À ce point de l'échange, plus grand-chose j'en conviens.
Désolé Invité. Case closed for me (ou l'on ouvre un autre thread les mecs

À ce point de l'échange, plus grand-chose j'en conviens.
En passant voici deux traductions.On December 4th, 2017, Google Headquarters in London applied their DeepMind AI project to the game of chess. The event was more of an experiment than a chess exhibition, and the results are groundbreaking in both the fields of computing and chess.
Rather than relying on the classic "alpha-beta algorithm" common to conventional chess software, AlphaZero uses a deep neural network and is trained solely by reinforcement learning from games of self-play. It scans only 80,000 positions per second compared to Stockfish's 70 million. AlphaZero played Stockfish 100 games, winning 28 and drawing the rest.(1) A subset of the match, 10 games that AlphaZero won, was released to the public.
Traduction DeepL a écrit :Le 4 décembre 2017, le siège social de Google à Londres a appliqué son projet DeepMind AI au jeu d'échecs. L'événement était plus une expérience qu'une exposition d'échecs, et les résultats sont révolutionnaires dans les domaines de l'informatique et des échecs.
Plutôt que de s'appuyer sur le classique "algorithme alpha-bêta" commun aux logiciels d'échecs conventionnels, AlphaZero utilise un réseau de neurones profonds et est entraîné uniquement par le renforcement de l'apprentissage à partir de jeux d'auto-jeu. Il n'analyse que 80 000 positions par seconde contre 70 millions pour Stockfish. AlphaZero a joué à Stockfish 100 parties, remportant 28 victoires et tirant au sort le reste (1) Un sous-ensemble du match, soit 10 parties gagnées par AlphaZero, a été rendu public.
Traduit avec www.DeepL.com/Translator
I.Google Translate a écrit :Le 4 décembre 2017, Google Headquarters à Londres a appliqué son projet DeepMind AI au jeu d'échecs. L'événement était plus une expérience qu'une exposition d'échecs, et les résultats sont révolutionnaires dans les deux domaines de l'informatique et des échecs.
Plutôt que de s'appuyer sur l'algorithme alpha-bêta classique commun aux logiciels d'échecs conventionnels, AlphaZero utilise un réseau neuronal profond et est entraîné uniquement par l'apprentissage par renforcement à partir de jeux de self-play. Il ne scanne que 80 000 positions par seconde par rapport aux 70 millions de Stockfish. AlphaZero a joué à Stockfish 100 jeux, en remportant 28 et en tirant le reste. (1) Un sous-ensemble du match, 10 jeux qu'Alphazero a remporté, a été publié au public.
Huhu, dans ce cas la, ne laisse pas un intervenant quelconque de ce forum te refiler un crucifix.Jean-Francois a écrit : ↑24 févr. 2018, 20:18Je vais relire D. Simmons pour savoir quoi faire contre l'infosphère![]()
Et maintenant ?neuneutrinos a écrit : ↑15 nov. 2017, 05:02 Je trouve que c'est un bon début.
Mais qu'en 1 v 1 c'est presque limité de parler de stratégie.
C'est mensonger de dire qu'une IA sait jouer à Dota pour le moment.
Au vu de l'article, il y a encore un peu de chemin à faire (l'article mentionne un pool de champion restreint de 18 champions sur 107 et des limitations non spécifiques sur les objets), mais ce n'est probablement pas insurmontable.thewild a écrit : ↑06 août 2018, 10:29Et maintenant ?neuneutrinos a écrit : ↑15 nov. 2017, 05:02 Je trouve que c'est un bon début.
Mais qu'en 1 v 1 c'est presque limité de parler de stratégie.
C'est mensonger de dire qu'une IA sait jouer à Dota pour le moment.
Des choses intéressantes à retirer de cet article? Je n'ai pas touché un échiquier depuis plusieurs décennies et déchiffrer la notation standard représente déjà un challenge pour moi.
La suggestion de 14.a4 par Alphazero dans la partie 1 me semble mieux que ce qui a été joué par Carana. Mais fallait voir loin (ce qui est une force incontestable d'Alphazero, mais pas juste en terme de calcul brut mais pour l'évolution potentielle de la position). a4 aurait permis (en cas de grand roque des Noirs), une poussée intéressante des Blancs à l'aile dame
Pas vraiment surprenant en fait, car je parierais que l'IA a le clic précis. Les valeurs d'APM les plus tordues qu'on voit même à très haut niveau incluent beaucoup de gâchis, et certaines actions répétitives font aussi exploser le compteur sans pour autant rendre compte d'une maîtrise absolue.
Ça et le fait de sur-saturer ses minéraux, c'est très intriguant, car elle a commencé à apprendre en regardant des joueurs humains, donc bloquer sa rampe est un comportement qu'elle a du désapprendre.L'IA se dispense aussi de précautions élémentaires, telles que la défense de l’accès à sa base, pour des raisons qui m'échappent un peu
C'est ce qui rend l'évaluation des réelles capacités d'une IA sur SC2 complexe. Pas facile de trouver un handicap bien équilibré pour éviter que la victoire ne se joue que sur les réactions surhumaines.yquemener a écrit : ↑10 févr. 2019, 08:28Oui, un micro-management parfait, c'est admis qu'une IA aura ça et même comme ça, elles sont incapables de gérer un humain qui a un minimum de stratégie. Hésiter entre attaquer et défendre, pas comprendre les stratégies de "bait" ou de contournement, c'est là qu'on était.
C'est a ce niveau que je me pose des questions. On a le même phénomène 3 posts plus haut avec l'IA de Dota 2 qui est limité à un pool de champion restreint et sans objets magiques. Dans SC2 apprendre plus de maps et de matchups est une progression linéaire. Dans Dota, intégrer plus de champions et d'objets magiques au modèle me semble plus exponentiel.Après avoir vu ce que j'ai vu dans ces matches, je n'ai réellement aucun doute que leur soft saura transposer ce savoir à d'autres cartes et d'autres match-ups même avec des limites d'APM énormes.
Ca m'a intrigué aussi et je suis aussi curieux de voir si c'est un comportement qui sera reproduit par des humains. Mine de rien les récolteurs ça coûte des sous, et AlphaZero compense par une armée relativement low cost bien micro. A voirLa sur-saturation lui permet de ne pas trop s'embêter à gérer des harass et lui dispense de faire du scouting, ça lui permet de s'étendre également beaucoup plus vite. Je peux comprendre l'intérêt même si c'est pas typique des joueurs humains. Je serais pas surpris si des joueurs pro se mettaient à essayer.
Un peu bizarre que l'API marche sur une race et pas les autres, mais pas non plus complètement extraordinaire. On a vu des bugs plus étranges
Je fais pas dans le deep, mais j'utilise des modeles supervisés au quotidien, et j'avoue que je suis parfois surpris de voir jusqu’où on peut les transposer. Dans les cas d'urgence, on a déjà utilisé un modele entraîné sur un produit pour le balancer sur un autre avec un pool de données minimal pour le ré-entraîner, et les résultats restent corrects.Dans le deep learning, une des choses qu'on essaye de faire c'est de généraliser et transposer les savoirs. Là ils vont donner une autre carte à Alpha* et elle va apprendre de nouvelles stratégies mais en réutilisant en partie des choses déjà apprises. Le but est de deviner quelles connaissances restent universelles, lesquelles sont spécifiques à une carte et in fine comment s'adapter à une nouvelle carte.
J'ai pas vu toute les parties, quel genre de cheese? Le plus couillu que j'ai vu était un 4*Gate Expand (pour les autres lecteurs, désolé pour le jargon, mais ca gagne du temps et j'ai pas envie de dérailler le topic outre mesure)Et il y a un match également où alpha* nous gratifie d'un "cheese" qui montre adaptation et improvisation. Non je pense vraiment que même avec des limitations de visibilité et d'APM, les champions humains seront battus cette année.
100 crédits pour une vision sur le gaz et la ligne de minerai, sachant qu'il a déterminé que Manaa n'a pas misé sur une agression early et ne pourra donc pas le supprimer si facilement. Lui donne aussi le timing de sortie des premières troupes. Pas un truc que ferait un joueur humain mais super intéressant à posteriori.
Encore un fois, génial à posteriori, mais surtout parce qu'il a une très bonne idée du timing de Manaa (qui me semblait un peu paniqué dans son jeu, si c'était sa 5eme raclée je le comprend mais son jeu est super réactif et c'est AlphaZero qui a l'initiative du début à la fin) et qu'il peut se permettre de setup son cheese.- les premières shield batteries, que le commentateur (qui a un niveau GM hein) trouve trop loin pour être utiles s'avéreront plus tard d'une utilité cruciale pour sauver le premier immortal.
P'tet ben qu'oui, p'tet ben qu'non. Il me semble qu'il perd un immortel avant, mais peut être sur un piège de champ de force.- là je m'avance un peu mais je me demande si cet immortel qui sort très rouge de cet engagement, n'a pas utilisé une technique qu'on a vu les IAs de DOTA apprendre: volontairement se prendre des coups pour "kitter" l'ennemi plus loin qu'il n'est raisonnable en lui faisant miroiter un kill juteux.
Utilisateurs parcourant ce forum : Aucun utilisateur inscrit