Lee Se-dol, l’ancien champion du monde du jeu de Go, prend sa retraite

**Stéphane le calme** · 04/03/2016, 18h42

Une intelligence artificielle réussira-t-elle à battre le meilleur joueur du monde au jeu de go ?
AlphaGo a réussi à battre le champion d'Europe

Mise à jour du 09 / 03 / 2016 : première manche sur cinq remportée par AlphaGo

Face au programme AlphaGo, le Sud-Coréen Lee Sedol a reconnu sa défaite pour une première manche de 186 tours qui aura duré un peu plus de trois heures. Il y a six mois, AlphaGo remportait cinq manches à zéro contre Fan Hui, le meilleur joueur d'Europe. Contrairement à cette partie, l'affrontement a été extrêmement serré ; les commentateurs ont parlé d'un jeu qui a été « agressif » des deux côtés.

Si Lee Sedol avait déclaré avec enthousiasme être « confiant et pense que je pourrai gagner, au moins cette fois-ci », lors d'une conférence de presse qui a eu lieu hier à Séoul, il a avancé avec prudence « aujourd'hui, je sais comment son algorithme a réussi à réduire le nombre de choix possibles. J'ai le sentiment qu'AlphaGo peut, dans une certaine mesure, imiter l'intuition humaine ».

Les prochaines manches auront lieu les 10, 12, 13 et 15 mars 2016.

Source : YouTube

Né il y a plusieurs milliers d'années en Chine et très populaire en Extrême-Orient (Japon, Chine et Corée, essentiellement), le jeu de go est un jeu où s'opposent deux joueurs qui vont s'affronter sur un plateau (le goban) armés de jetons noirs et blancs (les pierres). Tour à tour, les joueurs posent leurs pierres sur les intersections du goban, composé de 19 lignes sur 19, le but étant de contrôler avec ces pierres la plus grande surface possible du plateau.

Des règles qui s'avèrent donc plutôt simples même si, pour un ordinateur, la faculté d'en maîtriser les mécanismes, notamment via une résolution formelle par une recherche arborescente (qui est à la base de la plupart des algorithmes utilisés pour les programmes de jeux à deux joueurs) va s'avérer plus complexe par exemple que s'il s'agissait d'un jeu du morpion, de dames anglaises ou d'échecs. Pour quelle raison ? Le nombre de configurations possibles : il y en a 10 puissance 3 pour le jeu du morpion (sur une grille de 10×10 au lieu de 3×3, avec l'objectif d'aligner 6 pions au lieu de 3), 10 puissance 20 pour le jeu des dames anglaises, 10 puissance 50 pour le jeu d'échecs et 10 puissance 171 pour le jeu de go.

Si en 1997, Deep Blue, un super-ordinateur construit par IBM, a battu aux échecs le champion du monde, Garry Kasparov, l'histoire n'est pas la même pour le jeu de go. Malgré les énormes progrès faits en intelligence artificielle, le programme japonais Zen était considéré comme le meilleur au monde bien qu'il restait très loin du niveau des meilleurs joueurs professionnels. Cette intelligence artificielle se basait sur l’évaluation de la pertinence des coups en simulant des milliers de parties, approche qui a été améliorée grâce à la recherche arborescente Monte-Carlo.

Cette méthode consiste à systématiquement explorer les branches de l'arbre jusqu'à une position terminale pour contourner l'une des difficultés essentielles du go : la définition d'une bonne fonction d'évaluation heuristique. Cependant, étant donné le grand nombre de parties possibles, cette approche ne peut pas explorer exhaustivement toutes les possibilités : il faut donc choisir un sous-ensemble des parties possibles. Se posent alors deux problèmes essentiels : comment choisir celles qu'on explore parmi toutes les possibilités ? Étant donné les séquences observées et leur résultat (gagné ou perdu, dans le cas du go), comment déterminer le meilleur coup ?

Un des algorithmes les plus primitifs consiste à simplement choisir les coups aléatoirement, et à évaluer chaque position par la moyenne du résultat de toutes les parties aléatoires qui passent par cette position. Pour chacun des coups possibles, la moyenne des résultats des parties obtenues après avoir joué ce coup donne une estimation de sa valeur. Il suffit ensuite de choisir le coup qui mène vers la position qui a la meilleure moyenne. Pour donner un ordre de grandeur, les meilleurs programmes actuels parviennent à générer plusieurs dizaines de milliers de parties aléatoires par seconde sur un PC puissant.

En octobre 2015, pour la première fois, une intelligence artificielle a battu un joueur professionnel sur un plateau de taille normal : AlphaGo, un programme développé par la filiale DeepMind (une entreprise britannique créée en 2010 et qui a été rachetée en 2014 par Google) a battu par 5 parties à 0 le joueur professionnel français Fan Hui, 2e dan (sur 9 au maximum) et meilleur joueur d’Europe. Il n’a en outre perdu qu’une partie sur 500 contre les meilleurs programmes déjà sur le marché. C'est dans les parties rapides Fan Hui a mieux résisté, perdant 3 à 2. Les progrès liés à la victoire d’AlphaGo n’étaient pas attendus avant une dizaine d’années dans le milieu de l’intelligence artificielle.

AlphaGo se sert également de cette technique d'exploration, mais la combine à deux autres ingrédients secrets : les deep learning (réseaux de neurones profonds) et l’apprentissage renforcé. Le deep learning est une fonction mathématique aux paramètres ajustables de manière à fournir la meilleure réponse possible. En réalité, cette fonction est en fait la combinaison de milliers de variables reliées entre elles comme un réseau de neurones biologiques. L'apprentissage renforcé, qui est une spécialité de DeepMind, consiste à faire jouer l’algorithme contre lui-même pour améliorer le réseau neuronal.

L’équivalent pour le go de la rencontre mythique qui a opposé l'ordinateur d'IBM Deep Blue au meilleur joueur d'échecs du monde en 1997, le Russe Garry Kasparov, est annoncé par Google DeepMind le 9 mars prochain à Séoul où il affrontera le meilleur joueur du monde actuel : le Sud-Coréen, Lee Sedol, 9e dan.

« J’aurai le privilège d’affronter pour la première fois un ordinateur. J’ai entendu dire qu’AlphaGo est étonnamment fort et s’améliorera encore, mais je suis confiant que je pourrai gagner, au moins cette fois-ci », a déclaré Lee Sedol par l’entremise de la revue Nature.

Si la victoire contre Fan Hui est impressionnante, ce joueur est classé 633^e meilleur joueur au monde, bien loin donc du meilleur niveau mondial.

Source : Nature (maîtriser le jeu de Go avec les réseaux neuronaux profonds et l'exploration des arbres), le jeu de go et la révolution de Monte-Carlo

Et vous ?

Quels sont vos pronostics ? Pour quelles raisons ?

Voir aussi :

forum Intelligence Artificielle

**MaximeCh** · 04/03/2016, 20h21

Le numéro un d'Europe n'est que 2/9 dan et 633ème mondial?!
Je n'ose pas imaginer le niveau asiatique.

**TiranusKBX** · 04/03/2016, 20h35

D'ici 5-6 ans cela devrait être possible non ?

**Matthieu Vergne** · 05/03/2016, 00h11

Envoyé par Stéphane le calme

Une intelligence artificielle réussira-t-elle à battre le meilleur joueur du monde au jeu de go ?

Tant qu'aucune date limite n'est donnée, je pense que je peux répondre sans risque de me tromper "oui, évidemment". La question principale étant "quand" ça arrivera. Pour le match prévu par contre, je me garde bien d'y fournir des pronostics.

**patewing** · 05/03/2016, 11h32

2/9 dan certes, mais faut se remettre dans le contexte:

En asie de l'est, quasi tout le monde sait jouer au go à différents niveaux bien sûr, rien à voir avec les échecs en occident qui reste très marginal.

De ce fait, les enfant grandissent avec ce jeu et la concurrence pour être professionnel de go est énorme, le niveau est donc bien meilleur.

J'attends avec impatience la rencontre entre alpha go et lee sedol

Invité · 05/03/2016, 15h24

Je suis d'accord avec Matthieu : la question n'est pas "est-ce que ça arrivera" mais plutôt "quand".

L'article est très intéressant sauf que le sondage aurait, à mon avis, plus sa place dans un bar PMU que sur un forum d'informatique.

**polaroid62** · 05/03/2016, 21h13

Au Shogi aussi il y a eu des rencontres du style , ça serait génial d'ailleurs un equivalent de Fritz ou Chessmaster pour le shogi afin d'aider le joueur lambda.

**MaximeCh** · 09/03/2016, 15h26

Et bien c'est fait oO, victoire de Deep Mind.

Invité · 09/03/2016, 18h05

Il s'agit de la première manche sur cinq, donc c'est encore un peu tôt pour crier victoire.

AlphaGo a "étudié" le jeu des humains pendant des mois alors que Lee Sedol ne découvre vraiment le jeu d'AlphaGo que maintenant donc ce résultat n'est pas très étonnant. Maintenant si Lee Sedol arrive a cerner le jeu d'AlphaGo ou à envisager des stratégies nouvelles, il peut peut-être reprendre l'avantage.

**Gabin F** · 09/03/2016, 18h21

En effet, il est trop tôt pour se prononcer. Comme le souligne groharpon42, cette manche était probablement l'occasion pour Lee Sedol d'observer son adversaire puisqu'il n'a pas eu la possibilité d'affronter des IA par le passé. Il serait intéressant de voir comment se déroule la seconde manche. Quelqu'un pourrait-il m'expliquer les règles afin que je puisse mieux comprendre la vidéo de jeu ? Parce que je suis complètement perdu.

Merci

**MaximeCh** · 09/03/2016, 18h40

Envoyé par Gabin F

En effet, il est trop tôt pour se prononcer. Comme le souligne groharpon42, cette manche était probablement l'occasion pour Lee Sedol d'observer son adversaire puisqu'il n'a pas eu la possibilité d'affronter des IA par le passé. Il serait intéressant de voir comment se déroule la seconde manche. Quelqu'un pourrait-il m'expliquer les règles afin que je puisse mieux comprendre la vidéo de jeu ? Parce que je suis complètement perdu.

Merci

Occuper plus de territoire que l'adversaire sur une grille de taille définie.
Chaque joueur joue un pion à son tour, il n'y a qu'un type de pion.
Les pions sont posés sur les intersections de la grille alors que pour les jeux européens traditionnels, on les pose sur les cases.
On mange les pions adverses en les encerclant.

**Iradrille** · 09/03/2016, 20h45

Envoyé par groharpon42

Il s'agit de la première manche sur cinq, donc c'est encore un peu tôt pour crier victoire.

AlphaGo a "étudié" le jeu des humains pendant des mois alors que Lee Sedol ne découvre vraiment le jeu d'AlphaGo que maintenant donc ce résultat n'est pas très étonnant. Maintenant si Lee Sedol arrive a cerner le jeu d'AlphaGo ou à envisager des stratégies nouvelles, il peut peut-être reprendre l'avantage.

D'ailleurs, est-ce qu'une IA a un type de jeu particulier ?
Dans les mêmes conditions, elle va refaire la même partie ? Ou une partie complètement différente ?

Une idée de si sa façon de jouer ressemble à celle d'un joueur ?

Invité · 09/03/2016, 22h22

Envoyé par Iradrille

D'ailleurs, est-ce qu'une IA a un type de jeu particulier ?

AlphaGo apprend des stratégies et décide ses coups de lui-même mais il n'y a pas de magie la dedans : son fonctionnement suit un programme bien précis (deep learning + monte-carlo arborescent). Son type de jeu dépend de ses données d'apprentissage et des stratégies découvertes lors de l'exécution du programme.

Envoyé par Iradrille

Dans les mêmes conditions, elle va refaire la même partie ? Ou une partie complètement différente ?

Certains algo d'AlphaGo sont probabilistes donc il est possible qu'il joue une partie différente (d'autant plus que la phase de deep learning est également régulièrement "alimentée"). Ceci dit, s'il avait déjà trouvé une super stratégie, il est tout à fait possible qu'il rejoue la même.

Envoyé par Iradrille

Une idée de si sa façon de jouer ressemble à celle d'un joueur ?

Je ne connais pas bien le Go mais j'imagine que les joueurs ont des stratégies différentes. Concernant AlphaGo, la partie deep learning apprend à partir de données "humaines" donc il est possible que ça pousse l'IA a jouer "comme un humain" mais la partie monte-carlo qui vient ensuite peut changer complètement le comportement. En fait, l'IA s'oriente naturellement vers une stratégie qui lui semble efficace et si c'est vraiment la stratégie la plus efficace, il y a des chances pour que ce soit également "celle des humains". Il est également possible qu'elle ait trouvé une meilleure stratégie que tout le monde jusque là et dans ce cas Lee Sedol va se faire démonter...

**Zefling** · 10/03/2016, 00h47

Envoyé par MaximeCh

Le numéro un d'Europe n'est que 2/9 dan et 633ème mondial?!
Je n'ose pas imaginer le niveau asiatique.

Je connais quelques personnes qui font du go (dont certains à haut niveau, mais en Europe, d'ailleurs le niveau des Français est semble-t-il pas trop mal... pour l'occident). Et oui, le niveau des asiatiques est telle les tournois se font à part. Après c'est pas trop la même culture, c'est comme pour d'autre jeux : shōgi ou mah-jong. Quand tu vois le nombre de joueur en occident, il est certains que le niveau ne peut pas être le même que dans les pays où c'est des jeux dont tout le monde côté les règles. Quand je dis que je fais du mah-jong, il faut déjà que je commence par expliquer ce que c'est, alors que si j'avais dit poker ou échec.

Envoyé par groharpon42

Je ne connais pas bien le Go mais j'imagine que les joueurs ont des stratégies différentes.

Pour ce que je sais du Go c'est que ça fonctionne avec de l'influence (une notion qui peu paraître abstraite), et beaucoup de forme connues. C'est un jeu de délimitation de territoire. Ce n'est pas simple à aborder, alors que les règles sont vraiment simples.

**GPPro** · 10/03/2016, 08h53

2ème partie en cours, j'attends de voir les analyses post game mais je suis vraiment déçu et surpris par certaines erreurs de Lee

**Zefling** · 10/03/2016, 09h09

Envoyé par GPPro

2ème partie en cours, j'attends de voir les analyses post game mais je suis vraiment déçu et surpris par certaines erreurs de Lee

En même temps, ça doit être déstabilisant de jouer face à une machine.

**hotcryx** · 10/03/2016, 09h42

Le champion du monde l'a laissé gagné pour mettre en confiance la machine et les développeurs (ils ne seront pas virés)

**hotcryx** · 10/03/2016, 11h04

Envoyé par Zefling

En même temps, ça doit être déstabilisant de jouer face à une machine.

sachant que la moindre faille pourra "normalement" être exploitée.
Ca laisse peu de marge d'erreur

**hotcryx** · 10/03/2016, 11h06

Envoyé par Zefling

Je connais quelques personnes qui font du go (dont certains à haut niveau, mais en Europe, d'ailleurs le niveau des Français est semble-t-il pas trop mal... pour l'occident). Et oui, le niveau des asiatiques est telle les tournois se font à part. Après c'est pas trop la même culture, c'est comme pour d'autre jeux : shōgi ou mah-jong. Quand tu vois le nombre de joueur en occident, il est certains que le niveau ne peut pas être le même que dans les pays où c'est des jeux dont tout le monde côté les règles. Quand je dis que je fais du mah-jong, il faut déjà que je commence par expliquer ce que c'est, alors que si j'avais dit poker ou échec.

Pour ce que je sais du Go c'est que ça fonctionne avec de l'influence (une notion qui peu paraître abstraite), et beaucoup de forme connues. C'est un jeu de délimitation de territoire. Ce n'est pas simple à aborder, alors que les règles sont vraiment simples.

Tu veux dire: une vue globale?

**Alvaten** · 10/03/2016, 12h46

Une idée de si sa façon de jouer ressemble à celle d'un joueur ?

J'ai discuté avec une personne qui connais Fan Hui, apparemment il lui aurait dit "c'est la première fois que je joue contre un ordinateur qui me donne l'impression d'être un humain".
Alors oui c'est un peu "quelqu'un m'a dit que" mais c'est déjà ça

Affichage des résultats du sondage: Quels sont vos pronostics ? Merci de préciser les raisons en commentaire

Lee Se-dol, l’ancien champion du monde du jeu de Go, prend sa retraite

Intelligence artificielle

Discussions similaires

Partager

Partager