AlphaGo et les rapides progrès de l’intelligence artificielle

Près de vingt ans après la victoire aux échecs de l’ordinateur Deep Blue contre le champion Garry Kasparov, et cinq ans après la victoire de l’ordinateur Watson à Jeopardy, Google s’apprête à répéter l’exploit avec son ordinateur AlphaGo, cette fois au jeu de go. Depuis mardi dernier et jusqu’à lundi prochain se déroule une série de cinq parties contre le champion du monde Lee Sedol à Séoul. Or, contrairement à 1997 où Kasparov avait réussi à battre Deep Blue à quelques reprises lors de leur tournoi, AlphaGo demeure toujours invaincu après deux parties. Après avoir battu tous les programmes de go développés jusqu’à maintenant, puis vaincu le champion d’Europe Fan Hui cinq parties à zéro en octobre dernier, AlphaGo s’apprête à faire de même avec le champion du monde. Ce dernier doit maintenant gagner les trois prochaines parties pour remporter le match et le grand prix d’un million de dollars. Sedol, qui avait prédit avant le tournoi perdre au maximum une partie, affirme maintenant avoir comme objectif d’en gagner une seule sur cinq. Il va sans dire que la communauté du jeu de go, qui compte plus de 40 millions d’adeptes dans le monde, est sous le choc. On peut revisionner ces deux matchs ainsi que regarder les trois prochains en direct sur la chaîne YouTube du projet DeepMind de Google.

On a longtemps considéré ce jeu millénaire, aujourd’hui surtout populaire en Chine, au Japon et en Corée, comme étant imbattable par un ordinateur. Tel que Google s’amuse à expliquer sur son blogue officiel, il y a plus d’un googol (10^100) de fois plus de positions possibles à analyser au go qu’aux échecs. On ne peut donc pas simplement toutes les analyser comme on avait l’habitude de faire pour le backgammon ou les échecs, par exemple. En plus d’avoir assimilé 30 millions de mouvements tirés de parties jouées par des experts humains, AlphaGo s’est «entraîné» en jouant plusieurs milliers de parties contre lui-même, dans la même approche par réseau neuronal qui fait progresser le domaine de l’intelligence artificielle à grande vitesse ces dernières années.

Il est particulièrement intéressant d’observer les réactions du commentateur expert Michael Redmond, souvent incrédule devant les mouvements d’AlphaGo. Le jeu est riche de 2500 ans d’histoire, et le programme bouscule les stratégies établies. Il faut voir sa réaction après le jeu en O-10 à 1 h 18 dans la deuxième partie; de prime abord, il est persuadé qu’il s’agit d’une erreur. Sedol, de son côté, est tellement surpris qu’il quitte la pièce!

Un autre moment intéressant est le court entretien des commentateurs avec un ingénieur de l’équipe AlphaGo, à 45 minutes dans cette même partie. Redmond lui demande, en référence à un mouvement qui lui avait semblé étrange dans la partie précédente, pourquoi le jeu du programme est parfois «lent», peu agressif. L’ingénieur explique alors que les parties jouées par AlphaGo se terminent le plus souvent avec des résultats très serrés, parce que le programme préfère un mouvement qui le fait gagner par un point avec 90 % de probabilité, à un autre qui le fait gagner de 5 points, mais dans seulement 80 % des cas. Alors que les joueurs humains cherchent habituellement à maximiser leurs points, à augmenter leur marge de victoire, AlphaGo maximise avant tout sa probabilité de victoire, peu importe l’écart. Cette particularité met beaucoup de pression sur ses adversaires humains, qui ont toujours l’impression que la partie demeure très serrée.

Le succès d’AlphaGo, loin d’indiquer une soudaine supériorité de l’intelligence artificielle sur la nôtre, représente au contraire un exploit humain. Derrière le programme se trouve en effet, il faut le rappeler, l’ouvrage de toute une équipe d’ingénieurs qui y travaillent d’arrache-pied depuis plusieurs années. Comme les joueurs de go cette semaine, d’abord choqués, puis enthousiasmés par l’immense potentiel d’apprentissage que représente ce nouveau programme pour leur communauté, nous ne tarderons pas à bénéficier des avancées de l’intelligence artificielle dans notre quotidien. Google et son équipe DeepMind voient en effet déjà leur technologie appliquée dans le domaine de la santé.

Pour en savoir plus :
L’article scientifique paru dans Nature qui explique l’approche de l’équipe AlphaGo
Apprendre à jouer au go par tutoriel interactif

Laisser un commentaire

Entrer les renseignements ci-dessous ou cliquer sur une icône pour ouvrir une session :

Logo WordPress.com

Vous commentez à l’aide de votre compte WordPress.com. Déconnexion /  Changer )

Photo Facebook

Vous commentez à l’aide de votre compte Facebook. Déconnexion /  Changer )

Connexion à %s