IA : des agents intelligents de DeepMind battent le record des humains au Quake III
Un jeu de tir en vue subjective
Il y a quelques jours, des algorithmes d’OpenAI ont coopéré pour battre une équipe constituée de cinq des amateurs les plus forts dans le jeu de stratégie Dota 2. C’était déjà un exploit significatif. Mais l’industrie de l’intelligence artificielle ne compte pas s’en arrêter là. DeepMind, la filiale de Google basée au Royaume-Uni vient de concevoir des algorithmes qui ont prouvé leur capacité à battre des équipes d’humains à Quake III. La méthode utilisée pour former ces algorithmes est celle en passe de devenir la méthode standard dans le domaine. Il s’agit de la méthode de l’apprentissage par renforcement. Elle consiste à faire faire à l’algorithme une quantité colossale d’essais et de le laisser tirer de ses erreurs les conclusions sur ce qu’il faut faire et ce qu’il ne faut pas faire.
Les algorithmes de DeepMind n’ont donc reçu absolument aucune information sur la manière dont ils devraient jouer. Ils se sont juste affrontés entre eux jusqu’à en arriver à développer des stratégies gagnantes. Chaque algorithme a donc été confronté à un clone identique de millions de fois de manière à acquérir l’expérience et la science de la stratégie. DeepMind, pour approfondir l’expérience, a carrément formé une trentaine d’algorithmes dans le but d’obtenir au bout du processus, une large diversité de styles de jeu.
Il faut préciser que les algorithmes de DeepMind n’ont reçu aucune donnée sur le jeu auquel ils allaient être confrontés, contrairement à ceux d’OpenAI. Ils ont appris à jouer en scrutant l’entrée visuelle de l’écran, exactement comme un humain. Les chercheurs ont pris la décision de faire jouer chaque jeu sur une nouvelle carte générée de façon procédurale, de manière à ce que les algorithmes apprennent des stratégies ne pouvant être utilisées que sur une carte chacune. Et, en dépit de ça, les agents intelligents de DeepMind ne se sont pas contentés d’intégrer les règles de base du jeu, ils ont carrément développé des stratégies sensiblement proches de celles qu’un humain pourrait utiliser.
Afin d’évaluer les résultats de leur expérience, les chercheurs de DeepMind ont organisé un tournoi avec des équipes à deux joueurs. Certaines équipes étaient constituées uniquement d’agents intelligents de DeepMind. D’autres étaient constituées uniquement d’humains et d’autres encore étaient des équipes mixtes. À la fin du tournoi, le nombre de victoires des équipes uniquement composées d’agents intelligents était largement au-dessus de la moyenne qu'aurait obtenue un humain. C’est beaucoup plus que le nombre de victoires probable d’un humain moyen et le nombre de victoires probables d’un humain fort.
Il convient cependant de préciser que s’il arrivait que le nombre d'agents dans une équipe soit plus élevé, les résultats s’en trouvaient négativement affectés. L’expérience a été faite avec une équipe de quatre agents intelligents et leur taux de victoire est légèrement moindre qu'une équipe de deux agents. Donc, on peut affirmer sans trop de risques de se tromper que l’intégration des paramètres du travail collectif n’a pas encore pu être complètement effectuée par un agent IA.
Source : DeepMind
Et vous ?
Que pensez-vous de cette nouvelle prouesse de l'IA ?
Cela est-il le début pour enseigner aux algorithmes d'IA, l’intelligence collective grâce à laquelle l’humanité a pu autant prospérer ?
Voir aussi
Cinq algorithmes d'IA font équipe pour écraser des humains au Dota 2, un jeu d'équipe connu pour être extrêmement compliqué
OpenAI d'Elon Musk crée une IA capable de battre des humains sur Dota 2, un jeu vidéo de type arène de bataille en 3D
DeepMind rend Sonnet open source, sa bibliothèque de réseau neuronal orientée objet qui facilite la création de réseaux neuronaux complexes
IA : des chercheurs de Google développent un algorithme capable de créer des scènes 3D à partir d'images bidimensionnelles
Partager