Comment l’IA Google DeepMind va devenir le meilleur joueur de jeux vidéo

 

Après le jeu d’échecs et le jeu japonais Go, l’équipe en charge du développement de l’IA DeepMind s’est donnée l’objectif de dépasser le skill des humains dans les jeux vidéo. Après Dota 2 ? c’est au tour de Quake III Arena.

Nous utilisons l’intelligence artificielle pour toutes sortes de tâches, comme la prévision météorologique et l’automatisation des tâches dangereuses jusqu’à la recherche de remèdes contre les maladies et la résolution de problèmes sociaux complexes. Oh, et puis aussi sur nos smartphones (difficile d’y voir encore un réel avantage utilisateur). Et enfin, les jeux vidéo. En fait, Google a formé son IA DeepMind pour jouer à Quake III, et apparemment il est en train de botter des fesses humaines.

Pourquoi former une IA avancée pour jouer à un jeu vidéo ? Il y a en fait des applications pratiques et elles n’ont rien à voir avec le fait de gagner un tournoi d’e-sports ou de crâner sur Twitch.

Ce qui est intéressant dans le cas du jeu Quake III Arena, c’est que l’IA de Google doit apprendre à partir de zéro comment voir, agir, bouger, coopérer et rivaliser dans des environnements virtuels. En d’autres termes, Google n’a pas du tout alimenté DeepMind de toutes les instructions nécessaires pour jouer comme un dieu à Quake III. Au lieu de cela, c’est à l’IA de rivaliser avec elle-même jusqu’à ce qu’elle apprenne comment jouer et à appréhender les meilleures stratégies pour remporter les parties.

Une fois que DeepMind a appris à jouer, Google a organisé un tournoi avec 40 joueurs humains. DeepMind a pu jouer avec eux en tant qu’adversaires, mais aussi en tant que coéquipiers.

Cependant, il est intéressant de noter qu’une équipe de quatre bots DeepMind avait une probabilité de victoire de 65 %. Parmi toutes les équipes, celles qui étaient entièrement composées de robots ont donc réalisé les meilleures performances du tournoi.

Ce graphique montre le classement des différents joueurs. Les équipes « FTW » sont composées exclusivement de bots DeepMind, elles ont joué contre elles-mêmes dans une équipe de 30 joueurs. On apprend également qu’il a fallu environ 150 000 parties pour dépasser le niveau d’un joueur moyen.

« Grâce à de nouveaux développements dans l’apprentissage par renforcement, nos agents ont atteint des performances de niveau humain dans Quake III Arena CTF, un environnement multi-agents complexe et l’un des jeux multijoueurs cultes en 3D à la première personne. Ces agents démontrent leur capacité à faire équipe avec d’autres agents artificiels et des joueurs humains », explique l’équipe de DeepMind.

Google a évidemment de plus grandes aspirations que celle de dominer le gaming space. L’entreprise californienne souhaite continuer à améliorer ses méthodes d’apprentissage par renforcement afin de perfectionner son IA DeepMind. Ces concepts pourront ensuite être appliqués à des tâches plus significatives comme… d’ailleurs, on vous laisse terminer cette phrase.

Si le sujet vous intéresse, rendez-vous sur le site de DeepMind (en anglais).


Retrouvez un résumé du meilleur de l’actu tech tous les matins sur WhatsApp, c’est notre nouveau canal de discussion Frandroid que vous pouvez rejoindre dès maintenant !