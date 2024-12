Avec Gemini 2.0, Google entrevoit la possibilité de créer une myriade d’agents multimodaux, capables de nous assister dans différentes situations. Et pour illustrer cette nouvelle « ère » de l’IA, quoi de mieux que le jeu vidéo ?

Coincé dans un jeu vidéo ? Pas de souci, Gemini est là pour vous aider // Source : Google x Frandroid

Hier, la firme de Mountain View a présenté ses dernières avancées en matière d’IA. Plus puissant, plus polyvalent et plus complet que Gemini 1.5, Gemini 2.0 est surtout multimodal, c’est-à-dire qu’il peut travailler à la fois avec du texte, du son et des images, et ce, en toute fluidité. Avec de telles possibilités, Google cherche de bonnes raisons pour rendre son nouveau-né utile, et jusqu’à présent, il semble avoir trouvé de bonnes idées.

Dans son billet de blog présentant Gemini 2.0, Google a dévoilé un certain nombre de projets d’agents en cours de développement. Parmi eux, il en est un qui n’a pas encore de nom, mais qui n’en est pas moins intéressant et qui a trait aux jeux vidéo. L’entreprise de Mountain View souhaite, en effet, nous permettre de convoquer son IA pour nous assister lors de nos parties endiablées sur smartphone.

Il serait possible de lui poser des questions sur les stratégies à suivre, de lui demander de se souvenir des détails d’une quête, ou encore de nous en apprendre plus sur les mécanismes du jeu concerné. Gemini irait chercher ses informations sur Google, et se servirait de ce qui se passe à l’écran et de ses échanges avec l’utilisateur pour donner une réponse appropriée.

Bien sûr, tout cela se ferait en temps réel et vocalement, comme s’il s’agissait d’une discussion avec un autre joueur. Cependant, les limites de Gemini 2.0 dans ce contexte ne sont pas encore claires, et Google teste encore les capacités de son IA à « interpréter les règles et les défis » dans des jeux tels que Clash of Clans ou Hay Day.

Est-ce vraiment utile ?

Google n’aurait pas pu trouver meilleur exemple pour illustrer les compétences multimodales de Gemini 2 (à part le projet Astra, bien sûr). Interpréter ce qui se passe dans le champ de vision de l’utilisateur, aller chercher des informations dans une grande base de données, converser de manière naturelle, comprendre des mécaniques de jeu… Ce sont des prérogatives qui, individuellement, sont déjà complexes, mais qui, combinées, peuvent rendre l’IA très puissante.

Je ne partage pas vraiment l’avis de nos confrères de The Verge sur le sujet. À leur question « Ai-je vraiment besoin d’un agent d’IA pour me rappeler les quêtes ? », je répondrais « Oui ». Nous sommes tous parfois confrontés à des moments de friction dans les jeux vidéo, où certains d’entre nous doivent chercher de l’aide auprès d’autres joueurs sur internet.

Gemini 2.0, le GOAT ultime de Clash of Clans ? // Source : Google

Si Gemini est capable de réduire ce temps de recherche tout en nous permettant de rester dans le jeu, alors je considère que c’est un succès. Imaginez que vous soyez coincé dans un donjon froid et sombre de Baldur’s Gate 3 pendant plusieurs minutes, sans savoir où aller. Ne serait-ce pas génial de simplement dire « Hey Google, je suis bloqué, comment continuer ma quête ? » et de pouvoir enfin progresser à nouveau ?

Une nouvelle ère qui ne mettra pas tout le monde d’accord

Bien sûr, ce point de vue ne fera pas l’unanimité. D’abord, il y aura ceux qui défendent l’intérêt d’être autonome dans les jeux vidéo, pour ne pas gâcher l’expérience en allant immédiatement chercher une solution sur Google.

Ensuite, il y a la question de la valorisation des sites web qui partagent ce type d’informations. Comme les éditeurs de wiki, les hébergeurs de forums, et surtout les médias qui publient des articles sur ce genre de sujets.

Enfin, l’IA n’est pas exempte d’erreurs, et il est peu probable que Gemini 2.0 éradique ce problème. Un tel outil aurait le potentiel de provoquer des frictions d’un nouveau genre, en poussant par exemple les joueurs à choisir la mauvaise équipe pour le prochain combat de Gigamax sur Pokemon GO (voilà, vous connaissez mes deux lubies vidéoludiques coupables du moment).

Ces deux dernières lacunes comptent parmi les plus importantes de Gemini et des solutions concurrentes, et il semble qu’il faille s’en accommoder pour l’instant. Cependant, cet exemple avec les jeux vidéo montre clairement où Google veut amener sa technologie, pour le meilleur et pour le pire. Je pense y voir un réel intérêt à se servir de ces IA, qui pourraient enfin devenir « utiles » au quotidien. Un mot que même le PDG de Google, Sundar Pichai, s’est permis d’utiliser lors de la présentation de Gemini 2.0.

