Google vient de présenter Genie 2, son nouveau modèle d’intelligence artificielle. En quelques commandes et à partir d’une simple image, l’outil est capable de créer un monde interactif complet, et c’est plutôt bluffant.

Genie 2 permet de générer un environnement interactif en 3D à partir d’une seule image // Source : Google

Ces derniers temps, vous êtes peut-être tombé sur des images d’Oasis AI, une copie du jeu Minecraft qui utilise une IA pour générer le monde parcouru par les joueurs. Si le résultat n’est clairement pas dénué de défauts, au point d’être cauchemardesque par moments, l’expérience n’en est pas moins intéressante. Et, bien entendu, il ne s’agit pas d’un cas isolé.

En effet, Google aussi s’intéresse à ce créneau. Non content d’avoir plutôt bien rattrapé son retard sur OpenAI, l’éditeur de ChatGPT ou encore de Sora, la firme de Mountain View vient de présenter Genie 2, son nouveau « modèle de monde » (« world model » dans la langue de Sundar Pichai).

Comme son nom peut le suggérer, puisqu’il provient de « Generative Interactive Environments », ce nouvel outil ne se spécialise pas dans la génération de textes, d’images ou de sons, mais à la création d’environnements virtuels. Si la première itération était capable de créer un monde en 2D à partir d’une image fixe, la seconde fait un bond énorme en avant et peut concevoir des espaces en 3D. Et ce, toujours à partir d’un seul cliché.

Oui, il s’agit bien d’un environnement en 3D généré par une intelligence artificielle // Source : Google

Par exemple, à partir d’une photo d’une ville (réelle ou non), l’IA est capable de générer ce qui se trouvera sur les côtés, derrière, au-dessus et en dessous. Permettant ainsi aux utilisateurs de parcourir ce nouvel environnement, qui continue dans le même temps à être généré au fur et à mesure que l’on y progresse.

Un environnement complet et interactif, comme dans un vrai jeu vidéo

Au final, la technique est semblable à ce que d’autres outils de Google, comme Imagen 3 ou Veo, permettent de faire. Toutefois, si la possibilité d’explorer les espaces générés comme dans un jeu vidéo est assez inédite, l’entreprise américaine a ajouté un certain nombre d’autres d’options à Genie 2.

En effet, l’outil peut prendre en compte des paramètres de physique (force de gravité, collisions avec le décor, mouvements des fluides, etc.), d’éclairages et de réflexion, générer des animations, le personnage jouable ou encore des PNJ. Il est aussi possible de lui demander de configurer des interactions, comme d’ouvrir une porte quand on s’en approche ou d’animer d’une manière particulière notre personnage quand on appuie sur une touche précise du clavier.

Genie 2 est capable de générer toute une foule d’éléments, rendant ses environnements davantage interactifs // Source : Google

Enfin, Genie 2 est en mesure de se rappeler ce qu’il a généré précédemment, de telle sorte que le parcours d’un environnement reste cohérent avec ce qui a été affiché précédemment à l’écran. Cela doit régler un des gros défauts d’Oasis, rendant l’expérience très aléatoire, puisqu’en s’approchant trop près d’une fleur on peut se retrouver deux pas plus tard en plein Nether (ou en plein enfer, pour les non-initiés), par exemple.

L’IA de Google serait-elle donc bien capable de générer des jeux vidéo entiers en quelques clics ? On peut en tout cas y croire, tant tous les éléments nécessaires (ou presque) sont présents.

Un outil de recherche qui pourrait profiter à l’industrie

Selon le géant américain, l’objectif de cette nouvelle IA n’est pas uniquement de s’attaquer à la création vidéoludique. « Genie 2 montre le potentiel des modèles de monde fondamentaux pour créer divers environnements 3D », affirment les ingénieurs de Google dans un billet de blog. « Nos recherches visent à mettre au point des systèmes et des agents d’IA plus généraux, capables de comprendre et d’exécuter en toute sécurité un large éventail de tâches d’une manière qui soit utile aux personnes en ligne et dans le monde réel. »

De par sa versatilité, Genie 2 pourrait donc permettre d’améliorer les résultats et les performances des outils dopés à l’IA générative, en permettant aux modèles de s’entrainer et de s’appuyer sur plus de facteurs, par exemple. Une démarche qui n’est pas surprenante, tant le secteur commence à éprouver des difficultés pour améliorer encore davantage les modèles déjà existants.

De vrais jeux-vidéos ? Non, c’est le fruit de Genie 2 // Source : Google

Google voit tout de même un intérêt concret à son nouveau-né. La firme assure que Genie 2 peut être utilisé pour faire du « prototypage rapide », et permettre « aux artistes et aux concepteurs de créer rapidement des prototypes, ce qui peut stimuler le processus créatif pour la conception d’environnements, accélérant ainsi le processus créatif ».

Et, il est difficile de ne pas lier ces ambitions avec de récents propos de Hermen Hulst, co-PDG de la division PlayStation chez Sony. Celui-ci s’est montré enthousiaste à une utilisation plus généralisée de l’intelligence artificielle dans la production de jeux vidéo. Vu les avancées technologiques de ces récentes années, on ne peut que comprendre son point de vue.

Mais il reste à voir si Genie 2, et tous les autres outils dopés à l’IA proposés par les géants de la tech, seront réellement bénéfiques pour les joueurs. Mais aussi et surtout à toutes les petites mains bien humaines qui créent (avec amour, on en est sûrs) nos jeux vidéo favoris.