« Un monde virtuel visitable » : Google bluffe tout le monde avec une IA poussée à ses limites

 
Avec Genie 3, Google propose une IA générative capable de recréer un monde photoréaliste interactif.
Une capture d’écran du monde généré par Genie 3 // Source : Google

« Une nouvelle frontière », c’est comme cela que Google décrit son nouveau modèle Genie 3, capable de générer des mondes interactifs.

La vidéo de présentation en met plein les yeux et permet de très vite comprendre le concept. Genie 3 permet de générer un monde dans lequel vous pouvez vous déplacer à l’aide des flèches de votre clavier, ou bouger la vue avec une manette ou la souris.

Un tour de force technologique

On gagne donc encore une dimension après la génération d’image, puis de vidéo, en ajoutant l’interaction, on passe dans le domaine du jeu vidéo.

Le tour de force ici est notamment dans la capacité du modèle à mémoriser l’environnement déjà dessiné, même hors champ.

Les mondes générés proposent également une physique réaliste, où il est possible de peindre, de faire tomber des objets ou simplement de marcher.

Contrairement à Veo, pas question ici de générer une vidéo de quelques secondes. Le monde généré par Genie 3 peut s’étendre pendant plusieurs minutes et propose une interaction temps réel.

Google n’entrevoit pas seulement un usage pour générer des jeux vidéo, mais au-delà, permettre de créer des vidéos de formations ou des simulations dans un but scientifique.

Genie 3 permet également de créer des « événements » dans un monde généré. Par exemple faire apparaitre un personnage ou un retournement de situation.

Des limites encore bien réelles

Évidemment, tout n’est pas parfait, malgré le progrès démontré. Google relève notamment le faible nombre de minutes de la démo, alors que qu’elle souhaiterait créer des mondes capables d’une interaction pendant plusieurs heures.

D’autre part, si Genie 3 peut créer des mondes photoréalistes, ils ne sont pas géographiquement corrects. Autrement dit, le moteur ne sait pas générer un New York ou un Paris qui corresponde au réel.

Enfin, le modèle ne permet pas de tout faire en matière d’événement et Google souligne qu’il faudra étendre les possibilités à l’avenir.

Reste que le progrès accompli par les équipes de Deepmind en quelques années reste bluffant sur l’aspect technologique. Pour ce qui est de créer une véritable œuvre artistique comme le propose le jeu vidéo aujourd’hui, c’est un autre sujet.


Si vous voulez recevoir les meilleures actus Frandroid sur WhatsApp, rejoignez cette discussion.