Cette technologie Nvidia pourrait être le ChatGPT de la création 3D

Les chercheurs de Nvidia ont mis au point une IA générative capable de créer en une poignée de secondes un modèle 3D avec texture… à l’aide d’une simple requête textuelle.

En quelques secondes, l’IA de Nvidia parvient à générer un modèle 3D avec texture // Source : Nvidia

LATTE3D, c’est le nom d’une IA générative « texte-3D » mise au point par Nvidia et accélérée cette semaine par les chercheurs du groupe. Avec elle, il est désormais possible de générer un modèle 3D avec texture en quelques secondes, après avoir simplement entré une requête textuelle en amont. Les résultats sont pour l’instant relativement basiques, mais ce qui impressionne, c’est la vitesse d’exécution de cette IA et les progrès réalisés sur ce terrain en très peu de temps.

LATTE3D créée par ailleurs des modèles 3D en exploitant un format très répandu, leur permettant d’être facilement intégrés par la suite à des environnements virtuels, explique Nvidia dans son communiqué. Concrètement, cette IA pourra donc servir aux développeurs pour peupler plus rapidement un monde ouvert, par exemple, mais des applications dans le domaine publicitaire, dans la robotique, ou même pour des projets de conception sont aussi évoquées.

Nvidia progresse vite sur la génération de modèles 3D par IA

« Il y a un an, il fallait une heure aux modèles d’IA pour générer des visuels 3D de cette qualité. Aujourd’hui, il ne faut plus que 10 à 12 secondes », commente Sanja Fidler, vice-présidente de la recherche en AI chez Nvidia et responsable du développement de LATTE3D. « Nous pouvons désormais produire des résultats beaucoup plus rapidement, ce qui met la génération de modèles 3D à partir de texte, en temps quasi réel, à la portée des créateurs de tous les secteurs d’activité ».

Lien YouTube S’abonner à Frandroid

Un peu à la manière de ce que propose Midjourney pour la génération de visuels, LATTE3D créée de toutes pièces plusieurs modèles 3D légèrement différents pour chaque requête textuelle, de manière à laisser l’utilisateur final choisir le modèle le plus réussi, ou le plus proche de son idée originale.

On apprend pour le reste que l’IA de Nvidia a pour l’instant été entraînée avec deux ensembles de données spécifiques seulement : les animaux et les objets du quotidien, mais il est tout à fait possible de faire évoluer LATTE3D en l’entraînant sur d’autres ensembles. Les perspectives de création sont alors quasi infinies.

Sur le plan technique, on apprend enfin que LATTE3D a été entraîné à partir de GPUs Nvidia A100, mais que pour les démonstrations ci-dessus, l’IA ne sollicite qu’un seul GPU : une carte graphique professionnelle RTX A6000 « Ampere », lancée en fin d’année 2020.

Votre café et votre dose de tech vous attendent sur WhatsApp chaque matin avec Frandroid.