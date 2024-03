Les chercheurs de Nvidia ont mis au point une IA générative capable de créer en une poignée de secondes un modèle 3D avec texture... à l'aide d'une simple requête textuelle.

LATTE3D, c’est le nom d’une IA générative « texte-3D » mise au point par Nvidia et accélérée cette semaine par les chercheurs du groupe. Avec elle, il est désormais possible de générer un modèle 3D avec texture en quelques secondes, après avoir simplement entré une requête textuelle en amont. Les résultats sont pour l’instant relativement basiques, mais ce qui impressionne, c’est la vitesse d’exécution de cette IA et les progrès réalisés sur ce terrain en très peu de temps.

LATTE3D créée par ailleurs des modèles 3D en exploitant un format très répandu, leur permettant d’être facilement intégrés par la suite à des environnements virtuels, explique Nvidia dans son communiqué. Concrètement, cette IA pourra donc servir aux développeurs pour peupler plus rapidement un monde ouvert, par exemple, mais des applications dans le domaine publicitaire, dans la robotique, ou même pour des projets de conception sont aussi évoquées.

Nvidia progresse vite sur la génération de modèles 3D par IA

« Il y a un an, il fallait une heure aux modèles d’IA pour générer des visuels 3D de cette qualité. Aujourd’hui, il ne faut plus que 10 à 12 secondes », commente Sanja Fidler, vice-présidente de la recherche en AI chez Nvidia et responsable du développement de LATTE3D. « Nous pouvons désormais produire des résultats beaucoup plus rapidement, ce qui met la génération de modèles 3D à partir de texte, en temps quasi réel, à la portée des créateurs de tous les secteurs d’activité ».​

Lien YouTube S’abonner à Frandroid Ce contenu est bloqué car vous n’avez pas accepté les cookies et autres traceurs. Ce contenu est fourni par YouTube.

Pour pouvoir le visualiser, vous devez accepter l’usage étant opéré par YouTube avec vos données qui pourront être utilisées pour les finalités suivantes : vous permettre de visualiser et de partager des contenus avec des médias sociaux, favoriser le développement et l’amélioration des produits d’Humanoid et de ses partenaires, vous afficher des publicités personnalisées par rapport à votre profil et activité, vous définir un profil publicitaire personnalisé, mesurer la performance des publicités et du contenu de ce site et mesurer l’audience de ce site (en savoir plus) J’accepte tout Gérer mes choix

Un peu à la manière de ce que propose Midjourney pour la génération de visuels, LATTE3D créée de toutes pièces plusieurs modèles 3D légèrement différents pour chaque requête textuelle, de manière à laisser l’utilisateur final choisir le modèle le plus réussi, ou le plus proche de son idée originale.

On apprend pour le reste que l’IA de Nvidia a pour l’instant été entraînée avec deux ensembles de données spécifiques seulement : les animaux et les objets du quotidien, mais il est tout à fait possible de faire évoluer LATTE3D en l’entraînant sur d’autres ensembles. Les perspectives de création sont alors quasi infinies.

Sur le plan technique, on apprend enfin que LATTE3D a été entraîné à partir de GPUs Nvidia A100, mais que pour les démonstrations ci-dessus, l’IA ne sollicite qu’un seul GPU : une carte graphique professionnelle RTX A6000 « Ampere », lancée en fin d’année 2020.