« Nous sortons de l’ère du silence » : Gemini sait générer des vidéos avec le son

 
Gemini évolue et sait maintenant faire des vidéos avec le son grâce au nouveau modèle Veo 3.
Extrait d’une vidéo générée par IA (pour illustration) // Source : Google

Tout va très vite avec l’intelligence artificielle. Il n’y a pas longtemps, Google présentait le modèle Veo 2 pour Gemini capable de générer des vidéos. À la Google I/O 2025, la firme de Mountain View lève déjà le voile sur Veo 3 qui signe une première dans ce domaine.

Avec Veo 3, Gemini peut évidemment toujours générer des vidéos avec la promesse de rendus encore plus pertinents et intelligents. Or, Veo 3, c’est aussi le premier modèle d’IA capable de générer des vidéos avec le son.

Sortir de « l’ère du silence »

Demis Hassabis, le patron de DeepMind, la branche de Google dédiée à l’intelligence artificielle explique ainsi à la presse que « nous sortons de l’ère du silence pour les vidéos générées par IA ». Un clin d’œil pas forcément subtil à l’un des plus gros chamboulements dans l’histoire du cinéma où l’arrivée du son a drastiquement transformé l’industrie.

Le clin d’œil au cinéma se poursuit d’ailleurs avec l’outil Flow qui exploite justement Veo 3 pour créer des vidéos comme si on était un réalisateur.

Une démo réussie

Google a montré une rapide démonstration d’une vidéo générée avec Veo 3. On y voit une chouette voler puis atterrir dans une forêt la nuit avec une musique un peu enchantée en fond. L’animal atterrit près d’un blaireau et les deux protagonistes ont une courte discussion.

Comme toujours avec les démos, c’est impressionnant, mais on attend de pouvoir mettre la main dessus pour savoir ce que ça vaut réellement.


Le saviez-vous ? Google News vous permet de choisir vos médias. Ne passez pas à côté de Frandroid et Numerama.