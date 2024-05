Lors de sa Google I/O 2024, Google a présenté Veo, son modèle de génération de vidéos par IA. Il s'agit en fait d'un sérieux concurrent à Sora, l'outil de génération de vidéos présenté par OpenAI il y a quelques mois.

Ce mardi 14 mai, c’était la Google I/O 2024 en direct du siège de Google outre-Atlantique. Le géant du web y a fait beaucoup d’annonces et y a présenté nombre d’innovations. Parmi elles, Veo : un générateur de vidéos fonctionnant grâce à l’intelligence artificielle. Google a diffusé des démonstrations qui semblent assez impressionnantes, du moins autant que Sora d’OpenAI.

Veo : le générateur de vidéos quand on n’a plus d’« id »

Google présente son modèle de génération de vidéos comme le plus performant qu’il ait jamais conçu. Et pour cause : Veo s’appuie sur des modèles précédents comme Generative Query Network, DVD-GAN, Imagen-Video, Phenaki, WALT, VideoPoet ou encore Lumiere. Le principe : l’outil peut générer de A à Z des vidéos de plus d’une minute en qualité 1080p. Le tout à partir de texte, mais aussi d’images et de vidéo : avoir une requête plus complète, c’est de quoi avoir une meilleure vidéo en sortie. Des vidéos dans lesquelles « les personnes, les animaux et les objets se déplacent de manière réaliste tout au long des prises de vue. » Elles peuvent être modifiées à l’aide d’autres requêtes, des prompts. Dans l’interface présentée par Google, un bouton permet d’allonger la vidéo qui a été générée.

Ce que Google met en avant, c’est aussi le « large éventail de styles cinématographiques et visuels » dont on peut profiter. Cela est rendu possible grâce à l’interprétation poussée de Veo du langage et de la sémantique visuelle. Il comprend différents termes utilisés dans le monde de la vidéo : « timelapse » ou « plan aérien » par exemple. Google précise également que les vidéos seront marquées avec SynthID, afin d’identifier qu’elles ont été générées et qu’elles ne sont pas réelles. SynthID est en fait un système de watermarking développé par la filiale Deepmind. Selon cette dernière, il est impossible de le retirer.

L’entreprise va rendre Veo accessible à certains cinéastes et créateurs pour commencer à collaborer avec eux. L’outil sera en fait disponible dans VideoFX, une section de l’AI Test Kitchen de Google, à savoir son espace pour découvrir ses expérimentations en matière d’intelligence artificielle. Il faudra s’inscrire sur liste d’attente. Dans le cadre de sa présentation, Google a travaillé avec Donald Glover, principalement connu sous son nom de rapeur Childish Gambino, et son studio Gilga.

Bientôt des vidéos générées par IA grâce à Veo partout sur YouTube Shorts ?

À la toute fin de son communiqué de presse, Google écrit : « à l’avenir, nous intégrerons également certaines des fonctionnalités de Veo à YouTube Shorts et à d’autres produits. » Une petite phrase, presque laissée en suspens, mais qui permet d’entrevoir l’avenir.

Veo semble taillé pour être un concurrent à Sora d’OpenAI, un modèle dévoilé il y a quelques mois. OpenAI cherche essentiellement à convaincre des studios de cinéma de l’utiliser, ou du moins de l’expérimenter. On peut s’attendre à ce que Google fasse de même, mais l’entreprise a d’autres idées en tête.

À terme, Veo pourrait être utilisé sur YouTube Shorts pour générer de courtes vidéos d’une minute. En réalité, des vidéos générées par IA, on en trouve déjà sur les réseaux sociaux de vidéos au format vertical.

Des créateurs de contenu utilisant des avatars virtuels, ou bien des vidéastes souhaitant illustrer leurs Shorts pourraient être amenés à utiliser Veo durant leur processus créatif, pour l’automatiser. Les défis techniques pour avoir un modèle suffisamment performants sont encore grands, mais Veo est sans doute une fenêtre sur le futur de l’IA.