J’ai généré 5 musiques avec Gemini : la nouvelle fonction Lyria impressionne déjà malgré les limites

 
Google Gemini sait désormais gérer de la musique grâce à l’intégration de l’outil Lyria 3. Voici ce que ça donne.
Gemini sait faire de la musique avec Lyria 3 // Source : Image génére par Frandroid avec l’aide de l’IA

Gemini savait déjà générer des images et des vidéos de manière bluffante grâce à Nano Banana. Voici désormais l’équivalent côté musique avec l’outil Lyria 3 qui signe son arrivée dans le service IA de Google. J’ai pu générer quelques musiques et je vous propose de découvrir ce que ça donne.

Le procédé

Avant toute chose, quelques informations sont bonnes à connaître.

  • Lyria s’active comme Nano Banana : en cliquant sur le bouton Outils sous la barre de saisie de texte.
  • Les musiques générées ne durent que 30 secondes et peuvent être téléchargées en mp3 ou mp4 (la version mp4 n’est qu’une image fixe générée par Nano Banana et qui se termine par une animation du logo de Gemini).
  • À chaque fois qu’on lance Lyria, Gemini propose, sous la forme d’une mosaïque, différents styles musicaux pour orienter l’IA dans sa génération de contenus. Vous n’êtes pas obligé de choisir un template pour écrire votre prompt.
  • Vous pouvez indiquer le genre et la période musicale, le tempo et le rythme, les instruments, le timbre, le genre ou la tonalité de la voix, les paroles ou la thématique.
L’outil Lyria de Google Gemini vous laisse choisir un template musical avant d’écrire votre prompt si vous le souhaitez. // Source : Capture d’écran Frandroid

Notez que ces essais ont pu être réalisés après que Google m’a proposé de débloquer la fonction en avant-première sur mon compte.

Allez, c’est parti !

Mon tout premier essai

Pour mon tout premier essai, j’ai cliqué sur le template « Rap des années 90 » et j’ai demandé un texte poignant sur un fléau qui nous guette tous.

Le prompt – « Je veux un morceau qui dénonce le fléau de marcher dans une flaque d’eau avec des chaussettes. La chanson doit être en français. »

L’invitation au kebab

Pour ma deuxième tentative, je me suis inspiré d’un exemple, en anglais, fourni dans des documents de support que Google a fourni à la presse. Dans la langue de Shakespeare, cela donnait ce qui suit. « Create a pop rap fusion track with melodic hooks and atmospheric production about dinner plans at 7pm Saturday night at the « Food Spot » so my friends don’t forget. ».

Je l’ai traduit en français et en l’adaptant à ma sauce.

Le prompt – « Crée un morceau fusion pop-rap avec des refrains mélodiques et une production atmosphérique sur le thème du dîner prévu samedi soir à 19h au kébab du coin afin que mes amis n’oublient pas. La chanson doit être en français. »

Le voyage en Asie

Essai suivant. J’ai pensé à un couple d’amis actuellement en vadrouille en Asie pour plusieurs mois. Je m’en suis inspiré pour demander, sur le template « Cinématique », une musique chantant leur périple. Attention, je précise que je ne comptais pas leur envoyer le résultat.

Le prompt – « Je veux envoyer, à un couple d’amis, une musique épique racontant leurs aventures en Asie du Sud où ils passent notamment par le Cambodge, la Malaisie, la Thaïlande, le Vietnam ou encore l’Indonésie. Je veux des paroles en français, avec une voix masculine assez grave et un rythme qui monte crescendo. »

L’ode à la pluie

Sur cette requête, je voulais tester les connaissances instrumentales de Lyria. J’ai alors demandé une chanson sur la pluie, mais en précisant que je voulais du guembri, un instrument à cordes typique de la musique gnaoua au Maroc et plus largement au Maghreb et dont raffole mon père. Le résultat m’a bluffé, d’autant plus que l’IA a, d’elle-même, généré les paroles en arabe.

Le prompt – « Je veux une musique dynamique avec une voix au timbre rocailleux faisant l’éloge de la pluie. En instrument, je veux du guembri et quelques percussions. »

La musique pour accompagner une vidéo

Là, j’ai tenté une fonctionnalité mise en avant par Google : donner une vidéo ou une image et générer une musique qui en illustre bien l’esprit. Ni une ni deux, avec mon collègue Grégoire, nous avons fait les guignols en agitant les poings en l’air dans une vidéo selfie et en embrassant des blasons inexistants comme si nous célébrions le but d’une équipe de foot.

Le prompt – « Je veux une musique rock qui se cale bien sur cette vidéo. »

Conclusion : les limites de Lyria ne devraient pas durer

La génération de musique par IA compte déjà un acteur bien identifié : Suno. Lyria 3 dans Gemini vient donc marcher sur ses plates-bandes, mais force est de constater que Google a encore un peu de retard.

L’outil Lyria, malgré quelques petits ratés ici et là entre les exemples que je vous ai partagés ici, fonctionne très bien. Mais il reste très scolaire. Ma première réflexion a été de me dire qu’il était très « premier degré ». Il manque encore un petit supplément d’âme là où Suno cultive plus une fibre artistique.

Lyria dans Gemini // Source : Capture d’écran Frandroid

Cependant, ces limites de Lyria ne dureront sans doute pas. Les derniers modèles de Gemini n’ont cessé d’impressionner et il paraît peu probable que la génération de musique plus sophistiquée reste une difficulté pour l’IA de Google.

En attendant, Lyria reste parfaitement efficace et déjà impressionnant.


Utilisez-vous Google News (Actualités en France) ? Vous pouvez suivre vos médias favoris. Suivez Frandroid sur Google News (et Numerama).

Recherche IA boostée par
Perplexity