Midjourney v5 : une évolution notable à l’instar de GPT-4

 

Midjourney v5 est maintenant disponible. Le nouveau modèle peut générer des images beaucoup plus réalistes et détaillées. On vous explique tout ça.

Un portrait d’Elon Musk généré par une IA // Source : Frandroid avec Midjourney

Si vous suivez assidûment Frandroid, vous avez sans doute remarqué des images conçues grâce à Midjourney. Nous employons cet instrument pour générer des illustrations. Récemment, une cinquième version a été lancée, présentant une architecture neuronale significativement retravaillée et incorporant de nouvelles approches esthétiques. Alors que GPT-4 fait beaucoup parler de lui dans les médias, Midjourney est un autre outil qui mérite également notre attention et qu’il convient de suivre de près.

Qu’est-ce que Midjourney ?

Midjourney est un laboratoire de recherche indépendant qui a développé un programme éponyme basé sur l’intelligence artificielle. Ce programme est conçu pour générer des images à partir de descriptions textuelles, à l’instar de DALL-E d’OpenAI et Stable Diffusion. Bien que la technologie sous-jacente semble être Stable Diffusion, les créateurs de Midjourney ont développé leur propre style unique, avec un algorithme maison, qui a attiré beaucoup d’attention.

L’outil est en version bêta ouverte depuis juillet 2022. Depuis lors, il attire un nombre croissant d’utilisateurs : la version 2 de leur algorithme a été lancée en avril 2022, suivie de la version 3 en juillet de la même année. Le 10 novembre 2022, l’itération alpha de la version 4 a été mise à disposition des utilisateurs. Enfin, Midjourney dans sa version 5 est disponible depuis le 15 mars 2022.

Un portrait de Tim Cook généré par une IA // Source : Frandroid avec Midjourney

Midjourney opère à l’aide de simples mots, mais il emploie aussi des « prompts » — des commandes avancées — pour créer des images détaillées et précises avec le bot Midjourney. Ces prompts offrent une description textuelle de l’image que vous voulez générer et orientent le bot dans la réalisation de celle-ci. Que vous désiriez une photographie, une peinture ou un dessin rapide, le prompt peut assister le bot dans la création de l’image précise que vous souhaitez obtenir.

Une image d’une Tesla miniature en Lego générée par une IA // Source : Frandroid avec Midjourney

Qu’est-ce qui change dans cette cinquième monture ?

Le créateur de Midjourney, David Holz, décrit la V5 comme un outil professionnel, car, contrairement à ses versions antérieures, elle n’est pas restreinte à des styles artistiques spécifiques et propose une plus grande diversité de résultats visuels. Cependant, cette V5 est toujours en phase alpha et connaîtra des « changements majeurs » avant la version définitive.

En somme, cela permet une plus grande liberté créative, mais cette liberté doit être apprivoisée. D’après David Holz, cela peut impliquer d’utiliser des prompts plus élaborés détaillant de manière explicite les aspects de l’image, tels que l’éclairage et l’atmosphère, afin d’obtenir le résultat escompté. Précisons, au passage, qu’il est important de préciser des détails précis pour que le bot génère des éléments spécifiques. Pensez au sujet, au médium, à l’environnement, à l’éclairage, à la couleur, à l’ambiance et à la composition. Tout ce qui n’est pas mentionné sera généré de manière aléatoire.

Après avoir essayé la V5, nous avons constaté des résultats plus exacts, pertinents et moins d’anomalies ou d’échecs. Toutefois, la création d’images s’avère plus lente. Cette situation est semblable à ce que l’on peut observer avec GPT-4 sur ChatGPT. La version V5 offre des améliorations significatives dans la compréhension du langage, la précision et la flexibilité esthétique, qui contribuent toutes à la génération d’images à couper le souffle. La profondeur et la richesse des images qu’il produit sont vraiment étonnantes, et la gamme d’esthétiques qu’il peut évoquer est étonnante.

Comment utiliser Midjourney V5 ?

Actuellement, MidJourney n’est accessible que via Discord (profitez-en pour rejoindre notre serveur), donc pour commencer à l’utiliser, vous avez besoin d’un compte sur Discord. Tout d’abord, visitez le site Web de MidJourney et cliquez sur le programme de participation à la bêta.

Après cela, vous devez accepter une invitation au serveur Discord Midjourney. Ouvrez maintenant votre application Discord et cliquez sur l’icône en forme de bateau du serveur MidJourney. Utilisez l’invite avec la commande /imagine et commencez à créer des images à partir de votre imagination. Vous pouvez le faire sur le serveur que vous voulez, il faudra évidemment paramétrer Midjourney dans ce dernier.

Pour activer la V5, il faut un compte payant, puis activer cette version avec la commande /settings. Notez que la V4 fonctionne déjà très bien, mais un compte gratuit sera limité dans les quantités de requêtes possibles.

Comment utiliser les prompts ?

Les commandes de base sont aussi simples qu’un seul mot, une phrase ou même un émoji. Le bot ne comprend pas la grammaire ou la structure des phrases, le choix des mots est en conséquence important. Les synonymes plus spécifiques fonctionnent mieux que les génériques tandis que le fait d’utiliser moins de mots donne plus de poids à chaque mot. Vous avez aussi la possibilité d’utiliser des prompts, les fameuses commandes avancées.

Les commandes avancées peuvent inclure une ou plusieurs URL d’image, plusieurs phrases de texte et un ou plusieurs paramètres. Les URL d’image peuvent être ajoutées à une invite pour influencer le style et le contenu du résultat final, et les prompts peuvent modifier la façon dont une image est générée, tels que les proportions, les modèles…  Numerama évoque plusieurs exemples pour bien commencer. De plus, ce site génère des prompts à la volée.

Résultats avec la commande cyberpunk cat –seed 1071856 –ar 3:2 –v 5 // Source : Frandroid avec Midjourney

Il est également essentiel de se concentrer sur ce que vous voulez dans l’image plutôt que sur ce que vous ne voulez pas. Enfin, parlez à Midjourney en anglais pour avoir des résultats plus précis. Si ce n’est pas votre langue maternelle, n’hésitez pas à utiliser DeepL pour les traductions.

Quelques exemples générés avec Midjourney V5

Voici quelques exemples supplémentaires d’images générées avec Midjourney V5.


Utilisez-vous Google News (Actualités en France) ? Vous pouvez suivre vos médias favoris. Suivez Frandroid sur Google News (et Numerama).