Meta vient d’annoncer la nouvelle mouture de son IA, Llama 3.2. Open-source, multimodale, capable de fonctionner sur un smartphone et dotée d’une reconnaissance vocale : l’outil s’annonce très performant et surtout gratuit sur l’ensemble des services de la firme américaine.

Oui, Meta ajoute la reconnaissance vocale à son IA // Source : Capture d’écran Frandroid

Difficile de ne pas parler d’intelligence artificielle depuis la sortie de ChatGPT. Pour preuve, Meta a consacré plusieurs minutes à ce sujet lors de sa conférence annuelle, la Meta Connect 2024, et nous sommes ravis d’avoir fait le déplacement pour y assister (en ligne).

Pour la troisième fois en 2024, Llama a été mis à jour pour passer en version 3.2, open-source. Et, il ne s’agit pas de petites améliorations, car l’IA de Meta devient enfin multimodale et peut travailler avec des images aussi bien qu’avec du texte. Il sera possible de lui poser des questions sur des photos spécifiques, mais aussi de lui demander de modifier n’importe quel cliché par exemple. Ce n’est pas une nouveauté, puisque Google et OpenAI, entre autres, proposent déjà ce type de fonctionnalité depuis un certain temps déjà.

Llama devient multimodal et peut travailler avec des images // Source : Capture d’écran Frandroid

Dans la même veine que ChatGPT et Gemini, il est enfin possible de converser vocalement avec Llama, qui pourra répondre avec les voix de personnalités connues. Meta a également développé un outil de doublage automatique pour les Reels sur Instagram, afin de traduire directement les paroles des créateurs de contenu tout en gardant le même timbre de voix.

Les démonstrations faites lors de la Meta Connect sont assez impressionnantes, même si seules deux langues sont pour l’instant disponibles : l’anglais et l’espagnol.

De nouvelles capacités impressionnantes, mais indisponibles chez nous dans l’immédiat.

Tout cela offre aux créateurs de contenu la possibilité d’atteindre un public plus large. Toutefois, ceux-ci ne sont pas au bout de leurs peines, car les nouvelles fonctionnalités de Llama profiteront aussi aux utilisateurs d’AI Studio. Cet outil, qui permet de créer un chatbot à son image, pourra désormais s’animer pour créer un véritable avatar virtuel.

On peut donc imaginer qu’il sera possible de lancer une conversation vidéo avec un double IA de Léon Marchand et de lui poser des questions sur la natation ou les JO de Paris. Là encore, la démonstration faite sur scène était impressionnante, mais il reste à voir comment les créateurs de contenus et les agents de célébrités s’approprieront l’outil.

Les créateurs de contenus vont pouvoir se créer un véritable double virtuel // Source : Capture d’écran Frandroid

Llama 3.2 se décline en quatre modèles : deux pour l’image (11 et 90 milliards de paramètres), et deux pour le texte (1 et 3 milliards de paramètres). Sur ce dernier point, on est loin de ce que peut faire Llama 3.1 avec ses 405 milliards de paramètres, et ce, pour une bonne raison : ces versions allégées sont conçues pour fonctionner principalement en local, sur les smartphones et les ordinateurs des utilisateurs.

Llama 3.2 sera disponible gratuitement via les différentes applications de Meta (WhatsApp, Instagram, Facebook, Messenger)… sauf sur le Vieux Continent. L’Union européenne serre la vis à l’intelligence artificielle, et Meta devra se conformer aux réglementations locales avant de lancer ses nouveaux outils chez nous.