Google présente Gemini, son IA époustouflante ridiculisant ChatGPT

 

Google Bard n'était que le début. La firme de Mountain View vient d'annonce Gemini, son nouveau modèle de langage (LLM) capable de battre GPT-4 (ChatGPT) dans presque tous les domaines, avec en prime une compréhension impressionnante de son environnement.

Logo de Gemini // Source : Google

Oubliez ChatGPT, Google entre dans la place ! À la rédaction de Frandroid, nous nous étonnions que Google, entreprise « AI-first » de plusieurs milliers d’employés, dont beaucoup s’investissent dans l’IA depuis longtemps, se laisse damer le pion par OpenAI, une petite start-up (même soutenue par Microsoft). Si LaMDA puis PaLM-2, les moteurs derrière Bard, n’étaient pas à la hauteur, Gemini vient relever la barre.

Google annonce Gemini, son nouveau modèle d’IA

Qu’est-ce que Gemini ? Il s’agit du nouveau modèle d’IA conçu dès le départ pour être multimodal afin d’avoir une parfaite compréhension de son environnement et du contexte. Pour cela, Gemini ne se base pas uniquement sur du texte, mais peut analyser, traiter et combiner avec fluidité différents types d’informations, dont le texte, le code, l’audio, l’image et la vidéo.

Des performances exceptionnelles

Ce nouveau modèle d’IA s’annonce extrêmement performant. Sur 30 des 32 référentiels académiques, Gemini surpasse GPT-4, ainsi que tous les meilleurs résultats actuellement disponibles chez la concurrence. Si le modèle d’OpenAI peut tenter de rivaliser sur le texte, celui de Google s’impose parfois très largement dès lors qu’il s’agit de gestion multimodale.

« Les capacités sophistiquées de raisonnement de Gemini 1.0 lui permettent d’interpréter des informations écrites et visuelles complexes, ce qui le rend singulièrement apte à isoler des connaissances difficiles à discerner dans des volumes considérables de données », explique Google dans son communiqué de presse. Bien que Gemini excelle sur les problèmes de mathématiques et de physique, il n’en reste pas moins efficace sur de la compréhension plus simple, mais moins logique.

Dans une vidéo publiée sur YouTube, Google fait la démonstration des compétences époustouflantes de Gemini. Mais voyez plutôt par vous-mêmes :

Gemini à disposition de tout le monde

Google souhaite mettre Gemini dans toutes les mains et cherche à optimiser la première version de son modèle sur trois tailles :

  • Gemini Ultra : la démonstration ci-dessus, le plus complet des modèles ;
  • Gemini Pro : un modèle polyvalent adapté à de très nombreuses tâches ;
  • Gemini Nano : un modèle capable de tourner en local.

Évidemment, Gemini s’intègre à Google Bard, l’agent conversationnel déjà disponible. Gemini Pro intègre dès aujourd’hui Google Bard en anglais dans une très longue liste de pays. Malheureusement, l’Europe n’en fait pas encore partie, certainement pour des raisons de RGPD, comme c’était le cas au lancement de Bard.

Gemini Ultra de son côté intègrera une version « Advanced » de Google Bard en début d’année 2024. Avant cela, le modèle doit encore passer des « tests de confiance et de sûreté préalables à son déploiement ».

Enfin, Gemini Nano arrive également dès aujourd’hui sur le Pixel 8 Pro. De quoi générer des réponses automatiques dans vos conversations WhatsApp (en anglais dans un premier temps) en un seul clic depuis votre clavier Gboard et plus encore.

L’évolution est plutôt incroyable et promet de relancer la guerre des IA génératives en 2024 pour se rapprocher toujours plus de l’idéal de science-fiction posé par Jarvis dans Iron Man.


Le saviez-vous ? Google News vous permet de choisir vos médias. Ne passez pas à côté de Frandroid et Numerama.