Gemini 2.0 : ce qui change avec la nouvelle IA et comment l’essayer

Promis, cet article n’a pas Ă©tĂ© Ă©crit par une IA

 
Google vient de prĂ©senter Gemini 2.0, une version plus rapide et moins coĂ»teuse Ă  exĂ©cuter. Cette IA se veut surtout profondĂ©ment multimodale, ce qui signifie qu’elle peut manipuler du texte, des images et du son en mĂȘme temps, la rendant plus utile que jamais.
Gemini 2.0 devrait propulser les ambitions de Google dans une nouvelle Ăšre en 2025 // Source : Google

La course Ă  l’intelligence artificielle a pris une nouvelle tournure avec l’accĂšs au grand public de ChatGPT, Ă©ditĂ© par OpenAI et dont la recherche a Ă©tĂ© beaucoup encouragĂ©e (et financĂ©e) par Microsoft. Face aux promesses et aux performances de ces avancĂ©es, les autres gĂ©ants de la tech n’ont pas tardĂ© Ă  suivre le mouvement, et Ă  ce jeu, Google se positionne comme un concurrent trĂšs sĂ©rieux.

Avec Gemini, la firme de Mountain View veut en effet conserver sa place dominante dans le marchĂ© de la recherche sur le web, mais aussi intĂ©grer l’IA dans tous ses services qui peuvent en bĂ©nĂ©ficier, tels que Workspace, Gmail ou encore Home. Mais cette Ă©volution n’a commencĂ© que rĂ©cemment, et nombreux sont ceux qui se demandent encore Ă  quoi ressemblera l’Internet de demain.

Pour cela, il n’y a plus besoin de beaucoup d’imagination, car Google vient de prĂ©senter Gemini 2.0, une version plus rapide que Gemini 1.5, plus complĂšte, plus polyvalente et surtout, selon les termes de la firme amĂ©ricaine : plus utile.

Quand l’intelligence artificielle comprend tout pour pouvoir tout faire

Multimodal : c’est sĂ»rement le mot clĂ© Ă  retenir ici. Si les outils dĂ©veloppĂ©s par OpenAI ou Google sont capables de traiter plusieurs types d’informations diffĂ©rentes en mĂȘme temps, que ce soit du texte, des images ou du son, Gemini 2.0 pousse la barre un peu plus loin en intĂ©grant davantage cet aspect au cƓur de son IA. Selon la firme de Mountain View dans un communiquĂ© de presse, cela devrait offrir « des performances accrues » et permettre « l’utilisation d’outils natifs comme la recherche Google ».

Surtout, Gemini 2.0 devrait pouvoir propulser « des expĂ©riences agentives plus avancĂ©es, permettant aux assistants IA d’anticiper les besoins des utilisateurs et d’effectuer des actions sous leur supervision ». Ainsi, si Google veut rendre les conversations avec son outil plus fluides et complĂštes, que ce soit en pleine rue avec Astra, ou en faisant une simple recherche sur internet, elle souhaite aussi lui permettre de faire plus de choses pour nous et Ă  notre place.

C’est du moins la raison d’ĂȘtre, entre autres, du projet Mariner, une extension pour Chrome qui peut utiliser le navigateur de maniĂšre autonome. Il sera, par exemple, possible de lui demander une recette pour faire un mojito, d’en lister les ingrĂ©dients, et les ajouter Ă  un panier sur le site de votre commerçant favori.

Google a d’autres agents sous le coude, pour les dĂ©veloppeurs ou les joueurs, et il ne pourrait s’agir que d’un dĂ©but. Dans un billet de blog, Sundar Pichai, PDG de la firme, annonce une « nouvelle Ăšre agentive », oĂč Gemini 2.0 sera dĂ©tournĂ© en davantage d’usages diffĂ©rents, adaptĂ©s aux services qui en auront besoin.

L’ùre d’une IA vraiment utile, mais surtout moins gourmande

Pour le moment, outre les impressionnantes dĂ©monstrations publiĂ©es et les espĂ©rances de Google, on ne sait pas encore si Gemini 2.0 sera tellement plus utile que son prĂ©dĂ©cesseur. Selon Bloomberg, qui a pu tester certaines de ses fonctionnalitĂ©s, l’outil n’est pas exempt de quelques erreurs. Mais ce n’est pas forcĂ©ment le plus important ici.

RelayĂ© par The Verge, Demis Hassabis, PDG de Google DeepMind, a dĂ©clarĂ© que le but de cette nouvelle mouture n’est pas seulement d’ĂȘtre plus performante, mais aussi d’ĂȘtre moins coĂ»teuse. Un objectif atteint avec Gemini 2.0 Flash, un modĂšle « aussi performant que le modĂšle Pro actuel » de Gemini 1.5, selon Hassabis. « On peut donc considĂ©rer qu’il s’agit d’un niveau supĂ©rieur, pour le mĂȘme rapport coĂ»t-efficacitĂ©, les mĂȘmes performances et la mĂȘme vitesse », ajoute-t-il.

Pour aller plus loin
AprĂšs le texte, l’image et le son, l’IA peut dĂ©sormais gĂ©nĂ©rer des jeux vidĂ©o

Gemini 2.0 n’en est qu’au stade expĂ©rimental, et il va falloir attendre 2025 pour prendre totalement conscience de son plein potentiel. Il est toutefois possible d’en avoir un avant-goĂ»t via le portail web de Gemini. Soit en activant Gemini 2.0 Flash, soit en essayant Deep Research, une nouvelle fonctionnalitĂ© disponible pour les abonnĂ©s Ă  Gemini Advanced et capable de mener « des recherches complexes et de compiler des rapports ».

Attention toutefois, si vous ne parlez pas la langue de Shakespeare avec vos IA, il se peut que Gemini 2.0 ne soit pas aussi performant qu’annoncĂ©. En effet, la plupart des fonctionnalitĂ©s mises Ă  notre disposition sont disponibles en anglais seulement. Mais l’outil de Google devrait rapidement progresser sur ce point, et mĂȘme, ĂȘtre capable d’échanger dans plusieurs langues diffĂ©rentes dans une mĂȘme conversation. Et ça, ce serait vraiment utile !


Téléchargez notre application Android et iOS ! Vous pourrez y lire nos articles, dossiers, et regarder nos derniÚres vidéos YouTube.

Les derniers articles