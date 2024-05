Gemini était la star de la Google I/O 2024 avec de nombreuses annonces autour du LLM. Parmi elles, l'arrivée de Gemini 1.5 Flash, la version ultra-rapide du grand modèle de langage. Pourquoi ce LLM et à quoi va-t-il bien servir ?

C’était le sujet du jour : Gemini, avec le plein d’innovations durant la conférence annuelle de Google, la Google I/O 2024. En effet, Gemini s’invite dans Google Photos, sur la recherche Google, et sa version la plus puissante arrive dans Gemini Advanced. En parallèle de toutes ces annonces, il y a aussi une version très rapide du LLM : Gemini 1.5 Flash.

C’est quoi Gemini 1.5 Flash ?

Google présente sa énième version de Gemini, baptisée Gemini 1.5 Flash. Il s’agit d’un modèle de langage plus léger que Gemini 1.5 Pro, « conçu pour être rapide et efficace à grande échelle », précise Google dans son billet de blog. L’idée n’est pas tant d’en faire un LLM utilisable directement par le grand public, mais d’un modèle intégré dans certaines applications (via l’API de Google). Ce LLM est en fait « optimisé pour les tâches à haut volume et à haute fréquence », tout en étant plus rentable pour les entreprises qui voudraient l’utiliser.

Pour autant, il est multimodal comme son grand frère Gemini 1.5 Pro, ce qui signifie qu’il peut se baser sur du texte, de l’audio ou encore des images. Et ce y compris sur de grandes quantités d’informations. Pour cela, il dispose d’une capacité de traitement d’un million de tokens (ou jetons), ce qui permet de traiter en une fois une heure de vidéo, onze heures d’audio, 30 000 lignes de code ou 700 000 mots.

Si Gemini 1.5 Flash est moins bon que 1.5 Pro ou 1.0 Ultra, il se montre dans tous les tests avancés par Google meilleur que Gemini 1.0 Pro présenté en décembre dernier. Ce qui pose question, c’est que dans sa communication, Google ne mentionne qu’une seconde de latence, sans statistiques avancées. C’est plutôt étrange pour un LLM qui se veut spécialisé.

Vous n’utiliserez pas (directement) cette version de Gemini

Google vend son modèle en indiquant que Gemini 1.5 Flash « excelle en matière de résumés, d’applications de chat, de sous-titrage d’images et de vidéos, d’extraction de données à partir de longs documents et tableaux, etc. » Sa vitesse de réponse : moins d’une seconde de latence en moyenne dans la grande majorité des situations, se permet d’avancer Google.

Gemini 1.5 Flash est pour le moment disponible en test en avant-première publique dans sa version avec 1 million de jetons, uniquement dans Google AI Studio et Vertex AI (sur Google Cloud). L’idée pour Google est donc avant tout de vendre ce LLM auprès des entreprises et des développeurs.