Avec Gemma 2, Google tente de concilier puissance et portabilité. Une équation complexe qui mérite un examen approfondi, loin des effets d’annonce.

Début août, pas de repos quand on est en train de courir un marathon contre OpenAI, Meta, Microsoft… Google vient de dévoiler Gemma 2, son nouveau modèle d’intelligence artificielle conçu pour fonctionner sur des appareils mobiles.

L’annonce va certainement faire grand bruit, mais il convient de prendre du recul face aux promesses alléchantes du géant de la tech. Gemma 2 est présenté comme une petite révolution : un modèle d’IA capable de tenir dans un smartphone tout en rivalisant avec des systèmes bien plus imposants comme GPT-3.5.

Concrètement, Gemma 2 est un modèle de langage comprenant 2 milliards de paramètres. C’est effectivement peu comparé aux centaines de milliards de paramètres des modèles les plus avancés. Mais attention à ne pas tomber dans le piège des comparaisons hâtives : la taille d’un modèle n’est pas le seul critère de performance.

Google affirme avoir utilisé une technique appelée « distillation » pour compresser les connaissances de modèles plus volumineux dans Gemma 2. C’est une approche intéressante, mais qui a ses limites. La distillation permet effectivement de réduire la taille d’un modèle, mais souvent au prix d’une perte de nuance et de flexibilité. Il faut donc rester prudent face aux affirmations de performances « comparables » à des modèles bien plus grands.

Les graphiques présentés par Google sont certes impressionnants, mais rappelons-nous que les benchmarks en IA sont souvent taillés sur mesure pour mettre en valeur certains aspects spécifiques d’un modèle. La réalité de l’utilisation quotidienne pourrait s’avérer bien différente.

L’IA embarquée : un horizon encore lointain

L’idée d’avoir un assistant IA ultra-performant directement sur nos smartphones (et nos PC) est séduisante, mais la réalité est plus nuancée. Même si Gemma 2 représente une avancée, seule une infime partie des appareils actuellement sur le marché serait capable de le faire tourner de manière fluide.

On parle ici des smartphones haut de gamme les plus récents, qui ne représentent qu’une fraction du parc mondial.

Pour l’immense majorité des utilisateurs, l’IA basée sur le cloud restera la norme pendant encore un bon moment. Les limitations en termes de puissance de calcul, d’autonomie et de gestion thermique des appareils mobiles sont autant d’obstacles qui ne se franchiront pas du jour au lendemain.

Si vous voulez jouer avec le nouveau modèle Gemma 2 2B, ça se passe sur Google AI Studio et il est disponible via Ollama pour fonctionner sur PC et Mac.

