Gemma 4 sur Nintendo Switch : l'exploit technique en local

L’intelligence artificielle s’exécute sur des supports toujours plus inattendus. Une développeuse a récemment réussi à faire fonctionner la version allégée de Gemma 4, le modèle ouvert de Google, directement et localement sur une Nintendo Switch.

Google a lancé la famille de modèles Gemma 4 il y a quelques jours à peine. Dérivée des technologies de Gemini 3, cette génération se distingue par son approche ouverte (sous licence Apache 2.0) et sa multimodalité native, lui permettant de traiter des requêtes textuelles, visuelles et vocales. Surtout, la gamme a été conçue pour s’exécuter localement sur des configurations très variées, sans nécessiter de connexion à un serveur. S’il est tout à fait possible de l’installer sur PC et Mac, et même de la déployer gratuitement hors-ligne sur un smartphone, la communauté a déjà décidé de tester les limites matérielles de cet outil sur un support beaucoup plus atypique.

C’est sur le réseau social X que l’utilisatrice @maddiedreese a partagé une vidéo démontrant l’exécution locale de l’IA de Google sur la console hybride de Nintendo. Un exercice de style purement technique qui montre la souplesse des petits modèles de langage, même lorsqu’ils sont confrontés à une puce mobile dont l’architecture accuse plusieurs années d’ancienneté.

Un modèle quantifié tournant uniquement sur le processeur

Pour réaliser ce portage, l’environnement logiciel de la console a d’abord été modifié. La Switch tourne ici sous L4T Ubuntu, une déclinaison de Linux spécifiquement adaptée à la machine de Nintendo. L’exécution du modèle repose ensuite sur une version compilée de llama.cpp, un moteur très populaire pour faire fonctionner des modèles de langage localement avec des ressources limitées.

Gemma 4 running locally on a Nintendo Switch :)

1.5 tokens per second haha, but it runs!@googlegemma @googleaidevs @GoogleDeepMind pic.twitter.com/XzDSzxMPfx
— Maddie D. Reese (@maddiedreese) April 8, 2026

Sans surprise, il n’était pas question de lancer les versions les plus lourdes de la famille Google. Le choix s’est arrêté sur Gemma 4 E2B, le plus petit modèle de la gamme. Pour contourner la faible quantité de mémoire vive de la console, le fichier a subi une quantification IQ2_M, réduisant artificiellement son poids. Selon Maddie D. Reese, le processus s’effectue uniquement sur le processeur (CPU) de la machine, sans aucune accélération de la puce graphique. Evidemment, la vitesse d’affichage du texte reste assez lente, la puce Tegra X1 de la Nintendo Switch a tout de même fêté son dixième anniversaire l’année dernière.

Tous nos bons plans directement sur WhatsApp. Rejoignez Frandroid Bons Plans, zéro spam garanti.