Mistral Medium 3.5 : la start-up française dégaine un modèle 128B open source à moitié prix de Claude, mais 2 points derrière

Mistral sort Medium 3.5, un modèle 128 milliards de paramètres open source à 1,50 dollar le million de tokens entrants. C’est moins cher que Claude Sonnet 4.6, c’est aussi un peu moins bon.

Mistral, vous utilisez sans doute Le Chat. Un « ChatGPT » classique. Mais Mistral, ce n’est pas simplement ça. Ils ont aussi un « Claude Code ». Justement, Mistral vient de proposer une autre option française, ouverte, deux fois moins chère. Reste à voir si elle tient debout face à la concurrence.

Mistral Medium 3.5, donc. C’est un modèle dense de 128 milliards de paramètres, fenêtre de contexte de 256 000 jetons, publié fin avril 2026 sous licence MIT modifiée.

Il fusionne dans un seul jeu de poids ce que la maison vendait jusqu’ici en trois produits distincts : Medium pour le chat, Magistral pour le raisonnement, Devstral pour le code. Sur SWE-Bench Verified, le test de référence qui demande à une IA de réparer de vrais bugs sur GitHub, il atteint 77,6 %.

Côté tarifs, l’API affiche 1,50 $ par million de jetons entrants et 7,50 $ en sortie. Concrètement, c’est moitié prix de Claude Sonnet 4.6, qui plafonne à 3 $ et 15 $. Et il tourne en local sur quatre GPU, ce qui change beaucoup de choses pour les entreprises qui veulent garder leurs données chez elles.

Un agent qui code pendant qu’on prend le café

La vraie nouveauté n’est pas le modèle. C’est ce qu’il permet de faire.

Mistral lance Vibe, ses « agents distants » : on lui colle une tâche, il l’exécute dans le cloud, en parallèle, sans qu’on reste planté devant l’écran à valider chaque ligne. Refactor d’un module, génération de tests, mise à jour de dépendances, investigation d’un bug de CI : l’agent ouvre une pull request sur GitHub quand c’est fini, et on relit le résultat plutôt que les frappes au clavier.

Lien YouTube S’abonner à Frandroid

Le Chat hérite par ailleurs d’un « Work mode » qui fait la même chose pour les tâches non techniques : trier la boîte d’e-maisl, préparer une réunion, croiser plusieurs outils. C’est exactement la stratégie qu’Anthropic déroule depuis un an avec Claude Code. Mistral arrive avec deux trains de retard, mais avec un ticket européen.

Face à Claude Sonnet 4.6 (79,6 % sur SWE-Bench Verified, à 3 $/15 $), Medium 3.5 perd deux points et gagne 50 % sur la facture.

Face aux modèles chinois ouverts comme Qwen 3.5 ou DeepSeek V4, le différentiel de prix est moins flatteur, mais la question de la souveraineté change la donne pour beaucoup d’acheteurs publics et industriels européens.

Mistral n’a pas publié ses scores sur MMLU, GPQA ou les benchmarks de raisonnement général, ce qui est un signal en soi. On sait ce qu’il fait bien (le code, les agents). On sait moins ce qu’il vaut sur le reste.

Mistral n’est pas devenu le meilleur modèle du monde, et ne le sera probablement jamais à ce rythme. Mais l’entreprise a enfin compris que son créneau, c’est l’ouverture combinée à la souveraineté, pas la course aux benchmarks contre des géants qui ont cent fois ses moyens. Reste à savoir si l’Europe, qui adore parler de souveraineté numérique, aura le courage de la payer.

Si vous voulez recevoir les meilleures actus Frandroid sur WhatsApp, rejoignez cette discussion.