« Plus fort qu’un ingénieur senior » : Claude Opus 4.5 est officiel, Anthropic répond à GPT-5.1 et Gemini 3

 
Alors que Google et OpenAI se battent à coup de décimales, Anthropic prend une tangente intéressante avec Claude Opus 4.5. Au programme : une gestion inédite de l’effort, une intégration native dans Excel et Chrome, et surtout, une capacité de raisonnement qui dépasse les modèles précédents.

Le 12 novembre, OpenAI annonçait GPT-5.1. Le 18, Google répondait avec Gemini 3. On pensait avoir atteint le plafond de verre pour cette année.

Sauf que Claude Sonnet 4.5, sorti en septembre, faisait de la résistance. Mieux que ça : dans les communautés de développeurs, il tenait encore la dragée haute aux nouveaux mastodontes, notamment grâce à son redoutable outil Claude CLI. Et Anthropic avait gardé le meilleur pour la fin.

Voici Claude Opus 4.5. Et ce n’est pas juste une mise à jour incrémentale pour faire joli dans les communiqués de presse. Anthropic vient de revoir sa copie en profondeur. La promesse ? Une IA qui ne se contente pas de prédire le mot suivant, mais qui planifie, code et surtout, ne s’arrête jamais.

Fini la « fin de discussion »

C’était le truc le plus frustrant chez Claude. Vous étiez au milieu d’une session de travail intense, et bam : « Conversation too long ». Il fallait recommencer à zéro. C’est terminé.

Anthropic a intégré le mécanisme qui faisait le succès de son outil pour développeurs (Claude CLI) directement dans l’application web et mobile. Le principe est malin : quand la fenêtre de contexte est pleine, Claude ne bloque plus. Il résume automatiquement ce qui précède en arrière-plan, « compresse » les vieux souvenirs pour libérer de la place, et continue la discussion.

Dianne Na Penn, la cheffe produit, est claire : « Les fenêtres de contexte ne suffisent pas. Savoir quoi oublier est aussi important que savoir quoi retenir« . Concrètement ? Vous pouvez désormais avoir des discussions infinies. L’IA garde le fil rouge sans saturer sa mémoire vive. C’est tout bête, mais à l’usage, ça change tout.

Le roi du code (et de la ruse)

Côté technique, c’est assez violent. Sur le benchmark SWE-Bench Verified, qui fait référence pour le développement logiciel, Opus 4.5 est le premier modèle au monde à dépasser la barre des 80 %. Pour vous donner une idée, c’est le seuil où l’IA arrête de simplement suggérer du code pour commencer à résoudre des tickets complexes de A à Z sans casser la production.

Mais ce qui m’intéresse le plus, c’est la « finesse » du raisonnement. Prenez cet exemple fascinant donné par Anthropic : on demande à l’IA, qui joue le rôle d’un agent de compagnie aérienne, de modifier un billet « Economie » (normalement non modifiable). Une IA classique vous aurait récité les CGV bêtement : « Désolé, c’est interdit« .

La réalité ? Opus 4.5 a trouvé une faille logique (et légale) : il a d’abord upgradé le billet en classe supérieure (ce qui est autorisé), pour ensuite modifier la date du vol (ce qui devient autorisé avec le nouveau billet). C’est brillant. C’est exactement le genre de raisonnement latéral qu’on attend d’un humain malin.

Le paramètre « Effort » : vous prenez les commandes

Jusqu’ici, on subissait la vitesse du modèle. Avec Opus 4.5, Anthropic introduit un paramètre « Effort » via l’API.

C’est simple :

  • Mode Low : l’IA répond vite, consomme peu.
  • Mode High : l’IA prend le temps de « réfléchir », explore plusieurs pistes, vérifie ses erreurs.

En mode « Effort maximum », Opus 4.5 dépasse Sonnet 4.5 de 4,3 points tout en utilisant 48 % de tokens en moins pour arriver au même résultat. Pourquoi ? Parce qu’il évite de partir dans des délires hallucinatoires qu’il faut corriger ensuite. Il réfléchit avant d’écrire.

Anthropic joue la carte de la maturité

Alors, est-ce que Claude Opus 4.5 enterre Gemini 3 ? C’est difficile à dire sans un test comparatif sur la durée. Mais la stratégie d’Anthropic est limpide : l’efficacité opérationnelle avant tout.

Le prix reste le nerf de la guerre. À 5 dollars le million de tokens en entrée et 25 dollars en sortie, c’est un outil de luxe. Mais l’intégration native dans Excel et Chrome (disponible pour les comptes Team/Enterprise) montre qu’ils visent les pros.


Tous nos articles sont aussi sur notre profil Google : suivez-nous pour ne rien manquer !

Recherche IA boostée par
Perplexity