Les créateurs de Claude lâchent leurs chiffres internes et appellent à freiner l’IA : « on n’a pas beaucoup de temps »

L'IA qui se construit

 
Anthropic publie ses chiffres internes : plus de 80 % de son propre code est désormais écrit par son IA Claude. Et au lieu de s’en vanter, l’entreprise demande au monde la possibilité d’appuyer sur le frein, citant des dangers potentiels pour l’humanité.
Anthropic Claude

« Je ne peux pas m’empêcher de penser que rien de ce que je fais n’a d’importance. » Chez Anthropic, le vertige gagne les ingénieurs. Avec un modèle désormais capable d’optimiser du code 52 fois plus vite qu’un humain et de gérer des chantiers de 12 heures en totale autonomie, la start-up californienne voit ses créateurs devenir de simples relecteurs.

Le 4 juin 2026, Anthropic a mis en ligne un rapport au titre limpide : « When AI builds itself », l’IA qui se construit elle-même.

Le document, signé par Marina Favaro et Jack Clark, livre une donnée qu’on n’avait jamais vue de l’intérieur d’un grand laboratoire : plus de 80 % du code fusionné dans la base d’Anthropic est aujourd’hui écrit par Claude, son propre modèle. La même boîte qui annonce ce chiffre demande, dans la foulée, qu’on envisage de ralentir collectivement la course à l’IA.

C’est le genre de paradoxe qui mérite qu’on s’arrête. Anthropic vend Claude, vient de boucler une levée de fonds de 65 milliards de dollars qui la valorise autour de 965 milliards de dollars (environ 890 milliards d’euros), et passe son temps à expliquer que sa technologie pourrait devenir incontrôlable. Difficile de faire plus contre-intuitif comme argumentaire commercial.

Le chiffre qui fait peur : 80 % du code écrit par l’IA

Reprenons le chemin parcouru. Avant le lancement de Claude Code, l’agent de programmation maison, en février 2025, Claude écrivait quelques pour cent du code interne, à peine. Seize mois plus tard, on est passé à 80 %. Concrètement, beaucoup d’ingénieurs d’Anthropic ne tapent plus de code depuis des mois : ils dirigent et relisent ce que produit la machine.

Côté productivité, l’entreprise affirme qu’un ingénieur type fusionne huit fois plus de code par trimestre qu’en 2024. À prendre avec des pincettes, et Anthropic le reconnaît elle-même : le nombre de lignes mesure la quantité, pas la qualité, et ce « 8× » surestime presque sûrement le vrai gain.

Evolution du code rédigé par les ingénieurs Anthropic grâce à l’IA

Un sondage interne de mars 2026 auprès de 130 personnes des équipes de recherche donne un chiffre plus sobre : environ quatre fois plus de production ressentie grâce à l’IA. C’est déjà énorme.

Le plus parlant, c’est la durée des tâches. Anthropic s’appuie sur les mesures de METR, un organisme d’évaluation indépendant, qui suit la longueur de tâche qu’un modèle peut mener seul sans dérailler. En mars 2024, Claude Opus 3 gérait des tâches d’environ quatre minutes pour un humain.

Un an plus tard, Sonnet 3.7 tenait une heure et demie. Encore un an, et Opus 4.6 traite des chantiers de douze heures. Ce temps double désormais tous les quatre mois environ, contre tous les sept mois auparavant. En clair : on passe de la commission à confier des projets de plusieurs jours.

Le test le plus spectaculaire reste celui de l’optimisation. À chaque sortie de modèle, Anthropic donne le même exercice : voici un bout de code qui entraîne un petit modèle, rends-le plus rapide sans changer le résultat. En mai 2025, Opus 4 obtenait un gain de vitesse d’environ 3×. En avril 2026, le modèle interne baptisé Mythos Preview atteignait 52×.

Pour situer : un humain compétent met quatre à huit heures pour arriver à 4×. C’est exactement ce type de bond qui a permis à Claude Mythos de trouver 271 vulnérabilités dans Firefox en quelques jours.

Le taux de succession du code généré par Claude

Ce qu’il faut en retenir : les courbes ne montent pas en ligne droite, elles s’accélèrent. Et un humain qui plafonne à 4× sur l’optimisation se fait distancer d’un facteur dix en un an.

Ce que l’IA ne sait toujours pas faire (pour l’instant)

Avant de paniquer, une nuance essentielle : Anthropic insiste pour dire qu’on n’y est pas. Le terme central du rapport, c’est l’auto-amélioration récursive, ce moment théorique où une IA conçoit elle-même un successeur plus capable, qui conçoit à son tour le suivant, et ainsi de suite. L’entreprise est claire : ce stade n’est pas atteint, et il « n’est pas inévitable ». Mais il pourrait arriver plus tôt que les institutions ne sont prêtes à l’encaisser.

Là où l’humain garde l’avantage, c’est sur le jugement : choisir quels problèmes méritent qu’on s’y attaque, quels résultats croire, quand un chemin est une impasse. Anthropic a mesuré ce point sur de vraies sessions de recherche où un chercheur avait pris une mauvaise direction.

Les cas où l’IA a pris une meilleure décision qu’un ingénieur Anthropic

Montré le contexte avant le faux pas, Mythos Preview proposait une meilleure étape suivante 64 % du temps, contre 51 % pour Opus 4.5 six mois plus tôt. L’écart se resserre, vite. Et l’entreprise prévient que la relecture humaine devient le goulot d’étranglement : si la machine écrit tout, c’est l’humain qui valide qui ralentit la cadence.

Le rapport ne cache pas non plus le malaise des ingénieurs. Un témoignage cité décrit le vertige des jours où tout fonctionne et où l’on se demande à quoi l’on sert encore, face à un système plus rapide et meilleur. Cette ambivalence, on la retrouve chez les bidouilleurs qui laissent un agent IA bosser à leur place et découvrent qu’ils ne savent plus toujours ce que la machine a fait.

Pourquoi Anthropic demande un frein (et pourquoi ça grince)

La proposition concrète : la possibilité d’un ralentissement coordonné à l’échelle mondiale, pour laisser les structures de société et la recherche sur l’alignement rattraper la technologie. Attention, ce n’est pas un arrêt unilatéral. Anthropic précise qu’un tel frein n’aurait de sens que si plusieurs laboratoires de premier plan, dans plusieurs pays, s’arrêtaient ensemble sous des règles vérifiables par des tiers. Sur la BBC, Jack Clark a résumé : « On veut avoir l’option de lever le pied et de mettre le pied sur le frein. » Il estime qu’une IA capable d’auto-amélioration récursive est « possible d’ici deux ans » et qu’il faut agir vite avant que cela n’arrive : « on n’a pas beaucoup de temps« .

Le rapport ne se limite pas au risque technique abstrait. Il évoque des usages détournés très concrets : surveillance autoritaire de populations entières, opérations d’influence taillées sur mesure pour chaque individu et déployées à une échelle qu’aucune équipe humaine ne pourrait atteindre. Anthropic note aussi un point gênant pour qui rêve de traités : un entraînement de modèle est bien plus facile à cacher qu’un silo à missiles. La vérification, donc, serait le nerf de la guerre.

Tout le monde n’achète pas le récit. Plusieurs analystes y voient surtout du marketing stratégique. Selon SiliconANGLE, un analyste juge que les gains de productivité sont sans doute réels, mais que mettre en avant ses propres progrès vers l’auto-amélioration sert surtout l’image d’Anthropic.

Le timing alimente le soupçon : l’entreprise a déposé une demande confidentielle d’introduction en Bourse une semaine avant la publication. Demander à ralentir quand on est en tête, certains y voient une façon élégante de demander aux autres de patienter.

Côté politique, l’idée part avec un handicap. À Washington, l’argument dominant reste qu’un ralentissement reviendrait à offrir un avantage stratégique à la Chine. Un décret signé cette semaine ouvre des revues de sécurité de 30 jours, mais les tests demeurent volontaires, et aucun grand acteur ne s’est engagé à freiner. Pendant ce temps, le matériel suit : Nvidia vient de présenter un superordinateur d’IA pour la maison capable de faire tourner des modèles colossaux sur un bureau.

Pour le grand public, ce rapport vaut surtout comme signal : quand un laboratoire qui a tout intérêt à vanter ses modèles préfère agiter le drapeau rouge, ça mérite qu’on écoute, sans pour autant gober la posture vertueuse d’une entreprise en pleine opération financière.

En attendant, Anthropic continue de pousser ses propres modèles, dont le fameux Mythos jugé trop puissant pour sortir tel quel. Le pied reste posé sur l’accélérateur.


Retrouvez un résumé du meilleur de l’actu tech tous les matins sur WhatsApp, c’est notre nouveau canal de discussion Frandroid que vous pouvez rejoindre dès maintenant !

Recherche IA boostée par
Perplexity