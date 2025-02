Considéré par certains comme le modèle d’IA à « raisonnement hybride » le plus avancé à ce jour, Claude 3.7 a bénéficié d’un entraînement surprenant basé sur Pokémon rouge.

Les intelligences artificielles continuent de s’améliorer et basculent peu à peu à système de raisonnement « hybride ». Ce système permet à une IA de choisir le temps de réflexion qu’elle va consacrer pour répondre à une requête alternant entre un mode rapide et un mode lent. Au coeur de la nouvelle version de l’IA Claude avec son modèle 3.7, on apprend via TechCrunch que pour l’entraîner la société Anthropic a notamment utilisé l’une des premières versions de Pokémon.

Dans son blog, on apprend qu’Anthropic a mis à l’essai la capacité de raisonnement hybride de Claude sur Pokémon rouge en fournissant à l’IA une mémoire de base et la capacité à pouvoir jouer au jeu en continu.

La nouvelle version de Claude est capable d’obtenir trois badges d’arènes Pokémon // Source : Anthropic

La nouvelle version de Claude surpasse ses prédécesseurs en ayant défait trois boss d’arènes et en ayant obtenu leurs badges, le tout en réalisant 35 000 actions. S’il est dommage de ne pas savoir le temps réel que cette opération a pris, on note toutefois une évolution flagrante comparé à la première version de Claude qui , elle, n’a a priori pas dépassé le début du jeu.

Si la forme est triviale, ces tests montrent que certaines IA sont aujourd’hui capable de changer de stratégie pour réaliser une tâche complexe quitte à prendre plus de temps. Un raisonnement appliqué par de nombreuses entreprises comme DeepSeek et son modèle R1 ou encore OpenAI qui semble suivre la même trajectoire que Claude pour son ChatGPT-5.