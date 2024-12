Alors que Google venait à peine d’annoncer son modèle Gemini 2.0 Flash Thinking, OpenAI riposte avec O3, un système d’IA capable de raisonner de manière plus approfondie que jamais.

La bataille fait rage dans le monde de l’intelligence artificielle. Tout juste 24 heures après l’annonce par Google de son modèle Gemini 2.0 Flash Thinking, OpenAI contre-attaque avec o3, un nouveau LLM.

Qu’est-ce que OpenAI o2 ?

Le successeur d’o1 (OpenAI a évité la dénomination o2 pour éviter tout conflit avec l’opérateur télécom britannique) affiche des performances impressionnantes.

Selon OpenAI, o3 serait trois fois plus performant que son prédécesseur sur les tests ARC-AGI, une référence conçue pour évaluer la capacité d’un modèle d’IA à raisonner sur des problèmes mathématiques et logiques particulièrement complexes.



Ce qui distingue véritablement o3, c’est sa capacité à « ruminer » sur un problème avant de fournir une réponse. Contrairement aux modèles traditionnels qui répondent de manière quasi instantanée, o3 prend le temps d’analyser en profondeur les questions qui lui sont posées, particulièrement celles nécessitant un raisonnement logique étape par étape.

Résultats OpenAI o3 sur les benchmarks ARC-AGI

Et contrairement à o1, o3 permet de choisir entre trois niveaux de temps de réflexion : faible, moyen et élevé. Comme vous pouvez l’imaginer, à faible niveau, les tâches s’exécutent plus rapidement, mais peuvent être sujettes à des inexactitudes, tandis qu’à niveau élevé, c’est l’inverse : plus lentes, mais plus précises.

Sam Altman, PDG d’OpenAI, explique : « Nous considérons cela comme le début de la prochaine phase de l’IA, où ces modèles pourront effectuer des tâches de plus en plus complexes nécessitant un raisonnement approfondi« . Une déclaration qui prend tout son sens quand on examine les performances du modèle en matière de programmation et de résolution de problèmes scientifiques avancés.

L’alignement délibératif, kézako ?

OpenAI a également annoncé une technologie de sécurité : l’alignement délibératif.

Cette approche consiste à entraîner le modèle avec des limitations de sécurité précises, ce qui lui permet d’analyser la nature des requêtes et ses propres réponses pour détecter d’éventuelles violations de ses garde-fous. L’idée est de rendre le modèle plus résistant aux tentatives de détournement.

o3, c’est pour quand ?

Pour l’instant, o3 n’est pas accessible. OpenAI prévoit de mettre en place un système de demandes pour permettre à des testeurs externes d’utiliser le nouveau modèle.

