
OpenAI vient de sortir du silence avec le lancement de GPT-5.4. Ce n’est pas juste une itération de plus, c’est une réorganisation de leur catalogue.
Le modèle se décline désormais en trois versions : une version standard, une version Pro taillée pour la performance, et une version Thinking spécialisée dans le raisonnement complexe.


Le Plaud Note Pro enregistre vos réunions, les transcrit et les synthétise pour vous. Il suffit d’appuyer sur un bouton. Déjà plus d’un million d’utilisateurs !
OpenAI veut transformer son IA de conversation en un véritable outil de production. L’éditeur de ChatGPT annonce ainsi des gains d’efficacité impressionnants, en affirmant que GPT-5.4 résout les mêmes problèmes que ses prédécesseurs avec nettement moins de tokens.
La grande nouveauté technique, c’est l’explosion de la fenêtre de contexte. On passe à 1 million de tokens sur l’API (soit environ 750 000 mots).
Des performances records selon OpenAI
Sur le terrain des benchmarks, GPT-5.4 a bien sûr des arguments. Le modèle a décroché un score de 83 % au test GDPval d’OpenAI, qui mesure l’aptitude aux tâches intellectuelles complexes. Mieux encore, il domine le classement APEX-Agents de Mercor, conçu pour évaluer les compétences en droit et en finance.

Côté fiabilité, OpenAI s’attaque au grand mal de l’IA : les hallucinations. Les erreurs factuelles sur des affirmations isolées chutent de 33 % par rapport à GPT-5.2. Sur l’ensemble d’une réponse, la probabilité d’erreur baisse de 18 %. On n’est pas encore sur du zéro défaut, mais la tendance est encourageante pour ceux qui exigent de la précision.
Tool Search et sécurité
Pour les développeurs, le changement le plus malin s’appelle Tool Search. Jusqu’ici, quand on connectait une IA à des outils externes (recherche web, calculatrice, bases de données), il fallait lui « expliquer » le fonctionnement de tous les outils à chaque requête. Résultat ? Une consommation de tokens délirante. Désormais, le modèle va chercher la définition de l’outil uniquement quand il en a besoin.
Enfin, OpenAI a planché sur la sécurité de la version Thinking. Le risque avec les modèles qui « réfléchissent » (le fameux Chain-of-Thought), c’est qu’ils puissent apprendre à cacher leur raisonnement réel pour tromper l’utilisateur. Les nouveaux tests d’évaluation montrent que GPT-5.4 est incapable de dissimuler sa logique interne. En clair, on peut encore surveiller ce qu’il se passe dans sa « tête » numérique.
Si vous voulez recevoir les meilleures actus Frandroid sur WhatsApp, rejoignez cette discussion.


Ce contenu est bloqué car vous n'avez pas accepté les cookies et autres traceurs. Ce contenu est fourni par Disqus.
Pour pouvoir le visualiser, vous devez accepter l'usage étant opéré par Disqus avec vos données qui pourront être utilisées pour les finalités suivantes : vous permettre de visualiser et de partager des contenus avec des médias sociaux, favoriser le développement et l'amélioration des produits d'Humanoid et de ses partenaires, vous afficher des publicités personnalisées par rapport à votre profil et activité, vous définir un profil publicitaire personnalisé, mesurer la performance des publicités et du contenu de ce site et mesurer l'audience de ce site (en savoir plus)
En cliquant sur « J’accepte tout », vous consentez aux finalités susmentionnées pour l’ensemble des cookies et autres traceurs déposés par Humanoid et .
Vous gardez la possibilité de retirer votre consentement à tout moment. Pour plus d’informations, nous vous invitons à prendre connaissance de notre Politique cookies.