OpenAI sort un nouveau modèle de ChatGPT « ouvert » : qu’est-ce que ça veut dire exactement ?

 
Alors que le monde de l’IA attend impatiemment la sortie de ChatGPT, la firme de Sam Altman a d’abord annoncé la sortie de gpt-oss, un modèle de langage « ouvert » que tout le monde ou presque peut utiliser.
Source : Unsplash / Frandroid

Vous aimeriez utiliser ChatGPT, mais n’avez pas envie de donner toutes vos données à OpenAI ou de faire tourner à plein tube les serveurs de l’entreprise ? Bonne nouvelle, le géant de l’IA vient de rendre disponibles deux nouveaux modèles de langage, gpt-oss-20b et gt-oss-120b, qui peuvent être utilisés librement par tous et toutes et tourner en local sur une machine (à condition qu’elle soit assez puissante).

Comme l’explique Wired, cette stratégie de publier des modèles « ouverts » est un retour aux sources pour OpenAI qui n’avait pas publié de tels bouts de code depuis GPT-2 en 2019.

C’est quoi un modèle ouvert ?

Sur le papier, gpt-oss-20b promet des performances similaires à celle du modèle o3-mini, tandis que le modèle 120b affirme titiller la version o4-Mini de ChatGPT. Le premier (doté de 20 milliards de paramètres, d’où son nom) peut tourner sur n’importe quel PC doté de plus de 16 Go de RAM, tandis que le second (qui pointe à 120 milliards de paramètres) demandera une carte graphique digne de ce nom. Les deux modèles sont vendus comme capables de « raisonner » en détaillant leur « flot de pensée ». Ils peuvent générer du texte, des images, naviguer sur le web ou prendre le contrôle de votre ordinateur.

Mais si, sur le papier, ces nouveautés font parler d’elle, c’est parce qu’OpenAI a publié une partie de leurs codes sous licence libre. Plus exactement, c’est le « poids » de certaines données qui est rendu public ici. Derrière ce nom obscur se cache une espèce de carte qui liste les connexions faites par l’IA (et leur importance) pour arriver à générer certains contenus. En connaissant le poids d’un modèle, il est facile de comprendre ses sujets de prédilection, sa manière de connecter les sujets, etc. Un peu comme l’intensité des connexions neuronales dans un cerveau humain.

Sam Altman, patron d’OpenAI // Source : OpenAI

En levant un peu le rideau sur le fonctionnement de ces modèles, OpenAI donne à voir la manière dont ils fonctionnent, permettant à celles et ceux qui veulent intégrer un chatbot à leur produit d’avoir plus de transparence sur la manière dont ce dernier va agir. Les deux versions de gpt-oss sont aussi publiées sous licence libre, permettant de les réutiliser à loisir dans n’importe quel projet.

C’est comme l’open source ?

Malgré le nom qui peut porter à confusion (puisque le qualificatif « oss » signifie « open-source software »), ces modèles de langage ne sont pas à proprement parler open source. Certes, l’accès au poids des paramètres permet d’en comprendre leur fonctionnement, mais les données utilisées durant la phase d’entraînement ainsi que le code qui a été généré pour les créer ne sont pas disponibles.

Pour aller plus loin
ChatGPT GPT-5 : Microsoft confirme par erreur la grande nouveauté

Ainsi, il n’est pas possible de modifier les biais d’entraînement ou la manière dont les connexions sont faites, mais juste de voir le résultat. Pour reprendre une analogie populaire dans le monde de l’open source, un modèle ouvert équivaut à donner les ingrédients d’un gâteau tandis qu’un modèle open source livre toute la recette.


Si vous voulez recevoir les meilleures actus Frandroid sur WhatsApp, rejoignez cette discussion.