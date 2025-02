Des chercheurs de l’université de Stanford et Washington ont réussi à imiter l’un des derniers modèles d’IA d’OpenAI pour une somme dérisoire.

La course à l’intelligence artificielle prend un nouveau tournant avec l’arrivée de modèles open source accessibles à faible coût. Récemment, des chercheurs ont par exemple pu reproduire une version de DeepSeek pour moins de 30 dollars. Aujourd’hui, des chercheurs des universités de Stanford et Washington qui franchissent une nouvelle étape en développant un modèle d’IA capable de raisonner à la manière de o1 de ChatGPT et R1 de DeepSeek pour moins de 50 dollars, rapporte TechCrunch.

Une méthode éprouvée et controversée

Pour réaliser cet exploit, les chercheurs ont utilisé un modèle open source prêt à l’emploi, qu’ils ont affiné grâce à un « processus de distillation ». Cette technique consiste à entraîner une IA en lui faisant apprendre à partir des réponses d’un autre modèle pour en extraire ses capacités de raisonnement. Une approche récemment mise en lumière par OpenAI qui accuse DeepSeek d’avoir utilisé ce procédé pour développer son intelligence artificielle.

Dans leur document de recherche, les chercheurs expliquent avoir entraîné leur modèle à l’aide d’un ensemble de 1 000 questions précises, associé à une méthode de distillation inspirée du mode de raisonnement utilisé par Google avec son IA Gemini.

Une méthode ingénieuse qui pourrait également être illégale indique TechCrunch. En effet, Google interdit dans ses conditions d’utilisation toute tentative de rétro-ingénierie de ses modèles à des fins de développement de services concurrents. Reste à savoir si, dans ce cadre académique, cette restriction reste applicable.

L’IA bientôt à la portée de tous

Ce modèle d’IA baptisé s1 a permis aux chercheurs de mettre en lumière plusieurs éléments de l’industrie. Tout d’abord, ils ont pu démontrer qu’il était aujourd’hui facile d’avoir accès à une IA performante à moindre coût pour tout un chacun. Ensuite, ils ont constaté que la distillation et l’ajout d’un délai avant qu’une IA ne donne une réponse permettent d’obtenir des résultats plus précis que les méthodes de renforcements utilisés jusqu’à présent. Toutefois, cette méthode ne permet pour l’instant que de dupliquer des modèles existants à moindre coût, sans en créer de nouveaux.

Pour les plus curieux, l’ensemble des tests réalisés pour créer cette IA est disponible sur GitHub. L’espace contient également les données et le code utilisé pour entraîner s1.