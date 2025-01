À peine une semaine après le lancement du modèle d’IA « raisonnant » R1 par DeepSeek, Hugging Face se lance dans un projet ambitieux : créer une version entièrement ouverte de cette technologie. Une initiative baptisée Open-R1, qui vise à démocratiser l’accès aux outils derrière ce modèle prometteur, tout en questionnant les pratiques de transparence dans l’IA.

Porté par Leandro von Werra, responsable de la recherche chez Hugging Face, et une équipe d’ingénieurs, le projet Open-R1 ambitionne de reconstruire le modèle R1 de DeepSeek de A à Z, en rendant publics tous ses composants, y compris les données d’entraînement. Si DeepSeek propose une licence permissive pour R1, permettant son utilisation sans restriction majeure, l’entreprise chinoise garde secret certains éléments clés, comme les outils de développement ou les jeux de données. Une approche « boîte noire » qui complique la reproduction et l’amélioration du modèle, selon les chercheurs d’Hugging Face.

Présenté comme surpassant les performances du modèle o1 d’OpenAI dans des domaines comme les sciences ou les mathématiques, R1 se distingue par sa capacité à s’auto-vérifier, réduisant les erreurs classiques des IA. Son succès rapide, notamment via une application gratuite en tête des téléchargements sur l’App Store ,a relancé les débats sur la compétition technologique entre la Chine et les États-Unis. Mais pour Hugging Face, l’urgence est ailleurs : il s’agit avant tout de « désopacifier » le processus de création d’IA.

« Sans accès aux données d’entraînement ou au code, il est impossible d’étudier en profondeur les biais ou d’adapter le modèle à des contextes sensibles », explique Elie Bakouch, ingénieur chez Hugging Face. C’est là tout l’enjeu d’Open-R1 : permettre à la communauté scientifique de comprendre, et de contrôler, les mécanismes derrière ces IA.

Pour y parvenir, l’équipe s’appuie sur le Science Cluster de Hugging Face, un serveur équipé de 768 GPU Nvidia H100, et sollicite l’aide de contributeurs externes via GitHub. Le projet, déjà suivi par 10 000 utilisateurs sur la plateforme, mise sur une collaboration massive pour reproduire les algorithmes et jeux de données de R1 en quelques semaines.

Si le pari est réussi, Open-R1 pourrait servir de base à une nouvelle génération de modèles open source, combinant performance et transparence. « L’innovation ouverte profite à tous, y compris aux grands laboratoires », rappelle Bakouch, convaincu que ce partage accélérera les avancées dans le domaine.