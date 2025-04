La course à l’intelligence artificielle fait rage et, dans cette épreuve, la maison mère de Facebook est accusée d’avoir triché pour dépasser ChatGPT, Gemini et consorts.

Crédit : Meta

Quand la concurrence est rude, un petit coup de pouce ne fait pas de mal. Alors que Meta vient de publier sa nouvelle génération de modèles d’intelligence artificielle durant le week-end, plusieurs spécialistes soupçonnent l’entreprise d’avoir gonflé artificiellement les capacités de ces machines pour qu’elles paraissent plus douées que celles d’OpenAI ou de Google.

D’après TechCrunch, sur un test spécifiquement dédié à mesurer l’efficacité des grands modèles de langage, Facebook a tenté d’obtenir le meilleur score en filoutant un petit peu.

Une IA taillée pour la compétition ?

Tout part du site LMArena qui est censé indiquer via des scores simples quelle est L’IA la plus « intelligente » sur le marché. Lors de la publication de ses nouveaux modèles d’IA il y a quelques jours, un a fait particulièrement les gros titres : Llama 4 Maverick. Semblant flotter largement au-dessus de la concurrence sur les tests de LMArena, l’IA tête de gondole de Meta redéfinissait plus ou moins les limites de ce qui est faisable sur un modèle d’IA, et le tout sur un produit open source utilisable par tous.

Sauf que… pas vraiment. Le modèle spécifiquement mis en ligne sur le site de comparaison est en fait différent de celui que Meta a rendu public. Sur LMArena, c’est une version « expérimentale » du chatbot qui a fait mordre la poussière à la concurrence, tandis que le modèle public était lui bien moins impressionnant dans ses réponses.

Le classement des derniers modèles d’IA selon Meta // Crédit : Meta

Certains spécialistes de l’industrie ont même soupçonné Meta d’avoir entraîné ce modèle expérimental sur des données spécifiquement taillées pour briller sur les critères de comparaison de LMArena. Un peu comme un élève qui apprendrait un cours par cœur sans rien y comprendre pour autant.

Du flou et un loup ?

Un porte-parole de Meta a nié avoir eu recours à ces méthodes pour gonfler le score de Llama 4 Maverick, expliquant simplement que tous les prestataires offrant un accès au nouveau modèle n’avaient pas encore fini de le paramétrer proprement, ce qui explique les différences de qualité.

Pour aller plus loin

Après Le Chat, ChatGPT, Claude, Grok… voici un nouveau chatbot IA gratuit sur WhatsApp, Facebook, Instagram et Messenger

Et concernant la différence entre le modèle public et le modèle mis en ligne sur LMArena, il s’agit moins d’une tromperie que d’une déclaration un peu trompeuse. Un graphique sur le site de Meta précise bien que le modèle soumis au test était « optimisé pour la conversation », mais le flou a tout de même été savamment entretenu par le fait même de mettre en ligne le même jour un modèle expérimental et un modèle public portant le même nom ou presque.