Un collier IA pour « traduire » votre chien à 94,6 % ? Ce qu’en dit la science

Doctor Dolittle, vraiment ?

 
Une startup chinoise vend un collier connecté censé transformer les aboiements et les miaulements en phrases françaises. Le tout avec 94,6 % de précision annoncée, et zéro étude pour le prouver.

PettiChat tient en 27 grammes et se clipse sur n’importe quel collier. Le boîtier capte le son, l’envoie à une application maison, et recrache 1,2 seconde plus tard une phrase censée traduire ce que pense votre chien ou votre chat. Sur le papier, on tient enfin le Doctor Dolittle de poche. En vidéo, ça ressemble surtout à un doublage très bien synchronisé.

Derrière l’objet, une jeune entreprise installée à Hangzhou (avec un siège administratif à Hong Kong), un million de dollars levés en seed auprès d’investisseurs liés à l’université du Zhejiang, et un argumentaire calibré pour Kickstarter. Le tarif super early bird s’affiche à 119 dollars (un peu plus de 100 euros), l’édition limitée hors campagne grimpe à 189,99 dollars.

En Chine, le collier se négocie 799 yuans, environ 100 euros, et Dexerto rapporte déjà 10 000 précommandes, avec une IA qui s’appuierait sur Qwen, le grand modèle de langage d’Alibaba Cloud.

La marque revendique une exactitude contextuelle de 94,6 %, à partir d’un entraînement sur plus d’un million d’échantillons audio collectés auprès de plus de mille chiens et chats.

94,6 %, sur quelle base ?

C’est précisément là que la promesse s’effrite. Aucune étude indépendante, aucune méthodologie publiée, aucun comité de relecture pour valider le chiffre.

Côté recherche sérieuse, les travaux de l’université du Michigan publiés en 2024 montrent qu’un modèle dérivé de Wav2Vec2, l’architecture vocale conçue à l’origine pour la parole humaine, plafonne autour de 70 % de précision pour classer des aboiements en grandes catégories. Pas pour produire des phrases articulées.

Comme souvent, c’est certainement des mises en scène, avec une voix synthétique trop bien calée sur l’aboiement pour ne pas avoir été ajoutée en post-production.

Reformulons : décoder l’humeur générale d’un animal, anxieux, joueur, en alerte, à partir d’une fréquence et d’un timbre, c’est plausible et plusieurs équipes universitaires le font déjà sans crier au miracle. Faire articuler à Médor « j’ai vu un livreur, j’aimerais bien lui aboyer dessus », c’est de la science-fiction. Les chiens n’ont ni phonèmes discrets ni grammaire : leurs vocalisations dépendent du contexte, de la race, du vécu individuel.

Un modèle de langage peut générer une phrase plausible à partir d’un son, mais « plausible » n’est pas « exact ».

Et puis honnêtement, s’il fonctionnait vraiment, on découvrirait probablement que nos animaux nous jugent en silence depuis 15 000 ans.


Retrouvez un résumé du meilleur de l’actu tech tous les matins sur WhatsApp, c’est notre nouveau canal de discussion Frandroid que vous pouvez rejoindre dès maintenant !

Recherche IA boostée par
Perplexity