Pourquoi Reddit porte plainte contre cette entreprise IA ?

 
Reddit se lance dans une bataille judiciaire contre Perplexity. Le forum en ligne accuse l’entreprise IA de récupérer illégalement ses données.

Reddit pousse un nouveau coup de gueule contre les IA. Après s’être publiquement offusquée des pratiques de scrapping de Microsoft, l’entreprise s’attaque aujourd’hui à Perplexity. Selon Neowin, la plateforme communautaire intente une action en justice contre Perplexity ainsi que trois autres entreprises pour scraping de données.

Pour aller plus loin
Intelligence artificielle : cette start-up aspire tellement de données que les sites doivent réagir

Une pratique « à échelle industrielle »

Pour Reddit, Oxylabs UAB, AWMProxy et SerpApi ont collaboré avec Perplexity pour créer du scraping « à échelle industrielle ». Elle appuie son propos en indiquant dans sa plainte avoir tendu un piège dans lequel les comparses sont tombés. Elles contourneraient sciemment le fichier Robots.txt devant leur indiquer quelles pages peuvent être annexées ou non. Une pratique digne d’un « hacker nord-coréen », selon Reddit. La plateforme va plus loin encore en indiquant que le LLM n’a « rien de révolutionnaire ».

En d’autres termes, le modèle économique de Perplexity consiste à récupérer le contenu Reddit des résultats de recherche Google, à l’intégrer dans un LLM tiers et à le présenter comme un nouveau produit. 

Extrait de la plainte de Reddit contre Perplexity

Une pratique familière

Cette pratique semble profondément ancrée dans l’ADN de Perplexity. En août dernier, Cloudfare pointait déjà du doigt la plateforme et sa capacité à voler des données. Perplexity avait alors qualité l’étude de « baratin commercial ». Neowin, de son côté, rappelle également qu’en 2024 s’était déjà engagée auprès de Reddit à respecter le fameux fichier Robots.txt suite à une mise en demeure.

Le passage devant le tribunal suffira peut-être à réfréner une pratique commune chez les LLM. Pour Reddit, l’enjeu derrière cette plainte est de faire cesser cette pratique et récupérer tous les « gains mal acquis » par cette dernière.

Pour aller plus loin
OpenAI (ChatGPT) admet qu’il faut voler du contenu pour créer une IA


Si vous voulez recevoir les meilleures actus Frandroid sur WhatsApp, rejoignez cette discussion.

Recherche IA boostée par
Perplexity