
Reddit pousse un nouveau coup de gueule contre les IA. Après s’être publiquement offusquée des pratiques de scrapping de Microsoft, l’entreprise s’attaque aujourd’hui à Perplexity. Selon Neowin, la plateforme communautaire intente une action en justice contre Perplexity ainsi que trois autres entreprises pour scraping de données.
Pour aller plus loin
Intelligence artificielle : cette start-up aspire tellement de données que les sites doivent réagir
Une pratique « à échelle industrielle »
Pour Reddit, Oxylabs UAB, AWMProxy et SerpApi ont collaboré avec Perplexity pour créer du scraping « à échelle industrielle ». Elle appuie son propos en indiquant dans sa plainte avoir tendu un piège dans lequel les comparses sont tombés. Elles contourneraient sciemment le fichier Robots.txt devant leur indiquer quelles pages peuvent être annexées ou non. Une pratique digne d’un « hacker nord-coréen », selon Reddit. La plateforme va plus loin encore en indiquant que le LLM n’a « rien de révolutionnaire ».
En d’autres termes, le modèle économique de Perplexity consiste à récupérer le contenu Reddit des résultats de recherche Google, à l’intégrer dans un LLM tiers et à le présenter comme un nouveau produit.
Extrait de la plainte de Reddit contre Perplexity
Une pratique familière
Cette pratique semble profondément ancrée dans l’ADN de Perplexity. En août dernier, Cloudfare pointait déjà du doigt la plateforme et sa capacité à voler des données. Perplexity avait alors qualité l’étude de « baratin commercial ». Neowin, de son côté, rappelle également qu’en 2024 s’était déjà engagée auprès de Reddit à respecter le fameux fichier Robots.txt suite à une mise en demeure.
Le passage devant le tribunal suffira peut-être à réfréner une pratique commune chez les LLM. Pour Reddit, l’enjeu derrière cette plainte est de faire cesser cette pratique et récupérer tous les « gains mal acquis » par cette dernière.
Pour aller plus loin
OpenAI (ChatGPT) admet qu’il faut voler du contenu pour créer une IA
Si vous voulez recevoir les meilleures actus Frandroid sur WhatsApp, rejoignez cette discussion.

Ce contenu est bloqué car vous n'avez pas accepté les cookies et autres traceurs. Ce contenu est fourni par Disqus.
Pour pouvoir le visualiser, vous devez accepter l'usage étant opéré par Disqus avec vos données qui pourront être utilisées pour les finalités suivantes : vous permettre de visualiser et de partager des contenus avec des médias sociaux, favoriser le développement et l'amélioration des produits d'Humanoid et de ses partenaires, vous afficher des publicités personnalisées par rapport à votre profil et activité, vous définir un profil publicitaire personnalisé, mesurer la performance des publicités et du contenu de ce site et mesurer l'audience de ce site (en savoir plus)
En cliquant sur « J’accepte tout », vous consentez aux finalités susmentionnées pour l’ensemble des cookies et autres traceurs déposés par Humanoid et ses partenaires.
Vous gardez la possibilité de retirer votre consentement à tout moment. Pour plus d’informations, nous vous invitons à prendre connaissance de notre Politique cookies.
Gérer mes choix