Pourquoi Reddit veut bloquer ce site essentiel à Internet

 
La plateforme communautaire a décidé de bloquer l’archivage de ses pages par l’Internet Archive. Une mesure restrictive pensée pour empêcher le vol de ses données par les IA.

Reddit poursuit sa croisade contre le vol de données causé par l’intelligence artificielle. Plus tôt dans l’année, la plateforme a poussé un coup de gueule contre les robots de Microsoft, Anthropic ou encore Perplexity accusés d’agir comme si « tout sur Internet était gratuit pour eux », volant sans consentement leurs données. Une situation qui pousse aujourd’hui Reddit à franchir une nouvelle ligne pour protéger ses données.

Des vols repérés

Selon The Verge, Reddit a détecté que certaines entreprises IA utiliseraient les données présentes dans la Wayback Machine d’Internet Archive pour alimenter leurs LLM. Pour faire face à ces nouveaux vols, la plateforme a décidé d’empêcher Internet Archive d’indexer une grande partie du contenu sur Reddit. Désormais, la plateforme ne pourra avoir accès qu’à la page d’accueil du site avec les titres et les articles les plus populaires, mais plus leurs contenus ni leurs commentaires.

Un archivage compliqué

Informé de la situation en amont du blocage, Mark Graham, directeur de la Wayback Machine, a déclaré à The Verge avoir « avoir des discussions continues sur cette question ». Se présentant comme « la bibliothèque d’Alexandrie » du web, la mission de l’Internet Archive va se compliquer. Privés de l’accès à cette plateforme qui fait aujourd’hui office de véritable mine de savoirs pour de nombreux utilisateurs qui la préfère à Google, certaines de ses informations pourraient disparaître sans cet archivage.

Pour aller plus loin
L’Internet Archive, véritable « mémoire du web », victime d’une cyberattaque d’ampleur


Le saviez-vous ? Google News vous permet de choisir vos médias. Ne passez pas à côté de Frandroid et Numerama.