Après avoir massivement utilisé du contenu, souvent protégé, sur Internet pour parfaire l’apprentissage de son IA, OpenAI semble prendre une nouvelle direction et signe des accords avec des éditeurs pour utiliser légalement leurs données.
Rentrer dans le rang
En 2024, OpenAI avait déclaré à The Guardian qu’il était impossible de développer une IA aujourd’hui sans voler des données et sans enfreindre le droit d’auteur, en raison de la vaste étendue des contenus protégés.
On apprend, via The Wired, que l’entreprise change aujourd’hui son fusil d’épaule et souhaite avoir une utilisation plus respectueuse. De nombreux médias utilisent un fichier nommé robots.txt permettant de filtrer l’utilisation des robots qu’utilisent des IA pour récupérer leurs données.
En France, OpenAI a signé un accord avec Le Monde, et ne semble pas avoir signé d’autres accords.
La startup de détection d’IA, Originality AI, a réalisé une étude sur près de 1000 médias pour observer le niveau de blocage du robot de ChatGPT. Après un taux de blocage avoisinant un tiers des sites en novembre 2023, ce taux bascule à un quart. Pour les médias les plus importants, ce taux s’élevait à 90 % et descend aujourd’hui à un peu plus de 50 %.
Pour aller plus loin
« C’est vraiment pénible de bloquer ces entreprises » : le PDG de Reddit pousse un coup de gueule contre l’IA
Une stratégie de réglementation
On apprend qu’OpenAI a conclu des accords avec 12 éditeurs qui ont mis à jour leurs robots pour permettre à ChatGPT d’accéder à leurs données. « Il est clair qu’OpenAI considère le blocage comme une menace pour ses ambitions futures », déclare Jon Gillham, PDG d’Originality AI.
Certaines entreprises pourraient choisir la technique du blocage en première instance, selon Gilham pour forcer OpenAI à négocier une utilisation plus respectueuse de leurs données. Face à la lenteur que peuvent avoir les institutions à réglementer le sujet, la stratégie semble payer.
Des invités passionnants et des sujets palpitants ! Notre émission UNLOCK est à retrouver un jeudi sur deux en direct, de 17 à 19h sur Twitch. Pensez aussi aux rediffusions sur YouTube !
Ce contenu est bloqué car vous n'avez pas accepté les cookies et autres traceurs. Ce contenu est fourni par Disqus.
Pour pouvoir le visualiser, vous devez accepter l'usage étant opéré par Disqus avec vos données qui pourront être utilisées pour les finalités suivantes : vous permettre de visualiser et de partager des contenus avec des médias sociaux, favoriser le développement et l'amélioration des produits d'Humanoid et de ses partenaires, vous afficher des publicités personnalisées par rapport à votre profil et activité, vous définir un profil publicitaire personnalisé, mesurer la performance des publicités et du contenu de ce site et mesurer l'audience de ce site (en savoir plus)
En cliquant sur « J’accepte tout », vous consentez aux finalités susmentionnées pour l’ensemble des cookies et autres traceurs déposés par Humanoid et ses partenaires.
Vous gardez la possibilité de retirer votre consentement à tout moment. Pour plus d’informations, nous vous invitons à prendre connaissance de notre Politique cookies.
Gérer mes choix