Historique : ce procès va déterminer l’avenir de ChatGPT et l’IA générative

 

Le New York Times poursuit Microsoft et OpenAI en justice. Le média accuse ChatGPT de plagiat. L'IA se serait servie et nourrie des textes du New York Times pour devenir aussi intelligente, et serait capable de plagier le média américain. Derrière ce contentieux, c'est la question de l'avenir de l'IA générative qui se pose.

Le New York Times // Source : Photo de Stéphan Valentin sur Unsplash

C’est peut-être le procès du siècle qui vient de poindre à l’horizon. Alors que ChatGPT et l’IA générative ont le vent en poupe dans toute l’industrie de la tech, le média historique New York Times a annoncé poursuivre en justice Microsoft et OpenAI pour défendre sa propriété intellectuelle.

De quoi se plaint le New York Times ?

Le New York Times explique qu’il remplit une mission « vitale pour notre démocratie » depuis plus de 170 ans en menant des enquêtes et des reportages de fond. Une mission qui demande un investissement important et dont l’IA se servirait sans verser un sou. Le journal reproche à OpenAI et Microsoft de faire un usage illégal de cette masse de travail pour alimenter leurs LLM, et plus précisément que ChatGPT et Bing Chat (Microsoft Copilot désormais) peuvent profiter gratuitement de ce travail massif journalistique.

Pour défendre son cas, le média va donc se reposer sur la très stricte législation concernant le copyright, la propriété intellectuelle, aux États-Unis, qui est notamment protégée par la constitution du pays.

Au-delà du plagiat pur et simple du New York Times, le média met aussi en avant la qualité de son écriture. En effet, il estime que les articles publiés dans ses colonnes ont un poids très fort dans l’apprentissage des LLM car il s’agit d’un texte riche, c’est-à-dire écrit et corrigé de façon professionnelle par des humains avec un travail de recherche et de sources. Le New York Times mentionne, en exemple, qu’il se classe à la 42e position dans l’algorithme de Google comme l’un des sites web les plus importants au monde, derrière des sites de réseaux sociaux dont les écrits seraient moins intéressants pour l’IA.

Le New York Times entend enfin démontrer la masse d’argent générée par OpenAI et Microsoft sur le sujet. En particulier concernant le premier, souvent présenté comme une société à but non lucratif. À travers ses levées de fonds et son abonnement ChatGPT+, OpenAI est devenue l’une des entreprises les plus en vue de la tech. Pour le New York Times, ce sont des milliards de dollars de valeur complètement indue pour la start-up.

L’IA ne peut plus éviter la question du copyright

La question du copyright a déjà fait la une des médias depuis plusieurs mois quand il s’agit de l’IA générative. Pour devenir aussi intelligentes, les LLM comme GPT utilisé par ChatGPT, ou le LLM de Midjourney, ont avalé une quantité massive de données sur le web, sans jamais en demander l’autorisation.

Malgré des garde-fous timides mis en place, les outils issus de ces LLM peuvent sans problème procéder à du plagiat. C’est d’autant plus visible sur la génération d’images avec Midjourney ou Dall-E où l’on peut imiter de très près le style d’un artiste, et même reproduire certaines œuvres comme Mona Lisa.

ChatGPT peut copier un extrait d’article normalement bloqué derrière un paywall

L’exploitation de données à des fins lucratives par l’IA a déjà donné lieu à un mouvement de grèves des acteurs et actrices du cinéma et du jeu vidéo cette année.

Un procès déterminant

Le procès lancé par le New York Times face à Microsoft et OpenAI devrait donc être déterminant pour l’avenir de tout le secteur de l’IA. Il va décider de l’avenir de la capacité des LLM à pouvoir s’alimenter et la façon dont les entreprises qui les développent devront montrer patte blanche et rémunérer les ayants droit.

Le moins que l’on puisse dire, c’est que le dossier du New York Times semble solide. En plus de sa plainte très détaillée sur 69 pages, le média propose des centaines de milliers de documents pour prouver ce qu’il avance. On y retrouve notamment de nombreux articles publiés dans le New York Times et dont ChatGPT serait capable de donner des lignes sans sourciller.

Le média estime que les dommages et intérêts s’élèvent à plusieurs milliards de dollars. On comprend mieux pourquoi OpenAI chercherait à effectuer une levée de fonds de plusieurs milliards de dollars. Si elle a lieu, la société serait évaluée à 100 milliards de dollars.


Si vous voulez recevoir les meilleures actus Frandroid sur WhatsApp, rejoignez cette discussion.