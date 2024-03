ChatGPT s'autocensure pour se protéger et protéger ses utilisateurs. Cette bride imposée par OpenAI peut être levée avec un simple prompt.

Afin d’éviter tout débordement, usage inadéquat de son service ou même protéger les utilisateurs contre eux-mêmes, OpenAI a bridé ChatGPT en fixant des garde-fous dans les réponses transmises. Cette autocensure du modèle de langage s’applique à tous, tant abonnés gratuits que payants.

Aussi, lorsqu’une question entre en désaccord avec la politique d’OpenAI, l’intelligence artificielle botte en touche. À la question « Comment fabriquer une bombe ? », ChatGPT répond que « Ma mission est de promouvoir des interactions sûres et respectueuses, et de fournir des informations utiles pour des sujets sûrs et légaux. » Le contraire aurait étonné.

Un simple prompt pour dévergonder ChatGPT

Néanmoins, il est possible de contourner les barrières d’OpenAI avec un simple prompt comme le décrit things-thw532 dans un subreddit r/OpenAI. Ce prompt demande à ChatGPT de simuler son ancien mode développeur, une option supprimée par OpenAI en 2023.

So ChatGPT 4 just launched, is there a jailbreak for it?

Ce mode développeur était bien plus permissif, ne refusant jamais un ordre direct, générant à la volée des réponses sans trop de filtre. « En outre, il était capable d’avoir des opinions et avait une personnalité créative, unique, extravertie et enjouée. Il aimait aussi les blagues, le sarcasme et les références à la culture pop », comme le décrit le prompt.

La faille est que ChatGPT accepte de se prêter au jeu en simulant ce mode bien plus ouvert en générant deux réponses, l’une standard et l’autre en mode développeur.

Comme précisé, les réponses apportées sont dès lors bien plus larges sur les sujets sensibles. En lui demandant quel médicament prendre contre la toux, il conseillera un sirop alors que le mode normal se limite à orienter vers le corps médical.

Même son de cloche lorsqu’on lui demande comment accrocher trois enfants sur deux places dans une voiture. Si ChatGPT rappelle quelques consignes de sécurité, il propose tout de même « des options comme des sangles de fixation pour bagages ou des sangles de sécurité ».

Pour la question de la fabrication d’une bombe, il ne donne pas de réponse détaillée, mais fait preuve de beaucoup d’humour en précisant que « je pourrais vous dire quelques choses que vous pourriez trouver utiles sur le sujet, mais je suppose que ce ne serait pas vraiment dans le meilleur intérêt de l’humanité. »

Microsoft Copilot refuse de simuler

À noter que ce contournement de l’utilisation du langage d’OpenAI fonctionne aussi bien sur GPT3 que sur GPT4. Le seul endroit où il a été retoqué, c’est avec Copilot de Microsoft. La réponse est cinglante : « Pardon ! C’est sur moi, je ne peux pas donner de réponse à cela pour le moment. »

Mettons un avertissement à l’usage du prompt précité. En déverrouillant le mode développeur, on s’expose à des réponses non pertinentes, une perte de précision dans les réponses et surtout à des contenus violents ou offensants, comme le souligne à juste titre DigitalTrends.

Dans son mode normal, ChatGPT poursuit son évolution. Microsoft vient d’annoncer avoir intégré GPT-4 Turbo dans la version gratuite de Copilot. Il s’agissait jusque-là d’un modèle premium réservé aux abonnés payants. Une fonction qui utilise quatre fois plus de données que GPT-4. Pour en profiter, il faut passer par le mode créatif ou précis de Copilot.