
À trop faire confiance à son agent IA autonome, on peut s’en mordre les doigts. Une leçon qu’a apprise à la dure Summer Yue, la responsable de sécurité et de l’alignement IA chez Meta. Dans un post sur X (Twitter), la directrice explique comment OpenClaw, l’agent IA autonome capable d’effectuer des tâches, a subi un bug conduisant à la suppression de l’ensemble de sa boîte mail.
Un agent qui prend la confiance
C’est un test qui a mal tourné, indique Yue. La responsable a demandé dans un premier temps à OpenClaw de gérer sa messagerie secondaire avec une instruction simple : « Vérifie cette boîte de réception et suggère ce que tu archiverais ou supprimerais. N’agis pas avant que je te le dise. » Des tests sur plusieurs semaines qui se sont avérés suffisamment concluant pour qu’elle demande à l’agent IA de gérer sa boîte mail principale.
Selon l’intéressée, celle-ci était malheureusement trop volumineuse et aurait entraîné un bug chez l’IA. Les instructions d’origine données à l’agent auraient été effacées. OpenClaw a alors « décidé » que sa tâche consistait à supprimer les mails de la boîte de réception.
Une « erreur » de débutant
Face à la situation, Yue s’est retrouvée démunie : « Je ne pouvais pas l’arrêter depuis mon téléphone. J’ai dû courir jusqu’à mon Mac mini comme si je désamorçais une bombe ». Dans des captures d’écrans partagées sur X, on peut voir l’agent IA ne pas répondre aux multiples commandes envoyées par la directrice l’obligeant à aller sur son Mac Mini pour arrêter directement le processus. Une situation de désobéissance que reconnaîtra le LLM après coup, en « s’excusant » même s’il ne la justifie pas.
Pour Summer Yue, il s’agit là d’une « erreur de débutant ». Une erreur loin d’être rassurante d’un point de vue sécurité des données. La vigilance reste donc de mise lorsque l’on a affaire à des agents IA. D’autant plus dans un contexte où certaines entreprises, comme Microsoft, souhaiteraient en faire le mode de communication principal pour Windows.
Utilisez-vous Google News (Actualités en France) ? Vous pouvez suivre vos médias favoris. Suivez Frandroid sur Google News (et Numerama).

Ce contenu est bloqué car vous n'avez pas accepté les cookies et autres traceurs. Ce contenu est fourni par Disqus.
Pour pouvoir le visualiser, vous devez accepter l'usage étant opéré par Disqus avec vos données qui pourront être utilisées pour les finalités suivantes : vous permettre de visualiser et de partager des contenus avec des médias sociaux, favoriser le développement et l'amélioration des produits d'Humanoid et de ses partenaires, vous afficher des publicités personnalisées par rapport à votre profil et activité, vous définir un profil publicitaire personnalisé, mesurer la performance des publicités et du contenu de ce site et mesurer l'audience de ce site (en savoir plus)
En cliquant sur « J’accepte tout », vous consentez aux finalités susmentionnées pour l’ensemble des cookies et autres traceurs déposés par Humanoid et .
Vous gardez la possibilité de retirer votre consentement à tout moment. Pour plus d’informations, nous vous invitons à prendre connaissance de notre Politique cookies.