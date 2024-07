« Alexa, dis bonjour à ton nouveau concurrent. ». L’assistant vocal de ChatGPT vient d’être lancé par OpenAI, ce qui promet des conversations plus naturelles.

L’intelligence artificielle franchit une nouvelle étape dans son évolution avec le lancement de l’assistant vocal ChatGPT par OpenAI. Cette nouvelle fonction avait été annoncée lors de l’arrivée de GPT-4o, elle permet de transformer nos interactions avec l’IA grâce à une latence très faible.

Une sortie progressive et contrôlée

Après un léger retard dû à des préoccupations de sécurité, OpenAI a commencé à déployer l’assistant vocal pour ChatGPT. Mais attention, ne vous attendez pas à pouvoir discuter avec ChatGPT dès demain matin en prenant votre café. Pour l’instant, seul un groupe restreint d’utilisateurs privilégiés, abonnés au service ChatGPT Plus, ont la chance de tester cette nouvelle fonctionnalité.

Ce lancement en douceur n’est pas un hasard. OpenAI joue la carte de la prudence, l’entreprise américaine préfère une approche progressive pour peaufiner son assistant vocal avant un déploiement à grande échelle. C’est ce qu’on appelle une phase « alpha », un terrain d’essai grandeur nature qui permettra à l’entreprise de collecter des données précieuses sur l’utilisation réelle de l’assistant.

Les heureux élus recevront une notification par email et dans l’application mobile ChatGPT. Ils auront alors accès à quatre voix prédéfinies pour leur assistant. Et non, aucune ne ressemble à celle de Scarlett Johansson, désolé pour les fans de « Her » !

Les promesses d’une IA plus humaine

Mais que peut-on attendre exactement de cet assistant vocal ? OpenAI promet des conversations plus naturelles et en temps réel, avec une latence minimale. En d’autres termes, vous pourrez parler à ChatGPT comme vous parleriez à un ami, sans ces temps de latence gênants qui rappellent que vous discutez avec une machine.

L’un des aspects les plus intéressants est la possibilité d’interrompre l’IA à tout moment. Fini le temps où vous deviez attendre patiemment que l’assistant finisse sa tirade avant de pouvoir placer un mot.

Les défis de l’IA vocale

La sécurité et l’éthique sont au cœur des préoccupations d’OpenAI dans le développement de cet assistant vocal. C’est d’ailleurs ce qui a causé le retard initial dans le lancement. L’entreprise a pris un mois supplémentaire pour s’assurer que son assistant vocal répondait à des « normes élevées de sécurité et de fiabilité ».

L’une des mesures prises concerne la protection contre le clonage vocal. Les quatre voix prédéfinies sont les seules que l’assistant peut utiliser, et des systèmes ont été mis en place pour bloquer toute tentative de sortie vocale différente. C’est une précaution importante à l’ère des deepfakes vocaux et des arnaques téléphoniques sophistiquées.

De plus, OpenAI a intégré des mesures de sécurité pour empêcher l’assistant de répondre à des demandes de contenu violent ou protégé par le droit d’auteur. C’est un pas dans la bonne direction, mais on peut se demander comment ces systèmes réagiront face à des requêtes plus subtiles ou ambiguës.

OpenAI est loin d’être le seul acteur à s’engouffrer dans la conception d’un assistant vocal intelligent à faible latence, une startup française a tout juste lancé Moshi.

