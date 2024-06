Alors qu'OpenAI indique que la fonction Advanced Voice de GPT-4o n'arrivera pas avant plusieurs mois, certains utilisateurs disent y avoir accès quand même. De quoi découvrir concrètement à quoi ressemble cette nouvelle version de l'assistant vocal.

En mai dernier, OpenAI présentait le mode Advanced Voice, une fonction de ChatGPT qui permet de discuter de manière transparente avec le chatbot, façon assistant vocal. Une annonce qui s’est accompagnée de GPT-4o, un LLM multimodal plus puissant que GPT-4. OpenAI indiquait que cela n’allait pas arriver très prochainement : il va falloir attendre. Pourtant, plusieurs utilisateurs y ont quand même accès, comme l’a rapporté Tom’s Guide.

Une fonction de ChatGPT à laquelle personne n’aurait dû avoir accès

L’un des exemples d’utilisateurs, c’est un certain RozziTheCreator, qui, sur Reddit, a partagé l’enregistrement d’une conversation avec ChatGPT. On entend une nouvelle voix qui n’est actuellement pas disponible et qu’on n’avait jamais entendue. Une voix qui raconte une histoire d’horreur, ajoutant des effets sonores inquiétants. Comme l’a raconté cet internaute, il n’y a accès que quelques minutes, et l’outil rencontrait un certain nombre de problèmes techniques.

Interrogée par Tom’s Guide, OpenAI a indiqué qu’il s’agissait effectivement d’une erreur, corrigée depuis, qui a fait que certains utilisateurs ont eu accès à la version vocale de GTP-4o. Une erreur plutôt bonne pour nous, moins pour OpenAI : c’est la première fois qu’on découvre ce mode Advanced Voice non contrôlé directement par OpenAI. Jusqu’à présent, nous n’avons eu droit qu’à des démonstrations, sous le contrôle de son développeur. Ce que montre la vidéo de RozziTheCreator, c’est une IA qui parle de manière assez naturelle, et qui ajoute des effets sonores : cela n’avait jamais été vu auparavant.

Le mode Advanced Voice avec GPT-4o prend du retard

C’est en effet dans une publication sur X qu’OpenAI s’est exprimée sur ses avancées avec le mode vocal de ChatGPT sous GPT-4o. L’entreprise a rappelé qu’elle avait prévu de commencer à déployer cette fonction dans une première version auprès de certains utilisateurs de ChatGPT Plus. Cependant, tout n’est pas prêt : « nous améliorons la capacité du modèle à détecter et refuser certains contenus. Nous travaillons également à l’amélioration de l’expérience utilisateur et à la préparation de notre infrastructure ». C’est pourquoi le lancement est retardé d’un mois.

Il y a du retard donc, ce qui fait que tous les utilisateurs de ChatGPT Plus auront accès à l’Advanced Voice à l’automne : « les délais exacts dépendent du respect de nos normes élevées de sécurité et de fiabilité. »

