ChatGPT : deux nouvelles fonctionnalités qui métamorphosent l’expérience du chatbot

Il voit, il écoute et il parle

 

Quand on est en tête, il est facile de se faire dépasser, car on n'a pas la visibilité sur ceux qui nous suivent et leur rythme. OpenAI prend pourtant une longueur d'avance avec les dernières fonctionnalités ajoutées à son chatbot phare, ChatGPT. Jusqu'à présent, la plupart des assistants conversationnels ont été principalement limités au texte, mais OpenAI va intégrer la voix et l'image à son IA conversationnelle. Vous pourrez désormais avoir une conversation vocale avec ChatGPT, lui montrer des objets ou des images et même obtenir des conseils en temps réel pour cuisiner ou aider votre enfant avec ses devoirs.

Source : Zac Wolff sur Unsplash

Imaginons que vous soyez chez vous en fin de journée, perplexe devant votre réfrigérateur ouvert. Vous vous demandez ce que vous pourriez bien cuisiner avec les ingrédients disponibles. Au lieu de chercher des recettes en ligne en espérant qu’elles correspondent à ce que vous avez, vous pouvez simplement prendre une photo de l’intérieur de votre réfrigérateur et une autre de votre garde-manger, puis les envoyer à ChatGPT.

Cette mise à niveau vient après d’autres nouveautés, notamment le lancement de Dall-E 3 et son intégration avec ChatGPT. Le chatbot pourra maintenant voir, entendre, et parler, une première dans le monde des IA conversationnelles. Le but est simple : rendre l’interface utilisateur aussi intuitive que possible, vous permettant de communiquer avec la machine de la manière la plus naturelle.

Des conversations vocales

L’une des améliorations majeures de cette mise à jour est l’introduction des conversations vocales. OpenAI a rendu cette fonctionnalité facilement accessible depuis les paramètres de l’application mobile, où les utilisateurs pourront choisir parmi cinq voix différentes. On ne sait pas si la langue française sera prise en compte au début. Une fois que c’est fait, tout ce que vous avez à faire est d’appuyer sur le bouton du casque situé dans le coin supérieur droit de l’écran d’accueil pour engager une conversation vocale.

Ce pas en avant n’est pas seulement une prouesse technologique, il a aussi un impact pratique. Vous pouvez parler avec ChatGPT lors de vos déplacements, demander une histoire au coucher pour votre enfant, ou même régler un débat à table. OpenAI promet une voix qui sonne étonnamment réaliste. Pour cela, le spécialiste de l’IA a travaillé avec des acteurs vocaux pour créer ces voix, afin de prévenir les abus potentiels que pourraient engendrer des voix synthétiques trop convaincantes.

L’interaction avec des photos et des images

Si les conversations vocales étaient la seule mise à jour, ce serait déjà impressionnant. Mais OpenAI ne s’arrête pas là. Désormais, ChatGPT pourra aussi interagir avec des images. Imaginez que vous êtes à la maison et vous vous demandez ce que vous pouvez cuisiner pour le dîner. Vous pouvez simplement prendre des photos de votre réfrigérateur et de votre garde-manger, et demander des suggestions de recettes à ChatGPT.

Le modèle, capable de « voir » les images que vous avez envoyées, identifie les ingrédients disponibles et vous propose une ou plusieurs recettes que vous pourriez réaliser avec ceux-ci. Par exemple, si ChatGPT identifie des œufs, du fromage et des légumes, il pourrait vous suggérer une omelette aux légumes et au fromage. Et si vous avez des questions de suivi, comme la meilleure manière de battre les œufs ou le temps de cuisson optimal, le chatbot peut vous fournir des instructions étape par étape, rendant le processus de préparation du dîner plus fluide et intuitif.

Cette capacité à interagir avec les contenus multimédias ouvre une myriade de possibilités, surtout dans le secteur de l’éducation. Vous pouvez aider votre enfant à résoudre un problème de mathématiques en prenant une photo du problème, l’encercler, et demander des indices à ChatGPT.

Bref, OpenAI ne se repose pas sur ses lauriers. Avec ces améliorations, l’entreprise américaine cherche à conserver son avance. Les utilisateurs Plus et Enterprise auront un premier aperçu de ces nouvelles fonctionnalités dans les prochaines semaines, et d’autres groupes d’utilisateurs, y compris les développeurs, suivront peu après. Au-delà des aspects techniques, ces nouvelles fonctionnalités visent à créer une expérience utilisateur plus riche et plus intuitive, rapprochant ainsi l’intelligence artificielle d’une interaction humaine véritable.


Le saviez-vous ? Google News vous permet de choisir vos médias. Ne passez pas à côté de Frandroid et Numerama.

Les derniers articles