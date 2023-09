Amazon Alexa va devenir bien plus intelligent et interagir avec des discussions bien plus naturelles et fluides tout en exécutant des tâches toujours plus complexes. Dans l'idée, c'est comme si vous parliez avec ChatGPT.

Un assistant plus intelligent que jamais qui permet, en quelque sorte, de discuter à l’oral avec ChatGPT. Voici un raccourci un peu grossier, certes, mais décrivant assez bien ce que va devenir Amazon Alexa sur les enceintes connectées. C’est en tout cas l’avenir vers lequel on se dirige si l’on en croit la présentation pleine de promesses faite par David Limp, vice-président chez Amazon et chargé des produits et services de l’entreprise.

Le dirigeant a en effet évoqué un nouveau grand modèle de langage — large language model (LLM) en anglais — sur lequel l’assistant vocal Alexa allait désormais s’appuyer. Un LLM « spécifiquement optimisé pour la voix ». Ainsi, non seulement vous aurez affaire à un assistant vocal plus intelligent, mais ce dernier paraîtra aussi beaucoup plus naturel, presque humain, dans la manière de s’exprimer et d’interagir avec vous.

Dans la vidéo de démonstration ci-dessous, on voit même que l’on peut interrompre l’IA et que cela ne la perturbe pas pour continuer à comprendre la conversation et la poursuivre fluidement.

Selon Amazon, vous allez ainsi pouvoir faire des conversations plus longues (avec des phrases plus longues) et demander des tâches relativement complexes semblables à celles que vous pouvez déjà faire avec de puissants agents conversationnels comme ChatGPT ou Google Bard.

« Alexa, let’s chat » : une discussion plus naturelle

Une autre vidéo de démonstration illustre assez bien les futures capacités d’Amazon Alexa. Dans un des passages, on y voit une femme apostrophait l’assistant vocal en disant « Alexa, let’s chat ». Cela pourrait se traduire par « Alexa, discutons » (mais dans un ton un peu plus décontracté). La personne demande ensuite à l’intelligence artificielle d’imaginer un message d’invitation pour participer à un dîner centré autour d’une thématique d’enquête policière et précise, avec un phrasé assez naturel, qu’elle souhaite un texte assez mystérieux.

Alexa s’exécute et récite le premier jet qu’il a préparé. Cela convient à la dame qui enchaîne direct en demandant de l’envoyer sur son téléphone. Sans transition, elle continue de s’adresser à son assistant vocal en lui demandant de baisser les rideaux des fenêtres du salon. Enfin, la conversation se termine avec l’humain qui demande à Alexa de lui citer un morceau de jazz connu. L’IA répond et la femme réagit en disant simplement : « cool, joue ça ».

Cette démonstration s’inscrit dans une vidéo évidemment promotionnelle, sans aléas. Au crédit d’Amazon, notons tout de même que nos collègues de Numerama saluent une démonstration sur scène encore plus impressionnante, « avec une vraie conversation digne de deux humains ». Pour y arriver, Amazon affirme notamment avoir longuement étudier toutes les subtilités d’une discussion à l’oral.

Dans toute conversation, nous traitons des tonnes d’informations supplémentaires, telles que le langage corporel, la connaissance de la personne avec laquelle vous parlez et le contact visuel. Pour permettre cela avec Alexa, nous avons fusionné les données des capteurs d’un Echo — la caméra, les données vocales, sa capacité à détecter la présence — avec des modèles d’IA capables de comprendre ces signaux non verbaux. Nous nous sommes également attachés à réduire la latence afin que les conversations se déroulent naturellement, sans pause, et que les réponses soient d’une longueur adaptée à la voix, et non l’équivalent d’un paragraphe lu à haute voix.

Les capacités débloquées par le nouveau grand modèle de langage seront disponibles à partir de 2024. Aux États-Unis, certains utilisateurs pourront avoir la chance de le découvrir en preview. En France, il faudra sans doute attendre un peu avant de voir le nouveau LLM maîtriser la langue officielle de l’Hexagone.

