Le géant chinois Alibaba a développé une intelligence artificielle capable de passer des appels tout en imitant de manière très convaincante le langage naturel des êtres humains. Selon le MIT Technology Review, cet assistant est plus abouti que la solution similaire Google Duplex.

Alibaba est l’une des plus grosses entreprises chinoises. À tel point que son PDG et créateur, Jack Ma, est devenu une figure emblématique dans le monde de l’entrepreneuriat ainsi que dans la sphère si particulière des milliardaires. En France, d’aucuns ont déjà acheté des produits sur la plateforme d’e-commerce du groupe : Aliexpress.com.

Ainsi, à l’instar des grandes entreprises américaines du domaine de la Tech, Alibaba multiplie lui aussi les investissements en R&D dans différents secteurs et notamment celui de l’intelligence artificielle. Et les prouesses semblent être au rendez-vous à en croire un article publié sur le site Technology Review du MIT. Au point où le magazine affirme sans ciller que l’assistant vocal développé par Alibaba est plus abouti que celui de Google.

Alibaba vs Google

Pour bien comprendre cette analyse, il est bon de rappeler que Google a présenté cette année Google Duplex, une intelligence artificielle propulsée par Google Assistant capable de passer des appels à la place de l’utilisateur.

Déjà déployé sur certains smartphones aux États-Unis, Google Duplex est capable de réserver une table à un restaurant en discutant de manière très naturelle avec son interlocuteur. L’assistant est notamment capable de reproduire les hésitations dans le ton de la voix pour imiter au mieux la manière dont parlent les humains et ainsi un peu faire oublier qu’il s’agit d’un robot.

De son côté, Alibaba a fait la démonstration de sa solution lors de la conférence Neural Information Processing Systems 2018 qui réunit plusieurs spécialistes du secteur. La firme utilise déjà son assistant pour gérer le service client téléphonique de l’entreprise de logistique Cainiao (qui appartient au groupe Alibaba) et affirme que ce dernier répond déjà aux requêtes de près d’un million d’utilisateurs chaque jour.

Lors de la conférence, les chercheurs d’Alibaba ont ainsi diffusé un bout de conversation entre l’IA et un client. Le passage a été traduit du mandarin par MIT Technology Review :

– Assistant : Bonjour, je suis l’assistant vocal de Cainiao. Je suis —

– Client : Bonjour.

– A : Oui, bonjour, vous avez un colis prévu pour une livraison dans la matinée au 588 Culture West Road. Cela vous convient-il pour la réception ?

– C : Qui êtes-vous ?

– A : Je suis l’assistant vocal de Cainiao. J’aimerais confirmer votre livraison matinale au 588 Culture West Road. Est-ce bon pour vous ?

– C : Je ne suis pas à la maison le matin.

– A : Dans ce cas, avez-vous une autre adresse que vous aimeriez utiliser ?

3 nuances piégeuses

Comme le précise MIT Technology Review, l’assistant vocal a su gérer trois subtilités du langage qui sont tout à fait naturelles pour les humains, mais facilement piégeuses pour les intelligences artificielles. En effet, en 30 secondes, il a su gérer une interruption, une conversation non linéaire ainsi qu’une requête implicite.

L’interruption est sans doute le cas le plus simple à gérer. L’assistant doit juste comprendre qu’il n’a pas à répéter bêtement son discours d’introduction. La non-linéarité de la conversation, elle, intervient au moment où le client demande qui est son interlocuteur. Il ne répond ainsi pas à la question qui vient de lui être posée. L’IA réagit très bien en déclinant une nouvelle fois son identité avant de revenir au sujet initial. Elle ne perd ainsi pas le fil de la conversation.

Enfin, la requête implicite survient à la fin de l’exemple, quand le client affirme qu’il ne sera pas disponible le matin. L’assistant montre ici qu’il est assez intelligent pour comprendre ce que ce cela insinue et enchaîne directement en demandant quelle alternative conviendrait le mieux.

Éthique

Au vu de cette démonstration, il semblerait que la solution d’Alibaba soit un tantinet plus avancée que Google Duplex qui est déjà très impressionnant. Notez que l’IA n’essaie pas de mentir à son interlocuteur en lui faisant croire qu’il parle à un être humain. L’idée est plus de fournir une conversation agréable au client, pas de le duper. Google avait promis lui aussi que sa technologie resterait éthique à ce niveau-là.