Les assistants personnels vocaux sont désormais un élément stratégique des écosystèmes mobiles, avec Siri pour iOS, Google Now pour Android et Cortana pour Windows. Une étude a été réalisée dans plusieurs langues avec un protocole de test assez simple qui permet d’évaluer la performance des assistants vocaux.

Siri-Google-Now-Cortana

Dans ces technologies de paroles, on retrouve deux technologies : l’ASR (Automatic Speech Recognition pour Reconnaissance automatique de la parole) pour reconnaître la parole et le TTS (Text To Speech) pour synthétiser la parole. Ces deux technologies sont essentielles pour la communication homme-machine, et sont complexes : elles doivent reconnaître n’importe quelle voix dans des conditions acoustiques variables et souvent bruyantes, et bien sûr les spécificités de chaque langue avec des nuances du vocabulaire et des longueurs des phrases différentes. Hé oui, le langage naturel n’a pas de règles syntaxiques strictes et sans ambiguïté, le contexte et l’intonation donnent du sens à nos phrases.

Capture d’écran 2015-02-09 à 11.43.56

Le média VentureBeat a réalisé un test assez simple : 18 questions en 5 langues différents : anglais, italien, français, allemand et mandarin. En anglais, les résultats sont bons avec les trois assistants. En français et dans les autres langues, Siri surclasse nettement Google Now et Cortana.

Capture d’écran 2015-02-09 à 11.46.57

Quant au mandarin, Google a encore de gros efforts à financer pour améliorer la reconnaissance vocale. Pour rappel, Google propose plus de 50 langues et dialectes, dépassant de loin la fois Siri ou Cortana.

Capture d’écran 2015-02-09 à 11.47.23