Appels, réduction de bruit, rendu sonore... les casques audio sans fil se préparent à un pas de géant

Le constructeur français Orosound travaille sur l’intégration de l’intelligence artificielle dans ses futurs casques pour leur permettre de mieux gérer les appels et la réduction de bruit ou d’adapter le rendu sonore à la musique écoutée.

Le casque Orosound Tilde Pro // Source : Orosound

Aujourd’hui, on parle de Web3, de blockchain, de NFT ou de métavers. Mais il y a quelques années encore, le buzzword à la mode était l’intelligence artificielle. Cela ne signifie pas pour autant que l’IA a disparu de l’univers des nouvelles technologies. Au contraire, elle s’est intégrée peu à peu dans l’ensemble des appareils plus ou moins discrètement. Aujourd’hui, la plupart des smartphones utilisent de l’IA pour générer des photos qui vous plairont en un coup d’œil. On retrouve bien évidemment de l’IA dans les assistants vocaux. Et même des produits aussi simples a priori que les casques audio ne sont pas épargnés.

Comment ? Des casques audio ont besoin de l’intelligence artificielle ? A priori ces deux univers semblent très éloignés. Il faut dire qu’un casque, c’est avant tout des transducteurs reliés à une source en analogique et qui vont simplement reproduire le son émis par cette source. Mais avec l’évolution du marché, poussée par les casques à réduction de bruit, les casques sans fil, les DAC intégrés directement aux casques, les constructeurs peuvent désormais intégrer directement une dose de machine learning à leurs appareils. C’est ce qu’a pu nous confier Eric Benhaim, cofondateur et CTO d’Orosound. Cet ancien ingénieur en traitement du signal chez Parrot dirige désormais la conception de casques modulaires à réduction de bruit chez l’entreprise française née en 2015.

De l’IA pour des appels de meilleure qualité

Orosound a beau proposer essentiellement des casques destinés aux professionnels, dans les centres d’appel, l’initiative du constructeur français est particulièrement intéressante en cela qu’elle s’appuie en fait sur l’intelligence artificielle pour plusieurs aspects. D’abord, puisque ses casques sont orientés vers les appels, Orosound propose de l’IA pour la communication. « L’intelligence artificielle va nous servir à rendre vraiment les algorithmes adaptatifs en fonction du contexte d’utilisation et de l’écoute de la personne », nous explique Eric Benhaim. Concrètement, en fonction de l’environnement de l’utilisateur, il ne va pas être évident pour les micros d’un casque d’analyser quels sont les bruits à filtrer et quelle est la voix qui doit passer ce filtre de réduction de bruit. C’est d’ailleurs l’un des principaux défis des écouteurs sans fil proposés par nombre de constructeurs qui peinent à effacer les bruits ambiants, ou pire, qui vont considérablement abîmer votre voix durant les appels vocaux.

Les micros du Bose QC45 // Source : Frandroid

Mais quelle différence entre l’intelligence artificielle sur laquelle travaille Orosound et les fonctions de réduction de bruit environnementale proposées nativement par l’ensemble de l’industrie ? Ici, le casque continue à apprendre au fur et à mesure de l’utilisation. Certes, Orosound a entraîné les algorithmes de réduction des bruits pour les appels en amont de la commercialisation, mais le casque en lui-même va continuer d’apprendre en étant utilisé grâce à des processeurs intégrés. « Jusqu’à présent, tous les algorithmes de réduction de bruit sont des algorithmes statistiques basés sur le fait que, quand le casque détecte qu’on ne parle pas, le son est un bruit de fond et c’est ce bruit de fond qui va être supprimé », explique Eric Benhaim. Le cofondateur d’Orosound projette d’aller plus loin pour les futurs casques de sa marque : « On passe à une étape supérieure, en étant vraiment capables de faire la séparation en temps réel entre un bruit de voix intéressant et des bruits qui sont gênants ».

De l’IA pour une réduction de bruit adaptée à l’environnement

En plus de la réduction de bruit en communication, Orosound se penche également sur la réduction de bruit active (ANC) qui va permettre d’isoler l’utilisateur lorsqu’il profite de sa musique ou de ses podcasts. L’idée est ici de permettre au casque d’analyser son contexte d’utilisation en fonction de capteurs de mouvement et de l’environnement sonore. Une approche qui peut sembler similaire à celle de Sony avec son contrôle adaptatif du son sur le WH-1000XM4.

Le Sony WH-1000XM4 // Source : Frandroid

Le constructeur japonais propose en effet, dans son application, de modifier le niveau de réduction de bruit selon que l’on est assis, en mouvement, dans les transports ou dans un lieu précis. Il ne s’agit cependant pas d’intelligence artificielle, rétorque Eric Benhaim, mais de simples algorithmes :

Nous, avec des modèles d’IA, on va être capables de savoir quel est le contexte environnant, quel est le type d’activité, et de rendre vraiment les algorithmes adaptatifs. Il y a vraiment des filtres d’ANC qui vont être générés pour votre environnement et pas seulement des presets. Actuellement, la performance de l’ANC est fixe et va varier en fonction de l’utilisateur. On veut vraiment éviter cet aléa qu’il pourrait ressentir en fonction de la taille de la tête, de si le casque serre plus ou moins bien, de la morphologie, de là où l’on évolue. Le but, c’est de pousser au maximum ces filtrages numériques et ne pas arriver sur des instabilités.

De l’IA pour adapter le son en fonction de la musique

Avant même de communiquer à travers un micro ou de s’isoler de la pollution sonore, le principe même d’un casque audio est de profiter de sa musique, de ses appels ou de ses podcasts. Et sur l’écoute aussi Orosound a développé des algorithmes d’intelligence artificielle. L’idée cette fois est d’adapter automatiquement la signature sonore en fonction du type de contenu écouté par l’utilisateur, sans qu’il ait besoin de modifier manuellement l’égaliseur ou les presets au sein de son application, et ce quelle que soit le transducteur, le DAC ou les éléments électroacoustiques utilisés.

Les égaliseurs manuels d’Amazfit, Sony, Technics et JBL

Concrètement, le casque sera capable de reconnaître lorsque vous écoutez des podcasts et de mettre en avant les médiums, de pousser les graves si vous écoutez de la house ou de proposer une courbe plate si vous passez à de la musique classique. Il en va de même pour le niveau sonore des titres qui pourra être augmenté automatiquement par le casque si vous passez d’un titre encodé avec un fort volume à un autre avec un gain plus faible. « Il n’y a pas de raison aujourd’hui que l’on modifie le volume sonore en appuyant sur des boutons selon ce que l’on écoute », déplore Eric Benhaim. Là encore, l’IA doit être embarquée directement au sein du casque, indique le CTO d’Orosound : « Toute la chaîne de traitement doit être prise en compte pour prendre en compte la déperdition sur la chaîne numérique, les éléments électroacoustiques et avec une latence de traitement la plus faible possible ».

L’IA dans les casques, c’est pour bientôt

Reste encore un point sensible, et de taille : quand est-ce que le grand public peut espérer avoir accès à des technologies d’IA embarquées directement dans des casques, voire des écouteurs sans fil ? Sur ce point, Eric Benhaim se veut plutôt réaliste : « Aujourd’hui, personne n’a vraiment d’IA dans les casques ». Il faut dire que les puces électroniques nécessaires au traitement de ces données en temps réel sont encore rares et surtout bien trop consommatrices en énergie. Néanmoins, le projet d’Orosound est bel et bien de proposer ce type d’algorithme au plus vite. Pour ce faire, le constructeur français compte passer, dans un premier temps, par des mises à jour de son casque existant, l’Orosound Tilde Pro, doté de trois puces. Mais le gros de fonctionnalités arrivera dans un second temps, via une nouvelle génération de casques audio grâce à l’intégration de nouveaux composants : « On a déjà des modèles qui tournent sur PC, qui s’intègrent dans la chaîne d’acquisition du microphone et qui sont très bons, mais on veut vraiment pousser à les embarquer dans le casque ».

Le casque modulaire Orosound Tilde Pro // Source : Orosound

Le fait est que, si Orosound développe ses propres casques et solutions algorithmiques, le constructeur français s’appuie sur des fournisseurs pour les puces qui équipent ses appareils. Ces mêmes puces pourraient être adoptées par le reste de l’industrie afin de proposer, à leur tour, de l’intelligence artificielle sur des casques et écouteurs. Reste encore à maîtriser les coûts, surtout dans un contexte de pénurie mondiale, mais également la gestion de l’autonomie de ces casques sans fil.

Le saviez-vous ? Google News vous permet de choisir vos médias. Ne passez pas à côté de Frandroid et Numerama.

M_a_t_y_o_t

De l'IA, il y en a dans presque tous les casques. Là, il nous disent, si je comprends bien, qu'au lieu d'un algo de réduction de bruit (qui est déjà d'une intelligence artificielle élevée), il va y avoir une composante qui détecte quelques environnements prédéfinis pour appliqué un algo correspondant à l'environnement. C'est l'équivalent de l'appareil photo, qui détecte d'abord que vous êtes en lumière sombre pour adapter son paramétrage, ou que vous prenez votre plat pour améliorer les couleurs.
M_a_t_y_o_t

IA est un terme générique couvrant les règles simples, les algorithmes simples, le ML et les réseaux neuronaux profonds. Par exemple, je considère qu'un ascenseur est pourvu d'une IA depuis assez longtemps déjà. En fonction des appels, il va prioriser certains arrêts pour optimiser son parcours. Il va aussi garder la porte suffisamment ouverte et forcer la fermeture quand vous tardez trop. Il s'agit d'un objet (ou robot) intelligent dans sa tache. Le terme est tellement vague et au même temps tellement vendeur. Bonheur des journalistes et des marketeurs.
Sebi11

J'allais dire la même chose. C'est plus vendeur d'écrire IA faut dire... Mais là, on est sur un algo avancé ou du "simple" machine learning, il n'y aucune intelligence.
Dodutils

J'ai quand même un peu de mal avec ce terme IA qu'on nous vend à toutes les sauces, entre IA et simple algo évolué où se situe la limite voici une bonne question.