L'intelligence artificielle au service de la diversité linguistique ? C'est le pari de Google avec l'ajout de 110 nouvelles langues à son service de traduction, dont nos chères langues régionales.

Google Traduction fait un bond de géant dans la diversité linguistique. Avec 110 nouvelles langues ajoutées, dont le breton et l’occitan, c’est toute la richesse de notre patrimoine linguistique qui entre dans l’ère du numérique.

L’IA au service de la diversité linguistique

Jusqu’à présent, Google Traduction se faisait distancer par d’autres outils comme DeepL ou les chatbots IA (ChatGPT est efficace pour cette tâche). Mais le géant de Mountain View a décidé de frapper un grand coup en utilisant PaLM 2, son modèle linguistique d’intelligence artificielle, pour booster les capacités de son service de traduction.

Le résultat est impressionnant : Google Traduction passe de 133 à 243 langues prises en charge. Parmi les nouveaux venus, on trouve des langues peu parlées comme le manoi ou le sami, mais aussi — et c’est là que ça nous intéresse — le breton et l’occitan. Une véritable révolution pour ces langues régionales françaises qui peinent parfois à exister dans le monde numérique.

Le défi des langues régionales

L’intégration du breton et de l’occitan n’est pas anodine. Ces langues, bien que riches d’histoire et de culture, sont parfois menacées de disparition. Le breton, par exemple, ne compte plus qu’environ 200 000 locuteurs. Pourtant, comme l’explique Isaac Caswell de Google, ces communautés linguistiques sont « très dévouées » et ont « publié beaucoup de contenus ».

C’est là que l’IA entre en jeu. PaLM 2, le modèle linguistique de Google, s’est montré particulièrement efficace pour apprendre les langues liées entre elles. Cette capacité a permis d’intégrer non seulement le breton et l’occitan, mais aussi des créoles français comme le seychellois ou le mauricien.

Un travail collaboratif

Mais l’IA ne fait pas tout. Google a travaillé main dans la main avec des linguistes, des experts, des traducteurs et des locuteurs natifs pour évaluer la qualité du modèle et fournir des traductions. Cette approche collaborative est cruciale pour garantir la précision et le respect des subtilités de chaque langue.

D’ailleurs, l’intégration du breton dans Google Traduction répond à une demande forte de la communauté. En février, un collectif avait organisé un Datathon à Quimper pour plaider cette cause, la jugeant « essentielle pour que le breton et la Bretagne comptent dans le monde, à l’heure où la consommation culturelle est dématérialisée ».

L’ajout de ces langues régionales à Google Traduction va bien au-delà d’une simple fonctionnalité technique. C’est un véritable enjeu de préservation culturelle. En rendant ces langues accessibles via un outil aussi largement utilisé, Google contribue à leur visibilité et potentiellement à leur survie à l’ère numérique.

L’Office public de la langue bretonne avait d’ailleurs pris les devants en novembre 2023, en mettant en ligne des outils numériques pour renforcer la présence du breton sur internet, dont un dictionnaire de 60 000 mots. L’intégration à Google Traduction vient compléter ces efforts de manière significative.