En 7 questions-réponses, découvrez tout ce qu'il faut savoir sur ce champion européen de l'intelligence artificielle.

Qui a créé Mistral AI ?

Mistral AI est l’œuvre de trois chercheurs français : Arthur Mensch, Guillaume Lample et Timothée Lacroix.

Arthur Mensch, ancien de DeepMind (le laboratoire d’IA de Google), a pris le rôle de CEO. Guillaume Lample, qui a notamment participé à la création du modèle LLaMA chez Meta, est devenu le directeur scientifique. Timothée Lacroix, également ex-Meta, occupe le poste de directeur technique.

Ces trois experts se sont rencontrés à l’automne 2022, ils partageaient alors une vision commune : créer une entreprise européenne capable de rivaliser avec les géants américains de l’IA.

Tous issus d’une formation française en machine learning, ils se sont lancés dans l’aventure en avril 2023, avec chacun leur expertise spécifique : Guillaume pour la partie scientifique, Timothée pour l’infrastructure et l’ingénierie, et Arthur pour la stratégie et le développement commercial.

Mistral est-il basé en France ?

Mistral AI est une entreprise française dont le siège social est situé dans le 1ᵉʳ arrondissement de Paris. Bien qu’elle ait depuis étendu sa présence internationale avec des bureaux au Royaume-Uni et des antennes à Palo Alto et Singapour, elle maintient fermement son ancrage français.

Les fondateurs souhaitent capitaliser sur l’excellence de l’écosystème français en IA, notamment grâce à la présence de nombreux talents issus des grandes écoles et des laboratoires de recherche.

Qui a financé cette startup ?

Mistral AI a réalisé trois levées de fonds majeures en moins d’un an, soit plus d’un milliard d’euros. La première, en juin 2023, a atteint 105 millions d’euros avec des investisseurs comme Xavier Niel, Lightspeed Venture Partners et Eric Schmidt.

La deuxième, en décembre 2023, a rapporté 385 millions d’euros, impliquant notamment Andreessen Horowitz, BNP Paribas et Salesforce. La troisième, en juin 2024, a atteint 600 millions d’euros, menée par le fonds américain General Catalyst. Malgré ces investissements internationaux significatifs, Arthur Mensch, le CEO, affirme que 65 % du capital reste français.

De plus, l’entreprise a noué des partenariats stratégiques avec des acteurs majeurs comme Microsoft, qui a pris une participation minoritaire dans l’entreprise.

Quels sont les différents modèles de Mistral ?

Pour rappel, un LLM (Large Language Model) ou grand modèle de langage est un système d’intelligence artificielle entraîné sur d’immenses quantités de données textuelles.

Ces modèles peuvent comprendre et générer du texte, répondre à des questions, traduire des langues, analyser des documents et même écrire du code. Leur puissance est souvent mesurée en nombre de paramètres, qui représentent les connexions et les poids au sein du réseau neuronal.

Mistral AI propose plusieurs catégories de modèles. Au sommet de leur gamme se trouve Mistral Large 2, leur modèle le plus puissant avec 123 milliards de paramètres. Ce modèle phare rivalise avec GPT-4 et excelle particulièrement dans l’appel de fonctions, permettant d’interagir avec d’autres outils et systèmes.

Il est accompagné de Mistral Small, une version plus légère optimisée pour la rapidité de réponse, et de modèles spécialisés comme Codestral (22 milliards de paramètres) dédié à la programmation. Ce dernier peut tourner sur un PC portable.

L’entreprise a également développé des modèles utilisant l’architecture « système d’experts » comme Mixtral 8x7B et Mixtral 8x22B. Cette approche permet d’obtenir d’excellentes performances tout en optimisant l’utilisation des ressources.

Pour les applications mobiles et embarquées, Mistral propose les « Ministraux » : Ministral 3B et 8B, des modèles plus légers conçus pour fonctionner sur des appareils avec des ressources limitées. Du côté de la vision par ordinateur, Pixtral et Pixtral Large permettent d’analyser et de comprendre les images.

Mistral fait-il de l’open-source ?

Une particularité de Mistral est sa politique de distribution hybride : certains modèles sont disponibles en open source sous licence Apache 2.0 (comme Mistral 7B et Mixtral 8x7B), cela permet une utilisation libre et gratuite, tandis que d’autres sont proposés sous licence commerciale restrictive.

Cette approche permet à la fois de contribuer à la communauté open source et de maintenir un avantage compétitif sur leurs modèles les plus avancés. Tous ces modèles sont accessibles via leur plateforme « Le Chat » ou leur API pour les développeurs.

C’est quoi Le Chat ? Où télécharger Le Chat ?

Le Chat est l’interface conversationnelle développée par Mistral AI, lancée en février 2024.

C’est l’équivalent français de ChatGPT, il permet aux utilisateurs d’interagir directement avec les modèles d’intelligence artificielle de Mistral via une interface simple et intuitive accessible depuis leur navigateur web ou via une app.

La plateforme propose un large éventail de fonctionnalités, aussi bien dans sa version gratuite que premium (14,99 € par mois, ou inclus 1 an dans les forfaits Free mobile, voici comment l’activer).

Que peut-on faire avec Le Chat ?

On peut poser des questions, demander des analyses, générer des images, interpréter du code, et effectuer des recherches web en temps réel.

Le Chat peut également analyser des fichiers, gérer plusieurs espaces de travail… Il est capable d’interagir en plusieurs langues.

Une des forces du Chat est sa capacité à combiner différentes sources d’information. Grâce à des partenariats stratégiques, notamment avec l’AFP qui lui donne accès à 38 millions de dépêches depuis 1983, Le Chat peut fournir des réponses documentées et à jour. Il associe les connaissances pré-entraînées des modèles Mistral avec des informations récentes issues du web, du journalisme et d’autres sources, ce qui permet d’obtenir des réponses plus nuancées et mieux documentées. On notera aussi la génération d’images via un partenariat avec Black Forest Labs.

On dit Le Chat ou « Le Tchat » ?

La réponse est simple : c’est « Le Chat », comme l’animal.

Mistral AI a délibérément opté pour l’orthographe française traditionnelle « Chat » plutôt que l’anglicisme « Tchat » ou « Chat » (prononcé à l’anglaise).

Dans une interview, Arthur Mensch a évoqué la stratégie de Mistral pour concurrencer les géants de l’IA avec moins de ressources de calcul repose sur deux piliers fondamentaux :

L’efficacité avant tout : plutôt que de se lancer dans une course aux modèles toujours plus grands, Mistral a choisi de se concentrer sur l’optimisation et l’efficacité. L’entreprise insiste particulièrement sur la qualité des données d’entraînement plutôt que sur leur quantité.

Comme l’explique Arthur Mensch, leur approche privilégie « les aspects de l’entraînement qui ont le plus de levier« , notamment la qualité des données. Cette stratégie leur permet d’obtenir des performances impressionnantes avec des modèles plus petits et donc moins gourmands en ressources.

Mistral innove également dans l’architecture de ses modèles.

Le meilleur exemple est leur système d’experts (SMoE – Sparse Mixture of Experts), utilisé dans les modèles Mixtral. Cette approche permet d’avoir un grand nombre de paramètres totaux (par exemple 46,7 milliards pour Mixtral 8x7B) tout en n’en utilisant qu’une fraction à chaque utilisation (12,9 milliards par token).

Cette architecture leur permet d’obtenir des performances comparables aux plus grands modèles tout en utilisant beaucoup moins de ressources de calcul.

Pourquoi Mistral est si important en France ?

L’impact de Mistral sur l’écosystème tech français est considérable. En devenant la première entreprise d’IA européenne capable de rivaliser avec les géants américains, Mistral a démontré qu’il était possible de créer des technologies de pointe en France, avec des talents locaux.

Cette réussite a un effet d’entraînement majeur : elle attire l’attention des investisseurs internationaux sur la French Tech et encourage d’autres entrepreneurs à se lancer dans des projets ambitieux.

De plus, l’entreprise contribue à retenir les talents en France en offrant des opportunités professionnelles de haut niveau qui rivalisent avec celles des GAFAM.

L’entreprise joue également un rôle essentiel dans l’écosystème de l’IA en France en adoptant une approche ouverte.

En publiant certains de leurs modèles en open source, Mistral permet à d’autres startups et développeurs français de construire leurs propres applications et services basés sur ces technologies. Cette stratégie crée un effet multiplicateur : chaque avancée de Mistral profite potentiellement à l’ensemble de l’écosystème tech français.