Né en 1992 à Sèvres dans les Hauts de Seine, Arthur Mensch montre dès l’enfance une forte appétence pour les mathématiques et les sciences. En 2011, il entame des études supérieures à l’École polytechnique, qu’il poursuit à Télécom Paris, puis à l’université Paris-Saclay, où il se spécialise en apprentissage automatique et en vision artificielle.
Peu après, à l’Inria (Institut national de recherche en sciences et technologies du numérique), il rédige une thèse de doctorat portant sur l’optimisation stochastique et l’analyse prédictive d’images cérébrales en IRM fonctionnelle sous la direction de chercheurs de premier plan, tels que Bertrand Thirion, Gaël Varoquaux et Julien Mairal. Il part ensuite aux États-Unis étudier l’apprentissage par renforcement multi-agent auprès de Joan Bruna, professeur en science des données et en mathématiques au Courant Institute de l’université de New York.
Chercheur en IA chez DeepMind
En 2020, il commence sa carrière en rejoignant les bureaux parisiens de DeepMind, le laboratoire d’IA de Google réputé pour ses travaux sur AlphaGo, AlphaFold et les grands modèles de langage. Il opère pour la première fois dans un environnement où la frontière entre recherche académique et applications industrielles est poreuse.
Pendant près de trois ans, il travaille sur les LLM, les systèmes multimodaux et les architectures combinant génération et recherche documentaire, assistant à l’explosion des agents conversationnels et au succès quasi immédiat de ChatGPT.
Immergé tout au long de ses études au cœur de la recherche en IA, côtoyant désormais les meilleurs spécialistes du domaine, Arthur Mensch acquiert la conviction que l’Europe doit disposer de ses propres champions, alors même que les données massives et la puissance de calcul ont ouvert de nouvelles perspectives pour la génération automatique.
Mistral, le petit génie français de l’IA accumule les succès. © RTL, YouTube
Cofondateur de Mistral AI
Au printemps 2023, il cofonde Mistral AI avec Guillaume Lample et Timothée Lacroix, deux anciens chercheurs de Meta. En se référant à un vent méditerranéen puissant et rapide, le nom de l’entreprise ne laisse planer aucun doute sur son identité française, tout en évoquant la vitesse et l’impact qui caractérisent l’IA.
En matière de stratégie, Arthur Mensch opte pour des modèles de pointe ouverts, efficaces et interopérables, comme Ministral 3 ou Mistral Large 3, qui peuvent être multi-modaux comme Pixtral Large, afin de faciliter leur intégration par les développeurs, ce qui permet d’accélérer leur déploiement. Le succès est fulgurant.
En un peu plus d’un an, Mistral AI atteint une valorisation de plusieurs milliards de dollars et noue des partenariats stratégiques avec des acteurs internationaux comme Microsoft, Salesforce ou Nvidia. Du jamais-vu pour une start-up tricolore.
Un symbole du réveil européen
En prouvant qu’une entreprise française pouvait rivaliser avec les poids lourds américains ou chinois, Arthur Mensch est devenu une figure emblématique de la tech européenne. Avec Mistral AI, il incarne une nouvelle génération d’entrepreneurs qui considère que l’IA est à la fois un levier économique et un vecteur de souveraineté.
À ses yeux, la question du contrôle des modèles est aussi importante que leur performance brute. La porte est désormais ouverte pour que d’autres acteurs tricolores suivent le même chemin.