Les 17 et 18 mai 2025, une trentaine de mathématiciensmathématiciens venus d’universités prestigieuses comme Caltech, Oxford ou Cambridge se sont retrouvés à l’université de Berkeley, en Californie. Leur mission ? Mettre au défi une intelligence artificielle de pointe : o4-mini, un prototype avancé du futur modèle GPT développé par OpenAI.
Répartis en petits groupes, ces spécialistes ont conçu des problèmes mathématiques d’une complexité extrême. À la clé : 7 500 dollars pour chaque problème que l’IAIA ne parviendrait pas à résoudre. Une fois les énoncés finalisés, ils les ont soumis à o4-mini. Mais très vite, l’IA a surpris tout le monde.
Défi relevé : l’IA a épaté les meilleurs mathématiciens
En quelques minutes, o4-mini a résolu des problèmes qui demanderaient des semaines de travail à un humain.
Le mathématicien Ken Ono, professeur à l’université de Virginie, a proposé une question inédite sur la théorie des nombres, du niveau d’un doctorat. Il a vu, médusé, o4-mini dérouler en temps réel un raisonnement structuré, après avoir exploré en deux minutes l’ensemble des travaux existants sur le sujet.
L’IA a commencé par résoudre une version simplifiée du problème, avant de s’attaquer à la version complète. Elle a terminé en écrivant : « Aucune citation n’est nécessaire, j’ai moi-même calculé le chiffre mystère ! », raconte le professeur, à la fois impressionné et troublé.
OpenAI’s latest advancements, the O3 and O4 mini models, represent a significant leap in AI capabilities. The O3 model showcases enhanced reasoning skills, particularly in areas like coding, mathematics, and science, while minimizing errors from previous iterations. Users can… pic.twitter.com/a9iyBs6f3N
— Small Business Trends (@smallbiztrends) May 7, 2025
Au fil des heures, les défis mathématiques les plus coriaces ont été balayés un à un. L’IA a démontré, transformé, relié les concepts les plus abstraits avec une aisance déconcertante. À l’issue de ce marathon intellectuel, seuls dix problèmes ont tenu tête à l’IA. « Je n’avais jamais vu un modèle raisonner comme ça. C’est exactement ce que ferait un scientifique. C’est effrayant », confie Ken Ono.
Des modèles d’intelligence artificielle de plus en plus performants
Ce tour de force vient confirmer les premiers résultats d’un test similaire conduit quelques mois en amont par OpenAI. Epoch AI, en collaboration avec l’entreprise américaine, avait alors embauché un jeune docteur en mathématiques afin de mesurer les capacités de o4-mini. Le mathématicien, prénommé Elliot Glazer, avait conçu pour l’occasion un ensemble de 300 problèmes mathématiques inédits.
Résultat : là où les anciens modèles ne parvenaient à en résoudre que 2 %, o4-mini en a résolu 20 %.
C’est dans cette continuité que s’est déroulée l’expérience menée à Berkeley. Et cette fois, l’IA n’a pas seulement réussi le défi : elle a aussi impressionné les chercheurs par la rapiditérapidité de ses progrès en si peu de temps. « C’est exactement ce que ferait un très, très bon doctorant ; en fait, c’est même plus » a déclaré Yang-Hui He, mathématicien au London Institute for Mathematical Sciences et pionnier de l’usage de l’IA dans la discipline.