On parle de révolution : mais quelles sont les vraies forces de Gemini 3, et ses limites

Author:

Voici Gemini 3, la nouvelle version du chatbot de Google et principal rival de la cinquième version de ChatGPT. Cette mise à jour est particulièrement importante car Gemini est intégré à travers tous les produits de Google. La firme compte 650 millions d’utilisateurs du chatbot, et plus de deux milliards de personnes consultent l’AI Overview, cette fonctionnalité qui affiche un résumé des résultats en haut du moteur de recherche, et qui n’est toujours pas disponible en France.

Présentation de Gemini 3. En anglais, activez la traduction automatique des sous-titres. © Google

Une IA en tête des classements

Selon Google, sa nouvelle IA est capable de « saisir la profondeur et la nuance » ainsi que « le contexte et l’intention derrière votre demande ». Elle serait même « une nouvelle étape importante sur la voie de l’IAG (Intelligence Artificielle Générale», autrement dit une IA capable de rivaliser (ou même surpasser) avec l’intelligence humaine. Une déclaration audacieuse alors que de nombreux spécialistes pensent que les grands modèles de langage (LLM) derrière les chatbots actuels ne permettront pas d’atteindre cet objectif.

Lire l’article

Toutefois, Gemini 3 est bel et bien plus performant que son prédécesseur. Pour l’instant, Google présente deux versions : Gemini 3 Pro (en preview) et Gemini 3 Deep Think pour le raisonnement approfondi. Sur le classement LMArena, Gemini 3 Pro arrive en tête pour les trois tâches où il est présent, à savoir le texte, la compréhension d’images et le développement Web. Il dépasse de loin les scores de Claude Sonnet 4.5 et GPT-5.1 sur le test de raisonnement Humanity’s Last Exam (37,5 % contre 13,7 % et 26,5 % respectivement) ou sur le test de connaissances scientifiques GPQA Diamond (91,9 % contre 83,4 % et 88,1 % respectivement). Gemini 3 Pro arrive aussi premier sur les tests MMMU-Pro et Video-MMMU pour la compréhension multimodale.

Les scores de Gemini 3 Pro à plusieurs tests standardisés. © Google

Une version pour le raisonnement approfondi

Gemini 3 est présent dans divers outils de développement, comme Google AI Studio, pour le « vibe coding » et obtient les meilleurs scores sur des tests comme LiveCodeBench Pro ou Terminal-Bench 2.0. Le modèle de raisonnement Gemini 3 Deep Think obtient des scores encore plus élevés, avec 41 % pour Humanity’s Last Exam, 93,8 % pour GPQA Diamond et 45,1 % sur ARC-AGI-2, un test de raisonnement visuel (contre 31,1 % pour Gemini 3 Pro et seulement 17,6 % pour GPT-5.1).

Gemini 3 a aussi été conçu pour combiner ses différentes capacités, par exemple pour traduire des recettes manuscrites, ou compiler des articles et des vidéos sur un sujet pour créer des fiches de révision interactives. Il peut même analyser une vidéo d’un match sportif et donner des conseils pour améliorer son jeu.

Les scores de Gemini 3 Deep Think à plusieurs tests standardisés. © Google

Une mise à jour particulièrement bien accueillie

Les premiers retours sur les réseaux sociaux sont extrêmement enthousiastes (contrairement à GPT-5…), notamment sur ses compétences en programmation, en raisonnement, et en compréhension visuelle. Toutefois, ses performances en matière de génération de texte, ou écriture créative, semblent toujours être assez limitées. De plus, il faudra attendre de voir ce qu’il en est des hallucinations et de sa tendance, comme tous les chatbots, à se montrer excessivement flatteur et servile. Quoi qu’il en soit, les utilisateurs devraient constater de nets progrès pour certaines tâches.

À l’heure actuelle, la version de base du chatbot, le modèle « Rapide », utilise encore Gemini 2.5 Flash. Pour tester le nouveau modèle, il faut ouvrir le menu déroulant en bas à droite du champ de saisie, et choisir Raisonnement. Ce mode fait appel à Gemini 3 Pro pour une réflexion plus profonde. Cette version est disponible pour tous, y compris sans abonnement. Toutefois, l’accès gratuit est soumis à certaines limites, et Gemini basculera sur une version 2.5 lorsqu’elles seront dépassées. Le déploiement est graduel, il faudra donc simplement patienter si vous ne le voyez pas encore.

Leave a Reply

Your email address will not be published. Required fields are marked *