Anthropic démocratise l’IA premium avec Claude Sonnet 4.6 : les concurrents sous pression

Author:

Dans la course à l’intelligence artificielle, Google semble prendre la tête avec Gemini, alors que ChatGPT d’OpenAI perd en vitesse. Mais ce ne sont pas les seuls chatbots sur le marché, et l’un de leurs principaux rivaux est Claude d’Anthropic. Début février, l’entreprise a lancé une nouvelle version de Claude Opus, son chatbot destiné à un usage professionnel. Désormais, la firme vient d’annoncer Claude Sonnet 4.6, la version destinée au grand public.


Lire l’article



Cette nouvelle version serait améliorée à tous les niveaux, notamment en ce qui concerne « la programmation, l’utilisation de l’ordinateur, le raisonnement à long terme, la planification d’agents, le travail intellectuel et la conception ». D’un point de vue général, les performances de Claude sont très proches de celles de ChatGPT. Cependant, depuis plusieurs versions déjà, le chatbot se distingue en particulier sur deux points précis : la programmation et les textes complexes. Côté programmation, Anthropic annonce des améliorations en termes de consistance et de suivi des instructions. Il serait plus performant que Claude Opus 4.5, la précédente version du modèle pro sortie en novembre dernier.

Présentation de la nouvelle version de Claude Sonnet. © Anthropic

Une fenêtre contextuelle élargie

Anthropic annonce aussi une fenêtre contextuelle doublée, soit un million de tokens en version bêta. À titre de comparaison, chez ChatGPT la fenêtre contextuelle est de seulement 16 000 tokens en version gratuite, et monte jusqu’à 196 000 pour le modèle de raisonnement (GPT-5.2 Thinking). Google indique un million de tokens pour Gemini, mais seulement pour les abonnements les plus chers (AI Pro et AI Ultra). Pour l’accès gratuit, comptez 32 000 tokens. Un million de tokens représente environ 1 500 pages de texte ou 30 000 lignes de code. Il est donc possible de demander à Claude de prendre en compte de gros fichiers ou une codebase entière.

Bien entendu, Sonnet 4.6 affiche des scores en hausse sur tous les tests standardisés par rapport à Sonnet 4.5, et se retrouve particulièrement bien positionné par rapport à Gemini 3 Pro et GPT 5.2. Il obtient par exemple 58,3 % sur la résolution de problèmes (ARC-AGI-2), 89,9 % sur le raisonnement (GPQA Diamond), ou 79,6 % sur la programmation agentique (SWE-bench Verified).

Claude Sonnet 4.6 obtient parmi les meilleurs scores sur de nombreux tests standardisés. © Anthropic

Une IA capable de contrôler les autres logiciels

Auparavant, Anthropic avait sorti Claude Computer, un agent capable d’effectuer des tâches de manière autonome et d’accéder à différents logiciels fonctionnant dans un ordinateur virtuel intégré à l’IA. Cette fonctionnalité a depuis été intégrée au chatbot, et peut être utilisée avec Claude Cowork à condition d’être abonné. Avec Sonnet 4.6, cette fonctionnalité devient encore plus puissante. Elle n’utilise pas d’API ou d’outil spécial, et navigue visuellement dans les interfaces graphiques des logiciels comme le ferait un humain, ce qui lui permet de s’adapter plus facilement à toutes les situations.

Son score sur le test OSWorld est passé à 72,5 % de réussite sur les tâches, le plaçant loin devant les concurrents. Son concurrent le plus proche, Kimi K2.5 de Moonshot AI, affiche 63,3 %. La firme a aussi annoncé avoir pris soin de renforcer la sécurité du modèle pour le protéger contre les attaques de type « prompt injection ». C’est d’autant plus important que Sonnet 4.6 peut servir de modèle de base pour l’agent autonome OpenClaw (précédemment appelé Clawdbot et Moltbot).


Lire l’article



En plus d’être intégré à tous les abonnements, Claude Sonnet 4.6 peut être utilisé gratuitement via l’application mobile et sur Claude.ai. Il s’agit désormais du modèle par défaut. Toutefois, si vous n’avez pas d’abonnement, mieux vaut attendre quelques jours avant de le tester. Le chatbot est victime de son succès, et ne parvient pas à traiter la plupart des demandes, même au bout de dix tentatives…

Leave a Reply

Your email address will not be published. Required fields are marked *