Le dernier modèle Anthropic, Claude Sonnet 4.6, apporte des améliorations en matière de codage, d'utilisation de l'ordinateur, de raisonnement dans un contexte étendu et de planification d'agents
Anthropic a annoncé que Claude Sonnet 4.6 est désormais la norme pour les formules Free et Pro de claude.ai et Claude Cowork. Claude Sonnet désigne la version moyenne du modèle. Claude Opus est un modèle plus coûteux et plus performant, et Haiku un modèle plus léger et plus rapide. Pour les développeurs, le prix reste de 3 dollars par million de jetons d'entrée et de 15 dollars par million de jetons de sortie. Dans Claude Code, l'environnement de développement d'Anthropic, les premiers utilisateurs ont préféré Sonnet 4.6 à Sonnet 4.5 dans environ 70 % des cas. Ils ont indiqué que le modèle lit le contexte plus efficacement avant de modifier le code et qu'il consolide la logique partagée plutôt que de la dupliquer. Même par rapport à Opus 4.5, le modèle de pointe de novembre 2025, les utilisateurs ont choisi Sonnet 4.6 dans 59 % des cas.
Anthropic est une entreprise américaine spécialisée dans l'intelligence artificielle (IA). Elle a développé une famille de grands modèles de langage (LLM) baptisée Claude. Anthropic fonctionne comme une société d'intérêt public qui mène des recherches et développe des IA afin d'« étudier leurs propriétés de sécurité à la frontière technologique » et utilise ces recherches pour déployer des modèles sûrs pour le public.
Début février, Anthropic a dévoilé Claude Opus 4.6, son dernier modèle d'intelligence artificielle (IA) pour le « vibe working », présenté comme étant plus performant en matière de codage, capable de soutenir des tâches agentiques pendant une durée plus longue et de produire un travail professionnel de meilleure qualité. Cette mise à jour améliore les performances du modèle en matière de planification, de révision de code, de débogage et de recherche, ce qui constitue une avancée significative dans le domaine des outils d'IA pour les entreprises. Claude Opus 4.6 excelle également dans les tâches d'analyse financière et devrait avoir un impact sur des secteurs tels que l'ingénierie logicielle et la finance.
Récemment, Anthropic a annoncé que Claude Sonnet 4.6 est désormais la norme pour les formules Free et Pro de claude.ai et Claude Cowork. Claude Sonnet désigne la version moyenne du modèle. Claude Opus est un modèle plus coûteux et plus performant, et Haiku un modèle plus léger et plus rapide. Pour les développeurs, le prix reste de 3 dollars par million de jetons d'entrée et de 15 dollars par million de jetons de sortie.
Anthropic affirme que les utilisateurs préfèrent clairement le nouveau modèle à son prédécesseur. Dans Claude Code, l'environnement de développement d'Anthropic, les premiers utilisateurs ont préféré Sonnet 4.6 à Sonnet 4.5 dans environ 70 % des cas. Ils ont indiqué que le modèle lit le contexte plus efficacement avant de modifier le code et qu'il consolide la logique partagée plutôt que de la dupliquer. Même par rapport à Opus 4.5, le modèle de pointe de novembre 2025, les utilisateurs ont choisi Sonnet 4.6 dans 59 % des cas.
Un bond en avant dans l'utilisation des ordinateurs
En octobre 2024, Anthropic a été le premier à introduire un modèle d'utilisation d'ordinateurs à usage général, un type d'IA qui interagit avec l'interface utilisateur d'un ordinateur de la même manière qu'un humain. Cela permet à l'IA de comprendre l'écran et d'effectuer des tâches pour l'utilisateur. Les progrès ont été significatifs depuis la fin de l'année 2024. Sur OSWorld, la référence standard pour l'utilisation de l'IA sur ordinateur, les modèles Sonnet obtiennent des scores de plus en plus élevés. Cette référence teste des centaines de tâches dans des logiciels réels tels que Chrome, LibreOffice et VS Code sur un ordinateur simulé.
Les utilisateurs constatent désormais des performances de niveau humain dans des tâches telles que la navigation dans des feuilles de calcul complexes ou le remplissage de formulaires web sur plusieurs onglets de navigateur. Cependant, le modèle reste encore en retard par rapport aux humains les plus compétents. Mais les progrès sont suffisamment remarquables pour rendre l'utilisation de l'ordinateur utile pour toute une série de tâches professionnelles.
Dans son annonce, Anthropic déclare : "Au cours des seize derniers mois, nos modèles Sonnet ont enregistré des progrès constants sur OSWorld. Ces améliorations ne se limitent pas aux benchmarks : les premiers utilisateurs de Sonnet 4.6 constatent des capacités dignes d'un humain dans des tâches telles que la navigation dans un tableur complexe ou le remplissage d'un formulaire Web en plusieurs étapes, avant de tout rassembler dans plusieurs onglets du navigateur. Le modèle reste certes en retard par rapport aux humains les plus habiles dans l'utilisation des ordinateurs. Mais le rythme des progrès est néanmoins remarquable. Cela signifie que l'utilisation de l'ordinateur est beaucoup plus utile pour toute une série de tâches professionnelles et que des modèles nettement plus performants sont à portée de main."
L'utilisation de l'ordinateur comporte toutefois des risques. Des acteurs malveillants peuvent tenter de détourner le modèle en cachant des instructions sur des sites web, une technique connue sous le nom d'injection de prompt. Les évaluations de sécurité d'Anthropic montrent que Sonnet 4.6 constitue une amélioration significative par rapport à Sonnet 4.5 et offre des performances similaires à celles d'Opus 4.6 en matière de résistance aux injections de prompt.
Fenêtre contextuelle d'un million de jetons
La fenêtre contextuelle d'un million de tokens est suffisamment grande pour couvrir l'intégralité d'une base de code, des contrats à long terme ou des dizaines d'articles de recherche en une seule requête. Plus important encore, Sonnet 4.6 analyse efficacement l'ensemble de ce contexte. Cela rend le modèle plus performant en matière de planification à long terme. Cela a été démontré lors de l'évaluation Vending-Bench Arena, qui teste la capacité d'un modèle à gérer une entreprise simulée au fil du temps. Divers modèles d'IA s'y affrontent pour obtenir les profits les plus élevés. Sonnet 4.6 a développé une stratégie consistant à investir massivement dans la capacité pendant les dix premiers mois simulés, puis à se tourner brusquement vers la rentabilité dans le sprint final.
Les clients ont signalé des améliorations générales, notamment au niveau du code frontal et de l'analyse financière. Ils ont décrit les résultats visuels comme nettement plus raffinés, avec une meilleure mise en page, de meilleures animations et un design plus sensible que les modèles précédents. Le nombre d'itérations nécessaires pour obtenir des résultats prêts à la production a également été réduit.
Mises à jour du produit et fonctionnalités de la plateforme
Sur la plateforme de développement Claude, Sonnet 4.6 prend en charge à la fois la pensée adaptative et la pensée étendue. La compression du contexte en version bêta résume automatiquement les anciens contextes lorsque les conversations approchent leurs limites, ce qui augmente la longueur effective du contexte. Sur l'API, les outils de recherche et de récupération Web de Claude exécutent désormais automatiquement du code pour filtrer et traiter les résultats de recherche. Cela garantit que seul le contenu pertinent reste dans le contexte, ce qui améliore à la fois la qualité des réponses et l'efficacité des jetons. En outre, l'exécution de code, la mémoire, l'appel d'outils programmatiques, la recherche d'outils et les exemples d'utilisation d'outils sont désormais accessibles à tous.
Pour les utilisateurs de Claude dans Excel, le complément prend désormais en charge les connecteurs MCP. Cela permet à Claude de fonctionner avec des outils tels que S&P Global, LSEG, Daloopa, PitchBook, Moody's et FactSet. Les utilisateurs peuvent récupérer du contexte en dehors de leur feuille de calcul sans quitter Excel. Les connecteurs MCP déjà configurés dans Claude.ai fonctionnent automatiquement dans Excel. Cette fonctionnalité est disponible dans les plans Pro, Max, Team et Enterprise.
Claude Sonnet 4.6 est désormais disponible sur tous les forfaits Claude, Claude Cowork, Claude Code, l'API et toutes les principales plateformes cloud. Le niveau gratuit a été mis à niveau vers Sonnet 4.6 en standard et comprend désormais la création de fichiers, les connecteurs, les compétences et la compression. Les développeurs peuvent se lancer rapidement via claude-sonnet-4-6 dans l'API Claude.
Voici un extrait de l'annonce de Claude Sonnet 4.6 :
Évaluation de Claude Sonnet 4.6
Au-delà de l'utilisation informatique, Claude Sonnet 4.6 a amélioré ses performances dans tous les domaines. Il se rapproche du niveau d'intelligence d'Opus à un prix qui le rend plus pratique pour un nombre beaucoup plus important de tâches. Vous trouverez une présentation complète des capacités de Sonnet 4.6 et de ses comportements en matière de sécurité dans notre fiche système ; vous trouverez ci-dessous un résumé et une comparaison avec d'autres modèles récents.
Dans Claude Code, nos premiers tests ont montré que les utilisateurs préféraient Sonnet 4.6 à Sonnet 4.5 dans environ 70 % des cas. Les utilisateurs ont indiqué qu'il lisait plus efficacement le contexte avant de modifier le code et qu'il consolidait la logique partagée plutôt que de la dupliquer. Cela le rendait moins frustrant à utiliser lors de longues sessions que les modèles précédents.
Les utilisateurs ont même préféré Sonnet 4.6 à Opus 4.5, notre modèle de pointe de novembre, dans 59 % des cas. Ils ont estimé que Sonnet 4.6 était nettement moins sujet à la suringénierie et à la « paresse », et nettement meilleur dans le suivi des instructions. Ils ont signalé moins de fausses déclarations de réussite, moins d'hallucinations et un suivi plus cohérent des tâches en plusieurs étapes.
La fenêtre contextuelle de 1 million de tokens de Sonnet 4.6 est suffisante pour contenir des bases de code entières, des contrats volumineux ou des dizaines d'articles de recherche en une seule requête. Plus important encore, Sonnet 4.6 raisonne efficacement dans tout ce contexte. Cela peut le rendre beaucoup plus performant dans la planification à long terme. Nous l'avons constaté très clairement dans l'évaluation Vending-Bench Arena, qui teste la capacité d'un modèle à gérer une entreprise (simulée) au fil du temps et qui comprend un élément de compétition, différents modèles d'IA s'affrontant pour réaliser les plus gros profits.
Sonnet 4.6 a développé une nouvelle stratégie intéressante : il a investi massivement dans la capacité pendant les dix premiers mois simulés, dépensant beaucoup plus que ses concurrents, puis a opéré un virage radical pour se concentrer sur la rentabilité dans la dernière ligne droite. Le timing de ce virage lui a permis de terminer loin devant la concurrence.
Les premiers clients ont également signalé des améliorations générales, notamment au niveau du code frontal et de l'analyse financière. Les clients ont indépendamment décrit les résultats visuels de Sonnet 4.6 comme étant nettement plus raffinés, avec une meilleure mise en page, de meilleures animations et un meilleur sens du design que ceux des modèles précédents. Les clients ont également eu besoin de moins d'itérations pour obtenir des résultats de qualité production.
Source : Anthropic
Et vous ?
Pensez-vous que cette annonce est crédible ou pertinente ?
Quel est votre avis sur le sujet ?
Voir aussi :
Nous avons chargé Claude Opus 4.6 d'utiliser des équipes d'agents pour construire un compilateur C, ce que cela nous a appris sur l'avenir du développement logiciel autonome
Google annonce une mise à jour de son modèle d'IA Gemini 3 Deep Think afin qu'il puisse traiter des problèmes complexes du monde réel, il aurait atteint un score sans précédent de 84,6 % sur ARC-AGI-2
OpenAI lance GPT-5.3-Codex-Spark, optimisé par la puce Wafer Scale Engine 3 de Cerebras, pour un codage en temps réel ultra-rapide, 15 fois plus rapide que son prédécesseur










Pensez-vous que cette annonce est crédible ou pertinente ?
Répondre avec citation
Partager