IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Intelligence artificielle Discussion :

Anthropic lance Claude Sonnet 4.5, son dernier modèle d'IA qui « s'apparente davantage à un collègue »


Sujet :

Intelligence artificielle

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Communiqués de presse

    Femme Profil pro
    Traductrice Technique
    Inscrit en
    Juin 2023
    Messages
    2 678
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France

    Informations professionnelles :
    Activité : Traductrice Technique

    Informations forums :
    Inscription : Juin 2023
    Messages : 2 678
    Par défaut Anthropic lance Claude Sonnet 4.5, son dernier modèle d'IA qui « s'apparente davantage à un collègue »
    Anthropic lance Claude Sonnet 4.5, son dernier modèle d'IA qui « s'apparente davantage à un collègue », Claude Sonnet 4.5 est plus petit que Claude Opus 4.1, mais serait plus intelligent

    Anthropic, une start-up américaine spécialisée dans l'intelligence artificielle (IA), a récemment annoncé son dernier modèle d'IA : Claude Sonnet 4.5. Selon Anthropic, Claude Sonnet 4.5 est plus performant en matière de codage, d'utilisation des ordinateurs et de réponse aux besoins pratiques des entreprises, et il excelle dans des domaines spécialisés tels que la cybersécurité, la finance et la recherche. Claude Sonnet 4.5 est plus petit que Claude Opus 4.1, mais plus intelligent que lui « à presque tous les égards ».

    Anthropic, une start-up américaine spécialisée dans l'intelligence artificielle (IA), a récemment annoncé son dernier modèle d'IA : Claude Sonnet 4.5. Fondée en 2021, Anthropic a développé la famille de grands modèles de langage (LLM) baptisée Claude. Selon l'entreprise, elle mène des recherches et développe des IA afin « d'étudier leurs propriétés de sécurité à la frontière technologique » et utilise ces recherches pour déployer des modèles sûrs pour le public.

    Selon Anthropic, Claude Sonnet 4.5 est plus performant en matière de codage, d'utilisation des ordinateurs et de réponse aux besoins pratiques des entreprises, et il excelle dans des domaines spécialisés tels que la cybersécurité, la finance et la recherche. La start-up soutenue par Amazon, évaluée à 183 milliards de dollars, met Claude Sonnet 4.5 à la disposition de tous les utilisateurs.

    Anthropic a déclaré que Claude Sonnet 4.5 est le « meilleur modèle de codage au monde » selon les benchmarks du secteur tels que SWE-bench Verified, un ensemble de tests qui mesure les capacités de codage logiciel d'un système d'IA. « Les gens remarquent simplement avec ce modèle, parce qu'il est plus intelligent et plus proche d'un collègue, qu'il est assez agréable de travailler avec lui lorsqu'on rencontre des problèmes et qu'on les résout », a déclaré Jared Kaplan, cofondateur et directeur scientifique d'Anthropic. Selon l'entreprise, ce modèle génère un code de meilleure qualité, identifie plus facilement les améliorations à apporter au code et suit les instructions de manière plus fiable.


    Claude Sonnet 4.5 fait suite au lancement de Claude Opus 4.1 en août et de Claude Sonnet 4 en mai par Anthropic. Il s'agit du dernier exemple en date du rythme effréné de l'innovation dans le secteur de l'IA. Anthropic a été fondée en 2021 par un groupe d'anciens chercheurs d'OpenAI, et les deux entreprises sont depuis lors des concurrentes acharnées. OpenAI a lancé le boom de l'intelligence artificielle générative après la sortie de son chatbot ChatGPT en 2022. La start-up, dont la valorisation a atteint 500 milliards de dollars, a annoncé en août son dernier modèle, GPT-5. Le lancement a été difficile, certains utilisateurs se plaignant de ne plus avoir accès aux modèles précédents de l'entreprise.

    Mike Krieger, directeur produit chez Anthropic, a déclaré que Claude Sonnet 4.5 serait le modèle par défaut pour les utilisateurs et qu'Anthropic le recommandait pour « pratiquement tous les cas d'utilisation ». Les utilisateurs auront toutefois le choix. Les abonnés payants pourront toujours choisir d'utiliser Opus, et les utilisateurs ayant des flux de travail spécifiques pourront sélectionner une ancienne génération de Sonnet s'ils ne sont pas prêts à migrer du jour au lendemain, a-t-il déclaré.

    Claude Sonnet 4.5 est plus petit que Claude Opus 4.1, mais plus intelligent que lui « à presque tous les égards », a ajouté Krieger. « Nous l'avons trouvé, et nos clients le trouvent, très utile pour le travail réel et concret », a déclaré Krieger. Claude Sonnet 4.5 peut fonctionner de manière autonome pendant 30 heures, et Anthropic a déclaré qu'il était capable de rester concentré sur des tâches complexes en plusieurs étapes pendant toute cette période. Claude Opus 4, lancé par la société en mai, ne pouvait fonctionner de manière autonome que pendant sept heures.

    Anthropic a également pu améliorer le comportement du modèle grâce à une formation approfondie en matière de sécurité, a déclaré la société. Elle a réduit les « comportements préoccupants » tels que la tromperie, la recherche de pouvoir et la flagornerie, qui consiste pour un modèle à dire à un utilisateur ce qu'il veut entendre. Claude Sonnet 4.5 est également plus résistant aux attaques par injection de prompt, dans lesquelles un modèle peut être amené à faire quelque chose de malveillant, comme exposer des données sensibles. « Il s'agit de la plus grande avancée en matière de sécurité que nous ayons connue depuis probablement un an, un an et demi », a déclaré Kaplan.

    D'autres lancements de modèles sont déjà prévus pour Anthropic. Kaplan a déclaré que de meilleurs modèles étaient en préparation, notamment « très probablement Opus ». « Je ne promets rien », a-t-il déclaré. « Mais je pense que nous aurons probablement un ou deux autres lancements avant la fin de l'année. »

    Ce lancement intervient alors qu'Anthropic a révisé ses Conditions générales et sa Politique de confidentialité en août. Désormais, les données issues des conversations des utilisateurs de Claude pourront être utilisées pour entraîner les modèles — sauf en cas de refus explicite. Une décision qui marque une rupture par rapport à la politique originelle d’Anthropic, qui affirmait vouloir limiter au maximum la collecte et l’usage des données, se différenciant ainsi de certains concurrents comme OpenAI. Pour beaucoup d’observateurs, il s’agissait d’un tournant stratégique, dicté à la fois par la nécessité de rester compétitif et par les exigences financières colossales que représente l’entraînement des modèles de nouvelle génération.

    Pourtant, Anthropic fait face à un recours collectif intenté par des auteurs qui affirmaient que l'entreprise avait volé leurs œuvres pour entraîner ses modèles d'IA. La société d'IA a alors accepté de verser 1,5 milliard de dollars pour régler le conflit. Selon les avocats des auteurs, cet accord serait le plus important recouvrement de droits d'auteur jamais rendu public. Anthropic a déclaré que l'accord « résoudrait les réclamations restantes des plaignants ». Cependant, le juge fédéral américain William Alsup a rejetté l'accord.


    Voici un extrait de l'annonce d'Anthropic :

    Claude Sonnet 4.5 est le meilleur modèle de codage au monde. C'est le modèle le plus puissant pour créer des agents complexes. C'est le meilleur modèle pour utiliser des ordinateurs. Et il affiche des gains substantiels en matière de raisonnement et de mathématiques.

    Le code est partout. Il fait fonctionner toutes les applications, feuilles de calcul et outils logiciels que vous utilisez. Être capable d'utiliser ces outils et de résoudre des problèmes complexes, c'est ainsi que le travail moderne est accompli.

    Claude Sonnet 4.5 rend cela possible. Nous le lançons en même temps qu'une série de mises à jour majeures de nos produits. Dans Claude Code, nous avons ajouté des points de contrôle, l'une des fonctionnalités les plus demandées, qui enregistrent votre progression et vous permettent de revenir instantanément à un état précédent. Nous avons actualisé l'interface du terminal et livré une extension VS Code native. Nous avons ajouté une nouvelle fonctionnalité d'édition de contexte et un outil de mémoire à l'API Claude qui permettent aux agents de fonctionner encore plus longtemps et de gérer des tâches encore plus complexes. Dans les applications Claude, nous avons intégré l'exécution de code et la création de fichiers (feuilles de calcul, diapositives et documents) directement dans la conversation. Et nous avons mis l'extension Claude pour Chrome à la disposition des utilisateurs Max qui se sont inscrits sur la liste d'attente le mois dernier.

    Nous fournissons également aux développeurs les éléments de base que nous utilisons nous-mêmes pour créer Claude Code. Nous l'appelons le SDK Claude Agent. L'infrastructure qui alimente nos produits de pointe et leur permet d'atteindre leur plein potentiel est désormais à votre disposition pour que vous puissiez la développer.

    Il s'agit du modèle de pointe le plus aligné que nous ayons jamais publié, présentant d'importantes améliorations dans plusieurs domaines d'alignement par rapport aux modèles Claude précédents.

    Claude Sonnet 4.5 est disponible partout dès aujourd'hui. Si vous êtes développeur, il vous suffit d'utiliser claude-sonnet-4-5 via l'API Claude. Le prix reste le même que celui de Claude Sonnet 4, soit 3 $/15 $ par million de jetons.
    Intelligence de pointe

    Claude Sonnet 4.5 est à la pointe de la technologie selon l'évaluation SWE-bench Verified, qui mesure les capacités de codage logiciel dans le monde réel. Selon les testes, il restait concentré pendant plus de 30 heures sur des tâches complexes en plusieurs étapes.

    Nom : 1.jpg
Affichages : 17102
Taille : 32,1 Ko

    Claude Sonnet 4.5 représente une avancée significative dans l'utilisation des ordinateurs. Sur OSWorld, un benchmark qui teste les modèles d'IA sur des tâches informatiques réelles, Sonnet 4.5 est désormais en tête avec 61,4 %. Il y a seulement quatre mois, Sonnet 4 était en tête avec 42,2 %. Le modèle montre également des capacités améliorées dans un large éventail d'évaluations, notamment en matière de raisonnement et de mathématiques :

    Nom : 2.jpg
Affichages : 5779
Taille : 95,9 Ko

    Le modèle le plus aligné à ce jour d'Anthropic

    En plus d'être le modèle le plus performant, Claude Sonnet 4.5 est le modèle de pointe le plus aligné à ce jour d'Anthropic. Les capacités améliorées de Claude et sa formation approfondie en matière de sécurité ont permis d'améliorer le comportement du modèle, en réduisant les comportements préoccupants tels que la flagornerie, la tromperie, la recherche du pouvoir et la tendance à encourager les pensées délirantes. En ce qui concerne les capacités d'agent et d'utilisation informatique du modèle, le modèle a également fait des progrès dans la défense contre les attaques par injection de prompt, l'un des risques les plus graves pour les utilisateurs de ces capacités.

    Nom : 3.jpg
Affichages : 5752
Taille : 31,4 Ko

    Claude Sonnet 4.5 est commercialisé sous la protection AI Safety Level 3 (ASL-3). Ces mesures de sécurité comprennent des filtres appelés classificateurs qui visent à détecter les entrées et sorties potentiellement dangereuses, en particulier celles liées aux armes chimiques, biologiques, radiologiques et nucléaires (CBRN).

    Le SDK Claude Agent

    Des mises à jour de Claude Code sont désormais disponible. Ces mises à jour comprennent : comment les agents doivent gérer la mémoire dans le cadre de tâches de longue durée, comment gérer les systèmes d'autorisation qui équilibrent l'autonomie et le contrôle de l'utilisateur, et comment coordonner les sous-agents travaillant vers un objectif commun.


    Le SDK Claude Agent repose sur la même infrastructure que Claude Code, mais il offre des avantages pour une grande variété de tâches, et pas seulement pour le codage. À partir d'aujourd'hui, vous pouvez l'utiliser pour créer vos propres agents.

    Aperçu bonus de la recherche

    Anthropic publie un aperçu temporaire de la recherche parallèlement à Claude Sonnet 4.5, intitulé « Imagine with Claude ».


    Dans cette expérience, Claude génère des logiciels à la volée. Aucune fonctionnalité n'est prédéterminée, aucun code n'est pré-écrit. Ce que vous voyez, c'est Claude qui crée en temps réel, répondant et s'adaptant à vos demandes au fur et à mesure que vous interagissez.

    Il s'agit d'une démonstration amusante qui montre ce que Claude Sonnet 4.5 peut faire, une façon de voir ce qui est possible lorsque vous combinez un modèle performant avec la bonne infrastructure.

    Source : Anthropic

    Et vous ?

    Pensez-vous que cette annonce est crédible ou pertinente ?
    Quel est votre avis sur le sujet ?

    Voir aussi :

    Anthropic lance Claude Opus 4.1 avec des améliorations en matière de codage, de raisonnement et de débogage pour répondre aux besoins en manipulation précise du code et en recherches avancées des utilisateurs

    Anthropic a clôturé une nouvelle levée de fonds 13 milliards de $, portant la valorisation de l'entreprise à 183 milliards de $. Une somme colossale qui gonfle encore plus la bulle IA

    Un juge rejette l'accord à 1,5 milliard de dollars conclu par Anthropic concernant un recours collectif sur les droits d'auteur de près d'un demi-million de livres piratés pour former des chatbots
    Publication de communiqués de presse en informatique. Contribuez au club : corrections, suggestions, critiques, ... Contactez le service news et Rédigez des actualités

  2. #2
    Communiqués de presse

    Homme Profil pro
    Rédacteur technique
    Inscrit en
    Avril 2025
    Messages
    463
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Rédacteur technique

    Informations forums :
    Inscription : Avril 2025
    Messages : 463
    Par défaut Anthropic introduit plusieurs améliorations à Claude Code alimenté par Sonnet 4.5
    Anthropic introduit des améliorations à Claude Code alimenté par Sonnet 4.5 : une extension native VS Code, la version 2.0 de l'interface terminale et des points de contrôle pour un fonctionnement autonome

    Anthropic introduit plusieurs améliorations à Claude Code. Alimenté par Sonnet 4.5, Claude Code gère désormais des tâches de développement plus longues et plus complexes dans votre terminal et votre EDI. Anthropic lance une extension native VS Code en version bêta qui intègre Claude Code directement dans votre EDI. Anthropic a également publié une prise en charge SDK pour les sous-agents et les hooks, ce qui le rend plus personnalisable pour la création d'agents adaptés à vos workflows spécifiques. L'interface du terminal de Claude Code a été actualisée.

    Récemment, Anthropic, une start-up américaine spécialisée dans l'intelligence artificielle (IA), a annoncé son dernier modèle d'IA : Claude Sonnet 4.5. Pour information, Anthropic mène des recherches et développe des IA afin « d'étudier leurs propriétés de sécurité à la frontière technologique » et utilise ces recherches pour déployer des modèles sûrs pour le public

    Selon l'annonce, Claude Sonnet 4.5 est plus performant en matière de codage, d'utilisation des ordinateurs et de réponse aux besoins pratiques des entreprises, et il excelle dans des domaines spécialisés tels que la cybersécurité, la finance et la recherche. Claude Sonnet 4.5 est plus petit que Claude Opus 4.1, mais plus intelligent que lui « à presque tous les égards ». « Les gens remarquent simplement avec ce modèle, parce qu'il est plus intelligent et plus proche d'un collègue, qu'il est assez agréable de travailler avec lui lorsqu'on rencontre des problèmes et qu'on les résout », a déclaré Jared Kaplan, cofondateur et directeur scientifique d'Anthropic.

    Avec cette annonce, Anthropic introduit plusieurs améliorations à Claude Code : une extension native VS Code, la version 2.0 de l'interface terminal et des points de contrôle pour un fonctionnement autonome. Alimenté par Sonnet 4.5, Claude Code gère désormais des tâches de développement plus longues et plus complexes dans votre terminal et votre EDI.


    Claude Code est l'outil de codage agentique d'Anthropic qui réside dans votre terminal et vous aide à transformer vos idées en code. Claude Code permet de créer des fonctionnalités à partir de descriptions en anglais courant. Claude Code est également capable de déboguer et corriger les problèmes, de naviguer dans n'importe quelle base de code et d'automatiser les tâches fastidieuses.

    Extension VS Code

    Anthropic lance une extension native VS Code en version bêta qui intègre Claude Code directement dans votre EDI. Vous pouvez désormais voir les modifications apportées par Claude en temps réel grâce à un panneau latéral dédié avec des différences en ligne. L'extension offre une expérience Claude Code plus riche et plus graphique aux utilisateurs qui préfèrent travailler dans des IDE plutôt que dans des terminaux.


    Expérience de terminal améliorée

    L'interface du terminal de Claude Code a été actualisée. L'interface mise à jour offre une meilleure visibilité du statut et un historique des invites consultable (Ctrl+r), ce qui facilite la réutilisation ou la modification des invites précédentes.

    Nom : 1.jpg
Affichages : 29553
Taille : 42,6 Ko

    SDK Claude Agent

    Pour les équipes qui souhaitent créer des expériences agentifiques personnalisées, le SDK Claude Agent (anciennement SDK Claude Code) donne accès aux mêmes outils de base, systèmes de gestion de contexte et cadres d'autorisations qui alimentent Claude Code. Anthropic a également publié une prise en charge SDK pour les sous-agents et les hooks, ce qui le rend plus personnalisable pour la création d'agents adaptés à vos workflows spécifiques.

    Les développeurs créent déjà des agents pour un large éventail de cas d'utilisation avec le SDK, notamment des agents de conformité financière, des agents de cybersécurité et des agents de débogage de code.


    Exécutez des tâches de longue durée en toute confiance

    Alors que Claude Code prend en charge des tâches de plus en plus complexes, nous lançons une fonctionnalité de point de contrôle pour vous aider à déléguer des tâches à Claude Code en toute confiance tout en gardant le contrôle. Combiné aux récentes fonctionnalités, Claude Code est désormais plus apte à gérer des tâches sophistiquées.

    Points de contrôle

    Le développement complexe implique souvent de l'exploration et des itérations. Le nouveau système de points de contrôle enregistre automatiquement l'état de votre code avant chaque modification, et vous pouvez revenir instantanément aux versions précédentes en appuyant deux fois sur la touche Esc ou en utilisant la commande /rewind. Les points de contrôle vous permettent de vous lancer dans des tâches plus ambitieuses et à plus grande échelle, sachant que vous pouvez toujours revenir à un état antérieur du code.

    Lorsque vous revenez à un point de contrôle, vous pouvez choisir de restaurer le code, la conversation ou les deux à leur état antérieur. Les points de contrôle s'appliquent aux modifications apportées par Claude et non aux modifications apportées par l'utilisateur ou aux commandes bash. Il est recommandé de les utiliser en combinaison avec le contrôle de version.

    Sous-agents, hooks et tâches en arrière-plan

    Les points de contrôle sont particulièrement utiles lorsqu'ils sont combinés avec les dernières fonctionnalités de Claude Code qui permettent un travail autonome :

    • Les sous-agents délèguent des tâches spécialisées, comme le lancement d'une API backend pendant que l'agent principal construit le frontend, ce qui permet des workflows de développement parallèles.
    • Les hooks déclenchent automatiquement des actions à des moments précis, comme l'exécution de votre suite de tests après des modifications du code ou le linting avant les commits.
    • Les tâches en arrière-plan maintiennent actifs les processus de longue durée, tels que les serveurs de développement, sans bloquer la progression de Claude Code sur d'autres tâches.

    Ensemble, ces fonctionnalités vous permettent de déléguer en toute confiance à Claude Code des tâches importantes telles que des refactorisations approfondies ou l'exploration de fonctionnalités.

    Pour commencer

    Ces mises à jour sont désormais disponibles pour les utilisateurs de Claude Code.

    • Claude Sonnet 4.5 est le nouveau modèle par défaut dans Claude Code. Exécutez /model pour changer de modèle.
    • Extension VS Code (bêta) : téléchargez-la depuis le VS Code Extension Marketplace pour commencer.
    • Les mises à jour du terminal, y compris l'actualisation visuelle et les points de contrôle, sont disponibles pour tous les utilisateurs de Claude Code. Il vous suffit de mettre à jour votre installation locale.
    • Claude Agent SDK : consultez la documentation pour commencer.


    Source : Anthropic

    Et vous ?

    Pensez-vous que cette annonce est crédible ou pertinente ?
    Quel est votre avis sur le sujet ?

    Voir aussi :

    Claude Code est désormais disponible pour les abonnés aux formules Pro et Max, permettant des workflows de codage directs basés sur un terminal et vous permettant de déléguer des tâches de codage complexes

    Anthropic bride l'accès à Claude Code, accusant une minorité de développeurs de laisser Claude tourner en permanence ou de partager ou revendre leurs accès, s'attirant les foudres de la majorité

    Système de gestion de projet pour Claude Code, un workflow léger permettant d'organiser le développement basé sur l'IA et de réduire de moitié environ le temps de livraison
    Publication de communiqués de presse en informatique. Contribuez au club : corrections, suggestions, critiques, ... Contactez le service news et Rédigez des actualités

  3. #3
    Chroniqueur Actualités
    Avatar de Anthony
    Homme Profil pro
    Rédacteur technique
    Inscrit en
    Novembre 2022
    Messages
    2 009
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Gironde (Aquitaine)

    Informations professionnelles :
    Activité : Rédacteur technique

    Informations forums :
    Inscription : Novembre 2022
    Messages : 2 009
    Par défaut Claude Sonnet 4.5 d'Anthropic a développé une application de chat similaire à Slack en seulement 30 heures
    L'IA Claude Sonnet 4.5 d'Anthropic a développé de manière autonome une application de chat entièrement fonctionnelle similaire à Slack en 30 heures, générant 11 000 lignes de code sans aucune intervention

    Le modèle d'intelligence artificielle (IA) Claude Sonnet 4.5 d'Anthropic a développé de manière autonome une application de messagerie similaire à Slack en seulement 30 heures, générant environ 11 000 lignes de code sans aucune intervention. Cette prouesse marque une avancée significative par rapport à son prédécesseur, Claude Opus 4, et souligne le potentiel de la technologie à remodeler le secteur du développement logiciel, malgré les préoccupations éthiques liées à la suppression d'emplois dans ce domaine.

    Anthropic PBC est une start-up américaine spécialisée dans l'IA fondée en 2021 par d'anciens membres d'OpenAI. Elle développe une famille de grands modèles de langage (LLM) baptisée Claude. Selon l'entreprise, Anthropic mène des recherches et développe des IA afin « d'étudier leurs propriétés de sécurité à la frontière technologique » et utilise ces recherches pour déployer des modèles sûrs pour le public. En septembre 2025, Anthropic a été la quatrième entreprise privée la plus valorisée au monde, avec une valeur estimée à plus de 183 milliards de dollars.

    Pour rappel, Claude Sonnet 4.5 a été lancé par Anthropic à la fin du mois de septembre 2025. L'entreprise décrit ce modèle d'intelligence artificielle comme étant plus performant que ses prédécesseurs en matière de codage, d'utilisation des ordinateurs et de réponse aux besoins pratiques des entreprises. Selon Mike Krieger, directeur produit chez Anthropic, Claude Sonnet 4.5 est plus petit que Claude Opus 4.1, mais plus intelligent que ce dernier « à presque tous les égards ».

    Dans une démonstration remarquable des capacités évolutives de l'IA, Anthropic a dévoilé que son dernier modèle Claude Sonnet 4.5 a construit de manière autonome une application de chat entièrement fonctionnelle, similaire à Slack ou Microsoft Teams, au cours d'une session continue de 30 heures. L'IA a généré environ 11 000 lignes de code, ne s'arrêtant qu'une fois la tâche terminée. Cette prouesse représente une avancée considérable par rapport à son prédécesseur, le modèle Opus 4, qui ne pouvait fonctionner que pendant des durées plus courtes avant de nécessiter une intervention humaine.

    Cette expérience montre comment l'IA repousse les limites du développement logiciel, pouvant potentiellement transformer la manière dont les ingénieurs abordent les projets complexes.

    Les ingénieurs d'Anthropic ont fourni au modèle des spécifications de haut niveau pour une plateforme de messagerie, notamment la communication en temps réel, l'authentification des utilisateurs et la gestion des canaux. Sans autres instructions, Claude Sonnet 4.5 a procédé à l'architecture du système, en écrivant du code dans des langages tels que JavaScript et Python, en intégrant des bases de données et même en gérant les configurations de déploiement.


    Codage autonome : un bond en avant en matière d'endurance et de complexité de l'IA

    Cette durée d'exécution prolongée souligne une innovation clé dans la conception du modèle : des algorithmes améliorés de rétention du contexte et de prise de décision qui lui permettent de rester concentré pendant de longues périodes, surpassant de loin les itérations précédentes qui s'épuisaient après quelques heures seulement. Les observateurs du secteur notent qu'une telle autonomie pourrait accélérer le prototypage dans les entreprises technologiques, où les pressions liées aux délais de mise sur le marché sont intenses.

    Les détails de la session révèlent l'approche méthodique de l'IA, qui décompose l'application de type Slack en composants modulaires. Elle a commencé par l'infrastructure backend, en intégrant WebSocket pour les mises à jour en temps réel, puis a ajouté des éléments frontend à l'aide de frameworks tels que React. La capacité du modèle à déboguer et à itérer en interne, sans invites externes, suggère un comportement « agentique » mature, dans lequel l'IA agit davantage comme un ingénieur autonome.

    Du prototype à la production : implications pour le génie logiciel

    Anthropic affirme que cette version est suffisamment robuste pour créer des applications prêtes à être mises en production, et pas seulement des prototypes. Cela positionne Claude Sonnet 4.5 comme un leader dans les benchmarks de codage, surpassant ses concurrents tels que Gemini de Google dans les tâches nécessitant un raisonnement soutenu.

    Les comparaisons avec les modèles précédents sont frappantes. Alors qu'Opus 4 pouvait refactoriser du code pendant environ sept heures, le marathon de 30 heures de la nouvelle version démontre des améliorations exponentielles en termes d'efficacité et de volume de production. Les développeurs qui expérimentent des outils similaires ont partagé des anecdotes sur l'IA générant des milliers de lignes pour des clones d'applications telles que Sentry, bien que cela ne se fasse pas sans quelques limitations contextuelles occasionnelles.

    Défis et considérations éthiques liés au développement basé sur l'IA

    Malgré l'enthousiasme suscité, les experts mettent en garde contre les pièges potentiels, notamment les incohérences dans la qualité du code et le risque de propagation des biais dans les systèmes automatisés. Anthropic a mis l'accent sur les mesures de protection, mais la généralisation de cette technologie soulève des questions quant à la suppression d'emplois dans le domaine du codage.

    L'ensemble du secteur en prend bonne note, et les concurrents s'empressent de rattraper leur retard. Les publications sur X de développeurs tels que ceux qui créent des wrappers autour du SDK de Claude illustrent un écosystème en pleine croissance, où les outils d'IA sont intégrés dans les flux de travail pour une itération rapide. Comme l'a confié un ingénieur anonyme sur la plateforme, grâce à des modèles comme celui-ci, la mise en service de fonctionnalités qui prenait auparavant des semaines ne prend désormais que quelques heures.

    Perspectives d'avenir : étendre l'autonomie de l'IA au-delà de 30 heures

    À l'avenir, la feuille de route d'Anthropic laisse entrevoir des sessions autonomes encore plus longues, susceptibles de révolutionner la création de logiciels d'entreprise. Pour les initiés, il ne s'agit pas seulement de lignes de code, mais d'un signe que l'IA pourrait bientôt prendre en charge des cycles de développement de bout en bout, de la conception au déploiement, modifiant ainsi fondamentalement l'économie de l'innovation technologique.

    La récente expérience d'Anthropic s’inscrit dans une continuité d’initiatives menées par l'entreprise autour de son écosystème de modèles d'IA. Anthropic a en effet récemment introduit des améliorations à Claude Code, alimenté par Sonnet 4.5. Ces améliorations comprennent notamment une extension native VS Code qui intègre Claude Code directement dans l'EDI, la version 2.0 de l'interface du terminal et des points de contrôle pour un fonctionnement autonome, ainsi que la capacité de Claude Code à gérer des tâches de développement plus longues et plus complexes.

    Cette course technologique soulève toutefois de profondes inquiétudes. Dario Amodei, le PDG d’Anthropic, a récemment averti qu’une « hécatombe des travailleurs du savoir » se préparait. Selon lui, la technologie que lui et d'autres sociétés sont en train de mettre au point pourrait faire disparaître la moitié des emplois de bureau de niveau débutant dans les cinq prochaines années. Il a également déclaré que « l'IA commence à devenir meilleure que les humains dans presque toutes les tâches intellectuelles. » Sommes-nous en train d'assister au grand remplacement des salariés de bureau par l'IA ?

    Et vous ?

    Quel est votre avis sur le sujet ?
    Trouvez-vous cette initiative d'Anthropic crédible ou pertinente ?
    Pensez-vous que ces avancées permettront de réduire considérablement les délais de mise sur le marché pour les entreprises technologiques ?

    Voir aussi :

    Le « premier ingénieur logiciel IA » loin d'être à la hauteur : Devin a un taux de réussite de 15 %, des chercheurs notent que l'IA prend des jours pour faire des tâches simples qui auraient pris des heures

    L'IA peut écrire du code mais ne parvient pas à le comprendre, selon une étude d'OpenAI. Testés sur des tâches réelles de programmation, les modèles les plus avancés n'ont pu résoudre qu'un quart des défis

    Une étude révèle que les outils d'IA de codage ralentissent les développeurs tout en leur donnant l'illusion d'être plus rapides, ils ont mis 19 % plus de temps à accomplir les tâches de codage
    Contribuez au club : corrections, suggestions, critiques, ... Contactez le service news et Rédigez des actualités

  4. #4
    Membre éprouvé
    Avatar de Matthieu Vergne
    Homme Profil pro
    Consultant IT, chercheur IA indépendant
    Inscrit en
    Novembre 2011
    Messages
    2 418
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Consultant IT, chercheur IA indépendant
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Novembre 2011
    Messages : 2 418
    Billets dans le blog
    3
    Par défaut
    Je vois beaucoup d'affirmations gratuites, mais il n'y a qu'une seule chose que je ne vois pas : où est le rapport de test ? Non parce que c'est bien beau d'envoyer un cahier des charges dans le Cloud puis de recevoir en retour un executable après 30h. Mais cela n'a aucun intérêt si l'exécutable n'est pas testé pour confirmer qu'il répond au cahier des charges. Les benchmarks généraux, c'est bien joli, mais ce qui m'importe c'est qu'il réponde au besoin du cahier des charges (fonctions, perfs, sécu, etc.), pas qu'il soit bon à Coding Game.

    La vidéo de l'article est très parlante à 8:10, le gars dit "après cette vidéo je vais m'empresser de faire plein d'agents avec"... Nan mais c'est avant qu'il faut tester, pour savoir si c'est de la poudre aux yeux ou pas. Sauf que non, cette personne paye pour l'abonnement Claude pour pouvoir l'utiliser ($100/mois, sinon elle ne pourrait pas montrer ce qu'elle montre dans la vidéo), et elle doit rentabiliser son investissement, donc faut qu'elle sorte vite une vidéo sur le sujet pour être la première à en parler et se faire monétiser. Tester, vérifier, et modérer les propos une fois qu'on voit ce qu'il en est réellement, c'est après la hype.

    J'y vois beaucoup de "wow", mais rien de solide. Et le "wow", ça fait des années qu'on nous en gave, mais le solide, on peine toujours à le voir arriver.
    Site perso
    Recommandations pour débattre sainement

    Références récurrentes :
    The Cambridge Handbook of Expertise and Expert Performance
    L’Art d’avoir toujours raison (ou ce qu'il faut éviter pour pas que je vous saute à la gorge {^_^})

  5. #5
    Membre très actif

    Profil pro
    Inscrit en
    Mai 2003
    Messages
    360
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mai 2003
    Messages : 360
    Billets dans le blog
    1
    Par défaut
    Allons même plus loin que les cahiers de tests... Où sont les applications déployées et utilisées ?

    Pourquoi OpenIA/Claude ne dit pas : "voici telle application qui a été développée par l'IA et qui compte plus de 10 000 utilisateurs actifs par mois" ?

    Ce serait dans leur intérêt de montrer que ça fonctionne jusqu'au bout, jusqu'à l'usage en condition réelle... Quitte même à tricher un peu en faisant des parties à la main.

    Sauf que ça oublie un truc : c'est un enfer de faire des grosses évolutions sur un programme que l'on n'a pas écrit. Et les LLM perdent la tête à partir d'un certain volume de complexité.

  6. #6
    Membre éprouvé
    Avatar de Matthieu Vergne
    Homme Profil pro
    Consultant IT, chercheur IA indépendant
    Inscrit en
    Novembre 2011
    Messages
    2 418
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Consultant IT, chercheur IA indépendant
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Novembre 2011
    Messages : 2 418
    Billets dans le blog
    3
    Par défaut
    Citation Envoyé par JackIsJack Voir le message
    Allons même plus loin que les cahiers de tests... Où sont les applications déployées et utilisées ?
    L'application déployée, on pourra toujours te dire que ça demande des ressource pour le faire tourner, que c'est pas là où se trouve l'expertise de la boîte, ni l'objectif de l'expérience, etc. Tout l'intérêt du rapport de test est que ça ne coûte que l'écriture des tests sur la base du cahier des charges qu'ils maîtrisent (puisqu'ils le fournissent), l'exécution ne se faisant qu'avec une ou quelques lignes de commande. Et on ne me fera pas croire qu'une équipe de dév n'a pas l'expertise pour écrire des tests et des commandes.

    Si c'est juste un prompt type "Fait moi une application type Slack" et après 30h ils demandent "As-tu fini" et l'agent répond "oui", la seule chose à faire valoir est que l'agent a tenu 30h a produire du code sans exploser (mais sans savoir ce qu'il a vraiment produit).
    Site perso
    Recommandations pour débattre sainement

    Références récurrentes :
    The Cambridge Handbook of Expertise and Expert Performance
    L’Art d’avoir toujours raison (ou ce qu'il faut éviter pour pas que je vous saute à la gorge {^_^})

  7. #7
    Membre chevronné
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Septembre 2019
    Messages
    319
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Morbihan (Bretagne)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Septembre 2019
    Messages : 319
    Par défaut
    Plutôt que de lui faire développer une application à la noix, ce serait plus intéressant de lui faire développer un budget de l'Etat français à l'équilibre (ou mieux, en excédent), ce qui nous permettrait par la suite de nous débarrasser des inutiles politiques. Voilà une application de l'IA qui serait intéressante !

  8. #8
    Membre extrêmement actif Avatar de Mister Nono
    Homme Profil pro
    Ingénieur Mathématiques et Informatique
    Inscrit en
    Septembre 2002
    Messages
    2 255
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Ingénieur Mathématiques et Informatique
    Secteur : Santé

    Informations forums :
    Inscription : Septembre 2002
    Messages : 2 255
    Par défaut
    Il faudrait demander à Claude d'écrire une IA Claude plus performante puisque écrite par l'IA.

  9. #9
    Nouveau candidat au Club
    Homme Profil pro
    Enseignant Chercheur
    Inscrit en
    Février 2022
    Messages
    4
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Suisse

    Informations professionnelles :
    Activité : Enseignant Chercheur
    Secteur : Enseignement

    Informations forums :
    Inscription : Février 2022
    Messages : 4
    Par défaut considérations éthiques
    J'aime le ton général des commentaires qui relèvent les incohérences et manquements de cette annonce marketing de produit.

    À ce propos je suis impressionné comme l'entreprise réduit les enjeux éthiques à la seule question de la qualité du travail et de la suppression d'emploi.

    Premièrement de nombreuses autres enjeux éthiques autour de ce produit existe: exploitation du travail humain derrière les données, exploitation des individus pour corriger le modèle, exploitation des ressources naturelles et toute l'instabilité géopolitique qu'elle cause, en sus de toute l'énergie grise nécessaire pour le développement de l'outil, la consommation d'énergie pour utiliser l'outil et aussi la question du financement de la tech (techno-fascisme), et j'en oublie...

    Deuxièmement on nous affirme simultanément que ce produit est livré avec aucune garantie qualité, sujet à bug et cybermenaces, et qu'il va mettre des dev au chômage.

    Dans quels autres secteurs d'activité une entreprise peut-elle se permettre de souffler le vent chaud et froid avec autant d'assurance et si peu de raison?

Discussions similaires

  1. Réponses: 0
    Dernier message: 11/08/2025, 14h30
  2. Réponses: 0
    Dernier message: 09/06/2025, 18h15
  3. Réponses: 4
    Dernier message: 22/11/2023, 08h36
  4. Réponses: 0
    Dernier message: 08/09/2023, 08h35
  5. Anthropic lance Claude Instant 1.2 avec une longueur de contexte de 100 000
    Par Jade Emy dans le forum Intelligence artificielle
    Réponses: 0
    Dernier message: 11/08/2023, 10h22

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo