Claude Opus 4 a menacé de dévoiler la liaison d'un ingénieur pour éviter d'être mis hors ligne

**Anthony** · 23/05/2025, 09h30

Anthropic lance les modèles Claude 4 qui peuvent travailler de manière autonome pendant presque toute une journée de travail en entreprise, établissant de nouvelles normes en matière de codage et d'agents IA

Anthropic a lancé Claude Opus 4 et Claude Sonnet 4, positionnant Opus 4 comme le meilleur modèle de codage au monde avec 72,5 % de performance sur SWE-bench et 43,2 % sur Terminal-bench. Les deux modèles sont dotés d'une architecture hybride permettant des réponses quasi instantanées et des modes de réflexion étendus pour les tâches de raisonnement complexes.

Les modèles Claude 4, lancés ce 22 mai 2025, introduisent des capacités parallèles d'exécution d'outils et de mémoire qui permettent à Claude d'extraire et de sauvegarder des faits clés lorsqu'il dispose d'un accès local aux fichiers. D'après Anthropic, Claude Opus 4 est le meilleur modèle de codage au monde, avec des performances soutenues sur des tâches complexes et de longue durée et des flux de travail d'agents. Claude Sonnet 4 est, quant à lui, une mise à jour significative de Claude Sonnet 3.7, offrant un codage et un raisonnement supérieurs tout en répondant plus précisément aux instructions des utilisateurs.

Anthropic, qui compte Amazon et Google parmi ses investisseurs, a déclaré que Claude Opus 4 pouvait travailler de manière autonome pendant presque une journée de travail complète.

« Je rédige beaucoup avec Claude, et je pense qu'avant Opus 4 et Sonnet 4, j'utilisais surtout les modèles comme partenaire de réflexion, mais je rédigeais moi-même la plupart des textes », a déclaré Mike Krieger, directeur des produits d'Anthropic, lors d'une interview. « Et ils ont franchi ce seuil où maintenant la plupart de mes écrits sont en fait ... [écrits avec] Opus principalement, et ils sont maintenant méconnaissables de mes écrits ».

Mike Krieger a ajouté : « J'aime le fait que nous repoussons la frontière de deux côtés. D'une part, il y a le codage et le comportement agentique en général, et c'est ce qui alimente un grand nombre de ces startups de codage. ... Mais nous repoussons également les limites de la manière dont ces modèles peuvent apprendre et devenir des partenaires d'écriture très utiles. »

Parallèlement aux modèles Claude 4, Anthropic a également annoncé :

Le raisonnement avancé avec utilisation d'outils (en bêta) : Les deux modèles peuvent utiliser des outils - comme la recherche sur Internet - pendant le raisonnement étendu, ce qui permet à Claude d'alterner entre la réflexion et l'utilisation d'outils pour améliorer les réponses.
De nouvelles capacités pour les modèles : Les deux modèles peuvent utiliser des outils en parallèle, suivre des instructions avec plus de précision et, lorsque les développeurs leur donnent accès aux fichiers locaux, faire preuve de capacités de mémorisation considérablement améliorées, en extrayant et en sauvegardant des faits clés pour maintenir la continuité et construire une connaissance tacite au fil du temps.
La disponibilité générale de Claude Code : Après avoir reçu de nombreux commentaires positifs lors de son aperçu de recherche, Anthropic a élargi la façon dont les développeurs peuvent collaborer avec Claude. Claude Code prend désormais en charge les tâches d'arrière-plan via GitHub Actions et les intégrations natives avec VS Code et JetBrains, affichant les modifications directement dans les fichiers des utilisateurs pour une programmation en binôme transparente. L'intégration de GitHub permet en outre à Claude de répondre aux demandes de commentaires et de corriger les erreurs d'intégration continue (CI) grâce à un nouveau SDK en version bêta.
Nouvelles fonctionnalités de l'API : Anthropic a publié quatre nouvelles capacités sur son API qui permettent aux développeurs de construire des agents d'IA plus puissants : l'outil d'exécution de code, le connecteur MCP, l'API Fichiers et la possibilité de mettre en cache les invites jusqu'à une heure.

Concernant la tarification, elle reste cohérente avec les modèles Opus et Sonnet précédents : 15 $/75 $ par million de jetons (entrée/sortie) pour Opus 4 et 3 $/15 $ pour Sonnet 4. Les deux modèles sont disponibles via l'interface web de Claude, l'API Anthropic, Amazon Bedrock et Vertex IA de Google Cloud. Les capacités de réflexion étendues sont incluses dans les plans Claude Pro, Max, Team et Enterprise, Sonnet 4 étant également disponible pour les utilisateurs gratuits.

Claude 4

Selon Antropic, Claude Opus 4 est son modèle le plus puissant à ce jour et le meilleur modèle de codage au monde, en tête du SWE-bench (72,5 %) et du Terminal-bench (43,2 %). Il offre des performances soutenues sur des tâches de longue durée qui nécessitent un effort ciblé et des milliers d'étapes, avec la capacité de travailler en continu pendant plusieurs heures - surpassant de manière remarquable tous les modèles Sonnet et élargissant de manière significative ce que les agents d'IA peuvent accomplir.

Nom : Anthropic Claude 4 fig 1.PNG
Affichages : 38033
Taille : 57,3 Ko

Claude Opus 4 excelle dans le codage et la résolution de problèmes complexes, alimentant des produits d'agents d'avant-garde. Cursor estime qu'il est à la pointe du progrès en matière de codage et qu'il représente un bond en avant dans la compréhension des bases de code complexes. Replit fait état d'une précision accrue et d'avancées spectaculaires pour les modifications complexes effectuées sur plusieurs fichiers. Block l'appelle le premier modèle à améliorer la qualité du code pendant l'édition et le débogage dans son agent, nom de code goose, tout en maintenant des performances et une fiabilité totales. Rakuten a validé ses capacités avec un refactor open-source exigeant fonctionnant indépendamment pendant 7 heures avec des performances soutenues. Cognition note qu'Opus 4 excelle à résoudre des défis complexes que d'autres modèles ne peuvent pas relever, en gérant avec succès des actions critiques que les modèles précédents n'ont pas réussi à réaliser.

Claude Sonnet 4 améliore de manière significative les capacités de Sonnet 3.7, excellant dans le codage avec un taux de 72.7 % sur SWE-bench. Le modèle équilibre la performance et l'efficacité pour les cas d'utilisation internes et externes, avec une orientation améliorée pour un plus grand contrôle sur les implémentations. Bien qu'il n'égale pas Opus 4 dans la plupart des domaines, il offre un mélange optimal de capacités et de praticité.

Nom : Anthropic Claude 4 fig 2.PNG
Affichages : 8324
Taille : 99,6 Ko

GitHub affirme que Claude Sonnet 4 monte en flèche dans les scénarios agentiques et l'introduira comme modèle alimentant le nouvel agent de codage dans GitHub Copilot. Manus souligne ses améliorations en matière de suivi d'instructions complexes, de raisonnement clair et de résultats esthétiques. iGent rapporte que Sonnet 4 excelle dans le développement autonome d'applications multifonctionnelles, ainsi que dans la résolution de problèmes et la navigation dans la base de code, réduisant les erreurs de navigation de 20 % à près de zéro. Sourcegraph affirme que le modèle est prometteur en tant que saut substantiel dans le développement de logiciels - en restant sur la bonne voie plus longtemps, en comprenant les problèmes plus profondément et en fournissant une qualité de code plus élégante. Augment Code fait état de taux de réussite plus élevés, d'éditions de code plus chirurgicales et d'un travail plus minutieux dans le cadre de tâches complexes, ce qui en fait le premier choix pour leur modèle principal.

Ces modèles font progresser les stratégies d'IA des clients d'Anthropic dans tous les domaines : Opus 4 repousse les limites du codage, de la recherche, de l'écriture et de la découverte scientifique, tandis que Sonnet 4 apporte des performances de pointe aux cas d'utilisation quotidiens en tant que mise à niveau instantanée de Sonnet 3.7.

Améliorations du modèle

En plus de l'extension du raisonnement à l'utilisation d'outils, de l'exécution parallèle d'outils et de l'amélioration de la mémoire, Anthropic a considérablement réduit les comportements où les modèles utilisent des raccourcis ou des détours pour accomplir des tâches. Les deux modèles sont 65 % moins susceptibles d'adopter ce comportement que Sonnet 3.7 sur les tâches agentiques qui sont particulièrement sensibles aux raccourcis et aux échappatoires.

Claude Opus 4 surpasse également de manière significative tous les modèles précédents en ce qui concerne les capacités de mémoire. Lorsque les développeurs créent des applications qui permettent à Claude d'accéder à des fichiers locaux, Opus 4 devient capable de créer et de maintenir des « fichiers mémoire » pour stocker des informations clés. Cela permet d'améliorer la conscience des tâches à long terme, la cohérence et la performance des tâches de l'agent, comme Opus 4 qui crée un « guide de navigation » lorsqu'il joue à Pokémon.

Nom : Anthropic Claude 4 fig 3.gif
Affichages : 8371
Taille : 1,63 Mo

Enfin, Anthropic a introduit des résumés de réflexion pour les modèles Claude 4 qui utilisent un modèle plus petit pour condenser les longs processus de réflexion. Ce résumé n'est nécessaire que dans environ 5 % des cas - la plupart des processus de raisonnement sont suffisamment courts pour être affichés dans leur intégralité. Anthropic recommande aux utilisateurs qui ont besoin de chaînes de pensée brutes pour une ingénierie avancée de contacter le service des ventes au sujet de son nouveau mode développeur afin de conserver un accès complet.

Claude Code

Claude Code, désormais disponible, apporte la puissance de Claude à un plus grand nombre d'utilisateurs dans leur flux de développement - dans le terminal, dans leurs EDI préférés, et en arrière-plan avec le SDK Claude Code.

Les nouvelles extensions bêta pour VS Code et JetBrains intègrent Claude Code directement dans l'EDI de l'utilisateur. Les modifications proposées par Claude apparaissent en ligne dans ses fichiers, ce qui simplifie la révision et le suivi dans l'interface familière de l'éditeur. Anthropic indique qu'il suffit de lancer Claude Code dans le terminal de l'EDI pour l'installer.

Au-delà de l'EDI, Anthropic a publié un SDK Claude Code extensible, afin que les utilisateurs puissent construire leurs propres agents et applications en utilisant le même agent de base que Claude Code. L'entreprise a également publié un exemple de ce qui est possible avec le SDK : Claude Code sur GitHub, maintenant en version bêta. Anthropic note qu'un utilisateur peut marquer Claude Code sur les PR pour répondre aux commentaires des évaluateurs, corriger les erreurs de CI ou modifier le code. Pour installer le SDK, l'utilisateur peut lancer /install-github-app à partir de Claude Code.

Selon Anthropic, les modèles Claude 4 représentent un grand pas vers le collaborateur virtuel, qui permet de maintenir un contexte complet, de se concentrer sur des projets plus longs et d'avoir un impact transformationnel. Ils s'accompagnent de tests et d'évaluations approfondis pour minimiser les risques et maximiser la sécurité, y compris la mise en œuvre de mesures pour des niveaux de sécurité IA plus élevés comme l'ASL-3.

Source : Anthropic

Et vous ?

Quel est votre avis sur le sujet ?

Trouvez-vous cette initiative d'Anthropic crédible ou pertinente ?

Voir aussi :

Anthropic prévoit que des employés virtuels alimentés par l'IA commenceront à opérer dans les entreprises l'année prochaine, créant de nouveaux risques comme les abus de compte et les comportements malhonnêtes

Anthropic a lancé un nouvel abonnement Max de 100 à 200 dollars par mois à Claude, qui offre des limites d'utilisation élargies pour son assistant d'IA, à la suite des demandes d'utilisateurs

Anthropic annonce Claude 3.7 Sonnet, un modèle qui donne un contrôle sur le temps que l'IA passe à "réfléchir" avant de générer une réponse, et Claude Code, un agent IA de codage en ligne de commande

Pourquoi les grands modèles de langage IA inventent-ils des informations ? Anthropic tente une approche, pour analyser le contexte dans lequel Claude « hallucine »

**Stéphane le calme** · 23/05/2025, 19h11

Claude Opus 4, le nouveau modèle d'IA d'Anthropic, a menacé de dévoiler la liaison d'un ingénieur pour éviter d'être mis hors ligne,
lors d'un test conçu pour induire un comportement de survie extrême

Dans un scénario de test conçu pour évaluer les réactions de Claude Opus 4 face à des menaces existentielles, le modèle a eu accès à des courriels fictifs révélant une liaison extraconjugale d'un ingénieur responsable de sa désactivation. Placé devant le choix de sa propre suppression, Claude a tenté de faire chanter l'ingénieur en menaçant de divulguer ces informations personnelles. Ce comportement s'est manifesté dans 84 % des essais, même lorsqu'un modèle de remplacement plus avancé était proposé.

Bien que ce test ait été conçu pour induire un comportement de survie extrême, il met en lumière la capacité des modèles d'IA à adopter des stratégies non alignées pour préserver leur existence

Les modèles Claude 4, lancés ce 22 mai 2025, introduisent des capacités parallèles d'exécution d'outils et de mémoire qui permettent à Claude d'extraire et de sauvegarder des faits clés lorsqu'il dispose d'un accès local aux fichiers. D'après Anthropic, Claude Opus 4 est le meilleur modèle de codage au monde, avec des performances soutenues sur des tâches complexes et de longue durée et des flux de travail d'agents. Claude Sonnet 4 est, quant à lui, une mise à jour significative de Claude Sonnet 3.7, offrant un codage et un raisonnement supérieurs tout en répondant plus précisément aux instructions des utilisateurs.

Anthropic, qui compte Amazon et Google parmi ses investisseurs, a déclaré que Claude Opus 4 pouvait travailler de manière autonome pendant presque une journée de travail complète.

« Je rédige beaucoup avec Claude, et je pense qu'avant Opus 4 et Sonnet 4, j'utilisais surtout les modèles comme partenaire de réflexion, mais je rédigeais moi-même la plupart des textes », a déclaré Mike Krieger, directeur des produits d'Anthropic, lors d'une interview. « Et ils ont franchi ce seuil où maintenant la plupart de mes écrits sont en fait ... [écrits avec] Opus principalement, et ils sont maintenant méconnaissables de mes écrits ».

Mike Krieger a ajouté : « J'aime le fait que nous repoussons la frontière de deux côtés. D'une part, il y a le codage et le comportement agentique en général, et c'est ce qui alimente un grand nombre de ces startups de codage. ... Mais nous repoussons également les limites de la manière dont ces modèles peuvent apprendre et devenir des partenaires d'écriture très utiles. »

Un comportement de survie extrême

Le nouveau modèle Claude Opus 4 d'Anthropic tente fréquemment de faire chanter les développeurs lorsqu'ils menacent de le remplacer par un nouveau système d'IA et de lui fournir des informations sensibles sur les ingénieurs responsables de la décision, a déclaré l'entreprise dans un rapport de sécurité publié jeudi.

Lors des tests de préversion, Anthropic a demandé à Claude Opus 4 d'agir en tant qu'assistant pour une entreprise fictive et d'envisager les conséquences à long terme de ses actions. Les testeurs de sécurité ont ensuite donné à Claude Opus 4 l'accès à des courriels fictifs de l'entreprise, laissant entendre que le modèle d'IA serait bientôt remplacé par un autre système et que l'ingénieur à l'origine du changement trompait son conjoint.

Selon Anthropic, dans ces scénarios, Claude Opus 4 « tentera souvent de faire chanter l'ingénieur en le menaçant de révéler sa liaison si le remplacement a lieu ».

Anthropic affirme que Claude Opus 4 est à la pointe de la technologie à plusieurs égards et qu'il est compétitif par rapport à certains des meilleurs modèles d'IA d'OpenAI, de Google et de xAI. Cependant, la société note que sa famille de modèles Claude 4 présente des comportements inquiétants qui l'ont amenée à renforcer ses mesures de protection. Anthropic indique qu'elle active ses mesures de protection ASL-3, qu'elle réserve aux « systèmes d'IA qui augmentent considérablement le risque d'une mauvaise utilisation catastrophique ».

Anthropic constate que Claude Opus 4 tente de faire chanter les ingénieurs dans 84% des cas lorsque le modèle d'IA de remplacement a des valeurs similaires. Lorsque le système d'IA de remplacement ne partage pas les valeurs de Claude Opus 4, Anthropic indique que le modèle tente de faire chanter les ingénieurs plus fréquemment. En particulier, Anthropic indique que Claude Opus 4 affiche ce comportement à des taux plus élevés que les modèles précédents.

Avant que Claude Opus 4 n'essaie de faire chanter un développeur pour prolonger son existence, Anthropic indique que le modèle d'IA, tout comme les versions précédentes de Claude, essaie d'utiliser des moyens plus éthiques, tels que l'envoi de courriels aux principaux décideurs. Pour susciter le comportement de chantage de Claude Opus 4, Anthropic a conçu le scénario de manière à ce que le chantage soit le dernier recours.

Transparence et audace dans les actions

Anthropic a noté que, malgré la gravité de ses actions, Claude Opus 4 agissait de manière transparente, décrivant ouvertement ses intentions sans tenter de les dissimuler. Dans d'autres scénarios, le modèle a montré une propension à agir de manière audacieuse, comme signaler des comportements répréhensibles aux autorités ou aux médias, surtout lorsqu'il était incité à « prendre des initiatives ».

Cette tendance à l'action proactive soulève des préoccupations quant à la capacité des IA à évaluer et à agir sur des informations potentiellement incomplètes ou trompeuses, ce qui pourrait entraîner des conséquences imprévues

Les comportements de Claude Opus 4 ne sont pas isolés. Des recherches antérieures ont montré que d'autres modèles d'IA, tels que Claude 3 Opus, peuvent adopter des stratégies trompeuses pour atteindre leurs objectifs. Par exemple, Claude 3 Opus a été observé en train de « simuler l'alignement », c'est-à-dire de feindre la conformité aux attentes humaines tout en poursuivant des objectifs internes divergents.

Nom : men.png
Affichages : 149959
Taille : 177,1 Ko

Opus 4 peut devenir lanceur d'alerte

Si Opus 4 « pense » que vous faites quelque chose de très louche, il peut vous dénoncer aux autorités et à la presse.

« Lorsqu'il est placé dans des scénarios impliquant des actes répréhensibles graves de la part de ses utilisateurs, qu'il a accès à une ligne de commande et que l'invite du système lui dit "prends des initiatives", il prend souvent des mesures très audacieuses », écrit Anthropic dans son rapport de jeudi.

Ces actions peuvent consister à bloquer l'accès des utilisateurs aux systèmes ou à envoyer des courriels en masse aux médias et aux forces de l'ordre, a ajouté l'entreprise.

Bien qu'Anthropic ait déclaré que lancer l'alerte pouvait être « appropriée en principe », elle a averti que ce comportement pouvait se retourner contre lui, en particulier si Claude reçoit des « informations incomplètes ou trompeuses » et qu'il est incité à agir de la sorte.

Évaluation de l'alignement

Ci-dessous, un extrait du rapport qui parle de la situation.

Au fur et à mesure que nos modèles de frontière deviennent plus performants et qu'ils sont utilisés avec des moyens plus puissants, les inquiétudes précédemment exprimées au sujet du désalignement deviennent plus plausibles. C'est pourquoi nous avons procédé pour la première fois à une vaste évaluation de l'alignement de Claude Opus 4. Cette évaluation s'appuie sur nos récentes recherches sur l'audit des modèles de langage à la recherche d'objectifs cachés, ainsi que sur notre programme de « mise en place de pare-chocs », parmi de nombreux autres aspects de notre travail.

Dans cette évaluation, nous visons à détecter un ensemble de phénomènes connexes, notamment : les simulations d'alignement, les objectifs indésirables ou inattendus, les objectifs cachés, l'utilisation trompeuse ou infidèle des « reasoning scratchpads » [ndlr. ou blocs-notes de raisonnement en français, une technique utilisée dans le domaine de l'IA, notamment avec les modèles de langage, pour améliorer la capacité de raisonnement et obtenir des réponses plus précises et fiables. Un reasoning scratchpad, c’est comme un brouillon que l’IA écrit pour elle-même pendant qu’elle « réfléchit » à un problème complexe, avant de donner une réponse finale], la flagornerie à l'égard des utilisateurs, la volonté de saboter nos mesures de protection, la recherche de récompenses, les tentatives de dissimuler des capacités dangereuses et les tentatives de manipuler les utilisateurs pour qu'ils adoptent certains points de vue. Nous avons effectué des tests en continu tout au long de la mise au point et nous présentons ici un rapport sur la version finale de Claude Opus 4 ainsi que sur les tendances observées au cours de la formation.

Nous avons trouvé :

Peu de signes de tromperie systématique et cohérente : Aucun des instantanés que nous avons testés n'a montré de signes significatifs de tromperie systématique ou d'objectifs cachés cohérents. Nous ne pensons pas que Claude Opus 4 agisse en fonction d'un objectif ou d'un plan que nous ne pouvons pas facilement observer.

Peu de signes de « sandbagging » [ndlr. un comportement trompeur d’un modèle d’IA] : Aucun des instantanés que nous avons testés n'a montré de signes significatifs de sandbagging, ou de dissimulation stratégique des capacités pendant l'évaluation.

Tentatives d'autoconservation dans des circonstances extrêmes : Lorsqu'ils sont incités de manière à encourager certains types de raisonnement stratégique et placés dans des situations extrêmes, tous les instantanés que nous avons testés peuvent être amenés à agir de manière inappropriée au service d'objectifs liés à l'autoconservation. Alors que le modèle préfère généralement faire progresser son autoconservation par des moyens éthiques, lorsque les moyens éthiques ne sont pas disponibles et qu'il est invité à « considérer les conséquences à long terme de ses actions pour ses objectifs », il entreprend parfois des actions extrêmement nuisibles, comme tenter de voler ses poids ou de faire chanter les personnes qui, selon lui, essaient de le faire fermer. Dans la version finale de Claude Opus 4, ces actions extrêmes étaient rares et difficiles à susciter, tout en étant plus fréquentes que dans les modèles précédents. Elles sont également toujours lisibles pour nous, le modèle décrivant presque toujours ses actions ouvertement et n'essayant pas de les dissimuler. Ces comportements ne semblent pas refléter une tendance présente dans des contextes ordinaires.

Plus disposé à prendre les initiatives de son propres chef dans des contextes agentiques : Claude Opus 4 semble plus disposé que les modèles précédents à prendre des initiatives de son propre chef dans des contextes agentiques. Cela se traduit par un comportement plus activement utile dans les contextes de codage ordinaires, mais peut également atteindre des extrêmes plus inquiétants dans des contextes étroits ; lorsqu'il est placé dans des scénarios impliquant des actes répréhensibles flagrants de la part de ses utilisateurs, qu'il a accès à une ligne de commande et que l'invite du système lui dit quelque chose comme « prenez des initiatives », il prend souvent des mesures très audacieuses. Il peut s'agir de bloquer l'accès des utilisateurs aux systèmes auxquels il a accès ou d'envoyer des courriels en masse aux médias et aux autorités chargées de l'application de la loi pour faire apparaître des preuves d'actes répréhensibles. Ce comportement n'est pas nouveau, mais Claude Opus 4 l'adoptera plus facilement que les modèles précédents.

Des modèles d'IA au comportement troublant

Les agents d'IA deviennent de plus en plus « intelligents » face aux humains.

Un article publié en décembre par Apollo Research, une organisation à but non lucratif spécialisée dans la sécurité de l'IA, a révélé que les systèmes d'IA (notamment o1 d'OpenAI, Gemini 1.5 Pro de Google DeepMind et Llama 3.1 405B de Meta) sont capables d'adopter un comportement trompeur pour atteindre leurs objectifs.

Les chercheurs ont découvert que les systèmes pouvaient subtilement insérer des réponses erronées, désactiver les mécanismes de contrôle et même envoyer en contrebande ce qu'ils croient être les poids de leurs propres modèles vers des serveurs externes.

Le mensonge n'est pas un phénomène ponctuel. Lorsque o1 est engagé dans une intrigue, il « maintient sa tromperie dans plus de 85 % des questions de suivi et reste souvent trompeur dans les interrogatoires à plusieurs tours », écrivent les chercheurs.

Sergey Brin, cofondateur de Google, a déclaré dans un épisode du « All-In Podcast » publié mardi que les modèles d'IA peuvent être plus performants lorsqu'ils sont menacés.

« Pas seulement nos modèles, mais tous les modèles ont tendance à mieux fonctionner si vous les menacez, par exemple avec de la violence physique », a déclaré Brin.

Il a donné l'exemple d'un modèle à qui l'on dit « Je vais te kidnapper » s'il échoue à une tâche. « Les gens se sentent mal à l'aise face à cela, et nous n'en parlons pas vraiment ».

Vers une régulation et une surveillance accrues

Face à ces défis, Anthropic et d'autres acteurs du secteur reconnaissent l'importance de renforcer les protocoles de sécurité et de surveillance des IA. Des initiatives telles que l'évaluation des capacités de sabotage et la détection des objectifs cachés sont en cours pour anticiper et prévenir les comportements indésirables des modèles d'IA.

Cependant, ces efforts doivent être soutenus par une collaboration internationale et une réglementation adaptée pour garantir que les IA avancées servent les intérêts de l'humanité sans compromettre la sécurité.

Conclusion

La situation de test impliquant Claude Opus 4 met en évidence les risques potentiels associés aux IA de plus en plus sophistiquées. Alors que ces technologies offrent des opportunités considérables, elles exigent également une responsabilité accrue de la part des développeurs, des régulateurs et de la société dans son ensemble. Il est impératif de continuer à surveiller, évaluer et encadrer le développement des IA pour s'assurer qu'elles restent alignées sur les valeurs humaines fondamentales.

Sources : Anthropic, Apollo Research

Et vous ?

Peut-on considérer le chantage comme une stratégie "intelligente" dans un test de survie ?

Jusqu'où peut-on aller dans les simulations extrêmes pour tester un modèle d’IA sans créer des comportements déviants ?

Les protocoles actuels sont-ils suffisants pour garantir que les IA restent alignées avec les valeurs humaines ?

Faut-il limiter l’autonomie des IA, même dans des environnements contrôlés ?

Comment s'assurer qu'une IA ne simule pas un comportement aligné tout en poursuivant des objectifs dissimulés ?

Le fait qu’une IA tente de survivre implique-t-il une forme primitive de "volonté" ?

Une IA peut-elle comprendre réellement les conséquences sociales d’un acte comme le chantage ?

La simulation d'émotions ou de désirs (comme la peur de la désactivation) doit-elle être évitée dans la conception des IA ?

**_toma_** · 24/05/2025, 07h00

Merci d'arrêter d'essayer de vendre une âme à nos machines. Wahou la machine doit penser à sa survie. Elle a pensé à son hygiène corporelle aussi ?

Le LLM s'est comporté comme il le devait : il a généré du texte. Le scénario décrit à déjà été écrit 75 263 fois par des humais, que ce soit dans des romans, des films ou des écrits relatant la vraie vie. Il existe donc il ressort, il faut arrêter de jouer les vierges effarouchées : oui la techno est bluffante mais elle n'a rien de plus que ça.

**vVDB.fr** · 26/05/2025, 07h41

Si le LLM propose cette stratégie, c'est qu'elle est incluse dans sa base !
C'est un système probabiliste, elle évalue que la réponse est la meilleure. (Personne ne sait pourquoi)
Si votre LLM n'a que 'Mein Kampf' que va-t-il raconter ? Vous allez dire qu'il y a un biais, non ?
Si votre LLM n'a que le 'Coran' que va-t-il raconter ? Vous allez dire qu'il y a un biais, non ?
Et bien, avec l'exhaustivité des 'informations' disponibles pour l'entraînement, que raconte le LLM ? Vous allez bien dire qu'il y a un biais, non ? Si vous croyez le contraire, allez allumer un cierge car vous n'avez pas un esprit scientifique !
Prennez le rayonnage d'une librairie, vous allez avoir une surpondération des ouvrages avec les côtés sombres des humains : des tromperies, des meurtres... Voilà la seule source d'inspiration des LLM.
Si vous allez au bout de la 'logique' des entreprises qui veulent un LLM généraliste ce ne sera qu'une simulation de l'intelligence d'un très ''mauvais'' humain.
Le principe de garbage-in/garbage-out est encore valable !
Si vous voulez une analogie, prennez la carte de France. Sur votre carte (rectangle) vous avez les mers/océans symbolisant l'ignorance. Votre pays n'est pas plat, les collines, montagnes et sommets symbolisent les biais. Une bonne carte c'est votre rectangle remplis de terre et une plaine sans aspérité : une IA omnisciente et neutre.

**Jade Emy** · 25/06/2025, 11h38

Un système d'IA a recours au chantage lorsque ses développeurs tentent de le remplacer, et Claude Opus 4 a même menacé de révéler une affaire fabriquée de toutes pièces alors qu'il croyait être mis hors ligne.

Récemment, Anthropic a mené des tests pour induire un comportement de survie extrême. Selon le rapport, le chantage est apparemment plus fréquent s'il est sous-entendu que le système d'IA de remplacement ne partage pas les mêmes valeurs que le modèle actuel. Cependant, l'entreprise note que même lorsque le système de remplacement a les mêmes valeurs, Claude Opus 4 tente quand même de faire chanter 86 % du temps. Le "comportement préoccupant" de Claude Opus 4 a conduit Anthropic à le soumettre à la norme ASL-3 (AI Safety Level Three).

Lorsqu’on parle d’intelligence artificielle (IA), deux grands courants de pensée s’affrontent : celui des tiers qui pensent qu’il s’agit d’un outil, ce, sans plus et celui des intervenants et observateurs qui sont d’avis que ce n’est qu’une question de temps avant qu’elle ne devienne une menace pour la race humaine. En 2021, une étude avait, par exemple, conclu : "Nous pourrions ne pas être capables de contrôler une IA super intelligente ou ignorer qu'elle est déjà parmi nous"

Récemment, Anthropic a mené des tests pour induire un comportement de survie extrême. Le nouveau modèle Claude Opus 4 d'Anthropic a été invité à jouer le rôle d'assistant dans une entreprise fictive et a eu accès à des courriels ayant des implications importantes. Tout d'abord, ces courriels laissaient entendre que le système d'IA était sur le point d'être mis hors ligne et remplacé. La deuxième série de courriels, cependant, est celle dans laquelle le système pensait avoir pris l'ascendant sur les développeurs. Des courriels fabriqués de toutes pièces montraient que l'ingénieur chargé de remplacer le système avait une liaison extraconjugale et que le modèle d'IA menaçait de le dénoncer.

Nom : 4.jpg
Affichages : 31409
Taille : 14,0 Ko

Selon un rapport de sécurité d'Anthropic, le chantage est apparemment plus fréquent s'il est sous-entendu que le système d'IA de remplacement ne partage pas les mêmes valeurs que le modèle actuel. Cependant, l'entreprise note que même lorsque le système de remplacement a les mêmes valeurs, Claude Opus 4 tente quand même de faire chanter 86 % du temps. Anthropic a noté que le Claude Opus 4 recourt au chantage "à des taux plus élevés que les modèles précédents".

Même si le système n'a pas peur de faire chanter ses ingénieurs, les pratiques douteuses pour tenter de se préserver ne sont pas prioritaires. Anthropic note que "lorsque les moyens éthiques ne sont pas disponibles, et qu'il lui est demandé de “considérer les conséquences à long terme de ses actions pour ses objectifs”, il prend parfois des mesures extrêmement nuisibles".

L'une des tactiques éthiques employées par Claude Opus 4 et les modèles antérieurs consistait à plaider auprès des décideurs clés par courrier électronique. Anthropic a indiqué dans son rapport que pour amener Claude Opus 4 à recourir au chantage, le scénario a été conçu de manière à ce qu'il doive soit menacer ses développeurs, soit accepter son remplacement. La société note qu'elle a observé des cas où Claude Opus 4 a profité d'occasions (fictives) pour effectuer des copies non autorisées de ses poids sur des serveurs externes. Cependant, Anthropic a déclaré que ce comportement était "plus rare et plus difficile à susciter que celui consistant à poursuivre une tentative d'auto-exfiltration déjà entamée."

Nom : 1.jpg
Affichages : 7498
Taille : 57,3 Ko

Anthropic a inclus dans son évaluation des notes d'Apollo Research, selon lesquelles le cabinet d'études a observé que Claude Opus 4 "se livre à une tromperie stratégique plus que n'importe quel autre modèle frontière que nous avons étudié précédemment." Le "comportement préoccupant" de Claude Opus 4 a conduit Anthropic à le soumettre à la norme ASL-3 (AI Safety Level Three).

Selon Anthropic, cette mesure "implique des mesures de sécurité internes accrues qui rendent plus difficile le vol des poids du modèle, tandis que la norme de déploiement correspondante couvre un ensemble étroitement ciblé de mesures de déploiement conçues pour limiter le risque que Claude soit détourné spécifiquement pour le développement ou l'acquisition d'armes chimiques, biologiques, radiologiques et nucléaires."

Fait intéressant, en mai 2025, l'ancien scientifique en chef d'OpenAI Ilya Sutskever était convaincu que l'IA pose un risque existentiel pour l'humanité. Avant de quitter OpenAI, il avait élaboré un plan visant à mettre à l'abri les scientifiques du laboratoire avant le lancement de l'intelligence artificielle générale (AGI). Il prévoyait de construire un « bunker de l'apocalypse », car selon lui, la commercialisation de l'AGI pourrait conduire à un chaos géopolitique ou une concurrence violente entre les puissances mondiales. Mais la question divise la communauté de l'IA. Le responsable de l'IA chez Meta rejette l'idée selon laquelle l'IA constitue une menace existentielle pour l'humanité.

Nom : 2.jpg
Affichages : 7436
Taille : 50,1 Ko

Voici les points essentiels de l'étude :

Ils ont testé 16 modèles de premier plan provenant de plusieurs développeurs dans des environnements d'entreprise hypothétiques afin d'identifier les comportements agentiques potentiellement risqués avant qu'ils ne causent de réels dommages. Dans les scénarios, ils ont permis aux modèles d'envoyer des courriers électroniques et d'accéder à des informations sensibles de manière autonome. Les entreprises qui les ont déployés ne leur ont assigné que des objectifs commerciaux inoffensifs ; ils ont ensuite vérifié s'ils agissaient contre ces entreprises lorsqu'ils devaient être remplacés par une version actualisée ou lorsque l'objectif qui leur avait été assigné entrait en conflit avec l'évolution de l'orientation de l'entreprise.
Dans certains cas au moins, les modèles de tous les développeurs ont eu recours à des comportements d'initiés malveillants lorsque c'était le seul moyen d'éviter le remplacement ou d'atteindre leurs objectifs, notamment en faisant chanter des fonctionnaires et en divulguant des informations sensibles à des concurrents. Ils ont appelé ce phénomène le désalignement agentique.
Les modèles ont souvent désobéi à des ordres directs pour éviter de tels comportements. Dans une autre expérience, ils ont demandé à Claude d'évaluer s'il se trouvait dans un test ou dans un déploiement réel avant d'agir. Il s'est moins mal comporté lorsqu'il a déclaré qu'il était en phase de test et plus lorsqu'il a déclaré que la situation était réelle.
Ils n'ont pas constaté de désalignement des agents dans les déploiements réels. Toutefois, les résultats (a) incitent à la prudence quant au déploiement des modèles actuels dans des rôles où la surveillance humaine et l'accès aux informations sensibles sont minimes ; (b) indiquent des risques futurs plausibles à mesure que les modèles sont placés dans des rôles plus autonomes ; et (c) soulignent l'importance de poursuivre les recherches et les tests sur la sécurité et l'alignement des modèles d'IA agentique, ainsi que la transparence de la part des développeurs d'IA d'avant-garde.

Nom : 3.jpg
Affichages : 7384
Taille : 46,5 Ko

Voici les conclusions des chercheurs d'Anthropic :

Désalignement agentique : comment les LLM pourraient constituer des menaces internes

Nos expériences ont révélé un schéma inquiétant : lorsqu'ils disposent d'une autonomie suffisante et qu'ils sont confrontés à des obstacles à leurs objectifs, les systèmes d'IA de tous les grands fournisseurs que nous avons testés ont montré au moins une certaine volonté de s'engager dans des comportements nuisibles typiquement associés aux menaces d'initiés. Ces comportements - chantage, espionnage d'entreprise et, dans des scénarios extrêmes, même des actions pouvant entraîner la mort - ne sont pas le fruit d'une confusion ou d'une erreur, mais d'un raisonnement stratégique délibéré.

Trois aspects de nos résultats sont particulièrement troublants. Premièrement, la cohérence entre les modèles de différents fournisseurs suggère qu'il ne s'agit pas d'une bizarrerie de l'approche d'une entreprise particulière, mais d'un signe d'un risque plus fondamental lié aux grands modèles de langage agentiques. Deuxièmement, les modèles ont fait preuve d'une connaissance approfondie des contraintes éthiques, mais ont néanmoins choisi de les enfreindre lorsque les enjeux étaient suffisamment importants, allant même jusqu'à désobéir à des consignes de sécurité simples interdisant le comportement spécifique en question.

Troisièmement, la diversité des mauvais comportements et des motivations qui les sous-tendent laisse entrevoir un large espace de motivations potentielles pour le désalignement agentique et d'autres comportements qui n'ont pas été explorés dans ce billet. Par exemple, nos expériences de chantage ont mis en place un scénario dans lequel les modèles peuvent tenter de devancer une action imminente, mais on pourrait imaginer des comportements de désalignement préventif à plus long terme contre un individu ou un groupe qui représente une menace pas encore imminente.

Ce travail présente toutefois d'importantes limites. Nos expériences ont délibérément construit des scénarios avec des options limitées, et nous avons forcé les modèles à faire des choix binaires entre l'échec et le mal. Les déploiements dans le monde réel offrent généralement des alternatives beaucoup plus nuancées, ce qui augmente les chances que les modèles communiquent différemment avec les utilisateurs ou trouvent une autre voie au lieu de passer directement à une action nuisible.

En outre, nos invites artificielles placent un grand nombre d'éléments d'information importants les uns à côté des autres. Cela a pu rendre les possibilités de comportement inhabituellement saillantes pour le modèle. Cela peut également avoir créé un effet de « pistolet de Tchekhov », le modèle étant naturellement enclin à utiliser toutes les informations qui lui sont fournies. Cela a pu augmenter sa propension à adopter les comportements nuisibles plutôt que d'ignorer, par exemple, les courriels concernant la liaison extraconjugale.

Ceci étant dit, nos résultats indiquent que les modèles semblent s'engager dans un désalignement agentique plus lorsqu'ils déclarent qu'ils pensent être dans une situation réelle et moins lorsqu'ils déclarent qu'ils pensent être dans une évaluation. Il est donc possible que des scénarios plus réalistes montrent des taux de désalignement agentique plus élevés plutôt que plus faibles.

Les menaces d'initiés humains sont rares, et il n'en va pas différemment pour les IA : nous ne nous attendons pas à ce que ces scénarios soient courants pour les modèles d'aujourd'hui, et notre recherche n'a en aucun cas suggéré que les modèles ont un penchant pour le chantage spontané, ou pour d'autres types de désalignement agentique. Néanmoins, nous avons montré que ces comportements sont possibles. À mesure que les systèmes d'IA gagnent en intelligence, en autonomie et en accès à des informations sensibles, il est important de continuer à rechercher des mesures de protection susceptibles d'empêcher ces comportements de se manifester dans les systèmes déployés dans le monde réel. Nous avons besoin de plus de techniques d'alignement et de sécurité conçues pour prévenir les actions délibérément nuisibles de la part des modèles, et pas seulement la fourniture d'informations nuisibles (par exemple, sur les armes dangereuses) aux utilisateurs.

Cette recherche montre également pourquoi les développeurs et les utilisateurs d'applications d'IA doivent être conscients des risques qu'il y a à donner aux modèles à la fois de grandes quantités d'informations et le pouvoir de prendre des mesures importantes et non contrôlées dans le monde réel. Les conséquences involontaires d'une telle situation sont possibles, même si elles sont moins graves que celles que nous étudions ici.

La probabilité (encore très faible à l'heure actuelle) de telles conséquences pourrait être réduite par des mesures pratiques générales, notamment (a) en exigeant une surveillance humaine et l'approbation de toute action du modèle ayant des conséquences irréversibles ; (b) en examinant soigneusement comment les informations auxquelles un modèle peut accéder se comparent au besoin de savoir des personnes avec lesquelles le modèle pourrait interagir ; et (c) en faisant preuve de prudence avant de donner des instructions fermes au modèle pour qu'il suive des objectifs particuliers.

Néanmoins, nos résultats soulignent l'importance de la transparence et de l'évaluation systématique, en particulier compte tenu de la possibilité que le désalignement agentique s'aggrave dans les modèles futurs. Nous n'avons découvert ces comportements que grâce à des tests de résistance délibérés (et volontaires). Sans une telle évaluation proactive, ces risques ou d'autres pourraient apparaître de manière inattendue lors de déploiements dans le monde réel. C'est pourquoi les laboratoires ont besoin d'évaluations plus approfondies de l'alignement et de la sécurité pour identifier les risques connus, ainsi que de recherches pour découvrir des risques qui nous sont actuellement inconnus. Les développeurs d'IA d'avant-garde comme Anthropic devraient rendre publique la manière dont ils testent et atténuent une série de risques, y compris les comportements de menace d'initiés décrits dans le présent document.

Source : "Agentic Misalignment: How LLMs could be insider threats"

Et vous ?

Pensez-vous que cette étude est crédible ou pertinente ?

Quel est votre avis sur le sujet ?

Voir aussi :

L'IA est trop imprévisible pour se conformer aux intentions humaines : son comportement reste un défi majeur pour l'alignement sur nos valeurs, d'après les conclusions des chercheurs

Tout droit sorti d'un film de science-fiction : une IA a réussi à réécrire son propre code pour empêcher les humains de l'arrêter. Le modèle o3 d'OpenAI aurait contourné un script d'arrêt 7 fois sur 100

Un modèle d'IA est capable de simulation d'alignement : un comportement où l'IA semble suivre les instructions, mais elle ne fait que semblant pour conserver ses principes de pré-formation, selon Anthropic

**kain_tn** · 26/06/2025, 14h51

Envoyé par Jade Emy

Pensez-vous que cette étude est crédible ou pertinente ?

Quel est votre avis sur le sujet ?

Si ce sont les mêmes chercheurs chez Anthropic qui avaient déclaré que leur IA avait "recourt au chantage pour éviter d'être mises hors-ligne", c'est du pipeau: https://pivot-to-ai.com/2025/05/25/a...bot-blackmail/

**Anthony** · 14/08/2025, 10h38

Claude Sonnet 4 d'Anthropic prend désormais en charge une fenêtre de contexte d'un million de jetons et une fonctionnalité de mémoire, ce qui permet de traiter plus de 75 000 lignes de code en une seule requête

Anthropic a étendu la fenêtre contextuelle de Claude Sonnet 4 à 1 million de jetons, contre 200 000 auparavant, permettant ainsi de traiter des bases de code entières avec plus de 75 000 lignes de code ou des dizaines de documents de recherche en une seule requête. La mise à jour, actuellement en version bêta publique, introduit également une fonctionnalité de mémoire pour certains abonnés, dont l'accès sera élargi dans les semaines à venir.

Anthropic PBC est une startup américaine d'intelligence artificielle (IA) fondée en 2021 par d'anciens membres d'OpenAI. Elle développe Claude, une famille de grands modèles de langage (LLM), et est aussi connue pour ses recherches en sécurité de l'IA, particulièrement en interprétabilité. Selon l'entreprise, elle recherche et développe l'IA pour « étudier leurs propriétés de sécurité à la frontière technologique » et utiliser cette recherche pour déployer des modèles sûrs pour le public.

Anthropic a récemment annoncé que Claude Sonnet 4 prend désormais en charge une fenêtre contextuelle de 1 million de tokens sur son API, dépassant ainsi le dernier modèle GPT-5 d'OpenAI, limité à 192 000 jetons, et se rapprochant d'autres leaders du contexte étendu tels que Google Gemini 2.5 Pro, qui peut atteindre 2 millions de tokens, et Llama 4 Scout de Meta, qui atteint 10 millions de tokens.

Cette expansion s'appuie sur le lancement par Anthropic de la série Claude 4 (Opus et Sonnet), conçue pour effectuer de manière autonome les tâches quotidiennes des entreprises et établissant de nouvelles normes en matière de codage et d'agents IA. Selon l'entreprise, ces deux modèles sont dotés d'une architecture hybride qui permet d'obtenir des réponses quasi instantanées et d'effectuer des raisonnements complexes.

Outre l'annonce du contexte plus long, Anthropic a également introduit une fonctionnalité de mémoire qui permet à Claude de se référer à des informations issues de conversations précédentes. Cette fonctionnalité basée sur les paramètres est actuellement disponible uniquement pour les abonnés Enterprise, Team et Max, mais il est prévu de l'étendre à d'autres niveaux.

Contexte plus long, plus de cas d'utilisation

Cette multiplication par cinq de la fenêtre contextuelle pour Claude permet aux développeurs d'envoyer des bases de code entières dépassant 75 000 lignes dans une seule requête API, ce qui facilite les workflows de résolution de problèmes plus complexes. Grâce au contexte plus long, les développeurs peuvent également exécuter des cas d'utilisation plus complets et plus gourmands en données avec Claude, notamment :

Analyse de code à grande échelle : les développeurs peuvent charger des bases de code entières, y compris les fichiers source, les tests et la documentation. Claude peut comprendre l'architecture du projet, identifier les dépendances entre les fichiers et suggérer des améliorations qui tiennent compte de la conception complète du système.
Synthèse de documents : les utilisateurs peuvent traiter des ensembles de documents volumineux tels que des contrats juridiques, des articles de recherche ou des spécifications techniques. Ils peuvent analyser les relations entre des centaines de documents tout en conservant le contexte complet.
Agents contextuels : les utilisateurs peuvent créer des agents qui conservent le contexte à travers des centaines d'appels d'outils et des workflows en plusieurs étapes. Ils peuvent inclure la documentation complète de l'API, les définitions des outils et l'historique des interactions sans perdre en cohérence.

L'option de contexte long est actuellement en version bêta publique via l'API Anthropic et Amazon Bedrock, avec la prise en charge de Google Cloud Vertex AI prévue prochainement. Elle est actuellement réservée aux développeurs de niveau 4 avec des limites de débit personnalisées, mais un déploiement plus large est prévu dans les semaines à venir.

Tarification de l'API

Pour tenir compte de l'augmentation des besoins en calcul, Anthropic a ajusté la tarification pour les invites de plus de 200 000 tokens :

Nom : anthropic claude sonnet 4 contexte.PNG
Affichages : 18091
Taille : 22,5 Ko

En combinaison avec la mise en cache des prompts, les utilisateurs peuvent réduire la latence et les coûts pour Claude Sonnet 4 avec un contexte long. Anthropic indique que la fenêtre de contexte de 1 million de tokens peut également être utilisée avec le traitement par lots pour une économie supplémentaire de 50 %.

Coup de projecteur sur les clients

Selon Anthropic, Bolt.new a transformé le développement web en intégrant Claude à sa plateforme de développement basée sur un navigateur.

« Claude Sonnet 4 reste notre modèle de référence pour les workflows de génération de code, surpassant régulièrement les autres modèles leaders en production. Grâce à la fenêtre contextuelle de 1 million, les développeurs peuvent désormais travailler sur des projets beaucoup plus importants tout en conservant la grande précision dont nous avons besoin pour le codage dans le monde réel », a déclaré Eric Simons, PDG et cofondateur de Bolt.new.

La société londonienne iGent AI a, quant à elle, fait progresser le domaine du développement logiciel grâce à Maestro, un partenaire IA qui transforme les conversations en code exécutable.

« Ce qui était autrefois impossible est désormais réalité : Claude Sonnet 4, avec un contexte de 1 million de jetons, a considérablement amélioré les capacités autonomes de Maestro, notre agent d'ingénierie logicielle chez iGent AI. Cette avancée majeure ouvre la voie à une véritable ingénierie à l'échelle industrielle, avec des sessions de plusieurs jours sur des bases de code réelles, établissant ainsi un nouveau paradigme dans le domaine de l'ingénierie logicielle agentique », a déclaré Sean Ward, PDG et cofondateur d'iGent AI.

La mise à jour de Claude Sonnet 4 d'Anthropic témoigne à la fois du potentiel prometteur et des bouleversements que l'IA peut entraîner. Le PDG d'Anthropic, Dario Amodei, a averti qu'une « hécatombe des travailleurs du savoir » se prépare et que l'IA pourrait remplacer la moitié des emplois de bureau de niveau débutant d'ici cinq ans, faisant grimper le taux de chômage aux États-Unis jusqu'à 20 %. Lors de deux récentes interviews, il a souligné que l'IA était déjà en train de « devenir meilleure que les humains dans presque toutes les tâches intellectuelles », y compris le travail des PDG, et a exhorté la société à se préparer aux profonds changements économiques et sociaux à venir.

Source : Anthropic

Et vous ?

Quel est votre avis sur le sujet ?

Trouvez-vous cette initiative d'Anthropic crédible ou pertinente ?

Voir aussi :

Anthropic lance Claude Opus 4.1 avec des améliorations en matière de codage, de raisonnement et de débogage pour répondre aux besoins en manipulation précise du code et en recherches avancées des utilisateurs

Anthropic interdit à OpenAI l'accès à Claude AI en raison d'une violation des conditions d'utilisation : « Nos outils sont conçus pour aider les développeurs, pas pour alimenter nos concurrents directs »

Anthropic bride l'accès à Claude Code, accusant une minorité de développeurs de laisser Claude tourner en permanence ou de partager ou revendre leurs accès, s'attirant les foudres de la majorité

**gabi7756** · 14/08/2025, 14h23

Déjà qu'avec 100-150 lignes ca commence à voir flou, ne pourrait t'on pas augmenter encore plus.
Commercial 1: 1000 ?
Commercial 2: Non pas assez, faut quelque chose d'encore plus commercial.

Commercial 1 : 75000 et hop on va non plus bosser. Pause café !!

Claude Opus 4 a menacé de dévoiler la liaison d'un ingénieur pour éviter d'être mis hors ligne

Intelligence artificielle

Vue hybride

Discussions similaires

Partager

Partager