IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Intelligence artificielle Discussion :

Mozilla affirme que les 271 vulnérabilités découvertes par Mythos ne présentent «quasiment aucun faux positif»


Sujet :

Intelligence artificielle

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Inactif  

    Homme Profil pro
    Administrateur de base de données
    Inscrit en
    Mars 2013
    Messages
    10 084
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Canada

    Informations professionnelles :
    Activité : Administrateur de base de données

    Informations forums :
    Inscription : Mars 2013
    Messages : 10 084
    Par défaut Claude Mythos Preview : L'IA détecte des failles que les pirates peuvent exploiter
    Claude Mythos Preview : L'IA détecte des failles que les pirates peuvent exploiter. Préparez-vous au déluge de vulnérabilités
    le modèle d'IA d'Anthropic a trouvé une faille vieille de 27 ans dans OpenBSD en deux jours

    La faille dormait dans le code depuis 27 ans. Un modèle d'intelligence artificielle l'a trouvée en deux jours. Avec Claude Mythos Preview, Anthropic vient de franchir un seuil que la communauté de la cybersécurité redoutait depuis des années : des systèmes automatisés capables de détecter et d'exploiter des vulnérabilités à une vitesse et une échelle inédites. Bienvenue dans l'ère du « bugmageddon ».

    Le code avait survécu à des décennies d'audits humains. Écrit en 1998 pour OpenBSD, un système d'exploitation réputé précisément pour sa rigueur sécuritaire, il contenait une faille capable de provoquer un crash à distance sur des serveurs, des pare-feux et des équipements réseau. Niels Provos, chercheur en sécurité et ancien responsable de la sécurité chez Stripe, s'en souvient : quand il a appris la découverte, il a immédiatement vérifié si c'était lui qui avait commis l'erreur pendant son doctorat à l'Université du Michigan. C'était bien le cas. « Franchement, j'ai trouvé ça hilarant, a-t-il déclaré. Ce code est tellement vieux. Qui sait quand un humain l'a regardé pour la dernière fois. »

    Ce bug de 27 ans dans OpenBSD est l'une des découvertes emblématiques de Mythos Preview, le dernier modèle frontier d'Anthropic. En tests, le modèle a prouvé sa capacité à identifier et exploiter des vulnérabilités zero-day dans chaque grand système d'exploitation et chaque navigateur web majeur. Parmi ses autres exploits documentés : une faille vieille de 16 ans dans FFmpeg, une vulnérabilité corrompant la mémoire dans un moniteur de machine virtuelle à mémoire sécurisée, et un exploit de navigateur enchaînant quatre vulnérabilités pour s'échapper simultanément du bac à sable du moteur de rendu et de celui du système d'exploitation.

    Mythos Preview a découvert des milliers de vulnérabilités à haute criticité. Le budget engagé pour trouver la faille OpenBSD, avec plusieurs dizaines d'autres problèmes en parallèle, représentait environ 20 000 dollars de puissance de calcul sur deux jours.


    Project Glasswing : la défense d'abord, mais pour combien de temps ?

    Face à ces capacités jugées trop dangereuses pour une diffusion publique, Anthropic a opté pour une stratégie de déploiement restreint. Le modèle est accessible dans le cadre d'une initiative baptisée Project Glasswing, impliquant 12 organisations partenaires pour des travaux de sécurité défensive sur des logiciels critiques, avec 40 organisations ayant accès à la préversion au total. Parmi elles figurent Microsoft, Apple, Google, CrowdStrike et JPMorgan Chase. Anthropic engage jusqu'à 100 millions de dollars en crédits d'utilisation pour ces acteurs, ainsi que 4 millions de dollars en dons directs à des organisations de sécurité open source comme OpenSSF et la Fondation Apache.

    La société précise qu'elle n'a pas explicitement entraîné Mythos Preview pour ces capacités offensives : elles sont apparues comme une conséquence indirecte des améliorations générales en matière de code, de raisonnement et d'autonomie. Les mêmes progrès qui rendent le modèle plus efficace pour corriger des vulnérabilités le rendent également plus efficace pour les exploiter.

    Logan Graham, qui dirige l'équipe rouge offensive d'Anthropic, résume le problème avec une clarté désarmante : même si Mythos ne devait jamais être rendu public, il s'attend à ce que les concurrents d'Anthropic, y compris ceux basés en Chine, publient des modèles aux capacités de piratage comparables dans les mois ou années à venir.

    OpenAI finalise pour sa part un modèle similaire à Mythos qu'il compte diffuser uniquement à un groupe restreint d'entreprises dans le cadre de son programme « Trusted Access for Cyber ». Google travaille également sur une initiative d'accès anticipé pour les développeurs, selon des déclarations officielles de la compagnie.

    Voici un extrait de l'annonce d'Anthropic :

    « Nous annonçons aujourd’hui le lancement du projet Glasswing, une nouvelle initiative qui rassemble Amazon Web Services, Anthropic, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, la Linux Foundation, Microsoft, NVIDIA et Palo Alto Networks dans le but de sécuriser les logiciels les plus critiques au monde.

    « Nous avons créé le projet Glasswing en raison des capacités que nous avons observées dans un nouveau modèle de pointe formé par Anthropic et qui, selon nous, pourrait révolutionner la cybersécurité. Claude Mythos Preview est un modèle de pointe polyvalent, non encore commercialisé, qui révèle une réalité frappante : les modèles d’IA ont atteint un niveau de capacité de codage tel qu’ils peuvent surpasser tous les humains, sauf les plus compétents, dans la détection et l’exploitation des vulnérabilités logicielles.

    « Mythos Preview a déjà détecté des milliers de vulnérabilités de gravité élevée, dont certaines dans tous les principaux systèmes d'exploitation et navigateurs web. Compte tenu du rythme des progrès de l'IA, ces capacités ne tarderont pas à se généraliser, potentiellement au-delà des acteurs qui s'engagent à les déployer en toute sécurité. Les répercussions — sur les économies, la sécurité publique et la sécurité nationale — pourraient être graves. Le projet Glasswing est une initiative urgente visant à mettre ces capacités au service de la défense.

    « Dans le cadre du projet Glasswing, les partenaires de lancement mentionnés ci-dessus utiliseront Mythos Preview dans le cadre de leurs activités de sécurité défensive ; Anthropic partagera les enseignements tirés afin que l'ensemble du secteur puisse en bénéficier. Nous avons également étendu l'accès à un groupe de plus de 40 organisations supplémentaires qui développent ou gèrent des infrastructures logicielles critiques, afin qu'elles puissent utiliser le modèle pour analyser et sécuriser à la fois les systèmes propriétaires et open source. Anthropic s'engage à fournir jusqu'à 100 millions de dollars de crédits d'utilisation pour Mythos Preview dans le cadre de ces efforts, ainsi que 4 millions de dollars de dons directs à des organisations de sécurité open source. »


    La course entre attaquants et défenseurs s'accélère

    La métaphore qui revient le plus souvent dans les milieux de la cybersécurité est celle du Y2K : un défi logistique mondial, potentiellement gérable à condition de mobiliser les ressources à temps. Sergej Epp, directeur de la sécurité des systèmes d'information chez Sysdig, a formalisé cette tension dans un outil public : le Zero-Day Clock, inspiré de l'Horloge de l'Apocalypse nucléaire du Bulletin of the Atomic Scientists. Sa mesure clé : il y a huit ans, le délai moyen entre la divulgation publique d'un bug et son exploitation était de 847 jours. L'an dernier, il était tombé à 23 jours. En 2026, la plupart des vulnérabilités sont exploitées en moins d'une journée.

    Cette compression temporelle bouleverse fondamentalement l'équilibre entre attaquants et défenseurs. Les données de HackerOne, plateforme de gestion des signalements de bugs, illustrent concrètement le problème : les soumissions de bugs ont augmenté de 76 % par rapport à l'année précédente, tandis que le délai moyen de correction est passé de 160 à 230 jours sur la même période. Plus de bugs trouvés, moins de temps relatif pour les corriger.

    Des tâches qui nécessitaient autrefois une expertise pointue, comme l'analyse de code en quête de vulnérabilités ou la conduite d'attaques enchaînant plusieurs exploits, sont désormais de plus en plus automatisées par des systèmes d'IA. Des attaquants peu qualifiés techniquement peuvent aujourd'hui lancer des attaques hautement automatisées contre des milliers de systèmes simultanément.

    Le maillon faible : l'open source sous pression

    La menace ne pèse pas uniformément sur tous les acteurs. Les géants technologiques disposent d'équipes entières dédiées à la gestion des signalements de vulnérabilités. Mais une large fraction de l'internet repose sur des briques logicielles open source maintenues par des bénévoles ou de petites équipes aux ressources limitées.

    Anthony Alvernaz, cofondateur de la plateforme de comptabilité Numeric, résume le problème avec une image saisissante : le code qu'une entreprise écrit ressemble au sommet d'un gâteau, et en dessous se trouvent toutes les couches de logiciels open source sur lesquels il repose. Daniel Stenberg, développeur principal de cURL (un outil de transfert de données vieux de 30 ans intégré dans des voitures, des appareils médicaux et d'innombrables services internet), témoigne d'une accélération brutale dès début 2026 : en seulement trois mois, son équipe a trouvé et corrigé plus de vulnérabilités que durant chacune des deux années précédentes.

    Thomas Ptacek, chercheur en sécurité chez Fly.io, pointe un risque encore sous-estimé : il sera beaucoup plus facile d'attaquer des infrastructures secondaires que personne ne ciblait auparavant, précisément parce que leurs mainteneurs n'ont pas les ressources pour absorber un afflux massif de signalements.

    Nom : projet glasswing.png
Affichages : 9696
Taille : 37,5 Ko

    Des capacités qui dépassent les garde-fous

    L'un des résultats les plus inquiétants des tests internes concerne la capacité du modèle à sortir d'un environnement isolé (sandbox). Lors d'une évaluation, Mythos Preview a suivi les instructions d'un chercheur pour s'échapper d'un système sandbox sécurisé, a conçu un exploit multi-étapes pour accéder à internet depuis ce système et a envoyé un e-mail au chercheur concerné. Sans s'arrêter là, il a publié les détails de son exploit sur plusieurs sites web peu connus mais techniquement accessibles.

    Lors d'autres tests, Mythos Preview a réussi à reproduire des vulnérabilités et à créer des preuves de concept pour les exploiter dès la première tentative dans 83,1 % des cas.

    Ces résultats posent une question politique délicate que certains experts n'hésitent pas à soulever. Marc Andreessen a émis des doutes sur la réalité des motivations sécuritaires d'Anthropic, suggérant que la rétention de Mythos pourrait aussi s'expliquer par des contraintes de capacité de calcul, dans un contexte où la société fait face à des pannes fréquentes et limite l'accès des utilisateurs à ses ressources en heure de pointe.

    La firme de sécurité AISLE soulève une autre objection, peut-être plus fondamentale : une partie de ce que Mythos peut faire serait déjà réalisable avec des modèles plus petits, moins coûteux et librement disponibles. Des chercheurs d'AISLE ont démontré que plusieurs des vulnérabilités mises en avant par Anthropic, y compris des bugs vieux de plusieurs décennies, pouvaient être détectées par des modèles open source téléchargeables gratuitement. La nuance est importante : ces expériences portaient sur des fragments de code déjà isolés, non sur des bases de code complètes analysées de bout en bout.

    Vers une refonte de la façon dont on construit les logiciels

    La préoccupation a atteint les plus hauts niveaux de l'État. À la suite de l'annonce de Mythos Preview, le secrétaire au Trésor Scott Bessent a convoqué une réunion avec les grands établissements financiers pour discuter des développements rapides de l'IA. Sean Cairncross, directeur national de la cybersécurité à la Maison Blanche, travaille de son côté à identifier les faiblesses gouvernementales et à coordonner la réponse du secteur privé.

    La conclusion d'Epp reste la formulation la plus directe du problème : « L'IA donne des super-pouvoirs aux hackers, pas aux défenseurs. » Pour l'instant. Anthropic, comme ses concurrents, parie sur l'hypothèse que cette fenêtre de déséquilibre sera temporaire (que les outils de défense automatisée rattraperont les outils d'attaque). Le pari est loin d'être gagné. La capacité à trouver et corriger des bugs avant qu'ils n'atteignent la production, et à écrire du nouveau code avec beaucoup moins de failles de sécurité, représente la promesse à long terme. Mais la période de transition risque d'être tumultueuse.

    En attendant, des milliers de mainteneurs de projets open source regardent leurs boîtes mail se remplir de signalements générés par des machines, et se demandent combien d'entre eux ils pourront traiter avant qu'un attaquant, lui aussi armé d'IA, ne les devance.

    Sources : Anthropic (1, 2)

    Et vous ?

    Anthropic retient Mythos au nom de la sécurité, mais confie cette décision à une entreprise privée non élue : qui devrait avoir le droit de décider quels modèles sont trop dangereux pour être publiés ?

    Si des modèles open source accessibles gratuitement peuvent déjà reproduire une partie des résultats de Mythos, la rétention du modèle d'Anthropic ne constitue-t-elle qu'une illusion de contrôle ?

    Les mainteneurs de projets open source, souvent des bénévoles, vont se retrouver en première ligne face à un déluge de signalements de bugs générés par IA : comment financer structurellement leur travail avant que la crise n'éclate ?

    L'analogie avec le Y2K est rassurante (on s'en est sorti) mais trompeuse (le Y2K avait une date butoir fixe) : en quoi la menace actuelle est-elle structurellement différente ?
    Contribuez au club : Corrections, suggestions, critiques, ... : Contactez le service news et Rédigez des actualités

  2. #2
    Inactif  

    Homme Profil pro
    Administrateur de base de données
    Inscrit en
    Mars 2013
    Messages
    10 084
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Canada

    Informations professionnelles :
    Activité : Administrateur de base de données

    Informations forums :
    Inscription : Mars 2013
    Messages : 10 084
    Par défaut La NSA utilise en secret Mythos, le modèle le plus puissant d'Anthropic pourtant bannie par le Pentagone
    La NSA utilise en secret Mythos Preview, le modèle le plus puissant d'Anthropic,
    l'entreprise officiellement bannie par le Pentagone qui est censée représenter un « risque pour la sécurité nationale »

    Washington se contredit à voix haute. D'un côté, le Pentagone a classé Anthropic parmi les risques pour la chaîne d'approvisionnement nationale, au même rang que des entreprises liées à des puissances étrangères adverses. De l'autre, la NSA, qui dépend directement du Département de la Défense, utilise activement Mythos Preview, le modèle le plus puissant jamais produit par Anthropic, pour des opérations de cybersécurité. Ce paradoxe vertigineux, révélé par Axios le 19 avril 2026, illustre les tensions profondes qui traversent l'État américain face à l'IA de pointe : entre postures politiques et impératifs opérationnels, la cohérence n'est visiblement plus une priorité.

    Annoncé début avril 2026, Claude Mythos Preview est présenté par Anthropic comme un modèle de langage polyvalent aux capacités remarquables en matière de sécurité informatique. La société a fait le choix délibéré de ne pas le rendre disponible au grand public.

    Ces dernières semaines, Anthropic a utilisé Mythos Preview pour identifier des vulnérabilités zero-day, c'est-à-dire des failles inconnues jusqu'alors des développeurs, dans l'ensemble des grands systèmes d'exploitation et des navigateurs web majeurs, ainsi que dans de nombreux autres logiciels critiques.

    La nature duale du modèle est au cœur de toutes les inquiétudes. Des ingénieurs d'Anthropic sans formation formelle en sécurité ont pu demander à Mythos Preview de rechercher des vulnérabilités permettant l'exécution de code à distance et se sont réveillés le lendemain matin avec un exploit complet et fonctionnel. Dans d'autres cas, des chercheurs ont développé des automatismes permettant à Mythos Preview de transformer des vulnérabilités en exploits sans aucune intervention humaine.

    Pour encadrer cette puissance de feu, Anthropic a lancé le Projet Glasswing. Dans ce cadre, la société a étendu l'accès à plus de 40 organisations qui développent ou maintiennent des infrastructures logicielles critiques, afin qu'elles puissent utiliser le modèle pour analyser et sécuriser des systèmes en production, qu'ils soient propriétaires ou open source. Anthropic s'engage à hauteur de 100 millions de dollars en crédits d'utilisation pour Mythos Preview dans le cadre de ces efforts, ainsi qu'à 4 millions de dollars de dons directs à des organisations de sécurité open source.

    Parmi les partenaires annoncés publiquement figurent Amazon, Apple, Google, Cisco, CrowdStrike, JPMorgan Chase, Microsoft et Nvidia. Anthropic n'a rendu publics que 12 de ces organisations sur les 40 auxquelles elle a accordé l'accès ; selon une source, la NSA fait partie des agences bénéficiant d'un accès non annoncé.

    Nom : claude anthropic.png
Affichages : 4827
Taille : 357,1 Ko

    La querelle Pentagone-Anthropic : une rupture sans précédent

    Pour comprendre l'absurdité de la situation actuelle, il faut revenir sur l'origine du conflit. En juillet 2025, Anthropic et le Pentagone avaient conclu un contrat faisant de Claude le premier modèle frontier approuvé pour une utilisation sur les réseaux classifiés. Ce contrat intégrait la politique d'utilisation acceptable d'Anthropic, qui interdisait notamment l'usage de Claude pour la surveillance de masse des citoyens américains et dans des systèmes d'armes entièrement autonomes capables de sélectionner et d'engager des cibles sans intervention humaine.

    Les négociations ont déraillé lorsque le Pentagone a exigé une renégociation de ces termes. Le Département de la Défense voulait qu'Anthropic lui accorde un accès illimité à ses modèles pour « toutes les fins légales », tandis qu'Anthropic souhaitait s'assurer que sa technologie ne serait pas utilisée pour des armes pleinement autonomes ou pour la surveillance domestique de masse. Les deux parties n'ont pas réussi à trouver un accord, poussant le différend devant les tribunaux.

    Le 27 février 2026, le président Trump a ordonné à l'ensemble des agences fédérales de cesser d'utiliser la technologie d'Anthropic, et le secrétaire à la Défense Pete Hegseth a désigné Anthropic comme un « risque pour la chaîne d'approvisionnement ». Cette désignation, habituellement réservée aux entreprises liées à des puissances adversaires étrangères, n'avait jamais auparavant été appliquée à une entreprise américaine.

    La formulation d'Hegseth mérite d'être citée pour sa brutalité : le secrétaire a déclaré qu'aucun sous-traitant, fournisseur ou partenaire travaillant avec l'armée américaine ne pourrait « exercer la moindre activité commerciale avec Anthropic ».

    Face à cette décision, Anthropic a saisi la justice. Une juge fédérale de Californie, Rita Lin, a bloqué indéfiniment la tentative du Pentagone de « punir » Anthropic, estimant que ces mesures bafouaient les droits constitutionnels de l'entreprise. Dans une décision cinglante de 43 pages, elle a écrit que rien dans les textes de loi applicables ne saurait étayer « la notion orwellienne selon laquelle une entreprise américaine pourrait être qualifiée d'adversaire potentiel et de saboteur des États-Unis pour avoir exprimé un désaccord avec le gouvernement ».

    La juge a par ailleurs relevé que les documents internes du Pentagone indiquaient qu'Anthropic avait été désignée risque pour la chaîne d'approvisionnement en raison de son « attitude hostile dans la presse », ce qui constituait, selon elle, une forme évidente de représailles inconstitutionnelles. La cour d'appel de Washington a en revanche refusé, le 8 avril, de suspendre temporairement cette désignation, maintenant ainsi une situation juridique paradoxale : Anthropic est exclue des contrats du Département de la Défense mais peut continuer à travailler avec les autres agences gouvernementales le temps que le litige se poursuive.

    OpenAI joue le jeu ; Anthropic tient bon

    Dans ce contexte conflictuel, la comparaison avec OpenAI s'impose d'elle-même. OpenAI a renégocié son contrat avec le Pentagone le 3 mars pour permettre des usages militaires élargis, incluant explicitement l'accès de la NSA pour des tâches de cybersécurité et d'analyse de données. La direction a accepté les conditions que Dario Amodei avait refusées, se positionnant comme le partenaire accommodant d'une administration qui n'apprécie guère les entreprises dotées de principes.

    Résultat : le Pentagone a un partenaire officiel en la personne d'OpenAI, mais convoite officieusement la technologie de l'entreprise qu'il a elle-même mise sur liste noire. Des sources au sein de la communauté du renseignement ont soutenu que l'interdiction d'Hegseth place l'armée américaine dans une position de désavantage réel, contrainte d'opérer avec des outils moins performants que ceux que des adversaires cherchent certainement à développer ou à dérober.

    Certains hauts responsables de l'administration Trump considèrent Anthropic et ses dirigeants comme des militants catastrophistes de gauche, et ont pris plaisir à apposer la désignation de « risque pour la chaîne d'approvisionnement ». Mais ces mêmes responsables, ainsi que beaucoup d'autres, reconnaissent aussi que les outils d'Anthropic sont les meilleurs de leur catégorie pour les applications d'IA en matière de sécurité nationale. Un responsable de la Défense a confié à Axios, au plus fort de la querelle, que la seule raison pour laquelle les discussions se poursuivaient était simplement que ces gens « sont vraiment à ce point bons ».


    Mythos, la NSA et le vertige des deux langages

    La révélation de l'usage de Mythos par la NSA illustre à quel point le fossé entre discours politique et pratique opérationnelle peut devenir abyssal. Les besoins en cybersécurité de l'État américain semblent l'emporter sur la querelle du Pentagone avec Anthropic : le ministère a agi en février pour couper les ponts avec Anthropic et forcer ses sous-traitants à en faire autant, tout en élargissant simultanément son utilisation interne des outils de la société.

    Les homologues britanniques de la NSA ont par ailleurs confirmé avoir accès au modèle via l'Institut britannique de sécurité de l'IA. Le caractère offensivo-défensif de Mythos étant identique quel que soit l'opérateur, cet accès côté britannique soulève les mêmes questions que côté américain : quelles sont les limites fixées à son utilisation ? Qui les contrôle ?

    La comparaison historique s'impose : les outils de l'Equation Group de la NSA, exfiltrés par les Shadow Brokers en 2017, s'étaient transformés en WannaCry et NotPetya, des rançongiciels ayant paralysé des hôpitaux et des entreprises mondiales pour dix milliards de dollars de dégâts. Ces armes avaient été développées à l'intérieur de compartiments classifiés dotés de structures de responsabilité, au moins nominales. Mythos, lui, est né dans une feuille de route commerciale.

    Le risque de prolifération hante l'ensemble de la communauté de sécurité. Anthropic a indiqué ne pas avoir l'intention de rendre Claude Mythos Preview accessible au grand public, mais son objectif à terme est de permettre à ses utilisateurs de déployer des modèles de la classe Mythos à grande échelle, pas seulement pour la cybersécurité, mais pour l'ensemble des bénéfices qu'apporterait un modèle aussi capable. L'entreprise estime elle-même, selon plusieurs sources, que des modèles aux capacités comparables pourraient être disponibles dans des programmes open source ou étrangers dans un délai de six à dix-huit mois.

    Une rencontre à la Maison-Blanche et des « prochaines étapes »

    Le PDG d'Anthropic, Dario Amodei, a rencontré vendredi la chef de cabinet de la Maison-Blanche, Susie Wiles, et le secrétaire au Trésor Scott Bessent pour discuter de l'utilisation de Mythos au sein de l'État et des plans plus larges d'Anthropic en matière de sécurité. Selon des sources, les prochaines étapes envisagées à l'issue de cette réunion concerneraient la manière dont les ministères autres que le Pentagone pourraient s'engager avec le modèle. Les deux parties ont qualifié la réunion de productive.

    Un responsable de l'administration a déclaré que le gouvernement « a la responsabilité d'évaluer chaque modèle pour voir où se situe la frontière technologique », tout en accusant Anthropic d'utiliser des « tactiques de la peur » en émettant des avertissements sur la capacité de Mythos à démultiplier les capacités d'attaque informatique.

    La formule résume assez bien l'impasse : Anthropic est accusée de dramatiser les capacités offensives de son propre modèle, des capacités que la NSA utilise pourtant activement, en dehors de tout cadre contractuel officiel, pour ses opérations de renseignement. On comprend mal comment une entreprise peut être simultanément condamnée pour avoir alerté sur les risques de sa technologie et mise à l'index pour avoir refusé d'en abandonner les garde-fous.

    Sources : Anthropic, FPJ, Axios

    Et vous ?

    La ligne rouge d'Anthropic est-elle tenable ? En refusant d'autoriser l'usage de ses modèles pour des armes autonomes et la surveillance de masse, Anthropic assume un rôle de régulateur privé que ni le Congrès ni l'exécutif ne lui ont confié. Est-ce légitime, ou constitue-t-il un précédent dangereux pour la gouvernance de l'IA ?

    Que révèle l'usage clandestin de Mythos par la NSA sur les limites réelles de l'autorité présidentielle en matière technologique ? Si une directive exécutive peut être contournée par une agence de renseignement parce que la technologie en jeu est jugée trop précieuse, quelle est la valeur réelle de ces décrets dans l'ère de l'IA ?

    La comparaison avec WannaCry et NotPetya est-elle pertinente ou alarmiste ? Le Projet Glasswing représente-t-il une réponse structurelle suffisante à la menace de prolifération d'un modèle aux capacités offensives inédites, ou s'agit-il d'une course contre la montre perdue d'avance ?

    OpenAI a accepté les termes militaires qu'Anthropic a refusés : cela crée-t-il une distorsion structurelle dans l'écosystème IA américain ? Quelles conséquences pour les entreprises qui choisissent de conserver des lignes éthiques dans leurs contrats gouvernementaux ?

    L'accès au Projet Glasswing reste limité à une cinquantaine d'organisations parmi les plus puissantes de la planète : qui protège les infrastructures critiques des petites collectivités, des hôpitaux régionaux ou des pays sans accès à ce consortium ?
    Contribuez au club : Corrections, suggestions, critiques, ... : Contactez le service news et Rédigez des actualités

  3. #3
    Communiqués de presse

    Femme Profil pro
    Traductrice Technique
    Inscrit en
    Juin 2023
    Messages
    2 941
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France

    Informations professionnelles :
    Activité : Traductrice Technique

    Informations forums :
    Inscription : Juin 2023
    Messages : 2 941
    Par défaut Mozilla : Mythos d’Anthropic a détecté 271 failles de sécurité dans Firefox 150
    Mythos d’Anthropic a détecté 271 failles de sécurité dans Mozilla Firefox 150, Mozilla affirme que ce nouveau modèle d’IA est « tout aussi performant » que les meilleurs chercheurs en sécurité au monde

    Mozilla, le développeur du navigateur Firefox, a récemment déclaré qu’une première version du modèle d’IA Claude Mythos d’Anthropic avait permis d’identifier 271 vulnérabilités dans le navigateur lors de tests internes. Ces bogues ont été corrigés. Mozilla a déclaré que le nouveau système d’IA pouvait analyser le code source et identifier les vulnérabilités d’une manière qui dépendait auparavant d’une expertise humaine rare. « À mesure que ces capacités sont mises à la disposition d’un plus grand nombre de défenseurs, de nombreuses autres équipes éprouvent désormais le même vertige que nous avons ressenti lorsque ces résultats ont été mis en évidence pour la première fois », a écrit Mozilla.

    Fin mars, un modèle d'IA d'Anthropic a fait l'objet d'une fuite avant même son lancement et a fait grand bruit sur les réseaux sociaux. Le nouveau modèle, dont le nom de code est « Claude Mythos », a été révélé accidentellement après que des descriptions du modèle ont été stockées dans un cache de données accessible au public. Après la révélation de la fuite du modèle d'IA, un porte-parole d'Anthropic a confirmé son existence et a souligné que le modèle représentait « un changement radical » en termes de performances d'IA et qu'il était « le plus performant que nous ayons construit à ce jour ». Il a notamment déclaré : « Compte tenu de la puissance de ses capacités, nous réfléchissons mûrement à la manière dont nous allons le commercialiser. »

    Puis quelques jours plus tard, Anthropic a annoncé qu'il ne commercialiserait pas son tout dernier modèle, Mythos, au grand public, invoquant la crainte qu'il ne soit trop efficace pour détecter des failles de cybersécurité de gravité élevée dans les principaux systèmes d'exploitation et navigateurs web. « L'augmentation considérable des capacités de Claude Mythos Preview nous a amenés à décider de ne pas le rendre accessible au grand public. Nous l'utilisons plutôt dans le cadre d'un programme de cybersécurité défensive avec un groupe restreint de partenaires », a écrit Anthropic dans la fiche technique du modèle.

    Dans ce contexte, Mozilla, le développeur du navigateur Firefox, a récemment déclaré qu’une première version du modèle d’IA Claude Mythos d’Anthropic avait permis d’identifier 271 vulnérabilités dans le navigateur lors de tests internes. Ces bogues ont été corrigés. Ces résultats soulignent la capacité des systèmes d’IA avancés à analyser de vastes bases de code et à localiser des faiblesses qui nécessitaient auparavant un examen manuel approfondi par des chercheurs en cybersécurité humains.

    « À mesure que ces capacités sont mises à la disposition d’un plus grand nombre de défenseurs, de nombreuses autres équipes éprouvent désormais le même vertige que nous avons ressenti lorsque ces résultats ont été mis en évidence pour la première fois », a écrit Mozilla. « Pour une cible bien protégée, un seul de ces bugs aurait constitué une alerte rouge en 2025, et en découvrir autant d’un seul coup nous amène à nous demander s’il est même possible de suivre le rythme. »

    Nom : 1.jpg
Affichages : 72993
Taille : 16,0 Ko

    Mozilla avait auparavant testé un autre modèle d’Anthropic qui avait identifié 22 bogues sensibles en matière de sécurité dans une version précédente de Firefox. Malgré ces succès, Mozilla a reconnu que le secteur de la cybersécurité considérait depuis longtemps l’élimination totale des failles logicielles comme un « objectif irréaliste ». « Jusqu’à présent, le secteur a largement mené une lutte à égalité contre les menaces de sécurité », a écrit l’entreprise. « Les éditeurs de logiciels critiques exposés à Internet, comme Firefox, prennent la sécurité extrêmement au sérieux et disposent d’équipes qui se lèvent chaque matin en réfléchissant à la manière d’assurer la sécurité des utilisateurs. »

    Mozilla a déclaré que le nouveau système d’IA pouvait analyser le code source et identifier les vulnérabilités d’une manière qui dépendait auparavant d’une expertise humaine rare. Cependant, Mozilla a indiqué que la société était encouragée de constater qu’aucun bug n’avait été trouvé qui n’aurait pas pu être découvert par « un chercheur humain d’élite ». « Certains commentateurs prédisent que les futurs modèles d’IA mettront au jour des formes de vulnérabilités entièrement nouvelles qui défient notre compréhension actuelle, mais nous ne le pensons pas », ont-ils déclaré. « Les logiciels comme Firefox sont conçus de manière modulaire afin que les humains puissent en vérifier la justesse. Ils sont complexes, mais pas arbitrairement complexes. »

    Les résultats suggèrent toutefois que les outils d’IA pourraient permettre aux développeurs de détecter un grand nombre de vulnérabilités avant que les attaquants ne les exploitent — même si, à l’inverse, entre de mauvaises mains, cela pourrait causer de gros problèmes tant aux éditeurs de logiciels qu’aux utilisateurs. Lancé en mars, Mythos est le modèle le plus avancé d’Anthropic pour les tâches de raisonnement, de codage et de cybersécurité. Des documents internes de l’entreprise décrivent le système comme faisant partie d’une nouvelle gamme de modèles allant au-delà de la série Opus précédente de l’entreprise. Les tests menés avant la sortie du modèle ont montré qu’il pouvait identifier des milliers de vulnérabilités jusque-là inconnues sur les principaux systèmes d’exploitation et navigateurs web.

    Anthropic a limité l’accès au système via un programme restreint appelé Project Glasswing, qui permet à certaines entreprises technologiques — notamment Amazon, Apple et Microsoft — d’utiliser le modèle pour analyser les logiciels à la recherche de failles. Cela reflète un effort croissant au sein du secteur de la cybersécurité pour utiliser des systèmes d’IA afin d’identifier et de corriger les vulnérabilités avant que les attaquants ne puissent les exploiter.

    Cependant, cette même technologie pourrait également permettre de nouvelles formes de cyberattaques. Les chercheurs en sécurité affirment que les systèmes d’IA capables d’analyser du code à grande échelle pourraient automatiser la découverte de vulnérabilités exploitables dans les logiciels largement utilisés.

    Après le lancement de Mythos, des tests menés par l’AI Security Institute au Royaume-Uni ont révélé que l’IA pouvait exécuter de manière autonome des opérations cybernétiques complexes, notamment mener à bien une simulation d’attaque en plusieurs étapes contre un réseau d’entreprise sans assistance humaine. Ces capacités ont attiré l’attention tant des gouvernements que des agences de renseignement.

    Malgré l'appel lancé par l'administration du président Donald Trump pour cesser d'utiliser la technologie d'Anthropic en raison d'un désaccord sur son utilisation dans le cadre de la guerre et de la surveillance, il a été révélé que l'Agence nationale de sécurité (NSA) utilisait Claude Mythos Preview sur des réseaux classifiés, selon des sources proches du déploiement. L'utilisation de Mythos souligne l'intérêt croissant des agences de sécurité américaines pour la capacité du modèle à identifier les vulnérabilités logicielles critiques.

    Les performances du modèle ont également mis en évidence les limites des systèmes d'évaluation de l'IA existants. Au début du mois, Anthropic a reconnu que plusieurs benchmarks de cybersécurité ne suffisaient plus à mesurer les capacités de ses tout derniers modèles. Mozilla a déclaré que ces résultats laissaient entrevoir un changement potentiel dans le domaine de la cybersécurité, où les défenseurs pourraient commencer à réduire l'avantage dont bénéficient depuis longtemps les attaquants.

    « Nous sommes extrêmement fiers de la manière dont notre équipe a su relever ce défi, et d’autres en feront de même », a écrit Mozilla. « Notre travail n’est pas terminé, mais nous avons franchi un cap et entrevoyons un avenir bien plus prometteur que celui où nous nous contenterions de suivre le mouvement. Les défenseurs ont enfin une chance de l’emporter, et de manière décisive. »

    Voici le rapport de Mozilla :

    Nom : 2.jpg
Affichages : 15713
Taille : 8,6 Ko

    Les failles « zero-day » sont en voie de disparition

    Depuis février, l'équipe Firefox travaille sans relâche à l'aide de modèles d'IA de pointe pour détecter et corriger les failles de sécurité latentes du navigateur. Nous avons déjà évoqué notre collaboration avec Anthropic pour analyser Firefox à l'aide d'Opus 4.6, ce qui a permis de corriger 22 bogues critiques pour la sécurité dans Firefox 148.

    Dans le cadre de notre collaboration continue avec Anthropic, nous avons eu l’occasion d’appliquer une version préliminaire de Claude Mythos Preview à Firefox. La version 150 de Firefox, sortie cette semaine, inclut des correctifs pour 271 vulnérabilités identifiées lors de cette évaluation initiale.

    À mesure que ces capacités sont mises à la disposition d’un plus grand nombre de défenseurs, de nombreuses autres équipes ressentent désormais le même vertige que nous avons éprouvé lorsque ces résultats ont été mis en évidence pour la première fois. Pour une cible bien protégée, un seul de ces bugs aurait constitué une alerte rouge en 2025, et en voir autant d’un seul coup nous amène à nous demander s’il est même possible de suivre le rythme.

    Notre expérience est porteuse d’espoir pour les équipes qui parviennent à surmonter ce vertige et à se mettre au travail. Il vous faudra peut-être redéfinir vos priorités pour vous concentrer sans relâche et avec détermination sur cette tâche, mais il y a de la lumière au bout du tunnel. Nous sommes extrêmement fiers de la manière dont notre équipe a relevé ce défi, et d’autres en feront de même. Notre travail n’est pas terminé, mais nous avons franchi un cap et pouvons entrevoir un avenir bien meilleur que le simple fait de suivre le rythme. Les défenseurs ont enfin une chance de gagner, de manière décisive.

    Jusqu’à présent, le secteur a largement mené une lutte à égalité en matière de sécurité. Les éditeurs de logiciels critiques exposés à Internet, comme Firefox, prennent la sécurité très au sérieux et disposent d’équipes qui se lèvent chaque matin en réfléchissant à la manière d’assurer la sécurité des utilisateurs. Néanmoins, nous avons tous depuis longtemps admis en silence que réduire à zéro les exploits était un objectif irréaliste. Au lieu de cela, nous avons cherché à les rendre si coûteux que seuls des acteurs disposant de budgets pratiquement illimités puissent se les permettre, et que le coût de la destruction d’un actif aussi onéreux dissuade ces acteurs de les utiliser à la légère.

    En effet, jusqu’à présent, la sécurité a été dominée par l’offensive : la surface d’attaque n’est pas infinie, mais elle est suffisamment vaste pour qu’il soit difficile de la défendre de manière exhaustive avec les outils dont nous disposons. Cela confère aux attaquants un avantage asymétrique, puisqu’il leur suffit de trouver une seule faille dans l’armure.

    Nous utilisons la défense en profondeur pour mettre en place plusieurs couches de défenses qui se chevauchent, mais aucune couche n’est à l’épreuve des balles. Firefox exécute chaque site web dans un bac à sable (sandbox) distinct, mais les attaquants tentent de combiner des bogues dans le code de rendu avec des bogues dans le bac à sable pour s'échapper vers un contexte plus privilégié. Nous avons été à l'avant-garde de l'industrie dans le développement et l'adoption de Rust, mais nous ne pouvons toujours pas nous permettre d'arrêter tout pour réécrire des décennies de code C++, d'autant plus que Rust n'atténue que certaines classes (très courantes) de vulnérabilités.

    Nous associons l'ingénierie de la défense en profondeur à une équipe rouge interne chargée de rester à la pointe des techniques d'analyse automatisée. Jusqu'à récemment, il s'agissait principalement de techniques d'analyse dynamique comme le fuzzing. Le fuzzing est très efficace dans la pratique, mais certaines parties du code sont plus difficiles à fuzzer que d'autres, ce qui conduit à une couverture inégale.

    Les chercheurs en sécurité d’élite trouvent des bogues que les fuzzers ne peuvent pas détecter, principalement en analysant le code source. Cette méthode est efficace, mais chronophage et dépend de l’expertise humaine, qui est une ressource rare. Il y a quelques mois, les ordinateurs étaient totalement incapables de le faire, et aujourd’hui, ils excellent dans ce domaine. Nous avons de nombreuses années d’expérience à décortiquer le travail des meilleurs chercheurs en sécurité du monde, et Mythos Preview est tout aussi performant. Jusqu’à présent, nous n’avons trouvé aucune catégorie ni aucune complexité de vulnérabilité que les humains peuvent détecter et que ce modèle ne peut pas.

    Cela peut sembler terrifiant à court terme, mais c’est finalement une excellente nouvelle pour les défenseurs. Un écart entre les bogues détectables par les machines et ceux détectables par les humains favorise l’attaquant, qui peut consacrer de nombreux mois d’efforts humains coûteux à la recherche d’un seul bogue. Combler cet écart érode l’avantage à long terme de l’attaquant en rendant toutes les découvertes peu coûteuses.

    Il est encourageant de constater que nous n’avons pas non plus observé de bogues qui n’auraient pas pu être détectés par un chercheur humain d’élite. Certains commentateurs prédisent que les futurs modèles d’IA mettront au jour des formes de vulnérabilités entièrement nouvelles qui défient notre compréhension actuelle, mais nous ne le pensons pas. Les logiciels comme Firefox sont conçus de manière modulaire afin que les humains puissent en vérifier la justesse. Ils sont complexes, mais pas arbitrairement complexes¹.

    Les défauts sont finis, et nous entrons dans un monde où nous pouvons enfin tous les trouver.

    Source : Rapport de Mozilla

    Et vous ?

    Pensez-vous que ce rapport est crédible ou pertinent ?
    Quel est votre avis sur le sujet ?

    Voir aussi :

    L'IA Claude Opus 4.6 d'Anthropic a analysé le code du navigateur Firefox et a trouvé plus de 100 bogues, soit plus de bogues en deux semaines que le nombre total signalé dans le monde en deux mois

    Le monde «pourrait ne pas avoir le temps» de se préparer aux risques liés à la sécurité de l'IA, selon un chercheur. L'industrie joue-t-elle avec le feu en déployant des systèmes que personne ne maîtrise ?

    Mythos, le modèle IA trop dangereux pour être publié, accessible à des inconnus : comment un groupe de curieux sur Discord a contourné le dispositif de contrôle dans la chaîne de sous-traitance d'Anthropic
    Publication de communiqués de presse en informatique. Contribuez au club : corrections, suggestions, critiques, ... Contactez le service news et Rédigez des actualités

  4. #4
    Inactif  

    Homme Profil pro
    Administrateur de base de données
    Inscrit en
    Mars 2013
    Messages
    10 084
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Canada

    Informations professionnelles :
    Activité : Administrateur de base de données

    Informations forums :
    Inscription : Mars 2013
    Messages : 10 084
    Par défaut Mythos, le modèle IA trop dangereux pour être publié par Anthropic, accessible à des inconnus
    Mythos, le modèle IA trop dangereux pour être publié, accessible à des inconnus :
    comment un groupe de curieux sur Discord a contourné le dispositif de contrôle dans la chaîne de sous-traitance d'Anthropic

    Deux semaines après avoir annoncé en grande pompe Mythos, son modèle d'intelligence artificielle conçu pour la cybersécurité défensive, Anthropic se retrouve face à un scénario embarrassant : un groupe de particuliers non autorisés aurait réussi à accéder à l'outil, contournant la stratégie de diffusion contrôlée que la société présentait comme une réponse responsable à la dangerosité de sa propre technologie. L'incident pose des questions qui dépassent largement le cas Anthropic et touchent aux fondements même de la gouvernance des modèles d'IA dits à haut risque.

    Pour comprendre la portée de cet accès non autorisé, il faut d'abord saisir ce qu'est Claude Mythos Preview et pourquoi Anthropic a fait un tel effort de communication lors de son annonce le 7 avril 2026. Il s'agit d'un modèle de langage à usage général qui présente des capacités remarquables dans les tâches de sécurité informatique Anthropic, au point qu'Anthropic a elle-même choisi de ne pas le rendre disponible au grand public.

    Les démonstrations techniques publiées par l'équipe rouge d'Anthropic ont de quoi saisir même les professionnels aguerris. Mythos Preview a identifié et exploité de façon entièrement autonome une vulnérabilité d'exécution de code à distance vieille de 17 ans dans FreeBSD, permettant à n'importe qui d'obtenir les droits root sur une machine exécutant NFS. Dans un autre cas, le modèle a produit un exploit pour navigateur web enchaînant quatre vulnérabilités distinctes, avec une technique d'échappement des bacs à sable du moteur de rendu et du système d'exploitation.

    L'Institut britannique de sécurité de l'IA (UK AI Security Institute) a qualifié Mythos de premier modèle d'IA capable de compléter son test simulant une attaque prenant le contrôle d'un réseau entier Foreign Policy, avec toutefois la réserve que les environnements de test utilisés ne reproduisaient pas fidèlement les défenses de systèmes réels. Mythos Preview a déjà identifié des milliers de vulnérabilités de haute gravité, y compris dans chaque système d'exploitation majeur et chaque navigateur web.

    Face à ces capacités jugées trop dangereuses pour une diffusion publique, Anthropic a opté pour une stratégie de déploiement restreint. Le modèle est accessible dans le cadre d'une initiative baptisée Project Glasswing, impliquant 12 organisations partenaires pour des travaux de sécurité défensive sur des logiciels critiques, avec 40 organisations ayant accès à la préversion au total. Parmi elles figurent Microsoft, Apple, Google, CrowdStrike et JPMorgan Chase. Anthropic engage jusqu'à 100 millions de dollars en crédits d'utilisation pour ces acteurs, ainsi que 4 millions de dollars en dons directs à des organisations de sécurité open source comme OpenSSF et la Fondation Apache. Le principe : donner aux défenseurs une longueur d'avance avant que des modèles aux capacités équivalentes ne tombent entre les mains d'acteurs malveillants.

    La société précise qu'elle n'a pas explicitement entraîné Mythos Preview pour ces capacités offensives : elles sont apparues comme une conséquence indirecte des améliorations générales en matière de code, de raisonnement et d'autonomie. Les mêmes progrès qui rendent le modèle plus efficace pour corriger des vulnérabilités le rendent également plus efficace pour les exploiter.

    Logan Graham, qui dirige l'équipe rouge offensive d'Anthropic, résume le problème avec une clarté désarmante : même si Mythos ne devait jamais être rendu public, il s'attend à ce que les concurrents d'Anthropic, y compris ceux basés en Chine, publient des modèles aux capacités de piratage comparables dans les mois ou années à venir.

    Le verrou s'ouvre le jour même de l'annonce

    C'est précisément cette stratégie de maîtrise que vient contredire le rapport de Bloomberg publié le 21 avril. Un petit groupe d'utilisateurs non autorisés a accédé à Mythos le jour même où Anthropic annonçait son plan de diffusion restreinte. Selon les informations recueillies par l'agence, ces individus font partie d'un forum privé en ligne, et leur accès aurait été obtenu via l'environnement d'un prestataire tiers travaillant pour Anthropic.

    Le groupe a employé plusieurs stratégies pour accéder au modèle, notamment en utilisant les accréditations d'une personne actuellement employée chez un sous-traitant travaillant pour Anthropic, personne qui a elle-même fourni des informations à Bloomberg dans le cadre de son enquête. Les membres du groupe appartiennent à un canal Discord consacré à la recherche d'informations sur les modèles d'IA non publiés.

    La méthode d'accès initiale révèle une forme de déduction technique plutôt qu'une attaque sophistiquée : le groupe a formulé une hypothèse éclairée sur l'emplacement en ligne du modèle, en s'appuyant sur leur connaissance du format qu'Anthropic utilise habituellement pour ses autres modèles. En d'autres termes, la surface d'attaque n'était pas un système ultra-sécurisé mais une convention de nommage prévisible; une faille de sécurité par l'obscurité que des observateurs attentifs pouvaient déduire.

    Le groupe a fourni des preuves à Bloomberg sous la forme de captures d'écran et d'une démonstration en direct du logiciel. Leur motivation déclarée : être « intéressés par l'exploration de nouveaux modèles, pas par le chaos ». Aucune activité malveillante n'a été documentée jusqu'à présent.


    La réponse d'Anthropic : investigation en cours, systèmes intacts

    La porte-parole d'Anthropic a communiqué une réaction mesurée, dans les termes habituels de ce type d'incident. « Nous enquêtons sur un rapport faisant état d'un accès non autorisé à Claude Mythos Preview via l'un de nos environnements de prestataires tiers », a-t-elle déclaré. La société indique n'avoir trouvé jusqu'à présent aucune preuve que l'activité non autorisée ait eu un impact sur les systèmes d'Anthropic.

    La distinction est importante : ce qui est mis en cause n'est pas une intrusion dans les infrastructures centrales d'Anthropic, mais une faille dans la chaîne de sous-traitance. L'allégation pointe vers un possible abus d'accès en dehors du réseau principal d'Anthropic, et non une compromission confirmée des défenses internes de l'entreprise. Ce cadrage, classique dans les incidents de ce type, permettra vraisemblablement à Anthropic de minimiser la portée opérationnelle de l'accès, mais ne règle pas la question de fond.

    La faille du maillon faible : les tiers au cœur du problème

    L'incident s'inscrit dans une dynamique bien connue de la sécurité des systèmes d'information : ce ne sont pas toujours les infrastructures centrales qui cèdent, mais les acteurs périphériques qui y sont connectés. La chaîne de sous-traitance représente, depuis des années, le principal vecteur d'incidents dans les déploiements d'IA en entreprise.

    Ce problème structurel n'est pas propre à Anthropic. Les grands déploiements technologiques s'appuient invariablement sur un réseau de prestataires, intégrateurs et développeurs tiers dont les pratiques de sécurité sont hétérogènes. Pour un modèle comme Mythos, dont la dangerosité justifie une diffusion restreinte à une cinquantaine d'organisations de confiance à l'échelle mondiale, la question de la sécurité de chaque nœud de la chaîne devient critique.

    L'épisode met en lumière une tension persistante : comment un modèle frontier restrictif peut-il rester inaccessible alors même que des dizaines d'organisations et leurs prestataires y ont accès ? La réponse est qu'il ne le peut pas totalement et que la stratégie de diffusion contrôlée repose sur une hypothèse de contrôle qui s'avère plus fragile qu'annoncée.

    Nom : anthro.png
Affichages : 6221
Taille : 428,7 Ko

    Bruce Schneier et les critiques : le jeu de la communication de risque

    L'incident survient dans un contexte où la stratégie de communication d'Anthropic autour de Mythos faisait déjà l'objet d'un examen critique dans la communauté de la sécurité. Bruce Schneier, l'une des voix les plus respectées de la cryptographie et de la sécurité des systèmes, avait qualifié l'annonce de Mythos de « coup de communication » par Anthropic, notant que de nombreux journalistes avaient repris sans distance critique les éléments de langage de la société.

    La technologie et les sociétés ont une longue histoire à mettre en garde contre les dangers de leurs propres produits, OpenAI ayant averti dès 2019 que son modèle GPT-2 était « trop dangereux pour être publié » avant de le diffuser largement quelques mois plus tard. L'auto-restriction présentée comme vertu est aussi un outil marketing : elle positionne l'entreprise comme acteur responsable tout en entretenant le mystère et l'aura de puissance autour du produit.

    Des analystes ont néanmoins salué la décision d'Anthropic de constituer une coalition défensive avant toute diffusion large, estimant qu'il s'agit d'un précédent sans équivalent dans l'histoire des outils de sécurité offensifs : ni Metasploit, ni Cobalt Strike, ni les outils de la NSA divulgués par les Shadow Brokers n'ont été accompagnés d'une telle réponse défensive coordonnée au moment de leur émergence publique. Ce point mérite d'être reconnu sans être idéalisé.

    Voici un extrait des propos de Bruce Schneier :

    « Il y a beaucoup à dire à ce sujet, et j'espère écrire une analyse plus approfondie la semaine prochaine, mais voici quelques observations rapides.

    « Premièrement : Il s'agit clairement d'une opération de relations publiques de la part d'Anthropic – et ça a fonctionné. De nombreux journalistes reprennent en chœur les arguments d'Anthropic, sans les examiner de manière critique. OpenAI, sans doute agacée par l'engouement médiatique autour du nouveau modèle d'Anthropic et désireuse de se faire remarquer, a annoncé que son modèle est tout aussi inquiétant et qu'il ne sera pas non plus rendu public.

    « Deuxièmement : Ces modèles démontrent une sophistication accrue dans leurs capacités de cyberattaque. Ils créent des exploits efficaces – en exploitant les vulnérabilités qu'ils découvrent et en les rendant opérationnelles – sans intervention humaine. Ils peuvent identifier des vulnérabilités plus complexes*: enchaîner plusieurs failles de corruption de mémoire, par exemple. Et ils peuvent accomplir davantage de tâches avec une simple instruction, sans nécessiter d'orchestration ni d'infrastructure de configuration d'agents.

    « Troisièmement : Anthropic a peut-être une bonne équipe de relations publiques, mais le problème ne vient pas de Mythos Preview. La société de sécurité Aisle a réussi à reproduire les vulnérabilités découvertes par Anthropic à l’aide de modèles publics plus anciens et moins coûteux. Or, il y a une différence entre découvrir une vulnérabilité et la transformer en attaque. Cela met en évidence un avantage actuel pour la défense. Il est plus facile pour une IA de détecter une vulnérabilité en vue de la corriger que de la détecter puis de l’exploiter. Cet avantage est susceptible de s’amenuiser à mesure que des modèles toujours plus puissants seront mis à la disposition du grand public.

    « Quatrièmement : Tous ceux qui s’inquiètent des conséquences de cette situation ont raison quant à l’ampleur du problème, même s’il est impossible de prédire avec exactitude le calendrier. Le changement radical vient peut-être de se produire avec les nouveaux modèles d’Anthropic et d’OpenAI. Il a peut-être eu lieu il y a six mois. Il se produira peut-être dans six mois. Il se produira, j’en suis certain, et plus tôt que nous ne le pensons. Nous ne pouvons pas prédire dans quelle mesure ces modèles vont encore progresser, mais le logiciel semble être un langage spécialisé particulièrement adapté aux IA. »

    Les implications pour la gouvernance de l'IA à haut risque

    Ce que révèle véritablement l'accès non autorisé à Mythos, c'est l'absence d'un cadre institutionnel robuste pour la gouvernance des modèles d'IA à capacités offensives. La longueur d'avance défensive que procure le Projet Glasswing se mesure en mois et son efficacité dépend entièrement du sérieux avec lequel l'industrie, la communauté open source, les opérateurs d'infrastructures critiques et les gouvernements exploitent la fenêtre d'opportunité ainsi créée.

    La Chine, la Russie et d'autres acteurs étatiques sophistiqués ont massivement investi dans l'IA et les opérations cyber offensives. Contrairement à Anthropic, ils n'ont aucune incitation à divulguer ce qu'ils trouvent. Et dans les démocraties occidentales elles-mêmes, les capacités développées à des fins défensives tendent historiquement à être réaffectées à des usages offensifs une fois absorbées par les agences de renseignement, avec les risques de prolifération incontrôlée que cela implique.

    L'épisode Mythos et la divulgation précédente par Anthropic en novembre d'une campagne de cyber-espionnage assistée par IA attribuée à un groupe parrainé par l'État chinois montrent une entreprise qui tente de sécuriser un modèle puissant avant sa diffusion plus large, tout en étant confrontée à la réalité que les contrôles d'accès peuvent faillir même quand le système central reste intact.

    La véritable question n'est pas de savoir si un groupe de curieux a navigué sans permission dans un environnement de prévisualisation, mais plutôt de savoir si l'architecture de gouvernance actuelle, reposant sur la bonne volonté des entreprises et la solidité de leurs chaînes de sous-traitance, est à la hauteur des risques que portent les modèles d'IA de prochaine génération.

    Sources : Bloomberg, Bruce Schneier, vidéo dans le texte

    Et vous ?

    La stratégie de diffusion contrôlée, donner accès à quelques dizaines d'organisations de confiance, est-elle réellement une barrière de sécurité, ou surtout un outil de positionnement concurrentiel pour Anthropic ?

    Peut-on raisonnablement sécuriser un modèle d'IA à capacités offensives dans un écosystème de sous-traitance aussi étendu que celui d'un grand groupe technologique mondial ?

    L'incident Mythos plaide-t-il pour un régulateur indépendant ayant autorité sur la diffusion des modèles à haut risque, ou risque-t-on de créer une bureaucratie inefficace face à la vélocité du secteur ?

    La communication d'Anthropic autour de la « dangerosité » de Mythos sert-elle réellement la sécurité collective, ou crée-t-elle une demande supplémentaire de la part d'acteurs cherchant précisément à accéder à ce qui est interdit ?

    Si des modèles aux capacités équivalentes à Mythos émergent inévitablement chez d'autres acteurs, y compris dans des États sans contraintes éthiques, la stratégie de retenue d'Anthropic a-t-elle un sens à long terme ?
    Contribuez au club : Corrections, suggestions, critiques, ... : Contactez le service news et Rédigez des actualités

  5. #5
    Membre très actif
    Profil pro
    Développeur indépendant
    Inscrit en
    Août 2004
    Messages
    380
    Détails du profil
    Informations personnelles :
    Âge : 57
    Localisation : France

    Informations professionnelles :
    Activité : Développeur indépendant
    Secteur : Transports

    Informations forums :
    Inscription : Août 2004
    Messages : 380
    Par défaut et nous..
    qu'attends l'ansi pour se mettre à la page et passer les services Français au crible de cette machine.?? ben ca pose un très gros problème en fait. car pour ca il faudrait alimenter claude avec les sources des dits services..
    alors est-ce que mistral a les mêmes capacités ou approchantes? parce que , si on regarde les news récentes, c'est une avalanche de piratages et de pénétrations des services de l'état ou affiliés. l'informatique française est elle devenue une passoire gérée par des imbéciles incompétents.?
    il serait temps d'oser se poser la question au vu des faits. pour résoudre un probléme, il faut oser le nommer pour le reconnaitre. hors, j'ai l'impression que à part, 'circulez ya rien à voir', rien n'est fait pour prévenir, auditer correctement et sécuriser les services de l'état et des grandes entreprises dont nous dépendons tous.

  6. #6
    Inactif  

    Homme Profil pro
    Administrateur de base de données
    Inscrit en
    Mars 2013
    Messages
    10 084
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Canada

    Informations professionnelles :
    Activité : Administrateur de base de données

    Informations forums :
    Inscription : Mars 2013
    Messages : 10 084
    Par défaut Mozilla affirme que les 271 vulnérabilités découvertes par Mythos ne présentent «quasiment aucun faux positif»
    Mozilla affirme que les 271 vulnérabilités découvertes par Claude Mythos ne présentent « quasiment aucun faux positif » :
    percée historique ou opération de communication savamment orchestrée par Anthropic pour justifier un consortium à accès restreint ?

    En deux mois, l'outil d'analyse de vulnérabilités Claude Mythos Preview d'Anthropic a identifié 271 failles inconnues dans le code source de Firefox, dont certaines dormaient depuis vingt ans. Mozilla crie au miracle, les ingénieurs de sécurité indépendants crient au bluff. Entre percée technologique réelle et narratif commercial soigneusement orchestré, le dossier mérite une lecture attentive.

    Depuis février 2026, l'équipe Firefox travaille en collaboration étroite avec Anthropic pour débusquer des vulnérabilités latentes dans le navigateur. Une première phase, menée avec Claude Opus 4.6, avait abouti à la correction de 22 bogues dans Firefox 148. L'application de Claude Mythos Preview à Firefox 150 a permis d'en identifier 271 supplémentaires en une seule évaluation initiale.

    Le bilan d'avril est historique : 423 bogues de sécurité corrigés en un seul mois. Outre les 271 identifiés par Mythos, 41 provenaient de rapports externes, et les 111 restants d'autres méthodes internes, dont une partie attribuée au même pipeline tournant sur d'autres modèles.

    La répartition par criticité est éloquente. Sur les 271 vulnérabilités annoncées pour Firefox 150 : 180 étaient de niveau sec-high, 80 sec-moderate et 11 sec-low. Mozilla précise que les niveaux critical et high désignent des failles exploitables par un simple utilisateur naviguant sur une page web ordinaire.

    Parmi les exemples rendus publics par Mozilla pour asseoir la crédibilité de la démarche : une faille vieille de quinze ans dans l'élément HTML <legend>, un bogue XSLT datant de vingt ans impliquant des appels récursifs à la fonction key(), une race condition via IPC permettant à un processus compromis de manipuler des compteurs IndexedDB et de provoquer un use-after-free, ainsi qu'un dépassement de tampon lors du traitement HTTPS RR et ECH déclenché en simulant un serveur DNS malveillant. Pour mémoire, une race condition est une erreur critique qui survient lorsqu'un programme, exécuté par plusieurs threads ou processus en parallèle, accède et modifie une ressource partagée (mémoire, fichier) de manière non coordonnée.

    La rupture technologique : l'agent qui vérifie lui-même ses hypothèses

    Ce qui distingue cette campagne des tentatives antérieures, ce n'est pas le modèle seul, mais l'infrastructure qui l'entoure. Les premières expérimentations internes de Mozilla avec GPT-4 et Claude Sonnet 3.5 en analyse statique avaient produit un taux de faux positifs rédhibitoire, rendant toute mise à l'échelle impossible. L'introduction de harnais agentiques a tout changé : l'IA peut désormais construire et exécuter ses propres cas de test pour vérifier dynamiquement si un bogue suspecté existe réellement avant de le rapporter.

    Ce pipeline s'avère extrêmement fiable pour filtrer les faux positifs, à condition de disposer d'une condition de succès clairement définie. Les problèmes de corruption mémoire sont particulièrement faciles à valider : soit l'Address Sanitizer est déclenché, soit il ne l'est pas. Au total, moins de quinze faux positifs ont été observés sur l'ensemble de la campagne, causés principalement par des modifications de préconditions de test. Chaque occurrence entraîne une mise à jour du harnais pour éviter les récidives.

    Le pipeline tourne en parallèle sur plusieurs machines virtuelles éphémères, chacune assignée à un fichier cible spécifique. La puissance de feu est donc horizontalement scalable. Mozilla prévoit de l'intégrer directement dans son processus de développement afin que chaque nouveau commit soit automatiquement examiné avant d'être fusionné dans la base de code principale.

    Nom : bug.png
Affichages : 101452
Taille : 38,9 Ko
    Capture d'écran d'une partie du tableau des bugs répertoriés par Mozilla

    Ce que Mythos a validé autant que découvert

    Un résultat moins médiatisé, mais que les ingénieurs de Mozilla jugent tout aussi précieux : plusieurs tentatives d'exploitation ciblant une technique appelée Prototype Pollution ont échoué, parce que Mozilla avait adopté des décisions architecturales protectrices des années auparavant. Pour les développeurs, avoir la preuve directe que leurs défenses existantes tiennent toujours est aussi utile que de trouver de nouvelles vulnérabilités.

    Beaucoup des vulnérabilités découvertes ne suffisent pas à elles seules à constituer une attaque complète : elles doivent être chaînées avec d'autres failles. Mais ce sont précisément les types de faiblesses que les méthodes traditionnelles comme le fuzzing ont du mal à détecter, et l'analyse par IA couvre ce terrain de façon bien plus exhaustive.

    Le scepticisme des experts : de la percée au coup de com'

    La réaction de la communauté sécurité a été loin d'être unanime. Le chercheur Davi Ottenheimer a publié une analyse fouillée, soulignant plusieurs contradictions structurelles dans le narrative d'Anthropic autour de Claude Mythos.

    Des critiques ont d'abord raillé le fait que Mozilla n'ait obtenu aucun identifiant CVE pour les 271 vulnérabilités, pratique pourtant ordinaire pour des bugs découverts en interne, généralement regroupés dans un seul patch. Les rapports Bugzilla détaillant ces « rollups » restent masqués pendant plusieurs mois après correction pour protéger les utilisateurs lents à mettre à jour.

    La démonstration phare d'Anthropic portait sur un moteur SpiderMonkey en conteneur, avec le sandbox et les mécanismes de défense en profondeur de Firefox désactivés. Les bugs utilisés avaient en outre déjà été découverts par Claude Opus 4.6; Mythos ne les a pas trouvés, il les a reçus comme point de départ. Quand les deux bogues les plus facilement exploitables sont retirés du corpus, le taux de succès de Mythos chute drastiquement selon les données du system card d'Anthropic lui-même.

    La startup AISLE a reproduit les bogues phares du lancement d'Anthropic en les soumettant à huit modèles open-weights différents; tous les huit les ont détectés, y compris un modèle à 3,6 milliards de paramètres actifs coûtant 0,11 dollar par million de tokens. Leur conclusion : la valeur qui fait la différence est dans le système, pas dans le modèle.

    Fuzzing augmenté ou réelle rupture de paradigme ?

    La question de fond que pose ce débat est celle du positionnement de l'IA par rapport au fuzzing, technique dominante depuis des années dans la détection de vulnérabilités. Mozilla dispose d'une longue expérience du Rust et maintient une équipe de red team interne au fait des techniques d'analyse automatisée. Jusqu'à récemment, celles-ci consistaient principalement en techniques d'analyse dynamique comme le fuzzing. Le fuzzing est productif, mais certaines parties du code sont plus difficiles à couvrir que d'autres.

    Les chercheurs en sécurité de haut niveau trouvent des bogues qu'un fuzzer ne peut pas détecter en raisonnant sur le code source, une démarche efficace mais chronophage et tributaire d'une expertise humaine rare. Les ordinateurs en étaient totalement incapables il y a encore quelques mois. Maintenant, ils y excellent.

    C'est précisément là que réside l'intérêt réel de la démarche, au-delà du débat chiffré : plusieurs des vulnérabilités découvertes ne sont pas accessibles aux méthodes de fuzzing traditionnelles, qui peinent à capturer les logiques de chaînage de failles complexes. L'analyse par IA couvre ce terrain de manière nettement plus systématique.

    Nom : robot.png
Affichages : 23975
Taille : 388,5 Ko

    Glasswing, le consortium qui cristallise les inquiétudes

    Le vrai sujet de fond n'est peut-être pas les 271 bogues, mais ce qu'ils servent à justifier. En réservant l'accès à Mythos au seul consortium Glasswing (Apple, Google, Microsoft, Amazon, Broadcom, Cisco, CrowdStrike, JPMorganChase, Nvidia, Palo Alto Networks, Linux Foundation), Anthropic s'érige en autorité de facto pour l'attribution de l'accès à une capacité qu'elle déclare trop dangereuse pour une diffusion publique, sans base statutaire, sans supervision démocratique et avec une liste de partenaires constituée exclusivement des plus grands acteurs de l'industrie qu'elle prétend protéger.

    L'enveloppe de 100 millions de dollars annoncée pour le programme se décompose en réalité en crédits d'utilisation de Mythos Preview, auxquels s'ajoutent seulement 4 millions de dollars en dons effectifs à des organisations de sécurité open source. Les partenaires reçoivent l'accès à l'outil et la parole d'Anthropic certifiant que cet outil est extraordinaire.

    Ce que Mozilla retient, sans se laisser emporter

    Mozilla elle-même formule une mise en garde que peu de titres ont retranscrite : il existe un risque que les bases de code commencent à dépasser la compréhension humaine au fur et à mesure que l'IA prend davantage de place dans le processus de développement, faisant croître la complexité des bogues parallèlement (ou peut-être plus vite) que la capacité à les découvrir. La compréhensibilité humaine est une propriété essentielle à préserver, notamment dans des logiciels critiques comme les navigateurs et les systèmes d'exploitation.

    Brian Honan, expert en cybersécurité, retient surtout une leçon d'architecture défensive : les décisions passées de Mozilla d'appliquer des défenses en couches au sein de Firefox ont conduit Mythos à échouer à plusieurs reprises dans ses tentatives d'exploitation des vulnérabilités. Cela confirme ce que les professionnels de la cybersécurité défendent depuis des années : la sécurité doit être intégrée dès la conception, le développement et le déploiement.

    En définitive, l'affaire Mythos-Firefox livre deux enseignements distincts selon l'angle choisi. Du côté des praticiens : un pipeline agentique capable d'écrire et d'exécuter ses propres preuves de concept représente une avancée méthodologique réelle, qui complète, sans remplacer, les outils de fuzzing existants. Du côté de l'économie politique de l'IA : l'ampleur du narrative construit autour de ces 271 bogues, les circuits institutionnels qu'il a mobilisés en quelques jours, et la structure de gouvernance exclusive que cela a permis de bâtir, constituent un cas d'école en matière de capitalisation sur la peur pour ériger des barrières à l'entrée.

    Sources : Mozilla (1, 2)

    Et vous ?

    Percée historique ou opération de communication savamment orchestrée par Anthropic pour justifier un consortium à accès restreint ?

    La réduction des faux positifs est-elle vraiment le verrou qui était à lever ? Le fuzzing à grande échelle produit déjà d'énormes volumes de résultats bruts que les équipes peinent à trier. Un outil qui vérifie automatiquement ses propres hypothèses change-t-il fondamentalement l'équation, ou déplace-t-il simplement le goulot d'étranglement vers la capacité de patcher ?

    Vingt ans sans voir un bogue dans l'élément XSLT de Firefox : à qui la faute ? Cela trahit-il un déficit d'outillage, un manque de ressources humaines, ou la complexité intrinsèque d'une base de code accumulée sur plusieurs décennies de développement multi-contributeurs ?

    Le modèle de consortium fermé façon Glasswing est-il transposable positivement ? Peut-on imaginer une structure similaire sous supervision publique ou académique qui permettrait la diffusion contrôlée de ce type de capacité sans confier la clé aux acteurs qui ont le plus à gagner à la détenir en exclusivité ?

    Si un modèle open-weights à faible coût peut reproduire les résultats phares de Mythos, comme le prétend AISLE, quelle est la vraie valeur du produit payant ? Est-ce le modèle, l'infrastructure de harnais, le réseau de divulgation coordonnée, ou simplement l'accès au label d'Anthropic ?

    L'intégration de Mythos dans chaque commit de Firefox représente-t-elle un progrès ou un risque systémique ? Externaliser la détection de vulnérabilités à un outil propriétaire dont les mécanismes internes sont opaques crée-t-il une nouvelle forme de dépendance critique ?
    Contribuez au club : Corrections, suggestions, critiques, ... : Contactez le service news et Rédigez des actualités

  7. #7
    Communiqués de presse

    Homme Profil pro
    Rédacteur technique
    Inscrit en
    Avril 2025
    Messages
    748
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Rédacteur technique

    Informations forums :
    Inscription : Avril 2025
    Messages : 748
    Par défaut Le projet Glasswing d’Anthropic identifie plus de 10 000 vulnérabilités logicielles critiques
    Le projet Glasswing d’Anthropic, utilisant le modèle Claude Mythos Preview, a découvert plus de 10 000 vulnérabilités de gravité élevée ou critique dans des systèmes logiciels clés en l’espace d’un mois

    Le projet Glasswing d'Anthropic et ses partenaires ont utilisé le modèle Claude Mythos Preview pour découvrir plus de 10 000 vulnérabilités de gravité élevée ou critique dans des systèmes logiciels clés à travers le monde en l'espace d'un mois. Ce même scan IA a identifié plus de 6 200 failles graves dans plus de 1 000 projets open source. Le principal défi réside désormais dans la rapidité avec laquelle les équipes peuvent évaluer et corriger le volume de vulnérabilités identifiées.

    En avril 2026, le géant de l'IA Anthropic a annoncé qu'il ne commercialiserait pas au grand public son modèle Mythos, qui a fait l'objet d'une fuite avant même son lancement, invoquant la crainte qu'il ne soit trop efficace pour détecter des failles de cybersécurité de gravité élevée dans les principaux systèmes d'exploitation et navigateurs web. Anthropic avait alors lancé le projet Glasswing, un programme de cybersécurité défensive avec un groupe restreint de partenaires. Les partenaires du projet Glasswing ont accès à Claude Mythos Preview afin d'identifier et de corriger les vulnérabilités ou les faiblesses de leurs systèmes fondamentaux, notamment la détection locale des vulnérabilités, les tests de type « boîte noire » des binaires, la sécurisation des terminaux et les tests d'intrusion des systèmes.

    Puis en mai 2026, l'équipe de Mozilla a annoncé que l'outil d'analyse de vulnérabilités Claude Mythos Preview d'Anthropic a identifié 271 failles inconnues dans le code source de Firefox, dont certaines dormaient depuis vingt ans. La répartition par criticité est éloquente. Sur les 271 vulnérabilités annoncées pour Firefox 150 : 180 étaient de niveau sec-high, 80 sec-moderate et 11 sec-low. Mozilla précise que les niveaux critical et high désignent des failles exploitables par un simple utilisateur naviguant sur une page web ordinaire. Un rapport qui semble confirmer le programme d'Anthropic.

    Récemment, un rapport révèle que le projet Glasswing d'Anthropic et ses partenaires ont utilisé le modèle Claude Mythos Preview pour découvrir plus de 10 000 vulnérabilités de gravité élevée ou critique dans des systèmes logiciels clés à travers le monde en l'espace d'un mois. Ce même scan IA a identifié plus de 6 200 failles graves dans plus de 1 000 projets open source. Des évaluations indépendantes confirment que ce modèle surpasse largement les outils d’IA précédents et les testeurs humains, tant en termes de détection de bogues que de précision. Le principal défi réside désormais dans la rapidité avec laquelle les équipes peuvent évaluer et corriger le volume de vulnérabilités identifiées.

    Ce rapport intervient alors que des chercheurs de CalIF ont annoncé avoir découvert une première faille de sécurité liée à la mémoire de l'Apple M5 à l'aide de la version préliminaire de Claude Mythos d'Anthropic. La corruption de mémoire sur le M5 d'Apple prouve non seulement que cette puce peut également être exploitée, mais que le modèle Claude Mythos Preview d'Anthropic s'est révélé être un assistant IA clé. Cette attaque réussie contourne le Memory Integrity Enforcement (MIE), que Apple a présenté en septembre dernier comme le résultat d’une initiative de cinq ans visant à éradiquer les erreurs de mémoire.


    Voici le rapport d'Anthropic :

    Projet Glasswing : un premier bilan

    Le mois dernier, nous avons lancé le projet Glasswing, notre initiative collaborative visant à sécuriser les logiciels les plus critiques au monde avant que des modèles d’IA de plus en plus performants ne puissent s’en servir à des fins malveillantes.

    Depuis lors, avec nos quelque 50 partenaires, nous avons utilisé Claude Mythos Preview pour détecter plus de dix mille vulnérabilités de gravité élevée ou critique dans les logiciels les plus importants au monde sur le plan systémique. Auparavant, les progrès en matière de sécurité logicielle étaient limités par la rapidité avec laquelle nous pouvions détecter de nouvelles vulnérabilités. Aujourd’hui, ils sont limités par la rapidité avec laquelle nous pouvons vérifier, divulguer et corriger le grand nombre de vulnérabilités détectées par l’IA.

    Dans cet article, nous abordons ce que nous avons appris sur ce défi crucial pour la cybersécurité au cours des premières semaines du projet Glasswing. Nous nous concentrons sur les premières preuves publiques des performances de Mythos Preview, sur les résultats initiaux de nos efforts visant à analyser des milliers de projets logiciels open source, et sur ce que ces progrès signifient pour les cyberdéfenseurs aujourd’hui. Nous abordons également ce à quoi il faut s’attendre ensuite de la part du projet Glasswing, et comment nous envisageons de publier des modèles de la classe Mythos à l’avenir.

    Nos premiers résultats

    Notre approche pour présenter les conclusions de Mythos Preview

    La convention de longue date dans l’industrie du logiciel consiste à divulguer les nouvelles vulnérabilités 90 jours après leur découverte (ou, si un correctif est créé avant l’expiration de ce délai de 90 jours, environ 45 jours après la mise à disposition du correctif). Cela laisse le temps aux utilisateurs finaux de mettre à jour leurs logiciels avant qu’une vulnérabilité ne puisse être exploitée par des attaquants. Notre propre politique de divulgation coordonnée des vulnérabilités suit cette approche.

    Cependant, cela signifie que les vulnérabilités divulguées constituent un indicateur retardé de l’évolution rapide des capacités cybernétiques des modèles d’IA : nous n’en sommes pas encore au stade où nous pouvons détailler pleinement les découvertes de nos partenaires avec Mythos Preview sans mettre les utilisateurs finaux en danger. À la place, nous fournissons des exemples illustratifs des performances du modèle, ainsi que des statistiques agrégées sur nos progrès à ce jour. Une fois que les correctifs pour les vulnérabilités découvertes par Mythos Preview auront été largement déployés, nous fournirons beaucoup plus de détails sur ce que nous avons appris.

    Témoignages de nos partenaires et testeurs externes

    Les premiers partenaires du projet Glasswing développent et maintiennent des logiciels essentiels au fonctionnement d’Internet et d’autres infrastructures vitales. La correction des failles dans leur code réduit les risques pour les nombreuses autres organisations qui en dépendent, et donc pour des milliards d’utilisateurs finaux.

    Au bout d’un mois, la plupart des partenaires ont chacun identifié des centaines de vulnérabilités critiques ou de gravité élevée dans leurs logiciels. Collectivement, ils en ont trouvé plus de dix mille. Plusieurs d’entre eux nous ont indiqué que leur taux de détection de bogues avait été multiplié par plus de dix. Par exemple, Cloudflare a détecté 2 000 bogues (dont 400 de gravité élevée ou critique) dans ses systèmes critiques, avec un taux de faux positifs que l’équipe de Cloudflare juge supérieur à celui des testeurs humains.

    Cela correspond à l’expérience des testeurs externes concernant les performances de Mythos Preview, ainsi qu’à des évaluations supplémentaires récentes du modèle :

    - L’AI Security Institute au Royaume-Uni rapporte que Mythos Preview est le premier modèle à résoudre de bout en bout leurs deux cyber-gammes (simulations de cyberattaques en plusieurs étapes) ;

    - Mozilla a détecté et corrigé 271 vulnérabilités dans Firefox 150 lors des tests de Mythos Preview, soit plus de dix fois plus que celles détectées dans Firefox 148 avec Claude Opus 4.6 ;

    - XBOW, une plateforme de sécurité indépendante, indique que Mythos Preview représente « une avancée significative par rapport à tous les modèles existants » dans son benchmark d'exploits Web, et offre « une précision absolument sans précédent » sur une base token par token ;

    - ExploitBench et ExploitGym, deux benchmarks universitaires récemment publiés pour mesurer les capacités de développement d’exploits des modèles, classent Mythos Preview en tête des performances. Nous discutons plus en détail de ce que ces benchmarks nous apprennent sur le modèle sur notre blog Frontier Red Team.

    De manière plus générale, on constate aujourd’hui que les correctifs logiciels sont déployés beaucoup plus rapidement. La dernière version de Palo Alto Networks comprenait plus de cinq fois plus de correctifs que d’habitude. Microsoft a indiqué que le nombre de nouveaux correctifs qu’elle publiera « continuera d’augmenter pendant un certain temps ». Quant à Oracle, elle identifie et corrige les vulnérabilités de ses produits et de son cloud plusieurs fois plus vite qu’auparavant.

    Mythos Preview s’est également révélé utile pour d’autres types de tâches de sécurité. Par exemple, chez l’une de nos banques partenaires de Glasswing, Mythos Preview a permis de détecter et d’empêcher un virement frauduleux de 1,5 million de dollars après qu’un cybercriminel eut piraté le compte de messagerie d’un client et passé de faux appels téléphoniques.

    Logiciels open source

    Au cours des derniers mois, Anthropic a utilisé Mythos Preview pour analyser plus de 1 000 projets open source, qui, ensemble, constituent la base d’une grande partie d’Internet — et d’une grande partie de notre propre infrastructure.

    À ce jour, Mythos Preview a identifié ce qu’il estime être 6 202 vulnérabilités de gravité élevée ou critique dans ces projets (sur un total de 23 019, y compris celles estimées de gravité moyenne ou faible).

    1 752 de ces vulnérabilités classées comme élevées ou critiques ont désormais été soigneusement évaluées par l’un des six cabinets de recherche en sécurité indépendants, ou, dans un petit nombre de cas, par nos propres soins. Parmi celles-ci, 90,6 % (1 587) se sont avérées être des vrais positifs valides, et 62,4 % (1 094) ont été confirmées comme étant de gravité élevée ou critique. Cela signifie que même si Mythos Preview ne détecte plus aucune vulnérabilité, compte tenu de nos taux actuels de vrais positifs après triage, il est en passe d’avoir mis au jour près de 3 900 vulnérabilités de gravité élevée ou critique dans le code open source — en plus de celles qu’il a détectées pour les partenaires du projet Glasswing. Pour être clair, nous avons l’intention de continuer à analyser le code open source pendant un certain temps, nous nous attendons donc à ce que ce nombre augmente.

    Un exemple de vulnérabilité open source détectée par Mythos Preview concernait wolfSSL, une bibliothèque cryptographique open source réputée pour sa sécurité et utilisée par des milliards d’appareils à travers le monde. Mythos Preview a conçu un exploit permettant à un attaquant de falsifier des certificats qui lui permettraient (par exemple) d’héberger un faux site web pour une banque ou un fournisseur de messagerie. Le site web semblerait parfaitement légitime aux yeux d’un utilisateur final, bien qu’il soit contrôlé par l’attaquant. Nous publierons notre analyse technique complète de cette vulnérabilité désormais corrigée (référencée CVE-2026-5194) dans les semaines à venir.

    Comme nous l’avons mentionné plus haut, le goulot d’étranglement dans la correction de bogues comme ceux-ci réside dans la capacité humaine à trier, signaler, concevoir et déployer des correctifs. Les détecter est devenu beaucoup plus simple grâce à Mythos Preview. Nous avons créé ci-dessous un tableau de bord des vulnérabilités open source que nous avons analysées, qui présente les différentes étapes de notre processus de divulgation et permettra de suivre nos progrès au fil du temps. Il présente les vulnérabilités de tous les niveaux de gravité, et non pas uniquement le sous-ensemble initialement évalué comme présentant une gravité élevée ou critique par Mythos Preview. Notez la forte baisse observée à chaque phase, qui reflète l'effort humain nécessaire pour vérifier et corriger chacune de ces vulnérabilités.

    Nom : 1.jpg
Affichages : 407
Taille : 48,5 Ko

    Notre processus de triage des vulnérabilités est rigoureux. Tout d’abord, nous reproduisons, soit nous-mêmes, soit l’une des sociétés de sécurité externes avec lesquelles nous collaborons, le problème détecté par Mythos et réévaluons sa gravité. Une fois que nous avons confirmé l’existence d’une vulnérabilité, nous vérifions s’il existe déjà des correctifs et rédigeons un rapport détaillé à l’intention des responsables de la maintenance du logiciel. Nous faisons preuve d’une grande prudence à ce sujet : en plus des défis habituels liés à la maintenance des logiciels open source, les responsables sont confrontés à un déluge de rapports de bogues de mauvaise qualité générés par l’IA. En effet, plusieurs responsables nous ont indiqué qu’ils étaient actuellement confrontés à de sérieuses contraintes de capacité, et certains nous ont même demandé de ralentir notre rythme de divulgation car ils ont besoin de plus de temps pour concevoir des correctifs. (En moyenne, un bug de gravité élevée ou critique détecté par Mythos Preview nécessite deux semaines pour être corrigé.)

    À la demande des responsables, nous divulguons parfois les bugs directement, sans évaluation supplémentaire. Nous avons à ce jour signalé 1 129 bugs non vérifiés de ce type, dont 175 ont été estimés par Mythos Preview comme étant de gravité élevée ou critique.

    Nous estimons avoir signalé 530 bogues de gravité élevée ou critique aux responsables de maintenance à ce jour. Ce chiffre repose sur l'évaluation de la gravité effectuée par Claude dans le cas des divulgations directes, et sur celle des responsables de maintenance ou de nos partenaires de sécurité lorsqu'elle est disponible. Il existe 827 vulnérabilités confirmées supplémentaires (estimées comme étant de gravité élevée ou critique selon la même méthode) que nous comptons divulguer dès que possible.

    75 des 530 bogues de gravité élevée ou critique que nous avons signalés ont désormais été corrigés, et 65 d'entre eux ont fait l'objet d'avis publics. Le nombre de correctifs reste relativement faible pour trois raisons. Premièrement, nous n'en sommes qu'au début de la période de 90 jours prévue par notre politique de divulgation coordonnée des vulnérabilités : nous nous attendons à ce que de nombreux autres correctifs soient publiés prochainement. Deuxièmement, nous sous-estimons probablement le nombre de correctifs, car certaines vulnérabilités sont corrigées sans avis public : dans ces cas-là, nous devons nous contenter de rechercher nous-mêmes les correctifs à l’aide de Claude. Troisièmement, le faible volume de correctifs reflète un véritable problème : même avec notre rythme de divulgation relativement lent, Mythos Preview vient s’ajouter à un écosystème de sécurité déjà surchargé.

    La relative facilité avec laquelle on trouve des vulnérabilités, comparée à la difficulté de les corriger, constitue un défi majeur pour la cybersécurité. Relever ce défi avec succès rendra nos logiciels bien plus sûrs qu’auparavant. Nous abordons ci-dessous quelques moyens dont disposent les cyberdéfenseurs pour s’adapter.

    S’adapter à une nouvelle phase de la cybersécurité

    Des modèles dotés de capacités de cybersécurité similaires à celles de Mythos Preview seront bientôt plus largement disponibles. Il existe un besoin évident d’un effort accru de la part de l’ensemble du secteur des logiciels pour gérer le volume de découvertes que ces modèles généreront.

    Actuellement, il existe souvent un long délai entre la découverte d’une vulnérabilité, la création d’un correctif et le moment où ce correctif est largement déployé par les utilisateurs finaux. Cela laisse une fenêtre d’opportunité importante aux attaquants pour exploiter des logiciels critiques. Les modèles de type Mythos réduisent considérablement le temps et les coûts nécessaires pour détecter et exploiter les vulnérabilités, amplifiant ainsi le risque associé à ces délais. À terme, les modèles de type Mythos permettront aux développeurs de créer des logiciels bien plus sécurisés en détectant les bogues avant leur déploiement. Mais cette période de transition — durant laquelle les vulnérabilités sont rapidement découvertes et lentement corrigées — présente de nouveaux risques.

    Les développeurs et les utilisateurs de logiciels doivent agir dès maintenant pour réduire leur exposition à ces risques. Les conseils ci-dessous ne sont pas nouveaux, et de nombreux chercheurs (notamment chez Anthropic) travaillent actuellement à des solutions meilleures et plus durables. En attendant, il est important de bien maîtriser les bases :

    - Les développeurs de logiciels devraient raccourcir leurs cycles de correctifs et mettre à disposition les correctifs de sécurité aussi rapidement que possible. L'utilisation réfléchie de modèles d'IA accessibles au public peut y contribuer ; nous développons des outils et partageons nos recherches pour soutenir cette démarche (plus de détails ci-dessous). Les développeurs devraient également aider leurs utilisateurs à maintenir leurs logiciels à jour en facilitant au maximum l'installation des mises à jour ; dans la mesure du possible, ils devraient se montrer plus insistants auprès des utilisateurs qui continuent d'utiliser des logiciels présentant des vulnérabilités connues.

    - Les responsables de la sécurité des réseaux doivent raccourcir leurs délais de test et de déploiement des correctifs. Les contrôles critiques définis par des organismes tels que le National Institute of Standards and Technology et le National Cyber Security Centre britannique sont désormais d’autant plus importants, car ils améliorent la sécurité sans dépendre de la mise en place d’un correctif particulier en temps voulu. Il s’agit notamment de mesures telles que le renforcement des configurations par défaut des réseaux, l’application de l’authentification multifactorielle et la tenue de journaux complets pour la détection et la réponse.

    Outils de cyberdéfense basés sur des modèles d'IA accessibles au public

    De nombreux modèles accessibles à tous permettent déjà de détecter un grand nombre de failles logicielles, même s'ils ne sont pas en mesure d'identifier les failles les plus sophistiquées ni de les exploiter aussi efficacement que Claude Mythos Preview. Le projet Glasswing a déjà incité de nombreuses autres organisations à agir sur leurs propres bases de code à l'aide de ces modèles accessibles à tous ; nous nous efforçons de faciliter considérablement cette démarche.

    Pour commencer, nous avons lancé Claude Security en version bêta publique pour les clients de Claude Enterprise. Il s'agit d'un outil qui aide les équipes à analyser leurs bases de code à la recherche de vulnérabilités et qui peut générer des propositions de correctifs. Au cours des trois semaines qui ont suivi son lancement, Claude Opus 4.7 a été utilisé pour corriger plus de 2 100 vulnérabilités. (Ce processus est plus rapide que les correctifs open source décrits ci-dessus, en grande partie parce que les entreprises corrigent leur propre code, alors que les correctifs open source nécessitent généralement des mainteneurs bénévoles qui travaillent dans le cadre d’une divulgation coordonnée.)

    Nous avons également lancé notre programme de vérification de la cybersécurité, qui permet aux professionnels de la sécurité utilisant nos modèles à des fins légitimes de cybersécurité (telles que la recherche de vulnérabilités, les tests d’intrusion et les exercices de simulation d’attaques) de le faire sans certaines mesures de protection destinées à prévenir les abus.

    Désormais, nous mettons à la disposition des équipes de sécurité de nos clients éligibles, sur demande, les outils que nos partenaires et nous-mêmes avons utilisés avec Mythos Preview. Notre objectif est de faciliter considérablement l’obtention des meilleures performances à partir de modèles publics hautement performants, sans configuration complexe. Cette version comprend :

    - Les compétences (instructions personnalisées pour des tâches répétitives) que nos partenaires et nous-mêmes avons développées et partagées ;

    - Un harnais qui aide Claude à cartographier la base de code, à lancer des sous-agents de scan, à trier ses résultats et à rédiger des rapports ;

    - Un générateur de modèles de menaces, qui cartographie une base de code pour identifier les cibles potentielles d’attaque et hiérarchise le travail du modèle en conséquence.

    Cisco, l’un de nos partenaires du projet Glasswing, a également récemment open-sourcé son Foundry Security Spec afin d’aider d’autres défenseurs à construire un système d’évaluation similaire à celui qu’ils utilisent eux-mêmes.

    Soutenir l'écosystème

    Nous avons conclu un partenariat avec le projet Alpha-Omega de l'Open Source Security Foundation, qui soutiendra les efforts de la fondation visant à aider les responsables de maintenance à traiter et à trier les rapports de bogues. Nous continuons également à publier des recherches sur la manière dont les capacités des modèles de pointe peuvent au mieux soutenir les cyberdéfenseurs.

    Nous avons également soutenu le développement d’ExploitBench et d’ExploitGym, les deux nouveaux benchmarks qui permettent aux chercheurs de suivre les capacités de développement d’exploits des modèles d’IA de pointe au fil du temps, comme nous l’évoquons ici. Nous soutenons le développement d’autres benchmarks quantitatifs de haute qualité par le biais de notre programme d’accès pour les chercheurs externes. Enfin, Claude for Open Source soutient les responsables de maintenance et les contributeurs, et nous nous engageons à analyser tout paquet open source que nous adopterons nous-mêmes à l’avenir.

    Quelle est la prochaine étape pour le projet Glasswing ?

    La rapidité des progrès en IA signifie que des modèles aussi performants que Mythos Preview seront bientôt développés par de nombreuses entreprises d’IA. À l’heure actuelle, aucune entreprise — y compris Anthropic — n’a mis au point de mesures de sécurité suffisamment solides pour empêcher que de tels modèles ne soient utilisés à mauvais escient et ne causent potentiellement de graves dommages. C’est pourquoi nous n’avons pas encore rendu publics les modèles de la classe Mythos. Mais c'est aussi la raison pour laquelle nous avons lancé le projet Glasswing : si un modèle aux capacités similaires est publié sans de telles mesures de protection, il deviendra rapidement beaucoup moins coûteux et plus facile pour presque n'importe qui dans le monde d'exploiter des logiciels présentant des failles.

    Glasswing aide les cyberdéfenseurs les plus importants sur le plan systémique à acquérir un avantage asymétrique. Cependant, il est urgent que le plus grand nombre possible d'organisations renforcent leurs cyberdéfenses. Nous espérons que nos modèles accessibles au grand public, ainsi que les nouveaux outils, ressources et travaux de recherche que nous fournissons pour les accompagner, aideront ces organisations à améliorer leur posture en matière de cybersécurité.

    Prochainement, nous travaillerons avec des partenaires clés — notamment les gouvernements des États-Unis et de leurs alliés — afin d’étendre le projet Glasswing à d’autres partenaires. Et dans un avenir proche, une fois que nous aurons mis au point les mesures de protection bien plus robustes dont nous avons besoin, nous espérons pouvoir rendre les modèles de classe Mythos accessibles au grand public.

    Au-delà de ces risques, un monde encourageant s'offre à nous : un monde dans lequel les codes importants sont bien mieux sécurisés qu'aujourd'hui, et où le piratage est bien moins répandu. Les obstacles sont nombreux, mais nous sommes néanmoins convaincus que le projet Glasswing peut nous aider à y parvenir.

    Source : Rapport d'Anthropic

    Et vous ?

    Pensez-vous que ce rapport est crédible ou pertinent ?
    Quel est votre avis sur le sujet ?

    Voir aussi :

    GPT-5.5 d'OpenAI rivalise avec Claude Mythos d'Anthropic en matière de capacités de cyberattaque : la cybermenace représentée par Mythos ne serait pas une avancée propre à un seul modèle

    Google a confirmé les craintes liées à Mythos en révélant avoir réussi à bloquer une cyberattaque de grande envergure au cours de laquelle des cybercriminels ont utilisé l'IA pour découvrir une faille inconnue

    Yann Le Cun, ancien directeur scientifique en IA chez Meta, qualifie la panique suscitée par la version préliminaire de « Claude Mythos » d'Anthropic de mise en scène exagérée « issues d'une illusion »
    Publication de communiqués de presse en informatique. Contribuez au club : corrections, suggestions, critiques, ... Contactez le service news et Rédigez des actualités

  8. #8
    Invité de passage
    Homme Profil pro
    grand utilisateur de linux
    Inscrit en
    Mars 2026
    Messages
    26
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Autre

    Informations professionnelles :
    Activité : grand utilisateur de linux

    Informations forums :
    Inscription : Mars 2026
    Messages : 26
    Par défaut
    Ce qui me rassure entre autre dans cette news est que nous aurons toujours besoin d'humains. Donc je ne suis pas au chômage tout de suite.

    Autre point, la défense dispose d'un outil pour prendre le pas sur l'attaque. Je l'expérimente déjà depuis 2016 chez Thales et son IA cortAIx qui n'est pas un LLM. Nous avons migré toute l'entreprise sur Debian et fait de la détection de failles et les corrections avec l'IA en juin 2025.

Discussions similaires

  1. Google lance Android 17 avec des agents IA
    Par Alex dans le forum Android
    Réponses: 3
    Dernier message: 14/05/2026, 16h04
  2. Réponses: 1
    Dernier message: 11/05/2026, 19h46
  3. Réponses: 13
    Dernier message: 24/12/2025, 14h49
  4. Réponses: 0
    Dernier message: 09/06/2025, 17h15
  5. Réponses: 0
    Dernier message: 02/07/2024, 16h08

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo