Mozilla affirme que les 271 vulnérabilités découvertes par Mythos ne présentent «quasiment aucun faux positif»

**Stéphane le calme** · 22/04/2026, 09h22

Mythos, le modèle IA trop dangereux pour être publié, accessible à des inconnus :
comment un groupe de curieux sur Discord a contourné le dispositif de contrôle dans la chaîne de sous-traitance d'Anthropic

Deux semaines après avoir annoncé en grande pompe Mythos, son modèle d'intelligence artificielle conçu pour la cybersécurité défensive, Anthropic se retrouve face à un scénario embarrassant : un groupe de particuliers non autorisés aurait réussi à accéder à l'outil, contournant la stratégie de diffusion contrôlée que la société présentait comme une réponse responsable à la dangerosité de sa propre technologie. L'incident pose des questions qui dépassent largement le cas Anthropic et touchent aux fondements même de la gouvernance des modèles d'IA dits à haut risque.

Pour comprendre la portée de cet accès non autorisé, il faut d'abord saisir ce qu'est Claude Mythos Preview et pourquoi Anthropic a fait un tel effort de communication lors de son annonce le 7 avril 2026. Il s'agit d'un modèle de langage à usage général qui présente des capacités remarquables dans les tâches de sécurité informatique Anthropic, au point qu'Anthropic a elle-même choisi de ne pas le rendre disponible au grand public.

Les démonstrations techniques publiées par l'équipe rouge d'Anthropic ont de quoi saisir même les professionnels aguerris. Mythos Preview a identifié et exploité de façon entièrement autonome une vulnérabilité d'exécution de code à distance vieille de 17 ans dans FreeBSD, permettant à n'importe qui d'obtenir les droits root sur une machine exécutant NFS. Dans un autre cas, le modèle a produit un exploit pour navigateur web enchaînant quatre vulnérabilités distinctes, avec une technique d'échappement des bacs à sable du moteur de rendu et du système d'exploitation.

L'Institut britannique de sécurité de l'IA (UK AI Security Institute) a qualifié Mythos de premier modèle d'IA capable de compléter son test simulant une attaque prenant le contrôle d'un réseau entier Foreign Policy, avec toutefois la réserve que les environnements de test utilisés ne reproduisaient pas fidèlement les défenses de systèmes réels. Mythos Preview a déjà identifié des milliers de vulnérabilités de haute gravité, y compris dans chaque système d'exploitation majeur et chaque navigateur web.

Face à ces capacités jugées trop dangereuses pour une diffusion publique, Anthropic a opté pour une stratégie de déploiement restreint. Le modèle est accessible dans le cadre d'une initiative baptisée Project Glasswing, impliquant 12 organisations partenaires pour des travaux de sécurité défensive sur des logiciels critiques, avec 40 organisations ayant accès à la préversion au total. Parmi elles figurent Microsoft, Apple, Google, CrowdStrike et JPMorgan Chase. Anthropic engage jusqu'à 100 millions de dollars en crédits d'utilisation pour ces acteurs, ainsi que 4 millions de dollars en dons directs à des organisations de sécurité open source comme OpenSSF et la Fondation Apache. Le principe : donner aux défenseurs une longueur d'avance avant que des modèles aux capacités équivalentes ne tombent entre les mains d'acteurs malveillants.

La société précise qu'elle n'a pas explicitement entraîné Mythos Preview pour ces capacités offensives : elles sont apparues comme une conséquence indirecte des améliorations générales en matière de code, de raisonnement et d'autonomie. Les mêmes progrès qui rendent le modèle plus efficace pour corriger des vulnérabilités le rendent également plus efficace pour les exploiter.

Logan Graham, qui dirige l'équipe rouge offensive d'Anthropic, résume le problème avec une clarté désarmante : même si Mythos ne devait jamais être rendu public, il s'attend à ce que les concurrents d'Anthropic, y compris ceux basés en Chine, publient des modèles aux capacités de piratage comparables dans les mois ou années à venir.

Le verrou s'ouvre le jour même de l'annonce

C'est précisément cette stratégie de maîtrise que vient contredire le rapport de Bloomberg publié le 21 avril. Un petit groupe d'utilisateurs non autorisés a accédé à Mythos le jour même où Anthropic annonçait son plan de diffusion restreinte. Selon les informations recueillies par l'agence, ces individus font partie d'un forum privé en ligne, et leur accès aurait été obtenu via l'environnement d'un prestataire tiers travaillant pour Anthropic.

Le groupe a employé plusieurs stratégies pour accéder au modèle, notamment en utilisant les accréditations d'une personne actuellement employée chez un sous-traitant travaillant pour Anthropic, personne qui a elle-même fourni des informations à Bloomberg dans le cadre de son enquête. Les membres du groupe appartiennent à un canal Discord consacré à la recherche d'informations sur les modèles d'IA non publiés.

La méthode d'accès initiale révèle une forme de déduction technique plutôt qu'une attaque sophistiquée : le groupe a formulé une hypothèse éclairée sur l'emplacement en ligne du modèle, en s'appuyant sur leur connaissance du format qu'Anthropic utilise habituellement pour ses autres modèles. En d'autres termes, la surface d'attaque n'était pas un système ultra-sécurisé mais une convention de nommage prévisible; une faille de sécurité par l'obscurité que des observateurs attentifs pouvaient déduire.

Le groupe a fourni des preuves à Bloomberg sous la forme de captures d'écran et d'une démonstration en direct du logiciel. Leur motivation déclarée : être « intéressés par l'exploration de nouveaux modèles, pas par le chaos ». Aucune activité malveillante n'a été documentée jusqu'à présent.

La réponse d'Anthropic : investigation en cours, systèmes intacts

La porte-parole d'Anthropic a communiqué une réaction mesurée, dans les termes habituels de ce type d'incident. « Nous enquêtons sur un rapport faisant état d'un accès non autorisé à Claude Mythos Preview via l'un de nos environnements de prestataires tiers », a-t-elle déclaré. La société indique n'avoir trouvé jusqu'à présent aucune preuve que l'activité non autorisée ait eu un impact sur les systèmes d'Anthropic.

La distinction est importante : ce qui est mis en cause n'est pas une intrusion dans les infrastructures centrales d'Anthropic, mais une faille dans la chaîne de sous-traitance. L'allégation pointe vers un possible abus d'accès en dehors du réseau principal d'Anthropic, et non une compromission confirmée des défenses internes de l'entreprise. Ce cadrage, classique dans les incidents de ce type, permettra vraisemblablement à Anthropic de minimiser la portée opérationnelle de l'accès, mais ne règle pas la question de fond.

La faille du maillon faible : les tiers au cœur du problème

L'incident s'inscrit dans une dynamique bien connue de la sécurité des systèmes d'information : ce ne sont pas toujours les infrastructures centrales qui cèdent, mais les acteurs périphériques qui y sont connectés. La chaîne de sous-traitance représente, depuis des années, le principal vecteur d'incidents dans les déploiements d'IA en entreprise.

Ce problème structurel n'est pas propre à Anthropic. Les grands déploiements technologiques s'appuient invariablement sur un réseau de prestataires, intégrateurs et développeurs tiers dont les pratiques de sécurité sont hétérogènes. Pour un modèle comme Mythos, dont la dangerosité justifie une diffusion restreinte à une cinquantaine d'organisations de confiance à l'échelle mondiale, la question de la sécurité de chaque nœud de la chaîne devient critique.

L'épisode met en lumière une tension persistante : comment un modèle frontier restrictif peut-il rester inaccessible alors même que des dizaines d'organisations et leurs prestataires y ont accès ? La réponse est qu'il ne le peut pas totalement et que la stratégie de diffusion contrôlée repose sur une hypothèse de contrôle qui s'avère plus fragile qu'annoncée.

Nom : anthro.png
Affichages : 6268
Taille : 428,7 Ko

Bruce Schneier et les critiques : le jeu de la communication de risque

L'incident survient dans un contexte où la stratégie de communication d'Anthropic autour de Mythos faisait déjà l'objet d'un examen critique dans la communauté de la sécurité. Bruce Schneier, l'une des voix les plus respectées de la cryptographie et de la sécurité des systèmes, avait qualifié l'annonce de Mythos de « coup de communication » par Anthropic, notant que de nombreux journalistes avaient repris sans distance critique les éléments de langage de la société.

La technologie et les sociétés ont une longue histoire à mettre en garde contre les dangers de leurs propres produits, OpenAI ayant averti dès 2019 que son modèle GPT-2 était « trop dangereux pour être publié » avant de le diffuser largement quelques mois plus tard. L'auto-restriction présentée comme vertu est aussi un outil marketing : elle positionne l'entreprise comme acteur responsable tout en entretenant le mystère et l'aura de puissance autour du produit.

Des analystes ont néanmoins salué la décision d'Anthropic de constituer une coalition défensive avant toute diffusion large, estimant qu'il s'agit d'un précédent sans équivalent dans l'histoire des outils de sécurité offensifs : ni Metasploit, ni Cobalt Strike, ni les outils de la NSA divulgués par les Shadow Brokers n'ont été accompagnés d'une telle réponse défensive coordonnée au moment de leur émergence publique. Ce point mérite d'être reconnu sans être idéalisé.

Voici un extrait des propos de Bruce Schneier :

« Il y a beaucoup à dire à ce sujet, et j'espère écrire une analyse plus approfondie la semaine prochaine, mais voici quelques observations rapides.

« Premièrement : Il s'agit clairement d'une opération de relations publiques de la part d'Anthropic – et ça a fonctionné. De nombreux journalistes reprennent en chœur les arguments d'Anthropic, sans les examiner de manière critique. OpenAI, sans doute agacée par l'engouement médiatique autour du nouveau modèle d'Anthropic et désireuse de se faire remarquer, a annoncé que son modèle est tout aussi inquiétant et qu'il ne sera pas non plus rendu public.

« Deuxièmement : Ces modèles démontrent une sophistication accrue dans leurs capacités de cyberattaque. Ils créent des exploits efficaces – en exploitant les vulnérabilités qu'ils découvrent et en les rendant opérationnelles – sans intervention humaine. Ils peuvent identifier des vulnérabilités plus complexes*: enchaîner plusieurs failles de corruption de mémoire, par exemple. Et ils peuvent accomplir davantage de tâches avec une simple instruction, sans nécessiter d'orchestration ni d'infrastructure de configuration d'agents.

« Troisièmement : Anthropic a peut-être une bonne équipe de relations publiques, mais le problème ne vient pas de Mythos Preview. La société de sécurité Aisle a réussi à reproduire les vulnérabilités découvertes par Anthropic à l’aide de modèles publics plus anciens et moins coûteux. Or, il y a une différence entre découvrir une vulnérabilité et la transformer en attaque. Cela met en évidence un avantage actuel pour la défense. Il est plus facile pour une IA de détecter une vulnérabilité en vue de la corriger que de la détecter puis de l’exploiter. Cet avantage est susceptible de s’amenuiser à mesure que des modèles toujours plus puissants seront mis à la disposition du grand public.

« Quatrièmement : Tous ceux qui s’inquiètent des conséquences de cette situation ont raison quant à l’ampleur du problème, même s’il est impossible de prédire avec exactitude le calendrier. Le changement radical vient peut-être de se produire avec les nouveaux modèles d’Anthropic et d’OpenAI. Il a peut-être eu lieu il y a six mois. Il se produira peut-être dans six mois. Il se produira, j’en suis certain, et plus tôt que nous ne le pensons. Nous ne pouvons pas prédire dans quelle mesure ces modèles vont encore progresser, mais le logiciel semble être un langage spécialisé particulièrement adapté aux IA. »

Les implications pour la gouvernance de l'IA à haut risque

Ce que révèle véritablement l'accès non autorisé à Mythos, c'est l'absence d'un cadre institutionnel robuste pour la gouvernance des modèles d'IA à capacités offensives. La longueur d'avance défensive que procure le Projet Glasswing se mesure en mois et son efficacité dépend entièrement du sérieux avec lequel l'industrie, la communauté open source, les opérateurs d'infrastructures critiques et les gouvernements exploitent la fenêtre d'opportunité ainsi créée.

La Chine, la Russie et d'autres acteurs étatiques sophistiqués ont massivement investi dans l'IA et les opérations cyber offensives. Contrairement à Anthropic, ils n'ont aucune incitation à divulguer ce qu'ils trouvent. Et dans les démocraties occidentales elles-mêmes, les capacités développées à des fins défensives tendent historiquement à être réaffectées à des usages offensifs une fois absorbées par les agences de renseignement, avec les risques de prolifération incontrôlée que cela implique.

L'épisode Mythos et la divulgation précédente par Anthropic en novembre d'une campagne de cyber-espionnage assistée par IA attribuée à un groupe parrainé par l'État chinois montrent une entreprise qui tente de sécuriser un modèle puissant avant sa diffusion plus large, tout en étant confrontée à la réalité que les contrôles d'accès peuvent faillir même quand le système central reste intact.

La véritable question n'est pas de savoir si un groupe de curieux a navigué sans permission dans un environnement de prévisualisation, mais plutôt de savoir si l'architecture de gouvernance actuelle, reposant sur la bonne volonté des entreprises et la solidité de leurs chaînes de sous-traitance, est à la hauteur des risques que portent les modèles d'IA de prochaine génération.

Sources : Bloomberg, Bruce Schneier, vidéo dans le texte

Et vous ?

La stratégie de diffusion contrôlée, donner accès à quelques dizaines d'organisations de confiance, est-elle réellement une barrière de sécurité, ou surtout un outil de positionnement concurrentiel pour Anthropic ?

Peut-on raisonnablement sécuriser un modèle d'IA à capacités offensives dans un écosystème de sous-traitance aussi étendu que celui d'un grand groupe technologique mondial ?

L'incident Mythos plaide-t-il pour un régulateur indépendant ayant autorité sur la diffusion des modèles à haut risque, ou risque-t-on de créer une bureaucratie inefficace face à la vélocité du secteur ?

La communication d'Anthropic autour de la « dangerosité » de Mythos sert-elle réellement la sécurité collective, ou crée-t-elle une demande supplémentaire de la part d'acteurs cherchant précisément à accéder à ce qui est interdit ?

Si des modèles aux capacités équivalentes à Mythos émergent inévitablement chez d'autres acteurs, y compris dans des États sans contraintes éthiques, la stratégie de retenue d'Anthropic a-t-elle un sens à long terme ?

**OuftiBoy** · 22/04/2026, 11h10

Pierre Louis Chevalier,

Envoyé par Pierre Louis Chevalier

C'est expliqué dans l'article, pour tout ceux qui n'ont rien lu à part le titre de l'annonce, au lieu de lâcher le monstre dans la nature, et que les hackers puissent s'en servir pour faire des dommages énormes, ils vont le filer dans un premier temps en avant première à la big tech pour qu'ils puissent détecter leurs failles et les colmater avant de se faire encore plus massacrer par les attaques.

Là, pour le coup, c'est raté, leur monstre est maintenant dans la nature...
Tout ce qui est "dans le cloud" finira un jour par être dévoilé. Ce n'est jamais qu'une question de temps. Croire le contraire est une erreur...

Mais ce n'est que mon avis, il n'engage que moi.

BàV et Peace & Love.

**Anselme45** · 22/04/2026, 15h50

Quand Mythos a été annoncé comme ne devant être distribué qu'à un nombre limité d'entreprises de la high tech californienne, j'ai posé la question suivante:

Et après avoir filé leur magnifique outil aux big tech, il va se passer combien de temps pour que ce dernier se retrouve dans les mains de vrais méchants hackers, étatiques ou autres?

Cela va se calculer en jours? En heures? Ou en secondes?

Ben, voilà... On a la réponse!

**OrthodoxWindows** · 22/04/2026, 16h53

Envoyé par OuftiBoy

Là, pour le coup, c'est raté, leur monstre est maintenant dans la nature...
Tout ce qui est "dans le cloud" finira un jour par être dévoilé. Ce n'est jamais qu'une question de temps. Croire le contraire est une erreur...

Mais ce n'est que mon avis, il n'engage que moi.

BàV et Peace & Love.

Je pense d'ailleurs qu'il est encor préférable que Claude Mythos soit totalement accessible au public, qu'accessible de manière ciblée mais finalement assez large.
A à ce moment, il risque de n'être découvert, certes sillégalement ou par la menace judiciaire (dans le cas d'acteurs étatiques), que par les pires acteurs (les sections militaires des cyberattaques, les services secrets gouvernementaux, les grosses mafias spécialisés dans les demandes de rançons...) en ciblant des logiciels auquel souvent, les développeurs, notamment dans le cas de projets open-source à faible moyen mais à importance cruciale, n'auront pas. Alors qu'a contrario, si tout le monde y a accès, il sera plus facile pour les développeurs concernés de détecter et corriger des failles avant qu'elles ne soient découvertes par des acteurs malveillants...

**eomer212** · 27/04/2026, 23h55

qu'attends l'ansi pour se mettre à la page et passer les services Français au crible de cette machine.?? ben ca pose un très gros problème en fait. car pour ca il faudrait alimenter claude avec les sources des dits services..
alors est-ce que mistral a les mêmes capacités ou approchantes? parce que , si on regarde les news récentes, c'est une avalanche de piratages et de pénétrations des services de l'état ou affiliés. l'informatique française est elle devenue une passoire gérée par des imbéciles incompétents.?
il serait temps d'oser se poser la question au vu des faits. pour résoudre un probléme, il faut oser le nommer pour le reconnaitre. hors, j'ai l'impression que à part, 'circulez ya rien à voir', rien n'est fait pour prévenir, auditer correctement et sécuriser les services de l'état et des grandes entreprises dont nous dépendons tous.

**Stéphane le calme** · 08/05/2026, 21h49

Mozilla affirme que les 271 vulnérabilités découvertes par Claude Mythos ne présentent « quasiment aucun faux positif » :
percée historique ou opération de communication savamment orchestrée par Anthropic pour justifier un consortium à accès restreint ?

En deux mois, l'outil d'analyse de vulnérabilités Claude Mythos Preview d'Anthropic a identifié 271 failles inconnues dans le code source de Firefox, dont certaines dormaient depuis vingt ans. Mozilla crie au miracle, les ingénieurs de sécurité indépendants crient au bluff. Entre percée technologique réelle et narratif commercial soigneusement orchestré, le dossier mérite une lecture attentive.

Depuis février 2026, l'équipe Firefox travaille en collaboration étroite avec Anthropic pour débusquer des vulnérabilités latentes dans le navigateur. Une première phase, menée avec Claude Opus 4.6, avait abouti à la correction de 22 bogues dans Firefox 148. L'application de Claude Mythos Preview à Firefox 150 a permis d'en identifier 271 supplémentaires en une seule évaluation initiale.

Le bilan d'avril est historique : 423 bogues de sécurité corrigés en un seul mois. Outre les 271 identifiés par Mythos, 41 provenaient de rapports externes, et les 111 restants d'autres méthodes internes, dont une partie attribuée au même pipeline tournant sur d'autres modèles.

La répartition par criticité est éloquente. Sur les 271 vulnérabilités annoncées pour Firefox 150 : 180 étaient de niveau sec-high, 80 sec-moderate et 11 sec-low. Mozilla précise que les niveaux critical et high désignent des failles exploitables par un simple utilisateur naviguant sur une page web ordinaire.

Parmi les exemples rendus publics par Mozilla pour asseoir la crédibilité de la démarche : une faille vieille de quinze ans dans l'élément HTML <legend>, un bogue XSLT datant de vingt ans impliquant des appels récursifs à la fonction key(), une race condition via IPC permettant à un processus compromis de manipuler des compteurs IndexedDB et de provoquer un use-after-free, ainsi qu'un dépassement de tampon lors du traitement HTTPS RR et ECH déclenché en simulant un serveur DNS malveillant. Pour mémoire, une race condition est une erreur critique qui survient lorsqu'un programme, exécuté par plusieurs threads ou processus en parallèle, accède et modifie une ressource partagée (mémoire, fichier) de manière non coordonnée.

La rupture technologique : l'agent qui vérifie lui-même ses hypothèses

Ce qui distingue cette campagne des tentatives antérieures, ce n'est pas le modèle seul, mais l'infrastructure qui l'entoure. Les premières expérimentations internes de Mozilla avec GPT-4 et Claude Sonnet 3.5 en analyse statique avaient produit un taux de faux positifs rédhibitoire, rendant toute mise à l'échelle impossible. L'introduction de harnais agentiques a tout changé : l'IA peut désormais construire et exécuter ses propres cas de test pour vérifier dynamiquement si un bogue suspecté existe réellement avant de le rapporter.

Ce pipeline s'avère extrêmement fiable pour filtrer les faux positifs, à condition de disposer d'une condition de succès clairement définie. Les problèmes de corruption mémoire sont particulièrement faciles à valider : soit l'Address Sanitizer est déclenché, soit il ne l'est pas. Au total, moins de quinze faux positifs ont été observés sur l'ensemble de la campagne, causés principalement par des modifications de préconditions de test. Chaque occurrence entraîne une mise à jour du harnais pour éviter les récidives.

Le pipeline tourne en parallèle sur plusieurs machines virtuelles éphémères, chacune assignée à un fichier cible spécifique. La puissance de feu est donc horizontalement scalable. Mozilla prévoit de l'intégrer directement dans son processus de développement afin que chaque nouveau commit soit automatiquement examiné avant d'être fusionné dans la base de code principale.

Nom : bug.png
Affichages : 108777
Taille : 38,9 Ko

Capture d'écran d'une partie du tableau des bugs répertoriés par Mozilla

Ce que Mythos a validé autant que découvert

Un résultat moins médiatisé, mais que les ingénieurs de Mozilla jugent tout aussi précieux : plusieurs tentatives d'exploitation ciblant une technique appelée Prototype Pollution ont échoué, parce que Mozilla avait adopté des décisions architecturales protectrices des années auparavant. Pour les développeurs, avoir la preuve directe que leurs défenses existantes tiennent toujours est aussi utile que de trouver de nouvelles vulnérabilités.

Beaucoup des vulnérabilités découvertes ne suffisent pas à elles seules à constituer une attaque complète : elles doivent être chaînées avec d'autres failles. Mais ce sont précisément les types de faiblesses que les méthodes traditionnelles comme le fuzzing ont du mal à détecter, et l'analyse par IA couvre ce terrain de façon bien plus exhaustive.

Le scepticisme des experts : de la percée au coup de com'

La réaction de la communauté sécurité a été loin d'être unanime. Le chercheur Davi Ottenheimer a publié une analyse fouillée, soulignant plusieurs contradictions structurelles dans le narrative d'Anthropic autour de Claude Mythos.

Des critiques ont d'abord raillé le fait que Mozilla n'ait obtenu aucun identifiant CVE pour les 271 vulnérabilités, pratique pourtant ordinaire pour des bugs découverts en interne, généralement regroupés dans un seul patch. Les rapports Bugzilla détaillant ces « rollups » restent masqués pendant plusieurs mois après correction pour protéger les utilisateurs lents à mettre à jour.

La démonstration phare d'Anthropic portait sur un moteur SpiderMonkey en conteneur, avec le sandbox et les mécanismes de défense en profondeur de Firefox désactivés. Les bugs utilisés avaient en outre déjà été découverts par Claude Opus 4.6; Mythos ne les a pas trouvés, il les a reçus comme point de départ. Quand les deux bogues les plus facilement exploitables sont retirés du corpus, le taux de succès de Mythos chute drastiquement selon les données du system card d'Anthropic lui-même.

La startup AISLE a reproduit les bogues phares du lancement d'Anthropic en les soumettant à huit modèles open-weights différents; tous les huit les ont détectés, y compris un modèle à 3,6 milliards de paramètres actifs coûtant 0,11 dollar par million de tokens. Leur conclusion : la valeur qui fait la différence est dans le système, pas dans le modèle.

Fuzzing augmenté ou réelle rupture de paradigme ?

La question de fond que pose ce débat est celle du positionnement de l'IA par rapport au fuzzing, technique dominante depuis des années dans la détection de vulnérabilités. Mozilla dispose d'une longue expérience du Rust et maintient une équipe de red team interne au fait des techniques d'analyse automatisée. Jusqu'à récemment, celles-ci consistaient principalement en techniques d'analyse dynamique comme le fuzzing. Le fuzzing est productif, mais certaines parties du code sont plus difficiles à couvrir que d'autres.

Les chercheurs en sécurité de haut niveau trouvent des bogues qu'un fuzzer ne peut pas détecter en raisonnant sur le code source, une démarche efficace mais chronophage et tributaire d'une expertise humaine rare. Les ordinateurs en étaient totalement incapables il y a encore quelques mois. Maintenant, ils y excellent.

C'est précisément là que réside l'intérêt réel de la démarche, au-delà du débat chiffré : plusieurs des vulnérabilités découvertes ne sont pas accessibles aux méthodes de fuzzing traditionnelles, qui peinent à capturer les logiques de chaînage de failles complexes. L'analyse par IA couvre ce terrain de manière nettement plus systématique.

Nom : robot.png
Affichages : 24065
Taille : 388,5 Ko

Glasswing, le consortium qui cristallise les inquiétudes

Le vrai sujet de fond n'est peut-être pas les 271 bogues, mais ce qu'ils servent à justifier. En réservant l'accès à Mythos au seul consortium Glasswing (Apple, Google, Microsoft, Amazon, Broadcom, Cisco, CrowdStrike, JPMorganChase, Nvidia, Palo Alto Networks, Linux Foundation), Anthropic s'érige en autorité de facto pour l'attribution de l'accès à une capacité qu'elle déclare trop dangereuse pour une diffusion publique, sans base statutaire, sans supervision démocratique et avec une liste de partenaires constituée exclusivement des plus grands acteurs de l'industrie qu'elle prétend protéger.

L'enveloppe de 100 millions de dollars annoncée pour le programme se décompose en réalité en crédits d'utilisation de Mythos Preview, auxquels s'ajoutent seulement 4 millions de dollars en dons effectifs à des organisations de sécurité open source. Les partenaires reçoivent l'accès à l'outil et la parole d'Anthropic certifiant que cet outil est extraordinaire.

Ce que Mozilla retient, sans se laisser emporter

Mozilla elle-même formule une mise en garde que peu de titres ont retranscrite : il existe un risque que les bases de code commencent à dépasser la compréhension humaine au fur et à mesure que l'IA prend davantage de place dans le processus de développement, faisant croître la complexité des bogues parallèlement (ou peut-être plus vite) que la capacité à les découvrir. La compréhensibilité humaine est une propriété essentielle à préserver, notamment dans des logiciels critiques comme les navigateurs et les systèmes d'exploitation.

Brian Honan, expert en cybersécurité, retient surtout une leçon d'architecture défensive : les décisions passées de Mozilla d'appliquer des défenses en couches au sein de Firefox ont conduit Mythos à échouer à plusieurs reprises dans ses tentatives d'exploitation des vulnérabilités. Cela confirme ce que les professionnels de la cybersécurité défendent depuis des années : la sécurité doit être intégrée dès la conception, le développement et le déploiement.

En définitive, l'affaire Mythos-Firefox livre deux enseignements distincts selon l'angle choisi. Du côté des praticiens : un pipeline agentique capable d'écrire et d'exécuter ses propres preuves de concept représente une avancée méthodologique réelle, qui complète, sans remplacer, les outils de fuzzing existants. Du côté de l'économie politique de l'IA : l'ampleur du narrative construit autour de ces 271 bogues, les circuits institutionnels qu'il a mobilisés en quelques jours, et la structure de gouvernance exclusive que cela a permis de bâtir, constituent un cas d'école en matière de capitalisation sur la peur pour ériger des barrières à l'entrée.

Sources : Mozilla (1, 2)

Et vous ?

Percée historique ou opération de communication savamment orchestrée par Anthropic pour justifier un consortium à accès restreint ?

La réduction des faux positifs est-elle vraiment le verrou qui était à lever ? Le fuzzing à grande échelle produit déjà d'énormes volumes de résultats bruts que les équipes peinent à trier. Un outil qui vérifie automatiquement ses propres hypothèses change-t-il fondamentalement l'équation, ou déplace-t-il simplement le goulot d'étranglement vers la capacité de patcher ?

Vingt ans sans voir un bogue dans l'élément XSLT de Firefox : à qui la faute ? Cela trahit-il un déficit d'outillage, un manque de ressources humaines, ou la complexité intrinsèque d'une base de code accumulée sur plusieurs décennies de développement multi-contributeurs ?

Le modèle de consortium fermé façon Glasswing est-il transposable positivement ? Peut-on imaginer une structure similaire sous supervision publique ou académique qui permettrait la diffusion contrôlée de ce type de capacité sans confier la clé aux acteurs qui ont le plus à gagner à la détenir en exclusivité ?

Si un modèle open-weights à faible coût peut reproduire les résultats phares de Mythos, comme le prétend AISLE, quelle est la vraie valeur du produit payant ? Est-ce le modèle, l'infrastructure de harnais, le réseau de divulgation coordonnée, ou simplement l'accès au label d'Anthropic ?

L'intégration de Mythos dans chaque commit de Firefox représente-t-elle un progrès ou un risque systémique ? Externaliser la détection de vulnérabilités à un outil propriétaire dont les mécanismes internes sont opaques crée-t-il une nouvelle forme de dépendance critique ?

**Alex** · 27/05/2026, 10h32

Le projet Glasswing d’Anthropic, utilisant le modèle Claude Mythos Preview, a découvert plus de 10 000 vulnérabilités de gravité élevée ou critique dans des systèmes logiciels clés en l’espace d’un mois

Le projet Glasswing d'Anthropic et ses partenaires ont utilisé le modèle Claude Mythos Preview pour découvrir plus de 10 000 vulnérabilités de gravité élevée ou critique dans des systèmes logiciels clés à travers le monde en l'espace d'un mois. Ce même scan IA a identifié plus de 6 200 failles graves dans plus de 1 000 projets open source. Le principal défi réside désormais dans la rapidité avec laquelle les équipes peuvent évaluer et corriger le volume de vulnérabilités identifiées.

En avril 2026, le géant de l'IA Anthropic a annoncé qu'il ne commercialiserait pas au grand public son modèle Mythos, qui a fait l'objet d'une fuite avant même son lancement, invoquant la crainte qu'il ne soit trop efficace pour détecter des failles de cybersécurité de gravité élevée dans les principaux systèmes d'exploitation et navigateurs web. Anthropic avait alors lancé le projet Glasswing, un programme de cybersécurité défensive avec un groupe restreint de partenaires. Les partenaires du projet Glasswing ont accès à Claude Mythos Preview afin d'identifier et de corriger les vulnérabilités ou les faiblesses de leurs systèmes fondamentaux, notamment la détection locale des vulnérabilités, les tests de type « boîte noire » des binaires, la sécurisation des terminaux et les tests d'intrusion des systèmes.

Puis en mai 2026, l'équipe de Mozilla a annoncé que l'outil d'analyse de vulnérabilités Claude Mythos Preview d'Anthropic a identifié 271 failles inconnues dans le code source de Firefox, dont certaines dormaient depuis vingt ans. La répartition par criticité est éloquente. Sur les 271 vulnérabilités annoncées pour Firefox 150 : 180 étaient de niveau sec-high, 80 sec-moderate et 11 sec-low. Mozilla précise que les niveaux critical et high désignent des failles exploitables par un simple utilisateur naviguant sur une page web ordinaire. Un rapport qui semble confirmer le programme d'Anthropic.

Récemment, un rapport révèle que le projet Glasswing d'Anthropic et ses partenaires ont utilisé le modèle Claude Mythos Preview pour découvrir plus de 10 000 vulnérabilités de gravité élevée ou critique dans des systèmes logiciels clés à travers le monde en l'espace d'un mois. Ce même scan IA a identifié plus de 6 200 failles graves dans plus de 1 000 projets open source. Des évaluations indépendantes confirment que ce modèle surpasse largement les outils d’IA précédents et les testeurs humains, tant en termes de détection de bogues que de précision. Le principal défi réside désormais dans la rapidité avec laquelle les équipes peuvent évaluer et corriger le volume de vulnérabilités identifiées.

Ce rapport intervient alors que des chercheurs de CalIF ont annoncé avoir découvert une première faille de sécurité liée à la mémoire de l'Apple M5 à l'aide de la version préliminaire de Claude Mythos d'Anthropic. La corruption de mémoire sur le M5 d'Apple prouve non seulement que cette puce peut également être exploitée, mais que le modèle Claude Mythos Preview d'Anthropic s'est révélé être un assistant IA clé. Cette attaque réussie contourne le Memory Integrity Enforcement (MIE), que Apple a présenté en septembre dernier comme le résultat d’une initiative de cinq ans visant à éradiquer les erreurs de mémoire.

Voici le rapport d'Anthropic :

Projet Glasswing : un premier bilan

Le mois dernier, nous avons lancé le projet Glasswing, notre initiative collaborative visant à sécuriser les logiciels les plus critiques au monde avant que des modèles d’IA de plus en plus performants ne puissent s’en servir à des fins malveillantes.

Depuis lors, avec nos quelque 50 partenaires, nous avons utilisé Claude Mythos Preview pour détecter plus de dix mille vulnérabilités de gravité élevée ou critique dans les logiciels les plus importants au monde sur le plan systémique. Auparavant, les progrès en matière de sécurité logicielle étaient limités par la rapidité avec laquelle nous pouvions détecter de nouvelles vulnérabilités. Aujourd’hui, ils sont limités par la rapidité avec laquelle nous pouvons vérifier, divulguer et corriger le grand nombre de vulnérabilités détectées par l’IA.

Dans cet article, nous abordons ce que nous avons appris sur ce défi crucial pour la cybersécurité au cours des premières semaines du projet Glasswing. Nous nous concentrons sur les premières preuves publiques des performances de Mythos Preview, sur les résultats initiaux de nos efforts visant à analyser des milliers de projets logiciels open source, et sur ce que ces progrès signifient pour les cyberdéfenseurs aujourd’hui. Nous abordons également ce à quoi il faut s’attendre ensuite de la part du projet Glasswing, et comment nous envisageons de publier des modèles de la classe Mythos à l’avenir.

Nos premiers résultats

Notre approche pour présenter les conclusions de Mythos Preview

La convention de longue date dans l’industrie du logiciel consiste à divulguer les nouvelles vulnérabilités 90 jours après leur découverte (ou, si un correctif est créé avant l’expiration de ce délai de 90 jours, environ 45 jours après la mise à disposition du correctif). Cela laisse le temps aux utilisateurs finaux de mettre à jour leurs logiciels avant qu’une vulnérabilité ne puisse être exploitée par des attaquants. Notre propre politique de divulgation coordonnée des vulnérabilités suit cette approche.

Cependant, cela signifie que les vulnérabilités divulguées constituent un indicateur retardé de l’évolution rapide des capacités cybernétiques des modèles d’IA : nous n’en sommes pas encore au stade où nous pouvons détailler pleinement les découvertes de nos partenaires avec Mythos Preview sans mettre les utilisateurs finaux en danger. À la place, nous fournissons des exemples illustratifs des performances du modèle, ainsi que des statistiques agrégées sur nos progrès à ce jour. Une fois que les correctifs pour les vulnérabilités découvertes par Mythos Preview auront été largement déployés, nous fournirons beaucoup plus de détails sur ce que nous avons appris.

Témoignages de nos partenaires et testeurs externes

Les premiers partenaires du projet Glasswing développent et maintiennent des logiciels essentiels au fonctionnement d’Internet et d’autres infrastructures vitales. La correction des failles dans leur code réduit les risques pour les nombreuses autres organisations qui en dépendent, et donc pour des milliards d’utilisateurs finaux.

Au bout d’un mois, la plupart des partenaires ont chacun identifié des centaines de vulnérabilités critiques ou de gravité élevée dans leurs logiciels. Collectivement, ils en ont trouvé plus de dix mille. Plusieurs d’entre eux nous ont indiqué que leur taux de détection de bogues avait été multiplié par plus de dix. Par exemple, Cloudflare a détecté 2 000 bogues (dont 400 de gravité élevée ou critique) dans ses systèmes critiques, avec un taux de faux positifs que l’équipe de Cloudflare juge supérieur à celui des testeurs humains.

Cela correspond à l’expérience des testeurs externes concernant les performances de Mythos Preview, ainsi qu’à des évaluations supplémentaires récentes du modèle :

- L’AI Security Institute au Royaume-Uni rapporte que Mythos Preview est le premier modèle à résoudre de bout en bout leurs deux cyber-gammes (simulations de cyberattaques en plusieurs étapes) ;

- Mozilla a détecté et corrigé 271 vulnérabilités dans Firefox 150 lors des tests de Mythos Preview, soit plus de dix fois plus que celles détectées dans Firefox 148 avec Claude Opus 4.6 ;

- XBOW, une plateforme de sécurité indépendante, indique que Mythos Preview représente « une avancée significative par rapport à tous les modèles existants » dans son benchmark d'exploits Web, et offre « une précision absolument sans précédent » sur une base token par token ;

- ExploitBench et ExploitGym, deux benchmarks universitaires récemment publiés pour mesurer les capacités de développement d’exploits des modèles, classent Mythos Preview en tête des performances. Nous discutons plus en détail de ce que ces benchmarks nous apprennent sur le modèle sur notre blog Frontier Red Team.

De manière plus générale, on constate aujourd’hui que les correctifs logiciels sont déployés beaucoup plus rapidement. La dernière version de Palo Alto Networks comprenait plus de cinq fois plus de correctifs que d’habitude. Microsoft a indiqué que le nombre de nouveaux correctifs qu’elle publiera « continuera d’augmenter pendant un certain temps ». Quant à Oracle, elle identifie et corrige les vulnérabilités de ses produits et de son cloud plusieurs fois plus vite qu’auparavant.

Mythos Preview s’est également révélé utile pour d’autres types de tâches de sécurité. Par exemple, chez l’une de nos banques partenaires de Glasswing, Mythos Preview a permis de détecter et d’empêcher un virement frauduleux de 1,5 million de dollars après qu’un cybercriminel eut piraté le compte de messagerie d’un client et passé de faux appels téléphoniques.

Logiciels open source

Au cours des derniers mois, Anthropic a utilisé Mythos Preview pour analyser plus de 1 000 projets open source, qui, ensemble, constituent la base d’une grande partie d’Internet — et d’une grande partie de notre propre infrastructure.

À ce jour, Mythos Preview a identifié ce qu’il estime être 6 202 vulnérabilités de gravité élevée ou critique dans ces projets (sur un total de 23 019, y compris celles estimées de gravité moyenne ou faible).

1 752 de ces vulnérabilités classées comme élevées ou critiques ont désormais été soigneusement évaluées par l’un des six cabinets de recherche en sécurité indépendants, ou, dans un petit nombre de cas, par nos propres soins. Parmi celles-ci, 90,6 % (1 587) se sont avérées être des vrais positifs valides, et 62,4 % (1 094) ont été confirmées comme étant de gravité élevée ou critique. Cela signifie que même si Mythos Preview ne détecte plus aucune vulnérabilité, compte tenu de nos taux actuels de vrais positifs après triage, il est en passe d’avoir mis au jour près de 3 900 vulnérabilités de gravité élevée ou critique dans le code open source — en plus de celles qu’il a détectées pour les partenaires du projet Glasswing. Pour être clair, nous avons l’intention de continuer à analyser le code open source pendant un certain temps, nous nous attendons donc à ce que ce nombre augmente.

Un exemple de vulnérabilité open source détectée par Mythos Preview concernait wolfSSL, une bibliothèque cryptographique open source réputée pour sa sécurité et utilisée par des milliards d’appareils à travers le monde. Mythos Preview a conçu un exploit permettant à un attaquant de falsifier des certificats qui lui permettraient (par exemple) d’héberger un faux site web pour une banque ou un fournisseur de messagerie. Le site web semblerait parfaitement légitime aux yeux d’un utilisateur final, bien qu’il soit contrôlé par l’attaquant. Nous publierons notre analyse technique complète de cette vulnérabilité désormais corrigée (référencée CVE-2026-5194) dans les semaines à venir.

Comme nous l’avons mentionné plus haut, le goulot d’étranglement dans la correction de bogues comme ceux-ci réside dans la capacité humaine à trier, signaler, concevoir et déployer des correctifs. Les détecter est devenu beaucoup plus simple grâce à Mythos Preview. Nous avons créé ci-dessous un tableau de bord des vulnérabilités open source que nous avons analysées, qui présente les différentes étapes de notre processus de divulgation et permettra de suivre nos progrès au fil du temps. Il présente les vulnérabilités de tous les niveaux de gravité, et non pas uniquement le sous-ensemble initialement évalué comme présentant une gravité élevée ou critique par Mythos Preview. Notez la forte baisse observée à chaque phase, qui reflète l'effort humain nécessaire pour vérifier et corriger chacune de ces vulnérabilités.

Nom : 1.jpg
Affichages : 509
Taille : 48,5 Ko

Notre processus de triage des vulnérabilités est rigoureux. Tout d’abord, nous reproduisons, soit nous-mêmes, soit l’une des sociétés de sécurité externes avec lesquelles nous collaborons, le problème détecté par Mythos et réévaluons sa gravité. Une fois que nous avons confirmé l’existence d’une vulnérabilité, nous vérifions s’il existe déjà des correctifs et rédigeons un rapport détaillé à l’intention des responsables de la maintenance du logiciel. Nous faisons preuve d’une grande prudence à ce sujet : en plus des défis habituels liés à la maintenance des logiciels open source, les responsables sont confrontés à un déluge de rapports de bogues de mauvaise qualité générés par l’IA. En effet, plusieurs responsables nous ont indiqué qu’ils étaient actuellement confrontés à de sérieuses contraintes de capacité, et certains nous ont même demandé de ralentir notre rythme de divulgation car ils ont besoin de plus de temps pour concevoir des correctifs. (En moyenne, un bug de gravité élevée ou critique détecté par Mythos Preview nécessite deux semaines pour être corrigé.)

À la demande des responsables, nous divulguons parfois les bugs directement, sans évaluation supplémentaire. Nous avons à ce jour signalé 1 129 bugs non vérifiés de ce type, dont 175 ont été estimés par Mythos Preview comme étant de gravité élevée ou critique.

Nous estimons avoir signalé 530 bogues de gravité élevée ou critique aux responsables de maintenance à ce jour. Ce chiffre repose sur l'évaluation de la gravité effectuée par Claude dans le cas des divulgations directes, et sur celle des responsables de maintenance ou de nos partenaires de sécurité lorsqu'elle est disponible. Il existe 827 vulnérabilités confirmées supplémentaires (estimées comme étant de gravité élevée ou critique selon la même méthode) que nous comptons divulguer dès que possible.

75 des 530 bogues de gravité élevée ou critique que nous avons signalés ont désormais été corrigés, et 65 d'entre eux ont fait l'objet d'avis publics. Le nombre de correctifs reste relativement faible pour trois raisons. Premièrement, nous n'en sommes qu'au début de la période de 90 jours prévue par notre politique de divulgation coordonnée des vulnérabilités : nous nous attendons à ce que de nombreux autres correctifs soient publiés prochainement. Deuxièmement, nous sous-estimons probablement le nombre de correctifs, car certaines vulnérabilités sont corrigées sans avis public : dans ces cas-là, nous devons nous contenter de rechercher nous-mêmes les correctifs à l’aide de Claude. Troisièmement, le faible volume de correctifs reflète un véritable problème : même avec notre rythme de divulgation relativement lent, Mythos Preview vient s’ajouter à un écosystème de sécurité déjà surchargé.

La relative facilité avec laquelle on trouve des vulnérabilités, comparée à la difficulté de les corriger, constitue un défi majeur pour la cybersécurité. Relever ce défi avec succès rendra nos logiciels bien plus sûrs qu’auparavant. Nous abordons ci-dessous quelques moyens dont disposent les cyberdéfenseurs pour s’adapter.

S’adapter à une nouvelle phase de la cybersécurité

Des modèles dotés de capacités de cybersécurité similaires à celles de Mythos Preview seront bientôt plus largement disponibles. Il existe un besoin évident d’un effort accru de la part de l’ensemble du secteur des logiciels pour gérer le volume de découvertes que ces modèles généreront.

Actuellement, il existe souvent un long délai entre la découverte d’une vulnérabilité, la création d’un correctif et le moment où ce correctif est largement déployé par les utilisateurs finaux. Cela laisse une fenêtre d’opportunité importante aux attaquants pour exploiter des logiciels critiques. Les modèles de type Mythos réduisent considérablement le temps et les coûts nécessaires pour détecter et exploiter les vulnérabilités, amplifiant ainsi le risque associé à ces délais. À terme, les modèles de type Mythos permettront aux développeurs de créer des logiciels bien plus sécurisés en détectant les bogues avant leur déploiement. Mais cette période de transition — durant laquelle les vulnérabilités sont rapidement découvertes et lentement corrigées — présente de nouveaux risques.

Les développeurs et les utilisateurs de logiciels doivent agir dès maintenant pour réduire leur exposition à ces risques. Les conseils ci-dessous ne sont pas nouveaux, et de nombreux chercheurs (notamment chez Anthropic) travaillent actuellement à des solutions meilleures et plus durables. En attendant, il est important de bien maîtriser les bases :

- Les développeurs de logiciels devraient raccourcir leurs cycles de correctifs et mettre à disposition les correctifs de sécurité aussi rapidement que possible. L'utilisation réfléchie de modèles d'IA accessibles au public peut y contribuer ; nous développons des outils et partageons nos recherches pour soutenir cette démarche (plus de détails ci-dessous). Les développeurs devraient également aider leurs utilisateurs à maintenir leurs logiciels à jour en facilitant au maximum l'installation des mises à jour ; dans la mesure du possible, ils devraient se montrer plus insistants auprès des utilisateurs qui continuent d'utiliser des logiciels présentant des vulnérabilités connues.

- Les responsables de la sécurité des réseaux doivent raccourcir leurs délais de test et de déploiement des correctifs. Les contrôles critiques définis par des organismes tels que le National Institute of Standards and Technology et le National Cyber Security Centre britannique sont désormais d’autant plus importants, car ils améliorent la sécurité sans dépendre de la mise en place d’un correctif particulier en temps voulu. Il s’agit notamment de mesures telles que le renforcement des configurations par défaut des réseaux, l’application de l’authentification multifactorielle et la tenue de journaux complets pour la détection et la réponse.

Outils de cyberdéfense basés sur des modèles d'IA accessibles au public

De nombreux modèles accessibles à tous permettent déjà de détecter un grand nombre de failles logicielles, même s'ils ne sont pas en mesure d'identifier les failles les plus sophistiquées ni de les exploiter aussi efficacement que Claude Mythos Preview. Le projet Glasswing a déjà incité de nombreuses autres organisations à agir sur leurs propres bases de code à l'aide de ces modèles accessibles à tous ; nous nous efforçons de faciliter considérablement cette démarche.

Pour commencer, nous avons lancé Claude Security en version bêta publique pour les clients de Claude Enterprise. Il s'agit d'un outil qui aide les équipes à analyser leurs bases de code à la recherche de vulnérabilités et qui peut générer des propositions de correctifs. Au cours des trois semaines qui ont suivi son lancement, Claude Opus 4.7 a été utilisé pour corriger plus de 2 100 vulnérabilités. (Ce processus est plus rapide que les correctifs open source décrits ci-dessus, en grande partie parce que les entreprises corrigent leur propre code, alors que les correctifs open source nécessitent généralement des mainteneurs bénévoles qui travaillent dans le cadre d’une divulgation coordonnée.)

Nous avons également lancé notre programme de vérification de la cybersécurité, qui permet aux professionnels de la sécurité utilisant nos modèles à des fins légitimes de cybersécurité (telles que la recherche de vulnérabilités, les tests d’intrusion et les exercices de simulation d’attaques) de le faire sans certaines mesures de protection destinées à prévenir les abus.

Désormais, nous mettons à la disposition des équipes de sécurité de nos clients éligibles, sur demande, les outils que nos partenaires et nous-mêmes avons utilisés avec Mythos Preview. Notre objectif est de faciliter considérablement l’obtention des meilleures performances à partir de modèles publics hautement performants, sans configuration complexe. Cette version comprend :

- Les compétences (instructions personnalisées pour des tâches répétitives) que nos partenaires et nous-mêmes avons développées et partagées ;

- Un harnais qui aide Claude à cartographier la base de code, à lancer des sous-agents de scan, à trier ses résultats et à rédiger des rapports ;

- Un générateur de modèles de menaces, qui cartographie une base de code pour identifier les cibles potentielles d’attaque et hiérarchise le travail du modèle en conséquence.

Cisco, l’un de nos partenaires du projet Glasswing, a également récemment open-sourcé son Foundry Security Spec afin d’aider d’autres défenseurs à construire un système d’évaluation similaire à celui qu’ils utilisent eux-mêmes.

Soutenir l'écosystème

Nous avons conclu un partenariat avec le projet Alpha-Omega de l'Open Source Security Foundation, qui soutiendra les efforts de la fondation visant à aider les responsables de maintenance à traiter et à trier les rapports de bogues. Nous continuons également à publier des recherches sur la manière dont les capacités des modèles de pointe peuvent au mieux soutenir les cyberdéfenseurs.

Nous avons également soutenu le développement d’ExploitBench et d’ExploitGym, les deux nouveaux benchmarks qui permettent aux chercheurs de suivre les capacités de développement d’exploits des modèles d’IA de pointe au fil du temps, comme nous l’évoquons ici. Nous soutenons le développement d’autres benchmarks quantitatifs de haute qualité par le biais de notre programme d’accès pour les chercheurs externes. Enfin, Claude for Open Source soutient les responsables de maintenance et les contributeurs, et nous nous engageons à analyser tout paquet open source que nous adopterons nous-mêmes à l’avenir.

Quelle est la prochaine étape pour le projet Glasswing ?

La rapidité des progrès en IA signifie que des modèles aussi performants que Mythos Preview seront bientôt développés par de nombreuses entreprises d’IA. À l’heure actuelle, aucune entreprise — y compris Anthropic — n’a mis au point de mesures de sécurité suffisamment solides pour empêcher que de tels modèles ne soient utilisés à mauvais escient et ne causent potentiellement de graves dommages. C’est pourquoi nous n’avons pas encore rendu publics les modèles de la classe Mythos. Mais c'est aussi la raison pour laquelle nous avons lancé le projet Glasswing : si un modèle aux capacités similaires est publié sans de telles mesures de protection, il deviendra rapidement beaucoup moins coûteux et plus facile pour presque n'importe qui dans le monde d'exploiter des logiciels présentant des failles.

Glasswing aide les cyberdéfenseurs les plus importants sur le plan systémique à acquérir un avantage asymétrique. Cependant, il est urgent que le plus grand nombre possible d'organisations renforcent leurs cyberdéfenses. Nous espérons que nos modèles accessibles au grand public, ainsi que les nouveaux outils, ressources et travaux de recherche que nous fournissons pour les accompagner, aideront ces organisations à améliorer leur posture en matière de cybersécurité.

Prochainement, nous travaillerons avec des partenaires clés — notamment les gouvernements des États-Unis et de leurs alliés — afin d’étendre le projet Glasswing à d’autres partenaires. Et dans un avenir proche, une fois que nous aurons mis au point les mesures de protection bien plus robustes dont nous avons besoin, nous espérons pouvoir rendre les modèles de classe Mythos accessibles au grand public.

Au-delà de ces risques, un monde encourageant s'offre à nous : un monde dans lequel les codes importants sont bien mieux sécurisés qu'aujourd'hui, et où le piratage est bien moins répandu. Les obstacles sont nombreux, mais nous sommes néanmoins convaincus que le projet Glasswing peut nous aider à y parvenir.

Source : Rapport d'Anthropic

Et vous ?

Pensez-vous que ce rapport est crédible ou pertinent ?

Quel est votre avis sur le sujet ?

Voir aussi :

GPT-5.5 d'OpenAI rivalise avec Claude Mythos d'Anthropic en matière de capacités de cyberattaque : la cybermenace représentée par Mythos ne serait pas une avancée propre à un seul modèle

Google a confirmé les craintes liées à Mythos en révélant avoir réussi à bloquer une cyberattaque de grande envergure au cours de laquelle des cybercriminels ont utilisé l'IA pour découvrir une faille inconnue

Yann Le Cun, ancien directeur scientifique en IA chez Meta, qualifie la panique suscitée par la version préliminaire de « Claude Mythos » d'Anthropic de mise en scène exagérée « issues d'une illusion »

**suricata** · 28/05/2026, 15h39

Ce qui me rassure entre autre dans cette news est que nous aurons toujours besoin d'humains. Donc je ne suis pas au chômage tout de suite.

Autre point, la défense dispose d'un outil pour prendre le pas sur l'attaque. Je l'expérimente déjà depuis 2016 chez Thales et son IA cortAIx qui n'est pas un LLM. Nous avons migré toute l'entreprise sur Debian et fait de la détection de failles et les corrections avec l'IA en juin 2025.

Mozilla affirme que les 271 vulnérabilités découvertes par Mythos ne présentent «quasiment aucun faux positif»

Intelligence artificielle

Discussions similaires

Partager

Partager