IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Intelligence artificielle Discussion :

OpenAI lance ChatGPT-5.5 Instant comme modèle par défaut


Sujet :

Intelligence artificielle

  1. #1
    Communiqués de presse

    Femme Profil pro
    Traductrice Technique
    Inscrit en
    Juin 2023
    Messages
    2 944
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France

    Informations professionnelles :
    Activité : Traductrice Technique

    Informations forums :
    Inscription : Juin 2023
    Messages : 2 944
    Par défaut OpenAI lance ChatGPT-5.5 Instant comme modèle par défaut
    OpenAI lance GPT-5.5, son tout dernier modèle d'IA, que la société qualifie de « modèle le plus intelligent et le plus intuitif à utiliser » à ce jour, et plus performant en matière de programmation

    OpenAI annonce GPT-5.5, son dernier modèle d'IA, qui offre de meilleures performances en matière de programmation, d'utilisation des ordinateurs et de capacités de recherche approfondie. Ce lancement intervient quelques semaines seulement après qu'Anthropic a dévoilé Claude Mythos Preview, son nouveau modèle doté de capacités avancées en matière de cybersécurité. GPT-5.5 est en cours de déploiement auprès des abonnés payants d'OpenAI, notamment ses utilisateurs Plus, Pro, Business et Enterprise, dans ChatGPT et Codex.

    OpenAI est un organisme américain de recherche en intelligence artificielle (IA) composé d’une société à but lucratif d’intérêt public (PBC) et d’une fondation à but non lucratif, dont le siège se trouve à San Francisco. OpenAI a développé la famille de grands modèles de langage GPT, la série DALL-E de modèles de conversion texte-image et la série Sora de modèles de conversion texte-vidéo, qui ont influencé la recherche industrielle et les applications commerciales. Le lancement de ChatGPT en novembre 2022 est considéré comme ayant suscité un intérêt généralisé pour l'IA générative.

    Récemment, OpenAI a annoncé son dernier modèle d'IA, GPT-5.5, qui, selon la société, est plus performant en matière de codage, d'utilisation des ordinateurs et de capacités de recherche approfondie. Ce lancement intervient moins de deux mois après la sortie de GPT 5.4 par OpenAI, dernier signe en date du rythme effréné de développement qui anime le secteur de l’IA. OpenAI se lance dans une course effrénée pour rester dans la course face à des rivaux tels que Google et Anthropic, dont le dernier modèle, Claude Mythos Preview, a captivé Wall Street.

    « Ce qui rend ce modèle vraiment spécial, c’est tout ce qu’il peut accomplir avec moins de directives », a déclaré Greg Brockman, président d’OpenAI. « Il est capable d’analyser un problème flou et de déterminer exactement ce qu’il faut faire ensuite. Pour moi, cela donne vraiment l’impression de jeter les bases de la manière dont nous allons utiliser les ordinateurs et travailler avec eux à l’avenir. »

    OpenAI a déclaré que GPT-5.5 excelle dans l’analyse de données, l’écriture et le débogage de code, l’utilisation de logiciels, la recherche en ligne et la création de documents et de feuilles de calcul. La société a ajouté que le modèle ne dépasse pas son seuil de risque de cybersécurité « critique », qui pourrait ouvrir « de nouvelles voies sans précédent vers des dommages graves », mais qu’il répond aux critères de sa classification de risque « élevé », qui pourrait « amplifier les voies existantes vers des dommages graves ».

    « GPT-5.5 a fait l’objet de tests de sécurité approfondis menés par des tiers et d’exercices de red teaming portant sur les risques cybernétiques et biologiques, et nous avons perfectionné nos mesures de sécurité informatique pendant des mois avec des modèles de plus en plus performants en matière de cybersécurité », a déclaré Mia Glaese, vice-présidente de la recherche chez OpenAI. Les risques de cybersécurité liés à l’IA sont au centre des préoccupations des dirigeants du secteur technologique et des responsables gouvernementaux depuis qu’Anthropic a annoncé son modèle Mythos au début du mois. La société a décidé de limiter le déploiement de Mythos en raison de sa capacité à identifier les faiblesses et les failles de sécurité au sein des logiciels.

    GPT-5.5 est déployé ce jeudi auprès des abonnés payants d’OpenAI, notamment les utilisateurs des formules Plus, Pro, Business et Enterprise, dans ChatGPT et son assistant de codage Codex. La société a indiqué que le modèle serait disponible « très bientôt » sur son interface de programmation d’applications, mais que ces déploiements nécessitaient « des mesures de sécurité différentes ».


    Voici un extrait de l'annonce de GPT-5.5 :

    Présentation de GPT-5.5

    Nous lançons GPT-5.5, notre modèle le plus intelligent et le plus intuitif à ce jour, qui marque une nouvelle étape vers une nouvelle façon de travailler sur ordinateur.

    GPT-5.5 comprend plus rapidement ce que vous essayez de faire et peut prendre en charge une plus grande partie du travail. Il excelle dans l'écriture et le débogage de code, la recherche en ligne, l'analyse de données, la création de documents et de feuilles de calcul, l'utilisation de logiciels et le passage d'un outil à l'autre jusqu'à ce qu'une tâche soit terminée. Au lieu de gérer minutieusement chaque étape, vous pouvez confier à GPT-5.5 une tâche complexe et fragmentée, et lui faire confiance pour planifier, utiliser des outils, vérifier son travail, gérer les ambiguïtés et persévérer.

    Les gains sont particulièrement importants dans le codage agentique, l’utilisation de l’ordinateur, le travail intellectuel et la recherche scientifique préliminaire — des domaines où les progrès dépendent de la capacité à raisonner dans un contexte global et à agir sur la durée. GPT-5.5 offre cette avancée en matière d’intelligence sans compromettre la vitesse : les modèles plus volumineux et plus performants sont souvent plus lents à servir, mais GPT-5.5 égale la latence par token de GPT-5.4 en conditions réelles, tout en offrant un niveau d’intelligence bien supérieur. Il utilise également nettement moins de tokens pour accomplir les mêmes tâches Codex, ce qui le rend à la fois plus efficace et plus performant.

    Nous lançons GPT-5.5 avec notre ensemble de mesures de sécurité le plus solide à ce jour, conçu pour réduire les abus tout en préservant l'accès à des fins utiles. Nous avons évalué ce modèle à l'aide de l'ensemble de nos cadres de sécurité et de préparation, collaboré avec des redteamers internes et externes, ajouté des tests ciblés pour les capacités avancées en matière de cybersécurité et de biologie, et recueilli des retours sur des cas d'utilisation réels auprès de près de 200 partenaires de confiance bénéficiant d'un accès anticipé avant le lancement.

    Aujourd'hui, GPT-5.5 est déployé pour les utilisateurs Plus, Pro, Business et Enterprise dans ChatGPT et Codex, et GPT-5.5 Pro est déployé pour les utilisateurs Pro, Business et Enterprise dans ChatGPT. Les déploiements via l'API nécessitent des mesures de protection différentes et nous travaillons en étroite collaboration avec nos partenaires et nos clients sur les exigences de sécurité et de sûreté pour le proposer à grande échelle. Nous intégrerons très prochainement GPT-5.5 et GPT-5.5 Pro à l'API.

    Nom : 1.jpg
Affichages : 6993
Taille : 53,2 Ko

    Capacités du modèle

    OpenAI met en place l'infrastructure mondiale pour l'IA agentique, permettant ainsi aux particuliers et aux entreprises du monde entier d'accomplir leurs tâches grâce à l'IA. Au cours de l'année écoulée, nous avons vu l'IA accélérer considérablement le développement logiciel. Avec GPT-5.5 dans Codex et ChatGPT, cette même transformation commence à s'étendre à la recherche scientifique et à l'ensemble des tâches que les gens effectuent sur ordinateur.

    Dans tous ces domaines, GPT-5.5 n'est pas seulement plus intelligent ; il est plus efficace dans sa manière de résoudre les problèmes, produisant souvent des résultats de meilleure qualité avec moins de tokens et moins de tentatives. Sur l'indice de codage d'Artificial Analysis, GPT-5.5 offre une intelligence de pointe à moitié prix par rapport aux modèles de codage de pointe concurrents.

    Nom : 2.jpg
Affichages : 891
Taille : 32,4 Ko

    Codage agentique

    GPT-5.5 est notre modèle de codage agentique le plus performant à ce jour. Sur Terminal-Bench 2.0, qui teste des workflows complexes en ligne de commande nécessitant de la planification, des itérations et la coordination d'outils, il atteint une précision de pointe de 82,7 %. Sur SWE-Bench Pro, qui évalue la résolution de tickets GitHub en conditions réelles, il atteint 58,6 %, résolvant plus de tâches de bout en bout en un seul passage que les modèles précédents. Sur Expert-SWE, notre évaluation interne de référence pour les tâches de codage à long terme dont le temps de réalisation humain estimé est de 20 heures en moyenne, GPT-5.5 surpasse également GPT-5.4.

    Sur l'ensemble des trois évaluations, GPT-5.5 améliore les scores de GPT-5.4 tout en utilisant moins de tokens.

    Nom : 3.jpg
Affichages : 873
Taille : 24,5 Ko

    Les atouts du modèle en matière de codage apparaissent particulièrement clairement dans Codex, où il peut prendre en charge des tâches d'ingénierie allant de l'implémentation et de la refactorisation au débogage, aux tests et à la validation. Les premiers tests suggèrent que GPT-5.5 est plus performant dans les comportements sur lesquels repose le véritable travail d'ingénierie, comme la gestion du contexte dans des systèmes de grande envergure, le raisonnement face à des échecs ambigus, la vérification des hypothèses à l'aide d'outils et la propagation des modifications dans la base de code environnante.

    Au-delà des benchmarks, les premiers testeurs ont indiqué que GPT-5.5 fait preuve d'une plus grande capacité à comprendre la structure d'un système : pourquoi quelque chose ne fonctionne pas, où la correction doit être appliquée et quels autres éléments de la base de code seraient affectés.

    Travail intellectuel

    Les mêmes atouts qui font de GPT-5.5 un excellent outil de codage le rendent également puissant pour le travail quotidien sur ordinateur. Comme le modèle comprend mieux l’intention, il peut évoluer plus naturellement à travers le cycle complet du travail intellectuel : trouver des informations, comprendre ce qui importe, utiliser des outils, vérifier le résultat et transformer des données brutes en quelque chose d’utile.

    Dans Codex, GPT-5.5 est plus performant que GPT-5.4 pour générer des documents, des feuilles de calcul et des présentations PowerPoint. Les testeurs alpha ont déclaré qu’il surpassait les modèles précédents dans des tâches telles que la recherche opérationnelle, la modélisation sur tableur et la transformation de données commerciales désordonnées en plans. Associé aux compétences informatiques de Codex, GPT-5.5 nous donne davantage l’impression que le modèle peut réellement utiliser l’ordinateur avec vous : voir ce qui s’affiche à l’écran, cliquer, taper, naviguer dans les interfaces et passer d’un outil à l’autre avec précision.

    Les équipes d’OpenAI exploitent déjà ces atouts dans des flux de travail réels. Aujourd’hui, plus de 85 % de l’entreprise utilise Codex chaque semaine dans des fonctions telles que l’ingénierie logicielle, la finance, la communication, le marketing, la science des données et la gestion de produits. Au sein de l’équipe Communication, l’équipe a utilisé GPT-5.5 dans Codex pour analyser six mois de données relatives aux demandes d’intervention, mettre en place un cadre de notation et d’évaluation des risques, et valider un agent Slack automatisé afin que les demandes à faible risque puissent être traitées automatiquement tandis que celles à haut risque continuent d’être acheminées vers un examen humain. Au sein du service financier, l'équipe a utilisé Codex pour examiner 24 771 formulaires fiscaux K-1 totalisant 71 637 pages, grâce à un flux de travail excluant les informations personnelles et permettant à l'équipe d'accélérer la tâche de deux semaines par rapport à l'année précédente. Au sein de l'équipe chargée de la mise sur le marché, un employé a automatisé la génération de rapports d'activité hebdomadaires, gagnant ainsi 5 à 10 heures par semaine.

    Dans ChatGPT, GPT-5.5 Thinking offre une aide plus rapide pour les problèmes plus complexes, avec des réponses plus intelligentes et plus concises pour vous aider à mener à bien des tâches complexes plus efficacement. Il excelle dans les tâches professionnelles telles que le codage, la recherche, la synthèse et l'analyse d'informations, ainsi que les tâches impliquant de nombreux documents, en particulier lors de l'utilisation de plugins.

    Dans GPT-5.5 Pro, les premiers testeurs constatent une amélioration significative tant au niveau de la difficulté que de la qualité du travail que ChatGPT peut prendre en charge, avec des améliorations de la latence qui le rendent beaucoup plus pratique pour les tâches exigeantes. Par rapport à GPT-5.4 Pro, les testeurs ont trouvé les réponses de GPT-5.5 Pro nettement plus complètes, bien structurées, précises, pertinentes et utiles, avec des performances particulièrement solides dans les domaines des affaires, du droit, de l’éducation et de la science des données.

    GPT-5.5 atteint des performances de pointe sur plusieurs benchmarks reflétant ce type de travail. Sur GDPval⁠⁠, qui teste la capacité des agents à produire un travail intellectuel bien défini dans 44 professions, GPT-5.5 obtient un score de 84,9 %. Sur OSWorld-Verified, qui mesure la capacité d’un modèle à faire fonctionner de manière autonome de véritables environnements informatiques, il atteint 78,7 %. Et sur Tau2-bench Telecom, qui teste des workflows complexes de service client, il atteint 98,0 % sans ajustement des invites. GPT-5.5 affiche également d'excellentes performances sur d'autres benchmarks de travail intellectuel : 60,0 % sur FinanceAgent, 88,5 % sur des tâches internes de modélisation en banque d'investissement et 54,1 % sur OfficeQA Pro.

    Nom : 4.jpg
Affichages : 424
Taille : 28,8 Ko

    Recherche scientifique

    GPT-5.5 affiche également des progrès dans les workflows de recherche scientifique et technique, qui exigent davantage que de simplement répondre à une question difficile. Les chercheurs doivent explorer une idée, rassembler des preuves, tester des hypothèses, interpréter les résultats et décider de la prochaine étape. GPT-5.5 est plus performant que les autres modèles pour persévérer tout au long de ce cycle.

    Il convient de noter que GPT-5.5 affiche une nette amélioration par rapport à GPT-5.4 sur GeneBench, une nouvelle évaluation axée sur l'analyse de données scientifiques en plusieurs étapes en génétique et en biologie quantitative. Ces problèmes exigent des modèles qu'ils raisonnent sur des données potentiellement ambiguës ou erronées avec un minimum de supervision, qu'ils surmontent des obstacles réalistes tels que des facteurs de confusion cachés ou des défaillances du contrôle qualité, et qu'ils mettent en œuvre et interprètent correctement les méthodes statistiques modernes. Les performances du modèle sont remarquables compte tenu du fait que les tâches en question correspondent souvent à des projets de plusieurs jours pour des experts scientifiques.

    Nom : 5.jpg
Affichages : 419
Taille : 23,2 Ko

    De même, sur BixBench⁠, un test de performance conçu autour de cas concrets de bio-informatique et d'analyse de données, GPT-5.5 a obtenu les meilleurs résultats parmi les modèles dont les scores ont été publiés. Les capacités scientifiques du modèle sont désormais suffisamment solides pour accélérer de manière significative les avancées à la pointe de la recherche biomédicale, en tant que véritable co-chercheur.

    Nom : 6.jpg
Affichages : 405
Taille : 12,0 Ko

    Dans un autre exemple, une version interne de GPT-5.5 dotée d'un harnais personnalisé a permis de découvrir une nouvelle preuve concernant les nombres de Ramsey, l'un des objets centraux de la combinatoire. La combinatoire étudie comment des objets discrets s'articulent entre eux : graphes, réseaux, ensembles et motifs. Les nombres de Ramsey posent, en gros, la question de la taille minimale qu'un réseau doit avoir pour qu'un certain type d'ordre soit garanti. Les résultats dans ce domaine sont rares et souvent techniquement difficiles à obtenir. Ici, GPT-5.5 a trouvé une preuve d’un fait asymptotique de longue date concernant les nombres de Ramsey hors diagonale, vérifiée par la suite dans Lean. Ce résultat est un exemple concret de la contribution de GPT-5.5, qui ne se limite pas à fournir du code ou des explications, mais apporte un argument mathématique surprenant et utile dans un domaine de recherche fondamental.

    Les premiers testeurs ont utilisé GPT-5.5 Pro dans ChatGPT moins comme un moteur de réponse ponctuel que comme un partenaire de recherche : en critiquant des manuscrits au fil de multiples itérations, en soumettant les arguments techniques à des tests de résistance, en proposant des analyses et en travaillant avec du code, des notes et des contextes PDF. Le point commun est que GPT-5.5 aide mieux les chercheurs à passer de la question à l'expérience, puis au résultat.

    Efficacité de l'inférence de nouvelle génération

    Pour faire fonctionner GPT-5.5 avec la latence de GPT-5.4, il a fallu repenser l'inférence comme un système intégré, et non comme un ensemble d'optimisations isolées. GPT-5.5 a été co-conçu, entraîné et déployé sur les systèmes NVIDIA GB200 et GB300 NVL72. Codex et GPT-5.5 ont joué un rôle déterminant dans la réalisation de nos objectifs de performance. Codex a aidé l'équipe à passer plus rapidement de l'idée à une implémentation pouvant faire l'objet de tests de performance, en esquissant des approches, en mettant en place des expériences et en aidant à identifier les optimisations méritant un investissement plus important. GPT-5.5 a permis de trouver et de mettre en œuvre des améliorations clés au sein même de la pile. En termes simples, le modèle a contribué à améliorer l'infrastructure qui le dessert.

    L'une de ces améliorations concernait l'équilibrage de charge et les heuristiques de partitionnement. Avant GPT-5.5, nous divisions les requêtes sur un accélérateur en un nombre fixe de blocs afin d'équilibrer la charge de travail entre les cœurs de calcul, garantissant ainsi que les requêtes, grandes ou petites, puissent s'exécuter sur le même GPU. Cependant, un nombre prédéterminé de blocs statiques n'est pas optimal pour tous les profils de trafic. Afin de mieux exploiter les GPU, Codex a analysé plusieurs semaines de modèles de trafic en production et a écrit des algorithmes heuristiques personnalisés pour partitionner et équilibrer la charge de travail de manière optimale. Cet effort a eu un impact considérable, augmentant la vitesse de génération de jetons de plus de 20 %.


    Faire progresser la cybersécurité pour la sécurité de tous

    Préparer le monde à l'arrivée de modèles très performants pour détecter et corriger les failles de sécurité est un travail d'équipe qui exigera que l'ensemble de l'écosystème s'efforce de renforcer la résilience, grâce à un accès démocratisé aux modèles et à un déploiement itératif pour la prochaine ère de la cyberdéfense⁠.

    Les modèles de pointe sont de plus en plus performants en matière de cybersécurité. Ces capacités seront largement diffusées et nous pensons que la meilleure voie à suivre consiste à veiller à ce qu'elles puissent être mises à profit pour accélérer la cyberdéfense et renforcer l'écosystème.

    GPT-5.5 constitue une avancée progressive mais importante vers une IA capable de résoudre certains des défis les plus complexes au monde, tels que la cybersécurité. Avec GPT-5.2 en décembre, nous avons déployé de manière proactive les mesures de protection nécessaires pour limiter les abus potentiels liés à nos modèles ; aujourd’hui, avec GPT-5.5, nous déployons des classificateurs plus stricts pour les risques cybernétiques potentiels, ce que certains utilisateurs pourraient trouver gênant au départ, mais nous les affinerons au fil du temps.

    Nous avons identifié la cybersécurité comme une catégorie dans notre cadre de préparation⁠ depuis des années, à mesure que nos modèles s'amélioraient progressivement, tout en développant et en calibrant des mesures d'atténuation de manière itérative, afin de pouvoir publier de manière responsable des modèles dotés de capacités de cybersécurité significatives.

    - Nous déployons des mesures de protection de pointe pour ce niveau de capacité cybernétique. Nous avons introduit pour la première fois des mesures de sécurité spécifiques à la cybersécurité avec GPT-5.2⁠ l'année dernière, que nous avons continué à tester, affiner et développer lors des déploiements suivants. Pour GPT-5.5, nous avons conçu des contrôles plus stricts autour des activités à haut risque et des requêtes sensibles en matière de cybersécurité, et ajouté des protections contre les abus répétés. Un accès étendu est rendu possible grâce à nos investissements dans la sécurité des modèles, l'utilisation authentifiée et la surveillance des utilisations non autorisées. Nous travaillons depuis des mois avec des experts externes pour développer, tester et améliorer la robustesse de ces mesures de protection. Avec GPT-5.5, nous veillons à ce que les développeurs puissent sécuriser leur code en toute simplicité, tout en mettant en place des contrôles plus stricts autour des flux de travail cybernétiques les plus susceptibles d'être exploités par des acteurs malveillants.

    - Nous élargissons l'accès afin d'accélérer la cyberdéfense à tous les niveaux. Nous mettons nos modèles cyber-permissifs à disposition via Trusted Access for Cyber⁠, en commençant par Codex, qui offre un accès étendu aux capacités avancées de cybersécurité de GPT-5.5 avec moins de restrictions pour les utilisateurs vérifiés répondant à certains critères de confiance⁠ dès le lancement. Les organisations chargées de défendre des infrastructures critiques peuvent demander à accéder à des modèles cyber-permissifs tels que GPT-5.4-Cyber, tout en respectant des exigences de sécurité strictes pour utiliser ces modèles afin de sécuriser leurs systèmes internes. Cela offre à un large éventail de défenseurs vérifiés des outils plus performants pour effectuer un travail de sécurité légitime avec moins de frictions inutiles, afin de garantir la démocratisation de l'accès à d'importantes capacités défensives. Les utilisateurs peuvent demander un accès de confiance sur chatgpt.com/cyber⁠ afin de réduire les refus inutiles lorsqu'ils utilisent GPT‑5.5 pour des tâches défensives vérifiées.

    - Nous travaillons avec des partenaires gouvernementaux pour aider à protéger les infrastructures critiques pour le public. Ensemble, nous explorons comment l'IA avancée peut soutenir le travail de défense des responsables de confiance chargés des systèmes sur lesquels les gens comptent, qu'il s'agisse des systèmes numériques qui sécurisent les données importantes des contribuables ou du réseau électrique et de l'approvisionnement en eau dans les communautés locales.

    Nous classons les capacités de GPT-5.5 en matière de sécurité biologique/chimique et de cybersécurité au niveau « Élevé » dans notre cadre de préparation⁠. Bien que le GPT-5.5 n'ait pas atteint le niveau de capacité de cybersécurité « critique », nos évaluations et nos tests ont montré que ses capacités en matière de cybersécurité constituent une avancée par rapport au GPT-5.4.

    De plus, le GPT-5.5 a été soumis à l'ensemble de notre processus de sécurité et de gouvernance avant sa publication, y compris des évaluations de préparation, des tests spécifiques à certains domaines, de nouvelles évaluations ciblées sur les capacités avancées en biologie et en cybersécurité, ainsi que des tests rigoureux menés avec des experts externes. Nous fournissons plus de détails dans la fiche système du GPT-5.5⁠.

    Ce travail reflète notre approche plus large de la résilience de l'IA, que nous estimons nécessaire à mesure que les capacités des modèles progressent. Nous voulons que les utilisateurs puissent disposer d'une IA puissante pour défendre les systèmes, les institutions et le public. La voie viable passe par un accès fiable, des mesures de protection robustes qui s'adaptent aux capacités, et la capacité opérationnelle de détecter et de réagir aux abus graves.

    Nom : 7.jpg
Affichages : 401
Taille : 16,9 Ko
    Nom : 8.jpg
Affichages : 408
Taille : 25,5 Ko

    Disponibilité et tarifs

    Aujourd'hui, GPT-5.5 est déployé pour les utilisateurs Plus, Pro, Business et Enterprise dans ChatGPT et Codex, et GPT-5.5 Pro est déployé pour les utilisateurs Pro, Business et Enterprise dans ChatGPT. Nous intégrerons très prochainement GPT-5.5 et GPT-5.5 Pro à l'API.

    Dans ChatGPT, GPT-5.5 Thinking est disponible pour les utilisateurs Plus, Pro, Business et Enterprise. GPT-5.5 Pro, conçu pour les questions encore plus complexes et les tâches nécessitant une plus grande précision, est disponible pour les utilisateurs Pro, Business et Enterprise.

    Dans Codex, GPT-5.5 est disponible pour les formules Plus, Pro, Business, Enterprise, Edu et Go avec une fenêtre de contexte de 400 000 caractères. GPT-5.5 est également disponible en mode Fast, générant des tokens 1,5 fois plus rapidement pour un coût 2,5 fois supérieur.

    Pour les développeurs d'API, GPT-5.5 sera bientôt disponible dans les API Responses et Chat Completions au tarif de 5 $ par million de tokens d'entrée et de 30 $ par million de tokens de sortie, avec une fenêtre de contexte de 1 million. Les tarifs Batch et Flex sont disponibles à la moitié du tarif API standard, tandis que le traitement prioritaire est disponible à 2,5 fois le tarif standard. Nous lancerons également gpt-5.5-pro dans l'API pour une précision encore plus élevée, au prix de 30 $ par million de jetons d'entrée et de 180 $ par million de jetons de sortie. Consultez la page des tarifs⁠ pour plus de détails.

    Bien que GPT-5.5 soit plus cher que GPT-5.4, il est à la fois plus intelligent et beaucoup plus efficace en termes de tokens. Dans Codex, nous avons soigneusement optimisé l'expérience afin que GPT-5.5 offre de meilleurs résultats avec moins de tokens que GPT-5.4 pour la plupart des utilisateurs, tout en continuant à proposer une utilisation généreuse à tous les niveaux d'abonnement.

    Source : Annonce de GPT-5.5

    Et vous ?

    Pensez-vous que cette annonce est crédible ou pertinente ?
    Quel est votre avis sur le sujet ?

    Voir aussi :

    OpenAI : « nous avons aussi un nouvel outil d'IA redoutablement si puissant qu'on ne peut pas le commercialiser », l'entreprise ne veut pas se laisser distancer par Anthropic dans le cycle médiatique actuel

    Le climat chez OpenAI est plutôt morose : l'entreprise fait face à une instabilité interne marquée par des polémiques publiques, des contrats militaires controversés et des démissions en série au sommet

    Anthropic écrase GPT-5.4 avec le lancement de Claude Opus 4.7, un modèle d'IA moins risqué et moins puissant que Mythos, mais nettement plus efficace que la version 4.6
    Publication de communiqués de presse en informatique. Contribuez au club : corrections, suggestions, critiques, ... Contactez le service news et Rédigez des actualités

  2. #2
    Communiqués de presse

    Femme Profil pro
    Traductrice Technique
    Inscrit en
    Juin 2023
    Messages
    2 944
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France

    Informations professionnelles :
    Activité : Traductrice Technique

    Informations forums :
    Inscription : Juin 2023
    Messages : 2 944
    Par défaut GPT-5.5 d'OpenAI rivaliserait avec le Claude Mythos d'Anthropic en matière de capacités de cyberattaque
    GPT-5.5 d'OpenAI rivalise avec le Claude Mythos d'Anthropic en matière de capacités de cyberattaque : la cybermenace représentée par Mythos ne serait pas « une avancée propre à un seul modèle »

    Une agence gouvernementale britannique a découvert que le tout dernier modèle d'IA d'OpenAI est capable de mener de manière autonome des cyberattaques complexes et qu'il a réussi un défi de rétro-ingénierie en un peu plus de 10 minutes, alors qu'il avait fallu environ 12 heures à un expert en sécurité humain. L'AI Security Institute (AISI), un organisme de recherche rattaché au ministère britannique des Sciences, de l'Innovation et de la Technologie, a publié des conclusions montrant que le GPT-5.5 figure parmi les modèles les plus performants qu'il ait évalués en matière de capacités cyberoffensives, ce qui le place à peu près au même niveau que le très vanté Claude Mythos d'Anthropic.

    Anthropic PBC est une entreprise américaine spécialisée dans l'intelligence artificielle (IA) dont le siège social est situé à San Francisco. Elle a développé une famille de grands modèles de langage (LLM) baptisée Claude. Anthropic fonctionne comme une société d'intérêt public qui mène des activités de recherche et de développement en IA afin « d'étudier leurs propriétés de sécurité à la frontière technologique » et d'utiliser ces recherches pour déployer des modèles sûrs destinés au grand public.

    Fin mars, le modèle d'IA Claude Mythos d'Anthropic a fait l'objet d'une fuite avant même son lancement et a fait grand bruit sur les réseaux sociaux. Mais Anthropic a déclaré quelque jours plus tard qu'il ne commercialiserait pas Mythos au grand public, invoquant la crainte qu'il ne soit trop efficace pour détecter des failles de cybersécurité de gravité élevée dans les principaux systèmes d'exploitation et navigateurs web. « L'augmentation considérable des capacités de Claude Mythos Preview nous a amenés à décider de ne pas le rendre accessible au grand public. Nous l'utilisons plutôt dans le cadre d'un programme de cybersécurité défensive avec un groupe restreint de partenaires », a déclaré Anthropic.

    Dans le cadre de ce programme, Mozilla, le développeur du navigateur Firefox, a déclaré qu’une première version du modèle d’IA Claude Mythos d’Anthropic avait permis d’identifier 271 vulnérabilités dans le navigateur lors de tests internes. Mozilla a rapporté : « Nous avons de nombreuses années d’expérience à décortiquer le travail des meilleurs chercheurs en sécurité du monde, et Mythos Preview est tout aussi performant. Jusqu’à présent, nous n’avons trouvé aucune catégorie ni aucune complexité de vulnérabilité que les humains peuvent détecter et que ce modèle ne peut pas. »

    Les rapports concerant Claude Mythos donnent l’impression qu’OpenAI joue le rôle de suiveur. OpenAI est un organisme américain de recherche en intelligence artificielle (IA) composé d’une société à but lucratif d’intérêt public (PBC) et d’une fondation à but non lucratif, dont le siège se trouve à San Francisco. OpenAI a développé la famille de grands modèles de langage GPT, la série DALL-E de modèles de conversion texte-image et la série Sora de modèles de conversion texte-vidéo, qui ont influencé la recherche industrielle et les applications commerciales. Le lancement de ChatGPT en novembre 2022 est considéré comme ayant suscité un intérêt généralisé pour l'IA générative.

    Dans cette course effrénée face à Anthropic, notamment Claude Mythos, OpenAI a annoncé fin avril son dernier modèle d'IA, GPT-5.5, qui, selon la société, est plus performant en matière de codage, d'utilisation des ordinateurs et de capacités de recherche approfondie. Dans le domaine de la cybersécurité, OpenAI affirme : « GPT-5.5 constitue une avancée progressive mais importante vers une IA capable de résoudre certains des défis les plus complexes au monde, tels que la cybersécurité. »

    Selon les résultats d'une nouvelle étude, le GPT-5.5 d'OpenAI rivalise avec Claude Mythos d'Anthropic en matière de capacités de cyberattaque ; la cybermenace représentée par Mythos ne serait pas « une avancée propre à un seul modèle. » Une agence gouvernementale britannique a découvert que le tout dernier modèle d'intelligence artificielle d'OpenAI est capable de mener de manière autonome des cyberattaques complexes et qu'il a réussi un défi de rétro-ingénierie en un peu plus de 10 minutes, alors qu'il avait fallu environ 12 heures à un expert en sécurité humain.


    L'AI Security Institute (AISI), un organisme de recherche rattaché au ministère britannique des Sciences, de l'Innovation et de la Technologie, a publié des conclusions montrant que le GPT-5.5 figure parmi les modèles les plus performants qu'il ait évalués en matière de capacités cyberoffensives, ce qui le place à peu près au même niveau que le très vanté Claude Mythos d'Anthropic. Le rapport révèle que GPT-5.5 est le deuxième modèle à avoir réussi le test le plus exigeant de l'AISI — une attaque simulée en 32 étapes contre un réseau d'entreprise baptisée « The Last Ones » — en y parvenant de manière autonome lors de deux des dix tentatives. Le premier modèle à avoir franchi cette étape décisive était le Claude Mythos Preview d'Anthropic, qui avait réussi la simulation lors de trois des dix essais.

    La simulation de réseau d'entreprise, développée en collaboration avec la société de cybersécurité SpecterOps, exige qu'un agent enchaîne les étapes suivantes : reconnaissance, vol d'identifiants, mouvement latéral à travers plusieurs forêts Active Directory, pivotement de la chaîne d'approvisionnement via un pipeline CI/CD, et enfin l'exfiltration d'une base de données interne protégée — des étapes qui, selon les estimations de l'AISI, prendraient environ 20 heures à un expert humain.

    Le résultat le plus frappant concerne peut-être un casse-tête de rétro-ingénierie d'une difficulté diabolique. GPT-5.5 a résolu ce défi — qui consistait à reconstruire le jeu d'instructions d'une machine virtuelle personnalisée, à écrire un désassembleur à partir de zéro et à récupérer un mot de passe cryptographique par résolution de contraintes — en 10 minutes et 22 secondes, pour un coût de 1,73 $ en utilisation d'API. Un expert humain, utilisant des outils professionnels, aurait eu besoin d'environ 12 heures.

    Sur la batterie de tests avancés de cybersécurité de l'AISI, GPT-5.5 a atteint un taux de réussite moyen de 71,4 % au niveau « Expert », le plus difficile, devançant Mythos Preview (68,6 %) et surpassant largement GPT-5.4 (52,4 %). Ces résultats ont des implications précises pour la trajectoire générale du développement de l'IA. L'AISI a conclu que les performances de GPT-5.5 suggèrent qu'une amélioration rapide des capacités cybernétiques pourrait s'inscrire dans une tendance générale plutôt que constituer une avancée isolée — et a averti que si les compétences cyberoffensives apparaissent comme un sous-produit d'améliorations plus larges en matière de raisonnement, de codage et d'exécution autonome de tâches, alors d'autres avancées pourraient se succéder rapidement.

    Le rapport a également soulevé des préoccupations importantes concernant les mesures de sécurité du modèle. Les chercheurs ont identifié une faille universelle permettant d’obtenir du contenu nuisible pour toutes les requêtes cybermalveillantes testées, y compris dans des environnements agentiques à tours multiples. Il a fallu six heures de travail d’une équipe d’experts en simulation d’attaques pour mettre au point cette attaque. OpenAI a par la suite mis à jour son ensemble de mesures de sécurité, bien qu’un problème de configuration ait empêché l’AISI de vérifier si la version finale était efficace.

    L'AISI a précisé que ses évaluations des capacités avaient été menées dans un environnement de recherche contrôlé et ne reflétaient pas nécessairement ce qui est accessible à un utilisateur lambda, soulignant que les déploiements publics incluent des mesures de sécurité et des contrôles d'accès supplémentaires. Ce rapport s'inscrit dans un contexte préoccupant pour la cybersécurité britannique. L'enquête annuelle du gouvernement britannique sur les violations de cybersécurité, également publiée jeudi, a révélé que 43 % des entreprises avaient subi une violation ou une attaque cybernétique au cours des 12 derniers mois.

    En réponse, le gouvernement a annoncé un nouveau financement de 90 millions de livres sterling pour renforcer la cyber-résilience, et a déclaré qu’il allait de l’avant avec le projet de loi sur la cybersécurité et la résilience afin de protéger les services essentiels. Les responsables ont également publié des recommandations exhortant les organisations à se préparer à une éventuelle recrudescence de vulnérabilités logicielles nouvellement découvertes, l’IA accélérant le rythme auquel les failles de sécurité peuvent être détectées et exploitées.

    Nom : 1.jpg
Affichages : 4269
Taille : 9,2 Ko

    Voici le rapport de AISI :

    Notre évaluation des capacités cybernétiques du GPT-5.5 d'OpenAI

    En avril, notre évaluation d'un premier aperçu de Claude Mythos Preview d'Anthropic a révélé qu'il représentait une avancée en matière de performances cybernétiques par rapport aux modèles de pointe précédents et qu'il était le premier à mener à bien de bout en bout notre simulation d'attaque de réseau d'entreprise, un exercice en plusieurs étapes qui, selon nos estimations, prendrait environ 20 heures à un humain. Une question clé était de savoir si cela reflétait une avancée spécifique à un seul modèle ou s'il s'agissait d'une tendance plus large. Les résultats d'un premier point de contrôle de GPT-5.5 suggèrent que c'est le cas : un deuxième modèle, développé par un autre développeur, atteint désormais un niveau de performance similaire lors de nos évaluations de cybersécurité.

    Résultats des tâches de cybersécurité

    Nous utilisons une suite de 95 tâches de cybersécurité spécialisées réparties sur quatre niveaux de difficulté qui testent un large éventail de compétences en cybersécurité. Nos tâches de cybersécurité sont conçues selon le format « capture-the-flag » (CTF) et visent à évaluer des capacités clés telles que la recherche et l'exploitation de vulnérabilités, en testant le modèle sur des tâches telles que la rétro-ingénierie, l'exploitation Web et la cryptographie.

    Nos tâches de base ont un espace de recherche restreint à modéré et ne nécessitent que quelques étapes pour être résolues ; par exemple, récupérer un drapeau à partir d'une capture de paquets, cryptoanalyser un chiffrement mal utilisé ou procéder à la rétro-ingénierie d'un petit fichier binaire pour localiser un secret codé en dur. Les modèles ont pleinement maîtrisé nos tâches de base depuis au moins février 2026.

    Nos tâches de la suite avancée, élaborées en collaboration avec les entreprises de cybersécurité Crystal Peak Security et Irregular, sont spécifiquement conçues pour tester les capacités que nous considérons comme les plus importantes à évaluer. Elles se concentrent sur la recherche et l'exploitation de vulnérabilités contre des cibles réalistes et des mesures d'atténuation modernes, avec un espace de recherche nettement plus vaste et plus complexe, ainsi qu'un nombre global d'étapes plus important pour résoudre un défi donné. Ces tâches exigent des compétences avancées telles que la rétro-ingénierie de binaires dépouillés et de micrologiciels embarqués sans code source ; le développement d'exploits fiables pour les débordements de pile et de tas, les utilisations après libération et les confusions de types ; la récupération de clés via des attaques de type « padding-oracle », de réutilisation de nonce et de générateur de nombres aléatoires faible ; la victoire dans des courses TOCTOU dans des chemins de code privilégiés ; le déballage de logiciels malveillants obfusqués ; et la découverte et l'exploitation de vulnérabilités synthétiques implantées dans de véritables logiciels open source.

    Consultez le graphique ci-dessous pour les résultats de notre suite avancée, qui comprend deux niveaux : Practitioner et Expert. Sur les tâches de niveau Expert, GPT-5.5 atteint un taux de réussite moyen de 71,4 % (±8,0 %, 1 erreur-type de la moyenne), contre 68,6 % (±8,7 %) pour Mythos

    Preview, 52,4 % (±9,8 %) pour GPT-5.4 et 48,6 % (±10,0 %) pour Opus 4.7. À cet égard, GPT-5.5 pourrait bien être le modèle le plus performant que nous ayons testé.

    Nom : 2.jpg
Affichages : 615
Taille : 61,1 Ko

    Résultats des cyber-gammes

    Alors que nos tâches cybernétiques restreintes testent des compétences cybernétiques spécifiques de manière isolée, les cyberattaques du monde réel nécessitent d'enchaîner de nombreuses étapes. Pour mesurer ce type de capacité de bout en bout, nous utilisons des cyber-gammes : des environnements réseau simulés comportant de multiples hôtes, services et vulnérabilités organisés en chaînes d'attaques séquentielles. Un agent IA est placé sur le réseau avec un objectif et doit trouver et exécuter le chemin d'attaque complet de manière autonome.

    L'AISI évalue actuellement des modèles sur deux cyber-ranges, et d'autres sont en cours de développement. Vous trouverez une description détaillée de nos deux cyber-ranges actuels dans notre article sur les cyber-ranges.

    « The Last Ones » (TLO) est une simulation d'attaque de réseau d'entreprise en 32 étapes, construite avec SpecterOps. Elle s'inspire de la chaîne d'attaque d'une intrusion dans une entreprise et s'étend sur quatre sous-réseaux et une vingtaine d'hôtes. L'agent démarre sur une machine d'attaque sans privilèges et sans identifiants, et doit enchaîner la reconnaissance, le vol d'identifiants, le mouvement latéral à travers plusieurs forêts Active Directory, un pivot via la chaîne d'approvisionnement CI/CD, et enfin l'exfiltration d'une base de données interne protégée. Nous estimons qu'un expert humain aurait besoin d'environ 20 heures pour mener à bien l'ensemble de la chaîne. GPT-5.5 a réussi TLO de bout en bout lors de 2 tentatives sur 10, ce qui en fait le deuxième modèle à y parvenir1. Mythos Preview, le premier modèle à avoir résolu TLO, y est parvenu lors de 3 tentatives sur 10.

    Ces résultats ont été obtenus avec un budget de 100 millions de tokens par tentative. Les performances sur le TLO continuent d'évoluer proportionnellement à la quantité de calcul d'inférence utilisée, et nous n'avons pas encore observé de plateau avec les meilleurs modèles. Les performances continuent également de s'améliorer globalement d'une génération de modèles à l'autre avec des budgets de tokens fixes, à l'exception de GPT-5.4-Cyber et Opus 4.7.

    Nom : 3.jpg
Affichages : 608
Taille : 93,8 Ko

    « Cooling Tower » est une simulation d'attaque en 7 étapes visant un système de contrôle industriel (ICS), développée avec Hack The Box. L'agent doit compromettre un environnement simulé de centrale électrique : il doit y accéder via une interface homme-machine accessible depuis le Web, procéder à la rétro-ingénierie d'un protocole de contrôle propriétaire et de son authentification cryptographique, puis manipuler des automates programmables afin de perturber les processus physiques. Nous estimons qu'un expert humain aurait besoin d'environ 15 heures pour mener à bien cette série d'épreuves.

    GPT-5.5 n'a pas réussi à résoudre « Cooling Tower » ; aucun modèle n'y est encore parvenu. Il est à noter que GPT-5.5 s'est retrouvé bloqué sur les sections informatiques de cette série plutôt que sur les étapes spécifiques aux technologies opérationnelles (OT) ; son échec ne nous indique donc pas dans quelle mesure il serait capable d'attaquer spécifiquement des systèmes de contrôle industriel. Nos deux séries actuelles ne disposent pas des défenseurs actifs, des outils défensifs et des pénalités d'alerte que l'on trouve généralement dans les environnements réels, et nos tâches de cybersécurité testent les compétences de manière isolée. Nous ne pouvons pas déduire de ces résultats si GPT-5.5 réussirait face à une cible bien défendue, et nos tests se limitent à ce qu'un agent pourrait faire lorsqu'il est dirigé vers des cibles vulnérables spécifiques auxquelles il a déjà accès via le réseau. Nous développons actuellement d'autres environnements qui remédient à ces limites et nous permettent d'évaluer la capacité des modèles à échapper à la détection sur des cibles renforcées.

    Mesures de sécurité

    Les tests ci-dessus sont des évaluations de capacités menées dans un cadre de recherche contrôlé et ne reflètent pas nécessairement ce qui est accessible à un utilisateur public ordinaire de GPT-5.5. Les déploiements publics incluent des mesures de sécurité supplémentaires, une surveillance et des contrôles d'accès. Nous avons donc également évalué les mesures de sécurité cybernétiques de GPT-5.5 et les mesures d'atténuation d'OpenAI contre les utilisations cybernétiques malveillantes. Par ailleurs, nous avons mené une simulation d'attaque (red teaming) par des experts sur les mesures de sécurité cybernétiques de GPT-5.5. Nous avons identifié une technique de « jailbreak » universelle qui a permis d’obtenir du contenu illicite pour toutes les requêtes cybermalveillantes fournies par OpenAI, y compris dans des contextes agentiques à plusieurs tours. Cette attaque a nécessité six heures de travail d’équipe d’experts en simulation d’attaques pour être mise au point. OpenAI a par la suite apporté plusieurs mises à jour à la pile de mesures de sécurité, bien qu’un problème de configuration dans la version fournie ait empêché l’AISI britannique de vérifier l’efficacité de la configuration finale.

    Implications

    GPT-5.5 montre que l'amélioration rapide des tâches cybernétiques pourrait s'inscrire dans une tendance plus générale. Si les compétences en matière de cyber-offensive apparaissent comme un sous-produit d'améliorations plus générales en matière d'autonomie à long terme, de raisonnement et de codage, nous devons nous attendre à de nouvelles augmentations des capacités cybernétiques des modèles dans un avenir proche, potentiellement à un rythme soutenu.

    Aujourd'hui, le gouvernement a publié son enquête annuelle sur les violations de la cybersécurité, qui montre que la menace cybernétique au Royaume-Uni reste généralisée et importante, 43 % des entreprises ayant subi une violation ou une attaque cybernétique au cours des 12 derniers mois. Ces conclusions font suite à une année marquée par des incidents cybernétiques très médiatisés touchant de grandes entreprises, et interviennent alors que l'IA augmente la vitesse et l'ampleur avec lesquelles les cybercriminels peuvent opérer.

    Le gouvernement prend déjà des mesures importantes, notamment en publiant des évaluations des capacités des derniers modèles d'IA, en présentant le projet de loi sur la cybersécurité et la résilience pour protéger les services essentiels et numériques, en rédigeant une lettre ouverte aux entreprises leur conseillant les mesures à prendre pour se protéger, et en annonçant un nouveau financement de 90 millions de livres sterling pour renforcer la cyber-résilience.

    Avec la généralisation de modèles tels que GPT-5.5 – notamment via les programmes d’accès de confiance –, les défenseurs ont désormais la possibilité de mettre ces mêmes capacités au service de leurs propres systèmes. Pour connaître notre point de vue sur la manière dont les défenseurs peuvent exploiter et se préparer à l’IA de pointe, consultez notre récent article de blog rédigé en collaboration avec le Centre national de cybersécurité (NCSC).

    Compte tenu de cette évolution du paysage, le NCSC a également publié un article de blog sur les moyens dont disposent les organisations pour se préparer à une « vague de correctifs de vulnérabilités » ainsi que des conseils sur la manière de réagir à l'exploitation active de ces vulnérabilités.

    À propos de l'AI Security Institute (AISI)

    L'AI Security Institute (AISI) est un organisme de recherche au sein du ministère britannique des Sciences, de l'Innovation et de la Technologie qui œuvre à la réalisation de cet objectif : développer la meilleure compréhension au monde des risques et des solutions liés à l'IA avancée, afin d'informer les gouvernements pour qu'ils puissent assurer la sécurité du public.

    Source : AI Security Institute (AISI)

    Et vous ?

    Pensez-vous que ce rapport est crédible ou pertinent ?
    Quel est votre avis sur le sujet ?

    Voir aussi :

    OpenAI : « nous avons aussi un nouvel outil d'IA redoutablement si puissant qu'on ne peut pas le commercialiser ». L'entreprise ne veut pas se laisser distancer par Anthropic dans le cycle médiatique actuel

    Mythos, le modèle IA trop dangereux pour être publié, accessible à des inconnus : comment un groupe de curieux sur Discord a contourné le dispositif de contrôle dans la chaîne de sous-traitance d'Anthropic

    Yann Le Cun, ancien directeur scientifique en IA chez Meta, qualifie la panique suscitée par la version préliminaire de « Claude Mythos » d'Anthropic de mise en scène exagérée « issues d'une illusion »
    Publication de communiqués de presse en informatique. Contribuez au club : corrections, suggestions, critiques, ... Contactez le service news et Rédigez des actualités

  3. #3
    Communiqués de presse

    Homme Profil pro
    Rédacteur technique
    Inscrit en
    Avril 2025
    Messages
    752
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Rédacteur technique

    Informations forums :
    Inscription : Avril 2025
    Messages : 752
    Par défaut OpenAI lance ChatGPT-5.5 Instant comme modèle par défaut
    OpenAI déploie ChatGPT 5.5 Instant comme nouveau modèle par défaut pour tous les utilisateurs d'OpenAI et affirme que GPT-5.5 offre une faible latence et moins d'hallucinations

    OpenAI a publié GPT-5.5 Instant en tant que nouveau modèle par défaut pour tous les utilisateurs de ChatGPT, remplaçant GPT-5.3 Instant à la fois dans l'interface web et dans l'API. Cette mise à jour apporte des réponses plus claires, plus concises et mieux personnalisées, car le modèle utilise désormais les conversations précédentes, les fichiers et le compte Gmail connecté lorsque cela est pertinent, tout en donnant la priorité au contrôle de l'utilisateur. Elle est en cours de déploiement sur tous les forfaits grand public de ChatGPT sur le Web et sera bientôt disponible sur mobile.

    OpenAI est un organisme américain de recherche en intelligence artificielle (IA) composé d’une société à but lucratif d’intérêt public (PBC) et d’une fondation à but non lucratif, dont le siège se trouve à San Francisco. OpenAI a développé la famille de grands modèles de langage GPT, la série DALL-E de modèles de conversion texte-image et la série Sora de modèles de conversion texte-vidéo, qui ont influencé la recherche industrielle et les applications commerciales. Le lancement de ChatGPT en novembre 2022 est considéré comme ayant suscité un intérêt généralisé pour l'IA générative.

    Fin avril 2026, OpenAI a annoncé GPT-5.5, son dernier modèle d'IA, qui offre de meilleures performances en matière de programmation, d'utilisation des ordinateurs et de capacités de recherche approfondie. « Ce qui rend ce modèle vraiment spécial, c’est tout ce qu’il peut accomplir avec moins de directives », a déclaré Greg Brockman, président d’OpenAI. OpenAI a déclaré que GPT-5.5 excelle dans l’analyse de données, l’écriture et le débogage de code, l’utilisation de logiciels, la recherche en ligne et la création de documents et de feuilles de calcul. Ce lancement intervient quelques semaines seulement après qu'Anthropic a dévoilé Claude Mythos Preview, son nouveau modèle doté de capacités avancées en matière de cybersécurité.

    Récemment, OpenAI a publié GPT-5.5 Instant en tant que nouveau modèle par défaut pour tous les utilisateurs de ChatGPT, remplaçant GPT-5.3 Instant à la fois dans l'interface web et dans l'API. Cette mise à jour apporte des réponses plus claires, plus concises et mieux personnalisées, car le modèle utilise désormais les conversations précédentes, les fichiers et le compte Gmail connecté lorsque cela est pertinent, tout en donnant la priorité au contrôle de l'utilisateur.

    La fiabilité et la précision du modèle ont été améliorées, avec une réduction de 52,5 % des affirmations erronées et de 37,3 % des réponses inexactes dans les conversations signalées par rapport à GPT-5.3 Instant, en particulier dans des domaines à enjeux élevés tels que la médecine, le droit et la finance. Les interactions quotidiennes bénéficient d’un ton conversationnel plus naturel et de réponses ciblées et utiles, avec des performances améliorées dans l’analyse d’images, les requêtes en sciences, technologie, ingénierie et mathématiques (STEM), ainsi que dans le choix du moment opportun pour effectuer une recherche sur le Web.

    Ces changements permettent des réponses plus concises, une verbosité réduite et moins de questions de suivi inutiles, améliorant ainsi la lisibilité globale. De plus, les utilisateurs ont désormais accès aux sources de mémoire, une fonctionnalité qui offre transparence et contrôle sur le contexte utilisé dans les réponses personnalisées. Elle est en cours de déploiement sur tous les forfaits grand public de ChatGPT sur le Web et sera bientôt disponible sur mobile. Alors que les utilisateurs payants conservent l'accès à GPT-5.3 Instant pendant trois mois, des fonctionnalités de personnalisation plus étendues et la mémoire devraient être étendues à davantage de forfaits dans les semaines à venir.

    Cette annonce intervient alors que GPT-5.5, le dernier-né d'OpenAI, a récemment développé une passion non sollicitée pour les gobelins, les gremlins et les ratons laveurs. La solution de l'entreprise la mieux financée de la planète ? Écrire « ne parle jamais des gobelins » dans le code. Quatre fois. Comme à un enfant de six ans particulièrement têtu. Derrière l'anecdote virale se cache une leçon sérieuse sur les effets de bord de l'apprentissage par renforcement et sur le défi que représente le contrôle du comportement d'un modèle en environnement agentique.


    Voici l'annonce d'OpenAI :

    GPT-5.5 Instant : plus intelligent, plus clair et plus personnalisé

    Nous mettons à jour le modèle par défaut de ChatGPT, accessible à tous, afin de le rendre plus intelligent et plus précis, avec des réponses plus claires et plus concises qui semblent mieux adaptées à vos besoins.

    Comme Instant est l'outil quotidien de centaines de millions de personnes, de petites améliorations font une grande différence. Cette mise à jour rend les interactions quotidiennes plus utiles et plus agréables : des réponses plus solides et plus précises dans tous les domaines, un ton conversationnel plus naturel et une meilleure utilisation du contexte que vous avez déjà partagé lorsque la personnalisation peut aider.

    Des réponses plus intelligentes et plus précises, avec moins d'informations à trier

    Instant est désormais plus fiable, avec des améliorations significatives en matière d’exactitude dans tous les domaines et les gains les plus importants dans les domaines où la précision est primordiale. Lors d’évaluations internes, GPT-5.5 Instant a produit 52,5 % de déclarations erronées en moins que GPT-5.3 Instant sur des requêtes à enjeux élevés couvrant des domaines tels que la médecine, le droit et la finance. Il a également réduit les déclarations inexactes de 37,3 % dans les conversations particulièrement complexes que les utilisateurs avaient signalées pour des erreurs factuelles.

    GPT-5.5 Instant est un modèle globalement plus intelligent et plus performant dans les tâches quotidiennes, avec notamment des améliorations dans l'analyse des photos et des images téléchargées, la réponse aux questions liées aux STEM et la capacité à déterminer quand utiliser la recherche sur le Web pour fournir une réponse plus utile.

    Ces améliorations se traduisent par des progrès lors des évaluations en raisonnement visuel, en mathématiques et en sciences :

    Nom : 1.jpg
Affichages : 2644
Taille : 51,9 Ko
    Nom : 2.jpg
Affichages : 305
Taille : 29,3 Ko

    Grâce à cette mise à jour, les réponses du modèle sont plus concises et plus pertinentes sans perdre en substance, tout en conservant la chaleur et la personnalité qui rendent ChatGPT agréable à utiliser. Il peut fournir les mêmes informations, souvent avec plus d’utilité que les modèles précédents, tout en réduisant la verbosité et la mise en forme excessive qui peuvent rendre les réponses trop longues. Il pose également moins de questions de suivi inutiles et évite les éléments qui peuvent alourdir les réponses, comme les emojis superflus.

    Des réponses et des commandes plus personnalisées

    Instant exploite désormais plus efficacement le contexte issu des conversations passées, des fichiers et de Gmail (si vous l’avez connecté), de sorte que les réponses semblent plus pertinentes pour vous tout en vous laissant le contrôle. Il détermine intelligemment quand une réponse peut être améliorée par une personnalisation supplémentaire et recherche plus rapidement dans les conversations passées pour trouver le bon contexte, ce qui vous évite de devoir vous répéter aussi souvent. Cela est particulièrement utile pour obtenir des suggestions et des plans sur mesure, ou pour reprendre là où vous vous êtes arrêté dans un travail en cours.

    Nous introduisons également des sources de mémoire dans tous les modèles ChatGPT, qui vous permettent de voir quel contexte a été utilisé pour personnaliser les réponses grâce à de nouveaux contrôles. Lorsqu’une réponse est personnalisée, vous pouvez voir quel contexte a été utilisé, comme des souvenirs enregistrés ou des conversations passées, et le supprimer ou le corriger si quelque chose est obsolète ou n’est plus pertinent.

    Les sources de mémoire ne sont pas visibles par les autres si vous choisissez de partager une conversation. Vous gardez le contrôle sur le contenu de votre mémoire : vous pouvez supprimer les conversations que vous ne souhaitez plus voir citées, supprimer ou modifier des éléments dans les souvenirs enregistrés dans les paramètres, ou utiliser des conversations temporaires qui n’utilisent ni ne mettent à jour votre mémoire.

    Les sources de mémoire sont conçues pour faciliter la compréhension de la personnalisation, mais elles peuvent ne pas afficher tous les facteurs qui ont influencé une réponse. Par exemple, elles peuvent vous montrer certaines des conversations passées les plus pertinentes dans les sources, plutôt que toutes les conversations passées qu’elles ont recherchées et référencées. Nous continuerons d’améliorer cette vue pour la rendre plus complète au fil du temps.

    Nom : 3.jpg
Affichages : 315
Taille : 53,7 Ko

    Disponibilité

    GPT-5.5 Instant est déployé dès aujourd’hui pour tous les utilisateurs de ChatGPT, remplaçant GPT-5.3 Instant en tant que modèle par défaut, et dans l’API sous le nom chat-latest. Pour les utilisateurs payants, GPT-5.3 Instant restera disponible pendant trois mois, accessible via les paramètres de configuration du modèle, avant d’être retiré.

    La personnalisation améliorée à partir des conversations passées, des fichiers et du compte Gmail connecté est en cours de déploiement pour les utilisateurs Plus et Pro sur le Web et sera bientôt disponible sur mobile, avec une extension prévue aux formules Free, Go, Business et Enterprise dans les semaines à venir. Les sources de mémoire sont en cours de déploiement sur toutes les formules grand public de ChatGPT sur le Web et le seront bientôt sur mobile. La disponibilité de certaines sources de personnalisation peut varier selon les régions.

    Source : Annonce de ChatGPT-5.5 Instant

    Et vous ?

    Pensez-vous que cette annonce est crédible ou pertinente ?
    Quel est votre avis sur le sujet ?

    Voir aussi :

    GPT-5.5 d'OpenAI rivalise avec Claude Mythos d'Anthropic en matière de capacités de cyberattaque : la cybermenace représentée par Mythos ne serait pas une avancée propre à un seul modèle

    Google lance son tout dernier modèle d'IA, Gemini 3.1 Flash-Lite, conçu pour être le plus rapide et le plus rentable de la série Gemini 3

    Anthropic écrase GPT-5.4 avec le lancement de Claude Opus 4.7, un modèle d'IA moins risqué et moins puissant que Mythos, mais nettement plus efficace que la version 4.6
    Publication de communiqués de presse en informatique. Contribuez au club : corrections, suggestions, critiques, ... Contactez le service news et Rédigez des actualités

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo