OpenAI a lancé GPT-5.3 Codex, qui est 25 % plus rapide que GPT-5.2 et qui a été le premier modèle d'OpenAI à aider à son propre débogage pendant son développement
OpenAI a lancé un nouveau modèle de codage, GPT-5.3-Codex. La société a déclaré que ce nouveau modèle avait amélioré ses « capacités de raisonnement et de connaissances professionnelles » et qu'il fonctionnerait 25 % plus rapidement que son prédécesseur. OpenAI précise que le nouveau modèle GPT-5.3-Codex est son « premier modèle qui a contribué à sa propre création ». Lors de l'annonce de GPT-5.3-Codex, OpenAI a déclaré : « L'équipe Codex a utilisé les premières versions pour déboguer sa propre formation, gérer son propre déploiement et diagnostiquer les résultats des tests et des évaluations. Notre équipe a été impressionnée par la capacité de Codex à accélérer son propre développement. »
OpenAI est une entreprise américaine d'intelligence artificielle (IA) fondée en 2015 à San Francisco en Californie. Sa mission est de développer et de promouvoir une intelligence artificielle générale « sûre et bénéfique à toute l'humanité ». L'entreprise est connue pour ses grands modèles de langage tels que GPT-4o, la série de modèles de génération d'images DALL-E et le modèle de génération de vidéos Sora.
En août 2021, OpenAI a annoncé Codex, un outil d'autocomplétion de code disponible dans certains EDI tels que Visual Studio Code et Neovim. Il s'agissait d'une version modifiée et opérationnelle de GPT-3, affinée à partir de gigaoctets de code source dans une douzaine de langages de programmation. C'était le modèle original qui alimentait GitHub Copilot. En avril 2025, OpenAI a publié Codex CLI sur GitHub sous licence Apache 2.0, un agent IA qui s'exécute localement sur l'ordinateur de l'utilisateur. Ils ont également annoncé un modèle de langage, codex-mini-latest, disponible uniquement derrière une API. Il s'agissait d'une version affinée de o4-mini, spécialement entraînée pour être utilisée dans Codex CLI.
En mai 2025, OpenAI a annoncé le lancement d'un aperçu de recherche d'un outil distinct ayant un objectif similaire, également nommé Codex, basé sur une version affinée d'OpenAI o3. Il s'agit d'un agent logiciel qui effectue des tâches de programmation informatique, notamment la rédaction de fonctionnalités, la réponse à des questions sur le code source, l'exécution de tests et la proposition de PR pour révision. Début février 2026, OpenAI a lancé une application autonome pour son assistant de codage IA, Codex, disponible sur les ordinateurs Apple. L'application vise à faciliter la gestion simultanée de plusieurs agents IA par les développeurs de logiciels, a déclaré OpenAI.
Les outils de codage IA ont connu un essor fulgurant au cours de l'année dernière, ces annonces représentent les efforts d'OpenAI pour gagner des parts de marché sur ses concurrents tels qu'Anthropic et Cursor. Récemment, OpenAI a lancé un nouveau modèle de codage, GPT-5.3-Codex. La société a déclaré que ce nouveau modèle avait amélioré ses « capacités de raisonnement et de connaissances professionnelles » et qu'il fonctionnerait 25 % plus rapidement que son prédécesseur.
OpenAI précise que le nouveau modèle GPT-5.3-Codex est son « premier modèle qui a contribué à sa propre création ». Lors de l'annonce de GPT-5.3-Codex, OpenAI a déclaré : « L'équipe Codex a utilisé les premières versions pour déboguer sa propre formation, gérer son propre déploiement et diagnostiquer les résultats des tests et des évaluations. Notre équipe a été impressionnée par la capacité de Codex à accélérer son propre développement. »
Les personnes qui croient en la singularité technologique, ou « singularité », parlent d'un point de basculement à partir duquel la technologie s'améliore d'elle-même, entraînant une explosion incontrôlée des progrès technologiques. Avec cette annonce, OpenAI affirme donc que nous disposons désormais d'exemples concrets d'IA s'améliorant d'elle-même. Nous ne savons pas exactement dans quelle mesure GPT-5.3-Codex a participé à son propre développement, mais cette nouvelle révèle à quel point les modèles d'IA de pointe sont devenus avancés, en particulier dans l'écriture de code. « Avec GPT-5.3-Codex, Codex passe d'un agent capable d'écrire et de réviser du code à un agent capable de faire presque tout ce que les développeurs et les professionnels peuvent faire sur un ordinateur », affirme OpenAI.
Cette annonce intervient dans un contexte, où les experts doutent de plus en plus d'OpenAI. Récemment, un expert financier affirme qu'OpenAI est sur le point de se retrouver à court d'argent. Les géants technologiques comme Google peuvent utiliser leurs énormes réserves financières pour investir des centaines de milliards dans l'IA, ce qui n'est pas le cas d'OpenAI. Il s'attend à ce qu'OpenAI fasse faillite « au cours des 18 prochains mois ». Il affirme : « Quelle que soit la richesse du prix final de l'IA, les marchés financiers semblent peu susceptibles de le fournir. »
Voici un extrait de l'annonce d'OpenAI :
Présentation de GPT-5.3-Codex
GPT‑5.3-Codex établit un nouveau record dans l'industrie sur SWE-Bench Pro et Terminal-Bench, et affiche de solides performances sur OSWorld et GDPval, quatre benchmarks que nous utilisons pour mesurer les capacités de codage, d'agent et dans le monde réel.
Codage
GPT‑5.3-Codex atteint des performances de pointe sur SWE-Bench Pro, une évaluation rigoureuse de l'ingénierie logicielle dans le monde réel. Alors que SWE‑bench Verified ne teste que Python, SWE‑Bench Pro couvre quatre langages et est plus résistant à la contamination, plus difficile, plus diversifié et plus pertinent pour l'industrie. Il dépasse également de loin les performances de pointe précédentes sur Terminal-Bench 2.0, qui mesure les compétences terminales dont un agent de codage comme Codex a besoin. Il est à noter que GPT‑5.3‑Codex y parvient avec moins de jetons que n'importe quel modèle précédent, ce qui permet aux utilisateurs d'en créer davantage.
Développement web
La combinaison de capacités de codage de pointe, d'améliorations esthétiques et de compactage donne naissance à un modèle capable de réaliser un travail remarquable, en créant de toutes pièces des jeux et des applications complexes et hautement fonctionnels en quelques jours. GPT‑5.3-Codex comprend également mieux votre intention lorsque vous lui demandez de créer des sites web courants, par rapport à GPT‑5.2-Codex. Les invites simples ou insuffisamment précisées sont désormais remplacées par défaut par des sites plus fonctionnels et des paramètres par défaut plus judicieux, vous offrant ainsi une base plus solide pour donner vie à vos idées.
Au-delà du codage
Les ingénieurs logiciels, les concepteurs, les chefs de produit et les scientifiques des données font bien plus que générer du code. GPT‑5.3‑Codex est conçu pour prendre en charge toutes les tâches du cycle de vie des logiciels : débogage, déploiement, surveillance, rédaction de PRD, édition de textes, recherche sur les utilisateurs, tests, mesures, etc. Ses capacités agissantes vont au-delà des logiciels et vous aident à créer tout ce que vous souhaitez, qu'il s'agisse de présentations PowerPoint ou d'analyses de données dans des feuilles de calcul.
Grâce à des compétences personnalisées similaires à celles utilisées pour les précédents résultats GDPval, GPT‑5.3‑Codex affiche également de solides performances dans le domaine du travail intellectuel professionnel, tel que mesuré par GDPval, à égalité avec GPT‑5.2. GDPval est une évaluation publiée par OpenAI en 2025 qui mesure les performances d'un modèle sur des tâches intellectuelles bien définies dans 44 professions. Ces tâches comprennent notamment la création de présentations, de feuilles de calcul et d'autres produits de travail.
OSWorld est un benchmark d'utilisation informatique où l'agent doit accomplir des tâches de productivité dans un environnement informatique de bureau visuel. GPT‑5.3-Codex démontre des capacités d'utilisation informatique bien supérieures à celles des modèles GPT précédents.
Ensemble, ces résultats en matière de codage, de front-end, d'utilisation informatique et de tâches du monde réel montrent que GPT-5.3-Codex n'est pas seulement meilleur dans des tâches individuelles, mais marque également un changement radical vers un agent unique et polyvalent capable de raisonner, de construire et d'exécuter tout l'éventail des tâches techniques du monde réel.
Comment nous avons utilisé Codex pour former et déployer GPT‑5.3-Codex
Les récentes améliorations rapides de Codex s'appuient sur les fruits de projets de recherche menés pendant des mois, voire des années, dans l'ensemble d'OpenAI. Ces projets de recherche sont accélérés par Codex, et de nombreux chercheurs et ingénieurs d'OpenAI décrivent leur travail actuel comme étant fondamentalement différent de ce qu'il était il y a seulement deux mois. Même les premières versions de GPT‑5.3-Codex ont démontré des capacités exceptionnelles, permettant à notre équipe de travailler avec ces versions antérieures pour améliorer la formation et soutenir le déploiement des versions ultérieures.
Codex est utile pour un très large éventail de tâches, ce qui rend difficile d'énumérer de manière exhaustive toutes les façons dont il aide nos équipes. À titre d'exemple, l'équipe de recherche a utilisé Codex pour surveiller et déboguer le processus de formation de cette version. Cela a accéléré la recherche au-delà du débogage des problèmes d'infrastructure : cela a permis de suivre les modèles tout au long de la formation, de fournir une analyse approfondie de la qualité des interactions, de proposer des corrections et de créer des applications riches permettant aux chercheurs humains de comprendre précisément en quoi le comportement du modèle différait de celui des modèles précédents.
L'équipe d'ingénieurs a utilisé Codex pour optimiser et adapter le harnais pour GPT-5.3-Codex. Lorsque nous avons commencé à constater des cas limites étranges affectant les utilisateurs, les membres de l'équipe ont utilisé Codex pour identifier les bogues de rendu du contexte et les causes profondes des faibles taux de réussite du cache. GPT-5.3-Codex continue d'aider l'équipe tout au long du lancement en adaptant dynamiquement les clusters GPU pour s'ajuster aux pics de trafic et maintenir une latence stable.
Au cours des tests alpha, un chercheur a voulu comprendre la quantité de travail supplémentaire effectuée par GPT-5.3-Codex à chaque tour et la différence de productivité associée. GPT-5.3-Codex a proposé plusieurs classificateurs regex simples pour estimer la fréquence des clarifications, les réponses positives et négatives des utilisateurs, la progression de la tâche, puis les a exécutés de manière évolutive sur tous les journaux de session et a produit un rapport avec ses conclusions. Les personnes qui utilisaient Codex étaient plus satisfaites, car l'agent comprenait mieux leurs intentions et progressait davantage à chaque tour, avec moins de questions de clarification.
GPT‑5.3-Codex étant très différent de ses prédécesseurs, les données issues des tests alpha ont révélé de nombreux résultats inhabituels et contre-intuitifs. Un data scientist de l'équipe a travaillé avec GPT-5.3-Codex pour créer de nouveaux pipelines de données et visualiser les résultats de manière beaucoup plus riche que ne le permettaient nos outils de tableau de bord standard. Les résultats ont été analysés conjointement avec Codex, qui a résumé de manière concise les informations clés sur des milliers de points de données en moins de trois minutes.
Individuellement, toutes ces tâches sont des exemples intéressants de la manière dont Codex peut aider les chercheurs et les développeurs de produits. Dans l'ensemble, nous avons constaté que ces nouvelles capacités ont permis d'accélérer considérablement le travail de nos équipes de recherche, d'ingénierie et de développement de produits.
Prochaines étapes
Avec GPT‑5.3-Codex, Codex va au-delà de l'écriture de code pour l'utiliser comme un outil permettant de faire fonctionner un ordinateur et d'effectuer des tâches de bout en bout. En repoussant les limites de ce qu'un agent de codage peut faire, nous ouvrons également la voie à une catégorie plus large de travaux intellectuels, allant de la création et du déploiement de logiciels à la recherche, l'analyse et l'exécution de tâches complexes. Ce qui était au départ une volonté d'être le meilleur agent de codage est devenu la base d'un collaborateur plus général sur l'ordinateur, élargissant à la fois le nombre de personnes pouvant créer et les possibilités offertes par Codex.
Source : Annonce de GPT‑5.3-Codex
Et vous ?
Pensez-vous que cette annonce est crédible ou pertinente ?
Quel est votre avis sur le sujet ?
Voir aussi :
OpenAI lance GPT-5.2-Codex, le positionnant comme le summum des modèles de codage agentique adaptés aux tâches exigeantes d'ingénierie logicielle et de cybersécurité défensive
Anthropic se vante d'avoir développé Claude Cowork grâce au vibe coding en « une semaine et demie », alors que l'assistant IA a été lancé avec une vulnérabilité connue en matière d'exfiltration de données
OpenAI lance une application autonome pour son assistant de codage alimenté par l'IA, Codex, permettant aux développeurs de logiciels de gérer plusieurs agents IA à la fois, disponible sur macOS








Pensez-vous que cette annonce est crédible ou pertinente ?
Répondre avec citation


Partager