OpenAI dévoile le nouvel agent IA d'ingénierie logicielle Codex dans ChatGPT pour les développeurs, pour coder, corriger des bugs, et proposer des demandes de révision.

OpenAI présente Codex, un agent d'IA de génie logiciel basé sur le cloud qui peut travailler sur de nombreuses tâches en parallèle, alimenté par codex-1. Disponible dès aujourd'hui pour les utilisateurs de ChatGPT Pro, Team et Enterprise, et bientôt pour les utilisateurs Plus.

Dans le but d'injecter l'IA dans une plus grande partie du processus de programmation, OpenAI a lancé en avril dernier Codex CLI, un "agent" de codage conçu pour fonctionner localement à partir d'un logiciel terminal. Annoncé en même temps que les nouveaux modèles d'IA d'OpenAI, o3 et o4-mini, Codex CLI relie les modèles d'OpenAI au code local et aux tâches informatiques. Grâce à Codex CLI, les modèles d'OpenAI peuvent écrire et modifier du code sur un bureau et effectuer certaines actions, comme déplacer des fichiers.

Récemment, OpenAI, éditeur de ChatGPT, a déploié "Codex" pour ChatGPT, un agent d'IA qui automatise et délègue les tâches de programmation pour les ingénieurs en logiciel. L'entreprise affirme que Codex pourrait aider les développeurs à réaliser davantage de choses en déléguant leurs tâches à différents agents. L'idée est d'accélérer le développement et de devenir plus productif grâce à l'IA.

Mais comment fonctionne Codex ? Selon OpenAI, Codex est basé sur codex-1, qui est une nouvelle version de ChatGPT basée sur le modèle o3 existant, mais il a été optimisé pour le codage, ce qui se traduit par une plus grande précision. Codex extrait la base de code de Github et reflète étroitement le style des PR existants. Il peut écrire du nouveau code, proposer des pull requests et exécuter chaque tâche dans son propre bac à sable.

"L'exécution d'une tâche prend généralement entre 1 et 30 minutes, en fonction de sa complexité, et vous pouvez suivre la progression de Codex en temps réel", indique OpenAI. "Une fois que Codex a terminé une tâche, il enregistre ses changements dans son environnement. Codex fournit des preuves vérifiables de ses actions par le biais de citations de journaux de terminal et de résultats de tests, ce qui vous permet de retracer chaque étape franchie au cours de la réalisation d'une tâche".

Il serait intéressant de voir les performances de ce nouvel agent d'IA pour le codage. En effet, la tendance actuelle montre que les éditeurs de code traditionnels évoluent vers des interfaces plus "intelligentes". Deux acteurs récents dominent les débats : Cursor et Windsurf (issu de Codeium). Tous deux se présentent comme des EDI « IA-empowered » destinés à accélérer le codage et améliorer la productivité. Des rapports ont même révélé qu'OpenAI a envisagé d'acquérir Cursor avant de se tourner vers Windsurf.


Citation Envoyé par OpenAI
Aujourd'hui, nous lançons un aperçu de recherche de Codex : un agent d'ingénierie logicielle basé sur le cloud qui peut travailler sur de nombreuses tâches en parallèle. Codex peut effectuer des tâches pour vous comme écrire des fonctionnalités, répondre à des questions sur votre base de code, corriger des bugs, et proposer des demandes d'extraction pour révision ; chaque tâche s'exécute dans son propre environnement sandbox, préchargé avec votre référentiel.

Codex est alimenté par codex-1, une version d'OpenAI o3 optimisée pour l'ingénierie logicielle. Elle a été entraînée à l'aide de l'apprentissage par renforcement sur des tâches de codage réelles dans une variété d'environnements pour générer du code qui reflète étroitement le style humain et les préférences PR, adhère précisément aux instructions et peut exécuter des tests de manière itérative jusqu'à ce qu'il reçoive un résultat positif. Nous commençons à déployer Codex pour les utilisateurs de ChatGPT Pro, Enterprise et Team aujourd'hui, avec un support pour Plus et Edu bientôt.
Comment fonctionne Codex ?

Vous pouvez accéder à Codex via la barre latérale de ChatGPT et lui assigner de nouvelles tâches de codage en tapant une invite et en cliquant sur "Code". Si vous souhaitez poser une question à Codex sur votre base de code, cliquez sur "Demander". Chaque tâche est traitée indépendamment dans un environnement séparé et isolé, préchargé avec votre base de code. Codex peut lire et éditer des fichiers, ainsi qu'exécuter des commandes, y compris des harnais de test, des linters et des vérificateurs de type. L'exécution d'une tâche prend généralement entre 1 et 30 minutes, en fonction de sa complexité, et vous pouvez suivre la progression de Codex en temps réel.

Une fois que Codex a terminé une tâche, il enregistre les changements dans son environnement. Codex fournit des preuves vérifiables de ses actions par le biais de citations de journaux de terminal et de résultats de tests, ce qui vous permet de retracer chaque étape franchie au cours de l'exécution de la tâche. Vous pouvez ensuite examiner les résultats, demander d'autres révisions, ouvrir une demande GitHub ou intégrer directement les changements dans votre environnement local. Dans le produit, vous pouvez configurer l'environnement Codex pour qu'il corresponde le plus possible à votre environnement de développement réel.

Codex peut être guidé par des fichiers AGENTS.md placés dans votre dépôt. Il s'agit de fichiers texte, semblables à README.md, dans lesquels vous pouvez indiquer à Codex comment naviguer dans votre base de code, quelles commandes exécuter pour les tests et comment respecter au mieux les pratiques standard de votre projet. Comme les développeurs humains, les agents Codex sont plus performants lorsqu'ils disposent d'environnements de développement configurés, de configurations de test fiables et d'une documentation claire.

Sur les évaluations de codage et les benchmarks internes, codex-1 montre de fortes performances même sans fichiers AGENTS.md ou échafaudage personnalisé.

Nom : 1.jpg
Affichages : 34396
Taille : 37,6 Ko

Voici la politique d'OpenAI concernant les agents IA :

Citation Envoyé par OpenAI
Nous publions Codex en tant qu'aperçu de recherche, conformément à notre stratégie de déploiement itératif. Nous avons donné la priorité à la sécurité et à la transparence lors de la conception de Codex afin que les utilisateurs puissent vérifier ses résultats - une protection qui devient de plus en plus importante à mesure que les modèles d'IA gèrent des tâches de codage plus complexes de manière indépendante et que les considérations de sécurité évoluent. Les utilisateurs peuvent vérifier le travail de Codex à l'aide de citations, de journaux de terminaux et de résultats de tests. En cas d'incertitude ou d'échec des tests, l'agent Codex communique explicitement ces problèmes, ce qui permet aux utilisateurs de prendre des décisions éclairées sur la manière de procéder. Il reste essentiel pour les utilisateurs d'examiner et de valider manuellement tout le code généré par l'agent avant l'intégration et l'exécution.

Nom : 2.jpg
Affichages : 6322
Taille : 56,4 Ko

S'aligner sur les préférences humaines

L'un des principaux objectifs de la formation de codex-1 était d'aligner les résultats sur les préférences et les normes de codage humaines. Comparé à OpenAI o3, codex-1 produit systématiquement des correctifs plus propres, prêts à être immédiatement examinés par l'homme et intégrés dans les flux de travail standard.

Prévenir les abus

Il est de plus en plus important de se prémunir contre les applications malveillantes de l'ingénierie logicielle pilotée par l'IA, telles que le développement de logiciels malveillants. Dans le même temps, il est important que les mesures de protection n'entravent pas indûment les applications légitimes et bénéfiques qui peuvent impliquer des techniques parfois également utilisées pour le développement de logiciels malveillants, telles que l'ingénierie du noyau de bas niveau.

Afin d'équilibrer la sécurité et l'utilité, le Codex a été formé pour identifier et refuser précisément les demandes visant à développer des logiciels malveillants, tout en distinguant clairement les tâches légitimes et en les soutenant. Nous avons également amélioré nos cadres politiques et incorporé des évaluations rigoureuses de la sécurité pour renforcer efficacement ces limites. Nous avons publié un addendum à la carte du système o3 pour refléter ces évaluations.

Exécution sécurisée

L'agent Codex fonctionne entièrement dans un conteneur sécurisé et isolé dans le nuage. Pendant l'exécution de la tâche, l'accès à Internet est désactivé, limitant l'interaction de l'agent uniquement au code explicitement fourni via les dépôts GitHub et les dépendances préinstallées configurées par l'utilisateur via un script d'installation. L'agent ne peut pas accéder à des sites web externes, à des API ou à d'autres services.
Mises à jour de Codex CLI

Avec cette annonce, OpenAI publie également une version plus petite de codex-1, une version de o4-mini conçue spécifiquement pour être utilisée dans Codex CLI. Ce nouveau modèle prend en charge des flux de travail plus rapides dans le CLI et est optimisé pour les questions-réponses et l'édition de code à faible latence, tout en conservant les mêmes points forts en matière de suivi des instructions et de style. Il est disponible comme modèle par défaut dans Codex CLI et dans l'API en tant que codex-mini-latest.

OpenAI rend plus facile également la connexion de votre compte développeur à Codex CLI. Au lieu de générer et de configurer manuellement un jeton API, vous pouvez maintenant vous connecter avec votre compte ChatGPT et sélectionner l'organisation API que vous souhaitez utiliser. Ils vont automatiquement générer et configurer la clé API pour vous.


Disponibilité, prix et limitations de Codex

Codex est disponible pour les utilisateurs de ChatGPT Pro, Enterprise et Team dans le monde entier, avec un support pour Plus et Edu à venir. Les utilisateurs auront un accès généreux et sans frais supplémentaires pendant les semaines à venir afin que vous puissiez explorer ce que Codex peut faire. Après cela, un accès à taux limité et des options de prix seront déployés, qui vous permettront d'acheter de l'utilisation supplémentaire à la demande.

Pour les développeurs qui construisent avec codex-mini-latest, le modèle est disponible sur l'API Responses au prix de 1,50 $ pour 1M de jetons d'entrée et de 6 $ pour 1M de jetons de sortie, avec une remise de 75 % sur la mise en cache rapide.

Codex n'en est qu'à ses débuts. En tant qu'avant-première de recherche, il manque actuellement des fonctionnalités telles que les entrées d'images pour le travail frontal et la possibilité de corriger le cours de l'agent pendant qu'il travaille. En outre, la délégation à un agent distant prend plus de temps que l'édition interactive, ce qui peut nécessiter un certain temps d'adaptation. Au fil du temps, l'interaction avec les agents du Codex ressemblera de plus en plus à une collaboration asynchrone avec des collègues. Au fur et à mesure que les capacités des modèles progressent, les agents devraient s'occuper de tâches plus complexes sur des périodes prolongées.

Nom : 3.jpg
Affichages : 6314
Taille : 43,1 Ko

Voici les projections d'OpenAI concernant son agent IA :

Citation Envoyé par OpenAI
Nous imaginons un avenir où les développeurs pilotent le travail qu'ils souhaitent faire et délèguent le reste à des agents, pour avancer plus vite et être plus productifs grâce à l'IA. Pour y parvenir, nous construisons une suite d'outils Codex qui supportent à la fois la collaboration en temps réel et la délégation asynchrone.

Le couplage avec des outils d'IA tels que Codex CLI et d'autres est rapidement devenu une norme industrielle, aidant les développeurs à avancer plus rapidement pendant qu'ils codent. Mais nous pensons que le flux de travail asynchrone et multi-agents introduit par Codex dans ChatGPT deviendra la façon de facto dont les ingénieurs produisent un code de haute qualité.

En fin de compte, nous voyons ces deux modes d'interaction - l'appariement en temps réel et la délégation de tâches - converger. Les développeurs collaboreront avec des agents d'IA à travers leurs IDE et leurs outils quotidiens pour poser des questions, obtenir des suggestions et se décharger de tâches plus longues, le tout dans un flux de travail unifié.

À l'avenir, nous prévoyons d'introduire des flux de travail d'agents plus interactifs et plus flexibles. Les développeurs seront bientôt en mesure de fournir des conseils à mi-tâche, de collaborer sur les stratégies de mise en œuvre et de recevoir des mises à jour proactives sur l'avancement des travaux. Nous envisageons également des intégrations plus poussées à travers les outils que vous utilisez déjà : aujourd'hui Codex se connecte à GitHub, et bientôt vous serez en mesure d'assigner des tâches à partir de Codex CLI, ChatGPT Desktop, ou même des outils tels que votre gestionnaire d'incidents ou votre système de CI.

L'ingénierie logicielle est l'un des premiers secteurs à connaître des gains de productivité significatifs grâce à l'IA, ce qui ouvre de nouvelles possibilités pour les individus et les petites équipes. Bien que nous soyons optimistes quant à ces gains, nous collaborons également avec des partenaires pour mieux comprendre les implications de l'adoption généralisée d'agents sur les flux de travail des développeurs, le développement des compétences entre les personnes, les niveaux de compétences et les zones géographiques.

Ce n'est qu'un début et nous sommes impatients de voir ce que vous allez construire avec Codex.

Et vous ?

Pensez-vous que cet agent IA est crédible ou pertinent ?
Quel est votre avis sur le sujet ?

Voir aussi :

L'IA Codex d'OpenAI fait ses débuts en programmation et peut déjà coder dans une dizaine de langages. L'IA pourra-t-elle bientôt décharger les développeurs de certaines tâches, voire les remplacer ?

OpenAI a envisagé d'acheter Cursor avant de se tourner vers son rival Windsurf, un assistant d'IA de codage qui permet de pratiquer le « vibe coding » sans avoir de connaissances approfondies en programmation

OpenAI dévoile GPT-4.1, axée sur le codage, et abandonne progressivement GPT-4.5 : GPT-4.1 ne sera disponible que par l'intermédiaire de l'API développeur et non dans l'interface ChatGPT