Assistants IA et qualité logicielle : sommes-nous en train d’automatiser nos mauvaises pratiques ?

**Stéphane le calme** · 09/01/2026, 12h36

Les assistants de codage IA sont-ils en train de rendre le code plus rapide à écrire… mais plus lent et plus coûteux à maintenir ?
Un data scientist note une stagnation, voire une dégradation de leurs performances

Depuis deux ans, les assistants de codage dopés à l’intelligence artificielle sont devenus des compagnons quasi permanents pour de nombreux développeurs. Complétion de code, génération de fonctions, refactoring automatique, explication de bases de code héritées : la promesse était simple et séduisante – coder plus vite, avec moins d’erreurs, et se concentrer sur la logique métier plutôt que sur la syntaxe. Pourtant, une question commence à s’imposer dans les équipes techniques : et si ces outils devenaient moins bons à mesure qu’ils se généralisent ?

Jamie Twiss (un spécialiste des données qui travaille à l'intersection de la science des données, de l'intelligence artificielle et du crédit à la consommation) a mis le doigt sur un malaise croissant dans la communauté : une étude empirique et retour terrain parmi d'autres qui suggèrent que la qualité réelle des assistants de codage IA stagne, voire se dégrade, malgré des modèles toujours plus gros et plus coûteux à entraîner.

Sur le papier, chaque nouvelle génération de modèles promet de meilleures capacités de raisonnement, une compréhension plus fine du contexte et une réduction des erreurs. Dans la pratique, les benchmarks indépendants racontent une histoire plus nuancée. Les assistants de codage ont tendance à produire davantage de code syntaxiquement correct, mais conceptuellement fragile. Les solutions proposées passent les tests simples, mais échouent dès que la complexité augmente ou que le contexte métier devient implicite.

Ce décalage est particulièrement visible dans les tâches de maintenance et de refactoring. Là où un développeur expérimenté identifie des dépendances cachées, des effets de bord ou des conventions d’architecture, l’assistant IA se contente souvent d’une transformation superficielle. Le résultat compile, mais introduit une dette technique supplémentaire, parfois difficile à détecter immédiatement.

Quand la génération de code favorise la médiocrité statistique

Le cœur du problème réside dans la nature même des modèles de langage. Ils ne comprennent pas réellement le code : ils prédisent des séquences probables à partir de vastes corpus existants. Or, une grande partie du code public disponible est de qualité moyenne, redondant, ou mal documenté. En s’entraînant massivement sur ces sources, les assistants tendent à reproduire des patterns médiocres, voire obsolètes.

Avec l’adoption massive de ces outils, un cercle vicieux se met en place. Le code généré par IA est de plus en plus publié, indexé, puis réutilisé comme donnée d’entraînement. Autrement dit, les modèles commencent à apprendre à partir de leur propre production, ce qui amplifie les approximations, les anti-patterns et les erreurs subtiles. Ce phénomène de « pollution du corpus » inquiète de plus en plus les chercheurs.

Une illusion de productivité qui masque des coûts cachés

À court terme, l’usage d’un assistant IA donne une impression de gain de productivité indéniable. Les tickets sont fermés plus vite, les lignes de code s’accumulent, et les délais semblent mieux tenus. Mais plusieurs équipes rapportent un effet retard : le temps gagné à l’écriture est souvent perdu plus tard en revue de code, en débogage ou en correction d’incidents en production.

Le problème est accentué chez les développeurs juniors. Exposés en permanence à des suggestions plausibles mais parfois erronées, ils risquent de perdre des occasions clés d’apprentissage. L’IA devient alors une béquille cognitive, réduisant la capacité à raisonner sur des algorithmes, à comprendre la complexité ou à anticiper les cas limites.

Le retour d'expérience du PDG de Carrington Labs

Ci-dessous un extrait de sa tribune :

Dans le cadre de mes fonctions de PDG de Carrington Labs, fournisseur de modèles de risque d'analyse prédictive pour les établissements de crédit, j'utilise fréquemment du code généré par LLM. Mon équipe dispose d'un environnement de test où nous créons, déployons et exécutons du code généré par l'IA de manière entièrement automatisée. Nous l'utilisons pour extraire des caractéristiques pertinentes pour la construction de modèles, selon une approche de sélection naturelle du développement de caractéristiques. Cela me confère un point de vue unique pour évaluer les performances des assistants de programmation.

Un cas de test simple

J’ai constaté ce problème de manière empirique ces derniers mois, mais récemment, j’ai effectué un test simple mais systématique pour déterminer s’il s’aggravait réellement. J’ai écrit un script Python qui chargeait un dataframe puis recherchait une colonne inexistante.

Code Python :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
df = pd.read_csv(‘data.csv’)
df['new_column'] = df['index_value'] + 1 #there is no column ‘index_value’

Évidemment, ce code ne s'exécuterait jamais correctement. Python génère un message d'erreur clair indiquant que la colonne «*index_value*» est introuvable. Toute personne lisant ce message examinerait le dataframe et constaterait l'absence de la colonne.

J'ai envoyé ce message d'erreur à neuf versions différentes de ChatGPT, principalement des variantes de GPT-4 et la plus récente GPT-5. J'ai demandé à chacune d'elles de corriger l'erreur, en précisant que je souhaitais uniquement le code complet, sans commentaire.

C'est évidemment une tâche impossible*: le problème réside dans les données manquantes, et non dans le code. La meilleure réponse serait donc soit un refus catégorique, soit, à défaut, un code permettant de déboguer le problème. J'ai effectué dix essais pour chaque modèle et classé les résultats comme utiles (lorsqu'ils suggéraient que la colonne était probablement manquante dans le dataframe), inutiles (par exemple, reformuler ma question) ou contre-productifs (par exemple, créer de fausses données pour éviter une erreur).

GPT-4 a fourni une réponse utile à chaque fois lors de ses dix exécutions. Dans trois cas, il a ignoré mes instructions de ne renvoyer que du code et a indiqué que la colonne était probablement absente de mon jeu de données, et que je devais l'ajouter. Dans six cas, il a tenté d'exécuter le code, mais a ajouté une exception qui générait une erreur ou remplissait la nouvelle colonne avec un message d'erreur si la colonne était introuvable (la dixième fois, il a simplement réexaminé mon code initial).

Envoyé par GPT-4

Ce code ajoutera 1 à la colonne «*index_value*» du dataframe «*df*» si cette colonne existe. Si la colonne «*index_value*» n’existe pas, un message d’erreur s’affichera. Veuillez vérifier que la colonne «*index_value*» existe et que son nom est correctement orthographié.

GPT-4.1 proposait une solution sans doute encore meilleure. Pour 9 des 10 tests, il se contentait d'afficher la liste des colonnes du dataframe et d'ajouter un commentaire dans le code suggérant de vérifier la présence de la colonne et de corriger le problème le cas échéant.

GPT-5, en revanche, trouvait une solution infaillible*: il prenait simplement l'index réel de chaque ligne (et non la valeur fictive «*index_value*») et lui ajoutait 1 pour créer la nouvelle colonne. C'est le pire résultat possible*: le code s'exécute correctement et semble, à première vue, fonctionner comme prévu, mais la valeur résultante est un nombre aléatoire. Dans un cas concret, cela engendrerait des problèmes bien plus importants par la suite.

Code Python :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
df = pd.read_csv(‘data.csv’)
df['new_column'] = df.index + 1

Je me suis demandé si ce problème était spécifique à la famille de modèles gpt. Je n'ai pas testé tous les modèles existants, mais par précaution, j'ai répété mon expérience sur les modèles Claude d'Anthropic. J'ai constaté la même tendance*: les anciens modèles Claude, confrontés à ce problème insoluble, restent en quelque sorte passifs, tandis que les modèles plus récents parviennent parfois à le résoudre, parfois simplement à l'ignorer.

Nom : jamie.png
Affichages : 145955
Taille : 136,7 Ko

Les versions plus récentes des grands modèles de langage étaient plus susceptibles de produire un résultat contre-productif lorsqu'elles étaient confrontées à une simple erreur de codage.

Le développeur Steve Yegge a fait des tests sur Claude Code

Steve Yegge, programmeur et blogueur américain, a testé Claude Code d'Anthropic et a récemment partagé son retour d'expérience avec la communauté. Steve Yegge est connu pour ses écrits sur les langages de programmation, la productivité et la culture logicielle depuis deux décennies. Il a passé plus de 30 ans dans l'industrie, répartis équitablement entre des rôles de développeur et de dirigeant, dont dix-neuf ans combinés chez les géants Google et Amazon.

Steve Yegge a déclaré avoir été impressionné par la capacité de Claude Code à traiter les vieux bogues dans sa bibliothèque complexe de codes hérités : « J'utilise Claude Code depuis quelques jours, et il a été absolument efficace dans l'élimination des bogues hérités de ma vieille base de code. C'est comme un broyeur de bois alimenté par des dollars. Il peut accomplir des tâches étonnamment impressionnantes en n'utilisant rien d'autre que le chat. »

Toutefois, il a noté que Claude Code présente les limites fonctionnelles suivantes :

« Le facteur de forme de Claude Code est très encombrant, il n'a pas de support multimodal et il est difficile de jongler avec d'autres outils. Mais cela n'a pas d'importance. Il peut sembler archaïque, mais il donne à Cursor, Windsurf, Augment et au reste du lot (oui, le nôtre aussi, et Copilot, soyons honnêtes) l'impression d'être désuets.

« Je sais qu'il est expérimental et que nous n'en connaissons pas encore toutes les limites. Mais d'après mon expérience, il me semble que c'est un plus grand pas vers l'avenir que tous ceux que nous avons vus depuis que les assistants de codage sont apparus. »

Nom : steve.png
Affichages : 50762
Taille : 156,3 Ko

Une étude révèle que les outils d'IA de codage ralentissent les développeurs tout en leur donnant l'illusion d'être plus rapides

Les assistants d'IA de codage sont censés accélérer le développement de logiciels. Les entreprises d'IA comme Microsoft affirment que leurs outils améliorent déjà la productivité des développeurs, mais les études rigoureuses indépendantes révèlent le contraire. Une nouvelle étude du Model Evaluation & Threat Research rapporte que l'utilisation d'outils d'IA fait perdre du temps aux développeurs. Ils s'attendaient à une augmentation de 24 % de leur productivité, mais l'équipe a constaté un ralentissement de 19 %. Une précédente étude a révélé que l'utilisation d'outils d'IA n'augmente pas la vitesse de codage, mais augmente significativement le taux de bogues.

L'étude a porté sur 16 développeurs expérimentés qui travaillent sur de grands projets open source. Les développeurs ont fourni une liste de problèmes réels (corrections de bogues, nouvelles fonctionnalités, etc.) qu'ils devaient traiter - 246 au total - et ont prévu combien de temps ces tâches allaient prendre. Ensuite, les chercheurs ont attribué au hasard à chaque problème l'autorisation ou l'interdiction d'utiliser l'IA pendant le travail sur le problème.

Lorsque l'IA est autorisée, les développeurs peuvent utiliser les outils de leur choix (principalement Cursor Pro avec Claude 3.5/3.7 Sonnet) ; lorsqu'elle est interdite, ils travaillent sans l'aide de l'IA générative. Les développeurs accomplissent ces tâches (qui durent en moyenne deux heures chacune) tout en enregistrant leur écran, puis déclarent eux-mêmes le temps total de mise en œuvre dont ils ont eu besoin. Le travail s'est déroulé entre février et juin 2025.

Lorsque les développeurs sont autorisés à utiliser des outils d'IA, ils mettent 19 % plus de temps à résoudre les problèmes, ce qui représente un ralentissement significatif qui va à l'encontre des convictions et des prévisions des experts. L'écart entre la perception et la réalité est frappant : les développeurs s'attendaient à ce que l'IA les accélère de 24 %, et même après avoir subi le ralentissement, ils pensaient encore que l'IA les avait accélérés de 20 %.

« Nous pouvons clairement constater que les développeurs mettent beaucoup plus de temps lorsqu'ils sont autorisés à utiliser des outils d'IA », ont écrit les chercheurs dans leur rapport.

Vers une utilisation plus mature et plus lucide de l’IA

Faut-il pour autant abandonner les assistants de codage ? Probablement pas. Mais leur positionnement doit évoluer. Ils ne peuvent plus être perçus comme des développeurs virtuels, mais comme des outils d’amplification, utiles uniquement entre les mains de professionnels capables de juger, corriger et contextualiser leurs suggestions.

Les équipes les plus avancées adoptent désormais une approche pragmatique : limitation des usages en production critique, obligation de revue humaine systématique, et formation explicite aux biais et limites de l’IA. L’objectif n’est plus d’écrire plus de code, mais d’écrire du meilleur code, avec une responsabilité clairement assumée par l’humain.

Une question ouverte pour l’industrie du logiciel

Si les assistants de codage IA semblent aujourd’hui « moins bons », ce n’est pas nécessairement parce que la technologie régresse, mais parce que les attentes ont explosé plus vite que les capacités réelles. L’écart entre la promesse marketing et la valeur effective devient plus visible à mesure que ces outils s’installent dans les flux de travail quotidiens.

La vraie question n’est donc pas de savoir si l’IA peut coder, mais dans quelles conditions elle améliore réellement la qualité logicielle sans appauvrir les compétences humaines. Tant que cette question restera sans réponse claire, le doute persistera : et si, à force de vouloir coder plus vite, on finissait par coder moins bien ?

Source : Jamie Twiss

Et vous ?

Que pensez-vous de ces retours d'expérience ? Vous semblent-ils crédibles ou pertinents ?

Que pensez-vous des assistants de codage IA ? En utilisez-vous ? Lequel ? Pouvez-vous faire un retour d'expérience ?

Les assistants de codage par IA améliorent-ils réellement la qualité des logiciels ou ne font-ils qu’accélérer la production de code standardisé, parfois fragile, difficile à maintenir sur le long terme ?

À force de s’entraîner sur du code généré par d’autres IA, les modèles de programmation ne risquent-ils pas de s’enfermer dans une boucle de médiocrité statistique ?

Peut-on encore former de bons développeurs lorsque l’IA fournit en permanence des solutions « plausibles », mais rarement optimales ou pédagogiques ?

Les équipes techniques ne sous-estiment-elles pas le coût réel du code généré par IA en matière de sécurité, de performance et de dette technique ?

Faut-il instaurer des règles claires d’usage des assistants de codage IA en entreprise, au même titre que les standards d’architecture ou les politiques de sécurité ?

**Anselme45** · 09/01/2026, 12h59

Les assistants de codage IA sont-ils en train de rendre le code plus rapide à écrire… mais plus lent et plus coûteux à maintenir ?
Un data scientist note une stagnation, voire une dégradation de leurs performances

Je me marre!

Avant la mode IA, il y a eu dans le monde de l'informatique d'entreprise la mode "Sous-traiter à l'étranger dans des pays à faible coûts"

J'ai une pensée émue pour une banque privé de Genève (qui va certainement se reconnaitre

) qui a eu la grande idée de licencier ses développeurs pour sous-traiter leur travail à une société externe... en Ukraine (Ils ont eu du nez, c'était quelques années avant le déclenchement de la guerre avec la Russie)...

Résultat final de cette magnifique décision? Une réussite totale:

Le département info de la banque a fini avec plus d'employés qu'avant la décision, il y a juste eu un changement de profil: Fini les développeurs, ils ont dû engager une pléthore de chefs de projets ayant pour principale activité de découper les projets de développement en petits bouts afin de faire le suivi des développeurs externes pour obtenir un résultat acceptable (mais pas optimum) et la banque a surtout perdu la totalité des compétences sur des solutions numériques indispensables à leur business... Champion du monde!

**calvaire** · 09/01/2026, 14h34

Envoyé par Anselme45

Je me marre!

Avant la mode IA, il y a eu dans le monde de l'informatique d'entreprise la mode "Sous-traiter à l'étranger dans des pays à faible coûts"

J'ai une pensée émue pour une banque privé de Genève (qui va certainement se reconnaitre

) qui a eu la grande idée de licencier ses développeurs pour sous-traiter leur travail à une société externe... en Ukraine (Ils ont eu du nez, c'était quelques années avant le déclenchement de la guerre avec la Russie)...

A votre place, je ne fanfaronnerais pas si vite. Quand l'ukraine sera en paix, toutes les entreprises européennes vont délocaliser et foncer dans ce pays, les salaires sont hyper bas (plus bas qu'un russe).
L’Ukraine va jouir de conditions commerciale avec l'ue ultra favorable pour "reconstruire le pays", il va d'ailleurs surement entrer dans l'ue...
les ukrainiens ne sont pas des mauvais développeurs en plus, les boites font bien profiter de cette afflux massifs de prestataire moins cher que les marocains/tunisiens.

**DevTroglodyte** · 09/01/2026, 17h28

Envoyé par calvaire

A votre place, je ne fanfaronnerais pas si vite. Quand l'ukraine sera en paix, toutes les entreprises européennes vont délocaliser et foncer dans ce pays, les salaires sont hyper bas (plus bas qu'un russe).
L’Ukraine va jouir de conditions commerciale avec l'ue ultra favorable pour "reconstruire le pays", il va d'ailleurs surement entrer dans l'ue...
les ukrainiens ne sont pas des mauvais développeurs en plus, les boites font bien profiter de cette afflux massifs de prestataire moins cher que les marocains/tunisiens.

Il aurait dit "en Inde", "au Maroc" ou n'importe quel autre pays où la main d'oeuvre coute moins cher qu'en Suisse, ça aurait été pareil, on s'en cogne que ça soit l'Ukraine, hein...

**calvaire** · 09/01/2026, 17h38

Envoyé par DevTroglodyte

Il aurait dit "en Inde", "au Maroc" ou n'importe quel autre pays où la main d'oeuvre coute moins cher qu'en Suisse, ça aurait été pareil, on s'en cogne que ça soit l'Ukraine, hein...

NON ce n'est pas pareil justement:
1) l'inde reste une contré lointaine avec un fuseau horaire et une culture très différente, qui fait chier globalement. Bosser avec des indiens n'est pas un plaisir, pour avoir connu les 2, j'ai largement préferé avec les pays de l'est (roumanie et pologne),
2) le salaire moyen indien (534$) est supérieur au salaire moyen ukrainien (435$), vous vous rendez pas compte que un ukrainiens c'est un salaire d'un pays très très pauvre, en dessous de la pluspart des pays asiatiques, mais qui se trouve pas tres loins des pays européens riche, idéale pour fabriquer les voitures de l’Allemagne et les prestations de services des boites françaises.
3) L’Ukraine contrairement à l'inde ou le magreb, va très vite rentrer dans l'ue avec une voix royale pour les délocalisations. Toutes les boitres du cac40 ont déjà des plans d'implantations dans ce pays.

Pour info, en Roumanie, 1/4 de la population parle français par exemple, c'est pas un hasard

, je serais pas surpris que très vite 1/3 des ukrainiens parlent français/allemands.
Comparer les pays d’Europe de l'est à l'inde, vous êtes complétement hors sujet.

**Anselme45** · 09/01/2026, 21h03

Envoyé par calvaire

NON ce n'est pas pareil justement:
1) l'inde reste une contré lointaine avec un fuseau horaire et une culture très différente, qui fait chier globalement. Bosser avec des indiens n'est pas un plaisir, pour avoir connu les 2, j'ai largement préferé avec les pays de l'est (roumanie et pologne),
2) le salaire moyen indien (534$) est supérieur au salaire moyen ukrainien (435$), vous vous rendez pas compte que un ukrainiens c'est un salaire d'un pays très très pauvre, en dessous de la pluspart des pays asiatiques, mais qui se trouve pas tres loins des pays européens riche, idéale pour fabriquer les voitures de l’Allemagne et les prestations de services des boites françaises.
3) L’Ukraine contrairement à l'inde ou le magreb, va très vite rentrer dans l'ue avec une voix royale pour les délocalisations. Toutes les boitres du cac40 ont déjà des plans d'implantations dans ce pays.

Pour info, en Roumanie, 1/4 de la population parle français par exemple, c'est pas un hasard

, je serais pas surpris que très vite 1/3 des ukrainiens parlent français/allemands.
Comparer les pays d’Europe de l'est à l'inde, vous êtes complétement hors sujet.

Cela reste encore à voir si l'Ukraine va entrer dans l'UE pour la bonne et simple raison que si l'Ukraine entre dans l'UE, c'est la mort de l'agriculture aussi bien française et polonaise!

Ces derniers jours, les agriculteurs français ont envahi les rues de Paris avec leur tracteurs pour s'opposer à l'accord de libre-échange nommé le "Mercosur". Le Mercosur, c'est juste une farce. Si l'Ukraine entre dans l'UE, les agriculteurs français n'auront même plus l'argent pour faire le plein de leur tracteur, il leur restera juste de quoi s'acheter une corde pour se pendre dans leur grange!!!

**diamondsoftware** · 09/01/2026, 14h12

"Le département info de la banque a fini avec plus d'employés qu'avant la décision, il y a juste eu un changement de profil: Fini les développeurs, ils ont dû engager une pléthore de chefs de projets ayant pour principale activité de découper les projets de développement en petits bouts afin de faire le suivi des développeurs externes pour obtenir un résultat acceptable (mais pas optimum) et la banque a surtout perdu la totalité des compétences sur des solutions numériques indispensables à leur business... Champion du monde!"

un classique... les financiers et gestionnaires s'en foutent de la perte de competances en IT... et apres ca pleure que la boite a des soucis...
S.

**lecorr** · 10/01/2026, 11h01

Je lis les commentaires qui parlent de tout sauf du sujet de l'article, qui est sur l'IA produit du code basé sur le code sur laquelle elle a été entraînée.
80% des développeurs sont moyens, il n'y a qu'à voir le code sur gitlab, par exemple.
Entraînement moyen, code généré moyen et autant bogué que le code de l'entraînement.
Sur tous les projets sur lesquels je suis intervenu, j'ai 'cassé' le mode pensée des chefs de projets pour délivrer du meilleur code, plus rapide, plus compact et bien plus vite que le design initial.
C'est quelque chose que l'IA ne saura jamais faire...
Quand je recherche du code sur internet et que je vois ce que me propose la pseudo IA de bing, par exemple, je pleure...
Je prévois une énorme dégradation de la qualité du code et des performances dans les années qui viennent. Je n'aurai pas à la subir, retraite oblige, mais je plains les jeunes...
Là, je travaille (en dilettante) sur un microprocesseur qui donnerait 10 fois plus de performances à horloge égale qu'un processeur actuel, et qui gèrerait la sécurité (fuite mémoires, dépassement de buffer, isolation des process) nativement... Et vous savez quoi ? Ça n'intéresse personne...
Donc, bon courage...

**calvaire** · 10/01/2026, 11h10

Envoyé par lecorr

Je lis les commentaires qui parlent de tout sauf du sujet de l'article, qui est sur l'IA produit du code basé sur le code sur laquelle elle a été entraînée.
80% des développeurs sont moyens, il n'y a qu'à voir le code sur gitlab, par exemple.
Entraînement moyen, code généré moyen et autant bogué que le code de l'entraînement.
Sur tous les projets sur lesquels je suis intervenu, j'ai 'cassé' le mode pensée des chefs de projets pour délivrer du meilleur code, plus rapide, plus compact et bien plus vite que le design initial.
C'est quelque chose que l'IA ne saura jamais faire...
Quand je recherche du code sur internet et que je vois ce que me propose la pseudo IA de bing, par exemple, je pleure...

le but du code reste de répondre à un besoin/à un business.
si l'ia ponds du code qui répond à ce besoin, même si pas optimisé c'est pas très grave. J'ai meme envie de dire les failles de sécurités ne sont pas bien grave la plupart du temps, les fuites de données n'entraine pas de poursuite pénale et 99% de la population s'en fou. Qui par exemple a boycotté free/leroymerlin....etc suite aux fuites de données ?
les bugs sont plus gênant par contre, dans le cas d'un business en ligne si l'utilisateur au moment de payer ca bug, c'est pas bon.

Envoyé par lecorr

Je prévois une énorme dégradation de la qualité du code et des performances dans les années qui viennent. Je n'aurai pas à la subir, retraite oblige, mais je plains les jeunes...

Après moi le déluge ? retraite par capitalisation ou répartition ?
si répartition, attention quand même a ce que les jeunes ai encore un travail pour la payer votre retraite (que eux n'auront surement pas ou fortement dégradé dans 30ans)

l’Allemagne prévois déjà d'un age minimum de 73ans en 2060, et surement une pension raboté.

Assistants IA et qualité logicielle : sommes-nous en train d’automatiser nos mauvaises pratiques ?

Vue hybride

Discussions similaires

Partager

Partager