« J'aide mon chien à faire du vibe coding » : sa chienne ne comprend pas ce qu'elle fait et pourtant ses jeux

**Stéphane le calme** · 25/02/2026, 22h20

« J'aide mon chien à faire du vibe coding » : sa chienne ne comprend pas ce qu'elle fait et pourtant ses jeux tournent,
ce que l'expérience de l'ancien ingénieur de Meta dit du vibe coding

Un ancien ingénieur de recherche licencié par Meta a transformé l'accident de sa chienne sur son clavier en une démonstration technique qui dérange : avec le bon scaffolding, même un cavapoo de 4 kilos motivé par des croquettes peut produire des jeux vidéo jouables. Ce projet aussi absurde que révélateur expose une vérité inconfortable sur ce qu'est — et ce que n'est pas — le « vibe coding » assisté par IA.

Le 13 janvier 2026, Caleb Leak se réveille avec une mauvaise nouvelle : Meta vient de procéder à une nouvelle vague de licenciements, et son poste d'ingénieur de recherche en fait partie. Quelques semaines plus tôt, il avait remarqué des caractères étranges dans son terminal — y7u8888888ftrg34BC — et retrouvé sa chienne Momo, un cavapoo de 4 kilos, occupée à mâchouiller son baume à lèvres après être passée sur le clavier. L'incident l'avait fait sourire. Sans emploi, il décide d'y revenir sérieusement : et si ce chaos de pattes sur du plastique pouvait réellement produire quelque chose ?

La réponse, documentée dans un billet de blog, est à la fois absurde et profondément instructive : oui. Avec l'architecture adéquate, les frappes aléatoires d'un chien peuvent générer des jeux vidéo fonctionnels, avec audio, personnages, niveaux et boss de fin. Et c'est précisément là que la leçon technique commence.

L'architecture derrière le spectacle

Leak ne s'est pas contenté de brancher un clavier sur son ordinateur et d'y poser Momo. Le système qu'il a construit est une démonstration sérieuse d'ingénierie d'agents. Les frappes de la chienne transitent par un clavier Bluetooth Logitech Pebble Keys 2 (plusieurs prototypes ont été détruits en chemin), relié à un Raspberry Pi 5 qui diffuse chaque frappe de touche en UDP sur le réseau local. Une application Rust nommée DogKeyboard filtre les touches dangereuses — Échap, Tab, la touche Windows — et injecte le reste dans Claude Code. Quand Momo a tapé suffisamment de caractères, un distributeur automatique de croquettes Aqara C1 contrôlé via Zigbee se déclenche. Un carillon indique à la chienne que l'IA a fini de travailler et qu'elle peut reprendre.

Le renforcement positif a été soigneusement dosé : d'abord des saumons lyophilisés à haute valeur, progressivement remplacés par des croquettes ordinaires. L'entraînement a duré deux semaines, à raison de dix minutes deux fois par jour. Momo, contrairement à sa grande sœur Hana (plus entraînable mais trop grande pour marcher sur un clavier), a appris à faire glisser sa patte sur les touches plutôt que de les écraser. Un bug du système a même produit un comportement non désiré : des distributions accidentelles multiples ont conditionné la chienne à continuer de taper en espérant un deuxième service immédiat.

Tous les jeux sont développés sous Godot 4.6 avec de la logique C#. Le choix de Godot n'est pas anodin : contrairement à Unity (dont le pont MCP se bloquait régulièrement) ou à Bevy (dont les conventions de coordonnées désarçonnaient l'IA), Godot stocke ses scènes dans des fichiers .tscn en texte brut, que Claude peut lire et modifier directement. Un avantage structurel décisif pour un agent travaillant en autonomie.

Le vrai génie : les boucles de feedback

La partie la plus intéressante du projet n'est pas Momo. C'est ce que Leak a construit autour d'elle.

Le prompt système est d'une longueur remarquable : il instruit Claude Code qu'il communique avec un « designer de jeux vidéo excentrique qui parle en énigmes cryptiques », que chaque frappe aléatoire cache un concept de génie, et que son rôle est d'interpréter ce chaos en jeu fonctionnel. Des garde-fous stricts accompagnent cette consigne : présence obligatoire d'un personnage joueur visible, contrôles WASD ou touches directionnelles opérationnels, au moins un ennemi ou obstacle, audio fonctionnel. Sans cette liste de vérifications minimales, les premières tentatives produisaient des jeux avec des joueurs invisibles, des interfaces empilées dans un coin, ou des contrôles jamais correctement connectés.

Mais c'est l'outillage de feedback automatisé qui a tout changé. Leak a fourni à Claude deux outils supplémentaires : un script Python pour prendre des captures d'écran du jeu en cours d'exécution, et un système permettant d'envoyer des séquences de commandes à une instance de jeu active — « aller à gauche 3 secondes, pause 2 secondes, tirer ». Claude pouvait ainsi lancer le jeu, le jouer lui-même, observer les captures d'écran et itérer. Lors d'un test, l'IA a parcouru les six niveaux d'un jeu jusqu'au boss final, découvert un bug sur la barre de vie, corrigé le code, relancé, et rejoué pour confirmer le correctif.

Des outils complémentaires ont été ajoutés : un linter de scènes pour détecter les références de ressources cassées dans les fichiers .tscn, un linter de shaders retournant des messages d'erreur précis plutôt que le vague « compilation échouée » de Godot, et un mappeur d'actions d'entrée pour brancher correctement clavier et manette. Ces outils, open source, ne nécessitent pas de chien pour être utiles.

Un détail révélateur : lorsque tous les jeux commencèrent à sortir avec le même style — formes 3D néon brillantes — Leak interrogea Claude. L'IA lui expliqua que son fichier de mémoire persistante MEMORY.md avait ancré ce style comme signature du projet et continuait de le réappliquer. Supprimer ce fichier entre chaque jeu suffit à rétablir la variété. La mémoire externe des agents devient ainsi une variable d'architecture à part entière, capable de biaiser la production de façon invisible et durable.

Ce qu'en pensent les développeurs

Un commentaire synthétise l'enseignement central : « La magie n'est pas dans l'input. C'est dans le système autour. » Des frappes aléatoires produisant des jeux jouables signifient que l'input est essentiellement du bruit, et que l'ingénierie réside dans le scaffolding.

Le scaffolding (ou « échafaudage » en français) est une technique utilisée dans le développement de logiciels assistés par IA. Concrètement, c'est un système de coordination externe qui orchestre plusieurs appels successifs à un modèle de langage (LLM), en structurant les étapes, en gérant la mémoire entre chaque appel, en déclenchant des outils (recherche web, exécution de code, lecture de fichiers…), et en transmettant les résultats d'une étape à l'autre.

Un LLM seul ne « pense » pas en plusieurs étapes de façon autonome — il reçoit un prompt et produit une réponse. Le scaffolding est ce qui permet de simuler un raisonnement multi-étapes : un outil externe décide quand rappeler le modèle, avec quoi, et quoi faire du résultat. Des frameworks comme LangChain, LlamaIndex ou AutoGen en sont les incarnations les plus répandues. Le LLM est le cerveau ; le scaffolding est le système nerveux qui lui permet d'agir dans la durée.

Un développeur ayant travaillé sur des systèmes intégrant des agents IA a renchéri : la mémoire persistante, les contraintes comportementales et les boucles de feedback autour du modèle font plus pour la qualité de l'output que n'importe quelle optimisation de prompt. L'expérience de Momo pousse cette logique à son terme — si des frappes aléatoires produisent des jeux jouables, « l'intelligence » n'était jamais dans l'input. Le scaffolding ne soutient pas l'IA : il est la capacité de l'IA.

D'autres commentateurs ont été moins enthousiastes. Plusieurs ont souligné que l'expérience démontre avant tout l'absurdité du « vibe coding » comme pratique : si un générateur de nombres aléatoires ou /dev/random peut théoriquement remplacer la chienne sans changer le résultat, que reste-t-il de la prétendue valeur ajoutée humaine dans ce flux de travail ? Un utilisateur a formulé la critique plus durement encore : les vibe coders qui s'imaginent apporter une valeur créative font exactement la même chose que Momo — remuer le bassin d'entropie d'une boîte magique entraînée sur le travail d'autrui — sans le mérite de la sincérité canine.

La boutade qui a le mieux résumé l'ambiance : « L'espace de travail du futur comptera trois employés : un homme, un chien et une instance de Claude. Le chien écrit les prompts, l'homme nourrit le chien, et le chien empêche l'homme d'éteindre l'ordinateur. »

Nom : chien.png
Affichages : 6942
Taille : 681,6 Ko

Les jeux eux-mêmes

La galerie produite par Momo est étonnamment variée. Octogroove est un jeu de rythme où l'on joue de la batterie avec quatre tentacules de pieuvre, difficile et musical. The Oracle Frog of Rome propose d'éviter les tentacules d'une pieuvre géante tout en collectant des chaînes d'or pour la ligoter. Ewe Heard Me! est un jeu de rassemblement de moutons qui s'est révélé impossible à finir — les deux premiers moutons bloquaient l'entrée du parc, empêchant les suivants d'y entrer. Ce bug a conduit Leak à renforcer les exigences de vérification de jouabilité dans le prompt.

Le jeu le plus abouti, Quasar Saz, demande au joueur d'incarner Zara qui manie un saz cosmique (instrument à cordes à long manche) pour combattre des sons corrompus sur six niveaux plus un boss. Il dispose de visuels soignés et d'un audio dynamique. Fait notable : une amélioration de qualité a coïncidé avec la sortie d'Opus 4.6, Claude devenant alors plus enclin à générer des shaders personnalisés et des effets visuels.

Les limites et l'honnêteté du projet

Leak ne survend pas l'expérience. Il reconnaît explicitement que Momo n'est pas designer de jeux vidéo — c'est un cavapoo qui a appris qu'une plaque de plastique produit des croquettes quand on la frappe. La valeur du projet réside dans ce qu'il révèle sur l'ingénierie d'agents : les boucles de feedback automatisées, la validation par screenshot, le lint de fichiers de scènes, et la gestion de la mémoire persistante font davantage pour la qualité de l'output que la précision de l'input.

Sur Hacker News, quelqu'un a également signalé qu'un projet antérieur existait dans le même esprit : dogomation.darefail.com utilisait un chien comme interface pour créer des produits SaaS B2B. Leak, qui l'avait découvert juste avant de publier, a choisi de ne pas s'en inspirer pour garder sa démarche intacte.

Tous les composants du projet sont open source : DogKeyboard (le routeur de frappes), TeaLeaves (les outils de développement et prompts), et Quasar Saz en versions 1.0 (Momo pure) et 1.1 (avec corrections humaines). La vidéo YouTube montrant Momo à l'œuvre a été vue des dizaines de milliers de fois.

Une métaphore qui dérange

Au-delà de l'anecdote, ce projet illustre une tension réelle dans l'industrie. Les outils de développement assisté par IA progressent au point où la qualité d'un output dépend désormais bien davantage de la robustesse de l'environnement d'exécution — tests automatiques, feedback visuel, validation syntaxique, gestion de la mémoire — que de la sophistication de celui qui écrit le prompt. C'est une redistribution profonde de la valeur dans le workflow de développement.

Pour Caleb Leak, licencié d'un poste d'ingénieur de recherche chez Meta quelques semaines avant de publier ce projet, la démonstration a aussi une dimension personnelle. Elle prouve que les compétences qui comptent aujourd'hui ne sont plus celles qui permettaient de se distinguer hier : comprendre les LLMs ne suffit plus, il faut savoir construire les systèmes qui les entourent.

Momo, elle, continue de taper sur son clavier Logitech en espérant des croquettes. Elle ne sait pas qu'elle est devenue une allégorie.

Sources : Caleb Leak, vidéo dans le texte

Et vous ?

Si /dev/random peut théoriquement remplacer le chien avec le même résultat, quel est le vrai apport du « vibe coder » humain par rapport à Momo — et comment le défendre ?

Le projet démontre que la qualité de l'output dépend surtout du scaffolding (feedback loops, linters, mémoire) plutôt que du prompt lui-même. Est-ce que cela remet fondamentalement en question le métier de « prompt engineer » ?

La mémoire persistante de Claude Code (MEMORY.md) a biaisé invisiblement la production pendant des semaines. Quelles pratiques de gouvernance faut-il mettre en place pour auditer ce type de dérive dans les agents en production ?

Ce projet est entièrement open source et reproductible. Dans six mois, pensez-vous qu'il existera des studios indépendants utilisant ce type de pipeline (entrée aléatoire + scaffolding robuste) pour générer des jeux en série — et est-ce souhaitable ?

Voir aussi :

Une expérience de vibe coding : le bon, le mauvais et le laid

« Le vibe coding tue l'open source », car il sape le mécanisme de financement même qui permet aux projets open source de survivre en dissociant l'utilisation de l'engagement

Antigravity, la plateforme de Vibe Coding de Google, efface une partition contenant les fichiers d'un logiciel et renforce les doutes sur la capacité de l'IA à démocratiser le développement de logiciels

**kain_tn** · 26/02/2026, 09h08

Envoyé par Stéphane le calme

Si /dev/random peut théoriquement remplacer le chien avec le même résultat, quel est le vrai apport du « vibe coder » humain par rapport à Momo — et comment le défendre ?

Il n'y a pas d'apport du « vibe coder », et Momo vient de le démontrer. C'est indéfendable!
Merci Momo

Envoyé par Stéphane le calme

Le projet démontre que la qualité de l'output dépend surtout du scaffolding (feedback loops, linters, mémoire) plutôt que du prompt lui-même. Est-ce que cela remet fondamentalement en question le métier de « prompt engineer » ?

Exactement. Ça met en évidence que n'a n'a jamais été un vrai métier.

Ceux qui savent que les réponses aux prompts ne sont pas gravées dans le marbre, le savent déjà, mais ça ouvrira peut-être les yeux aux junkies du prompt avec leur phrase favorite: "It does not work as expected because you are just prompting it wrong" (ça ne marche pas comme attendu parce que vous n'avez juste pas le bon prompt)

Envoyé par Stéphane le calme

La mémoire persistante de Claude Code (MEMORY.md) a biaisé invisiblement la production pendant des semaines. Quelles pratiques de gouvernance faut-il mettre en place pour auditer ce type de dérive dans les agents en production ?

Ne pas utiliser les agents en production?

À part des andouilles comme Summer Yun (la « responsable sécurité et positionnement de l'IA » chez Meta. Décidément, ce titre me fait toujours autant rire), je pense que certains sont en train de se rendre compte de l'étendue des dégâts avec les incidents à répétition sur les infrastructures de grandes entreprises. Il y a déjà assez de news là-dessus sur ce forum.

Envoyé par Stéphane le calme

Ce projet est entièrement open source et reproductible. Dans six mois, pensez-vous qu'il existera des studios indépendants utilisant ce type de pipeline (entrée aléatoire + scaffolding robuste) pour générer des jeux en série — et est-ce souhaitable ?

Des studios multi-milliardaires, alors. Parce que si la qualité du jeu produit dépend des boucles de feedback, il leur faudra bientôt le budget d'un jeu AAA pour produire le moindre truc non bogué.

**Anselme45** · 26/02/2026, 10h28

Et oui chers développeurs, non seulement vous allez être remplacé par l'IA mais en plus par votre chien qui lui-même le sera à court terme par le chien virtuel de l'IA...

Est-ce que l'on va devoir encore subir longtemps ces conneries livrées à la tonne à longueur de semaine par ces mecs issus des GAFAM?

« J'aide mon chien à faire du vibe coding » : sa chienne ne comprend pas ce qu'elle fait et pourtant ses jeux

Vue hybride

Discussions similaires

Partager

Partager