« J'aide mon chien à faire du vibe coding » : sa chienne ne comprend pas ce qu'elle fait et pourtant ses jeux tournent,
ce que l'expérience de l'ancien ingénieur de Meta dit du vibe coding
Un ancien ingénieur de recherche licencié par Meta a transformé l'accident de sa chienne sur son clavier en une démonstration technique qui dérange : avec le bon scaffolding, même un cavapoo de 4 kilos motivé par des croquettes peut produire des jeux vidéo jouables. Ce projet aussi absurde que révélateur expose une vérité inconfortable sur ce qu'est — et ce que n'est pas — le « vibe coding » assisté par IA.
Le 13 janvier 2026, Caleb Leak se réveille avec une mauvaise nouvelle : Meta vient de procéder à une nouvelle vague de licenciements, et son poste d'ingénieur de recherche en fait partie. Quelques semaines plus tôt, il avait remarqué des caractères étranges dans son terminal — y7u8888888ftrg34BC — et retrouvé sa chienne Momo, un cavapoo de 4 kilos, occupée à mâchouiller son baume à lèvres après être passée sur le clavier. L'incident l'avait fait sourire. Sans emploi, il décide d'y revenir sérieusement : et si ce chaos de pattes sur du plastique pouvait réellement produire quelque chose ?
La réponse, documentée dans un billet de blog, est à la fois absurde et profondément instructive : oui. Avec l'architecture adéquate, les frappes aléatoires d'un chien peuvent générer des jeux vidéo fonctionnels, avec audio, personnages, niveaux et boss de fin. Et c'est précisément là que la leçon technique commence.
L'architecture derrière le spectacle
Leak ne s'est pas contenté de brancher un clavier sur son ordinateur et d'y poser Momo. Le système qu'il a construit est une démonstration sérieuse d'ingénierie d'agents. Les frappes de la chienne transitent par un clavier Bluetooth Logitech Pebble Keys 2 (plusieurs prototypes ont été détruits en chemin), relié à un Raspberry Pi 5 qui diffuse chaque frappe de touche en UDP sur le réseau local. Une application Rust nommée DogKeyboard filtre les touches dangereuses — Échap, Tab, la touche Windows — et injecte le reste dans Claude Code. Quand Momo a tapé suffisamment de caractères, un distributeur automatique de croquettes Aqara C1 contrôlé via Zigbee se déclenche. Un carillon indique à la chienne que l'IA a fini de travailler et qu'elle peut reprendre.
Le renforcement positif a été soigneusement dosé : d'abord des saumons lyophilisés à haute valeur, progressivement remplacés par des croquettes ordinaires. L'entraînement a duré deux semaines, à raison de dix minutes deux fois par jour. Momo, contrairement à sa grande sœur Hana (plus entraînable mais trop grande pour marcher sur un clavier), a appris à faire glisser sa patte sur les touches plutôt que de les écraser. Un bug du système a même produit un comportement non désiré : des distributions accidentelles multiples ont conditionné la chienne à continuer de taper en espérant un deuxième service immédiat.
Tous les jeux sont développés sous Godot 4.6 avec de la logique C#. Le choix de Godot n'est pas anodin : contrairement à Unity (dont le pont MCP se bloquait régulièrement) ou à Bevy (dont les conventions de coordonnées désarçonnaient l'IA), Godot stocke ses scènes dans des fichiers .tscn en texte brut, que Claude peut lire et modifier directement. Un avantage structurel décisif pour un agent travaillant en autonomie.
Le vrai génie : les boucles de feedback
La partie la plus intéressante du projet n'est pas Momo. C'est ce que Leak a construit autour d'elle.
Le prompt système est d'une longueur remarquable : il instruit Claude Code qu'il communique avec un « designer de jeux vidéo excentrique qui parle en énigmes cryptiques », que chaque frappe aléatoire cache un concept de génie, et que son rôle est d'interpréter ce chaos en jeu fonctionnel. Des garde-fous stricts accompagnent cette consigne : présence obligatoire d'un personnage joueur visible, contrôles WASD ou touches directionnelles opérationnels, au moins un ennemi ou obstacle, audio fonctionnel. Sans cette liste de vérifications minimales, les premières tentatives produisaient des jeux avec des joueurs invisibles, des interfaces empilées dans un coin, ou des contrôles jamais correctement connectés.
Mais c'est l'outillage de feedback automatisé qui a tout changé. Leak a fourni à Claude deux outils supplémentaires : un script Python pour prendre des captures d'écran du jeu en cours d'exécution, et un système permettant d'envoyer des séquences de commandes à une instance de jeu active — « aller à gauche 3 secondes, pause 2 secondes, tirer ». Claude pouvait ainsi lancer le jeu, le jouer lui-même, observer les captures d'écran et itérer. Lors d'un test, l'IA a parcouru les six niveaux d'un jeu jusqu'au boss final, découvert un bug sur la barre de vie, corrigé le code, relancé, et rejoué pour confirmer le correctif.
Des outils complémentaires ont été ajoutés : un linter de scènes pour détecter les références de ressources cassées dans les fichiers .tscn, un linter de shaders retournant des messages d'erreur précis plutôt que le vague « compilation échouée » de Godot, et un mappeur d'actions d'entrée pour brancher correctement clavier et manette. Ces outils, open source, ne nécessitent pas de chien pour être utiles.
Un détail révélateur : lorsque tous les jeux commencèrent à sortir avec le même style — formes 3D néon brillantes — Leak interrogea Claude. L'IA lui expliqua que son fichier de mémoire persistante MEMORY.md avait ancré ce style comme signature du projet et continuait de le réappliquer. Supprimer ce fichier entre chaque jeu suffit à rétablir la variété. La mémoire externe des agents devient ainsi une variable d'architecture à part entière, capable de biaiser la production de façon invisible et durable.
Ce qu'en pensent les développeurs
Un commentaire synthétise l'enseignement central : « La magie n'est pas dans l'input. C'est dans le système autour. » Des frappes aléatoires produisant des jeux jouables signifient que l'input est essentiellement du bruit, et que l'ingénierie réside dans le scaffolding.
Le scaffolding (ou « échafaudage » en français) est une technique utilisée dans le développement de logiciels assistés par IA. Concrètement, c'est un système de coordination externe qui orchestre plusieurs appels successifs à un modèle de langage (LLM), en structurant les étapes, en gérant la mémoire entre chaque appel, en déclenchant des outils (recherche web, exécution de code, lecture de fichiers…), et en transmettant les résultats d'une étape à l'autre.
Un LLM seul ne « pense » pas en plusieurs étapes de façon autonome — il reçoit un prompt et produit une réponse. Le scaffolding est ce qui permet de simuler un raisonnement multi-étapes : un outil externe décide quand rappeler le modèle, avec quoi, et quoi faire du résultat. Des frameworks comme LangChain, LlamaIndex ou AutoGen en sont les incarnations les plus répandues. Le LLM est le cerveau ; le scaffolding est le système nerveux qui lui permet d'agir dans la durée.
Un développeur ayant travaillé sur des systèmes intégrant des agents IA a renchéri : la mémoire persistante, les contraintes comportementales et les boucles de feedback autour du modèle font plus pour la qualité de l'output que n'importe quelle optimisation de prompt. L'expérience de Momo pousse cette logique à son terme — si des frappes aléatoires produisent des jeux jouables, « l'intelligence » n'était jamais dans l'input. Le scaffolding ne soutient pas l'IA : il est la capacité de l'IA.
D'autres commentateurs ont été moins enthousiastes. Plusieurs ont souligné que l'expérience démontre avant tout l'absurdité du « vibe coding » comme pratique : si un générateur de nombres aléatoires ou /dev/random peut théoriquement remplacer la chienne sans changer le résultat, que reste-t-il de la prétendue valeur ajoutée humaine dans ce flux de travail ? Un utilisateur a formulé la critique plus durement encore : les vibe coders qui s'imaginent apporter une valeur créative font exactement la même chose que Momo — remuer le bassin d'entropie d'une boîte magique entraînée sur le travail d'autrui — sans le mérite de la sincérité canine.
La boutade qui a le mieux résumé l'ambiance : « L'espace de travail du futur comptera trois employés : un homme, un chien et une instance de Claude. Le chien écrit les prompts, l'homme nourrit le chien, et le chien empêche l'homme d'éteindre l'ordinateur. »
Les jeux eux-mêmes
La galerie produite par Momo est étonnamment variée. Octogroove est un jeu de rythme où l'on joue de la batterie avec quatre tentacules de pieuvre, difficile et musical. The Oracle Frog of Rome propose d'éviter les tentacules d'une pieuvre géante tout en collectant des chaînes d'or pour la ligoter. Ewe Heard Me! est un jeu de rassemblement de moutons qui s'est révélé impossible à finir — les deux premiers moutons bloquaient l'entrée du parc, empêchant les suivants d'y entrer. Ce bug a conduit Leak à renforcer les exigences de vérification de jouabilité dans le prompt.
Le jeu le plus abouti, Quasar Saz, demande au joueur d'incarner Zara qui manie un saz cosmique (instrument à cordes à long manche) pour combattre des sons corrompus sur six niveaux plus un boss. Il dispose de visuels soignés et d'un audio dynamique. Fait notable : une amélioration de qualité a coïncidé avec la sortie d'Opus 4.6, Claude devenant alors plus enclin à générer des shaders personnalisés et des effets visuels.
Les limites et l'honnêteté du projet
Leak ne survend pas l'expérience. Il reconnaît explicitement que Momo n'est pas designer de jeux vidéo — c'est un cavapoo qui a appris qu'une plaque de plastique produit des croquettes quand on la frappe. La valeur du projet réside dans ce qu'il révèle sur l'ingénierie d'agents : les boucles de feedback automatisées, la validation par screenshot, le lint de fichiers de scènes, et la gestion de la mémoire persistante font davantage pour la qualité de l'output que la précision de l'input.
Sur Hacker News, quelqu'un a également signalé qu'un projet antérieur existait dans le même esprit : dogomation.darefail.com utilisait un chien comme interface pour créer des produits SaaS B2B. Leak, qui l'avait découvert juste avant de publier, a choisi de ne pas s'en inspirer pour garder sa démarche intacte.
Tous les composants du projet sont open source : DogKeyboard (le routeur de frappes), TeaLeaves (les outils de développement et prompts), et Quasar Saz en versions 1.0 (Momo pure) et 1.1 (avec corrections humaines). La vidéo YouTube montrant Momo à l'œuvre a été vue des dizaines de milliers de fois.
Une métaphore qui dérange
Au-delà de l'anecdote, ce projet illustre une tension réelle dans l'industrie. Les outils de développement assisté par IA progressent au point où la qualité d'un output dépend désormais bien davantage de la robustesse de l'environnement d'exécution — tests automatiques, feedback visuel, validation syntaxique, gestion de la mémoire — que de la sophistication de celui qui écrit le prompt. C'est une redistribution profonde de la valeur dans le workflow de développement.
Pour Caleb Leak, licencié d'un poste d'ingénieur de recherche chez Meta quelques semaines avant de publier ce projet, la démonstration a aussi une dimension personnelle. Elle prouve que les compétences qui comptent aujourd'hui ne sont plus celles qui permettaient de se distinguer hier : comprendre les LLMs ne suffit plus, il faut savoir construire les systèmes qui les entourent.
Momo, elle, continue de taper sur son clavier Logitech en espérant des croquettes. Elle ne sait pas qu'elle est devenue une allégorie.
Sources : Caleb Leak, vidéo dans le texte
Et vous ?
Si /dev/random peut théoriquement remplacer le chien avec le même résultat, quel est le vrai apport du « vibe coder » humain par rapport à Momo — et comment le défendre ?
Le projet démontre que la qualité de l'output dépend surtout du scaffolding (feedback loops, linters, mémoire) plutôt que du prompt lui-même. Est-ce que cela remet fondamentalement en question le métier de « prompt engineer » ?
La mémoire persistante de Claude Code (MEMORY.md) a biaisé invisiblement la production pendant des semaines. Quelles pratiques de gouvernance faut-il mettre en place pour auditer ce type de dérive dans les agents en production ?
Ce projet est entièrement open source et reproductible. Dans six mois, pensez-vous qu'il existera des studios indépendants utilisant ce type de pipeline (entrée aléatoire + scaffolding robuste) pour générer des jeux en série — et est-ce souhaitable ?
Voir aussi :
Une expérience de vibe coding : le bon, le mauvais et le laid
« Le vibe coding tue l'open source », car il sape le mécanisme de financement même qui permet aux projets open source de survivre en dissociant l'utilisation de l'engagement
Antigravity, la plateforme de Vibe Coding de Google, efface une partition contenant les fichiers d'un logiciel et renforce les doutes sur la capacité de l'IA à démocratiser le développement de logiciels







Si
Répondre avec citation







Partager