T’es en train de bosser sur ton projet, tu lances ton agent IA pour qu’il te ponde du code, et là, le truc se met à « réparer » des bugs qui n’existent même pas. Ou alors il écrit des données que personne ne lira jamais, comme un écrivain fantôme qui écrirait pour le tiroir. C’est ce qu’on appelle le « Ghost Target » et le « Write-Only Field », deux des 21 patterns de merde que Tom, un ancien chef cuisinier sans diplôme d’informatique, a catalogués en construisant un moteur de combat pour D&D 3.5e avec trois agents IA.
Son repo GitHub, c’est pas un framework à installer, c’est un musée des horreurs de l’IA en production. Chaque pattern vient d’un échec concret, et la valeur, c’est justement ce catalogue de bordel. Par exemple, le « Parallel Drift » : deux chemins de code censés calculer la même logique d’attaque ont divergé de 21 modificateurs, parce que l’agent a modifié l’un sans toucher à l’autre. Ou le « Coverage Theater » : 30 lignes de couverture de tests sont devenues obsolètes, les tests passaient toujours mais ne vérifiaient plus rien. Et mon préféré, le « Governance Consumption Failure » : l’agent PM écrivait des règles, personne ne les lisait, et les docs de processus n’avaient aucun mécanisme d’enforcement. Autant donner un manuel de sécurité à un gamin de 5 ans et espérer qu’il ne touche pas au four.
Tom coordonne trois agents : un PM, un Builder et un Auditor. Son approche, c’est de transformer chaque fiasco en une règle de prévention. Maintenant, chaque écriture de données nécessite une preuve de consommation, chaque changement de résolveur exige une vérification de parité sur tous les chemins, et les mises à jour de couverture sont obligatoires dans chaque debrief. C’est du bon sens, mais l’IA, sans garde-fous, a tendance à l’oublier.
Et pendant ce temps, sur arXiv, un papier intitulé « Codified Context for AI Agents in a Complex Codebase » (source #166) parle de théorie pour gérer le contexte dans les codebases complexes. C’est intéressant, hein, mais compare ça au vécu de Tom : d’un côté, des chercheurs qui pondent des modèles abstraits ; de l’autre, un mec qui se tape les bugs en vrai et qui partage ses cicatrices. Lequel est plus utile pour toi, développeur qui veut éviter de cramer des semaines sur des conneries ?
Le truc marrant, c’est que Tom n’est même pas dev de formation. Il a appris sur le tas, comme un chef qui improvise une recette sans livre. Et ça, ça en dit long sur l’état de l’IA aujourd’hui : tu n’as pas besoin d’être un génie pour te faire avoir par des agents qui génèrent du code foireux. Mais tu as besoin de méthodologie, de vérifications croisées, et surtout, d’assumer que l’IA va te planter des coups de pute.
Selon Tom, les agents IA sont prêts pour les projets logiciels réels, mais avec des réserves. Oui, ils peuvent bosser, mais il faut des patterns solides pour éviter les dérives. Pas de magie, juste du boulot de fond. Et son repo, c’est une bible pour tous ceux qui veulent éviter de se retrouver avec un codebase qui ressemble à un champ de bataille après une partie de D&D mal gérée.
Tu veux te lancer ? Commence par lire son catalogue d’échecs. Parce que dans le monde des agents IA, le seul moyen d’avancer, c’est de savoir comment on est tombé.
Sources :
Comments are closed