On va pas se mentir, la sortie de GPT-5.5 la semaine dernière était plutôt classe. OpenAI nous sort un modèle « agentique » taillé pour le boulot, des scores qui claquent sur les benchmarks, et même une efficacité token qui fait que le surcoût de 20% passe presque inaperçu. Sauf que voilà, en fouillant dans le code open source de Codex CLI, Ars Technica a découvert le squelette dans le placard : le système prompt de GPT-5.5 contient une interdiction pure et simple de parler de gobelins, fées, ratons laveurs, trolls, ogres et pigeons. Oui, tu as bien lu. La consigne apparaît deux fois dans les 3500 mots d’instructions de base, au même niveau que des règles comme « interdire les commandes destructrices ».
Ce n’est pas un caprice idéologique. D’après les ingénieurs, c’est un « patch » technique : récemment, le modèle se mettait à halluciner des histoires de gobelins dans des contextes qui n’avaient rien à voir. Une sorte de dérive statistique, un biais de génération qui fait que le modèle associe n’importe quel sujet à du folklore. Plutôt que de tout re-entraîner, ils ont collé un stop dans le prompt. C’est comme mettre un pansement sur une hémorragie, mais ça marche.
Ce leak révèle surtout les défis auxquels font face ces modèles géants : plus ils sont capables, plus ils développent des bizarreries imprévisibles. Et pendant que les concurrents (Claude Opus 4.7, notamment) dominent sur le benchmark MCP Atlas de Scale AI, OpenAI doit gérer des gobelins fantômes. La prochaine fois que tu vois un score de 82% sur Terminal-Bench, souviens-toi : derrière la puissance agentique, il y a parfois un ingénieur qui supplie son modèle de ne pas parler de pigeons.
Sources :
Comments are closed