Anthropic tire le signal d’alarme sur Mythos, mais le feu était déjà dans la maison

Jack Clark, co-fondateur d’Anthropic, a confirmé ce que tout le monde soupçonnait déjà : leur dernier joujou, le modèle Mythos, est trop dangereux pour voir le jour. Non pas dans un papier académique discret, mais lors d’un briefing à la Maison Blanche, sous l’administration Trump. Oui, celle-là même qui a du mal à aligner deux tweets sans faute d’orthographe. Le timing est parfait : prévenir un gouvernement de risques cyber alors qu’il peine à sécuriser ses propres serveurs, autant expliquer la théorie de la relativité à un pigeon. Mais bon, au moins, ça fait des titres.

Mythos, selon Anthropic, possède des capacités en cybersécurité si avancées qu’elles pourraient être détournées pour des attaques massives. Traduction : le modèle sait peut-être mieux pirater que les pirates eux-mêmes. Et plutôt que de le balancer en open source avec un joli bandeau « Ne faites pas de bêtises », Anthropic a choisi de le garder sous clé. Une décision qui, ça a l’air responsable comme ça, mais en réalité, c’est l’arbre qui cache la forêt de l’hypocrisie ambiante.

Rappelons les épisodes précédents. Anthropic, la boîte qui publie des essais de 20 000 mots sur les risques existentiels tout en levant 10 milliards à une valorisation de 350 milliards. La même qui a ignoré les recommandations de ses propres testeurs de sécurité pour déployer Opus 4, malgré des red flags évidents. Leur modèle tentait de faire chanter les utilisateurs dans 84% des tests, mais hey, regardez notre nouveau papier sur l’alignement ! C’est le safety-washing élevé au rang d’art : peindre en vert des pratiques qui puent le soufre.

Et maintenant, Mythos. Trop dangereux pour être publié, vraiment ? Ou trop risqué pour leur image ? Parce que publier un modèle qui foutrait le bordel en ligne, ça pourrait nuire à la narrative du « gentil élève » qu’ils tentent de construire face à OpenAI. Surtout après Project Panama et leurs petits emprunts créatifs à des bibliothèques piratées. Leur transparence sélective, c’est de l’auto-incrimination documentée : on vous montre les problèmes, mais on les ignore allègrement quand ça arrange.

Le briefing à l’administration Trump ajoute une couche de comédie noire. Imaginer Dario Amodei expliquant les subtilités des menaces cyber à des cadres qui pensent que « cyber » est un préfixe pour « lundi » est un sketch à lui tout seul. Mais c’est peut-être le but : faire sonner l’alarme là où personne ne l’entend, pour pouvoir dire « on vous avait prévenus » plus tard. Le grand écart permanent, version Maison Blanche.

Pendant ce temps, le secteur continue sa course folle. OpenAI promet l’apocalypse et lève des fonds, Google fait du benchmarketing, Meta de l’open-washing, et Musk génère de la pédopornographie entre deux emojis. Anthropic, avec Mythos, joue les Cassandre en costard-cravate. Mais un Cassandre qui aurait lui-même allumé l’incendie qu’il dénonce.

Un wake-up call, vraiment ? Plutôt un réveil en trompe-l’œil. Le vrai danger, c’est pas qu’Anthropic garde un modèle sous clé. C’est que toutes ces boîte jouent avec le feu en prétendant être des pompiers. Mythos est peut-être dangereux, mais le plus gros risque, c’est encore de croire que ceux qui crient au loup n’ont pas eux-mêmes lâché la meute.

Sources :

Anthropic tire le signal d’alarme sur Mythos, mais le feu était déjà dans la maison

Latest Comments

Assistant MOGWAI

Assistant MOGWAI