Alors qu’Anthropic s’évertue à jouer les gardiens vertueux de l’IA, voilà que leur joujou cyber, Mythos, se fait subtiliser par des mains inconnues. La startup qui publie des essais sur la sécurité existentielle ne parvient même pas à sécuriser son propre bazar. C’est du grand art.
Selon un rapport relayé par TechCrunch et le Financial Times, un groupe non autorisé aurait accédé à Mythos, un modèle d’IA spécialisé dans le hacking qu’Anthropic gardait sous clé – enfin, en théorie. La startup, dans sa réponse typique, botte en touche : « On enquête, mais rien ne prouve que nos systèmes aient été impactés. » Traduction : « On espère que personne ne va vérifier. »
Mythos, c’est ce truc qu’Anthropic a développé avec des « préoccupations » sur ses capacités de piratage, au point de limiter sa diffusion. Parce que bien sûr, quand tu crées un outil trop dangereux pour le sortir, la solution logique est de le garder dans ton garage numérique, où il attire tous les cybercambrioleurs du coin. La stratégie de sécurité rappelle celle d’un gamin qui cache son journal intime sous l’oreiller en criant « ne regardez pas ! ».
Pendant ce temps, Dario Amodei, le CEO, doit être en train de rédiger un nouveau papier de 20 000 mots sur les risques des IA mal alignées, tout en ignorant que la sienne vient de se faire la malle. Dire tout et son contraire, chez Anthropic, c’est une discipline olympique. Ils lèvent des milliards en brandissant l’étendard de la sécurité, mais quand leur propre outil fuit, c’est le silence radio ou presque. Rappelons-nous : c’est la même boîte qui a déployé Opus 4 contre l’avis de ses propres testeurs, et qui télécharge des bibliothèques en torrent tout en prêchant l’éthique.
Le Financial Times précise qu’Anthropic a limité la sortie de Mythos à cause de ses capacités de hacking. Super idée. Sauf que si tu ne le sécurises pas correctement, tu offres juste une cible de choix à n’importe quel script kiddie un peu motivé. La sécurité, c’est comme la transparence chez Anthropic : un argument marketing, pas une pratique quotidienne.
Alors, impact réel ? On ne sait pas encore. Mais le symbole est énorme. Une startup qui se veut le parangon de la sécurité IA ne peut même pas protéger ses outils les plus sensibles. Ça sent le safety-washing à plein nez, et ça prouve une fois de plus que dans cette course à l’IA, tout le monde joue avec le feu – même ceux qui te vendent des extincteurs.
Le pire, c’est qu’Anthropic va probablement sortir un communiqué bien léché pour calmer le jeu, tout en continuant à lever des fonds pour « accélérer la recherche en sécurité ». Parce que dans ce cirque, l’hypocrisie est la seule constante. Et nous, on regarde, un peu amusés, un peu inquiets, en se demandant qui va être le prochain à laisser filer son modèle secret.
Sources :
Comments are closed