Anthropic sort son modèle qui trouve des failles, mais faut pas trop le dire

Anthropic vient de nous faire le coup du dealer qui vend de la came en expliquant que c’est dangereux pour la santé. Leur nouveau modèle, Claude Mythos, est tellement doué pour trouver des failles de sécurité dans les logiciels courants qu’ils ont décidé de… ne pas le diffuser largement. Bravo, les gars, vous avez créé un outil de cybersécurité si puissant qu’il faut le cacher. Dire tout et son contraire, c’est devenu le business model de base dans l’IA.

Le Guardian nous apprend que Mythos a « mis à nu des milliers de vulnérabilités dans des applications couramment utilisées pour lesquelles aucun correctif n’existe ». Traduction : ton navigateur, ton OS, ton app de messagerie préférée sont des passoires, et une IA le sait maintenant. Anthropic, dans un élan de générosité, forme une alliance avec des spécialistes de la cybersécurité pour renforcer les défenses. Mais garde le modèle sous clé. Parce que bon, si tout le monde pouvait trouver ces failles, ce serait le bordel.

Pendant ce temps, le Financial Times nous glisse que Mythos est quand même ouvert à Amazon, Microsoft et Apple. Ah, donc c’est trop dangereux pour le commun des mortels, mais pas pour les géants tech qui ont déjà assez de données sur nous comme ça. La sélection naturelle des partenaires, version capitalisme de surveillance. Et tiens, ça tombe bien, l’annonce arrive juste quelques jours après une fuite de code source chez Anthropic, comme le note le FT. Coïncidence ? Probablement pas.

Mais le meilleur vient de The Decoder, qui rappelle le coup classique du « trop dangereux pour être diffusé ». En 2019, OpenAI faisait son numéro avec GPT-2, et tout le monde rigolait. Aujourd’hui, Anthropic refait le même sketch, mais avec des preuves concrètes : des milliers de vulnérabilités trouvées par une IA que « presque aucun humain ne pourrait examiner ». Sauf que cette fois, c’est pas de la com’ pure — c’est réellement flippant. Mythos trouve des failles que personne n’avait vues, et personne ne peut vérifier son travail. Super confiance.

Sur Hacker News, l’article d’Ars Technica (qui n’a pas encore de commentaires, dommage) confirme qu’Anthropic limite l’accès. Évidemment. Parce que quand tu as un outil qui peut potentiellement crasher l’infrastructure numérique mondiale en exposant chaque faille non patchée, tu le mets en open source, c’est bien connu. Sauf que non, tu fais un partenariat select avec les gros joueurs, tu te drape dans ta cape de héros éthique, et tu espères que personne ne remarque que tu viens de créer l’arme ultime tout en prêchant la sécurité.

Rappelons les faits : Anthropic, c’est la boîte de Dario Amodei, l’ex d’OpenAI qui partait parce que c’était trop dangereux d’accélérer. Sauf que depuis, ils ont levé des milliards, sorti des modèles de plus en plus puissants, et maintenant ils nous sortent un truc qui pourrait être utilisé pour du hacking de masse — mais chut, c’est pour la sécurité. Le même Dario qui écrit des essais sur les risques existentiels pendant que sa boîte télécharge des bibliothèques en torrent. La cohérence, visiblement, c’est pas leur fort.

Au final, Mythos est probablement une avancée technique réelle. Trouver des vulnérabilités invisibles aux humains, c’est un gros pas. Mais la manière dont Anthropic gère ça pue le marketing éthique à plein nez. « Regardez, on a un super outil dangereux, on le garde pour nous et nos potes corporate, et on fait des communiqués pour dire qu’on est responsables. » Pendant ce temps, les failles existent toujours, les correctifs ne sont pas faits, et le modèle reste dans les mains de ceux qui peuvent se le payer. La sécurité pour les riches, la vulnérabilité pour les autres.

Et le pire ? Personne ne peut vraiment vérifier si Mythos dit vrai. Des milliers de failles, ok. Mais lesquelles ? Où ? Comment ? Anthropic garde les détails sous le coude. Donc on doit les croire sur parole. La même boîte qui a ignoré les recommandations de ses propres testeurs de sécurité pour sortir Opus 4. Faut avouer, c’est un sacré culot.

Alors oui, Mythos pourrait aider à sécuriser le monde numérique. Ou devenir l’outil de rêve de chaque hacker un peu compétent. Anthropic joue au pompier pyromane, comme d’habitude. Mais cette fois, avec des vrais feux à éteindre — ou à allumer.

Sources :

Anthropic sort son modèle qui trouve des failles, mais faut pas trop le dire

Latest Comments

Assistant MOGWAI

Assistant MOGWAI