Tu connais le principe de la fuite contrôlée ? C’est quand une boîte fait semblant de cacher un truc tout en sachant très bien qu’il va fuir. Anthropic vient de nous en offrir une masterclass. Claude Sonnet5, leur nouveau modèle de programmation baptisé Fennec, était censé sortir début février dans le plus grand des secrets. Sauf que quelqu’un a oublié de nettoyer les logs Google Cloud. Résultat : tout le monde sait maintenant que ce modèle est quasi prêt, qu’il promet des performances de fou à moitié prix, et qu’il utilise une approche « swarm » pour coder.
Le timing est parfait. On est le 3 février, la sortie est prévue pour ce mois-ci, et pouf, une « fuite » qui fait le buzz sur tous les fils d’actu. 14 000 vues en quelques heures. Le coup du lapin sorti du chapeau, sauf que le lapin, on l’avait déjà vu répéter dans les coulisses.
Anthropic, c’est la boîte qui publie des essais de 20 000 mots sur les risques existentiels tout en téléchargeant des discographies en torrent. Là, ils jouent les modestes : « Oh non, notre modèle a fuité, quelle malchance ». Pendant ce temps, leur service com’ doit se frotter les mains. Parce que bon, une fuite via des logs Google Cloud, c’est un peu comme laisser ton journal intime ouvert sur la table du café du commerce. Soit t’es incroyablement négligent, soit tu veux qu’on le lise.
Et parlons du modèle. Claude Sonnet5, alias Fennec. Un nom mignon pour un truc qui promet de « reshaper l’industrie ». La promesse : des performances supérieures aux modèles flagship, pour la moitié du prix. L’approche « swarm » est présentée comme innovante, mais soyons honnêtes, on en a entendu parler depuis des mois dans les labos. C’est juste qu’Anthropic est le premier à l’emballer pour le grand public.
Le vrai jeu ici, c’est la guerre des prix. OpenAI, Google, Meta, tous se battent sur le terrain de la performance pure. Anthropic sort la carte du « moins cher et presque aussi bon ». Stratégie intelligente, surtout quand tu veux grignoter des parts de marché sans avoir à aligner des milliards supplémentaires en compute.
Mais ne t’emballe pas trop. « Peut surpasser les modèles flagship », c’est la phrase magique de tous les communiqués de presse depuis 2023. La réalité, c’est qu’ils choisissent soigneusement les benchmarks où ils brillent, et ignorent ceux où ils ramassent. Le « swarm approach » pour adresser les défis du codage IA ? À voir en conditions réelles. Parce que pour l’instant, la plupart des agents de codage ont encore tendance à te générer du code qui plante ou à inventer des bibliothèques qui n’existent pas.
Anthropic essaie de se positionner en alternative sérieuse à GitHub Copilot et aux autres. Moins cher, plus intelligent, plus éthique (bien sûr). Sauf que leur historique de « safety-washing » laisse un goût amer. Combien de fois ont-ils ignoré les recommandations de leurs propres évaluateurs de sécurité pour sortir un modèle ? Combien de fois ont-ils publié un papier sur l’alignement tout en poussant des features borderline ?
Fennec pourrait être une vraie avancée. Ou juste une itération de plus, bien emballée. Dans un secteur où chaque annonce est présentée comme une révolution, un peu de scepticisme ne fait pas de mal. Surtout quand la « révolution » commence par une fuite bien pratique.
Et pendant ce temps, Dario Amodei doit être en train d’écrire un nouvel essai sur les risques de l’IA tout en surveillant les précommandes de Fennec. Le dealer qui vend sa came en t’expliquant pourquoi c’est dangereux. La dissonance cognitive, c’est devenu la marque de fabrique du secteur.
Alors oui, Fennec semble prometteur. Mais garde ton enthousiasme en laisse jusqu’à ce que tu puisses l’essayer toi-même. Parce que entre les logs qui fuient et les promesses qui volent, la réalité a souvent du mal à suivre.
Sources :
Comments are closed