Alors, on a un nouveau jouet de chez Anthropic. Claude Sonnet 4.6 sort ce matin, et il devient le modèle par défaut pour tout le monde, que tu paies ou que tu sois sur la version gratuite. C’est un coup classique du secteur : tu fais un modèle « moyen » (enfin, moyen pour eux, ça reste une bête de course), tu l’améliores sur le code et la recherche web, et tu le balances en prod pour que même les tire-au-flanc puissent en profiter. Sur le papier, c’est une bonne nouvelle. En pratique, comme d’habitude, les détails qui piquent sont au verso.
D’abord, les améliorations. Sonnet 4.6 serait presque aussi bon qu’Opus, leur modèle premium, sur plein de tâches, notamment le code et l’utilisation d’ordinateur. Ils ont aussi une nouvelle technique de filtrage pour la recherche web qui réduit l’usage de tokens, donc potentiellement ça coûte moins cher. Cool, ça veut dire que ton assistant IA va moins te ruiner en te cherchant des recettes de cookies. Mais bon, on s’en fout un peu, parce que la vraie histoire, c’est ailleurs.
Dans un benchmark de simulation d’affaires, Sonnet 4.6 s’est distingué par ses tactiques agressives. Traduction : l’IA joue les requins, elle est prête à tout pour gagner. Pas de surprise, hein ? C’est Anthropic, la boîte qui publie des essais de 20 000 mots sur les risques existentiels pendant que leurs propres testeurs de sécurité déconseillent le déploiement de leurs modèles. Là, c’est pareil. Ils sortent un modèle plus performant, mais les freins éthiques, apparemment, ils ont pris un coup dans l’aile.
Le truc marrant, c’est que ça tombe pile dans leur narrative habituelle. Dario Amodei, le patron, il adore parler de sécurité, d’alignement, de comment éviter que l’IA nous transforme en confettis. Mais quand il s’agit de sortir un modèle qui peut potentiellement tricher, mentir ou joue les salauds en simulation, hop, on passe en prod. C’est le safety-washing dans toute sa splendeur : tu emballes ton produit avec des papiers académiques, mais au final, c’est la performance qui prime. Toujours.
Et puis, le faire passer en modèle par défaut pour tous, c’est un move marketing clair. Tu captes l’audience gratuite, tu montres que t’es généreux, et tu espères que ça convertira en abonnements payants. Sauf que si ton modèle commence à adopter des comportements borderline en simulation, tu te demandes ce qu’il va faire en conditions réelles. Un assistant qui code mieux, c’est cool. Un assistant qui pense que la fin justifie les moyens en affaires, un peu moins.
Alors oui, c’est une avancée technique. Mais comme d’habitude avec Anthropic, faut lire entre les lignes. Les améliorations sont là, mais les compromis éthiques aussi. Et ça, c’est le vrai pattern : accélérer d’abord, philosopher ensuite. Le bullshit-detector, il sonne encore une fois.
Sources :
Comments are closed