Claude 4.7 sort en force, mais Cowork est une tanche pour les non-techniciens

Ben’s Bites revient sur la semaine dernière, et y’a du lourd côté Anthropic. D’abord, Opus 4.7 est là : meilleur en vision, plus efficace dans l’utilisation des tokens de raisonnement, et un nouveau niveau de réflexion « xhigh » qui se glisse entre « high » et « max ». L’auteur l’a utilisé tout le week-end sans souci, contrairement au drama Twitter qui hurlait à la régression. Bref, les pleureuses se calmeront.

Mais le vrai morceau, c’est le nouvel onglet Design dans Claude. Un canvas façon interface de design avec un chat sur le côté, qui pose 5 à 10 questions via un formulaire interactif avant de générer des wireframes ou des prototypes haute-fidélité. Le flux « image → design » est visiblement très bon en mode prototype. Attention aux limites : sur le plan à 20 €, on pourra probablement générer 2-3 gros designs par semaine max. C’est en aperçu de recherche, mais ça promet.

Côté Codex, l’agent d’Anthropic a aussi eu droit à des updates : Computer Use peut maintenant piloter des apps sur un Mac, en arrière-plan (donc l’ordinateur reste utilisable). L’auteur reste sceptique mais admet que c’est plus rapide que les démos précédentes. Une preview opt-in, Chronicle, utilise le contexte récent de l’écran pour construire des mémoires. Et une flopée de plugins arrivent, dont la génération d’image, pour faire de Codex le superapp.

Mais le vrai fail de la semaine, c’est Claude Cowork. L’assistant est « comically bad for the average jane » : les capacités sont cachées derrière des connecteurs et plugins que l’utilisateur normal ne trouvera jamais. Pas d’envoi d’email, pas d’installation de skill, pas d’info sur les connecteurs disponibles. Les Scheduled Tasks s’arrêtent quand on ferme le couvercle (contrairement aux Routines de Claude Code). Bref, si l’utilisateur n’est pas un power user, il ferme l’app en se disant que l’IA c’est de la merde. Et y’a du vrai là-dedans.

Le reste de l’actu : Factory AI valorisée 1,5 milliard après une levée de 150 M$, avec 50% de réduction sur Opus 4.7 jusqu’au 30 avril. Google AI Pro et Ultra marchent maintenant avec AI Studio, Julius (génération de slides), Galaxy Brain (OS basé sur fichiers locaux), Kimi 2.6 Code (clone de Claude Code), Moondream Lens (fine-tuning vision en quelques images), et un benchmark Zapier AutomationBench qui mesure le vrai travail des modèles : et pour l’instant, aucun ne dépasse 10%.

Côté people, trois leaders quittent OpenAI : Kevin Weil (CPO), Bill Peebles (Sora), et Srinivas Narayanan (CTO B2B Apps). Rien de dramatique, mais ça fait des vagues. Et Elad Gil note qu’OpenAI et Anthropic représentent chacun 0,1% du PIB américain et pourraient atteindre 1-2% cette année.

Bref, une semaine où Anthropic montre le meilleur (Design, Opus 4.7, Codex) et le pire (Cowork est une tanche UX). La leçon : une interface bien foutue pour les geeks, c’est bien. Mais si on veut toucher monsieur tout-le-monde, il ne faut pas lui demander de devenir sysadmin.

Categories

Comments are closed

Latest Comments

Aucun commentaire à afficher.