Le pire mot à la mode de l’année n’est peut-être pas « agentic », mais « tokenmaxxing ». Ce néologisme degueulasse, inventé par Uber ou son cabinet conseil préféré, décrit une tendance aussi irrésistible que débile : utiliser des modèles de langage génératifs (LLM) coûteux pour des tâches de la vie quotidienne qui n’en ont pas besoin.
Imagine un commercial chez Uber qui, avant de traverser la rue, demande à Claude Code combien de chances il a de se faire écraser. C’est ça, le tokenmaxxing. Utiliser un lance-flammes nucléaire pour allumer une clope. Et le problème, c’est que ça vide le budget IA à une vitesse record.
Au point qu’Uber, selon son président Andrew Macdonald dans une interview à Rapid Report, a littéralement cramé tout son budget IA annuel en seulement quatre mois. Résultat : l’entreprise se demande maintenant si les tokens engloutis par les équipes, notamment via Claude Code, débouchent sur une quelconque valeur ajoutée. Pour l’instant, la corrélation est aussi solide qu’une promesse d’Elon Musk.
Uber n’est pas le seul à faire la gueule. Duolingo, l’appli de langues, a annoncé qu’elle allait désormais mesurer l’impact réel de ses fonctionnalités IA plutôt que de se contenter de compter les tokens consommés. Le marché réalise que plus de tokens ne veut pas dire plus de résultats, mais juste plus de factures.
Résultat des courses : les géants de la tech qui s’étaient rués sur l’IA comme des mineurs sur une pépite commencent à faire les comptes. Le mythe du « tout IA, tout le temps » se heurte au mur de la réalité : les LLM coûtent cher, et pour beaucoup de tâches, un bon vieux script bien optimisé ou un petit modèle spécialisé fait le job pour cent fois moins cher.
Tokenmaxxing, donc. Le mot qui va te sortir par les yeux cette année. Mais qui a le mérite de poser LA question qui fâche : est-ce que ton obsession pour l’IA a un sens, ou est-ce que tu es juste en train de cramer du token pour te donner l’impression d’être à la pointe ?
Comments are closed