SenseTime sort SenseNova-MARS, le nouvel agent autonome qui va tout changer (ou pas)

SenseTime, le géant chinois de l’IA, vient de lancer SenseNova-MARS, et si tu crois les communiqués, c’est rien de moins que le début d’une nouvelle ère. Un modèle multimodal « agentique » (leur terme, pas le mien) en versions 8B et 32B, open-source, qui combine raisonnement visuel dynamique et recherche image-texte pour, je cite, « simuler une logique de détective » et donner à l’IA des capacités de pensée et d’action indépendantes. Le premier VLM agentique, paraît-il. Et surprise : sur le benchmark MMSearch, il marque 74,2 points, battant même GPT-5.2. De quoi faire saliver les fanboys du secteur.

Mais avant de s’énerver pour télécharger les 32 milliards de paramètres, prends une grande inspiration. Parce que chez SenseTime, l’open-source, c’est comme les promesses électorales : ça sonne bien, mais faut vérifier les petites lignes. Leur précédent, SenseNova, était déjà présenté comme révolutionnaire, et pourtant, dans la vraie vie, il traînait souvent des pieds. Là, ils nous ressortent la même soupe avec une nouvelle étiquette « agentique », un mot qui fait tellement futuriste qu’on dirait un scénario de SF des années 90.

Ce qui est marrant, c’est ce score de 74,2 sur MMSearch. Super, bravo. Mais MMSearch, c’est leur benchmark maison, hein. C’est comme si je créais un concours de « meilleur pote IA » et me déclarais vainqueur. GPT-5.2, qu’ils disent avoir battu, est probablement testé dans des conditions qui arrangent SenseTime. Dans le monde réel, où les images sont floues, les prompts ambigus et les serveurs surchargés, je te parie un café que SenseNova-MARS va galérer comme un stagiaire un lundi matin. Le passage de la compréhension à l’exécution, c’est le Saint Graal de l’IA depuis des années, et chaque annonce prétend l’avoir trouvé. En réalité, non.

Et puis, parlons de l’« autonomie ». Un modèle qui « simule une logique de détective », ça fait rêver, mais en pratique, ça veut surtout dire qu’il peut enchaîner quelques étapes de raisonnement basiques avant de planter ou d’inventer des détails. L’IA autonome, aujourd’hui, c’est encore un mythe entretenu par des démos léchées et des communiqués enflammés. SenseTime n’est pas le premier à surfer sur cette vague, et probablement pas le dernier.

SenseNova-MARS est-il une avancée ? Sans doute. Ajouter du raisonnement visuel et de la recherche à un modèle multimodal, c’est techniquement intéressant. Mais est-ce que ça change la donne ? Non. C’est une itération de plus dans un secteur qui adore emballer des progrès incrémentaux en promesses révolutionnaires. SenseTime fait du bon boulot technique, mais leur marketing, lui, reste dans la surenchère habituelle.

Quand on te vendra « premier », « autonome » ou « bat GPT-5.2 » dans un titre, souviens-toi : l’IA avance par petits pas, pas par bonds quantiques. Et les bonds, souvent, c’est juste du vent.


Sources :

Categories

Comments are closed

Latest Comments

Aucun commentaire à afficher.