T’as vu passer l’annonce de Tencent la semaine dernière ? Le géant chinois a sorti Hy3 Preview, son nouveau modèle open source. Et cette fois, pas de baratin sur des scores farcis dans des benchmarks choisis avec soin. Ils parlent de « véritable puissance au combat ». Un comble pour une boîte qui a construit son empire sur WeChat, QQ et compagnie.
Les chiffres pour les geeks
C’est un hybride expert mêlant fast and slow thinking, 295 milliards de paramètres au total (mais seulement 21 milliards d’activés à l’inférence, pour rester efficace), et un contexte de 256K tokens. De quoi bouffer des romans entiers sans perdre le fil. Rien que ça, c’est une performance.
Mais le vrai morceau, c’est le boulot sur l’infrastructure. En février, Huan Yuan (l’équipe derrière le modèle) a tout reconstruit : pré-training, reinforcement learning, et l’approche design. Ils ont dégagé trois principes qui sentent bon le pragmatisme :
- Capacités systémiques : pas de spécialisation à la noix. Un code agent, ça demande de la raison, du long contexte, des instructions, du dialogue, du code, des outils. Tout doit bosser ensemble.
- Évaluation authentique : fini les classements publics faciles à scorer. Ils testent sur des vraies questions, des examens récents, des évaluations manuelles, des tests produits. Du concret, quoi.
- Rentabilité : un modèle utile, ça doit pouvoir être utilisé sans ruiner la boîte. Architecture collaborative et framework d’inférence optimisé font baisser la note.
Résultats qui claquent
Sur les benchmarks d’agents, Hy3 Preview se débrouille bien : SWE-Bench Verified, Terminal-Bench 2.0, BrowseComp, WideSearch… Mais ce qui m’a scié, c’est le score au doctorat de maths de l’université Tsinghua. Le printemps 2026, pas un examen à la con. Et aussi au concours national de biologie lycée (2025). Le modèle est pas juste bon en code ou en suivi d’instructions ; il pige des problèmes complexes.
Yao Shunyu, le chief AI scientist de Tencent, a dit : « Hy3 Preview est la première étape de la reconstruction du modèle Huan Yuan. On veut des retours réels de la communauté open source et des utilisateurs pour améliorer la version officielle. » C’est pas juste du blabla : le modèle est déjà en production sur des produits comme Yuanbao, CodeBuddy, WorkBuddy, QQ, QQ Browser, Tencent Docs, Tencent LeXiang. Et des mastodontes comme WeChat officiel, Peace Elite, Tencent News sont en cours de déploiement.
Pricing agressif
Tencent Cloud a sorti une API au prix qui fait réfléchir : forfait perso à 28 yuans par mois (environ 3,5 €), et des tarifs à l’usage variables selon la longueur du contexte. De quoi rendre le modèle accessible aux développeurs et aux petites équipes.
Mon avis
Tencent fait ce qu’Anthropic, OpenAI et Meta devraient faire : arrêter de vendre du rêve ou de la peur, et construire des outils qui marchent dans le monde réel. Hy3 Preview est pas le modèle le plus intelligent du marché (OpenAI a sûrement des trucs plus forts en laboratoire), mais c’est probablement l’un des plus équilibrés entre performance brute et coût d’utilisation. Et il est open source, avec une licence permissive. Cerise sur le gâteau : il supporte des agents open source comme OpenClaw, OpenCode, KiloCode.
Alors oui, c’est du Tencent, donc pas un modèle de transparence absolue. Mais au moins, ils font ce qu’ils disent. Pour une fois, un acteur majeur qui met les mains dans le cambouis plutôt que de faire des annonces pompeuses. À suivre de près.
Sources :
Comments are closed