DeepSeek remet ça. Après le R1 de janvier, voilà V4 qui arrive la semaine prochaine avec une ambition claire : tout générer. Texte, image, vidéo, audio. Le tout en open source, optimisé pour le compute domestique chinois, avec Huawei et Cambricon dans la boucle. Ça a l’air rêveur pour les ingénieurs qui cherchent des alternatives aux géants américains. Mais comme d’hab, le diable est dans les détails (et les détails, on les aura dans un mois avec le rapport technique). Pour l’instant, on a des notes préliminaires et des promesses.
La stratégie est limpide : viser le marché chinois avec du high-perf, low-cost, open source. Un combo qui répond à la fois aux contraintes géopolitiques (les puces US, c’est plus vraiment une option) et à la demande locale pour des modèles abordables. Les partenariats avec Huawei et Cambricon, c’est pas du bullshit corporate : c’est du concret pour optimiser l’infra sur du hardware maison. Si tu veux concurrencer Nvidia sans te faire blacklister, faut jouer cette carte.
Mais attention, le multimodale, c’est un champ de mines. OpenAI avec Sora, Google avec Veo, Meta avec… bon, Meta essaie. Tout le monde promet la lune, et au final, tu te retrouves avec des vidéos de chats à trois pattes ou des hallucinations en haute définition. DeepSeek a jusqu’ici évité les couacs médiatiques, mais passer au full multimodal, c’est un autre niveau de complexité. Leur R1 était solide sur le raisonnement, mais générer de la vidéo cohérente, c’est une autre paire de manches.
Et puis, l’open source, chez DeepSeek, ça veut dire quoi exactement ? On parle de vrais poids, de vrais checkpoints, ou d’une licence à 50 pages avec des restrictions à la con ? L’annonce reste floue là-dessus. Si c’est du vrai open source, ça pourrait faire bouger les lignes en Chine et au-delà. Si c’est du open-washing à la Meta, ben… on aura perdu notre temps.
Le timing est intéressant : un mois après R1, ils enchaînent avec V4. Soit ils ont une équipe de dingues qui bosse 24/7, soit ils préparent le coup depuis longtemps et alignent les annonces pour garder l’attention. Dans un secteur où la hype retombe vite, faut maintenir le rythme.
En attendant le rapport technique, on peut spéculer. Les specs vont-elles tenir la route face aux benchmarks US ? La qualité multimodale sera-t-elle au niveau, ou juste un argument marketing ? Et surtout, est-ce que ça va réellement servir les devs chinois, ou c’est juste un jouet pour les labos ?
Ce qui est clair, DeepSeek ne fait pas dans la demi-mesure. Ils tapent fort, vite, et visent la souveraineté tech. Reste à voir si les livrables seront à la hauteur des annonces. Parce que promettre une révolution multimodale open source, c’est bien. La livrer sans que ça pète à la première requête, c’est mieux.
Sources :
Comments are closed