Non, la guerre des prix dans l’IA n’est pas finie. DeepSeek vient de lâcher V4, et c’est un coup de tondeuse sur le marché.
Le lab chinois a dévoilé deux modèles open-weight sous licence MIT : V4-Pro (1,6 billion de paramètres, 49 milliards d’actifs) et V4-Flash (284 milliards de paramètres, 13 milliards d’actifs). Le premier devient le plus gros modèle open-weight jamais publié, dépassant le Kimi K2.6 de Moonshot AI et le GLM-5.1. Les deux supportent un contexte d’un million de tokens. De quoi balancer tout le code de ta startup dans un seul prompt sans transpirer.
L’innovation qui tue : l’architecture hybride.
DeepSeek a repensé son attention mechanism. Résultat : V4-Pro ne consomme que 27 % des FLOPs et 10 % du cache KV de V3.2 pour un contexte d’un million de tokens. V4-Flash descend à 10 % des FLOPs et 7 % du cache KV. Moins de compute, c’est moins de coût, et ça se ressent direct sur la facture.
Pricing : la douche froide pour les américains.
| Modèle | Input ($/M tokens) | Output ($/M tokens) |
|---|---|---|
| DeepSeek V4 Flash | 0,14 | 0,28 |
| DeepSeek V4 Pro | 1,74 | 3,48 |
| GPT-5.4 | 2,50 | 15,00 |
| GPT-5.5 | 5,00 | 30,00 |
| Claude Sonnet 4.6 | 3,00 | 15,00 |
| Claude Opus 4.7 | 5,00 | 25,00 |
V4-Flash coûte 10 à 20 fois moins cher que GPT-5.5 et Claude Opus 4.7. V4-Pro, même tarif défiant toute concurrence. Pendant que les géants américains augmentent leurs prix et plafonnent les usages pour cause d’IA agentique trop gourmande, DeepSeek arrive avec un modèle « good enough » pour trois fois rien. Et il est open-weight, en plus.
Performances : talonner, pas dépasser.
DeepSeek assume un retard de 3 à 6 mois sur les modèles de frontière comme GPT-5.4 et Gemini 3.1 Pro, surtout en connaissances générales. Mais en raisonnement et en code, c’est une autre histoire. Sur les benchmarks de compétition de code, V4 est « comparable à GPT-5.4 ». Et sur le benchmark GDPval-AA, V4-Pro mène tous les modèles open-weight avec 1 554 Elo, devant GLM-5.1 (1 535) et Kimi K2.6 (1 484). Bref, pour 90 % des usages, t’auras du mal à sentir la différence. Sauf sur ta facture.
Entraînement : le flou artistique.
DeepSeek révèle peu sur les données : 32 à 33 billions de tokens, avec un accent sur le multilinguisme, les papiers scientifiques et les données agentiques. Pas de noms de datasets, pas de licenses. Les soupçons de distillation à partir de GPT ou Claude ne sont pas confirmés dans le paper, mais le lab admet utiliser la distillation en post-training : une dizaine de modèles spécialisés internes (maths, code, agents) sont entraînés, puis un modèle unique apprend de tous. Malin, mais pas complètement transparent.
Matos : compatible Huawei, pour faire taire les critiques.
DeepSeek précise que l’architecture a été validée sur GPU Nvidia et NPU Huawei Ascend. Un signal fort : la Chine peut faire tourner des modèles de cette taille sans les puces américaines les plus récentes. Ça va donner des sueurs froides à Washington, qui accuse déjà DeepSeek de vol de propriété intellectuelle et d’utilisation de puces Nvidia interdites.
Impact boursier : les concurrents trinquent.
À Hong Kong, les actions de Zhipu et MiniMax ont chuté de 6,3 % et 3,9 % après l’annonce. Les investisseurs parient que DeepSeek va bouffer des parts de marché avec ses prix cassés. Et c’est sans doute juste.
Conclusion : le cauchemar des labos américains
DeepSeek n’a pas besoin d’être le meilleur pour gagner. Il lui suffit d’être « assez bon » et 20 fois moins cher. En open-weight. Avec un contexte d’un million de tokens. Pendant que Sam Altman lève 10 milliards pour accélérer et qu’Anthropic publie des essais sur la fin du monde, DeepSeek livre un produit concret, utilisable, et qui met une pression de ouf sur tout le monde.
Et toi, t’utilises encore GPT-5.5 à 30 $ le million de tokens ? Fais les comptes.
Sources :
Comments are closed