Tencent Cloud aligne ses prix sur ceux de DeepSeek, avec des réductions allant jusqu'à 97.5% sur certains modèles. La guerre des prix de l'inférence IA s'intensifie.
Jensen Huang a annoncé le Groq 3 LPU, la première puce Nvidia dédiée à l'inférence, validant une course au silicium que des startups menaient depuis des années sans vraiment convaincre.