Posts about Inférence IA

Tencent Cloud brade DeepSeek-V4 jusqu’à 97.5% et met les concurrents au régime sec

Tencent Cloud aligne ses prix sur ceux de DeepSeek, avec des réductions allant jusqu'à 97.5% sur certains modèles. La guerre des prix de l'inférence IA s'intensifie.

Nvidia décroche enfin la médaille de l’inférence avec Groq 3

Jensen Huang a annoncé le Groq 3 LPU, la première puce Nvidia dédiée à l'inférence, validant une course au silicium que des startups menaient depuis des années sans vraiment convaincre.