Alibaba Cloud annonce une baisse drastique du rate limiting de son API BaiLian, passant à 10 QPS, sous prétexte d'optimisation et de stabilité.
Amazon publie deux articles techniques sur Bedrock, et derrière les détails d'implémentation, on découvre que l'innovation est surtout dans la capacité à déployer des modèles multimodaux sans se casser la tête.