Alibaba Cloud vient de lâcher une petite bombe dans la cour des devs : à partir du 28 avril 2026, l’API de son kit de développement multimodal BaiLian sera plafonnée à 10 requêtes par seconde (QPS). Pour ceux qui ont l’habitude de bosser avec des API généreuses, c’est un peu comme passer d’un buffet à volonté à un régime à la cuillère. L’annonce, postée sur AIBase, nous explique doctement que c’est pour « optimiser la planification des ressources et assurer la stabilité du service ». Ou, traduit en français de dev : « On a trop de monde qui tire sur la bête, donc on rationne. »
La communication est un modèle du genre corporate : on parle d' »ajustement significatif » et d' »optimisation », mais derrière, c’est une restriction pure et simple. Le nouveau plafond, c’est 10 QPS en default rate limit, avec en bonus 600 nouvelles sessions par minute et 36 000 par heure. Alibaba assure que ça suffira pour « la plupart des tests de développement et des besoins quotidiens ». Mouais. Si t’es une startup qui veut scaler un produit basé sur BaiLian, bonne chance pour tenir avec ça. C’est le genre de décision qui pousse les devs à migrer vers d’autres plateformes ou à coder leurs propres contournements.
Ce qui est marrant, c’est que personne ne parle du vrai problème : est-ce que BaiLian galère à suivre la demande ? Est-ce qu’Alibaba Cloud a sous-estimé les coûts d’infrastructure pour un service multimodal ? Ou est-ce juste une façon déguisée de pousser les gros clients vers des contrats enterprise plus chers ? Dans le monde des clouds, quand on serre la vis sur le rate limiting gratuit, c’est rarement par altruisme.
Et puis, soyons francs : 10 QPS, en 2026, pour un service qui prétend rivaliser avec les GPT et les Gemini, c’est un peu light. Surtout pour du multimodal, où chaque requête peut engloutir des ressources monstrueuses. Si c’est pour assurer la stabilité, pourquoi ne pas avoir augmenté les capacités en parallèle ? Parce que, devine quoi, optimiser, ça coûte des sous. Et Alibaba, comme tous les géants du cloud, préfère limiter l’accès que de cracher au bassinet.
Alors, les devs, préparez vos scripts de retry et vos files d’attente. Ou, mieux, regardez du côté de l’open source : au moins, avec Llama ou Mistral, tu peux monter en charge sans demander la permission à un bureaucrate du cloud. Parce que, finalement, cette annonce nous rappelle une vérité basique : quand tu dépends d’une API propriétaire, tu es à la merci d’un tweet corporate. Et aujourd’hui, c’est BaiLian qui prend, demain, ce sera qui ?
Sources :
Comments are closed