Meta vient de lâcher quatre générations de puces IA custom, dédiées à l’inférence. Sur le papier, c’est un coup de maître : réduire la dépendance à Nvidia, contrôler les coûts, accélérer les déploiements. Dans les faits, c’est surtout un aveu : même le géant aux poches sans fond trouve que la facture GPU commence à piquer sévère.
Entre les milliards de requêtes quotidiennes sur Facebook, Instagram, WhatsApp et le reste de l’empire, Meta est devenu un aspirateur à GPU. Nvidia se frotte les mains, AMD essaie de suivre, et Zuck, lui, doit expliquer à ses actionnaires pourquoi ses data centers coûtent plus cher que le PIB d’un petit pays. Alors il fait ce que tout bon milliardaire fait quand il en a marre de payer : il fabrique son propre matos.
Ces quatre puces, c’est la réponse maison à un problème maison. L’inférence, c’est la partie où le modèle, déjà entraîné, répond à tes questions, génère ton fil, te suggère des amis. C’est moins gourmand que l’entraînement, mais à l’échelle de Meta, ça représente des montagnes de calcul. En customisant, ils promettent des gains d’efficacité, une latence réduite, et surtout, une facture moins salée.
Mais attention, le jeu n’est pas sans risque. Développer des puces, c’est long, cher, et techniquement chiant. Nvidia n’est pas leader par hasard : leurs GPU sont des bêtes de course, optimisés jusqu’à la moelle. Meta va devoir prouver que ses puces tiennent la route face à la concurrence, et surtout, qu’elles ne vont pas foirer au moment de scaler. Parce que si demain ton feed Instagram met 10 secondes à charger à cause d’une puce foireuse, les utilisateurs vont pas se gêner pour râler.
C’est aussi une question de timing. Le marché des puces IA est en ébullition, avec Google, Amazon, Microsoft qui ont déjà leurs propres solutions. Meta arrive un peu en retard à la fête, mais avec une arme de poids : son échelle. Des milliards d’utilisateurs, c’est à la fois un cauchemar logistique et un formidable terrain de test. Si leurs puces marchent ici, elles peuvent marcher partout.
Reste le vrai enjeu : l’indépendance. Meta veut contrôler sa stack de A à Z, des algorithmes au silicium. Moins de dépendance aux fournisseurs, plus de flexibilité pour innover (ou pour copier, soyons honnêtes). C’est un pari audacieux, mais nécessaire. Parce qu’à force de payer Nvidia, même Meta finirait par saigner.
Alors, révolution ou coup de com’ ? Pour l’instant, c’est surtout un gros pari. Si ça marche, Zuck devient un peu plus maître de son destin. Si ça foire, il aura juste gaspillé des milliards dans une usine à puces qui produit de la déception. Mais bon, avec les revenus publicitaires, il peut se le permettre. Pour nous, les utilisateurs, l’espoir c’est un feed plus rapide et moins de pannes. Le risque, c’est que Meta se plante et que tout ralentisse. Comme d’habitude, on verra bien.
Sources :
Comments are closed