Sarvam AI parle indien, mais le pari est plus personnel que politique

Alors que l’Inde organise son sommet AI Impact et que tout le monde s’attendait à du vent chaud, Sarvam AI a dégainé. Deux grands modèles linguistiques, construits from scratch, pour parler hindi, tamoul, bengali et une trentaine d’autres langues locales. Pas un finetuning de Llama ou de Mistral, non : du vrai travail d’orfèvre, calibré pour les connexions 2G et les smartphones à 100 dollars. Le ‘Make in India’ version IA, en somme.

Mais si tu penses que c’est juste un exercice de souveraineté numérique pour faire plaisir à New Delhi, détrompe-toi. Sarvam, c’est l’histoire d’une startup qui a compris une chose simple : les 1,4 milliard d’Indiens, ils s’en foutent de ChatGPT qui écrit des sonnets en anglais. Ils veulent une IA qui comprend leur accent, leur dialecte, et qui ne plante pas quand la connexion fait des siennes.

Leur vrai pari, c’est de sauter l’étape ‘copier l’Occident’. Pendant qu’OpenAI et Google se battent pour savoir qui a le meilleur benchmark en anglais, Sarvam bosse sur la compréhension contextuelle du hindi des rues, sur la génération de voix qui sonne comme ta tante du Rajasthan, et sur des modèles qui tiennent dans 2 Go de RAM. C’est du low-tech de luxe, et c’est brillant.

Évidemment, le timing est impeccable. Le gouvernement indien pousse depuis des mois sur sa stratégie ‘AI for All’, avec une liste de 12 modèles indigènes à développer. Sarvam fait partie du club, et leur annonce au sommet tombe à pic. Mais regarde les détails : leurs solutions promettent d’écouter, comprendre, répondre et capturer le quotidien des utilisateurs. Traduction : ils visent l’assistant vocal qui gère tes courses, ton compte bancaire et tes rendez-vous médicaux, le tout en tamoul ou en marathi.

Est-ce que ça va marcher ? C’est le million de roupies question. D’un côté, l’Inde a un vivier de talents techniques monstrueux, des données linguistiques à tire-larigot, et une population prête à sauter sur n’importe quel outil qui simplifie la vie. De l’autre, construire des LLMs from scratch, c’est un gouffre à calcul et à cash. Et la concurrence, elle ne dort pas : Google travaille déjà sur le hindi pour Gemini, et Meta ‘libère’ des modèles multilingues qui, sur le papier, pourraient faire le taf.

Mais Sarvam joue la carte de l’intimité culturelle. Leur IA ne sera pas juste une traduction approximative de GPT-4, mais un truc pensé pour les réalités locales : les marchés informels, la bureaucratie kafkaïenne, les dialectes qui changent tous les 50 kilomètres. C’est un pari audacieux, presque romantique : croire que la qualité prime sur la quantité, et que l’hyperlocal peut battre le global.

Reste à voir si les investisseurs suivront. Parce que développer des modèles pour des langues sous-représentées, c’est noble, mais ça rapporte moins vite qu’un chatbot corporate en anglais. Sarvam devra prouver que son approche n’est pas qu’un coup de com’ pour grappiller des subventions gouvernementales, mais un vrai business model. Et ça, c’est une autre paire de manches.

En attendant, leur annonce envoie un message clair aux géants américains : l’IA de demain ne se fera pas uniquement en anglais, et ceux qui ignorent les dialectes risquent de se retrouver à la traîne. Un peu comme si Netflix décidait de ne proposer que des films hollywoodiens en Inde. Bonne chance.


Sources :

Categories

Comments are closed

Latest Comments

Aucun commentaire à afficher.