La startup française Mistral lance Voxtral, un modèle de synthèse vocale open source capable de cloner une voix en trois secondes d'audio et de parler neuf langues, pour taper directement dans le marché des assistants vocaux et de la génération de voix.
Alibaba lance Fun-CineForge, un modèle de doublage open source qui promet de synchroniser parfaitement la voix et les lèvres, avec des émotions et de la cohérence multi-rôle, pour automatiser l'industrie du film.