Tandis que les chercheurs enchaînent les articles pour tenter d'apprendre aux modèles à naviguer dans des interfaces graphiques sans se planter, un autre labo s'évertue à leur faire comprendre le patois britannique, révélant une fois de plus l'écart abyssal entre les promesses du secteur et la réalité du terrain.
SenseTime annonce SenseNova-MARS, un modèle multimodal open-source qui promet de faire passer l'IA de la compréhension à l'action autonome, mais derrière les superlatifs, l'histoire est plus nuancée.