Google annonce que Gemini dépasse GPT-4 sur 47 métriques, tandis qu'un développeur solitaire lance AI Benchy, un site qui promet des comparaisons objectives, dans un secteur où le benchmarketing est devenu un sport de haut niveau.
Une nouvelle étude propose une méthode pour entraîner des modèles d'optimisation avec des données de merde, révélant au passage que l'IA expose les failles des systèmes hérités comme jamais.