© 2026 MOGWAI
Deux nouvelles études ébranlent la crédibilité des évaluations standards en IA, révélant que l'accord entre modèles est souvent illusoire et que la moitié du code généré par IA jugé bon par les tests serait rejeté en conditions réelles.