Posts about Fiabilité

Les IA juges sont des coups de dés maquillés en science exacte

Une étude publiée sur ArXiv révèle que les systèmes LLM-as-judge, utilisés massivement pour évaluer automatiquement les IA, sont en réalité d'une incohérence crasse, avec des violations de transitivité qui rendent leurs verdicts aussi fiables qu'une pièce truquée.

Les AI Overview de Google font juste 10% d’erreurs, tranquille

Une étude révèle que les réponses IA de Google sont correctes neuf fois sur dix, mais avec un volume de recherche astronomique, ces 10% d'erreur génèrent des millions de fausses infos par heure.

Les promesses de l’IA dans les marchés et la santé, ou comment se faire des illusions avec des courbes

Les outils d'IA pour prédire les devises et les essais cliniques ont le vent en poupe, mais entre la théorie des benchmarks et la réalité du terrain, c'est souvent le grand écart.

Wikipedia tire la chasse sur le contenu IA, et c’est une bonne nouvelle

Wikipedia interdit officiellement l'utilisation des grands modèles de langage pour générer ou réécrire des articles, une décolution saluée par les contributeurs qui préfèrent la rigueur humaine au bullshit algorithmique.

Claude tousse, Dario rédige un essai sur la fiabilité des serveurs

Anthropic, le champion de la sécurité existentielle, a du mal à maintenir son service en ligne ce lundi, laissant les utilisateurs dans le noir pendant des heures.

Le purgatoire des agents IA, ou quand l’autonomie dépasse la confiance

Les entreprises découvrent que les projets d'agents IA échouent moins à cause de la technologie que parce qu'ils reproduisent les erreurs de gouvernance des mainframes.

Les agents IA, une promesse qui coûte plus cher qu’elle ne rapporte

Les agents IA, censés automatiser nos vies, se révèlent être des gouffres financiers et techniques, avec des coûts d'exécution qui explosent et une fiabilité en berne.