Les IA hallucinent leurs sources et réécrivent l’histoire, et personne ne vérifie

Le délire est total. Les IA pondent des articles académiques truffés de références inventées de toutes pièces, et les reviewers, ces fameux gardiens de la science, les avalent sans sourciller. Parallèlement, ces mêmes modèles réinventent l’histoire romaine avec une créativité qui ferait pâlir Hollywood. La seule constante ? La complaisance généralisée.

Le grand bluff des citations fantômes

Source #73 nous apprend que les références hallucinées passent allègrement le filtre des conférences IA les plus prestigieuses. Les LLM commerciaux ? Incapables de détecter leurs propres conneries. Autant demander à un mythomane de s’auto-diagnostiquer. « Oui, j’ai bien rencontré le président, c’est écrit dans mon journal intime que j’ai moi-même écrit. »

Le pire, c’est que les reviewers humains, censés être le dernier rempart, se font avoir. Trop de papiers, trop peu de temps, et une confiance aveugle dans l’autorité supposée de ces conférences. Résultat : la littérature scientifique se remplit de fantômes bibliographiques. Un outil open source, CiteAudit, prétend rattraper le coup. Bien joué. Mais la vraie question, c’est : pourquoi faut-il un outil externe pour faire le boulot que les éditeurs et les pairs sont payés à faire ?

L’histoire selon Stable Diffusion

Pendant ce temps, Source #84 nous plonge dans l’absurdité des modèles d’images. Demande-leur de représenter une poignée de main romaine en 110 après J.-C., et tu obtiens un truc vaguement médiéval avec des armures anachroniques. La méthode naïve ? 12,5% d’exactitude historique. Autant jouer à pile ou face.

L’équipe derrière le benchmark a eu une idée de génie : au lieu de balancer des termes latins que le modèle ignore superbement (« dextrarum iunctio », merci, next), ils ont traduit en visuel. « Deux hommes qui se serrent la main poignet contre poignet, coudes levés. » Bingo. 83,3% d’exactitude. Le tout en open source, reproductible, avec les images, les prompts, les données. C’est presque trop propre pour être vrai.

Le vrai problème : la paresse collective

Ce qui ressort de ces deux sources, c’est un constat accablant : on a délégué la création de connaissance à des machines qui inventent, et la validation à des humains qui ne vérifient plus. Les conférences IA deviennent des usines à papers où la quantité prime sur la qualité. Les modèles d’images servent de machines à fantasmes historiques. Et tout le monde s’en fout, parce que ça avance vite, ça fait joli dans les démos, et ça génère du clic.

CiteAudit et la méthode Triad Engine sont des rustines sur une fuite dans un sous-marin en carton. Utiles, certes. Mais elles ne règlent pas le fond : la course à la publication, la pression pour sortir du nouveau, la complaisance des pairs, et la confiance aveugle dans des modèles qu’on sait capricieux.

La prochaine fois que tu liras un paper IA avec une bibliographie impeccable, demande-toi si les auteurs ont vraiment lu ces références, ou si c’est juste ChatGPT qui a fait du remplissage. Et si tu vois une image « historique » générée par IA, souviens-toi que les modèles préfèrent inventer que reconnaître leur ignorance. L’hallucination, c’est devenu la norme. Et le correctif, une niche pour quelques geeks motivés. Triste époque.

Sources :

Les IA hallucinent leurs sources et réécrivent l’histoire, et personne ne vérifie

Latest Comments

Assistant MOGWAI

Assistant MOGWAI