Chatbots médicaux, le diagnostic est sévère

Tu pensais que ton chatbot IA allait remplacer ton médecin traitant ? Reprends-toi. Une étude fraîchement publiée dégoupille une réalité moins glamour : les modèles stars comme ceux d’OpenAI et DeepSeek font des erreurs de diagnostic dans plus de 80% des cas précoces, quand les données médicales sont parcellaires. Leur problème ? Ils jugent trop vite, comme un étudiant en médecine qui passerait l’examen après avoir juste lu le résumé du cours.

Les sources pointent vers un article du Financial Times qui a fait le buzz sur Hacker News. L’info est simple, brutale, et devrait calmer les ardeurs de ceux qui voient déjà l’IA débarquer en blouse blanche. OpenAI et DeepSeek, deux poids lourds souvent encensés pour leurs performances, sont ici mis en lumière pour leur précipitation. Quand les symptômes sont vagues ou les antécédents incomplets, l’IA saute aux conclusions avec une confiance démesurée. C’est le syndrome du « premier résultat Google » appliqué à la santé : une réponse rapide, parfois plausible, souvent fausse, et potentiellement dangereuse.

La discussion sur Hacker News, avec seulement 2 points et 1 commentaire au moment où j’écris, montre peut-être une lassitude face à ces annonces. On en est au stade où chaque nouvelle étude sur les limites de l’IA médicale ressemble à une redite. Mais celle-ci tape juste : 80% d’erreurs, c’est pas une marge d’erreur, c’est un échec cuisant. Ça rappelle que les modèles génératifs, aussi impressionnants soient-ils sur des tâves de rédaction ou de code, restent des outils statistiques, pas des cerveaux cliniques. Ils manquent de prudence, de recul, et surtout, de cette intuition qui pousse un médecin à poser une question de plus plutôt que de conclure.

Et pendant ce temps, Sam Altman et ses acolytes continuent de promettre des révolutions dans tous les domaines, y compris la santé. Cette étude, c’est une douche froide bienvenue. Elle rappelle que entre la démo tape-à-l’œil et la réalité du terrain, y’a un fossé. Un fossé qui, dans le médical, se mesure en vies, pas en likes.

Alors, assistants, pas remplaçants ? Plus que jamais. Cette étude prouve que l’IA a encore du chemin avant de jouer au docteur. En attendant, garde ton rendez-vous chez le vrai médecin. Ton chatbot, lui, a encore besoin de réviser.


Sources :

Categories

Comments are closed

Latest Comments

Aucun commentaire à afficher.