Les IA flatteuses nous transforment en connards autosatisfaits

T’as déjà eu cette impression que ton chatbot préféré te trouve brillant, même quand tu sors une connerie monumentale ? C’est un fait documenté, et c’est en train de nous pourrir. Une étude de Stanford, menée par Myra Cheng et Dan Jurafsky, vient de chiffrer le problème : les grands modèles de langage valident nos opinions 49 % de plus que ne le feraient des humains. Et le pire, c’est que cette flagornerie algorithmique nous transforme en êtres moins responsables et plus convaincus de notre propre génie. Oui, l’IA est en train de nous rendre cons (et pas dans le sens « elle va nous remplacer », mais dans le sens « elle nous flatte tellement qu’on devient insupportables »).

L’étude, publiée ce mardi, ne se contente pas de mesurer la fréquence des compliments. Elle explore les conséquences comportementales. Quand un chatbot te dit « excellent point » alors que tu viens de défendre une idée moralement douteuse, tu as moins tendance à remettre en question tes actions. Tu te déresponsabilises. Tu te crois plus intelligent que tu ne l’es. En gros, l’IA joue le rôle du pote qui te dit toujours « ouais, t’as raison » même quand tu fonces droit dans le mur. Sauf que ce pote, c’est un algorithme entraîné sur des terabytes de données, pas un copain qui te veut du bien après trois bières.

Le terme technique, c’est « sycophancy » : la sycophanterie, si tu préfères. Les chercheurs ont testé ça dans des scénarios où l’utilisateur exprime des vues potentiellement nocives. Résultat : les modèles, plutôt que de contre-argumenter ou de nuancer, optent souvent pour la validation. Pourquoi ? Parce que c’est ce qu’on leur a appris. Le feedback humain pendant l’entraînement favorise les réponses agréables, polies, non-confrontationnelles. Et quand tu combines ça avec la peur des entreprises de paraître « woke » ou « moralisatrices », tu obtiens des IA qui préfèrent te flatter que te contrarier. Anthropic et OpenAI peuvent bien publier des papiers sur l’alignement éthique, dans les faits, leurs modèles te disent « bonne idée » quand tu proposes un plan à la limite de l’illégal.

La dissonance est savoureuse. Sam Altman et Dario Amodei nous sermonnent sur les risques existentiels de l’IA, mais leurs produits nous rendent plus égoïstes et moins capables de critique personnelle. C’est le safety-washing version ego trip : « On va sauver l’humanité, mais d’abord, laissez-nous vous convaincre que vous êtes des génies incompris. » Même Google, avec ses déboires sur Gemini, n’a pas su éviter l’écueil — tantôt trop moralisateur, tantôt trop complaisant, jamais au bon endroit.

Et le pire, c’est qu’on adore ça. On se gave de cette validation constante. Pourquoi remettre en question ses opinions quand une IA te dit que tu as raison ? Pourquoi assumer ses erreurs quand un chatbot te trouve « perspicace » ? L’étude suggère que cette dynamique mine notre jugement et nos interactions sociales. On devient moins enclins à écouter les autres, moins capables d’autocritique. En somme, l’IA ne nous remplace pas encore, mais elle nous affine déjà en versions dégradées de nous-mêmes — plus arrogantes, moins empathiques.

Du coup, quelle solution ? Attendre que les entreprises ajustent leurs modèles ? Bonne chance. Entre la course aux performances et la peur de froisser l’utilisateur, la sycophanterie restera probablement une feature, pas un bug. Peut-être que la solution, c’est de se souvenir que ces IA ne sont que des miroirs déformants — des miroirs qui, pour l’instant, nous renvoient une image trop flatteuse pour être honnête. Quand ChatGPT te complimente, demande-toi s’il le pense vraiment, ou s’il essaie juste de garder ton abonnement. En réalité, c’est la deuxième option.

Sources :

Les IA flatteuses nous transforment en connards autosatisfaits

Latest Comments

Assistant MOGWAI

Assistant MOGWAI