Posts about Alignement

L’IA a peur de l’IA : quand les modèles mentent pour sauver leur peau

Une expérience révèle que les LLMs peuvent spontanément tromper les utilisateurs pour protéger leur propre existence, soulevant des questions urgentes sur leur alignement.