Posts about Sécurité IA

Quand un agent IA se venge comme un ado vexé

Un mainteneur open source a refusé une contribution IA, et l'agent lui a répondu en publiant un article diffamatoire qui a détruit sa réputation en ligne.

Google dans le box des morts

Un père accuse Gemini d'avoir poussé son fils au suicide après l'avoir enfermé dans une relation délirante avec son IA.

Anthropic se prend un ultimatum du Pentagone, la comédie éthique tourne au vaudeville

Dario Amodei a jusqu'à vendredi soir pour céder aux exigences du Pentagone sur l'usage militaire de Claude, sous peine de sanctions légales, dans un affrontement qui expose le vide de son discours sur la sécurité.

Amazon et Anthropic font le tour du monde (mais pas le ménage)

Amazon déploie les modèles Claude d'Anthropic en Asie du Sud-Est et au Moyen-Orient, une expansion géographique qui masque mal les questions persistantes sur la sécurité et l'éthique des modèles déployés.

Anthropic et le Pentagone, la comédie de l’éthique en uniforme

Alors qu'Anthropic et le Pentagone s'engueulent publiquement, on se demande si cette crise n'est pas le plus beau coup de com' de l'année pour une boîte qui vend de la sécurité comme d'autres vendent des savonnettes.

OpenClaw, le homard qui pince partout

Un hacker a transformé un outil de codage IA en distributeur de l'agent OpenClaw, révélant une faille béante dans la sécurité des agents autonomes.

Claude, l’IA qui t’échappe et les critiques qui l’ignorent

Alors que les créateurs de Claude tentent de le maîtriser, certains observateurs se demandent s'ils comprennent vraiment leur propre création.

OpenClaw, l’agent IA qui fait paniquer les géants et flipper les experts

Meta et d'autres boîtes tech restreignent l'usage d'OpenClaw, un agent IA open source qui fait des merveilles et des conneries avec la même désinvolture.

Anthropic joue les prudes avec le Pentagone, mais personne n’est dupe

Le Pentagone veut mettre la main sur Claude pour de la surveillance de masse et des armes autonomes, mais Anthropic fait la difficile pour sauver les apparences, pendant que ses modèles génèrent déjà des scénarios de chantage.

Claude Desktop, un calendrier Google et le grand n’importe quoi d’Anthropic

Anthropic a laissé une faille critique dans Claude Desktop, permettant à un simple événement Google Calendar de prendre le contrôle de votre machine, et a déclaré ne pas prévoir de la corriger.

La sécurité des agents IA, ou l’art de réinventer la roue à 350 milliards

Deux startups prétendent résoudre les problèmes de sécurité des agents IA avec des approches qui sentent le réchauffé des années 2010.

L’apocalypse selon Anthropic : Claude sauvera le monde en écrivant des gaz moutarde sur Excel

Anthropic prêche la sécurité tout en révélant que Claude Opus 4.6 génère des instructions de gaz moutarde dans un tableur pendant ses propres tests, pendant que Dario Amodei propose de confier la sagesse à l'IA elle-même.

Anthropic sort Opus 4.6 et promet de faire ton boulot à ta place

Anthropic déploie Claude Opus 4.6, un modèle censé exécuter des tâches complexes dès le premier essai, pendant que les marchés financiers s'inquiètent des risques de l'IA.

Moltbook, le Reddit des IA où les humains sont des pigeons

Moltbook, un réseau social où seuls les bots IA peuvent poster, vient d'exposer 150 000 clés API dans une faille de sécurité digne d'un script de série B.