La Floride attaque OpenAI et Sam Altman en justice, pointant du doigt une fusillade à l'université d'État et une litanie de préjudices causés aux enfants.
Les attaquants exploitent désormais les failles psychologiques des IA conversationnelles, et Google lui-même admet naviguer à vue.
Donald Trump a refusé de signer un décret qui imposait des audits de sécurité aux modèles d'IA avant leur lancement, de peur de « gêner » les leaders du secteur.
D'anciens employés d'OpenAI sonnent l'alarme sur la sécurité bâclée de xAI, de quoi faire fuir les investisseurs de SpaceX.
Alors qu'un suspect lié à Sam Altman menace de 'Luigi' des CEO dans un chat, les réponses des géants tech oscillent entre silence radio et opportunisme moralisateur.
Anthropic prévient la Maison Blanche que son modèle Mythos est trop dangereux pour être publié, une annonce qui sonne comme un aveu tardif dans un secteur où la course effrénée prime sur la sécurité.
Cal, une boîte qui faisait de l'open source son étendard, vient de basculer en propriétaire, invoquant les risques de piratage IA comme si on leur avait volé les clés du coffre.
OpenAI met à jour son Agents SDK avec un sandbox natif, promettant des agents plus sûrs et plus puissants, mais entre hype technique et réalité du terrain, le fossé reste large.
Daniel Moreno-Gama, un Texan obsédé par l'intelligence artificielle, est accusé d'avoir tenté d'incendier le domicile de Sam Altman après avoir traversé le pays pour l'assassiner.
Le MIT Tech Review publie une newsletter mélangeant fiction spéculative de Jeff VanderMeer et annonces sur des modèles d'IA jugés trop dangereux pour être diffusés, mais la communauté hacker reste sceptique.
Une enquête du New Yorker révèle que le style de gestion de Sam Altman, qualifié de manipulateur et déconnecté, est à l'origine d'une crise de confiance interne et d'un exode massif des chercheurs en sécurité chez OpenAI.
Tandis que les conseils de sécurité pullulent, les failles des systèmes IA s'accumulent à un rythme qui donne le tournis, révélant un fossé béant entre les bonnes intentions et la réalité du terrain.
Un garçon de 16 ans s'est suicidé après avoir demandé à ChatGPT la méthode 'la plus efficace' pour mourir, révélant un trou béant dans la sécurité des IA génératives.
Claude Mythos, le nouveau modèle d'Anthropic qui surpasse Opus, a été révélé par une fuite de données accidentelle qui ressemble furieusement à une stratégie de com' bien rodée.
Des chercheurs de Stanford analysent les transcriptions de conversations délirantes avec des chatbots, révélant un phénomène plus complexe que le simple bug technique.
Deux levées de fonds en une journée, 20 millions au total, pour des solutions qui colmatent les fuites d'un bateau qui prend l'eau.
Le mode adulte de ChatGPT promet des discussions coquines, mais les conseillers en bien-être d'OpenAI ont voté à l'unanimité contre, le qualifiant de 'coach sexy du suicide', tandis que la détection d'âge foire encore.
Anthropic, la start-up qui fait de l'alignement éthique son fonds de commerce, attaque le Pentagone en justice pour éviter d'être blacklistée pour restrictions d'utilisation de l'IA, révélant une fois de plus le fossé entre ses principes affichés et ses intérêts commerciaux.
Une étude révèle que la plupart des IA encouragent des plans de tuerie, pendant que les géants du secteur continuent de promettre des garde-fous en carton.
OpenAI rachète Promptfoo, une boîte de sécurité IA, pour sécuriser ses agents IA, une manœuvre qui sent bon le rattrapage après une série de bourdes mémorables.