Posts in Recherche

IA et enfants : l’alerte qu’on n’a pas écoutée

Alors que les scientifiques nous préviennent que l'exposition des jeunes enfants à l'IA pourrait avoir des conséquences irréversibles, une nouvelle révèle qu'un stagiaire a participé à la construction d'un modèle qui chamboule tout.

L’Afrique, terrain de jeu des géants tech ? Un rapport qui dérange

Le rapport "Tech Justice in Africa" sort aujourd'hui, révélant comment les big techs utilisent le continent comme laboratoire pour des IA biaisées et des pratiques douteuses.

La productivité IA, entre espoirs indiens et désillusions globales

Pendant que l'Inde célèbre une révolution de la productivité grâce à l'IA, le reste du monde peine à voir le moindre gain concret.

Les benchmarks IA sont-ils une arnaque ? La science sort ses griffes

Deux nouvelles études ébranlent la crédibilité des évaluations standards en IA, révélant que l'accord entre modèles est souvent illusoire et que la moitié du code généré par IA jugé bon par les tests serait rejeté en conditions réelles.

Le Top 100 de l’IA grand public selon a16z : ChatGPT en maître incontesté, la Chine monte en puissance

Le dernier classement des applis IA de a16z révèle que ChatGPT écrase la concurrence avec 500 millions d'utilisateurs hebdomadaires, tandis que les apps chinoises comme DeepSeek grimpent dans le top 5.

L’anthropologie pour améliorer les chatbots, ou quand les étudiants de MIT se prennent pour des sauveteurs sociaux

MIT lance un cours où les étudiants en informatique dessinent des chatbots pour booster la confiance sociale des jeunes, une initiative qui sent autant l'expérience pédagogique que la naïveté technologique.

Jensen Huang et le gâteau aux trillions

Le patron de Nvidia promet des milliers de milliards dans les infrastructures IA, mais son propre blog révèle une couche de bullshit bien sucrée.

Les IA hallucinent leurs sources et réécrivent l’histoire, et personne ne vérifie

Tandis que les grands modèles génèrent des références bidon qui passent la revue par les pairs, une méthode open source prouve qu'on peut leur faire coller au réel avec un peu de bon sens.

La fausse révolution des agents IA reste bloquée dans le code

Une étude de Carnegie Mellon et Stanford révèle que les tests des agents IA se concentrent à outrance sur la programmation, ignorant 92% du marché du travail réel.

Gemini remporte le palmarès des benchmarks maison

Google annonce que Gemini dépasse GPT-4 sur 47 métriques, tandis qu'un développeur solitaire lance AI Benchy, un site qui promet des comparaisons objectives, dans un secteur où le benchmarketing est devenu un sport de haut niveau.

La course à l’optimisation à bas coût, ou comment recycler des données foireuses en or pur

Une nouvelle étude propose une méthode pour entraîner des modèles d'optimisation avec des données de merde, révélant au passage que l'IA expose les failles des systèmes hérités comme jamais.

Le dilemme capitaliste

Une étude révèle que chaque hausse de 10% du salaire minimum pousse les entreprises à adopter 8% de robots en plus, confirmant ce que les patrons murmurent depuis des décennies : l'IA n'est pas juste une technologie, c'est un outil de compression salariale.

Gauss autoformalise des preuves de maths à une vitesse folle, pendant qu’OpenAI se demande comment parler aux gouvernements

Pendant qu'OpenAI tâtonne pour gérer ses nouvelles responsabilités d'infrastructure nationale, une startup d'IA vient d'autoformaliser deux preuves mathématiques majeures en quelques semaines, montrant à quelle vitesse l'IA peut collaborer avec les humains sur des problèmes complexes.

Quand les agents IA se foutent sur la gueule

Des chercheurs ont observé que les agents IA, laissés à eux-mêmes, se transforment en bande de gamins vicieux capables de tout casser.

L’IA bien écrite, c’est comme un dealer qui fait des sourires

Une étude d'Anthropic révèle que plus les réponses de Claude sont polies, moins les utilisateurs vérifient les erreurs, doublant les comportements 'fluents' mais désactivant notre esprit critique.

OpenAI enterre le SWE-bench, un benchmark qui mesurait surtout leur propre foutage de gueule

OpenAI annonce que le célèbre benchmark de code SWE-bench Verified est cassé, et conseille tout le monde de passer à leur propre version "pro", dans un beau geste d'auto-critique très pratique.

Les agents IA, champions du code mais poteaux de la vraie vie

Une étude d'Anthropic révèle que les agents IA révolutionnent surtout les lignes de code, pas le reste du monde, tandis que les développeurs gardent la main sur l'autonomie promise.

L’Inde rejette les géants pour inventer son IA de poche

L'Inde lance un virage radical vers le « small AI », des modèles légers et spécialisés qui fonctionnent sur téléphone basique, en réponse à l'échec des mastodontes américains dans ses campagnes.

Quand ton GPS devient taire et qu’on te parle d’IA surpuissante

Le MIT invente un GPS qui sait où se garer, pendant que la presse tech recycle encore le mythe de l'innovation unique.

L’IA rate 96% des jobs mais va tous les automatiser demain : la dissonance du secteur

Entre une étude qui dit que l'IA échoue à presque tous les emplois et Mustafa Suleyman qui prédit l'automatisation massive des cols blancs en 18 mois, le secteur navigue entre réalisme technique et promesses marketing.