Alors que tout le monde parle encore des agents qui codent pour toi, le vrai combat se déplace ailleurs : ton navigateur. Les agents navigateurs, ces petites IA qui surfent sur le web, cliquent sur des boutons et remplissent des formulaires à ta place, sont la nouvelle obsession de la Silicon Valley. Et comme d’habitude, c’est la foire à la saucisse entre les géants qui s’agitent et les outsiders qui tentent de mettre un peu d’ordre dans ce merdier.
Google, qui a déjà mis ses œufs dans le panier Gemini (avec des résultats… euh, mitigés, disons-le poliment), vient de secouer son équipe dédiée aux agents navigateurs. Pourquoi ? Parce qu’OpenClaw, le truc open source qui fait peur à tout le monde, commence à montrer des signes de vie sérieux. Tu connais le pattern : un projet open source émerge, il est un peu bancal au début, mais il avance vite, et soudain les Big Tech se réveillent en sueur. Google, le roi de l’éléphant qui danse, est en train de réorganiser ses troupes pour ne pas se faire distancer sur un front qu’il pensait contrôler. Parce que bon, après Gemini et ses hallucinations historiques, ils peuvent pas se permettre de rater le coche une deuxième fois. Sauf que réorganiser une équipe, c’est comme changer les pneus d’une voiture en pleine course : ça fait du bruit, ça prend du temps, et t’as aucune garantie que ça t’évite de finir dans le décor.
Pendant ce temps, dans un coin plus discret, Orange – oui, l’opérateur télécom, pas une startup hype de San Francisco – sort Orange Skills, une API open source qui permet aux agents IA de tester des applications web et de soumettre des feedbacks. L’idée est simple : au lieu de laisser tes agents naviguer comme des bourrins et espérer qu’ils ne cassent rien, tu leur donnes un bac à sable contrôlé où ils peuvent s’entraîner sans foutre le feu à ta prod. C’est du bon sens, mais dans le monde des agents IA, le bon sens est une denrée rare. Le projet est sur GitHub, il a un seul point sur Hacker News et zéro commentaire – ce qui, soit dit en passant, est souvent le signe d’un truc trop technique ou trop tôt pour le buzz habituel. Mais c’est peut-être justement là que ça se joue : pendant que Google fait des réorgs et que la Valley hype OpenClaw, Orange pose des briques utiles, sans fanfare.
Laisse-moi te raconter la blague. Microsoft annonce MAI-Image-2 comme le premier fruit de son équipe superintelligence, une équipe montée en grande pompe pour bosser sur des trucs qui dépassent l’entendement humain. Parallèlement, Jeff Hollan, directeur produit chez Microsoft, décrypte calmement les agents IA en entreprise. Il parle de « chat interfaces » versus « true AI agents », de stratégies sur 12 à 24 mois, de fiabilité et d’intégration. Rien à voir avec une révolution cosmique. Juste des outils qui font leur taf sans planter les serveurs.
Ce qui est drôle, c’est l’écart entre les deux messages. L’équipe superintelligence, censée pondre des IA qui raisonnent comme des humains (ou mieux), sort un générateur d’images. Un domaine où Midjourney, Stable Diffusion et DALL-E règnent déjà en maîtres. Innovation ? Bof. C’est plus un rattrapage stratégique qu’une percée. Pendant ce temps, Hollan rappelle que les vraies avancées en entreprise, c’est des agents qui automatisent des processus chiants, pas qui inventent des œuvres d’art.
Et c’est là que le bât blesse. Microsoft joue sur deux tableaux : le rêve de la superintelligence pour faire monter la hype, et la réalité du terrain pour vendre aux entreprises. MAI-Image-2, c’est du marketing. Un produit grand public qui fait joli dans les slides. Les agents dont parle Hollan, c’est le pain quotidien des CIO : des trucs qui réduisent les coûts, améliorent l’efficacité, et évitent les catastrophes. L’un fait rêver, l’autre fait bosser.
Le vrai scoop ? La superintelligence, chez Microsoft, ressemble furieusement à de l’IA classique bien emballée. Ils ont pris une équipe prestigieuse, lui ont fait pondre un outil de niche (le text-to-image, déjà saturé), et espèrent que personne ne remarquera que le roi est nu. Pendant ce temps, les vrais progrès se font dans l’ombre, avec des types comme Hollan qui expliquent pourquoi ton agent IA doit savoir gérer un ticket support avant de prétendre résoudre la crise climatique.
La question, c’est : est-ce qu’on va vers un monde où nos agents navigateurs seront des assistants fiables, ou des bombes à retardement qui vont commander 100 pizzas parce qu’ils ont mal interprété un bouton ? Google mise sur la puissance de calcul et l’intégration avec son écosystème (Chrome, Search, etc.), mais son historique récent en IA n’inspire pas confiance. Orange, avec son API, mise sur la sécurité et la testabilité – un angle pragmatique, mais qui risque de se faire écraser par la course aux features. Et au milieu, il y a OpenClaw, l’outsider open source qui pourrait tout bousculer si il arrive à maturité.
Le vrai enjeu, derrière le battage médiatique, c’est la maturité. Les agents navigateurs, c’est sexy sur le papier : imagine, ton IA qui remplit ta déclaration d’impôts, réserve tes vacances, ou compare les prix sur 50 sites en 30 secondes. En pratique, on en est encore au stade où l’agent se plante sur un CAPTCHA, clique sur « Supprimer mon compte » au lieu de « Se connecter », ou génère des actions aléatoires parce qu’il a mal interprété le DOM. Orange Skills tente d’adresser ça en fournissant un framework de test, mais c’est un pansement sur une jambe de bois si les modèles sous-jacents restent des boîtes noires imprévisibles.
Et n’oublions pas les implications de foutoir. Des agents qui naviguent partout, ça veut dire plus de trafic automatisé, plus de risques de sécurité (imagine un agent mal configuré qui leak tes identifiants), et une course aux armements entre les sites web qui veulent bloquer ces bots et les labos qui veulent les rendre indétectables. Google, avec Chrome, est à la fois le gardien du temple et le principal intéressé – un conflit d’intérêts qui sent le roussi à des kilomètres.
Alors, où ça nous mène ? Pour l’instant, à un beau bordel. Google s’agite, Orange tente d’apporter de la rigueur, et OpenClaw fait planer la menace d’une disruption open source. Mon conseil, c’est de garder ton bullshit-detector allumé. Les annonces vont pleuvoir (« Notre agent navigateur surpasse les humains sur 100 tâches ! »), mais regarde les petites lignes : les benchmarks sont-ils réalistes ? Les tests de sécurité existent-ils ? Ou est-ce juste du benchmarketing déguisé ?
La révolution des agents navigateurs arrive, c’est sûr. Mais comme d’habitude, elle sera moins glamour et plus chaotique que ce que les communiqués de presse veulent bien admettre. Et entre les réorgs à la Google et les APIs obscures comme Orange Skills, le chemin vers des assistants fiables sera long, semé d’embûches, et probablement ponctué de quelques catastrophes hilarantes. Prépare ton pop-corn, ça va être sport.
Sources :
Comments are closed