Si tu pensais que l’IA servait juste à pondre des poèmes et à débiter des conneries avec un sourire digital, Google vient de te rappeler qu’il voit plus grand. À l’I/O 2026, la firme de Mountain View a balancé une salve de modèles taillés pour l’ère agentique : Gemini 3.5 Flash, le bolide des agents autonomes, et Gemini Omni, le multimodal qui avale texte, images, audio et vidéo pour recracher des séquences sur simple conversation. Le tout accompagné d’un IDE dédié, Antigravity 2.0, et d’un assistant perpétuel, Gemini Spark.
Flash, mais pas que
Gemini 3.5 Flash, c’est le nouveau fleuron de Google pour le code et les agents. Selon Koray Kavukcuoglu, CTO de DeepMind, le modèle serait 4 fois plus rapide que les autres modèles frontaliers, avec une version optimisée qui atteint 12 fois la vitesse pour la même qualité. Il surpasse même leur précédent champion, Gemini 3.1 Pro, sur quasi tous les benchmarks : codage, tâches agentiques, raisonnement multimodal. Bref, du lourd.
Agent first, bitches
Mais le vrai virage, c’est le changement de paradigme. Google ne vend plus l’IA comme un causant – pardon, un chatbot – mais comme un outil agentique. Tu lui files un objectif, il planifie, exécute, itère, et te rappelle juste quand il a besoin d’un avis humain. Sur scène, un ingé a montré des agents qui spawnent des sous-agents, qui chacun bossent sur un bout du projet, puis se reassemblent pour pondre un OS complet depuis zéro. Ouais, rien que ça. Pour que ces bestioles tournent, Google a sorti Antigravity 2.0, un IDE desktop couplé à Gemini 3.5 Flash.
Omni, le couteau suisse vidéo
De l’autre côté, Gemini Omni promet de démocratiser la création vidéo. Fini les timelines spatiales et les exports foireux : on parle, et la machine exécute. L’entrée de gamme, Omni Flash, est déjà dispo. ZDNet voit dans Omni ce que Nano Banana a fait pour les images : un mélange de réalisme, de contrôle stylistique, d’avatars et d’édition en langage naturel. Sauf que la vidéo, c’est un tout autre game. Les temps de génération, la cohérence temporelle, le « uncanny valley » — les défis sont vertigineux. Et cloner son image, sa voix, en quelques phrases ? De quoi faire passer les deepfakes actuels pour des dessins d’enfant.
Sécurité et réalité terrain
Bien sûr, donner des super-pouvoirs à tout le monde, ça flippe un peu. Google assure que les garde-fous contre les risques cyber et CBRN ont été renforcés, et que le modèle est mieux calibré pour répondre aux questions sensibles sans tout bloquer. Mais on connaît la musique : annonces tonitruantes, démos calibrées, puis déploiement poussif. « Je suis intrigué… et inquiet », avoue un journaliste de ZDNet. Et il a raison : si ça tient ne serait-ce qu’à moitié ses promesses, le paysage de la création vidéo prend un sacré coup de vieux.
Le pari de l’agent permanent
Et puis y a Gemini Spark, l’assistant perso qui tourne H24 dans le cloud. Il exécute des tâches en background, planifie, rappelle, sans que vous ayez à lui taper sur l’épaule. L’agent qui ne dort jamais est né. Pratique pour ceux qui veulent déléguer leur vie. Flippant pour ceux qui pensent à la vie privée.
Alors, miracle ou mirage technique ? Google a les moyens, les données et la horsepower. Mais les annonces sentent le déjà-vu : Gemini 3.5, c’est le iPhone S de l’IA – mieux, plus rapide, mais est-ce que ça change vraiment la donne ? L’agent permanent, lui, pourrait bien être le vrai changement de si les gens acceptent de confier leurs tâches à un esprit numérique toujours allumé.
En attendant, prépare-toi à voir débarquer des clones de toi-même qui te vendent des compléments alimentaires. L’avenir est radieux, les enfants.
Sources : TechCrunch, ZDNet, The Verge, Google AI Blog, The Decoder, Ben’s Bites
Sources :
Comments are closed