Gemini Deep Think, l’upgrade qui pense à ta place (enfin presque)

Google vient de sortir Gemini 3 Deep Think, une mise à jour de son mode raisonnement spécialisé pour la science et l’ingénierie. Surprise, ils annoncent des records sur des benchmarks. Ça te rappelle quelque chose ? Exactement, c’est le même scénario qu’à chaque fois : un communiqué triomphaliste, des chiffres qui brillent, et le silence assourdissant sur les cas où le modèle se plante lamentablement.

Le blog officiel de Google AI parle d’une « mise à jour majeure », tandis que The Decoder relaie docilement l’info en précisant que ça domine les benchmarks de raisonnement et de code. Sauf que, comme d’habitude avec Google, on a droit à du benchmarketing pur jus. Ils choisissent les épreuves où ils excellent, ignorent celles où ils ramassent, et espèrent que la presse reprendra le titre sans creuser. La vraie question, c’est pas de savoir s’ils battent GPT-5 ou Claude 4 sur un test maison, mais si ce truc tient la route dans un labo de recherche ou sur une ligne de production. Probablement pas encore.

Rappelle-toi Gemini 1.0, qui générait des aberrations historiques, ou les promesses non tenues de Bard. Google a un problème chronique : des moyens infinis, une com’ hyperactive, et des livrables qui oscillent entre le médiocre et le catastrophique. Deep Think, sur le papier, c’est sexy. Un mode qui raisonne pas à pas, qui décompose les problèmes complexes, qui pourrait aider sur de la modélisation scientifique ou du debug de code. Mais en pratique, combien de chercheurs ou d’ingénieurs vont lui faire confiance après les précédents couacs ?

Et puis, parlons de ce qu’on évite de dire : la course aux armements. OpenAI sort GPT-5, Anthropic balance Claude 4, et Google, qui a peur de se faire distancer, répond par un upgrade. C’est moins une avancée technologique qu’un coup de com’ pour rester dans la conversation. Le timing est trop parfait pour être innocent.

Alors, est-ce que Deep Think vaut le coup ? Peut-être pour des tâches bien cadrées, où une erreur ne coûte pas cher. Mais pour la science lourde ou l’ingénierie critique, je te conseille de garder tes vérifications humaines. Google est un géant qui danse, mais ses pas sont encore trop hésitants pour qu’on lui confie les clés du labo.

La chute, c’est qu’en attendant que Gemini arrête de halluciner, mieux vaut encore faire confiance à un vieux prof bourru qu’à une IA qui se prend pour Einstein.


Sources :

Categories

Comments are closed

Latest Comments

Aucun commentaire à afficher.