Gemini 3.5 Flash débarque dans llm-gemini, avec les tokens de raisonnement en streaming

Simon Willison a encore frappé. Dans la nuit de mardi à mercredi, il a balancé deux moutures de son plugin llm-gemini pour son outil en ligne de commande llm. La version stable 0.32 intègre le nouveau modèle gemini-3.5-flash, dont il a déjà causé sur son blog – avec en prime un dessin de pélican réalisé via cette mise à jour, parce que pourquoi pas.

Mais le plus intéressant, c’est la version alpha 0.32a0. Celle-ci débloque le streaming des tokens de raisonnement, une feature qui nécessite llm >= 0.32a0. Concrètement, au lieu d’attendre que le modèle ait fini de cogiter en silence, tu peux voir les petites billes algorithmiques qui lui passent par la tête en temps réel. Utile pour débuguer, comprendre les errances du modèle ou juste mater les rouages de la machine à prédire.

C’est pas la révolution qui va changer la face du monde, mais pour les gens qui bricolent avec Gemini en ligne de commande, c’est du pain béni. Google avance ses pions sur le terrain des modèles légers réactifs – le Flash – et améliore la transparence du raisonnement. Pas de bullshit marketing, juste des commits qui font le taf.


Sources :

Categories

Comments are closed

Latest Comments

Aucun commentaire à afficher.