AWS Bedrock AgentCore se dote d’évaluateurs maison

Amazon a dégainé une mise à jour pour Bedrock AgentCore, et voilà que tu vas pouvoir coller tes propres évaluateurs maison. Quatre fonctions Lambda, du fact-checking, de la détection PII, des alertes en temps réel. Le tout dans un post de blog qui sent bon le copier-coller de doc technique.

Bon, soyons clairs : c’est pas la révolution. C’est juste AWS qui te file une boîte à outils en plus pour que tu arrêtes de pleurer sur les limites des évaluateurs intégrés. AgentCore, leur système pour déployer des agents IA en mode prod, s’enrichit de ce qu’ils appellent des « custom code-based evaluators ». En clair, tu écris du code Lambda, tu l’enregistres, et tu peux le balancer en mode on-demand ou online. Tu mixes avec les évaluateurs intégrés, tu appelles d’autres services AWS pour vérifier les faits ou scraper les PII, et le tour est joué.

L’exemple qu’ils donnent, c’est un agent financier de market intelligence. Parce que oui, la finance a toujours été le terrain de jeu des premières versions. Mais franchement, l’idée est pas dégueu : si tu veux un agent qui ne raconte pas n’importe quoi sur les cours de bourse, tu lui files un évaluateur qui va checker les données Bloomberg en direct. Pour éviter qu’il balance un numéro de carte bleue d’un client, tu mets un détecteur PII. Et si jamais un mec passe son temps à poser des questions borderline, tu peux balancer une alerte en temps réel.

Mais attention les yeux : c’est pas du plug-and-play. Faut coder, faut déployer, faut gérer les permissions Lambda, les erreurs, les timeouts. La promesse d’Amazon, c’est que tu peux « combiner » évaluateurs custom et built-in. En pratique, tu vas te farcir des heures de debug parce que ton wrapper Lambda renvoie du JSON mal formé. Pour les cas d’usage vraiment critiques, tu ferais mieux de ne pas compter uniquement sur un évaluateur maison pour sauver la mise.

Au final, c’est un pas dans la bonne direction. Donner aux développeurs les moyens de contrôler ce que leurs agents crachent, c’est sain. Mais c’est aussi une manière élégante de dire : « On vous a filé des évaluateurs de base, maintenant démerdez-vous avec le reste, on va pas tout faire à votre place. » C’est le jeu. AgentCore devient un peu plus flexible, un peu moins boîte noire. Mais ça reste du AWS : tu paies à l’appel Lambda, et si ton évaluateur coûte plus cher que le modèle lui-même, ben tant pis pour toi.

Moi je dis : bien joué, Amazon. À mon avis, avant de te lancer dans des évaluateurs customisés à mort, assure-toi que ton agent de base tient déjà la route. Parce que sinon, tu vas juste foutre de la merde dans du Lambda.


Sources :

Categories

Comments are closed

Latest Comments

Aucun commentaire à afficher.