Newsletter para devsEntra

Guardarraíles del agente

Los guardarraíles (guardrails) son los filtros y políticas que acotan lo que un agente puede hacer y decir: rechazan prompts fuera de dominio, validan el output contra un esquema, limitan qué herramientas puede llamar, imponen autenticación y recortan el consumo de tokens. Son la versión deliberada de los permisos: no solo «¿puede ejecutar esto?» sino «¿debería siquiera contestar esto?». Sin guardarraíles el agente deriva a tareas fuera de alcance, fabrica respuestas más allá de su cutoff o gasta tokens en trivia. Es la capa que convierte un modelo conversacional en un agente fiable dentro de un dominio acotado, y su pareja natural son los permisos (qué ejecuta) y la verificación automatizada (qué valida el resultado).

Prompt para tu agente
Diseña los guardarraíles para un agente que opera en <dominio>: qué prompts
rechazar por estar fuera de alcance, cómo validar su output contra un esquema, qué
herramientas permitir y qué límites de tokens poner. Sepáralo de los permisos.

Fuentes en Web Reactiva

Momentos

los guardarraíles como filtros de input/output del agente · límite de tokens, autenticación de usuario, los guardarraíles, filtros de input/output

balance entre pruebas manuales y automáticas como guardarraíles · cloud for chrome, playwright por debajo, skill de browser, modal de cookies

Daniel Primo

Artículo creado por Daniel Primo con ayuda de la IA en base a lo compartido en el podcast, vídeos y textos de Web Reactiva.

12 recursos para developers cada domingo en tu bandeja de entrada

Además de una skill práctica bien explicada, trucos para mejorar tu futuro profesional y una pizquita de humor útil para el resto de la semana. Gratis.