Los guardarraíles (guardrails) son los filtros y políticas que acotan lo que un agente puede hacer y decir: rechazan prompts fuera de dominio, validan el output contra un esquema, limitan qué herramientas puede llamar, imponen autenticación y recortan el consumo de tokens. Son la versión deliberada de los permisos: no solo «¿puede ejecutar esto?» sino «¿debería siquiera contestar esto?». Sin guardarraíles el agente deriva a tareas fuera de alcance, fabrica respuestas más allá de su cutoff o gasta tokens en trivia. Es la capa que convierte un modelo conversacional en un agente fiable dentro de un dominio acotado, y su pareja natural son los permisos (qué ejecuta) y la verificación automatizada (qué valida el resultado).
Diseña los guardarraíles para un agente que opera en <dominio>: qué prompts rechazar por estar fuera de alcance, cómo validar su output contra un esquema, qué herramientas permitir y qué límites de tokens poner. Sepáralo de los permisos.
Fuentes en Web Reactiva
- Cómo construir agentes de IA: arquitectura, capas y orquestaciónPremium2026-03-17
- La IA miente: cómo revisar y verificar lo que programan los agentes de IAPremium2026-05-04
- Los agentes de IA mienten pero nosotros no leemos el códigowr2026-04-12
- Arquitectura de agentes de IA: componentes, capas y frameworks para developerspost2026-03-09
- Errores comunes al construir un agente de IA (y cómo evitarlos)post2026-05-31
Momentos
los guardarraíles como filtros de input/output del agente · límite de tokens, autenticación de usuario, los guardarraíles, filtros de input/output
balance entre pruebas manuales y automáticas como guardarraíles · cloud for chrome, playwright por debajo, skill de browser, modal de cookies
Artículo creado por Daniel Primo con ayuda de la IA en base a lo compartido en el podcast, vídeos y textos de Web Reactiva.