Seis niveles, no uno
Un agente no es «un prompt largo». Tools, guardarraíles, memoria, skills, MCP y orquestación — apilados.
De un LLM con tools a un sistema multiagéntico revisado por otro modelo. Seis niveles de arquitectura — con código, Mastra y Open Code — para que tu agente no se descontrole en producción.
Un agente no es «un prompt largo». Tools, guardarraíles, memoria, skills, MCP y orquestación — apilados.
Framework con 22k estrellas que ya viene con panel de desarrollo, evals y scorers integrados.
Lead, Executor, Reviewer — y un revisor del revisor. Mortadelo, Filemón y el Superintendente Vicente.
El punto de partida
«El LLM es el cerebro, pero el agente es toda la infraestructura que lo rodea.» Cada nivel suma una capa que el anterior no tenía — y cada uno resuelve un problema concreto que aparece en producción.
En la masterclass se construye nivel a nivel con Mastra (TypeScript, 22k estrellas), un panel de desarrollo en local y una API key. El mismo ejemplo, el mismo agente — añadiéndole capas hasta que aguante en producción.
Los seis niveles · de abajo a arriba
LLM aumentado con tools
Funciones que el modelo puede invocar para tocar el mundo real. La base.
Guardarraíles y políticas
Filtros deterministas a la entrada y a la salida. Para que no se caiga por el precipicio.
Memoria a corto y largo plazo
Ficheros, JSON o base de datos. Recordar la conversación y el perfil del usuario.
Skills inyectadas al contexto
Markdown que el agente carga bajo demanda. Tu manual de instrucciones, encapsulado.
MCP y herramientas externas
Protocolo abierto para conectar APIs y servicios sin escribirlos tú.
Orquestación con workflow
Un agente que reparte juego entre otros agentes. La frontera con lo multiagéntico.
Cuando se va de las manos
Le preguntas el precio de la sardina en la lonja de Sada y acaba hablando del año en que nació Napoleón. Eso, en producción, tira de tus tokens y de tu cartera.
La solución no es un prompt más largo: son guardarraíles y policies — filtros deterministas a la entrada y a la salida — para que el agente no se salga de la carretera.
Demo en directo: el agente sin guardarrail ignora la referencia geográfica y se pone a hablar de Napoleón. El recordatorio de por qué esto es serio cuando lo abres al usuario final.
Definición desde cero: guardarraíles, policies y por qué actúan como filtros deterministas en input y output. Con la metáfora que se queda grabada.
Pausa · interactivo
Marca las capas que tu agente ya tiene y llévate el regalo de la casa: un prompt de auditoría personalizado con tus respuestas. Pégalo en tu IA y te hará las preguntas incómodas, comprobará lo que dices tener y te diseñará el plan para subir a la siguiente capa.
Cómo se prueba un agente
«Una de las características más relevantes de los agentes es que no nos podemos fiar de su respuesta.» Sin respuestas deterministas, los test de TDD clásicos no valen.
De ahí nacen los evals (en Mastra, scorers). Otro modelo — idealmente de otro proveedor — puntúa la respuesta entre 0 y 1. El patrón se llama LLM as Judge. Y para el resto (longitud, palabras prohibidas), un scorer determinista.
LLM as Judge, scorers deterministas, evaluación cruzada entre proveedores. Lo más cerca que estamos de tener TDD para agentes — sin pretender que tengan conciencia.
La frontera multiagéntica
«Tenemos a los agentes de la TIA: el que manda es el Superintendente Vicente, el que ejecuta es Mortadelo, el que revisa es Filemón… y el que la lía, Bacterio.» El sistema multiagéntico del taller, pero con palabras que el LLM entienda: Lead, Executor, Reviewer.
Todo en Open Code — open source, los agentes son ficheros markdown, conecta con varios proveedores. Y como los agentes mienten, también hay un cuarto agente: el que evalúa al revisor.
La metáfora que aterriza qué es un sistema multiagéntico: orquestador, ejecutor, revisor — y por qué Open Code es la herramienta para montarlo sin que te cierren la cuenta.
Programa completo · 1h 29min
Aquí está el taller entero, fragmento a fragmento. Las son los momentos que más calan — según el feedback en directo.
Una pista antes de cerrar
Es una arquitectura por capas, con guardarraíles que no dejen que se caiga, memoria para que no sea Dory, skills para que sepa qué hacer, MCP para que llegue al mundo real y un orquestador para que reparta juego. La masterclass es ese ascenso, paso a paso, con código y demos en directo — y un revisor del revisor al final.