Masterclass · Agentes de IA

Cómo construir agentes de IA: arquitectura, capas y orquestación

De un LLM con tools a un sistema multiagéntico revisado por otro modelo. Seis niveles de arquitectura — con código, Mastra y Open Code — para que tu agente no se descontrole en producción.

Seis niveles, no uno
Un agente no es «un prompt largo». Tools, guardarraíles, memoria, skills, MCP y orquestación — apilados.
Con Mastra (TypeScript)
Framework con 22k estrellas que ya viene con panel de desarrollo, evals y scorers integrados.
Multiagente con Open Code
Lead, Executor, Reviewer — y un revisor del revisor. Mortadelo, Filemón y el Superintendente Vicente.

El punto de partida

Un agente es un sistema, no un prompt con suerte

«El LLM es el cerebro, pero el agente es toda la infraestructura que lo rodea.» Cada nivel suma una capa que el anterior no tenía — y cada uno resuelve un problema concreto que aparece en producción.

En la masterclass se construye nivel a nivel con Mastra (TypeScript, 22k estrellas), un panel de desarrollo en local y una API key. El mismo ejemplo, el mismo agente — añadiéndole capas hasta que aguante en producción.

Los seis niveles · de abajo a arriba

1
LLM aumentado con tools
Funciones que el modelo puede invocar para tocar el mundo real. La base.
2
Guardarraíles y políticas
Filtros deterministas a la entrada y a la salida. Para que no se caiga por el precipicio.
3
Memoria a corto y largo plazo
Ficheros, JSON o base de datos. Recordar la conversación y el perfil del usuario.
4
Skills inyectadas al contexto
Markdown que el agente carga bajo demanda. Tu manual de instrucciones, encapsulado.
5
MCP y herramientas externas
Protocolo abierto para conectar APIs y servicios sin escribirlos tú.
6
Orquestación con workflow
Un agente que reparte juego entre otros agentes. La frontera con lo multiagéntico.

Cuando se va de las manos

Liarla en producción cuesta tokens — y dinero

Le preguntas el precio de la sardina en la lonja de Sada y acaba hablando del año en que nació Napoleón. Eso, en producción, tira de tus tokens y de tu cartera.

La solución no es un prompt más largo: son guardarraíles y policies — filtros deterministas a la entrada y a la salida — para que el agente no se salga de la carretera.

Demo en directo: el agente sin guardarrail ignora la referencia geográfica y se pone a hablar de Napoleón. El recordatorio de por qué esto es serio cuando lo abres al usuario final.

Definición desde cero: guardarraíles, policies y por qué actúan como filtros deterministas en input y output. Con la metáfora que se queda grabada.

Pausa · interactivo

Ya conoces la escalera. ¿Dónde está tu agente?

Marca las capas que tu agente ya tiene y llévate el regalo de la casa: un prompt de auditoría personalizado con tus respuestas. Pégalo en tu IA y te hará las preguntas incómodas, comprobará lo que dices tener y te diseñará el plan para subir a la siguiente capa.

+19

24 developers ya han visto esta masterclass

Cómo se prueba un agente

LLM as Judge: otro modelo evalúa al tuyo

«Una de las características más relevantes de los agentes es que no nos podemos fiar de su respuesta.» Sin respuestas deterministas, los test de TDD clásicos no valen.

De ahí nacen los evals (en Mastra, scorers). Otro modelo — idealmente de otro proveedor — puntúa la respuesta entre 0 y 1. El patrón se llama LLM as Judge. Y para el resto (longitud, palabras prohibidas), un scorer determinista.

LLM as Judge, scorers deterministas, evaluación cruzada entre proveedores. Lo más cerca que estamos de tener TDD para agentes — sin pretender que tengan conciencia.

La frontera multiagéntica

Mortadelo, Filemón y quién revisa al que revisa

«Tenemos a los agentes de la TIA: el que manda es el Superintendente Vicente, el que ejecuta es Mortadelo, el que revisa es Filemón… y el que la lía, Bacterio.» El sistema multiagéntico del taller, pero con palabras que el LLM entienda: Lead, Executor, Reviewer.

Todo en Open Code — open source, los agentes son ficheros markdown, conecta con varios proveedores. Y como los agentes mienten, también hay un cuarto agente: el que evalúa al revisor.

La metáfora que aterriza qué es un sistema multiagéntico: orquestador, ejecutor, revisor — y por qué Open Code es la herramienta para montarlo sin que te cierren la cuenta.

Programa completo · 1h 29min

Tres capítulos. Dieciséis fragmentos. Una hora y media.

Aquí está el taller entero, fragmento a fragmento. Las son los momentos que más calan — según el feedback en directo.

Presentación

13:41

Presentación03:07
Qué es un agente: definición y roles05:42
Tipos de agentes: Product Agent y Developer Agent02:50
Mastra: framework TypeScript para construir agentes02:02

6 arquitecturas de agentes paso a paso

51:10

6 arquitecturas de agentes paso a paso00:35
Nivel 1: LLM aumentado con tools07:03
Nivel 2: Guardarraíles y políticas de entrada/salida04:30
Nivel 3: Memoria a corto y largo plazo06:17
Nivel 4: Skills inyectadas al contexto05:32
Observabilidad y trazabilidad con el Scouter05:27
Nivel 5: MCP y herramientas externas07:32
Nivel 6: Orquestación de agentes con workflow06:10
Evals y Scores: evaluar las respuestas del agente08:04

Developer Agent: sistemas multiagénticos con Open Code

24:50

Developer Agent: sistemas multiagénticos con Open Code11:49
Quién revisa al revisor: evaluación externa05:24
Oh My Open Agent: demo con 11 agentes07:37

Una pista antes de cerrar

Un agente no es un prompt con suerte

Es una arquitectura por capas, con guardarraíles que no dejen que se caiga, memoria para que no sea Dory, skills para que sepa qué hacer, MCP para que llegue al mundo real y un orquestador para que reparta juego. La masterclass es ese ascenso, paso a paso, con código y demos en directo — y un revisor del revisor al final.

Dudas antes de entrar

¿Qué necesito saber antes de entrar?

TypeScript a nivel intermedio y haber tocado un LLM al menos por API o por un cliente como Claude Code u Open Code. Si nunca has llamado a un LLM por API, antes mira el directo de OpenRouter o el de Grog que hay en el archivo.

¿Tengo que pagar API key de OpenAI o Anthropic?

Para reproducir los ejemplos con Mastra necesitas una API key. En el directo se enseña cómo conseguir claves gratuitas con Grog y OpenRouter que sirven hasta cierto punto. Si quieres ir hasta el final, una API key de pago.

¿Mastra es la única opción? ¿Por qué no Lanchain o Pydantic?

Mastra es la opción del taller — TypeScript, panel de desarrollo, evals y scorers integrados. Lanchain, Pydantic, DeepAgence y otros sirven para lo mismo. El método (capas, guardarraíles, evals, orquestación) es agnóstico al framework.

¿Open Code o Claude Code?

Para multiagente: Open Code. Es open source, los agentes son ficheros markdown, conecta con varios proveedores y no te van a cerrar la cuenta si te ven montar 11 agentes a la vez. Claude Code sirve igual de bien para usar, pero para construir sistemas multiagénticos a esta escala — Open Code.

¿Puedo dejar la suscripción al terminar?

Sí. Pero la membresía incluye podcast premium, otras masterclasses, las guías y la comunidad. La mayoría se queda.