Cómo crear un agente de IA con Claude Agent SDK y TypeScript (tutorial completo)

10/3/2026

Compartir en X Compartir en LinkedIn Compartir por email

El Claude Agent SDK permite construir agentes de IA autónomos usando el mismo motor que impulsa Claude Code, pero como librería programable en TypeScript o Python. En este tutorial vas a crear un chatbot de terminal que consulta una base de datos SQLite con el catálogo de Netflix: tú escribes la pregunta en español, Claude genera el SQL, ejecuta la query y te devuelve la respuesta con tablas en markdown.

Según la encuesta de Stack Overflow de 2025, el 52% de los desarrolladores afirma que las herramientas de IA y los agentes han tenido un efecto positivo en su productividad (Stack Overflow Developer Survey, 2025). Pero la mayoría sigue usando herramientas genéricas. Construir tu propio agente, adaptado a tus datos y tu flujo de trabajo, es el siguiente paso lógico. Si antes quieres entender la arquitectura y los componentes que forman un agente de IA, te ayudará a tomar mejores decisiones de diseño en este tutorial.

Esto es lo que vas a aprender:

Qué es el Claude Agent SDK y en qué se diferencia de la API de Anthropic
Cómo crear herramientas personalizadas con tool() y createSdkMcpServer()
Cómo diseñar prompts que guíen al modelo cuando trabaja con datos reales
Cómo funciona el bucle de agente por dentro
Cómo proteger tu herramienta con validaciones y límites

🔑 Lo más importante de este tutorial: el Claude Agent SDK convierte a Claude Code en una librería. No necesitas gestionar el bucle de tool calling. El SDK lo hace por ti.

¿Qué es el Claude Agent SDK y por qué es diferente a la API de Anthropic? ¶

El Claude Agent SDK es la infraestructura que mueve Claude Code, expuesta como paquete npm (o pip en Python). Si has trabajado con la API de Anthropic, conoces el patrón: envías un mensaje, el modelo responde con un tool_use, ejecutas la herramienta, le devuelves el resultado, repites. Con un par de herramientas el código se convierte en un laberinto de while y condicionales.

El SDK elimina esa complejidad. Tú le dices qué herramientas tiene disponibles, le das un prompt y le dejas trabajar.

Característica	API de Anthropic	Claude Agent SDK
Bucle de agente	Lo gestionas tú	Automático
Herramientas integradas (leer ficheros, bash, web)	No incluidas	Incluidas de serie
Gestión de contexto y compactación	Manual	Automática
Autocorrección ante errores	Implementación propia	Nativa con `maxTurns`
Autenticación	Solo API key	API key o suscripción Claude Code
Herramientas personalizadas (MCP)	Implementación externa	`createSdkMcpServer()` in-process

Según Gartner, el 40% de las aplicaciones empresariales incluirá agentes de IA específicos para 2026, frente a menos del 5% en 2025 (Gartner Platform Forecast, 2025). El Claude Agent SDK es una de las vías para llegar ahí sin construir la infraestructura desde cero.

La función principal es query(). Le pasas un prompt y unas opciones, te devuelve un AsyncGenerator que emite mensajes conforme Claude trabaja:

// Así de directo: le pasas un prompt y Claude hace el resto
for await (const message of query({ prompt: "...", options: { ... } })) {
  if (message.type === "result" && message.subtype === "success") {
    console.log(message.result);
  }
}

¿La clave? No necesitas API key si ya tienes Claude Code autenticado con tu suscripción Pro o Max. El SDK lanza Claude Code CLI como subproceso y usa tu sesión. Para proyectos personales y prototipos, esto es una ventaja enorme.

¿Qué necesitas antes de empezar? ¶

Antes de escribir ni una línea, asegúrate de tener esto:

Node.js 18 o superior. El SDK usa ESM nativo y funcionalidades modernas.
Claude Code instalado y autenticado. Si abres la terminal y ejecutas claude --version sin errores, estás listo.
Una suscripción activa (Pro o Max) o una API key configurada con ANTHROPIC_API_KEY.

Si no tienes Claude Code instalado, es un npm install -g @anthropic-ai/claude-code y después claude para autenticarte. Es un proceso de un minuto. Puedes consultar los detalles en la guía oficial de configuración de Claude Code.

¿Cómo se estructura el proyecto? ¶

El chatbot se organiza en 4 ficheros TypeScript dentro de src/, cada uno con una responsabilidad clara:

Fichero	Responsabilidad
`prompts.ts`	Todo el texto que va al modelo (schema, system prompt)
`db.ts`	Conexión SQLite + definición de la herramienta MCP
`render.ts`	Renderizado de markdown en terminal
`chatbot.ts`	Entry point que ensambla todo

Además, hay una base de datos SQLite (db/netflixdb.sqlite) con datos del catálogo de Netflix: películas, series, temporadas y estadísticas de visualización.

¿Por qué esta separación? Porque cada fichero se puede tocar sin romper los demás. Puedes cambiar el prompt sin abrir la lógica de base de datos. Puedes cambiar cómo se pintan los resultados sin tocar el agente. Es la misma filosofía que aplicas cuando separas componentes en un frontend.

¿Cómo se inicializa el proyecto? ¶

Crea el directorio y arranca:

mkdir netflix-sql-chatbot && cd netflix-sql-chatbot
npm init -y

Ahora instala las dependencias. Van en dos grupos: las del agente y las de soporte.

npm install @anthropic-ai/claude-agent-sdk better-sqlite3 zod chalk marked marked-terminal
npm install -D typescript tsx @types/better-sqlite3

¿Por qué cada una?

@anthropic-ai/claude-agent-sdk: el SDK del agente. Es la pieza central. Según el registro de npm, requiere Node.js 18+ y Zod ^3.24.1.
better-sqlite3: binding nativo de SQLite, síncrono y rápido. Perfecto para una herramienta que necesita devolver resultados al instante.
zod: validación de esquemas. El SDK lo usa para definir los parámetros de entrada de las herramientas con tipado seguro.
chalk + marked + marked-terminal: para que la respuesta del chatbot se vea con colores y tablas en la terminal. Esto es cosmético, pero mejora mucho la experiencia.
tsx: ejecuta TypeScript sin compilar. Lo usarás para lanzar el chatbot.

En el package.json, asegúrate de tener "type": "module" para usar ESM nativo y añade el script de arranque:

{
  "type": "module",
  "scripts": {
    "ask": "tsx src/chatbot.ts"
  }
}

¿Qué datos va a consultar el agente? ¶

La base de datos del catálogo de Netflix es un proyecto open source que puedes descargar desde las releases de netflixdb en GitHub. Está disponible en varios formatos (MySQL, PostgreSQL, SQLite). Nosotros hemos usado la versión SQLite porque es la que mejor encaja con un proyecto ligero de terminal: sin servidor, sin configuración, un solo fichero.

La base SQLite tiene 4 tablas relevantes:

movie (~12.000 filas): título, fecha de estreno, duración en minutos.
tv_show (~4.700 filas): series de televisión.
season (~8.600 filas): temporadas, con FK a tv_show.
view_summary (~37.000 filas): datos de visualización (horas vistas, views, ranking top 10, periodos semanales y semestrales).

La tabla view_summary es la más interesante y la más tramposa. Tiene dos foreign keys mutuamente excluyentes: movie_id (si es una película) y season_id (si es una serie). Nunca ambas a la vez. Esto es crucial para que el modelo sepa qué JOIN hacer.

Otro detalle: todas las fechas están en milisegundos epoch. No en formato YYYY-MM-DD, no en timestamp estándar. Milisegundos. Si no le avisas al modelo, va a generar queries con formatos de fecha que SQLite no entiende.

⚠️ Cuando trabajas con un LLM que genera SQL, los detalles del esquema lo son todo. Una fecha en formato inesperado o una relación mal explicada y el modelo generará queries incorrectas una y otra vez.

Si estás montando tu primer agente con IA, cada domingo compartimos herramientas, patrones y lo que vamos aprendiendo sobre ingeniería agéntica. Ya somos +6.700 developers.

Suscríbete gratis →

¿Cómo se diseñan los prompts para un agente SQL? ¶

Aquí es donde separas lo que el modelo sabe de lo que el modelo hace. Todo en src/prompts.ts. La investigación de Princeton sobre GEO (Generative Engine Optimization) demostró que incluir datos estadísticos y fuentes mejora la visibilidad del contenido hasta un 37% (Aggarwal et al., GEO: Generative Engine Optimization, KDD 2024). El mismo principio aplica a los prompts para agentes: cuanta más información estructurada le des, mejores resultados obtienes.

DB_SCHEMA: el mapa de los datos ¶

La primera constante es un string con la descripción completa de las tablas. No es SQL real, es lenguaje natural pensado para el modelo:

export const DB_SCHEMA = `
TABLAS Y COLUMNAS:

1. movie (~12K filas)
   - id INTEGER PRIMARY KEY
   - title VARCHAR(255) NOT NULL
   - release_date DATE (epoch milisegundos)
   - runtime BIGINT (minutos)
   ...

5. view_summary (~37K filas)
   - movie_id BIGINT (FK → movie.id, NULL si es serie)
   - season_id BIGINT (FK → season.id, NULL si es pelicula)
   - hours_viewed INTEGER NOT NULL
   - views INTEGER
   ...

NOTAS IMPORTANTES:
- TODAS las fechas estan en milisegundos epoch.
  Para convertir: date(columna/1000, 'unixepoch')
- view_summary.movie_id y season_id son mutuamente excluyentes
- Para series: view_summary → season → tv_show

EJEMPLO de query con fechas:
  SELECT m.title, vs.hours_viewed,
         date(vs.start_date/1000, 'unixepoch') as fecha
  FROM view_summary vs JOIN movie m ON vs.movie_id = m.id
  WHERE vs.duration = 'WEEKLY'
  ORDER BY vs.hours_viewed DESC LIMIT 10;
`;

Fíjate en tres decisiones de diseño:

Incluir las cardinalidades (~12K movies, ~37K view_summaries). Así el modelo calibra el volumen de datos y no intenta hacer cosas absurdas como un SELECT * sin límite.
Advertir de las trampas: las fechas en epoch, la tabla vacía, el campo locale casi siempre NULL.
Dar un ejemplo de query correcta. Esto es crítico. Un ejemplo vale más que tres párrafos de instrucciones. El modelo ve date(col/1000, 'unixepoch') y lo replica.

TOOL_DESCRIPTION: lo que el modelo ve al decidir si usa la herramienta ¶

Esta constante combina una descripción corta con el schema completo:

export const TOOL_DESCRIPTION =
  `Ejecuta una consulta SQL SELECT de solo lectura contra la base de datos SQLite de Netflix.
Solo se permiten consultas SELECT. Los resultados se limitan a 20 filas maximo.

${DB_SCHEMA}`;

¿Por qué meter el schema aquí y no solo en el system prompt? Porque cuando Claude decide si usar la herramienta y qué SQL escribir, tiene toda la información justo en el contexto del tool call. No depende de que el system prompt esté “cerca” en la ventana de contexto.

SYSTEM_PROMPT: las reglas de comportamiento ¶

export const SYSTEM_PROMPT = `Eres un analista de datos especializado en el catalogo de Netflix.

REGLAS:
- Responde SIEMPRE en espanol
- Usa tablas markdown para mostrar resultados
- Si una consulta SQL falla, analiza el error y corrige la query
- Limita los resultados a 20 filas maximo
- Convierte las fechas epoch con date(col/1000, 'unixepoch')
- Para series: JOIN view_summary → season → tv_show
- La tabla episode esta vacia, no la uses
- Explica brevemente que consulta hiciste y que significan los resultados`;

El system prompt define comportamiento. El schema define conocimiento. Están separados a propósito. Puedes ajustar las reglas del agente sin tocar la descripción de los datos, y viceversa.

La regla más potente es la de autocorrección. Cuando la herramienta devuelve un error de SQL, el modelo lo lee, entiende qué falló y genera una query corregida en el siguiente turno. Es un bucle de feedback implícito que el Agent SDK gestiona con maxTurns.

¿Cómo se crea una herramienta personalizada para el agente? ¶

Este es el corazón del proyecto. En src/db.ts abrimos la conexión SQLite y definimos la herramienta que el modelo puede invocar. El Model Context Protocol (MCP) es un estándar abierto impulsado por Anthropic para conectar agentes de IA con herramientas y fuentes de datos externas, según la documentación oficial del Agent SDK. Si quieres entender MCP en profundidad y construir tu propio servidor desde cero, te recomiendo el tutorial completo de MCP con TypeScript.

Conexión a la base de datos ¶

import { tool } from "@anthropic-ai/claude-agent-sdk";
import { z } from "zod";
import Database from "better-sqlite3";
import { resolve, dirname } from "node:path";
import { fileURLToPath } from "node:url";
import { TOOL_DESCRIPTION } from "./prompts.js";

const __dirname = dirname(fileURLToPath(import.meta.url));
const dbPath = resolve(__dirname, "../db/netflixdb.sqlite");

// La base se abre en modo solo lectura: doble protección
export const db = new Database(dbPath, { readonly: true });

La DB se abre en modo readonly. Esto es una red de seguridad a nivel de driver: aunque el modelo intentara un DROP TABLE, better-sqlite3 lo rechazaría antes de que llegue a SQLite.

Definir la herramienta con `tool()` ¶

La función tool() del SDK crea una herramienta MCP con nombre, descripción, esquema de entrada (Zod) y handler:

export const queryDatabaseTool = tool(
  "query_database",           // Nombre de la herramienta
  TOOL_DESCRIPTION,           // Descripción con el schema completo
  { sql: z.string().describe("Consulta SQL SELECT a ejecutar") },
  async ({ sql }) => {
    // 1. Solo permitir SELECT
    if (!/^\s*SELECT\b/i.test(sql)) {
      return {
        content: [{ type: "text", text: "Error: Solo se permiten consultas SELECT." }],
      };
    }

    // 2. Inyectar o recortar LIMIT a 20
    if (!/\bLIMIT\b/i.test(sql)) {
      sql = sql.replace(/;?\s*$/, " LIMIT 20");
    } else {
      sql = sql.replace(/\bLIMIT\s+(\d+)/i, (_match, n) =>
        `LIMIT ${Math.min(parseInt(n), 20)}`
      );
    }

    // 3. Ejecutar y devolver resultados (o errores legibles)
    try {
      const rows = db.prepare(sql).all();
      const json = JSON.stringify(rows, null, 2);
      const truncated = json.length > 8000
        ? json.slice(0, 8000) + "\n... (resultado truncado)"
        : json;
      return {
        content: [{ type: "text", text: `${rows.length} fila(s):\n${truncated}` }],
      };
    } catch (err: unknown) {
      const msg = err instanceof Error ? err.message : String(err);
      return {
        content: [{
          type: "text",
          text: `Error SQL: ${msg}\nQuery: ${sql}\nCorrige la consulta e intenta de nuevo.`
        }],
      };
    }
  }
);

Hay 3 capas de protección en este handler:

Validación SELECT: una regex que rechaza todo lo que no empiece por SELECT. Primera barrera contra mutaciones accidentales.
Control de LIMIT: si la query no tiene LIMIT, inyecta LIMIT 20. Si tiene un LIMIT mayor que 20, lo recorta. Sin esta protección, una query podría devolver 37.000 filas y reventar la ventana de contexto del modelo.
Try/catch con feedback: si SQLite lanza un error, la herramienta no falla. Devuelve el mensaje de error como texto plano. Esto permite al modelo leer el error, entender qué salió mal y generar una query corregida. Es el mecanismo de autocorrección.

El resultado JSON también se trunca a 8.000 caracteres como protección adicional.

🛡️ Cuando le das a un LLM acceso a una base de datos, necesitas capas de protección: readonly en el driver, validación de SELECT, límite de filas y truncado de resultados. Una sola capa no basta.

¿Cómo se ensambla todo en el entry point? ¶

El fichero src/chatbot.ts es el más corto porque solo cablea los módulos anteriores. Pero es donde ocurre la magia del SDK.

Crear el servidor MCP in-process ¶

import { query, createSdkMcpServer } from "@anthropic-ai/claude-agent-sdk";
import { db, queryDatabaseTool } from "./db.js";
import { SYSTEM_PROMPT } from "./prompts.js";

const mcpServer = createSdkMcpServer({
  name: "netflix-db",
  tools: [queryDatabaseTool],
});

createSdkMcpServer() crea un servidor MCP que se ejecuta dentro del mismo proceso Node. No es un proceso externo, no hay overhead de comunicación entre procesos. El Agent SDK expone este servidor al CLI de Claude Code como si fuera un MCP server real, pero todo corre en memoria. Según la referencia del SDK en TypeScript, esta función acepta un nombre, una versión opcional y un array de herramientas.

Lanzar la query al agente ¶

const prompt = process.argv.slice(2).join(" ");

const conversation = query({
  prompt,
  options: {
    systemPrompt: SYSTEM_PROMPT,
    tools: [],
    mcpServers: { "netflix-db": mcpServer },
    allowedTools: ["mcp__netflix-db__query_database"],
    maxTurns: 10,
  },
});

Cada opción tiene un propósito concreto:

tools: []: desactiva todos los tools integrados de Claude Code (Bash, Read, Edit…). El agente solo puede usar nuestra herramienta de consulta SQL.
mcpServers: registra nuestro servidor MCP in-process.
allowedTools: pre-autoriza la herramienta para que no pida permiso al usuario. El formato mcp__<servidor>__<herramienta> es la convención del SDK.
maxTurns: 10: máximo 10 turnos de conversación. Suficiente para que el agente haga una primera query, reciba un error, la corrija y responda. Pero evita bucles infinitos.

El bucle de mensajes ¶

for await (const message of conversation) {
  if (message.type === "result" && message.subtype === "success") {
    printResult(message.result, render);
  }
}

query() devuelve un AsyncGenerator. Emite varios tipos de mensajes durante la conversación: mensajes del asistente, tool calls, resultados de herramientas… Para nuestro chatbot solo nos interesa el resultado final: un mensaje de tipo result con subtipo success. El campo message.result contiene la respuesta formateada de Claude en markdown.

¿Cómo funciona el bucle de agente por dentro? ¶

Cuando ejecutas npm run ask "¿Cuáles son las 5 películas más vistas?", el flujo completo es este:

chatbot.ts recoge la pregunta y llama a query().
El Agent SDK lanza Claude Code CLI como subproceso y le pasa el system prompt y la herramienta MCP.
Claude recibe la pregunta, analiza la herramienta disponible y decide generar una query SQL.
El SDK intercepta el tool call y lo redirige a nuestro handler in-process.
El handler ejecuta la query contra SQLite y devuelve el resultado como texto.
El SDK le devuelve el resultado a Claude.
Claude lee los datos, los formatea en una tabla markdown y genera la respuesta final.
El AsyncGenerator emite un mensaje de tipo result y chatbot.ts lo imprime.

Si la query SQL tiene un error (una columna mal escrita, un JOIN incorrecto), SQLite lanza una excepción, el handler devuelve el error como texto, Claude lo lee, entiende qué falló y genera una query corregida. Todo dentro de los 10 turnos máximos.

Este es el poder real del SDK: tú defines la herramienta y el prompt, y el bucle de agente se encarga de la orquestación. No gestionas reintentos, no parseas tool calls, no controlas el flujo de conversación.

La encuesta de Stack Overflow de 2025 señala que el 70% de los usuarios de agentes de IA reconoce que estos reducen el tiempo dedicado a tareas específicas de desarrollo (Stack Overflow Developer Survey, 2025). Con un agente como este, la reducción es aún más notable porque eliminas el paso de escribir SQL a mano.

El SDK del agente gestiona el bucle por ti, pero elegir bien las herramientas y los límites sigue siendo cosa tuya. Cada domingo, +6.700 developers compartimos experiencias reales sobre IA aplicada al desarrollo.

Apúntate gratis →

¿Cómo se renderiza la respuesta en terminal? ¶

El módulo render.ts se encarga de pintar la respuesta con colores. Usa marked con el plugin marked-terminal para convertir el markdown de Claude (tablas, negritas, listas) en texto con códigos ANSI. No es la parte central del proyecto, pero mejora mucho la experiencia de uso.

Lo relevante del diseño es que el renderer es una función (string) => string. Si quieres cambiar la presentación (generar HTML, guardar en fichero, enviar a Slack…), solo tienes que escribir una función nueva. El resto del chatbot no se entera.

Tienes el código completo del renderizado en el repositorio del proyecto.

¿Qué buenas prácticas aplican a cualquier agente con el SDK? ¶

Después de construir este chatbot, hay varias lecciones que puedes llevarte a cualquier proyecto con el Agent SDK:

Separa el conocimiento del comportamiento. El schema de la base de datos es conocimiento. Las reglas de cómo responder son comportamiento. Ponlos en constantes distintas. Así puedes iterar sobre cada uno sin romper el otro.
Incluye ejemplos en la descripción de la herramienta. Un ejemplo de query correcta con la conversión de fechas vale más que tres párrafos explicando el formato epoch. El modelo aprende mejor por imitación.
Diseña herramientas que devuelvan errores legibles, no excepciones. Si la herramienta lanza una excepción, el agente se queda sin feedback. Si devuelve el error como texto, el agente puede autocorregirse.
Limita el scope del agente. Con tools: [] desactivas todas las herramientas integradas. Con allowedTools pre-autorizas solo las que necesitas. No le des al agente más capacidades de las que necesita.
Controla los tokens. maxTurns limita los turnos de conversación. El truncado a 8.000 caracteres limita el tamaño de las respuestas. La inyección de LIMIT 20 limita las filas. Cada capa protege la ventana de contexto.
Usa createSdkMcpServer() para herramientas in-process. No necesitas levantar un servidor MCP externo para herramientas sencillas. El servidor in-process es más rápido y más fácil de depurar.

💡 Si quieres que tu agente sea predecible, no le des acceso a todo. Limita las herramientas, limita los turnos, limita los datos. Un agente enfocado es un agente útil.

¿Cómo se ejecuta el chatbot? ¶

Con todo en su sitio, lanza una pregunta:

npm run ask "¿Cuáles son las 5 películas más vistas de Netflix?"

Claude generará algo parecido a esto en tu terminal:

────────────────────────────────────────────────────────
 NETFLIX SQL Chatbot
────────────────────────────────────────────────────────
 Pregunta: ¿Cuáles son las 5 películas más vistas de Netflix?
────────────────────────────────────────────────────────

Consulté la tabla view_summary filtrando por películas (movie_id NOT NULL)
y ordenando por horas vistas en orden descendente.

| Película             | Horas vistas |
| -------------------- | ------------ |
| Glass Onion          | 209,430,000  |
| Wednesday (Película) | 176,250,000  |
| ...                  | ...          |

Prueba con preguntas más complejas: “¿Qué series han estado más semanas en el top 10?”, “¿Cuántas películas se estrenaron en 2023?”, “Compara las horas de visualización entre películas y series”. El agente generará las queries necesarias, autocorrigiéndose si algo falla.

¿Qué más se puede hacer con el Claude Agent SDK? ¶

El SDK tiene mucho más que lo que hemos cubierto aquí. El mercado global de agentes de IA alcanzó los 7.600 millones de dólares en 2025 y se proyecta que supere los 10.900 millones en 2026, con un crecimiento anual del 45% (Grand View Research, 2025). Estas cifras reflejan una inversión real en infraestructura agentic, no solo experimentación.

Algunas direcciones que puedes explorar:

Subagentes: puedes definir agentes especializados a los que el agente principal delega tareas. Por ejemplo, un subagente para análisis de datos y otro para generar gráficos. Si quieres llevar esto al extremo con múltiples agentes coordinados, echa un vistazo a cómo funcionan los Agent Teams en Claude Code. La documentación sobre subagentes del SDK explica cómo configurarlos.
Salida estructurada: con outputFormat puedes forzar al agente a devolver JSON con un schema concreto en vez de texto libre.
Hooks: callbacks que se ejecutan antes o después de cada tool call. Útiles para logging, métricas o validaciones adicionales.
Sesiones: puedes capturar el sessionId y reanudar conversaciones previas, manteniendo contexto entre ejecuciones.

Otra dirección, si en vez de programar tú el bucle de orquestación prefieres que sea Claude quien escriba el script que reparte el trabajo entre decenas o cientos de subagentes, son los dynamic workflows de Claude Code: la contraparte dinámica de montar el harness a mano con el SDK.

Y si lo que quieres es saltarte toda la parte de orquestación, runtime y persistencia y ejecutar tus agentes en infraestructura de Anthropic, mira Claude Managed Agents: es la versión gestionada del SDK con memoria entre sesiones, evaluación por rúbrica y webhooks de producción. Si prefieres ese entorno persistente sin atarte a un único proveedor —con archivos, hosting e integraciones alrededor del agente— le dediqué un análisis a Zo Computer, un ordenador en la nube con IA.

Puedes consultar la documentación oficial del Agent SDK y los ejemplos funcionales en GitHub para profundizar.

Conclusión ¶

El Claude Agent SDK cambia la pregunta. Ya no es “¿cómo hago que un LLM use herramientas?” sino “¿qué herramienta le doy?”. La complejidad del bucle de agente, la gestión de contexto, los reintentos… todo eso ya está resuelto.

Lo que queda para ti es lo interesante: diseñar el prompt, construir la herramienta y decidir los límites del agente. Eso es programar con IA, no contra ella.

Si quieres dar el siguiente paso y dejar de depender del SDK de Anthropic para construir tus agentes, echa un vistazo a Flue, el agent harness framework de Astro: te entrega el harness completo en TypeScript y puedes desplegar tus agentes en Cloudflare Workers, GitHub Actions o tu propio Node sin atarte a un único proveedor. Y si prefieres un framework completo con agentes, herramientas, memoria y workflows en un mismo paquete, tienes la guía para crear tu primer agente con Mastra, también nativo de TypeScript y agnóstico de proveedor.

Tienes una base de datos de Netflix, cuatro ficheros TypeScript y un agente que autocorrige sus propias queries. ¿Qué base de datos le pondrías tú?

Preguntas frecuentes ¶

¿Necesito una API key de Anthropic para usar el Claude Agent SDK? ¶

No necesitas API key si ya tienes Claude Code autenticado con una suscripción Pro o Max. El SDK usa la sesión de Claude Code CLI. Si prefieres usar créditos de API, configura la variable de entorno ANTHROPIC_API_KEY y el SDK la usará en su lugar. Puedes consultar las opciones de autenticación en la guía de configuración de Claude Code.

¿Qué diferencia hay entre el Claude Agent SDK y la API de mensajes de Anthropic? ¶

La API de mensajes (/v1/messages) te da acceso directo al modelo, pero tú gestionas el bucle de herramientas. El Agent SDK te da el bucle de agente completo: herramientas integradas, gestión de contexto, autocorrección y orquestación de turnos. Es una capa de abstracción por encima de la API que automatiza todo el ciclo de tool calling.

¿Puedo usar Python en vez de TypeScript? ¶

Sí. El Claude Agent SDK tiene paquetes para ambos lenguajes. En Python se instala con pip install claude-agent-sdk y la función principal es también query() con ClaudeAgentOptions. La referencia del SDK en Python detalla la API completa.

¿Qué es un servidor MCP in-process? ¶

Es un servidor MCP (Model Context Protocol) que se ejecuta dentro del mismo proceso Node.js, sin comunicación entre procesos ni sockets. Se crea con createSdkMcpServer() y es la forma más sencilla de definir herramientas personalizadas para el agente. El MCP es un estándar abierto respaldado por Anthropic.

¿Cómo evito que el agente haga cosas que no debe? ¶

Con tres mecanismos combinados: tools: [] para desactivar herramientas integradas, allowedTools para autorizar solo las que necesitas, y validaciones dentro del handler de tu herramienta (como la comprobación de SELECT y el límite de filas). Según la encuesta de Stack Overflow de 2025, el 87% de los desarrolladores tiene preocupaciones sobre la precisión de las herramientas de IA, lo que refuerza la importancia de estas capas de control. De hecho, soltar un agente sin ponerle límites es uno de los errores que más caro se pagan en cuanto lo expones a usuarios reales.

¿Qué pasa si la query SQL del modelo falla? ¶

El handler atrapa la excepción y devuelve el mensaje de error como texto legible. El modelo lee el error, entiende qué falló y genera una query corregida en el siguiente turno. El parámetro maxTurns controla cuántos intentos tiene antes de que el SDK detenga el bucle.

¿Puedo conectar el agente a otras bases de datos que no sean SQLite? ¶

Sí. El handler de la herramienta es código TypeScript estándar. Puedes usar cualquier driver de base de datos: PostgreSQL con pg, MySQL con mysql2, MongoDB con su driver nativo… Solo necesitas adaptar la conexión y las protecciones de validación.

¿El Agent SDK funciona con modelos que no sean Claude? ¶

No. El SDK depende de Claude Code CLI y está diseñado para funcionar con los modelos de Anthropic (Sonnet, Opus, Haiku). Si necesitas usar modelos de otros proveedores, puedes configurar el SDK para trabajar con Amazon Bedrock o Google Vertex AI, pero siempre con modelos Claude.

¿Puedo usar múltiples herramientas en un mismo agente? ¶

Sí. Puedes definir varias herramientas en un mismo createSdkMcpServer() y autorizar cada una con allowedTools. El modelo decide cuál usar en función de la pregunta del usuario. La guía de herramientas personalizadas muestra cómo gestionar herramientas múltiples con autorización selectiva.

¿Dónde encuentro el código completo de este proyecto? ¶

El código fuente está disponible en el repositorio del proyecto. Incluye la base de datos SQLite, los 4 ficheros TypeScript y las instrucciones de instalación para que lo tengas funcionando en minutos.

Fuentes ¶

Documentación oficial

Documentación del Claude Agent SDK — Anthropic
Referencia TypeScript del SDK — Anthropic
Guía de herramientas personalizadas (Custom Tools) — Anthropic
Guía de MCP en el Agent SDK — Anthropic
Ejemplos del Claude Agent SDK en GitHub — Anthropic

Datos y estadísticas

Stack Overflow Developer Survey 2025 — Sección AI — Stack Overflow
Gartner Platform Forecast 2025 — Gartner
Grand View Research — AI Agents Market Size — Grand View Research
GEO: Generative Engine Optimization — Aggarwal et al., KDD 2024

🧨 Última oprtunidad para recibir la dinamita que mereces sobre programación con IA el próximo domingo: Suscríbete gratis a Web Reactiva en https://webreactiva.com/newsletter

Escrito con la ayuda de la IA generativa de Claude, fuentes fidedignas y con un human in the loop:
Dani Primo.

CEO en pantuflas de Web Reactiva. Programador y formador en tecnologías que cambian el mundo y a las personas. Activo en linkedin, en substack y canal @webreactiva en telegram

12 recursos para developers cada domingo en tu bandeja de entrada

Además de una skill práctica bien explicada, trucos para mejorar tu futuro profesional y una pizquita de humor útil para el resto de la semana. Gratis.