Masterclass · La IA miente

La IA miente: cómo revisar y verificar lo que programan los agentes

Métodos prácticos para revisar, verificar y automatizar lo que generan los agentes de IA — con skills, pruebas en navegador y adversarial review entre modelos.

Antes de empezar

La IA miente. Tú ya lo sabes. Marca cuándo.

La IA ejecuta sólo parcialmente. Hace lo que nadie pidió. Da por buenos tests que fallan. Antes de seguir, marca cuáles de estas nueve has vivido — y mira el patrón.

Bingo de las mentiras

Sin puntuación negativa. Sí hay patrón.

El método

Plan, ejecuta, revisa, corrige. Y vuelta.

Disciplina mínima sin frameworks pesados. El bucle que probablemente ya haces a medias — y lo que cambia cuando lo haces entero.

Daniel describe los cuatro pasos en directo, con ejemplos reales del proyecto que se está revisando.

El puente con tu proyecto

Skill + CLI: portable, revisable, encapsulada

Cuando no hay MCP — o cuando lo hay y se come tu ventana de contexto — el patrón skill + CLI es la salida. Lo que ya usas en terminal, ahora en manos de la IA.

La skill es portable, revisable y encapsulada. Daniel muestra el patrón skill + CLI cuando no quieres pagar el coste de un MCP.

El cruce entre modelos

Un modelo mirando lo que generó otro modelo

Otro modelo piensa distinto. Pedirle a Codex/GPT que revise lo que generó Claude (o al revés) detecta cosas que el original no vio. Aquí está el comando exacto y la conversación entera.

El comando «adversarial review» de Codex CLI, aplicado a una rama generada por Claude Code. Lo que dice GPT que el otro modelo no dijo.

Programa completo · 1h 36min

Ocho capítulos. Veintiocho fragmentos. Una hora y media.

Aquí está la masterclass entera, fragmento a fragmento. Las son los momentos que más calan — según el feedback de la comunidad.

01

Presentación

11:35
  • Presentación02:13
  • El ciclo anticaos03:24
  • Por qué la IA miente en la revisión01:12
  • Stack: Claude Code y Sonnet 4.602:42
  • Capas: prompts, skills, agentes y orquestación02:04
02

Las skills como conexión con el mundo real

10:17
  • Las skills como conexión con el mundo real05:56
  • Crear skill con skill-creator04:21
03

Feature de ejemplo: compartir ideas

08:04
  • Feature de ejemplo: compartir ideas02:12
  • Plan y ejecución con Opus 4.705:52
04

Revisar la ejecución del plan

19:27
  • Revisar la ejecución del plan00:39
  • Truco para no acumular documentación en tu repositorio04:55
  • Generar skill plan-review con skill-creator02:48
  • Evaluación A/B sintética de skills11:05
05

Visual Explainer: reportar al jefe

11:22
  • Visual Explainer: reportar al jefe04:45
  • Walkthrough lineal para tus agentes06:37
06

Comandos de revisión (Claude Code leak)

04:36
  • Comandos de revisión (Claude Code leak)02:23
  • Revisión con Codex y skills externas02:13
07

Pruebas en navegador con DevBrowser

21:09
  • Pruebas en navegador con DevBrowser08:57
  • Documentar pruebas con Gherkin05:15
  • Documentar la API con pruebas de IA06:57
08

Ficheros fundacionales y reglas por carpeta

09:59
  • Ficheros fundacionales y reglas por carpeta05:53
  • Claude Design y Google Stitch02:59
  • Conclusiones finales01:07

Una pista antes de cerrar

Grabada con Sonnet 4.6 a propósito

No es una demo con el modelo más caro forzado al máximo. Es la ejecución completa con un modelo «realista» — el que casi todo el mundo puede pagar. Si el método aguanta con Sonnet, aguanta con cualquier IA.

Dudas antes de entrar

¿Qué stack uso en la masterclass?
Laravel + React + Inertia para los ejemplos, pero el método es agnóstico. El ciclo anticaos, las skills, las pruebas con DevBrowser y la revisión adversarial funcionan con cualquier stack y cualquier agente compatible con skills.
¿Necesito Claude Code Pro?
No. La presentación se grabó con Sonnet 4.6 a propósito — para que el método funcione con cuentas más modestas. El plan se hizo con Opus 4.7. Si tienes Opus, mejor; pero no es requisito.
¿Funciona con Cursor, Copilot, OpenCode o Codex?
Sí. Las skills son protocolo abierto y compatible con 30+ agentes. El adversarial review precisamente cruza modelos (Claude ↔ Codex/GPT).
¿Tengo que saber Playwright o Gherkin?
No. La masterclass enseña cómo dejar que el agente los maneje por ti. Tú diseñas los criterios; las herramientas las orquesta el agente desde la skill.
¿Puedo dejar la suscripción al terminar?
Sí. Pero la membresía incluye podcast premium completo, otras masterclasses y la comunidad. La mayoría se queda.