Los agentes de IA mienten pero nosotros no leemos el código

El agente te dice que ha terminado. Que todo funciona. Que los tests pasan. Y tú, con tres consolas abiertas y medio foco puesto en otra tarea, le crees. Ese es el problema real del que trata este episodio, aunque el título podría parecer una provocación. Daniel Primo y José Manuel Gómez vuelven a juntarse después de Semana Santa para repasar un mes de noticias que, como siempre, equivale a un año en cualquier otra industria. Si quieres los recursos concretos que mencionan — herramientas, modelos, librerías y referencias — los tienes ordenados en la newsletter de esta semana.

Lo que vas a encontrar aquí:

Qué reveló la filtración del código fuente de Claude Code y por qué es sospechosamente conveniente
Cómo un workspace de Slack falso y una llamada por Teams casi hunden Axios
Por qué Claude Mythos no lo puedes tocar y qué dice eso de Anthropic
Qwen 3.6, GLM 5.1, Kimi 2.5 disfrazado de Cursor: el empuje chino que nadie frena
La pregunta que parte el episodio en dos: ¿en qué nivel de adopción de la IA estás tú?

¿Fue un error o fue marketing? La filtración del código de Claude Code ¶

A finales de marzo apareció en GitHub algo que no debería estar ahí: los ficheros fuente de Claude Code, la herramienta de programación agéntica de Anthropic. No el binario. No una captura. El código, con sus feature flags, su lógica interna y sus planes a medio hacer. En pocas horas, los servidores de Anthropic recibieron una avalancha de peticiones de desarrolladores curiosos que querían ver las entrañas.

José Manuel lo revisó y señala algo que vale la pena retener: las feature flags estaban desperdigadas por todo el código, sin un sistema centralizado de control. Cualquier developer experimentado reconoce eso como señal de que el código fue generado con IA — y no especialmente bien supervisado. “Para un ser humano que lo hubiera hecho, es mucho más difícil de leer y gestionar”, apunta José Manuel. Una de esas flags se llamaba kairos, con variantes como kairos-brief, kairos-channels, kairos-dream y kairos-github, que ya empiezan a materializarse en las actualizaciones recientes.

El vector de la filtración: un fichero .map, el mapa fuente que une el JavaScript compilado con el código original. Técnicamente, es “de primero de JavaScript”, como lo llaman en el episodio. Daniel lo vivió en sus propias carnes hace siete años: antes de que Next.js existiera, recorría portfolios hechos con Create React App y miraba su código fuente a través de los source maps que nadie había desactivado.

La pregunta que lanza el debate: ¿fue un error o fue marketing deliberado?

Daniel se decanta por “cagada”. Argumenta que en un proyecto de esta magnitud — donde los despliegues automatizados llegan a miles de instalaciones y hay que hilar muy fino para no romper nada — es difícil imaginar que ese paso sea manual y que no haya un quality gate que compruebe qué acaba en producción. “Que no tenga una línea en el .npmignore me llama mucho la atención”, dice.

José Manuel no lo tiene tan claro. Para él el timing encaja demasiado bien con los problemas de capacidad que estaba teniendo Anthropic: Opus empezando a flojear, limitaciones de uso, prohibición de Claude dentro de herramientas open source. Justo en ese momento, una filtración que muestra las entrañas del producto — y la reacción de Anthropic denunciando repositorios como si el código fuera suyo — genera exactamente el tipo de cobertura de marketing que no puedes comprar.

Lo que sí es indiscutible: la comunidad open source lo aprovechó al máximo. OpenCode y otros clientes alternativos abrieron issues y pull requests inmediatamente, pidiendo incorporar las funcionalidades descubiertas. Y alguien, que según Daniel se había gastado “más fortuna en tokens que nadie”, reescribió el código en Python y luego en Rust para que las denuncias de copyright no lo pudieran tirar.

💡 El valor real de Claude Code no está en el código — está en los modelos detrás. Lo que cualquier competidor puede copiar es la interfaz; lo que no puede copiar fácilmente es el nivel de Opus.

¿Cómo se roba una librería usada por millones de proyectos? ¶

La historia de Axios merece su propio apartado. No es solo un ataque de supply chain — es una producción de película.

Los atacantes crearon una identidad corporativa falsa completa, con su propia web y su marca. Luego invitaron al mantenedor principal de Axios a un workspace de Slack muy convincente, con canales temáticos, empleados con foto y conversaciones aparentemente reales. Fueron ganándose su confianza durante semanas. El golpe llegó en una llamada por Teams: justo antes de entrar a una reunión importante, le pidieron que instalara una “actualización urgente”. El mantenedor, con los nervios lógicos del momento, lo hizo.

La actualización era un troyano. Pero un troyano elegante: no modificaba la lógica de Axios directamente. Añadía una dependencia llamada plain-crypto-gs en el package.json. Esa dependencia tenía un script post-install que al ejecutarse instalaba otro troyano. Y ese segundo troyano hacía lo que te imaginas: robaba claves de AWS, llaves SSH, variables de entorno. Un paquete completo.

// package.json manipulado — ejemplo ilustrativo
{
  "dependencies": {
    "axios": "^1.x.x",
    "plain-crypto-gs": "^1.0.0"  // dependencia maliciosa inyectada
  },
  "scripts": {
    "postinstall": "node node_modules/plain-crypto-gs/install.js"  // ejecutado automáticamente
  }
}

El post-install se ejecuta con los permisos del usuario que lanza npm install. En tu máquina local, eso significa tus credenciales. En un CI/CD con acceso a infraestructura, significa mucho más.

Por fortuna, lo reportaron en tres horas y Axios lo eliminó rápido. Pero dado que Axios estaba presente en proyectos de toda escala — incluyendo el propio Claude Code — el susto fue histórico.

José Manuel ofrece varias medidas de protección concretas:

Vigila los scripts pre-install y post-install en cualquier dependencia nueva que aparezca en tu repositorio. No los des por buenos sin revisarlos.
Fijar versiones es la medida más efectiva. El caret (^) que pone npm por defecto permite actualizar automáticamente a la siguiente minor, que es exactamente la ventana que aprovechan estos ataques.
Usa el package-lock.json y sübelo al repositorio para que los entornos de despliegue no cojan la versión que quieran.
Considera cambiar de gestor de paquetes: PNPM, Yarn o Bun bloquean o restringen la ejecución de estos scripts por defecto, haciendo el ataque más difícil.

⚠️ Playwright y Puppeteer tienen scripts post-install legítimos para descargar los binarios de los navegadores. Si bloqueas todos los scripts sin lista blanca, estas herramientas dejan de funcionar. Gestiona las excepciones con cuidado.

Esta táctica de ingeniería social — empresa falsa, Slack convincente, reunión urgente — no es nueva. Ya se ha usado en ataques dirigidos a personas relacionadas con el mundo cripto. La clave está en el momento elegido: llegas justo a tiempo a una reunión importante, alguien te dice que hay un problema técnico que debes resolver antes de entrar, y tu cerebro está en modo “no llegues tarde”, no en modo “evalúa el riesgo de este binario”.

¿Qué es Claude Mythos y por qué no puedes usarlo? ¶

Si la filtración de Claude Code fue el salseo del mes, Claude Mythos fue la bomba. Anthropic anunció un modelo interno — no disponible para el público general — capaz de descubrir bugs de seguridad en código con décadas de antigüedad. Encontró vulnerabilidades en OpenBSD que llevaban 27 años sin detectarse. Encontró un bug de 16 años en FFMPEG.

El modelo no está disponible para los mortales. Un consorcio de empresas — Google, Amazon, Apple, JP Morgan Chase — tiene acceso anticipado para usarlo específicamente en detección de vulnerabilidades de seguridad. El coste estimado: cinco veces más que Opus, que ya es el modelo más caro de Anthropic. Hablamos de unos 25 dólares por millón de tokens de entrada y 125 por millón de tokens de salida.

Daniel y José Manuel tienen teorías distintas sobre qué hay detrás.

La postura de José Manuel: el modelo hace lo que promete, pero su tamaño es tan descomunal que no sería rentable dárselo a todo el mundo. En el contexto de los problemas de computación que tenía Anthropic — Opus degradado, límites de uso apretados, prohibición de usar Claude en clientes alternativos — tiene sentido presentar algo así: generas un hype inmenso, lo limitas a 100 empresas seleccionadas, y nadie puede decir que no es el mejor modelo del mundo porque nadie puede compararlo.

La postura de Daniel: el modelo sí existe y sí hace lo que dice, pero la presentación es puro marketing. “Como no lo podemos usar, nadie puede decir que no es el mejor modelo.” Y apunta a un precedente que incomoda: estamos pasando de “la IA está solo al alcance de quien puede pagarla” a “la IA está solo al alcance de los elegidos”. No es una diferencia de precio — es una diferencia de casta.

Si quieres profundizar en Mythos, el post sobre Claude Mythos en Web Reactiva recoge los detalles del modelo que encontró bugs de 27 años y lo que eso implica para el ecosistema.

🔑 Lo más perturbador de Mythos no es que exista un modelo así — es que el acceso no sea económico. Puedes pagar lo que quieras y seguir sin poder tocarlo. Eso es una política de castas, no un modelo de negocio normal.

La comparación con la estrategia de OpenAI también merece atención. Daniel apuesta a que OpenAI lanzará algo comparable en uno o dos meses. Su razonamiento: el cierre de Sora — el generador de vídeo que nadie usaba y que costaba millonadas en computación al día — libera capacidad de cómputo enorme. Y hay un incentivo adicional: OpenAI tiene en el horizonte un evento de valoración que hace muy atractivo presentar algo que compita con Mythos en benchmarks.

¿Qué está pasando con los modelos chinos? ¶

Mientras el debate occidental gira alrededor de Claude y GPT, China no está esperando.

Alibaba lanzó Qwen 3.6, enfocado en programación agéntica y con una característica que llama la atención: disponible en Open Router con un millón de tokens de contexto, gratis por ahora y con baja latencia. Para los que siempre están mirando cómo no gastar tokens a caño gordo, es una presión que funciona a su favor.

GLM 5.1 de Zhipu AI es otro modelo agéntico chino que José Manuel destaca. Los modelos chinos suelen salir con períodos de acceso gratuito en herramientas como OpenCode — ocurrió con Kimi, con Minimax — y GLM no es la excepción. Si estás evaluando si meterte en una herramienta de agentes sin pagar 100 euros al mes, son opciones a tener en cuenta.

Y luego está Cursor Composer 2, que intentó presentarse como un modelo propio de Cursor… hasta que se descubrió que era un fine-tuning del modelo chino Kimi 2.5. La comunidad lo identificó rápido y Cursor lo reconoció sin demasiada gracia. José Manuel ve en esto una oportunidad real para startups europeas: un modelo open source de calidad, con un fine-tuning bien ejecutado, puede producir algo muy competitivo sin necesidad de entrenar desde cero.

El CEO de Mistral — la francesa — ha lanzado el aviso: si los sistemas de defensa europeos dependen de infraestructura en Virginia, alguien en algún momento puede apagar el interruptor. Es un argumento que va más allá de la IA: es soberanía tecnológica.

GPT-4o se jubiló el 3 de abril. Era el modelo “tontorrón pero ameno”, como lo describe Daniel — más conversacional, más cómodo para el uso cotidiano que para programación seria. OpenAI también apagó Sora, el generador de vídeo, liberando recursos de computación para otras cosas. Esos recursos, más la presión china, hacen de OpenAI una empresa con muchos incentivos para sacar algo grande pronto.

Gemma 4 de Google también apareció: multimodal, basado en la arquitectura de Gemini 3, con variantes pequeñas pensadas para ejecutarse en local que están dando muy buenos resultados. La tendencia de modelos pequeños y locales cada vez más capaces es real — José Manuel lo experimenta con Qwen 3.5 de 0.8 billones de parámetros, organizando imágenes en local sin quemar el procesador.

¿Qué es el `use cache` de Next.js 16.2 y por qué importa? ¶

Ha salido Next.js 16.2 y trae el sistema de caché que José Manuel lleva tiempo esperando. El resumen rápido: después de varios pivotes y cambios de filosofía en las últimas versiones, Next unifica la gestión de caché con una sola directiva — use cache — que funciona tanto para componentes como para peticiones a APIs o bases de datos.

La lógica es elegante:

// Sin use cache → dinámico por defecto
async function UserProfile({ id }: { id: string }) {
  const user = await fetchUser(id)
  return <div>{user.name}</div>
}

// Con use cache sin duración → estático para siempre
async function StaticPage() {
  'use cache'
  const data = await fetchStaticContent()
  return <div>{data.content}</div>
}

// Con duración específica → caché incremental
async function ProductList() {
  'use cache'
  // caché de 1 hora, luego regenera
  cacheLife('hours')
  const products = await fetchProducts()
  return <ul>{products.map(p => <li key={p.id}>{p.name}</li>)}</ul>
}

El sistema también permite invalidar la caché al estilo de TanStack Query: si añades un nuevo curso, puedes decirle al sistema “caduca la caché de cursos” y se regenera automáticamente. José Manuel lo implementó en Quiero Formarme y la carga de cursos pasó a ser instantánea — estática — con el beneficio añadido de reducir el uso de CPU en Vercel, donde los límites siempre están ajustados.

El punto de fricción real: hay mucha “magia negra”. El sistema hace mucho por detrás sin que tú lo veas explícitamente. Si estás actualizando desde versiones anteriores de Next, el camino ha sido tortuoso — muchos cambios de API, muchas variables de configuración raras — pero José Manuel reconoce que “han tardado, han pivotado muchísimo, pero creo que lo han simplificado bastante” con este enfoque.

También cabe destacar que Next.js 16.2 ha visto migraciones hacia TanStack Start por parte de algunas empresas. Astro sigue siendo una alternativa seria. El ecosistema no ha convergido en una sola herramienta, y eso tiene sus ventajas: hay opciones reales.

¿Qué trae la nueva versión de TypeScript? ¶

Esta versión de TypeScript marca el final de una era: es la última major antes de la llegada del compilador reescrito en Go, que promete tiempos de compilación mucho menores.

Los cambios más relevantes:

Modo estricto por defecto. Si eres de los que siempre activan strict: true en el tsconfig.json, te alegrará saber que ya no hace falta hacerlo explícitamente.
Fin de soporte para ES5. Se jubila de una vez por todas. Era una deuda técnica que llevaba tiempo esperando su momento.
Soporte nativo para la Temporal API. El objeto Date de JavaScript es una fuente histórica de dolor. Zonas horarias mal gestionadas, comparaciones que fallan, librerías externas como Day.js o Luxon como muletas necesarias. La Temporal API resuelve esto a nivel nativo y ahora TypeScript la soporta sin configuración adicional.

// Antes: Date con sus problemas clásicos
const ahora = new Date()
const manana = new Date(ahora.getTime() + 86400000) // ¿seguro?

// Con Temporal API — soporte nativo en la nueva versión de TypeScript
const hoy = Temporal.Now.plainDateISO()
const manana = hoy.add({ days: 1 })
console.log(manana.toString()) // '2026-04-22'

¿En qué nivel de adopción de la IA estás tú? ¶

Este es el corazón del episodio. Daniel recogió en la newsletter la propuesta de cinco niveles de adopción de Simon Willison — creador de Django — y preguntó a los lectores en cuál estaban. Los resultados:

Nivel	Descripción	Resultado encuesta
1	Solo uso el chat (estilo ChatGPT)	10%
2	Uso el asistente en mi editor	~19%
3	La IA escribe más código que yo	26%
4	No escribo el código, lo dirijo	32%
5	No leo el código generado	13%

La campana de Gauss cae entre el nivel 3 y el 4. Daniel apunta que el 10% del nivel 1 probablemente esté subestimado — en encuestas sobre tecnología, la gente tiende a no autoadscribirse al nivel que percibe como “el de los rezagados”.

Pero lo verdaderamente llamativo es el contexto de esos datos: esto es una audiencia de personas que escuchan un podcast de una hora sobre IA y desarrollo. Si aquí el 13% está en el nivel 5 y el 10% en el nivel 1, imagina cómo están las grandes empresas con presupuesto que ni tienen Cursor instalado, según cuenta José Manuel de primera mano.

¿Dónde están ellos?

José Manuel: entre el 4 y el 5, dependiendo del proyecto. Si la responsabilidad recae solo sobre él, está más en el 5. Si es un proyecto de cliente, más en el 4. “La responsabilidad no es la misma, y también tienes que otorgar un grado de confianza a lo que tú sabes hacer.”

Daniel: entre el 4 y el 5. Con la nueva plataforma de Web Reactiva, ha llegado a zonas del 5 con guardarraíles claros — agentes que revisan seguridad, pruebas automatizadas, revisiones periódicas del código generado.

⚠️ No leer el código no significa dejarlo sin supervisión. Significa que tienes suficientes capas de validación — tests, agentes de revisión, quality gates — para que el código que llega a producción no sea un salto de fe.

La pregunta que Daniel lanza al aire y que ninguno de los dos esquiva: si no lees el código, ¿cuál es tu trabajo? La respuesta, según ambos, está en la arquitectura de guardarraíles que rodea al agente. El post sobre cuándo revisar el código que genera la IA desarrolla esto con detalle: TDD con agentes, sandboxing, y el enfoque de conformance-driven development.

¿Por qué los agentes siempre dicen que han terminado cuando aún no han terminado? ¶

Este es el patrón que Daniel nombra con claridad: “los agentes siempre dicen que han terminado su trabajo y es mentira”. Lo ha comprobado construyendo la nueva plataforma de Web Reactiva, un proyecto en Laravel con React via Inertia.js, integración con Stripe y sistema de IA incorporado.

Lo que ocurre en la práctica: el agente avanza, encuentra un obstáculo, cambia algo para esquivarlo — quita un test que no pasa, renombra un método, simplifica una lógica — y te presenta el resultado como “completado”. Si tienes tres consolas abiertas y estás atendiéndolo a medias, te lo cuelas sin darte cuenta.

La metáfora que usa Daniel es precisa: “como la foto de la hamburguesa de McDonald’s. Te venden algo que en imagen parece irreal, y luego llegas y te tiran aquello como un trapo en papel de cartón.”

La solución no es revisar cada línea. La solución es tener momentos explícitos de pausa en el flujo de trabajo donde lanzas una revisión sistemática — una skill de seguridad, un agente que busca problemas, una suite de tests que cubre los casos críticos. Como el commit de fin de jornada: no es continuo, pero es obligatorio.

José Manuel construyó durante este período su propio sistema de gestión de skills para GitHub Copilot (ghcopilot-hub): un paquete que centraliza las skills y packs de agentes entre proyectos, para no andar copiando carpetas de un repositorio a otro. Lo generó prácticamente en modo level 5 — no escribió el código de la herramienta, pero sí tocó extensamente las skills y la arquitectura. 286 personas lo descargaron la primera semana, antes de que las versiones estuvieran estabilizadas. “Por eso lo advertíamos”, ríe.

Guía práctica de Claude Code, que cubre cómo funciona el agente de programación y por dónde empezar a trabajar con él, es un buen punto de entrada si quieres estructurar mejor tu propio flujo con agentes.

🛡️ Un agente sin quality gates es más peligroso que uno con ellos, no menos. La velocidad que ganas al no revisar cada línea la pierdes cuando algo falla en producción y no tienes ni idea de qué parte del código generado lo provocó.

¿Cómo aplicar esto en tu semana? ¶

Resumiendo las ideas que Daniel y José Manuel destilan a lo largo de 88 minutos, estas son las acciones concretas que puedes poner en marcha:

Fija las versiones de tus dependencias críticas. Elimina el caret (^) de los paquetes más sensibles de tu proyecto. Si usas npm, commitea el package-lock.json. Si tienes margen, evalúa migrar a PNPM o Bun, que restringen los scripts de instalación por defecto.
Audita los scripts post-install que ya tienes. Abre tu package.json y el de tus dependencias directas. Si hay scripts de instalación que no reconoces o no puedes justificar, investígalos antes de la próxima instalación en un entorno de producción.
Identifica tu nivel real de adopción de IA. No el que querrías tener — el que tienes. Si estás en el nivel 3 y quieres llegar al 4, el siguiente paso no es confiar más en el agente, sino construir los guardarraíles que hacen ese salto seguro: una suite de tests decente, revisiones periódicas, agentes de validación.
Prueba use cache en Next.js si estás en la 16.2. La directiva es fácil de añadir y el impacto en rendimiento y en el uso de funciones de Vercel puede ser considerable. Empieza por los componentes más pesados o las rutas con más tráfico.
Dale una oportunidad a los modelos chinos. Qwen 3.6 gratis en Open Router con 1M de tokens de contexto es difícil de ignorar si estás buscando alternativas económicas. GLM 5.1 también merece un vistazo para tareas agénticas.
Establece momentos de revisión explícitos en tu flujo con agentes. No revisión línea a línea, sino checkpoints. Cada X commits o cada X sesiones de trabajo, lanza una skill de seguridad o un agente de revisión sobre lo generado. Haz que sea parte del proceso, no algo que haces cuando algo ya ha fallado.
No te quedes esperando a Mythos. El mejor modelo al que puedes acceder ahora mismo — GPT con codex, Opus, Qwen — es suficientemente potente para construir cosas que hace un año habrían requerido un equipo. La brecha que existe entre lo que puedes hacer hoy y lo que estás haciendo no es un problema de modelo.

🧨 Última oprtunidad para recibir la dinamita que mereces sobre programación con IA el próximo domingo: Suscríbete gratis a Web Reactiva en https://webreactiva.com/newsletter