Cómo usar /goal para que tu agente termine lo que empieza en Codex y Claude Code

Lo más fácil del mundo es decirle a un agente “termina la tarea”. Lo más difícil es que esa intención sobreviva más de tres turnos sin que te toque a ti escribir “sigue, prueba otra vez, verifica” hasta el infinito.

Ese hueco entre la intención y la ejecución es justo lo que intenta cubrir el comando /goal. No es magia. Es un bucle con objetivo explícito, criterio de parada medible y, si lo configuras mal, una trituradora de tokens con interfaz elegante.

Vamos a ver qué hace, en qué se diferencia entre Codex CLI y Claude Code, por qué OpenCode no lo tiene (todavía), cómo se compara con el famoso ralph-loop y, sobre todo, cómo escribir un /goal que no te funda la cuota mensual.

En este post:

Qué problema resuelve /goal y por qué no es un atajo más
Sintaxis y comportamiento real en Codex CLI
Cómo lo implementa Claude Code con su stop hook y su evaluador
El hueco de OpenCode y qué hace la comunidad para tapar el agujero
Patrón práctico para redactar objetivos verificables
Comparativa directa con el ralph-loop de Geoffrey Huntley
Cuándo NO usarlo (porque la respuesta no es “siempre”)

¿Qué es el comando /goal y por qué no es un atajo más? ¶

/goal es un comando que convierte una intención del usuario en un contrato persistente entre tú y el agente. El agente no termina su tarea cuando se le acaba el turno actual: termina cuando se cumple la condición que tú escribiste.

Ese cambio parece pequeño hasta que lo pruebas.

Hasta ahora, el flujo típico con un agente de programación era este: le pides algo, ejecuta, te devuelve el control, lees, escribes “sigue”, ejecuta, te devuelve el control… y así hasta que tu paciencia o tu cuota terminan primero.

Con /goal, el agente trabaja entre turnos. Sigue. Verifica. Vuelve a intentarlo. Y solo se detiene cuando un evaluador (o tú) considera que ha llegado al final.

🎯 La diferencia entre /goal y un prompt normal no está en lo que haces, sino en quién decide cuándo se ha terminado. Sin /goal, decides tú. Con /goal, lo decide el contrato.

Este patrón ha aterrizado en al menos tres ecosistemas: Codex CLI, Claude Code y, en otra escala, Antigravity 2.0 de Google (que también tiene un /goal con su propia interpretación, ya lo cubrimos por aquí). Cada uno lo implementa a su manera. Vamos a verlo.

¿Cómo funciona /goal en Codex CLI? ¶

En Codex CLI, /goal está documentado de forma oficial como un comando para establecer, pausar, reanudar, ver o limpiar un objetivo de tarea.

La sintaxis base es directa:

/goal <objective>
/goal
/goal pause
/goal resume
/goal clear

OpenAI lo describe como un objetivo persistente unido al hilo activo, pensado para tareas grandes donde Codex debe mantener una meta durante el trabajo. Si todavía no te has peleado con esta CLI, en nuestra guía de Codex CLI desde cero cubrimos instalación, permisos y sandbox. Hay dos detalles importantes que conviene saber antes de empezar.

Detalle número uno: el objetivo no puede estar vacío y tiene un máximo de 4.000 caracteres. Si tu plan no cabe ahí (cosa rara, pero pasa), la propia documentación recomienda ponerlo en un fichero y apuntar a ese fichero desde el /goal.

Detalle número dos: puede que no aparezca disponible si no activas la feature. La docs oficial menciona la opción features.goals en config.toml o el comando codex features enable goals. Si lo lanzas y no responde, ya sabes por dónde mirar.

El cookbook oficial de OpenAI lo define con una frase que vale la pena releer: un goal no es “haz esto ahora”, sino “mantén este resultado como contrato hasta que haya evidencia de que está cumplido”. Y añade que puede terminar por varios caminos: éxito, pausa, limpieza manual, interrupción del usuario, agotamiento de presupuesto o bloqueo que requiera intervención humana.

Un /goal bien escrito en Codex ¶

/goal Implementa docs/plan.md hasta que npm test y npm run lint terminen en 0.
No modifiques fixtures ni snapshots salvo que el plan lo pida explícitamente.
Trabaja por checkpoints. Registra qué has cambiado.
Detente si tras 12 turnos no hay progreso verificable.

Un /goal mal escrito en Codex ¶

/goal mejora la app

Eso no es un objetivo. Es una carta a los Reyes Magos.

La diferencia entre los dos no es el tamaño del prompt. Es la verificabilidad. En el primero hay comandos concretos (npm test, npm run lint), zonas prohibidas (fixtures, snapshots), un ritmo (checkpoints) y un freno (12 turnos). En el segundo, nada.

El método SDD paso a paso

El método para escribir specs que tu agente sí puede verificar

Verás cómo convertir una intención difusa en un objetivo verificable: cinco fases, ejemplo guiado real y plantilla para empezar hoy.

Asomarme al método →

Incluye autodiagnóstico + plantilla descargable

¿Cómo funciona /goal en Claude Code? ¶

Claude Code también tiene /goal oficial, pero su implementación técnica es algo distinta.

La documentación dice que requiere Claude Code v2.1.139 o posterior y que establece una condición de finalización: Claude sigue trabajando entre turnos hasta que esa condición se cumpla.

La diferencia interna importante es esta: en Claude Code, /goal funciona como un atajo de un stop hook prompt-based limitado a la sesión. Después de cada turno, un modelo rápido y pequeño evalúa si la condición se ha cumplido. Si no, Claude arranca otro turno. Si sí, se para.

¿Por qué importa este detalle? Porque te da una pista sobre el coste en tokens.

💡 El evaluador usa un modelo pequeño y rápido. Los tokens que gasta esa evaluación son despreciables comparados con los del trabajo principal del agente. El problema nunca es el evaluador. El problema son los turnos que el evaluador deja pasar.

La propia documentación compara /goal con sus primos cercanos dentro de Claude Code:

/goal: continúa cuando termina el turno anterior y se detiene cuando el evaluador confirma la condición.
/loop: relanza cada cierto intervalo temporal.
Stop hook personalizado: decide mediante tu propio script o prompt.
Auto mode: aprueba herramientas dentro de un turno, pero no inicia turnos nuevos.

Otra ventaja útil: puedes lanzar /goal sin argumentos para ver el estado, la duración, los turnos evaluados y el token spend acumulado. Visibilidad sobre lo que estás gastando, sin necesidad de abrir el dashboard.

Ejemplo de /goal en Claude Code ¶

/goal Todos los tests de tests/Feature/Auth pasan,
npm run lint termina en 0,
y git diff no contiene cambios fuera de app/Http/Auth y tests/Feature/Auth.
Si no se consigue en 10 turnos, detente con diagnóstico y siguiente acción recomendada.

Claude Code también admite lanzar /goal en modo no interactivo desde la terminal:

claude -p "/goal CHANGELOG.md has an entry for every PR merged this week"

Y aquí ya empieza a oler a “me voy a por café y que la máquina sufra”… pero al menos con papeles en regla.

Si te interesa entender cómo cambia tu trabajo con agentes como Claude Code o Codex, cada domingo compartimos lo que estamos aprendiendo sobre IA en el desarrollo. Ya somos +6.700 y es gratis desde 2018.

Suscríbete gratis →

El comando /goal en OpenCode ¶

OpenCode no tiene /goal oficial en su lista de comandos built-in.

Su documentación de TUI incluye comandos útiles como /connect, /compact, /init, /models, /new, /sessions, /undo, /redo… pero ni rastro de /goal.

Lo que sí tiene OpenCode es una base bastante interesante para construir algo parecido por tu cuenta:

Custom commands en .opencode/commands/ o en ~/.config/opencode/commands/.
Comandos definidos en Markdown o JSON.
Posibilidad de elegir agent, model y subtask desde el comando.
Inyección de argumentos con $ARGUMENTS.
Inclusión de salida de shell con !comando.
Referencias a ficheros con @archivo.

Aquí está la trampa. Un custom command llamado /goal en OpenCode no es equivalente al /goal de Codex o Claude Code. Sería un prompt reutilizable, nada más. No tendría por sí solo estado persistente del objetivo, evaluación automática tras cada turno, contador de turnos, pausa/reanudación reales ni presupuesto.

Para llegar a eso necesitas tres cosas: un plugin, un wrapper externo o usar el servidor/API de OpenCode. La documentación del OpenCode Server expone endpoints como prompt_async y /session/:id/command, así que técnicamente puedes construir un loop externo que inspeccione los resultados y mande “continúa” o “para”.

¿Mientras tanto? La comunidad ya ha publicado plugins que rellenan el hueco. Hay dos que merece la pena conocer.

El primero es opencode-goal-plugin de willytop8. Sigue una lógica sencilla: el agente cierra con [goal:complete] cuando termina o con [goal:blocked] cuando necesita tu intervención. Por defecto trae límites de seguridad razonables (10 turnos de auto-continue, 15 minutos de duración, 200.000 tokens trackeados) y admite flags por objetivo como --max-turns, --max-minutes o --max-tokens para no invocar al demonio de los tokens.

El segundo es @prevalentware/opencode-goal-plugin, con un enfoque más completo: estado persistente entre sesiones, indicador del goal en la TUI con tiempo transcurrido, herramientas de agente como set_goal o update_goal, y un detalle importante: para cerrar un objetivo como complete exige evidencia verificable, y para marcarlo como unmet necesita un blocker concreto. No te deja decir “ya está” sin pruebas.

🛡️ Si trabajas con OpenCode y necesitas el comportamiento de /goal, ponle siempre un límite duro de iteraciones desde el primer día. Sin freno explícito, esto se va de las manos antes de que termines el café.

Tabla comparativa: /goal en Codex, Claude Code y OpenCode ¶

Antes de seguir, pongamos lo importante en cristalino. Esta tabla resume las diferencias visibles según las documentaciones oficiales y la práctica de la comunidad.

Característica	Codex CLI	Claude Code	OpenCode
`/goal` built-in	Sí	Sí (desde v2.1.139)	No
Pausa/reanudar/limpiar	Sí (`pause/resume/clear`)	Implícito en la sesión	N/A
Límite de caracteres del objetivo	4.000 caracteres	Sin límite documentado	N/A
Mecanismo de parada	Contrato persistente del hilo	Stop hook con evaluador externo	Hay que construirlo
Visibilidad de tokens	Limitada en `/goal` directo	Muestra spend al consultar estado	Depende del plugin
Activación previa	Puede requerir `features.goals`	Disponible si la versión es válida	Custom command o plugin

Lo importante: ninguno te libera del trabajo de redactar bien el objetivo. Si lo escribes mal, todos fallan igual.

¿Cómo se escribe un /goal que no te arruine la cuota? ¶

Aquí está la parte que de verdad va a cambiar tu día.

He visto hilos en Reddit donde un /goal lleva más de dos días corriendo y supera los 1.600 millones de tokens acumulados. La respuesta más ingeniosa del hilo era “¿el objetivo era gastar dinero?”. Tiene gracia hasta que la factura llega. Y si ya andas vigilando el consumo, muchas de las técnicas para ahorrar tokens en Claude Code aplican igual de bien a un /goal.

El problema no es el comando. El problema es que el comando hace exactamente lo que le pides, ni más ni menos. Si le pides “mejora esto hasta que esté bien”, se queda iterando hasta que se acabe el planeta, porque “bien” no es medible.

La estructura sensata para un /goal se compone de cinco partes:

Estado final verificable: qué tiene que ser cierto cuando termine.
Comando de verificación: cómo se comprueba que se cumple.
Zonas prohibidas: dónde no debe meter mano.
Ritmo de trabajo: en cuántos pasos o checkpoints.
Freno explícito: cuántos turnos o cuánto tiempo antes de rendirse.

Sin los cinco, el /goal se convierte en un bash loop con factura abierta.

Plantilla práctica que puedes copiar ¶

/goal Completa [tarea] hasta que [criterio verificable].
Verifica con [comando exacto].
No modifiques [rutas/fixtures/APIs].
Trabaja en checkpoints de máximo [N] archivos.
Después de cada checkpoint ejecuta [test/lint/build].
Si fallas durante [N] turnos seguidos o superas [N] turnos totales,
detente y entrega diagnóstico.

Aplica esta plantilla a una tarea real y verás la diferencia.

⚠️ Si no puedes escribir “termina cuando X pase” con un comando concreto detrás de X, no uses /goal todavía. Usa un comando de planificación primero, parte la tarea en pedazos verificables y luego ya sueltas al bicho.

Un caso de uso bien resuelto ¶

Imagina que estás haciendo migración de un módulo de autenticación. Mal /goal sería:

/goal migra el módulo de auth a JWT

/goal bien escrito sería esto:

/goal Migra app/Http/Auth para usar JWT en lugar de sesiones.
Criterio: todos los tests de tests/Feature/Auth pasan,
PHPStan termina en nivel 6 sin warnings nuevos,
y composer test verifica que el resto del proyecto sigue verde.
No toques tests/Unit ni database/migrations ya aplicadas.
Trabaja por archivos: máximo 3 por checkpoint.
Tras cada checkpoint ejecuta composer test.
Si tras 15 turnos no hay progreso verificable, detente y entrega
un informe de bloqueos en docs/migration-blockers.md.

La diferencia entre las dos versiones es la diferencia entre “esperemos que funcione” y “esto se verifica solo”.

¿En qué se diferencia /goal del ralph-loop? ¶

Esta pregunta merece sección propia, porque hay solapamiento conceptual pero la implementación es muy distinta.

El ralph-loop (también conocido como Wiggum loop, en honor al personaje despistado e infatigable de los Simpsons) es una técnica popularizada por Geoffrey Huntley. La idea es de una simpleza casi insultante: un bash loop infinito que alimenta una y otra vez el mismo prompt a un agente de IA. Cada iteración empieza con una ventana de contexto fresca.

Punto. Eso es todo.

Huntley lo explica con humor: “Ralph es un bash loop. Es tan simple que cuando lo descubrí me dieron ganas de vomitar. Podía ver hacia dónde íbamos.”

El truco del ralph-loop está en cómo trata el contexto. En lugar de acumular contexto hasta que el modelo se vuelve idiota (lo que Huntley llama context rot), cada iteración empieza limpia. La memoria entre iteraciones se mantiene por otros medios: historial de git, ficheros como progress.txt, prd.json… Si quieres ver una implementación seria de esta técnica, el Santander AI Lab ha abierto su propia versión del ralph-loop en GitHub, con un truco extra: cuando un proveedor se queda sin cuota, rota automáticamente al siguiente agente y sigue.

¿Y /goal? /goal mantiene el contexto vivo entre turnos. No reinicia. Sigue iterando dentro de la misma sesión, con el evaluador comprobando si ya se ha cumplido el criterio.

Tabla de diferencias ¶

Aspecto	/goal	Ralph-loop
Contexto entre iteraciones	Persistente en sesión	Fresco en cada vuelta
Mecanismo de parada	Evaluador automático o turnos máximos	Promesa explícita como `<promise>DONE</promise>`
Riesgo de context rot	Sí, si la sesión se alarga	Bajo, por diseño
Coste en tokens	Predecible si pones límite de turnos	Alto y sostenido (cada vuelta es contexto nuevo)
Memoria entre vueltas	Conversación del hilo	Git, ficheros de progreso
Setup	Comando nativo del CLI	Bash + prompt template + safeguards
Buen encaje	Tareas con criterio verificable y ámbito acotado	Refactors grandes, greenfield, trabajo nocturno

Lo curioso es que se complementan. Puedes usar un ralph-loop para iterar sobre un PRD completo (cientos de tareas) y dentro de cada iteración usar /goal para garantizar que cada tarea individual se cierra con criterio verificable. Una capa por encima, otra por debajo.

¿Cuál usar? Si tu tarea tiene un final medible en un par de horas, /goal. Si tienes que hacer un trabajo enorme que puede llevar días y necesita resetear el contexto para no degradarse, ralph-loop. Si no estás seguro de cuál de las dos cosas es, parte la tarea en pedazos más pequeños hasta que esté claro.

¿Cuándo NO usar /goal? ¶

No todo es para /goal. Hay tres escenarios donde lo mejor es no activarlo.

Uno: cuando no hay criterio de éxito medible.

Si la tarea es “hazlo bonito” o “que quede mejor”, el agente no tiene forma de saber cuándo parar. Vas a perder tokens iterando sobre algo intangible. Cuando alguien me pide algo así, lo descompongo: ¿bonito comparado con qué? ¿Mejor en qué métrica concreta?

Dos: cuando ya estás encima del agente.

Si estás guiando paso a paso, conversando, ajustando matices… /goal te aporta poco. Su valor aparece cuando quieres que la intención sobreviva varios turnos sin que tú estés delante.

Lo dice un hilo de Reddit con bastante razón: si Codex (o Claude Code) ya hace lo que necesitas con un prompt normal, el comando no añade tanto.

Tres: cuando el trabajo es ambiguo o exploratorio.

Si estás haciendo prototipos rápidos, probando enfoques, descartando opciones… un /goal te encierra en un único camino. Lo que necesitas ahí es flexibilidad, no contrato.

🔑 /goal brilla cuando ya sabes qué tiene que pasar y solo te falta que pase. Si todavía estás descubriendo qué tiene que pasar, no lo uses. Planifica antes.

Saber cuándo NO usar una herramienta se aprende probando y compartiendo. Cada domingo, +6.700 developers intercambiamos experiencias y recursos sobre adopción de IA en el día a día del desarrollo. Gratis.

Suscríbete gratis →

El flujo recomendado: planificar primero, /goal después ¶

Esta es la receta que mejor funciona en la práctica.

Primero usas un comando de planificación (/plan en Codex y Claude Code, o el equivalente en tu agente) para convertir una intención difusa en un plan de tareas atómicas con tests y criterios de aceptación. Algo como:

/plan Convierte docs/feature.md en un plan de ejecución por
tareas atómicas, con tests y criterios de aceptación medibles
para cada una. Guarda el resultado en docs/plan.md.

Después, con el plan ya escrito, sueltas el /goal:

/goal Ejecuta docs/plan.md tarea por tarea hasta que todos
los criterios de aceptación estén cumplidos, npm test y
npm run lint pasen, y cada cambio quede justificado en
docs/progress.md. No avances a la siguiente tarea si la anterior
no está verificada. Detente tras 12 turnos o si hay un bloqueo externo.

La gracia del orden es esta: el /plan crea el contrato. El /goal lo cumple. Si te saltas el primer paso, el segundo trabaja a ciegas.

¿Qué nos dice la comunidad sobre /goal? ¶

Hay tres tendencias claras si te das una vuelta por Reddit y los foros de cada herramienta.

En Codex, el entusiasmo es alto cuando se usa bien. Hay desarrolladores contando que pudieron dejar al agente trabajando “sin interrupciones” en proyectos grandes. También hay escépticos preguntando qué aporta el comando si Codex ya hacía algo parecido sin él. Las dos posturas son válidas y dependen de cómo trabajes.

En Claude Code, la conversación es más reciente. La pregunta más común es eficiencia en tokens y la comparación directa con ralph-loop, lo que sugiere que hay curiosidad pero todavía pocas prácticas asentadas. Hilo típico: “¿habéis usado /goal? ¿Cuánto os ha costado?”.

En OpenCode, la gente está intentando replicar el comportamiento con plugins de auto-continue, custom commands y wrappers. Hay incluso una issue abierta pidiendo auto-continue cuando el modelo llega a finish_reason: "length". No es exactamente /goal, pero apunta al mismo dolor: tareas largas que se cortan por límites de salida.

La señal de fondo es esta: la idea del objetivo persistente es lo bastante poderosa como para que cada ecosistema esté buscando su versión. Es parte de un movimiento más amplio que ya desgranamos en las tendencias de agentes de código para 2026.

TL;DR ¶

🎯 /goal convierte una intención en un contrato verificable que el agente cumple entre turnos, sin necesidad de que escribas “sigue” cien veces.
🔧 En Codex CLI usa pause/resume/clear, tiene límite de 4.000 caracteres y puede requerir activar features.goals en config.toml.
⚡ En Claude Code (v2.1.139+) funciona como stop hook con evaluador externo. Consultar /goal sin argumentos muestra estado y gasto en tokens.
🛡️ OpenCode no lo trae built-in, pero puedes construir algo parecido con custom commands y plugins de auto-continue con límite de iteraciones.
🔑 La diferencia con el ralph-loop está en el contexto: /goal lo mantiene, ralph lo resetea cada vuelta. Se complementan.

Preguntas frecuentes sobre /goal ¶

¿Qué hace el comando /goal?
Convierte una intención del usuario en un contrato persistente que el agente intenta cumplir entre turnos. El agente no se detiene cuando termina la respuesta actual, sino cuando se cumple el criterio que tú escribiste.

¿En qué herramientas está disponible /goal?
Está disponible de forma oficial en Codex CLI de OpenAI y en Claude Code de Anthropic (desde la versión 2.1.139). Antigravity 2.0 de Google tiene su propia versión. OpenCode no lo trae built-in.

¿Cuánto gasta /goal en tokens?
Depende del número de turnos que dejes ejecutar y del tamaño del contexto. En Claude Code, el evaluador usa un modelo pequeño y su coste es despreciable. El gasto real viene de los turnos principales del agente, no de la evaluación.

¿Cómo evito que /goal se vaya de presupuesto?
Incluye siempre un freno explícito en el propio objetivo: “detente tras N turnos” o “para si fallas durante N intentos seguidos”. Hay casos documentados de /goal corriendo más de dos días con más de mil millones de tokens. No es un mito.

¿Cuál es la diferencia entre /goal y un prompt normal?
Un prompt normal termina cuando el agente devuelve su respuesta. /goal mantiene el contrato vivo hasta que se cumple el criterio o tú lo cancelas. Es la diferencia entre “haz esto ahora” y “mantén este resultado hasta que esté hecho”.

¿Puedo usar /goal para tareas exploratorias o ambiguas?
No es recomendable. /goal brilla cuando hay un criterio de éxito medible. Si la tarea es “mejora esto” o “hazlo más limpio”, el agente no sabrá cuándo parar y gastarás tokens sin avance verificable.

¿Qué pasa si /goal no aparece en mi CLI?
En Codex puede ser cuestión de activar la feature: prueba con codex features enable goals o ajusta features.goals en config.toml. En Claude Code, verifica que tu versión sea la 2.1.139 o superior.

¿Cómo se diferencia /goal del ralph-loop?
El ralph-loop reinicia el contexto en cada iteración y depende de memoria externa (git, ficheros). /goal mantiene el contexto vivo dentro de la sesión y usa un evaluador para parar. Se pueden combinar: ralph-loop por fuera, /goal por dentro.

¿Puedo lanzar /goal sin estar delante de la terminal?
Sí, en Claude Code se puede invocar de forma no interactiva con claude -p "/goal ...". En Codex también funciona con el hilo activo. Recomendable poner freno por turnos antes de irte.

¿Sirve /goal para revisar código o solo para implementarlo?
Sirve para cualquier tarea con criterio verificable: implementar, revisar, migrar, documentar, mantener un changelog… Lo importante no es la naturaleza de la tarea, sino que el final esté escrito en términos medibles.

Fuentes ¶

🧨 Última oprtunidad para recibir la dinamita que mereces sobre programación con IA el próximo domingo: Suscríbete gratis a Web Reactiva en https://webreactiva.com/newsletter