Newsletter para devsEntra

Rubber Duck: la segunda opinión de un modelo que no comparte los puntos ciegos del tuyo

Una skill que detecta los agentes de IA instalados en tu máquina y le encarga la crítica de tu plan, diff o tests a un modelo de otra familia. Encuentra defectos de fondo, los prioriza por severidad y no toca ni un archivo.

Invócala con un comando

  • /rubber-duck

    Detecta tu agente anfitrión, escanea qué otros CLIs de IA tienes instalados y te propone el mejor crítico de otra familia de modelos. Tú eliges quién critica; él hace la crítica y te la devuelve priorizada.

  • /rubber-duck opencode openai/gpt-5.5

    Sin preguntas: usa ese agente y ese modelo concretos como crítico. Los dos argumentos son opcionales, y el modelo va en el formato del propio agente. Si eliges uno de la misma familia que tu sesión, te avisa en vez de callárselo.

Qué es esta skill

¿Qué es rubber-duck?

rubber-duck le pide una segunda opinión sobre tu trabajo —un plan, un diseño, un diff, una suite de tests— a un modelo de IA de una familia distinta a la que está ejecutando tu sesión. Si trabajas con Claude, te critica un GPT o un Gemini; si trabajas con GPT, un Claude. Busca puntos ciegos, defectos de diseño y problemas de fondo. Nada de estilo, naming ni formateo.

Y un detalle que importa: el crítico nunca toca tus archivos ni ejecuta comandos que muten nada. Revisa, encuentra problemas y recomienda arreglos. La decisión de qué aplicar sigue siendo tuya.

El principio

Por qué el crítico tiene que ser de otra familia

Pedirle a un modelo que revise su propio trabajo produce sobre todo… acuerdo. Un modelo es el menos indicado para cazar sus propios puntos ciegos: comparte los sesgos que generaron el fallo. El valor de esta skill está en cruzar familias, y para llegar a ese modelo distinto conoce las dos puertas:

  • Tu propio agente cambia de modelo. Vía subproceso (claude -p, codex exec, opencode run…) o el comando /model de la sesión.
  • Otro CLI que ya tengas instalado. Aunque estés en Claude Code, igual tienes opencode, codex, copilot o amp en tu máquina. Ese segundo CLI es la puerta a otra familia y, al ser un proceso separado, la opinión es de verdad independiente.

Si no hay forma de contrastar, te lo dice claro y etiqueta la revisión como autocrítica, en vez de venderte una self-review como segunda opinión.

Cómo funciona

Un crítico con memoria (y con red de seguridad)

  • Escanea tu máquina una vez y lo recuerda. Detecta el agente anfitrión y cada CLI de IA instalado, y lo guarda todo en un agents.json: la siguiente invocación es instantánea.
  • Tú eliges al crítico. La skill rankea candidatos y recomienda —rotando para no repetir siempre el mismo—, pero la decisión es tuya, modelo concreto incluido. Y si le dices «no uses tal agente de crítico», lo bloquea hasta que digas lo contrario.
  • Smoke test antes de gastar. Antes de la crítica real manda un mensaje trivial por el mismo comando: si la auth falla o el modelo no existe, lo descubres con una línea, no después de componer un prompt de miles de tokens.
  • Informe por severidad. Los hallazgos llegan agrupados: bloqueantes, no bloqueantes y sugerencias. Si no hay nada sustancial, te lo dice y punto.
Instalación

Cómo instalar rubber-duck

Funciona con cualquier agente compatible con el estándar abierto de Agent Skills (Claude Code, Cursor, Codex, OpenCode, Gemini CLI…). Pega esto en tu terminal y listo:

npx skills add webreactiva/skills --skill rubber-duck

¿La quieres disponible en todos tus proyectos? Añade -g para instalarla global en la carpeta de skills de tu agente (~/.agents/skills, o ~/.claude/skills si usas Claude Code):

npx skills add webreactiva/skills --skill rubber-duck -g

Es open source. Puedes ver el código fuente en GitHub antes de instalarla.

Preguntas frecuentes

¿Necesito tener otro agente de IA instalado?

Ayuda, pero no es obligatorio. Si tienes un segundo CLI (opencode, codex, copilot, amp…), la skill lo usa como crítico independiente. Si no, intenta que tu propio agente cambie de modelo; y si tampoco puede contrastar, hace una autocrítica etiquetada como tal — nunca te la vende como opinión independiente.

¿Puede romperme algo?

No. El crítico solo lee y opina: nunca edita archivos ni ejecuta comandos que muten nada. Tú decides qué hallazgos aplicar y cuáles ignorar.

¿Cuándo compensa lanzarla?

Donde un defecto saldría caro: después de planificar un cambio no trivial (corregir ahí es baratísimo), a mitad de un trabajo complejo, tras escribir tests, o cuando llevas varios intentos fallidos con el mismo problema. Para cambios pequeños y bien entendidos, ahórratela: cada crítica consume latencia y uso del modelo crítico.

¿Tiene coste?

La skill es open source y gratis; el código está en GitHub. La crítica en sí consume uso del agente que elijas como crítico (el de tu otro CLI o el de tu propia sesión).

¿Cómo se usa?

No necesitas el comando: tu agente también la activa sola cuando le dices algo como…

  • dame una segunda opinión sobre este plan
  • búscale las pegas a este diseño
  • ¿es sólido este enfoque?
  • revisa mi plan antes de implementarlo
  • rubber duck this
  • poke holes in this

Siguiente paso

Ya sabes instalar skills. Aprende a crearlas.

Si te ha gustado tener un copiloto a demanda, el siguiente paso es escribir las tuyas. En la guía de skills aprendes la anatomía de un SKILL.md, a redactar descripciones que la disparan sola y a validarla.

Ir a la guía de skills →