754 skills de ciberseguridad para Claude Code, OpenCode y Codex

26/5/2026

Compartir en X Compartir en LinkedIn Compartir por email

Viernes, 19:42. Te llega un PDF de 120 KB con asunto “Factura urgente”. El remitente parece legítimo. El equipo de seguridad se ha ido hace rato.

¿Qué haces?

Si tu agente de IA tiene las skills adecuadas instaladas, le pides que analice el adjunto, extraiga los objetos sospechosos, decodifique los streams comprimidos y te devuelva una lista de IOCs. En tres minutos.

Si no las tiene, recibes un párrafo genérico sobre “ten cuidado con los archivos adjuntos” y la sensación de haber gastado tokens para nada.

Esa diferencia es de lo que va el post de hoy.

Existe un repositorio open source con 754 cybersecurity skills listas para inyectar en tu agente de IA. Cubre desde análisis de malware hasta forense de memoria, pasando por threat hunting, OT/ICS, IAM y ataques a modelos de ML. Es la mayor colección open source de este tipo y la voy a destripar en este post.

Estos son los puntos que vamos a tocar:

Por qué un agente de IA con skills de ciberseguridad bien hechas vale más que cualquier prompt genérico
El mapa completo: 26 dominios, 754 skills, 5 frameworks de referencia
Diez skills al detalle, repartidas por defensa, análisis de malware, pentesting, hardening y AI security
Cómo instalar el repo en Claude Code, Codex CLI, Cursor o cualquier agente compatible con el estándar agentskills.io
Las letras pequeñas: qué es y qué no es este repositorio (spoiler: no es oficial de Anthropic)

Si has llegado aquí desde el post sobre las mejores skills de revisión de código y seguridad, olvídalo por un momento. Aquello iba de revisar TU código. Esto va de defender TUS sistemas. Es otra liga.

Qué hace especial a una skill de ciberseguridad ¶

Una skill no es un prompt. No es un tutorial. No es una checklist en Notion.

Una skill es una carpeta con un SKILL.md cuyo frontmatter YAML define cuándo activarla, y cuyo cuerpo en Markdown describe el flujo paso a paso. El agente la descubre, decide si encaja con la petición del usuario y la carga en contexto. Si quieres entender el porqué del formato, lo expliqué en la guía completa de Agent Skills.

La diferencia operativa es brutal.

Sin skill, le pides a Claude que analice un volcado de memoria sospechoso y te suelta un párrafo correcto pero genérico: “podrías usar Volatility, busca procesos sospechosos, revisa conexiones de red…”. Con la skill performing-memory-forensics-with-volatility3 cargada, el agente sabe qué plugins ejecutar, en qué orden, qué cadenas buscar y cómo correlacionar los hallazgos con eventos del registro de Windows.

🔑 La diferencia entre un agente con skills y otro sin ellas es la diferencia entre un becario con buena voluntad y un analista que ya ha visto este ataque cinco veces este mes.

Y aquí entra la parte interesante: el sector de la ciberseguridad lleva años con un déficit estructural de talento. Según el informe ISC2 Cybersecurity Workforce Study 2024, el gap global llegó a 4,76 millones de profesionales sin cubrir, un 19% más que el año anterior. Casi el 47% de la fuerza laboral necesaria no existe.

Los agentes de IA no van a tapar ese agujero por sí solos. Pero un agente con conocimiento estructurado de procedimientos operativos puede multiplicar el trabajo de un analista junior y devolverle horas al senior. Esa es la apuesta detrás del repositorio que vamos a ver.

Workshop para empezar

Aprende a usar skills desde cero, sin copiar la primera que veas

Verás de cero al primer SKILL.md: qué es, cómo se escribe, cómo se carga sin gastar contexto y por qué instalar a ciegas te puede salir caro.

Entrar al workshop →

Workshop en directo · 1h

El repo: Anthropic Cybersecurity Skills ¶

El nombre induce a confusión, así que vamos a aclararlo rápido: no es un proyecto oficial de Anthropic. Es un repositorio comunitario mantenido por Mahipal Jangra (mukul975 en GitHub) que sigue el estándar abierto agentskills.io, el mismo formato que usan Claude Code, Codex, Cursor, OpenCode y compañía. El nombre es desafortunado, pero el contenido es valioso.

Cifras gordas:

754 skills en producción
26 dominios de seguridad cubiertos
5 frameworks de referencia mapeados en cada skill: MITRE ATT&CK v18, NIST CSF 2.0, MITRE ATLAS v5.4, MITRE D3FEND v1.3 y NIST AI RMF 1.0
Licencia Apache 2.0
Compatible con cualquier agente que entienda el formato de skills

Cada skill viene en una carpeta con esta estructura:

skills/analyzing-malicious-pdf-with-peepdf/
├── SKILL.md          # Definición principal con frontmatter YAML
├── references/
│   ├── standards.md  # Mapeo a frameworks de referencia
│   └── workflows.md  # Procedimiento técnico detallado
├── scripts/
│   └── process.py    # Helper script real para el flujo
└── assets/
    └── template.md   # Plantilla de informe rellenable

El cuerpo del SKILL.md sigue el patrón clásico de progressive disclosure: el agente lee primero los metadatos (unos 30 tokens), decide si la skill aplica, y solo entonces carga el flujo completo (entre 500 y 2.000 tokens). Esto le permite revisar las 754 skills disponibles sin saturar la ventana de contexto. Es el mismo principio que cubrí en cómo organiza Claude sus skills en 9 categorías.

El mapa completo: las 754 skills por dominio ¶

La tabla que viene es lo que justifica el clic en este post. Te muestra de un vistazo qué cubre el repositorio y dónde hay más densidad.

Dominio	Skills	Capacidades clave
Cloud Security	63	Hardening AWS/Azure/GCP, CSPM, forense en cloud
Threat Hunting	56	Hunts por hipótesis, detección de LOTL, analítica de comportamiento
Threat Intelligence	50	STIX/TAXII, MISP, integración de feeds, perfilado de actores
Network Security	43	IDS/IPS, reglas de firewall, segmentación VLAN, análisis de tráfico
Web Application Security	42	OWASP Top 10, SQLi, XSS, SSRF, deserialización
Malware Analysis	39	Análisis estático y dinámico, reversing, sandboxing
Digital Forensics	37	Imagen de disco, forense de memoria, reconstrucción de timeline
SOC Operations	33	Playbooks, escalado, métricas, tabletop exercises
Identity & Access Management	33	Políticas IAM, PAM, zero trust de identidad, Okta, SailPoint
Container Security	29	RBAC en K8s, escaneo de imágenes, Falco, forense de contenedores
Security Operations	28	Correlación SIEM, análisis de logs, triage de alertas
API Security	28	GraphQL, REST, OWASP API Top 10, bypass de WAF
OT/ICS Security	28	Modbus, DNP3, IEC 62443, defensa de historiadores, SCADA
Incident Response	26	Contención de brechas, respuesta a ransomware, runbooks
Vulnerability Management	25	Nessus, flujos de escaneo, priorización de parches, CVSS
Red Teaming	24	Engagements full-scope, ataques AD, simulación de phishing
Penetration Testing	20	Red, web, cloud, móvil y wireless
DevSecOps	17	Seguridad en CI/CD, firma de código, auditoría de Terraform
Zero Trust Architecture	17	BeyondCorp, modelo de madurez CISA, microsegmentación
Endpoint Security	17	EDR, detección de LOTL, malware fileless, caza de persistencia
Cryptography	15	TLS, Ed25519, certificate transparency, gestión de claves
Phishing Defense	15	Autenticación de email, detección de BEC, IR de phishing
Mobile Security	13	Análisis Android/iOS, pentesting móvil, forense de MDM
Ransomware Defense	13	Detección de precursores, respuesta, recuperación
Threat Detection	7	Reglas Sigma, detection engineering transversal
Compliance & Governance	4	CIS benchmarks, SOC 2, frameworks regulatorios
Application Security	4	AppSec transversal, modelado de amenazas
Deception Technology	3	Honeytokens, canaries para detección de brechas
Supply Chain Security	3	SBOM, riesgos de terceros, integridad del build
AI Security	2	Detección de prompt injection, defensa de modelos
Otros (wireless, blockchain, firmware, privacidad…)	14	Nichos especializados con cobertura mínima

Si te fijas en la distribución, hay tres bloques claros: detección y respuesta (threat hunting, SOC, DFIR), cloud y contenedores, y la capa de aplicación y redes. Las áreas más flojas (deception, supply chain, AI security) son justo donde el ecosistema entero anda escaso, así que no es problema del repo, es la realidad del sector.

Vamos ahora con tres skills al detalle. He elegido tres ejemplos que cubren tres frentes muy distintos: defensa contra phishing, análisis de malware y seguridad en la nube.

Skill #1: Analizar URLs maliciosas con URLScan ¶

La skill se llama analyzing-malicious-url-with-urlscan y vive en el subdominio phishing-defense. Está mapeada a la técnica AML.T0052 de MITRE ATLAS y a varios controles de NIST CSF.

El escenario típico es éste: te llega un enlace sospechoso y necesitas saber qué hace ese enlace sin tener que abrirlo desde tu máquina. Aquí es donde entra URLScan.io, un servicio que renderiza la URL en un Chromium aislado y captura todo lo que pasa: capturas, DOM tras ejecución, transacciones HTTP, comportamiento JavaScript, conexiones de red, certificado SSL, fingerprint tecnológico y mapeo IP/ASN.

La skill describe el flujo en cuatro pasos concretos:

Enviar la URL a URLScan vía web o API (POST https://urlscan.io/api/v1/scan/ con tu API-Key en la cabecera y visibilidad privada si el caso es sensible).
Analizar resultados: revisar la captura para detectar suplantación de marca, examinar la cadena de redirecciones, buscar formularios de captura de credenciales en el DOM, mirar las peticiones de red para identificar endpoints de exfiltración.
Extraer IOCs: dominios e IPs contactadas, URLs en la cadena de redirección, hashes SHA-256 de recursos, hashes de ficheros JavaScript.
Cross-reference con threat intelligence: el script process.py que viene en la skill automatiza el cruce con VirusTotal, PhishTank y Google Safe Browsing.

Lo interesante no son los pasos en sí. Lo interesante es que la skill incluye una lista de red flags que el agente puede aplicar de forma sistemática:

Dominios registrados hace menos de 30 días
Servicios de hosting gratuitos camuflados (Wix, GitHub Pages, Firebase)
Acortadores que ocultan el destino final
Profundidad excesiva de subdominios (clásico login.microsoft.com.evil.com)
Marca conocida en el subdominio o en el path, no en el dominio raíz
Puertos no estándar
URIs de datos o contenido en base64
Páginas pesadas en JavaScript con HTML mínimo

# Envío programático de una URL al sandbox de URLScan
import requests

api_key = "tu-api-key-aqui"
target_url = "https://dominio-sospechoso.example"

response = requests.post(
    "https://urlscan.io/api/v1/scan/",
    headers={"API-Key": api_key, "Content-Type": "application/json"},
    json={"url": target_url, "visibility": "private"}
)

scan_uuid = response.json()["uuid"]
# El resultado completo está disponible en pocos segundos
result_url = f"https://urlscan.io/result/{scan_uuid}/"

Para una caja de email corporativa que recibe miles de mensajes, conectar esta skill a un flujo automatizado de triage cambia las reglas del juego. El analista deja de procesar URLs una a una y pasa a revisar solo lo que ya viene puntuado y enriquecido.

Skill #2: PDFs con sorpresa y peepdf ¶

El segundo ejemplo es analyzing-malicious-pdf-with-peepdf. Subdominio malware-analysis. Tags: pdf, peepdf, pdfid, pdf-parser, static-analysis, reverse-engineering, dfir.

Un PDF malicioso no se ve. Lleva dentro JavaScript, shellcode, archivos embebidos o acciones automáticas que se disparan al abrirlo. La skill enseña al agente a destriparlo sin ejecutarlo.

🛡️ Importante: estos análisis se hacen siempre en una máquina aislada o sandbox. La skill lo deja claro en los prerequisites. Si la ejecutas en tu portátil del trabajo, el “investigador” pasa a ser “víctima”.

El flujo que define la skill tiene siete pasos:

Triage con pdfid: escanear el PDF buscando keywords sospechosos como /JS, /JavaScript, /OpenAction, /Launch, /EmbeddedFile.
Análisis interactivo con peepdf para explorar la estructura de objetos del documento.
Identificar objetos sospechosos donde vive el código o los streams codificados.
Extraer contenido: volcar los streams y decodificar los filtros (FlateDecode, ASCIIHexDecode).
Desofuscar el JavaScript extraído para localizar shellcode, heap sprays o exploits.
Comprobar VirusTotal mediante el hash, usando la utilidad vtcheck de peepdf.
Generar IOCs: URLs, dominios, hashes y firmas de shellcode.

La tabla de conceptos clave que incluye la skill es de las cosas que me hubiera gustado tener cuando empecé a mirar PDFs sospechosos:

Concepto	Qué hace
`/OpenAction`	Acción automática al abrir el PDF
`/JavaScript`, `/JS`	Código JavaScript embebido en objetos
`/Launch`	Lanza aplicaciones externas
`/EmbeddedFile`	Fichero embebido dentro del PDF
`FlateDecode`	Filtro de compresión zlib que esconde contenido
Object Streams	Objetos PDF almacenados en streams comprimidos

La skill no se queda en explicar qué es cada cosa: te marca el formato esperado del informe final con campos como SHA-256, IDs de objetos con JavaScript, URLs extraídas, detección de shellcode, ficheros embebidos, detecciones en VirusTotal y nivel de riesgo. Esa plantilla rellenada es lo que entregas al equipo de IR.

¿Por qué importa esto? Porque convierte un análisis ad-hoc en un proceso repetible. Diez analistas distintos pasando ese PDF por el flujo producen informes con el mismo formato. Y ese formato encaja con lo que espera el ticketing del SOC, el sistema de threat intel y el equipo de IR.

Que un agente con la skill correcta destripe un PDF malicioso en minutos es parte del cambio que estamos viviendo con la IA. Cada domingo lo contamos en la newsletter: experiencias reales adoptando IA en desarrollo. +6.700 developers, gratis desde 2018.

Apúntate gratis →

Skill #3: Robo de tokens OAuth en Microsoft Entra ID ¶

La tercera skill es detecting-oauth-token-theft, del subdominio cloud-security. Es quizás la más densa de las tres y la que mejor ilustra el nivel de detalle que algunas skills alcanzan.

El contexto: en entornos Microsoft 365 / Entra ID (antes Azure AD), uno de los vectores de compromiso más activos es el robo de tokens. Los atacantes ya no se quejan del MFA, simplemente lo eluden capturando el token después de que la víctima lo supere. AitM (Adversary-in-the-Middle) con herramientas tipo Evilginx2, device code phishing, extracción del PRT con Mimikatz, robo de cookies de navegador con infostealers… las opciones son varias y todas funcionan.

La skill estructura el conocimiento en una tabla impresionante de tipos de token y su superficie de ataque:

Token	Duración	Vector de robo	Impacto
Access Token	60-90 min	Memory dump, interceptación proxy	Acceso a API mientras dure
Refresh Token	Hasta 90 días	Robo de cookies, malware	Acceso persistente, nuevos access tokens
Primary Refresh Token (PRT)	Sesión	Mimikatz, AADInternals	SSO completo a todo M365/Azure
Session Cookie	Variable	XSS, exploit de browser, AitM	Secuestro completo de sesión
Device Code Token	15 min	Phishing del device code flow	Refresh token vía ingeniería social

Pero la joya son las queries KQL que la skill incluye para detectar el ataque en Microsoft Sentinel o Log Analytics. Por ejemplo, esta detecta sign-ins donde el token presenta anomalías:

// Detección de sign-ins con anomalías en el token
SigninLogs
| where TimeGenerated > ago(7d)
| where RiskDetail contains "token" or RiskEventTypes_V2 has "anomalousToken"
| project TimeGenerated, UserPrincipalName, IPAddress, Location,
          RiskDetail, RiskLevelDuringSignIn, AppDisplayName,
          DeviceDetail, ClientAppUsed, TokenIssuerType
| sort by TimeGenerated desc

Y esta otra detecta el clásico “imposible travel” combinado con reutilización de token:

// Mismo token usado desde múltiples IPs (token replay)
AADNonInteractiveUserSignInLogs
| where TimeGenerated > ago(7d)
| where ResultType == 0
| summarize IPs=make_set(IPAddress), IPCount=dcount(IPAddress)
            by UserPrincipalName, CorrelationId
| where IPCount > 1
| sort by IPCount desc

Cuando la skill detecta que algo huele mal, propone una respuesta operativa con PowerShell y Microsoft Graph: revocar todos los refresh tokens del usuario comprometido, forzar el cambio de contraseña, revisar y revocar OAuth grants sospechosos, revisar registros de enterprise apps por si hay alguna app rogue, y comprobar reglas de reenvío de correo (uno de los movimientos clásicos post-compromiso).

⚠️ Esta skill activa también la parte preventiva: configurar Token Protection (que vincula el token al TPM del dispositivo), habilitar Continuous Access Evaluation para que la revocación sea casi instantánea, y montar políticas de sesión en Defender for Cloud Apps. Es defensa proactiva, no solo reactiva.

Lo que vale aquí no son las queries en sí (las puedes encontrar en blogs sueltos) sino tenerlas empaquetadas, etiquetadas y vinculadas a un flujo completo: detección, investigación, contención y prevención. Tu agente sabe cuándo activar este protocolo y cómo encadenar las fases.

Skill #4: SQL injection en pentest autorizado ¶

La skill exploiting-sql-injection-vulnerabilities vive en el subdominio penetration-testing y cubre el otro lado de la mesa: cómo un pentester con autorización por escrito identifica y explota vulnerabilidades de inyección SQL.

El flujo cubre cuatro fases: descubrimiento de puntos de inyección (error-based, boolean-based, time-based y out-of-band), fingerprinting del motor de base de datos (MySQL, PostgreSQL, MSSQL, Oracle), explotación manual con técnicas UNION, error-based y blind, y por último el uso de sqlmap para automatizar lo demostrado a mano.

Lo que la hace útil es que separa con disciplina lo permitido de lo prohibido. La sección Do not use marca límites: no se ataca sin autorización por escrito, no se exfiltran datos reales de cliente más allá de la prueba de concepto y no se opera sobre producción si la explotación puede corromper la integridad. Esa pequeña frase es la línea entre un pentest profesional y un caso para la fiscalía.

Skill #5: Quishing, el phishing por código QR ¶

detecting-qr-code-phishing-with-email-security ataca un problema que ha explotado en los últimos meses. Los incidentes de QR phishing crecieron de 46.000 a 250.000 entre agosto y noviembre de 2025, según los datos que cita la propia skill, y el 89,3% de esos casos buscan credenciales.

El truco del atacante es elegante: incrusta una URL maliciosa dentro de un QR en una imagen. El gateway de email no lee imágenes. El usuario escanea con el móvil personal, que no tiene los controles corporativos. Y entrega las credenciales en una página que parece legítima.

La skill describe las técnicas de evasión que ya circulan en 2026: QR partidos en dos imágenes (kit Gabagool PhaaS), QR anidados (un QR que lleva a otro QR), QR en ASCII para esquivar el análisis de imagen (un 12% de los ataques en enero de 2026) y QR embebidos en PDFs adjuntos. Y propone defensas concretas: OCR sobre las imágenes del correo, extracción de la URL y aplicación de las mismas políticas de reputación que a las URLs en texto, y protección en el lado móvil con MDM y secure browser corporativo.

Skill #6: Ataques a la cadena de suministro en CI/CD ¶

detecting-supply-chain-attacks-in-ci-cd es de las más prácticas para quien tiene GitHub Actions corriendo en producción. Subdominio security-operations.

El núcleo es un escáner en Python que parsea los YAML de .github/workflows/ buscando los cinco vectores clásicos:

Actions sin pinear (usar @main en vez de un SHA concreto)
Inyección de script vía expresiones ${{ github.event }}
Permisos demasiado generosos para GITHUB_TOKEN
Actions de terceros con acceso de escritura al repo
Dependency confusion por colisión de nombres entre paquetes públicos y privados

# Buscar actions sin pinear a un SHA específico
import yaml
from pathlib import Path

for wf in Path(".github/workflows").glob("*.yml"):
    with open(wf) as f:
        workflow = yaml.safe_load(f)
    for job_name, job in workflow.get("jobs", {}).items():
        for step in job.get("steps", []):
            uses = step.get("uses", "")
            if uses and "@" in uses and not uses.split("@")[1].startswith("sha"):
                print(f"Action sin pinear: {uses} en {wf.name}")

Si gestionas cualquier proyecto con releases automáticas, este es de los escaneos que deberías pasar en cada cambio del directorio .github/workflows/.

Skill #7: Rate limiting y throttling de APIs ¶

implementing-api-rate-limiting-and-throttling cambia de bando: ya no detectamos, ahora construimos defensa.

La skill propone una arquitectura de rate limiting por capas con Redis. Implementa los tres algoritmos clásicos: token bucket, sliding window y fixed window. Y aplica límites distintos según el tipo de endpoint y el tier del usuario.

Categoría	Ejemplo	Límite típico
Autenticación	`POST /login`	5 peticiones por minuto y por IP
Reset de contraseña	`POST /forgot_password`	3 peticiones por hora y por IP
API estándar tier free	`GET /resource`	60 peticiones por minuto
API estándar tier enterprise	`GET /resource`	1.000 peticiones por minuto
Endpoints caros	`POST /export`	5 peticiones por hora

La implementación incluye respuestas HTTP 429 con el header Retry-After correcto, métricas para Prometheus o CloudWatch, y los criterios de validación que hay que cumplir antes de dar por buena la defensa. La skill también es honesta y avisa: el rate limiting no es la única defensa, va combinado con autenticación, autorización y reglas WAF.

Skill #8: Cifrado end-to-end inspirado en Signal ¶

implementing-end-to-end-encryption-for-messaging cae en el subdominio cryptography y es de las skills más densas en teoría. Implementa una versión simplificada del Signal Protocol con el algoritmo Double Ratchet, usando X25519 para intercambio de claves, HKDF para derivación y AES-256-GCM para cifrar los mensajes.

Los componentes que cubre:

Componente	Función	Algoritmo
X3DH	Acuerdo inicial de claves	X25519
Double Ratchet	Gestión continua de claves	X25519 + HKDF + AES-GCM
Sending Chain	Claves de cifrado por mensaje	Cadena HMAC-SHA256
Receiving Chain	Claves de descifrado por mensaje	Cadena HMAC-SHA256
Root Chain	Deriva nuevas chain keys en el ratchet DH	HKDF

🔑 La propiedad clave es forward secrecy: cada mensaje usa una clave única que se borra tras su uso. Si te comprometen la sesión actual, no pueden descifrar los mensajes anteriores. Ni los siguientes.

No es la skill que pone tu agente a defender en caliente. Es la que sirve cuando alguien en el equipo necesita entender qué garantías tiene de verdad un sistema de mensajería cifrada y qué se le exige a la implementación para no fallar en producción.

Estas skills funcionan también como material de aprendizaje estructurado. Si te va eso, cada semana seleccionamos 12 recursos sobre herramientas y carrera para developers, y los suscriptores aportan los suyos. +6.700 ya dentro, gratis.

Apúntate gratis →

Skill #9: Guardrails para aplicaciones con LLM ¶

implementing-llm-guardrails-for-security está en el subdominio ai-security y aborda el problema que más nos toca a los developers en 2026: cómo blindar una aplicación que llama a un LLM para que no se la salten con un prompt injection.

La skill propone un pipeline con tres capas: NVIDIA NeMo Guardrails para definir flows en Colang, validadores Python custom para PII y políticas de contenido, y el framework Guardrails AI para validar la salida estructurada (típicamente JSON con schema).

Las validaciones cubren ambos sentidos del tráfico. En la entrada del usuario, intercepta intentos de inyección, retira PII (PERSON, EMAIL_ADDRESS, US_SSN, CREDIT_CARD…) y aplica fronteras de tema. En la salida del modelo, detecta alucinaciones, filtra contenido tóxico y valida que el JSON cumple el schema antes de que llegue al sistema downstream.

🛡️ Aviso útil de la propia skill: los guardrails son una capa de defensa en profundidad, no son perímetro. No sustituyen a autenticación, autorización ni controles de red. Si te quedas solo con esto, tienes un cinturón pero ningún airbag.

El JSON de política que define la skill es directamente reutilizable como punto de partida para cualquier chatbot interno: lista blanca de temas, lista negra, patrones bloqueados, categorías de PII y longitud máxima de salida.

Skill #10: Escaneo de vulnerabilidades con credenciales ¶

performing-authenticated-vulnerability-scan cierra el repaso con un tema sencillo de explicar pero mal ejecutado en muchas empresas: si vas a escanear tus sistemas, hazlo con credenciales.

Según la propia skill, los escaneos credenciados detectan entre un 45 y un 60% más de vulnerabilidades que los no autenticados, y con muchísimos menos falsos positivos. Porque ya no estás infiriendo desde banners externos: estás preguntando al sistema directamente qué paquetes tiene instalados, qué claves de registro, qué configuraciones.

La skill detalla cómo configurar las credenciales por plataforma:

Linux/Unix: clave SSH Ed25519, usuario no-root con sudo limitado a comandos específicos
Windows: SMB, WMI, WinRM (HTTPS preferido), Kerberos con tickets de servicio
Red: SNMP v3 con autenticación y privacidad AES-256, SSH para Cisco/Juniper/Palo Alto
Bases de datos: cuentas específicas con SELECT en MySQL, role-based en PostgreSQL, SYS/SYSDBA en Oracle

Y trae el script de aprovisionamiento bash y PowerShell para crear esas cuentas de servicio con el privilegio mínimo necesario, incluyendo la configuración de sudoers para comandos concretos como dpkg -l, rpm -qa o dmidecode. Es la diferencia entre un escaneo que da resultados accionables y uno que llena el ticketing de ruido.

Cómo instalas esto en tu agente ¶

El estándar agentskills.io es abierto y la mecánica es la misma que cubrí en la guía de buenas prácticas para crear skills. Lo único que cambia es de dónde sacas el contenido.

Instalar las 754 de golpe es una locura: saturas el contexto del agente y le das cientos de skills que no vas a usar. Lo razonable es entrar al repositorio en GitHub, localizar la que te interesa y traértela una a una con su nombre exacto:

# Instala solo la skill que necesitas (sirve para cualquier agente compatible)
npx skills add https://github.com/mukul975/anthropic-cybersecurity-skills --skill analyzing-malicious-pdf-with-peepdf

El nombre de la skill es el de su carpeta dentro de skills/. Repite el comando con cada skill que quieras. Si prefieres tenerlo todo en local para curiosear, también puedes clonar el repo entero (git clone) y copiar a mano solo las carpetas que uses.

En ambos casos, las skills acaban en la carpeta que cada agente espera:

Claude Code: .claude/skills/ en el proyecto o en ~/.claude/skills/ con alcance global
Codex CLI y Cursor: leen también de .claude/skills/ además de su propio directorio
OpenCode: directorio nativo o .claude/skills/
Cualquier agente compatible con MCP: vía servidor MCP que sirva las skills

Como son 754 skills, el consejo práctico es no cargarlas todas. Quédate con los dominios que de verdad vas a usar. Si trabajas en una empresa SaaS, te interesan Cloud Security, API Security, Web Application Security, IAM y partes de DevSecOps. Si llevas la seguridad de una planta industrial, lo tuyo es OT/ICS Security, Network Security y Endpoint Security. Cargar todo el catálogo en un agente que solo hace triage de phishing es como meter el manual completo de Cisco en una router doméstico.

Lo que no debes esperar de este repo ¶

Voy a ser honesto contigo, porque me importa más tu tiempo que aplaudir un proyecto.

Primera letra pequeña: el nombre “Anthropic Cybersecurity Skills” induce a error. Repito que no es oficial de Anthropic. El propio README lo dice en el primer párrafo: “Community Project — This is an independent, community-created project. Not affiliated with Anthropic PBC”. Algunas skills llevan un acabado profesional muy alto. Otras son más esqueléticas. Es lo que pasa con cualquier proyecto comunitario de este tamaño.

Segunda letra pequeña: una skill es una guía estructurada, no un detector mágico. Si la skill dice “ejecuta esta query KQL”, el agente la lanza, pero la calidad del resultado depende de que tu Sentinel esté ingestando los logs correctos, que tengas la licencia adecuada (varias skills asumen Entra ID P2, Defender for Cloud Apps, etc.) y que sepas interpretar lo que sale. La skill da el playbook, no la infraestructura.

Tercera letra pequeña: los frameworks de referencia (MITRE ATT&CK, NIST CSF, ATLAS, D3FEND, AI RMF) son herramientas de comunicación entre equipos y de cumplimiento. Tenerlos mapeados está muy bien para reportes a CISOs, pero no transforma una skill mediocre en una skill útil. Mira el contenido del workflow antes de fiarte de la etiqueta.

💡 Si solo te llevas una cosa de este post: las skills no sustituyen al analista, lo amplifican. Un agente con 754 skills de ciberseguridad sigue necesitando supervisión humana para los casos límite y para validar que el contexto encaja. Sin esa supervisión, tienes un automatismo elegante que falla en silencio.

Preguntas frecuentes ¶

¿Qué son las skills de ciberseguridad para agentes de IA? ¶

Las skills de ciberseguridad son carpetas estructuradas (con un archivo SKILL.md y recursos asociados) que enseñan a un agente de IA a ejecutar procedimientos de seguridad concretos, paso a paso. El agente las descubre, decide si encajan con la petición del usuario y solo entonces carga el flujo completo. Siguen el estándar abierto agentskills.io, soportado por Claude Code, Codex CLI, Cursor, OpenCode y servidores MCP compatibles.

¿Es Anthropic Cybersecurity Skills un proyecto oficial de Anthropic? ¶

No. Es un repositorio comunitario mantenido por Mahipal Jangra y no está afiliado a Anthropic PBC. El propio README lo aclara en el primer párrafo. El nombre se eligió porque sigue el formato de skills popularizado por Anthropic, pero el código y los flujos son aportación de la comunidad.

¿Cuántas skills incluye el repositorio Anthropic Cybersecurity Skills? ¶

A mayo de 2026 contiene 754 skills en producción, repartidas en 26 dominios de seguridad. Los dominios con más cobertura son Cloud Security (63 skills), Threat Hunting (56), Threat Intelligence (50), Network Security (43) y Web Application Security (42). El catálogo crece con cada release.

¿Qué frameworks de seguridad mapea cada skill? ¶

Cada skill se etiqueta con cinco frameworks: MITRE ATT&CK v18 (200+ técnicas adversarias), NIST CSF 2.0 (6 funciones, 22 categorías), MITRE ATLAS v5.4 (84 técnicas específicas de IA/ML), MITRE D3FEND v1.3 (267 contramedidas defensivas) y NIST AI RMF 1.0 (72 subcategorías de gestión de riesgo en IA). Los mapeos viven en el frontmatter YAML y en el archivo references/standards.md de cada skill.

¿En qué agentes de IA puedo instalar estas skills? ¶

Las skills funcionan en cualquier agente compatible con el estándar agentskills.io: Claude Code, OpenAI Codex CLI, Cursor, OpenCode, Windsurf, Cline, Aider, GitHub Copilot y servidores MCP de terceros. La ruta más universal es .claude/skills/ en el proyecto o ~/.claude/skills/ con alcance global, que la mayoría de agentes lee además de su directorio propio.

¿Cuánto cuesta usar este repositorio? ¶

Es gratuito. Está publicado bajo licencia Apache 2.0, que permite uso comercial, modificación y redistribución sin pago de royalties. El único coste indirecto son los tokens que tu agente de IA consume al cargar las skills en contexto durante la conversación.

¿Una skill de ciberseguridad sustituye al analista humano? ¶

No. Una skill estructura el conocimiento procedimental y acelera tareas repetitivas, pero la validación, el contexto del negocio y los casos límite siguen necesitando supervisión humana. La promesa real es amplificar al analista junior y devolver horas al senior, no eliminar el puesto. Es defensa en profundidad, no piloto automático.

¿Las skills funcionan sin la infraestructura de seguridad detrás? ¶

No. La skill detecting-oauth-token-theft asume que ya tienes Microsoft Sentinel ingestando los logs y la licencia Entra ID P2 activa. La skill analyzing-malicious-url-with-urlscan necesita una cuenta en URLScan.io. La skill performing-authenticated-vulnerability-scan exige un escáner como Nessus, Qualys u OpenVAS ya desplegado. La skill aporta el playbook, no las herramientas ni los datos.

¿Existen skills específicas para defender aplicaciones con LLM? ¶

Sí. El subdominio ai-security del repositorio incluye skills directamente vinculadas: implementing-llm-guardrails-for-security cubre la validación de entrada y salida con NVIDIA NeMo Guardrails y el framework Guardrails AI, mientras que detecting-ai-model-prompt-injection-attacks aborda la detección de inyecciones con regex, scoring heurístico y clasificación con modelos DeBERTa. Ambas mapean a MITRE ATLAS y NIST AI RMF.

¿Cómo elijo qué skills cargar sin saturar el contexto del agente? ¶

Identifica los cinco escenarios que se repiten en tu trabajo y copia solo las skills que cubren esos casos. El sistema de progressive disclosure permite que un agente inspeccione cientos de skills (~30 tokens cada una) sin cargarlas enteras, pero copiar a ciegas todo el catálogo de 754 entradas dispara el coste y el ruido. Empieza con 10-15 skills bien elegidas y amplía según el uso real.

Por dónde empezar mañana ¶

Si ya tienes un agente configurado y quieres probar el repositorio, este es el orden que te recomiendo:

Clona el repo en local y dedica 20 minutos a leer 4 o 5 skills de dominios distintos. Te calibra qué calidad esperar.
Identifica 5 escenarios reales que se repitan en tu trabajo (análisis de phishing, revisión de logs, validación de configuraciones cloud, lo que sea) y busca las skills que cubren esos casos.
Copia solo esas skills a la carpeta de tu agente. No metas todo el catálogo de golpe.
Prueba cada skill con un caso real que ya hayas resuelto a mano, para validar que el resultado del agente cuadra con lo que ya sabías.
Solo entonces, amplía a más dominios.

Si vienes desde el lado del desarrollo y nunca has tocado análisis de malware o forense, las skills funcionan también como material de aprendizaje estructurado. Lee tres o cuatro del subdominio digital-forensics y tienes una panorámica clara de qué hace un analista DFIR en su día a día. No te convierte en experto, pero te quita la opacidad del campo.

¿Te imaginas un mundo donde tu agente de IA sepa de ciberseguridad lo que sabe un analista con cinco años de oficio? Todavía no estamos ahí. Pero un repositorio de 754 skills bien estructuradas, con flujos reales y referencias verificables, acerca esa idea un par de pasos más.

Y eso, en un sector con casi cinco millones de vacantes sin cubrir, no es poca cosa.

🧨 Última oprtunidad para recibir la dinamita que mereces sobre programación con IA el próximo domingo: Suscríbete gratis a Web Reactiva en https://webreactiva.com/newsletter

Escrito con la ayuda de la IA generativa de Claude, fuentes fidedignas y con un human in the loop:
Dani Primo.

CEO en pantuflas de Web Reactiva. Programador y formador en tecnologías que cambian el mundo y a las personas. Activo en linkedin, en substack y canal @webreactiva en telegram

12 recursos para developers cada domingo en tu bandeja de entrada

Además de una skill práctica bien explicada, trucos para mejorar tu futuro profesional y una pizquita de humor útil para el resto de la semana. Gratis.