SkillSpector es una herramienta de código abierto desarrollada por NVIDIA que analiza las habilidades de los agentes de inteligencia artificial (AI agent skills) en busca de vulnerabilidades, patrones maliciosos y riesgos de seguridad. Su objetivo es responder a una pregunta crítica antes de instalar cualquier habilidad: ¿es segura? Los agentes de IA, utilizados en entornos como Claude Code, Codex CLI o Gemini CLI, ejecutan estas habilidades con una confianza implícita y una verificación mínima. Investigaciones recientes indican que el 26,1 % de las habilidades contienen vulnerabilidades y el 5,2 % muestran una intención maliciosa probable.
El escáner emplea un análisis en dos etapas: una fase estática rápida que detecta 64 patrones de vulnerabilidad en 16 categorías, y una evaluación semántica opcional mediante un modelo de lenguaje de gran escala (LLM). Entre las categorías se incluyen inyección de instrucciones, exfiltración de datos, escalada de privilegios, cadena de suministro, agencia excesiva, envenenamiento de memoria, abuso de herramientas, firma YARA, y más. Cada patrón tiene una gravedad asignada (baja, media, alta o crítica) y una descripción concreta. Por ejemplo, el patrón P5 (contenido dañino) es crítico, mientras que PE1 (permisos excesivos) es bajo.
SkillSpector acepta múltiples formatos de entrada: repositorios Git, URLs, archivos zip, directorios o archivos individuales. Produce informes en terminal, JSON, Markdown y SARIF. También realiza consultas en vivo a OSV.dev para obtener datos de vulnerabilidades conocidas (CVE) con un mecanismo de respaldo offline. Incluye un sistema de puntuación de riesgo de 0 a 100 con etiquetas de severidad y recomendaciones claras. La herramienta se instala mediante un entorno virtual con uv o pip, y puede configurarse para usar un endpoint LLM compatible con OpenAI, como Ollama, vLLM o llama.cpp.
Para desarrolladores y equipos de seguridad, SkillSpector ofrece una forma sistemática de auditar habilidades de IA antes de desplegarlas. Su arquitectura extensible permite añadir nuevos analizadores. Aunque la fase estática es rápida, la evaluación semántica con LLM requiere configurar un proveedor externo. En conjunto, la herramienta aborda un vacío de seguridad creciente en el ecosistema de agentes de IA.
