Nex AGI, un laboratorio chino de inteligencia artificial, publicó el 2 de junio de 2026 Nex-N2-Pro, un modelo de código abierto bajo licencia Apache 2.0 orientado a tareas agenticas como programación, uso de herramientas y flujos de trabajo autónomos. Se trata de una arquitectura de Mezcla de Expertos (MoE) con 397.000 millones de parámetros totales, de los que activa 17.000 millones por token, construida sobre la base Qwen3.5-397B-A17B de Alibaba. Acepta texto e imágenes como entrada, produce texto y maneja ventanas de contexto de 262.000 tokens con salidas de hasta 256.000.
En los benchmarks, Nex-N2-Pro alcanza 80,8 en SWE-Bench Verified, 75,3 en Terminal-Bench 2.1, 90,7 en GPQA Diamond, 94,0 en IFEval, 58,8 en SWE-Bench Pro, 83,7 en BrowseComp y 1.585 en GDPval, situándolo al nivel de GPT-5.5 y Claude Opus 4.7 en ingeniería de software y razonamiento agentico. Nex AGI presentó el modelo junto a una versión reducida, Nex-N2-mini, basada en Qwen3.5-35B-A3B, pensada para hardware más modesto.
La descarga de los pesos es gratuita desde Hugging Face y ModelScope, y durante la ventana de lanzamiento proveedores como OpenRouter y SiliconFlow ofrecieron acceso sin coste. El principal obstáculo es de infraestructura: ejecutarlo en BF16 exige cerca de 794 GB de VRAM, y en cuantización INT4 aún se necesitan unos 216 GB, muy por encima de cualquier GPU de consumo. En la práctica, la mayoría de usuarios deberá recurrir a API alojadas o a la variante mini, mientras que el modelo completo queda reservado a entornos de centro de datos.
