MiniMax, la empresa china de inteligencia artificial, ha presentado M3, un nuevo modelo de IA de pesos abiertos que combina capacidades de programación de frontera y agentic con una ventana de contexto de hasta un millón de tokens y multimodocidad nativa. Según la compañía, M3 es el primer modelo de código abierto que reúne de forma simultánea estas tres capacidades, hasta ahora reservadas a unos pocos modelos cerrados.
El modelo emplea la arquitectura propietaria MiniMax Sparse Attention (MSA), que garantiza un mínimo de 512.000 tokens de contexto. El pipeline de entrenamiento se reconstruyó por completo para escalar los datos de preentrenamiento a más de 100 billones de tokens, con entrenamiento multimodal desde el inicio para alinear los espacios semánticos textual y visual.
En pruebas comparativas, M3 alcanzó 83,5 puntos en BrowseComp, por encima de Opus 4.7 (79,3). En una demostración, el modelo reprodujo de forma autónoma durante casi 12 horas un artículo destacado de ICLR 2025, generando 18 commits y 23 figuras experimentales. En otra prueba, M3 optimizó un kernel FP8 GEMM en GPUs NVIDIA Hopper a lo largo de 24 horas, completando 147 iteraciones y 1.959 llamadas a herramientas para lograr una aceleración de 9,4×. En PostTrainBench, M3 obtuvo 37,1 puntos y se clasificó tercero, solo por detrás de Opus 4.7 (42,4) y GPT-5.5 (39,3).
M3 está disponible mediante API, el Token Plan de la compañía y la plataforma agentic code.minimax.io. El modelo se publicará en HuggingFace y GitHub, con soporte para despliegue privado y ajuste fino.
