10 Mar 2026 · Original en inglés · Resumen IA

IA sorprende: modelo líder sin ajustes

Fuentes: LLM Neuroanatomy: How I Topped the AI Leaderboard Without Changing a Single Weight

En un giro inesperado en el mundo de la inteligencia artificial, un investigador conocido como 'dnhkng' ha logrado colocar su modelo, 'RYS-XLarge', en la cima del Hugging Face Open LLM Leaderboard, sin modificar ni un solo peso del modelo original. La hazaña, lograda a mediados de 2024, implica duplicar un bloque específico de siete capas intermedias del modelo de 72 mil millones de parámetros y volver a ensamblarlo. Este descubrimiento, denominado 'LLM Neuroanatomía' por el investigador, sugiere una estructura interna más flexible y adaptable en los modelos de lenguaje de lo que se creía anteriormente.

La investigación surgió de dos observaciones inusuales: la capacidad de un modelo para procesar y decodificar datos en Base64, incluso en formatos fuera de distribución, y la construcción del modelo 'Goliath-120b', que alternaba capas de diferentes modelos. 'dnhkng' postula que las capas iniciales actúan como traductores, convirtiendo la entrada a una representación abstracta, mientras que las capas finales la convierten de nuevo al formato de salida. Las capas intermedias, según su teoría, son responsables del razonamiento puro en una representación interna universal. Este hallazgo, que aún no ha sido publicado formalmente, desafía las convenciones de entrenamiento de modelos de IA y abre nuevas vías para la investigación en interpretabilidad de la IA.

Temas

Etiquetas

inteligencia artificial llm hugging face dnhkng transformer neuroanatomy rys-xlarge goliath-120b base64 interpretabilidad de la ia

Entidades mencionadas

Isaac Asimov person

Isaac Asimov fue un escritor estadounidense de origen ruso, conocido por ser un prolífico autor de obras de ciencia ficción y divulgación científica.Fue profesor de Bioquímica en la Escuela de Medicin

Ver en Wikipedia

Python software

Python es un lenguaje de alto nivel de programación interpretado cuya filosofía hace hincapié en la legibilidad de su código. Se trata de un lenguaje de programación multiparadigma, ya que soporta par

Ver en Wikipedia

transformer software

Base64 software

Colosseum location

Nous-Hermes creative_work

Dolphin creative_work

NeuralBeagle14-7B creative_work

IFEval event

MATH Lvl 5 event

GPQA event

MuSR event

MMLU-PRO event

dnhkng/RYS-XLarge creative_work

72-billion parameter software

Goliath-120b creative_work

Llama-2 software

Xwin software

Euryale software

HuggingFace Open LLM Leaderboard organization

This is the hub organisation maintaining the Open LLM Leaderboard.

HuggingFace organization

Hugging Face, Inc. es una empresa franco-estadounidense que desarrolla herramientas para crear aplicaciones utilizando el aprendizaje automático. Es conocida por su biblioteca de transformadores cread

Ver en Wikipedia

Alpindale location

Allendale es un lugar designado por el censo ubicado en el condado de Ottawa en el estado estadounidense de Míchigan. En el Censo de 2010 tenía una población de 17579 habitantes y una densidad poblaci

Ver en Wikipedia

BBH event