28 Jun 2026 · Original en inglés · Artículo

Proxy-KD: destilar conocimiento de modelos de lenguaje cerrados

Fuentes: Proxy-KD: distilling knowledge from black-box large language models

Investigadores presentan Proxy-KD, un método de destilación de conocimiento diseñado para transferir el saber de grandes modelos de lenguaje (LLM) propietarios y opacos —como GPT-4— a modelos más pequeños y ligeros. La destilación de conocimiento tradicional requiere acceder a los estados internos del modelo docente (logits, capas ocultas), un recurso al que no se puede llegar cuando el modelo es una caja negra ofrecida únicamente como API. Proxy-KD sortea esa barrera incorporando un modelo intermediario, llamado proxy, que facilita la transferencia desde el profesor cerrado hacia el estudiante.

Los autores explican que las salidas de texto generadas por LLMs avanzados son muestras de alta calidad, pero la ausencia de señales internas limita la eficacia del aprendizaje. El proxy actúa como puente: recibe las generaciones del docente cerrado y produce representaciones o señales adicionales que el modelo pequeño puede imitar con mayor eficiencia.

En los experimentos incluidos en el artículo, Proxy-KD no solo mejora el rendimiento de la destilación cuando el docente es una caja negra, sino que supera a técnicas clásicas de destilación de caja blanca, donde sí se tiene acceso completo al modelo profesor. Los autores —liderados por Hongzhan Chen, con una versión revisada publicada el 9 de noviembre de 2024 en arXiv— describen este enfoque como una nueva vía para aprovechar LLMs avanzados en el entrenamiento de modelos abiertos más compactos, con implicaciones para el desarrollo de asistentes locales, dispositivos de borde y aplicaciones donde el coste o la privacidad impiden recurrir directamente a un modelo propietario.

El trabajo se enmarca en la creciente línea de investigación que busca cerrar la brecha de capacidades entre modelos cerrados de gran tamaño y modelos abiertos más accesibles, sin depender de acceso total a los parámetros del docente.

Temas

ciencia y salud

Etiquetas

knowledge distillation large language models black-box models model compression proxy-kd gpt-4 arxiv hongzhan chen natural language processing machine learning

Entidades mencionadas

Hongzhan Chen person

Proxy-KD protocol_standard

arXiv organization

arXiv es un archivo en línea para las prepublicaciones de artículos científicos en el campo de las matemáticas, física, ciencias de la computación y biología cuantitativa. En muchos campos de las mate

Ver en Wikipedia

GPT-4 software

GPT-4 es un modelo de lenguaje grande (LLM) creado por OpenAI. Se lanzó el 14 de marzo de 2023 y está disponible a través de la API y para los usuarios de ChatGPT Plus.

Ver en Wikipedia

Enlaces

What is Connected Papers? www.connectedpapers.com

What is CatalyzeX? www.catalyzex.com

What is Huggingface? huggingface.co

What are Smart Citations? www.scite.ai