Proxy-KD: destilar conocimiento de modelos de lenguaje cerrados
Investigadores presentan Proxy-KD, un método de destilación de conocimiento diseñado para transferir el saber de grandes modelos de lenguaje (LLM) propietarios y opacos —como GPT-4— a modelos más pequeños y ligeros. La destilación de conocimiento tradicional requiere acceder a los estados internos d
