GPT-4 es un modelo de lenguaje grande (LLM) creado por OpenAI. Se lanzó el 14 de marzo de 2023 y está disponible a través de la API y para los usuarios de ChatGPT Plus.
Proxy-KD: destilar conocimiento de modelos de lenguaje cerrados
Investigadores presentan Proxy-KD, un método de destilación de conocimiento diseñado para transferir el saber de grandes modelos de lenguaje (LLM) propietarios y opacos —como GPT-4— a modelos más pequeños y ligeros. La destilación de conocimiento tradicional requiere acceder a los estados internos d
