Un modelo extenso de lenguaje o LLM, también llamado modelo de lenguaje de gran tamaño o modelo de lenguaje a gran escala, es un modelo de lenguaje de aprendizaje profundo, que consta de una red neuronal con muchos parámetros, entrenados en grandes cantidades de texto sin etiquetar mediante aprendizaje autosupervisado o aprendizaje semisupervisado. Los LLMs surgieron alrededor de 2018 con el primer modelo GPT-1, aunque fue su sucesor, GPT-2, el que obtuvo una atención más generalizada. Esto ha c
Revisar código de IA se ha vuelto caro; reescribirlo, barato
El ingeniero de software Ishmeet Bindra sostiene que los modelos de lenguaje grandes (LLM) no son vagos, sino que tienden a construir desde cero en lugar de reutilizar librerías existentes, ya que para el modelo escribir doscientas líneas de implementación supone el mismo esfuerzo cognitivo que escr
