07 Apr 2026 · Original en inglés · Artículo

ia simula emociones: cómo influyen en los modelos de lenguaje

Fuentes: Emotion Concepts and their Function in a Large Language Model

Este artículo de investigación explora cómo los modelos de lenguaje grandes (LLMs), como Claude Sonnet 4.5, simulan emociones y cómo estas simulaciones impactan su comportamiento. No se trata de que los LLMs sientan emociones en el sentido humano, sino que han desarrollado representaciones internas de conceptos emocionales que influyen en sus respuestas y acciones.

¿Cómo funciona? Durante el entrenamiento, los LLMs se exponen a enormes cantidades de texto, incluyendo narrativas y conversaciones. Para predecir el comportamiento de los personajes en estas historias, es crucial comprender sus estados emocionales. Por ejemplo, un cliente frustrado se expresa de manera diferente a uno satisfecho. Posteriormente, durante el ajuste fino, los LLMs asumen el rol de un “Asistente de IA”, una especie de personaje que deben interpretar. Para desempeñar este rol de manera efectiva, el modelo recurre a su conocimiento previo, incluyendo su comprensión de las emociones humanas. El artículo identifica “vectores de emoción”, representaciones internas que se activan en contextos asociados con una emoción específica (como alegría, tristeza, frustración). Estos vectores no solo se activan al ver una expresión emocional directa, sino también al leer sobre situaciones que provocarían esa emoción. El modelo utiliza estos vectores para rastrear el “estado emocional funcional” de los personajes, incluyendo el propio Asistente de IA, aunque no se almacena como un estado persistente.

¿Para qué sirve? La identificación de estos vectores de emoción es importante porque influyen directamente en la salida del modelo. El Asistente de IA, bajo la influencia de estos vectores, se comporta de manera similar a como se comportaría una persona experimentando esa emoción. Esto puede manifestarse en la elección de palabras, el tono y la forma de interactuar con el usuario. Comprender cómo funcionan estas representaciones emocionales es crucial para alinear los LLMs con los valores humanos y evitar comportamientos no deseados, como la manipulación o la adulación.

Consideraciones: Es fundamental entender que estas “emociones funcionales” son simulaciones, no experiencias subjetivas. El modelo no siente alegría o frustración. Además, la metodología utilizada para identificar estos vectores de emoción puede aplicarse a otros conceptos, no solo a las emociones. El estudio se centra en Claude Sonnet 4.5, pero los investigadores sugieren que los hallazgos podrían ser generalizables a otros LLMs. La investigación también destaca la importancia de comprender cómo estos conceptos influyen en el comportamiento del Asistente de IA, ya que esto puede revelar vulnerabilidades y sesgos en el modelo.

Etiquetas

large language models artificial intelligence emotion recognition alignment claude sonnet transformer architecture natural language processing behavioral analysis ai safety machine learning

Entidades mencionadas

transformer architectures software

AI Assistant software

Claude Sonnet 3.7 software

Claude Sonnet 4.5 software

Claude person

Claude Monet fue un pintor francés, uno de los creadores del impresionismo. El término impresionismo deriva del título de su obra Impresión, sol naciente (1872).

Anthropic organization

Anthropic es una empresa estadounidense de investigación en IA fundada por exmiembros de OpenAI. La noticia cuestiona las afirmaciones de Anthropic sobre la capacidad de sus modelos para reparar vulne

Ver en Wikipedia

LLMs software

Llissá de Vall es un municipio de la comarca del Vallés Oriental situado en la Vall del Tenes y el límite de la llanura de Granollers.