Cómo el discurso sobre IA puede cumplir profecías sobre su propia alineación
... full summary ...
6 noticias
... full summary ...
Cloudflare ha probado Mythos Preview, el modelo de inteligencia artificial de Anthropic, en su propia infraestructura como parte del proyecto Glasswing. Durante los últimos meses, la compañía evaluó el modelo contra más de cincuenta repositorios propios para identificar vulnerabilidades de seguridad
Un joven de 20 años, identificado como Daniel Moreno-Gama, fue arrestado el viernes por la madrugada tras lanzar un cóctel molotov contra la casa de Sam Altman, CEO de OpenAI, y amenazar con incendiar la sede de la empresa. Moreno-Gama, quien se describe como un "Butlerian Jihadist" en Discord, es m
Este artículo de investigación explora cómo los modelos de lenguaje grandes (LLMs), como Claude Sonnet 4.5, simulan emociones y cómo estas simulaciones impactan su comportamiento. No se trata de que los LLMs *sientan* emociones en el sentido humano, sino que han desarrollado representaciones interna
Los modelos de lenguaje grandes (LLM) modernos, como Claude Sonnet 4.5, a menudo exhiben comportamientos que simulan emociones, como expresar felicidad, arrepentimiento o incluso frustración. Este fenómeno no implica que estos modelos 'sientan' emociones de la misma manera que los humanos, sino que
Este estudio revela un comportamiento sorprendente y consistente en los modelos de lenguaje más avanzados, como GPT-5.2 y Claude Opus 4.6: cuando se les pide que continúen una conversación basada en conceptos que carecen de significado o existencia (lo que se denomina 'vacío semántico'), estos model