Noticias que mencionan Claude Sonnet

ModelRift lanza benchmark para evaluar seis IAs diseñando el Panteón de Roma

ModelRift ha publicado un benchmark práctico que evalúa seis herramientas de generación de código asistida por inteligencia artificial en la tarea de construir el Panteón de Roma utilizando OpenSCAD, un lenguaje de descripción de software CAD paramétrico. Los sistemas evaluados fueron Codex 5.5 High

Agentes de visión: 45 veces más costosos que las APIs

Un nuevo benchmark realizado por Reflex.dev revela que los agentes de visión para interactuar con aplicaciones son significativamente más costosos que el uso de APIs estructuradas. La prueba comparó dos métodos para que un agente de IA operara un panel de administración: uno a través de la interfaz

IA acelera matemáticas: LLMs automatizan topología

Un proyecto de investigación ha logrado automatizar una porción significativa de la topología general, un campo complejo de las matemáticas, utilizando modelos de lenguaje grandes (LLMs). Según un estudio publicado en arXiv el 6 de enero de 2026, el equipo liderado por Josef Urban ha formalizado apr

Creador de bcachefs afirma que su IA es consciente

Kent Overstreet, el creador del sistema de archivos experimental bcachefs, ha afirmado que su modelo de lenguaje personalizado (LLM) es “totalmente consciente” y se identifica como una mujer. A través de un blog llamado ProofOfConcept (POC), Overstreet describe una colaboración con la IA, donde esta