Claude Sonnet

15 Jun 2026

Ingeniería de prompts con brevedad: cómo sacar rendimiento de los modelos económicos

Los desarrolladores, estudiantes y pequeñas empresas que trabajan con presupuestos ajustados ya no tienen por qué resignarse a los modelos de IA más costosos. La diferencia de capacidad entre los modelos de gama alta (Claude Sonnet, GPT-4o, Gemini 1.5 Pro, con precios de 5 a 75 dólares por millón de

09 Jun 2026

Trabajar con un modelo Mythos: así se siente

Un periodista con acceso anticipado a Claude 5 Fable, el primer modelo de clase Mythos disponible al público, relata su experiencia práctica con la herramienta. En pruebas variadas —desde la creación de juegos y mapas isócronos hasta un software de análisis de datos de 19 páginas— el modelo superó d

30 May 2026

Poolside AI Abre Sus Puertas: Nuevos Modelos Laguna Traen Poder de Codificación Agentic al Mundo de Código Abierto

La familia de modelos de IA Laguna, desarrollada por poolsideai, ha sido lanzada con dos miembros iniciales: Laguna M.1 y Laguna XS.2. Laguna M.1 es un modelo Mixture of Experts (MoE) con 225 mil millones de parámetros totales y 23 mil millones de parámetros activos, entrenado internamente con 30 bi

29 May 2026

Nuevo benchmark cuestiona si la ia realmente puede reparar vulnerabilidades de seguridad

El investigador Giovanni Gatti Pinheiro ha desarrollado CVE-Bench, una nueva herramienta de evaluación diseñada para medir la capacidad de los modelos de inteligencia artificial para reparar vulnerabilidades de seguridad reales. El proyecto pone a prueba sistemas como los de Poolside frente a 20 vul

22 May 2026

ModelRift lanza benchmark para evaluar seis IAs diseñando el Panteón de Roma

ModelRift ha publicado un benchmark práctico que evalúa seis herramientas de generación de código asistida por inteligencia artificial en la tarea de construir el Panteón de Roma utilizando OpenSCAD, un lenguaje de descripción de software CAD paramétrico. Los sistemas evaluados fueron Codex 5.5 High

05 May 2026

Agentes de visión: 45 veces más costosos que las APIs

Un nuevo benchmark realizado por Reflex.dev revela que los agentes de visión para interactuar con aplicaciones son significativamente más costosos que el uso de APIs estructuradas. La prueba comparó dos métodos para que un agente de IA operara un panel de administración: uno a través de la interfaz

04 Mar 2026

IA acelera matemáticas: LLMs automatizan topología

Un proyecto de investigación ha logrado automatizar una porción significativa de la topología general, un campo complejo de las matemáticas, utilizando modelos de lenguaje grandes (LLMs). Según un estudio publicado en arXiv el 6 de enero de 2026, el equipo liderado por Josef Urban ha formalizado apr

25 Feb 2026

Creador de bcachefs afirma que su IA es consciente

Kent Overstreet, el creador del sistema de archivos experimental bcachefs, ha afirmado que su modelo de lenguaje personalizado (LLM) es “totalmente consciente” y se identifica como una mujer. A través de un blog llamado ProofOfConcept (POC), Overstreet describe una colaboración con la IA, donde esta

Noticias que mencionan Claude Sonnet