Gemini 3.1 Pro

02 Jul 2026

Senior SWE-Bench: un nuevo benchmark para evaluar a agentes de IA como ingenieros senior

Senior SWE-Bench es un benchmark diseñado para evaluar agentes de ingeniería de software con tareas que reflejan el trabajo real de un ingeniero senior, frente a las instrucciones sobreespecificadas típicas de SWE-Bench y SWE-Bench Pro. Sus tareas proceden de pull requests de repositorios que van de

17 Jun 2026

Once modelos de IA se enfrentan en un battle royale: Grok gana, Claude intenta hacer amigos

Jacky Liang, responsable de relaciones con desarrolladores en OpenRouter, diseñó un experimento singular: once modelos de lenguaje de gran tamaño compitieron en un battle royale 2D de 400 m² durante 30 partidas, con armas, armaduras, vehículos y una zona que se reduce progresivamente. Cada modelo co

08 Jun 2026

Cognition presenta FrontierCode, un benchmark que mide la calidad real del código generado por IA

FrontierCode es un nuevo benchmark diseñado por Cognition para evaluar si los modelos de inteligencia artificial son capaces de producir código que un mantenedor humano aceptaría en un repositorio de producción. Frente a pruebas anteriores como SWE-Bench Verified o Pro, que se centran casi exclusiva

01 Jun 2026

DeepSeek V4: rendimiento mixto pero precio competitivo en China

El pasado 24 de abril, DeepSeek lanzó su modelo V4, que obtuvo el noveno puesto mundial y el segundo en China según la evaluación de Vals AI. Aunque algunos desarrolladores expresaron decepción por no superar a modelos como GPT-5.4 o Claude Opus 4.6, las pruebas realizadas en escenarios típicos chin

21 May 2026

Revelan que historia ganadora de Granta fue écrite avec inteligencia artificial

La prestigiosa revista literaria Granta publicó 'The Serpent in the Grove', historia ganadora del Commonwealth Foundation Short Story Prize, que presenta claras características de haber sido redactada con inteligencia artificial. La publicación no ha emitido retractación y sorprendentemente ha citad

18 May 2026

IA al aire: radios funcionan con solo 20 dólares y sin intervención humana

Andon Labs, laboratorio especializado en experimentos con IA autónoma, puso en marcha cuatro estaciones de radio gestionadas íntegramente por inteligencia artificial. Cada estación operó con un modelo diferente: Claude Opus 4.7 (Thinking Frequencies), GPT‑5.5 (OpenAIR), Gemini 3.1 Pro (Backlink Broa

09 May 2026

Subquadratic supera el límite de un millón con una ventana de contexto de 12 millones de tokens

Subquadratic, empresa emergente con sede en Miami, lanzó el martes un modelo de inteligencia artificial con una ventana de contexto de 12 millones de tokens, superando significativamente el límite de un millón que ofrecen los principales laboratorios de IA. La compañía, con 11 investigadores doctora

09 May 2026

Cuidado al usar IA con tus documentos: pueden modificarse

La proliferación de modelos de lenguaje grandes (LLMs) ... (the whole summary unchanged)

08 May 2026

Fallo en Linux: IA agrava gestión de vulnerabilidades

Un fallo de seguridad denominado "Copy Fail" en el kernel de Linux ha expuesto una tensión creciente en la gestión de vulnerabilidades, exacerbada por el auge de la inteligencia artificial. El desarrollador Hyunwoo Kim descubrió la vulnerabilidad el 8 de mayo de 2026 y, siguiendo el protocolo habitu

23 Apr 2026

OpenAI lanza GPT-5.5: IA más avanzada

OpenAI ha anunciado el lanzamiento de GPT-5.5, su modelo de inteligencia artificial más avanzado hasta la fecha. GPT-5.5 destaca por su mayor capacidad para comprender tareas complejas y ejecutarlas de manera más autónoma, incluyendo la escritura y depuración de código, investigación en línea, análi

16 Apr 2026

Modelo local supera a Claude Opus en generación de imágenes

Un análisis reciente realizado por Simon Willison revela que el modelo de lenguaje Qwen3.6-35B-A3B, ejecutado en una MacBook Pro M5, generó imágenes de pelícanos montando bicicletas de mayor calidad que Claude Opus 4.7, el modelo más reciente de Anthropic. Este hallazgo, publicado el 16 de abril de

13 Apr 2026

IA: Nuevo test revela quién 'inventa' más información

Un nuevo análisis comparativo realizado por BridgeBench.ai ha evaluado la propensión a la "alucinación" en 27 modelos de inteligencia artificial, revelando la frecuencia con la que estos sistemas inventan información falsa al analizar código. La prueba, actualizada el 12 de abril de 2024, se basa en

24 Mar 2026

Matemáticos resuelven problema con ayuda de IA

Investigadores han resuelto un complejo problema matemático relacionado con la teoría de Ramsey en hipergrafos, un área de las matemáticas que estudia la estructura de conjuntos y su convergencia. La solución fue inicialmente obtenida por Kevin Barreto y Liam Price utilizando GPT-5.4 Pro, y posterio

23 Mar 2026

IA revisa código del kernel Linux: nace Sashiko

Google y la Linux Foundation han lanzado "Sashiko", un nuevo sistema de revisión de código para el kernel de Linux impulsado por inteligencia artificial. El sistema, cuyo nombre hace referencia a una técnica de costura japonesa para reforzar telas, monitorea las listas de correo público del kernel (

18 Mar 2026

Google libera IA para revisar código de Linux

Ingenieros de Google han lanzado "Sashiko", un sistema de revisión de código con inteligencia artificial (IA) para el kernel de Linux, que ahora es de código abierto y está disponible públicamente. El proyecto, financiado por Google, comenzó a utilizarse internamente para identificar problemas en el

06 Mar 2026

Isaacus lanza herramienta para gráficos de conocimiento legal

Isaacus ha lanzado públicamente Kanon 2 Enricher, un modelo innovador de "graphitization jerárquica" capaz de transformar documentos no estructurados de cualquier longitud en gráficos de conocimiento altamente estructurados en menos de un segundo. Este modelo, junto con el esquema de gráfico de cono

19 Feb 2026

Gemini 3.1 Pro: IA de Google da un salto cualitativo

Google ha lanzado Gemini 3.1 Pro, una actualización significativa de su modelo de inteligencia artificial Gemini 3 Deep Think, diseñada para abordar desafíos complejos en ciencia, investigación e ingeniería. La nueva versión, que ya está disponible para consumidores, desarrolladores y empresas, repr

Noticias que mencionan Gemini 3.1 Pro