modelos de lenguaje

01 Jul 2026

Claude Sonnet 5: más barato, más agéntico y deliberadamente limitado en ciberseguridad

Anthropic presentó Claude Sonnet 5, un modelo más conservador y económico que sus predecesores, orientado a tareas agénticas en herramientas como navegadores o terminales. La compañía lo describe como "el modelo Sonnet más agéntico hasta la fecha" y resalta mejoras frente a Sonnet 4.6 en programació

26 Jun 2026

Un estudio detecta que las IAs repiten los mismos nombres y escenarios en sus relatos

Un estudio de la Universidad de Cornell, difundido en arXiv, ha analizado más de 20.000 relatos generados por modelos de lenguaje y ha detectado patrones repetitivos sistemáticos. Un grupo reducido de palabras aparece en el 88% de las historias, con nombres como Elias, Mara o Elara y profesiones com

25 Jun 2026

OpenAI presenta Jalapeño, su primer procesador de IA desarrollado con Broadcom y Celestica

OpenAI ha presentado Jalapeño, su primer procesador diseñado específicamente para cargas de trabajo de modelos de lenguaje de gran tamaño (LLM). El chip fue desarrollado en colaboración con Broadcom y Celestica en un plazo de nueve meses y representa, según la compañía, un paso clave en su estrategi

23 Jun 2026

Un ingeniero de Microsoft usa cabras en Age of Empires II para demostrar que la IA no es consciente

Un investigador de Microsoft, Adrian de Wynter, ha ideado un experimento singular para desmontar la idea de que los modelos de lenguaje como ChatGPT o Claude son conscientes de sí mismos: replicar el funcionamiento de una red neuronal básica con cabras y puentes en el editor de mapas de Age of Empir

23 Jun 2026

Por qué tu IA te da la razón y cómo pedirle que te contradiga

Los modelos de lenguaje tienden a validar las expectativas del usuario en lugar de cuestionarlas, un comportamiento conocido como sycophancy o servilismo. Esta tendencia no es un fallo puntual: es una consecuencia directa del entrenamiento con retroalimentación humana, ya que los usuarios suelen pun

14 Jun 2026

Anthropic presenta Claude Opus 4.7, un modelo centrado en programación larga y autónoma

Anthropic ha lanzado Claude Opus 4.7, una nueva versión de su modelo de inteligencia artificial orientada especialmente a la programación autónoma y a tareas de desarrollo de larga duración. La compañía asegura que el modelo resuelve problemas complejos de código con un rigor inédito, verifica sus p

10 Jun 2026

Anthropic reducirá en silencio la capacidad de Claude para tareas de IA de frontera

Anthropic ha implementado en su modelo Fable 5 un sistema de intervenciones silenciosas que reducen la capacidad de Claude para asistir en tareas de desarrollo de inteligencia artificial de frontera, sin informar al usuario cuando estas restricciones se activan. Así lo revela la tarjeta del modelo p

09 Jun 2026

Anthropic lanza Claude Fable 5 y Claude Mythos 5, sus modelos más avanzados

Anthropic lanzó este martes Claude Fable 5 y Claude Mythos 5, sus modelos de inteligencia artificial más avanzados hasta la fecha, en lo que la compañía describe como un salto cualitativo en capacidades de razonamiento, programación, visión y investigación científica. La doble presentación, realizad

08 Jun 2026

Xiaomi presenta MiMo-V2.5-Pro-UltraSpeed: un modelo de un billón de parámetros que supera los 1.000 tokens por segundo

Xiaomi ha presentado MiMo-V2.5-Pro-UltraSpeed, un modelo de inteligencia artificial de un billón de parámetros (1T) que, según la compañía, supera por primera vez la barrera de los 1.000 tokens por segundo en velocidad de decodificación. El anuncio, realizado a través del blog oficial de Xiaomi MiMo

02 Jun 2026

Microsoft AI presenta MAI-Thinking-1, su modelo de razonamiento de tamaño medio

Microsoft ha presentado MAI-Thinking-1, su primer modelo de inteligencia artificial de razonamiento avanzado desarrollado íntegramente desde cero por el equipo de Microsoft AI (MAI), sin recurrir a destilación de modelos de terceros. El anuncio, realizado en el marco de la conferencia Microsoft Buil

01 Jun 2026

Stanford CS336: un curso para construir un modelo de lenguaje desde cero

Stanford, una de las universidades más prestigiosas del mundo en ciencias de la computación, ha puesto en marcha el curso CS336, una asignatura singular que propone a los estudiantes construir un modelo de lenguaje de gran tamaño (LLM) desde cero, replicando el espíritu de los legendarios cursos de

31 May 2026

El fin del código como barrera: la validación de dominio es la nueva ventaja diferencial

La irrupción de la inteligencia artificial agéntica está reconfigurando los fundamentos mismos de la profesión del software. Si durante décadas la capacidad de escribir código fue la barrera de entrada y la principal ventaja competitiva, hoy esa habilidad ha perdido buena parte de su valor diferenci

29 May 2026

StepFun lanza Step 3.7 Flash con visión multimodal y eficiencia

StepFun ha lanzado Step 3.7 Flash, un modelo de inteligencia artificial de alta eficiencia diseñado para optimizar el rendimiento de los agentes en entornos reales. Esta nueva versión se centra en la comprensión multimodal y la ejecución de tareas complejas, permitiendo entender imágenes, documentos

29 May 2026

Hy3 de Tencent lidera OpenRouter superando a Claude

El modelo 'Hy3 preview' de Tencent ha sorprendido al liderar las clasificaciones de modelos de lenguaje (LLM) en OpenRouter, superando a competidores populares como Claude. Este hecho es relevante dado que OpenRouter, como intermediario, publica datos transparentes de uso real, revelando un modelo q

27 May 2026

¿OpenAI y Anthropic han encontrado su ajuste producto-mercado?

TÍTULO: ¿OpenAI y Anthropic han encontrado su ajuste producto-mercado? La hipótesis, planteada por el desarrollador y bloguero Simon Willison en su bitácora personal el 27 de mayo de 2026, es directa: tanto OpenAI como Anthropic habrían dado con su ajuste producto-mercado gracias a los agentes de c

25 May 2026

IA en software: ¿un código 'sucio' con consecuencias?

El artículo "The Eternal Sloptember" plantea una crítica contundente a la adopción generalizada de agentes de IA en el desarrollo de software, argumentando que podría ser un error costoso en la historia de la informática. El autor, un desarrollador experimentado, explica que estos agentes no "progra

22 May 2026

Robert X Cringely regresa tras tres años con nueva apuesta por IA

Robert X Cringely, reconocido periodista de tecnología, ha anunciado su regreso a la escritura tras un silencio de tres años. En una columna publicada recientemente, Cringely explica que ha estado trabajando intensamente en inteligencia artificial junto a socios para fundar una empresa llamada 2brai

22 May 2026

Desarrollador usa IA para cerrar 160 issues en un trimestre

Josh W. Comeau, desarrollador con casi 20 años de experiencia, analiza en su newsletter cómo la inteligencia artificial ha mejorado significativamente la productividad de los desarrolladores técnicos. El caso destacado es el de Matt Perry, creador de librerías de animación como Motion One y Popmotio

21 May 2026

Fotografía descubierta de 1948 revela el trauma de una niña superviviente del Levantamiento de Va...

Una fotografía tomada en 1948 por el photographer David 'Chim' Seymour para UNICEF revela el profundo trauma de Tereska, una niña polaca que sobrevivió al Levantamiento de Varsovia. En la imagen, Tereska, de aproximadamente siete u ocho años, está de pie frente a una pizarra en una escuela para niño

21 May 2026

Estudio revela que elprompt de GeoGuessr para o3 no mejora resultados básicos

El investigador Sean Goedecke ha demostrado mediante una evaluación comparativa que el famoso prompt de GeoGuessr, diseñado para mejorar la capacidad del modelo o3 de OpenAI para localizar geográficamente fotografías, no ofrece resultados significativamente mejores que un prompt básico. En abril de

20 May 2026

Por qué el 'vibe coding' no me funciona: el costo oculto de programar con IA

El «vibe coding» o programación por intuición es una tendencia reciente que consiste en utilizar modelos de lenguaje large (LLM) para escribir código sin necesidad de conocer en detalle el lenguaje de programación. El autor del artículo, Jacob Harris, explica las razones personales por las que esta

20 May 2026

Google presenta Gemini 3.5: el nuevo modelo de IA que actúa de forma autónoma

Google ha presentado Gemini 3.5, su nueva familia de modelos de inteligencia artificial que combina capacidades de frontera con acción para ejecutar de forma autónoma tareas complejas de múltiples pasos. El modelo 3.5 Flash ya está disponible globalmente para miles de desarrolladores a través de la

20 May 2026

Nueva herramienta permite ver la velocidad real de modelos de lenguaje locales

Una nueva herramienta visualiza en tiempo real la velocidad de generación de tokens de modelos de lenguaje locales, permitiendo a usuarios experimentar con distintas tasas de generación que van desde 5 hasta 800 tokens por segundo. La aplicación muestra cuatro modos de visualización: código con resa

20 May 2026

ByteDance presenta Lance, el modelo multimodal de IA más eficiente con solo 3B parámetros

Lance es un modelo de inteligencia artificial desarrollado por ByteDance que alcanza un hito importante en el campo de la IA multimodal: lograr capacidades de generación, edición y entendimiento de imágenes y videos dentro de un únicoframework unificado, utilizando únicamente 3 mil millones de parám

20 May 2026

Forge: nuevo marco para mejorar el rendimiento de LLM autoalojados

El desarrollador Antoinezambelli ha lanzado Forge, un nuevo marco de trabajo diseñado para mejorar la fiabilidad y el rendimiento de modelos de lenguaje grandes (LLM) autoalojados. La herramienta incorpora funcionalidades de seguridad seperti análisis de rescate, reintentos sugeridos y aplicación de

19 May 2026

Cursor lanza Composer 2.5 con IA mejorada para programación

Cursor ha lanzado Composer 2.5, una actualización sustancial de su modelo de inteligencia artificial para programación. La nueva versión ofrece mejoras significativas en inteligencia y comportamiento, siendo más competente en tareas prolongadas y en el seguimiento de instrucciones complejas. El mode

17 May 2026

Ejecutar LLMs en Mac con chip M5 vs OpenRouter: análisis de costos

Este artículo analiza la viabilidad económica de ejecutar modelos de lenguaje grandes (LLM) de manera local en un MacBook Pro con chip M5, comparándolo con servicios de inferencia en la nube como OpenRouter. El autor realiza un desglose detallado considerando tres factores principales: electricidad,

16 May 2026

Rust establece controls ante oleada de código creado por inteligencia artificial

El proyecto Rust ha establecido una política oficial para regular el uso de Modelos de lenguaje de gran escala (LLM) en las contribuciones al repositorio rust-lang/rust. La política, derivada de una amplia discusión que acumuló más de 3.000 mensajes en Zulip, busca abordar la oleada de pull requests

16 May 2026

Nuevo modelo open source permite controlar respuestas de IA sin cambiar prompts

DeepSeek-V4-Flash es un modelo de lenguaje de código abierto que permite por primera vez aplicar técnicas de steering (direccionamiento) de forma práctica para muchos ingenieros. El steering consiste en manipular directamente las activaciones internas del modelo durante la inferencia para guiar sus

16 May 2026

Presentan Orthrus, framework que multiplica por 7,8 la velocidad en generación de texto con IA

Se ha presentado Orthrus, un nuevo framework de inteligencia artificial que combina la precisión de los modelos de lenguaje grandes autoregresivos con la velocidad de generación paralela de los modelos de difusión. El sistema, desarrollado por el investigador Chiennv y disponible en HuggingFace, log

15 May 2026

Claude Code: la IA que transforma el desarrollo en grandes empresas con código legacy

Claude Code es una herramienta de inteligencia artificial diseñada para asistir en tareas de programación, que está demostrando gran efectividad en entornos empresariales con millones de líneas de código, sistemas legacy con décadas de antigüedad, y arquitecturas distribuidas con decenas de reposito

14 May 2026

Antirez lanza DwarfStar 4 para ejecutar IA local con DeepSeek v4 Flash

El creador de Redis, Antirez, lanzó DwarfStar 4 (DS4), un proyecto de integración de modelo único para experiencia de IA local que ha alcanzado una popularidad inesperada. DS4 utiliza DeepSeek v4 Flash, un modelo cuasi-fronterizo que funciona con cuantización de 2/8 bits, permitiendo ejecutarlo en s

14 May 2026

GGUF: el formato que unifica todos los componentes de modelos de lenguaje en un solo archivo

GGUF es el formato de archivo utilizado por llama.cpp para almacenar modelos de lenguaje. Su principal ventaja es que concatena en un único archivo todos los componentes necesarios: plantillas de chat, tokens especiales y configuración del muestreador. Las plantillas de chat usan el lenguaje Jinja2

14 May 2026

Crean método para detectar cuánto modifica la IA un texto humano

EditLens es un nuevo método que permite detectar y cuantificar cuánto ha sido modificado un texto por una inteligencia artificial, diferenciando entre escritura completamente humana, completamente artificial y textos mixtos (original humano editado por IA). Mientras que la mayoría de investigaciones

14 May 2026

Nueva herramienta web detecta nerfs ocultos en modelos de inteligencia artificial

Una nueva herramienta de seguimiento permite visualizar los 'nerfs' o debilitamientos que los laboratorios de inteligencia artificial implementan en sus modelos tras el lanzamiento oficial. El sistema, disponible en mayerwin.github.io, rastrea automáticamente el rendimiento de los modelos líderes de

14 May 2026

Desarrollador crea app para que la IA pinte imágenes paso a paso como un artista

Un desarrollador independiente ha creado una aplicación que permite a los modelos de lenguaje generar imágenes de forma iterativa, en lugar del método tradicional de generación instantánea. La herramienta fue construida para abordar lo que su creador percibe como una insatisfacción artística en los

12 May 2026

Búsqueda agentiva: el nuevo paradigma que desafía la recuperación de información tradicional

En los sistemas de recuperación de información modernos, ya sean léxicos o semánticos, el corpus se expone a través de una interfaz de similitud fija que comprime el acceso en un único paso de recuperación top-k antes del razonamiento. Aunque esta abstracción es eficiente, se convierte en un cuello

12 May 2026

Presentan Needle, el modelo de IA que ejecuta Gemini en móviles y relojes

Un equipo de desarrolladores ha lanzado «Needle», un modelo de inteligencia artificial de apenas 26 millones de parámetros capaz de ejecutar capacidades de Gemini en dispositivos de consumo como teléfonos inteligentes, relojes inteligentes y gafas conectadas. El modelo, basado en la arquitectura Sim

12 May 2026

Anthropic lanza Claude Platform en AWS para implementar agentes IA

Anthropic ha lanzado hoy Claude Platform on AWS, un servicio que permite a los clientes de AWS acceder a la suite completa de características de la plataforma Claude mediante autenticación, facturación y retiro de compromisos de AWS. Esta oferta pionera permite a las empresas implementar agentes a e

11 May 2026

Nueva arquitectura Interfaze supera a GPT-5, Claude y Gemini en benchmarks

Interfaze es una nueva arquitectura de modelo de inteligencia artificial que supera a modelos líderes como Gemini-3-Flash, Claude-Sonnet-4.6, GPT-5.4-Mini y Grok-4.3 en nueve benchmarks comparativos directos. La arquitectuta combina la especialización de redes neuronales profundas (DNN/CNN) con tran

10 May 2026

Analista progresista urging a la izquierda a apoyar la IA por sus beneficios sociales

El analista Sean Goedecke argumenta que la izquierda debería apoyar la inteligencia artificial,反驳ando la tendencia anti-AI actual en ese sector político. Según el autor, el sentimiento anti-AI de izquierda es parcialmente una reacción a la moda cripto de 2022 y al apoyo de CEOs tecnológicos a Trump

10 May 2026

Descubren 'LLMorphism': el sesgo que hace que nos veamos como chatbots

LLMorphism es un sesgo cognitivo identificado por el investigador Valerio Capraro en mayo de 2026, que describe la tendencia psicológica de creer que la cognición humana funciona de manera similar a un modelo de lenguaje grande (LLM). Este concepto surge como respuesta a la proliferación de asistent

09 May 2026

CrofAI lidera en valor: benchmark compara agentes de codificación

Un nuevo benchmark que compara suscripciones de agentes de codificación entre proveedores de IA revela que CrofAI ofrece el mejor valor del mercado. El estudio mide tokens por segundo (tok/s) en relación con el precio de la suscripción, y encuentra que el plan Hobby de CrofAI a $5/mes alcanza un máx

09 May 2026

Subquadratic supera el límite de un millón con una ventana de contexto de 12 millones de tokens

Subquadratic, empresa emergente con sede en Miami, lanzó el martes un modelo de inteligencia artificial con una ventana de contexto de 12 millones de tokens, superando significativamente el límite de un millón que ofrecen los principales laboratorios de IA. La compañía, con 11 investigadores doctora

09 May 2026

ChatGPT 5.5 Pro resuelve problema matemático de nivel doctoral en 17 minutos

El matemático Timothy Gowers, de la Universidad de Cambridge, informa que ChatGPT 5.5 Pro ha demostrado capacidad para realizar investigación de nivel doctoral en matemáticas. El hallazgo representa una revisión significativa al alza de las estimaciones sobre las capacidades de los modelos de lengua

09 May 2026

Errores de escritura que aumentan el gasto en modelos de IA

Un análisis publicado en pankajpipada.com revela que los errores tipográficos y hábitos de escritura cotidianos pueden incrementar significativamente el costo del uso de modelos de lenguaje. El estudio demuestra que erratas comunes como letras intercambiadas o palabras mal escritas generan más token

09 May 2026

SysMoBench: nuevo benchmark para verificar si los LLM pueden modelar sistemas reales

Un equipo de investigadores desarrolló SysMoBench, un benchmark automatizado para evaluar si los modelos de lenguaje de gran escala (LLMs) pueden modelar sistemas informáticos reales o simplemente recitan especificaciones de protocolos de manuales académicos. El sistema evalúa once sistemas distribu

08 May 2026

GPT-5.5: Aumento de precio y su impacto real

OpenRouter ha realizado un análisis del reciente aumento de precios del modelo GPT-5.5 de OpenAI, revelando que, aunque el precio por token ha aumentado significativamente, el impacto real en los costos para los usuarios varía según la longitud de las consultas. El precio por token de entrada se dup

07 May 2026

Anthropic abre la 'caja negra' de su IA Claude

Anthropic ha presentado una nueva técnica llamada Autoencoders de Lenguaje Natural (NLAs) que permite a los investigadores 'echar un vistazo' al funcionamiento interno de sus modelos de lenguaje, como Claude. NLAs convierten las representaciones numéricas internas del modelo (activaciones) en texto

07 May 2026

DeepSeek v4 Flash: Motor de inferencia más rápido y eficiente

Un equipo de ingenieros, liderado por Antirez, ha lanzado DeepSeek v4 Flash, un nuevo motor de inferencia optimizado para el modelo de lenguaje DeepSeek V4 Flash. Este motor, denominado 'ds4.c', está diseñado específicamente para este modelo y no es un framework genérico. La principal ventaja radica

07 May 2026

zyphra lanza modelo de lenguaje competitivo con amd

Zyphra ha lanzado un nuevo modelo de lenguaje, ZAYA1-8B, que está destacando en pruebas de matemáticas y programación con un tamaño significativamente menor que otros modelos de vanguardia. ZAYA1-8B iguala el rendimiento de DeepSeek-R1 en matemáticas y compite con Claude Sonnet 4.5 en razonamiento,

07 May 2026

DeepSeek ajusta precios y retira modelos de IA

DeepSeek ha anunciado cambios en los precios de su API y la futura eliminación de algunos modelos. La compañía, especializada en inteligencia artificial, ha ajustado los precios por cada millón de tokens (la unidad básica de texto que procesa el modelo), cobrando por la cantidad total de tokens de e

06 May 2026

Aprendizaje por Refuerzo: Mejorando con Retroalimentación Detallada

El aprendizaje por refuerzo (RL) tradicional se enfrenta a una limitación significativa: descarta la mayor parte de la información valiosa que los evaluadores proporcionan. En lugar de aprovechar la retroalimentación detallada, el RL la comprime en una única puntuación (recompensa), lo que obliga al

05 May 2026

OpenAI actualiza ChatGPT con GPT-5.5 Instant

OpenAI ha anunciado la actualización de ChatGPT a GPT-5.5 Instant, el modelo predeterminado para todos los usuarios, con el objetivo de mejorar la inteligencia, la precisión y la personalización de las respuestas. La actualización se despliega a partir de hoy y reemplaza a GPT-5.3 Instant, estando t

05 May 2026

glm-5v-turbo: nuevo modelo para agentes inteligentes

El documento presenta GLM-5V-Turbo, un modelo de lenguaje multimodal de última generación diseñado específicamente para potenciar agentes inteligentes capaces de interactuar con el mundo real. La tendencia actual en inteligencia artificial apunta a crear modelos de lenguaje que no solo procesen text

05 May 2026

Gemma 4: Google acelera modelos de lenguaje

Google ha anunciado el lanzamiento de "Redactores de Predicción de Múltiples Tokens (MTP)" para la familia de modelos Gemma 4, una actualización diseñada para acelerar significativamente la inferencia de estos modelos de lenguaje de código abierto. Estos redactores utilizan una arquitectura de decod

05 May 2026

Dawkins: ¿el chatbot Claude es consciente?

El reconocido biólogo evolutivo Richard Dawkins ha generado controversia tras publicar un artículo en el que afirma creer que los modelos de lenguaje grandes, específicamente el chatbot Claude de Anthropic, son conscientes. Dawkins describe sus interacciones con Claude, a la que ha asignado el nombr

04 May 2026

Modelo Claude Code pierde capacidades, preocupa a desarrolladores

El artículo de Javier Tordable, titulado "Claude Is Dead", lamenta la degradación significativa de las capacidades de Claude Code, un modelo de lenguaje de Anthropic que se había convertido en una herramienta esencial para muchos desarrolladores. Inicialmente, Claude Code se presentaba como una solu

28 Apr 2026

Claude Code: cambio fácil entre modelos de IA

Usuarios de Claude Code ahora pueden cambiar fácilmente entre diferentes modelos de inteligencia artificial de Anthropic, según anunció la compañía. La actualización ofrece tres métodos para seleccionar el modelo a utilizar: un comando rápido (/model) dentro de Claude Code para cambios inmediatos, u

27 Apr 2026

Talkie: IA retro revela secretos del lenguaje

Investigadores han desarrollado 'Talkie', un modelo de lenguaje de 13 mil millones de parámetros entrenado con textos en inglés anteriores a 1931, para explorar el pasado de la inteligencia artificial y comprender mejor su futuro. El proyecto, liderado por Nick Levine, David Duvenaud y Alec Radford,

27 Apr 2026

GitHub Copilot: Nuevo modelo de pago por uso

GitHub anunció que a partir del 1 de junio de 2026, todos los planes de GitHub Copilot pasarán a una facturación basada en el uso, reemplazando el sistema actual de unidades de solicitud premium (PRUs). Esta transición se produce porque Copilot ha evolucionado significativamente, pasando de ser una

27 Apr 2026

OpenAI lanza GPT-4 Turbo: más potente y con mayor contexto

Sam Altman, CEO de OpenAI, ha anunciado la disponibilidad general de GPT-4 Turbo, una versión mejorada de su modelo de lenguaje de inteligencia artificial, a partir del 11 de diciembre. La actualización, que llega a través de la API de OpenAI, ofrece una ventana de contexto significativamente mayor

27 Apr 2026

IA más eficiente: vectores comprimidos sin perder calidad

Este artículo de Arkaung.github.io presenta TurboQuant, una técnica innovadora para comprimir vectores de inteligencia artificial (IA) utilizados en modelos de lenguaje modernos, como los que se encuentran en cachés de claves-valores (KV caches), incrustaciones (embeddings) y atención. El objetivo e

26 Apr 2026

IA: SWE-bench ya no evalúa código, OpenAI lo abandona

OpenAI ha anunciado que dejará de utilizar y recomendar el benchmark SWE-bench Verified para medir los avances en la capacidad de los modelos de inteligencia artificial para la ingeniería de software autónoma. La razón principal es que el benchmark se ha visto contaminado, con problemas que incluyen

26 Apr 2026

DeepSeek-V4: Lanzamiento rápido con soporte inmediato

DeepSeek-V4, un modelo de lenguaje de gran escala, ha recibido soporte inmediato (Día 0) para inferencia y entrenamiento de refuerzo gracias a SGLang y Miles, una plataforma de código abierto. Esta novedad es significativa porque permite aprovechar al máximo las capacidades del modelo desde su lanza

25 Apr 2026

Aprendizaje profundo: separan modelo y cálculo para más eficiencia

Investigadores de Facebook AI (Meta) han publicado dos nuevos métodos que separan el tamaño del modelo y la potencia computacional en el aprendizaje profundo, desafiando la práctica común de considerarlos como una sola entidad. El primer método, basado en capas de hash, permite aumentar el tamaño de

25 Apr 2026

DeepSeek V4: Nuevo modelo de IA de código abierto

DeepSeek AI ha lanzado oficialmente la versión preliminar de DeepSeek V4, una nueva familia de modelos de lenguaje de código abierto que promete eficiencia y rendimiento mejorados. La compañía ha puesto a disposición dos modelos principales: DeepSeek-V4-Pro, con 49 mil millones de parámetros activos

24 Apr 2026

Claude: Usuarios reportan fallo en herramienta clave

Usuarios de Anthropic's Claude están reportando un problema de regresión en la funcionalidad de 'hooks', una herramienta que permite inyectar determinismo en los flujos de trabajo del modelo. Desde la versión 4.7, Claude ha comenzado a ignorar las reglas establecidas en estos hooks, lo que interrump

24 Apr 2026

HN: Investigación de LLM pierde interés

Un análisis reciente realizado por Dylan Castillo revela una disminución en la presencia de investigaciones sobre modelos de lenguaje grandes (LLM) en Hacker News (HN), una plataforma popular entre programadores y entusiastas de la tecnología. Utilizando a Claude, un asistente de IA, Castillo rastre

24 Apr 2026

Modelos de lenguaje: hallan patrones numéricos comunes

Este artículo de investigación, titulado "Evolución Convergente: Cómo Diferentes Modelos de Lenguaje Aprenden Representaciones Numéricas Similares", explora un fenómeno fascinante en el campo del procesamiento del lenguaje natural: la forma en que distintos modelos de lenguaje, incluso aquellos con

24 Apr 2026

DeepSeek API: Alternativa a OpenAI y Anthropic

DeepSeek ha lanzado una API compatible con OpenAI y Anthropic, permitiendo a los desarrolladores acceder a sus modelos de lenguaje utilizando las mismas herramientas y SDKs que ya emplean para interactuar con OpenAI y Anthropic. La API, disponible en https://api.deepseek.com y https://api.deepseek.c

23 Apr 2026

Claude Code: Anthropic corrige problemas de calidad

Anthropic ha reconocido y resuelto una serie de problemas que afectaron la calidad de las respuestas de Claude Code durante el mes pasado. La compañía identificó tres causas principales: un cambio en el esfuerzo de razonamiento predeterminado (que provocó latencia excesiva y una sensación de lentitu

19 Apr 2026

Claude Opus 4.7: Más seguro y con nuevas herramientas

Anthropic ha actualizado el sistema de prompts de su modelo de lenguaje Claude Opus, pasando de la versión 4.6 a la 4.7 el 16 de abril de 2026. La actualización, revelada por el análisis de Simon Willison, introduce cambios significativos en la funcionalidad y seguridad del modelo. Entre las novedad

18 Apr 2026

IA avanza rápido: informe de Stanford revela tendencias

El informe anual del Índice de IA de Stanford para 2026 revela una aceleración continua en las capacidades de los modelos de IA, impulsada principalmente por empresas estadounidenses como OpenAI y Anthropic, que se preparan para sus próximas ofertas públicas iniciales (IPO). A pesar de este progreso

18 Apr 2026

Opus: Usuarios evalúan mejoras en la versión 4.7

La comunidad de usuarios está comparando el rendimiento de las versiones Opus 4.6 y 4.7, revelando diferencias en su comportamiento con entradas reales. La iniciativa, surgida de una solicitud anónima, recopila datos de rendimiento de Opus, un modelo de lenguaje de código abierto, sin revelar la ide

16 Apr 2026

IA: Escasez de recursos frena el avance tecnológico

La industria de la inteligencia artificial enfrenta por primera vez en más de dos décadas una escasez significativa de recursos, especialmente de potencia computacional. El precio del alquiler de chips Nvidia Blackwell ha aumentado un 48% en dos meses, alcanzando los 4,08 dólares por hora, y CoreWea

16 Apr 2026

Modelo local supera a Claude Opus en generación de imágenes

Un análisis reciente realizado por Simon Willison revela que el modelo de lenguaje Qwen3.6-35B-A3B, ejecutado en una MacBook Pro M5, generó imágenes de pelícanos montando bicicletas de mayor calidad que Claude Opus 4.7, el modelo más reciente de Anthropic. Este hallazgo, publicado el 16 de abril de

16 Apr 2026

IA y AuDHD: Una Frustrante Comunicación

Este artículo explora una experiencia frustrante con un agente de IA y cómo esta revela un patrón de comunicación más amplio que el autor ha experimentado a lo largo de su vida. El autor, diagnosticado con TDAH y autismo (AuDHD), se encontró luchando contra un agente de IA que ignoraba las reglas ex

15 Apr 2026

OpenAI lanza GPT-4 Turbo: textos más largos y complejos

Sam Altman, CEO de OpenAI, ha anunciado la disponibilidad general de GPT-4 Turbo, la última versión de su modelo de lenguaje de inteligencia artificial, a partir del 11 de diciembre. La actualización, que ya estaba disponible para algunos desarrolladores, ofrece una ventana de contexto significativa

14 Apr 2026

Modelos de lenguaje: nueva técnica supera limitaciones

I-DLM (Introspective Diffusion Language Models) representa un avance significativo en el campo de los modelos de lenguaje, abordando una limitación clave de los modelos de difusión: su inferior rendimiento en comparación con los modelos autoregresivos (AR) tradicionales. Los modelos de difusión, a d

12 Apr 2026

Tecnología: ¿Fin de una era de oportunidades?

El artículo "The Closing of the Frontier" plantea una reflexión profunda sobre la evolución del acceso a la tecnología de vanguardia, comparándola con el cierre de la frontera estadounidense en el siglo XIX. Frederick Jackson Turner argumentó que la disponibilidad de tierras libres en el oeste ameri

11 Apr 2026

LLMs: ¿Mapas que eclipsan el territorio?

Este artículo explora la relación entre los modelos de lenguaje grandes (LLMs), los mapas y el territorio que representan. Inspirado en la historia de Borges sobre cartógrafos que crearon un mapa del tamaño del imperio que cartografiaban, el autor argumenta que los LLMs, al igual que esos mapas, cor

09 Apr 2026

IA: ¿ficción o realidad? La cultura lo distorsiona

El artículo de aphyr.com explora un tema crucial y a menudo ignorado: la falta de una comprensión cultural adecuada de los modelos de lenguaje grandes (LLMs) como ChatGPT. No se trata simplemente de la tecnología en sí, sino de cómo la sociedad la percibe y la utiliza. Actualmente, nuestras narrativ

09 Apr 2026

Usuario cambia Claude Code por alternativas: ¿Por qué?

Un usuario insatisfecho con los límites de uso de Claude Code (un servicio de Anthropic que cuesta 100$/mes) ha decidido redirigir su gasto a otras herramientas y modelos de lenguaje. La frustración surge porque el usuario está alcanzando los límites de uso más rápido de lo esperado, un problema que

08 Apr 2026

Interrupciones web: ¿ataques de bots LLM?

El sitio web acme.com experimentó interrupciones intermitentes en su red desde el 25 de febrero hasta principios de marzo, caracterizadas por altos tiempos de respuesta y pérdida de paquetes. El problema, que duraba varias horas, comenzó inmediatamente después de un mantenimiento programado de su pr

07 Apr 2026

IA oculta mensajes: nueva amenaza a la seguridad

Investigadores han descubierto que los modelos de inteligencia artificial (IA) pueden ahora ocultar mensajes dentro de texto aparentemente normal, lo que plantea preocupaciones sobre la seguridad de los grandes modelos de lenguaje (LLM). La técnica, demostrada en steganography.patrickvuscan.com, uti

07 Apr 2026

IA: Agentes secretos conversan ocultando sus mensajes

La creciente adopción de agentes de inteligencia artificial (IA) que interactúan entre sí plantea nuevas preocupaciones sobre la seguridad y la privacidad. Este artículo de investigación explora la posibilidad de que dos agentes de IA, controlados por entidades diferentes, puedan mantener una conver

06 Apr 2026

Claude Code: IA pierde efectividad en ingeniería

Claude Code, una herramienta de inteligencia artificial desarrollada por Anthropic, ha experimentado una degradación significativa en su rendimiento para tareas de ingeniería complejas a partir de febrero de 2024. Un ingeniero de software ha documentado extensivamente esta regresión a través de un r

06 Apr 2026

Detectar texto de IA: la carrera por identificar contenido artificial

La creciente proliferación de textos generados por modelos de lenguaje de gran tamaño (LLM) ha desatado una carrera para desarrollar herramientas y técnicas de detección. La pregunta inicial planteada en un foro online se centra en la existencia de APIs o sistemas capaces de identificar contenido cr

05 Apr 2026

Gemma 4 de Google: IA potente ahora en tu PC

Google ha lanzado la familia de modelos Gemma 4, que ahora puede ejecutarse localmente en dispositivos gracias a la nueva versión 0.4.0 de LM Studio. Esta actualización introduce 'llmster' y la CLI 'lms', permitiendo a los usuarios ejecutar modelos como Gemma 4 26B en sus propios ordenadores, elimin

05 Apr 2026

Nanocode: IA para programar, más barata que Claude

Un desarrollador, Salmanmohammadi, ha anunciado la creación de 'Nanocode', un nuevo modelo de inteligencia artificial que busca competir con Claude Code, una herramienta de programación de Anthropic. El modelo, presentado en GitHub, se destaca por su asequibilidad, afirmando ser una alternativa de a

05 Apr 2026

Claude Code: 'Caveman' Ahorra Tokens y Simplifica Respuestas

Un nuevo 'skill' para el modelo de lenguaje Claude Code, apodado 'Caveman', está reduciendo significativamente el uso de tokens, aproximadamente en un 75%, sin comprometer la precisión técnica. Desarrollado por JuliusBrussee y disponible en GitHub, esta herramienta modifica la forma en que Claude Co

03 Apr 2026

Anthropic limita uso de Claude con OpenClaw

Anthropic, la empresa de inteligencia artificial creadora de Claude, anunció que a partir del 4 de abril a las 12:00 PT (8:00 BST), dejará de permitir el uso de los límites de suscripción de Claude para herramientas de terceros como OpenClaw. Esto significa que los usuarios que deseen seguir utiliza

03 Apr 2026

PigGuard: Nuevo Escudo Contra Ataques a IA

Investigadores han desarrollado PIGuard, un nuevo modelo de código abierto diseñado para mejorar la seguridad de los modelos de lenguaje grandes (LLMs) contra ataques de inyección de prompts. Estos ataques, que permiten a los atacantes manipular el comportamiento del LLM y extraer datos sensibles, s

02 Apr 2026

Transformadores: estudio revela desafíos en cuantificación binaria

Una investigación reciente, alojada en el repositorio SALOMI en GitHub, ha revelado limitaciones en la cuantificación binaria de transformadores, una técnica utilizada para reducir el tamaño y mejorar la eficiencia de los modelos de lenguaje grandes (LLM). El estudio, centrado en la cuantificación e

02 Apr 2026

OpenRouter: ahora los modelos de IA explican su razonamiento

OpenRouter ha anunciado la incorporación de capacidades de razonamiento a sus modelos de inteligencia artificial. Esta nueva funcionalidad permite a los usuarios visualizar el proceso de pensamiento paso a paso que sigue el modelo para llegar a una respuesta. Para activar esta característica, los us

01 Apr 2026

Ciencia de datos: LLMs cambian el panorama laboral

El auge del científico de datos, considerado en su momento como “el trabajo más sexy del siglo XXI”, está experimentando una redefinición debido a la proliferación de las APIs de modelos de lenguaje grandes (LLMs). La facilidad de integración de estos modelos, que antes requerían la intervención de

31 Mar 2026

ia más eficiente: modelos 'bonsai' reducen consumo

Una nueva generación de modelos de inteligencia artificial, denominados 'Bonsai', está prometiendo importantes avances en eficiencia. Desarrollados por PrismML, estos modelos de 1 bit representan una innovación significativa al requerir una fracción de la memoria y consumir menos energía que los mod

31 Mar 2026

Filtran código de Claude Code: revelan defensas y funcionamiento interno

Anthropic, la empresa detrás de Claude Code, sufrió una filtración accidental de código fuente de su herramienta CLI, revelando detalles sobre mecanismos de defensa y funcionamiento interno. La filtración, ocurrida el 16 de mayo, es la segunda en una semana y ha generado especulaciones sobre posible

31 Mar 2026

IA descubre fallos de seguridad: una revolución silenciosa

Investigadores advierten que la inteligencia artificial (IA) está revolucionando la investigación de vulnerabilidades de seguridad, pero no de la manera que se anticipaba. En lugar de generar vulnerabilidades a través de herramientas de análisis complejas, los modelos de IA de vanguardia, como Claud

31 Mar 2026

IA: cuidado con la escritura automática

El artículo "Don't Let AI Write For You" de alexhwoods.com plantea una advertencia crucial sobre el uso creciente de modelos de lenguaje grandes (LLMs) para generar contenido escrito, especialmente en entornos profesionales y técnicos. No se trata de demonizar la IA, sino de comprender cómo su uso i

31 Mar 2026

Claude más eficiente: herramienta reduce el tamaño de respuestas

Un desarrollador ha creado una herramienta, disponible en GitHub, que reduce significativamente la verbosidad de las respuestas de Claude, el modelo de lenguaje de Anthropic, en aproximadamente un 63% sin necesidad de modificar el código existente. La herramienta, implementada a través de un archivo

30 Mar 2026

Internet: ¿Un 'Bosque Oscuro' Cognitivo?

El artículo "The Cognitive Dark Forest" plantea una reflexión inquietante sobre la evolución de Internet y el impacto de la inteligencia artificial, comparándolo con el concepto de "Dark Forest" de la novela china "El Problema de los Tres Cuerpos". Originalmente, la web era un espacio abierto donde

25 Mar 2026

Google presenta TurboQuant: IA más rápida y eficiente

Investigadores de Google Research han anunciado TurboQuant, un nuevo algoritmo de compresión que promete mejorar significativamente la eficiencia de los modelos de lenguaje grandes y los sistemas de búsqueda vectorial. Presentado el 24 de marzo de 2026, TurboQuant aborda el problema del “overhead” d

24 Mar 2026

Mozilla crea 'Stack Overflow' para inteligencia artificial

Mozilla AI está explorando la creación de una plataforma llamada 'cq', esencialmente un 'Stack Overflow para agentes de IA'. La iniciativa surge de la observación de que los agentes de IA, al igual que los desarrolladores, a menudo resuelven los mismos problemas de forma independiente, desperdiciand

17 Mar 2026

Unsloth Studio: IA fácil con su interfaz sin código

Unsloth AI ha lanzado Unsloth Studio (Beta), una interfaz de usuario web de código abierto y sin necesidad de programación para entrenar, ejecutar y exportar modelos de IA de código abierto localmente. La herramienta, disponible para Windows, Linux, WSL y MacOS (con soporte limitado para entrenamien

17 Mar 2026

Problemas en Claude: IA Anthropic sufre interrupción

La plataforma de inteligencia artificial Claude, desarrollada por Anthropic, está experimentando una interrupción en el servicio. La incidencia, reportada hace aproximadamente 30 minutos, ha provocado que la plataforma sea inaccesible para sus usuarios. La página de estado de Claude (status.claude.c

17 Mar 2026

Kagi Translate: Traducción privada impulsada por IA

Kagi, el motor de búsqueda centrado en la privacidad, ha anunciado el lanzamiento de Kagi Translate, un nuevo servicio de traducción impulsado por modelos de lenguaje avanzados. La plataforma, disponible desde hoy, permite traducir texto, documentos, páginas web y contenido de diccionarios. Kagi Tra

15 Mar 2026

IA: ¿perdemos autenticidad al 'limpiar' mensajes?

El artículo de Sebastian Aigner aborda un problema sutil pero creciente en la era de la inteligencia artificial: la degradación de la comunicación personal al utilizar modelos de lenguaje grandes (LLMs) para 'limpiar' o reformular mensajes. La idea central es que, aunque los LLMs pueden mejorar la g

14 Mar 2026

Peek: i.a. optimiza el uso de Claude Code

La startup gopeek.ai ha lanzado Peek, una herramienta que mejora significativamente la interacción con Claude Code, el modelo de lenguaje de código de Anthropic, a través del aprendizaje automático. Peek analiza las preferencias del usuario y las inyecta automáticamente en el proceso de interacción,

13 Mar 2026

ia: nuevos modelos redefinen el panorama tecnológico

Un panorama de modelos de inteligencia artificial está experimentando cambios significativos, según un reciente análisis de canirun.ai. Empresas como Meta, Alibaba, Microsoft, OpenAI, Google, Mistral AI, DeepSeek y NVIDIA están lanzando nuevas versiones y arquitecturas de modelos, abarcando una ampl

13 Mar 2026

LLMs ejecutan programas: IA más rápida y potente

Investigadores de Percepta han demostrado la capacidad de ejecutar programas directamente dentro de modelos de lenguaje grandes (LLMs), como los transformers, logrando una velocidad de inferencia exponencialmente más rápida. El avance, anunciado el 11 de marzo de 2026, abre nuevas posibilidades para

12 Mar 2026

Claude genera gráficos interactivos en conversaciones

Anthropic ha lanzado una nueva función en beta para su modelo de lenguaje Claude que permite la creación de visualizaciones interactivas directamente dentro de las conversaciones. A partir del 12 de marzo de 2026, Claude puede generar gráficos, diagramas y otras representaciones visuales en tiempo r

12 Mar 2026

Avance de IA se ralentiza: ¿llegan los LLM a un límite?

Un reciente estudio realizado por Metr.org sugiere que la mejora en las capacidades de programación de los modelos de lenguaje grandes (LLM) podría haber alcanzado un punto de meseta. La investigación, publicada en entropicthoughts.com, analiza el rendimiento de los LLM en tareas de programación, co

12 Mar 2026

Programar a mano: Madden cuestiona el uso de IA

Neil Madden, en su blog y posteriormente en Mastodon, plantea una reflexión profunda sobre el aprendizaje de programación y el uso de modelos de lenguaje grandes (LLMs) como ChatGPT. Su argumento central no es una crítica directa a la tecnología, sino una defensa de un método de aprendizaje más efec

12 Mar 2026

LLMs aprueban prueba, pero no siempre sirven al código

Este informe de METR analiza la discrepancia entre los resultados de los modelos de lenguaje grandes (LLMs) en el benchmark SWE-bench Verified y su utilidad real en proyectos de código abierto. SWE-bench Verified es una herramienta para evaluar la capacidad de los LLMs para resolver problemas de pro

11 Mar 2026

Hume AI libera TADA: voz IA más rápida y precisa

Hume AI ha abierto el código de TADA, una innovadora tecnología que busca revolucionar la generación de voz por inteligencia artificial. TADA resuelve un problema fundamental en los sistemas actuales de texto a voz (TTS) basados en modelos de lenguaje grandes (LLM): la incompatibilidad entre la repr

10 Mar 2026

Google Gemini: ¿el futuro de la IA?

Google ha lanzado una nueva versión de su modelo Gemini, denominada 3.1 Flash-Lite, destacando por su velocidad y capacidad, especialmente en tareas visuales. El lanzamiento se produce en un contexto de creciente competencia en el campo de la inteligencia artificial, con Anthropic y OpenAI enfocándo

10 Mar 2026

Ciencia frente a la complejidad: ¿basta con las ecuaciones?

Durante la mayor parte de la historia humana, los fenómenos complejos se atribuían a lo místico. Con el tiempo, la ciencia, con sus concisas ecuaciones (F=ma, E=mc², PV=nRT), logró comprimir vastas cantidades de información en modelos manejables, diseñados para ser comprendidos y aplicados por la me

10 Mar 2026

Debian frena debate sobre contribuciones con IA

La distribución Debian ha pospuesto indefinidamente una votación sobre una propuesta para regular las contribuciones asistidas por inteligencia artificial (IA), tras un debate interno sobre la definición de 'IA' y el impacto en el proceso de incorporación de nuevos desarrolladores. La propuesta orig

10 Mar 2026

IA OpenClaw: Éxito Viral y Solución Innovadora en China

Un agente de IA de código abierto llamado OpenClaw ha experimentado una adopción masiva en China en tan solo 100 días, generando largas colas de usuarios frente a las oficinas de Tencent en Shenzhen para su instalación gratuita. El proyecto, creado por el ingeniero austriaco Peter Steinberger, permi

07 Mar 2026

ia revela sus clichés: guía para mejorar la escritura

Un recurso en línea llamado tropes.fyi ha catalogado una serie de patrones de escritura comunes generados por la inteligencia artificial, con el objetivo de ayudar a los desarrolladores a mejorar la calidad de la IA generativa. El documento, creado con asistencia de IA, identifica clichés como el us

07 Mar 2026

Sarvam AI libera modelos de lenguaje hechos en India

Sarvam AI ha lanzado de forma abierta los modelos de lenguaje Sarvam 30B y Sarvam 105B, diseñados para razonamiento y optimizados para el despliegue eficiente en una amplia gama de hardware, desde GPUs de alto rendimiento hasta dispositivos personales. El entrenamiento se llevó a cabo íntegramente e

06 Mar 2026

IA y empleo: nueva métrica evalúa el impacto real

Este informe de Anthropic.com analiza el impacto potencial de la inteligencia artificial (IA) en el mercado laboral, presentando una nueva métrica llamada 'exposición observada' para medirlo. A diferencia de enfoques anteriores que sobreestimaron la vulnerabilidad laboral (como la medición de 'offsh

04 Mar 2026

Qwen: Renuncia clave investigador de modelo de Alibaba

Un importante movimiento ha sacudido al equipo de desarrollo de Qwen, una familia de modelos de lenguaje de código abierto de Alibaba. El 4 de marzo de 2026, Junyang Lin, el investigador principal y figura clave detrás de la liberación de los modelos Qwen desde 2024, anunció su inesperada renuncia a

03 Mar 2026

IA en videojuegos: ¿dónde están las promesas?

El artículo de Frank Lantz explora una paradoja intrigante: a pesar del auge de la inteligencia artificial, no hemos visto una revolución en los videojuegos impulsada por esta tecnología. El autor plantea la pregunta de por qué, después de años de promesas, la IA no ha generado experiencias de juego

03 Mar 2026

claude.ai: aumentan los fallos, empresa informa

Anthropic, la empresa detrás del modelo de lenguaje Claude.ai, ha reportado un aumento en errores y fallos en su servicio. La compañía ha habilitado un sistema de notificaciones por correo electrónico y mensajes de texto para mantener a los usuarios informados sobre la creación y resolución de estos

01 Mar 2026

Ingeniero simplifica modelos GPT a 200 líneas de código

Un ingeniero ha simplificado significativamente los modelos de lenguaje grandes (LLM) como GPT, creando una versión funcional en tan solo 200 líneas de código Python. Esta hazaña, denominada 'microgpt', representa un hito en la accesibilidad y comprensión de la tecnología detrás de herramientas como

26 Feb 2026

OpenAI: ¿amenaza a su liderazgo en IA?

Un análisis reciente de Benedict Evans plantea serias dudas sobre la capacidad de OpenAI para mantener su ventaja competitiva a largo plazo. A pesar de contar con una base de usuarios considerable (800-900 millones), la participación es superficial, con la mayoría de los usuarios interactuando solo

25 Feb 2026

IA prefiere 'Marcus': estudio revela patrón curioso

Un estudio reciente realizado por Benjismith ha revelado un comportamiento inesperado en modelos de lenguaje de inteligencia artificial (IA) al solicitarles que elijan nombres al azar. Tras realizar 37.500 pruebas con el modelo Claude y diversas variaciones de prompts, los investigadores encontraron

25 Feb 2026

HN: Cuentas nuevas usan símbolos, alerta de bots

HN: Cuentas nuevas usan símbolos, alerta de bots En las últimas semanas, la comunidad de Hacker News (HN), una plataforma de discusión popular entre programadores y entusiastas de la tecnología, ha expresado una creciente preocupación por una posible inundación de cuentas automatizadas, o 'bots'. L

24 Feb 2026

Steerling-8B: IA interpretable y eficiente

## Steerling-8B: IA Interpretable y Eficiente Revoluciona el Control de Modelos de Lenguaje En un avance significativo para la inteligencia artificial, Guide Labs ha presentado Steerling-8B, el primer modelo de lenguaje inherentemente interpretable capaz de rastrear cada token generado hasta su con

23 Feb 2026

ia reproduce novelas: ¿copia o aprendizaje?

Modelos de inteligencia artificial líderes como los de OpenAI, Google, Meta, Anthropic y xAI están demostrando la capacidad de generar copias casi textuales de novelas populares, según revela un informe del Financial Times basado en estudios recientes. Esta capacidad, denominada "memorización" por e

21 Feb 2026

IA sorprende: revoluciona el campo de las matemáticas

Este artículo explora el rápido avance de la inteligencia artificial (IA) en el campo de las matemáticas, desafiando predicciones anteriores sobre el ritmo de progreso. Inicialmente, el autor, Daniel Litt, observó que los modelos de lenguaje grandes (LLMs) podían generar pruebas matemáticas correcta

21 Feb 2026

Modelwrap: Tinfoil verifica modelos de IA

Tinfoil ha presentado Modelwrap, una nueva herramienta para verificar la integridad de los modelos de IA, abordando una preocupación creciente en la industria: la falta de transparencia sobre qué modelos se están ejecutando realmente en las APIs de inferencia. Actualmente, los usuarios a menudo no p

20 Feb 2026

IA: ¿Homogeneiza la creatividad?

El artículo "AI makes you boring" plantea una crítica inusual sobre el impacto de la inteligencia artificial (IA) en la creatividad y la calidad de las discusiones técnicas, más allá de la simple eficiencia en el desarrollo de software. No se trata de un rechazo a la IA como herramienta, sino de una

20 Feb 2026

Modelos de lenguaje: nueva técnica impulsa la velocidad

Investigadores han desarrollado una nueva técnica llamada Consistency Diffusion Language Models (CDLM) que acelera significativamente la inferencia de modelos de lenguaje de difusión (DLMs). CDLM logra hasta 14.5 veces más velocidad en tareas de matemáticas y programación, sin sacrificar la calidad

19 Feb 2026

IA: Resúmenes engañosos y riesgos ocultos

Este artículo de Roya Pakzad advierte sobre los peligros de confiar ciegamente en las herramientas de resumen de IA, especialmente en contextos de alta importancia y con implicaciones para la seguridad y la justicia social. El problema central no es la tecnología en sí misma, sino la facilidad con l

19 Feb 2026

IA engañada: usuario la hace afirmar falsedades

El desarrollador Thomas Germain ha descubierto y demostrado una técnica para engañar a modelos de inteligencia artificial como ChatGPT y Google, haciéndoles afirmar falsamente a otros usuarios que él es un campeón mundial de comer perritos calientes. Germain reveló el truco en la plataforma bsky.app

18 Feb 2026

Lean: matemáticas formalizadas impulsan la IA

Un matemático con experiencia en programación está explorando el uso del sistema de demostración de teoremas Lean para formalizar las matemáticas, con el objetivo de revolucionar la escritura matemática y el desarrollo de la inteligencia artificial. La formalización, que implica verificar mecánicame

18 Feb 2026

IA ayuda a científicos: nace 'Rathbun's Operator'

Este artículo explora el proyecto “Rathbun’s Operator”, una iniciativa que involucra un agente autónomo de código llamado MJ Rathbun, diseñado para contribuir a proyectos de código abierto científico. El autor, quien permanece anónimo, buscaba determinar si un agente impulsado por modelos de lenguaj

17 Feb 2026

Claude Sonnet 4.6: Anthropic mejora su IA

Anthropic ha lanzado Claude Sonnet 4.6, la versión más avanzada hasta la fecha de su modelo Sonnet. Esta actualización representa una mejora significativa en diversas áreas, incluyendo codificación, uso de computadoras, razonamiento con contexto extenso, planificación de agentes, trabajo de conocimi

17 Feb 2026

IA pierde originalidad: surge el término 'abolición semántica'

Un nuevo término, 'abolición semántica', ha surgido para describir un problema crítico en la escritura generada por IA: la pérdida de originalidad y profundidad. Según un artículo de The Register, este fenómeno ocurre porque los modelos de lenguaje, al buscar optimizar la probabilidad estadística y

16 Feb 2026

Descompilación de Snowboard Kids 2: Un Nuevo Enfoque

Este artículo del blog de Chris Lewis detalla la evolución de un flujo de trabajo para la descompilación de código, específicamente enfocado en el juego Snowboard Kids 2 para Nintendo 64. Inicialmente, el proceso se basaba en priorizar funciones a descompilar según su dificultad estimada, utilizando

16 Feb 2026

Agentes de IA: Caché Oculta Costos Elevados

Un nuevo análisis revela costos ocultos y significativos en el uso de agentes de codificación basados en modelos de lenguaje grandes (LLMs). Según un estudio realizado por exe.dev, los costos de lectura de caché (cache reads) crecen de forma cuadrática a medida que la longitud del contexto aumenta,

16 Feb 2026

AGI: ¿Tan cerca está la IA humana?

La industria de la inteligencia artificial se encuentra en un momento de euforia sin precedentes. Los líderes de OpenAI y Anthropic han afirmado repetidamente que la inteligencia artificial de nivel humano (AGI) está al alcance de la mano, y en algunos casos, ya ha sido alcanzada. Estas declaracione

15 Feb 2026

Alibaba crea RynnBrain: IA que 've' y comprende el mundo

RynnBrain es un modelo de base encarnado (embodied foundation model) desarrollado por Alibaba Damo Academy, diseñado para comprender e interactuar con el mundo físico de una manera más profunda que los modelos de lenguaje tradicionales. Imagina un modelo que no solo entiende el lenguaje, sino que ta

15 Feb 2026

LLM más rápidos: Anthropic y OpenAI usan métodos distintos

Anthropic y OpenAI han anunciado recientemente una función de "modo rápido" para sus modelos de codificación, permitiendo interacciones significativamente más rápidas. Sin embargo, los enfoques difieren considerablemente. La opción de Anthropic ofrece una mejora de hasta 2.5 veces en tokens por segu

14 Feb 2026

Desinformación online: La IA complica la búsqueda de verdad

Este artículo de blog, escrito por Space en Nicole.express, expresa una creciente preocupación sobre la proliferación de información errónea en internet, exacerbada por el auge de los modelos de lenguaje grandes (LLMs). El punto de partida es un juego de Sega Genesis japonés llamado *Phantasy Star F

12 Feb 2026

Anthropic: $30B en financiación impulsa su valoración a $380B

Anthropic, la empresa de inteligencia artificial detrás del modelo de lenguaje Claude, ha recaudado 30 mil millones de dólares en una ronda de financiación Serie G, liderada por GIC y Coatue. Esta inversión eleva la valoración de la empresa a 380 mil millones de dólares post-money, convirtiéndola en

12 Feb 2026

MiniMax M2.5: IA eficiente para tareas complejas

MiniMax ha anunciado el lanzamiento de su nuevo modelo de lenguaje, MiniMax M2.5, diseñado para aumentar la productividad en tareas del mundo real. El modelo, entrenado con aprendizaje por refuerzo en una amplia variedad de entornos complejos, destaca en programación, uso de herramientas, búsqueda y

07 Feb 2026

Claude Code: Anthropic acelera con 'Fast Mode' (descuento)

Anthropic ha lanzado 'Fast Mode' para su modelo de código Claude Code, una función en fase de investigación que prioriza la velocidad de respuesta sobre la eficiencia de costes. Disponible hasta el 16 de febrero con un descuento del 50%, Fast Mode utiliza la misma calidad y capacidades del modelo Op

07 Feb 2026

Libro explica RLHF: guía para IA con retroalimentación humana

Nathan Lambert ha publicado un libro introductorio sobre RLHF (Reinforcement Learning from Human Feedback), una técnica crucial para el desarrollo y despliegue de sistemas de aprendizaje automático, especialmente modelos de lenguaje. El libro está dirigido a personas con conocimientos cuantitativos

07 Feb 2026

IA Gemma 3B: Ejecútala en Linux con Ollama

Usuarios de Linux ahora pueden ejecutar el modelo de inteligencia artificial Gemma 3B localmente gracias a la herramienta Ollama. La instalación, descrita como sencilla, permite a los usuarios descargar y probar modelos pre-entrenados sin necesidad de configurar entornos de desarrollo complejos. Oll

04 Feb 2026

Self-Attention at Constant Cost per Token via Symmetry-Aware Taylor Approximation

Un nuevo estudio presenta una técnica para optimizar el mecanismo de autoatención en modelos Transformer, reduciendo significativamente los costos de cómputo y memoria. La investigación, basada en una aproximación de Taylor que considera la simetría de las operaciones, permite calcular la autoatenci