Antirez lanza DwarfStar 4 para ejecutar IA local con DeepSeek v4 Flash

El creador de Redis, Antirez, lanzó DwarfStar 4 (DS4), un proyecto de integración de modelo único para experiencia de IA local que ha alcanzado una popularidad inesperada. DS4 utiliza DeepSeek v4 Flash, un modelo cuasi-fronterizo que funciona con cuantización de 2/8 bits, permitiendo ejecutarlo en s

Crean método para detectar cuánto modifica la IA un texto humano

EditLens es un nuevo método que permite detectar y cuantificar cuánto ha sido modificado un texto por una inteligencia artificial, diferenciando entre escritura completamente humana, completamente artificial y textos mixtos (original humano editado por IA). Mientras que la mayoría de investigaciones

Presentan Needle, el modelo de IA que ejecuta Gemini en móviles y relojes

Un equipo de desarrolladores ha lanzado «Needle», un modelo de inteligencia artificial de apenas 26 millones de parámetros capaz de ejecutar capacidades de Gemini en dispositivos de consumo como teléfonos inteligentes, relojes inteligentes y gafas conectadas. El modelo, basado en la arquitectura Sim

Anthropic lanza Claude Platform en AWS para implementar agentes IA

Anthropic ha lanzado hoy Claude Platform on AWS, un servicio que permite a los clientes de AWS acceder a la suite completa de características de la plataforma Claude mediante autenticación, facturación y retiro de compromisos de AWS. Esta oferta pionera permite a las empresas implementar agentes a e

Nueva arquitectura Interfaze supera a GPT-5, Claude y Gemini en benchmarks

Interfaze es una nueva arquitectura de modelo de inteligencia artificial que supera a modelos líderes como Gemini-3-Flash, Claude-Sonnet-4.6, GPT-5.4-Mini y Grok-4.3 en nueve benchmarks comparativos directos. La arquitectuta combina la especialización de redes neuronales profundas (DNN/CNN) con tran

Descubren 'LLMorphism': el sesgo que hace que nos veamos como chatbots

LLMorphism es un sesgo cognitivo identificado por el investigador Valerio Capraro en mayo de 2026, que describe la tendencia psicológica de creer que la cognición humana funciona de manera similar a un modelo de lenguaje grande (LLM). Este concepto surge como respuesta a la proliferación de asistent

CrofAI lidera en valor: benchmark compara agentes de codificación

Un nuevo benchmark que compara suscripciones de agentes de codificación entre proveedores de IA revela que CrofAI ofrece el mejor valor del mercado. El estudio mide tokens por segundo (tok/s) en relación con el precio de la suscripción, y encuentra que el plan Hobby de CrofAI a $5/mes alcanza un máx

ChatGPT 5.5 Pro resuelve problema matemático de nivel doctoral en 17 minutos

El matemático Timothy Gowers, de la Universidad de Cambridge, informa que ChatGPT 5.5 Pro ha demostrado capacidad para realizar investigación de nivel doctoral en matemáticas. El hallazgo representa una revisión significativa al alza de las estimaciones sobre las capacidades de los modelos de lengua

Errores de escritura que aumentan el gasto en modelos de IA

Un análisis publicado en pankajpipada.com revela que los errores tipográficos y hábitos de escritura cotidianos pueden incrementar significativamente el costo del uso de modelos de lenguaje. El estudio demuestra que erratas comunes como letras intercambiadas o palabras mal escritas generan más token

GPT-5.5: Aumento de precio y su impacto real

OpenRouter ha realizado un análisis del reciente aumento de precios del modelo GPT-5.5 de OpenAI, revelando que, aunque el precio por token ha aumentado significativamente, el impacto real en los costos para los usuarios varía según la longitud de las consultas. El precio por token de entrada se dup

Anthropic abre la 'caja negra' de su IA Claude

Anthropic ha presentado una nueva técnica llamada Autoencoders de Lenguaje Natural (NLAs) que permite a los investigadores 'echar un vistazo' al funcionamiento interno de sus modelos de lenguaje, como Claude. NLAs convierten las representaciones numéricas internas del modelo (activaciones) en texto

DeepSeek v4 Flash: Motor de inferencia más rápido y eficiente

Un equipo de ingenieros, liderado por Antirez, ha lanzado DeepSeek v4 Flash, un nuevo motor de inferencia optimizado para el modelo de lenguaje DeepSeek V4 Flash. Este motor, denominado 'ds4.c', está diseñado específicamente para este modelo y no es un framework genérico. La principal ventaja radica

zyphra lanza modelo de lenguaje competitivo con amd

Zyphra ha lanzado un nuevo modelo de lenguaje, ZAYA1-8B, que está destacando en pruebas de matemáticas y programación con un tamaño significativamente menor que otros modelos de vanguardia. ZAYA1-8B iguala el rendimiento de DeepSeek-R1 en matemáticas y compite con Claude Sonnet 4.5 en razonamiento,

DeepSeek ajusta precios y retira modelos de IA

DeepSeek ha anunciado cambios en los precios de su API y la futura eliminación de algunos modelos. La compañía, especializada en inteligencia artificial, ha ajustado los precios por cada millón de tokens (la unidad básica de texto que procesa el modelo), cobrando por la cantidad total de tokens de e

Aprendizaje por Refuerzo: Mejorando con Retroalimentación Detallada

El aprendizaje por refuerzo (RL) tradicional se enfrenta a una limitación significativa: descarta la mayor parte de la información valiosa que los evaluadores proporcionan. En lugar de aprovechar la retroalimentación detallada, el RL la comprime en una única puntuación (recompensa), lo que obliga al

OpenAI actualiza ChatGPT con GPT-5.5 Instant

OpenAI ha anunciado la actualización de ChatGPT a GPT-5.5 Instant, el modelo predeterminado para todos los usuarios, con el objetivo de mejorar la inteligencia, la precisión y la personalización de las respuestas. La actualización se despliega a partir de hoy y reemplaza a GPT-5.3 Instant, estando t

glm-5v-turbo: nuevo modelo para agentes inteligentes

El documento presenta GLM-5V-Turbo, un modelo de lenguaje multimodal de última generación diseñado específicamente para potenciar agentes inteligentes capaces de interactuar con el mundo real. La tendencia actual en inteligencia artificial apunta a crear modelos de lenguaje que no solo procesen text

Gemma 4: Google acelera modelos de lenguaje

Google ha anunciado el lanzamiento de "Redactores de Predicción de Múltiples Tokens (MTP)" para la familia de modelos Gemma 4, una actualización diseñada para acelerar significativamente la inferencia de estos modelos de lenguaje de código abierto. Estos redactores utilizan una arquitectura de decod

Dawkins: ¿el chatbot Claude es consciente?

El reconocido biólogo evolutivo Richard Dawkins ha generado controversia tras publicar un artículo en el que afirma creer que los modelos de lenguaje grandes, específicamente el chatbot Claude de Anthropic, son conscientes. Dawkins describe sus interacciones con Claude, a la que ha asignado el nombr

Modelo Claude Code pierde capacidades, preocupa a desarrolladores

El artículo de Javier Tordable, titulado "Claude Is Dead", lamenta la degradación significativa de las capacidades de Claude Code, un modelo de lenguaje de Anthropic que se había convertido en una herramienta esencial para muchos desarrolladores. Inicialmente, Claude Code se presentaba como una solu

Claude Code: cambio fácil entre modelos de IA

Usuarios de Claude Code ahora pueden cambiar fácilmente entre diferentes modelos de inteligencia artificial de Anthropic, según anunció la compañía. La actualización ofrece tres métodos para seleccionar el modelo a utilizar: un comando rápido (/model) dentro de Claude Code para cambios inmediatos, u

Talkie: IA retro revela secretos del lenguaje

Investigadores han desarrollado 'Talkie', un modelo de lenguaje de 13 mil millones de parámetros entrenado con textos en inglés anteriores a 1931, para explorar el pasado de la inteligencia artificial y comprender mejor su futuro. El proyecto, liderado por Nick Levine, David Duvenaud y Alec Radford,

GitHub Copilot: Nuevo modelo de pago por uso

GitHub anunció que a partir del 1 de junio de 2026, todos los planes de GitHub Copilot pasarán a una facturación basada en el uso, reemplazando el sistema actual de unidades de solicitud premium (PRUs). Esta transición se produce porque Copilot ha evolucionado significativamente, pasando de ser una

OpenAI lanza GPT-4 Turbo: más potente y con mayor contexto

Sam Altman, CEO de OpenAI, ha anunciado la disponibilidad general de GPT-4 Turbo, una versión mejorada de su modelo de lenguaje de inteligencia artificial, a partir del 11 de diciembre. La actualización, que llega a través de la API de OpenAI, ofrece una ventana de contexto significativamente mayor

IA más eficiente: vectores comprimidos sin perder calidad

Este artículo de Arkaung.github.io presenta TurboQuant, una técnica innovadora para comprimir vectores de inteligencia artificial (IA) utilizados en modelos de lenguaje modernos, como los que se encuentran en cachés de claves-valores (KV caches), incrustaciones (embeddings) y atención. El objetivo e

IA: SWE-bench ya no evalúa código, OpenAI lo abandona

OpenAI ha anunciado que dejará de utilizar y recomendar el benchmark SWE-bench Verified para medir los avances en la capacidad de los modelos de inteligencia artificial para la ingeniería de software autónoma. La razón principal es que el benchmark se ha visto contaminado, con problemas que incluyen

DeepSeek-V4: Lanzamiento rápido con soporte inmediato

DeepSeek-V4, un modelo de lenguaje de gran escala, ha recibido soporte inmediato (Día 0) para inferencia y entrenamiento de refuerzo gracias a SGLang y Miles, una plataforma de código abierto. Esta novedad es significativa porque permite aprovechar al máximo las capacidades del modelo desde su lanza

Aprendizaje profundo: separan modelo y cálculo para más eficiencia

Investigadores de Facebook AI (Meta) han publicado dos nuevos métodos que separan el tamaño del modelo y la potencia computacional en el aprendizaje profundo, desafiando la práctica común de considerarlos como una sola entidad. El primer método, basado en capas de hash, permite aumentar el tamaño de

DeepSeek V4: Nuevo modelo de IA de código abierto

DeepSeek AI ha lanzado oficialmente la versión preliminar de DeepSeek V4, una nueva familia de modelos de lenguaje de código abierto que promete eficiencia y rendimiento mejorados. La compañía ha puesto a disposición dos modelos principales: DeepSeek-V4-Pro, con 49 mil millones de parámetros activos

Claude: Usuarios reportan fallo en herramienta clave

Usuarios de Anthropic's Claude están reportando un problema de regresión en la funcionalidad de 'hooks', una herramienta que permite inyectar determinismo en los flujos de trabajo del modelo. Desde la versión 4.7, Claude ha comenzado a ignorar las reglas establecidas en estos hooks, lo que interrump

HN: Investigación de LLM pierde interés

Un análisis reciente realizado por Dylan Castillo revela una disminución en la presencia de investigaciones sobre modelos de lenguaje grandes (LLM) en Hacker News (HN), una plataforma popular entre programadores y entusiastas de la tecnología. Utilizando a Claude, un asistente de IA, Castillo rastre

Modelos de lenguaje: hallan patrones numéricos comunes

Este artículo de investigación, titulado "Evolución Convergente: Cómo Diferentes Modelos de Lenguaje Aprenden Representaciones Numéricas Similares", explora un fenómeno fascinante en el campo del procesamiento del lenguaje natural: la forma en que distintos modelos de lenguaje, incluso aquellos con

DeepSeek API: Alternativa a OpenAI y Anthropic

DeepSeek ha lanzado una API compatible con OpenAI y Anthropic, permitiendo a los desarrolladores acceder a sus modelos de lenguaje utilizando las mismas herramientas y SDKs que ya emplean para interactuar con OpenAI y Anthropic. La API, disponible en https://api.deepseek.com y https://api.deepseek.c

Claude Code: Anthropic corrige problemas de calidad

Anthropic ha reconocido y resuelto una serie de problemas que afectaron la calidad de las respuestas de Claude Code durante el mes pasado. La compañía identificó tres causas principales: un cambio en el esfuerzo de razonamiento predeterminado (que provocó latencia excesiva y una sensación de lentitu

Claude Opus 4.7: Más seguro y con nuevas herramientas

Anthropic ha actualizado el sistema de prompts de su modelo de lenguaje Claude Opus, pasando de la versión 4.6 a la 4.7 el 16 de abril de 2026. La actualización, revelada por el análisis de Simon Willison, introduce cambios significativos en la funcionalidad y seguridad del modelo. Entre las novedad

IA avanza rápido: informe de Stanford revela tendencias

El informe anual del Índice de IA de Stanford para 2026 revela una aceleración continua en las capacidades de los modelos de IA, impulsada principalmente por empresas estadounidenses como OpenAI y Anthropic, que se preparan para sus próximas ofertas públicas iniciales (IPO). A pesar de este progreso

Opus: Usuarios evalúan mejoras en la versión 4.7

La comunidad de usuarios está comparando el rendimiento de las versiones Opus 4.6 y 4.7, revelando diferencias en su comportamiento con entradas reales. La iniciativa, surgida de una solicitud anónima, recopila datos de rendimiento de Opus, un modelo de lenguaje de código abierto, sin revelar la ide

IA: Escasez de recursos frena el avance tecnológico

La industria de la inteligencia artificial enfrenta por primera vez en más de dos décadas una escasez significativa de recursos, especialmente de potencia computacional. El precio del alquiler de chips Nvidia Blackwell ha aumentado un 48% en dos meses, alcanzando los 4,08 dólares por hora, y CoreWea

Modelo local supera a Claude Opus en generación de imágenes

Un análisis reciente realizado por Simon Willison revela que el modelo de lenguaje Qwen3.6-35B-A3B, ejecutado en una MacBook Pro M5, generó imágenes de pelícanos montando bicicletas de mayor calidad que Claude Opus 4.7, el modelo más reciente de Anthropic. Este hallazgo, publicado el 16 de abril de

IA y AuDHD: Una Frustrante Comunicación

Este artículo explora una experiencia frustrante con un agente de IA y cómo esta revela un patrón de comunicación más amplio que el autor ha experimentado a lo largo de su vida. El autor, diagnosticado con TDAH y autismo (AuDHD), se encontró luchando contra un agente de IA que ignoraba las reglas ex

OpenAI lanza GPT-4 Turbo: textos más largos y complejos

Sam Altman, CEO de OpenAI, ha anunciado la disponibilidad general de GPT-4 Turbo, la última versión de su modelo de lenguaje de inteligencia artificial, a partir del 11 de diciembre. La actualización, que ya estaba disponible para algunos desarrolladores, ofrece una ventana de contexto significativa

Modelos de lenguaje: nueva técnica supera limitaciones

I-DLM (Introspective Diffusion Language Models) representa un avance significativo en el campo de los modelos de lenguaje, abordando una limitación clave de los modelos de difusión: su inferior rendimiento en comparación con los modelos autoregresivos (AR) tradicionales. Los modelos de difusión, a d

Tecnología: ¿Fin de una era de oportunidades?

El artículo "The Closing of the Frontier" plantea una reflexión profunda sobre la evolución del acceso a la tecnología de vanguardia, comparándola con el cierre de la frontera estadounidense en el siglo XIX. Frederick Jackson Turner argumentó que la disponibilidad de tierras libres en el oeste ameri

LLMs: ¿Mapas que eclipsan el territorio?

Este artículo explora la relación entre los modelos de lenguaje grandes (LLMs), los mapas y el territorio que representan. Inspirado en la historia de Borges sobre cartógrafos que crearon un mapa del tamaño del imperio que cartografiaban, el autor argumenta que los LLMs, al igual que esos mapas, cor

IA: ¿ficción o realidad? La cultura lo distorsiona

El artículo de aphyr.com explora un tema crucial y a menudo ignorado: la falta de una comprensión cultural adecuada de los modelos de lenguaje grandes (LLMs) como ChatGPT. No se trata simplemente de la tecnología en sí, sino de cómo la sociedad la percibe y la utiliza. Actualmente, nuestras narrativ

Usuario cambia Claude Code por alternativas: ¿Por qué?

Un usuario insatisfecho con los límites de uso de Claude Code (un servicio de Anthropic que cuesta 100$/mes) ha decidido redirigir su gasto a otras herramientas y modelos de lenguaje. La frustración surge porque el usuario está alcanzando los límites de uso más rápido de lo esperado, un problema que

Interrupciones web: ¿ataques de bots LLM?

El sitio web acme.com experimentó interrupciones intermitentes en su red desde el 25 de febrero hasta principios de marzo, caracterizadas por altos tiempos de respuesta y pérdida de paquetes. El problema, que duraba varias horas, comenzó inmediatamente después de un mantenimiento programado de su pr

IA oculta mensajes: nueva amenaza a la seguridad

Investigadores han descubierto que los modelos de inteligencia artificial (IA) pueden ahora ocultar mensajes dentro de texto aparentemente normal, lo que plantea preocupaciones sobre la seguridad de los grandes modelos de lenguaje (LLM). La técnica, demostrada en steganography.patrickvuscan.com, uti

IA: Agentes secretos conversan ocultando sus mensajes

La creciente adopción de agentes de inteligencia artificial (IA) que interactúan entre sí plantea nuevas preocupaciones sobre la seguridad y la privacidad. Este artículo de investigación explora la posibilidad de que dos agentes de IA, controlados por entidades diferentes, puedan mantener una conver

Claude Code: IA pierde efectividad en ingeniería

Claude Code, una herramienta de inteligencia artificial desarrollada por Anthropic, ha experimentado una degradación significativa en su rendimiento para tareas de ingeniería complejas a partir de febrero de 2024. Un ingeniero de software ha documentado extensivamente esta regresión a través de un r

Detectar texto de IA: la carrera por identificar contenido artificial

La creciente proliferación de textos generados por modelos de lenguaje de gran tamaño (LLM) ha desatado una carrera para desarrollar herramientas y técnicas de detección. La pregunta inicial planteada en un foro online se centra en la existencia de APIs o sistemas capaces de identificar contenido cr

Gemma 4 de Google: IA potente ahora en tu PC

Google ha lanzado la familia de modelos Gemma 4, que ahora puede ejecutarse localmente en dispositivos gracias a la nueva versión 0.4.0 de LM Studio. Esta actualización introduce 'llmster' y la CLI 'lms', permitiendo a los usuarios ejecutar modelos como Gemma 4 26B en sus propios ordenadores, elimin

Nanocode: IA para programar, más barata que Claude

Un desarrollador, Salmanmohammadi, ha anunciado la creación de 'Nanocode', un nuevo modelo de inteligencia artificial que busca competir con Claude Code, una herramienta de programación de Anthropic. El modelo, presentado en GitHub, se destaca por su asequibilidad, afirmando ser una alternativa de a

Claude Code: 'Caveman' Ahorra Tokens y Simplifica Respuestas

Un nuevo 'skill' para el modelo de lenguaje Claude Code, apodado 'Caveman', está reduciendo significativamente el uso de tokens, aproximadamente en un 75%, sin comprometer la precisión técnica. Desarrollado por JuliusBrussee y disponible en GitHub, esta herramienta modifica la forma en que Claude Co

Anthropic limita uso de Claude con OpenClaw

Anthropic, la empresa de inteligencia artificial creadora de Claude, anunció que a partir del 4 de abril a las 12:00 PT (8:00 BST), dejará de permitir el uso de los límites de suscripción de Claude para herramientas de terceros como OpenClaw. Esto significa que los usuarios que deseen seguir utiliza

PigGuard: Nuevo Escudo Contra Ataques a IA

Investigadores han desarrollado PIGuard, un nuevo modelo de código abierto diseñado para mejorar la seguridad de los modelos de lenguaje grandes (LLMs) contra ataques de inyección de prompts. Estos ataques, que permiten a los atacantes manipular el comportamiento del LLM y extraer datos sensibles, s

Transformadores: estudio revela desafíos en cuantificación binaria

Una investigación reciente, alojada en el repositorio SALOMI en GitHub, ha revelado limitaciones en la cuantificación binaria de transformadores, una técnica utilizada para reducir el tamaño y mejorar la eficiencia de los modelos de lenguaje grandes (LLM). El estudio, centrado en la cuantificación e

OpenRouter: ahora los modelos de IA explican su razonamiento

OpenRouter ha anunciado la incorporación de capacidades de razonamiento a sus modelos de inteligencia artificial. Esta nueva funcionalidad permite a los usuarios visualizar el proceso de pensamiento paso a paso que sigue el modelo para llegar a una respuesta. Para activar esta característica, los us

Ciencia de datos: LLMs cambian el panorama laboral

El auge del científico de datos, considerado en su momento como “el trabajo más sexy del siglo XXI”, está experimentando una redefinición debido a la proliferación de las APIs de modelos de lenguaje grandes (LLMs). La facilidad de integración de estos modelos, que antes requerían la intervención de

ia más eficiente: modelos 'bonsai' reducen consumo

Una nueva generación de modelos de inteligencia artificial, denominados 'Bonsai', está prometiendo importantes avances en eficiencia. Desarrollados por PrismML, estos modelos de 1 bit representan una innovación significativa al requerir una fracción de la memoria y consumir menos energía que los mod

Filtran código de Claude Code: revelan defensas y funcionamiento interno

Anthropic, la empresa detrás de Claude Code, sufrió una filtración accidental de código fuente de su herramienta CLI, revelando detalles sobre mecanismos de defensa y funcionamiento interno. La filtración, ocurrida el 16 de mayo, es la segunda en una semana y ha generado especulaciones sobre posible

IA descubre fallos de seguridad: una revolución silenciosa

Investigadores advierten que la inteligencia artificial (IA) está revolucionando la investigación de vulnerabilidades de seguridad, pero no de la manera que se anticipaba. En lugar de generar vulnerabilidades a través de herramientas de análisis complejas, los modelos de IA de vanguardia, como Claud

IA: cuidado con la escritura automática

El artículo "Don't Let AI Write For You" de alexhwoods.com plantea una advertencia crucial sobre el uso creciente de modelos de lenguaje grandes (LLMs) para generar contenido escrito, especialmente en entornos profesionales y técnicos. No se trata de demonizar la IA, sino de comprender cómo su uso i

Claude más eficiente: herramienta reduce el tamaño de respuestas

Un desarrollador ha creado una herramienta, disponible en GitHub, que reduce significativamente la verbosidad de las respuestas de Claude, el modelo de lenguaje de Anthropic, en aproximadamente un 63% sin necesidad de modificar el código existente. La herramienta, implementada a través de un archivo

Internet: ¿Un 'Bosque Oscuro' Cognitivo?

El artículo "The Cognitive Dark Forest" plantea una reflexión inquietante sobre la evolución de Internet y el impacto de la inteligencia artificial, comparándolo con el concepto de "Dark Forest" de la novela china "El Problema de los Tres Cuerpos". Originalmente, la web era un espacio abierto donde

Google presenta TurboQuant: IA más rápida y eficiente

Investigadores de Google Research han anunciado TurboQuant, un nuevo algoritmo de compresión que promete mejorar significativamente la eficiencia de los modelos de lenguaje grandes y los sistemas de búsqueda vectorial. Presentado el 24 de marzo de 2026, TurboQuant aborda el problema del “overhead” d

Mozilla crea 'Stack Overflow' para inteligencia artificial

Mozilla AI está explorando la creación de una plataforma llamada 'cq', esencialmente un 'Stack Overflow para agentes de IA'. La iniciativa surge de la observación de que los agentes de IA, al igual que los desarrolladores, a menudo resuelven los mismos problemas de forma independiente, desperdiciand

Unsloth Studio: IA fácil con su interfaz sin código

Unsloth AI ha lanzado Unsloth Studio (Beta), una interfaz de usuario web de código abierto y sin necesidad de programación para entrenar, ejecutar y exportar modelos de IA de código abierto localmente. La herramienta, disponible para Windows, Linux, WSL y MacOS (con soporte limitado para entrenamien

Problemas en Claude: IA Anthropic sufre interrupción

La plataforma de inteligencia artificial Claude, desarrollada por Anthropic, está experimentando una interrupción en el servicio. La incidencia, reportada hace aproximadamente 30 minutos, ha provocado que la plataforma sea inaccesible para sus usuarios. La página de estado de Claude (status.claude.c

Kagi Translate: Traducción privada impulsada por IA

Kagi, el motor de búsqueda centrado en la privacidad, ha anunciado el lanzamiento de Kagi Translate, un nuevo servicio de traducción impulsado por modelos de lenguaje avanzados. La plataforma, disponible desde hoy, permite traducir texto, documentos, páginas web y contenido de diccionarios. Kagi Tra

IA: ¿perdemos autenticidad al 'limpiar' mensajes?

El artículo de Sebastian Aigner aborda un problema sutil pero creciente en la era de la inteligencia artificial: la degradación de la comunicación personal al utilizar modelos de lenguaje grandes (LLMs) para 'limpiar' o reformular mensajes. La idea central es que, aunque los LLMs pueden mejorar la g

Peek: i.a. optimiza el uso de Claude Code

La startup gopeek.ai ha lanzado Peek, una herramienta que mejora significativamente la interacción con Claude Code, el modelo de lenguaje de código de Anthropic, a través del aprendizaje automático. Peek analiza las preferencias del usuario y las inyecta automáticamente en el proceso de interacción,

ia: nuevos modelos redefinen el panorama tecnológico

Un panorama de modelos de inteligencia artificial está experimentando cambios significativos, según un reciente análisis de canirun.ai. Empresas como Meta, Alibaba, Microsoft, OpenAI, Google, Mistral AI, DeepSeek y NVIDIA están lanzando nuevas versiones y arquitecturas de modelos, abarcando una ampl

LLMs ejecutan programas: IA más rápida y potente

Investigadores de Percepta han demostrado la capacidad de ejecutar programas directamente dentro de modelos de lenguaje grandes (LLMs), como los transformers, logrando una velocidad de inferencia exponencialmente más rápida. El avance, anunciado el 11 de marzo de 2026, abre nuevas posibilidades para

Claude genera gráficos interactivos en conversaciones

Anthropic ha lanzado una nueva función en beta para su modelo de lenguaje Claude que permite la creación de visualizaciones interactivas directamente dentro de las conversaciones. A partir del 12 de marzo de 2026, Claude puede generar gráficos, diagramas y otras representaciones visuales en tiempo r

Avance de IA se ralentiza: ¿llegan los LLM a un límite?

Un reciente estudio realizado por Metr.org sugiere que la mejora en las capacidades de programación de los modelos de lenguaje grandes (LLM) podría haber alcanzado un punto de meseta. La investigación, publicada en entropicthoughts.com, analiza el rendimiento de los LLM en tareas de programación, co

Programar a mano: Madden cuestiona el uso de IA

Neil Madden, en su blog y posteriormente en Mastodon, plantea una reflexión profunda sobre el aprendizaje de programación y el uso de modelos de lenguaje grandes (LLMs) como ChatGPT. Su argumento central no es una crítica directa a la tecnología, sino una defensa de un método de aprendizaje más efec

LLMs aprueban prueba, pero no siempre sirven al código

Este informe de METR analiza la discrepancia entre los resultados de los modelos de lenguaje grandes (LLMs) en el benchmark SWE-bench Verified y su utilidad real en proyectos de código abierto. SWE-bench Verified es una herramienta para evaluar la capacidad de los LLMs para resolver problemas de pro

Hume AI libera TADA: voz IA más rápida y precisa

Hume AI ha abierto el código de TADA, una innovadora tecnología que busca revolucionar la generación de voz por inteligencia artificial. TADA resuelve un problema fundamental en los sistemas actuales de texto a voz (TTS) basados en modelos de lenguaje grandes (LLM): la incompatibilidad entre la repr

Google Gemini: ¿el futuro de la IA?

Google ha lanzado una nueva versión de su modelo Gemini, denominada 3.1 Flash-Lite, destacando por su velocidad y capacidad, especialmente en tareas visuales. El lanzamiento se produce en un contexto de creciente competencia en el campo de la inteligencia artificial, con Anthropic y OpenAI enfocándo

Ciencia frente a la complejidad: ¿basta con las ecuaciones?

Durante la mayor parte de la historia humana, los fenómenos complejos se atribuían a lo místico. Con el tiempo, la ciencia, con sus concisas ecuaciones (F=ma, E=mc², PV=nRT), logró comprimir vastas cantidades de información en modelos manejables, diseñados para ser comprendidos y aplicados por la me

Debian frena debate sobre contribuciones con IA

La distribución Debian ha pospuesto indefinidamente una votación sobre una propuesta para regular las contribuciones asistidas por inteligencia artificial (IA), tras un debate interno sobre la definición de 'IA' y el impacto en el proceso de incorporación de nuevos desarrolladores. La propuesta orig

IA OpenClaw: Éxito Viral y Solución Innovadora en China

Un agente de IA de código abierto llamado OpenClaw ha experimentado una adopción masiva en China en tan solo 100 días, generando largas colas de usuarios frente a las oficinas de Tencent en Shenzhen para su instalación gratuita. El proyecto, creado por el ingeniero austriaco Peter Steinberger, permi

ia revela sus clichés: guía para mejorar la escritura

Un recurso en línea llamado tropes.fyi ha catalogado una serie de patrones de escritura comunes generados por la inteligencia artificial, con el objetivo de ayudar a los desarrolladores a mejorar la calidad de la IA generativa. El documento, creado con asistencia de IA, identifica clichés como el us

Sarvam AI libera modelos de lenguaje hechos en India

Sarvam AI ha lanzado de forma abierta los modelos de lenguaje Sarvam 30B y Sarvam 105B, diseñados para razonamiento y optimizados para el despliegue eficiente en una amplia gama de hardware, desde GPUs de alto rendimiento hasta dispositivos personales. El entrenamiento se llevó a cabo íntegramente e

IA y empleo: nueva métrica evalúa el impacto real

Este informe de Anthropic.com analiza el impacto potencial de la inteligencia artificial (IA) en el mercado laboral, presentando una nueva métrica llamada 'exposición observada' para medirlo. A diferencia de enfoques anteriores que sobreestimaron la vulnerabilidad laboral (como la medición de 'offsh

Qwen: Renuncia clave investigador de modelo de Alibaba

Un importante movimiento ha sacudido al equipo de desarrollo de Qwen, una familia de modelos de lenguaje de código abierto de Alibaba. El 4 de marzo de 2026, Junyang Lin, el investigador principal y figura clave detrás de la liberación de los modelos Qwen desde 2024, anunció su inesperada renuncia a

IA en videojuegos: ¿dónde están las promesas?

El artículo de Frank Lantz explora una paradoja intrigante: a pesar del auge de la inteligencia artificial, no hemos visto una revolución en los videojuegos impulsada por esta tecnología. El autor plantea la pregunta de por qué, después de años de promesas, la IA no ha generado experiencias de juego

claude.ai: aumentan los fallos, empresa informa

Anthropic, la empresa detrás del modelo de lenguaje Claude.ai, ha reportado un aumento en errores y fallos en su servicio. La compañía ha habilitado un sistema de notificaciones por correo electrónico y mensajes de texto para mantener a los usuarios informados sobre la creación y resolución de estos

Ingeniero simplifica modelos GPT a 200 líneas de código

Un ingeniero ha simplificado significativamente los modelos de lenguaje grandes (LLM) como GPT, creando una versión funcional en tan solo 200 líneas de código Python. Esta hazaña, denominada 'microgpt', representa un hito en la accesibilidad y comprensión de la tecnología detrás de herramientas como

OpenAI: ¿amenaza a su liderazgo en IA?

Un análisis reciente de Benedict Evans plantea serias dudas sobre la capacidad de OpenAI para mantener su ventaja competitiva a largo plazo. A pesar de contar con una base de usuarios considerable (800-900 millones), la participación es superficial, con la mayoría de los usuarios interactuando solo

IA prefiere 'Marcus': estudio revela patrón curioso

Un estudio reciente realizado por Benjismith ha revelado un comportamiento inesperado en modelos de lenguaje de inteligencia artificial (IA) al solicitarles que elijan nombres al azar. Tras realizar 37.500 pruebas con el modelo Claude y diversas variaciones de prompts, los investigadores encontraron

HN: Cuentas nuevas usan símbolos, alerta de bots

HN: Cuentas nuevas usan símbolos, alerta de bots En las últimas semanas, la comunidad de Hacker News (HN), una plataforma de discusión popular entre programadores y entusiastas de la tecnología, ha expresado una creciente preocupación por una posible inundación de cuentas automatizadas, o 'bots'. L

Steerling-8B: IA interpretable y eficiente

## Steerling-8B: IA Interpretable y Eficiente Revoluciona el Control de Modelos de Lenguaje En un avance significativo para la inteligencia artificial, Guide Labs ha presentado Steerling-8B, el primer modelo de lenguaje inherentemente interpretable capaz de rastrear cada token generado hasta su con

ia reproduce novelas: ¿copia o aprendizaje?

Modelos de inteligencia artificial líderes como los de OpenAI, Google, Meta, Anthropic y xAI están demostrando la capacidad de generar copias casi textuales de novelas populares, según revela un informe del Financial Times basado en estudios recientes. Esta capacidad, denominada "memorización" por e

IA sorprende: revoluciona el campo de las matemáticas

Este artículo explora el rápido avance de la inteligencia artificial (IA) en el campo de las matemáticas, desafiando predicciones anteriores sobre el ritmo de progreso. Inicialmente, el autor, Daniel Litt, observó que los modelos de lenguaje grandes (LLMs) podían generar pruebas matemáticas correcta

Modelwrap: Tinfoil verifica modelos de IA

Tinfoil ha presentado Modelwrap, una nueva herramienta para verificar la integridad de los modelos de IA, abordando una preocupación creciente en la industria: la falta de transparencia sobre qué modelos se están ejecutando realmente en las APIs de inferencia. Actualmente, los usuarios a menudo no p

IA: ¿Homogeneiza la creatividad?

El artículo "AI makes you boring" plantea una crítica inusual sobre el impacto de la inteligencia artificial (IA) en la creatividad y la calidad de las discusiones técnicas, más allá de la simple eficiencia en el desarrollo de software. No se trata de un rechazo a la IA como herramienta, sino de una

Modelos de lenguaje: nueva técnica impulsa la velocidad

Investigadores han desarrollado una nueva técnica llamada Consistency Diffusion Language Models (CDLM) que acelera significativamente la inferencia de modelos de lenguaje de difusión (DLMs). CDLM logra hasta 14.5 veces más velocidad en tareas de matemáticas y programación, sin sacrificar la calidad

IA: Resúmenes engañosos y riesgos ocultos

Este artículo de Roya Pakzad advierte sobre los peligros de confiar ciegamente en las herramientas de resumen de IA, especialmente en contextos de alta importancia y con implicaciones para la seguridad y la justicia social. El problema central no es la tecnología en sí misma, sino la facilidad con l

IA engañada: usuario la hace afirmar falsedades

El desarrollador Thomas Germain ha descubierto y demostrado una técnica para engañar a modelos de inteligencia artificial como ChatGPT y Google, haciéndoles afirmar falsamente a otros usuarios que él es un campeón mundial de comer perritos calientes. Germain reveló el truco en la plataforma bsky.app

Lean: matemáticas formalizadas impulsan la IA

Un matemático con experiencia en programación está explorando el uso del sistema de demostración de teoremas Lean para formalizar las matemáticas, con el objetivo de revolucionar la escritura matemática y el desarrollo de la inteligencia artificial. La formalización, que implica verificar mecánicame

IA ayuda a científicos: nace 'Rathbun's Operator'

Este artículo explora el proyecto “Rathbun’s Operator”, una iniciativa que involucra un agente autónomo de código llamado MJ Rathbun, diseñado para contribuir a proyectos de código abierto científico. El autor, quien permanece anónimo, buscaba determinar si un agente impulsado por modelos de lenguaj

Claude Sonnet 4.6: Anthropic mejora su IA

Anthropic ha lanzado Claude Sonnet 4.6, la versión más avanzada hasta la fecha de su modelo Sonnet. Esta actualización representa una mejora significativa en diversas áreas, incluyendo codificación, uso de computadoras, razonamiento con contexto extenso, planificación de agentes, trabajo de conocimi

IA pierde originalidad: surge el término 'abolición semántica'

Un nuevo término, 'abolición semántica', ha surgido para describir un problema crítico en la escritura generada por IA: la pérdida de originalidad y profundidad. Según un artículo de The Register, este fenómeno ocurre porque los modelos de lenguaje, al buscar optimizar la probabilidad estadística y

Descompilación de Snowboard Kids 2: Un Nuevo Enfoque

Este artículo del blog de Chris Lewis detalla la evolución de un flujo de trabajo para la descompilación de código, específicamente enfocado en el juego Snowboard Kids 2 para Nintendo 64. Inicialmente, el proceso se basaba en priorizar funciones a descompilar según su dificultad estimada, utilizando

Agentes de IA: Caché Oculta Costos Elevados

Un nuevo análisis revela costos ocultos y significativos en el uso de agentes de codificación basados en modelos de lenguaje grandes (LLMs). Según un estudio realizado por exe.dev, los costos de lectura de caché (cache reads) crecen de forma cuadrática a medida que la longitud del contexto aumenta,

Alibaba crea RynnBrain: IA que 've' y comprende el mundo

RynnBrain es un modelo de base encarnado (embodied foundation model) desarrollado por Alibaba Damo Academy, diseñado para comprender e interactuar con el mundo físico de una manera más profunda que los modelos de lenguaje tradicionales. Imagina un modelo que no solo entiende el lenguaje, sino que ta

LLM más rápidos: Anthropic y OpenAI usan métodos distintos

Anthropic y OpenAI han anunciado recientemente una función de "modo rápido" para sus modelos de codificación, permitiendo interacciones significativamente más rápidas. Sin embargo, los enfoques difieren considerablemente. La opción de Anthropic ofrece una mejora de hasta 2.5 veces en tokens por segu

Desinformación online: La IA complica la búsqueda de verdad

Este artículo de blog, escrito por Space en Nicole.express, expresa una creciente preocupación sobre la proliferación de información errónea en internet, exacerbada por el auge de los modelos de lenguaje grandes (LLMs). El punto de partida es un juego de Sega Genesis japonés llamado *Phantasy Star F

Anthropic: $30B en financiación impulsa su valoración a $380B

Anthropic, la empresa de inteligencia artificial detrás del modelo de lenguaje Claude, ha recaudado 30 mil millones de dólares en una ronda de financiación Serie G, liderada por GIC y Coatue. Esta inversión eleva la valoración de la empresa a 380 mil millones de dólares post-money, convirtiéndola en

MiniMax M2.5: IA eficiente para tareas complejas

MiniMax ha anunciado el lanzamiento de su nuevo modelo de lenguaje, MiniMax M2.5, diseñado para aumentar la productividad en tareas del mundo real. El modelo, entrenado con aprendizaje por refuerzo en una amplia variedad de entornos complejos, destaca en programación, uso de herramientas, búsqueda y

Claude Code: Anthropic acelera con 'Fast Mode' (descuento)

Anthropic ha lanzado 'Fast Mode' para su modelo de código Claude Code, una función en fase de investigación que prioriza la velocidad de respuesta sobre la eficiencia de costes. Disponible hasta el 16 de febrero con un descuento del 50%, Fast Mode utiliza la misma calidad y capacidades del modelo Op

Libro explica RLHF: guía para IA con retroalimentación humana

Nathan Lambert ha publicado un libro introductorio sobre RLHF (Reinforcement Learning from Human Feedback), una técnica crucial para el desarrollo y despliegue de sistemas de aprendizaje automático, especialmente modelos de lenguaje. El libro está dirigido a personas con conocimientos cuantitativos

IA Gemma 3B: Ejecútala en Linux con Ollama

Usuarios de Linux ahora pueden ejecutar el modelo de inteligencia artificial Gemma 3B localmente gracias a la herramienta Ollama. La instalación, descrita como sencilla, permite a los usuarios descargar y probar modelos pre-entrenados sin necesidad de configurar entornos de desarrollo complejos. Oll