Migrar a modelos de IA abiertos ya apenas tiene coste profesional

Artículo de opinión técnica que reflexiona sobre las ventajas crecientes de adoptar modelos de lenguaje abiertos en el trabajo profesional. El autor, Andrew Marble, traza un paralelismo con la evolución de Linux: así como el sistema operativo open source pasó de ser una apuesta arriesgada a una alte

ChatGPT pierde la mayoría absoluta del mercado de asistentes de IA

ChatGPT ha perdido por primera vez la mayoría absoluta del mercado mundial de asistentes de inteligencia artificial. Según datos de Sensor Tower, su cuota ha caído al 46,4%, frente a registros superiores al 50% que mantenía a comienzos de 2025. El retroceso no responde a una pérdida de usuarios —la

Anthropic rectifica las restricciones ocultas de Claude Fable 5

Anthropic se disculpó por implementar restricciones ocultas en su nuevo modelo Claude Fable 5, diseñadas para impedir la destilación, una técnica que permite entrenar modelos más pequeños a partir de las salidas de uno grande. La medida, que degradaba las respuestas sin avisar, afectaba a investigad

Anatomía de un kernel de paralelismo de expertos de alto rendimiento

Los modelos de lenguaje de gran tamaño (LLM) requieren coordinar muchas GPUs para funcionar. Una de las técnicas clave es el paralelismo de expertos (EP), esencial en los modelos MoE a gran escala. A diferencia de otras formas de paralelismo, cuyas comunicaciones siguen patrones fijos, en EP el rout

La «economía OnlyFans» de la inteligencia artificial estadounidense

Un ensayo de opinión publicado en un blog personal critica con dureza a las principales empresas estadounidenses de inteligencia artificial (IA), a las que acusa de sostener sus elevadas valoraciones financieras mediante una relación «parasocial» con sus clientes, que el autor compara con la economí

DeepSeek vuelve a hacer temblar los cimientos de la IA con V4

DeepSeek ha lanzado dos versiones preliminares de su modelo V4, la evolución del modelo que en 2025 sacudió la industria de la IA. La versión Pro cuenta con 1,6 billones de parámetros, de los que solo 49.000 millones se activan por consulta, gracias a una arquitectura de mezcla de expertos. La varia

DeepSeek V4: rendimiento mixto pero precio competitivo en China

El pasado 24 de abril, DeepSeek lanzó su modelo V4, que obtuvo el noveno puesto mundial y el segundo en China según la evaluación de Vals AI. Aunque algunos desarrolladores expresaron decepción por no superar a modelos como GPT-5.4 o Claude Opus 4.6, las pruebas realizadas en escenarios típicos chin

Hy3 de Tencent lidera OpenRouter superando a Claude

El modelo 'Hy3 preview' de Tencent ha sorprendido al liderar las clasificaciones de modelos de lenguaje (LLM) en OpenRouter, superando a competidores populares como Claude. Este hecho es relevante dado que OpenRouter, como intermediario, publica datos transparentes de uso real, revelando un modelo q

Herramienta de IA genera comandos de terminal con símbolos simples

Un desarrollador ha implementado una herramienta que permite generar comandos de terminal y obtener respuestas mediante inteligencia artificial utilizando símbolos como la coma y el signo de interrogación. Esta integración facilita la creación de comandos shell complejos y la consulta de información

LocalAI y outsourcing superan en costos a las grandes IA

Las grandes empresas de inteligencia artificial (Frontier labs) han incrementado drásticamente los costos de inferencia en los últimos meses. Modelos como GPT-5.5 de OpenAI y Gemini 3.5 de Google han duplicado y triplicado sus tarifas de API, respectivamente, mientras que Anthropic ha aumentado el c

El acceso a la IA más avanzada será controlado por seguridad y escasez

El acceso a la inteligencia artificial de vanguardia se volverá escaso y selectivo. Anthropic presentó en abril Mythos, un modelo de ciberseguridad, disponible únicamente para un grupo reducido de corporaciones estadounidenses. OpenAI también restrictió el acceso con su iniciativa Daybreak. Tres fac

Antirez lanza DwarfStar 4 para ejecutar IA local con DeepSeek v4 Flash

El creador de Redis, Antirez, lanzó DwarfStar 4 (DS4), un proyecto de integración de modelo único para experiencia de IA local que ha alcanzado una popularidad inesperada. DS4 utiliza DeepSeek v4 Flash, un modelo cuasi-fronterizo que funciona con cuantización de 2/8 bits, permitiendo ejecutarlo en s

EE.UU. lidera la carrera de IA gracias al dominio de la nube comercial

Estados Unidos lidera la carrera global de inteligencia artificial donde más importa: la comercialización y la infraestructura en la nube. Desde que DeepSeek R1 sorprendió al mercado en enero de 2025, empresas estadounidenses como OpenAI y Anthropic han acelerado su adopción empresarial, mientrasemp

CrofAI lidera en valor: benchmark compara agentes de codificación

Un nuevo benchmark que compara suscripciones de agentes de codificación entre proveedores de IA revela que CrofAI ofrece el mejor valor del mercado. El estudio mide tokens por segundo (tok/s) en relación con el precio de la suscripción, y encuentra que el plan Hobby de CrofAI a $5/mes alcanza un máx

DeepSeek v4 Flash: Motor de inferencia más rápido y eficiente

Un equipo de ingenieros, liderado por Antirez, ha lanzado DeepSeek v4 Flash, un nuevo motor de inferencia optimizado para el modelo de lenguaje DeepSeek V4 Flash. Este motor, denominado 'ds4.c', está diseñado específicamente para este modelo y no es un framework genérico. La principal ventaja radica

DeepSeek ajusta precios y retira modelos de IA

DeepSeek ha anunciado cambios en los precios de su API y la futura eliminación de algunos modelos. La compañía, especializada en inteligencia artificial, ha ajustado los precios por cada millón de tokens (la unidad básica de texto que procesa el modelo), cobrando por la cantidad total de tokens de e

DeepSeek: alternativa económica a agente de codificación

Un nuevo proyecto llamado 'deepclaude' ofrece una alternativa significativamente más económica a la herramienta de agente autónomo de codificación de Claude Code de Anthropic. Utilizando modelos de DeepSeek V4 Pro, OpenRouter o cualquier backend compatible con Anthropic, 'deepclaude' permite mantene

LamBench: Nuevos LLMs compiten por el liderazgo

Una nueva evaluación comparativa llamada LamBench ha revelado un panorama competitivo entre los modelos de lenguaje grandes (LLMs). La prueba, publicada recientemente, evalúa el rendimiento de estos modelos en tareas de inferencia. El modelo 'gpt-5.4' lidera la clasificación con un 91.7% de precisió

DeepSeek V4: Nuevo modelo de IA de código abierto

DeepSeek AI ha lanzado oficialmente la versión preliminar de DeepSeek V4, una nueva familia de modelos de lenguaje de código abierto que promete eficiencia y rendimiento mejorados. La compañía ha puesto a disposición dos modelos principales: DeepSeek-V4-Pro, con 49 mil millones de parámetros activos

DeepSeek API: Alternativa a OpenAI y Anthropic

DeepSeek ha lanzado una API compatible con OpenAI y Anthropic, permitiendo a los desarrolladores acceder a sus modelos de lenguaje utilizando las mismas herramientas y SDKs que ya emplean para interactuar con OpenAI y Anthropic. La API, disponible en https://api.deepseek.com y https://api.deepseek.c

Thunderbolt: IA de código abierto para empresas

Thunderbolt ha lanzado una plataforma de inteligencia artificial (IA) de código abierto y auto-alojada, diseñada específicamente para empresas. La plataforma, presentada recientemente, permite a las organizaciones mantener el control total sobre sus datos e infraestructura de IA, evitando la depende

IA: la memoria de las conversaciones tiene un costo

La forma en que los modelos de lenguaje grandes (LLM) como ChatGPT gestionan la memoria de las conversaciones, conocida como 'KV cache', tiene un costo físico y económico significativo. Cada interacción, incluso una pregunta sencilla, se traduce en datos almacenados en la memoria de la GPU, con GPT-

Galería online compara arquitecturas de LLM

Un repositorio en línea, alojado en sebastianraschka.com, ha sido creado para rastrear y comparar las arquitecturas de los últimos modelos de lenguaje grandes (LLM). La “Galería de Arquitecturas LLM” recopila diagramas y hojas de datos de modelos como Llama 3 8B, DeepSeek V3, Gemma 3, Qwen3, Mistral

ia: nuevos modelos redefinen el panorama tecnológico

Un panorama de modelos de inteligencia artificial está experimentando cambios significativos, según un reciente análisis de canirun.ai. Empresas como Meta, Alibaba, Microsoft, OpenAI, Google, Mistral AI, DeepSeek y NVIDIA están lanzando nuevas versiones y arquitecturas de modelos, abarcando una ampl