deepseek - ojeo.com

21 Jun 2026

Migrar a modelos de IA abiertos ya apenas tiene coste profesional

Artículo de opinión técnica que reflexiona sobre las ventajas crecientes de adoptar modelos de lenguaje abiertos en el trabajo profesional. El autor, Andrew Marble, traza un paralelismo con la evolución de Linux: así como el sistema operativo open source pasó de ser una apuesta arriesgada a una alte

22 Jun 2026

Nadella advierte contra la concentración de poder en la IA y explora un acuerdo con DeepSeek

El consejero delegado de Microsoft, Satya Nadella, ha advertido en una entrevista con The Wall Street Journal que la sociedad no tolerará que un pequeño grupo de empresas controle la economía de la inteligencia artificial. Sus declaraciones contrastan con los discursos apocalípticos que otros ejecut

19 Jun 2026

UCCL-EP: un núcleo de comunicación experto paralelo independiente de la controladora de red

UCCL-EP es un proyecto de software descrito en un artículo reciente y abordado en una entrada de blog de Doubleword que busca reproducir las primitivas de comunicación experto-paralelo (EP) de la biblioteca DeepEP de DeepSeek, originalmente diseñadas para hardware de NVIDIA, sobre cualquier combinac

17 Jun 2026

ChatGPT pierde la mayoría absoluta del mercado de asistentes de IA

ChatGPT ha perdido por primera vez la mayoría absoluta del mercado mundial de asistentes de inteligencia artificial. Según datos de Sensor Tower, su cuota ha caído al 46,4%, frente a registros superiores al 50% que mantenía a comienzos de 2025. El retroceso no responde a una pérdida de usuarios —la

15 Jun 2026

Meta invirtió más de 14.000 millones de dólares en IA, pero aún no logra liderar la conversación

En junio de 2025, Meta cerró la compra del 49% de Scale AI por 14.300 millones de dólares, en una operación que valoraba a la startup en 29.000 millones. La apuesta incluía la incorporación de su fundador, Alexandr Wang, para liderar los proyectos de superinteligencia desde Meta Superintelligence La

15 Jun 2026

Lanzan stdx, una biblioteca estándar ampliada para Rust con el apoyo de modelos de IA

El desarrollador de software Pierre (pingoo.io) ha presentado stdx, una biblioteca extendida para el lenguaje de programación Rust que busca compensar las carencias de la biblioteca estándar oficial, descrita como «anémica». El proyecto, disponible en GitHub y Codeberg, reúne en un solo paquete, sin

15 Jun 2026

Desarrolladores debaten si los modelos locales pueden sustituir a Claude y GPT en programación diaria

Un hilo de discusión en Hacker News reaviva el debate sobre si los modelos de lenguaje locales ya están listos para reemplazar a asistentes comerciales como Claude o GPT como herramienta principal de programación. Varios usuarios comparten sus configuraciones y resultados, con conclusiones dispares.

15 Jun 2026

Ingeniería de prompts con brevedad: cómo sacar rendimiento de los modelos económicos

Los desarrolladores, estudiantes y pequeñas empresas que trabajan con presupuestos ajustados ya no tienen por qué resignarse a los modelos de IA más costosos. La diferencia de capacidad entre los modelos de gama alta (Claude Sonnet, GPT-4o, Gemini 1.5 Pro, con precios de 5 a 75 dólares por millón de

15 Jun 2026

China plantea transferir a humanos los chats de IA cuando los usuarios expresen ideas suicidas

La Administración del Ciberespacio de China (CAC) ha publicado un borrador de normas que obligaría a los proveedores de chatbots de inteligencia artificial a derivar a una persona la conversación cuando un usuario plantee ideas de suicidio o autolesión, y a contactar de inmediato con un tutor o resp

13 Jun 2026

Z.ai lanza GLM-5.2 con ventana de un millón de tokens y licencia MIT la próxima semana

Z.ai, la división de modelos de inteligencia artificial de la china Zhipu, lanzará la próxima semana GLM-5.2, su nuevo modelo de código abierto que se posiciona como el líder entre los modelos de pesos abiertos en el Artificial Analysis Intelligence Index v4.1. El anuncio llega en un contexto de cre

11 Jun 2026

Anthropic rectifica las restricciones ocultas de Claude Fable 5

Anthropic se disculpó por implementar restricciones ocultas en su nuevo modelo Claude Fable 5, diseñadas para impedir la destilación, una técnica que permite entrenar modelos más pequeños a partir de las salidas de uno grande. La medida, que degradaba las respuestas sin avisar, afectaba a investigad

11 Jun 2026

Notas desde la sede de DeepSeek: 300 empleados, sin rótulo en la fachada y seis meses por detrás de EE. UU.

Un visitante que recorrió la sede de DeepSeek en Hangzhou describe una compañía deliberadamente discreta: opera en un edificio de 12 plantas sin logotipo visible desde la calle y mantiene una plantilla de unas 300 personas, un orden de magnitud inferior a la de Anthropic, sin intención de crecer a c

10 Jun 2026

Anatomía de un kernel de paralelismo de expertos de alto rendimiento

Los modelos de lenguaje de gran tamaño (LLM) requieren coordinar muchas GPUs para funcionar. Una de las técnicas clave es el paralelismo de expertos (EP), esencial en los modelos MoE a gran escala. A diferencia de otras formas de paralelismo, cuyas comunicaciones siguen patrones fijos, en EP el rout

07 Jun 2026

La «economía OnlyFans» de la inteligencia artificial estadounidense

Un ensayo de opinión publicado en un blog personal critica con dureza a las principales empresas estadounidenses de inteligencia artificial (IA), a las que acusa de sostener sus elevadas valoraciones financieras mediante una relación «parasocial» con sus clientes, que el autor compara con la economí

01 Jun 2026

DeepSeek vuelve a hacer temblar los cimientos de la IA con V4

DeepSeek ha lanzado dos versiones preliminares de su modelo V4, la evolución del modelo que en 2025 sacudió la industria de la IA. La versión Pro cuenta con 1,6 billones de parámetros, de los que solo 49.000 millones se activan por consulta, gracias a una arquitectura de mezcla de expertos. La varia

01 Jun 2026

DeepSeek V4: rendimiento mixto pero precio competitivo en China

El pasado 24 de abril, DeepSeek lanzó su modelo V4, que obtuvo el noveno puesto mundial y el segundo en China según la evaluación de Vals AI. Aunque algunos desarrolladores expresaron decepción por no superar a modelos como GPT-5.4 o Claude Opus 4.6, las pruebas realizadas en escenarios típicos chin

29 May 2026

Hy3 de Tencent lidera OpenRouter superando a Claude

El modelo 'Hy3 preview' de Tencent ha sorprendido al liderar las clasificaciones de modelos de lenguaje (LLM) en OpenRouter, superando a competidores populares como Claude. Este hecho es relevante dado que OpenRouter, como intermediario, publica datos transparentes de uso real, revelando un modelo q

27 May 2026

Herramienta de IA genera comandos de terminal con símbolos simples

Un desarrollador ha implementado una herramienta que permite generar comandos de terminal y obtener respuestas mediante inteligencia artificial utilizando símbolos como la coma y el signo de interrogación. Esta integración facilita la creación de comandos shell complejos y la consulta de información

26 May 2026

LocalAI y outsourcing superan en costos a las grandes IA

Las grandes empresas de inteligencia artificial (Frontier labs) han incrementado drásticamente los costos de inferencia en los últimos meses. Modelos como GPT-5.5 de OpenAI y Gemini 3.5 de Google han duplicado y triplicado sus tarifas de API, respectivamente, mientras que Anthropic ha aumentado el c

21 May 2026

Nueva CLI traduce descripciones en lenguaje natural a proyectos de software completos

Cynchro Labs ha lanzado DeepSeek Builder, una herramienta de línea de comandos (CLI) que automatiza la creación completa de proyectos de software utilizando la inteligencia artificial de DeepSeek. El usuario simplemente describe el proyecto en lenguaje natural y la herramienta genera automáticamente

16 May 2026

Nuevo modelo open source permite controlar respuestas de IA sin cambiar prompts

DeepSeek-V4-Flash es un modelo de lenguaje de código abierto que permite por primera vez aplicar técnicas de steering (direccionamiento) de forma práctica para muchos ingenieros. El steering consiste en manipular directamente las activaciones internas del modelo durante la inferencia para guiar sus

15 May 2026

El acceso a la IA más avanzada será controlado por seguridad y escasez

El acceso a la inteligencia artificial de vanguardia se volverá escaso y selectivo. Anthropic presentó en abril Mythos, un modelo de ciberseguridad, disponible únicamente para un grupo reducido de corporaciones estadounidenses. OpenAI también restrictió el acceso con su iniciativa Daybreak. Tres fac

14 May 2026

Antirez lanza DwarfStar 4 para ejecutar IA local con DeepSeek v4 Flash

El creador de Redis, Antirez, lanzó DwarfStar 4 (DS4), un proyecto de integración de modelo único para experiencia de IA local que ha alcanzado una popularidad inesperada. DS4 utiliza DeepSeek v4 Flash, un modelo cuasi-fronterizo que funciona con cuantización de 2/8 bits, permitiendo ejecutarlo en s

13 May 2026

EE.UU. lidera la carrera de IA gracias al dominio de la nube comercial

Estados Unidos lidera la carrera global de inteligencia artificial donde más importa: la comercialización y la infraestructura en la nube. Desde que DeepSeek R1 sorprendió al mercado en enero de 2025, empresas estadounidenses como OpenAI y Anthropic han acelerado su adopción empresarial, mientrasemp

09 May 2026

CrofAI lidera en valor: benchmark compara agentes de codificación

Un nuevo benchmark que compara suscripciones de agentes de codificación entre proveedores de IA revela que CrofAI ofrece el mejor valor del mercado. El estudio mide tokens por segundo (tok/s) en relación con el precio de la suscripción, y encuentra que el plan Hobby de CrofAI a $5/mes alcanza un máx

07 May 2026

DeepSeek v4 Flash: Motor de inferencia más rápido y eficiente

Un equipo de ingenieros, liderado por Antirez, ha lanzado DeepSeek v4 Flash, un nuevo motor de inferencia optimizado para el modelo de lenguaje DeepSeek V4 Flash. Este motor, denominado 'ds4.c', está diseñado específicamente para este modelo y no es un framework genérico. La principal ventaja radica

07 May 2026

DeepSeek ajusta precios y retira modelos de IA

DeepSeek ha anunciado cambios en los precios de su API y la futura eliminación de algunos modelos. La compañía, especializada en inteligencia artificial, ha ajustado los precios por cada millón de tokens (la unidad básica de texto que procesa el modelo), cobrando por la cantidad total de tokens de e

04 May 2026

DeepSeek: alternativa económica a agente de codificación

Un nuevo proyecto llamado 'deepclaude' ofrece una alternativa significativamente más económica a la herramienta de agente autónomo de codificación de Claude Code de Anthropic. Utilizando modelos de DeepSeek V4 Pro, OpenRouter o cualquier backend compatible con Anthropic, 'deepclaude' permite mantene

25 Apr 2026

LamBench: Nuevos LLMs compiten por el liderazgo

Una nueva evaluación comparativa llamada LamBench ha revelado un panorama competitivo entre los modelos de lenguaje grandes (LLMs). La prueba, publicada recientemente, evalúa el rendimiento de estos modelos en tareas de inferencia. El modelo 'gpt-5.4' lidera la clasificación con un 91.7% de precisió

25 Apr 2026

DeepSeek V4: Nuevo modelo de IA de código abierto

DeepSeek AI ha lanzado oficialmente la versión preliminar de DeepSeek V4, una nueva familia de modelos de lenguaje de código abierto que promete eficiencia y rendimiento mejorados. La compañía ha puesto a disposición dos modelos principales: DeepSeek-V4-Pro, con 49 mil millones de parámetros activos

24 Apr 2026

DeepSeek API: Alternativa a OpenAI y Anthropic

DeepSeek ha lanzado una API compatible con OpenAI y Anthropic, permitiendo a los desarrolladores acceder a sus modelos de lenguaje utilizando las mismas herramientas y SDKs que ya emplean para interactuar con OpenAI y Anthropic. La API, disponible en https://api.deepseek.com y https://api.deepseek.c

16 Apr 2026

Thunderbolt: IA de código abierto para empresas

Thunderbolt ha lanzado una plataforma de inteligencia artificial (IA) de código abierto y auto-alojada, diseñada específicamente para empresas. La plataforma, presentada recientemente, permite a las organizaciones mantener el control total sobre sus datos e infraestructura de IA, evitando la depende

31 Mar 2026

IA: la memoria de las conversaciones tiene un costo

La forma en que los modelos de lenguaje grandes (LLM) como ChatGPT gestionan la memoria de las conversaciones, conocida como 'KV cache', tiene un costo físico y económico significativo. Cada interacción, incluso una pregunta sencilla, se traduce en datos almacenados en la memoria de la GPU, con GPT-

15 Mar 2026

Galería online compara arquitecturas de LLM

Un repositorio en línea, alojado en sebastianraschka.com, ha sido creado para rastrear y comparar las arquitecturas de los últimos modelos de lenguaje grandes (LLM). La “Galería de Arquitecturas LLM” recopila diagramas y hojas de datos de modelos como Llama 3 8B, DeepSeek V3, Gemma 3, Qwen3, Mistral

13 Mar 2026

ia: nuevos modelos redefinen el panorama tecnológico

Un panorama de modelos de inteligencia artificial está experimentando cambios significativos, según un reciente análisis de canirun.ai. Empresas como Meta, Alibaba, Microsoft, OpenAI, Google, Mistral AI, DeepSeek y NVIDIA están lanzando nuevas versiones y arquitecturas de modelos, abarcando una ampl