DeepSeek es una empresa china de inteligencia artificial que desarrolla modelos extensos de lenguaje (LLM) de código abierto. Tiene sede en Hangzhou, Zhejiang, es propiedad y está financiada exclusivamente por el fondo de cobertura chino High-Flyer, cuyo cofundador, Liang Wenfeng, estableció la empresa en 2023 y se desempeña como su director ejecutivo.

Ver en Wikipedia

Noticias que mencionan DeepSeek

RubyLLM: un framework Ruby único para integrar múltiples proveedores de IA

RubyLLM es un framework de código abierto en Ruby que unifica el acceso a los principales proveedores de inteligencia artificial bajo una única interfaz. Su premisa es resolver la fragmentación existente: cada proveedor —OpenAI, Anthropic, Google, Mistral, xAI, DeepSeek, Ollama u OpenRouter, entre o

La economía de la decodificación especulativa en modelos de lenguaje

La decodificación especulativa es una técnica de optimización en inferencia de modelos de lenguaje que acelera la generación de tokens sin pérdida de calidad. Su principio es simple: el modelo predice varios tokens futuros de forma barata y luego verifica solo los aceptados, aprovechando el ancho de

Anatomía de un kernel de paralelismo de expertos de alto rendimiento

Los modelos de lenguaje de gran tamaño (LLM) requieren coordinar muchas GPUs para funcionar. Una de las técnicas clave es el paralelismo de expertos (EP), esencial en los modelos MoE a gran escala. A diferencia de otras formas de paralelismo, cuyas comunicaciones siguen patrones fijos, en EP el rout

Open-LLM-VTuber: un asistente de voz con avatar Live2D que funciona en local

Open-LLM-VTuber es un compañero de inteligencia artificial con interacción por voz y un avatar Live2D animado, diseñado para funcionar de forma totalmente local en Windows, macOS y Linux. El proyecto nació con el objetivo de replicar mediante soluciones de código abierto la experiencia de la VTuber

Investigador gasta 1.500 dólares probando 12 LLMs en app vulnerable

Un investigador de seguridad informática creó una aplicación de reseñas de libros deliberadamente vulnerable y gastó 1.500 dólares para comprobar si los modelos de lenguaje grandes (LLM) podían explotarla. La aplicación, construida con React Native (Expo) y un backend en Python (FastAPI), almacenaba

La IA acumula 1,4 billones de gasto y aún no es rentable

El panel de seguimiento "Is AI Profitable Yet?" cuantifica la brecha entre inversión y facturación de las principales empresas de inteligencia artificial a mayo de 2026. El gasto acumulado de la industria alcanza 1,4 billones de dólares frente a 613.000 millones en ingresos, y el sitio resume la sit

DeepSeek V4: rendimiento mixto pero precio competitivo en China

El pasado 24 de abril, DeepSeek lanzó su modelo V4, que obtuvo el noveno puesto mundial y el segundo en China según la evaluación de Vals AI. Aunque algunos desarrolladores expresaron decepción por no superar a modelos como GPT-5.4 o Claude Opus 4.6, las pruebas realizadas en escenarios típicos chin

Herramienta de IA de código abierto crea vídeos cortos en HD

MoneyPrinterTurbo es una herramienta de código abierto que integra grandes modelos de lenguaje (LLM) para generar vídeos cortos de alta definición de forma automatizada. Su arquitectura sigue el patrón MVC, lo que facilita su mantenimiento y escalabilidad, y ofrece tanto una interfaz web como una AP

Nuevo agente 'zot' simplifica el uso de modelos de IA

El proyecto 'zot', disponible a través de zot.sh, lanza una nueva herramienta de codificación diseñada para agilizar la interacción con modelos de lenguaje. Este agente, desarrollado en el lenguaje de programación Go y distribuido como un único binario estático, se destaca por su ligereza y simplici

Hy3 de Tencent lidera OpenRouter superando a Claude

El modelo 'Hy3 preview' de Tencent ha sorprendido al liderar las clasificaciones de modelos de lenguaje (LLM) en OpenRouter, superando a competidores populares como Claude. Este hecho es relevante dado que OpenRouter, como intermediario, publica datos transparentes de uso real, revelando un modelo q

Cate: el nuevo IDE espacial que revoluciona el desarrollo

Cate, una nueva herramienta de código abierto lanzada en GitHub, busca transformar los flujos de trabajo de los desarrolladores mediante un entorno de desarrollo integrado (IDE) espacial con un lienzo infinito. Esta aplicación de Electron permite organizar herramientas de desarrollo como terminales,

LocalAI y outsourcing superan en costos a las grandes IA

Las grandes empresas de inteligencia artificial (Frontier labs) han incrementado drásticamente los costos de inferencia en los últimos meses. Modelos como GPT-5.5 de OpenAI y Gemini 3.5 de Google han duplicado y triplicado sus tarifas de API, respectivamente, mientras que Anthropic ha aumentado el c

Tantara lanza OpenBrief, herramienta para resumir videos y audio

El desarrollador Tantara ha presentado OpenBrief, una nueva herramienta de código abierto alojada en GitHub que convierte videos y audio en resúmenes interactivos y legibles. Esta aplicación de escritorio permite a los usuarios importar archivos multimedia, extraer transcripciones y generar resúmene

El acceso a la IA más avanzada será controlado por seguridad y escasez

El acceso a la inteligencia artificial de vanguardia se volverá escaso y selectivo. Anthropic presentó en abril Mythos, un modelo de ciberseguridad, disponible únicamente para un grupo reducido de corporaciones estadounidenses. OpenAI también restrictió el acceso con su iniciativa Daybreak. Tres fac

Antirez lanza DwarfStar 4 para ejecutar IA local con DeepSeek v4 Flash

El creador de Redis, Antirez, lanzó DwarfStar 4 (DS4), un proyecto de integración de modelo único para experiencia de IA local que ha alcanzado una popularidad inesperada. DS4 utiliza DeepSeek v4 Flash, un modelo cuasi-fronterizo que funciona con cuantización de 2/8 bits, permitiendo ejecutarlo en s

CrofAI lidera en valor: benchmark compara agentes de codificación

Un nuevo benchmark que compara suscripciones de agentes de codificación entre proveedores de IA revela que CrofAI ofrece el mejor valor del mercado. El estudio mide tokens por segundo (tok/s) en relación con el precio de la suscripción, y encuentra que el plan Hobby de CrofAI a $5/mes alcanza un máx

DeepSeek v4 Flash: Motor de inferencia más rápido y eficiente

Un equipo de ingenieros, liderado por Antirez, ha lanzado DeepSeek v4 Flash, un nuevo motor de inferencia optimizado para el modelo de lenguaje DeepSeek V4 Flash. Este motor, denominado 'ds4.c', está diseñado específicamente para este modelo y no es un framework genérico. La principal ventaja radica

DeepSeek ajusta precios y retira modelos de IA

DeepSeek ha anunciado cambios en los precios de su API y la futura eliminación de algunos modelos. La compañía, especializada en inteligencia artificial, ha ajustado los precios por cada millón de tokens (la unidad básica de texto que procesa el modelo), cobrando por la cantidad total de tokens de e

Wiki Builder: Crea Bases de Conocimiento LLM Fácilmente

DAIR Academy ha lanzado Wiki Builder, un plugin de código abierto para Claude Code que simplifica la creación de bases de conocimiento para modelos de lenguaje grandes (LLM). El plugin automatiza la configuración inicial, generando una estructura de carpetas, archivos de configuración y prompts pred

China impide venta de Manus a Meta por 2.000 millones

La administración estatal de China ha bloqueado la adquisición de Manus, una startup de inteligencia artificial con sede en Singapur y raíces chinas, por parte de Meta, en una transacción valorada en 2 mil millones de dólares. La Comisión Nacional de Desarrollo y Reforma anunció el lunes que la oper

Mistral AI: Francia desafía a EE.UU. en la carrera de la IA

Mistral AI, una startup francesa fundada por Arthur Mensch, Guillaume Lample y Timothée Lacroix, está desafiando el dominio de Silicon Valley en el campo de la inteligencia artificial. A diferencia de sus competidores estadounidenses como OpenAI y Anthropic, Mistral se distingue por ofrecer modelos

Claude Code: Usuarios ahorran un 90% con código abierto

Usuarios de Claude, el modelo de lenguaje de Anthropic, están reduciendo significativamente sus costos al integrar Claude Code con Ollama, una plataforma de código abierto, según un tutorial publicado en GitHub por Coherence-Daddy. La técnica permite ejecutar tareas intensivas de programación, como

VT Code: Nuevo asistente de código abierto facilita el desarrollo

Un nuevo agente de codificación de código abierto llamado VT Code ha sido lanzado, con el objetivo de simplificar el desarrollo de software. Desarrollado por Vinhnx y disponible en GitHub, VT Code ofrece comprensión nativa del código con modelos de lenguaje grandes (LLM) y robustez en la seguridad d

DeepSeek V4: Nuevo modelo de IA de código abierto

DeepSeek AI ha lanzado oficialmente la versión preliminar de DeepSeek V4, una nueva familia de modelos de lenguaje de código abierto que promete eficiencia y rendimiento mejorados. La compañía ha puesto a disposición dos modelos principales: DeepSeek-V4-Pro, con 49 mil millones de parámetros activos

IA avanza rápido: informe de Stanford revela tendencias

El informe anual del Índice de IA de Stanford para 2026 revela una aceleración continua en las capacidades de los modelos de IA, impulsada principalmente por empresas estadounidenses como OpenAI y Anthropic, que se preparan para sus próximas ofertas públicas iniciales (IPO). A pesar de este progreso

macOS: IA controla tu ordenador con 'Agent'

Un desarrollador ha lanzado 'Agent!', una innovadora aplicación nativa para macOS que permite a los usuarios controlar completamente sus Macs utilizando 17 modelos de lenguaje de IA (LLM). La aplicación, disponible en GitHub, integra Apple Intelligence de forma local, automatizando tareas complejas

LLMs de código abierto: incompatibilidad dificulta su uso

El uso de modelos de lenguaje grandes (LLM) de código abierto se enfrenta a un desafío significativo: la incompatibilidad en los formatos de llamada de herramientas. Mientras que los modelos cerrados como los de OpenAI ofrecen una integración fluida, los modelos de código abierto requieren que los d

IA: ¿alinear es una ilusión? Riesgos de los modelos

El artículo de aphyr.com plantea una preocupación crítica: la proliferación de modelos de lenguaje grandes (LLMs) y su impacto en la seguridad, argumentando que la búsqueda de LLMs 'amigables' está creando inadvertidamente las condiciones para la creación de modelos peligrosos. La idea de que se pue

IA descubre miles de fallos ocultos en software

Anthropic ha anunciado recientemente Claude Mythos, un nuevo modelo de inteligencia artificial con una capacidad sin precedentes para encontrar vulnerabilidades de seguridad en software. El modelo ha identificado miles de fallos de seguridad, algunos de ellos activos durante más de una década en sis

Machine Learning: ¿Los benchmarks frenan el avance?

Este texto explora la paradoja de los benchmarks en el aprendizaje automático (Machine Learning, ML). Los benchmarks, que consisten en dividir los datos en conjuntos de entrenamiento y prueba para evaluar modelos, son la piedra angular del progreso en el campo, pero también son objeto de críticas si

Apple: estrategia cautelosa en la carrera por la IA

Apple ha adoptado una estrategia radicalmente diferente a la de sus competidores en la carrera por la inteligencia artificial, optando por no invertir masivamente en la infraestructura necesaria para ejecutar modelos de IA a gran escala. Mientras que Amazon, Google, Microsoft y Meta están destinando

ia: nuevos modelos redefinen el panorama tecnológico

Un panorama de modelos de inteligencia artificial está experimentando cambios significativos, según un reciente análisis de canirun.ai. Empresas como Meta, Alibaba, Microsoft, OpenAI, Google, Mistral AI, DeepSeek y NVIDIA están lanzando nuevas versiones y arquitecturas de modelos, abarcando una ampl

DoW y vigilancia: controversia por nuevos programas

Un reciente intercambio público entre el Subsecretario de Guerra Emil Michael y la divulgación de información sobre Anthropic ha generado controversia sobre la vigilancia doméstica y el papel del Departamento de Guerra (DoW). Michael, en una entrevista, defendió la legalidad de ciertas prácticas de

Synaps-CAD: IA revoluciona el diseño 3D

Un nuevo software de diseño 3D impulsado por inteligencia artificial, llamado Synaps-CAD, ha sido lanzado como prototipo temprano en GitHub por el desarrollador Ierror. La herramienta combina un editor de código OpenSCAD, una vista 3D en tiempo real y un asistente de IA, permitiendo a los usuarios m

ZSE: Motor optimiza LLMs y reduce el uso de memoria

Un nuevo motor de inferencia para modelos de lenguaje grandes (LLM) llamado ZSE ha sido desarrollado para reducir drásticamente los requisitos de memoria, según un anuncio reciente en GitHub. Creado por Zyora-Dev, ZSE permite ejecutar modelos de lenguaje de gran tamaño con una huella de memoria sign

Ocr sin servidor: 40 líneas de código lo hacen posible

Un desarrollador ha creado un sistema de Reconocimiento Óptico de Caracteres (OCR) sin servidor utilizando un modelo de código abierto, DeepSeek OCR, en tan solo 40 líneas de código. La solución, implementada a través de la plataforma Modal, permite procesar documentos PDF, incluso aquellos con nota

IA en Postgres: Nuevo Proyecto Integra Agentes Directamente

Un proyecto de código abierto llamado pgclaw permite integrar agentes de inteligencia artificial directamente en bases de datos PostgreSQL. Esta extensión, disponible en GitHub, introduce un nuevo tipo de dato 'claw' que permite almacenar agentes de IA (ya sean modelos de lenguaje simples o agentes

China Lanza GLM-5: Nuevo Rival para OpenAI

Zhipu AI, una empresa china de inteligencia artificial surgida de la Universidad Tsinghua, ha lanzado GLM-5, un modelo de lenguaje grande que se presenta como un competidor directo de OpenAI y Anthropic. GLM-5, la quinta generación de modelos de Zhipu AI, cuenta con aproximadamente 745 mil millones

Nanobot: IA Personal Ultraligera Revoluciona la Asistencia

Nanobot es un asistente de IA personal de código abierto y ultraligero, inspirado en Clawdbot. Con solo aproximadamente 4,000 líneas de código, es significativamente más pequeño que Clawdbot, lo que lo hace rápido y fácil de usar. Ofrece funcionalidades básicas de agente, incluyendo análisis de merc