DeepSeek es una empresa china de inteligencia artificial que desarrolla modelos extensos de lenguaje (LLM) de código abierto. Tiene sede en Hangzhou, Zhejiang, es propiedad y está financiada exclusivamente por el fondo de cobertura chino High-Flyer, cuyo cofundador, Liang Wenfeng, estableció la empresa en 2023 y se desempeña como su director ejecutivo.

Ver en Wikipedia

Noticias que mencionan DeepSeek

El acceso a la IA más avanzada será controlado por seguridad y escasez

El acceso a la inteligencia artificial de vanguardia se volverá escaso y selectivo. Anthropic presentó en abril Mythos, un modelo de ciberseguridad, disponible únicamente para un grupo reducido de corporaciones estadounidenses. OpenAI también restrictió el acceso con su iniciativa Daybreak. Tres fac

Antirez lanza DwarfStar 4 para ejecutar IA local con DeepSeek v4 Flash

El creador de Redis, Antirez, lanzó DwarfStar 4 (DS4), un proyecto de integración de modelo único para experiencia de IA local que ha alcanzado una popularidad inesperada. DS4 utiliza DeepSeek v4 Flash, un modelo cuasi-fronterizo que funciona con cuantización de 2/8 bits, permitiendo ejecutarlo en s

CrofAI lidera en valor: benchmark compara agentes de codificación

Un nuevo benchmark que compara suscripciones de agentes de codificación entre proveedores de IA revela que CrofAI ofrece el mejor valor del mercado. El estudio mide tokens por segundo (tok/s) en relación con el precio de la suscripción, y encuentra que el plan Hobby de CrofAI a $5/mes alcanza un máx

DeepSeek v4 Flash: Motor de inferencia más rápido y eficiente

Un equipo de ingenieros, liderado por Antirez, ha lanzado DeepSeek v4 Flash, un nuevo motor de inferencia optimizado para el modelo de lenguaje DeepSeek V4 Flash. Este motor, denominado 'ds4.c', está diseñado específicamente para este modelo y no es un framework genérico. La principal ventaja radica

DeepSeek ajusta precios y retira modelos de IA

DeepSeek ha anunciado cambios en los precios de su API y la futura eliminación de algunos modelos. La compañía, especializada en inteligencia artificial, ha ajustado los precios por cada millón de tokens (la unidad básica de texto que procesa el modelo), cobrando por la cantidad total de tokens de e

Wiki Builder: Crea Bases de Conocimiento LLM Fácilmente

DAIR Academy ha lanzado Wiki Builder, un plugin de código abierto para Claude Code que simplifica la creación de bases de conocimiento para modelos de lenguaje grandes (LLM). El plugin automatiza la configuración inicial, generando una estructura de carpetas, archivos de configuración y prompts pred

China impide venta de Manus a Meta por 2.000 millones

La administración estatal de China ha bloqueado la adquisición de Manus, una startup de inteligencia artificial con sede en Singapur y raíces chinas, por parte de Meta, en una transacción valorada en 2 mil millones de dólares. La Comisión Nacional de Desarrollo y Reforma anunció el lunes que la oper

Mistral AI: Francia desafía a EE.UU. en la carrera de la IA

Mistral AI, una startup francesa fundada por Arthur Mensch, Guillaume Lample y Timothée Lacroix, está desafiando el dominio de Silicon Valley en el campo de la inteligencia artificial. A diferencia de sus competidores estadounidenses como OpenAI y Anthropic, Mistral se distingue por ofrecer modelos

Claude Code: Usuarios ahorran un 90% con código abierto

Usuarios de Claude, el modelo de lenguaje de Anthropic, están reduciendo significativamente sus costos al integrar Claude Code con Ollama, una plataforma de código abierto, según un tutorial publicado en GitHub por Coherence-Daddy. La técnica permite ejecutar tareas intensivas de programación, como

VT Code: Nuevo asistente de código abierto facilita el desarrollo

Un nuevo agente de codificación de código abierto llamado VT Code ha sido lanzado, con el objetivo de simplificar el desarrollo de software. Desarrollado por Vinhnx y disponible en GitHub, VT Code ofrece comprensión nativa del código con modelos de lenguaje grandes (LLM) y robustez en la seguridad d

DeepSeek V4: Nuevo modelo de IA de código abierto

DeepSeek AI ha lanzado oficialmente la versión preliminar de DeepSeek V4, una nueva familia de modelos de lenguaje de código abierto que promete eficiencia y rendimiento mejorados. La compañía ha puesto a disposición dos modelos principales: DeepSeek-V4-Pro, con 49 mil millones de parámetros activos

IA avanza rápido: informe de Stanford revela tendencias

El informe anual del Índice de IA de Stanford para 2026 revela una aceleración continua en las capacidades de los modelos de IA, impulsada principalmente por empresas estadounidenses como OpenAI y Anthropic, que se preparan para sus próximas ofertas públicas iniciales (IPO). A pesar de este progreso

macOS: IA controla tu ordenador con 'Agent'

Un desarrollador ha lanzado 'Agent!', una innovadora aplicación nativa para macOS que permite a los usuarios controlar completamente sus Macs utilizando 17 modelos de lenguaje de IA (LLM). La aplicación, disponible en GitHub, integra Apple Intelligence de forma local, automatizando tareas complejas

LLMs de código abierto: incompatibilidad dificulta su uso

El uso de modelos de lenguaje grandes (LLM) de código abierto se enfrenta a un desafío significativo: la incompatibilidad en los formatos de llamada de herramientas. Mientras que los modelos cerrados como los de OpenAI ofrecen una integración fluida, los modelos de código abierto requieren que los d

IA: ¿alinear es una ilusión? Riesgos de los modelos

El artículo de aphyr.com plantea una preocupación crítica: la proliferación de modelos de lenguaje grandes (LLMs) y su impacto en la seguridad, argumentando que la búsqueda de LLMs 'amigables' está creando inadvertidamente las condiciones para la creación de modelos peligrosos. La idea de que se pue

IA descubre miles de fallos ocultos en software

Anthropic ha anunciado recientemente Claude Mythos, un nuevo modelo de inteligencia artificial con una capacidad sin precedentes para encontrar vulnerabilidades de seguridad en software. El modelo ha identificado miles de fallos de seguridad, algunos de ellos activos durante más de una década en sis

Machine Learning: ¿Los benchmarks frenan el avance?

Este texto explora la paradoja de los benchmarks en el aprendizaje automático (Machine Learning, ML). Los benchmarks, que consisten en dividir los datos en conjuntos de entrenamiento y prueba para evaluar modelos, son la piedra angular del progreso en el campo, pero también son objeto de críticas si

Apple: estrategia cautelosa en la carrera por la IA

Apple ha adoptado una estrategia radicalmente diferente a la de sus competidores en la carrera por la inteligencia artificial, optando por no invertir masivamente en la infraestructura necesaria para ejecutar modelos de IA a gran escala. Mientras que Amazon, Google, Microsoft y Meta están destinando

ia: nuevos modelos redefinen el panorama tecnológico

Un panorama de modelos de inteligencia artificial está experimentando cambios significativos, según un reciente análisis de canirun.ai. Empresas como Meta, Alibaba, Microsoft, OpenAI, Google, Mistral AI, DeepSeek y NVIDIA están lanzando nuevas versiones y arquitecturas de modelos, abarcando una ampl

DoW y vigilancia: controversia por nuevos programas

Un reciente intercambio público entre el Subsecretario de Guerra Emil Michael y la divulgación de información sobre Anthropic ha generado controversia sobre la vigilancia doméstica y el papel del Departamento de Guerra (DoW). Michael, en una entrevista, defendió la legalidad de ciertas prácticas de

Synaps-CAD: IA revoluciona el diseño 3D

Un nuevo software de diseño 3D impulsado por inteligencia artificial, llamado Synaps-CAD, ha sido lanzado como prototipo temprano en GitHub por el desarrollador Ierror. La herramienta combina un editor de código OpenSCAD, una vista 3D en tiempo real y un asistente de IA, permitiendo a los usuarios m

ZSE: Motor optimiza LLMs y reduce el uso de memoria

Un nuevo motor de inferencia para modelos de lenguaje grandes (LLM) llamado ZSE ha sido desarrollado para reducir drásticamente los requisitos de memoria, según un anuncio reciente en GitHub. Creado por Zyora-Dev, ZSE permite ejecutar modelos de lenguaje de gran tamaño con una huella de memoria sign

Ocr sin servidor: 40 líneas de código lo hacen posible

Un desarrollador ha creado un sistema de Reconocimiento Óptico de Caracteres (OCR) sin servidor utilizando un modelo de código abierto, DeepSeek OCR, en tan solo 40 líneas de código. La solución, implementada a través de la plataforma Modal, permite procesar documentos PDF, incluso aquellos con nota

IA en Postgres: Nuevo Proyecto Integra Agentes Directamente

Un proyecto de código abierto llamado pgclaw permite integrar agentes de inteligencia artificial directamente en bases de datos PostgreSQL. Esta extensión, disponible en GitHub, introduce un nuevo tipo de dato 'claw' que permite almacenar agentes de IA (ya sean modelos de lenguaje simples o agentes

China Lanza GLM-5: Nuevo Rival para OpenAI

Zhipu AI, una empresa china de inteligencia artificial surgida de la Universidad Tsinghua, ha lanzado GLM-5, un modelo de lenguaje grande que se presenta como un competidor directo de OpenAI y Anthropic. GLM-5, la quinta generación de modelos de Zhipu AI, cuenta con aproximadamente 745 mil millones

Nanobot: IA Personal Ultraligera Revoluciona la Asistencia

Nanobot es un asistente de IA personal de código abierto y ultraligero, inspirado en Clawdbot. Con solo aproximadamente 4,000 líneas de código, es significativamente más pequeño que Clawdbot, lo que lo hace rápido y fácil de usar. Ofrece funcionalidades básicas de agente, incluyendo análisis de merc