DeepSeek es una empresa china de inteligencia artificial que desarrolla modelos extensos de lenguaje (LLM) de código abierto. Tiene sede en Hangzhou, Zhejiang, es propiedad y está financiada exclusivamente por el fondo de cobertura chino High-Flyer, cuyo cofundador, Liang Wenfeng, estableció la empresa en 2023 y se desempeña como su director ejecutivo.

Ver en Wikipedia

Noticias que mencionan DeepSeek

Machine Learning: ¿Los benchmarks frenan el avance?

Este texto explora la paradoja de los benchmarks en el aprendizaje automático (Machine Learning, ML). Los benchmarks, que consisten en dividir los datos en conjuntos de entrenamiento y prueba para evaluar modelos, son la piedra angular del progreso en el campo, pero también son objeto de críticas si

Apple: estrategia cautelosa en la carrera por la IA

Apple ha adoptado una estrategia radicalmente diferente a la de sus competidores en la carrera por la inteligencia artificial, optando por no invertir masivamente en la infraestructura necesaria para ejecutar modelos de IA a gran escala. Mientras que Amazon, Google, Microsoft y Meta están destinando

ia: nuevos modelos redefinen el panorama tecnológico

Un panorama de modelos de inteligencia artificial está experimentando cambios significativos, según un reciente análisis de canirun.ai. Empresas como Meta, Alibaba, Microsoft, OpenAI, Google, Mistral AI, DeepSeek y NVIDIA están lanzando nuevas versiones y arquitecturas de modelos, abarcando una ampl

DoW y vigilancia: controversia por nuevos programas

Un reciente intercambio público entre el Subsecretario de Guerra Emil Michael y la divulgación de información sobre Anthropic ha generado controversia sobre la vigilancia doméstica y el papel del Departamento de Guerra (DoW). Michael, en una entrevista, defendió la legalidad de ciertas prácticas de

Synaps-CAD: IA revoluciona el diseño 3D

Un nuevo software de diseño 3D impulsado por inteligencia artificial, llamado Synaps-CAD, ha sido lanzado como prototipo temprano en GitHub por el desarrollador Ierror. La herramienta combina un editor de código OpenSCAD, una vista 3D en tiempo real y un asistente de IA, permitiendo a los usuarios m

ZSE: Motor optimiza LLMs y reduce el uso de memoria

Un nuevo motor de inferencia para modelos de lenguaje grandes (LLM) llamado ZSE ha sido desarrollado para reducir drásticamente los requisitos de memoria, según un anuncio reciente en GitHub. Creado por Zyora-Dev, ZSE permite ejecutar modelos de lenguaje de gran tamaño con una huella de memoria sign

Ocr sin servidor: 40 líneas de código lo hacen posible

Un desarrollador ha creado un sistema de Reconocimiento Óptico de Caracteres (OCR) sin servidor utilizando un modelo de código abierto, DeepSeek OCR, en tan solo 40 líneas de código. La solución, implementada a través de la plataforma Modal, permite procesar documentos PDF, incluso aquellos con nota

IA en Postgres: Nuevo Proyecto Integra Agentes Directamente

Un proyecto de código abierto llamado pgclaw permite integrar agentes de inteligencia artificial directamente en bases de datos PostgreSQL. Esta extensión, disponible en GitHub, introduce un nuevo tipo de dato 'claw' que permite almacenar agentes de IA (ya sean modelos de lenguaje simples o agentes

China Lanza GLM-5: Nuevo Rival para OpenAI

Zhipu AI, una empresa china de inteligencia artificial surgida de la Universidad Tsinghua, ha lanzado GLM-5, un modelo de lenguaje grande que se presenta como un competidor directo de OpenAI y Anthropic. GLM-5, la quinta generación de modelos de Zhipu AI, cuenta con aproximadamente 745 mil millones

Nanobot: IA Personal Ultraligera Revoluciona la Asistencia

Nanobot es un asistente de IA personal de código abierto y ultraligero, inspirado en Clawdbot. Con solo aproximadamente 4,000 líneas de código, es significativamente más pequeño que Clawdbot, lo que lo hace rápido y fácil de usar. Ofrece funcionalidades básicas de agente, incluyendo análisis de merc