DeepSeek es una empresa china de inteligencia artificial que desarrolla modelos extensos de lenguaje (LLM) de código abierto. Tiene sede en Hangzhou, Zhejiang, es propiedad y está financiada exclusivamente por el fondo de cobertura chino High-Flyer, cuyo cofundador, Liang Wenfeng, estableció la empresa en 2023 y se desempeña como su director ejecutivo.
DeepSeek
organization · 10 menciones
Noticias que mencionan DeepSeek
Machine Learning: ¿Los benchmarks frenan el avance?
Este texto explora la paradoja de los benchmarks en el aprendizaje automático (Machine Learning, ML). Los benchmarks, que consisten en dividir los datos en conjuntos de entrenamiento y prueba para evaluar modelos, son la piedra angular del progreso en el campo, pero también son objeto de críticas si
Apple: estrategia cautelosa en la carrera por la IA
Apple ha adoptado una estrategia radicalmente diferente a la de sus competidores en la carrera por la inteligencia artificial, optando por no invertir masivamente en la infraestructura necesaria para ejecutar modelos de IA a gran escala. Mientras que Amazon, Google, Microsoft y Meta están destinando
ia: nuevos modelos redefinen el panorama tecnológico
Un panorama de modelos de inteligencia artificial está experimentando cambios significativos, según un reciente análisis de canirun.ai. Empresas como Meta, Alibaba, Microsoft, OpenAI, Google, Mistral AI, DeepSeek y NVIDIA están lanzando nuevas versiones y arquitecturas de modelos, abarcando una ampl
DoW y vigilancia: controversia por nuevos programas
Un reciente intercambio público entre el Subsecretario de Guerra Emil Michael y la divulgación de información sobre Anthropic ha generado controversia sobre la vigilancia doméstica y el papel del Departamento de Guerra (DoW). Michael, en una entrevista, defendió la legalidad de ciertas prácticas de
Synaps-CAD: IA revoluciona el diseño 3D
Un nuevo software de diseño 3D impulsado por inteligencia artificial, llamado Synaps-CAD, ha sido lanzado como prototipo temprano en GitHub por el desarrollador Ierror. La herramienta combina un editor de código OpenSCAD, una vista 3D en tiempo real y un asistente de IA, permitiendo a los usuarios m
ZSE: Motor optimiza LLMs y reduce el uso de memoria
Un nuevo motor de inferencia para modelos de lenguaje grandes (LLM) llamado ZSE ha sido desarrollado para reducir drásticamente los requisitos de memoria, según un anuncio reciente en GitHub. Creado por Zyora-Dev, ZSE permite ejecutar modelos de lenguaje de gran tamaño con una huella de memoria sign
Ocr sin servidor: 40 líneas de código lo hacen posible
Un desarrollador ha creado un sistema de Reconocimiento Óptico de Caracteres (OCR) sin servidor utilizando un modelo de código abierto, DeepSeek OCR, en tan solo 40 líneas de código. La solución, implementada a través de la plataforma Modal, permite procesar documentos PDF, incluso aquellos con nota
IA en Postgres: Nuevo Proyecto Integra Agentes Directamente
Un proyecto de código abierto llamado pgclaw permite integrar agentes de inteligencia artificial directamente en bases de datos PostgreSQL. Esta extensión, disponible en GitHub, introduce un nuevo tipo de dato 'claw' que permite almacenar agentes de IA (ya sean modelos de lenguaje simples o agentes
China Lanza GLM-5: Nuevo Rival para OpenAI
Zhipu AI, una empresa china de inteligencia artificial surgida de la Universidad Tsinghua, ha lanzado GLM-5, un modelo de lenguaje grande que se presenta como un competidor directo de OpenAI y Anthropic. GLM-5, la quinta generación de modelos de Zhipu AI, cuenta con aproximadamente 745 mil millones
Nanobot: IA Personal Ultraligera Revoluciona la Asistencia
Nanobot es un asistente de IA personal de código abierto y ultraligero, inspirado en Clawdbot. Con solo aproximadamente 4,000 líneas de código, es significativamente más pequeño que Clawdbot, lo que lo hace rápido y fácil de usar. Ofrece funcionalidades básicas de agente, incluyendo análisis de merc
