DeepSeek v4 Flash: Motor de inferencia más rápido y eficiente

Un equipo de ingenieros, liderado por Antirez, ha lanzado DeepSeek v4 Flash, un nuevo motor de inferencia optimizado para el modelo de lenguaje DeepSeek V4 Flash. Este motor, denominado 'ds4.c', está diseñado específicamente para este modelo y no es un framework genérico. La principal ventaja radica

DeepSeek ajusta precios y retira modelos de IA

DeepSeek ha anunciado cambios en los precios de su API y la futura eliminación de algunos modelos. La compañía, especializada en inteligencia artificial, ha ajustado los precios por cada millón de tokens (la unidad básica de texto que procesa el modelo), cobrando por la cantidad total de tokens de e

DeepSeek: alternativa económica a agente de codificación

Un nuevo proyecto llamado 'deepclaude' ofrece una alternativa significativamente más económica a la herramienta de agente autónomo de codificación de Claude Code de Anthropic. Utilizando modelos de DeepSeek V4 Pro, OpenRouter o cualquier backend compatible con Anthropic, 'deepclaude' permite mantene

LamBench: Nuevos LLMs compiten por el liderazgo

Una nueva evaluación comparativa llamada LamBench ha revelado un panorama competitivo entre los modelos de lenguaje grandes (LLMs). La prueba, publicada recientemente, evalúa el rendimiento de estos modelos en tareas de inferencia. El modelo 'gpt-5.4' lidera la clasificación con un 91.7% de precisió

DeepSeek V4: Nuevo modelo de IA de código abierto

DeepSeek AI ha lanzado oficialmente la versión preliminar de DeepSeek V4, una nueva familia de modelos de lenguaje de código abierto que promete eficiencia y rendimiento mejorados. La compañía ha puesto a disposición dos modelos principales: DeepSeek-V4-Pro, con 49 mil millones de parámetros activos

DeepSeek API: Alternativa a OpenAI y Anthropic

DeepSeek ha lanzado una API compatible con OpenAI y Anthropic, permitiendo a los desarrolladores acceder a sus modelos de lenguaje utilizando las mismas herramientas y SDKs que ya emplean para interactuar con OpenAI y Anthropic. La API, disponible en https://api.deepseek.com y https://api.deepseek.c

Thunderbolt: IA de código abierto para empresas

Thunderbolt ha lanzado una plataforma de inteligencia artificial (IA) de código abierto y auto-alojada, diseñada específicamente para empresas. La plataforma, presentada recientemente, permite a las organizaciones mantener el control total sobre sus datos e infraestructura de IA, evitando la depende

IA: la memoria de las conversaciones tiene un costo

La forma en que los modelos de lenguaje grandes (LLM) como ChatGPT gestionan la memoria de las conversaciones, conocida como 'KV cache', tiene un costo físico y económico significativo. Cada interacción, incluso una pregunta sencilla, se traduce en datos almacenados en la memoria de la GPU, con GPT-

Galería online compara arquitecturas de LLM

Un repositorio en línea, alojado en sebastianraschka.com, ha sido creado para rastrear y comparar las arquitecturas de los últimos modelos de lenguaje grandes (LLM). La “Galería de Arquitecturas LLM” recopila diagramas y hojas de datos de modelos como Llama 3 8B, DeepSeek V3, Gemma 3, Qwen3, Mistral

ia: nuevos modelos redefinen el panorama tecnológico

Un panorama de modelos de inteligencia artificial está experimentando cambios significativos, según un reciente análisis de canirun.ai. Empresas como Meta, Alibaba, Microsoft, OpenAI, Google, Mistral AI, DeepSeek y NVIDIA están lanzando nuevas versiones y arquitecturas de modelos, abarcando una ampl