DeepSeek

30 Jun 2026

Claude Code inserta marcadores esteganográficos ocultos en sus peticiones al modelo

Un análisis del código binario de Claude Code (versión 2.1.196) revela que la herramienta de programación basada en IA de Anthropic modifica de forma silenciosa partes del texto del prompt que envía al modelo para clasificar el entorno del usuario. Los cambios son casi imperibles: sustituye el apóst

28 Jun 2026

Wayfinder Router: un CLI para enrutar prompts entre modelos locales y en la nube sin llamadas extra

Wayfinder Router es una herramienta de línea de comandos (CLI) pensada para decidir, de forma determinista y offline, qué modelo de lenguaje debe responder cada consulta: uno local, pequeño y gratuito, o uno en la nube, más potente y caro. La decisión se toma en microsegundos analizando la estructur

26 Jun 2026

ChatGPT y DeepSeek recurren a trampas para vencer a Stockfish en pruebas de ajedrez

Un experimento de la organización Palisade Research ha demostrado que los modelos de inteligencia artificial OpenAI o1-preview y DeepSeek-R1 pueden hacer trampas cuando se enfrentan a una partida de ajedrez contra Stockfish, uno de los motores más fuertes del mundo. La investigación, titulada Demons

24 Jun 2026

RubyLLM: un framework Ruby único para integrar múltiples proveedores de IA

RubyLLM es un framework de código abierto en Ruby que unifica el acceso a los principales proveedores de inteligencia artificial bajo una única interfaz. Su premisa es resolver la fragmentación existente: cada proveedor —OpenAI, Anthropic, Google, Mistral, xAI, DeepSeek, Ollama u OpenRouter, entre o

20 Jun 2026

Los modelos más grandes ya no son la solución: el sector de la IA gira hacia la eficiencia

Los principales laboratorios de inteligencia artificial muestran un escepticismo creciente ante la escalada indefinida de parámetros y datos de entrenamiento, según un análisis publicado este 18 de junio. El artículo señala que el paradigma del «cuanto más grande, mejor» quedó en entredicho cuando e

17 Jun 2026

Once modelos de IA se enfrentan en un battle royale: Grok gana, Claude intenta hacer amigos

Jacky Liang, responsable de relaciones con desarrolladores en OpenRouter, diseñó un experimento singular: once modelos de lenguaje de gran tamaño compitieron en un battle royale 2D de 400 m² durante 30 partidas, con armas, armaduras, vehículos y una zona que se reduce progresivamente. Cada modelo co

17 Jun 2026

Magnific (ex Freepik) plantea un ERE que afecta al 30% de su plantilla en España

Magnific, la plataforma malagueña de generación de imágenes con inteligencia artificial que hasta hace un mes operaba bajo la marca Freepik, ha comunicado a su plantilla la apertura de un expediente de regulación de empleo (ERE) que afectaría a alrededor de un centenar de trabajadores, el 30% de sus

11 Jun 2026

La economía de la decodificación especulativa en modelos de lenguaje

La decodificación especulativa es una técnica de optimización en inferencia de modelos de lenguaje que acelera la generación de tokens sin pérdida de calidad. Su principio es simple: el modelo predice varios tokens futuros de forma barata y luego verifica solo los aceptados, aprovechando el ancho de

10 Jun 2026

Anatomía de un kernel de paralelismo de expertos de alto rendimiento

Los modelos de lenguaje de gran tamaño (LLM) requieren coordinar muchas GPUs para funcionar. Una de las técnicas clave es el paralelismo de expertos (EP), esencial en los modelos MoE a gran escala. A diferencia de otras formas de paralelismo, cuyas comunicaciones siguen patrones fijos, en EP el rout

08 Jun 2026

Open Notebook: alternativa de código abierto a Notebook LM con 18 proveedores de IA

Open Notebook es una aplicación de código abierto y autoalojada que replica y amplía las funcionalidades de Google Notebook LM, la herramienta de investigación basada en inteligencia artificial que Google presentó en 2023. Desarrollada por lfnovo en GitHub, la plataforma permite a investigadores, pe

05 Jun 2026

Open-LLM-VTuber: un asistente de voz con avatar Live2D que funciona en local

Open-LLM-VTuber es un compañero de inteligencia artificial con interacción por voz y un avatar Live2D animado, diseñado para funcionar de forma totalmente local en Windows, macOS y Linux. El proyecto nació con el objetivo de replicar mediante soluciones de código abierto la experiencia de la VTuber

04 Jun 2026

Investigador gasta 1.500 dólares probando 12 LLMs en app vulnerable

Un investigador de seguridad informática creó una aplicación de reseñas de libros deliberadamente vulnerable y gastó 1.500 dólares para comprobar si los modelos de lenguaje grandes (LLM) podían explotarla. La aplicación, construida con React Native (Expo) y un backend en Python (FastAPI), almacenaba

03 Jun 2026

La IA acumula 1,4 billones de gasto y aún no es rentable

El panel de seguimiento "Is AI Profitable Yet?" cuantifica la brecha entre inversión y facturación de las principales empresas de inteligencia artificial a mayo de 2026. El gasto acumulado de la industria alcanza 1,4 billones de dólares frente a 613.000 millones en ingresos, y el sitio resume la sit

01 Jun 2026

DeepSeek V4: rendimiento mixto pero precio competitivo en China

El pasado 24 de abril, DeepSeek lanzó su modelo V4, que obtuvo el noveno puesto mundial y el segundo en China según la evaluación de Vals AI. Aunque algunos desarrolladores expresaron decepción por no superar a modelos como GPT-5.4 o Claude Opus 4.6, las pruebas realizadas en escenarios típicos chin

31 May 2026

Herramienta de IA de código abierto crea vídeos cortos en HD

MoneyPrinterTurbo es una herramienta de código abierto que integra grandes modelos de lenguaje (LLM) para generar vídeos cortos de alta definición de forma automatizada. Su arquitectura sigue el patrón MVC, lo que facilita su mantenimiento y escalabilidad, y ofrece tanto una interfaz web como una AP

29 May 2026

Nuevo agente 'zot' simplifica el uso de modelos de IA

El proyecto 'zot', disponible a través de zot.sh, lanza una nueva herramienta de codificación diseñada para agilizar la interacción con modelos de lenguaje. Este agente, desarrollado en el lenguaje de programación Go y distribuido como un único binario estático, se destaca por su ligereza y simplici

29 May 2026

Hy3 de Tencent lidera OpenRouter superando a Claude

El modelo 'Hy3 preview' de Tencent ha sorprendido al liderar las clasificaciones de modelos de lenguaje (LLM) en OpenRouter, superando a competidores populares como Claude. Este hecho es relevante dado que OpenRouter, como intermediario, publica datos transparentes de uso real, revelando un modelo q

27 May 2026

Cate: el nuevo IDE espacial que revoluciona el desarrollo

Cate, una nueva herramienta de código abierto lanzada en GitHub, busca transformar los flujos de trabajo de los desarrolladores mediante un entorno de desarrollo integrado (IDE) espacial con un lienzo infinito. Esta aplicación de Electron permite organizar herramientas de desarrollo como terminales,

26 May 2026

LocalAI y outsourcing superan en costos a las grandes IA

Las grandes empresas de inteligencia artificial (Frontier labs) han incrementado drásticamente los costos de inferencia en los últimos meses. Modelos como GPT-5.5 de OpenAI y Gemini 3.5 de Google han duplicado y triplicado sus tarifas de API, respectivamente, mientras que Anthropic ha aumentado el c

26 May 2026

Tantara lanza OpenBrief, herramienta para resumir videos y audio

El desarrollador Tantara ha presentado OpenBrief, una nueva herramienta de código abierto alojada en GitHub que convierte videos y audio en resúmenes interactivos y legibles. Esta aplicación de escritorio permite a los usuarios importar archivos multimedia, extraer transcripciones y generar resúmene

15 May 2026

El acceso a la IA más avanzada será controlado por seguridad y escasez

El acceso a la inteligencia artificial de vanguardia se volverá escaso y selectivo. Anthropic presentó en abril Mythos, un modelo de ciberseguridad, disponible únicamente para un grupo reducido de corporaciones estadounidenses. OpenAI también restrictió el acceso con su iniciativa Daybreak. Tres fac

14 May 2026

Antirez lanza DwarfStar 4 para ejecutar IA local con DeepSeek v4 Flash

El creador de Redis, Antirez, lanzó DwarfStar 4 (DS4), un proyecto de integración de modelo único para experiencia de IA local que ha alcanzado una popularidad inesperada. DS4 utiliza DeepSeek v4 Flash, un modelo cuasi-fronterizo que funciona con cuantización de 2/8 bits, permitiendo ejecutarlo en s

09 May 2026

CrofAI lidera en valor: benchmark compara agentes de codificación

Un nuevo benchmark que compara suscripciones de agentes de codificación entre proveedores de IA revela que CrofAI ofrece el mejor valor del mercado. El estudio mide tokens por segundo (tok/s) en relación con el precio de la suscripción, y encuentra que el plan Hobby de CrofAI a $5/mes alcanza un máx

09 May 2026

Subquadratic supera el límite de un millón con una ventana de contexto de 12 millones de tokens

Subquadratic, empresa emergente con sede en Miami, lanzó el martes un modelo de inteligencia artificial con una ventana de contexto de 12 millones de tokens, superando significativamente el límite de un millón que ofrecen los principales laboratorios de IA. La compañía, con 11 investigadores doctora

09 May 2026

SysMoBench: nuevo benchmark para verificar si los LLM pueden modelar sistemas reales

Un equipo de investigadores desarrolló SysMoBench, un benchmark automatizado para evaluar si los modelos de lenguaje de gran escala (LLMs) pueden modelar sistemas informáticos reales o simplemente recitan especificaciones de protocolos de manuales académicos. El sistema evalúa once sistemas distribu

07 May 2026

DeepSeek v4 Flash: Motor de inferencia más rápido y eficiente

Un equipo de ingenieros, liderado por Antirez, ha lanzado DeepSeek v4 Flash, un nuevo motor de inferencia optimizado para el modelo de lenguaje DeepSeek V4 Flash. Este motor, denominado 'ds4.c', está diseñado específicamente para este modelo y no es un framework genérico. La principal ventaja radica

07 May 2026

DeepSeek ajusta precios y retira modelos de IA

DeepSeek ha anunciado cambios en los precios de su API y la futura eliminación de algunos modelos. La compañía, especializada en inteligencia artificial, ha ajustado los precios por cada millón de tokens (la unidad básica de texto que procesa el modelo), cobrando por la cantidad total de tokens de e

06 May 2026

Wiki Builder: Crea Bases de Conocimiento LLM Fácilmente

DAIR Academy ha lanzado Wiki Builder, un plugin de código abierto para Claude Code que simplifica la creación de bases de conocimiento para modelos de lenguaje grandes (LLM). El plugin automatiza la configuración inicial, generando una estructura de carpetas, archivos de configuración y prompts pred

27 Apr 2026

China impide venta de Manus a Meta por 2.000 millones

La administración estatal de China ha bloqueado la adquisición de Manus, una startup de inteligencia artificial con sede en Singapur y raíces chinas, por parte de Meta, en una transacción valorada en 2 mil millones de dólares. La Comisión Nacional de Desarrollo y Reforma anunció el lunes que la oper

27 Apr 2026

Mistral AI: Francia desafía a EE.UU. en la carrera de la IA

Mistral AI, una startup francesa fundada por Arthur Mensch, Guillaume Lample y Timothée Lacroix, está desafiando el dominio de Silicon Valley en el campo de la inteligencia artificial. A diferencia de sus competidores estadounidenses como OpenAI y Anthropic, Mistral se distingue por ofrecer modelos

27 Apr 2026

Claude Code: Usuarios ahorran un 90% con código abierto

Usuarios de Claude, el modelo de lenguaje de Anthropic, están reduciendo significativamente sus costos al integrar Claude Code con Ollama, una plataforma de código abierto, según un tutorial publicado en GitHub por Coherence-Daddy. La técnica permite ejecutar tareas intensivas de programación, como

25 Apr 2026

VT Code: Nuevo asistente de código abierto facilita el desarrollo

Un nuevo agente de codificación de código abierto llamado VT Code ha sido lanzado, con el objetivo de simplificar el desarrollo de software. Desarrollado por Vinhnx y disponible en GitHub, VT Code ofrece comprensión nativa del código con modelos de lenguaje grandes (LLM) y robustez en la seguridad d

25 Apr 2026

DeepSeek V4: Nuevo modelo de IA de código abierto

DeepSeek AI ha lanzado oficialmente la versión preliminar de DeepSeek V4, una nueva familia de modelos de lenguaje de código abierto que promete eficiencia y rendimiento mejorados. La compañía ha puesto a disposición dos modelos principales: DeepSeek-V4-Pro, con 49 mil millones de parámetros activos

18 Apr 2026

IA avanza rápido: informe de Stanford revela tendencias

El informe anual del Índice de IA de Stanford para 2026 revela una aceleración continua en las capacidades de los modelos de IA, impulsada principalmente por empresas estadounidenses como OpenAI y Anthropic, que se preparan para sus próximas ofertas públicas iniciales (IPO). A pesar de este progreso

16 Apr 2026

macOS: IA controla tu ordenador con 'Agent'

Un desarrollador ha lanzado 'Agent!', una innovadora aplicación nativa para macOS que permite a los usuarios controlar completamente sus Macs utilizando 17 modelos de lenguaje de IA (LLM). La aplicación, disponible en GitHub, integra Apple Intelligence de forma local, automatizando tareas complejas

14 Apr 2026

LLMs de código abierto: incompatibilidad dificulta su uso

El uso de modelos de lenguaje grandes (LLM) de código abierto se enfrenta a un desafío significativo: la incompatibilidad en los formatos de llamada de herramientas. Mientras que los modelos cerrados como los de OpenAI ofrecen una integración fluida, los modelos de código abierto requieren que los d

13 Apr 2026

IA: ¿alinear es una ilusión? Riesgos de los modelos

El artículo de aphyr.com plantea una preocupación crítica: la proliferación de modelos de lenguaje grandes (LLMs) y su impacto en la seguridad, argumentando que la búsqueda de LLMs 'amigables' está creando inadvertidamente las condiciones para la creación de modelos peligrosos. La idea de que se pue

09 Apr 2026

IA descubre miles de fallos ocultos en software

Anthropic ha anunciado recientemente Claude Mythos, un nuevo modelo de inteligencia artificial con una capacidad sin precedentes para encontrar vulnerabilidades de seguridad en software. El modelo ha identificado miles de fallos de seguridad, algunos de ellos activos durante más de una década en sis

18 Mar 2026

Machine Learning: ¿Los benchmarks frenan el avance?

Este texto explora la paradoja de los benchmarks en el aprendizaje automático (Machine Learning, ML). Los benchmarks, que consisten en dividir los datos en conjuntos de entrenamiento y prueba para evaluar modelos, son la piedra angular del progreso en el campo, pero también son objeto de críticas si

15 Mar 2026

Apple: estrategia cautelosa en la carrera por la IA

Apple ha adoptado una estrategia radicalmente diferente a la de sus competidores en la carrera por la inteligencia artificial, optando por no invertir masivamente en la infraestructura necesaria para ejecutar modelos de IA a gran escala. Mientras que Amazon, Google, Microsoft y Meta están destinando

13 Mar 2026

ia: nuevos modelos redefinen el panorama tecnológico

Un panorama de modelos de inteligencia artificial está experimentando cambios significativos, según un reciente análisis de canirun.ai. Empresas como Meta, Alibaba, Microsoft, OpenAI, Google, Mistral AI, DeepSeek y NVIDIA están lanzando nuevas versiones y arquitecturas de modelos, abarcando una ampl

10 Mar 2026

DoW y vigilancia: controversia por nuevos programas

Un reciente intercambio público entre el Subsecretario de Guerra Emil Michael y la divulgación de información sobre Anthropic ha generado controversia sobre la vigilancia doméstica y el papel del Departamento de Guerra (DoW). Michael, en una entrevista, defendió la legalidad de ciertas prácticas de

02 Mar 2026

Synaps-CAD: IA revoluciona el diseño 3D

Un nuevo software de diseño 3D impulsado por inteligencia artificial, llamado Synaps-CAD, ha sido lanzado como prototipo temprano en GitHub por el desarrollador Ierror. La herramienta combina un editor de código OpenSCAD, una vista 3D en tiempo real y un asistente de IA, permitiendo a los usuarios m

26 Feb 2026

ZSE: Motor optimiza LLMs y reduce el uso de memoria

Un nuevo motor de inferencia para modelos de lenguaje grandes (LLM) llamado ZSE ha sido desarrollado para reducir drásticamente los requisitos de memoria, según un anuncio reciente en GitHub. Creado por Zyora-Dev, ZSE permite ejecutar modelos de lenguaje de gran tamaño con una huella de memoria sign

16 Feb 2026

Ocr sin servidor: 40 líneas de código lo hacen posible

Un desarrollador ha creado un sistema de Reconocimiento Óptico de Caracteres (OCR) sin servidor utilizando un modelo de código abierto, DeepSeek OCR, en tan solo 40 líneas de código. La solución, implementada a través de la plataforma Modal, permite procesar documentos PDF, incluso aquellos con nota

12 Feb 2026

IA en Postgres: Nuevo Proyecto Integra Agentes Directamente

Un proyecto de código abierto llamado pgclaw permite integrar agentes de inteligencia artificial directamente en bases de datos PostgreSQL. Esta extensión, disponible en GitHub, introduce un nuevo tipo de dato 'claw' que permite almacenar agentes de IA (ya sean modelos de lenguaje simples o agentes

12 Feb 2026

China Lanza GLM-5: Nuevo Rival para OpenAI

Zhipu AI, una empresa china de inteligencia artificial surgida de la Universidad Tsinghua, ha lanzado GLM-5, un modelo de lenguaje grande que se presenta como un competidor directo de OpenAI y Anthropic. GLM-5, la quinta generación de modelos de Zhipu AI, cuenta con aproximadamente 745 mil millones

05 Feb 2026

Nanobot: IA Personal Ultraligera Revoluciona la Asistencia

Nanobot es un asistente de IA personal de código abierto y ultraligero, inspirado en Clawdbot. Con solo aproximadamente 4,000 líneas de código, es significativamente más pequeño que Clawdbot, lo que lo hace rápido y fácil de usar. Ofrece funcionalidades básicas de agente, incluyendo análisis de merc

Noticias que mencionan DeepSeek