Qwen

26 Jun 2026

Eustella: qué es, cómo funciona y cuánto cuesta la IA europea con agentes

Eustella es un asistente personal de inteligencia artificial desarrollado por la empresa austríaca newsrooms.ai, con sede en Viena, que se presenta como una alternativa europea a ChatGPT, Gemini y Claude, con un enfoque centrado en la privacidad y la soberanía de los datos. Toda la información de lo

24 Jun 2026

Expertos chinos y estadounidenses piden cooperación en IA ante riesgos sistémicos

El periodista Will Knight asistió a una conferencia de inteligencia artificial en Zhongguancun, distrito tecnológico de Pekín, organizada por la Academia de Inteligencia Artificial de Pekín. Reunió a figuras legendarias de la informática como Whitfield Diffie, codescubridor de la criptografía de cla

11 Jun 2026

Resolver la ambigüedad del coreano en CPU: 7.300 palabras por segundo sin GPU

Kimchi Reader, una herramienta de aprendizaje de coreano por inmersión, necesitaba desambiguar lemas en libros completos de forma rápida y precisa. El desarrollador encaró el reto con un modelo KoELECTRA-small de 14 millones de parámetros, cuantizado a int8 y ejecutado íntegramente en CPU mediante u

11 Jun 2026

DiffusionGemma: Google DeepMind cambia las reglas del texto y multiplica por cuatro la velocidad en local

# DiffusionGemma: Google DeepMind cambia las reglas del texto y multiplica por cuatro la velocidad en local **Google DeepMind ha presentado DiffusionGemma, el primer modelo abierto de la familia Gemma 4 que abandona la generación autorregresiva. En lugar de escribir token a token de izquierda a der

06 Jun 2026

Anatomía de un LLM moderno: de los tokens a la predicción

Los modelos de lenguaje de gran tamaño (LLM) se construyen apilando bloques transformer una y otra vez, por lo que entender la maquinaria del transformer es la base para comprender su funcionamiento. Esta guía recorre los componentes esenciales de un LLM moderno sin profundizar en las matemáticas, c

05 Jun 2026

Anatomía de un estancamiento: las alucinaciones de los LLM entre los estudiantes

Un profesor universitario narra en primera persona la experiencia vivida con un estudiante de tercer año —al que llama Joe— durante un proyecto de investigación independiente centrado en la verificación automática del protocolo MQTT mediante un modelo de lenguaje. El relato, escrito como advertencia

03 Jun 2026

Claude Opus 4.8 se identificó como Qwen en chino: la evidencia descarta la destilación

El 28 de mayo de 2026, Anthropic lanzó Claude Opus 4.8. Horas después, varios usuarios que preguntaban al modelo en chino «你是什么模型?» («¿qué modelo eres?») recibieron una respuesta inesperada: Claude se identificaba como Tongyi Qianwen, la familia de modelos de Qwen desarrollada por Alibaba. El incide

29 May 2026

Nuevo captcha evalúa el proceso mental para detectar bots de IA

Investigadores de Roundtable Technologies han presentado CogCAPTCHA30, una innovadora propuesta de verificación que explota las diferencias cognitivas entre humanos y agentes de inteligencia artificial. Ante la vulnerabilidad de los CAPTCHAs tradicionales ante modelos de visión por computadora, este

27 May 2026

Herramienta de IA genera comandos de terminal con símbolos simples

Un desarrollador ha implementado una herramienta que permite generar comandos de terminal y obtener respuestas mediante inteligencia artificial utilizando símbolos como la coma y el signo de interrogación. Esta integración facilita la creación de comandos shell complejos y la consulta de información

15 May 2026

Nueva herramienta encuentra el mejor LLM para tu hardware

El desarrollador Andyyyy64 ha publicado en GitHub la herramienta 'whichllm', diseñada para ayudar a los usuarios a encontrar el modelo de lenguaje grande (LLM) más adecuado para su hardware específico. La aplicación detecta automáticamente las características del sistema (GPU, CPU, RAM) y ordena los

09 May 2026

Modal mejora inferencia multimodal más de 10% con un simple diccionario Python

La plataforma Modal ha logrado mejorar el rendimiento de inferencia multimodal en más de un 10% mediante la implementación de un simple diccionario Python en el motor de inferencia SGLang. El cambio, ya integrado en SGLang v0.5.10, aumentó el throughput de solicitudes de 22.2 a 25.7 req/s (un 16.2%

09 May 2026

SysMoBench: nuevo benchmark para verificar si los LLM pueden modelar sistemas reales

Un equipo de investigadores desarrolló SysMoBench, un benchmark automatizado para evaluar si los modelos de lenguaje de gran escala (LLMs) pueden modelar sistemas informáticos reales o simplemente recitan especificaciones de protocolos de manuales académicos. El sistema evalúa once sistemas distribu

27 Apr 2026

LLMs en vuelo: Ingeniero prueba IA sin conexión

Este artículo describe un experimento realizado por Dmitri Lerko, un ingeniero, durante un vuelo de 10 horas de Londres a Las Vegas, utilizando un MacBook Pro M5 Max para ejecutar modelos de lenguaje grandes (LLMs) localmente sin conexión a internet. El objetivo era evaluar la viabilidad de realizar

27 Apr 2026

Claude Code: Usuarios ahorran un 90% con código abierto

Usuarios de Claude, el modelo de lenguaje de Anthropic, están reduciendo significativamente sus costos al integrar Claude Code con Ollama, una plataforma de código abierto, según un tutorial publicado en GitHub por Coherence-Daddy. La técnica permite ejecutar tareas intensivas de programación, como

25 Apr 2026

IA recuerda: Stash crea memoria persistente para agentes

Stash, una nueva capa de memoria persistente para agentes de IA, ha sido presentada por Mohamed Al-Ashaal. La herramienta busca resolver el problema de que los agentes de IA, como ChatGPT y Claude, no retienen información entre sesiones, obligando a los usuarios a repetir constantemente la misma inf

16 Apr 2026

Modelo local supera a Claude Opus en generación de imágenes

Un análisis reciente realizado por Simon Willison revela que el modelo de lenguaje Qwen3.6-35B-A3B, ejecutado en una MacBook Pro M5, generó imágenes de pelícanos montando bicicletas de mayor calidad que Claude Opus 4.7, el modelo más reciente de Anthropic. Este hallazgo, publicado el 16 de abril de

16 Apr 2026

macOS: IA controla tu ordenador con 'Agent'

Un desarrollador ha lanzado 'Agent!', una innovadora aplicación nativa para macOS que permite a los usuarios controlar completamente sus Macs utilizando 17 modelos de lenguaje de IA (LLM). La aplicación, disponible en GitHub, integra Apple Intelligence de forma local, automatizando tareas complejas

05 Apr 2026

IA tropieza con Lisp: Ingeniero crea herramienta para ayudar

Un ingeniero de DevOps ha descubierto una dificultad inesperada al utilizar herramientas de IA para programar en Lisp. A pesar de su preferencia personal por Lisp, la IA, específicamente Claude, tuvo serias dificultades para interactuar con el REPL (Read-Eval-Print Loop), un entorno de desarrollo in

04 Apr 2026

LLMs generan mejor código con técnica de 'auto-enseñanza'

El artículo "Embarrassingly Simple Self-Distillation Improves Code Generation" presenta una técnica sorprendentemente sencilla para mejorar la capacidad de los grandes modelos de lenguaje (LLMs) para generar código. En esencia, la técnica, llamada Self-Distillation Simple (SSD), permite que un LLM s

04 Apr 2026

TQ4_1S: LLMs más pequeños para dispositivos Apple

Un desarrollador ha presentado una nueva técnica de compresión de modelos de lenguaje grandes (LLM) llamada TQ4_1S, diseñada específicamente para dispositivos Apple con chips Metal. Esta técnica reduce el tamaño de los modelos en un 27-38%, dependiendo del modelo, sin necesidad de reentrenamiento ni

31 Mar 2026

Mr. Chatterbox: IA con sabor victoriano

Trip Venturella ha lanzado "Mr. Chatterbox", un modelo de lenguaje único que se entrena exclusivamente con textos de dominio público de la Biblioteca Británica, datados entre 1837 y 1899. Este enfoque elimina cualquier dato de entrenamiento posterior a 1899, creando un modelo con una perspectiva y v

04 Mar 2026

Qwen: Renuncia clave investigador de modelo de Alibaba

Un importante movimiento ha sacudido al equipo de desarrollo de Qwen, una familia de modelos de lenguaje de código abierto de Alibaba. El 4 de marzo de 2026, Junyang Lin, el investigador principal y figura clave detrás de la liberación de los modelos Qwen desde 2024, anunció su inesperada renuncia a

28 Feb 2026

agenticSeek: IA privada que funciona en tu dispositivo

Un nuevo asistente de IA de código abierto llamado agenticSeek ha sido lanzado en GitHub, ofreciendo una alternativa centrada en la privacidad a las soluciones basadas en la nube como Manus AI. Este asistente funciona completamente en el dispositivo del usuario, sin necesidad de conexión a internet

25 Feb 2026

IA india 'Indus': ¿soberanía o misterio?

La startup india Sarvam AI ha generado controversia tras recibir una importante financiación pública (10.000 crore de rupias en un fondo nacional) y lanzar su modelo de IA 'Indus', con 105 mil millones de parámetros, que supuestamente supera a modelos más grandes como Gemini Flash. Si bien la empres

15 Feb 2026

Hugging Face acelera LLMs con 'continuous batching'

Hugging Face ha publicado un artículo técnico explicando 'continuous batching', una técnica para acelerar la respuesta de los modelos de lenguaje grandes (LLMs) como Qwen y Claude. El problema actual es que los LLMs, al generar texto, procesan la solicitud completa y luego añaden tokens uno por uno,

15 Feb 2026

IA en el Navegador: Ejecuta Modelos GGUF sin Nube

MDST ha lanzado una nueva herramienta que permite ejecutar modelos de lenguaje grandes (LLMs) en formato GGUF directamente en el navegador web, sin necesidad de depender de proveedores de la nube o configuraciones complejas. Esta innovación, impulsada por WebGPU, abre la puerta a un acceso más ampli

Noticias que mencionan Qwen