Noticias que mencionan Qwen

Nueva herramienta encuentra el mejor LLM para tu hardware

El desarrollador Andyyyy64 ha publicado en GitHub la herramienta 'whichllm', diseñada para ayudar a los usuarios a encontrar el modelo de lenguaje grande (LLM) más adecuado para su hardware específico. La aplicación detecta automáticamente las características del sistema (GPU, CPU, RAM) y ordena los

LLMs en vuelo: Ingeniero prueba IA sin conexión

Este artículo describe un experimento realizado por Dmitri Lerko, un ingeniero, durante un vuelo de 10 horas de Londres a Las Vegas, utilizando un MacBook Pro M5 Max para ejecutar modelos de lenguaje grandes (LLMs) localmente sin conexión a internet. El objetivo era evaluar la viabilidad de realizar

Claude Code: Usuarios ahorran un 90% con código abierto

Usuarios de Claude, el modelo de lenguaje de Anthropic, están reduciendo significativamente sus costos al integrar Claude Code con Ollama, una plataforma de código abierto, según un tutorial publicado en GitHub por Coherence-Daddy. La técnica permite ejecutar tareas intensivas de programación, como

IA recuerda: Stash crea memoria persistente para agentes

Stash, una nueva capa de memoria persistente para agentes de IA, ha sido presentada por Mohamed Al-Ashaal. La herramienta busca resolver el problema de que los agentes de IA, como ChatGPT y Claude, no retienen información entre sesiones, obligando a los usuarios a repetir constantemente la misma inf

Modelo local supera a Claude Opus en generación de imágenes

Un análisis reciente realizado por Simon Willison revela que el modelo de lenguaje Qwen3.6-35B-A3B, ejecutado en una MacBook Pro M5, generó imágenes de pelícanos montando bicicletas de mayor calidad que Claude Opus 4.7, el modelo más reciente de Anthropic. Este hallazgo, publicado el 16 de abril de

macOS: IA controla tu ordenador con 'Agent'

Un desarrollador ha lanzado 'Agent!', una innovadora aplicación nativa para macOS que permite a los usuarios controlar completamente sus Macs utilizando 17 modelos de lenguaje de IA (LLM). La aplicación, disponible en GitHub, integra Apple Intelligence de forma local, automatizando tareas complejas

IA tropieza con Lisp: Ingeniero crea herramienta para ayudar

Un ingeniero de DevOps ha descubierto una dificultad inesperada al utilizar herramientas de IA para programar en Lisp. A pesar de su preferencia personal por Lisp, la IA, específicamente Claude, tuvo serias dificultades para interactuar con el REPL (Read-Eval-Print Loop), un entorno de desarrollo in

LLMs generan mejor código con técnica de 'auto-enseñanza'

El artículo "Embarrassingly Simple Self-Distillation Improves Code Generation" presenta una técnica sorprendentemente sencilla para mejorar la capacidad de los grandes modelos de lenguaje (LLMs) para generar código. En esencia, la técnica, llamada Self-Distillation Simple (SSD), permite que un LLM s

TQ4_1S: LLMs más pequeños para dispositivos Apple

Un desarrollador ha presentado una nueva técnica de compresión de modelos de lenguaje grandes (LLM) llamada TQ4_1S, diseñada específicamente para dispositivos Apple con chips Metal. Esta técnica reduce el tamaño de los modelos en un 27-38%, dependiendo del modelo, sin necesidad de reentrenamiento ni

Mr. Chatterbox: IA con sabor victoriano

Trip Venturella ha lanzado "Mr. Chatterbox", un modelo de lenguaje único que se entrena exclusivamente con textos de dominio público de la Biblioteca Británica, datados entre 1837 y 1899. Este enfoque elimina cualquier dato de entrenamiento posterior a 1899, creando un modelo con una perspectiva y v

Qwen: Renuncia clave investigador de modelo de Alibaba

Un importante movimiento ha sacudido al equipo de desarrollo de Qwen, una familia de modelos de lenguaje de código abierto de Alibaba. El 4 de marzo de 2026, Junyang Lin, el investigador principal y figura clave detrás de la liberación de los modelos Qwen desde 2024, anunció su inesperada renuncia a

agenticSeek: IA privada que funciona en tu dispositivo

Un nuevo asistente de IA de código abierto llamado agenticSeek ha sido lanzado en GitHub, ofreciendo una alternativa centrada en la privacidad a las soluciones basadas en la nube como Manus AI. Este asistente funciona completamente en el dispositivo del usuario, sin necesidad de conexión a internet

IA india 'Indus': ¿soberanía o misterio?

La startup india Sarvam AI ha generado controversia tras recibir una importante financiación pública (10.000 crore de rupias en un fondo nacional) y lanzar su modelo de IA 'Indus', con 105 mil millones de parámetros, que supuestamente supera a modelos más grandes como Gemini Flash. Si bien la empres

Hugging Face acelera LLMs con 'continuous batching'

Hugging Face ha publicado un artículo técnico explicando 'continuous batching', una técnica para acelerar la respuesta de los modelos de lenguaje grandes (LLMs) como Qwen y Claude. El problema actual es que los LLMs, al generar texto, procesan la solicitud completa y luego añaden tokens uno por uno,

IA en el Navegador: Ejecuta Modelos GGUF sin Nube

MDST ha lanzado una nueva herramienta que permite ejecutar modelos de lenguaje grandes (LLMs) en formato GGUF directamente en el navegador web, sin necesidad de depender de proveedores de la nube o configuraciones complejas. Esta innovación, impulsada por WebGPU, abre la puerta a un acceso más ampli