Noticias que mencionan Ollama

PMB: memoria local persistente para agentes de programación con IA

PMB es una herramienta de código abierto que dota de memoria persistente a los agentes de programación basados en modelos de lenguaje. Toda la información —decisiones técnicas, lecciones aprendidas y datos del proyecto— se almacena en un único archivo SQLite en el disco del usuario, junto a un índic

RubyLLM: un framework Ruby único para integrar múltiples proveedores de IA

RubyLLM es un framework de código abierto en Ruby que unifica el acceso a los principales proveedores de inteligencia artificial bajo una única interfaz. Su premisa es resolver la fragmentación existente: cada proveedor —OpenAI, Anthropic, Google, Mistral, xAI, DeepSeek, Ollama u OpenRouter, entre o

Cómo instalar y usar modelos de IA locales en tu PC con Windows

Ejecutar modelos de inteligencia artificial en el propio ordenador, sin depender de la nube ni de suscripciones, es una realidad accesible en 2026. Este vídeo-tutorial de Heise explica paso a paso cómo poner en marcha modelos de lenguaje y de generación de imagen en un PC con Windows, compatible tan

Una sola operación acapara la explotación de CVE-2026-4020 en WordPress

HoneyLabs atribuye a un único operador la mayor parte de los ataques registrados contra la vulnerabilidad CVE-2026-4020, un fallo de divulgación de información en el plugin Gravity SMTP para WordPress que devuelve credenciales SMTP, claves de SendGrid y Mailgun y tokens DKIM sin autenticación. De la

Ejecutar Claude Code sin conexión: ajustes y hardware

Claude Code, la herramienta de codificación asistida por inteligencia artificial de Anthropic, puede ejecutarse en un entorno completamente local y aislado (air-gapped) sin necesidad de conexión a internet. El artículo describe la configuración necesaria para lograrlo, utilizando un modelo local com

Google lanza versiones QAT de Gemma 4 para móviles y portátiles

Google ha presentado nuevos checkpoints de Gemma 4 optimizados con Quantization-Aware Training (QAT), una técnica que integra la cuantización durante el entrenamiento para reducir la pérdida de calidad al comprimir los modelos. La novedad permite ejecutar Gemma 4 en dispositivos móviles y GPUs de co

Open-LLM-VTuber: un asistente de voz con avatar Live2D que funciona en local

Open-LLM-VTuber es un compañero de inteligencia artificial con interacción por voz y un avatar Live2D animado, diseñado para funcionar de forma totalmente local en Windows, macOS y Linux. El proyecto nació con el objetivo de replicar mediante soluciones de código abierto la experiencia de la VTuber

Ajuste fino de un LLM para escribir documentación al estilo de 1995

El autor detalla un experimento personal de ajuste fino (fine-tuning) de un modelo de lenguaje para que genere documentación técnica al estilo de los años 80 y 90. La motivación es explorar la predicción de que los redactores técnicos del futuro trabajarán con modelos locales especializados, en luga

HPPIE: un RAG clínico que modela al paciente antes de recuperar documentos

HPPIE (Hyper-Personalized Patient Insights Engine) es una arquitectura de RAG clínico que incorpora el modelado de persona del paciente en la fase de recuperación, en lugar de relegarlo a un filtrado posterior. El proyecto fue desarrollado en una Global AI Hackathon, donde obtuvo el segundo puesto d

mnemo: capa de memoria IA local con grafo de conocimiento persistente

mnemo es una capa de memoria local diseñada para dotar a los modelos de lenguaje de gran tamaño (LLM) de memoria persistente sin depender de servicios en la nube. Funciona como un servicio "sidecar" que observa cada conversación, extrae entidades nombradas y relaciones mediante un LLM, construye un

Cómo ejecutar Gemma 4 en un Xeon de 2016 sin GPU

## Cómo ejecutar Gemma 4 en un Xeon de 2016 sin GPU: la hazaña técnica que desafía el 'memory wall' Un experimento publicado en el blog técnico point.free demuestra que es posible ejecutar un modelo de inteligencia artificial de última generación, concretamente Gemma 4 en su versión 26B con arquite

Odiseo: un espacio de trabajo autogestionado con inteligencia artificial

Odiseo (Odysseus) es un proyecto de software que ofrece un espacio de trabajo autogestionado con inteligencia artificial, diseñado para ejecutarse en el propio hardware del usuario y priorizar la privacidad. Su objetivo es replicar la experiencia de interfaz de ChatGPT o Claude, pero de forma local

Herramienta de IA de código abierto crea vídeos cortos en HD

MoneyPrinterTurbo es una herramienta de código abierto que integra grandes modelos de lenguaje (LLM) para generar vídeos cortos de alta definición de forma automatizada. Su arquitectura sigue el patrón MVC, lo que facilita su mantenimiento y escalabilidad, y ofrece tanto una interfaz web como una AP