Ollama

01 Jul 2026

PMB: memoria local persistente para agentes de programación con IA

PMB es una herramienta de código abierto que dota de memoria persistente a los agentes de programación basados en modelos de lenguaje. Toda la información —decisiones técnicas, lecciones aprendidas y datos del proyecto— se almacena en un único archivo SQLite en el disco del usuario, junto a un índic

24 Jun 2026

peerd: un agente de IA que vive en el navegador y comparte sus creaciones entre pares

peerd es una extensión para Chrome y Firefox que ejecuta un bucle completo de agente de inteligencia artificial dentro del propio navegador, sin servidor intermedio ni telemetría. La herramienta utiliza el navegador como runtime, hipervisor y modelo de seguridad: aprovecha los aislados de V8 para el

24 Jun 2026

RubyLLM: un framework Ruby único para integrar múltiples proveedores de IA

RubyLLM es un framework de código abierto en Ruby que unifica el acceso a los principales proveedores de inteligencia artificial bajo una única interfaz. Su premisa es resolver la fragmentación existente: cada proveedor —OpenAI, Anthropic, Google, Mistral, xAI, DeepSeek, Ollama u OpenRouter, entre o

23 Jun 2026

Cómo instalar y usar modelos de IA locales en tu PC con Windows

Ejecutar modelos de inteligencia artificial en el propio ordenador, sin depender de la nube ni de suscripciones, es una realidad accesible en 2026. Este vídeo-tutorial de Heise explica paso a paso cómo poner en marcha modelos de lenguaje y de generación de imagen en un PC con Windows, compatible tan

21 Jun 2026

Dos modelos Qwen3 en un único DGX Spark: la aritmética de la residencia para LLM locales

Ejecutar dos modelos de lenguaje grandes de forma coresidente en una sola GPU exige un cálculo de memoria preciso, algo que el parámetro gpu_memory_utilization de vLLM no resuelve por sí solo. Este artículo recoge la experiencia práctica de desplegar Qwen3-Next-80B-Instruct-FP8 y Qwen3-4B-Instruct-2

17 Jun 2026

Una sola operación acapara la explotación de CVE-2026-4020 en WordPress

HoneyLabs atribuye a un único operador la mayor parte de los ataques registrados contra la vulnerabilidad CVE-2026-4020, un fallo de divulgación de información en el plugin Gravity SMTP para WordPress que devuelve credenciales SMTP, claves de SendGrid y Mailgun y tokens DKIM sin autenticación. De la

11 Jun 2026

Ejecutar Claude Code sin conexión: ajustes y hardware

Claude Code, la herramienta de codificación asistida por inteligencia artificial de Anthropic, puede ejecutarse en un entorno completamente local y aislado (air-gapped) sin necesidad de conexión a internet. El artículo describe la configuración necesaria para lograrlo, utilizando un modelo local com

08 Jun 2026

Open Notebook: alternativa de código abierto a Notebook LM con 18 proveedores de IA

Open Notebook es una aplicación de código abierto y autoalojada que replica y amplía las funcionalidades de Google Notebook LM, la herramienta de investigación basada en inteligencia artificial que Google presentó en 2023. Desarrollada por lfnovo en GitHub, la plataforma permite a investigadores, pe

05 Jun 2026

Google lanza versiones QAT de Gemma 4 para móviles y portátiles

Google ha presentado nuevos checkpoints de Gemma 4 optimizados con Quantization-Aware Training (QAT), una técnica que integra la cuantización durante el entrenamiento para reducir la pérdida de calidad al comprimir los modelos. La novedad permite ejecutar Gemma 4 en dispositivos móviles y GPUs de co

05 Jun 2026

Open-LLM-VTuber: un asistente de voz con avatar Live2D que funciona en local

Open-LLM-VTuber es un compañero de inteligencia artificial con interacción por voz y un avatar Live2D animado, diseñado para funcionar de forma totalmente local en Windows, macOS y Linux. El proyecto nació con el objetivo de replicar mediante soluciones de código abierto la experiencia de la VTuber

05 Jun 2026

Ajuste fino de un LLM para escribir documentación al estilo de 1995

El autor detalla un experimento personal de ajuste fino (fine-tuning) de un modelo de lenguaje para que genere documentación técnica al estilo de los años 80 y 90. La motivación es explorar la predicción de que los redactores técnicos del futuro trabajarán con modelos locales especializados, en luga

05 Jun 2026

HPPIE: un RAG clínico que modela al paciente antes de recuperar documentos

HPPIE (Hyper-Personalized Patient Insights Engine) es una arquitectura de RAG clínico que incorpora el modelado de persona del paciente en la fase de recuperación, en lugar de relegarlo a un filtrado posterior. El proyecto fue desarrollado en una Global AI Hackathon, donde obtuvo el segundo puesto d

03 Jun 2026

mnemo, una capa de memoria local para cualquier LLM con grafo de conocimiento persistente

mnemo es una capa de memoria local diseñada para dotar a los modelos de lenguaje grandes (LLM) de memoria persistente entre conversaciones. Su premisa es resolver una limitación habitual de los chatbots y asistentes basados en LLM: el olvido total del contexto cuando termina una sesión. La herramien

03 Jun 2026

mnemo: capa de memoria IA local con grafo de conocimiento persistente

mnemo es una capa de memoria local diseñada para dotar a los modelos de lenguaje de gran tamaño (LLM) de memoria persistente sin depender de servicios en la nube. Funciona como un servicio "sidecar" que observa cada conversación, extrae entidades nombradas y relaciones mediante un LLM, construye un

03 Jun 2026

Google presenta Gemma 4 12B, un modelo multimodal unificado que se ejecuta en portátiles

Google presenta Gemma 4 12B, un modelo multimodal unificado que se ejecuta en portátiles Google ha presentado Gemma 4 12B, un nuevo modelo de inteligencia artificial de código abierto que destaca por su arquitectura multimodal unificada y por su capacidad de ejecutarse en portátiles convencionales

01 Jun 2026

Cómo ejecutar Gemma 4 en un Xeon de 2016 sin GPU

## Cómo ejecutar Gemma 4 en un Xeon de 2016 sin GPU: la hazaña técnica que desafía el 'memory wall' Un experimento publicado en el blog técnico point.free demuestra que es posible ejecutar un modelo de inteligencia artificial de última generación, concretamente Gemma 4 en su versión 26B con arquite

31 May 2026

Odiseo: un espacio de trabajo autogestionado con inteligencia artificial

Odiseo (Odysseus) es un proyecto de software que ofrece un espacio de trabajo autogestionado con inteligencia artificial, diseñado para ejecutarse en el propio hardware del usuario y priorizar la privacidad. Su objetivo es replicar la experiencia de interfaz de ChatGPT o Claude, pero de forma local

31 May 2026

Herramienta de IA de código abierto crea vídeos cortos en HD

MoneyPrinterTurbo es una herramienta de código abierto que integra grandes modelos de lenguaje (LLM) para generar vídeos cortos de alta definición de forma automatizada. Su arquitectura sigue el patrón MVC, lo que facilita su mantenimiento y escalabilidad, y ofrece tanto una interfaz web como una AP

Noticias que mencionan Ollama