Ejecutar LLMs en Mac con chip M5 vs OpenRouter: análisis de costos

Este artículo analiza la viabilidad económica de ejecutar modelos de lenguaje grandes (LLM) de manera local en un MacBook Pro con chip M5, comparándolo con servicios de inferencia en la nube como OpenRouter. El autor realiza un desglose detallado considerando tres factores principales: electricidad,

Claude Code: Usuarios ahorran un 90% con código abierto

Usuarios de Claude, el modelo de lenguaje de Anthropic, están reduciendo significativamente sus costos al integrar Claude Code con Ollama, una plataforma de código abierto, según un tutorial publicado en GitHub por Coherence-Daddy. La técnica permite ejecutar tareas intensivas de programación, como

Gemma: IA crea diagramas en Chrome con WebGPU

Un equipo de desarrolladores ha presentado Gemma LLM, un modelo de lenguaje capaz de generar diagramas directamente en el navegador Chrome utilizando WebGPU. La demostración, disponible para Chrome versión 134 o superior, permite a los usuarios describir un diagrama y que Gemma lo cree como un dibuj

LLMs de código abierto: incompatibilidad dificulta su uso

El uso de modelos de lenguaje grandes (LLM) de código abierto se enfrenta a un desafío significativo: la incompatibilidad en los formatos de llamada de herramientas. Mientras que los modelos cerrados como los de OpenAI ofrecen una integración fluida, los modelos de código abierto requieren que los d

IA multimodal en Mac: nueva herramienta facilita el ajuste

Un nuevo toolkit llamado 'gemma-tuner-multimodal' permite a los usuarios afinar modelos Gemma de Google para tareas de inteligencia artificial multimodal (texto, imágenes y audio) directamente en Macs con Apple Silicon. La herramienta, desarrollada por Mattmireles y disponible en GitHub, elimina la

Parlor: IA para MacBooks sin internet

Un desarrollador ha presentado "Parlor", una innovadora herramienta de inteligencia artificial que permite conversaciones de voz y visión en tiempo real directamente en MacBooks, sin necesidad de conexión a internet. El proyecto, cuyo código está disponible en GitHub, utiliza el modelo de lenguaje G

ia de Google corre en Chrome: extensión 'Gemma Gem'

Un desarrollador ha creado una extensión para el navegador Chrome llamada "Gemma Gem" que permite ejecutar el modelo de inteligencia artificial Gemma 4 de Google directamente en el dispositivo del usuario, sin necesidad de conexión a internet ni compartir datos con servidores externos. La extensión,

Google presenta TurboQuant: IA más rápida y eficiente

Investigadores de Google Research han anunciado TurboQuant, un nuevo algoritmo de compresión que promete mejorar significativamente la eficiencia de los modelos de lenguaje grandes y los sistemas de búsqueda vectorial. Presentado el 24 de marzo de 2026, TurboQuant aborda el problema del “overhead” d

Galería online compara arquitecturas de LLM

Un repositorio en línea, alojado en sebastianraschka.com, ha sido creado para rastrear y comparar las arquitecturas de los últimos modelos de lenguaje grandes (LLM). La “Galería de Arquitecturas LLM” recopila diagramas y hojas de datos de modelos como Llama 3 8B, DeepSeek V3, Gemma 3, Qwen3, Mistral

ia local: creando un asistente de código desde cero

Este artículo describe la construcción de un agente de codificación local basado en IA, un experimento para comprender los componentes básicos necesarios para crear un asistente de codificación conversacional que opere directamente en tu máquina, sin depender de servicios en la nube. El objetivo era

Heretic: herramienta elimina censura de IA automáticamente

Un nuevo conjunto de herramientas llamado Heretic está automatizando la eliminación de restricciones de seguridad (censura) de modelos de lenguaje basados en transformadores, sin necesidad de costosos procesos de reentrenamiento. Desarrollado por P-E-W y disponible en GitHub, Heretic combina técnica