14 May 2026 · Original en inglés · Resumen IA

GGUF: el formato que unifica todos los componentes de modelos de lenguaje en un solo archivo

Fuentes: What's in a GGUF, besides the weights - and what's still missing? - NobodyWho

GGUF es el formato de archivo utilizado por llama.cpp para almacenar modelos de lenguaje. Su principal ventaja es que concatena en un único archivo todos los componentes necesarios: plantillas de chat, tokens especiales y configuración del muestreador. Las plantillas de chat usan el lenguaje Jinja2 para definir el formato conversacional, incluyendo soporte para llamadas a herramientas y contenido multimedia. Los tokens especiales incluyen marcas como para fin de secuencia y para inicio, así como delimitadores para turnos de conversación y llamadas a herramientas. La configuración del muestreador permite especificar la secuencia de pasos para seleccionar el siguiente token de la distribución de probabilidades. Una reciente adición al formato GGUF permite incluir esta configuración directamente en el archivo del modelo. Entre las funcionalidades aún pendientes está la definición de gramáticas para parsear diferentes formatos de llamadas a herramientas, lo que evitaría que cada motor de inferencia implemente sus propios parsers.

Temas

Etiquetas

gguf llama.cpp modelos de lenguaje inteligencia artificial jinja2 formato de archivo ggml-org huggingface ollama tokenización

Entidades mencionadas

Jinja2 software

GGUF software

Qwen/Qwen3.5-0.8B software

Gemma4 creative_work

LFM2 creative_work

gemma-4-E4B-it creative_work

NobodyWho group_movement

minijinja software

minja software

artefact2.github.io organization

Source code: libxm, libxm.js Click the bottom/top rows to mute channels/instruments. Not hearing any sound? Click the play/pause button on the top right. Looking for modules? Try The Mod Archive Or lo

ggml-org location

Gumlog es un lugar designado por el censo ubicado en el condado de Franklin en el estado estadounidense de Georgia. En el censo de 2000, su población era de 2.025.

Ver en Wikipedia

Ollama person

Ollanta Moisés Humala Tasso es un político y exmilitar peruano que se desempeñó como presidente de la República del Perú desde 2011 hasta 2016, tras ser candidato por la alianza electoral Gana Perú. E

Ver en Wikipedia

Google organization

Google es una empresa de tecnología multinacional con sede en California, conocida por sus servicios de búsqueda, publicidad en línea y, según el artículo, por sus comités de contratación que evalúan

Ver en Wikipedia

HuggingFace organization

Hugging Face, Inc. es una empresa franco-estadounidense que desarrolla herramientas para crear aplicaciones utilizando el aprendizaje automático. Es conocida por su biblioteca de transformadores cread

Ver en Wikipedia

Rust software

Rust es un lenguaje de programación compilado, de propósito general y multiparadigma que está siendo desarrollado por Fundación Rust. Es un lenguaje de programación multiparadigmático que soporta prog

Ver en Wikipedia

llama.cpp software

Se llama copla es un concurso musical dedicado a la interpretación de copla emitido en Andalucía (España) por Canal Sur Televisión, y en el resto de España y el extranjero por otras plataformas a trav

Ver en Wikipedia

Enlaces

llama.cpp github.com

a typical safetensors repo on huggingface huggingface.co

a typical ollama model ollama.com

chat template that ships with Gemma 4 huggingface.co

their own jinja implementation github.com

llama_chat_apply_template github.com

recent addition to the GGUF format github.com

upstream huggingface repos huggingface.co

the downstream GGUF conversions huggingface.co