GGUF: el formato que unifica todos los componentes de modelos de lenguaje en un solo archivo
GGUF es el formato de archivo utilizado por llama.cpp para almacenar modelos de lenguaje. Su principal ventaja es que concatena en un único archivo todos los componentes necesarios: plantillas de chat, tokens especiales y configuración del muestreador. Las plantillas de chat usan el lenguaje Jinja2
