GPT2-BASIC es un runtime de transformer y asistente local implementado en BASIC para máquinas de clase DOS, compilado con FreeBASIC y verificado en QEMU. No es un frontend web ni un envoltorio de API: carga artefactos de modelo desde disco, ejecuta inferencia tipo GPT con aritmética entera de punto fijo Q20.12 y permite cambiar en caliente paquetes de asistente y bases de conocimiento indexadas, todo sin acceso a red.
El proyecto parte de una premisa concreta: la inferencia de modelos de lenguaje y un asistente local útil son algoritmos portables. Con la cuantización, el diseño de tokenizador y los índices de recuperación adecuados, las mismas ideas centrales pueden ejecutarse muy por debajo del suelo hardware habitual de los LLM modernos.
El binario de producción, GPT2.EXE, ocupa 309.760 bytes y maneja un checkpoint de 463.168 parámetros (2 capas, 48 dimensiones, 4 cabezas, contexto 192) con tokenizer de lexicon de 4096 tokens. La suite de 10 prompts alcanza 10/10 tanto en host como en evidencia DOS, con calidad media de 0,968 y 0,969 respectivamente. El runtime ofrece decodificación greedy determinista para validación y muestreo temperature/top-k/top-p de punto fijo para uso interactivo, además de trazas DOS legibles por máquina y registros de temporización PERF_*.
El repositorio ofrece cuatro modos de release con compromisos distintos entre memoria y velocidad: residente completo (2.055.940 B, 2,46 tok/s en QEMU 486DX2/66), shortlist de cabeza de salida (2.064.148 B, 3,35 tok/s), token+head cuantizados q4 (974.724 B, 2,12 tok/s) y streaming de cabeza q4 (616.324 B, 0,81 tok/s). Cada modo supera pruebas de paridad vectorial DOS y de calidad fija en host. Se incluyen bundles para DOSBox, QEMU, transferencia a hardware físico y kit de lanzamiento, junto con módulos de laboratorio (matrices, block-sparse, benchmarks sintéticos) que ya no se compilan en el binario de producción.
El proyecto se dirige a desarrolladores de sistemas con recursos limitados, profesionales de IA que buscan un runtime de transformer legible e inspeccionable, y constructores de sistemas embebidos o heredados que necesitan un asistente funcional, no un puerto conceptual.
