VibeThinker-3B: razonamiento verificable en modelos pequeños de 3.000 millones de parámetros
Investigadores presentan VibeThinker-3B, un modelo denso de 3.000 millones de parámetros diseñado para explorar los límites del razonamiento verificable en modelos de lenguaje de tamaño reducido. El trabajo, publicado como informe técnico en arXiv, parte de la premisa de que las tareas de razonamien
