DeepSeek-V4-Flash es un modelo de lenguaje de código abierto que permite por primera vez aplicar técnicas de steering (direccionamiento) de forma práctica para muchos ingenieros. El steering consiste en manipular directamente las activaciones internas del modelo durante la inferencia para guiar sus salidas sin necesidad de modificar los prompts. El desarrollador antirez ha creado DwarfStar 4, una versión reducida de llama.cpp optimizada exclusivamente para este modelo, que incluye funcionalidad de steering como característica nativa. La técnica funciona extrayendo un concepto del estado interno del modelo (como responder de forma concisa) y fortaleciendo las activaciones numéricas que lo representan. Anteriormente, el steering estaba fuera del alcance de usuarios regulares que acceden a LLMs mediante APIs, también los grandes laboratorios como Anthropic preferían entrenar directamente sus modelos en lugar de manipular activaciones mid-flight. Ahora, la comunidad open-source puede experimentar con esta técnica por primera vez, todo gracias a que DeepSeek-V4-Flash ofrece un rendimiento competitivo con el extremo inferior de los modelos frontier para codificación agentiva.
Nuevo modelo open source permite controlar respuestas de IA sin cambiar prompts
