16 May 2026 · Original en inglés · Resumen IA

Nuevo modelo open source permite controlar respuestas de IA sin cambiar prompts

Fuentes: DeepSeek-V4-Flash enables new LLM steering techniques

DeepSeek-V4-Flash es un modelo de lenguaje de código abierto que permite por primera vez aplicar técnicas de steering (direccionamiento) de forma práctica para muchos ingenieros. El steering consiste en manipular directamente las activaciones internas del modelo durante la inferencia para guiar sus salidas sin necesidad de modificar los prompts. El desarrollador antirez ha creado DwarfStar 4, una versión reducida de llama.cpp optimizada exclusivamente para este modelo, que incluye funcionalidad de steering como característica nativa. La técnica funciona extrayendo un concepto del estado interno del modelo (como responder de forma concisa) y fortaleciendo las activaciones numéricas que lo representan. Anteriormente, el steering estaba fuera del alcance de usuarios regulares que acceden a LLMs mediante APIs, también los grandes laboratorios como Anthropic preferían entrenar directamente sus modelos en lugar de manipular activaciones mid-flight. Ahora, la comunidad open-source puede experimentar con esta técnica por primera vez, todo gracias a que DeepSeek-V4-Flash ofrece un rendimiento competitivo con el extremo inferior de los modelos frontier para codificación agentiva.

Temas

Etiquetas

deepseek deepseek-v4-flash dwarfstar 4 llama.cpp steering modelos de lenguaje inteligencia artificial código abierto antirez

Entidades mencionadas

Oliver Sacks person

Oliver Wolf Sacks, comendador de la Orden del Imperio Británico, citado como Oliver Sacks, fue un neurólogo y escritor británico de origen judío, aficionado a la química y divulgador de la ciencia, so

Ver en Wikipedia

Golden Gate Claude creative_work

DwarfStar 4 software

steering software

sparse autoencoders software

4o-era group_movement

ggml-org location

Gumlog es un lugar designado por el censo ubicado en el condado de Franklin en el estado estadounidense de Georgia. En el censo de 2000, su población era de 2.025.

Ver en Wikipedia

transformer-circuits.pub organization

A surprising fact about modern large language models is that nobody really knows how they work internally. The Interpretability team strives to change that — to understand these models to better plan

GPT-5.5 software

deepseek-v4-flash software

Claude Code software

Claude Monet fue un pintor francés, uno de los creadores del impresionismo. El término impresionismo deriva del título de su obra Impresión, sol naciente (1872).

antirez person

El antisemitismo, en el sentido amplio del término, hace referencia a la discriminación, hostilidad, prejuicio y odio hacia los judíos en sentido amplio, basada en una combinación de prejuicios de tip

Ver en Wikipedia

Anthropic organization

Anthropic es una empresa estadounidense de investigación en IA fundada por exmiembros de OpenAI. La noticia cuestiona las afirmaciones de Anthropic sobre la capacidad de sus modelos para reparar vulne

Ver en Wikipedia

ChatGPT software

ChatGPT es un chatbot de inteligencia artificial desarrollado por OpenAI, y es un ejemplo clave de la tecnología que está desafiando las nociones tradicionales de la 'ventaja humana'. Su capacidad par

Ver en Wikipedia

llama.cpp software

Se llama copla es un concurso musical dedicado a la interpretación de copla emitido en Andalucía (España) por Canal Sur Televisión, y en el resto de España y el extranjero por otras plataformas a trav

Ver en Wikipedia

OpenAI organization

OpenAI, LLC es una empresa estadounidense de investigación y despliegue de inteligencia artificial fundada en 2015 e, inicialmente, sin ánimo de lucro. Su misión original era asegurar que la inteligen

Ver en Wikipedia

Enlaces

Golden Gate Claude www.anthropic.com

DwarfStar 4 github.com

llama.cpp github.com

steering github.com

eight days ago github.com

tried it myself github.com