Un equipo de ingenieros, liderado por Antirez, ha lanzado DeepSeek v4 Flash, un nuevo motor de inferencia optimizado para el modelo de lenguaje DeepSeek V4 Flash. Este motor, denominado 'ds4.c', está diseñado específicamente para este modelo y no es un framework genérico. La principal ventaja radica en su velocidad, gracias a la reducción de parámetros activos, y en la eficiencia de su 'modo de pensamiento', que genera secciones de reflexión significativamente más cortas que otros modelos, permitiendo su uso incluso en condiciones exigentes. El modelo en sí destaca por su ventana de contexto de 1 millón de tokens, su capacidad para acceder a información especializada y su excelente calidad en la generación de texto en inglés e italiano. Además, utiliza una técnica innovadora de compresión de caché KV que permite la inferencia en hardware con recursos limitados, como MacBooks, e incluso la persistencia en disco. El proyecto, desarrollado con asistencia de GPT 5.5, se centra en ofrecer una experiencia de inferencia local completa y reproducible, aunque actualmente se encuentra en fase alfa y es compatible únicamente con Metal. El equipo subraya la importancia de la colaboración con proyectos como llama.cpp y GGML, y anticipa futuras mejoras en el modelo DeepSeek v4 Flash.
