Krea 2: un modelo fundacional para la exploración creativa en generación de imágenes

Fuentes: Krea 2 Technical Report

Krea 2 es una nueva familia de modelos fundacionales de generación de imágenes desarrollada por Krea con un objetivo explícitamente distinto al de la mayoría de sistemas actuales: en lugar de optimizar un único estilo predeterminado y pulido, busca ofrecer una herramienta de exploración creativa, capaz de abarcar múltiples estéticas, estados de ánimo y composiciones y, al mismo tiempo, permitir al usuario navegar entre ellas con control.

El informe técnico detalla la infraestructura de datos y el framework de entrenamiento distribuido construidos desde cero para crear un corpus de preentrenamiento con amplia cobertura de conocimiento del mundo y estilos. El entrenamiento sigue una canalización (pipeline) multi-fase que incluye preentrenamiento, midtraining, ajuste fino supervisado (SFT), optimización por preferencias y aprendizaje por refuerzo (RL).

En el plano arquitectónico, el modelo emplea un transformer de difusión (DiT) validado mediante ablaciones exhaustivas, junto con componentes como iREPA, VAEs mejorados y el codificador de visión-lenguaje Qwen3-VL. Incorpora, además, mejoras como atención agrupada por consultas (GQA), atención con puerta sigmoide, modulación ligera del timestep y agregación de características multicapa del codificador de texto.

Para reducir la brecha entre los condicionamientos aprendidos durante el entrenamiento y los prompts reales de los usuarios, el sistema integra dos herramientas: un expansor de prompts, entrenado con SFT y RL sobre LLMs de código abierto para enriquecer instrucciones breves sin sobrescribir la intención del usuario, y un sistema de referencia de estilo que permite inyectar la estética de una o varias imágenes con control granular sobre la intensidad y la mezcla.

En el Artificial Analysis leaderboard de texto a imagen, Krea 2 se sitúa entre los diez primeros modelos y en segundo lugar entre los desarrollados por laboratorios independientes, lo que lo convierte en una línea base competitiva además de experimental.