OpenAI ha presentado este martes ChatGPT Images 2.0, un nuevo modelo de generación de imágenes que soluciona la principal limitación de sus predecesores: la representación precisa de texto. El sistema es capaz de plasmar desde etiquetas breves hasta bloques densos de prosa sin errores tipográficos, e incluso de generar capturas de pantalla indistinguibles de las producidas en un ordenador real. La compañía lo describe como un salto cualitativo respecto a GPT-Image-1.5, lanzado hace apenas cuatro meses.
Durante las últimas semanas, el modelo circuló de forma anónima en la plataforma LM Arena bajo el alias "duct tape", donde varios usuarios destacaron su capacidad para reproducir portadas de revista e interfaces de aplicaciones completas. OpenAI presume de que puede diseñar revistas, infografías, mapas, secuencias de manga o carteles publicitarios listos para imprimir, con resolución de hasta 2K y múltiples relaciones de aspecto. Una sola instrucción permite obtener hasta ocho imágenes manteniendo la coherencia de personajes y objetos, lo que facilita la creación de storyboards, cómics o campañas gráficas completas.
El modelo se ofrece en dos versiones: Instant, para usos rápidos, y Thinking, reservada a suscriptores de pago, que razona antes de generar, verifica el resultado y puede consultar la web para incorporar datos actualizados. Esta última función, aunque más lenta, permite producir infografías con cifras recientes o logotipos correctos. Images 2.0 también mejora el soporte de alfabetos no latinos como japonés, coreano, hindi, bengalí y chino. Está disponible desde este martes para todos los usuarios de ChatGPT y a través de la API para desarrolladores, con precios variables según resolución y calidad.
