IA genera texto legible en imágenes: nuevo método

Fuentes: New Technique Improves Text Accuracy in AI-Generated Images

Un investigador ha desarrollado una nueva técnica para mejorar la precisión de texto y números en imágenes generadas por inteligencia artificial. El método, descrito por Sam Collins en su blog, permite generar imágenes con texto legible y numérico, algo que los modelos de IA actuales, como Gemini, suelen fallar. La técnica consiste en un proceso de dos capas: primero, se crea un 'dibujo base' determinista (como un SVG o imagen generada por código) que define la posición y orientación del texto y números. Segundo, este dibujo base se utiliza como entrada, junto con una descripción textual, en un modelo de IA multimodal como Gemini 3.0 Pro para generar la imagen final. Collins afirma que el proceso no es complejo y que herramientas como Claude Code o Codex pueden automatizar cada paso. Aunque el resultado no es perfecto en todas las ocasiones, esta técnica representa un avance significativo en la capacidad de los modelos de IA para generar imágenes con texto preciso y coherente, abriendo nuevas posibilidades para la creación de contenido visual.