Estudio revela que elprompt de GeoGuessr para o3 no mejora resultados básicos

Fuentes: The famous o3 "GeoGuessr" prompt did not work
Estudio revela que elprompt de GeoGuessr para o3 no mejora resultados básicos
Imagen generada con IA

El investigador Sean Goedecke ha demostrado mediante una evaluación comparativa que el famoso prompt de GeoGuessr, diseñado para mejorar la capacidad del modelo o3 de OpenAI para localizar geográficamente fotografías, no ofrece resultados significativamente mejores que un prompt básico. En abril de 2024, Kelsey Piper descubrió que o3 podía identificar la ubicación exacta de fotos apenas descriptivas, comparándose con los mejores jugadores humanos de GeoGuessr. Tras analizar 200 imágenes de Wikimedia Commons, Geograph e iNaturalist, los resultados revelaron que el prompt básico obtuvo una mediana de 83,2 km de error, mientras que el prompt avanzada registró 102,3 km. Ambas funcionan bien, pero el prompt elaborada no aportó mejoras sustanciales. El experimento también reveló que los modelos GPT-5.4 y GPT-5.5 no han heredado esta habilidad de geolocalización de o3. Goedecke advierte que es fácil autoconvencerse sobre la efectividad de un prompt cuando el modelo ya es competente en la tarea base.