Mapeando el mundo de Shakespeare: Cuando la limpieza de datos roba el protagonismo

Fuentes: Mapping Shakespeare’s World: When Data Cleaning Steals the Show
Imagen generada por IA con el prompt: A watercolor-style antique map with teardrop markers, vintage compass, parchment texture, soft lighting, Shakespearean era atmosphere, no text or faces.
Imagen generada con IA

El autor relata la construcción de un mapa interactivo de todos los lugares mencionados en las obras de Shakespeare. Comenzando con una conversación con el Profesor Gavin Hollis sobre el uso de mapas por parte de Shakespeare y el término 'mapp'ry', el proyecto implicó descargar las obras completas de Project Gutenberg, utilizar spaCy NER con la ayuda de Claude para extraer 578 nombres de lugares candidatos, revisar y aprobar manualmente 288 lugares, geocodificarlos con la API de OpenCage y corregir manualmente las coordenadas de lugares antiguos o mitológicos. Extraer citas con referencias a la obra y la escena resultó desafiante debido a superposiciones con nombres de personajes y acotaciones escénicas, lo que finalmente arrojó 2.685 citas y 153 escenarios en 288 lugares y 38 obras. El mapa, construido con MapLibre, utilizó los mosaicos Watercolour de Stamen para darle una sensación shakesperiana, con una opción en blanco y negro. El autor inicialmente intentó utilizar un símbolo de pluma como marcador, pero se enfrentó a problemas técnicos y cambió a un símbolo de lágrima. Los fallos en los datos requirieron una combinación de scripts de Python (cortesía de Claude) y correcciones manuales, incluyendo un error humorístico donde 'Maidenhead' fue marcado como un lugar, pero en realidad se refería a la virginidad. El mapa final permite buscar por lugar u obra y filtra las ubicaciones en consecuencia.