Un error inesperado en el pipeline de datos de Shopify, causado por el nombre oficial del país de Moldavia, ha interrumpido temporalmente la replicación de datos a su sistema de análisis. El problema surgió porque el nombre completo de Moldavia, “Moldova, Republic of”, contenía una coma, que al ser replicado a través de DMS (Data Migration Service) a Redshift, generó un error al no estar los valores de campo correctamente delimitados, provocando que Redshift interpretara un número incorrecto de columnas. La solución inicial, renombrar el registro en la base de datos de origen, resultó ser temporal. La solución implementada fue sanitizar el nombre a través de un trabajo de sincronización, reemplazando la coma por un guión. Se exploran soluciones más robustas como cambiar el delimitador de CSV o migrar a un formato de archivo como Parquet para evitar futuros problemas. El incidente destaca la importancia de validar y limpiar los datos externos en el punto de ingestión para evitar errores en etapas posteriores del proceso, y la necesidad de un enfoque de limpieza de datos en múltiples capas.
