El auge del científico de datos, considerado en su momento como “el trabajo más sexy del siglo XXI”, está experimentando una redefinición debido a la proliferación de las APIs de modelos de lenguaje grandes (LLMs). La facilidad de integración de estos modelos, que antes requerían la intervención de científicos de datos e ingenieros de aprendizaje automático (MLEs), está eliminando la necesidad de estos roles en ciertas etapas del desarrollo de IA. Sin embargo, el artículo argumenta que el papel del científico de datos no está muerto, sino que se está transformando. El trabajo crucial de diseño de experimentos, depuración de sistemas estocásticos y creación de métricas significativas sigue siendo esencial, y la experiencia en ciencia de datos es vital para construir 'arneses' efectivos para estos modelos, incluyendo la definición de métricas específicas y la verificación de jueces (evaluadores). El artículo destaca cinco errores comunes en el desarrollo de IA, como el uso de métricas genéricas, la falta de verificación de jueces y el diseño deficiente de experimentos, y enfatiza la importancia de que los científicos de datos lideren el análisis de datos y la definición de métricas personalizadas para garantizar el éxito de las aplicaciones de IA.
