Código Repetido: Ranking Revela la Complejidad de Lenguajes

Fuentes: Boilerplate Tax - Ranking popular programming languages by density

Un investigador utilizó la herramienta 'scc' para medir la complejidad del código en repositorios de GitHub, analizando específicamente la métrica de 'Líneas de Código Únicas' (LUC). El objetivo era determinar la cantidad de código único en diferentes lenguajes de programación y comparar la repetición de código boilerplate entre ellos (por ejemplo, Go vs. Rust). Para ello, automatizó el proceso utilizando un script de Python generado con Google Gemini, analizando los 1000 repositorios más populares. El análisis reveló datos interesantes sobre la 'secesión' (dryness) del código en varios lenguajes, y permitió descubrir un error en la herramienta 'scc' que fue posteriormente corregido. El estudio también proporcionó una gran cantidad de datos (472 MB en formato SQLite) para futuros análisis.