Un investigador ha desarrollado una herramienta llamada 'confusable-vision' para cuantificar la similitud visual de pares de caracteres Unicode confusables. La herramienta, basada en el cálculo del índice de similitud estructural (SSIM), analizó 1.418 pares de caracteres en 230 fuentes, revelando que el 96,5% no son visualmente confusables. Sin embargo, 82 pares son píxel-idénticos en al menos una fuente, lo que representa un riesgo de seguridad potencial. El estudio destaca que la mayoría de las fuentes reutilizan los mismos glifos para caracteres cirílicos y latinos, lo que hace que sean indistinguibles visualmente. Por ejemplo, la letra cirílica 'а' (U+0430) es píxel-idéntica a la letra latina 'a' en más de 40 fuentes. La herramienta, reproducible y auditada, ofrece una evaluación empírica de la confusión visual, contrastando con la lista de confusables.txt, que a menudo incluye mapeos semánticamente correctos pero visualmente distintos. El análisis revela que, si bien el riesgo general es bajo, la similitud píxel-perfecta en ciertos pares, especialmente en fuentes estándar, presenta una vulnerabilidad explotable.
