27 Feb 2026 · Original en inglés · Resumen IA

Herramienta detecta riesgo de confusión en caracteres Unicode

Fuentes: Tool Quantifies Visual Similarity of Unicode Confusable Pairs

Un investigador ha desarrollado una herramienta llamada 'confusable-vision' para cuantificar la similitud visual de pares de caracteres Unicode confusables. La herramienta, basada en el cálculo del índice de similitud estructural (SSIM), analizó 1.418 pares de caracteres en 230 fuentes, revelando que el 96,5% no son visualmente confusables. Sin embargo, 82 pares son píxel-idénticos en al menos una fuente, lo que representa un riesgo de seguridad potencial. El estudio destaca que la mayoría de las fuentes reutilizan los mismos glifos para caracteres cirílicos y latinos, lo que hace que sean indistinguibles visualmente. Por ejemplo, la letra cirílica 'а' (U+0430) es píxel-idéntica a la letra latina 'a' en más de 40 fuentes. La herramienta, reproducible y auditada, ofrece una evaluación empírica de la confusión visual, contrastando con la lista de confusables.txt, que a menudo incluye mapeos semánticamente correctos pero visualmente distintos. El análisis revela que, si bien el riesgo general es bajo, la similitud píxel-perfecta en ciertos pares, especialmente en fuentes estándar, presenta una vulnerabilidad explotable.

Temas

seguridad

Etiquetas

unicode confusable pairs font rendering security ssim confusable-vision glyph cyrillic latin fontconfig

Entidades mencionadas

Helvetica software

macOS location

Unicode software

TR39 protocol_standard

SSIM software

Fontconfig software

node-canvas software

GlyphNet software

VGG16 software

Arial software

Menlo software

Georgia software

Noto Sans Tifinagh software

STIX Two Math software

STIX Two Text software

STIXGeneral software

Apple Symbols software

Cyrillic ԁ software

Latin d software