Un fallo de compatibilidad entre la lista 'confusables.txt' y la normalización NFKC podría dejar sistemas vulnerables a ataques de homoglífos. 'confusables.txt', un archivo de la Unicode Consortium, mapea caracteres visualmente similares para detectar posibles suplantaciones (como usar una 'а' cirílica en lugar de una 'a' latina en un nombre de usuario). Sin embargo, NFKC, un proceso de normalización Unicode, transforma algunos de estos caracteres de manera diferente, lo que hace que ciertas entradas en 'confusables.txt' sean inaccesibles después de la normalización. Esto afecta a 31 caracteres, incluyendo el 'Long S' (ſ) que NFKC convierte a 's' mientras que 'confusables.txt' lo mapea a 'f', y variantes de 'I' y '0' que NFKC normaliza a sus formas básicas. La discrepancia surge porque 'confusables.txt' se enfoca en la apariencia visual, mientras que NFKC se centra en la representación canónica. Los desarrolladores que implementan sistemas de seguridad deben tener en cuenta esta diferencia y ajustar sus mapas de caracteres confusables en consecuencia, especialmente si utilizan NFKC antes de la detección de confusables.
