Unicode y la escritura asiática: chino, japonés y coreano

Fuentes: An Introduction to Writing Systems & Unicode

Este artículo introduce los sistemas de escritura, centrándose en el chino, japonés y coreano, y explica cómo Unicode los maneja. Comienza con el chino, destacando la diferencia entre los caracteres tradicionales (usados en Taiwán y Hong Kong) y los simplificados (usados en China continental y Singapur). Ambos sistemas representan el mismo idioma, pero con formas de escritura distintas. Es importante notar que los caracteres chinos (hanzi) no necesariamente corresponden a la pronunciación del idioma, ya que existen muchos dialectos mutuamente incomprensibles. Además, existe el sistema zhuyin (bopomofo), utilizado para la transliteración y anotación.

Luego, se explora el japonés, que utiliza tres sistemas de escritura nativos (kanji, hiragana y katakana) junto con el romaji (escritura latina). Los kanji son caracteres chinos adoptados, principalmente para las raíces de las palabras. Hiragana se usa para palabras japonesas nativas y partículas gramaticales, mientras que katakana se utiliza para palabras extranjeras. El japonés requiere el uso de aproximadamente 2.000 kanji para el uso diario.

El coreano utiliza el hangul, un sistema de escritura único donde los fonemas dentro de una sílaba se representan con símbolos individuales (jamos). Aunque el coreano también usa caracteres chinos (hanja), su uso es mucho menor que en el caso del japonés. Unicode permite representar el hangul tanto como jamos individuales como sílabas completas.

Finalmente, el artículo aborda aspectos técnicos de Unicode, explicando cómo maneja las variaciones en la forma de los caracteres (por ejemplo, las diferencias entre las formas simplificadas y tradicionales del chino) y cómo gestiona la compatibilidad con sistemas más antiguos. Se mencionan los bloques de radicales de Unicode (KangXi y CJK Radicals Extension), que contienen componentes utilizados en la construcción de caracteres y para la indexación de diccionarios. Se advierte que estos bloques no deben usarse como caracteres ideográficos en sí mismos. El artículo concluye resaltando la importancia de definir conjuntos de caracteres para cada sistema de escritura y cómo Unicode facilita esta tarea.