關(guān)于Unicode
由于各國(guó)國(guó)家標(biāo)準(zhǔn)字集所收的漢字字?jǐn)?shù)、常用字的差異,雖然象中國(guó)兩岸GB/BIG5字集常用字基本類似,轉(zhuǎn)換后閱讀并不成問題,但是這種編碼轉(zhuǎn)換的混亂關(guān)系,對(duì)文字交流始終是一種障礙。因此相關(guān)國(guó)家的標(biāo)準(zhǔn)化組織和文字工作者經(jīng)過共同努力,終于在93年完成了包含中日韓(CJK)漢字的Unicode 漢字標(biāo)準(zhǔn)ISO 10646.1。 Unicode是完全雙字節(jié)表示的多國(guó)文字編碼體系,編碼空間0x0000-0xFFFF。 ISO 10646.1漢字標(biāo)準(zhǔn)使用編碼0x4E00-9FA5,共包含20902個(gè)漢字。其中: 大陸(S)提出的漢字17124個(gè),臺(tái)灣(T)提出的漢字17258個(gè); S與T的并集,即中國(guó)(C)提出的漢字為20158個(gè)。 日本(J)提出的漢字為12157個(gè),中國(guó)未提出的690個(gè)(Ja); 韓國(guó)(K)提出的漢字為7477個(gè),其中中國(guó)未提出的90個(gè)(Ka); Ja與Ka并集共744字。 支持Unicode編碼的相關(guān)電腦系統(tǒng)軟件,如Unix, Win95已有推出,但是由于Unicode的ASCII碼是用雙字節(jié)編碼(即一般電腦系統(tǒng)中的單字節(jié)ASCII碼前加 0x00),同時(shí)其漢字編碼與各國(guó)的現(xiàn)有編碼也不兼容,造成現(xiàn)有的軟件和數(shù)據(jù)不能直接使用,所以目前完全使用Unicode軟件系統(tǒng)的用戶并不多,大多數(shù)只將它此作為一個(gè)國(guó)際語言編碼標(biāo)準(zhǔn)來使用。