EUC
維基百科,自由的百科全書
EUC全名為Extended Unix Code,是一個使用8位編碼來表示字符的方法。
它使用了一些兼容于ISO/IEC 2022區位碼的94x94編碼表,把每個區位加上0xA0來表示,以便兼容于ASCII。
目錄 [隱藏] |
[編輯] EUC-CN
EUC-CN是GB 2312最常用的表示方法。瀏覽器編碼表上的“GB
GB 2312字元使用兩個字節來表示。
“第一位字節”使用0xA1-0xF7
“第二位字節”使用0xA1-0xFE
舉例來說,“啊”字是GB 2312之中的第一個漢字,它的區位碼是1601。
在EUC-CN之中,它把0xA0+16=0xB0,0xA0+1=0xA1,得出0xB
[編輯] EUC-JP
EUC-JP用來儲存日本JIS X 0208(舊稱JIS C 6226)及JIS X 0212字集的字符。但是,日語文字較多使用ISO-2022-JP或Shift JIS的方法來表示。
半角片假名使用兩個字節來表示。
“第一位字節”使用0x8E
“第二位字節”使用0xA1-0xDF
JIS X 0208字元使用兩個字節來表示。
“第一位字節”使用0xA1-0xFE
“第二位字節”使用0xA1-0xFE
JIS X 0212字元使用三個字節來表示。
“第一位字節”使用0x
“第二位字節”使用0xA1-0xFE
“第三位字節”使用0xA1-0xFE
[編輯] EUC-JISX0213
EUC-JISX0213是一個制定中的EUC規格,用來表示JIS X 0213字集的字符。
半角片假名使用兩個字節來表示。
“第一位字節”使用0x8E
“第二位字節”使用0xA1-0xDF
JIS X 0213第一字面字元使用兩個字節來表示。
“第一位字節”使用0xA1-0xFE
“第二位字節”使用0xA1-0xFE
JIS X 0213第二字面字元使用三個字節來表示。
“第一位字節”使用0x
“第二位字節”使用0xA1-0xFE
“第三位字節”使用0xA1-0xFE
[編輯] EUC-KR
EUC-KR用來儲存韓國KS X 1001字集(舊稱KS C 5601)的字符。此規格由KS X 2901(舊稱KS C 5861)定義。
KS X 1001字元使用兩個字節來表示。
“高位字節”使用0xA1-0xFE
“低位字節”使用0xA1-0xFE
[編輯] EUC-TW
EUC-TW本來是臺灣使用的其中一個漢字儲存方法,以CNS 11643字表為基礎。但是臺灣普遍使用大五碼,EUC-TW甚少使用。
CNS 11643第一字面的字元使用兩個字節來表示。
“第一位字節”使用0xA1-0xFE
“第二位字節”使用0xA1-0xFE
CNS 11643其他字面的字元使用四個字節來表示。
“第一位字節”使用0x8E
“第二位字節”使用0xA1-0xB0(0xA1-0xA7分別代表第1至第7個字面,其余未定義)
“第三位字節”使用0xA1-0xFE
“第四位字節”使用0xA1-0xFE
(CNS 11643第一字面可選擇使用兩個字節或四個字節來表示)
[編輯] 參看
[編輯] 參考文獻
- 小林劍,(1999年). CJKV Information Processing. First Edition. O'Reilly and Associates, Inc. ISBN 1-56592-224-7;中文版,鄭褚璋譯,(2002年)中日韓越資訊處理 第一版,臺北市,美商歐萊禮股份有限公司。 ISBN 986-7794-03-6
posted on 2009-11-17 13:42 肥仔 閱讀(794) 評論(0) 編輯 收藏 引用 所屬分類: 字符編碼

