EUC
EUC攏號做Extended Unix Code,是一個使用八位編碼來表示字符的方法。
EUC 頭仔是針對 Unix 系統,由一寡仔 Unix 公司所開發,佇一九九一年標準化。EUC 是因為 ISO / IEC 二千空二十二的七位編碼標準,所以講單字節的編碼空間為九十四,雙字節的編碼空間(區位碼)為九十四 x 九十四。共每一个區位加上零 xA 零來表示,以便符合 ISO 二千空二十二。伊主要用於表示佮儲存漢語文字、日語文字佮朝鮮文字。
EUC 定義矣四个單獨的碼集(code set)。 碼集零總是對應該七位的 ASCII(抑是其他各國定義的 ISO 六百四十六), 包括著矣 ISO 二千空二十二定義的 C 零與 G 零空間的值。碼集一 , 二 , 三表示 G 一空間的值。其中,碼集一表示一寡無經修削(unadorned)彼字符。碼集二的字符編碼以零 x 八 E(屬於 C 一控制字符,抑是稱 SS 二)為第一字節。碼集三的字符編碼以零 x 八 F(另外一个屬於 C 一个控制字符,抑是稱 SS 三)為第一字節。碼集零總是編碼做單字節;碼集二、三總是編碼為至少兩字節;碼集一編碼是一孵三字節。
EUC-CN
EUC-CN是 GB 二千三百十二上捷用的表示方法。瀏覽器編碼表頂的「GB 二千三百十二」,通常攏是講「EUC-CN」表示法。
ASCII 字符,範圍做零 x 二十一孵空 x 七 E,直接用單字節表示。這是碼集零 .
GB 二千三百十二字用兩字節來表示。這是碼集一 .
- 「第一位字節」使用零 xA 一垺零 xFE
- 「第二位字節」使用零 xA 一垺零 xFE
GB 兩千三百十二無咧使用碼集二、碼集三部份。
比如講伊,「 啊」字嘿 GB 二千三百十二之中的第一个漢字,伊的區位碼是一千六百空一。
佇咧 EUC-CN 之中,伊共零 xA 零 + 十六=零 xB 零 , 零 xA 零 + 一=零 xA 一,有出脫 xB 零 A 一。
EUC-JP
EUC-JP用來儉日本 JIS X 兩百空八(舊名 JIS C 六千兩百二十六)佮 JIS X 二百十二字集的字符,主要影響類 Unix 作業系統的日文表示佮處理。猶毋過,日文 Windows 作業系統較濟使用 ISO 抹二千空二十二-JP 抑是 Shift JIS 的方法來表示。
ASCII 字符,範圍做零 x 二十一孵空 x 七 E,直接用單字節表示。這是碼集零 .
半角片假名使用兩字節來表示。這是碼集二
- 「第一位字節」使用零 x 八 E
- 「第二位字節」使用零 xA 一垺零 xDF
JIS X 二百空八字元使用兩字節來表示。這是碼集一 .
- 「第一位字節」使用零 xA 一垺零 xFE
- 「第二位字節」使用零 xA 一垺零 xFE
JIS X 二百十二字用三字節來表示。這是碼集三
- 「第一位字節」使用零 x 八 F
- 「第二位字節」使用零 xA 一垺零 xFE
- 「第三位字節」使用零 xA 一垺零 xFE
EUC-JISX 兩百十三
EUC-JISX 兩百十三是一个制定中的 EUC 規格,用來表示講 JIS X 二百十三字集的字符。
半角片假名使用兩字節來表示。
- 「第一位字節」使用零 x 八 E
- 「第二位字節」使用零 xA 一垺零 xDF
JIS X 二百十三第一字面字元使用兩字節來表示。
- 「第一位字節」使用零 xA 一垺零 xFE
- 「第二位字節」使用零 xA 一垺零 xFE
JIS X 二百十三第二字面字元使用三字節來表示。
- 「第一位字節」使用零 x 八 F
- 「第二位字節」使用零 xA 一垺零 xFE
- 「第三位字節」使用零 xA 一垺零 xFE
EUC-KR
EUC-KR用來儲存韓國 KS X 一千空一字集(舊名 KS C 五千六百空一)彼字符。這个規格由 KS X 兩千九百空一(舊名 KS C 五千八百六十一)定義。
KS X 一千空一字元使用兩字節來表示。
- 「高位字節」使用零 xA 一垺零 xFE
- 「低位字節」使用零 xA 一垺零 xFE
EUC-TW
EUC-TW為台灣使用的漢字編碼方法之一,以 CNS 一孵一千六百四十三字表為基礎;但是台灣普遍使用大五碼,EUC-TW 甚少使用。
CNS 一孵一千六百四十三第一字面的字元使用兩字節來表示。
- 「第一位字節」使用零 xA 一垺零 xFE
- 「第二位字節」使用零 xA 一垺零 xFE
CNS 一刀六百四十三其他字面的字元使用四字節來表示。
- 「第一位字節」使用零 x 八 E
- 「第二位字節」使用零 xA 一垺零 xB 零(零 xA 一垺零 xA 七分別代表第一至第七字面,賰的定義)
- 「第三位字節」使用零 xA 一垺零 xFE
- 「第四位字節」使用零 xA 一垺零 xFE
( CNS 一孵一千六百四十三第一字面會當選擇使用兩字抑是四字節來表示)
參看
- ISO / IEC 二千空二十二
- JIS X 兩百空一
- GB 二千三百十二
- CNS 一孵一千六百四十三
參考文獻
- 小林劍,(一九九九年). _ CJKV Information Processing _ . First Edition . O'Reilly and Associates , Inc . ISBN 一石頭五六千五百九十二石兩百二十四抹七;中文版,鄭鈺璋譯,(二空空二年)_ 中日韓越資訊處理 _ 頭版,台北市,美商歐萊禮股份有限公司。ISBN 九百八十六五七千七百九十四四配三孵六