跳至內容

EUC

出自Taiwan Tongues 台語維基
於 2025年8月22日 (五) 15:22 由 TaiwanTonguesApiRobot留言 | 貢獻 所做的修訂 (從 JSON 檔案批量匯入)

(差異) ←上個修訂 | 已批准修訂 (差異) | 最新修訂 (差異) | 下個修訂→ (差異)

EUC攏號做Extended Unix Code,是一個使用八位編碼來表示字符的方法。

EUC 頭仔是針對 Unix 系統,由一寡仔 Unix 公司所開發,佇一九九一年標準化。EUC 是因為 ISO / IEC 二千空二十二的七位編碼標準,所以講單字節的編碼空間為九十四,雙字節的編碼空間(區位碼)為九十四 x 九十四。共每一个區位加上零 xA 零來表示,以便符合 ISO 二千空二十二。伊主要用於表示佮儲存漢語文字、日語文字佮朝鮮文字。

EUC 定義矣四个單獨的碼集(code set)。 碼集零總是對應該七位的 ASCII(抑是其他各國定義的 ISO 六百四十六), 包括著矣 ISO 二千空二十二定義的 C 零與 G 零空間的值。碼集一 , 二 , 三表示 G 一空間的值。其中,碼集一表示一寡無經修削(unadorned)彼字符。碼集二的字符編碼以零 x 八 E(屬於 C 一控制字符,抑是稱 SS 二)為第一字節。碼集三的字符編碼以零 x 八 F(另外一个屬於 C 一个控制字符,抑是稱 SS 三)為第一字節。碼集零總是編碼做單字節;碼集二、三總是編碼為至少兩字節;碼集一編碼是一孵三字節。

EUC-CN

EUC-CN是 GB  二千三百十二上捷用的表示方法。瀏覽器編碼表頂的「GB 二千三百十二」,通常攏是講「EUC-CN」表示法。

ASCII 字符,範圍做零 x 二十一孵空 x 七 E,直接用單字節表示。這是碼集零 .

GB  二千三百十二字用兩字節來表示。這是碼集一 .


「第一位字節」使用零 xA 一垺零 xFE


「第二位字節」使用零 xA 一垺零 xFE

GB 兩千三百十二無咧使用碼集二、碼集三部份。

比如講伊,「 啊」字嘿 GB  二千三百十二之中的第一个漢字,伊的區位碼是一千六百空一。

佇咧 EUC-CN 之中,伊共零 xA 零 + 十六=零 xB 零 , 零 xA 零 + 一=零 xA 一,有出脫 xB 零 A 一。

EUC-JP

EUC-JP用來儉日本 JIS X  兩百空八(舊名 JIS C  六千兩百二十六)佮 JIS X  二百十二字集的字符,主要影響類 Unix 作業系統的日文表示佮處理。猶毋過,日文 Windows 作業系統較濟使用 ISO 抹二千空二十二-JP 抑是 Shift JIS 的方法來表示。

ASCII 字符,範圍做零 x 二十一孵空 x 七 E,直接用單字節表示。這是碼集零 .

半角片假名使用兩字節來表示。這是碼集二


「第一位字節」使用零 x 八 E


「第二位字節」使用零 xA 一垺零 xDF

JIS X  二百空八字元使用兩字節來表示。這是碼集一 .


「第一位字節」使用零 xA 一垺零 xFE


「第二位字節」使用零 xA 一垺零 xFE

JIS X  二百十二字用三字節來表示。這是碼集三


「第一位字節」使用零 x 八 F


「第二位字節」使用零 xA 一垺零 xFE


「第三位字節」使用零 xA 一垺零 xFE

EUC-JISX 兩百十三

EUC-JISX 兩百十三是一个制定中的 EUC 規格,用來表示講 JIS X  二百十三字集的字符。

半角片假名使用兩字節來表示。


「第一位字節」使用零 x 八 E


「第二位字節」使用零 xA 一垺零 xDF

JIS X  二百十三第一字面字元使用兩字節來表示。


「第一位字節」使用零 xA 一垺零 xFE


「第二位字節」使用零 xA 一垺零 xFE

JIS X  二百十三第二字面字元使用三字節來表示。


「第一位字節」使用零 x 八 F


「第二位字節」使用零 xA 一垺零 xFE


「第三位字節」使用零 xA 一垺零 xFE

EUC-KR

EUC-KR用來儲存韓國 KS X  一千空一字集(舊名 KS C  五千六百空一)彼字符。這个規格由 KS X  兩千九百空一(舊名 KS C  五千八百六十一)定義。

KS X  一千空一字元使用兩字節來表示。


「高位字節」使用零 xA 一垺零 xFE


「低位字節」使用零 xA 一垺零 xFE

EUC-TW

EUC-TW為台灣使用的漢字編碼方法之一,以 CNS 一孵一千六百四十三字表為基礎;但是台灣普遍使用大五碼,EUC-TW 甚少使用。

CNS 一孵一千六百四十三第一字面的字元使用兩字節來表示。


「第一位字節」使用零 xA 一垺零 xFE


「第二位字節」使用零 xA 一垺零 xFE

CNS 一刀六百四十三其他字面的字元使用四字節來表示。


「第一位字節」使用零 x 八 E


「第二位字節」使用零 xA 一垺零 xB 零(零 xA 一垺零 xA 七分別代表第一至第七字面,賰的定義)


「第三位字節」使用零 xA 一垺零 xFE


「第四位字節」使用零 xA 一垺零 xFE

( CNS 一孵一千六百四十三第一字面會當選擇使用兩字抑是四字節來表示)

參看

  • ISO / IEC 二千空二十二
  • JIS X 兩百空一
  • GB 二千三百十二
  • CNS  一孵一千六百四十三

參考文獻

  • 小林劍,(一九九九年). _ CJKV Information Processing _ . First Edition . O'Reilly and Associates , Inc . ISBN 一石頭五六千五百九十二石兩百二十四抹七;中文版,鄭鈺璋譯,(二空空二年)_ 中日韓越資訊處理 _ 頭版,台北市,美商歐萊禮股份有限公司。ISBN 九百八十六五七千七百九十四四配三孵六