跳至內容
主選單
主選單
移至側邊欄
隱藏
導覽
首頁
近期變更
隨機頁面
MediaWiki說明
Taiwan Tongues 台語維基
搜尋
搜尋
外觀
建立帳號
登入
個人工具
建立帳號
登入
檢視 EUC 的原始碼
頁面
討論
臺灣正體
閱讀
檢視原始碼
檢視歷史
工具
工具
移至側邊欄
隱藏
操作
閱讀
檢視原始碼
檢視歷史
一般
連結至此的頁面
相關變更
特殊頁面
頁面資訊
外觀
移至側邊欄
隱藏
←
EUC
由於以下原因,您無權編輯此頁面:
您請求的操作只有這些群組的使用者能使用:
使用者
、taigi-reviewer、apibot
您可以檢視並複製此頁面的原始碼。
'''EUC'''攏號做'''Extended Unix Code''',是一個使用八位編碼來表示字符的方法。 EUC 頭仔是針對 Unix 系統,由一寡仔 Unix 公司所開發,佇一九九一年標準化。EUC 是因為 ISO / IEC 二千空二十二的七位編碼標準,所以講單字節的編碼空間為九十四,雙字節的編碼空間(區位碼)為九十四 x 九十四。共每一个區位加上零 xA 零來表示,以便符合 ISO 二千空二十二。伊主要用於表示佮儲存漢語文字、日語文字佮朝鮮文字。 EUC 定義矣四个單獨的碼集(code set)。 碼集零總是對應該七位的 ASCII(抑是其他各國定義的 ISO 六百四十六), 包括著矣 ISO 二千空二十二定義的 C 零與 G 零空間的值。碼集一 , 二 , 三表示 G 一空間的值。其中,碼集一表示一寡無經修削(unadorned)彼字符。碼集二的字符編碼以零 x 八 E(屬於 C 一控制字符,抑是稱 SS 二)為第一字節。碼集三的字符編碼以零 x 八 F(另外一个屬於 C 一个控制字符,抑是稱 SS 三)為第一字節。碼集零總是編碼做單字節;碼集二、三總是編碼為至少兩字節;碼集一編碼是一孵三字節。 ==EUC-CN== '''EUC-CN'''是 GB 二千三百十二上捷用的表示方法。瀏覽器編碼表頂的「GB 二千三百十二」,通常攏是講「EUC-CN」表示法。 ASCII 字符,範圍做零 x 二十一孵空 x 七 E,直接用單字節表示。這是碼集零 . GB 二千三百十二字用兩字節來表示。這是碼集一 . :「第一位字節」使用零 xA 一垺零 xFE :「第二位字節」使用零 xA 一垺零 xFE GB 兩千三百十二無咧使用碼集二、碼集三部份。 比如講伊,「 啊」字嘿 GB 二千三百十二之中的第一个漢字,伊的區位碼是一千六百空一。 佇咧 EUC-CN 之中,伊共零 xA 零 + 十六=零 xB 零 , 零 xA 零 + 一=零 xA 一,有出脫 xB 零 A 一。 ==EUC-JP== '''EUC-JP'''用來儉日本 JIS X 兩百空八(舊名 JIS C 六千兩百二十六)佮 JIS X 二百十二字集的字符,主要影響類 Unix 作業系統的日文表示佮處理。猶毋過,日文 Windows 作業系統較濟使用 ISO 抹二千空二十二-JP 抑是 Shift JIS 的方法來表示。 ASCII 字符,範圍做零 x 二十一孵空 x 七 E,直接用單字節表示。這是碼集零 . 半角片假名使用兩字節來表示。這是碼集二 :「第一位字節」使用零 x 八 E :「第二位字節」使用零 xA 一垺零 xDF JIS X 二百空八字元使用兩字節來表示。這是碼集一 . :「第一位字節」使用零 xA 一垺零 xFE :「第二位字節」使用零 xA 一垺零 xFE JIS X 二百十二字用三字節來表示。這是碼集三 :「第一位字節」使用零 x 八 F :「第二位字節」使用零 xA 一垺零 xFE :「第三位字節」使用零 xA 一垺零 xFE ===EUC-JISX 兩百十三=== '''EUC-JISX 兩百十三'''是一个制定中的 EUC 規格,用來表示講 JIS X 二百十三字集的字符。 半角片假名使用兩字節來表示。 :「第一位字節」使用零 x 八 E :「第二位字節」使用零 xA 一垺零 xDF JIS X 二百十三第一字面字元使用兩字節來表示。 :「第一位字節」使用零 xA 一垺零 xFE :「第二位字節」使用零 xA 一垺零 xFE JIS X 二百十三第二字面字元使用三字節來表示。 :「第一位字節」使用零 x 八 F :「第二位字節」使用零 xA 一垺零 xFE :「第三位字節」使用零 xA 一垺零 xFE ==EUC-KR== '''EUC-KR'''用來儲存韓國 KS X 一千空一字集(舊名 KS C 五千六百空一)彼字符。這个規格由 KS X 兩千九百空一(舊名 KS C 五千八百六十一)定義。 KS X 一千空一字元使用兩字節來表示。 :「高位字節」使用零 xA 一垺零 xFE :「低位字節」使用零 xA 一垺零 xFE ==EUC-TW== '''EUC-TW'''為台灣使用的漢字編碼方法之一,以 CNS 一孵一千六百四十三字表為基礎;但是台灣普遍使用大五碼,EUC-TW 甚少使用。 CNS 一孵一千六百四十三第一字面的字元使用兩字節來表示。 :「第一位字節」使用零 xA 一垺零 xFE :「第二位字節」使用零 xA 一垺零 xFE CNS 一刀六百四十三其他字面的字元使用四字節來表示。 :「第一位字節」使用零 x 八 E :「第二位字節」使用零 xA 一垺零 xB 零(零 xA 一垺零 xA 七分別代表第一至第七字面,賰的定義) :「第三位字節」使用零 xA 一垺零 xFE :「第四位字節」使用零 xA 一垺零 xFE ( CNS 一孵一千六百四十三第一字面會當選擇使用兩字抑是四字節來表示) ==參看== * ISO / IEC 二千空二十二 * JIS X 兩百空一 * GB 二千三百十二 * CNS 一孵一千六百四十三 ==參考文獻== * 小林劍,(一九九九年). _ CJKV Information Processing _ . First Edition . O'Reilly and Associates , Inc . ISBN 一石頭五六千五百九十二石兩百二十四抹七;中文版,鄭鈺璋譯,(二空空二年)_ 中日韓越資訊處理 _ 頭版,台北市,美商歐萊禮股份有限公司。ISBN 九百八十六五七千七百九十四四配三孵六 [[分類: 待校正]]
返回到「
EUC
」。