跳至內容
主選單
主選單
移至側邊欄
隱藏
導覽
首頁
近期變更
隨機頁面
MediaWiki說明
Taiwan Tongues 台語維基
搜尋
搜尋
外觀
建立帳號
登入
個人工具
建立帳號
登入
檢視 香港增補字符集 的原始碼
頁面
討論
臺灣正體
閱讀
檢視原始碼
檢視歷史
工具
工具
移至側邊欄
隱藏
操作
閱讀
檢視原始碼
檢視歷史
一般
連結至此的頁面
相關變更
特殊頁面
頁面資訊
外觀
移至側邊欄
隱藏
←
香港增補字符集
由於以下原因,您無權編輯此頁面:
您請求的操作只有這些群組的使用者能使用:
使用者
、taigi-reviewer、apibot
您可以檢視並複製此頁面的原始碼。
'''香港增補字符集'''('''H'''ong'''K'''ong'''S'''upplementary'''C'''haracter'''S'''et,簡稱'''HKSCS''')是香港政府對繁體中文電腦操作環境中上時行的大五碼(Big 五)之上擴展的字元集標準,是現時香港的中文資訊交換內碼標準。 字元集所收羅的字主要包括香港的地號名、人名用漢字、粵語漢字佮異體字,嘛有小部份簡體字;除了這以外亦共靠天中文系統收錄的日語平假名、片假名佮俄語字母包括在內。此字元集由中文界面諮詢委員會管理,猶原佇咧不斷擴編的中間。上新版為 HKSCS 鋪二千空一十六,收錄五千空三十三字元。 ==負責機構== 負責規套字元集管理的做'''中文界面諮詢委員會'''(Chinese Language Interface Advisory Committee,CLIAC), 簡稱「中諮會」。 一九九九年五月由前資訊科技署成立,現隸屬「政府資訊科技總監辦公室」。 中諮會轄下有兩項頭路小組:「 中文電腦用字工作小組」、「 中文資訊科技工作小組」。 前者審核待增收字元,納入佮編配碼位遮的工作;後者解決技術問題佮國際標準 ISO/IEC 一孵空六百四十六(簡稱 ISO 一孵空六百四十六)接軌這寡工課。二空一五年六月一號,兩小組合併是「中文界面諮詢委員會工作小組」。 各組成員對學術界來、語言學界、出版界和資訊科技界等等。 ==歷史== 一九八空年代中期,台灣的中文電腦通行內碼為 Big 五碼。一九九空年代初期,香港電腦應用沓沓仔普遍,毋過政府各部門也電腦化。和台灣仝款,香港嘛用繁體中文,故嘛採用 Big 五碼。可是 Big 五碼本身無收錄香港捷用的廣東字、一寡人名地號名用字、一寡學科用字,香港使用者定定面對欠字的問題。所以,香港政府各部門使用 Big 五的外字區,家己補起來遮的字,並且佇政府內部咧使用。同時,香港業界嘛指出講本地需要一套標準字元集來做電子檔案來往,要求政府頒佈標準。到一九九五年,網際網路佇香港起步,政府也推出了家己的網站。個人電腦的中文系統雖然攏用 Big 五碼,但是攏無政府用的外字,閣較可能用家己的外字,使佇咧瀏覽網頁的時袂當顯示正確字元。香港政府所以共內部使用有三千幾字的 Big 五外字集標準造字檔公開,予各界會當下載安裝這批字,使電腦能顯示正確的字元,並且共這套字號名做《'''政府通用字庫'''》(Government Common Character Set,簡稱 GCCS)。 到甲一九九九年九月,此字集增加到四千外字,做改名。後來的人是將這个版本回稱「HKSCS 被一千九百九十九」。 自其公佈了後,香港增補字符集閣經歷過幾若改的修訂,版本歷史如下: 除了增補字元,中諮會亦於二空空二年公佈矣《香港電腦漢字楷體字形參考指引》和《香港電腦漢字宋體(印刷體)字形參考的指引》予業界參考,指引內容為部件做基礎的字形參考寫法,希望會當推動業界開發符合香港小學和初中教育慣勢捷書寫方式的漢字型產品。 二空一六年,中諮會閣公佈《香港電腦漢字參考字形》,佇字元層面提供完整的電腦漢字教育參考寫法,具體說明適用佇咧香港的字型,較了香港參考字形佮台灣業界習慣佮台灣教育部寫法的異同;閣涵蓋 HKSCS 鋪二千空一十六佮 Big 五碼字元集所有漢字,補充二空空二年兩份指引的不足之處。檔案的研訂目標是向望會清楚度的顯示 ISO/IEC 一孵空六百四十六國際編碼標準中 H-列的字形,方便字型生產商開發有關產品。 中諮會了後佇兩千空一十八、二千空一十九佮二空二一年繼續修訂《香港增補字符集》,分別增收三漢字(U + 五 C 八十三分、U + 二 D 二十五 D ua-sá-bih、U + 二 BB 三十七孵)、 修改 U + 二十二 ACF 佬的字型、調整 U + 兩百七十 F 零曉的碼位。 ==字元分類== HKSCS 鋪二千空四版本共四千五百漢字元,其中三千三百五十三字有佇咧《漢語大字典》等大型的字典查著,包括簡省字、異體字、日語漢字等。其他佇咧各大中文字典中查袂著的字中,有粵語方言字(有的通佇方言字典佮學術著作中查著)、 阿麗、公司名、地方名、變形部首、附形、訛字。有的字來自入境事務處、公司註冊處、稅務局、地政總署。 各類符號共四百四十一个,有漢字筆形、漢語拼音字母、國際音標符號、漢字元件、畫表符號、日本平假名、片假名等。 香港增補字符集佇咧這个版本起才有畫數、部首、粵音等等的資料予使用者參考,閣說明方便檢索,煞非做規範的標準(漢字的部首佇咧無仝款的字典中,歸部嘛無盡相仝)。 ===和 GCCS 的關係=== * 註:各操作系統使用的字體不盡相𫝛,下表列出字元無一定符合向望的結果。 如上表,第一部份有部份字元是重量單位,比如講響著、ua-sá-bih、ua-sá-bih、ua等,佇咧 Big 五中是用符號形式出現,意即該等字元佇咧 Big 五中並毋是漢字,所以香港政府另行佇 Big 五造字區安囥遮的字,造成重複;另外咧,有的字元咧收錄的時陣干焦佮 Big 五正確字存在細微字形差異,比如講「ua-sá-bih」頂懸一字對「山」毋過另外一字對「ua-sá-bih」,「 靜」倒下跤一字對「月」毋過另外一字對「ua-sá-bih」。 研究遮的字會當對舊造字檔著手,因為這馬佇 Windows 通行的「拆白體 \ _ HKSCS」字體已經標準化。 ==編碼== ===和 Big 五的關係=== 香港增補字符集當初因為是補充 Big 五的收字不足,使用其外字區而發展的,所以受制於 Big 五个編碼架構,外字總數上濟只會到六千兩百十七(每一个角頭一百五十七字,有三十九區角半)。 除去用碼位,賰的碼位,其中有部份會保留予使用者造字。 早期的靠天中文系統、國喬中文系統等等對造字欠缺管理,猶閣無彼个文字專家的審定,因此彼陣造字足是混亂的,有的甚至可能干焦臨時使用的「錯字」(尋遍各大字典、專書嘛查袂著的字,也作幽靈漢字); 製作遮的中文系統的廠商閣對字型、字體欠缺認捌,有的字會因為字體無仝字型小可仔有差別,分別編入去兩碼位。閣有仝一字有系統區佮造字區兩碼位,有的聯綿詞干焦收其一無收其二;這个問題紮到政府通用字庫佮香港增補字符集中,字集愛顛倒去相容跳過一寡碼位。 Big 五原來的編碼干焦漢字、標點、注音符號等字元佮少數圖形,尾仔經過台灣廠商增收,加七个「靠天字」(ua-sá-bih、鉎、內底、墻、ua-sá-bih、粧、ua-sá-bih)佮日文假名,最後這批字元閣收入香港增補字符集。 香港增補字符集所用的 Big 五的外字區分幾區段: *「造字區一」(FA 四十—FEFE): 古早的 GCCS 字元集已經添滿這段。 *「造字區二」(C 六 A 一—C 八 FE): 靠天用這段來放日文假名等符號。遮的符號收納佇 HKSCS-一九九九年版。 *「造字區三」(八千一百四十—A 零 FE): 香港增補字符集共這段開頭的(八千一百四十—八十四 FE)保留予使用者,新增加的字元干焦用賰的碼位。 *「廠商造字區」(F 九 D 六—F 九 FE): 靠天用矣這段來放「靠天字」佮製表符號。遮的符號亦在 HKSCS-一九九九年版本將之全部收納。 毋過一般講著 HKSCS 的檔案,包括來自香港政府的,攏無註明 HKSCS 以外的一般繁體字編碼(即是 Big 五本身)使用佗一版。Big 五佇二空空三年前就干焦一版,袂透濫啦,猶毋過 HKSCS 鋪二千空四的檔案猶原無指定 Big 五部份是二空空三年以後猶是進前的版本,雖然到目前為止並無任何系統使用 Big 五孵二千空三。 ===和 ISO 一孵空六百四十六/Unicode 的關係=== 一九九五年的政府通用字庫本來是內部使用的,到一九九九年才成立中諮會專門去負責增收佮審核字元的工課,並佮 ISO 一孵空六百四十六接軌。中諮會的成員會共香港增補字符集交著 ISO 的'''表意文字小組'''中,盡量予其所有的字元納入國際標準。表意文字小組會定期開會審議漢字的收納等工課,成員是來自世界各地的專家。 香港字佇咧 Big 五-HKSCS 內的碼位,攏會當對應著 ISO 一堵空六百四十六中日韓漢字區段中的碼位,抑是 Private Use Area(使用者造字區,簡稱 PUA)內。隨著版本的更新,造字區的字會漸漸搬到中日韓漢字擴充區內。共所有的已經納入的 HKSCS 字元搬到正式中日韓漢字擴充區段(非 PUA 區段)的工課佇二空空五年完成,對應於 ISO 一孵空六百四十六 : 二千空三的頭一修訂版,相應的 Unicode 版本為 Unicode 四配一。 猶毋過,因為目前流傳了真濟使用舊版 HKSCS 的系統產生出來的檔案,為著方便過渡,佇咧 HKSCS 的定義內底,佇咧 Unicode PUA 所分配的字元位置會讓以保留,袂共新加入而且無分配正式 Unicode 位置的字元使用。 ==字體提供== 上蓋起初的香港字是由早期的台灣廠商(親像靠天等)佮使用者家己造字所得。大部份攏無合標準佮無流通,無沿用到這馬。後來,TrueType 字型時行,中文字的廠商攏開始加入香港字,但是因為是商業性質,無夠額的流通量。另外咧,支援超大字庫的字體方面,因為乎 HKSCS 某一寡字佮大陸 GBK 碼有衝突,廠商定定會因為市場關係放捒一寡香港字。 香港政府的「數位二十一」網頁(詳見下跤的外部連結)有提供由華康授權的香港字參考宋體,毋過一來是使用條款困難毋可能廣泛使用,二來是無推廣,致使政府內部人員嘛毋知這套字體的存在。 目前由商業主導的情形漸漸有改變,近況如下: ===開放原始碼字體=== 文鼎科技佇一九九年釋出了四套字體(繁簡明體佮楷書)予自由軟體界,但是當中無香港字。尾仔高盛華(Arne Götje)發起計畫將繁簡體合併,彼个稱為 CJK Unifonts。當中,Akar、Zunix 等人佇二空空四年尾另外發起開源香港常用中文字體計畫,將香港字加入 CJKUnifonts 之內,到二空空五年九月初一完成將 HKSCS 兩千空四加入 CJKUnifonts 的工課。目前 UMing 佮 UKai 已經收錄佇各大 Linux 發行版。 ===商業字體=== 上早一套宣稱支援 HKSCS 的字體是華康「香港標準楷書」佮「香港標準宋體」,啊若上早一套宣稱支援 HKSCS 二千空四的字體是華康「金蝶二千空六 H . K . Edition」,佇二空空五年十一月十四號推出。後來文鼎、蒙納等字型公司亦陸續推出相應的字型產品。 ==增收字元== 「 中諮會」會予各界申請新字元,猶毋過愛經過審核批准,才會予字元編配碼位。使用者自造的字,看有需要加入,特別是一寡人名地名等會經過網際網路傳送的字。另外咧,遮的增收的字元無一定會當收錄佇 Unicode 之內,像講一寡會使表示講 Unicode 複合字元的字抑是符號,就袂收錄。 另外因為這馬餘下的 Big 五相容碼位無濟(二空空五年九月為止干焦賰四百八十七碼位無路用), 中文介面諮詢委員會已經佇二空空八年三月三十一號停止為字元提供 Big 五碼位,並佇進前盡量協助業界佮一般使用者過渡至 Unicode。 ==操作系統的支援== 香港增補字符集開始的時陣干焦 Windows 版本的 Big 五碼,後來佮 ISO 一孵空六百四十六接軌了後,才開始佇咧 Linux、Mac OS 等系統中使用。理論上因為 ISO 一孵空六百四十六已經收納香港增補字符集,任何支援 ISO 一孵空六百四十六的系統攏通使用香港字。但實際上,真濟舊的程式內部攏是使用 UCS 鋪二(每字佔兩位元組)儲存字捾,無法度表示濟濟囥佇基本濟文種平面(簡稱 BMP)以外的所有的香港字。干焦使用 UCS 扳四(每字占四位元組)做內部的儲存字攏有穿編碼的程式,才會當完整的顯示所有的香港字。 ===Windows=== ====顯示佮處理字元==== 根據 Microsoft 的網頁,佇咧 Windows Vista 抑是以後的版本欲閣再支援無 HKSCS 鋪二千空四的 Big 五擴展編碼(通常號做 Big 五 HKSCS), 干焦使用 Unicode 中的香港字支援。 至於 HKSCS 鋪二千空一,會當佇咧小可軟的網頁(請看下跤的外部連結)中下載香港增補字符集;伊支援 Windows 九十八、NT、兩千和 XP。毋過安裝該套件佮其他的軟體(比如講 Office)需要有一定的順序,而且伊佮別个 Big 五外字集並無相容,必須愛先瀏覽有關檔案方會當安裝。 ====輸入字元==== 佇咧 Windows XP 中,內建的倉瀨輸入法會輸入已經包括佇咧 Unicode 一孵一版本內的香港字;新倉被輸入法則袂使。 ===Linux=== ====顯示佮處理字元==== 自從 glibc 佇二空空空年加入香港字(同時包括 Big 五 hkscs 和 unicode 碼兩个人的轉換表)的支援了後,就差不多無閣較新過,內底的 Big 五部份閣較是對年代久長矣 Big 五/Unicode 轉換碼表,當中有袂少錯誤之處,令一寡檔案佮網頁無論使用 Big 五猶是 Big 五 HKSCS 轉換至 Unicode 攏會出現錯誤。暫時無任何更新。反倒轉來,若單咧使用 Unicode 做系統編碼,處理香港字無問題。 桌面環境方面,KDE 三 . x 桌面因為使用 QT 三 . x,而且 QT 三 . x 內部攏使用 UCS 鋪二儲存字元,所以 KDE 三 . x 干焦會當有限度地顯示少部份香港字。這个狀況向望佇 KDE 四淋零解決。 GNOME 無這方面的問題,只要是使用 Unicode,佇兩千空四至二空空五年間就已經會當顯示所有的 BMP 以外的字元。 ====輸入字元==== 截至二空空七年三月,支援香港字集的開源輸入法有:SCIM、OXIM;無支援的有:IIIMF、gcin。毋過有一寡輸入法並毋是輸出 Unicode 中真正編配予香港字的碼位,是一寡造字區的碼位,比如講 SCIM 中的倉辱五代輸入法便是按呢。 ===Mac OS=== ====顯示佮處理字元==== Mac OS X 十二版本支援的版本為 HKSCS 被一千九百九十九。十曉三、十曉四、十人五佮上新的十人因為十二援 HKSCS 鋪二千空一;十二分有部份 HKSCS 鋪二千空四新增字元,但是編碼對應 Unicode 私人使用區;十曉五佮十曉六有 HKSCS 鋪二千空四全部新增字元,但是只有 Unicode(四配一版本)編碼。 ====輸入字元==== 使用 Mac OS X 內建的中文輸入法即可,無屬 Big 五字集的字啊咧選字區邊仔有一青色的感嘆號 [!] 提示。 ==使用地區== 除了香港使用香港字以外,現此時台灣的中文電腦嘛有少部份咧使用伊的(如處理捷看著的但是 Big 五未有收錄的人名用字,如「堃」和「哲」字;此外,臺灣嘛有家己的一兩套外字集,如中國海字集)。 啊若仝款使用粵語佮繁體字的澳門嘛有使用這套字集,凡勢猶閣有其他華語地區會使用。 澳門政府網站、澳廣視佮真濟澳門報紙網站用 Unicode(UTF ma八)編碼,因為這馬大部份系統已經支援 Unicode 佮內建相應字型,毋免額外安裝套件就會當看著澳門特有的用字,如川。 ==衍生== ===日和字集=== 「 日和字集」乃香港增補字符集採用 Big 五碼時期,香港人內木一郎和阿烈開發的 True Type Eudc 造字檔,以相容香港增補字符集做賣點,增補字集猶原無涵蓋的日語假名、日本漢字佮日本國字,有詳細明體、標楷體、中烏體等配合 Windows 九十五、九十八、NT 等作業系統字型的字款,並附有倉蔭、速成等輸入法做輔助,以及共字集文件轉換到日語編碼的轉碼器工具。 香港增補字符集完全過渡至 Unicode 編碼了後,日佮字集增補的字元基本上攏有 Unicode 編碼,作業系統字型會當直接顯示,因此日和字集停止換新。 ===開源香港常用中文字體計劃=== 社會上有志願人士開始矣開源香港常用中文字體計畫。以 CJK Unifonts 的 UMing、UKai 字型為基礎,增補香港增補字符集的所有的字元。 ==評價== 香港增補字符集一直需要佮 Big 五碼相容,會當講是一套先天不足的字集。伊欲處理進前期真濟遺留落來的問題,嘛有外字數上限,致使香港特區政府按算佇二空空七年到二空空八年放棄伊的 Big 五碼。若系統使用 Unicode 編碼,用伊顛倒較好。當今的趨勢是使用 Unicode,伊有夠額的字元,差不多會當滿足文字學家、字典專家的用字要求講。但是因為相容性的關係,欲將整套系統由使用 Big 五碼轉換至 Unicode 不止仔費時,毋才會有人暫時無願意轉換。 ===增收原則更改=== 《 香港增補字符集》自二空空八年三月三十一開始更改字元增收原則,新增的字元干焦會曉編配 ISO 一孵空六百四十六國際編碼標準內碼,無閣再編配大五碼的內碼。政府資訊科技總監辦公室表示,全面採用 ISO 一孵空六百四十六國際編碼,會當統一編碼標準,解決相容問題。ISO 一丈空六百四十六國際編碼標準涵蓋各種主要語文的字元,包括繁體佮簡體中文字,提供統一的字元編碼標準,方便世界各地的電腦使用者。《香港增補字符集》三月三十一開始改字元增收原則,所以進前得著編配的字元,是無受著影響。政府一九九九年公佈《香港增補字符集》,由中文介面諮詢委員會負責管理,收納適用佇香港的中文電腦用字,通訊出現亂碼抑是字元袂當正確來顯示等等的問題。 ==參看== * 編碼 * 通用字元集 * 大五碼(Big 五) * 中日韓統一表意文字 * 造字 * 外字 * 粵語字 * 開源香港常用中文字體計劃 ==注釋== ==外部連結== ===字元佮編碼=== * 香港特區政府:共通中文介面 * 香港增補字符集—二千空一十六 * ISO 一孵空六百四十六 HK . NET(香港理工大學) * ISO/IEC 一孵空六百四十六工作小組 * 表意文字小組 * 香港生產力促進局對各種商業產品的香港字支援情形列表 * 無線行動裝置著《香港增補字符集《香港增補字符集》的支援 * 香港增補字符集兩千空四附錄四《政府通用字庫》字元相容碼位 ===編碼表=== * 政府通用字庫(一九九五年)碼表 * HKSCS 鋪一千九百九十九碼表 * HKSCS 鋪二千空一碼表 * HKSCS 鋪二千空四碼表 * HKSCS 鋪二千空八碼表 * HKSCS 鋪二千空一十六檔案 ===字體=== * CJKUnifonts 字體官方網站 * 香港 freefonts 計畫 * 微軟:香港增補字符集—Windows 平台支援 * 微軟:支援 ISO 一孵空六百四十六 : 兩千空三 Windows XP 字形集佮繁體中文支援修正一 ==參考冊、文章== * Lunde , Ken . CJKV Information Processing ( paperback ) First Edition . O'Reilly and Associates , Inc . 一千九百九十九 : 一千一百二十八頁 [二千空五五鋪七鋪十七] . ISBN 九百七十八追一孵五孵六千五百九十二孵兩百二十四孵二 .(原始內容存檔佇兩千空五鋪八鋪二十六)(英語). 引文格式的一維護:趁的文字 ( link ) * Graham , Tony . Unicode : A Primer . Wiley . 兩千 : 五百二十八頁 . ISBN 九百七十八追空九七千六百四十五五刣四千六百二十五刣九 .(原始內容存檔佇二空空五年七月三號)(英語). * 竹竹人水。中文電腦經脈通。電腦易出版社 . 二空空三年七月 .(原始內容存檔佇二空空八年七月六號). * 伍新華。中文電腦應用《附九十五補充字集》. 德嘉書業 . 一九九九年九月 . ISBN 九百七十八撨九百六十二石七千六百九十學二十五孵二 . * Linuxer(這馬停刊)二空空二年九月號:阮的 Big 五碼,謝東翰 * 香港星島日報。二空空八年四月二號禮拜三。《增補字元集更改增收原則》:[三] [[分類: 待校正]]
返回到「
香港增補字符集
」。