跳至內容

ASCII

出自Taiwan Tongues 台語維基
這是此頁批准,以及是最近的修訂。

ASCII(發音:/ ˈæski / _ ASS-kee _,AmericanStandardCode forInformationInterchange,美國標準資訊交換碼)是對拉丁字母的一套電腦編碼系統。伊主要愛用現代英語來做,咧其擴展版本延伸美國標準的資訊交換碼是會當部份支援其他的西歐語言,並等仝款國際標準ISO / IEC 六百四十六

美國資訊交換標準代碼是這軀編碼系統的傳統號名,網際網路號碼分配局這馬閣較傾向使用伊的新名 US-ASCII。

美國資訊交換標準代碼是美國電氣佮電子工程師協會路站碑之一。

ASCII 對電報碼發展來。頭一版標準發布佇一九六三年,一九六七年經歷過一改主要修訂,最後一改更新則是佇一九八六年,到今為止共定義一百二十八字元;其中三十三字元無法度顯示(一寡尾仔提供矣擴充,致使遮的字會當顯示為著諸如笑面、撲克牌花式等八-bit 符號), 而且這三十三字元多數攏已經是陳廢的控制字元。控制字元的用途主要是用來操控已經處理過的文字。佇三十三字元以外的是九十五个會當顯示的字元。用鍵盤摃落空白鍵所產生的空白字元嘛算一个會當顯示字元(顯示為空白)。

技術背景

佇咧電腦當中,所有的資料咧儲存佮運算的時攏愛使用二進位數表示。比如講,像 a、b、c、d 按呢五十二字母(包括大寫)以及零、一等數字閣有一寡常用的符號(比如講 \ *、#、@ 等)佇電腦當中儲存的時嘛咧使用兩進位數來表示,具體用佗一寡二進位數字表示佗一个符號,這就是編碼。若無仝的電腦愛想互相通信無造成混亂,遐爾逐台電腦著愛使用仝款的編碼規則,所以美國有關係的標準化組織就推出矣 ASCII 編碼。

ASCII 是由美國國家標準學會(American National Standard Institute,ANSI)制定的,使用標準的單位元組字元編碼方案,用佇咧基於文字的資料。方案起頭佇五空年代尾期,佇一九六七年定案。伊上頭是美國的標準,供無仝電腦互相通信的時需要共同遵守的西文字元編碼標準。這馬去予國際標準化組織(International Organization for Standardization,ISO)定做國際標準(ISO / IEC 六百四十六), 適用所有的拉丁字母。

控制字元

ASCII 控制字元的編號範圍是零石三十一佮一百二七(十六進位:零 x 空吱吱 x 一 F 佮零 x 七 F), 攏總三十三个字元。

為方便人類使用者閱讀,各個控制字元攏有 Unicode 表示法和脫出字元表示法:

  • Unicode 表示法:當想欲佇畫面抑是紙頂表示講遮的控制字元時,就會顯示甲這个形的。較早古早的系統抑是瀏覽器可能會看袂著。使用微軟任一中文輸入法,輸入 ` U 兩千四百即可看著 ␀,輸入 ` U 兩千四百空一有看著 ␁,照這寡推捒。
  • 脫出字元表示法:通常用佇總端機連線(比如講 Telnet 通訊協定), 以脫出字元 ^ 一開頭,閣接一个符號,用來予遮的控制字元著愛用佇畫面上顯現。雖然講看起來是兩字元,但是佇彼尾溜機頂實際干焦一字元。佇咧絕大部份的終端機系統內底,包括講 Windows 的命令提示講字元(cmd . exe)、 Linux 和 FreeBSD,攏會使用 ` Ctrl ` 代表脫出字元,輸入想欲愛的 ASCII 控制字元。譬如講輸入空字元,著愛輸入 ` Ctrl ` + ` 二 `,毋是 ` ^ ` ` @ `,後者會顯示做兩字箍,前者干焦會顯示做一字元。

會當顯示字元

可顯示字元編號範圍是三十二呵咾一百二十六(零 x 二十五空 x 七 E), 九十五字。

三十二~百二六 ( 這馬九十五 ) 嘿字元 ( 三十二是空格 ),其中四十八~五十七為空到九十个阿拉伯數字。

六十五~九十為二十六个大寫英文字母,九十七喔~一百二十二號做二十六个小寫英文字母,做一寡標點符號、運算符號等等。

缺點

ASCII 的局限是干焦會當顯示二十六个基本拉丁字母、阿拉伯數字佮英式標點符號,所以只會當用來顯示現代美國英語(而且處理 naïve、café、élite 等外來語的時陣,著愛去除附加符號)。 雖然 EASCII 解決部份西歐語言的顯示問題,但是對閣較濟其他的語言猶原無能為力。所以,這馬的軟體系統大部份攏是採用 Unicode,特別是佮 ASCII 向下相容的 UTF ma八。

參見

  • EASCII(Extended ASCII)
  • EBCDIC
  • ISO / IEC 六百四十六
  • ISO / IEC 八千八百五十九
  • 控制字元
  • ASCII 藝術
  • ASCII 絲帶行動

參考資料