跳至內容

「文字檔案」:修訂間差異

出自Taiwan Tongues 台語維基
TaiwanTonguesApiRobot留言 | 貢獻
從 JSON 檔案批量匯入
 
(無差異)

於 2025年8月19日 (二) 21:51 的最新修訂

文字檔案(text file,textfile,flatfile)一般指干焦字元原生編碼構成的二進位電腦檔案,佮好額人相比,其實毋包括字樣的控制元素,會當予上簡單的文字編輯器直接讀取。==資料儲存==

因為結構簡單,文字檔案被廣泛用於記錄資訊,伊會當避免其他的檔案格式拄著的一寡問題。此外,做文字檔案中的部份資訊出現錯誤時,往往會當較好的對錯誤中恢復出來,而且閣繼續處理賰的內容。文字檔案的一个缺點是趨值較低,也就是講,其實本會當用閣較細的儲存空間記錄遮的資訊。

格式

ASCII

ASCII 標準予得干焦有含 ASCII 字元的文字檔案會當佇咧 Unix、Macintosh、Microsoft Windows、DOS 佮其他作業系統之間自由互動,啊若其他格式的檔案是真歹做到這點的。猶毋過,佇遮的做業系統當中,換行符仔並無仝款,處理非 ASCII 字元的方式嘛無一致。

MIME

文字檔案佇咧 MIME 標準中的類型為 " text / plain ",此外,伊通常閣附加編碼的資訊。佇咧 Mac OS X 出現進前,做資源分叉仔(resource fork)指定某一个檔案的類型為「TEXT」時,Mac OS 就認為這个檔案是文字檔案。佇咧 Windows 中,做一个檔案的副檔名做「txt」時,系統就認為伊是一个文字檔案。此外,佮特殊的目的,有一寡文字檔案使用其他的副檔名。比如講,電腦的原始碼嘛是文字檔案,𪜶的字尾是用來指明伊的程式語言的。

. txt

. txt 是包含真少格式資訊的文字檔案的副檔名。. txt 格式並無明確的定義,伊通常是講遐的會當予系統終端抑是簡單的文字編輯器接受的格式。任何會當讀取文字的程式攏會當讀取帶有 . txt 副檔名的檔案,所以,通常認為這種檔案是通用的、迒過平台的。

佇咧英文字檔案中,ASCII 字元集是上捷看著的格式,而且佇足濟場合,伊嘛是預設的格式。對重音符號來講佮其他的非 ASCII 字元,著愛選一種字元編碼。佇足濟系統內底,字元編碼是由電腦的區域設定決定的。捷看的字元編碼包括支援真濟歐洲的語言的 ISO八千八百五十九孵一。

因為真濟編碼干焦會當表達有限的字元,通常𪜶干焦會當用幾若種語言。Unicode 制定了一種試圖會當表達所有已經知影語言的標準,Unicode 字元集非常的大,伊囊括大多數已經知的字元集。Unicode 有多種的字元編碼,其中上定看著是 UTF ma八,這種編碼會當向下相容 ASCII,仝款內容的 ASCII 文字檔案佮 UTF 鋪八文字檔案完全一致。

Windows 的 . txt 檔案

微軟乎 MS-DOS 和 Windows 採用著仝款的文字檔案格式,𪜶攏使用 CR 和 LF 兩字元作為換行符,這兩字元對應的 ASCII 碼分別為十三佮十。通常,上尾一逝文字無法度換途符仔(CR-LF 標誌)結尾,包括記事本在內的真濟文字編輯器嘛無咧檔案的最後添加換行符仔。

大多數啦 Windows 文字檔案使用 ANSI、OEM 抑是講 Unicode 編碼。Windows所指的 ANSI 編碼通常是一个元組的 ISO 鋪八千八百五十九編碼,毋過對親像中文、日文、朝鮮文這款的環境,需要使用兩位元組字元集。佇咧過渡至 Unicode 前,Windows 直直用 ANSI做系統預設的編碼。而且 OEM 編碼,嘛是通常所講的 MS-DOS 頁碼,是 IBM 為較早 IBM 個人電腦的文字模式顯示系統定義的。佇全螢幕的 MS-DOS 程式內面同時使用了圖形的佮按行畫的字元。 新版本的 Windows 會用得使用 UTF 鋪十六 LE 和 UTF 鋪八等等的 Unicode 編碼。

展現

用文字編輯器拍開一个文字檔案了後,使用者會當看著會當讀的純文字內容。控制字元有時去予編輯器當做文字指令,有時予人當做親像純文字彼款可編輯的跳脫字元。儘管文字檔案內底有純文字資訊,但是通過特殊的方法,檔 àn-nāi 的控制字元(尤其是檔案結束字元)會當予純文字袂當見。

參考

==參見==* 文字編輯器

  • ASCII
  • Unicode
  • 記事本