檔案格式
檔案格式(英語:file format), 閣稱檔案類型,是指電腦為著儲存資訊使用的對資訊的特殊編碼方式,是用佇咧辨識內底儲存的資料。譬如講有的儲存圖片,有的儲存程式,有的儲存文字的資訊。每一類的資訊,攏會用得一種抑是幾若種檔案格式儲存佇咧電腦儲存內底。逐種檔案格式通常會有一種抑是講這个副檔名會當提來辨識,但是嘛可能無副檔名。副檔名會當幫助應用程式辨識的檔案格式。
對硬碟機抑是啥物電腦的儲存裝置來講,有效的資訊干焦零佮一兩種。所以電腦著愛設計有相應的方式來進行資訊-位元的轉換。對無仝款的資訊有無仝款的儲存格式。
概述
有一寡檔案格式予人設計用佇儲存特殊的資料,比如講:
- 影像檔案中的 JPEG 檔案格式干焦用於儲存靜態的影像,
- 而且 GIF 既然會當儉靜態影像,也會當儉簡單動畫;
- Quicktime 格式會當儉真濟種無仝款的媒體類型。
- 文字類的檔案有:
- text 檔案一般干焦儲存簡單無格式的 ASCII 抑是 Unicode 的文字;
- HTML 文件會當儉紮有格式的文字;
- PDF 伊會當儉內容豐富的,圖文並茂的文字。
仝一个檔案格式,用無仝的程式來處理可能產生足無仝的結果。比如講 Word 文件,用 Microsoft Word 看的時陣,會當看著文字的內容,而且用無格式的方式音樂放送軟體中的放送,產生的則是噪聲。一種檔案格式對某一寡軟體會產生有意義的結果,對另外一寡軟體來看,親像攏無路用途的數位糞埽。
規範
真濟檔案攏開始公開、無仝程度的規範或者是建議的格式。遮的規範或者是建議咧講資料按怎編碼,按怎排列。有當時仔嘛規定講敢有需要特定的電腦程式讀抑是處理。有兩款狀況下,檔案格式無公開。第一款情形是:開發者將檔案格式視作商業秘密毋願公開;第二項的狀況是:開發者毋願抑是開足少的時間用佇咧規範文件。
需要注意的是,使用無公開的檔案格式可能會帶來其他的成本。欲了解這个檔案提升,抑是需要迵過對得著的檔案來進行顛倒向工程,抑是通過向開發者付費來得著檔案的格式。第二種方式當中往往閣需要佮開發者簽訂無擴散協定。無論按怎兩種方式攏是費時,了錢的。
辨識檔案的類型
佇程式的角度來看,檔案是資料流,檔案系統為每一種檔案風格的規定矣存取的方法。比如講:元資料。無仝的作業系統攏慣勢的採取各自的方式解決這个問題,逐種方式攏有逐家的優欠點。
當然喔,現代的作業系統佮應用程式,一般攏需要遮所講的方法處理無仝的檔案,
副檔名
用副檔名辨識檔案格式的方式代先佇數字裝置公司的 CP / M 作業系統予人採用。若尾閣予人 DOS 和 Windows 作業系統採用。副檔名是指檔名中,上尾仔一个點(.)號後的字母序列。比如講,HTML 檔案通過 . htm 抑是 . html 副檔名辨識;GIF 圖形檔案用 . gif 副檔名辨識。佇咧早期的 FAT 檔案系統中,副檔名限制只能是三字元,雖罔這馬真大部份的作業系統已經無才有這種限制矣,真濟檔案室到今猶原採取三字元作副檔名。因為無一个正式的副檔名號標準,所以乎,有一寡檔案格式可能會採用仝款的副檔名,出現按呢的情況就會使作業系統錯誤地辨識檔案的格式,同時也予使用者造成兇惑。
副檔名的方式的一个特點是,改副檔名會致使系統誤判檔案格式。比如講,將 filename . html 簡單改名做 filename . txt 可以系統誤將 HTML 檔案辨識做純文字格式。就算講一寡熟手的使用者會當利用這个特點,但普通使用者真容易改名的時陣發生錯誤,煞予檔案變甲無法度使用。所以,現代的有一寡作業系統管理程式,比如講 Windows Explorer 加入限制向使用者顯示副檔名的功能。
特徵簽章 ( File header )
一種廣泛應用佇 UNIX 佮其衍生的作業系統上的方法是將一个特殊的數字存囥佇咧檔案的特定位置里。上蓋起初這个數字一般是檔案開始處的兩个位元組。這馬一般是將任何會當獨一無二的元序列攏會當做特徵簽章。比如講 GIF 圖形檔案是將檔案開始處的六个位元組做特徵簽章的,伊會當是 GIF 八十七 a 抑是講 GIF 八十九 a。但是嘛有一寡檔案誠歹過這種方式辨識,比如講 HTML 檔案。
採用這種方式會當閣較好的防止對檔案格式發生誤判,並且特徵簽章會當予出關於檔案格式的閣較詳細的資訊。這種方式的缺點是效率較低。特別是顯示大量的檔案的時,因為逐種特徵簽章具有無仝款的辨識方式,將消耗系統大量的資源對檔案格式進行判斷。副檔名佮後壁欲講的元資料方式因為採用固定格式的資料,會當進行快速匹配。應用程式往往利用特徵簽章來判斷檔案敢是完整佮有效。
元資料
最後一種方式共檔案格式的資訊存囥到磁碟特定的位置。
採用這種方式,元資料佮檔案本身分開存放。遮爾仔的缺點是會當移植性差。因為無仝的檔案系統之間元資料可能需要轉換。
蘋果 Macintosh 的類型碼
蘋果電腦的檔案系統為逐个檔案的 kha-tá-lok-guh 入口攏儉矣 _ 建立者 _ 和 _ 類型碼 _。遮的代碼叫做 OSType。比如講一个蘋果電腦建立的檔案的建立者會是 AAPL 而且 _ 類型 _ 嘛是啦 APPL。RISC 做系統採用類似的系統,用一个十二位元位的數字索引描述表。比如講:十六進位的 FF 五代表 PoScript,檔案類型就是 PostScript 檔案。
IBM / Microsoft 的擴充檔案屬性
HPFS , NTFS , FAT 十二 , FAT 十六 , 佮 FAT 三十二檔案系統會當儲存額外的檔案屬性資訊。伊是由名佮與名對應的值組成。譬如講擴充屬性「. type」用佇判斷檔案的類型,可能是值包括「Plain Text」抑是「HTML document」。 一个檔案會當有偌種屬性。
Unix 的擴充檔案屬性
ext 二,ext 三,ReiserFS 版本三,XFS,JFS 和 FFS 檔案系統允准儲存擴充的檔案屬性。伊是由名佮與名對應的值組成。名應當是獨一無二的。
MIME 類型
MIME 廣泛地用於誠濟 Internet 有關係的應用,而且當咧廣泛地採用著其他的應用。頭仔佇咧 RFC 一三百四十一明說明。MIME 用一个 _ 類型 _ / _ 子類型 _ 表示檔案的類型。比如講:text / html 代表檔案是 HTML 文件,image / gif 表示 GIF 檔案。MIME 上原初是用表示電子批的附件的類型。
參見
- 檔案格式列表
- 音訊檔格式
- 文件檔案格式
- 化學檔案格式
- 副檔名
- 圖形檔案格式
- 自由檔案格式列表
- 目的檔格式
- 視訊檔式
外部連結
- File extensions encyclopedia(英文)
- FileInfo . net-副檔名資源
- 按字母順序的副檔名佮檔案格式列表
- 程式設計師檔案的格式資源
- 檔案格式 | 中文官方站檔案提升解說、拍開軟體
- 格式之相爭自由軟體雜誌上關於檔案格式歷史的文章
- Magic signature database-Standard file format information and FFID registry
- File signatures ( aka magic numbers ) found in files to indicate their file type
- PRONOM technical registry
- Library of Congress file format information
- Intoduction to Uniform Type Identifiers
- Game File Format Central-A large and expanding list of detailed descriptions of game-related file-formats
- BIEW Binary vIEW project