會當紮的文件做一个格(英語:PortableDocumentFormat,縮寫:PDF)是一種用獨立佇咧應用程式、硬體、操作系統的方式表現文件的檔案格式。彼每一个 PDF 檔案包括固定布局的平面文件的完整描述,包括文字、字形、圖閣有其他需要顯示的資訊。PDF 檔案除平面的文字佮圖形以外,猶閣有可能包括邏輯結構的元素,注釋、表單、圖層、好額媒體(包括影片內容) 之類的互動元素,使用 U 三 D 抑是 PRC 的三維物件,以及多種其他的資料內容。PDF 規範閣提供啟用遮的功能的時陣需要加密功能、數位簽章、文件附件佮元資料等等。
PDF 源自一九九一年 AdobeSystems 共同創始人約翰 ・ 沃諾克發起的「Camelot 專案」。 二空空八年成做 ISO 標準的一部份,編號 ISO 三孵二千,上新的版本 ISO 三逢二千學二 : 二千空二十佇二空二空年十二月發布。
歷史
Adobe Systems 佇一九九三年免費提供了 PDF 規範,彼當陣佮 PDF 做伙競離跨平台文件格式的,猶閣包括講 DjVu(猶閣佇開發中)、 Envoy、CommonGround Digital Paper、Farallon Replica 佮 Adobe 家己本身的 PostScript(. ps)格式。佇咧全球的資訊網佮 HTML 文字猶未開始的時陣,PDF 佇桌面出版工作流技術中間真受歡迎。PDF 起初為 Adobe 所控制的專有格式,到二空空八年七月一日才去予官方以開放標準發行,並且由國際標準化組織以 ISO 三逢二千學一 : 兩千空八發布。此後,標準的控制權利便移轉到矣產業專家志願者所組的 ISO 委員會下底。二空空八年,Adobe 佇咧 ISO 三分二千四百十一發佈了公共專利許可,對著製作、使用、銷售佮發佈 PDF 相容的應用所需要的專利,攏嘛會讓買斷式授權。
PDF 一爿七含有一寡 Adobe 所定義的專有技術,如 Adobe XML 表單結構(XFA)和 JavaScript 著著 Acrobat 的擴充。遮的技術予 ISO 三千兩百龍眼一參照為對這个規範之完整實現袂使得抑是欠而且規範性的,但是𪜶並無予人標準化,其規格嘛干焦發佈佇 Adobe 的網站頂懸。遮的技術大部份也無予熱門的 PDF 第三方實現所支援。
二空一七年七月二八號,發佈了 ISO 三逢二千學二 : 二千空一十七(PDF 二孵空)。 ISO 三石二千峰二不將任何專有技術當做是規範性參照檔案。
二空二空年十二月十四號,發佈矣 ISO 三孵二千-二 : 二千空二十(PDF 二孵空)。 佇咧二千空一十七版本的基礎頂頭包括了對規範性參照的澄清、更正猶閣有其他的一寡重要更新。
技術基礎
PDF 檔案通常由向量圖形、文字佮點陣圖形構成。
PDF主要由三項技術組成:
- 衍生自 PostScript 頁面描述語言的子集,用伊的生做佮輸出圖形。
- 字型98入去 / 替換系統,會當使字型隨檔案做伙傳輸。
- 結構化的儲存系統,以縛定遮的元素佮任何相關內容到單個檔案,紮有適當的資料壓縮系統。
PostScript
PostScript 是一種執行佇直譯器以生成圖像的頁面描述語言,一个需要大量的資源的行程。毋但會當處理圖形,嘛有具 ` if ` 佮 ` loop ` 之類命令的標準程式語言特性。PDF 真大程度上是基於 PostScript,但是做簡單,以移除像這款的流控制特性,猶閣保持咧 ` lineto ` 之類的圖形命令。
通常,類 PostScript 的 PDF 代碼產生佇 PostScript 原始檔。以 PostScript 代碼輸出的圖形命令被收集並標記;其中文件所參考的任何檔案圖像或者是字型嘛予人收集,然後每一件攏予人壓縮做單一个檔案。 由此,規个的 PostScript 領域(字型、輸出、計量)會當保持完整。
做一个文件格式按呢,PDF 比較起來 PostScript 有一寡優勢:
- PDF 包含已經標記和解析的 PostScript 原始碼,以咧修改 PDF 頁面描述佮修改所產生的頁面造型之間直接保持一致。
- PDF(自一孵四版)支援真圖形透明度;PostScript 無支援。
- PostScript 是一種帶有隱形全域狀態的直譯語言,因此伴綴一頁的指令會當任何後續頁面的表現。所以,PostScript 文件內面所有的先進前的頁面伊著愛經過處理來決定所予出去的頁面的正確的表現,而且 PDF 文件內底每一頁無受其他的因素的影響。結果 PDF 檢視器允准使用者快速跳轉來到長文件的最後一頁,啊若一个 PostScript 檢視器需要會當顯示目標頁面進前繼續來處理所有的頁面(除可選 PostScript 文件結構規範已經予周密地遵守外)。
PDF 一堵六佮閣較懸版本支援1875入去 PDF 檔案的互動式三 D 文件,會用得使用 U 三 D、PRC 抑是其他各種三 D 格式躉入三 D 圖像。
技術概括
===檔案結構===PDF 檔案是 COS(" Carousel " Object Structure,Carousel 物件結構)格式的集。COS 也伴隨著 FDF 檔案。COS 樹檔案主要由物件組成,內底有八種類型:* 布林值,表示 true 抑是 false
- 數字
- 字捾
- 名稱
- 陣列,物件的指令性集合
- 字典,照名稱索引物件的集合
- 字串流,通常包含大量的資料
- 空物件會當是直接(1875入去其他的東西)抑是直接的。直接物件以物件號佮代號編號。這號做 xref 表的索引表予逐个物件對檔案開頭起的位元組偏移量。這設計允准有效的隨機存取著檔案中的東西,凡勢無需要寫規个檔案(增加新)即可做出小的改動。對 PDF 一孵五版開始,非直接物件嘛會當佇遮稱呼「東西流」彼字串流內底。這一增加檔案大細的技術有大量細的非直接物件,並且對置標 PDF 特別有用。
PDF 檔案有兩種輸出方式:非線性(非「最佳化」)和線性(「 最佳化」)。 非線性 PDF 檔案比線性的占用較細的硬碟空間,就算一部份的資料要求文件內面集合頁面通過 PDF 檔案分散開的存取愈慢。線性 PDF 檔案(嘛稱「最佳化」抑是「web最佳化」PDF 檔案)以使得網頁瀏覽器外掛程式無需要等待下載規个檔案來閱讀的方式構建,自從𪜶用線性的方式來寫入硬碟(親像頁面的順序)開始。PDF 檔案會當用 Adobe Acrobat 軟體抑是 QPDF 上佳化。
圖像模式
圖形佇咧 PDF 中呈現的基本設計是用非常類似 PostScript 中的方式,除了 PDF 一爿四加添的透明度的使用。
PDF 圖形使用裝置獨立性𥰔仔卡兒坐標系來咧講頁面的外觀。一个 PDF 頁面描述會使用矩陣來縮放、旋轉抑是毋著切圖形的元素。PDF 中的一个主要的概念是圖形狀態,也就是可能會通過頁面來講修改、儲存抑是還原的圖形參數的集合。PDF 有(就是一鋪六版的)二四種圖形狀態屬性,內底上重要的有:
- 當前咧變換矩陣(CTM), 決定坐標系
- 剪落的路草
- 色彩的空間
- 阿爾法複合,透明度的關鍵部份
向量圖
PDF 中的向量圖攏親像佇咧 PostScript 中一項,是由路徑組成的。路徑通常由直線佮濟項的貝茲曲線組成,但是嘛會當對文字的外甥構建。無仝 PostScript,PDF 無允准𤆬直線和曲線的單一路徑去組合文字阿啄仔。路徑會當予人描繪、 添充抑是用剪取。描繪佮添充通用任意圖形狀態當中的色彩集,包括式的款。
PDF 支援多種調色盤類型。上簡單的是 thài-lù 式的樣,其中藝術作品的一部分予人指定以予人重複地畫的圖樣。這可能是彩色 thài-lù 式的樣,紮紮咧平平物件內底的指定的色水,抑是延遲色莫編碼到式式已經畫製造的時陣的無色的 thài-lù 式的樣。對 PDF 一爿三開始閣有矣底紋式的模式,連紲畫出無仝的色水。七種底紋式形中上簡單的是軸向底紋(Type 二)和徑向底紋(Type 三)。
點陣圖
PDF 咱的點陣圖(這號做 Image XObjects)因為帶相關字串流的字典呈現。字典描述了圖像的屬性佮包含圖像資料的流。(罕得看的是,點陣圖無定會做一个內嵌圖像予直接去1875入去頁面描述。)圖像通常攏出佇壓縮的目的過濾。PDF 中支援的圖像過濾器包含著常用的過濾器
- ASCII 八十五 Decode用佇字支流的囥入七个 ASCII 的過濾器
- ASCIIHexDecode類似 ASCII 八十五 Decode,毋過相容性低
- FlateDecode是因為 RFC 一千九百五十佮 RFC 一千九百五十一所定義的 zlib / deflate演算法(亦即 gzip,但是毋是 zip)定定用過濾器;引入來的 PDF 一孵二;會當用兩組預測功能中的一組會當進一步相容 zlib / deflate 演算法:出自 TIFF 六鼻空規格內底的 Predictor 二和來自 PNG 規格(RFC 兩千空八十三)的預測器(過濾器)
- LZWDecode是因為 LZW 演算法的過濾器可用兩組預測功能內底的一組進一步相容 LZW 壓縮:出自 TIFF六鼻空規格內底的 Predictor 二和來自 PNG 規格的預測器(過濾器)
- RunLengthDecode使用遊程編碼演算法佮圖像指定的過濾器用佇咧重複資料的字串流的簡單的硩縮演算法
- DCTDecode是因為 JPEG 標準的有損過濾器
- CCITTFaxDecode是因為 ITU-T T . 四和 T . 六中定義的 Group 三抑 Group 四 CCITT(ITU-T)傳真壓縮標準的無失真二值(烏白)過濾器
- JBIG 二 Decode是因為 JBIG 二標準的有損抑無失真二值(烏白)過濾器,引入來 PDF 一孵四
- JPXDecode是因為 JPEG 兩千標準的有損無失真過濾器,引入來 PDF 一爿五通常 PDF 中包含的所有圖像1875入去圖像,猶毋過 PDF 允准圖像資料通過使用外部字串流或者是替代圖像儲是存在外部的檔案。PDF 的標準子集,包括講 PDF / A 和 PDF / X,禁止遮的特性。
文字
文字佇咧 PDF 中以頁面內容字串流中的「文字元素」呈現出來。一个文字元素指定字元應佇咧指定位置描繪。字元用所選字型源的編碼指定。
字型
PDF 中的字型物件是對數位字型的描述。可能是字型中的字元是咧講,抑是包含1875入去的字型檔案。後者叫1875入字型,前者叫做鬧熱入字型。所謂入去的字型檔案提升使用的標準數位字型檔案:Type 一(佮伊的壓縮版變種CFF)、TrueType和(自 PDF 一堵六版起)OpenType。另外咧PDF 支援由 PDF 圖形處理器描述的字型組件中的Type 三反種。
Standard Type 一字型(Standard 十四字型)
以 Standard 十四字型著稱呼四種字型佇咧文件中 PDF 有特別的意義:
- Times(v 三,定規、斜體、粗體佮粗斜體)
- Courier(定規、斜體、粗體佮粗斜體)
- Helvetica(v 三,定規、偽趨體、粗體佮粗偽趨體)
- Symbol / Zapf Dingbats
遮的字型有時叫做 Base 十四字型。遮的字型抑是仝度量會合的彼个替代字型,你必須愛會當用佇咧所有 PDF 閱讀器上,而且毋免納入去PDF。PDF 檢視器著愛掌握遮的字型度量。無字型若無允人入去 PDF 就可能會予人替換。
編碼
文字串中,字元用編碼對映字形佇咧做前字型的字元代碼(整數)顯示。預定義的編碼有偌種,包括講 WinAnsi、MacRoman,猶閣大量東亞語言編碼,而且伊彼字型會當有家己的編碼。(就算 WinAnsi 和 MacRoman 編碼取自 Windows 和 Macintosh 作業系統中歷史上的這个專有編碼,用這類編碼的內容佇任何平台頂攏執行的好。)PDF 會當指定會當使用的預定義的編碼、字型內底建編碼,抑是提供預定義抑是內底建編碼的查詢表示(毋著 TrueType 字型推薦)。 PDF 中的編碼機制是為 Type 一字型設計的,而且應用著 TrueType 字型的規則是複合的。
對大型字型或者是紮非標準字型的字型,特殊編碼 Identity-H(用佇橫寫)抑是 Identity-V(用佇咧徛寫)被使用。若是關於字元的語意資訊予人預定義,這類字型有必要提供 ToUnicode 表。
透明度
PDF 的原始圖像模型像 PostScript 的 opaque:頁面上咧畫的每一个個物件完全替換早前佇仝一个標記的任何物件。佇咧 PDF 一爿四中圖像模型予人擴充以允准透明度。使用透明度的時,新物件佮早前標記的物件互相作用產生混合的特效。透明度添加到 PDF 由寫來 PDF 一 .佮早期的規格的產品內底予人無注意設計的新的擴充方法完成。結果,使用少量透明度的檔案佇舊的檢視器中可能會以被接受地視圖檢視,但大量用透明度的檔案佇舊的檢視器當中會顯示無正確抑若無警告。
透明度擴充是因為透明度組、混合模式、形狀佮 alpha 的關鍵概念。這一模式敆牢咧對應 Adobe Illustrator 九的特性。混合模式因為彼當陣 Adobe Photoshop 所用的。PDF 一孵四規格出版的時陣, 用佇計算混合模式的公式予人 Adobe 保密。此後𪜶予人公佈。
PDF 規格內底透明度組的概念獨立於 Adobe Illustrator 之類的應用中已經有的「組」抑是「層」的概念。遐的反映物件之上的邏輯關係的分組咧編輯遐的物仔的時陣有意義,但是毋是圖像模型的一部份。
互動式元素
PDF 檔案無定包括注釋、表單、影片佮 Flash 動畫之類的互動式元素。
好額媒體 PDF是一个用來描述會當騙入去抑是鏈入去 PDF 的互動式內容的術語。這內容著愛用 Flash 檔案提供。Adobe 收購 Macromedia 的時陣,公司的主業是 Flash,而且 Flash 去予放送去予人去搝入 Adobe Acrobat,Adobe Reader,徙掉用於是 Flash、QuickTime 抑是 Windows Media 之類第三方外掛程式的需要。不幸的是,這造成 QuickTime 影片對 PDF 予人禁按呢佮蘋果公司的必巡。好額人客專家 Robert Connolly 相信這件代誌引發蘋果佮 Adobe 之間 Flash iPhone / iPad 爭論頂懸的衝突。好額媒體 PDF 無佇咧蘋果的 iPad 啥物彼款 iOS 裝置操作,而且互動性受著限制。
互動式表單是一个添加表單到 PDF 檔案格式的機制。
PDF 當前支援用佇整合資料佮 PDF 表單的兩種無仝的辦法。兩種格式今仔日並存在 PDF 規格:
- AcroForms(閣叫Acrobat forms)引入來 PDF 一鋪二格式的規格並包含講所有後來的 PDF 規格。
- Adobe XML 表單架構(XFA)的表單,引入來 PDF 一鋪五格式的規格。XFA 規格無包括講 PDF 規格,干焦做做過去爾特性會當參考。Adobe XFA 表單無佮 AcroForms 相容。====AcroForms====
AcroForms 佇咧 PDF 一鋪二格式予人引入去。AcroForms 允准使用物件(如文字方塊、選擇鈕等等)佮一寡代碼(如 JavaScript)。
咧標準PDF 動作類型以外,互動式形式(AcroForms)支援提交、重設佮匯入資料。「提交」動作傳送所選表單欄位佮值的名稱予指定的統一資源定做符(URL)。 互動式表單欄位名稱佮值凡勢會予人看現出意格式提交(號決於輸出格式、提交的 PDF 和 XFDF 旗標的設定):
- HTML 表單格式(自 PDF 一孵五起用 HTML 四配零一規格;一孵二起用 HTML 二孵空)
- 表單資料格式(FormsData Format,FDF)
- XML 表單資料格式(XML Forms Data Format,XFDF)(擴充 XFDF 規格,二孵空版;自 PDF 一爿五起予人支援;佇咧 PDF 一孵四中替換 XML 表單提交格式定義)
- PDF(規个文件會當提交予,毋是單獨的欄位佮值)。(PDF 一爿四中定義)
AcroForms 會當保持表單欄位佇包含 key : value 組合的外部的單獨的檔案。內部的檔案可能用 FDF 和 XFDF 檔案。使用權(UR)簽章定義回入表單資料檔案以 FDF、XFDF 佮文字(CSV / TSV)格式,佮以 FDF 佮 XFDF 格式對資料檔案匯出檔案的權利。
表單資料格式(FDF)
表單資料格式(Forms Data Format,FDF)是因為 PDF,使用仝款的句法佮基本上仝款的檔案結構,但是比 PDF 簡單,自從 FDF文件的主體由干焦一个要求的物件組成就開始。表單資料式定義佇咧 PDF 規格(自 PDF 一孵二起)。 表單資料格式會當佇咧表單資料到侍服器、接收回應佮組合到互動式表單的時陣予人使用。閣會當予人用來匯出表單資料到會當導覽著相應的 PDF 互動式表單的單獨的檔案。對 PDF 一孵三開始,FDF 會當予人用來定義用佇咧對所應用的 PDF 文件分開的注釋的容器。FDF 通常封裝 X . 五百空九憑證之類的資訊、要求憑證、設定 kha-tá-lok-guh、設定時間才侍服器佮為網路傳輸1875入去 PDF 檔案。FDF 使用 MIME 內容類型 application / vnd . fdf、副檔名 . fdf,並佇咧 Mac OS 用檔案類型'FDF'。匯入和匯出獨立 FDF 檔案的支援無予自由抑是免費 PDF 軟體廣泛的實現。比如講,Evince、Okular、Poppler、KPDF 抑是 Sumatra PDF 無敆入 / 匯出的支援,毋過,Evince、Okular 和 Popller 坉落去 PDF Acroforms 並佇咧 PDF 中儲存已經填寫資料。匯入獨立 FDF 檔案的支援咧 Adobe Reader 中得著實現;匯入和匯出支援(包括佇 PDF 中儲存 FDF 資料)做範例佇咧 Foxit Reader 和 PDF-XChange Viewer Free 中得著實現;PDF 檔案中 FDF 資料的儲存嘛去予 pdftk 支援。
XML 表單資料格式(XFDF)
XML 表單資料格式(XFDF,XML Forms Data Format)是表單資料式的 XML 版,猶毋過 XFDF 只執行 FDF 內含表單佮注釋的子集。FDF 字典中的一寡詞條無等價於 XFDF 的,像狀態、編碼、JavaScript、頁面關鍵字、1875入式 FDF、差異佮目標。此外,XFDF 無允准佇基於已經予定的資料的新頁面大量生成或者是添加;就親像使用 FDF 檔案的時陣會當予人完成的仝款。XFDF 規格予人參照於(但是無包括講)PDF 一爿五規格(佮其實以後的版本)。 伊予單獨描寫做是「XML 表單資料結構規格」(XML Forms Data Format Specification)。 PDF 一爿四規格允准以 XML 格式提交表單,猶毋過佇 PDF 一爿五規格內底 XFDF 格式提交取代。XFDF 符合 XML 標準。
到二空一六年十二月,XFDF 三更零佇咧 _ ISO 一爿九千四百四十四孵一 : 二千空一十六–Document management–XML Forms Data Format–Part 一 : Use of ISO 三二千學二 ( XFDF 三-c零 ) _ 的名義下成做 ISO / IEC 標準。這个標準是 ISO 三鋪二千學二的規範性參考資料。
XFDF 會用得佮 FDF 相等的方式,若是提交表單資料予侍服器,做出修訂,然後倒轉來,並且新表單資料予人敆入去互動式的表單。伊閣會當用來匯出表單資料到會當予人導轉去相應的 PDF 互動式表單的單獨的檔案。
Adobe XML 表單架構(XFA)
PDF 一 .五格式當中,Adobe Systems 引入來新的、專有的氣口,號做 Adobe XML 表單架構(XFA)。 XFA 二鋪空二參照佇 PDF 一爿五規格(佮以後的版本), 單獨描寫講是《Adobe XML Forms Architecture ( XFA ) Specification》,有幾个版。XFA 規格無包括佇 ISO 三逢二千學一 PDF 一人七並干焦做理由 Adobe 建立的外部專工做參考。佇咧 ISO 三逢二千學二(PDF 二孵空)當中予人棄用。
Adobe XFA 表單無佮 AcroForms 相容。Adobe Reader 包含使用 XFA 表單的「禁用特性」,干焦咧拍開只來自 Adobe 的這个可行的技術建立的 PDF 文件時啟用。XFA Forms 無相容 Adobe Reader 六以前的版本。
XFA 表單會當建立抑是用作 PDF 檔案抑是作為 XDP(XML 封包)檔案。PDF 中 XFA 源的格式由 XML 封包規格描述。XDP 可能做單獨的文件,嘛可能佇 PDF 文件的內部紮。XDP 提供打包周邊 XML 容器內底的表單組件的機制。XDP 嘛是可以以打包一個 PDF 檔案,伴隨 XML 表單佮模板的資料。PDF 可能包括 XFA(佇咧 XDP 格式中), XFA 伊嘛是可能包括 PDF。咧用 XFA 表單 XFA(XML 表單架構)語法對一个應用徙去另外一个應用的時陣,𪜶必須以 XML 封包封裝。
當 PDF 和 XFA 來共敆做堆,結果是任意頁面中的 XFA 表單崁矣 PDF 背景。這隻構有當時仔予人提做 XFAF(XFA Foreground,XFA 前景)。 替代方法是直接佇 XFA(毋免 PDF,抑是講干焦紮有 PDF 標記的上細條構造 XFA 的容器的「掛外掛 PDF」,抑是用靜態 XFA 表單的預彩現描寫作為 PDF)展開所有的表單,包括樣板檔案。這有時予人叫做是全 XFA。
PDF 一孵五開始,可變文字欄位的文字內容,佮伊的標記註解可能包含格式的資訊(看板的資訊)。 遮的好額字串是符合 XML 表單架構規格二孵空二(本身是 XHTML 一垺零規格的子集)定義的富文字慣例的 XML 文件,擴充矣 CSS 二項式屬性中受限的設定。PDF 一爿六中,PDF 支援 XML 表單架構(XFA)規格二石二定義的富文字元素佮屬性。PDF 一鈕七中,PDF 支援 XML 表單架構(XFA)規格二石四定義的富文字元素佮屬性。
多數 PDF 處理器無處理 XFA 內容。生成外掛 PDF 的時陣會去予人建議包括著 PDF 標記的一个簡單的單頁PDF 圖像顯示警告(如:「 為著欲檢視本文件的全部內容,你需要新版的 PDF 檢視器」等。)會當彩現 XFA 內容的 PDF 處理器應該無現實警示頁面圖像或者是以動態表單內容快速替換。帶有一寡 XFA 彩現功會當支援的 PDF 軟體的例包括 Adobe Reader for Windows、Linux、Mac OS X(但是毋是 Adobe Reader Mobile for Android / iOS)抑是Nuance PDF Reader。
邏輯架構佮可讀性
「 標籤」PDF(ISO 三逢二千學一 : 兩千空八十四抹八)有文件架構佮語意資訊,以允准會靠的文字抽取及使用。技術起來講,標籤PDF 是建立佇咧 PDF 一交三所引入的邏輯結構框殼頂,對其格式的程式來使用。標籤 PDF 定義一組標準結構型別及屬性,允准頁面的內容(文字、圖形佮圖片)了後去予人提再利用佇其他的用途。
當PDF 檔案干焦供列印時,並無要求支援標籤 PDF。因為按呢一特色是非必須的,而且 ISO 三鋪二千石一對標籤 PDF 的規則相對模糊,所以佇消費性裝置內底,包括輔助技術(AT), 標籤 PDF 的支援有的差差參參。
一个專門針對會當讀性、為 ISO 標準之子集的 PDF 規格:PDF / UA 佇咧二空一二年頭一改發佈。
安全佮簽章
一份 PDF 檔案可能會當用來驗證的擔保或者數位簽章加密。由 Acrobat PDF 提供的標準擔保以兩種無仝的方法佮兩種無仝的密碼組成,使用者密碼,加密檔案並且阻止開啟;所有的人密碼,指定就算文件被解密的時陣應該被限制的操作,會當包括講:列印、對文件複製文字佮圖像、修飾文件,抑是添加抑是刪除文字注釋佮 AcroForm 欄位。使用者密碼(控制開啟)加密檔案並要求密碼破解以去除,難度取決佇密碼長度佮加密演算法—— 伊可能非常安全(假使好的密碼佮加密演算法無有已經知的攻擊手法)。 所有的人密碼(控制操作)無加密檔案,反取決佇客戶捀軟體以遵循遮的限制,而且無安全。所有的人密碼會當予真濟通常會當用 PDF 破解軟體徙掉,包括一寡自由的線頂服務。由此,文件作者囥佇咧PDF 文件內底的使用限制無安全,而且袂當佇一旦檔案內底散佈時保證;這一危險就咧使用 Adobe Acrobat 軟體以建立抑是編輯 PDF 檔案應用這類限制的時陣顯現出來。
就算無徙掉密碼,真濟免費抑是開源 PDF 讀器忽略權限「保護」並且允准使用者列印或者是做文字挽要的複製,袂輸文件無去予密碼保護限制仝款。
一寡解決方案像 Adobe 的 LiveCycle Rights Management 閣較強化資訊權利管理的方式,毋但會當限制啥物人拍開文件,而且以標準的安全處理程式做袂到的方式會當靠的執行權限。
使用權
對 PDF 一孵五起來,使用權(UR)簽章用來啟用佇一寡 PDF 檢視器應該用著毋是預設的附加的互動式特性。這一簽章用來驗證由真實的授權機構有可能予𪜶的許可。比如講,伊會當允准使用者:
- 儲存伴有修訂表單佮 / 抑是注釋資料的 PDF 文件
- 對 FDF、XFDF 佮文字(CSV/ TSV)格式中的資料檔案匯入
- 對 FDF 和 XFDF 格式中的資料檔案匯出
- 對資料提交
- 對號名的頁面模板具體呈現新頁面
- 應用一个數位簽章到已經有的數位簽章表單欄位
- 建立、刪除、修正、複製、匯入、匯出注釋譬如講,Adobe Systems 佇咧 Adobe Reader 中授權啟用附加特性,使用公鎖密碼學。Adobe Reader 使用對一个 Adobe 授權的權威認證的驗證個簽章。PDF 一爿五規格宣稱其他的 PDF 閱讀器應用會當為𪜶家己的目的自由使用這仝款機制。
檔案附件
PDF 檔案會當有文件級佮頁面級的檔案附件,讀者會當存取並開或者是儲存在原生的檔案系統。PDF 附件會當做為範例用 pdftk 加甲已經有的 PDF 檔案。Adobe Reader 提供對附件的支援,而且因為 Poppler 的閱讀器如 Evince 抑是 Okular 嘛有對文件級附件的支援。
元資料
PDF 檔案會當包含兩種類型的元資料。第一種是文件資訊字典,一套親像作者、標題、主題、建立佮更新日期的關鍵字 / 值欄位。這儲存佇可選的檔案尾仔。有一小組欄位是有定義的,而且若有需要,會當用附加的文字欄位擴充。
後來佇咧 PDF 一爿四中,對元的資料流的支援予人加入,用會當延伸元資料平台(XMP)來添加像咧其他的檔案彼款的是因為 XML 標準的會當延伸的元資料。這允准元資料附加到文件內底的任何字串流,諸如關於1875入式的插圖的說明,猶閣有規个文件(附加到文件 kha-tá-lok-guh), 使用會當延伸的綱要。
相關技術
Mars
Adobe 捌探索是因為 XML 的下一代 PDF,代號 Mars。
Mars 的圖形元素的格式有時仔簡單就咧講 SVG,毋過根據二空空七年十一月的零鷹八版草案規格(§ 三 Mars SVG Support)這格式實際上干焦接近於這間SVG:伊仝時陣包括 SVG 新增佮移除的部份,一般袂使予人標準 SVG 工具檢視抑是建立:一寡物件佇咧 SVG 檢視器佮 Mars 檢視器之間看起來明顯無仝。
Adobe Systems 佇兩千空八遮的停止開發 Mars。
技術問題
掃描的文件
由掃描器硬副副文件建立的 PDF 檔案包含原始文字無由相仝的文件直接建立的 PDF 檔案彼款相仝的架構。掃描的文件原本地包括文件的圖片,無關係文字的資訊。只要使用者會當看著伊只是另外一个 PDF 檔案,帶有對其他的任意所在來的袂當分的名稱佮副檔名;好的掃描器凡勢會影響咧看原生的 PDF 檔案相仝,即使是視覺上品質真䆀的檔案,定定帶有扭曲的頁面,會當予出其本性。毋過,檔案大細會明顯無仝,而且袂使搜揣文字。對精確品質的掃描會當用帶光學字元辨識(OCR)的適合的軟體辨識文件中的文字,並且入文件去予其中會當檢索,攏著愛看OCR 的準確性。
可讀性
PDF 檔案會當專門為著欲予殘疾人閱讀來建立。節甲二空一四年 ( 二千空一十四-Missing required parameter 一=_ month _ ! ) PDF檔案格式有使用中會當包含標籤(XML)、 替換文字、標題、音訊描述等等的。對標 PDF 佇咧 PDF / A 影一 a 規格內底予人要求。一寡軟體會當自動生成置標 PDF,毋過這個特性毋是預設啟用。捷看的螢幕閱讀器,包括講JAWS、Window-Eyes、Hal 和 Kurzweil 一千佮三千會當朗讀標 PDF,就親像 Acrobat 和 Acrobat Reader 後來的版本仝款。此外,對標 PDF有視覺障礙的讀者重排和放大。問題猶原佇咧予舊版 PDF 佮掃描的文件生的 PDF 加標記。遮的情況下,通好讀性標記佮重排就袂當用,而且著愛用手動抑是 OCR 技術處理。遮的過程對一寡殘疾人是達到無到的喔。
著 PDF 可讀性的一个足大的挑戰是 PDF 文件有三種無仝的視圖,攏著愛看著文件的建立,會佮其他視圖相矛盾。遮的視圖有:物理視圖、標記視圖佮內容視圖。物理視圖會當顯示佮列印(多數人認為的 PDF 文件)。 標記視圖是螢幕閱讀器佮其他存取技術用來予有障礙的使用者紮來高品質導航佮閱讀體驗的。內容共看圖樣 PDF 內容字串流的物件的物理排列,並且可能由無完全支援標記視圖的軟體顯示,如 AdobeReader 的 Reflow 特性。
是因為 ISO 三更二千學一的可閱讀 PDF 國際標準 PDF / UA 佇二零一二年以 ISO 一爿四千兩百八十九孵一發布,並為可閱讀 PDF 技術建立規範的語言。
病毒佮漏洞
PDF 附件帶病毒上先發現佇二空空一年。這號名做 OUTLOOK . PDFWorm 抑是 Peachy 的病毒,會通過 Microsoft Outlook 以附件的形式將家己傳送到位 Adobe PDF 檔案。然後會用 Adobe Acrobat 共這个家己啟用,但是袂去予 Acrobat Reader 啟用。
隨著時間推捒,新的空隙佇咧 Adobe Reader 的濟个版本予人發現,促使企業發出安全性修復。其他 PDF 閱讀器嘛較會受著影響。惡化的一个因素是 PDF 閱讀器會予組態佇網頁1875入去 PDF 彼陣自動啟動,為攻擊𤆬來矣載體。若惡意的網頁包含一份利用 PDF彼个漏洞感染的 PDF 檔案,系統會無法度抵抗,就算瀏覽器是安全的。其中一寡空隙是因為 PDF 標準允准 PDF 文件用 JavaScript 指令碼指令的結果。佇咧 PDF 閱讀器中禁止執行 JavaScript 對較冗的遐的未來的空縫,就算講這無阻止 PDF 檢視器其他部份的空縫。安全專家稱 JavaScript 對於 PDF 閱讀器來講毋是基本的,而且出於禁止 JavaScript 的安全保障較贏咧任何造成的相容性問題。阻止 PDF 檔案漏洞的一種方式是有本地抑是網路服務能佇咧閱讀進前共檔案轉換做其他的格式。
二空一空年三月三十號安全專家 Didier Stevens 報告 Adobe Reader 佮福昕閱讀器予電視若是使用者經詢問允准啟動的時執行惡意會當執行檔的空隙。
使用限制佮顯示
PDF 可能會加密,致使檢視抑是編輯內容的時陣會要求輸入密碼。PDF 參考書同時定義四十位和一百二十八个元加密,攏運用 RC 四和 MD 五的複雜系統。PDF 參考冊閣定義第三方會當制定𪜶家己的 PDF 加密系統的方式。
PDF 檔案無定閣包含1875入去的 DRM 限制,提供限制複製、編輯抑是列印的進一步控制。複製、編輯抑是列印的限制取決佇閱讀軟體遵循𪜶,因此𪜶提供的安全機制是有限的。
PDF 參考書有面向終端使用者概覽的技術細節。就親像 HTML 檔案仝款,PDF 檔案會當向網路侍服器喔提交資訊。這會當予人用來追蹤客戶捀 PC 的 IP 位址,這一過程予人號做背景連線通訊。Acrobat Reader 升級到七又閣有空 . 五以後,使用者會予人提示「. . . via a dialogue box that the author of the file is auditing usage of the file , and be offered the option of continuing」。Adobe 通過 LiveCycle 安全侍服器提供針對特定的文件設定安全策略的方法。這會當包括要求使用者認證並且限制文件會當予離線拍開的時陣會當予存取或者是載入的時期。PDF 文件一旦予人結束到策略侍服器佮指定策略,這个策略會當予所有人改抑是復原。這个策略控制文件,抑無就是「佇自然狀態下」。 逐个文件拍開抑是關掉事件嘛會使予策略侍服器追蹤。這个策略侍服器會使對個人設定,抑是 Adobe 通過 Adobe 線頂服務提供公共服務。佮其他 DRM 形式仝款,依附遮的策略佮限制有可能會,嘛有可能袂予閱讀器軟體執行。
預設的顯示設定
PDF 文件會當包含顯示設定,包括頁面顯示輸出和縮放級別。拍開文件的時陣 Adobe Reader 用遮的設定去替換使用者的預設定。免錢的 Adobe Reader 袂當徙掉這類限制。
內容
PDF 檔案通常混合了向量圖形、文字佮點陣圖。PDF 的基本內底包括講:
- 文字儲存做內容字葩(就是毋是文字本身)
- 由圖形和線條組成的用佇咧說明和設計的向量圖形
- 由相片和其他類型的圖片組成的點陣圖佇近期 PDF 標準修訂當中,PDF 文件閣支援閣支援(文件內部抑是網頁)、 表單、JavaScript(會過 Acrobat 三更零的外掛程式啟用), 或者是其他任意類型的能用外掛程式控制的可1875入內容。
PDF 一孵六支援互動式三 D 文件1875入去 PDF——三 D 繪圖通用 U 三 D 抑是 PRC 佮其他多種格式的1875入去。
佇電腦螢幕頂懸看起來相𫝛兩个 PDF 檔案有可能大細無仝啦。比如講,一个懸解析度點陣圖比低解析度的占閣較濟的儲存空間。通常閣較懸的解析度閣較適宜列印文毋是顯示螢幕。其他可能影響檔案大細的可能有1875入全部字型,尤其是東亞字型,猶閣有共文字存做圖片。
軟體
PDF 通常免費提供,而且真濟版本會當對濟項來源提著。
有真濟軟體選項用來建立PDF,包括內建於 Mac OS X 佮多數 Linux 發行版、LibreOffice、Microsoft Office 二千空一十六、WordPerfect 九、Scribus 真濟有適用著 Microsoft Windows 的 PDF 列印驅動、pdfTeX 排版系統、DocBook PDF 工具、圍踅 Ghostscript 佮 Adobe Acrobat 本身開發的應用猶閣有 Adobe FrameMaker 的 PDF 排印功能。Google 的線頂辦公套件 Google Docs 也允准上傳、儲存為 PDF。
光柵圖像處理器(RIPs)用佇轉換 PDF 檔案為點陣圖式用適應來成成佇咧紙頂懸佮其他媒體的印表機、數字生產印刷機以及一種被稱做柵格化的行程中的印前。有直接處理 PDF 能力的 RIP 包括咧出自 Adobe Systems 和 Jaws 的 Adobe PDF 排印 ia̋n-jín 佮出自 Global Graphics 的 Harlequin RIP 當中。
有一寡軟體會當直接建立空白的 PDF 文件,比如講 Adobe 官方的 Adobe Acrobat DC,但是通常意義毋大;因為乎 Adobe Acrobat 並無真𠢕對文件進行排版。
因為乎 PDF 具有完美展現檔案原貌的功能,市面上也有一部份軟體並毋是為 PDF 搤生,但是通過一寡開發函式庫抑是圖樣繪製框嘛有PDF 匯出功能。
一寡用於編輯 PDF 檔案的特殊軟體,通過受誠濟限制並且比建立佮編輯標準會當編輯文件格式閣較貴參參的選擇。Inkscape 空曉四六佮以後版本允准通過 Poppler 加入去中央的轉譯步驟編輯 PDF。
Adobe Acrobat DC 允准使用者對一个未加密的 PDF 檔案或者是有相關權限使用者著 PDF 檔案進行編輯,同時閣內底起矣 OCR 辨識、注釋、表單 ió-bih、合併,數位簽章等十分完善的功能
Serif PagePlus 拍開、編輯佮儲存已經有的 PDF 文件,猶閣有軟體套件中的建立的文件的發布。
Microsoft Office Word 嘛支援拍開、編輯佮儲存已經有的 PDF 文件的編輯功能。
Enfocus PitStop Pro,Acrobat 的外掛程式,容允 PDF 檔案的手動佮自動編輯,同時免費的 Enfocus Browser 會當使編輯 PDF的低階別架構成做可能。
大多數的 TeX 檔案經過編譯系統了後預設輸出格式為 PDF 檔案
注釋
Adobe Acrobat 是允准使用者予已經建立的 PDF 檔案注釋、突顯佮添加筆記的專有軟體的一个案例。作為自由軟體會當用的(GNU 通用公共許可協定許可下)一个 UNIX 應用是 PDFedit。另外一个 GPL 授權的原生 UNIX 應用是 Xournal。Xournal 允准以無仝款的字型佮色水注釋,佮用佇咧文字抑是段落的快速下劃佮突顯線條的規則。Xournal 猶閣有一个用於四角形、矩形佮圓形的形辨識工具。Xournal 中的注釋會當予人徙振動、複製抑是講貼著。免費軟體福昕閱讀器,適用佇咧Microsoft Windows,允准注釋文件。Tracker Software 的 PDF-XChange Viewer 的免費版允准無受限制的注釋佮標記。蘋果 Mac OS X 內建 PDF閱讀器 Preview 嘛會當親像免錢的軟體 Skim 彼注釋,後者支援佮 LaTeX、SyncTeX 和 PDFSync 整合,以及佮 BibDesk 參考文獻管理軟體整合。免費軟體 Qiqqa 會用得建立總結所有注釋的報告,而且筆記通過𪜶的 PDF 函式庫做出來。
對著行動版的注釋,iAnnotate PDF(來自 Branchfire)和 GoodReader(來自 Aji)容允著 PDF注釋以及匯出注釋的挽欲。
猶閣有一寡支援注釋 PDF 佮其他的文件做一个格 web 注釋系統,如 A . nnotate、crocodoc、WebNotes。
佇咧 PDF 予人向望有紙質文件的全部功能的所在,墨水注釋會予人要求。一寡接受來自滑鼠的墨水輸入的程式可能無夠通對應平板的手寫輸入。PC 上已經有的解決方案包括 PDF Annotator 和 Qiqqa。
其他
PDF 軟體做線頂服務的例包括用於檢視和儲存的 Scribd、用佇線頂編輯的 Pdfvue 佮用著 PDF 轉換的 Zamzar。
一九九三年出自 Global Graphics 的 Jaws 點陣圖處理器成做頭一個不用轉換到其他格式原生產生 PDF 的銷售用的印前 RIP。公司佇一九九七年予𪜶的 Harlequin RIP 發佈了一个有仝款相容性的更新。
愛克發-吉華一九九七年推介並且賣 Apogee,第一个是因為 PDF 的印前工作流系統。
誠濟商業的膠印機接受遞交發布就緒的 PDF 檔案做印刷的來源,特別是 PDF / X 影一 a 子集佮仝款的變種。發布就緒的 PDF 檔案的提交是嘿接收已經收集本地檔案的工課無確定性需求的替代。
PDF 予人選做是 Mac OS X 的「在地」元檔案格式,取代早期 Mac OS 的 PICT 格式。Quartz 圖形層的圖像模式基於 Display PostScript 和 PDF 把有的模式,產生伊號伊的名 Display PDF。Preview 應用佮 Safari 網頁瀏覽器二交零佮以後版本攏會當顯示 PDF 檔案。著 PDF 的系統級支援予得 Mac OS X 應用會當自動建立 PDF 文件,共𪜶提供 OS 標準的列印架構支援。檔案會當揤檔案檔頭輸出為 PDF 一鋪三格式。佇咧 Mac OS X 十曉空到十三版截圖的時陣,圖像嘛會使截取做 PDF;後來的版本儲存截圖為 PNG 檔案,雖然這途為若有需要會當重新設定做 PDF。
一寡仔桌面印表機嘛支援直接列印 PDF,會當毋免加額的輔助生出來 PDF 資料。目前,所有 PDF 相容印表機嘛支援 PostScript,但是多數 PostScript 印表機無直接支援 PDF 列印。
自由軟體基金會捌認為𪜶的一个高優先級計劃「提供自由、高品質佮全功能的一組軟體函式庫佮程式實現 PDF 檔案格式佮 ISO 三方二千標準的相關技術」。 啊若佇二空一一年,GNU PDF 計畫對「高優先級」列表內底去予人徙掉,因為乎 Poppler 函式庫的完善,鼓勵矣像 Evince 之類的應用佮 GNOME 桌面環境的遮爾仔應用。Poppler 是因為 Xpdf 代碼。PDF 軟體列表亦列出可用的商業開發用軟體函式庫。
Apache 軟體基金會的 Apache PDFBox 計劃是一款用佇咧處理 PDF 文件的開放原始碼 Java 函式庫。PDFBox 以 Apache 許可證授權發布。
一个叫做 Devon Govett 的 Adobe 員工佇 GitHub 上開源矣一款用於 JavaScript 的 PDF 操作函式庫 PDFKit
Apple 開發者早期使用 Quartz 的 CGPDFDocument 來畫一个 PDF 文件,但是因為使用較為底層的圖形函式庫畫製 PDF文件佮檢視十分麻煩,所以佇二空一七年的時陣 WWDC 大會上 Apple 引進了後 PDFKit 來予開發者佇 Apple 產品的作業系統上予家己的 App 支援繪製,檢視,標註 PDF 等等的功能==參考文獻==
參見
- XML 紙張規範
- PostScript
- DjVu
- PDF / A
- PDF 軟體列表
外部連結
- Adobe PDF 官方介紹:啥物是PDF?Adobe 會當紮的文件做一个格(鋪面存鋪排,存于網際網路檔案館)
- How was the PDF format created ? Quora
- PDF Association-PDFAssociation 是軟體開發者創作佮處理 PDF 文件的產業協會
- Adobe PDF 一百空一 : Summary of PDF
- Adobe : PostScript vs . PDF–官方介紹的 PS、EPS 佮 PDF 的較
- _ PDF Standards . . . . transitioning the PDF specification from a de facto standard to a de jure standard _,存在網路檔案館–有關係會當存取文件做式的 PDF / E 佮 PDF / UA 規格的資訊
- ISO 一爿九千空五孵一 : 兩千空五國際標準化組織發布的PDF / A 影一 ISO 標準
- PDF Reference and Adobe Extensions to the PDF Specification
- Portable Document Format : An Introduction for Programmers–對比 PDF、PostScript 佮 PDF 構件的介紹(升級到 v 一孵三)
- The Camelot Paper– John Warnock 概述的建立 PDF 的這个案
- Everything you wanted to know about PDF but were afraid to ask-Leonard Rosenthol(Adobe Systems)佇咧 TUG 二千空七上的談話記錄
- How to produce PDF with XSL-FO
- 善用佳軟:全面接觸 PDF : 上好用的 PDF 軟體匯總