AOMediaVideo一
AOMedia Video 一(簡稱AV 一)是一種開放、免專利的影片編碼的格式,專為透過網路進行串流傳輸來設計。伊由開放媒體聯盟(AOMedia)開發,目標是佇咧取代其前身 VP 九,該聯盟由半導體企業、隨選視訊供應商佮網頁瀏覽器開發商佇二空一五年成立。二空一八年,Facebook 來進行倚近真實使用環境條件測試,測試結果顯示 AV 一資料壓縮率佮 x 兩百六十四 main profile、x 兩百六十四 high profile 和 libvpx-vp 九相比並之下,分別提昇百分之五十配三、百分之四十六交二佮百分之三十四交零。
佮 VP 九類似,但是佮 H . 兩百六十四 / AVC 和 HEVC 無仝的是,AV 一具有買斷式授權模式,袂阻礙開源項目的採樣。
AVIF 是一種使用 AV 一壓縮演算法的圖形檔案格式。
歷史進程
開放媒體聯盟(AOMedia)建立 AV 一主因為牽涉著 HEVC 的懸成本專利許可佮霧霧空間,此外,由 MPEG 設計之編解碼器有望取代 AVC。聯盟上早是由七間公司,Amazon、Cisco、Google、Intel、Microsoft、Mozilla 和 Netflix 所組成,並且宣佈技術重點為著提供高品質網路影像。佇二空一五年七月二一,HEVC Advance,現為 ACCESS Advance,初初授權予人宣布增加嘿 AVC 的權利金,除了權利金所增加的成本外,閣增加授權複雜度。這進一步牽成仝年的九月初一,開放媒體聯盟發布 AV 一个官方公告伊嘛宣佈成立。佮過往 MPEG 規範無仝,MPEG 會當干焦對 MPEG-LA 得著許可,當完成 HEVC 規範時,已經形成兩个專利池,第三个專利池嘛咧欲出現。普遍來講,專利持有人拒絕共專利共享佇咧專利池上,這加添 HEVC 授權的無確定性。根據微軟 Lan LeGrow 所說,開源、免版稅可看做無確定性消除的方法。
此外,建立 AV 一另外一个原因是專利授權對免費開源軟體的負面影響。比如講佇瀏覽器內底實際做 H . 兩百六十四,共予人禁止使用,除非向 MPEG-LA 支付權利金。歐洲自由軟體基金會認為,因為和自由軟體許可證的各種無相容,公平佮合理非歧視條款許可實踐使標準的自由軟體實施成做無可能。
AV 一的組成來自聯盟成員過去的研究佮工作內容,分別佇幾冬前就開始實作實驗性平台,如:Xiph 佮 Mozilla 的 Daala,Google 實驗性質的 VP 九提升做 VP 十,並且二空一四年九月十二公布,以及 Cisco 的 Thor 佇二空一五年八月十一發布。AV 一以 VP 九的代碼庫做基礎,佮其他的技術結合產生,AV 一編解碼器參考規範初初版本零友一 . 零,並且二空一六年四月七號發布。
二空一七年十月下旬,儘管對開發的凍結開始生效,但是這个重要的功能猶是繼續發展。其中一項當咧開發的功能 ─ ─ 位元流的格式,原定佇二空一八年一月凍結開發,但是猶原有關鍵錯誤,以及需要對轉換方法、語法設計、運動向量預測的修改,也有法律的妥善性的問題,最終發布日期延期到仝年三月二八,聯盟發佈官方 AV 一位元流規範佮軟體的編解碼器參考規範,二空一八年六月二五發佈經驗證過了後的位元流規範一四界零 . 空版,總算二空一九年一月初八,發佈一四界零 . 空版附帶的規格刊誤。
根據聯盟成員 Bitmovin 中 Martin Smole 表示,佇位元流格式完成凍結了後,計算效率佇官方參考編解碼器猶原有挑戰。雖然講會當處理位元流的格式,但這並毋是商用的用途,速度最佳化嘛無考量。所以,早期版本的 AV 一比現有的 HEVC 編碼器慢幾个數量級。近期,開發者較優化官方參考編碼器。發佈了後一年的二空一九年三月,參考編碼器的效率有大幅提升,並且佮其他捷看的編解碼器佇咧比並的效率的範圍內底。
二空二一年一月二一,AV 一的多用途網際網路郵件擴展 ( MIME ) 類型予人定義做 video / AV 一。使用按呢 MIME 類型的 AV 一的使用干焦限制即時傳輸協定目的。
目的
AV 一的目標是成做一種既先進科技閣買斷式授權 ( 免版稅 ) 的網路影片格式。根據 Google Chrome 媒體團隊戰略佮合作伴關係主管 Matt Frost 的講法,「 開放媒體聯盟的使命佮 WebM 項目仝款。」
標準制定當中反復出現的一个問題,尤其是免版稅的多媒體格式,是無細膩侵犯其建立者佮使用者毋知影的專利的危險。關於著 AV 一佮進前的 VP 八、VP 九、Theora 和 IVC 提出這種的擔憂。這个問題並毋是免版稅格式獨有的,但是伊獨特威脅著𪜶免版稅的地位。
為實現免版稅的目標,開發過程要求佇兩个獨立方獨立確認無侵犯競爭公司的專利進前,不得採用任何功能。若無法度得著專利保護技術的替代方案,相關專利的所有的人將被邀請加入聯盟(準講𪜶已經是另外一个全利池的成員)。 比如講,聯盟成員 Apple、Cisco、Google 和 Microsoft 嘛是啦 MPEG-LA H . 二百六十四專利池的許可人。
技術
AV 一是一種使用傳統的基於區塊編碼毋過嘛加入新技術的頻率變換格式,AV 一使用的編碼技術主要來源於 GoogleVP 九的後一代影片壓縮格式 VP 十,但是仝彼个時陣嘛包括講由 Xiph . Org 基金會主要贊助者 Mozilla 開發的 Daala 影片壓縮格式佮由 Cisco 開發的 Thor 影片壓縮格式內底所使用的影片編碼技術。
開放媒體聯盟根據 FreeBSD 二許可證發布了一个用 C 語言和組合語言編寫的編解碼器參考實例 libaom。該參考實例的開發接受開放媒體聯盟成員資助伊並且公開進行。此外閣有一个開源編碼器 rav 一 e,rav 一 e 編碼器以犧牲編碼效率為代價,成做上簡單、上緊符合 AV 一標準的影片編碼器。
分割區
所以,影格的內容予人劃分 ( Partitioning ) 為相間、相鄰而且大細仝款的區域,叫超區塊。這就親像大區域的概念,超區塊呈現四角形,大細會當替一百二十八 × 一百二十八抑六十四 × 六十四像素。超區塊會當根據無仝款的分割區模式劃做閣較細的區塊。四方分割模式 ( four-way split pattern ) 是唯一會當遞迴將分割區細分的模式。這允准將超區塊對大區塊劃做分做小至四 × 四像素的分割區。
T 形分割區模式是 VP 十開發的一項新功能,水平抑是垂直拆分超區塊分割做四 : 一和一 : 四長條形分割區。分割區模式的使用因超區塊大細塊才有限制,其中一百二十八 × 一百二十八佮八 × 八超區塊攏袂使用四 : 一抑是講一 : 四長條型分割區拆分,干焦八 × 八超區塊是袂當使用 T 形分割。
佇咧無仝區頭的部份使用兩个獨立預測,_ 會當使用平趨的趨趨過渡線(好形分割區預測 _)。 這予伊的物件通準確地分割,無需要四角形邊界的傳統階梯線。
是因為瓦形行列之間的會當預測的相依性這會當實作閣較濟的編碼器平行性。
預測
AV 閣較懸的精度(十抑是十二位元樣本頻率)欲執行內部來處理,因為解析度提懸,圖像中央的四捨五入的誤差較細,予壓縮效能改進。
預測 ( Prediction ) 會當佇一个區內底以閣較進階的方式組合做複合預測,包括無仝方向平趨佮尖尖櫼形分割區預測 _,_ 猶閣有基於使用兩个預測器探究兩个人之間差異的隱式遮罩,這將比取平均來得優秀。這允准佇仝一超區內底使用兩个影格間預測或者是影格間佮影格內底預測的組合。
佇影格間預測的時陣,一个影格會當存取八个會當用影格來緩衝區中的六个毋是三个,而且會當為雙向預測,即影格間佮影格內預測組合預測。
佇咧 AV 一中的扭曲運動和全域運動分析工具,用佇藉著辨識由相機運動產生的模式,以減少運動向量中的趁錢的資訊,如果噪音就是趁錢。這實現了往過的做式中試圖煞猶未予實現的做法,親像雖然採用適用三維的新穎方法的 MPEG 扳四 ASP。位元流提供的影格有一組扭曲參數,隱式區域參數會當根據周圍的區塊計算會得著並佇區塊中使用。
_ 切換影格 _(S 影格)是一種新的影格間類型,會當使用來自仝一个影像閣較懸解析度的已經解碼參考影格進行預測以允准切換至低解析度,佇自適性位元串串流媒體實例中,無需要佇開始時陣使用完整的關鍵影格影像片段。
影格內底預測
影格內底預測 ( Intra Prediction ) 使用當前影格中會當用資訊來預測目標區域的像素。大多數的情況下,影格來預測是對待預測目標區塊頂懸佮厝邊頭的相鄰像素構建的。DC 預測器藉著平均區塊倒爿佮頂頭親像素進行預測。
根據指定的角度,方向預測器會當推斷相鄰像素。佇咧 AV 一中,以四十五度角開始,逐擺差距二十二形五度,一步一步增加到二百空三度,計共八種模式。每一个方向的模式當中,會當為較大的區域予每一个三度,計共六組的偏移訊號,主角頂懸佮下跤各三組,從而且產生攏總五十六個角。
其中,真實運動預測器被替換做 Paeth 預測器,這欲判別倒上角已經知影素佮新像素的倒爿佮頂面的親像素的差別,啊若選擇佇較細條的方向的像素作為預測器。
另外調色盤預測器會當較少色水上濟八个色水的區域,如部份電腦螢幕的內容,通使用是平度平面本的色度度預測器來利用亮度佮色水資訊之間的相關性。
為著欲減少沿影格間來預測區塊邊界的可視邊界,會當用重疊一塊運動補償 ( OBMC ) 技術,和相鄰區疊二到三十二个像素,並且混合重疊部份。
資料轉換
為著欲預測了後賰的精差轉換 ( Data transformation ) 到頻域,AV 一編碼器會當使用正四角形、若無第二 : 一分之一啦 : 二佮四 : 一分之一啦 : 四矩形進行離散餘弦變換,猶閣有非對稱的離散正弦變換,嘿來自附近像素,預測倒爿或者是頂頭緣具有較低精差的區域,抑是選擇無進行換。
這會當複合兩个一維變換,予水平和垂直維度有通使用無仝款的變換。
量化
AV 一具有最佳化量化 ( Quantization ) 矩陣,逐影格會當選擇佮傳送的資訊八組量化參數,有兩个色度平面的單獨參數,並且會使使用空間來預測。佇咧每一个新的超區塊頂懸,量化參數會當透過傳送偏移訊號進行調整。
濾波器
Thor 的約束低通濾波器 ( Filter ) 和 Daala 的定向去振鈴濾波器,對環路濾波有卓越的成效:結合二者之約束定向增強濾波器,超過單獨抑是同齊使用一般濾波器的結果。
這是一種邊緣定向條件替換濾波器,平滑具有可組態強度的區塊沿主要邊緣方向,以消除振鈴效應。
閣有基於著 Wiener 濾波器佮自引導恢復濾波器 _ 的環路恢復濾波器 _,用於去除因為區塊處理引起的模糊振鈴。
膠片規粒合成使用參數影片編碼方法改進了噪音聲訊號的編碼。因為膠片粒仔噪音原生的隨機性,該訊號分量傳統上編碼成本貴,較會損失佮拍歹,並且可能會留下嚴重的編碼振鈴作為殘留物。使用膠片粒仔合成來避開這寡問題,其使用視覺上主觀視覺印象相𫝛的部份替換部份訊號毋是客觀相𫝛性。消除對訊號中去除粒粒成分佮分析其非隨機特徵,取取代之的是干焦將描述性參數傳輸到解碼器,解碼器會添加回原始組成分了後重塑閣合成偽隨機噪聲訊號。膠片粒仔合成是 AC 三、AAC、Vorbis 和 Opus 音訊編解碼器中使用的感知噪音替代技術的視覺等等效項。
枋編碼
Daala 的被編碼器,是一種非二進位的算術編碼器,做替代原先的 VP 九二進位的編碼器。_ 非二進位 _ 算術編碼的有利在避開現有專利,同時嘛予位元層級的串列過程有增加平行性,藉來降低硬體實作對石英震盪器的速率要求。如前文參考之適應性二元算術編碼之現代二進位算術編碼的有效性,其實當咧使用比二進位閣較大的字母表來實作,所以速度會閣較緊,敢若霍夫曼編碼仝款,雖然猶袂赴霍夫曼編碼簡單快速。AV 一咧算術編碼器當中有揤編碼符號毋是按影格調整符號概率的能力。
可適性視訊編碼
對著視訊上重要的是,可適性視訊編碼是一種泛用技術毋是由 AV 一獨有,通好對閣較高位元速率的影像流中提品質閣較好的低位元速率影片流。這寡自適應位元速率流傳輸差別是佇咧,逐个閣較懸位元速率適配中的一寡壓縮效率被放棄的,致使規个影像流的效能。編碼的過程也較少趁錢佮較低的要求。
AV 一提供了時間佮空間會當適合,影格速率佮解析度攏是定義做低位元流可用的方法。
編碼規範
AV 一擁有三種設定供解碼器使用Main、High佮Professional。Main 允准八、十位元的色彩深度佮四 : 零 : 零(灰階)佮四 : 二 : 零的色度抽樣。High 後續支援四 : 四 : 四个色度抽樣。Professional 將會完整支援四 : 零 : 零、四 : 二 : 零、四 : 二 : 二、四 : 四 : 四的色度抽樣以及八、十、十二位元的色彩深度。
軟體支援
- Web 瀏覽器:
- Firefox(自二空一九年五月第六十七堵空版起;佇所有的桌面平台頂預設啟動-適用三十二位元和六十四位元系統的 Windows、macOS 和 Linux)
- Google Chrome(自二空一八年十月第七十版了後的解碼器起;自二空二一年四月十四第九十版了後的編碼器起 )
- Opera(自二空一八年十一月二八第五十七版起 )
- Microsoft Edge(自二空一八年十月十號 Windows 更新的 ( 一千八百空九 ) 起,帶有 AV 一影像擴充出外掛程式)
- Vivaldi(自二空一八年十月起 )
- 影像放送器:
- VLC 媒體放送器(自三堵空版起)
- mpv(自空吱二九 . 空版起)
- Xine-lib(自一孵二 . 十起)
- PotPlayer(自二空一八年十月十六日第一石七 . 一孵四千八百空四版起)
- K-Lite 編解碼器包(自二空一八年九月十三號起十四堵四 . 五版起)
- 編碼器:
- FFmpeg(自二空一八年四月二十四四四零版起)
- HandBrake(自二空一九年十一月九號一石三 . 空版起支援解碼)
- Bitmovin 編碼(自二空一八年七月四號一石五空 . 空版起)
- 影像編輯:
- DaVinci Resolve(自二空二一年五月十七抹二版起支援解碼)
- 其他:
- GStreamer(自一孵一四版起)
- MKVToolNix(自版本二十八開始用最終的 av 一-in-mkv 規範)
- MediaInfo(自十八堵空三版起)
- Elecard StreamEye Studio(影像品質分析工具)
- Google Duo(自二空二空年四月起)
採用
YouTube 已經開始試驗佇部份的影片使用 AV 一个影片的格式。二空二空年二月五號,Netflix 開始咧 Android 裝置上使用 AV 一个影片的格式放片,AV 一的壓縮效率較原先的 VP 九提升百分之二十。Facebook 表示 AV 一效能超過預期,一旦時機成熟將沓沓仔採用 AV 一个影片的格式。
Twitch 計畫佇二空二二年抑是二空二三年佇咧關注度較懸的影片採用 AV 一个影片的格式,並佇二空二四年抑是二空二五年全面採用。
二空二空年四月三十號,愛奇藝宣佈佇電腦瀏覽器佮 Android 裝置上支援 AV 一个影片的格式。
二空二二年二月初六,嗶嗶嗶嗶已經佇網頁捀測試 AV 一个影片式的解碼放送。