進階音訊編碼
進階音訊編碼(英語:AdvancedAudioCoding,AAC)是有損音訊壓縮的專利數位音訊編碼標準,由 Fraunhofer IIS、杜比實驗室、貝爾實驗室、Sony、Nokia 等公司共同開發。出現佇一九九七年,為一種因為 MPEG 抹二的標準,二空空空年,MPEG 鋪四標準佇原本的基礎頂懸加上矣 PNS(Perceptual Noise Substitution)等技術,並且提供真濟種的擴展工具。為著區別於傳統的 MPEG 鋪二 AAC 閣叫做 MPEG 扳四 AAC。其實作為 MP 三的後繼者去予人設計出來,佇仝款的位元速率之下,AAC 比較起來 MP 三通常會當達到閣較好的聲音品質。
AAC 由國際標準化組織佮國際電工委員會標準化為 MPEG 鋪二佮 MPEG 鋪四規格的一部份。部份的 AAC、HE-AAC ( AAC + ) 為 MPEG 枋四音訊的一部份,並且予人採用佇數位聲音廣播、世界數位廣播兩个數位廣播標準中以及 DVB-H、ATSC-M / H 兩个移動電視標準中。
AAC 支援包含一个串流中四十八个上懸到九十六 kHz 的全部攏是闊聲道,加上十六个百二 Hz 的低頻聲道 ( LFE )、因為十六个鷹合聲道佮資料串流。佇咧 joint stereo 模式下,欲予立體聲的品質達到會當接受的程度干焦需要九十六 kbps 的位元速率,若欲達成是 Hi-fi 則上少需要會當變位元速率下一百二十八 kbps。
AAC 予被 YouTube、iPhone、iPod、iPad、任天堂 DSi、任天堂三 DS、iTunes、DivX、PlayStation 三和多款 Nokia 四十系列、Sony Ericsson 手機仔是採用做預設的音訊編碼碼格式,並且予 PlayStation Vita、Wii、Sony Walkman MP 三系列佮隨後的 Android、BlackBerry 等行動作業系統支援。
副檔名
AAC編碼的主要副檔名有三種:
- . aac-使用 MPEG 鋪二 Audio Transport Stream(ADTS,_ 參見 MPEG 鋪二 _)容器,區別於使用 MPEG 抹四容器的 MP 四 / M 四 A 格式,屬於傳統的 AAC 編碼(FAAC 恬恬仔的封裝,猶毋過 FAAC 若輸會當出 MPEG 抹四封裝的 AAC)。
- . mp 四-使用矣 MPEG 扳四 Part 十四(第十四部份)的簡化版即三 GPP Media Release 六 Basic(三 gp 六,_ 參見三 GP _)進行封裝的 AAC 編碼(Nero AAC 編碼器干焦會當輸出 MPEG 抹四封裝的 AAC)。
- . m 四 a-為著區別純音訊 MP 四檔案佮包含影片的 MP 四檔案來由蘋果(Apple)公司使用的副檔名,Apple iTunes 著純音訊 MP 四檔案採用矣 " . m 四 a " 號名。M 四 A 伊的本質佮音訊 MP 四相仝,故音訊 MP 四檔案亦可直接更改副檔名做 M 四 A。Sony Ericsson 佇二空空六年後發表的手機仔原廠鈴仔聲差不多攏沓沓仔改做 M 四 A 檔案。
技術概覽
AAC 作為一種高壓縮比的音訊壓縮演算法,壓縮比通常為十八:一,嘛有資料講做二十:一;佇音質方面,因為採用多聲道,佮使用低複雜性的描述方式,使其比強所有的傳統編碼方式佇仝規格的情形之下閣較贏一籌。
AAC 是一種足闊音訊編碼演算法,主要利用以下兩種編碼的策略來大大減少儲存高品質數位音訊所需要的資料量:
- 放棄佮感知影上無關係的訊號成份
- 去除編碼了後訊號的趁食的部份實際的編碼流程包括以下的步數:
- 利用改進的離散餘弦變換 ( MDCT ) 共訊號對時域轉換到頻域:選取適當的時域取樣點數由濾波器組將其轉換到頻域
- 因為心理聲學欲頻域訊號量化佮編碼
- 加入內部的錯誤閣較正碼
- 儲存抑是傳輸訊號
- 為著避免損害的取樣點,著每一个影格使用模仔 N 的 Luhn 演算法做校驗咧 MPEG 抹四點並無定義一个單一的高效率壓縮流程,是一組複雜的工具來達成對低編碼速率的語音編碼到高品質音訊壓縮、音樂合成等廣泛的操作。
- MPEG 增加四音訊編碼演算法家族迒過對低位元速率的語音編碼 ( 上低至二 kbps ) 到高品質音訊編碼 ( 逐聲道六十四 kbps 抑是閣較懸 )
- AAC 提供差不多低至八 kHz 懸至九十六 kHz 的這个多種取樣頻率、閣較懸的位元深度 ( 八 , 十六 , 二十四 , 三十二 bit ),並且支援一到四十八之間的任何聲道數
- 比較起來 MP 三使用的混和濾波器組,AAC 使用 MDCT 配增加至一千空二十四或者是九百六十點的窗長度
AAC 編碼器會當動態的佇咧單一的一千空二十四點 MDCT 區域抑是八个百二八點區塊之間切換 ( 抑是九百六十佮百二十點 )
- 佇咧有暫態的訊號變化時,選擇使用八个較短的一百二十分之一百二十八點區域以達到閣較好的時候解析度
- 佇預設的狀況下則使用較長的九百六十分之一千空二十四點區域以增加頻域的解析度,因為按呢會當閣較複雜的心理聲學模型來達成閣較好的編碼效率
比較起來 MP 三的改進
AAC 來做這个 MP 三的後繼者予人設計出來,佇一九九空年代尾期的雙盲試驗重顯示佇仝款的位元速率之下,AAC 比 MP 三表現出閣較好的聲音品質。
AAC 比較起來 MP 三的改進包含:
- 閣較濟的取樣頻率選擇 ( 八 kHz 至九十六 kHz,MP 三為十六 kHz 至四十八 kHz )
- 閣較懸的聲道數頂限 ( 四十八个,MP 三佇咧 MPEG 糊一模式下為上濟雙種聲道,MPEG 鋪二模式下五配一聲道 )
- 任意的位元速率佮可變的影格長度
- 閣較懸效率佮閣較單純濾波器組 ( AAC 使用純粹的 MDCT,MP 三則使用較複雜的混佮濾波器組 )
- 對平穩的訊號有閣較懸的編碼效率 ( AAC 使用較長的九百六十分之一千空二十四點區塊長度,MP 三則為著五百七十六點 )
- 對暫態變化的訊號有閣較懸的編碼準確度 ( AAC 使用較短的百二十分之一百二十八點區塊長度,MP 三則為百九十二點 )
- 會當選擇使用凱澤窗函式,以較大的主瓣 ( main lobe ) 為代價,消除頻譜洩漏效應 ( spectral leakage )
- 對頻率佇咧十六 kHz 的聲音訊號成分有閣較好的處理
- 有另外的模組親像雜訊移頻 ( noise shaping )、反向預測 ( backward prediction )、感覺知影講的雜訊代替 ( perceptual noise substitution ) 等,會當結合遮的模組建構出各種無仝的編碼規格整體來講,AAC 格式佮彼號比起來 MP 三給開發者在設計編碼上閣較大的彈性,而且修正真濟佇咧 MPEG 糊一音訊規格頂懸的設計選擇,遮的增加的彈性予閣較濟編碼策略會當同時存在,行若達成閣較懸的壓縮效率。就算講按呢,若欲講有 AAC 敢比 MP 三好,AAC 並無完全的決定性的優勢,MP 三雖然比較為古早而且有相當的瑕疵,煞嘛予證實是意外的勇勇。佇低位元速率的狀況之下 ( 通常低於一百二十八 kbps ),AAC 佮 HE-AAC 則因為閣較好的立體聲編碼、純粹的 MDCT 佮閣較好的窗函式長度,優於 MP 三,尤其佇極低位元速率的情況下優勢閣較呈現。
MP 三作為上早數年音樂開始佇網路頂懸傳播、分享所使用的格式,有上蓋為普遍的軟體佮硬體支援,AAC 因為一寡產業界是繼續堅定的支援,成做 MP 三一个有力的競爭對手,另外一个競爭對手是開源產業界支援的 IETF 標準開放格式 Opus ( 音訊的格式 )。
低位元速率規格
高效 AAC(HE-AAC,英語:High-EfficiencyAAC)為有損數據壓縮技術,是嘿進階音訊編碼(AAC)的擴充。HE-AAC v 一使用頻段複製(SBR,英語:Spectral Band Replication)提高頻域的壓縮效率,適用佇低位元速率(六十四 kbps 以下)。 HE-AAC v 二結合使用 SBR 佮參數立體聲(PS,英語:Parametric Stereo)提懸立體聲訊號的壓縮效率。HE-AAC v 二進一步降低矣對位元速率的需求(接近佇百分之五十), 予人應用就類似 DAB 等位元速率資源真有限的領域。
HE-AAC 之另外一常有名稱aacPlus(aac +), 為開發 SBR 之公司 Coding Technologies 的註冊商標。MPEG 組織佇二空空三年五月將 aac + 納入 ISO/IEC 一爿四千四百九十六爿三(MPEG 扳四 Part 三)。 HE-AAC 適合佇咧低位的元率(low bitrates)的應用,如:網路電台、數位電視等等,其宣稱佇四十八 kbps 的音質會用得比一百二十八 kbps 的 MP 三普通,主要的競爭物件是專利的 IETF 標準開放格式 Opus。
版本
HE-AAC 之無仝版本:
規格一覽
因為乎 AAC 是一个大陣家族,𪜶分做九種的規格,以適應無仝場合的需要,嘛正正是因為 AAC 的規格(Profile)傷濟,致使普通電腦使用者感覺十分困擾:
一 . MPEG 鋪二 AAC LC 低複雜度的規格(Low Complexity) 二 . MPEG 鋪二 AAC Main 主規格三 . MPEG 鋪二 AAC SSR 這會當變取樣率規格(Scaleable Sample Rate) 四 . MPEG 扳四 AAC LC 低複雜度的規格(Low Complexity), 這馬的手機仔較捷看著的 MP 四檔案中的音訊部份就包括著這个規格音訊檔案五 . MPEG 扳四 AAC Main 主規格六 . MPEG 扳四 AAC SSR 這會當變取樣率規格(Scaleable Sample Rate) 七 . MPEG 扳四 AAC LTP 長時期預測規格(Long Term Predicition) 八 . MPEG 扳四 AAC LD 低延遲的規格(Low Delay) 九 . MPEG 扳四 AAC HE 高效率規格(High Efficiency)
- 欲講的規格內底,主規格(Main)包含了除增益控制以外的全部功能,其音質上好,低複雜度的規格(LC)著是較簡單,無矣增益控制,毋過提懸編碼效率,至「SSR」著「LC」規格大體是相仝,但是加增益的控制功能,另外咧,MPEG 扳四 AAC / LTP / LD / HE,攏是用佇咧低位元的機會下編碼,特別是「HE」是有 Nero AAC 編碼器支援,是近來定定用的一種編碼器,毋過通常來講,Main 規格佮 LC 音質規格的差無蓋大,所以目前使用上濟的 AAC 規格多數攏是「LC」規格,因為愛考慮手機仔目前的記持體能力無達到合理水準。
MPEG 扳四 AAC LC(Low Complexity)上捷用的規格,阮叫「低複雜度的規格」,阮簡稱「LC-AAC」,這種規格佇中咧等位元速率的編碼效率和這个音質的方面,攏揣會著平衡點。所謂中等位元速率,就是講:九十六 kbps 鋪百九十二 kbps 之間的位元速率。所以,若欲使用 LC-AAC 規格,請儘可能共位元速率控制佇進前講的彼个區間內。
編碼器一覽
因為 AAC 格式這家族較大陣,欲了解伊,代先愛清楚其各有無仝的編碼器,目前包括著商業的、免錢的 AAC 格式音訊編碼器,其中幾个主要的編碼器如下:
- FhG:Fraunhofer IIS 研發的權威編碼器。
- Nero AAC:同時支援 LC-AAC / HE-AAC 規格,由 Nero 公司免錢發佈的 Nero AAC 編碼器。
- QuickTime / iTunes:Apple 公司的兩款軟體攏提供矣 AAC 編碼功能,其編碼的技術來自 " Dolby Laboratories "(簡寫為 Dolby Labs,杜比實驗室)。
- FAAC(Freeware Advanced Audio Coder): 嘛是一種真好的命令列編碼器,支援 LC / Main / LTP 規格,這个軟體是免費的。FAAC 是自由軟體。
- DivX AAC:二空空九年 DivX 開發出來的新 AAC 編碼器,支援 LC / HE / HEv 二規格。目前當咧試當中。
另外閣有 Psytel(已經停止開發), Coding Technologies(已經予人杜比實驗室收購), HHI / z Plane(Compaact), Dolby AAC 等 AAC 編碼器,啊若其他如 Panasonic、Nokia、AT & T、NEC 等公司嘛攏有獨家開發的編碼器,佇咧逐家舞予清楚這 AAC 格式音訊規格佮編碼器了後,咱就袂歹知影按怎仝一款乎手機仔會支援啊看起來攏是 AAC 格式音訊的諸多檔案室矣,比如講 Nokia 六千兩百三十 i 就是既支援 AAC 格式嘛支援 M 四 A 格式佮 MP 四格式的機型,啊若遮的音訊檔案其實攏是屬於 AAC 家族成員。
目前聽著用的較濟應該是 LC 和 HE(適合低位元速率)。
HE:「 high efficiency」(高效性)。 HE-AAC v 一(閣稱 AACPlusV 一,SBR ) 用容器的方法加原 AAC(LC)+ SBR 技術。SBR 其實代表的是 Spectral Band Replication(頻段複製)。 簡單括一下仔,音樂的主要頻譜集中佇咧低頻段,高頻段的幅度誠小,你若對規个頻段編碼,欲按怎為著保護高頻造成低頻段編碼過細來致使檔案誠大,欲按怎為著儲存了低頻的主要成份若失去懸頻成份致使著喪失音質。SBR 共頻譜切開來,低頻單獨編碼儲存主要成分,高頻單獨放大編碼儲存音質,仝音質下降低檔案大細。
HEv 二 ( 閣叫做 HEPS ) 伊用容器的方法有包含矣 HE-AAC v 一和 PS 技術。PS 指「Parametric Stereo」(參數立體聲)。 這其實好理解講,原來的立體聲檔案,檔案大細是一个聲道的兩倍。但是兩个聲道的聲音是一種相𫝛,根據香農資訊配編碼定理,相關性應該予人去落才會當減小檔案大細。所以乎 PS 技術儉一个聲道的全部資訊,然後,開真少的位元組用參數來講另外一个聲道佮伊無仝的所在。
許可佮專利
使用者無需要會使付款來串流傳輸抑是分發 AAC 格式的內容。這个原因會當使 AAC 比其前身的彼个 MP 三仝款,特別是根據適用佇流媒體(如網際網路廣播)分發內容成做閣較有吸引力的格式。
毋過,AAC 編解碼器的所有製造商抑是開發商攏需要專利許可。所以,FFmpeg 和 FAAC 等自由開放原始碼軟體的實現可能干焦會用得原始碼形式分發,才避免專利侵權。
參考文獻
外部連結
- 蘋果電腦 MPEG 扳四 AAC
- AAC EE Times 文章
- Fraunhofer MPEG 鋪二 AAC 資訊
- AAC Licensing
- Open Source AAC codec FAAC(編碼器)佮 FAAD 二(解碼器)
- Roberto's public listening tests-blind , controlled listening tests of lossy compression formats including AAC
- MPEG 扳四 HE-AAC v 二—audio coding for today's digital media world,article in the EBU technical review(二千空六分之一)giving explanations on HE-AAC .
- Coding Technologies 的 aacPlus 介紹