本發(fā)明涉及音頻編碼處理領(lǐng)域,特別是涉及一種對(duì)單聲道或立體聲進(jìn)行編碼的方法。
背景技術(shù):在分層音頻編碼上,已經(jīng)存在通過(guò)精細(xì)分層方式進(jìn)行有損數(shù)字音頻編碼方法及無(wú)損音頻編碼技術(shù),如ISO/IEC14496-3MPEG-4BSAC(Bitslicedarithmeticcoding)比特片算術(shù)編碼、在AVS(AudioVideocodingStandardWorkgroupofChina)中采用的類(lèi)似于MPEG-4BSAC編碼方法以及MPEG-4SLS(ScalableLosslessCoding)的無(wú)損增強(qiáng)層方式都可實(shí)現(xiàn)對(duì)音頻進(jìn)行精細(xì)分層,對(duì)每一層分別編碼。但精細(xì)分層方式存在編碼效率低、結(jié)構(gòu)復(fù)雜、處理邏輯復(fù)雜度高等缺點(diǎn)。現(xiàn)有技術(shù)中還有一種非精細(xì)分層的編碼方案:在MPEG-4第三部分和MPEG-2第七部分中都提供了可伸縮采樣率編碼算法AAC-SSR(AdvancedAudioCoding-ScalableSamplingRate),首先是由Sony提出的,編碼架構(gòu)也類(lèi)似于其獨(dú)有的ARTAC(AdaptiveTransformAcousticCoding)編碼。該編碼方案首先將輸入的數(shù)字音頻信號(hào)通過(guò)4帶的多相正交濾波器組(PQF,PolyphaseQuadratureFilter)分割成4個(gè)頻帶,然后這4個(gè)頻帶分別進(jìn)行1個(gè)256點(diǎn)MDCT(512樣點(diǎn)窗長(zhǎng))或8個(gè)32點(diǎn)(64樣點(diǎn)窗長(zhǎng))MDCT。該編碼方案還可通過(guò)去除高PQF帶的方式降低數(shù)據(jù)率,通過(guò)減少頻帶的方式實(shí)現(xiàn)比特流分層,從而獲得不同比特率和采樣率。這種編碼方案的好處是在每個(gè)頻帶內(nèi)可以獨(dú)立選擇長(zhǎng)塊或短塊MDCT,因此對(duì)高頻可使用短塊編碼增強(qiáng)時(shí)間分辨率;而對(duì)低頻使用長(zhǎng)塊編碼獲得高頻率分辨率。但是由于4個(gè)PQF帶間存在混迭,因此相鄰部分的變換域系數(shù)編碼效率會(huì)下降。
技術(shù)實(shí)現(xiàn)要素:為解決上述技術(shù)問(wèn)題,本發(fā)明提出一種對(duì)單聲道或立體聲進(jìn)行編碼的方法,包括:將單聲道或立體聲音頻信號(hào)分為一基本層及至少一增強(qiáng)層;對(duì)基本層采用mp3、AAC、SBR、PS和/或DRA編碼方式編碼;對(duì)至少一增強(qiáng)層分別采用mp3、AAC、SBR、PS、DRA、殘差編碼、部分參數(shù)編碼算法和/或參數(shù)編碼算法編碼。優(yōu)選地,上述將單聲道或立體聲音頻信號(hào)分為一基本層和一增強(qiáng)層是:基于頻帶將單聲道或立體聲音頻信號(hào)分為一基本層和一增強(qiáng)層,基本層為單聲道或立體聲的低頻編碼部分;增強(qiáng)層為單聲道或立體聲的高頻編碼部分;或基于聲道將立體聲音頻信號(hào)分為一基本層和一增強(qiáng)層,基本層傳輸左聲道或和聲道;增強(qiáng)層傳輸右聲道或差聲道;或基于參數(shù)立體聲編碼將立體聲音頻信號(hào)分為一基本層和一增強(qiáng)層,基本層傳輸左右聲道縮混的單個(gè)聲道;增強(qiáng)層傳輸參數(shù)立體聲信息;或基于殘差分層結(jié)構(gòu)將單聲道或立體聲音頻信號(hào)分為一基本層和一增強(qiáng)層。優(yōu)選地,上述對(duì)基本層和/或至少一增強(qiáng)層,分別采用帶寬擴(kuò)展算法進(jìn)行編碼。優(yōu)選地,上述對(duì)于基于殘差分層結(jié)構(gòu)劃分得到的基本層和一增強(qiáng)層分別編碼的步驟包括:根據(jù)增強(qiáng)層低頻殘差對(duì)基本層低頻編碼部分進(jìn)行補(bǔ)充;通過(guò)增強(qiáng)層帶寬擴(kuò)展修正參數(shù)對(duì)基本層帶寬擴(kuò)展參數(shù)進(jìn)行調(diào)整。優(yōu)選地,上述音頻信號(hào)為立體聲的情況下,基本層包含編碼縮混的聲道低頻部分進(jìn)行編碼以及帶寬擴(kuò)展和參數(shù)立體聲編碼信息;增強(qiáng)層傳輸?shù)皖l部分的殘差編碼。優(yōu)選地,上述音頻信號(hào)為立體聲的情況下,基本層傳輸縮混的單聲道信號(hào)的低頻部分編碼信息;增強(qiáng)層傳輸?shù)皖l部分殘差編碼信息和帶寬擴(kuò)展及參數(shù)立體聲編碼信息。優(yōu)選地,上述對(duì)基本層編碼的步驟包括:根據(jù)對(duì)基本層的碼率要求進(jìn)行編碼,將得到的編碼數(shù)據(jù)放入基本層傳輸;將原始音頻與基本層解碼恢復(fù)后的音頻比較獲取殘差信號(hào);而對(duì)增強(qiáng)層編碼的步驟是對(duì)殘差信號(hào)進(jìn)行編碼作為增強(qiáng)層。優(yōu)選地,上述將單聲道或立體聲音頻信號(hào)分為一基本層、第一增強(qiáng)層和第二增強(qiáng)層是:基于頻帶將單聲道或立體聲音頻信號(hào)分為一基本層、第一增強(qiáng)層和第二增強(qiáng)層,其中基本層為單聲道或立體聲的低頻編碼部分;第一增強(qiáng)層為單聲道或立體聲的中頻編碼部分;第二增強(qiáng)層為單聲道或立體聲的高頻編碼部分。優(yōu)選地,上述基于殘差分層結(jié)構(gòu)將單聲道或立體聲音頻信號(hào)分為一基本層、至少一增強(qiáng)層;而對(duì)基本層編碼的步驟包括:根據(jù)對(duì)基本層的碼率要求進(jìn)行編碼,將得到的全頻帶基本質(zhì)量編碼數(shù)據(jù)放入基本層傳輸;將原始音頻與基本層解碼恢復(fù)后的音頻比較,獲得第一級(jí)殘差信號(hào);而對(duì)第一增強(qiáng)層和/或第二增強(qiáng)層編碼的步驟包括:對(duì)第一級(jí)殘差信號(hào)進(jìn)行編碼作為第一增強(qiáng)層的數(shù)據(jù);從第一增強(qiáng)層編碼所輸入的第一級(jí)殘差信號(hào)中去除對(duì)第一增強(qiáng)層解碼恢復(fù)的信號(hào),獲得第二級(jí)殘差信號(hào);對(duì)第二級(jí)殘差信號(hào)進(jìn)行編碼,作為第二增強(qiáng)層的數(shù)據(jù);依次根據(jù)上一級(jí)殘差信號(hào)獲得下一級(jí)殘差信號(hào),對(duì)下一級(jí)殘差信號(hào)進(jìn)行編碼作為下一級(jí)增強(qiáng)層的數(shù)據(jù),直至對(duì)所有增強(qiáng)層均完成編碼。優(yōu)選地,上述對(duì)基本層編碼的步驟包括:在編碼端,對(duì)時(shí)域數(shù)據(jù)x[n]做MDCT變換得到譜系數(shù)X[k];將頻域系數(shù)分成多個(gè)子帶,對(duì)其中屬于子帶b的譜系數(shù)除以一個(gè)量化步長(zhǎng)Δb;對(duì)量化步長(zhǎng)Δb取整(nint)得到量化后的譜系數(shù)每個(gè)量化步長(zhǎng)Δb和譜系數(shù)傳輸?shù)浇獯a端。優(yōu)選地,上述對(duì)至少一增強(qiáng)層分別編碼的步驟包括:在編碼端,對(duì)時(shí)域數(shù)據(jù)x[n]做MDCT變換得到譜系數(shù)X[k];將頻域系數(shù)分成多個(gè)子帶,對(duì)其中屬于子帶b的譜系數(shù)除以一個(gè)量化步長(zhǎng)Δb;對(duì)量化步長(zhǎng)Δb取整(nint)得到量化后的譜系數(shù)每個(gè)量化步長(zhǎng)Δb和譜系數(shù)傳輸?shù)浇獯a端;用量化步長(zhǎng)Δb和譜系數(shù)恢復(fù)逆量化后的譜系數(shù)用原始譜系數(shù)X[k]減去逆量化后的譜系數(shù)得到殘差譜系數(shù)E[k]將殘差譜系數(shù)E[k]分成多個(gè)子帶,對(duì)其中屬于子帶c的譜系數(shù)除以一個(gè)殘差譜系數(shù)量化步長(zhǎng)Δe,取整(nint)得到量化后的殘差譜系數(shù)將殘差譜系數(shù)量化步長(zhǎng)Δe和量化后的殘差譜系數(shù)傳輸?shù)浇獯a端。本發(fā)明對(duì)單聲道或立體聲進(jìn)行粗分層,一般僅做2或3分層,實(shí)現(xiàn)簡(jiǎn)單可保證更高效率的壓縮,無(wú)需精細(xì)分層技術(shù)下的各種限制條件。可通過(guò)靈活控制每層聲道的質(zhì)量,獲取最佳綜合聲音質(zhì)量;易于滿足信道編碼要求。附圖說(shuō)明圖1為本發(fā)明一實(shí)施例對(duì)單聲道或立體聲進(jìn)行分層的示意圖;圖2為本發(fā)明一實(shí)施例的編碼流程示意圖;圖3為本發(fā)明一實(shí)施例基于頻帶的分層結(jié)構(gòu)對(duì)音頻信號(hào)進(jìn)行分層的示意圖;圖4為本發(fā)明一實(shí)施例基于聲道的分層結(jié)構(gòu)對(duì)音頻信號(hào)進(jìn)行分層的示意圖;圖5為本發(fā)明一實(shí)施例基于參數(shù)立體聲編碼的分層結(jié)構(gòu)對(duì)音頻信號(hào)進(jìn)行分層的示意圖;圖6為本發(fā)明一實(shí)施例的分層結(jié)構(gòu)示意圖;圖7為本發(fā)明一實(shí)施例基于殘差的分層結(jié)構(gòu)對(duì)音頻信號(hào)進(jìn)行分層的示意圖;圖8為本發(fā)明一實(shí)施例基本層具有帶寬擴(kuò)展算法時(shí)基于殘差分層的二層結(jié)構(gòu)示意圖;圖9為本發(fā)明一實(shí)施例增強(qiáng)層具有帶寬擴(kuò)展算法時(shí)基于殘差分層的二層結(jié)構(gòu)示意圖;圖10為本發(fā)明一實(shí)施例基本層有帶寬擴(kuò)展和增強(qiáng)層有帶寬擴(kuò)展修正的基于殘差分層的二層結(jié)構(gòu)示意圖;圖11為本發(fā)明一實(shí)施例一種對(duì)立體聲音頻信號(hào)分層的結(jié)構(gòu)示意圖;圖12為本發(fā)明一實(shí)施例另一種對(duì)立體聲音頻信號(hào)分層的結(jié)構(gòu)示意圖;圖13為本發(fā)明一實(shí)施例一種音頻分層多層結(jié)構(gòu)示意圖;圖14為本發(fā)明一實(shí)施例另一種音頻分層多層結(jié)構(gòu)示意圖;圖15為本發(fā)明一實(shí)施例一種音頻分層結(jié)構(gòu)示意圖;圖16為本發(fā)明一實(shí)施例的dra算法簡(jiǎn)單示意圖;圖17為本發(fā)明一實(shí)施例的DRA核殘差編碼算法示意圖;圖18為本發(fā)明一實(shí)施例的立體聲音頻分層結(jié)構(gòu)示意圖。具體實(shí)施方式為詳細(xì)說(shuō)明本發(fā)明的技術(shù)內(nèi)容、構(gòu)造特征、所達(dá)成的目的及效果,下面將結(jié)合實(shí)施例并配合附圖予以詳細(xì)說(shuō)明。請(qǐng)參閱圖1示出的對(duì)單聲道或立體聲進(jìn)行分層的示意圖及圖2示出的編碼流程示意圖,本實(shí)施例對(duì)單聲道或立體聲進(jìn)行編碼的方法包括:步驟S1、將單聲道或立體聲音頻信號(hào)分為一基本層及至少一增強(qiáng)層;步驟S2、對(duì)基本層采用mp3、AAC、SBR、PS和/或DRA編碼方式編碼;步驟S3、對(duì)至少一增強(qiáng)層分別采用mp3、AAC、SBR、PS、DRA、殘差編碼、部分參數(shù)編碼算法和/或參數(shù)編碼算法編碼。基于上述實(shí)施例,本發(fā)明給出一系列不同的分層方案。參照?qǐng)D3示出的基于頻帶的分層結(jié)構(gòu)對(duì)音頻信號(hào)進(jìn)行分層的示意圖,本發(fā)明基于頻帶將單聲道或立體聲音頻信號(hào)分為一基本層和一增強(qiáng)層,依次從低頻到高頻將每個(gè)頻段的音頻編碼信息放入基本層和增強(qiáng)層?;緦訛閱温暤阑蛄Ⅲw聲的低頻編碼部分;增強(qiáng)層為單聲道或立體聲的高頻編碼部分。在該分層方案下,高頻部分編碼可以參與與低頻部分同樣的算法,或者采用參數(shù)方法如帶寬擴(kuò)展算法?;緦右话悴捎谜5木幋a算法如mp3,AAC或DRA等,增強(qiáng)層仍可使用正常編碼算法、部分參數(shù)編碼算法如強(qiáng)度立體聲、參數(shù)編碼算法如帶寬擴(kuò)展等。以頻帶分層方案的優(yōu)點(diǎn)是保證低頻的質(zhì)量。參照?qǐng)D4示出的基于聲道的分層結(jié)構(gòu)對(duì)音頻信號(hào)進(jìn)行分層的示...