專利名稱:用于隱蔽壓縮域分組丟失的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明概括而言涉及差錯掩藏,更具體而言,涉及用于隱蔽數(shù)字音頻流應(yīng)用中出現(xiàn)傳輸錯誤的分組丟失恢復(fù)。
背景技術(shù):
如果流媒體可用于移動設(shè)備中,那么用戶就能使用移動設(shè)備例如收聽音樂。對于音樂收聽?wèi)?yīng)用而言,通常將音頻信號壓縮成數(shù)字分組格式來傳輸。壓縮數(shù)字音頻諸如MP3(MPEG-1/2層3)在Internet上的傳輸,對于傳統(tǒng)的音樂發(fā)行過程已經(jīng)產(chǎn)生了深遠(yuǎn)的影響。在音頻信號壓縮領(lǐng)域中最新研究表明,對于使用移動終端的流數(shù)字音頻已有可能實現(xiàn)。由于網(wǎng)絡(luò)通信量增大,有可能出現(xiàn)因分組網(wǎng)絡(luò)中通信量擁塞或過度延遲而造成音頻分組的丟失。此外,無線信道是另一種可引起分組丟失的差錯源。在此條件下,關(guān)鍵在于提高服務(wù)質(zhì)量(QoS),從而產(chǎn)生普遍接受的音樂流應(yīng)用。
為了減輕分組丟失所引起的聲音品質(zhì)下降,已經(jīng)提出了多種現(xiàn)有技術(shù)及其組合。UEP(不等差錯保護),即前向糾錯的子類(FEC),是在此方面的一個重要概念。已經(jīng)證明,UEP是一種用于保護壓縮域音頻比特流,如MPEG AAC(高級音頻編碼),的非常有效的工具,其中,按照其比特差錯靈敏度將比特分成不同的類。在美國專利申請序列No.10/281,395中披露了使用UEP進行樂器聲音的差錯隱蔽。
在另一種方法中,Korhonen(“Error Robustness Scheme forPefceptually Coded Audio Based on Interframe Shuffling ofSamples”,Proc.of IEEE International Conference onAcoustics,Speech and Signal Processing 2002,OrlandoFlorida,pp.2053-2056,2002年5月)將音頻幀分成兩部分關(guān)鍵數(shù)據(jù)部分和弱關(guān)鍵數(shù)據(jù)部分。包括關(guān)鍵數(shù)據(jù)部分的有效載荷通過可靠方式傳輸,如TCP(傳輸控制協(xié)議),而弱關(guān)鍵數(shù)據(jù)部分諸如UDP(用戶數(shù)據(jù)報協(xié)議)的方式傳輸。
不過,由于移動IP網(wǎng)絡(luò)的差錯性以及對等待時間的限制,按照多種UEP機制以及選擇性重發(fā)機制進行的分組傳遞依然不太可靠。特別是當(dāng)差錯源自于擁塞IP網(wǎng)絡(luò)中的分組丟失,無線空中接口中的比特差錯,以及蜂窩網(wǎng)絡(luò)中的切換時的情形。因而,提供一種用于在分組網(wǎng)如移動IP網(wǎng)、2.5G和3G網(wǎng)以及藍(lán)牙上傳輸高質(zhì)量音頻流的健壯方法和系統(tǒng),是有益和合乎需要的。該方法和系統(tǒng)必須考慮所需的計算復(fù)雜性以及存儲器/能耗。
MPEG-2/MPEG-4 AAC編碼器及其相關(guān)的數(shù)據(jù)結(jié)構(gòu)在本領(lǐng)域中是公知的。圖1表示AAC幀的數(shù)據(jù)結(jié)構(gòu)。幀包括關(guān)鍵數(shù)據(jù)部分(例如報頭),標(biāo)度因子以及量化改良離散余弦變換系數(shù)(QMDCT數(shù)據(jù))。圖2表示MPEG-2解碼器。如圖所示,解碼器10包括比特流多路解復(fù)用器,用于接收13818-7編碼的音頻數(shù)據(jù)流200,并將信號(細(xì)線)和數(shù)據(jù)(粗線)提供給解碼器中的各個解碼工具。解碼器10中的工具包括增益控制模塊,AAC頻譜處理塊以及AAC解碼塊。如圖2所示,可由比特流多路解復(fù)用器所提供的信號220和數(shù)據(jù)230得到AAC幀中的關(guān)鍵數(shù)據(jù)部分110??捎蔁o噪聲解碼工具的輸出獲得QMDCT數(shù)據(jù)112??捎蓸?biāo)度因子解碼工具的輸出獲得標(biāo)度因子114。在現(xiàn)有技術(shù)中,差錯隱蔽主要在時域(例如PCM取樣240)或頻域(例如MDCT和IMDCT系數(shù))中實現(xiàn)。所述現(xiàn)有技術(shù)解決方案對于存儲器、計算和能耗的要求更多。當(dāng)在移動終端中實現(xiàn)音頻流時,希望使用能大大減少存儲器要求、計算復(fù)雜性以及能耗的差錯隱蔽方法。
發(fā)明內(nèi)容
本發(fā)明提供一種對數(shù)字音頻流中發(fā)生的傳輸差錯進行差錯隱蔽的方法和裝置。更具體而言,在壓縮域中恢復(fù)傳輸所造成的分組丟失。
從而,根據(jù)本發(fā)明第一方面,提供一種對音頻信號的比特流表示中的差錯進行隱蔽的方法,其中,該比特流包括當(dāng)前幀和至少一個相鄰幀,每幀具有處于壓縮域中的多個數(shù)據(jù)部分。該方法的特征在于將壓縮域中的所述多個數(shù)據(jù)部分存儲在所述至少一個相鄰幀中,判斷當(dāng)前幀是否存在缺陷,如果當(dāng)前幀有缺陷,則檢測當(dāng)前幀中至少一個有缺陷的數(shù)據(jù)部分,以及基于所述至少一個相鄰幀中的其中至少一個所存儲的數(shù)據(jù)部分,恢復(fù)當(dāng)前幀中所述至少一個有缺陷的數(shù)據(jù)部分。
如果當(dāng)前幀中有缺陷的數(shù)據(jù)部分為報頭,則基于與所述至少一個相鄰幀中所述其中至少一個所存儲的數(shù)據(jù)部分的報頭相關(guān)聯(lián)的統(tǒng)計特性,恢復(fù)該有缺陷的報頭。
如果當(dāng)前幀中有缺陷的數(shù)據(jù)部分是全局增益值,則基于用于恢復(fù)當(dāng)前幀中所述至少一個有缺陷的數(shù)據(jù)部分的所述至少一個相鄰幀中的全局增益,恢復(fù)該有缺陷的數(shù)據(jù)部分。
最好是,所述至少一個相鄰幀包括具有第一全局增益值的第一幀,和具有小于第一全局增益值的第二全局增益值的第二幀,基于第二全局增益值來恢復(fù)當(dāng)前幀中的有缺陷的數(shù)據(jù)部分。
如果當(dāng)前幀中有缺陷的數(shù)據(jù)部分包括一個或多個標(biāo)度因子,則基于用于恢復(fù)當(dāng)前幀中所述至少一個有缺陷數(shù)據(jù)部分的所述至少一個相鄰幀中的標(biāo)度因子,恢復(fù)該有缺陷的數(shù)據(jù)部分。
如果當(dāng)前幀中有缺陷的數(shù)據(jù)部分包括QMDCT系數(shù),則基于所述至少一個相鄰幀中的QMDCT系數(shù)、特別是在較低頻率域中的QMDCT系數(shù),恢復(fù)該有缺陷的數(shù)據(jù)部分??捎昧闳〈?dāng)前幀中丟失的QMDCT系數(shù)。
根據(jù)本發(fā)明第二方面,提供一種音頻解碼器,用于解碼音頻信號的比特流表示,以便提供在調(diào)制域中的音頻數(shù)據(jù),其中,該比特流包括當(dāng)前幀和至少一個相鄰幀,每幀具有多個數(shù)據(jù)部分,所述解碼器包括第一模塊,用于解碼所述每個幀,以提供在壓縮域中的多個數(shù)據(jù)部分的信號表示。該解碼器的特征在于第二模塊,其對信號作出響應(yīng),用于將壓縮域中的所述多個數(shù)據(jù)部分存儲在所述至少一個相鄰幀中,以及第三模塊,若當(dāng)前幀有缺陷,則用于檢測壓縮域中的至少一個有缺陷的數(shù)據(jù)部分,以基于所述至少一個相鄰幀中的至少其中一個所存儲的數(shù)據(jù)部分,恢復(fù)當(dāng)前幀中所述至少一個有缺陷的數(shù)據(jù)部分。
根據(jù)本發(fā)明第三方面,提供一種用于接收音頻流中的分組數(shù)據(jù)的音頻接收機,所述接收機包括拆包模塊,用于將接收的分組數(shù)據(jù)拆成音頻信號的比特流表示,其中,該比特流包括當(dāng)前幀和至少一個相鄰幀,每幀具有多個數(shù)據(jù)部分。該接收機的特征在于解碼模塊,用于將所述每個幀解碼,以提供在壓縮域中的多個數(shù)據(jù)部分的信號表示,存儲模塊,對信號作出響應(yīng),用于將壓縮域中的所述多個數(shù)據(jù)部分存儲在所述至少一個相鄰幀中,以及差錯隱蔽模塊,若當(dāng)前幀有缺陷,則用于檢測當(dāng)前幀中的至少一個數(shù)據(jù)部分,以基于所述至少一個相鄰幀中的至少其中一個所存儲的數(shù)據(jù)部分,恢復(fù)當(dāng)前幀中的所述至少一個有缺陷的數(shù)據(jù)部分。
根據(jù)本發(fā)明第四方面,提供一種電信設(shè)備,如移動終端。該電信設(shè)備包括天線,和與天線相連的音頻接收機,用于接收音頻流中的分組數(shù)據(jù),其中,該接收機包括拆包模塊,用于將所接收的分組數(shù)據(jù)拆成音頻信號的比特流表示,其中,該比特流包括當(dāng)前幀和至少一個相鄰幀,每幀具有多個數(shù)據(jù)部分,且其中,該接收機還包括解碼模塊,用于解碼所述每個幀,以提供在壓縮域中的多個數(shù)據(jù)部分的信號表示,存儲模塊,對信號作出響應(yīng),用于將壓縮域中的所述多個數(shù)據(jù)部分存儲在所述至少一個相鄰幀中,以及差錯隱蔽模塊,若當(dāng)前幀有缺陷,則檢測當(dāng)前幀中的至少一個數(shù)據(jù)部分,以基于所述至少一個相鄰幀中的至少其中一個所存儲的數(shù)據(jù)部分,恢復(fù)當(dāng)前幀中的所述至少一個有缺陷的數(shù)據(jù)部分。
結(jié)合附圖3至13,通過閱讀說明,將易于理解本發(fā)明。
圖1所示的方框圖表示AAC幀的數(shù)據(jù)結(jié)構(gòu)。
圖2所示的方框圖表示現(xiàn)有技術(shù)的MPEG-2 AAC解碼器。
圖3所示的流程圖表示根據(jù)本發(fā)明的差錯隱蔽方法。
圖4所示的示意圖表示對于AAC幀被破壞的關(guān)鍵數(shù)據(jù)部分的恢復(fù)。
圖5所示的示意圖表示所丟失標(biāo)度因子的恢復(fù)。
圖6所示的曲線圖表示AAC幀的左和右通道的長開窗標(biāo)度因子。
圖7所示的曲線圖表示長開窗標(biāo)度因子的另一示例。
圖8所示的曲線圖表示兩相鄰AAC幀的短開窗標(biāo)度因子。
圖9所示的示意圖表示AAC幀中的標(biāo)度因子矢量。
圖10所示的示意圖表示估計丟失編碼標(biāo)度因子的搜索過程。
圖11a所示的曲線圖表示AAC幀的其中一個立體聲通道中的QMDCT系數(shù)。
圖11b所示的曲線圖表示AAC幀的另一立體聲通道中的QMDCT系數(shù)。
圖12所示的方框圖表示,根據(jù)本發(fā)明,可實現(xiàn)差錯隱蔽方法的接收機。
圖13所示的方框圖表示,根據(jù)本發(fā)明,具有差錯隱蔽模塊的移動終端。
具體實施例方式
在使用各種UEP(不等差錯保護)機制后,在接收機側(cè)的情形可能是在AAC幀中的QMDCT(量化改良離散余弦變換)數(shù)據(jù)中出現(xiàn)最多的分組丟失。有些分組丟失發(fā)生在AAC標(biāo)度因子中。在罕有情況下,分組丟失可能出現(xiàn)在關(guān)鍵數(shù)據(jù)中,或者AAC報頭和全局_增益(global-gain)中。如果關(guān)鍵數(shù)據(jù)丟失,則很難將該AAC幀的其余部分解碼。
因而,本發(fā)明直接在壓縮域中進行差錯隱蔽。特別是,本發(fā)明隱蔽AAC幀的三個獨立部分中的差錯包括報頭和全局_增益的關(guān)鍵數(shù)據(jù),QMDCT數(shù)據(jù)以及標(biāo)度因子。圖3的流程圖500中表示出根據(jù)本發(fā)明的差錯隱蔽方法。在通過比特流多路解復(fù)用器(圖2)將編碼音頻比特流分類后,獲得并檢查AAC幀中報頭和全局增益的數(shù)據(jù)110表示,QMDCT系數(shù)的數(shù)據(jù)112表示以及標(biāo)度因子的數(shù)據(jù)114表示,以進行差錯隱蔽。在步驟510,檢查數(shù)據(jù)110,判斷報頭和全局_增益中是否存在差錯。如果存在差錯,則將AAC比特流路由到差錯處理器,在步驟512,在該處校正報頭/全局_增益。如果在報頭/全局_增益數(shù)據(jù)中不存在任何錯誤,則在步驟520,檢查數(shù)據(jù)112,以判斷在QMDCT系數(shù)中是否存在差錯。如果存在差錯,則將AAC比特流路由到差錯處理器,在步驟522,于該處校正QMDCT系數(shù)中的差錯。之后,在步驟530處檢查數(shù)據(jù)114,判斷標(biāo)度因子中是否存在差錯。如果存在差錯,則在步驟532處校正標(biāo)度因子中的差錯。在這些差錯隱蔽步驟之后,在步驟540將隱蔽了差錯的AAC比特流解碼成PCM取樣。
為了隱蔽當(dāng)前AAC幀中數(shù)據(jù)110,112和114中的差錯,優(yōu)選將至少一個以前幀中的相應(yīng)數(shù)據(jù)存儲在緩沖器中。圖12表示出能實現(xiàn)本發(fā)明的接收機。
由于AAC報頭和全局_增益的數(shù)據(jù)表示是差錯隱蔽中最關(guān)鍵的數(shù)據(jù),必須加強該關(guān)鍵數(shù)據(jù)的保護。可通過下面所述多種方法實現(xiàn)保護。
1)在流傳輸開始之前,可事先傳輸關(guān)鍵數(shù)據(jù)。由此,分組丟失最可能發(fā)生在QMDCT數(shù)據(jù)和標(biāo)度因子中。
2)通過選擇性重發(fā)機制保護關(guān)鍵數(shù)據(jù)。因為在大多數(shù)AAC比特流中,關(guān)鍵數(shù)據(jù)占這些位的比例不足10%,基于網(wǎng)絡(luò)的重發(fā)機制不會顯著減小傳輸帶寬。
3)在發(fā)送側(cè),將關(guān)鍵數(shù)據(jù)作為輔助數(shù)據(jù)嵌入在多個分組中。
利用這些方法中的任何一種,可將一個或多個幀的關(guān)鍵數(shù)據(jù)存儲在接收機側(cè)。如果在關(guān)鍵數(shù)據(jù)中出現(xiàn)分組丟失,基于其統(tǒng)計特性和數(shù)據(jù)結(jié)構(gòu),可由相鄰幀得出至少部分關(guān)鍵數(shù)據(jù)。例如,可由幀n-1和n+1中的相應(yīng)數(shù)據(jù)確定幀n的MDCT窗口_序列(window_sequence)。同樣,可由相鄰幀可靠地估計出窗口_形狀(window_shape)。對于全局_增益,優(yōu)選使用相鄰幀n-1和n+1中其中較小的一個全局_增益值,以取代幀n中的丟失值。根據(jù)心理聲學(xué),該準(zhǔn)則反映出這樣的事實,即導(dǎo)致聲音下降的填充聲音片段在感覺上比急變(surge)的聲音片段更舒服。在關(guān)鍵數(shù)據(jù)中用于差錯隱蔽的關(guān)鍵數(shù)據(jù)緩沖器如圖4所示。
在基于幀n-1和幀n+1中的關(guān)鍵數(shù)據(jù)得出受損幀n中的關(guān)鍵數(shù)據(jù)并保存了得出的關(guān)鍵數(shù)據(jù)后,存在至少兩種方式來產(chǎn)生填充1、由相鄰幀估計幀n所缺少的標(biāo)度因子和QMDCT,后面將會對此進行描述。
2、通過將幀中的標(biāo)度因子和QMDCT系數(shù)設(shè)置為零,在壓縮域中減弱整個幀n,并隱蔽在MDCT域或PCM域(參見圖2和12)中的差錯。
如果分組丟失僅出現(xiàn)在AAC標(biāo)度因子中(即,相同幀中的AAC報頭和全局_增益是可用的),則可使用全局_增益和哈夫曼表對各個標(biāo)度因子進行編碼。此外,從每個數(shù)據(jù)部分中的部分_數(shù)據(jù)(section_data)和最大值可獲得具有零的標(biāo)度因子的部分。同樣,有可能估計單個DPCM(差分脈碼調(diào)制)標(biāo)度因子以及甚至是AAC幀中的全部標(biāo)度因子。用于估計丟失數(shù)據(jù)的基本方法是部分模式匹配方法。
標(biāo)度因子中的差錯可以以不同方式出現(xiàn)1).在AAC幀中的所有標(biāo)度因子全部丟失;2).AAC幀中的一部分標(biāo)度因子丟失;以及3).在AAC幀中的單個標(biāo)度因子丟失。當(dāng)AAC幀中的所有標(biāo)度因子丟失時,基于一個或多個相鄰幀可計算出丟失的標(biāo)度因子,如圖5所示。圖5顯示出當(dāng)對立體聲音樂進行編碼時由此一個幀具有兩個通道的情形。將每個通道中的標(biāo)度矢量視為矢量,可使用相鄰失量的輪廓(contour)來判斷幀間或通道間相關(guān)是否起主導(dǎo)作用。如果通道間相關(guān)強于幀間相關(guān),則使用相鄰?fù)ǖ罉?biāo)度因子矢量來代替丟失的標(biāo)度因子矢量,反之亦然。應(yīng)該注意,由于長窗口的標(biāo)度_因子矢量緯度不同于短窗口的標(biāo)度_因子矢量緯度,出于差錯隱蔽的目的,必須存儲對于長和短窗口的標(biāo)度_因子矢量。圖6和7顯示出長開窗標(biāo)度因子的示例,圖8顯示出音頻比特流的兩個AAC幀的短開窗標(biāo)度因子示例。在圖6,7和8中,使用第一標(biāo)度_因子得出全局_增益。如果短窗口的標(biāo)度因子丟失,則應(yīng)使用所存儲的短開窗標(biāo)度因子來恢復(fù)它們。同樣,如果長窗口的標(biāo)度因子丟失,則應(yīng)使用所存儲的長開窗標(biāo)度因子來恢復(fù)它們。
除作為全局_增益的第一標(biāo)度因子外,還可計算出兩個通道x,y之間的部分歐幾里德距離dx,y,如下d=Σi=1N(SCFx,i-SCFy,i-c)2·wi]]>其中,N為通道中標(biāo)度因子的數(shù)量,SCF為單個標(biāo)度因子,w為感覺加權(quán)因子,c=Gx-Gy,且Gx,Gy為通道x和y的全局_增益。對于更復(fù)雜的實現(xiàn)方式,可使用搜索方法得出c,以獲得在兩個通道之間的最小距離。
例如,如果幀n的右通道的一部分或所有標(biāo)度因子丟失,則計算出幀n-1的左與右通道之間的部分歐幾里德距離d1和幀n-1的左通道與幀n的左通道之間的部分歐幾里德距離d2,以便判斷通道間相關(guān)或幀間是否用于差錯隱蔽目的。如果d1>d2(或lag=2),則應(yīng)使用幀間相關(guān),應(yīng)基于幀n-1的右通道中的標(biāo)度因子來恢復(fù)幀n的右通道中丟失的標(biāo)度因子。如果d1<d2(或lag=1),則應(yīng)使用通道間相關(guān),應(yīng)基于幀n的左通道中的標(biāo)度因子來恢復(fù)幀n的右通道中丟失的標(biāo)度因子。在使用所存儲的標(biāo)度因子代替丟失的標(biāo)度因子之前,為阻止任何錯誤的能量急變或避免產(chǎn)生錯誤的凸顯(salient)頻率成分,需進行某些調(diào)整。例如,應(yīng)考慮到兩個通道之間的全局_增益偏移c。
如果在AAC幀中的單個標(biāo)度因子丟失且其位置已知,如果在一個或多個相鄰幀中的標(biāo)度因子未遭破壞的話,則有可能估計丟失的DPCM編碼標(biāo)度因子。在不失一般性的條件下,假設(shè)丟失了兩個單個標(biāo)度因子,如圖9所示。在圖9中,陰影區(qū)域表示丟失的標(biāo)度因子x1,x2,它們各處在同一幀中未遭破壞的標(biāo)度因子的矢量(空白區(qū))之間。可將幀中的標(biāo)度因子解碼,直至出現(xiàn)第一丟失標(biāo)度因子x1。盡管x1與x2之間的數(shù)據(jù)是正確的,由于DPCM編碼特性,不能直接使用它們。不過,可使用搜索方法來估計丟失的標(biāo)度因子x1,如圖10所示。搜索從零開始(這是由于它是丟失標(biāo)度因子x1的最有可能的值),在x2之前的標(biāo)度因子處停止。在每個步驟中,計算出部分歐幾里德距離,并使用所計算出值中的最小歐幾里德距離來估計丟失的標(biāo)度因子x1。在搜索中,如圖10所示,在第六步中找出最小歐幾里德距離,且丟失的標(biāo)度因子x1為3??砂凑胀瑯拥姆绞絹砼卸▉G失的標(biāo)度因子x2。
在分組丟失中最可能出現(xiàn)的情形是QMDCT系數(shù)受損或丟失,而報頭和標(biāo)度因子可用。在此情形中,還可使用部分模式匹配的方法來恢復(fù)丟失的QMDCT系數(shù)。AAC幀的QMDCT系數(shù)的示例如圖11a和11b所示。在傳輸音頻流期間,連續(xù)計算出基于所接收幀的QMDCT系數(shù)的特征矢量(FV)。結(jié)合差錯隱蔽方法所使用的特征是最大絕對值,平均絕對值和帶寬(非零值的數(shù)量)。在AAC幀中的兩個立體聲通道的QMDCT系數(shù)分別如圖11a和11b所示。如圖所示,較大值通常集中在低頻區(qū)。為恢復(fù)幀中丟失的QMDCT系數(shù),基于其均值和方差將QMDCT系數(shù)劃分到兩個頻率區(qū)。在低頻區(qū)中,最好使用時域相關(guān)方法來恢復(fù)通常較大的值。例如,如果QDMCT系數(shù)丟失,可利用可能相關(guān)的QMDCT矢量中相應(yīng)系數(shù)來代替它們。在此使用特征矢量來找出可能的相關(guān)。不過,在高頻區(qū)中,最好使用不同的方法。
為恢復(fù)高頻區(qū)中的QMDCT,假設(shè)有兩種情形。如果幀的全部QMDCT系數(shù)丟失(最大1024),最好只使用緩沖的信息來恢復(fù)丟失的QMDCT系數(shù)。為判定應(yīng)使用通道間相關(guān)或是幀間相關(guān),計算出使用前一幀中FV的自相關(guān)的lag值(1或2)?;趌ag值,可判定是否使用同樣幀的不同通道還是不同幀的相同通道。利用自幀所計算出的lag值,還有可能判定是否使用前一幀來代替丟失的幀。為阻止填充QMDCT系數(shù)超出如所要使用的哈夫曼代碼本所定義的最大值,應(yīng)削減填充QMDCT系數(shù)。例如,可將全部填充QMDCT系數(shù)降低一常數(shù),從而在填充幀中將不會出現(xiàn)能量的急變。
如果僅丟失高頻區(qū)中QMDCT系數(shù)的獨立簇(cluster)(例如2或4的簇),則隱蔽差錯的最簡單方法是以零代替所有丟失的QMDCT系數(shù)。
對于僅丟失低頻區(qū)中QMDCT系數(shù)的獨立簇的情形,可使用幀間相關(guān)來檢查與相鄰幀的部分歐幾里德距離,通過降低因子來修改填充系數(shù)以阻止出現(xiàn)偽能量急變。
圖12的方框圖顯示出在接收機側(cè)的AAC解碼器,根據(jù)本發(fā)明,該解碼器能夠?qū)崿F(xiàn)壓縮域中的差錯隱蔽以及在MDCT域中的差錯隱蔽。此外,它還能夠在PCM域中隱蔽樂器聲音中的差錯,這在共同未決美國專利申請序列No.10/281,395中有所討論。如圖12所示,在接收機側(cè)5,使用分組拆包模塊20將分組數(shù)據(jù)200轉(zhuǎn)換成AAC比特流210。代碼本的信息202表示提供到樂器代碼本緩沖器22進行存儲。同時,將分組序列號的信息204表示提供給差錯檢查模塊24以檢查是否丟失分組。若丟失分組的話,則差錯檢查模決24通知丟失分組的壞幀指示28。壞幀指示28還表示應(yīng)使用樂器代碼本中的哪個元件用于差錯隱蔽?;趬膸甘?8所提供的信息,壓縮域差錯隱蔽部件30向AAC解碼器10提供受損或丟失音頻幀的信息表示。與此同時,使用碼冗余度檢查(CRC)模塊26來檢測解碼器10中的比特流。CRC模塊26將比特流差錯的信息表示提供給壞幀指示28。使用在操作上與壓縮域差錯隱蔽模塊30相連的多個緩沖器32,34和36來存儲報頭與全局_增益的表示,標(biāo)度因子和QMDCT系數(shù)。基于在AAC幀中丟失了什么樣的數(shù)據(jù)部分,利用在緩沖器32,34和36中的數(shù)據(jù)得出或計算丟失的數(shù)據(jù)部分。有益的是,還提供緩沖器42,以存儲MDCT系數(shù),并且如果將壞幀的標(biāo)度因子和QMDCT數(shù)據(jù)設(shè)置為零,則將MDCT域差錯隱蔽模塊40用于隱蔽差錯。在壓縮域或MDCT域中隱蔽了AAC比特流210中的差錯后,AAC解碼器10將AAC比特流解碼成PCM取樣240?;谌缰胤啪彌_器50所提供的樂器聲音的信息表示,PCM域差錯隱蔽部件52使用樂器代碼緩沖器22所提供的代碼本元件206重構(gòu)受損或丟失的樂器聲音。經(jīng)差錯隱蔽的PCM取樣250提供給重放裝置。
應(yīng)注意,如上所述的接收機5還包括差錯隱蔽模塊和緩沖器以重構(gòu)在音頻比特流中受損或丟失的樂器聲音。在共同未決美國專利申請序列10/281,395中披露了關(guān)于樂器聲音恢復(fù)的細(xì)節(jié)。然而,根據(jù)本發(fā)明,可在不使用樂器聲音恢復(fù)機制的條件下實現(xiàn)對于壓縮域分組丟失隱蔽的方法和裝置。
可用于移動終端的差錯隱蔽方法和裝置如圖13所示。圖13的方塊圖表示根據(jù)本發(fā)明的一個示例性實施例的移動終端300。移動終端300包括終端所特有部件,如麥克風(fēng)301,鍵盤307,顯示器306,發(fā)送/接收開關(guān)308,天線309和控制部件305。此外,圖13顯示出移動終端所特有的發(fā)送器和接收機塊304,311。發(fā)送器塊304包括用于將講話信號進行編碼的編碼器321。發(fā)送器塊304還包括信道編碼,譯碼和調(diào)制所需的操作,以及RF功能(為清楚起見,在圖13中未示出)。接收機塊311包括能夠接收例如用于收聽音樂目的的壓縮數(shù)字音頻數(shù)據(jù)的解碼塊320。從而,解碼塊320包括類似于AAC解碼器10的解碼器以及類似于如圖12所示壓縮域差錯隱蔽模塊30,MDCT域差錯隱蔽模塊40和緩沖器32,34,36,42的差錯隱蔽模塊/緩沖器322。來自麥克風(fēng)301的信號,經(jīng)放大階段302處放大,并在A/D轉(zhuǎn)換器303中數(shù)字化,提供給發(fā)送器塊304,通常是提供給發(fā)送塊所包括的講話編碼裝置。所處理的發(fā)送信號經(jīng)過發(fā)送塊的調(diào)制和放大,經(jīng)由發(fā)送/接收開關(guān)308提供給天線309。所要接收的信號自天線經(jīng)由發(fā)送/接收開關(guān)308提供給接收器塊311,由接收器塊解調(diào)接收信號。解碼塊320能夠?qū)⒃诮庹{(diào)的接收信號中的分組數(shù)據(jù)轉(zhuǎn)換成包含有多個幀的AAC比特流。差錯隱蔽模塊基于在緩沖器中所存儲的數(shù)據(jù)恢復(fù)在缺陷幀中的丟失數(shù)據(jù)。差錯隱蔽的PCM取樣被饋送到重放裝置312??刂撇考?05控制移動終端300進行操作,讀取用戶通過鍵盤307所給出的控制命令,并通過顯示器306向用戶提供消息。
從而,盡管參照本發(fā)明的優(yōu)選實施例描述了本發(fā)明,本領(lǐng)域技術(shù)人員應(yīng)該理解,在不偏離本發(fā)明范圍的條件下,可對本發(fā)明進行在形式和細(xì)節(jié)上的上述以及各種其他改變,省略和修改。
權(quán)利要求
1.一種對音頻信號的比特流表示中的差錯進行隱蔽的方法,其中,該比特流包括當(dāng)前幀和至少一個相鄰幀,每幀具有處于壓縮域中的多個數(shù)據(jù)部分,所述方法的特征在于將壓縮域中的所述多個數(shù)據(jù)部分存儲在所述至少一個相鄰幀中;判斷當(dāng)前幀是否存在缺陷;如果當(dāng)前幀有缺陷,則檢測當(dāng)前幀中至少一個有缺陷的數(shù)據(jù)部分,以及基于所述至少一個相鄰幀中的其中至少一個所存儲的數(shù)據(jù)部分,恢復(fù)當(dāng)前幀中所述至少一個有缺陷的數(shù)據(jù)部分。
2.根據(jù)權(quán)利要求1的方法,特征在于,在當(dāng)前幀中所述至少一個有缺陷的數(shù)據(jù)部分包括報頭,所述恢復(fù)是基于與所述至少一個相鄰幀中所述其中至少一個所存儲的數(shù)據(jù)部分的報頭相關(guān)聯(lián)的統(tǒng)計特性。
3.根據(jù)權(quán)利要求1的方法,特征在于,在當(dāng)前幀中所述至少一個有缺陷的數(shù)據(jù)部分包括窗口序列,所述至少其中一個所存儲的數(shù)據(jù)部分包括在所述至少一個相鄰幀中的窗口序列,以恢復(fù)在當(dāng)前幀中的所述至少一個有缺陷的數(shù)據(jù)部分。
4.根據(jù)權(quán)利要求1的方法,特征在于,在當(dāng)前幀中所述至少一個有缺陷的數(shù)據(jù)部分包括窗口形狀,所述至少其中一個所存儲的數(shù)據(jù)部分包括在所述至少一個相鄰幀中的窗口形狀,以恢復(fù)在當(dāng)前幀中的所述至少一個有缺陷的數(shù)據(jù)部分。
5.根據(jù)權(quán)利要求1的方法,特征在于,在當(dāng)前幀中所述至少一個有缺陷的數(shù)據(jù)部分包括全局增益值,所述至少其中一個所存儲的數(shù)據(jù)部分包括在所述至少一個相鄰幀中的全局增益值,以恢復(fù)在當(dāng)前幀中的所述至少一個有缺陷的數(shù)據(jù)部分。
6.根據(jù)權(quán)利要求1的方法,特征在于,在當(dāng)前幀中所述至少一個有缺陷的數(shù)據(jù)部分包括全局增益值,所述至少一個相鄰幀包括具有第一全局增益值的第一幀和具有第二全局增益值的第二幀,且第二全局增益值小于第一全局增益值,并且,基于第二全局增益值來恢復(fù)當(dāng)前幀中的所述至少一個有缺陷的數(shù)據(jù)部分。
7.根據(jù)權(quán)利要求1的方法,特征在于,在當(dāng)前幀中所述至少一個有缺陷的數(shù)據(jù)部分包括一個或多個標(biāo)度因子,所述至少其中一個所存儲的數(shù)據(jù)部分包括在所述至少一個相鄰幀中的一個或多個標(biāo)度因子,以恢復(fù)在當(dāng)前幀中的所述至少一個有缺陷的數(shù)據(jù)部分。
8.根據(jù)權(quán)利要求1的方法,特征在于,在當(dāng)前幀中所述至少一個有缺陷的數(shù)據(jù)部分包括多個變換系數(shù),所述至少其中一個所存儲的數(shù)據(jù)部分包括在所述至少一個相鄰幀中的多個變換系數(shù),以恢復(fù)在當(dāng)前幀中的所述至少一個有缺陷的數(shù)據(jù)部分。
9.根據(jù)權(quán)利要求8的方法,特征在于,變換系數(shù)包括QMDCT系數(shù)。
10.根據(jù)權(quán)利要求9的方法,特征在于,QMDCT系數(shù)包括在高頻區(qū)中和低頻區(qū)中的系數(shù),其中,基于所述至少一個相鄰幀中低頻區(qū)中的相應(yīng)系數(shù),來恢復(fù)有缺陷數(shù)據(jù)部分的低頻區(qū)中的系數(shù)。
11.一種用于解碼音頻信號的比特流表示以便提供在調(diào)制域中的音頻數(shù)據(jù)的音頻解碼器,其中,該比特流包括當(dāng)前幀和至少一個相鄰幀,每幀具有多個數(shù)據(jù)部分,所述解碼器包括第一模塊,用于解碼所述每個幀,以提供在壓縮域中的多個數(shù)據(jù)部分的信號表示,所述解碼器的特征在于第二模塊,對信號作出響應(yīng),用于將壓縮域中的所述多個數(shù)據(jù)部分存儲在所述至少一個相鄰幀中,以及第三模塊,若當(dāng)前幀有缺陷,則用于檢測壓縮域中的至少一個有缺陷的數(shù)據(jù)部分,以基于所述至少一個相鄰幀中的至少其中一個所存儲的數(shù)據(jù)部分,恢復(fù)當(dāng)前幀中所述至少一個有缺陷的數(shù)據(jù)部分。
12.一種用于接收音頻流中的分組數(shù)據(jù)的音頻接收機,所述接收機包括拆包模塊,用于將接收的分組數(shù)據(jù)拆成音頻信號的比特流表示,其中,該比特流包括當(dāng)前幀和至少一個相鄰幀,每幀具有多個數(shù)據(jù)部分,所述接收機的特征在于解碼模塊,用于將所述每個幀解碼,以提供在壓縮域中的多個數(shù)據(jù)部分的信號表示,存儲模塊,對信號作出響應(yīng),用于將壓縮域中的所述多個數(shù)據(jù)部分存儲在所述至少一個相鄰幀中,以及差錯隱蔽模塊,若當(dāng)前幀有缺陷,則用于檢測當(dāng)前幀中的至少一個數(shù)據(jù)部分,以基于所述至少一個相鄰幀中的至少其中一個所存儲的數(shù)據(jù)部分,恢復(fù)當(dāng)前幀中的所述至少一個有缺陷的數(shù)據(jù)部分。
13.一種移動終端,包括天線,和與天線相連的音頻接收機,用于接收音頻流中的分組數(shù)據(jù),其中,該接收機包括拆包模塊,用于將所接收的分組數(shù)據(jù)拆成音頻信號的比特流表示,其中,該比特流包括當(dāng)前幀和至少一個相鄰幀,每幀具有多個數(shù)據(jù)部分,所述移動終端的特征在于,接收機還包括解碼模塊,用于解碼所述每個幀,以提供在壓縮域中的多個數(shù)據(jù)部分的信號表示,存儲模塊,對信號作出響應(yīng),用于將壓縮域中的所述多個數(shù)據(jù)部分存儲在所述至少一個相鄰幀中,以及差錯隱蔽模塊,若當(dāng)前幀有缺陷,則檢測當(dāng)前幀中的至少一個數(shù)據(jù)部分,以基于所述至少一個相鄰幀中的至少其中一個所存儲的數(shù)據(jù)部分,恢復(fù)當(dāng)前幀中的所述至少一個有缺陷的數(shù)據(jù)部分。
全文摘要
一種用于在壓縮域中隱蔽AAC比特流中的丟失數(shù)據(jù)的差錯隱蔽方法和裝置。該比特流被劃分成幀,每個幀具有多個包括報頭/全局增益,標(biāo)度因子和QMDCT系數(shù)的數(shù)據(jù)部分。數(shù)據(jù)部分存儲在多個緩沖器中,從而,如果當(dāng)前幀的一個或多個數(shù)據(jù)部分受損或丟失,使用相鄰幀中相應(yīng)的數(shù)據(jù)部分來隱蔽當(dāng)前幀中的差錯。
文檔編號G10L19/14GK1732512SQ200380108100
公開日2006年2月8日 申請日期2003年12月29日 優(yōu)先權(quán)日2002年12月31日
發(fā)明者Y·王, J·奧延佩拉, J·科爾霍寧 申請人:諾基亞有限公司