涉及已編碼聲音信號的譯碼的差錯消除的制作方法

文檔序號：2823592閱讀：216來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：涉及已編碼聲音信號的譯碼的差錯消除的制作方法
背景技術(shù)：
和現(xiàn)有技術(shù)本發(fā)明總地涉及由表示聲音信號的編碼數(shù)據(jù)部分丟失或者損壞而引起的譯碼聲音信號中的差錯消除。更具體而言，本發(fā)明涉及分別按照權(quán)利要求1和39的前序部分的從傳輸媒質(zhì)接收編碼信息形式的數(shù)據(jù)的一種方法和一種差錯消除單元。本發(fā)明還涉及分別按照權(quán)利要求41和42的前序部分的用于從接收到的編碼信息形式的數(shù)據(jù)生成聲音信號的譯碼器、按照權(quán)利要求37的一種計算機程序和按照權(quán)利要求38的一種計算機可讀媒質(zhì)。
音頻和語音編譯碼器(編譯碼器＝編碼器和譯碼器)有很多不同應(yīng)用。比如，編碼和譯碼方案可用于固定和移動通信系統(tǒng)中和視頻會議系統(tǒng)中的聲音信號的比特率高效傳輸。語音編譯碼器也可用于保密電話和話音存儲。
特別在移動應(yīng)用中，編譯碼器有時是在惡劣的信道狀況下操作。這種非最佳傳輸狀況的一個后果是表示語音信號的編碼比特在發(fā)送機與接收機之間的某處受到破壞或丟失。今天的移動通信系統(tǒng)和因特網(wǎng)應(yīng)用的多數(shù)語音編譯碼器都按塊操作，其中GSM(移動通信全球系統(tǒng))、WCDMA(寬帶碼分多址接入)、TDMA(時分多址接入)和IS95(國際標(biāo)準(zhǔn)-95)構(gòu)成了一些實例。按塊操作的意思是聲音源信號被劃分為特定時長如20ms的語音編譯碼器幀。因而一個語音編譯碼器幀中的信息被編碼為一個單元。然而，語音編譯碼器幀通常還劃分為比如具有5ms時長的子幀。然后子幀就是特定參數(shù)的編碼單元，比如GSM FR-編譯碼器(FR＝全速率)、GSM EFR-編譯碼器(EFR＝增強的全速率)、GSM AMR-編譯碼器(AMR＝自適應(yīng)多速率)、ITU G.72 9-編譯碼器(ITU＝國際電信聯(lián)盟)和EVRC(增強的可變速率編譯碼器)中的合成濾波器激勵的編碼。
除了激勵參數(shù)外，上述編譯碼器還通過其他參數(shù)，比如像LPC參數(shù)(LPC＝線性預(yù)測編碼)、LTP滯后(LTP＝長期預(yù)測)和各種增益參數(shù)來對聲音信號建模。這些參數(shù)的特定比特表示的信息對于譯碼的聲音信號的感知聲音質(zhì)量非常重要。如果這些比特在傳輸當(dāng)中受到破壞，則收聽人至少暫時會感覺譯碼聲音信號的聲音質(zhì)量具有較低的質(zhì)量。因此如果對應(yīng)的語音編譯碼器幀帶著差錯到達(dá)，則忽視這些幀的參數(shù)而改為利用原先接收到的正確參數(shù)通常是很有利的。這種差錯消除技術(shù)可以這種形式或者其他方式應(yīng)用于聲音信號通過非理想信道傳輸?shù)亩鄶?shù)系統(tǒng)當(dāng)中。
差錯消除方法通常瞄準(zhǔn)的是減輕丟失/損壞的語音編譯碼器幀的影響，這是通過凍結(jié)相對較慢變化的任何語音編譯碼器參數(shù)來進(jìn)行的。這一差錯消除比如可通過GSM EFR-編譯碼器和GSM AMR-編譯碼器中的差錯消除單元執(zhí)行，該單元在丟失或損壞的語音編譯碼器幀的情況中重復(fù)該LPC增益和LPC滯后參數(shù)。然而，如果幾個連續(xù)的語音編譯碼器幀都丟失或損壞，則要應(yīng)用噪聲抑制技術(shù)，這會涉及帶有衰減因子的增益參數(shù)的重復(fù)和向其長期平均移動的LPC參數(shù)的重復(fù)。此外，在接收到一個或者多個損壞幀后第一個正確接收幀的功率電平可能被限制在接收該損壞幀前最后一個正確接收幀的功率電平。這就減輕了譯碼語音信號中不希望的人工產(chǎn)物，而該人工產(chǎn)物的發(fā)生是由于語音合成濾波器和自適應(yīng)碼本在接收到損壞幀期間的差錯狀態(tài)中設(shè)置而導(dǎo)致的。
下面涉及改善在發(fā)送機與接收機之間的傳輸期間丟失或者損壞的語音編譯碼器幀的惡劣影響的可選裝置和方面的一些實例。
美國專利5,907,822公布了一種丟失容忍語音譯碼器，它使用過去信號的歷史數(shù)據(jù)來插入到丟失的數(shù)據(jù)段中以消除數(shù)字語音幀差錯。被用于語音壓縮參數(shù)的一步外插的向后傳播所訓(xùn)練的一種多層前饋人工神經(jīng)網(wǎng)絡(luò)在丟失幀的情況下抽取必需的參數(shù)并產(chǎn)生一個替代幀。
歐洲專利B1,0 665 161描述了用于消除語音譯碼器中丟失幀的影響的一種裝置和一種方法。該文獻(xiàn)建議使用話音活動檢測器來限制門限值的更新以便能在丟失幀的情況下確定背景聲音。后置濾波器通常能使譯碼信號的頻譜發(fā)生歪斜。然而，在丟失幀的情況下后置濾波器的濾波系數(shù)不被更新。
美國專利5,909,663描述了一種語音編碼器，其中通過在接收幾個連續(xù)的損壞語音幀時避免重復(fù)使用相同參數(shù)而增強了譯碼語音信號的感知聲音質(zhì)量。將噪聲成分加入激勵信號、將激勵信號替換為噪聲成分或者隨機地從包含多個激勵信號的噪聲碼本讀出激勵信號可以完成這一方面。
通過在受到破壞的語音編譯碼器幀期間簡單地重復(fù)最后接收到的未損壞語音編譯碼器幀的特定譜參數(shù)，熟知的用于窄帶編譯碼器的差錯消除解決方案在多數(shù)環(huán)境下一般都提供了令人滿意的結(jié)果。實際當(dāng)中，這一規(guī)程隱含地保留了譯碼語音信號的頻譜的幅度和形狀，直到接收到一個新的未損壞的語音編譯碼器幀。通過這樣保留語音信號的譜幅度和形狀，它也隱含地假定該譯碼器中的激勵信號的頻譜是平坦的(或白的)。
然而，并非總是這種情況。比如，一個代數(shù)碼激勵線性預(yù)測編譯碼器(ACELP)可產(chǎn)生非白的激勵信號。此外，激勵信號的譜形狀從一個語音編譯碼器幀到另一幀會有相當(dāng)大的變化。因而只重復(fù)最后接收到的未損壞語音編譯碼器幀的譜參數(shù)會導(dǎo)致譯碼聲音信號的頻譜有突然的變化，這當(dāng)然就意味著體驗到的聲音質(zhì)量會較低。
特定地，按照CELP編碼范例操作的寬帶語音編譯碼器已證明會遇到上述問題，因為在這些編譯碼器中合成濾波器激勵的譜形狀從一個語音編譯碼器幀到另一幀可能會變化得甚至更加劇烈。
發(fā)明概要因此本發(fā)明的目的是提供一種語音編碼解決方案，該方案能緩解上述問題。
按照本發(fā)明的一個方面，達(dá)到該目的是通過接收編碼信息形式的數(shù)據(jù)并將該數(shù)據(jù)譯碼為最初描述的聲音信號的一種方法，其特征在于，在接收到損壞數(shù)據(jù)的情況下，基于一次重建信號產(chǎn)生二次重建信號。二次重建信號具有的頻譜是一次重建信號的頻譜的頻譜調(diào)整版本，其中就頻譜形狀而言，它與在先重建信號的頻譜之間的偏差比一次重建信號的頻譜與在先重建信號的頻譜之間的對應(yīng)偏差要小。
按照本發(fā)明的另一方面，達(dá)到該目的是通過可直接載入計算機的內(nèi)部存儲器的一種計算機程序，該程序包含用于當(dāng)該程序在計算機上運行時執(zhí)行上一段落描述的方法的軟件。
按照本發(fā)明的一個其他方面，達(dá)到該目的是通過計算機可讀媒質(zhì)，該媒質(zhì)上記錄有一個程序，其中該程序使計算機執(zhí)行上面倒數(shù)第二段落中描述的方法。
按照本發(fā)明的又一個其他方面，達(dá)到該目的是通過最初描述的一種差錯消除單元，其特征在于，在接收到損壞數(shù)據(jù)的情況下，一個頻譜糾正單元基于一次重建信號產(chǎn)生二次重建頻譜，以致于就頻譜形狀而言，二次重建頻譜的頻譜形狀與在先重建信號的頻譜之間的偏差比基于一次重建信號的頻譜要小。
按照本發(fā)明的再一個其他方面，達(dá)到該目的是通過用于從接收到的編碼信息形式的數(shù)據(jù)生成聲音信號的一種譯碼器。該譯碼器包括主差錯消除單元以產(chǎn)生至少一個參數(shù)。它還包括語音譯碼器以從該主差錯消除接收語音編譯碼器幀、該至少一個參數(shù)并且提供聲音信號作為響應(yīng)。此外，該譯碼器還包括所提出的差錯消除單元，其中一次重建信號構(gòu)成語音譯碼器產(chǎn)生的譯碼語音信號而二次重建信號構(gòu)成增強的聲音信號。
按照本發(fā)明的再一個其他方面，達(dá)到該目的是通過用于從接收到的編碼信息形式的數(shù)據(jù)生成聲音信號的一種譯碼器。該譯碼器包括主差錯消除單元以產(chǎn)生至少一個參數(shù)。它還包括激勵生成器以接收語音編譯碼器參數(shù)和該至少一個參數(shù)并且產(chǎn)生激勵信號以響應(yīng)來自主差錯消除單元的該至少一個參數(shù)。最后，該譯碼器包括所提出的差錯消除單元，其中一次重建信號構(gòu)成激勵生成器產(chǎn)生的激勵信號而二次重建信號構(gòu)成增強的激勵信號。
作為丟失或接收到的損壞數(shù)據(jù)的結(jié)果，所提出的重建頻譜的顯式生成保證了頻譜在接收到未損壞數(shù)據(jù)的時段與接收到損壞數(shù)據(jù)的時段之間的平滑過渡。結(jié)果，這就提供了譯碼信號的增強的感知聲音質(zhì)量，特別是對于比如涉及ACELP編碼方案的高級的寬帶編譯碼器而言。
附圖簡述現(xiàn)在通過優(yōu)選實施方案并參考附圖更詳細(xì)地解釋本發(fā)明，這些優(yōu)選

圖1是示意按照本發(fā)明的差錯消除單元的一般框圖，圖2示意了包含表示聲音信號的編碼信息的連續(xù)信號幀，圖3示意了基于圖2中的信號幀中的編碼信息的譯碼聲音信號，圖4示意了對應(yīng)于圖2信號幀的圖3中譯碼聲音信號片斷的一組頻譜，圖5給出包括按照本發(fā)明的基于在先未損壞數(shù)據(jù)生成的頻譜、損壞數(shù)據(jù)的一次重建頻譜以及損壞數(shù)據(jù)的二次重建頻譜，圖6是示意按照本發(fā)明的差錯消除單元的第一實施方案的框圖，
圖7是示意按照本發(fā)明的差錯消除單元的第二實施方案的框圖，以及圖8是示意按照本發(fā)明的一般方法的流程圖。
發(fā)明的優(yōu)選實施方案的描述圖1是示意按照本發(fā)明的差錯消除單元100的框圖。差錯消除單元100的目的是在接收數(shù)據(jù)損壞或丟失的情況下產(chǎn)生從接收數(shù)據(jù)譯碼的增強信號znE。該增強的譯碼信號znE表示語音信號的參數(shù)如激勵參數(shù)，或者該增強的譯碼信號znE本身就是一個聲音信號。單元100包含第一變換器101，它接收從該接收的數(shù)據(jù)得到的一次重建信號yn。一次重建信號yn被視為時域的信號并且第一轉(zhuǎn)換器101定期產(chǎn)生一次重建信號yn的最近接收到的時間片斷的、第一頻譜形式的一次重建頻率變換Yn。典型地，每個片斷對應(yīng)于該接收的信號的一個信號幀。
第一頻譜Yn被發(fā)送到頻譜糾正單元102，該單元基于第一頻譜Yn產(chǎn)生二次重建頻譜ZnE。產(chǎn)生二次重建頻譜ZnE以致于就頻譜形狀而言它與在先重建信號的頻譜之間的偏差比基于一次重建信號yn的頻譜要小。
為了示意這一點，參考圖2，圖中示意了包含表示一個聲音信號的編碼信息的連續(xù)信號幀F(xiàn)(1)-F(5)。發(fā)送機分別以規(guī)則的時間間隔t1、t2、t3、t4、t5產(chǎn)生信號幀F(xiàn)(1)-F(5)。盡管如此，信號幀F(xiàn)(1)-F(5)不必以相同的規(guī)律或者甚至不必以相同的順序到達(dá)接收機，只要它們在足夠小的時延內(nèi)到達(dá)以便接收機在譯碼前能以正確的順序重新安排該信號幀F(xiàn)(1)-F(5)就可以了。然而，為了簡單起見，此例中假定信號幀F(xiàn)(1)-F(5)都適時地到達(dá)并且以發(fā)送機生成它們的相同順序到達(dá)。初始的三個信號幀F(xiàn)(1)-F(3)無損壞地到達(dá)，即包含的信息中沒有任何差錯。然而，第四個信號幀F(xiàn)(4)在到達(dá)譯碼單元前就已經(jīng)損壞或者可能完全丟失了。隨后的信號幀F(xiàn)(5)又是無損壞地到達(dá)。
圖3示意了基于圖2中的信號幀F(xiàn)(1)-F(5)的譯碼聲音信號z(t)。基于第一信號幀F(xiàn)(1)中包含的信息而生成時域t中第一時刻t1與第二時刻t2之間的聲音信號z(t)。對應(yīng)地，基于第二F(2)和第三F(3)信號幀中的信息而生成直到第四時刻t4的聲音信號z(t)。在實際情況下，由于編碼時延、傳輸時間和譯碼時延，發(fā)送機一側(cè)的時刻t1-t5與接收機一側(cè)的對應(yīng)時刻t1-t5之間也有偏移。這里又是為了簡單起見，而忽略這一事實。
但是，在第四時刻t4，不存在(或者可能只有不可靠的)接收信息能作為聲音信號z(t)的基礎(chǔ)。因此，聲音信號z’(t4)-z’(t5)是基于在第四時刻t4與第五時刻t5之間主差錯消除單元產(chǎn)生的重建信號幀F(xiàn)rec(4)。如圖3所示，源自重建信號幀F(xiàn)rec(4)的聲音信號z(t)呈現(xiàn)的波形特征與源自相鄰信號幀F(xiàn)(3)和F(5)的聲音信號z(t)的那部分不同。
圖4示意了一組頻譜Z1、Z2、Z3、Z4和Z5，分別對應(yīng)于圖3中譯碼聲音信號z(t)的片斷z(t1)-z(t2)、z(t2)-z(t3)、z(t3)-z(t4)和z’(t4)-z’(t5)。譯碼的聲音信號z(t)在時域t中第三時刻t3與第四時刻t4之間相對平坦并且因此具有相對較強的低頻內(nèi)容，這用大部分能量處于低頻區(qū)域的對應(yīng)頻譜Z3來表示。與此相反，基于重建信號幀F(xiàn)rec(4)的聲音信號z’(t4)-z’(t5)的頻譜在高頻頻帶包含相對較多的能量并且時域t中的信號z’(t4)-z’(t5)表現(xiàn)出相對較快的振幅變化?；谧詈蠼邮盏奈磽p壞信號幀F(xiàn)(3)的譯碼聲音信號的頻譜Z3與基于重建信號幀F(xiàn)rec(4)的譯碼聲音信號的頻譜Z’4的對比頻譜形狀導(dǎo)致聲音信號中不希望的人工產(chǎn)物并且收聽者感覺到聲音質(zhì)量較低。
圖5示意了基于最后接收的未損壞信號幀F(xiàn)(3)的譯碼聲音信號的頻譜Z3與基于重建信號幀F(xiàn)rec(4)的譯碼聲音信號的頻譜Z’4的放大版本，它們用相應(yīng)的實線來表示。圖中用虛線示意了頻譜糾正單元102生成的二次重建頻譜ZnE。后一頻譜ZnE的頻譜形狀與基于最后接收的未損壞信號幀F(xiàn)(3)的譯碼聲音信號的頻譜Z3之間的偏差比基于重建信號幀F(xiàn)rec(4)的譯碼聲音信號的頻譜Z’4要小。比如，頻譜ZnE向低頻區(qū)域的偏移更大。
返回圖1，第二變換器103接收到二次重建頻譜ZnE、執(zhí)行逆頻率變換并提供構(gòu)成該增強譯碼信號的、時域中相應(yīng)的二次重建信號znE。圖3用虛線示意了這個信號zE(t4)-zE(t5)，就波形特征而言，它比基于重建信號幀F(xiàn)rec(4)的聲音信號z’(t4)-z’(t5)更像從最后接收到的未損壞信號幀F(xiàn)(3)譯碼的聲音信號z(t3)-z(t4)。
通過用糾正頻譜Cn乘以重建信號幀F(xiàn)rec(4)的第一頻譜Yn的相位，即Yn/|Yn|(其中Yn表示第一頻譜而|Yn|表示第一頻譜的幅度)來產(chǎn)生二次重建頻譜ZnE。實際上，可以按照表達(dá)式ZnE＝Cn·Yn/|Yn|來執(zhí)行這一步。
按照本發(fā)明的優(yōu)選實施方案，按照下面所述，糾正頻譜Cn的生成是通過在先接收到的未損壞數(shù)據(jù)F(n-1)。頻譜糾正單元102首先生成從在先接收到的未損壞數(shù)據(jù)F(n-1)產(chǎn)生的信號的在先頻譜Yn-1，它分別對應(yīng)于圖4和5中的Z3和圖3中的F(3)。然后，頻譜糾正單元102產(chǎn)生在先頻譜Yn-1的幅度譜|Yn-1|。
按照本發(fā)明的另一優(yōu)選實施方案，糾正頻譜Cn是通過產(chǎn)生從在先接收到的未損壞數(shù)據(jù)F(n-1)產(chǎn)生的信號的在先頻譜Yn-1而生成的。然后將所得頻譜濾波為濾波的在先頻譜H(Yn-1)。最后，產(chǎn)生該濾波的在先頻譜H(Yn-1)的幅度譜|H(Yn-1)|。
濾波會涉及到對在先頻譜Yn-1的很多可選修改。然而，濾波的總目的總是創(chuàng)建有相應(yīng)頻譜的信號，該頻譜是從在先未損壞信號幀譯碼的信號頻譜的平滑重復(fù)。因此低通濾波構(gòu)成一個合理的可選方案。另一個可選方案是在逆譜域(cepstral domain)中平滑。這涉及到將在先(可能是對數(shù)的)幅度譜|Yn-1|變換到逆譜域，丟棄特定階(如5-7)和以上的逆譜系數(shù)，并反變換到頻域中。另一個非線性濾波可選方案是將在先頻譜Yn-1劃分為至少兩個頻率子帶f1-fM并計算各個頻率子帶f1-fM中原始頻譜系數(shù)的平均系數(shù)值。最后，該原始頻譜系數(shù)被對應(yīng)的平均系數(shù)值所取代。其結(jié)果是，總的頻帶被平滑。頻率子帶f1-fM或者可以是等距的，即將在先頻譜Yn-1劃分為等大小的片斷，或者是非等距的(如按照Bark或Mel尺度頻帶劃分)。優(yōu)選的是頻譜Yn-1的非等距對數(shù)劃分，因為就頻率分辨率和響度感知來說，人耳的聽力大體上也是對數(shù)律的。
此外，頻率子帶可相互部分重疊。這種情況下要取得重疊區(qū)域中的系數(shù)值，可通過，第一，用一個窗函數(shù)乘以每個頻率子帶，以及第二，在每個重疊區(qū)域中使相鄰加窗頻率子帶的系數(shù)值相加來進(jìn)行。該窗函數(shù)在非重疊頻率區(qū)域中有恒定的幅度，而在相鄰頻率子帶重疊處的上過渡和下過渡區(qū)域中幅度逐步下降。
按照本發(fā)明的另一優(yōu)選實施方案，通過減少糾正頻譜Cn相對于所謂的目標(biāo)噪聲抑制頻譜|Y0|的動態(tài)范圍來產(chǎn)生二次重建信號的頻譜ZnE。比如，目標(biāo)噪聲抑制頻譜|Y0|可代表聲源信號的長期平均值。
動態(tài)減少糾正頻譜Cn相對于該目標(biāo)噪聲抑制頻譜|Y0|的范圍可按照下面的關(guān)系式來執(zhí)行Cn=(|Y0|k+comp(|Yn-1|k-|Y0|k))1/k]]>其中Yn-1表示在先重建信號幀的頻譜(注意，此幀并非必須是未損壞的信號幀，而可以是前面重建的損壞或丟失的信號幀)，|Y0|表示目標(biāo)噪聲抑制頻譜，k表示指數(shù)，如2，而comp(x)表示壓縮函數(shù)。壓縮函數(shù)的特征為具有比輸入變量的絕對值要小的絕對值，即|comp(x)|＜|x|。因而，衰減因子η＜1構(gòu)成壓縮函數(shù)comp(x)＝η·x的一個簡單實例。
優(yōu)選地，衰減因子η由狀態(tài)機給出，比如在GSM AMR標(biāo)準(zhǔn)中狀態(tài)機有七個不同狀態(tài)。因而衰減因子η可描述為狀態(tài)變量s的函數(shù)η(s)，取值如下
接收到未損壞的數(shù)據(jù)片，狀態(tài)變量就置為0。在接收到第一片損壞數(shù)據(jù)的情況下，它被置為1。如果在接收到第一片損壞數(shù)據(jù)后接收到隨后的損壞數(shù)據(jù)片，則狀態(tài)變量s對于每一片接收到的損壞數(shù)據(jù)都遞增一個狀態(tài)直到狀態(tài)6。在狀態(tài)6中和接收到另一片損壞數(shù)據(jù)時，狀態(tài)變量保持在狀態(tài)6。如果狀態(tài)6中接收到一片未損壞數(shù)據(jù)，則該狀態(tài)變量置為狀態(tài)5，并且如果在此狀態(tài)5中，接收到隨后的一片未損壞數(shù)據(jù)，則狀態(tài)變量復(fù)位到0。
按照本發(fā)明的另一優(yōu)選實施方案，改為通過減少糾正頻譜Cn相對于歸一化的目標(biāo)噪聲抑制頻譜的動態(tài)范圍來產(chǎn)生二次重建信號的頻譜ZnE。這是通過計算下式來實現(xiàn)的Cn＝‖Yn-1‖·Csn/‖Csn‖其中||Yn-1||表示在先重建信號幀的頻譜的Lk范數(shù)。矢量Yn-1＝{y1，y2，...，ym}的Lk范數(shù)||Yn-1||由下式給出||Yn-1||=(1mΣi=1m|yi|k)1/k]]>其中k是指數(shù)，而yi是Yn-1的第i個譜系數(shù)。此外，按照下面的關(guān)系式得出CsnCsn=(|Y0|k/||Y0||k+comp(|Yn-1|k/||Yn-1||k-|Y0|k/||Y0||k))1/k]]>其中|Y0|表示目標(biāo)噪聲抑制頻譜，||Y0||k表示按照使用的Lk范數(shù)的目標(biāo)噪聲抑制頻譜功率，k是指數(shù)，如2，而comp(x)表示壓縮函數(shù)。
按照本發(fā)明優(yōu)選實施方案，通過關(guān)于按照線性范數(shù)Lk的目標(biāo)功率||Y0||k壓縮在先重建信號幀的頻譜幅度來產(chǎn)生糾正頻譜Cn，其中指數(shù)k比如等于2。
一般情況當(dāng)中，通過計算下式來實現(xiàn)該壓縮Cn=|Yn-1|/||Yn-1||·(||Y0||k+comp(||Yn-1||k-||Y0||k))1/k]]>其中|Yn-1|表示在先重建信號幀的頻譜的幅度，||Y0||k表示按照Lk范數(shù)的目標(biāo)噪聲抑制功率，其中k是指數(shù)，如2，而comp(x)表示壓縮函數(shù)。
按照本發(fā)明的優(yōu)選實施方案，糾正頻譜Cn用下式描述Cn＝η·|Yn-1|其中η表示＜1的衰減因子，而|Yn-1|表示在先重建信號幀的頻譜的幅度。
在這種情況下，優(yōu)選地，衰減因子η也由具有七個不同狀態(tài)0-6的狀態(tài)機給出。此外，可應(yīng)用與所述相同的η(s)值和狀態(tài)機規(guī)則。
按照本發(fā)明的優(yōu)選實施方案，通過首先產(chǎn)生在先重建信號幀的頻譜Yn-1來生成糾正頻譜Cn。然后，產(chǎn)生對應(yīng)的幅度譜|Yn-1|，而最后用自適應(yīng)噪聲抑制因子γm乘以幅度頻譜|Yn-1|的部分m(即第m個子帶)。一個簡單的實例是只使用包含全部頻譜的一個頻帶(即m＝1)。
按照下式，可由在先重建的信號幀和接收到的損壞數(shù)據(jù)F(n)反過來得出自適應(yīng)噪聲抑制因子γmγm=Σk=low(m)high(m)|Yn(k)|2Σk=low(m)high(m)|Yn-1(k)|2]]>其中“l(fā)ow(m)”表示對應(yīng)于已從重建數(shù)據(jù)譯碼的信號頻譜的子帶fm的頻帶下邊界的頻率系數(shù)下標(biāo)，而“high(m)”表示對應(yīng)于已從重建數(shù)據(jù)譯碼的信號頻譜的子帶fm的頻帶上邊界的頻率系數(shù)下標(biāo)，|Yn(k)|表示代表第一頻譜中第k個頻率分量的系數(shù)的幅度，|Yn-1(k)|表示代表在先頻譜中第k個頻率分量的系數(shù)的幅度。
此外，并非必需再分該頻譜。因而，該頻譜可只包含一個子帶fm，它具有對應(yīng)于從重建數(shù)據(jù)譯碼信號的整個頻帶的邊界的系數(shù)下標(biāo)。然而，如果要進(jìn)行子帶劃分，則優(yōu)選地按照Bark尺度頻帶劃分或者M(jìn)el尺度頻帶劃分進(jìn)行。
按照本發(fā)明的優(yōu)選實施方案，糾正頻譜Cn只影響高于門限頻率的頻率分量。出于實現(xiàn)的原因，選擇該門限頻率使之對應(yīng)于特定的門限系數(shù)。糾正頻譜Cn因此可用下列表達(dá)式來描述Cn(k)＝|Yn(k)| 對于k≤門限系數(shù)Cn(k)＝γ·|Yn-1(k)|對于k＞門限系數(shù)其中Cn(k)表示代表糾正頻譜Cn中的第k個頻率分量的系數(shù)k的幅度，|Yn(k)|表示代表第一頻譜中的第k個頻率分量的系數(shù)k的幅度，|Yn-1(k)|表示代表在先頻譜中的第k個頻率分量的系數(shù)的幅度，而γ表示＜1的自適應(yīng)噪聲抑制因子。
比如可以選擇自適應(yīng)噪聲抑制因子γ為第一頻譜Yn的功率| Yn|2與在先頻譜Yn-1的功率|Yn-1|2之比的平方根，即γ=|Yn|2|Yn-1|2]]>對于特定的頻帶，自適應(yīng)噪聲抑制因子γ也可按照下式得出γ=Σk=lowhigh|Yn(k)|2Σk=lowhigh|Yn-1(k)|2]]>其中“l(fā)ow”表示對應(yīng)于已從重建數(shù)據(jù)譯碼的信號頻譜的頻帶下邊界的頻率系數(shù)下標(biāo)，而“high”表示對應(yīng)于已從重建數(shù)據(jù)譯碼的信號頻譜的頻帶上邊界的頻率系數(shù)下標(biāo)，|Yn(k)|表示代表第一頻譜中第k個頻率分量的系數(shù)的幅度，而|Yn-1(k)|表示代表在先頻譜中第k個頻率分量的系數(shù)的幅度。典型地，頻帶下邊界可以是0kHz而頻帶上邊界是2kHz。上面描述糾正頻譜Cn(k)的表達(dá)式中的門限頻率可以與頻帶的上邊界重合，但并非必須如此。按照本發(fā)明的優(yōu)選實施方案，門限頻率改為3kHz。
因為主差錯消除單元一般在頻帶的較低部分最有效，所以所提出的噪聲抑制動作也在此頻帶中最有效。因而，通過在第一頻譜Yn中迫使高頻帶功率與低頻帶功率之比與前面信號幀的相應(yīng)比值相同，也可使來自主差錯消除單元的噪聲抑制擴(kuò)展到頻帶的較高部分。
現(xiàn)有技術(shù)水平的差錯消除方法中的一個共同特點在于將丟失或損壞幀后的第一幀的功率電平限制為差錯/丟失發(fā)生前最后接收到的未損壞信號幀的功率電平。按照本發(fā)明，應(yīng)用類似原理也是很有利的，并且因而將糾正頻譜Cn的子帶的功率限制為在先接收到的未損壞數(shù)據(jù)F(n-1)的對應(yīng)子帶的功率。子帶比如可定義為表示高于(門限系數(shù)k表示的)門限頻率的頻率分量的系數(shù)。這種幅度限制就是要確保在去除一幀后的第一幀中的高頻帶與低頻帶的能量比不會被歪曲。幅度限制可用下式來描述Cn(k)=min(1,σh,prevgoodσh,n)·|Yn(k)|]]>對于k＞門限系數(shù)其中σh，provgood表示從最后接收到的未損壞信號幀F(xiàn)(N-1)得到的信號幀的功率的根，σh，n表示從當(dāng)前信號幀得到的信號幀的功率的根，而|Yn(k)|表示代表從當(dāng)前信號幀得到的頻譜中第k個頻率分量的系數(shù)k的幅度。
因為本發(fā)明主要是想用于語音信號的編碼，所以一次重建信號優(yōu)選地就是聲音信號。此外，編碼的語音數(shù)據(jù)被分段為信號幀，或者更準(zhǔn)確地稱為語音編譯碼器幀。語音編譯碼器幀還可進(jìn)一步劃分為語音編譯碼器子幀，這同樣構(gòu)成按照本發(fā)明的差錯消除單元的操作的基礎(chǔ)。然后基于特定語音編譯碼器或者語音編譯碼器子幀是丟失還是帶有至少一個錯誤接收到來確定損壞的數(shù)據(jù)。
圖6示意了包含差錯消除單元100的CELP譯碼器的框圖，其中聲音信號a作為一次重建信號y輸入該單元。
該譯碼器包含主差錯消除單元603，在接收到損壞的語音幀F(xiàn)的情況下或者如果語音幀F(xiàn)丟失，它就產(chǎn)生至少一個參數(shù)p1。數(shù)據(jù)質(zhì)量確定單元601檢查所有進(jìn)入的語音幀F(xiàn)，比如通過執(zhí)行循環(huán)冗余校驗(CRC)，從而斷定特定語音幀F(xiàn)是正確地還是有錯地接收。未損壞的語音幀F(xiàn)經(jīng)過數(shù)據(jù)質(zhì)量確定單元601傳遞到語音譯碼器602，該譯碼器在其輸出端生成語音信號a并經(jīng)過閉合的開關(guān)605。
如果數(shù)據(jù)質(zhì)量確定單元601檢測到損壞或丟失的語音幀F(xiàn)，則單元601激活該主差錯消除單元603，該單元603產(chǎn)生表示用于該損壞的語音幀F(xiàn)第一重建的基礎(chǔ)的至少一個參數(shù)p1。然后語音譯碼器602生成第一重建語音信號a以響應(yīng)該重建的語音幀。數(shù)據(jù)質(zhì)量確定單元601還激活該差錯消除單元100并打開開關(guān)605。因而，第一重建語音信號a作為信號y傳遞到差錯消除單元100以按照所提出的上述方法進(jìn)一步增強聲音信號a。結(jié)果得到的增強聲音信號a在輸出端作為信號zE傳遞，該信號被進(jìn)行頻譜調(diào)整以致于就頻譜形狀而言其頻譜與在先接收到的未損壞語音幀F(xiàn)產(chǎn)生的聲音信號a之間的偏差比該第一重建語音信號的頻譜要小。
圖7示意了按照本發(fā)明的差錯消除單元的另一應(yīng)用的框圖。這里，數(shù)據(jù)質(zhì)量確定單元701接收表示聲音源信號的重要特征的進(jìn)入?yún)?shù)S。在參數(shù)S未損壞(比如通過CRC確定)的情況下，將它們傳遞到激勵生成器702。激勵生成器702將激勵信號e經(jīng)由開關(guān)705傳遞到合成濾波器704，該濾波器生成聲音信號a。
然而，如果數(shù)據(jù)質(zhì)量確定單元701發(fā)現(xiàn)參數(shù)S損壞或者丟失了，則它激活主差錯消除單元703，該單元703產(chǎn)生至少一個參數(shù)p2。激勵生成器702接收該至少一個參數(shù)p2并提供第一重建激勵信號e來對其響應(yīng)。數(shù)據(jù)質(zhì)量確定單元701還打開開關(guān)705并激活該差錯消除單元100。其結(jié)果是，差錯消除單元100將激勵信號e接收為一次重建信號y。差錯消除單元100產(chǎn)生二次重建信號zE作為響應(yīng)，該信號被進(jìn)行了頻譜調(diào)整以致于就頻譜形狀而言其頻譜與在先接收到的未損壞語音幀F(xiàn)產(chǎn)生的激勵信號e之間的偏差比第一重建激勵信號的頻譜要小。
按照本發(fā)明的優(yōu)選實施方案，主差錯消除單元703還將至少一個參數(shù)c1傳遞給差錯消除單元100。這一傳送由數(shù)據(jù)質(zhì)量確定單元701控制。
為了進(jìn)行總結(jié)，現(xiàn)在參數(shù)圖8中的流程圖描述本發(fā)明的一般方法。第一步驟801中接收數(shù)據(jù)。隨后的步驟802檢查接收的數(shù)據(jù)是否損壞，并且如果數(shù)據(jù)未損壞，則規(guī)程繼續(xù)進(jìn)行到步驟803。該步驟存儲數(shù)據(jù)用于以后可能的使用。然后，在下一步驟804中，將數(shù)據(jù)譯碼成為源信號本身、參數(shù)或者源信號相關(guān)的信號如激勵信號的估計。此后，該規(guī)程返回步驟801，以便接收新數(shù)據(jù)。
如果步驟802檢測到接收的數(shù)據(jù)損壞，則規(guī)程繼續(xù)前進(jìn)到步驟805，其中檢索步驟803中在先存儲的數(shù)據(jù)。因為事實上很多連續(xù)的數(shù)據(jù)片可能都損壞或者丟失了，所以檢索的數(shù)據(jù)不必是剛好在當(dāng)前丟失或損壞的數(shù)據(jù)之前的數(shù)據(jù)。然而所檢索的數(shù)據(jù)仍然是最后接收到的未損壞數(shù)據(jù)。然后此數(shù)據(jù)在隨后步驟806中得到利用，該步驟產(chǎn)生一次重建信號。該一次重建信號是基于當(dāng)前接收到的數(shù)據(jù)(如果有的話)和存儲的在先數(shù)據(jù)的至少一個參數(shù)。最后，步驟807基于一次重建信號而產(chǎn)生二次重建信號以致于頻譜形狀與在先接收到的未損壞數(shù)據(jù)的頻譜之間的偏差比一次重建信號的頻譜要小。此后該規(guī)程返回步驟801，以便接收新數(shù)據(jù)。
另一種可能是包含步驟808，該步驟產(chǎn)生并存儲基于目前重建幀的數(shù)據(jù)。在剛好后隨的另一幀去除的情況下，在步驟805中可檢索此數(shù)據(jù)。
通過可直接下載到計算機的內(nèi)部存儲器的計算機程序可執(zhí)行本發(fā)明的上述方法，以及其他任何已描述的實施方案。這樣一個程序包含軟件用于在計算機上運行該程序時執(zhí)行所提出的步驟。該計算機自然也可存儲于任何類型的可讀媒介上。
此外，可以想象，將按照本發(fā)明的差錯消除單元100與進(jìn)行頻域濾波的用于語音編譯碼器的所謂增強單元放在一起是很有利的。這些單元都在頻域以類似方式操作并且都涉及反頻率變換到時域。
盡管已提出使用通過執(zhí)行頻域濾波操作得到的糾正幅度頻譜Cn來產(chǎn)生上述的二次重建信號，但當(dāng)然也可通過改而使用相應(yīng)的時域濾波器而在時域中進(jìn)行等同的濾波。然后可應(yīng)用任何的已知設(shè)計方法來導(dǎo)出具有近似該糾正幅度頻譜Cn的頻率響應(yīng)的濾波器。
本說明書中使用的詞“包含”是用來指明存在所述特點、數(shù)字、步驟或者分量。然而，該詞并不排除存在或者增加一個或多個其他特點、數(shù)字、步驟或分量或者其組合。
本發(fā)明并不局限于附圖所述的實施方案，而可以在權(quán)利要求的范圍內(nèi)自由地變動。
權(quán)利要求
1.一種從傳輸媒質(zhì)接收編碼信息(F(1)-F(5))形式的數(shù)據(jù)并將該數(shù)據(jù)譯碼為聲音信號(z(t))的方法，在丟失或者接收到損壞的數(shù)據(jù)(F(4))的情況下該方法包含基于在先重建信號(F(3))的至少一個參數(shù)(p1；p2)產(chǎn)生重建數(shù)據(jù)(Frec(4))，從該重建數(shù)據(jù)(Frec(4))產(chǎn)生一次重建信號(z’(t4)-z’(t5))，該一次重建信號(z’(t4)-z’(t5))具有第一頻譜(Z’4)，其特征在于，基于該一次重建信號(z’(t4)-z’(t5))產(chǎn)生二次重建信號(zE(t4)-zE(t5))，這是通過對第一頻譜(Z’4)進(jìn)行頻譜調(diào)整以致于就頻譜形狀而言該二次重建信號(zE(t4)-zE(t5))的頻譜(Z4E)與在先重建信號(z(t3)-z(t4))的頻譜(Z3)之間的偏差比第一頻譜(Z’4)要小。
2.按照權(quán)利要求1的方法，其特征在于該在先重建信號(z(t3)-z(t4))的頻譜(Z3)是從在先接收的未損壞數(shù)據(jù)(F(3))產(chǎn)生的。
3.按照權(quán)利要求1或2的任何一條的方法，其特征在于頻譜調(diào)整涉及使從該重建數(shù)據(jù)生成的第一頻譜的相位譜乘以糾正頻譜(Cn)。
4.按照權(quán)利要求3或4的任何一條的方法，其特征在于二次重建信號的頻譜(ZnE)可按照表達(dá)式Cn·Yn/|Yn|得出，其中Cn表示糾正頻譜，Yn表示第一頻譜，|Yn|表示第一頻譜的幅度。
5.按照權(quán)利要求3或4的任何一條的方法，其特征在于產(chǎn)生糾正頻譜(Cn)是通過產(chǎn)生在先重建信號的在先頻譜，以及產(chǎn)生在先頻譜的幅度頻譜。
6.按照權(quán)利要求5的方法，其特征在于該在先重建信號(z(t3)-z(t4))的頻譜(Z3)是從在先接收的未損壞數(shù)據(jù)(F(3))產(chǎn)生。
7.按照權(quán)利要求3或4的任何一條的方法，其特征在于產(chǎn)生糾正頻譜(Cn)是通過產(chǎn)生從在先接收的未損壞數(shù)據(jù)產(chǎn)生的信號的在先頻譜，通過對該在先頻譜濾波來產(chǎn)生濾波的在先頻譜，以及產(chǎn)生該濾波的在先頻譜的幅度頻譜。
8.按照權(quán)利要求7的方法，其特征在于該濾波涉及低通濾波。
9.按照權(quán)利要求7的方法，其特征在于該濾波涉及逆譜域中的平滑。
10.按照權(quán)利要求7的方法，其特征在于該濾波涉及將在先頻譜劃分為至少兩個頻率子帶，對每個頻率子帶，計算相應(yīng)頻率子帶內(nèi)原始頻譜系數(shù)的平均系數(shù)值，以及對每個頻率子帶，用相應(yīng)的平均系數(shù)值替代每個原始頻譜系數(shù)。
11.按照權(quán)利要求10的方法，其特征在于頻率子帶都是等距的。
12.按照權(quán)利要求10或11的方法，其特征在于頻率子帶至少部分重疊。
13.按照權(quán)利要求12的方法，其特征在于頻率子帶的重疊區(qū)域中的所得系數(shù)值的取得可通過用一個窗函數(shù)乘以每個頻率子帶來產(chǎn)生相應(yīng)的加窗頻率子帶，以及在每個重疊區(qū)域中使相鄰加窗頻率子帶的系數(shù)值相加。
14.按照權(quán)利要求13的方法，其特征在于該窗函數(shù)在非重疊頻率區(qū)域中幅度不變，而在相鄰頻率子帶重疊的上過渡和下過渡區(qū)域中幅度逐步下降。
15.按照權(quán)利要求3或4的任何一條的方法，其特征在于通過減少糾正頻譜(Cn)相對于目標(biāo)噪聲抑制頻譜的動態(tài)范圍來產(chǎn)生該二次重建信號的頻譜(ZnE)。
16.按照權(quán)利要求15的方法，其特征在于可按照下面關(guān)系式產(chǎn)生糾正頻譜(Cn)(|Y0|k+comp(|Yn-1|k-|Y0|k))1/k]]>其中Yn-1表示在先重建信號幀的頻譜，|Y0|表示目標(biāo)噪聲抑制頻譜，k表示指數(shù)，以及comp(x)表示壓縮函數(shù)，使得|comp(x)|＜|x|。
17.按照權(quán)利要求16的方法，其特征在于該壓縮函數(shù)是用表達(dá)式η·x描述的衰減函數(shù)，其中η表示＜1的衰減因子，以及x表示要壓縮的數(shù)值。
18.按照權(quán)利要求3或4的任何一條的方法，其特征在于通過減少糾正頻譜(Cn)相對于歸一化的目標(biāo)噪聲抑制頻譜的動態(tài)范圍來產(chǎn)生該二次重建信號的頻譜(ZnE)。
19.按照權(quán)利要求18的方法，其特征在于按照下面關(guān)系式產(chǎn)生糾正頻譜(Cn)‖Yn-1‖·Csn/‖Csn‖其中||Yn-1||表示在先重建信號幀的頻譜的Lk范數(shù)，Csn=(|Y0|k/||Y0||k+comp(|Yn-1|k/||Yn-1||k-|Y0|k/||Y0||k))1/k]]>其中|Y0|表示目標(biāo)噪聲抑制頻譜，||Y0||k表示按照Lk范數(shù)的目標(biāo)噪聲抑制頻譜的功率，k表示指數(shù)，以及comp(x)表示壓縮函數(shù)，使得|comp(x)|＜|x|。
20.按照權(quán)利要求3或4的任何一條的方法，其特征在于通過關(guān)于目標(biāo)噪聲抑制頻譜的功率而壓縮在先重建信號的在先頻譜的幅度來產(chǎn)生糾正頻譜(Cn)。
21.按照權(quán)利要求20的方法，其特征在于按照下面關(guān)系式產(chǎn)生糾正頻譜(Cn)|Yn-1|/||Yn-1||·(||Y0||k+comp(||Yn-1||k-||Y0||k))1/k]]>其中|Yn-1|表示在先重建信號幀的頻譜的幅度，||Y0||k表示目標(biāo)噪聲抑制頻譜的Lk范數(shù)，k表示指數(shù)，以及comp(x)表示壓縮函數(shù)，使得|comp(x)|＜|x|。
22.按照權(quán)利要求21的方法，其特征在于按照下面關(guān)系式產(chǎn)生糾正頻譜(Cn)η·|Yn-1|其中η表示＜1的衰減因子，以及|Yn-1|表示在先重建信號幀的頻譜的幅度。
23.按照權(quán)利要求17或22的任何一條的方法，其特征在于衰減因子η由具有七個狀態(tài)的狀態(tài)機給出，并用下式描述η(s)；其中η(s)取決于狀態(tài)變量，如下η(s)＝1，對于s＝0η(s)＝0.98，對于s∈[1，5]η(s)＝0.7，對于s＝6，并且接收到未損壞的數(shù)據(jù)，狀態(tài)變量就置為0，接收到一片損壞數(shù)據(jù)，狀態(tài)變量就置為1，在接收到第一片損壞數(shù)據(jù)后，對于隨后接收到的每片損壞數(shù)據(jù)，狀態(tài)變量都遞增一狀態(tài)，以及在狀態(tài)6中，接收到損壞數(shù)據(jù)，該狀態(tài)變量保持等于6，并且接收到未損壞數(shù)據(jù)，該狀態(tài)變量置為狀態(tài)5。
24.按照權(quán)利要求3或4的任何一條的方法，其特征在于產(chǎn)生糾正頻譜(Cn)是通過產(chǎn)生在先重建信號幀的頻譜，產(chǎn)生在先重建信號幀的頻譜的幅度，用至少一個自適應(yīng)噪聲抑制因子乘以該幅度頻譜的至少一個頻帶，該至少一個自適應(yīng)噪聲抑制因子是從該在先重建的信號幀得到的，并且是對于該在先重建信號幀的頻譜的至少一個頻率子帶而產(chǎn)生的。
25.按照權(quán)利要求24的方法，其特征在于該至少一個自適應(yīng)噪聲抑制因子之一可按照下式得出Σk=low(m)high(m)|Yn(k)|2Σk=low(m)high|Yn-1(k)|2]]>其中“l(fā)ow(m)”表示對應(yīng)于已從重建數(shù)據(jù)譯碼的信號頻譜子帶fm的頻帶下邊界的頻率系數(shù)下標(biāo)，“high(m)”表示對應(yīng)于已從重建數(shù)據(jù)譯碼的信號頻譜子帶fm的頻帶上邊界的頻率系數(shù)下標(biāo)，|Yn(k)|表示代表第一頻譜中第k個頻率分量的系數(shù)的幅度，以及|Yn-1(k)|表示代表該在先頻譜中第k個頻率分量的系數(shù)的幅度。
26.按照權(quán)利要求10、24或25的任何一條的方法，其特征在于按照Bark尺度頻帶劃分將該在先頻譜和第一頻譜分別劃分為至少兩個頻率子帶。
27.按照權(quán)利要求10、24或25的任何一條的方法，其特征在于按照Mel尺度頻帶劃分將該在先頻譜和第一頻譜分別劃分為至少兩個頻率子帶。
28.按照權(quán)利要求3或4的任何一條的方法，其特征在于糾正頻譜(Cn)只影響高于門限頻率的頻率分量，該門限頻率對應(yīng)于特定的門限系數(shù)。
29.按照權(quán)利要求28的方法，其特征在于糾正頻譜(Cn)可用下式描述Cn(k)＝|Yn(k)| 對于k≤門限系數(shù)Cn(k)＝γ·|Yn-1(k)|對于k＞門限系數(shù)其中Cn(k)表示代表該糾正頻譜(Cn)中的第k個頻率分量的系數(shù)的幅度，|Yn(k)|表示代表該第一頻譜中的第k個頻率分量的系數(shù)的幅度，|Yn-1(k)|表示代表該在先頻譜中的第k個頻率分量的系數(shù)的幅度，以及γ表示＜1的自適應(yīng)噪聲抑制因子。
30.按照權(quán)利要求29的方法，其特征在于自適應(yīng)噪聲抑制因子可按照下式得出Σk=lowhigh|Yn(k)|2Σk=lowhigh|Yn-1(k)|2]]>其中“l(fā)ow”表示對應(yīng)于已從重建數(shù)據(jù)譯碼的信號頻譜的頻帶下邊界的頻率系數(shù)下標(biāo)，“high”表示對應(yīng)于已從重建數(shù)據(jù)譯碼的信號頻譜的頻帶上邊界的頻率系數(shù)下標(biāo)，|Yn(k)|表示代表該第一頻譜中第k個頻率分量的系數(shù)的幅度，以及|Yn-1(k)|表示代表該在先頻譜中第k個頻率分量的系數(shù)的幅度。
31.按照權(quán)利要求28-30的任何一條的方法，其特征在于，對于代表高于門限頻率的頻率分量的系數(shù)，將糾正頻譜(Cn)的至少一個子帶的功率限制為在先接收到的未損壞數(shù)據(jù)的至少一個子帶的功率。
32.按照前述權(quán)利要求的任何一條的方法，其特征在于一次重建信號(z’(t4)-z’(t5))和二次重建信號(zE(t4)-zE(t5))是聲音信號(a)。
33.按照權(quán)利要求1-31的任何一條的方法，其特征在于一次重建信號(z’(t4)-z’(t5))和二次重建信號(zE(t4)-zE(t5))是激勵信號(e)。
34.按照權(quán)利要求1-33的任何一條的方法，其特征在于數(shù)據(jù)被分段為信號幀(F(1)-F(5))，并且基于特定信號幀是丟失還是帶有至少一個錯誤被接收到而確定損壞的數(shù)據(jù)。
35.按照權(quán)利要求34的方法，其特征在于信號幀構(gòu)成語音編譯碼器幀。
36.按照權(quán)利要求34的方法，其特征在于信號幀構(gòu)成語音編譯碼器子幀。
37.一種可直接裝載到計算機的內(nèi)部存儲器的計算機程序，該程序包含軟件，用于在該計算機上運行該程序時執(zhí)行權(quán)利要求1-36的任何一條的步驟。
38.一種計算機可讀媒質(zhì)，其上記錄有一個程序，其中該程序使計算機執(zhí)行權(quán)利要求1-36的任何一條的步驟。
39.一種差錯消除單元，用于在丟失數(shù)據(jù)或接收到損壞數(shù)據(jù)的情況下對編碼信息形式的已接收數(shù)據(jù)譯碼的信號進(jìn)行增強，該單元包含，第一變換器(101)，它具有輸入端以接收從該接收數(shù)據(jù)(F(n))譯碼的一次重建信號(yn)，和輸出端以提供一次重建頻率變換(Yn)，頻譜糾正單元(102)，它具有輸入端以接收該一次重建頻率變換(Yn)，和輸出端以提供二次重建頻譜(ZnE)，以及第二變換器(103)，它具有輸入端以接收該二次重建頻譜(ZnE)，和輸出端以提供一個二次重建信號(ZnE)，其特征在于頻譜糾正單元(102)基于一次重建信號(yn)產(chǎn)生該二次重建頻譜信號(ZnE)以致于就頻譜形狀而言該二次重建頻譜信號(ZnE)與在先重建信號(yn-1)的頻譜(Z3)之間的偏差比基于該一次重建信號(yn)的頻譜(Z’4)要小。
40.按照權(quán)利要求39的差錯消除單元，其特征在于從在先接收到的未損壞數(shù)據(jù)(F(3))產(chǎn)生在先重建信號(z(t3)-z(t4))的頻譜(Z3)。
41.一種用于從編碼信息形式的已接收數(shù)據(jù)生成聲音信號的譯碼器，該譯碼器包含主差錯消除單元(603)，經(jīng)由輸出端產(chǎn)生至少一個參數(shù)(p1)，語音譯碼器(602)，具有第一輸出端以接收語音編譯碼器幀(F)、第二輸入端以接收該至少一個參數(shù)(p1)和輸出端以提供聲音信號(a)來響應(yīng)該至少一個參數(shù)(p1)，其特征在于該譯碼器包含按照權(quán)利要求37的差錯消除單元，其中該一次重建信號(yn)構(gòu)成該語音譯碼器(602)產(chǎn)生的譯碼語音信號并且該二次重建信號(znE)構(gòu)成增強的聲音信號。
42.一種用于從編碼信息形式的接收數(shù)據(jù)生成聲音信號的譯碼器，該譯碼器包含主差錯消除單元(703)，經(jīng)由輸出端產(chǎn)生至少一個參數(shù)(p2)，激勵生成器(702)，具有第一輸入端以接收語音編譯碼器參數(shù)(S)、第二輸入端以接收該至少一個參數(shù)(p2)，和輸出端以提供激勵信號(e)來響應(yīng)該至少一個參數(shù)(p2)，其特征在于該譯碼器包含按照權(quán)利要求37的差錯消除單元，其中該一次重建信號(yn)構(gòu)成激勵生成器(702)產(chǎn)生的激勵信號并且該二次重建信號(znE)構(gòu)成增強的激勵信號。
全文摘要
本發(fā)明涉及在譯碼的聲音信號中的差錯消除，該差錯是由表示聲音信號的編碼數(shù)據(jù)在傳輸媒質(zhì)中的傳輸期間被部分丟失或損壞而引起的。在丟失數(shù)據(jù)或者接收到損壞數(shù)據(jù)的情況下，基于一次重建信號產(chǎn)生二次重建信號。這個信號具有頻譜調(diào)整的頻譜(Z
文檔編號G10L19/005GK1470049SQ01817589
公開日2004年1月21日申請日期2001年9月7日優(yōu)先權(quán)日2000年10月20日
發(fā)明者S·布魯恩, S 布魯恩申請人:艾利森電話股份有限公司

完整全部詳細(xì)技術(shù)資料下載