專利名稱:有音調(diào)周期的校正的數(shù)字音頻信號丟失塊的合成的制作方法
有音調(diào)周期的校正的數(shù)字音頻信號丟失塊的合成
本發(fā)明涉及一種數(shù)字音頻信號的處理方法(特別是語音信號)。 本發(fā)明涉及適用于傳輸/接收這樣信號的 一 種編碼/解碼系統(tǒng)。尤
其是,本發(fā)明涉及在接收端的處理方法,當塊丟失時該方法能改善解
碼信號的質(zhì)量。
不同的現(xiàn)存技術(shù),以進行數(shù)字轉(zhuǎn)換和合成數(shù)字音頻信號,最通常
的技術(shù)是
-波形編碼方法,如脈沖編碼調(diào)制(PCM)和自適應(yīng)音頻脈沖 編碼(ADPCM),
-綜合分析編碼方法,如碼激勵線性預(yù)測(CELP)編碼,以
及
-感知子帶編碼(sub-band perceptual coding )方法或變換編碼。 這些技術(shù)連續(xù)處理輸入信號,通過抽樣(PCM或ADPCM)或 者通過被稱之為"幀"(CELP和變換1編碼)的采樣塊來進行采樣。 簡單地說,值得注意的是,運用通過短窗框圖(short windows ) (在這個實例中為10至20ms)評估參數(shù),能從它最近的過去中(如 在8KHz的8至12個采樣)預(yù)測一個語音信號。這些用聲道轉(zhuǎn)換公 式(如對發(fā)輔音的)表示的短期(short-term)預(yù)測參數(shù)可以通過線性 預(yù)測編碼(LPC)方法得到。還有與由于聲帶震動的準周期語音(如 發(fā)如元音字母的發(fā)音)相聯(lián)系的長期(longer-term)相關(guān)系數(shù)。
這包括至少決定聲音信號的基本頻率,該頻率根據(jù)說話者的不 同,從^Hz(低聲)至600Hz(高聲)不等。于是, 一長期預(yù)測(LTP) 分析被用于確定長期預(yù)測器的LTP參數(shù),特別是經(jīng)常被稱之為"音調(diào) 周期"的基本頻率的倒數(shù)(inverse)。那么,在音調(diào)周期中的采樣數(shù) 量通過Fe/F。(或者其整數(shù)部分)的關(guān)系被確定,其中 -Fe為采樣率,以及-Fo為基本頻率。
因此,值得注意的是包括音調(diào)周期的長期預(yù)測的LTP參數(shù)表示語 音信號(濁音(voiced)時)的基本震動,同時短期預(yù)測LPC參數(shù)表 示該信號的頻譜包絡(luò)。
因此,在確定的編碼器中,從語音編碼中得到的這些LPC和LTP 參數(shù)集可以用塊通過一個或多個電信網(wǎng)絡(luò),被發(fā)送到 一 同源解碼器 (homologous decoder),因此4吏最初的語音信號可以:故重建。
然而,可以參考(通過例子的方式)ITU-T為語音信號(其以16KHz 被采樣)寬帶傳輸而標準化的48、56和64kbit/sG.722編碼系統(tǒng)。G.722 編碼器在通過鏡象濾波器組(QMF)獲得兩個子頻帶中具有一個 ADPCM編碼方案。為了詳細的信息,可以有用地參考G.722建議的 文本。
現(xiàn)有技術(shù)的
圖1示出根據(jù)G.722建議的編碼與解碼的結(jié)構(gòu)。模塊 101至103表示應(yīng)用于輸入信號Si的傳輸QMF濾波器組(頻譜被分 為高頻102和低頻100和子采樣101和103)。隨后的模塊104和105 分別與低頻帶和高頻帶的ADPCM編碼器通訊。ADPCM編碼器的低 頻帶的輸出被指定為分別代表6、 5或4-比特(bit)輸出每采樣的0、 l或2的模式值,同時ADPCM的高頻帶輸出是固定的(2bits每采 樣)。在解碼器中有相對應(yīng)的ADPCM解碼器模塊(模塊106和107), 它們的輸出在QMF接收濾波器組被疊力口(進行過采樣(over-sampling) 108和110,反濾波109和111,以及對高、低頻帶進行合并112),以 獲得到合成信號So。
這里祐:;險測到的一個普遍問題涉及對在解碼中的塊丟失(the loss ofblock)的校正(correcting)。實際上,從編碼輸出的比特流被格式 化(format)成二元塊(binary block),以通過多種網(wǎng)類型進行傳輸。 這些,例如,通過互聯(lián)網(wǎng)被傳輸?shù)膲K被稱為"互聯(lián)網(wǎng)協(xié)議(IP)數(shù)據(jù) 包",或通過異步傳輸模式(ATM)網(wǎng)絡(luò)傳輸?shù)膲K被稱為"幀",或 者是其它。在編碼后被傳輸?shù)膲K可以因為不同的原因被丟失
-如網(wǎng)絡(luò)路由器被超載(overload)以及轉(zhuǎn)儲存(dump)它的隊列,(continuous-flow decoding)中,^口果 塊被接收時具有延時(因此沒被考慮進去),
國如被接收的塊被損壞(corrupted)(例如,其CRC奇偶檢 驗碼未被驗證)。
當一個或多個塊的丟失發(fā)生時,解碼器必須在沒有丟失塊或者錯 誤塊的信息的情況下,重建信號。這依賴于從接收到的有效塊中先前 解碼得到的信息。這個被稱之為"遺失塊的校正"(或者,以下為"被 去除幀的校正,,)的問題,實際上,比簡單的遺失信息預(yù)測更加普遍, 因為幀的遺失經(jīng)常引起在編碼器和解碼器之間的同步的丟失,尤其 是,當后者是預(yù)測型時,以及在丟失后在被預(yù)測的信息和被解碼信息 之間的連續(xù)性問題。因此,被除去(erased)的幀的校正還包括狀態(tài) 信息的修復(fù),以及再集中技術(shù)(re-convergence)和其它。
ITU-T G.711建議的附件1描述了 一個適用于PCM編碼的被除去 的信息的校正。因為PCM編碼不是預(yù)測型的,因此遺失幀的校正在 一丟失后,簡單的計算丟失信息的預(yù)測,以及確保一個被重建幀和正 確被接收到的幀之間的連續(xù)性。通過在與基本頻率同步方法中重復(fù)先 前的信號進行該預(yù)測。通過進行平滑(smoothing)或在被接收到的采 樣和被預(yù)測的采樣之間的交叉衰減(cross-fading),以確保該連續(xù)性。 在文獻〃」戸cA:W /ow cowcea/mewf附e^ot/ / z7c/ 麗ve/brw
/w^wa/加& ow We decoded s/ eecA /or //ze
swZ -6aw"ZXPCM wzWe6awd 5T eec/z codec", M. Serizawa and Y. Nozawa, IEEE Speech Coding Workshop, pages 68-70 (2002)("—種運用音調(diào)波 形的重復(fù)和內(nèi)部狀態(tài)的數(shù)據(jù)包的丟失的隱藏的方法,以為子頻帶 ADPCM寬帶語音編碼器更新被解碼的語音",M.Serizawa和 Y.Nozawa, IEEE Speech Coding Working, 60-70頁(2002 ))中,通過 運用音調(diào)周期重復(fù)算法(重復(fù)可以和在G.711建議的附錄1中描述的 相似)預(yù)測丟失幀,為G.722標準化編碼/解碼器提供一被除去幀的校 正。為了更新G.722編碼器狀態(tài)(濾波器存儲器和音調(diào)適應(yīng) (adaptation)存儲器),被預(yù)測的幀因此被分成兩個子頻率帶,該兩
7個子頻率帶可通過應(yīng)用ADPCM編碼而^皮再編碼(re-encoded)。
然而,只有在先前信號是平穩(wěn)的(stationary),或者至少是周期 性平穩(wěn)(cyclostationary)時,這樣通過重復(fù)音調(diào)周期對丟失幀進行校 正的技術(shù)才可以正確應(yīng)用。因此,它們是基于丟失幀(它是必須被預(yù) 測)相關(guān)的信號與為該丟失幀解碼的信號"相似"的固有假設(shè)。當是 語音信號時,這個固有假設(shè)只有對聲音嚴格有效,例如一部分被重復(fù) 的元音。例如,元音"a"可以被多次重復(fù)(例如"aaaa,等,,,沒有造 成聽覺不適)。語音信號包括被稱為"短暫性"(transitories)的聲音(非 固定聲音一般包括以元音的開始(attacks) (beginnings)以及對應(yīng)短輔 音(例如"p", "b", "d", "t", "k")的被稱之為"爆破音,,的發(fā)音)。因 此,例如,如果幀在緊接著一個"t"發(fā)音之后被丟失,當這里有幾個 連續(xù)幀的丟失(比如5個連續(xù)丟失),通過簡單的重復(fù)的一丟失幀 的校正,將會產(chǎn)生令耳朵非常不舒服的一陣"t"的序列("t-t-t-t-t")。
圖2a和圖2b示出,當用根據(jù)G.722建議的編碼器對寬帶信號進 行編碼時的這樣的聲學(xué)效應(yīng)。尤其是,圖2a示出經(jīng)一理想信道(沒 有幀丟失)解碼的語音信號。在實施例中顯示出,這個信號對應(yīng)于法 語單詞"temps",被分為兩個法語音素(phonemes):先是/t/,然后是 /an/。縱向的虛線表示幀之間的邊界。在此考慮的幀的長度大約為 10ms。當丟失幀緊接著音素/t/之后時,圖2b示出了根據(jù)一種與上述 引用的Serizawa等人的技術(shù)相似的技術(shù),進行解碼得到的信號。圖 2b清晰地示出了過去信號(past signal)重復(fù)的問題。它示出了音素/t/ 在預(yù)測幀中被重復(fù)。當在丟失之后其預(yù)測被輕微地延長時,它還在后 續(xù)幀中出現(xiàn),在如圖所示的例子中,以便與正常情況下的解碼執(zhí)行一 交叉衰減(即,在被接收到的信號中出現(xiàn)有用的數(shù)據(jù))。
在現(xiàn)有技術(shù)中,爆破音的重復(fù)問題顯然從未被提及。
在這種狀況下,本發(fā)明提供了一種改進。
為此目的,本發(fā)明提供了一種用于合成由連續(xù)的采樣塊表示的數(shù) 字音頻信號的方法,其中,當接收到這樣一個信號時,用于替換至少 一個無效塊,根據(jù)在所述無效塊之前的至少一個有效塊的采樣,產(chǎn)生一替換塊。
所述方法通常包括以下步驟
a) 確定步驟,在至少一個有效塊中確定信號的重復(fù)周期,以及
b) 復(fù)制步驟,復(fù)制所述重復(fù)周期的采樣到至少 一個替換塊中。 在根據(jù)本發(fā)明的方法中
-在步驟a)中,在緊接著一無效塊后的至少一個有效塊中,確定 一個最后的重復(fù)周期,以及
-在步驟b)中,根據(jù)一個先前重復(fù)周期的采樣,對所述最后重復(fù) 周期的采樣進行校正,以限制可能存在于最后的重復(fù)周期中的任何瞬 時信號的振幅。
然后,上述被校正的所述采樣被復(fù)制至所述替換塊中。
根據(jù)本發(fā)明的方法可以有利地被用于語音信號的處理,在濁音信 號的情況下和非濁音信號的情況下相同得好。因此,如果信號是濁音 的,重復(fù)周期簡單地包括音調(diào)周期,以及本方法的步驟a)特別地涉及 在接著丟失的至少一個有效塊中確定信號的語調(diào)(tone)(例如,在 語音信號中的一個聲音(voice)的語調(diào))的音調(diào)周期(典型地,是通 過基本頻率的倒數(shù)獲得)。
如果被接收的有效的信號是非濁聲的,事實上,沒有可探測到的 音調(diào)周期。在這種情況下,它可能被提供設(shè)置一個任意給定的采樣的 數(shù)量,該數(shù)量被認為是音調(diào)周期的長度(然后, 一般可以被參考為"音 調(diào)周期"),并且根據(jù)這個重復(fù)周期來執(zhí)行根據(jù)本發(fā)明的方法。例如, 音調(diào)周期可以選擇盡可能的長,通常為20ms(對應(yīng)于很低聲音的50Hz) 即在8KHz采樣頻率的160個采樣。也可能對應(yīng)于一個相關(guān)函數(shù)的最 大值的值,該相關(guān)函數(shù)的最大值通過限制在 一 個值區(qū)間內(nèi)的搜索獲得 (例如在MAX_PITCH/2和MAX—PITCH之間,其中MAX—PITCH 是音調(diào)周期搜索中的最大值)。
優(yōu)選地,如果多個無效塊必須在接收中被替換,并且這些塊延續(xù) 至少 一 個重復(fù)周期,則對所述最后重復(fù)周期的所有采樣應(yīng)用所述采樣
9校正步驟b),如同當前采樣, 一個接著一個地進行。
此外,如果這些無效塊甚至延續(xù)至幾個重復(fù)周期,則對在步驟b) 中被校正的重復(fù)周期進行多次復(fù)制,以形成所述替換塊。
在一個特殊實施例中,對于在步驟b)中執(zhí)行的前文所述的采樣校
正,可以采用下述過程。對于最終重復(fù)周期中的當前采樣,通過進行
比較
-所述當前采樣的振幅,以絕對值的形式,
-以及短暫地大致位于在所述當前采樣之前的 一重復(fù)周期中的 至少一個采樣的振幅,以絕對值的形式,
以及從上述這兩個振幅中,為所述當前采樣分配其中的最小的振 幅,以絕對值的形式,當然,同時也要把它原有的振幅符號分配給它。
術(shù)語"大致位于"表示了這樣一個事實,即在與當前采樣相關(guān)聯(lián) 的先前重復(fù)周期中搜索一個鄰近區(qū)域(neighborhood)。因此,優(yōu)選 地,對于最后重復(fù)周期的一個當前采樣
-以在短暫位于所述當前采樣前的一個重復(fù)周期中的一個采樣 為中心的一鄰近區(qū)域中,構(gòu)建一個采樣的集合,
-從所述鄰近區(qū)域的采樣的振幅中,確定一4皮選定的振幅,以絕 對值的形式,以及
-比較所述被選定的振幅與所述當前采樣的振幅,以絕對值的形 式,以從所述被選定的振幅與所述當前采樣的振幅中,為所述當前采 樣分配其最小振幅,以絕對值的形式。
優(yōu)選地,從所述鄰近區(qū)域的采樣的振幅中被選定的振幅是其最大 振幅,以絕對值的形式。
進一步地, 一個衰減(逐步衰減)通常被應(yīng)用于在替換塊中的采 樣的幅度。這樣,有利地,信號的短暫性特征信號在塊丟失之前被檢 測,并且,如果可^f于, 一個更快的衰減;陂應(yīng)用,該衰減比應(yīng)用在平穩(wěn) (非短暫性)信號上的衰減更快。
另外,或者作為一個變化實施例,在合成處理期間,對下一濾波 器的存儲器的更新(置零,zero reset)也可以被執(zhí)行,尤其是適用于短暫性的聲音,以避免在隨后的有效塊的處理中經(jīng)歷這樣的短暫性的 聲音的影響。
優(yōu)選地,在塊丟失之前的短暫性信號的檢測按如下步驟執(zhí)行
-對所述最后重復(fù)周期的多個當前采樣,測量當前采樣的振幅相 對于上述提及的凈皮選定振幅(如前文所述,在鄰近區(qū)域中^皮確定)之 間的相關(guān)關(guān)系,以絕對值的形式,以及
-然后,對于當前采樣,計算發(fā)生所述相關(guān)關(guān)系大于一第一預(yù)先 確定的門限值(例如一大約為4的值,如在下文^是及)的次數(shù),以及
-如果所述出現(xiàn)的次數(shù)大于一第二預(yù)先確定的門限值(例如,如 果多于一次,如在下文提及的),則檢測到存在短暫性信號。
根據(jù)本發(fā)明,當在緊按著丟失塊之前的重復(fù)周期中檢測到短暫性 聲音時,上述步驟也可以被用來觸發(fā)校正步驟b)。
然而,為了確定是否運用根據(jù)本發(fā)明的校正步驟b),優(yōu)選地,執(zhí) 行下述過程。如果數(shù)字音頻信號是語音信號,則有利地,檢測在該語 音信號中的濁音度,以及,如果該語音信號是高濁音的(在對于音調(diào) 周期的搜索中,它可以通過一相關(guān)系數(shù)接近于"1"而被顯示出來), 則步驟b)中的校正不被執(zhí)行。換而言之,只有當該信號是非濁音或當 它是弱濁音時,該校正才被執(zhí)行。
這樣,當接收到的有效信號是高濁音的(因此是平穩(wěn)的),步驟 b)的校正的應(yīng)用以及在替換塊中的信號的不必要的衰減則被避免,該 信號實際上和穩(wěn)定的元音(例如"aaaa")的發(fā)音相對應(yīng)。
因此,簡而言之,本發(fā)明涉及針對在數(shù)字音頻信號解碼中的丟失 的塊的合成,在重復(fù)周期(或?qū)嵋舻恼Z音信號的"音調(diào)周期,,)的 重復(fù)之前的信號修正。通過比較一個音調(diào)周期的采樣和先前音調(diào)周期 中的采樣,避免短暫性的重復(fù)的影響。優(yōu)選地,通過從當前采樣和先 前音調(diào)周期中大約相同位置上的至少一個采樣中選擇最小值,修正該 信號。
本發(fā)明提供了多個優(yōu)點,特別是在解碼的情況下出現(xiàn)塊丟失時。 尤其是,它還使得避免因為短暫性(當使用一個簡單的音調(diào)重復(fù)周期)的錯誤重復(fù)而產(chǎn)生的偽跡變成為可能。此外,它還執(zhí)行短暫性的檢測, 該檢測可以被用于適應(yīng)被預(yù)測信號(通過可變衰減)的能量控制。
除了前文已提及的圖1、 2a和2b以外,通過參閱以下實施例以 及附圖的詳細描述,本發(fā)明的其它有點和特性將變得更清晰
-圖2c通過比較的方法示出了在如圖2a和2b所示的相同的 信號上應(yīng)用根據(jù)本發(fā)明的方法的效果,其中,該信號的一個幀TP 已經(jīng)被丟失;
-圖3示出了根據(jù)G.722建議的解碼器,但該解碼器通過集成 一個根據(jù)本發(fā)明的用于對被除去的幀進行校正的裝置而被修改; -圖4示出了低頻帶的預(yù)測的基本原理; -圖5示出了音調(diào)重復(fù)(在激勵域中)的基本原理; -圖6示出了根據(jù)本發(fā)明的激勵信號的修正,所述信號被音調(diào) 重復(fù)所跟隨;
-圖7示出了根據(jù)本發(fā)明的一個特殊實施例的方法的步驟; -圖8用圖示的方法示出了用于執(zhí)行根據(jù)本發(fā)明的方法的 一 個 合成裝置;
-圖8a示出了雙通道正交鏡象濾波器組(QMF)的通常結(jié)構(gòu); -圖8b示出了當L(z)和H(z)是理想濾波器(即,/,e=2/e)時, 圖8a中的信號頻譜x(n), xl(n), xh(n)。
下文將描述一個本發(fā)明的實施例,該實施例依賴于根據(jù)G.722建 議的編碼系統(tǒng)。G.722編碼器(通過參閱圖l在上文中被描述)的描 述在此不再重復(fù)。在此的描述將局限于被修改的G.722的解碼器,該 解碼器集成了音調(diào)周期的校正器,當有幀丟失時,所述音調(diào)周期被重 新生成。
參考圖3,根據(jù)本發(fā)明的所述解碼器(這里根據(jù)G.722建議)再 次示出了具有QMF接收濾波器組(模塊310至314)的雙子頻帶中 的一個結(jié)構(gòu)。對應(yīng)于圖1中的解碼器,圖3中的解碼器還集成了裝置 320,該裝置用于被除去幀的校正。
12G.722解碼器產(chǎn)生以16kHz采樣的輸出信號So,并且被分成10 或20或40ms的短暫幀(或采樣塊)。根據(jù)出現(xiàn)或不出現(xiàn)幀的丟失, 它的操作不同。
在完全不出現(xiàn)幀的丟失的情況下(也即所有的幀都被接收并且都 有效),低頻頻帶LF的比特流(bitstream)通過根據(jù)本發(fā)明的裝置 320中的模塊300進行解碼,不執(zhí)行交叉衰減(模塊303 ),并且被 重建信號可以簡單地通過zl=xl得到。相似地,通過模塊304,對高 頻頻帶HF的比特流進行解碼。交換模塊307選擇信道uh=xh,以及 交換模塊309選擇信道zh=uh=xh。
另一方面,在一個或多個幀丟失的情況下,在低頻帶LF中,通 過先前信號xl (特別地,音調(diào)的復(fù)制)在模塊301中對被除去的幀進 行預(yù)測,并且在模塊302中ADPCM解碼器的狀態(tài)被更新。所述被除 去的幀如zl=yl被重建。每當一個丟失幀被檢測到,重復(fù)上述過程。 值得注意的是,預(yù)測模塊301沒有被非常嚴格限定只用于針對該當前 (丟失)幀產(chǎn)生一個預(yù)測信號它還產(chǎn)生為下一幀產(chǎn)生10ms的信號, 以在模塊303中執(zhí)行交叉衰減。
這樣,當一有效幀被接收,后者通過模塊300被解碼,并且在第 一個10毫秒期間,在有效幀xl和先前預(yù)測幀yl之間執(zhí)行一交叉衰減 303。
在高頻頻段HF中,被除去的幀通過先前信號xh在模塊305中進 行預(yù)測,并且ADPCM解碼器的狀態(tài)在模塊306中被更新。在一個優(yōu) 選的實施例中,預(yù)測yh是先前信號xh的最后周期的簡單重復(fù)。交換 模塊307選擇通道uh=yh。
有利地,該信號uh纟皮濾波,以產(chǎn)生信號vh。實際上,G.722編 碼器是一個向后預(yù)測(backward predictive )的編碼系統(tǒng)。在每個子頻 帶中,它使用一個自回歸滑動平均(ARMA, auto-regressive moving average)類型的預(yù)測:燥作,以及一個ARMA濾波器的音調(diào)量化 (quantization)和適配(adaptation)過程,與在編碼器和解碼器處的 相同。音調(diào)的預(yù)測和適配依賴于被解碼數(shù)據(jù)(預(yù)測錯誤,重建信號)。傳輸錯誤,特別是幀丟失,導(dǎo)致在解碼器和編碼器的變量之間的 不同步。因此,該音調(diào)的適配和預(yù)測過程是不正確的,并且有一個顯
著的時間段(達到300 ~ 500ms )的偏置(bias)。在高頻帶中,在其 它偽像(artefacts)中,這個偏置可以導(dǎo)致出現(xiàn)振幅的一個非常弱的 直流分量(對于大約+/-10數(shù)量級的信號,最大動態(tài)范圍+/-32767 )。
然而,在通過QMF合成濾波器組后,這個直流分量以8KHz的 正弦波的形式呈現(xiàn),該波可以被耳朵聽見,并且非常不舒服。
下文對直流分量(或者"DC分量")變化成8kHz的正弦進行了 解釋。圖8a示出一雙通道的正交鏡像濾波器組(QMF)。信號x(n) 通過分析器組被分解至兩個子頻帶。這樣, 一低頻帶xl(n)和一高頻帶 xh(n)被獲得。這些信號通過它們的z變化被定義<formula>formula see original document page 14</formula>
因為在正交中的低通L(z)和高通H(z),則H(z)-L(-z)。
如果L(z)證實完整的重制的限制,則在合成濾波器組后得到的信 號與信號x(n)相同,并在最接近的時間延遲。
這樣,如果信號x(n)的采樣頻率是/e,,則信號xl(n)與xh(n)以頻 率/e^/e'/2被采樣。典型地,經(jīng)常為/e'= 16 kHz,即/e = 8 kHz。進 一步指出的是,該濾波器L(z)和H(z)可以是,例如,在ITU-T G.722 建議中指定的24系數(shù)QMF濾波器。
圖8b示出了當濾波器L(z)和H(z)是理想的中間頻帶濾波器時, 信號x(n)、 xl(n)和xh(n)的頻譜。因此當在理想狀態(tài)下,在區(qū)間[-f'e/2, 十fe'/2]的L(z)頻率響應(yīng)通過以下/^式得到<formula>formula see original document page 14</formula>需要注意的是,xh(n)的頻語對應(yīng)于被折疊的高頻帶(folded high band)。該在現(xiàn)有技術(shù)中熟知的"折疊"屬性,可以被形象化地解釋,如同定義XH(z)的上述公式的方式一樣。該高頻帶的折疊通過合成濾 波器組被"翻轉(zhuǎn)"(inverted),并以頻率的自然順序重現(xiàn)高頻帶頻 譜。
然而,在實踐中,L(z)和H(z)濾波器并不是理想的。它們的非理 想特性導(dǎo)致了被合成濾波器組取消(cancel)的頻譜折疊分量的出現(xiàn)。 然而,該高頻帶仍舊被反轉(zhuǎn)。
然后,模塊308執(zhí)行一個高通濾波(HPF),該高通濾波(HPF) 除去了直流分量("除去DC")。這樣的濾波器的使用是非常有利 的,包括根據(jù)本發(fā)明的低頻帶音調(diào)周期校正的范圍的外部。
進一步地,在通常的解碼中幀的丟失的上下文中,使用HPF濾 波器(模塊308 )用于除去高頻帶中的直流分量,可能是一個分開保 護的主題。通常而言,它因此會被理解為,在對被接收到的信號進行 解碼的情形下,所述被接收信號被分解到高頻頻帶和低頻頻帶中,至 少有兩個通道,如在根據(jù)G.722標準的解碼中,當在緊接著替換信號 的合成一信號丟失發(fā)生時,通常地,在解碼器的高頻通路上,這可以 導(dǎo)致在替換信號中的直流分量的出現(xiàn)。在特定時間中,這個直流分量 的作用可以延續(xù)至被解碼信號中,而不論被接收到的編碼信號再次變 成有效,原因在于在編碼器和解碼器之間的失去同步,以及濾波器的 存儲器大小。
有利地,在高頻通道上提供高通濾波器308。例如,有利地,為 G.722解碼器的高頻通道的QMF濾波器組的上行數(shù)據(jù)流提供該高通 濾波器308。這個安排使得在當應(yīng)用QMF濾波器組時,避免在8kHz (從采樣率/e得到數(shù)值)的直流分量的折疊成為可能。更一般地,當 解碼器在高頻通道的處理的一端包含一濾波器組時,優(yōu)選地,為該濾 波器組的上行數(shù)據(jù)提供高通濾波器(308 )。
這樣,再次參閱圖3,只要有幀丟失,交換模塊309就選擇通道 zh=vh。
然后,只要一有效幀被接收,后者通過模塊304進行解碼,并且 交換模塊307選擇通道uh-xh。對于接下來的時間里(例如,4秒之
15后),交換模塊309再次選擇通道zl^vh,但是這幾秒過后,返回到一的"普通"模式,其中交換模塊309再次選擇通道zl^uh,通過旁路模塊308并且因此不應(yīng)用高通濾波器308。
通常而言,因此可以:陂理解為,優(yōu)選地,該高通濾波器308只在塊丟失的期間和之后被短暫地(例如,幾秒鐘)使用,即使如果有效的塊被再次接收到。濾波器308可能永久地被使用。然而,它只有在幀丟失的情況才被激活,因為由于直流分量的擾動只在這種情況下才被產(chǎn)生,所以在不出現(xiàn)幀丟失的情況下,被修改的G.722解碼器(整合了丟失校正機制)的輸出,與ITU-T G.722的解碼器的輸出相同。該濾波器308只在對于幀的丟失的校正,以及對于當丟失發(fā)生的連續(xù)幾秒內(nèi)的校正中才被應(yīng)用。實際上,當有丟失時,G.722解碼器會在該丟失后的IOO至500ms會與編碼器失去同步,并且,在高頻帶上該直流分量通常只存在1至2秒。濾波器308被保持一個稍長的時間,以獲得一個安全的余量(margin )(比如4秒)。
在圖3中示出的解碼器不再被進一步地描述,因為可以理解的是,特別地,本發(fā)明在低頻帶預(yù)測模塊301中被實施。這個模塊301在圖4中進行詳細描述。
參閱圖4,該低頻帶的預(yù)測依賴于對先前信號xl的分析(在圖4中以ANALYS標出的部分),該先前信號xl緊跟著將被傳送的信號yl的合成(在圖4中以SYNTH表示出的部分)。模塊400執(zhí)行一個對先前信號xl的線性預(yù)測分析(LPC)。這個分析,與特別在標準化的G.729編碼器被執(zhí)行的分析相似。它包括對信號的窗操作(windowingthe signal),計算自動校正以及用萊文森-德賓(Levinson-Durbin )算法來獲得線性預(yù)測系數(shù)。優(yōu)選的,只有該信號的最后IO秒被使用,并且LPC階次(order)設(shè)置為8。這樣,得到9個LPC系數(shù)(以下稱為aQ, ai….,ap),形式如下
A(z) = ao + ai z" + ... + ap z—p
其中p = 8以及a0= 1。
在LPC分析后,先前的激勵信號通過模塊401進行計算。該先前的激勵信號被稱為e(n),其中n = -M, ...,l,式中M對應(yīng)于^皮存儲的先前采樣的個數(shù)。
模塊402對基本頻率(fundamental fr叫uency)或者它的倒數(shù)音調(diào)周期,進行了估計。這個估計通過,例如類似于音調(diào)分析(被稱為"開環(huán)(open loop)",特別地,如在標準化的G.729編碼器中)相類似的方法進行。
因此被估計的音調(diào)r。在模塊403中被用來預(yù)測當前幀的激勵。
此外,先前信號xl在才莫塊404中被分類(classified)。在此,它可能嘗試對短暫性的出現(xiàn)進行探測,例如爆破音的出現(xiàn),以便應(yīng)用根據(jù)本發(fā)明的音調(diào)周期校正,但是,在一個優(yōu)選變化實施例中,它被嘗試用來對信號Si是否為高濁音(例如,當對應(yīng)于音調(diào)周期的相關(guān)性非常接近于1時)進行測試。如果該信號是高濁音(它對應(yīng)于一穩(wěn)定元音的發(fā)音,如""aaaa….")的,那么信號Si沒有短暫性,并且可以不執(zhí)行根據(jù)本發(fā)明的音調(diào)周期校正。否則,優(yōu)選地,在其它所有情況中,應(yīng)用根據(jù)本發(fā)明的音調(diào)周期校正。
濁音度的探測的細節(jié)在這里不被提及,因為它們本身被熟知,并且在本發(fā)明的范圍之外。
再次參考圖4 ,合成SYNTH依照現(xiàn)有技術(shù)中熟知的并被稱為"資源-濾波器"("source-filter")的模型。它包括通過LPC濾波器對被預(yù)測的激勵進行濾波。在此,被預(yù)測的激勵e(n)(其中,現(xiàn)在n=0,....,L-1,L為將被預(yù)測的幀的長度)通過反轉(zhuǎn)濾波器(inverse filter) 1/A(z)(模塊405)進行濾波。然后,該被得到的信號,根據(jù)在模塊406中計算得到的一衰減,而被衰減,最終以yl被傳送。
這樣,本發(fā)明通過圖4的模塊403被執(zhí)行,它的作用在下文中進行詳細表述。
為圖示的目的,圖5示出了如同在現(xiàn)有技術(shù)中被執(zhí)行的簡單激勵
重復(fù)的基本原理。該激勵可以簡單地通過重復(fù)最后的音調(diào)周期r。而被預(yù)測,即復(fù)制先前激勵的一連串的最后采樣,在該一連串的采樣的個數(shù)對應(yīng)于在包括在音調(diào)周期r。的采樣的個數(shù)?,F(xiàn)在參閱圖6,在重復(fù)最后的音調(diào)周期r。前,根據(jù)本發(fā)明,后者^皮進^f于如下纟務(wù)正。
對每個采樣11=-^,..,1,根據(jù)根據(jù)如下公式,采樣e(n)被修正為emod(n):
如上所述,優(yōu)選地,如果該信號xl (以及該輸入信號Si)是高濁音的,則這個信號的修正不被執(zhí)行。實際上,在高濁信號的情況下,最后音調(diào)周期的簡單重復(fù),沒有修正,可以產(chǎn)生一個較好的結(jié)果,而最后音調(diào)周期的修正以及它的重復(fù),還可能導(dǎo)致輕微的質(zhì)量下降。
圖7用流程圖的形式,示出了對應(yīng)于這個方程的應(yīng)用的過程,以對根據(jù)本發(fā)明的一個實施例的方法的步驟進行圖示。其中,啟始點是通過模塊401傳送的先前信號e(n)。在步驟70中,從確定濁音度的模塊404中獲得信號是否是高濁音的信息。如果該信號是高濁音(在測試71的輸出處的箭標0),則在圖4的模塊403中,有效塊的最后音調(diào)周期被就完全被復(fù)制,以及,隨后該處理過程直接通過模塊405的反轉(zhuǎn)濾波1/A(z)的應(yīng)用而被繼續(xù)。
在另一方面,如果信號xl不是高濁音的(在測試71的輸出的箭標N),它將嘗試修改對應(yīng)于被接收到的最后有效塊的激勵信號e(n)的最后采樣,這些采樣延續(xù)至整個音調(diào)周期r"步驟73),由圖4中的模塊402給出(在步驟72中)。
在圖7所示的實施例中,它嘗試^修改在整個音調(diào)周期r0中的所有采樣e(n),其中n包括表示"7 -r0 + 1到 中的值,e("》對應(yīng)于被接收到的最后有效采樣(步驟74)。因此,通過這些符號,可以理解,采樣e(n), n介于-rQ+1和";之間,簡單地屬于最后被有效接收到的音調(diào)周期。
在步驟75中,對應(yīng)于最后音調(diào)周期的每個采樣e(n),確定一個先前音調(diào)周期的鄰近區(qū)域NEIGH,這樣在倒數(shù)第二個音調(diào)周期中。這個測量是有利的,但不是必需的。它所提供的優(yōu)點將在下文中描述。在此進行簡單的闡述,在一個被描述的實施例中,這個鄰近區(qū)域包括
18奇數(shù)個的采樣2k+l。當然,在一個變化實施例中,這數(shù)目可以是偶數(shù)。此外,在圖6所示的實施例中,我們?nèi)-l。事實上,再次參閱圖6,可以注意到,被稱為e(3)的最后音調(diào)周期的第三個采樣被選擇(步驟74),并且和它在倒數(shù)第二音調(diào)周期中相對應(yīng)的鄰近區(qū)域NEIGH的采樣用粗體被表示出來,并且為eor。), e(3-ro)和e(4-ro)。這樣,它們是分散在e(3-ro)周圍。
在步驟76中,從鄰近區(qū)域中的采樣確定以絕對值的形式的最大值(即,在圖6所示的例子中的采樣e(2-ro))。這個特性是有利的,但不是必需的。它提供的優(yōu)勢將在下文中進行描述。典型地,在一個變化實施例中,例如,可能通過選擇以確定在鄰近區(qū)域NEIGH上的平均值。
在步驟77中,現(xiàn)有采樣e(n)的值和在步驟76中在鄰近區(qū)域得到的最大值M之間,以絕對值的形式,確定一個的最小值。在圖6所示的實施例中,實際上,介于e(3)和e(2-r())中最小值是倒數(shù)第二的音調(diào)周期e(2-r。)的采樣。仍在步驟77中,當前采樣e(n)的振幅被這個最小值代替。在圖6中,采樣e(3)的振幅變得與采樣e(2-r。)的振幅相等。同樣的方法被應(yīng)用在最后周期的所有采樣上,從e(l)到e(12)。在圖6中,被校正的采樣已經(jīng)被替換,如虛線框所示。根據(jù)本發(fā)明而被校正的被預(yù)測音調(diào)周期7^+1,7>2的采樣,通過閉合箭頭(closed arrow)表示。
這樣,可以理解的是,通過步驟77的有利的執(zhí)行,如果一爆破音確實在最后的音調(diào)周期Tj上出現(xiàn)(如圖6中所示,高信號強度,以絕對值形式),在該爆破音的強度和在前一音調(diào)周期中的大約在相同的短暫位置上的采樣的強度之間,最小值會被確定(這里,術(shù)語"大約"是指"至最近的相鄰區(qū)域的土k",在步驟75中產(chǎn)生該實施例的優(yōu)點),以及如果用一個屬于倒數(shù)第二的音調(diào)周期7^的較低的強度對爆破音的強度進行適當?shù)奶鎿Q。另一方面,如果最后音調(diào)周期7]的采樣的強度比倒數(shù)第二周期的強度低,通過在當前采樣e(3)與倒數(shù)第二周期中的強度值e(2-ro)之間選擇最小值,該最后周期不被修正,這樣就避免了爆破音(有高強度)從倒數(shù)第二音調(diào)周期7^中被復(fù)制的風(fēng)險。
這樣,在步驟76中,可以對鄰近區(qū)i或(例如,并且不是在該鄰近區(qū)域上的另一參數(shù))的采樣,以絕對值的形式,確定最大值M,以彌補為了執(zhí)行值e(n)的替換步驟77中選擇最小值的影響。因此,這一做法使得避免限制替換音調(diào)周期7]+1, 7]+2 (圖6)的振幅成為可能。
更進一步地,確定相鄰區(qū)域的步驟75有利地被執(zhí)行,因為音調(diào)周期不總是有規(guī)則的,并且如果采樣e(n)在音調(diào)周期T。中有最大的強度,對于下一音調(diào)周期中的采樣e(n+r。),這也不是總是這樣的。此外, 一個音調(diào)周期可以延續(xù)至落在在兩個采樣(以被確定的采樣頻率)中的一個短暫位置上。這被稱為"部分音調(diào)(fractional pitch)"。因此,如果有必要將采樣e(n-r。)與在位于下一音調(diào)周期中的采樣e(n)聯(lián)系起來,則通常優(yōu)選地,取一個以采樣e(n-ro)為中心的一個鄰近區(qū)域。
最后,因為步驟75至77的處理過程必須涉及采樣的絕對值,步驟78簡單地包括了將原始采樣e(n)的符號重新分配給被修正的采樣e脂d(n)。
為下一采樣e(n)(在步驟79中n變?yōu)閚+l)重復(fù)步驟75至78,直到音調(diào)周期T。被用盡(exhausted)(因此直到到達最后有效采樣e("/))。
這樣,為了余下的解碼,被修正的信號em。d(n)被傳送至翻轉(zhuǎn)濾波器1/A(z)(參考圖4中的405 )。
然而,需要注意兩個可能的變化實施例??梢砸赃@樣的方法來校正最后音調(diào)周期Tj,將該校正Fj應(yīng)用到該下一個音調(diào)周期,并且為下一音調(diào)周期復(fù)制該校正,即:7]=7]+1=7]+2=7^。
在一個變化實施例中,最后音調(diào)周期7]被原封不動地保留,并且在另 一方面,它的校正r,j被復(fù)制到下一個音調(diào)周期Tj+1和Tj+2中。
圖5與圖6的比較示出了 ,激勵的修正如何被執(zhí)行時有利的。因此,簡要地說,當在最后音調(diào)周期中出現(xiàn)爆破音的情況下,后者將在音調(diào)重復(fù)之前自動地被移除,因為它在倒數(shù)第二音調(diào)周期中沒有等同物。因此,這個操作使得移除包含爆破音重復(fù)的音調(diào)重復(fù)的多個麻煩 的偽跡中的一個成為可能。
此外,有利地,如果一個爆破音在最后音調(diào)周期中被探測到,則 對被重復(fù)和被合成的信號的一個更快衰減被提供。通常而言,短暫性 的檢測的一個實施例,可以包括對出現(xiàn)如下條件(1)的次數(shù)進行計
算
如果這條件被證實出現(xiàn),例如在當前幀中超過一次,那么先前信 號xl包括一短暫性(例如一爆破音),它可以通過406迫使一個更快的 衰減作用在被合成信號yl上(例如, 一個超過10ms的衰減)。
因此,圖2c通過與圖2a和圖2b進行比較的方式,示出了當本 發(fā)明被執(zhí)行時的被解碼信號,其中包含爆破音/t/的幀被丟失。在這樣 的情況下,因為本發(fā)明的執(zhí)行,音素/t/的重復(fù)被避免。隨著幀丟失而 來的差異,不會被聯(lián)系到爆破音的實際探測。實際上,在圖2c中在 幀丟失后的信號衰減,可以通過在這種情況下的事實得到解釋, G.722解碼器被重置(在圖3中的模塊302中完全更新其狀態(tài)),而 在圖2b的情況下,G.722解碼器未被重置。然而,可以理解的是,本 發(fā)明涉及為了對被除去幀的預(yù)則而對爆破音的探測,并不涉及在幀丟 失之后的重新開始問題。
然而,對人的耳朵而言,在圖2c中所示的信號比在圖2b中所示 的信號具有更好的質(zhì)量。
本發(fā)明還涉及一種存儲在數(shù)字音頻信號合成裝置的存儲器中的 計算機程序。當該計算機程序被該合成裝置的處理器執(zhí)行時,該計算 機程序包括用于執(zhí)行根據(jù)本發(fā)明的方法的指令。而且,前先描述的圖 7示出了這樣一個計算機程序的一個流程圖。
此外,本發(fā)明還涉及一種數(shù)字音頻信號合成裝置,所述信號由連 續(xù)塊組成。這個裝置還包括用于存儲上述計算機程序的存儲器,以及 可以包括具有前文所述功能的圖4中的模塊403。參照圖8,這個裝 置SYN包括-輸入裝置I,用于在至少一個當前塊被合成之前,接收信號(e(n)) 的塊,以及
-輸出裝置O,用于傳送被合成的信號(em。d(n)),所述被合成的信 號至少包括所述當前塊。
根據(jù)本發(fā)明的合成裝置SYN,包括如工作儲存器MEM (或用來 存儲前文提及的計算機程序)的裝置,以及與這個存儲器MEM協(xié)作 的處理器PROC,用于執(zhí)行根據(jù)本發(fā)明的方法,以及用于從信號e(n) 至少一個所述先前塊開始合成所述當前塊。
本發(fā)明還涉及一種數(shù)字音頻信號的解碼器,所述信號由連續(xù)塊組 成,并且這個解碼器還包括根據(jù)本發(fā)明的裝置403,用于合成無效塊。
更一般地,本發(fā)明不局限于上述列舉的實施例;它可以延用到其 它的變化實施例。
在變化例中,對音調(diào)周期的校正的和/或?qū)Χ虝盒缘奶綔y的參數(shù)可 以是如下情況。取一個間隔,其包括在倒數(shù)第二音調(diào)周期中三個采樣 的不同個數(shù)。例如,取1^=2,以獲得總共5個被考慮的采樣。相似地, 可以對短暫性測試調(diào)整門限值(在上述條件(1)的例子中為1/4)。 另外,如果探測條件被證實m次,其中m2,則可以聲明該信號為 短暫性。
此外,本發(fā)明還可以同樣被運用在除前文所述的情況之外的其它 情況下。
例如,信號的探測和校正可以在信號域中(而不是激發(fā)域中)被 執(zhí)行。典型的,對于在CELP解碼器(它也會根據(jù)源-過濾器模式執(zhí)行) 中的幀丟失的校正,該激勵通過音調(diào)的重復(fù)被預(yù)測,可選地,再附加 一個隨機貢獻(contribution)而被預(yù)測,并且,這個激勵通過1/A(z) 類型的濾波器被濾波,其中A(z)從被正確接收的最后預(yù)測過濾器獲
3曰付。
它還可以同樣好地被用于根據(jù)G.711標準的編碼器。 當然,另外,如果在倒數(shù)第二個音調(diào)周期中,安排進行爆破音檢 測(例如,用上述條件(1)類型的條件),則簡單復(fù)制倒數(shù)第二音調(diào)周期r^以構(gòu)成新的被合成周期Tj+2已使得克服爆破音重復(fù)的 問題成為可能。該實施例也在本發(fā)明的保護范圍內(nèi)。
此外,為了在上述描述中的清楚起見,步驟b)中的采樣的校正被 描述,緊跟著將已校正的采樣復(fù)制到替換塊中。當然,技術(shù)上嚴格等 同情況下,它還可以先復(fù)制最后重復(fù)周期的采樣,然后在替代塊中對 它們進行校正。因此,采樣校正和復(fù)制可以被交替進行,可以任何順 序執(zhí)行,特別地,可以被翻轉(zhuǎn)。
權(quán)利要求
1.一種用于合成由連續(xù)的采樣塊表示的數(shù)字音頻信號的方法,其中,當接收到這樣一個信號時,用于替換至少一個無效塊,根據(jù)在所述無效塊之前的至少一個有效塊的采樣產(chǎn)生一替換塊,所述方法包括以下步驟a)確定步驟(402),在至少一個有效塊中確定一重復(fù)周期,以及b)復(fù)制步驟(403),復(fù)制所述重復(fù)周期的采樣到至少一個替換塊中,其特征在于-在步驟a)中,在緊接著一無效塊后的至少一個有效塊中,確定一個最后的重復(fù)周期(Tj),-在步驟b)中,根據(jù)所述最后重復(fù)周期之前的一個先前重復(fù)周期(Tj-1)的采樣(e(2-T0),e(3-T0),e(4-T0)),對所述最后重復(fù)周期(Tj)的采樣(e(3))進行校正,以限制在所述最后重復(fù)周期中的任何瞬時信號的振幅,并且因此被校正的所述采樣被復(fù)制至所述替換塊(Tj+1,Tj+2)中。
2. 根據(jù)權(quán)利要求1所述的方法,其中所述信號是一濁音語音信號,其特征在于,所述重復(fù)周期是對應(yīng)所述信號的基本頻率倒數(shù)的音調(diào)周期。
3. 根據(jù)權(quán)利要求1或2所述的方法,其特征在于,在步驟b),通過比較-所述當前采樣的振幅,以絕對值的形式,-與短暫大致位于在所述當前采樣之前的一重復(fù)周期中的至少一 個采樣(e(2-r。))的振幅,以絕對值的形式, 以及通過從所述這兩個振幅中,為所述當前采樣分配其中的最小的振幅, 以絕對值的形式,對所述最后重復(fù)周期的一個當前采樣(e(3))進行校正。
4. 根據(jù)權(quán)利要求3所述的方法,其特征在于,對所述最后重復(fù)周期 的一當前采樣(e(3)):-在短暫位于所述當前采樣前的一重復(fù)周期的一采樣(e(3-r。))周圍中心圍繞的一鄰近區(qū)域中,構(gòu)建一采樣的集合(75),-從所述鄰近區(qū)域的采樣的振幅中,確定一被選定的振幅(76),以絕對值的形式,以及-比較所述被選定的振幅與所述當前采樣的振幅,以絕對值的形式, 以從所述被選定的振幅與所述當前采樣的振幅中,為所述當前采樣 (e(3))分配(77)其最小振幅,以絕對值的形式。
5. 根據(jù)權(quán)利要求所述4的方法,其特征在于,從所述鄰近區(qū)域的采樣 的振幅中被選定的振幅是其最大振幅,以絕對值的形式(M)。
6. 根據(jù)前述權(quán)利要求中任一項所述的方法,其中,所述數(shù)字音頻信號 是一語音信號,其特征在于,在所述語音信號(71)中檢測濁音度, 以及當所述語音信號是非濁音或弱濁音時,執(zhí)行步驟a)至d)。
7. 根據(jù)前述權(quán)利要求中任一項所述的方法,其中,在所述替換塊中的 采樣的振幅的一個衰減被應(yīng)用,其特征在于,對在所述最后重復(fù)周期 中的信號的任何短暫性的特征進行檢測,并且,如果可行, 一比對固 定信號更快的衰減被使用。
8. 根據(jù)權(quán)利要求7所述的方法,結(jié)合權(quán)利要求3或4,其特征在于 -對所述最后重復(fù)周期的多個當前采樣,相對于上述提及的被選定振 幅,測量當前采樣的振幅的一個相關(guān)關(guān)系,以絕對值的形式,以及-對所述相關(guān)關(guān)系大于一第 一預(yù)先確定的門限值的當前采樣出現(xiàn)的 次數(shù)進行計算,以及-如果所述出現(xiàn)的次數(shù)大于一第二預(yù)先確定的門限值時,則一短暫性 特征的存在被測定。
9. 根據(jù)前述權(quán)利要求中任一項所述的方法,其特征在于,如果多個 連續(xù)的無效塊的接收延續(xù)至至少一個重復(fù)周期,則對所述最后重復(fù)周 期的所有采樣應(yīng)用所述采樣校正步驟b),如當前采樣,一個接著一個 地進行。
10. 根據(jù)權(quán)利要求9所述的方法,其特征在于,如果多個連續(xù)的無效 塊的接收延續(xù)至多個重復(fù)周期,為了替換所述多個無效塊,對在步驟 b)中被校正的重復(fù)周期進行多次復(fù)制,以得到所述替換塊。
11. 一種存儲在數(shù)字音頻信號合成裝置的存儲器中的計算機程序,其 特征在于,當該計算機程序被該合成裝置的處理器被執(zhí)行時,該計算機程序包括用于執(zhí)行根據(jù)權(quán)利要求1至10中任一項所述的方法的指令。
12. —種數(shù)字音頻信號合成裝置,所述信號由連續(xù)塊組成,該裝置包 括-輸入裝置I,用于在至少一個當前塊被合成之前,接收所述信號 (e(n))的塊,以及-輸出裝置0,用于傳送被合成的信號(e^(n)),所述被合成的信號 至少包括所述當前塊,其特征在于,該裝置還包括用于執(zhí)行根據(jù)權(quán)利要求1至10任一 項所述的方法的裝置(MEM, PR0C),用于通過至少一個所述先前塊 合成所述當前塊。
13. —種數(shù)字音頻信號的解碼器,所述信號由連續(xù)塊組成,其特征在 于,該解碼器還包括根據(jù)權(quán)利要求12所述的裝置(403 ),用于合成 無效塊。
全文摘要
本發(fā)明涉及在數(shù)字音頻信號解碼中的在音調(diào)周期重復(fù)前對丟失塊合成的信號校正。通過音調(diào)周期的采樣與先前音調(diào)周期的對比,以避免短暫性重復(fù)的影響,例如,爆破音的語音周期。通過選擇在最后音調(diào)周期(T<sub>j</sub>)的當前采樣(e(3))與至少一個在先前音調(diào)周期(T<sub>j-1</sub>)的大約相同位置的采樣(e(2-T<sub>0</sub>))的最小值,較優(yōu)的對該信號進行校正。
文檔編號G10L19/02GK101627423SQ200780046752
公開日2010年1月13日 申請日期2007年10月17日 優(yōu)先權(quán)日2006年10月20日
發(fā)明者巴拉茲·科維斯, 斯特凡·拉古德 申請人:法國電信