專利名稱:具有矢量激勵(lì)源的數(shù)字語言編碼器的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及語言編碼器,具體涉及采用矢量激勵(lì)源的數(shù)字式語言編碼器。
在本領(lǐng)域內(nèi),語言編碼器是眾所周知的。一些語言編碼器將語音樣值轉(zhuǎn)換為數(shù)字化的代碼,然后通過采用線性預(yù)測編碼法顯示出語言頻譜信息。另一些語言編碼器通過提供一個(gè)與原來的語音信號(hào)有關(guān)的激勵(lì)信號(hào)來改進(jìn)普通的線性預(yù)測編碼技術(shù)。本發(fā)明人早先在美國專利Us.4817157中已敘述過一種具有改進(jìn)的矢量激勵(lì)源的數(shù)字式語言編碼器,其中,可查閱一種激勵(lì)矢量代碼簿來選取一個(gè)最適合于可資利用信息的激勵(lì)信號(hào)。由此可提供出一個(gè)嚴(yán)密代表原話音信號(hào)、復(fù)原的語言信號(hào)。
通常,如果有大量可用的備選激勵(lì)矢量可用作激勵(lì)源,則由此得出的譯碼語言信號(hào)將更嚴(yán)密地代表原來的未編碼的語言信號(hào)。然而,這樣來提高性能一般會(huì)導(dǎo)致代碼簿規(guī)模的增大,并且通常會(huì)增加處理的復(fù)雜性和數(shù)據(jù)的速率。
因此,需要有采用矢量激勵(lì)信號(hào)的一種數(shù)字式語言編碼器。其中,對于給定規(guī)模的代碼簿而言,可在最小限度地增加復(fù)雜性和基本上不增加數(shù)據(jù)率的情況下使譯碼的語言信號(hào)的質(zhì)量實(shí)質(zhì)上達(dá)到最高。
通過配置以這里公布的具有改進(jìn)的語言質(zhì)量的、帶有矢量激勵(lì)源的數(shù)字式語言編碼器,上述的需要和其它要求基本上能得到滿足。根據(jù)本發(fā)明,在對一個(gè)信號(hào)樣值例如一個(gè)語言樣值進(jìn)行編碼時(shí),編碼器首先確定這個(gè)語言樣值的音調(diào)時(shí)間(pitch period)參數(shù)。部分地依賴于這個(gè)音調(diào)時(shí)間參數(shù),可以確定出一個(gè)具體的編碼的激勵(lì)信號(hào),而與音調(diào)濾波器系數(shù)無關(guān)。因此,可使得用于那個(gè)具體語言樣值的音調(diào)濾波器系數(shù)最優(yōu)化。這種方法允許在取定備選的激勵(lì)信號(hào)時(shí),不需相應(yīng)地增加處理的復(fù)雜性或數(shù)據(jù)率。
在一個(gè)實(shí)施例中,確定編碼的激勵(lì)信號(hào)時(shí)基本上與任何音調(diào)信息無關(guān)。具體地說,對于由代碼簿提供的備選激勵(lì)信號(hào)進(jìn)行處理,以便基本上消除至少部分地可由一個(gè)參數(shù)分量來代表的那些分量,而該參考分量至少部分地與中間音調(diào)矢量有關(guān)聯(lián)。更具體地說,將與中間音調(diào)矢量有關(guān)的矢量分量從備選激勵(lì)信號(hào)中除掉(這一步驟稱為正交化)。然后,經(jīng)正交化的備選激勵(lì)信號(hào)與未編碼的語言樣值進(jìn)行比較,以識(shí)別出最佳地代表這個(gè)具體的語言樣值的備選激勵(lì)信號(hào)。包括音調(diào)濾波器系數(shù)在內(nèi)的音調(diào)信息隨后可得到優(yōu)化,以最佳地適合于選定的激勵(lì)信號(hào),借此產(chǎn)生出該語言信號(hào)的全面優(yōu)化的編碼信號(hào)。
在另一個(gè)實(shí)施例中,配置了一個(gè)備選激勵(lì)信號(hào)第二代碼簿。其中,使用兩個(gè)激勵(lì)信號(hào)來代表語言樣值。第一激勵(lì)信號(hào)可按上述方法予以選定,第二激勵(lì)信號(hào)可按類似的方法選定。其中,備選的第二激勵(lì)信號(hào)重要的是與中間音調(diào)矢量和先前選定的第一激勵(lì)信號(hào)兩者相正交。
圖1示出本發(fā)明的方框圖;
圖2示出代表本發(fā)明一個(gè)特定的矢量圖。
本發(fā)明的實(shí)施,可應(yīng)用一種合適的數(shù)字信號(hào)處理器例如莫托羅拉公司的DSP 56000系列的器件來組成語言編碼器。這樣的DSP器件實(shí)施例的運(yùn)算功能示于圖1的等效電路中方框圖。
將音調(diào)時(shí)間參數(shù)(101)(它按先有的技術(shù)確定出)提供給包含有音調(diào)濾波器一部分的一個(gè)音調(diào)濾波器組(102)。由此得出的合成信號(hào)(103)包含有一個(gè)中間音調(diào)矢量,它加到第一乘法器(104)和兩個(gè)正交化處理器(106和107)上。第一乘法器(104)的作用是將該合成信號(hào)(103)乘以一個(gè)音調(diào)濾波器系數(shù)(108),以產(chǎn)生出一個(gè)音調(diào)濾波器輸出(109)。音調(diào)濾波器系數(shù)(108)的選取在下面詳述。
第一代碼簿(111)包含有一組基本矢量,它們可以線性組合起來以形成許多合成的激勵(lì)信號(hào)。根據(jù)所用的存貯器的大小和適合于應(yīng)用的其它因素合成的激勵(lì)信號(hào)的可能個(gè)數(shù)例如可在64至2048之間;當(dāng)應(yīng)用于特定的用途時(shí),其數(shù)目可能較多。在對一個(gè)具體的語言樣值編碼時(shí),問題是在這些激勵(lì)源中選取哪個(gè)才能最佳地代表原語言信息的相應(yīng)分量。
根據(jù)本發(fā)明,一旦具體的合成信號(hào)(103)確定后,由第一代碼簿(111)組列出的激勵(lì)信號(hào)將順序地呈現(xiàn)作為備選激勵(lì)源。每個(gè)備選激勵(lì)源首先使之相對于合成信號(hào)作正交化(106)。例如參照圖2,如果矢量A認(rèn)為代表合成信號(hào),矢量B認(rèn)為代表一個(gè)具體的備選激勵(lì)源,則備選激勵(lì)源信號(hào)的正交化將得出由參考字符B′表示的矢量。(應(yīng)該指出,在實(shí)踐中,矢量的空間維數(shù)是包含該矢量的樣值數(shù)的函數(shù),樣值數(shù)可能達(dá)到40或更多。還應(yīng)指出,通過將基本矢量正交化,很容易使備選激勵(lì)矢量正交化。這里,正交化的一些基本矢量彼此間的線性組合,可產(chǎn)生出正交化的激勵(lì)矢量。)一旦正交化后,得出的備選激勵(lì)源可以與未編碼信號(hào)(113)(或者在此基礎(chǔ)上的一個(gè)合適的代表性信號(hào))相比較(112),以確定這兩者之間的相對的類似性或不一致性。然后,對第一代碼簿(111)中的每個(gè)激勵(lì)源重復(fù)進(jìn)行該處理。于是,可作出判定,哪一個(gè)備選激勵(lì)源最嚴(yán)密地與未編碼信號(hào)(113)相一致。
如本領(lǐng)域內(nèi)所熟知的,在這個(gè)具體實(shí)施例中,增益系數(shù)114也可用來修正每個(gè)備選激勵(lì)源信號(hào)。此外,如果需要,激勵(lì)源的選取和增益補(bǔ)償兩者也可以實(shí)質(zhì)上同時(shí)實(shí)現(xiàn),這也是本領(lǐng)域內(nèi)所熟知的。
一旦通過這種處理從第一代碼簿(111)中選定一個(gè)合適的激勵(lì)源,此后的正交化處理(106)就可免去,并通過合適的控制機(jī)械(117)選擇出該準(zhǔn)確的激勵(lì)源信號(hào)(116)。然后,在單一個(gè)代碼簿編碼器的情況下,可以選通音調(diào)信息(117),并與所選取的具有音調(diào)濾波器系數(shù)(108)的激勵(lì)源信號(hào)相加(118),而激勵(lì)增益(114)優(yōu)化到使組合的激勵(lì)源最嚴(yán)密地與未編碼信號(hào)(113)相一致。一旦優(yōu)化后,音調(diào)時(shí)間參數(shù),音調(diào)濾波器系數(shù)及具體的激勵(lì)源和增益都已知,于是,由此得出的合適的信號(hào)可用作為原語言樣值的信號(hào)。
如圖1中所示,如果需要,可以再使用一個(gè)代碼簿(121),它也包含有許多個(gè)基本矢量,可導(dǎo)得備選激勵(lì)源。使用這樣多個(gè)代碼簿的方法在本領(lǐng)域中是已知的。然而,根據(jù)本發(fā)明,一旦如上所述從第一代碼簿(111)中選定激勵(lì)源后,使第二代碼簿(121)來的備選激勵(lì)源相對于第一代碼簿(111)來的合成信號(hào)(103)和選定的激勵(lì)源兩者都正交化。然后,選取過程可按上面所述方式繼續(xù)進(jìn)行,將第二代碼薄(121)來的正交的備選激勵(lì)源信號(hào)與對應(yīng)的未編碼信號(hào)(113)進(jìn)行比較,以識(shí)別出最嚴(yán)密的適配。一旦選定這個(gè)激勵(lì)源,便可如上面所述使音調(diào)濾波器系數(shù)(108)和激勵(lì)增益(114和120)最佳化。
權(quán)利要求
1.一種對語言樣值編碼的方法,它包括以下步驟A.對語言樣值確定一個(gè)音調(diào)時(shí)間參數(shù);其特征在于B.對該語言樣值確定一個(gè)與任何音調(diào)濾波器系數(shù)無關(guān)的編碼激勵(lì)信號(hào);C.對該語言樣值一個(gè)音調(diào)一個(gè)音調(diào)濾波系數(shù)。
2.根據(jù)權(quán)利要求1所述的方法,其特征還在于,確定編碼激勵(lì)信號(hào)的步驟包括有提供出多個(gè)備選激勵(lì)信號(hào)。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,確定編碼激勵(lì)信號(hào)的步驟包括有對多個(gè)備選激勵(lì)信號(hào)進(jìn)行處理,以提供出處理好的條選激勵(lì)信號(hào),這些信號(hào)是由與音調(diào)濾波器的輸出可代表的信息基本上無關(guān)的信息組成的,而音調(diào)濾波器的輸出至少部分地是音調(diào)時(shí)間參數(shù)的函數(shù)。
4.根據(jù)權(quán)利要求2所述的方法,其特征還在于,確定編碼激勵(lì)信號(hào)的步驟包括有對多個(gè)備選激勵(lì)信號(hào)進(jìn)行處理,以使多個(gè)備選激勵(lì)信號(hào)相對于音調(diào)濾波器輸出成正交,而音調(diào)濾波器的輸出至少部分地是音調(diào)時(shí)間參數(shù)的函數(shù)。
5.根據(jù)權(quán)利要求1所述的方法,其特征還在于,確定編碼激勵(lì)信號(hào)的步驟包括有以下步驟B1.對一個(gè)激勵(lì)信號(hào)進(jìn)行處理,以基本上除去至少可由一參考信號(hào)部分地代表分量,而該參考信號(hào)至少部分地與音調(diào)時(shí)間參數(shù)有關(guān)聯(lián);B2.對該語言樣值確定一個(gè)合適的激勵(lì)信號(hào)。
6.根據(jù)權(quán)利要求5所述的方法,其特征還在于,處理激勵(lì)信號(hào)的步驟包括將該激勵(lì)信號(hào)處理得使之相對于音調(diào)濾波器輸出成正交,而音調(diào)濾波器的輸出至少部分地是音調(diào)時(shí)間參數(shù)的函數(shù)。
7.根據(jù)權(quán)利要求5所述的方法,其特征還在于以下步驟C1.對一個(gè)備選激勵(lì)信號(hào)進(jìn)行處理,以基本上除去至少部分地可由一個(gè)參考信號(hào)代表的分量,而該參考信號(hào)至少部分地與音調(diào)時(shí)間參數(shù)有關(guān)聯(lián);另外,合適的激勵(lì)信號(hào)在步驟C中確定。
8.根據(jù)權(quán)利要求7所述的方法,其特征還在于,處理備選激勵(lì)信號(hào)的步驟包括將該備選激勵(lì)信號(hào)處理得使之相對于參考信號(hào)和步驟C中確定的合適的激勵(lì)信號(hào)兩者成正交。
9.應(yīng)用至少兩個(gè)包含有備選激勵(lì)信號(hào)方面信息的代碼薄對信號(hào)樣值進(jìn)行編碼的一種方法,它包括以下步驟A.應(yīng)用第一代碼薄對信號(hào)樣值確定第一激勵(lì)信號(hào);其特征在于B.應(yīng)用第二代碼薄對該信號(hào)樣值確定第二激勵(lì)信號(hào),該第二激勵(lì)信號(hào)是由與第一激勵(lì)信號(hào)可代表的信息基本上無關(guān)的信息組成的;C.應(yīng)用第一和第二激勵(lì)信號(hào)來至少部分地代表該信號(hào)樣值。
10.根據(jù)權(quán)利要求9所述的方法,其特征還在于,該信號(hào)樣值包含一個(gè)語言樣值。
11.根據(jù)權(quán)利要求9所述的方法,其特征還在于,確定第二激勵(lì)信號(hào)的步驟包括有對備選激勵(lì)信號(hào)進(jìn)行處理,以使該備選激勵(lì)信號(hào)相對于第一激勵(lì)信號(hào)成正交。
全文摘要
在一個(gè)利用矢量激勵(lì)的矢量激勵(lì)源數(shù)字或語言編碼器中,備選激勵(lì)源(111、121)認(rèn)為是與某些音調(diào)參數(shù)無關(guān)的,一旦選定一個(gè)具體的激勵(lì)源后,可使音調(diào)參數(shù)唯一地最佳化,從而獲得語言質(zhì)量的全面改進(jìn)。
文檔編號(hào)G10L19/12GK1048278SQ90103020
公開日1991年1月2日 申請日期1990年6月19日 優(yōu)先權(quán)日1989年6月23日
發(fā)明者格森·艾拉·阿倫 申請人:莫托羅拉公司