亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

聲源矢量生成裝置以及聲音編碼裝置和聲音解碼裝置的制作方法

文檔序號:2829562閱讀:292來源:國知局
專利名稱:聲源矢量生成裝置以及聲音編碼裝置和聲音解碼裝置的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及能得到高品質(zhì)合成聲音的聲源矢量生成裝置以及能用低位速率對高品質(zhì)的聲音信號進(jìn)行編碼/解碼的聲音編碼裝置和聲音解碼裝置。
背景技術(shù)
CELP(Code Excited Linear Prediction編碼激勵線性預(yù)測)型的聲音編碼裝置,是對每個(gè)以一定的時(shí)間劃分聲音的幀進(jìn)行線性預(yù)測,用存儲過去的驅(qū)動聲源的自適應(yīng)碼本和存儲多個(gè)噪聲向量的噪聲碼本,對每幀線性預(yù)測的預(yù)測殘差(激勵信號)進(jìn)行編碼的方式。例如在“低位速率高品質(zhì)量話音”(“High Quality Speechat Low Bit Rate”M.R.Schroeder,Proc.ICASSP’85,PP937-940)中公開的CELP型聲音編碼裝置。
圖1表示CELP型的聲音編碼裝置的概略結(jié)構(gòu)。CELP型的聲音編碼裝置將聲音信息分離成聲源信息和聲道信息并進(jìn)行編碼。對于聲道信息,將輸人聲音信號10輸人到濾波器系數(shù)分析單元11中并進(jìn)行線性預(yù)測,在濾波器系數(shù)量化單元12對線性預(yù)測系數(shù)(LPG)進(jìn)行編碼。借助于對合成濾波器13提供線性預(yù)測系數(shù),在合成濾波器13能將聲道信號摻人聲源信息中。對于聲源信息,在每個(gè)進(jìn)一步細(xì)分幀的區(qū)間(稱為子幀)進(jìn)行自適應(yīng)碼本14的檢索和噪聲碼本15的聲源檢索。自適應(yīng)碼本14的檢索和噪聲碼本15的聲源檢索,是決定使式(1)的編碼失真最小的自適應(yīng)碼矢量的碼號及其增益(音調(diào)增益)、和噪聲碼矢量的碼號及其增益(噪聲碼增益)的處理。
‖v·(gaHp+gcHc)‖2(1)V聲音信號(矢量)H合成濾波器的脈沖響應(yīng)卷積矩陣
H=h(0)0ΛΛ00h(1)h(0)0Λ00h(2)h(1)h(0)000MMMO00MMMOh(0)0h(L-1)ΛΛΛh(1)h(0)]]>其中,h合成濾波器的脈沖響應(yīng)(矢量)L幀長p自適應(yīng)碼矢量c噪聲碼矢量ga自適應(yīng)碼增益(音調(diào)增益)gc噪聲碼增益但是,因當(dāng)閉環(huán)檢索使式(1)為最小的前述碼時(shí),碼檢索中所要的運(yùn)算量變得膨大,所以在一般的CELP型聲音編碼裝置中,首先進(jìn)行自適應(yīng)碼本檢索,規(guī)定自適應(yīng)碼矢量的碼號,接著接受其結(jié)果,進(jìn)行噪聲碼本檢索,規(guī)定噪聲碼矢量的碼號。
這里,參照圖2A~圖2C對CELP型聲音編碼裝置的噪聲碼本檢索進(jìn)行說明。
圖中,符號x是基于式(2)求得的噪聲碼本檢索用的目標(biāo)矢量。設(shè)自適應(yīng)碼本檢索已經(jīng)結(jié)束。
x=v-gaHp(2)x噪聲碼本檢索目標(biāo)(矢量)v聲音信號(矢量)H合成濾波器的脈沖響應(yīng)卷積矩陣p自適應(yīng)碼矢量ga自適應(yīng)碼增益(音調(diào)增益)如圖2所示,噪聲碼本檢索是規(guī)定使計(jì)算單元16中用式(3)定義的編碼失真最小的噪聲碼矢量c的處理。
‖x-gcHc)‖2(3)x噪聲碼本檢索目標(biāo)(矢量)H合成濾波器的脈沖響應(yīng)卷積矩陣c噪聲碼矢量
gc噪聲碼增益失真計(jì)算單元16對控制開關(guān)21進(jìn)行控制,切換從噪聲碼本15讀出的噪聲編碼矢量,直到定出噪聲碼矢量c為止。
為了減少計(jì)算的費(fèi)用,實(shí)際的CELP型聲音編碼裝置為圖2B的結(jié)構(gòu),在失真計(jì)算單元16’中進(jìn)行規(guī)定使式(4)的失真估算值最大的碼號的處理。
(xtHc)2||Hc||2=((xtH)c)2||Hc||2=(x′tc)2||Hc||2=(x′tc)2ctHtHc---(4)]]>x噪聲碼本檢索目標(biāo)(矢量)H合成濾波器的脈沖響應(yīng)卷積矩陣H’H的轉(zhuǎn)置矩陣x’在H對x進(jìn)行時(shí)間反轉(zhuǎn)合成倒置所得矢量(x”=x’H)c噪聲碼矢量具體地說,將噪聲碼本控制開關(guān)21連接到噪聲碼本15的1端,從對應(yīng)于該端的地址讀出噪聲碼矢量c。由合成濾波器13,將讀出的噪聲碼矢量c與聲道信息合成,生成合成矢量Hc。接著,用對目標(biāo)x進(jìn)行時(shí)間反轉(zhuǎn)、合成、時(shí)間反轉(zhuǎn)得到的矢量x’、以合成濾波器合成噪聲碼矢量的所得矢量Hc和噪聲碼矢量c,失真計(jì)算單元16’算出式(4)的失真估算值。然后,切換噪聲碼本控制開關(guān)21,對噪聲碼本內(nèi)的全部噪聲矢量,算出上述失真估算值。
最后,將式(4)的失真估算值為最大時(shí)連接的噪聲碼本控制開關(guān)21的號碼,作為噪聲碼矢量的碼號,輸出到編碼輸出單元17中。
圖2C表示聲音解碼轉(zhuǎn)置的部分結(jié)構(gòu)。切換控制噪聲碼本控制開關(guān)21,以便讀出被傳送來的碼號的噪聲碼矢量。在放大電路23和合成濾波器24中設(shè)定被傳送來的噪聲編碼增益gc和濾波器系數(shù)后,讀出噪聲碼矢量并復(fù)原合成聲音。
在前述的聲音編碼裝置和解碼裝置中,存儲在噪聲碼本15中作為聲源信息的噪聲碼矢量的越多,越能檢索接近實(shí)際聲音的聲源的噪聲碼矢量。但是,因噪聲碼本(ROM)的容量有限制,所以不能將對應(yīng)于全部聲源的無數(shù)的噪聲碼矢量存儲在噪聲碼本中。因此,在謀求聲音品質(zhì)的改善方面有其極限。
此外,提議有能大幅度地降低失真計(jì)算單元的編碼失真計(jì)算,而且能減小噪聲碼本(ROM)的代數(shù)結(jié)構(gòu)的聲源(記載在“8KBIT/S ACELP CODING OF SPEECHWITH 10MS SPEECH-FRAMEA CANDIDATE FOR CCITT STANDARDIZATION”R.Salami,C.Laflamme,J-P.Adoul,ICASSP’94,pp.II-97~I(xiàn)I-100,1994中)。
代數(shù)結(jié)構(gòu)的聲源預(yù)先計(jì)算合成濾波器的脈沖響應(yīng)和時(shí)間反轉(zhuǎn)的目標(biāo)的卷積運(yùn)算結(jié)果以及合成濾波器的自相關(guān),并在存儲器中展開,因而能大幅度地減少編碼失真計(jì)算的費(fèi)用。借助于代數(shù)生成噪聲碼矢量,能減小存儲噪聲碼矢量的ROM。在噪聲碼本中使用前述代數(shù)結(jié)構(gòu)聲源的CS-ACELP和ACELP分別被ITU-T作為G.729建議和G.723.1建議提出。
但是,在將前述代數(shù)結(jié)構(gòu)聲源包括在噪聲碼本中的CELP型的聲音編碼裝置/聲音解碼裝置中,因不斷地用脈沖串矢量對噪聲碼本檢索用目標(biāo)進(jìn)行編碼,所以在謀求聲音品質(zhì)的改善方面有其極限。

發(fā)明內(nèi)容
鑒于前述實(shí)際情況,本發(fā)明的第1個(gè)目的是提供比原樣在噪聲碼本中存儲噪聲碼矢量的場合能大幅度地減小存儲器容量,并能謀得聲音品質(zhì)改善的聲源矢量生成裝置以及聲音編碼裝置和聲音解碼裝置。
本發(fā)明的第2個(gè)目的是提供在噪聲碼本中包括代數(shù)結(jié)構(gòu)聲源,與用脈沖串矢量對噪聲碼本檢索用目標(biāo)進(jìn)行編碼的場合相比,能生成復(fù)雜的噪聲碼矢量,并能謀得聲音品質(zhì)改善的聲源矢量生成裝置以及聲音編碼裝置和聲音解碼裝置。
本發(fā)明將以往的CELP型聲音編碼/解碼裝置的固定矢量讀出單元和固定碼本,分別置換為輸出與被輸入的振種值相對應(yīng)的不同的矢量系列的振蕩器和存儲多個(gè)振種(產(chǎn)生振蕩器)的振種存儲單元中。由此,不必將固定矢量原樣存儲在固定碼本(ROM)中,能大幅度地減小存儲器的容量。
本發(fā)明將以往的CELP型聲音編碼/解碼裝置的噪聲矢量讀出單元和噪聲碼本置換為振蕩器和振種存儲單元。由此,不必將噪聲矢量原樣存儲在固定碼本(ROM)中,能大幅度地減小存儲器的容量。
本發(fā)明聲源矢量生成裝置的結(jié)構(gòu)是存儲多個(gè)固定波形,根據(jù)起始端候補(bǔ)位置信息將各固定波形配置在各自的起始端位置上,并對這些固定波形進(jìn)行加法運(yùn)算,生成聲源矢量。因此,能生成接近實(shí)際聲音的聲源矢量。
本發(fā)明是噪聲碼本采用前述聲源矢量生成裝置而構(gòu)成的CELP型聲音編碼/解碼裝置。固定波形配置單元也可以代數(shù)生成固定波形的起始端候補(bǔ)位置信息。
本發(fā)明的CELP型聲音編碼/解碼裝置做成存儲多個(gè)固定波形,生成與每個(gè)固定波形起始端候補(bǔ)位置信息相對應(yīng)的脈沖,對合成濾波器的脈沖響應(yīng)和各自的固定波形卷積,生成波形別脈沖響應(yīng),計(jì)算前述波形別脈沖響應(yīng)的自相關(guān)和互相關(guān),并在相關(guān)矩陣存儲器中展開。由此,能得到與以代數(shù)結(jié)構(gòu)聲源作為噪聲碼本使用的場合相同程度的計(jì)算費(fèi)用,同時(shí)能改善合成聲音的品質(zhì)的聲音編碼/解碼裝置。
本發(fā)明的CELP型聲音編碼/解碼裝置包括多個(gè)噪聲碼本和從前述多個(gè)噪聲碼本中選擇一個(gè)的切換手段,也可以至少以一個(gè)噪聲碼本作為前述聲源矢量生成裝置,此外,也可以至少以一個(gè)噪聲碼本作為存儲多個(gè)隨機(jī)數(shù)序列的向量存儲單元或者存儲多個(gè)脈沖串的脈沖串存儲單元,或者至少有兩個(gè)具有前述聲源矢量生成裝置的噪聲碼本,而且各噪聲碼本存儲的固定波形個(gè)數(shù)不同,還可以使切換手段選擇任一噪聲碼本,使噪聲碼本檢索時(shí)編碼失真為最小,或者根據(jù)聲音區(qū)間分析結(jié)果,自適應(yīng)選擇任一個(gè)噪聲碼本。
根據(jù)本發(fā)明的第一方面,提供一種聲源矢量生成裝置,包括矢量提供單元,用于提供輸入聲源矢量;波形提供單元,用于從存儲裝置提供固定波形;以及變形單元,用于通過使用所述輸入聲源矢量和所述固定波形,生成變形聲源矢量。
根據(jù)本發(fā)明的第二方面,提供一種具有聲源矢量生成裝置的CELP型聲音編碼裝置,所述聲源矢量生成裝置包括矢量提供單元,用于提供輸入聲源矢量;波形提供單元,用于從存儲裝置提供固定波形;以及變形單元,用于通過使用所述輸入聲源矢量和所述固定波形,生成變形聲源矢量。
根據(jù)本發(fā)明的第三方面,提供一種具有聲源矢量生成裝置的CELP型聲音解碼裝置,所述聲源矢量生成裝置包括矢量提供單元,用于提供輸入聲源矢量;波形提供單元,用于從存儲裝置提供固定波形;以及變形單元,用于通過使用所述輸入聲源矢量和所述固定波形,生成變形聲源矢量。
根據(jù)本發(fā)明的第四方面,提供一種用于CELP型聲音編碼裝置或CELP型聲音解碼裝置的聲源矢量生成方法,包括如下步驟提供輸入聲源矢量;從存儲裝置提供固定波形;以及通過使用所述輸入聲源矢量和所述固定波形,生成變形聲源矢量。


圖1表示以往的CELP型聲音編碼裝置的概略圖。
圖2A是圖1的聲音編碼裝置的聲源矢量生成單元的方框圖。
圖2B謀求減少計(jì)算費(fèi)用的變形的聲源矢量生成單元的方框圖。
圖2C是與圖1的聲音編碼裝置配對使用的聲音解碼裝置中聲源矢量生成單元的方框圖。
圖3表示與實(shí)施形態(tài)1相關(guān)的聲音編碼裝置的主要部分的方框圖。
圖4表示包括在實(shí)施形態(tài)1的聲音編碼裝置中的聲源矢量生成裝置的方框圖。
圖5表示實(shí)施形態(tài)2的聲音編碼裝置的主要部分的方框圖。
圖6表示包括在實(shí)施形態(tài)2的聲音編碼裝置中的聲源矢量生成裝置的方框圖。
圖7表示與實(shí)施形態(tài)3和4相關(guān)的聲音編碼裝置的主要部分的方框圖。
圖8表示包括在實(shí)施形態(tài)3的聲音編碼裝置中的聲源矢量生成裝置的方框圖。
圖9表示包括在實(shí)施形態(tài)4的聲音編碼裝置中的非線性數(shù)字濾波器的方框圖。
圖10表示圖9所示的非線性數(shù)字濾波器的加法特性圖。
圖11表示與實(shí)施形態(tài)5相關(guān)的聲音編碼裝置的主要部分的方框圖。
圖12表示與實(shí)施形態(tài)6相關(guān)的聲音編碼裝置的主要部分的方框圖。
圖13A表示與實(shí)施形態(tài)7相關(guān)的聲音編碼裝置的主要部分的方框圖。
圖13B表示與實(shí)施形態(tài)7相關(guān)的聲音編碼裝置的主要部分的方框圖。
圖14表示與實(shí)施形態(tài)8相關(guān)的聲音解碼裝置的主要部分的方框圖。
圖15表示與實(shí)施形態(tài)9相關(guān)的聲音編碼裝置的主要部分的方框圖。
圖16表示包括在實(shí)施形態(tài)9的聲音編碼裝置中的量化對象LSP增加部分的方框圖。
圖17表示包括在實(shí)施形態(tài)9的聲音編碼裝置中的LSP量化·解碼單元的方框圖。
圖18表示與實(shí)施形態(tài)10相關(guān)的聲音編碼裝置的主要部分的方框圖。
圖19A表示與實(shí)施形態(tài)11相關(guān)的聲音編碼裝置的主要部分的方框圖。
圖19B表示與實(shí)施形態(tài)11相關(guān)的聲音解碼裝置的主要部分的方框圖。
圖20表示與實(shí)施形態(tài)12相關(guān)的聲音編碼裝置的主要部分的方框圖。
圖21表示與實(shí)施形態(tài)13相關(guān)的聲音編碼裝置的主要部分的方框圖。
圖22表示與實(shí)施形態(tài)14相關(guān)的聲音編碼裝置的主要部分的方框圖。
圖23表示與實(shí)施形態(tài)15相關(guān)的聲音編碼裝置的主要部分的方框圖。
圖24表示與實(shí)施形態(tài)16相關(guān)的聲音編碼裝置的主要部分的方框圖。
圖25表示與實(shí)施形態(tài)16相關(guān)的矢量量化部分的方框圖。
圖26表示與實(shí)施形態(tài)17相關(guān)的聲音編碼裝置的參數(shù)編碼部分的方框圖。
圖27表示與實(shí)施形態(tài)18相關(guān)的降噪裝置的方框圖。
具體實(shí)施例方式
下面,參照附圖對本發(fā)明的實(shí)施形態(tài)具體地進(jìn)行說明。
實(shí)施形態(tài)1圖3表示與實(shí)施形態(tài)1相關(guān)的聲音編碼裝置的主要部分的方框圖。這種聲音編碼裝置包括具有振種存儲單元31和振蕩器32的聲源矢量生成裝置30,和LPC合成濾波器單元33。
將從振種存儲單元31輸出的振種(產(chǎn)生振蕩的“種子”)34輸入到振蕩器32中。與輸入的振種值相對應(yīng),振蕩器32輸出不同的矢量系列。振蕩器32用對應(yīng)于振種(產(chǎn)生振蕩的“種子”)34的值的內(nèi)容進(jìn)行振蕩,并輸出作為矢量系列的聲源矢量35。LPC合成濾波器單元33用合成濾波器的脈沖響應(yīng)卷積矩陣的形式,提供聲道信息,以脈沖響應(yīng)對聲源矢量35進(jìn)行卷積運(yùn)算后輸出合成話音36。將以脈沖響應(yīng)對聲源矢量35進(jìn)行卷積運(yùn)算稱為LPC合成。
圖4表示聲源矢量生成裝置30的具體的結(jié)構(gòu)。按照由失真計(jì)算單元提供的控制信號,振種存儲單元控制開關(guān)41切換從振種存儲單元31讀出的振種。
這樣,僅將從振蕩器32輸出不同的矢量系列的多個(gè)振種預(yù)先存儲在振種存儲單元31中,與將復(fù)雜的噪聲碼向量原樣存儲在噪聲碼本中的場合相比,能用較小的容量發(fā)生更多的噪聲碼矢量。
此外,雖然在本實(shí)施形態(tài)中對聲音編碼裝置進(jìn)行了說明,但也能將聲源矢量生成裝置30用于聲音解碼裝置中。這種場合,在聲音解碼裝置中具有與聲音編碼裝置的振種存儲單元31相同內(nèi)容的振種存儲單元,并將編碼時(shí)選擇的振種號碼提供給振種存儲單元控制開關(guān)41。
實(shí)施形態(tài)2圖5表示基于本實(shí)施形態(tài)的聲音編碼裝置的主要部分的方框圖。這種聲音編碼裝置包括具有振種存儲單元51和非線性振蕩器52的聲源矢量生成裝置50,和LPC合成濾波器單元53。
將從振種存儲單元51輸出的振種(產(chǎn)生振蕩的“種子”)54輸入到非線性振蕩器52中。從非線性振蕩器52輸出的作為矢量系列的聲源矢量55,輸入到LPC合成濾波器單元53中。合成濾波器單元53的輸出是合成話音56。
非線性振蕩器52輸出對應(yīng)于輸入的振種54的值的不同的矢量系列,LPC合成濾波器單元53對輸入的聲源矢量55進(jìn)行LPC合成,并輸出合成話音56。
圖6表示聲源矢量生成裝置50的功能的方框圖。按照由失真計(jì)算單元提供的控制信號,振種存儲單元控制開關(guān)41切換從振種存儲單元51讀出的振種。
這樣,借助于在聲源矢量生成裝置50的振蕩器中使用非線性振蕩器52,利用遵循非線性特性的振蕩,能抑制發(fā)散,得到實(shí)用的聲源矢量。
此外,雖然在本實(shí)施形態(tài)中對聲音編碼裝置進(jìn)行了說明,但也能將聲源矢量生成裝置50用于聲音解碼裝置中。這種場合,在聲音解碼裝置中包括與聲音編碼裝置的振種存儲單元51相同內(nèi)容的振種存儲單元,并將編碼時(shí)選擇的振種號碼提供給振種存儲單元控制開關(guān)41。
實(shí)施形態(tài)3圖7表示基于本實(shí)施形態(tài)的聲音編碼裝置的主要部分的方框圖。這種聲音編碼裝置包括具有振種存儲單元71和非線性數(shù)字濾波器72的聲源矢量生成裝置70,和LPC合成濾波器單元73。74是從振種存儲單元71輸出并輸入到非線性數(shù)字濾波器72中的振種(產(chǎn)生振蕩的“種子”),75是作為從非線性數(shù)字濾波器72輸出的矢量系列的聲源矢量,76是從LPC合成濾波器73輸出的合成話音。
如圖8所示,聲源矢量生成裝置70具有利用由失真計(jì)算單元供給的控制信號,切換從振種存儲單元71讀出的振種74的振種存儲單元控制開關(guān)41。
非線性數(shù)字濾波器72輸出對應(yīng)于輸入的振種的值的不同的矢量系列,LPC合成濾波器單元73對輸入的聲源矢量75進(jìn)行LPC合成,并輸出合成話音76。
這樣,借助于在聲源矢量生成裝置70的振蕩器中使用非線性數(shù)字濾波器72,利用遵循非線性特性的振蕩,能抑制發(fā)散,得到實(shí)用的聲源矢量。
此外,雖然在本實(shí)施形態(tài)中對聲音編碼裝置進(jìn)行了說明,但也能將聲源矢量生成裝置70用于聲音解碼裝置中。這種場合,在聲音解碼裝置中包括與聲音編碼裝置的振種存儲單元71相同內(nèi)容的振種存儲單元,并將編碼時(shí)選擇的振種號碼提供給振種存儲單元控制開關(guān)41。
實(shí)施形態(tài)4如圖7所示,與本實(shí)施形態(tài)相關(guān)的聲音編碼裝置包括具有振種存儲單元71和非線性數(shù)字濾波器72的聲源矢量生成裝置70,和LPC合成濾波器單元73。
特別指出的是,非線性數(shù)字濾波器72具有圖9所示的結(jié)構(gòu)。這種非線性數(shù)字濾波器72包括具有如圖10所示的非線性加法特性的加法器91,具有保存數(shù)字濾波器的狀態(tài)(y(k-1)~y(k-N)的值)的作用的狀態(tài)變量保持單元92~93,以及并聯(lián)連接到各狀態(tài)變量保持單元92~93的輸出上,將狀態(tài)變量中乘以增益后,輸出到加法器91中的乘法器94~95。根據(jù)從振種存儲單元71讀出的振種,狀態(tài)變量保持單元92~93設(shè)定狀態(tài)變量初始值。乘法器94~95限定增益的值,使數(shù)字濾波器的極點(diǎn)存在于Z平面的單位圓外。
圖10是表示包括在非線性數(shù)字濾波器72中的加法器91的非線性加法特性的概念圖,表示具有2的補(bǔ)數(shù)特性的加法器91的輸入輸出關(guān)系。加法器91首先求得作為對加法器91的輸入值總和的加法器輸入和,接著使用圖10所示的非線性特性,以算出對該輸入和的加法器輸出。
特別是,因非線性數(shù)字濾波器72采用2次全極結(jié)構(gòu),所以串聯(lián)連接2個(gè)狀態(tài)變量保持單元92、93,并對狀態(tài)變量保持單元92、93連接乘法器94、95。采用加法器91的非線性加法特性為2的補(bǔ)數(shù)的數(shù)字濾波器。此外,振種存儲單元71,特別存儲記載在表1中的32字的振種矢量。
表1噪聲矢量生成用的振種矢量

在前述結(jié)構(gòu)的聲音編碼裝置中,將從振種存儲單元71讀出的振種矢量作為初始值,供給非線性數(shù)字濾波器72的狀態(tài)變量保持單元92、93。非線性數(shù)字濾波器72每從輸入矢量(0系列)將0輸入到加法器91中,就輸出1個(gè)采樣(y(k)),并作為狀態(tài)變量順次地傳送到狀態(tài)變量保持單元92、93中。這時(shí),對從狀態(tài)變量保持單元92、93輸出的狀態(tài)變量,分別由各乘法器94、95乘以增益a1、a2。用加法器91對乘法器94、95的輸出進(jìn)行相加,求出加法器輸入和,并根據(jù)圖10的特性,發(fā)生抑制在+1~-1之間的加法器輸出。在輸出這種加法器輸出(y(k+1))作為聲源矢量的同時(shí),順次地傳送到狀態(tài)變量保持單元92、93中,生成新的采樣(y(k+2))。
在本實(shí)施形態(tài)中,作為非線性數(shù)字濾波器,為了極存在于Z平面的單位圓外,特地固定乘法器94~95的系數(shù)1~N,使加法器91持有非線性加法特性,因而即使非線性數(shù)字濾波器72的輸入變大,也能抑制輸出發(fā)散,可連續(xù)生成能實(shí)用的聲源矢量。還能確保生成的聲源矢量的隨機(jī)性。
此外,雖然在本實(shí)施形態(tài)中對聲音編碼裝置進(jìn)行了說明,但也能將聲源矢量生成裝置70用于聲音解碼裝置中。這種場合,在聲音解碼裝置中包括與聲音編碼裝置的振種存儲單元71相同內(nèi)容的振種存儲單元,并將編碼時(shí)選擇的振種號碼提供給振種存儲單元控制開關(guān)41。
實(shí)施形態(tài)5圖11表示基于本實(shí)施形態(tài)的聲音編碼裝置的主要部分的方框圖。這種聲音編碼裝置包括具有聲源存儲單元111和聲源加法矢量生成單元112的聲源矢量生成裝置110,和LPC合成濾波器單元113。
聲源存儲單元111存儲過去的聲源矢量,利用接受來自未圖示的失真計(jì)算單元的控制信號的控制開關(guān),讀出聲源矢量。
聲源加法矢量生成單元112,對從聲源存儲單元111讀出的過去的聲源矢量,施行用生成矢量特定號碼指示的規(guī)定的處理,生成新的聲源矢量。聲源加法矢量生成單元112,具有對應(yīng)于生成矢量特定號碼,切換對過去的聲源矢量的處理內(nèi)容的功能。
在如前所述結(jié)構(gòu)的聲音編碼裝置中,從例如執(zhí)行聲源檢索的失真計(jì)算單元供給生成矢量特定號碼。聲源加法矢量生成單元112,根據(jù)輸入生成矢量特定號碼的值對過去的聲源矢量進(jìn)行不同的處理,生成不同的聲源加法矢量,而且LPC合成濾波器單元113對輸入的聲源矢量進(jìn)行LPC合成并輸出合成話音。
采用本實(shí)施形態(tài),則僅將少數(shù)的過去的聲源矢量預(yù)先存儲在聲源存儲單元111中,并切換在聲源加法矢量生成單元112的處理內(nèi)容,就能生成隨機(jī)的聲源矢量,因不必預(yù)先將噪聲矢量原樣地存儲在噪聲碼本(ROM)中,所以能大幅度地減小存儲器的容量。
此外,雖然在本實(shí)施形態(tài)中對聲音編碼裝置進(jìn)行了說明,但也能將聲源矢量生成裝置110用于聲音解碼裝置中。這種場合,在聲音解碼裝置中包括與聲音編碼裝置的聲源存儲單元111相同內(nèi)容的聲源存儲單元,并對聲源加法矢量生成單元112提供編碼時(shí)選擇的生成矢量特定號碼。
實(shí)施形態(tài)6圖12表示與本實(shí)施形態(tài)相關(guān)的聲源矢量生成裝置的功能的方框圖。這種聲源矢量生成裝置包括聲源加法矢量生成單元120和存儲多個(gè)要素矢量1~N的聲源存儲單元121。
聲源加法矢量生成單元120包括進(jìn)行從聲源存儲單元121的不同的位置讀出多個(gè)不同長度的要素矢量的處理的讀出處理單元122,進(jìn)行對讀出處理后的多個(gè)要素矢量作倒置排列變換的處理的倒置處理單元123,進(jìn)行對倒置處理后的多個(gè)矢量分別乘以不同的增益的處理的乘法處理單元124,進(jìn)行縮短乘法處理后的多個(gè)矢量的矢量長度的處理的間抽處理單元125,進(jìn)行伸長間抽處理后的多個(gè)矢量的矢量長度的處理的內(nèi)插處理單元126,進(jìn)行使內(nèi)插處理后的多個(gè)矢量相加的處理的加法處理單元127,以及同時(shí)具有決定對應(yīng)于所輸入生成矢量特定號碼值的具體處理方法并對決定各處理單元作指示的功能及保持決定該具體處理內(nèi)容時(shí)參照的號碼變換對應(yīng)映射表2的功能的處理判定和指示單元128。
表2號碼變換對應(yīng)映射

這里,對聲源加法矢量生成單元120進(jìn)一步詳細(xì)地進(jìn)行說明。聲源加法矢量生成單元120將輸入生成矢量特定號碼(用7位的位串取0到127的整數(shù))與號碼變換對應(yīng)映射表2進(jìn)行比較,以決定讀出處理單元122、倒置處理單元123、乘法處理單元124、間抽間距處理單元125、內(nèi)插處理單元126、加法處理單元127的各自的具體地處理方法,并向各處理單元輸出其具體的處理方法。
首先,著眼于輸入生成矢量特定號碼的低端的4位串(n1從0到15的整數(shù)值),從聲源存儲單元121的一端到n1的位置為止,切出長度100的要素矢量1(V1)。接著,著眼于結(jié)合輸入生成矢量特定號碼的低端的2位串和高端3位串的5位串(n2從0到31的整數(shù)值),從聲源存儲單元121的一端到n2+14(從14到45的整數(shù)值)的位置為止,切出長度78的要素矢量2(V2)。進(jìn)而,著眼于輸入生成矢量特定號碼的高端5位串(n3從0到31的整數(shù)值),從聲源存儲單元121的一端到n3+46(從46到77的整數(shù)值)的位置為止,切出長度Ns(=52)的要素矢量3(V3)。讀出處理單元122進(jìn)行向倒置處理單元123輸出V1、V2、V3的處理。
如果生成矢量特定號碼的最低端的1位是“0”,則倒置處理單元123進(jìn)行以倒置排列變換V1和V2和V3的矢量作為新的V1、V2、V3并輸出到乘法處理單元124中的處理,如果生成矢量特定號碼的最低端的1位是“1”,則進(jìn)行原樣地將V1和V2和V3輸出到乘法處理單元124中的處理。
乘法處理單元124著眼于組合輸入生成矢量特定號碼的高端第7位和高端第6位的2位串,如果該位串是‘00’,則V2的振幅乘-2倍、如果該位串是‘01’,則以V3的振幅的-2,如果該位串是‘10’,則V1的振幅乘-2,如果該位串是‘11’,則V2的振幅乘2,所得各矢量分別作為新的V1、V2、V3,輸出到間抽單元125中。
間抽單元125著眼于組合輸入生成矢量特定號碼的高端第4位和高端第3位的2位串,如果該位串是(a)‘00’,則從V1、V2、V3開始間隔1個(gè)采樣,取出26個(gè)采樣的矢量作為新的V1、V2、V3,輸出到內(nèi)插處理單元126中,如果該位串是(b)‘01’,則從V1、V3開始間隔1個(gè)采樣,從V2開始間隔2個(gè)采樣,取出26個(gè)采樣的矢量作為新的V1、V2、V3,輸出到內(nèi)插處理單元126中,如果該位串是(c)‘10’,則從V1開始間隔3個(gè)采樣,從V2、V3開始間隔1個(gè)采樣,取出26個(gè)采樣的矢量作為新的V1、V2、V3,輸出到內(nèi)插處理單元126中,如果該位串是(d)‘11’,則從V1開始間隔3個(gè)采樣,從V2開始間隔2個(gè)采樣,從V3開始間隔1個(gè)采樣,取出26個(gè)采樣的矢量作為新的V1、V2、V3,輸出到內(nèi)插處理單元77中,內(nèi)部插處理單元126著眼于輸入生成矢量特定號碼的高端第3位,如果其值是(a)‘0’,則以將V1、V2、V3分別代入長度Ns(=52)的0矢量的偶數(shù)號采樣中的矢量作為新的V1、V2、V3,輸出到加法處理單元75中,如果其值是(b)‘1’,則以將V1、V2、V3分別代入長度Ns(=52)的0矢量的奇數(shù)號采樣中的矢量作為新的V1、V2、V3,輸出到加法處理單元75中。
加法處理單元127對由內(nèi)插處理單元126生成的3個(gè)矢量(V1、V2、V3)進(jìn)行加法運(yùn)算,生成并輸出聲源加法矢量。
這樣,本實(shí)施形態(tài),因?qū)?yīng)于生成矢量特定號碼隨機(jī)地組合多個(gè)處理,生成隨機(jī)的聲源矢量,所以不必預(yù)先將噪聲矢量原樣地存儲在噪聲碼本(ROM)中,能大幅度地減小存儲器的容量。
此外,借助于在實(shí)施形態(tài)5的聲音編碼裝置中使用本實(shí)施形態(tài)的聲源矢量生成裝置,不必持有大容量的噪聲碼本,就能生成復(fù)雜隨機(jī)的聲源矢量。
實(shí)施形態(tài)7下面,在以作為日本國內(nèi)的PDC數(shù)字便攜電話的聲音編碼/解碼標(biāo)準(zhǔn)方式的PSI-CELP為基礎(chǔ)做成的CELP型聲音編碼裝置中,使用前述的實(shí)施形態(tài)1~實(shí)施形態(tài)6的任一個(gè)所示的聲源矢量生成裝置的例,作為實(shí)施形態(tài)7進(jìn)行說明。
圖13A和圖13B表示與實(shí)施形態(tài)7相關(guān)的聲音編碼裝置的方框圖。在這種編碼裝置中,將數(shù)字化的輸入聲音數(shù)據(jù)1300以幀為單位(幀長Nf=104)供給到緩存器1301中。這時(shí),由供給的新的數(shù)據(jù)更新緩沖器1301中的舊的數(shù)據(jù)。幀功率量化和解碼單元1302首先從緩存器1301中讀出長度Nf(=104)的處理幀s(i)(0≤i≤Nf-1),由式(5)求出該處理幀內(nèi)采樣的平均功率amp。
amp=Σi=0Nfs2(i)Nf---(5)]]>amp處理幀內(nèi)采樣的平均功率i處理幀內(nèi)的要素號碼(0≤i≤Nf-1)s(i)處理幀內(nèi)采樣Nf處理幀長(=52)利用式(6),將求得的處理幀內(nèi)采樣的平均功率amp變換成對數(shù)變換值amplog。
amplog=log10(255×amp+1)log10(255+1)---(6)]]>amplog處理幀內(nèi)采樣的平均功率的對數(shù)變換值amp處理幀內(nèi)采樣的平均功率將求得的amplog存儲在功率量化表存儲單元1303中,用表3所示的10字的標(biāo)量量化用表Cpow進(jìn)行標(biāo)量量化,得到4位的功率索引Ipow,從得到4位的功率索引Ipow求出解碼幀功率spow,并將功率索引Ipow和解碼幀功率spow輸出到參數(shù)編碼單元133中。功率量化表存儲單元1303存儲16字的功率標(biāo)量量化表(表3),在幀功率量化·解碼單元1302對處理幀內(nèi)采樣的平均功率的對數(shù)變換值進(jìn)行標(biāo)量量化時(shí)參照該表。
表3功率標(biāo)量量化用表

LPC分析單元1304,首先從緩存器1301讀出分析區(qū)間長度Nw(=256)的分析區(qū)間數(shù)據(jù),在讀出的分析區(qū)間數(shù)據(jù)上乘以窗長Nw(=256)的漢明窗Wh,得到乘以漢明窗后的分析區(qū)間數(shù)據(jù)后,多次求所得乘以漢明窗后的分析區(qū)間數(shù)據(jù)的自相關(guān)函數(shù),直到次數(shù)為預(yù)測次數(shù)Np(=10)為止。。在求得的自相關(guān)函數(shù)上乘以存儲在滯后窗存儲單元1305中的10字的滯后窗表(表4),得到乘以滯后窗后的自相關(guān)函數(shù),對于得到的乘以滯后窗后的自相關(guān)函數(shù),進(jìn)行線性預(yù)測分析,算出LPC的參數(shù)α(i)(1≤i≤Np),并輸出到音調(diào)預(yù)選單元1308中。
表4滯后窗表

接著,將求得的LPC參數(shù)α(i)變換成LSP(線頻譜對)ω(i)(1≤i≤Np),并輸出到量化/解碼單元1306中。滯后窗存儲單元1305存儲LPC分析單元參照的滯后窗。
LSP量化/解碼單元1306,首先參照LSP量化表存儲單元1307中存儲的LSP的矢量量化用表,對從LPC分析單元1304接收到的LSP進(jìn)行矢量量化,選擇最佳索引,并以選擇的索引作為LSP碼Ilsp輸出到參數(shù)編碼單元1331中。接著,從LSP量化表存儲單元1307讀出對應(yīng)于LSP碼的形心作為解碼LSPωq(i)(1≤i≤Np),并將讀出的解碼LSP輸出到LSP插入單元1311中。此外,將解碼LSP變換成LPC,得到解碼LSPαq(i)(1≤i≤Np),并將得到的解碼LPC輸出到矢量加權(quán)濾波器系數(shù)運(yùn)算單元1312和聽覺加權(quán)LPC合成濾波器系數(shù)運(yùn)算單元1314中。
LSP量化表存儲單元1307存儲LSP量化/解碼單元1306對LSP進(jìn)行矢量量化時(shí)參照的LSP矢量量化表。
音調(diào)預(yù)選單元1308,首先對從緩存器1301讀出的處理幀數(shù)據(jù)s(i)(1≤i≤Nf-1),施行根據(jù)由LPC分析單元1304接收到的LSPα(i)(1≤i≤Np)構(gòu)成的線性預(yù)測反濾波,得到線性預(yù)測殘差信號res(i)(1≤i≤Nf-1),計(jì)算得到的線性預(yù)測殘差信號res(i)的功率,求得用處理子幀聲音采樣功率使計(jì)算的殘差信號功率歸一化的值的歸一化預(yù)測殘差功率resid,并輸出到參數(shù)編碼單元1331中。接著,在線性預(yù)測殘差信號res(i)上乘以長度Nw(=256)的漢明窗,生成乘以漢明窗后的線性預(yù)測殘差信號resw(i)(1≤i≤Nw-1),在Lmin-2≤i≤Lmax+2(其中,Lmin為長期預(yù)測系數(shù)的最短分析區(qū)間為16、Lmax為長期預(yù)測系數(shù)的最長分析區(qū)間,分別取為16的128)的范圍內(nèi),求得生成的resw(i)的自相關(guān)函數(shù)φint(i)。在求得的自相關(guān)函數(shù)φint(i)上疊加存儲在多相系數(shù)存儲單元1309上的28字的多相濾波器系數(shù)Cppf(表5),分別求得整數(shù)滯后int的自相關(guān)函數(shù)φint(i)、偏離整數(shù)滯后int-1/4的分?jǐn)?shù)位置的自相關(guān)函數(shù)φdq(i)、偏離整數(shù)滯后int+1/4的分?jǐn)?shù)位置的自相關(guān)函數(shù)φaq(i)、偏離整數(shù)滯后int+1/2的分?jǐn)?shù)位置的自相關(guān)函數(shù)φah(i)。
表5多相濾波器系數(shù)Cppf

此外,分別對Lmin-2≤i≤Lmax+2范圍內(nèi)的自變量i,將φint(i)、φdq(i)、φaq(i)、φah(i)中最大的代入到φmax(i)中,進(jìn)行式(7)的處理,求得Lmax-Lmin+1個(gè)的φmax(i)。
φmax(i)=MAX(φint(i)、φdq(i)、φaq(i)、φah(i)) (7)φmax(i)φint(i)、φdq(i)、φaq(i)、φah(i)的最大值I長期預(yù)測系數(shù)的分析區(qū)間(Lmin≤i≤Lmax)Lmin長期預(yù)測系數(shù)的最短分析區(qū)間(=16)Lmax長期預(yù)測系數(shù)的最長分析區(qū)間(-128)φint(i)預(yù)測殘差信號整數(shù)滯后(int)的自相關(guān)函數(shù)φdq(i)預(yù)測殘差信號分?jǐn)?shù)滯后(int-1/4)的自相關(guān)函數(shù)φaq(i)預(yù)測殘差信號分?jǐn)?shù)滯后(int+1/4)的自相關(guān)函數(shù)φah(i)預(yù)測殘差信號分?jǐn)?shù)滯后(int+1/2)的自相關(guān)函數(shù)從求得的(Lmax-Lmin+1)個(gè)的φmax(i)中,由高端順次地選出值大的6個(gè),保存作為音調(diào)候補(bǔ)psel(i)(0≤i≤5),并將線性預(yù)測殘差信號res(i)和音調(diào)第1候補(bǔ)psel(0)輸出到音調(diào)增強(qiáng)濾波器系數(shù)運(yùn)算單元1310,將psel(i)(0≤i≤5)輸出到自適應(yīng)矢量生成單元1319中。
多相系數(shù)存儲單元1309,存儲音調(diào)預(yù)選單元1308用分?jǐn)?shù)滯后精度求出線性預(yù)測殘差信號的自相關(guān)函數(shù)時(shí)和自適應(yīng)矢量生成單元1319用分?jǐn)?shù)精度生成自適應(yīng)矢量時(shí)參照的多相濾波器的系數(shù)。
音調(diào)增強(qiáng)濾波器系數(shù)運(yùn)算單元1310,根據(jù)音調(diào)預(yù)選單元1308中求得的線性預(yù)測殘差和res(i)和從音調(diào)第1候補(bǔ)psel(0),求3次音調(diào)預(yù)測系數(shù)cov(0≤i≤2)。借助使用求得的音調(diào)預(yù)測系數(shù)cov(0≤i≤2)的式(8),求音調(diào)增強(qiáng)濾波器Q(z)的脈沖響應(yīng),并輸出到頻譜加權(quán)濾波器系數(shù)運(yùn)算單元1312和聽覺加權(quán)濾波器系數(shù)運(yùn)算單元1313中。
Q(z)=1+Σi=02cov(i)×λpi×z-psel(0)+i-1---(8)]]>Q(z)音調(diào)增強(qiáng)濾波器的傳遞函數(shù)cov(i)音調(diào)預(yù)測系數(shù)(0≤i≤2)λpi音調(diào)增強(qiáng)常數(shù)(=0.4)psel(0)音調(diào)第1候補(bǔ)LSP內(nèi)插單元1311,首先借助使用在LSP量化/解碼單元1306中求得的當(dāng)前處理幀的解碼LSPωq(i)和以前求得并保持的前處理幀的解碼LSPωq p(i)的式(9),對每個(gè)子幀,求解碼mw插LSPωintp(n,i)(1≤i≤Np)。
ωintp(n,i)=0.4×ωq(i)+0.6×ωqp(i)n=1ωq(i)n=0---(9)]]>ωintp(n,i)第n子幀的內(nèi)插LSPn子幀號碼(=1,2)ωq(i)處理幀的解碼LSPωqp(i)前處理幀的解碼LSP用將求得的ωintp(n,i)變換成LPC,求得解碼內(nèi)插LPCαq(n,i)(1≤i≤Np),并將求得的解碼內(nèi)插LPCαq(n,i)(1≤i≤Np)輸出到頻譜加權(quán)濾波器系數(shù)運(yùn)算單元1312和聽覺加權(quán)LPC合成濾波器系數(shù)運(yùn)算單元1314中。
頻譜加權(quán)濾波器系數(shù)運(yùn)算單元1312構(gòu)成式(10)的MA型頻譜加權(quán)濾波器I(z),將其脈沖響應(yīng)輸出到聽覺加權(quán)濾波器系數(shù)運(yùn)算單元1313中。
I(z)=Σi=1Nfirαfir(i)×z-i---(10)]]>I(z)MA型頻譜加權(quán)濾波器的傳遞函數(shù)NfirI(z)的濾波器次數(shù)(=11)αfir(i)I(z)的脈沖響應(yīng)(1≤i≤Nfir)其中,式(10)的脈沖響應(yīng)αfir(i)(1≤i≤Nfir)是截短到Nfir(=11)項(xiàng)為止的(11)供給的的ARMA型頻譜增強(qiáng)濾波器G(z)的脈沖響應(yīng)。
G(z)=1+Σi=1Npα(n,i)×λmai×z-i1+Σi=1Npα(n,i)×λari×z-i---(11)]]>G(z)頻譜加權(quán)濾波器的傳遞函數(shù)n子幀號碼(=1,2)NpLPC分析次數(shù)(=10)α(n,i)第n子幀的解碼內(nèi)插LSPλmaG(z)的分子常數(shù)(=0.9)λarG(z)的分母常數(shù)(=0.4)聽覺加權(quán)濾波器系數(shù)運(yùn)算單元1313,首先將疊加從頻譜加權(quán)濾波器系數(shù)運(yùn)算單元1312接收到的頻譜加權(quán)濾波器I(z)的脈沖響應(yīng)和從音調(diào)增強(qiáng)濾波器系數(shù)運(yùn)算單元1310接收到的音調(diào)增強(qiáng)濾波器Q(z)的脈沖響應(yīng)的結(jié)果作為脈沖響應(yīng),構(gòu)成聽覺加權(quán)濾波器W(z),并將構(gòu)成的聽覺加權(quán)濾波器W(z)的脈沖響應(yīng)輸出到聽覺加權(quán)LPC合成濾波器系數(shù)運(yùn)算單元1314和聽覺加權(quán)單元1315中。
聽覺加權(quán)LPC合成濾波器系數(shù)運(yùn)算單元1314,利用從LSP內(nèi)插單元1311接收到的解碼內(nèi)插LPCαq(n,i)和從聽覺加權(quán)濾波器系數(shù)運(yùn)算單元1313接收到的聽覺加權(quán)濾波器W(z),由式(12)構(gòu)成聽覺加權(quán)LPC合成濾波器H(z)。
H(z)=11+Σi=1Npαq(n,i)×z-iW(z)---(12)]]>H(z)聽覺加權(quán)合成濾波器的傳遞函數(shù)
NpLPC分析次數(shù)αq(n,i)第n子幀的解碼內(nèi)插LSPn子幀號碼(=1,2)W(z)聽覺加權(quán)濾波器(級聯(lián)I(z)和Q(z)而成)的傳遞函數(shù)將構(gòu)成的聽覺加權(quán)LPC合成濾波器H(z)的系數(shù),輸出到目標(biāo)生成單元A1316、聽覺加權(quán)LPC倒置合成單元A1317、聽覺加權(quán)LPC合成單元A1321、聽覺加權(quán)LPC倒置合成單元B1326和聽覺加權(quán)LPC合成單元B1329中。
聽覺加權(quán)單元1315將從緩沖器1301中讀出的子幀信號輸入到0狀態(tài)的聽覺加權(quán)LPC合成濾波器H(z)中,并以其輸出作為聽覺加權(quán)殘差spw(i)(0≤i≤Ns-1),輸出到目標(biāo)生成單元A1316中。
目標(biāo)生成單元A1316從聽覺加權(quán)單元1315中求得的聽覺加權(quán)殘差spw(i)(0≤i≤Ns-1),減去作為在聽覺加權(quán)LPC合成濾波器系數(shù)運(yùn)算單元1314中求得的聽覺加權(quán)LPC合成濾波器H(z)中輸入0系列時(shí)的輸出的0輸入響應(yīng)Zres(i)(0≤i≤Ns-1)后,所得結(jié)果輸出到LPC倒置合成單元A1317和目標(biāo)生成單元B1325中,作為聲源選擇用的目標(biāo)向量r(i)(0≤i≤Ns-1)。
聽覺加權(quán)LPC倒置合成單元A1317時(shí)間反轉(zhuǎn)地將從目標(biāo)生成單元1316接收到的目標(biāo)系列r(i)(0≤i≤Ns-1)變換排列,并將變換得到的向量輸入到初始狀態(tài)為0的聽覺加權(quán)LPC合成濾波器H(z)中,將其輸出再次時(shí)間反轉(zhuǎn)變換排列,從而得到目標(biāo)系列的時(shí)間反轉(zhuǎn)合成向量rh(k)(0≤k≤Ns-1),并輸出到比較單元A1322中。
自適應(yīng)碼本1318存儲自適應(yīng)矢量生成單元1319生成自適應(yīng)矢量時(shí)參照的過去的驅(qū)動聲源。自適應(yīng)矢量生成單元1319在生成從音調(diào)預(yù)選單元1308接收到的6個(gè)音調(diào)候補(bǔ)psel(j)(0≤j≤5)的同時(shí),生成Nac個(gè)自適應(yīng)矢量Pacb(i,k)(0≤i≤Ns-1、0≤k≤Ns-1、6≤Nac≤24),并輸出到自適應(yīng)/固定選擇單元1320中。具體地說,如表6所示,在16≤psel(j)≤44的場合,對于相當(dāng)于一個(gè)整數(shù)滯后位置的4種分?jǐn)?shù)滯后位置,生成自適應(yīng)矢量,在45≤psel(j)≤64的場合,對于相當(dāng)于一個(gè)整數(shù)滯后位置的2種分?jǐn)?shù)滯后位置,生成自適應(yīng)矢量,在65≤psel(j)≤128的場合,對整數(shù)滯后位置,生成自適應(yīng)矢量。由此,根據(jù)psel(j)(0≤j≤5)的值,自適應(yīng)矢量的候補(bǔ)數(shù)Nac最少為6,最多為24。
表6自適應(yīng)矢量和固定矢量的總數(shù)


此外,生成分?jǐn)?shù)精度的自適應(yīng)矢量時(shí),利用在以整數(shù)精度從自適應(yīng)碼本1318讀出的過去的聲源矢量中,疊加存儲在多相系數(shù)存儲單元1309中的多相濾波器系數(shù)的內(nèi)插處理進(jìn)行。
這里,對應(yīng)于lagf(i)的值的內(nèi)插,是進(jìn)行在lagf(i)=0的場合對應(yīng)于整數(shù)滯后位置、在lagf(i)=1的場合對應(yīng)于從整數(shù)滯后位置偏離-1/2的分?jǐn)?shù)滯后位置、在lagf(i)=2的場合對應(yīng)于從整數(shù)滯后位置偏離+1/4的分?jǐn)?shù)滯后位置、在lagf(i)=3的場合對應(yīng)于從整數(shù)滯后位置偏離-1/4的分?jǐn)?shù)滯后位置的內(nèi)插。
自適應(yīng)/固定選擇單元1320,首先接受自適應(yīng)矢量生成單元1319生成的Nac(6~24)一個(gè)候補(bǔ)的自適應(yīng)矢量,并輸出到聽覺加權(quán)LPC合成單元A1321和比較單元A1322中。
比較單元A1322,首先為了適應(yīng)矢量生成單元1319生成的自適應(yīng)矢量Pacb(i,k)(0≤i≤Ns-1、0≤k≤Ns-1、6≤Nac≤24)從Nac(6~20)個(gè)候補(bǔ)中預(yù)先Nacb(=4)個(gè)候補(bǔ),利用式(13)求得由聽覺加權(quán)LPC倒置合成單元1317受理的目標(biāo)矢量的時(shí)間反轉(zhuǎn)合成矢量rh(k)(0≤k≤Ns-1)和自適應(yīng)矢量Pacb(i,k)的內(nèi)積prac(i)。
prac(i)=Σk=0Ns-1Pacb(i,k)×rh(k)---(13)]]>
prac(i)自適應(yīng)矢量預(yù)選基準(zhǔn)值Nac(i)預(yù)選后自適應(yīng)矢量候補(bǔ)數(shù)(=6~24)i自適應(yīng)矢量的號碼(0≤i≤Nac-1)Pacb(i,k)自適應(yīng)矢量rh(k)目標(biāo)矢量r(k)的時(shí)間反轉(zhuǎn)合成矢量比較求得的內(nèi)積prac(i),選擇其值變大時(shí)的標(biāo)號和以該標(biāo)號作為引數(shù)時(shí)的內(nèi)積(直到高端第Nacb(=4)個(gè)為止,并分別作為自適應(yīng)矢量預(yù)選后標(biāo)號apsel(j)(0≤j≤Nacb-1)和自適應(yīng)矢量預(yù)選后基準(zhǔn)值prac(apsel(j))進(jìn)行保存,而且將自適應(yīng)矢量預(yù)選后標(biāo)號apsel(j)(0≤j≤Nacb-1)輸出到自適應(yīng)/固定選擇單元1320中。
聽覺加權(quán)LPC合成單元A1321對通過在自適應(yīng)矢量生成單元1319中生成的自適應(yīng)/固定選擇單元1320的預(yù)選后自適應(yīng)矢量Pacb(apsel(j),k),施行聽覺加權(quán)LPC合成,生成合成自適應(yīng)矢量SYNacb(apsel(j),k),并輸出到比較單元A1322中。接著,比較單元A1322為了對其自身已預(yù)選的Nacb(=4)個(gè)的預(yù)選后適應(yīng)矢量Pacb(apsel(j),k)進(jìn)行正式選擇,由式(14)求出自適應(yīng)矢量正式選擇基準(zhǔn)值sacbr(j)。
sacbr(j)=prac2(apdel(j))Σk=0Ns-1SYNacb2(j,k)---(14)]]>sacbr(j)自適應(yīng)矢量正大選擇基準(zhǔn)值prac()自適應(yīng)矢量預(yù)選后基準(zhǔn)值apsel(j)自適應(yīng)矢量預(yù)選標(biāo)號k矢量次數(shù)(0≤k≤Ns-1)j被預(yù)選的自適應(yīng)矢量的標(biāo)號的號碼(0≤j≤Nacb-1)Ns子幀長(=52)Nacb自適應(yīng)矢量的預(yù)選數(shù)SYNacb(J,K)合成自適應(yīng)矢量分別用式(14)的值增大時(shí)的標(biāo)號和以該標(biāo)號作為引數(shù)時(shí)的式(14)的值,作為自適應(yīng)矢量正大選擇后標(biāo)號ASEL和自適應(yīng)矢量正式選擇后基準(zhǔn)值sacbr(ASEL),并輸出到自適應(yīng)/固定選擇單元1320中。
固定碼本1323對固定矢量讀出單元1324讀出的矢量存儲Nfc(=16)個(gè)候補(bǔ)。這里,比較單元A1322為了對從固定矢量讀出單元1324讀出的固定矢量Pfcb(i,k)(0≤i≤Nfc-1、0≤k≤Ns-1),從Nfc(=16)個(gè)候補(bǔ)中預(yù)選Nfcb(=2)個(gè)候補(bǔ)、利用式(15)求出由聽覺加權(quán)LPC倒置合成單元A1317受理的目標(biāo)矢量的時(shí)間反轉(zhuǎn)合成矢量rh(k)(0≤k≤Ns-1)和固定矢量Pfcb(i,k)的內(nèi)積的絕對值|prfc(i)|。
|prfc|=Σk=0Ns-1Pfcb(i,k)×rh(k)---(15)]]>|prfc(i)|固定矢量預(yù)選基準(zhǔn)值k矢量的要素號碼(0≤k≤Ns-1)I固定矢量的號碼(0≤i≤Nfc-1)Nfc固定矢量數(shù)(=16)Pfcb(i,k)固定矢量rh(k)目標(biāo)矢量r(k)的時(shí)間反轉(zhuǎn)合成矢量比較式(15)的值|prac(i)|,選擇其值變大時(shí)的標(biāo)號和以該標(biāo)號作為引數(shù)時(shí)的內(nèi)積的絕對值(直到高端第Nfcb(=2)為止),并分別作為固定矢量預(yù)選后標(biāo)號fpsel(j)(0≤j≤Nfcb-1)和固定矢量預(yù)選后基準(zhǔn)值|prfc(fpsel(j))|進(jìn)行保存,而且將固定矢量預(yù)選后標(biāo)號fpsel(j)(0≤j≤Nfcb-1)輸出到自適應(yīng)/固定選擇單元1320中。
聽覺加權(quán)LPC合成單元A1321,對通過在固定矢量讀出單元1324中讀出的自適應(yīng)/固定選擇單元1320的預(yù)選后固定矢量Pfcb(fpsel(j),k),施行聽覺加權(quán)LPC合成,生成合成固定矢量SYNfcb(fpsel(j),k),并輸出到比較單元A1322中。
接著,比較單元A1322為了從其自身預(yù)選的Nfcb(=2)個(gè)的預(yù)選后固定矢量Pfcb(fpsel(j),k)中正式選擇最佳固定矢量,由式(16)求出固定矢量正式選擇基準(zhǔn)值sfcbr(j)。
sfcbr(j)=|prfc(fpsel(j))|2Σk=0Ns-1SYNfcb2(j,k)---(16)]]>sfcbr(j)固定矢量正式選擇基準(zhǔn)值
|prfc()|固定矢量預(yù)選后基準(zhǔn)值fpsel(j)固定矢量預(yù)選后標(biāo)號(0≤j≤Nfcb-1)k矢量的要素號碼(0≤k≤Ns-1)j被預(yù)選的固定矢量的號碼(0≤j≤Nfcb-1)Ns子幀長(=52)Nacb固定矢量的預(yù)選數(shù)(=2)SYNacb(J,K)合成固定矢量分別用式(16)的值增大時(shí)的標(biāo)號和以該標(biāo)號作為引數(shù)時(shí)的式(16)的值,作為固定矢量正式選擇后標(biāo)號FSEL和固定矢量正式選擇后基準(zhǔn)值facbr(FSEL),并輸出到自適應(yīng)/固定選擇單元1320中。
自適應(yīng)/固定選擇單元1320利用從比較單元A1322收到的prac(ASEL)、sacbr(ASEL)、|prfc(FSEL)|和sfcbr(FSEL)的大小和正負(fù)關(guān)系(記載在式(17)中),選擇正式選擇后自適應(yīng)矢量或正式選擇后固定矢量,作為自適應(yīng)/固定矢量AF(k)(0≤k≤Ns-1)。
AF(k)=Pacb(ASEL,k)sacbr(ASEL)≥sfcbr(FSEL),prac(ASEL)>00sacbr(ASEL)≥sfcbr(FSEL),prac(ASEL)≤0Pfcb(FSEL,k)sacbr(ASEL)<sfcbr(FSEL),prac(ASEL)≥0-Pfcb(FSEL,k)sacbr(ASEL)<sfcbr(FSEL),prac(ASEL)<0---(17)]]>AF(k)自適應(yīng)/固定矢量ASEL自適應(yīng)矢量正式選擇后標(biāo)號FSEL固定矢量正式選擇后標(biāo)號k矢量的要素號碼Pacb(ASEL,k)正式選擇后自適應(yīng)矢量Pfcb(FSEL,k)正式選擇后固定矢量sacbr(ASEL)自適應(yīng)矢量正式選擇后基準(zhǔn)值sfcbr(FSEL)固定矢量正式選擇后基準(zhǔn)值prac(ASEL)自適應(yīng)矢量預(yù)選后基準(zhǔn)值prfc(FSEL)固定矢量預(yù)選后基準(zhǔn)值將選擇的自適應(yīng)/固定矢量AF(k)輸出到聽覺加權(quán)LPC合成濾波器單元A1321中,將表示生成選擇的自適應(yīng)/固定矢量AF(k)的號碼的標(biāo)號作為自適應(yīng)/固定標(biāo)號AFSEL輸出到參數(shù)編碼單元1331中。此外,這里因設(shè)計(jì)成自適應(yīng)矢量和固定矢量的總矢量數(shù)為255個(gè)(參照表6),所以自適應(yīng)/固定標(biāo)號AFSEL為8位編碼。
聽覺加權(quán)LPC合成濾波器單元A1321對在自適應(yīng)/固定選擇單元1320中選擇的自適應(yīng)/固定矢量AF(k),施行聽覺加權(quán)LPC合成濾波,生成合成自適應(yīng)/固定矢量SYNaf(k)(0≤k≤Ns-1),并輸出到比較單元1322中。
比較單元1322,首先利用式(18)求出從聽覺加權(quán)LPC合成濾波器單元A1321收到的合成自適應(yīng)/固定矢量SYNaf(k)(0≤k≤Ns-1)的功率powp。
powp=Σk=0Ns-1SYNaf2(k)---(18)]]>powp自適應(yīng)/固定矢量(SYNaf(k))的功率k矢量的要素號碼(0≤k≤Ns-1)Ns子幀長(=52)SYNaf(k)自適應(yīng)/固定矢量接著,由式(19)求出從目標(biāo)生成單元A1316收到的目標(biāo)矢量和合成自適應(yīng)/固定矢量SYNaf(k)的內(nèi)積pr。
pr=Σk=0Ns-1SYNaf(k)×r(k)---(19)]]>prSYNaf(k)和r(k)的內(nèi)積Ns子幀長(=52)SYNaf(k)自適應(yīng)/固定矢量r(k)目標(biāo)矢量k矢量的要素號碼(0≤k≤Ns-1)進(jìn)而,將由從自適應(yīng)/固定選擇單元1320收到的自適應(yīng)/固定矢量AF(k)輸出到自適應(yīng)碼本更新單元1333中,計(jì)算AF(k)的功率POWaf,將合成自適應(yīng)/固定矢量SYNaf(k)和POWaf輸出到參數(shù)編碼單元1331中,并將powp和pr以及rh(k)輸出到比較單元B1330中。
目標(biāo)生成單元B1325,從目標(biāo)生成單元A1316收到的聲源選擇用的目標(biāo)矢量r(i)(0≤k≤Ns-1)減去從比較單元A1322收到的合成自適應(yīng)/固定矢量SYNaf(k)(0≤k≤Ns-1),生成新的目標(biāo)矢量,并將生成的新的目標(biāo)矢量輸出到聽覺加權(quán)LPC倒置合成單元B1326中。
聽覺加權(quán)LPC倒置合成單元B1326對目標(biāo)生成單元B1325中生成的新的目標(biāo)矢量,進(jìn)行時(shí)間反轉(zhuǎn)排列變換,并將該變換后的矢量輸入到0狀態(tài)的聽覺加權(quán)LPC合成濾波器中,再次對該輸出向量進(jìn)行時(shí)間反轉(zhuǎn)排列變換,生成新的目標(biāo)矢量的時(shí)間反轉(zhuǎn)合成矢量ph(k)(0≤k≤Ns-1),并輸出到比較單元B1330中。
聲源矢量生成裝置1337使用與例如實(shí)施形態(tài)3中說明了的聲源矢量生成裝置70相同的裝置。聲源矢量生成裝置70從振種存儲單元71讀出第1個(gè)振種,輸入到非線性數(shù)字濾波器72中,并生成噪聲矢量。將在聲源矢量生成裝置70生成的噪聲矢量輸出到聽覺加權(quán)LPC合成單元B1329和比較單元B1330中。接著,從振種存儲單元71輸入到讀出第2個(gè)振種,輸入到非線性數(shù)字濾波器72中,生成噪聲矢量,并輸出到聽覺加權(quán)LPC合成單元B1329和比較單元B1330中。
較單元B1330為了對根據(jù)第1振種生成的噪聲矢量,從Nst(=64)個(gè)候補(bǔ)中預(yù)選Nstb(=6)個(gè)候補(bǔ),由式(20)求出第1噪聲矢量預(yù)選基準(zhǔn)值cr(i1)(0≤i1≤Nstb1-1))。
cr(i1)=Σj=0Ns-1Psrb1(i1j)×rh(j)-prpowpΣj=0Ns-1Psrb1(i1j)×ph(j)---(20)]]>cr(i1)第1噪聲矢量預(yù)選基準(zhǔn)值Ns子幀長(=52)rh(j)目標(biāo)矢量(rh(j))的時(shí)間反轉(zhuǎn)合成矢量powp自適應(yīng)/固定矢量(SYNaf(k))的功率prSYNaf(k)和r(k)的內(nèi)積Pstb1(i1,j)第1噪聲矢量ph(j)SYNaf(k)的時(shí)間反轉(zhuǎn)合成矢量i1第1噪聲矢量的號碼(0≤i1≤Nst-1)j矢量的要素號碼比較求得的cr(i1)d1值,選擇其值變大時(shí)的標(biāo)號和以該標(biāo)號作為引數(shù)時(shí)的式(20)的值(直到高端第Nstb(=6)個(gè)為止),分別作為第1噪聲矢量預(yù)選后標(biāo)號s1psel(j1)(0≤j1≤Nstb-1)和預(yù)選后第1噪聲矢量Pstb1(s1psel(j1),k)(0≤j1≤Nstb-1,0≤k≤Ns-1))進(jìn)行保存。接著,對于第2噪聲矢量也進(jìn)行與第1噪聲矢量相同的處理,分別作為第2噪聲矢量預(yù)選后標(biāo)號s2psel(j2)(0≤j2≤Nstb-1)和預(yù)選后第2噪聲矢量Pstb1(s2pse2(j2),k)(0≤j2≤Nstb-1,0≤k≤Ns-1))進(jìn)行保存。
聽覺加權(quán)LPC合成單元B1329,對預(yù)選后第1噪聲矢量Pstb1(s1psel(j1),k),施行聽覺加權(quán)LPC合成,生成合成第1噪聲矢量SYNstb1(s1psel(j1),k),并輸出到比較單元B1330中。接著,對預(yù)選后第2噪聲矢量Pstb2(s2psel(j2),k),施行聽覺加權(quán)LPC合成,生成合成第2噪聲矢量SYNstb2(s2psel(j2),k),并輸出到比較單元B1330中。
比較單元B1330為了對其自身預(yù)選的預(yù)選后第1噪聲矢量和預(yù)選后第2噪聲矢量進(jìn)行正式選擇,對在聽覺加權(quán)LPC合成單元B1329中計(jì)算的合成第1噪聲矢量SYNstb1(s1psel(j1),k),進(jìn)行式(21)的計(jì)算。
SYNOstb1(s1psel(j1),k)=SYNstb1(s1psel(j1),k)-SYNaf(j1)powpΣk=0Ns-1Pstb1(s1psel(j1),k)×ph(k)---(21)]]>SYNOstb1(s1psel(j1),k)=(21)SYNOstb1(s1psel(j1),k)正交化合成第1噪聲矢量SYNstb1(s1psel(j1),k)合成第1噪聲矢量Pstb1(s1psel(j1),k)預(yù)選后第1噪聲矢量SYNaf(j)自適應(yīng)/固定矢量powp自適應(yīng)/固定矢量(SYNaf(j))的功率Ns子幀長(=52)ph(k)SYNaf(j)的時(shí)間反轉(zhuǎn)合成矢量j1預(yù)選后第1噪聲矢量的號碼k矢量的要素號碼(0≤k≤Ns-1)求出正交化合成第1噪聲矢量SYNOstb1(s1psel(j1),k)后,對合成第2噪聲矢量SYNOstb2(s2psel(j2),k)也進(jìn)行同樣的計(jì)算,求出正交化合成第2噪聲矢量SYNOstb2(s2psel(j2),k),并分別用式(22)和式(23),對((s1psel(j1),s2psel(j2))的全部組合(36項(xiàng)),以閉環(huán)方式計(jì)算第1噪聲矢量本選擇基準(zhǔn)值scr1和第2噪聲矢量本選擇基準(zhǔn)值scr2。
scr1=cscr12Σk=0Ns-1[SYNOstb1(s1psel(j1),k)+SYNOstb2(s2psel(j2),k)]2---(22)]]>scr1第1噪聲矢量本選擇基準(zhǔn)值c scr1由式(24)事先計(jì)算的常數(shù)SYNOstb1(s1psel(j1),k)正交合成第1噪聲矢量SYNOstb2(s2psel(j2),k)正交合成第2噪聲矢量r(k)目標(biāo)矢量s1psel(j1),k第1噪聲矢量預(yù)選后標(biāo)號s2psel(j2),k第2噪聲矢量預(yù)選后標(biāo)號Ns子幀長(=52)k矢量的要素號碼scr2=cscr22Σk=0Ns-1[SYNOstb1(s1psel(j1),k-SYNOstb2(s2psel(j2),k)]2---(23)]]>scr2第2噪聲矢量本選擇基準(zhǔn)值c scr1由式(25)事先計(jì)算的常數(shù)SYNOstb1(s1psel(j1),k)正交合成第1噪聲矢量SYNOstb2(s2psel(j2),k)正交合成第2噪聲矢量r(k)目標(biāo)矢量s1psel(j1),k第1噪聲矢量預(yù)選后索引s2psel(j2),k第2噪聲矢量預(yù)選后標(biāo)號Ns子幀長(=52)k矢量的要素號碼其中,式(22)中的cs1cr和式(23)中的cs2cr,分別是由式(24)和式(25)預(yù)先計(jì)算的常數(shù)
cscr1=Σk=0Ns-1SYNOstb1(s1psel(j1),k)×r(k)+Σk=0Ns-1SYNOstb2(s2psel(j2),k)×r(k)---(24)]]>cscr1式(22)用常數(shù)SYNOstb1(s1psel(j1),k)正交合成第1噪聲矢量SYNOstb2(s2psel(j2),k)正交合成第2噪聲矢量r(k)目標(biāo)矢量s1psel(j1),k第1噪聲矢量預(yù)選后標(biāo)號s2psel(j2),k第2噪聲矢量預(yù)選后標(biāo)號Ns子幀長(=52)k矢量的要素號碼cscr1=Σk=0Ns-1SYNOstb1(s1psel(j1),k)×r(k)-Σk=0Ns-1SYNOstb2(s2psel(j2),k)×r(k)---(25)]]>cscr2式(23)用常數(shù)SYNOstb1(s1psel(j1),k)正交合成第1噪聲矢量SYNOstb2(s2psel(j2),k)正交合成第2噪聲矢量r(k)目標(biāo)矢量s1psel(j1),k第1噪聲矢量預(yù)選后標(biāo)號s2psel(j2),k第2噪聲矢量預(yù)選后標(biāo)號Ns子幀長(=52)k矢量的要素號碼比較單元B1330進(jìn)一步將s1cr的最大值代入到MAXs1cr中、將s2cr的最大值代入到MAXs2cr中,并用MAXs1cr和MAXs2cr中大的一個(gè)作為scr,將求得到scr時(shí)參照的s1psel(j1)的值作為第1噪聲矢量正式選擇后標(biāo)號SSEL1,輸出到參數(shù)編碼單元1331中。保存對應(yīng)于SSEL1的噪聲矢量作為正式選擇后第1噪聲矢量Pstb1(SSEL1,k),求出對應(yīng)于Pstb1(SSEL1,k)的本選擇后合成第1噪聲矢量SYNstb1(SSEL1,k)(0≤k≤Ns-1),并輸出到參數(shù)編碼單元1331中。
同樣,將求得scr時(shí)參照的s2psel(j2)的值作為第2噪聲矢量正式選擇后標(biāo)號SSEL2輸出到參數(shù)編碼單元1331中,而且保存對應(yīng)于SSEL2的噪聲矢量作為正式選擇后第2噪聲矢量Pstb2(SSEL2,k),求出對應(yīng)于Pstb2(SSEL2,k)的正式選擇后合成第2噪聲矢量SYNstb2(SSEL2,k)(0≤k≤Ns-1),并輸出到參數(shù)編碼單元1331中。
比較單元B1330進(jìn)一步求出分別乘以Pstb1(SSEL1,k)和Pstb2(SSEL2,k)的符號S1和S2,并以求得的S1和S2的正負(fù)信息作為增益正負(fù)標(biāo)號Is1s2(2位信息),輸出到參數(shù)編碼單元1331中。
(S1,S2)=(+1,+1)sxr1≥scr2,cscr1≥0(-1,-1)scr1≥scr2,cscr1<0(+1,-1)scr1<scr2,cscr2≥0(-1,+1)scr1<scr2,cscr2<0---(26)]]>S1正式選擇后第1噪聲矢量的符號S2正式選擇后第2噪聲矢量的符號scr1式(22)的輸出scr2式(23)的輸出cscr1式(24)的輸出cscr2式(25)的輸出在根據(jù)式(27)生成噪聲矢量ST(k)(0≤k≤Ns-1),并輸出到自適應(yīng)碼本更新單元1333中的同時(shí),求出其功率POWsf,并輸出到參數(shù)編碼單元1331中。
ST(k)=S1×Pstb1(SSEL1,k)÷S2×Pstb2(SSEL2,k) (27)ST(k)隨機(jī)矢量S1正式選擇后第1噪聲矢量的符號S2正式選擇后第2噪聲矢量的符號Pstb1(SSEL1,k)正式選擇后第1級確定的矢量Pstb2(SSEL2,k)正式選擇后第2級確定的矢量SSEL1第1噪聲矢量正式選擇后標(biāo)號SSEL2第2噪聲矢量正式選擇后標(biāo)號k矢量的要素號碼(0≤k≤Ns-1)根據(jù)式(28)生成合成噪聲矢量SYNst(k)(0≤k≤Ns-1),并輸出到參數(shù)編碼單元1331中。
SYNst(k)=S1×SYNstb1(SSEL1,k)÷S2×SYNstb2(SSEL2,k)(28)SYNst(k)合成隨機(jī)的矢量S1正式選擇后第1噪聲矢量的符號S2正式選擇后第2噪聲矢量的符號SYNstb1(SSEL1,k)正式選擇后合成第1噪聲矢量SYNstb2(SSEL2,k)正式選擇后合成第2噪聲矢量k矢量的要素號碼(0≤k≤Ns-1)參數(shù)編碼單元1331,首先根據(jù)利用在幀功率量化/解碼單元1302中求得的解碼幀功率spow、以及音調(diào)預(yù)選單元1308中求得的歸一化預(yù)測殘差功率resid的式(29),求出子幀推定殘差功率rs。
rs=Ns×spow×resid(29)rs子幀推定殘差功率Ns子幀長(=52)spow解碼幀功率resid歸一化預(yù)測殘差功率使用求得的子幀推定殘差功率rs、比較單元A1322中計(jì)算的自適應(yīng)/固定矢量的功率POWaf,比較單元B1330中求得的噪聲矢量的功率POWst、表7所示的增益量化表存儲單元1332中存儲的256字的增益量化用表(CGaf[i]、CGst[i])(0≤i≤127)等,根據(jù)式(30)求出量化增益選擇基準(zhǔn)值STDg。
表7增益量化用表


STDg=Σk=0Ns-1(rsPOWaf·CGaf(Ig)×SYNaf(k)+rsPOWst·CGst(Ig)×SYNst(k)-r(k))2---(30)]]>STDg量化增益選擇基準(zhǔn)值rs子幀推定殘差功率POWaf自適應(yīng)/固定矢量的功率POWst噪聲矢量的功率i增益量化表的標(biāo)號(0≤i≤127)CGaf(i)增益量化表中自適應(yīng)/固定矢量欄的組成部分CGat(i)增益量化表中噪聲矢量欄的組成部分SYNaf(k)合成自適應(yīng)/固定矢量SYNat(k)合成噪聲矢量r(k)目標(biāo)矢量Ns子幀長(=52)k矢量的要素號碼(0≤k≤Ns-1)借助使用選擇1個(gè)求得的量化增益選擇基準(zhǔn)值STDg為最小時(shí)的標(biāo)號,作為增益量化標(biāo)號Ig,以選擇的增益量化標(biāo)號Ig為基礎(chǔ)從增益量化用表讀出的自適應(yīng)/固定矢量欄的選擇后增益CGaf(Ig),以及以選擇的增益量化標(biāo)號Ig為基礎(chǔ)從增益量化用表讀出的噪聲矢量側(cè)選擇后增益CGst(Ig)等的式(31),求出在AF(k)中實(shí)際用的自適應(yīng)/固定矢量方面的正式增益Gaf和在ST(k)中實(shí)際用的噪聲矢量方面的正式增益Gst,并輸出到自適應(yīng)碼本更新單元1333中。
Gaf自適應(yīng)/固定矢量側(cè)本增益Gst噪聲矢量側(cè)本增益rsrs子幀推定殘差功率
POWaf自適應(yīng)/固定矢量的功率POWst噪聲矢量的功率CGaf(Ig)固定/適應(yīng)矢量方面的功率CGst(Ig)噪聲矢量方面的功率Ig增益量化標(biāo)號參數(shù)編碼單元1331收集在幀功率量化和解碼單元1302中求得的功率標(biāo)號Ipow、在LSP量化和解碼單元1306中求得的LSP碼I1sp、在自適應(yīng)/固定選擇單元1320中求得的自適應(yīng)/固定標(biāo)號AFSEL、在比較單元B1330中求得的第1噪聲矢量正式選擇后標(biāo)號SSEL1和第2噪聲矢量正式選擇后標(biāo)號SSEL2以及增益正負(fù)標(biāo)號Is1s2、在參數(shù)編碼單元1331自身中求得的增益量化標(biāo)號Ig,作為聲音碼,并將收集到的聲音碼輸出到傳送單元1334中。
自適應(yīng)碼本更新單元1333,進(jìn)行對比較單元A1322中求得的自適應(yīng)/固定矢量AF(k)和比較單元B1330中求得的噪聲矢量ST(k)分別乘以用參數(shù)編碼單元1331求得的自適應(yīng)/固定矢量正式增益Gaf和噪聲矢量正式噪聲Gst后進(jìn)行相加的式(32)的處理,生成驅(qū)動聲源ex(k)(0≤k≤Ns-1),并將生成的驅(qū)動聲源ex(k)(0≤k≤Ns-1)輸出到自適應(yīng)碼本1318中。
ex(k)=Gaf×AF(k)+Gst*ST(k)(32)ex(k)驅(qū)動聲源AF(k)thd適應(yīng)固定矢量ST(k)噪聲矢量的增益k矢量的要素號碼(0≤k≤Ns-1)這時(shí),用由thd適應(yīng)碼本更新單元1333收到的新驅(qū)動聲源ex(k),更新自適應(yīng)碼本1318內(nèi)舊的驅(qū)動聲源。
實(shí)施形態(tài)8下面,對在以作為數(shù)字便攜電話的聲音編碼/解碼標(biāo)準(zhǔn)方式的PSI-CELP開發(fā)的聲音解碼裝置中,用前述實(shí)施形態(tài)1~實(shí)施形態(tài)6說明了的聲源矢量生成裝置的實(shí)施形態(tài)進(jìn)行說明。這種解碼裝置是與前述的實(shí)施形態(tài)7配對的裝置。
圖14表示與實(shí)施形態(tài)8相關(guān)的聲音解碼裝置的功能方框圖。參數(shù)解碼單元1402通過傳送單元1401獲得從圖13所述的CELP型聲音編碼裝置送來的聲音編碼(功率標(biāo)號Ipow、LSP碼I1sp、自適應(yīng)/固定標(biāo)號AFSEL、第1噪聲矢量正式選擇后標(biāo)號SSEL1、第2噪聲矢量正式選擇后標(biāo)號SSEL2、增益量化標(biāo)號Ig、增益正負(fù)標(biāo)號Is1s2)。
接著,從存儲在功率量化表存儲單元1405中的功率量化用表(參照表3)讀出功率標(biāo)號Ipow所示的標(biāo)量值,并作為解碼幀功率spow輸出到功率復(fù)原單元1417中,從存儲在LSP量化表存儲單元1404中的LSP量化用表讀出LSP編碼I1sp的所示的矢量,并作為解碼LSP輸出到LSP內(nèi)插單元1406中。將自適應(yīng)/固定標(biāo)號AFSEL輸出到自適應(yīng)矢量生成單元1408固定矢量讀出單元1411以及自適應(yīng)/固定選擇單元1412中,將第1噪聲矢量正式選擇后標(biāo)號SSEL1和第2噪聲矢量正式選擇后標(biāo)號SSEL2輸出到聲源矢量生成裝置1414中。從存儲在增益量化表存儲單元1403中的增益量化用表(參照表7)讀出增益量化索引Ig。所示的矢量(CAaf(Ig),CGst(Ig)),與編碼裝置側(cè)相同,根據(jù)式(31)求出在AF(k)中實(shí)際用的自適應(yīng)/固定矢量正式增益Gaf和在ST(k)中實(shí)際用的噪聲矢量正式增益Gst,并將求得的自適應(yīng)/固定矢量正式增益Gaf和噪聲矢量正式增益Gst與增益正負(fù)標(biāo)號Is1s2一起輸出到驅(qū)動聲源生成單元1413中。
LSP內(nèi)插單元1406用與編碼裝置相同的方法,根據(jù)從參數(shù)編碼單元1402收到的解碼LSP對每一子幀求出解碼內(nèi)插LSPωintp(n,i)(0≤i≤Np),用求得的LSPωintp(n,i)變換成LPC,從而得到解碼內(nèi)插LPC,并將得到的解碼內(nèi)插LPC輸出到LPC合成濾波器單元1413中。
自適應(yīng)矢量生成單元1408根據(jù)從參數(shù)解碼單元1402收到的自適應(yīng)/固定標(biāo)號AFSEL,在從自適應(yīng)碼本1407讀出的矢量上疊加存儲在多相系數(shù)存儲單元1409中的多相系數(shù)(參照表5)的一部分,生成分?jǐn)?shù)滯后精度的自適應(yīng)矢量,并輸出到自適應(yīng)/固定選擇單元1412中。固定矢量讀出單元1411根據(jù)從參數(shù)解碼單元1402收到的自適應(yīng)/固定標(biāo)號AFSEL,從固定碼本1410讀出固定矢量,并輸出到自適應(yīng)/固定選擇單元1412中。
自適應(yīng)/固定選擇單元1412根據(jù)從參數(shù)解碼單元1402收到的自適應(yīng)/固定標(biāo)號AFSEL,選擇從自適應(yīng)矢量生成單元1408輸入的自適應(yīng)矢量或從固定矢量讀出單元1411輸入的固定矢量作為自適應(yīng)/固定矢量AF(k),并將被選擇的自適應(yīng)/固定矢量AF(k)輸出到驅(qū)動聲源生成單元1413中。聲源矢量生成裝置1414根據(jù)從由參數(shù)解碼單元1402收到的第1噪聲矢量正式選擇后標(biāo)號SSEL1和第2噪聲矢量正式選擇后標(biāo)號SSEL2,從振種存儲單元71取出第1振種和第2振種,輸入到非線性數(shù)字濾波器72中,分別發(fā)生第1噪聲矢量和第2噪聲矢量。這樣,在重現(xiàn)的第1噪聲矢量和第2噪聲矢量上分別乘以增益正負(fù)標(biāo)號的第1級信息S1和第2級信息S2,生成聲源矢量ST(k),并將生成的聲源矢量輸出到驅(qū)動聲源生成單元1413中。
驅(qū)動聲源生成單元1413在從自適應(yīng)/固定選擇單元1412收到的自適應(yīng)/固定矢量AF(k)和從聲源矢量生成裝置1414收到的聲源矢量ST(k)上分別乘以在參數(shù)編碼單元1402求出的自適應(yīng)/固定矢量正式增益Gaf和噪聲矢量正式增益Gst后,根據(jù)增益正負(fù)標(biāo)號Is1s2進(jìn)行相加或者相減,得到驅(qū)動聲源ex(k),并將得到驅(qū)動器聲源輸出到LPC合成濾波器14136和自適應(yīng)碼本1407中。在這里,用從驅(qū)動聲源生成單元1413輸入的新的驅(qū)動聲源更新自適應(yīng)碼本1407內(nèi)的舊的驅(qū)動聲源。
LPC合成濾波器1416對在驅(qū)動聲源生成單元1413生成的驅(qū)動聲源,采用以從LSP內(nèi)插入單元1406收到的解碼內(nèi)插LPC構(gòu)成的合成濾波器進(jìn)行LPC合成,并將濾波器的輸出送到功率復(fù)原單元1417中。功率復(fù)原單元1417首先求出在LPC合成濾波器單元1413求得的驅(qū)動聲源合成矢量的平均功率,接著用將從參數(shù)解碼單元1402收到的解碼功率spow除以求得的平均功率,并將所得結(jié)果與驅(qū)動聲源的合成矢量乘,從而生成合成話音518。
實(shí)施形態(tài)9圖15表示與實(shí)施形態(tài)9相關(guān)的聲音編碼裝置的主要部分的方框圖。這種聲音編碼裝置是在圖13所示的聲音編碼裝置上增加量化對象LSP增加單元151LSP量化/解碼單元152和LSP量化誤差比較單元153,或者變更一部分功能。
LPC分析單元1304對緩存器1301內(nèi)的處理幀進(jìn)行線性預(yù)測分析并得到LPC后,對得到的LPC進(jìn)行變換生成量化對象LSP,并將生成的量化對象LSP輸出到量化對象LSP增加單元151中。具體地說,兼?zhèn)鋵彺嫫鲀?nèi)的首讀區(qū)間進(jìn)行線性預(yù)測分析,得到對首讀區(qū)間的LPC后,對得到的LPC進(jìn)行變換,生成對先讀區(qū)間的LSP,并輸出到量化對象LSP增加單元151中的功能。
量化對象LSP增加單元151借助LPC分析單元1304中變換處理幀的LPC,除直接得到的量化對象LSP以外,還生成多個(gè)量化對象LSP。
LSP量化表存儲單元1307存儲LSP量化/解碼單元152參照的量化表,LSP量化/解碼單元152對生成的量化對象LSP進(jìn)行量化和解碼,生成各自的解碼LSP。
LSP量化誤差比較單元153對生成的多個(gè)解碼LSP進(jìn)行比較,以閉環(huán)的方式選擇1個(gè)異常噪聲最少的解碼LSP,并將選擇的解碼LSP作為對于處理幀的解碼LSP重新采用。
圖16表示量化對象LSP增加部分151的方框圖。
量化對象LSP增加部分151由存儲LPC分析單元1304中所求處理幀的量化對象LSP的當(dāng)前幀LSP存儲單元161、存儲LPC分析單元1304中求出的首讀區(qū)間的LSP的首讀區(qū)間LSP存儲單元162、存儲前處理幀的解碼LSP的前幀LSP存儲單元163和對于從前述3個(gè)存儲單元讀出的LSP進(jìn)行線性內(nèi)插計(jì)算、并增加多個(gè)量化對象LSP的線性內(nèi)插單元164構(gòu)成。
對處理幀的量化對象LSP、首讀區(qū)間的LSP以及前處理幀的解碼LSP,進(jìn)行線性內(nèi)插計(jì)算,增加多個(gè)生成量化對象LSP,并將生成的量化對象LSP輸出到全部LSP量化/解碼單元152中。
這里,對量化對象LSP增加單元151進(jìn)一步詳細(xì)地進(jìn)行說明。LPC分析單元1304,對緩存器內(nèi)的處理幀進(jìn)行線性預(yù)測分析,得到預(yù)測次數(shù)Np(=10)次的LPCα(i)(0≤i≤Np),對得到的LPC進(jìn)行變換生成量化對象LSPω(i)(0≤i≤Np),并將生成的量化對象LSPω(i)(0≤i≤Np)存儲到量化對象LSP增加單元151內(nèi)的當(dāng)前幀LSP存儲單元161中。此外,對緩存器內(nèi)的首讀區(qū)間進(jìn)行線性預(yù)測分析,得到對首讀區(qū)間的LPC,變換得到的首讀區(qū)間的LPC,生成對首讀區(qū)間的LSPω(i)(0≤i≤Np),并將生成的首讀區(qū)間的LSPω(i)(0≤i≤Np)在儲在量化對象LSP增加單元151內(nèi)的首讀區(qū)間LSP存儲單元162中。
接著,線性內(nèi)插單元164分別從當(dāng)前幀LSP存儲單元161讀出對應(yīng)于處理幀的量化對象LSPω(i)(0≤i≤Np),從首讀區(qū)間LSP存儲單元162讀出對應(yīng)于首讀區(qū)間的LSPωf(i)(0≤i≤Np),從前幀LSP存儲單元163讀出對應(yīng)于前處理幀的解碼LSPωqp(i)(0≤i≤Np),借助于進(jìn)行式(33)所示的變換,分別生成量化對象增加第1LSPω1(i)(0≤i≤Np),量化對象增加第2LSP2ω(i)(0≤i≤Np),量化對象增加第3LSPω3(i)(0≤i≤Np)。
ω1(i)ω2(i)ω3(i)=0.80.20.00.50.30.20.80.30.5ωq(i)ωqp(i)ωf(i)---(33)]]>ω1(i)量化對象增加第1LSPω2(i)量化對象增加第2LSP
ω3(i)量化對象增加第3LSPiLPC次號(0≤i≤Np)NpLPC分析次數(shù)(=10)ωq(i)對應(yīng)于處理幀的解碼LSPωqp(i)對應(yīng)于前處理幀的復(fù)合LSPωf(i)對應(yīng)于首讀區(qū)間的LSP將生成的ω1(i)、ω2(i)、ω3(i)輸出到LSP量化/解碼單元152中。LSP量化/解碼單元152在對4個(gè)量化對象LSPω(i)、ω1(i)、ω2(i)、ω3(i)全部進(jìn)行矢量量化/解碼后,分別求出對應(yīng)于ω(i)的量化誤差的功率Epow(ω)、對應(yīng)于ω1(i)的量化誤差的功率Epow(ω1)、對應(yīng)于ω2(i)的量化誤差的功率Epow(ω2)、對于ω3(i)的量化誤差的功率Epow(ω3),并對求出的各個(gè)量化殘差功率施行式(34)的變換,求出解碼LSP選擇基準(zhǔn)值STDlsp(ω)、STDlsp(ω1)、STDlsp(ω2)、STDlsp(ω3)。
STDlsp(ω)STDlsp(ω1)STDlsp(ω2)STDlsp(ω3=Epow(ω)Epow(ω1)Epow(ω2)Epow(ω3)-0.00100.00050.00020.0000---(34)]]>STDlsp(ω)對應(yīng)于ω(i)的的復(fù)合LSP選擇基準(zhǔn)值STDlsp(ω1)對應(yīng)于ω1(i)的復(fù)合LSP選擇基準(zhǔn)值STDlsp(ω2)對應(yīng)于ω2(i)的復(fù)合LSP選擇基準(zhǔn)值STDlsp(ω3)對應(yīng)于ω3(i)的復(fù)合LSP選擇基準(zhǔn)值Epow(ω)對應(yīng)于ω(i)的量化誤差的功率Epow(ω1)對應(yīng)于ω1(i)的量化誤差的功率Epow(ω2)對應(yīng)于ω2(i)的量化誤差的功率Epow(ω3)對應(yīng)于ω3(i)的量化誤差的功率比較求出的解碼LSP選擇基準(zhǔn)值,在選擇并輸出該基準(zhǔn)值最小的量化對象LSP所對應(yīng)的解碼LSP作為對應(yīng)于處理幀的解碼LSPωq(i)(0≤i≤Np),同時(shí)在前幀LSP存儲單元163中存儲下一個(gè)幀的LSP,以便能在矢量量化時(shí)參照。
本實(shí)施形態(tài)有效地利用LSP具有的內(nèi)插特性的優(yōu)越性(即使用內(nèi)插后的LSP合成也不會發(fā)生異常噪聲),能對LSP進(jìn)行向量量化,即使象話頭那樣頻譜變動大的區(qū)間,也不發(fā)生異常噪聲,所以能減小在LSP的量化特性不充分的情況下可能發(fā)生的合成語音中的異常噪聲。
圖17表示本實(shí)施形態(tài)的LSP量化/解碼單元152的方框圖。LSP量化/解碼單元152包括增益信息存儲單元171、自適應(yīng)增益選擇單元172、乘增益運(yùn)算單元173、LSP量化單元174和LSP解碼單元175。
增益信息存儲單元171存儲自適應(yīng)增益選擇單元172中選擇自適應(yīng)增益時(shí)參照的多個(gè)增益候補(bǔ)。乘增益運(yùn)算單元173將由LSP量化表存儲單元1307讀出的碼矢量乘以自適應(yīng)增益選擇單元172中選擇的自適應(yīng)增益。LSP量化單元174用乘以自適應(yīng)增益后的碼矢量,對量化對象LSP進(jìn)行矢量量化。LSP解碼單元175具有對矢量量化的LSP進(jìn)行解碼,生成并輸出解碼LSP的功能,還具有求出作為量化對象LSP與解碼LSP的差分的LSP量化誤差,輸出到自適應(yīng)增益選擇單元172中的功能。自適應(yīng)增益選擇單元172以矢量量化時(shí)在碼矢量上乘以前處理幀的LSP的自適應(yīng)增益的大小,和對應(yīng)于前幀的LSP量化誤差的大小為基準(zhǔn),以存儲在增益存儲單元171中的增益生成信息為基礎(chǔ)進(jìn)行自適應(yīng)調(diào)節(jié),同時(shí)求出對處理幀的量化對象LSP進(jìn)行矢量量化時(shí)乘到碼矢量上自適應(yīng)增益,并將求得的自適應(yīng)增益輸出到乘法增益運(yùn)算單元173中。
這樣,LSP量化/解碼單元152是在自適應(yīng)碼矢量上的自適應(yīng)增益的同時(shí),對量化對LSP進(jìn)行矢量量化和解碼。
這里,對LSP量化/解碼單元152進(jìn)一步詳細(xì)地進(jìn)行說明。增益信息存儲單元171存儲自適應(yīng)增益選擇單元103參照的4個(gè)增益候補(bǔ)(0.9,1.0,1.1,1.2),適應(yīng)增益選擇單元103,利用在量化前幀的量化對象LSP時(shí)生成的功率ERpow除以矢量量化前處理幀的量化對象LSP時(shí)選擇的自適應(yīng)增益Gqlsp的平方的式(35),求出自適應(yīng)增益選擇基準(zhǔn)值Slsp。
Slsp=ERpowGqlsp2---(35)]]>Slsp自適應(yīng)增益選擇基準(zhǔn)值ERpow量化前幀的LSP時(shí)生成的量化誤差的功率Gqlsp量化前幀的LSP時(shí)選擇的自適應(yīng)增益根據(jù)使用求得的自適應(yīng)增益選擇基準(zhǔn)值Slsp的式(36),從由增益信息存儲單元171讀出的4個(gè)增益候補(bǔ)(0.9,1.0,1.1,1.2)中選擇1個(gè)增益。并且,在將被選擇的自適應(yīng)增益Gqlsp的值輸出到乘增益運(yùn)算單元173中的同時(shí),將用于指定被選擇的適應(yīng)增益是4種中的哪一種的信息(2位信息)輸出到參數(shù)編碼單元中。
Glsp=1.2Slsp>0.00251.1Slsp>0.00151.0Slsp>0.00080.9Slsp≤0.0008---(36)]]>Glsp乘在LSP量化用碼矢量上的自適應(yīng)增益Slsp自適應(yīng)增益選擇基準(zhǔn)值在變量Gqlsp和變量ERpow中,保持所選擇的自適應(yīng)增益Glsp和伴隨量化產(chǎn)生的誤差,直到矢量量化下一幀的量化對象LSP時(shí)為止。
乘增益運(yùn)算單元173在由LSP量化表存儲單元1307讀出的碼矢量上乘以自適應(yīng)增益選擇單元172中選擇的自適應(yīng)增益Glsp,并輸出到LSP量化單元174中。LSP量化單元174,用乘以自適應(yīng)增益的碼矢量,對量化對象LSP進(jìn)行矢量量化,并將其標(biāo)號輸出到參數(shù)編碼單元中。LSP解碼單元175對在LSP量化單元174量化的LSP進(jìn)行解碼,得到解碼LSP,輸出到得到的解碼LSP,同時(shí)從量化對象LSP減去得到的解碼LSP,求出LSP量化誤差,計(jì)算求出的LSP量化誤差的功率ERpow,并輸出到自適應(yīng)增益選擇單元172中。
本實(shí)施形態(tài)能減小在LSP的量化特性不充分的場合可能發(fā)生的合成話音中的異常噪聲。
實(shí)施形態(tài)10圖18表示與本實(shí)施形態(tài)相關(guān)的聲源矢量生成裝置的結(jié)果的方框圖。這種聲源矢量生成裝置包括存儲通道CH1、CH2、CH3的3個(gè)固定波形(V1(長度L1)、V2(長度L2)、V3(長度L3))的固定波形存儲單元181,具有各通道的固定波形起始端候補(bǔ)位置信息,并將從固定波形存儲單元181讀出的固定波形(V1、V2、V3)分別配置在P1、P2、P3的位置上的固定波配置在單元182和對基于固定波形配置單元182配置的固定波形相加,并輸出聲源矢量的加法運(yùn)算單元183。
下面,對如前所述結(jié)構(gòu)的聲源矢量生成裝置的動作進(jìn)行說明。
在固定波形存儲單元181上預(yù)先存儲3個(gè)固定波形V1、V2、V3。固定波形配置單元182根據(jù)表8所示的其本身具有的固定波形起始端候補(bǔ)位置信息,在從CH1用的起始端候補(bǔ)位置中選擇的位置P1上配置(移位)從固定波形存儲單元181讀出的固定波形V1,同樣,在從CH2、CH3用的起始端候補(bǔ)位置中選擇的位置P2、P3上分別配置固定波形V2、V3。
表8固定波形起始端候補(bǔ)位置信息

加法運(yùn)算單元183對由固定波形配置單元182配置的固定波形進(jìn)行加法運(yùn)算并生成聲源矢量。
其中,對固定波形配置單元182具有的固定波形起始端候補(bǔ)位置信息,分配與能被選擇的各固定波形的起始端候補(bǔ)位置的組合信息(表示選擇哪一個(gè)位置作為P1、選擇哪一個(gè)位置作為P2、選擇哪一個(gè)位置作為P3的信息)一一對應(yīng)的碼號。
采用這樣結(jié)構(gòu)的聲源矢量生成裝置,則在能利用傳送與固定波形配置單元182具有的固定波形起始端候補(bǔ)位置信息有對應(yīng)關(guān)系的碼號,行聲音信息的傳送的同時(shí),借助于碼號僅存在于各起始端候補(bǔ)數(shù)的積的部分,能不增加計(jì)算和必要的存儲器,生成接近實(shí)際聲音的聲源矢量。
為了能利用碼號的傳送進(jìn)行聲音信息的傳送,可前述聲源矢量生成裝置作為噪聲碼本用在聲音編碼/解碼裝置中。
在本實(shí)施形態(tài)中,雖然對圖18所示的用3個(gè)固定波形的場合進(jìn)行了說明,但固定波形的個(gè)數(shù)(圖18和表8的通道數(shù)一致)為其它的個(gè)數(shù)的場合,也能得到同樣的作用和效果。
此外,在本實(shí)施形態(tài)中,雖然對固定波形配置單元182具有表8所示的固定波形起始端候補(bǔ)位置信息的場合進(jìn)行了說明,但對于具有表8以外的固定波形起始端候補(bǔ)位置信息的場合,也能得到同樣的作用·效果。
實(shí)施形態(tài)11圖19A表示與本實(shí)施形態(tài)相關(guān)的CELP型聲音編碼裝置的結(jié)構(gòu)方框圖。圖19B表示與CELP型聲音編碼裝置配對的CELP型聲音解碼裝置的結(jié)構(gòu)方框圖。
與本實(shí)施形態(tài)相關(guān)的CELP型聲音編碼裝置包括由固定波形存儲單元181A和固定波形配置單元182A以及加法運(yùn)算單元183A組成的聲源矢量生成裝置。固定波形存儲單元181A存儲多個(gè)固定波形,固定波形配置單元182A根據(jù)自己具有的固定波形起始端候補(bǔ)位置信息將從固定波形存儲單元181A讀出的固定波形分別配置(移位)在選擇的位置上,加法運(yùn)算單元183A對由固定波形配置單元182A配置的固定波形進(jìn)行加法運(yùn)算、生成聲源矢量C。
這種CELP型聲音編碼裝置包括對被輸入的噪聲碼本檢索用目標(biāo)X進(jìn)行時(shí)間反轉(zhuǎn)的時(shí)間反轉(zhuǎn)單元191、對時(shí)間反轉(zhuǎn)單元191的輸出進(jìn)行合成的濾波器192、對合成濾波器192的輸出再次進(jìn)行反轉(zhuǎn)并輸出到時(shí)間反轉(zhuǎn)合成目標(biāo)X’的時(shí)間反轉(zhuǎn)單元193、對乘以噪聲編碼矢量增益gc的聲源矢量C進(jìn)行合成并輸出合成聲源矢量S的合成濾波器194,以及輸入X’、C、S并計(jì)算失真的失真計(jì)算單元205和傳送單元196。
在本實(shí)施形態(tài)中,固定波形存儲單元181A、固定波形配置單元182A和加法運(yùn)算單元183A,對應(yīng)于圖18所示的固定波形存儲單元181、固定波形配置單元182和加法運(yùn)算單元183,各通道的固定波形起始端候補(bǔ)位置對應(yīng)于表8,因而下文中表示通道號、固定波形號及其長度和位置的記號,使用圖18和表8所示的。
另一方面,圖19B的CELP型聲音解碼裝置包括存儲多個(gè)固定波形的固定波形存儲單元181B、根據(jù)基于自己具有的固定波形起始端候補(bǔ)位置信息,將從固定波形存儲單元181B讀出的固定波形分別配置(移位)在選擇的位置上的固定波形配置單元182B、對由固定波形配置單元182B配置的固定波形進(jìn)行加法運(yùn)算,生成聲源矢量C的加法運(yùn)算單元183B、乘以噪聲編碼矢量增益gc的乘增益運(yùn)算單元197和對聲源矢量C進(jìn)行合成并輸出合成聲源矢量S的合成濾波器198。
聲音解碼裝置的固定波形存儲單元181B和固定波形配置單元182B,與聲音編碼裝置的固定波形存儲單元181A和固定波形配置單元182A具有相同的結(jié)構(gòu),固定波形存儲單元181A和181B存儲的固定波形,是具有借助于將以使用噪聲碼本檢索用目標(biāo)的式(3)的編碼失真計(jì)算式作為價(jià)值函數(shù)的學(xué)習(xí),使式(3)的價(jià)值函數(shù)統(tǒng)計(jì)上最小的特性的固定波形。
下面,對如前所述結(jié)構(gòu)的聲音編碼裝置的動作進(jìn)行說明。
噪聲碼本檢索用目標(biāo)X,在時(shí)間反轉(zhuǎn)單元191被倒置后,在合成濾波器被合成,并在時(shí)間反轉(zhuǎn)單元193再次被倒置后,作為噪聲碼本檢索用的時(shí)間反轉(zhuǎn)合成目標(biāo)X’輸出到失真計(jì)算單元205中。
接著,固定波形配置單元182A根據(jù)表8所示的自己具有的固定波形起始端候補(bǔ)位置信息,將從固定波形存儲單元181A讀出的固定波形V1配置(移位)在從CH1用的起始端候補(bǔ)位置選擇的位置P1上,同樣,將固定波形V2、V3配置在從CH2、CH3用的起始端候補(bǔ)位置選擇的位置P2、P3上。被配置的各固定波形輸出到加法器183A中進(jìn)行相加,成為聲源矢量C,并輸入到合成濾波器194中。合成濾波器194對聲源矢量C進(jìn)行合成,生成合成聲源矢量S,并輸出到失真計(jì)算單元205中。
失真計(jì)算單元205輸入時(shí)間反轉(zhuǎn)合成目標(biāo)X’、聲源矢量C、合成聲源矢量S,計(jì)算式(4)的編碼失真。
失真計(jì)算單元205在計(jì)算失真后,對固定波形配置單元182A能選擇的起始端候補(bǔ)位置的全部組合,重復(fù)進(jìn)行從將信號送到固定波形配置單元182A中,從固定波形配置單元182A選擇分別對應(yīng)于3個(gè)通道的起始端候補(bǔ)位置起,到在失真計(jì)算單元205計(jì)算失真為止的前述處理。
然后,選擇編碼失真最小的起始端候補(bǔ)位置的組合,將與該起始端候補(bǔ)位置的組合一一對應(yīng)的碼號、以及這時(shí)的最佳躁聲碼矢量增益gc作為噪聲碼本的碼,傳送到傳送單元196中。
接著,對圖19B的聲音解碼裝置的動作進(jìn)行說明。
固定波形配置單元181B根據(jù)從傳送單元196送來的信息,從表8所示的自己具有的固定波形起始端候補(bǔ)位置信息中選擇各通道的固定波形的位置,將從固定波形配置單元181B讀出的固定波形V1配置(移位)在從CH1用的起始端候補(bǔ)位置中選擇的位置P1上,同樣,將固定波形V2、V3配置在從CH2、CH3用的起始端候補(bǔ)位置中選擇的位置P2、P3上。被配置的各固定波形輸出到加法器43中進(jìn)行相加,成為聲源矢量C,并乘以由來自傳送單元196的信息選擇的噪聲碼矢量增益gc后,輸出到合成濾波器198中。合成濾波器198對乘以gc后的聲源矢量C進(jìn)行合成,生成并輸出合成聲源矢量S。
采用這樣結(jié)構(gòu)的聲音編碼/解碼裝置,則因由固定波形存儲單元、固定波形配置單元和加法器組成的聲源矢量生成單元生成聲源矢量,所以增加具有實(shí)施形態(tài)10的效果,此外,用合成濾波器合成這種聲源矢量而得的合成聲源矢量還具有與實(shí)際的目標(biāo)統(tǒng)計(jì)上接近的特性,因而能得到高品質(zhì)的合成聲音。
在本實(shí)施形態(tài)中,雖然示出了將學(xué)習(xí)得到的固定波形存儲在固定波形存儲單元181A和181B中的情況,但在采用其它的統(tǒng)計(jì)分析噪聲碼本檢索用目標(biāo)X,并根據(jù)其分析結(jié)果生成的固定波形的情況下,在采用根據(jù)實(shí)際見識生成的固定波形的情況下,也能同樣地得到高品質(zhì)的合成聲音。
在本實(shí)施形態(tài)中,雖然對固定波形存儲單元存儲3個(gè)固定波形的情況進(jìn)行了說明,但在固定波形的個(gè)數(shù)為其它的個(gè)數(shù)的情況下也能得到同樣的作用和效果。
此外,在本實(shí)施形態(tài)中,雖然對固定波形配置單元具有表8所示的固定波形起始端候補(bǔ)位置信息的情況進(jìn)行了說明,但在具有表8以外的固定波形起始端候補(bǔ)位置信息的情況下也能得到同樣的作用和效果。
實(shí)施形態(tài)12圖20是表示本實(shí)施形態(tài)的CELP型聲音編碼裝置的結(jié)構(gòu)的方框圖。
該CELP型聲音編碼裝置具有存儲多個(gè)固定波形(體實(shí)施形態(tài)中是CH1W1、CH2W2、CH3W3個(gè))的固定波形存儲器200,以及有作為對固定波形存儲器200中存儲的固定波形由代數(shù)規(guī)則生成其起始端位置用的信息的固定波形起始端候補(bǔ)位置信息的固定波形配置單元201。又,該CELP型聲音編碼裝置具備波形別脈沖響應(yīng)運(yùn)算單元202、脈沖發(fā)生器203及相關(guān)矩陣運(yùn)算器204,還具備時(shí)間反轉(zhuǎn)單元193及失真計(jì)算單元205。
波形別脈沖響應(yīng)運(yùn)算單元202具有對固定波形存儲器200來的3個(gè)固定波形和合成濾波器的脈沖響應(yīng)h(長度L=子幀長度)進(jìn)行卷積,計(jì)算出3種波形別脈沖響應(yīng)(CH1h1、CH2h2、CH3h3,長度L=子幀長度)的功能。
波形別合成濾波器192’具有對使輸入的噪聲碼檢索目標(biāo)X時(shí)間反轉(zhuǎn)的時(shí)間反轉(zhuǎn)單元191的輸出與來自波形別脈沖響應(yīng)運(yùn)算單元202的各個(gè)波形別脈沖響應(yīng)h1、h2、h3進(jìn)行卷積的功能。
脈沖發(fā)生器203只在固定波形配置單元201選擇的起始候補(bǔ)位置P1、P2、P3分別使振幅1(有極性)的脈沖上升,產(chǎn)生不同通道的脈沖(CH1d1、CH2d2、CH3d3)。
相關(guān)矩陣運(yùn)算器204計(jì)算來自波形別脈沖響應(yīng)運(yùn)算單元202的波形別脈沖響應(yīng)h1、h2與h3各自的自相關(guān),以及h1與h2、h1與h3、h2與h3的互相關(guān),將求得的相關(guān)值在相關(guān)矩陣存儲器RR中展開。
失真運(yùn)算單元205用3個(gè)波形別時(shí)間反轉(zhuǎn)合成目標(biāo)(X’1、X’2、X’3)、相關(guān)矩陣存儲器RR、3個(gè)通道別脈沖(d1、d2、d3),借助于式(4)的變形式(37)指定使編碼失真最小的噪聲碼矢量。
(Σi=13xi′tdi)2Σi=13Σj=13HitHjdj---(37)]]>di通道別脈沖(矢量)di=±1×δ(k-pi),k=0~L-1,pi第i通道n固定波形起始端候補(bǔ)位置Hi=波形別脈沖響應(yīng)卷積矩陣(Hi=HWi)Wi=固定波形卷積矩陣
Wi=wi(0)0ΛΛ0000wi(1)wi(0)0Λ0000wi(2)wi(1)wi(0)00000MMMO0000wi(Li-1)wi(Li-2)OOO0000wi(Li-1)wi(Li-2)OO0Λ0M0wi(Li-1)OO000MM0OOO00MMMOOOO00000wi(Li-1)Λwi(1)wi(0)]]>其中Wi為第i通道的固定波形(長度Li)x’i在Hi將x時(shí)間反轉(zhuǎn)合成倒置的矢量(x’ti=Hi)這里對從式(4)變成式(37)的變換,分別用式(38)和式(39)表示出分母項(xiàng)和分子項(xiàng)的變換。
(xtHc)2]]>=(xtH(W1d1+W2d2+W3d3))2]]>=(xt(H1d1+H2d2+H3d3))2]]>=((xtH1)d1+(xtH2)d2+(xtH3)d3)2]]>=(x1′td1+x2′td2+x3′td3)2]]>=(Σi=13xi′tdi)2---(38)]]>x噪聲碼檢索目標(biāo)(矢量)xtx的倒易矢量H合成濾波器的脈沖響應(yīng)卷積矩陣c噪聲碼矢量(c=W1d1+W2d2+W3d3)Wi固定波形卷積矩陣di通道別脈沖(矢量)Hi波形別脈沖響應(yīng)卷積矩陣(Hi=HWi)x’i在Hi將x時(shí)間反轉(zhuǎn)合成倒置的矢量(x’ti=xtHi)
||Hc||2]]>=||H(W1d1+W2d2+W3d3)||2]]>=||H1d1+H2d2+H3d3||2]]>=(H1d1+H2d2+H3d3)t(H1d1+H2d2+H3d3)]]>=(d1tH1t+d2tH2t+d3tH3t)(H1d1+H2d2+H3d3)]]>=Σi=13Σj=13ditHitdjHj---(39)]]>H合成濾波器的脈沖響應(yīng)卷積矩陣c噪聲碼矢量(c=W1d1+W2d2+W3d3)Wi固定波形卷積矩陣di通道別脈沖(矢量)Hi波形別脈沖響應(yīng)卷積矩陣(H=HWi)下面對具有如上所述結(jié)構(gòu)的CELP型聲音編碼裝置的動作加以說明。
首先,對波形別脈沖響應(yīng)運(yùn)算單元202存儲的3個(gè)固定波形W1、W2、W3和脈沖響應(yīng)h進(jìn)行卷積,計(jì)算出3種波形別脈沖響應(yīng)h1、h2、h3,輸出到波形別合成濾波器192’及相關(guān)矩陣運(yùn)算器204。
接著,波形別合成濾波器192’對由時(shí)間反轉(zhuǎn)單元191進(jìn)行過時(shí)間反轉(zhuǎn)的噪聲碼檢索目標(biāo)X和輸入的3種波形別脈沖響應(yīng)h1、h2、h3的各個(gè)進(jìn)行卷積,用時(shí)間反轉(zhuǎn)單元193再度對來自波形別合成濾波器192’的3種輸出矢量進(jìn)行時(shí)間反轉(zhuǎn),分別生成3個(gè)波形別時(shí)間反轉(zhuǎn)合成目標(biāo)X’1、X’2、X’3輸出到失真計(jì)算單元205。
接著,相關(guān)矩陣運(yùn)算單元204計(jì)算輸入的3種波形別脈沖響應(yīng)h1、h2、h3各自的自相關(guān)和h1與h2、h1與h3、h2與h3的互相關(guān),將求得的相關(guān)值在相關(guān)矩陣矩陣存儲器RR展開后輸出到失真運(yùn)算單元205。
將上述處理作為前處理實(shí)施后,固定波形配置單元201在每一個(gè)通道各選一個(gè)固定波形的起始端候補(bǔ)位置,向脈沖發(fā)生器203輸出該位置信息。
脈沖發(fā)生器203在從固定波形配置單元121得到的選擇位置上分別使振幅1(有極性)的脈沖上升,產(chǎn)生通道別脈沖d1、d2、d3并輸出到失真計(jì)算單元205。
然后,失真計(jì)算單元205用3個(gè)波形別時(shí)間反轉(zhuǎn)合成目標(biāo)X’1、X’2、X’3、相關(guān)矩陣RR及3個(gè)通道別脈沖d1、d2、d3,計(jì)算式(37)的最小編碼失真基準(zhǔn)值。
固定波形配置單元201就該單元能夠選擇的起始端候補(bǔ)位置的全部組合,反復(fù)進(jìn)行從選擇對分別與3個(gè)通道對應(yīng)的起始端候補(bǔ)位置起,到失真計(jì)算單元205計(jì)算失真為止的上述處理。然后,在將噪聲碼矢量增益gc指定為噪聲碼本的代碼后,將使式(37)的編碼失真檢索基準(zhǔn)值最小的起始端候補(bǔ)位置的組合編號所對應(yīng)的碼號及那時(shí)的最佳增益?zhèn)魉偷絺鬏攩卧?br> 還有,本實(shí)施形態(tài)的聲音解碼裝置的結(jié)構(gòu)與實(shí)施形態(tài)10的圖19B相同,聲音編碼裝置的固定波形存儲單元及固定波形配置單元與聲音解碼裝置裝置的固定波形存儲單元及固定波形配置單元有相同的結(jié)構(gòu)。固定波形存儲單元存儲的固定波形是具有將使用噪聲碼本檢索目標(biāo)的式(3)(編碼畸變計(jì)算式)作為價(jià)值函數(shù)學(xué)習(xí),以在統(tǒng)計(jì)上使式(3)的價(jià)值函數(shù)最小的特性的固定波形。
采用這樣構(gòu)成的聲音編碼/解碼裝置,在能夠以代數(shù)計(jì)算算出固定波形配置單元內(nèi)的固定波形起始端修補(bǔ)位置的情況下,將前處理階段求得的波形別時(shí)間反轉(zhuǎn)合成目標(biāo)的3項(xiàng)相加,取其結(jié)果的平方,可以計(jì)算式(37)的分子項(xiàng)。又,將前處理階段求得的波形別脈沖響應(yīng)的相關(guān)矩陣的9項(xiàng)相加,可以計(jì)算式(37)的分子項(xiàng)。因此,可以用與將已有的代數(shù)結(jié)構(gòu)聲源(以振幅1的幾個(gè)脈沖構(gòu)成聲源矢量)用于噪聲碼本的情況相同的運(yùn)算量完成檢索。
再者用合成濾波器合成的合成聲源矢量與實(shí)際目標(biāo)有在統(tǒng)計(jì)上相近的特性,因此可以得到高質(zhì)量的合成話音。
還有,本實(shí)施形態(tài)示出了將學(xué)習(xí)得到的固定形狀存儲于固定波形存儲單元的情況,此外,在使用對噪聲碼本檢索用的目標(biāo)X進(jìn)行統(tǒng)計(jì)分析,根據(jù)該分析結(jié)果作成的固定波形的情況下,以及使用根據(jù)實(shí)際見識作成的固定波形的情況下,也一樣能夠得到高質(zhì)量的合成話音。
又,本實(shí)施形態(tài)對固定波形存儲單元存儲3個(gè)固定波形的情況作出了說明,但是固定波形的個(gè)數(shù)取其他數(shù)值的時(shí)也能得到相同的作用與效果。
又,本實(shí)施形態(tài)對固定波形配置單元具有表8所示的固定波形起始端候補(bǔ)位置信息的情況作了說明,但如果是能夠以代數(shù)方法生成的,則具有表8以外的固定波形起始端候補(bǔ)位置信息的情況也能得到同樣的作用和效果。
實(shí)施形態(tài)13圖21是本實(shí)施形態(tài)的CELP型聲音編碼裝置的結(jié)構(gòu)方框圖。本實(shí)施形態(tài)的編碼裝置具備2種噪聲碼本A211、B212、切換兩種噪聲碼本的開關(guān)213、進(jìn)行噪聲碼矢量乘以增益的運(yùn)算的乘法器214、將由開關(guān)213連接的噪聲碼本輸出的噪聲碼矢量加以合成的合成濾波器215,以及計(jì)算式(2)的編碼失真的失真計(jì)算單元216。
噪聲碼本A211具有實(shí)施形態(tài)10的聲源矢量生成裝置的結(jié)構(gòu),另一噪聲碼本B212由存儲根據(jù)隨機(jī)數(shù)序列作出的多個(gè)隨機(jī)矢量的隨機(jī)數(shù)序列存儲單元217構(gòu)成。以閉環(huán)進(jìn)行噪聲碼本的切換。X是噪聲碼本檢索用的目標(biāo)。
下成對具有如上所述結(jié)構(gòu)的CRLP型聲音編碼裝置的動作加以說明。
開始時(shí),開關(guān)213連接于噪聲碼本A211一側(cè),固定波形配置單元182根據(jù)示于表8的本身具有的固定波形起始端候補(bǔ)位置信息,將從固定波形存儲單元181讀出的固定波形分別配置(移位)到從起始端候補(bǔ)位置選擇出的位置上。所配置的固定波形由加法器183進(jìn)行加法運(yùn)算,變成噪聲碼矢量,并乘以噪聲碼矢量增益后被輸入合成濾波器215。合成濾波器215將所輸入的噪聲碼矢量加以合成后,輸出到失真計(jì)算單元216。
失真計(jì)算單元216使用噪聲碼本的檢索用目標(biāo)X和從合成濾波器215得到的合成,進(jìn)行式(2)的使編碼失真最小的處理。
失真計(jì)算單元216在計(jì)算失真之后,向固定波形配置單元182傳送信號,就固定波形配置單元182能選擇的起始端候補(bǔ)位置的全部組合,反復(fù)進(jìn)行從固定波形配置單元182選擇起始端候補(bǔ)位置起,到失真計(jì)算單元216計(jì)算失真為止的上述處理。
然后,選擇最小編碼失真的起始端候補(bǔ)位置的組合,存儲與該起始端候補(bǔ)位置的組合一一對應(yīng)的噪聲碼矢量的碼號、那時(shí)的噪聲碼矢量增益gc,及編碼失真最小值。
接著,開關(guān)213連接于噪聲碼本B212一側(cè),從隨機(jī)數(shù)序列存儲單元217讀出的隨機(jī)數(shù)序列成為噪聲碼矢量,乘以噪聲碼矢量增益后,輸出到合成濾波器215。合成濾波器215將所輸入的噪聲碼矢量加以合成后,輸出到失真計(jì)算單元216。
失真計(jì)算單元216用噪聲碼本檢索用的目標(biāo)X和從合成濾波器215得到的合成矢量,計(jì)算式(2)的編碼失真。
失真計(jì)算單元216在計(jì)算失真之后向隨機(jī)數(shù)序列存儲單元217傳送信號,就隨機(jī)數(shù)序列存儲單元217能選擇的全部噪聲碼矢量,反復(fù)進(jìn)行從隨機(jī)數(shù)序列存儲單元217選擇噪聲碼矢量起,到在失真計(jì)算單元216計(jì)算失真為止的上述處理。
然后,選擇編碼失真最小的噪聲碼矢量,將該噪聲碼矢量的碼號、那時(shí)的噪聲碼矢量增益gc,以及編碼失真最小值存儲起來。
接著,失真計(jì)算單元216將把開關(guān)213連接于噪聲碼本A211時(shí)得到的編碼失真最小值與把開關(guān)213連接于噪聲碼本B212時(shí)得到的編碼失真最小值加以比較,將得到較小編碼失真時(shí)的開關(guān)連接信息及那時(shí)的碼號和噪聲碼矢量增益判定為聲音碼,傳送到未圖示的傳輸單元。
還有,與本實(shí)施形狀的聲音編碼裝置配對的聲音解碼裝置是將噪聲碼本A、噪聲碼本B、開關(guān)、噪聲碼矢量增益,及合成濾波器以同圖21一樣的結(jié)構(gòu)配置而成的,根據(jù)由傳輸單元輸入的聲音碼,決定所使用的噪聲碼本。噪聲碼矢量及噪聲碼矢量增益,得到合成聲源矢量作為合成濾波器的輸出。
采用這樣構(gòu)成的聲音編碼裝置/解碼裝置,可以從由噪聲碼本A生成的噪聲碼矢量和由噪聲碼本B生成的噪聲碼矢量中,以閉環(huán)的方式選擇使式(2)的編碼失真最小的,因此,能夠生成更接近實(shí)際聲音的聲源矢量,同時(shí)能夠得到高音質(zhì)的合成話音。
本實(shí)施形態(tài)示出以作為已有CELP型聲音編碼裝置的圖2所示結(jié)構(gòu)為基礎(chǔ)的聲音編碼/解碼裝置,但是在圖19A、B或圖20的結(jié)構(gòu)為基礎(chǔ)的CELP型聲音編碼裝置/解碼裝置中使用本實(shí)施形態(tài)也能得到同樣的作用與效果。
本實(shí)施形態(tài)設(shè)噪聲碼本A211圖18的結(jié)構(gòu),但是在固定波形存儲單元181具有其他結(jié)構(gòu)的情況(例如有4種固定波形等)等也能得到同樣的作用和效果。
在本實(shí)施形態(tài)中,對噪聲碼本A211的固定波形配置單元182具有表8中所示的固定波形起始端候補(bǔ)位置信息的情況作了說明,但是,具有其他固定波形起始端候補(bǔ)位置信息時(shí)也能得到同樣的作用和效果。
又,本實(shí)施形態(tài)對噪聲碼本B212由直接在存儲器中存儲多個(gè)隨機(jī)數(shù)序列的隨機(jī)數(shù)序列存儲單元217構(gòu)成的情況進(jìn)行了說明,但是噪聲碼本B212具有其他聲源結(jié)構(gòu)的情況(例如由代數(shù)結(jié)構(gòu)聲源生成信息構(gòu)成的情況)也能得到同樣的作用和效果。
再者,本實(shí)施形態(tài)對具有2種噪聲碼本的CELP型聲音編碼/解碼裝置作了說明,但采用具有3種以上噪聲碼本的CELP型聲音編碼/解碼裝置時(shí),也能取得同樣的作用和效果。
實(shí)施形態(tài)14圖22表示本實(shí)施形態(tài)的CELP型聲音編碼裝置的結(jié)構(gòu)。本實(shí)施形態(tài)的聲音編碼裝置具有兩種躁聲碼本,一種噪聲碼本是實(shí)施形態(tài)10的圖18所示的聲源矢量生成裝置的結(jié)構(gòu),另一噪聲碼本由存儲多個(gè)脈沖串的脈沖串存儲單元構(gòu)成,利用噪聲碼本檢索以前已經(jīng)得到的量化音調(diào)增益,自適應(yīng)地?fù)Q用噪聲碼本。
噪聲碼本A211由固定波形存儲單元181、固定波形配置單元182、加法器183構(gòu)成,與圖18的原矢量生成裝置對應(yīng)。噪聲碼本B221由存儲多個(gè)脈沖串的脈沖串存儲單元222構(gòu)成。開關(guān)213’對噪聲碼本A211與噪聲碼本B211進(jìn)行切換。又,乘法器224輸出自適應(yīng)碼本223的輸出乘以在噪聲碼本檢索時(shí)已經(jīng)得到的音調(diào)增益得出的自適應(yīng)碼矢量。音調(diào)增益量化器225的輸出傳送給開關(guān)213’。
下面對具有上述結(jié)構(gòu)的CELP型聲音編碼裝置的動作加以說明。
已有的CELP型聲音代碼裝置首先進(jìn)行自適應(yīng)碼本223的檢索,接著接受其結(jié)果,進(jìn)行噪聲碼本檢索。該自適應(yīng)碼本檢索是從自適應(yīng)碼本223存儲的多個(gè)自適應(yīng)碼矢量(自適應(yīng)碼矢量與噪聲碼矢量乘以各自的增益后進(jìn)行相加而得到的矢量)選擇最合適的自適應(yīng)碼矢量的處理,結(jié)果是生成自適應(yīng)碼矢量的碼號及音調(diào)增益。
本實(shí)施形態(tài)的CELP型聲音編碼裝置在音調(diào)增益量化單元225將該音調(diào)增益量化,并在生成量化音調(diào)增益之后進(jìn)行噪聲碼本檢索。音調(diào)增益量化單元225得到的量化音調(diào)增益送往切換噪聲碼本用的開關(guān)213’。
開關(guān)213’在量化音調(diào)增益的值小的時(shí)候判斷為輸入聲音清音性強(qiáng),連接噪聲碼本A211,在量化音調(diào)增益值大的時(shí)候判斷為輸入聲音濁音性強(qiáng),連接噪聲碼本B221。
開關(guān)213’連接于噪聲碼本A211一側(cè)時(shí),固定波形配置單元182根據(jù)示于表8的本身具有的固定波形起始端候補(bǔ)位置信息,將從固定波形存儲單元181讀出的固定波形分別配置(移位)到從起始端候補(bǔ)位置選擇出的位置上。所配置的各固定波形輸出到加法器183進(jìn)行加法運(yùn)算,成為噪聲碼矢量,乘以噪聲碼矢量增益后輸入合成濾波器215。合成濾波器215將輸入的噪聲碼矢量加以合成,輸出到失真計(jì)算單元216。
失真計(jì)算單元216利用噪聲碼本檢索用目標(biāo)X和從合成濾波器215得到的矢量,計(jì)算式(2)的編碼失真。
失真計(jì)算單元216在計(jì)算失真之后向固定波形配置單元182傳送信號182,就固定波形配置單元182能夠選擇的起始端候補(bǔ)位置的全部組合,反復(fù)進(jìn)行從固定波形配置單元182選擇起始端候補(bǔ)位置起,到失真計(jì)算單元216計(jì)算失真為止的上述處理。
然后,選擇編碼失真最小的起始端候補(bǔ)位置的組合,將與該起始端候補(bǔ)位置的組合一一對應(yīng)的噪聲碼矢量的碼號、那時(shí)的噪聲碼矢量增益gc,及量化音調(diào)增益作為聲音碼傳送到傳輸單元。本實(shí)施形態(tài)在進(jìn)行聲音編碼之前事先使固定波形存儲單元181存儲的固定波形圖呈現(xiàn)清音性質(zhì)。
另一方面,開關(guān)213’連接于噪聲碼本B221一側(cè)時(shí)從脈沖串存儲單元222讀出的脈沖串成為噪聲碼矢量,開關(guān)213’經(jīng)噪聲碼矢量增益的乘法運(yùn)算過程后,輸入合成濾波器215。合成濾波器215將輸入的噪聲碼矢量加以合成,并輸出到失真計(jì)算單元216。
失真計(jì)算單元216用噪聲碼本檢索用目標(biāo)X和從合成濾波器215得到的合成矢量,計(jì)算式(2)的編碼失真。
失真計(jì)算單元216在計(jì)算失真之后向脈沖串存儲單元222傳送信號,就脈沖串存儲單元222能夠選擇的所有的噪聲碼矢量,反復(fù)進(jìn)行從脈沖串存儲單元222選擇噪聲碼矢量起,到失真計(jì)算單元216計(jì)算失真為止的上述處理。
然后,選擇編碼失真最小的躁聲碼矢量,將該噪聲碼矢量的碼號、那時(shí)的噪聲碼矢量增益gc,以及量化音調(diào)增益作為聲音碼向傳輸單元傳送。
還有,與本實(shí)施形態(tài)的聲音編碼裝置配對的聲音解碼裝置是具有將噪聲碼本A、噪聲碼本B、開關(guān)、噪聲碼矢量增益,以及合成濾波器以與圖22相同的結(jié)構(gòu)配置而成的部分的裝置,首先,接收傳送來的量化音調(diào)增益,根據(jù)其大小判斷在編碼裝置一方開關(guān)213’是連接于噪聲碼本A211一側(cè),還是連接于噪聲碼本B221一側(cè)。接著,根據(jù)碼號及噪聲碼矢量增益的代碼,得到合成聲源矢量作為合成濾波器的輸出。
采用具有這樣的結(jié)構(gòu)的聲源編碼/解碼裝置,可以相應(yīng)于輸入聲音的特征(在本實(shí)施形態(tài)中,利用量化音調(diào)增益的大小作為濁音性/清音性的判斷數(shù)據(jù))自適應(yīng)地切換2種噪聲碼本,能夠在輸入聲音的濁音性強(qiáng)的情況下選擇脈沖串作為噪聲碼矢量,在清音性強(qiáng)的情況下,選擇呈現(xiàn)清音性質(zhì)的噪聲碼矢量,可生成更接近原聲的聲源矢量,同時(shí)可以提高合成話音的音質(zhì)。在本實(shí)施形態(tài)中,由于如上所述以開環(huán)進(jìn)行開關(guān)切換,可以使傳送的信息增加,以提高有關(guān)作用和效果。
本實(shí)施形態(tài)中示出以作為已有的CELP型聲音編碼裝置的圖2所示結(jié)構(gòu)為基礎(chǔ)的聲音編碼/解碼裝置,但是在以圖19A、B或圖20的結(jié)構(gòu)為基礎(chǔ)的CELP型聲音編碼/解碼裝置中使用本實(shí)施形態(tài)也可以得到同樣的效果。
本實(shí)施形態(tài)中,作為用于切換開關(guān)213’的參數(shù),使用在音調(diào)增益量化器225將自適應(yīng)碼矢量的音調(diào)增益量化而得到的音調(diào)增益,但是也可以代之以使用配備音調(diào)周期運(yùn)算器,從自適應(yīng)碼矢量計(jì)算出的音調(diào)周期。
本實(shí)施形態(tài)中,設(shè)噪聲碼本A211具有圖18的結(jié)構(gòu),但是在固定波形存儲單元181具有其他結(jié)構(gòu)的情況下(例如有4種固定波形的情況等),也能得到同樣的作用與效果。
在本實(shí)施形態(tài)中,對噪聲碼帳A211的固定波形配置單元182具有表8所示的固定波形起始端候補(bǔ)位置信息的情況作了說明,但是具有其他固定波形起始端候補(bǔ)位置信息時(shí)也能夠得到同樣的作用與效果。
在本實(shí)施形態(tài)中,就噪聲碼本B211由直接將脈沖串存儲于存儲器中的脈沖串存儲單元222構(gòu)成的情況作了說明,但是在噪聲碼本B221具有其他聲源結(jié)構(gòu)(例如由代數(shù)結(jié)構(gòu)聲源生成信息構(gòu)成的情況下)也能夠得到同樣的作用與效果。
還有,在本實(shí)施例中,對具有2種噪聲碼本的CELP型聲音編碼/解碼裝置進(jìn)行了說明,但是采用具有3種以上噪聲碼本的CELP型聲音編碼/解碼裝置時(shí),也能夠得到同樣的作用與效果。
實(shí)施形態(tài)15圖23是本實(shí)施形態(tài)的CELP型聲音編碼裝置的結(jié)構(gòu)方框圖。本實(shí)施形態(tài)的聲音編碼裝置具有兩種噪聲碼本,一種噪聲碼本是實(shí)施形態(tài)10的圖18所示的聲源矢量生成裝置的結(jié)構(gòu),在固定波形存儲單元存儲3個(gè)固定波形,另一噪聲碼本同樣是圖18所示的聲源矢量生成裝置的結(jié)構(gòu),但固定波形存儲單元存儲的固定波形是2個(gè),而且以閉環(huán)進(jìn)行上述兩種噪聲碼本的切換。
噪聲碼本A211由存儲3個(gè)固定波形的固定波形存儲單元A181、固定波形配置單元A182、加法器183構(gòu)成,與以圖18的聲源矢量生成裝置的結(jié)構(gòu)在固定波形存儲單元存儲3個(gè)固定波形的情況對應(yīng)。
噪聲碼本B230由存儲2個(gè)固定波形的固定波形存儲單元B231、具備表9所示的固定波形起始端候補(bǔ)位置信息的固定波形配置單元B232、將由固定波形配置單元B232配置的2個(gè)固定波形相加生成噪聲碼矢量的加法器233構(gòu)成,與以圖18的聲源矢量生成裝置的結(jié)構(gòu)在固定波形存儲單元存儲2個(gè)固定波形的情況對應(yīng)。
表9

其他結(jié)構(gòu)也與上述實(shí)施形態(tài)13相同。
下面對具有如上所述的結(jié)構(gòu)的CELP型聲音編碼裝置的動作加以說明。
開始時(shí),開關(guān)213連接于噪聲碼本A211一側(cè),固定波形存儲單元A181根據(jù)表8所示的本身具有的固定波形起始端候補(bǔ)位置信息,將從固定波形存儲單元A181讀出的3個(gè)固定波形分別配置(移位)到從起始端候補(bǔ)位置選擇出的位置上。所配置的3個(gè)固定波形輸出到加法器183,經(jīng)過加法運(yùn)算,成為噪聲碼矢量,經(jīng)過開關(guān)213、乘以噪聲碼矢量增益的乘法器213,輸入合成濾波器215。合成濾波器215將輸入的噪聲代碼量加以合成,并輸出到失真計(jì)算單元216。
失真計(jì)算單元用噪聲碼本檢索用的目標(biāo)X和從合成濾波器215得到的合成矢量計(jì)算式(2)的編碼失真。
失真計(jì)算單元216在計(jì)算失真之后向固定波形配置單元A182傳送信號,就固定波形配置單元A182能選擇的起始端候補(bǔ)位置的全部組合,反復(fù)進(jìn)行從固定波形配置單元A182選擇起始端候補(bǔ)位置起,到失真計(jì)算單元216計(jì)算失真為止的上述處理。
然后,選擇編碼失真最小的起始端候補(bǔ)位置的組合,存儲與該起始端候補(bǔ)位置的組合一一對應(yīng)的噪聲碼矢量的碼號、那時(shí)的噪聲碼矢量增益gc,以及編碼失真最小值。
本實(shí)施形態(tài)中,在進(jìn)行聲音編碼之前,存儲于固定波形存儲單元A181的固定波形圖使用學(xué)習(xí)得到的,該學(xué)習(xí)在固定波形有3個(gè)的條件下使失真最小。
接著,開關(guān)213連接于噪聲碼本B230一側(cè),固定波形存儲單元B231根據(jù)表9所示的本身具有的固定波形起始端候補(bǔ)位置信息,將從固定波形存儲單元B231讀出的2個(gè)固定波形分別配置(移位)到從起始端候補(bǔ)位置選擇出的位置上。所配置的2個(gè)固定波形輸出到加法器233,經(jīng)過加法運(yùn)算后,成為噪聲碼矢量,經(jīng)過開關(guān)213、將乘以噪聲碼矢量增益的乘法器214,輸入合成濾波器215。合成濾波器215將輸入的噪聲碼矢量合成,并輸出到失真計(jì)算單元216。
失真計(jì)算單元216用噪聲碼本檢索用的目標(biāo)X和從合成濾波器215得到的合成矢量,計(jì)算式(2)的編碼失真。
失真計(jì)算單元216在計(jì)算失真之后,將信號傳送到固定波形配置單元B232,就固定波形配置單元B232能夠選擇的起始端候補(bǔ)位置的全部組合,反復(fù)進(jìn)行從固定波形配置單元B232選擇起始端候補(bǔ)位置,到失真計(jì)算單元216計(jì)算失真為止的上述處理。
然后,選擇編碼失真最小的起始端候補(bǔ)位置的組合,存儲與該起始端候補(bǔ)位置的組合一一對應(yīng)的噪聲碼矢量的碼號、那時(shí)的噪聲碼矢量增益gc,以及編碼失真最小值。本實(shí)施形態(tài)在進(jìn)行聲音編碼之前,存儲于固定波形存儲單元B231的固定波形圖使用學(xué)習(xí)得到的,該學(xué)習(xí)在固定波形有2個(gè)的條件下使失真最小。
接著,失真計(jì)算單元216將開關(guān)213連接于噪聲碼本A211時(shí)得到的編碼失真最小值與開關(guān)213連接于噪聲碼本B230時(shí)得到的編碼失真最小值加以比較,將得到較小編碼失真時(shí)的開關(guān)連接信息、那時(shí)的碼號及噪聲碼矢量增益判定為聲音碼,傳送到傳輸單元。
還有,在本實(shí)施形態(tài)中的聲音解碼裝置是具有將噪聲碼本A、噪聲碼本B、開關(guān)、噪聲碼矢量增益及合成濾波器以與圖23一樣的結(jié)構(gòu)配置而成的部分的裝置,根據(jù)從傳輸單元輸入的聲音碼,決定所使用的噪聲碼本、噪聲碼矢量及噪聲碼矢量增益,從而得到合成聲源矢量作為合成濾波器的輸出。
采用這樣構(gòu)成的聲音編碼/解碼裝置,可用閉環(huán)從由噪聲碼本A生成的噪聲碼矢量與噪聲碼本B生成的噪聲碼矢量中選擇使式(2)的編碼失真最小的噪聲碼矢量,因此可以生成更接近原聲的聲源矢量,同時(shí)可以得到高音質(zhì)的合成話音。
在本實(shí)施形態(tài)中,示出以作為已有的CELP型聲音編碼裝置的圖2所示結(jié)構(gòu)為基礎(chǔ)的聲音編碼/解碼裝置,但是,在以圖19A、B或圖20的結(jié)構(gòu)為基礎(chǔ)的CELP型聲音編碼/解碼裝置中使用本實(shí)施形態(tài)也能夠得到同樣的效果。
在本實(shí)施形態(tài)中,對噪聲碼本A211的固定波形存儲單元A181存儲3個(gè)固定波形的情況進(jìn)行了說明,但是,在固定波形存儲單元A181具有其他數(shù)目的固定波形的情況下(例如有4個(gè)固定波形的情況等)也能得到同樣的作用與效果。對于噪聲碼本B230也相同。
又,在本實(shí)施形態(tài)中,對噪聲碼本A211的固定波形配置單元A182具有表8所示的固定波形起始端候補(bǔ)位置信息的情況作了說明,但是,具有其他固定波形起始端候補(bǔ)位置信息時(shí)也能夠得到同樣的作用與效果。對于噪聲碼本B230也相同。
還有,本實(shí)施形態(tài)對具有2種噪聲碼本的CELP型聲音編碼/解碼裝置進(jìn)行了說明,但是采用有3種以上噪聲碼本的CELP型聲音編碼/解碼裝置時(shí),也能得到相同的作用與效果。
實(shí)施形態(tài)16圖24表示本實(shí)施形態(tài)的CELP型聲音編碼裝置的功能方框圖。該聲音編碼裝置在LPC分析單元242對輸入的聲音數(shù)據(jù)241進(jìn)行自相關(guān)分析與LPC分析,以此得到LPC系數(shù),又對所得到的LPC系數(shù)進(jìn)行編碼,得到LPC代碼,又將得到的LPC代碼加以編碼,得到解碼LPC系數(shù)。
接著,在聲源生成單元245,從自適應(yīng)碼本243與聲源矢量生成裝置244取出自適應(yīng)碼矢量與噪聲碼矢量,分別送往LPC合成單元246。聲源矢量生成裝置244使用上述實(shí)施形態(tài)1~4、10中的任一個(gè)聲源矢量生成裝置。并且,在LPC合成單元246,根據(jù)LPC分析單元242得到的解碼LPC系數(shù)對聲源生成單元245得到的2個(gè)聲源進(jìn)行濾波,從而得到兩個(gè)合成話音。
還在比較單元247分析在LPC合成單元246得到的2種合成話音與輸入的聲音的關(guān)系,求兩種合成話音的最佳值(最佳增益),把根據(jù)該最佳增益進(jìn)行過功率調(diào)整的各合成話音相加,得到總合成話音,計(jì)算該總合成話音與輸入的聲音的距離。
又,對自適應(yīng)碼本243與聲源矢量生成裝置244產(chǎn)生的全部聲源樣本,計(jì)算由于使聲源生成單元245、LPC合成單元246起作用而得到的多個(gè)合成話音與輸入的聲音的距離,求得在該結(jié)果所得到的距離中為最小的時(shí)候的聲源樣本的標(biāo)號,再把與該標(biāo)號對應(yīng)的兩個(gè)聲源傳送到參數(shù)編碼單元248。
參數(shù)編碼單元248進(jìn)行最佳增益的編碼,得到增益代碼,將LPC代碼、聲源樣本標(biāo)號匯集在一起傳送到傳輸路徑249。又根據(jù)增益代碼和對應(yīng)于標(biāo)號的兩個(gè)聲源生成實(shí)際聲源信號,將其存儲于自適應(yīng)碼本243,同時(shí)廢棄舊聲源樣本。
圖25是與參數(shù)編碼單元248中增益矢量量化有關(guān)的部分的功能方框圖。
參數(shù)編碼單元248具備變換為輸入最佳增益2501的組成部分的和以及對該和的比率求量化對象矢量的參數(shù)變換單元2502、用解碼矢量存儲單元存儲的過去已解碼代碼矢量和預(yù)測系數(shù)存儲單元存儲的預(yù)測系數(shù)求目標(biāo)矢量的目標(biāo)提取單元2503,存儲過去已解碼代碼矢量的解碼矢量存儲單元2504、存儲預(yù)測系數(shù)的預(yù)測系數(shù)存儲單元2505、用預(yù)測系數(shù)存儲單元存儲的預(yù)測系數(shù),計(jì)算矢量碼本存儲的多個(gè)代碼矢量與目標(biāo)提取單元得到的目標(biāo)矢量之間的距離的距離計(jì)算單元2506、存儲多個(gè)代碼矢量的矢量碼本2507、以及控制矢量碼本與距離計(jì)算單元,根據(jù)對從距離計(jì)算單元得到的距離的比較,求出最佳代碼矢量的編號,并根據(jù)求得的編號取出矢量存儲單元存儲的代碼矢量,用該代碼矢量更新解碼矢量存儲單元的內(nèi)容的比較單元2508。
下面對具有如上所述結(jié)構(gòu)的參數(shù)編碼單元248的動作做詳細(xì)說明。預(yù)先生成存儲多個(gè)量化對象矢量的代表性樣本(代碼矢量)的矢量碼本2507、這通常以分析多個(gè)聲音數(shù)據(jù)得到的多個(gè)矢量為基礎(chǔ),用LBG算法(IEEETRANSACTIONS ON COMMUNICATIONS,VOL.COM-28,NO.1,pp84-95,JANUARY 1980)生成。
又,在預(yù)測系數(shù)存儲單元2505存儲著用于進(jìn)行預(yù)測編碼的系數(shù)。關(guān)于該預(yù)測系數(shù)的算法將在后面進(jìn)行說明。又在解碼矢量存儲單元2504中預(yù)先存儲表示清音狀態(tài)的數(shù)值作為初始值。例如功率最小的代碼矢量。
首先,在參數(shù)變換單元2502將輸入的最佳增益2501(自適應(yīng)聲源的增益與噪聲聲源的增益)變換成和與比率的要素的矢量(輸入)。變換方法示于式(40)P=log(Ga+Gs)R=Ga/(Ga+Gs) ……(40)(Ga+Gs)最佳增益Ga自適應(yīng)聲源增益Gs隨機(jī)聲源增益(P,R)輸入矢量P和R比率上述各量中,Ga不必一定是正值,因而R地有負(fù)值的情況。而且,在Ga+Gs為負(fù)值的情況下代入預(yù)先準(zhǔn)備的固定值。
接著,在目標(biāo)提取單元2503以在參數(shù)變換單元2052得到的矢量為基礎(chǔ),利用解碼矢量存儲單元2504存儲的過去的解碼矢量和預(yù)測系數(shù)存儲單元2505存儲的預(yù)測系數(shù),得到目標(biāo)矢量。將目標(biāo)矢量的計(jì)算式示于式(41)Tp=P-(Σi=1lUpi×pi+Σi=1lVpi×ri)]]>Tr=R-(Σi=1lUri×pi+Σi=1lVri×ri)---(41)]]>(Tp,Tr)目標(biāo)矢量(P,R)輸入矢量(pi,ri)過去的解碼矢量Upi,Vpi,Uri,Vri預(yù)測系數(shù)(固定值)i前面第幾個(gè)解碼矢量的標(biāo)號l預(yù)測次數(shù)接著在距離計(jì)算單元2506用預(yù)測系數(shù)存儲單元2505存儲的預(yù)測系數(shù)計(jì)算在目標(biāo)提取單元2503得到的目標(biāo)矢量與矢量碼本2507存儲的代碼矢量的距離。
距離的計(jì)算式示于式(42)Dn=Wp×(Tp-UpO×Cpn-VpO×Crn)2+Wr×(Tr-UpO×Cpn-VrO×Crn)2(42)Dn目標(biāo)矢量與代碼矢量的距離(Tp,Tr)目標(biāo)矢量UpO,VpO,UrO,VrO預(yù)測系數(shù)(固定值)(Cpn,Crn)代碼矢量n代碼矢量的編號Wp,Wr調(diào)節(jié)對失真的靈敏度的加權(quán)系數(shù)(固定)接著,比較單元2508控制矢量碼本2507與距離計(jì)算單元2506,在矢量碼本2507中存儲的多個(gè)代碼矢量中求距離計(jì)算單元2506計(jì)算出的距離為最小的代碼矢量的編號,以此作為增益的代碼2509。又以得到的增益代碼2509為基礎(chǔ)求解碼矢量,并利用該矢量更新解碼矢量存儲單元2504的內(nèi)容。求解碼矢量的方法示于式(43)
p=(Σi=1lUpi×pi+Σi=1lVpi×ri)+UpO×Cpn+VpO×Crn]]>R=(Σi=1lUri×pi+Σi=1lVri×ri)+UrO×Cpn+VrO×Crn---(43)]]>(Cpn,Crn)代碼矢量(p,r)解碼矢量(pi,ri)過去的解碼矢量Upi,Vpi,Uri,Vri預(yù)測系數(shù)(固定值)i前面第幾個(gè)解碼矢量的標(biāo)號l預(yù)測次數(shù)n代碼矢量的編號又,進(jìn)行更新的方法示于式(44)。
處理的順序pO=CpNrO=CrNpi=pi-1(i=1~1)ri=ri-1(i=1~1)(44)N增益的代碼另一方面,解碼裝置(解碼器)備有與編碼裝置相同的矢量碼本、預(yù)測系數(shù)存儲單元以及解碼矢量存儲單元,根據(jù)編碼裝置傳送來的增益的代碼,借助于編碼裝置中比較單元的編碼矢量生成功能和解碼矢量存儲單元的更新功能進(jìn)行解碼。
這里對預(yù)測系數(shù)存儲單元2505存儲的預(yù)測系數(shù)的設(shè)定方法加以說明。
首先對許多學(xué)習(xí)用的聲音數(shù)據(jù)進(jìn)行量化,收集從其最佳增益求出的輸入矢量和量化時(shí)的解碼矢量編成組,然后通過使下面的式(45)所示的總失真最小,對該組求預(yù)測系數(shù)。具體地說,以各Upi、Uri對總失真式進(jìn)行偏微分,解所得到的聯(lián)立方程,從而求出Upi、Uri的值。
Total=Σt=0T{Wp×(Pt-Σi=0lUpi×pt,i)2+]]>Wr×(Rt-Σi=0lUri×rt,i)2}]]>pt,O=Cprp,O=Crn……(45)Total總失真t時(shí)間(幀編號)T矢量組的數(shù)據(jù)數(shù)目(Pt,Rt)時(shí)間t中的最佳增益(pti,rt,i)時(shí)間t中的解碼矢量Upi、Vpi、Uri、Vri預(yù)測系數(shù)(固定值)i表示前面第幾個(gè)解碼矢量的標(biāo)號l預(yù)測次數(shù)(Cpn(t),Crn(t))時(shí)間t中的代碼矢量Wp,Wr調(diào)節(jié)對失真的靈敏度的權(quán)重系數(shù)(固定)采取這樣的矢量量化方法,可以把最佳增益原樣矢量量化,能借助于參數(shù)變換單元的特征,利用功率與各增益的相對大小的相關(guān)性,因而可實(shí)現(xiàn)借助于解碼矢量存儲單元、預(yù)測系數(shù)存儲單元、目標(biāo)提取單元及距離計(jì)算單元的特征,利用功率與2個(gè)增益的相對關(guān)系間的相關(guān)性的增益預(yù)測編碼,并且借助于這些特征,可以充分利用參數(shù)之間的相關(guān)性。
實(shí)施形態(tài)17圖26是表示本實(shí)施形態(tài)的聲音編碼裝置的參數(shù)編碼單元的功能的方框圖。在本實(shí)施形態(tài)中,一邊根據(jù)與聲源的標(biāo)號對應(yīng)的兩個(gè)合成話音和聽覺加權(quán)輸入聲音估算增益量化引起的失真,一邊進(jìn)行矢量量化。
如圖26所示,該參數(shù)編碼單元具備根據(jù)輸入的聽覺輸入聲音、聽覺加權(quán)LPC合成自適應(yīng)聲源、作為聽覺加權(quán)LPC合成噪聲聲源2601的輸入數(shù)據(jù)、解碼矢量存儲單元存儲的解碼矢量,以及預(yù)測系數(shù)存儲單元儲存的預(yù)測系數(shù)計(jì)算進(jìn)行距離計(jì)算所需的參數(shù)的參數(shù)計(jì)算單元2602、存儲過去解碼的代碼矢量的解碼矢量存儲單元2603、存儲預(yù)測系數(shù)的預(yù)測系數(shù)存儲單元2604、使用存儲于預(yù)測系數(shù)存儲單元的預(yù)測系數(shù),計(jì)算以矢量碼本中存儲的多個(gè)代碼矢量解碼時(shí)的編碼失真的距離計(jì)算單元2605、存儲多個(gè)代碼矢量的矢量碼本2606,以及控制矢量碼本和距離計(jì)算單元,根據(jù)從距離計(jì)算單元得到的編碼失真的比較,求出最佳代碼矢量的編號,并根據(jù)求得的編號取出矢量存儲單元所存的代碼矢量,用該代碼矢量更新解碼矢量存儲單元的內(nèi)容的比較單元2607。
下面對具有如上所述結(jié)構(gòu)的參數(shù)編碼單元的矢量量化動作加以說明。預(yù)先生成存儲多個(gè)量化對象矢量的代表性樣本(代碼矢量)的矢量碼本2606。通常是根據(jù)LBG算法(IEEE TRANSACTIONS ON COMMUNICATIONS,VOL.COM-28,NO.1,PP84-95,JANUARY 1980)等生成的。又在預(yù)測系數(shù)存儲單元2604預(yù)先存儲用于進(jìn)行預(yù)測編碼的系數(shù)。該系數(shù)使用與實(shí)施形態(tài)16中說明的預(yù)測系數(shù)存儲單元2505存儲的預(yù)測系數(shù)相同的系數(shù)。又在解碼矢量存儲單元2603存儲表示清音狀態(tài)的數(shù)值作為初始值。
首先,在參數(shù)計(jì)算單元2602,根據(jù)聽覺加權(quán)輸入聲音、聽覺加權(quán)LPC合成自適應(yīng)聲源、聽覺加權(quán)LPC合成噪聲聲源2601,以及解碼矢量存儲單元2603存儲的解碼矢量、預(yù)測系數(shù)存儲單元2604存儲的預(yù)測系數(shù),對距離計(jì)算所需的參數(shù)進(jìn)行計(jì)算。距離算計(jì)單元的距離根據(jù)下式(46)計(jì)算En=Σi=0I(Xi-Gan×Ai-Gsn×Si)2]]>Gan=Orn×e×p(Opn)Gsn=(1-Orn)×e×p(Opn)Opn=Y(jié)p+UpO×Cpn+VpO×CrnYp=Σj=1JUpj×pj+Σj=1JVpj×rj]]>Yr=Σj=1JUrj×pj+Σj=1JVrj×rj---(46)]]>Gan,Gsn解碼增益(Opn,Orn)解碼矢量(Yp,Yr)預(yù)測矢量En使用第n號增益代碼矢量時(shí)的編碼失真Xi聽覺加權(quán)輸入聲音
Ai聽覺加權(quán)LPC合成自適應(yīng)聲源Si聽覺加權(quán)LPC合成隨機(jī)聲源n代碼矢量的編號i聲源數(shù)據(jù)標(biāo)號I子幀長度(輸入聲音的編碼單位)(Cpn,Crn)代碼矢量(pj,rj)過去的解碼矢量Upj,Vpj,Urj,Vrj預(yù)測系數(shù)(固定值)j表示前面第幾個(gè)解碼矢量的標(biāo)號J預(yù)測次數(shù)因而,在參數(shù)計(jì)算單元2602對與代碼矢量的編號無關(guān)的部分進(jìn)行計(jì)算。預(yù)先計(jì)算的是上述預(yù)測矢量和3個(gè)合成話音之間的相關(guān)性及功率。計(jì)算式示于式(47)Yp=Σj=1JUpj×pj+Σj=1JVpj×rj]]>Yr=Σj=1JUrj×pj+Σj=1JVrj×rj]]>Dxx=Σi=0IXi×Xi]]>Dxa=Σi=0IXi×Ai×2]]>Dxs=Σi=0IXi×Si×2]]>Daa=Σi=0IAi×Ai]]>Das=Σi=0IAi×Si×2]]>Dss=Σi=0ISi×Si]]>(Yp,Yr)預(yù)測矢量Dxx,Dxa,Dxs,Daa,Das,Dss合成話音間的相關(guān)值、功率Xi聽覺加權(quán)輸入聲音Ai聽覺加權(quán)LPC合成自適應(yīng)聲源Si聽覺加權(quán)LPC合成隨機(jī)聲源
i聲源數(shù)據(jù)標(biāo)號I子幀長度(輸入聲音的編碼單位)(pj,rj)過去的解碼矢量Upj,Vpj,Urj,Vrj預(yù)測系數(shù)(固定值)j表示前面第幾個(gè)解碼矢量的標(biāo)號J預(yù)測次數(shù)接著,在距離計(jì)算單元2605,根據(jù)參數(shù)運(yùn)算單元2602計(jì)算的各參數(shù)、預(yù)測系數(shù)存儲單元2604存儲的預(yù)測系數(shù)、矢量碼本2606存儲的代碼矢量算出編碼失真。計(jì)算式示于式(48)En=Dxx+(Gan)2×Daa+(Gsn)2×Dss-Gan×Dxa-Gsn×Dxs+Gan×Gsn×DasGan=Orn×exp(Opn)Gsn=(1-Orn)×exp(Opn)Opn=Y(jié)p+UpO×Cpn+VpO×CrnOrn=Y(jié)r+UrO×Cpn+VrO×Crn (48)En使用第n號增益代碼矢量時(shí)的編號失真Dxx,Dxa,Dxs,Daa,Das,Dss合成話音間的相關(guān)值、功率Gan,Gsn解碼增益(Opn,Orn)解碼矢量(Yp,Yr)預(yù)測矢量UpO,VpO,UrO,VrO預(yù)測系數(shù)(固定值)(Cpn,Crn)代碼矢量n代碼矢量的編號還有,實(shí)際上Dxx與代碼矢量的編號n無關(guān),因此可以省略其加法運(yùn)算。
接著,比較單元2607對矢量碼本2606和距離運(yùn)算單元2605進(jìn)行控制,在矢量碼本2606存儲的多個(gè)代碼矢量中,求距離運(yùn)算單元2605計(jì)算出的距離達(dá)到最小的代碼矢量的編號,以此作為增益的代碼2608。又以得到的增益代碼2608為基礎(chǔ)求解碼矢量,用它來更新解碼矢量存儲單元2603的內(nèi)容。解碼矢量根據(jù)式(43)求得。
又,使用更新方法式(44)。
另一方面,聲音解碼裝置預(yù)先備有與聲音編碼裝置相同的矢量碼本、預(yù)測系數(shù)存儲單元、解碼矢量存儲單元,根據(jù)從編碼器傳送來的增益代碼,利用編碼器比較單元生成解碼矢量的功能和解碼矢量存儲單元的更新功能進(jìn)行解碼。
采用具有這樣的結(jié)構(gòu)的實(shí)施例形態(tài),可以一邊根據(jù)與聲源的標(biāo)號對應(yīng)的兩種合成話音和輸入聲音估算增益量化引起的失真,一邊進(jìn)行矢量量化,借助于參數(shù)變換單元的特征,利用功率與各增益的相對大小的相關(guān)性,因而能實(shí)現(xiàn)借助于解碼矢量存儲單元、預(yù)測系數(shù)存儲單元、目標(biāo)提取單元、距離計(jì)算單元的特征,利用功率與2個(gè)增益的相對關(guān)系之間的相關(guān)性的增益預(yù)測編碼,以此可以充分利用參數(shù)之間的相關(guān)性。
實(shí)施形態(tài)18圖27是本實(shí)施形態(tài)的降噪裝置的主要功能方框圖。該降噪裝置裝備于上述聲音編碼裝置。例如,在圖13所示的聲音編碼裝置中設(shè)置在緩沖器1301的前級。
圖27所示的降噪裝置具備A/D變換器272、降噪系數(shù)存儲單元273、降噪系數(shù)調(diào)整單元274、輸入波形設(shè)定單元275、LPC分析單元276、傅利葉變換單元277、降噪/頻譜補(bǔ)償單元278、頻譜穩(wěn)定單元279、反傅利葉變換單元280、頻譜增強(qiáng)單元281、波形匹配單元282、噪聲推定單元284、噪聲頻譜存儲單元285、前頻譜存儲單元286、隨機(jī)相位存儲單元287、前波形存儲單元288、最大功率存儲單元289。
首先對初始設(shè)定加以說明。表10表示固定參數(shù)的名稱和設(shè)定例。
表10


又,隨機(jī)相位存儲單元287預(yù)先存儲用于調(diào)整相位的相位數(shù)據(jù)。這些數(shù)據(jù)在頻譜穩(wěn)定化單元279用于使相位轉(zhuǎn)動。相位數(shù)據(jù)有8種的例子示于表11。
表11

以使用上述相位數(shù)據(jù)為目的的計(jì)數(shù)器(隨機(jī)相位計(jì)數(shù)器)也在隨機(jī)相位存儲單元287存儲著。該數(shù)值預(yù)先初始化為0存儲著。
接著,設(shè)定靜態(tài)的RAM區(qū)域。亦即對降噪系數(shù)存儲單元273、噪聲頻譜存儲單元285、前頻譜存儲單元286、前波形存儲單元288、最大功率存儲單元289清零。下面敘述對各存儲單元的說明和設(shè)定例。
降噪系數(shù)存儲單元273是存儲降噪系數(shù)的區(qū)域,作為初始值存儲著20.0。噪聲頻譜存儲單元285是對各頻率存儲表示平均噪聲功率、平均噪聲頻率,以及1級候補(bǔ)的補(bǔ)償用噪聲頻譜與2級候補(bǔ)的補(bǔ)償用噪聲頻譜各自的頻譜值在幾幀以前有過變化的幀數(shù)(持續(xù)數(shù))的區(qū)域,而且作為初始值對平均噪聲功率存儲足夠大的值,對平均噪聲頻譜存儲指定的最小功率,對補(bǔ)償用噪聲頻譜和持續(xù)數(shù)分別存儲足夠大的數(shù)。
前頻譜存儲單元286是存儲補(bǔ)償用噪聲功率、以前的幀的功率(全頻帶、中頻帶)(前幀功率)、以前的幀的平滑功率(全頻帶、中頻帶)(前幀平滑功率),以及噪聲持續(xù)數(shù)的區(qū)域,作為補(bǔ)償用噪聲功率,存儲足夠大的值,作為前幀功率、全幀平滑功率都存儲0.0,而作為噪聲持續(xù)數(shù)存儲噪聲基準(zhǔn)持續(xù)數(shù)。
前波形存儲單元288是存儲用于使輸出信號匹配的先前幀輸出信號末尾首讀數(shù)據(jù)長度份額的數(shù)據(jù)的區(qū)域,作為初始值全部存儲0。頻譜增強(qiáng)單元281進(jìn)行ARMA及高頻增強(qiáng)濾波,而且將以此為目的的各濾波器的狀態(tài)都清0。最大功率存儲單元289是存儲輸入的信號的功率的最大值的區(qū)域,作為最大功率存儲0。
下面用圖27在每個(gè)方框圖中對降噪算法加以說明。
首先,用A/D變換器272對含有聲音的模擬輸入信號進(jìn)行A/D變換,輸入1幀長度+首讀數(shù)據(jù)長度(上述設(shè)定例中為160+80=240點(diǎn))份額。降噪系數(shù)調(diào)節(jié)單元274根據(jù)降噪系數(shù)存儲單元273存儲的降噪系數(shù)、指定降噪系數(shù)、降噪系數(shù)學(xué)習(xí)系數(shù)及補(bǔ)償功率上升系數(shù),利用式(49)計(jì)算出降噪系數(shù)及補(bǔ)償系數(shù)。然后,將得到的降噪系數(shù)存儲于降噪系數(shù)存儲單元273,同時(shí)將A/D變換器272得到的輸入信號傳送到輸入波形設(shè)定單元275,再將補(bǔ)償系數(shù)與降噪系數(shù)傳送到噪聲推定單元284與降噪頻譜補(bǔ)償單元278。
q=q*C+Q*(1-C)r=Q/q*D……(49)q降噪系數(shù)Q指定的降噪系數(shù)C降噪系數(shù)學(xué)習(xí)系數(shù)r補(bǔ)償系數(shù)D補(bǔ)償助率上升系數(shù)還有,降噪系數(shù)是表示噪聲降低的比例的系數(shù),指定降噪系數(shù)是指預(yù)先指定的固定降躁系數(shù)、降噪系數(shù)學(xué)習(xí)系數(shù)是表示降噪系數(shù)接近指定降噪系數(shù)的比例的系數(shù),補(bǔ)償系數(shù)是調(diào)節(jié)頻譜補(bǔ)償?shù)难a(bǔ)償功率的系數(shù),補(bǔ)償功率上升系數(shù)是調(diào)節(jié)補(bǔ)償系數(shù)的系數(shù)。
在輸入波形設(shè)定單元275,為了能夠進(jìn)行FFT(快速傅利葉變換),將來自A/D變換器272的輸入信號從后面開始寫入具有2的乘方的長度的存儲器陣列。前面的部分填上0。在上述設(shè)定例中,在長度為256的陣列中0~15寫入0,16~255寫入輸入信號。這一數(shù)組在進(jìn)行8階快速傅利葉變換(FFT)時(shí)用作實(shí)數(shù)部分。又,虛數(shù)部分準(zhǔn)備與實(shí)數(shù)部分相同長度的陣列,全部寫著0。
在LPC分析單元276,對輸入波形設(shè)定單元275設(shè)定的實(shí)數(shù)區(qū)域加上漢明窗,并對加漢明窗后的波形進(jìn)行自相關(guān)分析,求自相關(guān)函數(shù),進(jìn)行基于自相關(guān)法的LPC分析,得到線性預(yù)測系數(shù)。再把得到的線性預(yù)測系數(shù)傳送到頻譜增強(qiáng)單元281。
傅利葉變換單元277有在輸入波形設(shè)定單元275得到的實(shí)數(shù)部分、虛數(shù)部分的存儲器陣列進(jìn)行采用高速傅利葉變換的離散傅利葉變換。計(jì)算得到的復(fù)數(shù)頻譜的實(shí)數(shù)部分與虛數(shù)部分的絕對值之和,以此求輸入信號的模擬振幅頻譜(下稱輸入頻譜)。又求出各頻率的輸入頻譜值的總和(下稱輸入功率),傳送到噪聲推定單元284。又將復(fù)數(shù)頻譜本身傳送到頻譜穩(wěn)定單元279。
下面對噪聲推定單元284的處理加以說明。
噪聲推定單元284將傅利葉變換單元277得到的輸入功率與最大功率存儲單元289存儲的最大功率數(shù)值加以比較,在最大功率較小的情況下,以輸入功率數(shù)值作為最大功率數(shù)值,將該數(shù)值存儲于最大功率存儲單元289,然后,在符合下面三個(gè)條件中的至少一個(gè)時(shí)進(jìn)行噪聲推定,在完全不滿足時(shí)不進(jìn)行噪聲推定。
(1)輸入功率比最大功率乘以無聲檢測系數(shù)的積小。
(2)降噪系數(shù)比指定降噪系數(shù)加0.2的和大。
(3)輸入比從噪聲頻譜存儲單元285得到的平均噪聲功率乘以1.6的積小。
這里地噪聲推定單元284的噪聲推定算法加以敘述。
首先,對噪聲頻譜存儲單元285存儲的1級候補(bǔ)、2級候補(bǔ)的全部頻率的持續(xù)數(shù)進(jìn)行更新(加1)。然后,調(diào)查1級候補(bǔ)的各頻率的持續(xù)數(shù),在比預(yù)先設(shè)定的噪聲頻譜基準(zhǔn)持續(xù)數(shù)大時(shí),以2級候補(bǔ)的補(bǔ)償用頻譜與持續(xù)數(shù)作為1級候補(bǔ),以2級候補(bǔ)的補(bǔ)償用頻譜作為3級候補(bǔ)的補(bǔ)償用頻譜,取持續(xù)數(shù)為0。但是,在調(diào)換該2級候補(bǔ)的補(bǔ)償用頻譜時(shí)不存儲3級候補(bǔ),而以2級候補(bǔ)經(jīng)若干放大代用,以此可以節(jié)省存儲器。在本實(shí)施形態(tài)中,以2級候補(bǔ)的補(bǔ)償用頻譜放大1.4倍代用。
在持續(xù)數(shù)更新后,對各頻率進(jìn)行補(bǔ)償用噪聲頻譜與輸入頻譜的比較。首先,將各頻率的輸入頻譜與1級候補(bǔ)的補(bǔ)償用噪聲頻譜用比較,如果輸入頻譜較小,就取1級候補(bǔ)的補(bǔ)償用噪聲頻譜與持續(xù)數(shù)為2級候補(bǔ),以輸入頻譜作為1級候補(bǔ)的補(bǔ)償用頻譜,并將1級候補(bǔ)的持續(xù)數(shù)取0。在上述條件以外的情況下,進(jìn)行輸入頻譜與2級候補(bǔ)的補(bǔ)償用噪聲譜的比較,如果是輸入頻譜較小,取輸入頻譜為2級候補(bǔ)的補(bǔ)償用頻譜,并將2級候補(bǔ)的持續(xù)數(shù)取0。然后,將得到的1、2級候補(bǔ)的補(bǔ)償用頻率與持續(xù)數(shù)存儲于補(bǔ)償用噪聲頻譜存儲單元285。同時(shí),對平均噪聲頻譜也按照下面的式(50)進(jìn)行更新。
si=si*g+Si*(1-g)……(50)s平均噪聲頻譜 S輸入頻譜g0.9(輸入功率比平均噪聲功率的一半大的情況下)0.5(輸入功率比平均噪聲功率的一半小的情況下)i頻率編號還有,平均噪聲頻譜是用模擬的方式求得的平均噪聲頻譜,式(50)中的系數(shù)g是調(diào)節(jié)平均噪聲頻譜學(xué)習(xí)的快慢的系數(shù)。亦即,是具有在輸入功率與噪聲功率相比較小的情況下,判斷為是只有噪聲的區(qū)間的可能性大,提高學(xué)習(xí)速度,在并非較小的情況下判斷為有可能是在聲音區(qū)間中,降低學(xué)習(xí)速度的效果的系數(shù)。
然后,求平均噪聲頻譜各頻率值的總和,以此作為平均噪聲功率。補(bǔ)償用噪聲譜、平均噪聲譜、平均噪聲功率存儲于噪聲頻譜存儲單元285。
又,在上述噪聲推定處理中,如果使1個(gè)頻率的噪聲頻譜與多個(gè)頻率的輸入頻譜對應(yīng),則可以節(jié)省構(gòu)成噪聲頻譜存儲單元285用的RAM容量。下面舉出使用本實(shí)施形態(tài)的256點(diǎn)的FFT的情況下,根據(jù)4個(gè)頻率的輸入頻譜推定1個(gè)頻率的噪聲頻譜時(shí)的、噪聲頻譜存儲單元285的RAM容量為例。考慮(模擬)振幅頻譜以頻率軸左右對稱,在所有頻率進(jìn)行推定的情況下,由于存儲128個(gè)頻率的頻譜和持續(xù)數(shù),需要128(頻率)×2(頻譜與持續(xù)數(shù))×3(補(bǔ)償用的1、2級候補(bǔ)、平均),即共計(jì)768W的RAM容量。
與此相反,在使1個(gè)頻率的噪聲頻譜與4個(gè)頻率的輸入頻譜對應(yīng)的情況下,需要32(頻率)×2(頻譜與持續(xù)數(shù))×3(補(bǔ)償用的1、2級候補(bǔ)、平均),即共計(jì)192W的RAM容量即可。實(shí)驗(yàn)證實(shí),雖然在這種情況下,噪聲頻譜頻率的分辨率降低,但是在上述1對4的情況下性能幾乎沒有變壞。而且由于這一做法不是以1個(gè)頻率的頻譜推定噪聲頻譜,在穩(wěn)態(tài)聲(正弦波、元音等)長時(shí)間持續(xù)的情況下,也有防止把這種頻譜錯(cuò)誤推定為噪聲頻譜的效果。
下面對降噪/頻譜補(bǔ)償單元278進(jìn)行的處理加以說明。
從輸入的頻譜中減去噪聲頻譜存儲單元285存儲的平均噪聲頻譜與降噪系數(shù)調(diào)節(jié)單元274得到的降噪系數(shù)的乘積(以下稱差頻譜)。在節(jié)約上述噪聲推定單元284的說明中所示的、噪聲頻譜存儲單元285的RAM容量的情況下,減去與輸入頻譜對應(yīng)的頻率的平均噪聲頻譜與降噪系數(shù)的乘積。然后,在差額譜為負(fù)的情況下,將噪聲頻譜存儲單元285存儲的補(bǔ)償用噪聲頻譜的1級候補(bǔ)與降噪系數(shù)調(diào)節(jié)單元274求出的補(bǔ)償系數(shù)的乘積代入以進(jìn)行補(bǔ)償。這一點(diǎn)對所有頻率進(jìn)行。又,對每一頻率生成標(biāo)志數(shù)據(jù),以便判明補(bǔ)償差頻譜的頻率。例如,每一頻率有一個(gè)區(qū)域,在不補(bǔ)償時(shí)代入0,在補(bǔ)償時(shí)代入1。這一標(biāo)志數(shù)據(jù)與差頻譜一起被送到頻譜穩(wěn)定單元279。又,調(diào)查標(biāo)志數(shù)據(jù)的值以求出補(bǔ)償?shù)目倲?shù)(補(bǔ)償數(shù)),也將其送往頻譜穩(wěn)定單元279。
接著,對頻譜穩(wěn)定單元279的處理加以說明。這一處理主要是為了起減小對不含聲音的區(qū)間的異常感覺的作用。
首先,計(jì)算降噪/頻譜補(bǔ)償單元278得到的各頻率的差頻譜之和求當(dāng)前幀的功率。當(dāng)前幀功率求全頻帶與中頻帶兩種。全頻帶是對全部頻率(所謂全頻帶,在本實(shí)施形態(tài)是0~128)求得的,中頻帶是對聽覺重要的中間附近的頻帶(所謂中頻帶,在本實(shí)施形態(tài)是16~79)求得的。
同樣,求關(guān)于噪聲頻譜存儲單元285存儲的補(bǔ)償用噪聲頻譜的1級候補(bǔ)的和,以此作為當(dāng)前幀噪聲功率(全頻帶、中頻帶)。在這里,調(diào)查降噪/頻譜補(bǔ)償單元278得到的補(bǔ)償數(shù)值,在足夠大的情況下,并且又是滿足下述3個(gè)條件中的至少1個(gè)的情況下,判斷當(dāng)前幀是只有噪聲的區(qū)間,進(jìn)行頻譜的穩(wěn)定處理。
(1)輸入功率比最大功率乘以無聲檢測系數(shù)的積小。
(2)當(dāng)前幀功率(中頻帶)比當(dāng)前幀噪聲功率(中頻帶)乘以5.0的積小。
(3)輸入功率比噪聲基準(zhǔn)功率小。
不進(jìn)行穩(wěn)定處理時(shí),前頻譜存儲單元286存儲的噪聲持續(xù)數(shù)為正時(shí)減小,又以當(dāng)前幀噪聲功率(全頻帶、中頻帶)為前幀功率(全頻帶、中頻帶),分別存儲于前頻譜存儲單元286,并進(jìn)入相位擴(kuò)散處理。
在這里對領(lǐng)譜穩(wěn)定處理加以說明。這一處理的目的是實(shí)現(xiàn)無聲區(qū)間(沒有聲音只有噪聲的區(qū)間)的頻譜的穩(wěn)定和減小功率。處理有兩種,在噪聲持續(xù)數(shù)比噪聲基準(zhǔn)持續(xù)數(shù)小的情況下實(shí)施處理1,在前者超過后者的情況下實(shí)施處理2。下面對兩種處理進(jìn)行說明。
處理1對前頻譜存儲單元286存儲的噪聲持續(xù)數(shù)加1,又將當(dāng)前幀噪聲功率(全這、中頻帶)當(dāng)作前幀功率(全頻帶、中頻帶),分別存儲于前頻譜存儲單元286,并進(jìn)入相位調(diào)整處理。
處理2參照前頻譜存儲單元286存儲的前幀功率、前幀平滑功率、還有作為固定系數(shù)的無聲功率降低系數(shù),按照式(51)分別使其變更。
Dd80=Dd80*0.8+A80*0.2*PD80=D80*0.5+Dd80*0.5Dd129=Dd129*0.8+A129*0.2*P (51)D129=D129*0.5+Dd129*0.5Dd80前幀平滑功率(中頻帶)D80前幀功率(中頻帶)Dd129前幀平滑功率(全頻帶)D129前幀功率(全頻帶)A80當(dāng)前幀噪聲功率(中頻帶)A129當(dāng)前幀噪聲功率(全頻帶)接著,使這些功率反映于差頻譜中。為此,計(jì)算中頻帶所乘的系數(shù)(以下稱系數(shù)1)與全頻帶所乘的系數(shù)(以下稱系數(shù)2)等兩個(gè)系數(shù)。首先,以下式(式(52))計(jì)算系數(shù)1。
r1=D80/A80(A80>0時(shí))1.0(A80 0時(shí))(52)r1系數(shù)1D80前幀功率(中頻帶)A80當(dāng)前幀噪聲功率(中頻帶)系數(shù)2受系數(shù)1的影響,因此,求取的手段有些復(fù)雜。其步驟如下。
(1)在前幀平滑功率(全頻帶)比前幀功率(中頻帶)小的情況下,或當(dāng)前幀噪聲功率(全頻帶)比當(dāng)前幀噪聲功率(中頻帶)小的情況下,轉(zhuǎn)入步驟(2),其他情況下轉(zhuǎn)入步驟(3)。
(2)系數(shù)2取0.0,以前幀功率(全頻帶)作為前幀功率(中頻帶),轉(zhuǎn)入步驟(6)。
(3)在當(dāng)前幀噪聲功率(全頻帶)與當(dāng)前幀噪聲功率(中頻帶)相等時(shí)轉(zhuǎn)入步驟(4),在不相等時(shí)轉(zhuǎn)入(5)。
(4)系數(shù)取1.0,并轉(zhuǎn)入(6)。
(5)利用下述式(53)求系數(shù)2,并轉(zhuǎn)入(6)。
r2=(D129-D80)/(A129-A80) (53)r2系數(shù)2D129前幀功率(全頻帶)D80前幀功率(中頻帶)A129當(dāng)前幀噪聲功率(全頻帶)A80當(dāng)前幀噪聲功率(中頻帶)(6)系數(shù)2計(jì)算處理結(jié)束。
利用上述算法得到的系數(shù)1、2都把上限箝于1.0,把下限箝于無聲功率降低系數(shù)。然后,把中頻帶的頻率(本例中為16~79)的差頻譜乘以系數(shù)1得到的積作為差頻譜,再把該差頻譜的全頻帶中去除中頻帶后的頻率(本例中為0~15,80~128)的差頻譜乘以系數(shù)2得到的積作為差頻譜。與此同時(shí),利用下面的式(54)變換前幀功率(全頻帶、中頻帶)。
D80=A80*r1D129=D80+(A129-A80)*r2 (54)r1系數(shù)1r2系數(shù)2D80前幀功率(中頻帶)A80當(dāng)前幀噪聲功率(中頻帶)D129前幀功率(全頻帶)A129當(dāng)前幀噪聲功率(全頻帶)將這樣得到的各種功率數(shù)據(jù)全部存儲于前頻譜存儲單元286,結(jié)束處理(2)。
根據(jù)上述要領(lǐng)在頻譜穩(wěn)定單元279實(shí)現(xiàn)頻譜穩(wěn)定。
下面對相位調(diào)整處理加以說明。在已往的頻譜相減中,相位原則上不變,但是本實(shí)施形態(tài)中,在該頻率的頻譜在削減時(shí)得到補(bǔ)償?shù)那闆r下,進(jìn)行隨機(jī)修改相位的處理。由于這一處理,余下的噪聲的隨機(jī)性加強(qiáng),因此有在聽覺上不大會給人以不良印象的效果。
首先,得到隨機(jī)相位存儲單元287存儲的隨機(jī)相位計(jì)數(shù)器。然后,參照全部頻率的標(biāo)志數(shù)據(jù)(表示有否補(bǔ)償?shù)臄?shù)據(jù)),正在補(bǔ)償時(shí),利用下面的式(55),使在傅利葉變換單元277得到的復(fù)數(shù)頻譜的相位旋轉(zhuǎn)。
Bs=Si*Rc-Ti*Rc+1Bt=Si*Rc+1+Ti*RcSi=Bs(55)Ti=BtSi、Ti復(fù)數(shù)頻譜、i表示頻率的標(biāo)號R隨機(jī)相位數(shù)據(jù)、c隨機(jī)相位計(jì)數(shù)器Bs、Bt計(jì)算基數(shù)寄存器在式(55)中,成對使用兩個(gè)隨機(jī)相位數(shù)據(jù)。因而,每進(jìn)行一次上述處理,使隨機(jī)相位計(jì)數(shù)器增加2,在達(dá)到上限(在本實(shí)施形態(tài)中為16)的情況下取0。還有,隨機(jī)相位計(jì)數(shù)器存儲于隨機(jī)相位存儲單元287,所得到的復(fù)數(shù)頻譜傳送到反傅利葉變換單元280。求出差頻譜的總和(以下稱差頻譜功率),將其傳送到頻率增強(qiáng)單元281。
反傅利葉變換單元280,根據(jù)頻譜穩(wěn)定單元279得到的差頻譜的幅和復(fù)數(shù)頻譜的相位,構(gòu)成新的復(fù)數(shù)頻譜,用FFT進(jìn)行反傅利葉變換。(把所得到的信號稱為第1次輸出信號)。然后,將所得到的第1次輸出信號傳送到頻譜增強(qiáng)單元281。
下面對頻譜增強(qiáng)單元281的處理加以說明。
首先,參照噪聲頻譜存儲單元285存儲的平均噪聲功率、頻譜穩(wěn)定單元279得到的差頻譜功率、作為常數(shù)的噪聲基準(zhǔn)功率,選擇MA增強(qiáng)系數(shù)與AR增強(qiáng)系數(shù)。選擇根據(jù)對下述兩個(gè)條件進(jìn)行的評價(jià)進(jìn)行。
條件1差頻譜功率比噪聲頻譜存儲單元285存儲的平均噪聲功率乘以0.6得到的積大,并且平均噪聲功率比噪聲基準(zhǔn)功率大。
條件2差頻譜功率比平均噪聲功率大。
滿足條件(1)時(shí),以此作為“濁音區(qū)間”,取MA增強(qiáng)系數(shù)為MA增強(qiáng)系數(shù)1-1,取AR增強(qiáng)系數(shù)為AR增強(qiáng)系數(shù)1-1,取高頻增強(qiáng)系數(shù)為高頻增強(qiáng)系數(shù)1。而在不滿足條件(1),而滿足條件(2)的情況下,將其當(dāng)作“清音區(qū)間”,取MA增強(qiáng)系數(shù)為MA增強(qiáng)系數(shù)1-0,取AR增強(qiáng)系數(shù)為AR增強(qiáng)系數(shù)1-0,取高頻增強(qiáng)系數(shù)為0。又,在不滿足條件(1),又不滿足條件(2)的情況下,以此作為“無聲區(qū)間(只有噪聲的區(qū)間)”,取MA增強(qiáng)系數(shù)為MA增強(qiáng)系數(shù)0,取AR增強(qiáng)系數(shù)為AR增強(qiáng)系數(shù)0,取高頻增強(qiáng)系數(shù)為高頻增強(qiáng)系數(shù)0。
然后,使用LPC分析單元276得到的線性預(yù)測系數(shù)、上述MA增強(qiáng)系數(shù)、AR增強(qiáng)系數(shù),根據(jù)下述式(56),計(jì)算出極點(diǎn)增強(qiáng)濾波器的MA系數(shù)與AR系數(shù)。
α(ma)i=αi*βiα(ar)i=αi*γi (56)α(ma)iMA系數(shù)α(ar)iAR系數(shù)αi線性預(yù)測系數(shù)βMA增強(qiáng)系數(shù)γAR增強(qiáng)系數(shù)
i編號然后,對在反傅利葉變換單元280得到的第1次輸出信號,用上述MA系數(shù)與AR系數(shù)乘極點(diǎn)增強(qiáng)濾波器。此濾波器的傳遞函數(shù)示于下面的式(57)。
1+α(ma)1×Z-1+α(ma)2×Z-2+Λ+α(ma)j×Z-j1+α(ar)1×Z-1+α(ar)2×Z-2+Λ+α(ar)j×Z-j---(57)]]>α(ma)iMA系數(shù)α(ar)iAR系數(shù)j次數(shù)進(jìn)而,為了增強(qiáng)高頻成分,用上述高頻增強(qiáng)系數(shù)乘高頻增強(qiáng)濾波器。此濾波器的傳遞函數(shù)示于下述式(58)。
1-δZ-1……(58)δ為高頻增強(qiáng)系數(shù)上述處理得到的信號稱為第2次輸出信號。還有,濾波器的狀態(tài)保持于頻譜增強(qiáng)單元281的內(nèi)部。
最后,在波形匹配單元282,利用三角窗使頻譜增強(qiáng)單元281得到的第2次輸出信號和前波形存儲單元288存儲的信號重迭,得到輸出信號。還把該輸出信號的末尾首讀數(shù)據(jù)長度份額的數(shù)據(jù)存儲于前波形存儲單元288。這時(shí)的匹配方法示于下面的式(59).
Oj=(j×Dj+(L-j)×Zj)/L (j=0~L-1)Oj=Di(j=L~L+M-1)Zj=OM+1(j=0~L-1)(59)Oj輸出信號Dj第2次輸出信號Zj輸出信號L首讀數(shù)據(jù)長度M幀長度這里需要注意的是,作為輸出信號,輸出首讀數(shù)據(jù)長度+幀長度份額的數(shù)據(jù),但是,其中能夠作為信號處理的只有從數(shù)據(jù)的始端起,長度等于幀長度的區(qū)間。這是因?yàn)?,后面的首讀數(shù)據(jù)長度的數(shù)據(jù)在輸出下一輸出信號時(shí)被改寫。但是,在輸出信號的全部區(qū)間內(nèi)連續(xù)性受到補(bǔ)償,因此能夠使用于LPC分析和濾波器分析等頻率分析中。
采用這樣的實(shí)施形態(tài),在聲音區(qū)間中和聲音區(qū)間外都能夠進(jìn)行噪聲頻譜推定,即使是在搞不清楚聲音在哪一個(gè)時(shí)間存在于全部數(shù)據(jù)的情況下,也能夠推定噪聲頻譜。
此外,可以用線性預(yù)測系數(shù)增強(qiáng)輸入的頻譜包絡(luò)的特征,即使是在噪聲電平高的情況下也能防止音質(zhì)劣化。
還可以從平均和最低兩個(gè)方向推定噪聲的頻譜,因而能夠進(jìn)行更恰當(dāng)?shù)慕翟胩幚怼?br> 又,將噪聲的平均頻譜用于降噪處理,可以在更大程度上削減噪聲頻譜,還可以另外推定補(bǔ)償用頻譜,以更恰當(dāng)?shù)剡M(jìn)行補(bǔ)償。
而且,可以使不含聲音、只有噪聲的區(qū)間的頻譜平滑,因而能夠防止同區(qū)間的頻譜由于噪聲的減小而由極端的頻譜變動引起異常感覺。
還可以使補(bǔ)償?shù)念l率成分具有隨機(jī)性,將不削去而留下的噪聲變換成聽覺上異常感覺小的噪聲。
又,在聲音區(qū)間,可以實(shí)施在聽覺上更恰當(dāng)?shù)募訖?quán),在無聲音的區(qū)間和清輔音區(qū)間,可以抑制由聽覺加權(quán)引起的異常感覺。
工業(yè)應(yīng)用性如上所述,本發(fā)明的聲源矢量生成裝置,聲音編碼裝置和聲音解碼裝置對于聲源矢量檢索是有用的,適合于提高音質(zhì)。
權(quán)利要求
1.一種聲源矢量生成裝置,其特征在于,包括矢量提供單元,用于提供輸入聲源矢量;波形提供單元,用于從存儲裝置提供固定波形;以及變形單元,用于通過使用所述輸入聲源矢量和所述固定波形,生成變形聲源矢量。
2.一種具有聲源矢量生成裝置的CELP型聲音編碼裝置,其特征在于,所述聲源矢量生成裝置包括矢量提供單元,用于提供輸入聲源矢量;波形提供單元,用于從存儲裝置提供固定波形;以及變形單元,用于通過使用所述輸入聲源矢量和所述固定波形,生成變形聲源矢量。
3.一種具有聲源矢量生成裝置的CELP型聲音解碼裝置,其特征在于,所述聲源矢量生成裝置包括矢量提供單元,用于提供輸入聲源矢量;波形提供單元,用于從存儲裝置提供固定波形;以及變形單元,用于通過使用所述輸入聲源矢量和所述固定波形,生成變形聲源矢量。
4.一種用于CELP型聲音編碼裝置或CELP型聲音解碼裝置的聲源矢量生成方法,其特征在于,包括如下步驟提供輸入聲源矢量;從存儲裝置提供固定波形;以及通過使用所述輸入聲源矢量和所述固定波形,生成變形聲源矢量。
全文摘要
本發(fā)明揭示一種聲源矢量生成裝置以及聲音編碼裝置和聲音解碼裝置。將以往的CELP型聲音編碼/解碼裝置的噪聲向量讀出單元和噪聲碼本,分別置換為根據(jù)輸入振種的值輸出不同矢量系列的振蕩器和存儲多個(gè)振種(產(chǎn)生振蕩器振蕩的“種子”)的振種存儲單元。由此,不必將固定矢量原樣地存儲在固定碼本(ROM)中,能大幅度地減小存儲器容量。
文檔編號G10L19/08GK1877698SQ20061010070
公開日2006年12月13日 申請日期1997年11月6日 優(yōu)先權(quán)日1996年11月7日
發(fā)明者安永和敏, 森井利幸, 渡邊泰助, 江原宏幸 申請人:松下電器產(chǎn)業(yè)株式會社
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1