亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

聲音譯碼方法以及聲音譯碼裝置的制作方法

文檔序號:7621739閱讀:155來源:國知局
專利名稱:聲音譯碼方法以及聲音譯碼裝置的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及對聲音信號進行數(shù)字信號的壓縮編碼譯碼時使用的聲音編碼譯碼方法和聲音編碼譯碼裝置,特別涉及用來使用低比特率再生高品質(zhì)的聲音的聲音編碼方法、聲音譯碼方法、聲音編碼裝置和聲音譯碼裝置。
背景技術(shù)
過去,作為高效率聲音編碼方法,典型的有碼驅(qū)動線性預(yù)測編碼(Code-Excited Linear PredictionCELP),對該技術(shù),“Code-ExcitedLinear Prediction(CELP)High-quality speech at very low bitrates”(M.R.Shroeder and B.S.Atal著、ICASSP’85,pp.937-940,1985)已有敘述。
圖6是表示一例CELP聲音編碼方法的整體構(gòu)成的圖。圖中101是編碼部,102是譯碼部,103是多路復(fù)用裝置,104是分離裝置。編碼部101由線性預(yù)測參數(shù)分析裝置105、線性預(yù)測參數(shù)編碼裝置106、合成濾波器107、適應(yīng)代碼簿108、驅(qū)動代碼簿109、增益編碼裝置110、距離計算裝置111和加權(quán)相加計算裝置138構(gòu)成。此外,譯碼部102由線性預(yù)測參數(shù)譯碼裝置112、合成濾波器113、適應(yīng)代碼簿114、驅(qū)動代碼簿115、增益譯碼裝置116和加權(quán)相加計算裝置139構(gòu)成。
在CELP聲音編碼中,將5~50ms作為一幀,將該幀的聲音分成頻譜信息和聲音源信息后進行編碼。首先,說明CELP聲音編碼方法的動作。在編碼部101中,線性預(yù)測參數(shù)分析裝置105分析輸入聲音S101,抽出作為聲音頻譜信息的線性預(yù)測參數(shù)。線性預(yù)測參數(shù)編碼裝置106對該線性預(yù)測參數(shù)進行編碼,將該編碼后的線性預(yù)測參數(shù)作為合成濾波器的系數(shù)來設(shè)定。
其次,說明聲音源信息的編碼。在適應(yīng)代碼簿108中,存儲過去的驅(qū)動聲音源信號,并與距離計算裝置111輸入的適應(yīng)代碼對應(yīng)輸出周期性的重復(fù)過去的驅(qū)動聲音源信號的時間序列矢量。在驅(qū)動代碼簿109中,存儲多個時間序列矢量,該時間序列矢量構(gòu)成為例如能夠進行學(xué)習(xí),使學(xué)習(xí)用聲音和它的編碼聲音的失真很小。從適應(yīng)代碼簿108、驅(qū)動代碼簿109來的各時間序列矢量與增益編碼裝置110給出的各增益對應(yīng),在加權(quán)相加計算裝置138中進行加權(quán)相加,將該計算結(jié)果作為驅(qū)動聲音信號供給合成濾波器107,得到編碼聲音。距離計算裝置111求出編碼聲音和輸入聲音S101的距離,尋求距離最小的適應(yīng)代碼、驅(qū)動代碼和增益。在上述編碼結(jié)束后,將線性預(yù)測參數(shù)的代碼以及使輸入聲音和編碼聲音的失真最小的適應(yīng)代碼、驅(qū)動代碼、增益的代碼作為編碼結(jié)果輸出。
其次,說明CPEL聲音譯碼方法的動作。
另一方面,在聲音譯碼部102中,線性預(yù)測參譯編碼裝置112根據(jù)線性預(yù)測參數(shù)的代碼對該線性預(yù)測參數(shù)進行譯碼,并作為合成濾波器的系數(shù)來設(shè)定。其次,適應(yīng)代碼簿114與適應(yīng)代碼對應(yīng)輸出周期性的重復(fù)過去的驅(qū)動聲音源信號的時間序列矢量,驅(qū)動代碼簿115與驅(qū)動代碼對應(yīng)時間序列矢量。這些時間序列矢量與增益譯碼裝置中從增益代碼譯碼的各增益對應(yīng),在加權(quán)相加計算裝置139中進行加權(quán)相加,將該計算結(jié)果作為驅(qū)動聲音信號供給合成濾波器113,得到輸出聲音S103。
此外,在CELP聲音編碼譯碼方法中,作為以提高再生聲音品質(zhì)為目的進行改良的先有的聲音編碼譯碼方法,有“Phonetically-basedvector excitation coding of speech at 3.6kbps”(S.wang andA.Gersho著、ICASSP’89,pp.49-52,1989)所示的方法。圖7示出一例該先有的聲音編碼譯碼方法的整體構(gòu)成,對與圖6對應(yīng)的裝置添加相同的符號,在圖中的編碼部101中,117是聲音狀態(tài)判定裝置,118是驅(qū)動代碼簿切換裝置,119是第1驅(qū)動代碼簿,120是第2驅(qū)動代碼簿。此外,在圖中的譯碼裝置102中,121是驅(qū)動代碼簿切換裝置,122是第1驅(qū)動代碼簿,123是第2驅(qū)動代碼簿。說明這樣構(gòu)成的編碼譯碼方法的動作。首先,在編碼裝置101中,聲音狀態(tài)判定裝置117分析輸入聲音S101,判定聲音狀態(tài)例如是有聲、無聲兩種狀態(tài)中的哪一種狀態(tài)。驅(qū)動代碼簿切換裝置118根據(jù)該聲音狀態(tài)的判定結(jié)果切換驅(qū)動代碼簿,例如,若是有聲則使用第1驅(qū)動代碼簿119編碼,若是無聲則使用第2驅(qū)動代碼簿120編碼,此外,對使用了哪一個驅(qū)動代碼簿也進行編碼。
其次,在譯碼裝置102中,驅(qū)動代碼簿切換裝置121與在編碼裝置中使用了哪一個驅(qū)動代碼簿的代碼對應(yīng)切換到第1驅(qū)動代碼簿或第2驅(qū)動代碼簿,使其與編碼裝置101使用的驅(qū)動代碼簿相同。通過這樣的構(gòu)成,對聲音的每一個狀態(tài)準(zhǔn)備一個與編碼適應(yīng)的驅(qū)動代碼簿,通過與輸入的聲音狀態(tài)對應(yīng)切換使用驅(qū)動代碼簿,可以提高再生聲音的品質(zhì)。
此外,作為不增加比特數(shù)去切換多個驅(qū)動代碼簿的先有的聲音編碼譯碼方法,有特開平8-185198號公報公開的方法。它是與用適應(yīng)代碼簿選擇的音調(diào)周期對應(yīng)去切換使用多個驅(qū)動代碼簿的方法。因此,可以在不增加傳送信息的情況下使用與輸入信號的特征相適應(yīng)的驅(qū)動代碼簿。
如上所述,在圖6所示的先有的聲音編碼譯碼方法中,使用單一的驅(qū)動代碼簿生成合成聲音。為了即使在低比特率時也能得到高品質(zhì)的編碼聲音,存儲在驅(qū)動代碼簿中的時間序列矢量變成包含很多脈沖的無噪聲的東西。因此,當(dāng)將背景噪聲或磨擦性子音等有噪聲的聲音編碼合成時,編碼聲音存在產(chǎn)生“嘰哩嘰哩”“嘁哩嘁哩”等不自然的聲音的問題。若使驅(qū)動編碼簿只由帶噪聲的時間序列矢量構(gòu)成,雖然可以解決該問題,但作為編碼聲音的整體品質(zhì)卻變差了。
此外,在已改良的圖7所示的先有的聲音編碼譯碼方法中,與輸入聲音的狀態(tài)對應(yīng)切換多個驅(qū)動代碼簿并生成編碼聲音。因此,對例如輸入聲音是有噪聲的無聲部分,可以使用由有噪聲的時間序列矢量構(gòu)成的驅(qū)動代碼簿,對除此之外的有聲部分可以使用由無噪聲的時間序列矢量構(gòu)成的驅(qū)動代碼簿,即使對有噪聲的聲音進行編碼、也不會發(fā)生“嘰哩嘰哩”的聲音。但是,因譯碼側(cè)也使用和編碼側(cè)相同的驅(qū)動代碼簿,故有必要對使用了哪一個驅(qū)動編碼簿的信息重新進行編碼傳送,存在妨礙低比特率化的問題。
此外,在不增加發(fā)送比特數(shù)的情況下切換多個驅(qū)動代碼簿的先有的聲音編碼譯碼方法中,與用適應(yīng)代碼選擇的音調(diào)周期對應(yīng)切換驅(qū)動代碼簿。但是,因用適應(yīng)代碼選擇的音調(diào)周期與實際的聲音音調(diào)周期有差別,只根據(jù)該值不能判定輸入聲音的狀態(tài)是有噪聲還是無噪聲,故不能解決聲音的噪聲部分的編碼聲音不自然的問題。

發(fā)明內(nèi)容
本發(fā)明是為了解決有關(guān)的問題而提出的,其目的在于提供一種聲音編碼譯碼方法和聲音編碼譯碼裝置,即使在低比特率的情況下也能再生高品質(zhì)的聲音。
為了解決上述課題,本發(fā)明的聲音編碼方法使用頻譜信息、功率信息和音調(diào)信息中的至少一個代碼或編碼結(jié)果,對該編碼區(qū)間中的聲音的噪聲水平進行評價,根據(jù)評價結(jié)果選擇多個驅(qū)動代碼中的一個。
本發(fā)明的一種按照編碼驅(qū)動線性預(yù)測(CELP)的聲音譯碼方法,其特征在于,所述聲音譯碼方法接收聲音編碼并利用至少一個驅(qū)動編碼簿對聲音進行合成,所述聲音譯碼方法包括下列步驟從所述驅(qū)動編碼簿獲得帶有噪聲水平的時間序列矢量;確定是否需要對所述時間序列矢量作出修改;如果確定需要進行修改,則對所述時間序列矢量進行修改,使得所述噪聲水平改變;輸出所述時間序列矢量;及利用所述輸出的時間序列矢量對聲音進行合成。
與此對應(yīng),本發(fā)明的一種按照編碼驅(qū)動線性預(yù)測(CELP)的聲音譯碼裝置,其特征在于,所述聲音譯碼裝置接收聲音編碼并利用至少一個驅(qū)動編碼簿對聲音進行合成,所述聲音譯碼裝置包括時間序列矢量調(diào)制裝置,用于從所述驅(qū)動編碼簿獲得帶有噪聲水平的時間序列矢量,并確定是否需要對所述時間序列矢量作出修改,如果確定需要進行修改,則用于對所述時間序列矢量進行修改,使得所述噪聲水平改變,及用于輸出所述時間序列矢量;和聲音合成裝置,用于利用所述輸出的時間序列矢量對聲音進行合成。
進而,下一個發(fā)明的聲音編碼方法具有多個驅(qū)動代碼簿,所存儲的時間序列矢量的噪聲水平不同,根據(jù)聲音的噪聲水平的評價結(jié)果切換多個驅(qū)動代碼簿。
進而,下一個發(fā)明的聲音編碼方法根據(jù)聲音的噪聲水平的評價結(jié)果,使存儲在驅(qū)動代碼簿中時間序列矢量的噪聲水平發(fā)生變化。
進而,下一個發(fā)明的聲音編碼方法具有存儲有噪聲的時間序列矢量的驅(qū)動代碼簿,根據(jù)聲音的噪聲水平的評價結(jié)果,通過間拔驅(qū)動聲音源的信號樣品去生成噪聲水平低的時間序列矢量。
進而,下一個發(fā)明的聲音編碼方法具有存儲有噪聲的時間序列矢量的第1驅(qū)動代碼簿和存儲無噪聲的時間序列矢量的第2驅(qū)動代碼簿,根據(jù)聲音的噪聲水平的評價結(jié)果,生成將第1驅(qū)動代碼簿的時間序列矢量和第2驅(qū)動代碼簿的時間序列矢量加權(quán)相加后的時間序列矢量。
進而,下一個發(fā)明的聲音譯碼方法使用頻譜信息、功率信息和音調(diào)信息中的至少一個代碼或譯碼結(jié)果,對該譯碼區(qū)間中的聲音的噪聲水平進行評價,根據(jù)評價結(jié)果選擇多個驅(qū)動代碼中的一個。
進而,下一個發(fā)明的聲音譯碼方法具有多個驅(qū)動代碼簿,所存儲的時間序列矢量的噪聲水平不同,根據(jù)聲音的噪聲水平的評價結(jié)果切換多個驅(qū)動代碼簿。
進而,下一個發(fā)明的聲音譯碼方法根據(jù)聲音的噪聲水平的評價結(jié)果,使存儲在驅(qū)動代碼簿中時間序列矢量的噪聲水平發(fā)生變化。
進而,下一個發(fā)明的聲音譯碼方法具有存儲有噪聲的時間序列矢量的驅(qū)動代碼簿,根據(jù)聲音的噪聲水平的評價結(jié)果,通過間拔驅(qū)動聲音源的信號樣品去生成噪聲水平低的時間序列矢量。
進而,下一個發(fā)明的聲音譯碼方法具有存儲有噪聲的時間序列矢量的第1驅(qū)動代碼簿和存儲無噪聲的時間序列矢量的第2驅(qū)動代碼簿,根據(jù)聲音的噪聲水平的評價結(jié)果,生成將第1驅(qū)動代碼簿的時間序列矢量和第2驅(qū)動代碼簿的時間序列矢量加權(quán)相加后的時間序列矢量。
進而,下一個發(fā)明的聲音編碼裝置包括頻譜信息編碼部,對輸入聲音的頻譜信息進行編碼并作為編碼結(jié)果的一個要素輸出;噪聲水平評價部,使用根據(jù)從該頻譜信息編碼部來的已編碼的頻譜信息得到的頻譜信息和功率信息中的至少一個代碼或編碼結(jié)果,對該編碼區(qū)間內(nèi)的聲音的噪聲水平進行評價并輸出評價結(jié)果;存儲多個無噪聲的時間序列矢量的第1驅(qū)動代碼簿;存儲多個有噪聲的時間序列矢量的第2驅(qū)動代碼簿;根據(jù)上述噪聲水平評價部的評價結(jié)果切換第1驅(qū)動代碼簿和第2驅(qū)動代碼簿的驅(qū)動代碼簿切換部;加權(quán)相加計算部,對從上述第1驅(qū)動代碼簿或第2驅(qū)動代碼簿來的時間序列矢量,分別與各時間序列矢量的增益對應(yīng)進行加權(quán)相加;合成濾波器,將該加權(quán)的時間序列矢量作為驅(qū)動聲音源信號,在該驅(qū)動聲音源信號和從上述頻譜信息編碼部來的已編碼的頻譜信息的基礎(chǔ)上得到編碼聲音;距離計算部,求出該編碼聲音和上述輸入聲音的距離,尋求距離最小的驅(qū)動代碼和增益,并將該結(jié)果作為驅(qū)動代碼和增益代碼的編碼結(jié)果輸出。
進而,下一個發(fā)明的聲音譯碼裝置包括頻譜信息譯碼部,從頻譜信息的代碼中譯碼出頻譜信息;噪聲水平評價部,使用根據(jù)從該頻譜信息譯碼部來的已譯碼的頻譜信息得到的頻譜信息和功率信息中的至少一個譯碼結(jié)果或上述頻譜信息的代碼,對該譯碼區(qū)間內(nèi)的聲音的噪聲水平進行評價并輸出評價結(jié)果;存儲多個無噪聲的時間序列矢量的第1驅(qū)動代碼簿;存儲多個有噪聲的時間序列矢量的第2驅(qū)動代碼簿;根據(jù)上述噪聲水平評價部的評價結(jié)果切換第1驅(qū)動代碼簿和第2驅(qū)動代碼簿的驅(qū)動代碼簿切換部;加權(quán)相加計算部,對從上述第1驅(qū)動代碼簿或第2驅(qū)動代碼簿來的時間序列矢量,分別與各時間序列矢量的增益對應(yīng)進行加權(quán)相加;合成濾波器,將該加權(quán)的時間序列矢量作為驅(qū)動聲音源信號,在該驅(qū)動聲音源信號和從上述頻譜信息譯碼部來的已譯碼的頻譜信息的基礎(chǔ)上得到譯碼聲音。
本發(fā)明的聲音編碼裝置的特征在于,在編碼驅(qū)動線性預(yù)測(CELP)聲音編碼裝置中,包括使用頻譜信息、功率信息和音調(diào)信息中的至少一個代碼或編碼結(jié)果對該編碼區(qū)間內(nèi)的聲音的噪聲水平進行評價的噪聲水平評價部;根據(jù)上述噪聲水平評價部的評價結(jié)果切換多個驅(qū)動代碼簿的驅(qū)動代碼簿切換部。
本發(fā)明的聲音譯碼裝置的特征在于,在編碼驅(qū)動線性預(yù)測(CELP)聲音譯碼裝置中,包括使用頻譜信息、功率信息和音調(diào)信息中的至少一個代碼或譯碼結(jié)果對該譯碼區(qū)間內(nèi)的聲音的噪聲水平進行評價的噪聲水平評價部;根據(jù)上述噪聲水平評價部的評價結(jié)果切換多個驅(qū)動代碼簿的驅(qū)動代碼簿切換部。


圖1是表示本發(fā)明的聲音編碼和聲音譯碼裝置的實施形態(tài)1的整體構(gòu)成的方框圖。
圖2是向圖1的實施形態(tài)1的噪聲水平評價的說明提供的表。
圖3是表示本發(fā)明的聲音編碼和聲音譯碼裝置的實施形態(tài)3的整體構(gòu)成的方框圖。
圖4是表示本發(fā)明的聲音編碼和聲音譯碼裝置的實施形態(tài)5的整體構(gòu)成的方框圖。
圖5是向圖4的實施形態(tài)5的加權(quán)決定處理的說明提供的表。
圖6是表示先有的CELP聲音編碼譯碼裝置的整體構(gòu)成的方框圖。
圖7是表示過去改良了的CELP聲音編碼譯碼裝置的整體構(gòu)成的方框圖。
具體實施例方式
下面,參照

本發(fā)明的實施形態(tài)。
實施形態(tài)1.
圖1示出本發(fā)明的聲音編碼方法和聲音譯碼方法的實施形態(tài)1的整體構(gòu)成的方框圖。圖中,1是編碼部,2是譯碼部,3是多路復(fù)用部,4是分離部。編碼部1由線性預(yù)測參數(shù)分析部5、線性預(yù)測參數(shù)編碼部6、合成濾波器7、適應(yīng)代碼簿8、增益編碼部10、距離計算裝置11、第1驅(qū)動代碼簿19、第2驅(qū)動代碼簿20、噪聲水平評價部24、驅(qū)動代碼簿切換部25和加權(quán)相加計算部38構(gòu)成。此外,譯碼部2由線性預(yù)測參數(shù)譯碼部12、合成濾波器13、適應(yīng)代碼簿14、第1驅(qū)動代碼簿22、第2驅(qū)動代碼簿23、噪聲水平評價部26、驅(qū)動代碼簿切換部27、增益譯碼部16和加權(quán)相加計算部39構(gòu)成。圖1中的5是作為頻譜信息分析部的線性預(yù)測參數(shù)分析部,分析輸入聲音S1,抽出作為聲音頻譜信息的線性預(yù)測參數(shù),6是作為頻譜信息編碼部的線性預(yù)測參數(shù)編碼部,對作為頻譜信息的該線性預(yù)測參數(shù)進行編碼,將該編碼后的線性預(yù)測參數(shù)作為合成濾波器7的系數(shù)來設(shè)定,19、22是存儲多個無噪聲的時間序列矢量的第1驅(qū)動代碼簿,20、23是存儲多個有噪聲的時間序列矢量的第2驅(qū)動代碼簿,24、26是評價噪聲水平的噪聲水平評價部,25、27是根據(jù)噪聲水平切換驅(qū)動代碼簿的驅(qū)動代碼簿切換部。
下面,說明動作。首先,在編碼部1中,線性預(yù)測參數(shù)分析部5分析輸入聲音S1,抽出作為聲音頻譜信息的線性預(yù)測參數(shù)。線性預(yù)測參數(shù)編碼部6對該線性預(yù)測參數(shù)進行編碼,將該編碼后的線性預(yù)測參數(shù)作為合成濾波器7的系數(shù)來設(shè)定,同時,向噪聲水平評價部24輸出。其次,說明聲音源信息的編碼。適應(yīng)代碼簿8存儲過去的驅(qū)動聲音源信號,并與距離計算裝置11輸入的適應(yīng)代碼對應(yīng)輸出周期性的重復(fù)過去的驅(qū)動聲音源信號的時間序列矢量。噪聲水平評價部24根據(jù)從上述線性預(yù)測參數(shù)編碼部6輸入的已編碼的線性預(yù)測參數(shù)和適應(yīng)代碼,例如如圖2所示那樣,從頻譜的傾斜、短期預(yù)測增益和音調(diào)變動去評價該編碼區(qū)間的噪聲水平,并將評價結(jié)果輸出給驅(qū)動代碼簿切換部25。驅(qū)動代碼簿切換部25根據(jù)上述噪聲水平的評價結(jié)果去切換編碼時用的驅(qū)動代碼簿,例如,若噪聲水平低,則切換到第1驅(qū)動代碼簿19,若噪聲水平高,則切換到第2驅(qū)動代碼簿20。
在第1驅(qū)動代碼簿19中存儲多個無噪聲的時間序列矢量,該時間序列矢量構(gòu)成為例如能夠進行學(xué)習(xí),使學(xué)習(xí)用聲音和它的編碼聲音的失真很小。此外,在第2驅(qū)動代碼簿20中存儲多個有噪聲的時間序列矢量,例如,存儲由隨機噪聲生成的多個時間序列矢量,輸出與從距離計算部11輸入的各個驅(qū)動代碼對應(yīng)的時間序列矢量。從適應(yīng)代碼簿8、第1驅(qū)動代碼簿19或第2驅(qū)動代碼簿20來的各時間序列矢量與增益編碼部10加給的各增益對應(yīng),在加權(quán)相加計算部38中進行加權(quán)相加,將該計算結(jié)果作為驅(qū)動聲音信號供給合成濾波器7,得到編碼聲音。距離計算部11求出編碼聲音和輸入聲音S1的距離,尋求距離最小的適應(yīng)代碼、驅(qū)動代碼和增益。在上述編碼結(jié)束后,將線性預(yù)測參數(shù)的代碼以及使輸入聲音和編碼聲音的失真最小的適應(yīng)代碼、驅(qū)動代碼、增益的代碼作為編碼結(jié)果輸出。以上是本實施形態(tài)1的聲音編碼方法的特征動作。
其次,說明譯碼部2。在譯碼部2中,線性預(yù)測參數(shù)譯碼部12從線性預(yù)測參數(shù)的代碼中譯碼出線性預(yù)測參數(shù)并作為合成濾波器13的系數(shù)來設(shè)定,同時,向噪聲水平評價部26輸出。其次,說明聲音源信息的譯碼。適應(yīng)代碼簿14與適應(yīng)代碼對應(yīng),輸出周期地重復(fù)過去的驅(qū)動聲音源信號的時間序列矢量。噪聲水平評價部26使用和編碼部1的噪聲水平評價部24相同的方法,根據(jù)從上述線性預(yù)測參數(shù)譯碼部12輸入的已譯碼的線性預(yù)測參數(shù)和適應(yīng)代碼去評價噪聲水平,并將評價結(jié)果輸出給驅(qū)動代碼簿切換部27。驅(qū)動代碼簿切換部27和編碼部1的驅(qū)動代碼簿切換部25一樣,根據(jù)上述噪聲水平的評價結(jié)果切換第1驅(qū)動代碼簿22和第2驅(qū)動代碼簿23。
在第1驅(qū)動代碼簿22中存儲多個無噪聲的時間序列矢量,該時間序列矢量構(gòu)成為例如能夠進行學(xué)習(xí),使學(xué)習(xí)用聲音和它的編碼聲音的失真很小,而在第2驅(qū)動代碼簿20中存儲多個有噪聲的時間序列矢量,例如,存儲由隨機噪聲生成的多個時間序列矢量,輸出與從距離計算部11輸入的各個驅(qū)動代碼對應(yīng)的時間序列矢量。從適應(yīng)代碼簿14和第1驅(qū)動代碼簿22或第2驅(qū)動代碼簿23來的各時間序列矢量與在增益譯碼部16中從增益代碼譯碼出的各增益對應(yīng),在加權(quán)相加計算部39中進行加權(quán)相加,將該計算結(jié)果作為驅(qū)動聲音信號供給合成濾波器13,得到輸出聲音S3。以上是本實施形態(tài)1的聲音譯碼方法的特征動作。
若按照該實施形態(tài)1,通過根據(jù)代碼和編碼結(jié)果對輸入聲音的噪聲水平進行評價并根據(jù)評價結(jié)果使用不同的驅(qū)動代碼簿,可以用少量的信息再生出高品質(zhì)的聲音。
此外,在上述實施形態(tài)中,對驅(qū)動代碼簿19、20、22、23說明了存儲多個時間序列矢量的情況,但只要存儲至少一個時間序列矢量,就可以實施本發(fā)明。
實施形態(tài)2在上述實施形態(tài)1中,切換使用兩個驅(qū)動代碼簿,但也可以具有三個以上的驅(qū)動代碼簿,根據(jù)噪聲水平進行切換使用。若按照該實施形態(tài)2,因為不只是將聲音分成有噪聲和無噪聲兩種類型,對于有一點噪聲的中間狀態(tài)的聲音也可以使用與其相應(yīng)的驅(qū)動代碼簿,所以能夠再生出高品質(zhì)的聲音。
實施形態(tài)3圖3示出本發(fā)明的聲音編碼方法和聲音譯碼方法的實施形態(tài)3的整體構(gòu)成,對與圖1對應(yīng)的部分添加相同的符號,圖中28、30是存儲有噪聲的時間序列矢量的驅(qū)動代碼簿,29、31是將時間序列矢量的小振幅樣品的振幅值為零的樣品間拔部。
下面,說明動作。首先,在編碼部1中,線性預(yù)測參數(shù)分析部5分析輸入聲音S1,抽出作為聲音頻譜信息的線性預(yù)測參數(shù)。線性預(yù)測參數(shù)編碼部6對該線性預(yù)測參數(shù)進行編碼,將該編碼后的線性預(yù)測參數(shù)作為合成濾波器7的系數(shù)來設(shè)定,同時,向噪聲水平評價部24輸出。其次,說明聲音源信息的編碼。適應(yīng)代碼簿8存儲過去的驅(qū)動聲音源信號,并與距離計算部11輸入的適應(yīng)代碼對應(yīng)輸出周期性的重復(fù)過去的驅(qū)動聲音源信號的時間序列矢量。噪聲水平評價部24根據(jù)從上述線性預(yù)測參數(shù)編碼部6輸入的已編碼的線性預(yù)測參數(shù)和適應(yīng)代碼,例如從頻譜的傾斜、短期預(yù)測增益和音調(diào)變動去評價該編碼區(qū)間的噪聲水平,并將評價結(jié)果輸出給樣品間拔部29。
在驅(qū)動代碼簿28中存儲例如由隨機噪聲生成的多個時間序列矢量,輸出與從距離計算部11輸入驅(qū)動代碼對應(yīng)的時間序列矢量。樣品間拔部29根據(jù)上述噪聲水平的評價結(jié)果,若噪聲水平低,則在從上述驅(qū)動代碼簿28輸入的時間序列矢量中輸出使例如未達到規(guī)定的振幅值的樣品的振幅值為零的時間序列矢量,此外,若噪聲水平高,則直接輸出從上述驅(qū)動代碼簿28輸入的時間序列矢量。從適應(yīng)代碼簿8、樣品間拔部29來的各時間序列矢量與增益編碼部10加給的各增益對應(yīng),在加權(quán)相加計算部38中進行加權(quán)相加,將該計算結(jié)果作為驅(qū)動聲音信號供給合成濾波器7,得到編碼聲音。距離計算部11求出編碼聲音和輸入聲音S1的距離,尋求距離最小的適應(yīng)代碼、驅(qū)動代碼和增益。在上述編碼結(jié)束后,將線性預(yù)測參數(shù)的代碼以及使輸入聲音和編碼聲音的失真最小的適應(yīng)代碼、驅(qū)動代碼、增益的代碼作為編碼結(jié)果S2輸出。以上是本實施形態(tài)1的聲音編碼方法的特征動作。
其次,說明譯碼部2。在譯碼部2中,線性預(yù)測參數(shù)譯碼部12從線性預(yù)測參數(shù)的代碼中譯碼出線性預(yù)測參數(shù)并作為合成濾波器13的系數(shù)來設(shè)定,同時,向噪聲水平評價部26輸出。其次,說明聲音源信息的譯碼。適應(yīng)代碼簿14與適應(yīng)代碼對應(yīng),輸出周期地重復(fù)過去的驅(qū)動聲音源信號的時間序列矢量。噪聲水平評價部26使用和編碼部1的噪聲水平評價部24相同的方法,根據(jù)從上述線性預(yù)測參數(shù)譯碼部12輸入的已譯碼的線性預(yù)測參數(shù)和適應(yīng)代碼去評價噪聲水平,并將評價結(jié)果輸出給樣品間拔部31。
驅(qū)動代碼簿30與驅(qū)動代碼對應(yīng)輸出時間序列矢量。樣品間拔部31通過和上述編碼部1的樣品間拔部29同樣的處理,根據(jù)上述噪聲評價結(jié)果輸出時間序列矢量。從適應(yīng)代碼簿14和樣品間拔部31來的各時間序列矢量與增益譯碼部16加給的各增益對應(yīng),在加權(quán)相加計算部39中進行加權(quán)相加,將該計算結(jié)果作為驅(qū)動聲音源信號供給合成濾波器13,得到輸出聲音S3。
若按照該實施形態(tài)3,具有存儲有噪聲的時間序列矢量的驅(qū)動代碼簿,通過根據(jù)聲音的噪聲水平的結(jié)果對驅(qū)動聲音源的信息樣品進行間拔來生成噪聲水平低的驅(qū)動聲音源,可以用少量的信息再生出高品質(zhì)的聲音。此外,因不需要多個驅(qū)動代碼簿,故具有能夠減少用于存儲驅(qū)動代碼簿的存儲器的數(shù)量的效果。
實施形態(tài)4
在上述實施形態(tài)3中,對時間序列矢量的樣品有間拔和不間拔兩種選擇,但也可以在間拔樣品時根據(jù)噪聲水平變更振幅閾值。若按照該實施形態(tài)4,因為不只是將聲音分成有噪聲和無噪聲兩種類型,對于有一點噪聲的中間狀態(tài)的聲音也可以生成并使用與其相應(yīng)的時間序列矢量,所以能夠再生出高品質(zhì)的聲音。
實施形態(tài)5圖4示出本發(fā)明的聲音編碼方法和聲音譯碼方法的實施形態(tài)5的整體構(gòu)成,對與圖1對應(yīng)的部分添加相同的符號,圖中32、35是存儲有噪聲的時間序列矢量的第1驅(qū)動代碼簿,33、36是存儲無噪聲的時間序列矢量的第2驅(qū)動代碼簿,34、37是權(quán)重決定部。
下面,說明動作。首先,在編碼部1中,線性預(yù)測參數(shù)分析部5分析輸入聲音S1,抽出作為聲音頻譜信息的線性預(yù)測參數(shù)。線性預(yù)測參數(shù)編碼部6對該線性預(yù)測參數(shù)進行編碼,將該編碼后的線性預(yù)測參數(shù)作為合成濾波器7的系數(shù)來設(shè)定,同時,向噪聲水平評價部24輸出。其次,說明聲音源信息的編碼。適應(yīng)代碼簿8存儲過去的驅(qū)動聲音源信號,并與距離計算部11輸入的適應(yīng)代碼對應(yīng)輸出周期性的重復(fù)過去的驅(qū)動聲音源信號的時間序列矢量。噪聲水平評價部24根據(jù)從上述線性預(yù)測參數(shù)編碼部6輸入的已編碼的線性預(yù)測參數(shù)和適應(yīng)代碼,例如從頻譜的傾斜、短期預(yù)測增益和音調(diào)變動去評價該編碼區(qū)間的噪聲水平,并將評價結(jié)果輸出給權(quán)重決定部34。
在第1驅(qū)動代碼簿32中存儲例如由隨機噪聲生成的多個有噪聲的時間序列矢量,輸出與驅(qū)動代碼對應(yīng)的時間序列矢量。在第2驅(qū)動代碼簿20中存儲多個時間序列矢量,該時間序列矢量構(gòu)成為例如能夠進行學(xué)習(xí),使學(xué)習(xí)用聲音和它的編碼聲音的失真很小。輸出與從距離計算部11輸入的驅(qū)動代碼對應(yīng)的時間序列矢量。重量決定部34根據(jù)從上述噪聲水平評價部24輸入的噪聲水平評價結(jié)果,例如按照圖5決定加給第1驅(qū)動代碼簿32的時間序列矢量和第1驅(qū)動代碼簿32的時間序列矢量的權(quán)重。第1驅(qū)動代碼簿32和第2驅(qū)動代碼簿33的各時間序列矢量根據(jù)上述權(quán)重決定部34給出的權(quán)重進行加權(quán)相加。從適應(yīng)代碼簿8輸出的時間序列矢量和上述加權(quán)相加后生成的時間序列矢量與增益編碼部10加給的各增益對應(yīng),在加權(quán)相加計算部38中進行加權(quán)相加,將該計算結(jié)果作為驅(qū)動聲音信號供給合成濾波器7,得到編碼聲音。距離計算部11求出編碼聲音和輸入聲音S1的距離,尋求距離最小的適應(yīng)代碼、驅(qū)動代碼和增益。在上述編碼結(jié)束后,將線性預(yù)測參數(shù)的代碼以及使輸入聲音和編碼聲音的失真最小的適應(yīng)代碼、驅(qū)動代碼、增益的代碼作為編碼結(jié)果輸出。
其次,說明譯碼部2。在譯碼部2中,線性預(yù)測參數(shù)譯碼部12從線性預(yù)測參數(shù)的代碼中譯碼出線性預(yù)測參數(shù)并作為合成濾波器13的系數(shù)來設(shè)定,同時,向噪聲水平評價部26輸出。其次,說明聲音源信息的譯碼。適應(yīng)代碼簿14與適應(yīng)代碼對應(yīng),輸出周期地重復(fù)過去的驅(qū)動聲音源信號的時間序列矢量。噪聲水平評價部26使用和編碼部1的噪聲水平評價部24相同的方法,根據(jù)從上述線性預(yù)測參數(shù)譯碼部12輸入的已譯碼的線性預(yù)測參數(shù)和適應(yīng)代碼去評價噪聲水平,并將評價結(jié)果輸出給權(quán)重決定部37。
第1驅(qū)動代碼簿35和第2驅(qū)動代碼部36與驅(qū)動代碼對應(yīng)輸出時間序列矢量。權(quán)重決定部37和編碼部1的權(quán)重決定部34一樣,根據(jù)從上述噪聲水平評價部26輸入的噪聲水平評價結(jié)果給出權(quán)重。從第1驅(qū)動代碼簿35、第2驅(qū)動代碼簿36來的各時間序列矢量與上述權(quán)重決定部37加給的各權(quán)重對應(yīng)進行加權(quán)相加。從適應(yīng)代碼簿14輸出的時間序列矢量和上述權(quán)重相加生成的時間序列矢量與在增益譯碼部16中從增益代碼譯碼出的各增益對應(yīng),在加權(quán)相加計算部39中進行加權(quán)相加,將該計算結(jié)果作為驅(qū)動聲音信號供給合成濾波器13,得到輸出聲音S3。
若按照該實施形態(tài)5,根據(jù)代碼和編碼結(jié)果對輸入聲音的噪聲水平進行評價并根據(jù)評價結(jié)果對有噪聲的時間序列矢量和無噪聲的時間序列矢量進行加權(quán)相加后再使用,因此,可以用少量的信息再生出高品質(zhì)的聲音。
實施形態(tài)6在上述實施形態(tài)1~5中,進而還可以根據(jù)噪聲水平的評價結(jié)果去變更增益的代碼簿。若按照該實施形態(tài)6,因為可以根據(jù)驅(qū)動代碼部使用最佳的增益代碼簿,所以能夠再生出高品質(zhì)的聲音。
實施形態(tài)7在上述實施形態(tài)1~6中,對聲音的噪聲水平進行評價并根據(jù)評價結(jié)果切換驅(qū)動代碼簿,也可以分別對有聲音的突然出現(xiàn)和破裂性子音等進行判定、評價并根據(jù)評價結(jié)果切換驅(qū)動代碼簿。若按照該實施形態(tài)7,因為不只對聲音的噪聲狀態(tài)進行分類,而是對有聲音的突然出現(xiàn)和破裂性子音等進一步進行仔細(xì)分類,可以使用各自合適的驅(qū)動代碼部,所以能夠再生出高品質(zhì)的聲音。
實施形態(tài)8在上述實施形態(tài)1~6中,從圖2所示的頻譜傾斜、短期預(yù)測增益和音調(diào)變動去評價編碼區(qū)間的噪聲水平,但也可以使用相對適應(yīng)代碼簿的輸出的增益值的大小去進行評價。
工業(yè)上利用的可能性若按照本發(fā)明的聲音編碼方法和聲音譯碼方法以及聲音編碼裝置和聲音譯碼裝置,使用頻譜信息、功率信息和音調(diào)信息中的至少一個代碼或編碼結(jié)果去評價該編碼區(qū)間的噪聲水平,并根據(jù)評價結(jié)果使用不同的驅(qū)動代碼簿,所以,能用少量的信息再生高品質(zhì)的聲音。
此外,若按照本發(fā)明的聲音編碼方法和聲音譯碼方法,具有多個驅(qū)動代碼簿,所存儲的驅(qū)動聲音源的噪聲水平不同,根據(jù)聲音的噪聲水平的評價結(jié)果,切換使用多個驅(qū)動代碼簿,所以,能用少量的信息再生高品質(zhì)的聲音。
此外,若按照本發(fā)明的聲音編碼方法和聲音譯碼方法,根據(jù)聲音的噪聲水平的評價結(jié)果,使存儲在驅(qū)動代碼簿中的時間序列矢量的噪聲水平變化,所以,能用少量的信息再生高品質(zhì)的聲音。
此外,若按照本發(fā)明的聲音編碼方法和聲音譯碼方法,具有存儲有噪聲的時間序列矢量的驅(qū)動代碼簿,根據(jù)聲音的噪聲水平的評價結(jié)果,通過間拔時間序列矢量的信息樣品去生成噪聲水平低的時間序列矢量,所以,能用少量的信息再生高品質(zhì)的聲音。
此外,若按照本發(fā)明的聲音編碼方法和聲音譯碼方法,具有存儲有噪聲的時間序列矢量的第1驅(qū)動代碼簿和存儲無噪聲的時間序列矢量的第2驅(qū)動代碼簿,根據(jù)聲音的噪聲水平的評價結(jié)果,對第1驅(qū)動代碼簿的時間序列矢量和第2驅(qū)動代碼簿的時間序列矢量進行加權(quán)相加并生成時間序列矢量,所以,能用少量的信息再生高品質(zhì)的聲音。
權(quán)利要求
1.一種按照編碼驅(qū)動線性預(yù)測(CELP)的聲音譯碼方法,其特征在于,所述聲音譯碼方法接收聲音編碼并利用至少一個驅(qū)動編碼簿對聲音進行合成,所述聲音譯碼方法包括下列步驟從所述驅(qū)動編碼簿獲得帶有噪聲水平的時間序列矢量;確定是否需要對所述時間序列矢量作出修改;如果確定需要進行修改,則對所述時間序列矢量進行修改,使得所述噪聲水平改變;輸出所述時間序列矢量;及利用所述輸出的時間序列矢量對聲音進行合成。
2.一種按照編碼驅(qū)動線性預(yù)測(CELP)的聲音譯碼裝置,其特征在于,所述聲音譯碼裝置接收聲音編碼并利用至少一個驅(qū)動編碼簿對聲音進行合成,所述聲音譯碼裝置包括時間序列矢量調(diào)制裝置,用于從所述驅(qū)動編碼簿獲得帶有噪聲水平的時間序列矢量,并確定是否需要對所述時間序列矢量作出修改,如果確定需要進行修改,則用于對所述時間序列矢量進行修改,使得所述噪聲水平改變,及用于輸出所述時間序列矢量;和聲音合成裝置,用于利用所述輸出的時間序列矢量對聲音進行合成。
全文摘要
本發(fā)明的一種按照編碼驅(qū)動線性預(yù)測(CELP)的聲音譯碼方法,其特征在于,所述聲音譯碼方法接收聲音編碼并利用至少一個驅(qū)動編碼簿對聲音進行合成,所述聲音譯碼方法包括下列步驟從所述驅(qū)動編碼簿獲得帶有噪聲水平的時間序列矢量;確定是否需要對所述時間序列矢量作出修改;如果確定需要進行修改,則對所述時間序列矢量進行修改,使得所述噪聲水平改變;輸出所述時間序列矢量;及利用所述輸出的時間序列矢量對聲音進行合成。
文檔編號H04B14/04GK1737903SQ200510089528
公開日2006年2月22日 申請日期1998年12月7日 優(yōu)先權(quán)日1997年12月24日
發(fā)明者山浦正 申請人:三菱電機株式會社
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1