專利名稱:移動通信終端中使用知覺線性預(yù)測的語音編碼設(shè)備和方法
技術(shù)領(lǐng)域:
本發(fā)明涉及移動通信終端的編碼,尤其是,涉及使用知覺線性預(yù)測(PLP)的語音編碼設(shè)備和方法。
背景技術(shù):
隨著移動通信技術(shù)的發(fā)展,語音移動通信終端已經(jīng)提供有利用數(shù)字、字符、符號等等的數(shù)據(jù)通信,包括各種各樣圖像信號的多媒體通信以及語音通信。多個終端用戶從系統(tǒng)接收分配于此的無線電信道,并且使用無線電資源來發(fā)送和接收所需的數(shù)據(jù)。但是,為了使多個用戶同時使用該無線電信道,該無線電信道具有受限的帶寬,因此每個用戶的數(shù)據(jù)比特率理所當(dāng)然地受到限制。
因此,已經(jīng)提出了一種用于使用以上有限的數(shù)據(jù)比特率來傳送更大量數(shù)據(jù)的編碼技術(shù)。各種各樣的方法作為現(xiàn)有技術(shù)語音編碼技術(shù)而存在,其中每個在某一比特率上具有若干優(yōu)點(diǎn)。
例如,使用通用音頻編碼、脈沖編碼調(diào)制(PCM)和自適應(yīng)增量脈碼調(diào)制(ADPCM)的語音編碼在超過16Kbps的高比特率被有效使用,并且碼激勵線性預(yù)測(CELP)和其他各種各樣的變化在2.4Kbps至16Kbps范圍內(nèi)的中間比特率被有效使用。尤其是,使用LD-CELP、CS-ACELP、VSELP和MELP的編碼方法和寬帶語音編碼可以在中間比特率上被使用。此外,線性預(yù)測編碼(LPC)、殘留激勵線性預(yù)示(RELP)、共振峰聲碼器和倒譜(Cepstral)聲碼器在75bps至2.4Kbps范圍的低比特率上具有許多的優(yōu)點(diǎn)。
因此,在現(xiàn)有技術(shù)和本發(fā)明中,現(xiàn)在將解釋一種用于在以低比特率使用的編碼方法中間改善LPC的方法。
圖1舉例說明現(xiàn)有技術(shù)的LPC編碼器的結(jié)構(gòu)。
如在該圖中舉例說明的,現(xiàn)有技術(shù)的LPC編碼器包括用于計算輸入信號x[n]的自相關(guān)值rx[n]的相關(guān)器10;用于通過處理該自相關(guān)值rx[n]來計算LP系數(shù)aL和增益G的LP系數(shù)計算器11;用于確定該輸入信號x[n]是一個有聲V信號還是無聲UV信號的V/UV確定單元12;用于當(dāng)該輸入信號x[n]是有聲V信號的時候,計算相應(yīng)信號的音高P的音高計算器13;用于按照從V/UV確定單元12輸出的V/UV指示比特,通過編碼從LP系數(shù)計算器11和音高計算器13接收的LP系數(shù)an、增益G和音高P,來輸出比特流的參數(shù)編碼單元14。
現(xiàn)在將解釋具有上述結(jié)構(gòu)的現(xiàn)有技術(shù)LPC編碼器的操作。
首先,該相關(guān)器10自相關(guān)一個輸入信號x[n]。LP系數(shù)計算器11處理由該相關(guān)器10計算的自相關(guān)值rx[n],以便計算LP系數(shù)an和增益G。此時,V/UV確定單元12確定該輸入信號x[n]是有聲V信號還是無聲UV信號以輸出一個V/UV指示比特,然后僅僅輸出有聲V信號。音高計算器13計算從V/UV確定單元12輸出的有聲V信號的音高P。
因此,當(dāng)V/UV指示比特表示有聲V信號的時候,通過編碼(通過低比特率編碼)從LP系數(shù)計算器11和音高計算器13接收的LP系數(shù)an、增益G和音高P,參數(shù)編碼單元14輸出一個比特流。然后,控制器(未示出)處理該比特流,從而將其輸出到無線電(無線)單元(未示出)。該無線電單元將從控制單元輸出的信號變換為無線電(無線)信號,并且發(fā)射經(jīng)變換的無線電信號。
因而,在現(xiàn)有技術(shù)中,移動通信終端執(zhí)行LPC編碼,以通過低的比特率發(fā)送一個音頻信號。但是,在現(xiàn)有技術(shù)LPC編碼中,通常使用線性預(yù)測系數(shù),其不考慮人的聽覺感覺特點(diǎn)。因此,對于使用低比特率操作的現(xiàn)有技術(shù)LPC編碼來說,壓縮效率不是很高(即,1200Kbps至2400Kbps),并且不能獲得很好的聲音質(zhì)量。
發(fā)明內(nèi)容
因此,本發(fā)明的一個目的是提供一種能夠通過使用PLP系數(shù)執(zhí)行LPC編碼改善壓縮效率和聲音質(zhì)量的移動通信終端的語音編碼設(shè)備和方法。
為了實(shí)現(xiàn)這些和其他的優(yōu)點(diǎn),以及按照本發(fā)明的目的,正如在此處具體實(shí)施和廣泛地描述的,提供了一種移動通信終端的線性預(yù)測編碼(LPC)編碼器,包括知覺線性預(yù)測(PLP)系數(shù)計算器,用于通過處理輸入信號來計算PLP系數(shù)和增益;V/UV確定單元,用于確定輸入信號是有聲信號還是無聲信號,從而當(dāng)輸入信號是有聲信號的時候,輸出確定信號和有聲信號;音高計算器,用于計算從V/UV確定單元輸出的輸入信號的音高;和參數(shù)編碼單元,用于基于確定信號使用PLP系數(shù)、增益和音高來執(zhí)行低比特率編碼。
為了實(shí)現(xiàn)這些和其他的優(yōu)點(diǎn),以及按照本發(fā)明的目的,正如在此處具體實(shí)施和廣泛地描述的,提供了一種移動通信終端的低比特率語音編碼方法,包括通過處理輸入信號來計算知覺線性預(yù)測(PLP)系數(shù)和增益;確定輸入信號是有聲信號還是無聲信號,從而當(dāng)輸入信號被確定為有聲信號的時候,輸出確定比特值和有聲信號;計算從V/UV確定單元輸出的輸入信號的音高;和基于確定比特值使用PLP系數(shù)、增益和音高來執(zhí)行低比特率編碼。
優(yōu)選地,該有聲信號是一個語音信號。
優(yōu)選地,該P(yáng)LP系數(shù)對于8kHz采樣速率具有大約第七次。
從下面結(jié)合附圖的詳細(xì)說明中,本發(fā)明的上述和其他的目的、特點(diǎn)、方式以及優(yōu)點(diǎn)將變得更加清晰可見。
被包括以提供對本發(fā)明進(jìn)一步的理解,并被并入和構(gòu)成本說明書的一部分的附圖舉例說明本發(fā)明的實(shí)施例,并且與說明書一起可以起解釋本發(fā)明原理的作用。
在附圖中圖1舉例說明一個使用LP系數(shù)的現(xiàn)有技術(shù)LPC編碼器的結(jié)構(gòu);圖2舉例說明一個按照本發(fā)明的使用PLP系數(shù)的LPC編碼器;和圖3詳細(xì)地舉例說明計算圖2中的PLP系數(shù)的順序步驟。
具體實(shí)施例方式
現(xiàn)在將詳細(xì)地進(jìn)行介紹本發(fā)明的優(yōu)選實(shí)施例,其舉例在附圖中被舉例說明。
本發(fā)明提供一種使用知覺線性預(yù)測(PLP)的低比特率語音編碼,該知覺線性預(yù)測(PLP)能夠執(zhí)行比線性預(yù)測編碼(LPC)更低次(階)的編碼,以便執(zhí)行具有高壓縮率的語音編碼。
現(xiàn)在首先將解釋PLP和LP之間的差別。
LP是傳統(tǒng)地公知的,因此將不給出為.比詳細(xì)的推導(dǎo)公式的描述。LP基本上涉及獲得一個LP系數(shù)ak,使得按照公式(1)的均方誤差(MSE),即,e[n]的值可以是最小值,如同下述。
e‾[n]=x‾[n]-x‾^[n]=Σk=0Npredakx‾[n-k]]]>公式(1)該獲得的LP系數(shù)ak對于8kHz采樣速率具有大約第8至第12次(階)。因此,該獲得的LP系數(shù)ak被用于使用線性預(yù)測(LP)的各種各樣的編碼方法(例如,LPC、CELP、MELP、RELP等等),其被更詳細(xì)地在語音編碼及合成,阿姆斯特丹,荷蘭Elsevier,1995年中公開。
PLP在Hermansky的論文中于1990年第一次介紹。PLP使用類似于現(xiàn)有的Mel頻率倒譜系數(shù)(MFCC)的人的聽覺感覺特點(diǎn)。因此,當(dāng)以低比特率執(zhí)行LPC時,本發(fā)明使用PLP系數(shù)而不是使用LP系數(shù)來執(zhí)行低比特率語音編碼。
也就是說,本發(fā)明使用PLP系數(shù)來獲得頻譜。PLP系數(shù)反映人的聽覺效果。因此,在MSE方面,使用PLP系數(shù)比使用LP可能在該頻譜中出現(xiàn)更大的誤差。但是,當(dāng)考慮到聽覺效果的時候,使用PLP系數(shù)的頻譜可以具有更少的誤差。此外,對于系數(shù)傳輸,在LPC的情況下,對于典型的8kHz采樣速率,使用大約第10次(階)的傳輸,但是對于PLP,使用大約第7次(階)的傳輸,從而可以降低該比特率。
圖2舉例說明一個按照本發(fā)明的使用PLP系數(shù)的LPC編碼器的結(jié)構(gòu)。
參考圖2,除了不包括相關(guān)器10并且用PLP系數(shù)計算器20代替LP系數(shù)計算器11之外,使用PLP系數(shù)的LPC編碼器被構(gòu)成為與在圖1中的現(xiàn)有技術(shù)LPC編碼器是相同的。
PLP系數(shù)計算器20處理語音信號S[n],以計算PLP系數(shù)ap和增益G,其中考慮到聽覺效果。
現(xiàn)在將參考附圖解釋具有按照本發(fā)明的上述結(jié)構(gòu)的使用PLP系數(shù)的LPC編碼器的操作。
首先,PLP系數(shù)計算器20接收語音信號S[n],以便通過順序地執(zhí)行圖3所示的操作來計算PLP系數(shù)ap和增益G。
也就是說,PLP系數(shù)計算器20對輸入信號,即,語音信號S[n]執(zhí)行快速傅里葉變換(FFT)。對于該經(jīng)傅里葉變換的語音信號執(zhí)行臨界頻帶積分(critical-bankintegration)和重復(fù)取樣處理,以通過頻率單元從該語音信號S[n]中除去噪聲分量。
一旦除去該噪聲分量,PLP系數(shù)計算器20對該傅里葉變換的語音信號執(zhí)行均衡和擴(kuò)音處理,以使其變成具有適合于人的聽覺感覺幅值的聲音分量,然后該語音信號與一個允許人類收聽的輸出功率相匹配。
當(dāng)完成功率匹配的時候,PLP系數(shù)計算器20對相應(yīng)的語音信號執(zhí)行離散傅里葉逆變換,而后從相應(yīng)的語音信號中獲得一組線性方程。因此,PLP系數(shù)計算器20對該線性方程組執(zhí)行倒譜遞歸處理,從而輸出PLP模型的倒譜系數(shù),即,PLP系數(shù)ap。換句話說,PLP系數(shù)計算器20向參數(shù)編碼單元23輸出反映人的聽覺感覺特點(diǎn)的低次(階)PLP系數(shù)ap和增益G作為參數(shù)值。
此時,V/UV確定單元21輸出一個V/UV指示比特,并且將語音信號S[n]傳送給音高計算器22。音高計算器22計算語音信號S[n]的音高P。
因此,參數(shù)編碼單元23通過編碼(通過低比特率編碼)從PLP系數(shù)計算器20和音高計算器22接收的V/UV指示比特值、PLP系數(shù)ap、增益G和音高P來輸出一個比特流。優(yōu)選地,所傳送的PLP系數(shù)ap的次數(shù)大約是用于8kHz采樣速率的第七次。然后,控制器(未示出)處理該比特流,然后輸出該處理的比特流給無線電(無線)單元(未示出)。無線電單元將從控制器輸出的信號變換為無線電信號(無線電信號)并且發(fā)射它。
如上所述,在本發(fā)明中,LPC是通過使用PLP系數(shù)執(zhí)行的,從而可以改善壓縮率,并且語音等級信號可以被利用更有效率的低比特率傳送。
此外,在本發(fā)明中,可以實(shí)現(xiàn)更高的壓縮率,并且通過使用PLP系數(shù)而不是使用現(xiàn)有的LP系數(shù)作為一個參數(shù),可以期待具有高的聲音質(zhì)量的信號質(zhì)量。
因此,按照本發(fā)明的語音編碼設(shè)備和方法可以使用低的比特率用于編碼和解碼語音,或者被用于占據(jù)很小面積的設(shè)備,并且使用PLP參數(shù)執(zhí)行語音合成。
此外,按照本發(fā)明的語音編碼設(shè)備和方法可以用于供聲音本身差不多不是非常重要的,但是足以聽到的應(yīng)用的語音編碼。此外,通過高壓縮率因特網(wǎng)存儲數(shù)據(jù)或者需要低的比特率,在一個具有有限存儲器的嵌/系統(tǒng)中,可以在因特網(wǎng)上執(zhí)行有效的語音對話。
由于本發(fā)明可以不脫離其精神或者基本的特性以若干形式實(shí)施,除非另作說明的,此外應(yīng)該理解,以上所述的實(shí)施例不受先前描述的任何細(xì)節(jié)的限制,而是應(yīng)該廣泛地解釋為在所附的權(quán)利要求限定的精神和范圍內(nèi),因此,所有的變化和修改落在權(quán)利要求的范圍內(nèi),或者這樣的范圍的等價因此意欲被所附的權(quán)利要求所包含。
權(quán)利要求
1.一種移動通信終端中的語音編碼設(shè)備,包括知覺線性預(yù)測(PLP)系數(shù)計算器,用于通過處理輸入信號來計算PLP系數(shù)和增益;V/UV確定單元,用于確定輸入信號是有聲信號還是無聲信號,從而當(dāng)輸入信號是有聲信號的時候,輸出確定結(jié)果和有聲信號;音高計算器,用于計算從V/UV確定單元輸出的輸入信號的音高;和參數(shù)編碼單元,用于基于確定結(jié)果使用PLP系數(shù)、增益和音高來執(zhí)行低比特率編碼。
2.根據(jù)權(quán)利要求1的設(shè)備,其中有聲信號是一個語音信號。
3.根據(jù)權(quán)利要求1的設(shè)備,其中確定結(jié)果表示輸入信號是有聲信號還是無聲信號的比特值。
4.根據(jù)權(quán)利要求1的設(shè)備,其中該P(yáng)LP系數(shù)的次數(shù)對于8kHz采樣速率大約是第七次。
5.一種移動通信終端的語音編碼方法,包括通過處理輸入信號來計算知覺線性預(yù)測(PLP)系數(shù)和增益;確定輸入信號是有聲信號還是無聲信號,從而當(dāng)輸入信號被確定為有聲信號的時候,輸出確定信號和有聲信號;計算從V/UV確定單元輸出的輸入信號的音高;和基于確定信號使用該P(yáng)LP系數(shù)、增益和音高來執(zhí)行低比特率編碼。
6.根據(jù)權(quán)利要求5的方法,其中有聲信號是一個語音信號。
7.根據(jù)權(quán)利要求5的方法,其中計算PLP系數(shù)和增益的步驟包括對于輸入信號執(zhí)行快速傅里葉變換(FFT);對經(jīng)傅里葉變換的語音信號執(zhí)行臨界頻帶積分和重復(fù)取樣,從而利用頻率單元除去噪聲分量;對經(jīng)傅里葉變換的語音信號執(zhí)行均衡和擴(kuò)音處理,使之變成具有適合于人的聽覺感覺幅值的聲音分量,然后將該語音信號與一個適宜的輸出功率相匹配;對與輸出功率相匹配的語音信號執(zhí)行離散傅里葉逆變換,從而獲得一組線性方程;和對于該線性方程組執(zhí)行倒譜遞歸處理,從而獲得PLP系數(shù)和增益。
8.根據(jù)權(quán)利要求5的方法,其中PLP系數(shù)的次數(shù)對于8kHz采樣速率大約是第七次。
全文摘要
通過使用知覺線性預(yù)測(PLP)系數(shù)執(zhí)行線性預(yù)測編碼(LPC),與使用線性預(yù)測(LP)系數(shù)的情況相比較,移動通信終端的語音編碼設(shè)備和方法可以實(shí)施更高的壓縮率和確保高的聲音質(zhì)量。
文檔編號G10L19/12GK1737904SQ20051010985
公開日2006年2月22日 申請日期2005年7月25日 優(yōu)先權(quán)日2004年7月23日
發(fā)明者金燦佑 申請人:Lg電子株式會社