亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

用于語音質(zhì)量評估的聽覺發(fā)音分析的制作方法

文檔序號:2820994閱讀:392來源:國知局
專利名稱:用于語音質(zhì)量評估的聽覺發(fā)音分析的制作方法
技術(shù)領(lǐng)域
本本發(fā)明與通信系統(tǒng)有關(guān),具體地說與語音質(zhì)量評估(speechquality assessment)有關(guān)。
背景技術(shù)
可以測量無線通信系統(tǒng)的性能,其中之一是測量語音質(zhì)量。在當(dāng)前的技術(shù)中,對于評估語言質(zhì)量來說,主觀語音質(zhì)量評估(subjectivespeech quality assessment)是最為可靠和普遍接受的方式。在主觀語音質(zhì)量評估中,由一些人類收聽者來評估經(jīng)處理的語音的語音質(zhì)量,經(jīng)處理的語音是經(jīng)例如接收機(jī)解碼處理的發(fā)送語音信號。這種技術(shù)是主觀的,因?yàn)樗且愿魅说母杏X為基礎(chǔ)的。然而,主觀語音質(zhì)量評估是一種昂貴和費(fèi)時(shí)的技術(shù),因?yàn)闉榱说玫浇y(tǒng)計(jì)上可靠的結(jié)果必需有足夠多的語音樣本和收聽者。
客觀語音質(zhì)量評估(Objective speech quality assessment)是另一種評估語音質(zhì)量的技術(shù)。與主觀語音質(zhì)量評估不同,客觀語音質(zhì)量評估不是以各人的感覺為基礎(chǔ)??陀^語音質(zhì)量評估可以有兩種類型。第一種客觀語音質(zhì)量評估以已知的源語音(source speech)為基礎(chǔ)。在第一種客觀語音質(zhì)量評估中,移動臺發(fā)送從已知的源語音得出(例如通過編碼)的語音信號。接收、處理并隨后記錄該發(fā)送語音信號。利用眾所周知的語音評估技術(shù),諸如語音質(zhì)量的感覺評估(Perceptual Evaluation ofSpeech Quality,PESQ),將所記錄的經(jīng)處理的語音信號與已知的源語音進(jìn)行比較,確定語音質(zhì)量。如果不知道源語音信號或者發(fā)送語音信號不是從已知的源語音得出,就不能使用第一種客觀語音質(zhì)量評估。
第二種客觀語音質(zhì)量評估不是根據(jù)已知的源語音。第二種客觀語音質(zhì)量評估的大多數(shù)實(shí)施方式涉及根據(jù)經(jīng)處理的語音估計(jì)出源語音,然后利用眾所周知的語音評估技術(shù)將估計(jì)的源語音與經(jīng)處理的語音進(jìn)行比較。然而,隨著經(jīng)處理的語音的失真增大,估計(jì)的源語音的質(zhì)量下降,從而使第二種客觀語音質(zhì)量評估的這些實(shí)施方式不大可靠。
因此,有必要開發(fā)一種不用已知的源語音或估計(jì)的源語音的客觀語音質(zhì)量評估技術(shù)。

發(fā)明內(nèi)容
本發(fā)明提供了一種用于語音質(zhì)量評估的聽覺發(fā)音分析技術(shù)(auditory-articulatory analysis technique)。本發(fā)明的發(fā)音分析技術(shù)以對與語音信號中的發(fā)音頻率范圍和非發(fā)音頻率范圍關(guān)聯(lián)的功率進(jìn)行比較為基礎(chǔ)。在發(fā)音分析中既不用源語音也不用對源語音的估計(jì)。發(fā)音分析包括對一個語音信號的發(fā)音功率和非發(fā)音功率進(jìn)行比較和根據(jù)比較評估語音質(zhì)量的步驟,其中發(fā)音功率和非發(fā)音功率分別是與語音信號中的發(fā)音頻率范圍和非發(fā)音頻率范圍關(guān)聯(lián)的功率。在一個實(shí)施例中,發(fā)音功率與非發(fā)音功率之間的比較是它們之比,發(fā)音功率是與2~12.5Hz之間的頻率關(guān)聯(lián)的功率,而非發(fā)音功率是與大于12.5Hz的頻率關(guān)聯(lián)的功率。


從以下說明、所附權(quán)利要求書和附圖可以更好地理解本發(fā)明的特征、情況和優(yōu)點(diǎn)。在這些附圖中圖1示出了按照本發(fā)明設(shè)計(jì)的采用發(fā)音分析的語音質(zhì)量評估設(shè)備;圖2示出了按照本發(fā)明的一個實(shí)施例在一個發(fā)音分析模塊內(nèi)處理多個包絡(luò)ai(t)的流程圖;以及圖3示出了一個例示功率與頻率關(guān)系的調(diào)制頻譜Ai(m,f)的例子。
具體實(shí)施例方式
本發(fā)明提供了一種用于語音質(zhì)量評估的聽覺發(fā)音分析技術(shù)。本發(fā)明的發(fā)音分析技術(shù)以對與語音信號中的發(fā)音頻率范圍和非發(fā)音頻率范圍關(guān)聯(lián)的功率進(jìn)行比較為基礎(chǔ)。在這種發(fā)音分析中既不用源語音也不用對源語音的估計(jì)。這種發(fā)音分析包括對一個語音信號的發(fā)音功率和非發(fā)音功率進(jìn)行比較和根據(jù)比較評估語音質(zhì)量的步驟,其中發(fā)音功率和非發(fā)音功率是分別與語音信號中的發(fā)音頻率范圍和非發(fā)音頻率范圍關(guān)聯(lián)的功率。
圖1示出了按照本發(fā)明設(shè)計(jì)的采用發(fā)音分析的語音質(zhì)量評估設(shè)備10。語音質(zhì)量評估設(shè)備10包括耳蝸濾波器組(cochlear filterbank)12、包絡(luò)分析模塊14和發(fā)音分析模塊16。在語音質(zhì)量評估設(shè)備10中,語音信號s(t)提供給耳蝸濾波器組12作為輸入。耳蝸濾波器組12包括多個耳蝸濾波器hi(t),用來按照第一級外周聽覺系統(tǒng)處理語音信號s(t),其中i=1,2,...,Nc表示具體的耳蝸濾波器信道,而Nc表示耳蝸濾波器信道的總數(shù)。具體地說,耳蝸濾波器組12對語音信號s(t)進(jìn)行濾波,產(chǎn)生多個臨界頻帶信號(critical band signal)si(t),其中臨界頻帶信號si(t)等于s(t)*hi(t)。
這些臨界頻帶信號si(t)提供給包絡(luò)分析模塊14作為輸入。在包絡(luò)分析模塊14內(nèi),對這些臨界頻帶信號si(t)進(jìn)行處理,得到多個包絡(luò)ai(t),其中ai(t)=si2(t)+s^i2(t),]]>而 是si(t)的Hilbert變換。
然后,這些包絡(luò)ai(t)提供給發(fā)音分析模塊16作為輸入。在發(fā)音分析模塊16內(nèi),對這些包絡(luò)ai(t)進(jìn)行處理,得到對語音信號s(t)的語音質(zhì)量評估。具體地說,發(fā)音分析模塊16對與人的發(fā)音系統(tǒng)產(chǎn)生的信號關(guān)聯(lián)的功率(以下稱為“發(fā)音功率PA(m,i)”)和與不是人的發(fā)音系統(tǒng)產(chǎn)生的信號關(guān)聯(lián)的功率(以下稱為“非發(fā)音功率PNA(m,i)”)進(jìn)行比較。然后,用這種比較作出語音質(zhì)量評估。
圖2示出了按照本發(fā)明的一個實(shí)施例在發(fā)音分析模塊16內(nèi)處理多個包絡(luò)ai(t)的流程圖200。在步驟210,對這些包絡(luò)ai(t)中的每個包絡(luò)的幀m執(zhí)行Fourier變換,產(chǎn)生調(diào)制頻譜Ai(m,f),其中f為頻率。
圖3示出了一個例示功率與頻率關(guān)系的調(diào)制頻譜Ai(m,f)的例子30。在例子30中,發(fā)音功率PA(m,i)是與頻率為2~12.5Hz關(guān)聯(lián)的功率,而非發(fā)音功率PNA(m,i)是與頻率高于12.5Hz關(guān)聯(lián)的功率。與頻率低于2Hz關(guān)聯(lián)的功率PNo(m,i)是臨界頻帶信號ai(t)的幀m的DC分量。在這個例子中,根據(jù)人發(fā)音的速度為2~12.5Hz而與發(fā)音功率PA(m,i)和非發(fā)音功率PNA(m,i)關(guān)聯(lián)的頻率范圍(以下分別稱為“發(fā)音頻率范圍”和“非發(fā)音頻率范圍”)是相鄰而不相疊的頻率范圍這樣的事實(shí),選擇發(fā)音功率PA(m,i)用作與頻率2~12.5Hz關(guān)聯(lián)的功率??梢岳斫?,對這個申請來說,所謂“發(fā)音功率PA(m,i)”不應(yīng)該局限于人發(fā)音的頻率范圍或者說上述的頻率范圍2~12.5Hz。同樣,所謂“非發(fā)音功率PNA(m,i)”也不應(yīng)該將頻率范圍局限于高于與發(fā)音功率PA(m,i)關(guān)聯(lián)的頻率范圍。非發(fā)音頻率范圍可以與也可以不與發(fā)音頻率范圍交疊或鄰接。非發(fā)音頻率范圍也可以包括低于發(fā)音頻率范圍內(nèi)最低頻率的頻率,諸如與臨界頻帶信號ai(t)的幀m的DC分量關(guān)聯(lián)的那些頻率。
在步驟220,對于每個調(diào)制頻譜Ai(m,f),發(fā)音分析模塊16將發(fā)音功率PA(m,i)與非發(fā)音功率PNA(m,i)進(jìn)行比較。在發(fā)音分析模塊16的這個實(shí)施例中,發(fā)音功率PA(m,i)與非發(fā)音功率PNA(m,i)之間的比較為發(fā)音與非發(fā)音功率之比ANR(m,i)。ANR由下式定義ANR(m,i)=PA(m,i)+ϵPNA(m,i)+ϵ----(1)]]>其中ε為某個小常數(shù)。發(fā)音功率PA(m,i)與非發(fā)音功率PNA(m,i)之間的其他比較方式也是可行的。例如,比較可以是式(1)的倒數(shù),也可以是發(fā)音功率PA(m,i)與非發(fā)音功率PNA(m,i)之差。為了便于討論,流程圖200所示的發(fā)音分析模塊16的實(shí)施例將就用式(1)的ANR(m,i)進(jìn)行比較予以討論。然而,不應(yīng)將此以任何方式解釋為對本發(fā)明的限制。
在步驟230,用ANR(m,i)確定幀m的局部語音質(zhì)量LSQ(m)。局部語音質(zhì)量LSQ(m)用所有信道i的發(fā)音與非發(fā)音比ANR(m,i)與一個基于DC分量功率PNo(m,i)的加權(quán)系數(shù)R(m,i)的總和來確定。具體地說,局部語音質(zhì)量LSQ(m)用下式確定
LSQ(m)=log[Σi=1NcANR(m,i)R(m,i)]----(2)]]>其中R(m,i)=log(1+PNo(m,i))Σk=1Nclog(1+PNo(m,k))----(3)]]>而k為頻率附標(biāo)。
在步驟240,語音信號s(t)的總體語音質(zhì)量SQ用幀m的局部語音質(zhì)量LSQ(m)和對數(shù)功率Ps(m)確定。具體地說,語音質(zhì)量SQ用下式確定SQ=L{Ps(m)LSQ(m)}m=1T=[Σm=1,Ps>PthTPsλ(m)LSQλ(m)]1λ----(4)]]>其中Ps(m)=log[ΣtIm^s2(t)],]]>L為Lp范數(shù),T為語音信號s(t)內(nèi)的幀的總數(shù),λ為任何值,而Pth為可聽信號與無聲的區(qū)別門限。在一個實(shí)施例中,λ可取地為一個奇整數(shù)值。
發(fā)音分析模塊16的輸出是對所有的幀m的語音質(zhì)量SQ的評估。也就是說,語音質(zhì)量SQ是對語音信號s(t)的語音質(zhì)量評估。
雖然以上結(jié)合一定的實(shí)施例對本發(fā)明作了相當(dāng)詳細(xì)的說明,但其他實(shí)施型式也是可行的。因此,本發(fā)明的精神實(shí)質(zhì)和專利保護(hù)范圍不應(yīng)局限于在本說明中所說明的這些實(shí)施例。
權(quán)利要求
1.一種執(zhí)行聽覺發(fā)音分析的方法,所述方法包括下列步驟對一個語音信號的發(fā)音功率和非發(fā)音功率進(jìn)行比較,其中發(fā)音功率和非發(fā)音功率分別是與語音信號的發(fā)音頻率和非發(fā)音頻率關(guān)聯(lián)的功率;以及根據(jù)比較結(jié)果評估語音質(zhì)量。
2.權(quán)利要求1的方法,其中發(fā)音頻率大致為2~12.5Hz。
3.權(quán)利要求1的方法,其中發(fā)音頻率大致與人類發(fā)音的速度相應(yīng)。
4.權(quán)利要求1的方法,其中非發(fā)音頻率大致高于發(fā)音頻率。
5.權(quán)利要求1的方法,其中發(fā)音功率與非發(fā)音功率之間的比較為發(fā)音功率與非發(fā)音功率之比。
6.權(quán)利要求5的方法,其中發(fā)音功率與非發(fā)音功率之比包括一個分母和一個分子,分子包括發(fā)音功率和一個小的常數(shù),分母包括非發(fā)音功率加上這個小的常數(shù)。
7.權(quán)利要求1的方法,其中發(fā)音功率與非發(fā)音功率之間的比較為發(fā)音功率與非發(fā)音功率之差。
8.權(quán)利要求1的方法,其中評估語音質(zhì)量的步驟包括下列步驟用比較確定局部語音質(zhì)量。
9.權(quán)利要求1的方法,其中還用基于DC分量功率的加權(quán)系數(shù)確定局部語音質(zhì)量。
10.權(quán)利要求9的方法,其中用局部語音質(zhì)量確定總體語音質(zhì)量。
11.權(quán)利要求10的方法,其中還用對數(shù)功率Ps確定總體語音質(zhì)量。
12.權(quán)利要求1的方法,其中用對數(shù)功率Ps確定總體語音質(zhì)量。
13.權(quán)利要求1的方法,其中比較步驟包括下列步驟對從多個臨界頻帶信號得到的多個包絡(luò)中的每個包絡(luò)執(zhí)行Fourier變換。
14.權(quán)利要求1的方法,其中比較步驟包括下列步驟對語音信號進(jìn)行濾波,以得到多個臨界頻帶信號。
15.權(quán)利要求14的方法,其中比較步驟包括下列步驟對多個臨界頻帶信號進(jìn)行包絡(luò)分析,以得到多個調(diào)制頻譜。
16.權(quán)利要求15的方法,其中比較步驟包括下列步驟對多個調(diào)制頻譜的每個調(diào)制頻譜進(jìn)行Fourier變換。
全文摘要
本發(fā)明提供了一種用于語音質(zhì)量評估的聽覺發(fā)音分析。這種發(fā)音分析以對與語音信號中的發(fā)音頻率范圍和非發(fā)音頻率范圍關(guān)聯(lián)的功率進(jìn)行比較為基礎(chǔ)。在這種發(fā)音分析中既不用源語音也不用對源語音的估計(jì)。這種發(fā)音分析包括對一個語音信號的發(fā)音功率和非發(fā)音功率進(jìn)行比較和根據(jù)比較結(jié)果評估語音質(zhì)量的步驟,其中發(fā)音功率和非發(fā)音功率分別是與語音信號中的發(fā)音頻率范圍和非發(fā)音頻率范圍關(guān)聯(lián)的功率。
文檔編號G10L11/00GK1550001SQ03800938
公開日2004年11月24日 申請日期2003年6月27日 優(yōu)先權(quán)日2002年7月1日
發(fā)明者金度錫 申請人:朗迅科技公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1