專利名稱::一種漢語(yǔ)普通話中平舌音和卷舌音的客觀測(cè)試方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及漢語(yǔ)普通話客觀測(cè)試
技術(shù)領(lǐng)域:
,具體地說(shuō),本發(fā)明涉及一種漢語(yǔ)普通話中平舌音和巻舌音的客觀測(cè)試方法。
背景技術(shù):
:在漢語(yǔ)普通話的學(xué)習(xí)中,由于聲母的發(fā)音持續(xù)時(shí)間比較短,發(fā)音過(guò)程包括成阻、持阻和除阻三個(gè)階段,對(duì)發(fā)音部位和發(fā)音方法的要求較高,所以,聲母的發(fā)音難度較大,特別是一些發(fā)音方法和發(fā)音部位比較接近的聲母,學(xué)習(xí)者由于受到自身母語(yǔ)和地方語(yǔ)的影響,在普通話的學(xué)習(xí)過(guò)程中容易混淆。一般來(lái)說(shuō),學(xué)習(xí)者在學(xué)習(xí)第二語(yǔ)言的過(guò)程中,總是習(xí)慣于用母語(yǔ)中的發(fā)音來(lái)模擬第二語(yǔ)言中的發(fā)音。如果母語(yǔ)中的發(fā)音可以和第二語(yǔ)言中的某些發(fā)音對(duì)應(yīng),那么這些發(fā)音一般比較容易掌握,而且掌握的比較好。但是,如果第二語(yǔ)言中的某些音在學(xué)習(xí)者的母語(yǔ)中找不到可以對(duì)應(yīng)的音,那么,這些音的學(xué)習(xí)難度將特別大。特別是,如果在第二語(yǔ)言中有些發(fā)音十分接近的音,而在學(xué)習(xí)者的母語(yǔ)中這些音本身就是不區(qū)分的,那么在這種情況下,學(xué)習(xí)者就更加難以掌握了。平舌音和巻舌音,是普通話中比較難學(xué)習(xí)和掌握的兩類聲母,特別是對(duì)于母語(yǔ)是南方語(yǔ)系的學(xué)習(xí)者和測(cè)試者,由于母語(yǔ)的原因,更不容易區(qū)分。在漢語(yǔ)普通話中,共有六個(gè)平舌音和巻舌音,分別是[s]、[sh]、[c]、[ch]、[z]和[zh];其中,[s]、[z]和[c]屬于平舌音,[sh]、[zh]和[ch]屬于巻舌音。目前,基于隱馬爾可夫的漢語(yǔ)普通話測(cè)試方法是應(yīng)用較廣的一種方法。輸入語(yǔ)音首先通過(guò)識(shí)別器被一遍解碼,在這個(gè)過(guò)程中,對(duì)應(yīng)于輸入語(yǔ)音的詞圖或詞序列被得到。第二遍計(jì)算過(guò)程在前面得到的詞圖或詞序列的基礎(chǔ)上進(jìn)行,計(jì)算輸入語(yǔ)音與聲學(xué)模型的匹配程度,最后通過(guò)映射得到輸入語(yǔ)音的得分。由于目前使用的聲學(xué)模型中平舌音和巻舌音的鑒別度不高,導(dǎo)致輸入語(yǔ)音通過(guò)解碼后計(jì)算的與聲學(xué)模型的匹配程度準(zhǔn)確度不高,輔助學(xué)習(xí)者學(xué)習(xí)時(shí)效果較差。
發(fā)明內(nèi)容為克服現(xiàn)有技術(shù)中平舌音和巻舌音的測(cè)試準(zhǔn)確性差的缺陷,本發(fā)明提出一種漢語(yǔ)普通話中平舌音和巻舌音的客觀測(cè)試方法。根據(jù)本發(fā)明的一個(gè)方面,提供了一種漢語(yǔ)普通話中平舌音和巻舌音的客觀評(píng)測(cè)方法,包括步驟IO)、對(duì)輸入語(yǔ)音進(jìn)行切分;步驟20)、提取切分后語(yǔ)音的能量均值比特征;步驟30)、將所述能量均值比與通過(guò)訓(xùn)練獲取的閾值比較,得到客觀評(píng)測(cè)平舌音和巻舌音的得分。其中,步驟10)中,優(yōu)選地,以音素為最小單位對(duì)輸入語(yǔ)音進(jìn)行切分。其中,步驟20)中,優(yōu)選地,所述語(yǔ)音區(qū)別特征為輸入語(yǔ)音的強(qiáng)頻集中區(qū)和非強(qiáng)頻集中區(qū)的能量均值比。其中,步驟20)進(jìn)一步包括步驟IOO)、分析切分后語(yǔ)音的頻鐠特征,去除低頻能量集中區(qū);步驟200)、定位所述語(yǔ)音的強(qiáng)頻集中區(qū),獲取所述強(qiáng)頻集中區(qū)的能量均值;步驟300)、定位所述語(yǔ)音的非強(qiáng)頻集中區(qū),獲取所述語(yǔ)音非強(qiáng)頻集中區(qū)的能量均值;步驟400)、獲取所述語(yǔ)音的所述強(qiáng)頻集中區(qū)和所述非強(qiáng)頻集中區(qū)的能量均值比。其中,步驟30)進(jìn)一步包括如果輸入語(yǔ)音應(yīng)該為平舌音,當(dāng)輸入語(yǔ)音的能量均值比大于預(yù)設(shè)的閾值,將輸入語(yǔ)音測(cè)定為平舌音;如果輸入語(yǔ)音應(yīng)該為巻舌音,當(dāng)輸入語(yǔ)音的能量均值比大于預(yù)設(shè)的闊值,將輸入語(yǔ)音測(cè)定為巻舌音。其中,步驟100)進(jìn)一步包括步驟IIO)、對(duì)語(yǔ)音信號(hào)分幀,獲取每一頻率點(diǎn)上的頻域能量;步驟120)、使用滑動(dòng)窗,確定頻域能量的極大值點(diǎn);步驟130)、采用可變窗,確定低頻高能量區(qū)域的頻率上限點(diǎn),去除低于所述頻率上限點(diǎn)的各頻率點(diǎn)。其中,步驟200)進(jìn)一步包括步驟210)、通過(guò)設(shè)定平舌音強(qiáng)頻集中區(qū)的頻率下限和巻舌音強(qiáng)頻集中區(qū)的頻率上限,設(shè)定平舌音和巻舌音的強(qiáng)頻集中區(qū)的范圍;步驟220)、使用滑動(dòng)窗,在所述設(shè)定的強(qiáng)頻集中區(qū)范圍內(nèi)尋找能量極值點(diǎn);步驟230)、對(duì)于平舌音,將所述頻率下限到能量極值點(diǎn)之間的區(qū)域作為強(qiáng)頻集中區(qū);對(duì)于巻舌音,將能量極值點(diǎn)到所述頻率上限之間的區(qū)域作為強(qiáng)頻集中區(qū);步驟240)、將尋找能量極值點(diǎn)時(shí)滑動(dòng)窗中各頻點(diǎn)的能量均值作為所述強(qiáng)頻集中區(qū)的能量均值。其中,步驟300)進(jìn)一步包括步驟310)、通過(guò)計(jì)算能量極小值,確定平舌音非強(qiáng)頻集中區(qū)的頻率上限;步驟320)、通過(guò)計(jì)算能量極大值,確定巻舌音非強(qiáng)頻集中區(qū)的頻率下限;步驟330)、計(jì)算輸入語(yǔ)音非強(qiáng)頻集中區(qū)能量。其中,步驟120)進(jìn)一步包括使用滑動(dòng)窗尋找能量極大值及其所在的頻率,存、A,A=argmax£(A:),A:=wiy+y/oor(丄/2)+l,其中,"為滑動(dòng)窗的滑動(dòng)次數(shù),滑動(dòng)窗的窗長(zhǎng)為"滑動(dòng)步長(zhǎng)為『,如""2)表示l/2的值向絕對(duì)值減小的方向舍入;所述能量極大值maxE^需要滿足£隨=五(4其中,<formula>formulaseeoriginaldocumentpage9</formula>其中,A為頻率點(diǎn)k的頻率。其中,步驟130)進(jìn)一步包括設(shè)能量參考初始閾值為A,《、;r/,、z),其中,先=argmax£(A:);遞歸計(jì)算隨窗長(zhǎng)增加的能量的均值,£,2)+(其中,/。。"丄/2)+/</;,!是頻率軸上的頻率點(diǎn),£(0為頻率點(diǎn)對(duì)應(yīng)的頻域能量,《為預(yù)先設(shè)定的尋找低頻高能量集中區(qū)的上限頻率,當(dāng)£,+1>£,"m/朋"£">£",把頻率點(diǎn)'作為低頻高能量區(qū)域的頻率上限點(diǎn),去除低于所述頻率上限點(diǎn)的各頻率點(diǎn)。其中,步驟330)進(jìn)一步包括當(dāng)輸入語(yǔ)音應(yīng)該為平舌音時(shí),所述非強(qiáng)頻集中區(qū)能量為當(dāng)輸入語(yǔ)音應(yīng)該為巻舌音時(shí),所述非強(qiáng)頻集中區(qū)能量為五A,27Z五("其中,力,和4為非強(qiáng)頻集中區(qū)的平舌音的上限頻率和巻舌音的下限頻率,E(^為頻點(diǎn)k的能量值,尸為語(yǔ)音信號(hào)采樣頻率的一半。通過(guò)應(yīng)用本發(fā)明,采用更能反映發(fā)音本質(zhì)的區(qū)別特征,對(duì)平舌音和巻舌音進(jìn)行區(qū)分,可以得到更好的區(qū)分性能。圖1是本發(fā)明的平舌音和巻舌音客觀測(cè)試方法一個(gè)實(shí)施例的流程圖2是完整的平舌音頻域能量曲線;圖3是完整的巻舌音頻域能量曲線;圖4是用滑動(dòng)窗尋找能量的極大值點(diǎn)示意圖5是尋找低頻高能量集中區(qū)域頻率上限點(diǎn)示意圖。具體實(shí)施例方式下面結(jié)合附圖和具體實(shí)施例,對(duì)本發(fā)明提供的一種漢語(yǔ)普通話中平舌音和巻舌音的客,見(jiàn)測(cè)試方法作詳細(xì)說(shuō)明。如圖1所示,根據(jù)本發(fā)明的一個(gè)實(shí)施例提供的一種平舌音和巻舌音的客觀測(cè)試方法包括如下步驟對(duì)輸入語(yǔ)音進(jìn)行切分;提取區(qū)別平舌音和巻舌音的語(yǔ)音特征;根據(jù)評(píng)估模型對(duì)語(yǔ)音區(qū)別特征評(píng)估打分和得到發(fā)音得分。1、將輸入語(yǔ)音以音素為最小單位進(jìn)行切分。2、^:取區(qū)別特征語(yǔ)音區(qū)別特征是構(gòu)成語(yǔ)音信號(hào)的基本元素,不但^1語(yǔ)音學(xué)和音系學(xué)研究的重要內(nèi)容,也是語(yǔ)音信號(hào)處理技術(shù)所面對(duì)的重要處理對(duì)象。通常語(yǔ)音區(qū)別特征包括區(qū)分元音的舌位的高低前后,區(qū)分輔音的發(fā)音時(shí)發(fā)生阻礙的不同部位以及不同的發(fā)音方法。(1)去除低頻能量集中區(qū)從圖2和圖3中可以看出,語(yǔ)音低頻部分的能量集中區(qū)的能量對(duì)于整個(gè)頻域上的能量分布影響很大,由于它的存在,使得平舌音在高頻部分的強(qiáng)頻集中區(qū)和巻舌音在中低頻部分的強(qiáng)頻集中區(qū)與其相比并不明顯。所以,低頻部分的能量集中區(qū)在釆用強(qiáng)頻集中區(qū)的特征區(qū)分平舌音和巻舌音時(shí),需要將其去除。a、對(duì)語(yǔ)音信號(hào)分幀,并作快速傅立葉變換(FFT),計(jì)算每一個(gè)頻率點(diǎn)上的頻域能量;五("=|>")(1)其中,M為語(yǔ)音信號(hào)的幀數(shù),4厶,)為每一幀語(yǔ)音信號(hào)對(duì)應(yīng)于頻率點(diǎn)A的譜能量。b、用滑動(dòng)窗尋找頻域能量的極大值點(diǎn),如圖4所示;i)、設(shè)滑動(dòng)窗的窗長(zhǎng)為"滑動(dòng)步長(zhǎng)為『,滑動(dòng)窗函數(shù)—"=1,0<^"(2)滑動(dòng)窗在預(yù)設(shè)的范圍內(nèi)滑動(dòng),尋找符合條件的極大值以及極大值所在的頻率點(diǎn)、A二argmaxjE(A:),A:="『+yz離(L/2)+l("其中,"為滑動(dòng)窗的滑動(dòng)次數(shù),y。。Ki/2)表示L/2的值向絕對(duì)值減小的方向舍入。能量極大值需要滿足Z五")Z五")、7y離(丄/2)、;如o"Z/2)ii)、為去除能量奇異值的影響,在尋找能量極大值£("時(shí)添加以下飾£*=會(huì)(五(")辟+1))五、^z^廠朋dF>2),+1_(5)y麼(丄/2)如。"m)c、尋找低頻高能量區(qū)域的頻率上限點(diǎn),如圖5所示,能量極值點(diǎn)找到后,采用可變窗長(zhǎng)的矩形窗尋找頻率上限點(diǎn)。設(shè)能量參考初始闊值為A,且五<formula>formulaseeoriginaldocumentpage13</formula>其中,A=argmax£(A:)。隨著窗長(zhǎng)的增加,遞歸計(jì)算能量的均值,<formula>formulaseeoriginaldocumentpage13</formula>并且滿足,其中,'是頻率軸上的頻率點(diǎn),"(o為頻率點(diǎn)對(duì)應(yīng)的頻域能量,力為預(yù)先設(shè)定的尋找低頻高能量集中區(qū)的上限頻率。當(dāng)把頻率點(diǎn)y作為低頻高能量區(qū)域的頻率上限,去除低于頻率上限點(diǎn)的各頻率點(diǎn)。(2)定位強(qiáng)頻集中區(qū)a)、定位強(qiáng)頻集中區(qū)首先,設(shè)定強(qiáng)頻集中區(qū)的范圍,由于計(jì)算機(jī)輔助語(yǔ)言學(xué)習(xí)和客觀測(cè)試系統(tǒng)中,測(cè)試者的發(fā)音文本是已知的,所以,可以根據(jù)不同的發(fā)音設(shè)定不同尋找范圍。尋找范圍的設(shè)定釆取適當(dāng)擴(kuò)大的原則,對(duì)于平舌音,由于強(qiáng)頻集中區(qū)位于高頻部分,所以,強(qiáng)頻集中區(qū)的頻率下限定為/"=3500他。對(duì)于巻舌音,強(qiáng)頻集中區(qū)位于中低頻部分,所以,強(qiáng)頻集中區(qū)的頻率上限定為力,=5500歷。采用上文中介紹的滑動(dòng)窗尋找能量極大值的方法在預(yù)定區(qū)域內(nèi)按照頻域能量的大小尋找前三個(gè)極值點(diǎn)、&,&。A:=argmaxjE(A:),A:=A:0++j。。"Z/2)+l(10)其中,A。為預(yù)定尋找區(qū)域的起始點(diǎn),對(duì)于平舌音,將設(shè)定的頻率下限作為起始點(diǎn),對(duì)于巻舌音,將低頻高能量的頻率上限點(diǎn)作為起始點(diǎn)。但是,為避免能量極值點(diǎn)與能量最大值點(diǎn)的混淆,三個(gè)極值點(diǎn)、、&需要滿足<formula>formulaseeoriginaldocumentpage14</formula>其中,At—為極值點(diǎn)間的間距,對(duì)于平舌音,強(qiáng)頻集中區(qū)是頻率下限(3500hz)到k2之間的區(qū)域;對(duì)于巻舌音,強(qiáng)頻集中區(qū)是k2到頻率上限(5500HZ)之間的區(qū)域。b)、計(jì)算輸入語(yǔ)音強(qiáng)頻集中區(qū)的能量均值,以尋找能量極值點(diǎn)時(shí)滑動(dòng)窗中的能量均值作為強(qiáng)頻集中區(qū)的能量均值,即(12)<formula>formulaseeoriginaldocumentpage15</formula>其中,^為強(qiáng)頻集中區(qū)的能量均值,《為能量極值點(diǎn)所在的滑動(dòng)窗的能量均值,c(《)為根據(jù)《是否為零而變化的權(quán)值,丄是滑動(dòng)窗的窗長(zhǎng),"是滑動(dòng)次數(shù),『是滑動(dòng)窗的滑動(dòng)步長(zhǎng),t。為預(yù)定尋找區(qū)域的起始點(diǎn)。(3)、定位非強(qiáng)頻集中區(qū)a)、確定平舌音非強(qiáng)頻集中區(qū)的頻率上限乂二argmin五(A:),A:二A:pA:2,A3(15)頻率上限<formula>formulaseeoriginaldocumentpage15</formula>其中,A是預(yù)先設(shè)定的平舌音強(qiáng)頻集中區(qū)的下限頻率,丄是滑動(dòng)窗的窗長(zhǎng)。b)、確定巻舌音非強(qiáng)頻集中區(qū)的頻率下限/=argmax5(A:),A:=^,A2,A:3(17)頻率下限<formula>formulaseeoriginaldocumentpage15</formula>其中,人是預(yù)先設(shè)定的巻舌音強(qiáng)頻集中區(qū)的上限頻率,z是滑動(dòng)窗的c)、計(jì)算輸入語(yǔ)音非強(qiáng)頻集中區(qū)能:對(duì)于平舌音、五'=4"(19)、f7。.對(duì)于巻舌音&=yVi,,、F-力,w(20)其中,4和力"為非強(qiáng)頻集中區(qū)的上、下限頻率,F(xiàn)為語(yǔ)音信號(hào)采樣頻率的一半。(4)、計(jì)算區(qū)別特征一一強(qiáng)頻集中區(qū)和非強(qiáng)頻集中區(qū)的能量均值比&(21)其中,^為強(qiáng)頻集中區(qū)的能量均值,^為非強(qiáng)頻集中區(qū)的能量均值。3、評(píng)估打分由于發(fā)音部位的不同導(dǎo)致共鳴腔、共鳴頻率的不同,從而4吏得能量分布和能量強(qiáng)頻集中區(qū)有所不同,這是區(qū)別平舌音和巻舌音的根本特征。本文采用強(qiáng)頻集中區(qū)和非強(qiáng)頻集中區(qū)的能量均值比,作為描述能量分布和強(qiáng)頻集中區(qū)的特征,對(duì)平舌音和巻舌音進(jìn)行區(qū)分。判別爿>式為M,(22)其中,《為能量均值比的閾值,閾值通過(guò)訓(xùn)練得到,找一批平舌音和巻舌音,分別求取他們的這個(gè)比值,從中總結(jié)出這個(gè)闊值。如果測(cè)試者應(yīng)該讀平舌音,讀得語(yǔ)音的R〉Rt,則表明他讀的是平舌音;如果測(cè)試者應(yīng)該讀巻舌音,讀得語(yǔ)音的R〉Rt,則表明他讀的是巻舌音。采用包含漢語(yǔ)普通話中6對(duì)平舌音和巻舌音的300個(gè)單音節(jié)字的數(shù)據(jù)庫(kù)對(duì)以上介紹的區(qū)分方法進(jìn)行測(cè)試,數(shù)據(jù)庫(kù)由50個(gè)南方口音的中學(xué)生在安靜環(huán)境下錄制,并由五位漢語(yǔ)普通話國(guó)家一級(jí)測(cè)試員進(jìn)行單獨(dú)打分。測(cè)試任務(wù)是對(duì)數(shù)據(jù)庫(kù)中的發(fā)音進(jìn)行評(píng)估打分,試驗(yàn)結(jié)果如表1所示。同時(shí),本文對(duì)低頻能量集中區(qū)去除模塊對(duì)系統(tǒng)性能的影響也進(jìn)行了測(cè)試,試驗(yàn)結(jié)果的比較示于表l中。表l平舌音和巻舌音打分正確率<table>tableseeoriginaldocumentpage17</column></row><table>從表1中可以看出,采用區(qū)別特征用于對(duì)平舌音和巻舌音的打分可以取得相對(duì)H腿的方法比較好的效果,能夠在很大程度上克服對(duì)于學(xué)習(xí)者和測(cè)試系統(tǒng)這兩類音容易混淆的問(wèn)題,而且,去除低頻能量集中區(qū)的模塊對(duì)整個(gè)算法的性能有很大影響。最后應(yīng)說(shuō)明的是,以上實(shí)施例僅用以說(shuō)明本發(fā)明的技術(shù)方案而非對(duì)其限制,并且在應(yīng)用上可以延伸到其他的修改、變化、應(yīng)用和實(shí)施例,同時(shí)認(rèn)為所有這樣的修改、變化、應(yīng)用、實(shí)施例都在本發(fā)明的精神和范圍內(nèi)。權(quán)利要求1、一種漢語(yǔ)普通話中平舌音和卷舌音的客觀評(píng)測(cè)方法,包括步驟10)、對(duì)輸入的平舌音或者卷舌音進(jìn)行切分;步驟20)、提取切分后語(yǔ)音的能量均值比特征;步驟30)、將所述能量均值比與通過(guò)訓(xùn)練獲取的對(duì)應(yīng)平舌音或者卷舌音的閾值比較,得到客觀評(píng)測(cè)平舌音和卷舌音的得分。2、權(quán)利要求l的方法,其中,步驟10)中,優(yōu)選地,以音素為最小單位對(duì)輸入語(yǔ)音進(jìn)行切分。3、權(quán)利要求l的方法,其中,步驟20)中,優(yōu)選地,所述語(yǔ)音區(qū)別特征為輸入語(yǔ)音的強(qiáng)頻集中區(qū)和非強(qiáng)頻集中區(qū)的能量均值比。4、權(quán)利要求l的方法,其中,步驟20)進(jìn)一步包括步驟IOO)、分析切分后語(yǔ)音的頻鐠特征,去除低頻能量集中區(qū);步驟200)、定位所述語(yǔ)音的強(qiáng)頻集中區(qū),獲取所述強(qiáng)頻集中區(qū)的能量均值;步驟300)、定位所述語(yǔ)音的非強(qiáng)頻集中區(qū),獲取所述語(yǔ)音非強(qiáng)頻集中區(qū)的能量均值;步驟400)、獲取所述語(yǔ)音的所述強(qiáng)頻集中區(qū)和所述非強(qiáng)頻集中區(qū)的能量均值比。5、權(quán)利要求l的方法,其中,步驟30)進(jìn)一步包括如果輸入語(yǔ)音應(yīng)該為平舌音,當(dāng)輸入語(yǔ)音的能量均值比大于預(yù)設(shè)的閾值,將輸入語(yǔ)音測(cè)定為平舌音;如果輸入語(yǔ)音應(yīng)該為巻舌音,當(dāng)輸入語(yǔ)音的能量均值比大于預(yù)設(shè)的閾值,將輸入語(yǔ)音測(cè)定為巻舌音。6、權(quán)利要求4的方法,其中,步驟100)進(jìn)一步包括步驟IIO)、對(duì)語(yǔ)音信號(hào)分幀,獲取每一頻率點(diǎn)上的頻域能量;步驟120)、使用滑動(dòng)窗,確定頻域能量的極大值點(diǎn);步驟130)、采用可變窗,確定低頻高能量區(qū)域的頻率上限點(diǎn),去除低于所述頻率上限點(diǎn)的各頻率點(diǎn)。7、權(quán)利要求4的方法,其中,步驟200)進(jìn)一步包括步驟210)、通過(guò)設(shè)定平舌音強(qiáng)頻集中區(qū)的頻率下限和巻舌音強(qiáng)頻集中區(qū)的頻率上限,^:定平舌音和巻舌音的強(qiáng)頻集中區(qū)的范圍;步驟220)、使用滑動(dòng)窗,在所述設(shè)定的強(qiáng)頻集中區(qū)范圍內(nèi)尋找能量極值點(diǎn);步驟230)、對(duì)于平舌音,將所述頻率下限到能量極值點(diǎn)之間的區(qū)域作為強(qiáng)頻集中區(qū);對(duì)于巻舌音,將能量極值點(diǎn)到所述頻率上限之間的區(qū)域作為強(qiáng)頻集中區(qū);步驟240)、將尋找能量核^值點(diǎn)時(shí)滑動(dòng)窗中各頻點(diǎn)的能量均值作為所述強(qiáng)頻集中區(qū)的能量均值。8、權(quán)利要求4的方法,其中,步驟300)進(jìn)一步包括步驟310)、通過(guò)計(jì)算能量極小值,確定平舌音非強(qiáng)頻集中區(qū)的頻率上限;步驟320)、通過(guò)計(jì)算能量極大值,確定巻舌音非強(qiáng)頻集中區(qū)的頻率下限;9、權(quán)利要求6的方法,其中,步驟120)進(jìn)一步包括使用滑動(dòng)窗尋找能量極大值及其所在的頻率點(diǎn)<formula>formulaseeoriginaldocumentpage4</formula>其中,"為滑動(dòng)窗的滑動(dòng)次數(shù),滑動(dòng)窗的窗長(zhǎng)為"滑動(dòng)步長(zhǎng)為『,W"/"表示L/2的值向絕對(duì)值減小的方向舍入;所述能量極大值max£("需要滿足<formula>formulaseeoriginaldocumentpage4</formula>其中,力為頻率點(diǎn)k的頻率。10、權(quán)利要求9的方法,其中,步驟130)進(jìn)一步包括設(shè)能量參考初始閾值為五<formula>formulaseeoriginaldocumentpage4</formula>其中,<formula>formulaseeoriginaldocumentpage4</formula>遞歸計(jì)算隨窗長(zhǎng)增加的能量的均值,<formula>formulaseeoriginaldocumentpage4</formula>其中,如<formula>formulaseeoriginaldocumentpage4</formula>是頻率軸上的頻率點(diǎn),五(/)為頻率點(diǎn)對(duì)應(yīng)的頻域能量,力為預(yù)先設(shè)定的尋找低頻高能量集中區(qū)的上限頻率,當(dāng)朋"£,>£M朋"、把頻率點(diǎn)Z作為低頻高能量區(qū)域的頻率上限點(diǎn),去除低于所述頻率上限點(diǎn)的各頻率點(diǎn)。11、權(quán)利要求8的方法,其中,步驟330)進(jìn)一步包括當(dāng)輸入語(yǔ)音應(yīng)該為平舌音時(shí),所述非強(qiáng)頻集中區(qū)能量為<formula>formulaseeoriginaldocumentpage4</formula>當(dāng)輸入語(yǔ)音應(yīng)該為巻舌音時(shí),所述非強(qiáng)頻集中區(qū)能量為<formula>formulaseeoriginaldocumentpage5</formula>其中,力/'和力"為非強(qiáng)頻集中區(qū)的平舌音的上限頻率和巻舌音的下限頻率,E("為頻點(diǎn)k的能量值,F(xiàn)為語(yǔ)音信號(hào)釆樣頻率的一半。全文摘要本發(fā)明公開(kāi)了一種漢語(yǔ)普通話中平舌音和卷舌音的客觀測(cè)試方法,包括接收輸入語(yǔ)音;對(duì)輸入語(yǔ)音進(jìn)行切分;提取區(qū)別特征;根據(jù)評(píng)估模型進(jìn)行評(píng)估打分和得到發(fā)音得分。通過(guò)應(yīng)用本發(fā)明,采用更能反映發(fā)音本質(zhì)的區(qū)別特征,對(duì)平舌音和卷舌音進(jìn)行區(qū)分,可以得到更好的區(qū)分性能。文檔編號(hào)G10L11/00GK101546553SQ200810102580公開(kāi)日2009年9月30日申請(qǐng)日期2008年3月24日優(yōu)先權(quán)日2008年3月24日發(fā)明者軍楊,濱董,顏永紅申請(qǐng)人:中國(guó)科學(xué)院聲學(xué)研究所;北京中科信利技術(shù)有限公司