專利名稱:語音數(shù)據(jù)的測評裝置的制作方法
技術領域:
本實用新型涉及ー種語音數(shù)據(jù)的測評裝置,尤其涉及ー種基于語言生態(tài)學的語音數(shù)據(jù)的測評裝置。
背景技術:
近年來,隨著語音識別等語音技術的進歩,計算機輔助語言學習技術作為ー個全新的交叉學科研究課題逐漸受到學術界和教育界的關注?,F(xiàn)有的運用計算機進行普通話水平測試和指導學習的方法采用了以音段為單位建立普通話水平測試評分機制,采用語音識別的方法,計算參加普通話水平考試考生的得分,井指出考生的發(fā)音錯誤。但是現(xiàn)有技術有如下缺陷該技術主要針對我國的普通話水平考試應用,考生的母語基本為漢語,漢語發(fā)音水平很高,其方法不適合母語非漢語的漢語學習者的發(fā)音水平評價和發(fā)音指導;該技術過多的依賴于隱馬爾科夫模型等統(tǒng)計學方法,沒有針對漢語普通話學習者的母語(或方言)背景進行語音生態(tài)分析和相應的系統(tǒng)設計;該技術提出了發(fā)音錯誤分析和指導,但沒有給出具體的實現(xiàn)方法,導致系統(tǒng)功能并不能實現(xiàn)。
實用新型內容本實用新型的目的是針對現(xiàn)有技術的缺陷,提供了ー種語音數(shù)據(jù)的測評裝置,可以有效的利用語言生態(tài)學來實現(xiàn)非漢語母語語音數(shù)據(jù)的檢測和測評,有效的分類得出不同情況的測評結果,指導發(fā)音。為實現(xiàn)上述目的,本實用新型提供了ー種語音數(shù)據(jù)的測評裝置,所述語音數(shù)據(jù)的測評裝置包括采集單元、提取單元、處理單元和映射単元;所述采集単元與所述提取単元相連接,所述提取単元與所述處理単元相連接,所述處理単元與所述映射単元相連接;所述采集單元采集測評漢語語音的測評發(fā)音數(shù)據(jù);所述提取単元從所述測評發(fā)音數(shù)據(jù)中按照專家知識數(shù)據(jù)庫中的專家知識數(shù)據(jù)提取特征參數(shù),從所述特征參數(shù)中查詢典型偏誤特征;所述處理単元根據(jù)所述特征參數(shù)得到客觀測評結果數(shù)據(jù);所述映射単元將所述客觀測評結果數(shù)據(jù)利用評分映射關系進行映射處理得到主觀測評結果數(shù)據(jù)。所述語音數(shù)據(jù)的測評裝置還包括,用于根據(jù)所述主觀測評結果數(shù)據(jù),依照所述典型偏誤特征,得到發(fā)音練習數(shù)據(jù)的生成単元,與所述映射単元相連接。本實用新型語音數(shù)據(jù)的測評裝置利用語言生態(tài)學的方法,實現(xiàn)非漢語母語語音數(shù)據(jù)的準確的檢測和測評,從而有效的指導檢測者的發(fā)音。
[0014]圖1為本實用新型語音數(shù)據(jù)的測評裝置的示意圖;圖2為本實用新型語音數(shù)據(jù)的測評裝置的處理方法流程圖;圖3為本實用新型語音數(shù)據(jù)的測評裝置的處理方法的示意圖;圖4為本實用新型語音數(shù)據(jù)的測評裝置中切除清音和靜音方法的示意圖;圖5為本實用新型語音數(shù)據(jù)的測評裝置中基音周期估計方法的示意圖;圖6為本實用新型語音數(shù)據(jù)的測評裝置中基音失真度計算方法的示意圖;圖7為本實用新型語音數(shù)據(jù)的測評裝置中共振峰失真度計算方法的示意圖;圖8為本實用新型語音數(shù)據(jù)的測評裝置中發(fā)音指導示意圖之ー;圖9為本實用新型語音數(shù)據(jù)的測評裝置中發(fā)音指導示意圖之ニ。
具體實施方式
下面通過附圖和實施例,對本實用新型的技術方案做進ー步的詳細描述。本實用新型是ー種利用計算機輔助下的漢語學習裝置,計算機輔助漢語學習方法分為前期準備和發(fā)音教學兩個階段第一個階段是基于語言生態(tài)調查的前期準備階段工作,對非漢語母語的漢語學習者的教學,起決定性的作用,包含了語音數(shù)據(jù)采集,語音數(shù)據(jù)分析和特征提取,獲取當?shù)厝藢W習漢語發(fā)音時的典型偏誤特征和專家知識。選取部分當?shù)厝藵h語普通話語音庫語音和標準語音庫語音作為評分語音庫數(shù)據(jù),最后利用評分語音庫中的特征向量,建立起特征向量與打分之間的評分映射。第二個階段是發(fā)音教學階段,首先對測試者的發(fā)音錄音進行處理,先進行特征提取、然后通過偏誤分析,客觀評分,在最后的發(fā)音教學単元中結合專家知識對測試者進行有針對性的教學。本實用新型就是所謂的第二個階段的具體過程,圖1為本實用新型語音數(shù)據(jù)的測評裝置的示意圖,如圖所示,本實用新型包括采集單元11、提取單元12、處理單元13和映射單元14。采集單元11與提取單元12相連接,提取單元12與處理單元13相連接,處理單元13與映射單元14相連接;采集單元11采集測評漢語語音的測評發(fā)音數(shù)據(jù);提取單元12從測評發(fā)音數(shù)據(jù)中按照專家知識數(shù)據(jù)庫中的專家知識數(shù)據(jù)提取特征參數(shù),從特征參數(shù)中查詢典型偏誤特征;處理單元13根據(jù)特征參數(shù)得到客觀測評結果數(shù)據(jù);映射単元14將客觀測評結果數(shù)據(jù)利用評分映射關系進行映射處理得到主觀測評結果數(shù)據(jù)。再如圖1所示,本實用新型的語音數(shù)據(jù)的測評裝置還包括生成単元15,用于根據(jù)所述主觀測評結果數(shù)據(jù),依照所述典型偏誤特征,得到發(fā)音練習數(shù)據(jù)的,與映射単元14相連接圖2為本實用新型語音數(shù)據(jù)的測評裝置的處理方法流程圖,圖3為本實用新型語音數(shù)據(jù)的測評裝置的處理方法的示意圖,如圖所示,具體包括如下步驟步驟101,采集單元采集測評漢語語音的測評發(fā)音數(shù)據(jù);即采集非漢語母語的漢語語音測評發(fā)音數(shù)據(jù),并且將該測評發(fā)音數(shù)據(jù)按照年齡和性別歸類。首先由發(fā)音測試者選擇屬于自己的地區(qū),進而確定適用于測試者的計算機輔助漢語學習系統(tǒng)。然后對測試者的漢語測評發(fā)音數(shù)據(jù)進行采集。步驟102,提取單元從所述測評發(fā)音數(shù)據(jù)中按照專家知識數(shù)據(jù)庫中的專家知識數(shù)據(jù)提取特征參數(shù),從所述特征參數(shù)中查詢典型偏誤特征;即據(jù)不同年齡和性別按照語音測評標準,從所述測評發(fā)音數(shù)據(jù)中提取特征參數(shù),將所述特征參數(shù)進行統(tǒng)計和匹配得到所述典型偏誤特征。依據(jù)數(shù)據(jù)分析階段語音生態(tài)分析得到的專家知識進行特征參數(shù)選擇和權重設置,然后提取測試者語音數(shù)據(jù)特征參數(shù)。從所述測評發(fā)音數(shù)據(jù)中提取-MFCC信息、基音信息和共振峰信息。 由于語音信號是ー種典型的非平穩(wěn)信號,加之呼吸氣流、外部噪音、電流干擾等使得語音信號不能直接用于提取特征,而要進行前期的預處理。經過預處理的語音數(shù)據(jù)就可以進行特征參數(shù)提取。預處理模塊包括預采樣和量化、預加重濾波、加窗分幀、端點檢測。預加重濾波器是ー個ー階高通濾波器。目的是濾除低頻干擾,提升語音信號的高頻部分,使信號的頻譜變得平坦,便于進行頻譜分析或聲道參數(shù)的分析。預加重濾波器一般形式如下H(z) = 1-uz ベ(1)其中,u的值接近于1,在本系統(tǒng)中u的值取為0. 97。語音信號在10_30ms內保持相對平穩(wěn),因此巾貞長一般取10_30ms,巾貞移通常為巾貞長的0 1/2。本系統(tǒng)巾貞長取25ms,巾貞移取5ms。加窗可以保持語音信號的短時平穩(wěn)性,減少截斷導致的吉布斯效應。本系統(tǒng)采用漢明窗,窗函數(shù)如下
0.5-0.46 cos I-1 , 0<n<N-\Whm=\VN-IJ(2)
0, other端點檢測的基本參數(shù)主要有短時能量及平均幅度和過零率。設經加窗處理后得到的第η幀語音信號為xn(m),則xn(m)滿足下式xn(m) = w(m) x (n+m),N = 0,T,2T,L ;0 ^ m ^ N_1 (3)式中w(m)是窗函數(shù),N是窗長;下標η = 0,1, L表示巾貞號。那么xn(m)的短時能量可以表示為
1 N-1Εη = —Σχ 2( )⑷
ゾ V m=0短時過零率(ZCR)表示ー幀語音信號波形穿過零點電平的次數(shù),可通過如下公式計算ZCR = — Σ I sgn[x; ( )] - sgn[x; [η -1)] |(5)
2 Π=1式中sgn 口是符號函數(shù),即
r η [1 , X > 0sgn IXI = <{
L J い,x<0端點檢測算法采用雙門限算法,雙門限端點檢測包括短時能量檢測和短時過零率檢測,檢測之前分別為短時能量和過零率各設置ー個較高門限和ー個較低門限Eh,E1; ZCRh和ZCR1;門限值的計算需要根據(jù)不同環(huán)境進行調整。語音端點檢測把語音段分為三類靜音段、過渡段和語音段。能量和過零率均低于低門限的語音認為是處在靜音段,只要其中一個超過低門限則認為進入過渡段,能量和過零率有一個都超過高門限才被認為進入語音段。同時為了去除噪聲的誤判,語音段的長度門限為20-30ms,為了避免字間空隙認為是靜音,靜音段的長度門限為30-50ms。需要注意的是,為避免短時能量En溢出及配合后邊的閾值,本發(fā)實用新型中采用短時平均幅度STAMn代替En,STAMn可以表示為
權利要求1.ー種語音數(shù)據(jù)的測評裝置,其特征在于,所述語音數(shù)據(jù)的測評裝置包括采集單元、提取單元、處理單元和映射単元; 所述采集単元與所述提取単元相連接,所述提取単元與所述處理単元相連接,所述處理單元與所述映射単元相連接; 所述采集單元采集測評漢語語音的測評發(fā)音數(shù)據(jù);所述提取単元從所述測評發(fā)音數(shù)據(jù)中按照專家知識數(shù)據(jù)庫中的專家知識數(shù)據(jù)提取特征參數(shù),從所述特征參數(shù)中查詢典型偏誤特征;所述處理単元根據(jù)所述特征參數(shù)得到客觀測評結果數(shù)據(jù);所述映射單元將所述客觀測評結果數(shù)據(jù)利用評分映射關系進行映射處理得到主觀測評結果數(shù)據(jù)。
2.根據(jù)權利要求1所述的語音數(shù)據(jù)的測評裝置,其特征在于,所述語音數(shù)據(jù)的測評裝置還包括,用于根據(jù)所述主觀測評結果數(shù)據(jù),依照所述典型偏誤特征,得到發(fā)音練習數(shù)據(jù)的生成単元,與所述映射單元相連接。
專利摘要本實用新型涉及一種語音數(shù)據(jù)的測評裝置,語音數(shù)據(jù)的測評裝置包括采集單元、提取單元、處理單元和映射單元;采集單元與提取單元相連接,提取單元與處理單元相連接,處理單元與映射單元相連接;采集單元采集測評漢語語音的測評發(fā)音數(shù)據(jù);提取單元從測評發(fā)音數(shù)據(jù)中按照專家知識數(shù)據(jù)庫中的專家知識數(shù)據(jù)提取特征參數(shù),從特征參數(shù)中查詢典型偏誤特征;處理單元根據(jù)特征參數(shù)得到客觀測評結果數(shù)據(jù);映射單元將客觀測評結果數(shù)據(jù)利用評分映射關系進行映射處理得到主觀測評結果數(shù)據(jù)。語音數(shù)據(jù)的測評裝置利用語言生態(tài)學的方法,實現(xiàn)非漢語母語語音數(shù)據(jù)的準確的檢測和測評,從而有效的指導檢測者的發(fā)音。
文檔編號G10L25/90GK202758611SQ201220128139
公開日2013年2月27日 申請日期2012年3月29日 優(yōu)先權日2012年3月29日
發(fā)明者孟子厚, 韓衛(wèi)生, 謝凌云, 潘興德, 章斯宇 申請人:北京中傳天籟數(shù)字技術有限公司