一種基于移動終端的嗓音檢測評估裝置及方法

文檔序號：2829121閱讀：651來源：國知局

專利名稱：一種基于移動終端的嗓音檢測評估裝置及方法
技術領域：
本發(fā)明涉及移動終端和嗓音檢測技術領域，具體涉及一種基于移動終端的嗓音檢測評估裝置及方法。
背景技術：
隨著醫(yī)學技術的發(fā)展和人們健康意識的提高，人們更加重視嗓音疾病對生活質量造成的影響，嗓音聲學評估、喉功能檢測、嗓音矯治與保健成為了耳鼻咽喉科新的發(fā)展趨勢。然而，隨著人口老齡化和慢性疾病人口比例的逐年增長，傳統(tǒng)的醫(yī)療服務面臨巨大的壓力和挑戰(zhàn)。因此，一種便攜式、低成本、有效的嗓音分析檢測系統(tǒng)亟待出現(xiàn)。目前，國內外主要使用電子計算機及頻譜分析儀采集、分析、統(tǒng)計嗓音聲樣，對嗓音進行聲學分析。國內已有的嗓音醫(yī)學相關系統(tǒng)為國產USSA語音頻譜分析系統(tǒng)(彭策，萬柏坤.嗓音分析在疾病診斷中的應用[J].生物醫(yī)學工程學雜志，2007，24(6):1419-1422.)，聲樣采集均在環(huán)境噪音小于45dB SPL的空調室內，受檢者口距麥克風10-15cm,自然舒適平穩(wěn)發(fā)元音/a/、/i/各3 5秒各I次，聲強控制在80dB SPL左右，通過A/D轉換，輸入電子計算機進行嗓音聲學參數(shù)分析，采集的聲學參數(shù)有:基頻(H))、基頻微擾(Jitter)、振幅微擾(Shimmer)、規(guī)范化噪聲能量(NNE)、基頻標準差(SDFO)等。國外的相關系統(tǒng)有美國Tiger Electronics (上海)公司生產的Dr.Speech Science語音分析系統(tǒng)，法國開發(fā)的嗓音工作站EVA (Marseille French)(Hu Ruimin, Peng Jun, Zhu Rong.Electronic Mail Voice Assistant(EVA).HighTechnology Letters, 19981.)和美國Kay Elemetrics公司的多維語音分析系統(tǒng)MDVP (Mult1-Dimensional Voice Program)(Kent RD,Vorperian HK, Kent JF,DuffyJR.Voice dysfunction in dysarthria:application of the Mult1-Dimensional VoiceProgram.Journal of communication disorders, 20034.；Maryn Y, Corthals P, De BodtM, Van Cauwenberge P, Deliyski D.Perturbation measures of voice:a comparativestudy between Mult1-Dimensional Voice Program and Praat.Folia phoniatrica etlogopaedica, 20094.)，以上提及的這些軟件的采樣環(huán)境與上述國產的系統(tǒng)基本相同，處理結果和參數(shù)分析較優(yōu)于國產系統(tǒng)。多維語音嗓音分析軟件的主要功能是研究正常嗓音和病變嗓音的聲學性質，能從語音信號中提取包括頻率抖動、振幅抖動、基頻、能量等32項聲學參數(shù)，利用這些參數(shù)可以評價嗓音的特性，同時可以利用各參數(shù)的正常參考值對病變嗓音進行臨床分析。但上述系統(tǒng)、軟件價格昂貴，且受于時間和環(huán)境的限制，不能隨時隨地方便快捷對嗓音信號進行分析評估，適用人群非常少，在國內外尚未得到普及。如今移動終端(如手機、掌上電腦等)已經發(fā)展的十分迅速，計算速度和能力非常驚人，且得到很大范圍的普及，需對嗓音進行評估的人群日益增加(教師、音樂人等)，但是基于移動終端的嗓音評估系統(tǒng)尚屬空白。此外，由于嗓音信號的多變性，迄今尚未找到一種完善的方法可以使各類人群、各種環(huán)境條件下都能獲得滿意的檢測結果，也缺少對性別差異等的考慮。目前已有一些針對嗓音分析或者性能評估的專利，但是其中有的是針對特定人群對嗓音性能進行評估(德米特里戈洛夫金，崔哲珉.評估演唱者的嗓音性能的方法和使用該方法的設備.CN101740025A_200910.)，有的是提供一種嗓音諧噪比的分析方法(顏永紅，王迪，張建平一種自動嗓音諧噪比分析方法 CN101452698_200710.)，有的幾乎未涉及嗓音生理參數(shù)(KAY ELEMETRICS CORP.Speech analysis apparatus.US23732081A_1981-2-23.)，都缺少可以適用于各類人群比較便捷并且可以對重要生理參數(shù)進行分析評估的系統(tǒng)。請參見中國專利CN101740025A“評估演唱者的嗓音性能的方法和使用該方法的設備”德米特里戈洛夫金等人提出的一種用于評估卡拉OK設備的演唱者的嗓音性能的方法；參見中國專利CN101452698 “一種自動嗓音諧噪比分析方法”顏永紅等人發(fā)明的使用自相關圖表征的時域和耳蝸譜域通道之間相關性來判斷諧波成份進行諧噪比分析的方法；參見美國專利US23732081A“speech analysis apparatusTferbeson, WilliamD等人發(fā)明的將音調頻率信號等通過電壓傳感器到視覺顯示裝置。

發(fā)明內容
針對現(xiàn)有技術存在的問題，本發(fā)明提供一種基于移動終端的嗓音檢測評估裝置及方法。本發(fā)明的技術方案是:一種基于移動終端的嗓音檢測評估裝置，包括嗓音檢測評估終端，用于對嗓音信號進行檢測并分析嗓音狀態(tài)，其包括信號采集及數(shù)據(jù)保存單元、嗓音信號處理及評估單元和數(shù)據(jù)輸出單元；所述嗓音檢測評估終端采用移動終端；所述信號采集及數(shù)據(jù)保存單元包括嗓音信號采集模塊、嗓音信號數(shù)據(jù)保存模塊和檢測評估結果保存模塊；嗓音信號采集模塊用于采集測試者的嗓音信號，采集到的嗓音信號在嗓音信號數(shù)據(jù)保存模塊進行保存，嗓音檢測評估結果在檢測評估結果保存模塊進行保存；所述嗓音信號處理及評估單元包括嗓音信號處理模塊、嗓音信號周期檢測模塊、特征參數(shù)提取模塊和嗓音信號特征評估分析模塊；嗓音信號處理模塊用于截取嗓音信號中的周期性信號；嗓音信號周期檢測模塊用于對截取的周期性信號進行周期檢測；特征參數(shù)提取模塊用于對嗓音信號周期檢測模塊的輸出信號進行特征參數(shù)提取，特征參數(shù)包括基頻、微擾、諧噪比、信噪比和標準化聲門噪聲能量NNE;嗓音信號特征評估分析模塊用于對特征參數(shù)提取模塊的提取結果進行分析，得出測試者嗓音狀態(tài)；所述數(shù)據(jù)輸出單元包括嗓音信號輸出模塊、嗓音信號波形繪制模塊和檢測日志訪問模塊；嗓音信號輸出模塊用于將嗓音信號特征評估分析模塊的分析結果輸出到外部，嗓音信號波形繪制模塊用于將采集到的測試者的嗓音信號繪制成波形并顯示，檢測日志訪問模塊用于將特征參數(shù)提取模塊的提取結果和嗓音信號特征評估分析模塊的分析結果生成檢測日志，進行長期跟蹤分析。
采用上述基于移動終端的嗓音檢測評估裝置進行嗓音檢測評估方法，包括以下步驟:步驟1:通過嗓音檢測評估終端采集測試者的嗓音信號，將所采集到的嗓音數(shù)據(jù)繪制波形曲線顯示并保存數(shù)據(jù)；步驟2:截取采集到的嗓音信號中的周期性信號；截取采集到的嗓音信號中的周期性信號的具體方法如下:步驟2.1:對采集到的嗓音信號進行小波變換，并得到嗓音信號中高頻部分的小波系數(shù)；步驟2.2:對小波變換后的嗓音信號進行分幀，計算分幀后每幀信號的小波系數(shù)的偏方差值；步驟2.3:選取小波系數(shù)的偏方差值最小的一幀嗓音信號作為周期性信號并保存；步驟3:對截取的周期性信號進行周期檢測；步驟3.1:通過快速傅里葉變換確定周期性信號的基頻；人的嗓音頻率范圍為50-500HZ，測試者嗓音在該頻率范圍內的最大值位置即為估算的嗓音信號中周期性信號的基頻。通過傅里葉變換確定周期性信號的基頻，具體步驟如下:步驟3.1.1:對周期性信號進行傅里葉變換；步驟3.1.2:在變換后的周期性信號中選取人的嗓音頻率范圍內的頻率，其中的最大峰值位置作為主峰值；人的嗓音頻率范圍為50-500HZ ；步驟3.1.3:提取最大峰值位置的1/N位置處的±5%范圍內的峰值即作為分峰值，N為整數(shù)，N=l，2，3,4,5……；步驟3.1.4:判斷主峰值與分峰值的比值，若該比值小于10，則該主峰值為基頻，否則該主峰值不是基頻，返回步驟3.1.3，提取最大峰值位置的1/(N+1)位置處的±5%范圍內的峰值即作為分峰值，繼續(xù)判斷主峰值與分峰值的比值；步驟3.1.5:得到周期性信號的基頻；步驟3.2:采用小波變換的方法對周期性信號進行小波分解和小波重構，得到小波重構信號；嗓音基頻變化范圍較大，從低音男性的50Hz到高音女性或兒童的500Hz，接近三個倍頻程，根據(jù)嗓音信號據(jù)估計的基礎頻率不同，小波分解的層數(shù)一般為9層以上(包括9層)，小波重構的層數(shù)一般為6層或7層。根據(jù)理論和實驗分析得出:基礎頻率約為50-172HZ的嗓音信號應選擇在第7層進行小波重構；基礎頻率約為172-344HZ的嗓音信號應選擇在第6層進行小波重構；基礎頻率約為344-500HZ的嗓音信號應選擇在第5層進行小波重構。步驟3.3:對小波重構信號進行周期檢測，得到嗓音信號的周期；對比較復雜的嗓音信號周期檢測即轉化為對比較簡單的小波重構信號的周期檢測，小波重構信號的波形是類正弦曲線，對小波重構信號進行周期檢測的步驟如下:步驟3.3.1:通過導數(shù)特性檢測得到小波重構信號的峰值位置序列；
步驟3.3.2:去除峰值位置序列中的重復峰值，得到新的峰值位置序列；步驟3.3.3:檢測步驟3.3.2得到的峰值位置序列中的每個點的前后15%的范圍內的極大值，得到小波重構信號的極大值位置序列；采用同樣方法，重復步驟3.3.f步驟3.3.3可得到原始嗓音周期性信號的極大值位置序列；步驟3.3.4:將小波重構信號的極大值位置序列與原始嗓音周期性信號的極大值位置序列進行模糊匹配，完成周期檢測；將小波重構信號的極大值位置序列與原始嗓音周期性信號的極大值位置序列進行模糊匹配，具體是:將小波重構信號的極大值位置序列與原始嗓音周期性信號的極大值位置序列里的數(shù)值按順序進行比對，計算相應位置數(shù)值之差，若差值<基本周期的20%(基本周期為基頻的倒數(shù))，則該數(shù)值保留，否則舍棄，得到新的嗓音周期性信號的極大值位置序列就是周期性信號的峰值位置序列，進而得到嗓音信號的周期，完成嗓音信號的周期檢測。步驟4:對周期檢測后的嗓音信號進行特征參數(shù)提取，并對提取結果進行顯示和保存，特征參數(shù)包括基頻、微擾、諧噪比、信噪比和標準化聲門噪聲能量NNE;基頻(Fundamental Frequency, F0)是聲帶振動的基礎頻率,單位為Hz,表示每秒聲帶振動的次數(shù)，是最常用的聲學檢測指標之一。一般來說，正常男性的基頻在130Hz左右，正常女性的基頻在250Hz左右，正常兒童的基頻在340Hz左右?；l主要是由聲帶振動的速率決定的。聲帶振動部分的長度，聲帶組織的張力以及聲帶質量的大小是決定基頻的三大因素。微擾分為頻率微擾(Jitter)和振幅微擾(Shi_er):基頻微擾和振幅微擾主要反映嗓音信號的瞬時變化情況，一般來說，病理嗓音較正常嗓音有更高的基頻微擾值和振幅微擾值[8]。嗓音隨聲帶的質量、振動幅度、緊張度而變化，人的嗓音頻率與幅度不是衡定不變的，發(fā)聲時聲信號頻率與振幅出現(xiàn)微小、快速、不規(guī)則的變化，這種變化稱之為頻率微擾商(FPQ或稱Jitter)和振幅微擾商(APQ或稱Shimmer),音調微擾與頻率的百分比表示頻率變動幅度，基本周期平均數(shù)除微擾程度得出相對平均微擾。Jitter及Shimmer均表達嗓音信號的短時變化，是反映聲帶不規(guī)律性振動的有效指標，分別反映聲音的撕啞程度及粗糙程度，不同的聲樣其Shimmer、Jitter不同，發(fā)/i/時，聲帶拉緊，張力較大，通過聲門的氣流量較發(fā)/a/時小，而聲門下壓則較大，故聲帶振動相對發(fā)/a/時規(guī)則，發(fā)元音/i/時對Jitter和Shi_er值影響最小,病理狀態(tài)下更易受代償影響。基頻微擾(Jitter)是指相鄰周期間聲波頻率的變化率，用于度量指定的一個周期與相鄰前幾個周期或后幾個周期的差異量，反映聲帶振動周期間頻率的差異?；l微擾有五個計算公式:
Jitter = 100 Yi 丨 I — ”X(…一 U I (%)M^k + l ,^ x(n + j ^l}
i=ia)基頻微擾(RAP)的定義是移動平均數(shù)為3b)基頻微擾(PPQ)的定義是移動平均數(shù)為5c)基頻微擾(Ilp)的定義是移動平均數(shù)為11
d)基頻微擾(abs)的定義是
權利要求
1.種基于移動終端的嗓音檢測評估裝置，其特征在于:包括嗓音檢測評估終端，用于對嗓音信號進行檢測并分析嗓音狀態(tài)，其包括信號采集及數(shù)據(jù)保存單元、嗓音信號處理及評估單元和數(shù)據(jù)輸出單元；所述嗓音檢測評估終端采用移動終端；所述信號采集及數(shù)據(jù)保存單元包括嗓音信號采集模塊、嗓音信號數(shù)據(jù)保存模塊和檢測評估結果保存模塊；嗓音信號采集模塊用于采集測試者的嗓音信號，采集到的嗓音信號在嗓音信號數(shù)據(jù)保存模塊進行保存，嗓音檢測評估結果在檢測評估結果保存模塊進行保存；所述嗓音信號處理及評估單元包括嗓音信號處理模塊、嗓音信號周期檢測模塊、特征參數(shù)提取模塊和嗓音信號特征評估分析模塊；嗓音信號處理模塊用于截取嗓音信號中的周期性信號；嗓音信號周期檢測模塊用于對截取的周期性信號進行周期檢測；特征參數(shù)提取模塊用于對嗓音信號周期檢測模塊的輸出信號進行特征參數(shù)提??；嗓音信號特征評估分析模塊用于對特征參數(shù)提取模塊的提取結果進行分析，得出測試者嗓音狀態(tài)；所述數(shù)據(jù)輸出單元包括嗓音信號輸出模塊、嗓音信號波形繪制模塊和檢測日志訪問模塊；嗓音信號輸出模塊用于將嗓音信號特征評估分析模塊的分析結果輸出到外部，嗓音信號波形繪制模塊用于將采集到的測試者的嗓音信號繪制成波形并顯示，檢測日志訪問模塊用于將特征參數(shù)提取模塊的提取結果和嗓音信號特征評估分析模塊的分析結果生成檢測日志，進行長期跟蹤分析。
2.據(jù)權利要求1所述的基于移動終端的嗓音檢測評估裝置進行嗓音檢測評估的方法，其特征在于:包括以下步驟: 步驟1:通過嗓音檢測評估終端采集測試者的嗓音信號，將所采集到的嗓音數(shù)據(jù)繪制波形曲線顯示并保存數(shù)據(jù)；步驟2:截取采集到的嗓音信號中的周期性信號；步驟3:對截取的周期性信號進行周期檢測；步驟3.1:通過快速傅里葉變換確定周期性信號的基頻；步驟3.2:采用小波變換的方法對周期性信號進行小波分解和小波重構，得到小波重構信號；步驟3.3:對小波重構信號進行周期檢測，得到嗓音信號的周期；對小波重構信號進行周期檢測的步驟如下: 步驟3.3.1:通過導數(shù)特性檢測得到小波重構信號的峰值位置序列；步驟3.3.2:去除峰值位置序列中的重復峰值，得到新的峰值位置序列；步驟3.3.3:檢測步驟3.3.2得到的峰值位置序列中的每個點的前后15%的范圍內的極大值，得到小波重構信號的極大值位置序列；采用同樣方法，重復步驟3.3.廣步驟3.3.3可得到原始嗓音周期性信號的極大值位置序列；步驟3.3.4:將小波重構信號的極大值位置序列與原始嗓音周期性信號的極大值位置序列進行模糊匹配，得到嗓音信號周期；步驟4:對周期檢測后的嗓音信號進行特征參數(shù)提取，并對提取結果進行顯示和保存，特征參數(shù)包括基頻、微擾、諧噪比、信噪比和標準化聲門噪聲能量NNE ；步驟5:對特征參數(shù)提取結果和健康嗓音數(shù)據(jù)的特征參數(shù)進行比對分析，得出測試者嗓音狀態(tài)；步驟6:對分析結果進行顯示，并且根據(jù)特征參數(shù)提取結果和分析結果生成測試者嗓音檢測日志，可以根據(jù)需要隨時查閱。
3.據(jù)權利要求2所述的基于移動終端的嗓音檢測評估方法，其特征在于:步驟2所述的截取采集到的嗓音信號中的周期性信號，具體方法如下: 步驟2.1:對采集到的嗓音信號進行小波變換，并得到嗓音信號中高頻部分的小波系數(shù)；步驟2.2:對小波變換后的嗓音信號進行分幀，計算分幀后每幀信號的小波系數(shù)的偏方差值; 步驟2.3:選取小波系數(shù)的偏方差值最小的一幀嗓音信號作為周期性信號并保存。
4.據(jù)權利要求2所述的基于移動終端的嗓音檢測評估方法，其特征在于:步驟3.1所述的通過快速傅里葉變換確定周期性信號的基頻，具體步驟如下: 步驟3.1.1:對周期性信號進行傅里葉變換；步驟3.1.2:在變換后的周期性信號中選取人的嗓音頻率范圍內的頻率，其中的最大峰值位置作為主峰值；人的嗓音頻率范圍為50-500HZ ；步驟3.1.3:提取最大峰值位置的1/N位置處的±5%范圍內的峰值即作為分峰值，N為整數(shù)，N=l，2，3,4,5……；步驟3.1.4:判斷主峰值與分峰值的比值，若該比值小于10，則該主峰值為基頻，否則該主峰值不是基頻，返回步驟3.1.3，提取最大峰值位置的I/ (N+1)位置處的±5%范圍內的峰值即作為分峰值，繼續(xù)判斷主峰值與分峰值的比值；步驟3.1.5:得到周期性信號的基頻。
5.據(jù)權利要求2所述的基于移動終端的嗓音檢測評估方法，其特征在于:步驟3.2所述的采用小波變換的方法對周期性信號進行小波分解和小波重構，得到小波重構信號，小波分解的層數(shù)至少為9層，小波重構的層數(shù)為6層或7層。
6.據(jù)權利要求2所述的基于移動終端的嗓音檢測評估方法，其特征在于:步驟3.3.4所述的將小波重構信號的極大值位置序列與原始嗓音周期性信號的極大值位置序列進行模糊匹配，完成周期檢測，具體是將小波重構信號的極大值位置序列與原始嗓音周期性信號的極大值位置序列里的數(shù)值按順序進行比對，計算相應位置數(shù)值之差，若差值< 基本周期的20%，則該數(shù)值保留，否則舍棄，得到新的嗓音周期性信號的極大值位置序列就是周期性信號的峰值位置序列，進而得到嗓音信號的周期。
7.據(jù)權利要求2所述的基于移動終端的嗓音檢測評估方法，其特征在于:步驟5所述的健康嗓音數(shù)據(jù)的特征參數(shù)，具體如下:正常人頻率微擾0.18±0.07 %、振幅微擾1.60±0.74 %、諧噪比25.34±3.12 dB、信噪比25.39±3.09 dB、聲門噪聲能量-16.95±3.57 dB ;男性基頻平均值160.81 ±24.27 Hz、女性基頻平均值297.42±35.89Hz、基頻總平均值206.35±70.77 Hz。
全文摘要
一種基于移動終端的嗓音檢測評估裝置，包括嗓音檢測評估終端，其包括信號采集及數(shù)據(jù)保存單元、嗓音信號處理及評估單元和數(shù)據(jù)輸出單元；嗓音檢測評估終端采用移動終端；信號采集及數(shù)據(jù)保存單元包括嗓音信號采集模塊、嗓音信號數(shù)據(jù)保存模塊和檢測評估結果保存模塊；嗓音信號處理及評估單元包括嗓音信號處理模塊、嗓音信號周期檢測模塊、特征參數(shù)提取模塊和嗓音信號特征評估分析模塊；數(shù)據(jù)輸出單元包括嗓音信號輸出模塊、嗓音信號波形繪制模塊和檢測日志訪問模塊。本發(fā)明具有嗓音信號采集、處理、分析和評估功能，基于移動終端的嗓音檢測評估裝置具有便攜、低成本、性別差異不敏感等優(yōu)點。
文檔編號G10L25/66GK103093759SQ20131001610
公開日2013年5月8日申請日期2013年1月16日優(yōu)先權日2013年1月16日
發(fā)明者徐禮勝, 邊鉞巖, 王嬌娜, 汪威, 靳雁冰, 紀朋飛申請人:東北大學

完整全部詳細技術資料下載