一種用于數字助聽器的中文語音信號處理方法

文檔序號：2821623閱讀：172來源：國知局

專利名稱：一種用于數字助聽器的中文語音信號處理方法
技術領域：
本發(fā)明屬于數字助聽器的語音處理技術，它針對中文語音的發(fā)音特征進行數字信號處理，適用于基于數字信號處理技術的數字助聽器。
背景技術：
助聽器作為聽力康復的最主要的手段，近百年來一直受到力求改進生活質量的人們關注，伴隨著科技的不斷發(fā)展，計算機技術和數字信號處理越來越多的應用到助聽器領域。目前，國際上推出的助聽器新產品大多數都是基于數字信號處理技術的數字助聽器。由于世界上數字助聽器的設計、制造商基本上都是西方國家，因此為滿足多種類型聽障者在不同聲學環(huán)境下的聽力補償的需要而出現的各種數字助聽信號處理技術，比如削峰控制、自動增益控制、自動頻響控制等技術卻大多是以西方語音的特征為研究對象而做出的，所以目前還沒有任何一種數字助聽器信號處理技術是針對中文語音的特征進行處理的。
根據對中文語言的研究，其特征是單音節(jié)發(fā)聲并具有明顯的聲調特性；相對于西方語言來說，音調包含了大量的語言和語義職別信息?；诖罅康脑囼灡砻鳎怀鰪娬{放大語音的聲調特征能夠有效的提高中文言語的分辨率。
在聽覺中，聲調形象或印象比較模糊。大體上可以說，短時間的音高變化是難以分辨的，只不過是個平均音高罷了。所謂短時間，例如半個音節(jié)或者三分之一音節(jié)，或者是一個輕聲音節(jié)。音節(jié)開頭和結尾的地方，音高的變化可能是不易分辨的。值得重視的事實是，語音學家的心理感受，陰平和陽平后的輕聲做聲學分析有時候很像去聲，卻又不是去聲。那是因為它一開始的音高迅速下降，與此同時音量在逐漸增加，這時入耳聽到的主要是一種低降的特征，而不是高降的特征。同樣，聲母l、m、n、r或零聲母做聲母的音節(jié)是上聲的時候，一開始的音高也是大幅度迅速下降的，人耳聽到的主要也是低降的特征。
本發(fā)明根據聲調的特點，把輸入聲音經過傅立葉變換分解到多個不同的頻率區(qū)間上進行處理，每個頻率區(qū)間上聲音的強度從低到高分為若干個等級。根據中文語音的特性，音調變化在信號特征上表現為基頻的變化，因此找到這個變化并適當增大基頻所在頻率區(qū)間的增益就可達到強調聲調的目的，從而提高使用者對中文語音的識別率。

發(fā)明內容
本發(fā)明旨在針對現有數字助聽器大多是以西方語音的發(fā)音特征為研究對象而設計，而不適應中文發(fā)音特征的現狀，提供一種用于數字助聽器的中文語音信號處理方法，通過數字信號處理器針對中文語音信號的特征進行處理，從而提高使用者對中文語音的識別率。
為解決上述技術問題，本發(fā)明采用的技術方案如下一種用于數字助聽器的中文語音信號處理方法，其特征在于a)從音頻接收裝置輸入的語音由A/D采樣設備獲取時域數字輸入信號；b)經傅立葉變換處理，對時域信號作時域/頻域轉換獲取信號頻譜；c)通過頻譜分析處理提取頻域信號特征，通過元音輔音變化統(tǒng)計、譜分析并計算增益處理確定信號放大或衰減策略；d)由數字信號處理器根據確定的信號處理策略對信號進行處理；e)處理后的數字信號輸出到D/A轉換器，將信號還原成模擬信號輸出到聲音還原裝置。
本發(fā)明所述時域/頻域轉換處理過程是采用先進先出的輸入隊列(FIFO)對時域信號進行列隊，并采用迭加DFT濾波器組處理音頻數據塊，將時域信號轉變成頻域信號。
所述濾波器組把輸入信號分解為多個頻率區(qū)間，經過離散傅立葉變換(DFT)的調制過程，單一的原型濾波器被復制為2N個復合濾波波段；這個調制過程在統(tǒng)一的濾波器組中只產生相同的濾波波形和結果；經該傅立葉變換處理將時域信號轉換為多個頻率區(qū)間的頻域信號。
所述頻域信號特征提取過程是對已獲得的頻域信號，提取多個頻率區(qū)間中每個頻率區(qū)間的特征，判斷該輸入信號是噪音信號還是語音信號。
所述元音輔音變化統(tǒng)計過程是上述根據噪音或語音信號的判斷，如果是語音信號，則對元音輔音變化做出統(tǒng)計，判斷語音基頻的變化。
所述譜分析并計算增益過程是根據語音基頻變化的特點確定每個頻率區(qū)間的增益策略，如果是噪音就給負增益，如果是語音就給正增益。
所述數字信號處理器根據確定的信號處理策略對信號進行處理的過程是根據中文語音特征，聲母主要分布在高頻(b，p，m，f，z，c，s)，具有持續(xù)時間短，能量比較低的特征；韻母主要分布在低頻(a，o，e，i，u，ü)，具有持續(xù)時間長，能量較高的特征。相對于噪音，語音具有能量變化快，峰值頻率不確定的顯著特征。信號處理器依據這些特征，將輸入信號分解成不同的頻率波段，分別統(tǒng)計每個波段的能量和能量變化，將所有波段的能量進行比較，找出能量最大以及最小的波段并記錄，再與上一個時段的能量分布進行比較，以找到能量變化趨勢，確定語音信號分布情況，根據這些分布特征對不同的波段分別進行衰減和增強，再將所有波段的信號合成輸出，達到突出語音特征的目的。
本發(fā)明所述信號分解成多個頻率波段以及將所有頻率波段的信號合成所采用的方法為迭加DFT即離散傅立葉變換和IDFT即反離散傅立葉變換濾波器組處理，進行時頻域信號轉換，在轉換過程中采用先進先出的輸出隊列(FIFO)對輸入輸出信號進行暫存。
本發(fā)明數字信號處理器采用16位定點結構的DSP即可完成所有操作。DSP是IT行業(yè)標準組件，跟電阻電容一樣，屬于標準用語。
本發(fā)明的優(yōu)點在于
本發(fā)明針對中文語音單音節(jié)字發(fā)聲并具有明顯的聲調特性，音調包含大量的語言信息這一特征，突出強調放大語音的聲調特征，將這一算法技術運用于數字助聽器，從而能夠有效提高使用者中文語音的識別率。本方法實施簡單、方便，數字助聽器中文使用者可以獲得較好的助聽效果。

圖1為本發(fā)明采用的信號處理流程框圖具體實施方式
一種用于數字助聽器的中文語音處理方法，通過數字信號處理器針對中文語音信號的特征進行處理，從而提高使用者對中文語音的識別率。
本發(fā)明所述方法基于對音頻的處理。其過程包括時域/頻域轉換處理、頻域信號特征提取、元音輔音變化統(tǒng)計、譜分析增益處理、頻域/時域轉換處理。見圖1。
從音頻接收裝置輸入的語音經過A/D模數轉換為數字信號，獲得的語音數據流經過時域/頻域轉換為系統(tǒng)所需的語音數據流，用濾波器組把該語音數據流分解為N個頻率區(qū)間，經過DFT的調制過程，單一的原型濾波器被復制為2N個復合濾波波段，通過頻譜分析處理分別提取這2N個頻率區(qū)間的信號特征，確定信號放大衰減策略，對每個區(qū)間的數字信號經信號特征提取、元音輔音變化統(tǒng)計處理、譜分析增益處理，然后由數字信號處理器根據確定的信號處理策略對這2N個頻率區(qū)間的信號進行處理，通過頻域/時域轉換輸出到輸入/輸出裝置，再通過A/D轉換后輸出到聲音還原裝置。
所述時域/頻域轉換處理過程是采用先進先出輸入隊列(FIFO)對時域信號進行列隊，并采用迭加DFT濾波器組處理音頻數據塊，將時域信號轉變成頻域信號，利用上述濾波器組把輸入信號分解為N個頻率區(qū)間，經過DFT的調制過程，單一的原型濾波器被復制為2N個復合頻率區(qū)間。這個調制過程在統(tǒng)一的濾波器組中只產生相同的濾波波形和結果。經過這一變換處理將時域信號轉換為N個頻率區(qū)間的頻域信號。
所述頻域信號特征提取過程是對上面獲得的頻域信號，提取16個頻率區(qū)間中每個頻率區(qū)間的特征，判斷該輸入信號是噪音信號還是語音信號。
所述元音輔音變化統(tǒng)計過程是根據前面處理的判斷，如果是語音信號，則對元音輔音變化做出統(tǒng)計，判斷語音基頻的變化。
所述頻譜分析增益處理過程是根據變化的特點確定每個頻率區(qū)間的增益策略，如果是噪音就給負增益，如果是語音就給正增益。
所述數字信號處理器根據確定的信號處理策略對信號進行處理的過程是根據中文語音特征，聲母主要分布在高頻(b，p，m，f，z，c，s)，具有持續(xù)時間短，能量比較低的特征；韻母主要分布在低頻(a，o，e，i，u，ü)，具有持續(xù)時間長，能量較高的特征。相對于噪音，語音具有能量變化快，峰值頻率不確定的顯著特征。信號處理器依據這些特征，將輸入信號分解成不同的頻率波段，分別統(tǒng)計每個波段的能量和能量變化，將所有波段的能量進行比較，找出能量最大以及最小的波段并記錄，再與上一個時段的能量分布進行比較，以找到能量變化趨勢，確定語音信號分布情況，根據這些分布特征對不同的波段分別進行衰減和增強，再將所有波段的信號合成輸出，達到突出語音特征的目的。
本發(fā)明所述信號分解成多個頻率波段以及將所有頻率波段的信號合成所采用的方法為迭加DFT即離散傅立葉變換和IDFT即反離散傅立葉變換濾波器組處理，進行時頻域信號轉換，在轉換過程中采用先進先出的輸出隊列(FIFO)對輸入輸出信號進行暫存。
本發(fā)明數字信號處理器采用16位定點結構的DSP即可完成所有操作。DSP是IT行業(yè)標準組件，跟電阻電容一樣，屬于標準用語。
本發(fā)明所述頻域/時域轉換過程是時域/頻域轉換的逆過程，采用迭加DFT濾波器組處理音頻數據塊，將時域信號轉變成頻域信號，采用先進先出輸出隊列(FIFO)對輸出時域信號進行列隊。從而完成放大中文語音聲調，達到提高使用者中文語音識別率的目的。
權利要求
1.一種用于數字助聽器的中文語音信號處理方法，其特征在于a)從音頻接收裝置輸入的語音由A/D采樣設備獲取時域數字輸入信號；b)經傅立葉變換處理，對時域信號作時域/頻域轉換獲取信號頻譜；c)通過頻譜分析處理提取頻域信號特征，通過元音輔音變化統(tǒng)計、譜分析并計算增益處理確定信號放大或衰減策略；d)由數字信號處理器根據確定的信號處理策略對信號進行處理；e)處理后的數字信號輸出到D/A轉換器，將信號還原成模擬信號輸出到聲音還原裝置。
2.根據權利要求1所述的一種用于數字助聽器的中文語音信號處理方法，其特征在于所述時域/頻域轉換處理過程是采用先進先出的輸入隊列(FIFO)對時域信號進行列隊，并采用迭加DFT濾波器組處理音頻數據塊，將時域信號轉變成頻域信號。
3.根據權利要求2所述的一種用于數字助聽器的中文語音信號處理方法，其特征在于所述濾波器組把輸入信號分解為多個頻率區(qū)間，經過離散傅立葉變換(DFT)的調制過程，單一的原型濾波器被復制為2N個復合濾波波段；這個調制過程在統(tǒng)一的濾波器組中只產生相同的濾波波形和結果；經該傅立葉變換處理將時域信號轉換為多個頻率區(qū)間的頻域信號。
4.根據權利要求1所述的一種用于數字助聽器的中文語音信號處理方法，其特征在于所述頻域信號特征提取過程是對已獲得的頻域信號，提取多個頻率區(qū)間中每個頻率區(qū)間的特征，判斷該輸入信號是噪音信號還是語音信號。
5.根據權利要求1所述的一種用于數字助聽器的中文語音信號處理方法，其特征在于所述元音輔音變化統(tǒng)計過程是上述根據噪音或語音信號的判斷，如果是語音信號，則對元音輔音變化做出統(tǒng)計，判斷語音基頻的變化。
6.根據權利要求1所述的一種用于數字助聽器的中文語音信號處理方法，其特征在于所述譜分析并計算增益過程是根據語音基頻變化的特點確定每個頻率區(qū)間的增益策略，如果是噪音就給負增益，如果是語音就給正增益。
7.根據權利要求1所述的一種用于數字助聽器的中文語音信號處理方法，其特征在于數字信號處理器依據中文語音特征，將輸入信號分解成不同的頻率波段，分別統(tǒng)計每個波段的能量和能量變化，將所有波段的能量進行比較，找出能量最大以及最小的波段并記錄，再與上一個時段的能量分布進行比較，以找到能量變化趨勢，確定語音信號分布情況，根據這些分布特征對不同的波段分別進行衰減和增強，再將所有波段的信號合成輸出，以此突出語音特征。
8.根據權利要求2或3所述的一種用于數字助聽器的中文語音信號處理方法，其特征在于本發(fā)明所述信號分解成多個頻率波段以及將所有頻率波段的信號合成所采用的方法為迭加DFT即離散傅立葉變換和IDFT即反離散傅立葉變換濾波器組處理，進行時頻域信號轉換，在轉換過程中采用先進先出的輸出隊列(FIFO)對輸入輸出信號進行暫存。
9.根據權利要求1或7所述的一種用于數字助聽器的中文語音信號處理方法，其特征在于數字信號處理器采用16位定點結構的DSP完成所有操作。
全文摘要
本發(fā)明描述了一種用于數字助聽器的中文語音信號處理方法，屬于一種語音信號處理技術。本發(fā)明針對中文語音的聲調包含大量的語言和語義信息這一特征，通過頻譜分析、將語音數據流按多個頻率區(qū)間對其信號特征進行處理后將數字信號經D/A轉換后輸出。通過本發(fā)明獲得的語音信號，使使用者能夠更加清晰的聽到中文語音，提高了中文語音和語義識別率，可有效地改善數字助聽器中文使用者的助聽效果。
文檔編號G10L21/00GK1598927SQ20041004058
公開日2005年3月23日申請日期2004年8月31日優(yōu)先權日2004年8月31日
發(fā)明者蔣一寧, 夏世雄, 蔣濤, 付曉毅, 陳志剛申請人:四川微迪數字技術有限公司

完整全部詳細技術資料下載

該技術已申請專利。僅供學習研究，如用于商業(yè)用途，請聯系技術所有人。
技術研發(fā)人員：蔣一寧;夏世雄;蔣濤;付曉毅;陳志剛
技術所有人：四川微迪數字技術有限公司
我是此專利的發(fā)明人

相關技術

網友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種用于數字助聽器的中文語音信號處理方法