本發(fā)明涉及一種語音識別系統(tǒng),特別是涉及一種基于骨傳導高噪聲環(huán)境下的語音識別系統(tǒng)。
背景技術(shù):
語音是人類交流最方便的一種方式,如用語音實現(xiàn)操作則會帶來很大方便,目前一般的語音識別系統(tǒng),采用模擬濾波和MCU(單片機)語音處理,由于模擬濾波裝置體積大,過濾噪聲范圍由元件參數(shù)制約,調(diào)整不方便,過濾噪聲范圍易受環(huán)境溫度影響,而簡單的數(shù)字語音儲存、語音識別技術(shù),受環(huán)境噪聲和音量的影響大,語音識別的效果差,造成識別出錯,引起操作或控制失誤。
技術(shù)實現(xiàn)要素:
針對現(xiàn)有技術(shù)中的缺陷,本發(fā)明的目的是提供一種基于骨傳導高噪聲環(huán)境下的語音識別系統(tǒng),其克服現(xiàn)有裝置濾波調(diào)整不方便、通用性差、體積大、結(jié)構(gòu)復雜、受環(huán)境噪聲和音量的影響大、語音識別的效果差、易造成識別出錯、引起操作或控制失誤等問題。
根據(jù)本發(fā)明的一個方面,提供一種基于骨傳導高噪聲環(huán)境下的語音識別系統(tǒng),其特征在于,其包括:
送話器,用于發(fā)送語音;
語音接收模塊,用于接收訓練語音或辨識語音;接收訓練語音,儲存使用者的語音命令;接收辨識語音,與多個訓練語音比較辨識,并按功能設置,通過開關(guān)量IO接口輸出不同的操作邏輯信號;
驅(qū)動電路模塊,用于放大控制電路的信號;
邏輯開關(guān)量IO接口,用于執(zhí)行不同的操作、控制電路實現(xiàn)對多種設備的控制,用于對壓力、流量、溫度進行調(diào)節(jié);
控制設定模塊,用于控制、設定工作;
工作狀態(tài)顯示模塊,用于顯示整個系統(tǒng)工作狀況;
通信接口模塊,用于連接通信設備;
語音處理模塊,用于處理語音信號;語音處理模塊包括相互連接的語音回放模塊和DSP模塊,語音回放模塊用于實現(xiàn)清晰的語音通信或在對操作命令識別后,按功能設置進行相應操作時,為進一步提高操作正確率,在每一個指令收到后,系統(tǒng)會通過語音回放回饋給使用者,便于及時確認;DSP模塊用于接收訓練語音或辨識語音;對環(huán)境噪聲進行過濾、消噪和語音信號的閉環(huán)音量自動調(diào)節(jié),使語音不受環(huán)境噪聲和音量的影響,實現(xiàn)清晰的通信或正確的語音訓練儲存和語音識別;DSP模塊包括DA轉(zhuǎn)換模塊、數(shù)字濾波模塊、PID控制模塊和AD轉(zhuǎn)換模塊,DA轉(zhuǎn)換模塊用于將數(shù)字信號轉(zhuǎn)換為模擬信號;數(shù)字濾波模塊用于對信號進行處理;PID控制模塊用于測量、比較和執(zhí)行實際值和期望值;AD轉(zhuǎn)換模塊用于將模擬信號轉(zhuǎn)換為數(shù)字信號;
信號調(diào)理模塊,使語音信號達到A/D要求;
受話器,用于接收語音。
優(yōu)選地,所述DSP模塊包括以下步驟的工作過程:
步驟一,接收語音信號;
步驟二,進行DA轉(zhuǎn)換;
步驟三,進行數(shù)字濾波處理;
步驟四,存儲識別信號;
步驟五,經(jīng)開關(guān)量IO,進行調(diào)節(jié)控制;
步驟六,進行AD轉(zhuǎn)換和回放。
優(yōu)選地,所述DSP模塊采用數(shù)學運算處理方法實現(xiàn)正確識別,并進行相應操作。
優(yōu)選地,所述DSP模塊采用TI公司TMS320LF2407A控制器,TMS320LF2407A與通用的CPU和微處理器相比,價格低、應用廣泛、有很強的數(shù)字信息處理功能,它集C2xx內(nèi)核增強型TMS320設計結(jié)構(gòu)及低功耗、高性能、優(yōu)化外圍電路于一體,16位數(shù)字信號處理,帶有硬件乘法器和乘加指令,每條指令在25ns完成,語音經(jīng)10位高速AD轉(zhuǎn)換器語音轉(zhuǎn)換等數(shù)字信息處理能力為本發(fā)明提供合適的硬件基礎(chǔ);DSP具有程控性、重復性,抗干擾性能好,能夠?qū)崿F(xiàn)自適應算法、數(shù)據(jù)壓縮,它具有模擬信號的無法替代的特性。
優(yōu)選地,所述PID控制模塊具有閉環(huán)音量自動調(diào)節(jié),閉環(huán)音量自動調(diào)節(jié)采用離散量PID調(diào)節(jié),使語音不受環(huán)境噪聲和音量的影響。
優(yōu)選地,所述PID控制模塊具有語音訓練,用于從DSP對采集到的語音樣本進行分析處理中,提取出語音特征信息,建立一個特征模型,存儲于存儲器中。
優(yōu)選地,所述PID控制模塊具有語音識別,用于從DSP對采集到的語音樣本進行類似的分析處理中,提取出語音的特征信息,然后將這個特征信息模型與已有的特征模型信號進行對比,如果二者達到了一定的匹配度,則輸入的語音被識別,作出相應動作。
本發(fā)明的積極進步效果在于:本發(fā)明無需任何模擬濾波器,裝置完全集成化,使用DSP模塊及相關(guān)技術(shù),裝置性能優(yōu)良;從經(jīng)濟的角度講,本發(fā)明使用的僅僅為一塊通用DSP模塊和少量普通電子元件組成的外圍電路,由于采用通用電子器件,器件成本低廉,從應用的角度講,語音是人類交流最方便的一種方式,用語音實現(xiàn)清晰的通信或相應的操作具有很廣應用前景。本發(fā)明調(diào)整方便,通用性好,體積小,結(jié)構(gòu)簡單,不受環(huán)境噪聲和音量的影響,語音識別的效果好,不會造成識別出錯、引起操作或控制失誤。本發(fā)明具有噪聲抑制、音量自動調(diào)節(jié)、語音儲存、語音識別等功能,利用DSP強大的數(shù)字信號處理能力,完成音源波頻譜分量分析,然后根據(jù)所希望的頻率特性進行濾波,同時對語音信號幅值進行離散量的閉環(huán)音量自動調(diào)節(jié)。
附圖說明
通過閱讀參照以下附圖對非限制性實施例所作的詳細描述,本發(fā)明的其它特征、目的和優(yōu)點將會變得更明顯:
圖1為本發(fā)明基于骨傳導高噪聲環(huán)境下的語音識別系統(tǒng)的原理框架圖。
圖2為本發(fā)明中PID控制模塊的工作過程的流程圖。
具體實施方式
下面結(jié)合具體實施例對本發(fā)明進行詳細說明。以下實施例將有助于本領(lǐng)域的技術(shù)人員進一步理解本發(fā)明,但不以任何形式限制本發(fā)明。應當指出的是,對本領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明構(gòu)思的前提下,還可以做出若干變形和改進。這些都屬于本發(fā)明的保護范圍。
如圖1所示,本發(fā)明公開了一種基于骨傳導高噪聲環(huán)境下的語音識別系統(tǒng),其包括送話器、語音接收模塊、驅(qū)動電路模塊、邏輯開關(guān)量IO(輸入輸出)接口、控制設定模塊、工作狀態(tài)顯示模塊、通信接口模塊、DA(數(shù)模)轉(zhuǎn)換模塊、PID(比例-積分-微分)控制模塊、AD(模數(shù))轉(zhuǎn)換模塊、DSP(數(shù)字信號處理)模塊、語音處理模塊、數(shù)字濾波模塊、語音回放模塊、信號調(diào)理模塊、受話器,其中:
送話器,用于發(fā)送語音;
語音接收模塊,用于接收訓練語音或辨識語音;接收訓練語音,儲存使用者的語音命令;接收辨識語音,與多個訓練語音比較辨識,并按功能設置,通過開關(guān)量IO接口輸出不同的操作邏輯信號;
驅(qū)動電路模塊,用于放大控制電路的信號;
邏輯開關(guān)量IO接口,用于執(zhí)行不同的操作、控制電路實現(xiàn)對多種設備的控制,用于對壓力、流量、溫度進行調(diào)節(jié);
控制設定模塊,用于控制、設定工作;
工作狀態(tài)顯示模塊,用于顯示整個系統(tǒng)工作狀況;
通信接口模塊,用于連接通信設備;
語音處理模塊,用于處理語音信號;語音處理模塊包括相互連接的語音回放模塊和DSP模塊,語音回放模塊用于實現(xiàn)清晰的語音通信或在對操作命令識別后,按功能設置進行相應操作時,為進一步提高操作正確率,在每一個指令收到后,系統(tǒng)會通過語音回放回饋給使用者,便于及時確認,使控制正確率達到100%;
DSP模塊用于接收訓練語音或辨識語音;對環(huán)境噪聲進行過濾、消噪和語音信號的閉環(huán)音量自動調(diào)節(jié),使語音不受環(huán)境噪聲和音量的影響,實現(xiàn)清晰的通信或正確的語音訓練儲存和語音識別;DSP模塊包括DA轉(zhuǎn)換模塊、數(shù)字濾波模塊、PID控制模塊和AD轉(zhuǎn)換模塊,DA轉(zhuǎn)換模塊用于將數(shù)字信號轉(zhuǎn)換為模擬信號;數(shù)字濾波模塊用于對信號進行處理;PID控制模塊用于測量、比較和執(zhí)行實際值和期望值;AD轉(zhuǎn)換模塊用于將模擬信號轉(zhuǎn)換為數(shù)字信號;經(jīng)過語音識別后,實現(xiàn)多種操作功能,針對不同語音命令進行操作或控制;為進一步提高正確率,在每一個指令收到后,系統(tǒng)會通過語音回放回饋給使用者,便于及時確認,使控制正確率達到100%,并由系統(tǒng)給控制接口以邏輯指令以執(zhí)行下一步操作;整個系統(tǒng)工作狀況由顯示器指示;整個系統(tǒng)還能通過通信接口應用于多平臺的控制,能走向工業(yè)機器人控制應用領(lǐng)域;
信號調(diào)理模塊,使語音信號達到A/D要求;
受話器,用于接收語音。
如圖2所示,DSP模塊包括以下步驟的工作過程:
步驟一,接收語音信號;
步驟二,進行DA轉(zhuǎn)換;
步驟三,進行數(shù)字濾波處理;
步驟四,存儲識別信號;
步驟五,經(jīng)開關(guān)量IO,進行調(diào)節(jié)控制;
步驟六,進行AD轉(zhuǎn)換和回放。
所述DSP模塊采用數(shù)學運算處理方法實現(xiàn)正確識別,并進行相應操作。
所述DSP模塊采用TI公司TMS320LF2407A控制器,TMS320LF2407A與通用的CPU和微處理器(MCU)相比,價格低、應用廣泛、有很強的數(shù)字信息處理功能,它集C2xx內(nèi)核增強型TMS320設計結(jié)構(gòu)及低功耗、高性能、優(yōu)化外圍電路于一體,16位數(shù)字信號處理,帶有硬件乘法器和乘加指令,每條指令在25ns完成,語音經(jīng)10位高速AD轉(zhuǎn)換器語音轉(zhuǎn)換等數(shù)字信息處理能力為本發(fā)明提供合適的硬件基礎(chǔ);DSP具有程控性、重復性,抗干擾性能好,能夠?qū)崿F(xiàn)自適應算法、數(shù)據(jù)壓縮,它具有模擬信號的無法替代的特性。DSP模塊對音源信號進行數(shù)學運算處理方法來達到頻域濾波,并且對語音信號幅值進行離散量閉環(huán)音量自動調(diào)節(jié)。DSP模塊對采集到的語音樣本在濾波和音量自動調(diào)節(jié)之后,進行分析處理,提高匹配程度,達到正確語音識別。
在DSP模塊提供高速數(shù)字信號處理硬件基礎(chǔ)上,進行有效數(shù)字信號處理技術(shù)開發(fā),通過研究人類語音特色,進行細微的頻譜分析,同時對各種環(huán)境噪聲和各種裝備工作時產(chǎn)生的噪聲開展頻譜研究和統(tǒng)計分析,鑒別出環(huán)境噪聲與人類語音的差別,在此基礎(chǔ)上,得出數(shù)字濾波傳遞函數(shù),進行濾波,抑制環(huán)境噪聲,開發(fā)出語音識別軟件進行語音識別;語音識別對象是語音,決定音源質(zhì)量的關(guān)鍵參數(shù)是“采樣率”,只要選擇采樣率>48KHz就能達到CD音質(zhì),實現(xiàn)對語音的高音質(zhì)精確采集,確保整體數(shù)據(jù)處理分析的精度;一般的MCU是難以達到的,并由DSP模塊進一步作數(shù)字信號處理,完成噪聲抑制,數(shù)值PID控制、數(shù)據(jù)壓縮技術(shù)等;把語音信號處理要求和DSP模塊的數(shù)字信息處理技術(shù)結(jié)合起來實現(xiàn)高質(zhì)量語音通信和正確的語音識別。
DSP模塊將語音信號從時域變換到頻域形式通常采用傅立葉變換,對于離散化的周期信號而言,快速傅立葉變換(FFT)是分析語音波形的最好的算法之一,利用FFT能直接得到波形所含的各頻譜分量。FFT是離散傅立葉變換(DFT)的一種快速算法;由于我們在計算DFT時一次復數(shù)乘法需用四次實數(shù)乘法和二次實數(shù)加法;一次復數(shù)加法則需二次實數(shù)加法;每運算一個X(k)需要4N次復數(shù)乘法及2N+2(N-1)=2(2N-1)次實數(shù)加法;所以整個DFT運算總共需要4N2次實數(shù)乘法和N*2(2N-1)=2N(2N-1)次實數(shù)加法;如此一來,計算時乘法次數(shù)和加法次數(shù)都是和N2成正比的,當N很大時,運算量是龐大的,因而需要改進對DFT的算法減少運算速度;根據(jù)傅立葉變換的對稱性和周期性,將DFT運算中有些項合并和有限項簡化。
設序列長度為N=2L,L為整數(shù);將N=2L的序列x(n)(n=0,1,…,N-1),按N的奇偶分成兩組,也就是說我們將一個N點的DFT分解成兩個N/2點的DFT,它們又重新組合成一個如下式(1)所表達的N點DFT:
上式FFT運算序列是混亂的,但經(jīng)分析,信號流程有一定規(guī)律—即位碼倒置,本發(fā)明使用了位倒序的減接尋址方式和乘累加、移位累加指令實現(xiàn);
利用快速傅立葉變換(FFT)對輸入語音信號進行離散傅立葉變換分析其頻譜,然后利用FIR數(shù)字濾波器,濾波器設計方法是利用濾波理論設計滿足要求的傳遞函數(shù)H(s),依據(jù)H(s)求出相應的數(shù)字濾波器傳遞函數(shù)H(z),根據(jù)所希望的頻率特性進行濾波,這種辦法具有較好的頻率選擇性和靈活性。
所述PID控制模塊具有閉環(huán)音量自動調(diào)節(jié),閉環(huán)音量自動調(diào)節(jié)采用離散量PID調(diào)節(jié),使語音不受環(huán)境噪聲和音量的影響。
所述PID控制模塊具有語音訓練,語音訓練用于從DSP對采集到的語音樣本進行分析處理中,提取出語音特征信息,建立一個特征模型,存儲于存儲器中。
所述PID控制模塊具有語音識別,語音識別用于從DSP對采集到的語音樣本進行類似的分析處理中,提取出語音的特征信息,然后將這個特征信息模型與已有的特征模型信號進行對比,如果二者達到了一定的匹配度,則輸入的語音被識別,作出相應動作。
本發(fā)明通過研究人類語音特色,同時通過對環(huán)境的各種噪聲和各種裝備工作時產(chǎn)生的噪聲開展頻譜研究和統(tǒng)計分析,鑒別出環(huán)境噪聲與人類語音的差別,利用DSP強大的數(shù)字信號處理能力,完成音源波頻譜分量分析,然后根據(jù)所希望的頻率特性進行濾波,同時對語音信號幅值進行離散量的閉環(huán)音量自動調(diào)節(jié),使語音不受環(huán)境噪聲和音量的影響,實現(xiàn)高標準語音通信,通過與訓練語音比較,實現(xiàn)語音識別,并按要求進行操作和控制。由于采用DSP有效地數(shù)字信號處理技術(shù),使用數(shù)學運算方法對音源信號處理,省去了濾波器等器件,克服現(xiàn)有的識別語音裝置通用性差、體積大、結(jié)構(gòu)復雜、成本高等問題,取得了裝置體積小、結(jié)構(gòu)簡單、頻率選擇方便、使用靈活、性能優(yōu)良等有益效果。
以上對本發(fā)明的具體實施例進行了描述。需要理解的是,本發(fā)明并不局限于上述特定實施方式,本領(lǐng)域技術(shù)人員可以在權(quán)利要求的范圍內(nèi)做出各種變形或修改,這并不影響本發(fā)明的實質(zhì)內(nèi)容。