1.一種語(yǔ)音識(shí)別系統(tǒng),其特征在于:包括:
語(yǔ)音采集模塊,用于收集用戶(hù)待識(shí)別的語(yǔ)音數(shù)據(jù);
預(yù)處理模塊,用于對(duì)所述待識(shí)別的語(yǔ)音數(shù)據(jù)進(jìn)行預(yù)處理;
特征提取模塊,用于從預(yù)處理后的所述待識(shí)別的語(yǔ)音數(shù)據(jù)中提取語(yǔ)音特征參數(shù);
存儲(chǔ)模塊,用于存儲(chǔ)至少一個(gè)用戶(hù)的語(yǔ)音模型;
模式匹配模塊,基于提取所述語(yǔ)音特征參數(shù),并且選擇對(duì)應(yīng)于所述語(yǔ)音特征參數(shù)的語(yǔ)音模型;
參數(shù)調(diào)整模塊,用于通過(guò)使用所選擇的所述模式匹配模塊來(lái)調(diào)整語(yǔ)音參數(shù),所述語(yǔ)音參數(shù)是用于識(shí)別所述待識(shí)別的語(yǔ)音數(shù)據(jù)的語(yǔ)音指令和語(yǔ)意;
語(yǔ)音指令識(shí)別模塊,用于基于調(diào)整的所述語(yǔ)音參數(shù)來(lái)識(shí)別所述用戶(hù)的所述語(yǔ)音指令;
語(yǔ)意識(shí)別模塊,用于基于調(diào)整的所述語(yǔ)音參數(shù)來(lái)識(shí)別所述用戶(hù)的所述語(yǔ)意。
2.根據(jù)權(quán)利要求1所述的語(yǔ)音識(shí)別系統(tǒng),其特征在于:
所述預(yù)處理模塊包括模數(shù)轉(zhuǎn)換單元、信號(hào)放大單元、增益控制單元、降噪單元、濾波單元和采樣單元,用于依次對(duì)所述待識(shí)別的語(yǔ)音數(shù)據(jù)進(jìn)行將采集到的模擬語(yǔ)音數(shù)據(jù)轉(zhuǎn)換為數(shù)字語(yǔ)音數(shù)據(jù)、數(shù)字語(yǔ)音數(shù)據(jù)進(jìn)行放大、校正所述數(shù)字語(yǔ)音數(shù)據(jù)的增益、消除所述數(shù)字語(yǔ)音數(shù)據(jù)中的噪聲、對(duì)所述所述數(shù)字語(yǔ)音數(shù)據(jù)進(jìn)行濾波和采樣。
3.根據(jù)權(quán)利要求2所述的語(yǔ)音識(shí)別系統(tǒng),其特征在于:所述預(yù)處理模塊還包括編碼單元,用于對(duì)采樣的數(shù)字語(yǔ)音數(shù)據(jù)進(jìn)行格式轉(zhuǎn)換及編碼,使其被分割為由多幀組合而成的短時(shí)信號(hào)。
4.根據(jù)權(quán)利要求3所述的語(yǔ)音識(shí)別系統(tǒng),其特征在于:所述預(yù)處理模塊還包括端點(diǎn)檢測(cè)單元,用于計(jì)算進(jìn)行格式轉(zhuǎn)換及編碼后的所述待識(shí)別的語(yǔ)音數(shù)據(jù)的語(yǔ)音起點(diǎn)和終點(diǎn),獲得所述待識(shí)別的語(yǔ)音數(shù)據(jù)中語(yǔ)音的時(shí)域范圍。
5.根據(jù)權(quán)利要求1所述的語(yǔ)音識(shí)別系統(tǒng),其特征在于:所述特征提取模塊通過(guò)從編碼后的所述待識(shí)別的語(yǔ)音數(shù)據(jù)中提取頻率倒譜系數(shù)MFCC特征,來(lái)提取所述語(yǔ)音特征參數(shù)。
6.根據(jù)權(quán)利要求1所述的語(yǔ)音識(shí)別系統(tǒng),其特征在于:所述語(yǔ)意識(shí)別模塊包括儲(chǔ)存單元、識(shí)別單元和選擇單元,所述儲(chǔ)存單元儲(chǔ)存不同語(yǔ)音情感的語(yǔ)意;所述識(shí)別單元基于調(diào)整的所述語(yǔ)音參數(shù)來(lái)識(shí)別所述語(yǔ)調(diào),并通過(guò)選擇單元選取所述儲(chǔ)存單元中的語(yǔ)意。
7.如權(quán)利要求1所述的語(yǔ)音識(shí)別系統(tǒng),其特征在于,所述模式匹配模塊利用高斯混合模型,使用最大后驗(yàn)概率算法MAP將所提取的所述語(yǔ)音特征參數(shù)與所述語(yǔ)音模型進(jìn)行匹配,計(jì)算所述待識(shí)別語(yǔ)音信號(hào)與每一個(gè)所述語(yǔ)音模型的似然度,來(lái)選擇對(duì)應(yīng)于所述語(yǔ)音特征參數(shù)的語(yǔ)音模型。