1.一種用于大數(shù)據(jù)分析的語音識別系統(tǒng),其特征在于,包括:
語音信息分類模塊,用于對原始語音信息進(jìn)行分類,得到分類后的原始語音信息;
原始語音處理模塊,用于對分類后的原始語音信息進(jìn)行語音增強(qiáng)和濾波,得到處理后的語音信息;
聲學(xué)特征識別提取模塊,用于對處理后的語音信息中的聲學(xué)特征進(jìn)行識別提取;
基礎(chǔ)元數(shù)據(jù)集,用于存儲針對不同語音信息分類的聲學(xué)特征及與其對應(yīng)的文本信息;
聲學(xué)特征匹配模塊,用于將提取的聲學(xué)特征與基礎(chǔ)元數(shù)據(jù)集中與相應(yīng)的語音信息分類對應(yīng)的聲學(xué)特征進(jìn)行匹配,識別出第一語音識別結(jié)果;
識別糾錯(cuò)模塊,用于對識別出的第一語音識別結(jié)果進(jìn)行清洗糾錯(cuò),得到第二語音識別結(jié)果;
結(jié)果輸出模塊,用于將第二語音識別結(jié)果作為語音識別結(jié)果進(jìn)行輸出。
2.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于,包括:
所述語音信息分類模塊,用于根據(jù)語音特征對對原始語音信息進(jìn)行分類,所述語音特征包括:語音的時(shí)長、語音包含的音素?cái)?shù)量。
3.根據(jù)權(quán)利要求2所述的系統(tǒng),其特征在于,包括:
所述原始語音處理模塊,包括用于對分類后的原始語音信息進(jìn)行語音增強(qiáng),得到語音增強(qiáng)后的原始語音信息,所用增強(qiáng)方法為減譜法,所用減譜公式為:
其中,PS(ω)為輸出語音信息的功率譜,Py(ω)為原始語音信息的功率譜,Pn1(ω)為發(fā)聲前的寂靜段的功率譜,Pn2(ω)為發(fā)聲結(jié)束后的寂靜段的功率譜,t1為發(fā)聲前的寂靜段結(jié)束時(shí)的時(shí)間點(diǎn),t2為發(fā)聲結(jié)束后的寂靜段開始時(shí)的時(shí)間點(diǎn),t為當(dāng)前所要處理的語音信息的時(shí)間點(diǎn)。
4.根據(jù)權(quán)利要求3所述的系統(tǒng),其特征在于,包括:
所述原始語音處理模塊,包括用于對語音增強(qiáng)后的原始語音信息進(jìn)行濾波,所用濾波方法為通過帶通濾波器進(jìn)行濾波。
5.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于,包括:
所述聲學(xué)特征包括:
Mel頻段倒譜系數(shù)和過零峰值幅度。
6.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于,包括:
所述聲學(xué)特征識別提取模塊,用于對處理后的語音信息中的聲學(xué)特征進(jìn)行識別提取,包括,對處理后的語音信息進(jìn)行預(yù)加重、分幀和加窗,加窗所用的窗函數(shù)為:
其中,w(n)為窗函數(shù)的值,N為幀長,n為采樣點(diǎn);
對聲學(xué)特征進(jìn)行識別提取使用基于Levenberg-Marquardt算法的神經(jīng)網(wǎng)絡(luò)進(jìn)行識別提取。
7.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于,包括:
所述基礎(chǔ)元數(shù)據(jù)集,所用存儲方法為,先存儲一類語音信息分類的聲學(xué)特征及與其對應(yīng)的文本信息,作為參考數(shù)據(jù),對于其他語音信息分類的聲學(xué)特征,根據(jù)聲學(xué)特征出現(xiàn)的概率使用不同的存儲方式,出現(xiàn)概率高的聲學(xué)特征進(jìn)行完整存儲,出現(xiàn)概率低的聲學(xué)特征僅存儲其與參考數(shù)據(jù)的不同部分。
8.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于,包括:
所述聲學(xué)特征匹配模塊,用于將提取的聲學(xué)特征與基礎(chǔ)元數(shù)據(jù)集中與相應(yīng)的語音信息分類對應(yīng)的聲學(xué)特征進(jìn)行匹配,識別出第一語音識別結(jié)果,所用識別方法為通過HMM-GMM模型或RNN-GMM模型進(jìn)行識別。
9.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于,包括:
所述識別糾錯(cuò)模塊,用于通過語言模型對第一語音識別結(jié)果進(jìn)行清洗糾錯(cuò),得到第二語音識別結(jié)果,包括:結(jié)合語義模型對第一語音識別結(jié)果進(jìn)行清洗糾錯(cuò)。