亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種用于大數(shù)據(jù)分析的語音識別系統(tǒng)的制作方法

文檔序號:12724091閱讀:來源:國知局

技術(shù)特征:

1.一種用于大數(shù)據(jù)分析的語音識別系統(tǒng),其特征在于,包括:

語音信息分類模塊,用于對原始語音信息進(jìn)行分類,得到分類后的原始語音信息;

原始語音處理模塊,用于對分類后的原始語音信息進(jìn)行語音增強(qiáng)和濾波,得到處理后的語音信息;

聲學(xué)特征識別提取模塊,用于對處理后的語音信息中的聲學(xué)特征進(jìn)行識別提取;

基礎(chǔ)元數(shù)據(jù)集,用于存儲針對不同語音信息分類的聲學(xué)特征及與其對應(yīng)的文本信息;

聲學(xué)特征匹配模塊,用于將提取的聲學(xué)特征與基礎(chǔ)元數(shù)據(jù)集中與相應(yīng)的語音信息分類對應(yīng)的聲學(xué)特征進(jìn)行匹配,識別出第一語音識別結(jié)果;

識別糾錯(cuò)模塊,用于對識別出的第一語音識別結(jié)果進(jìn)行清洗糾錯(cuò),得到第二語音識別結(jié)果;

結(jié)果輸出模塊,用于將第二語音識別結(jié)果作為語音識別結(jié)果進(jìn)行輸出。

2.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于,包括:

所述語音信息分類模塊,用于根據(jù)語音特征對對原始語音信息進(jìn)行分類,所述語音特征包括:語音的時(shí)長、語音包含的音素?cái)?shù)量。

3.根據(jù)權(quán)利要求2所述的系統(tǒng),其特征在于,包括:

所述原始語音處理模塊,包括用于對分類后的原始語音信息進(jìn)行語音增強(qiáng),得到語音增強(qiáng)后的原始語音信息,所用增強(qiáng)方法為減譜法,所用減譜公式為:

<mrow> <msub> <mi>P</mi> <mi>S</mi> </msub> <mrow> <mo>(</mo> <mi>&omega;</mi> <mo>)</mo> </mrow> <mo>=</mo> <mi>m</mi> <mi>a</mi> <mi>x</mi> <mo>{</mo> <mn>0</mn> <mo>,</mo> <msub> <mi>P</mi> <mi>y</mi> </msub> <mrow> <mo>(</mo> <mi>&omega;</mi> <mo>)</mo> </mrow> <mo>-</mo> <msqrt> <mrow> <mfrac> <mrow> <msub> <mi>t</mi> <mn>2</mn> </msub> <mo>-</mo> <mi>t</mi> </mrow> <mrow> <msub> <mi>t</mi> <mn>2</mn> </msub> <mo>-</mo> <msub> <mi>t</mi> <mn>1</mn> </msub> </mrow> </mfrac> <msup> <mrow> <mo>(</mo> <msub> <mi>P</mi> <mrow> <mi>n</mi> <mn>1</mn> </mrow> </msub> <mo>(</mo> <mi>&omega;</mi> <mo>)</mo> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>+</mo> <mfrac> <mrow> <mi>t</mi> <mo>-</mo> <msub> <mi>t</mi> <mn>1</mn> </msub> </mrow> <mrow> <msub> <mi>t</mi> <mn>2</mn> </msub> <mo>-</mo> <msub> <mi>t</mi> <mn>1</mn> </msub> </mrow> </mfrac> <msup> <mrow> <mo>(</mo> <msub> <mi>P</mi> <mrow> <mi>n</mi> <mn>2</mn> </mrow> </msub> <mo>(</mo> <mi>&omega;</mi> <mo>)</mo> <mo>)</mo> </mrow> <mn>2</mn> </msup> </mrow> </msqrt> <mo>}</mo> </mrow>

其中,PS(ω)為輸出語音信息的功率譜,Py(ω)為原始語音信息的功率譜,Pn1(ω)為發(fā)聲前的寂靜段的功率譜,Pn2(ω)為發(fā)聲結(jié)束后的寂靜段的功率譜,t1為發(fā)聲前的寂靜段結(jié)束時(shí)的時(shí)間點(diǎn),t2為發(fā)聲結(jié)束后的寂靜段開始時(shí)的時(shí)間點(diǎn),t為當(dāng)前所要處理的語音信息的時(shí)間點(diǎn)。

4.根據(jù)權(quán)利要求3所述的系統(tǒng),其特征在于,包括:

所述原始語音處理模塊,包括用于對語音增強(qiáng)后的原始語音信息進(jìn)行濾波,所用濾波方法為通過帶通濾波器進(jìn)行濾波。

5.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于,包括:

所述聲學(xué)特征包括:

Mel頻段倒譜系數(shù)和過零峰值幅度。

6.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于,包括:

所述聲學(xué)特征識別提取模塊,用于對處理后的語音信息中的聲學(xué)特征進(jìn)行識別提取,包括,對處理后的語音信息進(jìn)行預(yù)加重、分幀和加窗,加窗所用的窗函數(shù)為:

<mrow> <mi>w</mi> <mrow> <mo>(</mo> <mi>n</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <mn>0.47</mn> <mo>-</mo> <mn>0.42</mn> <mi>c</mi> <mi>o</mi> <mi>s</mi> <mrow> <mo>(</mo> <mfrac> <mrow> <mn>2</mn> <mi>&pi;</mi> <mrow> <mo>(</mo> <mi>n</mi> <mo>-</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow> <mrow> <mi>N</mi> <mo>-</mo> <mn>1</mn> </mrow> </mfrac> <mo>)</mo> </mrow> <mo>+</mo> <mn>0.11</mn> <mi>s</mi> <mi>i</mi> <mi>n</mi> <mrow> <mo>(</mo> <mfrac> <mrow> <mi>&pi;</mi> <mrow> <mo>(</mo> <mi>n</mi> <mo>-</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow> <mrow> <mi>N</mi> <mo>-</mo> <mn>1</mn> </mrow> </mfrac> <mo>)</mo> </mrow> <mo>,</mo> </mrow> </mtd> <mtd> <mrow> <mn>1</mn> <mo>&le;</mo> <mi>n</mi> <mo>&le;</mo> <mi>N</mi> </mrow> </mtd> </mtr> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mrow> <mi>n</mi> <mo>=</mo> <mi>e</mi> <mi>l</mi> <mi>s</mi> <mi>e</mi> </mrow> </mtd> </mtr> </mtable> </mfenced> </mrow>

其中,w(n)為窗函數(shù)的值,N為幀長,n為采樣點(diǎn);

對聲學(xué)特征進(jìn)行識別提取使用基于Levenberg-Marquardt算法的神經(jīng)網(wǎng)絡(luò)進(jìn)行識別提取。

7.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于,包括:

所述基礎(chǔ)元數(shù)據(jù)集,所用存儲方法為,先存儲一類語音信息分類的聲學(xué)特征及與其對應(yīng)的文本信息,作為參考數(shù)據(jù),對于其他語音信息分類的聲學(xué)特征,根據(jù)聲學(xué)特征出現(xiàn)的概率使用不同的存儲方式,出現(xiàn)概率高的聲學(xué)特征進(jìn)行完整存儲,出現(xiàn)概率低的聲學(xué)特征僅存儲其與參考數(shù)據(jù)的不同部分。

8.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于,包括:

所述聲學(xué)特征匹配模塊,用于將提取的聲學(xué)特征與基礎(chǔ)元數(shù)據(jù)集中與相應(yīng)的語音信息分類對應(yīng)的聲學(xué)特征進(jìn)行匹配,識別出第一語音識別結(jié)果,所用識別方法為通過HMM-GMM模型或RNN-GMM模型進(jìn)行識別。

9.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于,包括:

所述識別糾錯(cuò)模塊,用于通過語言模型對第一語音識別結(jié)果進(jìn)行清洗糾錯(cuò),得到第二語音識別結(jié)果,包括:結(jié)合語義模型對第一語音識別結(jié)果進(jìn)行清洗糾錯(cuò)。

當(dāng)前第2頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1