一種用于大數(shù)據(jù)分析的語音識別系統(tǒng)的制作方法

文檔序號：12724091閱讀：來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)>一種用于大數(shù)據(jù)分析的語音識別系統(tǒng)的制作方法與工藝

技術(shù)特征：

1.一種用于大數(shù)據(jù)分析的語音識別系統(tǒng)，其特征在于，包括：

語音信息分類模塊，用于對原始語音信息進(jìn)行分類，得到分類后的原始語音信息；

原始語音處理模塊，用于對分類后的原始語音信息進(jìn)行語音增強(qiáng)和濾波，得到處理后的語音信息；

聲學(xué)特征識別提取模塊，用于對處理后的語音信息中的聲學(xué)特征進(jìn)行識別提取；

基礎(chǔ)元數(shù)據(jù)集，用于存儲針對不同語音信息分類的聲學(xué)特征及與其對應(yīng)的文本信息；

聲學(xué)特征匹配模塊，用于將提取的聲學(xué)特征與基礎(chǔ)元數(shù)據(jù)集中與相應(yīng)的語音信息分類對應(yīng)的聲學(xué)特征進(jìn)行匹配，識別出第一語音識別結(jié)果；

識別糾錯(cuò)模塊，用于對識別出的第一語音識別結(jié)果進(jìn)行清洗糾錯(cuò)，得到第二語音識別結(jié)果；

結(jié)果輸出模塊，用于將第二語音識別結(jié)果作為語音識別結(jié)果進(jìn)行輸出。

2.根據(jù)權(quán)利要求1所述的系統(tǒng)，其特征在于，包括：

所述語音信息分類模塊，用于根據(jù)語音特征對對原始語音信息進(jìn)行分類，所述語音特征包括：語音的時(shí)長、語音包含的音素?cái)?shù)量。

3.根據(jù)權(quán)利要求2所述的系統(tǒng)，其特征在于，包括：

所述原始語音處理模塊，包括用于對分類后的原始語音信息進(jìn)行語音增強(qiáng)，得到語音增強(qiáng)后的原始語音信息，所用增強(qiáng)方法為減譜法，所用減譜公式為：

$<mrow> <msub> <mi>P</mi> <mi>S</mi> </msub> <mrow> <mo>(</mo> <mi>ω</mi> <mo>)</mo> </mrow> <mo>=</mo> <mi>m</mi> <mi>a</mi> <mi>x</mi> <mo>{</mo> <mn>0</mn> <mo>,</mo> <msub> <mi>P</mi> <mi>y</mi> </msub> <mrow> <mo>(</mo> <mi>ω</mi> <mo>)</mo> </mrow> <mo>-</mo> <msqrt> <mrow> <mfrac> <mrow> <msub> <mi>t</mi> <mn>2</mn> </msub> <mo>-</mo> <mi>t</mi> </mrow> <mrow> <msub> <mi>t</mi> <mn>2</mn> </msub> <mo>-</mo> <msub> <mi>t</mi> <mn>1</mn> </msub> </mrow> </mfrac> <msup> <mrow> <mo>(</mo> <msub> <mi>P</mi> <mrow> <mi>n</mi> <mn>1</mn> </mrow> </msub> <mo>(</mo> <mi>ω</mi> <mo>)</mo> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>+</mo> <mfrac> <mrow> <mi>t</mi> <mo>-</mo> <msub> <mi>t</mi> <mn>1</mn> </msub> </mrow> <mrow> <msub> <mi>t</mi> <mn>2</mn> </msub> <mo>-</mo> <msub> <mi>t</mi> <mn>1</mn> </msub> </mrow> </mfrac> <msup> <mrow> <mo>(</mo> <msub> <mi>P</mi> <mrow> <mi>n</mi> <mn>2</mn> </mrow> </msub> <mo>(</mo> <mi>ω</mi> <mo>)</mo> <mo>)</mo> </mrow> <mn>2</mn> </msup> </mrow> </msqrt> <mo>}</mo> </mrow>$

其中，P_S(ω)為輸出語音信息的功率譜，P_y(ω)為原始語音信息的功率譜，P_n1(ω)為發(fā)聲前的寂靜段的功率譜，P_n2(ω)為發(fā)聲結(jié)束后的寂靜段的功率譜，t₁為發(fā)聲前的寂靜段結(jié)束時(shí)的時(shí)間點(diǎn)，t₂為發(fā)聲結(jié)束后的寂靜段開始時(shí)的時(shí)間點(diǎn)，t為當(dāng)前所要處理的語音信息的時(shí)間點(diǎn)。

4.根據(jù)權(quán)利要求3所述的系統(tǒng)，其特征在于，包括：

所述原始語音處理模塊，包括用于對語音增強(qiáng)后的原始語音信息進(jìn)行濾波，所用濾波方法為通過帶通濾波器進(jìn)行濾波。

5.根據(jù)權(quán)利要求1所述的系統(tǒng)，其特征在于，包括：

所述聲學(xué)特征包括：

Mel頻段倒譜系數(shù)和過零峰值幅度。

6.根據(jù)權(quán)利要求1所述的系統(tǒng)，其特征在于，包括：

所述聲學(xué)特征識別提取模塊，用于對處理后的語音信息中的聲學(xué)特征進(jìn)行識別提取，包括，對處理后的語音信息進(jìn)行預(yù)加重、分幀和加窗，加窗所用的窗函數(shù)為：

$<mrow> <mi>w</mi> <mrow> <mo>(</mo> <mi>n</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <mn>0.47</mn> <mo>-</mo> <mn>0.42</mn> <mi>c</mi> <mi>o</mi> <mi>s</mi> <mrow> <mo>(</mo> <mfrac> <mrow> <mn>2</mn> <mi>π</mi> <mrow> <mo>(</mo> <mi>n</mi> <mo>-</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow> <mrow> <mi>N</mi> <mo>-</mo> <mn>1</mn> </mrow> </mfrac> <mo>)</mo> </mrow> <mo>+</mo> <mn>0.11</mn> <mi>s</mi> <mi>i</mi> <mi>n</mi> <mrow> <mo>(</mo> <mfrac> <mrow> <mi>π</mi> <mrow> <mo>(</mo> <mi>n</mi> <mo>-</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow> <mrow> <mi>N</mi> <mo>-</mo> <mn>1</mn> </mrow> </mfrac> <mo>)</mo> </mrow> <mo>,</mo> </mrow> </mtd> <mtd> <mrow> <mn>1</mn> <mo>≤</mo> <mi>n</mi> <mo>≤</mo> <mi>N</mi> </mrow> </mtd> </mtr> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mrow> <mi>n</mi> <mo>=</mo> <mi>e</mi> <mi>l</mi> <mi>s</mi> <mi>e</mi> </mrow> </mtd> </mtr> </mtable> </mfenced> </mrow>$

其中，w(n)為窗函數(shù)的值，N為幀長，n為采樣點(diǎn)；

對聲學(xué)特征進(jìn)行識別提取使用基于Levenberg-Marquardt算法的神經(jīng)網(wǎng)絡(luò)進(jìn)行識別提取。

7.根據(jù)權(quán)利要求1所述的系統(tǒng)，其特征在于，包括：

所述基礎(chǔ)元數(shù)據(jù)集，所用存儲方法為，先存儲一類語音信息分類的聲學(xué)特征及與其對應(yīng)的文本信息，作為參考數(shù)據(jù)，對于其他語音信息分類的聲學(xué)特征，根據(jù)聲學(xué)特征出現(xiàn)的概率使用不同的存儲方式，出現(xiàn)概率高的聲學(xué)特征進(jìn)行完整存儲，出現(xiàn)概率低的聲學(xué)特征僅存儲其與參考數(shù)據(jù)的不同部分。

8.根據(jù)權(quán)利要求1所述的系統(tǒng)，其特征在于，包括：

所述聲學(xué)特征匹配模塊，用于將提取的聲學(xué)特征與基礎(chǔ)元數(shù)據(jù)集中與相應(yīng)的語音信息分類對應(yīng)的聲學(xué)特征進(jìn)行匹配，識別出第一語音識別結(jié)果，所用識別方法為通過HMM-GMM模型或RNN-GMM模型進(jìn)行識別。

9.根據(jù)權(quán)利要求1所述的系統(tǒng)，其特征在于，包括：

所述識別糾錯(cuò)模塊，用于通過語言模型對第一語音識別結(jié)果進(jìn)行清洗糾錯(cuò)，得到第二語音識別結(jié)果，包括：結(jié)合語義模型對第一語音識別結(jié)果進(jìn)行清洗糾錯(cuò)。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第2頁1 2 3

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種用于大數(shù)據(jù)分析的語音識別系統(tǒng)的制作方法