一種語(yǔ)音識(shí)別方法及裝置的制作方法

文檔序號(hào)：2823344閱讀：207來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專(zhuān)利>樂(lè)器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專(zhuān)利名稱(chēng)：一種語(yǔ)音識(shí)別方法及裝置的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及通信技術(shù)領(lǐng)域，具體的說(shuō)，涉及一種語(yǔ)音識(shí)別方法及裝置。
背景技術(shù)：
自動(dòng)語(yǔ)音識(shí)別ASR(Automatic Speech Recognition)技術(shù)是一種將人的語(yǔ)音轉(zhuǎn)換為文本的技術(shù)，屬于一個(gè)多學(xué)科交叉的技術(shù)領(lǐng)域，它與聲學(xué)、語(yǔ)音學(xué)、語(yǔ)言學(xué)、數(shù)字信號(hào)處理理論、信息論、計(jì)算機(jī)科學(xué)等眾多學(xué)科緊密相連。近年來(lái)，消費(fèi)類(lèi)電子產(chǎn)品對(duì)低成本、高穩(wěn)健性的語(yǔ)音識(shí)別系統(tǒng)的需求逐漸增加，語(yǔ)音識(shí)別系統(tǒng)已經(jīng)大量地從實(shí)驗(yàn)室的PC平臺(tái)轉(zhuǎn)移到了終端設(shè)備中。目前已經(jīng)有許多用戶(hù)有機(jī)會(huì)體驗(yàn)到語(yǔ)音識(shí)別技術(shù)帶給人們的便捷服務(wù)，例如通過(guò)語(yǔ)音識(shí)別技術(shù)，用戶(hù)可以直接發(fā)出語(yǔ)音來(lái)對(duì)終端設(shè)備發(fā)送指令，或要求終端設(shè)備記錄用戶(hù)發(fā)出的語(yǔ)音，從而將文本轉(zhuǎn)換成用戶(hù)語(yǔ)音朗讀出來(lái)。終端語(yǔ)音識(shí)別是一個(gè)模式識(shí)別匹配的過(guò)程。在這個(gè)過(guò)程中，終端首先要根據(jù)人的語(yǔ)音特點(diǎn)建立語(yǔ)音模型，通過(guò)對(duì)輸入的語(yǔ)音信號(hào)的分析，抽取所需的特征，來(lái)建立語(yǔ)音識(shí)別所需的模板。而終端在識(shí)別過(guò)程中要根據(jù)語(yǔ)音識(shí)別模型，將終端中的語(yǔ)音模板與輸入的語(yǔ) 音信號(hào)的特征比較后，確定與輸入語(yǔ)音匹配的最佳模板，從而獲得語(yǔ)音識(shí)別的結(jié)果。在實(shí)現(xiàn)本發(fā)明過(guò)程中，發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)中至少存在如下問(wèn)題在現(xiàn)有的語(yǔ)音識(shí)別終端產(chǎn)品中，語(yǔ)音識(shí)別系統(tǒng)對(duì)用戶(hù)輸入的語(yǔ)音進(jìn)行識(shí)別過(guò)程中，通常會(huì)根據(jù)可信度的高低向用戶(hù)顯示與輸入語(yǔ)音有關(guān)的幾種選擇，用戶(hù)需要再次選擇來(lái)確定最終的識(shí)別結(jié)果；另外，語(yǔ)音識(shí)別過(guò)程中如果出現(xiàn)錯(cuò)誤，只能在提示用戶(hù)識(shí)別結(jié)果或根據(jù)該識(shí)別結(jié)果繼續(xù)運(yùn)行程序時(shí)，被用戶(hù)發(fā)覺(jué)，無(wú)法提前獲知。例如用戶(hù)在使用語(yǔ)音識(shí)別技術(shù)撥打電話時(shí)，當(dāng)語(yǔ)音識(shí)別錯(cuò)誤發(fā)生時(shí)，往往在接通電話后，用戶(hù)才能發(fā)現(xiàn)通話對(duì)象是錯(cuò) 誤的。針對(duì)上述現(xiàn)有技術(shù)可以看出，現(xiàn)有的語(yǔ)音識(shí)別系統(tǒng)很大程度上給用戶(hù)造成的用戶(hù)體驗(yàn)很差。

發(fā)明內(nèi)容
本發(fā)明的實(shí)施例提供了一種語(yǔ)音識(shí)別方法及裝置，能夠提高現(xiàn)有語(yǔ)音識(shí)別系統(tǒng)的用戶(hù)體驗(yàn)。本發(fā)明實(shí)施例提供了一種語(yǔ)音識(shí)別方法，技術(shù)方案包括通過(guò)至少兩條語(yǔ)音識(shí)別支路識(shí)別輸入語(yǔ)音；在確定從所述語(yǔ)音識(shí)別支路獲得的至少兩種語(yǔ)音識(shí)別結(jié)果一致時(shí)，輸出所述識(shí)別結(jié)果。本發(fā)明實(shí)施例提供了一種語(yǔ)音識(shí)別裝置，技術(shù)方案包括信息識(shí)別模塊，用于通過(guò)至少兩條語(yǔ)音識(shí)別支路識(shí)別輸入語(yǔ)音；識(shí)別處理模塊，用于在確定從所述信息識(shí)別模塊中獲得的至少兩種語(yǔ)音識(shí)別結(jié)果一致時(shí)，輸出所述識(shí)別結(jié)果。由上述本發(fā)明的實(shí)施例提供的技術(shù)方案可以看出，其通過(guò)對(duì)至少兩條語(yǔ)音識(shí)別支路產(chǎn)生的結(jié)果進(jìn)行判決，不需要用戶(hù)再次對(duì)識(shí)別結(jié)果進(jìn)行選擇，在錯(cuò)誤發(fā)生時(shí)可以采用相應(yīng)的處理方式提示用戶(hù)，提高了現(xiàn)有語(yǔ)音識(shí)別系統(tǒng)的用戶(hù)體驗(yàn)。

為了更清楚地說(shuō)明本發(fā)明實(shí)施例的技術(shù)方案，下面將對(duì)實(shí)施例描述中所需要使用的附圖作簡(jiǎn)單地介紹，顯而易見(jiàn)地，下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例，對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講，在不付出創(chuàng)造性勞動(dòng)性的前提下，還可以根據(jù)這些附圖獲得其他的附圖。圖1為本發(fā)明實(shí)施例一種語(yǔ)音識(shí)別方法的流程圖；圖2為本發(fā)明實(shí)施例一種語(yǔ)音識(shí)別方法的應(yīng)用場(chǎng)景圖；圖3為本發(fā)明實(shí)施例一種語(yǔ)音識(shí)別方法的應(yīng)用場(chǎng)景圖；圖4為本發(fā)明實(shí)施例一種語(yǔ)音識(shí)別裝置的結(jié)構(gòu)示意圖。
具體實(shí)施例方式下面將結(jié)合本發(fā)明實(shí)施例中的附圖，對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述，顯然，所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例，而不是全部的實(shí)施例。基于本發(fā)明中的實(shí)施例，本領(lǐng)域普通技術(shù)人員在沒(méi)有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例，都屬于本發(fā)明保護(hù)的范圍。本發(fā)明實(shí)施例一種語(yǔ)音識(shí)別方法及裝置的核心是針對(duì)輸入語(yǔ)音采用至少兩條的語(yǔ)音識(shí)別支路進(jìn)行處理，通過(guò)對(duì)產(chǎn)生的至少兩個(gè)語(yǔ)音識(shí)別結(jié)果進(jìn)行判決后輸出，用戶(hù)不需要針對(duì)多個(gè)識(shí)別結(jié)果進(jìn)行再次選擇，同時(shí)，本發(fā)明實(shí)施例在識(shí)別結(jié)果的判決過(guò)程中，能夠及時(shí)提示用戶(hù)識(shí)別過(guò)程中出現(xiàn)的錯(cuò)誤，避免了由于語(yǔ)音識(shí)別錯(cuò)誤導(dǎo)致的錯(cuò)誤程序的運(yùn)行。下面通過(guò)本發(fā)明具體實(shí)施例針對(duì)本發(fā)明記載的技術(shù)方案進(jìn)行詳細(xì)說(shuō)明。如圖1所示，本發(fā)明實(shí)施例提供了一種語(yǔ)音識(shí)別方法，可以通過(guò)如下技術(shù)方案實(shí) 現(xiàn)步驟101 通過(guò)至少兩條語(yǔ)音識(shí)別支路識(shí)別輸入語(yǔ)音；步驟102 在確定從所述語(yǔ)音識(shí)別支路獲得的至少兩種語(yǔ)音識(shí)別結(jié)果一致時(shí)，輸出所述識(shí)別結(jié)果。在本發(fā)明的一個(gè)實(shí)施例中，通過(guò)至少兩條語(yǔ)音識(shí)別支路識(shí)別輸入語(yǔ)音的過(guò)程具體可以通過(guò)如下技術(shù)方案實(shí)現(xiàn)步驟1011 獲取輸入語(yǔ)音信號(hào)；步驟1012 分別通過(guò)至少兩條語(yǔ)音識(shí)別支路對(duì)所述語(yǔ)音信號(hào)進(jìn)行識(shí)別后，存儲(chǔ)所述語(yǔ)音識(shí)別支路產(chǎn)生的至少兩種語(yǔ)音識(shí)別結(jié)果。需要說(shuō)明的是，本發(fā)明實(shí)施例中采用至少兩條語(yǔ)音識(shí)別支路對(duì)用戶(hù)輸入的語(yǔ)音信號(hào)進(jìn)行語(yǔ)音識(shí)別，并沒(méi)有具體限定語(yǔ)音識(shí)別支路的數(shù)量，在實(shí)施例的具體實(shí)現(xiàn)場(chǎng)景中，可以根據(jù)業(yè)務(wù)需求來(lái)具體選配。另外需要說(shuō)明的是，在現(xiàn)有的語(yǔ)音識(shí)別系統(tǒng)中常用的算法通常有基于神經(jīng)網(wǎng)絡(luò) 的訓(xùn)練和識(shí)別算法、基于動(dòng)態(tài)時(shí)間歸整匹配的識(shí)別算法和基于統(tǒng)計(jì)的隱含馬爾可夫模型識(shí) 別和訓(xùn)練算法。
由于基于神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和識(shí)別算法實(shí)現(xiàn)起來(lái)較復(fù)雜，且識(shí)別率不高?；趧?dòng)態(tài) 時(shí)間歸整匹配的識(shí)別算法屬于一個(gè)最為小巧的語(yǔ)音識(shí)別的算法，其系統(tǒng)開(kāi)銷(xiāo)小，且識(shí)別速度快，針對(duì)小詞匯量的語(yǔ)音命令控制系統(tǒng)非常有效，但不適用在復(fù)雜系統(tǒng)中。基于統(tǒng)計(jì)的隱含馬爾可夫模型識(shí)別和訓(xùn)練算法是目前語(yǔ)音識(shí)別系統(tǒng)中最佳的一種，因?yàn)檫@種數(shù)學(xué)模型已經(jīng)形成了完整的理論框架。隱含馬爾可夫模型的算法是通過(guò)將語(yǔ) 音看成一連串特定狀態(tài)，這種狀態(tài)以某種隱含的關(guān)系與語(yǔ)音的觀測(cè)量(或特征)相關(guān)聯(lián)，并且這種隱含關(guān)系在HMM模型中通常以概率形式所體現(xiàn)，HMM模型的輸出結(jié)果也以概率形式給出，這為本發(fā)明實(shí)施例中的判決過(guò)程創(chuàng)造了條件。由此，本發(fā)明實(shí)施例中語(yǔ)音識(shí)別支路優(yōu) 選基于統(tǒng)計(jì)的隱含馬爾可夫模型識(shí)別和訓(xùn)練算法來(lái)實(shí)現(xiàn)。在本發(fā)明實(shí)施例中，在確定從所述語(yǔ)音識(shí)別支路獲得的至少兩種語(yǔ)音識(shí)別結(jié)果不一致時(shí)，分別給出了兩種不同的處理方式一種處理方式的應(yīng)用場(chǎng)景如圖2所示用戶(hù)輸入的語(yǔ)音信號(hào)通過(guò)至少兩個(gè)語(yǔ)音識(shí)別支路進(jìn)行語(yǔ)音識(shí)別，獲得至少兩種語(yǔ) 音識(shí)別結(jié)果；通過(guò)對(duì)至少兩種語(yǔ)音識(shí)別結(jié)果判決后如果相同，將識(shí)別結(jié)果直接輸出，或者根據(jù)該識(shí)別結(jié)果進(jìn)行相應(yīng)的操作；比如用戶(hù)在使用語(yǔ)音撥號(hào)服務(wù)時(shí)，系統(tǒng)會(huì)根據(jù)獲得的相同識(shí)別結(jié)果確定用戶(hù)撥出的被叫號(hào)碼，向被叫號(hào)碼發(fā)出通話呼叫或進(jìn)行短信發(fā)送。相反，當(dāng)獲得的識(shí)別結(jié)果中至少有一個(gè)識(shí)別結(jié)果不同時(shí)，輸出警報(bào)，提示用戶(hù)重新輸入語(yǔ)音信息，以便針對(duì)再次輸出的語(yǔ)音信息進(jìn)行識(shí)別。用戶(hù)使用現(xiàn)有的語(yǔ)音識(shí)別系統(tǒng)提供的服務(wù)時(shí)，當(dāng)識(shí)別結(jié)果有誤，例如用戶(hù)使用語(yǔ)音撥號(hào)時(shí)，只能在系統(tǒng)根據(jù)錯(cuò)誤識(shí)別結(jié)果撥通被叫號(hào)碼后，用戶(hù)才發(fā)覺(jué)其的錯(cuò)誤操作，不僅導(dǎo)致用戶(hù)自身的體驗(yàn)很差，同時(shí)也影響了被叫用戶(hù)的體驗(yàn)，通過(guò)在錯(cuò)誤發(fā)生時(shí)，及時(shí)提示用戶(hù)語(yǔ)音識(shí)別過(guò)程出現(xiàn)錯(cuò)誤，避免誤操作的產(chǎn)生。需要說(shuō)明的是，在圖2所示的應(yīng)用場(chǎng)景中，判決過(guò)程不具體針對(duì)語(yǔ)音識(shí)別支路的數(shù)量進(jìn)行考慮，判決過(guò)程中只要有語(yǔ)音識(shí)別支路產(chǎn)生的識(shí)別結(jié)果有一個(gè)與其余結(jié)果不同時(shí)，即做出警報(bào)。采用上述圖2這種方式，不僅能夠避免用戶(hù)針對(duì)多個(gè)識(shí)別結(jié)果的再次選擇帶來(lái)的麻煩，而且在語(yǔ)音信息識(shí)別過(guò)程出現(xiàn)錯(cuò)誤時(shí)，能夠及時(shí)給出用戶(hù)提示，避免識(shí)別錯(cuò)誤帶來(lái)的誤操作。另一種處理方式的應(yīng)用場(chǎng)景圖如圖3所示用戶(hù)輸入的語(yǔ)音信號(hào)通過(guò)至少兩個(gè)語(yǔ)音識(shí)別支路進(jìn)行語(yǔ)音識(shí)別，獲得至少兩種語(yǔ) 音識(shí)別結(jié)果；通過(guò)對(duì)至少兩種語(yǔ)音識(shí)別結(jié)果判決后，如果相同，將識(shí)別結(jié)果直接輸出，或者根據(jù)該識(shí)別結(jié)果進(jìn)行相應(yīng)的操作；當(dāng)不同時(shí)，還可以根據(jù)多數(shù)原則、加權(quán)算法或多數(shù)原則與加權(quán)算法相結(jié)合中任一方式，從所述至少兩種識(shí)別結(jié)果中確定最終識(shí)別結(jié)果后，再輸出。需要說(shuō)明的是，在圖3所示的應(yīng)用場(chǎng)景中，當(dāng)采用多數(shù)原則對(duì)語(yǔ)音識(shí)別支路的識(shí) 別結(jié)果進(jìn)行判決時(shí)，要具體考慮識(shí)別支路的數(shù)量，是將識(shí)別結(jié)果中保持一致數(shù)量最多的識(shí) 別結(jié)果作為最終識(shí)別結(jié)果，在最終識(shí)別結(jié)果確定后進(jìn)行輸出或按照最終識(shí)別結(jié)果執(zhí)行相應(yīng) 操作。例如應(yīng)用場(chǎng)景中存在6條語(yǔ)音識(shí)別支路時(shí)，語(yǔ)音識(shí)別后產(chǎn)生的結(jié)果為其中有3條支路的識(shí)別結(jié)果保持一致，有2條識(shí)別結(jié)果保持一致，其余1條支路的識(shí)別結(jié)果與另外5 條均不同，針對(duì)這種情況，將識(shí)別結(jié)果相同的3條支路的識(shí)別結(jié)果作為最終的識(shí)別結(jié)果。在圖3所示的應(yīng)用場(chǎng)景中，還可以采用加權(quán)計(jì)算的方式對(duì)語(yǔ)音識(shí)別支路的識(shí)別結(jié) 果進(jìn)行判決，其獲得的最終識(shí)別結(jié)果取決于權(quán)重的設(shè)定，具體可以通過(guò)分別針對(duì)每一條語(yǔ) 音識(shí)別支路設(shè)定權(quán)重，權(quán)重具體可以根據(jù)網(wǎng)絡(luò)延時(shí)時(shí)間、系統(tǒng)負(fù)荷來(lái)確定，本發(fā)明實(shí)施例不限定權(quán)重的具體設(shè)定因素，只要便于語(yǔ)音識(shí)別結(jié)果的判決即可。應(yīng)用場(chǎng)景中存在6條語(yǔ)音識(shí)別支路時(shí)，可以根據(jù)網(wǎng)絡(luò)延時(shí)時(shí)間來(lái)分別設(shè)定每條支路的權(quán)重，將網(wǎng)絡(luò)延時(shí)時(shí)間越小的支路權(quán)重設(shè)定的越高，通過(guò)加權(quán)算法來(lái)確定最終值，由于加權(quán)算法已經(jīng)是比較成熟的現(xiàn)有技術(shù)，所以本發(fā)明實(shí)施例在此不作贅述。在圖3所示的應(yīng)用場(chǎng)景中，也可以采用多數(shù)原則與加權(quán)算法相結(jié)合的方式來(lái)確定最終識(shí)別結(jié)果；應(yīng)用場(chǎng)景中存在6條語(yǔ)音識(shí)別支路時(shí)，當(dāng)每條支路產(chǎn)生的識(shí)別均不一致時(shí)，單純采用多數(shù)原則不能確定最終識(shí)別結(jié)果，在這種情況下，采用分別針對(duì)不能語(yǔ)音識(shí)別支路設(shè) 定權(quán)重，并通過(guò)加權(quán)算法針對(duì)每條語(yǔ)音識(shí)別支路計(jì)算權(quán)重值，從而確定最終識(shí)別結(jié)果。采用上述圖3這種方式，也能夠避免用戶(hù)針對(duì)多個(gè)識(shí)別結(jié)果的再次選擇帶來(lái)的麻煩，而且在語(yǔ)音信息識(shí)別過(guò)程出現(xiàn)錯(cuò)誤時(shí)，能夠通過(guò)綜合判決多個(gè)語(yǔ)音識(shí)別結(jié)果，盡可能的保證語(yǔ)音識(shí)別的準(zhǔn)確性。如圖4所示，基于上述圖1所示的方法實(shí)施例，本發(fā)明實(shí)施例還提供了一種語(yǔ)音識(shí) 別裝置，可以包括如下功能模塊信息識(shí)別模塊41，用于通過(guò)至少兩條語(yǔ)音識(shí)別支路識(shí)別輸入語(yǔ)音；識(shí)別處理模塊42，用于在確定從所述信息識(shí)別模塊中獲得的至少兩種語(yǔ)音識(shí)別結(jié) 果一致時(shí)，輸出所述識(shí)別結(jié)果。在本發(fā)明的一個(gè)實(shí)施例中，信息識(shí)別模塊41具體可以包括信息獲取單元411，用于獲取輸入語(yǔ)音信號(hào)；語(yǔ)音識(shí)別單元412，用于分別通過(guò)至少兩條語(yǔ)音識(shí)別支路對(duì)所述信息獲取模塊獲取的所述語(yǔ)音信號(hào)進(jìn)行識(shí)別后，存儲(chǔ)所述語(yǔ)音識(shí)別支路產(chǎn)生的至少語(yǔ)音兩種識(shí)別結(jié)果。需要說(shuō)明的是，信息識(shí)別模塊可以由圖2和圖3中的ASRl、ASR2"*ASRn組成，其中每條支路產(chǎn)生的識(shí)別結(jié)果可以統(tǒng)一存儲(chǔ)，也可以分別存儲(chǔ)。在本發(fā)明的一個(gè)實(shí)施例中，識(shí)別處理模塊42還可以用于在確定從所述語(yǔ)音識(shí)別支路獲得的至少兩種語(yǔ)音識(shí)別結(jié)果不一致時(shí)，提示用戶(hù)重新輸入語(yǔ)音信號(hào)。在本發(fā)明的一個(gè)實(shí)施例中，識(shí)別處理模塊42還可以用于在確定從所述語(yǔ)音識(shí)別支路獲得的至少兩種語(yǔ)音識(shí)別結(jié)果不一致時(shí)，根據(jù)多數(shù)原則、加權(quán)算法或多數(shù)原則與加權(quán) 算法相結(jié)合中任一方式，從所述至少兩種識(shí)別結(jié)果中確定最終識(shí)別結(jié)果后，再輸出。需要說(shuō)明的是，識(shí)別處理模塊的具體實(shí)現(xiàn)可以參見(jiàn)圖2和圖3所示的應(yīng)用場(chǎng)景，對(duì) 語(yǔ)音識(shí)別結(jié)果進(jìn)行判決可以通過(guò)圖中的信息判決器實(shí)現(xiàn)。在本發(fā)明的一個(gè)實(shí)施例中，信息識(shí)別模塊41中的語(yǔ)音識(shí)別支路采用基于統(tǒng)計(jì)的隱含馬爾可夫模型識(shí)別和訓(xùn)練算法來(lái)實(shí)現(xiàn)。需要說(shuō)明的是，本發(fā)明實(shí)施例是基于圖1所示的方法實(shí)施例獲得的，在本發(fā)明實(shí) 施例中涉及的各功能模塊與圖1方法實(shí)施例中各步驟涉及的具體技術(shù)方案相對(duì)應(yīng)，具體請(qǐng)參見(jiàn)上述圖1方法實(shí)施例。有上述本發(fā)明實(shí)施例記載的技術(shù)方案可知，一個(gè)語(yǔ)音識(shí)別系統(tǒng)性能好壞的關(guān)鍵取決于采用的語(yǔ)音模型能否真實(shí)地反映話音的物理變化規(guī)律，由于語(yǔ)音信號(hào)具有多樣性和復(fù) 雜性，本發(fā)明采用多于一條的語(yǔ)音識(shí)別支路同時(shí)對(duì)輸入語(yǔ)音進(jìn)行識(shí)別，盡可能的避免給用戶(hù)帶來(lái)重復(fù)性選擇的問(wèn)題，提高了用戶(hù)體驗(yàn)，同時(shí)當(dāng)識(shí)別結(jié)果錯(cuò)誤或不一致時(shí)能夠通過(guò)及時(shí)提醒或通過(guò)計(jì)算的方式來(lái)確定最終的識(shí)別結(jié)果，很大程度上保證了識(shí)別結(jié)果的準(zhǔn)確性，避免了由于識(shí)別結(jié)果錯(cuò)誤產(chǎn)生的誤操作。本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例方法中的全部或部分流程，是可以通過(guò)計(jì)算機(jī)程序來(lái)指令相關(guān)的硬件來(lái)完成，所述的程序可存儲(chǔ)于一計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì) 中，該程序在執(zhí)行時(shí)，可包括如上述各方法的實(shí)施例的流程。其中，所述的存儲(chǔ)介質(zhì)可為磁碟、光盤(pán)、只讀存儲(chǔ)記憶體(Read-Only Memory, ROM)或隨機(jī)存儲(chǔ)記憶體(Random Access Memory, RAM)等。以上所述，僅為本發(fā)明較佳的具體實(shí)施方式
，但本發(fā)明的保護(hù)范圍并不局限于此，任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi)，可輕易想到的變化或替換，都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此，本發(fā)明的保護(hù)范圍應(yīng)該以權(quán)利要求的保護(hù)范圍為準(zhǔn)。
權(quán)利要求
一種語(yǔ)音識(shí)別方法，其特征在于，包括通過(guò)至少兩條語(yǔ)音識(shí)別支路識(shí)別輸入語(yǔ)音；在確定從所述語(yǔ)音識(shí)別支路獲得的至少兩種語(yǔ)音識(shí)別結(jié)果一致時(shí)，輸出所述識(shí)別結(jié)果。
2.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述通過(guò)至少兩條語(yǔ)音識(shí)別支路識(shí)別輸入語(yǔ)音，包括獲取輸入語(yǔ)音信號(hào)；分別通過(guò)至少兩條語(yǔ)音識(shí)別支路對(duì)所述語(yǔ)音信號(hào)進(jìn)行識(shí)別后，存儲(chǔ)所述語(yǔ)音識(shí)別支路產(chǎn)生的至少兩種語(yǔ)音識(shí)別結(jié)果。
3.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述方法還包括在確定從所述語(yǔ)音識(shí)別支路獲得的至少兩種語(yǔ)音識(shí)別結(jié)果不一致時(shí)，提示用戶(hù)重新輸入語(yǔ)音信號(hào)。
4.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述方法還包括在確定從所述語(yǔ)音識(shí)別支路獲得的至少兩種語(yǔ)音識(shí)別結(jié)果不一致時(shí)，根據(jù)多數(shù)原則、加權(quán)算法或多數(shù)原則與加權(quán)算法相結(jié)合中任一方式，從所述至少兩種語(yǔ)音識(shí)別結(jié)果中確定最終識(shí)別結(jié)果后，再輸出。
5.根據(jù)權(quán)利要求1-4中任一所述的方法，其特征在于，所述語(yǔ)音識(shí)別支路采用基于統(tǒng) 計(jì)的隱含馬爾可夫模型識(shí)別和訓(xùn)練算法來(lái)實(shí)現(xiàn)。
6.一種語(yǔ)音識(shí)別裝置，其特征在于，包括信息識(shí)別模塊，用于通過(guò)至少兩條語(yǔ)音識(shí)別支路識(shí)別輸入語(yǔ)音；識(shí)別處理模塊，用于在確定從所述信息識(shí)別模塊中獲得的至少兩種語(yǔ)音識(shí)別結(jié)果一致時(shí)，輸出所述識(shí)別結(jié)果。
7.根據(jù)權(quán)利要求6所述的裝置，其特征在于，所述信息識(shí)別模塊具體包括信息獲取單元，用于獲取輸入語(yǔ)音信號(hào)；語(yǔ)音識(shí)別單元，用于分別通過(guò)至少兩條語(yǔ)音識(shí)別支路對(duì)所述信息獲取模塊獲取的所述語(yǔ)音信號(hào)進(jìn)行識(shí)別后，存儲(chǔ)所述語(yǔ)音識(shí)別支路產(chǎn)生的至少兩種語(yǔ)音識(shí)別結(jié)果。
8.根據(jù)權(quán)利要求6所述的裝置，其特征在于，所述識(shí)別處理模塊還用于在確定從所述語(yǔ)音識(shí)別支路獲得的至少兩種語(yǔ)音識(shí)別結(jié)果不一致時(shí)，提示用戶(hù)重新輸入語(yǔ)音信號(hào)。
9.根據(jù)權(quán)利要求6所述的裝置，其特征在于，所述識(shí)別處理模塊還用于在確定從所述語(yǔ)音識(shí)別支路獲得的至少兩種語(yǔ)音識(shí)別結(jié)果不一致時(shí)，根據(jù)多數(shù)原則、加權(quán)算法或多數(shù)原則與加權(quán)算法相結(jié)合中任一方式，從所述至少兩種語(yǔ)音識(shí)別結(jié)果中確定最終識(shí)別結(jié)果后，再輸出。
10.根據(jù)權(quán)利要求6-9中任一所述的裝置，其特征在于，所述信息識(shí)別模塊中的語(yǔ)音識(shí) 別支路采用基于統(tǒng)計(jì)的隱含馬爾可夫模型識(shí)別和訓(xùn)練算法來(lái)實(shí)現(xiàn)。
全文摘要
本發(fā)明公開(kāi)了一種語(yǔ)音識(shí)別方法及裝置，技術(shù)方案中該方法包括通過(guò)至少兩條語(yǔ)音識(shí)別支路識(shí)別輸入語(yǔ)音；在確定從所述語(yǔ)音識(shí)別支路獲得的至少兩種語(yǔ)音識(shí)別結(jié)果一致時(shí)，輸出所述識(shí)別結(jié)果。本發(fā)明實(shí)施例還提供了一種語(yǔ)音識(shí)別裝置，其中包括用于通過(guò)至少兩條語(yǔ)音識(shí)別支路識(shí)別輸入語(yǔ)音的信息識(shí)別模塊，以及用于在確定從所述信息識(shí)別模塊中獲得的至少兩種語(yǔ)音識(shí)別結(jié)果一致時(shí)，輸出所述識(shí)別結(jié)果的識(shí)別處理模塊。采用本發(fā)明實(shí)施例記載的技術(shù)方案能夠提高現(xiàn)有語(yǔ)音識(shí)別系統(tǒng)的用戶(hù)體驗(yàn)。
文檔編號(hào)G10L15/28GK101807399SQ201010111329
公開(kāi)日2010年8月18日申請(qǐng)日期2010年2月2日優(yōu)先權(quán)日2010年2月2日
發(fā)明者汪海申請(qǐng)人:華為終端有限公司

完整全部詳細(xì)技術(shù)資料下載