專(zhuān)利名稱(chēng):一種語(yǔ)音識(shí)別方法及裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及通信技術(shù)領(lǐng)域,具體的說(shuō),涉及一種語(yǔ)音識(shí)別方法及裝置。
背景技術(shù):
自動(dòng)語(yǔ)音識(shí)別ASR(Automatic Speech Recognition)技術(shù)是一種將人的語(yǔ)音轉(zhuǎn)換 為文本的技術(shù),屬于一個(gè)多學(xué)科交叉的技術(shù)領(lǐng)域,它與聲學(xué)、語(yǔ)音學(xué)、語(yǔ)言學(xué)、數(shù)字信號(hào)處理 理論、信息論、計(jì)算機(jī)科學(xué)等眾多學(xué)科緊密相連 。近年來(lái),消費(fèi)類(lèi)電子產(chǎn)品對(duì)低成本、高穩(wěn)健 性的語(yǔ)音識(shí)別系統(tǒng)的需求逐漸增加,語(yǔ)音識(shí)別系統(tǒng)已經(jīng)大量地從實(shí)驗(yàn)室的PC平臺(tái)轉(zhuǎn)移到 了終端設(shè)備中。目前已經(jīng)有許多用戶(hù)有機(jī)會(huì)體驗(yàn)到語(yǔ)音識(shí)別技術(shù)帶給人們的便捷服務(wù),例 如通過(guò)語(yǔ)音識(shí)別技術(shù),用戶(hù)可以直接發(fā)出語(yǔ)音來(lái)對(duì)終端設(shè)備發(fā)送指令,或要求終端設(shè)備記 錄用戶(hù)發(fā)出的語(yǔ)音,從而將文本轉(zhuǎn)換成用戶(hù)語(yǔ)音朗讀出來(lái)。終端語(yǔ)音識(shí)別是一個(gè)模式識(shí)別匹配的過(guò)程。在這個(gè)過(guò)程中,終端首先要根據(jù)人的 語(yǔ)音特點(diǎn)建立語(yǔ)音模型,通過(guò)對(duì)輸入的語(yǔ)音信號(hào)的分析,抽取所需的特征,來(lái)建立語(yǔ)音識(shí)別 所需的模板。而終端在識(shí)別過(guò)程中要根據(jù)語(yǔ)音識(shí)別模型,將終端中的語(yǔ)音模板與輸入的語(yǔ) 音信號(hào)的特征比較后,確定與輸入語(yǔ)音匹配的最佳模板,從而獲得語(yǔ)音識(shí)別的結(jié)果。在實(shí)現(xiàn)本發(fā)明過(guò)程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)中至少存在如下問(wèn)題在現(xiàn)有的語(yǔ)音識(shí)別終端產(chǎn)品中,語(yǔ)音識(shí)別系統(tǒng)對(duì)用戶(hù)輸入的語(yǔ)音進(jìn)行識(shí)別過(guò)程 中,通常會(huì)根據(jù)可信度的高低向用戶(hù)顯示與輸入語(yǔ)音有關(guān)的幾種選擇,用戶(hù)需要再次選擇 來(lái)確定最終的識(shí)別結(jié)果;另外,語(yǔ)音識(shí)別過(guò)程中如果出現(xiàn)錯(cuò)誤,只能在提示用戶(hù)識(shí)別結(jié)果或 根據(jù)該識(shí)別結(jié)果繼續(xù)運(yùn)行程序時(shí),被用戶(hù)發(fā)覺(jué),無(wú)法提前獲知。例如用戶(hù)在使用語(yǔ)音識(shí)別 技術(shù)撥打電話時(shí),當(dāng)語(yǔ)音識(shí)別錯(cuò)誤發(fā)生時(shí),往往在接通電話后,用戶(hù)才能發(fā)現(xiàn)通話對(duì)象是錯(cuò) 誤的。針對(duì)上述現(xiàn)有技術(shù)可以看出,現(xiàn)有的語(yǔ)音識(shí)別系統(tǒng)很大程度上給用戶(hù)造成的用戶(hù)體 驗(yàn)很差。
發(fā)明內(nèi)容
本發(fā)明的實(shí)施例提供了一種語(yǔ)音識(shí)別方法及裝置,能夠提高現(xiàn)有語(yǔ)音識(shí)別系統(tǒng)的 用戶(hù)體驗(yàn)。本發(fā)明實(shí)施例提供了一種語(yǔ)音識(shí)別方法,技術(shù)方案包括通過(guò)至少兩條語(yǔ)音識(shí)別支路識(shí)別輸入語(yǔ)音;在確定從所述語(yǔ)音識(shí)別支路獲得的至少兩種語(yǔ)音識(shí)別結(jié)果一致時(shí),輸出所述識(shí)別結(jié)果。本發(fā)明實(shí)施例提供了一種語(yǔ)音識(shí)別裝置,技術(shù)方案包括 信息識(shí)別模塊,用于通過(guò)至少兩條語(yǔ)音識(shí)別支路識(shí)別輸入語(yǔ)音;識(shí)別處理模塊,用于在確定從所述信息識(shí)別模塊中獲得的至少兩種語(yǔ)音識(shí)別結(jié)果 一致時(shí),輸出所述識(shí)別結(jié)果。由上述本發(fā)明的實(shí)施例提供的技術(shù)方案可以看出,其通過(guò)對(duì)至少兩條語(yǔ)音識(shí)別支路產(chǎn)生的結(jié)果進(jìn)行判決,不需要用戶(hù)再次對(duì)識(shí)別結(jié)果進(jìn)行選擇,在錯(cuò)誤發(fā)生時(shí)可以采用相應(yīng)的處理方式提示用戶(hù),提高了現(xiàn)有語(yǔ)音識(shí)別系統(tǒng)的用戶(hù)體驗(yàn)。
為了更清楚地說(shuō)明本發(fā)明實(shí)施例的技術(shù)方案,下面將對(duì)實(shí)施例描述中所需要使用 的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本 領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其他 的附圖。圖1為本發(fā)明實(shí)施例一種語(yǔ)音識(shí)別方法的流程圖;圖2為本發(fā)明實(shí)施例一種語(yǔ)音識(shí)別方法的應(yīng)用場(chǎng)景圖;圖3為本發(fā)明實(shí)施例一種語(yǔ)音識(shí)別方法的應(yīng)用場(chǎng)景圖;圖4為本發(fā)明實(shí)施例一種語(yǔ)音識(shí)別裝置的結(jié)構(gòu)示意圖。
具體實(shí)施例方式下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完 整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于 本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他 實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。本發(fā)明實(shí)施例一種語(yǔ)音識(shí)別方法及裝置的核心是針對(duì)輸入語(yǔ)音采用至少兩條的 語(yǔ)音識(shí)別支路進(jìn)行處理,通過(guò)對(duì)產(chǎn)生的至少兩個(gè)語(yǔ)音識(shí)別結(jié)果進(jìn)行判決后輸出,用戶(hù)不需 要針對(duì)多個(gè)識(shí)別結(jié)果進(jìn)行再次選擇,同時(shí),本發(fā)明實(shí)施例在識(shí)別結(jié)果的判決過(guò)程中,能夠及 時(shí)提示用戶(hù)識(shí)別過(guò)程中出現(xiàn)的錯(cuò)誤,避免了由于語(yǔ)音識(shí)別錯(cuò)誤導(dǎo)致的錯(cuò)誤程序的運(yùn)行。下面通過(guò)本發(fā)明具體實(shí)施例針對(duì)本發(fā)明記載的技術(shù)方案進(jìn)行詳細(xì)說(shuō)明。如圖1所示,本發(fā)明實(shí)施例提供了一種語(yǔ)音識(shí)別方法,可以通過(guò)如下技術(shù)方案實(shí) 現(xiàn)步驟101 通過(guò)至少兩條語(yǔ)音識(shí)別支路識(shí)別輸入語(yǔ)音;步驟102 在確定從所述語(yǔ)音識(shí)別支路獲得的至少兩種語(yǔ)音識(shí)別結(jié)果一致時(shí),輸 出所述識(shí)別結(jié)果。在本發(fā)明的一個(gè)實(shí)施例中,通過(guò)至少兩條語(yǔ)音識(shí)別支路識(shí)別輸入語(yǔ)音的過(guò)程具體 可以通過(guò)如下技術(shù)方案實(shí)現(xiàn)步驟1011 獲取輸入語(yǔ)音信號(hào);步驟1012 分別通過(guò)至少兩條語(yǔ)音識(shí)別支路對(duì)所述語(yǔ)音信號(hào)進(jìn)行識(shí)別后,存儲(chǔ)所 述語(yǔ)音識(shí)別支路產(chǎn)生的至少兩種語(yǔ)音識(shí)別結(jié)果。需要說(shuō)明的是,本發(fā)明實(shí)施例中采用至少兩條語(yǔ)音識(shí)別支路對(duì)用戶(hù)輸入的語(yǔ)音信 號(hào)進(jìn)行語(yǔ)音識(shí)別,并沒(méi)有具體限定語(yǔ)音識(shí)別支路的數(shù)量,在實(shí)施例的具體實(shí)現(xiàn)場(chǎng)景中,可以 根據(jù)業(yè)務(wù)需求來(lái)具體選配。另外需要說(shuō)明的是,在現(xiàn)有的語(yǔ)音識(shí)別系統(tǒng)中常用的算法通常有基于神經(jīng)網(wǎng)絡(luò) 的訓(xùn)練和識(shí)別算法、基于動(dòng)態(tài)時(shí)間歸整匹配的識(shí)別算法和基于統(tǒng)計(jì)的隱含馬爾可夫模型識(shí) 別和訓(xùn)練算法。
由于基于神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和識(shí)別算法實(shí)現(xiàn)起來(lái)較復(fù)雜,且識(shí)別率不高?;趧?dòng)態(tài) 時(shí)間歸整匹配的識(shí)別算法屬于一個(gè)最為小巧的語(yǔ)音識(shí)別的算法,其系統(tǒng)開(kāi)銷(xiāo)小,且識(shí)別速 度快,針對(duì)小詞匯量的語(yǔ)音命令控制系統(tǒng)非常有效,但不適用在復(fù)雜系統(tǒng)中。基于統(tǒng)計(jì)的隱含馬爾可夫模型識(shí)別和訓(xùn)練算法是目前語(yǔ)音識(shí)別系統(tǒng)中最佳的一 種,因?yàn)檫@種數(shù)學(xué)模型已經(jīng)形成了完整的理論框架。隱含馬爾可夫模型的算法是通過(guò)將語(yǔ) 音看成一連串特定狀態(tài),這種狀態(tài)以某種隱含的關(guān)系與語(yǔ)音的觀測(cè)量(或特征)相關(guān)聯(lián),并 且這種隱含關(guān)系在HMM模型中通常以概率形式所體現(xiàn),HMM模型的輸出結(jié)果也以概率形式 給出,這為本發(fā)明實(shí)施例中的判決過(guò)程創(chuàng)造了條件。由此,本發(fā)明實(shí)施例中語(yǔ)音識(shí)別支路優(yōu) 選基于統(tǒng)計(jì)的隱含馬爾可夫模型識(shí)別和訓(xùn)練算法來(lái)實(shí)現(xiàn)。在本發(fā)明實(shí)施例中,在確定從所述語(yǔ)音識(shí)別支路獲得的至少兩種語(yǔ)音識(shí)別結(jié)果不 一致時(shí),分別給出了兩種不同的處理方式一種處理方式的應(yīng)用場(chǎng)景如圖2所示用戶(hù)輸入的語(yǔ)音信號(hào)通過(guò)至少兩個(gè)語(yǔ)音識(shí)別支路進(jìn)行語(yǔ)音識(shí)別,獲得至少兩種語(yǔ) 音識(shí)別結(jié)果;通過(guò)對(duì)至少兩種語(yǔ)音識(shí)別結(jié)果判決后如果相同,將識(shí)別結(jié)果直接輸出,或者根據(jù)該識(shí)別結(jié)果進(jìn)行相應(yīng)的操作;比如用 戶(hù)在使用語(yǔ)音撥號(hào)服務(wù)時(shí),系統(tǒng)會(huì)根據(jù)獲得的相同識(shí)別結(jié)果確定用戶(hù)撥出的被叫號(hào)碼,向 被叫號(hào)碼發(fā)出通話呼叫或進(jìn)行短信發(fā)送。相反,當(dāng)獲得的識(shí)別結(jié)果中至少有一個(gè)識(shí)別結(jié)果不同時(shí),輸出警報(bào),提示用戶(hù)重新 輸入語(yǔ)音信息,以便針對(duì)再次輸出的語(yǔ)音信息進(jìn)行識(shí)別。用戶(hù)使用現(xiàn)有的語(yǔ)音識(shí)別系統(tǒng)提 供的服務(wù)時(shí),當(dāng)識(shí)別結(jié)果有誤,例如用戶(hù)使用語(yǔ)音撥號(hào)時(shí),只能在系統(tǒng)根據(jù)錯(cuò)誤識(shí)別結(jié)果 撥通被叫號(hào)碼后,用戶(hù)才發(fā)覺(jué)其的錯(cuò)誤操作,不僅導(dǎo)致用戶(hù)自身的體驗(yàn)很差,同時(shí)也影響了 被叫用戶(hù)的體驗(yàn),通過(guò)在錯(cuò)誤發(fā)生時(shí),及時(shí)提示用戶(hù)語(yǔ)音識(shí)別過(guò)程出現(xiàn)錯(cuò)誤,避免誤操作的 產(chǎn)生。需要說(shuō)明的是,在圖2所示的應(yīng)用場(chǎng)景中,判決過(guò)程不具體針對(duì)語(yǔ)音識(shí)別支路的 數(shù)量進(jìn)行考慮,判決過(guò)程中只要有語(yǔ)音識(shí)別支路產(chǎn)生的識(shí)別結(jié)果有一個(gè)與其余結(jié)果不同 時(shí),即做出警報(bào)。采用上述圖2這種方式,不僅能夠避免用戶(hù)針對(duì)多個(gè)識(shí)別結(jié)果的再次選擇帶來(lái)的 麻煩,而且在語(yǔ)音信息識(shí)別過(guò)程出現(xiàn)錯(cuò)誤時(shí),能夠及時(shí)給出用戶(hù)提示,避免識(shí)別錯(cuò)誤帶來(lái)的 誤操作。另一種處理方式的應(yīng)用場(chǎng)景圖如圖3所示用戶(hù)輸入的語(yǔ)音信號(hào)通過(guò)至少兩個(gè)語(yǔ)音識(shí)別支路進(jìn)行語(yǔ)音識(shí)別,獲得至少兩種語(yǔ) 音識(shí)別結(jié)果;通過(guò)對(duì)至少兩種語(yǔ)音識(shí)別結(jié)果判決后,如果相同,將識(shí)別結(jié)果直接輸出,或者 根據(jù)該識(shí)別結(jié)果進(jìn)行相應(yīng)的操作;當(dāng)不同時(shí),還可以根據(jù)多數(shù)原則、加權(quán)算法或多數(shù)原則與 加權(quán)算法相結(jié)合中任一方式,從所述至少兩種識(shí)別結(jié)果中確定最終識(shí)別結(jié)果后,再輸出。需要說(shuō)明的是,在圖3所示的應(yīng)用場(chǎng)景中,當(dāng)采用多數(shù)原則對(duì)語(yǔ)音識(shí)別支路的識(shí) 別結(jié)果進(jìn)行判決時(shí),要具體考慮識(shí)別支路的數(shù)量,是將識(shí)別結(jié)果中保持一致數(shù)量最多的識(shí) 別結(jié)果作為最終識(shí)別結(jié)果,在最終識(shí)別結(jié)果確定后進(jìn)行輸出或按照最終識(shí)別結(jié)果執(zhí)行相應(yīng) 操作。例如應(yīng)用場(chǎng)景中存在6條語(yǔ)音識(shí)別支路時(shí),語(yǔ)音識(shí)別后產(chǎn)生的結(jié)果為其中有3條支路的識(shí)別結(jié)果保持一致,有2條識(shí)別結(jié)果保持一致,其余1條支路的識(shí)別結(jié)果與另外5 條均不同,針對(duì)這種情況,將識(shí)別結(jié)果相同的3條支路的識(shí)別結(jié)果作為最終的識(shí)別結(jié)果。在圖3所示的應(yīng)用場(chǎng)景中,還可以采用加權(quán)計(jì)算的方式對(duì)語(yǔ)音識(shí)別支路的識(shí)別結(jié) 果進(jìn)行判決,其獲得的最終識(shí)別結(jié)果取決于權(quán)重的設(shè)定,具體可以通過(guò)分別針對(duì)每一條語(yǔ) 音識(shí)別支路設(shè)定權(quán)重,權(quán)重具體可以根據(jù)網(wǎng)絡(luò)延時(shí)時(shí)間、系統(tǒng)負(fù)荷來(lái)確定,本發(fā)明實(shí)施例不 限定權(quán)重的具體設(shè)定因素,只要便于語(yǔ)音識(shí)別結(jié)果的判決即可。 應(yīng)用場(chǎng)景中存在6條語(yǔ)音識(shí)別支路時(shí),可以根據(jù)網(wǎng)絡(luò)延時(shí)時(shí)間來(lái)分別設(shè)定每條支 路的權(quán)重,將網(wǎng)絡(luò)延時(shí)時(shí)間越小的支路權(quán)重設(shè)定的越高,通過(guò)加權(quán)算法來(lái)確定最終值,由于 加權(quán)算法已經(jīng)是比較成熟的現(xiàn)有技術(shù),所以本發(fā)明實(shí)施例在此不作贅述。在圖3所示的應(yīng)用場(chǎng)景中,也可以采用多數(shù)原則與加權(quán)算法相結(jié)合的方式來(lái)確定 最終識(shí)別結(jié)果;應(yīng)用場(chǎng)景中存在6條語(yǔ)音識(shí)別支路時(shí),當(dāng)每條支路產(chǎn)生的識(shí)別均不一致時(shí),單純 采用多數(shù)原則不能確定最終識(shí)別結(jié)果,在這種情況下,采用分別針對(duì)不能語(yǔ)音識(shí)別支路設(shè) 定權(quán)重,并通過(guò)加權(quán)算法針對(duì)每條語(yǔ)音識(shí)別支路計(jì)算權(quán)重值,從而確定最終識(shí)別結(jié)果。采用上述圖3這種方式,也能夠避免用戶(hù)針對(duì)多個(gè)識(shí)別結(jié)果的再次選擇帶來(lái)的麻 煩,而且在語(yǔ)音信息識(shí)別過(guò)程出現(xiàn)錯(cuò)誤時(shí),能夠通過(guò)綜合判決多個(gè)語(yǔ)音識(shí)別結(jié)果,盡可能的 保證語(yǔ)音識(shí)別的準(zhǔn)確性。如圖4所示,基于上述圖1所示的方法實(shí)施例,本發(fā)明實(shí)施例還提供了一種語(yǔ)音識(shí) 別裝置,可以包括如下功能模塊信息識(shí)別模塊41,用于通過(guò)至少兩條語(yǔ)音識(shí)別支路識(shí)別輸入語(yǔ)音;識(shí)別處理模塊42,用于在確定從所述信息識(shí)別模塊中獲得的至少兩種語(yǔ)音識(shí)別結(jié) 果一致時(shí),輸出所述識(shí)別結(jié)果。在本發(fā)明的一個(gè)實(shí)施例中,信息識(shí)別模塊41具體可以包括信息獲取單元411,用于獲取輸入語(yǔ)音信號(hào);語(yǔ)音識(shí)別單元412,用于分別通過(guò)至少兩條語(yǔ)音識(shí)別支路對(duì)所述信息獲取模塊獲 取的所述語(yǔ)音信號(hào)進(jìn)行識(shí)別后,存儲(chǔ)所述語(yǔ)音識(shí)別支路產(chǎn)生的至少語(yǔ)音兩種識(shí)別結(jié)果。需要說(shuō)明的是,信息識(shí)別模塊可以由圖2和圖3中的ASRl、ASR2"*ASRn組成,其中 每條支路產(chǎn)生的識(shí)別結(jié)果可以統(tǒng)一存儲(chǔ),也可以分別存儲(chǔ)。在本發(fā)明的一個(gè)實(shí)施例中,識(shí)別處理模塊42還可以用于在確定從所述語(yǔ)音識(shí)別 支路獲得的至少兩種語(yǔ)音識(shí)別結(jié)果不一致時(shí),提示用戶(hù)重新輸入語(yǔ)音信號(hào)。在本發(fā)明的一個(gè)實(shí)施例中,識(shí)別處理模塊42還可以用于在確定從所述語(yǔ)音識(shí)別 支路獲得的至少兩種語(yǔ)音識(shí)別結(jié)果不一致時(shí),根據(jù)多數(shù)原則、加權(quán)算法或多數(shù)原則與加權(quán) 算法相結(jié)合中任一方式,從所述至少兩種識(shí)別結(jié)果中確定最終識(shí)別結(jié)果后,再輸出。需要說(shuō)明的是,識(shí)別處理模塊的具體實(shí)現(xiàn)可以參見(jiàn)圖2和圖3所示的應(yīng)用場(chǎng)景,對(duì) 語(yǔ)音識(shí)別結(jié)果進(jìn)行判決可以通過(guò)圖中的信息判決器實(shí)現(xiàn)。在本發(fā)明的一個(gè)實(shí)施例中,信息識(shí)別模塊41中的語(yǔ)音識(shí)別支路采用基于統(tǒng)計(jì)的 隱含馬爾可夫模型識(shí)別和訓(xùn)練算法來(lái)實(shí)現(xiàn)。需要說(shuō)明的是,本發(fā)明實(shí)施例是基于圖1所示的方法實(shí)施例獲得的,在本發(fā)明實(shí) 施例中涉及的各功能模塊與圖1方法實(shí)施例中各步驟涉及的具體技術(shù)方案相對(duì)應(yīng),具體請(qǐng)參見(jiàn)上述圖1方法實(shí)施例。有上述本發(fā)明實(shí)施例記載的技術(shù)方案可知,一個(gè)語(yǔ)音識(shí)別系統(tǒng)性能好壞的關(guān)鍵取決于采用的語(yǔ)音模型能否真實(shí)地反映話音的物理變化規(guī)律,由于語(yǔ)音信號(hào)具有多樣性和復(fù) 雜性,本發(fā)明采用多于一條的語(yǔ)音識(shí)別支路同時(shí)對(duì)輸入語(yǔ)音進(jìn)行識(shí)別,盡可能的避免給用 戶(hù)帶來(lái)重復(fù)性選擇的問(wèn)題,提高了用戶(hù)體驗(yàn),同時(shí)當(dāng)識(shí)別結(jié)果錯(cuò)誤或不一致時(shí)能夠通過(guò)及 時(shí)提醒或通過(guò)計(jì)算的方式來(lái)確定最終的識(shí)別結(jié)果,很大程度上保證了識(shí)別結(jié)果的準(zhǔn)確性, 避免了由于識(shí)別結(jié)果錯(cuò)誤產(chǎn)生的誤操作。本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例方法中的全部或部分流程,是可以 通過(guò)計(jì)算機(jī)程序來(lái)指令相關(guān)的硬件來(lái)完成,所述的程序可存儲(chǔ)于一計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì) 中,該程序在執(zhí)行時(shí),可包括如上述各方法的實(shí)施例的流程。其中,所述的存儲(chǔ)介質(zhì)可為磁 碟、光盤(pán)、只讀存儲(chǔ)記憶體(Read-Only Memory, ROM)或隨機(jī)存儲(chǔ)記憶體(Random Access Memory, RAM)等。以上所述,僅為本發(fā)明較佳的具體實(shí)施方式
,但本發(fā)明的保護(hù)范圍并不局限于此, 任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到的變化或替換, 都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)該以權(quán)利要求的保護(hù)范圍 為準(zhǔn)。
權(quán)利要求
一種語(yǔ)音識(shí)別方法,其特征在于,包括通過(guò)至少兩條語(yǔ)音識(shí)別支路識(shí)別輸入語(yǔ)音;在確定從所述語(yǔ)音識(shí)別支路獲得的至少兩種語(yǔ)音識(shí)別結(jié)果一致時(shí),輸出所述識(shí)別結(jié)果。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述通過(guò)至少兩條語(yǔ)音識(shí)別支路識(shí)別輸 入語(yǔ)音,包括獲取輸入語(yǔ)音信號(hào);分別通過(guò)至少兩條語(yǔ)音識(shí)別支路對(duì)所述語(yǔ)音信號(hào)進(jìn)行識(shí)別后,存儲(chǔ)所述語(yǔ)音識(shí)別支路 產(chǎn)生的至少兩種語(yǔ)音識(shí)別結(jié)果。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括在確定從所述語(yǔ)音識(shí)別支路獲得的至少兩種語(yǔ)音識(shí)別結(jié)果不一致時(shí),提示用戶(hù)重新輸 入語(yǔ)音信號(hào)。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括在確定從所述語(yǔ)音識(shí)別支路獲得的至少兩種語(yǔ)音識(shí)別結(jié)果不一致時(shí),根據(jù)多數(shù)原則、 加權(quán)算法或多數(shù)原則與加權(quán)算法相結(jié)合中任一方式,從所述至少兩種語(yǔ)音識(shí)別結(jié)果中確定 最終識(shí)別結(jié)果后,再輸出。
5.根據(jù)權(quán)利要求1-4中任一所述的方法,其特征在于,所述語(yǔ)音識(shí)別支路采用基于統(tǒng) 計(jì)的隱含馬爾可夫模型識(shí)別和訓(xùn)練算法來(lái)實(shí)現(xiàn)。
6.一種語(yǔ)音識(shí)別裝置,其特征在于,包括信息識(shí)別模塊,用于通過(guò)至少兩條語(yǔ)音識(shí)別支路識(shí)別輸入語(yǔ)音;識(shí)別處理模塊,用于在確定從所述信息識(shí)別模塊中獲得的至少兩種語(yǔ)音識(shí)別結(jié)果一致 時(shí),輸出所述識(shí)別結(jié)果。
7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述信息識(shí)別模塊具體包括信息獲取單元,用于獲取輸入語(yǔ)音信號(hào);語(yǔ)音識(shí)別單元,用于分別通過(guò)至少兩條語(yǔ)音識(shí)別支路對(duì)所述信息獲取模塊獲取的所述 語(yǔ)音信號(hào)進(jìn)行識(shí)別后,存儲(chǔ)所述語(yǔ)音識(shí)別支路產(chǎn)生的至少兩種語(yǔ)音識(shí)別結(jié)果。
8.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述識(shí)別處理模塊還用于在確定從所述 語(yǔ)音識(shí)別支路獲得的至少兩種語(yǔ)音識(shí)別結(jié)果不一致時(shí),提示用戶(hù)重新輸入語(yǔ)音信號(hào)。
9.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述識(shí)別處理模塊還用于在確定從所述 語(yǔ)音識(shí)別支路獲得的至少兩種語(yǔ)音識(shí)別結(jié)果不一致時(shí),根據(jù)多數(shù)原則、加權(quán)算法或多數(shù)原 則與加權(quán)算法相結(jié)合中任一方式,從所述至少兩種語(yǔ)音識(shí)別結(jié)果中確定最終識(shí)別結(jié)果后, 再輸出。
10.根據(jù)權(quán)利要求6-9中任一所述的裝置,其特征在于,所述信息識(shí)別模塊中的語(yǔ)音識(shí) 別支路采用基于統(tǒng)計(jì)的隱含馬爾可夫模型識(shí)別和訓(xùn)練算法來(lái)實(shí)現(xiàn)。
全文摘要
本發(fā)明公開(kāi)了一種語(yǔ)音識(shí)別方法及裝置,技術(shù)方案中該方法包括通過(guò)至少兩條語(yǔ)音識(shí)別支路識(shí)別輸入語(yǔ)音;在確定從所述語(yǔ)音識(shí)別支路獲得的至少兩種語(yǔ)音識(shí)別結(jié)果一致時(shí),輸出所述識(shí)別結(jié)果。本發(fā)明實(shí)施例還提供了一種語(yǔ)音識(shí)別裝置,其中包括用于通過(guò)至少兩條語(yǔ)音識(shí)別支路識(shí)別輸入語(yǔ)音的信息識(shí)別模塊,以及用于在確定從所述信息識(shí)別模塊中獲得的至少兩種語(yǔ)音識(shí)別結(jié)果一致時(shí),輸出所述識(shí)別結(jié)果的識(shí)別處理模塊。采用本發(fā)明實(shí)施例記載的技術(shù)方案能夠提高現(xiàn)有語(yǔ)音識(shí)別系統(tǒng)的用戶(hù)體驗(yàn)。
文檔編號(hào)G10L15/28GK101807399SQ201010111329
公開(kāi)日2010年8月18日 申請(qǐng)日期2010年2月2日 優(yōu)先權(quán)日2010年2月2日
發(fā)明者汪海 申請(qǐng)人:華為終端有限公司