可以被改變,并且最終置信度分?jǐn)?shù)可以通過將權(quán)重值施加于初始置信度分?jǐn)?shù)來計(jì)算。
[0093]本公開的組成元件可以是存儲(chǔ)在計(jì)算機(jī)可讀記錄介質(zhì)上的代碼段。計(jì)算機(jī)可讀記錄裝置可以是ROM、RAM、CD-ROM、DVD_R0M、DVD_RAM、磁帶、軟盤、硬盤以及光學(xué)數(shù)據(jù)存儲(chǔ)設(shè)備。此外,計(jì)算機(jī)可讀記錄介質(zhì)可以存儲(chǔ)并執(zhí)行被劃分在連接到網(wǎng)絡(luò)的計(jì)算機(jī)上且可以被計(jì)算機(jī)分開讀取的代碼。
[0094]作為本公開示例的上文涉及的附圖和本公開的詳細(xì)描述,用于解釋本公開,但不限制權(quán)利要求中描述的本公開的含義或范圍。因此,本領(lǐng)域技術(shù)人員可以很容易地從上面的描述中實(shí)現(xiàn)修改。此外,本領(lǐng)域技術(shù)人員可以刪除一些本文描述的組成元件而不使性能劣化,或者可以添加其它的組成元件以提高性能。此外,本領(lǐng)域技術(shù)人員可以根據(jù)工藝或設(shè)備的環(huán)境來改變本文描述的方法的步驟的順序。因此,本公開的范圍不應(yīng)該由上文描述的實(shí)施方式來確定,而是由權(quán)利要求及其等同形式來確定。
[0095]盡管本公開結(jié)合目前被認(rèn)為是可實(shí)現(xiàn)的實(shí)施方式已經(jīng)進(jìn)行了描述,但是應(yīng)當(dāng)理解本公開并不限于所公開的實(shí)施方式,而相反的,意在覆蓋包括在所附權(quán)利要求的精神和范圍內(nèi)的各種修改和等同配置。
【主權(quán)項(xiàng)】
1.一種語(yǔ)音識(shí)別系統(tǒng),包括: 上下文存儲(chǔ)介質(zhì),其存儲(chǔ)包括多個(gè)單音節(jié)命令的單音節(jié)命令上下文以及存儲(chǔ)包括多個(gè)多音節(jié)命令的多音節(jié)命令上下文; 語(yǔ)音段檢測(cè)器,其通過分析具有起始點(diǎn)和結(jié)束點(diǎn)的語(yǔ)音段內(nèi)的語(yǔ)音信號(hào)來檢測(cè)所述語(yǔ)音段; 音節(jié)確定器,其配置成確定語(yǔ)音信號(hào)是對(duì)應(yīng)于單音節(jié)模式還是多音節(jié)模式; 特征向量提取器,其通過分析語(yǔ)音信號(hào)來提取特征向量;以及語(yǔ)音識(shí)別器,其根據(jù)語(yǔ)音信號(hào)是對(duì)應(yīng)于單音節(jié)模式還是多音節(jié)模式的確定結(jié)果,選擇單音節(jié)命令上下文和多音節(jié)命令上下文中的一者,并且基于所提取的特征向量來識(shí)別在單音節(jié)命令上下文和多音節(jié)命令上下文中所選擇的一者中的至少一個(gè)命令。2.如權(quán)利要求1所述的語(yǔ)音識(shí)別系統(tǒng),其中所述音節(jié)確定器包括: 元音/輔音檢測(cè)器,其從語(yǔ)音信號(hào)中檢測(cè)元音和輔音; 組合計(jì)算器,其計(jì)算元音和輔音的組合的數(shù)量;以及 比較器,其將所述組合的數(shù)量與預(yù)定數(shù)量進(jìn)行比較。3.如權(quán)利要求2所述的語(yǔ)音識(shí)別系統(tǒng),其中所述元音/輔音檢測(cè)器利用語(yǔ)音信號(hào)的能量、語(yǔ)音信號(hào)的過零率、語(yǔ)音信號(hào)的自相關(guān)函數(shù)、語(yǔ)音信號(hào)的基頻和語(yǔ)音信號(hào)的頻譜傾斜中的至少一個(gè)來檢測(cè)元音和輔音。4.如權(quán)利要求1所述的語(yǔ)音識(shí)別系統(tǒng),還包括存儲(chǔ)用于語(yǔ)音識(shí)別的聲學(xué)模型的聲學(xué)模型存儲(chǔ)介質(zhì),其中 當(dāng)所述音節(jié)確定器確定出語(yǔ)音信號(hào)對(duì)應(yīng)于單音節(jié)模式時(shí),所述語(yǔ)音識(shí)別器基于所提取的特征向量,利用單音節(jié)命令上下文和聲學(xué)模型來識(shí)別至少一個(gè)命令,并且 當(dāng)所述音節(jié)確定器確定出語(yǔ)音信號(hào)對(duì)應(yīng)于多音節(jié)模式時(shí),所述語(yǔ)音識(shí)別器基于所提取的特征向量,利用多音節(jié)命令上下文和聲學(xué)模型來識(shí)別至少一個(gè)命令。5.如權(quán)利要求1所述的語(yǔ)音識(shí)別系統(tǒng),還包括: 聲學(xué)模型存儲(chǔ)介質(zhì),其存儲(chǔ)用于語(yǔ)音識(shí)別的聲學(xué)模型;以及 識(shí)別結(jié)果處理器,其執(zhí)行對(duì)應(yīng)于至少一個(gè)所識(shí)別的命令的功能。6.一種語(yǔ)音識(shí)別系統(tǒng),包括: 上下文存儲(chǔ)介質(zhì),其存儲(chǔ)包括多個(gè)單音節(jié)命令的單音節(jié)命令上下文以及存儲(chǔ)包括多個(gè)多音節(jié)命令的多音節(jié)命令上下文; 語(yǔ)音段檢測(cè)器,其通過分析具有起始點(diǎn)和結(jié)束點(diǎn)的語(yǔ)音段內(nèi)的語(yǔ)音信號(hào)來檢測(cè)所述語(yǔ)音段; 音節(jié)確定器,其配置成確定語(yǔ)音信號(hào)是對(duì)應(yīng)于單音節(jié)模式還是多音節(jié)模式; 特征向量提取器,其通過分析語(yǔ)音信號(hào)來提取特征向量; 語(yǔ)音識(shí)別器,其基于所提取的特征向量來計(jì)算各單音節(jié)命令的初始置信度分?jǐn)?shù)和各多音節(jié)命令的初始置信度分?jǐn)?shù); 權(quán)重值設(shè)置器,其根據(jù)語(yǔ)音信號(hào)是對(duì)應(yīng)于單音節(jié)模式還是多音節(jié)模式的確定結(jié)果,設(shè)置施加于各單音節(jié)命令的初始置信度分?jǐn)?shù)的第一權(quán)重值和施加于各多音節(jié)命令的初始置信度分?jǐn)?shù)的第二權(quán)重值;以及 權(quán)重值施加器,其通過將第一權(quán)重值施加于各單音節(jié)命令的初始置信度分?jǐn)?shù)來計(jì)算各單音節(jié)命令的最終置信度分?jǐn)?shù),并且通過將第二權(quán)重值施加于各多音節(jié)命令的初始置信度分?jǐn)?shù)來計(jì)算各多音節(jié)命令的最終置信度分?jǐn)?shù)。7.如權(quán)利要求6所述的語(yǔ)音識(shí)別系統(tǒng),其中所述音節(jié)確定器包括: 元音/輔音檢測(cè)器,其從語(yǔ)音信號(hào)中檢測(cè)元音和輔音; 組合計(jì)算器,其計(jì)算元音和輔音的組合的數(shù)量;以及 比較器,其將所述組合的數(shù)量與預(yù)定數(shù)量進(jìn)行比較。8.如權(quán)利要求7所述的語(yǔ)音識(shí)別系統(tǒng),其中所述元音/輔音檢測(cè)器利用語(yǔ)音信號(hào)的能量、語(yǔ)音信號(hào)的過零率、語(yǔ)音信號(hào)的自相關(guān)函數(shù)、語(yǔ)音信號(hào)的基頻和語(yǔ)音信號(hào)的頻譜傾斜中的至少一個(gè)來檢測(cè)元音和輔音。9.如權(quán)利要求6所述的語(yǔ)音識(shí)別系統(tǒng),還包括: 識(shí)別結(jié)果處理器,其基于各單音節(jié)命令的最終置信度分?jǐn)?shù)和各多音節(jié)命令的最終置信度分?jǐn)?shù)來選擇具有最高的最終置信度分?jǐn)?shù)的命令。10.如權(quán)利要求6所述的語(yǔ)音識(shí)別系統(tǒng),其中: 當(dāng)所述音節(jié)確定器確定出語(yǔ)音信號(hào)對(duì)應(yīng)于單音節(jié)模式時(shí),所述權(quán)重值設(shè)置器將第一權(quán)重值設(shè)置為大于第二權(quán)重值。11.如權(quán)利要求9所述的語(yǔ)音識(shí)別系統(tǒng),其中: 當(dāng)所述音節(jié)確定器確定出語(yǔ)音信號(hào)對(duì)應(yīng)于多音節(jié)模式時(shí),所述權(quán)重值設(shè)置器將第二權(quán)重值設(shè)置為大于第一權(quán)重值。12.—種識(shí)別方法,所述識(shí)別方法包括以下步驟: 通過分析具有起始點(diǎn)和結(jié)束點(diǎn)的語(yǔ)音段內(nèi)的語(yǔ)音信號(hào)來檢測(cè)所述語(yǔ)音段; 確定語(yǔ)音信號(hào)是對(duì)應(yīng)于單音節(jié)模式還是多音節(jié)模式; 通過分析語(yǔ)音信號(hào)來提取特征向量; 當(dāng)語(yǔ)音信號(hào)對(duì)應(yīng)于單音節(jié)模式時(shí),選擇包括多個(gè)單音節(jié)命令的單音節(jié)命令上下文,并且基于所提取的特征向量,利用單音節(jié)命令上下文來識(shí)別至少一個(gè)命令;以及 當(dāng)語(yǔ)音信號(hào)對(duì)應(yīng)于多音節(jié)模式時(shí),選擇包括多個(gè)多音節(jié)命令的多音節(jié)命令上下文,并且基于所提取的特征向量,利用多音節(jié)命令上下文來識(shí)別至少一個(gè)命令。13.如權(quán)利要求12所述的識(shí)別方法,其中確定語(yǔ)音信號(hào)是對(duì)應(yīng)于單音節(jié)模式還是多音節(jié)模式的步驟包括: 從語(yǔ)音信號(hào)中檢測(cè)元音和輔音; 計(jì)算元音和輔音的組合的數(shù)量;以及 將所述組合的數(shù)量與預(yù)定數(shù)量進(jìn)行比較。14.如權(quán)利要求13所述的語(yǔ)音識(shí)別方法,其中所述從語(yǔ)音信號(hào)中檢測(cè)元音和輔音的步驟包括: 利用語(yǔ)音信號(hào)的能量、語(yǔ)音信號(hào)的過零率、語(yǔ)音信號(hào)的自相關(guān)函數(shù)、語(yǔ)音信號(hào)的基頻和語(yǔ)音信號(hào)的頻譜傾斜中的至少一個(gè)來檢測(cè)元音和輔音。15.一種語(yǔ)音識(shí)別方法,所述語(yǔ)音識(shí)別方法包括以下步驟: 通過分析具有起始點(diǎn)和結(jié)束點(diǎn)的語(yǔ)音段內(nèi)的語(yǔ)音信號(hào)來檢測(cè)語(yǔ)音段; 確定語(yǔ)音信號(hào)是對(duì)應(yīng)于單音節(jié)模式還是多音節(jié)模式; 通過分析語(yǔ)音信號(hào)來提取特征向量; 基于所提取的特征向量來計(jì)算包括在單音節(jié)命令上下文中的各單音節(jié)命令的初始置信度分?jǐn)?shù)和包括在多音節(jié)命令上下文中的各多音節(jié)命令的初始置信度分?jǐn)?shù); 根據(jù)語(yǔ)音信號(hào)是對(duì)應(yīng)于單音節(jié)模式還是多音節(jié)模式的確定結(jié)果,設(shè)置施加于各單音節(jié)命令的初始置信度分?jǐn)?shù)的第一權(quán)重值和施加于各多音節(jié)命令的初始置信度分?jǐn)?shù)的第二權(quán)重值;以及 通過將第一權(quán)重值施加于各單音節(jié)命令的初始置信度分?jǐn)?shù)來計(jì)算各單音節(jié)命令的最終置信度分?jǐn)?shù),并且通過將第二權(quán)重值施加于各多音節(jié)命令的初始置信度分?jǐn)?shù)來計(jì)算各多音節(jié)命令的最終置信度分?jǐn)?shù)。16.如權(quán)利要求15所述的語(yǔ)音識(shí)別方法,其中確定語(yǔ)音信號(hào)是對(duì)應(yīng)于單音節(jié)模式還是多音節(jié)模式的步驟包括: 從語(yǔ)音信號(hào)中檢測(cè)元音和輔音; 計(jì)算元音和輔音的組合的數(shù)量;以及 將所述組合的數(shù)量與預(yù)定數(shù)量進(jìn)行比較。17.如權(quán)利要求16所述的語(yǔ)音識(shí)別方法,其中從語(yǔ)音信號(hào)中檢測(cè)元音和輔音的步驟包括: 利用語(yǔ)音信號(hào)的能量、語(yǔ)音信號(hào)的過零率、語(yǔ)音信號(hào)的自相關(guān)函數(shù)、語(yǔ)音信號(hào)的基頻和語(yǔ)音信號(hào)的頻譜傾斜中的至少一個(gè)來檢測(cè)元音和輔音。18.如權(quán)利要求15所述的語(yǔ)音識(shí)別方法,所述語(yǔ)音識(shí)別方法還包括以下步驟: 基于各單音節(jié)命令的最終置信度分?jǐn)?shù)和各多音節(jié)命令的最終置信度分?jǐn)?shù)來選擇具有最高的最終置信度分?jǐn)?shù)的命令。19.如權(quán)利要求15所述的語(yǔ)音識(shí)別方法,其中設(shè)置第一權(quán)重值和第二權(quán)重值的步驟包括: 當(dāng)語(yǔ)音信號(hào)對(duì)應(yīng)于單音節(jié)模式時(shí),將第一權(quán)重值設(shè)置為大于第二權(quán)重值;以及 當(dāng)語(yǔ)音信號(hào)對(duì)應(yīng)于多音節(jié)模式時(shí),將第二權(quán)重值設(shè)置為大于第一權(quán)重值。
【專利摘要】本發(fā)明提供一種語(yǔ)音識(shí)別系統(tǒng),包括:上下文存儲(chǔ)介質(zhì),其存儲(chǔ)包括多個(gè)單音節(jié)命令的單音節(jié)命令上下文以及存儲(chǔ)包括多個(gè)多音節(jié)命令的多音節(jié)命令上下文;語(yǔ)音段檢測(cè)器,其通過分析具有起始點(diǎn)和結(jié)束點(diǎn)的語(yǔ)音段內(nèi)的語(yǔ)音信號(hào)來檢測(cè)語(yǔ)音段;音節(jié)確定器,其配置成確定語(yǔ)音信號(hào)是對(duì)應(yīng)于單音節(jié)模式還是多音節(jié)模式;特征向量提取器,其通過分析語(yǔ)音信號(hào)來提取特征向量;以及語(yǔ)音識(shí)別器,其根據(jù)語(yǔ)音信號(hào)是對(duì)應(yīng)于單音節(jié)模式還是多音節(jié)模式的確定結(jié)果,選擇單音節(jié)命令上下文和多音節(jié)命令上下文中的一者,并且基于所提取的特征向量來識(shí)別在單音節(jié)命令上下文和多音節(jié)命令上下文中所選擇的一者中的至少一個(gè)命令。
【IPC分類】G10L15/26
【公開號(hào)】CN105609105
【申請(qǐng)?zhí)枴緾N201510507683
【發(fā)明人】李昌憲, 房圭燮
【申請(qǐng)人】現(xiàn)代自動(dòng)車株式會(huì)社
【公開日】2016年5月25日
【申請(qǐng)日】2015年8月18日
【公告號(hào)】DE102015214250A1, US9286888