一種語音語句識別方法及裝置的制造方法_3

文檔序號：8431787閱讀：來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)>一種語音語句識別方法及裝置的制造方法

提供的方案，包括:對屬于多種預(yù)設(shè)特定句式之一的待識別語音語句信號進(jìn)行數(shù)字化預(yù)處理，得到數(shù)字語音序列；對數(shù)字語音序列進(jìn)行過零點(diǎn)檢測，得到數(shù)字語音序列包括的多個序列分段，以及多個序列分段的分段數(shù)量；從多個語句結(jié)構(gòu)中，選擇語句成分?jǐn)?shù)量與分段數(shù)量相同的語句結(jié)構(gòu)，作為數(shù)字語音序列的語句結(jié)構(gòu)；按照數(shù)字語音序列的語句結(jié)構(gòu)的語句成分組成，確定所述數(shù)字語音序列中各指定語句成分各自對應(yīng)的序列分段；分別針對數(shù)字語音序列中每個指定語句成分對應(yīng)的序列分段，通過比較該指定語句成分對應(yīng)的序列分段的特征參數(shù)與該指定語句成分對應(yīng)的模式庫中的各特征參數(shù)，確定該指定語句成分對應(yīng)的序列分段的語義。采用本發(fā)明實(shí)施例提供的方法，相比現(xiàn)有技術(shù)，減少了對待識別語音語句的識別時間，從而提高了語音語句的處理效率。
[0101]本申請的實(shí)施例所提供的語音語句識別裝置可通過計算機(jī)程序?qū)崿F(xiàn)。本領(lǐng)域技術(shù)人員應(yīng)該能夠理解，上述的模塊劃分方式僅是眾多模塊劃分方式中的一種，如果劃分為其他模塊或不劃分模塊，只要語音語句識別裝置具有上述功能，都應(yīng)該在本申請的保護(hù)范圍之內(nèi)。
[0102]本申請是參照根據(jù)本申請實(shí)施例的方法、設(shè)備(系統(tǒng))、和計算機(jī)程序產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計算機(jī)程序指令實(shí)現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合?？商峁┻@些計算機(jī)程序指令到通用計算機(jī)、專用計算機(jī)、嵌入式處理機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個機(jī)器，使得通過計算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實(shí)現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。
[0103]這些計算機(jī)程序指令也可存儲在能引導(dǎo)計算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計算機(jī)可讀存儲器中，使得存儲在該計算機(jī)可讀存儲器中的指令產(chǎn)生包括指令裝置的制造品，該指令裝置實(shí)現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。
[0104]這些計算機(jī)程序指令也可裝載到計算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備上，使得在計算機(jī)或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計算機(jī)實(shí)現(xiàn)的處理，從而在計算機(jī)或其他可編程設(shè)備上執(zhí)行的指令提供用于實(shí)現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。
[0105]顯然，本領(lǐng)域的技術(shù)人員可以對本發(fā)明進(jìn)行各種改動和變型而不脫離本發(fā)明的精神和范圍。這樣，倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi)，則本發(fā)明也意圖包含這些改動和變型在內(nèi)。
【主權(quán)項】
1.一種語音語句識別方法，其特征在于，包括: 對屬于多種預(yù)設(shè)特定句式之一的待識別語音語句信號進(jìn)行數(shù)字化預(yù)處理，得到數(shù)字語音序列；對所述數(shù)字語音序列進(jìn)行過零點(diǎn)檢測，得到所述數(shù)字語音序列包括的多個序列分段，以及所述多個序列分段的分段數(shù)量；從多個語句結(jié)構(gòu)中，選擇語句成分?jǐn)?shù)量與所述分段數(shù)量相同的語句結(jié)構(gòu)，作為所述數(shù)字語音序列的語句結(jié)構(gòu)，其中，所述多個語句結(jié)構(gòu)的語句成分?jǐn)?shù)量不同；按照所述數(shù)字語音序列的語句結(jié)構(gòu)的語句成分組成，確定所述數(shù)字語音序列中各指定語句成分各自對應(yīng)的序列分段；分別針對所述數(shù)字語音序列中每個指定語句成分對應(yīng)的序列分段，通過比較該指定語句成分對應(yīng)的序列分段的特征參數(shù)與該指定語句成分對應(yīng)的模式庫中的各特征參數(shù)，確定該指定語句成分對應(yīng)的序列分段的語義。
2.如權(quán)利要求1所述的方法，其特征在于，通過比較該指定語句成分對應(yīng)的序列分段的特征參數(shù)與該指定語句成分對應(yīng)的模式庫中的各特征參數(shù)，確定該指定語句成分對應(yīng)的序列分段的語義，具體包括: 比較該指定語句成分對應(yīng)的序列分段的特征參數(shù)與該指定語句成分對應(yīng)的模式庫中的各特征參數(shù)的相似度；將該指定語句成分對應(yīng)的模式庫中相似度最大的特征參數(shù)對應(yīng)的語義，確定為該指定語句成分對應(yīng)的序列分段的語義。
3.如權(quán)利要求1所述的方法，其特征在于，在從多個語句結(jié)構(gòu)中，選擇語句成分?jǐn)?shù)量與所述分段數(shù)量相同的語句結(jié)構(gòu)之前，還包括: 提取所述數(shù)字語音序列的表示語法類別的特征信息；通過比較所述特征信息與多個語法類別的預(yù)設(shè)特征信息，確定所述數(shù)字語音序列的語法類別，其中，語法類別的預(yù)設(shè)特征信息為基于提取的多個已知屬于該語法類別的數(shù)字語音序列的表示語法類別的特征信息得到的；從多個語句結(jié)構(gòu)中，選擇語句成分?jǐn)?shù)量與所述分段數(shù)量相同的語句結(jié)構(gòu)，具體包括:從所述數(shù)字語音序列的語法類別包括的多個語句結(jié)構(gòu)中，選擇語句成分?jǐn)?shù)量與所述分段數(shù)量相同的語句結(jié)構(gòu)。
4.如權(quán)利要求3所述的方法，其特征在于，通過比較所述特征信息與多個語法類別的預(yù)設(shè)特征信息，確定所述數(shù)字語音序列的語法類別，具體包括: 比較所述特征信息與多個語法類別的預(yù)設(shè)特征信息的相似度；將所述多個語法類別中相似度最大的預(yù)設(shè)特征信息對應(yīng)的語法類別，確定為所述數(shù)字語音序列的語法類別。
5.如權(quán)利要求3或4所述的方法，其特征在于，還包括: 按照所述數(shù)字語音序列的語法類別對應(yīng)的預(yù)設(shè)操作方式，執(zhí)行與所述數(shù)字語音序列的各指定語句成分對應(yīng)的序列分段的語義對應(yīng)的操作。
6.一種語音語句識別裝置，其特征在于，包括: 預(yù)處理單元，用于對屬于多種預(yù)設(shè)特定句式之一的待識別語音語句信號進(jìn)行數(shù)字化預(yù)處理，得到數(shù)字語音序列；過零點(diǎn)檢測單元，用于對所述數(shù)字語音序列進(jìn)行過零點(diǎn)檢測，得到所述數(shù)字語音序列包括的多個序列分段，以及所述多個序列分段的分段數(shù)量；選擇單元，用于從多個語句結(jié)構(gòu)中，選擇語句成分?jǐn)?shù)量與所述分段數(shù)量相同的語句結(jié)構(gòu)，作為所述數(shù)字語音序列的語句結(jié)構(gòu)，其中，所述多個語句結(jié)構(gòu)的語句成分?jǐn)?shù)量不同；第一確定單元，用于按照所述數(shù)字語音序列的語句結(jié)構(gòu)的語句成分組成，確定所述數(shù)字語音序列中各指定語句成分各自對應(yīng)的序列分段；第二確定單元，用于分別針對所述數(shù)字語音序列中每個指定語句成分對應(yīng)的序列分段，通過比較該指定語句成分對應(yīng)的序列分段的特征參數(shù)與該指定語句成分對應(yīng)的模式庫中的各特征參數(shù)，確定該指定語句成分對應(yīng)的序列分段的語義。
7.如權(quán)利要求6所述的裝置，其特征在于，所述第二確定單元，具體用于比較該指定語句成分對應(yīng)的序列分段的特征參數(shù)與該指定語句成分對應(yīng)的模式庫中的各特征參數(shù)的相似度；將該指定語句成分對應(yīng)的模式庫中相似度最大的特征參數(shù)對應(yīng)的語義，確定為該指定語句成分對應(yīng)的序列分段的語義。
8.如權(quán)利要求6所述的裝置，其特征在于，還包括: 提取單元，用于在從多個語句結(jié)構(gòu)中，選擇語句成分?jǐn)?shù)量與所述分段數(shù)量相同的語句結(jié)構(gòu)之前，提取所述數(shù)字語音序列的表示語法類別的特征信息；第三確定單元，用于通過比較所述特征信息與多個語法類別的預(yù)設(shè)特征信息，確定所述數(shù)字語音序列的語法類別，其中，語法類別的預(yù)設(shè)特征信息為基于提取的多個已知屬于該語法類別的數(shù)字語音序列的表示語法類別的特征信息得到的；所述選擇單元，具體用于從所述數(shù)字語音序列的語法類別包括的多個語句結(jié)構(gòu)中，選擇語句成分?jǐn)?shù)量與所述分段數(shù)量相同的語句結(jié)構(gòu)。
9.如權(quán)利要求8所述的裝置，其特征在于，所述第三確定單元，具體用于比較所述特征信息與多個語法類別的預(yù)設(shè)特征信息的相似度；將所述多個語法類別中相似度最大的預(yù)設(shè)特征信息對應(yīng)的語法類別，確定為所述數(shù)字語音序列的語法類別。
10.如權(quán)利要求8或9所述的裝置，其特征在于，還包括: 執(zhí)行單元，用于按照所述數(shù)字語音序列的語法類別對應(yīng)的預(yù)設(shè)操作方式，執(zhí)行與所述數(shù)字語音序列的各指定語句成分對應(yīng)的序列分段的語義對應(yīng)的操作。
【專利摘要】本發(fā)明公開了一種語音語句識別方法及裝置，包括：對屬于多種預(yù)設(shè)特定句式之一的待識別語音語句信號進(jìn)行數(shù)字化預(yù)處理，得到數(shù)字語音序列；對數(shù)字語音序列進(jìn)行過零點(diǎn)檢測，得到數(shù)字語音序列包括的多個序列分段，以及多個序列分段的分段數(shù)量；從多個語句結(jié)構(gòu)中，選擇語句成分?jǐn)?shù)量與分段數(shù)量相同的語句結(jié)構(gòu)，作為數(shù)字語音序列的語句結(jié)構(gòu)；按照數(shù)字語音序列的語句結(jié)構(gòu)的語句成分組成，確定所述數(shù)字語音序列中各指定語句成分各自對應(yīng)的序列分段；分別針對數(shù)字語音序列中每個指定語句成分對應(yīng)的序列分段，通過比較該指定語句成分對應(yīng)的序列分段的特征參數(shù)與該指定語句成分對應(yīng)的模式庫中的各特征參數(shù)，確定該指定語句成分對應(yīng)的序列分段的語義。
【IPC分類】G10L15-08, G10L15-06, G10L25-51
【公開號】CN104751856
【申請?zhí)枴緾N201310753083
【發(fā)明人】王左彪, 王瑞鵬, 呂廣娜, 王紅梅, 劉越
【申請人】中國移動通信集團(tuán)公司
【公開日】2015年7月1日
【申請日】2013年12月31日

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第3頁1 2 3

相關(guān)技術(shù)