提供的方案,包括:對屬于多種預(yù)設(shè)特定句式之一的待識別語音語句信號進(jìn)行數(shù)字化預(yù)處理,得到數(shù)字語音序列;對數(shù)字語音序列進(jìn)行過零點(diǎn)檢測,得到數(shù)字語音序列包括的多個序列分段,以及多個序列分段的分段數(shù)量;從多個語句結(jié)構(gòu)中,選擇語句成分?jǐn)?shù)量與分段數(shù)量相同的語句結(jié)構(gòu),作為數(shù)字語音序列的語句結(jié)構(gòu);按照數(shù)字語音序列的語句結(jié)構(gòu)的語句成分組成,確定所述數(shù)字語音序列中各指定語句成分各自對應(yīng)的序列分段;分別針對數(shù)字語音序列中每個指定語句成分對應(yīng)的序列分段,通過比較該指定語句成分對應(yīng)的序列分段的特征參數(shù)與該指定語句成分對應(yīng)的模式庫中的各特征參數(shù),確定該指定語句成分對應(yīng)的序列分段的語義。采用本發(fā)明實(shí)施例提供的方法,相比現(xiàn)有技術(shù),減少了對待識別語音語句的識別時間,從而提高了語音語句的處理效率。
[0101]本申請的實(shí)施例所提供的語音語句識別裝置可通過計算機(jī)程序?qū)崿F(xiàn)。本領(lǐng)域技術(shù)人員應(yīng)該能夠理解,上述的模塊劃分方式僅是眾多模塊劃分方式中的一種,如果劃分為其他模塊或不劃分模塊,只要語音語句識別裝置具有上述功能,都應(yīng)該在本申請的保護(hù)范圍之內(nèi)。
[0102]本申請是參照根據(jù)本申請實(shí)施例的方法、設(shè)備(系統(tǒng))、和計算機(jī)程序產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計算機(jī)程序指令實(shí)現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合??商峁┻@些計算機(jī)程序指令到通用計算機(jī)、專用計算機(jī)、嵌入式處理機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個機(jī)器,使得通過計算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實(shí)現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。
[0103]這些計算機(jī)程序指令也可存儲在能引導(dǎo)計算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計算機(jī)可讀存儲器中,使得存儲在該計算機(jī)可讀存儲器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實(shí)現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。
[0104]這些計算機(jī)程序指令也可裝載到計算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計算機(jī)或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計算機(jī)實(shí)現(xiàn)的處理,從而在計算機(jī)或其他可編程設(shè)備上執(zhí)行的指令提供用于實(shí)現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。
[0105]顯然,本領(lǐng)域的技術(shù)人員可以對本發(fā)明進(jìn)行各種改動和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含這些改動和變型在內(nèi)。
【主權(quán)項】
1.一種語音語句識別方法,其特征在于,包括: 對屬于多種預(yù)設(shè)特定句式之一的待識別語音語句信號進(jìn)行數(shù)字化預(yù)處理,得到數(shù)字語音序列; 對所述數(shù)字語音序列進(jìn)行過零點(diǎn)檢測,得到所述數(shù)字語音序列包括的多個序列分段,以及所述多個序列分段的分段數(shù)量; 從多個語句結(jié)構(gòu)中,選擇語句成分?jǐn)?shù)量與所述分段數(shù)量相同的語句結(jié)構(gòu),作為所述數(shù)字語音序列的語句結(jié)構(gòu),其中,所述多個語句結(jié)構(gòu)的語句成分?jǐn)?shù)量不同; 按照所述數(shù)字語音序列的語句結(jié)構(gòu)的語句成分組成,確定所述數(shù)字語音序列中各指定語句成分各自對應(yīng)的序列分段; 分別針對所述數(shù)字語音序列中每個指定語句成分對應(yīng)的序列分段,通過比較該指定語句成分對應(yīng)的序列分段的特征參數(shù)與該指定語句成分對應(yīng)的模式庫中的各特征參數(shù),確定該指定語句成分對應(yīng)的序列分段的語義。
2.如權(quán)利要求1所述的方法,其特征在于,通過比較該指定語句成分對應(yīng)的序列分段的特征參數(shù)與該指定語句成分對應(yīng)的模式庫中的各特征參數(shù),確定該指定語句成分對應(yīng)的序列分段的語義,具體包括: 比較該指定語句成分對應(yīng)的序列分段的特征參數(shù)與該指定語句成分對應(yīng)的模式庫中的各特征參數(shù)的相似度; 將該指定語句成分對應(yīng)的模式庫中相似度最大的特征參數(shù)對應(yīng)的語義,確定為該指定語句成分對應(yīng)的序列分段的語義。
3.如權(quán)利要求1所述的方法,其特征在于,在從多個語句結(jié)構(gòu)中,選擇語句成分?jǐn)?shù)量與所述分段數(shù)量相同的語句結(jié)構(gòu)之前,還包括: 提取所述數(shù)字語音序列的表示語法類別的特征信息; 通過比較所述特征信息與多個語法類別的預(yù)設(shè)特征信息,確定所述數(shù)字語音序列的語法類別,其中,語法類別的預(yù)設(shè)特征信息為基于提取的多個已知屬于該語法類別的數(shù)字語音序列的表示語法類別的特征信息得到的; 從多個語句結(jié)構(gòu)中,選擇語句成分?jǐn)?shù)量與所述分段數(shù)量相同的語句結(jié)構(gòu),具體包括:從所述數(shù)字語音序列的語法類別包括的多個語句結(jié)構(gòu)中,選擇語句成分?jǐn)?shù)量與所述分段數(shù)量相同的語句結(jié)構(gòu)。
4.如權(quán)利要求3所述的方法,其特征在于,通過比較所述特征信息與多個語法類別的預(yù)設(shè)特征信息,確定所述數(shù)字語音序列的語法類別,具體包括: 比較所述特征信息與多個語法類別的預(yù)設(shè)特征信息的相似度; 將所述多個語法類別中相似度最大的預(yù)設(shè)特征信息對應(yīng)的語法類別,確定為所述數(shù)字語音序列的語法類別。
5.如權(quán)利要求3或4所述的方法,其特征在于,還包括: 按照所述數(shù)字語音序列的語法類別對應(yīng)的預(yù)設(shè)操作方式,執(zhí)行與所述數(shù)字語音序列的各指定語句成分對應(yīng)的序列分段的語義對應(yīng)的操作。
6.一種語音語句識別裝置,其特征在于,包括: 預(yù)處理單元,用于對屬于多種預(yù)設(shè)特定句式之一的待識別語音語句信號進(jìn)行數(shù)字化預(yù)處理,得到數(shù)字語音序列; 過零點(diǎn)檢測單元,用于對所述數(shù)字語音序列進(jìn)行過零點(diǎn)檢測,得到所述數(shù)字語音序列包括的多個序列分段,以及所述多個序列分段的分段數(shù)量; 選擇單元,用于從多個語句結(jié)構(gòu)中,選擇語句成分?jǐn)?shù)量與所述分段數(shù)量相同的語句結(jié)構(gòu),作為所述數(shù)字語音序列的語句結(jié)構(gòu),其中,所述多個語句結(jié)構(gòu)的語句成分?jǐn)?shù)量不同; 第一確定單元,用于按照所述數(shù)字語音序列的語句結(jié)構(gòu)的語句成分組成,確定所述數(shù)字語音序列中各指定語句成分各自對應(yīng)的序列分段; 第二確定單元,用于分別針對所述數(shù)字語音序列中每個指定語句成分對應(yīng)的序列分段,通過比較該指定語句成分對應(yīng)的序列分段的特征參數(shù)與該指定語句成分對應(yīng)的模式庫中的各特征參數(shù),確定該指定語句成分對應(yīng)的序列分段的語義。
7.如權(quán)利要求6所述的裝置,其特征在于,所述第二確定單元,具體用于比較該指定語句成分對應(yīng)的序列分段的特征參數(shù)與該指定語句成分對應(yīng)的模式庫中的各特征參數(shù)的相似度; 將該指定語句成分對應(yīng)的模式庫中相似度最大的特征參數(shù)對應(yīng)的語義,確定為該指定語句成分對應(yīng)的序列分段的語義。
8.如權(quán)利要求6所述的裝置,其特征在于,還包括: 提取單元,用于在從多個語句結(jié)構(gòu)中,選擇語句成分?jǐn)?shù)量與所述分段數(shù)量相同的語句結(jié)構(gòu)之前,提取所述數(shù)字語音序列的表示語法類別的特征信息; 第三確定單元,用于通過比較所述特征信息與多個語法類別的預(yù)設(shè)特征信息,確定所述數(shù)字語音序列的語法類別,其中,語法類別的預(yù)設(shè)特征信息為基于提取的多個已知屬于該語法類別的數(shù)字語音序列的表示語法類別的特征信息得到的; 所述選擇單元,具體用于從所述數(shù)字語音序列的語法類別包括的多個語句結(jié)構(gòu)中,選擇語句成分?jǐn)?shù)量與所述分段數(shù)量相同的語句結(jié)構(gòu)。
9.如權(quán)利要求8所述的裝置,其特征在于,所述第三確定單元,具體用于比較所述特征信息與多個語法類別的預(yù)設(shè)特征信息的相似度; 將所述多個語法類別中相似度最大的預(yù)設(shè)特征信息對應(yīng)的語法類別,確定為所述數(shù)字語音序列的語法類別。
10.如權(quán)利要求8或9所述的裝置,其特征在于,還包括: 執(zhí)行單元,用于按照所述數(shù)字語音序列的語法類別對應(yīng)的預(yù)設(shè)操作方式,執(zhí)行與所述數(shù)字語音序列的各指定語句成分對應(yīng)的序列分段的語義對應(yīng)的操作。
【專利摘要】本發(fā)明公開了一種語音語句識別方法及裝置,包括:對屬于多種預(yù)設(shè)特定句式之一的待識別語音語句信號進(jìn)行數(shù)字化預(yù)處理,得到數(shù)字語音序列;對數(shù)字語音序列進(jìn)行過零點(diǎn)檢測,得到數(shù)字語音序列包括的多個序列分段,以及多個序列分段的分段數(shù)量;從多個語句結(jié)構(gòu)中,選擇語句成分?jǐn)?shù)量與分段數(shù)量相同的語句結(jié)構(gòu),作為數(shù)字語音序列的語句結(jié)構(gòu);按照數(shù)字語音序列的語句結(jié)構(gòu)的語句成分組成,確定所述數(shù)字語音序列中各指定語句成分各自對應(yīng)的序列分段;分別針對數(shù)字語音序列中每個指定語句成分對應(yīng)的序列分段,通過比較該指定語句成分對應(yīng)的序列分段的特征參數(shù)與該指定語句成分對應(yīng)的模式庫中的各特征參數(shù),確定該指定語句成分對應(yīng)的序列分段的語義。
【IPC分類】G10L15-08, G10L15-06, G10L25-51
【公開號】CN104751856
【申請?zhí)枴緾N201310753083
【發(fā)明人】王左彪, 王瑞鵬, 呂廣娜, 王紅梅, 劉越
【申請人】中國移動通信集團(tuán)公司
【公開日】2015年7月1日
【申請日】2013年12月31日