語(yǔ)音關(guān)鍵詞檢出系統(tǒng)、創(chuàng)建用于其的詞典的系統(tǒng)和方法

文檔序號(hào)：6429797閱讀：216來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專(zhuān)利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

專(zhuān)利名稱(chēng)：語(yǔ)音關(guān)鍵詞檢出系統(tǒng)、創(chuàng)建用于其的詞典的系統(tǒng)和方法
技術(shù)領(lǐng)域：
本發(fā)明涉及語(yǔ)音關(guān)鍵詞檢出(spotting)系統(tǒng)，以及創(chuàng)建用于該語(yǔ)音關(guān)鍵詞檢出系統(tǒng)的詞典的系統(tǒng)和方法。
背景技術(shù)：
語(yǔ)音關(guān)鍵詞檢出技術(shù)旨在檢測(cè)并且識(shí)別連續(xù)的或者分割的輸入語(yǔ)音中的預(yù)定義語(yǔ)音關(guān)鍵詞。語(yǔ)音關(guān)鍵詞檢出技術(shù)被用于幾乎所有語(yǔ)音識(shí)別應(yīng)用中，如呼叫中心系統(tǒng)、語(yǔ)音郵件分類(lèi)和按內(nèi)容搜索。在實(shí)際的語(yǔ)音關(guān)鍵詞檢出應(yīng)用中，輸入語(yǔ)音的大多數(shù)部分不包括關(guān)鍵詞。這些部分稱(chēng)為集外詞(Out-Of-Vocabulary，00V)段(即，非關(guān)鍵詞)。如果OOV段被錯(cuò)誤地識(shí)別為關(guān)鍵詞，則這被稱(chēng)為誤警(false alarm, FA) 0高誤警率會(huì)引起不良的用戶體驗(yàn)。一般而言，丟棄OOV數(shù)據(jù)的方法之一是除了建立關(guān)鍵詞模型之外，還建立用于OOV數(shù)據(jù)的適當(dāng)?shù)睦Ｐ?garbage model),以區(qū)分關(guān)鍵詞和非關(guān)鍵詞。通常，關(guān)鍵詞的數(shù)量是有限的。建立對(duì)于每個(gè)關(guān)鍵詞的準(zhǔn)確模型是相對(duì)容易的。而建立準(zhǔn)確的垃圾模型是非常困難的，這是因?yàn)榇嬖谔囝?lèi)型的00V數(shù)據(jù)。例如，關(guān)于00V數(shù)據(jù)，有靜音數(shù)據(jù)、語(yǔ)音數(shù)據(jù)和不同類(lèi)型的噪聲等。建立垃圾模型的通用方法如下。(I)采用一個(gè)或更多個(gè)通用垃圾模型。例如，美國(guó)專(zhuān)利申請(qǐng)No. 20030200090 和 No. 20050256712 以及 Jay G. Wilpon 等人的 “Automatic Recognition of Keywords in Unconstrained Speech Using HiddenMarkov Models”，IEEE Trans on Assp, Vol. 38, No. 11, November, 1990,第 1870-1878 頁(yè)描述了通過(guò)利用所有語(yǔ)音數(shù)據(jù)(具有或不具有關(guān)鍵詞樣本)和各種噪聲來(lái)建立一個(gè)通用垃圾模型的各種方式。H. BourlarcUB. D' hoore 和 JM Boite,“optimizing recognition andrejection performance in word spotting systems，，，Proc. ICASSP 94,第 373-376 頁(yè)描述了通過(guò)聚類(lèi)的上下文無(wú)關(guān)的音子數(shù)據(jù)來(lái)建立若干個(gè)通用垃圾模型。這種方法易于操作并且對(duì)于提高通用語(yǔ)音關(guān)鍵詞檢出系統(tǒng)的性能是有效的。但是，這樣的通用垃圾模型是關(guān)鍵詞無(wú)關(guān)的。其不能在考慮特定關(guān)鍵詞的情況下良好地代表所有非關(guān)鍵詞的特性。具有與關(guān)鍵詞相似發(fā)音的00V詞傾向于被識(shí)別為關(guān)鍵詞，因而導(dǎo)致大量的誤警。(2)采用關(guān)鍵詞相關(guān)的垃圾模型。建立與特定關(guān)鍵詞相關(guān)的垃圾模型將降低上述的誤警。例如，在美國(guó)專(zhuān)利No. 5895448 和 No. 6223155，以及 J. Rohlicek, ff. Russel、S. Rouko 和 H. Gish, “Continuoushidden Markov modeling for speaker independent word spotting”， in Proc, Int.Conf. Acoustics, Speech, and Signal Processing, 1989,第 627-630 頁(yè)和 Makoto Yamada>Tsuneo Kato、Masaki Naito和Hisashi Kawai,^Improvement of Rejection Performanceof Speech keyword spotting Using Anti-Keywords Derived from Large Vocabulary，，，in INTERSPEECH2005, September, 4-8, Lisbon, Portugal,第 1445-1448 頁(yè)中，提出了建立用于關(guān)鍵詞的垃圾模型的各種方式。這種方法良好地區(qū)分特定關(guān)鍵詞和OOV詞。但是，因?yàn)橐粋€(gè)關(guān)鍵詞具有至少一個(gè)垃圾模型，因此在識(shí)別時(shí)將使用許多垃圾模型，這引起語(yǔ)音關(guān)鍵詞檢出系統(tǒng)的重的計(jì)算和存儲(chǔ)負(fù)荷。另一個(gè)缺點(diǎn)是一旦改變或增加關(guān)鍵詞，用于其的垃圾模型應(yīng)當(dāng)被重新建立和訓(xùn)練。如何在使計(jì)算和存儲(chǔ)負(fù)荷保持低的同時(shí)有效地減小語(yǔ)音關(guān)鍵詞檢出的誤警率是語(yǔ)音關(guān)鍵詞檢出技術(shù)的挑戰(zhàn)。

發(fā)明內(nèi)容
本發(fā)明的目的是提供一種使用關(guān)鍵詞相關(guān)的垃圾I旲型的聞度可罪的語(yǔ)首關(guān)鍵詞檢出系統(tǒng)，其能夠在不引起重的計(jì)算和存儲(chǔ)負(fù)荷的情況下提高垃圾模型的區(qū)分能力。根據(jù)本發(fā)明的一個(gè)方面，提供了一種語(yǔ)音關(guān)鍵詞檢出系統(tǒng)。其包括輸入單元，用于接收輸入語(yǔ)音信號(hào)；特征提取單元，用于從輸入語(yǔ)音信號(hào)提取至少一個(gè)特征；分類(lèi)器單元，用于基于所述至少一個(gè)特征和詞典將輸入語(yǔ)音信號(hào)分類(lèi)為目標(biāo)關(guān)鍵詞或者集外詞；和輸出單元，用于輸出分類(lèi)的結(jié)果。所述詞典包括語(yǔ)法(gra_ar)，該語(yǔ)法包括目標(biāo)關(guān)鍵詞列表和用于集外詞的兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列；和詞庫(kù)(lexicon)，該詞庫(kù)包括代表目標(biāo)關(guān)鍵詞列表中的一個(gè)或更多個(gè)目標(biāo)關(guān)鍵詞的音子序列的所有候選關(guān)鍵詞的發(fā)音以及代表用于集外詞的所述兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列的發(fā)音，所述兩個(gè)標(biāo)識(shí)符中的一個(gè)標(biāo)識(shí)符表不第一類(lèi)音子，另一個(gè)標(biāo)識(shí)符表不第二類(lèi)音子。第一類(lèi)音子和第二類(lèi)音子是基于音子的固有特征而聚類(lèi)的。第一類(lèi)音子、第二類(lèi)音子和用于一個(gè)或更多個(gè)目標(biāo)關(guān)鍵詞的音子分別由它們的模型描述。根據(jù)本發(fā)明的另一方面，提供一種創(chuàng)建用于語(yǔ)音關(guān)鍵詞檢出系統(tǒng)的詞典的系統(tǒng)。所述詞典包括具有目標(biāo)關(guān)鍵詞列表的語(yǔ)法；和詞庫(kù)，該詞庫(kù)包括代表目標(biāo)關(guān)鍵詞列表中的一個(gè)或更多個(gè)目標(biāo)關(guān)鍵詞的音子序列的所有候選關(guān)鍵詞的發(fā)音。所述系統(tǒng)包括用于基于音子的固有特征將語(yǔ)音數(shù)據(jù)聚類(lèi)為第一類(lèi)音子和第二類(lèi)音子的單元；用于依賴(lài)于目標(biāo)關(guān)鍵詞列表中的目標(biāo)關(guān)鍵詞的音子序列，生成用于集外詞的兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列的單元，所述兩個(gè)標(biāo)識(shí)符中的一個(gè)標(biāo)識(shí)符表示第一類(lèi)音子，另一個(gè)標(biāo)識(shí)符表示第二類(lèi)音子；和用于將所述兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列添加到語(yǔ)法中的單元。所述詞庫(kù)還包括代表用于集外詞的所述兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列的發(fā)音。第一類(lèi)音子、第二類(lèi)音子和用于一個(gè)或更多個(gè)目標(biāo)關(guān)鍵詞的音子分別由它們的模型描述。根據(jù)本發(fā)明的又一方面，提供一種創(chuàng)建用于語(yǔ)音關(guān)鍵詞檢出系統(tǒng)的詞典的方法。所述詞典包括具有目標(biāo)關(guān)鍵詞列表的語(yǔ)法；和詞庫(kù)，該詞庫(kù)包括代表目標(biāo)關(guān)鍵詞列表中的一個(gè)或更多個(gè)目標(biāo)關(guān)鍵詞的音子序列的所有候選關(guān)鍵詞的發(fā)音。所述方法包括以下步驟基于音子的固有特征將語(yǔ)音數(shù)據(jù)聚類(lèi)為第一類(lèi)音子和第二類(lèi)音子；依賴(lài)于目標(biāo)關(guān)鍵詞列表中的目標(biāo)關(guān)鍵詞的音子序列，生成用于集外詞的兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列，所述兩個(gè)標(biāo)識(shí)符中的一個(gè)標(biāo)識(shí)符表示第一類(lèi)音子，另一個(gè)標(biāo)識(shí)符表示第二類(lèi)音子；和將所述兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列添加到語(yǔ)法中。所述詞庫(kù)還包括代表用于集外詞的所述兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列的發(fā)音。第一類(lèi)音子、第二類(lèi)音子和用于一個(gè)或更多個(gè)目標(biāo)關(guān)鍵詞的音子分別由它們的模型描述。
根據(jù)本發(fā)明中的語(yǔ)音關(guān)鍵詞檢出系統(tǒng)以及創(chuàng)建用于該語(yǔ)音關(guān)鍵詞檢出系統(tǒng)的詞典的方法和系統(tǒng)，訓(xùn)練數(shù)據(jù)被在音子級(jí)別聚類(lèi)為兩類(lèi)第一類(lèi)音子和第二類(lèi)音子。利用訓(xùn)練庫(kù)中的屬于第一類(lèi)音子的音子，訓(xùn)練第一類(lèi)音子的模型，該訓(xùn)練庫(kù)包括用于訓(xùn)練模型的所有訓(xùn)練語(yǔ)音數(shù)據(jù)。利用訓(xùn)練庫(kù)中的屬于第二類(lèi)音子的音子，訓(xùn)練第二類(lèi)音子的模型。第一類(lèi)音子和第二類(lèi)音子例如分別為輔音和元音。依賴(lài)于與目標(biāo)關(guān)鍵詞相關(guān)地生成兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列，所述兩個(gè)標(biāo)識(shí)符分別表示第一類(lèi)音子和第二類(lèi)音子。在語(yǔ)音關(guān)鍵詞檢出時(shí)，通過(guò)語(yǔ)音關(guān)鍵詞檢出系統(tǒng)使用兩個(gè)標(biāo)識(shí)符的序列來(lái)連結(jié)(concatenate)第一類(lèi)音子的模型和第二類(lèi)音子的模型，以創(chuàng)建垃圾模型。由于用于創(chuàng)建垃圾模型的所述兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列是依賴(lài)于目標(biāo)關(guān)鍵字生成的，所以誤警率的改進(jìn)更為優(yōu)于使用一個(gè)或更多個(gè)通用垃圾模型的系統(tǒng)。此外，由于僅建立了兩個(gè)模型，即，第一類(lèi)音子的模型和第二類(lèi)音子的模型，所以，與使用關(guān)鍵詞相關(guān)的許多垃圾模型的常規(guī)語(yǔ)音關(guān)鍵詞檢出系統(tǒng)相比，計(jì)算和存儲(chǔ)負(fù)荷顯著降低。此外，當(dāng)改變或添加目標(biāo)關(guān)鍵詞時(shí)，只需要改變或重新生成所述兩個(gè)標(biāo)識(shí)符的序列，而無(wú)需建立新的模型。而在使用關(guān)鍵詞相關(guān)的許多垃圾模型的常規(guī)語(yǔ)音關(guān)鍵詞檢出系統(tǒng)中，一旦改變或添加目標(biāo)關(guān)鍵詞，必需重新建立與該新的目標(biāo)關(guān)鍵詞相關(guān)的垃圾模型。根據(jù)以下參照附圖對(duì)示例性實(shí)施例的描述，本發(fā)明的其它特征將變得明顯。

圖I是常規(guī)語(yǔ)音關(guān)鍵詞檢出系統(tǒng)的方框圖。圖2是根據(jù)本發(fā)明的語(yǔ)音關(guān)鍵詞檢出系統(tǒng)的方框圖。圖3是創(chuàng)建用于本發(fā)明的語(yǔ)音關(guān)鍵詞檢出系統(tǒng)的詞典的系統(tǒng)的方框圖。圖4是創(chuàng)建用于本發(fā)明的語(yǔ)音關(guān)鍵詞檢出系統(tǒng)的詞典的流程圖。圖5是訓(xùn)練輔音模型和元音模型的流程圖。圖6是根據(jù)本發(fā)明第一實(shí)施例的創(chuàng)建詞典的流程圖，該詞典包括與目標(biāo)關(guān)鍵詞列表中的所有目標(biāo)關(guān)鍵詞相關(guān)的OOV詞的CV序列。圖7是根據(jù)本發(fā)明第一實(shí)施例的生成與一個(gè)目標(biāo)關(guān)鍵詞相關(guān)的OOV詞的CV序列的流程圖。圖8是生成長(zhǎng)度在最小長(zhǎng)度和最大長(zhǎng)度之間的所有CV序列的流程圖。圖9是確定目標(biāo)關(guān)鍵詞KWi的誤警樣本的流程圖。圖10是根據(jù)本發(fā)明第二實(shí)施例的創(chuàng)建詞典的流程圖，該詞典包括與目標(biāo)關(guān)鍵詞列表中的所有目標(biāo)關(guān)鍵詞相關(guān)的OOV詞的CV序列。圖11是根據(jù)本發(fā)明第二實(shí)施例的生成與一個(gè)目標(biāo)關(guān)鍵詞相關(guān)的OOV詞的CV序列的流程圖。圖12是示出能夠?qū)崿F(xiàn)本發(fā)明的實(shí)施例的計(jì)算機(jī)系統(tǒng)的硬件配置的方框圖。圖13是示出常規(guī)語(yǔ)音關(guān)鍵詞檢出系統(tǒng)和根據(jù)本發(fā)明的語(yǔ)音關(guān)鍵詞檢出系統(tǒng)之間的比較的圖表。
具體實(shí)施例方式現(xiàn)在將按照附圖詳細(xì)描述本發(fā)明的優(yōu)選實(shí)施例。注意，實(shí)施例中的部件的相對(duì)布置以及設(shè)備的形狀僅是作為示例，并不旨在將本發(fā)明的范圍限制于這些示例。此外，在圖中，類(lèi)似的附圖標(biāo)記和字母指代類(lèi)似的項(xiàng)，由此，一旦在一個(gè)圖中定義了一項(xiàng)，無(wú)需對(duì)于隨后的圖討論該項(xiàng)。(常規(guī)語(yǔ)音關(guān)鍵詞檢出系統(tǒng))圖I是常規(guī)語(yǔ)音關(guān)鍵詞檢出系統(tǒng)IA的方框圖。在圖I中，使用關(guān)鍵詞無(wú)關(guān)的通用垃圾模型的語(yǔ)音關(guān)鍵詞檢出系統(tǒng)IA包括語(yǔ)音輸入單元101、特征提取單元102、分類(lèi)器單元103、輸出單元104、聲學(xué)模型單元105和詞典單元 106。語(yǔ)音輸入單元101用于接收并處理(例如，預(yù)濾波、采樣、量化、加窗和預(yù)加權(quán)等)輸入語(yǔ)音信號(hào)，該輸入語(yǔ)音信號(hào)通常是一系列聲學(xué)波形。經(jīng)處理的信號(hào)被輸入特征提取單元102，該特征提取單元102從經(jīng)處理的信號(hào)提取特征并且獲取波譜表示。通常使用的波譜表不是 MFCC (梅爾倒譜系數(shù)，mel frequency cepstral coefficients), MFCC 提供輸入語(yǔ)音信號(hào)的每幀的特征矢量。MFCC矢量被輸入分類(lèi)器單元103，分類(lèi)器單元103識(shí)別輸入語(yǔ)音段的幀是目標(biāo)關(guān)鍵詞還是OOV詞。隨后，表示輸入語(yǔ)音信號(hào)是目標(biāo)關(guān)鍵詞還是OOV詞的識(shí)別結(jié)果被發(fā)送到輸出單元104，輸出單元104輸出該識(shí)別結(jié)果。在分類(lèi)器單元103的識(shí)別(分類(lèi))期間，詞典單元106和聲學(xué)模型單元105提供對(duì)于分類(lèi)器單兀103的輸入。具體地，常規(guī)的詞典單元106包括詞庫(kù)和語(yǔ)法，在詞庫(kù)中，代表一個(gè)或更多個(gè)目標(biāo)關(guān)鍵詞的音子序列(例如，代表目標(biāo)關(guān)鍵詞“Stop”的音子序列“S T AA P”)的所有候選關(guān)鍵詞的發(fā)音以及代表通用垃圾的序列的發(fā)音被提供，并且在語(yǔ)法中，目標(biāo)關(guān)鍵詞列表和通用垃圾的序列被提供。聲學(xué)模型單元105包括用于構(gòu)成目標(biāo)關(guān)鍵詞的音子的模型(例如，音子“S”的模型、音子“T”的模型、音子“AA”的模型、和音子“P”的模型)，以及用于通用垃圾的音子模型。當(dāng)本申請(qǐng)中提到模型時(shí)，其通常是隱馬爾可夫模型(Hidden Markov model,HMM)。關(guān)于HMM及其在語(yǔ)音識(shí)別系統(tǒng)中的應(yīng)用，可以參照清華大學(xué)出版社的“現(xiàn)代語(yǔ)音技術(shù)基礎(chǔ)和應(yīng)用”。在圖I中的常規(guī)語(yǔ)音關(guān)鍵詞檢出系統(tǒng)IA中，分類(lèi)器單元103按照詞典單元106中的關(guān)鍵詞列表中的目標(biāo)關(guān)鍵詞的音子序列，連結(jié)聲學(xué)模型單兀105中的對(duì)應(yīng)的音子模型，以建立目標(biāo)關(guān)鍵詞的模型(即，目標(biāo)關(guān)鍵詞模型)。此外，分類(lèi)器單元103還按照詞典單元106中的通用垃圾的序列連結(jié)聲學(xué)模型單元105中的用于通用垃圾的音子模型，以建立通用垃圾模型。使用這些目標(biāo)關(guān)鍵詞模型和通用垃圾模型，分類(lèi)器單元103將輸入語(yǔ)音信號(hào)分類(lèi)為目標(biāo)關(guān)鍵詞或OOV詞。具體地，對(duì)于輸入語(yǔ)音信號(hào)而言，如果目標(biāo)關(guān)鍵詞的概率是最高概率，則分類(lèi)器單元103將輸入語(yǔ)音信號(hào)分類(lèi)為目標(biāo)關(guān)鍵詞，如果OOV詞的概率是最高概率，則將輸入語(yǔ)音信號(hào)分類(lèi)為OOV詞。對(duì)于輸入語(yǔ)音信號(hào)而言的目標(biāo)關(guān)鍵詞的概率指的是目標(biāo)關(guān)鍵詞模型與輸入語(yǔ)音信號(hào)之間的相似度。類(lèi)似地，對(duì)于輸入語(yǔ)音信號(hào)而言的OOV詞的概率指的是OOV詞的通用垃圾模型與輸入語(yǔ)音信號(hào)之間的相似度。如上所述，由于通用垃圾模型是特定關(guān)鍵詞無(wú)關(guān)的，所以這樣的分類(lèi)具有高誤警率。(根據(jù)本發(fā)明的輔音模型和元音模型)
在本發(fā)明中，為了建立關(guān)鍵詞相關(guān)的垃圾模型，按照音子的固有特征將訓(xùn)練數(shù)據(jù)在音子級(jí)別聚類(lèi)為兩類(lèi)輔音(第一類(lèi)音子)和元音(第二類(lèi)音子)。輔音是利用聲道的完全或部分閉合來(lái)發(fā)聲的語(yǔ)音聲音。例子有[P]是以嘴唇來(lái)發(fā)音；[t]是以舌頭的前部來(lái)發(fā)音；[k]是以舌頭的后部來(lái)發(fā)音；[h]是在喉部中發(fā)音；[f]和[s]是使空氣流過(guò)狹窄的通道(摩擦)來(lái)發(fā)音；并且[m]和[η]是使空氣流過(guò)鼻子來(lái)發(fā)音(鼻音)。元音是利用開(kāi)放的聲道來(lái)發(fā)聲的語(yǔ)音聲音，例如英語(yǔ)的ah ! [a:]，其以聲道的振動(dòng)來(lái)發(fā)音。這與輔音的不同在于在沿著聲道的某一點(diǎn)處存在限制或閉合。也可以基于音子的各種固有特征按照任何其它方式對(duì)音子聚類(lèi)?；谏厦娴木垲?lèi)，建立并且訓(xùn)練輔音模型和元音模型。圖5是訓(xùn)練輔音模型和元音模型的流程圖。如圖5所示，利用訓(xùn)練庫(kù)中的輔音的音子樣本對(duì)輔音模型進(jìn)行訓(xùn)練，并且利用訓(xùn)練庫(kù)中的元音的音子樣本對(duì)元音模型進(jìn)行訓(xùn)練。在訓(xùn)練之后，分別對(duì)于輔音和元音建立HMM模型。對(duì)于輔音模型和元音模型中的每一個(gè)，獲得轉(zhuǎn)移概率矩陣A = a01a02. . . anl. . . am，每個(gè)au代表每個(gè)子音子(一個(gè)音子由多個(gè)子音子構(gòu)成)自循環(huán)或變?yōu)橄乱蛔右糇拥母怕?。獲得觀察值的似然度矩陣B = h (Ot)，bi(ot)表示從一個(gè)子音子生成的在幀t處的波譜特征矢量的概率。(根據(jù)本發(fā)明的語(yǔ)音關(guān)鍵詞檢出系統(tǒng))圖2是本發(fā)明的語(yǔ)音關(guān)鍵詞檢出系統(tǒng)IB的方框圖。語(yǔ)音關(guān)鍵詞檢出系統(tǒng)IB與常規(guī)語(yǔ)音關(guān)鍵詞檢出系統(tǒng)IA的一個(gè)不同在于，除了用于目標(biāo)關(guān)鍵詞的音子模型和用于通用垃圾的音子模型以外，本發(fā)明的聲學(xué)模型單元105A包括上述輔音模型(第一類(lèi)模型)和元音模型(第二類(lèi)模型)。另一個(gè)不同在于在詞典單元106A中，在語(yǔ)法中包括用于OOV詞的至少一個(gè)CV序列(兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列)。CV序列中的C代表輔音(第一類(lèi)音子)，CV序列中的V代表元音(第二類(lèi)音子)。CV序列是依賴(lài)于目標(biāo)關(guān)鍵詞及其誤警樣本生成的。詞庫(kù)進(jìn)一步包括代表用于集外(OOV)詞的至少一個(gè)CV序列的發(fā)音。除了按照目標(biāo)關(guān)鍵詞的音子序列連結(jié)目標(biāo)關(guān)鍵詞的音子模型(即，建立目標(biāo)關(guān)鍵詞模型)之外，分類(lèi)器單元103按照詞典單元106A中的用于OOV詞的CV序列連結(jié)聲學(xué)模型單元105A中的輔音模型和元音模型。在以下描述中，將通過(guò)按照CV序列連結(jié)輔音模型和元音模型生成的模型稱(chēng)為CV垃圾模型。分類(lèi)器單元103將輸入語(yǔ)音信號(hào)分類(lèi)為目標(biāo)關(guān)鍵詞或者OOV詞(S卩，非關(guān)鍵詞)。具體地，如果目標(biāo)關(guān)鍵詞的概率是最高概率，則分類(lèi)器單元103將輸入語(yǔ)音信號(hào)分類(lèi)為目標(biāo)關(guān)鍵詞，如果CV序列的概率或者非關(guān)鍵詞的概率是最高概率，則將輸入語(yǔ)音信號(hào)分類(lèi)為OOV詞。注意，根據(jù)本發(fā)明的語(yǔ)音關(guān)鍵詞檢出系統(tǒng)IB可以包括如圖I所示的用于通用垃圾的音子模型，通用垃圾的序列以及代表通用垃圾的序列的發(fā)音。但是，本發(fā)明可以在沒(méi)有該部件的情況下實(shí)現(xiàn)。在語(yǔ)音關(guān)鍵詞檢出系統(tǒng)IB的語(yǔ)法中，由于CV序列是基于特定目標(biāo)關(guān)鍵詞及其誤警樣本生成的，所以具有與目標(biāo)關(guān)鍵詞類(lèi)似的發(fā)音的OOV詞能夠被識(shí)別為非關(guān)鍵詞。由此，與使用關(guān)鍵詞無(wú)關(guān)的通用垃圾模型的常規(guī)語(yǔ)音關(guān)鍵詞檢出系統(tǒng)IA相比，能夠顯著地降低
誤警率。此外，與使用關(guān)鍵詞相關(guān)的許多單獨(dú)的垃圾模型的常規(guī)語(yǔ)音關(guān)鍵詞檢出系統(tǒng)相t匕，由于只建立了兩個(gè)模型，即，第一類(lèi)模型(輔音模型)和第二類(lèi)模型(元音模型)，所以計(jì)算和存儲(chǔ)負(fù)荷顯著降低。此外，在使用關(guān)鍵詞相關(guān)的許多單獨(dú)的垃圾模型的常規(guī)語(yǔ)音關(guān)鍵詞檢出系統(tǒng)中，一旦改變或添加目標(biāo)關(guān)鍵詞，用于關(guān)鍵詞的垃圾模型必須被重新建立。然而，在本發(fā)明中，當(dāng)改變或添加目標(biāo)關(guān)鍵詞時(shí)，只需要生成新的CV序列，而無(wú)需建立任何新的模型。注意，上述單元和以下要描述的單元是用于實(shí)施以下要描述的過(guò)程的示例性的和/或優(yōu)選的模塊。這些單元可以是硬件單元(諸如場(chǎng)可編程門(mén)陣列、數(shù)字信號(hào)處理器或?qū)Ｓ眉呻娐返?和/或軟件模塊(諸如計(jì)算機(jī)可讀程序)。以上并未詳盡地描述用于實(shí)現(xiàn)各個(gè)步驟的單元。然而，只要有執(zhí) 行某個(gè)處理的步驟，就可以有用于實(shí)現(xiàn)同一處理的對(duì)應(yīng)的功能模塊或單元(由硬件和/或軟件實(shí)施)。通過(guò)以下描述的步驟以及與這些步驟對(duì)應(yīng)的單元的所有組合限定的技術(shù)方案都包括在本申請(qǐng)的公開(kāi)內(nèi)容中，只要它們構(gòu)成的這些技術(shù)方案是完整并且可應(yīng)用的。此外，由各種單元構(gòu)成的以上系統(tǒng)可以作為功能模塊被并入到諸如計(jì)算機(jī)之類(lèi)的硬件裝置中。除了這些功能模塊之外，計(jì)算機(jī)當(dāng)然可以具有其他硬件或者軟件部件。(創(chuàng)建用于語(yǔ)音關(guān)鍵詞檢出系統(tǒng)的詞典的系統(tǒng))圖3是創(chuàng)建用于本發(fā)明的語(yǔ)音關(guān)鍵詞檢出系統(tǒng)的詞典的系統(tǒng)的方框圖。創(chuàng)建用于語(yǔ)音關(guān)鍵詞檢出系統(tǒng)的詞典的系統(tǒng)200包括聚類(lèi)單元201，用于基于語(yǔ)音數(shù)據(jù)的固有特征將語(yǔ)音數(shù)據(jù)聚類(lèi)為輔音和元音；CV序列生成單元202，用于依賴(lài)于目標(biāo)關(guān)鍵詞列表中的目標(biāo)關(guān)鍵詞的音子序列生成用于集外詞的至少一個(gè)CV序列，C代表輔音,V代表元音；和用于將所述至少一個(gè)CV序列添加到詞典中的單元203。該系統(tǒng)200能夠?qū)崿F(xiàn)創(chuàng)建用于語(yǔ)音關(guān)鍵詞檢出系統(tǒng)的詞典的下述方法。創(chuàng)建用于語(yǔ)音關(guān)鍵詞檢出系統(tǒng)的詞典的系統(tǒng)200可以是孤立的形式，或者被并入本發(fā)明的語(yǔ)音關(guān)鍵詞檢出系統(tǒng)IB中的分類(lèi)器單元103中。(創(chuàng)建用于語(yǔ)音關(guān)鍵詞檢出系統(tǒng)的詞典的方法)圖4示出創(chuàng)建用于本發(fā)明的語(yǔ)音關(guān)鍵詞檢出系統(tǒng)的詞典的流程圖。在圖4所示的方法中，首先基于語(yǔ)音數(shù)據(jù)的固有特征將語(yǔ)音數(shù)據(jù)聚類(lèi)為輔音和元音(S301)。然后，依賴(lài)于目標(biāo)關(guān)鍵詞列表中的目標(biāo)關(guān)鍵詞的音子序列，生成集外詞的至少一個(gè)CV序列(S302)。C代表輔音，V代表元音。然后，將所述至少一個(gè)CV序列添加到詞典中(S303)。在創(chuàng)建用于語(yǔ)音關(guān)鍵詞檢出系統(tǒng)的詞典的系統(tǒng)200中實(shí)現(xiàn)創(chuàng)建用于語(yǔ)音關(guān)鍵詞檢出系統(tǒng)的詞典的方法。下面是創(chuàng)建詞典的方法的細(xì)節(jié)。(根據(jù)本發(fā)明的第一實(shí)施例的創(chuàng)建包括代表目標(biāo)關(guān)鍵詞相關(guān)的OOV詞的CV序列的詞典)圖6是根據(jù)本發(fā)明的第一實(shí)施例的創(chuàng)建包括與目標(biāo)關(guān)鍵詞列表中的所有目標(biāo)關(guān)鍵詞相關(guān)的OOV詞的CV序列的詞典的流程圖。CV序列的生成是基于目標(biāo)關(guān)鍵詞及其誤警樣本創(chuàng)建詞典的主要過(guò)程。對(duì)于目標(biāo)關(guān)鍵詞列表中的所有目標(biāo)關(guān)鍵詞執(zhí)行該生成過(guò)程。在如圖3所示的系統(tǒng)200和/或如圖2所示的分類(lèi)器單元103中執(zhí)行CV序列的生成。例如，在下面的描述中，CV序列的生成在分類(lèi)器單元103中執(zhí)行。首先，獲得目標(biāo)關(guān)鍵詞列表中的一個(gè)目標(biāo)關(guān)鍵詞(S401)。如果獲得的目標(biāo)關(guān)鍵詞不為空(S402中的“是”)，則分類(lèi)器單元103基于該目標(biāo)關(guān)鍵詞及其輸入的誤警樣本生成用于該目標(biāo)關(guān)鍵詞的OOV詞的至少一個(gè)CV序列(S403)。隨后將描述基于一個(gè)目標(biāo)關(guān)鍵詞及其輸入的誤警樣本生成該目標(biāo)關(guān)鍵詞的OOV詞的至少一個(gè)CV序列(S403)的細(xì)節(jié)。在S403中生成CV序列之后，將生成的CV序列存儲(chǔ)在緩沖器(未示出)中(S404)。然后，流程圖返回到S401以獲得目標(biāo)關(guān)鍵詞列表中的下一個(gè)目標(biāo)關(guān)鍵詞，并且如果S402中的確定為“是”，則重復(fù)步驟S403到S404。如果在S401中獲得的目標(biāo)關(guān)鍵詞為空(S402中為“否”)，這意味著目標(biāo)關(guān)鍵詞列表中的所有目標(biāo)關(guān)鍵詞已被處理，并且再?zèng)]有目標(biāo)關(guān)鍵詞需要被處理。然后，分類(lèi)器單元103收集在緩沖器中的所有生成的CV序列，并且刪除重復(fù)的CV序列(S405)。例如，如果用于目標(biāo)關(guān)鍵詞KW1的生成的CV序列是“CVCV”、“VCCV”和“CVC”，并且用于目標(biāo)關(guān)鍵詞KW2·的生成的CV序列是“CVVC”、“CVC”和“VCV”，那么在收集和刪除之后的用于目標(biāo)關(guān)鍵詞KW1和目標(biāo)關(guān)鍵詞KW2兩者的CV序列是“CVCV”，“VCCV”，“CVC” “CVVC”和“VCV”，刪除了一個(gè)重復(fù)的序列“CVC”。所得的CV序列被添加到詞典單元106A中的語(yǔ)法中(S406)。然后，該過(guò)程結(jié)束。(根據(jù)第一實(shí)施例的生成代表一個(gè)目標(biāo)關(guān)鍵詞KWi的OOV詞的CV序列)現(xiàn)在將參照?qǐng)D7描述基于一個(gè)目標(biāo)關(guān)鍵詞及其輸入的誤警樣本生成至少一個(gè)CV序列(S403)的細(xì)節(jié)。圖7是根據(jù)本發(fā)明的第一實(shí)施例的生成與一個(gè)目標(biāo)關(guān)鍵詞KWi相關(guān)的OOV詞的CV序列的流程圖。首先，目標(biāo)關(guān)鍵詞KWi被輸入如圖2所示的分類(lèi)器單元103中(S501)。然后，對(duì)于目標(biāo)關(guān)鍵詞KWi創(chuàng)建臨時(shí)語(yǔ)法(S502)。對(duì)于目標(biāo)關(guān)鍵詞KWi的臨時(shí)語(yǔ)法包括目標(biāo)關(guān)鍵詞KWi本身以及長(zhǎng)度等于或大于最小長(zhǎng)度并且等于或小于最大長(zhǎng)度的所有可能CV序列。最小長(zhǎng)度和最大長(zhǎng)度是預(yù)定義的。為了找出目標(biāo)關(guān)鍵詞KWi的OOV詞的CV序列而創(chuàng)建臨時(shí)語(yǔ)法。長(zhǎng)度等于或大于最小長(zhǎng)度并且等于或小于最大長(zhǎng)度的所有可能CV序列是預(yù)先確定的。確定這些所有可能CV序列的細(xì)節(jié)在圖8中示出。圖8是生成長(zhǎng)度等于或大于最小長(zhǎng)度并且等于或小于最大長(zhǎng)度的所有可能CV序列的流程圖。在圖8中，首先獲得如下CV序列的最大長(zhǎng)度LENmax和最小長(zhǎng)度LENmin,該CV序列是從詞庫(kù)中的所有候選關(guān)鍵詞的音子序列轉(zhuǎn)換而來(lái)的(S601)。在詞庫(kù)中，提供代表一個(gè)或更多個(gè)目標(biāo)關(guān)鍵詞的音子序列的所有候選關(guān)鍵詞的發(fā)音。通過(guò)將候選關(guān)鍵詞的音子序列聚類(lèi)為兩類(lèi)輔音和元音，來(lái)獲得候選關(guān)鍵詞的CV序列。如果音子序列中的一個(gè)音子是輔音，它由CV序列中的“C”代表。如果一個(gè)音子是元音，它由CV序列中的“V”代表。例如，關(guān)于候選關(guān)鍵詞“start”，可以通過(guò)將音子序列/S/、/T/、/AA/、/R/、/T/依次聚類(lèi)為輔音、輔音、元音、輔音和輔音，來(lái)獲得CV序列“CCVCC”。CV序列“CCVCC”的長(zhǎng)度是五。以相同的方式，能夠計(jì)算詞庫(kù)中的所有候選關(guān)鍵詞的CV序列的長(zhǎng)度。由此，能夠獲得LENmax和LENmin。注意，也可以通過(guò)直接計(jì)數(shù)候選關(guān)鍵詞的音子序列中的每一個(gè)中的音子的數(shù)量來(lái)獲得LENmax和 LENmin。在生成長(zhǎng)度等于或大于最小長(zhǎng)度并且等于或小于最大長(zhǎng)度的所有CV序列的過(guò)程中，設(shè)定兩個(gè)參數(shù)LenCT和Listi，LenCT代表其范圍是等于或大于最小長(zhǎng)度并且等于或大于最大長(zhǎng)度的一個(gè)CV序列的長(zhǎng)度，Listi代表具有某一長(zhǎng)度的CV序列的列表。開(kāi)始時(shí)，將參數(shù)Lencv設(shè)為L(zhǎng)ENmin,并且將i設(shè)為I (S602)。當(dāng)i = I時(shí)，Listi代表長(zhǎng)度Lencv = LENmin的CV序列的列表。找出長(zhǎng)度=Lencv的所有CV序列并將其存儲(chǔ)在Listi中(S603)。將Lencv和i分別遞增(S604)，并且重復(fù)步驟S603和S604，直到Lenev > LENmax (S605)。所有找到的列表被收集作為長(zhǎng)度等于或大于最小長(zhǎng)度并且等于或小于最大長(zhǎng)度的所有可能CV序列(S606)。該過(guò)程返回到圖7中的S502。通過(guò)組合目標(biāo)關(guān)鍵詞KWi本身和長(zhǎng)度等于或大于最小長(zhǎng)度并且等于或小于最大長(zhǎng)度的所有可能CV序列，創(chuàng)建臨時(shí)語(yǔ)法。然后，執(zhí)行用于從長(zhǎng)度等于或大于最小長(zhǎng)度并且等于或小于最大長(zhǎng)度的所有可能CV序列中找出用于代表目標(biāo)關(guān)鍵詞KWi的OOV詞的CV序列。首先，確定是否存在目標(biāo)關(guān)鍵詞KWi的誤警樣本(S503)。目標(biāo)關(guān)鍵詞KWi的誤警樣本代表易于被識(shí)別為目標(biāo)關(guān)鍵詞KWi的OOV詞。能夠通過(guò)圖9中示出的過(guò)程預(yù)先確定誤警樣本。圖9是確定目標(biāo)關(guān)鍵詞KWi的誤警樣本的流程圖。首先，輸入訓(xùn)練庫(kù)(S701)。然后，使用如圖2中描述的通用垃圾模型和關(guān)鍵詞模型來(lái)執(zhí)行分類(lèi)或識(shí)別(S702)。隨后，對(duì)于每個(gè)目標(biāo)關(guān)鍵詞KWi,找出被分類(lèi)為目標(biāo)關(guān)鍵詞KWi的OOV詞(S703)。將每個(gè)OOV詞確定為目標(biāo)關(guān)鍵詞KWi的一個(gè)誤警樣本(S704)。使用多個(gè)找出的誤警樣本來(lái)生成圖7的過(guò)程中的目標(biāo)關(guān)鍵詞KWi的OOV詞的CV序列。該過(guò)程回到圖7中的S503。如果存在目標(biāo)關(guān)鍵詞KWi的預(yù)定誤警樣本(S503中為“是”)，則分類(lèi)器單元103基于目標(biāo)關(guān)鍵詞KWi的臨時(shí)語(yǔ)法、如圖2中所示的KWi的關(guān)鍵詞模型以及輔音模型和元音模型，識(shí)別輸入的誤警樣本，并輸出識(shí)別結(jié)果(S504)。找出識(shí)別結(jié)果中的識(shí)別概率滿足預(yù)定條件的CV序列，作為用于OOV詞的候選CV序列(S505)。隨后將描述預(yù)定條件的細(xì)節(jié)。此后，與找出的CV序列一一對(duì)應(yīng)的計(jì)數(shù)器被遞增(S506)。然后，過(guò)程返回到S503以確定是否存在目標(biāo)關(guān)鍵詞KWi的下一個(gè)誤警樣本(S503)。如果存在(S503中為“是”)，則重復(fù)步驟S504到S506。如果對(duì)于目標(biāo)關(guān)鍵詞KWi的所有誤警樣本進(jìn)行了該處理，S卩，S503中的確定為“否”，則過(guò)程進(jìn)行到S507。在S507中，將候選CV序列利用它們的相應(yīng)計(jì)數(shù)器的值進(jìn)行排序，并且選擇前N個(gè)候選CV序列，即，前N個(gè)頻繁找到的候選CV序列作為目標(biāo)關(guān)鍵詞KWJ^OOV詞的CV序列。優(yōu)選地，I彡N彡所有目標(biāo)關(guān)鍵詞的總數(shù)。然后，圖7的過(guò)程結(jié)束。(找出候選CV序列的預(yù)定條件)存在定義找出候選CV序列的預(yù)定條件的各種方式。一個(gè)可能的方式是在目標(biāo)關(guān)鍵詞KWi的一個(gè)誤警樣本的識(shí)別結(jié)果中，找出識(shí)別概率高于KWi的識(shí)別概率的CV序列，作為候選CV序列。另選地，找出候選CV序列的方式是在目標(biāo)關(guān)鍵詞KWi的一個(gè)誤警樣本的識(shí)別結(jié)果中，找出具有較高識(shí)別概率的前M個(gè)CV序列，作為候選CV序列。優(yōu)選地，I < M <所有目標(biāo)關(guān)鍵詞的總數(shù)。
另選地，找出候選CV序列的方式是在目標(biāo)關(guān)鍵詞KWi的一個(gè)誤警樣本的識(shí)別結(jié)果中，找出識(shí)別概率高于諸如O. 2的閾值的CV序列作為候選CV序列。(根據(jù)本發(fā)明第二實(shí)施例的創(chuàng)建包括代表目標(biāo)關(guān)鍵詞相關(guān)的OOV詞的CV序列的詞典)圖10是根據(jù)本發(fā)明第二實(shí)施例的創(chuàng)建包括與目標(biāo)關(guān)鍵詞列表中的所有目標(biāo)關(guān)鍵詞相關(guān)的OOV詞的CV序列的詞典的流程圖。步驟S401到S402、S404和S406與圖6中的一樣。省略相應(yīng)的描述以避免重復(fù)。不同在于S403A中的生成用于一個(gè)目標(biāo)關(guān)鍵詞的OOV詞的至少一個(gè)CV序列的處理以及S405A中的選擇用于所有目標(biāo)關(guān)鍵詞的CV序列的處理。具體地，在根據(jù)第二實(shí)施例的生成用于一個(gè)目標(biāo)關(guān)鍵詞的OOV詞的至少一個(gè)CV序列的處理中，取消了選擇用于目標(biāo)關(guān)鍵詞KWi的OOV詞的前N個(gè)頻繁找到的CV序列的步驟 (圖7的S507)，如圖11所示。取而代之，對(duì)于所有目標(biāo)關(guān)鍵詞在S405A中執(zhí)行前N個(gè)頻繁找出的CV序列的選擇。具體地，在步驟S405A中，在S404中一旦在緩沖器中存儲(chǔ)用于每個(gè)目標(biāo)關(guān)鍵詞的OOV詞的候選CV序列及其計(jì)數(shù)器，并且再?zèng)]有需要處理的目標(biāo)關(guān)鍵詞，就收集所有候選CV序列并利用其計(jì)數(shù)器進(jìn)行排序。如果存在用于不同目標(biāo)關(guān)鍵詞的OOV詞的重復(fù)的候選CV序列，則將它們的計(jì)數(shù)器累加。例如，“CVC”序列是用于目標(biāo)關(guān)鍵詞KW1的OOV詞的候選CV序列，并且關(guān)于目標(biāo)關(guān)鍵詞KW1的“CVC”序列的第一計(jì)數(shù)器為36。此外，“CVC”序列還是用于目標(biāo)關(guān)鍵詞KW2的OOV詞的候選CV序列，并且關(guān)于目標(biāo)關(guān)鍵詞KW2的“CVC”序列的第二計(jì)數(shù)器為45。那么，用于目標(biāo)關(guān)鍵詞KW1和KW2兩者的OOV詞的“CVC”序列的累加計(jì)數(shù)器為81。在累加之后，利用所有候選CV序列的計(jì)數(shù)器對(duì)所有候選CV序列排序。然后，選擇前N個(gè)候選CV序列，8卩，前N個(gè)頻繁找出的CV序列，作為用于所有目標(biāo)關(guān)鍵詞的OOV詞的CV序列。優(yōu)選地，I SNS所有目標(biāo)關(guān)鍵詞的總數(shù)。利用第二實(shí)施例，可以限制用于所有目標(biāo)關(guān)鍵詞的OOV詞的CV序列的總數(shù)。因此，能夠進(jìn)一步降低分類(lèi)(識(shí)別)時(shí)的計(jì)算和存儲(chǔ)負(fù)荷。(能夠?qū)崿F(xiàn)本發(fā)明的實(shí)施例的硬件配置)圖12是示出能夠?qū)崿F(xiàn)本發(fā)明的實(shí)施例的計(jì)算機(jī)系統(tǒng)1000的硬件配置的框圖。如圖12所示，計(jì)算機(jī)系統(tǒng)包括計(jì)算機(jī)1110。計(jì)算機(jī)1110包括經(jīng)由系統(tǒng)總線1121連接的處理單元1120、系統(tǒng)存儲(chǔ)器1130、不可移動(dòng)非易失性存儲(chǔ)器接口 1140、可移動(dòng)非易失性存儲(chǔ)器接口 1150、用戶輸入接口 1160、網(wǎng)絡(luò)接口 1170、視頻接口 1190和輸出外圍接口1195。系統(tǒng)存儲(chǔ)器1130包括R0M(只讀存儲(chǔ)器)1131和RAM(隨機(jī)存取存儲(chǔ)器)1132。BIOS(基本輸入輸出系統(tǒng))1133駐留在ROM 1131中。操作系統(tǒng)1134、應(yīng)用程序1135、其它程序單元1136和某些程序數(shù)據(jù)1137駐留在RAM 1132中。諸如硬盤(pán)之類(lèi)的不可移動(dòng)非易失性存儲(chǔ)器1141連接到不可移動(dòng)非易失性存儲(chǔ)器接口 1140。不可移動(dòng)非易失性存儲(chǔ)器1141例如能夠存儲(chǔ)操作系統(tǒng)1144、應(yīng)用程序1145、其它程序單元1146和某些程序數(shù)據(jù)1147。諸如軟盤(pán)驅(qū)動(dòng)器1151和⑶-ROM驅(qū)動(dòng)器1155之類(lèi)的可移動(dòng)非易失性存儲(chǔ)器連接到可移動(dòng)非易失性存儲(chǔ)器接口 1150。例如，軟盤(pán)1152可以被插入到軟盤(pán)驅(qū)動(dòng)器1151中，以及⑶(光盤(pán))1156可以被插入到⑶-ROM驅(qū)動(dòng)器1155中。諸如鼠標(biāo)1161和鍵盤(pán)1162之類(lèi)的輸入設(shè)備被連接到用戶輸入接口 1160。計(jì)算機(jī)1110能夠通過(guò)網(wǎng)絡(luò)接口 1170連接到遠(yuǎn)程計(jì)算機(jī)1180。例如，網(wǎng)絡(luò)接口1170能夠通過(guò)局域網(wǎng)1171連接到遠(yuǎn)程計(jì)算機(jī)1180。另選地，網(wǎng)絡(luò)接口 1170能夠連接到調(diào)制解調(diào)器(調(diào)制器-解調(diào)器)1172，以及調(diào)制解調(diào)器1172經(jīng)由廣域網(wǎng)1173連接到遠(yuǎn)程計(jì)算機(jī) 1180。遠(yuǎn)程計(jì)算機(jī)1180可以包括諸如硬盤(pán)之類(lèi)的存儲(chǔ)器1181，其存儲(chǔ)遠(yuǎn)程應(yīng)用程序1185。視頻接口 1190連接到監(jiān)視器1191。
輸出外圍接口 1195連接到打印機(jī)1196和揚(yáng)聲器1197。圖12所示的計(jì)算機(jī)系統(tǒng)僅僅是說(shuō)明性的并且決不意圖對(duì)本發(fā)明、其應(yīng)用或用途的任何限制。圖12所示的計(jì)算機(jī)系統(tǒng)能夠被實(shí)現(xiàn)于任何實(shí)施例，能夠作為獨(dú)立計(jì)算機(jī)，也能夠作為設(shè)備中的處理系統(tǒng)，能夠移除一個(gè)或多個(gè)不必要的組件，或者向其添加一個(gè)或多個(gè)附加的組件。(建立在根據(jù)本發(fā)明的語(yǔ)音關(guān)鍵詞檢出系統(tǒng)中使用的CV垃圾模型的例子)以下解釋在如圖2所示的根據(jù)本發(fā)明的語(yǔ)音關(guān)鍵詞檢出系統(tǒng)中建立用于僅一個(gè)目標(biāo)關(guān)鍵詞的CV垃圾模型的示例。目標(biāo)關(guān)鍵詞中文中的“開(kāi)始” 拼音發(fā)音kail shi3·關(guān)鍵詞的音子序列k ai sh iii·相關(guān)元音-輔音序列CVCV以下是在三種語(yǔ)言的語(yǔ)音關(guān)鍵詞檢出系統(tǒng)中的一個(gè)實(shí)施例。注意，語(yǔ)音關(guān)鍵詞檢出系統(tǒng)可以是任何適當(dāng)?shù)念?lèi)型，只要其可以實(shí)現(xiàn)語(yǔ)音關(guān)鍵詞檢出即可?！つ繕?biāo)語(yǔ)言中文、英文和日文·詞庫(kù)中的候選關(guān)鍵詞100個(gè)中文常用詞、100個(gè)英文常用詞和100個(gè)日文常用詞·分類(lèi)器用于孤立詞識(shí)別的基于Viterbi搜索的HMM解碼器(分類(lèi)器) 模型*通用垃圾模型利用所有語(yǔ)音庫(kù)訓(xùn)練，其為三個(gè)狀態(tài)，64個(gè)混合HMM*關(guān)鍵詞模型語(yǔ)言相關(guān)的三個(gè)狀態(tài)，兩個(gè)混合，800個(gè)共享狀態(tài)的HMM*5 (或10)個(gè)CV垃圾模型以下是建立5或10個(gè)CV垃圾模型的處理。利用三種語(yǔ)言的訓(xùn)練庫(kù)中的所有元音樣本訓(xùn)練元音模型。利用三種語(yǔ)言的訓(xùn)練庫(kù)中的所有輔音樣本訓(xùn)練輔音模型。利用基于所述300個(gè)候選關(guān)鍵詞獲得的最大長(zhǎng)度和最小長(zhǎng)度收集總共86個(gè)可能的CV序列。在預(yù)定條件下以所述86個(gè)可能的CV序列的出現(xiàn)頻率對(duì)所述86個(gè)可能的CV序列排序。從86個(gè)可能的CV序列中選擇前5個(gè)和前10個(gè)CV序列。按照前5個(gè)和前10個(gè)CV序列連結(jié)元音模型和輔音模型，以分別生成5個(gè)和10個(gè)CV垃圾模型。
(與常規(guī)語(yǔ)音關(guān)鍵詞檢出系統(tǒng)的比較)以下是根據(jù)本發(fā)明的語(yǔ)音關(guān)鍵詞檢出系統(tǒng)與圖I所示的常規(guī)語(yǔ)音關(guān)鍵詞檢出系統(tǒng)之間的比較。以下是測(cè)試集說(shuō)明三個(gè)語(yǔ)言測(cè)試集中文、英文和日文語(yǔ)法中采用10個(gè)目標(biāo)關(guān)鍵詞，在以上示例中建立對(duì)于每個(gè)目標(biāo)關(guān)鍵詞的CV垃圾模型?！?1000個(gè)中文詞、3000個(gè)英文詞和3000個(gè)日文詞，它們?cè)跍y(cè)試集中具有相同的分布。圖13是示出基于以上測(cè)試集的、圖I中所示的常規(guī)語(yǔ)音關(guān)鍵詞檢出系統(tǒng)與本發(fā)明的語(yǔ)音關(guān)鍵詞檢出系統(tǒng)之間的比較的圖表。在圖13中，RC代表召回(recall)率，其是被正確識(shí)別的關(guān)鍵詞的數(shù)目/關(guān)鍵詞的總數(shù)。FA代表誤警率，其是(被識(shí)別為關(guān)鍵詞的非關(guān)鍵詞的數(shù)目+被識(shí)別為其它關(guān)鍵詞的關(guān)鍵詞的數(shù)目)/關(guān)鍵詞和非關(guān)鍵詞的總數(shù)。MD代表漏檢率，其是被識(shí)別為非關(guān)鍵詞的關(guān)鍵詞的數(shù)目/關(guān)鍵詞的總數(shù)。在圖13中，黑條表示使用通用垃圾模型的常規(guī)語(yǔ)音關(guān)鍵詞檢出系統(tǒng)的結(jié)果。灰條表示使用一個(gè)通用垃圾模型和五個(gè)CV垃圾模型(CV序列)的根據(jù)本發(fā)明的語(yǔ)音關(guān)鍵詞檢出系統(tǒng)的結(jié)果。白條表示使用一個(gè)通用垃圾模型和10個(gè)CV垃圾模型(CV序列)的根據(jù)本發(fā)明的語(yǔ)音關(guān)鍵詞檢出系統(tǒng)的結(jié)果。從圖13可以看出，與使用通用垃圾模型的常規(guī)語(yǔ)音關(guān)鍵詞檢出系統(tǒng)相比，本發(fā)明的語(yǔ)音關(guān)鍵詞檢出系統(tǒng)以?xún)H可忽略的RC的減小將FA減少了約30%。此外，具有5個(gè)CV垃圾模型的系統(tǒng)的性能和具有10個(gè)CV垃圾模型的系統(tǒng)的性能幾乎相同。可以看出，5個(gè)CV垃圾模型的情況就足夠了。考慮到計(jì)算和存儲(chǔ)負(fù)荷，具有5個(gè)CV垃圾模型的系統(tǒng)是優(yōu)選的。注意，建立5個(gè)或者10個(gè)垃圾模型僅是示例。可以建立任何適當(dāng)數(shù)量的CV垃圾模型。綜上所述，根據(jù)本發(fā)明的語(yǔ)音關(guān)鍵詞檢出系統(tǒng)能夠以可忽略的召回率的減小顯著降低誤警率。此外，由于在計(jì)算時(shí)僅需要考慮兩個(gè)用于OOV詞的模型，即，輔音模型和元音模型，所以使計(jì)算和存儲(chǔ)負(fù)荷保持低?？梢酝ㄟ^(guò)各種方式執(zhí)行本發(fā)明的方法和設(shè)備。例如，可以通過(guò)軟件、硬件、固件或其任何組合來(lái)實(shí)施本發(fā)明的方法和設(shè)備。上述的方法步驟的次序僅是說(shuō)明性的，本發(fā)明的方法步驟不限于以上具體描述的次序，除非以其他方式明確說(shuō)明。此外，在一些實(shí)施例中，本發(fā)明還可以被實(shí)施為記錄在記錄介質(zhì)中的程序，其包括用于實(shí)現(xiàn)根據(jù)本發(fā)明的方法的機(jī)器可讀指令。因而，本發(fā)明還覆蓋存儲(chǔ)用于實(shí)現(xiàn)根據(jù)本發(fā)明的方法的程序的記錄介質(zhì)。雖然已通過(guò)示例詳細(xì)展示了本發(fā)明的一些具體實(shí)施例，但是本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解，上述示例僅意圖是示例性的而不限制本發(fā)明的范圍。本領(lǐng)域技術(shù)人員應(yīng)該理解，上述實(shí)施例可以被修改而不脫離本發(fā)明的范圍和實(shí)質(zhì)。本發(fā)明的范圍是通過(guò)所附的權(quán)利要求限定的。
權(quán)利要求
1.一種語(yǔ)音關(guān)鍵詞檢出系統(tǒng),包括輸入單兀，用于接收輸入語(yǔ)音信號(hào)；特征提取單元，用于從輸入語(yǔ)音信號(hào)提取至少一個(gè)特征；分類(lèi)器單元，用于基于所述至少一個(gè)特征和詞典將輸入語(yǔ)音信號(hào)分類(lèi)為目標(biāo)關(guān)鍵詞或者集外詞；和輸出單元，用于輸出分類(lèi)的結(jié)果，其中，詞典包括語(yǔ)法，該語(yǔ)法包括目標(biāo)關(guān)鍵詞列表和用于集外詞的兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列；和詞庫(kù)，該詞庫(kù)包括代表目標(biāo)關(guān)鍵詞列表中的一個(gè)或更多個(gè)目標(biāo)關(guān)鍵詞的音子序列的所有候選關(guān)鍵詞的發(fā)音以及代表用于集外詞的所述兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列的發(fā)音，所述兩個(gè)標(biāo)識(shí)符中的一個(gè)標(biāo)識(shí)符表示第一類(lèi)音子，另一個(gè)標(biāo)識(shí)符表示第二類(lèi)音子，第一類(lèi)音子和第二類(lèi)音子是基于音子的固有特征而聚類(lèi)的，并且其中，第一類(lèi)音子、第二類(lèi)音子和用于一個(gè)或更多個(gè)目標(biāo)關(guān)鍵詞的音子分別由它們的模型描述。
2.根據(jù)權(quán)利要求I的語(yǔ)音關(guān)鍵詞檢出系統(tǒng)，其中，如果最高概率是目標(biāo)關(guān)鍵詞的概率，則分類(lèi)器單元將輸入語(yǔ)音信號(hào)分類(lèi)為目標(biāo)關(guān)鍵詞，如果最高概率是所述兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列的概率，則將輸入語(yǔ)音信號(hào)分類(lèi)為集外詞。
3.根據(jù)權(quán)利要求I的語(yǔ)音關(guān)鍵詞檢出系統(tǒng)，其中分類(lèi)器單元包括用于對(duì)于每個(gè)目標(biāo)關(guān)鍵詞生成用于集外詞的所述兩個(gè)標(biāo)識(shí)符的序列的單元；用于對(duì)于每個(gè)目標(biāo)關(guān)鍵詞選擇前N個(gè)最頻繁生成的所述兩個(gè)標(biāo)識(shí)符的序列的單元，其中N為等于或大于I的整數(shù)；和用于對(duì)于所有目標(biāo)關(guān)鍵詞收集對(duì)于每個(gè)目標(biāo)關(guān)鍵詞的所有選定的所述兩個(gè)標(biāo)識(shí)符的序列作為用于集外詞的所述兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列的單元。
4.根據(jù)權(quán)利要求I的語(yǔ)音關(guān)鍵詞檢出系統(tǒng)，其中，分類(lèi)器單元包括用于對(duì)于每個(gè)目標(biāo)關(guān)鍵詞生成用于集外詞的所述兩個(gè)標(biāo)識(shí)符的序列的單元；用于對(duì)于所有目標(biāo)關(guān)鍵詞收集對(duì)于每個(gè)目標(biāo)關(guān)鍵詞的所有生成的所述兩個(gè)標(biāo)識(shí)符的序列的單元；和用于對(duì)于所有目標(biāo)關(guān)鍵詞選擇前N個(gè)最頻繁生成的所述兩個(gè)標(biāo)識(shí)符的序列，作為用于集外詞的所述兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列的單元，其中N為等于或大于I的整數(shù)。
5.根據(jù)權(quán)利要求3或4的語(yǔ)音關(guān)鍵詞檢出系統(tǒng)，其中所述用于對(duì)于每個(gè)目標(biāo)關(guān)鍵詞生成用于集外詞的所述兩個(gè)標(biāo)識(shí)符的序列的單元包括用于確定目標(biāo)關(guān)鍵詞的誤警樣本的單元；用于創(chuàng)建目標(biāo)關(guān)鍵詞的臨時(shí)語(yǔ)法的單元，所述臨時(shí)語(yǔ)法包括目標(biāo)關(guān)鍵詞以及長(zhǎng)度等于或大于最小長(zhǎng)度并且等于或小于最大長(zhǎng)度的所有的所述兩個(gè)標(biāo)識(shí)符的序列；用于基于臨時(shí)語(yǔ)法、目標(biāo)關(guān)鍵詞的音子序列的模型、第一類(lèi)音子的模型和第二類(lèi)音子的模型，識(shí)別每個(gè)誤警樣本的單元；和用于找出每個(gè)誤警樣本的識(shí)別結(jié)果中的識(shí)別概率滿足預(yù)定條件的所述兩個(gè)標(biāo)識(shí)符的序列的單元。
6.根據(jù)權(quán)利要求5的語(yǔ)音關(guān)鍵詞檢出系統(tǒng)，其中，所述預(yù)定條件是以下條件中的一個(gè) 1)在每個(gè)誤警樣本的識(shí)別結(jié)果中，所述兩個(gè)標(biāo)識(shí)符的序列的識(shí)別概率高于目標(biāo)關(guān)鍵詞的識(shí)別概率； 2)在每個(gè)誤警樣本的識(shí)別結(jié)果中，所述兩個(gè)標(biāo)識(shí)符的序列的識(shí)別概率高于閾值； 3)在每個(gè)誤警樣本的識(shí)別結(jié)果中，選出具有較高識(shí)別概率的前M個(gè)所述兩個(gè)標(biāo)識(shí)符的序列，其中M為等于或大于I的整數(shù)。
7.根據(jù)權(quán)利要求5的語(yǔ)音關(guān)鍵詞檢出系統(tǒng)，其中，通過(guò)以下單元生成臨時(shí)語(yǔ)法中的長(zhǎng)度等于或大于最小長(zhǎng)度并且等于或小于最大長(zhǎng)度的所有的所述兩個(gè)標(biāo)識(shí)符的序列用于獲得從候選關(guān)鍵詞轉(zhuǎn)換的所述兩個(gè)標(biāo)識(shí)符的序列的最小長(zhǎng)度和最大長(zhǎng)度的單元；和用于收集長(zhǎng)度等于或大于最小長(zhǎng)度并且等于或小于最大長(zhǎng)度的所有的所述兩個(gè)標(biāo)識(shí)符的序列。
8.根據(jù)權(quán)利要求1-4中任一項(xiàng)的語(yǔ)音關(guān)鍵詞檢出系統(tǒng)，其中第一類(lèi)音子是輔音，第二類(lèi)音子是兀音。
9.一種創(chuàng)建用于語(yǔ)音關(guān)鍵詞檢出系統(tǒng)的詞典的系統(tǒng)，所述詞典包括具有目標(biāo)關(guān)鍵詞列表的語(yǔ)法；和詞庫(kù)，該詞庫(kù)包括代表目標(biāo)關(guān)鍵詞列表中的一個(gè)或更多個(gè)目標(biāo)關(guān)鍵詞的音子序列的所有候選關(guān)鍵詞的發(fā)音，所述系統(tǒng)包括用于基于音子的固有特征將語(yǔ)音數(shù)據(jù)聚類(lèi)為第一類(lèi)音子和第二類(lèi)音子的單元；用于依賴(lài)于目標(biāo)關(guān)鍵詞列表中的目標(biāo)關(guān)鍵詞的音子序列，生成用于集外詞的兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列的單元，所述兩個(gè)標(biāo)識(shí)符中的一個(gè)標(biāo)識(shí)符表示第一類(lèi)音子，另一個(gè)標(biāo)識(shí)符表示第二類(lèi)音子；和用于將所述兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列添加到語(yǔ)法中的單元，其中所述詞庫(kù)還包括代表用于集外詞的所述兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列的發(fā)音，并且其中，第一類(lèi)音子、第二類(lèi)音子和用于一個(gè)或更多個(gè)目標(biāo)關(guān)鍵詞的音子分別由它們的模型描述。
10.根據(jù)權(quán)利要求9的系統(tǒng)，其中，所述用于生成用于集外詞的所述兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列的單元包括用于對(duì)于每個(gè)目標(biāo)關(guān)鍵詞生成用于集外詞的所述兩個(gè)標(biāo)識(shí)符的序列的單元；用于對(duì)于每個(gè)目標(biāo)關(guān)鍵詞選擇前N個(gè)最頻繁生成的所述兩個(gè)標(biāo)識(shí)符的序列的單元，其中N為等于或大于I的整數(shù)；和用于對(duì)于所有目標(biāo)關(guān)鍵詞收集對(duì)于每個(gè)目標(biāo)關(guān)鍵詞的所有選定的所述兩個(gè)標(biāo)識(shí)符的序列作為用于集外詞的所述兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列的單元。
11.根據(jù)權(quán)利要求9的系統(tǒng)，其中，所述用于生成用于集外詞的所述兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列的單元包括用于對(duì)于每個(gè)目標(biāo)關(guān)鍵詞生成用于集外詞的所述兩個(gè)標(biāo)識(shí)符的序列的單元；用于對(duì)于所有目標(biāo)關(guān)鍵詞收集對(duì)于每個(gè)目標(biāo)關(guān)鍵詞的所有生成的所述兩個(gè)標(biāo)識(shí)符的序列的單元；和用于對(duì)于所有目標(biāo)關(guān)鍵詞選擇前N個(gè)最頻繁生成的所述兩個(gè)標(biāo)識(shí)符的序列，作為用于集外詞的所述兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列的單元，其中N為等于或大于I的整數(shù)。
12.根據(jù)權(quán)利要求10或11的系統(tǒng)，其中，用于對(duì)于每個(gè)目標(biāo)關(guān)鍵詞生成用于集外詞的所述兩個(gè)標(biāo)識(shí)符的序列的單元包括用于確定目標(biāo)關(guān)鍵詞的誤警樣本的單元；用于創(chuàng)建目標(biāo)關(guān)鍵詞的臨時(shí)語(yǔ)法的單元，所述臨時(shí)語(yǔ)法包括目標(biāo)關(guān)鍵詞以及長(zhǎng)度等于或大于最小長(zhǎng)度并且等于或小于最大長(zhǎng)度的所有的所述兩個(gè)標(biāo)識(shí)符的序列；用于基于臨時(shí)語(yǔ)法、目標(biāo)關(guān)鍵詞的音子序列的模型、第一類(lèi)音子的模型和第二類(lèi)音子的模型，識(shí)別每個(gè)誤警樣本的單元；和用于找出每個(gè)誤警樣本的識(shí)別結(jié)果中的識(shí)別概率滿足預(yù)定條件的所述兩個(gè)標(biāo)識(shí)符的序列的單元。
13.根據(jù)權(quán)利要求12的系統(tǒng)，其中，所述預(yù)定條件是以下條件中的一個(gè) 1)在每個(gè)誤警樣本的識(shí)別結(jié)果中，所述兩個(gè)標(biāo)識(shí)符的序列的識(shí)別概率高于目標(biāo)關(guān)鍵詞的識(shí)別概率； 2)在每個(gè)誤警樣本的識(shí)別結(jié)果中，所述兩個(gè)標(biāo)識(shí)符的序列的識(shí)別概率高于閾值； 3)在每個(gè)誤警樣本的識(shí)別結(jié)果中，選出具有較高識(shí)別概率的前M個(gè)所述兩個(gè)標(biāo)識(shí)符的序列，其中M為等于或大于I的整數(shù)。
14.根據(jù)權(quán)利要求12的系統(tǒng)，其中，通過(guò)以下單元生成臨時(shí)語(yǔ)法中的長(zhǎng)度等于或大于最小長(zhǎng)度并且等于或小于最大長(zhǎng)度的所有的所述兩個(gè)標(biāo)識(shí)符的序列用于獲得從候選關(guān)鍵詞轉(zhuǎn)換的所述兩個(gè)標(biāo)識(shí)符的序列的最小長(zhǎng)度和最大長(zhǎng)度的單元；和用于收集長(zhǎng)度等于或大于最小長(zhǎng)度并且等于或小于最大長(zhǎng)度的所有的所述兩個(gè)標(biāo)識(shí)符的序列。
15.根據(jù)權(quán)利要求9-11中任一項(xiàng)的系統(tǒng)，其中，第一類(lèi)音子是輔音，第二類(lèi)音子是兀音。
16.一種創(chuàng)建用于語(yǔ)音關(guān)鍵詞檢出系統(tǒng)的詞典的方法，所述詞典包括具有目標(biāo)關(guān)鍵詞列表的語(yǔ)法；和詞庫(kù)，該詞庫(kù)包括代表目標(biāo)關(guān)鍵詞列表中的一個(gè)或更多個(gè)目標(biāo)關(guān)鍵詞的音子序列的所有候選關(guān)鍵詞的發(fā)音，所述方法包括以下步驟基于音子的固有特征將語(yǔ)音數(shù)據(jù)聚類(lèi)為第一類(lèi)音子和第二類(lèi)音子；依賴(lài)于目標(biāo)關(guān)鍵詞列表中的目標(biāo)關(guān)鍵詞的音子序列，生成用于集外詞的兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列，所述兩個(gè)標(biāo)識(shí)符中的一個(gè)標(biāo)識(shí)符表示第一類(lèi)音子，另一個(gè)標(biāo)識(shí)符表示第二類(lèi)音子；和將所述兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列添加到語(yǔ)法中，其中所述詞庫(kù)還包括代表用于集外詞的所述兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列的發(fā)音，并且其中，第一類(lèi)音子、第二類(lèi)音子和用于一個(gè)或更多個(gè)目標(biāo)關(guān)鍵詞的音子分別由它們的模型描述。
17.根據(jù)權(quán)利要求16的方法，其中，生成用于集外詞的所述兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列的步驟包括對(duì)于每個(gè)目標(biāo)關(guān)鍵詞生成用于集外詞的所述兩個(gè)標(biāo)識(shí)符的序列；對(duì)于每個(gè)目標(biāo)關(guān)鍵詞選擇前N個(gè)最頻繁生成的所述兩個(gè)標(biāo)識(shí)符的序列，其中N為等于或大于I的整數(shù)；和對(duì)于所有目標(biāo)關(guān)鍵詞收集對(duì)于每個(gè)目標(biāo)關(guān)鍵詞的所有選定的所述兩個(gè)標(biāo)識(shí)符的序列作為用于集外詞的所述兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列。
18.根據(jù)權(quán)利要求16的方法，其中，生成用于集外詞的所述兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列的步驟包括對(duì)于每個(gè)目標(biāo)關(guān)鍵詞生成用于集外詞的所述兩個(gè)標(biāo)識(shí)符的序列；對(duì)于所有目標(biāo)關(guān)鍵詞收集對(duì)于每個(gè)目標(biāo)關(guān)鍵詞的所有生成的所述兩個(gè)標(biāo)識(shí)符的序列；和對(duì)于所有目標(biāo)關(guān)鍵詞選擇前N個(gè)最頻繁生成的所述兩個(gè)標(biāo)識(shí)符的序列，作為用于集外詞的所述兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列，其中N為等于或大于I的整數(shù)。
19.根據(jù)權(quán)利要求17或18的方法，其中，對(duì)于每個(gè)目標(biāo)關(guān)鍵詞生成用于集外詞的所述兩個(gè)標(biāo)識(shí)符的序列的步驟包括確定目標(biāo)關(guān)鍵詞的誤警樣本；創(chuàng)建目標(biāo)關(guān)鍵詞的臨時(shí)語(yǔ)法，所述臨時(shí)語(yǔ)法包括目標(biāo)關(guān)鍵詞以及長(zhǎng)度等于或大于最小長(zhǎng)度并且等于或小于最大長(zhǎng)度的所有的所述兩個(gè)標(biāo)識(shí)符的序列；基于臨時(shí)語(yǔ)法、目標(biāo)關(guān)鍵詞的音子序列的模型、第一類(lèi)音子的模型和第二類(lèi)音子的模型，識(shí)別每個(gè)誤警樣本；和找出每個(gè)誤警樣本的識(shí)別結(jié)果中的識(shí)別概率滿足預(yù)定條件的所述兩個(gè)標(biāo)識(shí)符的序列。
20.根據(jù)權(quán)利要求19的方法，其中，所述預(yù)定條件是以下條件中的一個(gè) 1)在每個(gè)誤警樣本的識(shí)別結(jié)果中，所述兩個(gè)標(biāo)識(shí)符的序列的識(shí)別概率高于目標(biāo)關(guān)鍵詞的識(shí)別概率； 2)在每個(gè)誤警樣本的識(shí)別結(jié)果中，所述兩個(gè)標(biāo)識(shí)符的序列的識(shí)別概率高于閾值； 3)在每個(gè)誤警樣本的識(shí)別結(jié)果中，選出具有較高識(shí)別概率的前M個(gè)所述兩個(gè)標(biāo)識(shí)符的序列，其中M為等于或大于I的整數(shù)。
21.根據(jù)權(quán)利要求19的方法，其中，通過(guò)以下步驟生成臨時(shí)語(yǔ)法中的長(zhǎng)度等于或大于最小長(zhǎng)度并且等于或小于最大長(zhǎng)度的所有的所述兩個(gè)標(biāo)識(shí)符的序列獲得從候選關(guān)鍵詞轉(zhuǎn)換的所述兩個(gè)標(biāo)識(shí)符的序列的最小長(zhǎng)度和最大長(zhǎng)度；和收集長(zhǎng)度等于或大于最小長(zhǎng)度并且等于或小于最大長(zhǎng)度的所有的所述兩個(gè)標(biāo)識(shí)符的序列。
22.根據(jù)權(quán)利要求16-18中任一項(xiàng)的方法，其中，第一類(lèi)音子是輔音，第二類(lèi)音子是兀音。
全文摘要
本申請(qǐng)涉及語(yǔ)音關(guān)鍵詞檢出系統(tǒng)。其包括輸入單元，用于接收輸入語(yǔ)音信號(hào)；特征提取單元，用于從輸入語(yǔ)音信號(hào)提取至少一個(gè)特征；分類(lèi)器單元，用于基于至少一個(gè)特征和詞典將輸入語(yǔ)音信號(hào)分類(lèi)為目標(biāo)關(guān)鍵詞或者集外詞；和輸出單元，用于輸出分類(lèi)的結(jié)果。該詞典包括語(yǔ)法，包括目標(biāo)關(guān)鍵詞列表和用于集外詞的兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列；和詞庫(kù)，包括代表目標(biāo)關(guān)鍵詞列表中的一個(gè)或更多個(gè)目標(biāo)關(guān)鍵詞的音子序列的所有候選關(guān)鍵詞的發(fā)音以及代表所述至少一個(gè)序列的發(fā)音，其中一個(gè)標(biāo)識(shí)符表示第一類(lèi)音子，另一個(gè)標(biāo)識(shí)符表示第二類(lèi)音子。第一類(lèi)音子和第二類(lèi)音子是基于音子的固有特征聚類(lèi)的。第一類(lèi)音子、第二類(lèi)音子和目標(biāo)關(guān)鍵詞的音子由模型描述。
文檔編號(hào)G06F17/30GK102915729SQ20111021728
公開(kāi)日2013年2月6日申請(qǐng)日期2011年8月1日優(yōu)先權(quán)日2011年8月1日
發(fā)明者郭莉莉, 劉賀飛, 亓超申請(qǐng)人:佳能株式會(huì)社

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專(zhuān)利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：郭莉莉;劉賀飛;亓超
技術(shù)所有人：佳能株式會(huì)社
我是此專(zhuān)利的發(fā)明人

該領(lǐng)域下的技術(shù)專(zhuān)家
如您需求助技術(shù)專(zhuān)家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢(xún)。
1、李老師：1.計(jì)算力學(xué) 2.無(wú)損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專(zhuān)家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢(xún)問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

語(yǔ)音關(guān)鍵詞檢出系統(tǒng)、創(chuàng)建用于其的詞典的系統(tǒng)和方法