亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

語(yǔ)音關(guān)鍵詞檢出系統(tǒng)、創(chuàng)建用于其的詞典的系統(tǒng)和方法

文檔序號(hào):6429797閱讀:216來(lái)源:國(guó)知局
專(zhuān)利名稱(chēng):語(yǔ)音關(guān)鍵詞檢出系統(tǒng)、創(chuàng)建用于其的詞典的系統(tǒng)和方法
技術(shù)領(lǐng)域
本發(fā)明涉及語(yǔ)音關(guān)鍵詞檢出(spotting)系統(tǒng),以及創(chuàng)建用于該語(yǔ)音關(guān)鍵詞檢出系統(tǒng)的詞典的系統(tǒng)和方法。
背景技術(shù)
語(yǔ)音關(guān)鍵詞檢出技術(shù)旨在檢測(cè)并且識(shí)別連續(xù)的或者分割的輸入語(yǔ)音中的預(yù)定義語(yǔ)音關(guān)鍵詞。語(yǔ)音關(guān)鍵詞檢出技術(shù)被用于幾乎所有語(yǔ)音識(shí)別應(yīng)用中,如呼叫中心系統(tǒng)、語(yǔ)音郵件分類(lèi)和按內(nèi)容搜索。在實(shí)際的語(yǔ)音關(guān)鍵詞檢出應(yīng)用中,輸入語(yǔ)音的大多數(shù)部分不包括關(guān)鍵詞。這些部分稱(chēng)為集外詞(Out-Of-Vocabulary,00V)段(即,非關(guān)鍵詞)。如果OOV段被錯(cuò)誤地識(shí)別 為關(guān)鍵詞,則這被稱(chēng)為誤警(false alarm, FA) 0高誤警率會(huì)引起不良的用戶體驗(yàn)。一般而言,丟棄OOV數(shù)據(jù)的方法之一是除了建立關(guān)鍵詞模型之外,還建立用于OOV數(shù)據(jù)的適當(dāng)?shù)睦P?garbage model),以區(qū)分關(guān)鍵詞和非關(guān)鍵詞。通常,關(guān)鍵詞的數(shù)量是有限的。建立對(duì)于每個(gè)關(guān)鍵詞的準(zhǔn)確模型是相對(duì)容易的。而建立準(zhǔn)確的垃圾模型是非常困難的,這是因?yàn)榇嬖谔囝?lèi)型的00V數(shù)據(jù)。例如,關(guān)于00V數(shù)據(jù),有靜音數(shù)據(jù)、語(yǔ)音數(shù)據(jù)和不同類(lèi)型的噪聲等。建立垃圾模型的通用方法如下。(I)采用一個(gè)或更多個(gè)通用垃圾模型。例如,美國(guó)專(zhuān)利申請(qǐng)No. 20030200090 和 No. 20050256712 以及 Jay G. Wilpon 等人的 “Automatic Recognition of Keywords in Unconstrained Speech Using HiddenMarkov Models”,IEEE Trans on Assp, Vol. 38, No. 11, November, 1990,第 1870-1878 頁(yè)描述了通過(guò)利用所有語(yǔ)音數(shù)據(jù)(具有或不具有關(guān)鍵詞樣本)和各種噪聲來(lái)建立一個(gè)通用垃圾模型的各種方式。H. BourlarcUB. D' hoore 和 JM Boite,“optimizing recognition andrejection performance in word spotting systems,,,Proc. ICASSP 94,第 373-376 頁(yè)描述了通過(guò)聚類(lèi)的上下文無(wú)關(guān)的音子數(shù)據(jù)來(lái)建立若干個(gè)通用垃圾模型。這種方法易于操作并且對(duì)于提高通用語(yǔ)音關(guān)鍵詞檢出系統(tǒng)的性能是有效的。但是,這樣的通用垃圾模型是關(guān)鍵詞無(wú)關(guān)的。其不能在考慮特定關(guān)鍵詞的情況下良好地代表所有非關(guān)鍵詞的特性。具有與關(guān)鍵詞相似發(fā)音的00V詞傾向于被識(shí)別為關(guān)鍵詞,因而導(dǎo)致大量的誤警。(2)采用關(guān)鍵詞相關(guān)的垃圾模型。建立與特定關(guān)鍵詞相關(guān)的垃圾模型將降低上述的誤警。例如,在美國(guó)專(zhuān)利No. 5895448 和 No. 6223155,以及 J. Rohlicek, ff. Russel、S. Rouko 和 H. Gish, “Continuoushidden Markov modeling for speaker independent word spotting”, in Proc, Int.Conf. Acoustics, Speech, and Signal Processing, 1989,第 627-630 頁(yè)和 Makoto Yamada>Tsuneo Kato、Masaki Naito和Hisashi Kawai,^Improvement of Rejection Performanceof Speech keyword spotting Using Anti-Keywords Derived from Large Vocabulary,,,in INTERSPEECH2005, September, 4-8, Lisbon, Portugal,第 1445-1448 頁(yè)中,提出了建立用于關(guān)鍵詞的垃圾模型的各種方式。這種方法良好地區(qū)分特定關(guān)鍵詞和OOV詞。但是,因?yàn)橐粋€(gè)關(guān)鍵詞具有至少一個(gè)垃圾模型,因此在識(shí)別時(shí)將使用許多垃圾模型,這引起語(yǔ)音關(guān)鍵詞檢出系統(tǒng)的重的計(jì)算和存儲(chǔ)負(fù)荷。另一個(gè)缺點(diǎn)是一旦改變或增加關(guān)鍵詞,用于其的垃圾模型應(yīng)當(dāng)被重新建立和訓(xùn)練。如何在使計(jì)算和存儲(chǔ)負(fù)荷保持低的同時(shí)有效地減小語(yǔ)音關(guān)鍵詞檢出的誤警率是語(yǔ)音關(guān)鍵詞檢出技術(shù)的挑戰(zhàn)。

發(fā)明內(nèi)容
本發(fā)明的目的是提供一種使用關(guān)鍵詞相關(guān)的垃圾I旲型的聞度可罪的語(yǔ)首關(guān)鍵詞檢出系統(tǒng),其能夠在不引起重的計(jì)算和存儲(chǔ)負(fù)荷的情況下提高垃圾模型的區(qū)分能力。 根據(jù)本發(fā)明的一個(gè)方面,提供了一種語(yǔ)音關(guān)鍵詞檢出系統(tǒng)。其包括輸入單元,用于接收輸入語(yǔ)音信號(hào);特征提取單元,用于從輸入語(yǔ)音信號(hào)提取至少一個(gè)特征;分類(lèi)器單元,用于基于所述至少一個(gè)特征和詞典將輸入語(yǔ)音信號(hào)分類(lèi)為目標(biāo)關(guān)鍵詞或者集外詞;和輸出單元,用于輸出分類(lèi)的結(jié)果。所述詞典包括語(yǔ)法(gra_ar),該語(yǔ)法包括目標(biāo)關(guān)鍵詞列表和用于集外詞的兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列;和詞庫(kù)(lexicon),該詞庫(kù)包括代表目標(biāo)關(guān)鍵詞列表中的一個(gè)或更多個(gè)目標(biāo)關(guān)鍵詞的音子序列的所有候選關(guān)鍵詞的發(fā)音以及代表用于集外詞的所述兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列的發(fā)音,所述兩個(gè)標(biāo)識(shí)符中的一個(gè)標(biāo)識(shí)符表不第一類(lèi)音子,另一個(gè)標(biāo)識(shí)符表不第二類(lèi)音子。第一類(lèi)音子和第二類(lèi)音子是基于音子的固有特征而聚類(lèi)的。第一類(lèi)音子、第二類(lèi)音子和用于一個(gè)或更多個(gè)目標(biāo)關(guān)鍵詞的音子分別由它們的模型描述。根據(jù)本發(fā)明的另一方面,提供一種創(chuàng)建用于語(yǔ)音關(guān)鍵詞檢出系統(tǒng)的詞典的系統(tǒng)。所述詞典包括具有目標(biāo)關(guān)鍵詞列表的語(yǔ)法;和詞庫(kù),該詞庫(kù)包括代表目標(biāo)關(guān)鍵詞列表中的一個(gè)或更多個(gè)目標(biāo)關(guān)鍵詞的音子序列的所有候選關(guān)鍵詞的發(fā)音。所述系統(tǒng)包括用于基于音子的固有特征將語(yǔ)音數(shù)據(jù)聚類(lèi)為第一類(lèi)音子和第二類(lèi)音子的單元;用于依賴(lài)于目標(biāo)關(guān)鍵詞列表中的目標(biāo)關(guān)鍵詞的音子序列,生成用于集外詞的兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列的單元,所述兩個(gè)標(biāo)識(shí)符中的一個(gè)標(biāo)識(shí)符表示第一類(lèi)音子,另一個(gè)標(biāo)識(shí)符表示第二類(lèi)音子;和用于將所述兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列添加到語(yǔ)法中的單元。所述詞庫(kù)還包括代表用于集外詞的所述兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列的發(fā)音。第一類(lèi)音子、第二類(lèi)音子和用于一個(gè)或更多個(gè)目標(biāo)關(guān)鍵詞的音子分別由它們的模型描述。根據(jù)本發(fā)明的又一方面,提供一種創(chuàng)建用于語(yǔ)音關(guān)鍵詞檢出系統(tǒng)的詞典的方法。所述詞典包括具有目標(biāo)關(guān)鍵詞列表的語(yǔ)法;和詞庫(kù),該詞庫(kù)包括代表目標(biāo)關(guān)鍵詞列表中的一個(gè)或更多個(gè)目標(biāo)關(guān)鍵詞的音子序列的所有候選關(guān)鍵詞的發(fā)音。所述方法包括以下步驟基于音子的固有特征將語(yǔ)音數(shù)據(jù)聚類(lèi)為第一類(lèi)音子和第二類(lèi)音子;依賴(lài)于目標(biāo)關(guān)鍵詞列表中的目標(biāo)關(guān)鍵詞的音子序列,生成用于集外詞的兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列,所述兩個(gè)標(biāo)識(shí)符中的一個(gè)標(biāo)識(shí)符表示第一類(lèi)音子,另一個(gè)標(biāo)識(shí)符表示第二類(lèi)音子;和將所述兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列添加到語(yǔ)法中。所述詞庫(kù)還包括代表用于集外詞的所述兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列的發(fā)音。第一類(lèi)音子、第二類(lèi)音子和用于一個(gè)或更多個(gè)目標(biāo)關(guān)鍵詞的音子分別由它們的模型描述。
根據(jù)本發(fā)明中的語(yǔ)音關(guān)鍵詞檢出系統(tǒng)以及創(chuàng)建用于該語(yǔ)音關(guān)鍵詞檢出系統(tǒng)的詞典的方法和系統(tǒng),訓(xùn)練數(shù)據(jù)被在音子級(jí)別聚類(lèi)為兩類(lèi)第一類(lèi)音子和第二類(lèi)音子。利用訓(xùn)練庫(kù)中的屬于第一類(lèi)音子的音子,訓(xùn)練第一類(lèi)音子的模型,該訓(xùn)練庫(kù)包括用于訓(xùn)練模型的所有訓(xùn)練語(yǔ)音數(shù)據(jù)。利用訓(xùn)練庫(kù)中的屬于第二類(lèi)音子的音子,訓(xùn)練第二類(lèi)音子的模型。第一類(lèi)音子和第二類(lèi)音子例如分別為輔音和元音。依賴(lài)于與目標(biāo)關(guān)鍵詞相關(guān)地生成兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列,所述兩個(gè)標(biāo)識(shí)符分別表示第一類(lèi)音子和第二類(lèi)音子。在語(yǔ)音關(guān)鍵詞檢出時(shí),通過(guò)語(yǔ)音關(guān)鍵詞檢出系統(tǒng)使用兩個(gè)標(biāo)識(shí)符的序列來(lái)連結(jié)(concatenate)第一類(lèi)音子的模型和第二類(lèi)音子的模型,以創(chuàng)建垃圾模型。由于用于創(chuàng)建垃圾模型的所述兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列是依賴(lài)于目標(biāo)關(guān)鍵字生成的,所以誤警率的改進(jìn)更為優(yōu)于使用一個(gè)或更多個(gè)通用垃圾模型的系統(tǒng)。此外,由于僅建立了兩個(gè)模型,即,第一類(lèi)音子的模型和第二類(lèi)音子的模型,所以,與使用關(guān)鍵詞相關(guān)的許多垃圾模型的常規(guī)語(yǔ)音關(guān)鍵詞檢出系統(tǒng)相比,計(jì)算和存儲(chǔ)負(fù)荷顯著降低。此外,當(dāng)改變或添加目標(biāo)關(guān)鍵詞時(shí),只需要改變或重新生成所述兩個(gè)標(biāo)識(shí)符的序列,而無(wú)需建立新的模型。而在使用關(guān)鍵詞相關(guān)的許多垃圾模型的常規(guī)語(yǔ)音關(guān)鍵詞檢出系統(tǒng)中,一旦改變或添加目標(biāo)關(guān)鍵詞,必需重新建立與該新的目標(biāo)關(guān)鍵詞相關(guān)的垃圾模型。 根據(jù)以下參照附圖對(duì)示例性實(shí)施例的描述,本發(fā)明的其它特征將變得明顯。


圖I是常規(guī)語(yǔ)音關(guān)鍵詞檢出系統(tǒng)的方框圖。圖2是根據(jù)本發(fā)明的語(yǔ)音關(guān)鍵詞檢出系統(tǒng)的方框圖。圖3是創(chuàng)建用于本發(fā)明的語(yǔ)音關(guān)鍵詞檢出系統(tǒng)的詞典的系統(tǒng)的方框圖。圖4是創(chuàng)建用于本發(fā)明的語(yǔ)音關(guān)鍵詞檢出系統(tǒng)的詞典的流程圖。圖5是訓(xùn)練輔音模型和元音模型的流程圖。圖6是根據(jù)本發(fā)明第一實(shí)施例的創(chuàng)建詞典的流程圖,該詞典包括與目標(biāo)關(guān)鍵詞列表中的所有目標(biāo)關(guān)鍵詞相關(guān)的OOV詞的CV序列。圖7是根據(jù)本發(fā)明第一實(shí)施例的生成與一個(gè)目標(biāo)關(guān)鍵詞相關(guān)的OOV詞的CV序列的流程圖。圖8是生成長(zhǎng)度在最小長(zhǎng)度和最大長(zhǎng)度之間的所有CV序列的流程圖。圖9是確定目標(biāo)關(guān)鍵詞KWi的誤警樣本的流程圖。圖10是根據(jù)本發(fā)明第二實(shí)施例的創(chuàng)建詞典的流程圖,該詞典包括與目標(biāo)關(guān)鍵詞列表中的所有目標(biāo)關(guān)鍵詞相關(guān)的OOV詞的CV序列。圖11是根據(jù)本發(fā)明第二實(shí)施例的生成與一個(gè)目標(biāo)關(guān)鍵詞相關(guān)的OOV詞的CV序列的流程圖。圖12是示出能夠?qū)崿F(xiàn)本發(fā)明的實(shí)施例的計(jì)算機(jī)系統(tǒng)的硬件配置的方框圖。圖13是示出常規(guī)語(yǔ)音關(guān)鍵詞檢出系統(tǒng)和根據(jù)本發(fā)明的語(yǔ)音關(guān)鍵詞檢出系統(tǒng)之間的比較的圖表。
具體實(shí)施例方式現(xiàn)在將按照附圖詳細(xì)描述本發(fā)明的優(yōu)選實(shí)施例。注意,實(shí)施例中的部件的相對(duì)布置以及設(shè)備的形狀僅是作為示例,并不旨在將本發(fā)明的范圍限制于這些示例。此外,在圖中,類(lèi)似的附圖標(biāo)記和字母指代類(lèi)似的項(xiàng),由此,一旦在一個(gè)圖中定義了一項(xiàng),無(wú)需對(duì)于隨后的圖討論該項(xiàng)。(常規(guī)語(yǔ)音關(guān)鍵詞檢出系統(tǒng))圖I是常規(guī)語(yǔ)音關(guān)鍵詞檢出系統(tǒng)IA的方框圖。在圖I中,使用關(guān)鍵詞無(wú)關(guān)的通用垃圾模型的語(yǔ)音關(guān)鍵詞檢出系統(tǒng)IA包括語(yǔ)音輸入單元101、特征提取單元102、分類(lèi)器單元103、輸出單元104、聲學(xué)模型單元105和詞典單元 106。語(yǔ)音輸入單元101用于接收并處理(例如,預(yù)濾波、采樣、量化、加窗和預(yù)加權(quán)等)輸入語(yǔ)音信號(hào),該輸入語(yǔ)音信號(hào)通常是一系列聲學(xué)波形。經(jīng)處理的信號(hào)被輸入特征提取單元102,該特征提取單元102從經(jīng)處理的信號(hào)提取特征并且獲取波譜表示。通常使用的波譜 表不是 MFCC (梅爾倒譜系數(shù),mel frequency cepstral coefficients), MFCC 提供輸入語(yǔ)音信號(hào)的每幀的特征矢量。MFCC矢量被輸入分類(lèi)器單元103,分類(lèi)器單元103識(shí)別輸入語(yǔ)音段的幀是目標(biāo)關(guān)鍵詞還是OOV詞。隨后,表示輸入語(yǔ)音信號(hào)是目標(biāo)關(guān)鍵詞還是OOV詞的識(shí)別結(jié)果被發(fā)送到輸出單元104,輸出單元104輸出該識(shí)別結(jié)果。在分類(lèi)器單元103的識(shí)別(分類(lèi))期間,詞典單元106和聲學(xué)模型單元105提供對(duì)于分類(lèi)器單兀103的輸入。具體地,常規(guī)的詞典單元106包括詞庫(kù)和語(yǔ)法,在詞庫(kù)中,代表一個(gè)或更多個(gè)目標(biāo)關(guān)鍵詞的音子序列(例如,代表目標(biāo)關(guān)鍵詞“Stop”的音子序列“S T AA P”)的所有候選關(guān)鍵詞的發(fā)音以及代表通用垃圾的序列的發(fā)音被提供,并且在語(yǔ)法中,目標(biāo)關(guān)鍵詞列表和通用垃圾的序列被提供。聲學(xué)模型單元105包括用于構(gòu)成目標(biāo)關(guān)鍵詞的音子的模型(例如,音子“S”的模型、音子“T”的模型、音子“AA”的模型、和音子“P”的模型),以及用于通用垃圾的音子模型。當(dāng)本申請(qǐng)中提到模型時(shí),其通常是隱馬爾可夫模型(Hidden Markov model,HMM)。關(guān)于HMM及其在語(yǔ)音識(shí)別系統(tǒng)中的應(yīng)用,可以參照清華大學(xué)出版社的“現(xiàn)代語(yǔ)音技術(shù)基礎(chǔ)和應(yīng)用”。在圖I中的常規(guī)語(yǔ)音關(guān)鍵詞檢出系統(tǒng)IA中,分類(lèi)器單元103按照詞典單元106中的關(guān)鍵詞列表中的目標(biāo)關(guān)鍵詞的音子序列,連結(jié)聲學(xué)模型單兀105中的對(duì)應(yīng)的音子模型,以建立目標(biāo)關(guān)鍵詞的模型(即,目標(biāo)關(guān)鍵詞模型)。此外,分類(lèi)器單元103還按照詞典單元106中的通用垃圾的序列連結(jié)聲學(xué)模型單元105中的用于通用垃圾的音子模型,以建立通用垃圾模型。使用這些目標(biāo)關(guān)鍵詞模型和通用垃圾模型,分類(lèi)器單元103將輸入語(yǔ)音信號(hào)分類(lèi)為目標(biāo)關(guān)鍵詞或OOV詞。具體地,對(duì)于輸入語(yǔ)音信號(hào)而言,如果目標(biāo)關(guān)鍵詞的概率是最高概率,則分類(lèi)器單元103將輸入語(yǔ)音信號(hào)分類(lèi)為目標(biāo)關(guān)鍵詞,如果OOV詞的概率是最高概率,則將輸入語(yǔ)音信號(hào)分類(lèi)為OOV詞。對(duì)于輸入語(yǔ)音信號(hào)而言的目標(biāo)關(guān)鍵詞的概率指的是目標(biāo)關(guān)鍵詞模型與輸入語(yǔ)音信號(hào)之間的相似度。類(lèi)似地,對(duì)于輸入語(yǔ)音信號(hào)而言的OOV詞的概率指的是OOV詞的通用垃圾模型與輸入語(yǔ)音信號(hào)之間的相似度。如上所述,由于通用垃圾模型是特定關(guān)鍵詞無(wú)關(guān)的,所以這樣的分類(lèi)具有高誤警率。(根據(jù)本發(fā)明的輔音模型和元音模型)
在本發(fā)明中,為了建立關(guān)鍵詞相關(guān)的垃圾模型,按照音子的固有特征將訓(xùn)練數(shù)據(jù)在音子級(jí)別聚類(lèi)為兩類(lèi)輔音(第一類(lèi)音子)和元音(第二類(lèi)音子)。輔音是利用聲道的完全或部分閉合來(lái)發(fā)聲的語(yǔ)音聲音。例子有[P]是以嘴唇來(lái)發(fā)音;[t]是以舌頭的前部來(lái)發(fā)音;[k]是以舌頭的后部來(lái)發(fā)音;[h]是在喉部中發(fā)音;[f]和[s]是使空氣流過(guò)狹窄的通道(摩擦)來(lái)發(fā)音;并且[m]和[η]是使空氣流過(guò)鼻子來(lái)發(fā)音(鼻音)。元音是利用開(kāi)放的聲道來(lái)發(fā)聲的語(yǔ)音聲音,例如英語(yǔ)的ah ! [a:],其以聲道的振動(dòng)來(lái)發(fā)音。這與輔音的不同在于在沿著聲道的某一點(diǎn)處存在限制或閉合。也可以基于音子的各種固有特征按照任何其它方式對(duì)音子聚類(lèi)?;谏厦娴木垲?lèi),建立并且訓(xùn)練輔音模型和元音模型。圖5是訓(xùn)練輔音模型和元音模型的流程圖。如圖5所示,利用訓(xùn)練庫(kù)中的輔音的音子樣本對(duì)輔音模型進(jìn)行訓(xùn)練,并且利用訓(xùn)練庫(kù)中的元音的音子樣本對(duì)元音模型進(jìn)行訓(xùn)練。在訓(xùn)練之后,分別對(duì)于輔音和元音建立HMM模型。對(duì)于輔音模型和元音模型中的 每一個(gè),獲得轉(zhuǎn)移概率矩陣A = a01a02. . . anl. . . am,每個(gè)au代表每個(gè)子音子(一個(gè)音子由多個(gè)子音子構(gòu)成)自循環(huán)或變?yōu)橄乱蛔右糇拥母怕?。獲得觀察值的似然度矩陣B = h (Ot),bi(ot)表示從一個(gè)子音子生成的在幀t處的波譜特征矢量的概率。(根據(jù)本發(fā)明的語(yǔ)音關(guān)鍵詞檢出系統(tǒng))圖2是本發(fā)明的語(yǔ)音關(guān)鍵詞檢出系統(tǒng)IB的方框圖。語(yǔ)音關(guān)鍵詞檢出系統(tǒng)IB與常規(guī)語(yǔ)音關(guān)鍵詞檢出系統(tǒng)IA的一個(gè)不同在于,除了用于目標(biāo)關(guān)鍵詞的音子模型和用于通用垃圾的音子模型以外,本發(fā)明的聲學(xué)模型單元105A包括上述輔音模型(第一類(lèi)模型)和元音模型(第二類(lèi)模型)。另一個(gè)不同在于在詞典單元106A中,在語(yǔ)法中包括用于OOV詞的至少一個(gè)CV序列(兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列)。CV序列中的C代表輔音(第一類(lèi)音子),CV序列中的V代表元音(第二類(lèi)音子)。CV序列是依賴(lài)于目標(biāo)關(guān)鍵詞及其誤警樣本生成的。詞庫(kù)進(jìn)一步包括代表用于集外(OOV)詞的至少一個(gè)CV序列的發(fā)音。除了按照目標(biāo)關(guān)鍵詞的音子序列連結(jié)目標(biāo)關(guān)鍵詞的音子模型(即,建立目標(biāo)關(guān)鍵詞模型)之外,分類(lèi)器單元103按照詞典單元106A中的用于OOV詞的CV序列連結(jié)聲學(xué)模型單元105A中的輔音模型和元音模型。在以下描述中,將通過(guò)按照CV序列連結(jié)輔音模型和元音模型生成的模型稱(chēng)為CV垃圾模型。分類(lèi)器單元103將輸入語(yǔ)音信號(hào)分類(lèi)為目標(biāo)關(guān)鍵詞或者OOV詞(S卩,非關(guān)鍵詞)。具體地,如果目標(biāo)關(guān)鍵詞的概率是最高概率,則分類(lèi)器單元103將輸入語(yǔ)音信號(hào)分類(lèi)為目標(biāo)關(guān)鍵詞,如果CV序列的概率或者非關(guān)鍵詞的概率是最高概率,則將輸入語(yǔ)音信號(hào)分類(lèi)為OOV詞。注意,根據(jù)本發(fā)明的語(yǔ)音關(guān)鍵詞檢出系統(tǒng)IB可以包括如圖I所示的用于通用垃圾的音子模型,通用垃圾的序列以及代表通用垃圾的序列的發(fā)音。但是,本發(fā)明可以在沒(méi)有該部件的情況下實(shí)現(xiàn)。在語(yǔ)音關(guān)鍵詞檢出系統(tǒng)IB的語(yǔ)法中,由于CV序列是基于特定目標(biāo)關(guān)鍵詞及其誤警樣本生成的,所以具有與目標(biāo)關(guān)鍵詞類(lèi)似的發(fā)音的OOV詞能夠被識(shí)別為非關(guān)鍵詞。由此,與使用關(guān)鍵詞無(wú)關(guān)的通用垃圾模型的常規(guī)語(yǔ)音關(guān)鍵詞檢出系統(tǒng)IA相比,能夠顯著地降低
誤警率。此外,與使用關(guān)鍵詞相關(guān)的許多單獨(dú)的垃圾模型的常規(guī)語(yǔ)音關(guān)鍵詞檢出系統(tǒng)相t匕,由于只建立了兩個(gè)模型,即,第一類(lèi)模型(輔音模型)和第二類(lèi)模型(元音模型),所以計(jì)算和存儲(chǔ)負(fù)荷顯著降低。此外,在使用關(guān)鍵詞相關(guān)的許多單獨(dú)的垃圾模型的常規(guī)語(yǔ)音關(guān)鍵詞檢出系統(tǒng)中,一旦改變或添加目標(biāo)關(guān)鍵詞,用于關(guān)鍵詞的垃圾模型必須被重新建立。然而,在本發(fā)明中,當(dāng)改變或添加目標(biāo)關(guān)鍵詞時(shí),只需要生成新的CV序列,而無(wú)需建立任何新的模型。注意,上述單元和以下要描述的單元是用于實(shí)施以下要描述的過(guò)程的示例性的和/或優(yōu)選的模塊。這些單元可以是硬件單元(諸如場(chǎng)可編程門(mén)陣列、數(shù)字信號(hào)處理器或?qū)S眉呻娐返?和/或軟件模塊(諸如計(jì)算機(jī)可讀程序)。以上并未詳盡地描述用于實(shí)現(xiàn)各個(gè)步驟的單元。然而,只要有執(zhí) 行某個(gè)處理的步驟,就可以有用于實(shí)現(xiàn)同一處理的對(duì)應(yīng)的功能模塊或單元(由硬件和/或軟件實(shí)施)。通過(guò)以下描述的步驟以及與這些步驟對(duì)應(yīng)的單元的所有組合限定的技術(shù)方案都包括在本申請(qǐng)的公開(kāi)內(nèi)容中,只要它們構(gòu)成的這些技術(shù)方案是完整并且可應(yīng)用的。此外,由各種單元構(gòu)成的以上系統(tǒng)可以作為功能模塊被并入到諸如計(jì)算機(jī)之類(lèi)的硬件裝置中。除了這些功能模塊之外,計(jì)算機(jī)當(dāng)然可以具有其他硬件或者軟件部件。(創(chuàng)建用于語(yǔ)音關(guān)鍵詞檢出系統(tǒng)的詞典的系統(tǒng))圖3是創(chuàng)建用于本發(fā)明的語(yǔ)音關(guān)鍵詞檢出系統(tǒng)的詞典的系統(tǒng)的方框圖。創(chuàng)建用于語(yǔ)音關(guān)鍵詞檢出系統(tǒng)的詞典的系統(tǒng)200包括聚類(lèi)單元201,用于基于語(yǔ)音數(shù)據(jù)的固有特征將語(yǔ)音數(shù)據(jù)聚類(lèi)為輔音和元音;CV序列生成單元202,用于依賴(lài)于目標(biāo)關(guān)鍵詞列表中的目標(biāo)關(guān)鍵詞的音子序列生成用于集外詞的至少一個(gè)CV序列,C代表輔音,V代表元音;和用于將所述至少一個(gè)CV序列添加到詞典中的單元203。該系統(tǒng)200能夠?qū)崿F(xiàn)創(chuàng)建用于語(yǔ)音關(guān)鍵詞檢出系統(tǒng)的詞典的下述方法。創(chuàng)建用于語(yǔ)音關(guān)鍵詞檢出系統(tǒng)的詞典的系統(tǒng)200可以是孤立的形式,或者被并入本發(fā)明的語(yǔ)音關(guān)鍵詞檢出系統(tǒng)IB中的分類(lèi)器單元103中。(創(chuàng)建用于語(yǔ)音關(guān)鍵詞檢出系統(tǒng)的詞典的方法)圖4示出創(chuàng)建用于本發(fā)明的語(yǔ)音關(guān)鍵詞檢出系統(tǒng)的詞典的流程圖。在圖4所示的方法中,首先基于語(yǔ)音數(shù)據(jù)的固有特征將語(yǔ)音數(shù)據(jù)聚類(lèi)為輔音和元音(S301)。然后,依賴(lài)于目標(biāo)關(guān)鍵詞列表中的目標(biāo)關(guān)鍵詞的音子序列,生成集外詞的至少一個(gè)CV序列(S302)。C代表輔音,V代表元音。然后,將所述至少一個(gè)CV序列添加到詞典中(S303)。在創(chuàng)建用于語(yǔ)音關(guān)鍵詞檢出系統(tǒng)的詞典的系統(tǒng)200中實(shí)現(xiàn)創(chuàng)建用于語(yǔ)音關(guān)鍵詞檢出系統(tǒng)的詞典的方法。下面是創(chuàng)建詞典的方法的細(xì)節(jié)。(根據(jù)本發(fā)明的第一實(shí)施例的創(chuàng)建包括代表目標(biāo)關(guān)鍵詞相關(guān)的OOV詞的CV序列的詞典)圖6是根據(jù)本發(fā)明的第一實(shí)施例的創(chuàng)建包括與目標(biāo)關(guān)鍵詞列表中的所有目標(biāo)關(guān)鍵詞相關(guān)的OOV詞的CV序列的詞典的流程圖。CV序列的生成是基于目標(biāo)關(guān)鍵詞及其誤警樣本創(chuàng)建詞典的主要過(guò)程。對(duì)于目標(biāo)關(guān)鍵詞列表中的所有目標(biāo)關(guān)鍵詞執(zhí)行該生成過(guò)程。在如圖3所示的系統(tǒng)200和/或如圖2所示的分類(lèi)器單元103中執(zhí)行CV序列的生成。例如,在下面的描述中,CV序列的生成在分類(lèi)器單元103中執(zhí)行。首先,獲得目標(biāo)關(guān)鍵詞列表中的一個(gè)目標(biāo)關(guān)鍵詞(S401)。如果獲得的目標(biāo)關(guān)鍵詞不為空(S402中的“是”),則分類(lèi)器單元103基于該目標(biāo)關(guān)鍵詞及其輸入的誤警樣本生成用于該目標(biāo)關(guān)鍵詞的OOV詞的至少一個(gè)CV序列(S403)。隨后將描述基于一個(gè)目標(biāo)關(guān)鍵詞及其輸入的誤警樣本生成該目標(biāo)關(guān)鍵詞的OOV詞的至少一個(gè)CV序列(S403)的細(xì)節(jié)。在S403中生成CV序列之后,將生成的CV序列存儲(chǔ)在緩沖器(未示出)中(S404)。然后,流程圖返回到S401以獲得目標(biāo)關(guān)鍵詞列表中的下一個(gè)目標(biāo)關(guān)鍵詞,并且如果S402中的確定為“是”,則重復(fù)步驟S403到S404。如果在S401中獲得的目標(biāo)關(guān)鍵詞為空(S402中為“否”),這意味著目標(biāo)關(guān)鍵詞列表中的所有目標(biāo)關(guān)鍵詞已被處理,并且再?zèng)]有目標(biāo)關(guān)鍵詞需要被處理。然后,分類(lèi)器單元103收集在緩沖器中的所有生成的CV序列,并且刪除重復(fù)的CV序列(S405)。例如,如果用于目標(biāo)關(guān)鍵詞KW1的生成的CV序列是“CVCV”、“VCCV”和“CVC”,并且用于目標(biāo)關(guān)鍵詞KW2·的生成的CV序列是“CVVC”、“CVC”和“VCV”,那么在收集和刪除之后的用于目標(biāo)關(guān)鍵詞KW1和目標(biāo)關(guān)鍵詞KW2兩者的CV序列是“CVCV”,“VCCV”,“CVC” “CVVC”和“VCV”,刪除了一個(gè)重復(fù)的序列“CVC”。所得的CV序列被添加到詞典單元106A中的語(yǔ)法中(S406)。然后,該過(guò)程結(jié)束。(根據(jù)第一實(shí)施例的生成代表一個(gè)目標(biāo)關(guān)鍵詞KWi的OOV詞的CV序列)現(xiàn)在將參照?qǐng)D7描述基于一個(gè)目標(biāo)關(guān)鍵詞及其輸入的誤警樣本生成至少一個(gè)CV序列(S403)的細(xì)節(jié)。圖7是根據(jù)本發(fā)明的第一實(shí)施例的生成與一個(gè)目標(biāo)關(guān)鍵詞KWi相關(guān)的OOV詞的CV序列的流程圖。首先,目標(biāo)關(guān)鍵詞KWi被輸入如圖2所示的分類(lèi)器單元103中(S501)。然后,對(duì)于目標(biāo)關(guān)鍵詞KWi創(chuàng)建臨時(shí)語(yǔ)法(S502)。對(duì)于目標(biāo)關(guān)鍵詞KWi的臨時(shí)語(yǔ)法包括目標(biāo)關(guān)鍵詞KWi本身以及長(zhǎng)度等于或大于最小長(zhǎng)度并且等于或小于最大長(zhǎng)度的所有可能CV序列。最小長(zhǎng)度和最大長(zhǎng)度是預(yù)定義的。為了找出目標(biāo)關(guān)鍵詞KWi的OOV詞的CV序列而創(chuàng)建臨時(shí)語(yǔ)法。長(zhǎng)度等于或大于最小長(zhǎng)度并且等于或小于最大長(zhǎng)度的所有可能CV序列是預(yù)先確定的。確定這些所有可能CV序列的細(xì)節(jié)在圖8中示出。圖8是生成長(zhǎng)度等于或大于最小長(zhǎng)度并且等于或小于最大長(zhǎng)度的所有可能CV序列的流程圖。在圖8中,首先獲得如下CV序列的最大長(zhǎng)度LENmax和最小長(zhǎng)度LENmin,該CV序列是從詞庫(kù)中的所有候選關(guān)鍵詞的音子序列轉(zhuǎn)換而來(lái)的(S601)。在詞庫(kù)中,提供代表一個(gè)或更多個(gè)目標(biāo)關(guān)鍵詞的音子序列的所有候選關(guān)鍵詞的發(fā)音。通過(guò)將候選關(guān)鍵詞的音子序列聚類(lèi)為兩類(lèi)輔音和元音,來(lái)獲得候選關(guān)鍵詞的CV序列。如果音子序列中的一個(gè)音子是輔音,它由CV序列中的“C”代表。如果一個(gè)音子是元音,它由CV序列中的“V”代表。例如,關(guān)于候選關(guān)鍵詞“start”,可以通過(guò)將音子序列/S/、/T/、/AA/、/R/、/T/依次聚類(lèi)為輔音、輔音、元音、輔音和輔音,來(lái)獲得CV序列“CCVCC”。CV序列“CCVCC”的長(zhǎng)度是五。以相同的方式,能夠計(jì)算詞庫(kù)中的所有候選關(guān)鍵詞的CV序列的長(zhǎng)度。由此,能夠獲得LENmax和LENmin。注意,也可以通過(guò)直接計(jì)數(shù)候選關(guān)鍵詞的音子序列中的每一個(gè)中的音子的數(shù)量來(lái)獲得LENmax和 LENmin。在生成長(zhǎng)度等于或大于最小長(zhǎng)度并且等于或小于最大長(zhǎng)度的所有CV序列的過(guò)程中,設(shè)定兩個(gè)參數(shù)LenCT和Listi,LenCT代表其范圍是等于或大于最小長(zhǎng)度并且等于或大于最大長(zhǎng)度的一個(gè)CV序列的長(zhǎng)度,Listi代表具有某一長(zhǎng)度的CV序列的列表。開(kāi)始時(shí),將參數(shù)Lencv設(shè)為L(zhǎng)ENmin,并且將i設(shè)為I (S602)。當(dāng)i = I時(shí),Listi代表長(zhǎng)度Lencv = LENmin的CV序列的列表。找出長(zhǎng)度=Lencv的所有CV序列并將其存儲(chǔ)在Listi中(S603)。將Lencv和i分別遞增(S604),并且重復(fù)步驟S603和S604,直到Lenev > LENmax (S605)。所有找到的列表被收集作為長(zhǎng)度等于或大于最小長(zhǎng)度并且等于或小于最大長(zhǎng)度的所有可能CV序列(S606)。該過(guò)程返回到圖7中的S502。通過(guò)組合目標(biāo)關(guān)鍵詞KWi本身和長(zhǎng)度等于或大于最小長(zhǎng)度并且等于或小于最大長(zhǎng)度的所有可能CV序列,創(chuàng)建臨時(shí)語(yǔ)法。 然后,執(zhí)行用于從長(zhǎng)度等于或大于最小長(zhǎng)度并且等于或小于最大長(zhǎng)度的所有可能CV序列中找出用于代表目標(biāo)關(guān)鍵詞KWi的OOV詞的CV序列。首先,確定是否存在目標(biāo)關(guān)鍵詞KWi的誤警樣本(S503)。目標(biāo)關(guān)鍵詞KWi的誤警樣本代表易于被識(shí)別為目標(biāo)關(guān)鍵詞KWi的OOV詞。能夠通過(guò)圖9中示出的過(guò)程預(yù)先確定誤警樣本。圖9是確定目標(biāo)關(guān)鍵詞KWi的誤警樣本的流程圖。首先,輸入訓(xùn)練庫(kù)(S701)。然后,使用如圖2中描述的通用垃圾模型和關(guān)鍵詞模型來(lái)執(zhí)行分類(lèi)或識(shí)別(S702)。隨后,對(duì)于每個(gè)目標(biāo)關(guān)鍵詞KWi,找出被分類(lèi)為目標(biāo)關(guān)鍵詞KWi的OOV詞(S703)。將每個(gè)OOV詞確定為目標(biāo)關(guān)鍵詞KWi的一個(gè)誤警樣本(S704)。使用多個(gè)找出的誤警樣本來(lái)生成圖7的過(guò)程中的目標(biāo)關(guān)鍵詞KWi的OOV詞的CV序列。該過(guò)程回到圖7中的S503。如果存在目標(biāo)關(guān)鍵詞KWi的預(yù)定誤警樣本(S503中為“是”),則分類(lèi)器單元103基于目標(biāo)關(guān)鍵詞KWi的臨時(shí)語(yǔ)法、如圖2中所示的KWi的關(guān)鍵詞模型以及輔音模型和元音模型,識(shí)別輸入的誤警樣本,并輸出識(shí)別結(jié)果(S504)。找出識(shí)別結(jié)果中的識(shí)別概率滿足預(yù)定條件的CV序列,作為用于OOV詞的候選CV序列(S505)。隨后將描述預(yù)定條件的細(xì)節(jié)。此后,與找出的CV序列一一對(duì)應(yīng)的計(jì)數(shù)器被遞增(S506)。然后,過(guò)程返回到S503以確定是否存在目標(biāo)關(guān)鍵詞KWi的下一個(gè)誤警樣本(S503)。如果存在(S503中為“是”),則重復(fù)步驟S504到S506。如果對(duì)于目標(biāo)關(guān)鍵詞KWi的所有誤警樣本進(jìn)行了該處理,S卩,S503中的確定為“否”,則過(guò)程進(jìn)行到S507。在S507中,將候選CV序列利用它們的相應(yīng)計(jì)數(shù)器的值進(jìn)行排序,并且選擇前N個(gè)候選CV序列,即,前N個(gè)頻繁找到的候選CV序列作為目標(biāo)關(guān)鍵詞KWJ^OOV詞的CV序列。優(yōu)選地,I彡N彡所有目標(biāo)關(guān)鍵詞的總數(shù)。然后,圖7的過(guò)程結(jié)束。(找出候選CV序列的預(yù)定條件)存在定義找出候選CV序列的預(yù)定條件的各種方式。一個(gè)可能的方式是在目標(biāo)關(guān)鍵詞KWi的一個(gè)誤警樣本的識(shí)別結(jié)果中,找出識(shí)別概率高于KWi的識(shí)別概率的CV序列,作為候選CV序列。另選地,找出候選CV序列的方式是在目標(biāo)關(guān)鍵詞KWi的一個(gè)誤警樣本的識(shí)別結(jié)果中,找出具有較高識(shí)別概率的前M個(gè)CV序列,作為候選CV序列。優(yōu)選地,I < M <所有目標(biāo)關(guān)鍵詞的總數(shù)。
另選地,找出候選CV序列的方式是在目標(biāo)關(guān)鍵詞KWi的一個(gè)誤警樣本的識(shí)別結(jié)果中,找出識(shí)別概率高于諸如O. 2的閾值的CV序列作為候選CV序列。(根據(jù)本發(fā)明第二實(shí)施例的創(chuàng)建包括代表目標(biāo)關(guān)鍵詞相關(guān)的OOV詞的CV序列的詞典)圖10是根據(jù)本發(fā)明第二實(shí)施例的創(chuàng)建包括與目標(biāo)關(guān)鍵詞列表中的所有目標(biāo)關(guān)鍵詞相關(guān)的OOV詞的CV序列的詞典的流程圖。步驟S401到S402、S404和S406與圖6中的一樣。省略相應(yīng)的描述以避免重復(fù)。不同在于S403A中的生成用于一個(gè)目標(biāo)關(guān)鍵詞的OOV詞的至少一個(gè)CV序列的處理以及S405A中的選擇用于所有目標(biāo)關(guān)鍵詞的CV序列的處理。具體地,在根據(jù)第二實(shí)施例的生成用于一個(gè)目標(biāo)關(guān)鍵詞的OOV詞的至少一個(gè)CV序列的處理中,取消了選擇用于目標(biāo)關(guān)鍵詞KWi的OOV詞的前N個(gè)頻繁找到的CV序列的步驟 (圖7的S507),如圖11所示。取而代之,對(duì)于所有目標(biāo)關(guān)鍵詞在S405A中執(zhí)行前N個(gè)頻繁找出的CV序列的選擇。具體地,在步驟S405A中,在S404中一旦在緩沖器中存儲(chǔ)用于每個(gè)目標(biāo)關(guān)鍵詞的OOV詞的候選CV序列及其計(jì)數(shù)器,并且再?zèng)]有需要處理的目標(biāo)關(guān)鍵詞,就收集所有候選CV序列并利用其計(jì)數(shù)器進(jìn)行排序。如果存在用于不同目標(biāo)關(guān)鍵詞的OOV詞的重復(fù)的候選CV序列,則將它們的計(jì)數(shù)器累加。例如,“CVC”序列是用于目標(biāo)關(guān)鍵詞KW1的OOV詞的候選CV序列,并且關(guān)于目標(biāo)關(guān)鍵詞KW1的“CVC”序列的第一計(jì)數(shù)器為36。此外,“CVC”序列還是用于目標(biāo)關(guān)鍵詞KW2的OOV詞的候選CV序列,并且關(guān)于目標(biāo)關(guān)鍵詞KW2的“CVC”序列的第二計(jì)數(shù)器為45。那么,用于目標(biāo)關(guān)鍵詞KW1和KW2兩者的OOV詞的“CVC”序列的累加計(jì)數(shù)器為81。在累加之后,利用所有候選CV序列的計(jì)數(shù)器對(duì)所有候選CV序列排序。然后,選擇前N個(gè)候選CV序列,8卩,前N個(gè)頻繁找出的CV序列,作為用于所有目標(biāo)關(guān)鍵詞的OOV詞的CV序列。優(yōu)選地,I SNS所有目標(biāo)關(guān)鍵詞的總數(shù)。利用第二實(shí)施例,可以限制用于所有目標(biāo)關(guān)鍵詞的OOV詞的CV序列的總數(shù)。因此,能夠進(jìn)一步降低分類(lèi)(識(shí)別)時(shí)的計(jì)算和存儲(chǔ)負(fù)荷。(能夠?qū)崿F(xiàn)本發(fā)明的實(shí)施例的硬件配置)圖12是示出能夠?qū)崿F(xiàn)本發(fā)明的實(shí)施例的計(jì)算機(jī)系統(tǒng)1000的硬件配置的框圖。如圖12所示,計(jì)算機(jī)系統(tǒng)包括計(jì)算機(jī)1110。計(jì)算機(jī)1110包括經(jīng)由系統(tǒng)總線1121連接的處理單元1120、系統(tǒng)存儲(chǔ)器1130、不可移動(dòng)非易失性存儲(chǔ)器接口 1140、可移動(dòng)非易失性存儲(chǔ)器接口 1150、用戶輸入接口 1160、網(wǎng)絡(luò)接口 1170、視頻接口 1190和輸出外圍接口1195。系統(tǒng)存儲(chǔ)器1130包括R0M(只讀存儲(chǔ)器)1131和RAM(隨機(jī)存取存儲(chǔ)器)1132。BIOS(基本輸入輸出系統(tǒng))1133駐留在ROM 1131中。操作系統(tǒng)1134、應(yīng)用程序1135、其它程序單元1136和某些程序數(shù)據(jù)1137駐留在RAM 1132中。諸如硬盤(pán)之類(lèi)的不可移動(dòng)非易失性存儲(chǔ)器1141連接到不可移動(dòng)非易失性存儲(chǔ)器接口 1140。不可移動(dòng)非易失性存儲(chǔ)器1141例如能夠存儲(chǔ)操作系統(tǒng)1144、應(yīng)用程序1145、其它程序單元1146和某些程序數(shù)據(jù)1147。諸如軟盤(pán)驅(qū)動(dòng)器1151和⑶-ROM驅(qū)動(dòng)器1155之類(lèi)的可移動(dòng)非易失性存儲(chǔ)器連接到可移動(dòng)非易失性存儲(chǔ)器接口 1150。例如,軟盤(pán)1152可以被插入到軟盤(pán)驅(qū)動(dòng)器1151中,以及⑶(光盤(pán))1156可以被插入到⑶-ROM驅(qū)動(dòng)器1155中。諸如鼠標(biāo)1161和鍵盤(pán)1162之類(lèi)的輸入設(shè)備被連接到用戶輸入接口 1160。計(jì)算機(jī)1110能夠通過(guò)網(wǎng)絡(luò)接口 1170連接到遠(yuǎn)程計(jì)算機(jī)1180。例如,網(wǎng)絡(luò)接口1170能夠通過(guò)局域網(wǎng)1171連接到遠(yuǎn)程計(jì)算機(jī)1180。另選地,網(wǎng)絡(luò)接口 1170能夠連接到調(diào)制解調(diào)器(調(diào)制器-解調(diào)器)1172,以及調(diào)制解調(diào)器1172經(jīng)由廣域網(wǎng)1173連接到遠(yuǎn)程計(jì)算機(jī) 1180。遠(yuǎn)程計(jì)算機(jī)1180可以包括諸如硬盤(pán)之類(lèi)的存儲(chǔ)器1181,其存儲(chǔ)遠(yuǎn)程應(yīng)用程序1185。視頻接口 1190連接到監(jiān)視器1191。
輸出外圍接口 1195連接到打印機(jī)1196和揚(yáng)聲器1197。圖12所示的計(jì)算機(jī)系統(tǒng)僅僅是說(shuō)明性的并且決不意圖對(duì)本發(fā)明、其應(yīng)用或用途的任何限制。圖12所示的計(jì)算機(jī)系統(tǒng)能夠被實(shí)現(xiàn)于任何實(shí)施例,能夠作為獨(dú)立計(jì)算機(jī),也能夠作為設(shè)備中的處理系統(tǒng),能夠移除一個(gè)或多個(gè)不必要的組件,或者向其添加一個(gè)或多個(gè)附加的組件。(建立在根據(jù)本發(fā)明的語(yǔ)音關(guān)鍵詞檢出系統(tǒng)中使用的CV垃圾模型的例子)以下解釋在如圖2所示的根據(jù)本發(fā)明的語(yǔ)音關(guān)鍵詞檢出系統(tǒng)中建立用于僅一個(gè)目標(biāo)關(guān)鍵詞的CV垃圾模型的示例。 目標(biāo)關(guān)鍵詞中文中的“開(kāi)始” 拼音發(fā)音kail shi3·關(guān)鍵詞的音子序列k ai sh iii·相關(guān)元音-輔音序列CVCV以下是在三種語(yǔ)言的語(yǔ)音關(guān)鍵詞檢出系統(tǒng)中的一個(gè)實(shí)施例。注意,語(yǔ)音關(guān)鍵詞檢出系統(tǒng)可以是任何適當(dāng)?shù)念?lèi)型,只要其可以實(shí)現(xiàn)語(yǔ)音關(guān)鍵詞檢出即可?!つ繕?biāo)語(yǔ)言中文、英文和日文·詞庫(kù)中的候選關(guān)鍵詞100個(gè)中文常用詞、100個(gè)英文常用詞和100個(gè)日文常用詞·分類(lèi)器用于孤立詞識(shí)別的基于Viterbi搜索的HMM解碼器(分類(lèi)器) 模型*通用垃圾模型利用所有語(yǔ)音庫(kù)訓(xùn)練,其為三個(gè)狀態(tài),64個(gè)混合HMM*關(guān)鍵詞模型語(yǔ)言相關(guān)的三個(gè)狀態(tài),兩個(gè)混合,800個(gè)共享狀態(tài)的HMM*5 (或10)個(gè)CV垃圾模型以下是建立5或10個(gè)CV垃圾模型的處理。利用三種語(yǔ)言的訓(xùn)練庫(kù)中的所有元音樣本訓(xùn)練元音模型。利用三種語(yǔ)言的訓(xùn)練庫(kù)中的所有輔音樣本訓(xùn)練輔音模型。利用基于所述300個(gè)候選關(guān)鍵詞獲得的最大長(zhǎng)度和最小長(zhǎng)度收集總共86個(gè)可能的CV序列。在預(yù)定條件下以所述86個(gè)可能的CV序列的出現(xiàn)頻率對(duì)所述86個(gè)可能的CV序列排序。從86個(gè)可能的CV序列中選擇前5個(gè)和前10個(gè)CV序列。按照前5個(gè)和前10個(gè)CV序列連結(jié)元音模型和輔音模型,以分別生成5個(gè)和10個(gè)CV垃圾模型。
(與常規(guī)語(yǔ)音關(guān)鍵詞檢出系統(tǒng)的比較)以下是根據(jù)本發(fā)明的語(yǔ)音關(guān)鍵詞檢出系統(tǒng)與圖I所示的常規(guī)語(yǔ)音關(guān)鍵詞檢出系統(tǒng)之間的比較。以下是測(cè)試集說(shuō)明 三個(gè)語(yǔ)言測(cè)試集中文、英文和日文 語(yǔ)法中采用10個(gè)目標(biāo)關(guān)鍵詞,在以上示例中建立對(duì)于每個(gè)目標(biāo)關(guān)鍵詞的CV垃圾模型?!?1000個(gè)中文詞、3000個(gè)英文詞和3000個(gè)日文詞,它們?cè)跍y(cè)試集中具有相同的分 布。圖13是示出基于以上測(cè)試集的、圖I中所示的常規(guī)語(yǔ)音關(guān)鍵詞檢出系統(tǒng)與本發(fā)明的語(yǔ)音關(guān)鍵詞檢出系統(tǒng)之間的比較的圖表。在圖13中,RC代表召回(recall)率,其是被正確識(shí)別的關(guān)鍵詞的數(shù)目/關(guān)鍵詞的總數(shù)。FA代表誤警率,其是(被識(shí)別為關(guān)鍵詞的非關(guān)鍵詞的數(shù)目+被識(shí)別為其它關(guān)鍵詞的關(guān)鍵詞的數(shù)目)/關(guān)鍵詞和非關(guān)鍵詞的總數(shù)。MD代表漏檢率,其是被識(shí)別為非關(guān)鍵詞的關(guān)鍵詞的數(shù)目/關(guān)鍵詞的總數(shù)。在圖13中,黑條表示使用通用垃圾模型的常規(guī)語(yǔ)音關(guān)鍵詞檢出系統(tǒng)的結(jié)果。灰條表示使用一個(gè)通用垃圾模型和五個(gè)CV垃圾模型(CV序列)的根據(jù)本發(fā)明的語(yǔ)音關(guān)鍵詞檢出系統(tǒng)的結(jié)果。白條表示使用一個(gè)通用垃圾模型和10個(gè)CV垃圾模型(CV序列)的根據(jù)本發(fā)明的語(yǔ)音關(guān)鍵詞檢出系統(tǒng)的結(jié)果。從圖13可以看出,與使用通用垃圾模型的常規(guī)語(yǔ)音關(guān)鍵詞檢出系統(tǒng)相比,本發(fā)明的語(yǔ)音關(guān)鍵詞檢出系統(tǒng)以?xún)H可忽略的RC的減小將FA減少了約30%。此外,具有5個(gè)CV垃圾模型的系統(tǒng)的性能和具有10個(gè)CV垃圾模型的系統(tǒng)的性能幾乎相同。可以看出,5個(gè)CV垃圾模型的情況就足夠了。考慮到計(jì)算和存儲(chǔ)負(fù)荷,具有5個(gè)CV垃圾模型的系統(tǒng)是優(yōu)選的。注意,建立5個(gè)或者10個(gè)垃圾模型僅是示例。可以建立任何適當(dāng)數(shù)量的CV垃圾模型。綜上所述,根據(jù)本發(fā)明的語(yǔ)音關(guān)鍵詞檢出系統(tǒng)能夠以可忽略的召回率的減小顯著降低誤警率。此外,由于在計(jì)算時(shí)僅需要考慮兩個(gè)用于OOV詞的模型,即,輔音模型和元音模型,所以使計(jì)算和存儲(chǔ)負(fù)荷保持低??梢酝ㄟ^(guò)各種方式執(zhí)行本發(fā)明的方法和設(shè)備。例如,可以通過(guò)軟件、硬件、固件或其任何組合來(lái)實(shí)施本發(fā)明的方法和設(shè)備。上述的方法步驟的次序僅是說(shuō)明性的,本發(fā)明的方法步驟不限于以上具體描述的次序,除非以其他方式明確說(shuō)明。此外,在一些實(shí)施例中,本發(fā)明還可以被實(shí)施為記錄在記錄介質(zhì)中的程序,其包括用于實(shí)現(xiàn)根據(jù)本發(fā)明的方法的機(jī)器可讀指令。因而,本發(fā)明還覆蓋存儲(chǔ)用于實(shí)現(xiàn)根據(jù)本發(fā)明的方法的程序的記錄介質(zhì)。雖然已通過(guò)示例詳細(xì)展示了本發(fā)明的一些具體實(shí)施例,但是本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,上述示例僅意圖是示例性的而不限制本發(fā)明的范圍。本領(lǐng)域技術(shù)人員應(yīng)該理解,上述實(shí)施例可以被修改而不脫離本發(fā)明的范圍和實(shí)質(zhì)。本發(fā)明的范圍是通過(guò)所附的權(quán)利要求限定的。
權(quán)利要求
1.一種語(yǔ)音關(guān)鍵詞檢出系統(tǒng),包括 輸入單兀,用于接收輸入語(yǔ)音信號(hào); 特征提取單元,用于從輸入語(yǔ)音信號(hào)提取至少一個(gè)特征; 分類(lèi)器單元,用于基于所述至少一個(gè)特征和詞典將輸入語(yǔ)音信號(hào)分類(lèi)為目標(biāo)關(guān)鍵詞或者集外詞;和 輸出單元,用于輸出分類(lèi)的結(jié)果, 其中,詞典包括語(yǔ)法,該語(yǔ)法包括目標(biāo)關(guān)鍵詞列表和用于集外詞的兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列;和詞庫(kù),該詞庫(kù)包括代表目標(biāo)關(guān)鍵詞列表中的一個(gè)或更多個(gè)目標(biāo)關(guān)鍵詞的音子序列的所有候選關(guān)鍵詞的發(fā)音以及代表用于集外詞的所述兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列的發(fā)音,所述兩個(gè)標(biāo)識(shí)符中的一個(gè)標(biāo)識(shí)符表示第一類(lèi)音子,另一個(gè)標(biāo)識(shí)符表示第二類(lèi)音子,第一類(lèi)音子和第二類(lèi)音子是基于音子的固有特征而聚類(lèi)的,并且 其中,第一類(lèi)音子、第二類(lèi)音子和用于一個(gè)或更多個(gè)目標(biāo)關(guān)鍵詞的音子分別由它們的模型描述。
2.根據(jù)權(quán)利要求I的語(yǔ)音關(guān)鍵詞檢出系統(tǒng),其中, 如果最高概率是目標(biāo)關(guān)鍵詞的概率,則分類(lèi)器單元將輸入語(yǔ)音信號(hào)分類(lèi)為目標(biāo)關(guān)鍵詞,如果最高概率是所述兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列的概率,則將輸入語(yǔ)音信號(hào)分類(lèi)為集外詞。
3.根據(jù)權(quán)利要求I的語(yǔ)音關(guān)鍵詞檢出系統(tǒng),其中 分類(lèi)器單元包括 用于對(duì)于每個(gè)目標(biāo)關(guān)鍵詞生成用于集外詞的所述兩個(gè)標(biāo)識(shí)符的序列的單元; 用于對(duì)于每個(gè)目標(biāo)關(guān)鍵詞選擇前N個(gè)最頻繁生成的所述兩個(gè)標(biāo)識(shí)符的序列的單元,其中N為等于或大于I的整數(shù);和 用于對(duì)于所有目標(biāo)關(guān)鍵詞收集對(duì)于每個(gè)目標(biāo)關(guān)鍵詞的所有選定的所述兩個(gè)標(biāo)識(shí)符的序列作為用于集外詞的所述兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列的單元。
4.根據(jù)權(quán)利要求I的語(yǔ)音關(guān)鍵詞檢出系統(tǒng),其中, 分類(lèi)器單元包括 用于對(duì)于每個(gè)目標(biāo)關(guān)鍵詞生成用于集外詞的所述兩個(gè)標(biāo)識(shí)符的序列的單元; 用于對(duì)于所有目標(biāo)關(guān)鍵詞收集對(duì)于每個(gè)目標(biāo)關(guān)鍵詞的所有生成的所述兩個(gè)標(biāo)識(shí)符的序列的單元;和 用于對(duì)于所有目標(biāo)關(guān)鍵詞選擇前N個(gè)最頻繁生成的所述兩個(gè)標(biāo)識(shí)符的序列,作為用于集外詞的所述兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列的單元,其中N為等于或大于I的整數(shù)。
5.根據(jù)權(quán)利要求3或4的語(yǔ)音關(guān)鍵詞檢出系統(tǒng),其中 所述用于對(duì)于每個(gè)目標(biāo)關(guān)鍵詞生成用于集外詞的所述兩個(gè)標(biāo)識(shí)符的序列的單元包括 用于確定目標(biāo)關(guān)鍵詞的誤警樣本的單元; 用于創(chuàng)建目標(biāo)關(guān)鍵詞的臨時(shí)語(yǔ)法的單元,所述臨時(shí)語(yǔ)法包括目標(biāo)關(guān)鍵詞以及長(zhǎng)度等于或大于最小長(zhǎng)度并且等于或小于最大長(zhǎng)度的所有的所述兩個(gè)標(biāo)識(shí)符的序列; 用于基于臨時(shí)語(yǔ)法、目標(biāo)關(guān)鍵詞的音子序列的模型、第一類(lèi)音子的模型和第二類(lèi)音子的模型,識(shí)別每個(gè)誤警樣本的單元;和用于找出每個(gè)誤警樣本的識(shí)別結(jié)果中的識(shí)別概率滿足預(yù)定條件的所述兩個(gè)標(biāo)識(shí)符的序列的單元。
6.根據(jù)權(quán)利要求5的語(yǔ)音關(guān)鍵詞檢出系統(tǒng),其中,所述預(yù)定條件是以下條件中的一個(gè) 1)在每個(gè)誤警樣本的識(shí)別結(jié)果中,所述兩個(gè)標(biāo)識(shí)符的序列的識(shí)別概率高于目標(biāo)關(guān)鍵詞的識(shí)別概率; 2)在每個(gè)誤警樣本的識(shí)別結(jié)果中,所述兩個(gè)標(biāo)識(shí)符的序列的識(shí)別概率高于閾值; 3)在每個(gè)誤警樣本的識(shí)別結(jié)果中,選出具有較高識(shí)別概率的前M個(gè)所述兩個(gè)標(biāo)識(shí)符的序列,其中M為等于或大于I的整數(shù)。
7.根據(jù)權(quán)利要求5的語(yǔ)音關(guān)鍵詞檢出系統(tǒng),其中, 通過(guò)以下單元生成臨時(shí)語(yǔ)法中的長(zhǎng)度等于或大于最小長(zhǎng)度并且等于或小于最大長(zhǎng)度的所有的所述兩個(gè)標(biāo)識(shí)符的序列 用于獲得從候選關(guān)鍵詞轉(zhuǎn)換的所述兩個(gè)標(biāo)識(shí)符的序列的最小長(zhǎng)度和最大長(zhǎng)度的單元;和 用于收集長(zhǎng)度等于或大于最小長(zhǎng)度并且等于或小于最大長(zhǎng)度的所有的所述兩個(gè)標(biāo)識(shí)符的序列。
8.根據(jù)權(quán)利要求1-4中任一項(xiàng)的語(yǔ)音關(guān)鍵詞檢出系統(tǒng),其中 第一類(lèi)音子是輔音,第二類(lèi)音子是兀音。
9.一種創(chuàng)建用于語(yǔ)音關(guān)鍵詞檢出系統(tǒng)的詞典的系統(tǒng),所述詞典包括具有目標(biāo)關(guān)鍵詞列表的語(yǔ)法;和詞庫(kù),該詞庫(kù)包括代表目標(biāo)關(guān)鍵詞列表中的一個(gè)或更多個(gè)目標(biāo)關(guān)鍵詞的音子序列的所有候選關(guān)鍵詞的發(fā)音,所述系統(tǒng)包括 用于基于音子的固有特征將語(yǔ)音數(shù)據(jù)聚類(lèi)為第一類(lèi)音子和第二類(lèi)音子的單元; 用于依賴(lài)于目標(biāo)關(guān)鍵詞列表中的目標(biāo)關(guān)鍵詞的音子序列,生成用于集外詞的兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列的單元,所述兩個(gè)標(biāo)識(shí)符中的一個(gè)標(biāo)識(shí)符表示第一類(lèi)音子,另一個(gè)標(biāo)識(shí)符表示第二類(lèi)音子;和 用于將所述兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列添加到語(yǔ)法中的單元, 其中所述詞庫(kù)還包括代表用于集外詞的所述兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列的發(fā)音,并且其中,第一類(lèi)音子、第二類(lèi)音子和用于一個(gè)或更多個(gè)目標(biāo)關(guān)鍵詞的音子分別由它們的模型描述。
10.根據(jù)權(quán)利要求9的系統(tǒng),其中, 所述用于生成用于集外詞的所述兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列的單元包括 用于對(duì)于每個(gè)目標(biāo)關(guān)鍵詞生成用于集外詞的所述兩個(gè)標(biāo)識(shí)符的序列的單元; 用于對(duì)于每個(gè)目標(biāo)關(guān)鍵詞選擇前N個(gè)最頻繁生成的所述兩個(gè)標(biāo)識(shí)符的序列的單元,其中N為等于或大于I的整數(shù);和 用于對(duì)于所有目標(biāo)關(guān)鍵詞收集對(duì)于每個(gè)目標(biāo)關(guān)鍵詞的所有選定的所述兩個(gè)標(biāo)識(shí)符的序列作為用于集外詞的所述兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列的單元。
11.根據(jù)權(quán)利要求9的系統(tǒng),其中, 所述用于生成用于集外詞的所述兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列的單元包括 用于對(duì)于每個(gè)目標(biāo)關(guān)鍵詞生成用于集外詞的所述兩個(gè)標(biāo)識(shí)符的序列的單元; 用于對(duì)于所有目標(biāo)關(guān)鍵詞收集對(duì)于每個(gè)目標(biāo)關(guān)鍵詞的所有生成的所述兩個(gè)標(biāo)識(shí)符的序列的單元;和 用于對(duì)于所有目標(biāo)關(guān)鍵詞選擇前N個(gè)最頻繁生成的所述兩個(gè)標(biāo)識(shí)符的序列,作為用于集外詞的所述兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列的單元,其中N為等于或大于I的整數(shù)。
12.根據(jù)權(quán)利要求10或11的系統(tǒng),其中, 用于對(duì)于每個(gè)目標(biāo)關(guān)鍵詞生成用于集外詞的所述兩個(gè)標(biāo)識(shí)符的序列的單元包括 用于確定目標(biāo)關(guān)鍵詞的誤警樣本的單元; 用于創(chuàng)建目標(biāo)關(guān)鍵詞的臨時(shí)語(yǔ)法的單元,所述臨時(shí)語(yǔ)法包括目標(biāo)關(guān)鍵詞以及長(zhǎng)度等于或大于最小長(zhǎng)度并且等于或小于最大長(zhǎng)度的所有的所述兩個(gè)標(biāo)識(shí)符的序列; 用于基于臨時(shí)語(yǔ)法、目標(biāo)關(guān)鍵詞的音子序列的模型、第一類(lèi)音子的模型和第二類(lèi)音子的模型,識(shí)別每個(gè)誤警樣本的單元;和 用于找出每個(gè)誤警樣本的識(shí)別結(jié)果中的識(shí)別概率滿足預(yù)定條件的所述兩個(gè)標(biāo)識(shí)符的序列的單元。
13.根據(jù)權(quán)利要求12的系統(tǒng),其中,所述預(yù)定條件是以下條件中的一個(gè) 1)在每個(gè)誤警樣本的識(shí)別結(jié)果中,所述兩個(gè)標(biāo)識(shí)符的序列的識(shí)別概率高于目標(biāo)關(guān)鍵詞的識(shí)別概率; 2)在每個(gè)誤警樣本的識(shí)別結(jié)果中,所述兩個(gè)標(biāo)識(shí)符的序列的識(shí)別概率高于閾值; 3)在每個(gè)誤警樣本的識(shí)別結(jié)果中,選出具有較高識(shí)別概率的前M個(gè)所述兩個(gè)標(biāo)識(shí)符的序列,其中M為等于或大于I的整數(shù)。
14.根據(jù)權(quán)利要求12的系統(tǒng),其中, 通過(guò)以下單元生成臨時(shí)語(yǔ)法中的長(zhǎng)度等于或大于最小長(zhǎng)度并且等于或小于最大長(zhǎng)度的所有的所述兩個(gè)標(biāo)識(shí)符的序列 用于獲得從候選關(guān)鍵詞轉(zhuǎn)換的所述兩個(gè)標(biāo)識(shí)符的序列的最小長(zhǎng)度和最大長(zhǎng)度的單元;和 用于收集長(zhǎng)度等于或大于最小長(zhǎng)度并且等于或小于最大長(zhǎng)度的所有的所述兩個(gè)標(biāo)識(shí)符的序列。
15.根據(jù)權(quán)利要求9-11中任一項(xiàng)的系統(tǒng),其中, 第一類(lèi)音子是輔音,第二類(lèi)音子是兀音。
16.一種創(chuàng)建用于語(yǔ)音關(guān)鍵詞檢出系統(tǒng)的詞典的方法,所述詞典包括具有目標(biāo)關(guān)鍵詞列表的語(yǔ)法;和詞庫(kù),該詞庫(kù)包括代表目標(biāo)關(guān)鍵詞列表中的一個(gè)或更多個(gè)目標(biāo)關(guān)鍵詞的音子序列的所有候選關(guān)鍵詞的發(fā)音,所述方法包括以下步驟 基于音子的固有特征將語(yǔ)音數(shù)據(jù)聚類(lèi)為第一類(lèi)音子和第二類(lèi)音子; 依賴(lài)于目標(biāo)關(guān)鍵詞列表中的目標(biāo)關(guān)鍵詞的音子序列,生成用于集外詞的兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列,所述兩個(gè)標(biāo)識(shí)符中的一個(gè)標(biāo)識(shí)符表示第一類(lèi)音子,另一個(gè)標(biāo)識(shí)符表示第二類(lèi)音子;和 將所述兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列添加到語(yǔ)法中, 其中所述詞庫(kù)還包括代表用于集外詞的所述兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列的發(fā)音,并且 其中,第一類(lèi)音子、第二類(lèi)音子和用于一個(gè)或更多個(gè)目標(biāo)關(guān)鍵詞的音子分別由它們的模型描述。
17.根據(jù)權(quán)利要求16的方法,其中,生成用于集外詞的所述兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列的步驟包括 對(duì)于每個(gè)目標(biāo)關(guān)鍵詞生成用于集外詞的所述兩個(gè)標(biāo)識(shí)符的序列; 對(duì)于每個(gè)目標(biāo)關(guān)鍵詞選擇前N個(gè)最頻繁生成的所述兩個(gè)標(biāo)識(shí)符的序列,其中N為等于或大于I的整數(shù);和 對(duì)于所有目標(biāo)關(guān)鍵詞收集對(duì)于每個(gè)目標(biāo)關(guān)鍵詞的所有選定的所述兩個(gè)標(biāo)識(shí)符的序列作為用于集外詞的所述兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列。
18.根據(jù)權(quán)利要求16的方法,其中, 生成用于集外詞的所述兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列的步驟包括 對(duì)于每個(gè)目標(biāo)關(guān)鍵詞生成用于集外詞的所述兩個(gè)標(biāo)識(shí)符的序列; 對(duì)于所有目標(biāo)關(guān)鍵詞收集對(duì)于每個(gè)目標(biāo)關(guān)鍵詞的所有生成的所述兩個(gè)標(biāo)識(shí)符的序列;和 對(duì)于所有目標(biāo)關(guān)鍵詞選擇前N個(gè)最頻繁生成的所述兩個(gè)標(biāo)識(shí)符的序列,作為用于集外詞的所述兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列,其中N為等于或大于I的整數(shù)。
19.根據(jù)權(quán)利要求17或18的方法,其中, 對(duì)于每個(gè)目標(biāo)關(guān)鍵詞生成用于集外詞的所述兩個(gè)標(biāo)識(shí)符的序列的步驟包括 確定目標(biāo)關(guān)鍵詞的誤警樣本; 創(chuàng)建目標(biāo)關(guān)鍵詞的臨時(shí)語(yǔ)法,所述臨時(shí)語(yǔ)法包括目標(biāo)關(guān)鍵詞以及長(zhǎng)度等于或大于最小長(zhǎng)度并且等于或小于最大長(zhǎng)度的所有的所述兩個(gè)標(biāo)識(shí)符的序列; 基于臨時(shí)語(yǔ)法、目標(biāo)關(guān)鍵詞的音子序列的模型、第一類(lèi)音子的模型和第二類(lèi)音子的模型,識(shí)別每個(gè)誤警樣本;和 找出每個(gè)誤警樣本的識(shí)別結(jié)果中的識(shí)別概率滿足預(yù)定條件的所述兩個(gè)標(biāo)識(shí)符的序列。
20.根據(jù)權(quán)利要求19的方法,其中,所述預(yù)定條件是以下條件中的一個(gè) 1)在每個(gè)誤警樣本的識(shí)別結(jié)果中,所述兩個(gè)標(biāo)識(shí)符的序列的識(shí)別概率高于目標(biāo)關(guān)鍵詞的識(shí)別概率; 2)在每個(gè)誤警樣本的識(shí)別結(jié)果中,所述兩個(gè)標(biāo)識(shí)符的序列的識(shí)別概率高于閾值; 3)在每個(gè)誤警樣本的識(shí)別結(jié)果中,選出具有較高識(shí)別概率的前M個(gè)所述兩個(gè)標(biāo)識(shí)符的序列,其中M為等于或大于I的整數(shù)。
21.根據(jù)權(quán)利要求19的方法,其中, 通過(guò)以下步驟生成臨時(shí)語(yǔ)法中的長(zhǎng)度等于或大于最小長(zhǎng)度并且等于或小于最大長(zhǎng)度的所有的所述兩個(gè)標(biāo)識(shí)符的序列 獲得從候選關(guān)鍵詞轉(zhuǎn)換的所述兩個(gè)標(biāo)識(shí)符的序列的最小長(zhǎng)度和最大長(zhǎng)度;和收集長(zhǎng)度等于或大于最小長(zhǎng)度并且等于或小于最大長(zhǎng)度的所有的所述兩個(gè)標(biāo)識(shí)符的序列。
22.根據(jù)權(quán)利要求16-18中任一項(xiàng)的方法,其中, 第一類(lèi)音子是輔音,第二類(lèi)音子是兀音。
全文摘要
本申請(qǐng)涉及語(yǔ)音關(guān)鍵詞檢出系統(tǒng)。其包括輸入單元,用于接收輸入語(yǔ)音信號(hào);特征提取單元,用于從輸入語(yǔ)音信號(hào)提取至少一個(gè)特征;分類(lèi)器單元,用于基于至少一個(gè)特征和詞典將輸入語(yǔ)音信號(hào)分類(lèi)為目標(biāo)關(guān)鍵詞或者集外詞;和輸出單元,用于輸出分類(lèi)的結(jié)果。該詞典包括語(yǔ)法,包括目標(biāo)關(guān)鍵詞列表和用于集外詞的兩個(gè)標(biāo)識(shí)符的至少一個(gè)序列;和詞庫(kù),包括代表目標(biāo)關(guān)鍵詞列表中的一個(gè)或更多個(gè)目標(biāo)關(guān)鍵詞的音子序列的所有候選關(guān)鍵詞的發(fā)音以及代表所述至少一個(gè)序列的發(fā)音,其中一個(gè)標(biāo)識(shí)符表示第一類(lèi)音子,另一個(gè)標(biāo)識(shí)符表示第二類(lèi)音子。第一類(lèi)音子和第二類(lèi)音子是基于音子的固有特征聚類(lèi)的。第一類(lèi)音子、第二類(lèi)音子和目標(biāo)關(guān)鍵詞的音子由模型描述。
文檔編號(hào)G06F17/30GK102915729SQ20111021728
公開(kāi)日2013年2月6日 申請(qǐng)日期2011年8月1日 優(yōu)先權(quán)日2011年8月1日
發(fā)明者郭莉莉, 劉賀飛, 亓超 申請(qǐng)人:佳能株式會(huì)社
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1