中文熱詞檢測方法和裝置的制造方法
【專利摘要】本發(fā)明提供了一種中文熱詞檢測方法和裝置。該方法包括:收集用戶語音的連續(xù)的多個(gè)片段;參照目標(biāo)中文熱詞中每個(gè)字的標(biāo)準(zhǔn)語音特征,獲取目標(biāo)中文熱詞中各個(gè)字在每個(gè)片段中出現(xiàn)的概率;基于上述目標(biāo)中文熱詞中各個(gè)字在每個(gè)片段中出現(xiàn)的概率,獲取在不違背目標(biāo)中文熱詞的字的標(biāo)準(zhǔn)前后順序的前提下所述多個(gè)片段中出現(xiàn)該目標(biāo)中文熱詞的最大概率;基于所述最大概率檢測在用戶語音中是否有目標(biāo)中文熱詞。本發(fā)明能夠支持以字為分割單位的中文熱詞檢測,并保證檢測出的熱詞與目標(biāo)中文熱詞中的字的順序一致。
【專利說明】
中文熱詞檢測方法和裝置
技術(shù)領(lǐng)域
[0001] 本發(fā)明涉及語音檢測技術(shù),特別涉及以字為分割單位中文語音熱詞檢測技術(shù)。
【背景技術(shù)】
[0002] 語音熱詞檢測技術(shù)日益發(fā)展,并在語音搜索以及熱詞喚醒等方面開始廣泛應(yīng)用。 現(xiàn)有的熱詞檢測技術(shù)多是基于音節(jié)對目標(biāo)熱詞進(jìn)行分割,這種基于音節(jié)的熱詞分割非常適 用于英文單詞的提取,但不適用于中文語言材料的分析。此外,目前的語音熱詞檢測方法無 法在中文熱詞檢測中保證測出的熱詞與目標(biāo)中文熱詞中的字的順序一致。
【發(fā)明內(nèi)容】
[0003] 本發(fā)明解決的技術(shù)問題之一是,能夠支持以字為分割單位的中文熱詞檢測,并保 證檢測出的熱詞與目標(biāo)中文熱詞中的字的順序一致。
[0004] 根據(jù)本發(fā)明的一個(gè)實(shí)施例,提供了一種中文熱詞檢測方法,包括:收集用戶語音的 連續(xù)的多個(gè)片段;參照目標(biāo)中文熱詞中每個(gè)字的標(biāo)準(zhǔn)語音特征,獲取目標(biāo)中文熱詞中各個(gè) 字在每個(gè)片段中出現(xiàn)的概率;基于上述目標(biāo)中文熱詞中各個(gè)字在每個(gè)片段中出現(xiàn)的概率, 獲取在不違背目標(biāo)中文熱詞的字的標(biāo)準(zhǔn)前后順序的前提下所述多個(gè)片段中出現(xiàn)該目標(biāo)中 文熱詞的最大概率;基于所述最大概率檢測在用戶語音中是否有目標(biāo)中文熱詞。
[0005] 根據(jù)本發(fā)明的一個(gè)實(shí)施例,提供了一種中文熱詞檢測裝置,包括:收集模塊,被配 置為收集用戶語音的連續(xù)的多個(gè)片段;第一獲取模塊,被配置為參照目標(biāo)中文熱詞中每個(gè) 字的標(biāo)準(zhǔn)語音特征,獲取目標(biāo)中文熱詞中各個(gè)字在每個(gè)片段中出現(xiàn)的概率;第二獲取模塊, 被配置為基于上述目標(biāo)中文熱詞中各個(gè)字在每個(gè)片段中出現(xiàn)的概率,獲取在不違背目標(biāo)中 文熱詞的字的標(biāo)準(zhǔn)前后順序的前提下所述多個(gè)片段中出現(xiàn)該目標(biāo)中文熱詞的最大概率;檢 測模塊,被配置為基于所述最大概率檢測在用戶語音中是否有目標(biāo)中文熱詞。
[0006] 由于本發(fā)明實(shí)施例中,判斷目標(biāo)中文熱詞在用戶語音中是否出現(xiàn)是通過在不違背 目標(biāo)中文熱詞的字的標(biāo)準(zhǔn)前后順序的前提下計(jì)算最大概率進(jìn)行的,這樣就保證了所檢測出 的熱詞與目標(biāo)中文熱詞中的字的順序一致。另外,現(xiàn)有技術(shù)的熱詞檢測方法中,多數(shù)是以音 節(jié)為基本單位對語音進(jìn)行分割的,這種分割方法不利于中文形式的用戶熱詞語音的識別。 中文的詞語、短語、語句等語言資料是由"字"按照一定的順序連接而成,從而表達(dá)一定語義 的。因此"字"是中文詞語和語句的基本單位。對于不同的人,說話的快慢,停頓的方式可能 不同,但針對每個(gè)字而言,發(fā)音的基本特征是非常相近的(這里不考慮方言帶來的干擾), 因此通過以字為單位對目標(biāo)中文熱詞進(jìn)行分割,提取每個(gè)字的標(biāo)準(zhǔn)語音特征作為參照,可 以有效地抓住目標(biāo)中文熱詞的基本特征,降低錯誤檢測率。
[0007] 本領(lǐng)域普通技術(shù)人員將了解,雖然下面的詳細(xì)說明將參考圖示實(shí)施例、附圖進(jìn)行, 但本發(fā)明并不僅限于這些實(shí)施例。而是,本發(fā)明的范圍是廣泛的,且意在僅通過后附的權(quán)利 要求限定本發(fā)明的范圍。
【附圖說明】
[0008] 通過閱讀參照以下附圖所作的對非限制性實(shí)施例所作的詳細(xì)描述,本發(fā)明的其它 特征、目的和優(yōu)點(diǎn)將會變得更明顯:
[0009] 圖1是根據(jù)本發(fā)明的一個(gè)實(shí)施例的一種中文熱詞檢測方法的流程圖。
[0010] 圖2是根據(jù)本發(fā)明的另一個(gè)實(shí)施例的一種中文熱詞檢測裝置的框圖。
【具體實(shí)施方式】
[0011] 下面結(jié)合附圖對本發(fā)明作進(jìn)一步詳細(xì)描述。
[0012] 圖1是根據(jù)本發(fā)明的一個(gè)實(shí)施例的一種中文熱詞檢測方法1的流程圖。本發(fā)明 的方法主要通過計(jì)算機(jī)設(shè)備上的處理器或操作程序來完成,將該處理器或操作程序稱為一 種中文熱詞檢測裝置,以下簡稱檢測裝置。該計(jì)算機(jī)設(shè)備包括但不限于電腦、手機(jī)、平板電 腦,以及帶有該處理器或操作程序的智能可穿戴設(shè)備,如智能手環(huán),智能手表,以及智能眼 鏡等。
[0013] 熱詞是指與用于發(fā)出的常規(guī)語音指令不同的一些特殊的語音指令,它們通常與應(yīng) 用或計(jì)算機(jī)設(shè)備的總體狀態(tài)相關(guān)而不涉及用戶的具體語音指令。例如,對于應(yīng)用的喚醒、關(guān) 閉、計(jì)算機(jī)設(shè)備的開啟、關(guān)閉等。舉一個(gè)具體的例子。對于應(yīng)用"出門問問"來說,只要用戶 在計(jì)算機(jī)設(shè)備上安裝了 "出門問問",即使該應(yīng)用在未開啟的狀態(tài)下它也以低功耗不停定時(shí) 檢測是否用戶說出了熱詞"你好問問",一旦例如通過本發(fā)明實(shí)施例的中文熱詞檢測方法1 檢測到了用戶語音中有目標(biāo)中文熱詞"你好問問",就自動喚醒或開啟該應(yīng)用。用戶就可以 針對該應(yīng)用發(fā)出各種具體的語音查詢等。
[0014] 中文熱詞是指一切中文形式的熱詞。
[0015] 步驟110,收集用戶語音的連續(xù)的多個(gè)片段。
[0016] 用戶語音是指用戶發(fā)出的語音,它可能是中文熱詞(諸如"你好問問"),也可能是 其它語音。本發(fā)明的實(shí)施例用來從用戶語音中檢測出它是否是中文熱詞或包括中文熱詞。
[0017] 所述多個(gè)片段可以是等時(shí)間長度的多個(gè)片段,也可以是不等時(shí)間長度的多個(gè)片 段。
[0018] 在所述多個(gè)片段可以是等時(shí)間長度的多個(gè)片段的情況下,例如,將檢測到有用戶 的聲音出現(xiàn)的一刻設(shè)為0,多個(gè)片段可以為〇-〇. 5s、0. 5s-ls、ls-l. 5s、l. 5s-2s、2s-2. 5s 等。一般來說,根據(jù)人的正常語速,讓每個(gè)片段的時(shí)間長度不大于正常人說一個(gè)中文字的時(shí) 間長度。
[0019] 用戶語音的連續(xù)的多個(gè)片段可以通過計(jì)算機(jī)設(shè)備的音頻接收器等收集。
[0020] 步驟120,參照目標(biāo)中文熱詞中每個(gè)字的標(biāo)準(zhǔn)語音特征,獲取目標(biāo)中文熱詞中各個(gè) 字在每個(gè)片段中出現(xiàn)的概率。
[0021] 目標(biāo)中文熱詞是指預(yù)先設(shè)定的中文形式的熱詞,例如預(yù)先設(shè)定"你好問問"作為開 啟"出門問問"應(yīng)用的熱詞。
[0022] 字的標(biāo)準(zhǔn)語音特征可以是這個(gè)字發(fā)音的聲波波形,也可以是對該字發(fā)音聲波波形 處理后的數(shù)據(jù),該語音特征的出現(xiàn)就代表了該字的出現(xiàn)。
[0023]目標(biāo)中文熱詞中每個(gè)字的標(biāo)準(zhǔn)語音特征可以是從不同的人說目標(biāo)中文熱詞中每 個(gè)字的語音的樣本中利用已知的機(jī)器學(xué)習(xí)方法得到的。
[0024] 例如,目標(biāo)中文熱詞是"你好問問"。將大量的人說"你"、"好"、"問1"、"問2"中的 每個(gè)字的語音作為樣本輸入機(jī)器學(xué)習(xí)的一個(gè)模型,該模型從大量的人說"你"的語音樣本的 聲波波形中進(jìn)行學(xué)習(xí),學(xué)習(xí)所有這些"你"的語音樣本的聲波波形的規(guī)律,經(jīng)處理后就得到 了共性的語音特征作為"你"的標(biāo)準(zhǔn)語音特征。當(dāng)該模型再接收到一個(gè)新的字的語音后,該 模型就能識別出該新的字是不是"你"、以及是"你"的概率。"好"、"問1"、"問2"的標(biāo)準(zhǔn)語 音特征也可以類似地得到。
[0025] 目標(biāo)中文熱詞中每個(gè)字的標(biāo)準(zhǔn)語音特征也可以是事先規(guī)定的,例如來自于教科 書。
[0026] 在一種實(shí)施方式中,參照目標(biāo)中文熱詞中每個(gè)字的標(biāo)準(zhǔn)語音特征獲取目標(biāo)中文熱 詞中各個(gè)字在每個(gè)片段中出現(xiàn)的概率是通過深層神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法實(shí)現(xiàn)的。
[0027] 深層神經(jīng)網(wǎng)絡(luò)訓(xùn)練以目標(biāo)中文熱詞中每個(gè)字的標(biāo)準(zhǔn)語音特征為標(biāo)準(zhǔn),通過差值優(yōu) 化,不斷地對每個(gè)片段是否出現(xiàn)目標(biāo)中文熱詞中的字進(jìn)行分析,最終得到目標(biāo)中文熱詞中 各個(gè)字在每個(gè)片段中出現(xiàn)的概率。深層神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法是成熟的現(xiàn)有技術(shù),在這里就不 再詳細(xì)表述。當(dāng)然本領(lǐng)域的技術(shù)人員也可采用其他機(jī)器學(xué)習(xí)方法作為該步驟的分析方法, 比如多層神經(jīng)網(wǎng)絡(luò)訓(xùn)練等。
[0028] 步驟130,基于上述目標(biāo)中文熱詞中各個(gè)字在每個(gè)片段中出現(xiàn)的概率,獲取在不違 背目標(biāo)中文熱詞的字的標(biāo)準(zhǔn)前后順序的前提下所述多個(gè)片段中出現(xiàn)該目標(biāo)中文熱詞的最 大概率。
[0029] 在一種實(shí)施方式中,步驟130是通過基于時(shí)間的隱藏馬爾科夫模型實(shí)現(xiàn)的,其中 在所述基于時(shí)間的隱藏馬爾科夫模型中,以目標(biāo)中文熱詞的字的標(biāo)準(zhǔn)前后順序,限制所述 基于時(shí)間的隱藏馬爾科夫模型在各個(gè)連續(xù)片段間出現(xiàn)的目標(biāo)中文熱詞中的字之間的轉(zhuǎn)移 路徑。
[0030] 目標(biāo)中文熱詞的字的標(biāo)準(zhǔn)前后順序是指規(guī)定的目標(biāo)中文熱詞中字的前后順序。例 如,規(guī)定"你好問問"是啟動應(yīng)用"出門問問"的熱詞,則標(biāo)準(zhǔn)前后順序就是"你"、"好"、"問 1"、"問2"。轉(zhuǎn)移路徑是隱藏馬爾科夫模型中的術(shù)語,是將各個(gè)片段中判斷出來的字和相應(yīng) 概率相連接形成的路徑。
[0031] 為了清晰而簡潔的描述基于時(shí)間的隱藏馬爾科夫模型的工作流程,建立以下表格 進(jìn)行闡釋,該表格僅作為示例,而不作為對本發(fā)明的限制。
[0032]
[0033]
[0034] 該表中,目標(biāo)中文熱詞為"你好問問"。每一行的數(shù)字表示在每一片段中,出現(xiàn)目標(biāo) 中文熱詞中各個(gè)相應(yīng)字的概率。
[0035] 對片段nl至n7這個(gè)7個(gè)連續(xù)的片段,按照目標(biāo)中文熱詞"你好問問"的順序,在 片段nl中應(yīng)當(dāng)找到"你",而不是概率更高的"好",作為基于時(shí)間的隱藏馬爾科夫模型的起 始;由于必須以"你好問問"為順序,因此由片段nl向片段n2的轉(zhuǎn)移路徑只有"你"到"你", "你"到"好"兩種,又因?yàn)橐易畲蟾怕兽D(zhuǎn)移路徑,片段n2中"你"的概率大于"好",因此由 語音單元nl到語音單元n2的轉(zhuǎn)移路徑是"你"到"你";基于以上原理,由語音單元n2到 語音單元n3的轉(zhuǎn)移路徑有"你"到"你","你"到"好"兩種,因?yàn)樵谡Z音單元n3中"你"和 "好"概率相等,因此由語音單元n2到語音單元n3的轉(zhuǎn)移路徑有兩種"你"到"你"和"你"到 "好";那么接下來的路徑就有"你"到"你","你"到"好","好"到"問"三種,根據(jù)概率最大來 判斷,應(yīng)為"好"到"問";其后的按此原則依次類推,就可以得到該七個(gè)連續(xù)片段中,目標(biāo)中 文熱詞中的字的轉(zhuǎn)移路徑為:"你"一〉"你"一〉"好"一〉"問"一〉"問"一〉"問"一 > "問",該路徑出現(xiàn)的概率為與在不違背目標(biāo)中文熱詞的字的標(biāo)準(zhǔn)前后順序的前提下所述 多個(gè)片段中出現(xiàn)該目標(biāo)中文熱詞的最大概率。
[0036] 根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述最大概率的算法是將轉(zhuǎn)移路徑中所有字出現(xiàn) 概率進(jìn)行等權(quán)相加再除以轉(zhuǎn)移路徑中字的個(gè)數(shù)。比如,在上述表格中,所述最大概率為 (0. 1+0. 6+0. 4+0. 6+0. 8+0. 4+0. 5)/7 = 0. 49。當(dāng)然,最大概率的算法也可以是其他合理的 形式。
[0037] 步驟140,基于所述最大概率檢測在用戶語音中是否有目標(biāo)中文熱詞。
[0038] 在一種實(shí)施方式中,可以將所述最大概率與預(yù)定閾值相比較,大于預(yù)定閾值的,認(rèn) 為在所述用戶語音中有目標(biāo)中文熱詞。
[0039] 例如,該預(yù)定閾值設(shè)置為1除以目標(biāo)中文熱詞中的個(gè)數(shù)。比如,在上述表格中,所 述接受概率閾值為1/4 = 0. 25。將步驟130中獲取的最大概率與該預(yù)定閾值比較。由于 0. 49大于0. 25,那么認(rèn)為在上述表格的例子中,片段nl至n7這7個(gè)連續(xù)的片段中出現(xiàn)了 目標(biāo)中文熱詞"你好問問"。當(dāng)然,預(yù)定閾值也可以通過其他合理的形式設(shè)定。
[0040] 如果只應(yīng)用深層神經(jīng)網(wǎng)絡(luò)訓(xùn)練對片段進(jìn)行分析,就會對收集片段的時(shí)間長度加以 限制。因?yàn)樯顚由窠?jīng)網(wǎng)絡(luò)訓(xùn)練智能在語音層面上保證一個(gè)小時(shí)間片段上的順序,最多300ms 左右。如果欲在語音層面上保證長時(shí)間的順序,就要加長檢測時(shí)間長度,比如大于300ms,這 種加長檢測時(shí)間長度,即加長檢測延遲的手段不但會給之后的分析帶來更高的能耗,而且 依然不能保證字層面上的順序。本發(fā)明實(shí)施例獲取在不違背目標(biāo)中文熱詞的字的標(biāo)準(zhǔn)前后 順序的前提下所述多個(gè)片段中出現(xiàn)該目標(biāo)中文熱詞的最大概率從而檢測用戶語音中是否 有目標(biāo)中文熱詞的方式還減輕了加長檢測時(shí)間長度的負(fù)面影響。
[0041] 如圖2所示,本發(fā)明的另一個(gè)實(shí)施例提供了一種中文熱詞檢測裝置2,包括:收集 模塊210,被配置為收集用戶語音的連續(xù)的多個(gè)片段;第一獲取模塊220,被配置為參照目 標(biāo)中文熱詞中每個(gè)字的標(biāo)準(zhǔn)語音特征,獲取目標(biāo)中文熱詞中各個(gè)字在每個(gè)片段中出現(xiàn)的概 率;第二獲取模塊230,被配置為基于上述目標(biāo)中文熱詞中各個(gè)字在每個(gè)片段中出現(xiàn)的概 率,獲取在不違背目標(biāo)中文熱詞的字的標(biāo)準(zhǔn)前后順序的前提下所述多個(gè)片段中出現(xiàn)該目標(biāo) 中文熱詞的最大概率;檢測模塊240,被配置為基于所述最大概率檢測在用戶語音中是否 有目標(biāo)中文熱詞。上述各模塊可以通過軟件、硬件(FPGA、集成電路等)或軟硬件結(jié)合的方 式實(shí)現(xiàn)。
[0042] 可選地,所述多個(gè)片段是等時(shí)間長度的多個(gè)片段。
[0043] 可選地,目標(biāo)中文熱詞中每個(gè)字的標(biāo)準(zhǔn)語音特征是從不同的人說目標(biāo)中文熱詞中 每個(gè)字的語音的樣本中利用機(jī)器學(xué)習(xí)得到的。
[0044] 可選地,檢測模塊240進(jìn)一步被配置為:將所述最大概率與預(yù)定閾值相比較,大于 預(yù)定閾值的,認(rèn)為在所述用戶語音中有目標(biāo)中文熱詞。
[0045] 可選地,第一獲取模塊220通過深層神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法獲取目標(biāo)中文熱詞中各個(gè) 字在每個(gè)片段中出現(xiàn)的概率。
[0046] 可選地,第二獲取模塊230通過基于時(shí)間的隱藏馬爾科夫模型獲取在不違背目標(biāo) 中文熱詞的字的標(biāo)準(zhǔn)前后順序的前提下所述多個(gè)片段中出現(xiàn)該目標(biāo)中文熱詞的最大概率, 其中在所述基于時(shí)間的隱藏馬爾科夫模型中,以目標(biāo)中文熱詞的字的標(biāo)準(zhǔn)前后順序,限制 所述基于時(shí)間的隱藏馬爾科夫模型在各個(gè)連續(xù)片段間出現(xiàn)的目標(biāo)中文熱詞中的字之間的 轉(zhuǎn)移路徑。
[0047] 附圖中的流程圖和框圖顯示了根據(jù)本發(fā)明的多個(gè)實(shí)施例的系統(tǒng)、方法和計(jì)算機(jī)程 序產(chǎn)品的可能實(shí)現(xiàn)的體系架構(gòu)、功能和操作。在這點(diǎn)上,流程圖或框圖中的每個(gè)方框可以代 表一個(gè)模塊、程序段或代碼的一部分,所述模塊、程序段或代碼的一部分包含一個(gè)或多個(gè)用 于實(shí)現(xiàn)規(guī)定的邏輯功能的可執(zhí)行指令。也應(yīng)當(dāng)注意的是,框圖和/或流程圖中的每個(gè)方框、 以及框圖和/或流程圖中的方框的組合,可以用執(zhí)行規(guī)定的功能或操作的專用的基于硬件 的系統(tǒng)來實(shí)現(xiàn),或者可以用專用硬件與計(jì)算機(jī)指令的組合來實(shí)現(xiàn)。
[0048] 對于本領(lǐng)域技術(shù)人員而言,顯然本發(fā)明不限于上述示范性實(shí)施例的細(xì)節(jié),而且在 不背離本發(fā)明的精神或基本特征的情況下,能夠以其他的具體形式實(shí)現(xiàn)本發(fā)明。因此,無論 從哪一點(diǎn)來看,均應(yīng)將實(shí)施例看作是示范性的,而且是非限制性的,本發(fā)明的范圍由所附權(quán) 利要求而不是上述說明限定,因此旨在將落在權(quán)利要求的等同要件的含義和范圍內(nèi)的所有 變化囊括在本發(fā)明內(nèi)。不應(yīng)將權(quán)利要求中的任何附圖標(biāo)記視為限制所涉及的權(quán)利要求。
【主權(quán)項(xiàng)】
1. 一種中文熱詞檢測方法(1),包括: 收集用戶語音的連續(xù)的多個(gè)片段(110); 參照目標(biāo)中文熱詞中每個(gè)字的標(biāo)準(zhǔn)語音特征,獲取目標(biāo)中文熱詞中各個(gè)字在每個(gè)片段 中出現(xiàn)的概率(120); 基于上述目標(biāo)中文熱詞中各個(gè)字在每個(gè)片段中出現(xiàn)的概率,獲取在不違背目標(biāo)中文熱 詞的字的標(biāo)準(zhǔn)前后順序的前提下所述多個(gè)片段中出現(xiàn)該目標(biāo)中文熱詞的最大概率(130); 基于所述最大概率檢測在用戶語音中是否有目標(biāo)中文熱詞(140)。2. 根據(jù)權(quán)利要求1的中文熱詞檢測方法,其中所述多個(gè)片段是等時(shí)間長度的多個(gè)片 段。3. 根據(jù)權(quán)利要求1的中文熱詞檢測方法,其中目標(biāo)中文熱詞中每個(gè)字的標(biāo)準(zhǔn)語音特征 是從不同的人說目標(biāo)中文熱詞中每個(gè)字的語音的樣本中利用機(jī)器學(xué)習(xí)得到的。4. 根據(jù)權(quán)利要求1的中文熱詞檢測方法,其中基于所述最大概率檢測在用戶語音中是 否有目標(biāo)中文熱詞的步驟(140)包括:將所述最大概率與預(yù)定閾值相比較,大于預(yù)定閾值 的,認(rèn)為在所述用戶語音中有目標(biāo)中文熱詞。5. 根據(jù)權(quán)利要求1的中文熱詞檢測方法,其中獲取目標(biāo)中文熱詞中各個(gè)字在每個(gè)片段 中出現(xiàn)的概率的步驟(120)是通過深層神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法實(shí)現(xiàn)的。6. 根據(jù)權(quán)利要求1的中文熱詞檢測方法,其中獲取在不違背目標(biāo)中文熱詞的字的標(biāo)準(zhǔn) 前后順序的前提下所述多個(gè)片段中出現(xiàn)該目標(biāo)中文熱詞的最大概率的步驟(130)是通過 基于時(shí)間的隱藏馬爾科夫模型實(shí)現(xiàn)的,其中在所述基于時(shí)間的隱藏馬爾科夫模型中,以目 標(biāo)中文熱詞的字的標(biāo)準(zhǔn)前后順序,限制所述基于時(shí)間的隱藏馬爾科夫模型在各個(gè)連續(xù)片段 間出現(xiàn)的目標(biāo)中文熱詞中的字之間的轉(zhuǎn)移路徑。7. -種中文熱詞檢測裝置(2),包括: 收集模塊(210),被配置為收集用戶語音的連續(xù)的多個(gè)片段; 第一獲取模塊(220),被配置為參照目標(biāo)中文熱詞中每個(gè)字的標(biāo)準(zhǔn)語音特征,獲取目標(biāo) 中文熱詞中各個(gè)字在每個(gè)片段中出現(xiàn)的概率; 第二獲取模塊(230),被配置為基于上述目標(biāo)中文熱詞中各個(gè)字在每個(gè)片段中出現(xiàn)的 概率,獲取在不違背目標(biāo)中文熱詞的字的標(biāo)準(zhǔn)前后順序的前提下所述多個(gè)片段中出現(xiàn)該目 標(biāo)中文熱詞的最大概率; 檢測模塊(240),被配置為基于所述最大概率檢測在用戶語音中是否有目標(biāo)中文熱詞。8. 根據(jù)權(quán)利要求7的中文熱詞檢測裝置,其中所述多個(gè)片段是等時(shí)間長度的多個(gè)片 段。9. 根據(jù)權(quán)利要求7的中文熱詞檢測裝置,其中目標(biāo)中文熱詞中每個(gè)字的標(biāo)準(zhǔn)語音特征 是從不同的人說目標(biāo)中文熱詞中每個(gè)字的語音的樣本中利用機(jī)器學(xué)習(xí)得到的。10. 根據(jù)權(quán)利要求7的中文熱詞檢測裝置,其中檢測模塊(240)進(jìn)一步被配置為:將所 述最大概率與預(yù)定閾值相比較,大于預(yù)定閾值的,認(rèn)為在所述用戶語音中有目標(biāo)中文熱詞。
【文檔編號】G10L15/02GK105869622SQ201510031181
【公開日】2016年8月17日
【申請日】2015年1月21日
【發(fā)明人】雷欣, 李倩
【申請人】上海羽扇智信息科技有限公司