亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

自動語音識別系統(tǒng)中的快速詞匯表外搜索的制作方法_4

文檔序號:9308669閱讀:來源:國知局
這些字不在 索引中所以也不會在搜索中找到。
[0083] 根據(jù)本發(fā)明實施例的多個方面,由具有相關(guān)聯(lián)的開始時間、結(jié)束時間和字置信度 的一組字構(gòu)成的LVCSR文本輸出用于在要再處理的音頻中找到00V字的可能位置,以確定 這些位置是否包含所搜索的00V字。換句話說,本發(fā)明的實施例中生成一組錨字段用于在 其中進行搜索。
[0084] 圖10是顯示根據(jù)本發(fā)明一個實施例的處理搜索查詢的方法的流程圖。在步驟210 中,系統(tǒng)從用戶(例如,參見圖2)接收查詢Q作為搜索短語。該查詢Q可以包括詞匯表中 的一些字(IV字)和不在詞匯表中的字(00V字)。
[0085] 在步驟220中,為查詢Q中的字生成成組的錨字段(A),其中每個錨字段識別出音 頻文件集合中的與該查詢中的字相對應的位置。根據(jù)本發(fā)明一個實施例的生成錨字段的方 法將在下文中參照圖11做更詳細的描述。
[0086] 參照圖11,給定接收到的查詢Q和LVCSR文本輸出(之前當音頻被開始處理時生 成的),該系統(tǒng)為查詢Q中的每一個字生成錨字段(A)。該組錨在步驟222中被初始化為空 集(J- 0 )。然后,在步驟224中,對查詢Q中的每個字Wl,在步驟226中,在LVCSR詞匯表 (或詞典)VWCSR中查詢字wi以確定w1是00V字還是IV字。在步驟228中,如果w1是IV字, 則搜索LVCSR文本輸出找到足夠確定的匹配項,例如,高于給定字置信度閥值。該字的位置 依照開始和結(jié)束時間被保存為錨AIV,其中AIV是一組錨{a,每個錨a]為包括字wi、開始時 間s.j和結(jié)束時間e』的3元組(a』=(w;,s.j,e.),所以AIV={(w;,s.j,e.) })。
[0087] 如果WlS〇OV字,在步驟230中生成字^的子字單元列表。該子字單元可以是例 如語素、音節(jié)、音素或者音素的序列。步驟234中,在LVCSR輸出文本中搜索^的每一個子 字以生成一組詞匯表外錨A_。在一些實施例中,在步驟232中,對LVCSR輸出文本的搜索 僅限于具有低置信度(例如,字置信度低于給定閥值或者在兩個給定閥值之間)的字。
[0088] 在一個實施例中,搜索LVCSR文本輸出是在預處理索引上執(zhí)行的,例如空閑文本 索引。IV字可以在字級別索引上搜索,00V字可以在子字級別索引上搜索。不失一般性地, 在一個實施例中,子字索引是LVCSR文本輸出的音素抄本的索引。在另一個實施例中,如果 子字為單字字符(例如,而不是音素),則00V字可以在相同的字級別自由文本索引中搜索。
[0089] 例如,如果要搜索的00V字是"Honda"并且子字索引是LVCSR文本輸出的音素抄 本索引,那么將在音素抄本中搜索"Honda"的音素(/h/Q/n/,/Q/n/d/,/n/d/@)。
[0090] 另一方面,如果子字索引是字級別自由文本索引,那么可以在該自由文本索引中 搜索字符串" hon "、" ond "和" nda "。
[0091] 在步驟236中,所有找到的位置(A_或者A IV)都被添加到錨A的列表中 (A - A U Aoov U A IV) 〇
[0092] 然后在步驟238中檢查查詢Q以確定是否存在更多的查詢字Wl待處理。如果有, 該過程返回到步驟224以使用下一個字^重復該過程。如果所有的字都已經(jīng)處理過,則錨 A的累積集合在步驟239中返回。
[0093] 錨字段的后處理
[0094] 再次參照圖10,生成一組錨字段A后,錨字段在步驟240中進行后處理以擴展錨字 段,在步驟260中對錨字段進行分類,并且在步驟270中合并重疊的錨字段。步驟240中對 錨字段的擴展步驟將參照圖12和13做更詳細的描述。該列表中的每個錨代表音頻中的一 個小字段。因為錨字段通常為單個字或子字的長度,所以所述小字段通常非常小以至于難 以包含整個短語(例如,搜索查詢的整個搜索短語)。因此,在音頻字段上運行音頻識別之 前擴展每個音頻字段。
[0095]因此,每個錨字段的左邊和右邊(開始和結(jié)束)的邊界a]= (w,,S],e])被擴展,以 便提高錨字段包含完整待搜索短語的可能性。為了計算左邊(開始時間)的擴展,將查詢 中在該錨的字之前的字符數(shù)1^乘以語言的平均口語字符寬度y (例如,字典中字的平均字 符寬度)。在特定實施例中,計算呼叫者的平均字符寬度,或者另一個最佳的已知值可以被 計算或者從存儲器中查詢。然后將常量const添加到動態(tài)計算的擴展值。
[0096] 同樣地,右邊的擴展的計算是通過將到錨的右側(cè)的字符數(shù)民乘以y并且添加常 量 constr。在一些實施例中,consti: const r。
[0097]簡單來說,對于每個錨字段a]= (w,,S],e]),8]與e,的值被擴展,使得擴展字段為 (w" s廠(QX y )-Cl, ej+Ghar^X y )+cr),其中cr和c丨分別為右邊和左邊的常量。
[0098] 參照圖13,步驟242中,對查詢Q中的每個字Wl,在步驟244中計算 Wl的左側(cè)和右 側(cè)的字符數(shù)(LjPRi)。步驟246中,字符數(shù)[^和^中的每一個乘以平均字符寬度y (例如 根據(jù)所有音頻數(shù)據(jù)的分析或基于當前發(fā)音者的數(shù)據(jù)樣本進行計算)以得到擴展數(shù)量expu 和expM,在步驟248中,該擴展數(shù)量進一步通過常量值constjP const ^擴展。在步驟250 中,檢查查詢Q以判定是否還有其它的字K要處理。如果判定為有,則對剩余字重復步驟 244、246和248的過程。如果判定為沒有,則該過程進行到步驟252。
[0099] 步驟252中,對于錨A的每個錨aj (其中,aj = (w j,sj,eJ),開始時間sj在步驟 254中通過相對于Wj的左側(cè)擴展數(shù)exp u變換(減少),結(jié)束時間e 在步驟256中通過相 對于Wj的右側(cè)擴展數(shù)exp y變換(增加),使得擴展后的錨a」的形式為(w y Sfexpu efe xpy)。步驟258中,檢查一組錨A以判定是否還有更多的錨&]等待進行后處理。如果判定 為有,則對剩余的錨重復步驟254和256的過程。如果判定為沒有,則擴展后的錨被返回到 步驟259。
[0100] 再次參照圖10,擴展后的錨A存儲為步驟260中的新的開始時間,并且在步驟270 中合并重疊的錨(即,具有新的開始時間的錨開始于前一個錨的新的結(jié)束時間)。
[0101] 音頻的再處理
[0102] 在步驟280中,對于上述一組擴展后的錨A中的每個錨字段aj,在錨字段上音頻識 別以產(chǎn)生搜索事件。該識別處理可以使用例如美國專利7, 487, 094 "System and method of call classification with context modeling based on composite words"中描述的 識別技術(shù)??蛇x地,該處理可以由可以判定一個或多個查詢字是否在音頻中的錨的位置被 提到的其它合適的短語識別技術(shù)完成。上述方法可以擴展為通過在音頻中單獨或同時(例 如,同步)搜索每個項而完成對多個項執(zhí)行識別功能。
[0103] 該識別過程使用字或短語(例如,查詢Q中的搜索項)與音頻字段(例如,錨字 段),返回表示所提供的音頻字段包含所提供的字或短語的置信度的事件置信等級。這樣, 搜索擴展后的錨A中的每個錨字段以判定這些字段是否包含查詢Q中的字或短語。同樣地, 因為例如在音頻集的縮減部分中搜索包括查詢字的縮減組的字(稱為"約束語法(例如, 僅搜索先前錨字段),因此搜索時間能夠縮短。參看美國第7, 487, 094號專利"System and method of call classification with context modeling based on composite words',, 了解有關(guān)約束語法的其它詳細信息。
[0104] 然后為每個事件(例如,每個可能的匹配項)計算事件置信度,具有高于特定閥值 的事件置信度的事件被認為是命中點(即,包含所搜索的查詢項的音頻中的位置),這些搜 索結(jié)果在步驟290中返回。顯示搜索結(jié)果時,搜索結(jié)果可以按照它們的事件置信度進行分 類,具有最高相似度的匹配項首先顯示。
[0105] 圖10、11、12和13中的上述過程可以說明如下:
[0106] 1.A -傘
[0107] 2?對于查詢◎ 中的每一個字w
[0108] A.如果w G VwesR,則從LVCSR中收集具有高字置信度(字置信度高于預定閥值) 的字,生成一組錨AIV= {(WhS^ei)}
[0109] B.如果w 則從LVCSR中收集具有低字置信度(字置信度在兩個預定閥 值之間)的字:
[0110] ?通過采用W的子字創(chuàng)建搜索列表
[0111] ?從LVCSR索引中的列表中搜索每個項,生成一組錨A_
[0112] C.AW-AIVUA_
[0113] D.A -A U Aw
[0114] 3?對每個錨,a;= (w ;,Si, e;),擴展其兩側(cè)的邊界:
[0115] A.在查詢Q中找到字Wl的相對位置,從該字的每一側(cè)計算字符數(shù)。將它們分別記 為LjPRi。
[0116] B.Si-s廠(1^*y+(301181^),e;-ei+(RiXy+constr),其中y是平均字符寬度。
[0117] 4.根據(jù)開始時間對所述錨進行分類并且合并重疊的錨。
[0118] 5.對于所述錨中的每一個錨字段
[0119] A?使用約束語法搜索所述字段。
[0120] 多次移動搜索窗直到超出搜索范圍。
[0121] B.為所述事件計算事件置信度并與閥值進行比較。
[0122] 在
當前第4頁1 2 3 4 5 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1