一種音視頻語音信息精確定位的檢索系統(tǒng)及方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于音視頻語音信息檢索領(lǐng)域,具體涉及一種音視頻語音信息精確定位的檢索系統(tǒng)及方法。
【背景技術(shù)】
[0002]隨著網(wǎng)絡(luò)和多媒體技術(shù)的迅猛發(fā)展,音視頻媒體的數(shù)量呈爆炸性增長,人們對數(shù)字音視頻語音信息的檢索、精確定位的需求越發(fā)突出。近年來,基于內(nèi)容的音視頻檢索出現(xiàn)了許多新的研究和發(fā)展方向。
[0003]傳統(tǒng)技術(shù)中,多數(shù)的音視頻語音信息檢索系統(tǒng)及檢索方法,一般僅針對音頻文件中語音信息進行關(guān)鍵字檢索(例如音頻文件中語音信息的搜索方法、裝置及設(shè)備”專利申請公布號:CN101996195A),而不是對音頻文件中關(guān)鍵字以外的自由字、詞進行全面檢索和精確定位。
[0004]面對音視頻語音信息檢索,依然采用標(biāo)序和打點的方法,尚無有效的辦法進行快速檢索,精確定位。對一般人員,基本上憑借個人經(jīng)驗,只能依靠播放音視頻語音文件進行原始的人工查找,費時費力。遠(yuǎn)不能滿足信息化社會對信息時效和信息規(guī)范化管理的要求。
[0005]通過“音視頻語音處理與檢索系統(tǒng)”生成的語音、文字、視頻三位一體的電子集成文檔,為音視頻語音信息快速檢索、精確定位提供了一種新的方法。
【發(fā)明內(nèi)容】
[0006]為了有效解決上述問題,本發(fā)明提供一種音視頻語音信息精確定位的檢索系統(tǒng)和方法。
[0007]所述“音視頻語音信息精確定位的檢索系統(tǒng)及方法”,僅用于檢索“音視頻三維一體電子集成文檔”即“目標(biāo)文件”。
[0008]本發(fā)明的技術(shù)方案具體如下:一種音視頻語音信息精確定位的檢索系統(tǒng),所述檢索系統(tǒng)包括處理單元、顯示單元及手動操作單元。所述顯示單元及手動操作單元均連接在處理單元上,所述處理單元包括目標(biāo)文件瀏覽模塊、目標(biāo)文件檢索模塊、查找模塊及處理模塊,所述目標(biāo)文件瀏覽模塊、目標(biāo)文件檢索模塊及查找模塊均連接在處理模塊上。
[0009]進一步地,所述目標(biāo)文件檢索模塊應(yīng)用近似于位置檢索方式,利用記錄中的自然語言進行檢索,詞與詞之間的邏輯關(guān)系用位置算符進行組配??梢圆灰蕾囍黝}詞表而直接使用自由詞進行檢索的技術(shù)方法。
[0010]進一步地,所述目標(biāo)文件檢索模塊是可以從任意存儲介質(zhì)中跨硬盤跨文件夾進行檢索。輸入目標(biāo)文件中任意需要檢索的詞組或句子。系統(tǒng)自動搜索到含有該詞組和句子的所有目標(biāo)文件,并將檢索到的目標(biāo)文件一一列表;
進一步地,所述目標(biāo)文件檢索模塊,打開檢索到的目標(biāo)文件時,系統(tǒng)依據(jù)檢索的詞組或句子。通過絕對匹配在文檔中所要查詢的信息,當(dāng)查詢結(jié)果為真時,返回文檔中所處的定位,并精確定位相應(yīng)的語音視頻信息; 進一步地,所述目標(biāo)文件瀏覽模塊為:讀取目標(biāo)文件,并連接顯示單元實現(xiàn)音頻、視頻、文字同步瀏覽,保持音頻、視頻、文字精準(zhǔn)對應(yīng)的關(guān)聯(lián)。當(dāng)播放語音、圖像時,與語音對應(yīng)的文字,會自動尚殼顯不;
進一步地,所述目標(biāo)文件瀏覽模塊在瀏覽部分或全部文字時,與被瀏覽文字相關(guān)聯(lián)的語音和圖像會同步播放,其播放的語音可以在目標(biāo)文件中的原音與跟讀音之間切換;
進一步地,所述目標(biāo)文件瀏覽模塊可以實現(xiàn)將文字信息導(dǎo)出純文本或富文本格式文件,并導(dǎo)入其他文件編輯器中編輯打?。?br> 進一步地,所述查找模塊為:打開任一個目標(biāo)文件,輸入一個要查找的詞組或字段,系統(tǒng)會自動檢索當(dāng)前打開的目標(biāo)文件的文本,并高亮顯示所有與給定詞組或字段相符的文字,并定位相應(yīng)的語音視頻信息,同步播放;
一種音視頻語音信息精確定位的檢索方法,應(yīng)用上述的檢索系統(tǒng),所述方法包括以下步驟:
A、進行選擇檢索系統(tǒng)方向;
B、進行瀏覽目標(biāo)文件;
C、進行目標(biāo)文件檢索;
D、進行目標(biāo)文件內(nèi)查找;
進一步地,步驟A中的所述選擇檢索方向包括目標(biāo)文件瀏覽、目標(biāo)文件檢索和目標(biāo)文件內(nèi)查找;
所述步驟B中瀏覽目標(biāo)文件,包括直接手動打開要瀏覽的目標(biāo)文件,瀏覽全部文檔或部分段落、語句,同步播放對應(yīng)的語音和圖像??梢詫x中的段落、語句進行輸出、打印;
上述步驟C中目標(biāo)文件檢索,包括輸入要檢索的詞組,句子或段落,指定查找檢索路徑,進行檢索,系統(tǒng)自動給出包含檢索內(nèi)容的目標(biāo)文件列表。根據(jù)列表調(diào)入目標(biāo)文件,被檢索到的內(nèi)容在播放器中高亮顯示,并會自動播放對應(yīng)的音視頻文件。還可以對選中的段落、語句進行輸出、打??;
進一步地,所述步驟D中目標(biāo)文件內(nèi)查找,包括打開任一個目標(biāo)文件,通過查找功能輸入一個要查找的詞組或字段,系統(tǒng)全文檢索當(dāng)前打開的目標(biāo)文件的文本,并高亮顯示所有與給定關(guān)鍵詞或字段相符的文字,同步播放對應(yīng)的語音和圖像。也可以對選中的段落、語句進行輸出、打印。
[0011]本發(fā)明的有益效果:
1、實現(xiàn)了音視頻語音信息,依據(jù)自由字、詞或字段的精確定位與快速檢索;
2、可以從不同的硬盤、不同的文件夾中,檢索出包含相同內(nèi)容的所有目標(biāo)文件,進行比對,并獲得與檢索內(nèi)容同步的語音和圖像的再現(xiàn);
3、可以方便的復(fù)制檢索到的文本內(nèi)容,引用或再編輯;
4、在瀏覽、播放的同時,可以在跟讀音與原音之間互相切換,進行內(nèi)容真實性驗證;
5、本系統(tǒng)是目標(biāo)文件專用的檢索系統(tǒng),具有高保密性,并通過權(quán)限設(shè)置,將各個目標(biāo)文件設(shè)定成不同的訪問級別,只有用戶權(quán)限級別超過訪問級別時才可以訪問,實現(xiàn)多層次的保密級別。
【附圖說明】
[0012]圖1為本發(fā)明音視頻語音檢索系統(tǒng)的總流程圖。
[0013]圖2為本發(fā)明通過目標(biāo)文件中的文字進行瀏覽的流程圖;
圖3為本發(fā)明通過詞組和句子進行檢索目標(biāo)文件的流程圖;
圖4為本發(fā)明通過目標(biāo)文件中的自由字、詞進行檢索相關(guān)音視頻片段的流程圖。
【具體實施方式】
[0014]下面結(jié)合實例對本發(fā)明的技術(shù)方案進行詳細(xì)說明,顯然,所描述的實例僅僅是本發(fā)明中很小的一部分,而不是全部的實例?;诒景l(fā)明中的實例,本領(lǐng)域人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實例,都屬于本發(fā)明保護的范圍。
[0015]如圖1所示為本發(fā)明音視頻語音檢索系統(tǒng)的總流程圖,具體為本發(fā)明提供一種音視頻語音信息精確定位的檢索方法,所述該方法用于檢索語音、文本及視頻三維一體的電子集成文件(即目標(biāo)文件),所述該方法包括以下步驟:
A)首先選擇要檢索方向:瀏覽目標(biāo)文件、目標(biāo)文件內(nèi)檢索、檢索目標(biāo)文件
B)如圖2所示,通過文字瀏覽目標(biāo)文件,瀏覽文字的同時,重現(xiàn)聲音和圖像的三維效果。選擇文字導(dǎo)出格式:純文本、富文本或字符塊。打印輸出相關(guān)文本內(nèi)容。
[0016]C)如圖3所示,通過詞組或句子檢索相關(guān)目標(biāo)文件,具體為:
Cl:輸入需要檢索的詞組或句子;
C2:確定檢索范圍,指定查找路徑;
C3:列出包含檢索詞組或句子的目標(biāo)文件;
C4:依次打開檢索到的目標(biāo)文件,瀏覽相關(guān)內(nèi)容;
C5:導(dǎo)出或打印相關(guān)內(nèi)容
D)如圖4所示,在目標(biāo)文件內(nèi),通過關(guān)鍵字檢索相關(guān)音視頻片段,具體為:
Dl:打開目標(biāo)文件;
D2:輸入要檢索的詞組或句子;
D3:顯示包含查找的詞組或句子,并同步播放對應(yīng)的語音和圖像;
D4:導(dǎo)出、打印相關(guān)內(nèi)容。
[0017]具體應(yīng)用實例:
如圖1所示,通過音視頻文件檢索系統(tǒng)打開音視頻語音處理系統(tǒng)生成的與音視頻信息相關(guān)聯(lián)的電子集成文檔即目標(biāo)文件進行閱讀,以及在指定目錄中對目標(biāo)文件進行全文檢索,并可以對已打開的電子集成文檔按文字檢索,并播放對應(yīng)的音視頻信息。還可以選擇播放器中的文字拷貝至文字處理程序(例如:微軟Off