一種用于形成文字索引的多媒體系統(tǒng)及處理方法
【專利摘要】本發(fā)明涉及一種多媒體系統(tǒng),包括拍攝終端、服務(wù)器和查詢終端;服務(wù)器包括第二傳輸單元、解析單元、數(shù)據(jù)庫、第二存儲(chǔ)單元等;其中,所述服務(wù)器用于讀取拍攝終端上傳的文字,并形成文字索引。本發(fā)明還涉及一種使用所述多媒體系統(tǒng)的多媒體方法。
【專利說明】-種用于形成文字索引的多媒體系統(tǒng)及處理方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及多媒體領(lǐng)域,特別涉及能夠形成文字索引的多媒體領(lǐng)域。
【背景技術(shù)】
[0002] 隨著網(wǎng)絡(luò)和多媒體技術(shù)的廣泛應(yīng)用,網(wǎng)絡(luò)培訓(xùn)已成為員工培訓(xùn)的必然發(fā)展趨勢(shì)。 然而,網(wǎng)絡(luò)培訓(xùn)面臨著"來源單一、脫離實(shí)踐、滯后現(xiàn)場(chǎng)"的問題,尤其是缺少以現(xiàn)場(chǎng)案例為 內(nèi)容的生產(chǎn)技能類培訓(xùn),這勢(shì)必會(huì)影響以生產(chǎn)技能操作為主的員工培訓(xùn)效果。因此,積極引 入現(xiàn)場(chǎng)案例教學(xué),探索智能終端和移動(dòng)網(wǎng)絡(luò)的應(yīng)用,將成為網(wǎng)絡(luò)培訓(xùn)和資源建設(shè)的新方向。
【發(fā)明內(nèi)容】
[0003] 本發(fā)明涉及一種多媒體系統(tǒng),包括拍攝終端、服務(wù)器和查詢終端;其特征在于:月艮 務(wù)器包括第二傳輸單元、解析單元、數(shù)據(jù)庫、第二存儲(chǔ)單元;其中,所述服務(wù)器用于讀取拍攝 終端上傳的文字,并形成文字索引。
[0004] 本發(fā)明還涉及一種使用所述多媒體系統(tǒng)的多媒體處理方法,其特征在于包括以下 步驟:
[0005] 步驟S100,用戶使用拍攝終端拍攝多媒體,所述多媒體包括視頻和音頻;當(dāng)在某 一位置和/或變焦拍攝時(shí),由計(jì)時(shí)單元記錄下拍攝的開始時(shí)間和結(jié)束時(shí)間;隨后,計(jì)時(shí)單元 將事件、開始時(shí)間和結(jié)束時(shí)間一并保存到第一存儲(chǔ)單元的記錄表中,其中所述事件包括位 置、變焦;
[0006] 步驟S200,將多媒體中的音頻轉(zhuǎn)換為文字,轉(zhuǎn)換后,在拍攝終端上顯示給用戶,供 用戶確認(rèn);如果用戶認(rèn)為轉(zhuǎn)換的文字內(nèi)容有錯(cuò)誤或需要調(diào)整,則使用拍攝終端的第一輸入 單元進(jìn)行修改;
[0007] 步驟S220,拍攝終端通過第一傳輸單元將拍攝的多媒體、第一存儲(chǔ)單元中的記錄 表、以及經(jīng)過用戶確認(rèn)的文字上傳到服務(wù)器的第二傳輸單元,服務(wù)器將拍攝的多媒體保存 到數(shù)據(jù)庫中,并記錄多媒體ID,所述多媒體ID是上傳的多媒體的唯一標(biāo)識(shí);
[0008] 步驟S240,服務(wù)器根據(jù)記錄表中的事件、開始時(shí)間和結(jié)束時(shí)間,使用解析單元從多 媒體的視頻中提取關(guān)鍵幀,并確定關(guān)鍵幀的錄制時(shí)長,所述關(guān)鍵幀為拍攝終端在同一事件 下拍攝的視頻幀的代表;
[0009] 步驟S260,得到視頻中每個(gè)事件對(duì)應(yīng)的關(guān)鍵幀和事件的持續(xù)時(shí)間,其中根據(jù)每個(gè) 事件的開始時(shí)間和結(jié)束時(shí)間獲取持續(xù)時(shí)間;
[0010] 步驟S300,服務(wù)器讀取所述上傳的文字,根據(jù)文字中的標(biāo)點(diǎn)符號(hào),將文字切分為基 本字符串單元;
[0011] 步驟S310,根據(jù)分詞詞典,對(duì)基本字符串單元進(jìn)行正向最大分詞匹配和逆向最大 分詞匹配,形成分詞掃描字符串;
[0012] 步驟S320,判斷分詞掃描字符串是否存在歧義;如果存在歧義,則消除歧義,形成 分詞結(jié)果字符串;如果不存在歧義,則直接將分詞掃描字符串作為分詞結(jié)果字符串;
[0013] 其中,對(duì)于存在歧義的字符串ABC,根據(jù)以下公式計(jì)算I (A,B)和I (B,C)的值:
【權(quán)利要求】
1. 一種多媒體系統(tǒng),包括拍攝終端、服務(wù)器和查詢終端;其特征在于:服務(wù)器包括第二 傳輸單元、解析單元、數(shù)據(jù)庫、第二存儲(chǔ)單元;其中,所述服務(wù)器用于讀取拍攝終端上傳的文 字,并形成文字索引。
2. -種使用根據(jù)權(quán)利要求1所述的多媒體系統(tǒng)的多媒體處理方法,其特征在于包括以 下步驟: 步驟S100,用戶使用拍攝終端拍攝多媒體,所述多媒體包括視頻和音頻;當(dāng)在某一位 置和/或變焦拍攝時(shí),由計(jì)時(shí)單元記錄下拍攝的開始時(shí)間和結(jié)束時(shí)間;隨后,計(jì)時(shí)單元將事 件、開始時(shí)間和結(jié)束時(shí)間一并保存到第一存儲(chǔ)單元的記錄表中,其中所述事件包括位置、變 焦; 步驟S200,將多媒體中的音頻轉(zhuǎn)換為文字,轉(zhuǎn)換后,在拍攝終端上顯示給用戶,供用戶 確認(rèn);如果用戶認(rèn)為轉(zhuǎn)換的文字內(nèi)容有錯(cuò)誤或需要調(diào)整,則使用拍攝終端的第一輸入單元 進(jìn)行修改; 步驟S220,拍攝終端通過第一傳輸單元將拍攝的多媒體、第一存儲(chǔ)單元中的記錄表、以 及經(jīng)過用戶確認(rèn)的文字上傳到服務(wù)器的第二傳輸單元,服務(wù)器將拍攝的多媒體保存到數(shù)據(jù) 庫中,并記錄多媒體ID,所述多媒體ID是上傳的多媒體的唯一標(biāo)識(shí); 步驟S240,服務(wù)器根據(jù)記錄表中的事件、開始時(shí)間和結(jié)束時(shí)間,使用解析單元從多媒體 的視頻中提取關(guān)鍵巾貞,并確定關(guān)鍵巾貞的錄制時(shí)長,所述關(guān)鍵巾貞為拍攝終端在同一事件下拍 攝的視頻巾貞的代表; 步驟S260,得到視頻中每個(gè)事件對(duì)應(yīng)的關(guān)鍵幀和事件的持續(xù)時(shí)間,其中根據(jù)每個(gè)事件 的開始時(shí)間和結(jié)束時(shí)間獲取持續(xù)時(shí)間; 步驟S300,服務(wù)器讀取所述上傳的文字,根據(jù)文字中的標(biāo)點(diǎn)符號(hào),將文字切分為基本字 符串單元; 步驟S310,根據(jù)分詞詞典,對(duì)基本字符串單元進(jìn)行正向最大分詞匹配和逆向最大分詞 匹配,形成分詞掃描字符串; 步驟S320,判斷分詞掃描字符串是否存在歧義;如果存在歧義,則消除歧義,形成分詞 結(jié)果字符串;如果不存在歧義,則直接將分詞掃描字符串作為分詞結(jié)果字符串; 其中,對(duì)于存在歧義的字符串ABC,根據(jù)以下公式計(jì)算I(A,B)和I(B,C)的值:
其中A、B、C為單個(gè)字或詞,n(x,y)為x,y在分詞詞典中出現(xiàn)的次數(shù),n(x)為x在分詞 詞典中出現(xiàn)的次數(shù),n(y)分別為y在分詞詞典中出現(xiàn)的次數(shù),N為分詞詞典的總詞數(shù); 比較I(A,B)和I(B,C)的值: 如果I(A,B)-I(B,C) >i,那么采用AB/C的切分; 如果I(B,C)-I(A,B) >i,那么采用A/BC的切分; 其中,i為第一閥值,優(yōu)選為〇 ; 如果非上述兩種情況,則利用如下公式:
其中,f(AB)表示在所述字符串中AB出現(xiàn)的次數(shù);f(BC)表示在所述字符串中BC出現(xiàn) 的次數(shù);Max(f(AB),f(BC))的值為f(AB)和f(BC)中較大的;比較Af與運(yùn), 其中0為第二閾值,優(yōu)選為0.75; 如果Af> @,則將字符串ABC切分為"AB/C" ; 如果Af〈 = @,則將字符串ABC切分為"A/BC" ; 步驟S330,將經(jīng)過分詞后的字符串匯聚成文字索引; 步驟S340,對(duì)于每一個(gè)多媒體,服務(wù)器形成多媒體索引表,并存儲(chǔ)在第二存儲(chǔ)單元中; 所述多媒體索引表包括:多媒體ID、文字索引、關(guān)鍵幀集合以及事件持續(xù)時(shí)間集合; 步驟S400,用戶使用查詢終端查找所述多媒體,并將檢索結(jié)果呈現(xiàn)給用戶。
【文檔編號(hào)】H04L29/06GK104408162SQ201410737502
【公開日】2015年3月11日 申請(qǐng)日期:2014年12月5日 優(yōu)先權(quán)日:2014年12月5日
【發(fā)明者】李榮凱, 秦衡, 謝清玉, 張耀坤, 李經(jīng)緯 申請(qǐng)人:國家電網(wǎng)公司, 國網(wǎng)技術(shù)學(xué)院