基于關(guān)鍵特征的大規(guī)模編目模版遷移方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了一種基于關(guān)鍵特征的大規(guī)模編目模版遷移方法,包括步驟:S1、分別從待遷移的編目模版庫(kù)與目標(biāo)編目模版庫(kù)中獲取音視頻模版,兩兩基于音視頻的關(guān)鍵特征進(jìn)行音視頻內(nèi)容的比對(duì);S2、經(jīng)過音視頻內(nèi)容的比對(duì),若待遷移的模版在目標(biāo)庫(kù)中已存在,即在目標(biāo)庫(kù)中存在完全相同音視頻內(nèi)容的編目模版,那么計(jì)算機(jī)自動(dòng)將該模版丟棄,不予遷移;S3、由用戶處理分組好的編目模版,即有音視頻內(nèi)容部分重疊的模版組,根據(jù)具體的業(yè)務(wù)需要,由用戶排除無效的編目模版,同時(shí)可針對(duì)有部分內(nèi)容重疊的模版進(jìn)行編輯裁剪為有效模版后連同剩余的有效編目模版由計(jì)算機(jī)自動(dòng)遷移入目標(biāo)編目模版庫(kù)。
【專利說明】基于關(guān)鍵特征的大規(guī)模編目模版遷移方法及系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及計(jì)算機(jī)編目【技術(shù)領(lǐng)域】,特別涉及一種基于關(guān)鍵特征的大規(guī)模編目模版遷移方法及系統(tǒng)。
【背景技術(shù)】
[0002]傳統(tǒng)的遷移辦法一般為人工導(dǎo)入,在導(dǎo)入的過程中盡量從文本內(nèi)容避開相同重復(fù)模版的可能性,這種遷移方法一般需要耗費(fèi)很大的人工量,并且難免會(huì)有重復(fù),因?yàn)榇嬖诖罅课谋久枋霾煌粢曨l內(nèi)容卻一致的編目模版。
【發(fā)明內(nèi)容】
[0003](一)要解決的技術(shù)問題
[0004]本發(fā)明所要解決的技術(shù)問題是:如何提供一種基于關(guān)鍵特征的大規(guī)模編目模版遷移技術(shù)和方法,充分利用計(jì)算機(jī)音視頻關(guān)鍵特征比對(duì)技術(shù),實(shí)現(xiàn)在少量人工參與的情況下,計(jì)算機(jī)自動(dòng)對(duì)大規(guī)模的編目模版進(jìn)行遷移案。
[0005](二)技術(shù)方案
[0006]為解決上述問題,本發(fā)明提供一種基于關(guān)鍵特征的大規(guī)模編目模版遷移方法,包括步驟:S1、分別從待遷移的編目模版庫(kù)與目標(biāo)編目模版庫(kù)中獲取音視頻模版,兩兩基于音視頻的關(guān)鍵特征進(jìn)行音視頻內(nèi)容的比對(duì);S2、經(jīng)過音視頻內(nèi)容的比對(duì),若待遷移的模版在目標(biāo)庫(kù)中已存在,即在目標(biāo)庫(kù)中存在完全相同音視頻內(nèi)容的編目模版,那么計(jì)算機(jī)自動(dòng)將該模版丟棄,不予遷移;若待遷移的模版在目標(biāo)庫(kù)中不存在,即在目標(biāo)庫(kù)中找不到與其音視頻內(nèi)容相同或部分相同的編目模版,則計(jì)算機(jī)自動(dòng)將該模版遷移到目標(biāo)編目模版庫(kù)中;若在目標(biāo)庫(kù)中找到有部分音視頻內(nèi)容與待遷移的編目模版相同時(shí),則自動(dòng)將其標(biāo)記分組,同時(shí)轉(zhuǎn)入步驟S3 ;S3、由處理分組好的編目模版,即有音視頻內(nèi)容部分重疊的模版組,根據(jù)具體的業(yè)務(wù)需要,排除無效的編目模版,剩余的有效編目模版計(jì)算機(jī)將自動(dòng)遷移入目標(biāo)編目模版庫(kù)。
[0007]本發(fā)明還提供一種基于關(guān)鍵特征的大規(guī)模編目模版遷移系統(tǒng),包括:音視頻關(guān)鍵特征比對(duì)模塊,通過該模塊,計(jì)算機(jī)自動(dòng)抽取待遷移模版與目標(biāo)庫(kù)中的已有模版中的音視頻關(guān)鍵特征,并對(duì)模版中的音視頻內(nèi)容進(jìn)行自動(dòng)比對(duì)?’編目模版分組模塊,通過該模塊,計(jì)算機(jī)自動(dòng)根據(jù)模版關(guān)鍵特征的比對(duì)結(jié)果對(duì)待遷移的模版進(jìn)行分組,將其分為:完全相同、完全不同、部分相同3組模版,并進(jìn)行標(biāo)識(shí);人工審核界面模塊,該模塊提供人機(jī)交互界面,人工可通過該界面對(duì)與目標(biāo)庫(kù)中模版部分相同的待遷移模版進(jìn)行審核,人工可回放待遷移模版與目標(biāo)庫(kù)中模版相同部分的音視頻,根據(jù)不同的業(yè)務(wù)需要,決定該待遷移模版是否為有效模版,即是否該遷移入庫(kù);編目模版遷移模塊,通過該模塊,計(jì)算機(jī)自動(dòng)匯總有效的新的待遷移模版,并將模版所對(duì)應(yīng)的音視頻文件,以及文本描述信息入目標(biāo)庫(kù)。
[0008] 優(yōu)選地,所述音視頻關(guān)鍵特征比對(duì)模塊的工作流程包括:a、獲取待遷移模版中的音頻信號(hào),進(jìn)行預(yù)處理,即提取功率譜并計(jì)算子帶能量,建立能量直方圖,得到音頻指紋,即音頻關(guān)鍵特征;b、獲取目標(biāo)模版庫(kù)中模版的音頻信號(hào),進(jìn)行預(yù)處理,S卩加窗提取功率譜,并計(jì)算子帶能量,建立能量直方圖,得到音頻關(guān)鍵特征;C、根據(jù)兩個(gè)模版的音頻關(guān)鍵特征,進(jìn)行模版比對(duì),計(jì)算兩個(gè)模版的相似度,最后根據(jù)人工預(yù)設(shè)的門限值,決策該兩個(gè)模版是否相同、部分相同或完全不同。
[0009]優(yōu)選地,所述編目模版分組模塊的工作流程包括:自動(dòng)將完全相同的待遷移模版丟棄,完全不同的模版即為新模版,自動(dòng)傳送給編目模版遷移模塊進(jìn)行遷移入目標(biāo)庫(kù),而對(duì)于部分相同的模版則傳送給人工審核界面模塊。
[0010]優(yōu)選地,所述人工審核界面模塊的工作流程包括:人工可通過該界面對(duì)待遷移模版進(jìn)行編輯裁剪為有效模版后再遷移入庫(kù)。
[0011](三)有益效果
[0012]根據(jù)本發(fā)明,能夠很好地解決傳統(tǒng)方法耗費(fèi)人力、速度慢,而且容易存在重復(fù)內(nèi)容的編目模版的缺點(diǎn),能夠在少量人工參與的情況下通過計(jì)算機(jī)自動(dòng)進(jìn)行編目模版的遷移,同時(shí)在遷移過程中真正避免重復(fù)模版的情況出現(xiàn)。
【專利附圖】
【附圖說明】
[0013]圖1為依照本發(fā)明實(shí)施例的基于關(guān)鍵特征的大規(guī)模編目模版遷移方法的流程示意圖;
[0014]圖2為依照本發(fā)明實(shí)施例的基于關(guān)鍵特征的大規(guī)模編目模版遷移系統(tǒng)的結(jié)構(gòu)示意圖;
[0015]圖3為依照本發(fā)明實(shí)施例的音視頻關(guān)鍵特征比對(duì)模塊的工作流程示意圖。
【具體實(shí)施方式】
[0016]下面結(jié)合附圖和實(shí)施例,對(duì)本發(fā)明的【具體實(shí)施方式】作進(jìn)一步詳細(xì)描述。以下實(shí)施例用于說明本發(fā)明,但不用來限制本發(fā)明的范圍。
[0017]如圖1所示,根據(jù)本發(fā)明實(shí)施例的基于關(guān)鍵特征的大規(guī)模編目模版遷移方法包含以下步驟:
[0018]步驟S1:分別從待遷移的編目模版庫(kù)與目標(biāo)編目模版庫(kù)中獲取音視頻模版,兩兩基于音視頻的關(guān)鍵特征進(jìn)行音視頻內(nèi)容的比對(duì),在本方法中,關(guān)鍵特征可看作是這一小段音頻數(shù)據(jù)本身的一個(gè)短小的總結(jié),通過數(shù)學(xué)函數(shù)的映射,可將數(shù)據(jù)冗余較大的音頻波形空間映射到指紋空間,從而在比對(duì)過程中定位相似或相同的音頻內(nèi)容。
[0019]步驟S2:經(jīng)過音視頻內(nèi)容的比對(duì),若待遷移的模版在目標(biāo)庫(kù)中已存在,即在目標(biāo)庫(kù)中存在完全相同音視頻內(nèi)容的編目模版,那么計(jì)算機(jī)自動(dòng)將該模版丟棄,不予遷移;若待遷移的模版在目標(biāo)庫(kù)中不存在,即在目標(biāo)庫(kù)中找不到與其音視頻內(nèi)容相同或部分相同的編目模版,則計(jì)算機(jī)自動(dòng)將該模版遷移到目標(biāo)編目模版庫(kù)中;若在目標(biāo)庫(kù)中找到有部分音視頻內(nèi)容與待遷移的編目模版相同時(shí),則自動(dòng)將其標(biāo)記分組,同時(shí)轉(zhuǎn)入人工處理流程,即步驟S3 ;
[0020]步驟S3:由人工處理分組好的編目模版,即有音視頻內(nèi)容部分重疊的模版組,人工根據(jù)具體的業(yè)務(wù)需要,排除無效的編目模版,剩余的有效編目模版計(jì)算機(jī)將自動(dòng)遷移入目標(biāo)編目模版庫(kù)。[0021]如圖2所示,根據(jù)本發(fā)明實(shí)施例的基于關(guān)鍵特征的大規(guī)模編目模版遷移系統(tǒng)包含以下模塊:
[0022]音視頻關(guān)鍵特征比對(duì)模塊、編目模版分組模塊、人工審核界面模塊、編目模版遷移模塊。其中,
[0023]I)音視頻關(guān)鍵特征比對(duì)模塊
[0024]通過該模塊,計(jì)算機(jī)自動(dòng)抽取待遷移模版與目標(biāo)庫(kù)中的已有模版中的音視頻關(guān)鍵特征,并對(duì)模版中的音視頻內(nèi)容進(jìn)行自動(dòng)比對(duì),比對(duì)流程如圖3中所示。
[0025]首先獲取待遷移模版中的音頻信號(hào),進(jìn)行預(yù)處理,即提取功率譜并計(jì)算子帶能量,建立能量直方圖,得到音頻指紋,即音頻關(guān)鍵特征。
[0026]獲取目標(biāo)模版庫(kù)中模版的音頻信號(hào),采取類似的預(yù)處理方式,即加窗提取功率譜,并計(jì)算子帶能量,建立能量直方圖,得到音頻關(guān)鍵特征。
[0027]根據(jù)兩個(gè)模版的音頻關(guān)鍵特征,進(jìn)行模版比對(duì),計(jì)算兩個(gè)模版的相似度,最后根據(jù)人工預(yù)設(shè)的門限值,決策該兩個(gè)模版是否相同、部分相同或完全不同。
[0028]2)編目模版分組模塊
[0029]通過該模塊,計(jì)算機(jī)自動(dòng)根據(jù)模版關(guān)鍵特征的比對(duì)結(jié)果對(duì)待遷移的模版進(jìn)行分組,將其分為:完全相同、完全不同、部分相同3組模版,并進(jìn)行標(biāo)識(shí)。
[0030]自動(dòng)將完全相同的待遷移模版丟棄,完全不同的模版即為新模版,自動(dòng)傳送給編目模版遷移模塊進(jìn)行遷移入目標(biāo)庫(kù),而對(duì)于部分相同的模版則傳送給人工審核界面模塊。
[0031]3)人工審核界面模塊
[0032]該模塊提供人機(jī)交互界面,人工可通過該界面對(duì)與目標(biāo)庫(kù)中模版部分相同的待遷移模版進(jìn)行審核,人工可回放待遷移模版與目標(biāo)庫(kù)中模版相同部分的音視頻,根據(jù)不同的業(yè)務(wù)需要,決定該待遷移模版是否為有效模版,即是否該遷移入庫(kù)。人工也可通過該界面對(duì)待遷移模版進(jìn)行編輯裁剪為有效模版后再遷移入庫(kù)。
[0033]4)編目模版遷移模塊
[0034]通過該模塊,計(jì)算機(jī)自動(dòng)匯總有效的新的待遷移模版,并將模版所對(duì)應(yīng)的音視頻文件,以及文本描述信息入目標(biāo)庫(kù)。
[0035]通過結(jié)合附圖對(duì)本發(fā)明具體實(shí)施例的描述,本發(fā)明的其它方面及特征對(duì)本領(lǐng)域的技術(shù)人員而言是顯而易見的。
[0036]以上所述僅是本發(fā)明的優(yōu)選實(shí)施方式,應(yīng)當(dāng)指出,對(duì)于本【技術(shù)領(lǐng)域】的普通技術(shù)人員來說,在不脫離本發(fā)明技術(shù)原理的前提下,還可以做出若干改進(jìn)和替換,這些改進(jìn)和替換也應(yīng)視為本發(fā)明的保護(hù)范圍。
【權(quán)利要求】
1.一種基于關(guān)鍵特征的大規(guī)模編目模版遷移方法,其特征在于,包括步驟: 51、分別從待遷移的編目模版庫(kù)與目標(biāo)編目模版庫(kù)中獲取音視頻模版,兩兩基于音視頻的關(guān)鍵特征進(jìn)行音視頻內(nèi)容的比對(duì); 52、經(jīng)過音視頻內(nèi)容的比對(duì),若待遷移的編目模版在目標(biāo)編目模版庫(kù)中已存在,則將該模版丟棄,不予遷移; 若待遷移的編目模版在目標(biāo)編目模版庫(kù)中不存在,則將該編目模版遷移到目標(biāo)編目模版庫(kù)中; 若在目標(biāo)編目模版庫(kù)中找到有部分音視頻內(nèi)容與待遷移的編目模版相同時(shí),則自動(dòng)將其標(biāo)記分組,同時(shí)轉(zhuǎn)入步驟S3 ; 53、由用戶排除無效的編目模版,對(duì)有部分內(nèi)容重疊的模版進(jìn)行編輯裁剪為有效模版后連同剩余的有效編目模版自動(dòng)遷移入目標(biāo)編目模版庫(kù)中。
2.一種基于關(guān)鍵特征的大規(guī)模編目模版遷移系統(tǒng),其特征在于,包括: 音視頻關(guān)鍵特征比對(duì)模塊,通過該模塊計(jì)算機(jī)自動(dòng)抽取待遷移模版與目標(biāo)庫(kù)中的已有模版中的音視頻關(guān)鍵特征,并對(duì)模版中的音視頻內(nèi)容進(jìn)行自動(dòng)比對(duì); 編目模版分組模塊,通過該模塊計(jì)算機(jī)自動(dòng)根據(jù)模版關(guān)鍵特征的比對(duì)結(jié)果對(duì)待遷移的模版進(jìn)行分組,將其分為:完全相同、完全不同、部分相同3組模版,并進(jìn)行標(biāo)識(shí); 人工審核界面模塊,該模塊提供人機(jī)交互界面,人工可通過該界面對(duì)與目標(biāo)庫(kù)中模版部分相同的待遷移模版進(jìn)行審核,人工可回放待遷移模版與目標(biāo)庫(kù)中模版相同部分的音視頻,根據(jù)不同的業(yè)務(wù)需要,決定該待遷移模版是否為有效模版,即是否該遷移入庫(kù); 編目模版遷移模塊,通過該模塊,計(jì)算機(jī)自動(dòng)匯總有效的新的待遷移模版,并將模版所對(duì)應(yīng)的音視頻文件,以及文本描述信息入目標(biāo)庫(kù)。
3.如權(quán)利要求2所述的系統(tǒng),其特征在于,所述音視頻關(guān)鍵特征比對(duì)模塊的工作流程包括: a、獲取待遷移模版中的音頻信號(hào),進(jìn)行預(yù)處理; b、獲取目標(biāo)模版庫(kù)中模版的音頻信號(hào),進(jìn)行預(yù)處理; C、根據(jù)兩個(gè)模版的音頻關(guān)鍵特征,進(jìn)行模版比對(duì),計(jì)算兩個(gè)模版的相似度,最后根據(jù)人工預(yù)設(shè)的門限值,決策該兩個(gè)模版是否相同、部分相同或完全不同。
4.如權(quán)利要求2或3所述的系統(tǒng),其特征在于,所述編目模版分組模塊的工作流程包括: 自動(dòng)將完全相同的待遷移模版丟棄,完全不同的模版即為新模版,自動(dòng)傳送給編目模版遷移模塊進(jìn)行遷移入目標(biāo)庫(kù),而對(duì)于部分相同的模版則傳送給人工審核界面模塊。
5.如權(quán)利要求2或3所述的系統(tǒng),其特征在于,所述人工審核界面模塊的工作流程包括: 人工可通過該界面對(duì)待遷移模版進(jìn)行編輯裁剪為有效模版后再遷移入庫(kù)。
【文檔編號(hào)】G06F17/30GK103699575SQ201310628448
【公開日】2014年4月2日 申請(qǐng)日期:2013年11月29日 優(yōu)先權(quán)日:2013年11月29日
【發(fā)明者】陳鑫瑋, 徐波 申請(qǐng)人:北京中科模識(shí)科技有限公司