一種視頻檢索方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明實(shí)施例提供的一種視頻檢索方法及系統(tǒng),可以根據(jù)視頻幀的相似度將用于檢索的源視頻拆分為多個(gè)子視頻,并對(duì)每個(gè)子視頻分析得到子視頻的特征圖像,使用子視頻的特征圖像來進(jìn)行視頻檢索。在檢索時(shí),本發(fā)明可以根據(jù)圖像相似度及播放順序是否一致確定所要檢索的視頻。由于進(jìn)行視頻檢索時(shí),需要同時(shí)滿足圖像相似度高和播放順序一致這兩個(gè)條件,因此所確定的檢索結(jié)果的準(zhǔn)確性更高。同時(shí),本發(fā)明可以使用戶在不了解視頻名稱等文字信息時(shí)通過視頻來檢索視頻,擴(kuò)展了視頻檢索方式,降低了視頻檢索的難度。
【專利說明】一種視頻檢索方法及系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及信息檢索【技術(shù)領(lǐng)域】,特別是涉及一種視頻檢索方法及系統(tǒng)。
【背景技術(shù)】
[0002]隨著科技的發(fā)展,用戶通過各種電子設(shè)備觀看視頻也越來越普遍。
[0003]用戶經(jīng)常需要檢索自己所需要觀看的視頻,現(xiàn)有的視頻檢索技術(shù)一般可以通過視頻名稱、演職人員等文字信息來檢索視頻。例如:輸入某導(dǎo)演的名字,則與該導(dǎo)演相關(guān)的電影、電視劇就會(huì)在檢索結(jié)果中顯示。但這需要用戶知悉所要檢索的視頻的上述文字信息才能進(jìn)行檢索。當(dāng)用戶并不了解上述文字信息時(shí),則無法進(jìn)行檢索。
【發(fā)明內(nèi)容】
[0004]本發(fā)明實(shí)施例的目的在于提供一種視頻檢索方法及系統(tǒng),以通過視頻進(jìn)行檢索。
[0005]為達(dá)到上述目的,本發(fā)明實(shí)施例公開了一種視頻檢索方法,包括:
[0006]獲得用于檢索的源視頻;
[0007]根據(jù)所述源視頻的視頻幀的相似度,將所述源視頻至少拆分為第一子視頻和第二子視頻,并將拆分得到的子視頻按照播放順序進(jìn)行排序;
[0008]對(duì)所述第一子視頻和第二子視頻進(jìn)行分析,獲得所述第一子視頻的特征圖像以及所述第二子視頻的特征圖像;
[0009]利用所述第一子視頻的特征圖像和所述第二子視頻的特征圖像在預(yù)設(shè)的檢索庫(kù)中進(jìn)行檢索,命中第一索引圖像和第二索引圖像,其中,所述第一子視頻的特征圖像與所述第一索引圖像的相似度高于第二閾值,所述第二子視頻的特征圖像與所述第二索引圖像的相似度高于所述第二閾值;
[0010]若所述第一索引圖像和第二索引圖像對(duì)應(yīng)同一索引視頻,且所述第一索引圖像和所述第二索引圖像的排序與所述第一子視頻和所述第二子視頻的排序相同,確定所述第一索引圖像和第二索引圖像對(duì)應(yīng)的索引視頻為檢索結(jié)果。
[0011]優(yōu)選的,所述第一子視頻的特征圖像為所述第一子視頻中視頻幀的相同部分,所述第二子視頻的特征圖像為所述第二子視頻中視頻幀的相同部分;
[0012]或者,所述第一子視頻的特征圖像為所述第一子視頻中視頻幀的相同部分和不同部分,所述第二子視頻的特征圖像為所述第二子視頻中視頻幀的相同部分和不同部分;
[0013]或者,所述第一子視頻的特征圖像為所述第一子視頻中的第一幀、最后一幀及處于中間位置的視頻幀,所述第二子視頻的特征圖像為所述第二子視頻中的第一幀、最后一幀及處于中間位置的視頻幀;
[0014]或者,所述第一子視頻的特征圖像為從所述第一子視頻中提取出來的具有相同時(shí)間間隔的至少兩個(gè)視頻幀,所述第二子視頻的特征圖像為從所述第二子視頻中提取出來的具有相同時(shí)間間隔的至少兩個(gè)視頻巾貞;
[0015]或者,所述第一子視頻的特征圖像為對(duì)所述第一子視頻的視頻幀進(jìn)行均化處理后得到的圖像,所述第二子視頻的特征圖像為對(duì)所述第二子視頻的視頻幀進(jìn)行均化處理后得到的圖像。
[0016]優(yōu)選的,所述獲得用于檢索的源視頻,包括:根據(jù)用戶輸入的本地視頻地址,從本地獲得用于檢索的源視頻;
[0017]或者,所述獲得用于檢索的源視頻,包括:根據(jù)用戶輸入的網(wǎng)絡(luò)視頻地址,從網(wǎng)絡(luò)中獲得用于檢索的源視頻。
[0018]優(yōu)選的,還包括:輸出確定為檢索結(jié)果的索引視頻的標(biāo)識(shí)信息。
[0019]優(yōu)選的,還包括:
[0020]確定所述源視頻與確定為檢索結(jié)果的索引視頻的相對(duì)位置信息;
[0021]輸出所述相對(duì)位置信息。
[0022]一種視頻檢索系統(tǒng),包括:源視頻獲得模塊、源視頻拆分模塊、子視頻分析模塊、視頻檢索模塊和結(jié)果確定模塊,
[0023]所述源視頻獲得模塊,用于獲得用于檢索的源視頻;
[0024]所述源視頻拆分模塊,用于根據(jù)所述源視頻的視頻幀的相似度,將所述源視頻至少拆分為第一子視頻和第二子視頻,并將拆分得到的子視頻按照播放順序進(jìn)行排序;
[0025]所述子視頻分析模塊,用于對(duì)所述第一子視頻和第二子視頻進(jìn)行分析,獲得所述第一子視頻的特征圖像以及所述第二子視頻的特征圖像;
[0026]所述視頻檢索模塊,用于利用所述第一子視頻的特征圖像和所述第二子視頻的特征圖像在預(yù)設(shè)的檢索庫(kù)中進(jìn)行檢索,命中第一索引圖像和第二索引圖像,其中,所述第一子視頻的特征圖像與所述第一索引圖像的相似度高于第二閾值,所述第二子視頻的特征圖像與所述第二索引圖像的相似度高于所述第二閾值;
[0027]所述結(jié)果確定模塊,用于在所述第一索引圖像和第二索引圖像對(duì)應(yīng)同一索引視頻,且所述第一索引圖像和所述第二索引圖像的排序與所述第一子視頻和所述第二子視頻的排序相同時(shí),確定所述第一索引圖像和第二索引圖像對(duì)應(yīng)的索引視頻為檢索結(jié)果。
[0028]優(yōu)選的,所述第一子視頻的特征圖像為所述第一子視頻中視頻幀的相同部分,所述第二子視頻的特征圖像為所述第二子視頻中視頻幀的相同部分;
[0029]或者,所述第一子視頻的特征圖像為所述第一子視頻中視頻幀的相同部分和不同部分,所述第二子視頻的特征圖像為所述第二子視頻中視頻幀的相同部分和不同部分;
[0030]或者,所述第一子視頻的特征圖像為所述第一子視頻中的第一幀、最后一幀及處于中間位置的視頻幀,所述第二子視頻的特征圖像為所述第二子視頻中的第一幀、最后一幀及處于中間位置的視頻幀;
[0031]或者,所述第一子視頻的特征圖像為從所述第一子視頻中提取出來的具有相同時(shí)間間隔的至少兩個(gè)視頻幀,所述第二子視頻的特征圖像為從所述第二子視頻中提取出來的具有相同時(shí)間間隔的至少兩個(gè)視頻巾貞;
[0032]或者,所述第一子視頻的特征圖像為對(duì)所述第一子視頻的視頻幀進(jìn)行均化處理后得到的圖像,所述第二子視頻的特征圖像為對(duì)所述第二子視頻的視頻幀進(jìn)行均化處理后得到的圖像。
[0033]優(yōu)選的,所述源視頻獲得模塊,包括:本地視頻獲得子模塊和/或網(wǎng)絡(luò)視頻獲得子模塊,[0034]所述本地視頻獲得子模塊,用于根據(jù)用戶輸入的本地視頻地址,從本地獲得用于檢索的源視頻;
[0035]所述網(wǎng)絡(luò)視頻獲得子模塊,用于根據(jù)用戶輸入的網(wǎng)絡(luò)視頻地址,從網(wǎng)絡(luò)中獲得用于檢索的源視頻。
[0036]優(yōu)選的,還包括:結(jié)果輸出模塊,用于輸出確定為檢索結(jié)果的索引視頻的標(biāo)識(shí)信
肩、O
[0037]優(yōu)選的,還包括:相對(duì)位置確定模塊和相對(duì)位置輸出模塊,
[0038]所述相對(duì)位置確定模塊,用于確定所述源視頻與確定為檢索結(jié)果的索引視頻的相對(duì)位置信息;
[0039]所述相對(duì)位置輸出模塊,用于輸出所述相對(duì)位置信息。
[0040]本發(fā)明實(shí)施例提供的一種視頻檢索方法及系統(tǒng),可以根據(jù)視頻幀的相似度將用于檢索的源視頻拆分為多個(gè)子視頻,并對(duì)每個(gè)子視頻分析得到子視頻的特征圖像,使用子視頻的特征圖像來進(jìn)行視頻檢索。在檢索時(shí),本發(fā)明可以根據(jù)圖像相似度及播放順序是否一致確定所要檢索的視頻。由于進(jìn)行視頻檢索時(shí),需要同時(shí)滿足圖像相似度高和播放順序一致這兩個(gè)條件,因此所確定的檢索結(jié)果的準(zhǔn)確性更高。同時(shí),本發(fā)明可以使用戶在不了解視頻名稱等文字信息時(shí)通過視頻來檢索視頻,擴(kuò)展了視頻檢索方式,降低了視頻檢索的難度。
【專利附圖】
【附圖說明】
[0041]為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0042]圖1為本發(fā)明實(shí)施例提供的一種視頻檢索方法的流程圖;
[0043]圖2為本發(fā)明實(shí)施例提供的另一種視頻檢索方法的流程圖;
[0044]圖3為本發(fā)明實(shí)施例提供的一種視頻檢索系統(tǒng)的結(jié)構(gòu)不意圖;
[0045]圖4為本發(fā)明實(shí)施例提供的另一種視頻檢索系統(tǒng)的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0046]下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0047]如圖1所示,本發(fā)明實(shí)施例提供的一種視頻檢索方法,可以包括:
[0048]S100、獲得用于檢索的源視頻;
[0049]在本發(fā)明的實(shí)施例中,用于檢索的源視頻可以為一個(gè)視頻的片段,如用戶使用手機(jī)對(duì)電視中正在播放的節(jié)目進(jìn)行拍攝得到的視頻;或者,用于檢索的源視頻也可以為圖像互換格式GIF動(dòng)畫??梢岳斫?,GIF動(dòng)畫與視頻一樣,是由具有播放先后順序的多張圖像構(gòu)成。
[0050]如果用于檢索的源視頻是本地視頻,則可以根據(jù)用戶輸入的本地視頻地址,從本地獲得用于檢索的源視頻。如果用于檢索的源視頻是網(wǎng)絡(luò)視頻,則可以根據(jù)用戶輸入的網(wǎng)絡(luò)視頻地址,從網(wǎng)絡(luò)中獲得用于檢索的源視頻。
[0051]S200、根據(jù)所述源視頻的視頻幀的相似度,將所述源視頻至少拆分為第一子視頻和第二子視頻,并將拆分得到的子視頻按照播放順序進(jìn)行排序;
[0052]可以理解的是,在拍攝視頻的過程中,隨著拍攝對(duì)象、拍攝方式的變化,一個(gè)視頻中可以有多個(gè)場(chǎng)景,例如汽車中、客廳中、樓梯間中、辦公室中等多個(gè)場(chǎng)景。在對(duì)某場(chǎng)景進(jìn)行拍攝時(shí),由于拍攝背景、人物變化相對(duì)較小,因此,可以根據(jù)視頻幀的相似度就可以將視頻拆分為對(duì)應(yīng)于場(chǎng)景的多個(gè)子視頻。
[0053]在本發(fā)明的一種可選實(shí)施方式中,場(chǎng)景可以為視頻拍攝的一個(gè)或多個(gè)鏡頭,一個(gè)鏡頭可以是指從前一個(gè)光學(xué)轉(zhuǎn)換到后一個(gè)光學(xué)轉(zhuǎn)換之間的完整片段。在視頻中,一個(gè)或多個(gè)鏡頭可以組成一個(gè)場(chǎng)景,若干個(gè)場(chǎng)景構(gòu)成一部影片。因此,鏡頭也是構(gòu)成視覺語言的基本單位。
[0054]由于視頻具有播放順序,因此可以將拆分得到的多個(gè)子視頻按照播放順序進(jìn)行排列,得到子視頻序列。例如:某視頻播放時(shí),首先出現(xiàn)場(chǎng)景A,然后出現(xiàn)場(chǎng)景B,那么拆分得到的與場(chǎng)景A對(duì)應(yīng)的子視頻排列在場(chǎng)景B對(duì)應(yīng)的子視頻的前方。
[0055]S300、對(duì)所述第一子視頻和第二子視頻進(jìn)行分析,獲得第一子視頻的特征圖像以及第二子視頻的特征圖像;
[0056]特征圖像可以是體現(xiàn)子視頻的各視頻幀的圖像特征,在進(jìn)行視頻檢索時(shí),使用子視頻的特征圖像進(jìn)行檢索,可以有效減少檢索過程中的計(jì)算量。
[0057]可選的,在本發(fā)明的具體示例中,上述S300的實(shí)現(xiàn)方式有多種,下面進(jìn)行詳細(xì)的介紹。當(dāng)然,上述S300的實(shí)現(xiàn)并不局限于下列方式。
[0058]方式一、對(duì)所述第一子視頻和第二子視頻進(jìn)行分析,獲得第一子視頻的特征圖像以及第二子視頻的特征圖像,其中,所述第一子視頻的特征圖像為所述第一子視頻中視頻幀的相同部分,所述第二子視頻的特征圖像為所述第二子視頻中視頻幀的相同部分。
[0059]方式二、對(duì)所述第一子視頻和第二子視頻進(jìn)行分析,獲得第一子視頻的特征圖像以及第二子視頻的特征圖像,其中,所述第一子視頻的特征圖像為第一子視頻中視頻幀的相同部分和不同部分,所述第二子視頻的特征圖像為第二子視頻中視頻幀的相同部分和不同部分。
[0060]在進(jìn)行視頻拍攝時(shí),如果視頻拍攝設(shè)備靜止拍攝,則所拍攝的場(chǎng)景中的背景變化較小或不變,而前景部分則發(fā)生變化。例如:人物訪談視頻中背景圖像沒有變化,由于人的動(dòng)作、表情在一直變化,因此作為前景部分的人物圖像則發(fā)生變化。如果視頻拍攝設(shè)備根據(jù)拍攝主體的移動(dòng)而移動(dòng)拍攝,如人騎馬移動(dòng),視頻拍攝設(shè)備跟隨移動(dòng)拍攝,則所拍攝的場(chǎng)景中的背景變化,而拍攝主體變化較小或不變。因此,可以將視頻幀的相同部分作為子視頻的特征圖像,也可以將相同部分和不同部分均作為子視頻的特征圖像。
[0061]優(yōu)選的,上述方式一和方式二中,可以采用MPEG視頻壓縮技術(shù)中的視頻幀差異確定方式來獲得各視頻幀的相同部分和/或不同部分。
[0062]MPEG視頻壓縮技術(shù)是基于變換的有損壓縮。MPEG視頻壓縮技術(shù)將圖像分區(qū)成小塊,然后進(jìn)行變換編碼,然后進(jìn)行量化,最后進(jìn)行熵編碼。MPEG視頻壓縮技術(shù)采用了的動(dòng)量估計(jì)和動(dòng)量補(bǔ)償技術(shù)。在利用了動(dòng)量補(bǔ)償?shù)膱D像中,被編碼的是經(jīng)過動(dòng)量補(bǔ)償?shù)膮⒖紟c目前圖像的差。MPEG以一秒時(shí)段作為單位,將時(shí)段內(nèi)的每一格圖像做比較。由于一般視頻內(nèi)容都是背景部分變化小、前景部分變化大,MPEG技術(shù)就應(yīng)用這個(gè)特點(diǎn),以一幅圖像為主圖,其余圖像格只記錄參考資料及變化數(shù)據(jù),更有效記錄動(dòng)態(tài)圖像。
[0063]方式三、對(duì)所述第一子視頻和第二子視頻進(jìn)行分析,獲得第一子視頻的特征圖像以及第二子視頻的特征圖像,其中,所述第一子視頻的特征圖像為第一子視頻中的第一幀、最后一幀及處于中間位置的視頻幀,所述第二子視頻的特征圖像為第二子視頻中的第一中貞、最后一巾貞及處于中間位置的視頻中貞。
[0064]方式四、對(duì)所述第一子視頻和第二子視頻進(jìn)行分析,獲得第一子視頻的特征圖像以及第二子視頻的特征圖像,其中,所述第一子視頻的特征圖像為從第一子視頻中提取出來的具有相同時(shí)間間隔的至少兩個(gè)視頻幀,所述第二子視頻的特征圖像為從第二子視頻中提取出來的具有相同時(shí)間間隔的至少兩個(gè)視頻幀。
[0065]方式三和方式四,直接采用子視頻中的某個(gè)或某些視頻幀作為該子視頻的特征圖像,更加簡(jiǎn)單直接。為了提高檢索的準(zhǔn)確性,方式三是選取了位于子視頻的首、尾和中間位置的視頻幀,可以很好的體現(xiàn)子視頻的圖像特征。方式四則是按照播放時(shí)刻每隔一段時(shí)間就選取一個(gè)視頻幀,這樣選取的視頻幀均勻分布在子視頻中,也可以很好的體現(xiàn)子視頻的圖像特征。
[0066]方式五、對(duì)所述第一子視頻和第二子視頻進(jìn)行分析,獲得第一子視頻的特征圖像以及第二子視頻的特征圖像,其中,所述第一子視頻的特征圖像為對(duì)第一子視頻的視頻幀進(jìn)行均化處理后得到的圖像,所述第二子視頻的特征圖像為對(duì)第二子視頻的視頻幀進(jìn)行均化處理后得到的圖像。
[0067]具體的,可以對(duì)視頻幀中相同位置像素的顏色值計(jì)算平均值,得到視頻幀各像素的平均顏色值,由具有平均顏色值的像素組成的圖像即為均化圖像。
[0068]可以理解的是,由于S300對(duì)按照播放順序進(jìn)行排序的第一子視頻和第二子視頻進(jìn)行分析,獲得第一子視頻的特征圖像以及第二子視頻的特征圖像,因此所獲得的特征圖像也可以構(gòu)成具有相同排列順序的特征圖像序列。
[0069]S400、利用所述第一子視頻的特征圖像和所述第二子視頻的特征圖像在預(yù)設(shè)的檢索庫(kù)中進(jìn)行檢索,命中第一索引圖像和第二索引圖像,其中,所述第一子視頻的特征圖像與所述第一索引圖像的相似度高于第二閾值,所述第二子視頻的特征圖像與所述第二索引圖像的相似度高于所述第二閾值;
[0070]其中,預(yù)設(shè)的檢索庫(kù)中可以保存有索引視頻,如電影等?;蛘?,預(yù)設(shè)的檢索庫(kù)中可以保存有所述索引視頻的索引子視頻,所述索引子視頻可以是根據(jù)視頻幀的相似度對(duì)索引視頻進(jìn)行拆分得到。同屬一個(gè)索引視頻的多個(gè)索引子視頻按照播放順序排列。或者,預(yù)設(shè)的檢索庫(kù)中可以保存有索引圖像,所述索引圖像從索引子視頻中分析獲得,與索引子視頻對(duì)應(yīng)。由于屬一個(gè)索引視頻的多個(gè)索引子視頻按照播放順序排列,因此索引圖像也可以構(gòu)成具有相同排列順序的索引圖像序列。
[0071 ] 可選的,在本發(fā)明的實(shí)施例中,上述S400在具體實(shí)現(xiàn)時(shí),可以從特征圖像和索引圖像中提取特征信息,如特征碼等,然后通過對(duì)比特征信息確定二者的相似度。例如,通過感知哈希算法確定兩個(gè)圖像間的相似度。通過感知哈希算法可以得到特征圖像、索引圖像的哈希值,并將該哈希值作為相應(yīng)圖像的特征信息以進(jìn)行相似度計(jì)算。[0072]S500、若所述第一索引圖像和第二索引圖像對(duì)應(yīng)同一索引視頻,且所述第一索引圖像和所述第二索引圖像的排序與所述第一子視頻和所述第二子視頻的排序相同,確定所述第一索引圖像和第二索引圖像對(duì)應(yīng)的索引視頻為檢索結(jié)果。
[0073]否則,可以認(rèn)為沒有檢索到相應(yīng)的結(jié)果??蛇x的,還可以輸出檢索結(jié)果以告知用戶未檢索到相關(guān)視頻。
[0074]本發(fā)明在進(jìn)行視頻檢索時(shí),當(dāng)檢索庫(kù)中有多個(gè)索引圖像與特征圖像相似度高于閾值,且索引圖像的排列順序與子視頻的排列順序一致時(shí),就可以確定上述多個(gè)索引圖像對(duì)應(yīng)的索引視頻為所要檢索的視頻。
[0075]例如:用于檢索的源視頻是網(wǎng)絡(luò)上的一段視頻,本發(fā)明實(shí)施例提供的技術(shù)方案中,獲得該源視頻,劃分后得到第一子視頻和第二子視頻,其中,第一子視頻順序在第二子視頻之前。從第一子視頻中得到第一特征圖像,從第二子視頻中得到第二特征圖像。利用第一特征圖像在檢索庫(kù)中檢索,得到與第一特征圖像相似度高于第二閾值的第一索引圖像;利用第二特征圖像在檢索庫(kù)中檢索,得到與第二特征圖像相似度高于第二閾值的第二索引圖像。若第一索引圖像和第二索引圖像對(duì)應(yīng)同一索引視頻,且第一索引圖像的順序在第二索引圖像之前,因此可以確定源視頻與索引視頻具有較高的相似度,可以將該索引視頻作為檢索結(jié)果。
[0076]優(yōu)選的,在本發(fā)明的一個(gè)實(shí)施例中,還可以輸出該索引視頻的標(biāo)識(shí)信息給用戶;示例性的,索引視頻的標(biāo)識(shí)信息可以包括:索引視頻的名稱、索引視頻的海報(bào)和/或索引視頻的播放地址。當(dāng)然,索引視頻的標(biāo)識(shí)信息還可以包括:索引視頻的作者、索引視頻的簡(jiǎn)介、索引視頻的劇照和/或索引視頻的演職人員信息等。
[0077]本發(fā)明實(shí)施例提供的一種視頻檢索方法,可以根據(jù)視頻幀的相似度將用于檢索的源視頻拆分為多個(gè)子視頻,并對(duì)每個(gè)子視頻分析得到子視頻的特征圖像,使用子視頻的特征圖像來進(jìn)行視頻檢索。在檢索時(shí),本發(fā)明可以根據(jù)圖像相似度及播放順序是否一致確定所要檢索的視頻。由于進(jìn)行視頻檢索時(shí),需要同時(shí)滿足圖像相似度高和播放順序一致這兩個(gè)條件,因此所確定的檢索結(jié)果的準(zhǔn)確性更高。同時(shí),本發(fā)明可以使用戶在不了解視頻名稱等文字信息時(shí)通過視頻來檢索視頻,擴(kuò)展了視頻檢索方式,降低了視頻檢索的難度。
[0078]可選的,如圖2所示,在上述S500之后,本發(fā)明實(shí)施例提供的另一種視頻檢索方法中,還可以包括:
[0079]S600、確定所述源視頻與作為檢索結(jié)果的索引視頻的相對(duì)位置信息;
[0080]S700、輸出所述相對(duì)位置信息。在本發(fā)明的實(shí)施例中,根據(jù)第一索引圖像和第二索引圖像在索引視頻的所有索引圖像中的排列順序,就可以得到上述源視頻出自索引視頻哪一段,也就得到了源視頻與索引視頻的相對(duì)位置信息。
[0081]具體的,S700中相對(duì)位置信息的輸出方式有多種,可選的,可以將上述相對(duì)位置信息顯示在視頻播放界面中,如:在視頻播放進(jìn)度條中設(shè)置相對(duì)位置標(biāo)識(shí)。
[0082]得到并輸出源視頻與索引視頻的相對(duì)位置信息可以幫助用戶快速在索引視頻中進(jìn)行定位,方便用戶觀看。
[0083]與上述方法實(shí)施例相對(duì)應(yīng),本發(fā)明還提供了一種視頻檢索系統(tǒng)。
[0084]如圖3所示,本發(fā)明實(shí)施例提供的一種視頻檢索系統(tǒng),可以包括:源視頻獲得模塊100、源視頻拆分模塊200、子視頻分析模塊300、視頻檢索模塊400和結(jié)果確定模塊500,[0085]源視頻獲得模塊100,用于獲得用于檢索的源視頻;
[0086]在本發(fā)明的實(shí)施例中,用于檢索的源視頻可以為一個(gè)視頻的片段,如用戶使用手機(jī)對(duì)電視中正在播放的節(jié)目進(jìn)行拍攝得到的視頻;或者,用于檢索的源視頻也可以為圖像互換格式GIF動(dòng)畫??梢岳斫猓珿IF動(dòng)畫與視頻一樣,是由具有播放先后順序的多張圖像構(gòu)成。
[0087]可選的,源視頻獲得模塊100,可以包括:本地視頻獲得子模塊和/或網(wǎng)絡(luò)視頻獲得子模塊,
[0088]所述本地視頻獲得子模塊,用于根據(jù)用戶輸入的本地視頻地址,從本地獲得用于檢索的源視頻;
[0089]所述網(wǎng)絡(luò)視頻獲得子模塊,用于根據(jù)用戶輸入的網(wǎng)絡(luò)視頻地址,從網(wǎng)絡(luò)中獲得用于檢索的源視頻。
[0090]源視頻拆分模塊200,用于根據(jù)所述源視頻的視頻幀的相似度,將所述源視頻至少拆分為第一子視頻和第二子視頻,并將拆分得到的子視頻按照播放順序進(jìn)行排序;
[0091]可以理解的是,在拍攝視頻的過程中,隨著拍攝對(duì)象、拍攝方式的變化,一個(gè)視頻中可以有多個(gè)場(chǎng)景,例如汽車中、客廳中、樓梯間中、辦公室中等多個(gè)場(chǎng)景。在對(duì)某場(chǎng)景進(jìn)行拍攝時(shí),由于拍攝背景、人物變化相對(duì)較小,因此,可以根據(jù)視頻幀的相似度就可以將視頻拆分為對(duì)應(yīng)于場(chǎng)景的多個(gè)子視頻。
[0092]子視頻分析模塊300,用于對(duì)所述第一子視頻和第二子視頻進(jìn)行分析,獲得所述第一子視頻的特征圖像以及所述第二子視頻的特征圖像;
[0093]可選的,在本發(fā)明的具體示例中,上述子視頻分析模塊300獲得的特征圖像可以有多種情況,下面進(jìn)行詳細(xì)的介紹。當(dāng)然,視頻分析模塊300獲得的特征圖像并不局限于下列情況。
[0094]情況一、所述第一子視頻的特征圖像為所述第一子視頻中視頻幀的相同部分,所述第二子視頻的特征圖像為所述第二子視頻中視頻幀的相同部分;
[0095]情況二、所述第一子視頻的特征圖像為所述第一子視頻中視頻幀的相同部分和不同部分,所述第二子視頻的特征圖像為所述第二子視頻中視頻幀的相同部分和不同部分;
[0096]情況三、所述第一子視頻的特征圖像為所述第一子視頻中的第一幀、最后一幀及處于中間位置的視頻幀,所述第二子視頻的特征圖像為所述第二子視頻中的第一幀、最后一中貞及處于中間位置的視頻巾貞;
[0097]情況四、所述第一子視頻的特征圖像為從所述第一子視頻中提取出來的具有相同時(shí)間間隔的至少兩個(gè)視頻幀,所述第二子視頻的特征圖像為從所述第二子視頻中提取出來的具有相同時(shí)間間隔的至少兩個(gè)視頻巾貞;
[0098]情況五、所述第一子視頻的特征圖像為對(duì)所述第一子視頻的視頻幀進(jìn)行均化處理后得到的圖像,所述第二子視頻的特征圖像為對(duì)所述第二子視頻的視頻幀進(jìn)行均化處理后得到的圖像。
[0099]視頻檢索模塊400,用于利用所述第一子視頻的特征圖像和所述第二子視頻的特征圖像在預(yù)設(shè)的檢索庫(kù)中進(jìn)行檢索,命中第一索引圖像和第二索引圖像,其中,所述第一子視頻的特征圖像與所述第一索引圖像的相似度高于第二閾值,所述第二子視頻的特征圖像與所述第二索引圖像的相似度高于所述第二閾值;[0100]其中,預(yù)設(shè)的檢索庫(kù)中可以保存有索引視頻,如電影等?;蛘?,預(yù)設(shè)的檢索庫(kù)中可以保存有所述索引視頻的索引子視頻,所述索引子視頻可以是根據(jù)視頻幀的相似度對(duì)索引視頻進(jìn)行拆分得到。同屬一個(gè)索引視頻的多個(gè)索引子視頻按照播放順序排列?;蛘?,預(yù)設(shè)的檢索庫(kù)中可以保存有索引圖像,所述索引圖像從索引子視頻中分析獲得,與索引子視頻對(duì)應(yīng)。由于屬一個(gè)索引視頻的多個(gè)索引子視頻按照播放順序排列,因此索引圖像也可以構(gòu)成具有相同排列順序的索引圖像序列。
[0101]結(jié)果確定模塊500,用于在所述第一索引圖像和第二索引圖像對(duì)應(yīng)同一索引視頻,且所述第一索引圖像和所述第二索引圖像的排序與所述第一子視頻和所述第二子視頻的排序相同時(shí),確定所述第一索引圖像和第二索引圖像對(duì)應(yīng)的索引視頻為檢索結(jié)果。
[0102]優(yōu)選的,在本發(fā)明的一個(gè)實(shí)施例中,還可以包括:結(jié)果輸出模塊,用于輸出確定為檢索結(jié)果的索引視頻的標(biāo)識(shí)信息。示例性的,索引視頻的標(biāo)識(shí)信息可以包括:索引視頻的名稱、索引視頻的海報(bào)和/或索引視頻的播放地址。當(dāng)然,索引視頻的標(biāo)識(shí)信息還可以包括:索引視頻的作者、索引視頻的簡(jiǎn)介、索引視頻的劇照和/或索引視頻的演職人員信息等。
[0103]本發(fā)明實(shí)施例提供的一種視頻檢索系統(tǒng),可以根據(jù)視頻幀的相似度將用于檢索的源視頻拆分為多個(gè)子視頻,并對(duì)每個(gè)子視頻分析得到子視頻的特征圖像,使用子視頻的特征圖像來進(jìn)行視頻檢索。在檢索時(shí),本發(fā)明可以根據(jù)圖像相似度及播放順序是否一致確定所要檢索的視頻。由于進(jìn)行視頻檢索時(shí),需要同時(shí)滿足圖像相似度高和播放順序一致這兩個(gè)條件,因此所確定的檢索結(jié)果的準(zhǔn)確性更高。同時(shí),本發(fā)明可以使用戶在不了解視頻名稱等文字信息時(shí)通過視頻來檢索視頻,擴(kuò)展了視頻檢索方式,降低了視頻檢索的難度。
[0104]可選的,如圖4所示,本發(fā)明實(shí)施例提供的另一種視頻檢索系統(tǒng)中,還可以包括:相對(duì)位置確定模塊600和相對(duì)位置輸出模塊700,
[0105]相對(duì)位置確定模塊600,用于確定所述源視頻與確定為檢索結(jié)果的索引視頻的相對(duì)位置信息;
[0106]相對(duì)位置輸出模塊700,用于輸出所述相對(duì)位置信息。
[0107]得到并輸出源視頻與索引視頻的相對(duì)位置信息可以幫助用戶快速在索引視頻中進(jìn)行定位,方便用戶觀看。
[0108]需要說明的是,在本文中,諸如第一和第二等之類的關(guān)系術(shù)語僅僅用來將一個(gè)實(shí)體或者操作與另一個(gè)實(shí)體或操作區(qū)分開來,而不一定要求或者暗示這些實(shí)體或操作之間存在任何這種實(shí)際的關(guān)系或者順序。而且,術(shù)語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者設(shè)備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者設(shè)備所固有的要素。在沒有更多限制的情況下,由語句“包括一個(gè)……”限定的要素,并不排除在包括所述要素的過程、方法、物品或者設(shè)備中還存在另外的相同要素。
[0109]本說明書中的各個(gè)實(shí)施例均采用相關(guān)的方式描述,各個(gè)實(shí)施例之間相同相似的部分互相參見即可,每個(gè)實(shí)施例重點(diǎn)說明的都是與其他實(shí)施例的不同之處。尤其,對(duì)于系統(tǒng)實(shí)施例而言,由于其基本相似于方法實(shí)施例,所以描述的比較簡(jiǎn)單,相關(guān)之處參見方法實(shí)施例的部分說明即可。
[0110]以上所述僅為本發(fā)明的較佳實(shí)施例而已,并非用于限定本發(fā)明的保護(hù)范圍。凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換、改進(jìn)等,均包含在本發(fā)明的保護(hù)范圍內(nèi)。
【權(quán)利要求】
1.一種視頻檢索方法,其特征在于,包括: 獲得用于檢索的源視頻; 根據(jù)所述源視頻的視頻幀的相似度,將所述源視頻至少拆分為第一子視頻和第二子視頻,并將拆分得到的子視頻按照播放順序進(jìn)行排序; 對(duì)所述第一子視頻和第二子視頻進(jìn)行分析,獲得所述第一子視頻的特征圖像以及所述第二子視頻的特征圖像; 利用所述第一子視頻的特征圖像和所述第二子視頻的特征圖像在預(yù)設(shè)的檢索庫(kù)中進(jìn)行檢索,命中第一索引圖像和第二索引圖像,其中,所述第一子視頻的特征圖像與所述第一索引圖像的相似度高于第二閾值,所述第二子視頻的特征圖像與所述第二索引圖像的相似度高于所述第二閾值; 若所述第一索引圖像和第二索引圖像對(duì)應(yīng)同一索引視頻,且所述第一索引圖像和所述第二索引圖像的排序與所述第一子視頻和所述第二子視頻的排序相同,確定所述第一索引圖像和第二索引圖像對(duì)應(yīng)的索引視頻為檢索結(jié)果。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述第一子視頻的特征圖像為所述第一子視頻中視頻幀的相同部分,所述第二子視頻的特征圖像為所述第二子視頻中視頻幀的相同部分; 或者,所述第一子視頻的特征圖像為所述第一子視頻中視頻幀的相同部分和不同部分,所述第二子視頻的特征圖像為所述第二子視頻中視頻幀的相同部分和不同部分; 或者,所述第一子視頻的特征圖像為所述第一子視頻中的第一幀、最后一幀及處于中間位置的視頻幀,所述第二子視頻的特征圖像為所述第二子視頻中的第一幀、最后一幀及處于中間位置的視頻幀; 或者,所述第一子視頻的特征圖像為從所述第一子視頻中提取出來的具有相同時(shí)間間隔的至少兩個(gè)視頻幀,所述第二子視頻的特征圖像為從所述第二子視頻中提取出來的具有相同時(shí)間間隔的至少兩個(gè)視頻幀; 或者,所述第一子視頻的特征圖像為對(duì)所述第一子視頻的視頻幀進(jìn)行均化處理后得到的圖像,所述第二子視頻的特征圖像為對(duì)所述第二子視頻的視頻幀進(jìn)行均化處理后得到的圖像。
3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述獲得用于檢索的源視頻,包括:根據(jù)用戶輸入的本地視頻地址,從本地獲得用于檢索的源視頻; 或者,所述獲得用于檢索的源視頻,包括:根據(jù)用戶輸入的網(wǎng)絡(luò)視頻地址,從網(wǎng)絡(luò)中獲得用于檢索的源視頻。
4.根據(jù)權(quán)利要求1-3中任一項(xiàng)所述的方法,其特征在于,還包括:輸出確定為檢索結(jié)果的索引視頻的標(biāo)識(shí)信息。
5.根據(jù)權(quán)利要求1至4中任一項(xiàng)所述的方法,其特征在于,還包括: 確定所述源視頻與確定為檢索結(jié)果的索引視頻的相對(duì)位置信息; 輸出所述相對(duì)位置信息。
6.一種視頻檢索系統(tǒng),其特征在于,包括:源視頻獲得模塊、源視頻拆分模塊、子視頻分析模塊、視頻檢索模塊和結(jié)果確定模塊, 所述源視頻獲得模塊,用于獲得用于檢索的源視頻;所述源視頻拆分模塊,用于根據(jù)所述源視頻的視頻幀的相似度,將所述源視頻至少拆分為第一子視頻和第二子視頻,并將拆分得到的子視頻按照播放順序進(jìn)行排序; 所述子視頻分析模塊,用于對(duì)所述第一子視頻和第二子視頻進(jìn)行分析,獲得所述第一子視頻的特征圖像以及所述第二子視頻的特征圖像; 所述視頻檢索模塊,用于利用所述第一子視頻的特征圖像和所述第二子視頻的特征圖像在預(yù)設(shè)的檢索庫(kù)中進(jìn)行檢索,命中第一索引圖像和第二索引圖像,其中,所述第一子視頻的特征圖像與所述第一索引圖像的相似度高于第二閾值,所述第二子視頻的特征圖像與所述第二索引圖像的相似度高于所述第二閾值; 所述結(jié)果確定模塊,用于在所述第一索引圖像和第二索引圖像對(duì)應(yīng)同一索引視頻,且所述第一索引圖像和所述第二索引圖像的排序與所述第一子視頻和所述第二子視頻的排序相同時(shí),確定所述第一索引圖像和第二索引圖像對(duì)應(yīng)的索引視頻為檢索結(jié)果。
7.根據(jù)權(quán)利要求6所述的系統(tǒng),其特征在于,所述第一子視頻的特征圖像為所述第一子視頻中視頻幀的相同部分,所述第二子視頻的特征圖像為所述第二子視頻中視頻幀的相同部分; 或者,所述第一子視頻的特征圖像為所述第一子視頻中視頻幀的相同部分和不同部分,所述第二子視頻的特征圖像為所述第二子視頻中視頻幀的相同部分和不同部分; 或者,所述第一子視頻的特征圖像為所述第一子視頻中的第一幀、最后一幀及處于中間位置的視頻幀,所述第二子視頻的特征圖像為所述第二子視頻中的第一幀、最后一幀及處于中間位置的視頻幀; 或者,所述第一子視頻的特征圖像為從所述第一子視頻中提取出來的具有相同時(shí)間間隔的至少兩個(gè)視頻幀,所述第二子視頻的特征圖像為從所述第二子視頻中提取出來的具有相同時(shí)間間隔的至少兩個(gè)視頻幀; 或者,所述第一子視頻的特征圖像為對(duì)所述第一子視頻的視頻幀進(jìn)行均化處理后得到的圖像,所述第二子視頻的特征圖像為對(duì)所述第二子視頻的視頻幀進(jìn)行均化處理后得到的圖像。
8.根據(jù)權(quán)利要求6或7所述的系統(tǒng),其特征在于,所述源視頻獲得模塊,包括:本地視頻獲得子模塊和/或網(wǎng)絡(luò)視頻獲得子模塊, 所述本地視頻獲得子模塊,用于根據(jù)用戶輸入的本地視頻地址,從本地獲得用于檢索的源視頻; 所述網(wǎng)絡(luò)視頻獲得子模塊,用于根據(jù)用戶輸入的網(wǎng)絡(luò)視頻地址,從網(wǎng)絡(luò)中獲得用于檢索的源視頻。
9.根據(jù)權(quán)利要求6-8中任一項(xiàng)所述的系統(tǒng),其特征在于,還包括:結(jié)果輸出模塊,用于輸出確定為檢索結(jié)果的索引視頻的標(biāo)識(shí)信息。
10.根據(jù)權(quán)利要求6至9中任一項(xiàng)所述的系統(tǒng),其特征在于,還包括:相對(duì)位置確定模塊和相對(duì)位置輸出模塊, 所述相對(duì)位置確定模塊,用于確定所述源視頻與確定為檢索結(jié)果的索引視頻的相對(duì)位置信息; 所述相對(duì)位置輸出模塊,用于輸出所述相對(duì)位置信息。
【文檔編號(hào)】G06F17/30GK103984778SQ201410250095
【公開日】2014年8月13日 申請(qǐng)日期:2014年6月6日 優(yōu)先權(quán)日:2014年6月6日
【發(fā)明者】張寶良, 張?jiān)獞c, 李丁盼 申請(qǐng)人:北京金山網(wǎng)絡(luò)科技有限公司