專(zhuān)利名稱(chēng)::基于鄰近i幀dc圖像相似度的壓縮域關(guān)鍵幀提取方法
技術(shù)領(lǐng)域:
:本發(fā)明屬于網(wǎng)絡(luò)視頻內(nèi)容分析
技術(shù)領(lǐng)域:
,涉及一種基于鄰近I幀DC圖像相似度的壓縮域關(guān)鍵幀提取方法。
背景技術(shù):
:隨著網(wǎng)絡(luò)多媒體技術(shù)的深入發(fā)展,網(wǎng)絡(luò)視頻已逐漸成為信息表達(dá)的一種主流方式。在網(wǎng)絡(luò)視頻內(nèi)容分析中,由于視頻本身數(shù)據(jù)量較大,若對(duì)全部的視頻幀進(jìn)行分析需要花費(fèi)大量的時(shí)間和空間,無(wú)法滿(mǎn)足對(duì)實(shí)時(shí)性有一定要求的場(chǎng)合。由于視頻內(nèi)容在時(shí)空上具有一定的相關(guān)性,而關(guān)鍵幀通常能反應(yīng)出視頻的主要內(nèi)容。因此,通過(guò)提取關(guān)鍵幀并進(jìn)行分析,可以有效減少視頻處理的數(shù)據(jù)量,降低計(jì)算的時(shí)空復(fù)雜度,提高網(wǎng)絡(luò)視頻內(nèi)容分析的效率。目前,對(duì)于關(guān)鍵幀的提取方法,國(guó)內(nèi)外學(xué)者做了大量的研究工作,根據(jù)所處理的視頻數(shù)據(jù)對(duì)象,可以將這些方法分為像素域的關(guān)鍵幀提取和壓縮域的關(guān)鍵幀提取。針對(duì)像素域上的關(guān)鍵幀提取,可以通過(guò)對(duì)幀內(nèi)像素進(jìn)行光流分析來(lái)計(jì)算運(yùn)動(dòng)量,并選取單個(gè)鏡頭中運(yùn)動(dòng)量局部最小值處的幀作為關(guān)鍵幀。也可以通過(guò)利用幀的顏色直方圖,邊界方向直方圖以及小波統(tǒng)計(jì)等特征來(lái)度量出幀與幀之間的差異,并選取兩個(gè)連續(xù)差異較大幀的中間幀作為關(guān)鍵幀。還可以通過(guò)對(duì)幀間顏色直方圖的差異應(yīng)用低通濾波器來(lái)突出編輯持續(xù)效果,以此進(jìn)行鏡頭分割,并在此基礎(chǔ)上應(yīng)用自適應(yīng)時(shí)域采樣方法提取關(guān)鍵幀。上述方法都是在視頻完全解壓縮后進(jìn)行的,所以計(jì)算量比較大,效率較低難以滿(mǎn)足實(shí)時(shí)性的要求。壓縮域視頻處理技術(shù)是直接面向數(shù)據(jù)量較小的壓縮視頻數(shù)據(jù),在不解壓或者少解壓的情況下對(duì)視頻進(jìn)行處理,可以大大提高視頻的處理速度,因此壓縮域上的關(guān)鍵幀提取方法研究也引起的廣泛關(guān)注。有一種方法利用視頻幀所包含各類(lèi)型宏塊的數(shù)量差異衡量幀與幀之間的差距,并應(yīng)用高斯濾波和離散曲線進(jìn)化方法進(jìn)行關(guān)鍵幀的提取。另一種方法給出了利用壓縮域運(yùn)動(dòng)向量的感知運(yùn)動(dòng)能量來(lái)選擇關(guān)鍵幀的方法,并在基于MPEG-7的視頻文件中取得了較好的效果。還有一種是針對(duì)在MPEG壓縮視頻域中基于DC系數(shù)圖像直方圖和運(yùn)動(dòng)矢量的關(guān)鍵幀提取方法,主要應(yīng)用于視頻檢索中視頻摘要的提取。這些方法的共同點(diǎn)是利用視頻壓縮域中的某些特征(如運(yùn)動(dòng)矢量MV、宏塊類(lèi)型等)來(lái)確定鏡頭邊界,實(shí)現(xiàn)鏡頭分割,并從分割出的鏡頭中提取出關(guān)鍵幀,且所做的實(shí)驗(yàn)多數(shù)是針對(duì)MPEG系列視頻壓縮標(biāo)準(zhǔn)的。而目前開(kāi)放的視頻壓縮標(biāo)準(zhǔn)比較多,上述方法在應(yīng)用于其它視頻壓縮標(biāo)準(zhǔn)如H.261、H.263時(shí)處理速度的效果不明顯。
發(fā)明內(nèi)容本發(fā)明的目的是提供一種基于鄰近I幀DC圖像相似度的壓縮域關(guān)鍵幀提取方法,可以快速準(zhǔn)確地完成網(wǎng)絡(luò)視頻關(guān)鍵幀提取過(guò)程,解決了現(xiàn)有關(guān)鍵幀提取方法存在的只能處理單一視頻標(biāo)準(zhǔn)的缺點(diǎn),簡(jiǎn)化了視頻關(guān)鍵幀提取過(guò)程。本發(fā)明所采用的技術(shù)方案是,一種基于鄰近I幀DC圖像相似度的壓縮域關(guān)鍵幀提取方法,該方法按照以下步驟實(shí)施步驟1:假設(shè)VS為待處理的原始視頻流,DC'為VS中第/個(gè)I幀所對(duì)應(yīng)的DC圖像,/=7,2,i",w為I幀總數(shù),則相鄰I幀DC圖像的相<formula>formulaseeoriginaldocumentpage6</formula>c分別為DC圖像的寬度和高度;為所有VS中所有相似度《構(gòu)成的集合,即S&「fA,^4,A尺為聚類(lèi)總個(gè)數(shù),及zx:為I幀相關(guān)度集合,且凡e及ix:,其中A為VS中第/個(gè)I幀的相關(guān)度,S^為關(guān)鍵幀集合,且初始時(shí)^=小,利用公式(1)計(jì)算相鄰DC圖之間的距離《,得到序列&w步驟2:設(shè)置聚類(lèi)總個(gè)數(shù)尺的值,《>0,并利用Kmeans方法對(duì)步驟1得到的&w進(jìn)行聚類(lèi),步驟3:按照公式(2)^y,jp,^,(2)2z/p#《,dyeC7咖p,(i乂+!eC7oss《計(jì)算VS中每個(gè)I幀的相關(guān)度,其中p,2,…,尺,.7'2…'&=7;所有VS中每個(gè)I幀的相關(guān)度iV,構(gòu)成幀相關(guān)度集合/z)c;步驟4:對(duì)于幀相關(guān)度集合及z)c,若""e滿(mǎn)足條件及i=2,ie=2(3)其中s,e=1,2,…,"一l;"e且""e;則將s,6e并入集合S^中,即S^-S^u",^〉;步驟5:重復(fù)步驟4,直到找出所有滿(mǎn)足條件的S、f、e為止,S^即為最終所提取的關(guān)鍵幀集合。本發(fā)明的方法,該方法在壓縮域上直接進(jìn)行關(guān)鍵幀提取,改變了先鏡頭分割后關(guān)鍵幀提取的思路,能夠提高視頻內(nèi)容分析的速度,可以快速完成網(wǎng)絡(luò)視頻關(guān)鍵幀提取過(guò)程,并保證結(jié)果的有效性和準(zhǔn)確性;本發(fā)明可處理多種類(lèi)型視頻文件的關(guān)鍵幀提取,能夠應(yīng)對(duì)視頻文件種類(lèi)多、壓縮格式多等情況。圖1是本發(fā)明方法實(shí)施例在5個(gè)不同的視頻中,根據(jù)不同的聚類(lèi)個(gè)數(shù)K值提取出的關(guān)鍵幀數(shù)量曲線圖2是本發(fā)明方法實(shí)施例針對(duì)圖1中不同的5個(gè)視頻和不同的聚類(lèi)個(gè)數(shù)值的情況下關(guān)鍵幀提取過(guò)程所需的時(shí)間開(kāi)銷(xiāo)曲線圖3是本發(fā)明方法實(shí)施例在聚類(lèi)個(gè)數(shù)值固定的情況下,對(duì)一段視頻在不同的播放時(shí)間內(nèi)所提取的關(guān)鍵幀數(shù)量曲線圖4是本發(fā)明方法實(shí)施例針對(duì)圖3中視頻各播放時(shí)間內(nèi)關(guān)鍵幀提取過(guò)程所對(duì)應(yīng)的時(shí)間開(kāi)銷(xiāo)曲線圖。具體實(shí)施例方式下面結(jié)合附圖和具體實(shí)施方式對(duì)本發(fā)明進(jìn)行詳細(xì)說(shuō)明。本發(fā)明方法考慮到存在多個(gè)視頻壓縮標(biāo)準(zhǔn)和網(wǎng)絡(luò)視頻內(nèi)容審計(jì)的實(shí)時(shí)性等因素,利用壓縮域內(nèi)I幀的DC圖像特征,給出了一種在壓縮域內(nèi)快速提取關(guān)鍵幀的方法。假設(shè)VS為待處理的原始視頻流,DC'為VS中第/個(gè)I幀所對(duì)應(yīng)的DC圖像,/=門(mén)2,3,...,"。"為I幀總數(shù),則相鄰I幀DC圖像的相似度4定義為A=^^/+"=tpC/-DC/"/(1)/=0公式(1)中/=/,2,^..,"-7;丄-『^X/^c,『D。/^c分別為DC圖像的寬度和高度。為了方便描述,在這里做如下的約定&^為VS中所有相似度4構(gòu)成的集合,即&^^""4,U。《為聚類(lèi)總個(gè)數(shù)。及zx:為I幀相關(guān)度集合,且凡E/^c,i,為VS中第z'個(gè)I幀的相關(guān)度。幀相關(guān)度是指與某個(gè)I幀相關(guān)聯(lián)的類(lèi)的個(gè)數(shù)。s^為關(guān)鍵幀集合,且初始時(shí)=(|)。本發(fā)明的基于鄰近I幀DC圖像相似度的壓縮域關(guān)鍵幀提取方法(簡(jiǎn)稱(chēng)KSIDCIS)的具體實(shí)施步驟如下步驟l:利用公式&W0、y+7J計(jì)算相鄰DC圖之間的距離4,得到序列U;步驟2:設(shè)置聚類(lèi)總個(gè)數(shù)為《(尺>0),并利用Kmeans方法對(duì)&w進(jìn)行聚類(lèi),得到C7osW,C7ow2,C/fl^/,…,C7ow/G/=h2,…,&步驟3:按照公式(2)<formula>formulaseeoriginaldocumentpage8</formula>計(jì)算VS中每個(gè)I幀的相關(guān)度J川,其中戶(hù)『h2,…,尺,'2...,^=7;所有VS中每個(gè)I幀的相關(guān)度及,+,構(gòu)成幀相關(guān)度集合步驟4:對(duì)于幀相關(guān)度集合及zx:,若s,6e滿(mǎn)足條件<formula>formulaseeoriginaldocumentpage8</formula>其中s,e-l,2,…,"-l;s《e且s^Z《e;則將"6e并入集合S^中,即^=^葉#}。步驟5:重復(fù)步驟4,直到找出所有滿(mǎn)足條件的s、f、e為止,且5W為最終所提取的關(guān)鍵幀集合。即本方法先利用公式(1)求出兩個(gè)相鄰I幀DC圖像之間的相似度4,然后執(zhí)行步驟2,此時(shí)Kmeans聚類(lèi)方法可將相似度集合5^,中的所有元素《聚集成不同的類(lèi),以確定相鄰I幀是否相似,若連續(xù)的多個(gè)4被分在同一個(gè)類(lèi)中,則說(shuō)明這些4值大小接近,其所對(duì)應(yīng)的多個(gè)連續(xù)I幀相似性也較強(qiáng),此時(shí)可選取這些I幀中的任意一幀作為關(guān)鍵幀來(lái)代表這些連續(xù)I幀內(nèi)容;若這些《被分散在多個(gè)不同的類(lèi)中,則說(shuō)明這些4值大小變化劇烈,其所對(duì)應(yīng)的多個(gè)連續(xù)I幀的內(nèi)容差異較大(如發(fā)生鏡頭突變切換等),此時(shí)這些《值被劃分成多段,應(yīng)選擇分段點(diǎn)《所對(duì)應(yīng)的/幀作為關(guān)鍵幀。例如,對(duì)于一段連續(xù)的4值^4,若4力,4,44分別屬于不同的類(lèi),則分段點(diǎn)為^,此時(shí)應(yīng)將第5號(hào)I幀作為關(guān)鍵幀。步驟3、步驟4和步驟5給出了選取關(guān)鍵幀的過(guò)程。其中,若《,《+7屬于同一類(lèi),則第y+7個(gè)I幀的相關(guān)度《+尸/,否則,《+尸2,此時(shí)說(shuō)明在第y+7個(gè)I幀處,幀內(nèi)容發(fā)生了較大變化;且很容易得出A和A分別為1。S^為所提取的關(guān)鍵幀編號(hào)組成的集合。從上述過(guò)程可以看出,本發(fā)明KSIDCIS方法的空間開(kāi)銷(xiāo)主要是存儲(chǔ)DC圖像的空間開(kāi)銷(xiāo)S,但在計(jì)算出相似度的集合6"^后,后續(xù)步驟都沒(méi)有涉及到S,則此時(shí)空間開(kāi)銷(xiāo)S可以被釋放,可見(jiàn),盡管S值較大,但由于它在執(zhí)行過(guò)程中存在時(shí)間較短,且僅被使用一次,所以S對(duì)空間開(kāi)銷(xiāo)的影響是短暫的,因此本發(fā)明KSIDCIS方法的空間性能完全滿(mǎn)足實(shí)際應(yīng)用要求。此外,本方法也具有較高的時(shí)間效率,從以下兩方面可以看出(1)本發(fā)明KSIDCIS方法充分利用相鄰I幀相似度較大的特點(diǎn),只計(jì)算相鄰I幀DC圖像的相似度,而不是計(jì)算任意兩個(gè)DC圖像相似度,將計(jì)算次數(shù)從1S^N次減少到N-1次,避免大量不必要的計(jì)算,節(jié)約了時(shí)間開(kāi)銷(xiāo)。(2)通過(guò)結(jié)合聚類(lèi)方法Kmeans收斂較快的特性,在選取適當(dāng)/i:值的情況下,可對(duì)相似度集合S^在較短時(shí)間內(nèi)完成聚類(lèi)。由于集合&w中的各元素為一維向量,各聚類(lèi)中心點(diǎn)的維數(shù)也為一維向量,這使得聚類(lèi)方法計(jì)算量大大降低,提高了聚類(lèi)處理效率。表l和圖1、2、3、4給出了本發(fā)明的實(shí)驗(yàn)結(jié)果,實(shí)驗(yàn)中的視頻數(shù)據(jù)均來(lái)自于YouTube網(wǎng)站。表1中給出了6個(gè)具體實(shí)施例的視頻文件的編號(hào)、視頻文件的大小及播放時(shí)間、各視頻中所含I幀的總數(shù)量以及視頻的類(lèi)別。表2給出了視頻文件的原始URL地址。表1<table>tableseeoriginaldocumentpage10</column></row><table>表2視頻文件URL列表<table>tableseeoriginaldocumentpage10</column></row><table>圖1是在5個(gè)不同的視頻中,根據(jù)不同的聚類(lèi)個(gè)數(shù)《值提取出的關(guān)鍵幀數(shù)量曲線圖,圖中橫坐標(biāo)表示視頻的編號(hào),縱坐標(biāo)是關(guān)鍵幀數(shù)量;圖2是本發(fā)明方法實(shí)施例針對(duì)圖1中不同的5個(gè)視頻和不同的聚類(lèi)個(gè)數(shù)值的情況下關(guān)鍵幀提取過(guò)程所用的時(shí)間開(kāi)銷(xiāo)曲線圖,圖中橫坐標(biāo)表示視頻的編號(hào),縱坐標(biāo)表示提取關(guān)鍵幀所花費(fèi)的時(shí)間;圖中,U表示視頻中I幀的總數(shù),《表示聚類(lèi)的個(gè)數(shù),時(shí)間坐標(biāo)軸的單位是10_4秒。由圖1、2可以看出,選取合適的聚類(lèi)個(gè)數(shù)K值,能夠在壓縮域上提取出合適的可以反應(yīng)視頻主要內(nèi)容的關(guān)鍵幀數(shù)量。圖3是在特定的聚類(lèi)個(gè)數(shù)值下,一段特定的視頻在不同的播放時(shí)間內(nèi)關(guān)鍵幀數(shù)量曲線圖,圖中橫坐標(biāo)表示一段特定視頻的播放時(shí)間(單位為分鐘),縱坐標(biāo)表示關(guān)鍵幀的數(shù)量;圖4給出了各播放時(shí)間內(nèi)關(guān)鍵幀提取過(guò)程所花費(fèi)的時(shí)間,是針對(duì)圖3中提取出的不同數(shù)量的關(guān)鍵幀所對(duì)應(yīng)的時(shí)間開(kāi)銷(xiāo)曲線圖,圖中橫坐標(biāo)表示關(guān)鍵幀數(shù)量,縱坐標(biāo)表示提取相應(yīng)的關(guān)鍵幀所花費(fèi)的時(shí)間,U表示視頻中I幀的總數(shù),尺表示聚類(lèi)的個(gè)數(shù),時(shí)間坐標(biāo)軸的單位是10"秒。本發(fā)明對(duì)播放時(shí)間較長(zhǎng)的視頻文件V6,完成了在聚類(lèi)《值為固定值時(shí),取不同播放時(shí)間(間隔為2分鐘)的情況下進(jìn)行關(guān)鍵幀提取的實(shí)驗(yàn)。由圖3、4可以看出,在特定的聚類(lèi)個(gè)數(shù)《值固定的情況下,對(duì)于同一個(gè)視頻,雖然隨著視頻播放時(shí)間的增加,關(guān)鍵幀的數(shù)目會(huì)增加,提取關(guān)鍵幀的時(shí)間開(kāi)銷(xiāo)會(huì)隨著視頻文件播放時(shí)間長(zhǎng)度的增加呈總體上升趨勢(shì),但其時(shí)間開(kāi)銷(xiāo)保持在毫秒級(jí),可以滿(mǎn)足實(shí)時(shí)性要求。本發(fā)明方法考慮到存在多個(gè)視頻壓縮標(biāo)準(zhǔn)和網(wǎng)絡(luò)視頻內(nèi)容審計(jì)的實(shí)時(shí)性等因素,利用壓縮域內(nèi)I幀的DC圖像特征,給出了一種在壓縮域內(nèi)快速提取關(guān)鍵幀的方法,改變了先鏡頭分割后關(guān)鍵幀提取的思路,在保證準(zhǔn)確性的條件下,簡(jiǎn)化了視頻關(guān)鍵幀提取過(guò)程,能夠提高視頻內(nèi)容分析的速度,可以快速完成網(wǎng)絡(luò)視頻關(guān)鍵幀提取過(guò)程,并保證結(jié)果的有效性和準(zhǔn)確性;同時(shí),本發(fā)明可處理多種類(lèi)型視頻文件的關(guān)鍵幀提取,面向各種視頻壓縮標(biāo)準(zhǔn)(如MPEG-l/2/4、H.261、H.263等)的視頻文件,解決了現(xiàn)有關(guān)鍵幀提取方法存在的只能處理單一視頻標(biāo)準(zhǔn)的缺點(diǎn),能夠應(yīng)對(duì)視頻文件種類(lèi)多、壓縮格式多等情況。權(quán)利要求1、一種基于鄰近I幀DC圖像相似度的壓縮域關(guān)鍵幀提取方法,其特征在于,該方法按照以下步驟實(shí)施步驟1假設(shè)VS為待處理的原始視頻流,DCi為VS中第i個(gè)I幀所對(duì)應(yīng)的DC圖像,i=1,2,3,...,n,n為I幀總數(shù),則相鄰I幀DC圖像的相似度dj定義為<mathsid="math0001"num="0001"><math><![CDATA[<mrow><msub><mi>d</mi><mi>j</mi></msub><mo>=</mo><mi>dist</mi><mrow><mo>(</mo><mi>j</mi><mo>,</mo><mi>j</mi><mo>+</mo><mn>1</mn><mo>)</mo></mrow><mo>=</mo><munderover><mi>Σ</mi><mrow><mi>l</mi><mo>=</mo><mn>0</mn></mrow><mi>L</mi></munderover><msup><mrow><mo>(</mo><msubsup><mi>DC</mi><mi>l</mi><mi>j</mi></msubsup><mo>-</mo><msubsup><mi>DC</mi><mi>l</mi><mrow><mi>j</mi><mo>+</mo><mn>1</mn></mrow></msubsup><mo>)</mo></mrow><mn>2</mn></msup><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></mrow>]]></math></maths>公式(1)中j=1,2,3,...,n-1;L=WDC×HDC,WDC,HDC分別為DC圖像的寬度和高度;Sdist為所有VS中所有相似度dj構(gòu)成的集合,即Sdist={d1,d2,…,di,…,dn-1},K為聚類(lèi)總個(gè)數(shù),RDC為I幀相關(guān)度集合,且Ri∈RDC,其中Ri為VS中第i個(gè)I幀的相關(guān)度,SRF為關(guān)鍵幀集合,且初始時(shí)SRF=φ,利用公式(1)計(jì)算相鄰DC圖之間的距離dj,得到序列Sdist;步驟2設(shè)置聚類(lèi)總個(gè)數(shù)K的值,K>0,并利用Kmeans方法對(duì)步驟1得到的Sdist進(jìn)行聚類(lèi),得到Class1,Class2,Classi,...,ClassK,i=1,2,...,K;步驟3按照公式(2)<mathsid="math0002"num="0002"><math><![CDATA[<mrow><msub><mi>R</mi><mrow><mi>j</mi><mo>+</mo><mn>1</mn></mrow></msub><mo>=</mo><mfencedopen='{'close=''><mtable><mtr><mtd><mn>1</mn></mtd><mtd><mi>if</mi></mtd><mtd><mi>p</mi><mo>=</mo><mi>q</mi><mo>,</mo></mtd><mtd><msub><mi>d</mi><mi>j</mi></msub><mo>∈</mo><msub><mi>Class</mi><mi>p</mi></msub><mo>,</mo></mtd><mtd><msub><mi>d</mi><mrow><mi>j</mi><mo>+</mo><mn>1</mn></mrow></msub><mo>∈</mo><msub><mi>Class</mi><mi>q</mi></msub></mtd></mtr><mtr><mtd><mn>2</mn></mtd><mtd><mi>if</mi></mtd><mtd><mi>p</mi><mo>≠</mo><mi>q</mi><mo>,</mo></mtd><mtd><msub><mi>d</mi><mi>j</mi></msub><mo>∈</mo><msub><mi>Class</mi><mi>p</mi></msub><mo>,</mo></mtd><mtd><msub><mi>d</mi><mrow><mi>j</mi><mo>+</mo><mn>1</mn></mrow></msub><mo>∈</mo><msub><mi>Class</mi><mi>q</mi></msub></mtd></mtr></mtable></mfenced><mo>,</mo><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></mrow>]]></math></maths>計(jì)算VS中每個(gè)I幀的相關(guān)度Rj+1,其中p,q=1,2,...,K;j=0,1,2...,n-1;R1=1,Rn=1;所有VS中每個(gè)I幀的相關(guān)度Rj+1構(gòu)成幀相關(guān)度集合RDC;步驟4對(duì)于幀相關(guān)度集合RDC,若s,t,e滿(mǎn)足條件<mathsid="math0003"num="0003"><math><![CDATA[<mrow><mfencedopen='{'close=''><mtable><mtr><mtd><msub><mi>R</mi><mi>s</mi></msub><mo>=</mo><mn>2</mn><mo>,</mo><msub><mi>R</mi><mi>e</mi></msub><mo>=</mo><mn>2</mn></mtd></mtr><mtr><mtd><msub><mi>R</mi><mrow><mi>s</mi><mo>+</mo><mn>1</mn></mrow></msub><mo>=</mo><msub><mi>R</mi><mrow><mi>s</mi><mo>+</mo><mn>2</mn></mrow></msub><mo>=</mo><mo>·</mo><mo>·</mo><mo>·</mo><mo>=</mo><msub><mi>R</mi><mi>t</mi></msub><mo>=</mo><mo>·</mo><mo>·</mo><mo>·</mo><msub><mi>R</mi><mrow><mi>e</mi><mo>-</mo><mn>2</mn></mrow></msub><mo>=</mo><msub><mi>R</mi><mrow><mi>e</mi><mo>-</mo><mn>1</mn></mrow></msub><mo>=</mo><mn>1</mn></mtd></mtr></mtable></mfenced><mo>,</mo><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>3</mn><mo>)</mo></mrow></mrow>]]></math></maths>其中s,e=1,2,…,n-1;s≤e且s≤t≤e;則將s,t,e并入集合SRF中,即SRF=SRF∪{s,t,e};步驟5重復(fù)步驟4,直到找出所有滿(mǎn)足條件的s、t、e為止,SRF即為最終所提取的關(guān)鍵幀集合。全文摘要本發(fā)明公開(kāi)了一種基于鄰近I幀DC圖像相似度的壓縮域關(guān)鍵幀提取方法,該方法首先計(jì)算原始視頻中鄰近I幀DC圖像的相似度,形成相似度集合,其次利用聚類(lèi)算法Kmeans對(duì)鄰近I幀的DC圖像相似度集合進(jìn)行聚類(lèi),最后根據(jù)聚類(lèi)結(jié)果中各I幀的相關(guān)度值進(jìn)行關(guān)鍵幀提取。本發(fā)明充分利用相鄰I幀相似度較大的特點(diǎn),來(lái)減少計(jì)算次數(shù)以避免大量不必要的計(jì)算和應(yīng)用聚類(lèi)方法Kmeans對(duì)相似度集合S<sub>dist</sub>在較短時(shí)間內(nèi)完成聚類(lèi),改變了先鏡頭分割后提取關(guān)鍵幀的思路,簡(jiǎn)化了視頻關(guān)鍵幀提取過(guò)程,并保證了結(jié)果的有效性;而且,本發(fā)明可處理多種類(lèi)型視頻文件的關(guān)鍵幀提取。文檔編號(hào)G06F17/30GK101577824SQ20091002294公開(kāi)日2009年11月11日申請(qǐng)日期2009年6月12日優(yōu)先權(quán)日2009年6月12日發(fā)明者孫欽東,倩王,敏胡,郭曉軍申請(qǐng)人:西安理工大學(xué)