專利名稱:一種鏡頭邊界檢測方法
技術(shù)領(lǐng)域:
本發(fā)明屬于視頻檢索領(lǐng)域,具體涉及一種鏡頭邊界檢測方法。
背景技術(shù):
在視頻檢索的過程中,鏡頭邊界檢測是整個系統(tǒng)的第一步,鏡頭邊界檢測的準(zhǔn)確度和效率的高低,關(guān)系到整個視頻檢索系統(tǒng)的成敗,是視頻檢索系統(tǒng)中至關(guān)重要的一步。鏡頭邊界檢測的任務(wù)就是通過比較視頻序列幀的差異來尋找鏡頭邊界,確定鏡頭變化類型和位置。目前,該領(lǐng)域內(nèi)解決鏡頭邊界檢測的方法主要是基于閾值和基于機(jī)器學(xué)習(xí)的。基于閾值的方法由于閾值選取的好壞對檢測效果有較大的影響;而且不同的視頻閾值差異很大。這些都限制了閾值方法更進(jìn)一步提高效果。近年來,基于機(jī)器學(xué)習(xí)的鏡頭邊界檢測方法得到了深入研究。文獻(xiàn)《Temporal videosegmentation using unsupervisedclustering and semantic object tracking》(作者Bilge Gunsel, A. Mufit Ferman,A. Murat Tekalp, J. Electron.1maging 7 (3), 1998, 592-604)中,提取顏色直方圖特征并計(jì)算相鄰幀的幀間差異,接著采用K均值聚類算法對視頻的序列幀進(jìn)行分類。文獻(xiàn)《Supervisedclassification for video shot segmentation [A]》(作者Y Qi, HauptmannAT Liu, IEEE ICME03[C]。Baltimore, MD, USA, 2003, vol. 2,689-692)中,采用 k 最近鄰域分類、Naive Bayes可能性分類法和支持向量機(jī)將視頻序列幀分成切變幀和非切變幀;對非切變幀,又采用小波光滑去噪的方法來檢測漸變幀,從而完成鏡頭邊界的分割。文獻(xiàn)((Algorithm for Shot Boundary Detection basedon Support Vector Machine inCompressed Domain》(作者Jian-Rong Caoand An-Ni Cai,在 Tien Tzu Hsueh Pao/ActaElectronica Sinica,36(l) =203-208,2008)中提出,利用滑動窗口的方法將提取到的壓縮域特征組成一個多維的特征向量,對SVM進(jìn)行訓(xùn)練,使用訓(xùn)練好的SVM模型對視頻幀進(jìn)行分類,從而得到鏡頭的邊界。但是,支持向量機(jī)參數(shù)的選取至今仍然沒有一個統(tǒng)一的標(biāo)準(zhǔn),參數(shù)選取大多依靠經(jīng)驗(yàn)采取試湊的方法,這樣不僅費(fèi)時而且很難得到滿意的結(jié)果;此外,對于鏡頭邊界檢測中對于長漸變鏡頭的檢測一直明顯存在的漏檢問題也沒有很好的方法。。
發(fā)明內(nèi)容
本發(fā)明的目的在于解決上述現(xiàn)有技術(shù)中存在的難題,提供一種鏡頭邊界檢測方法,使用禁忌搜索算法對支持向量機(jī)的參數(shù)進(jìn)行優(yōu)化,綜合使用上下文特征向量和基于禁忌搜索優(yōu)化的支持向量機(jī)分類模型,降低參數(shù)選擇的盲目性和不準(zhǔn)確,而且對于檢測各類鏡頭突變和漸變十分穩(wěn)定和準(zhǔn)確。本發(fā)明是通過以下技術(shù)方案實(shí)現(xiàn)的—種鏡頭邊界檢測方法,基于上下文特征向量和禁忌搜索算法優(yōu)化支持向量機(jī)實(shí)現(xiàn)鏡頭邊界檢測。
所述方法包括以下步驟(I),提取視頻數(shù)據(jù)的底層特征提取全局顏色直方圖和小波紋理特征;(2),計(jì)算幾種特定間隔下視頻序列幀的幀間差,將其組成幾種滑動窗口下的上下文特征向量;(3),使用禁忌搜索算法優(yōu)化支持向量機(jī)分類模型;(4),利用得到的近似最優(yōu)參數(shù)訓(xùn)練得到最優(yōu)分類模型,并以此為基礎(chǔ)對視頻序列幀進(jìn)行分類,最終完成鏡頭分割;所述近似最優(yōu)參數(shù)包括懲罰因子C和核函數(shù)參數(shù)Y。所述步驟(I)中的提取全局顏色直方圖是這樣實(shí)現(xiàn)的通過計(jì)算每個顏色區(qū)間的像素值個數(shù)來統(tǒng)計(jì)得到;對于原始的視頻序列幀,需要提取并計(jì)算每一個通道下的顏色直方圖區(qū)間值,采用X 2距離來計(jì)算幀間差異值,根據(jù)下式進(jìn)行
權(quán)利要求
1.一種鏡頭邊界檢測方法,其特征在于所述方法基于上下文特征向量和禁忌搜索算法優(yōu)化支持向量機(jī)實(shí)現(xiàn)鏡頭邊界檢測。
2.根據(jù)權(quán)利要求I所述的鏡頭邊界檢測方法,其特征在于 所述方法包括以下步驟 (1),提取視頻數(shù)據(jù)的底層特征提取全局顏色直方圖和小波紋理特征; (2),計(jì)算幾種特定間隔下視頻序列幀的幀間差,將其組成幾種滑動窗口下的上下文特征向量; (3),使用禁忌搜索算法優(yōu)化支持向量機(jī)分類模型; (4),利用得到的近似最優(yōu)參數(shù)訓(xùn)練得到最優(yōu)分類模型,并以此為基礎(chǔ)對視頻序列幀進(jìn)行分類,最終完成鏡頭分割;所述近似最優(yōu)參數(shù)包括懲罰因子C和核函數(shù)參數(shù)Y。
3.根據(jù)權(quán)利要求2所述的鏡頭邊界檢測方法,其特征在于所述步驟(I)中的提取全局顏色直方圖是這樣實(shí)現(xiàn)的通過計(jì)算每個顏色區(qū)間的像素值個數(shù)來統(tǒng)計(jì)得到;對于原始的視頻序列幀,需要提取并計(jì)算每一個通道下的顏色直方圖區(qū)間值,采用X2距離來計(jì)算幀間差異值,根據(jù)下式進(jìn)行
4.根據(jù)權(quán)利要求2所述的鏡頭邊界檢測方法,其特征在于所述步驟(I)中的提取小波紋理特征是這樣實(shí)現(xiàn)的 首先,使用三層小波變換對原始幀進(jìn)行分解,分解得到的結(jié)果如下
5.根據(jù)權(quán)利要求2所述的鏡頭邊界檢測方法,其特征在于所述步驟(3)具體如下 (3.A),初始解和適應(yīng)度函數(shù)(C(I,Ytl)代表隨機(jī)產(chǎn)生的一個初始解,采用f(c,y)=accuracy作為適應(yīng)度函數(shù)來計(jì)算適應(yīng)度值,式中的c和、分別是支持向量機(jī)中的懲罰因子和核函數(shù)參數(shù); (3. B),鄰域解和禁忌對象在初始解(C(l,Y0)周圍能夠得到很多組鄰域解(C,Y),通過初始預(yù)測每組解都會得到一個相應(yīng)的適應(yīng)度值;鄰域解的生成策略是以初始解為中心,根據(jù)劃定的一個預(yù)定范圍在其中隨機(jī)生成一定變化步長的解;適應(yīng)度值的計(jì)算應(yīng)用了支持向量機(jī)的交叉驗(yàn)證策略; (3. C),候選集生成每一代根據(jù)適應(yīng)度值的情況從鄰域解中選取; (3. D),禁忌表的生成每代中最好的解都放入到禁忌表中,在接下來若干代的迭代中所述最好的解被禁忌使用; (3. E),對禁忌表中的解的特赦如果禁忌解對應(yīng)的適應(yīng)度值比到現(xiàn)在為止最好的適應(yīng)度值更大,那么允許其從禁忌表中逃逸;另外,每隔若干代的迭代,之前放入到禁忌表中的最優(yōu)解也會被釋放出來; (3. F),如果達(dá)到最大迭代次數(shù)或者得到了足夠好的適應(yīng)度解,則停止迭代)。
6.根據(jù)權(quán)利要求2所述的鏡頭邊界檢測方法,其特征在于所述步驟(4)是這樣實(shí)現(xiàn)的 使用支持向量機(jī)的分類函數(shù)svmpredict,將測試集的所有數(shù)據(jù)劃分為三類,分別對應(yīng)突變幀、漸變幀和普通幀,這樣也就完成了鏡頭分割。
全文摘要
本發(fā)明提供了一種鏡頭邊界檢測方法,屬于視頻檢索領(lǐng)域。所述方法基于上下文特征向量和禁忌搜索算法優(yōu)化支持向量機(jī)實(shí)現(xiàn)鏡頭邊界檢測,包括以下步驟(1)提取視頻數(shù)據(jù)的底層特征;(2)計(jì)算幾種特定間隔下視頻序列幀的幀間差,將其組成幾種滑動窗口下的上下文特征向量;(3)使用禁忌搜索算法優(yōu)化支持向量機(jī)分類模型;(4)利用得到的近似最優(yōu)參數(shù)訓(xùn)練得到最優(yōu)分類模型,并以此為基礎(chǔ)對視頻序列幀進(jìn)行分類,最終完成鏡頭分割。本發(fā)明方法避免了傳統(tǒng)支持向量機(jī)選取參數(shù)時的盲目性和低效率,能夠一次性準(zhǔn)確地得到近似最優(yōu)參數(shù),而且能夠保證不陷入局部最優(yōu)的麻煩。
文檔編號G06K9/62GK102982553SQ201210574509
公開日2013年3月20日 申請日期2012年12月21日 優(yōu)先權(quán)日2012年12月21日
發(fā)明者孫學(xué)梅, 趙龍 申請人:天津工業(yè)大學(xué)