專利名稱:視頻指紋快速檢索方法
技術(shù)領(lǐng)域:
本發(fā)明涉及視頻指紋領(lǐng)域,特別涉及一種視頻指紋快速檢索方法。
背景技術(shù):
視頻指紋是一種軟件識(shí)別、提取、壓縮視頻的技術(shù),可以使產(chǎn)生的唯一的“指紋”來 代表一個(gè)視頻文件。視頻指紋是一個(gè)新興的技術(shù),已經(jīng)證明可以有效應(yīng)用于音頻數(shù)據(jù)預(yù)處 理、哈希值的比較和數(shù)字水印等領(lǐng)域。視頻指紋分析可以基于任何視覺的視頻特征,包括 (但不限于),視頻流中的關(guān)鍵幀序列分析,色彩和運(yùn)動(dòng)的變化等特征。一般來說,數(shù)字視頻 數(shù)據(jù)可以直接從文件中剝離出來,然后基于哈希值進(jìn)行壓縮?;诠V当容^進(jìn)行視頻文 件匹配的方法是有缺點(diǎn)的。因?yàn)?,視頻文件的匹配,只能依據(jù)視頻數(shù)據(jù)文件或視頻數(shù)據(jù)文件 中的一部分中的數(shù)據(jù)完全相等。大部分情況下,不同的視頻編碼和數(shù)字處理可能會(huì)導(dǎo)致視 頻數(shù)字?jǐn)?shù)據(jù)的微小改動(dòng),但是這種改變不會(huì)影響視頻本身感知性(也就是人的視覺是感覺 不到的)。因此,即使當(dāng)兩個(gè)視頻片斷是感性相同,當(dāng)采用哈希值比較方法時(shí),很可能失敗。 此外,如果想通過給出一些視頻片段來識(shí)別一個(gè)視頻也是不可能的??梢钥闯觯@種基于哈 希值比較的方法同樣是不可能用于視頻的相似匹配。數(shù)字視頻指紋識(shí)別可以依據(jù)“指紋”來 識(shí)別視頻,視頻文件可以是不同的分辨率(更大或更小),也可以略加修改(對(duì)幀片段進(jìn)行 模糊、旋轉(zhuǎn)、裁剪、加速、減速、插入元素)。視頻指紋技術(shù)可以從視頻文件中提取的可以唯一 標(biāo)識(shí)視頻文件的特征,并存儲(chǔ)這些特征。這樣,就可以后通過比較提取的視頻指紋來識(shí)別視 頻內(nèi)容。對(duì)于數(shù)字視頻數(shù)據(jù),音頻和視頻都可以提取指紋,根據(jù)不同的應(yīng)用領(lǐng)域會(huì)有不同的 意義。一個(gè)視頻指紋建立涉及使用專門的解碼器對(duì)視頻數(shù)據(jù)進(jìn)行解碼,然后應(yīng)用特征提取 算法提取視頻的特征。視頻指紋相對(duì)比原來的源文件內(nèi)容,要少了很多。因此可以很容易 在數(shù)據(jù)庫中儲(chǔ)存。他們可能被視為一種有損壓縮的極端形式,不能用來重建原始視頻內(nèi)容。 視頻指紋與數(shù)字水印不同。數(shù)字水印是在視頻內(nèi)容中插入一個(gè)唯一的標(biāo)識(shí)。也即是說,數(shù) 字水印技術(shù)要改變視頻文件的內(nèi)容,為了識(shí)別視頻文件,數(shù)字水必須被插入到視頻文件中。 以后,任何人任何時(shí)間都可以在視頻文件中更改或刪除數(shù)字水印。而視頻指紋,可以識(shí)別任 何內(nèi)容,不管文件之前是否被更改過。考慮到現(xiàn)有的視頻數(shù)量龐大,隨著視頻由用戶上傳的 網(wǎng)站大量涌現(xiàn),視頻指紋識(shí)別技術(shù)面臨著巨大的可擴(kuò)展性的挑戰(zhàn)。隨著視頻網(wǎng)絡(luò)的發(fā)展,視頻節(jié)目呈海量增長(zhǎng)之勢(shì),如何高效且有效地檢索或監(jiān)管 視頻內(nèi)容成為一個(gè)重要的問題。視頻指紋技術(shù)的出現(xiàn)為視頻內(nèi)容的監(jiān)管和檢索提供了一種 高效且有效的方法。視頻指紋技術(shù)中的關(guān)鍵技術(shù)是(1)視頻指紋的提取;和(2)視頻指紋 的檢索。視頻指紋的檢索方法是否有效,直接決定了視頻指紋檢索的效率和精度。在2002年的視覺信息最新進(jìn)展國(guó)際會(huì)議上(Proceedings of Recent Advances in VisualInformation Systems 2002),Oostveen 和 Kalker 等人在《視頻指紋的特征 提取方法禾口數(shù)據(jù)庫策略〉〉(Feature Extraction and a Database Strategy for Video Fingerprinting)這篇文章中,提出了一種視頻指紋檢索方法。該檢索方法有下面幾個(gè)特 點(diǎn)(1)被用于檢索的指紋文件是一個(gè)指紋片段,而數(shù)據(jù)庫中則是大量的指紋文件;(2)采用的計(jì)算方法是將數(shù)據(jù)庫中的大量的指紋文件做成哈希表,然后進(jìn)行快速的檢索;(3)若 對(duì)數(shù)據(jù)庫中的每個(gè)候選指紋片段與被用于檢索的指紋片段進(jìn)行漢明(Hamming)距離計(jì)算的話,則運(yùn)算很大。
而在實(shí)際應(yīng)用中,碰到的情況與之相反,也就是說用于檢索的指紋文件是一個(gè)指 紋文件,而數(shù)據(jù)庫中包含的則是一些指紋片段,例如反動(dòng)、暴力、色情、誹謗等之類的違規(guī)視 頻片段。在此基礎(chǔ)上,本發(fā)明提出一種基于線段檢測(cè)的視頻指紋檢索系統(tǒng)。這里的視頻指 紋既可以是視頻中的視頻信號(hào)的指紋,也可以是視頻中的音頻信號(hào)的指紋,它們被統(tǒng)稱為 是視頻指紋。有鑒于此,本領(lǐng)域技術(shù)人員針對(duì)上述問題,提供了一種視頻指紋快速檢索方法。方法內(nèi)容本發(fā)明提供了一種視頻指紋快速檢索方法,克服了現(xiàn)有技術(shù)的困難,以達(dá)到快速 檢索大量指紋片段,提高視頻指紋檢索的效率和精度的目的。本發(fā)明采用如下技術(shù)方案本發(fā)明的一種視頻指紋快速檢索方法,其特征在于包括以下步驟A)將視頻片段庫中的每個(gè)視頻片段提取指紋特征,并以指紋特征建立數(shù)據(jù)庫;B)根據(jù)數(shù)據(jù)庫建立哈希表;C)加載被檢索視頻文件,然后提取指紋特征;D)進(jìn)行基于線段檢測(cè)的指紋快速檢索。優(yōu)選地,所述步驟A)中,所述提取指紋特征包括提取音頻指紋特征或提取視頻指 紋特征。優(yōu)選地,所述步驟B)中,所述哈希表的鍵值是數(shù)據(jù)庫中的指紋文件的子指紋。優(yōu)選地,所述步驟B)中,所述子指紋是32比特的二進(jìn)制數(shù)。優(yōu)選地,所述步驟B)中,所述哈希表的值是指向文件號(hào)集合的指針。優(yōu)選地,所述步驟B)中,所述文件號(hào)集合包括對(duì)應(yīng)鍵值的指紋文件的文件號(hào)。優(yōu)選地,所述步驟D)中,包括以下步驟Dl)建立坐標(biāo)系,其橫軸為數(shù)據(jù)庫中的文件號(hào),縱軸為被檢索的視頻指紋文件的子 指紋;D2)通過哈希表的快速取值,形成坐標(biāo)系中的若干線段;D3)掃描該坐標(biāo)系中的所有線段,將間隔距離小于K的線段連接成一個(gè)線段,得到 的線段的集合稱為L(zhǎng) ;D4)在L內(nèi),過濾掉所有長(zhǎng)度小于T的線段,得到過濾后的線段的集合FL ;D5)根據(jù)FL中一條線段的縱軸范圍,計(jì)算被檢索的視頻指紋文件和該線段所在文 件號(hào)所對(duì)應(yīng)的數(shù)據(jù)庫中的指紋文件的距離d,執(zhí)行步驟D8);D6)判斷FL中是否還有剩余線段,若是,則執(zhí)行步驟D7),若否,則被檢索的視頻指 紋文件不是目標(biāo)文件,程序結(jié)束;D7)根據(jù)FL中剩余的一條線段的縱軸范圍,計(jì)算被檢索的視頻指紋文件和該線段 所在文件號(hào)所對(duì)應(yīng)的數(shù)據(jù)庫中的指紋文件的距離d,執(zhí)行步驟D8);D8)判斷d是否小于閾值D,若是,則被檢索的視頻指紋文件是目標(biāo)文件,程序結(jié) 束;若否,則執(zhí)行步驟D6);
其中,K是一個(gè)預(yù)先給定的閾值,且K > 0 ;L為算法步驟過程中,將間隔距離小于K的線段連接成一個(gè)線段,得到的線段的集合;T是預(yù)先給定的常數(shù),且T > 0 ;在L內(nèi),過濾掉所有長(zhǎng)度小于T的線段,得到過濾 后的線段的集合稱為FL;d為根據(jù)FL中一條線段的縱軸范圍,計(jì)算被檢索的視頻指紋文件和該線段所在文 件號(hào)所對(duì)應(yīng)的數(shù)據(jù)庫中的指紋文件的距離;D是預(yù)先給定的閾值,且D > 0。優(yōu)選地,所述步驟D)中,所述距離d是漢明距離。由于采用了上述技術(shù),本發(fā)明能快速檢索大量指紋片段,提高視頻指紋檢索的效 率和精度。以下結(jié)合附圖及實(shí)施例進(jìn)一步說明本發(fā)明。
圖1為本發(fā)明的視頻指紋快速檢索方法的流程圖;圖2為本發(fā)明的視頻指紋快速檢索方法的實(shí)施例流程圖;圖3為本發(fā)明中哈希表的實(shí)施例圖;圖4為本發(fā)明中進(jìn)行線段檢測(cè)的實(shí)施例圖。附圖標(biāo)記A為準(zhǔn)備階段,B為線段檢測(cè)階段,C為驗(yàn)證階段,D為哈希表,E為用于被檢索的視 頻指紋文件,F(xiàn)為文件ID,G為過濾后的線段,H為過濾后的線段。
具體實(shí)施例方式下面通過圖1至4來介紹本發(fā)明的一種具體實(shí)施例。如圖1至4所示,本發(fā)明的一種視頻指紋快速檢索方法,包括以下步驟A)將視頻片段庫中的每個(gè)視頻片段提取指紋特征,并以指紋特征建立數(shù)據(jù)庫;B)根據(jù)數(shù)據(jù)庫建立哈希表;C)加載被檢索視頻文件,然后提取指紋特征;D)進(jìn)行基于線段檢測(cè)的指紋快速檢索。所述步驟A)中,所述提取指紋特征包括提取音頻指紋特征或提取視頻指紋特征。所述步驟B)中,所述哈希表的鍵值是數(shù)據(jù)庫中的指紋文件的子指紋,所述子指紋 是32比特的二進(jìn)制數(shù);所述哈希表的值是指向文件號(hào)集合的指針,所述文件號(hào)集合包括對(duì) 應(yīng)鍵值的指紋文件的文件號(hào)。所述步驟D)中,包括以下步驟Dl)建立坐標(biāo)系,其橫軸為數(shù)據(jù)庫中的文件號(hào),縱軸為被檢索的視頻指紋文件的子 指紋;D2)通過哈希表的快速取值,形成坐標(biāo)系中的若干線段;D3)掃描該坐標(biāo)系中的所有線段,將間隔距離小于K的線段連接成一個(gè)線段,得到 的線段的集合稱為L(zhǎng) ;
D4)在L內(nèi),過濾掉所有長(zhǎng)度小于T的線段,得到過濾后的線段的集合FL ;D5)根據(jù)FL中一條線段的縱軸范圍,計(jì)算被檢索的視頻指紋文件和該線段所在文件號(hào)所對(duì)應(yīng)的數(shù)據(jù)庫中的指紋文件的距離d,執(zhí)行步驟D8);D6)判斷FL中是否還有剩余線段,若是,則執(zhí)行步驟D7),若否,則被檢索的視頻指紋文件不是目標(biāo)文件,程序結(jié)束;D7)根據(jù)FL中剩余的一條線段的縱軸范圍,計(jì)算被檢索的視頻指紋文件和該線段所在文件號(hào)所對(duì)應(yīng)的數(shù)據(jù)庫中的指紋文件的距離d,執(zhí)行步驟D8);D8)判斷d是否小于閾值D,若是,則被檢索的視頻指紋文件是目標(biāo)文件,程序結(jié)束;若否,則執(zhí)行步驟D6)。其中,K是一個(gè)預(yù)先給定的閾值,且K > 0 ;L為算法步驟過程中,將間隔距離小于K的線段連接成一個(gè)線段,得到的線段的集合;T是預(yù)先給定的常數(shù),且!" > 0 ;在L內(nèi),過濾 掉所有長(zhǎng)度小于T的線段,得到過濾后的線段的集合稱為FL ;d為根據(jù)FL中一條線段的縱 軸范圍,計(jì)算被檢索的視頻指紋文件和該線段所在文件號(hào)所對(duì)應(yīng)的數(shù)據(jù)庫中的指紋文件的 距離;D是預(yù)先給定的閾值,且D > 0。所述步驟D)中,所述距離d是漢明距離。漢明距離就是信息論中,兩個(gè)等長(zhǎng)字符 串之間的漢明距離是兩個(gè)字符串對(duì)應(yīng)位置的不同字符的個(gè)數(shù)。換句話說,它就是將一個(gè)字 符串變換成另外一個(gè)字符串所需要替換的字符個(gè)數(shù)。實(shí)際使用中,如圖2至4所示本發(fā)明的具體實(shí)施例流程包括以下步驟1)將視頻片段庫中的每個(gè)視頻片段進(jìn)行指紋特征提取,這些指紋文件稱為是數(shù)據(jù) 庫;2)在數(shù)據(jù)庫上建立哈希表,其特征在于哈希表的鍵值(key)是數(shù)據(jù)庫中的指紋文 件的子指紋,通常是一個(gè)32比特的二進(jìn)制數(shù),但不局限于是32比特;哈希表的值(value) 是一個(gè)指針,該指針指向一個(gè)文件號(hào)(id)集合;該文件號(hào)集合是包含相應(yīng)鍵值的指紋文件 的文件號(hào)的集合。該集合中的元素具有唯一性,也就是說不存在重復(fù)的文件號(hào)。3)在進(jìn)行檢索的時(shí)候,首先加載用于被檢索的視頻文件,然后進(jìn)行指紋特征提 ??;4)按下面的步驟進(jìn)行基于線段檢測(cè)的指紋快速檢索5)以被檢索的視頻指紋文件的子指紋為縱軸,以數(shù)據(jù)庫中的文件號(hào)為橫軸,形成 坐標(biāo)系;6)通過哈希表的快速取值,形成坐標(biāo)系中的若干線段;7)掃描該坐標(biāo)系中的所有線段,將間隔距離小于K的線段連接成一個(gè)線段,得到 的線段的集合稱為L(zhǎng) ;8)在L內(nèi),過濾掉所有長(zhǎng)度小于T的線段,得到過濾后的線段的集合FL ;9)根據(jù)FL中每條線段的縱軸范圍,計(jì)算被檢索的視頻指紋文件和該線段所在 文件號(hào)所對(duì)應(yīng)的數(shù)據(jù)庫中的指紋文件的距離d,這里的距離指的是漢明距離(Hamming distance);10)若d小于某個(gè)閾值D,則被檢索的視頻指紋文件被認(rèn)為是目標(biāo)文件,返回之;11)否則,回到9)直到退出。與現(xiàn)有技術(shù)相比,本發(fā)明能快速檢索大量指紋片段,提高視頻指紋檢索的效率和精度。 綜上可知,由于采用了上述技術(shù),本發(fā)明與現(xiàn)有技術(shù)相比,本發(fā)明能快速檢索大量 指紋片段,提高視頻指紋檢索的效率和精度。以上所述的實(shí)施例僅用于說明本發(fā)明的技術(shù) 思想及特點(diǎn),其目的在于使本領(lǐng)域內(nèi)的技術(shù)人員能夠了解本發(fā)明的內(nèi)容并據(jù)以實(shí)施,不能 僅以本實(shí)施例來限定本發(fā)明的專利范圍,即凡依本發(fā)明所揭示的精神所作的同等變化或修 飾,仍落在本發(fā)明的專利范圍內(nèi)。
權(quán)利要求
一種視頻指紋快速檢索方法,其特征在于包括以下步驟A)將視頻片段庫中的每個(gè)視頻片段提取指紋特征,并以指紋特征建立數(shù)據(jù)庫;B)根據(jù)數(shù)據(jù)庫建立哈希表;C)加載被檢索視頻文件,然后提取指紋特征;D)進(jìn)行基于線段檢測(cè)的指紋快速檢索。
2.如權(quán)利要求1所述的視頻指紋快速檢索方法,其特征在于所述步驟A)中,所述提 取指紋特征包括提取音頻指紋特征或提取視頻指紋特征。
3.如權(quán)利要求1所述的視頻指紋快速檢索方法,其特征在于所述步驟B)中,所述哈 希表的鍵值是數(shù)據(jù)庫中的指紋文件的子指紋。
4.如權(quán)利要求3所述的視頻指紋快速檢索方法,其特征在于所述步驟B)中,所述子 指紋是32比特的二進(jìn)制數(shù)。
5.如權(quán)利要求1所述的視頻指紋快速檢索方法,其特征在于所述步驟B)中,所述哈 希表的值是指向文件號(hào)集合的指針。
6.如權(quán)利要求5所述的視頻指紋快速檢索方法,其特征在于所述步驟B)中,所述文 件號(hào)集合包括對(duì)應(yīng)鍵值的指紋文件的文件號(hào)。
7.如權(quán)利要求1、2、4、6中任意一項(xiàng)所述的視頻指紋快速檢索方法,其特征在于所述 步驟D)中,包括以下步驟Dl)建立坐標(biāo)系,其橫軸為數(shù)據(jù)庫中的文件號(hào),縱軸為被檢索的視頻指紋文件的子指紋;D2)通過哈希表的快速取值,形成坐標(biāo)系中的若干線段;D3)掃描該坐標(biāo)系中的所有線段,將間隔距離小于K的線段連接成一個(gè)線段,得到的線 段的集合稱為L(zhǎng) ;D4)在L內(nèi),過濾掉所有長(zhǎng)度小于T的線段,得到過濾后的線段的集合FL ; D5)根據(jù)FL中一條線段的縱軸范圍,計(jì)算被檢索的視頻指紋文件和該線段所在文件號(hào) 所對(duì)應(yīng)的數(shù)據(jù)庫中的指紋文件的距離d,執(zhí)行步驟D8);D6)判斷FL中是否還有剩余線段,若是,則執(zhí)行步驟D7),若否,則被檢索的視頻指紋文 件不是目標(biāo)文件,程序結(jié)束;D7)根據(jù)FL中剩余的一條線段的縱軸范圍,計(jì)算被檢索的視頻指紋文件和該線段所在 文件號(hào)所對(duì)應(yīng)的數(shù)據(jù)庫中的指紋文件的距離d,執(zhí)行步驟D8);D8)判斷d是否小于閾值D,若是,則被檢索的視頻指紋文件是目標(biāo)文件,程序結(jié)束;若 否,則執(zhí)行步驟D6);其中,K是一個(gè)預(yù)先給定的閾值,且K > O ;L為算法步驟過程中,將間隔距離小于K的線段連接成一個(gè)線段,得到的線段的集合; T是預(yù)先給定的常數(shù),且T > O ;在L內(nèi),過濾掉所有長(zhǎng)度小于T的線段,得到過濾后的 線段的集合稱為FL ;d為根據(jù)FL中一條線段的縱軸范圍,計(jì)算被檢索的視頻指紋文件和該線段所在文件號(hào) 所對(duì)應(yīng)的數(shù)據(jù)庫中的指紋文件的距離; D是預(yù)先給定的閾值,且D > O。
8.如權(quán)利要求7所述的視頻指紋快速檢索方法,其特征在于所述步驟D)中,所述距離d是漢 明距離。
全文摘要
本發(fā)明揭示了一種視頻指紋快速檢索方法,包括以下步驟A)將視頻片段庫中的每個(gè)視頻片段提取指紋特征,并以指紋特征建立數(shù)據(jù)庫;B)根據(jù)數(shù)據(jù)庫建立哈希表;C)加載被檢索視頻文件,然后提取指紋特征;D)進(jìn)行基于線段檢測(cè)的指紋快速檢索,本發(fā)明能快速檢索大量指紋片段,提高視頻指紋檢索的效率和精度。
文檔編號(hào)G06K9/00GK101807208SQ201010133870
公開日2010年8月18日 申請(qǐng)日期2010年3月26日 優(yōu)先權(quán)日2010年3月26日
發(fā)明者連惠城 申請(qǐng)人:上海全土豆網(wǎng)絡(luò)科技有限公司