1.一種基于隨機(jī)多視角哈希的大規(guī)模近重復(fù)視頻檢索方法,其特征是按如下步驟進(jìn)行:
步驟一、訓(xùn)練階段:
步驟1、對(duì)數(shù)據(jù)集中的V段視頻采用時(shí)間間隔采樣的方法提取關(guān)鍵幀,從而獲得n幀關(guān)鍵幀;
步驟2、提取n幀關(guān)鍵幀的HSV顏色直方圖特征矩陣和LBP局部二值模式特征矩陣表示所述HSV顏色直方圖特征矩陣X(1)中第i行第j列元素;表示所述LBP局部二值模式特征矩陣X(2)中第i行第j列元素;所述HSV顏色直方圖特征矩陣X(1)的大小為n×d1,其中,d1為所述HSV顏色直方圖特征的量化級(jí)數(shù);所述LBP局部二值模式特征矩陣X(2)的大小為n×d2,其中,d2為所述LBP局部二值模式特征的維度;所述HSV顏色直方圖特征矩陣X(1)中第i行行向量表示第i幀關(guān)鍵幀所對(duì)應(yīng)的特征向量;所述LBP局部二值模式特征矩陣X(2)中第i行行向量表示第i幀關(guān)鍵幀所對(duì)應(yīng)的特征向量;令X(g)表示任一特征矩陣,其中,g=1表示HSV顏色直方圖特征矩陣;g=2表示LBP局部二值模式特征矩陣;
步驟3、生成所述n幀關(guān)鍵幀中任一關(guān)鍵幀所對(duì)應(yīng)的s位哈希碼;
步驟3.1、利用式(1)對(duì)第i幀關(guān)鍵幀所對(duì)應(yīng)的特征向量進(jìn)行線性映射,得到第i行特征向量的第l個(gè)線性映射值
式(1)中,為線性映射的第j行第l列結(jié)合系數(shù),bl為第l個(gè)偏置參數(shù);
步驟3.2、利用sigmoid函數(shù)對(duì)所述第i行特征向量的第l個(gè)線性映射值進(jìn)行處理,得到sigmoid函數(shù)映射值z(mì)il;從而將線性映射值所在的實(shí)數(shù)空間映射為sigmoid函數(shù)映射值所在的準(zhǔn)哈??臻g;
步驟3.3、對(duì)所述sigmoid函數(shù)映射值z(mì)il進(jìn)行閾值化處理,判斷zil>0.5是否成立,若成立,則令hil為1,否則令hil為0;從而獲得第i幀關(guān)鍵幀的哈希碼序列hi=[hi1,hi2,…,hil,…,his];hil表示第i幀關(guān)鍵幀的第l位哈希碼;
步驟4、在所述HSV顏色直方圖特征矩陣和所述LBP局部二值模式特征矩陣中,利用高斯模型分別計(jì)算在給定第i幀關(guān)鍵幀時(shí),第j幀關(guān)鍵幀與所述第i幀關(guān)鍵幀的相似程度的條件概率且令從而獲得n幀關(guān)鍵幀之間的條件概率矩陣為
步驟5、判斷第i幀關(guān)鍵幀與第j幀關(guān)鍵幀是否屬于同一視頻,若屬于,則令第i幀關(guān)鍵幀與第j幀關(guān)鍵幀的所屬關(guān)系否則令從而獲得n幀關(guān)鍵幀之間的所屬關(guān)系矩陣
判斷第i幀關(guān)鍵幀與第j幀關(guān)鍵幀在數(shù)據(jù)集真值表中是否為近重復(fù)視頻,若是,則令第i幀關(guān)鍵幀與第j幀關(guān)鍵幀的監(jiān)督關(guān)系否則,令從而獲得n幀關(guān)鍵幀之間的監(jiān)督關(guān)系矩陣
步驟6、利用式(2)計(jì)算得到n幀關(guān)鍵幀之間相似程度的概率矩陣P,并進(jìn)行歸一化處理,得到歸一化后的概率矩陣
式(2)中,表示條件概率矩陣系數(shù);β表示所屬關(guān)系矩陣系數(shù);γ表示監(jiān)督關(guān)系矩陣系數(shù);且系數(shù)β、γ均大于0且小于1,系數(shù)β、γ之和為1;
步驟7、在所述準(zhǔn)哈??臻g中,利用方差為1的高斯模型計(jì)算n幀關(guān)鍵幀之間的條件概率矩陣Q;
步驟8、利用復(fù)合的Kullback-Leibler(KL)散度計(jì)算概率矩陣和條件概率矩陣Q之間的差異SKL;
步驟9、利用式(3)優(yōu)化目標(biāo)方程O:
式(3)中、μ為所設(shè)定的正則項(xiàng)系數(shù);
步驟10、采用標(biāo)準(zhǔn)的梯度下降算法優(yōu)化第j行第l列結(jié)合系數(shù)以及第l個(gè)偏置參數(shù)bl;
步驟11、利用優(yōu)化后的第j行第l列結(jié)合系數(shù)以及第l個(gè)偏置參數(shù)bl,并按照步驟1至步驟3對(duì)所述數(shù)據(jù)集中的所有視頻進(jìn)行處理,得到所有視頻的關(guān)鍵幀的s位哈希碼序列;
步驟12、利用式(4)計(jì)算獲得所有視頻中任一視頻的s位哈希碼序列中第e位哈希碼
式(4)中,Ind表示任一視頻的關(guān)鍵幀集合,|Ind|表示任一視頻的關(guān)鍵幀集合Ind的勢(shì);hye表示任一視頻中第y幀關(guān)鍵幀的第e位哈希碼;
步驟二、檢索階段:
步驟13、在所有視頻中選定一個(gè)待檢索視頻,并利用漢明距離來衡量所述待檢索視頻與所有其他視頻的s位哈希碼序列之間的差異,從而根據(jù)待檢索視頻與其他視頻之間的差異大小來判斷是否為近重復(fù)視頻。