本發(fā)明涉及技術圖像檢索重排序領域,尤其涉及一種基于排列融合的圖像檢索重排序方法及系統(tǒng)。
背景技術:
:圖像檢索重排序是圖像檢索領域研究的前沿問題。該技術試圖在基于文本的圖像檢索結果的基礎上,利用返回檢索圖像的視覺信息進行重排序,提高圖像檢索性能。圖像檢索重排序能夠同時對檢索系統(tǒng)產(chǎn)生積極的影響。該技術可以高效地結合基于文本的圖像檢索和基于內容的圖像檢索的優(yōu)點:先利用基于文本的檢索快速從海量數(shù)據(jù)庫中返回初始查詢結果,然后對初始查詢結果中排序靠前的一部分圖像精細分析其內容,對這些圖像進行重排序,以改善圖像檢索的結果。從用戶的角度講,圖像檢索重排序技術可以提升用戶體驗;對檢索系統(tǒng)來說,圖像檢索重排序可以有效改善圖像檢索性能。圖像重排序方法一般基于兩個假設:(1)返回的初始文本查詢結果中排序靠前的圖像大部分都是跟查詢相關的;(2)與查詢相關的圖像之間的相似性比較高。大部分圖像重排序的方法都是從這兩個假設出發(fā),設計重排序模型。此外,由于重排序是通過挖掘圖像的視覺模式來對圖像初始查詢結果進行改善,因此圖像重排序中的兩個重要環(huán)境是圖像的視覺特征表達和重排序模型建立。在圖像視覺特征表達方面,一般常用的特征有基于紋理的、基于形狀的、基于顏色的特征。利用最廣泛的是尺度旋轉不變特征(ScaleInvariantFeatureTransform,SIFT),這種特征對局部遮擋和旋轉等有較高的魯棒性,因此在圖像檢索、圖像識別等領域取得了不錯的效果。然而,近年來提出的深度卷積神經(jīng)網(wǎng)絡,不依賴于人工特征提取,可以自動從大量訓練數(shù)據(jù)中提取層級特征,為圖像視覺特征表達提供了一種新方法。如果可以將深度特征用于重排序中的特征表達,將有效提升重排序效果。在重排序模型設計方面,不管是基于偽相關反饋的方法,還是基于圖的方法,基本假設都是返回的初始查詢結果中排序靠前的圖像大部分與查詢相關。然而,由于噪聲的影響,返回的結果中有包含大量不相關圖像,在這種情況下這些重排序模型的效果不理想。因此,需要解決初始返回結果中噪聲過大的問題。技術實現(xiàn)要素:基于
背景技術:
存在的技術問題,本發(fā)明提出了一種基于排列融合的圖像檢索重排序方法及系統(tǒng)。本發(fā)明提出的基于排列融合的圖像檢索重排序方法,包括以下步驟:S1、在搜索引擎上輸入請求查詢文本Q,得到基于請求查詢文本Q的初始檢索結果L,提取所述初始檢索結果L中每幅圖像的視覺特征,再計算出所述初始檢索結果L中每幅圖像與其它圖像的相似度;S2、根據(jù)所述初始檢索結果L中每幅圖像與其它圖像的相似度對所述初始檢索結果L進行降噪處理后得到檢索圖像列表L′;S3、從所述檢索圖像列表L′中選取一個或多個種子點圖像,并采用基于圖的重排序方法對所述檢索圖像列表L′中的圖像進行重排序得到重排序結果;其中,當從所述檢索圖像列表L′中選取一個種子點圖像時,采用基于圖的重排序方法對所述檢索圖像列表L′中的圖像進行重排序得到重排序結果;當從所述檢索圖像列表L′中選取多個種子點圖像時,采用基于圖的重排序方法對所述檢索圖像列表L′中的圖像進行重排序得到多個重排序結果,并對上述得到的多個重排序結果進行融合,得到最終重排序結果。優(yōu)選地,步驟S1中提取所述初始檢索結果L中每幅圖像的視覺特征,再計算出所述初始檢索結果L中每幅圖像與其它圖像的相似度具體包括:對初始檢索結果L={I1,I2,...,IN}中的圖像Ii提取基于深度卷積神經(jīng)網(wǎng)絡的特征,將其表示成一個特征向量;優(yōu)選地,采用在ImageNetILSVRC-2012數(shù)據(jù)集上訓練好的卷積神經(jīng)網(wǎng)絡;將圖片Ii輸入該網(wǎng)絡,提取第七層全連接層的4096維特征k=1,...,4096,再將上述特征通過下述公式進行歸一化,得到Ii的特征向量xi:其中,K是特征的維數(shù)且K=4096;由于特征的維數(shù)K較高,因此需對特征進行降維處理,優(yōu)選地,采用PCA對特征進行降維處理;優(yōu)選地,計算所述初始檢索結果L中兩幅圖像Ii和Ij的相似度具體包括:計算兩幅圖像Ii和Ij對應特征向量間的卡方距離dij:兩幅圖像Ii和Ij的相似度sij按如下公式計算:其中,λ=0.5。優(yōu)選地,步驟S2具體包括根據(jù)所述初始檢索結果L中每幅圖像與其它圖像的相似度對所述初始檢索結果L進行降噪處理,去除所述初始檢索結果L中與請求查詢文本Q不相關的噪聲圖像,得到檢索圖像列表L′;優(yōu)選地,采用基于相似度加權和的降噪方法對所述初始檢索結果L進行降噪處理,上述降噪方法具體包括:通過公式計算所述初始檢索結果L中的每幅圖像Ii與所述初始檢索結果L中其它圖像的相似度加權以及圖像Ii的置信分數(shù)ci,所述公式為:其中,N為所述初始檢索結果L中圖像的幅數(shù),sij為圖像Ii和圖像Ij之間的相似度,μj為加權系數(shù),且圖像Ij在所述初始檢索結果L中的排序越靠前μj越大;優(yōu)選地,采用基于視覺降序的降噪方法對所述初始檢索結果L進行降噪處理,上述降噪方法具體包括:基于視覺排序的降噪方法是利用視覺排序模型來計算每幅圖像的置信分數(shù);置信分數(shù)向量c=[c1,c2,L,cN]T中的ci對應所述初始檢索結果L中第i圖像Ij的置信分數(shù),且置信分數(shù)通過下式迭代求解;c=d(S*×c)+(1-d)p;其中,c的初值設置為1/N,d為平衡參數(shù)且d=0.85,S*為對相似性矩陣S做列歸一化得到的矩陣;將上式迭代達到穩(wěn)定的結果c作為每幅圖像的置信分數(shù),且置信分數(shù)越高表明圖像與請求查詢文本Q的相關性越高,則將所述初始檢索結果L中的圖像按照置信分數(shù)從高至低進行排序,得到檢索圖像列表L′。優(yōu)選地,步驟S3具體包括從所述檢索圖像列表L′中多次選取種子點圖像,且每個種子點圖像對應一個重排序結果,再對得到的多個重排序結果進行融合以得到最終重排序結果;優(yōu)選地,采用Borda融合方法對得到的多個重排序結果進行融合,具體包括:Borda融合是將重排序結果轉化成分數(shù)后再進行融合;重排序結果中排序越靠前的圖像,分數(shù)越高;具體地,重排序結果中排序為R的圖像的分數(shù)s為:其中,N為重排序結果中圖像的總數(shù)量;對每幅圖像計算出其在多個重排序結果中的分數(shù)總和,分數(shù)總和越高表明該圖像與請求查詢文本Q的相關度越高;將每幅圖像按照分數(shù)總和從高至低排列即得到最終重排序結果;優(yōu)選地,采用Condorect融合方法對得到的多個重排序結果進行融合,具體包括:Condorect融合是采用少數(shù)服從多數(shù)的投票機制;在每次迭代過程中,選擇一張圖像,上述圖像滿足如下條件:該圖像與其它圖像成對比較排名,如果該圖像在重排序結果中的排名比其它圖像都靠前,則選取該幅圖像加入融合后圖像序列,同時將此圖像從候選圖像集中去除;在下一次迭代過程中,按照上述過程和方法再選取一張圖像加入融合后圖像集;如此得到最終重排序結果;優(yōu)選地,采用RRF融合方法對得到的多個重排序結果進行融合,具體包括:RRF融合方法將每幅圖像按照如下公式從多個重排序結果R中計算出該幅圖像的排序分數(shù),所述公式為:其中,r(Ii)為圖像Ii在某個重排序結果r中的排序位置;將每幅圖像按照RRFscore的大小降序排序即得到最終重排序結果。本發(fā)明提出的基于排列融合的圖像檢索重排序系統(tǒng),包括:搜索模塊,用于在搜索引擎上根據(jù)請求查詢文本Q得到基于請求查詢文本Q的初始檢索結果L;特征提取模塊,用于提取所述初始檢索結果L中每幅圖像的視覺特征,并計算出所述初始檢索結果L中每幅圖像與其它圖像的相似度;降噪處理模塊,用于根據(jù)所述初始檢索結果L中每幅圖像與其它圖像的相似度對所述初始檢索結果L進行降噪處理,并得到檢索圖像列表L′;重排序模塊,用于從所述檢索圖像列表L′中選取一個或多個種子點圖像,并采用基于圖的重排序方法對所述檢索圖像列表L′中的圖像進行重排序得到重排序結果。優(yōu)選地,所述重排序模塊從所述檢索圖像列表L′中選取一個種子點圖像時,采用基于圖的重排序方法對所述檢索圖像列表L′中的圖像進行重排序得到重排序結果;所述重排序模塊從所述檢索圖像列表L′中選取多個種子點圖像時,采用基于圖的重排序方法對所述檢索圖像列表L′中的圖像進行重排序得到多個重排序結果,并對上述得到的多個重排序結果進行融合,得到最終重排序結果。優(yōu)選地,所述特征提取模塊提取所述初始檢索結果L中每幅圖像的視覺特征,再計算出所述初始檢索結果L中每幅圖像與其它圖像的相似度具體包括:對初始檢索結果L={I1,I2,...,IN}中的圖像Ii提取基于深度卷積神經(jīng)網(wǎng)絡的特征,將其表示成一個特征向量;優(yōu)選地,采用在ImageNetILSVRC-2012數(shù)據(jù)集上訓練好的卷積神經(jīng)網(wǎng)絡;將圖片Ii輸入該網(wǎng)絡,提取第七層全連接層的4096維特征k=1,...,4096,再將上述特征通過下述公式進行歸一化,得到Ii的特征向量xi:其中,K是特征的維數(shù)且K=4096;由于特征的維數(shù)K較高,因此需對特征進行降維處理,優(yōu)選地,采用PCA對特征進行降維處理;優(yōu)選地,計算所述初始檢索結果L中兩幅圖像Ii和Ij的相似度具體包括:計算兩幅圖像Ii和Ij對應特征向量間的卡方距離dij:兩幅圖像Ii和Ij的相似度sij按如下公式計算:其中,λ=0.5。優(yōu)選地,降噪處理模塊具體包括根據(jù)所述初始檢索結果L中每幅圖像與其它圖像的相似度對所述初始檢索結果L進行降噪處理,并得到檢索圖像列表L′;優(yōu)選地,采用基于相似度加權和的降噪方法對所述初始檢索結果L進行降噪處理,上述降噪方法具體包括:通過公式計算所述初始檢索結果L中的每幅圖像Ii與所述初始檢索結果L中其它圖像的相似度加權以及圖像Ii的置信分數(shù)ci,所述公式為:其中,N為所述初始檢索結果L中圖像的幅數(shù),sij為圖像Ii和圖像Ij之間的相似度,μj為加權系數(shù),且圖像Ij在所述初始檢索結果L中的排序越靠前μj越大;優(yōu)選地,采用基于視覺降序的降噪方法對所述初始檢索結果L進行降噪處理,上述降噪方法具體包括:基于視覺排序的降噪方法是利用視覺排序模型來計算每幅圖像的置信分數(shù);置信分數(shù)向量c=[c1,c2,L,cN]T中的ci對應所述初始檢索結果L中第i圖像Ij的置信分數(shù),且置信分數(shù)通過下式迭代求解;c=d(S*×c)+(1-d)p;其中,c的初值設置為1/N,d為平衡參數(shù)且d=0.85,S*為對相似性矩陣S做列歸一化得到的矩陣;將上式迭代達到穩(wěn)定的結果c作為每幅圖像的置信分數(shù),且置信分數(shù)越高表明圖像與請求查詢文本Q的相關性越高,則將所述初始檢索結果L中的圖像按照置信分數(shù)從高至低進行排序,得到檢索圖像列表L′。優(yōu)選地,所述重排序模塊具體包括從所述檢索圖像列表L′中選取多個種子點圖像,采用基于圖的重排序方法對所述檢索圖像列表L′中的圖像進行重排序得到多個重排序結果,并對上述得到的多個重排序結果進行融合,得到最終重排序結果;優(yōu)選地,采用Borda融合方法對得到的多個重排序結果進行融合,具體包括:Borda融合是將重排序結果轉化成分數(shù)后再進行融合;重排序結果中排序越靠前的圖像,分數(shù)越高;具體地,重排序結果中排序為R的圖像的分數(shù)s為:其中,N為重排序結果中圖像的總數(shù)量;對每幅圖像計算出其在多個重排序結果中的分數(shù)總和,分數(shù)總和越高表明該圖像與請求查詢文本Q的相關度越高;將每幅圖像按照分數(shù)總和從高至低排列即得到最終重排序結果;優(yōu)選地,采用Condorect融合方法對得到的多個重排序結果進行融合,具體包括:Condorect融合是采用少數(shù)服從多數(shù)的投票機制;在每次迭代過程中,選擇一張圖像,上述圖像滿足如下條件:該圖像與其它圖像成對比較排名,如果該圖像在重排序結果中的排名比其它圖像都靠前,則選取該幅圖像加入融合后圖像序列,同時將此圖像從候選圖像集中去除;在下一次迭代過程中,按照上述過程和方法再選取一張圖像加入融合后圖像集;如此得到最終重排序結果;優(yōu)選地,采用RRF融合方法對得到的多個重排序結果進行融合,具體包括:RRF融合方法將每幅圖像按照如下公式從多個重排序結果R中計算出該幅圖像的排序分數(shù),所述公式為:其中,r(Ii)為圖像Ii在某個重排序結果r中的排序位置;將每幅圖像按照RRFscore的大小降序排序即得到最終重排序結果。本發(fā)明提出了一種基于排序融合的圖像檢索重排序方法,該方法首先對初始檢索結果進行降噪處理得到降噪后的排序結果,再對上述降噪后的排序結果進行基于圖的重排序;如此,先對初始檢索結果作了降噪處理后再對其進行基于圖的重排序,有效地降低了重排序結果的不穩(wěn)定性;進一步地,本發(fā)明提出了兩種對初始結果進行降噪的方法,可以有效地從初始檢索結果中將與請求查詢文本相關的圖像排在前面,提升后續(xù)基于圖的重排序中種子點圖像的查詢相關度,保證重排序結果的穩(wěn)定性和準確性;同時,本發(fā)明提出了三種對多個重排序結果進行融合的方法,上述方法通過對多個重排序結果進行融合再得到最終重排序結果,提升了最終重排序結果的穩(wěn)定性,進一步保障本發(fā)明提出的重排序方法的穩(wěn)定性和準確度。附圖說明圖1為一種基于排列融合的圖像檢索重排序方法的步驟示意圖;圖2為一種基于排列融合的圖像檢索重排序系統(tǒng)的結構示意圖。具體實施方式如圖1所示,圖1為本發(fā)明提出的一種基于排列融合的圖像檢索重排序方法。參照圖1,本發(fā)明提出的基于排列融合的圖像檢索重排序方法,包括以下步驟:S1、在搜索引擎上輸入請求查詢文本Q,得到基于請求查詢文本Q的初始檢索結果L,提取所述初始檢索結果L中每幅圖像的視覺特征,再計算出所述初始檢索結果L中每幅圖像與其它圖像的相似度;其中,提取所述初始檢索結果L中每幅圖像的視覺特征,再計算出所述初始檢索結果L中每幅圖像與其它圖像的相似度具體包括:對初始檢索結果L={I1,I2,...,IN}中的圖像Ii提取基于深度卷積神經(jīng)網(wǎng)絡的特征,將其表示成一個特征向量;優(yōu)選地,采用在ImageNetILSVRC-2012數(shù)據(jù)集上訓練好的卷積神經(jīng)網(wǎng)絡;將圖片Ii輸入該網(wǎng)絡,提取第七層全連接層的4096維特征k=1,...,4096,再將上述特征通過下述公式進行歸一化,得到Ii的特征向量xi:其中,K是特征的維數(shù)且K=4096;由于特征的維數(shù)K較高,因此需對特征進行降維處理,優(yōu)選地,采用PCA對特征進行降維處理;優(yōu)選地,計算所述初始檢索結果L中兩幅圖像Ii和Ij的相似度具體包括:計算兩幅圖像Ii和Ij對應特征向量間的卡方距離dij:兩幅圖像Ii和Ij的相似度sij按如下公式計算:其中,λ=0.5。S2、根據(jù)所述初始檢索結果L中每幅圖像與其它圖像的相似度對所述初始檢索結果L進行降噪處理后得到檢索圖像列表L′;具體包括根據(jù)所述初始檢索結果L中每幅圖像與其它圖像的相似度對所述初始檢索結果L進行降噪處理,去除所述初始檢索結果L中與請求查詢文本Q不相關的噪聲圖像,得到檢索圖像列表L′;優(yōu)選地,采用基于相似度加權和的降噪方法對所述初始檢索結果L進行降噪處理,上述降噪方法具體包括:通過公式計算所述初始檢索結果L中的每幅圖像Ii與所述初始檢索結果L中其它圖像的相似度加權以及圖像Ii的置信分數(shù)ci,所述公式為:其中,N為所述初始檢索結果L中圖像的幅數(shù),sij為圖像Ii和圖像Ij之間的相似度,μj為加權系數(shù),且圖像Ij在所述初始檢索結果L中的排序越靠前μj越大;優(yōu)選地,采用基于視覺降序的降噪方法對所述初始檢索結果L進行降噪處理,上述降噪方法具體包括:基于視覺排序的降噪方法是利用視覺排序模型來計算每幅圖像的置信分數(shù);置信分數(shù)向量c=[c1,c2,L,cN]T中的ci對應所述初始檢索結果L中第i圖像Ij的置信分數(shù),且置信分數(shù)通過下式迭代求解;c=d(S*×c)+(1-d)p;其中,c的初值設置為1/N,d為平衡參數(shù)且d=0.85,S*為對相似性矩陣S做列歸一化得到的矩陣;將上式迭代達到穩(wěn)定的結果c作為每幅圖像的置信分數(shù),且置信分數(shù)越高表明圖像與請求查詢文本Q的相關性越高,則將所述初始檢索結果L中的圖像按照置信分數(shù)從高至低進行排序,得到檢索圖像列表L′。S3、從所述檢索圖像列表L′中選取一個或多個種子點圖像,并采用基于圖的重排序方法對所述檢索圖像列表L′中的圖像進行重排序得到重排序結果;其中,當從所述檢索圖像列表L′中選取一個種子點圖像時,采用基于圖的重排序方法對所述檢索圖像列表L′中的圖像進行重排序得到重排序結果;當從所述檢索圖像列表L′中選取多個種子點圖像時,采用基于圖的重排序方法對所述檢索圖像列表L′中的圖像進行重排序得到多個重排序結果,并對上述得到的多個重排序結果進行融合,得到最終重排序結果。當從所述檢索圖像列表L′中多次選取種子點圖像,且每個種子點圖像對應一個重排序結果,再對得到的多個重排序結果進行融合以得到最終重排序結果;優(yōu)選地,采用Borda融合方法對得到的多個重排序結果進行融合,具體包括:Borda融合是將重排序結果轉化成分數(shù)后再進行融合;重排序結果中排序越靠前的圖像,分數(shù)越高;具體地,重排序結果中排序為R的圖像的分數(shù)s為:其中,N為重排序結果中圖像的總數(shù)量;對每幅圖像計算出其在多個重排序結果中的分數(shù)總和,分數(shù)總和越高表明該圖像與請求查詢文本Q的相關度越高;將每幅圖像按照分數(shù)總和從高至低排列即得到最終重排序結果;優(yōu)選地,采用Condorect融合方法對得到的多個重排序結果進行融合,具體包括:Condorect融合是采用少數(shù)服從多數(shù)的投票機制;在每次迭代過程中,選擇一張圖像,上述圖像滿足如下條件:該圖像與其它圖像成對比較排名,如果該圖像在重排序結果中的排名比其它圖像都靠前,則選取該幅圖像加入融合后圖像序列,同時將此圖像從候選圖像集中去除;在下一次迭代過程中,按照上述過程和方法再選取一張圖像加入融合后圖像集;如此得到最終重排序結果;優(yōu)選地,采用RRF融合方法對得到的多個重排序結果進行融合,具體包括:RRF融合方法將每幅圖像按照如下公式從多個重排序結果R中計算出該幅圖像的排序分數(shù),所述公式為:其中,r(Ii)為圖像Ii在某個重排序結果r中的排序位置;將每幅圖像按照RRFscore的大小降序排序即得到最終重排序結果。如圖2所示,圖2為本發(fā)明提出的一種基于排列融合的圖像檢索重排序系統(tǒng)。參照圖2,本發(fā)明提出的基于排列融合的圖像檢索重排序系統(tǒng),包括:搜索模塊,用于在搜索引擎上根據(jù)請求查詢文本Q得到基于請求查詢文本Q的初始檢索結果L;特征提取模塊,用于提取所述初始檢索結果L中每幅圖像的視覺特征,并計算出所述初始檢索結果L中每幅圖像與其它圖像的相似度;具體包括:對初始檢索結果L={I1,I2,...,IN}中的圖像Ii提取基于深度卷積神經(jīng)網(wǎng)絡的特征,將其表示成一個特征向量;優(yōu)選地,采用在ImageNetILSVRC-2012數(shù)據(jù)集上訓練好的卷積神經(jīng)網(wǎng)絡;將圖片Ii輸入該網(wǎng)絡,提取第七層全連接層的4096維特征k=1,...,4096,再將上述特征通過下述公式進行歸一化,得到Ii的特征向量xi:其中,K是特征的維數(shù)且K=4096;由于特征的維數(shù)K較高,因此需對特征進行降維處理,優(yōu)選地,采用PCA對特征進行降維處理;優(yōu)選地,計算所述初始檢索結果L中兩幅圖像Ii和Ij的相似度具體包括:計算兩幅圖像Ii和Ij對應特征向量間的卡方距離dij:兩幅圖像Ii和Ij的相似度sij按如下公式計算:其中,λ=0.5。降噪處理模塊,用于根據(jù)所述初始檢索結果L中每幅圖像與其它圖像的相似度對所述初始檢索結果L進行降噪處理,并得到檢索圖像列表L′;降噪處理模塊具體包括根據(jù)所述初始檢索結果L中每幅圖像與其它圖像的相似度對所述初始檢索結果L進行降噪處理,并得到檢索圖像列表L′;優(yōu)選地,采用基于相似度加權和的降噪方法對所述初始檢索結果L進行降噪處理,上述降噪方法具體包括:通過公式計算所述初始檢索結果L中的每幅圖像Ii與所述初始檢索結果L中其它圖像的相似度加權以及圖像Ii的置信分數(shù)ci,所述公式為:其中,N為所述初始檢索結果L中圖像的幅數(shù),sij為圖像Ii和圖像Ij之間的相似度,μj為加權系數(shù),且圖像Ij在所述初始檢索結果L中的排序越靠前μj越大;優(yōu)選地,采用基于視覺降序的降噪方法對所述初始檢索結果L進行降噪處理,上述降噪方法具體包括:基于視覺排序的降噪方法是利用視覺排序模型來計算每幅圖像的置信分數(shù);置信分數(shù)向量c=[c1,c2,L,cN]T中的ci對應所述初始檢索結果L中第i圖像Ij的置信分數(shù),且置信分數(shù)通過下式迭代求解;c=d(S*×c)+(1-d)p;其中,c的初值設置為1/N,d為平衡參數(shù)且d=0.85,S*為對相似性矩陣S做列歸一化得到的矩陣;將上式迭代達到穩(wěn)定的結果c作為每幅圖像的置信分數(shù),且置信分數(shù)越高表明圖像與請求查詢文本Q的相關性越高,則將所述初始檢索結果L中的圖像按照置信分數(shù)從高至低進行排序,得到檢索圖像列表L′。重排序模塊,用于從所述檢索圖像列表L′中選取一個或多個種子點圖像,并采用基于圖的重排序方法對所述檢索圖像列表L′中的圖像進行重排序得到重排序結果;其中,重排序模塊從所述檢索圖像列表L′中選取一個種子點圖像時,采用基于圖的重排序方法對所述檢索圖像列表L′中的圖像進行重排序得到重排序結果;重排序模塊從所述檢索圖像列表L′中選取多個種子點圖像時,采用基于圖的重排序方法對所述檢索圖像列表L′中的圖像進行重排序得到多個重排序結果,并對上述得到的多個重排序結果進行融合,得到最終重排序結果。當所述重排序模塊從所述檢索圖像列表L′中選取多個種子點圖像,采用基于圖的重排序方法對所述檢索圖像列表L′中的圖像進行重排序得到多個重排序結果,并對上述得到的多個重排序結果進行融合,得到最終重排序結果;優(yōu)選地,采用Borda融合方法對得到的多個重排序結果進行融合,具體包括:Borda融合是將重排序結果轉化成分數(shù)后再進行融合;重排序結果中排序越靠前的圖像,分數(shù)越高;具體地,重排序結果中排序為R的圖像的分數(shù)s為:其中,N為重排序結果中圖像的總數(shù)量;對每幅圖像計算出其在多個重排序結果中的分數(shù)總和,分數(shù)總和越高表明該圖像與請求查詢文本Q的相關度越高;將每幅圖像按照分數(shù)總和從高至低排列即得到最終重排序結果;優(yōu)選地,采用Condorect融合方法對得到的多個重排序結果進行融合,具體包括:Condorect融合是采用少數(shù)服從多數(shù)的投票機制;在每次迭代過程中,選擇一張圖像,上述圖像滿足如下條件:該圖像與其它圖像成對比較排名,如果該圖像在重排序結果中的排名比其它圖像都靠前,則選取該幅圖像加入融合后圖像序列,同時將此圖像從候選圖像集中去除;在下一次迭代過程中,按照上述過程和方法再選取一張圖像加入融合后圖像集;如此得到最終重排序結果;優(yōu)選地,采用RRF融合方法對得到的多個重排序結果進行融合,具體包括:RRF融合方法將每幅圖像按照如下公式從多個重排序結果R中計算出該幅圖像的排序分數(shù),所述公式為:其中,r(Ii)為圖像Ii在某個重排序結果r中的排序位置;將每幅圖像按照RRFscore的大小降序排序即得到最終重排序結果。本實施方式中基于排序融合的圖像檢索重排序方法,該方法首先對初始檢索結果進行降噪處理得到降噪后的排序結果,再對上述降噪后的排序結果進行基于圖的重排序;如此,先對初始檢索結果作了降噪處理后再對其進行基于圖的重排序,有效地降低了重排序結果的不穩(wěn)定性;進一步地,提出了兩種對初始結果進行降噪的方法,可以有效地從初始檢索結果中將與請求查詢文本相關的圖像排在前面,提升后續(xù)基于圖的重排序中種子點圖像的查詢相關度,保證重排序結果的穩(wěn)定性和準確性;同時,提出了三種對多個重排序結果進行融合的方法,上述方法通過對多個重排序結果進行融合再得到最終重排序結果,提升了最終重排序結果的穩(wěn)定性,進一步保障本發(fā)明提出的重排序方法的穩(wěn)定性和準確度。為驗證本實施方式提出的方案的可行性和穩(wěn)定性,針對性的進行了多次實驗;實驗結果如表1-表4所示,表中標記的含義如下:MAP@T是指排序前T的圖像的平均正確率,是衡量圖像排序結果的公認標準,它們的取值范圍都在[0,1]之間,值越大表示排序效果越好。具體來說:1)對降噪方法進行了對比實驗:對比初始檢索結果、基于相似度加權和的降噪結果和基于視覺排序的降噪結果,實驗結果請參見表1。從表1可以發(fā)現(xiàn),通過對初始檢索結果進行降噪,可以有效提升排序效果。表1基于相似度加強和的降噪方法和基于視覺排序的降噪方法比較結果2)對基于圖的重排序方法進行了對比實驗:比較初始檢索結果、基于圖的重排序結果(策略1)、先用基于相似度加權和的降噪后再用基于圖的重排序結果(策略2),和先用基于視覺排序的降噪后再用基于圖的重排序結果(策略3),實驗結果請參見表2。從表2可以發(fā)現(xiàn),基于圖的重排序結果比初始檢索結果好,先去噪再重排序比單獨重排序的效果好。MAP@T初始檢索結果策略1策略2策略350.6110.6700.7730.794100.5530.6640.7540.767200.5030.6550.7280.739400.4520.6390.6890.694600.4310.6290.6670.671800.4260.6270.6560.6601000.4310.6340.6570.662ALL0.5690.7150.7360.740表2基于圖的重排序結果、先用基于相似度加權和的降噪后再用基于圖的重排序結果和先用基于視覺排序的降噪后再用基于圖的重排序結果比較3)對融合排序方法進行了對比實驗:比較了三種不同融合策略的重排序結果,實驗結果請參見表3。從表3可以發(fā)現(xiàn),融合排序比單獨排序效果好,三種融合策略效果相差不大,Borda和RRF略好于Condorect方法。表3三種不同融合策略的重排序結果比較4)利用本發(fā)明的方案與現(xiàn)有技術的方案進行了對比。對比結果如表4。表4的數(shù)據(jù)表明,本發(fā)明的重排序結果高于其它任何對比方法,可以得出本發(fā)明方法具有更好的重排序效果。表4本發(fā)明技術方案與現(xiàn)有技術方案的對比結果以上所述,僅為本發(fā)明較佳的具體實施方式,但本發(fā)明的保護范圍并不局限于此,任何熟悉本
技術領域:
的技術人員在本發(fā)明揭露的技術范圍內,根據(jù)本發(fā)明的技術方案及其發(fā)明構思加以等同替換或改變,都應涵蓋在本發(fā)明的保護范圍之內。當前第1頁1 2 3