專利名稱:基于先驗(yàn)知識(shí)的圖像檢索方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種圖像檢索方法,特別涉及一種基于先驗(yàn)知識(shí)的圖像檢索方法,屬于基于內(nèi)容的圖像檢索領(lǐng)域。
背景技術(shù):
隨著計(jì)算機(jī)和互聯(lián)網(wǎng)的普及,多媒體技術(shù)的迅速發(fā)展,網(wǎng)絡(luò)上涌現(xiàn)出大量的圖像、音頻和視頻資源。這些在給人們提供便利和豐富人們精神生活的同時(shí),也給人們提出了新的研究課題如何從浩繁的多媒體資源中快速準(zhǔn)確地查找出用戶請(qǐng)求的資源。目前,常用的圖像檢索技術(shù)是基于內(nèi)容的圖像檢索。在基于內(nèi)容的圖像檢索領(lǐng)域中,圖像特征度量作為衡量圖像相似度的關(guān)鍵步驟,對(duì)最終圖像檢索結(jié)果的好壞起著至關(guān)重要的作用。因此,尋找一個(gè)好的距離度量方法對(duì)于研究基于內(nèi)容的圖像檢索來(lái)說(shuō)意義重大。由于圖像背景千差萬(wàn)別,特別是柔性物體的結(jié)構(gòu)容易發(fā)生形變,這些都會(huì)影響到從圖像中提出的特征向量,在此基礎(chǔ)上進(jìn)行距離度量就會(huì)降低圖像的檢索精度?;趦?nèi)容的圖像檢索方法,首先是分析圖像庫(kù)中圖像的特征,提取能反映該圖像內(nèi)容的特征向量,存入相應(yīng)的特征庫(kù)中。在進(jìn)行圖像檢索時(shí),對(duì)每一幅給定的測(cè)試圖像,分析圖像特征并提取能反映該圖像內(nèi)容的特征向量;然后將提取到的特征向量與特征庫(kù)中的特征向量進(jìn)行匹配,根據(jù)匹配結(jié)果到圖像庫(kù)中搜索,就可以得到與之最相似的圖像。其中特征向量匹配的過(guò)程常利用特征向量之間的距離來(lái)進(jìn)行相似性度量,而常用的距離有歐式距離、加權(quán)歐式距離、明氏距離等等。這些距離函數(shù)的優(yōu)點(diǎn)在于所有的參數(shù)和數(shù)據(jù)都是提前設(shè)定或從圖像中直接提取得到,因此使用方便、計(jì)算簡(jiǎn)單。但是它們的缺點(diǎn)也同樣明顯由于未考慮先驗(yàn)知識(shí),檢索結(jié)果往往會(huì)不盡如人意。目前的基于內(nèi)容的圖像特征檢索與相似度量算法都很難在效率和效果中取得一個(gè)平衡,而這個(gè)問(wèn)題又是基于內(nèi)容的圖像檢索領(lǐng)域中的一個(gè)重要的關(guān)鍵問(wèn)題。由于這個(gè)問(wèn)題的存在,阻礙了基于內(nèi)容的圖像檢索的廣泛應(yīng)用。
發(fā)明內(nèi)容
本發(fā)明的目的是為了克服已有圖像特征度量方法存在的不足,提出基于先驗(yàn)知識(shí)的圖像檢索方法。本發(fā)明的目的是通過(guò)下述技術(shù)方案實(shí)現(xiàn)的。一種基于先驗(yàn)知識(shí)的圖像檢索方法,其操作步驟如下包括訓(xùn)練過(guò)程和測(cè)試過(guò)程。所述訓(xùn)練過(guò)程包括步驟一至步驟三,具體為步驟一、建立視覺(jué)詞匯表。依次對(duì)訓(xùn)練數(shù)據(jù)集中的每類圖像進(jìn)行分析處理,為每類圖像建立一個(gè)視覺(jué)詞匯表。使用一個(gè)類別的圖像建立該類別圖像的視覺(jué)詞匯表的具體步驟為步驟1.1 :獲取訓(xùn)練數(shù)據(jù)集中該類別圖像中各張圖像的特征向量,用符號(hào)(fi, f2, · · · , fn)表示,其中,......、4分別表示圖像的一個(gè)特征,η表示特征向量中特
征的個(gè)數(shù);所述特征是多維的,其維度用N表示,N > 2。所述獲取訓(xùn)練數(shù)據(jù)集中的每張圖像的特征向量的方法包括surf (Speed-up
Robust Features)算法和 sift (Scale Invariant Feature Transform)算法。步驟1. 2 :對(duì)于步驟1.1得到的該類別圖像的特征向量(f\,f2,. . .,fn)中的特征f1; f2, - - - , fn進(jìn)行聚類,得到m個(gè)特征類別,m為正整數(shù);步驟1. 3 :對(duì)于步驟1. 2得到的m個(gè)特征類別,獲取每個(gè)特征類別的單詞。所述每個(gè)特征類別的單詞為該特征類別中全部特征向量聚類的中心點(diǎn)。步驟1. 4 :得到該類別圖像的視覺(jué)詞匯表。所述該類別圖像的視覺(jué)詞匯表由該類別類圖像的各特征類別的單詞組成。步驟二、在步驟一操作的基礎(chǔ)上,統(tǒng)計(jì)每類圖像的單詞分布直方圖。針對(duì)一類圖像,統(tǒng)計(jì)該類別圖像的單詞分布直方圖的具體操作步驟為步驟2.1 :為該類別圖像的視覺(jué)詞匯表中的每個(gè)單詞設(shè)定一個(gè)統(tǒng)計(jì)量,分別用符號(hào)TpTy……、Tm表示,并設(shè)置1\、T2、……、Tm的初始值均為O。步驟2. 2 :依次使用該類別中的每一張圖像的特征向量(f\,f2,. . .,fn)中的每一個(gè)特征與該類別圖像的視覺(jué)詞匯表中的單詞逐一比較,找出距離最短的單詞,并將該單詞對(duì)應(yīng)的統(tǒng)計(jì)量自增I。步驟2. 3:對(duì)統(tǒng)計(jì)量1\、T2、……、Tm進(jìn)行歸一化處理。具體為分別用統(tǒng)計(jì)量!\、T2,……、Tm除以該類別圖像的特征數(shù)總和,得到的結(jié)果分別用T'2、……、τ/。步驟2. 4 :得到該類別圖像的單詞分布直方圖。所述單詞分布直方圖由該類別圖像的視覺(jué)詞匯表中的每個(gè)單詞對(duì)應(yīng)的歸一化后的統(tǒng)計(jì)量T'1、T' 2、……、τ/組成。步驟三、在步驟二操作的基礎(chǔ)上,計(jì)算每個(gè)類別圖像特征對(duì)應(yīng)的特征權(quán)值。對(duì)于一個(gè)類別的圖像,該類別圖像特征對(duì)應(yīng)的特征權(quán)值的計(jì)算方法為步驟3.1:找出該類別圖像的單詞分布直方圖中T' ρ T' 2、……、Tm'中的最大值,用符號(hào)Tmax'表不。步驟3. 2 :在該類圖像的特征向量(f\,f2,. . .,fn)中找到M個(gè)與步驟3.1得到的Tfflax/距離最接近的特征,生成MXN的矩陣,矩陣用符號(hào)AMXN,M值由人為指定,10彡M彡200并且M < η。步驟3. 3:計(jì)算矩陣Amxn中每列數(shù)據(jù)的方差的倒數(shù),分別用符號(hào)0ι、σ2、……、 步驟3. 4 :對(duì)步驟3. 3中所述矩陣Amxn中每列數(shù)據(jù)的方差的倒數(shù)σ ρ σ 2、……、0,進(jìn)行歸一化處理,得到該類別圖像特征對(duì)應(yīng)的特征權(quán)值,分別用COi表示,I < i SN。其
權(quán)利要求
1.一種基于先驗(yàn)知識(shí)的圖像檢索方法,其特征在于其操作步驟如下包括訓(xùn)練過(guò)程和測(cè)試過(guò)程;所述訓(xùn)練過(guò)程包括步驟一至步驟三,具體為步驟一、建立視覺(jué)詞匯表;依次對(duì)訓(xùn)練數(shù)據(jù)集中的每類圖像進(jìn)行分析處理,為每類圖像建立一個(gè)視覺(jué)詞匯表;使用一個(gè)類別的圖像建立該類別圖像的視覺(jué)詞匯表的具體步驟為步驟1.1:獲取訓(xùn)練數(shù)據(jù)集中該類別圖像中各張圖像的特征向量,用符號(hào)(fi, f2) · · · , fn)表示,其中,......、fn分別表示圖像的一個(gè)特征,η表示特征向量中特征的個(gè)數(shù);所述特征是多維的,其維度用N表示,Ν^2;步驟1. 2:對(duì)于步驟1.1得到的該類別圖像的特征向量(f\,f2,. . .,fn)中的特征f1; f2, - - - , fn進(jìn)行聚類,得到m個(gè)特征類別,m為正整數(shù);步驟1. 3 :對(duì)于步驟1. 2得到的m個(gè)特征類別,獲取每個(gè)特征類別的單詞;所述每個(gè)特征類別的單詞為該特征類別中全部特征向量聚類的中心點(diǎn);步驟1. 4 :得到該類別圖像的視覺(jué)詞匯表;所述該類別圖像的視覺(jué)詞匯表由該類別類圖像的各特征類別的單詞組成;步驟二、在步驟一操作的基礎(chǔ)上,統(tǒng)計(jì)每類圖像的單詞分布直方圖;針對(duì)一類圖像,統(tǒng)計(jì)該類別圖像的單詞分布直方圖的具體操作步驟為步驟2.1 :為該類別圖像的視覺(jué)詞匯表中的每個(gè)單詞設(shè)定一個(gè)統(tǒng)計(jì)量,分別用符號(hào)!\、T2 >……、Tm表示,并設(shè)置1\、T2、……、Tm的初始值均為O;步驟2. 2 :依次使用該類別中的每一張圖像的特征向量(f\,f2,. . .,fn)中的每一個(gè)特征與該類別圖像的視覺(jué)詞匯表中的單詞逐一比較,找出距離最短的單詞,并將該單詞對(duì)應(yīng)的統(tǒng)計(jì)量自增I;步驟2. 3:對(duì)統(tǒng)計(jì)量1\、T2、……、Tm進(jìn)行歸一化處理;具體為分別用統(tǒng)計(jì)量!\、T2,……、Tm除以該類別圖像的特征數(shù)總和,得到的結(jié)果分別用T'2、……、T/ ;步驟2.4 :得到該類別圖像的單詞分布直方圖;所述單詞分布直方圖由該類別圖像的視覺(jué)詞匯表中的每個(gè)單詞對(duì)應(yīng)的歸一化后的統(tǒng)計(jì)量T' pT' 2、……、T/組成;步驟三、在步驟二操作的基礎(chǔ)上,計(jì)算每個(gè)類別圖像特征對(duì)應(yīng)的特征權(quán)值;對(duì)于一個(gè)類別的圖像,該類別圖像特征對(duì)應(yīng)的特征權(quán)值的計(jì)算方法為步驟3.1:找出該類別圖像的單詞分布直方圖中T' pT' 2、……、Tm'中的最大值,用符號(hào)Tniax'表示;步驟3. 2 :在該類圖像的特征向量(f\,f2,. . .,fn)中找到M個(gè)與步驟3.1得到的Tmax'距離最接近的特征,生成MXN的矩陣,矩陣用符號(hào)Amxn,M值由人為指定,10≤M≤200并且M≤η ;步驟3. 3:計(jì)算矩陣Amxn中每列數(shù)據(jù)的方差的倒數(shù),分別用符號(hào)0ι、σ2、……、σΝ ;步驟3. 4:對(duì)步驟3. 3中所述矩陣Amxn中每列數(shù)據(jù)的方差的倒數(shù)0ι、σ2、……、σΝ進(jìn)行歸一化處理,得到該類別圖像特征對(duì)應(yīng)的特征權(quán)值,分別用Oi表示,I≤i≤N ;其中,
2.如權(quán)利要求1所述的一種基于先驗(yàn)知識(shí)的圖像檢索方法,其特征在于其步驟一步驟1.1中所述獲取訓(xùn)練數(shù)據(jù)集中的每張圖像的特征向量的方法包括surf算法和sift算法。
全文摘要
本發(fā)明涉及一種基于先驗(yàn)知識(shí)的圖像檢索方法,屬于基于內(nèi)容的圖像檢索領(lǐng)域。本發(fā)明的圖像檢索方法使用加入維度權(quán)值的歐式距離的度量方法,把圖像中的背景部分剔除,只保留用戶關(guān)注的前景內(nèi)容;并降低背景部分的維度權(quán)值,提高前景維度權(quán)值,減少了背景的影響,增加了圖像中的前景對(duì)最后檢索結(jié)果的影響。其檢索過(guò)程為首先提取目標(biāo)圖像的局部特征,然后選取當(dāng)前比較的圖像類別下相應(yīng)的維度權(quán)值,利用加權(quán)歐式距離函數(shù)進(jìn)行相似性度量,最后根據(jù)相似度的大小返回相應(yīng)的圖片。本發(fā)明提出的基于先驗(yàn)知識(shí)的圖像檢索方法與已有基于內(nèi)容的圖像檢索方法相比較,檢索更準(zhǔn)確、效率更高。
文檔編號(hào)G06K9/62GK103064985SQ201310033058
公開(kāi)日2013年4月24日 申請(qǐng)日期2013年1月28日 優(yōu)先權(quán)日2013年1月28日
發(fā)明者陳宇峰, 李鳳霞, 閆高潔, 楊志中, 俞文昌 申請(qǐng)人:北京理工大學(xué)