本發(fā)明屬于圖像檢索技術(shù)領(lǐng)域,具體地說是一種基于角點(diǎn)描述子的圖像檢索方法。
背景技術(shù):
隨著多媒體技術(shù)的發(fā)展和大數(shù)據(jù)時(shí)代的來臨,圖像數(shù)據(jù)爆炸式增長,圖像成為當(dāng)今社會獲取數(shù)據(jù)和交換信息的重要載體,如何從龐大的網(wǎng)絡(luò)圖像數(shù)據(jù)庫中快速有效組織檢索圖像信息,成為人們越來越關(guān)心的問題。圖像檢索技術(shù)具有廣泛的應(yīng)用場景,如商品搜索、圖標(biāo)去重、商標(biāo)注冊、人臉檢索、醫(yī)學(xué)圖像檢索等,具有重要的研究意義。
圖像檢索一般通過提取圖像的顏色、形狀、紋理等視覺特征,在數(shù)據(jù)庫中查詢和檢索圖像特征相近的圖像實(shí)現(xiàn)。經(jīng)過幾十年的發(fā)展,圖像檢索技術(shù)取得了長足的進(jìn)步,也有一些應(yīng)用性的成果,但是現(xiàn)在圖像檢索系統(tǒng)的查詢結(jié)果和人的認(rèn)知判斷差距較大,相似查詢的準(zhǔn)確率依然不能讓人滿意。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于針對上述已有技術(shù)的問題,提出一種基于角點(diǎn)描述子的圖像檢索方法,通過提取圖像角點(diǎn)的局部鄰域特征和空間位置特征實(shí)現(xiàn)角點(diǎn)匹配,通過分析角點(diǎn)匹配的結(jié)果實(shí)現(xiàn)圖像檢索。
為實(shí)現(xiàn)上述目的,本發(fā)明的技術(shù)方案是:一種基于角點(diǎn)描述子的圖像檢索方法,其特征在于包括如下步驟:
(1)輸入查詢圖像i0和圖像數(shù)據(jù)庫s,其中s包含k幅圖像,s={ij},j=1,2,…,k;
(2)角點(diǎn)檢測;對查詢圖像和圖像數(shù)據(jù)庫中的圖像二值化提取邊緣并濾波后利用基于邊緣曲率極大值的方法檢測角點(diǎn);對查詢圖像i0檢測角點(diǎn),得到查詢圖像的角點(diǎn)集合p0={p0u},u=1,2,…,m,對圖像數(shù)據(jù)庫s中的任意一幅圖像ij(j=1,2,…,k)檢測角點(diǎn),得到ij的角點(diǎn)集合pj={pjv},v=1,2,…,n,其中m,n分別是i0和ij的角點(diǎn)數(shù)目;
(3)特征提?。粚0和pj中的每個(gè)角點(diǎn)分別提取局部統(tǒng)計(jì)分布lsd特征flsd,全局統(tǒng)計(jì)分布gsd特征fgsd,將這兩個(gè)特征級聯(lián)起來描述二值圖像角點(diǎn)特征:
f=[w1flsd,w2fgsd]
其中,w1和w2分別為lsd特征和gsd特征的加權(quán)值,這里w2=2w1;
對p0和pj分別得到兩個(gè)角點(diǎn)描述集合f0={f0u},u=1,2,…,m、fj={fjv},v=1,2,…,n;
(4)角點(diǎn)匹配;對p0中任意點(diǎn)p0u,u=1,2,…,m,對應(yīng)特征向量f0u,u=1,2,…,m,pj中任意點(diǎn)pjv,v=1,2,…,n,對應(yīng)特征向量fjv,v=1,2,…,n,計(jì)算p0和pj的距離duv=||f0u-fjv||;設(shè)相似閾值為t,則有當(dāng)duv≤t時(shí)p0u和pjv相似,當(dāng)duv>t時(shí)p0u和pjv不相似;遍歷f0和fj找出最相似的匹配點(diǎn)對,通過基于仿射變換的ransac篩選,消除誤匹配,得到最終角點(diǎn)匹配結(jié)果;
(5)返回結(jié)果;按照查詢圖像和圖像數(shù)據(jù)庫中角點(diǎn)匹配率從大到小的順序依次返回前n幅圖像作為圖像檢索結(jié)果。
所述步驟(3)中局部統(tǒng)計(jì)分布lsd特征flsd的提取方法,包括以下步驟:
對于圖像i的任意角點(diǎn)p,以p為中心,在i中取一個(gè)9*9的矩形區(qū)域,以p為原點(diǎn)劃分1、2、3、4四個(gè)鄰域象限,統(tǒng)計(jì)鄰域象限i的黑色像素的比例并量化得到特征值ri(i=1,2,3,4),將四個(gè)象限的特征值依次級聯(lián)得到描述當(dāng)前點(diǎn)p的特征矢量,該特征矢量定義如下:flsd=(r1,r2,r3,r4)
其中,
其中,s是9*9的矩形鄰域的目標(biāo)像素總數(shù),si是鄰域象限i的目標(biāo)像素的數(shù)目,這里t1=7,t2=16,t3=0.3。
所述步驟(3)中全局統(tǒng)計(jì)分布gsd特征fgsd的提取方法,包括以下步驟:
對于圖像i的任意角點(diǎn)p,以p為原點(diǎn),將i劃分為四個(gè)象限,然后統(tǒng)計(jì)每個(gè)象限的角點(diǎn)數(shù)目占整幅圖像角點(diǎn)總數(shù)的比例,依次級聯(lián)得到全局統(tǒng)計(jì)分布gsd特征;
設(shè)圖像i角點(diǎn)集合c={ct}={(xt,yt)},t=1,2,…,n,n為角點(diǎn)數(shù)目,xt和yt分別是角點(diǎn)ct的橫坐標(biāo)和縱坐標(biāo);任意角點(diǎn)(xt,yt)∈c的全局統(tǒng)計(jì)分布特征計(jì)算如下:
其中,card(*)表示集合元素的數(shù)目,q1t,q2t,q3t,q4t分別是以角點(diǎn)(xt,yt)∈c為原點(diǎn)劃分的1,2,3,4四個(gè)象限中的點(diǎn)集集合:
q1t={(x,y)|(x,y)∈c且x>xt,y≥yt}
q2t={(x,y)|(x,y)∈c且x≤xt,y>yt}
q3t={(x,y)|(x,y)∈c且x<xt,y≤yt}
q4t={(x,y)|(x,y)∈c且x≥xt,y<yt}。
本發(fā)明與現(xiàn)有的技術(shù)相比具有以下優(yōu)點(diǎn):本發(fā)明提出一種基于角點(diǎn)局部統(tǒng)計(jì)分布描述和全局統(tǒng)計(jì)分布描述的圖像檢索技術(shù),在相似圖像匹配中表現(xiàn)出較強(qiáng)的魯棒性,圖像檢索準(zhǔn)確性較高。該描述子也可用于圖像配準(zhǔn)等。
附圖說明
圖1是角點(diǎn)鄰域分析示意圖(p1、p2、p3為標(biāo)示的三個(gè)角點(diǎn));
圖2是關(guān)鍵點(diǎn)位置特征示意圖;
圖3是本發(fā)明圖像檢索方法實(shí)驗(yàn)的pvr曲線。
具體實(shí)施方式
以下參照附圖,對本發(fā)明的技術(shù)方案和效果做進(jìn)一步詳細(xì)描述。
本發(fā)明的實(shí)現(xiàn)步驟如下:
步驟1,輸入查詢圖像i0和目標(biāo)圖像數(shù)據(jù)庫s。
步驟2,角點(diǎn)檢測。對查詢圖像和圖像數(shù)據(jù)庫中的圖像二值化后提取邊緣并濾波,利用基于邊緣曲率極大值的方法檢測角點(diǎn);對查詢圖像i0檢測角點(diǎn),得到查詢圖像的角點(diǎn)集合p0={p0l},l=1,2,…,m,對圖像數(shù)據(jù)庫s中的任意一幅圖像ij(j=1,2,…,k)檢測角點(diǎn),得到ij的角點(diǎn)集合pj={pjv},v=1,2,…,n,其中m,n分別是i0和ij的角點(diǎn)數(shù)目;(橙色是添加的內(nèi)容)
(2.1)邊緣提取。對圖像進(jìn)行二值化操作并提取0-1變化的邊緣曲線。
(2.2)邊緣濾波。通過一維高斯濾波達(dá)到平滑曲線,抑制噪聲的目的。
設(shè)曲線γ的弧長表達(dá)方式為γ(l)=(x(l),y(l)),其中l(wèi)是弧長參數(shù),x,y分別表示曲線上點(diǎn)的橫坐標(biāo)和縱坐標(biāo),x,y都是l的一維函數(shù)。
在尺度σ下,曲線γ表達(dá)為γσ(l)=(x(l,σ),y(l,σ)),為了減小噪聲對角點(diǎn)檢測準(zhǔn)確性的干擾,分別對曲線在兩個(gè)方向進(jìn)行高斯濾波,如下:
其中,g(l,σ)是高斯函數(shù)g(l)在不同的尺度參數(shù)σ下的形式:
(2.3)角點(diǎn)檢測。對經(jīng)過濾波之后的曲線,將符合條件的曲率極大值點(diǎn)作為角點(diǎn)。對于曲線l的參數(shù)方程表示為
如果曲率極大值點(diǎn)t點(diǎn)曲率值大于等于閾值t,即k(t)≥t,則當(dāng)前點(diǎn)是角點(diǎn);如果曲率值小于閾值,即k(t)<t,則該曲率極大值點(diǎn)不是角點(diǎn)。
步驟3,提取角點(diǎn)特征。角點(diǎn)是圖像輪廓突然發(fā)生轉(zhuǎn)折的地方,微觀上,每個(gè)角點(diǎn)具有一定的大小和方向,宏觀上,一組角點(diǎn)集合的分布表示圖像的關(guān)鍵結(jié)構(gòu)分布。對p0和pj中的每個(gè)角點(diǎn)分別提取局部統(tǒng)計(jì)分布lsd特征flsd和全局統(tǒng)計(jì)分布gsd特征fgsd并融合,分別得到p0和pj的角點(diǎn)描述集合f0={f0u},u=1,2,…,m、fj={fjv},v=1,2,…,n。
(3.1)局部統(tǒng)計(jì)分布特征。
每個(gè)尖角都有一定的大小、方向,我們通過角點(diǎn)鄰域的像素分布來描述這些尖角特征。如圖1所示,在每個(gè)角點(diǎn)鄰域取一定大小的block,如圖中在p1、p2、p3附近分別標(biāo)示的紅色窗口所示,假設(shè)將窗口按象限分為1、2、3、4,我們會發(fā)現(xiàn),不同類型的角點(diǎn),每個(gè)窗口的內(nèi)容及排列是不同的。如p1為指向第三象限的黑色銳角,黑色像素只集中在鄰域窗口的第一象限;p2是由3、4象限指向1、2象限的白色鈍角,黑色像素占據(jù)了1、2象限的全部,3、4象限的部分區(qū)域;p3為由2、3象限指向1、4象限的黑色銳角,黑色像素占據(jù)了2、3象限的部分面積。由此可見,每個(gè)角點(diǎn)的特征可以由其周圍區(qū)域的像素分布來表征。我們把這個(gè)特征定義為局部統(tǒng)計(jì)分布特征lsd(localstatisticaldistribution).
對于圖像i的任意角點(diǎn)p,以p為中心,在i中取一個(gè)9*9的矩形區(qū)域,以p為原點(diǎn)劃分1、2、3、4四個(gè)鄰域象限,統(tǒng)計(jì)鄰域象限i的黑色像素的比例并量化得到特征值ri(i=1,2,3,4),將四個(gè)象限的特征值依次級聯(lián)得到描述當(dāng)前點(diǎn)p的特征矢量,該特征矢量定義如下:flsd=(r1,r2,r3,r4),其中,
ri(i=1,2,3,4)分別為鄰域象限i的特征取值,s是9*9的矩形鄰域的目標(biāo)像素總數(shù),si是鄰域象限i的目標(biāo)像素的數(shù)目,這里t1=7,t2=16,t3=0.3。本發(fā)明對角點(diǎn)的特征表達(dá)采用當(dāng)前的量化規(guī)則,描述方式簡單,減小了數(shù)據(jù)量,兼顧多種角點(diǎn)鄰域分布情況,具有良好區(qū)分性。這里采用4個(gè)象限3種量化值,通過大尺度劃分粗量化方式提高特征的魯棒性,從而提高檢索中相似點(diǎn)匹配的魯棒性,增強(qiáng)相似圖片檢索能力。
(3.2)全局統(tǒng)計(jì)分布特征。
對于圖像i的任意角點(diǎn)p,以p為原點(diǎn),將i劃分為四個(gè)象限,然后統(tǒng)計(jì)每個(gè)象限的角點(diǎn)數(shù)目占整幅圖像角點(diǎn)總數(shù)的比例,依次級聯(lián)得到一個(gè)4維的特征向量,描述該角點(diǎn)在圖中的相對位置。我們把這種特征描述稱為全局統(tǒng)計(jì)分布gsd(globalstatisticaldistribution).
設(shè)圖像i角點(diǎn)集合c={ct}={(xt,yt)},t=1,2,…,n,n為角點(diǎn)數(shù)目,xt和yt分別是角點(diǎn)ct的橫坐標(biāo)和縱坐標(biāo);。任意角點(diǎn)(xt,yt)∈c的全局統(tǒng)計(jì)分布特征計(jì)算如下:
其中,q1t,q2t,q3t,q4t分別是以角點(diǎn)(xt,yt)∈c為原點(diǎn)劃分的1,2,3,4四個(gè)象限中的點(diǎn)集集合,card(*)表示相應(yīng)集合中元素的數(shù)目:
q1t={(x,y)|(x,y)∈c且x>xt,y≥yt}
q2t={(x,y)|(x,y)∈c且x≤xt,y>yt}
q3t={(x,y)|(x,y)∈c且x<xt,y≤yt}
q4t={(x,y)|(x,y)∈c且x≥xt,y<yt}
如圖2所示,對角點(diǎn)p1,以其為中心,將整幅圖像劃分為4個(gè)象限,分別計(jì)算每個(gè)象限中角點(diǎn)的數(shù)目比例,得到p1點(diǎn)的特征向量f1=(0.4,0.4,0.1,0.1),從該特征向量可以看出來p1左右兩側(cè)角點(diǎn)分布相對平衡,上側(cè)角點(diǎn)數(shù)目較多,即位于中部偏下的位置,于圖中觀察的結(jié)果一致。對角點(diǎn)p2,以同樣的4象限劃分方式,得到p2的特征向量為f2=(0.2,0.7,0.1,0),可見p2位于接近右下角的位置。通過上述分析,我們發(fā)現(xiàn)該種特征描述方式能夠比較直觀簡單的描述每個(gè)角點(diǎn)在角點(diǎn)點(diǎn)集中的相對位置,推廣到整個(gè)角點(diǎn)集合的描述,那么該種特征描述方式可以表達(dá)整個(gè)角點(diǎn)集合的分布特征。同時(shí),由于該特征描述方式利用了關(guān)鍵點(diǎn)之間的相對位置信息代替絕對位置,圖像的平移對全局統(tǒng)計(jì)分布特征沒有影響,同時(shí)少數(shù)點(diǎn)的大范圍移動(dòng)及多數(shù)點(diǎn)在小范圍內(nèi)的移動(dòng)對全局分布特征影響不明顯,gsd特征是一種非常穩(wěn)定、簡單的空間分布描述子。
綜上所述,我們分別介紹了描述角點(diǎn)信息的兩種統(tǒng)計(jì)分布特征:局部統(tǒng)計(jì)分布特征lsd描述圖像關(guān)鍵點(diǎn)的局部分布,反映圖像的關(guān)鍵結(jié)構(gòu)的特征,表達(dá)細(xì)節(jié)信息;全局統(tǒng)計(jì)分布特征gsd描述圖像關(guān)鍵點(diǎn)的整體分布特征,表達(dá)整體信息。將局部特征和全局特征結(jié)合起來則可以更加全面地描述圖像。
(3.3)兩種特征融合。
角點(diǎn)p的lsd特征為flsd,gsd特征為fgsd,將這兩個(gè)特征級聯(lián)起來可以描述二值圖像角點(diǎn)特征:
f=[w1flsd,w2fgsd]
其中,w1和w2分別為局部統(tǒng)計(jì)分布特征和全局統(tǒng)計(jì)分布特征的加權(quán)值,一般w2=λ·w1,這里λ=2。
步驟4,角點(diǎn)匹配。
(4.1)對p0中任意點(diǎn)p0u,u=1,2,…,m,對應(yīng)特征向量f0u,u=1,2,…,m,pj中任意點(diǎn)pjv,v=1,2,…,n,對應(yīng)特征向量fjv,v=1,2,…,n,計(jì)算p0和pj的距離duv=||f0u-fjv||;設(shè)相似閾值為t,則有當(dāng)duv≤t時(shí)p0u和pjv相似,當(dāng)duv>t時(shí)p0u和pjv不相似;遍歷f0和fj找出最相似的匹配點(diǎn)對作為角點(diǎn)匹配結(jié)果。
(4.2)將上述匹配結(jié)果通過基于仿射變換的ransac篩選,消除誤匹配,得到最終角點(diǎn)匹配結(jié)果。
步驟5,返回結(jié)果。
設(shè)i0和ij兩個(gè)圖像的角點(diǎn)數(shù)目分別為n0和nj,匹配點(diǎn)對數(shù)目為n0j,則二者的匹配率為:
按照查詢圖像和圖像數(shù)據(jù)庫中角點(diǎn)匹配率從大到小的順序依次返回前n幅圖像作為圖像檢索結(jié)果。本發(fā)明效果可以通過以下仿真實(shí)驗(yàn)進(jìn)行驗(yàn)證:
1.實(shí)驗(yàn)條件與方法
硬件平臺為:處理器為intel(r)core(tm)i5-6500cpu@3.20ghz,內(nèi)存(ram)為8.0gb,硬盤1tb,操作系統(tǒng)為microsoftwindows7旗艦版;
軟件平臺:visualstudio2013;
實(shí)驗(yàn)方法:本發(fā)明方法。
2.仿真內(nèi)容與結(jié)果
在上述實(shí)驗(yàn)條件下,選用包含1000幅商標(biāo)圖像的圖像庫進(jìn)行檢索實(shí)驗(yàn),用pvr曲線(查準(zhǔn)率-查全率曲線)來衡量該檢索系統(tǒng)的性能,這里查準(zhǔn)率=返回的相關(guān)圖像數(shù)目/返回總圖像,查全率=返回的相關(guān)圖像的數(shù)目/數(shù)據(jù)庫中相關(guān)圖像的數(shù)目。如圖3是本發(fā)明方法在本文實(shí)驗(yàn)數(shù)據(jù)集實(shí)驗(yàn)的pvr曲線。跟已有的一些圖像檢索算法比較,本發(fā)明的檢索表現(xiàn)較好,具有更強(qiáng)的魯棒性。
本實(shí)施例沒有詳細(xì)敘述的部件和結(jié)構(gòu)屬本行業(yè)的公知部件和常用結(jié)構(gòu)或常用手段,這里不一一敘述。