本發(fā)明涉及計算機視覺任務技術領域,具體涉及基于平穩(wěn)小波變換和亮度序的局部特征描述方法。
背景技術:
圖像局部特征的描述是計算機視覺和模式識別領域中一個基礎熱點問題,其成果已經(jīng)被廣泛應用于目標識別(參見文獻“l(fā)owedg.distinctiveimagefeaturesfromscale-invariantkeypoints[j].internationaljournalofcomputervision,2004,60(2):91-110.”),圖像檢索(參見文獻“yangy,newsams.geographicimageretrievalusinglocalinvariantfeatures[j].ieeetransactionsongeoscienceandremotesensing.2013,51(2):818-832.”),三維重建(參見文獻“furukaway,poncej.accurate,dense,androbustmulti-viewstereopsis[j].ieeetransactionsonpatternanalysisandmachineintelligence,2010,32(8):1362-1376.”),圖像配準(參見文獻“wangsh,youhj,fuk.bfsift:anovelmethodtofindfeaturematchesforsarimageregistration[j].ieeegeoscienceandremotesensingletters,2012,9(4):649-653.”)等眾多領域中。其中,sift(scaleinvariantfeaturetransform)(參見文獻“l(fā)owedg.distinctiveimagefeaturesfromscale-invariantkeypoints[j].internationaljournalofcomputervision,2004,60(2):91-110.”)是最常用的描述子之一,在對比實驗中常常用作基礎算法,gloh(gradientlocationandorientationhistogram)(參見文獻“mikolajczykk,schmidc.aperformanceevaluationoflocaldescriptors[j].ieeetransactionsonpatternanalysisandmachineintelligence,2005,27(10):1615-1630.”)和daisy(參見文獻“tolae,lepetitv,fuap.daisy:anefficientdensedescriptorappliedtowide-baselinestereo[j].ieeetransactionsonpatternanalysisandmachineintelligence,2010,32(5):815-830.”)描述子是兩種sift描述子的延伸擴展算法。這些算法僅能保證對圖像幾何變換和線性亮度變化具有一定的不變性,然而圖像局部區(qū)域的亮度變化通常不是線性的,圖像局部區(qū)域的非線性亮度變化(如單調亮度變化)往往導致上述描述子性能急劇下降。
針對圖像非線性亮度變化問題,基于像素點相對序和對比關系的描述子已經(jīng)被提出。文獻(參見文獻“tangf,limsh,changnl,etal.anovelfeaturedescriptorinvarianttocomplexbrightnesschanges[c].proceedingsofieeeconferenceoncomputervisionandpatternrecognition,miamifl,usa:ieeepress,2009:2631-2638.”)提出了osid(ordinalspatialintensitydistribution)描述子,其利用亮度序和空間序構建三維直方圖,統(tǒng)計三維直方圖便得到一種魯棒性較強的亮度不變局部特征描述子。文獻(參見文獻“wangz,fanb,wuf.localintensityorderpatternforfeaturedescription[c].proceedingsofieeeinternationalconferenceoncomputervision,washingtond.c.,usa:ieeepress,2011:603-610.”)提出了liop(localintensityorderpattern)描述子,該描述子利用亮度序對支持區(qū)域進行劃分,進而在劃分的子區(qū)域上建立特征直方圖,其優(yōu)勢是不需要計算局部區(qū)域的主方向。文獻(參見文獻“ojalat,pietikainenm,maenpaat.multiresolutiongray-scaleandrotationinvarianttextureclassificationwithlocalbinarypatterns[j].ieeetransactionsonpatternanalysisandmachineintelligence,2002,24(7):971-987.”)利用每個像素點與其鄰域點之間的對比關系來構建lbp(localbinarypattern)描述子。文獻(參見文獻“
技術實現(xiàn)要素:
本發(fā)明根據(jù)上述現(xiàn)有技術中存在的問題,提供基于平穩(wěn)小波變換和亮度序的局部特征描述方法。利用多支持區(qū)域來構造描述子可獲得比單支持區(qū)域更好的匹配準確率,保證所構造的局部特征描述子對非線性亮度變化具有不變性和較強的魯棒性。
為解決上述問題,本發(fā)明采用的技術方案是:基于平穩(wěn)小波變換和亮度序的局部特征描述方法,其特征在于,包括:
利用hessian-affine算子檢測仿射協(xié)變區(qū)域;
利用平穩(wěn)小波變換對檢測區(qū)域進行分解,獲得不同尺度的多支持區(qū)域;
利用亮度序對支持區(qū)域進行劃分,得到互不重疊的子區(qū)域;
利用三值模式策略在局部旋轉不變坐標系下計算局部特征描述子。
進一步地,所述利用hessian-affine算子檢測仿射協(xié)變區(qū)域;具體為:采用hessian-affine算子進行區(qū)域檢測并進行預處理和歸一化處理;其中區(qū)域檢測為橢圓形區(qū)域,對該橢圓形區(qū)域進行預處理和歸一化處理,得到支持區(qū)域。
優(yōu)選的,所述橢圓形區(qū)域為雙線性插值構成的大小為41×41像素的檢測區(qū)域。
進一步地,所述利用平穩(wěn)小波變換對檢測區(qū)域進行分解,獲得不同尺度的多支持區(qū)域;具體為:采用平穩(wěn)小波變換對歸一化處理的檢測區(qū)域進行分解,產(chǎn)生不同尺度的n個低頻圖像作為多支持區(qū)域;令uk為一信號序列,則其swt分解為:
其中,h和g是正交濾波器,a0=uk,h[0]=h,g[0]=g。
進一步地,所述利用亮度序對支持區(qū)域進行劃分,得到互不重疊的子區(qū)域;具體為:
設r是一個支持區(qū)域,將r內所有像素點進行非降排序:
{xf(1),xf(2),l,xf(n):i(xf(1))≤i(xf(2))≤l≤i(xf(n))}
其中x1,x2,l,xn是該支持區(qū)域內n個像素點,i(x1),i(x2),l,i(xn)表示像素點x1,x2,l,xn對應的像素點亮度值,f(1),f(2),l,f(n)是1,2,l,n的一個排列;等間距選取k+1個亮度值t1,t2,ltk:
其中
根據(jù)所選取的ti值將r劃分為k個子區(qū)域:
ri={xj∈r:ti-1≤i(xj)≤ti},i=1,2,l,k。
進一步地,所述利用三值模式策略在局部旋轉不變坐標系下計算局部特征描述子,具體包括:
對于任意像素點xi∈rk,首先建立旋轉不變坐標系,其中s是利用hessian-affine算子獲取的特征點,
其中,
令
其中,l=1,2,l,9;則像素點xi可以描述為:
f(xi)=(f1,f2,f3,f4,f6,f7,f8,f9);
子區(qū)域rk的描述向量可以表達為:
單支持區(qū)域r上的描述向量可以表示為:
d(r)=(f(r1),f(r2),l,f(rk));
在n個支持區(qū)域上的描述向量可以表示為:
d=(d1,d2,l,dn);
其中dn是第n個支持區(qū)域上的描述向量。
進一步地,所述局部特征描述子為8*k*n維向量,對d進行歸一化后其每個元素的值不大于0.2。
與現(xiàn)有技術相比,本發(fā)明具有以下優(yōu)點:
1、通過利用swt分解獲得多個支持區(qū)域,使得該支持區(qū)域具有一定的方向性和尺度性,有效的反映區(qū)域的紋理信息,保證了描述子的魯棒性;
2、本發(fā)明利用亮度序進行區(qū)域劃分,其最大的優(yōu)勢是不需要計算支持區(qū)域的主方向,不僅提高了算法的時間效率,而且確保了所構造描述子的單調亮度變化不變性;
3、本發(fā)明在局部旋轉不變坐標系下計算局部特征描述子,確保了所構造描述子的旋轉不變性;
4、本發(fā)明通過利用三值模式策略來描述子局部區(qū)域,進一步提高了局部特征描述子的鑒別力。
附圖說明
圖1為本發(fā)明提出基于平穩(wěn)小波變換和亮度序的局部特征描述方法流程圖;
圖2為本發(fā)明提出的利用平穩(wěn)小波變換獲得四個支持區(qū)域的示例圖;
圖3為本發(fā)明利用亮度序將支持區(qū)域劃分為6個相互獨立子區(qū)域的示例圖;
圖4為本發(fā)明一實施方式的所使用的局部旋轉不變坐標系的示意圖。
具體實施方式
下面詳細描述本發(fā)明的實施方式,所述實施方式的示例在附圖中示出,其中自始至終相同或類似的標號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附圖描述的實施方式是示例性的,僅用于解釋本發(fā)明,而不能解釋為對本發(fā)明的限制。
本技術領域技術人員可以理解,除非特意聲明,這里使用的單數(shù)形式“一”、“一個”、“所述”和“該”也可包括復數(shù)形式。應該進一步理解的是,本發(fā)明的說明書中使用的措辭“包括”是指存在所述特征、整數(shù)、步驟、操作、元件和/或組件,但是并不排除存在或添加一個或多個其他特征、整數(shù)、步驟、操作、元件、組件和/或它們的組。應該理解,當本發(fā)明稱元件被“連接”或“耦接”到另一元件時,它可以直接連接或耦接到其他元件,或者也可以存在中間元件。此外,這里使用的“連接”或“耦接”可以包括無線連接或耦接。這里使用的措辭“和/或”包括一個或更多個相關聯(lián)的列出項的任一單元和全部組合。
本技術領域技術人員可以理解,除非另外定義,這里使用的所有術語(包括技術術語和科學術語)具有與本發(fā)明所屬領域中的普通技術人員的一般理解相同的意義。還應該理解的是,諸如通用字典中定義的那些術語應該被理解為具有與現(xiàn)有技術的上下文中的意義一致的意義,并且除非像這里一樣定義,不會用理想化或過于正式的含義來解釋。
本技術領域技術人員可以理解,除非另外定義,這里使用的所有術語(包括技術術語和科學術語)具有與本發(fā)明所屬領域中的普通技術人員的一般理解相同的意義。還應該理解的是,諸如通用字典中定義的那些術語應該被理解為具有與現(xiàn)有技術的上下文中的意義一致的意義,并且除非像這里一樣定義,不會用理想化或過于正式的含義來解釋。
本發(fā)明的方法綜合利用了平穩(wěn)小波變換在分解圖像信息的有效性、尺度性和亮度序在區(qū)域劃分時的單調亮度不變性。需要特別指出的是,常見的局部特征描述子(如sift描述子)為了獲得旋轉不變性,必須計算區(qū)域的主方向并按照該方向將局部區(qū)域進行校正,而本發(fā)明不需要計算計算區(qū)域主方向,不僅大大提高了本發(fā)明方法的時間效率,而且減少了因計算區(qū)域主方向所帶來的誤差。此外,本發(fā)明通過利用三值模式來描述局部區(qū)域,比傳統(tǒng)的二值模式(如cslbp描述子)更能精確反映圖像像素點之間的大小關系,并且大大降低了描述向量的維數(shù)。
本發(fā)明的方法在oxford標準數(shù)據(jù)庫上進行了測試,該方法在圖像模糊變化、視角變化、線性亮度變化和jpeg壓縮變化下表現(xiàn)出較好的性能,特別在包含豐富紋理信息的圖像序列集下表現(xiàn)更佳。
參見圖1為本發(fā)明一實施方式的局部特征描述方法流程圖。
如圖1所示,本發(fā)明提供一種基于平穩(wěn)小波變換和亮度序的局部特征描述方法,包括:利用hessian-affine算子檢測仿射協(xié)變區(qū)域;利用平穩(wěn)小波變換對檢測區(qū)域進行分解,獲得不同尺度的多支持區(qū)域;利用亮度序對支持區(qū)域進行劃分,得到互不重疊的子區(qū)域;利用三值模式策略在局部旋轉不變坐標系下計算局部特征描述子。
圖2示出了根據(jù)本發(fā)明一實施方式的利用平穩(wěn)小波變換獲得四個支持區(qū)域的示例圖。
如圖2所示,本發(fā)明利用平穩(wěn)小波對歸一化區(qū)域進行分解,得到四個不同尺度和方向的低頻圖像作為多支持區(qū)域,支持區(qū)域的大小與歸一化區(qū)域一致。
圖3示出了根據(jù)本發(fā)明一實施方式的利用亮度序將支持區(qū)域劃分為6個相互獨立子區(qū)域的示例圖。
圖3分別示出了區(qū)域劃分策略和6個劃分后的子區(qū)域,6個子區(qū)域相互獨立不重疊并完整的將支持區(qū)域進行劃分。
圖4為本發(fā)明一實施方式的所使用的局部旋轉不變坐標系的示意圖。如圖4所示,是利用hessian-affine算子獲取的特征點,是像素點在該坐標系下給定半徑圓上等間距分布的8個鄰域點;該坐標系本質上是旋轉不變的,并保證本發(fā)明方法的旋轉不變性。
1、基于平穩(wěn)小波變換的多支持區(qū)域
現(xiàn)有的局部特征描述子大都在單支持區(qū)域內構造的,然而單一的支持區(qū)域不足以確保圖像局部特征描述子的穩(wěn)定性。較常用的多支持區(qū)域策略是n嵌套的多支持區(qū)域[13],但該策略僅僅體現(xiàn)關鍵區(qū)域的空間信息而忽略頻率等重要信息。相對于二維離散小波,平穩(wěn)小波在變換的過程中不存在下采樣操作,具有平移不變性(參見文獻“fanb,wuf,huz.rotationallyinvariantdescriptorsusingintensityorderpooling[j].ieeetransactionsonpatternanalysisandmachineintelligence,2012,34(10):2031-2045.”),其輸出的高低頻圖像與原始圖像大小一致,保留了原始圖像的空間信息,因此利用swt來獲取n個支持區(qū)域。令uk為一信號序列,則其swt分解為:
其中,h和g是正交濾波器,a0=uk,h[0]=h,g[0]=g。
2、基于亮度序的區(qū)域劃分
利用亮度序進行區(qū)域劃分是最近較為常用的方法(參見文獻“wangz,fanb,wuf.localintensityorderpatternforfeaturedescription[c].proceedingsofieeeinternationalconferenceoncomputervision,washingtond.c.,usa:ieeepress,2011:603-610.”,“fanb,wuf,huz.rotationallyinvariantdescriptorsusingintensityorderpooling[j].ieeetransactionsonpatternanalysisandmachineintelligence,2012,34(10):2031-2045.”),其最大的優(yōu)勢是不需要計算支持區(qū)域的主方向,不僅提高了算法的時間效率,而且確保了所構造描述子的旋轉不變性和單調亮度變化不變性。若r是一個支持區(qū)域,首先,將r內所有像素點進行非降排序:
{xf(1),xf(2),l,xf(n):i(xf(1))≤i(xf(2))≤l≤i(xf(n))}
(2)
其中x1,x2,l,xn是該支持區(qū)域內n個像素點,i(x1),i(x2),l,i(xn)表示像素點x1,x2,l,xn對應的像素點亮度值,f(1),f(2),l,f(n)是1,2,l,n的一個排列。
其次,等間距選取k+1個亮度值t1,t2,ltk:
其中
最后,根據(jù)所選取的ti值將r劃分為k個子區(qū)域:
ri={xj∈r:ti-1≤i(xj)≤ti},i=1,2,l,k(4)
3、局部特征描述
對于任意像素點xi∈rk,首先建立旋轉不變坐標系(參見文獻“fanb,wuf,huz.rotationallyinvariantdescriptorsusingintensityorderpooling[j].ieeetransactionsonpatternanalysisandmachineintelligence,2012,34(10):2031-2045.”),如圖4所示,其中s是利用hessian-affine算子獲取的特征點,
其中,
若令
其中,l=1,2,l,9;則像素點xi可以描述為:
f(xi)=(f1,f2,f3,f4,f6,f7,f8,f9)(7)
由公式(7)可知,f(xi)中不包含f5,當f5=1時,則有pr,t(xi)=4,由公式(5)可推出
在單支持區(qū)域r上的描述向量可以表示為:
d(r)=(f(r1),f(r2),l,f(rk))(9)
則在n個支持區(qū)域上的描述向量為:
d=(d1,d2,l,dn)(10)
其中dn是第n個支持區(qū)域上的描述向量??芍撁枋鲎邮?×k×n維向量。最后對d進行歸一化使其每個元素的值不大于0.2,以減少其較大元素的影響。
本發(fā)明提供的基于平穩(wěn)小波變換和亮度序的局部特征描述方法,具有以下優(yōu)點:1、通過利用swt分解獲得多個支持區(qū)域,使得該支持區(qū)域具有一定的方向性和尺度性,有效的反映區(qū)域的紋理信息,保證了描述子的魯棒性;2、本發(fā)明利用亮度序進行區(qū)域劃分,其最大的優(yōu)勢是不需要計算支持區(qū)域的主方向,不僅提高了算法的時間效率,而且確保了所構造描述子的單調亮度變化不變性;3、本發(fā)明在局部旋轉不變坐標系下計算局部特征描述子,確保了所構造描述子的旋轉不變性;4、本發(fā)明通過利用三值模式策略來描述子局部區(qū)域,進一步提高了局部特征描述子的鑒別力。
本技術領域技術人員可以理解,本發(fā)明可以涉及用于執(zhí)行本申請中所述操作中的一項或多項操作的設備。其中設備可以為所需的目的而專門設計和制造,或者也可以包括通用計算機中的已知設備,所述通用計算機有存儲在其內的程序選擇性地激活或重構。這樣的計算機程序被存儲在設備(例如,計算機)可讀介質中或者存儲在適于存儲電子指令并分別耦聯(lián)到總線的任何類型的介質中,所述計算機可讀介質包括但不限于任何類型的盤(包括軟盤、硬盤、光盤、cd-rom、和磁光盤)、隨即存儲器(ram)、只讀存儲器(rom)、電可編程rom、電可擦rom(eprom)、電可擦除可編程rom(eeprom)、閃存、磁性卡片或光線卡片。可讀介質包括用于以由設備(例如,計算機)可讀的形式存儲或傳輸信息的任何機構。例如,可讀介質包括隨即存儲器(ram)、只讀存儲器(rom)、磁盤存儲介質、光學存儲介質、閃存裝置、以電的、光的、聲的或其他的形式傳播的信號(例如載波、紅外信號、數(shù)字信號)等。
本技術領域技術人員可以理解,可以用計算機程序指令來實現(xiàn)這些結構圖和/或框圖和/或流圖中的每個框以及這些結構圖和/或框圖和/或流圖中的框的組合??梢詫⑦@些計算機程序指令提供給通用計算機、專業(yè)計算機或其他可編程數(shù)據(jù)處理方法的處理器來生成機器,從而通過計算機或其他可編程數(shù)據(jù)處理方法的處理器來執(zhí)行的指令創(chuàng)建了用于實現(xiàn)結構圖和/或框圖和/或流圖的框或多個框中指定的方法。
本技術領域技術人員可以理解,本發(fā)明中已經(jīng)討論過的各種操作、方法、流程中的步驟、措施、方案被交替、更改、組合或刪除。進一步地,具有本發(fā)明中已經(jīng)討論過的各種操作、方法、流程中的其他步驟、措施、方案也被交替、更改、重排、分解、組合或刪除。進一步地,現(xiàn)有技術中的具有與本發(fā)明中公開的各種操作、方法、流程中的步驟、措施、方案也被交替、更改、重排、分解、組合或刪除。
以上所述僅是本發(fā)明的部分實施方式,應當指出,對于本技術領域的普通技術人員來說,在不脫離本發(fā)明原理的前提下,還可以做出若干改進和潤飾,這些改進和潤飾也應視為本發(fā)明的保護范圍。