亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

圖像識別方法、圖像識別裝置以及圖像識別程序的制作方法

文檔序號:6456387閱讀:397來源:國知局

專利名稱::圖像識別方法、圖像識別裝置以及圖像識別程序的制作方法
技術領域
:本發(fā)明涉及一種使用描述圖像局部特征的局部描述符來進行圖像識別的圖像識別方法、使用局部描述符來進行圖像識別的圖像識別裝置以及圖像識別程序。
背景技術
:伴隨著數(shù)碼照相機、帶照相機的手機的普及,不僅是簡單地拍攝快照(snapshot),還想利用照相機作為信息輸入設備的需求增強。作為可能性之一,考慮識別由照相機捕捉到的物體并進行與其相應的信息處理。不得不說不設任何限制地識別物體還很困難,但是隨著近年來的技術發(fā)展,如果能夠對對象加以限制,則物體識別現(xiàn)實可行。例如如果能夠假定對象不是三維物體而是平面上的圖案(平面物體)、不是識別物體的類(class)(例如照片上的物體是否屬于車類(category))而是識別實例(instance)(是否為從某個角度拍攝某一車型得到的照片)等,則已經(jīng)處于能夠服務的水平。例如,已知有利用抹式會社Clementec技術(US.PatentNo.20040208372)的大日本印刷林式會社的服務、奧林巴斯纟朱式會^土的月良務、利用EvolutionRobotics,Inc.才支術的日本電氣才朱式會社的服務等。如果能夠進行這種平面物體的識別,則不僅通過拍攝海報、商品照片來進行引導,還打開附帶已有圖像、視頻的自動索引的道路。然而,為了進行物體識別需要從圖像中提取特征。在本發(fā)明中著眼于以平面物體為對象的4吏用局部描述符(localdescriptor)的識別。局部描述符是指捕捉圖像的局部特征并提取其作為多維特征向量來描述圖像的描述符。局部地決定值,因此具有對隱藏、圖像變動較強(魯棒)的性質。在此,"局部"意味著圖像的一部分,"局部描述符"是指表現(xiàn)圖像的部分特征的描述符。本說明書中局部描述符還稱作特征向量。在使用局部描述符的物體識別法中,測量從兩個圖像中得到的特征向量之間的距離、對應到最近鄰的特征向量為基本運算。并且,在由照相機得到的圖像與數(shù)據(jù)庫中的多個圖像之間對應特征向量,并對數(shù)據(jù)庫中的圖像進行投票。最后,輸出得票數(shù)最多的圖像標簽作為"識別結果"。但是,當考慮特征向量的維數(shù)是從數(shù)十到數(shù)百、數(shù)量是每張圖像數(shù)百到數(shù)千的級別時,可知無限制地計算所有組合的距離并不實用。但是,隨著近年來的最近鄰搜索技術的發(fā)展,能夠在短時間內(nèi)搜索龐大數(shù)量的特征向量(例如參照非專利文獻l、2)。特另'J是ANN(ApproximateNearestNeighbor)(例^口參照非專利文獻3)、LSH(LocalitySensitiveHashing)(例如參照非專利文獻4),分別通過使用樹結構、哈希(Hash)表進行近似最近鄰搜索來實現(xiàn)高速搜索。在日本國內(nèi),例如除了針對精確最近鄰搜索的SR-Tree(例如參照非專利文獻5)之外,作為近似最近鄰搜索方法存在小林等人的分布式編碼(例如參照非專利文獻6)。并且,從物體識別的觀點出發(fā),和田等人提出了最近鄰辨別器(例如參照非專利文獻7)的概念和將其具體化的KDDT(例如參照非專利文獻8)的方法。在考慮各物體與一個特征向量對應來識別該物體類別的問題時,只要知道從識別對象的物體得到的特征向量接近哪個類別的特征向量即可,不需要求出"最近鄰"的特征向量。由此與使用精確最近鄰搜索的情況相比,表現(xiàn)出能夠實現(xiàn)數(shù)倍至數(shù)百倍的高速化。另外,已知有適于附帶文檔圖像索引的特征量的提取方法和適于該特征量的檢索算法(例如參照專利文獻l)。專利文獻l:國際7>開第2006/092957號小冊子非專利文獻l:P.Indyk,Nearestneighborsinhigh—dimensionalspaces,Handbookofdiscreteandcomputationalgeometry(Eds.byJ.E.GoodmanandJ.O'Rourke),Chapman&Hall/CRC,pp.877-892,2004.非專利文獻2:G.Shakhnarovich,T.DarrellandP.IndykEds.,Nearest-neighbormethodsinlearningandvision,TheMITPress,2005.非專利文獻3:S.Arya,D,M.Mount,R.SilvermanandA.Y.Wu,"Anoptimalalgorithmforapproximatenearestneighborsearching,"JournaloftheACM,vol.45,no.6,pp.89卜923,1998.非專利文獻4:M.Datar,N.Immorlica,P.IndykandV.S.Mirrokni,Locality-sensitivehashingschemebasedonp-stabledistributions,Proc.ofthe20thannualsymposiumonComputationalGeometry,pp.253-262,2004.非專利文獻5:片山紀生、佐藤真一、"類似検索07t&0索引技沐于,,、情幸艮処理、vol.42,no.10,pp.958—964,Oct.,2001.非專利文獻6:小林卓夫、中川正樹、"分散〕一f^y^〖二上)高次元O最近傍探索"、信學技報PRMU2006-41,June,2006.非專利文獻7:和田俊和、"空間分割^用V、fc識別^非線形寫像O學習(l)空間分割^上3最近傍識別0高速化"、情報処理、vol.46,no.8,pp.912-918,Aug.,2005.非專利文獻8:柴田智行、加藤丈和、和田俊和、"K-ddecisiontree^^O応用一最近傍識別器(D高速化^省乂千!;化"、信學論(D-II),vol.J88-D-I1,no.8,pp.1367-1377,Aug.,2005.
發(fā)明內(nèi)容發(fā)明要解決的問題如上所述的局部描述符那樣以多個特征向量表現(xiàn)各物體的方法是對物體識別有效的方法(approach)。但是,需要對多個特征向量執(zhí)行計算,希望進一步縮短計算時間。即要求更高速的物體識別的處理方法。如專利文獻1所述,研究特征量的提取方法是實現(xiàn)高速的物體識別方法的有效方法之一,但是研究使用通過現(xiàn)有方法提取出的特征量的最近鄰搜索方法也是從其它方面出發(fā)的有效方法,這種方法一皮期4寺。用于解決問題的方案在通過統(tǒng)計處理來決定識別結果的情況下,與最近鄰辨別器相同,無需對各特征向量求出最近鄰的特征向量,只要知道所對應的圖像是哪個即可。并且,即使錯誤地對照到與其它物體的特征向量,只要最終正確答案和非正確答案的得票數(shù)不逆轉即可。因而,通過犧牲特征向量的搜索正確度來實施大幅的近似最近鄰搜索能夠贏得處理時間。發(fā)明人等根據(jù)上述構思重復研究而作出本發(fā)明。(1)本發(fā)明提供一種圖像識別方法,在提供表示對象物體的圖像作為輸入圖像時,通過搜索局部描述符來從圖像數(shù)據(jù)庫中辨別包括上述對象物體的圖像,該圖像識別方法的特征在于,具備如下工序從輸入圖像中導出表示其局部特征的多個局部描述符的工序;限定工序,在從上述圖像數(shù)據(jù)庫中的圖像得到的各局部描述符中,對輸入圖像的各局部描述符分別限定進行搜索的對象;搜索工序,從上述搜索對象中搜索與輸入圖像的各局部描述符接近的各局部描述符,確定針對輸入圖像的各局部描述符的近鄰的各局部描述符;以及辨別工序,使用統(tǒng)計處理來辨別得到近鄰的各局部描述符的圖像中應為識別結果的圖像,其中,上述限定工序將上述搜索對象的數(shù)量限定在能夠辨別應為識別結果的圖像的程度,由計算機執(zhí)行各工序。(2)另外,從不同觀點出發(fā),本發(fā)明提供一種圖像識別裝置,在提供表示對象物體的圖像作為輸入圖像時,通過搜索局部描述符來從圖像數(shù)據(jù)庫中辨別包括上述對象物體的圖像,該圖像識別裝置的特征在于,具備特征導出部,其從輸入圖像中導出表示其局部特征的多個局部描述符;限定部,其在從上述圖像數(shù)據(jù)庫中的圖像得到的各局部描述符中,對輸入圖像的各局部描述符分別限定進行搜索的對象;搜索部,其從上述搜索對象中搜索與輸入圖像的各局部描述符接近的各局部描述符,確定針對輸入圖像的各局部描述符的近鄰的各局部描述符;以及辨別部,其使用統(tǒng)計處理來辨別得到近鄰的各局部描述符的圖像中應為識別結果的圖像,其中,上述限定部將上述搜索對象的數(shù)量限定在能夠辨別應為識別結果的圖像的程度。(3)并且,從不同觀點出發(fā),本發(fā)明提供一種圖像識別程序,使用計算機實現(xiàn)如下功能在提供表示對象物體的圖像作為輸入圖像時,通過搜索局部描述符來從圖像數(shù)據(jù)庫中辨別包括上述對象物體的圖像,該圖像識別程序的特征在于,使計算機作為如下各部發(fā)揮功能特征導出部,其從輸入圖像中導出表示其局部特征的多個局部描述符;限定部,其在從上述圖像數(shù)據(jù)庫中的圖像得到的各局部描述符中,對輸入圖像的各局部描述符分別限定進行搜索的對象;搜索部,其從上述搜索對象中搜索與輸入圖像的各局部描述符接近的各局部描述符,確定針對輸入圖像的各局部描述符的近鄰的各局部描述符;以及辨別部,其使用統(tǒng)計處理來辨別得到近鄰的各局部描述符的圖像中應為識別結果的圖像,其中,上述限定部將上述搜索對象的數(shù)量限定在能夠辨別應為識別結果的圖像的程度。(4)另外,本發(fā)明的一個側面提供一種圖像識別方法,根據(jù)輸入圖像中包括的對象物體的圖案,從使用哈希表而具有體系的圖像數(shù)據(jù)庫中識別包括上述對象物體的圖像,該圖像識別方法的特征在于,具備如下工序提取表示上述圖案的局部特征量的一個以上特征向量的工序;索引算出工序,根據(jù)提取出的特征向量算出哈希表的索引;投票工序,用算出的索引參照上述哈希表來決定圖像數(shù)據(jù)庫中的候補圖像,對所決定的候補圖像進行投票;以及根據(jù)對各特征向量的投票結果得到識別結果的圖像的工序,其中,上述哈希表的制作工序包括如下各工序對從登記在數(shù)據(jù)庫內(nèi)的各圖像中提取出的各特征向量算出哈希表的索引,除去各特征向量中辨別能力較低的特征向量,登記與留下的各特征向量對應的圖像參照用數(shù)據(jù)。(5)另外,從不同觀點出發(fā),本發(fā)明提供一種圖像識別裝置,根據(jù)輸入圖像中包括的對象物體的圖案,從使用哈希表而具有體系的圖像數(shù)據(jù)庫中識別包括上述對象物體的圖像,該圖像識別裝置的特征在于,具備特征點提取部,其提取表示上述圖案的局部特征的一個以上特征向量;索引算出部,其根據(jù)提取出的特征向量算出哈希表的索引;投票部,其用算出的索引參照上述哈希表來決定圖像數(shù)據(jù)庫中的候補圖像,對所決定的候補圖像進行投票;以及圖像選擇部,其根據(jù)對各特征向量的投票結果得到識別結果的圖像,其中,上述哈希表的制作工序包括如下各工序對從登記在數(shù)據(jù)庫內(nèi)的各圖像中提取出的各特征向量考慮特征量的變動地算出哈希表的索引,除去各特征向量中辨別能力較低的特征向量,登記與留下的各特征向量對應的圖像參照用數(shù)據(jù)。發(fā)明的效果在本發(fā)明的上述(l)的圖像識別方法中,上述限定工序將上述搜索對象的數(shù)量限定在能夠辨別應為識別結果的圖像的程度,因此能夠縮短識別所需的處理時間。即能夠高速地識別物體。另外,在本發(fā)明的上述(2)的圖像識別裝置中,上述限定部將上述搜索對象的數(shù)量限定在能夠辨別應為識另'J結果的圖像的程度,因此能夠縮短識別所需的處理時間。并且,在本發(fā)明的上述(3)的圖像識別程序中,上述限定部將上述搜索對象的數(shù)量限定在能夠辨別應為識別結果的圖像的程度,因此能夠縮短識別所需的處理時間。根據(jù)本發(fā)明的上述(4)的圖像識別方法,除去辨別能力較低的特征向量,在哈希表中僅登記與辨別能力較高的特征向量對應的圖像參照用數(shù)據(jù),因此能夠僅將辨別能力較高的特征向量作為處理對象在短時間內(nèi)進行圖像識別。另外,在哈希表中僅登記與辨別能力較高的特征向量對應的圖像參照用數(shù)據(jù),因此與登記與所有特征向量對應的圖像參照用數(shù)據(jù)的情況相比,能夠節(jié)約圖像數(shù)據(jù)庫所需的存儲器容量。另外,根據(jù)本發(fā)明的上述(5)的圖像識別裝置,在哈希表中僅登記與辨別能力較高的特征向量對應的圖像參照用數(shù)據(jù),因此能夠將它們作為處理對象在短時間內(nèi)進行圖像識別。另外,在哈希表中僅登記與辨別能力較高的特征向量對應的圖像參照用數(shù)據(jù),因此能夠節(jié)約圖像數(shù)據(jù)庫的存儲器容量。在此,容易理解地說明除去特征向量其立意。本發(fā)明的圖像識別方法是使用特征向量來識別圖像的方法。識別的基本在于登記在數(shù)據(jù)庫中的特征向量與輸入圖像的特征向量的對照。特征向量表示圖像的局部特征,因此通常從一個圖像中得到多個特征向量。但是,登記在數(shù)據(jù)庫中的物體(圖像)的特征向量中存在很好地表示該物體的特征(辨別能力較高)的特征向量和不是很好地表示該物體特征(辨別能力較低)的特征向量。很好地表示物體的特征的特征向量是指如果存在該特征向量則可以說輸入圖像是該物體的、成為充足證據(jù)的特征向量。另一方面,不是很好地表示該物體的特征的特征向量是指如下的特征向量由于出現(xiàn)在各種物體的圖像中,因此雖說具有該特征向量但是不能使用于判斷是哪個物體。特征向量的除去是指將后者即不能作為證據(jù)的特征向量從詞典中刪除的處理。更具體地說,以i)計算近似的特征向量多到何種程度ii)舍棄超過固定閾值的特征向量的流程進行處理,刪除辨別能力較低的特征向量。下面說明本發(fā)明的優(yōu)選方式。在上述(l)的圖像識別方法中,也可以是上述限定工序能夠根據(jù)輸入圖像使限定搜索對象的程度不同來辨別應為識另'J結果的圖像。即,也可以根據(jù)輸入圖像使近似程度不同。由此,通過根據(jù)圖像來變更識別所使用的近似程度能夠縮短處理時間。在使用近似最近鄰搜索的物體識別中,近似程度成為用于平衡識別率和效率的重要參數(shù)。越是加強近似越能夠削減處理時間,但是當過分加強近似時,對很多特征向量求不出最近鄰,作為結果導致引起誤識別。在此問題之一是引起誤識別的近似程度根據(jù)圖像而不同。存在即使進行大幅近似也能夠識別的"簡單"圖像,相反地存在進行大幅近似會誤識別的"難"圖像。為了通過固定的近似來確保一定的識別率,需要使近似程度配合識別困難的圖像,從而成為提高效率的障礙。因此,作為本發(fā)明的一個優(yōu)選方式,從"識別所需的最近鄰搜索的精確度根據(jù)圖像而不同"的觀點出發(fā)提供削減處理的方法。即針對圖像適應性地調(diào)節(jié)近似程度的方法。根據(jù)上述方法,通過準備近似程度不同的多個辨別器、并從近似程度強到弱多階縱列連接它們,能夠實現(xiàn)。由此,能夠在前階部分利用大幅近似的辨別器來高速地識別可簡單識別的圖像,能夠在后階部分利用近似較弱的辨別器來僅對大幅近似無法識別的圖像費時地精密地進行識別。另外,在無法辨別應為識別結果的圖像時,還可以上述限定工序放寬限定搜索對象的程度、并且進行除去先前視為搜索對象的局部描述符之外地決定新搜索對象的處理,對所決定的搜索對象執(zhí)行搜索工序以及辨別工序。由此,即使在改變近似程度來多階地執(zhí)行限定工序、搜索工序以及辨別工序的情況下,也能夠以與搜索在各階中成為搜索對象的局部描述符一遍的情況相比毫不遜色的處理時間進行識別。該方法的特征在于進行多階化的辨別器的構成方法。在后階的辨別器中,僅將近似不同引起的差分、即在比其前階的辨別器中沒有成為對象的特征向量設為距離計算的對象,由此能夠得到如下優(yōu)點即使處理進行到最后階也僅需要與單獨使用最后階的辨別器的情況大致相等的計算量。并且,在階段性地放寬限定搜索對象的程度來重復進行上述限定工序、搜索工序以及辨別工序也無法辨別應為識別結果的圖像時,也可以拒絕關于該局部描述符的搜索結果。由此,與不進行拒絕的情況相比能夠抑制誤識別率。另外,上述圖像數(shù)據(jù)庫包括哈希表,該哈希表用按規(guī)定過程對從各圖像中導出的各局部描述符算出的索引值來對其進行分類,上述限定工序考慮特征量變動地按上述過程根據(jù)輸入圖像的各局部描述符來算出索引值,用算出的索引值參照上述哈希表并將屬于該類的局部描述符設為搜索對象,上述辨別工序對通過搜索工序而確定的近鄰的各局部描述符使用統(tǒng)計處理,該統(tǒng)計處理為對得到該各局部描述符的圖像進行投票,上述哈希表是如下這樣制作而成的對各類,在屬于該類的局部描述符的數(shù)量超過閾值的情況下,從搜索對象中除去該類的局部描述符。由此,由于在屬于各類的局部描述符的數(shù)量超過閾值的情況下從搜索對象中除去它們來制作哈希表,因此在限定工序中視為搜索對象的局部描述符被限定在辨別能力較高的局部描述符,乂人而實現(xiàn)高效的識別。在屬于哈希表的一個類(索引)的局部描述符(特征向量)的數(shù)量較多的情況下,可以說這些局部描述符辨別能力較低。即意思是在根據(jù)輸入圖像的局部描述符來算出索引并參照哈希表的情況下,登記有多個屬于該類的候補。這種局部描述符對識別對象的圏定沒有多大貢獻,可以說辨別能力較低。如果從搜索對象中除去辨別能力較低的局部描述符,則僅參照辨別能力較高的局部描述符,從而進行高效的識別。并且,各局部描述符表現(xiàn)為向量,考慮特征量的變動地算出哈希表的索引值的處理是如下處理在將各局部描述符的要素離散化而得到的離散值中包括誤差范圍地算出索引值,上述誤差范圍也可以根據(jù)上述變動來決定。即在算出索引時,在根據(jù)要素值和變動的估計值而算出的值的范圍跨越離散化所使用的多個區(qū)間的情況下,也可以使用與各區(qū)間對應的離散值來算出多個索引。例如,在圖像數(shù)據(jù)庫中的對象物體的圖案是從與輸入圖像不同的角度看對象物體的圖案的情況下、即存在變動的情況下,要進行識別的圖像與輸入圖像之間存在對應關系的局部描述符(特征向量)的要素值將變化。哈希表按照規(guī)定過程以規(guī)定的計算過程根據(jù)局部描述符的要素值算出作為離散值的索引值,但是當特征向量的要素值發(fā)生變動時,可以說算出不同的離散值的可能性較高。特征向量的各要素是以規(guī)定閾值進行了離散化的離散值。因此,在以特征向量的各要素值為中心的變動的估計區(qū)間跨越超過離散化的閾值的多個區(qū)間的情況下,以與各區(qū)間對應的離散值作為要素值來算出多個索引。由此,能夠抑制針對上述變動的識別率下降。換言之,在特征向量的某要素接近離散化的閾值的情況下,也考慮跨越閾值的可能性地算出索引,由此能夠確保識別率。另外,上述搜索工序也可以是如下工序計算輸入圖像的各局部描述符與屬于與其對應的類的哈希表中的各局部描述符之間的距離,確定處于規(guī)定距離內(nèi)或者最短距離的局部描述符。或者,上述搜索工序也可以是如下工序將屬于與輸入圖像的各局部描述符對應的類的哈希表中的各局部描述符都設為近鄰的局部描述符。由此,不進行特征向量的距離計算就能夠進行搜索,因此與進行距離計算的情況相比能夠縮短搜索所需的處理時間。在上述(2)的圖像識別裝置中可以是上述限定部能夠根據(jù)輸入圖像使限定搜索對象的程度不同來辨別應為識別結果的圖像。即也可以根據(jù)輸入圖像使近似程度不同。由此,通過根據(jù)圖像來變更識別所使用的近似程度能夠縮短處理時間。另外,在無法辨別應為識別結果的圖像時,上述限定部放寬限定搜索對象的程度、并且進一步進行除去先前視為搜索對象的局部描述符地決定新的搜索對象的處理,搜索部對所決定的搜索對象進一步確定近鄰的各局部描述符,辨別部根據(jù)所確定的各局部描述符進一步辨別應為識別結果的圖像。由此,即使在改變近似程度而限定部、搜索部以及辨別部執(zhí)行多階處理的情況下,也能夠以與搜索在各階段中成為搜索對象的局部描述符一次的情況相比毫不遜色的處理時間進行識別。另外,在上述(1)和(4)的發(fā)明的圖像識別方法、上述(2)和(5)的圖像識別裝置、上述(3)的圖像識別程序中,圖像數(shù)據(jù)庫中的圖像所包括的上述對象物體的圖案也可以是從與輸入圖像不同的角度看對象物體時的圖案。另外,在上述(1)和(4)的發(fā)明的圖像識別方法、上述(2)和(5)的圖像識別裝置、上述(3)的圖像識別程序中,圖像數(shù)據(jù)庫中的圖像所包括的上述對象物體的圖案也可以其一部分與輸入圖像的圖案對應。還能夠組合多個在此示出的各種優(yōu)選方式。進一步說明本發(fā)明的優(yōu)選方式。在上述(4)的發(fā)明的圖像識別方法中,除去辨別能力較低的特征向量也可以是如下處理在索引互相相等的特征向量超過規(guī)定數(shù)量的情況下,將算出該索引的各特征向量從對哈希表的登記對象中除去。針對哈希表的一個索引而成為登記對象的特征向量的數(shù)量多的情況可以說這些特征向量辨別能力較低。即意思是在根據(jù)從輸入圖像中提取出的特征向量算出索引、并以算出的索引參照哈希表的情況下,對該索引登記有多個能夠成為候補的圖像。這種索引對識別對象的圖像圏定沒有多大貢獻。因而,對各索引,從對哈希表的登記對象中除去這些特征向量,由此能夠僅將辨別能力較高的圖像參照用數(shù)據(jù)登記在哈希表中。另外,上述索引算出工序也可以通過在將各特征向量的要素離散化而得到的離散值中包括滿足誤差估計范圍的離散值來算出索引。即,在算出索引時,在根據(jù)要素的值和變動的估計值而算出的值的范圍跨越離散化使用的多個區(qū)間的情況下,也可以使用與各區(qū)間對應的離散值來算出多個索引。例如,在圖像數(shù)據(jù)庫中的對象物體的圖案是從與輸入圖像不同的角度看對象物體的圖案(有變動)的情況下,在要進行識別的圖像和輸入圖像之間存在對應關系的特征向量的要素值變化。在索引算出工序中,以閾值為基準將特征向量的要素值離散化,但是在存在對應關系的特征向量的要素值在閾值附近的情況下,可以說當值變動時離散化的結果為被離散化成不同的離散值的可能性較高。因此,以特征向量的要素值為中心的變動估計區(qū)間跨越離散化使用的多個區(qū)間的情況下,通過使用與各區(qū)間對應的離散值來計算多個索引,能夠抑制針對上述變動的識別率下降。換言之,在特征向量的某要素接近計算索引時的離散化閾值的情況下,也考慮跨越閾值的可能性地計算索引,從而能夠確保識別率。另外,登記在上述哈希表中的圖像參照用數(shù)據(jù)由圖像ID和該特征向量的要素構成,上述圖像ID辨別包括各特征向量的數(shù)據(jù)庫中的圖像,投票工序也可以是如下處理進行輸入圖像的各特征向量與登記在根據(jù)該特征向量算出的哈希表的索引中的各特征向量之間的距離計算,對以最短距離的特征向量的圖像ID所辨別的圖像進行投票。另外,此時也可以是僅在最短距離在一定閾值以下時進行投票的處理。由此,能夠將特征向量的距離計算次數(shù)圏定在登記在索引中的特征向量來減少距離計算的次數(shù)?;蛘撸怯浽谏鲜龉1碇械膱D像參照用數(shù)據(jù)由辨別包括各特征向量的數(shù)據(jù)庫中的圖像的圖像ID構成,投票工序也可以是如下處理對登記在根據(jù)輸入圖像的各特征向量算出的哈希表的索引中的圖像ID所辨別的圖像進行投票。由此,哈希表中僅登記圖像ID而不需要登記各特征向量的要素,因此能夠進一步節(jié)約圖像數(shù)據(jù)庫的存儲器。另外,用對輸入圖像的各特征向量算出的索引來參照哈希表,以使用登記在該索引中的圖像ID進行投票處理的簡單處理來進行識別處理,因此與進行距離計算的情況相比,能夠進一步縮短計算時間。另外,在上述(5)的發(fā)明的圖像識別裝置中,除去辨別能力較低的特征向量也可以是如下處理在索引互相相等的特征向量超過規(guī)定數(shù)量的情況下,將算出該索引的各特征向量從對哈希表的登記對象中除去。并且,索引算出部也可以通過在將各特征向量的要素離散化而得到的離散值中包括滿足誤差估計范圍的離散值來算出索引值。即,在根據(jù)各特征向量的要素值和變動的估計值算出的值的范圍^爭越多個區(qū)間的情況下,也可以使用與各區(qū)間對應的離散值來算出多個索引。登記在上述哈希表中的圖像參照用數(shù)據(jù)由辨別包括各特征向量的數(shù)據(jù)庫中的圖像的圖像ID和該特征向量的要素構成,投票部也可以進行輸入圖像的各特征向量與登記在根據(jù)該特征向量算出的哈希表的索引中的各特征向量之間的距離計算,對最短距離的特征向量的圖像ID所辨別的圖像投票。另外,此時也可以是僅在最短距離在一定閾值以下時進行投票?;蛘?,登記在上述哈希表中的圖像參照用數(shù)據(jù)由辨別包括各特征向量的數(shù)據(jù)庫中的圖像的圖像ID構成,投票部也可以對登記在根據(jù)輸入圖像的各特征向量算出的哈希表的索引中的圖像ID所辨別的圖像進行投票。還能夠組合多個在此示出的各種優(yōu)選方式。圖l是表示通過現(xiàn)有技術的PCA-SIFT得到的特征向量的值分布的曲線圖。圖2是表示利用現(xiàn)有技術的ANN的近似最近鄰搜索的概念的說明圖。圖3是表示在本發(fā)明所涉及的數(shù)據(jù)登記中、向哈希登記時產(chǎn)生沖突的情況下的處理的說明圖。圖4是表示在本發(fā)明所涉及的實驗中使用的登記圖像的一例的說明圖。圖5是表示在本發(fā)明所涉及的實驗中使用的檢索問題圖像的一例的i兌明圖。圖6是表示4吏用現(xiàn)有技術的ANN、4吏允許誤差s從2到100之間變化時的識別率以及處理時間的實^r結果的曲線圖。圖7是表示使用現(xiàn)有技術的LSH、改變變換后的向量的維數(shù)k和哈希函數(shù)的數(shù)L時的識別率以及處理時間的實驗結果的曲線圖。圖8是表示使用有距離計算的本發(fā)明的方法、改變沖突的閾值c時的識別率以及處理時間的實驗結果的曲線圖。圖9是表示使用有距離計算的本發(fā)明的方法、改變成為處理對象的維凄史b時的識別率以及處理時間的實-驗結果的曲線圖。圖IO是表示使用沒有距離計算的本發(fā)明的方法、改變沖突的閾值c時的識別率以及處理時間的實^r結果的曲線圖。圖ll是表示使用沒有距離計算的本發(fā)明的方法、改變成為處理對象的維數(shù)b時的識別率以及處理時間的實-驗結果的曲線圖。圖12是為了比較本發(fā)明的各方法與現(xiàn)有技術的各方法的特征而將參數(shù)改變?yōu)槎喾N情況并在橫軸上描繪識別率、在縱軸上描繪處理時間的曲線圖。圖13是表示本發(fā)明的各方法以及現(xiàn)有方法中的拍攝角度與識別率之間的關系的曲線圖。圖14是表示使用沒有距離計算的本發(fā)明的方法、登記圖像數(shù)量與識別率以及處理時間之間的關系的曲線圖。圖15是表示本發(fā)明的圖像識別裝置中與沒有距離計算的方法對應的結構例的框圖。圖16是表示本發(fā)明的圖像識別裝置中與有距離計算的方法對應的結構例的框圖。圖17是表示在本發(fā)明中應對了特征向量的各維的值的變動的離散化方法的圖。圖18是表示作為本發(fā)明的一個方式、多階縱列連接辨別器的結構的框圖。圖19是表示關于現(xiàn)有方法、近似最近鄰搜索的精確度和圖像識別率之間的關系的曲線圖。圖20是表示在本發(fā)明的有距離計算的方法中b與識別率、處理時間的關系的曲線圖。圖21是表示在本發(fā)明的沒有距離計算的方法中b與識別率、處理時間的關系的曲線圖。圖22是在不拒絕的情況下、為了比較本發(fā)明的方法與現(xiàn)有方法的特性而對各方法表示識別率和處理時間之間的關系的曲線圖。圖23是表示多階縱列連接有距離計算的辨別器而構成的、本發(fā)明的圖像識別裝置的框圖。圖24是表示多階縱列連接沒有距離計算的辨別器而構成的、本發(fā)明的圖像識別裝置的框圖。附圖標記i兌明10:辨別器;11:特征點提取部;13:索引算出部;15、35:圖像數(shù)據(jù)庫;16:暫定最近鄰數(shù)據(jù)庫;17、37:哈希表;19:投票部;21:投票表;23:圖像選擇部;24:可靠性判斷部;38:特4i點對照部。具體實施例方式下面4吏用附圖更詳細地說明本發(fā)明。此外,下面說明的所有點是示例,不應解釋為是限定本發(fā)明的內(nèi)容。在本實施方式中,首先說明根據(jù)輸入圖像而階段性地調(diào)節(jié)近似程度的方法(多階化方法)。在各階段中,設為利用辨別器來進行識別與輸入圖像相應的圖的處理。上述辨別器進行相當于方法權利要求項中所說的限定工序、搜索工序以及辨別工序的處理。另外,上述辨別器是相當于產(chǎn)品權利要求項和程序權利要求項中所說的限定部、搜索部以及識別部的部分。接著,說明上述辨別器的更詳細的結構?!抖嚯A化方法》l.結構和要件在由多個特征向量表現(xiàn)一個圖像、并通過特征向量的近似最近鄰搜索和投票來進行識別的情況下,性能的界限是不進行近似時的識別率。如果進行近似就能夠相應地實現(xiàn)高速化,但是通常識別率降低。如先前所述,這種近似程度與識別率的關系根據(jù)識別對象的圖像而不同,因此為了既保持識別率又縮短處理時間需要適當?shù)卣{(diào)整近似程度。問題點在于在識別之前估計識別所需的近似程度并不容易。應對該問題的一個方法是準備近似程度不同的多個辨別器,一邊觀察這些辨別器的輸出一邊選擇適當?shù)慕瞥潭?。作為既保持處理效率又利用多個辨別器的具體方法,考慮多階縱列連接基于近似最近鄰搜索的辨別器的結構。圖18是表示多階縱列連接辨別器得到的結構的框圖。在此,標記數(shù)字1至N的矩形表示辨別器,設為數(shù)字越小近似越強。首先利用第一階辨別器識另'j從搜索問題的輸入圖像中得到的特征向量的集合。如果在該階能夠得到充分的證據(jù),則可靠性判斷部中止識別處理并回答結果。另一方面,如果不能得到充分的證據(jù),則使下一階近似程度更弱的辨別器發(fā)生作用,再次識別特征向量的集合。在反復進行處理直到到達最后的N階也不能得到充分的證據(jù)的情況下,采用回答最大得票數(shù)的圖像和拒絕該圖像中的任一個。通過以上的處理,對于在較早的階段中止處理的圖像能夠期待大幅的效率化,并且根據(jù)需要能夠進行費時的識別。在采用這種結構時成為要件的事項是如下兩點<1〉中止識別處理的判斷方法<2>對于"難"的圖像也保持處理效率的方法。關于<1>,希望以較少的計算量盡可能精確地判斷。<2〉是用于即使對反復進行識別處理直到后階為止的圖像也不降低處理效率的策略。理想情況是,只要利用多階化的辨別器進行處理直到s階為止的情況下的計算量與單獨使用具有與第s階相同近似程度的辨別器的情況相等即可。下面說明各要件。2.中止識別處理的判斷方法引起識別錯誤的圖像說起來具有如下性質得票數(shù)少,在即使得到某種程度得票數(shù)的情況下,在得票數(shù)上與第二位的候補之間也基本沒有差距。當著眼于這些點時,作為可靠性判斷部的處理考慮使用得票數(shù)的如下的簡便判斷方法。當設一位的得票數(shù)為V,、二位的得票數(shù)為Vjt,如果同時滿足V一t、rV一V2則中止處理,將一位得票的圖像設為回答。在此,t是得票數(shù)的閾值,r是一位與二位的得票數(shù)之比的閾值。此外,關于最終階存在如下兩種情況與上式無關地將得票數(shù)最大的圖像設為識別結果的情況,以及在不滿足上式的情況下進行拒絕的情況。3.對于"難"的圖像也保持處理效率的方法考慮近似程度不同的N個近似最近鄰搜索器1,L,N(以后簡單稱為搜索器)。設為搜索器(s-l)的近似程度比搜索器s更強。將使用搜索器s對特征向量q;進行近似最近鄰搜索得到的結果、作為距離計算對象而得到的特征向量的集合設為Pi(s)。在近似最近鄰搜索中,通常具有近似程度越強成為距離計算對象的特征向量數(shù)量越少的性質。即,針對所有i和s,IPi^HP,s—"l成立?,F(xiàn)在,針對這些搜索器考慮下面這兩個性質。定義l.單調(diào)性當對所有i和sP"2P,-D(1)都成立時,稱為近似最近鄰搜索器具有單調(diào)性。定義2.差分檢索性當近似最近鄰搜索器高效地求出Pi(s)—Pi(s-"(2)差分集合時,稱為具有差分檢索性。在使用具有單調(diào)性的搜索器來構成圖18的多階辨別器的情況下,考慮在第s階中不是將P"而是將與前一階的差分Pi(s)—P,-"設為距離計算或者投票的對象。當這樣構成時,從第1階到第s階為止成為距離計算或者投票的對象的特征向量的并集與單獨使用搜索器s時的集合P"相等,因此距離計算或者投票的次數(shù)相同。并且,在搜索器具有差分搜索性的情況下,即使進行多階化也能夠將計算量的增加抑制得較低。按照圖23具體說明使用距離計算的情況下的識別過程。在圖23中標記了附圖標記10的框內(nèi)的模塊表示構成多階辨別器的各階辨別器的詳細結構。當處理進行到第(s-l)階時,發(fā)現(xiàn)針對各特征向量qi的暫定最近鄰p,并將其記錄在暫定最近鄰數(shù)據(jù)庫16中。因而,在第s階中,通過差分哈希鍵(hashkey)計算得到Pie(Pi(s)-P,《)的差分特征向量,僅對它們進行與q;之間的距離計算,如果發(fā)現(xiàn)比p,距離更近的向量,只要將其作為暫定最近鄰p/重新登記在暫定最近鄰數(shù)據(jù)庫16中并且重新進行投票即可。按照圖24具體說明不使用距離計算的情況下的識別過程。當處理進行到第(s-l)階時,針對各特征向量qi,利用到該階為止所得到的哈希鍵來結束投票。因而,在第s階中,通過差分哈希鍵計算得到Ae(Pi(s)-Pj(s—")的差分特征向量,僅對它們追加進行投票即可。此外,在圖24中標記了附圖標記10的框內(nèi)的模塊表示構成多階辨別器的各階辨別器的詳細結構。另外,圖23、圖24的可靠性判斷部24包括圖15、圖16的圖像選擇部23的功能。在利用到第s階為止的投票結果能夠得到充分的可靠性的情況下,可靠性判斷部24決定應為識別結果的圖像(與圖像選擇部23的功能對應)。但是,在沒能得到充分的可靠性的情況下,判斷為應該進一步進行下一階第(s+l)階。即使進行到最終階(第N階)也沒能得到充分的可靠性的情況下,判斷為拒絕該結果?!侗鎰e器的結構》作為辨別器,提供基于以下概念的方法。在本實施方式中,使用PCA-SIFT作為局部描述符。作為使用PCA-SIFT的情況下的最近鄰搜索方法,發(fā)明人提出比現(xiàn)有的ANN、LSH更高速的方法作為本發(fā)明的一個側面。發(fā)明人的最近鄰搜索方法如后述那樣具有單調(diào)性和差分檢索性,因此非常適合多階化。因此,在多階化的實施方式中說明應用發(fā)明人的方法作為辨別器的結構。但是認為上述的多階化方法不一定限定于與發(fā)明人的方法組合,只要滿足單調(diào)性和差分檢索性,即使是應用以往的最近鄰搜索方法的辨別器也能夠得到某種程度的效果。例如,ANN、LSH也滿足單調(diào)性。在ANN中,在階段性地變更后述的允許誤差s的值的情況下滿足單調(diào)性,在LSH中,在階段性地增加所檢索的哈希表的數(shù)量L的情況下滿足單調(diào)性。即,即使是利用現(xiàn)有方法的辨別器,只要將其多階化,與一階的情況相比也能夠縮短物體識別的處理時間。另外,相反地,要應用于辨別器的發(fā)明人的方法沒有必要一定進行多階化。即使是一階的辨別器,與利用現(xiàn)有方法的辨別器相比也能夠縮短處理時間。但是,如果將應用了發(fā)明人的方法的辨別器進行多階化,則能夠實現(xiàn)更高速的物體識別。因而,最好將兩者進行組合。在應用于辨別器的發(fā)明人的方法中,除了在近似最近鄰搜索的最終階中進行距離計算的方法(有距離計算的方法)之外,還存在完全不進行距離計算就完成的方法(沒有距離計算的方法)。下面,首先說明有距離計算的方法、沒有距離計算的方法中共用的數(shù)據(jù)登記,然后說明各方法、多階化方法。發(fā)明人公開使用了哈希表的兩種高速化方法。高速化方法之一是減少特征向量的距離計算次數(shù)的方法。具體地說,在近鄰具有多個特征向量而無法避免多個距離計算的情況下,通過舍棄這種特征向量來實現(xiàn)高速化。下面將該方法稱為"有距離計算"的方法。另一個是完全不進行距離計算的方法。作為處理僅查找哈希表來進行投票。下面將該方法稱為"沒有距離計算"的方法。根據(jù)本實施方式,在從由照相機捕捉到的圖像中識別物體的處理、詳細地說在使用局部描述符的物體識別法中,與現(xiàn)有技術相比能夠縮短識別處理所需的計算時間?;蛘?,能夠以比現(xiàn)有技術更少的存儲器容量進行處理。另外,才艮據(jù)本實施方式,與使用ANN、LSH的以往的近似最近鄰搜索法的情況相比,為達成相同識別率所需的計算時間變短。在后述的實驗例中,計算時間縮短到現(xiàn)有技術的1/2至1/3。另外,沒有距離計算的方法的存儲器使用量少,因此在可伸縮性(scalability)這點上也優(yōu)良?!督Y構概要》圖15和圖16是表示本發(fā)明的圖像識別裝置的結構例的框圖。圖15是與沒有距離計算的方法對應的框圖,圖16是與有距離計算的方法對應的框圖。例如在上述圖像識別裝置上執(zhí)行本發(fā)明的圖像識別方法。圖像識別裝置的硬件例如由CPU、硬盤裝置等存儲裝置、RAM、以及輸入輸出電路等構成,其中,上述存儲裝置保存表示CPU所執(zhí)行的處理過程的程序,上述RAM對CPU提供工作區(qū),上述輸入輸出電路輸入輸出數(shù)據(jù)。更具體地說,例如也可以是具有上述結構的個人計算機?;蛘?,作為不同方式,也可以設為設備嵌入型的裝置,由大規(guī)模集成電路(LSI)、硬盤裝置以及控制它們的處理的微型計算機構成。在圖15中,特征點提取部ll是從輸入圖像所包括的對象物體的圖案中提取特征向量的模塊。索引算出部13是根據(jù)特征向量以規(guī)定的算出方法來算出哈希表的索引的模塊。在圖像數(shù)據(jù)庫15中登記了附加有圖像ID的多個圖像。另外,圖像數(shù)據(jù)庫15具有用于參照圖像的哈希表17。哈希表17對多個索引登記與該索引對應的圖像的圖像ID。如下這樣進行對各索引的圖像ID的對應。首先,通過與特征點提取部ll相同的處理來提取登記對象的圖像的特征向量。用與索引算出部13相同的算出方法對提取出的各特征向量算出哈希表的索引。對這樣算出的索引預先登記包括算出了索引的特征向量的圖像的圖像ID。投票部19是如下模塊參照上述哈希表17所確定的索引,針對所參照的索引,如果存在被登記在哈希表17中的圖像ID,則對該圖像進行投票。為了進行投票,設置有對各圖像存儲得票數(shù)的得票表21。圖像選擇部23是參照得票表21來選擇得到最大得票數(shù)的圖像的模塊。在圖15的圖像識別裝置中應用多階化方法的情況下,上述各模塊中的索引算出部13、投票部19以及投票表21成為多階化的對象。在圖16中,特征點提取部ll、索引算出部13、投票部19、投票表21、圖像選擇部23具有與圖15相同的功能。圖像數(shù)據(jù)庫35的哈希表37的結構與圖15不同。即、在哈希表37的索引中,對所登記的圖像的各特征向量,以組的形式登記向量要素和包括該特征向量的圖像的圖像ID。向量要素使用于距離計算。另外,圖16的圖像識別裝置具備特征點對照部38。特征點對照部38是如下模塊在針對一個索引多個特征向量成為登記對象的情況下,進行這些特征向量與從輸入圖像中提取出的特征向量之間的距離計算來決定最短距離的特征向量,并且將與最短距離的特征向量一起登記的圖像ID決定為候補圖像。在圖16的圖像識別裝置中應用多階化方法的情況下,上述各模塊中索引算出部13、投票部19、投票表21以及特征點對照部38成為多階化對象。此外,在圖15的圖像識別裝置中,針對所參照的索引而對被登記的全部圖像ID進行投票,因此不存在與特征點對照部38對應的模塊?!短卣飨蛄俊废旅嬲f明本實施方式中利用的特征向量。l.SIFTSIFT(Scale-InvariantFeatureTransform:尺度不變特4正變換)是指由Lowe提出的特征點和伴隨該特征點的特征向量的提耳又法(例如參照D.G丄owe,"Distinctiveimagefeaturesfromscale—invariantkeypoints,"InternationalJournalofComputerVision,vol.60,no.2,pp.91-110,2004.)。如該名所示,對圖像放大縮小、旋轉、視點偏差具有魯棒(robust)特征。以往處理時間4皮一見為問題,j旦是通過利用GPU(GraphicalProcessingUnit:圖形處理單元)能夠進行高速處理。在本實施方式中,使用由Lowe提供的軟件(參照URL:http:〃www.cs.ubc.ca/lowe/keypoints/)來4是耳又4爭4正點。凈爭4正向量是128維的整數(shù)值(0-255)向量。2.PCA-SIFTKe等人對SIFT的特征向量應用主成分分析(PCA),由此提出提高SIFT的穩(wěn)定性、辨別性地PCA-SIFT(例如參照Y.KeandR.Sukthankar,Pea-sift:Amoredistinctiverepresentationforlocalimagedescriptors,CVPR2004,Vol.2,pp.506-513,2004.)。在本實施方式中利用該PCA-SIFT作為圖的局部描述符。通過PCA-SIFT得到的特征向量是36維的實數(shù)值向量。即對根據(jù)SIFT得到的特征向量<吏用URL:http:〃www.cs.cmu.edu廠yke/pcasift/提供的軟件,由此變換為36維的向量。當使用后述實驗例中使用的圖像來計算PCA-SIFT時,可知各維具有如圖l所示的值分布。圖l是表示特征向量的值分布的曲線圖。橫軸是各維的值,縱軸是頻度。第l維是雙峰性的分布,第2維之后示出單峰性的分布。另外,隨著維數(shù)變大分散變小。平均值都是0的附近?!段矬w識別和近似最近鄰搜索》l.根據(jù)投票的物體識別圖像數(shù)據(jù)庫中收藏有多個圖像,設各圖像表示一個物體。當提供識別對象的圖像(以下稱作檢索問題)時,將物體識另'J任務定義為從數(shù)據(jù)庫中檢索與檢索問題最匹配的圖像。為了該目的,在本實施方式中使用投票方式?,F(xiàn)在將檢索問題的圖像表示為Q,將數(shù)據(jù)庫中的圖像表示為P。另外,將從Q、P中得到的d維特征向量表示為q、p。當設近似最近鄰搜索的結果為得到p作為與q對應的特征向量時,對圖像P投一票。對從Q中得到的全部特征向量執(zhí)行這種投票,將最終得票數(shù)最大的圖像作為識別結果進行提示。這樣,針對從檢索問題中得到的各特征向量,與從數(shù)據(jù)庫中的全部圖像中得到的特征向量之間進行近似最近鄰搜索,因此如何使近似最近鄰搜索高速化成為關4定點。在說明本實施方式之前,首先簡單說明作為現(xiàn)有技術的代表方法的ANN和LSH。2.ANN非專利文獻3中舉出的ANN(ApproximateNearstNeighbor)是使用樹結構來高速地進行近似最近鄰搜索的方法。樹的節(jié)點與分割特征空間得到的hyperrectangle(以后稱作單元)對應,葉節(jié)點中還對應有特征向量。圖2示出利用ANN的近似最近鄰搜索的概念。其中,為了簡單,不描繪與說明無關的單元。現(xiàn)在,設q為檢索問題的特征向量,設Ppp2、P3為數(shù)據(jù)庫中的圖像的特征向量,設當前發(fā)現(xiàn)Pi為近鄰的向量。在執(zhí)行最近鄰搜索的情況下,與實線表示的超球體重合的單元中可能存在比^更近鄰的特征向量,因此成為搜索對象。另一方面,在進行近似最近鄰搜索的情況下,針對到p,為止的距離r考慮使用允許誤差s來定義的半徑r/(l+s)的超球體,僅將與其相交的單元設為搜索對象。由此,可能無法發(fā)現(xiàn)最近鄰特征向量(圖2的情況下是p》,但是成為對象的單元數(shù)量減少,因此能夠削減搜索時間。3丄SH非專利文獻4中舉出的LSH(LocalitySensitiveHashing)是使用哈希表的近似最近鄰搜索的方法。在此,說明實驗中使用的E2LSH(ExactEuclideanLSH;以后簡單稱作LSH)??紤]d維向量p氣Xp…,Xd)。在LSH中,將一個特征向量變換為L種k維向量,登記在分別.O對應的L個p合希表中。才企索時,使用檢索問題的特征向量q來檢索全部的哈希表,從所得到的特征向量Pp…,p,中選擇與q的歐幾里得(Euclid)距離最小的特征向量為結果。通過這樣使用多個哈希來穩(wěn)定地求出較好的近似最近鄰的特征向量。再稍微具體地進行說明。對檢索問題的特征向量、數(shù)據(jù)庫中的特征向量共用處理,因此通常以v表示特征向量。v使用以如下過程生成的L個函數(shù)gt(v),…,gL(v),保存在對應的L個哈希表中。各gj(v)是如gj(v)氣h"v),…,hk(v))那樣地將v變換為k維向量的函數(shù)。hi(v)是將v變換為整數(shù)的函數(shù),具有如下形式。<formula>formulaseeoriginaldocumentpage31</formula>在此,ai是各維獨立地按照正態(tài)隨機數(shù)生成的d維向量,、是通過[O,w]的均勻隨才凡數(shù)(uniformrandomnumber)決定的標量。通過使用這種值,能夠實現(xiàn)V,與V2的歐幾里得距離越小、相應地hi(v,)=hi(v2)的可能性高的效果。在LSH中,通過^f吏用卜l,…,k的k個不同的a。ti來設k維向量,使歐幾里得距離遠離的v不是相同向量。另一方面,通過使用L個g.,防止從對象中漏掉歐幾里得距離接近的v。以上是代表現(xiàn)有技術的ANN以及LSH的說明。接著說明本發(fā)明的方法?!独脹_突削減的高速近似近鄰搜索》1.觀點在使用捕捉物體的局部特征而得到的特征向量、通過投票處理來識別物體的情況下,針對檢索問題的特征向量不需要必須從數(shù)據(jù)庫中發(fā)現(xiàn)最近鄰的特征向量,只要付與給特征向量的圖像標簽是正確答案即可。并且,通過投票來決定識別結果,因此只要正確答案的得票數(shù)不逆轉,即使錯誤的票計入其它圖像也不會發(fā)生問題。在本發(fā)明中活用這種特性實施大幅的近似,由此與使用ANN、LSH的情況相比實現(xiàn)更高速的處理。在使用ANN、LSH的情況下,最需要計算時間的部分是q與Pj之間的距離計算。因而,如何削減該部分成為關鍵點。但是,如果檢索精確度(識別率)明顯下降、或者所需存儲量大幅增大,則成為問題。在本發(fā)明中,通過使用活用了數(shù)據(jù)特性的哈希函數(shù)來解決高速化問題。作為方法考慮如下兩種。方法之一是進行距離計算、是削減成為距離計算對象的特征向量的數(shù)量的方法。具體地說,在產(chǎn)生多個沖突的情況下、即登記有很多具有相同哈希值的特征向量時,預先從哈希表中消去它們。由此,能夠將每個檢索問題的特征向量的距離計算次數(shù)肖']減到一定值以下。另一個方法是完全不進行距離計算的方法。當按照沖突次數(shù)進行消去時,哈希表中留下在辨別圖像上有效果的特征向量。因此,如果使用這些特征向量,則能夠期待僅進行投票也能夠得到正確的結果。2.數(shù)據(jù)登記首先,說明本發(fā)明的兩種方法共用的數(shù)據(jù)登記。在與本發(fā)明的方法同樣地使用哈希表的LSH中,當哈希表數(shù)量變多時將消耗大量的存儲器。因此,在本實施方式中,為削減存儲量而設為僅使用一個哈希表。將特征向量登記在哈希表中的方法如下。取通過PCA-SIFT得到的36維實數(shù)值向量p的第l維到第d維,設為[數(shù)2]<formula>formulaseeoriginaldocumentpage33</formula>將各維離散化,制作以自然數(shù)為要素的向量l^(Ui,…,Ud)。并且,利用[數(shù)4]<formula>formulaseeoriginaldocumentpage33</formula>求出哈希的索引,登記在哈希表中。在此,U是離散值的種類(以U進制數(shù)表現(xiàn)),H^是哈希表的大小。登記在哈希表中的數(shù)據(jù)根據(jù)是否使用距離而不同。在使用距離的情況下,除了登記針對特征向量p的圖像ID之外,還登記p本身,用于檢索時的距離計算。另一方面,在不使用距離的情況下,不需要登記p。特別是在以二值進行離散化的情況(以2進制數(shù)表現(xiàn)的情況)下,使用閾值T。二0,利用[數(shù)5]<formula>formulaseeoriginaldocumentpage33</formula>將各維二值化,制作位向量l^(Up…,Ud)。并且,利用[數(shù)6]d-l1^由=(1>111。(11^(2)i=0求出哈希的索引,登記在哈希表中。在此,H^是哈希表的大小。登記在哈希表中的數(shù)據(jù)根據(jù)是否使用距離而不同。在使用距離的情況下,除了登記針對特征向量p的圖像ID之外,還登記p本身,用于檢索時的距離計算。另一方面,在不使用距離的情況下,不需要登記p。在登記時產(chǎn)生沖突的情況下,如圖3那樣,通過鏈條(chain)法將多個特征向量登記為列表。此時,當列表過長時,產(chǎn)生距離計算的成本過大的問題。因此,在本實施方式中,對目錄長度n設置閾值c,當滿足n〉c時從哈希表中刪除列表整體。此外,作為預備實驗還嘗試了在信息檢索中使用的各種加權,但是在識別率上沒有很大的差別。這種刪除不僅對識別率有利還對速度有利,因此在本實施方式中不采用加權而采用刪除。具有相同哈希值的特征向量多意味著該特征向量對圖像識別沒有多大貢獻。因而,認為即使刪除其影響也較少。通過對登記在數(shù)據(jù)庫中的所有特征向量實施以上處理來完成數(shù)據(jù)登記。3.使用距離計算的方法接著說明使用距離計算的檢索。在本實施方式中,針對從檢索問題Q中得到的各特征向量q,從上述哈希表中檢索特征向量。當設所得到的特征向量集合為P時,接著從P中求出成為q的最近鄰的特征向量f。并且,在兩個特征向量的距離dist(q,p"滿足dist(q,p*)《dmax的情況下,投票給與p'對應的圖像ID。在此d,是距離的閾值。但是,當設為(1,=00時,與距離無關地投票給f。在該處理中最重要的步驟是如何檢索針對q的特征向量。最簡單的方法是與登記時相同地對q也求出位向量,利用哈希函數(shù)求出具有相同哈希值的特征向量。但是,在這種處理中雖然能夠充分削減距離的計算次數(shù),但是由于如下理由而無法得到足夠的識別率。存在特征向量各維的值隨拍攝條件而變動的情形。如果存在超過閾值那樣的變動,則位向量變成不同的向量,變得無法得到對應的特征向量。在LSH中,為了應對相同的問題,在式(l)中將均勻隨機數(shù)t加到值中來使閾值附近的值隨機地移動。另外,在上述非專利文獻6中舉出的小林等人的方法中,通過對特征向量乘旋轉矩陣來改變閾值的相對位置。在本實施方式中,將值的變動幅度ei殳為參lt來應對變動。具體地說,當設為q=(Xp…,Xd)、用于離散化的閾值為Tj(i=0,l,..,z),區(qū)間[數(shù)8](-①,To)(4)[Ti,Ti+1)(0《i<z)(5)[I,)(6)有重疊時,分配與各區(qū)間對應的離散值(式(4)的情況下是0,式(5)的情況下是i+l,d的情況下是z+l)。在此,z是i的最大值。另外,注意到根據(jù)e的值不同所分配的離散值為多個。考慮圖17示出的例子。這種情況下,具有重疊的區(qū)間是[To,t;)、[i;,t2)、[丁2,;)三個,因此作為分配給qj的離散值是分別對應的l、2、3三種。但是,當無限制地導入這種"嘗試各種可能性"的處理時,將需要龐大的計算時間。因此在本實施方式中,將成為處理對象的維數(shù)b維持在不太大的值。此外,在離散化為3值以上的情況下,不需要必須將處理對象的可能維數(shù)的所有離散值都用于索引的計算。例如,也可以是在圖17中隨機地選擇用于索引計算的離散值、僅使用1和2的處理。特別是將特征向量的各維值離散化為2值的情況下,針對各維q/直滿足lq)I"的維j,不僅使用Uj,還使用u'j=(Uj+l)mod2(若是O則是l,若是1則是0)來檢索特征向量。但是,當無限制地導入這種"嘗試兩者"的處理時,將需要龐大的計算時間。在該處理中,當將成為處理對象的維數(shù)設為b時,使用2b種位向量來訪問哈希表。因此在本實施方式中,使b維持在不太大的值。當滿足[數(shù)12]lqjI"的維數(shù)超過b時,從維數(shù)的索引較小的當中采用b個。此外,還考慮概率性地決定成為對象的維。但是,實際嘗試發(fā)現(xiàn)在識別率上幾乎沒有差別,需要額外的計算時間。此外,也能夠不是在檢索時而是在登記時進行這種變動的應對。具體地說,在登記時同樣地制作2b個位向量并登記在哈希表中。由此,在檢索時不需要使用多個位向量來訪問哈希表,因此能夠期待縮短處理時間。然而,由于登記多個特征向量,因此對存儲器的負擔變大。預備實驗的結果是在處理時間上沒有很大的差別、對存儲器的負擔顯著,因此在本實施方式中設為在一企索時對變動進行應對。4.不使用距離計算的方法在不使用距離計算的方法中,不是對檢索問題的特征向量q實施如上所述的距離計算來求出近似最近鄰,而是對屬于從哈希表中得到的特征向量的集合p的所有特征向量實施投票處理。處理的參數(shù)與不使用距離的方法相同,是特征量的變動幅度e、應對變動的維數(shù)b這兩個?!独胋的多階化》發(fā)明人等的方法的參數(shù)是b、c、d、e四個。在本實施方式中,通過變更其中的b來調(diào)整近似程度。具體地說,在第s階中使用設為b=s-l的辨別器。發(fā)明人等的方法是伴隨b的增加僅增加用于訪問哈希表的索引。因此,不僅滿足單調(diào)性還滿足差分搜索性。但是,多階化的參數(shù)并不限于b。還能夠利用其它參數(shù)進行多階化。例如,可知參數(shù)d不僅滿足單調(diào)性也滿足差分搜索性。關于c、e也存在該可能性。此外,在沒有距離計算的方法中,在各段處理中不是更新暫定最近鄰Pi*并進行投票,而是對屬于得到的差集合Pi(s)-P,-"的所有特征向量進行投票。(實驗例)為了驗證本發(fā)明方法的有效性進行了實驗。首先,說明應用了發(fā)明人等的方法的辨別器和利用現(xiàn)有方法的辨別器的比較實驗。《實驗1》l.實驗條件l.l.圖像數(shù)據(jù)庫首先說明實驗所使用的圖像。首先,準備了收集方法不同的A、B、C三種數(shù)據(jù)集。圖4是表示實驗中使用的登記圖像的一例的說明圖。A是使用Google的圖像檢索而收集的3,100張圖像。作為檢索關鍵字使用了海報、雜志、封面等。圖4的(a)示出例子。B是PCA—SIFT的站點(URL:http:〃www.cs.cmu.edu廠yke/pcasift)所公開的圖像,圖像數(shù)量是18,500張。該數(shù)據(jù)主要由自然照片、人物照片等構成。圖4的(b)示出例子。C由在照片共享站點的flickr中利用animal、birthday、food、japan等簽條(tag)收集的78,400張的圖像構成。主要包括如圖4的(c)所示的物體、自然照片、人物照片等。此外,在收集時除了600x600像素(pixel)以下大小的圖像之外,進行縮小使圖像長邊為640pixel以下。另夕卜,特征向量為IOO個以下的圖像也排除在外。A、B、C的圖像一邊長度的平均分別是498、612、554pixel。接著,使用A、B、C的圖像來制作由表l所示的圖像數(shù)量構成的數(shù)據(jù)庫DB1,…,DB5,用于實驗。表l包括在數(shù)據(jù)庫中的圖像數(shù)<table>tableseeoriginaldocumentpage38</column></row><table>200780040849.X說明書第34/42頁在此,大的數(shù)據(jù)庫包括小的數(shù)據(jù)庫作為其一部分。此外,從DB3起對每個圖像提取平均2,069個特征向量。1.2.檢索問題圖像作為檢索問題,使用以如下過程制作的2,000張圖像。首先,在DB1所包括的圖像中,從A、B、C中分別隨機地選擇IOO、200、200張圖像并打印在A4紙面上。接著,使用照相機拍攝打印出的紙面。圖5示出拍攝得到的圖像(檢索問題圖像)的例子。如圖所示,在拍攝紙面整體的配置上,使照相機光軸相對于紙面的角度6改變?yōu)?0°、75°、60°。另外,使角度為90°拍攝了紙面的一部分。其結果是對一張紙面合計得到四種圖像。并且,將拍攝得到的圖像縮小到512x341pixel,通過PCA-SIFT求出特征向量。其結果是每張圖像平均得到605個特征向量。此外,打印時使用OKI(注冊商標)C5200n(彩色激光打印機)、拍攝時使用CANON(注冊商標)EOSKiss(注冊商標)Digital(630萬像素)和附屬鏡頭EF-S18-55mmUSM。1.3.評價在實驗中,使用ANN和LSH作為近似最近鄰搜索的比較方法,與本發(fā)明的方法進行比較。此外,作為ANN,使用了URL:http:〃www.cs.umd.edu/mount/ANN/提供的程序,作為LSH,使用URL:http:〃www.mit.edu廠andoni/提供的程序。作為評價基準,使用識別率和處理時間。識別率表示能夠正確地識別檢索問題圖像的比例。另外,處理時間表示檢索出檢索問題的一張圖像所需的時間。但是,不包括提取特征向量所需的時間。此外,實驗中使用的計算機的CPU為AMDOpteron(注冊商標)2.8GHz、存儲器為16GB。此外,通過實驗,在本發(fā)明的方法中將離散化全部設為二值(U二2),T。=0。另外,有距離計算的方法中的距離最大值的閾值dmax固定為3,000。2.使用了DB3的比較實驗首先,使用DB3來說明各方法的參數(shù)與識別率、處理速度的關系。2.1.ANN圖6示出使用ANN、使允許誤差在2到IOO之間變化時的識別率以及處理時間的實—驗結果??芍R別率、處理時間伴隨著s的增力口而減少。s從2到10左右為止,與處理時間的減少相比,識別率的減少緩慢。2.2丄SH圖7示出使用LSH、改變變換后的向量維數(shù)k和哈希函數(shù)的數(shù)量L時的識別率以及處理時間的實驗結果。首先,可知識別率、處理時間伴隨著L的增加而增加。當進一步增加L時能夠提高識別率,但是由于存儲器不足而無法執(zhí)行。另外,除圖示以外還嘗試了各種k,可知當減少k時識別率得到改善但是處理時間增加。認為其理由是當k較小時成為距離計算對象的特征向量的數(shù)量增加。2.3.本發(fā)明的方法(有距離計算)使用有距離計算的本發(fā)明的方法調(diào)查了沖突的閾值c與識別率、處理時間的關系。此時,作為p合希表的大小而i殳為Hsize=2d。設為e二200、b=7、d=24、26、28,在圖8中示出改變c時的識別率以及處理時間的實驗結果??芍幚頃r間隨著c減少而減少。但是,當c過小時識別率下降。認為這是因為對識別有用的特征向量也被刪除的緣故。另一方面,在增加c的情況下,計算時間增加,但是識別率基本不減少。認為這是因為即使搜索到不能成為最近鄰的特征向量也能夠通過距離計算來排除的緣故。另外,調(diào)查b與識別率、處理時間的關系。在將用于求出p合希的索引的維i殳為d二26之后,i殳為e二200、500、1000、c=oo,在圖9中示出改變b的結果??芍斣黾觔時雖然處理時間增加{旦是識別率提高。在b較小的情況下,e二200時識別率高。2.4.本發(fā)明的方法(沒有距離計算)接著,使用沒有距離計算的本發(fā)明的方法調(diào)查了c與識別率、處理時間的關系。設為cN24、26、28、e=200、b=5,在圖10中示出改變c的結果。對于d二24、26、28的值,當分別是c二2、3、4的小值時識別率為最大。認為這是因為在不使用距離計算的方法中隨著c變大而很多不是最近鄰的特征向量參與投票的緣故??芍c圖8所示的使用距離計算的情況是很好的對比。另外,還調(diào)查了b與識別率、處理時間的關系。設為(1=28、e=200、c=2,在圖ll中示出改變b的結果。到b^5為止,識別率伴隨著b的增加而上升,但是當b增加超過5時,識別率下降。認為這是因為由于b的增加而通過不能成為最近鄰的不恰當特征向量的投票增大。當考慮在圖9的計算距離的圖中增加b時識別率沒有減少這點時,也同樣可以說是很好的對、比。2.5.各方法的比較為了比較各方法的特征,將參數(shù)改變?yōu)槎喾N情況,圖12示出在橫軸上描繪識別率、在縱軸上描繪處理時間的曲線圖。用線來描繪在ANN中改變參數(shù)所得到的結果,設為評價基準。描繪得越靠右識別率越高,描繪得越靠下處理時間越短。因此,可以說描繪得越靠右下越優(yōu)良。LSH幾乎沒有超過ANN的線。在本發(fā)明的方法中,進行距離計算的方法在識別率為98%以下的情況下優(yōu)于ANN。在本發(fā)明的方法中,不進行距離計算的方法大部分情況下都優(yōu)于ANN。接著,調(diào)查各方法中的拍攝角度與識別率的關系。圖13示出處理時間約為10ms識別率最佳的情況。參數(shù)是ANNe=40,LSHk=20、L=15,有3巨離計算的方法e=200、b=4、c=8、d=24,沒有距離計算的方法e=200、b=5、c=2、d28。但是,示出利用沒有距離計算的方法的處理時間為3.4ms的曲線??芍谙嗤幚頃r間內(nèi),與ANN、LSH相比,有距離計算的方法能夠得到更高的識別率。可知在沒有距離計算的方法中,除了0=60°的情況外,能夠以1/3的處理時間得到與ANN相同程度的識別率。表2示出使用了各種參數(shù)的代表值的識別率與處理時間。表2各方法的識別率[。/。]和處理時間[ms]<table>tableseeoriginaldocumentpage42</column></row><table>可知與ANN相比,有距離計算的方法能夠以1/3左右的處理時間實現(xiàn)相同程度的識別率。另外一面,在沒有距離計算的方法中,平均識別率不及ANN。但是,其原因在于0=60。的情況下識別率低。在能夠限定在e^75。的狀況下,可知能夠在4ms以下的短處理時間內(nèi)實現(xiàn)96%左右的識別率。3.使用DB1-DB5的實驗在除了沒有距離計算的方法的全部方法中,為了檢索必須保持原特征向量的數(shù)據(jù),因此對于DB4、DB5的數(shù)據(jù)因存儲器不足而無法執(zhí)行檢索。另一方面,在不使用距離計算的方法中,僅向哈希表登記圖像ID即可,因此對存儲器的負擔少,能夠進行直到10萬圖像為止的實驗。因此,設為e二200、d=28,改變b和c來調(diào)查登記圖像數(shù)量與識別率、處理時間的關系。圖14示出識別率最好的情況。此時的b從DBl起依次為5、6、5、6、5,c為l、1、2、4、5。即使在將登記圖像數(shù)量增加到10萬張的情況下,也得到識別率87.3%、處理時間20.6ms。除了6=60°的情況外識別率為91.4%。由此,不使用距離計算的方法在識別率這點上不及其它,但是在以某程度的識別率能夠滿足的情況下,在伸縮性這點上可以說是優(yōu)良的方法。另外,處理是向哈希表的訪問和投票這種簡單處理,因此認為也存在這方面的優(yōu)點。接著,除了作為近似最近鄰搜索的以往方法的ANN、LSH之外,還使用有距離計算的方法來構成一階辨別器,與使用了應用本發(fā)明人的方法的多階辨別器的情況進行比較?!秾嶒?》l.實驗條件作為局部描述符使用由PCA-SIFT站點提供的描述符。設哈希表的大小為Hsize=2d。以下所示的處理時間表示識別一張檢索問題圖像所需的時間。但是,不包括提取特征向量所需的時間。所使用的計算機結構與實驗l相同。另外在該實驗中,使用圖23所示的多階辨別器。l.l.圖像數(shù)據(jù)庫從與實驗l相同的出處收集圖像數(shù)據(jù)庫的圖像,但是其數(shù)量為使用Google的圖像檢索收集的圖像為3,100張、由PCA-SIFT站點公開的圖像為3,450張、在照片共享站點的flickr中利用animal、birthday、food等簽條收集的圖像為3,450張、合計10,000張圖像。L2.檢索問題圖像作為檢索問題,制作了存在與數(shù)據(jù)庫對應的圖像和沒有與數(shù)據(jù)庫對應的圖像兩種。關于前者,從數(shù)據(jù)庫所包含的圖像中對各收集方法隨地選擇100、200、200張合計500張。關于后者,準備了199張不包含在數(shù)據(jù)庫中的圖像。接著,將它們打印在A4紙張上,用照相機進行拍攝。與實驗l相同,在拍攝紙面整體的配置上,使照相機光軸相對于紙面的角度e改變?yōu)?0°、75°、60°。另外,使角度為90地拍攝了紙面的一部分。其結果是對一張紙面得到合計四種圖像。并且,將所拍攝的圖像縮小到512x341pixel,通過PCA-SIFT求出特征向量。其結果是一張圖像平均得到612個特征向量。2.不進行拒絕的情況首先,僅使用在數(shù)據(jù)庫中存在對應的圖像的檢索問題進行實驗。2.1.近似最近鄰搜索的精確度與圖像的識別率的關系首先,作為預備實驗,調(diào)查為識別圖像所需的最近鄰搜索的精確度。具體地說,對于沒有多階化的方法(ANN、LSH、有距離計算的方法),將參數(shù)改變?yōu)槎喾N情況來測量近似最近鄰搜索的精確度與圖像的識別率的關系。近似最近鄰搜索的精確度是由近似最近鄰搜索求出真正的最近鄰的比例。圖19示出結果。從該結果可知近似最近鄰搜索的精確度從100%到20%附近為止,即使近似最近鄰搜索的精確度減少,識別率也基本不減少。認為這是因為即使錯誤地投票給其它圖像也還不至于使正確答案的圖像與其它圖像的得票數(shù)逆轉。另外,還了解到近似最近鄰搜索的精確度與識別率之間存在不依賴于方法的關系。2.2利用多階化削減處理[表3]表3進行廢棄的情況的結果<table>tableseeoriginaldocumentpage45</column></row><table>接著驗證多階化的效果。首先,使用有距離計算的方法調(diào)查b與識別率和處理時間的關系。設為e二200、c=5、d=28、t=2、r=0.5,圖20示出改變b的結果。可知進行多階化的情況與不進行多階化的情況相比,能夠基本上不降低識別率地削減處理時間。另外,可知隨著多階化的階數(shù)(N^b+l)變多而削減處理時間的效果變大。同樣地,使用沒有距離計算的方法來調(diào)查b與識別率和處理時間的關系。i殳為e^200、c=3、d=28、t=2、r=0.5,圖21示出改變b的結果??芍跊]有距離計算的方法中也能夠削減處理時間。2.3.各方法的比較為了比較各方法的特征,將參數(shù)改變?yōu)槎喾N情況,在圖22中示出描繪了識別率與處理時間的關系的曲線圖。用線描繪在ANN中改變允許誤差s得到的結果,設為評價基準。描繪得越靠右識別率越高,描繪得越靠下處理時間越短。因此,可以說描繪得越靠右下越優(yōu)良。LSH幾乎不超過ANN的線。在有距離計算的方法中,最大識別率不及ANN,但是在識別率為98%以下的情況下,與ANN相比能夠以1/10至1/40左右的處理時間來實現(xiàn)相同的識別率。在提出方法中,通過進行多階化將處理時間削減到有距離計算方法的1/5左右。3.進行拒絕的情況接著說明進行拒絕的情況下的實驗結果。如下這樣定義評價尺度。針對存在對應的圖像的檢索問題,設為識別率q、誤識別率E,、拒絕率Ri(C,+E^R嚴l)。針對沒有對應的圖像的檢索問題,設為誤識別率E^拒絕率尺2(£2+112=1)。首先,使用有距離計算的提出方法,通過10-foldcrossvalidation(10倍交叉驗證)進行實驗。對學習樣本,在E嚴0、E2=0的條件下求出R,為最小的參數(shù),將其應用到測試樣本(基準A)。另外,與其不同,也對學習樣本求出E^E^Ri為最小的參數(shù),將其應用到測試樣本(基準B)。作為參數(shù)嘗試了b=5,10、d=24,28、e=200,400、c=5、t=4,8,12、r^0.2,0.4,0.6的所有組合。沒有距離計算的提出方法中,對參數(shù)追加c二2來同樣地進行實驗。表3示出結果。在以基準A來設定參數(shù)的情況下,在有距離計算的提出方法中,在拒絕率R,為12.15%時能夠使誤識別率£2為0%。此時,誤識別率£2不到0%,但是能夠得到0.25%的低值。另外,在以基準B來設定參數(shù)的情況下,相對于誤識別率的微小增加,能夠將拒絕率Rt抑制到1/3。另一方面,在沒有距離計算的提出方法中,得到不如有距離計算的提出方法的結果。對于處理時間,沒有對應的圖像的檢索問題一方長4至9倍左右。這是因為通過多階化,沒有對應的圖像的檢索問題幾乎處理到最末階而#1拒絕,與此相對,存在對應的圖^(象的4全索問題不到達最末階就輸出回答。此外,關于本發(fā)明,可知除了上述的實施方式之外,本發(fā)明還能夠有各種變形例。例如考慮將本發(fā)明也應用于平面物體以外。本發(fā)明的范圍意圖包括與權利要求范圍同等的意思以及范圍內(nèi)的所有變更。產(chǎn)業(yè)上的可利用性使用了本發(fā)明的物體識別處理能夠應用于從由照相機捕捉的圖像中識別物體、進行與識別結果相應的信息處理的服務。作為上述信息處理的具體例,考慮對現(xiàn)存圖像、視頻圖像等附加索引的處理等。權利要求1.一種圖像識別方法,在提供表示對象物體的圖像作為輸入圖像時,通過搜索局部描述符來從圖像數(shù)據(jù)庫中辨別包括上述對象物體的圖像,該圖像識別方法的特征在于,具備如下工序從輸入圖像中導出表示其局部特征的多個局部描述符的工序;限定工序,在從上述圖像數(shù)據(jù)庫中的圖像得到的各局部描述符中,對輸入圖像的各局部描述符分別限定進行搜索的對象;搜索工序,從上述搜索對象中搜索與輸入圖像的各局部描述符接近的各局部描述符,確定針對輸入圖像的各局部描述符的近鄰的各局部描述符;以及辨別工序,使用統(tǒng)計處理來辨別得到近鄰的各局部描述符的圖像中應為識別結果的圖像,其中,上述限定工序將上述搜索對象的數(shù)量限定在能夠辨別應為識別結果的圖像的程度,由計算機執(zhí)行各工序。2.根據(jù)權利要求l所述的圖像識別方法,其特征在于,上述限定工序能夠根據(jù)輸入圖像使限定搜索對象的程度不同來辨別應為識別結果的圖像。3.根據(jù)權利要求2所述的圖像識別方法,其特征在于,在無法辨別應為識別結果的圖像時,上述限定工序放寬限定搜索對象的程度,并且還進行如下處理除去先前視為搜索對象的局部描述符之夕卜地決定新的搜索對象,對所決定的搜索對象執(zhí)行搜索工序以及辨別工序。4.根據(jù)權利要求3所述的圖像識別方法,其特征在于,在階段性地放寬限定搜索對象的程度來重復上述限定工序、搜索工序以及辨別工序也無法辨別應為識別結果的圖像時,拒絕關于該局部描述符的搜索結果。5.根據(jù)權利要求14的任意一項所述的圖像識別方法,其特征在于,上述圖像數(shù)據(jù)庫包括哈希表,該哈希表以按規(guī)定過程根據(jù)從各圖像中導出的各局部描述符而算出的索引值來對其進行分類,上述限定工序考慮特征量的變動地按上述過程根據(jù)輸入圖像的各局部描述符算出索引值,用算出的索引值來參照上述哈希表并將屬于該類的局部描述符設為搜索對象,上述辨別工序對通過搜索工序確定的近鄰的各局部描述符使用統(tǒng)計處理,該統(tǒng)計處理為對得到該近鄰的各局部描述符的圖像進行投票,對各類如下這樣制作上述哈希表在屬于該類的局部描述符的數(shù)量超過閾值的情況下,從搜索對象中除去該類的局部描述符。6.根據(jù)權利要求5所述的圖像識別方法,其特征在于,各局部描述符表現(xiàn)為向量,考慮特征量的變動來算出哈希表的索引值的處理是如下處理在使各局部描述符的要素離散化而得到的離散值中包括誤差范圍地算出索引值,根據(jù)上述變動來決定上述誤差范圍。7.根據(jù)權利要求5或6所述的圖像識別方法,其特征在于,上述搜索工序是如下工序進行輸入圖像的各局部描述符與屬于與其對應的類的哈希表中的各局部描述符之間的距離計算,確定處于規(guī)定距離內(nèi)或者最短距離的局部描述符。8.根據(jù)權利要求5或6所述的圖像識別方法,其特征在于,上述搜索工序是將屬于與輸入圖像的各局部描述符對應的類的哈希表中的各局部描述符都設為近鄰的局部描述符的工序。9.根據(jù)權利要求18的任一項所述的圖像識別方法,其特征在于,圖像數(shù)據(jù)庫中的圖像所包括的上述對象物體的圖案是從與輸入圖像不同的角度看對象物體時的圖案。10.根據(jù)權利要求18的任一項所述的圖像識別方法,其特征在于,圖像數(shù)據(jù)庫中的圖像所包括的上述對象物體的圖案是其一部分與輸入圖像的圖案對應的圖案。11.一種圖像識別裝置,在提供表示對象物體的圖像作為輸入圖像時,通過搜索局部描述符來從圖像數(shù)據(jù)庫中辨別包括上述對象物體的圖像,該圖像識別裝置的特征在于,具備特征導出部,其從輸入圖像中導出表示其局部特征的多個局部描述符;限定部,其在從上述圖像數(shù)據(jù)庫中的圖像得到的各局部描述符中,對輸入圖像的各局部描述符分別限定進行搜索的對象;搜索部,其從上述搜索對象中搜索與輸入圖像的各局部描述符接近的各局部描述符,確定針對輸入圖像的各局部描述符的近鄰的各局部描述符;以及辨別部,其使用統(tǒng)計處理來辨別得到近鄰的各局部描述符的圖像中應為識別結果的圖像,其中,上述限定部將上述搜索對象的數(shù)量限定在能夠辨別應為識別結果的圖像的程度。12.根據(jù)權利要求ll所述的圖像識別裝置,其特征在于,上述限定部能夠根據(jù)輸入圖像使限定搜索對象的程度不同來辨別應為識別結果的圖像。13.根據(jù)權利要求12所述的圖像識別裝置,其特征在于,在無法辨別應為識別結果的圖像時,上述限定部放寬限定搜索對象的程度、并且還進行如下處理除去先前視為搜索對象的局部描述符之外地決定新的搜索對象,搜索部對所決定的搜索對象進一步確定近鄰的各局部描述符,辨別部根據(jù)所確定的各局部描述符進一步辨別應為識別結果的圖像。14.一種圖像識別程序,使用計算機來實現(xiàn)如下功能在提供表示對象物體的圖像作為輸入圖像時,通過搜索局部描述符來從圖像數(shù)據(jù)庫中辨別包括上述對象物體的圖像,該圖像識別程序的特征在于使計算機作為如下各部發(fā)揮功能特征導出部,其從輸入圖像中導出表示其局部特征的多個局部描述f尋;限定部,其在從上述圖像數(shù)據(jù)庫中的圖像得到的各局部描述符中,對輸入圖像的各局部描述符分別限定進行搜索的對象;搜索部,其從上述搜索對象中搜索與輸入圖像的各局部描述符接近的各局部描述符,確定針對輸入圖像的各局部描述符的近鄰的各局部描述符;辨別部,其4吏用統(tǒng)計處理來辨別得到近鄰的各局部描述符的圖像中應為識別結果的圖像,其中,上述限定部將上述搜索對象的數(shù)量限定在能夠辨別應為識別結果的圖像的程度。全文摘要提供一種在從拍攝物體得到的圖像中提取特征向量并且以多個特征向量來表現(xiàn)物體、并從圖像數(shù)據(jù)庫中檢索特征一致的物體的物體識別處理中更高速的識別物體的處理方法。另外,提供一種節(jié)約圖像數(shù)據(jù)庫所需的存儲器容量的方法。提出一種用于通過近似最近鄰搜索來識別以多個特征向量描述的物體的任務的高速化方法。高速化方法之一是在近鄰處具有多個特征向量而不能避免很多距離計算的情況下,通過舍棄這種特征向量來實現(xiàn)高速化。另一個高速化方法是完全不進行距離計算,僅查找哈希表來進行投票。另外,通過多階縱列連接基于近似最近鄰搜索的辨別器來根據(jù)圖像變更用于識別的近似程度,從而大幅提高效率。文檔編號G06T7/00GK101536035SQ200780040849公開日2009年9月16日申請日期2007年8月1日優(yōu)先權日2006年8月31日發(fā)明者巖村雅一,野口和人,黃瀨浩一申請人:公立大學法人大阪府立大學
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1