專利名稱:通過度量嵌入進行的圖像比較的制作方法
通過度量嵌入進行的圖像比較 戰(zhàn)
為了在因特網(wǎng)上或者在計算設(shè)備中搜索文本、圖像、想法、網(wǎng)站等,可以輸 入文本關(guān)鍵字以開始該搜索。常規(guī)地,在計算環(huán)境中搜索圖像限于輸入概括該圖像 的文本關(guān)鍵字或者輸入概括該圖像的視覺對象或視覺特征的文本關(guān)鍵字。常規(guī)地, 不將搜索的關(guān)鍵部分轉(zhuǎn)換成文本就難以而搜索圖像。由此,常規(guī)的圖像搜索實際上 是文本搜索。
執(zhí)行成功的圖像搜索的難處在于圖像本身。圖像遠比文字復(fù)雜。這是因為圖 像玎被修改以至經(jīng)修改的圖像在數(shù)學(xué)意義上不同于原始圖像,但對于人類視覺系統(tǒng) 來說,此二者彼此間在視覺上是難以分辨的。因此,如果用戶使圖像變亮或變暗、 改變對比度、微調(diào)顏色、裁剪、或者壓縮圖像等等,這時盡管圖像可能看上去一樣, 但是量化此圖像的參數(shù)已經(jīng)顯著改變。為避免這種復(fù)雜性,僅以文字概括圖像并執(zhí) 行圖像的文字搜索是比較容易的。
需要一種在數(shù)學(xué)上——信息上捕捉圖像的方法,促使圖像搜索能以輸入圖像 本身開始,并能以找到該圖像的可能被以很多不同的方式一一例如由圖像編輯軟 件——修改的匹配版本來成功地結(jié)束。
概要
提供通過度量嵌入——即以可數(shù)字地作出比較,而不必直接依賴于被比圖像 的視覺方面的形式——來進行圖像比較的系統(tǒng)和方法,。在一種實現(xiàn)中,從每一待
比較的圖像創(chuàng)建一張圖(graph),諸如具有頂點和邊的無向圖??衫孟袼氐母?種特征來創(chuàng)建此圖。從-圖像創(chuàng)建一張圖可部分地由小波變換技術(shù)獲得系數(shù)矢量值 來完成??杉尤虢翟胩幚硪援a(chǎn)生可靠的圖以供比較。例如,在小波變換處理之后, 不顯著的值可被置零,并且圖像或圖可被按比例縮小。
之后,上述圖度量可被嵌入樹,諸如對應(yīng)于每一圖像的一族分層結(jié)構(gòu)的充分 分離的樹(hierarchical well-separated trees, HST)中。這些對應(yīng)于一圖像的HST可 被遞歸地聚簇,直到表示圖像的圖被分割。這些已嵌入圖信息的樹族被差分以獲得它們表示的圖像的相似性度量。在一
種實現(xiàn)中,由于表示一圖像的樹族既被遞歸地創(chuàng)建,因此對根HST及其相關(guān)的子 樹迭代地應(yīng)用樹差分技術(shù)。在一種實現(xiàn)中,此差分包括匯編圖像之間的最小差值的 矩陣,以及矢量化此矩陣以使一歸一化過程可找到以單個相似性度量來概括圖像之 間的最小差值的平均值或中值。
附圖簡要說明
圖1是表示一圖像的示例性圖的示意圖。
圖2是一經(jīng)由差分嵌入有圖度量的樹族來進行的示例性圖像比較的示意圖。 圖3是一示例性圖像比較系統(tǒng)的示意圖。 圖4是一示例性圖像比較引擎的框圖。
圖5是一經(jīng)由對各子節(jié)點集合進行迭代比較來進行的示例性圖像比較的示意圖。
圖6是圖像比較的示例性方法的流程圖。
具體說明
在此描述的系統(tǒng)和方法提供圖像比較技術(shù)。這些圖像比較技術(shù)可被用于執(zhí)行 因特網(wǎng)圖像搜索或用于從圖像池等中識別源圖像的經(jīng)修改版本。例如,用戶可能借 助于照片編輯軟件修改源圖像,或者通過裁剪和壓縮源圖像以備將此圖像包含在電 子郵件消息中。在此描述的系統(tǒng)和方法提供從其他圖像中搜索或者找到這樣的經(jīng)修 改圖像的途徑。
圖1示出一種圖像比較方法的示例性實現(xiàn),其中圖像100的像素值由一無向 圖102表示。該無向圖102中的每一頂點表示圖像中的一對應(yīng)像素。在一個實現(xiàn)中, 形成此圖102的圖像處理級包括小波變換的應(yīng)用,小波變換建立系數(shù)矢量值,丟棄 太小——即低于一選定閾值的值。在無向圖102中各頂點之間的邊可根據(jù)位于邊的 兩端的這一對像素之間的值的差值來加權(quán)。將被用于確定邊的加權(quán)的像素特征可從 諸如密度、能量等許多不同類型的像素特征中選擇。這樣,結(jié)果獲得的無向圖102 可按比例縮小以節(jié)約處理功率并降低噪聲。這種無向圖102在此可寬松地稱作為經(jīng) 預(yù)處理圖像,因為隨圖形成過程之后還有進一步的處理。
樹族104,諸如嵌入了圖度量的分層結(jié)構(gòu)的充分分離的樹可從在上述圖像預(yù)處 理級中創(chuàng)建的無向圖102推導(dǎo)出。樹族104是通過聚簇方法建立的,此方法使一初
始簇遞歸通過足夠的迭代次數(shù)以將經(jīng)預(yù)處理圖像分割成若干充分分離的樹。用于這
種方法的典型的樹族104包括大約十棵樹(母樹和子樹)。
如圖2所示,為從一組圖像中找到一幅圖像, 一種差分技術(shù)找到原始圖像的 樹族104與多個待比較的其他圖像各自的樹族(如204, 204',204",204'")之間的 相似性度量。與原始圖像100間具有最髙相似性度量的圖像被選定為最佳匹配。
在一種實現(xiàn)中,上述差分技術(shù)只是通過對每棵樹的每個節(jié)點賦予形狀矢量以 及采用在不同待比較圖像的相應(yīng)節(jié)點之間得到最小差值的相似性度量值的方式引 入工作量。也就是說,在橫跨表示兩幅圖像的的兩個樹族的樹中,聚合出一差值矩 陣。對此矩陣賦一矢量,之后將該矢量的分量平均化或者歸一化以建立一相似性分 數(shù)。因此,為了從圖像池中找到一圖像的拷貝或者該圖像的經(jīng)修改版本,可比較這 些相似性分?jǐn)?shù)以揭示有希望的匹配。
示例性系統(tǒng)
圖3示出用于比較圖像的示例性系統(tǒng)300。計算設(shè)備302通信地耦合于因特網(wǎng) 304。該計算設(shè)備302主存圖像比較引擎306。這種連網(wǎng)計算環(huán)境只是為了舉例的 目的而示出。其他類型的計算和網(wǎng)絡(luò)環(huán)境也可主存本主題。圖像比較引擎306使圖 像搜索308成為可能。 一目標(biāo)或"源"圖像310可由用戶或者由系統(tǒng)300的組件選 擇。圖像比較引擎306將源圖像310與例如在因特網(wǎng)304上找到的其他圖像比較, 并返回每--比較的相似性度量。圖像比較引擎306可指定源圖像與一組候選圖像的 成員之間的最佳匹配。
作為搜索來自因特網(wǎng)304的一組圖像的替代,圖像比較引擎306還可搜索文 件目錄中、數(shù)據(jù)庫中、或作為電子郵件消息的附件存儲在一文件夾中等的一組圖像。
示例性引擎
圖4更詳細地示出圖3的示例性圖像比較引擎306。圖4的圖像比較引擎306 意圖為概覽目的提供一示例布置。圖示組件或相似組件的許多其他布置是可能的。 這樣的圖像比較引擎306可在硬件、軟件,或者硬件、軟件、固件的結(jié)合等中執(zhí)行。
圖像比較引擎306的圖示的示例布置包括圖像圖化引擎402及圖像比較器 404。圖像圖化引擎402產(chǎn)生表示圖像的圖和樹族104,而圖像比較器404找到多 個樹族104之間的相似性度量,以試圖將一候選圖像與源圖像100匹配。
圖像圖化引擎402進一步包括以下圖像預(yù)處理組件灰度級化器406,小波變
換引擎408,以及比例縮小器410。這些組件產(chǎn)生一經(jīng)預(yù)處理圖像412,即可從其 產(chǎn)生樹族104以表示圖像100并允許圖像比較的圖。圖像圖化引擎402進一步包括 樹創(chuàng)建引擎414。此樹窗建引擎414進一步包括簇遞歸器416、樹修剪器418、以 及重運行過濾器。這些組件產(chǎn)生各種嵌入有用于表示不同圖像的圖度量的樹族(例 如104, 104,)。
以上介紹的圖像比較器404進一步包括樹差分引擎422及聚合器424。樹差分 引擎422進一步包括最小差值引擎426,此最小差值引擎426又進一步包括樹拓?fù)?比較器428和簇拓?fù)浔容^器430。聚合單元424進一步包括差值矩陣432,以及矢 量引擎434和歸一化器436,歸一化器436產(chǎn)生量化一對圖像之間的相似性的相似 性度量438。
圖像圖化引擎
在圖像圖化引擎402的圖像預(yù)處理組件中,灰度級化器406可接收一彩色RGB 圖像輸入,并例如通過RGB值的L2規(guī)范將此輸入轉(zhuǎn)化為灰度級。
在一種實現(xiàn)中,小波變換引擎408執(zhí)行三階Haar小波變換。結(jié)果獲得的系數(shù) 矢量中的小值可被取閾為零,也就是說,絕對值小于一閾值一一例如0.15的系數(shù) 換為零。隨后,對這些系數(shù)矢量應(yīng)用一小波重建過程,并且比例縮小器410將結(jié)果 按比例縮小至大約70像素寬以產(chǎn)生經(jīng)預(yù)處理圖像412。
樹創(chuàng)建引擎414從經(jīng)預(yù)處理圖像412產(chǎn)生Jt棵分層結(jié)構(gòu)的充分分離的樹 (HST)。典型地,k- 10。這些HST可通過遞歸的分層結(jié)構(gòu)聚簇分解過程來產(chǎn)生。 樹創(chuàng)建引擎414從設(shè)置圖節(jié)點G的初始簇等于經(jīng)預(yù)處理圖像412開始。簇尺寸參 數(shù)由r表示,并且經(jīng)預(yù)處理圖像412中的像素數(shù)目由W指定。r的典型值在大約l 與大約-2之間。參數(shù)r的某些調(diào)整可改善結(jié)果。
簇遞歸器416選擇一簇C,并選擇一隨機點xEC,。如果C,的所有點都在離點 x距離r(logAO的范圍內(nèi),則不必進行進一步處理,并且將C,作為樹返回。否貝廿, 從一反型(inverse-type)分布中選中一半徑d。也就是說,如果經(jīng)預(yù)處理圖像412 包含JV個像素,則對于參數(shù)r的一給定值,簇遞歸器416在均勻分布的
上選擇 一x值,并設(shè)定of--r(logAO(logx)。
隨后,簇遞歸器416設(shè)定C,+1=5(:c,^,從而使一球體的中心從一之前的點jc 到以一新點x且以d為半徑,并在Cw遞歸構(gòu)建一棵樹,并設(shè)定(7,= C,/Ci+1。此 過程可以C'代替C,反復(fù)執(zhí)行。由此構(gòu)建的這些遞歸樹形成C,的子樹,直到C,.被
分割。結(jié)果獲得的多棵樹是嵌入有經(jīng)預(yù)處理圖像412的度量的HST樹族104。
樹修剪器418通過將那些對應(yīng)的簇包含的像素數(shù)目低于某一閾值——典型地 為100個像素的節(jié)點修剪掉來降低圖像中噪聲的影響。應(yīng)當(dāng)注意的是,q,+u-別jc,力 HC,.,也就是說,該簇與上述球體不相同,而是包含于該球體內(nèi)的像素集合。像素 集合通常并不十分像球體,因此下述的形狀矢量承擔(dān)更多的重要性。在一種實現(xiàn)中, 樹修剪器418可通過在樹創(chuàng)建的末尾修剪掉小節(jié)點來避免要確定簇的尺寸最大為 KlogAO的初始步驟。
類似地,如果結(jié)果獲得的樹所具有的節(jié)點少于一閾值數(shù)目,例如少于6個節(jié) 點,則重運行過濾器420通過重新運行整個樹創(chuàng)建過程來降低噪聲。換言之,小的 樹表示不良的聚簇,且該樹應(yīng)當(dāng)以不同的聚簇參數(shù)重新創(chuàng)建。
圖像比較器
在圖示的圖像比較器404的示例中,樹差分引擎422從源圖像100的樹族104 接收一棵樹,諸如HST。樹差分引擎422類似地從一候選圖像的樹族104'中接收 一棵樹。
給定這兩棵樹——例如HST——樹差分引擎422具有一產(chǎn)生它們之間的差值 度量的最小差值引擎426。在一種實現(xiàn)中,樹拓?fù)浔容^器428將這些樹的拓?fù)浣Y(jié)構(gòu) 納入考慮,而簇拓?fù)浔容^器430將與這些樹的節(jié)點相關(guān)聯(lián)的簇的拓?fù)浣Y(jié)構(gòu)納入考 慮。給定一子HST,最小差值引擎426以其母HST的直徑來按比例縮放每一邊緣 的權(quán)重。對每一節(jié)點v,最小差值引擎426通過將該簇在v的位置與兩個形狀參數(shù) 《,力和級聯(lián)來賦一矢量flvE 口4。這些參數(shù)可這樣獲得:計算該簇在v的凸包H, 并設(shè)定心《為H內(nèi)任意兩點間的最大距離,以及《 -min礎(chǔ)max少eHp(:c,力,其中P (;^)是在圖像圖中;c到;;的距離。
如圖5中所示,給定兩個HSTr502和C/502',樹差分引擎422遞歸計算一
樹差分函數(shù)"treediff(r,t/)",以及在各子節(jié)點集合之間映射。r502及C/502,的根 下的子樹分別被設(shè)定成U乂,和"卩^。樹差分引擎422令^=|卜,,- |,其中A是
上述口4中的形狀矢量。最小差值引擎426隨后令&為使&最小化的(iV)對;令
&為使去除"所在的行和列后的^最小的(W)對,依此類推。s;序列描述r502
的根下的子樹與C/502'的根下的子樹之間的匹配。若、^a,,則多個子樹將是不失配的。樹差分引擎422遞歸地對匹配子樹(例如,頂層匹配子樹(504,504');(506,506'); (508,508,));及后續(xù)各層的匹配子樹,諸如(510,510,)等)計算treediff函數(shù),從該 &對產(chǎn)生4。為對《求和,樹差分引擎422隨后累加每一匹配對的邊權(quán)重之差值, 以及矢量flv的差值。若r或C/有任何失配的子樹,則樹差分引擎422累加那些子 樹的邊權(quán)重的總和(但不利用矢量av)。樹差分引擎422獲得結(jié)果總和,其是r 和C/的treediff函數(shù)值。
在一種實現(xiàn)中,除了通過形狀矢量的最小值來匹配子樹,樹差分引擎422還 執(zhí)行多層窮舉搜索。在某些情況下這可提供更好的結(jié)果。若treediff(r,C/,0)是上述 的差分函數(shù),則treediff(r,C/,力意圖產(chǎn)生子樹r與C/之間的所有可能匹配。因此, 從一頂層開始,樹差分引擎422在每次匹配中為每一對調(diào)用treediffi[r,t/,t/-l),并 返回在所有匹配中匹配總值的數(shù)學(xué)最小值。由于上述樹修剪器418通常通過修剪掉 那些對應(yīng)的簇包含的像素低于閾值數(shù)目的節(jié)點來優(yōu)化這些樹,因此r和C/的子樹 的數(shù)量不大。由于對treediff(r,i/,力的頂層調(diào)用中c/的典型值只有2或3,因此產(chǎn)生 一窮舉匹配是可行的。
在比較兩幅圖像(如G和/f)以獲得相似性度量的背景中,上述圖像圖化引
擎402從每一圖像計算/fe棵HST (典型地y^10)。每一圖像的樹族(104,104')分 別是U〉和,其中1《i《k。聚合器424形成 -treediff(7;,J7,)作為差值矩 陣432。矢量引擎434根據(jù)《-min,ij形成矢量d。在某些實現(xiàn)中,此最小值運算 是不對稱的,因此Ajj《Aji。歸一化單元436隨后聚合treediff函數(shù)的結(jié)果 厶(0,//)-鵬朋^)或厶(0,//)=鵬^朋(力。后者,即按中值(median)的聚集在某些 實現(xiàn)中可能給出較佳的結(jié)果,這可能是由于其對異常值較不敏感(類似于有噪圖像 中使用的中值濾波器與均值濾波器的對比)。
在一變形例中,使用邊緣檢測器(圖未示)在樹創(chuàng)建引擎414中聚簇。因此, 在小波變換引擎408的低通作用之后,可通過Canny邊緣濾鏡(圖未示)來處理 圖像,且結(jié)果獲得的樹被聚簇。由于Canny邊緣濾鏡并不保證對象被閉合邊緣曲 線包圍,因此在此情形中可利用高斯平均計算像素值差值來創(chuàng)建用于HST的圖像 圖。這會有阻礙聚簇越過邊緣端點之間的小間隙的作用。在很多情況下,當(dāng)樹差分 引擎422以這種方式應(yīng)用此Canny邊緣濾鏡時,結(jié)果所得的HST產(chǎn)生良好的結(jié)果。
示例性方法
圖6示出用于進行圖像比較的一示例性方法600。在該流程圖中,各操作在各
個框中概述。此示例性方法600可由硬件、軟件、或者此二者的組合來執(zhí)行,例如, 由示例性圖像比較引擎306的組件執(zhí)行。
在框602,從每一待比較圖像創(chuàng)建一張圖。用圖表示圖像以使該圖像可與其他 圖像數(shù)字地比較相似性或不相似性涉及可靠地量化組成圖像的像素,例如通過用 圖像中相鄰像素的差值來加權(quán)圖的邊。若圖像是彩色的,則可使用像素的色彩分量 來創(chuàng)建此圖,或者可將該彩色圖像灰度級化,并且可利用像素的其他各種非色彩特 征來創(chuàng)建此圖。用于從圖像創(chuàng)建圖的引擎,例如示例性圖像比較引擎306,可包括 其他預(yù)處理組件以使此圖成為用于比較目的的可靠的圖像指標(biāo)。
通過小波變換獲得系數(shù)矢量值有助于從圖像創(chuàng)建圖。產(chǎn)生用于比較圖像目的 的可靠圖的主要因素之一在于,從圖中消除不相關(guān)的噪聲。因此,在小波變換之后, 不顯著的值可被置零,從而減少本方法必須處理的信息總量。將圖像和/或圖按比 例縮小到有效率的尺寸對創(chuàng)建圖也是有利的。
在方框604中,為每-張圖創(chuàng)建樹族。在本示例性方法600的該部分中,表 示待比較圖像的圖盡管量化了圖像,但是仍不容易適合于可數(shù)字地實施的數(shù)學(xué)比較 技術(shù)。因此,并不試圖直接比較圖,而是將每一張圖的度量嵌入樹族中。舉例來說, 分層結(jié)構(gòu)的充分分離的樹(HST),十分適合于可數(shù)字地高效率實施的數(shù)學(xué)比較技 術(shù)。由此,圖像變成圖,圖進而變成相關(guān)的樹族。這些樹的簇和節(jié)點允許數(shù)學(xué)上地 比較圖像,即以一種可數(shù)字地操縱并且不直接依賴于圖像的視覺質(zhì)量的用于比較的 形式來比較圖像。
在框606,兩幅待比較圖像的樹族彼此差分以獲得一相似性度量。也就是說, 這些嵌入有圖信息的樹族被比較以獲得它們表示的圖像的相似性度量。在一種實現(xiàn) 中,由于表示圖像的樹族是遞歸地創(chuàng)建的,因此樹差分技術(shù)被迭代地應(yīng)用于根HST 以及它們相關(guān)的子樹。在一種實現(xiàn)中,所述差分包括匯編差值矩陣并使該矩陣矢 量化,從而使一平均化(或?qū)ふ抑兄?過程可以用單個相似性度量來概括這些差值。
在此描述的系統(tǒng)和方法可將圖度量嵌入樹的度量中并且畸變近似很低。給定 一定義度量的一般化圖,嵌入樹度量具有Q(")的失真(其中"是G中的點的數(shù)目)。 然而給定一圖G,樹族度量{7^}隨同嵌入G—7}(以使得給定任意兩點,有矽 EG),在隨機選擇的7;上,K的預(yù)期失真是O(logn)。
結(jié)論
上述的主題可由硬件、軟件、固件等或者它們的組合來實現(xiàn)。在某些實現(xiàn)中,
該主題可在由計算設(shè)備或通信設(shè)備執(zhí)行的諸如程序模塊等的計算機可執(zhí)行指令的 一般化背景中描述。通常,程序模塊包含執(zhí)行特定任務(wù)或?qū)崿F(xiàn)特定抽象數(shù)據(jù)類型的 例程、程序、對象、組件、數(shù)據(jù)結(jié)構(gòu)等。所述主題也可在分布式通信環(huán)境中實施, 其中任務(wù)由通過通信網(wǎng)絡(luò)鏈接的多個遠程處理設(shè)備通過無線通信來執(zhí)行。在無線網(wǎng) 絡(luò)中,程序模塊可同時位于本地和遠程通信設(shè)備儲存媒介,包括存儲器儲存設(shè)備。 以上討論描述了用于進行圖像比較的示例性系統(tǒng)和方法。盡管以結(jié)構(gòu)特征和/ 或方法動作專用的語言來描述所述主題,但應(yīng)當(dāng)理解,在所附權(quán)利要求書中定義的 主題并不必限于前述的具體特征或動作。確切而言,以上描述的具體特征和動作是 作為實現(xiàn)權(quán)利要求的示例性形式公開的。
權(quán)利要求
1、一種方法,包括將第一圖像表示為一第一圖,并將第二圖像表示為一第二圖,其中所述第一和第二圖中的每個頂點對應(yīng)于各自圖像中的一個像素;為每一無向圖中的頂點之間的每一條邊賦一權(quán)重,其中所述權(quán)重對應(yīng)相鄰像素值之間的差值;從所述第一圖導(dǎo)出一第一族樹,并從所述第二圖導(dǎo)出第二族樹,其中所述樹族中嵌入了圖度量;以及基于所述第一與第二樹族之間的差值度量確定所述第一和第二圖像的差值度量。
2、 如權(quán)利要求1所述的方法,其特征在于,將所述第一和第二圖像表示為第一 和第二圖包括,用小波變換來處理每一圖像。
3、 如權(quán)利要求2所述的方法,其特征在于,所述小波變換包括三階Haar小波變換。
4、 如權(quán)利要求2所述的方法,進一步包括按比例縮小每一圖像以降低經(jīng)預(yù)處理 圖像中產(chǎn)生的噪聲。
5、 如權(quán)利要求2所述的方法,進一步包括將每一圖像按比例縮小至大約70個像 素寬以形成經(jīng)預(yù)處理的圖像。
6、 如權(quán)利要求1所述的方法,其特征在于,導(dǎo)出樹族包括,通過圖像的遞歸分 層結(jié)構(gòu)聚簇分解導(dǎo)出一族分層結(jié)構(gòu)的充分分離的樹。
7、 如權(quán)利要求6所述的方法,其特征在于,所述遞歸分層結(jié)構(gòu)聚簇分解包括 從所述經(jīng)預(yù)處理的圖像中選擇一簇像素,在所述像素簇中選擇一隨機像素位置;c,選擇簇尺寸r、以及等于-r(logAO(logx)的半徑A其中W是所述經(jīng)預(yù)處理的圖像中的像 素數(shù)量;生成所述像素簇的多個子簇,直到所述像素簇被分割,其中所述生成包括從點;c 以連續(xù)半徑遞歸地構(gòu)建子簇,其中每一子簇被設(shè)定成先前獲得的簇除以具有當(dāng)前半徑 的簇的比率。
8、 如權(quán)利要求1所述的方法,其特征在于,確定所述第一樹族與第二樹族之間 的差值包括比較第一樹族和第二樹族的拓?fù)浣Y(jié)構(gòu),以及比較與所述第一和第二族的 樹節(jié)點相關(guān)聯(lián)的簇的拓?fù)浣Y(jié)構(gòu)。
9、 如權(quán)利要求1所述的方法,其特征在于,確定所述第一樹族與第二樹族之間 的差值包括計算與所述第一樹族和所述第二樹族的每一節(jié)點相關(guān)聯(lián)的簇的凸包以獲 得該節(jié)點的多個形狀參數(shù),通過將所述簇中與所述節(jié)點相關(guān)聯(lián)的位置與所述各形狀參 數(shù)級聯(lián)來向每一節(jié)點賦一形狀矢量,以及找到使所述第一與第二樹族各自的子節(jié)點集 合的形狀矢量之間的差值最小化的差值度量。
10、 如權(quán)利要求9所述的方法,進一步包括通過形成所述形狀矢量的差值最小 化的矢量并歸一化所述矢量的分量,來聚合所述各樹的節(jié)點上的差值。
11、 如權(quán)利要求l所述的方法,進-步包括為所述第一圖像和--組圖像中的成 員連續(xù)地重復(fù)所述方法,以找到所述組中與所述第一圖像具有最高相似性的成員。
12、 一種包括多條可執(zhí)行指令的存儲介質(zhì),所述指令在由計算設(shè)備執(zhí)行時實現(xiàn)權(quán) 利要求1所述的方法。
13、 一種圖像比較引擎,包括圖像圖化引擎,用于從對應(yīng)的圖像導(dǎo)出無向圖,其中所述無向圖的頂點對應(yīng)于所 述圖像中的像素;樹創(chuàng)建引擎,用于從每一無向圖導(dǎo)出一族樹; 樹差分引擎,語言確定各樹族中對應(yīng)節(jié)點之間的最小差值; 聚合器,語言匯編各樹族之間的差值的矩陣;以及 矢量引擎,語言從所述差值矩陣導(dǎo)出兩幅圖像的相似性度量。
14、 如權(quán)利要求13所述的圖像比較引擎,其特征在亍,所述圖像圖化引擎包括 語言處理彩色圖像的灰度級化器、語言確定像素系數(shù)矢量值的小波變換引擎、以及語 言減小圖像尺寸并降低噪聲的比例縮小器。
15、 如權(quán)利要求13所述的圖像比較引擎,其特征在于,所述樹創(chuàng)建引擎進一步 包括簇遞歸器,用于將由無向圖表示的圖像分割成充分分離的簇。
16、 如權(quán)利要求13所述的圖像比較引擎,其特征在于,所述樹創(chuàng)建引擎進一步 包括樹修剪器,用于去除與擁有的節(jié)點的數(shù)目低于閾值的對應(yīng)簇相關(guān)聯(lián)的樹節(jié)點。
17、 如權(quán)利要求13所述的圖像比較引擎,其特征在于,所述樹創(chuàng)建引擎進一步 包括一重運行過濾器,用于在有樹具有的節(jié)點的數(shù)目低于閾值的情況下在所述圖像圖 化器處重新啟動一幅圖像。
18、 如權(quán)利要求13所述的圖像比較引擎,其特征在于,所述樹差分引擎進一步 包括最小差值引擎,所述最小差值引擎包括樹拓?fù)浔容^器和簇拓?fù)浔容^器。
19、 一種系統(tǒng),包括 用于從對應(yīng)圖像導(dǎo)出圖的裝置;用于從每一圖導(dǎo)出一族樹的裝置;以及用于確定兩幅不同圖像的樹族之間的最小差值的裝置。
20、如權(quán)利要求19所述的系統(tǒng),進一步包括用于選擇一圖像的裝置、以及用 于基于所述樹族之間的最小差值從一組圖像中找到與所選圖像最相似的圖像的裝置。
全文摘要
提供通過度量嵌入進行圖像比較的系統(tǒng)和方法。在一實施例中,從每一待比較圖像創(chuàng)建一張圖。隨后將表度量嵌入每一圖像的樹族中。將不同圖像各自的樹族之間的最小差值匯編為一矩陣,從該矩陣獲得用于進行圖像比較的相似性度量。
文檔編號G06K9/54GK101194272SQ200680018455
公開日2008年6月4日 申請日期2006年4月27日 優(yōu)先權(quán)日2005年5月31日
發(fā)明者M·凱瑞, R·文卡特薩 申請人:微軟公司