專利名稱:與遞歸直方圖矢量發(fā)生匹配的基于調(diào)色板的直方圖的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及圖像處理和圖形匹配領(lǐng)域,并特別涉及在兩個數(shù)據(jù)集的每個的直方圖(histogfam)特征基礎(chǔ)上對兩個數(shù)據(jù)集的比較。
直方圖一般被用于表征數(shù)據(jù)集。數(shù)據(jù)集之間的相似性通??赏ㄟ^比較數(shù)據(jù)集內(nèi)每個的公用值出現(xiàn)的相對頻率來確定。圖形匹配,并且特別是圖像匹配,通常包括直方圖比較以確定圖像之間的相似性或搜索較大圖像內(nèi)的目標(biāo)對象。
直方圖包括“類(class)”或“庫(bin)”,用于包含被表征的數(shù)據(jù)集內(nèi)類的組成數(shù)的頻數(shù)。每個數(shù)據(jù)項基于其值而與類關(guān)聯(lián),并且數(shù)據(jù)集內(nèi)每個數(shù)據(jù)值的出現(xiàn)導(dǎo)致被關(guān)聯(lián)類的頻數(shù)被增值(increment)。在一些直方圖結(jié)構(gòu)中,每個數(shù)據(jù)項可與多個類關(guān)聯(lián),并且每個類的頻數(shù)為數(shù)據(jù)項的每次出現(xiàn)而被增值。為便于在此作為參照,假定每個數(shù)據(jù)值都與單個類關(guān)聯(lián),沒有一般性(generality)損失,這是因為不考慮被用于將頻數(shù)分配給類的技術(shù),本發(fā)明的原理是可用的。
被用于將數(shù)據(jù)集的不同數(shù)據(jù)值分類的類數(shù)通常確定了直方圖的鑒別能力或分辨率。如果許多不同的數(shù)據(jù)值被分配給相同的直方圖類,則具有基本上不同的數(shù)據(jù)值的數(shù)據(jù)集直方圖可以是等效的,并因此是可辨別的。相反,如果每個不同的數(shù)據(jù)值都被分配給不同的直方圖類,則具有很相似但不完全相同的數(shù)據(jù)值的數(shù)據(jù)集直方圖將基本上是不同的,即使數(shù)據(jù)集是相似的。通常,當(dāng)亦為基本上相似的數(shù)據(jù)集提供了相似或等效的直方圖時,選擇被用于將不同的數(shù)據(jù)值分類的類數(shù)從而提供在基本上不同的數(shù)據(jù)集之中好的辨別能力。
在常規(guī)直方圖比較過程中,提供直方圖之間相似性測量所需要的時間與直方圖中的類數(shù)成比例,而計算一個區(qū)域的直方圖的時間與該區(qū)域的大小成比例。具有好的辨別能力的直方圖結(jié)構(gòu)(即大量的類)可導(dǎo)致過長的處理時間。在一些應(yīng)用如實時視頻處理中,處理速度對于應(yīng)用的可行性是至關(guān)重要的,但通常強(qiáng)加了減小直方圖辨別能力的折中。
圖像處理領(lǐng)域中的一般應(yīng)用是在相對大的圖像中搜索相對小的目標(biāo)圖像的位置。在這樣的應(yīng)用中,可能包含較小目標(biāo)圖像的較大圖像的每個區(qū)域被評估以確定該區(qū)域的內(nèi)容是否對應(yīng)于目標(biāo)內(nèi)容。在這個應(yīng)用的情況下,直方圖為目標(biāo)的內(nèi)容而被生成,并且這個目標(biāo)直方圖被與對應(yīng)于較大圖像中每個可能包含目標(biāo)的區(qū)域的直方圖進(jìn)行比較??紤]一個大小上為N乘M像素的圖像和一個大小上為n乘m像素的目標(biāo)。該圖像包括(N-(n-1))×(M-(m-1))個可能包含該目標(biāo)的區(qū)域。在典型的應(yīng)用中,圖像可在大小上為1024×1024像素,而目標(biāo)可在大小上小于100×100像素。在這個實例中,圖像包括幾乎一百萬個可能的區(qū)域,并且需要用于每個這些區(qū)域的直方圖。欲評估區(qū)域的這個潛在大的數(shù)量進(jìn)一步使有效的直方圖生成和直方圖比較過程成為必要,特別是對于實時圖像處理。
本發(fā)明的目的是提供允許有在直方圖之中足夠的辨別能力而無需過多的處理時間的直方圖比較過程。本發(fā)明的另一目的是提供具有基本上獨立于直方圖中類數(shù)的處理時間的直方圖比較過程。本發(fā)明的另一目的是提供獨立于目標(biāo)大小的直方圖比較過程。本發(fā)明的另一目的是提供對評估對應(yīng)于較大數(shù)據(jù)集內(nèi)重疊區(qū)域的直方圖特別有效的直方圖比較過程。
通過提供對第一數(shù)據(jù)集的直方圖矢量和第二數(shù)據(jù)集相應(yīng)的直方圖矢量進(jìn)行比較的直方圖比較過程,可實現(xiàn)這些和其它目的。第一和第二數(shù)據(jù)集的直方圖矢量是從所選幾個直方圖類的直方圖值而形成的,所選的幾個類是包含最高頻數(shù)的第一數(shù)據(jù)集的類。僅使用第一數(shù)據(jù)集的所選幾個類來表征第二數(shù)據(jù)集;有屬于其它類的值的數(shù)據(jù)項被忽略。對應(yīng)于第二數(shù)據(jù)集,調(diào)色板數(shù)據(jù)集被生成,其中第三數(shù)據(jù)集內(nèi)的數(shù)據(jù)項對應(yīng)于第一數(shù)據(jù)集所選類的索引,或?qū)τ谒雎缘臄?shù)據(jù)項的零索引。對應(yīng)于重疊區(qū)域的直方圖被基于第三數(shù)據(jù)集而遞歸地確定。若給出對應(yīng)于第一區(qū)域的直方圖,則僅通過增值位于第二但不位于第一區(qū)域中的單元的索引頻數(shù)并減值位于第一但不位于第二區(qū)域中的單元的索引頻數(shù),就可確定第二、重疊區(qū)域的直方圖。
參照附圖并通過實例,本發(fā)明被更詳細(xì)地描述,在附圖中
圖1示出對應(yīng)于實例搜索陣列的實例值陣列。
圖2示出依照本發(fā)明的目標(biāo)直方圖矢量的形成和實例目標(biāo)值陣列。
圖3示出依照本發(fā)明的陣列比較過程的實例流程圖。
圖4示出依照本發(fā)明對應(yīng)于在搜索陣列中目標(biāo)調(diào)色板值的出現(xiàn)的實例調(diào)色板陣列。
圖5A和5B示出依照本發(fā)明用于搜索陣列重疊區(qū)域的搜索直方圖矢量的實例遞歸確定。
在所有的附圖中,相同的參考數(shù)字表示相似或相應(yīng)的特征或功能。
本發(fā)明提供了對兩個數(shù)據(jù)集基于直方圖的比較,并特別好地適合于在較大數(shù)據(jù)集的一個或多個區(qū)域內(nèi)、或者在數(shù)據(jù)集的較大集合中的一個或多個數(shù)據(jù)集內(nèi)定位第一數(shù)據(jù)集或第一數(shù)據(jù)集的近似。為便于參照,第一數(shù)據(jù)集被稱為目標(biāo)數(shù)據(jù)集或目標(biāo)。在圖像處理的情況下,目標(biāo)可以是人的圖像。本發(fā)明基于直方圖的比較過程可被用于在一組人們的較大圖像中尋找人的圖像,或在人們不同圖像的集合中尋找人的圖像,或者兩者的組合。盡管本發(fā)明是將圖像用作范例數(shù)據(jù)集而提供的,但它亦可用于在值的類的出現(xiàn)頻率(即直方圖)的基礎(chǔ)上比較任何數(shù)據(jù)集,正如在考慮到本公開內(nèi)容時對本鄰域的普通技術(shù)人員來說這將是顯然的。
圖1示出對應(yīng)于欲與目標(biāo)值陣列(圖2中的210)比較的數(shù)據(jù)集的實例值陣列100。為便于參照和說明,本發(fā)明被提供于在較大的搜索數(shù)據(jù)集內(nèi)尋找較小目標(biāo)數(shù)據(jù)集的情況,盡管如以上所指出的,本發(fā)明可用于在其它數(shù)據(jù)集的集合內(nèi)尋找目標(biāo)數(shù)據(jù)集,并且每個搜索數(shù)據(jù)集可以是與目標(biāo)數(shù)據(jù)集相同的大小。盡管搜索數(shù)據(jù)集優(yōu)選為至少與目標(biāo)數(shù)據(jù)集一樣大,但本鄰域的普通技術(shù)人員將認(rèn)識到,可對比較進(jìn)行構(gòu)建以在較小的搜索數(shù)據(jù)集內(nèi)尋找目標(biāo)的一個或多個較小部分。另外,數(shù)據(jù)集不需要為二維值陣列;通過使用本發(fā)明的原理,一維或多維陣列亦是可比較的。
搜索陣列100的每個單元101被示出為具有在a-z的范圍內(nèi)的數(shù)據(jù)值。在圖像處理的情況下,這些數(shù)據(jù)值可對應(yīng)于顏色值、照度值、紋理值等,或者這些值的組合。例如,在此引入作為參考、代理記錄為US010238、授予Miroslav Trajkovic、提交于2001年5月11日、序列號為09/854121的共同未決的U.S.專利申請“Object trackingbased on color distribution(基于顏色分布的對象跟蹤)”,公開了合成數(shù)據(jù)值的使用,如果數(shù)據(jù)項(圖像的像素)可區(qū)別于灰,則所述數(shù)據(jù)值由色度分量來確定,而如果數(shù)據(jù)項為灰或接近灰,則由亮度分量來確定。此外,色度分量是每個數(shù)據(jù)項的色彩(hue)(顏色)和飽和度(白度)測量的組合。在其它情況下,如人口統(tǒng)計,數(shù)據(jù)值可對應(yīng)于經(jīng)濟(jì)、政治聯(lián)系(affiliation)等的分類。
圖2示出實例目標(biāo)值陣列210,其使用與搜索陣列100相同的可能數(shù)據(jù)值(a-z)的集。即在圖像處理的情況下,目標(biāo)陣列210中的字母“a”對應(yīng)于與亦具有字母“a”的搜索圖像100中的數(shù)據(jù)項相同的顏色值或合成值,并且反之亦然。通常,在目標(biāo)和搜索陣列中均使用相同的過程來確定數(shù)據(jù)項的值。
通常,目標(biāo)數(shù)據(jù)集將包含比可能數(shù)據(jù)值的數(shù)量少的不同值。就是說,例如,即便要,很少的圖像將包含所有可能的顏色值。在圖2的實例中,從a-z的26個可能值范圍或直方圖庫,目標(biāo)包含九個不同的值f、a、j、b、s、d、p、g和h。對應(yīng)于目標(biāo)圖像的這九個值的每個的直方圖庫220的內(nèi)容在230處被示出。如所示,數(shù)據(jù)值“a”在目標(biāo)中出現(xiàn)四次;值“s”出現(xiàn)三次;值“d”和“f”出現(xiàn)兩次,而值“g”、“h”、“j”、“b”和“p”每個出現(xiàn)一次。目標(biāo)的直方圖表示中所有其它的直方圖庫將包含零的頻數(shù)。
依照本發(fā)明,目標(biāo)中“N”個最頻繁出現(xiàn)的數(shù)據(jù)值被識別。在這個實例中,N被選為七,而七個最頻繁出現(xiàn)的數(shù)據(jù)值被識別為a、s、d、f、g、h和j。約束(tied)值被任意選擇以便包括在N個值中。就是說,字母g、h、j、b和p每個都出現(xiàn)一次;可選擇這些字母的任何三個以完成七個數(shù)據(jù)值的選擇。
由于本發(fā)明特別好地適合于基于顏色值直方圖的圖像處理和圖像匹配,目標(biāo)數(shù)據(jù)集內(nèi)N個最頻繁出現(xiàn)的數(shù)據(jù)值的集合在此被稱為目標(biāo)調(diào)色板。在圖2的實例中,目標(biāo)調(diào)色板包括值a、s、d、f、g、h和j,有被分配給每個的序貫索引1-7,如列240所示。這些索引240被用于形成矢量250,在此被稱為目標(biāo)直方圖矢量或目標(biāo)矢量,其示出目標(biāo)中每個調(diào)色板值的數(shù)字。就是說,矢量的第一單元或維對應(yīng)于調(diào)色板值“a”(調(diào)色板索引為“1”),而第一單元的值為四,由此示出目標(biāo)包含值“a”的四次出現(xiàn)。以類似方式,第二單元示出目標(biāo)包含值“s”(調(diào)色板索引為“2”)的三次出現(xiàn),第三單元示出目標(biāo)包含值“d”(調(diào)色板索引為“3”)的兩次出現(xiàn),等等。應(yīng)指出,由于目標(biāo)調(diào)色板和矢量被限定于N(7)的大小,對應(yīng)于目標(biāo)的被包含于直方圖230中的一些值(特別是b和p)不再被呈現(xiàn)于目標(biāo)調(diào)色板中,也不在目標(biāo)矢量中。如將在以下所提出的,用本發(fā)明原理來比較數(shù)據(jù)集的速度基本上依賴于N,這是辨別相似數(shù)據(jù)集的能力。N的選擇依賴于具體的應(yīng)用以及速度和性能之間適當(dāng)?shù)恼壑小T趫D像處理應(yīng)用中,為了與八和十六位的字大小或公用字節(jié)的兼容性,N的值典型地為七或十五。
依照本發(fā)明,目標(biāo)與另一數(shù)據(jù)集或數(shù)據(jù)集的子集的比較是通過比較目標(biāo)直方圖矢量與對應(yīng)于其它數(shù)據(jù)集或子集的直方圖矢量來實現(xiàn)的。通過使用對應(yīng)于搜索陣列中目標(biāo)調(diào)色板值出現(xiàn)的“調(diào)色板陣列”,使得目標(biāo)直方圖矢量與另一數(shù)據(jù)集或子集的直方圖矢量的比較變得容易。在搜索陣列100的實例中,包含a、s、d、f、g、h或j的調(diào)色板值之一的陣列的每個單元1 01分別由調(diào)色板索引數(shù)字1、2、3、4、5、6或7在調(diào)色板陣列中識別。調(diào)色板陣列中的所有其它單元被設(shè)定為零或空值(null)以表示在搜索陣列的相應(yīng)單元處不包含調(diào)色板值。圖4示出對應(yīng)于圖1實例搜索陣列100的調(diào)色板陣列400,并在以下被進(jìn)一步討論。
圖3示出依照本發(fā)明的數(shù)據(jù)集比較過程的實例流程圖。在310處,目標(biāo)直方圖是通過對目標(biāo)數(shù)據(jù)集內(nèi)每個數(shù)據(jù)值的出現(xiàn)數(shù)進(jìn)行計數(shù)而確定的??蓪崿F(xiàn)映射以將具體值映射或量化為對應(yīng)于所限定直方圖的類或庫的數(shù)據(jù)值。例如,如果直方圖類對應(yīng)于將連續(xù)范圍的值劃分(partition)為整數(shù)值,則舍入或截斷過程將被應(yīng)用于識別對應(yīng)于適當(dāng)直方圖類或庫的整數(shù)數(shù)據(jù)值。
在320處,通過識別目標(biāo)數(shù)據(jù)集內(nèi)N個最頻繁出現(xiàn)的數(shù)據(jù)值(直方圖類),目標(biāo)調(diào)色板如以上所述被形成。目標(biāo)調(diào)色板被用于如以上所述在330處形成目標(biāo)直方圖矢量并在340處生成對應(yīng)于搜索數(shù)據(jù)集內(nèi)目標(biāo)調(diào)色板值的出現(xiàn)的調(diào)色板陣列。
圖4示出對應(yīng)于圖1搜索陣列100中圖2實例目標(biāo)調(diào)色板值(a、s、d、f、g、h和j)的出現(xiàn)的實例調(diào)色板陣列400。圖1搜索陣列100的第一行的首先五個單元分別為q、z、g、w和s,而圖4調(diào)色板陣列400的第一行的首先五個單元分別為0、0、5、0和2。首先兩個字母q和z不在目標(biāo)調(diào)色板值的集內(nèi),并由此調(diào)色板陣列400在第一行相應(yīng)的兩個位置中包含零或空值。第三個字母g是目標(biāo)調(diào)色板值集的成員,并且其調(diào)色板索引為五。這樣,調(diào)色板陣列400第一行的第三個單元為索引值五。以類似的方式,第四和第五個字母w和s映射于調(diào)色板陣列值零(w不是調(diào)色板值)和二(s為目標(biāo)調(diào)色板中的第二個值)。從算法上,這個過程被限定為如果Vi,j為調(diào)色板值的成員,則pi,j=m,否則pi,j=0;其中Vi,j為搜索數(shù)據(jù)集(圖1中的100)i,j位置處的數(shù)據(jù)項的值,pi,j為調(diào)色板陣列中相應(yīng)的i,j入口(entry)的值,而m為對應(yīng)于搜索值Vi,j的調(diào)色板值的索引。
在圖像內(nèi)搜索目標(biāo)是通過處理圖像調(diào)色板400而實現(xiàn)的。通過圖3的循環(huán)350-380,圖像調(diào)色板400被搜索與目標(biāo)大小相同的區(qū)域,該目標(biāo)具有與目標(biāo)直方圖矢量相似的直方圖矢量。正如對本鄰域普通技術(shù)人員來說是顯然的,若假定直方圖在大小上的差異被規(guī)格化(normalize),則可使用與目標(biāo)直方圖矢量在大小上不同的區(qū)域。為便于參照,在以下假定了相等的目標(biāo)和區(qū)域大小。
由于被用于生成目標(biāo)直方圖矢量的調(diào)色板值的索引與圖像調(diào)色板400中的每個單元關(guān)聯(lián),搜索數(shù)據(jù)集區(qū)域的直方圖矢量的生成只需要累加每個索引在搜索數(shù)據(jù)集區(qū)域內(nèi)出現(xiàn)的次數(shù)。例如,包括調(diào)色板索引1的三次出現(xiàn)、調(diào)色板索引2的一次出現(xiàn)、調(diào)色板索引3的兩次出現(xiàn)等等的圖4的區(qū)域410,具有直方圖矢量(3,1,2,1,1,0,1)415。以類似的方式,區(qū)域420具有直方圖矢量(3,3,2,2,1,0,1)425。在圖3的360處,調(diào)色板陣列每個目標(biāo)大小的區(qū)域的直方圖矢量被確定,并在370處與目標(biāo)直方圖矢量比較。優(yōu)選地,以下方程被用于確定兩個直方圖矢量之間的相似性S=Σk=1Nmin(hRk,hTk),]]>其中hR為區(qū)域的直方圖矢量,hT為目標(biāo)的直方圖矢量,而N為每個直方圖矢量中的維數(shù)或長度。在該實例中,圖4的矢量415(3,1,2,1,1,0,1)與圖2的目標(biāo)矢量250(4,3,2,2,1,1,1)的相似性為S=min(3,4)+min(1,3)+min(2,2)+min(1,2)+min(1,1)
+min(0,1)+min(1,1)S=3+1+2+1+1+0+1=9。
矢量425(3,3,2,2,1,0,1)與目標(biāo)矢量250(4,3,2,2,1,1,1)的相似性為S=min(3,4)+min(3,3)+min(2,2)+min(2,2)+min(1,1)+min(0,1)+min(1,1)S=3+3+2+2+1+0+1=12。
基于這兩個相似性測量,區(qū)域420(對應(yīng)于矢量425)被確定為比區(qū)域410較相似于目標(biāo)。這種相似性測量可基于最大可能值而被規(guī)格化到0-1的范圍,所述最大可能值為目標(biāo)直方圖矢量hT的分量之和。在這個實例中,最大值為14,并由此區(qū)域420被確定具有12/14或近似為0.86的規(guī)格化相似性測量,與之相比,對于區(qū)域410,為近似0.63的相似性測量。
應(yīng)指出,必須為搜索集或調(diào)色板400中的每個不同的目標(biāo)大小的區(qū)域而確定直方圖矢量。依照本發(fā)明的另一方面,每個區(qū)域的直方圖矢量是基于其直接相鄰的直方圖矢量而被確定的。例如,考慮圖4中豎直鄰接的目標(biāo)大小的區(qū)域450和460,區(qū)域460為由虛線邊框限定的區(qū)域。區(qū)域450的直方圖矢量為(1,1,0,2,0,1,1)。通過減值與區(qū)域450第一行中像素集關(guān)聯(lián)的索引的矢量值(對應(yīng)于在區(qū)域450內(nèi)但不在區(qū)域460內(nèi)的像素)并增值與區(qū)域450之下的行中的像素集關(guān)聯(lián)的索引的矢量值(對應(yīng)于在區(qū)域460內(nèi)但不在區(qū)域450內(nèi)的像素),區(qū)域460的直方圖矢量可被確定。在這個實例中,第七個調(diào)色板顏色的矢量值被減值,而第四個調(diào)色板顏色的矢量值被增值,給出了區(qū)域460的直方圖矢量(1,1,0,2+1,0,1,1-1)=(1,1,0,3,0,1,0)。以類似的方式,通過將從其它區(qū)域被“刪除”的豎直列中的索引的矢量值減值并將被“加”給其它區(qū)域以形成水平鄰接區(qū)域的豎直列中的索引的矢量值增值,與另一區(qū)域水平鄰接的區(qū)域的直方圖可被確定。這樣,在確定了第一目標(biāo)大小的區(qū)域的直方圖矢量后,每個隨后的直方圖矢量可通過有限數(shù)量的增值或減值運算來確定。
圖5A和5B示出對依照本發(fā)明用于搜索陣列重疊區(qū)域的搜索直方圖的遞歸確定的更有效的改進(jìn)。本實施例特別好地適合于被配置以直接實現(xiàn)矢量運算的系統(tǒng),如包含MMX技術(shù)的系統(tǒng)。
實例目標(biāo)區(qū)域450在圖5A中被示出;為便于參照,索引i,j被用于識別每個單元的行(i)和列(j)。區(qū)域左上的索引被用于識別該區(qū)域。例如,圖5B中的區(qū)域46 0被識別為區(qū)域(i+1,j),其位于與區(qū)域450相同的列(j),但位于下一個下面的行(i+1)。
對應(yīng)于區(qū)域450中的每行,直方圖矢量hh被示出。矢量hh(i,j)451對應(yīng)于在(i,j)處開始的目標(biāo)大小的行;hh(i+1,j)452作為其下面的行,等等。區(qū)域450的直方圖矢量455被示出為每個行矢量的矢量和,并被識別為hr(i,j)。
假定直方圖矢量hr(i,j)存在,則僅通過減去對應(yīng)于區(qū)域最上面行hh(i,j)451的直方圖矢量并加上對應(yīng)于區(qū)域450下面的行hr(i+4,j)464的直方圖矢量,就可計算對應(yīng)于區(qū)域460的直方圖矢量hr(i+1,j),如圖5B中所示。從算法上hr(i+1,j)= hr(i,j)+hh(i+w,j)-hh(i,j),其中w為區(qū)域的行數(shù)。應(yīng)指出,單個矢量的加和減提供了獨立于區(qū)域豎直大小w的對應(yīng)于區(qū)域的直方圖矢量確定。矢量加和減的速度依賴于矢量的維數(shù),其在本應(yīng)用中為調(diào)色板值的數(shù)量。調(diào)色板值的數(shù)量決定上述相似性測量的辨別能力,并由此依照本發(fā)明,該過程的速度直接關(guān)系到本發(fā)明直方圖比較過程的辨別能力。
以上方程被用于確定對應(yīng)于豎直列(j)中每個區(qū)域的直方圖矢量。在本發(fā)明的優(yōu)選實施例中,遞歸技術(shù)亦被用于鄰接豎直列(j+1)的處理。如以上所指出的,水平行矢量hh被用于在基本上獨立于區(qū)域豎直大小的時間內(nèi)計算區(qū)域直方圖矢量。以類似的方式,每個水平行矢量hh在基本上獨立于區(qū)域水平大小的時間內(nèi)被確定,如以下hh(i,j+1)=hh(i,j)hh(i,j+1)[p(i,j+m)]++hh(i,j+1)[p(i,j)]--,其中p(x,y)為調(diào)色板陣列中x,y位置處的調(diào)色板索引值,而m為區(qū)域的寬度。以上方程是用“C”語言編寫的,并對應(yīng)于設(shè)定鄰接的(i,j+1)直方圖矢量等于在先的(i,j)直方圖矢量;增值直方圖矢量中第p個矢量單元,其中p為直接與區(qū)域(i,j)的行的最后的水平單元鄰接的調(diào)色板陣列單元(i,j+m)的內(nèi)容;以及減值直方圖矢量中的第p個矢量單元,其中p為區(qū)域(i,j)的行的最先調(diào)色板陣列單元(i,j)的內(nèi)容。以這種方式,僅需要單個增值和減值運算以確定每個行矢量hh,而不管區(qū)域的水平大小m。
行矢量的這種遞歸確定的實例參照圖4的虛線邊框472內(nèi)單元(0-1-6-1)的行矢量確定而被示出,其直接鄰接于區(qū)域450的第二調(diào)色板行(4-0-1-6)。對應(yīng)于這個第二調(diào)色板行(4-0-1-6)的行矢量452(1,0,0,1,0,1,0)在圖5A中被示出。為從在先鄰接行的行矢量452來確定對應(yīng)于行472的矢量,矢量值首先被設(shè)定等于先前矢量452(1,0,0,1,0,1,0)。然后,對應(yīng)于被加上的調(diào)色板單元(“1”)473調(diào)色板值的矢量單元被增值(1+1,0,0,1,0,1,0),而對應(yīng)于被去掉的調(diào)色板單元(“4”)4 7 4的矢量單元被減值(1+1,0,0,1-1,0,1,0),從而形成對應(yīng)于所需單元行(0-1-6-1)472的矢量(2,0,0,0,0,1,0)。應(yīng)指出,由于在這個確定中僅需要先前行的最先和最后加一的調(diào)色板值,這種單個增值和減值過程是可用的,而不管單元行的寬度。
對于除形成目標(biāo)和搜索數(shù)據(jù)集的二維(i,j)陣列外的其它結(jié)構(gòu),可得出類似的方程,正如在考慮到本公開內(nèi)容時對本鄰域的普通技術(shù)人員來說這將是顯然的。例如,一維(線性)陣列對應(yīng)于常數(shù)(單位)值j,并且可單獨使用在緊接的上面所描述的鄰接水平行的遞歸確定,由此需要單個增值和減值運算以確定每個直方圖矢量。
優(yōu)選地,本發(fā)明被實施為可在處理系統(tǒng)上執(zhí)行的計算機(jī)程序,其有輔助硬件單元,如由該處理系統(tǒng)控制的圖像和矢量處理器。其它實施例對于本領(lǐng)域的普通技術(shù)人員來說將是顯然的。例如,調(diào)色板陣列400可由軟件例行程序在存儲器中生成,該例行程序亦確定目標(biāo)矢量和第一區(qū)域矢量。可提供“特定用途”集成電路如可編程門陣列,其被配置以‘步進(jìn)通過(step-through)’存儲器,比較目標(biāo)矢量與區(qū)域矢量,并且應(yīng)用以上限定的遞歸算法以確定每個隨后的區(qū)域矢量并重復(fù)該過程直到每個區(qū)域都已被評估。
上述僅示出了本發(fā)明的原理。由此將理解,本領(lǐng)域的技術(shù)人員將能設(shè)計各種安排,盡管未在此明確描述或示出,其亦實施本發(fā)明的原理并由此在以下權(quán)利要求的精神和范圍內(nèi)。
權(quán)利要求
1.一種比較兩個數(shù)據(jù)集的方法,包括-確定對應(yīng)于第一數(shù)據(jù)集內(nèi)值的分布的第一直方圖,-確定對應(yīng)于第一數(shù)據(jù)集內(nèi)特定數(shù)量不同值的多個調(diào)色板值,-確定對應(yīng)于第一直方圖的第一直方圖矢量,第一直方圖矢量包括每個都對應(yīng)于多個調(diào)色板值中的調(diào)色板值的單元,-識別對應(yīng)于多個調(diào)色板值的第二數(shù)據(jù)集內(nèi)的值,-確定對應(yīng)于第二數(shù)據(jù)集內(nèi)值的第二直方圖矢量,以及-將第一直方圖矢量和第二直方圖矢量比較。
2.權(quán)利要求1的方法,其中確定第二直方圖矢量包括第二直方圖矢量的遞歸確定,其基于先前被確定的直方圖矢量以及被包含于先前被確定的直方圖矢量內(nèi)但不被包含于第二直方圖矢量內(nèi)的單元和被包含于第二直方圖矢量內(nèi)但不被包含于先前被確定的直方圖矢量內(nèi)的單元。
3.權(quán)利要求2的方法,其中遞歸確定包括-基于相應(yīng)的一個或多個先前的行矢量而確定一個或多個行矢量,以及-基于先前被確定的直方圖矢量和一個或多個行矢量而確定第二直方圖矢量。
4.權(quán)利要求1的方法,其中第一數(shù)據(jù)集對應(yīng)于目標(biāo)圖像的第一像素值,而第二數(shù)據(jù)集對應(yīng)于源圖像的第二像素值。
5.權(quán)利要求4的方法,其中第一像素值和第二像素值對應(yīng)于每個像素的色彩分量、飽和度分量和亮度分量的至少一個。
6.權(quán)利要求1的方法,其中多個調(diào)色板值對應(yīng)于第一數(shù)據(jù)集內(nèi)的值,其具有比第一數(shù)據(jù)集內(nèi)其它值高的第一直方圖內(nèi)的頻數(shù)。
7.權(quán)利要求1的方法,其中不同值的特定數(shù)量基本上小于第一數(shù)據(jù)集內(nèi)可能不同值的最大數(shù)量。
8.權(quán)利要求1的方法,進(jìn)一步包括將第一和第二數(shù)據(jù)集內(nèi)的值映射到多個直方圖類,并且其中每個調(diào)色板值對應(yīng)于多個直方圖類中的直方圖類。
9.權(quán)利要求1的方法,其中識別第二數(shù)據(jù)集內(nèi)的值包括-生成對應(yīng)于識別多個調(diào)色板值中調(diào)色板值的每次出現(xiàn)的第二數(shù)據(jù)集的調(diào)色板數(shù)據(jù)集,而確定第二直方圖矢量包括-提供調(diào)色板數(shù)據(jù)集內(nèi)每個調(diào)色板值出現(xiàn)數(shù)的計數(shù)。
10.權(quán)利要求1的方法,其中-第二數(shù)據(jù)集是包括第三數(shù)據(jù)集的較大數(shù)據(jù)集的子集,該第三數(shù)據(jù)集與第二數(shù)據(jù)集重疊,-第三數(shù)據(jù)集具有第三直方圖矢量,并且-確定第二直方圖包括-使第二直方圖矢量等于第三直方圖矢量;-對被包括于第三數(shù)據(jù)集內(nèi)但不被包括于第二數(shù)據(jù)集內(nèi)的調(diào)色板值而減值第二直方圖矢量,并且-對被包括于第二數(shù)據(jù)集內(nèi)但不被包括于第三數(shù)據(jù)集內(nèi)的調(diào)色板值而增值第二直方圖矢量。
11.權(quán)利要求10的方法,其中-對被包括于第三數(shù)據(jù)集內(nèi)但不被包括于第二數(shù)據(jù)集內(nèi)的一個或多個段確定第一中間矢量,-對被包括于第二數(shù)據(jù)集內(nèi)但不被包括于第三數(shù)據(jù)集內(nèi)的一個或多個段而確定第二中間矢量,并且-減值第二直方圖矢量包括減去第一中間矢量,而-增值第二直方圖矢量包括加上第二中間矢量。
12.權(quán)利要求1的方法,進(jìn)一步包括-識別對應(yīng)于多個調(diào)色板值的多個數(shù)據(jù)集內(nèi)每個中的值,-確定對應(yīng)于多個數(shù)據(jù)集內(nèi)值的多個其它直方圖矢量,-將第一直方圖矢量與多個直方圖中的每個比較,以及-基于將第一直方圖矢量與第二直方圖矢量和多個直方圖矢量中的每個比較,識別最相似于第一數(shù)據(jù)集的多個數(shù)據(jù)集內(nèi)選擇的一個。
13.一種計算機(jī)程序,當(dāng)由處理系統(tǒng)執(zhí)行時,其被配置以實現(xiàn)以下操作-生成對應(yīng)于第一數(shù)據(jù)集內(nèi)值的分布的第一直方圖,-確定對應(yīng)于第一數(shù)據(jù)集內(nèi)特定數(shù)量不同值的多個調(diào)色板值,-確定對應(yīng)于第一直方圖的第一直方圖矢量,-第一直方圖矢量包括每個都對應(yīng)于多個調(diào)色板值中調(diào)色板值的單元,-識別對應(yīng)于多個調(diào)色板值的第二數(shù)據(jù)集內(nèi)的值,-確定對應(yīng)于第二數(shù)據(jù)集內(nèi)值的第二直方圖矢量,以及-比較第一直方圖矢量和第二直方圖矢量。
14.權(quán)利要求13的計算機(jī)程序,其中該計算機(jī)程序被進(jìn)一步配置以通過實現(xiàn)以下操作、基于目標(biāo)與多個數(shù)據(jù)集中每個的相似性而識別多個數(shù)據(jù)集的所選數(shù)據(jù)集,包括第二數(shù)據(jù)集-識別對應(yīng)于多個調(diào)色板值的多個數(shù)據(jù)集內(nèi)每個中的值,-確定多個直方圖矢量,每個直方圖矢量對應(yīng)于多個數(shù)據(jù)集內(nèi)每個中的值,-比較第一直方圖矢量和每個直方圖矢量以確定與每個直方圖矢量關(guān)聯(lián)的比較測量,以及-基于與每個直方圖矢量關(guān)聯(lián)的比較測量,識別所選數(shù)據(jù)庫。
15.權(quán)利要求14的計算機(jī)程序,其中第一數(shù)據(jù)集(210)對應(yīng)于目標(biāo)圖像的第一像素值,而多個數(shù)據(jù)集中的每個對應(yīng)于每個數(shù)據(jù)集的像素值。
16.權(quán)利要求15的計算機(jī)程序,其中第一像素值和第二像素值對應(yīng)于每個像素的色彩分量、飽和度分量和亮度分量的至少一個。
17.一種圖像處理系統(tǒng),包括處理器,其被配置以-生成對應(yīng)于第一數(shù)據(jù)集內(nèi)值的分布的第一直方圖,-確定對應(yīng)于第一數(shù)據(jù)集內(nèi)特定數(shù)量不同值的多個調(diào)色板值,-確定對應(yīng)于第一直方圖的第一直方圖矢量,-第一直方圖矢量包括每個都對應(yīng)于多個調(diào)色板值中調(diào)色板值的單元,-識別對應(yīng)于多個調(diào)色板值的第二數(shù)據(jù)集內(nèi)的值,-確定對應(yīng)于第二數(shù)據(jù)集內(nèi)值的第二直方圖矢量,以及-比較第一直方圖矢量和第二直方圖矢量;和-存儲器,被操作地耦合于處理器,其被配置以存儲對應(yīng)于多個調(diào)色板值的第二數(shù)據(jù)集內(nèi)值的表示,從而便于確定第二直方圖矢量。
18.權(quán)利要求17的圖像處理系統(tǒng),進(jìn)一步包括特定用途的設(shè)備,其被配置以基于被存儲于存儲器中值的表示而確定第二直方圖矢量。
全文摘要
提供了一種直方圖比較過程,其比較第一數(shù)據(jù)集的直方圖矢量與第二數(shù)據(jù)集的相應(yīng)直方圖矢量。第一和第二數(shù)據(jù)集的直方圖矢量從所選幾個直方圖類的直方圖值而被形成,所選幾個類為包含最高頻數(shù)的第一數(shù)據(jù)集的類。第二數(shù)據(jù)集的特征在于僅使用第一數(shù)據(jù)集的所選幾個類;有屬于其它類的值的數(shù)據(jù)項被忽略。調(diào)色板數(shù)據(jù)集對應(yīng)于第二數(shù)據(jù)集而被生成,其中第三數(shù)據(jù)集內(nèi)的數(shù)據(jù)項對應(yīng)于第一數(shù)據(jù)集的所選類的索引,或者對于被忽略的數(shù)據(jù)項,為零索引。基于第三數(shù)據(jù)集,對應(yīng)于重疊區(qū)域的直方圖被遞歸地確定。若給出對應(yīng)于第一區(qū)域的直方圖,則僅通過增值位于第二區(qū)域但不位于第一區(qū)域內(nèi)單元的索引的頻數(shù)并減值位于第一區(qū)域但不位于第二區(qū)域內(nèi)單元的索引的頻數(shù),第二、重疊區(qū)域的直方圖被確定。
文檔編號G06K9/32GK1462411SQ02801488
公開日2003年12月17日 申請日期2002年5月7日 優(yōu)先權(quán)日2001年5月11日
發(fā)明者M·特拉科維克 申請人:皇家菲利浦電子有限公司