專利名稱:利用空間相干性設(shè)定主色的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及多媒體搜索。具體而言,本發(fā)明涉及設(shè)定主色的方法,其中包含了主色作為用于搜索多媒體數(shù)據(jù)的特征。
簡而言之,可以通過以下方法來確定主色利用給定區(qū)域的平均顏色值;選擇一種出現(xiàn)頻率最高的顏色;選擇n種出現(xiàn)頻率最高的顏色;利用在指定區(qū)域超過p%的顏色;或者利用分布圖,等等。
上述的每種方法都有自己的優(yōu)點和缺點。
例如,利用分布圖的方法可以很好地表示顏色。但是,它需要大量的數(shù)據(jù),并且有時候會把只占區(qū)域中極小部分的顏色設(shè)定為主色。
另一種利用單個平均值的方法具有數(shù)據(jù)信息量小的優(yōu)點,并且能夠在基于內(nèi)容的搜索中實現(xiàn)預(yù)過濾的功能。但是,如果該區(qū)域是由多種顏色組成,則很難準確地表示主色。
但是,考慮到圖象的特征通常是形形色色的,而且通常難以用單個的顏色值表示各種顏色,僅僅利用一種主色來表示圖象區(qū)域的方法無法恰當或者充分地表示圖象的全部特征,也無法構(gòu)建精確的圖象特征數(shù)據(jù)庫,從而降低利用這樣的特征數(shù)據(jù)庫進行圖象搜索的性能。
另外,在多種顏色的基礎(chǔ)上表示區(qū)域主色的方法不僅占用很大的存儲空間,而且難以精確地表示顏色間的相互關(guān)系。在很多情況下,也難以根據(jù)給定圖象區(qū)域的顏色分布確定主色,由這種方法獲取的主色值缺乏精度。
考慮到上述的所有問題,本發(fā)明的發(fā)明人提出了一種新的描述給定圖象區(qū)域的顏色信息的方法,其中圖象區(qū)域由幾個主色和它們的頻率(主色在給定區(qū)域中的比率,百分比%),定義主色的空間相干性(其被稱為可靠性),利用這個可靠性和主色來進行圖象搜索,以提高圖象搜索的性能。韓國專利申請NO.1999-3181(對應(yīng)于2000年1月10日提交的美國專利申請No.09/479,888和1999年12月31日提交的PCT申請No.PCT/KR99/00849)和韓國專利申請NO.1999-26784(對應(yīng)于2000年7月3日提交的美國專利申請No.09/609,392和PCT申請No.PCT/KR00/00710)中敘述了這種方法。
這里,空間相干性可以是關(guān)于指定圖象區(qū)域的主色的可靠程度的線索或信息,還指示了主色在該圖象區(qū)域中混合的密集程度。
因此,當與主色一起定義了空間相干性的時候,在進行圖象搜索的時候可以知道主色的可靠程度,在此基礎(chǔ)上,可以實現(xiàn)更高級的搜索。
因此可以得出結(jié)論,用空間相干性表示主色可靠性的精確程度顯著地影響圖象搜索的性能。
所以,空間相干性簡單的均勻量化顯然不足以反映圖象的各種特征。因此需要更好的空間相干性的量化方案。
發(fā)明內(nèi)容
因此,本發(fā)明是方向是用于設(shè)定主色的方法,其可以從根本上消除因現(xiàn)有技術(shù)的限制和缺點而帶來的一個或多個問題。
本發(fā)明的一個目的是提供一種設(shè)定主色的方法,特別是主色被用作多媒體數(shù)據(jù)的特征的時候,其利用主色的空間相干性來改善多媒體數(shù)據(jù)搜索的性能。
為了實現(xiàn)上述的和其它的優(yōu)點,根據(jù)本發(fā)明的目的,正如在此作為實施例并詳細敘述的,提供了一種設(shè)定主色的方法,其中主色由主色值、頻率、及其空間相干性表示,空間相干性在預(yù)定的閾值基礎(chǔ)上進行非均勻量化。
根據(jù)本發(fā)明的一個方面,在預(yù)定閾值的基礎(chǔ)上將空間相干性劃分為指定的多個段,以將對應(yīng)于各個段的空間相干性量化為特定的值,或者均勻量化特定段的空間相干性,從而使得整體的空間相干性是不均勻量化的。
根據(jù)本發(fā)明的一個優(yōu)選實施例,提供了一種設(shè)定主色的方法,以利用表示指定圖象區(qū)域的主色和主色的空間相干性(SC)來描述指定的圖象區(qū)域,該方法包括將空間相干性與預(yù)定的閾值進行比較;根據(jù)空間相干性和預(yù)定閾值之間的比較,通過映射對應(yīng)于空間相干性的量化空間相干性(QSC)來對空間相干性進行非均勻量化。
優(yōu)選的是,將空間相干性標準化為0~1的實數(shù),將閾值設(shè)定為0.70。
更為優(yōu)選的是,如果空間相干性小于閾值0.70,則將相應(yīng)的空間相干性的量化值映射為“1”,對于空間相干性為0.70~1之間的區(qū)域,剩余的量化為均勻量化。
優(yōu)選的是,利用量化空間相干性(QSC)的“0”值來作為表示該空間相干性無效或未計算的信號。
根據(jù)本發(fā)明的另一個優(yōu)選實施例,提供了一種對圖象主色的空間相干性進行量化的方法,該方法包括將空間相干性標準化為0~1;按照5位(0~31)為空間相干性指定預(yù)定數(shù)目的位;以及根據(jù)標準化的預(yù)定閾值,將空間相干性非均勻地量化為1~31的范圍內(nèi)。
優(yōu)選的是,如果空間相干性的標準化值小于閾值0.70,則將量化空間相干性(QSC)設(shè)定為1,而0.70~1范圍內(nèi)的空間相干性值被均勻量化至2~31的范圍內(nèi)。
更為優(yōu)選的是,利用量化空間相干性(QSC)的“0”值來表示這個元素未計算。
可以理解,本發(fā)明以上的綜述和以下的詳細說明都是示例性的和說明性的,旨在對由權(quán)利要求所限定的本發(fā)明進行進一步的解釋。
優(yōu)選實施例本發(fā)明實施例的下面的詳細說明(如
圖1-3所示)不是用于限制本發(fā)明的范圍,如所說明的那樣,它只是本發(fā)明的優(yōu)選實施例的一個代表。在說明書中,不同圖中的相同的參考標號表示相同的元件。說明書中所提供的內(nèi)容只是用于增進對本發(fā)明的綜合理解。因此,顯然如果沒有所定義的這些內(nèi)容,本發(fā)明也可以實現(xiàn)。同樣,公知的功能和結(jié)構(gòu)這里就不詳細描述了,因為這些不必要的細節(jié)可能會不利于對本發(fā)明的理解。
本發(fā)明提出了一種用于設(shè)置主色、特別是在給定的圖象區(qū)域的主色和該主色的空間相干性一起進行表示的時候設(shè)置主色的方法,該方法包括步驟把空間相干性和預(yù)定的閾值進行比較,根據(jù)上述比較結(jié)果,通過把與上述空間相干性相對應(yīng)的量化的空間相干性(QSC)進行映射,實現(xiàn)對該空間相干性的非均勻量化。
優(yōu)選地,把空間相干性標準化為從實數(shù)0到1之間,而把本發(fā)明的方法中所使用的閾值設(shè)置為0.70。
如果量化的空間相干性(QSC)為“0”,其意味著空間相干性是無效的。
相反,如果空間相干性小于閾值0.70,就把用于相應(yīng)的空間相干性的量化值映射為“1”(QSC=1),按照剩余的量化值的數(shù)目,把均勻的量化應(yīng)用于空間相干性從0.70到1的區(qū)域中。此處,均勻量化根據(jù)下面的公式執(zhí)行量化的空間相干性(QSC)=(int)[(SC-0.7)/(1.0-0.7)×(2.0SC_BIT-2.0)+0.50]+2,
其中SC_BIT表示分配給量化作用的位數(shù)。
在本發(fā)明的一個實施例中,空間相干性被量化為1位,如果空間相干性比閾值0.7小,QSC就變?yōu)?,如果空間相干性比閾值0.7大,QSC就變?yōu)?。
優(yōu)選地,本發(fā)明中所使用的閾值可以由兩個閾值來設(shè)置,也就是,第一個閾值為0.62,第二個閾值為0.7。
在本發(fā)明的另一個實施例中,空間相干性被量化為2個或更多個位,如果此時的空間相干性小于0.62(SC<0.62),QSC就變?yōu)?。反之,如果空間相干性在0.62和0.7之間(0.62≤SC≤0.7)時,則QSC為1,如果空間相干性為0.7或大于0.7時,按照剩余的量化值的數(shù)目,把均勻的量化應(yīng)用于空間相干性從0.70到1的區(qū)域中。與上面相類似,均勻量化根據(jù)下面的公式執(zhí)行量化的空間相干性(QSC)=(int)[(SC-0.7)/(1.0-0.7)×(2.0SC_BIT-3.0)+0.50]+2,其中SC_BIT表示分配給量化作用的位數(shù),它為兩個或多個位(SC_BIT≥2)。
下面將參照相關(guān)附圖解釋利用空間相干性設(shè)置主色的方法。
如上所述,本方法的主要目的是提高圖象搜索的性能,這主要是通過以下方法實現(xiàn)根據(jù)幾種主色、它們的頻率(一給定區(qū)域中主色所占百分比)以及與主色相對應(yīng)的空間相干性來描繪一個圖象區(qū)域;以及在多媒體數(shù)據(jù)搜索過程中利用主色來開發(fā)空間相干性。
通常采用的設(shè)置主色的方法包括使用區(qū)域中平均色值的方法;利用出現(xiàn)頻率最高的顏色來表示主色的方法;利用出現(xiàn)頻率最高的n種顏色來表示主色的方法(n為一預(yù)定數(shù)字);利用指定區(qū)域中所占百分比大于p%的顏色的方法;或利用分布圖的方法。
優(yōu)選地,空間相干性用用于一個區(qū)域或一幅圖象的整個主色的單一值來表示(SC對于全體主色的空間相干性)。
如前所述,本發(fā)明的空間相干性的值是非均勻量化的,目的是改善圖象搜索的性能。
此處,空間相干性SC是根據(jù)以下公式得到的SC=∑對所有iCOH_Ci×COUNT_PELS_Ci/TOTAL_PELS_OF_R此處,COH_Ci是Ci的每個主色的相干性;COUNT_PELS_Ci是區(qū)域R中Ci的象素數(shù)目;TOTAL_PELS_OF_R是通過對區(qū)域R中的象素計數(shù)而計算出的區(qū)域R的大小。
為了獲得空間相干性,空間相干性的值首先要指定為一個初始值“0”(設(shè)置SC=0),用于對象素值(SUM_COUNG_PELS)計數(shù)的變量要指定為“0”。
在此之后,為給定區(qū)域R中的所有象素指定VISITEDPELP=FALSE,然后,考慮到整個主色(Ci)就可以獲得COH_Ci和COUNT_PELS_Ci。
要得到最終的空間相干性,SC要加上COH_Ci×COUNT_PELS_Ci(即,SC=SC+COH_Ci×COUNT_PELS_Ci),然后被TOTAL_PELS_OF_R除(即SC=SC/TOTAL_PELS_OF_R)。
特別地,COH_Ci(Ci的整個主色相干性)和COUNT_PELS_Ci按如下方式獲得首先,先確定相干性檢驗屏蔽(CCM)的大小。例如,CCM可以通過把CCM_WIDTH(=3)與CCM_HEIGHT(=3)相乘得到。把初始COUNT_PELS_Ci設(shè)置為0,TOTAL_NUM_COHERENT也設(shè)置為0。對于區(qū)域R中的全部象素PELj,如果滿足關(guān)系Ci=COLOR_OF_PELj&VISITED_PELj=FALSE,則VISITED_PELj就為真(也就是,VISITED_PELj=TRUE),并且COUNT_PELS_Ci增加1(也就是COUNT_PELS_Ci=COUNT_PELS_Ci+1)。對于下面的操作要把PELj調(diào)整到CCM的中心。
除了中心象素PELj之外,如果對于所有的其他被屏蔽的象素Ci=COLOR_OF_MASKED_PEXELk,它們都增加TOTAL_NUM_COHERENT++。
下一步,利用下面的公式計算COH_Ci,COH_Ci=TOTAL_NUM COHERENT/COUNT_PELS_Ci/(CCM_WIDTH*CCM_HEIGHT-1)。然后,利用所得到的COH_Ci和COUNT_PELS_Ci,根據(jù)下面的公式就可以得到空間相干性∑foralliCOH_Ci×COUNT_PELS_Ci/TOTAL_PELS_OF_R把由上面的算法確定的空間相干性用0和1之間的實數(shù)進行標準化。然后把最終的空間相干性量化為1個位,2個位,3個位,4個位或5個位。
例如,如果把空間相干性量化為1個位,QSC(量化的空間相干性)就取0或1;如果把空間相干性量化為2個位,QSC(量化的空間相干性)就取0,1,2或3;如果把空間相干性量化為3個位,QSC(量化的空間相干性)就取0,1,2,3,4,5,6或7;如果把空間相干性量化為4個位,QSC就(量化的空間相干性)就取0,1,2,……14或15;如果把空間相干性量化為5個位,QSC就(量化的空間相干性)就取0,1,2,……30或31。
因此,空間相干性的量化方案主要可以歸類為一個均勻的量化方案和非均勻的量化方案,在均勻量化方案中,空間相干性可被均勻地從0到1進行劃分來映射每個量化值;在非均勻的量化方案中,0到1之間的部分被非均勻劃分來映射每個量化值。優(yōu)選地,在本發(fā)明中,即使使用相對較少的位數(shù),也應(yīng)用非均勻的量化方案以改善搜索功能。
更具體地說,根據(jù)本發(fā)明的空間相干性的非均勻的量化方案被分為一種情況用“0”代表量化值,和一種情況排除(不使用)“0”代表量化值。
在一些情況下,不用“0”代表量化值,由于“0”已用于代表其它,即‘SC為無效’。例如,當空間相干性被量化為2個位時,QSC(量化空間系數(shù))被映射為1,2或3。
圖1說明了本發(fā)明的第一實施例,其中“0”不用于代表量化值,閾值0.70用于代表非均勻量化。
首先,算出了空間相干性(S101)。然后,將空間相干性與閾值0.70相比較(S102)。如果空間相干性小于0.70,則QSC被映射為1(S103),而如果空間相干性大于閾值0.70,剩余量化數(shù)量繼續(xù)均勻量化直到空間相干性從0.70到1的區(qū)域(S104)。
換言之,QSC基于下述公式進行非均勻量化(S105)
(QSC)=(int)[(SC-0.7)/(1.0-0.7)×(2.0SC_BIT-2.0)+0.5]+2其中,SC_BIT為賦給量化的位數(shù)。例如,SC_BIT可為2位,3位,4位或5位。
圖2和圖3顯示了根據(jù)本發(fā)明的第二優(yōu)選實施例和第三優(yōu)選實施例利用量化值“0”來量化空間相干性的方法。
如果用量化值0量化空間相干性,則已量化的空間相干性可以包括量化值“0”的方式表述。例如,如果空間相干性被量化為2位,已量化空間相干性(QSC)被映射為0,1,2或2。
特別地,圖2說明了僅利用量化值“0”和利用1位來量化空間相干性的方法。
參見圖2,首先算出空間相干性(S201),然后其與閾值0.70比較(S202)。
比較的結(jié)果,如果空間相干性小于0.70,則QSC被映射為0量化值。同時,如果空間相干性大于0.70,QSC被映射為1量化值。
另一方面,圖3所示的第三優(yōu)選實施說明了獲得已量化的空間相干性(QSC)的方法,特別是當利用大于1位,如2位、3位、4位或5位來量化空間相干性時。
此外,如前所述首先算出空間相干性(S301),但這一次其與閾值0.62和0.7比較(S302)。
如果空間相干性小于0.62,則QSC被映射為0量化值(S303),如果空間相干性大于或等于0.62并且小于0.70(0.62≤SC<0.70),QSC被映射為1量化值(S304)。
同時,如果空間相干性大于或等于0.70,按照剩余量化位數(shù)將非均勻量化應(yīng)用于具有從0.70到1的空間相干性的區(qū)域(S305)。
換言之,QSC基于下述公式進行均勻量化(S305)(QSC)=(int)[(SC-0.7)/(1.0-0.7)×(2.0SC_BIT-3.0)+0.5]+2其中,SC_BIT為賦給量化的位數(shù)。例如,SC_BIT可為2位,3位,4位或5位。
如前所述,當一圖像或圖像區(qū)域被一主色表示時,如果主色頻率和主色的空間相干性被與主色一起表示時,并且如果空間相干性為非均勻量化,即使采用相對較小的位數(shù)也可能提高圖像搜索的性能。
為了利用主色信息(主色值,顏色頻率,顏色的空間相干性)來進行更好的圖像搜索,可以將某個圖像區(qū)域(或整個圖像)與另一個圖像區(qū)域進行比較。也就是,將從每一個圖像區(qū)域抽取的幾個主色、主色的頻率、和主色的空間相干性與另一個區(qū)域的這些信息匹配以進行比較。
這樣做,使用下述公式算出用來反映兩個將被比較的圖像區(qū)域(或整個圖像)間的近似性的誤差Diff(D1,D2)Diff(D1,D2)=W1×SC_Diff×DC_Diff+W2×DC_Diff通過此種方式,發(fā)現(xiàn)兩個圖像區(qū)域(或整個圖像)的相似性。
在上述公式中,W1表示權(quán)重SC_Diff。例如,W1可被賦為0.3(W1=0.3)。然而,如果空間相干性無效,W1被賦為0(W1=0)。同樣地,W2表示右邊第二項的權(quán)重DC_Diff。例如,W2可被賦為0.7(W2=0.7)。
這里,SC_Diff為將被比較的兩個圖像區(qū)域(或整個圖像)的每一個空間相干性的差異的絕對值,并且DC_Diff為將被比較的兩個圖像(或整個圖像)的主色值間的差值。
總之,本發(fā)明對提高搜索的性能是很有利的。特別地,在搜索期間,通過結(jié)合頻率和空間相干性將主色表示為圖像搜索,其中空間相干性被基于預(yù)先確定的閾值進行非均勻量化。因此,即使采用相對較小的位數(shù),空間相干性能夠表示主色的可靠性并且提供更為改善的圖像搜索的性能。
盡管本發(fā)明已被結(jié)合各種實施例進行了描述,這些描述僅僅是示例性的。因此,根據(jù)前述的詳細的描述,許多替換、修改和變化對于本領(lǐng)域熟練的技術(shù)人員來說是顯而易見的。前面的說明應(yīng)包容所有此類替換和變化位于所附的權(quán)利要求的精神和范圍內(nèi)。
權(quán)利要求
1.一種利用表示指定圖象區(qū)域的主色和所述主色的空間相干性(SC)來設(shè)定主色以描述指定圖象區(qū)域的方法,所述方法包括將所述空間相干性與預(yù)定的閾值進行比較;在所述空間相干性和所述預(yù)定閾值之間的比較的基礎(chǔ)上,通過映射對應(yīng)于所述空間相干性的量化空間相干性(QSC)來對所述空間相干性進行非均勻量化。
2.根據(jù)權(quán)利要求1所述的方法,其中,將所述空間相干性標準化為0~1之間,將所述閾值設(shè)定為0.70。
3.根據(jù)權(quán)利要求1所述的方法,其中,所述量化空間相干性(QSC)的“0”值表示所述空間相干性無效。
4.根據(jù)權(quán)利要求2所述的方法,其中,如果所述空間相干性小于閾值0.70,將相應(yīng)的空間相干性的量化值映射為“1”,對于空間相干性為0.70~1之間的區(qū)域,剩余的量化全部為均勻量化。
5.根據(jù)權(quán)利要求4所述的方法,其中,量化空間相干性(QSC)的均勻量化是根據(jù)以下的公式進行的(QSC)=(int)[(SC-0.7)/(1.0-0.7)×(2.0SC_BIT-2.0)+0.5]+2其中,SC_BIT是分配給量化的位數(shù)。
6.根據(jù)權(quán)利要求2所述的方法,其中,所述空間相干性進行1位量化,如果所述空間相干性小于所述閾值0.70,則QSC變成0(QSC=0),而如果所述空間相干性大于所述閾值0.70,則QSC變成1(QSC=1)。
7.根據(jù)權(quán)利要求1所述的方法,其中,所述閾值包括第一閾值0.62和第二閾值0.70。
8.根據(jù)權(quán)利要求7所述的方法,其中,所述空間相干性進行2位或更多位的量化,如果所述空間相干性小于所述第一閾值0.62(SC<0.62),則QSC變成0(QSC=0);如果所述空間相干性大于等于所述第一閾值0.62并且小于所述第二閾值0.70(0.62≤SC<0.70),則QSC變成1(QSC=1);如果所述空間相干性大于或等于0.70(0.70≤SC),則對空間相干性為0.70~1的區(qū)域進行均勻量化。
9.根據(jù)權(quán)利要求8所述的方法,其中,量化空間相干性(QSC)的均勻量化是根據(jù)以下的公式進行的(QSC)=(int)[(SC-0.7)/(1.0-0.7)×(2.0SC_BIT-3.0)+0.5]+2其中,SC_BIT是分配給量化的位數(shù)。
10.一種對圖象主色的空間相干性進行量化的方法,包括將所述空間相干性標準化為0~1;將空間相干性的預(yù)定位數(shù)指定為5位(0~31);以及根據(jù)標準化的預(yù)定閾值,將所述空間相干性非均勻量化為1~31的范圍內(nèi),其中,如果所述空間相干性的標準化值小于閾值0.70,則將量化空間相干性(QSC)設(shè)定為1,而將0.70~1之間的空間相干性值均勻量化至2~31的范圍。
11.根據(jù)權(quán)利要求10所述的方法,其中,利用量化空間相干性的“0”值來表示這個元素未計算。
12.根據(jù)權(quán)利要求10所述方法,其中,量化空間相干性(QSC)的均勻量化是根據(jù)以下的公式進行的(QSC)=(int)[(SC-0.7)/(1.0-0.7)×(2.0SC_BIT-2.0)+0.5]+2其中,SC_BIT是分配給量化的位數(shù)。
全文摘要
本發(fā)明公開了一種用于利用空間相干性設(shè)置主色以提高圖像搜索功能的性能的方法,其描述了基于幾種主色的圖像區(qū)域,每一個主色的頻率,和主色的空間相干性(SC)。根據(jù)本發(fā)明的方法,基于預(yù)先確定的閾值對空間相干性進行非均勻量化。根據(jù)本發(fā)明的優(yōu)選實施例,空間相干性(SC)在0和1之間取值并且閾值被設(shè)為0.70。
文檔編號G06T7/40GK1366262SQ0210237
公開日2002年8月28日 申請日期2002年1月18日 優(yōu)先權(quán)日2001年1月18日
發(fā)明者金賢埈 申請人:Lg電子株式會社