一種基于群稀疏特征選擇的圖像檢索方法
【專利摘要】本發(fā)明公開了一種基于群稀疏特征選擇的圖像檢索方法,包括特征選擇與圖像檢索兩部分,其中特征選擇步驟包括選取圖像對(duì)、提取多種特征、形成特征差異矩陣、建立群稀疏邏輯回歸模型、運(yùn)用優(yōu)化算法求解權(quán)重、選擇出最優(yōu)特征;圖像檢索步驟包括提取圖像庫所有圖像的最優(yōu)特征、形成圖像特征庫、提取查詢圖像最優(yōu)特征、相似度比較、求出最大相似度圖像序號(hào)、輸出檢索圖像。本發(fā)明運(yùn)用自適應(yīng)譜梯度算法有效的求解群稀疏邏輯回歸模型,具有更快的收斂速度,更少的運(yùn)行時(shí)間。傳統(tǒng)的基于內(nèi)容的圖像檢索,特征的選擇是特定的,本發(fā)明用全部訓(xùn)練特征進(jìn)行圖像檢索相比,在相同的實(shí)驗(yàn)條件下,圖像的查準(zhǔn)率明顯提高,圖像檢索的效率增強(qiáng)。
【專利說明】一種基于群稀疏特征選擇的圖像檢索方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及圖像信息處理【技術(shù)領(lǐng)域】,尤其涉及一種基于群稀疏特征選擇的圖像檢索方法。
【背景技術(shù)】
[0002]隨著數(shù)據(jù)庫技術(shù)、多媒體技術(shù)、網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,人們?cè)絹碓蕉嗟亟佑|到擁有大量數(shù)字圖像的數(shù)據(jù)庫,為了對(duì)圖像庫進(jìn)行有效管理,人們急切的需要高效的圖像檢索系統(tǒng)。由于技術(shù)原因,目前許多流行的商用Web圖像搜索引擎,如Google、百度、360搜索等等都是傳統(tǒng)的基于文本的圖像檢索。基于文本的圖像檢索采用Web網(wǎng)頁中與圖像關(guān)聯(lián)的文字信息來完成搜索任務(wù),但是它有如下的缺點(diǎn):1.描述能力有限,例如對(duì)紋理,不規(guī)則形狀等無法精確描述。2.描述具有主觀性,不同人對(duì)同一副圖像的描述可能不同。3.在現(xiàn)代社會(huì)海量的圖像面前,每一幅圖像皆有詳細(xì)的文本描述顯然這是不現(xiàn)實(shí)的。為了克服傳統(tǒng)檢索方法的局限性,基于內(nèi)容的圖像檢索技術(shù)應(yīng)運(yùn)而生?;趦?nèi)容的圖像檢索采用的做法是預(yù)先采用某些特征提取算法抽取圖像的低層特征(如顏色、紋理和形狀等)并形成一個(gè)特征庫。然后提取查詢圖像的特征并與特征庫進(jìn)行匹配以尋找相似的圖像。由于這些特征都是客觀獨(dú)立地存在于圖像中的,因此這種圖像檢索方法的主要特點(diǎn)是利用圖像本身包含的客觀視覺特性,不需要人為干預(yù)和解釋,能夠通過計(jì)算機(jī)自動(dòng)實(shí)現(xiàn)對(duì)圖像特征的提取和存儲(chǔ)。因此基于內(nèi)容的圖像檢索技術(shù)已迅速成為圖像數(shù)據(jù)庫技術(shù)中的研究熱點(diǎn)之一,并得到了國內(nèi)外信息領(lǐng)域科技人員的廣泛重視和研究?;趦?nèi)容的圖像檢索,這個(gè)概念是于1992年最先由T.Kato提出的,經(jīng)過這20年的研究,國內(nèi)外的許多高校和研究機(jī)構(gòu)投入了大量的資金、人力和物力進(jìn)行研究,并取得了一定的成果。如IBM公司開發(fā)的QBIC系統(tǒng),Virage公司開發(fā)的Virage系統(tǒng),MIT的多媒體實(shí)驗(yàn)室開發(fā)的Photobook系統(tǒng),哥倫比亞大學(xué)開發(fā)的VisualSEEK和WebSEEK系統(tǒng),中國科學(xué)院計(jì)算機(jī)技術(shù)研究所智能信息處理重點(diǎn)實(shí)驗(yàn)室研發(fā)的Mires系統(tǒng)等等。
[0003]圖像特征的提取是基于內(nèi)容的圖像檢索的第一步也是最為關(guān)鍵的一步。圖像的特征包括低層視覺特征(包括顏色、紋理、形狀等)和高層語義特征(主體對(duì)象、行為特征、情感特征等)。由于目前圖像理解、計(jì)算機(jī)視覺等領(lǐng)域的研究水平還很有限,使得現(xiàn)有的對(duì)基于內(nèi)容的圖像檢索技術(shù)的研究和應(yīng)用均是基于圖像的低層視覺特征來進(jìn)行的,還無法在真正意義上做到基于高層語義的圖像檢索。不同的圖像低層視覺特征都具有其獨(dú)特的性質(zhì)和適合的應(yīng)用場(chǎng)合,例如顏色特征適用于顏色信息較為豐富,且圖像之間顏色分布差異較大的圖像數(shù)據(jù)庫;對(duì)于富含紋理信息的圖像(醫(yī)學(xué)圖像、植物圖像、巖石圖像等)通常采用的方法是基于紋理特征的檢索方式;而針對(duì)具有明確主體對(duì)象且目標(biāo)邊緣清晰的圖像使用形狀特征進(jìn)行檢索則能取得較好的檢索效果。在系統(tǒng)的復(fù)雜度和檢索時(shí)間允許的情況下,將多種低層視覺特征組合起來進(jìn)行圖像檢索可以獲得更好的檢索結(jié)果。
[0004]隨著計(jì)算機(jī)視覺的發(fā)展,圖像的特征越來越豐富,而圖像特征的性質(zhì)千差萬別,各不相同。如顏色特征就可以有RGB,HSV,LAB等等,紋理特征有Tamura,SIFT (尺度不變的幾何變化),Gabor等等,形狀特征有不變矩,邊緣方向直方圖,霍夫變換直線檢測(cè)等等。當(dāng)使用多種特征組合進(jìn)行圖像檢索,如果不加選擇的使用大量特征進(jìn)行圖像檢索,由于多種特征的存在,必然產(chǎn)生數(shù)據(jù)冗余,計(jì)算復(fù)雜度上升,檢索的效率與性能下降等問題。對(duì)于這個(gè)問題,目前有兩種解決方案,一種是對(duì)維數(shù)大的特征的進(jìn)行降維處理,另外一種是對(duì)特征進(jìn)行擇優(yōu)選擇。對(duì)于降維方法,存在兩個(gè)問題:1.縮減的維數(shù)不是盲目的,因?yàn)槿绻S數(shù)被縮減到必要的維數(shù)以下,圖像特征的信息就有可能丟失。2.而且由于底層屬于同類特征的不同特征有強(qiáng)烈的相關(guān)性,降維并不能夠徹底解決數(shù)據(jù)冗余的問題。所以特征選擇是一個(gè)比較好的方法,對(duì)于不同圖像庫,最優(yōu)的特征一般也不一樣,因此選擇最優(yōu)特征非常重要。對(duì)于一個(gè)圖像庫來說,所選取的特征好壞直接影響檢索性能,如何建立一個(gè)可以選擇對(duì)于特定圖像庫最為有效的特征組合的通用的模型成為一個(gè)非常重要的問題。
【發(fā)明內(nèi)容】
[0005]本發(fā)明所要解決的技術(shù)問題在于提出了一種基于群稀疏特征選擇解決方案,將其用于基于內(nèi)容的圖像檢索上,在提聞檢索的準(zhǔn)確率的同時(shí),有效地提升了檢索的效率。
[0006]一種基于群稀疏特征選擇的圖像檢索方法,其特征在于,包括特征選擇和圖像檢索兩部分:
[0007]一、特征選擇具體包括:
[0008]步驟11、針對(duì)圖像庫中的每一幅圖像,比較其圖像關(guān)鍵字形成相似與不相似序列,接著比較相似與不相似序列的圖像顯著區(qū)域的歐式距離,獲取圖像庫中每一幅圖像的相似對(duì)與不相似對(duì),得到該圖像的相似性度量向量;
[0009]步驟12、對(duì)獲得的每一幅圖像的相似對(duì)與不相似對(duì)分別提取訓(xùn)練特征,圖像庫中所有圖像的訓(xùn)練特征形成兩個(gè)特征矩陣,將前述兩個(gè)特征矩陣相減形成特征差異矩陣;
[0010]步驟13、設(shè)定權(quán)重系數(shù),并依據(jù)特征差異矩陣與相似性度量向量,建立群稀疏邏輯模型;
[0011]步驟14、利用優(yōu)化算法求解群稀疏邏輯模型,求解出權(quán)重系數(shù);
[0012]步驟15、根據(jù)權(quán)重系數(shù)中非O群對(duì)應(yīng)于特征差異矩陣所占位置,得出最優(yōu)特征;步驟16、對(duì)于圖像庫中的所有圖像提取步驟15得出的最優(yōu)特征,將提取的特征以矩陣的形式保存,形成圖像特征庫;
[0013]二、圖像檢索具體包括:
[0014]步驟21、對(duì)查詢圖像,按照步驟11至步驟15的方式提取出最優(yōu)特征;
[0015]步驟22、利用相似度度量,將查詢圖像的最優(yōu)特征與圖像特征庫中的每一幅圖像的特征進(jìn)行相似性匹配;
[0016]步驟23、將匹配得出的圖像按照相似度的程度從大到小進(jìn)行排序,得出經(jīng)過排序的圖像序號(hào);
[0017]步驟24、根據(jù)步驟23得出的圖像序號(hào),從圖像特征庫中提取出對(duì)應(yīng)圖像,并作為查詢圖像對(duì)應(yīng)的檢索圖像輸出。
[0018]作為本發(fā)明的進(jìn)一步優(yōu)選方案,所述步驟14中,優(yōu)化算法為自適應(yīng)譜梯度算法。
[0019]作為本發(fā)明的進(jìn)一步優(yōu)選方案,所述步驟23中,相似度度量的計(jì)算方法選擇L1距離,L2距離,直方圖交集,卡方距離,KL-D距離中的一種。[0020]相比現(xiàn)有技術(shù),本發(fā)明方法具有以下有益效果:
[0021]1.運(yùn)用群稀疏算法構(gòu)建針對(duì)圖像庫進(jìn)行特征選擇的通用方法;
[0022]2.優(yōu)化算法中采用的自適應(yīng)譜梯度算法(ANSPG)相比譜梯度算法(SPG)有效減少了算法的時(shí)間復(fù)雜度,在處理群稀疏表示問題上性能優(yōu)越;
[0023]3.運(yùn)用本文通過基于群稀疏特征選擇的算法,提高了基于內(nèi)容圖像檢索的性能,并通過實(shí)驗(yàn)驗(yàn)證了本文提出基于內(nèi)容的圖像檢索方法的性能。
【專利附圖】
【附圖說明】
[0024]圖1為特征選擇和特征檢索流程圖;
[0025]圖2 (a)、圖2 (b)分別為圖像對(duì)選擇策略和構(gòu)建的群稀疏邏輯模型示意圖;
[0026]圖3 (a)、圖3 (b)、圖3 (c)Corel5K為非別在數(shù)據(jù)庫上使用譜梯度(SPG)算法與自適應(yīng)譜梯度(ANSPG)算法分別對(duì)顏色特征,紋理與方向特征進(jìn)行選擇;
[0027]圖4為在Corel5K數(shù)據(jù)庫上索查準(zhǔn)率比較;
[0028]圖5為在IAPRIC12數(shù)據(jù)庫上索查準(zhǔn)率比較;
[0029]圖6為具體實(shí)例中所選用的訓(xùn)練特征;
[0030]圖7為不同特征在不同距離度量下的查準(zhǔn)率;
[0031]圖8為SPG(譜梯度算法)與ANSPG(自適應(yīng)譜梯度)算法在Corel5K上時(shí)間花費(fèi)。
【具體實(shí)施方式】
[0032]下面結(jié)合附圖對(duì)本發(fā)明的技術(shù)方案進(jìn)行詳細(xì)說明:
[0033]本發(fā)明所述一種基于群稀疏特征選擇圖像檢索方法,包括特征選擇與圖像檢索兩部分,如圖1所示。
[0034]特征選擇步驟包括:
[0035]步驟1、圖像對(duì)獲取與形成相似性度量向量:在圖像庫中選擇圖像對(duì)是本文提出算法的一個(gè)重要的預(yù)備工作。從第一幅圖像開始,圖像相似對(duì)的選擇流程如圖2 (a)所示。由于關(guān)鍵字的比較相對(duì)于圖像歐氏距離的比較計(jì)算的時(shí)間復(fù)雜度很低,所以本文首先將圖像庫中第一幅圖與其余圖像的關(guān)鍵字進(jìn)行比較,如果有大于三分之二關(guān)鍵字相同的,則生成第一幅圖像的一個(gè)相似序列,如果有沒有關(guān)鍵字相同的,則生成第一幅圖像的一個(gè)不相似序列。然后將相似列與不相似列中的每一幅圖像分別同第一幅圖像運(yùn)用歐氏距離的度量方法進(jìn)行相似性比較,選Ii1 Cn1為選擇的相似圖像對(duì)數(shù)目)幅最相似的圖像與第一幅圖像組成相似對(duì),同時(shí)選n2 Cn2為選擇的不相似圖像對(duì)數(shù)目)幅最不相似的圖像與第一幅圖像組成不相似對(duì),從而可以構(gòu)建關(guān)于第一幅圖像的所有相似對(duì)和不相似對(duì)。依次對(duì)圖像庫中第二幅圖像到最后一幅圖像重復(fù)運(yùn)用流程圖2 Ca)中所示圖像對(duì)的構(gòu)建方法,最終可以得到圖像庫中每一幅圖像所對(duì)應(yīng)的所有相似與不相似圖像對(duì)。然后根據(jù)構(gòu)建的相似對(duì)和不相似對(duì),將相似對(duì)賦予I而不相似對(duì)賦予-1,從而得到一個(gè)相似性度量向量Y。
[0036]步驟2、提取特征與構(gòu)建特征差異矩陣:如圖1所示將所得圖像對(duì)首先分為兩個(gè)圖像列L1與L2,然后分別提取訓(xùn)練特征得到特征矩陣A與B,把A和B相減得到特征差異矩陣X e Rnxp (η為圖像對(duì)數(shù)目,P為所有訓(xùn)練特征的維數(shù)),Xi e X可以看作一對(duì)圖像的特征差,具體如如圖2 (b)所示。
[0037]步驟3、建立Q1范數(shù)正則化框架:建立對(duì)于特征差異矩陣X e RnXp,X中的第i行定義為Xi e Rixp。相似性度量向量定義為Y e Rnxi,向量Y中的元素分別為對(duì)圖像對(duì)賦予值。權(quán)重向量定義為we RPX1。因此Y可以用特征的一個(gè)稀疏線性組合加上殘差項(xiàng)Θ GRpxl來表示:
[0038]
【權(quán)利要求】
1.一種基于群稀疏特征選擇的圖像檢索方法,其特征在于,包括特征選擇和圖像檢索兩部分: 一、特征選擇具體包括: 步驟11、針對(duì)圖像庫中的每一幅圖像,比較其圖像關(guān)鍵字形成相似與不相似序列,接著比較相似與不相似序列的圖像顯著區(qū)域的歐式距離,獲取圖像庫中每一幅圖像的相似對(duì)與不相似對(duì),得到該圖像的相似性度量向量; 步驟12、對(duì)獲得的每一幅圖像的相似對(duì)與不相似對(duì)分別提取訓(xùn)練特征,圖像庫中所有圖像的訓(xùn)練特征形成兩個(gè)特征矩陣,將前述兩個(gè)特征矩陣相減形成特征差異矩陣; 步驟13、設(shè)定權(quán)重系數(shù),并依據(jù)特征差異矩陣與相似性度量向量,建立群稀疏邏輯模型; 步驟14、利用優(yōu)化算法求解群稀疏邏輯模型,求解出權(quán)重系數(shù); 步驟15、根據(jù)權(quán)重系數(shù)中非O群對(duì)應(yīng)于特征差異矩陣所占位置,得出最優(yōu)特征; 步驟16、對(duì)于圖像庫中的所有圖像提取步驟15得出的最優(yōu)特征,將提取的特征以矩陣的形式保存,形成圖像特征庫; 二、圖像檢索具體包括: 步驟21、對(duì)查詢圖像,按照步驟11至步驟15的方式提取出最優(yōu)特征; 步驟22、利用相似度度量,將查詢圖像的最優(yōu)特征與圖像特征庫中的每一幅圖像的特征進(jìn)行相似性匹配; 步驟23、將匹配得出的圖像按照相似度的程度從大到小進(jìn)行排序,得出經(jīng)過排序的圖像序號(hào); 步驟24、根據(jù)步驟23得出的圖像序號(hào),從圖像特征庫中提取出對(duì)應(yīng)圖像,并作為查詢圖像對(duì)應(yīng)的檢索圖像輸出。
2.如權(quán)利要求1一種基于群稀疏特征選擇的圖像檢索方法,其特征在于:所述步驟14中,優(yōu)化算法為自適應(yīng)譜梯度算法。
3.如權(quán)利要求1一種基于群稀疏特征選擇的圖像檢索方法,其特征在于:所述步驟22中,相似度度量的計(jì)算方法選擇L1距離,L2距離,直方圖交集,卡方距離或KL-D距離中的一種。
【文檔編號(hào)】G06F17/30GK103810252SQ201410027227
【公開日】2014年5月21日 申請(qǐng)日期:2014年1月21日 優(yōu)先權(quán)日:2014年1月21日
【發(fā)明者】徐軍, 鄭秋中 申請(qǐng)人:南京信息工程大學(xué)