專利名稱:基于支持向量機的圖像反饋方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬于圖像檢索領(lǐng)域,特別是一基于支持向量機的圖像反饋方法及系統(tǒng)。
背景技術(shù):
為了能夠從大量的圖像數(shù)據(jù)中快速、準確地找到用戶所需內(nèi)容,基于內(nèi)容的圖像檢索技術(shù)得到了廣泛關(guān)注,成為信息檢索領(lǐng)域的研究熱點,并已成為國際學術(shù)界研究的一個熱點。所謂基于內(nèi)容的圖像檢索,就是根據(jù)圖像的顏色、紋理、形狀等特征,按照某種相似度計算方法,從圖像庫中找出與用戶事先想要查詢的圖像最相似的若干幅圖像。由于圖像底層視覺特征與圖像高級語義之間存在代溝,因此人們提出了基于反饋的圖像檢索方法來解決這一問題。一般情況下,圖像特征用高維向量表示,一幅圖像可以看作高維空間中的一個點, 相似圖像檢索則可以轉(zhuǎn)化成尋找高維特征空間中與指定點距離最近的一組點的問題?,F(xiàn)有的圖像檢索方式普遍采用基于支持向量機的圖像反饋方法,但由于被標記的訓(xùn)練樣本數(shù)量很少,造成的支持向量機的分類器的超平面偏移,以致分類效果不佳。
發(fā)明內(nèi)容
針對現(xiàn)有基于支持向量機的圖像反饋方法在圖像檢索中存在的問題,本發(fā)明提出了一基于支持向量機的圖像反饋方法及系統(tǒng)。本發(fā)明采用的技術(shù)手段如下一種基于支持向量機的圖像反饋方法,其特征在于包括以下步驟Sl 提取圖像庫中每幅圖像的底層視覺特征,并將提取的底層視覺特征放入特征庫;S2 調(diào)取用戶在圖像庫中選取的示例圖像,利用特征庫查找圖像庫中與該示例圖像最相似的N幅圖像;S3 將N幅圖像標記為正例圖像和反例圖像,形成正例圖像集和反例圖像集;S4:對正例圖像集和反例圖像集進行擴展和更新后,將正例圖像集和反例圖像集中的圖像放入支持向量機中進行訓(xùn)練,輸出訓(xùn)練結(jié)果。本發(fā)明的基于支持向量機的圖像反饋方法在基于傳統(tǒng)支持向量機反饋方法的基礎(chǔ)上,對樣本進行擴展和更新并使用數(shù)據(jù)降維的理論對樣本進行處理。該方法不僅解決了傳統(tǒng)支持向量機由于訓(xùn)練樣本少造成不穩(wěn)定的問題、正例樣本遠遠少于反例樣本造成分類器最優(yōu)超平面偏移的問題,而且也解決了目標類圖像與其他類圖像難以區(qū)分以及圖像特征的維數(shù)過大而造成的維數(shù)災(zāi)難問題。本發(fā)明有效改進了支持向量機存在的缺陷,顯著提高了分類器的性能,對基于相關(guān)反饋的圖像檢索研究與應(yīng)用有很好的參考和實用價值。
圖1為本發(fā)明的基于支持向量機的圖像反饋方法的流程圖。圖2為本發(fā)明的基于支持向量機的圖像反饋系統(tǒng)的結(jié)構(gòu)圖。
具體實施例方式為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點更加清楚明白,以下結(jié)合附圖及實施例,對本發(fā)明進行進一步詳細說明。如圖1所示,本發(fā)明的基于支持向量機的圖像反饋方法包括以下步驟步驟Sl 提取圖像庫中每幅圖像的底層視覺特征,并將提取的底層視覺特征放入特征庫。當?shù)讓右曈X特征是顏色特征時,該步驟又包括以下步驟將RGB顏色空間轉(zhuǎn)換到 HSV空間;將HSV顏色空間量化成64份;統(tǒng)計落在每一份顏色空間中像素點的個數(shù)作為顏色特征。當?shù)讓右曈X特征是紋理特征時,該步驟又包括以下步驟對圖像進行3級小波變換;計算每級變換后的3個子帶的均值和方差作為紋理特征。當?shù)讓右曈X特征是形狀特征時,該步驟又包括以下步驟用Sobel算子提取圖像邊緣點;統(tǒng)計圖像邊緣點在水平、45度、垂直、135度方向的像素點個數(shù)作為形狀特征。步驟S2 調(diào)取用戶在圖像庫中選取的示例圖像,利用特征庫查找圖像庫中與該示例圖像最相似的N幅圖像。利用特征庫查找圖像庫中與該示例圖像最相似的N幅圖像的步驟又包括以下步驟計算示例圖像的底層視覺特征;應(yīng)用歐式距離算法計算示例圖像的底層視覺特征與圖像庫中每一圖像的相似度;將全部相似度由高到低排序,并將排序在前的N幅圖像作為與該示例圖像最相似的N幅圖像。應(yīng)用歐式距離算法計算示例圖像的底層視覺特征與圖像庫中每一圖像的相似度又可以表示為Sijj = expMxi-Xjl2)其中,Si,j是示例圖像Xi與圖像庫中每一圖像\的相似度。步驟S3 將N幅圖像標記為正例圖像和反例圖像,形成正例圖像集和反例圖像集。該步驟又包括以下步驟將N幅圖像中與示例圖像屬于同一語義類的圖像標記為正例圖像,將N幅圖像中與示例圖像不屬于同一語義類的圖像標記為反例圖像。步驟S4 對正例圖像集和反例圖像集進行擴展和更新后,將正例圖像集和反例圖像集中的圖像放入支持向量機中進行訓(xùn)練,輸出訓(xùn)練結(jié)果。對正例圖像集和反例圖像集進行擴展的步驟又包括以下步驟從圖像庫中未標記的圖像中,選取相似度排序在前的若干幅圖像作為正例圖像加入正例圖像集;從圖像庫中未標記的圖像中,選取相似度排序在后的若干幅圖像作為反例圖像加入反例圖像集,從而增加了總的訓(xùn)練樣本圖像的數(shù)量。對正例圖像集進行更新的步驟又包括以下步驟根據(jù)正例圖像貢獻值公式計算正例圖像集中每一正例圖像的貢獻值,以及圖像庫中每一未標記圖像的貢獻值;用未標記圖像中具有最大貢獻值的未標記圖像替換正例圖像集中具有最小貢獻值的正例圖像。其中的正例圖像貢獻值公式可以表示為^Fp (ν) = At(v) + (1 -(τ(ν)-咖))其中,λ為權(quán)重值,t(v)是針對步驟Sl提取的底層視覺特征使用K-Means算法做自然聚類得到的聚類結(jié)果計算得到的圖像的典型性值,τ (ν)是圖像集中每一未標記圖像和正例圖像集中每一正例圖像分別與示例圖像的相似度的排序,AFp(V)是正例圖像集中每一正例圖像和圖像庫中每一未標記圖像的貢獻值。對反例圖像集進行更新的步驟又包括以下步驟根據(jù)反例圖像貢獻值公式計算反例圖像集中每一反例圖像的貢獻值,以及圖像庫中每一未標記圖像的貢獻值;用未標記圖像中具有最大貢獻值的未標記圖像替換反例圖像集中具有最小貢獻值的反例圖像。其中的反例圖像的貢獻值公式可以表示為AFm(V) = Ai(V)Hl -見碎(T(V1)-τ(ν))其中,λ為權(quán)重值,t (ν)是針對步驟Sl提取的底層視覺特征使用K-Means算法做自然聚類得到的聚類結(jié)果計算得到的圖像的典型性值,τ (ν)是圖像集中每一未標記圖像和反例圖像集中每一反例圖像分別與示例圖像的相似度的排序,AFm(V)是反例圖像集中每一反例圖像和圖像庫中每一未標記圖像的貢獻值。在步驟S4之后,還可以包括以下步驟對圖像庫中的圖像按照與示例圖像的相似度進行重排序,使得正例樣本靠前,排序后得到圖像特征矩陣X ;減小正例樣本集中正例樣本的類內(nèi)距離;增大反例樣本集中反例樣本的類內(nèi)距離;得到一映射矩陣,利用該映射矩陣將圖像庫中的高維圖像特征映射到低維空間。減小正例樣本集中正例樣本的類內(nèi)距離的步驟可以表示為A+ = Σ wr,jxj+ +纊是正例樣本集中選定的正例樣本,是正例樣本集中除選定的正例樣本之外的任一正例樣本,Wijj是正例樣本集中除選定的正例樣本之外的任一正例樣本相對選定的正例樣本的權(quán)重,《是誤差值。增大反例樣本集中反例樣本的類內(nèi)距離的步驟可以表示為P1 = argmax ^ hu 11 滅-^j ||2戈是反例樣本集中選定的反例樣本,無是反例樣本集中除選定的反例樣本之外的任一反例樣本,h^.是反例樣本集中除選定的反例樣本之外的任一反例樣本相對選定的反例樣本的權(quán)重。得到一映射矩陣的步驟可以表示為利用Wi,」和比,」構(gòu)成一矩陣Ml ;利用公式 U= arS^ax吋f^MM求得映射矩陣U。
UgRHXL利用該映射矩陣將圖像庫中的高維圖像特征映射到低維空間的步驟可以表示為Y = U1X e Rlx n其中,Y是低維空間圖像特征矩陣。如圖2所示,本發(fā)明的基于支持向量機的圖像反饋系統(tǒng)包括提取單元1,用于提取圖像庫中每幅圖像的底層視覺特征,并將提取的底層視覺特征放入特征庫;預(yù)處理單元 2,用于對提取的底層視覺特征使用K-Means算法做自然聚類得到的聚類結(jié)果計算得到的圖像的典型性值;檢索單元3,用于調(diào)取用戶在圖像庫中選取的示例圖像,利用特征庫查找圖像庫中與該示例圖像最相似的N幅圖像;標記單元4,用于將N幅圖像標記為正例圖像和反例圖像,形成正例圖像集和反例圖像集;學習單元5,用于對正例圖像集和反例圖像集進行擴展和更新后,將正例圖像集和反例圖像集中的圖像放入支持向量機中進行訓(xùn)練,輸出訓(xùn)練結(jié)果。其中,提取單元1、檢索單元3、標記單元4、學習單元5分別的執(zhí)行步驟如上所述。本發(fā)明的基于支持向量機的圖像反饋方法在基于傳統(tǒng)支持向量機反饋方法的基礎(chǔ)上,對樣本進行擴展和更新并使用數(shù)據(jù)降維的理論對樣本進行處理。該方法不僅解決了傳統(tǒng)支持向量機由于訓(xùn)練樣本少造成不穩(wěn)定的問題、正例樣本遠遠少于反例樣本造成分類器最優(yōu)超平面偏移的問題,而且也解決了目標類圖像與其他類圖像難以區(qū)分以及圖像特征的維數(shù)過大而造成的維數(shù)災(zāi)難問題。本發(fā)明有效改進了支持向量機存在的缺陷,顯著提高了分類器的性能,對基于相關(guān)反饋的圖像檢索研究與應(yīng)用有很好的參考和實用價值。以上所述,僅為本發(fā)明較佳的具體實施方式
,但本發(fā)明的保護范圍并不局限于此, 任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),根據(jù)本發(fā)明的技術(shù)方案及其發(fā)明構(gòu)思加以等同替換或改變,都應(yīng)涵蓋在本發(fā)明的保護范圍之內(nèi)。
權(quán)利要求
1.一種基于支持向量機的圖像反饋方法,其特征在于包括以下步驟51提取圖像庫中每幅圖像的底層視覺特征,并將提取的底層視覺特征放入特征庫;52調(diào)取用戶在圖像庫中選取的示例圖像,利用特征庫查找圖像庫中與該示例圖像最相似的N幅圖像;53將N幅圖像標記為正例圖像和反例圖像,形成正例圖像集和反例圖像集;S4:對正例圖像集和反例圖像集進行擴展和更新后,將正例圖像集和反例圖像集中的圖像放入支持向量機中進行訓(xùn)練,輸出訓(xùn)練結(jié)果。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于當?shù)讓右曈X特征是顏色特征時,步驟Sl又包括以下步驟將RGB顏色空間轉(zhuǎn)換到HSV空間;將HSV顏色空間量化成64份;統(tǒng)計落在每一份顏色空間中像素點的個數(shù)作為顏色特征;當?shù)讓右曈X特征是紋理特征時,步驟Sl又包括以下步驟對圖像進行3級小波變換; 計算每級變換后的3個子帶的均值和方差作為紋理特征。當?shù)讓右曈X特征是形狀特征時,步驟Sl又包括以下步驟用Sobel算子提取圖像邊緣點;統(tǒng)計圖像邊緣點在水平、45度、垂直、135度方向的像素點個數(shù)作為形狀特征。
3.根據(jù)權(quán)利要求1所述的,其特征在于利用特征庫查找圖像庫中與該示例圖像最相似的N幅圖像的步驟又包括以下步驟計算示例圖像的底層視覺特征;應(yīng)用歐式距離算法計算示例圖像的底層視覺特征與圖像庫中每一圖像的相似度;將全部相似度由高到低排序,并將排序在前的N幅圖像作為與該示例圖像最相似的N 幅圖像。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于應(yīng)用歐式距離算法計算示例圖像的底層視覺特征與圖像庫中每一圖像的相似度又可以表示為Sijj = exp (-1 Xi-Xj 12)其中,Suj是示例圖像Xi與圖像庫中每一圖像\的相似度。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于步驟S3包括以下步驟將N幅圖像中與示例圖像屬于同一語義類的圖像標記為正例圖像,將N幅圖像中與示例圖像不屬于同一語義類的圖像標記為反例圖像。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于對正例圖像集和反例圖像集進行擴展的步驟又包括以下步驟從圖像庫中未標記的圖像中,選取相似度排序在前的若干幅圖像作為正例圖像加入正例圖像集;從圖像庫中未標記的圖像中,選取相似度排序在后的若干幅圖像作為反例圖像加入反例圖像集,從而增加了總的訓(xùn)練樣本圖像的數(shù)量。
7.根據(jù)權(quán)利要求1所述的方法,其特征在于對正例圖像集進行更新的步驟又包括以下步驟根據(jù)正例圖像貢獻值公式計算正例圖像集中每一正例圖像的貢獻值,以及圖像庫中每一未標記圖像的貢獻值;用未標記圖像中具有最大貢獻值的未標記圖像替換正例圖像集中具有最小貢獻值的正例圖像;其中的正例圖像貢獻值公式可以表示為^Fp (ν) = Ai(v) + (1 - Α)Σνι % (Φ) - Φ,))其中,λ為權(quán)重值,t(v)是針對步驟Sl提取的底層視覺特征使用K-Means算法做自然聚類得到的聚類結(jié)果計算得到的圖像的典型性值,τ (ν)是圖像集中每一未標記圖像和正例圖像集中每一正例圖像分別與示例圖像的相似度的排序,AFp(V)是正例圖像集中每一正例圖像和圖像庫中每一未標記圖像的貢獻值。
8.根據(jù)權(quán)利要求1所述的方法,其特征在于對反例圖像集進行更新的步驟又包括以下步驟根據(jù)反例圖像貢獻值公式計算反例圖像集中每一反例圖像的貢獻值,以及圖像庫中每一未標記圖像的貢獻值;用未標記圖像中具有最大貢獻值的未標記圖像替換反例圖像集中具有最小貢獻值的反例圖像;其中的反例圖像的貢獻值公式可以表示為AFm(V) = Α (ν)+(\ -(Φ,)-τ(ν))其中,λ為權(quán)重值,t(v)是針對步驟Sl提取的底層視覺特征使用K-Means算法做自然聚類得到的聚類結(jié)果計算得到的圖像的典型性值,τ (ν)是圖像集中每一未標記圖像和反例圖像集中每一反例圖像分別與示例圖像的相似度的排序,AFm(V)是反例圖像集中每一反例圖像和圖像庫中每一未標記圖像的貢獻值。
9.根據(jù)權(quán)利要求1所述的方法,其特征在于在步驟S4之后還包括以下步驟對圖像庫中的圖像按照與示例圖像的相似度進行重排序,使得正例樣本靠前,排序后得到圖像特征矩陣X ;減小正例樣本集中正例樣本的類內(nèi)距離;增大反例樣本集中反例樣本的類內(nèi)距離; 得到一映射矩陣,利用該映射矩陣將圖像庫中的高維圖像特征映射到低維空間;減小正例樣本集中正例樣本的類內(nèi)距離的步驟表示為= Σ是正例樣本集中選定的正例樣本,A+是正例樣本集中除選定的正例樣本之外的任一正例樣本, Wi, J是正例樣本集中除選定的正例樣本之外的任一正例樣本相對選定的正例樣本的權(quán)重, 高+是誤差值;增大反例樣本集中反例樣本的類內(nèi)距離的步驟表示為^=argmax2:\; Il λ -兄1卩、是反例樣本集中選定的反例樣本,是反例樣本集中除選定的反例樣本之外的任一反例樣本,hi, J是反例樣本集中除選定的反例樣本之外的任一反例樣本相對選定的反例樣本的權(quán)重;得到一映射矩陣的步驟可以表示為利用Wq和hq構(gòu)成一矩陣Ml ;利用公式 U = ar§ max啦rM1C/]求得映射矩陣υ .UlRhxl利用該映射矩陣將圖像庫中的高維圖像特征映射到低維空間的步驟可以表示為Y = UtX e Rixn,其中,Y是低維空間圖像特征矩陣。
10.一種基于支持向量機的圖像反饋系統(tǒng),其特征在于包括提取單元,用于提取圖像庫中每幅圖像的底層視覺特征,并將提取的底層視覺特征放入特征庫;預(yù)處理單元,用于對提取的底層視覺特征使用K-Means算法做自然聚類得到的聚類結(jié)果計算得到的圖像的典型性值;檢索單元,用于調(diào)取用戶在圖像庫中選取的示例圖像,利用特征庫查找圖像庫中與該示例圖像最相似的N幅圖像;標記單元,用于將N幅圖像標記為正例圖像和反例圖像,形成正例圖像集和反例圖像集;學習單元,用于對正例圖像集和反例圖像集進行擴展和更新后,將正例圖像集和反例圖像集中的圖像放入支持向量機中進行訓(xùn)練,輸出訓(xùn)練結(jié)果。
全文摘要
本發(fā)明公開了一基于支持向量機的圖像反饋方法及系統(tǒng)。方法包括提取圖像庫中每幅圖像的底層視覺特征,將提取的底層視覺特征放入特征庫;調(diào)取用戶在圖像庫中選取的示例圖像,利用特征庫查找圖像庫中與該示例圖像最相似的N幅圖像;將N幅圖像標記為正例圖像和反例圖像,形成正例圖像集和反例圖像集;對正例圖像集和反例圖像集進行擴展和更新后,將正例圖像集和反例圖像集中的圖像放入支持向量機中進行訓(xùn)練,輸出訓(xùn)練結(jié)果。該方法在基于傳統(tǒng)支持向量機反饋方法的基礎(chǔ)上,對樣本進行擴展和更新并使用數(shù)據(jù)降維的理論對樣本進行處理。解決了傳統(tǒng)支持向量機由于訓(xùn)練樣本少造成不穩(wěn)定的問題、正例樣本遠遠少于反例樣本造成分類器最優(yōu)超平面偏移的問題。
文檔編號G06K9/62GK102542050SQ20111044908
公開日2012年7月4日 申請日期2011年12月28日 優(yōu)先權(quán)日2011年12月28日
發(fā)明者李東明, 王向陽 申請人:遼寧師范大學