本發(fā)明涉及的是一種圖像分類的方法,具體可以應(yīng)用到各種需要圖像分類的場景中。
背景技術(shù):
稀疏濾波技術(shù),是指通過約束信號重構(gòu)系數(shù)矢量中非零系數(shù)的個(gè)數(shù),達(dá)到優(yōu)化特征表達(dá),提高計(jì)算速度的效果,此外,稀疏濾波可以對信號產(chǎn)生壓縮效果,以此節(jié)約存儲(chǔ)和傳輸空間。
稀疏濾波應(yīng)用到圖像分類中,就是用圖像信號的稀疏特征系數(shù)代替圖像本身作為分類的信號樣本。對于基于稀疏濾波的圖像分類技術(shù)來說,常用做法是采用矩陣分解技術(shù),通過將原始圖像像素矩陣X分解為兩個(gè)矩陣U和A的乘積,其中,矩陣U為基矩陣,控制圖像特征由高維向低維轉(zhuǎn)化,矩陣A為稀疏系數(shù)矩陣,其中每一列系數(shù)矢量中,存在極少數(shù)的非零元素,訓(xùn)練稀疏模型時(shí),采用L-1范數(shù)約束稀疏系數(shù)矩陣A的稀疏度,分類時(shí),使用圖像信號的稀疏系數(shù)矩陣作為分類器的輸入,分類圖像。這種方式的缺點(diǎn)在于:一,對矩陣A做L-1范數(shù)稀疏度約束,容易使學(xué)習(xí)到的模型產(chǎn)生過擬合,影響分類的效果,甚至,嚴(yán)重時(shí)會(huì)產(chǎn)生錯(cuò)誤分類,在分類結(jié)果與安全因素相關(guān)時(shí),會(huì)導(dǎo)致嚴(yán)重的安全災(zāi)難;二,如果對矩陣U做過擬合懲罰,則增加了優(yōu)化項(xiàng),使優(yōu)化過程復(fù)雜化,需要昂貴的計(jì)算資源。
圖像的幅頻特征,是指將圖像信號或者可以代表圖像信號的特征信號作為二維信號進(jìn)行調(diào)和分析,使用諸如離散傅里葉變換,Z變換,小波變換,希爾伯特-黃變換等手段,獲取到的圖像數(shù)據(jù)在頻率域的特征,是信號幅度與信號頻率之間的關(guān)系。利用圖像的幅頻特征進(jìn)行稀疏濾波,可以在利用圖像信號的頻率特性建立濾波模型,避免直接對矩陣A和矩陣U做約束,從而有效地避免了過擬合和優(yōu)化過程的復(fù)雜化。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明提供一種基于幅頻特征稀疏濾波的圖像分類技術(shù),利用圖像信號的幅頻特征建立稀疏濾波模型;利用稀疏特征矩陣進(jìn)行圖像分類。
本發(fā)明技術(shù)方案為:
一種基于幅頻特征稀疏濾波的圖像分類方法,包括以下步驟:
1)訓(xùn)練數(shù)據(jù)獲取階段,獲取待分類圖像數(shù)據(jù)的一個(gè)子集,格式化為統(tǒng)一維度的圖像數(shù)據(jù)矩陣X;
2)初始化階段,生成兩個(gè)隨機(jī)矩陣,分別為維度為f*n的基矩陣U,維度為n*m的稀疏系數(shù)矩陣A;
3)變換階段,對矩陣A或圖像數(shù)據(jù)矩陣X進(jìn)行調(diào)和變換,獲得幅頻特征矩陣F;
4)優(yōu)化建立階段,通過約束原始矩陣X與重構(gòu)矩陣Y=UA的能量差最小,以及幅頻特征矩陣F的能量最大,選取一種優(yōu)化算法,執(zhí)行迭代優(yōu)化,例如,可以選取梯度下降算法;
5)優(yōu)化迭代階段,重復(fù)執(zhí)行4,直到目標(biāo)函數(shù)值達(dá)到預(yù)期的目標(biāo)或者迭代次數(shù)達(dá)到預(yù)先設(shè)定的最大值;
6)生成階段,用基矩陣U和新的待分類圖像矩陣Z,生成矩陣Z的稀疏系數(shù)矩陣B;
7)分類階段,選擇一種分類器,矩陣B作為分類器輸入,獲取分類結(jié)果。
本發(fā)明的有益效果為:一種基于幅頻特征稀疏濾波的圖像分類技術(shù)具有非常廣泛和實(shí)用的應(yīng)用場景,比如,在生產(chǎn)環(huán)境中,由于傳感器采集到的圖像數(shù)據(jù)都是帶有隨機(jī)噪聲和自然背景的圖像數(shù)據(jù),這些數(shù)據(jù)會(huì)放大L-1范數(shù)稀疏度約束的過擬合效果,嚴(yán)重干擾圖像分類結(jié)果?;诜l特征的稀疏濾波方法,通過在頻域建立稀疏濾波模型,有效避免了直接約束稀疏系數(shù)矩陣帶來的過擬合問題,并且通過減少優(yōu)化項(xiàng),提高了優(yōu)化效率,不但節(jié)省了計(jì)算資源,而且提高了分類器的分類精度,因此,具有廣闊的應(yīng)用前景。
附圖說明
圖1(a)為稀疏度為α的矩陣A的圖像;
圖1(b)為圖1(a)中矩陣A的幅頻特征矩陣F的圖像;
圖2(a)為稀疏度為β的矩陣A的圖像;
圖2(b)為圖2(a)中矩陣A的幅頻特征矩陣F的圖像
圖3(a)為稀疏度為γ的矩陣A的圖像;
圖3(b)為圖3(a)中矩陣A的幅頻特征矩陣F的圖像
圖中:x,y分別為矩陣A兩個(gè)維度坐標(biāo);s代表矩陣A的二維信號函數(shù)值;u,v分別為矩陣F的兩個(gè)維度坐標(biāo);稀疏度α<β<γ。
具體實(shí)施方式
下面結(jié)合附圖和技術(shù)方案詳細(xì)說明本發(fā)明。
第一步,訓(xùn)練數(shù)據(jù)獲取階段
獲取待分類圖像數(shù)據(jù)之后,選取一個(gè)子集作為訓(xùn)練數(shù)據(jù),格式化為m*(w*h)維度的圖像數(shù)據(jù)矩陣X;其中,m為樣本數(shù)目,w、h為單個(gè)圖像的長、寬;設(shè)f=w*h為圖像原始特征空間維度,即待分類圖像中像素點(diǎn)的個(gè)數(shù);
第二步,初始化階段
設(shè)置稀疏特征數(shù)目為n(n<f),隨機(jī)生成元素?cái)?shù)值在0~1之間的兩個(gè)二維矩陣,分別為維度為f*n的基矩陣U和維度為n*m的稀疏系數(shù)矩陣A;
第三步,變換階段
對稀疏系數(shù)矩陣A或者圖像數(shù)據(jù)矩陣X進(jìn)行調(diào)和變換,獲得幅頻特征矩陣F;所述的調(diào)和變換的方法包括離散傅里葉變換、快速傅里葉變換、離散余弦變換、Z變換、小波變換或希爾伯特-黃變換等;
假設(shè)采用稀疏系數(shù)矩陣A執(zhí)行離散傅里葉變換,用s(x,y)代表A的二維信號函數(shù),F(xiàn)(u,v)代表s(x,y)的幅頻特征,則:
其中,u,v代表F的兩個(gè)維度坐標(biāo),x,y代表A兩個(gè)維度坐標(biāo),m為樣本數(shù)目,n為稀疏特征數(shù)目。
第四步,優(yōu)化建立階段
將幅頻特征矩陣F的協(xié)方差矩陣的和的L-2范數(shù)的相反數(shù)作為F的能量,記為E(F);設(shè)幅頻特征矩陣F的第i個(gè)列向量的協(xié)方差矩陣為R(Fi),則稀疏度約束函數(shù)spi=λ||X-UA||2+E(F)。其中,λ為能量約束系數(shù),一般取0.5;重構(gòu)矩陣Y=UA為基矩陣U和稀疏系數(shù)矩陣A的乘積;i、j分別表示幅頻特征矩陣F的維度坐標(biāo)。
第五步,優(yōu)化迭代階段
以稀疏度約束函數(shù)為目標(biāo)函數(shù),根據(jù)約束目標(biāo)函數(shù)中圖像數(shù)據(jù)矩陣X(原始矩陣)與重構(gòu)矩陣Y的能量差最小,以及幅頻特征矩陣F的能量最大,選取梯度下降算法,執(zhí)行迭代優(yōu)化。
所述的梯度下降算法具體為:
目標(biāo)函數(shù)spi對稀疏系數(shù)矩陣A,基矩陣U的梯度更新矩陣函數(shù)分別為:
Gspi/U=-XAT+(UA)AT
設(shè)置迭代次數(shù),通過以上兩個(gè)梯度更新矩陣,執(zhí)行以spi函數(shù)為目標(biāo)函數(shù)的迭代優(yōu)化,至目標(biāo)函數(shù)值達(dá)到預(yù)期的目標(biāo)或者迭代次數(shù)達(dá)到預(yù)先設(shè)定的最大值,梯度下降算法結(jié)束。
附圖是對迭代優(yōu)化過程中,幅頻特征矩陣與稀疏系數(shù)矩陣變化趨勢的說明,圖1(a)、圖2(a)、圖3(a)為稀疏度遞增的稀疏系數(shù)矩陣A的圖像;圖1(b)、圖2(b)、圖3(b)分別為圖1(a)、圖2(a)、圖3(a)中矩陣A的幅頻特征矩陣F的圖像;隨著圖1(b)、圖2(b)、圖3(b)中幅度偏離中心程度的逐漸變大,相應(yīng)地,圖1(a),圖2(a),圖3(a)的稀疏度逐漸變大。
第六步,生成階段
設(shè)新的待分類圖像數(shù)據(jù)矩陣為Z,由第五步得到的基矩陣U和待分類圖像數(shù)據(jù)矩陣Z生成矩陣Z的稀疏系數(shù)矩陣B,即B=U-1Z。
第七步,分類階段
將稀疏系數(shù)矩陣B作為分類器的輸入矩陣,執(zhí)行分類。