本發(fā)明涉及圖像分類(lèi)領(lǐng)域,尤其涉及一種基于多通道特征的elm(extremelearningmachine極端學(xué)習(xí)機(jī))和de(differentialevolution差分進(jìn)化算法)相結(jié)合的圖像分類(lèi)方法。
背景技術(shù):
圖像分類(lèi)問(wèn)題是當(dāng)今計(jì)算機(jī)視覺(jué)與圖像處理領(lǐng)域許多重要研究領(lǐng)域的基礎(chǔ)問(wèn)題。好的圖像分類(lèi)技術(shù)可以有效地解決其他科研領(lǐng)域的難題,比如圖像檢索領(lǐng)域、遙感圖像領(lǐng)域、三維重建領(lǐng)域等等。分類(lèi)的目的就是根據(jù)現(xiàn)有的圖像特征建立一個(gè)分類(lèi)器,能夠?qū)ξ粗膱D像類(lèi)型進(jìn)行預(yù)測(cè)。例如,通過(guò)遙感圖像分類(lèi)獲得土地利用圖、植被覆蓋圖以及其他一些圖件,進(jìn)而將這些圖件作為下一步的基礎(chǔ)圖件,進(jìn)行環(huán)境、土地利用;在醫(yī)學(xué)上可以通過(guò)對(duì)x線圖形分類(lèi)進(jìn)行乳腺癌腫塊的診斷。
因此,近些年來(lái)許多圖像分類(lèi)方法被提出來(lái)。有基于紋理、形狀以及顏色空間的圖像分類(lèi)技術(shù),分類(lèi)器一般都使用svm(supportvectormachine,支持向量機(jī))。但是這些方法都存在不同程度的問(wèn)題。首先,對(duì)于采用的這些紋理、形狀以及顏色空間特征不足以表達(dá)圖像的特征。其次,svm分類(lèi)器需要反饋調(diào)節(jié)參數(shù),耗時(shí)長(zhǎng),不能達(dá)到快速分類(lèi)效果。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明針對(duì)上述技術(shù)問(wèn)題,提出一種基于多通道特征的elm和de相結(jié)合的圖像分類(lèi)方法。本發(fā)明方法通過(guò)提取分辨率高的圖像特征來(lái)提高分類(lèi)精度,以及通過(guò)使用耗時(shí)少的分類(lèi)器實(shí)現(xiàn)快速圖像分類(lèi)。
本發(fā)明的基于多通道特征的elm和de相結(jié)合的圖像分類(lèi)方法,包括:訓(xùn)練過(guò)程和預(yù)測(cè)過(guò)程。所述訓(xùn)練過(guò)程包括:
步驟a1:獲取正負(fù)樣本;
步驟a2:將上述樣本的大小統(tǒng)一變換到規(guī)定尺寸,并進(jìn)行高斯濾波處理;
步驟a3:提取上述樣本圖像的積分通道特征,包括:灰度顏色通道特征、梯度方向直方圖通道特征和梯度幅值通道特征;
步驟a4:將步驟3中提取的積分通道特征作為elm的輸入并進(jìn)行圖像分類(lèi)訓(xùn)練,同時(shí),使用de差分進(jìn)化算法對(duì)elm進(jìn)行改進(jìn)優(yōu)化,使elm的分類(lèi)效果達(dá)到最優(yōu),從而獲得訓(xùn)練好的分類(lèi)器。
所述預(yù)測(cè)過(guò)程包括:
步驟b1:將待預(yù)測(cè)圖像的大小縮到規(guī)定尺寸,并進(jìn)行高斯濾波處理;
步驟b2:提取上述待預(yù)測(cè)圖像的積分通道特征,包括灰度顏色通道、梯度方向直方圖通道和梯度幅值通道;
步驟b3:將上述提取的積分通道特征作為上述訓(xùn)練好的分類(lèi)器的輸入,通過(guò)所述分類(lèi)器進(jìn)行分類(lèi),將分類(lèi)結(jié)果輸出。
本發(fā)明所采用的技術(shù)方案是一種基于多通道特征的elm和de相結(jié)合的圖像分類(lèi)方法,可以實(shí)現(xiàn)快速、高精度、具有很高的實(shí)用價(jià)值的圖像分類(lèi)。
附圖說(shuō)明
圖1為本發(fā)明的圖像分類(lèi)方法的流程圖。
圖2(a)為本發(fā)明的正樣本集(人臉)的示意圖;圖2(b)為縮小后的正樣本集(人臉)的示意圖。
圖3(a)為本發(fā)明的負(fù)樣本集(被覆蓋掉人臉的人)的示意圖;圖3(b)為縮小后的負(fù)樣本集(人臉)的示意圖。
具體實(shí)施方式
下面通過(guò)實(shí)施例對(duì)本發(fā)明作進(jìn)一步說(shuō)明,其目的僅在于更好地理解本發(fā)明的研究?jī)?nèi)容而非限制本發(fā)明的保護(hù)范圍。
如圖1所示,本發(fā)明的一種基于多通道特征的elm和de相結(jié)合的圖像分類(lèi)方法,包括訓(xùn)練過(guò)程和預(yù)測(cè)過(guò)程,所述訓(xùn)練過(guò)程包括如下步驟:
步驟a1:獲取正負(fù)樣本,本實(shí)施例中以人臉圖像為訓(xùn)練樣本,取不同光照?qǐng)鼍跋?、不同年齡、不同性別等人臉作為正樣本,取除人臉之外的其他身體部位小塊作為負(fù)樣本,如圖2(a)和圖3(a)所示。無(wú)人臉的任何圖像都可以作為負(fù)樣本,為了減少誤檢,本發(fā)明采用覆蓋掉人臉的圖像作為負(fù)樣本集。本發(fā)明中,正樣本數(shù)量為五萬(wàn),負(fù)樣本數(shù)量十萬(wàn)。
步驟a2:將上述樣本的大小統(tǒng)一縮放或裁切到規(guī)定尺寸,并進(jìn)行高斯濾波處理。這里,規(guī)定尺寸可以是20*20(分辨率),如圖2(b)和圖3(b)中所示。當(dāng)然也可以根據(jù)實(shí)際需求是其他尺寸。這里使用高斯濾波處理,減弱噪聲,增強(qiáng)對(duì)比度。
步驟a3:提取上述樣本圖像的積分通道特征,包括:灰度顏色通道特征、梯度方向直方圖通道特征和梯度幅值通道特征。這里,灰度顏色通道特征為1個(gè)、梯度方向直方圖通道特征為6個(gè),梯度幅值通道特征為1個(gè)。當(dāng)然,根據(jù)實(shí)際的需求,也可以提取不同的特征數(shù)量。
步驟a4:將步驟a3中提取的積分通道特征作為elm的輸入并進(jìn)行圖像分類(lèi)訓(xùn)練,同時(shí),使用de差分進(jìn)化算法對(duì)elm進(jìn)行改進(jìn)優(yōu)化,使elm的分類(lèi)效果達(dá)到最優(yōu),從而獲得訓(xùn)練好的分類(lèi)器。
進(jìn)一步地,步驟a4中使用de差分進(jìn)化算法對(duì)elm進(jìn)行改進(jìn)優(yōu)化進(jìn)一步包括:
步驟a41:將elm隨機(jī)產(chǎn)生的輸入權(quán)值wi與隱層權(quán)值bi作為de的初始種群θ并輸入de;
上述公式(1)中,k表示隱層結(jié)點(diǎn)數(shù),n表示輸入神經(jīng)元數(shù)。對(duì)種群中的每個(gè)個(gè)體,計(jì)算相應(yīng)的廣義逆矩陣,對(duì)廣義逆矩陣的結(jié)果在驗(yàn)證集上計(jì)算均方根誤差,并以該誤差作為每個(gè)個(gè)體的適應(yīng)度,所述均方根誤差的計(jì)算公式如下:
上述公式(2)中,e表示均方根誤差,(xj,tj)為elm的訓(xùn)練數(shù)據(jù),n為輸入樣本數(shù),i表示第i個(gè)隱層結(jié)點(diǎn),j表示第j個(gè)輸入數(shù)據(jù),m表示輸入數(shù)據(jù)x的維數(shù)(即特征數(shù)),根據(jù)經(jīng)驗(yàn)設(shè)置de最大的進(jìn)化代數(shù)為50,選取最小誤差時(shí)的θ,作為elm最優(yōu)的輸入權(quán)值與隱層權(quán)值;
步驟a42:將elm的分類(lèi)錯(cuò)誤率作為閾值,所述錯(cuò)誤率為分錯(cuò)類(lèi)的圖像與總圖像數(shù)量的比值,對(duì)步驟a41中獲得的elm的輸入權(quán)值與隱層權(quán)值進(jìn)行優(yōu)選。具體地,設(shè)定一個(gè)elm的最大能接受的錯(cuò)誤率δ,若在de的最大進(jìn)化代數(shù)內(nèi),得到的elm錯(cuò)誤率小于δ,則此時(shí)de的輸出為elm的最優(yōu)權(quán)值;若de達(dá)到最大進(jìn)化代數(shù),且elm的錯(cuò)誤率依舊大于設(shè)置的閾值,則選擇最大代數(shù)內(nèi)elm最小錯(cuò)誤率時(shí)的de輸出為最優(yōu)權(quán)值。
通過(guò)上述步驟,可獲得訓(xùn)練好的最優(yōu)的分類(lèi)器。
下面介紹預(yù)測(cè)過(guò)程,所述預(yù)測(cè)過(guò)程包括如下步驟:
步驟b1:將待預(yù)測(cè)圖像的大小縮放到規(guī)定尺寸,并進(jìn)行高斯濾波處理;
步驟b2:提取上述待預(yù)測(cè)圖像的積分通道特征,包括灰度顏色通道、梯度方向直方圖通道和梯度幅值通道;
步驟b3:將上述提取的積分通道特征作為上述訓(xùn)練好的分類(lèi)器的輸入,通過(guò)所述分類(lèi)器進(jìn)行分類(lèi),將分類(lèi)結(jié)果輸出。
上述步驟b3之后還可以包括統(tǒng)計(jì)誤檢率的步驟。
通過(guò)本發(fā)明的基于多通道特征的elm和de相結(jié)合的圖像分類(lèi)方法,可以實(shí)現(xiàn)快速、高精度、具有很高的實(shí)用價(jià)值的圖像分類(lèi)。
顯然,本技術(shù)領(lǐng)域中的普通技術(shù)人員應(yīng)當(dāng)認(rèn)識(shí)到,以上的實(shí)施例僅是用來(lái)說(shuō)明本發(fā)明,而并非用作為對(duì)本發(fā)明的限定,只要在本發(fā)明的實(shí)質(zhì)精神范圍內(nèi),對(duì)以上所述實(shí)施例的變化、變型都將落在本發(fā)明的權(quán)利要求書(shū)范。