本發(fā)明涉及的是一種圖像分類方法,特別是一種聯(lián)合三邊濾波器和深度學(xué)習(xí)理論的高光譜圖像分類方法。
背景技術(shù):
高光譜遙感利用很多很窄的電磁波段從感興趣的物體獲取圖像數(shù)據(jù),一般從可見光到熱波紅外波段范圍內(nèi)設(shè)置了幾十到數(shù)百個(gè)連續(xù)波段,其光譜分辨率可高達(dá)納米數(shù)量級(jí)。對(duì)于每一個(gè)被記錄的像素,豐富的光譜信息可以提供觀測(cè)地表的完整的光譜描述和特性,因此在物質(zhì)辨別時(shí)可以被看作是一個(gè)有效的工具。目前高光譜成像已經(jīng)成為一種重要的遙感成像探測(cè)手段,其本質(zhì)在于能夠同時(shí)提供地物分布的空間信息和較高分辨率的光譜信息。雖然高光譜圖像數(shù)據(jù)有著比以往數(shù)據(jù)更顯著的優(yōu)勢(shì)和發(fā)展?jié)摿?,但在?duì)高光譜圖像數(shù)據(jù)進(jìn)行空間信息和光譜信息提取與應(yīng)用過程中,出現(xiàn)了很多技術(shù)上的難題,給研究者們帶來了巨大的挑戰(zhàn)。另一方面,在利用高光譜傳感器捕獲和傳輸高光譜圖像過程中,通常高斯噪聲和脈沖噪聲等會(huì)引入到圖像中,導(dǎo)致產(chǎn)生的圖像質(zhì)量下降,從而很大程度上制約圖像的分類精度。因此,如何有效地提高圖像質(zhì)量和提取像素的光譜-空間信息,從而實(shí)現(xiàn)高光譜數(shù)據(jù)的有效分類得到越來越廣泛的關(guān)注。
在對(duì)高光譜圖像分類中,去除圖像噪聲和提取光譜-空間特征尤為重要。這是因?yàn)樵肼晫?dǎo)致圖像的質(zhì)量嚴(yán)重退化,從而很大程度上制約圖像的分類精度。其次,在一個(gè)局部區(qū)域內(nèi)的像素通常代表相同的物質(zhì)和具有相似的光譜特性,因此綜合利用高光譜數(shù)據(jù)的空間信息被期待獲取更好的分類性能。然而,現(xiàn)有的文獻(xiàn)通常只利用了像素的光譜-空間信息,沒有考慮局部區(qū)域內(nèi)像素的幾何鄰近性,而且不能有效濾除退化圖像的高斯,斑點(diǎn)和脈沖噪聲等。
另一方面,目前大多較為流行的分類器通常被看作是淺層學(xué)習(xí)模型,例如線性支持向量機(jī),邏輯回歸,最大似然分類器和稀疏表示基分類器等。然而這些分類器不能有效地提取光譜數(shù)據(jù)的高階特征。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于提供一種能夠提高光譜數(shù)據(jù)的分類性能的基于三邊濾波器和堆棧稀疏自動(dòng)編碼器的圖像分類方法。
發(fā)明是這樣實(shí)現(xiàn)的:
首先,使用三邊濾波器獲取平滑的圖像,提取所述圖像的像素的光譜-空間特征的同時(shí)濾除退化圖像的高斯、斑點(diǎn)和脈沖噪聲;
其次,使用改進(jìn)的堆棧稀疏自動(dòng)編碼器(SSA)進(jìn)行高階特征提?。?/p>
最后,利用隨機(jī)森林分類器進(jìn)行有監(jiān)督微調(diào)網(wǎng)絡(luò)和分類。
本發(fā)明還可以包括:
1、所述圖像為高光譜圖像。
2、所述三邊濾波器的像素更新公式為:
其中,t和v分別代表像素的坐標(biāo),Sp代表像素t的鄰域的集合,δs、δr和δd分別為控制空間參數(shù)、幅值參數(shù)和脈沖參數(shù),I(t)是初始圖像的中心像素,I(v)是鄰域窗口內(nèi)的像素,J(t)和J(j)分別是基于參考圖像的中心像素和鄰域窗口內(nèi)的像素,Wt是空間鄰近性加權(quán)相似性加權(quán)和脈沖加權(quán)的乘積,Wt進(jìn)一步表示為:
在執(zhí)行脈沖權(quán)重因子時(shí),采用等級(jí)排序絕對(duì)差(Rank-Ordered Absolute Differences(ROAD))來確定樣本點(diǎn)是圖像的邊緣點(diǎn)或是被脈沖噪聲污染的像素點(diǎn),相應(yīng)的計(jì)算公式如下:
d[t,v]=|I(t)-I(v)|
rf(t,v)=fth smallest d[t,v]
其中,rf(t,v)代表增序排列的絕對(duì)差異值d[t,v],即從小到大累計(jì)選取f個(gè)d[t,v]值,2≤g≤w2-2,w是窗口尺寸,在等式中,ROAD統(tǒng)計(jì)被用來度量中心像素和第g個(gè)鄰域像素的鄰近程度。
3、使用改進(jìn)的堆棧稀疏自動(dòng)編碼器進(jìn)行高階特征提取具體包括:
稀疏自動(dòng)編碼器嘗試提取隱藏特征以至譯碼層的重構(gòu)矢量近似于輸入層的輸入數(shù)據(jù),即輸入矢量x∈RD被映射到隱藏層和產(chǎn)生一個(gè)線性組成z∈RS,然后采用一個(gè)非線性激活函數(shù)f(x)=(1+exp(-x))-1獲取輸出a,如下所示
z=wx+b1,a=f(z)
其中,w∈RS×D和b1∈RS×1分別代表輸入層到隱藏層的權(quán)重和偏置,D代表輸入數(shù)據(jù)維數(shù)、S代表隱藏層神經(jīng)元個(gè)數(shù),為了驗(yàn)證是否獲取的重構(gòu)y近似于初始輸入,對(duì)獲取的a進(jìn)行譯碼,如下所示:
t=va+b2,y=f(t)
其中,v∈RD×S、b2∈RD×1分別代表隱藏層到輸出層的權(quán)重和偏置,初始輸入x和重構(gòu)y之間的最小誤差被計(jì)算;為了發(fā)現(xiàn)初始輸入的一些特定結(jié)構(gòu)和相關(guān)性,稀疏約束和權(quán)重懲罰項(xiàng)被添加到網(wǎng)絡(luò)中,目標(biāo)函數(shù)J如下所示:
其中,M是樣本個(gè)數(shù),xm和ym分別代表第m個(gè)輸入和輸出,λ代表權(quán)重懲罰參數(shù),η代表稀疏懲罰項(xiàng)的權(quán)重,代表l層的第i個(gè)隱層神經(jīng)元和l-1層的第j個(gè)輸入神經(jīng)元之間的連接權(quán)重;此外,代表隱藏單元的目標(biāo)平均激活函數(shù)r和隱藏神經(jīng)元i的平均激活函數(shù)
采用改進(jìn)的人工魚群智能優(yōu)化算法優(yōu)化每一層稀疏自動(dòng)編碼器的目標(biāo)函數(shù),具體方案如下:
設(shè)魚群總數(shù)為n,每一條魚代表一個(gè)神經(jīng)網(wǎng)絡(luò)和任意兩條魚的差值和加性值仍然代表一個(gè)神經(jīng)網(wǎng)絡(luò),稀疏自動(dòng)編碼器的優(yōu)化參數(shù)包括兩個(gè)權(quán)重矩陣[w]與[v]和閾值向量b;在當(dāng)前的位置,個(gè)體魚的食物濃度為Y=1/E,兩個(gè)個(gè)體魚Xp和Xq之間的距離如下:
其中,輸出層神經(jīng)元個(gè)數(shù)是N,wij(p)和wij(q)分別代表人工魚Xp和Xq的參數(shù)矩陣[w]中第i行、第j列的元素,vki(p)和vki(q)分別代表人工魚Xp和Xq的參數(shù)矩陣[v]中第k行、第i列的元素,bi(p)和bi(q)分別代表人工魚Xp和Xq的閾值向量b中第i行的元素,bk(p)和bk(q)分別代表人工魚Xp和Xq的閾值向量b中第k行的元素,dpq代表兩個(gè)個(gè)體魚Xp和Xq之間的距離。
覓食行為:w(p)是個(gè)體魚的當(dāng)前狀態(tài),然后在視野范圍內(nèi)隨機(jī)地選擇一個(gè)新的狀態(tài)w(q),如果食物濃度Yq>Yp,w(p)按照公式被更新;否則,再一次選擇一個(gè)新的狀態(tài)來判斷是否滿足前進(jìn)條件,如果在執(zhí)行最大嘗試次數(shù)后仍然不滿足前進(jìn)條件,個(gè)體魚將按照公式w(pnext)=w(p)+rand()×step+χ×(wij(best)-wij(l)),if(Yq≤Yp)執(zhí)行隨機(jī)行為,
其中,w(pnext)是個(gè)體魚的下一步狀態(tài),rand()是[0,1]之間均勻地產(chǎn)生一個(gè)隨機(jī)數(shù),wij(best)和wij(l)分別代表當(dāng)前最優(yōu)人工魚Xbest和隨機(jī)魚Xl的參數(shù)矩陣[w]中第i行、第j列的元素,χ是黃金比例系數(shù)λ和偏移的乘積表示為:
其中,代表標(biāo)準(zhǔn)均勻分布的一個(gè)隨機(jī)值和取值區(qū)間為
利用模糊邏輯系統(tǒng)來動(dòng)態(tài)地調(diào)整視野距離V和移動(dòng)步長(zhǎng)M,魚群位置的分散度和迭代次數(shù)作為輸入變量,同時(shí)V和M作為輸出變量,分散性測(cè)度表達(dá)公式如下:
其中,魚群總數(shù)為n,k代表當(dāng)前迭代,和分別代表第k次迭代時(shí)的人工魚Xp和最優(yōu)人工魚Xbest,D代表模糊系統(tǒng)的輸入變量即魚群之間的分散性,迭代和分散性度量被歸一化在0到1之間,如下所示:
KNorm=k/Kmax
式中,KNorm和DNorm分別為將當(dāng)前迭代次數(shù)k與分散性D進(jìn)行標(biāo)準(zhǔn)正態(tài)化后的模糊系統(tǒng)輸入?yún)?shù);Kmax為最大迭代次數(shù);Dmin和Dmax分別為每次迭代中分散性的最小值和最大值。
本發(fā)明將改進(jìn)的堆棧稀疏自動(dòng)編碼器和隨機(jī)森林分類器引入到高光譜數(shù)據(jù)分類中,作為一種深度學(xué)習(xí)架構(gòu),改進(jìn)的堆棧稀疏自動(dòng)編碼器可以逐層地提取光譜數(shù)據(jù)的抽象的和有用的深層次特征,從而提高光譜數(shù)據(jù)的分類性能。
本發(fā)明提出的聯(lián)合三邊濾波器與堆棧稀疏自動(dòng)編碼器的分類方法不僅適用于對(duì)高光譜圖像進(jìn)行分類,同時(shí)也可以對(duì)其他圖像進(jìn)行分類。具有很強(qiáng)的可移植性,更易滿足圖像分類的需求。
本發(fā)明的優(yōu)點(diǎn)如下:
1)在計(jì)算相似性權(quán)重wr過程中,使用的是基于雙樹復(fù)小波變換的參考圖像,而不是初始的高光譜圖像。這一步的實(shí)現(xiàn)可以提高灰度測(cè)度計(jì)算的穩(wěn)定性從而獲得更加準(zhǔn)確的結(jié)果。
2)在像素更新公式中,引入脈沖權(quán)重因子。通過綜合考慮像素的光譜相似性和幾何鄰近性,從而有效地獲得高光譜圖像的光譜和空間特征,同時(shí)最大限度地濾除圖像在產(chǎn)生和傳輸過程中產(chǎn)生的高斯噪聲和脈沖噪聲等。
3)利用改進(jìn)的稀疏自動(dòng)編碼器(ISA)逐層提取光滑圖像的特征表示,采用人工魚群智能優(yōu)化算法優(yōu)化ISA的目標(biāo)函數(shù),從而降低傳統(tǒng)的反向傳播算法易于陷入局部極值的可能性同時(shí)加快算法的收斂速度。進(jìn)一步采用堆棧稀疏自動(dòng)編碼器自適應(yīng)地提取光譜數(shù)據(jù)的高階特征。為獲取最優(yōu)分類準(zhǔn)確度提供可能。
附圖說明
圖1是一幅光譜-空間信息聯(lián)合的高光譜圖像分類流程圖;
圖2是一幅人工魚群算法優(yōu)化稀疏自動(dòng)編碼器的流程圖;
圖3是人工魚模型;
圖4(a)-圖4(c)是模糊邏輯系統(tǒng)的輸入和輸出變量;
圖5是基于三邊濾波器和堆棧稀疏自動(dòng)編碼器的空譜聯(lián)合的高光譜圖像分類框架;
圖6(a)是印第安納農(nóng)場(chǎng)數(shù)據(jù)的九種地物的真實(shí)分布圖;
圖6(b)是基于對(duì)比算法OS-SVM的印第安納農(nóng)場(chǎng)數(shù)據(jù)的總體分類精度圖;
圖6(c)是基于對(duì)比算法BF-SVM的印第安納農(nóng)場(chǎng)數(shù)據(jù)的總體分類精度圖;
圖6(d)是基于對(duì)比算法TF-SVM的印第安納農(nóng)場(chǎng)數(shù)據(jù)的總體分類精度圖;
圖6(e)是基于對(duì)比算法OS-SSAR的印第安納農(nóng)場(chǎng)數(shù)據(jù)的總體分類精度圖;
圖6(f)是基于對(duì)比算法BF-SSARF的印第安納農(nóng)場(chǎng)數(shù)據(jù)的總體分類精度圖;
圖6(g)是基于對(duì)比算法TF-SSARF的印第安納農(nóng)場(chǎng)數(shù)據(jù)的總體分類精度圖;
圖6(h)是基于對(duì)比算法TF-ISSARF的印第安納農(nóng)場(chǎng)數(shù)據(jù)的總體分類精度圖;
圖7(a)是肯尼迪航天中心數(shù)據(jù)的十三種地物的真實(shí)分布圖;
圖7(b)是基于對(duì)比算法OS-SVM的肯尼迪航天中心數(shù)據(jù)的總體分類精度圖;
圖7(c)是基于對(duì)比算法BF-SVM的肯尼迪航天中心數(shù)據(jù)的總體分類精度圖;
圖7(d)是基于對(duì)比算法TF-SVM的肯尼迪航天中心數(shù)據(jù)的總體分類精度圖;
圖7(e)是基于對(duì)比算法OS-SSARF的肯尼迪航天中心數(shù)據(jù)的總體分類精度圖;
圖7(f)是基于對(duì)比算法BF-SSARF的肯尼迪航天中心數(shù)據(jù)的總體分類精度圖;
圖7(g)是基于對(duì)比算法TF-SSARF的肯尼迪航天中心數(shù)據(jù)的總體分類精度圖;
圖7(h)是基于對(duì)比算法TF-ISSARF的肯尼迪航天中心數(shù)據(jù)的總體分類精度圖;
圖8(a)描述基于三邊濾波器的空間參數(shù),幅值參數(shù)和脈沖參數(shù)對(duì)印第安納農(nóng)場(chǎng)數(shù)據(jù)的總體分類精度的影響;
圖8(b)描述基于三邊濾波器的空間參數(shù),幅值參數(shù)和脈沖參數(shù)對(duì)肯尼迪航天中心數(shù)據(jù)的總體分類精度的影響;
圖9(a)描述基于三邊濾波器的空間鄰近性加權(quán)的窗口尺寸對(duì)印第安納農(nóng)場(chǎng)數(shù)據(jù)的總體分類精度的影響;
圖9(b)描述基于三邊濾波器的空間鄰近性加權(quán)的窗口尺寸對(duì)肯尼迪航天中心數(shù)據(jù)的總體分類精度的影響。
具體實(shí)施方式
下面舉例對(duì)本發(fā)明做更詳細(xì)的描述。
首先,在執(zhí)行高光譜圖像分類之前,使用三邊濾波器獲取平滑的高光譜圖像。提取像素的光譜-空間特征的同時(shí)濾除退化圖像的高斯、斑點(diǎn)和脈沖噪聲等。
其次,使用改進(jìn)的堆棧稀疏自動(dòng)編碼器(SSA)進(jìn)行高階特征提取。
最后,利用隨機(jī)森林分類器進(jìn)行有監(jiān)督微調(diào)網(wǎng)絡(luò)和分類。
本發(fā)明提出的聯(lián)合三邊濾波器與堆棧稀疏自動(dòng)編碼器的分類方法不僅適用于對(duì)高光譜圖像進(jìn)行分類,同時(shí)也可以對(duì)其他圖像進(jìn)行分類。具有很強(qiáng)的可移植性,更易滿足圖像分類的需求。
本發(fā)明具體包括:
1、本發(fā)明提出運(yùn)用三邊濾波器對(duì)初始的退化圖像進(jìn)行平滑濾波。提出的三邊濾波器的像素更新公式如下所示:
其中,t和v分別代表像素的坐標(biāo)。Sp代表像素t的鄰域的集合。δs,δr和δd分別控制空間參數(shù),幅值參數(shù)和脈沖參數(shù)。I(t)是初始圖像的中心像素和I(v)是鄰域窗口內(nèi)的像素。J(t)和J(j)分別是基于參考圖像的中心像素和鄰域窗口內(nèi)的像素。Wt是空間鄰近性加權(quán)相似性加權(quán)和脈沖加權(quán)的乘積,可以進(jìn)一步表示為:
在執(zhí)行脈沖權(quán)重因子時(shí),采用等級(jí)排序絕對(duì)差(Rank-Ordered Absolute Differences(ROAD))來確定樣本點(diǎn)是圖像的邊緣點(diǎn)或是被脈沖噪聲污染的像素點(diǎn)。相應(yīng)的計(jì)算公式如下:
d[t,v]=|I(t)-I(v)| (3)
rf(t,v)=fth smallest d[t,v] (4)
其中,rf(t,v)代表增序排列的絕對(duì)差異值d[t,v],即從小到大累計(jì)選取f個(gè)d[t,v]值。2≤g≤w2-2,w是窗口尺寸。在等式(5)中,ROAD統(tǒng)計(jì)被用來度量中心像素和第g個(gè)鄰域像素的鄰近程度。
通常,如果圖像內(nèi)不存在噪聲像素,在鄰域窗口內(nèi)大部分像素點(diǎn)展現(xiàn)相似的強(qiáng)度值和產(chǎn)生低的ROAD值。相反,如果像素被脈沖噪聲污染,被污染像素的光譜強(qiáng)度和鄰域像素存在較大差異,導(dǎo)致產(chǎn)生高的ROAD函數(shù)值。特別地,如果圖像中至少存在一個(gè)噪聲樣本或者產(chǎn)生高的ROAD值,此時(shí)脈沖權(quán)重被激活和通過公式(1)更新當(dāng)前的像素值。相反地,如果圖像中不存在脈沖像素或者高的ROAD值,脈沖權(quán)重因子被抑制,即wd=0,此時(shí)使用雙邊濾波器對(duì)初始圖像進(jìn)行平滑濾波。
2、利用上述三邊濾波器獲取平滑的高光譜圖像后,提出一種改進(jìn)的堆棧稀疏自動(dòng)編碼器自適應(yīng)地提取平滑圖像的高階特征表示。
具體實(shí)現(xiàn)如下所示:
稀疏自動(dòng)編碼器嘗試提取隱藏特征以至譯碼層的重構(gòu)矢量近似于輸入層的輸入數(shù)據(jù)。即輸入矢量x∈RD被映射到隱藏層和產(chǎn)生一個(gè)線性組成z∈RS,然后采用一個(gè)非線性激活函數(shù)f(x)=(1+exp(-x))-1獲取輸出a,如下所示.
z=wx+b1,a=f(z) (6)
其中,w∈RS×D(D代表輸入數(shù)據(jù)維數(shù)和S代表隱藏層神經(jīng)元個(gè)數(shù))和b1∈RS×1分別代表輸入層到隱藏層的權(quán)重和偏置。進(jìn)一步,為了驗(yàn)證是否獲取的重構(gòu)y近似于初始輸入,對(duì)獲取的a進(jìn)行譯碼,如下所示:
t=va+b2,y=f(t) (7)
其中,v∈RD×S、b2∈RD×1分別代表隱藏層到輸出層的權(quán)重和偏置。初始輸入x和輸出y之間的最小重構(gòu)誤差被計(jì)算。特別地,為了發(fā)現(xiàn)初始輸入的一些特定結(jié)構(gòu)和相關(guān)性,稀疏約束和權(quán)重懲罰項(xiàng)被添加到網(wǎng)絡(luò)中,目標(biāo)函數(shù)J如下所示:
其中,M是樣本個(gè)數(shù),xm和ym分別代表第m個(gè)輸入和輸出。λ代表權(quán)重懲罰參數(shù)和η代表稀疏懲罰項(xiàng)的權(quán)重。代表l層的第i個(gè)隱層神經(jīng)元和l-1層的第j個(gè)輸入神經(jīng)元之間的連接權(quán)重;此外,代表r(隱藏單元的目標(biāo)平均激活函數(shù))和(隱藏神經(jīng)元i的平均激活函數(shù))的相對(duì)熵。
如公式(8),通常采用梯度下降和反向傳播算法更新隱藏層的權(quán)重和偏置,從而實(shí)現(xiàn)優(yōu)化目標(biāo)函數(shù)J。然而,再進(jìn)行目標(biāo)函數(shù)優(yōu)化過程中,模型較難選取適當(dāng)?shù)某跏紮?quán)重和偏置,優(yōu)化過程易于陷入局部極值。為了尋址上述難題,本發(fā)明提出利用改進(jìn)的人工魚群智能優(yōu)化算法替代梯度下降和反向傳播算法,采用改進(jìn)的人工魚群智能優(yōu)化算法優(yōu)化每一層稀疏自動(dòng)編碼器的目標(biāo)函數(shù)。改進(jìn)的原因是由于人工魚群算法展現(xiàn)魯棒的追蹤性能,快的收斂速度和高的全局優(yōu)化能力。具體實(shí)施方案如下:
設(shè)魚群總數(shù)為n,每一條魚代表一個(gè)神經(jīng)網(wǎng)絡(luò)和任意兩條魚的差值和加性值仍然代表一個(gè)神經(jīng)網(wǎng)絡(luò),稀疏自動(dòng)編碼器的優(yōu)化參數(shù)包括兩個(gè)權(quán)重矩陣[w]與[v]和閾值向量b;在當(dāng)前的位置,個(gè)體魚的食物濃度為Y=1/E,兩個(gè)個(gè)體魚Xp和Xq之間的距離如下:
其中,輸出層神經(jīng)元個(gè)數(shù)是N,wij(p)和wij(q)分別代表人工魚Xp和Xq的參數(shù)矩陣[w]中第i行、第j列的元素,vki(p)和vki(q)分別代表人工魚Xp和Xq的參數(shù)矩陣[v]中第k行、第i列的元素,bi(p)和bi(q)分別代表人工魚Xp和Xq的閾值向量b中第i行的元素,bk(p)和bk(q)分別代表人工魚Xp和Xq的閾值向量b中第k行的元素,dpq代表兩個(gè)個(gè)體魚Xp和Xq之間的距離。
本發(fā)明研究和改進(jìn)了魚群的四個(gè)生物學(xué)行為,包括覓食行為,聚群行為,跟隨行為和隨機(jī)行為。
覓食行為:w(p)是個(gè)體魚的當(dāng)前狀態(tài),然后在視野范圍內(nèi)隨機(jī)地選擇一個(gè)新的狀態(tài)w(q),如果食物濃度Yq>Yp,w(p)按照公式(10)被更新;否則,再一次選擇一個(gè)新的狀態(tài)來判斷是否滿足前進(jìn)條件,如果在執(zhí)行最大嘗試次數(shù)后仍然不滿足前進(jìn)條件,個(gè)體魚將按照公式(11)執(zhí)行隨機(jī)行為。
w(pnext)=w(p)+rand()×step+χ×(wij(best)-wij(l)),if(Yq≤Yp) (11)
其中,w(pnext)是個(gè)體魚的下一步狀態(tài),rand()是[0,1]之間均勻地產(chǎn)生一個(gè)隨機(jī)數(shù)。本發(fā)明提出將χ×(wij(best)-wij(l))添加到魚群位置更新公式中,被稱作為全局最優(yōu)導(dǎo)向魚群搜索項(xiàng)。其中,wij(best)和wij(l)分別代表當(dāng)前最優(yōu)人工魚Xbest和隨機(jī)魚Xl的參數(shù)矩陣[w]中第i行,第j列的元素。χ是黃金比例系數(shù)λ和偏移的乘積,如下所示:
其中,代表標(biāo)準(zhǔn)均勻分布的一個(gè)隨機(jī)值和取值區(qū)間為在這里從公式(12)可知,產(chǎn)生的新解沒有呆在相同的位置,而是轉(zhuǎn)移一個(gè)角度,從而使得個(gè)體魚在搜索空間內(nèi)獲得更多的位置信息。
另一方面,為了克服傳統(tǒng)人工魚群算法存在后期迭代收斂速度慢的不足,本發(fā)明提出利用模糊邏輯系統(tǒng)來動(dòng)態(tài)地調(diào)整視野距離(V)和移動(dòng)步長(zhǎng)(M)。在這個(gè)設(shè)計(jì)的系統(tǒng)中,魚群位置的分散度和迭代次數(shù)作為輸入變量。同時(shí)V和M作為輸出變量。分散性測(cè)度表達(dá)公式如下:
其中,魚群總數(shù)為n和k代表當(dāng)前迭代。和分別代表第k次迭代時(shí)的人工魚Xp和最優(yōu)人工魚Xbest。D代表模糊系統(tǒng)的輸入變量即魚群之間的分散性。大體上,魚群越接近時(shí)分散性越低,反之亦然。在上述公式(13)中,歐式距離被用來測(cè)量個(gè)體魚和最優(yōu)魚之間的分散度。此外,為了方便計(jì)算,迭代和分散性度量被歸一化在0到1之間,如下所示:
KNorm=k/Kmax (14)
式中,KNorm和DNorm分別為將當(dāng)前迭代次數(shù)k與分散性D進(jìn)行標(biāo)準(zhǔn)正態(tài)化后的模糊系統(tǒng)輸入?yún)?shù);Kmax為最大迭代次數(shù);Dmin和Dmax分別為每次迭代中分散性的最小值和最大值。
需要注意的是,上述的位置信息更新規(guī)則同樣適用于聚群行為和跟隨行為。為了每一條魚,通過執(zhí)行上述描述的四種行為模式來搜索最優(yōu)解。然后,選擇最好的行為模式來更新當(dāng)前狀態(tài)。最后需要對(duì)公告板進(jìn)行更新,即人工魚的最優(yōu)狀態(tài)和最大的食物濃度被記錄在公告板上,在移動(dòng)之后每一條魚被更新,然后比較公告板和產(chǎn)生的新的狀態(tài)。如果人工魚的當(dāng)前狀態(tài)優(yōu)于公告板,公告板上的值將被替代。
在訓(xùn)練完每一個(gè)稀疏自動(dòng)編碼器之后,重構(gòu)層被移除和提取的特征保存于隱藏層,然后被用來作為下一個(gè)隱藏層的輸入,從而產(chǎn)生更高階特征。進(jìn)一步,通過堆疊多個(gè)非監(jiān)督特征學(xué)習(xí)層來構(gòu)建堆棧稀疏自動(dòng)編碼器。最后,隨機(jī)森林分類器被級(jí)聯(lián)到堆棧稀疏自動(dòng)編碼器的最后一層,當(dāng)訓(xùn)練分類器時(shí)對(duì)學(xué)習(xí)到的高階特征進(jìn)行有監(jiān)督的微調(diào),然后通過最大投票規(guī)則判別測(cè)試集的類別標(biāo)簽。
圖1是一幅空譜聯(lián)合的高光譜圖像分類流程圖,在提出的三邊濾波器中,通過綜合考慮高光譜圖像的光譜和空間鄰近性從而產(chǎn)生光譜-空間信息特征集。獲得的平滑圖像可以有效地濾除高斯噪聲,斑點(diǎn)噪聲和脈沖噪聲等,同時(shí)保留圖像的細(xì)節(jié)信息。此外,本發(fā)明采用改進(jìn)的堆棧稀疏自動(dòng)編碼器和隨機(jī)森林分類器對(duì)獲取的平滑圖像進(jìn)行非監(jiān)督的訓(xùn)練和有監(jiān)督的微調(diào)與分類。所提出的深度學(xué)習(xí)機(jī)模型可以逐層地提取數(shù)據(jù)的抽象的和有用的高階特征表示,從而提高高光譜數(shù)據(jù)的分類性能。
圖2是一幅人工魚群算法優(yōu)化稀疏自動(dòng)編碼器的流程圖。在改進(jìn)的深度學(xué)習(xí)模型中,將全局最優(yōu)導(dǎo)向魚群搜索項(xiàng)和模糊邏輯規(guī)則引入到魚群行為模式中,實(shí)現(xiàn)優(yōu)化目標(biāo)函數(shù)J。該方法的提出可以保持魚群的多樣性并同時(shí)避免算法在后期迭代收斂慢的不足,從而有效地避免深度學(xué)習(xí)模型在優(yōu)化目標(biāo)函數(shù)過程中易于陷入局部極值,從而獲取全局最優(yōu)解。
圖3是一個(gè)人工魚模型,和為兩條任意魚,Xp為當(dāng)前人工魚,step為移動(dòng)步長(zhǎng),visual為其感知范圍,然后在視野范圍內(nèi)隨機(jī)地選擇一個(gè)新的人工魚Xq,如果食物濃度值Yq>Yp,人工魚Xp的當(dāng)前狀態(tài)w(p)被更新;如果人工魚Xq的新的狀態(tài)w(q)不比當(dāng)前狀態(tài)更優(yōu),則繼續(xù)巡視感知范圍內(nèi)的其它位置,來判斷是否滿足前進(jìn)條件。如果在執(zhí)行完最大嘗試次數(shù)后仍然不滿足前進(jìn)條件,個(gè)體魚將任意移動(dòng)一步。大體上,魚群移動(dòng)的最終目標(biāo)是通過執(zhí)行最優(yōu)的行為模式從而獲取最優(yōu)解。
參圖4(a)-圖4(c),該圖被用來顯示模糊邏輯系統(tǒng)的輸入和輸出變量。系統(tǒng)中,魚群位置的分散度和迭代次數(shù)作為輸入變量。同時(shí)視野范圍和移動(dòng)步長(zhǎng)作為輸出變量。圖4(a)-圖4(c)中L,M,H,ML和MH分別代表低,中,高,中低和中高值。通常在早期迭代過程中,視野范圍和移動(dòng)步長(zhǎng)應(yīng)該取較大值以致搜索更大范圍和確保全局最優(yōu)化。然后,隨著迭代的進(jìn)行,視野范圍和移動(dòng)步長(zhǎng)應(yīng)該逐步降低以確保算法在鄰近全局最優(yōu)解范圍內(nèi)執(zhí)行最優(yōu)化,從而獲得高精度解。
圖5是基于三邊濾波器和堆棧稀疏自動(dòng)編碼器的空譜聯(lián)合的高光譜圖像分類框架。
首先,采用提出的三邊濾波器提高圖像質(zhì)量,即將空間信息整合到光譜域中同時(shí)降低由噪聲引起的退化現(xiàn)象。進(jìn)一步,采用改進(jìn)的堆棧稀疏自動(dòng)編碼器提取平滑的圖像的高階特征。最后,將獲取的抽象的高階特征作用于隨機(jī)森林分類器中,通過主要投票準(zhǔn)則獲取最終的分類結(jié)果。
圖6(a)-圖6(h)是一幅真實(shí)的高光譜圖像數(shù)據(jù),這組數(shù)據(jù)由AVIRIS傳感器于1992年在美國(guó)印第安納州西北部的農(nóng)場(chǎng)上空獲取。AVIRIS數(shù)據(jù)包含224個(gè)波段,它的空間分辨率為20m和光譜覆蓋范圍為0.2~2.4μm。在去除20個(gè)水吸收波段和4個(gè)噪聲波段,剩余200個(gè)波段用于分類實(shí)驗(yàn)。整幅圖大小為144x144個(gè)像素點(diǎn),包含從20到2468個(gè)像素不等的16類地物。為了使實(shí)驗(yàn)分析更加顯著,七類關(guān)于小樣本的地物被移除和剩余的九類大樣本地物被保留。圖6(a)表示場(chǎng)景的真實(shí)地物分布,圖6(b)-(d)代表初始光譜數(shù)據(jù)集,來自于雙邊濾波器的空譜聯(lián)合特征和來自于提出的三邊濾波器的空譜聯(lián)合特征被分別送入到支持向量機(jī)分類器的分類圖(即分別表示為OS-SVM,BF-SVM,和TF-SVM)。圖6(e)-(g)代表初始光譜數(shù)據(jù)集,來自于雙邊濾波器的空譜聯(lián)合特征和來自于三邊濾波器的空譜聯(lián)合特征被分別送入到堆棧稀疏自動(dòng)編碼器和隨機(jī)森林分類器(即分別表示為OS-SSARF,BF-SSARF,和TF-SSARF)。最后,圖6(h)代表來自于三邊濾波器的空譜聯(lián)合特征被送入到改進(jìn)的堆棧稀疏自動(dòng)編碼器和隨機(jī)森林分類器(即為TF-ISSARF)。從圖6可以看出,相比于對(duì)比算法,所提出的TF-ISSARF方法獲得最好的分類圖(即圖6(h))。
圖7(a)-圖7(h)是一幅真實(shí)的高光譜圖像數(shù)據(jù),這組數(shù)據(jù)同樣是由AVIRIS傳感器獲取得到的,它拍攝于1996年的美國(guó)肯尼迪航天中心上空。數(shù)據(jù)構(gòu)成特點(diǎn)與印第安農(nóng)場(chǎng)數(shù)據(jù)集一致。經(jīng)數(shù)據(jù)預(yù)處理,保留176個(gè)波段進(jìn)行分類實(shí)驗(yàn)。圖像大小為614×512像素,空間分辨率18m。在圖7(a)中,我們給出了場(chǎng)景的真實(shí)地物分布。圖7(b)-(h)分別為對(duì)比算法和所提出的算法的分類圖。與預(yù)期結(jié)果相一致,所提出的TF-ISSARF方法獲得最好的分類圖(即圖7(h))和它基本接近真實(shí)的地物分布。
參照?qǐng)D8(a)-圖8(b),研究和分析了總體分類準(zhǔn)確度隨著三邊濾波器的空間參數(shù),幅值參數(shù)和脈沖參數(shù)取值的變異性,在圖8(a)中,對(duì)于印第安納農(nóng)場(chǎng)數(shù)據(jù),當(dāng)δs=7,δr=0.4,和δd=8時(shí)提出的TF-ISSARF分類方法獲得最優(yōu)的總體分類準(zhǔn)確度。對(duì)于肯尼迪航天中心數(shù)據(jù),從圖8(b)可知當(dāng)δs=8,δr=0.4,和δd=7時(shí),取得最優(yōu)的總體分類準(zhǔn)確度。
參照?qǐng)D9(a)-圖9(b),研究和分析了三邊濾波器的鄰域窗口尺寸對(duì)總體分類準(zhǔn)確度的影響。為了獲得最優(yōu)的窗口尺寸,對(duì)于印第安納農(nóng)場(chǎng)數(shù)據(jù),固定δs=7,δr=0.4,和δd=8,分析總體分類準(zhǔn)確度隨著窗口尺寸的變化。從圖9(a)可知,當(dāng)窗口尺寸w=7時(shí),農(nóng)場(chǎng)數(shù)據(jù)獲得最好的分類結(jié)果。對(duì)于圖9(b),當(dāng)窗口尺寸w=9時(shí),肯尼迪航天中心數(shù)據(jù)獲得最好的分類結(jié)果。
上述為本發(fā)明特舉之實(shí)施例,并非用以限定本發(fā)明。本發(fā)明提供的基于三邊濾波器和堆棧稀疏自動(dòng)編碼器的高光譜圖像分類方法同樣適用于分類其他的非高光譜圖像。在不脫離本發(fā)明的實(shí)質(zhì)和范圍內(nèi),可做些許的調(diào)整和優(yōu)化,以本發(fā)明的保護(hù)范圍以權(quán)利要求為準(zhǔn)。