本發(fā)明涉及一種基于深度學(xué)習(xí)的高光譜圖像分類方法,屬于遙感與測繪、計(jì)算機(jī)視覺與模式識(shí)別技術(shù),適用于任何成像光譜儀獲取的高光譜數(shù)據(jù)。
背景技術(shù):
高光譜圖像的精細(xì)分類是高光譜遙感技術(shù)應(yīng)用的核心內(nèi)容之一,是計(jì)算機(jī)視覺與模式識(shí)別、遙感與測繪領(lǐng)域十分關(guān)注的問題。已有的分類方法存在降維過程中造成高光譜圖像中非線性信息的損失和在利用圖像的空間特征時(shí)需要人為的設(shè)計(jì)空間特征的不足,導(dǎo)致分類精度較差,導(dǎo)致高光譜圖像分類的不確定性,進(jìn)而影響其在實(shí)際中的應(yīng)用。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明要解決的技術(shù)問題為:克服現(xiàn)有的高光譜圖像分類方法的兩方面的不足:(1)現(xiàn)有的線性降維方法在降維過程中會(huì)造成高光譜圖像中非線性信息的損失;(2)在利用圖像的空間特征時(shí)需要人為的設(shè)計(jì)空間特征。
本發(fā)明解決上述技術(shù)問題采用的技術(shù)方案為:一種基于深度學(xué)習(xí)的高光譜圖像分類方法,包括以下步驟:
步驟(1)輸入高光譜遙感圖像數(shù)據(jù),每個(gè)像素即樣本用光譜特征向量表示,樣本的特征維數(shù)為d,將樣本集合歸一化到0~1之間,所有歸一化的樣本構(gòu)成樣本集,其中xi為第i個(gè)樣本,N為樣本總個(gè)數(shù);
步驟(2)對(duì)自編碼網(wǎng)絡(luò)的基本組成單位——自動(dòng)編碼機(jī)進(jìn)行自下而上的逐層訓(xùn)練;
步驟2a)首先初始化自動(dòng)編碼的的網(wǎng)絡(luò)參數(shù)θ={W1,W2,b1,b2},W1和b1是輸入層到隱層的權(quán)重和偏置,W2和b2是隱層到重構(gòu)層的權(quán)重和偏置,初始化b1和b2分別為全零的m維和n維的向量,W1=rand(m,n)×2e-e,W2=rand(n,m)×2e-e,其中,rand(m,n)和rand(n,m)分別是從0到1間隨機(jī)取值的m×n和n×m矩陣;
步驟2b)調(diào)整自動(dòng)編碼機(jī)的網(wǎng)絡(luò)參數(shù)θ,使得輸入層和重構(gòu)層的差距達(dá)到最??;
步驟2c)最底層的自動(dòng)編碼機(jī)訓(xùn)練完畢后,將下一層自動(dòng)編碼機(jī)的隱藏層輸出作為上一層的輸入層的輸入,逐層訓(xùn)練自動(dòng)編碼機(jī),最終得到整個(gè)自編碼網(wǎng)絡(luò)的初始化參數(shù);
步驟(3)展開的深度自編碼網(wǎng)絡(luò)采用BP算法對(duì)預(yù)訓(xùn)練得到的初始權(quán)值進(jìn)一步調(diào)整,進(jìn)一步減少誤差,BP算法的目標(biāo)函數(shù)采用交叉熵函數(shù):
其中,xi是自編碼網(wǎng)絡(luò)輸入向量的第i個(gè)分量,yi代表經(jīng)過自編碼網(wǎng)絡(luò)重構(gòu)后的數(shù)據(jù)的第i個(gè)分量。m代表自編碼網(wǎng)絡(luò)輸入數(shù)據(jù)的維度及重構(gòu)后數(shù)據(jù)的維度,二者維度相等;
步驟(4)使用訓(xùn)練完畢的自編碼網(wǎng)絡(luò)對(duì)高光譜數(shù)據(jù)進(jìn)行降維處理,獲得降維后的圖像;
步驟(5)輸入降維后的高光譜圖像以及對(duì)應(yīng)的分類參考圖,取待分類像元鄰域內(nèi)的數(shù)據(jù)立方體為卷積神經(jīng)網(wǎng)絡(luò)的輸入,分類參考圖中像元對(duì)應(yīng)的地物種類為卷積神經(jīng)網(wǎng)絡(luò)的期望輸出,使用隨機(jī)梯度下降算法訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò),訓(xùn)練完畢后將卷積神經(jīng)網(wǎng)絡(luò)作用與整幅圖像,獲得最終的分類結(jié)果。
其中,所述步驟(5)中的卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)圖如下:
卷積神經(jīng)網(wǎng)絡(luò)一般由卷積層,池化層,全連接層和softmax分類層組成,卷積神經(jīng)網(wǎng)絡(luò)的輸入大小為7×7×N,其中N是降維后高光譜圖像的維數(shù),7×7是像元鄰域的大小,卷積神經(jīng)網(wǎng)絡(luò)的輸入的空間維數(shù)不高,因此無需進(jìn)行空間域的池化降維操作;
卷積神經(jīng)網(wǎng)絡(luò)包含三個(gè)卷積層,一個(gè)全連接層和一個(gè)softmax分類層,每一個(gè)卷積層的包含N個(gè)大小為3×3的卷積核,全連接層的輸入為N,輸出為30,softmax分類層的輸入大小為30,輸出大小為高光譜圖像的地物種類數(shù)。
本發(fā)明與現(xiàn)有技術(shù)相比的優(yōu)點(diǎn)在于:
(1)在降維方面,傳統(tǒng)的降維方式如PCA,ICA,NWFE等方法均屬于線性降維方法,在降維過程中損失掉了高光譜圖像數(shù)據(jù)在光譜維上的非線性的細(xì)節(jié)信息,限制了分類精度。本發(fā)明采用深度自編碼網(wǎng)絡(luò)對(duì)高光譜數(shù)據(jù)進(jìn)行降維,深度自編碼網(wǎng)絡(luò)在降維方面有兩個(gè)優(yōu)勢:一方面,高光譜圖像數(shù)據(jù)中無標(biāo)簽的數(shù)據(jù)樣本相對(duì)來說容易獲得,而有標(biāo)簽的數(shù)據(jù)樣本不易獲得,而深度自編碼網(wǎng)絡(luò)的訓(xùn)練采用非監(jiān)督的訓(xùn)練方式,使用無標(biāo)簽的數(shù)據(jù)即可;另一方面,深度自編碼網(wǎng)絡(luò)屬于非線性降維方式,能夠有效的保留數(shù)據(jù)樣本中的高維度上的非線性信息,從而有效提升了分類精度。
(2)在結(jié)合空間特征方面,傳統(tǒng)的結(jié)合空間特征的高光譜圖像分類方法需要人工設(shè)計(jì)并提取空間特征,如紋理特征,形態(tài)學(xué)特征,形狀特征等,人工設(shè)計(jì)并提取空間特征依賴于人的知識(shí)或經(jīng)驗(yàn),分類的結(jié)果相當(dāng)程度上取決于特征設(shè)計(jì)的好壞,而且并不能保證提取到的特征對(duì)所有的分類結(jié)果都有利,可能在某一數(shù)據(jù)集上表現(xiàn)良好的特征,在另外一個(gè)數(shù)據(jù)集上表現(xiàn)不佳。本方法受到卷積神經(jīng)網(wǎng)絡(luò)在圖像識(shí)別等應(yīng)用的啟發(fā),設(shè)計(jì)了一種用于光譜空間聯(lián)合分類的卷積神經(jīng)網(wǎng)絡(luò),能夠自動(dòng)從高光譜圖像中提取對(duì)分類有利的空間特征,免去了人工設(shè)計(jì)并提取空間特征的過程。
附圖說明
圖1為本發(fā)明的方法實(shí)現(xiàn)流程圖;
圖2為本發(fā)明的卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)圖及分類過程示意圖;
圖3為本發(fā)明仿真實(shí)驗(yàn)圖,其中,圖3(a)為本發(fā)明仿真實(shí)驗(yàn)中Indian Pines高光譜圖像數(shù)據(jù);圖3(b)為本發(fā)明仿真實(shí)驗(yàn)中Indian Pines高光譜圖像數(shù)據(jù)的標(biāo)記模板;圖3(c)~圖3(g)為本發(fā)明仿真實(shí)驗(yàn)中各種算法的分類結(jié)果對(duì)比((a)假彩色圖像,(b)為分類參考圖,(c)PCA-SVM:80.47%,(d)Autoencoder-SVM:85.48%,(e)PCA-MOR-SVM:91.13%,(f)PCA-CNN:%95.27,(g)Autoencoder-CNN:98.64%);
圖4為本發(fā)明仿真實(shí)驗(yàn)中Indian Pines數(shù)據(jù)分類結(jié)果中使用各種方面進(jìn)行分類后,每一種地物的精度。
具體實(shí)施方式
下面結(jié)合附圖以及具體實(shí)施方式進(jìn)一步說明本發(fā)明。
如圖1所示,本發(fā)明包括以下兩個(gè)步驟:基于自動(dòng)編碼網(wǎng)絡(luò)的降維以及基于卷積神經(jīng)網(wǎng)絡(luò)的空譜聯(lián)合分類。其中,自動(dòng)編碼網(wǎng)絡(luò)的訓(xùn)練使用無標(biāo)簽的數(shù)據(jù)進(jìn)行無監(jiān)督分類,而卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練使用有標(biāo)簽的數(shù)據(jù)進(jìn)行監(jiān)督分類。
現(xiàn)有待分類高光譜圖像數(shù)據(jù)Indian Pines,Indian Pines為AVIRIS采集的農(nóng)業(yè)區(qū)高光譜圖像,圖像大小為145×145像素,共包含220個(gè)波段,去掉其中的20個(gè)水吸收嚴(yán)重的波段,得到包含200個(gè)波段的高光譜數(shù)據(jù)。Indian Pines以及Pavia University數(shù)據(jù)的假彩色圖以及標(biāo)記模板分別如圖3,4所示,本發(fā)明的具體實(shí)施步驟如下:
(1)輸入高光譜圖像數(shù)據(jù),每個(gè)像素即樣本用高光譜特征向量表示,樣本的維數(shù)為m,將樣本歸一化到0~1之間,所有歸一化的樣本構(gòu)成樣本集合,其中xi為第i個(gè)樣本,N為樣本總數(shù)。
(2)自動(dòng)編碼機(jī)的訓(xùn)練使用無標(biāo)簽的數(shù)據(jù)樣本。自動(dòng)編碼網(wǎng)絡(luò)的訓(xùn)練共包含參數(shù)預(yù)訓(xùn)練和微調(diào)兩個(gè)步驟,自編碼網(wǎng)絡(luò)的結(jié)構(gòu)為200-120-80-60-40,自編碼網(wǎng)絡(luò)共有5層,降維后的光譜維維度是40。
2a)預(yù)訓(xùn)練過程。隨機(jī)初始化自編碼網(wǎng)絡(luò)的參數(shù)后,逐層訓(xùn)練組成自編碼網(wǎng)絡(luò)的多個(gè)自動(dòng)編碼機(jī),下層自動(dòng)編碼機(jī)的隱藏層單元的輸出作為其上層的輸入?yún)⑴c訓(xùn)練。
2b)微調(diào)過程。預(yù)訓(xùn)練完成后,展開的自動(dòng)編碼網(wǎng)絡(luò)采用BP算法對(duì)預(yù)訓(xùn)練得到的初始權(quán)值進(jìn)一步調(diào)整,進(jìn)一步減少誤差。BP算法的目標(biāo)函數(shù)采用交叉熵函數(shù)。
(3)使用(2)已經(jīng)訓(xùn)練好的自動(dòng)編碼網(wǎng)絡(luò)對(duì)Indian Pines高光譜數(shù)據(jù)進(jìn)行降維,降維后的光譜維度為40。
(4)輸入降維后的高光譜數(shù)據(jù)以及對(duì)應(yīng)的地物標(biāo)記圖,在已經(jīng)標(biāo)記的數(shù)據(jù)中選取30%作為訓(xùn)練樣本,其余70%作為測試樣本。本方法使用的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖所示,輸入的數(shù)據(jù)為以待分類像元為中心的矩形區(qū)域內(nèi)的數(shù)據(jù)立方體,取矩形大小為7×7,因此卷積神經(jīng)網(wǎng)絡(luò)的輸入大小為7×7×40。卷積神經(jīng)網(wǎng)絡(luò)的期望輸出為對(duì)應(yīng)的待分類像元對(duì)應(yīng)的地物種類。卷積神經(jīng)網(wǎng)絡(luò)包含3個(gè)卷積層,一個(gè)全連接層和一個(gè)softmax分類層。每個(gè)卷積層都包含40個(gè)大小為3×3的卷積核,全連接層的輸入大小為40,輸出大小為30,softmax分類層的輸入大小為30,輸出大小為Indian Pines高光譜數(shù)據(jù)的地物種類數(shù)目,即16。本方法中的卷積神經(jīng)網(wǎng)絡(luò)通過使用隨機(jī)梯度下降算法最小化損失函數(shù)來實(shí)現(xiàn)訓(xùn)練。損失函數(shù)如下:
其中,L為卷積神經(jīng)網(wǎng)絡(luò)的損失函數(shù),M為隨機(jī)梯度下降算法中每一批訓(xùn)練樣本中含有樣本的個(gè)數(shù),ti是第i個(gè)樣本對(duì)應(yīng)的卷積神經(jīng)網(wǎng)絡(luò)的輸出,而yi代表第i個(gè)樣本對(duì)應(yīng)的卷積神經(jīng)網(wǎng)絡(luò)的期望輸出,即樣本對(duì)應(yīng)的標(biāo)簽。
(5)在步驟(4)中完成了卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練之后,將其作用于整幅高光譜圖像,得到最終的分類結(jié)果。