一種基于分層稀疏判別特征學習的高光譜圖像分類方法
【專利摘要】本發(fā)明具體公開了一種基于分層稀疏判別特征學習的高光譜圖像分類方法,主要用于解決現有技術不能很好的學習高光譜數據鄰域塊的特征表示的問題。其實現步驟為:輸入高光譜圖像數據樣本集,從中選擇訓練集和測試集;基于選出的訓練集和樣本集,利用基于稀疏編碼的分層判別特征學習方法,得到第一層判別特征及第二層判別特征;將第一層判別特征及第二層判別特征結合,得到分層判別特征;基于分層判別特征,利用支撐矢量機分類,輸出分類結果。本發(fā)明在空間金字塔稀疏編碼模型的基礎上,加入了類標監(jiān)督信息的判別字典學習,且基于空間金字塔稀疏模型采用二層判別特征學習,增強了特征的判別性,提高了分類精度,使得對高光譜數據分類更加準確。
【專利說明】-種基于分層稀疏判別特征學習的高光譜圖像分類方法
【技術領域】
[0001] 本發(fā)明屬于圖像處理【技術領域】,涉及機器學習和高光譜圖像處理,具體是一種基 于分層稀疏判別特征學習的高光譜圖像分類方法,本發(fā)明可以通過對高光譜數據進行判別 特征學習,恰當的表征出高光譜圖像不同地物的特征,從而在此基礎上實現計算機自主的 對于高光譜圖像不同地物進行分類識別。
【背景技術】
[0002] 高光譜圖像的地物分類是目前高光譜圖像處理領域的研究熱點,其研究主要致力 于尋找使計算機智能地學習和識別不同圖像目標的技術方法。高光譜圖像具有比較高的光 譜分辨率,通常能達到KT2a數量級,同時波段多,光譜通道數多達數十甚至數百個以上,而 且各通道間往往是連續(xù)的。高光譜圖像的地物分類在地質調查、農作物災害監(jiān)測、大氣污染 和軍事目標打擊等領域均有良好應用前景。最為普遍的高光譜圖像地物分類方法通常是: (1)輸入一幅高光譜圖像;(2)從中選取訓練樣本和測試樣本;(3)通過特征學習的方法分 別對訓練樣本和測試樣本學習特征;(4)將所學的特征通過分類器進行分類;(5)得到分類 結果。其中的一個關鍵問題就是如何從大量帶有冗余的高光譜數據中提取有用信息,使用 合適的特征學習方法表征出不同地物的表示,因為表示的合理與否決定了后續(xù)分類的性能 上限。另外,由于高光譜具有數據量大、冗余信息多、波段多等不利因素,因此要求對高光譜 數據特征學習時用到的技術方法高效、簡單且有一定抗噪聲干擾能力。
[0003] Jianchao Yang 等人在論文 "Linear Spatial Pyramid Matching Using Sparse Coding for Image Classification"(CVPR,2009)中利用基于 Sparse Coding 的方法對原 始高光譜圖像數據進行空間金字塔最大池化特征編碼,最后結合分類器進行分類。該方法 的具體步驟為第1步:提取樣本SIFT特征;第2步:訓練字典;第3步:根據字典對SIFT 特征進行編碼得到稀疏編碼向量,對稀疏編碼向量做最大池化算法得到每個樣本的最終特 征;第4步:對最終特征用線性支持矢量機方法進行分類。這種方法雖然對特征編碼相對準 確,但是,仍然存在的不足之處是,該方法比較依賴于稀疏編碼的好壞。
【發(fā)明內容】
[0004] 本發(fā)明針對上述現有技術的不足,提出一種新的基于稀疏編碼的分層判別特征學 習方法,在對高光譜圖像數據進行稀疏編碼時加入了類標信息,在分層特征學習的過程中 加入了結構信息,使得地物分類特征更具判別性,從而進一步提高對高光譜數據圖像不同 地物的智能識別能力。
[0005] 本發(fā)明的技術方案是:一種基于分層稀疏判別特征學習的高光譜圖像分類方法, 包括以下步驟:
[0006] (1)輸入包含C類地物的高光譜遙感圖像數據,每個像素即為樣本,將樣本用光譜 特征向量表示,樣本的特征維數為h,所有樣本構成樣本集Y = e Rm ?其中yi為第i 個樣本,N為樣本總個數,R表示實數域;
[0007] (2)隨機從每類樣本集中選出10%的樣本作為訓練集Ytrata e Rh,H1表示訓練 集樣本數目,剩余的90%樣本作為測試集¥_ e ,n2表示測試集樣本數目;
[0008] (3)基于訓練集Ytrain和樣本集Y,利用基于稀疏編碼的分層判別特征學習方法,得 到第一層判別特征集及第二層判別特征集t = ,其中,#為對應于樣本集 i ; I I=I I 11=1 Y第i個樣本的第一層判別特征,;!為對應于樣本集Y第i個樣本的第二層判別特征:
[0009] 3a)從訓練集中隨機選取K1個訓練樣本作為第一層判別字典的初始化字典 ,利用判別K-SVD字典學習方法,得到第一層判別字典D ;
[0010] 3b)基于第一層判別字典D,利用正交匹配追蹤算法得到所有樣本的第一層稀疏 編碼特征 2 = [I,,Z2,…,Z v] G ;
[0011] 3c)根據所有樣本的第一層稀疏編碼特征,利用第一層判別特征學習方法,得到第 一層判別特征集f = e RaiA>v及第二層輸入特征集& e = ;
[0012] 3d)從訓練集對應的第二層輸入特征集中隨機選取K2個作為第二層判別字典的初 始化字典D' 2,結合對應的類標矩陣和判別矩陣,類似于第一層判別字典學習方法優(yōu)化判 別字典目標函數,得到第二層判別字典〇2 G R5a^A ;
[0013] 3e)基于樣本集Y的第二層輸入特征集和第二層判別字典,利用正交匹配追蹤算 法得到每個樣本的第二層稀疏編碼特征《,=〇,<1),#斤5^3),?, (4>],1 = 1,2,"、1對所有樣本 的第二層稀疏編碼特征利用最大池化算法,得到第二層判別特征集t = e Ra.,.v ;
[0014] (4)合并第一層判別特征集f和第二層判別特征集§,得到樣本集Y的分層判別 特征集F,F= F;F ;
[0015] (5)將訓練集和測試集對應的分層判別特征集輸入到支撐矢量機,得到測試集的 分類標簽向量,該類標簽向量即為該高光譜圖像的分類結果。
[0016] 上述步驟3a)中判別K-SVD字典學習方法的具體步驟為:
[0017] 第1步,基于訓練集Ytrain,判別K-SVD字典學習方法的目標函數如下:
【權利要求】
1. 一種基于分層稀疏判別特征學習的高光譜圖像分類方法,其特征在于,包括以下步 驟: (1) 輸入包含C類地物的高光譜遙感圖像數據,每個像素即為樣本,將樣本用光譜特征 向量表示,樣本的特征維數為h,所有樣本構成樣本集
> 其中yi為第i個樣 本,N為樣本總個數,R表示實數域; (2) 隨機從每類樣本集中選出10 %的樣本作為訓練集
,^表示訓練集樣 本數目,剩余的90 %樣本作為測試集
,n2表示測試集樣本數目; (3) 基于訓練集YtMin和樣本集Y,利用基于稀疏編碼的分層判別特征學習方法,得到第 一層判別特征集
及第二層判別特征集
,其中,|?為對應于樣本集Y第i 個樣本的第一層判別特征,|為對應于樣本集Y第i個樣本的第二層判別特征: f 3a)從訓練集中隨機選取&個訓練樣本作為第一層判別字典的初始化字典
I 利用判別K-SVD字典學習方法,得到第一層判別字典D; 3b)基于第一層判別字典D,利用正交匹配追蹤算法得到所有樣本的第一層稀疏編碼 特征
3c)根據所有樣本的第一層稀疏編碼特征,利用第一層判別特征學習方法,得到第一層 判別特征集
及第二層輸入特征集
3d)從訓練集對應的第二層輸入特征集中隨機選取K2個作為第二層判別字典的初始化 字典D' 2,結合對應的類標矩陣和判別矩陣,類似于第一層判別字典學習方法優(yōu)化判別字 典目標函數,得到第二層判別字典
3e)基于樣本集Y的第二層輸入特征集和第二層判別字典,利用正交匹配追蹤算法得 到每個樣本的第二層稀疏編碼特征
i= 1,2,…,N,對所有樣本的第 二層稀疏編碼特征利用最大池化算法,得到第二層判別特征集
(4) 合并第一層判別特征集|?和第二層判別特征集|,得到樣本集Y的分層判別特征集 F,
(5) 將訓練集和測試集對應的分層判別特征集輸入到支撐矢量機,得到測試集的分類 標簽向量,該類標簽向量即為該高光譜圖像的分類結果。
2. 根據權利要求1所述的一種基于分層稀疏判別特征學習的高光譜圖像分類方法,其 特征在于,所述步驟3a)中判別K-SVD字典學習方法的具體步驟為: 第1步,基于訓練集YtMin,判別K-SVD字典學習方法的目標函數如下:
其中,上述式子第一項為重構誤差項,第二項為判別稀疏編碼約束項,第三項為分類誤 差項,D表示第一層判別字典,包含Ki個字典原子,每個原子維數為d,W表示分類變換矩陣, A表示線性變換矩陣,X表示稀疏編碼系數矩陣,||*|表示12范數的平方和,a和P表示平 衡類標判別項和分類誤差項的正則參數,取值范圍是1?5, 表示理想狀況下的 判別稀疏編碼系數矩陣,若D中第k個字典原子與訓練樣本集YtMin中第i個樣本屬于同一 類時,則Qki值為1,不同類時為〇,HeE&B|表示訓練樣本的類標矩陣,若Ytrain中第i個樣 本屬于第c(c= 1,2,…,C)類,1^為1,否則為0,\表示稀疏編碼系數矩陣X的第i列向 量,II?II:表示h范數,e為定義的1(T6 ; 第2步,為了求解判別K-SVD字典學習方法的目標函數,改寫為:
其中,
,(0T表示矩陣的 轉置,對該目標函數利用K-SVD字典學習方法進行求解,從而得到第一層判別字典D。
3. 根據權利要求1所述的一種基于分層稀疏判別特征學習的高光譜圖像分類方法,其 特征在于,所述步驟3b)中正交匹配追蹤算法的具體步驟為: 第1步,基于第一層判別字典D,正交匹配追蹤算法的目標優(yōu)化函數如下:
其中,yi表示樣本集Y的第i個樣本,Zi表示yi的稀疏編碼系數,S為定義的1(T6 ; 第2步,構造殘差項,殘差項構造為r?=yi,i= 1,2…N,索引集A°SK維零向量, 初始化變量J= 1 ; 第3步,找出殘差與字典D中的第j列+內積最大所對應的下標入,即
第4步,更新索引集Aa),Aa)(J)=入;更新所選擇的字典原子列構成的集合口^ =D(:,人《(1:刀),用最小二乘法得到了階逼近的
,新殘差!^ = Yi-D^Zi,J=J+1 ; 第5步,判斷是否迭代結束:如果J彡K且仍有yi未作為殘差項,則返回第2步,否則, 若J<K且yi,i= 1,2…N都作為殘差項則程序結束,若J>K,則返回到第3步繼續(xù)執(zhí)行。
4. 根據權利要求1所述的一種基于分層稀疏判別特征學習的高光譜圖像分類方法,其 特征在于,所述步驟3c)中第一層判別特征學習方法的具體步驟為: 第1步,以每個樣本的稀疏編碼特征Zi,i= 1,2,…,N為中心,取鄰域窗口大小為 (2m+l)X(2m+l)內所有樣本的稀疏編碼特征構成稀疏編碼塊Zi,i= 1,2,…,N,Zi為 (2m+l)X(2m+l)XI的一個三維矩陣; 第2步,對每個樣本的稀疏編碼塊21進行分塊,利用(m+l)X(m+l)的滑動窗口,劃窗 步長為m,從上到下,從左到右遍歷Zy依次提取稀疏編碼表示子塊
和 Z,H),總共4個子塊,每個子塊的規(guī)模為(m+1)X(m+1)XI; 第3步,依次對得到的4個子塊進行空間金字塔最大池化算法
,j= 1,2, 3, 4 其中,SM(〇表示進行空間金字塔最大池化操作,
,j= 1,2,3,4,U代 表空間金字塔分解層數,Vu是位于空間金字塔第u層的所有塊的總數目,M( ?)表示最大池 化算法,
第4步,按矩陣行組合的方式
得到第i個樣本的第一層判別特征I;,按矩陣列組合的方式
得到第i個樣本的第二層輸入特征。
【文檔編號】G06K9/66GK104408478SQ201410647211
【公開日】2015年3月11日 申請日期:2014年11月14日 優(yōu)先權日:2014年11月14日
【發(fā)明者】張向榮, 焦李成, 梁云龍, 馬文萍, 侯彪, 劉若辰, 馬晶晶, 白靜 申請人:西安電子科技大學