一種基于半監(jiān)督字典學(xué)習(xí)的高光譜圖像分類方法
【專利摘要】本發(fā)明公開了一種基于半監(jiān)督字典學(xué)習(xí)的高光譜圖像分類方法,主要解決高光譜圖像高維和在相對(duì)小樣本情況下分類精度低的問題。其步驟包括:將高光譜圖像的像素點(diǎn)用光譜特征向量表示;選取標(biāo)記樣本集、無標(biāo)記樣本集和測(cè)試樣本集;構(gòu)造有標(biāo)記樣本的類標(biāo)矩陣;構(gòu)造無標(biāo)記樣本的拉普拉斯矩陣;使用交替優(yōu)化策略和梯度下降法求解半監(jiān)督字典學(xué)習(xí)模型;使用學(xué)習(xí)得到的字典編碼有標(biāo)記樣本、無標(biāo)記樣本和測(cè)試樣本;使用學(xué)習(xí)得到的稀疏編碼作為特征分類高光譜圖像。本發(fā)明采用半監(jiān)督思想,相比監(jiān)督學(xué)習(xí)方法能夠獲得較高的分類正確率,可用于精細(xì)農(nóng)業(yè),植被調(diào)查,軍事偵察等領(lǐng)域。
【專利說明】一種基于半監(jiān)督字典學(xué)習(xí)的高光譜圖像分類方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于圖像處理【技術(shù)領(lǐng)域】,涉及半監(jiān)督學(xué)習(xí)和稀疏表示方法,用于相對(duì)小樣 本情景下的高光譜圖像分類問題。
【背景技術(shù)】
[0002] 高光譜遙感技術(shù)產(chǎn)生于20世紀(jì)80年代,結(jié)合了成像技術(shù)和光譜技術(shù),可以在電磁 波的紫外到近紅外的幾十至幾百個(gè)很窄的連續(xù)波段上獲取感興趣地面物體的輻射特性,是 對(duì)地觀測(cè)的重要前沿技術(shù)。與傳統(tǒng)光譜成像技術(shù)相比,高光譜遙感不僅波段數(shù)和譜分辨率 更高,而且波段幾乎是連續(xù)的,可以為每個(gè)像元差生一條連續(xù)的光譜曲線,其獲取的圖像包 含了空間、輻射,和光譜三重信息,具有圖譜合一的特點(diǎn)。
[0003] 目前,許多國家研制了高光譜遙感系統(tǒng),比如美國國家宇航局(NASA)的AVIRIS、 EO-I HYPERION、加拿大的熒光線成像光譜儀FLI、德國的R0SIS-10、R0SIS-22、澳大利亞的 HyMap、加拿大ITRES公司的CASI、SASI、我國的0MIS、PHI。常用的高光譜圖像數(shù)據(jù)包括由 美國國家宇航局的AVIRIS獲取的Indian Pines數(shù)據(jù)集、Kennedy Space Center (KSC)數(shù) 據(jù)集,以及EO-I HYPERION光譜儀獲取的Botswana數(shù)據(jù)集等。高光譜遙感已經(jīng)廣泛應(yīng)用于 天氣預(yù)報(bào)、環(huán)境監(jiān)測(cè)、災(zāi)害評(píng)估、精細(xì)農(nóng)業(yè)、地質(zhì)調(diào)查、軍事偵察等許多領(lǐng)域。
[0004] 地物分類的任務(wù)是確定感興趣地面物體的所屬地物類別,它是高光譜遙感最重要 的應(yīng)用之一,是許多相關(guān)應(yīng)用的基礎(chǔ)。對(duì)于特定的波長,不同的物質(zhì)具有不同的電磁輻射特 性,高光譜能夠捕獲從可見光到近紅外光譜的連續(xù)光譜信息,因而提供了分類不同地物的 重要區(qū)分信息。高光譜遙感為分類提供豐富信息的同時(shí),也帶來了巨大的挑戰(zhàn):1)很高的 波段數(shù)(數(shù)十到數(shù)百);2)相對(duì)較少的標(biāo)記樣本(總樣本數(shù)大,而標(biāo)記樣本的代價(jià)高昂)。 在高維和相對(duì)小樣本條件下,分類器可以任意好地?cái)M合有限的訓(xùn)練數(shù)據(jù),而未必能有效地 預(yù)測(cè)測(cè)試數(shù)據(jù),也即面臨著過擬合的風(fēng)險(xiǎn)。對(duì)于理想的高光譜分類算法,應(yīng)該在高維和少量 標(biāo)記樣本的條件下仍能給出較高的分類精度。
[0005] 為了處理高光譜圖像分類的相對(duì)小樣本問題,已經(jīng)有許多方法被提出?;诤说?方法,如:支持向量機(jī)(SVM),對(duì)高維數(shù)據(jù)不太敏感,在高光譜圖像分類中表現(xiàn)出良好的性 能。半監(jiān)督的分類方法,如:基于圖的半監(jiān)督分類算法RLS,同時(shí)考慮在標(biāo)記樣本上的分類 誤差和無標(biāo)記樣本上的預(yù)測(cè)類標(biāo)的平滑性。稀疏表示也被成功用于高光譜圖像分類,如:稀 疏表示分類方法SRC。
[0006] 雖然SVM對(duì)于高維數(shù)據(jù)具有一定的魯棒性,但是研究表明,高維仍然對(duì)SVM的分類 性能產(chǎn)生較大影響;基于圖的半監(jiān)督方法,相比于有監(jiān)督算法可以提高分類性能,然而它是 直接處理高維的譜段特征,并不能有效的提高分類精度。本發(fā)明的半監(jiān)督字典學(xué)習(xí)方法,利 用高光譜數(shù)據(jù)的稀疏特性和半監(jiān)督學(xué)習(xí)策略,結(jié)合少量標(biāo)記樣本的判別信息和大量無標(biāo)記 樣本的結(jié)構(gòu)信息改進(jìn)高光譜圖像分類性能。
【發(fā)明內(nèi)容】
[0007] 本發(fā)明的目的在于同時(shí)利用少量的有標(biāo)記樣本以及大量的無標(biāo)記樣本,提出一種 基于半監(jiān)督字典學(xué)習(xí)的高光譜圖像分類方法,在有標(biāo)記樣本較少的情況下提高分類性能。
[0008] 為此,本發(fā)明提供了一種基于半監(jiān)督字典學(xué)習(xí)的高光譜圖像分類方法,其技術(shù)方 案如下:
[0009] -種基于半監(jiān)督字典學(xué)習(xí)的高光譜圖像分類方法,包括如下步驟:
[0010] (1)輸入一幅高光譜圖像I,包含C類地物共n個(gè)像素點(diǎn),每一個(gè)像素點(diǎn)為一個(gè)樣 本,每個(gè)樣本用光譜特征向量表示,樣本的特征維數(shù)為d ;
[0011] (2)從圖像I中選取h個(gè)有標(biāo)記樣本構(gòu)成標(biāo)記樣本集
【權(quán)利要求】
1. 一種基于半監(jiān)督字典學(xué)習(xí)的高光譜圖像分類方法,其特征在于:包括如下步驟: (1) 輸入一幅高光譜圖像I,包含C類地物共η個(gè)像素點(diǎn),每一個(gè)像素點(diǎn)為一個(gè)樣本,每 個(gè)樣本用光譜特征向量表示,樣本的特征維數(shù)為d ; (2) 從圖像I中選取Ii1個(gè)有標(biāo)記樣本構(gòu)成標(biāo)記樣本集
表示標(biāo)記樣本集的第i個(gè)樣本;標(biāo)記樣本集對(duì)應(yīng)的類標(biāo)集戈
其中,Jf是標(biāo)記樣本集中第i個(gè)樣本的類標(biāo);選取nu個(gè)無標(biāo)記樣本構(gòu)成無標(biāo)記樣本集
其中,^表示無標(biāo)記樣本集的第i個(gè)樣本;其余樣本構(gòu)成測(cè)試樣 本集
.其中,表示測(cè)試樣本集的第i個(gè)樣本,nt表示測(cè)試樣本個(gè)數(shù); Rd表示d維向量空間; (3) 構(gòu)造無標(biāo)記樣本的相似度矩陣S :
其中,Su表示矩陣S的第i行、第j列元素,
表示樣本jcf1的k近鄰集合,〇為 控制高斯核平滑度的參數(shù),e('>為指數(shù)函數(shù); (4) 計(jì)算無標(biāo)記樣本的拉普拉斯矩陣L : L = D-S 其中,D為對(duì)角矩陣,第i個(gè)對(duì)角線元素為
(5) 計(jì)算有標(biāo)記樣本的類標(biāo)矩陣H :
(6) 交替優(yōu)化關(guān)于分類器參數(shù)矩陣W和字典B的半監(jiān)督字典學(xué)習(xí)目標(biāo)函數(shù):
其中,B e Rd>^表示字典,每一列表示一個(gè)字典原子,1*表示字典原子的個(gè)數(shù);eW 表示標(biāo)記樣本集中第i個(gè)樣本的稀疏編碼向量,為標(biāo)記樣本集的稀疏編碼矩陣, 每一列對(duì)應(yīng)一個(gè)樣本的編碼向量;e Λ*"表不無標(biāo)記樣本集中第i個(gè)樣本的稀疏編碼向 量,ZfjGlron-為無標(biāo)記樣本集的稀疏編碼矩陣,每一列對(duì)應(yīng)一個(gè)樣本的編碼向量;E ;i e Rti 為類標(biāo)矩陣H的第i列列向量,表示標(biāo)記樣本集中第i個(gè)樣本的類標(biāo)向量;W e 是以稀 疏編碼為輸入的線性分類器參數(shù)矩陣;f( ·)表示損失函數(shù),Tr( ·)表示跡函數(shù),I I · I I1表 示向量的I1范數(shù),γ、μ、λ為正則項(xiàng)權(quán)重參數(shù); (7) 對(duì)測(cè)試樣本進(jìn)行稀疏編碼:
其中,ζ廣e,表示測(cè)試樣本集中第i個(gè)樣本的稀疏編碼向量,^ eW%為測(cè)試樣本集 的稀疏編碼矩陣,每一列對(duì)應(yīng)一個(gè)樣本的編碼向量; (8) 預(yù)測(cè)測(cè)試集樣本類標(biāo)Kr j+,/ = l,2,...,《;: J
其中,%是線性分類器參數(shù)矩陣W的第j列。
2.根據(jù)權(quán)利要求1所述的一種基于半監(jiān)督字典學(xué)習(xí)的高光譜圖像分類方法,其特征在 于:其中步驟(6)所述的交替優(yōu)化關(guān)于分類器參數(shù)W和字典B的半監(jiān)督字典學(xué)習(xí)目標(biāo)函數(shù), 按如下步驟實(shí)施: 6a)從標(biāo)記樣本集和無標(biāo)記樣本集中隨機(jī)選取樣本構(gòu)建初始字典B,采用隨機(jī)矩陣初 始化線性分類器參數(shù)矩陣W ; 6b)求解如下稀疏編碼問題,更新有標(biāo)記樣本和無標(biāo)記樣本的稀疏編碼矩陣:
6c)采用梯度法更新線性分類器參數(shù)矩陣W : ff = (ZL (Zl) τ+ λ 1+ μ ZuL (Zu) V1ZlHt 其中,I為單位矩陣; 6d)采用梯度下降法更新字典B :
其中,<>和#分別是稀疏編碼向量zf和f的非零元素構(gòu)成的向量,史1和紀(jì)"分別 是與#>和^>對(duì)應(yīng)選擇的原子構(gòu)成的子字典,Bu表示字典B的第i行第j列元素
-表 示目標(biāo)函數(shù)關(guān)于變量的導(dǎo)數(shù),〇 < ξ < 1是優(yōu)化步長因子; 6e)執(zhí)行步驟6b)-6d),直至滿足最大迭代次數(shù),然后停止。
【文檔編號(hào)】G06K9/66GK104392251SQ201410717651
【公開日】2015年3月4日 申請(qǐng)日期:2014年11月28日 優(yōu)先權(quán)日:2014年11月28日
【發(fā)明者】張向榮, 焦李成, 宋強(qiáng), 馬文萍, 侯小瑾, 侯彪, 馬晶晶, 白靜, 翁鵬 申請(qǐng)人:西安電子科技大學(xué)