專利名稱:基于圖的半監(jiān)督高光譜遙感圖像分類方法
技術領域:
本發(fā)明屬于圖像處理技術領域,涉及高光譜遙感圖像的分類,可用于對高光譜遙 感圖像進行預處理,具體是一種基于圖的半監(jiān)督高光譜遙感圖像分類方法。
背景技術:
高光譜遙感圖像具有較高的光譜分辨率,提供了關于地物類型的豐富的信息。遙 感圖像的分類是遙感圖像分析和應用的關鍵技術之一,如何面對高光譜的海量數(shù)據(jù)以及高 維特點,將高光譜圖像的各種特征相結合,研究快速、高效的目標識別與分類算法是目前和 未來一段時間內高光譜圖像處理研究的一個熱點。高光譜遙感之所以受到世界各國遙感科學家的普遍關注,其中一個重要原因就 是這一技術將確定物質或地物性質的光譜與揭示其空間和幾何關系的圖像革命性地結合 在一起,而許多物質的特征往往表現(xiàn)在一些狹窄的光譜范圍內,高光譜遙感實現(xiàn)了捕獲地 物的光譜特征同時又不失其整體形態(tài)及其與周圍地物的關系。高光譜技術產(chǎn)生的一組圖像 所提供的豐富信息可以顯著地提高分析的質量、細節(jié)性、可靠性以及可信度。高光譜遙感在很多領域中都有重要的應用。在民用方面的應用有地質調查,植被 遙感,農(nóng)業(yè)監(jiān)測(產(chǎn)量估計、作物分析),精農(nóng)業(yè)研究,大氣遙感(包括水蒸氣、云及氣溶膠探 測),水文學(涉及沿海地區(qū)和內陸水域環(huán)境、冰雪性質),災害環(huán)境遙感(生物量燃燒和棄 礦污染調查),土壤調查(評價、分類、侵蝕退化預測及監(jiān)測)及城市環(huán)境遙感(包括城市地 物和人工目標物的標識、城區(qū)制圖和城市環(huán)境監(jiān)測)等等。在這些應用中分類是一個非常 重要的技術。目前已有很多高光譜遙感圖像的分類方法,包括無監(jiān)督和監(jiān)督的學習方法以及半 監(jiān)督的分類方法。無監(jiān)督的方法包括K均值(k-means)聚類,譜聚類等,監(jiān)督學習方法包括 最近鄰(NN)方法,支持向量機(SVM)的方法以及神經(jīng)網(wǎng)絡的方法。現(xiàn)有的半監(jiān)督學習方法有生成模型方法,自訓練方法,協(xié)同訓練和多視圖學習,基 于圖的方法等。(1)基于生成模型的方法這類算法假設用模型ρ(X,y) =p(y)p(x|y)對 數(shù)據(jù)建模,其中P(x|y)是一個混和分布。這樣大量的無標識數(shù)據(jù)加上少量的各類的帶標 識數(shù)據(jù)就能用來求出該混合分布的各個參數(shù)。( 自訓練(Self-training)半監(jiān)督學習 該算法首先用標注數(shù)據(jù)訓練分類器,然后用訓練好的分類器為無標注數(shù)據(jù)進行分類或標 記,再選取其中置信度最高的若干個無標注數(shù)據(jù)放入到標注數(shù)據(jù)訓練集里,接著用新的訓 練集對前面的分類器再次訓練,并不斷重復此過程,直至達到某停止條件。( 協(xié)同訓練 (Co-training)和多視圖學習(Multiview learning)協(xié)同訓練學習方法指的是多個學習 機互相提供訓練,即互相學習。半監(jiān)督的互訓練思想體現(xiàn)為首先將特征集分成兩個盡可 能的相對平衡的特征集,再對每一個學習機采用已標識的樣本進行訓練,訓練完畢后采用 另一學習機為本學習機中的無標簽樣本集中具有較高置信的樣本進行標識,然后進行再訓 練,如此循環(huán)直至算法穩(wěn)定。以上三種方法較基于圖的半監(jiān)督方法相比泛化性較差。(4)基 于圖的半監(jiān)督學習目前大多數(shù)基于圖的半監(jiān)督學習算法都使用了圖拉普拉斯算子,并且通過圖來估計一個分類函數(shù)f。f通常需要滿足對已標識樣本的識別盡可能與目標標識一 致,對整個圖的標識盡可能光滑。這樣基于圖的半監(jiān)督學習方法就可以用正則框架來描述, 即對已標識樣本的損失函數(shù)加上光滑正則項?;趫D的方法是半監(jiān)督圖像分類技術中的重要組成部分,該類方法的基本內容 是構建一個圖用來表征所有像素之間的相似性;已標注像素點的類別信息可以在帶權圖 上傳遞,傳遞的結果可以為未標注圖像提供有效的分類信息。很多基于圖的半監(jiān)督學習方 法都是相似的,都是先建立優(yōu)化目標函數(shù)或代價函數(shù)(通常由損失函數(shù)和正則項構成),并 通過各種最優(yōu)化方法進行求解,使代價函數(shù)最小化。大部分基于圖的半監(jiān)督學習算法之間 不同的地方只是在于對損失函數(shù)和正則項的選擇不同。目前基于圖的半監(jiān)督學習算法主要 有基于高斯場(Gaussian Fields)和調和函數(shù)(Harmonic Function)的方法,局部和全局 —Ifcft (local andglobal consistency)(Manifold Regularization) 算法以及線性近鄰傳播算法(Linear neighborhood propagate,英文縮寫為LNP)等。基于圖的半監(jiān)督學習方法的核心的圖的構建,由于和所有像素點存在一一對應的 關系,圖節(jié)點的數(shù)目是顯而易見的,因此構建圖的關鍵是權值的選擇。目前常用的圖有ε 近鄰圖,k近鄰圖,全連接圖,稀疏圖,大多都是用高斯核函數(shù)計算權值。與很多基于圖的半 監(jiān)督學習方法不同,線性近鄰傳播方法使用k近鄰的稀疏圖,并且使用線性表示的方法求 圖中邊的權值,與已有傳統(tǒng)方法相比,性能有所提高。對于高光譜遙感圖像的分類,由于已標識的樣本點較少,使用傳統(tǒng)的監(jiān)督的學習 算法很難獲得較好的分類效果,無監(jiān)督的方法不使用標簽的信息,也很難得到較好的分類 結果。半監(jiān)督學習方法可以利用大量的未標記樣本的信息,提高分類的精確率,因此可以把 半監(jiān)督學習用于高光譜圖像分類,以提高分類的精度。然而由于大多數(shù)基于圖的半監(jiān)督學 習方法計算量和存儲量都很大,處理海量的高光譜數(shù)據(jù)會有困難,本發(fā)明提出使用半監(jiān)督 推導的方法處理海量高光譜數(shù)據(jù),解決計算量和存儲量的問題。
發(fā)明內容
本發(fā)明的目的在于克服上述已有技術的不足,提出一種分類準確度高,運算復雜 度低,數(shù)據(jù)處理量增加50倍的基于圖的半監(jiān)督高光譜遙感圖像分類方法。做好高光譜圖像 的預處理,為進一步處理打好基礎。本發(fā)明的實現(xiàn)在于本發(fā)明是一種基于圖的半監(jiān)督高光譜圖像分類方法,其特征 在于包括如下步驟(1)被分類的高光譜遙感圖像具有N個像素點,其中標記點為L個,所有的L個標 記點構成有標簽點的集合,輸入的高光譜遙感圖像每一個像素點就是一個樣本點,該點用 一個特征向量&表示,得到圖像特征集。(2)對具有N個像素點的高光譜遙感圖像,從無標簽的樣本中隨機采樣M個點 與已標記的L個點構成集合S,S = {χ,-};,, η = L+M,無標簽樣本點中剩余的點構成集合R, R = {x,}f= ;無標簽的樣本點,即除去L個有標簽的點剩余的即為無標簽點,總數(shù)為N-L個。(3)用類概率距離計算集合S 中的樣本點在集合S中的K個近鄰點,用類概率 距離計算集合R中的樣本點在集合S中的K個近鄰點,得到輸入圖像每個樣本點^ci的近 鄰點的集合N(Xi)。
(4)根據(jù)每個樣本點Xi在集合N(Xi)中的近鄰信息使用線性表示方法構建兩個稀 疏矩陣Wss和WSK。(5)使用標簽傳播的方法在稀疏圖Wss上傳遞已標注樣本點Xi的類別信息,得到集 合S上樣本點Xi的標簽預測函數(shù)F/。(6)計算集合R中樣本點Xi的標簽預測函數(shù)巧,可使用下式計算F; =Wsr* F* ο(7)根據(jù)集合S和集合R的標簽預測函數(shù)確定圖像中每一個樣本點Xi的類標,可 使用下式乃
權利要求
1.一種基于圖的半監(jiān)督高光譜遙感圖像分類方法,其特征在于包括如下步驟(1)被分類的高光譜遙感圖像具有N個像素點,其中標記點為L個,所有的L個標記點 構成有標簽點的集合,輸入的高光譜遙感圖像每一個像素點就是一個樣本點,該點用一個 特征向量&表示,得到圖像特征集;(2)對具有N個像素點的高光譜遙感圖像,從無標簽的樣本點中隨機采樣M個點與已標 記的L個點構成集合S,5 = ^,1,n = L+M,n為S集合中樣本點的個數(shù),無標簽樣本點中剩 余的點構成集合R,及= |x,〔;(3)用類概率距離計算集合S中的樣本點在集合S中的K個近鄰點,用類概率距離計算 集合R中的樣本點在集合S中的K個近鄰點,得到輸入圖像每個樣本點^ci的近鄰點的集合 N(Xi);(4)根據(jù)每個樣本點Xi在集合N(Xi)中的近鄰信息使用線性表示方法構建兩個稀疏矩 陣 Wss 和 Wsk;(5)使用標簽傳播的方法在稀疏矩陣Wss上傳遞已標注樣本點Xi的類別信息,得到集合 S上樣本點Xi的標簽預測函數(shù)巧';(6)計算集合R中樣本點Xi的標簽預測函數(shù)巧,可使用下式計算Fr — Wsr * Fs ;(7)根據(jù)標簽預測函數(shù)F/和確定樣本點Xi的類標,可使用下式計算
2.根據(jù)權利要求1所述的高光譜遙感圖像分類方法,其特征在于其中步驟(1)所述 的將輸入高光譜遙感圖像中的每一個像素點用一個特征向量Xi表示,是首先對輸入圖像進 行雜波去除處理,即去除空氣水分吸收及低信噪比等雜波波段,之后用每一個像素點的所 有波段的灰度值作為高光譜遙感圖像每一個像素點的特征向量Xi。
3.根據(jù)權利要求2所述的高光譜遙感圖像分類方法,其特征在于其中步驟C3)所述 的計算集合R中和集合S中的K個近鄰點,具體包括以下步驟3a)初始化概率向量ρ (Xi) = (Pl,i,...,ρ。,》1,其中P。,i表示樣本點xi屬于類別c(c =1,2,…,C)的概率,C表示圖像的類別數(shù);3b)對于一對不同的樣本點Xi和\,計算兩點屬于同一類的概率P(Xi,Xp,可使用下式 計算
4.根據(jù)權利要求3所述的高光譜遙感圖像分類方法,其特征在于其中步驟(4)根據(jù)每個樣本點Xi在集合N(Xi)中的近鄰信息使用線性表示方法構建兩個稀疏的矩陣Wss和Wsk,具體包括以下步驟4a)計算每個點由其近鄰點重構所得的重構系數(shù)Qij,可使用下式計算
5.根據(jù)權利要求1或4所述的高光譜遙感圖像分類方法,其特征在于其中步驟(5)使 用標簽傳播的方法在稀疏圖Wss上傳遞已標注樣本點的類別信息,得到預測標記函數(shù)F/,具 體包括以下步驟5a)構建一個nXC類標矩陣Y,如果樣本點Xi標記為第c(c彡C)類,Yij= 1,否則Yij =O ;5b)計算集合S中樣本點Xi的預測標記函數(shù)Fs',使用下式計算
全文摘要
本發(fā)明是一種基于圖的半監(jiān)督高光譜遙感圖像分類方法,實現(xiàn)步驟涉及提取輸入圖像特征;從無標簽的樣本中隨機采樣M個點與已標記的L個點構建成集合S,剩余的點構成集合R;使用類概率距離計算集合S和R中的點在集合S中的K個近鄰點;使用線性表示方法構建兩個稀疏矩陣WSS和WSR;使用標簽傳播得到預測標記函數(shù)計算集合R中樣本點的標簽預測函數(shù)確定輸入圖像所有像素點的類標。本發(fā)明使用類概率距離計算樣本點的近鄰點,使用半監(jiān)督推導實現(xiàn)對高光譜圖像的準確分類,大大減小了計算復雜度。解決了基于圖的半監(jiān)督學習算法不能用于大規(guī)模數(shù)據(jù)處理的問題,使用本發(fā)明在單位時間內計算效率至少提高了20-50倍,分類結果圖的視覺效果較好。
文檔編號G06K9/62GK102096825SQ20111007159
公開日2011年6月15日 申請日期2011年3月23日 優(yōu)先權日2011年3月23日
發(fā)明者侯彪, 劉若辰, 張向榮, 李陽陽, 楊淑媛, 焦李成, 馬文萍, 魏征麗 申請人:西安電子科技大學