基于局部光譜角度量流形近鄰的高光譜遙感影像分類方法
【專利摘要】本發(fā)明公開了一種基于局部光譜角度量流形近鄰的高光譜遙感影像分類方法,先采用傳統(tǒng)歐氏距離得到大范圍近鄰,再由光譜角得到準確近鄰,通過近鄰進行局部重構,并使重構誤差最小,在低維空間中保持局部重構方式不變,最小化重構誤差,進而提取出高維數(shù)據(jù)中的內在鑒別特征。分類時,先由歐氏距離得到新樣本的近鄰,再計算新樣本與近鄰間的光譜角,把新樣本歸為光譜角最小的類。本發(fā)明能夠更有效地提取出鑒別特征,且分類結果更準確,對高光譜遙感影像的地物分類效果更好。
【專利說明】基于局部光譜角度量流形近鄰的高光譜遙感影像分類方法
【技術領域】
[0001]本發(fā)明涉及高光譜遙感影像特征提取和分類方法的改進,具體涉及一種基于局部光譜角度量流形近鄰的高光譜遙感影像分類方法,屬于高光譜遙感影像特征提取和分類【技術領域】。
【背景技術】
[0002]科學研究者們于20世紀80年代初在多光譜遙感的基礎上提出了高光譜遙感。高光譜遙感影像的光譜分辨率高達ιο_2λ數(shù)量級(屬于納米級),波段范圍從可見光到短波紅外,光譜波段數(shù)多達數(shù)十個甚至數(shù)百個以上,高光譜分辨率高的特點使高光譜圖像數(shù)據(jù)相鄰波段間的間隔較窄,存在波段重疊區(qū)域,光譜通道不再離散而呈現(xiàn)出連續(xù),因此高光譜遙感通常又被稱為成像光譜遙感。高光譜遙感不僅可以解決地物大類的識別問題,而且可以進行類內細分或精細光譜特征提取。高光譜遙感影像分類首先需要對待測數(shù)據(jù)進行特征提取,進行維數(shù)約簡,然后再對提取出來的特征進行分類。
[0003]一、特征提取方法介紹
[0004]高光譜遙感影像是由成像光譜儀獲取的,含有豐富的信息,給地物研究帶來了新的機遇。但由于高光譜遙感影像數(shù)據(jù)量大、數(shù)據(jù)間相關性強、冗余度大、維數(shù)高、信息隱含,傳統(tǒng)分類方法很易導致Hughes現(xiàn)象,即“維數(shù)災難”。因此,如何從高維數(shù)據(jù)中有效地提取出隱含特征,降低數(shù)據(jù)維數(shù)成為高光譜遙感影像在數(shù)據(jù)處理方面研究的重點。
[0005]1、傳統(tǒng)特征提取方法
[0006]在傳統(tǒng)的特征提取方法研究中,學者們提出了幾種經典的方法,主要有:主成分分析(Principal Component Analysis, PCA)、線性鑒別分析(Linear DiscriminantAnalysis, LDA)、多維尺度分析(Multidimensional Scaling, MDS)、最小噪聲分離變換(Minimum Noise Fraction, MNF)、獨立成分分析(Independent Component Analysis, ICA)等,這些方法都是以數(shù)據(jù)屬于全局線性結構為前提,在某一優(yōu)化準則條件下,尋找數(shù)據(jù)最接近的線性模型,它們都為線性維數(shù)約簡方法。這些方法物理模型明確、容易解釋、過程簡單并且拓展性好等優(yōu)點,使用范圍廣,在數(shù)據(jù)特征提取的研究中占了主導地位。但高光譜遙感數(shù)據(jù)的結構十分復雜,并不是線性分布的,使用傳統(tǒng)維數(shù)約簡方法并不能取得較好的效果。
[0007]2、流形學習方法
[0008]流形學習主要思想是通過對樣本數(shù)據(jù)進行學習,從樣本數(shù)據(jù)的幾何結構中發(fā)現(xiàn)隱含信息,找出各數(shù)據(jù)的本質特征,得到高維數(shù)據(jù)中隱含的低維嵌入特征或數(shù)據(jù)映射關系,實現(xiàn)數(shù)據(jù)從高維空間到低維空間的維數(shù)約簡或數(shù)據(jù)的二維三維可視化顯示。高光譜遙感數(shù)據(jù)是非線性分布,通過流形學習方法可以很好地揭示出隱含的低維流形結構,有效地提取出各數(shù)據(jù)的鑒別特征,得到更好的結果。主要的流形學習方法有局部線性嵌入算法(LLE)、等距離映射算法(ISOMAP)、拉普拉斯特征映射算法(LE)、鄰域保持嵌入算法(NPE)和局部保持投影算法(LPP)。
[0009]2.1) LLE算法的主要思想是非線性結構數(shù)據(jù)在局部范圍呈現(xiàn)出線性結構,保持這種局部的線性結構關系,從高維數(shù)據(jù)中揭示出低維流形結構,進而提取出各數(shù)據(jù)的流形特征,實現(xiàn)維數(shù)約簡。其主要方法是在高維空間中各數(shù)據(jù)點用k個近鄰點線性表示,維數(shù)簡約后保持與每個對應近鄰點的權值不變,重構維數(shù)簡約后對應的數(shù)據(jù)點,使重構誤差最小,能夠有效地提取出非線性結構數(shù)據(jù)的流形特征。LLE算法通過對數(shù)據(jù)的局部重構,在低維空間中保持局部重構關系不變,提取出數(shù)據(jù)中隱含的低維流形特征,揭示出數(shù)據(jù)中的非線性結構關系,對高光譜遙感數(shù)據(jù)能夠有效地展示出數(shù)據(jù)的內在幾何結構。但LLE算法的近鄰選取,對結果影響較大。
[0010]2.2)IS0MAP通過測地距離來近似數(shù)據(jù)間的幾何結構關系,從高維空間投影到低維空間中,保持各數(shù)據(jù)點間的測地距離不變,即在高維空間中幾何位置相距較遠的點投影后也相距較遠,幾何位置相距較近的點投影后也相距較近。ISOMAP算法提出了測地距離的概念,在高維空間中測地距離更能夠真實反映數(shù)據(jù)點間的幾何結構關系,能更好地提取出非線性數(shù)據(jù)中內在低維流形,實現(xiàn)較好的維數(shù)約簡。但該算法的計算復雜度比較大,并且需要選取近鄰,對結果影響較大。
[0011]2.3)LE算法的基本思想是在高維空間中相距較遠的數(shù)據(jù)點,維數(shù)約簡后在低維嵌入空間中仍相距較遠;較近的數(shù)據(jù)點,維數(shù)約簡后仍相距較近;目的是使數(shù)據(jù)點間的局部幾何結構在低維空間得到保持,并能最佳的表達出來。LE算法運用了譜圖理論,通過對各數(shù)據(jù)間設置不同的權值,使數(shù)據(jù)間的局部鄰域信息在低維空間中能夠較好地體現(xiàn)出來。LE算法保證了幾何結構為近鄰的數(shù)據(jù)點從高維空間投影到低維空間中近鄰位置關系不變,能夠有效地提取出數(shù)據(jù)的流形特征。但對于幾何位置較遠的數(shù)據(jù)點,投影到低維空間后仍相距較遠,易產生空洞現(xiàn)象。
[0012]2.4)NPE算法從本質上看是LLE算法的線性逼近,數(shù)據(jù)集在降到低維空間后,保持數(shù)據(jù)固有的局部鄰域流形不變,得到從高維空間到低維空間的投影矩陣;遇到新樣本時,可通過投影矩陣直接得到低維嵌入數(shù)據(jù)。NPE算法保持數(shù)據(jù)的局部鄰域結構不變,提取出高維數(shù)據(jù)中的低維流形結構,且能夠更有效地處理新樣本,實現(xiàn)維數(shù)約簡。但其同樣受近鄰選取的影響較大,并且為線性維數(shù)約簡方法,對非線性結構的數(shù)據(jù)效果不是很好。
[0013]2.5)LPP算法的主要思想是在低維空間中保持原有數(shù)據(jù)在高維空間中的近鄰關系不變,其實質是對LE算法進行線性化。LPP算法具有明確的投影矩陣,能夠直接把新樣本投影到低維空間中。LPP算法能夠很好地處理新樣本問題,并能較好地保持數(shù)據(jù)的局部幾何結構,實現(xiàn)數(shù)據(jù)降維。但LPP只考慮了數(shù)據(jù)的局部關系,受近鄰選取影響較大,并受噪聲影響大。
[0014]二、高光譜遙感數(shù)據(jù)的分類方法
[0015]在高光譜遙感影像中不同地物的差異通過像元的光譜信息及幾何空間信息進行表達,同時,不同的地物類型具有不同的光譜信息和幾何空間特性。高光譜遙感影像分類就是以影像像元的光譜和空間特征為基礎,對每個像元或比較均質的像元組中所代表的不同類別地物進行類別屬性的確定和標注。通過對高光譜遙感影像中各地物的光譜信息和幾何空間信息進行分析,獲得可分性最大的特征,選擇適當?shù)姆诸愊到y(tǒng),將各個像元劃分為對應的類別屬性中。傳統(tǒng)的分類方法主要有如下幾種。
[0016]1、k最近鄰分類(k_NN)
[0017]k最近鄰算法(k-Nearest Neighbor, k_NN)是一種比較經典的分類方法,該方法由k個已知近鄰來判斷未知數(shù)據(jù)點的類別信息,其理論已經非常成熟,在模式分類中得到了廣泛應用。k-NN算法不需要對樣本進行訓練,受噪聲影響較小,但k值對算法的結果影響較大,其值的選擇需要反復地進行調整,在維數(shù)較高時,計算時間較長。
[0018]2、光譜角制圖分類(SAM)
[0019]光譜角制圖(Spectral Angle Mapping, SAM)是對地物光譜波形相似性的一種度量,它把每條光譜都視為波譜空間的一個矢量,通過計算未知光譜與已知光譜間夾角來確定光譜間的相似程度,進而確定未知光譜曲線的類別信息。由于光譜曲線間的夾角越小表示兩光譜曲線越相似,屬于同類光譜的可能性越大,從而可以通過計算光譜曲線間的夾角來確定未知光譜曲線所屬類別。
[0020]SAM是一個基于統(tǒng)計特征的算法,與光譜矢量的模無關,具有較好的抗干擾能力,受光照變化影響小,并且受“同物異譜”現(xiàn)象的影響小,現(xiàn)已在光譜數(shù)據(jù)分類中得到廣泛的應用,具有較好的分類效果。但是SAM算法在兩種光譜曲線相似程度很大時,對光譜曲線區(qū)分度較難,不能取得較好的分類效果。
[0021]3、支持向量機分類(SVM)
[0022]支持向量機(Support Vector Machines, SVM)是以統(tǒng)計學中的VC維理論和結構風險最小原理為理論基礎,根據(jù)有限的樣本信息在模型的復雜度(即特定訓練樣本的學習精度)和學習能力(即正確識別任意樣本的能力)之間尋求最佳折衷,以獲得最好的推廣能力。SVM算法是以統(tǒng)計學為基礎尋求數(shù)據(jù)間的最優(yōu)分類面,通過把非線性數(shù)據(jù)映射到核函數(shù)空間,使其線性化,進而簡化了計算復雜度,具有較好的分類效果;但是如何選擇子空間和建立合適模型成為SVM運用的難點。
[0023]通過上述現(xiàn)有技術介紹可以看出,目前的特征提取方法和分類方法都存在各自不足,特征提取方法不能有效地提取出鑒別特征,幾種分類方法要么影響因素多,要么存在某些局限性,兩者都會導致分類結果準確性受到影響。
【發(fā)明內容】
[0024]針對現(xiàn)有技術存在的上述不足,本發(fā)明的目的是提供一種能夠更有效地提取出鑒別特征,且分類結果更準確,對高光譜遙感影像的地物分類效果更好的基于局部光譜角度量流形近鄰的高光譜遙感影像分類方法。
[0025]為了實現(xiàn)上述目的,本發(fā)明采用的技術方案如下:
[0026]基于局部光譜角度量流形近鄰的高光譜遙感影像分類方法,其特征在于:其步驟為,
[0027]I)從數(shù)據(jù)集中隨機選取一定數(shù)量的樣本作為訓練樣本,其類別信息已知,再隨機選取一定數(shù)量的樣本作為測試樣本;
[0028]2)采用歐氏距離判別大范圍近鄰,選取與各訓練樣本點歐氏距離最小的m個訓練樣本點作為大范圍近鄰Ntj ;
[0029]3)在大范圍近鄰K中,利用式⑴計算各訓練樣本點與其余訓練樣本點的光譜角,得到光譜角最小的k個訓練樣本點作為準確近鄰Na,其中k < m ;
【權利要求】
1.基于局部光譜角度量流形近鄰的高光譜遙感影像分類方法,其特征在于:其步驟為, 1)從數(shù)據(jù)集中隨機選取一定數(shù)量的樣本作為訓練樣本,其類別信息已知,再隨機選取一定數(shù)量的樣本作為測試樣本; 2)采用歐氏距離判別大范圍近鄰,選取與各訓練樣本點歐氏距離最小的m個訓練樣本點作為大范圍近鄰Ntj ; 3)在大范圍近鄰K中,利用式(1)計算各訓練樣本點與其余訓練樣本點的光譜角,得到光譜角最小的k個訓練樣本點作為準確近鄰Na,其中k < m ;
2.根據(jù)權利要求1所述的基于局部光譜角度量流形近鄰的高光譜遙感影像分類方法,其特征在于:所述第7)步的分類器按如下方法進行分類,先由歐氏距離得到維數(shù)約簡后的數(shù)據(jù)點yi的m個近鄰No;再分別計算Ji與近鄰No內各數(shù)據(jù)點的光譜角,最后把與Ji光譜角最小的數(shù)據(jù)點作為yi的類別;其過程如下:①由歐氏距離得到測試樣本維數(shù)約簡后的數(shù)據(jù)點yi在所有訓練樣本維數(shù)約簡后的數(shù)據(jù)中的m個近鄰No,如式⑷所示:
【文檔編號】G06K9/66GK103729651SQ201410023922
【公開日】2014年4月16日 申請日期:2014年1月17日 優(yōu)先權日:2014年1月17日
【發(fā)明者】劉嘉敏, 羅甫林, 黃鴻, 李連澤, 劉軍委 申請人:重慶大學