本發(fā)明屬于高光譜圖像無監(jiān)督
技術(shù)領(lǐng)域:
,,特別是一種基于置信度構(gòu)造類屬字典的高光譜無監(jiān)督分類方法。
背景技術(shù):
:高光譜圖像數(shù)據(jù)按照光譜區(qū)間內(nèi)的幾十甚至幾百個(gè)連續(xù)的窄波段的波長進(jìn)行分解,具有豐富的地物光譜特征信息,可廣泛應(yīng)用于地物精細(xì)分類、礦產(chǎn)調(diào)查等領(lǐng)域。如何利用高光譜的海量數(shù)據(jù)以及高維特點(diǎn),將高光譜圖像的各種特征相結(jié)合,研究快速、高效的目標(biāo)識(shí)別與分類算法一直是高光譜圖像處理研究的一個(gè)熱點(diǎn)。高光譜圖像無監(jiān)督分類方法,由于沒有人工標(biāo)記樣本,經(jīng)典方法往往分類精度較低。例如,常見的k均值分類和譜聚類方法在高光譜圖像無監(jiān)督分類應(yīng)用中,其總體分類精度很難達(dá)到70%以上。由于高光譜圖像在由原始訓(xùn)練樣本組成的字典表示下的稀疏特性,不同類的地物光譜特征位于不同的低維子空間,即某一光譜特征僅能被該類地物光譜特征組成的字典稀疏表示,從而利用稀疏表示模型來抽取稀疏表示特征,建立鑒別性子空間來實(shí)現(xiàn)分類。稀疏表示分類方法中,構(gòu)建具有鑒別性的稀疏子空間是其關(guān)鍵問題[m.yang,f.dehoog,y.fanandw.hu,"adaptivesamplingbydictionarylearningforhyperspectralimaging,"inieeejournalofselectedtopicsinappliedearthobservationsandremotesensing,vol.9,no.9,pp.4501-4509,sept.2016.]。通常,構(gòu)建稀疏表示的字典有兩種方法:(1)采取圖像光譜像元樣本直接構(gòu)造;(2)字典學(xué)習(xí)方法[練秋生,石保順,陳書貞.字典學(xué)習(xí)模型、算法及其應(yīng)用研究進(jìn)展[j].自動(dòng)化學(xué)報(bào),2015,(02):240-260.]。通過利用圖像原始數(shù)據(jù)樣本,用部分或者所有光譜像元來構(gòu)造稀疏表示的字典,該方法雖然構(gòu)造形式簡單且計(jì)算復(fù)雜度低,但是稀疏子空間的鑒別性不足,導(dǎo)致此方法構(gòu)建字典進(jìn)行稀疏表示的誤分類率比較高。字典學(xué)習(xí)的方法,通過樣本學(xué)習(xí)獲得表示字典能更好地與圖像本身結(jié)構(gòu)匹配,具有更稀疏的表示,但計(jì)算復(fù)雜度很高。技術(shù)實(shí)現(xiàn)要素:本發(fā)明的目的在于提供一種基于置信度構(gòu)造類屬字典的高光譜無監(jiān)督分類方法,利用基于置信度構(gòu)造的類屬字典對(duì)樣本進(jìn)行核化稀疏表示,進(jìn)而進(jìn)行二次分類。實(shí)現(xiàn)本發(fā)明目的的技術(shù)解決方案:一種基于置信度構(gòu)造類屬字典的高光譜無監(jiān)督分類方法,步驟如下:步驟s1:構(gòu)造高光譜圖像的二維光譜-像元矩陣,即對(duì)高光譜圖像按照逐像元光譜向量排列形成光譜-像元矩陣;步驟s2:行和列規(guī)范化處理,得到規(guī)范化光譜-像元矩陣;步驟s3:奇異值特征抽取與選擇,即對(duì)規(guī)范化后的光譜-像元矩陣進(jìn)行奇異值svd分解,選取左右奇異特征向量形成特征向量矩陣;步驟s4:粗分類,即利用k均值方法對(duì)特征向量矩陣進(jìn)行分類,得到各光譜像元的粗分類結(jié)果,即把z中每一行看作待分類的各樣本,對(duì)特征向量矩陣z粗分類,得到b+n個(gè)類別標(biāo)簽,前b個(gè)為二維光譜-像元行對(duì)應(yīng)的類別標(biāo)簽,后n個(gè)為列對(duì)應(yīng)的類別標(biāo)簽,即n個(gè)像元對(duì)應(yīng)的類別標(biāo)簽。此步粗分類得到類別集合c1,c2,...,cm為粗分類結(jié)果,其中m≥2為指定類別數(shù),b為高光譜圖像的波段數(shù),n為高光譜圖像的像元數(shù);步驟s5:基于置信度構(gòu)造類屬字典,即由粗分類的結(jié)果,對(duì)每類的光譜像元與其類別中心歐氏距離作為置信度評(píng)價(jià)準(zhǔn)則,通過置信度篩選進(jìn)一步劃分為低置信度光譜像元樣本和高置信度分類樣本,高置信度分類樣本構(gòu)成類屬字典;步驟s6:基于核化稀疏表示二次分類,即由類屬子字典對(duì)低置信度光譜像元樣本進(jìn)行核化稀疏表示,通過最小類別重建誤差確定低置信度光譜像元樣本的類別標(biāo)簽。本發(fā)明與現(xiàn)有技術(shù)相比,其顯著優(yōu)點(diǎn)為:(1)首先對(duì)高光譜圖像的二維光譜-像元矩陣的行和列規(guī)范化處理,奇異值特征抽取與特征選擇,對(duì)形成的特征矩陣進(jìn)行粗分類,獲得較高的粗分類結(jié)果。(2)根據(jù)粗分類的結(jié)果計(jì)算置信度,并從像元中挑選出高置信度分類樣本構(gòu)造類屬字典,本發(fā)明提出的字典構(gòu)造方法不僅大幅降低了直接利用光譜數(shù)據(jù)字典進(jìn)行稀疏表示的誤分類問題,提高了字典的子空間鑒別性,而且避免了字典學(xué)習(xí)造成的計(jì)算復(fù)雜度過高的問題。下面結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步詳細(xì)描述。附圖說明圖1是本發(fā)明基于置信度構(gòu)造類屬字典的高光譜圖像無監(jiān)督分類方法的流程圖。圖2是光譜-像元二維矩陣行和列的規(guī)范化處理示意圖。圖3為三維的salinas-a高光譜圖像,圖中有204個(gè)光譜段,圖像的空間大小為86×83。圖4是salinas-a數(shù)據(jù)集分類結(jié)果圖:(a)為salinas-a數(shù)據(jù)集基準(zhǔn)分類效果圖;(b)為salinas-a數(shù)據(jù)集采用k均值方法的分類效果圖;(c)為salinas-a數(shù)據(jù)集采用譜聚類(sc)的分類效果圖;(d)為salinas-a數(shù)據(jù)集采用本發(fā)明粗分類效果圖;(e)為salinas-a數(shù)據(jù)集采用本發(fā)明最終分類方法效果圖。具體實(shí)施方式結(jié)合圖1,本發(fā)明基于置信度構(gòu)造類屬字典的高光譜圖像無監(jiān)督分類方法,步驟如下:步驟s1:構(gòu)造高光譜圖像的二維光譜-像元矩陣,即對(duì)高光譜圖像按照逐像元光譜向量排列形成光譜-像元矩陣,方法如下:輸入一幅高光譜圖像x0∈rw×h×b,構(gòu)造此高光譜圖像的二維光譜-像元矩陣,即對(duì)高光譜圖像x0按照逐像元光譜向量排列形成光譜-像元二維矩陣x∈rb×n,且x=[x1,x2,…,xn],其中xi∈rb表示x中第i個(gè)像元i=1,2,...,n,且xi=[xi1,xi2,...,xib]t,其中xij∈r表示像元xi中第j維的光譜值j=1,2,...,b,其中n=w×h表示像元數(shù),“t”為矩陣的轉(zhuǎn)置符號(hào),w和h分別表示空間維的寬度和長度,b表示波段數(shù)。步驟s2:將矩陣x進(jìn)行行和列規(guī)范化處理,得到規(guī)范化光譜-像元矩陣,如圖2示意圖所示,步驟如下:第一步:各行信息求和構(gòu)造對(duì)角矩陣m1∈rb×b,即其中表示第1個(gè)光譜通道的圖像像素值之和,表示第b個(gè)光譜通道的圖像像素值之和,圖2中p表示第p個(gè)光譜通道,p=1,2,...,b。diag(·)表示矩陣中對(duì)角元素取括號(hào)內(nèi)值的對(duì)角矩陣。第二步:各列信息求和構(gòu)造對(duì)角矩陣m2∈rn×n,即其中表示第1個(gè)光譜向量的元素之和,表示第n個(gè)光譜向量的元素之和,圖2中q表示第q個(gè)光譜向量,q=1,2,...,n。第三步:行和列規(guī)范化,計(jì)算公式為:其中x表示構(gòu)造的二維光譜-像元矩陣,為x規(guī)范化結(jié)果矩陣。步驟s3:奇異值特征抽取與特征選擇,即對(duì)規(guī)范化后的光譜-像元矩陣進(jìn)行奇異值(svd)分解,選取左右奇異特征向量形成特征向量矩陣。步驟如下:第一步:對(duì)進(jìn)行奇異值分解,從第二個(gè)奇異值向量開始的前s個(gè)最大的奇異值對(duì)應(yīng)的左右奇異值向量u=[u2,u3,...,us+1]和v=[v2,v3,...,vs+1],形成降維后的特征向量空間。其中m為類別個(gè)數(shù),表示四舍五入取整運(yùn)算(本發(fā)明可以取值m=8)。第二步:歸一化,其計(jì)算公式為左右奇異值向量,組成特征向量矩陣步驟s4:粗分類:用k均值方法對(duì)特征向量矩陣z進(jìn)行分類,得到各光譜像元的粗分類結(jié)果。對(duì)矩陣z粗分類(把z中每一行看作待分類的各樣本),得到b+n個(gè)類別標(biāo)簽,前b個(gè)為二維光譜-像元行對(duì)應(yīng)的類別標(biāo)簽,后n個(gè)為列對(duì)應(yīng)的類別標(biāo)簽,即n個(gè)像元對(duì)應(yīng)的類別標(biāo)簽。此步粗分類得到類別集合c1,c2,...,cm粗分類結(jié)果,其中m≥2為指定類別數(shù),b為高光譜圖像的波段數(shù),n為高光譜圖像的像元數(shù)。步驟s5:基于置信度構(gòu)造類屬字典,即由粗分類的結(jié)果,對(duì)每類的光譜像元與其類別中心歐氏距離作為置信度評(píng)價(jià)準(zhǔn)則,通過置信度篩選進(jìn)一步劃分為低置信度光譜像元樣本和高置信度分類樣本,高置信度分類樣本構(gòu)成類屬字典,具體步驟如下:第一步:計(jì)算各類別均值向量:對(duì)類ck中所有像元樣本求均值向量且nk為類ck中像元個(gè)數(shù),k=1,2,...,m。第二步:每類中各像元與均值向量求歐氏距離:如第k類中像元與μk作光譜維上的歐氏距離運(yùn)算第三步:選取高置信度分類樣本作為字典:將類別ck中各像元與類別中心的歐式距離值作升序排列,選取前個(gè)最小距離值對(duì)應(yīng)的像元集合,作為類別ck的子字典,記為dk。依次對(duì)m個(gè)類別做上述操作,合并各類別子字典為字典d,即對(duì)粗分類結(jié)果的各像元類別標(biāo)簽,提取字典中各像元對(duì)應(yīng)的類別標(biāo)簽,剩余的像元(x/d)稱作低置信度分類樣本,進(jìn)行基于核化稀疏表示的二次分類。其中σ為控制參數(shù),σ≥2,符號(hào)“∪”表示集合并運(yùn)算,“/”表示集合減運(yùn)算(本發(fā)明中可以取值σ=7)。第四步:輸出高置信度樣本的分類結(jié)果,低置信度樣本進(jìn)行基于核化稀疏表示的二次分類。步驟s6:基于核化稀疏表示二次分類,即由類屬子字典對(duì)低置信度光譜像元樣本進(jìn)行核化稀疏表示,通過最小類別重建誤差確定低置信度光譜像元樣本的類別標(biāo)簽,即對(duì)低置信度像元樣本進(jìn)行核化稀疏表示二次分類的步驟如下:第一步:計(jì)算核稀疏表示系數(shù),對(duì)低置信度樣本集合x/d取出一個(gè)像元x,計(jì)算其稀疏表示系數(shù),其中表示2-范數(shù),||·||1表示1-范數(shù),φ(x)為核化后的光譜像元x,φ(d)=[φ(d1),φ(d2),...,φ(dr)]為核化后的字典,α為x的稀疏表示系數(shù),λ為正則化參數(shù),φ為核函數(shù)。用交替方向乘子法進(jìn)行求解,得到對(duì)應(yīng)該像元x的稀疏表示系數(shù)α(本發(fā)明中可以取值λ=10-4)。第二步:由最小類別重建誤差判別樣本x的類別標(biāo)簽,其準(zhǔn)則,其中函數(shù)δk(·)表示從α中挑選出對(duì)應(yīng)的第k類的元素,依次對(duì)m個(gè)類別求殘差,把像元x劃歸為最小殘差對(duì)應(yīng)的類別,其中m為類別數(shù),k為類別索引k∈{1,2,...,m},class(x)表示x的分類結(jié)果。第三步:在集合x/d中取出下一像元,繼續(xù)執(zhí)行第一步和第二步,當(dāng)集合x/d的所有像元取完,循環(huán)結(jié)束;第四步:輸出x/d中各像元的分類結(jié)果。本發(fā)明的效果可通過以下仿真實(shí)驗(yàn)進(jìn)一步說明:輸入一幅高光譜圖像x0∈rw×h×b,以圖3所示圖像寬度w=86,圖像高度h=83,圖像的波段數(shù)b=204的salinas-a數(shù)據(jù)集為實(shí)驗(yàn)用例,將其原始高光譜圖像x0∈r86×83×204按照逐像元光譜向量排列形成光譜-像元二維矩陣x∈r204×7138,其像元數(shù)n=7138,類別個(gè)數(shù)m=8。1、仿真條件salinas-a數(shù)據(jù)集是salinas圖像的子集,為aviris遙感收集的加利福尼亞salinas山谷數(shù)據(jù)。去除了20個(gè)水吸收波段(108-112,154-167,224),最終剩余總計(jì)204個(gè)光譜段,圖像的空間大小為86×83。軟件環(huán)境為win7下安裝的matlabr2014a,電腦機(jī)器配置為inter(r)xeoncpue5-2683,2ghz,64.0gbram。本發(fā)明采用的評(píng)價(jià)指標(biāo)是聚類精度的評(píng)價(jià)方法(acc,calculationmethodofclusteringaccuracy)。2、仿真內(nèi)容本發(fā)明采用真實(shí)高光譜數(shù)據(jù)集檢驗(yàn)算法的聚類性能。為測試本發(fā)明算法的性能,將粗分類即聯(lián)合聚類算法(coclustering)分類結(jié)果與傳統(tǒng)聚類算法對(duì)比。對(duì)比方法包括:k均值,譜聚類(sc);在粗分類結(jié)果基礎(chǔ)上,基于置信度構(gòu)造類屬字典,即選取高置信度分類樣本作為字典,剩余的低置信度分類樣本進(jìn)行基于核化稀疏表示的二次分類。3、仿真實(shí)驗(yàn)結(jié)果分析表1為高光譜數(shù)據(jù)salinas-a在不同聚類算法下的分類結(jié)果,是數(shù)據(jù)集salinas-a分別在k均值、譜聚類(sc)、粗分類、本發(fā)明分類方法四種方法的分類準(zhǔn)確率。圖4中的(b)、(c)、(d)、(e)分別為salinas-a數(shù)據(jù)集在k均值、譜聚類、粗分類、本發(fā)明最終分類結(jié)果四種算法下的聚類效果圖??梢钥闯鰣D4的(d)粗分類的聯(lián)合聚類算法要比圖的(b)傳統(tǒng)的k均值和圖4的(c)譜聚類算法的分類結(jié)果都要好;同時(shí),基于粗分類結(jié)果得到的類別標(biāo)簽進(jìn)行高置信度字典的構(gòu)造,對(duì)低置信度分類樣本進(jìn)行基于核化稀疏表示的二次分類,并把粗分類中的高置信度類別標(biāo)簽與基于核化稀疏表示的二次分類結(jié)果中的低置信度分類樣本類別標(biāo)簽合并,即最終各像元的類別標(biāo)簽,與基準(zhǔn)分類圖4的(a)對(duì)比,計(jì)算分類準(zhǔn)確率。本發(fā)明克服了直接利用全部光譜數(shù)據(jù)構(gòu)造字典所帶來的分類子空間刻畫精度不足和字典學(xué)習(xí)的計(jì)算復(fù)雜度過高的問題,提高了字典子空間鑒別性,降低了誤分類錯(cuò)誤率。表1datasetk均值譜聚類(sc)粗分類本發(fā)明最終分類結(jié)果salinas-a67.66±4.2069.29±0.0276.84±6.2779.79±6.30當(dāng)前第1頁12