本發(fā)明涉及一種并行智能化面向?qū)ο蠓诸惙椒?,屬于遙感影像分類方法領(lǐng)域。
背景技術(shù):
從處理單元上區(qū)分遙感影像分類算法,主要包括兩大類:基于像素的分類方法和基于對(duì)象的分類方法。地物的分類精度取決于混合像元數(shù)目與類別內(nèi)部光譜變異兩個(gè)因素:空間分辨率的提高,造成紋理均一的地物混合像元數(shù)減少,提高分類的精度;而對(duì)于光譜空間,其異質(zhì)性大的地物類別內(nèi)部的光譜響應(yīng)變異增大,從而導(dǎo)致類別可分性降低。高空間分辨率遙感是未來(lái)的發(fā)展趨勢(shì),其遙感影像信息豐富,含有多種信息特征,而基于像素的分類方法只能從單一光譜特征入手,已不能滿足分類的精度,同時(shí)產(chǎn)生的椒鹽效應(yīng)會(huì)降低分類效果。因此,針對(duì)高空間分辨率遙感影像的地物分類,不僅需要考慮遙感影像的光譜特征,還需綜合考慮其空間特征。
基于對(duì)象的分類處理單元不再是單個(gè)像元,而是由若干個(gè)像元組成的類內(nèi)同質(zhì)性最大且類間異質(zhì)性最大的“同質(zhì)”像元群,即目標(biāo)對(duì)象。以對(duì)象為處理單元,將遙感影像的光譜特征和空間特征作為對(duì)象屬性聯(lián)合參與分類算法,更加符合人類目視判讀的依據(jù),提高分類結(jié)果精度。影像對(duì)象的生成源于影像分割,面向?qū)ο蠓诸惖牡谝徊绞菍⒂跋穹指畛梢粋€(gè)個(gè)“同質(zhì)”對(duì)象,影像分割的優(yōu)劣直接影響分類結(jié)果的精度。常用于面向?qū)ο蠓诸愔械挠跋穹指罘椒ㄖ饕卸喑叨确指?、分水嶺分割、均值飄移分割、區(qū)域生成分割。這些分割算法雖然得到較好的實(shí)驗(yàn)結(jié)果,但在分割參數(shù)設(shè)置方面仍需要通過(guò)人工交互進(jìn)行大量試驗(yàn),效率低下,且依賴操作人員的專業(yè)水平,沒(méi)有統(tǒng)一合理的定量分割評(píng)價(jià)標(biāo)準(zhǔn),未能達(dá)到實(shí)用化階段。因此,需要一種高效的自我優(yōu)化的改進(jìn)算法,完成分割參數(shù)自動(dòng)化確定,同時(shí)結(jié)合并行處理技術(shù),提高面向?qū)ο蠓诸惣夹g(shù)的智能化和并行化程度。
技術(shù)實(shí)現(xiàn)要素:
針對(duì)現(xiàn)有面向?qū)ο蠓诸惙椒ù嬖诘姆诸惥冗^(guò)度依賴處理人員專業(yè)水平、質(zhì)量標(biāo)準(zhǔn)難以保障不統(tǒng)一及處理效率低的問(wèn)題,本發(fā)明提出了一種并行智能化面向?qū)ο蠓诸惙椒ǎ丛诓⑿协h(huán)境支持下,依據(jù)定量化分類精度評(píng)價(jià),自動(dòng)化確定最優(yōu)分割參數(shù)的智能化面向?qū)ο蠓椒ā?/p>
本發(fā)明的技術(shù)解決方案為:針對(duì)高分辨率遙感影像,首先設(shè)置空間域參數(shù)和顏色域參數(shù)對(duì)遙感影像執(zhí)行meanshift(均值漂移)分割,之后結(jié)合分類樣本數(shù)據(jù)對(duì)分割后的影像進(jìn)行svm(supportvectormachine支持向量機(jī))影像分類,最后利用驗(yàn)證樣本進(jìn)行定化量的分類精度評(píng)價(jià),計(jì)算混淆矩陣和評(píng)價(jià)參數(shù)kappa。并且以一定的步長(zhǎng)s逐步改變分割參數(shù),繼續(xù)執(zhí)行上述步驟,在得到一系列的評(píng)價(jià)參數(shù)中,通過(guò)統(tǒng)計(jì)分析得到最優(yōu)評(píng)價(jià)參數(shù)kappa值和其對(duì)應(yīng)的最優(yōu)分割參數(shù),繼而得到最優(yōu)的分類結(jié)果。這是一個(gè)以定量化分類精度為最高,決定最優(yōu)分類結(jié)果的思想流程,同時(shí)利用mpi(messagepassinginterface)并行運(yùn)算規(guī)則,將計(jì)算一系列的kappa值的過(guò)程分布式處理,縮短整體算法執(zhí)行時(shí)間,提高運(yùn)行效率。
一種并行智能化面向?qū)ο蠓诸惙椒?,具體包括以下步驟:
(1)讀入高分辨率遙感影像數(shù)據(jù);
(2)確定meanshift分割參數(shù)變化集qsr及分割影像集ims:包括,空間域帶寬參數(shù)hs和顏色域帶寬參數(shù)hr的變化集為qs和qr,以及變化步長(zhǎng)steps和stepr,利用高斯核函數(shù)
(3)確定分類類別數(shù)目,并讀入訓(xùn)練樣本sc,利用svm分類算法對(duì)步驟(2)中的分割結(jié)果進(jìn)行分類,得到分類影像集isvm;
(4)依據(jù)步驟(3)中的分類影像集isvm與驗(yàn)證樣本vc計(jì)算混淆矩陣,并計(jì)算kappa系數(shù),形成kappa系數(shù)集ksr;
(5)選擇數(shù)據(jù)處理并行模式,并設(shè)置使用線程數(shù)t;
(6)對(duì)kappa系數(shù)集ksr和空間域帶寬hs,顏色域帶寬hr進(jìn)行函數(shù)關(guān)系分析,計(jì)算出最大值kappamax對(duì)應(yīng)的hsk和hrk,以及對(duì)應(yīng)的分類結(jié)果。
其中,步驟(1)中所述的高分辨率遙影響感數(shù)據(jù)為三波段,并按紅、綠、藍(lán)波段順序組合的真彩色影像數(shù)據(jù);
其中,步驟(2)中的meanshift分割,主要依賴于二維核函數(shù)
式中knormal(x)為高斯函數(shù),xs是空間域中位置向量,xr是顏色域色度向量;hs,hr分別是空間域帶寬和顏色域帶寬,且hs∈qs,hr∈qr,qsr=qs∪qr,兩個(gè)帶寬參數(shù)hs,hr的變化決定meanshift分割結(jié)果,分割參數(shù)變化集qsr與分割影像集ims為一一對(duì)應(yīng),c是標(biāo)準(zhǔn)化常量,使得二維核函數(shù)表達(dá)式
其中,步驟(3)中所述的svm分類在步驟(2)的分割影像集ims的基礎(chǔ)上執(zhí)行,核心是確定最優(yōu)分類面函數(shù)svm(x)=sgn(ω·x+b),其中ω和b是決定分類面函數(shù)的兩個(gè)參數(shù)。主要流程分為以下幾步:
a.高維映射:將分割影像集ims中的一個(gè)影像imsi和訓(xùn)練樣本sc,通過(guò)徑向基函數(shù)(radialbasisfunction)進(jìn)行高維映射,其中徑向基函數(shù)rbf的數(shù)學(xué)表達(dá)如下:
式中s、t分別表示訓(xùn)練樣本特征向量,
b.對(duì)訓(xùn)練樣本進(jìn)行學(xué)習(xí)得到最優(yōu)分類面:通過(guò)訓(xùn)練樣本學(xué)習(xí)計(jì)算得到ω和b,從而確定了最優(yōu)分類面svm(x);
c.對(duì)分割影像imsi進(jìn)行分類提?。簩⑵涮卣飨蛄看胱顑?yōu)分類面方程svm(x),區(qū)分類別,得到分類影像isvmi;
d.對(duì)應(yīng)于分割影像集ims則有一一對(duì)應(yīng)的分類影像集isvm。
其中步驟(4)中kappa是評(píng)價(jià)分類結(jié)果是否可信的一種度量,計(jì)算基礎(chǔ)依賴于混淆矩陣,主要計(jì)算表達(dá)式為:
式中,k為混淆矩陣行數(shù),xii為遙感類別和地面參考類別為i的樣本點(diǎn)數(shù),xi+和x+i分別為混淆矩陣中第i行和第i列的和,n為總樣本個(gè)數(shù);在此基礎(chǔ)上,首先結(jié)合驗(yàn)證樣本vc和分類影像集isvm中每個(gè)分類影像isvmi生成對(duì)應(yīng)的混淆矩陣mconi,再次利用上述計(jì)算表達(dá)式,計(jì)算kappa值,最后得到kappa系數(shù)集ksr,可知ksr與isvm、ims、qsr一一對(duì)應(yīng);
其中,步驟(5)是并行處理策略,經(jīng)過(guò)以上四個(gè)步驟可知,從高分辨率影像數(shù)據(jù)至kappa系數(shù)集ksr是一套面向?qū)ο蠓诸惣熬榷吭u(píng)價(jià)的流程(如圖1),由于除了改變參數(shù)集qsr中分割參數(shù)之hs和hr外,上述子流程與子流程之間并沒(méi)有交集,條件滿足并行處理要求:每個(gè)子線程ti單獨(dú)運(yùn)行上述流程,得到kappa系數(shù)ki,最后再合并形成kappa系數(shù)集ksr,完成整個(gè)處理過(guò)程(如圖2)。設(shè)置使用線程數(shù)為t,串行總運(yùn)算量為m,則并行加速比為
其中,步驟(6)中kappa系數(shù)集ksr可以看作變量hs和hr的值集,即由式kappa=k(hs,hr)表示,由于函數(shù)解析式k(x)無(wú)法獲知,通過(guò)實(shí)驗(yàn)數(shù)據(jù),結(jié)合統(tǒng)計(jì)分析比對(duì),得到最大kappamax和其對(duì)應(yīng)的hsk和hrk,以及從影像分類集isvm對(duì)應(yīng)的最佳分類影像結(jié)果isvmax。
本發(fā)明與現(xiàn)有技術(shù)相比的優(yōu)點(diǎn)在于:克服傳統(tǒng)面向?qū)ο蠓诸愡^(guò)程中需要大量人工交互參數(shù)調(diào)整、處理效率低下等局限,本方法利用定量化分類評(píng)價(jià)系數(shù)kappa和mpi并行處理機(jī)制實(shí)現(xiàn)高效智能化面向?qū)ο蠓诸?。它具有以下?yōu)點(diǎn):(1)以最優(yōu)化定量評(píng)價(jià)參數(shù)為收斂準(zhǔn)則,自我反饋式確定最優(yōu)分類中參數(shù),從而脫離傳統(tǒng)面向?qū)ο蠓诸愔型ㄟ^(guò)人工交互式參數(shù)調(diào)整模式,減少操作人員的專業(yè)水平依賴;(2)分類結(jié)果以定量化精度評(píng)價(jià)最高為目標(biāo),具有統(tǒng)一的評(píng)價(jià)標(biāo)準(zhǔn);(3)在整個(gè)處理過(guò)程中融入mpi并行處理機(jī)制,完成并行高效的分布式處理,提高方法的整體效率。
附圖說(shuō)明
圖1為本發(fā)明中面向?qū)ο蠓诸惣熬榷吭u(píng)價(jià)算法流程圖。
圖2為并行化面向?qū)ο蠓诸惛倪M(jìn)算法流程。
圖3為分辨率為0.5米的都江堰航拍真彩色遙感數(shù)據(jù)。
圖4(a)為285組實(shí)驗(yàn)結(jié)果中kappa系數(shù)與分割參數(shù)hr的變化曲線。
圖4(b)為285組實(shí)驗(yàn)結(jié)果中kappa系數(shù)與分割參數(shù)hs變化曲線。
圖5(a)為經(jīng)統(tǒng)計(jì)分析后,kappa系數(shù)與分割參數(shù)hr的變化曲線。
圖5(b)為經(jīng)統(tǒng)計(jì)分析后,kappa系數(shù)與分割參數(shù)hs變化曲線。
圖6(a)為最佳分割二值圖。
圖6(b)為最佳影像分割圖,圖6(c)為最優(yōu)分類結(jié)果圖。
具體實(shí)施方式
為了更好的說(shuō)明本發(fā)明涉及的面向?qū)ο蠓诸惙椒?,利用分辨率?.5米的都江堰航拍遙感數(shù)據(jù)進(jìn)行汶川地震震害信息分類提取。本發(fā)明一種并行智能化面向?qū)ο蠓诸惙椒ǎ唧w實(shí)現(xiàn)步驟如下:
(1)讀入高分辨率遙感影像數(shù)據(jù):讀入汶川地震震后都江堰航空遙感數(shù)據(jù),空間分辨率為0.5米,波段順序?yàn)榧t、綠、藍(lán)的真彩色影像(如圖3)。
(2)根據(jù)meanshift遙感分割中核函數(shù)中參數(shù)的具體含義:
hs代表計(jì)算meanshift向量時(shí)空間域中窗口大小,而hr為顏色域中窗口大小。而經(jīng)過(guò)實(shí)驗(yàn)初步確定當(dāng)hr為90時(shí),實(shí)驗(yàn)區(qū)影像幾乎被分割為一個(gè)類別,所以hr下限從1開始,所以設(shè)置hr的值域qr設(shè)為[1,90],即rc=1,rf=90,當(dāng)hr=1時(shí)步長(zhǎng)stepr設(shè)置為4,取其它值時(shí)步長(zhǎng)stepr設(shè)置為5;而根據(jù)影像的分辨率為0.5米和影像中建筑物實(shí)際尺寸,則hs以建筑物尺寸對(duì)應(yīng)窗口大小或略小于該值為上限,即hs的值域qs設(shè)為[5,19],即sc=5,sf=19,變化步長(zhǎng)steps=1,這樣對(duì)原始數(shù)據(jù)執(zhí)行meanshift分割之后,生成影像分割集ims即有285組分割結(jié)果;
(3)確定分類類別數(shù)目,并選擇訓(xùn)練樣本,依據(jù)實(shí)地參考,確定分類類別數(shù)目c=6(分別為陰影、道路、植被、水體、完好建筑物和倒塌建筑物),訓(xùn)練樣本sc和測(cè)試樣本vc根據(jù)實(shí)地驗(yàn)證和人工目視相結(jié)合方式確定。對(duì)第(2)步生成的影像分割集ims逐一進(jìn)行svm分類,生成分類影像集isvm,其維度和影像分割集一樣,即有285組分類結(jié)果;
(4)對(duì)第(3)步結(jié)果分類影像集isvm加入驗(yàn)證樣本vc,利用混淆矩陣算法,并逐一計(jì)算kappa系數(shù)得到ki,經(jīng)過(guò)285次循環(huán)計(jì)算得到kappa系數(shù)集ksr;
(5)實(shí)驗(yàn)步驟(2)~(4)中存在互不相關(guān)且可獨(dú)立運(yùn)行的285次流程化運(yùn)算,并行實(shí)驗(yàn)使用分布式計(jì)算一共節(jié)點(diǎn)有15個(gè),每個(gè)節(jié)點(diǎn)有8個(gè)雙核cpu,所以為最大化利用計(jì)算能力,共開辟線程數(shù)t=15*8*2=240個(gè),并行運(yùn)行時(shí)間和加速比如下表1(實(shí)驗(yàn)串行運(yùn)算和并行運(yùn)算的運(yùn)行時(shí)間與加速比)列出:
表1
(6)結(jié)合285組實(shí)驗(yàn)結(jié)果得到的kappa系數(shù)集ksr,與對(duì)應(yīng)的分割參數(shù)hs和hr,進(jìn)行統(tǒng)計(jì)分析,找到最大kappa值對(duì)應(yīng)的最優(yōu)參數(shù),從而尋找最優(yōu)分類結(jié)果。首先從實(shí)驗(yàn)數(shù)據(jù)中分別取列出了hs分別為5、10、15、19和hr分別為5、20、60、90時(shí)的部分實(shí)驗(yàn)分類結(jié)果,同時(shí)圖中對(duì)應(yīng)的kappa值列表于下表2(實(shí)驗(yàn)區(qū)部分分類結(jié)果kappa值):
表2
此表反應(yīng)出hr的取值對(duì)分類精度有較大影響,當(dāng)hs較小(hs≤15)時(shí),kappa值隨hr增加而增大,隨著hr不斷增大,而過(guò)大的值(hr≥60)造成嚴(yán)重錯(cuò)分結(jié)果;當(dāng)hr較小(hr≤20)時(shí),kappa值對(duì)hs的變化不敏感;隨著hr的增大(hr≥60),kappa隨hs增大而增大,但總體分類精度相對(duì)較低。為得到精確結(jié)果,綜合實(shí)驗(yàn)得到的所有結(jié)果,求當(dāng)hs分別為5到19區(qū)間內(nèi)定值時(shí),得到kappa與hr的變化曲線(如圖4(a)所示);當(dāng)hr固定取1到90之間定值時(shí),kappa與hs的變化曲線(如圖4(b)所示)。從圖中可分析得知,kappa值隨變量hr和hs的變化得到的規(guī)律滿足上述結(jié)論。kappa值對(duì)hr變量敏感,隨著hr的增加呈現(xiàn)先增后漲規(guī)律并在hr=20時(shí)達(dá)到峰值,而當(dāng)hr≥50時(shí),kappa值的變化受到hs的影響,呈現(xiàn)較大的起伏性;kappa值隨著hs的變化無(wú)規(guī)律可循,當(dāng)hr≤60時(shí),hs的增加對(duì)kappa沒(méi)有影響,當(dāng)hr≥60時(shí),kappa值隨著hs的遞增變化起伏較大,沒(méi)有規(guī)律。
對(duì)圖4(a)中的kappa曲線求得平均kappa系數(shù)值隨著hr變化的曲線(圖5(a)),可以看到當(dāng)hr=20時(shí)平均kappa系數(shù)達(dá)到最高點(diǎn)(圖中虛線的交叉點(diǎn)),而由前面的定性分析可知kappa系數(shù)主要受hr的變化影響,所以hr=20是kappa最大的必要條件。圖5(b)顯示當(dāng)hr=20時(shí)kappa系數(shù)隨著變量hs的變化情況,可以得出kappa對(duì)hs變化不敏感。由于hs的增大會(huì)導(dǎo)致運(yùn)算時(shí)間的大量消耗,雖然對(duì)結(jié)果可以起到一定的平滑改善,但較大的hs是不可取的。為此取hs變化的中數(shù)(圖中虛線交叉點(diǎn))作為最優(yōu)kappa的另一條件。即根據(jù)實(shí)驗(yàn)區(qū)得到最優(yōu)分割參數(shù)組合為hs=12,hr=20。利用參數(shù)組合得到最佳分割結(jié)果和分類結(jié)果如圖6(a),圖6(b)和6(c)所示。
從利用本發(fā)明方法可以得出根據(jù)最優(yōu)分類評(píng)價(jià)參數(shù)kappa可自動(dòng)確定最優(yōu)分割參數(shù)組合為hs=12,hr=20,達(dá)到智能化確定參數(shù)目標(biāo),且在整個(gè)285組實(shí)驗(yàn)中得到最高kappa值為0.73。通過(guò)使用并行策略,改進(jìn)并行方法的加速比為16.47,時(shí)間由串行時(shí)的3.13個(gè)小時(shí)縮短至11分鐘左右,很大程度上提高了程序運(yùn)算的效率,完成并行化算法處理。