一種遙感影像信息提取與解譯方法及其模塊的制作方法
【專利摘要】本發(fā)明公開了一種遙感影像信息提取與解譯方法及其模塊,提出了一種基于SRMMHR和隨機(jī)森林的地理要素面向?qū)ο笞詣?dòng)解譯方法,該模塊采用這種方法進(jìn)行遙感影像的信息提取與解譯。本發(fā)明能夠?qū)崿F(xiàn)遙感影像的有效分割、特征的自動(dòng)優(yōu)選、分類規(guī)則集的自動(dòng)構(gòu)建,為遙感影像信息提取與解譯提供了一種人工干預(yù)少、自動(dòng)化程度高、解譯精度高的手段。
【專利說(shuō)明】一種遙感影像信息提取與解譯方法及其模塊
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及遙感影像信息提取與解譯,特別是指一種面向?qū)ο蠓诸惙椒ā?br>
【背景技術(shù)】
[0002]遙感影像信息提取與解譯是對(duì)遙感影像上的各種特征進(jìn)行綜合分析、比較、推理和判斷,最后提取出各種地物目標(biāo)信息的過(guò)程,依據(jù)解譯方法分為目視解譯、人機(jī)交互解譯、基于知識(shí)的遙感影像解譯、影像智能解譯(即自動(dòng)解譯)等。遙感解譯經(jīng)歷了從人工解譯到半自動(dòng)解譯,正在向自動(dòng)化、智能化方向發(fā)展。
[0003]隨著遙感影像空間分辨率的提高,面向?qū)ο蠓治黾夹g(shù)(geographic object basedimage analysis, GEOBIA)成為遙感影像解譯的主流方向,其最突出的特點(diǎn)是處理的最小單元不再是單個(gè)像素,而是由影像分割得到的同質(zhì)影像對(duì)象。該技術(shù)充分利用了遙感影像的光譜、幾何、紋理、拓?fù)洹⒄Z(yǔ)義等特征,克服了傳統(tǒng)的基于像元影像分析(pixel based imageanalysis, PBIA)技術(shù)的種種缺陷,促成了遙感與地理信息科學(xué)的集成及多源信息的融合,在全球氣候監(jiān)測(cè)、農(nóng)業(yè)發(fā)展、自然資源管理、國(guó)防安全等領(lǐng)域得到了廣泛應(yīng)用。
[0004]面向?qū)ο蠓治黾夹g(shù)與傳統(tǒng)的基于像元處理方法不同,首先,通過(guò)一定的分割方法對(duì)遙感影像進(jìn)行分割,在提取分割單元(圖像分割后所得到的內(nèi)部屬性相對(duì)一致或均質(zhì)程度較高的圖像區(qū)域,在土地利用應(yīng)用領(lǐng)域這種分割單元類似于土地利用斑塊)的各種特征后,在特征空間中利用模式識(shí)別方法對(duì)分割單元進(jìn)行識(shí)別和標(biāo)識(shí),從而最終完成信息的分類與提取。面向?qū)ο蠓治黾夹g(shù)體現(xiàn)出信息利用程度高、抗干擾性強(qiáng)、數(shù)據(jù)集成度高、分類精度高、后處理人工編輯量少等優(yōu)勢(shì),其核心是影像分割及面向?qū)ο蠓诸惸P偷臉?gòu)建。
[0005]目前,影像分割有上千種分割方法,主要分為:閾值分割法、邊緣檢測(cè)分割法、區(qū)域特征分割法、特征空間聚類分割法、統(tǒng)計(jì)模式識(shí)別方法、基于小波分析的方法等。但這些方法并不都適合于高分辨率影像,其中分水嶺、均值漂移、分形網(wǎng)絡(luò)演化算法在遙感影像分割中應(yīng)用較多,鑒于高分辨率影像具有空間分辨率高、單景數(shù)據(jù)量大、幾何特征顯著、紋理信息明顯等特點(diǎn),統(tǒng)計(jì)區(qū)域增長(zhǎng)算法(statistical region merging, SRM)能夠有效保持影像的邊界信息,克服分割影像的細(xì)碎現(xiàn)象,保證分割影像的整體一致性,可以直接應(yīng)用于噪聲嚴(yán)重的影像。異質(zhì)性最小規(guī)則(minimum heterogeneity rule, MHR)不僅考慮了光譜異質(zhì)性,而且考慮了形狀異質(zhì)性,能夠減少噪聲,得到規(guī)則對(duì)象。本發(fā)明綜合統(tǒng)計(jì)區(qū)域增長(zhǎng)及分形網(wǎng)絡(luò)演化方法的優(yōu)勢(shì),提出基于統(tǒng)計(jì)區(qū)域增長(zhǎng)與異質(zhì)性最小規(guī)則相結(jié)合(StatisticalRegion Merging and Minimum Heterogeneity Rule:SRMMHR)的影像分割方法,實(shí)現(xiàn)遙感影像的有效分割。
[0006]規(guī)則集是面向?qū)ο蠓诸惸P偷囊环N透明專家知識(shí)解決方案,具有結(jié)構(gòu)清晰、易于理解、能夠有效組織和推理、先驗(yàn)性、可復(fù)用等優(yōu)勢(shì),商用的面向?qū)ο蠓治鲕浖鏴Cognition提供了定制規(guī)則集的功能,提供了上百種對(duì)象特征,但重要特征的選擇仍然是具有挑戰(zhàn)和費(fèi)時(shí)的工作。目前,面向?qū)ο蠓诸愐?guī)則集主要存在兩大缺陷,一是很難確定哪些特征是非常重要的;二是不同的數(shù)據(jù)類型及不同的場(chǎng)景條件限制了分類規(guī)則集的應(yīng)用。[0007]模式識(shí)別方法,如決策樹、隨機(jī)森林等具有自動(dòng)進(jìn)行特征優(yōu)選、自動(dòng)構(gòu)建模型的 優(yōu)勢(shì)。隨機(jī)森林(random forest, RF)是一種集成機(jī)器學(xué)習(xí)方法,它利用隨機(jī)重采樣技術(shù) bootstrap和節(jié)點(diǎn)隨機(jī)分裂技術(shù)構(gòu)建多棵決策樹,通過(guò)投票得到最終分類結(jié)果。RF是由數(shù) 據(jù)驅(qū)動(dòng)的非參數(shù)分類方法,只需通過(guò)對(duì)給定樣本進(jìn)行學(xué)習(xí)訓(xùn)練形成分類規(guī)則,無(wú)需分類的 先驗(yàn)知識(shí),具有分析復(fù)雜相互作用分類特征的能力,對(duì)于噪聲數(shù)據(jù)和存在缺失值的數(shù)據(jù)具 有很好的魯棒性,可以估計(jì)特征的重要性,具有較快的學(xué)習(xí)速度。[0008]近年來(lái)RF已經(jīng)應(yīng)用到遙感影像分類中,如,V.F.Rodriguez-Galiano和B.Ghimire 等2012年通過(guò)地表覆蓋分類實(shí)驗(yàn)驗(yàn)證了隨機(jī)森林算法的優(yōu)勢(shì),Guo Li和Chehata Nesrine 等2011年將隨機(jī)森林用于多源數(shù)據(jù)城市分類中,驗(yàn)證了隨機(jī)森林方法以及多源數(shù)據(jù)用于 分類的優(yōu)勢(shì),Andre Stumpf和Norman Kerle于2011年將隨機(jī)森林用于面向?qū)ο蟮幕?制圖中,提出了監(jiān)督學(xué)習(xí)的制圖流程,提高了滑坡提取的自動(dòng)化程度與精度,減少了人工干 預(yù),劉毅、杜培軍等將隨機(jī)森林用于國(guó)產(chǎn)小衛(wèi)星遙感影像分類中,證明比最大似然、支持向 量機(jī)等具有更好的穩(wěn)定性、更高的分類精度和更快的運(yùn)算速度。以上研究主要局限于中低 分辨率遙感影像像素級(jí)分類,關(guān)于面向?qū)ο蟮碾S機(jī)森林分類研究甚少,缺少對(duì)隨機(jī)森林中 特征優(yōu)選策略的深入剖析,更缺少面向?qū)ο蟮碾S機(jī)森林分類方法及模塊。[0009]因此,本發(fā)明提出基于統(tǒng)計(jì)區(qū)域增長(zhǎng)與異質(zhì)性最小規(guī)則相結(jié)合(SRMMHR)的影像分 割方法,充分利用面向?qū)ο蠓治黾半S機(jī)森林機(jī)器學(xué)習(xí)的優(yōu)勢(shì),實(shí)現(xiàn)基于SRMMHR與隨機(jī)森林 的地理要素面向?qū)ο笞詣?dòng)解譯方法,研制相應(yīng)的模塊,通過(guò)特征自動(dòng)優(yōu)選及規(guī)則集自動(dòng)構(gòu) 建策略實(shí)現(xiàn)地理要素的自動(dòng)解譯,是當(dāng)前遙感影像信息提取與解譯發(fā)展的重要趨勢(shì)。
【發(fā)明內(nèi)容】
[0010]有鑒于此,本發(fā)明的目的在于提出一種基于SRMMHR和隨機(jī)森林的地理要素面向 對(duì)象自動(dòng)解譯方法以及相應(yīng)的模塊。通過(guò)本發(fā)明所提供的方法,能夠?qū)崿F(xiàn)遙感影像的有效 分割、特征的自動(dòng)優(yōu)選、分類規(guī)則集的自動(dòng)構(gòu)建,減少人工干預(yù),提高信息提取與解譯精度。[0011]基于上述目的本發(fā)明提供的遙感影像信息提取與解譯方法,其特征在于,至少包 括以下步驟,利用統(tǒng)計(jì)區(qū)域增長(zhǎng)和異質(zhì)性最小原則相結(jié)合分割方法進(jìn)行影像分割;利用分 形指數(shù)評(píng)價(jià)分割質(zhì)量,直到得到質(zhì)量較好的同質(zhì)性多邊形對(duì)象;統(tǒng)計(jì)多邊形對(duì)象的特征,形 成特征庫(kù);所述特征包括光譜特征、形狀特征、和紋理特征;選擇地理要素的典型樣本,形 成樣本集;利用隨機(jī)森林方法,根據(jù)訓(xùn)練樣本集及相應(yīng)特征,自動(dòng)進(jìn)行特征優(yōu)選及構(gòu)建分類 模型,根據(jù)分類模型對(duì)多邊形對(duì)象進(jìn)行分類,得到解譯結(jié)果;利用袋外數(shù)據(jù)誤差和混淆矩陣 對(duì)解譯結(jié)果進(jìn)行精度評(píng)價(jià)。[0012]可選的,所述利用統(tǒng)計(jì)區(qū)域增長(zhǎng)和異質(zhì)性最小原則相結(jié)合分割方法進(jìn)行影像分割 包括基于SRM的初始分割過(guò)程和基于MHR的合并過(guò)程。[0013]可選的,基于SRM的初始分割過(guò)程包括如下步驟,初始化像素對(duì);確定排序函數(shù), 將像素對(duì)按照函數(shù)大小由小到大排序;確定每個(gè)象素對(duì)的合并準(zhǔn)則以及各個(gè)象素的父結(jié)點(diǎn) 所在位置;依次判斷各象素所在種子點(diǎn)的位置是否不一致,以及是否滿足合并準(zhǔn)則,如果位 置不一致以及滿足合并條件,則進(jìn)入下一步驟;否則,不進(jìn)像素對(duì)行合并,并將合并后的各 像素對(duì)生成初始分割影像;按照合并準(zhǔn)則將像素對(duì)進(jìn)行合并,得到合并后的面積以及面積 加權(quán)像素值。[0014]可選的,所述排序函數(shù)公式為:/(/^’)= 一火-凡I;其中,p' a、pa表示波段a中相鄰象素對(duì)象素值,BI, B2……Bk表示k個(gè)波段。
[0015]可選的,所述合并準(zhǔn)則為:
,
【權(quán)利要求】
1.一種遙感影像信息提取與解譯方法,其特征在于,至少包括以下步驟,利用統(tǒng)計(jì)區(qū)域增長(zhǎng)和異質(zhì)性最小原則相結(jié)合的分割方法進(jìn)行影像分割;利用分形指數(shù)評(píng)價(jià)分割質(zhì)量,直到得到質(zhì)量較好的同質(zhì)性多邊形對(duì)象;統(tǒng)計(jì)多邊形對(duì)象的特征,形成特征庫(kù);所述特征包括光譜特征、形狀特征、和紋理特征;選擇地理要素的典型樣本,形成樣本集;利用隨機(jī)森林方法,根據(jù)訓(xùn)練樣本集及相應(yīng)特征,自動(dòng)進(jìn)行特征優(yōu)選及構(gòu)建分類模型, 根據(jù)分類模型對(duì)多邊形對(duì)象進(jìn)行分類,得到解譯結(jié)果;利用袋外數(shù)據(jù)誤差和混淆矩陣對(duì)解譯結(jié)果進(jìn)行精度評(píng)價(jià)。
2.根據(jù)權(quán)利要求1所述的遙感影像信息提取與解譯方法,其特征在于,所述利用統(tǒng)計(jì)區(qū)域增長(zhǎng)和異質(zhì)性最小原則相結(jié)合的分割方法進(jìn)行影像分割包括基于統(tǒng)計(jì)區(qū)域增長(zhǎng)的初始分割過(guò)程和基于異質(zhì)性最小原則的合并過(guò)程。
3.根據(jù)權(quán)利要求2所述的遙感影像信息提取與解譯方法,其特征在于,基于統(tǒng)計(jì)區(qū)域增長(zhǎng)的初始分割過(guò)程包括如下步驟,初始化像素對(duì);確定排序函數(shù),將像素對(duì)按照函數(shù)大小由小到大排序;確定每個(gè)象素對(duì)的合并準(zhǔn)則以及各個(gè)象素的父結(jié)點(diǎn)所在位置;依次判斷各象素所在種子點(diǎn)的位置是否不一致,以及是否滿足合并準(zhǔn)則,如果位置不一致以及滿足合并條件,則進(jìn)入下一步驟;否則,不進(jìn)行像素對(duì)合并;按照合并準(zhǔn)則將像素對(duì)進(jìn)行合并,得到合并后的面積以及面積加權(quán)像素值;生成初始分割影像。
4.根據(jù)權(quán)利要求3所述的遙感影像信息提取與解譯方法,其特征在于,所述排序函數(shù)公式為d唭中,P' a、Pa表示波段a中相鄰象素對(duì)象素值,BI,B2……Bk表示k個(gè)波段;和 / 或所述合并準(zhǔn)則為:
5.根據(jù)權(quán)利要求3所述的遙感影像信息提取與解譯方法,其特征在于,基于異質(zhì)性最小原則的合并過(guò)程包括如下步驟,設(shè)置異質(zhì)性最小原則的參數(shù):即設(shè)置光譜異質(zhì)性權(quán)重Wm1ot、形狀異質(zhì)性權(quán)重Wshape、 緊湊度指數(shù)權(quán)重W_pt、光滑度指數(shù)權(quán)重ws_th,尺度參數(shù)Th2 ;其中Wm1ot e [O, I],
6.根據(jù)權(quán)利要求1所述的遙感影像信息提取與解譯方法,其特征在于,利用隨機(jī)森林方法進(jìn)行分類的步驟進(jìn)一步包括如下過(guò)程, 采用bootstrap自助抽樣技術(shù)有放回地隨機(jī)抽取訓(xùn)練樣本,形成各個(gè)決策樹的樣本子集,未被選中的為袋外數(shù)據(jù); 采用CART 二元?jiǎng)澐植呗詷?gòu)建與樣本子集對(duì)應(yīng)的決策樹,每個(gè)決策樹的每個(gè)節(jié)點(diǎn)隨機(jī)抽取m個(gè)特征,通過(guò)計(jì)算每個(gè)特征蘊(yùn)含的信息量進(jìn)行分裂生長(zhǎng),然后眾多決策樹構(gòu)成一個(gè)隨機(jī)森林;其中,m小于總特征數(shù)量η ; 將生成的隨機(jī)森林作為預(yù)測(cè)模型來(lái)預(yù)測(cè)待分類對(duì)象的類別; 采用投票的方式,每棵決策樹的預(yù)測(cè)結(jié)果算作一票,將得票最多的類別作為待分類對(duì)象。
7.根據(jù)權(quán)利要求6所述的遙感影像信息提取與解譯方法,所述采用bootstrap自助抽樣技術(shù)有放回地隨機(jī)抽取訓(xùn)練樣本、形成各個(gè)決策樹的訓(xùn)練樣本子集的步驟執(zhí)行T次,形成T個(gè)訓(xùn)練樣本子集;其中利用隨機(jī)森林方法進(jìn)行分類的分類決策為:
8.根據(jù)權(quán)利要求6所述的遙感影像信息提取與解譯方法,其特征在于,所述隨機(jī)森林訓(xùn)練包括如下步驟,創(chuàng)建并初始化樹集合、參與的樣本序號(hào)、每個(gè)樣本的測(cè)試分類等參數(shù);采用bootstrap自助抽樣技術(shù)隨機(jī)生成訓(xùn)練樣本子集,利用遞歸方式訓(xùn)練單棵樹;使用未參與當(dāng)前樹構(gòu)建的樣本,測(cè)試當(dāng)前樹的預(yù)測(cè)準(zhǔn)確率;判斷準(zhǔn)確率是否達(dá)到標(biāo)準(zhǔn)或者節(jié)點(diǎn)樣本數(shù)是否過(guò)少,若是,則最終完成單個(gè)決策樹的生成,將當(dāng)前樹加入到樹集合中;若否,則返回采用bootstrap自助抽樣技術(shù)隨機(jī)生成訓(xùn)練樣本子集的步驟。
9.根據(jù)權(quán)利要求8所述的遙感影像信息提取與解譯方法,其特征在于,所述訓(xùn)練單棵樹的步驟包括如下過(guò)程,計(jì)算當(dāng)前節(jié)點(diǎn)樣本中最大樣本數(shù)量的類別,則為該節(jié)點(diǎn)的類別;判斷樣本數(shù)量是否過(guò)少,或深度是否大于最大指定深度,或該節(jié)點(diǎn)是否只有一種類別, 若是,則停止分裂;若否,則進(jìn)入下一步;采用最優(yōu)分裂策略針對(duì)某一變量進(jìn)行左右分裂,最優(yōu)分裂的依據(jù)是:其中,N1為左分裂的樣 本總數(shù),Nr為右分裂的樣本總數(shù),Cia為左分裂中類別i的樣本個(gè)數(shù),Ci,r為右分裂中類別i的樣本個(gè)數(shù);若不存在最優(yōu)分裂或者無(wú)法分裂,則釋放相關(guān)數(shù)據(jù)后返回;否則,處理代理分裂、分割左右分裂數(shù)據(jù)、調(diào)用左右后續(xù)分裂。
10.一種遙感影像信息提取與解譯模塊,其特征在于,采用權(quán)利要求1-8中任意一項(xiàng)所述的遙感影像信息提取與解譯方法進(jìn)行遙感影像信息提取與解譯。
【文檔編號(hào)】G06K9/46GK103500344SQ201310392133
【公開日】2014年1月8日 申請(qǐng)日期:2013年9月2日 優(yōu)先權(quán)日:2013年9月2日
【發(fā)明者】李海濤, 顧海燕, 韓顏?lái)? 余凡, 楊懿, 劉佳 申請(qǐng)人:中國(guó)測(cè)繪科學(xué)研究院