本發(fā)明涉及一種基于蜂群智能的遙感影像聚類(lèi)方法,屬于遙感影像聚類(lèi)分析領(lǐng)域。
背景技術(shù):
土地利用/覆被為很多學(xué)科提供了基礎(chǔ)數(shù)據(jù),包括生態(tài)學(xué)、地理學(xué)及氣候?qū)W等。因而,一直是科學(xué)家關(guān)注的焦點(diǎn)之一。遙感技術(shù)已經(jīng)被認(rèn)為是獲取土地利用/覆被數(shù)據(jù)的主流手段之一,這是因?yàn)槠渚哂泻芏嗒?dú)特的優(yōu)勢(shì),包括宏觀性、現(xiàn)勢(shì)性、可重復(fù)性和經(jīng)濟(jì)性等??茖W(xué)家已經(jīng)付出了很大精力發(fā)展了很多遙感分類(lèi)算法,但由于遙感影像的復(fù)雜性,精確的遙感影像分類(lèi)仍然是一項(xiàng)巨大挑戰(zhàn)。
總體而言,分類(lèi)方法分為監(jiān)督分類(lèi)與非監(jiān)督分類(lèi)(聚類(lèi))。監(jiān)督分類(lèi)(例如最大似然法)一般分類(lèi)精度較好,但需要大量訓(xùn)練樣本指導(dǎo)分類(lèi)。而訓(xùn)練樣本的搜集一般十分費(fèi)時(shí)費(fèi)力,并且很多地區(qū)不可到達(dá)。隨著遙感技術(shù)的快速發(fā)展,人類(lèi)獲取的衛(wèi)星遙感數(shù)據(jù)量呈現(xiàn)海量規(guī)模。在這種背景下,非監(jiān)督分類(lèi)受到了科學(xué)家越來(lái)越多的關(guān)注和注意,這是因?yàn)槠洳恍枰獦颖局R(shí),而僅依靠遙感影像自身統(tǒng)計(jì)特性就能生產(chǎn)土地利用數(shù)據(jù)。目前,非監(jiān)督分類(lèi)方法已經(jīng)廣泛應(yīng)用于各類(lèi)遙感應(yīng)用,包括全球土地利用制圖等。
k-means算法是一種最為常用的非監(jiān)督遙感分類(lèi)算法。它工作原理簡(jiǎn)單,效率較高,因而得到廣泛應(yīng)用。然而,k-means建立在數(shù)據(jù)對(duì)象符合高斯分布基礎(chǔ)之上,而遙感數(shù)據(jù)十分復(fù)雜,其數(shù)據(jù)分布往往不符合高斯分布。因而,k-means往往無(wú)法達(dá)到全局最優(yōu)解。此外,其性能在很大程度上受到初始數(shù)據(jù)的影響,因而穩(wěn)定性不足。
飛速發(fā)展的人工智能為這一領(lǐng)域的進(jìn)步提供了新的契機(jī)。非監(jiān)督分類(lèi)問(wèn)題可以轉(zhuǎn)換為一個(gè)優(yōu)化問(wèn)題,利用人工智能方法加以解決。遺傳算法(genetic algorithm,GA)是最為經(jīng)典的和最常用的智能算法,基于GA學(xué)者們發(fā)展了遺傳聚類(lèi)算法(GA-clustering)用于遙感影像分類(lèi)。該算法包括以下步驟:
1.將每一個(gè)解決方案視為一個(gè)染色體,通過(guò)對(duì)染色體的操作實(shí)現(xiàn)優(yōu)化;
2.構(gòu)造適宜度函數(shù),通過(guò)選擇算子保留精英群體,淘汰部分落后群體;
3.利用交叉算子和變異算子增加種群多樣性;
4.達(dá)到循環(huán)停止條件,輸出最優(yōu)解決方案,實(shí)現(xiàn)遙感影像非監(jiān)督分類(lèi)。
但是上述遺傳聚類(lèi)算法具有如下缺點(diǎn):
1開(kāi)發(fā)能力弱:遺傳聚類(lèi)算法依靠選擇和交叉算子來(lái)對(duì)已有染色體進(jìn)行開(kāi)發(fā),但并沒(méi)有對(duì)特別優(yōu)異的染色體予以特別重視,因而其收斂速度較慢,不適合處理復(fù)雜和大規(guī)模的遙感數(shù)據(jù)。
2開(kāi)拓能力較差:遺傳聚類(lèi)算法僅僅依靠交叉和變異來(lái)實(shí)現(xiàn)種群的開(kāi)拓,往往很難實(shí)現(xiàn)解空間的全局搜索與開(kāi)拓;由于其開(kāi)拓能力弱,所以其遙感影像聚類(lèi)結(jié)果好壞十分依賴(lài)于初始種群質(zhì)量,即聚類(lèi)結(jié)果不夠穩(wěn)定。
綜上,現(xiàn)有智能算法由于開(kāi)發(fā)和開(kāi)拓能力弱,在挖掘最優(yōu)聚類(lèi)中心從而實(shí)現(xiàn)遙感影像分類(lèi)任務(wù)中,往往無(wú)法得到全局最優(yōu)聚類(lèi)中心,無(wú)法取得滿(mǎn)意遙感分類(lèi)結(jié)果。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的是為了解決現(xiàn)有用于遙感影像的分類(lèi)算法開(kāi)發(fā)和開(kāi)拓能力弱,在挖掘最優(yōu)聚類(lèi)中心從而實(shí)現(xiàn)遙感影像分類(lèi)任務(wù)中,往往無(wú)法得到全局最優(yōu)聚類(lèi)中心,無(wú)法取得滿(mǎn)意遙感分類(lèi)結(jié)果的缺點(diǎn),而提出一種基于蜂群智能的遙感影像聚類(lèi)方法,包括如下步驟:
步驟1)確定待分類(lèi)遙感影像分類(lèi)數(shù)目,并將遙感影像的每一個(gè)像元隨機(jī)分配給一種分類(lèi);每個(gè)像元具有預(yù)定數(shù)量的特征;
步驟2)根據(jù)像元的特征對(duì)像元進(jìn)行蜂群智能挖掘,具體為:
步驟2.1)初始化控制參數(shù);所述控制參數(shù)包括蜜蜂數(shù)量、最大循環(huán)次數(shù)、限制搜索次數(shù);蜜蜂包括雇傭蜂、觀察蜂;所述蜜蜂數(shù)量為p,雇傭蜂數(shù)量為p/2,所述觀察蜂數(shù)量為p/2;
步驟2.2)建立食物源;每個(gè)食物源對(duì)應(yīng)于一個(gè)雇傭蜂;所述食物源由每一個(gè)類(lèi)別的聚類(lèi)中心連接形成,長(zhǎng)度為n×m,其中n為遙感影像中每一個(gè)像元的波段數(shù)目,m為待分類(lèi)數(shù)目;所述食物源的前n位表示第一個(gè)類(lèi)別的聚類(lèi)中心,以此類(lèi)推;
步驟2.3)計(jì)算食物源的適宜度;所述適宜度函數(shù)f的表達(dá)式為f=1/(M+1),M為聚類(lèi)指標(biāo);
步驟2.4)搜索新食物源;即在根據(jù)步驟2.3)計(jì)算完現(xiàn)有食物源的適宜度后,在已有食物源周?chē)S機(jī)搜索新的食物源位置;
步驟2.5)觀察蜂根據(jù)隨機(jī)概率P(Xi)對(duì)一個(gè)食物源進(jìn)行跟隨,隨機(jī)概率P(Xi)的表達(dá)式為:
其中,Xi為第i個(gè)蜜蜂食物源位置,f(Xi)為食物源Xi的花粉豐度,Ne為雇傭蜂數(shù)量;
步驟2.6)若一個(gè)食物源在經(jīng)過(guò)限制搜索次數(shù)后始終不能提高f(Xi)的值,則雇傭蜂轉(zhuǎn)變?yōu)閭刹旆?,使用列維飛行在解空間內(nèi)全局搜索新的食物源;若能夠提高f(Xi)的值,則跳轉(zhuǎn)到步驟2.4);
步驟2.7)當(dāng)所有蜜蜂完成搜索,將當(dāng)前的適宜度最高的最食物源與上一個(gè)循環(huán)的最優(yōu)食物源進(jìn)行比較,選取數(shù)值更高的作為當(dāng)前的全局最優(yōu)食物源;當(dāng)循環(huán)達(dá)到最大循環(huán)次數(shù)時(shí),停止循環(huán)并輸出最優(yōu)聚類(lèi)中心。
本發(fā)明的有益效果為:1、現(xiàn)有技術(shù)中的遺傳聚類(lèi)算法僅僅通過(guò)選擇算子來(lái)增加精英群體比例,但并沒(méi)有圍繞該群體進(jìn)行強(qiáng)力搜索,因此其開(kāi)發(fā)能力很弱。而本發(fā)明在影像最優(yōu)聚類(lèi)中心搜索過(guò)程中,利用觀察蜂對(duì)優(yōu)秀食物源周?chē)M(jìn)行多次搜索,大大提高了種群開(kāi)發(fā)能力。2、遺傳聚類(lèi)算法通過(guò)交叉和變異算子實(shí)現(xiàn)全局搜索,然而交叉算子僅僅基于已有基因片段,而變異算子往往只針對(duì)一個(gè)基因位,且其變異幅度有限,因此遺傳聚類(lèi)算法開(kāi)拓能力有限。而遺傳聚類(lèi)算法通過(guò)定義限制搜索次數(shù),及時(shí)放棄低劣食物源,并通過(guò)列維飛行實(shí)現(xiàn)了全局漫游能力,因而能實(shí)現(xiàn)在最優(yōu)聚類(lèi)中心解空間的全局搜索能力,具備了強(qiáng)大的開(kāi)拓能力。3、雇用蜂與觀察蜂相互配合機(jī)制,實(shí)現(xiàn)遙感影像聚類(lèi)最優(yōu)食物源的快速搜索即強(qiáng)化了開(kāi)發(fā)能力;4、使用了列維飛行的分布模型,列維飛行使得搜索新的食物源時(shí),搜索位置為在小范圍內(nèi)流通,并且有小概率會(huì)流動(dòng)到較遠(yuǎn)位置,使得對(duì)遙感影像的聚類(lèi)可以做到全局搜索,其突出優(yōu)點(diǎn)在于,小概率流動(dòng)到較為位置的特性可以提高搜索蜜源的效率,即原有的搜索方式符合均值分布、正態(tài)分布,而導(dǎo)致搜索范圍較小,如果相鄰區(qū)域不存在符合條件的蜜源,則會(huì)大大降低搜索效率,而列維飛行的步長(zhǎng)不符合高斯分布律,可以提高搜索效率,并且使用列維飛行模型克服了本領(lǐng)域內(nèi)技術(shù)人員的技術(shù)偏見(jiàn),本領(lǐng)域的技術(shù)人員僅僅認(rèn)識(shí)到了可以通過(guò)隨機(jī)算法來(lái)進(jìn)行全局搜索、全局漫游,但是使用的算法都是符合高斯分布律的隨機(jī)算法,即使做了提高效率也未從非高斯分布算法的角度考慮。因此本發(fā)明的基于蜂群智能的遙感影像聚類(lèi)方法是非顯而易見(jiàn)的,具有突出的技術(shù)效果。
附圖說(shuō)明
圖1為本發(fā)明的基于蜂群智能的遙感影像聚類(lèi)方法的流程圖;
圖2為本發(fā)明的基于蜂群智能的遙感影像聚類(lèi)方法中蜂群智能挖掘的具體步驟流程圖。
具體實(shí)施方式
具體實(shí)施方式一:本實(shí)施方式的一種基于蜂群智能的遙感影像聚類(lèi)方法,其特征在于,包括如下步驟:
步驟1)確定待分類(lèi)遙感影像分類(lèi)數(shù)目,并將遙感影像的每一個(gè)像元隨機(jī)分配給一種分類(lèi);每個(gè)像元具有預(yù)定數(shù)量的特征;
步驟2)根據(jù)像元的特征對(duì)像元進(jìn)行蜂群智能挖掘,具體為:
步驟2.1)初始化控制參數(shù);控制參數(shù)包括蜜蜂數(shù)量、最大循環(huán)次數(shù)、限制搜索次數(shù);蜜蜂包括雇傭蜂、觀察蜂;蜜蜂數(shù)量為p,雇傭蜂數(shù)量為p/2,觀察蜂數(shù)量為p/2;
步驟2.2)建立食物源;每個(gè)食物源對(duì)應(yīng)于一個(gè)雇傭蜂;食物源由每一個(gè)類(lèi)別的聚類(lèi)中心連接形成,長(zhǎng)度為n×m,其中n為遙感影像中每一個(gè)像元的波段數(shù)目,m為待分類(lèi)數(shù)目;食物源的前n位表示第一個(gè)類(lèi)別的聚類(lèi)中心,以此類(lèi)推;
步驟2.3)計(jì)算食物源的適宜度;適宜度函數(shù)f的表達(dá)式為f=1/(M+1),M為聚類(lèi)指標(biāo);聚類(lèi)指標(biāo)M直接反映了一個(gè)聚類(lèi)中心的質(zhì)量,因而在本發(fā)明中,我們基于聚類(lèi)指標(biāo)M評(píng)估食物源的收益,考慮到聚類(lèi)指標(biāo)越大,則食物源的質(zhì)量越差,為了保障豐富的食物源具有高收益,故做了上述的適宜度函數(shù)。
步驟2.4)搜索新食物源;即在根據(jù)步驟2.3)計(jì)算完現(xiàn)有食物源的適宜度后,在已有食物源周?chē)S機(jī)搜索新的食物源位置;
步驟2.5)觀察蜂根據(jù)隨機(jī)概率P(Xi)對(duì)一個(gè)食物源進(jìn)行跟隨,隨機(jī)概率P(Xi)的表達(dá)式為:
其中,Xi為第i個(gè)蜜蜂食物源位置,f(Xi)為食物源Xi的花粉豐度,Ne為雇傭蜂數(shù)量;這表示當(dāng)開(kāi)始搜索時(shí),觀察蜂隨機(jī)變?yōu)楣蛡蚍渌阉魇澄镌?,隨機(jī)變?yōu)楣蛡蚍涞母怕始礊镻(Xi),P(Xi)一定程度上反映了食物源豐度,即食物源豐度越高,雇傭蜂就有越高的幾率跟隨這個(gè)食物源。如此一來(lái)可以把更多的注意力放在豐富的食物源上。
步驟2.6)若一個(gè)食物源在經(jīng)過(guò)限制搜索次數(shù)后始終不能提高f(Xi)的值,則雇傭蜂轉(zhuǎn)變?yōu)閭刹旆?,使用列維飛行在解空間內(nèi)全局搜索新的食物源;若能夠提高f(Xi)的值,則跳轉(zhuǎn)到步驟2.4);
步驟2.7)當(dāng)所有蜜蜂完成搜索,將當(dāng)前的適宜度最高的最食物源與上一個(gè)循環(huán)的最優(yōu)食物源進(jìn)行比較,選取數(shù)值更高的作為當(dāng)前的全局最優(yōu)食物源;當(dāng)循環(huán)達(dá)到最大循環(huán)次數(shù)時(shí),停止循環(huán)并輸出最優(yōu)聚類(lèi)中心,從而完成遙感影像聚類(lèi)的任務(wù)。
其中列維飛行是從分布角度上講,大部分情況在小范圍內(nèi)流動(dòng),也有一小部分情況會(huì)流動(dòng)到較遠(yuǎn)位置的一種運(yùn)動(dòng)模式。
使用列維飛行的好處是,列維飛行使得搜索新的食物源時(shí),搜索位置為在小范圍內(nèi)流通,并且有小概率會(huì)流動(dòng)到較遠(yuǎn)位置,使得對(duì)遙感影像的聚類(lèi)可以做到全局搜索,其突出優(yōu)點(diǎn)在于,小概率流動(dòng)到較為位置的特性可以提高搜索蜜源的效率,即原有的搜索方式符合均值分布、正態(tài)分布,而導(dǎo)致搜索范圍較小,如果相鄰區(qū)域不存在符合條件的蜜源,則會(huì)大大降低搜索效率,而列維飛行的步長(zhǎng)不符合高斯分布律,可以提高搜索效率。
由于傳統(tǒng)的蜂群智能算法不能做到全局搜索,因此相比于傳統(tǒng)算法,本實(shí)施方式的好處是通過(guò)列維飛行在小范圍內(nèi)隨機(jī)流動(dòng),可以在小范圍隨機(jī)位置搜索新蜜源;相比于其他做了全局搜索的蜂群算法,本實(shí)施方式的好處在于,列維步長(zhǎng)提供了一種小概率產(chǎn)生長(zhǎng)步長(zhǎng)的方法,使得蜜源的搜索效率更高。
需要說(shuō)明的是,步驟2.5)中的f(Xi)與步驟2.3)中的適宜度函數(shù)f是相同的函數(shù),適宜度函數(shù)f是關(guān)于M的函數(shù),同時(shí)從M的表達(dá)式中可以看出,通過(guò)兩次累加符號(hào)累加出來(lái)的值其實(shí)就是第i個(gè)蜜蜂食物源的位置。因此適宜度函數(shù)f雖然從表示形式上沒(méi)有直接體現(xiàn)出其為關(guān)于Xi的函數(shù),但是實(shí)際上適宜度函數(shù)f的自變量就是Xi。
具體實(shí)施方式二:本實(shí)施方式與具體實(shí)施方式一不同的是:聚類(lèi)指標(biāo)通過(guò)如下公式計(jì)算:
其中,xj為i(i=1,2,…,k)類(lèi)別中的任意一個(gè)像元,zi為類(lèi)別i的聚類(lèi)中心,Ci為第i類(lèi)聚類(lèi),j為類(lèi)別i的像元個(gè)數(shù),k∈{1,2,…,p/2}且k≠i。
其它步驟及參數(shù)與具體實(shí)施方式一相同。
具體實(shí)施方式三:本實(shí)施方式與具體實(shí)施方式一至二之一不同的是:
步驟2.2)中,食物源的位置由如下公式確定:
其中,表示第i個(gè)雇傭蜂在第j個(gè)特征的位置,和分別表示第j個(gè)特征的最小值和最大值,rand(0,1)表示在0-1之間變化的隨機(jī)數(shù)。第j個(gè)特征是指遙感影像多維特征(即波段)中的第j個(gè)特征
其它步驟及參數(shù)與具體實(shí)施方式一至三之一相同。
具體實(shí)施方式四:本實(shí)施方式與具體實(shí)施方式一至三之一不同的是:
步驟2.2)中新的食物源表達(dá)式為:
其中,是第i個(gè)雇傭蜂在第j個(gè)特征(j=1,2,…,n)的新食物源位置;和分別表示第i、k個(gè)蜜蜂在第j個(gè)特征的原食物源位置,其中i,k∈{1,2,…,p/2}且k≠i;是一個(gè)在-1和1之間變化的隨機(jī)數(shù)。
本實(shí)施方式表示在完成現(xiàn)有的食物源收益評(píng)估后,雇傭蜂開(kāi)始在已有食物源周?chē)S機(jī)搜索新食物源位置,搜索機(jī)制如上式所示,如果新的食物源收益度高于原食物源,則原食物源被新食物源替換。
其它步驟及參數(shù)與具體實(shí)施方式一至四之一相同。
具體實(shí)施方式五:本實(shí)施方式與具體實(shí)施方式一至四之一不同的是:
步驟2.6)中新的位置通過(guò)如下公式計(jì)算:
其中,表示被放棄的食物源i的新位置,Xi為原位置,s為列維飛行所產(chǎn)生步長(zhǎng)。
其它步驟及參數(shù)與具體實(shí)施方式一至五之一相同。
具體實(shí)施方式六:本實(shí)施方式與具體實(shí)施方式一至五之一不同的是:
列維飛行所產(chǎn)生步長(zhǎng)s通過(guò)如下公式進(jìn)行計(jì)算:
在這里,μ,ν和λ分別從正態(tài)分布中計(jì)算得到,即:
其中,
其中,Γ為gamma函數(shù),β為在1到2之間變化的常量。
其它步驟及參數(shù)與具體實(shí)施方式一至六之一相同。