本發(fā)明涉及數(shù)據(jù)整合,具體涉及一種基于gis技術(shù)的生物多樣性調(diào)查數(shù)據(jù)整合方法及系統(tǒng)。
背景技術(shù):
1、生物多樣性對(duì)于維持地球生態(tài)穩(wěn)定具有重要意義,隨著人類(lèi)科技水平進(jìn)步,生物多樣性保護(hù)工作逐漸引起關(guān)注,在此過(guò)程中,生物多樣性數(shù)據(jù)整合對(duì)于推進(jìn)生物多樣性保護(hù)工作具有重要價(jià)值,目前在生物多樣性數(shù)據(jù)整合方面多采用設(shè)定調(diào)查區(qū)域進(jìn)行人工統(tǒng)計(jì)或概率統(tǒng)計(jì)法,這種方法存在以下問(wèn)題:
2、(1)在人工統(tǒng)計(jì)生物數(shù)量時(shí),由于地形情況復(fù)雜,人工難以深入各種地形進(jìn)行統(tǒng)計(jì),容易存在遺漏問(wèn)題,人工統(tǒng)計(jì)效率低下,僅適用于較小面積的生物數(shù)量統(tǒng)計(jì);
3、(2)在概率統(tǒng)計(jì)時(shí),可以通過(guò)概率計(jì)算減小統(tǒng)計(jì)工作量,用較小區(qū)域的生物數(shù)量統(tǒng)計(jì)結(jié)果預(yù)估較大區(qū)域的生物數(shù)量,但這種方法根據(jù)概率函數(shù)選擇的不同,會(huì)有不同的統(tǒng)計(jì)結(jié)果,存在較大誤差。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的在于提供一種基于gis技術(shù)的生物多樣性調(diào)查數(shù)據(jù)整合方法及系統(tǒng),以解決現(xiàn)有技術(shù)中容易遺漏,效率低下,不適用于較大區(qū)域,誤差較大的問(wèn)題。
2、為解決上述技術(shù)問(wèn)題,本發(fā)明具體提供下述技術(shù)方案:
3、本發(fā)明的第一個(gè)方面,提供了一種基于gis技術(shù)的生物多樣性調(diào)查數(shù)據(jù)整合方法,包括以下步驟:
4、通過(guò)地理信息系統(tǒng)gis獲取調(diào)查區(qū)域的地理空間數(shù)據(jù)及植被分布影像,按照經(jīng)緯度及海拔分布對(duì)所述調(diào)查區(qū)域進(jìn)行同類(lèi)區(qū)域分割;
5、按照分割后的同類(lèi)區(qū)域,對(duì)所述調(diào)查區(qū)域的地形數(shù)據(jù)、氣候數(shù)據(jù)、土壤數(shù)據(jù)進(jìn)行數(shù)據(jù)量化,對(duì)數(shù)據(jù)量化結(jié)果進(jìn)行數(shù)據(jù)類(lèi)聚合,構(gòu)成多源數(shù)據(jù)整合體;
6、對(duì)所述植被分布影像進(jìn)行圖像預(yù)處理,獲取圖像濾波數(shù)據(jù),構(gòu)建學(xué)生網(wǎng)絡(luò)利用知識(shí)蒸餾對(duì)所述圖像濾波數(shù)據(jù)進(jìn)行圖像特征提取;
7、構(gòu)建深度置信網(wǎng)絡(luò),按照平均權(quán)重對(duì)所述多源數(shù)據(jù)整合體及調(diào)查區(qū)域的植被特征進(jìn)行網(wǎng)絡(luò)匹配,生成生物多樣性調(diào)查數(shù)據(jù);
8、調(diào)整所述多源數(shù)據(jù)整合體的權(quán)重,對(duì)所述多源數(shù)據(jù)整合體及調(diào)查區(qū)域的植被特征進(jìn)行多次網(wǎng)絡(luò)匹配,生成生物多樣性趨勢(shì)數(shù)據(jù)。
9、作為本發(fā)明的一種優(yōu)選方案,通過(guò)地理信息系統(tǒng)gis獲取調(diào)查區(qū)域的地理空間數(shù)據(jù)及植被分布影像,包括:
10、獲取調(diào)查區(qū)域中心點(diǎn)經(jīng)緯度、區(qū)域形狀、區(qū)域面積及時(shí)間切點(diǎn),基于所述中心點(diǎn)經(jīng)緯度、區(qū)域形狀、區(qū)域面積及時(shí)間切點(diǎn)向gis系統(tǒng)請(qǐng)求獲取調(diào)查區(qū)域的地理空間數(shù)據(jù)及植被分布影像。
11、作為本發(fā)明的一種優(yōu)選方案,按照經(jīng)緯度及海拔分布對(duì)所述調(diào)查區(qū)域進(jìn)行同類(lèi)區(qū)域分割,包括:
12、將所述調(diào)查區(qū)域的經(jīng)緯度圖進(jìn)行均勻劃分,劃分為24×24的網(wǎng)格圖,計(jì)算網(wǎng)格內(nèi)部的海拔平均值;
13、使用海拔蔓延算法對(duì)所述網(wǎng)格圖進(jìn)行同類(lèi)區(qū)域分割;
14、首先選取所述網(wǎng)格圖中的任意網(wǎng)格作為蔓延起始點(diǎn),計(jì)算所述蔓延起始點(diǎn)與其相鄰的所有網(wǎng)格海拔平均值的絕對(duì)差值;
15、若所述海拔平均值的絕對(duì)差值小于20米,再計(jì)算相鄰網(wǎng)格邊緣海拔的絕對(duì)差值;
16、若所述相鄰網(wǎng)格邊緣海拔的絕對(duì)差值小于20米,則認(rèn)為兩個(gè)網(wǎng)格之間海拔變化平緩,為同類(lèi)網(wǎng)格;
17、若所述相鄰網(wǎng)格邊緣海拔的絕對(duì)差值大于20米,則認(rèn)為兩個(gè)網(wǎng)格之間海拔變化劇烈,為非同類(lèi)網(wǎng)格;
18、若所述海拔平均值的絕對(duì)差值大于20米,則認(rèn)為兩個(gè)網(wǎng)格之間海拔變化劇烈,為非同類(lèi)網(wǎng)格;
19、在所述非同類(lèi)網(wǎng)格之間插入?yún)^(qū)域分割線(xiàn),并選取所述同類(lèi)網(wǎng)格作為新的蔓延起始點(diǎn),重復(fù)上述操作遍歷所有網(wǎng)格,直到區(qū)域分割線(xiàn)閉合,形成同類(lèi)區(qū)域分割結(jié)果。
20、作為本發(fā)明的一種優(yōu)選方案,按照分割后的同類(lèi)區(qū)域,對(duì)所述調(diào)查區(qū)域的地形數(shù)據(jù)、氣候數(shù)據(jù)、土壤數(shù)據(jù)進(jìn)行數(shù)據(jù)量化,包括:
21、在同類(lèi)區(qū)域內(nèi)部對(duì)各項(xiàng)數(shù)據(jù)計(jì)算均值;
22、對(duì)地形數(shù)據(jù)構(gòu)建數(shù)據(jù)組,其表達(dá)式為:
23、;
24、其中,表示地形類(lèi)別,表示地形起始海拔高度,表示地形終止海拔高度,表示地形面積;
25、對(duì)氣候數(shù)據(jù)計(jì)算年平均溫度值,其表達(dá)式為:
26、;
27、其中,表示年平均溫度值,表示月平均溫度值;
28、對(duì)土壤數(shù)據(jù)構(gòu)建數(shù)據(jù)組,其表達(dá)式為:
29、;
30、其中,表示土壤酸堿度,表示土壤硬度。
31、作為本發(fā)明的一種優(yōu)選方案,對(duì)數(shù)據(jù)量化結(jié)果進(jìn)行數(shù)據(jù)類(lèi)聚合,構(gòu)成多源數(shù)據(jù)整合體,包括:
32、采用k鄰近算法將所述分割后的同類(lèi)區(qū)域作為數(shù)據(jù)樣本構(gòu)建樣本網(wǎng)絡(luò),k的值取10,將數(shù)據(jù)量化后的te、t、so作為知識(shí)樣本輸入所述樣本網(wǎng)絡(luò),對(duì)所述知識(shí)樣本進(jìn)行歸一化處理,作為網(wǎng)絡(luò)的節(jié)點(diǎn)向量;
33、所述數(shù)據(jù)樣本與知識(shí)樣本進(jìn)行一階卷積,并將卷積結(jié)果沿所述樣本網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)傳遞給下一節(jié)點(diǎn),下一節(jié)點(diǎn)接收卷積結(jié)果并與節(jié)點(diǎn)向量進(jìn)行一階卷積及節(jié)點(diǎn)向量更新;
34、基于樣本網(wǎng)絡(luò)節(jié)點(diǎn)輸出進(jìn)行聚類(lèi)分析,獲取多源數(shù)據(jù)整合體。
35、作為本發(fā)明的一種優(yōu)選方案,對(duì)所述植被分布影像進(jìn)行圖像預(yù)處理,獲取圖像濾波數(shù)據(jù),包括:
36、對(duì)所述調(diào)查區(qū)域的植被分布影像進(jìn)行圖像數(shù)字化,形成圖像灰度值矩陣,對(duì)所述圖像灰度值矩陣進(jìn)行動(dòng)態(tài)中值濾波;
37、采用長(zhǎng)度為3,寬度為1的觀(guān)察窗口對(duì)所述圖像灰度值矩陣進(jìn)行觀(guān)察,將所述觀(guān)察窗口視野內(nèi)的圖像灰度值進(jìn)行排序,將排序結(jié)果中的中值賦給所述觀(guān)察窗口視野內(nèi)的所有矩陣元素;
38、將所述觀(guān)察窗口移動(dòng)兩個(gè)矩陣元素的距離,并將所述觀(guān)察窗口長(zhǎng)度設(shè)置為5,再次進(jìn)行排序,將排序結(jié)果中的中值賦給所述觀(guān)察窗口視野內(nèi)的所有矩陣元素;
39、將所述觀(guān)察窗口移動(dòng)四個(gè)矩陣元素的距離,并將所述觀(guān)察窗口長(zhǎng)度設(shè)置為3,重復(fù)上述操作獲取圖像濾波數(shù)據(jù),濾波函數(shù)表達(dá)式為:
40、;
41、其中,表示行列的矩陣元素的灰度值,的值為2或4,表示觀(guān)察窗口視野內(nèi)的圖像灰度值中值。
42、作為本發(fā)明的一種優(yōu)選方案,構(gòu)建學(xué)生網(wǎng)絡(luò)利用知識(shí)蒸餾對(duì)所述圖像濾波數(shù)據(jù)進(jìn)行圖像特征提取,包括:
43、使用教師網(wǎng)絡(luò)對(duì)所述圖像濾波數(shù)據(jù)進(jìn)行特征提取,將圖像中的植被種類(lèi)、數(shù)量及分布情況形成訓(xùn)練數(shù)據(jù)集,利用教師網(wǎng)絡(luò)的網(wǎng)絡(luò)中間層輸出的特征向量對(duì)學(xué)生網(wǎng)絡(luò)訓(xùn)練進(jìn)行監(jiān)督,將所述訓(xùn)練數(shù)據(jù)集作為學(xué)生網(wǎng)絡(luò)訓(xùn)練輸入的訓(xùn)練標(biāo)簽,學(xué)生模型總體目標(biāo)函數(shù)表達(dá)式為:
44、;
45、其中,表示交叉熵?fù)p失的權(quán)重值,表示教師網(wǎng)絡(luò)的損失函數(shù),表示學(xué)生網(wǎng)絡(luò)預(yù)測(cè)結(jié)果的散度;
46、使用訓(xùn)練完成的學(xué)生網(wǎng)絡(luò)對(duì)所述圖像濾波數(shù)據(jù)進(jìn)行特征提取。
47、作為本發(fā)明的一種優(yōu)選方案,構(gòu)建深度置信網(wǎng)絡(luò),按照平均權(quán)重對(duì)所述多源數(shù)據(jù)整合體及調(diào)查區(qū)域的植被特征進(jìn)行網(wǎng)絡(luò)匹配,生成生物多樣性調(diào)查數(shù)據(jù),包括:
48、隨機(jī)選取50%的多源數(shù)據(jù)整合體,并將其內(nèi)部各個(gè)部分的數(shù)據(jù)權(quán)重設(shè)置為相等,與植被特征進(jìn)行人工匹配后作為深度置信網(wǎng)絡(luò)預(yù)訓(xùn)練材料;
49、將所述預(yù)訓(xùn)練材料輸入深度置信網(wǎng)絡(luò)的界面層,每一個(gè)預(yù)訓(xùn)練材料對(duì)應(yīng)一個(gè)獨(dú)立的深度置信網(wǎng)絡(luò)神經(jīng)元;
50、使用cd-7算法對(duì)初始受限玻爾茲曼機(jī)進(jìn)行預(yù)訓(xùn)練,通過(guò)界面層與下層神經(jīng)元之間的狀態(tài)轉(zhuǎn)移概率函數(shù)更新下層神經(jīng)元的激活狀態(tài);
51、當(dāng)所述初始受限玻爾茲曼機(jī)參數(shù)權(quán)值達(dá)到最優(yōu)解后,固定參數(shù)并重復(fù)訓(xùn)練下層受限玻爾茲曼機(jī),直到所有受限玻爾茲曼機(jī)參數(shù)權(quán)值達(dá)到最優(yōu)解;
52、將所有受限玻爾茲曼機(jī)參數(shù)權(quán)值達(dá)到最優(yōu)解的深度置信網(wǎng)絡(luò)展開(kāi)為bp神經(jīng)網(wǎng)絡(luò),并以人工匹配結(jié)果作為網(wǎng)絡(luò)訓(xùn)練輸出期望,對(duì)受限玻爾茲曼機(jī)權(quán)重進(jìn)行微調(diào),直到網(wǎng)絡(luò)訓(xùn)練輸出符合人工匹配結(jié)果,網(wǎng)絡(luò)訓(xùn)練輸出結(jié)果與輸出期望的誤差指標(biāo)表達(dá)式為:
53、
54、其中,表示網(wǎng)絡(luò)訓(xùn)練輸出結(jié)果,表示輸出期望,表示訓(xùn)練樣本數(shù)量;
55、在權(quán)重微調(diào)結(jié)束后,將剩下50%的多源數(shù)據(jù)整合體與調(diào)查區(qū)域的植被特征輸入深度置信網(wǎng)絡(luò)獲取網(wǎng)絡(luò)匹配結(jié)果,生成生物多樣性調(diào)查數(shù)據(jù)。
56、作為本發(fā)明的一種優(yōu)選方案,調(diào)整所述多源數(shù)據(jù)整合體的權(quán)重,對(duì)所述多源數(shù)據(jù)整合體及調(diào)查區(qū)域的植被特征進(jìn)行多次網(wǎng)絡(luò)匹配,生成生物多樣性趨勢(shì)數(shù)據(jù),包括:
57、通過(guò)多次調(diào)整所述多源數(shù)據(jù)整合體內(nèi)部各個(gè)部分的數(shù)據(jù)權(quán)重,重新輸入所述深度置信網(wǎng)絡(luò)進(jìn)行訓(xùn)練;
58、每一次訓(xùn)練中選取地形、氣候或土壤中的一個(gè)部分作為主要影響因素,將其權(quán)重設(shè)置為70%,相應(yīng)的另外兩個(gè)部分的權(quán)重設(shè)置為15%;
59、通過(guò)多次訓(xùn)練獲得不同的網(wǎng)絡(luò)匹配結(jié)果,將不同的網(wǎng)絡(luò)匹配結(jié)果與一般化生物多樣性調(diào)查數(shù)據(jù)進(jìn)行比對(duì),獲得不同環(huán)境因素對(duì)生物多樣性的影響結(jié)果。
60、本發(fā)明的第二個(gè)方面,一種基于gis技術(shù)的生物多樣性調(diào)查數(shù)據(jù)整合系統(tǒng),其特征在于,包括:
61、gis數(shù)據(jù)請(qǐng)求模塊:根據(jù)用戶(hù)需求向gis系統(tǒng)發(fā)出數(shù)據(jù)獲取命令并接收回傳數(shù)據(jù);
62、圖像處理模塊:對(duì)gis系統(tǒng)回傳的圖像數(shù)據(jù)進(jìn)行圖像采樣、分割及特征提??;
63、神經(jīng)網(wǎng)絡(luò)模塊:根據(jù)不同的訓(xùn)練樣本及訓(xùn)練方式,訓(xùn)練學(xué)生模型或深度置信網(wǎng)絡(luò),在訓(xùn)練結(jié)束后按照訓(xùn)練參數(shù)對(duì)新的輸入樣本進(jìn)行處理;
64、數(shù)據(jù)整合平臺(tái):管理模塊之間的數(shù)據(jù)傳輸,解析用戶(hù)命令,顯示模塊信息,輸出數(shù)據(jù)整合或處理的結(jié)果。
65、本發(fā)明與現(xiàn)有技術(shù)相比較具有如下有益效果:
66、本發(fā)明采用gis技術(shù),通過(guò)gis系統(tǒng)獲取調(diào)查區(qū)域的地理空間數(shù)據(jù)及植被分布影像,利用深度神經(jīng)網(wǎng)絡(luò)對(duì)數(shù)據(jù)進(jìn)行處理,計(jì)算調(diào)查區(qū)域的生物數(shù)量,可以在極大范圍內(nèi)完成生物多樣性調(diào)查工作,深度神經(jīng)網(wǎng)絡(luò)經(jīng)過(guò)訓(xùn)練和參數(shù)調(diào)整,可以在無(wú)需人工參與的情況下,精確計(jì)算生物數(shù)量,提高了生物多樣性調(diào)查效率。
67、通過(guò)改變不同環(huán)境因素在網(wǎng)絡(luò)匹配中的權(quán)重,進(jìn)行多次匹配,可以獲得不同環(huán)境因素對(duì)生物多樣性的影響程度,減小一次匹配可能存在的誤差。