細(xì)粒度的森林火災(zāi)概率預(yù)報(bào)系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種林火預(yù)測(cè)預(yù)報(bào)系統(tǒng),特別是涉及一種基于數(shù)據(jù)驅(qū)動(dòng)方法建模的林 火預(yù)測(cè)預(yù)報(bào)系統(tǒng)。
【背景技術(shù)】
[0002] 森林是重要的資源之一,森林火災(zāi)是影響森林發(fā)展的主要災(zāi)害,不僅直接影響森 林生態(tài)平衡,造成經(jīng)濟(jì)和生態(tài)資源流失,而且危及到人民生命財(cái)產(chǎn)的安全[1 ]。設(shè)計(jì)簡(jiǎn)單實(shí) 用的林火預(yù)測(cè)預(yù)報(bào)系統(tǒng),是降低森林火災(zāi)危害的重要措施。
[0003] 國(guó)外對(duì)林火預(yù)測(cè)預(yù)報(bào)的研究工作開展得較早。美國(guó)開發(fā)出國(guó)家火險(xiǎn)等級(jí)系統(tǒng) (NFDRS)[2],以氣象、地形、可燃物等多種因素作為輸入,基于燃燒原理和實(shí)驗(yàn)室試驗(yàn)發(fā)展 建立物理模型,計(jì)算森林火險(xiǎn)指標(biāo)。但NFDRS組成結(jié)構(gòu)極為復(fù)雜,在實(shí)際應(yīng)用中較難實(shí)施
[3] ;且其預(yù)報(bào)模型是基于物理的方法,需要進(jìn)行大量的實(shí)驗(yàn)。
[0004] 加拿大開發(fā)出加拿大森林火險(xiǎn)天氣指數(shù)(FWI)系統(tǒng)[4],其結(jié)構(gòu)如圖1所示。該系統(tǒng) 從可燃物含水率平衡理論出發(fā),以4種基本的氣象觀測(cè)數(shù)據(jù)作為輸入,通過(guò)大量點(diǎn)火試驗(yàn)建 立計(jì)算模型,經(jīng)過(guò)一系列推導(dǎo)、計(jì)算,最終以火險(xiǎn)天氣指標(biāo)來(lái)進(jìn)行火險(xiǎn)預(yù)報(bào)。但其僅考慮氣 象因素對(duì)林火發(fā)生的影響,忽略了可燃物和地形等因素的空間變化[3]。
[0005] 韓國(guó)針對(duì)本國(guó)森林火災(zāi)的特點(diǎn),開發(fā)出適用于韓國(guó)地區(qū)的國(guó)家森林火險(xiǎn)等級(jí)預(yù)報(bào) 系統(tǒng)(KFFDRI) [5],如圖2所示。KFFDRI以韓國(guó)1997-2001年之間的森林火災(zāi)歷史數(shù)據(jù)及同期 氣象數(shù)據(jù)和126次火災(zāi)現(xiàn)場(chǎng)調(diào)查數(shù)據(jù)為基礎(chǔ),建立基于氣象因子、可燃物因子和地形因子的 半機(jī)理半統(tǒng)計(jì)模型進(jìn)行林火等級(jí)預(yù)報(bào)。但KFFDRI僅適用于韓國(guó)地區(qū),不易推廣[6]。
[0006] 澳大利亞于19世紀(jì)50年代后期構(gòu)建了本國(guó)的森林火險(xiǎn)等級(jí)系統(tǒng)(McArthur) [3]。 該系統(tǒng)以野外點(diǎn)火實(shí)驗(yàn)為基礎(chǔ),研究并制定了四個(gè)子模型:干旱因子模型、可燃物濕度模 型、蔓延速度模型和撲救困難模型,用于火險(xiǎn)等級(jí)的評(píng)定。該系統(tǒng)的輸入因子包括長(zhǎng)期的干 旱指數(shù),以及近期的降水量、溫度、濕度和風(fēng)速,根據(jù)火災(zāi)的撲救困難程度制定森林火險(xiǎn)等 級(jí)。
[0007] 我國(guó)對(duì)林火預(yù)測(cè)的研究起步較晚,且主要是在美國(guó)、加拿大等國(guó)家的成果基礎(chǔ)上, 結(jié)合我國(guó)的實(shí)際情況進(jìn)行的,如由中國(guó)氣象局發(fā)布并于2007年10月1日實(shí)施的《中國(guó)氣象行 業(yè)標(biāo)準(zhǔn)(QX/T77-2007)--森林火險(xiǎn)氣象等級(jí)》。該方法的輸入包括5種當(dāng)期氣象因子和7種 前期氣象因子,首先利用計(jì)算公式計(jì)算各氣象因子對(duì)森林火險(xiǎn)的貢獻(xiàn)度,然后計(jì)算當(dāng)期因 子指數(shù)和前期因子指數(shù),最后利用上一步的結(jié)果計(jì)算森林火險(xiǎn)氣象指數(shù)。目前我國(guó)應(yīng)用于 林火監(jiān)測(cè)的系統(tǒng)較多,但用于林火預(yù)測(cè)的成型系統(tǒng)較少。雖然我國(guó)已研制和發(fā)展出數(shù)十種 火險(xiǎn)預(yù)報(bào)方法,但到目前為止還沒有建立一套綜合考慮氣象、植被、地理以及人類活動(dòng)等影 響因素的國(guó)家級(jí)林火預(yù)測(cè)預(yù)報(bào)系統(tǒng)[7]。
[0008] 導(dǎo)致林火發(fā)生的因素眾多,機(jī)制復(fù)雜,并且因果之間呈非線性關(guān)系,傳統(tǒng)的林火預(yù) 測(cè)預(yù)報(bào)系統(tǒng)旨在通過(guò)將多種氣象因素通過(guò)一定的組合建立線性模型進(jìn)行林火預(yù)測(cè)[8],但 各林場(chǎng)所處的地形各不相同,各因素對(duì)林火的影響程度各不相同,林火的發(fā)生也不只受氣 象因素的影響,從而導(dǎo)致預(yù)測(cè)效果并不理想[9];且傳統(tǒng)林火預(yù)測(cè)預(yù)報(bào)系統(tǒng)的空間粒度較 為粗略,時(shí)效性較差,不能滿足各級(jí)森林防火工作的實(shí)際需求。
【發(fā)明內(nèi)容】
[0009] 為克服現(xiàn)有技術(shù)的不足,針對(duì)傳統(tǒng)林火預(yù)測(cè)預(yù)報(bào)系統(tǒng)預(yù)測(cè)精度不高、空間粒度較 粗等問(wèn)題,設(shè)計(jì)并實(shí)現(xiàn)實(shí)用的林火概率預(yù)報(bào)系統(tǒng)以達(dá)到如下目標(biāo):
[0010] (1)考慮多種因素對(duì)林火發(fā)生的綜合影響關(guān)系,提高系統(tǒng)的預(yù)測(cè)精度;
[0011] (2)構(gòu)建貝葉斯網(wǎng)絡(luò)模型,將貝葉斯網(wǎng)絡(luò)的相關(guān)理論應(yīng)用到林火預(yù)測(cè)預(yù)報(bào)領(lǐng)域,發(fā) 揮貝葉斯網(wǎng)絡(luò)在處理此類不確定性問(wèn)題的優(yōu)勢(shì),提高系統(tǒng)的預(yù)測(cè)精度;
[0012] (3)構(gòu)建概率分配模型,將大范圍的林火概率進(jìn)行分配,細(xì)化系統(tǒng)的空間粒度;
[0013] (4)制定林火風(fēng)險(xiǎn)等級(jí)并將之可視化,直觀地表征林火發(fā)生的難易程度。
[0014] 本發(fā)明采用的技術(shù)方案是,細(xì)粒度的森林火災(zāi)概率預(yù)報(bào)系統(tǒng),包括:
[0015] 關(guān)系型數(shù)據(jù)庫(kù)模塊,關(guān)系型數(shù)據(jù)庫(kù)模塊進(jìn)一步包括氣象觀測(cè)數(shù)據(jù)庫(kù)、氣象預(yù)報(bào)數(shù) 據(jù)庫(kù)、模型輸入因子數(shù)據(jù)庫(kù)、模型數(shù)據(jù)庫(kù)和林火概率數(shù)據(jù)庫(kù);氣象觀測(cè)數(shù)據(jù)庫(kù)存儲(chǔ)當(dāng)日的氣 象觀測(cè)數(shù)據(jù),用于更新模型輸入因子數(shù)據(jù)庫(kù)中的數(shù)據(jù);氣象預(yù)報(bào)數(shù)據(jù)庫(kù)存儲(chǔ)用于貝葉斯網(wǎng) 絡(luò)推理的氣象預(yù)報(bào)數(shù)據(jù);模型輸入因子數(shù)據(jù)庫(kù)存儲(chǔ)用于構(gòu)建貝葉斯網(wǎng)絡(luò)模型和概率分配模 型的歷史數(shù)據(jù)和空間數(shù)據(jù),包括氣象歷史數(shù)據(jù)、林火歷史數(shù)據(jù)、地理數(shù)據(jù)、地表覆蓋數(shù)據(jù)、人 口分布數(shù)據(jù);林火概率數(shù)據(jù)庫(kù)存儲(chǔ)系統(tǒng)的計(jì)算結(jié)果,包括由貝葉斯網(wǎng)絡(luò)推理得到的縣級(jí)林 火概率,由概率分配模型計(jì)算得到的300m X 300m粒度林火概率,以及相應(yīng)的林火風(fēng)險(xiǎn)等級(jí); 模型數(shù)據(jù)庫(kù)存儲(chǔ)系統(tǒng)的模型文件,為每個(gè)地區(qū)的林火概率提供計(jì)算模型;
[0016] 數(shù)據(jù)庫(kù)管理模塊,提供對(duì)數(shù)據(jù)庫(kù)中基礎(chǔ)信息的處理,實(shí)現(xiàn)數(shù)據(jù)的導(dǎo)入、數(shù)據(jù)格式轉(zhuǎn) 換、數(shù)據(jù)編輯、修改、查詢;
[0017] 數(shù)據(jù)采集模塊完成對(duì)系統(tǒng)輸入數(shù)據(jù)的采集工作,其中氣象歷史數(shù)據(jù)需要編寫網(wǎng)絡(luò) 爬蟲程序進(jìn)行采集;包括地表覆蓋、海拔的柵格數(shù)據(jù)借助地理信息系統(tǒng)工具進(jìn)行提?。?br>[0018] FWI指數(shù)計(jì)算模塊完成森林火險(xiǎn)天氣指數(shù)計(jì)算功能,首先由午時(shí)氣溫、午時(shí)相對(duì)濕 度、午時(shí)風(fēng)速、24小時(shí)降水量計(jì)算得到5個(gè)中間指數(shù),再由5個(gè)中間指數(shù)計(jì)算得出當(dāng)日的FWI 指數(shù),數(shù)據(jù)規(guī)整模塊完成對(duì)連續(xù)型數(shù)據(jù)的離散化功能,以生成用于貝葉斯網(wǎng)絡(luò)模型訓(xùn)練及 預(yù)測(cè)的樣本數(shù)據(jù);
[0019] 貝葉斯網(wǎng)絡(luò)推理模塊完成貝葉斯網(wǎng)絡(luò)建模和推理功能,首先根據(jù)專家經(jīng)驗(yàn),主觀 確定貝葉斯網(wǎng)絡(luò)的節(jié)點(diǎn)和網(wǎng)絡(luò)結(jié)構(gòu);然后,基于樣本數(shù)據(jù)進(jìn)行網(wǎng)絡(luò)參數(shù)學(xué)習(xí),建立用于林火 概率預(yù)測(cè)的貝葉斯網(wǎng)絡(luò)模型;最后,應(yīng)用聯(lián)合樹算法進(jìn)行推理,預(yù)測(cè)出縣級(jí)林火概率;
[0020] 概率分配模塊完成將縣級(jí)林火概率分配至300m X 300m粒度功能,首先對(duì)林火歷史 記錄進(jìn)行統(tǒng)計(jì)分析,得到各林火因子的取值權(quán)重,然后基于空間數(shù)據(jù)和縣級(jí)林火概率計(jì)算 300m X 300m粒度的林火概率,并通過(guò)顯示模塊顯示。
[0021] 貝葉斯網(wǎng)絡(luò)建模和推理功能與預(yù)測(cè)出縣級(jí)林火概率的具體步驟:
[0022] 林火概率預(yù)測(cè)的貝葉斯網(wǎng)絡(luò)中的節(jié)點(diǎn)分為兩類:一類是林火發(fā)生節(jié)點(diǎn),表征結(jié)果; 另一類是林火誘因節(jié)點(diǎn),表征原因;節(jié)點(diǎn)間的有向連接弧表示林火及其誘因之間的因果關(guān) 系,每個(gè)節(jié)點(diǎn)的參數(shù)值表征了林火及其誘因之間的概率依賴關(guān)系;
[0023] 基于時(shí)態(tài)數(shù)據(jù)和空間數(shù)據(jù)進(jìn)行貝葉斯網(wǎng)絡(luò)建模:貝葉斯網(wǎng)絡(luò)模型的空間參照為縣 或區(qū);模型的時(shí)間參照為一天;每一個(gè)節(jié)點(diǎn)有若干個(gè)離散、互斥的取值狀態(tài),這意味著觀測(cè) 到的連續(xù)型數(shù)包括海拔、人口密度的連續(xù)型數(shù)必須預(yù)先做離散化處理,應(yīng)用等頻率離散化 方法[17]對(duì)數(shù)據(jù)進(jìn)行離散化;
[0024] 海拔節(jié)點(diǎn)、地表覆蓋節(jié)點(diǎn)和人口密度節(jié)點(diǎn)的條件概率表由先驗(yàn)知識(shí)確定,即:每個(gè) 縣的平均海拔、地表覆蓋和人口密度短時(shí)間內(nèi)是不變的;
[0025] 其余除林火發(fā)生節(jié)點(diǎn)外的節(jié)點(diǎn)的條件概率表,應(yīng)用最大似然估計(jì)方法進(jìn)行學(xué)習(xí), 最大似然估計(jì)基于傳統(tǒng)的統(tǒng)計(jì)分析思想,依據(jù)樣本與參數(shù)的似然程度來(lái)評(píng)判樣本與模型的 擬合程度,設(shè)數(shù)據(jù)D由樣本組成,則節(jié)點(diǎn)Xi的參數(shù)Θ,的對(duì)數(shù)似然函數(shù)的一般形 式為:L(Θi | D) = 1 ogP(D | Θi),Θi的最大似然估計(jì),就是令L(Θi | D)達(dá)到最大的那個(gè)取值< s即
[0026]
[0027] 設(shè)節(jié)點(diǎn)Xi共有ri個(gè)取值,其父節(jié)點(diǎn)JiUi)的取值共有qi個(gè)組合,根據(jù)獨(dú)立同分布假 設(shè)和貝葉斯網(wǎng)絡(luò)的結(jié)構(gòu)特征,有:
[0028] 1.-:1
[0029] 其中Di為一個(gè)觀測(cè)樣本,niijk為D中滿足Xi = k且3i(Xi) = j的樣本的數(shù)量,記
,則Θ,的最大似然估計(jì)為:
[0030]
[0031] 對(duì)于林火發(fā)生節(jié)點(diǎn),其父節(jié)點(diǎn)集合中包含地表覆蓋節(jié)點(diǎn),由于模型的空間參照為 縣或區(qū),實(shí)際數(shù)據(jù)中該節(jié)點(diǎn)的取值不是確定的,而是一個(gè)概率分布:當(dāng)縣名已知的情況下, 每一種地表覆蓋類型的取值概率為該類型在該縣內(nèi)的覆蓋面積與該縣面積的比例,故林火 節(jié)點(diǎn)需要基于"碎權(quán)樣本"進(jìn)行最大似然估計(jì)[18],假設(shè)X:。為地表覆蓋節(jié)點(diǎn),X fire3為林火節(jié) 點(diǎn),由于Χι。有13種取值狀態(tài),故將Di拆分為13個(gè)碎權(quán)樣本:
[0032]
[0033] 其中Xi為Χι。的某種取值,%為樣本(DiX^zxi)的權(quán)重,滿足約束條件: f;H· =1,w在實(shí)際數(shù)據(jù)中是已知的,其值為樣本Di所屬縣內(nèi)地表覆蓋類型&的覆蓋面積 ,=1 T' 、 與該縣總面積的比值,在林火節(jié)點(diǎn)Xfire的參數(shù)學(xué)習(xí)過(guò)程中,每個(gè)觀測(cè)樣本〇:都被13個(gè)完整的 碎權(quán)樣本所替代,記Μ為全部的碎權(quán)完整數(shù)據(jù),則Xfira的參數(shù)估計(jì)方法為:
[0034]
[0035] 其中mfire,jk為Dt中所有滿足Xfire = k且Ji(Xfire) = j的樣本的權(quán)重之和,mfire,j為Dt中 所有滿足:π (Xf ire) = j的樣本的權(quán)重之和;
[0036] 構(gòu)建貝葉斯網(wǎng)絡(luò)模型之后,需要進(jìn)行貝葉斯網(wǎng)絡(luò)推理計(jì)算縣級(jí)林火概率即后驗(yàn)概 率分布,即:已知網(wǎng)絡(luò)中縣名節(jié)點(diǎn)、FWI指數(shù)節(jié)點(diǎn)和月份節(jié)點(diǎn)的取值,月份節(jié)點(diǎn)的取值為證據(jù) 變量,記為Xe,計(jì)算林火發(fā)生節(jié)點(diǎn)查詢變量Xf ire的后驗(yàn)概率分布,進(jìn)行從原因到結(jié)果的預(yù)測(cè) 推理,應(yīng)用精確推理方法中的聯(lián)合樹算法(Junction Tree Algorith