本發(fā)明涉及氣象預(yù)測領(lǐng)域。更具體地說,本發(fā)明涉及一種復(fù)雜地貌大景區(qū)的景點(diǎn)氣象要素智能精細(xì)預(yù)測方法。
背景技術(shù):
旅游業(yè)是嚴(yán)重依賴自然環(huán)境和氣象條件的產(chǎn)業(yè),氣象條件是影響氣象景觀資源、旅游安全和旅游質(zhì)量的重要因素。準(zhǔn)確細(xì)致的旅游氣象的預(yù)測預(yù)報(bào)已經(jīng)成為氣象部門和旅游管理部門越來越關(guān)注的問題,如何及時(shí)準(zhǔn)確而又經(jīng)濟(jì)便捷地預(yù)報(bào)預(yù)測景區(qū)及周邊的氣象要素、氣候環(huán)境和惡劣天氣,如何準(zhǔn)確有效地做好旅游氣象預(yù)測預(yù)報(bào)預(yù)警服務(wù)、使其更好地幫助游客適時(shí)享受氣象景觀資源、規(guī)避旅游災(zāi)害風(fēng)險(xiǎn)和做到安全健康出行,提高旅游服務(wù)質(zhì)量,已經(jīng)成為發(fā)展現(xiàn)代旅游產(chǎn)業(yè)重要環(huán)節(jié)。
近年來,國家在旅游氣象服務(wù)方面做了大量的工作,各地學(xué)者和氣象部門在氣象要素監(jiān)測預(yù)測預(yù)報(bào),及氣候景觀、旅游舒適度等旅游氣象指數(shù)等方面也做了大量的理論研究與應(yīng)用服務(wù)(服務(wù)示范點(diǎn)、合作框架協(xié)議、中國天氣網(wǎng)等)。但是,目前氣象要素的預(yù)測預(yù)報(bào)多是根據(jù)國家氣象局從數(shù)值預(yù)報(bào)模式輸出產(chǎn)品中每天下發(fā)到地方氣象和旅游服務(wù)部門的格點(diǎn)數(shù)據(jù)進(jìn)行預(yù)測預(yù)報(bào)的,是以地理區(qū)劃進(jìn)行服務(wù)。盡管部分大型景區(qū)內(nèi)也設(shè)置了氣象自動(dòng)觀測站,但因建站和維護(hù)成本高而致使氣象自動(dòng)觀測站的設(shè)置數(shù)量有限,覆蓋面不全,預(yù)測時(shí)長較短,并不適合提供復(fù)雜地貌大景區(qū)氣象要素精細(xì)預(yù)測服務(wù)。由于某一局部地區(qū)受某一城區(qū)人口數(shù)量、生活和工業(yè)排放的變化,以及該地區(qū)地型地貌、湖泊和植被覆蓋率等周圍環(huán)境條件的影響,數(shù)值預(yù)報(bào)模式輸出產(chǎn)品、國家氣象局發(fā)布的旅游氣象預(yù)測數(shù)據(jù)和各氣象觀測站獲得的數(shù)據(jù)對某一地區(qū)的氣象要素變化較大,這樣因素都直接影響到該局部地區(qū)的氣象要素值。所以缺少針對旅游景區(qū)的復(fù)雜自然和社會(huì)環(huán)境進(jìn)行個(gè)性化精細(xì)化的氣象預(yù)測預(yù)報(bào)服務(wù),特別是復(fù)雜地貌的大型景區(qū)的具體景點(diǎn)更是不足,但其又相當(dāng)重要。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的是提供一種復(fù)雜地貌大景區(qū)的景點(diǎn)氣象要素智能精細(xì)預(yù)測方法,先建立目標(biāo)景點(diǎn)氣象要素的預(yù)測模型g,再采用該預(yù)測模型較高精度、較長預(yù)報(bào)時(shí)長地得到該景區(qū)內(nèi)景點(diǎn)的氣象要素預(yù)測數(shù)據(jù),以提供精細(xì)化個(gè)性化的氣象預(yù)測服務(wù),為游客出行、景區(qū)管理和災(zāi)害防控提供很好的決策支持。
為了實(shí)現(xiàn)根據(jù)本發(fā)明的這些目的和其它優(yōu)點(diǎn),提供了一種復(fù)雜地貌大景區(qū)的景點(diǎn)氣象要素智能精細(xì)預(yù)測方法,包括以下步驟:
步驟一、收集目標(biāo)景區(qū)的目標(biāo)景點(diǎn)的氣象要素?cái)?shù)據(jù),建立目標(biāo)景點(diǎn)的氣象要素歷史數(shù)據(jù)庫ohdb;收集與ohdb中的氣象要素?cái)?shù)據(jù)同期的目標(biāo)景區(qū)所在區(qū)域的格點(diǎn)化氣象要素?cái)?shù)據(jù),建立目標(biāo)景區(qū)所在區(qū)域的氣象要素歷史數(shù)據(jù)庫rhdb;收集國家氣象局發(fā)布的與ohdb中的氣象素?cái)?shù)據(jù)同期的目標(biāo)景區(qū)的氣象要素?cái)?shù)據(jù),建立目標(biāo)景區(qū)的氣象要素歷史數(shù)據(jù)庫thdb;
步驟二、根據(jù)目標(biāo)景點(diǎn)的實(shí)際情況,確定目標(biāo)景點(diǎn)的目標(biāo)氣象要素;將ohdb中的氣象要素?cái)?shù)據(jù)與rhdb中的氣象要素?cái)?shù)據(jù)和thdb中的氣象要素?cái)?shù)據(jù)進(jìn)行相關(guān)分析,提取與目標(biāo)景點(diǎn)的目標(biāo)氣象要素顯著相關(guān)的氣象要素,并從rhdb和thdb中提取與目標(biāo)景點(diǎn)的目標(biāo)氣象要素顯著相關(guān)的氣象要素對應(yīng)的氣象要素?cái)?shù)據(jù),建立目標(biāo)景點(diǎn)相關(guān)氣象要素?cái)?shù)據(jù)集rfs;
步驟三、對rfs中的氣象要素?cái)?shù)據(jù)進(jìn)行z-score標(biāo)準(zhǔn)化處理;
步驟四、對步驟三中得到的數(shù)據(jù)進(jìn)行核主成分分析,選取貢獻(xiàn)率較大的前2-6個(gè)主分量作為目標(biāo)景點(diǎn)主要相關(guān)氣象要素,從rfs中選出與目標(biāo)景點(diǎn)主要相關(guān)氣象要素對應(yīng)的氣象要素?cái)?shù)據(jù),建立目標(biāo)景點(diǎn)主要相關(guān)氣象要素?cái)?shù)據(jù)集dfs;
步驟五、以dfs中的數(shù)據(jù)作為數(shù)據(jù)樣本,使用基因表達(dá)式編程算法計(jì)算目標(biāo)景點(diǎn)的目標(biāo)氣象要素與目標(biāo)景點(diǎn)主要相關(guān)氣象要素的映射關(guān)系函數(shù),得到目標(biāo)景點(diǎn)氣象要素的預(yù)測模型g;
步驟六、收集待預(yù)測時(shí)段的目標(biāo)景區(qū)所在區(qū)域的格點(diǎn)化氣象要素的預(yù)測數(shù)據(jù)和目標(biāo)景區(qū)的氣象要素的預(yù)測數(shù)據(jù),并從中提取與目標(biāo)景點(diǎn)的目標(biāo)氣象要素顯著相關(guān)的氣象要素對應(yīng)的氣象要素的數(shù)據(jù),建立待預(yù)測目標(biāo)景點(diǎn)相關(guān)氣象要素?cái)?shù)據(jù)集xrfs;
步驟七、對xrfs中的氣象要素?cái)?shù)據(jù)進(jìn)行z-score標(biāo)準(zhǔn)化處理;
步驟八、對步驟七中得到的數(shù)據(jù)進(jìn)行核主成分分析,選取貢獻(xiàn)率較大的前2-6個(gè)主分量作為綜合預(yù)報(bào)因子,從xrfs中選出與綜合預(yù)報(bào)因子對應(yīng)的氣象要素?cái)?shù)據(jù),建立待預(yù)測目標(biāo)景點(diǎn)主要相關(guān)氣象要素?cái)?shù)據(jù)集xdfs;
步驟九、將xdfs中的數(shù)據(jù)帶入g中進(jìn)行計(jì)算,得到初步目標(biāo)景點(diǎn)氣象要素預(yù)測數(shù)據(jù),對初步目標(biāo)景點(diǎn)氣象要素預(yù)測數(shù)據(jù)進(jìn)行逆標(biāo)準(zhǔn)化處理,即得到目標(biāo)景點(diǎn)的氣象要素預(yù)測數(shù)據(jù)。
優(yōu)選的是,所述的復(fù)雜地貌大景區(qū)的景點(diǎn)氣象要素智能精細(xì)預(yù)測方法中,所述步驟一中收集目標(biāo)景區(qū)的目標(biāo)景點(diǎn)的氣象要素?cái)?shù)據(jù)的具體方法為:
在目標(biāo)景區(qū)內(nèi)待測的目標(biāo)景點(diǎn)處設(shè)置氣象要素觀測儀器或移動(dòng)氣象自動(dòng)站,每6小時(shí)統(tǒng)計(jì)并記錄一次該時(shí)間段內(nèi)各氣象要素的平均數(shù)據(jù),并持續(xù)至少一年。
優(yōu)選的是,所述的復(fù)雜地貌大景區(qū)的景點(diǎn)氣象要素智能精細(xì)預(yù)測方法中,所述步驟一中收集的目標(biāo)景區(qū)的目標(biāo)景點(diǎn)的氣象要素?cái)?shù)據(jù)包括:大氣溫度、相對濕度、風(fēng)向、風(fēng)速、雨量、氣壓、土壤溫度、土壤濕度、能見度、紫外線、特零地溫、云量、蒸發(fā)量、云高、雪深、日照輻射、霧以及霆相關(guān)的氣象要素?cái)?shù)據(jù)。
優(yōu)選的是,所述的復(fù)雜地貌大景區(qū)的景點(diǎn)氣象要素智能精細(xì)預(yù)測方法中,所述步驟五具體包括以下步驟:
步驟a、基因表達(dá)式編程算法程序讀入數(shù)據(jù)樣本,輸入種群大小、基因頭長度、基因尾長度、函數(shù)最大操目數(shù)、基因數(shù)、最大迭代數(shù)、最大適應(yīng)度值、變異率、插串率和重組率,基因表達(dá)式編程算法程序根據(jù)基因表達(dá)式編程染色體和基因的定義自動(dòng)生成初始種群;
步驟b、基因表達(dá)式編程算法程序進(jìn)行適應(yīng)度計(jì)算,以染色體為個(gè)體,并分別計(jì)算各個(gè)個(gè)體的適應(yīng)度,適應(yīng)度的計(jì)算公式如下:
其中,
ri為第i個(gè)體的適應(yīng)度,0≤ri≤1;
sse為殘差平方和;
m為目標(biāo)發(fā)生的氣象災(zāi)害的總記錄次數(shù);
yj為以第一預(yù)報(bào)因子中的數(shù)據(jù)作為數(shù)據(jù)樣本,其中存儲(chǔ)的第j次的氣象要素;
sst為總離差平方和;
步驟c、若步驟b中計(jì)算得到的個(gè)體的適應(yīng)度達(dá)到步驟a中輸入的最大適應(yīng)度值,則將種群中的最優(yōu)個(gè)體的表現(xiàn)型按樹的中序遍歷將表達(dá)樹解析為數(shù)學(xué)表達(dá)式,其中,在所有個(gè)體中適應(yīng)度最大的個(gè)體為最優(yōu)個(gè)體,所得數(shù)學(xué)表達(dá)式即為目標(biāo)景區(qū)的一種氣象災(zāi)害與主要?dú)庀笠刂g的映射關(guān)系函數(shù);若步驟b中計(jì)算得到的個(gè)體的適應(yīng)度未達(dá)到步驟a中輸入的最大適應(yīng)度值,則繼續(xù)
步驟d、以最優(yōu)個(gè)體作為最優(yōu)染色體,保留最優(yōu)染色體進(jìn)行遺傳操作,并根據(jù)達(dá)爾文的適者生存原則選擇產(chǎn)生下一代染色體,將得到的下一代染色體作為個(gè)體重復(fù)步驟b到步驟c。
優(yōu)選的是,所述的復(fù)雜地貌大景區(qū)的景點(diǎn)氣象要素智能精細(xì)預(yù)測方法中,所述步驟a中基因表達(dá)式編程算法的基因用長度固定的符串來表示,由頭部和尾部兩部分組成,頭部包含函數(shù)符號(hào)和終結(jié)符號(hào),尾部包含終結(jié)符號(hào),尾部長度t和頭部長度h之間滿足方程:t=h*(n-1)+1。
優(yōu)選的是,所述的復(fù)雜地貌大景區(qū)的景點(diǎn)氣象要素智能精細(xì)預(yù)測方法中,所述步驟a中的基因表達(dá)式編程算法程序采用多基因染色體的方式構(gòu)成染色體,每個(gè)氣象要素用一個(gè)基因表示。
優(yōu)選的是,所述的復(fù)雜地貌大景區(qū)的景點(diǎn)氣象要素智能精細(xì)預(yù)測方法中,所述步驟d中根據(jù)達(dá)爾文的適者生存原則產(chǎn)生下一代染色體的步驟為:
步驟1)、保留最優(yōu)染色體;
步驟2)、選擇染色體進(jìn)行復(fù)制,可選用輪盤賭選擇法或錦標(biāo)賽選擇法對染色體進(jìn)行選擇;
步驟3)、對步驟2)中得到的染色體依概率進(jìn)行交叉重組、變異、插串和倒串等遺傳操作,得到下一代染色體。
本發(fā)明至少包括以下有益效果:
本發(fā)明只需要收集待預(yù)測時(shí)段的目標(biāo)景區(qū)所在區(qū)域的格點(diǎn)化氣象要素的預(yù)測數(shù)據(jù)和目標(biāo)景區(qū)的氣象要素的預(yù)測數(shù)據(jù),對這些數(shù)據(jù)收集容易、成本低,免去了建立和維護(hù)眾多密集的景區(qū)景點(diǎn)氣象觀測站的成本。
本發(fā)明利用智能計(jì)算方法進(jìn)行景區(qū)局部氣象要素預(yù)測的非線性建模,比傳統(tǒng)線性回歸建模方法可更有效地將復(fù)雜地貌大景區(qū)局部氣象要素精細(xì)預(yù)測問題的復(fù)雜性轉(zhuǎn)化為數(shù)學(xué)關(guān)系函數(shù)。
本發(fā)明可應(yīng)用于各種環(huán)境,根據(jù)各地區(qū)不同的環(huán)境影響作用情況,得到該區(qū)域景點(diǎn)的目標(biāo)氣象要素與景點(diǎn)主要相關(guān)氣象要素的映射關(guān)系函數(shù),自動(dòng)建立景點(diǎn)氣象要素的預(yù)測模型,也可根據(jù)環(huán)境變化的需要重新執(zhí)行程序代碼,重新進(jìn)行自動(dòng)建模,適應(yīng)性強(qiáng),精確度高,計(jì)算過程相對簡單且不需要反復(fù)調(diào)試,具有廣泛應(yīng)用價(jià)值。
本發(fā)明的其它優(yōu)點(diǎn)、目標(biāo)和特征將部分通過下面的說明體現(xiàn),部分還將通過對本發(fā)明的研究和實(shí)踐而為本領(lǐng)域的技術(shù)人員所理解。
附圖說明
圖1為本發(fā)明所述的復(fù)雜地貌大景區(qū)的景點(diǎn)氣象要素智能精細(xì)預(yù)測方法的流程圖。
具體實(shí)施方式
下面結(jié)合附圖對本發(fā)明做進(jìn)一步的詳細(xì)說明,以令本領(lǐng)域技術(shù)人員參照說明書文字能夠據(jù)以實(shí)施。
<實(shí)施例1>
如圖1所示,本發(fā)明提供一種復(fù)雜地貌大景區(qū)的景點(diǎn)氣象要素智能精細(xì)預(yù)測方法,包括以下步驟:
步驟一、根據(jù)實(shí)際情況需要確定目標(biāo)景區(qū)中待預(yù)測的目標(biāo)景點(diǎn)的地理位置、要預(yù)測的氣象要素內(nèi)容和預(yù)測時(shí)長;通過在目標(biāo)景點(diǎn)臨時(shí)設(shè)置可移動(dòng)的氣象要素觀測傳感器或移動(dòng)氣象自動(dòng)站收集該景點(diǎn)兩年以上觀測到的各種氣象要素的每6小時(shí)平均歷史數(shù)據(jù),包括大氣溫度、相對濕度、風(fēng)向、風(fēng)速、雨量、氣壓、土壤溫度、土壤濕度、能見度、紫外線、特零地溫、云量、蒸發(fā)量、云高、雪深、日照輻射、霧以及霆等氣象要素,收集目標(biāo)景區(qū)的目標(biāo)景點(diǎn)的氣象要素?cái)?shù)據(jù),例如,以廣西大明山風(fēng)景區(qū)的天湖景點(diǎn)作為目標(biāo)景點(diǎn),則收集天湖景點(diǎn)的氣象要素?cái)?shù)據(jù),建立目標(biāo)景點(diǎn)的氣象要素歷史數(shù)據(jù)庫ohdb;收集與ohdb中的氣象要素?cái)?shù)據(jù)同期的目標(biāo)景區(qū)所在區(qū)域的格點(diǎn)化氣象要素?cái)?shù)據(jù),建立目標(biāo)景區(qū)所在區(qū)域的氣象要素歷史數(shù)據(jù)庫rhdb,例如,目標(biāo)是廣西大明山風(fēng)景區(qū),該景區(qū)主要位于南寧市北部的武鳴區(qū)內(nèi),大明山山體長68公里,寬23公里,橫跨武鳴、上林、馬山、賓陽四縣區(qū),則收集數(shù)值預(yù)報(bào)模式同期生成的武鳴、上林、馬山、賓陽四縣區(qū)的對應(yīng)的各種氣象要素?cái)?shù)據(jù);收集國家氣象局發(fā)布的與ohdb中的氣象素?cái)?shù)據(jù)同期的目標(biāo)景區(qū)的氣象要素?cái)?shù)據(jù),例如,以廣西大明山風(fēng)景區(qū)作為目標(biāo)景區(qū),則收集國家氣象局發(fā)布的與ohdb中的氣象素?cái)?shù)據(jù)同期的廣西大明山風(fēng)景區(qū)的氣象要素?cái)?shù)據(jù),建立目標(biāo)景區(qū)的氣象要素歷史數(shù)據(jù)庫thdb;
步驟二、根據(jù)目標(biāo)景點(diǎn)的實(shí)際情況,確定目標(biāo)景點(diǎn)的目標(biāo)氣象要素,例如,某景點(diǎn)的主要參考?xì)庀笠貫榻邓鈮?、濕度、風(fēng)向、風(fēng)速和地溫,則以上述氣象要素作為該景點(diǎn)的目標(biāo)氣象要素;將ohdb中的氣象要素?cái)?shù)據(jù)與rhdb中的氣象要素?cái)?shù)據(jù)和thdb中的氣象要素?cái)?shù)據(jù)進(jìn)行相關(guān)分析,提取與目標(biāo)景點(diǎn)的目標(biāo)氣象要素顯著相關(guān)的氣象要素,并從rhdb和thdb中提取與目標(biāo)景點(diǎn)的目標(biāo)氣象要素顯著相關(guān)的氣象要素對應(yīng)的氣象要素?cái)?shù)據(jù),建立目標(biāo)景點(diǎn)相關(guān)氣象要素?cái)?shù)據(jù)集rfs;例如,某景點(diǎn)的目標(biāo)氣象要素為降水、風(fēng)向、風(fēng)速和地溫,分別以降水、風(fēng)向、風(fēng)速和地溫作為該景點(diǎn)的目標(biāo)氣象要素,將ohdb中的氣象要素?cái)?shù)據(jù)與rhdb中的氣象要素?cái)?shù)據(jù)和thdb中的氣象要素?cái)?shù)據(jù)進(jìn)行相關(guān)分析,得到與降水、風(fēng)向、風(fēng)速和地溫各自顯著相關(guān)的氣象要素,并在rhdb和thdb中提取與之對應(yīng)的氣象要素?cái)?shù)據(jù),建立目標(biāo)景點(diǎn)相關(guān)氣象要素?cái)?shù)據(jù)集rfs;
下面以預(yù)測目標(biāo)氣象要素為廣西大明山景區(qū)天湖景點(diǎn)的特零地溫為例,提取目標(biāo)景點(diǎn)相關(guān)氣象要素?cái)?shù)據(jù)集rfs的過程是:
1)假設(shè)廣西大明山景區(qū)天湖景點(diǎn)的特零地溫為因變量y,其與rhdb、thdb中的可能相關(guān)的氣象要素自變量集合為
x={x1,x2,…,xn}
則其對應(yīng)歷史數(shù)據(jù)集可表示為:
其中,m為ohdb中特零地溫記錄數(shù);
n為rhdb、thdb中與特零地溫可能相關(guān)的氣象要素?cái)?shù);
xmn為目標(biāo)景區(qū)第m次記錄的第n種氣象要素的值;
ym為ohdb中第m次記錄的特零地溫值;
2)計(jì)算步驟1)中各與目標(biāo)氣象要素因變量y可能相關(guān)的氣象要素x之間的相關(guān)系數(shù),其公式為:
3)對步驟2)中計(jì)算所得的各變量相關(guān)系統(tǒng)進(jìn)行相關(guān)系數(shù)檢驗(yàn),從中選取通過給定信度檢驗(yàn)的相關(guān)性較好的氣象要素,即提取與目標(biāo)景點(diǎn)的目標(biāo)氣象要素顯著相關(guān)的氣象要素,作為目標(biāo)氣象要素的相關(guān)要素自變量;
4)并從rhdb和thdb中提取與目標(biāo)景點(diǎn)的目標(biāo)氣象要素顯著相關(guān)的氣象要素對應(yīng)的氣象要素?cái)?shù)據(jù),建立目標(biāo)景點(diǎn)相關(guān)氣象要素?cái)?shù)據(jù)集rfs;
步驟三、對rfs中的氣象要素?cái)?shù)據(jù)進(jìn)行z-score標(biāo)準(zhǔn)化處理,以消除每個(gè)因素變量的量綱不同對核主成分分析和對基因表達(dá)式編程建模帶來的影響。
步驟四、對步驟三中得到的數(shù)據(jù)進(jìn)行核主成分分析,選取貢獻(xiàn)率較大的前2-6個(gè)主分量作為目標(biāo)景點(diǎn)主要相關(guān)氣象要素,從rfs中選出與目標(biāo)景點(diǎn)主要相關(guān)氣象要素對應(yīng)的氣象要素?cái)?shù)據(jù),建立目標(biāo)景點(diǎn)主要相關(guān)氣象要素?cái)?shù)據(jù)集dfs;例如步驟二中提取到的與目標(biāo)景點(diǎn)的目標(biāo)氣象要素顯著相關(guān)的氣象要素為大氣溫度、相對濕度、風(fēng)向、風(fēng)速、雨量、氣壓、土壤溫度、土壤濕度、能見度、紫外線,則通過步驟三和步驟四的處理選取相對濕度、風(fēng)向、風(fēng)速和雨量這四個(gè)貢獻(xiàn)率較大的氣象要素作為目標(biāo)景點(diǎn)主要相關(guān)氣象要素,并從rfs中選出與濕度、風(fēng)向、風(fēng)速和雨量相對應(yīng)的氣象要素?cái)?shù)據(jù),建立dfs;
核主成分分析常用的核函數(shù)主要包括線性核函數(shù)、多項(xiàng)式核函數(shù)、高斯徑向基核函數(shù)和神經(jīng)網(wǎng)絡(luò)核函數(shù)等4類,在工程實(shí)施時(shí)可根據(jù)模型實(shí)驗(yàn)測試的最佳效果選定預(yù)測某一目標(biāo)氣象要素時(shí)最適合的核函數(shù)。本實(shí)施方案以選用高斯徑向基函數(shù)為核函數(shù)為例說明構(gòu)建核主成分分析法的實(shí)施過程:
a、將所獲得的n個(gè)指標(biāo)(每一指標(biāo)有m個(gè)樣品)的一批數(shù)據(jù)寫成一個(gè)(m×n)維數(shù)據(jù)矩陣:
b、計(jì)算核矩陣:選擇高斯徑向核函數(shù)中的參數(shù),公式為:
kμv:=(φ(xμ)·φ(xv))
c、修正核矩陣得到kμv,計(jì)算公式為:
d、運(yùn)用jacobi迭代方法計(jì)算kμv的特征值λ1,…,λn以及對應(yīng)的特征向量v1,…,vn;
e、對特征值按降序排序得λ1’,…,λn’,并調(diào)整特征向量得λ1',…,λn';
f、求單位正交化特征向量(用施密特正交法)得到α1,…,αn;
g、計(jì)算特征值的累積貢獻(xiàn)率b1,…,bn,根據(jù)給定的提取效率p,如果bt≥p,則提取t個(gè)主分量α1,…,αt;
h、計(jì)算已修正的核矩陣x在提取出的特征向量上的投影z,其中α=(α1,…,αt)。
以上步驟所得的投影z即為數(shù)據(jù)經(jīng)核主成分分析降維后所得數(shù)據(jù),即把原本rfs的n維數(shù)據(jù)降為了t維。該t維的主分量數(shù)據(jù)α=(α1,…,αt)就是預(yù)測對應(yīng)的目標(biāo)氣象要素模型的預(yù)測因子向量;
步驟五、以dfs中的數(shù)據(jù)作為數(shù)據(jù)樣本,使用基因表達(dá)式編程算法計(jì)算目標(biāo)景點(diǎn)的目標(biāo)氣象要素與目標(biāo)景點(diǎn)主要相關(guān)氣象要素的映射關(guān)系函數(shù),得到目標(biāo)景點(diǎn)氣象要素的預(yù)測模型g;根據(jù)得到的目標(biāo)景點(diǎn)的目標(biāo)氣象要素與目標(biāo)景點(diǎn)主要相關(guān)氣象要素的映射關(guān)系函數(shù),即可在已知與目標(biāo)景點(diǎn)主要相關(guān)氣象要素的數(shù)據(jù)后,計(jì)算目標(biāo)景點(diǎn)的目標(biāo)氣象要素的值;
步驟六、收集待預(yù)測時(shí)段的目標(biāo)景區(qū)所在區(qū)域的格點(diǎn)化氣象要素的預(yù)測數(shù)據(jù)和目標(biāo)景區(qū)的氣象要素的預(yù)測數(shù)據(jù),并從中提取與目標(biāo)景點(diǎn)的目標(biāo)氣象要素顯著相關(guān)的氣象要素對應(yīng)的氣象要素的數(shù)據(jù),建立待預(yù)測目標(biāo)景點(diǎn)相關(guān)氣象要素?cái)?shù)據(jù)集xrfs;例如需要預(yù)測某時(shí)間段某景點(diǎn)大氣溫度,與其顯著相關(guān)的氣象要素為目標(biāo)景區(qū)所在區(qū)域的格點(diǎn)化氣象要素中的氣壓、濕度、風(fēng)向、風(fēng)速和地溫,國家氣象局發(fā)布的該景點(diǎn)所在景區(qū)的氣象要素中的氣壓、濕度和風(fēng)向,則收集預(yù)測時(shí)段的該景區(qū)所在區(qū)域的格點(diǎn)化氣象要素的預(yù)測數(shù)據(jù)和目標(biāo)景區(qū)的氣象要素的預(yù)測數(shù)據(jù),并從該景區(qū)所在區(qū)域的格點(diǎn)化氣象要素的預(yù)測數(shù)據(jù)中提取氣壓、濕度、風(fēng)向、風(fēng)速和地溫的數(shù)據(jù),從國家氣象局發(fā)布的該景區(qū)氣象要素的預(yù)測數(shù)據(jù)中提取氣壓、濕度和風(fēng)向的數(shù)據(jù),建立xrfs;
步驟七、對xrfs中的氣象要素?cái)?shù)據(jù)進(jìn)行z-score標(biāo)準(zhǔn)化處理;
步驟八、對步驟七中得到的數(shù)據(jù)進(jìn)行核主成分分析,選取貢獻(xiàn)率較大的前2-6個(gè)主分量作為綜合預(yù)報(bào)因子,從xrfs中選出與綜合預(yù)報(bào)因子對應(yīng)的氣象要素?cái)?shù)據(jù),建立待預(yù)測目標(biāo)景點(diǎn)主要相關(guān)氣象要素?cái)?shù)據(jù)集xdfs;步驟七和步驟八的操作實(shí)質(zhì)上都是為了提高數(shù)據(jù)建模的模型泛化性能,z-score標(biāo)準(zhǔn)化處理是一種有效的降低原始數(shù)據(jù)取值范圍過大和部分?jǐn)?shù)據(jù)偏差太大而給所建模型的泛化性能帶來太多負(fù)面影響的有效方法;核主成分分析是一種有效的從對預(yù)測目標(biāo)影響程度大小不一的眾多的要素中重構(gòu)和提取若干主要的影響因子的方法,以這些主要影響因子建??杀苊馓鄬R饬x不大的要素和因子參加建模導(dǎo)致所得模型容易過擬合;
步驟九、將xdfs中的數(shù)據(jù)帶入g中進(jìn)行計(jì)算,得到初步目標(biāo)景點(diǎn)氣象要素預(yù)測數(shù)據(jù),對初步目標(biāo)景點(diǎn)氣象要素預(yù)測數(shù)據(jù)進(jìn)行逆標(biāo)準(zhǔn)化處理,即得到目標(biāo)景點(diǎn)氣象要素預(yù)測數(shù)據(jù);z-score標(biāo)準(zhǔn)化處理的逆標(biāo)準(zhǔn)化處理,經(jīng)過該處理后可使得氣象要素的預(yù)測數(shù)值與其觀測值在同一尺度上和取值范圍一致。
所述的復(fù)雜地貌大景區(qū)的景點(diǎn)氣象要素智能精細(xì)預(yù)測方法中,所述步驟一中收集目標(biāo)景區(qū)的目標(biāo)景點(diǎn)的氣象要素?cái)?shù)據(jù)的具體方法為:
在目標(biāo)景區(qū)內(nèi)待測的目標(biāo)景點(diǎn)處設(shè)置氣象要素觀測儀器或移動(dòng)氣象自動(dòng)站,每6小時(shí)統(tǒng)計(jì)并記錄一次該時(shí)間段內(nèi)各氣象要素的平均數(shù)據(jù),并持續(xù)至少一年。
所述的復(fù)雜地貌大景區(qū)的景點(diǎn)氣象要素智能精細(xì)預(yù)測方法中,所述步驟一中收集的目標(biāo)景區(qū)的目標(biāo)景點(diǎn)的氣象要素?cái)?shù)據(jù)包括:大氣溫度、相對濕度、風(fēng)向、風(fēng)速、雨量、氣壓、土壤溫度、土壤濕度、能見度、紫外線、特零地溫、云量、蒸發(fā)量、云高、雪深、日照輻射、霧以及霆相關(guān)的氣象要素?cái)?shù)據(jù)。
所述的復(fù)雜地貌大景區(qū)的景點(diǎn)氣象要素智能精細(xì)預(yù)測方法中,所述步驟五具體包括以下步驟:
步驟a、基因表達(dá)式編程算法程序讀入數(shù)據(jù)樣本,輸入種群大小、基因頭長度、基因尾長度、函數(shù)最大操目數(shù)、基因數(shù)、最大迭代數(shù)、最大適應(yīng)度值、變異率、插串率和重組率,基因表達(dá)式編程算法程序根據(jù)基因表達(dá)式編程染色體和基因的定義自動(dòng)生成初始種群;
步驟b、基因表達(dá)式編程算法程序進(jìn)行適應(yīng)度計(jì)算,以染色體為個(gè)體,并分別計(jì)算各個(gè)個(gè)體的適應(yīng)度,適應(yīng)度的計(jì)算公式如下:
其中,
ri為第i個(gè)體的適應(yīng)度,0≤ri≤1;
sse為殘差平方和;
m為ohdb中的存儲(chǔ)的待測要素的相關(guān)歷史數(shù)據(jù)記錄數(shù);
yj為以第一預(yù)報(bào)因子中的數(shù)據(jù)作為數(shù)據(jù)樣本,其中存儲(chǔ)的第j次的氣象要素;
sst為總離差平方和;
步驟c、若步驟b中計(jì)算得到的個(gè)體的適應(yīng)度達(dá)到步驟a中輸入的最大適應(yīng)度值,則將種群中的最優(yōu)個(gè)體的表現(xiàn)型按樹的中序遍歷將表達(dá)樹解析為數(shù)學(xué)表達(dá)式,其中,在所有個(gè)體中適應(yīng)度最大的個(gè)體為最優(yōu)個(gè)體,所得數(shù)學(xué)表達(dá)式即為目標(biāo)景區(qū)的一種氣象災(zāi)害與主要?dú)庀笠刂g的映射關(guān)系函數(shù);若步驟b中計(jì)算得到的個(gè)體的適應(yīng)度未達(dá)到步驟a中輸入的最大適應(yīng)度值,則繼續(xù)
步驟d、以最優(yōu)個(gè)體作為最優(yōu)染色體,保留最優(yōu)染色體進(jìn)行遺傳操作,并根據(jù)達(dá)爾文的適者生存原則選擇產(chǎn)生下一代染色體,將得到的下一代染色體作為個(gè)體重復(fù)步驟b到步驟c。
所述的復(fù)雜地貌大景區(qū)的景點(diǎn)氣象要素智能精細(xì)預(yù)測方法中,所述步驟a中基因表達(dá)式編程算法的基因用長度固定的符串來表示,由頭部和尾部兩部分組成,頭部包含函數(shù)符號(hào)和終結(jié)符號(hào),尾部包含終結(jié)符號(hào),尾部長度t和頭部長度h之間滿足方程:t=h*(n-1)+1。
所述的復(fù)雜地貌大景區(qū)的景點(diǎn)氣象要素智能精細(xì)預(yù)測方法中,所述步驟a中的基因表達(dá)式編程算法程序采用多基因染色體的方式構(gòu)成染色體,每個(gè)氣象要素用一個(gè)基因表示。
所述的復(fù)雜地貌大景區(qū)的景點(diǎn)氣象要素智能精細(xì)預(yù)測方法中,所述步驟d中根據(jù)達(dá)爾文的適者生存原則產(chǎn)生下一代染色體的步驟為:
步驟1)、保留最優(yōu)染色體;
步驟2)、選擇染色體進(jìn)行復(fù)制,可選用輪盤賭選擇法或錦標(biāo)賽選擇法對染色體進(jìn)行選擇;
步驟3)、對步驟2)中得到的染色體依概率進(jìn)行交叉重組、變異、插串和倒串等遺傳操作,得到下一代染色體。
<實(shí)施例2>
(1)根據(jù)業(yè)務(wù)需要確定目標(biāo)景區(qū)中待觀測預(yù)測的目標(biāo)景點(diǎn)地理位置、要預(yù)測的氣象要素內(nèi)容和預(yù)測時(shí)長。
(2)通過在該位置臨時(shí)設(shè)置各種可移動(dòng)的氣象要素觀測傳感器或移動(dòng)氣象自動(dòng)站收集該位置兩年以上觀測到的各種氣象要素的每6小時(shí)平均歷史數(shù)據(jù),這些歷史數(shù)據(jù)包括大氣溫度、相對濕度、風(fēng)向、風(fēng)速、雨量、氣壓、土壤溫度、土壤濕度、能見度、紫外線、特零地溫、云量、蒸發(fā)量、云高、雪深、日照輻射、霧以及霆等相關(guān)要素,以及發(fā)生的時(shí)間和具體位置等信息,構(gòu)建目標(biāo)景點(diǎn)的氣象要素歷史數(shù)據(jù)庫ohdb;
(3)收集數(shù)值預(yù)報(bào)模式輸出產(chǎn)品(如t639和grapes等)關(guān)于待預(yù)測景區(qū)所屬地理區(qū)域的格點(diǎn)氣象要素歷史數(shù)據(jù)。例如,待預(yù)測景區(qū)是廣西大明山風(fēng)景區(qū),該景區(qū)主要位于南寧市北部的武鳴區(qū)內(nèi),大明山山體長68公里,寬23公里,橫跨武鳴、上林、馬山、賓陽四縣區(qū)。則收集數(shù)值預(yù)報(bào)模式同期生成的武鳴、上林、馬山、賓陽四縣區(qū)的對應(yīng)各層次各種氣象要素?cái)?shù)據(jù)。并將以上氣象要素?cái)?shù)據(jù)構(gòu)建目標(biāo)景區(qū)所在區(qū)域的氣象要素歷史數(shù)據(jù)庫rhdb;
(4)收集國家氣象局發(fā)布的同期的關(guān)于目標(biāo)景區(qū)各種旅游氣象要素歷史數(shù)據(jù)。并將以上氣象要素?cái)?shù)據(jù)構(gòu)建目標(biāo)景區(qū)的氣象要素歷史數(shù)據(jù)庫thdb;
(5)將ohdb中的目標(biāo)景區(qū)待測景點(diǎn)位置待測氣象要素與rhdb、thdb中的氣象要素歷史數(shù)據(jù)進(jìn)行相關(guān)分析,提取與目標(biāo)景點(diǎn)位置的目標(biāo)氣象要素顯著相關(guān)的氣象要素?cái)?shù)據(jù),構(gòu)建目標(biāo)相關(guān)氣象要素集rfs;
下面以預(yù)測目標(biāo)氣象要素為廣西大明山景區(qū)天湖景點(diǎn)的特零地溫為例,提取其相關(guān)氣象要素集rfs的過程是:
①假設(shè)廣西大明山景區(qū)天湖景點(diǎn)的特零地溫為因變量y,其與ohdb、rhdb、thdb中的可能相關(guān)的氣象要素自變量集合為x={x1,x2,...,xn},則其對應(yīng)歷史數(shù)據(jù)集可表示為:
i=1,2,…,m和j=1,2,…,n,其中m為ohdb中某氣象要素的記錄數(shù),n為與目標(biāo)氣象要素可能相關(guān)的氣象要素?cái)?shù)。
②計(jì)算上述各與目標(biāo)氣象要素因變量y可能相關(guān)的氣象要素xi之間的相關(guān)系數(shù),其公式為:
③對上述計(jì)算所得的各變量相關(guān)系統(tǒng)進(jìn)行相關(guān)系數(shù)檢驗(yàn),從中選取通過給定信度檢驗(yàn)的相關(guān)性較好的各氣象要素作為目標(biāo)氣象要素相關(guān)要素自變量。
④整理上述步驟選取出來的各相關(guān)氣象要素自變量和相應(yīng)的因變量,構(gòu)建目標(biāo)景區(qū)待測景點(diǎn)位置待測氣象要素影響因子集rfs。
(6)對步驟(5)選取出來的待測氣象要素影響因子集rfs的數(shù)據(jù)進(jìn)行z-score標(biāo)準(zhǔn)化處理,以消除每個(gè)因素變量的量綱不同對核主成分分析和對基因表達(dá)式編程建模帶來的影響;
(7)對經(jīng)過標(biāo)準(zhǔn)化處理的時(shí)序數(shù)據(jù)進(jìn)行核主成分分析,選擇貢獻(xiàn)率較大的前t(建議2<t<6)個(gè)主分量作為預(yù)報(bào)因子;
核主成分分析常用的核函數(shù)主要包括線性核函數(shù)、多項(xiàng)式核函數(shù)、高斯徑向基核函數(shù)和神經(jīng)網(wǎng)絡(luò)核函數(shù)等4類,在工程實(shí)施時(shí)可根據(jù)模型實(shí)驗(yàn)測試的最佳效果選定預(yù)測某一目標(biāo)氣象要素時(shí)最適合的核函數(shù)。本實(shí)施方案以選用高斯徑向基函數(shù)為核函數(shù)為例說明構(gòu)建核主成分分析法的實(shí)施過程:
核主成分分析常用的核函數(shù)主要包括線性核函數(shù)、多項(xiàng)式核函數(shù)、高斯徑向基核函數(shù)和神經(jīng)網(wǎng)絡(luò)核函數(shù)等4類,在工程實(shí)施時(shí)可根據(jù)模型實(shí)驗(yàn)測試的最佳效果選定預(yù)測某一目標(biāo)氣象要素時(shí)最適合的核函數(shù)。本實(shí)施方案以選用高斯徑向基函數(shù)為核函數(shù)為例說明構(gòu)建核主成分分析法的實(shí)施過程:
a、將所獲得的n個(gè)指標(biāo)(每一指標(biāo)有m個(gè)樣品)的一批數(shù)據(jù)寫成一個(gè)(m×n)維數(shù)據(jù)矩陣:
b、計(jì)算核矩陣:選擇高斯徑向核函數(shù)中的參數(shù),公式為:
kμv:=(φ(xμ)·φ(xv))
c、修正核矩陣得到kμv,公式為:
d、運(yùn)用jacobi迭代方法計(jì)算kμv的特征值λ1,…,λn以及對應(yīng)的特征向量v1,…,vn;
e、對特征值按降序排序得λ1’,…,λn’,并調(diào)整特征向量得λ1',…,λn';
f、求單位正交化特征向量(用施密特正交法)得到α1,…,αn;
g、計(jì)算特征值的累積貢獻(xiàn)率b1,…,bn,根據(jù)給定的提取效率p,如果bt≥p,則提取t個(gè)主分量α1,…,αt;
h、計(jì)算已修正的核矩陣x在提取出的特征向量上的投影z,其中α=(α1,…,αt)。
以上步驟所得的投影z即為數(shù)據(jù)經(jīng)核主成分分析降維后所得數(shù)據(jù),即把原本rfs的n維數(shù)據(jù)降為了t維。該t維的主分量數(shù)據(jù)α=(α1,…,αt)就是預(yù)測對應(yīng)的目標(biāo)氣象要素模型的預(yù)測因子向量;
(8)選取上述步驟(7)所得的t個(gè)預(yù)測因子向量作為新的輸入樣本集數(shù)據(jù)輸入,開始基因表達(dá)式編程的氣象要素?cái)?shù)據(jù)的函數(shù)挖掘過程,所獲得的函數(shù)模型即為該目標(biāo)氣象要素的預(yù)測模型,具體包括以下步驟:
第一步:讀入樣本數(shù)據(jù),輸入種群大小、基因頭長度、基因尾長度、函數(shù)最大操目數(shù)、基因數(shù)、最大迭代數(shù)、最大適應(yīng)度值、變異率、插串率、重組率,系統(tǒng)根據(jù)基因表達(dá)式編程染色體和基因的定義自動(dòng)生成初始種群;
其中,基因表達(dá)式編程的基因用長度固定的符串來表示,由頭和尾兩部分組成,頭部既可以包含函數(shù)符號(hào)也可以包含終結(jié)符號(hào),而尾部則只能包含終結(jié)符號(hào),且尾部長度t和頭部長度h之間應(yīng)該滿足方程:t=h*(n-1)+1;本發(fā)明預(yù)報(bào)氣象要素的數(shù)據(jù)對象是多元時(shí)間序列數(shù)據(jù),在染色體構(gòu)成采用多基因染色體的方式,每個(gè)主要?dú)庀笠蜃佑靡粋€(gè)基因表示。
第二步:適應(yīng)度計(jì)算指定各個(gè)個(gè)體(即染色體)的適應(yīng)度;
本發(fā)明的適應(yīng)度函數(shù)選用復(fù)相關(guān)系數(shù),定義如下:
其中,
ri為第i個(gè)體的適應(yīng)度,0≤ri≤1;
sse為殘差平方和;
m為ohdb中的存儲(chǔ)的待測要素的相關(guān)歷史數(shù)據(jù)記錄數(shù);
yj為以第一預(yù)報(bào)因子中的數(shù)據(jù)作為數(shù)據(jù)樣本,其中存儲(chǔ)的第j次的氣象要素;
sst為總離差平方和;
第三步:若不符合結(jié)束條件,繼續(xù)下一步,否則跳到第五步;
其中,本發(fā)明的結(jié)束條件為最大適應(yīng)度值達(dá)到要求;
第四步:保留最優(yōu)染色體,進(jìn)行遺傳操作,并根據(jù)達(dá)爾文的“適者生存”原則選擇產(chǎn)生下一代,其過程如下:
①保留最優(yōu)染色體;
②選擇染色體進(jìn)行復(fù)制,可選用輪盤賭選擇法或錦標(biāo)賽選擇法對染色體進(jìn)行選擇;
③對②選擇和復(fù)制染色體的結(jié)果依概率進(jìn)行交叉重組、變異、插串、倒串等遺傳操作。
轉(zhuǎn)到第二步。
第五步:將種群中的最優(yōu)染色體的表現(xiàn)型按樹的中序遍歷將表達(dá)樹解析為數(shù)學(xué)表達(dá)式,所得數(shù)學(xué)表達(dá)式即為所求解的氣象要素與其主要預(yù)測因子的映射關(guān)系函數(shù)模型。
(9)輸入數(shù)值預(yù)報(bào)模式輸出產(chǎn)品關(guān)于待預(yù)測景區(qū)所屬地理區(qū)域的對應(yīng)各層次各種的格點(diǎn)氣象要素目標(biāo)時(shí)段預(yù)報(bào)數(shù)據(jù)和國家氣象局發(fā)布的關(guān)于目標(biāo)景區(qū)各種旅游氣象要素目標(biāo)時(shí)段預(yù)報(bào)數(shù)據(jù),按照步驟(5)結(jié)果初步篩選強(qiáng)影響因子,并進(jìn)行步驟(6)和步驟(7)操作。
(10)將步驟(9)結(jié)果輸入到步驟(8)所獲得的預(yù)測模型,并將結(jié)果進(jìn)行逆標(biāo)準(zhǔn)化處理得到真正的目標(biāo)氣象要素預(yù)測結(jié)果。
盡管本發(fā)明的實(shí)施方案已公開如上,但其并不僅僅限于說明書和實(shí)施方式中所列運(yùn)用,它完全可以被適用于各種適合本發(fā)明的領(lǐng)域,對于熟悉本領(lǐng)域的人員而言,可容易地實(shí)現(xiàn)另外的修改,因此在不背離權(quán)利要求及等同范圍所限定的一般概念下,本發(fā)明并不限于特定的細(xì)節(jié)和這里示出與描述的圖例。