一種基于模糊決策樹的航站樓離港旅客流量預(yù)測方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及航站樓離港旅客流量預(yù)測領(lǐng)域,特別涉及一種基于模糊決策樹的航站 樓離港旅客流量預(yù)測方法。
【背景技術(shù)】
[0002] 目前,民用航空領(lǐng)域交通壓力持續(xù)增長造成了航站樓擁堵的現(xiàn)象,因此要實現(xiàn)航 站樓的高效率運作就對到達航站樓的旅客流量預(yù)測提出了更高的要求。國內(nèi)對于旅客在短 時間內(nèi)到達的預(yù)測研宄還處于起步階段,由于短時間內(nèi)的旅客流量具有很強的隨機性和非 線性,給預(yù)測帶來了很大的困難。目前已有多種方法被用來預(yù)測旅客流量,包括支持向量回 歸模型、BP神經(jīng)網(wǎng)絡(luò)模型、FIR神經(jīng)網(wǎng)絡(luò)模型等,這些方法各有利弊,如神經(jīng)網(wǎng)絡(luò)可以很好 地描述流量的非線性,但也具有尋優(yōu)速度慢、實時性差、推廣能力低等不足的缺點,支持向 量回歸模型具有全局優(yōu)化,推廣性能好等優(yōu)點,但應(yīng)用較為繁瑣,效率不高,都還不能滿足 簡潔準確的預(yù)測要求。
【發(fā)明內(nèi)容】
[0003] 本發(fā)明的目的是為了解決現(xiàn)有技術(shù)在解決民用航空領(lǐng)域交通壓力持續(xù)增長造成 了航站樓擁堵的現(xiàn)象中尋優(yōu)速度慢、實時性差、推廣能力低、應(yīng)用較為繁瑣、效率不高以及 不能滿足簡潔準確的預(yù)測要求的問題而提出的一種基于模糊決策樹的航站樓離港旅客流 量預(yù)測方法。
[0004] 上述的發(fā)明目的是通過以下技術(shù)方案實現(xiàn)的:
[0005] 步驟一、將航班數(shù)量、時間點和日期的具體值代入隸屬度函數(shù)運算后轉(zhuǎn)化為[0, 1] 區(qū)間的隸屬度數(shù)據(jù);
[0006] 步驟二、計算航班數(shù)量、時間點和日期的模糊信息熵H (A),選取模糊信息熵最小的 屬性作為模糊決策樹的根結(jié)點;
[0007] 步驟三、利用步驟一獲得的隸屬度數(shù)據(jù)中的60%?80%,運用決策樹算法和根結(jié) 點建立模糊決策樹,得到屬性為旅客流量等級分類頻度的葉子結(jié)點,將旅客流量等級分類 頻度的葉子結(jié)點中最大的兩項分類頻度之和定義為葉子結(jié)點的聯(lián)合置信度入;
[0008] 步驟四、給定基準聯(lián)合置信度X。,若葉子結(jié)點的聯(lián)合置信度A滿足,則結(jié) 束拓展并把該葉子結(jié)點的聯(lián)合置信度A定為旅客流量等級概率;
[0009] 步驟五、若葉子結(jié)點的聯(lián)合置信度X < X。,則重復(fù)進行步驟三直至葉子結(jié)點滿足 入〉^為止;此時葉子結(jié)點為最終葉子結(jié)點,最終葉子結(jié)點的聯(lián)合置信度X即為最終旅客 流量等級概率;從而得到模糊決策樹;
[0010] 步驟六、步驟一獲得的隸屬度數(shù)據(jù)的20%?40%檢驗?zāi):龥Q策樹,即將20%? 40 %的隸屬度數(shù)據(jù)代入模糊決策樹中,得到旅客流量等級概率,根據(jù)旅客流量等級概率確 定旅客流量等級,即分別用旅客流量等級中位數(shù)乘以該等級的概率,加和獲得旅客流量,確 定最終得到的基于模糊決策樹的旅客流量預(yù)測等級,將最終得到的基于模糊決策樹的旅客 流量預(yù)測等級與真實旅客流量等級進行對比,即計算基于模糊決策樹的旅客流量預(yù)測等級 與真實流量等級為同一等級的概率,當該概率值達到80%及以上時,說明建立的模糊決策 樹準確性高,確定得到模糊決策樹用來預(yù)測旅客流量等級;即完成了一種基于模糊決策樹 的航站樓離港旅客流量預(yù)測方法。
[0011] 發(fā)明效果
[0012] 模糊決策樹方法是歸納學習領(lǐng)域中的一個重要分支,在道路短時交通流量預(yù)測領(lǐng) 域已有少量應(yīng)用,在航站樓離港旅客流量預(yù)測領(lǐng)域目前還沒有應(yīng)用。模糊決策樹的基礎(chǔ)是 統(tǒng)計理論,它從一個統(tǒng)計得到的示例表出發(fā)依據(jù)某種啟發(fā)式信息,產(chǎn)生一棵模糊決策樹,并 使用由決策樹轉(zhuǎn)化的規(guī)則組預(yù)測待定事件。它在知識的歸納過程中并入了認識上的不確定 性,使歸納出的知識在容許不精確或沖突的信息方面更穩(wěn)健。
[0013] 與現(xiàn)有技術(shù)相比,本發(fā)明的特點和積極效果在于:(1)本發(fā)明將所有影響離港旅 客流量的因素量化成[0,1]區(qū)間的數(shù)值,按照統(tǒng)計學思想建立模糊決策樹,進行現(xiàn)有數(shù)據(jù) 的統(tǒng)計和分析,且將數(shù)據(jù)合理分類用于建立規(guī)則和檢驗規(guī)則,從而解決尋優(yōu)速度慢和效率 不高的問題,(2)統(tǒng)計每30分鐘的數(shù)據(jù),具有實時性強的優(yōu)點,若實際應(yīng)用中需要更精確的 預(yù)測,將所得數(shù)據(jù)重新劃分即可。(3)計算過程簡單,推廣性能好,預(yù)測過程簡潔,結(jié)果較為 準確。
[0014] 并且從圖3中可以看出,預(yù)測等級曲線與真實等級曲線擬合效果較好,預(yù)測流量 等級與真實流量等級為同一等級的概率為78. 33%,預(yù)測流量等級與真實流量等級相差不 大于一個等級的概率達到93. 33%,預(yù)測流量等級與真實流量等級相差不大于兩個等級的 概率達到98. 33 %,這表明通過模糊決策樹的旅客流量等級預(yù)測較為準確。在模糊決策樹的 基礎(chǔ)上進行適當?shù)母倪M,運用這種方法分析各種因素的變化對旅客流量的影響,從而將其 應(yīng)用到航站樓旅客流量預(yù)測的領(lǐng)域顯得尤為重要且可行。
【附圖說明】
[0015] 圖1為【具體實施方式】一提出的一種基于模糊決策樹的航站樓離港旅客流量預(yù)測 方法流程圖;
[0016] 圖2為實施例提出的模糊決策樹示意圖;
[0017] 圖3為實施例提出的旅客流量等級的預(yù)測效果檢驗圖;
[0018] 圖4為實施例提出的旅客流量分析與預(yù)測流程圖。
【具體實施方式】
【具體實施方式】 [0019] 一:本實施方式的一種基于模糊決策樹的航站樓離港旅客流量預(yù)測 方法,具體是按照以下步驟制備的:
[0020] 步驟一、將附帶屬性的統(tǒng)計數(shù)據(jù)經(jīng)過模糊化預(yù)處理,即將航班數(shù)量、時間點和日期 的具體值代入隸屬度函數(shù)運算后轉(zhuǎn)化為[0, 1]區(qū)間的隸屬度數(shù)據(jù);其中,屬性包括航班數(shù) 量、時間點和日期;
[0021] 步驟二、計算航班數(shù)量、時間點和日期的模糊信息熵H(A),選取模糊信息熵最小的 屬性作為模糊決策樹的根結(jié)點;
[0022] 步驟三、利用步驟一獲得的隸屬度數(shù)據(jù)中的60 %?80%,運用決策樹算法和根結(jié) 點建立模糊決策樹,得到屬性為旅客流量等級分類頻度的葉子結(jié)點,將旅客流量等級分類 頻度的葉子結(jié)點中最大的兩項分類頻度之和定義為葉子結(jié)點的聯(lián)合置信度A;原因在于 決策樹在決策領(lǐng)域運用中使用的置信度0取值較大,則在預(yù)測流量時會造成大量信息的 缺失,直接導(dǎo)致預(yù)測失效,為避免這種情況的發(fā)生提出了聯(lián)合置信度A的定義;
[0023] 步驟四、給定基準聯(lián)合置信度X。,若葉子結(jié)點的聯(lián)合置信度X滿足,則結(jié) 束拓展并把該葉子結(jié)點的聯(lián)合置信度A定為旅客流量等級概率;
[0024] 步驟五、若葉子結(jié)點的聯(lián)合置信度X<X。,則重復(fù)進行步驟三直至葉子結(jié)點滿足 入〉^為止;此時葉子結(jié)點為最終葉子結(jié)點,最終葉子結(jié)點的聯(lián)合置信度X即為最終旅客 流量等級概率;若按照全部屬性擴展之后A<Ac),則標記該葉子結(jié)點為無效結(jié)點;從而得 到模糊決策樹;
[0025] 步驟六、步驟一獲得的隸屬度數(shù)據(jù)的20%?40%檢驗?zāi):龥Q策樹,即將20%? 40 %的隸屬度數(shù)據(jù)代入模糊決策樹中,得到旅客流量等級概率,根據(jù)旅客流量等級概率確 定旅客流量等級,即分別用旅客流量等級中位數(shù)乘以該等級的概率,加和獲得旅客流量,確 定該旅客流量等級,即為最終得到的基于模糊決策樹的旅客流量預(yù)測等級,將最終得到的 基于模糊決策樹的旅客流量預(yù)測等級與真實旅客流量等級進行對比,即計算基于模糊決策 樹的旅客流量預(yù)測等級與真實流量等級為同一等級的概率,當該概率值達到80%及以上 時,說明建立的模糊決策樹準確性高,確定得到模糊決策樹用來預(yù)測旅客流量等級,否則該 模糊決策樹無效;如圖1 ;即完成了一種基于模糊決策樹的航站樓離港旅客流量預(yù)測方法。