本發(fā)明涉及一種用于分析航班旅客機票海量數(shù)據(jù)庫存的方法和計算機程序產(chǎn)品。
背景技術(shù):
航空公司擁有關(guān)于在過去所執(zhí)行的航班的大規(guī)模的信息。這些信息中的至少一部分被存放在航班旅客機票海量數(shù)據(jù)庫存中。在這些數(shù)據(jù)庫存中,對于每個單個的由航空公司所銷售的機票都存在數(shù)據(jù)集,其中數(shù)據(jù)集例如包括關(guān)于航班線路、航班日期以及機票價格的信息。
尤其是也由于在民用航空的領(lǐng)域中所進行的企業(yè)集中(所述企業(yè)集中已導(dǎo)致具有大的線路網(wǎng)和非常多的航班架次的基本上全球起作用的航空公司),航空公司的航班旅客機票海量數(shù)據(jù)庫存經(jīng)常具有相當(dāng)大的規(guī)模、尤其是在其中海量數(shù)據(jù)庫存持續(xù)多于一個日歷年的情況下具有相當(dāng)大的規(guī)模。
在每個航空公司中都經(jīng)常存在對從相應(yīng)的航班旅客機票海量數(shù)據(jù)庫存確定如下信息的濃厚興趣,所述信息可用作企業(yè)決策的基礎(chǔ)。可屬于這些決策的是:在航班計劃上的變化(例如線路的取消、起飛時間也或者到達時間的變化、在各個線路上的頻率的變化、在確定的線路上所采用的飛機的變化等等)、機群計劃(例如退役或采購確定的大小和作用距離的飛機)或者制訂對于新的飛機的要求規(guī)范,所述要求規(guī)范接著可以作為新研發(fā)的出發(fā)點被提供給飛機制造商。
為此,在現(xiàn)有技術(shù)中公知的是從航班旅客機票海量數(shù)據(jù)庫存確定各個特征數(shù)。這樣,針對預(yù)給定的線路的在預(yù)給定的時間段中的總收入例如可以通過將來自航班旅客機票海量數(shù)據(jù)庫存的滿足相對應(yīng)的邊界條件的數(shù)據(jù)集的機票價格加和來確定。也可以確定在確定的線路上在預(yù)給定的時間段中所運送的旅客的數(shù)目。通過關(guān)聯(lián)所述兩個信息可以計算每個所運送的旅客的平均收入。(平均)收入也可以針對每個運送等級(例如“頭等艙(First)”、“商務(wù)艙(Business)”、“經(jīng)濟艙(Economy)”)分開地來確定,然而這導(dǎo)致了特征數(shù)的數(shù)目的相對應(yīng)的增加。
為了為上面所提及的決策奠定主觀假定地(vermeintlich)足夠的并且牢固的基礎(chǔ),必須針對所有在至少一年之內(nèi)的、通常甚至超過一年的由航空公司所執(zhí)行的航班來確定所提到的特征數(shù)。由于航班旅客機票海量數(shù)據(jù)庫存的如其常有的純粹的大小,為了相對應(yīng)地確定這些特征數(shù),性能特別強的計算機是必要的,所述計算機為此仍然需要相當(dāng)大的時間段。
由于這些技術(shù)上的現(xiàn)實情況,對航班旅客機票海量數(shù)據(jù)庫存的分析在現(xiàn)有技術(shù)中一般僅僅限于特征數(shù)的預(yù)給定的集合的確定,所述特征數(shù)接著作為靜態(tài)值被輸送給另一統(tǒng)計分析。在此,所確定的特征數(shù)的集合被選擇為使得其數(shù)目也可以由性能不那么強的計算機來進一步處理。
對于策略上的決策來說,將所確定的特征數(shù)與所假設(shè)的或策略上所估計的修正因子結(jié)合。然而,依據(jù)航班旅客機票海量數(shù)據(jù)庫存全面地檢查修正因子的合理性在此實際上是不可能的。為此,也就是對航班旅客機票海量數(shù)據(jù)庫存的十分耗時的、束縛人力資源并且計算密集的數(shù)據(jù)分析會是必要的,所述數(shù)據(jù)分析原則上只可在性能極其強的計算機上被執(zhí)行而且本身會在那里需要相當(dāng)大的時間段。因為用于相對應(yīng)的數(shù)據(jù)分析的相對應(yīng)的計算機能力在航空公司的情況下經(jīng)常不可用,所以在現(xiàn)有技術(shù)中原則上省去相對應(yīng)的檢查。由于缺少實際上的使用可能性而在現(xiàn)有技術(shù)中還不曾存在如下模型,利用所述模型,適合于所提到的目的的數(shù)據(jù)分析會是可能的。
因此,在現(xiàn)有技術(shù)中,對大的航班旅客機票海量數(shù)據(jù)庫存的分析由于計算能力的限制經(jīng)常限于確定預(yù)給定的特征參量的集合。然而,這些特征數(shù)是靜態(tài)參量,從所述靜態(tài)參量出發(fā)只能主觀地估計例如以應(yīng)該用來考慮例如被改變的市場條件的“策略上的減價”的形式的改變。在現(xiàn)有技術(shù)中,進一步的信息由于經(jīng)常受限的計算能力而不能從航班旅客機票海量數(shù)據(jù)庫存中獲得。
技術(shù)實現(xiàn)要素:
因而,本發(fā)明所基于的任務(wù)在于:提供一種方法以及一種設(shè)備,所述方法消除或者至少減少來自現(xiàn)有技術(shù)的缺點。
該任務(wù)通過按照獨立權(quán)利要求所述的方法以及按照獨立權(quán)利要求12所述的計算機程序產(chǎn)品來解決。有利的改進方案是從屬權(quán)利要求的主題。
因此,本發(fā)明涉及一種用于分析航班旅客機票海量數(shù)據(jù)庫存的方法,所述方法具有以下步驟:
a. 將機票數(shù)據(jù)與航班計劃信息相關(guān)聯(lián)來形成包括針對每個航班事件的機票聯(lián)票數(shù)據(jù)(Ticket-Coupon-Daten)的數(shù)據(jù)庫;
b. 確保針對每個航班事件的各個機票聯(lián)票根據(jù)相應(yīng)的機票聯(lián)票收入以預(yù)給定的順序來排序;
c. 依據(jù)連續(xù)的旅客號碼的數(shù)目根據(jù)所排序的機票聯(lián)票來確定針對每個航班事件的收入;
d. 確定針對每個單個的航班事件i的函數(shù)Yi(X)的校準(zhǔn)參數(shù),其中Yi代表收入而X代表連續(xù)的旅客號碼,其中依據(jù)根據(jù)連續(xù)的旅客號碼來確定的收入來進行對函數(shù)Yi(X)的校準(zhǔn),使得函數(shù)值Yi與所確定的收入的偏差盡可能地?。徊⑶?/p>
e. 將多個被校準(zhǔn)的函數(shù)組合成可依據(jù)航班信息分配的群集(Cluster)。
此外,本發(fā)明還涉及一種依據(jù)按照本發(fā)明的方法的用于分析航班旅客機票海量數(shù)據(jù)庫存的計算機程序產(chǎn)品。
根據(jù)本發(fā)明的方法能夠?qū)崿F(xiàn)使很大規(guī)模的航班旅客機票海量數(shù)據(jù)庫存也可用,使得大量從現(xiàn)有技術(shù)中公知的由于經(jīng)常不存在的計算能力而在可獲得的信息方面的限制被克服。對此,針對來自航班旅客機票海量數(shù)據(jù)庫存的各個航班事件分別校準(zhǔn)函數(shù)并且將多個相似地被校準(zhǔn)的函數(shù)組合成可依據(jù)航班信息分配的群集。利用針對群集的一個航班線路或者針對群集的所有航班線路的這樣確定的函數(shù)也可以如隨后所示出的那樣借助于性能不那么強的計算機來作出不同的、詳細的分析和預(yù)測,而不必如在現(xiàn)有技術(shù)中由于不足的計算性能而經(jīng)常會是必需的那樣動用主觀的猜測或者策略上被估計的修正因子。
在此要注意的是,對于校準(zhǔn)所提到的函數(shù)必要的計算能力不一定比對于按照現(xiàn)有技術(shù)來確定特征數(shù)所需要的那個計算能力更低。然而,利用按照本發(fā)明的方法所確定的并且被組合成可分配的群集的函數(shù)能夠?qū)崿F(xiàn)緊接著按照本發(fā)明的方法的大規(guī)模的并且詳細的分析,而針對各個分析步驟會不需要特征數(shù)的重復(fù)的重新計算或者其它的數(shù)值的、要應(yīng)用于總航班旅客機票海量數(shù)據(jù)庫存上的方法。因而,利用按照本發(fā)明的方法,所述大規(guī)模的并且詳細的分析需要的計算性能是在現(xiàn)有技術(shù)中(只要相對應(yīng)的分析在那里曾是完全可能的)的計算性能的幾分之一,并且因此也可以在性能不那么強的計算機上被執(zhí)行。
在按照本發(fā)明的方法中,在第一步驟中將機票數(shù)據(jù)與航班計劃信息相關(guān)聯(lián),以便這樣獲得具有針對每個航班事件的機票聯(lián)票數(shù)據(jù)的數(shù)據(jù)庫。
機票數(shù)據(jù)基本上是如從航班旅客機票海量數(shù)據(jù)庫存中按照現(xiàn)有技術(shù)公知的數(shù)據(jù)。對于每個單個的、由航空公司在預(yù)給定的時間段中出售的機票來說存在諸如旅行線路信息和機票信息的數(shù)據(jù)。旅行線路信息可包含關(guān)于包括起飛和到達地點以及必要時中間站點的航班線路、航班日期和/或各個子線路的起飛和到達時間以及相對應(yīng)的航班號的信息。機票信息優(yōu)選地包括相應(yīng)的機票收入和所預(yù)訂的運送等級(例如“頭等艙(First)”、“商務(wù)艙(Business)”、“經(jīng)濟艙(Economy)”)。
在機票數(shù)據(jù)中,已經(jīng)可以存放那些涉及與至少一個中間站點和多個子航班線路的航班連接(Flugverbindung)的航班機票,使得針對所述子航班線路中的每個來說存放有具有關(guān)于子航班線路的以子線路機票數(shù)據(jù)為形式的相對應(yīng)的信息的自己的一套數(shù)據(jù)。如果情況不是如此,那么航班機票的針對與多個子線路的航班連接的機票數(shù)據(jù)在將機票數(shù)據(jù)與航班計劃信息組合之前或者在將機票數(shù)據(jù)與航班計劃信息組合時優(yōu)選地被劃分為子線路機票數(shù)據(jù)、即被劃分為多個分別關(guān)于所述子線路之一的數(shù)據(jù)集。僅僅針對總航班線路而存在的值(諸如機票收入)例如可以根據(jù)各個子航班線路的長度被劃分到各個子線路機票數(shù)據(jù)上。
航班計劃信息包括機票數(shù)據(jù)涉及的所有航班的信息、也就是說由航空公司在相同的時間段中所執(zhí)行的針對其也存在機票數(shù)據(jù)的所有航班的航班信息。優(yōu)選地,所述各個航班信息除了關(guān)于航班線路以及起飛和到達時間(必要時包括日期)的信息之外也還包含關(guān)于所采用的飛機類型、座位的總數(shù)目、作為座位的總數(shù)目的不同的運送等級的份額的座位配置和/或作為座位在不同的運送等級中的相應(yīng)的總數(shù)目的座位配置的信息。航班信息也可包括航班號。關(guān)于航班線路的信息可包含關(guān)于起飛和到達機場的地理信息、例如關(guān)于機場分別處于的大洲、地區(qū)和/或城市的信息,但是也可包含地理位置說明。此外,關(guān)于航班線路的信息還可包含關(guān)于在起飛機場與到達機場之間的線路長度和/或大圓距離(Grosskreisentfernung)的信息。
對于機票數(shù)據(jù)與航班計劃信息的關(guān)聯(lián)來說,所述機票數(shù)據(jù)的每個單個的數(shù)據(jù)集都由所述機票數(shù)據(jù)的數(shù)據(jù)集涉及的那個航班的航班信息來補充。在此,航班線路、起飛和到達時間和/或航班號可以被考慮用于關(guān)聯(lián)。
通過機票數(shù)據(jù)與航班計劃信息的關(guān)聯(lián)的步驟來形成機票聯(lián)票數(shù)據(jù)庫,在所述機票聯(lián)票數(shù)據(jù)庫中每個單個的機票或子線路機票相對于原始的機票數(shù)據(jù)或子線路機票數(shù)據(jù)都包括有關(guān)執(zhí)行相應(yīng)的機票或子線路機票涉及的航班的附加信息。屬于這些附加信息的尤其可以是:飛機類型、座位的總數(shù)目和/或已用來執(zhí)行相應(yīng)的航班的飛機的座位配置。
在下一步驟中確保:針對每個航班事件的各個機票聯(lián)票在機票聯(lián)票數(shù)據(jù)庫中根據(jù)相應(yīng)的機票收入以預(yù)給定的順序來排序。機票聯(lián)票尤其可以以降序或者升序來排序。接著,在降序排序的情況下,對于相應(yīng)的航班事件來說,第一機票聯(lián)票是具有最高的機票收入的那個機票聯(lián)票、最后的機票聯(lián)票是具有最低的機票收入的那個機票聯(lián)票。在升序排序的情況下,對于相應(yīng)的航班事件來說,第一機票聯(lián)票是具有最低的機票收入的那個機票聯(lián)票、最后的機票聯(lián)票是具有最高的機票收入的那個機票聯(lián)票。
該上下文中的“確保”意味著:在該方法步驟結(jié)束時,針對每個的航班事件的機票聯(lián)票實際上都以預(yù)給定的順序來排序。對此,例如可以在適當(dāng)?shù)臋z查的范圍內(nèi)確認針對航班事件的機票聯(lián)票是否已經(jīng)具有所期望的順序。只有當(dāng)情況不會應(yīng)該如此時,所述機票聯(lián)票才可以相對應(yīng)地重新被排序。替代于利用緊接著的可能的排序來檢查,也可能的是在沒有事先的檢查的情況下將排序算法應(yīng)用到機票聯(lián)票上,其中所述排序算法優(yōu)選地在確認所述機票聯(lián)票完全被排序時中斷。用于檢查所述機票聯(lián)票的順序和用于以預(yù)給定的順序來將機票聯(lián)票排序的方法從現(xiàn)有技術(shù)中是公知的。如果出于其它原因可以以機票聯(lián)票已經(jīng)恰當(dāng)?shù)乇慌判颍ɡ缬捎谙鄬?yīng)地被預(yù)排序的初始數(shù)據(jù))為出發(fā)點,那么對于確保所期望的順序的方法步驟來說,主動的操作不是必要的。
緊接著,依據(jù)連續(xù)的旅客號碼根據(jù)所排序的機票聯(lián)票來確定針對每個航班事件的收入。所要確定的收入尤其可以是平均收入或者累積收入。
“根據(jù)連續(xù)的旅客號碼的平均收入”可根據(jù)從第一機票聯(lián)票出發(fā)直至連續(xù)的旅客號碼的被排序的機票聯(lián)票的機票收入的總和除以連續(xù)的旅客號碼來計算。為此,“根據(jù)連續(xù)的旅客號碼的累積收入”的確定原則上類似地進行,然而其中省去了除以連續(xù)的旅客號碼。
在該步驟中,為了闡明可以看到基于所排序的機票聯(lián)票的針對每個航班事件的值表格的制訂。從1出發(fā)延續(xù)直至在所涉及的航班事件中實際上被運輸?shù)穆每偷臄?shù)目的旅客號碼用作值表格的自變數(shù)。從第一機票聯(lián)票(例如在降序排序的情況下具有最高的機票收入的機票聯(lián)票)出發(fā)將根據(jù)連續(xù)的旅客號碼的平均收入或者累積收入作為函數(shù)值,其中相對應(yīng)的收入可以通過從第一機票聯(lián)票出發(fā)直至連續(xù)的旅客號碼的被排序的機票收入的總和(在平均收入的情況下除以連續(xù)的旅客號碼)來形成。
根據(jù)連續(xù)的旅客號碼的針對每個航班事件的平均收入尤其可以通過下面的、關(guān)于為此所需的計算能力節(jié)省資源的步驟來確定:
a)確定根據(jù)連續(xù)的旅客號碼的累積收入;
b)將所述累積收入除以附屬的連續(xù)的旅客號碼。
為了確定累積收入,優(yōu)選地降序排序的機票聯(lián)票的機票收入按順序從第一機票聯(lián)票出發(fā)優(yōu)選地被累加,其中累積收入的所累加的機票聯(lián)票的相應(yīng)的數(shù)目對應(yīng)于連續(xù)的旅客號碼。緊接著,為了得到平均收入,將各個累積收入除以分別所屬的連續(xù)的旅客號碼。
如果根據(jù)連續(xù)的旅客號碼的針對每個航班事件的收入被確定,那么緊接著可以針對每個航班事件校準(zhǔn)函數(shù)Yi(X)。在該函數(shù)中,索引i代表相應(yīng)的航班事件,Yi代表根據(jù)X、連續(xù)的旅客號碼的收入。
相對應(yīng)地可校準(zhǔn)的函數(shù)是具有至少一個可預(yù)給定的系數(shù)的預(yù)給定的函數(shù)??梢赃x擇系數(shù),使得函數(shù)值Yi與針對每個旅客號碼X所確定的收入的偏差是盡可能地小。對函數(shù)Yi(X)的相應(yīng)的系數(shù)的確定與本發(fā)明相關(guān)聯(lián)地被稱作對函數(shù)Yi(X)的校準(zhǔn)并且例如可以根據(jù)最小二乘法來進行。所述可預(yù)給定的系數(shù)也被稱作“校準(zhǔn)參數(shù)”。換言之,對函數(shù)Yi(X)的校準(zhǔn)因此依據(jù)根據(jù)連續(xù)的旅客號碼被確定的收入來進行,使得函數(shù)值Yi與所確定的收入的偏差盡可能地小。
優(yōu)選的是,函數(shù)Yi(X)的范圍對于實際上已針對其來確定收入的旅客號碼X來說是單調(diào)上升或單調(diào)下降的。函數(shù)Yi(X)的校準(zhǔn)參數(shù)的數(shù)目優(yōu)選地小于等于10、進一步優(yōu)選地小于等于5、進一步優(yōu)選地小于等于3。通過相對應(yīng)的函數(shù)Yi(X)可以降低用于校準(zhǔn)的以及必要時用于隨后所解釋的組合成群集的資源耗費。
特別優(yōu)選的是,函數(shù)Yi(X)是具有校準(zhǔn)參數(shù)Ai和mi的函數(shù):
(等式1)
因為該函數(shù)僅具有兩個校準(zhǔn)參數(shù),所以校準(zhǔn)可以特別節(jié)省資源地來執(zhí)行。同時已表明:該函數(shù)經(jīng)常良好地描述了航班事件的累積收入或者平均收入。
為了盡可能節(jié)省資源地執(zhí)行必要的對所述優(yōu)選的函數(shù)的校準(zhǔn),優(yōu)選的是對上面所提到的函數(shù)取對數(shù),使得得出線性等式:
(等式2)
或
其中 (等式3)
接著,
(等式4)
適用于校準(zhǔn)參數(shù)Ai。
所提到的線性等式可以借助于在之前的步驟中所確定的根據(jù)連續(xù)的旅客號碼的針對每個航班事件的收入簡單并且節(jié)省資源地來校準(zhǔn),其中優(yōu)化尤其可以將線性等式的確定度R2的最大化作為目的。經(jīng)驗已表明:在98%的被研究的航班事件中可以達到超過99%的確定度R2。
不依賴于最終的函數(shù)Yi(X),在校準(zhǔn)時特別優(yōu)選的是:所述校準(zhǔn)僅僅依據(jù)收入的所得出的變化過程的預(yù)先確定的范圍來進行、尤其依據(jù)從第一或者最后的連續(xù)的旅客號碼出發(fā)的相關(guān)聯(lián)的份額來進行。所述校準(zhǔn)因此可以依據(jù)更小數(shù)目的值來進行,由此對于校準(zhǔn)所必要的計算性能可以被減小。為了校準(zhǔn)而要考慮的連續(xù)的旅客號碼的份額優(yōu)選地為60-80%、進一步優(yōu)選地為70%。
如果針對來自機票聯(lián)票數(shù)據(jù)庫中的每個單個的航班事件的校準(zhǔn)結(jié)束,那么在所述校準(zhǔn)中所確定的值(例如Bi和mi)以及必要時相應(yīng)的確定度R2可以與附屬的航班信息一起被中間存儲。相對應(yīng)的信息例如可以被存放在第一函數(shù)數(shù)據(jù)庫中,所述第一函數(shù)數(shù)據(jù)庫在其大小方面相對于機票數(shù)據(jù)或者機票聯(lián)票數(shù)據(jù)庫是明顯更小的。接著,相對于在機票數(shù)據(jù)或機票聯(lián)票數(shù)據(jù)庫中的每個機票一個數(shù)據(jù)集,所述第一函數(shù)數(shù)據(jù)庫針對每個航班事件都包括恰好一個數(shù)據(jù)集。
為了還明顯地提高隨后的分析的可能性、但是也明顯地提高在下文所描述的組合成群集的可能性,優(yōu)選的是,除了所提到的被確定的值之外也還確定關(guān)于在航班事件中各個運送等級的裝載(Auslastung)的值。這些值例如可以被中間存儲在第一函數(shù)數(shù)據(jù)庫中。所述裝載值在此可以作為各個運送等級中的旅客的絕對數(shù)目或者作為各個運送等級中的占用的座位的份額來說明。例如要在第一函數(shù)數(shù)據(jù)庫中中間存儲的數(shù)據(jù)集的數(shù)目由此不改變,而是繼續(xù)對應(yīng)于不同的航班事件的數(shù)目。
所述各個航班事件緊接著借助于相應(yīng)的校準(zhǔn)值(例如Bi和mi)被組合成可依據(jù)航班信息分配的群集?!翱梢罁?jù)航班信息分配的群集”在該上下文中意味著:限定各個群集,使得航班事件只基于其航班信息就可以明確地被分配給確定的群集??梢砸罁?jù)航班信息,例如根據(jù)季節(jié)或者日歷月、起飛和目的地點或者相應(yīng)的地區(qū)、飛機的類型(例如長線路、短線路、支線航班)、線路長度、甚至大圓距離等等來形成群集。
對于將各個航班事件組合成群集來說可以檢查:航班事件的關(guān)于航班消息可清楚地限定的組是否具有足夠類似的校準(zhǔn)值(例如Bi和mi)、也就是說各個航班事件的校準(zhǔn)值是否只在預(yù)給定的范圍中彼此有偏差。如果情況如此,那么可以針對該群集的所有的航班事件來確定共同的校準(zhǔn)值(例如和)。接著,所述航班事件可以被組合在群集中,使得對于該群集的所有航班事件來說只須存儲單個的函數(shù)或者共同的校準(zhǔn)值(例如和)。所述共同的校準(zhǔn)值(例如和)例如可以通過求平均值來找到。如果航班事件不能被分配給可限定的組,那么可以針對相對應(yīng)的航班事件保持之前所確定的單獨的校準(zhǔn)值(例如Bi和mi)。
針對各個群集的共同的校準(zhǔn)值(例如和)與能夠?qū)崿F(xiàn)將航班事件明確地分配給該群集的信息和未能被分配給群集的航班事件的單獨的校準(zhǔn)值(例如Bi和mi)一起、連同附屬的航班信息被存儲在例如第二函數(shù)數(shù)據(jù)庫中。
利用按照本發(fā)明的方法的試驗已表明:航班事件的單獨的校準(zhǔn)值(例如Bi和mi)例如可以根據(jù)地區(qū)和地區(qū)的組合(例如一個樞紐(Hub)的歐洲內(nèi)部的也可被稱作支線航班的航班事件,在歐洲與其它大洲(諸如北美)上的全部地區(qū)之間的航班事件)以及根據(jù)日歷月被組合成群集。在確定的地區(qū)中的或跨地區(qū)的(regionsuebergreifend)和在確定的日歷月中然而跨越多年的航班事件尤其也可以被組合成群集,其中這一點原則上也在多年期間例如通過被改變的競爭而被改變的市場條件的情況下是可能的。同樣,航班事件經(jīng)??梢耘c所采用的飛機模型的座位容量無關(guān)地被組合成群集。
這樣通過校準(zhǔn)值(例如Bi和mi)所確定的并且被組合成群集的函數(shù)的數(shù)目相對于在最初的機票數(shù)據(jù)中的數(shù)據(jù)集的數(shù)目小了至少一個數(shù)量級、一般來說甚至小了多個數(shù)量級。但是,同時所確定的函數(shù)不同于在現(xiàn)有技術(shù)中地不僅僅是靜態(tài)特征值,而是能夠?qū)崿F(xiàn)大規(guī)模的分析,所述大規(guī)模的分析在現(xiàn)有技術(shù)中基于航班旅客機票海量數(shù)據(jù)庫存(如果有的話)曾只可以用高的計算機能力來執(zhí)行。而基于按照本發(fā)明所確定的校準(zhǔn)值的分析也可以利用與此相對地明顯性能更弱的計算機來執(zhí)行。
當(dāng)然,基于按照本發(fā)明的校準(zhǔn)以及組合成群集來得出初始的機票數(shù)據(jù)的簡化和偏差,然而研究已表明:相對應(yīng)的不準(zhǔn)確性是可忽略的并且尤其由于先通過按照本發(fā)明的方法變得可能的分析可能性而不止被彌補。
即使利用所描述的組合成各個群集來組合大量航班事件已經(jīng)是可能的,這在具有旅客在不同的預(yù)訂等級(例如“頭等艙(First)”、“商務(wù)艙(Business)”和“經(jīng)濟艙(Economy)”)中的明顯不同的分布的航班事件的情況下也常常是不可能的或者只容忍大的不準(zhǔn)確性的情況下是可能的。在此不重要的是:由于分別被采用的飛機的不同的座位配置或者由于在預(yù)訂時的波動而出現(xiàn)將旅客不同地分布到在不同的預(yù)訂等級中。
在一優(yōu)選的改進方案中,本發(fā)明已斷定:在較高的預(yù)訂等級(例如“First”和“Business”)中的旅客(所謂的“正常票價旅客)占自由地預(yù)給定的固定數(shù)目的旅客的份額與根據(jù)連續(xù)的旅客號碼的收入之間存在關(guān)系并且該關(guān)系是線性的。因而優(yōu)選的是,在將所述各個航班事件組合成可依據(jù)航班信息分配的群集時考慮該線性關(guān)系。由此,對于所有航班事件的映射來說所需的群集的數(shù)目可以進一步被減小,而且對在進一步處理時的計算能力的要求可以進一步被減小。
為了可以進行相對應(yīng)的組合,必要的是提供關(guān)于各個運送等級在每個航班事件中的裝載的信息。然而,相對應(yīng)的信息可以容易地被確定而且例如可以被存放在第一函數(shù)數(shù)據(jù)庫中(如上所述)。
將具有各個運送等級的不同的裝載的航班事件組合成可依據(jù)航班信息分配的群集包括以下步驟:
a. 從針對預(yù)給定的旅客號碼a,b,…的線性等式確定斜率ja,jb,…,所述線性等式描述了在正常票價旅客的數(shù)目n或正常票價旅客占自由地預(yù)給定的固定數(shù)目的旅客的份額與要組合的航班事件的針對預(yù)給定的旅客號碼a,b,…的收入之間的關(guān)系,其中針對預(yù)給定的旅客號碼a,b,…的收入根據(jù)正常票價旅客的數(shù)目n或者正常票價旅客占自由地被預(yù)給定的固定數(shù)目的旅客的份額通過解開針對相應(yīng)的航班事件的函數(shù)Yi(X)來確定,并且其中所述預(yù)給定的旅客號碼a,b,…的數(shù)目和線性等式的數(shù)目分別對應(yīng)于函數(shù)Yi(X)的校準(zhǔn)參數(shù)的數(shù)目;和
b. 針對正常票價旅客的預(yù)給定的數(shù)目或者正常票價旅客占自由地預(yù)給定的固定數(shù)目的旅客的份額來確定共同的校準(zhǔn)值。
因此,對于將具有各個運送等級的不同的裝載的航班事件組合成可依據(jù)航班信息分配的群集來說,首先分別針對預(yù)給定的旅客號碼a,b,…來解開針對所涉及的航班事件的函數(shù)Yi(X),而且根據(jù)正常票價旅客的數(shù)目n或者正常票價旅客占相應(yīng)的航班事件的自由地預(yù)給定的固定數(shù)目的旅客的份額來確定在此所獲得的結(jié)果(即收入)。接著,對于預(yù)給定的旅客號碼a,b,…來說,可以分別確定如下線性等式,所述線性等式表示在正常票價旅客的數(shù)目n或正常票價旅客占自由地預(yù)給定的固定數(shù)目的旅客的份額與針對預(yù)給定的旅客號碼a,b,…的收入之間的關(guān)系。從所述線性等式可以確定直線的斜率ja,jb,…。所述斜率ja,jb,…例如可以作為針對相對應(yīng)的群集的參數(shù)例如存放在第二函數(shù)數(shù)據(jù)庫中。如果所述直線的斜率ja,jb,…基于正常票價旅客占自由地預(yù)給定的固定數(shù)目的旅客的份額被確定,那么所述斜率ja,jb,…也可以是相同的。
所述共同的校準(zhǔn)值(例如和)可以與群集的確定的航班事件的校準(zhǔn)參數(shù)(例如Bi和mi)相同。接著,正常票價旅客的附屬的數(shù)量對應(yīng)于相對應(yīng)的航班事件的正常票價旅客ni的數(shù)目。但是必要時也可以求平均值或者諸如此類的。
如果對于群集來說,除了共同的校準(zhǔn)值(例如和)之外也還有所描述的斜率ja,jb,…以及正常票價旅客的附屬的數(shù)目或者所述正常票價旅客占自由地預(yù)給定的固定數(shù)目的旅客的份額是可用的,那么針對各個航班事件的校準(zhǔn)參數(shù)(例如Bi和mi)可以借助于針對已知的旅客號碼a,b,…的斜率ja,jb,…根據(jù)正常票價旅客的預(yù)給定的數(shù)目或者所述正常票價旅客占自由地預(yù)給定的固定數(shù)目的旅客的偏差來適配,使得從中最終得到的函數(shù)足夠準(zhǔn)確地描述相應(yīng)的航班事件。
以優(yōu)選的函數(shù)為例,這一點可以變得清楚。在此,利用共同的校準(zhǔn)值和來解開針對旅客號碼a,b的函數(shù),使得得出:
(等式5)
和
(等式6)。
對于來自相對應(yīng)的群集的具有正常票價旅客的已知的數(shù)目ni的任意的航班來說,可以容易地從如下等式確定該航班事件的單獨的函數(shù)Yi或者其校準(zhǔn)參數(shù)Bi和mi:
(等式7)
和
(等式8)。
由此能夠?qū)崿F(xiàn):由于航班信息中的共同性原則上也可以被組合成可依據(jù)航班信息分配的群集的航班事件盡管也由于正常票價旅客的不同的數(shù)目或正常票價旅客占自由地預(yù)給定的固定數(shù)目的旅客的不同的份額而有明顯不同的校準(zhǔn)參數(shù)實際上也可以被組合成群集。
優(yōu)選的是:針對一個群集的所有航班事件來確定正常票價旅客的數(shù)目的平均值或者所述正常票價旅客占自由地預(yù)給定的固定數(shù)目的旅客的份額的平均值。優(yōu)選地也可以確定正常票價旅客的數(shù)目與相應(yīng)的直線的標(biāo)準(zhǔn)差或正常票價旅客占自由地預(yù)給定的固定數(shù)目的旅客的份額與相應(yīng)的直線的標(biāo)準(zhǔn)差。
通過可能相對應(yīng)地擴展地組合航班事件來降低必要的群集的數(shù)目,以便按照最初的機票數(shù)據(jù)來映射所有航班事件。相對應(yīng)地,降低例如要在第二函數(shù)數(shù)據(jù)庫中存儲的包含關(guān)于各個群集的信息的數(shù)據(jù)集的數(shù)目。研究已表明:相對于來自第一方法步驟的大約1260萬的機票數(shù)據(jù)(集),數(shù)據(jù)集的數(shù)目可以被減小到直至大約2千。然而不同于在現(xiàn)有技術(shù)中地,最終得到的數(shù)據(jù)集在此并不限于靜態(tài)特征數(shù),而是提供如下可能性:以足夠的準(zhǔn)確性來執(zhí)行對多個可依據(jù)航班信息來組合的航班事件亦或單個航班事件的詳細的分析。由于數(shù)據(jù)集的比較小的數(shù)目,在此也可以借助于性能更弱的計算機來執(zhí)行相對應(yīng)的分析。只要在現(xiàn)有技術(shù)中相對應(yīng)的分析完全是可能的,這些分析就需要性能極其強的計算機和巨大的時間耗費,以便勝任最初的機票數(shù)據(jù)的只在現(xiàn)有技術(shù)中存在的明顯更高的數(shù)目。
通過所描述的將航班時間擴展地組合成可依據(jù)航班信息分配的群集來在如下方面形成附加的獎勵效應(yīng)(Bonuseffekt):例如甚至飛機大小的改變都可以由在線路上所采用的飛機模型或者不同的座位配置預(yù)先投影和估計。這樣,所獲得的信息可以在機群計劃中或者在航班計劃制訂中由航空公司來考慮、但是也可以在飛機新設(shè)計中由飛機制造商來考慮。
按照本發(fā)明的方法在機群計劃中以及在新飛機的設(shè)計中也能夠?qū)崿F(xiàn):通過正常票價旅客來確保尤其是較高的預(yù)訂等級(例如“First”和“Business”)的盡可能最優(yōu)的裝載。由此可以明顯減小如下危險:在較高的預(yù)訂等級中的座位持續(xù)不被利用并且必須不斷作為自重被攜帶在飛機中,這最終也會不必要地提高動力燃料消耗。
用于在可依據(jù)航班信息分配的群集中的正常票價旅客的座位的最優(yōu)的數(shù)目、也就是說那些確保最優(yōu)的裝載的數(shù)目優(yōu)選地通過將群集的正常票價旅客的或正常票價旅客占自由地預(yù)給定的固定數(shù)目的旅客的份額的平均數(shù)與相同的群集的正常票價旅客的數(shù)目的或正常票價旅客占自由地預(yù)給定的固定數(shù)目的旅客的份額的標(biāo)準(zhǔn)差的二倍加和來確定。利用針對正常票價旅客的座位的這樣被確定的最優(yōu)的數(shù)目可以優(yōu)化在群集中的相對應(yīng)的座位的裝載,使得在可分配給該群集的航班事件上的要攜帶的自重在總和上是最小的而且可以相對應(yīng)地節(jié)約動力燃料。用于優(yōu)化座位的裝載的并且借此最終用于持續(xù)地降低動力燃料消耗的方法必要時分開地應(yīng)受(verdienen)保護。
按照本發(fā)明的計算機程序產(chǎn)品用于實施按照本發(fā)明的方法。因而參閱之前的實施方案。所述計算機程序產(chǎn)品可以以軟盤、DVD(數(shù)字多功能光盤(Digital Versatile Disc))、CD(壓縮光盤(Compact Disc))、記憶棒或者其它的任意的存儲介質(zhì)的形式存在。
附圖說明
現(xiàn)在,依據(jù)一有利的實施例參照隨附的附圖來進一步描述本發(fā)明。其中:
圖1示出了按照本發(fā)明的方法的示意圖;
圖2示出了來自機票聯(lián)票數(shù)據(jù)庫的摘錄;
圖3示出了機票收入根據(jù)連續(xù)的旅客號碼的圖表;
圖4示出了累積收入根據(jù)連續(xù)的旅客號碼的圖表;
圖5示出了平均收入根據(jù)連續(xù)的旅客號碼的圖表;
圖6示出了來自第一函數(shù)數(shù)據(jù)庫的摘錄;
圖7示出了針對兩個預(yù)給定的旅客號碼的不同的航班事件的平均收入的圖表;
圖8示出了來自第二函數(shù)數(shù)據(jù)庫的摘錄;和
圖9示出了關(guān)于對確定的航班事件的信息的確定的圖解的圖表。
具體實施方式
在圖1中示意性地示出了按照本發(fā)明的方法100。在第一步驟101中,被存放在第一數(shù)據(jù)存儲器1中的機票數(shù)據(jù)和被存放在第二數(shù)據(jù)存儲器2中的航班計劃信息被組合成機票聯(lián)票數(shù)據(jù)庫13并且被存放在第三數(shù)據(jù)存儲器3中。
在圖2中示出了來自機票聯(lián)票數(shù)據(jù)庫13的摘錄。針對每個單個的機票聯(lián)票23存在單獨的數(shù)據(jù)集,所述數(shù)據(jù)集包含關(guān)于以下方面的信息:
- 航班事件的日期,
- 航班號,
- 起飛地點,
- 到達地點,
- 到達時間,
- 針對機票聯(lián)票的機票收入30,
- 運送等級,
- 已實際上用來執(zhí)行航班的飛機類型,
- 已實際上用來執(zhí)行航班的飛機的座位數(shù)目,以及
- 已實際上用來執(zhí)行航班的飛機的座位配置。
信息“航班事件的日期”、“航班號”、“起飛地點”、“起飛時間”、“到達地點”和“到達時間”不僅被包含在機票數(shù)據(jù)和在航班計劃信息中而且用于將航班計劃信息與機票數(shù)據(jù)明確地關(guān)聯(lián)。在機票聯(lián)票數(shù)據(jù)庫13中的信息“機票收入”以及“運送等級”來自如下機票數(shù)據(jù),所述機票數(shù)據(jù)包含來自航班計劃信息的關(guān)于“飛機類型”、“座位數(shù)目”和“座位配置”的信息。
在機票聯(lián)票數(shù)據(jù)庫13中僅包含有單個航班線路。如果來自機票數(shù)據(jù)的機票包括多個子線路,那么相應(yīng)的機票被分成多個機票聯(lián)票23,使得針對每個子線路都存在單獨的機票聯(lián)票23。在所示出的示例中,機票聯(lián)票23`和23``形成來自機票數(shù)據(jù)庫的針對總航班線路漢堡(Hamburg,HAM)-紐約約翰F.肯尼迪(John F. Kennedy)機場(JFK)的在法蘭克福(Frankfurt,F(xiàn)RA)換乘的機票的兩個子線路。
在隨后的步驟102中確保:在機票聯(lián)票數(shù)據(jù)庫13中將每個單個的航班事件的機票聯(lián)票23根據(jù)預(yù)給定的準(zhǔn)則來排序,也就是以按照針對相對應(yīng)的航班事件的每個機票聯(lián)票23的機票收入30的降序來排序。為此,在所示出的示例中將單個的航班事件的機票聯(lián)票23輸送給相對應(yīng)地對機票聯(lián)票23進行排序的排序算法、例如冒泡排序算法。一旦機票聯(lián)票23以正確的順序存在,所述排序算法就中斷。如果針對航班事件的機票數(shù)據(jù)23在被輸送給所述排序算法時已經(jīng)被排序,那么該排序算法在唯一的運行之后已中斷。
在圖3中以示例示出了所排序的機票聯(lián)票23關(guān)于針對單個的航班事件的連續(xù)的旅客號碼31的機票收入30,其中旅客號碼31連續(xù)地從1進展直至針對相應(yīng)的航班事件的機票聯(lián)票23的數(shù)目。
在步驟103中,針對每個航班事件的平均收入32根據(jù)連續(xù)的旅客號碼31被確定。對此,在中間步驟中首先根據(jù)連續(xù)的旅客號碼31來計算累積收入33,其方式是所排序的機票聯(lián)票23的機票收入30按順序從第一機票聯(lián)票23出發(fā)被累加并且根據(jù)所累加的機票聯(lián)票23的對應(yīng)于連續(xù)的旅客號碼31的數(shù)目被確定。在圖4中示出了針對來自圖3的航班事件的該中間步驟的結(jié)果。
緊接著,各個累積收入33除以分別所屬的連續(xù)的旅客號碼31,以便這樣得到根據(jù)連續(xù)的旅客號碼31的平均收入32。在圖5中以示例示出了針對來自圖3和4的航班事件的平均收入32。
從在圖5中以示例來示出的根據(jù)連續(xù)的旅客號碼31的平均收入32出發(fā),在步驟104中針對每個航班事件來校準(zhǔn)函數(shù):
(等式1)
在該函數(shù)中,索引i代表相應(yīng)的單個的航班事件,Yi代表平均收入而X代表連續(xù)的旅客號碼。為了校準(zhǔn),該函數(shù)的校準(zhǔn)參數(shù)Ai和mi被優(yōu)化,使得與在之前的步驟103中所確定的針對每個航班事件的根據(jù)連續(xù)的旅客號碼31的平均收入32的偏差是盡可能地小。在此,所述校準(zhǔn)僅依據(jù)連續(xù)的旅客號碼31中的70%、即具有最高的旅客號碼31的那70%來進行。相對應(yīng)的份額在圖5中被表示為區(qū)域34。
為了盡可能節(jié)省資源地執(zhí)行必要的校準(zhǔn),優(yōu)選地以取對數(shù)的方式使用上面所提到的函數(shù)、即用作線性等式:
(等式2)
或
其中 (等式3)。
最后提到的線性等式可借助于在之前的步驟中所確定的針對每個航班事件的根據(jù)連續(xù)的旅客號碼31的平均收入32簡單地并且節(jié)省資源地來校準(zhǔn),其中優(yōu)化尤其可以將線性等式的確定度R2的最大化作為目的。參數(shù)Ai由
(等式4)
得出。
相應(yīng)地針對每個航班事件(針對所述每個航班事件都在數(shù)據(jù)庫1中存在機票數(shù)據(jù))來校準(zhǔn)的函數(shù)以其校準(zhǔn)參數(shù)Bi和mi的形式被存放在第一函數(shù)數(shù)據(jù)庫4中。除了校準(zhǔn)參數(shù)Bi和mi之外,在第一函數(shù)數(shù)據(jù)庫4中還存放有相應(yīng)的航班事件的航班信息。旅客的數(shù)目也根據(jù)等級分開地被存放在第一函數(shù)數(shù)據(jù)庫4中。在圖6中以示例示出了來自相對應(yīng)的第一函數(shù)數(shù)據(jù)庫4的摘錄。
通過針對每個航班事件,僅僅針對每個航班事件的一個數(shù)據(jù)集被存放在第一函數(shù)數(shù)據(jù)庫4中,在該數(shù)據(jù)庫中的數(shù)據(jù)集的數(shù)目相對于具有針對每個單個的航班事件的機票數(shù)據(jù)和機票聯(lián)票數(shù)據(jù)13的數(shù)據(jù)庫1和3已經(jīng)明顯被減小。
在另一步驟105中,來自第一函數(shù)數(shù)據(jù)庫4的各個數(shù)據(jù)集被組合成各個可依據(jù)航班信息分配的群集。這樣,在圖6中所說明的在法蘭克福(FRA)與北美或兩個紐約機場約翰F.肯尼迪機場(JFK)和紐瓦克機場(EWR)之間的航班被組合成如下群集,所述群集接著對于在法蘭克福與北美或紐約之間的所有的航班來說都是有效的。在此,該群集此外還可以限于在一年的一月份中的航班。
除了在圖6中所說明的在法蘭克福與紐約之間的航班之外,在第一函數(shù)數(shù)據(jù)庫4中當(dāng)然還包含大量其它的航班,所述航班屬于所提到的群集“在一月份中的法蘭克福-紐約”(或“在一月份中的法蘭克福-北美”)。不過,飛機大小或者座位配置在所示出的示例中不是用于形成群集的準(zhǔn)則。
對于群集的相對應(yīng)的航班事件的組合來說,首先針對兩個預(yù)給定的旅客號碼a,b借助于相應(yīng)的校準(zhǔn)參數(shù)Bi和mi和上面所提到的函數(shù)來計算平均收入。在圖7中示出了針對旅客號碼a=150和b=300的這樣被計算的平均收入,其中所述平均收入關(guān)于正常票價旅客(也就是說在預(yù)訂等級“First”和“Business”中的旅客)針對分別相對應(yīng)的航班事件被示出。正常票價旅客的數(shù)目可以從第一函數(shù)數(shù)據(jù)庫4獲悉(參見圖6“旅客的數(shù)目”)。
對于預(yù)給定的旅客號碼a,b中的每個來說,可以分別接近具有相應(yīng)的斜率ja,jb的直線36、37。此外,在該步驟中確定共同的校準(zhǔn)參數(shù)和以及正常票價旅客的附屬的數(shù)目。這些值例如可以是校準(zhǔn)參數(shù)和所述群集的確定的航班事件的正常票價旅客的數(shù)目。
此外,能夠針對相應(yīng)的群集的航班事件還可以確定所運送的正常票價旅客的數(shù)目的平均值和標(biāo)準(zhǔn)差。相對應(yīng)的信息可以如在圖8中的示例中所示出的那樣被存放在第二函數(shù)數(shù)據(jù)庫5中。
根據(jù)關(guān)于共同的校準(zhǔn)值和的信息、正常票價旅客的附屬的數(shù)量以及針對群集的斜率ja,jb、即根據(jù)各個航班事件的正常票價旅客的數(shù)目可以確定針對來自該群集的各個航班事件的單獨的校準(zhǔn)參數(shù)Bi和mi。
對此,例如可以利用共同的校準(zhǔn)值和來解開針對旅客號碼a,b的函數(shù),使得得出:
(等式5)
和
(等式6)。
對于來自相對應(yīng)的群集的具有正常票價旅客的已知的數(shù)目ni的任意的航班來說,接著可以容易地從如下等式確定該航班事件的單獨的函數(shù)Yi或其校準(zhǔn)參數(shù)Bi和mi:
(等式7)
和
(等式8)。
在圖9中再次以圖形的方式闡明了所述用于確定一個確定的航班事件的單獨的校準(zhǔn)參數(shù)Bi和mi的處理方式。從針對兩個預(yù)給定的旅客號碼a=150和b=300的斜率ja,jb出發(fā),可以針對這兩個旅客號碼a,b分別確定已知的具有共同的校準(zhǔn)值和的函數(shù)的偏差、函數(shù)(Yi)的“平移”和在此被改變的校準(zhǔn)參數(shù)Bi和mi,所述在此被改變的校準(zhǔn)參數(shù)Bi和mi與相應(yīng)的航班事件的正常票價旅客的實際上的數(shù)目ni有關(guān)。
通過所描述的組合還可能進一步減小數(shù)據(jù)集在相對于第一函數(shù)數(shù)據(jù)庫4的第二函數(shù)數(shù)據(jù)庫5中的數(shù)目。
結(jié)果,通過按照本發(fā)明的方法來提供第二函數(shù)數(shù)據(jù)庫5,所述第二函數(shù)數(shù)據(jù)庫5可以以足夠的準(zhǔn)確性來映射被包含在最初的機票數(shù)據(jù)中的所有航班事件,但是與此不同地得到小了多個數(shù)量級的數(shù)目的數(shù)據(jù)集。由于所述明顯被減小的大小,也可以通過性能更弱的計算機來分析第二函數(shù)數(shù)據(jù)庫5。作為附加的獎勵效應(yīng),也可以從這樣被確定的第二函數(shù)數(shù)據(jù)庫5中得出信息并且作出預(yù)測,而這曾在現(xiàn)有技術(shù)中是不可能的。