1.一種旅客航班需求分析方法,其特征在于,所述方法包括:
進(jìn)行數(shù)據(jù)預(yù)處理得到航班查詢(xún)數(shù)據(jù);
根據(jù)所述航班查詢(xún)數(shù)據(jù)進(jìn)行旅客查航班行為模式分類(lèi);
對(duì)所述分類(lèi)得到的旅客查詢(xún)航班行為類(lèi)別進(jìn)行權(quán)值訓(xùn)練;
根據(jù)所述權(quán)值訓(xùn)練的結(jié)果以及所述分類(lèi)得到的旅客查詢(xún)航班行為類(lèi)別,計(jì)算每個(gè)產(chǎn)品集在多個(gè)維度下的需求指數(shù);
將所述需求指數(shù)進(jìn)行前端展示。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述進(jìn)行數(shù)據(jù)預(yù)處理得到航班查詢(xún)數(shù)據(jù),包括:對(duì)獲取并解析后的旅客查詢(xún)航班日志數(shù)據(jù)使用Hadoop分布式數(shù)據(jù)處理平臺(tái)進(jìn)行數(shù)據(jù)預(yù)處理,生成航班查詢(xún)數(shù)據(jù)并存儲(chǔ)到Hadoop分布式數(shù)據(jù)平臺(tái)的Hive組件中。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述航班查詢(xún)數(shù)據(jù)進(jìn)行旅客查航班行為模式分類(lèi),包括:
從Hadoop分布式數(shù)據(jù)處理平臺(tái)的Hive組件中讀取預(yù)處理生成的航班查詢(xún)數(shù)據(jù),通過(guò)不同渠道各自對(duì)應(yīng)的分類(lèi)決策樹(shù)進(jìn)行查詢(xún)航班行為分類(lèi),得到旅客查詢(xún)航班行為類(lèi)別的數(shù)據(jù)。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述根據(jù)所述航班查詢(xún)數(shù)據(jù)進(jìn)行旅客查航班行為模式分類(lèi),還包括:將所述旅客查詢(xún)航班行為類(lèi)別的數(shù)據(jù)存儲(chǔ)到Hadoop分布式數(shù)據(jù)處理平臺(tái)的Hive組件中。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對(duì)所述分類(lèi)得到的旅客查詢(xún)航班行為類(lèi)別進(jìn)行權(quán)值訓(xùn)練,包括:使用模式搜索算法,通過(guò)迭代計(jì)算獲取每個(gè)旅客查詢(xún)航班行為類(lèi)別的權(quán)重。
6.根據(jù)權(quán)利要求1或5所述的方法,其特征在于,所述對(duì)所述分類(lèi)得到的旅客查詢(xún)航班行為類(lèi)別進(jìn)行權(quán)值訓(xùn)練,包括:
獲取訓(xùn)練樣本數(shù)據(jù),以訓(xùn)練樣本中所有產(chǎn)品的各查詢(xún)行為類(lèi)別的加權(quán)和與相應(yīng)的預(yù)訂量在給定的時(shí)間范圍內(nèi)變化趨勢(shì)一致性最大化為目標(biāo),使用模式搜索算法,計(jì)算最優(yōu)的權(quán)值,最終將得到的所有查詢(xún)航班行為類(lèi)別的權(quán)值系數(shù)輸出保存到IndexWeight.txt文件中。
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述計(jì)算每個(gè)產(chǎn)品集在多個(gè)維度下的需求指數(shù),包括:
將分類(lèi)所得結(jié)果按產(chǎn)品集聚合,并使用權(quán)值訓(xùn)練所得的權(quán)值系數(shù),通過(guò)線(xiàn)性加權(quán)求和的方法計(jì)算每個(gè)產(chǎn)品集在多個(gè)維度下的需求指數(shù),所述需求指數(shù)包括瞬時(shí)需求指數(shù)、和/或累計(jì)需求指數(shù)、和/或歷史需求指數(shù)、和/或未來(lái)需求指數(shù)。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于:根據(jù)計(jì)算得到的瞬時(shí)需求指數(shù)結(jié)果計(jì)算所述未來(lái)需求指數(shù)、歷史需求指數(shù)、歷史細(xì)節(jié)指數(shù);其中,所述未來(lái)需求指數(shù)表示以當(dāng)前日期為界,對(duì)一個(gè)產(chǎn)品集的所有已計(jì)算的瞬時(shí)需求指數(shù)進(jìn)行累加求和;所述歷史需求指數(shù)表示以當(dāng)前日期為界,對(duì)一個(gè)產(chǎn)品集在特定時(shí)間段內(nèi)的所有瞬時(shí)指數(shù)進(jìn)行累加求和;所述歷史細(xì)節(jié)指數(shù)表示一個(gè)產(chǎn)品集在特定時(shí)間段內(nèi)任意一單位時(shí)間內(nèi)的瞬時(shí)指數(shù)。
9.一種旅客航班需求分析系統(tǒng),其特征在于,所述系統(tǒng)包括:
基礎(chǔ)數(shù)據(jù)處理模塊,用于進(jìn)行數(shù)據(jù)預(yù)處理得到航班查詢(xún)數(shù)據(jù);
行為模式分類(lèi)模塊,用于根據(jù)所述航班查詢(xún)數(shù)據(jù)進(jìn)行旅客查航班行為模式分類(lèi);
權(quán)值訓(xùn)練模塊,用于對(duì)所述分類(lèi)得到的旅客查詢(xún)航班行為類(lèi)別進(jìn)行權(quán)值訓(xùn)練;
指數(shù)計(jì)算模塊,用于根據(jù)所述權(quán)值訓(xùn)練的結(jié)果以及所述分類(lèi)得到的旅客查詢(xún)航班行為類(lèi)別,計(jì)算每個(gè)產(chǎn)品集在多個(gè)維度下的需求指數(shù);
前端展示模塊,用于將所述需求指數(shù)進(jìn)行前端展示。
10.根據(jù)權(quán)利要求9所述的系統(tǒng),其特征在于,所述基礎(chǔ)數(shù)據(jù)處理模塊,用于:對(duì)獲取并解析后的旅客查詢(xún)航班日志數(shù)據(jù)使用Hadoop分布式數(shù)據(jù)處理平臺(tái)進(jìn)行數(shù)據(jù)預(yù)處理,生成航班查詢(xún)數(shù)據(jù)并存儲(chǔ)到Hadoop分布式數(shù)據(jù)平臺(tái)的Hive組件中。
11.根據(jù)權(quán)利要求9所述的系統(tǒng),其特征在于,所述行為模式分類(lèi)模塊,用于:從Hadoop分布式數(shù)據(jù)處理平臺(tái)的Hive組件中讀取預(yù)處理生成的航班查詢(xún)數(shù)據(jù),通過(guò)不同渠道各自對(duì)應(yīng)的分類(lèi)決策樹(shù)進(jìn)行查詢(xún)航班行為分類(lèi),得到旅客查詢(xún)航班行為類(lèi)別的數(shù)據(jù)。
12.根據(jù)權(quán)利要求11所述的系統(tǒng),其特征在于,所述行為模式分類(lèi)模塊,還用于:將所述旅客查詢(xún)航班行為類(lèi)別的數(shù)據(jù)存儲(chǔ)到Hadoop分布式數(shù)據(jù)處理平臺(tái)的Hive組件中。
13.根據(jù)權(quán)利要求9所述的系統(tǒng),其特征在于,所述權(quán)值訓(xùn)練模塊,用于:使用模式搜索算法,通過(guò)迭代計(jì)算獲取每個(gè)旅客查詢(xún)航班行為類(lèi)別的權(quán)重。
14.根據(jù)權(quán)利要求9或13所述的系統(tǒng),其特征在于,所述權(quán)值訓(xùn)練模塊,具體用于:獲取訓(xùn)練樣本數(shù)據(jù),以訓(xùn)練樣本中所有產(chǎn)品的各查詢(xún)行為類(lèi)別的加權(quán)和與相應(yīng)的預(yù)訂量在給定的時(shí)間范圍內(nèi)變化趨勢(shì)一致性最大化為目標(biāo),使用模式搜索算法,計(jì)算最優(yōu)的權(quán)值,最終將得到的所有查詢(xún)航班行為類(lèi)別的權(quán)值系數(shù)輸出保存到IndexWeight.txt文件中。
15.根據(jù)權(quán)利要求9所述的系統(tǒng),其特征在于,所述指數(shù)計(jì)算模塊,用于:將分類(lèi)所得結(jié)果按產(chǎn)品集聚合,并使用權(quán)值訓(xùn)練所得的權(quán)值系數(shù),通過(guò)線(xiàn)性加權(quán)求和的方法計(jì)算每個(gè)產(chǎn)品集在多個(gè)維度下的需求指數(shù),所述需求指數(shù)包括瞬時(shí)需求指數(shù)、和/或累計(jì)需求指數(shù)、和/或歷史需求指數(shù)、和/或未來(lái)需求指數(shù)。
16.根據(jù)權(quán)利要求15所述的系統(tǒng),其特征在于,所述指數(shù)計(jì)算模塊,還用于:根據(jù)計(jì)算得到的瞬時(shí)需求指數(shù)結(jié)果計(jì)算所述未來(lái)需求指數(shù)、歷史需求指數(shù)、歷史細(xì)節(jié)指數(shù);其中,所述未來(lái)需求指數(shù)表示以當(dāng)前日期為界,對(duì)一個(gè)產(chǎn)品集的所有已計(jì)算的瞬時(shí)需求指數(shù)進(jìn)行累加求和;所述歷史需求指數(shù)表示以當(dāng)前日期為界,對(duì)一個(gè)產(chǎn)品集在特定時(shí)間段內(nèi)的所有瞬時(shí)指數(shù)進(jìn)行累加求和;所述歷史細(xì)節(jié)指數(shù)表示一個(gè)產(chǎn)品集在特定時(shí)間段內(nèi)任意一單位時(shí)間內(nèi)的瞬時(shí)指數(shù)。