本發(fā)明涉及大數(shù)據(jù)預(yù)測(cè)領(lǐng)域,特別涉及一種基于旅游大數(shù)據(jù)的游客流量預(yù)測(cè)及峰值調(diào)控方法。
背景技術(shù):
截止2015年底,我國(guó)國(guó)內(nèi)旅游人數(shù)超過(guò)41億人次,旅游收入約4.13萬(wàn)億元,旅游業(yè)對(duì)GDP的綜合貢獻(xiàn)超過(guò)教育、銀行、汽車(chē)行業(yè),占比高達(dá)10.51%。根據(jù)國(guó)家旅游局公布的2016年國(guó)慶節(jié)假日旅游市場(chǎng)信息,僅國(guó)慶黃金周期間全國(guó)共接待游客5.93億。旅游市場(chǎng)的繁榮在推動(dòng)旅游產(chǎn)業(yè)發(fā)展的同時(shí),對(duì)景區(qū)和旅游城市提出了更高的要求,如何利用數(shù)據(jù)有效獲得游客流量數(shù)據(jù)預(yù)測(cè),有預(yù)見(jiàn)性的進(jìn)行游客的疏導(dǎo)調(diào)控,從而提高景區(qū)的服務(wù)質(zhì)量,提升游客的旅游體驗(yàn)。
目前,為解決上述問(wèn)題,國(guó)家旅游局已發(fā)出通知要求各地建立健全景區(qū)游客流量控制機(jī)制。但是從目前全國(guó)各地的旅游業(yè)發(fā)展情況來(lái)看,景區(qū)和旅游城市尚缺乏完善的游客流量預(yù)測(cè)與峰值調(diào)控機(jī)制。傳統(tǒng)的游客流量預(yù)測(cè)大多只從門(mén)票銷售入手,數(shù)據(jù)來(lái)源單一,沒(méi)有充分利用旅游智慧化產(chǎn)生的旅游大數(shù)據(jù),統(tǒng)計(jì)結(jié)果具有片面性,統(tǒng)計(jì)準(zhǔn)確性不足。缺乏有效的游客流量預(yù)測(cè)預(yù)警數(shù)據(jù)支撐,使得景區(qū)和旅游城市的游客調(diào)控方法仍停留在廣播提示、交通管制、消費(fèi)價(jià)格調(diào)控等傳統(tǒng)路徑上,沒(méi)有充分利用互聯(lián)網(wǎng)手段,實(shí)現(xiàn)線上和線下的互動(dòng),進(jìn)行游客流量的引導(dǎo),調(diào)控景區(qū)峰值游客數(shù)量。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于克服現(xiàn)有技術(shù)中的游客流量預(yù)測(cè)方法缺乏數(shù)據(jù)支撐,統(tǒng)計(jì)結(jié)果準(zhǔn)確性不足等缺陷,從而提供一種基于旅游大數(shù)據(jù)的游客流量預(yù)測(cè)及峰值調(diào)控方法。
為了實(shí)現(xiàn)上述目的,本發(fā)明提供了一種基于旅游大數(shù)據(jù)的游客流量預(yù)測(cè)方法,包括:
步驟101)、采集旅游大數(shù)據(jù),建立預(yù)測(cè)樣本;其中,
所述旅游大數(shù)據(jù)包括歷史客流數(shù)據(jù)y1、社交網(wǎng)絡(luò)熱力數(shù)據(jù)y2、OTA瀏覽數(shù)據(jù)y3、周邊城市游客數(shù)據(jù)y4、交通流量數(shù)據(jù)y5;所述預(yù)測(cè)樣板包括一個(gè)或多個(gè)時(shí)間段內(nèi)的旅游大數(shù)據(jù);
步驟102)、建立客流量預(yù)測(cè)模型,并基于所述預(yù)測(cè)樣本求取所述客流量預(yù)測(cè)模型中的參數(shù);其中,所述客流量預(yù)測(cè)模型為:
其中的Z為預(yù)測(cè)客流量,αk為對(duì)應(yīng)樣本數(shù)據(jù)的計(jì)算參數(shù),αk為預(yù)測(cè)修訂常量,e是去除影響后的隨機(jī)誤差,yk為預(yù)測(cè)樣板中的數(shù)據(jù);αk、αk為所述客流量預(yù)測(cè)模型中的待求參數(shù);
步驟103)、由步驟102)所得到的客流量預(yù)測(cè)模型計(jì)算游客流量的預(yù)測(cè)初始值;
步驟104)、根據(jù)景區(qū)在預(yù)測(cè)日的天氣預(yù)報(bào)校正游客流量的預(yù)測(cè)值。
上述技術(shù)方案中,在所述的步驟102)中,采用多元線性回歸的最小二乘法求取所述客流量預(yù)測(cè)模型中的參數(shù)。
上述技術(shù)方案中,所述步驟104)包括:
首先根據(jù)預(yù)測(cè)景區(qū)的天氣預(yù)報(bào),計(jì)算人體舒適度指數(shù),該指數(shù)的計(jì)算公式如下:
ssd=(1.818t+18.18)(0.88+0.002f)+(t-32)/(45-t)-3.2v+18.2;
其中,t為平均氣溫,f為相對(duì)濕度,v為風(fēng)速;
然后根據(jù)ssd值校正參數(shù)β;具體包括:若50<ssd<76,β=1.25,若25<ssd<51或75<ssd<86,β=1;若ssd<26或ssd>85,β=0.85;
最后在得到校正參數(shù)β后,對(duì)預(yù)測(cè)初始值進(jìn)行校正,取得校正后的景區(qū)預(yù)測(cè)客流量Zβ:
Zβ=βZ;
Z為預(yù)測(cè)初始值。
本發(fā)明還提供了一種游客流量峰值調(diào)控方法,包括:
步驟201)、將所述基于旅游大數(shù)據(jù)的游客流量預(yù)測(cè)方法所得到的某一景區(qū)的游客流量預(yù)測(cè)值與該景區(qū)的接待游客能力進(jìn)行比較,根據(jù)比較結(jié)果將該景區(qū)劃分為峰值調(diào)控景區(qū)或余量充足景區(qū);其中,
所述峰值調(diào)控景區(qū)為游客流量預(yù)測(cè)值大于景區(qū)的接待游客能力,所述余量充足景區(qū)為游客流量預(yù)測(cè)值小于景區(qū)的接待游客能力;
步驟202)、計(jì)算峰值調(diào)控景區(qū)與余量充足景區(qū)之間的單體調(diào)控阻力系數(shù);其中,所述單體調(diào)控阻力系數(shù)是衡量峰值調(diào)控景區(qū)與余量充足景區(qū)之間調(diào)控游客難度的無(wú)量綱指標(biāo),由景區(qū)間距離、景區(qū)間消費(fèi)差額、景區(qū)吸引力比值共同決定;
步驟203)、基于步驟202)得到的單體調(diào)控阻力系數(shù)構(gòu)建峰值調(diào)控計(jì)算模型;其中,所述峰值調(diào)控計(jì)算模型要求峰值游客調(diào)控的總阻力最小,其表達(dá)式為:
其中C為總的調(diào)控阻力,cij為從峰值調(diào)控景區(qū)pi調(diào)度游客到余量充足景區(qū)vj的單體調(diào)控阻力系數(shù),xij為從峰值調(diào)控景區(qū)pi調(diào)度游客到余量充足景區(qū)vj的游客量;
步驟204)、基于步驟203)所建立的峰值調(diào)控計(jì)算模型,計(jì)算預(yù)計(jì)客流分配情況,確定游客峰值調(diào)控景區(qū)對(duì)應(yīng)的余量充足景區(qū);
步驟205)、基于步驟204)的結(jié)果進(jìn)行游客誘導(dǎo)。
上述技術(shù)方案中,所述步驟202)包括:
步驟202-1)、峰值調(diào)控景區(qū)pi與余量景區(qū)vj之間進(jìn)行調(diào)度,計(jì)算兩景區(qū)之間的單體調(diào)控交通消費(fèi)tij;其中,dij為景區(qū)之間的距離,為當(dāng)?shù)刈廛?chē)費(fèi)用平均單價(jià);
步驟202-2)、計(jì)算峰值調(diào)控景區(qū)pi、余量景區(qū)vj之間的預(yù)計(jì)游客消費(fèi)差額;其中,
預(yù)計(jì)游客消費(fèi)差額分別為峰值調(diào)控景區(qū)pi、余量景區(qū)vj預(yù)計(jì)游客消費(fèi)平均值;
步驟202-3)、計(jì)算景區(qū)吸引力指數(shù)比;若峰值調(diào)控景區(qū)pi、余量景區(qū)vj的景區(qū)OTA網(wǎng)絡(luò)評(píng)分分別為si、sj,則景區(qū)吸引力指數(shù)比為sij=si/sj;
步驟202-4)、對(duì)單體調(diào)控交通消費(fèi)tij、預(yù)計(jì)游客消費(fèi)差額wij進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化處理:
步驟202-5)、根據(jù)之前計(jì)算得到的兩景區(qū)之間的單體調(diào)控交通消費(fèi)tij、兩景區(qū)之間的預(yù)計(jì)游客消費(fèi)差額wij、景區(qū)吸引力指數(shù)比sij,計(jì)算兩景區(qū)之間的單體調(diào)控難度系數(shù):
上述技術(shù)方案中,所述步驟204)包括:遍歷峰值調(diào)控計(jì)算模型中的所有的單體調(diào)控阻力系數(shù)cij,找到調(diào)控消費(fèi)最低的一條路徑優(yōu)先分配,取xij=min(pi,vj);循環(huán)往復(fù),直至所有的xij均完成取值,即獲得峰值景區(qū)游客調(diào)控目的地和預(yù)計(jì)接納人數(shù)。
上述技術(shù)方案中,在所述步驟205)中采用三級(jí)調(diào)控模式進(jìn)行游客誘導(dǎo),包括:
設(shè)定閾值x1、x2,當(dāng)xij<x1時(shí),采用一級(jí)誘導(dǎo)模式調(diào)控,在景區(qū)附近以廣播等方式誘導(dǎo)游客向目的地景區(qū)轉(zhuǎn)移;
當(dāng)x1<xij<x2時(shí),采用二級(jí)誘導(dǎo)模式調(diào)控,在景區(qū)附近進(jìn)行廣播誘導(dǎo)之外,在通向景區(qū)的交通路段進(jìn)行交通廣播、區(qū)域信號(hào)燈控制,引導(dǎo)車(chē)流量像目的地景區(qū)轉(zhuǎn)移;
當(dāng)xij>x2時(shí),采用三級(jí)誘導(dǎo)模式調(diào)控,全網(wǎng)化發(fā)布游客誘導(dǎo)信息,在充分調(diào)動(dòng)前兩級(jí)誘導(dǎo)手段的同時(shí),利用微信公眾平臺(tái)、WEB網(wǎng)站、移動(dòng)APP、OTA進(jìn)行消息發(fā)布,從行前開(kāi)始進(jìn)行游客誘導(dǎo)調(diào)控。
本發(fā)明的優(yōu)點(diǎn)在于:
本發(fā)明綜合多通道的客流量預(yù)測(cè)可以有效提升景區(qū)對(duì)客流量控制的準(zhǔn)確度和有效性,在預(yù)測(cè)的基礎(chǔ)上根據(jù)調(diào)控阻力系數(shù)進(jìn)行峰值調(diào)控,可以有效緩解景區(qū)的管理壓力,提高運(yùn)營(yíng)效率,從而更好的服務(wù)游客,釋放景區(qū)的管控壓力。
附圖說(shuō)明
圖1是本發(fā)明的基于旅游大數(shù)據(jù)的游客流量預(yù)測(cè)方法的流程圖;
圖2是本發(fā)明的游客流量峰值調(diào)控方法的流程圖;
圖3是客流預(yù)測(cè)樣本的結(jié)構(gòu)示意圖;
圖4是峰值調(diào)控模型的示意圖;
圖5是單體調(diào)控阻力系數(shù)的影響因子的示意圖。
具體實(shí)施方式
現(xiàn)結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步的描述。
參考圖1,本發(fā)明的基于旅游大數(shù)據(jù)的游客流量預(yù)測(cè)方法包括:
第一步:讀取旅游大數(shù)據(jù),建立預(yù)測(cè)樣本。
參考圖3,本發(fā)明使用的旅游大數(shù)據(jù)包括歷史客流數(shù)據(jù)y1、社交網(wǎng)絡(luò)熱力數(shù)據(jù)y2、OTA瀏覽數(shù)據(jù)y3、周邊城市游客數(shù)據(jù)y4、交通流量數(shù)據(jù)y5。這些數(shù)據(jù)共同構(gòu)成預(yù)測(cè)樣本,即某天客流數(shù)據(jù)的預(yù)測(cè)樣本為Y{y1,y2,y3,y4,y5}。
第二步:基于所述預(yù)測(cè)樣本,建立客流量預(yù)測(cè)模型。
預(yù)測(cè)客流量Z按式進(jìn)行計(jì)算。其中,αk為對(duì)應(yīng)樣本數(shù)據(jù)的計(jì)算參數(shù),α0為預(yù)測(cè)修訂常量,e是去除影響后的隨機(jī)誤差。
根據(jù)預(yù)測(cè)客流量Z的上述計(jì)算公式,在n組預(yù)測(cè)樣本數(shù)據(jù){Y1,Y2,…,Yn}的基礎(chǔ)上,建立客流量預(yù)測(cè)模型{Z1,Z2,…,Zn},可表示為:
其中,該客流量預(yù)測(cè)模型中的參數(shù)值αik(i=1,2,……,n;k=1,2,……,5)為未知值,其在后續(xù)步驟中進(jìn)行計(jì)算。
第三步:對(duì)所述客流量預(yù)測(cè)模型中的參數(shù)進(jìn)行求解,從而得到客流量預(yù)測(cè)模型。在參數(shù)求解時(shí),采用了多元線性回歸的最小二乘法,即:使客流量實(shí)際值與預(yù)測(cè)值之間的離差平方和最小,進(jìn)行參數(shù)初始化計(jì)算:
在上述計(jì)算公式中,、yk(k=1、2、3、4、5)可從前述的n組預(yù)測(cè)樣本數(shù)據(jù)中獲取,為已知值;Z可由歷史的真實(shí)客流數(shù)據(jù)得到,為已知值;六個(gè)參數(shù)α0,α1,α2,α3,α4,α5為未知值,通過(guò)上述六組關(guān)系式,可計(jì)算出六個(gè)參數(shù)的值。
在實(shí)現(xiàn)時(shí),可將n組預(yù)測(cè)樣本數(shù)據(jù)隨機(jī)組合為n/6個(gè)計(jì)算組,通過(guò)上述六組關(guān)系式,得到n/6組α0,α1,α2,α3,α4,α5,最后通過(guò)取平均確定最后的參數(shù)值α0,α1,α2,α3,α4,α5。
第四步:計(jì)算預(yù)測(cè)初始值。
根據(jù)第三步求得的旅游客流預(yù)測(cè)參數(shù),代入計(jì)算求得預(yù)測(cè)日當(dāng)日客流量Z的初始值。
第五步:校正預(yù)測(cè)日當(dāng)日客流量Z的預(yù)測(cè)值。
在校正預(yù)測(cè)值時(shí),首先根據(jù)預(yù)測(cè)景區(qū)的天氣預(yù)報(bào),計(jì)算人體舒適度指數(shù),該指數(shù)的計(jì)算公式如下:
ssd=(1.818t+18.18)(0.88+0.002f)+(t-32)/(45-t)-3.2v+18.2;
其中,t為平均氣溫,f為相對(duì)濕度,v為風(fēng)速。
以ssd值對(duì)應(yīng)校正參數(shù)β,50<ssd<76,β=1.25,25<ssd<51或75<ssd<86,β=1,ssd<26或ssd>85,β=0.85。
在得到校正參數(shù)β后,對(duì)預(yù)測(cè)初始值進(jìn)行校正,取得校正后的景區(qū)預(yù)測(cè)客流量:
Zβ=βZ。
在本發(fā)明的游客流量預(yù)測(cè)方法所得到的景區(qū)預(yù)測(cè)客流值的基礎(chǔ)上,本發(fā)明的游客流量峰值調(diào)控方法能夠?qū)τ慰土髁窟M(jìn)行調(diào)控,如圖2所示,該方法包括:
第六步:將景區(qū)預(yù)測(cè)客流值Zβ與景區(qū)接待游客能力Zmax進(jìn)行差額比較,若Zβ>Zmax則景區(qū)處于峰值待調(diào)控狀態(tài),待調(diào)控游客量p=Zβ-Zmax;若Zβ<Zmax則景區(qū)處于余量充足狀態(tài),可接待游客余量v=Zmax-Zβ。
第七步:景區(qū)劃分。
根據(jù)游客流量預(yù)測(cè),將景區(qū)劃分為峰值調(diào)控景區(qū)集和余量充足景區(qū)集。峰值調(diào)控景區(qū)集包含m個(gè)待調(diào)控景區(qū),記為P1,P2…Pm,其待調(diào)控游客量為p1、p2…pm。余量充足景區(qū)集包含n個(gè)可平衡游客景區(qū),記為V1,V2…Vn,其游客容納能力為v1、v2…vn。
第八步:計(jì)算峰值調(diào)控景區(qū)與余量充足景區(qū)之間的單體調(diào)控阻力系數(shù)。其中,所述單體調(diào)控阻力系數(shù)是衡量峰值調(diào)控景區(qū)與余量充足景區(qū)之間調(diào)控游客難度的無(wú)量綱指標(biāo),如圖5所示,由景區(qū)間距離、景區(qū)間消費(fèi)差額、景區(qū)吸引力比值共同決定。該步驟具體包括:
峰值調(diào)控景區(qū)pi與余量景區(qū)vj之間進(jìn)行調(diào)度,兩景區(qū)之間的單體調(diào)控交通消費(fèi)tij,景區(qū)之間的距離為dij,當(dāng)?shù)刈廛?chē)費(fèi)用平均單價(jià)為則
計(jì)算兩景區(qū)之間的預(yù)計(jì)游客消費(fèi)差額,pi、vj景區(qū)預(yù)計(jì)游客消費(fèi)平均值分別為
計(jì)算景區(qū)吸引力指數(shù)比,若pi、vj景區(qū)OTA網(wǎng)絡(luò)評(píng)分分別為si、sj,則景區(qū)吸引力指數(shù)比為sij=si/sj。
對(duì)tij、wij進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化處理:
根據(jù)之前計(jì)算得到的兩景區(qū)之間的單體調(diào)控交通消費(fèi)tij、兩景區(qū)之間的預(yù)計(jì)游客消費(fèi)差額wij、景區(qū)吸引力指數(shù)比sij,計(jì)算兩景區(qū)之間的單體調(diào)控難度系數(shù):
第九步:構(gòu)建峰值調(diào)控計(jì)算模型。
如圖4所示,假設(shè)峰值游客調(diào)控的總阻力的表達(dá)式為:調(diào)控過(guò)程中力求其調(diào)控阻力最小。即:
其中C為總的調(diào)控阻力,cij為從峰值調(diào)控景區(qū)pi調(diào)度游客到余量充足景區(qū)vj的單體調(diào)控阻力系數(shù),xij為從峰值調(diào)控景區(qū)pi調(diào)度游客到余量充足景區(qū)vj的游客量。
第十步:計(jì)算預(yù)計(jì)客流分配情況,確定游客峰值調(diào)控景區(qū)對(duì)應(yīng)的余量充足景區(qū)。
在該步驟中,遍歷所有的單體調(diào)控阻力系數(shù)cij,找到調(diào)控消費(fèi)最低的一條路徑優(yōu)先分配,取xij=min(pi,vj)。如此循環(huán),直至所有的xij均完成取值。即獲得峰值景區(qū)游客調(diào)控目的地和預(yù)計(jì)接納人數(shù)。
第十一步:按照第十步的結(jié)果進(jìn)行游客誘導(dǎo),按照預(yù)計(jì)調(diào)控客流量設(shè)定三級(jí)調(diào)控模式。設(shè)定閾值x1、x2,xij<x1時(shí),采用一級(jí)誘導(dǎo)模式調(diào)控,在景區(qū)附近以廣播等方式誘導(dǎo)游客向目的地景區(qū)轉(zhuǎn)移。x1<xij<x2時(shí),采用二級(jí)誘導(dǎo)模式調(diào)控,在景區(qū)附近進(jìn)行廣播誘導(dǎo)之外,在通向景區(qū)的交通路段進(jìn)行交通廣播、區(qū)域信號(hào)燈控制,引導(dǎo)車(chē)流量像目的地景區(qū)轉(zhuǎn)移。xij>x2時(shí),采用三級(jí)誘導(dǎo)模式調(diào)控,全網(wǎng)化發(fā)布游客誘導(dǎo)信息,在充分調(diào)動(dòng)前兩級(jí)誘導(dǎo)手段的同時(shí),利用微信公眾平臺(tái)、WEB網(wǎng)站、移動(dòng)APP、OTA進(jìn)行消息發(fā)布,從行前開(kāi)始進(jìn)行游客誘導(dǎo)調(diào)控。
本發(fā)明綜合使用歷史客流數(shù)據(jù)、社交網(wǎng)絡(luò)熱力數(shù)據(jù)、OTA瀏覽數(shù)據(jù)、周邊城市游客數(shù)據(jù)、交通流量數(shù)據(jù)建立多元回歸模型,進(jìn)行參數(shù)擬合,獲得參數(shù)擬合值后進(jìn)行指定日期的預(yù)測(cè)。初始預(yù)測(cè)完成后,根據(jù)天氣信息,對(duì)初始預(yù)測(cè)值做修訂。在客流預(yù)測(cè)的基礎(chǔ)上對(duì)景區(qū)進(jìn)行分類,根據(jù)預(yù)測(cè)值將景區(qū)劃分為峰值調(diào)控景區(qū)和余量重組景區(qū),計(jì)算景區(qū)之間的調(diào)控阻力系數(shù),利用游客調(diào)控分配模型,計(jì)算求解得到游客調(diào)控分配數(shù)值,依據(jù)分配數(shù)值對(duì)各調(diào)控景區(qū)實(shí)施不同的調(diào)控手段,在兩類景區(qū)之間進(jìn)行游客調(diào)度,以實(shí)現(xiàn)景區(qū)之間客流量的平衡分配。綜合多通道的客流量預(yù)測(cè)可以有效提升景區(qū)對(duì)客流量控制的準(zhǔn)確度和有效性,在預(yù)測(cè)的基礎(chǔ)上根據(jù)調(diào)控阻力系數(shù)進(jìn)行峰值調(diào)控,可以有效緩解景區(qū)的管理壓力,提高運(yùn)營(yíng)效率,從而更好的服務(wù)游客,釋放景區(qū)的管控壓力。
最后所應(yīng)說(shuō)明的是,以上實(shí)施例僅用以說(shuō)明本發(fā)明的技術(shù)方案而非限制。盡管參照實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)說(shuō)明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解,對(duì)本發(fā)明的技術(shù)方案進(jìn)行修改或者等同替換,都不脫離本發(fā)明技術(shù)方案的精神和范圍,其均應(yīng)涵蓋在本發(fā)明的權(quán)利要求范圍當(dāng)中。