本發(fā)明涉及公交IC卡乘客下車站點的判斷方法。
背景技術(shù):
公交IC卡收費系統(tǒng)在運行過程中產(chǎn)生大量的刷卡交易數(shù)據(jù),其數(shù)據(jù)具有采集方便、樣本量大、連續(xù)記錄等優(yōu)點,挖掘這些數(shù)據(jù)背后的信息,能夠為城市公共交通系統(tǒng)的規(guī)劃和管理提供科學的決策依據(jù)。公交IC卡收費系統(tǒng)有一票制收費和分段收費兩類收費制式,其中一票制收費是國內(nèi)、外最普遍的收費方式。一票制系統(tǒng)具有無人售票、方便乘客等優(yōu)點,在現(xiàn)在和未來仍將為最主要的收費方式。一票制收費僅在上車刷卡,乘客下車站點信息無法直接得到,現(xiàn)有方法只能判斷出部分乘車的下車站點,這成為應用IC數(shù)據(jù)分析公交出行信息的瓶頸。現(xiàn)有方法是利用公交出行鏈的特征進行下車站點判斷,出行鏈是指以家為起點和終點將居民一天當中各種目的出行按發(fā)生順序聯(lián)接起來所形成的若干閉合鏈。出行鏈描述的是居民從家出發(fā)再返回家這樣一個過程,這個過程中包含時間、空間、方式和活動類型信息,而且這些信息之間是相互聯(lián)系和相互作用的?;诔鲂墟湹南萝囌军c推算方法最早用來分析軌道交通乘客的出站站點。國外大部分城市軌道交通系統(tǒng)只在進站刷卡,乘客的出站站點沒有記錄,為了獲得軌道交通乘客的出行OD(起點和終點),紐約市城市公交機構(gòu)(2002)利用軌道交通乘客出行形成的出行鏈來推算乘客的出站站點。推算采用了2條假設:(1)同一乘客上一次乘車的終點,為一下次乘車的起點。(2)同一乘客一天最后一次出行的終點,為同一天第一次出行的起點。Jinhua Zhao(2007)在上述2條假設基礎上,對地鐵客流的OD估計方法進行改進,利用地鐵與公交的前后乘車站點之間的空間關(guān)系、乘客出行模式的對稱關(guān)系推算芝加哥市地鐵乘客的出站站點。這種利用同一卡號兩次刷卡的時間和空間關(guān)系推算公交IC卡乘客下車站點的方法一般基于以下3個假設:(1)“下一次出行”(Next Trip)假設:同一乘客在同一天中公交乘車的終點大多接近下一次乘車的起點。(2)“最后一次出行”(Last Trip)假設:同一乘客在同一天中最后一次乘車的終點接近同一天第一次乘車的起點。(3)“返程出行”(Return Trip)假設:同一乘客在同一天中如果連續(xù)兩次乘車的線路相同,方向(上行和下行)相反,則第一次乘車的終點為第二次乘車的起點,第一次乘車的起點為第二次乘車的終點。出行鏈方法精度較高,但需要乘客公交出行鏈連續(xù)時才能應用,造成大量乘車記錄無法判斷下車站點,如全天只有1次乘車時。
技術(shù)實現(xiàn)要素:
本發(fā)明的目的在于提供一種基于歷史出行模式判斷公交IC卡乘客下車站點的方法。
為達到上述目的,本發(fā)明采用了以下技術(shù)方案:
采集智能公交系統(tǒng)數(shù)據(jù),通過對公交IC卡數(shù)據(jù)和智能調(diào)度系統(tǒng)數(shù)據(jù)的關(guān)聯(lián)獲得公交乘客的上車站點信息。
應用通勤OD估計方法判斷公交通勤乘客及其居住地和工作地站點信息。取出1條公交出行記錄,如果該記錄公交卡號為通勤乘客卡號,且刷卡時間為高峰時段,則判斷此次出行為通勤出行。若該次通勤出行公交線路的下游方向存在工作地站點或居住地站點或兩者附近站點,則判斷該站點為下車站點。若該次出行上車站點為居住地站點或工作地站點或兩者附近站點,則判定該次出行為直達通勤出行,否則為非直達通勤出行。
應用出行鏈方法推算公交IC卡乘客下車站點,將已知上、下車站點信息的歷史公交出行作為關(guān)聯(lián)出行匹配的基礎數(shù)據(jù)。依次應用以下4條假設進行當日下車站點的判斷:(1)同一乘客當日和往日的兩次公交乘車,如果乘車線路、乘車方向相同,上車站點相同或接近,則當日的下車站點與往日的下車站點相同或接近。(2)同一乘客當日和往日的兩次公交乘車,如果乘車線路相同而乘車方向相反,那么當日乘車的下車站點是往日乘車的上車站點或附近站點(3)同一乘客當日和往日的兩次公交乘車,如果乘車線路不同,乘車方向相同,上車站點相同或接近,且當日乘車線路下游存在與往日乘車線路下車站點相同或接近的站點,則此站點為當日乘車的下車站點。(4)同一乘客當日和往日的兩次公交乘車,如果乘車線路不同,乘車方向相反,且當日乘車線路下游存在與往日乘車上車站點相同或接近的站點,則此站點為當日乘車時的下車站點。
本發(fā)明的有益效果體現(xiàn)在:
本發(fā)明所述基于歷史出行模式判斷公交IC卡乘客下車站點的方法,能夠?qū)怀鲂墟湶贿B續(xù)條件下的下車站點進行判斷,該方法在現(xiàn)有出行鏈方法的基礎上,僅用了5個工作日的部分公交線路數(shù)據(jù)進行了實驗,即可將工作日下車站點推算成功的比例提高了12.16%,準確率達到87.89%。隨著智能公交系統(tǒng)的日益普及和運算能力的提高,應用整個城市更長時段的公交線路數(shù)據(jù)進行計算時,下車站點判斷成功的比例和精度還能夠得到進一步提高。
具體實施方式
下面結(jié)合實施例對本發(fā)明作進一步說明。
1.基本思路
公交乘客的交通行為具有很強的時空規(guī)律性,即大部分人都是在家和工作單位兩點之間展開出行,而出行時間和地點呈現(xiàn)24小時周期性,公交乘客長期的出行規(guī)律是在空間尺度和時間尺度的制約下產(chǎn)生的。根據(jù)公交乘客長期出行的時空規(guī)律性,分別提出基于通勤出行模式和關(guān)聯(lián)出行模式兩種判斷下車站點的思路。
(1)基于通勤出行模式的下車站點判斷思路
通勤交通是指居民在居住地和工作地(學校)之間的往返過程。在居民的日常公交出行中,通勤出行占了很大的比重。從居民長期公交出行的上車站點信息可以判斷出其早、晚高峰經(jīng)常性的乘車站點,從而能夠確定出乘客的居住地站點和工作地站點。根據(jù)得到的通勤OD信息可能判斷通勤出行的下車站點,按照是否為直達通勤出行,具體分為以下2種情況討論。
1)直達公交通勤出行的下車站點判斷
直達的公交通勤出行指乘客乘坐的是居住地站點和工作地站點之間的直達公交線路,不需要換乘其它線路或其他交通方式就可以完成通勤出行。對于直達通勤出行,若乘客在工作日早高峰首次乘坐的站點為居住地站點或附近站點,且乘坐線路下游存在工作地站點或附近站點,則可判定該站點為本次乘車的下車站點;若乘客在工作日晚高峰首次乘坐的站點為工作地站點或附近站點,且乘坐線路下游存在居住地站點或附近站點,則可判定該站點為本次乘車的下車站點。
2)非直達公交通勤出行的下車站點判斷
非直達公交通勤出行是指乘客需要通過換乘其他公交線路或其他交通方式完成通勤,主要有4種模式:a)公交+公交;b)其他交通方式+公交;c)公交+其他交通方式;d)其他交通方式+公交+其他交通方式。對于模式a和模式b的最后一次乘車,若該次乘車線路下游方向存在某站點為工作地站點或居住地站點或附近站點,則此可將此站點判斷為下車站點。對于模式c和模式d,其公交乘車的下車站點距離工作地與居住地較遠,根據(jù)通勤OD信息無法判斷。
(2)基于關(guān)聯(lián)出行模式的下車站點判斷思路
公交乘客除了在通勤出行上具有高度的規(guī)律性以外,在其他目的公交出行上也表現(xiàn)出一定的時空規(guī)律。例如,在不同日期,公交乘客經(jīng)常在相近時間的相近站點上車,在相近時間的相近站點下車。對于公交乘客當天的出行,可能從該乘客往日的出行數(shù)據(jù)中找出具有時空關(guān)聯(lián)性的出行進行匹配,來判斷當日出行的下車站點。根據(jù)對乘客長期公交出行時空規(guī)律的觀察,提出以下4條假設進行的下車站點判斷。
假設1:(同線路同方向匹配)同一乘客當日和往日的兩次公交乘車,如果乘車線路、乘車方向相同,上車站點相同或接近,則當日的下車站點與往日的下車站點相同或接近。
假設2:(同線路反方向匹配)同一乘客當日和往日的兩次公交乘車,如果乘車線路相同而乘車方向相反,那么當日乘車的下車站點是往日乘車的上車站點或附近站點。
假設3:(不同線路同方向匹配)同一乘客當日和往日的兩次公交乘車,如果乘車線路不同,乘車方向相同,上車站點相同或接近,且當日乘車線路下游存在與往日乘車線路下車站點相同或接近的站點,則此站點為當日乘車的下車站點。
假設4:(不同線路反方向匹配)同一乘客當日和往日的兩次公交乘車,如果乘車線路不同,乘車方向相反,且當日乘車線路下游存在與往日乘車上車站點相同或接近的站點,則此站點為當日乘車時的下車站點。
2.算法實現(xiàn)
基于以上基本思路,提出基于歷史出行模式的公交IC乘客下車站點判斷算法。
Step1:應用現(xiàn)有的出行鏈方法推算同1個星期5個工作日的公交IC卡乘客下車站點。
Step2:應用現(xiàn)有的公交通勤OD估計方法識別該星期的通勤乘客卡號,并判斷其居住地和工作地站點。
Step3:將Step1出行鏈方法無法推算下車站點的公交出行數(shù)據(jù)提取出來,并將Step2得到的通勤OD數(shù)據(jù)作為應用通勤出行模式判斷下車站點基礎數(shù)據(jù)。
Step4:取出1條公交出行記錄,如果該記錄公交卡號為通勤乘客卡號,且刷卡時間為高峰時段,則判斷此次出行為通勤出行。
Step5:若該次通勤出行公交線路的下游方向存在工作地站點或居住地站點或兩者附近站點,則判斷該站點為下車站點。若該次出行上車站點為居住地站點或工作地站點或兩者附近站點,則判定該次出行為直達通勤出行,否則為非直達通勤出行。
Step6:將Step5通勤出行模式未能判斷下車站點的記錄提取出來,并將Step1出行鏈方法已判斷出下車站點的記錄作為應用關(guān)聯(lián)出行模式判斷下車站點的基礎數(shù)據(jù)。
Step7:取出1條公交出行記錄,依次應用關(guān)聯(lián)出行模式的假設1~4推算下車站點。
以上算法,采用VB.NET語言編程實現(xiàn)。
3.算法實驗
本發(fā)明采集了2008年12月南寧市57條智能公交線路的系統(tǒng)運營數(shù)據(jù),包括公交IC卡數(shù)據(jù)、公交GPS數(shù)據(jù)、公交站點坐標數(shù)據(jù)和公交運行記錄數(shù)據(jù),公交IC卡數(shù)據(jù)來自公交自動收費系統(tǒng),其他3種數(shù)據(jù)來自公交智能調(diào)度系統(tǒng)。在SQL-Server 2008數(shù)據(jù)庫導入原始數(shù)據(jù)并進行數(shù)據(jù)預處理,將智能調(diào)度系統(tǒng)數(shù)據(jù)與公交IC卡數(shù)據(jù)關(guān)聯(lián)確定出2008年12月1日(周一)-2008年12月5日(周五)公交IC卡乘客的上車站點,作為本發(fā)明算法實驗數(shù)據(jù),字段描述見表1。
表1.研究數(shù)據(jù)字段描述
運行算法Step1,應用出行鏈方法計算12月1日-12月5日全天出行2次以上卡號的公交乘客的下車站點。以12月5日為例,出行鏈方法推算出全天乘車2次以上出行下車站點的比例為88.43%,占全部實驗數(shù)據(jù)155 815條(含全天出行1次的記錄37 712條)的67.03%,推算失敗的原因是公交出行鏈不連續(xù)。計算結(jié)果統(tǒng)計見表2。
表2.出行鏈方法計算結(jié)果統(tǒng)計
運行算法Step2,基于12月1日-12月5日數(shù)據(jù)計算通勤乘客卡號、居住地站點和工作地站點,得到通勤出行OD,運算結(jié)果統(tǒng)計見表3。
表3.通勤OD運算結(jié)果統(tǒng)計
運行算法Step3-Step7計算12月5日出行鏈方法無法判斷下車站點的記錄,共計51376條,包括全天出行1次的記錄37 712條和Step1推算失敗的記錄13 664條。以Step1得到的12月1日(周一)-12月4日(周四)的計算結(jié)果和Step2得到的通勤OD分布數(shù)據(jù)作為Step3-Step7判斷下車站點的基礎數(shù)據(jù)。
算法全部運行結(jié)束,12月5日全天出行1次的記錄37 712條,判斷出下車站點的記錄為13 279條,占35.21%。Step1出行鏈方法無法推算的記錄13 664條,判斷出下車站點的記錄為5 627條,占41.18%。基于歷史出行模式方法推算出12月5日下車站點的記錄為18 906條,推算成功的比例為36.80%,占全部實驗數(shù)據(jù)155 815條的12.13%。算法實驗結(jié)果統(tǒng)計見表4。
表4.算法實驗結(jié)果統(tǒng)計
Table 4 Statistics of the algorithm operation results
4.算法驗證
(1)驗證思路
根據(jù)紐約城市公交機構(gòu)的研究結(jié)果,出行鏈方法推算下車站點的準確率在90%以上。將2008年12月5日利用出行鏈方法推算出下車站點的記錄提取出來,再次應用基于歷史出行模式的方法判斷這部分記錄的下車站點,然后比較兩種方法推算結(jié)果的一致性(距離小于1 000m認為一致)。若兩種方法推算下車站點的一致率為A,假設出行鏈方法的正確率為90%,則可認為基于歷史出行模式判斷方法的正確率為A/90%。
(2)驗證結(jié)果
提取2008年12月5日出行鏈方法判斷出下車站點的記錄104 439條,應用歷史出行模式方法再次判斷得到66 869條公交出行記錄的下車站點,經(jīng)過比較,兩種方法推算結(jié)果一致的記錄為52 893條,一致率為79.10%,則基于歷史出行模式判斷下車站點的準確率為87.89%(79.10%/90%),算法驗證結(jié)果見表5。
表5.算法驗證結(jié)果
5.結(jié)論
根據(jù)長期公交出行具有的時空規(guī)律性,本發(fā)明提出了基于歷史出行模式判斷公交IC卡乘客下車站點的方法,該方法能夠?qū)怀鲂墟湶贿B續(xù)條件下的下車站點進行判斷。通過算法試驗和精度分析,該方法在現(xiàn)有研究的基礎上將工作日下車站點推算成功的比例提高了12.16%,準確率達到87.89%。本發(fā)明僅用了5個工作日的部分公交線路數(shù)據(jù)進行了實驗,隨著智能公交系統(tǒng)的日益普及和運算能力的提高,應用整個城市更長時段的公交線路數(shù)據(jù)進行計算時,下車站點判斷成功的比例和精度還能夠得到進一步提高。