本發(fā)明涉及智能化公共交通技術(shù)領(lǐng)域,尤其涉及一種基于公交OD數(shù)據(jù)的公交換乘識別方法。
背景技術(shù):
近年來,智能公交系統(tǒng)如公交IC卡收費系統(tǒng)和車輛GPS系統(tǒng)在各個城市的廣泛應(yīng)用,產(chǎn)生了海量數(shù)據(jù),這些數(shù)據(jù)具有真實、準(zhǔn)確、樣本量大、更新快等特點,可以真實地描述城市公交運營情況和居民公交出行特征,越來越多的學(xué)者通過對這兩個系統(tǒng)數(shù)據(jù)進(jìn)行挖掘分析得到公交OD信息。而通過公交OD信息可以對公交系統(tǒng)進(jìn)行換乘識別,公交系統(tǒng)的換乘識別分析可以獲得更加完善的公交客流信息和換乘信息,這對于城市公共交通系統(tǒng)特別是公交換乘樞紐的規(guī)劃和設(shè)計有著重要意義。
目前的公交IC卡收費系統(tǒng)有兩種,一種是分段計費系統(tǒng),其在乘客上車和下車都需刷卡從而可以記錄乘客的上下車相關(guān)信息,另一種是一票制計費系統(tǒng),其只要求乘客在上車時刷卡,因此只記錄了乘客的上車信息,可知這兩種系統(tǒng)都沒有對公交乘客的換乘信息做記錄。目前的公交系統(tǒng)中,大部分采用一票制收費系統(tǒng),國內(nèi)外最早是通過連續(xù)兩次刷卡時間間隔來進(jìn)行一票制收費系統(tǒng)的公交換乘識別,如將刷卡時間間隔小于60min的連續(xù)兩次公交出行中的第2次乘車定義為換乘行為。這種方法簡單易操作,但是若第一次乘車時間過長或過短,則會出現(xiàn)漏判或錯判。針對這個問題,有研究提出通過GPS信息判斷出下車站點及下車時間從而得到換乘時間,看是否小于給定的判斷閾值,進(jìn)而判斷出乘客2次乘車是換乘行為還是出行行為。這種方法排除了前一次乘車車內(nèi)時間的干擾,但用于判斷的時間閾值大多是根據(jù)經(jīng)驗給出且為固定值,不能適應(yīng)目前復(fù)雜多變的公交系統(tǒng),且也可能錯判一些短時間的活動行為。因此,后來有研究提出了可變參數(shù)換乘識別方法,即針對不同類型的換乘方式分別給出換乘時間參數(shù)的表達(dá)式,分別得到各線路公交車的時間約束閾值。當(dāng)前關(guān)于換乘行為識別的研究基本都是從時間角度上進(jìn)行判斷,僅從時間角度,容易將乘客在下車站點附近進(jìn)行的短時活動行為(如接送孩子上下學(xué)等)誤判為換乘行為。有部分研究考慮了空間角度,但也僅僅考慮了換乘距離這一因素,沒有分析乘客出行整個過程的空間特征,換乘識別準(zhǔn)確性不夠高。
技術(shù)實現(xiàn)要素:
為了克服現(xiàn)有技術(shù)存在的缺點與不足,本發(fā)明提供一種基于公交OD數(shù)據(jù)的公交換乘識別方法,在現(xiàn)有基于智能公交信息系統(tǒng)數(shù)據(jù)判斷公交刷卡乘客上下車站點研究的基礎(chǔ)上得到公交刷卡乘客的OD數(shù)據(jù)后,提取出單個公交刷卡乘客一天且大于一條刷卡記錄的公交OD數(shù)據(jù),從時間和空間兩個方面綜合時間方面對公交乘客進(jìn)行換乘識別,時間方面主要是從乘客的站臺候車時間及最大候車時間閾值進(jìn)行比較識別,空間方面將乘客的換乘步行距離、迂回系數(shù)、直達(dá)系數(shù)三個參數(shù)與其分別設(shè)定的閾值進(jìn)行比較識別,只有在時間和空間兩個方面都滿足要求才識別為換乘,提高了換乘識別的精度。
為解決上述技術(shù)問題,本發(fā)明提供如下技術(shù)方案:一種基于公交OD數(shù)據(jù)的公交換乘識別方法,包括如下步驟:
S1、提取單個乘客一天的公交OD數(shù)據(jù),若該乘客當(dāng)天的公交OD數(shù)據(jù)只有一條記錄,則判定出行不是換乘,若超過一條記錄,則按時間先后進(jìn)行排序,并從第1條OD記錄開始;
S2、順序遍歷該乘客相鄰的兩條OD記錄的線路號是否相同,所述相鄰的兩條OD記錄分別為第i條OD記錄與第i+1條OD記錄,若相同,則判定乘客沒有進(jìn)行換乘,數(shù)據(jù)指針移向下一條乘車記錄,重復(fù)步驟S2;若不相同,則進(jìn)入下一步;
S3、求當(dāng)前一次乘車的下車站點與下一次乘車的上車站點間的步行距離,并將步行距離與步行換乘距離閾值進(jìn)行比較,若步行距離大于步行換乘距離閾值,則判定乘客下一次乘車為二次出行,數(shù)據(jù)指針移向下一條乘車記錄,回到步驟S2;若步行距離小于或等于步行換乘距離閾值,則進(jìn)入下一步;
S4、計算相鄰兩次乘車記錄間的迂回系數(shù),并將迂回系數(shù)與迂回系數(shù)閾值進(jìn)行比較,若迂回系數(shù)大于迂回系數(shù)閾值,則判定乘客第二次乘車為二次出行,數(shù)據(jù)指針移向下一條乘車記錄,回到步驟S2;若迂回系數(shù)小于或等于迂回系數(shù)閾值,則進(jìn)入下一步;
S5、將線路站點信息數(shù)據(jù)中每條線路的站點提取出來構(gòu)成一個站點集合,提取當(dāng)天乘客前一條乘車記錄的上車站點和后一條乘車記錄的下車站點構(gòu)成公交出行OD集合;若OD集合屬于任一線路的站點集合,則判定第二次乘車為二次出行,數(shù)據(jù)指針移向下一條乘車記錄,回到步驟S2,否則,進(jìn)入下一步;
S6、確定乘客到達(dá)下一個上車站點的時間;根據(jù)乘客到達(dá)下一個上車站點的時間,確定乘客在下一個上車站點的站臺候車時間;確定乘客的最大候車時間閾值;進(jìn)行公交換乘識別,若站臺候車時間大于最大候車時間閾值,則第二次乘車為二次出行,反之,則為換乘行為;若當(dāng)前記錄不是當(dāng)天乘客出行的最后一條OD記錄,則數(shù)據(jù)指針移向下一條乘車記錄,回到步驟S2;若當(dāng)前記錄是該乘客最后一條OD記錄,則提取當(dāng)天下一名乘客的乘車OD記錄,回到步驟S1。
進(jìn)一步地,所述步驟S1中的公交OD數(shù)據(jù)由公交IC卡數(shù)據(jù)挖掘分析所得到,所述公交OD數(shù)據(jù)包括:公交IC卡號、車牌號、線路號、上車站點、上車時間、下車站點、下車時間和公交車輛GPS運行數(shù)據(jù);所述公交車輛GPS運行數(shù)據(jù)包括線路號、車牌號、站點名稱、進(jìn)站時間、出站時間以及各線路的站點信息、各站點的地理坐標(biāo)信息。
進(jìn)一步地,所述步驟S2具體為:
對當(dāng)天乘客相鄰兩條記錄的線路號Li及Li+1進(jìn)行判斷,若Li=Li+1,則判定相鄰兩次乘車的線路號相同,乘客并沒有進(jìn)行換乘行為,判定乘客為兩次公交出行;若Li≠Li+1,則進(jìn)入步驟S3;其中,在判定乘客第二次乘車為二次出行后,搜索下一乘客的一天的公交OD數(shù)據(jù),若無下一乘客的公交OD數(shù)據(jù),則停止結(jié)束,若有則返回步驟S1。
進(jìn)一步地,所述步驟S3具體為:
求第i次乘車的下車站點與第i+1次乘車的上車站點間的步行距離D并與步行換乘距離閾值Dmax進(jìn)行比較,若D>Dmax,則第i+1次乘車為二次出行,數(shù)據(jù)指針移向下一條乘車記錄,返回步驟S2;若D≤Dmax,則進(jìn)入步驟S4。
進(jìn)一步地,所述換乘距離閾值Dmax取值范圍為300-500m。
進(jìn)一步地,所述步驟S4具體為:
計算相鄰兩次刷卡記錄間的迂回系數(shù)C,將其與迂回系數(shù)閾值Cmax比較,若C>Cmax,則第二次乘車為二次出行,數(shù)據(jù)指針移向下一條乘車記錄,返回步驟S2;若C<Cmax,則進(jìn)入步驟S5。
進(jìn)一步地,所述迂回系數(shù),其表達(dá)式如下:
其中,Ki為乘客上一次乘坐公交的距離,即車輛從乘客上車站點至下車站點間的走行距離;Ki+1為乘客后次乘坐公交的距離;Di為乘客的步行距離;Ki,i+1為乘客上一次乘車的上車站點至后次乘車的下車站點間的直線距離。
進(jìn)一步地,所述步驟S5具體為:
將線路站點信息數(shù)據(jù)中每條線路的站點提取出來構(gòu)成一個站點集合Wj,Wj表示線路j的站點集合,1≤j≤N,N為城市公交線路的線路總數(shù);提取當(dāng)天前一條刷卡記錄的上車站點Bi和后一條刷卡記錄的下車站點Ai+1構(gòu)成公交出行OD集合{Bi,Ai+1},若{Bi,Ai+1}屬于任一線路站點集合Wj,則直達(dá)系數(shù)等于1,第二次乘車為二次出行,數(shù)據(jù)指針移向下一條乘車記錄,返回步驟S2,否則,進(jìn)入步驟S6。
進(jìn)一步地,所述S6具體為:
S61)確定乘客到達(dá)下一個上車站點的時間:
根據(jù)前后兩條記錄的步行距離及乘客的平均步行速度v,可以得到乘客的步行時間Tw=D/v,乘客到達(dá)下一個上車站點的時間Tarr=TAi+Tw;
S62、確定乘客在下一個上車站點的候車時間:
乘客的站臺候車時間等于乘客在下個站點的上車時間減去其到達(dá)該站點的時間,即TL=TB(i+1)-Tarr;
S63、確定乘客的最大候車時間閾值:
乘客最大候車時間閾值等于乘客在下個站點的上車時間與同一線路上個班次公交車到達(dá)該上車站點的時間間隔,根據(jù)線路號及上車站點名稱及上車時間,可在GPS數(shù)據(jù)里查找得到上一班次公交車的的到站時間Tg,則最大候車時間閾值TLmax=TB(i+1)-Tg;
S64、進(jìn)行公交換乘識別:
若TL大于最大候車時間閾值TLmax,則第二次乘車為二次出行;反之,則為換乘行為,若當(dāng)前記錄不是當(dāng)天乘客出行的最后一條OD記錄,則數(shù)據(jù)指針移向下一條乘車記錄,回到步驟S2;若當(dāng)前記錄是該乘客最后一條OD記錄,則提取當(dāng)天下一名乘客的乘車OD記錄,回到步驟S1。
采用上述技術(shù)方案后,本發(fā)明至少具有如下有益效果:
(1)本發(fā)明根據(jù)乘客在公交出行時偏好選擇不迂回、直達(dá)的路線,提出迂回系數(shù)和直達(dá)系數(shù)作為公交換乘識別的參數(shù),可以有效的將進(jìn)行短時活動的公交出行從換乘識別的結(jié)果中剔除出來,提高了公交換乘識別的準(zhǔn)確率;
(2)與傳統(tǒng)換乘識別采用的固定時間閾值不同,本發(fā)明采用兩輛車實時的到站間隔作為候車時間閾值進(jìn)行公交換乘時間方面的識別,針對復(fù)雜動態(tài)的公交系統(tǒng),具有較強的靈活性;
(3)本發(fā)明分析的OD數(shù)據(jù)是通過融合公交IC卡和公交GPS數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘分析可得,可較為完整和準(zhǔn)確地提取公交乘客的出行信息,同時充分考慮公交乘客的出行特征,數(shù)據(jù)采集方便且準(zhǔn)確率高,為公交換乘識別提供可靠的數(shù)據(jù)支持;
(4)本發(fā)明方法考慮因素全面,實用性強,很大程度地提高公交換乘識別的準(zhǔn)確率,且為后面的公交換乘系統(tǒng)的優(yōu)化提供豐富、及時的決策依據(jù)。
附圖說明
圖1是本發(fā)明一種基于公交OD數(shù)據(jù)的公交換乘識別方法的步驟流程圖。
具體實施方式
需要說明的是,在不沖突的情況下,本申請中的實施例及實施例中的特征可以相互結(jié)合,下面結(jié)合附圖和具體實施例對本申請作進(jìn)一步詳細(xì)說明。
如圖1所示,本發(fā)明提供一種基于公交OD數(shù)據(jù)的公交換乘識別方法,其步驟如下:
(1)提取單個乘客一天的公交OD數(shù)據(jù),并按時間進(jìn)行排序;
(2)基于換乘識別的前提條件判斷;
(3)基于換乘步行距離的換乘識別;
(4)基于迂回系數(shù)的換乘識別;
(5)基于直達(dá)系數(shù)的換乘識別;
(6)基于站臺候車時間的換乘識別。
進(jìn)一步地,所述步驟(1)的具體過程為:
提取單個乘客一天的公交OD數(shù)據(jù),公交OD數(shù)據(jù)由公交IC卡數(shù)據(jù)挖掘分析所得到,所述公交OD數(shù)據(jù)包括:公交IC卡號、車牌號、線路號、上車站點、上車時間、下車站點、下車時間和公交車輛GPS運行數(shù)據(jù);所述公交車輛GPS運行數(shù)據(jù)包括線路號、車牌號、站點名稱、進(jìn)站時間、出站時間以及各線路的站點信息、各站點的地理坐標(biāo)信息,若該乘客當(dāng)天只有一條記錄,則該次出行不是換乘,若超過一條記錄,則按時間先后進(jìn)行排序;
所述步驟(2)的具體過程為:對當(dāng)天乘客相鄰兩條記錄的線路號Li及Li+1進(jìn)行判斷,若Li=Li+1,說明相鄰兩次乘車線路號相同,乘客并沒有進(jìn)行換乘行為,判斷為兩次公交出行;若Li≠Li+1,則進(jìn)入第(3)步。
所述步驟(3)中,求第i次乘車的下車站點與第i+1次乘車的上車站點間的步行距離D并與步行換乘距離閾值Dmax進(jìn)行比較,若D>Dmax,則第i+1次乘車為二次出行;若D≤Dmax,則進(jìn)入第(4)步。所述換乘距離閾值通常取值范圍為300-500m。
所述步驟(4)中,計算相鄰兩次乘車記錄間的迂回系數(shù)C,將其與迂回系數(shù)閾值Cmax比較,若C>Cmax,則第二次乘車為二次出行;若C<Cmax,則進(jìn)入第(5)步,迂回系數(shù)表達(dá)式如下:
其中,Ki為乘客前次乘坐公交的距離(即車輛從上車站點至下車站點間的走行距離),Ki+1為乘客后次乘坐公交的距離,Di為乘客的步行距離,Ki,i+1為乘客前次乘車的上車站點至后次乘車的下車站點間的直線距離。
所述步驟(5)中,將線路站點信息數(shù)據(jù)中每條線路的站點提取出來構(gòu)成一個站點集,Wj表示線路j的站點集合,1≤j≤N,N為城市公交線路的線路總數(shù),提取當(dāng)天乘客前一條乘車記錄的上車站點Bi和后一條乘車記錄的下車站點Ai+1構(gòu)成公交出行OD集{Bi,Ai+1},若{Bi,Ai+1}屬于任一線路站點集合Wj,則直達(dá)系數(shù)等于1,第二次乘車為二次出行,否則,進(jìn)入第(6)步。
所述步驟(6)中,具體過程如下:
(61)確定乘客到達(dá)下一個上車站點的時間:
根據(jù)前后兩條記錄的步行距離及乘客的平均步行速度v(取值1.2m/s),可以得到乘客的步行時間Tw=D/v,乘客到達(dá)下一個上車站點的時間Tarr=TAi+Tw;
(62)確定乘客在下一個上車站點的站臺候車時間:
乘客的站臺候車時間等于乘客在下個站點的上車時間減去其到達(dá)該站點的時間,即TL=TB(i+1)-Tarr;
(63)確定乘客的最大候車時間閾值:
乘客最大候車時間閾值等于乘客在下個站點的上車時間與同一線路上個班次公交車到達(dá)該上車站點的時間間隔,根據(jù)線路號及上車站點名稱及上車時間,可在GPS數(shù)據(jù)里查找得到上一班次公交車的的到站時間Tg,則最大候車時間閾值TLmax=TB(i+1)-Tg;
(64)進(jìn)行公交換乘識別
若TL大于最大候車時間閾值TLmax,則第二次乘車為二次出行,反之,則為換乘行為。
有益效果:與現(xiàn)有技術(shù)相比,本發(fā)明具有以下優(yōu)點:
(1)本發(fā)明根據(jù)乘客在公交出行時偏好選擇不迂回、直達(dá)的路線,提出迂回系數(shù)和直達(dá)系數(shù)作為公交換乘識別的參數(shù),可以有效的將進(jìn)行短時活動的公交出行從換乘識別的結(jié)果中剔除出來,提高了公交換乘識別的準(zhǔn)確率;
(2)與傳統(tǒng)換乘識別采用的固定時間閾值不同,本發(fā)明采用兩輛車實時的到站間隔作為候車時間閾值進(jìn)行公交換乘時間方面的識別,針對復(fù)雜動態(tài)的公交系統(tǒng),具有較強的靈活性;
(3)本發(fā)明分析的OD數(shù)據(jù)是通過融合公交IC卡和公交GPS數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘分析可得,可較為完整和準(zhǔn)確地提取公交乘客的出行信息,同時充分考慮公交乘客的出行特征,數(shù)據(jù)采集方便且準(zhǔn)確率高,為公交換乘識別提供可靠的數(shù)據(jù)支持。
其中,上述步驟中,本方法針對的是每個乘客個體進(jìn)行識別,輸入數(shù)據(jù)為單個乘客某一天內(nèi)的OD記錄。
綜上所述,本發(fā)明方法考慮因素全面,實用性強,很大程度地提高公交換乘識別的準(zhǔn)確率,且為后面的公交換乘系統(tǒng)的優(yōu)化提供豐富、及時的決策依據(jù)。
實施例
以某市已匹配完成上下車站點的公交OD數(shù)據(jù)為例,選取某乘客一天內(nèi)公交OD記錄,采用本發(fā)明對該乘客進(jìn)行公交換乘識別,具體過程如下所示:
步驟一:提取乘客一天的公交OD記錄如表1所示,由于乘車記錄超過1條,因此將記錄按時間先后順序排列;
表1公交乘客出行OD信息表格
步驟二:基于換乘識別的前提條件判斷中,由于第一條乘車記錄的線路號L1=K5,第二條刷卡記錄的線路號L2=609,L1≠L2,進(jìn)入步驟三。
步驟三:基于換乘步行距離的換乘識別中,設(shè)步行換乘距離閾值Dmax=500米,計算得第一條記錄與第二條紀(jì)錄間的步行距離D=444米<500米,進(jìn)入步驟四。
步驟四:基于迂回系數(shù)的換乘識別中,根據(jù)線路站點信息及各站點經(jīng)緯度信息,可以算出第一條記錄與第二條記錄間的迂回系數(shù)為14.5,根據(jù)經(jīng)驗值將迂回系數(shù)閾值Cmax設(shè)定為1.7。迂回系數(shù)遠(yuǎn)遠(yuǎn)大于設(shè)定的閾值,說明乘客連續(xù)兩次乘車路線過于迂回,第二次乘車不是換乘為二次出行,公交換乘識別結(jié)束。
盡管已經(jīng)示出和描述了本發(fā)明的實施例,對于本領(lǐng)域的普通技術(shù)人員而言,可以理解的是,在不脫離本發(fā)明的原理和精神的情況下可以對這些實施例進(jìn)行多種等效的變化、修改、替換和變型,本發(fā)明的范圍由所附權(quán)利要求及其等同范圍限定。