專利名稱:基于公交ic卡線路的匹配方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種基于公交ic卡線路的匹配方法,屬于公交信息數(shù)據(jù)處理及集
成領(lǐng)域。
背景技術(shù):
傳統(tǒng)的公交客流調(diào)査是一項繁瑣和大量耗費人力、財力的工作,并且得出的數(shù)
據(jù)結(jié)果精度不高,實際操作非常困難,釆用基于公交IC卡信息處理公交客流信息, 具有低成本、高質(zhì)量等優(yōu)點,建立IC卡數(shù)據(jù)處理系統(tǒng),對現(xiàn)有IC卡數(shù)據(jù)進行深度
的挖掘處理,可以為不僅為日常調(diào)度提供依據(jù),也為線網(wǎng)優(yōu)化提供了參考。然而公 交基礎(chǔ)信息采集分析作為公交規(guī)劃和公交運營決策的基礎(chǔ),其研究還存在著一定的 不足。
現(xiàn)有的ic卡數(shù)據(jù)在記錄過程中會產(chǎn)生不規(guī)則的線路編碼與正常的線路編碼混
和在一起,對數(shù)據(jù)挖掘造成干擾.現(xiàn)在的公交線路有很大一部分比例是單次刷卡線路
的,在IC卡數(shù)據(jù)中沒有關(guān)于乘客上下車站點的記錄,因此要了解各個站點客流的時空
分布,必須對站點進行匹配,在匹配過程中還需在結(jié)合行車時刻表對首末站進行判斷。
發(fā)明內(nèi)容
本發(fā)明的目的在于,通過提供一種基于公交IC卡線路的匹配方法,以及全面、
準(zhǔn)確反映城市公交運營狀況及公交乘客公交出行特征的信息。為公交規(guī)劃者提供規(guī) 劃依據(jù),為公交管理者提供公交運營決策的依據(jù)。
本發(fā)明是采用以下技術(shù)手段實現(xiàn)的
一種基于公交IC卡線路的匹配方法,包括公交IC卡線路號的匹配、車輛行駛 方向匹配、以及基于聚類分析的上車站點判斷;
所述的公交IC卡線路號的匹配,包括以下步驟步驟1.1:按公交公司分類,并提取各公司的線路號,定義從公交IC卡中提取 的該公司的線路總數(shù)為Xl,實際現(xiàn)有的運營公交線路為X2;
步驟1.2:將提取各公司的線路號與實際公司擁有的運營公交線路進行比較,然 后進行初步匹配;
若X1<X2則說明IC卡記錄的線路數(shù)小于實際運營的線路,則導(dǎo)入的原始數(shù)據(jù) 出現(xiàn)問題,返回步驟l,重新檢査導(dǎo)入數(shù)據(jù);
若X^X2,則將提取的線路號與公司現(xiàn)有的線路作比較,線路號相同則匹配成 功,對未成功匹配的線路和剩余未匹配的實際公司線路數(shù)進行二次匹配;
若X1〉X2,則將提取的線路號與公司現(xiàn)有的線路作比較,線路號相同則匹配成 功,初步剔除刷卡為少量記錄的未匹配線路;
步驟1.3:依據(jù)公交IC卡站點屬性、車輛號、司機號的屬性對未匹配線路進行 二次匹配;
按照IC卡中單雙次刷卡等屬性匹配公司剩余線路數(shù);
對于雙次刷卡可通過上、下車站號的總站數(shù)匹配,對于單次刷卡線路則利用對 其刷卡時間進行聚類分析得出站點總數(shù),輔助線路號的匹配;
IC卡每條記錄都有車輛號、司機號的信息,配合公交線路行車計劃表對線路進 行匹配。
所述的車輛行駛方向匹配,包括正常的車輛的發(fā)車時間和起始站點、延誤而 不能按時到達終點站的調(diào)度運營信息、臨時調(diào)整發(fā)車的班次、司售人員工號、時間、 起始站點信息的數(shù)據(jù)庫。具體包括以下步驟
2.1:匹配司機編號;
2.2:匹配售票員編號;
2.3:根據(jù)發(fā)車計劃表、調(diào)度運營信息表確定起始站點; 2.4:增加IC卡數(shù)據(jù)中車輛行駛方向的信息; 所述的基于聚類分析的上車站點判斷,包括-運用時間聚類方法將乘坐同一車次乘客的刷卡記錄聚合成為一組;如果線路上每一個站點均有乘客刷卡,則產(chǎn)生的各組數(shù)據(jù)與公交線路沿途站點 --對應(yīng);
根據(jù)公交一卡通數(shù)據(jù)的刷卡時間記錄,線路編號、車輛編號與公交調(diào)度信息表 發(fā)生多對一的關(guān)系;跟據(jù)不同站點間刷卡時間差對刷卡數(shù)據(jù)進行聚類分析,選取合 適的時間差閾值;依據(jù)時間差閾值的選取,對上車站點進行識別。
小于所述時間差閾值的記錄信息為上游站點,大于所述時間差閾值的記錄信息 為下游站點。
前述的時間差閾值的選取標(biāo)準(zhǔn)為,站點間距離和公交的平均運行速度。 本發(fā)明與現(xiàn)有技術(shù)相比,具有以下明顯的優(yōu)勢和有益效果
本發(fā)明一種基于公交IC卡線路的匹配方法,由于將靜態(tài)信息與動態(tài)信息進行 了有機的結(jié)合,將提取各公司的線路號與實際公司擁有的線路進行比較,然后進行初 步匹配;依據(jù)公交IC卡站點屬性、車輛號、司機號等屬性對未匹配線路進行二次 匹配;
進行了車輛行駛方向匹配判斷,基于聚類分析的上車站點判斷,根據(jù)公交一卡 通數(shù)據(jù)的刷卡時間記錄,線路編號、車輛編號與公交調(diào)度信息表發(fā)生多對一的關(guān)系。 跟據(jù)不同站點間刷卡時間差對刷卡數(shù)據(jù)進行聚類分析。選取合適的時間差閾值,依 據(jù)閾值的選取,可以對上車站點進行識別,結(jié)合公交一卡通數(shù)據(jù)的聚類結(jié)果,即可 較為準(zhǔn)確判斷各上車站點。
圖1公交IC卡線路號匹配流程圖; 圖2車輛行駛方向匹配流程; 圖3上車站點識別流程。
具體實施例方式
下面結(jié)合附圖對本發(fā)明的具體實施例加以說明根據(jù)匹配內(nèi)容搭建本發(fā)明方法 實施平臺,請參閱圖1所示為本發(fā)明所給出的公交IC卡線路預(yù)處理流程圖,圖2為車輛 行駛方向匹配流程,圖3為上車站點識別流程圖進行本發(fā)明具體實施方案的詳細說 明
本發(fā)明總體實施框架是首先適用于在常規(guī)狀態(tài)下單次刷卡公交線路,對于公交 延誤特別大或緊急狀況下產(chǎn)生的站點匹配仍然存在偏差.
本發(fā)明具體實施步驟如下
第一步將公交IC卡原始數(shù)據(jù)導(dǎo)入到數(shù)據(jù)庫中,并添加各線路隸屬公司的字段.
按照不同的IC卡接口類型分別將IC卡原始數(shù)據(jù)導(dǎo)入到如oracle、 SQL等大 型數(shù)據(jù)庫中的不同表中,并將各線路按公司分類,提取IC卡各公交公司所運營的 線路信息。
第二步與現(xiàn)公司擁有線路作比較,進行線路號匹配;
將提取的線路號與公司現(xiàn)有的線路作比較,線路號相同則匹配成功,對未成功 匹配的線路和剩余的實際公司線路數(shù)進行二次匹配。通常情況下,數(shù)據(jù)集中未匹配 的線路數(shù)會大于或等于實際剩余線路數(shù),若出現(xiàn)小于的情況,則可能是導(dǎo)入的原始 數(shù)據(jù)出現(xiàn)問題,需重新檢查導(dǎo)入數(shù)據(jù);若數(shù)據(jù)集中未匹配的線路遠大于實際剩余線 路數(shù),則可以初步剔除一些刷卡記錄異常的線路。最后,按照IC卡中單雙次刷卡 等屬性匹配公司剩余線路數(shù)。對于雙次刷卡可通過上、下車站號的總站數(shù)匹配,對 于單次刷卡線路則利用對其刷卡時間進行聚類分析進行站點匹配,來輔助線路號的 匹配。此外還可以根據(jù)實際行車時刻表中的車輛號,司機號等信息進行線路號的匹 配
第三步與行車計劃表比較,確定線路的行駛方向。在公交線路行車計劃表中, 一般都詳細記錄著每個車輛的發(fā)車時間和起始站 點,尤其是每天首末三個班次的車輛, 一般情況下都嚴(yán)格按照行車計劃發(fā)車。其他 時段內(nèi),若某車輛在運營過程中出現(xiàn)較大延誤而不能按時到達終點站時,該事件將 被記錄在調(diào)度運營信息表中,臨時調(diào)整發(fā)車的班次、司售人員工號、時間、起始站 點等信息也被記錄,形成完整的事件數(shù)據(jù)庫。因此,利用線路行車計劃表以及調(diào)度 運營信息表中的車輛編號、司乘人員編號的信息,與IC卡數(shù)據(jù)中車輛編號、司售 人員編號信息進行匹配,進一步確定車輛的起始站點,從而確定車輛的行駛方向。
第四步利用聚類分析法,進行站點的匹配;
通過在車站刷卡上車的實際情況可以得知,乘坐同一車次乘客的刷卡數(shù)據(jù)在時 間上具有集中性,可以運用時間聚類方法將乘坐同一車次乘客的刷卡記錄聚合成為 一組。如果線路上每一個站點均有乘客刷卡,則產(chǎn)生的各組數(shù)據(jù)與公交線路沿途站 點一一對應(yīng)。但是實際中公交線路基本不可能每個站點均有乘客上車刷卡,所以通 過聚類分析公交一卡通數(shù)據(jù)只能統(tǒng)計到有刷卡乘客站點的刷卡數(shù)據(jù),而不能通過一 一對應(yīng)判斷各組數(shù)據(jù)對應(yīng)的公交站點。
跟據(jù)不同站點間刷卡時間差對刷卡數(shù)據(jù)進行聚類分析。選取合適的時間差閾 值,將小于閾值的歸為上游站點,大于閾值的記錄歸為下游站點。對于閾值的選取, 主要考慮站點間距離和公交的平均運行速度,可根據(jù)實際調(diào)査的數(shù)據(jù)判定。依據(jù)閾 值的選取,可以對上車站點進行識別,而刷卡時間可近似認(rèn)為是公交車輛在公交站 點的??繒r間,通過這兩個時間的匹配,結(jié)合公交一卡通數(shù)據(jù)的聚類結(jié)果,即可較 為準(zhǔn)確判斷各上車站點。
最后應(yīng)說明的是以上示例僅用以說明本發(fā)明而并非限制本發(fā)明所描述的技術(shù) 方案;因此,盡管本說明書參照上述的示例對本發(fā)明已進行了詳細的說明,但是, 本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解,仍然可以對本發(fā)明進行修改或等同替換;而一切 不脫離發(fā)明的精神和范圍的技術(shù)方案及其改進,其均應(yīng)涵蓋在本發(fā)明的權(quán)利要求范 圍當(dāng)中。
權(quán)利要求
1、一種基于公交IC卡線路的匹配方法,包括公交IC卡線路號的匹配、車輛行駛方向匹配、以及基于聚類分析的上車站點判斷;其特征在于所述的公交IC卡線路號的匹配,包括以下步驟步驟1.1按公交公司分類,并提取各公司的線路號,定義從公交IC卡中提取的該公司的線路總數(shù)為X1,實際現(xiàn)有的運營公交線路為X2;步驟1.2將提取各公司的線路號與實際公司擁有的運營公交線路進行比較,然后進行初步匹配;若X1<X2則說明IC卡記錄的線路數(shù)小于實際運營的線路,則導(dǎo)入的原始數(shù)據(jù)出現(xiàn)問題,返回步驟1,重新檢查導(dǎo)入數(shù)據(jù);若X1=X2,則將提取的線路號與公司現(xiàn)有的線路作比較,線路號相同則匹配成功,對未成功匹配的線路和剩余未匹配的實際公司線路數(shù)進行二次匹配;若X1>X2,則將提取的線路號與公司現(xiàn)有的線路作比較,線路號相同則匹配成功,初步剔除刷卡為少量記錄的未匹配線路;步驟1.3依據(jù)公交IC卡站點屬性、車輛號、司機號的屬性對未匹配線路進行二次匹配;按照IC卡中單雙次刷卡等屬性匹配公司剩余線路數(shù);對于雙次刷卡可通過上、下車站號的總站數(shù)匹配,對于單次刷卡線路則利用對其刷卡時間進行聚類分析得出站點總數(shù),輔助線路號的匹配;IC卡每條記錄都有車輛號、司機號的信息,配合公交線路行車計劃表對線路進行匹配;所述的車輛行駛方向匹配,包括正常的車輛的發(fā)車時間和起始站點、延誤而不能按時到達終點站的調(diào)度運營信息、臨時調(diào)整發(fā)車的班次、司售人員工號、時間、起始站點信息的數(shù)據(jù)庫;具體包括以下步驟2.1匹配司機編號;2.2匹配售票員編號;2.3根據(jù)發(fā)車計劃表、調(diào)度運營信息表確定起始站點;2.4增加IC卡數(shù)據(jù)中車輛行駛方向的信息;所述的基于聚類分析的上車站點判斷,包括運用時間聚類方法將乘坐同一車次乘客的刷卡記錄聚合成為一組;如果線路上每一個站點均有乘客刷卡,則產(chǎn)生的各組數(shù)據(jù)與公交線路沿途站點一一對應(yīng);根據(jù)公交一卡通數(shù)據(jù)的刷卡時間記錄,線路編號、車輛編號與公交調(diào)度信息表發(fā)生多對一的關(guān)系;跟據(jù)不同站點間刷卡時間差對刷卡數(shù)據(jù)進行聚類分析,選取合適的時間差閾值;依據(jù)時間差閾值的選取,對上車站點進行識別。
2、 根據(jù)權(quán)利要求1所述的基于公交IC卡線路的匹配方法,,其特征 在于小于所述時間差閾值的記錄信息為上游站點,大于所述時間差閾值 的記錄信息為下游站點。
3、 根據(jù)權(quán)利要求1所述的基于公交IC卡線路的匹配方法,,其特征 在于所述時間差閾值的選取標(biāo)準(zhǔn)為,站點間距離和公交的平均運行速度。
全文摘要
本發(fā)明公開了一種基于公交IC卡線路的匹配方法,屬于公交信息數(shù)據(jù)處理及集成領(lǐng)域。包括公交IC卡線路號的匹配、車輛行駛方向匹配、以及基于聚類分析的上車站點判斷;依據(jù)公交IC卡站點屬性、車輛號、司機號的屬性對未匹配線路進行多次匹配;根據(jù)公交一卡通數(shù)據(jù)的刷卡時間記錄,線路編號、車輛編號與公交調(diào)度信息表發(fā)生多對一的關(guān)系;跟據(jù)不同站點間刷卡時間差對刷卡數(shù)據(jù)進行聚類分析,選取合適的時間差閾值;依據(jù)時間差閾值的選取,對上車站點進行識別。對IC卡數(shù)據(jù)進行篩選、集成、規(guī)約等預(yù)處理,之后進行深入挖掘,最終獲得線路的站點客流。為公交規(guī)劃者提供規(guī)劃依據(jù),為公交管理者提供公交運營決策的依據(jù)。
文檔編號G08G1/00GK101540098SQ20091008330
公開日2009年9月23日 申請日期2009年4月30日 優(yōu)先權(quán)日2009年4月30日
發(fā)明者尹長勇, 陳紹輝, 陳艷艷 申請人:北京工業(yè)大學(xué)