本發(fā)明屬于交通智能管理和控制技術領域,具體涉及一種基于生存分析參數(shù)分布的公交站臺毗鄰區(qū)公交車旅行時間評價模型構建方法。
背景技術:
隨著經(jīng)濟發(fā)展和城鎮(zhèn)化進程加快,人們出行頻率的增加和生活就業(yè)半徑的擴大,對公共交通服務水平及公交站臺覆蓋率提出更高的要求,因此近年公交站臺設施建設速度加快,是公共交通運營系統(tǒng)的重要保障和支撐。然而,在公交站臺毗鄰區(qū)公交車運營效率低下已經(jīng)成為制約城市公交發(fā)展的主要問題之一,由于機動車與公交車的相互作用和違規(guī)行為影響、非機動車與公交車的交互作用和違規(guī)行為等因素,嚴重影響了公交車在公交站臺毗鄰區(qū)內(nèi)的行駛時間和相應到站??糠瘴恢煤蜁r間,從而增加公交車的延誤時間和行駛危險性,也對城市公共交通的正常運行和市民便捷出行產(chǎn)生影響,成為制約公共交通發(fā)展的一大瓶頸。
現(xiàn)有研究不能在公交站臺毗鄰區(qū)內(nèi)公交車運行的影響因素進行判別,也不能在影響因素干擾下公交車的理論旅行時間進行定量計算,因此公共交通管理相關部門無法對公交站臺毗鄰區(qū)公交車運營進行正確評價。而目前交通管理相關部門只是定性化做出相應的措施,如增加視頻監(jiān)測影響旅行時間的影響因素并進行相應管理,但相關部門沒有充分運用實際數(shù)據(jù),實時對公交車旅行時間進行鑒別,更不能對公交車運營后評價進行定量和定性化的系統(tǒng)研究,并沒有從相關研究中得到很好的解答。因此應將公交站臺毗鄰區(qū)公交車旅行時間的定量化研究納入到城市公交規(guī)劃建設中,并根據(jù)公交車運行狀態(tài)評價采取應對措施來提高公交車的運營效率,實際也是以人為本、公交優(yōu)先的一個具體體現(xiàn)。
技術實現(xiàn)要素:
發(fā)明目的:針對現(xiàn)有技術中對公交站臺毗鄰區(qū)公交車旅行時間后評價研究的不足,本發(fā)明基于現(xiàn)有智能交通控制與管理技術提出了一種基于生存分析參數(shù)分布的公交車旅行時間評價模型構建方法,基于本發(fā)明構建的模型能夠定量評估公交車旅行時間,從而可以針對其顯著影響因素實施有效的管控措施。
技術方案:為實現(xiàn)上述發(fā)明目的,本發(fā)明的技術方案為:
一種基于生存分析參數(shù)分布的公交車旅行時間模型構建方法,包括如下步驟:
(1)將公交站臺毗鄰區(qū)劃分為上游、站臺和下游區(qū)間,采集公交站臺毗鄰區(qū)視頻數(shù)據(jù),獲取每輛車在三個區(qū)間的旅行時間以及相對應的影響變量數(shù)據(jù);
(2)將公交站臺毗鄰區(qū)公交車旅行時間比擬為生存分析中時間持續(xù)期,假設其近似服從多種參數(shù)分布從而建立不同生存分析模型,通過相關性分析計算影響變量之間的相關系數(shù),得到相關性較低的影響變量,并帶入服從參數(shù)分布的生存分析模型中求解,選取最優(yōu)模型;
(3)對最優(yōu)參數(shù)生存分析模型的概率密度函數(shù)進行積分得到期望函數(shù),作為公交車旅行時間評價模型。
所述步驟(1)中,所述影響變量包括小汽車違規(guī)時間比例、非機動車違規(guī)時間比例、小汽車流量、非機動車流量、公交車??繒r間、公交車延誤、公交車停靠位置和公交車是否換道。
所述步驟(2)中,服從多種參數(shù)分布形式包括指數(shù)、威布爾、對數(shù)正態(tài)、Gompertz和廣義Gamma分布。
所述步驟(2)中,數(shù)值型變量之間的相關性用簡單Pearson相關系數(shù)來衡量;順序變量與順序變量或與數(shù)值型變量之間的相關性,用Spearman相關系數(shù)來衡量;涉及到分類變量的相關性用交叉列聯(lián)表中對稱度量的相關性指標來體現(xiàn)。
所述步驟(2)中,對每一個特定的參數(shù)分布計算AIC和BIC值,選取AIC或BIC值最小,或AIC和BIC值均最小的作為最優(yōu)參數(shù)模型。
有益效果:本發(fā)明方法基于生存分析參數(shù)分布構建公交車旅行時間評價模型,方法簡單易行,評價模型準確性高,可以基于本發(fā)明構建的模型通過影響變量的輸入數(shù)據(jù),計算理論公交車旅行時間,從而為運營管理者針對影響變量實施管控措施提供理論依據(jù),并可預測變量對于旅行時間影響變化情況,便于運營管理者為用戶提供更好的公交車運營信息服務,從而提供公交競爭力,使用本發(fā)明方法構建的理論模型計算公交站臺毗鄰區(qū)公交車旅行時間具有實際工程應用價值。
附圖說明
圖1為本發(fā)明實施例的方法流程圖。
圖2為本發(fā)明實施例中公交站臺檢測點和劃分區(qū)間具體示意圖。
圖3為下游區(qū)間公交車旅行時間期望值與實際觀察值之間的擬合關系圖。
具體實施方式
下面結合具體實施例,進一步闡明本發(fā)明,應理解這些實施例僅用于說明本發(fā)明而不用于限制本發(fā)明的范圍,在閱讀了本發(fā)明之后,本領域技術人員對本發(fā)明的各種等價形式的修改均落于本申請所附權利要求所限定的范圍。
如圖1所示,本發(fā)明實施例公開的一種基于生存分析參數(shù)分布的公交車旅行時間模型構建方法,主要包括如下步驟:
(1)獲取每輛公交車在站臺毗鄰區(qū)的上游、站臺和下游三個區(qū)間的旅行時間以及相對應的影響變量數(shù)據(jù)。將公交站臺毗鄰區(qū)分為上游、站臺和下游三個區(qū)間,將每輛公交車作為研究對象,通過視頻設備采集公交站臺毗鄰區(qū)公交車在三個區(qū)間視頻數(shù)據(jù),并從視頻數(shù)據(jù)中獲取每輛公交車在三個區(qū)間的旅行時間數(shù)據(jù),以及每輛車旅行時間相對應的影響變量數(shù)據(jù)。
(2)將旅行時間比擬為生存分析中時間持續(xù)期,構建旅行時間近似服從不同參數(shù)分布的生存分析模型,并將相關性較低的影響變量帶入模型中求解進而選取最優(yōu)模型。公交站臺毗鄰區(qū)內(nèi)的公交車旅行時間,屬于廣義生存時間的范圍,可將其比擬為生存分析中時間持續(xù)期,從而運用生存分析方法進行研究。旅行時間為公交車通過相應區(qū)間行駛狀態(tài)的持續(xù),存在明顯的持續(xù)期過程起始時刻-持續(xù)時間-結束時刻。
公交車旅行時間分布可用以下概率概率密度函數(shù)、生存函數(shù)和風險函數(shù)來描述。假設公交站臺毗鄰區(qū)內(nèi)的公交車旅行時間近似服從某個參數(shù)分布,則可以運用數(shù)學性質(zhì)更好的參數(shù)模型進行分析。且參數(shù)方法中旅行時間有多種可供選擇的分布形式,如指數(shù)、威布爾、對數(shù)正態(tài)、Gompertz和廣義Gamma分布等。
建立公交車旅行時間評價模型前,先需要對數(shù)據(jù)的質(zhì)量進行相關性檢查。可通過相關性分析計算變量之間的相關系數(shù),來檢驗兩變量(或樣本)間的相關性。數(shù)值型變量之間的相關性可直接用簡單Pearson相關系數(shù)來衡量;順序變量與順序變量或與數(shù)值型變量之間的相關性,需要用Spearman相關系數(shù);而涉及到分類變量的相關性則需要用交叉列聯(lián)表中對稱度量的相關性指標來體現(xiàn)。在刪除任何高度相關的變量時,還需要結合來自其它研究的信息,若其它研究表明給出的變量對因變量有重要影響,則它仍應該保留。
確定各協(xié)變量之間都不存在較強得相關性,將選取變量帶入服從參數(shù)分布生存分析模型中求解,常采用AIC(Akaike information criterion)和BIC(Baysian information criterion)指標不僅能衡量特定參數(shù)模型中變量優(yōu)劣性,而且可用來選擇最優(yōu)的參數(shù)模型。對每一個特定的參數(shù)分布可以計算AIC和BIC值,選取AIC或BIC值最小,或AIC和BIC值均最小的作為最優(yōu)參數(shù)模型,表明該模型擬合效果越佳。
(3)結合選取得最優(yōu)參數(shù)模型,對其概率密度函數(shù)進行積分得到期望函數(shù),
并且期望函數(shù)可作為公交車旅行時間評價模型。進一步地可以結合實時測量獲取的旅行時間和顯著影響變量數(shù)據(jù),可利用公交車旅行時間評價模型計算公交車在相應區(qū)間的旅行時間,并與實際測量的旅行時間進行對比,從而驗證模型的準確性。
下面本實施例用在南京市選擇機動車與非機動車無物理隔離設施的道路中途公交站臺作為研究對象,進一步說明本發(fā)明方法的實施細節(jié)并驗證本發(fā)明方法的有效性。該類型公交站臺特征是:通過道路標線來分離機動車道和自行車道,公交站臺設置在人行道上,如圖1所示。
以該類型公交站臺為例,說明公交站臺毗鄰區(qū)設置檢測點的位置,并在同時能夠包括橫斷面1、2、3和4周圍交通情況和??空九_服務情況的高空位置安裝視頻檢測設備,例如各檢測點之間相隔20米,具體距離長度可根據(jù)實際情況適當調(diào)整,如圖2所示。
下面用在南京市選擇符合上述類型標準1個公交站點,2013年5-7月晴朗天氣下在高處建筑物放置攝像機進行拍攝獲得數(shù)據(jù)。在視頻上標記橫斷面1、2、3和4,從而通過視頻記錄公交車經(jīng)過橫斷面1、2、3和4的瞬時行駛時間,并記錄與旅行時間相對應的影響變量,如下表1所示。
在視頻數(shù)據(jù)庫中總共采集該類型公交站臺的176個公交車范例,選取了公交車毗鄰區(qū)范圍內(nèi)劃分的3個區(qū)間的行駛時間數(shù)據(jù),將公交站臺類型所有統(tǒng)計的公交車3個區(qū)間的行駛時間和影響變量組合成數(shù)據(jù)樣本。
表1影響變量說明
生存分析方法通常采用三個函數(shù)來刻畫生存時間t的分布特征:(1)反映個體生存時間超過t的概率生存函數(shù);(2)反映特定事件在t時刻發(fā)生的非條件概率概率密度函數(shù);(3)反映個體在下一瞬間結束的概率風險函數(shù)。且參數(shù)方法中風險函數(shù)有多種可供選擇的分布形式,如指數(shù)、威布爾、對數(shù)正態(tài)、Gompertz和廣義Gamma分布等。
首先令公交站臺毗鄰區(qū)公交車旅行時間為T,假設時間對數(shù)logT與變量之間存在如下線性關系:
其中,Xj和βj為影響變量和待求解的影響變量系數(shù),β0為待求解的常量系數(shù),j=1,2,...,p,p為影響變量的數(shù)目,σ(σ>0)是未知的刻度函數(shù),ε為隨機誤差項并且為隨機變量,概率密度函數(shù)為g(ε,d),生存函數(shù)為G(ε,d),d為未知參數(shù),這表明公交站臺毗鄰區(qū)公交車旅行時間T與隨機誤差項的分布有關。
假設公交站臺毗鄰區(qū)公交車旅行時間風險函數(shù)近似服從指數(shù)分布,則可運用以下數(shù)學性質(zhì)更好的參數(shù)模型進行分析。令上述公式(1)中的σ=1,則公交站臺毗鄰區(qū)第i個公交車旅行時間T與變量的關系如下:
其中i=1,2,...,n,n為采集的公交站臺毗鄰區(qū)的樣本數(shù)據(jù)中公交車的數(shù)量,εi是獨立同分布的隨機變量,且服從雙指數(shù)分布。雙指數(shù)分布的概率密度函數(shù)g(ε)和生存函數(shù)為G(ε)分別為:
公交站臺毗鄰區(qū)公交車旅行時間T的概率概率密度函數(shù)可通過如下的推導求出:
其中ε=(logt-μ)/σ,由于g(ε)服從雙指數(shù)分布,把其概率密度函數(shù)代入上式(5),則可得T的概率密度函數(shù)為:
引入變量的影響,所以令可推導出第i個公交車旅行時間Ti的概率密度函數(shù)如下所示:
假設公交站臺毗鄰區(qū)公交車旅行時間服從參數(shù)為λ和γ的威布爾分布時,類似過程可推導出第i個公交站臺毗鄰區(qū)公交車旅行時間Ti的概率密度函數(shù)如下所示:
假設公交站臺毗鄰區(qū)公交車旅行時間服從正態(tài)分布時,其中,Φ為標準正態(tài)分布函數(shù)。類似上述的推導過程,可得第i個公交車旅行時間Ti的概率密度函數(shù)如下所示:
假設公交站臺毗鄰區(qū)公交車旅行時間服從正態(tài)分布Gompertz時,可得第i個公交站臺毗鄰區(qū)公交車旅行時間Ti的概率密度函數(shù)如下所示:f(t)=λi exp[γt-λi/γ(eγt-1)]。
當公交站臺毗鄰區(qū)公交車旅行時間T服從一個參數(shù)為μi,σ2和κ三個參數(shù)的廣義伽馬分布時,其概率概率密度函數(shù)為:其中,γ=1/κ2,z=sign(κ)[(logt-μ)/σ],s=γeκz,Φ(z)是標準正態(tài)函數(shù)。I(γ,s)是不完全Gamma函數(shù),Γ(γ)是完全Gamma函數(shù)。當參數(shù)σ和κ取不同數(shù)值時,指數(shù)分布、威布爾分布和對數(shù)正態(tài)分布都屬于廣義Gamma分布簇。
在公交站臺上游區(qū)間,根據(jù)表1給出的變量的數(shù)據(jù)類型,分別采用對應的相關系數(shù)計算方法,若變量之間的相關性檢驗值小于0.05,則拒絕變量之間相關系數(shù)為0的原假設,說明這些變量之間的相關系數(shù)顯著不為0,但具體的相關程度由相關系數(shù)值來體現(xiàn)。變量間相關系數(shù)的絕對值一般小于0.40,則表明它們之間只是存在極低或低度的相關程度。在公交站臺毗鄰區(qū)上游區(qū)間,只有公交車??繒r間和公交車??课恢靡约肮卉囇诱`三者之間的相關系數(shù)大于0.40,說明三者之間存在一定的中度相關,選取公交??繒r間保留并帶入模型計算。在公交站臺毗鄰區(qū)站臺區(qū)間,所有變量之間的相關系數(shù)都小于0.40,所有變量被選入模型進行計算。在公交站臺毗鄰區(qū)下游區(qū)間,所有變量之間的相關系數(shù)都小于0.40,所有變量被選入模型進行計算。
表2公交站上游區(qū)間各模型的影響變量系數(shù)
表3公交站站臺區(qū)間各模型的影響變量系數(shù)
表4公交站下游區(qū)間各模型的影響變量系數(shù)
表2-4給出在公交站臺上游區(qū)間、站臺和下游區(qū)間內(nèi)在考慮變量影響下各個模型的擬合結果(表中C表示被選入模型的影響變量系數(shù),P表示檢驗顯著性數(shù)值,表中省略了影響不顯著變量,即顯著性p值小于0.1的變量),從最后兩行的數(shù)據(jù)來看,廣義伽瑪分布模型對應的BIC和AIC值都是最小,由于廣義伽瑪分布模型是指數(shù)、威布爾和對數(shù)正態(tài)模型的廣義分布簇,因此選取其中數(shù)值最小的對數(shù)正態(tài)模型作為具體最優(yōu)模型,并且表3中為對數(shù)正態(tài)模型的廣義伽瑪分布模型對應的BIC和AIC值最小,綜上所述說明對數(shù)正態(tài)模型最優(yōu)。表2-4還給出了變量影響下各模型協(xié)變量系數(shù)的估計結果,在上游區(qū)間對公交車旅行時間產(chǎn)生影響的變量是公交車??繒r間和非機動車流量;在站臺區(qū)間對公交車旅行時間產(chǎn)生影響的變量是小汽車流量、公交車延誤和公交車??课恢?;在下游區(qū)間對公交車旅行時間產(chǎn)生影響的變量是小汽車流量。
圖3還給出了下游區(qū)間公交車旅行時間期望值與實際觀察值之間的對比擬合結果,在下游區(qū)間對公交車旅行時間期望值與實際觀察值擬合效果值為0.7513,總體而言,該模型的評價結果較好。
因此可以采用基于生存分析參數(shù)分布模型,結合顯著影響公交車運行的變量,計算理論公交車旅行時間,并可與實際旅行時間進行對比分析,從而對公交車旅行時間準確性進行判別,進而評價公交車運營效果,便于決策者更好地進行管控決策,從而提升公交系統(tǒng)運營服務質(zhì)量。