本發(fā)明屬于空間統(tǒng)計分析領(lǐng)域,特別涉及一種基于空間誤差模型的公共交通通達性差異分析方法。
背景技術(shù):
公共交通是社會生活中主要的出行方式,通過公交、地鐵、輕軌等這些公共交通,能到達乘客的目的地。將一個地方到另一個地方的便捷程度定義為交通通達度,分析一個城市的交通通達度是將街區(qū)看作城市的最小單元,在比較宏觀的層面上分析整個城市的交通格局,可以為城市基礎(chǔ)公共交通建設(shè)提供決策支持。交通通達度是由可達度(accessibility)發(fā)展而來,hansen最先定義了可達度的概念,可達度是相互作用的機會的潛力大小。在空間中,可達性用于反映一般出行者利用給定的交通系統(tǒng)從出發(fā)地點到達活動地點的便利程度,是交通系統(tǒng)、土地利用和出行者相互作用的關(guān)鍵因素。而空間中得物體存在普遍的相關(guān)性,進行必要的空間自相關(guān)分析,能得到更為精確的結(jié)果。在對可達度的研究應(yīng)用中,pooler運用回歸分析法考察了就業(yè)增長與可達性的關(guān)系,用就業(yè)因素作為可達度研究的主要影響因子,對美國60個都市區(qū)進行了研究。ozbay提出了一個新的可達度函數(shù)模型,研究的是就業(yè)可達度,并將這一模型運用到紐約和新澤西都市區(qū)的交通領(lǐng)域。在gis取得了一些成就之后,更多的研究在利用gis的相關(guān)理論方法,o-kelly和horner利用可達度理論對美國縣域人口得統(tǒng)計數(shù)據(jù)進行了人口增長速度方面的研究。另外還有一些學(xué)者將可達度與時空相結(jié)合,更好的表述了城市中可達度得時空特征。mavoa等人提出兩種公交可達度的研究方法,并運用到新西蘭的auckland城市,最后提出了關(guān)于公共交通車輛頻率得建議。cheng等人分析了深圳市就醫(yī)通達度,假設(shè)初級、二級、三級是就醫(yī)得主要場所,并根據(jù)通行時間和空間差異分析每一個地區(qū)的空間可達度。
在計算一個點的交通通達性時,使用如下公式:
其中,ai表示一個點的交通通達性,i,j分別表示空間中不同的兩點,n,n表示空間中點的數(shù)量,sij表示計算交通通達度的阻抗因子,通常是時間或者距離。
在計算一個區(qū)域的交通通達性時,使用如下公式:
其中,e表示一個區(qū)域的交通通達性,i表示這個區(qū)域中的任意一點,n,n表示空間中點的數(shù)量,ai表示一個點的交通通達性。
方差分析(anova)是一種特殊形式的統(tǒng)計假設(shè)檢定,廣泛應(yīng)用于實驗數(shù)據(jù)的分析中。統(tǒng)計假設(shè)檢定是一種根據(jù)數(shù)據(jù)進行決策的方法[5]。方差分析用于檢驗兩組或兩組以上的實驗數(shù)據(jù)組數(shù)據(jù)均值間差別顯著性,首先設(shè)定一個零假設(shè),表述為實驗中所有的實驗組數(shù)據(jù)均值間不存在顯著差異。測試結(jié)果(通過零假設(shè)進行計算)如果不僅僅是因為運氣,則在統(tǒng)計學(xué)上稱為顯著。然后經(jīng)過一系列的統(tǒng)計計算,統(tǒng)計顯著的結(jié)果(當(dāng)可能性的p-value小于臨界的“顯著值”)則可以推翻零假設(shè)。方差分析的結(jié)果是用方差表表示的,誤差由方差表示,組內(nèi)的誤差是每一個數(shù)據(jù)和他所在組的均值的方差表示,組間的誤差是總的誤差減去組內(nèi)誤差得到的,而總誤差等于總方差,df是自由度,用于計算平均方差,最終由f值表示方差分析的結(jié)果,但是一般都是用p-value的值表示顯著性結(jié)果,當(dāng)p-value的值大于0.05時,則表示不存在顯著性差異,若小于0.05,則表示存在顯著性差異,具體計算如下表:
其中
xi是數(shù)據(jù)集中的數(shù)據(jù),
空間自相關(guān)分析是利用空間誤差模型(spatialerrormodel)計算的,空間誤差模型最開始由anselin在《spatialeconometrics:methodsandmodels》中提出,根據(jù)地理學(xué)第一定理,相鄰的事物相似,遠離的事物相異??臻g誤差模型來自于普通線性回歸,即y=αx+ε,當(dāng)用于普通線性回歸的兩個變量都考慮空間自相關(guān)性時,則需要在原來變量的基礎(chǔ)上減去周圍相鄰空間所共有的部分才能應(yīng)用普通線性回歸,即需要減去ρwy,其中ρ是空間自相關(guān)系數(shù),w是空間鄰接矩陣。所以得到空間誤差模型如下:
y-pwy=αx-αpwx+ε
整理變形有:
y=ax+(i-pw)-1ε
因為空間誤差模型不是線性模型,所以不能使用普通的最小二乘法進行參數(shù)估算,需要使用最大似然法進行參數(shù)估算。將變量代入模型中估算得到該變量的空間自相關(guān)系數(shù),然后消除空間自相關(guān)影響,保證變量的獨立性,才能進行方差分析。
對于普通的方差分析方法,實驗數(shù)據(jù)必要滿足獨立性、正態(tài)性、等方差性的基本假設(shè),即用于分析差異性的數(shù)據(jù)必須滿足獨立性、正態(tài)性、等方差性。對空間中的數(shù)據(jù)進行差異性分析,需要滿足這樣的基本假設(shè),而空間數(shù)據(jù)最基本的特征就是具有空間自相關(guān)性,空間自相關(guān)性是空間數(shù)據(jù)之間存在的相互依賴的關(guān)系,所以不滿足獨立性,所以普通的方差分析并不能對空間數(shù)據(jù)進行差異性分析,在此基礎(chǔ)上發(fā)展的基于空間誤差模型的方差分析能有效地分析空間數(shù)據(jù)的差異性。
城市中分布著許多的基礎(chǔ)設(shè)施,如醫(yī)院、學(xué)校,分析城市基礎(chǔ)設(shè)施的通行便利程度可以反映出基礎(chǔ)設(shè)施在城市中的分布狀況。利用基于空間誤差模型的方差分析方法,可以分析出城市中不同地區(qū)基礎(chǔ)設(shè)施的交通通達性,如果不同地區(qū)之間的基礎(chǔ)設(shè)施的交通通達性差異顯著,說明城市的基礎(chǔ)設(shè)施分布不公平,而如果不同地區(qū)之間的基礎(chǔ)設(shè)施的交通通達性差異不顯著,說明城市的基礎(chǔ)設(shè)施分布公平。對城市中基礎(chǔ)設(shè)施的分布公平性進行評價,能對城市基礎(chǔ)設(shè)施規(guī)劃提供決策支持。
技術(shù)實現(xiàn)要素:
本發(fā)明所要解決的問題是,提供一種城市內(nèi)各個行政區(qū)劃內(nèi)基礎(chǔ)設(shè)施分布是否公平的分析方法。
本發(fā)明提供一種城市內(nèi)各個行政區(qū)劃內(nèi)基礎(chǔ)設(shè)施分布是否公平的分析方法,包括以下步驟:
步驟1:從百度地圖提供的api獲取到城市公交站點數(shù)據(jù)和基礎(chǔ)設(shè)施位置數(shù)據(jù),利用百度地圖提供的api獲取到每一個公交站點到基礎(chǔ)設(shè)施的距離、時間。計算公共交通通達性,具體包括:
步驟1.1:利用百度地圖api獲取到城市中所有的公交站點位置數(shù)據(jù)和基礎(chǔ)設(shè)施位置數(shù)據(jù)。
步驟1.2:利用百度地圖api和步驟1.1中得到的位置數(shù)據(jù)獲取搭乘公共交通從每一個公交站點到任一基礎(chǔ)設(shè)施的通行時間和同行距離。
步驟1.3:利用點的交通通達性計算公式和步驟1.2中得到的通行時間和同行距離計算出城市中每一個公交站點的交通通達性。
步驟1.4:利用面的交通通達性計算公式和步驟1.3中得到的點的交通通達性計算出城市各個區(qū)劃的交通通達性。
步驟2:利用基于空間誤差模型的方差分析將步驟1中計算得到的各個區(qū)域的交通通達性,包括數(shù)據(jù)的正態(tài)性檢驗、空間自相關(guān)分析、消除空間自相關(guān)影響,具體包括:
步驟2.1:對步驟1.4中計算得到的交通通達性數(shù)據(jù)進行正態(tài)性檢驗,使用的方法是shapiro-wilk正態(tài)性檢驗,如果通過正態(tài)性檢驗,則進行步驟2.2,否則利用boxcox正態(tài)性變換將非正態(tài)性數(shù)據(jù)轉(zhuǎn)換為正態(tài)性。
步驟2.2:利用空間誤差模型對步驟2.1的數(shù)據(jù)做空間自相關(guān)性分析,分析得到空間自相關(guān)系數(shù),然后消除公共交通通達性數(shù)據(jù)的空間自相關(guān)影響。
步驟2.3:將進行過步驟2.2的數(shù)據(jù)做方差分析,得到差異性分析結(jié)果
步驟3:將步驟2中分析得到的結(jié)果進行討論,最終得到整個城市的基礎(chǔ)設(shè)施分布公平性評價。
依照本發(fā)明所提供的城市基礎(chǔ)設(shè)施公共交通通達性差異性分析方法,可以從通行時間和通行距離兩個因素分析城市中基礎(chǔ)設(shè)施的分布是否合理,這種分布是基于公平性評價出來的。而且在利用空間自相關(guān)分析的基礎(chǔ)上,使用方差分析能得到更有說服力的差異性結(jié)果。
附圖說明
圖1為本發(fā)明實施例數(shù)據(jù)獲取的流程圖。
圖2為本發(fā)明實施例基于空間誤差模型的公共交通通達性差異分析方法的流程圖。
具體實施方法
為了便于本領(lǐng)域普通技術(shù)人員的理解和實施本發(fā)明,下面結(jié)合附圖及實施例對本發(fā)明做進一步的詳細(xì)描述,應(yīng)當(dāng)理解,此處所描述的實施示例僅用于說明和解釋本發(fā)明,并不用于限定本發(fā)明。
本發(fā)明要解決的核心問題是:分析城市中的某一基礎(chǔ)設(shè)施在各個行政區(qū)劃中是否分布公平。
請見圖1,本發(fā)明提供的一種基于anova的基礎(chǔ)設(shè)施公共交通通達性差異性分析方法,包括以下步驟:
步驟1:從百度地圖提供的api獲取到城市公交站點數(shù)據(jù)和基礎(chǔ)設(shè)施位置數(shù)據(jù),利用百度地圖提供的api獲取到每一個公交站點到基礎(chǔ)設(shè)施的距離、時間。計算公共交通通達性;
步驟1.1:利用百度地圖api獲取到城市中所有的公交站點位置數(shù)據(jù)和基礎(chǔ)設(shè)施位置數(shù)據(jù);
具體實施時,可以參考百度地圖api的開發(fā)者服務(wù)網(wǎng)站developer.baidu.com/map,獲取城市中的公交站點位置數(shù)據(jù)和基礎(chǔ)設(shè)施位置數(shù)據(jù)需要使用百度地圖api中的javascriptapi,通過提供的本地搜索api,寫成html網(wǎng)頁并以“公交站”為關(guān)鍵詞搜索,得到城市中所有的公交站點的名稱、所屬行政區(qū)劃、經(jīng)緯度坐標(biāo)。然后以基礎(chǔ)設(shè)施的名稱為關(guān)鍵詞進行搜索,如“三甲醫(yī)院”,“小學(xué)”,“中學(xué)”等,得到相應(yīng)的基礎(chǔ)設(shè)施的名稱、所屬行政區(qū)劃、經(jīng)緯度坐標(biāo)。本發(fā)明對此選擇武漢市的三甲醫(yī)院進行交通通達性差異性分析。武漢市是湖北省省會,是中國中部地區(qū)的中心城市,是全國重要的工業(yè)基地、科教基地和綜合交通樞紐,武漢市下轄13個行政區(qū)劃,分別是江岸區(qū)、江漢區(qū)、硚口區(qū)、漢陽區(qū)、武昌區(qū)、洪山區(qū)、青山區(qū)、東西湖區(qū)、蔡甸區(qū)、江夏區(qū)、黃陂區(qū)、新洲區(qū)、漢南區(qū)。這里選擇武漢市中心城區(qū)作為實驗區(qū)域,即江岸區(qū)、江漢區(qū)、硚口區(qū)、漢陽區(qū)、武昌區(qū)、洪山區(qū)、青山區(qū)這7個行政區(qū)劃。最終獲取到武漢市中心城區(qū)共1416個公交站點,29個三甲醫(yī)院位置數(shù)據(jù)。
步驟1.2:利用百度地圖api和步驟1.1中得到的位置數(shù)據(jù)獲取搭乘公共交通從每一個公交站點到任一基礎(chǔ)設(shè)施的通行時間和同行距離;
具體實施時,可以參考百度地圖api的開發(fā)者服務(wù)網(wǎng)站developer.baidu.com/map,獲取搭乘公共交通從每一個公交站點到任一基礎(chǔ)設(shè)施的通行時間和同行距離需要使用百度地圖api中web服務(wù)api中的directionapi,在規(guī)劃路徑時,可以選擇不同的公共交通換乘策略,包括少換乘、少步行、不坐地鐵、時間短、地鐵優(yōu)先這五種策略。通過directionapi,可以得到每一個公交站點通過乘坐公共交通工具到每一個基礎(chǔ)設(shè)施的通行時間和通行距離,在這里所指的公共交通工具包括交通車、地鐵、輕軌等。
步驟1.3:利用點的交通通達性計算公式和步驟1.2中得到的通行時間和同行距離計算出城市中每一個公交站點的交通通達性;
具體實施時,將步驟1.2中獲取到的通行時間和通行距離分別代入交通通達性公式,得到每一個公交站點的基于時間的交通通達性和基于距離的交通通達性。
步驟1.4:利用面的交通通達性計算公式和步驟1.3中得到的點的交通通達性計算出城市各個區(qū)劃的交通通達性;
具體實施時,統(tǒng)計落在每一個行政區(qū)劃中的公交站點,用落在這個區(qū)劃內(nèi)的所有的公交站點的交通通達性在計算這個區(qū)劃的交通通達性,由此可以得到城市中所有的區(qū)劃的基于時間的交通通達性和基于距離的交通通達性。
步驟2:利用基于空間誤差模型的方差分析將步驟1中計算得到的各個區(qū)域的交通通達性,包括數(shù)據(jù)的正態(tài)性檢驗、空間自相關(guān)分析、消除空間自相關(guān)影響等操作。
步驟2.1:對步驟1.4中計算得到的交通通達性數(shù)據(jù)進行正態(tài)性檢驗,使用的方法是shapiro-wilk正態(tài)性檢驗,如果通過正態(tài)性檢驗,則進行步驟2.2,否則利用boxcox正態(tài)性變換將非正態(tài)性數(shù)據(jù)轉(zhuǎn)換為正態(tài)性。
具體實施時,將步驟1中獲得的數(shù)據(jù)進行正態(tài)性檢驗,采用的方法是shapiro-wilk正態(tài)性檢驗,shapiro-wilk正態(tài)性檢驗是一種基于相關(guān)性的算法,其計算式為:
其中,xi是待測變量,
步驟2.2:利用空間誤差模型對步驟2.1的數(shù)據(jù)做空間自相關(guān)性分析,分析得到空間自相關(guān)系數(shù),然后消除公共交通通達性數(shù)據(jù)的空間自相關(guān)影響。
具體實施時,對步驟2.1中得到結(jié)果做空間自相關(guān)性分析,要利用空間誤差模型計算空間自相關(guān)系數(shù),首先要利用空間中城市各個區(qū)劃的鄰接關(guān)系建立空間鄰接矩陣,其原理是:假設(shè)空間中有n塊區(qū)域,則有這樣一個n*n的矩陣來表示n塊區(qū)域之間的鄰接關(guān)系,如果第i塊區(qū)域與第j塊區(qū)域相鄰,則矩陣中位置為(i,j)和位置為(j,i)的值都為1,否則值為0,同時定義矩陣中對角線上的數(shù)都為0。因為空間誤差模型是一個回歸模型,如果要計算某一個單一變量的空間自相關(guān)系數(shù),需要代入空間鄰接矩陣作為參數(shù)將交通通達性的數(shù)據(jù)與自身做回歸,然后利用最大似然法估算回歸模型中的系數(shù),這其中便有空間自相關(guān)系數(shù)。計算得到空間自相關(guān)系數(shù)之后,需要消除空間自相關(guān)影響,具體計算公式為:
y′=y(tǒng)*(i-ρwy)
其中,i為對角線上全為1的單位矩陣。
在實例中,利用空間誤差模型對數(shù)據(jù)進行分析,得到基于距離和時間的公共交通通達度的空間自相關(guān)系數(shù)為0.9812、0.9512,空間自相關(guān)性特別強,消除空間自相關(guān)性才能保證數(shù)據(jù)的獨立性,滿足獨立性才能利用方差分析進行差異性分析。
步驟2.3:將進行過步驟2.2的數(shù)據(jù)做方差分析,得到差異性分析結(jié)果
具體實施時,對步驟2.2中的得到數(shù)據(jù)進行方差分析,得到的結(jié)果是方差分析計算得到f值。然后計算f值在整個數(shù)據(jù)分布上的p-value,由p-value分析差異性分析結(jié)果。
步驟3:將步驟2中分析得到的結(jié)果進行討論,最終得到整個城市的基礎(chǔ)設(shè)施分布公平性評價。
具體實施時,對步驟2.3中得到的p-value進行討論,在0.05的置信水平上進行評價,如果p-value大于等于0.05,則表示差異不顯著,該基礎(chǔ)設(shè)施在城市中分布公平;如果p-value小于0.05,則表示差異顯著,該基礎(chǔ)設(shè)施在城市中分布不公平。但是對一個城市而言,空間上的公平主要是體現(xiàn)在距離上的,而時間上主要是居民出行時考慮的,所以基于時間的交通通達度體現(xiàn)了居民出行到基礎(chǔ)設(shè)施的公平性,而基于距離的交通通達性體現(xiàn)了基礎(chǔ)設(shè)施在城市中分布的公平性。在實例中,武漢市中心城區(qū)基于距離的公共交通就醫(yī)通達性表現(xiàn)為有顯著的差異,說明三甲醫(yī)院在武漢市的分布有不公平的特征,而基于時間的公共交通就醫(yī)通達性表現(xiàn)為沒有顯著的差異,說明居民在出行到三甲醫(yī)院時,因為交通工具的影響,在空間上的不公平被彌補,最終表現(xiàn)為公平。
應(yīng)當(dāng)理解的是,本說明書未詳細(xì)闡述的部分均屬于現(xiàn)有技術(shù)。
應(yīng)當(dāng)理解的是,上述針對較佳實施例的描述較為詳細(xì),并不能因此而認(rèn)為是對本發(fā)明專利保護范圍的限制,本領(lǐng)域的普通技術(shù)人員在本發(fā)明的啟示下,在不脫離本發(fā)明權(quán)利要求所保護的范圍情況下,還可以做出替換或變形,均落入本發(fā)明的保護范圍之內(nèi),本發(fā)明的請求保護范圍應(yīng)以所附權(quán)利要求為準(zhǔn)。