本發(fā)明涉及數(shù)據(jù)分析,特別是一種交通數(shù)據(jù)分析方法及系統(tǒng)。
背景技術(shù):
1、在近年來,隨著城市化進(jìn)程的加速和交通需求的不斷增加,城市交通管理和公共交通系統(tǒng)的優(yōu)化成為關(guān)鍵的研究領(lǐng)域,交通數(shù)據(jù)分析技術(shù)在此過程中扮演了重要的角色,傳統(tǒng)的城市交通管理系統(tǒng)主要依賴于單一的數(shù)據(jù)源,例如交通流量監(jiān)測器和gps數(shù)據(jù),來進(jìn)行交通狀況的實(shí)時監(jiān)測與管理,然而,這種方法的局限性在于其數(shù)據(jù)源的單一性,往往難以全面反映城市交通的復(fù)雜性和動態(tài)變化。
2、為了解決這一問題,近年來,研究者們提出了多源數(shù)據(jù)融合的方法,將來自不同來源的數(shù)據(jù)進(jìn)行整合,以獲取更全面的交通信息,這種方法能夠更好地捕捉交通流動的多樣性和復(fù)雜性,提高交通預(yù)測的準(zhǔn)確性,然而,盡管多源數(shù)據(jù)融合技術(shù)在一定程度上改善了交通數(shù)據(jù)的全面性和準(zhǔn)確性,但現(xiàn)有的系統(tǒng)常常忽視不同區(qū)域之間的需求差異和服務(wù)差距,導(dǎo)致公共交通資源的配置不夠優(yōu)化,不同區(qū)域公共交通服務(wù)發(fā)展不均衡,不能很好滿足用戶公共交通出行的需求。
技術(shù)實(shí)現(xiàn)思路
1、鑒于上述現(xiàn)有的交通數(shù)據(jù)分析方法及系統(tǒng)中存在的問題,提出了本發(fā)明。
2、因此,本發(fā)明所要解決的問題在于現(xiàn)有的系統(tǒng)常常忽視不同區(qū)域之間的需求差異和服務(wù)差距,導(dǎo)致公共交通資源的配置不夠優(yōu)化,不同區(qū)域公共交通服務(wù)發(fā)展不均衡,不能很好滿足用戶公共交通出行的需求。
3、為解決上述技術(shù)問題,本發(fā)明提供如下技術(shù)方案:一種交通數(shù)據(jù)分析方法,其包括,收集多源數(shù)據(jù)形成全面的城市交通數(shù)據(jù)體系,構(gòu)建動態(tài)時空圖分析不同時間和空間維度的交通數(shù)據(jù)得到不同區(qū)域公共交通出行需求;對不同區(qū)域的公共交通服務(wù)水平進(jìn)行評估,根據(jù)不同區(qū)域的出行需求和公共交通服務(wù)水平制定差異化的線路規(guī)劃;預(yù)測不同區(qū)域的車輛交通密度并根據(jù)用戶出行數(shù)據(jù)為用戶推薦公共交通路線。
4、作為本發(fā)明所述交通數(shù)據(jù)分析方法的一種優(yōu)選方案,其中:所述收集多源數(shù)據(jù)形成全面的城市交通數(shù)據(jù)體系指確定主要數(shù)據(jù)源包括交通監(jiān)控數(shù)據(jù),gps數(shù)據(jù)以及社交媒體平臺數(shù)據(jù),實(shí)時從各數(shù)據(jù)源中收集數(shù)據(jù)并對數(shù)據(jù)進(jìn)行預(yù)處理,將所有數(shù)據(jù)源的時間和日期轉(zhuǎn)換為統(tǒng)一格式并統(tǒng)一數(shù)據(jù)的地理位置信息,將預(yù)處理后的數(shù)據(jù)存儲進(jìn)中央數(shù)據(jù)庫中形成全面的城市交通數(shù)據(jù)體系并按照地理區(qū)域?qū)⒊鞘袆澐譃椴煌瑓^(qū)域。
5、作為本發(fā)明所述交通數(shù)據(jù)分析方法的一種優(yōu)選方案,其中:所述構(gòu)建動態(tài)時空圖分析不同時間和空間維度的交通數(shù)據(jù)得到不同區(qū)域公共交通出行需求指定義動態(tài)圖結(jié)構(gòu),從城市交通數(shù)據(jù)體系中提取人口和交通特征數(shù)據(jù),選擇城市的交通交叉口以及公共交通站點(diǎn)作為節(jié)點(diǎn),利用gis系統(tǒng)和城市交通布局圖定位每個節(jié)點(diǎn)的地理位置;
6、基于實(shí)際交通路線和公共交通連接線確定節(jié)點(diǎn)之間的連接邊,將人口和交通特征數(shù)據(jù)融入節(jié)點(diǎn),使用交通和出行時間數(shù)據(jù)加強(qiáng)邊的屬性,根據(jù)實(shí)時交通流量數(shù)據(jù)動態(tài)更新邊的權(quán)重;
7、根據(jù)從城市交通數(shù)據(jù)體系中獲得的實(shí)時數(shù)據(jù)更新圖中的節(jié)點(diǎn)和邊的狀態(tài);
8、基于定義的節(jié)點(diǎn)和邊構(gòu)建時空張量網(wǎng)絡(luò),包括空間張量圖和時間張量圖:
9、所述構(gòu)建空間張量圖指通過收集gis數(shù)據(jù)測量節(jié)點(diǎn)間的實(shí)際距離,基于節(jié)點(diǎn)間的地理距離和交通流量連接確定節(jié)點(diǎn)間的空間關(guān)系;
10、基于節(jié)點(diǎn)間的交通流量和通勤數(shù)據(jù)計算節(jié)點(diǎn)間的連接權(quán)重,將空間關(guān)系和權(quán)重轉(zhuǎn)化為多維張量,每個維度代表一個節(jié)點(diǎn),節(jié)點(diǎn)間的連接通過張量的權(quán)重表示;
11、所述構(gòu)建時間張量圖指收集每個節(jié)點(diǎn)的時間序列數(shù)據(jù),包括每日的交通流程以及特殊事件的影響,為每個時間點(diǎn)創(chuàng)建獨(dú)立的層,每層代表一個時間段內(nèi)的交通狀態(tài),通過時間依賴性描述定義層與層之間的連接;
12、使用投影糾纏對態(tài)算法優(yōu)化時空張量網(wǎng)絡(luò),將時空張量網(wǎng)絡(luò)中的數(shù)據(jù)轉(zhuǎn)換為多維數(shù)組形式,根據(jù)數(shù)據(jù)的維度和結(jié)構(gòu)選擇張量格式,設(shè)定投影糾纏對態(tài)算法的核心參數(shù),包括虛擬維度和優(yōu)化迭代次數(shù),使用仿真數(shù)據(jù)測試不同的參數(shù)設(shè)置選擇最佳的參數(shù)組合;
13、將多維數(shù)據(jù)輸入進(jìn)投影糾纏對態(tài)算法中進(jìn)行張量分解處理,將復(fù)雜的多維數(shù)據(jù)簡化為易于管理和分析的格式,使用梯度下降算法根據(jù)最新的時空數(shù)據(jù)定期優(yōu)化張量網(wǎng)絡(luò)的參數(shù);
14、設(shè)計多層圖卷積網(wǎng)絡(luò)結(jié)構(gòu),每層負(fù)責(zé)處理節(jié)點(diǎn)的特征和集成鄰近節(jié)點(diǎn)的信息,通過殘差連接配置網(wǎng)絡(luò)層;
15、使用圖卷積公式更新每個節(jié)點(diǎn)的特征表示:
16、
17、式中,是節(jié)點(diǎn)v在第l+1層的特征表示,是第l層中節(jié)點(diǎn)v的特征向量,n(v)是節(jié)點(diǎn)v的鄰居節(jié)點(diǎn)集合,w(l)是第l層的可學(xué)習(xí)權(quán)重矩陣,σ是非線性激活函數(shù)relu,cvu是節(jié)點(diǎn)v的鄰居數(shù)量,u是節(jié)點(diǎn)v的鄰居節(jié)點(diǎn),是節(jié)點(diǎn)u在第l層的特征表示;
18、對于每個節(jié)點(diǎn),聚合其自身和鄰居的特征獲得新的節(jié)點(diǎn)表示,使用歷史交通數(shù)據(jù)進(jìn)行模型訓(xùn)練并定義交叉熵?fù)p失函數(shù),通過反向傳播算法計算損失函數(shù)關(guān)于每個權(quán)重的梯度,應(yīng)用梯度下降更新權(quán)重,在訓(xùn)練過程中,實(shí)時計算模型損失,若模型損失在連續(xù)3個周期中沒有下降,則停止訓(xùn)練得到圖神經(jīng)網(wǎng)絡(luò)模型;
19、將圖神經(jīng)網(wǎng)絡(luò)模型部署在中央數(shù)據(jù)庫中實(shí)時接收交通數(shù)據(jù)預(yù)測各區(qū)域公共交通的出行需求。
20、作為本發(fā)明所述交通數(shù)據(jù)分析方法的一種優(yōu)選方案,其中:所述對不同區(qū)域的公共交通服務(wù)水平進(jìn)行評估指從城市交通數(shù)據(jù)體系中獲取區(qū)域的車輛負(fù)載率,班次準(zhǔn)點(diǎn)率和客流量,通過gis得到公共交通服務(wù)的線路覆蓋率和站點(diǎn)可達(dá)性并
21、將收集的數(shù)據(jù)按照時間段進(jìn)行分組;
22、分析車輛負(fù)載率數(shù)據(jù)識別過載以及車輛利用率低的問題區(qū)域和時間段;
23、分析班次準(zhǔn)點(diǎn)率數(shù)據(jù)評估交通高峰期的公共交通服務(wù)的可靠性;
24、分析客流量數(shù)據(jù)評估各主要線路和車站的服務(wù)需求滿足情況;
25、分析線路覆蓋率評估公共交通服務(wù)在不同區(qū)域的覆蓋情況;
26、分析站臺可達(dá)性數(shù)據(jù)分析居民訪問最近站點(diǎn)的平均步行距離;
27、將得到的分析結(jié)果進(jìn)行整合,標(biāo)識出公共交通服務(wù)水平不足的區(qū)域。
28、作為本發(fā)明所述交通數(shù)據(jù)分析方法的一種優(yōu)選方案,其中:所述根據(jù)不同區(qū)域的出行需求和公共交通服務(wù)水平制定差異化的線路規(guī)劃指使用k-means聚類算法根據(jù)交通需求將城市不同區(qū)域分類為高需求區(qū)和低需求區(qū),編制每個聚類區(qū)域的需求特征報告,包括高需求時間段、乘客偏好和服務(wù)不足點(diǎn);
29、基于各區(qū)域的公共交通的出行需求以及各區(qū)域的公共交通服務(wù)水平標(biāo)識出公共交通出行需求高而公共交通服務(wù)水平不足的區(qū)域,使用gis工具和數(shù)據(jù)可視化技術(shù),映射出公共交通出行需求與公共交通服務(wù)水平不匹配的具體位置,將該區(qū)域作為首要線路優(yōu)化目標(biāo);
30、對于公共交通服務(wù)水平不足的區(qū)域,制定增加公共交通資源的策略,包括增加班次、延長運(yùn)營時間、增加新的線路以及調(diào)整現(xiàn)有線路;
31、對于公共交通服務(wù)水平過剩的區(qū)域,減少該區(qū)域的公共交通資源的分配,優(yōu)化現(xiàn)有線路并合并不經(jīng)濟(jì)的公共交通線路,重新分配資源到公共交通出行需求更高的區(qū)域。
32、作為本發(fā)明所述交通數(shù)據(jù)分析方法的一種優(yōu)選方案,其中:所述預(yù)測不同區(qū)域的車輛交通密度指使用卷積神經(jīng)網(wǎng)絡(luò)構(gòu)建交通密度預(yù)測模型,包括輸入層、卷積層、池化層以及輸出層;
33、使用歷史交通流量數(shù)據(jù)作為訓(xùn)練集輸入交通密度預(yù)測模型中進(jìn)行迭代訓(xùn)練,定義損失函數(shù)和adam優(yōu)化器進(jìn)行模型參數(shù)迭代優(yōu)化,當(dāng)在連續(xù)迭代過程中需求預(yù)測模型的損失不再明顯下降則停止迭代輸出模型參數(shù)更新交通密度預(yù)測模型;
34、將實(shí)時交通流量數(shù)據(jù)輸入交通密度預(yù)測模型中獲取各區(qū)域未來的車輛交通密度。
35、作為本發(fā)明所述交通數(shù)據(jù)分析方法的一種優(yōu)選方案,其中:所述根據(jù)用戶出行數(shù)據(jù)為用戶推薦公共交通路線指收集用戶的歷史出行數(shù)據(jù)包括常用路線,出行時間和頻率以及偏好設(shè)置,對收集數(shù)據(jù)進(jìn)行預(yù)處理并使用k-means聚類算法根據(jù)用戶數(shù)據(jù)將用戶分類為早高峰通勤者和周末出行者,使用apriori算法識別用戶頻繁的出行組合,包括常用的起始站點(diǎn)和目的站點(diǎn),整合未來的車輛交通密度數(shù)據(jù)并生成每條規(guī)劃的公共交通路線的特征向量,包括路線長度,車輛交通密度以及歷史用戶選擇頻率;
36、使用隨機(jī)森林模型,將歷史用戶出行數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)輸入隨機(jī)森林模型進(jìn)行訓(xùn)練,使用交叉驗(yàn)證方法優(yōu)化隨機(jī)森林的樹的數(shù)量和樹的深度進(jìn)行迭代直到模型性能不再明顯提升則停止迭代獲得訓(xùn)練好的隨機(jī)森林模型,將生成的特征向量輸入進(jìn)隨機(jī)森林模型中得到每條規(guī)劃的公共交通路線的得分,將公共交通路線按得分遞減排序,選擇得分最高的公共交通路線作為最優(yōu)公共交通路線并實(shí)時推送給用戶。
37、本發(fā)明的另外一個目的是提供一種交通數(shù)據(jù)分析系統(tǒng),其包括,
38、數(shù)據(jù)收集模塊,用于從多個數(shù)據(jù)源中收集交通數(shù)據(jù)并進(jìn)行預(yù)處理后存儲進(jìn)中央數(shù)據(jù)庫形成全面的城市交通數(shù)據(jù)體系;
39、數(shù)據(jù)分析模塊,用于基于城市交通數(shù)據(jù)體系中的實(shí)時交通數(shù)據(jù)構(gòu)建動態(tài)圖結(jié)構(gòu)以及時空張量網(wǎng)絡(luò)并通過圖神經(jīng)網(wǎng)絡(luò)預(yù)測各區(qū)域公共交通的出行需求;
40、水平評估模塊,用于實(shí)時分析各區(qū)域的交通數(shù)據(jù)對各區(qū)域的公共交通服務(wù)水平進(jìn)行評估;
41、線路規(guī)劃模塊,用于基于各區(qū)域的公共交通的出行需求和服務(wù)水平對各區(qū)域的公共交通線路進(jìn)行規(guī)劃;
42、個性出行模塊,用于基于規(guī)劃后的公共交通線路并根據(jù)用戶的出行數(shù)據(jù)和各公共交通線路的車輛交通密度實(shí)時向用戶推薦公共交通線路。
43、一種計算機(jī)設(shè)備,包括:存儲器和處理器;所述存儲器存儲有計算機(jī)程序,所述處理器執(zhí)行所述計算機(jī)程序時實(shí)現(xiàn)交通數(shù)據(jù)分析方法的步驟。
44、一種計算機(jī)可讀存儲介質(zhì),其上存儲有計算機(jī)程序,所述計算機(jī)程序被處理器執(zhí)行時實(shí)現(xiàn)交通數(shù)據(jù)分析方法的步驟。
45、本發(fā)明有益效果為:本發(fā)明通過收集和融合多源數(shù)據(jù),構(gòu)建動態(tài)時空圖分析不同時間和空間維度的交通數(shù)據(jù),從而精確預(yù)測不同區(qū)域的公共交通需求,不僅能夠更全面地捕捉交通流動的復(fù)雜特征,還能根據(jù)公共交通服務(wù)水平的評估結(jié)果制定差異化的線路規(guī)劃并基于預(yù)測的交通密度為用戶推薦最優(yōu)的公共交通路線,提高了公共交通服務(wù)的均衡程度,滿足區(qū)域用戶公共交通出行需求。