車輛行進開銷的預(yù)測方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了一種車輛行進開銷的預(yù)測方法,包括步驟:將接收到的交通數(shù)據(jù)和地圖數(shù)據(jù)分化到各自相應(yīng)的預(yù)測路段內(nèi)并提取其對應(yīng)的特征值;基于特征值將每一預(yù)測路段分化到不同的聚類中;通過計算并預(yù)測獲得每個聚類的完整車輛行進開銷序列;利用聚類的完整車輛行進開銷序列對該聚類的任一預(yù)測路段的部分時間切片的車輛行進開銷序列進行相關(guān)性完整填充,其中填充在任一預(yù)測路段的未來時間切片內(nèi)的車輛行進開銷序列作為該預(yù)測路段的未來車輛行進開銷預(yù)測值。本發(fā)明還公開了一種車輛行進開銷的預(yù)測系統(tǒng)。
【專利說明】車輛行進開銷的預(yù)測方法及系統(tǒng)
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及交通數(shù)據(jù)處理領(lǐng)域,尤其涉及一種車輛行進開銷的預(yù)測方法及系統(tǒng)。
【背景技術(shù)】
[0002] 隨著技術(shù)的發(fā)展,越來越多的交通數(shù)據(jù)得以被人們所收集并利用。例如,在GPS設(shè) 備的普及下,大都市出租車輛均裝備了 GPS設(shè)備。通過這些設(shè)備以及其他一些相關(guān)車輛信 息采集設(shè)備,出租車可以不斷地將自己的位置信息,速度信息以及載客與否信息傳送給數(shù) 據(jù)中心。于是,數(shù)據(jù)中心便可以收集海量的交通數(shù)據(jù),從而進行一系列的數(shù)據(jù)挖掘與分析任 務(wù)。由于海量交通數(shù)據(jù)富含的豐富價值,基于交通數(shù)據(jù)的挖掘工作也變成了時下一個熱活 躍的熱點研宄領(lǐng)域。交通數(shù)據(jù)相關(guān)的研宄工作主要包含兩個目的。其一是通過對海量交通 數(shù)據(jù)的分析,來發(fā)掘城市的一些動態(tài)特征。這方面的研宄包括研宄城市規(guī)劃合理程度,分析 城市不同區(qū)域的功能模塊等等。而第二個目的,則是通過利用海量交通數(shù)據(jù),從而為用戶提 供與交通相關(guān)的服務(wù)。例如,根據(jù)歷史交通車輛的行進軌跡對用戶做最優(yōu)路線推薦,以及通 過出租車行駛歷史數(shù)據(jù)提供優(yōu)化的打車推薦服務(wù),幫助用戶更加容易打到出租車,也使得 出租車更容易找到用戶等等。
[0003] 基于交通數(shù)據(jù)的研宄,一方面,由于大城市出租車數(shù)量眾多且它們均會頻繁發(fā)送 車輛信息,數(shù)據(jù)中心會收集到海量數(shù)據(jù),對挖掘提出了數(shù)據(jù)規(guī)模上的挑戰(zhàn)。而另一方面,由 于出租車僅僅占大城市所有車輛中的一個微小的部分,對于這類數(shù)據(jù)開展的數(shù)據(jù)挖掘任務(wù) 同時又面臨著數(shù)據(jù)稀缺的挑戰(zhàn)。然而,在眾多對于交通數(shù)據(jù)進行的數(shù)據(jù)挖掘任務(wù)中,對于道 路行進開銷的數(shù)據(jù)挖掘任務(wù)尤為重要,因為它扮演著對于其他數(shù)據(jù)挖掘任務(wù)提供基礎(chǔ)的角 色。比如知道各個道路的行進開銷有助于城市建設(shè)規(guī)劃,同時,也方便于系統(tǒng)提供合理路線 給用戶而完成旅行路線推薦的服務(wù)。由此,此項對道路行進開銷估計與預(yù)測的工作有著強 烈的動機。
[0004] 道路行進開銷的數(shù)據(jù)挖掘任務(wù),具體來說,就是通過采集交通數(shù)據(jù),將這些交通數(shù) 據(jù)歸類到相應(yīng)的道路上,并通過這些交通數(shù)據(jù)來計算不同時間段上這條道路的車輛行進單 位距離所需要的時間耗費。所以,道路行進開銷的數(shù)據(jù)挖掘也可以理解成對于道路期望的 行進速度的計算,因為一旦我們可以掌握道路期望的行進速度,此道路上車輛行進單位距 離所需要耗費的時間也可以自然快捷地計算出來。需要指出的是,不同車輛在同一條道路 同一個時間段的行進開銷有所不同,這跟駕駛員的駕駛習(xí)慣,當(dāng)時道路上的具體道路交通 狀況有關(guān)。這里所說的道路行進開銷的計算是相對于此道路在這一特定時間段的車輛行進 開銷期望而言。這個行進開銷值可以對這條路段這個時間的交通狀況提供一個合理的參 考。
[0005] 這項工作中設(shè)計到的道路行進開銷的數(shù)據(jù)挖掘任務(wù)涉及了兩方面。第一方面,是 對于道路行進開銷的估計。這一部分,主要著重于時間點的當(dāng)下,由于出租車數(shù)據(jù)的稀疏特 性,部分路段在特定時間段并沒有出租車覆蓋,也沒有相應(yīng)的交通數(shù)據(jù),因此其道路行進開 銷并不能通過簡單根據(jù)其上車輛行進速度計算而得到。然而,對于收集到交通數(shù)據(jù)的路段 和未收集到交通數(shù)據(jù)的路段,我們都需要對其當(dāng)前的車輛行進開銷進行估計。第二方面,是 對于道路行進開銷的預(yù)測。這一部分,主要著重于時間點的未來,我們根據(jù)當(dāng)前收集到的交 通數(shù)據(jù),對于路段在未來時間的車輛行進開銷進行預(yù)測。這一部分的工作相對第一部分更 為重要,因為對于一些行進路徑推薦的服務(wù),了解未來的道路行進開銷對于優(yōu)化路徑的提 出有著重要的意義。
[0006] 在現(xiàn)有技術(shù)中,關(guān)于道路車輛行進開銷的估計與道路車輛行進開銷的預(yù)測,均有 相關(guān)工作展開。其中,關(guān)于道路車輛行進開銷的預(yù)測的工作,在本發(fā)明之前也有進行。在現(xiàn) 有技術(shù)中,對于一個路段,收集其不同時間段中的車輛行進開銷,并將這一系列的車輛行進 開銷作為時間序列,運用時間序列預(yù)測的方法對未來的車輛行進開銷作預(yù)測。另一項工作, 假設(shè)同一路段每天同一時間的車輛行進開銷相同,并且通過計算歷史數(shù)據(jù)每天同一時間的 車輛行進開銷的平均值對未來某天同一時間的車輛行進開銷作預(yù)測。這些先前工作均忽略 了出租車數(shù)據(jù)的稀疏特性。它們只能對于有交通數(shù)據(jù)的路段進行未來的車輛行進開銷預(yù) 測,而對于大部分沒有被出租車覆蓋到的路段或者某些時間段缺乏數(shù)據(jù)的路段,均無法進 行準(zhǔn)確有效的未來車輛行進開銷預(yù)測。
【發(fā)明內(nèi)容】
[0007] 本發(fā)明的目的提供一種車輛行進開銷的預(yù)測方法及系統(tǒng),克服現(xiàn)有技術(shù)中沒有解 決的數(shù)據(jù)稀疏問題,從而可以完整地對于任意路段都可以完成未來車輛行進開銷的預(yù)測。
[0008] 為實現(xiàn)上述目的,本發(fā)明提供了一種車輛行進開銷的預(yù)測方法,包括步驟:
[0009] A、將接收到的交通數(shù)據(jù)和地圖數(shù)據(jù)分化到各自相應(yīng)的預(yù)測路段內(nèi),并基于每一 所述預(yù)測路段內(nèi)的交通數(shù)據(jù)和地圖數(shù)據(jù),提取其對應(yīng)的特征值;
[0010] B、基于所述特征值將每一所述預(yù)測路段分化到不同的聚類中,使得同一個聚類中 的所有預(yù)測路段有著相似的特征;
[0011] C、將同一個聚類的交通數(shù)據(jù)和地圖數(shù)據(jù)分化到其對應(yīng)的過去連續(xù)的多個特定時 間切片內(nèi),并計算出每個時間切片內(nèi)的平均車輛行進開銷值,從而得到按照時間先后次序 排列的聚類的歷史車輛行進開銷序列;
[0012] D、根據(jù)所述聚類的歷史車輛行進開銷序列,利用時間序列預(yù)測方法得到其對應(yīng)的 多個未來時間切片的聚類的未來車輛行進開銷序列,所述聚類的歷史車輛行進開銷序列和 聚類的未來車輛行進開銷序列構(gòu)成聚類的完整車輛行進開銷序列;
[0013] E、利用所述聚類的完整車輛行進開銷序列對該聚類的任一預(yù)測路段的部分時間 切片的車輛行進開銷序列進行相關(guān)性完整填充,其中填充在任一預(yù)測路段的未來時間切片 內(nèi)的車輛行進開銷序列作為該預(yù)測路段的未來車輛行進開銷預(yù)測值。
[0014] 本發(fā)明提供了一種車輛行進開銷的預(yù)測系統(tǒng),包括:
[0015] 預(yù)測路段分化單元,用于將接收到的交通數(shù)據(jù)和地圖數(shù)據(jù)分化到各自相應(yīng)的預(yù)測 路段內(nèi);
[0016] 預(yù)測路段特征值提取單元,基于每一所述預(yù)測路段內(nèi)的交通數(shù)據(jù)和地圖數(shù)據(jù),提 取其對應(yīng)的特征值;
[0017] 預(yù)測路段聚類單元,基于所述特征值將每一所述預(yù)測路段分化到不同的聚類中, 使得同一個聚類中的所有預(yù)測路段有著相似的特征;
[0018] 聚類的歷史車輛行進開銷序列計算單元,用于將同一個聚類的交通數(shù)據(jù)和地圖數(shù) 據(jù)分化到其對應(yīng)的過去連續(xù)的多個特定時間切片內(nèi),并計算出每個時間切片內(nèi)的平均車輛 行進開銷值,從而得到按照時間先后次序排列的聚類的歷史車輛行進開銷序列;
[0019] 聚類的未來車輛行進開銷序列預(yù)測單元,用于根據(jù)所述聚類的歷史車輛行進開銷 序列,利用時間序列預(yù)測方法得到其對應(yīng)的多個未來時間切片的聚類的未來車輛行進開銷 序列,所述聚類的歷史車輛行進開銷序列和聚類的未來車輛行進開銷序列構(gòu)成聚類的完整 車輛行進開銷序列;以及
[0020] 預(yù)測路段的行進開銷預(yù)測單元,利用所述聚類的完整車輛行進開銷序列對該聚類 的任一預(yù)測路段的部分時間切片的車輛行進開銷序列進行相關(guān)性完整填充,其中填充在任 一預(yù)測路段的未來時間切片內(nèi)的車輛行進開銷序列作為該預(yù)測路段的未來車輛行進開銷 預(yù)測值。
[0021] 與現(xiàn)有技術(shù)相比,本發(fā)明公開的車輛行進開銷的預(yù)測方法及系統(tǒng)具有如下有益效 果:通過各個交通車輛信息點的具體信息來劃預(yù)測路段,并尋找分類相似的預(yù)測路段,然后 基于同一個聚類中的所有預(yù)測路段有著相似的特征的原則,通過計算聚類的完整車輛行進 開銷序列模式后來對該聚類的任一預(yù)測路段的部分時間切片的車輛行進開銷序列進行相 關(guān)性完整填充,從而使填充在任一預(yù)測路段的未來時間切片內(nèi)的車輛行進開銷序列作為該 預(yù)測路段的未來車輛行進開銷預(yù)測值。因此,本發(fā)明通過找尋相似路段,并且認(rèn)為相似路段 的車輛行進開銷的變化模式相似來進行車輛行進開銷的預(yù)測。通過這一方法,可以克服先 前工作沒有解決的數(shù)據(jù)稀疏問題,從而可以完整地對于任意路段都可以完成未來車輛行進 開銷的預(yù)測。
【專利附圖】
【附圖說明】
[0022] 圖1是本發(fā)明實施例1中一種車輛行進開銷的預(yù)測方法的流程示意圖。
[0023] 圖2是圖1所示的一種車輛行進開銷的預(yù)測方法中的步驟S103的具體流程示意 圖。
[0024] 圖3是圖1所示的一種車輛行進開銷的預(yù)測方法中的步驟S106的具體流程示意 圖。
[0025] 圖4是本發(fā)明實施例2中一種車輛行進開銷的預(yù)測系統(tǒng)的結(jié)構(gòu)示意圖。
[0026] 圖5是圖4所示的一種車輛行進開銷的預(yù)測系統(tǒng)的預(yù)測路段聚類單元的結(jié)構(gòu)示意 圖。
【具體實施方式】
[0027] 下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完 整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例。基于 本發(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他 實施例,都屬于本發(fā)明保護的范圍。
[0028] 實施例1
[0029] 參見圖1,是本發(fā)明實施例提供的一種車輛行進開銷的預(yù)測方法的流程示意圖,包 括步驟:
[0030] S101、接收包括交通數(shù)據(jù)和地圖數(shù)據(jù)的數(shù)據(jù);
[0031] 其中,所述交通數(shù)據(jù)至少包括車輛不同時間點的當(dāng)前時間信息、位置經(jīng)度信息和 行進速度信息,所述地圖數(shù)據(jù)包括路段的起始終止經(jīng)煒度信息。
[0032] S102、將接收到的交通數(shù)據(jù)和地圖數(shù)據(jù)分化到各自相應(yīng)的預(yù)測路段內(nèi),并基于每 一所述預(yù)測路段內(nèi)的交通數(shù)據(jù)和地圖數(shù)據(jù),提取其對應(yīng)的特征值;
[0033] S103、基于所述特征值將每一所述預(yù)測路段分化到不同的聚類中,使得同一個聚 類中的所有預(yù)測路段有著相似的特征;
[0034] S104、將同一個聚類的交通數(shù)據(jù)和地圖數(shù)據(jù)分化到其對應(yīng)的過去連續(xù)的多個特定 時間切片內(nèi),并計算出每個時間切片內(nèi)的平均車輛行進開銷值,從而得到按照時間先后次 序排列的聚類的歷史車輛行進開銷序列;
[0035] S105、根據(jù)所述聚類的歷史車輛行進開銷序列,利用時間序列預(yù)測方法得到其對 應(yīng)的多個未來時間切片的聚類的未來車輛行進開銷序列,所述聚類的歷史車輛行進開銷序 列和聚類的未來車輛行進開銷序列構(gòu)成聚類的完整車輛行進開銷序列;
[0036] S106、利用所述聚類的完整車輛行進開銷序列對該聚類的任一預(yù)測路段的部分時 間切片的車輛行進開銷序列進行相關(guān)性完整填充,其中填充在任一預(yù)測路段的未來時間切 片內(nèi)的車輛行進開銷序列作為該預(yù)測路段的未來車輛行進開銷預(yù)測值。
[0037] 在步驟S102中,基于步驟SlOl輸入的交通數(shù)據(jù)與地圖數(shù)據(jù)進行路段的時空分割, 同時由于交通數(shù)據(jù)中有車輛的位置信息和當(dāng)前時間信息,所以各個數(shù)據(jù)點可以根據(jù)此類時 空信息分化到其應(yīng)該屬于的相關(guān)預(yù)測路段中。
[0038] 其中,每一所述預(yù)測路段可以由連續(xù)的多個屬于此路段的時空分割路段表示,所 述時空分割路段定義為給定時間段下的特定長度路段,且所述給定時間段與所述特定時間 切片一致。優(yōu)選的,所述預(yù)測路段與所述特定長度路段的路段長度相同。
[0039] "時空分割路段"即是在給定時間段下的特定長度路段,在本實施例中,這里的時 間段長度默認(rèn)為三十分鐘。定義在這個短暫時間段中一個路段的車輛行進開銷保持不變或 者變化微小可以忽略。
[0040] 由于定義的時空分割路段是將一個路段在時間軸上按照三十分鐘為一個時間片 進行切片,因此,本實施例的預(yù)測路段可以由連續(xù)的四十八個屬于此路段的時空分割路段 表示,這樣可以表現(xiàn)出完整一天的預(yù)測路段。于是,預(yù)測路段的特征可以由所有完整一天的 時空分割路段的特征并集來表示。
[0041] 在步驟S102中,本實施例為每一個預(yù)測路段中的每一個時空分割路段提取特征 值以對其進行描述。在實施例中,每一個時空分割路段提取的特征值包括為靜態(tài)特征和動 態(tài)特征兩類。其中,靜態(tài)特征主要用于描述時空分割路段及其附近時空分割路段的路網(wǎng)的 結(jié)構(gòu),這些特征在長期是相對穩(wěn)定不變的特征,被歸為靜態(tài)特征一類。而動態(tài)特征旨在提取 該時空分割路段的動態(tài)信息,主要包括該時空分割路段及其近鄰時空分割路段的車輛平均 行進速度的相關(guān)信息。該類信息相關(guān)于實時的車輛行進情況,會不斷地發(fā)生變化,被歸為動 態(tài)特征一類。對于每一時空分割路段提取的完整特征其及相關(guān)描述總結(jié)與表1中:
[0042]
【權(quán)利要求】
1. 一種車輛行進開銷的預(yù)測方法,其特征在于,包括步驟: A、 將接收到的交通數(shù)據(jù)和地圖數(shù)據(jù)分化到各自相應(yīng)的預(yù)測路段內(nèi),并基于每一所述 預(yù)測路段內(nèi)的交通數(shù)據(jù)和地圖數(shù)據(jù),提取其對應(yīng)的特征值; B、 基于所述特征值將每一所述預(yù)測路段分化到不同的聚類中,使得同一個聚類中的所 有預(yù)測路段有著相似的特征; C、 將同一個聚類的交通數(shù)據(jù)和地圖數(shù)據(jù)分化到其對應(yīng)的過去連續(xù)的多個特定時間切 片內(nèi),并計算出每個時間切片內(nèi)的平均車輛行進開銷值,從而得到按照時間先后次序排列 的聚類的歷史車輛行進開銷序列; D、 根據(jù)所述聚類的歷史車輛行進開銷序列,利用時間序列預(yù)測方法得到其對應(yīng)的多個 未來時間切片的聚類的未來車輛行進開銷序列,所述聚類的歷史車輛行進開銷序列和聚類 的未來車輛行進開銷序列構(gòu)成聚類的完整車輛行進開銷序列; E、 利用所述聚類的完整車輛行進開銷序列對該聚類的任一預(yù)測路段的部分時間切片 的車輛行進開銷序列進行相關(guān)性完整填充,其中填充在任一預(yù)測路段的未來時間切片內(nèi)的 車輛行進開銷序列作為該預(yù)測路段的未來車輛行進開銷預(yù)測值。
2. 如權(quán)利要求1所述的車輛行進開銷的預(yù)測方法,其特征在于,每一所述預(yù)測路段可 以由連續(xù)的多個屬于此路段的時空分割路段表示,所述時空分割路段定義為給定時間段下 的特定長度路段,且所述給定時間段與所述特定時間切片一致。
3. 如權(quán)利要求1或2所述的車輛行進開銷的預(yù)測方法,其特征在于,所述特征值靜態(tài) 特征值和動態(tài)特征值,所述靜態(tài)特征值包括但不限于時空分割路段類型、時空分割路段長 度、時空分割路段的近鄰時空分割路段平均類型、時空分割路段的近鄰時空分割路段平均 長度、時空分割路段的近鄰時空分割路段類型方差、時空分割路段的近鄰時空分割路段長 度方差以及時空分割路段的近鄰時空分割路段數(shù)量;所述動態(tài)特征值包括但不限于時空分 割路段的近鄰時空分割路段第i個時間段平均行進速度以及時空分割路段的近鄰時空分 割路段第i個時間段行進速度方差;其中,i= 〇時表示同一時間段內(nèi),i= 1與i= -1分 別表示下一個時間段內(nèi)和上一個時間段內(nèi),依此類推。
4. 如權(quán)利要求1所述的車輛行進開銷的預(yù)測方法,其特征在于,所述步驟B具體包括: B1、通過公式(1)將每一所述預(yù)測路段的特征值進行歸一化處理,從而減少各個特征 值的大小差距:
其中,F(xiàn)"igin是每個時空分割路段的初始特征值,F(xiàn)_是此類特征的最大值,F(xiàn)n_為歸一 化后的特征值,因此歸一化后的特征值均處于零到一之間。 B2、基于經(jīng)過歸一化處理后的特征值并通過K-Means的聚類方法將每一所述預(yù)測路段 分化到不同的聚類中,從而使得同一個聚類中的所有預(yù)測路段有著相似的特征,具體包括 步驟: B21、初始化定義K個聚類中心; B22、根據(jù)公式(2)中定義的預(yù)測路段與聚類中心的距離,將各個預(yù)測路段歸類到其距 離最近的聚類中心處:
其中,Disa。表示任一預(yù)測路段到任一個聚類中心的距離,fV代表該預(yù)測路段的第i個 特征值,而V代表該聚類中心的第i個特征值; B23、根據(jù)每個聚類中的預(yù)測路段的平均特征值更新該聚類的中心,直至預(yù)測路段的平 均特征值與聚類中心完全重合無法更新為止。
5. 如權(quán)利要求1所述的車輛行進開銷的預(yù)測方法,其特征在于,所述步驟E具體包括步 驟: E1、定義所述聚類的完整車輛行進開銷序列與該聚類中的任一預(yù)測路段的部分時間切 片的車輛行進開銷序列的距離如公式(4)所示:
其中,CP表示聚類的完整車輛行進開銷序列,R表示任一預(yù)測路段的部分時間切片 的車輛行進開銷序列,R.tc表示該預(yù)測路段已擁有的部分時間切片的車輛行進開銷值, CP.correspondingTc表示聚類完整車輛行進開銷時間序列中對應(yīng)于R.tc同一時間片段中 的車輛行進開銷值; E2、將聚類的完整車輛行進開銷序列的數(shù)據(jù)整體放大/縮小α倍,從而使得公式(4) 中的距離Distance(CP,R)最??;其中,α為正實數(shù); Ε3、將縮放后的所述聚類的完整車輛行進開銷序列中的對應(yīng)數(shù)值填補到所述預(yù)測路段 的部分時間切片的車輛行進開銷序列的缺失值處,填充完整后形成預(yù)測路段的車輛行進開 銷序列,并使該預(yù)測路段的車輛行進開銷序列與所述聚類的完整車輛行進開銷序列的相關(guān) 性最尚; Ε4、對于填充完整后的所述預(yù)測路段的車輛行進開銷序列,提取填充在該預(yù)測路段的 未來時間切片內(nèi)的車輛行進開銷序列作為該預(yù)測路段的未來車輛行進開銷預(yù)測值。
6. -種車輛行進開銷的預(yù)測系統(tǒng),其特征在于,包括: 預(yù)測路段分化單元,用于將接收到的交通數(shù)據(jù)和地圖數(shù)據(jù)分化到各自相應(yīng)的預(yù)測路段 內(nèi); 預(yù)測路段特征值提取單元,基于每一所述預(yù)測路段內(nèi)的交通數(shù)據(jù)和地圖數(shù)據(jù),提取其 對應(yīng)的特征值; 預(yù)測路段聚類單元,基于所述特征值將每一所述預(yù)測路段分化到不同的聚類中,使得 同一個聚類中的所有預(yù)測路段有著相似的特征; 聚類的歷史車輛行進開銷序列計算單元,用于將同一個聚類的交通數(shù)據(jù)和地圖數(shù)據(jù)分 化到其對應(yīng)的過去連續(xù)的多個特定時間切片內(nèi),并計算出每個時間切片內(nèi)的平均車輛行進 開銷值,從而得到按照時間先后次序排列的聚類的歷史車輛行進開銷序列; 聚類的未來車輛行進開銷序列預(yù)測單元,用于根據(jù)所述聚類的歷史車輛行進開銷序 列,利用時間序列預(yù)測方法得到其對應(yīng)的多個未來時間切片的聚類的未來車輛行進開銷序 列,所述聚類的歷史車輛行進開銷序列和聚類的未來車輛行進開銷序列構(gòu)成聚類的完整車 輛行進開銷序列;以及 預(yù)測路段的行進開銷預(yù)測單元,利用所述聚類的完整車輛行進開銷序列對該聚類的任 一預(yù)測路段的部分時間切片的車輛行進開銷序列進行相關(guān)性完整填充,其中填充在任一預(yù) 測路段的未來時間切片內(nèi)的車輛行進開銷序列作為該預(yù)測路段的未來車輛行進開銷預(yù)測 值。
7. 如權(quán)利要求6所述的車輛行進開銷的預(yù)測系統(tǒng),其特征在于,每一所述預(yù)測路段可 以由連續(xù)的多個屬于此路段的時空分割路段表示,所述時空分割路段定義為給定時間段下 的特定長度路段,且所述給定時間段與所述特定時間切片一致。
8. 如權(quán)利要求6所述的車輛行進開銷的預(yù)測系統(tǒng),其特征在于,所述特征值靜態(tài)特征 值和動態(tài)特征值,所述靜態(tài)特征值包括但不限于時空分割路段類型、時空分割路段長度、時 空分割路段的近鄰時空分割路段平均類型、時空分割路段的近鄰時空分割路段平均長度、 時空分割路段的近鄰時空分割路段類型方差、時空分割路段的近鄰時空分割路段長度方差 以及時空分割路段的近鄰時空分割路段數(shù)量;所述動態(tài)特征值包括但不限于時空分割路段 的近鄰時空分割路段第i個時間段平均行進速度以及時空分割路段的近鄰時空分割路段 第i個時間段行進速度方差;其中,i= 〇時表示同一時間段內(nèi),i= 1與i= -1分別表示 下一個時間段內(nèi)和上一個時間段內(nèi),依此類推。
9. 如權(quán)利要求6所述的車輛行進開銷的預(yù)測系統(tǒng),其特征在于,所述預(yù)測路段聚類單 元具體包括: 歸一化模塊,用于通過公式(1)將每一所述預(yù)測路段的特征值進行歸一化處理,從而 減少各個特征值的大小差距:
其中,Ligin是每個預(yù)測路段的初始特征值,F(xiàn)_是此類特征的最大值,F(xiàn)_為歸一化后 的特征值,因此歸一化后的特征值均處于零到一之間; K-Means聚類模塊,基于經(jīng)過歸一化處理后的特征值并通過K-Means的聚類方法將每 一所述預(yù)測路段分化到不同的聚類中,從而使得同一個聚類中的所有預(yù)測路段有著相似的 特征; 所述K-Means聚類模塊通過以下步驟將每一所述預(yù)測路段分化到不同的聚類中: (1) 、初始化定義K個聚類中心; (2) 、根據(jù)公式(2)中定義的預(yù)測路段與聚類中心的距離,將各個預(yù)測路段歸類到其距 離最近的聚類中心處:
其中,Disa。表示任一預(yù)測路段到任一個聚類中心的距離,fV代表該預(yù)測路段的第i個 特征值,而V代表該聚類中心的第i個特征值; (3)、根據(jù)每個聚類中的預(yù)測路段的平均特征值更新該聚類的中心,直至預(yù)測路段的平 均特征值與聚類中心完全重合無法更新為止。
10.如權(quán)利要求6所述的車輛行進開銷的預(yù)測系統(tǒng),其特征在于,所述預(yù)測路段的行進 開銷預(yù)測單元通過以下步驟計算預(yù)測路段的未來車輛行進開銷預(yù)測值: (1) 定義所述聚類的完整車輛行進開銷序列與該聚類中的任一預(yù)測路段的部分時間切 片的車輛行進開銷序列的距離如公式(4)所示:
其中,CP表示聚類的完整車輛行進開銷序列,R表示任一預(yù)測路段的部分時間切片 車輛行進開銷序列,R.tc表示該預(yù)測路段已擁有的部分時間切片的車輛行進開銷值, CP.correspondingTc表示聚類完整車輛行進開銷時間序列中對應(yīng)于R.tc同一時間片段中 的車輛行進開銷值; (2) 將聚類的完整車輛行進開銷序列的數(shù)據(jù)整體放大/縮小α倍,從而使得公式(4) 中的距離Distance(CP,R)最??;其中,α為正實數(shù); (3) 將縮放后的所述聚類的完整車輛行進開銷序列中的對應(yīng)數(shù)值填補到所述預(yù)測路段 的部分時間切片的車輛行進開銷序列的缺失值處,填充完整后形成預(yù)測路段的車輛行進開 銷序列,并使該預(yù)測路段的車輛行進開銷序列與所述聚類的完整車輛行進開銷序列的相關(guān) 性最尚; (4) 對于填充完整后的所述預(yù)測路段的車輛行進開銷序列,提取填充在該預(yù)測路段的 未來時間切片內(nèi)的車輛行進開銷序列作為該預(yù)測路段的未來車輛行進開銷預(yù)測值。
【文檔編號】G08G1/01GK104464280SQ201410453712
【公開日】2015年3月25日 申請日期:2014年9月5日 優(yōu)先權(quán)日:2014年9月5日
【發(fā)明者】丁燁, 高民, 譚浩宇, 倪明選 申請人:廣州市香港科大霍英東研究院