基于隱語義模型的交通信號優(yōu)化方法
【專利摘要】本發(fā)明公開了一種基于隱語義模型的交通信號優(yōu)化方法,該方法利用隱語義模型在推薦系統(tǒng)中處理不確定性因素的優(yōu)勢,將交通狀態(tài)類比為用戶,將配時方案類比為物品,將交通指標(如延時)類比為評分。該方法包括:預處理數(shù)據(jù);將交通狀態(tài)和配時方案映射到隱語義空間;訓練交通狀態(tài)對配時方案的評分預測模型;預測評分并選擇最佳配時方案;實際應用配時方案并反饋交通信息。本發(fā)明方法簡單易行,能處理傳統(tǒng)控制策略不能很好處理、但實際存在且影響較大的不確定性因素,無需精確對難以準確量化的不確定性因素建模,所以具有很好的普適性和較少約束,可作為傳統(tǒng)策略的補充和優(yōu)化。
【專利說明】基于隱語義模型的交通信號優(yōu)化方法
【技術領域】
[0001] 本發(fā)明涉及交通信號控制、信息處理和數(shù)據(jù)挖掘等【技術領域】,更具體地,涉及一種 基于隱語義模型的交通信號優(yōu)化方法。
【背景技術】
[0002] 城市機動車保有量的不斷增長,導致很多城市問題,如交通擁堵、環(huán)境污染、交通 事故等。單純依賴于增建交通基礎設施,如擴張道路等,既耗財較大,又需面對樓房拆遷和 城市已有規(guī)劃等現(xiàn)實問題。交通信號控制已在實踐中被證明是一種有效的緩解交通問題的 方式,主要通過給各種復雜多變的路況提供實時的配時方案來實現(xiàn)。理論研究上的交通信 號控制,試圖分析實際交通環(huán)境中的各種可能影響交通狀況的因素,通過理想化或假設性 建模,用數(shù)學語言描述盡可能貼近實際的交通環(huán)境,進一步預測下一時段的路況,以提前配 置出合適的紅綠燈配時方案,以盡可能的減輕交通擁堵?;诶碚撗芯浚壳暗慕煌ㄐ盘柨?制策略可大致分為定時控制、感應控制、智能控制等;但受限于實際交通環(huán)境的復雜性和隨 機性等,實際應用中以初級的定時控制策略為主。而導致其復雜性、隨機性等的主要因素, 就是實際交通環(huán)境中有大量的不確定性因素,這些因素難以用數(shù)學語言準確建模、甚至有 相當一部分不確定因素無法建模,這就導致理論上的理想化假設在實際應用中無法達到令 人滿意的程度。
[0003] 推薦系統(tǒng)目前主要應用在電子商務、電影網(wǎng)站、音樂網(wǎng)站、視頻網(wǎng)站、廣告等領 域;個性化推薦系統(tǒng)通過建立用戶與信息產(chǎn)品之間的二元關系,利用已有的選擇過程或相 似性關系挖掘每個用戶潛在感興趣的對象,進而進行個性化推薦。而隱語義模型(Latent Factor Model)是近幾年在推薦系統(tǒng)領域最為熱門的研究話題,它的核心思想是通過隱含 特征(latent factor)聯(lián)系用戶興趣和物品;隱語義模型取得很好的效果并被廣泛應用, 其主要原因是它能較好的處理用戶興趣與物品之間相互影響的很多不確定性因素,即隱含 特征。隱語義模型試圖通過分析用戶對物品的評分,將用戶和物品都映射到一個隱語義空 間;物品和用戶均由一個向量表示,向量元素即為各種不確定性因素。例如,以電影為例,有 些因素是顯性的,如喜劇片、動作片、驚悚片等,有些因素是很難定義明確的,如道德深度、 詭異程度等等,還有很多因素根本就無法解釋,但這些因素都是影響用戶對電影的喜好程 度,對用戶與電影之間的相互影響起著關鍵性的作用。用戶喜好這些元素的程度越高,且電 影擁有這些元素的程度越高,則用戶越容易喜歡這些電影。隱語義模型,從機器學習和數(shù)據(jù) 挖掘的角度,很好的處理了用戶與物品之間的難以用數(shù)學精確建模的不確定性因素,很好 的建立起了用戶與物品的最佳匹配的連接。
[0004] 隨著檢測技術的日益成熟,交通中的數(shù)據(jù)量也與日俱增,使得在交通中應用機器 學習和數(shù)據(jù)挖掘技術成為可能;且交通中也存在一些指標可以反映交通狀態(tài)對交通信號的 "喜好程度",如交通狀態(tài)在對應交通信號配時方案下的延時、流量等。如何將隱語義模型無 縫連接的應用到交通信號推薦中,處理好復雜交通環(huán)境中難以建模但又對實際交通狀況有 影響的不確定性因素,是一個極大的挑戰(zhàn)和極具意義的研究點。
【發(fā)明內容】
[0005] 針對當前實際交通環(huán)境中存在大量難以用數(shù)學精確建模、甚至根本無法建模的不 確定因素,以及這些因素造成理論研究成果和實際應用之間的差距問題,本發(fā)明的目的是 提供一種基于隱語義模型的交通信號優(yōu)化方法,以解決理論成果和實際應用的無縫連接問 題。
[0006] 為了實現(xiàn)上述目的,本發(fā)明提出了一種基于隱語義模型的交通信號優(yōu)化方法,包 括以下步驟:
[0007] 選定相關交通指標,為評分建模;
[0008] 為基本交通狀態(tài)和配時方案建模;
[0009] 結合實際交通情況,考慮交通狀態(tài)和配時方案本身特性,進一步細化精確所述評 分預測模型;
[0010] 利用數(shù)據(jù)庫的數(shù)據(jù)和優(yōu)化方法,從機器學習的角度訓練所述評分預測模型的參 數(shù),以得到交通狀態(tài)對配時方案的評分預測公式參數(shù);
[0011] 利用得到的所述評分預測公式參數(shù),結合所述評分預測模型,預測交通狀態(tài)對未 使用過的配時方案的評分;
[0012] 對比得到的所述最佳配時方案和該交通狀態(tài)歷史使用過的配時方案,得出最終最 優(yōu)配時方案。
[0013] 其中,所述數(shù)據(jù)庫的數(shù)據(jù)采集既可以通過技術采集,也可以通過交管局獲??;以及 所述數(shù)據(jù)庫中的配時方案既可以通過采集得到,又可以由經(jīng)典算法生成。
[0014] 其中,作為評分的交通指標,選取延時作為評分。
[0015] 其中,所述為基本交通狀態(tài)和配時方案建模的步驟包括:將交通狀態(tài)和配時方案 以向量的形式映射到隱語義空間,用數(shù)學語言表述為:
[0016] qt e Rf, ps e Rf,
[0017] 其中,向量qt表示配時方案,向量ps表示交通狀態(tài),f表示交通狀態(tài)和配時方案之 間相互作用的不確定性因素。
[0018] 其中,所述進一步細化精確所述評分預測模型的步驟包括:
[0019] 用公式表達交通狀態(tài)和配時方案中存在的偏置評分為:
[0020] bst = u+bs+bt,
[0021] 由此,最終的評分預測模型為
[0022] /;, = n + bs + b, + ¢// ps ^
[0023] 其中,fst為預測評分結果,bst表示偏置評分,u表示平均評分,b s和bt分別表示 交通狀態(tài)和配時方案本身打分或被打分偏離平局分u的程度,向量qt表不配時方案,向量 ps表示交通狀態(tài)。
[0024] 其中,所述利用數(shù)據(jù)庫的數(shù)據(jù)和優(yōu)化方法,從機器學習的角度訓練所述評分預測 模型的參數(shù),以得到交通狀態(tài)對配時方案的評分預測公式參數(shù)的步驟進一步包括:
[0025] 整理提取出數(shù)據(jù)庫中的交通狀態(tài)、配時方案和相應評分都均在的三元數(shù)組;
[0026] 數(shù)據(jù)預處理:將上述三元數(shù)組的數(shù)據(jù)按要求處理成統(tǒng)一標準格式;
[0027] 將處理好的數(shù)據(jù)分成Μ份,其中M-1份作為訓練集,剩余1份作為測試集;
[0028] 在訓練集上訓練模型參數(shù),此處選擇以最小化預測評分和真實評分的絕對均方差 為目標訓練,即
[0029]
【權利要求】
1. 一種基于隱語義模型的交通信號優(yōu)化方法,包括以下步驟: 選定相關交通指標,為評分建模; 為基本交通狀態(tài)和配時方案建模; 結合實際交通情況,考慮交通狀態(tài)和配時方案本身特性,進一步細化精確所述評分預 測模型; 利用數(shù)據(jù)庫的數(shù)據(jù)和優(yōu)化方法,從機器學習的角度訓練所述評分預測模型的參數(shù),以 得到交通狀態(tài)對配時方案的評分預測公式參數(shù); 利用得到的所述評分預測公式參數(shù),結合所述評分預測模型,預測交通狀態(tài)對未使用 過的配時方案的評分; 對比得到的所述最佳配時方案和該交通狀態(tài)歷史使用過的配時方案,得出最終最優(yōu)配 時方案。
2. 根據(jù)權利要求1所述的基于隱語義模型的交通信號優(yōu)化方法,其中所述數(shù)據(jù)庫的數(shù) 據(jù)是通過技術采集,或者通過交管局獲取;以及所述數(shù)據(jù)庫中的配時方案是通過采集得到, 或者由經(jīng)典算法生成。
3. 根據(jù)權利要求1所述的基于隱語義模型的交通信號優(yōu)化方法,其中作為評分的交通 指標,選取延時作為評分。
4. 根據(jù)權利要求1所述的基于隱語義模型的交通信號優(yōu)化方法,其中所述為基本交 通狀態(tài)和配時方案建模的步驟包括:將交通狀態(tài)和配時方案以向量的形式映射到隱語義空 間,用數(shù)學語言表述為: qt e Rf, Ps e Rf, 其中,向量qt表示配時方案,向量Ps表示交通狀態(tài),f表示交通狀態(tài)和配時方案之間相 互作用的不確定性因素。
5. 根據(jù)權利要求1所述的基于隱語義模型的交通信號優(yōu)化方法,其中所述進一步細化 精確所述評分預測模型的步驟包括: 用公式表達交通狀態(tài)和配時方案存在的偏置評分為: bst = u+bs+bt, 由此,最終的評分預測模型為 =? + + h, + t\ , 其中,fst為預測評分結果,bst表示偏置評分,u表示平均評分,bs和bt分別表示交通 狀態(tài)和配時方案本身打分或被打分偏離平局分u的程度,向量qt表不配時方案,向量ps表 示交通狀態(tài)。
6. 根據(jù)權利要求1所述的基于隱語義模型的交通信號優(yōu)化方法,其中所述利用數(shù)據(jù)庫 的數(shù)據(jù)和優(yōu)化方法,從機器學習的角度訓練所述評分預測模型的參數(shù),以得到交通狀態(tài)對 配時方案的評分預測公式參數(shù)的步驟進一步包括: 整理提取出數(shù)據(jù)庫中的交通狀態(tài)、配時方案和相應評分都均在的三元數(shù)組; 數(shù)據(jù)預處理:將上述三元數(shù)組的數(shù)據(jù)按要求處理成統(tǒng)一標準格式; 將處理好的數(shù)據(jù)分成Μ份,其中M-1份作為訓練集,剩余1份作為測試集; 在訓練集上訓練模型參數(shù),此處選擇以最小化預測評分和真實評分的絕對均方差為目 標訓練,即
其中,rst為真實評分,α表示訓練集上交通狀態(tài)、配時方案和相應評分都存在的三元 組的集合,上式第二項為防止過擬合的正則化項,λ為正則化參數(shù),其具體值一般結合實驗 選??;此處通過隨機梯度下降法或最小二乘法進行優(yōu)化,得到各待求參數(shù); 得到模型后,在測試集上測試該模型下的絕對均方差,通過以下公式計算:
其中,I α I表示測試集上交通狀態(tài)、配時方案和相應評分都存在的三元組的集合的長 度; 調整參數(shù)f,重復上述兩個步驟,訓練出各種不同的模型,以及相應的測試集上的絕對 均方差值; 根據(jù)以上結果,選擇使得絕對均方差RMSE最小的最佳預測模型。
7. 根據(jù)權利要求6所述的基于隱語義模型的交通信號優(yōu)化方法,其中所述對比得到的 所述最佳配時方案和該交通狀態(tài)歷史使用過的配時方案的步驟包括:利用所得的所述最佳 預測模型,為當前交通狀態(tài)預測其未使用過的配時方案的評分,并將該評分與具使用過的 配時方案的評分對比,確定最終最佳的配時方案。
8. 根據(jù)權利要求1所述的基于隱語義模型的交通信號優(yōu)化方法,還包括在得到最佳配 時方案之后,進一步將實際應用后的數(shù)據(jù)反饋給所述數(shù)據(jù)庫,進一步豐富或更新所述數(shù)據(jù) 庫的步驟。
【文檔編號】G08G1/07GK104112366SQ201410360312
【公開日】2014年10月22日 申請日期:2014年7月25日 優(yōu)先權日:2014年7月25日
【發(fā)明者】王飛躍, 趙一飛, 呂宜生, 朱鳳華 申請人:中國科學院自動化研究所