1.一種單交叉口信號燈時間控制方法,其特征在于,該控制方法的步驟如下:
1)按照單交叉口四個來車方向和每種車輛排隊狀態(tài)中不同的排隊車輛數(shù)將車輛排隊狀態(tài)分為nk種,n為車輛排隊長度的種類,k為單交叉口的車道數(shù);
2)以交通信號相位個數(shù)、每個相位的最小時間、綠燈增加的時間段數(shù)和每段時間的長度作為交通行為;
3)根據(jù)所劃分的車輛排隊狀態(tài)和確定的交通行為采用Q學(xué)習(xí)法進行學(xué)習(xí),
Q(s,a)←Q(s,a)+α[μ+γmaxa'Q(s',a')-Q(s,a)]
s←s′
其中α為學(xué)習(xí)速率,γ為折扣因子,s為目前的交通狀態(tài)即車輛排隊狀態(tài),a為某一交通行為,μ為補償值,s'為下一個狀態(tài),a'為下一個交通行為。
2.根據(jù)權(quán)利要求1所述的單交叉口信號燈時間控制方法,其特征在于,所述的補償值μ是當(dāng)前信號周期通過交叉口車輛數(shù)與周期結(jié)束時交叉口排隊的車輛數(shù)的差值,當(dāng)通過交叉口的車輛數(shù)大于排隊的車輛數(shù)時,補償值為正值;當(dāng)通過交叉口的車輛數(shù)大于排隊的車輛數(shù)時補償值為負值。
3.根據(jù)權(quán)利要求1所述的單交叉口信號燈時間控制方法,其特征在于,交叉口的周期長度δ為:
δ=nph×tmin+nex×hex
其中nph表示交通信號相位的個數(shù),tmin表示每個相位的最小時間,nex表示綠燈增加的時間段數(shù),hex表示每段時間的長度。
4.根據(jù)權(quán)利要求3所述的單交叉口信號燈時間控制方法,其特征在于,所述交叉口的周期長度δ可調(diào),周期長度δ通過調(diào)整綠燈增加的時間段數(shù)nex和每段時間長度hex來實現(xiàn)調(diào)整。
5.一種單交叉口信號燈時間控制系統(tǒng),其特征在于,該控制系統(tǒng)包括車輛排隊狀態(tài)劃分模塊、交通行為構(gòu)建模塊和Q學(xué)習(xí)迭代模塊,
所述的車輛排隊狀態(tài)劃分模塊用于按照單交叉口四個來車方向和每種車輛排隊狀態(tài)中不同的排隊車輛數(shù)將車輛排隊狀態(tài)分為nk種,n為車輛排隊長度的種類,k為單交叉口的車道數(shù);
所述的交通行為構(gòu)建模塊用于以交通信號相位個數(shù)、每個相位的最小時間、綠燈增加的時間段數(shù)和每段時間的長度作為交通行為;
所述的Q學(xué)習(xí)迭代模塊用于根據(jù)所劃分的車輛排隊狀態(tài)和確定的交通行為采用Q學(xué)習(xí)法進行學(xué)習(xí),
Q(s,a)←Q(s,a)+α[μ+γmaxa'Q(s',a')-Q(s,a)]
s←s′
其中α為學(xué)習(xí)速率,γ為折扣因子,s為目前的交通狀態(tài)即車輛排隊狀態(tài),a為某一交通行為,μ為補償值,s'為下一個狀態(tài),a'為下一個交通行為。
6.根據(jù)權(quán)利要求5所述的單交叉口信號燈時間控制系統(tǒng),其特征在于,所述的補償值μ是當(dāng)前信號周期通過交叉口車輛數(shù)與周期結(jié)束時交叉口排隊的車輛數(shù)的差值,當(dāng)通過交叉口的車輛數(shù)大于排隊的車輛數(shù)時,補償值為正值;當(dāng)通過交叉口的車輛數(shù)大于排隊的車輛數(shù)時補償值為負值。
7.根據(jù)權(quán)利要求5所述的單交叉口信號燈時間控制系統(tǒng),其特征在于,交叉口的周期長度δ為:
δ=nph×tmin+nex×hex
其中nph表示交通信號相位的個數(shù),tmin表示每個相位的最小時間,nex表示綠燈增加的時間段數(shù),hex表示每段時間的長度。
8.根據(jù)權(quán)利要求7所述的單交叉口信號燈時間控制系統(tǒng),其特征在于,所述交叉口的周期長度δ可調(diào),周期長度δ通過調(diào)整綠燈增加的時間段數(shù)nex和每段時間長度hex來實現(xiàn)調(diào)整。