本發(fā)明涉及快速路交通控制技術(shù)領(lǐng)域,具體涉及一種快速路交通系統(tǒng)的迭代動態(tài)線性化及自學(xué)習(xí)控制方法。
背景技術(shù):
快速路交通控制是交通工程和智能交通系統(tǒng)中的一個重要領(lǐng)域。高峰期高速公路的頻繁擁堵使交通狀況惡化。造成快速路擁堵最常見的原因包括:交通需求大于設(shè)計(jì)能力、交通事故、道路工程和天氣狀況。為了更好地發(fā)揮快速路的性能,入口匝道是普遍采用的策略。入口匝道控制的目的是為了調(diào)節(jié)在其入口匝道處進(jìn)入快速路主道的交通量,保證在下游干線快速路上保持期望(或最優(yōu))的車流量,使得快速路通行能力達(dá)到最大化。實(shí)際中,可在入口匝道處,通過交通監(jiān)測裝置和信號配時裝置對進(jìn)入的汽車數(shù)量進(jìn)行統(tǒng)計(jì)檢測和控制。
目前,基于局部和協(xié)調(diào)反饋的alinea入口匝道策略已成功應(yīng)用到快速路交通系統(tǒng)控制中。它已被證明是一種非常簡單,高效且方便實(shí)現(xiàn)的入口匝道控制方法。然而,該方法難以校準(zhǔn)影響系統(tǒng)性能的關(guān)鍵模型參數(shù),因?yàn)槟P蛥?shù)會隨著道路條件的幾何結(jié)構(gòu)和環(huán)境因素,如雨水或者霧天而有所不同。此外,快速路交通流系統(tǒng)是強(qiáng)非線性、耦合且不確定的,因此其準(zhǔn)確的模型在實(shí)際中很難得到。所以,將常見的基于模型的控制方法應(yīng)用于快速路交通控制問題時,常會遇到很多意想不到的困難。
另一方面,宏觀交通流模式一般都是每天重復(fù)的。例如,交通流將從午夜開始并逐漸增加至第一個高峰即早高峰,通常從上午7點(diǎn)到9點(diǎn),第二個高峰從下午5點(diǎn)到7點(diǎn)。擁堵通常每天在同一位置開始。迭代學(xué)習(xí)控制(ilc)非常適合處理重復(fù)過程的控制問題。在前期的研究中,有學(xué)者提出了一些基于入口匝道策略的ilc方法,并已經(jīng)應(yīng)用于快速路一天或一周的密度控制中。在文獻(xiàn)“freewaytrafficcontrolusingiterativelearningcontrol-basedrampmeteringandspeedsignaling”中,討論了基于ilc的入口匝道和速度控制。在文獻(xiàn)“aniterativelearningapproachfordensitycontroloffreewaytrafficflowviarampmetering”中,研究了以互補(bǔ)方式與純誤差反饋相結(jié)合的學(xué)習(xí)機(jī)制,仿真結(jié)果證明了基于ilc的優(yōu)越性。文獻(xiàn)“acomplementarymodularizedrampmeteringapproachbasedoniterativelearningcontrolandalinea”,通過使用基于ilc的入口匝道策略和基于ilc和alinea相結(jié)合的互補(bǔ)入口匝道策略來對輸入飽和進(jìn)行研究。在文獻(xiàn)“iterativelearningcontroloffreewayflowviarampmeteringandsimulationonparamics”和文獻(xiàn)“flowbasedlocalrampmeteringusingiterativelearningandparamicsplatform”中,進(jìn)一步評估了基于ilc的入口匝道控制的有效性。
需要注意的是,上述用于入口匝道控制的ilc方法都是基于壓縮映射和固定點(diǎn)理論設(shè)計(jì)的線性迭代學(xué)習(xí)算法,這在實(shí)際應(yīng)用中會存在兩個主要的限制。第一個限制是,由于跟蹤誤差的收斂性是基于λ范數(shù)獲得的,有時沿迭代軸系統(tǒng)輸出的瞬態(tài)響應(yīng)性能變差。第二個限制是相同初始狀態(tài)及相同參考軌跡必須匹配才能獲得完全跟蹤。
日復(fù)一日的嚴(yán)格重復(fù)性是一種理想的交通控制情況。實(shí)際中,由于快速路的道路條件和環(huán)境因素,例如雨水和霧天,使得交通流密度和車輛平均速度的初始值,以及跟蹤目標(biāo)每天都是變化的。因此,研究非嚴(yán)格重復(fù)模式的具有隨機(jī)初始條件和迭代變化的期望密度軌跡的快速路交通系統(tǒng)的ilc方法是具有一定意義的。
目前,自適應(yīng)迭代學(xué)習(xí)控制(ailc)方案得到了廣泛研究,并且有許多成功的案例。在一般情況下,ailc最具有吸引力的優(yōu)點(diǎn)是其處理迭代變化的參考軌跡的能力,并且這些參考軌跡是有界但可能具有大的隨機(jī)初始重置誤差以及干擾等問題。然而,大多數(shù)現(xiàn)有的ailc依賴于這樣一個事實(shí),即未知參數(shù)被已知非線性函數(shù)線性參數(shù)化,由于宏觀交通流模型具有強(qiáng)非線性,因此不能直接用于快速路交通控制問題中。
最近,神經(jīng)網(wǎng)絡(luò)或模糊系統(tǒng)已被應(yīng)用到了ailc中,以解決非線性系統(tǒng)無法線性參數(shù)化的問題。然而,通常難以確定模糊規(guī)則庫和隸屬度函數(shù),并且用大量的操作數(shù)據(jù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)也比較困難。最近,有學(xué)者通過將動態(tài)線性化方法引入到迭代域,提出了針對一般非線性離散時間系統(tǒng)的一種數(shù)據(jù)驅(qū)動的無模型自適應(yīng)ilc。它實(shí)現(xiàn)了隨機(jī)初始條件下的完全跟蹤,并且不需要任何外部測試信號或訓(xùn)練過程。但是,目標(biāo)跟蹤軌跡必須是嚴(yán)格重復(fù)的。
受上述討論的啟發(fā),通過引入偽偏導(dǎo)數(shù)(ppd)的新概念,針對快速路交通系統(tǒng)提出了一種新的等價的動態(tài)線性化方法。進(jìn)一步,提出了一種基于快速路交通系統(tǒng)的迭代動態(tài)線性化的自學(xué)習(xí)控制方法(lineardata-modelbasedadaptiveilc,ldm-ailc),通過匝道調(diào)節(jié)對快速路交通流密度進(jìn)行控制。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的是提出了一種新的快速路交通系統(tǒng)的迭代動態(tài)線性化及自學(xué)習(xí)控制方法,通過匝道調(diào)節(jié)對快速路交通流密度進(jìn)行控制。
為了實(shí)現(xiàn)上述目的,本發(fā)明采用如下技術(shù)方案,快速路交通系統(tǒng)的迭代動態(tài)線性化及自學(xué)習(xí)控制方法,包括以下步驟:
(1)建立快速路交通系統(tǒng)的空間離散交通模型;
(2)將所述空間離散交通流模型用一般非線性離散時間系統(tǒng)的形式表示;
(3)將一般非線性離散時間模型轉(zhuǎn)化為動態(tài)線性化數(shù)據(jù)模型;
(4)建立動態(tài)線性化數(shù)據(jù)模型的學(xué)習(xí)控制律和參數(shù)更新律。
進(jìn)一步地,所述步驟(1)中所述快速路交通系統(tǒng)假設(shè)包括一條單車道的快速路,每一區(qū)段均有一個入口匝道和一個出口匝道,則所述快速路的空間離散交通流模型為:
qi(t)=ρi(t)vi(t),(2)
其中h是采樣時間間隔;t是指第t個時刻;i∈{1,λ,in}是指快速路的第i個區(qū)段;in是總的區(qū)段數(shù);τ,υ,κ,l,m為常數(shù)參數(shù);ρi(t)表示快速路第i個區(qū)段第t個時刻的交通流密度;vi(t)表示快速路第i個區(qū)段第t個時刻的平均速度;qi(t)表示快速路第i個區(qū)段第t個時刻的交通流量;ri(t)表示快速路第i個區(qū)段第t個時刻的入口匝道交通流率;si(t)表示快速路第i個區(qū)段第t個時刻的出口匝道交通流率;li表示快速路第i個區(qū)段的長度,vfree表示快速路第i個區(qū)段的自由速度,ρjam表示最大密度。
進(jìn)一步地,將所述空間離散交通流模型轉(zhuǎn)化為一般非線性形式為:
y(t+1)=f[y(t),r(t),d(t)],(5)
其中,狀態(tài)向量y(t)∈rn包括所有交通密度、平均速度以及匝道序列;控制向量r(t)∈rn包括所有可控匝道流率;干擾向量d(t)∈rn包括所有入口匝道的需求和轉(zhuǎn)彎速度;f(λ)∈rn是向量值函數(shù)。
進(jìn)一步地,所述步驟(3)中將一般非線性離散時間模型轉(zhuǎn)化為動態(tài)線性化數(shù)據(jù)模型,需要設(shè)定非線性數(shù)據(jù)模型滿足以下2個假設(shè):
假設(shè)1:f(λ)關(guān)于控制向量r(t)的偏導(dǎo)數(shù)連續(xù);
假設(shè)2:非線性數(shù)據(jù)模型滿足廣義lipschitz條件,即對任意固定的t和||δr(t)||≠0,有
其中,δy(t+1)=y(tǒng)(t+1)-y(t),δr(t+1)=r(t)-r(t-1);
則可得,對于任意的時刻t一定存在一個被稱為ppd矩陣的參數(shù)
δy(t+1)=φ(t)δr(t)(6)
其中,φ(t)∈rn×n且||φ(t)||≤bφ。
進(jìn)一步地,所述步驟(5)中建立動態(tài)線性化數(shù)據(jù)模型的學(xué)習(xí)控制律和參數(shù)更新律的步驟為:
(51)設(shè)動態(tài)線性化數(shù)據(jù)模型滿足假設(shè)3,同時設(shè)定快速路交通系統(tǒng)在有限的運(yùn)行時間間隔t內(nèi)重復(fù),
假設(shè)3:ppd參數(shù)矩陣
(52)設(shè)期望交通輸出為yd,k(t)∈rn,對于所有的t∈{0,1,∧,t},k=1,2,∧,yd,k(t)是迭代相關(guān)且有界的,即
其中,byd為正常數(shù)且存在;
(53)定義跟蹤誤差ek(t)=y(tǒng)d,k(t)-yk(t),則
ek(t+1)=y(tǒng)d,k(t+1)-yk(t)-φ(t)δrk(t)=φ(t)(φ(t)-1yd,k(t+1)-φ(t)-1yk(t)-δrk(t))(9)
令
ek(t+1)=φ(t)[θ(t)ζk(t)-δrk(t)](10)
其中,ζk(t)=y(tǒng)d,k(t+1)-yk(t)∈rn,θ(t)=φ(t)-1∈rn×n;
(54)則可得第k次的學(xué)習(xí)控制律可表述為:
其中,
其中,
本發(fā)明所提出的ldm-ailc方法能夠處理非線性系統(tǒng),并且無需已知線性參數(shù)的結(jié)構(gòu),它是一種數(shù)據(jù)驅(qū)動的控制方法,控制器的設(shè)計(jì)和分析只取決于i/o數(shù)據(jù)。此外,在具有隨機(jī)初始狀態(tài)和迭代變化跟蹤目標(biāo)的非嚴(yán)格可重復(fù)條件下,所提出的ldm-ailc方法仍然能夠獲得完全跟蹤性能。因此,在實(shí)踐中更適合于具有更高階、強(qiáng)非線性和非嚴(yán)格可重復(fù)條件的這種典型的復(fù)雜快速路交通控制系統(tǒng)。理論分析和仿真結(jié)果均證實(shí)了所提方法的有效性。并且本發(fā)明的方法具有以下優(yōu)點(diǎn):
(1)本發(fā)明的快速路交通系統(tǒng)的迭代動態(tài)線性化方法,與以前的方法相比,不需要模型且完全等價;
(2)本發(fā)明的方法是基于數(shù)據(jù)驅(qū)動的,是利用以前重復(fù)的信息來更新當(dāng)前的操作,與人的經(jīng)驗(yàn)學(xué)習(xí)類似;
(3)本發(fā)明的方法不需要要求系統(tǒng)每天從同一個初始點(diǎn)開始運(yùn)行;
(4)本發(fā)明的方法在每天的期望密度和期望速度有所改變時,也可以應(yīng)用。
附圖說明
圖1是具有入口/出口匝道的快速路各區(qū)段描述;
圖2是迭代變化的期望交通密度分布圖;
圖3是初始交通密度迭代100次的變化圖;
圖4是在時間間隔t∈{0,λ,500}內(nèi)的最大跟蹤誤差變化圖。
具體實(shí)施方式
下面結(jié)合附圖和實(shí)施例對本發(fā)明作進(jìn)一步的說明。
如圖1所示,快速路交通系統(tǒng)包括一個單車道的快速路,每一區(qū)段都有一個入口匝道和一個出口匝道。它的空間離散交通流模型如下(1)-(4)式所示。
qi(t)=ρi(t)vi(t),(2)
其中,h是采樣時間間隔;t是指第t個時刻,t∈{0,1,∧,t};i∈{1,∧,in}是指快速路的第i個區(qū)段;in是總的區(qū)段數(shù);τ,v,k,l,m為常數(shù)參數(shù);ρi(t)表示快速路第i個區(qū)段第t個時刻的交通流密度;vi(t)表示快速路第i個區(qū)段第t個時刻的平均速度;qi(t)表示快速路第i個區(qū)段第t個時刻的交通流量;ri(t)表示快速路第i個區(qū)段第t個時刻的入口匝道交通流率;si(t)表示快速路第i個區(qū)段第t個時刻的出口匝道交通流率;li表示快速路第i個區(qū)段的長度,vfree表示快速路第i個區(qū)段的自由速度,ρjam表示最大密度。
假設(shè)快速路交通系統(tǒng)在有限的時間間隔t={0,1,λ,t}內(nèi)重復(fù)運(yùn)行??刂颇繕?biāo)是設(shè)計(jì)一種不需要已知確切的交通流模型和干擾情況的自適應(yīng)ilc方法。自適應(yīng)ilc將利用歷史的快速路交通數(shù)據(jù)來產(chǎn)生控制輸入序列,以使得交通密度在整個區(qū)間t={0,1,λ,t}上收斂到期望值。
根據(jù)(1)–(4)式,將所述空間離散交通流模型用一般非線性離散時間形式表示為:
y(t+1)=f[y(t),r(t),d(t)],(5)
其中,狀態(tài)向量y(t)∈rn包含所有交通密度、平均速度以及匝道序列;控制向量r(t)∈rn包括所有可控匝道流率;干擾向量d(t)∈rp包含所有入口匝道的需求和轉(zhuǎn)彎速度;f(λ)∈rn是向量值函數(shù)。
假設(shè)1:f(λ)關(guān)于控制輸入r(t)的偏導(dǎo)數(shù)連續(xù)。
假設(shè)2:非線性數(shù)據(jù)模型滿足廣義lipschitz條件,即對任意固定的t和||δr(t)||≠0,有
||δy(t+1)||≤bφ||δr(t)||
其中,δy(t+1)=y(tǒng)(t+1)-y(t),δr(t)=r(t)-r(t-1);bφ是一個正常數(shù)。
假設(shè)1是一般非線性系統(tǒng)控制器設(shè)計(jì)的典型條件。假設(shè)2限制由控制輸入的變化驅(qū)動的系統(tǒng)輸出的變化率,它意味著入口匝道交通流量的有限變化不會導(dǎo)致交通密度的無限變化。此外,我們只需要已知bφ這樣一個常數(shù)的存在,而不需要已知它的精確值。
對于滿足假設(shè)1和假設(shè)2的一般非線性離散時間模型,當(dāng)||δr(t)||≠0時,對于任意的時刻t一定存在一個被稱為ppd矩陣的參數(shù)φ(t),使得非線性數(shù)據(jù)模型能夠轉(zhuǎn)化成如下等價的動態(tài)線性化數(shù)據(jù)模型,
δy(t+1)=φ(t)δr(t)(6)
其中,φ(t)∈rn×n且||φ(t)||≤bφ。
由非線性數(shù)據(jù)模型,
令ψ(t)=f[y(t),r(t-1),d(t)]-f[y(t-1),r(t-1),d(t-1)]。由假設(shè)1和微分中值定理,(a1)可重寫為
其中,
ψ(t)=h(t)δr(t)(a3)
因?yàn)闂l件||δr(t)||≠0滿足,方程(a3)至少有一個解h*(t)。事實(shí)上,對于每個時刻t,它一定具有無窮多個解。
令
動態(tài)線性化數(shù)據(jù)模型是對一般非線性離散時間模型的一種等價的描述,它與其他的線性形式不同,如泰勒線性化省略了高階項(xiàng)。動態(tài)線性化是一種數(shù)據(jù)驅(qū)動的方法,它的實(shí)現(xiàn)只依賴于系統(tǒng)的輸入輸出數(shù)據(jù)。此外,線性數(shù)據(jù)模型非常簡單,不需要任何模糊控制規(guī)則、外部測試信號以及像神經(jīng)網(wǎng)絡(luò)那樣的訓(xùn)練過程。
另一個假設(shè)是關(guān)于ppd參數(shù)的。
ppd參數(shù)矩陣φ(t)是正定或者非負(fù)定的。不失一般性,本文中我們假設(shè)φ(t)≥δi>0。
假設(shè)3規(guī)定了控制方向的同向性,這在控制系統(tǒng)中是常見的。
如文獻(xiàn)“datadrivenmodel-freeadaptivecontrolforaclassofmimononlineardiscrete-timesystems”所述,φ(t)表示馬爾可夫參數(shù)或線性系統(tǒng)的傳遞函數(shù),對于僅在有限時間間隔t∈{0,1,λ,t}上沿時間軸變化的快速路交通系統(tǒng),可以合理地假設(shè)φ(t)是嚴(yán)格可重復(fù)的,然后通過考慮快速路交通控制系統(tǒng)的重復(fù)性,動態(tài)線性化數(shù)據(jù)模型的等效表達(dá)式可表述為,
yk(t+1)=y(tǒng)k(t)+φ(t)δrk(t)(10)
其中,δrk(t)=rk(t)-rk(t-1);t={0,1,λ,t};k=1,2,λ代表迭代次數(shù)。
期望的交通輸出是yd,k(t)∈rn,對于所有的t∈{0,λ,t},k=1,2,λ,它是迭代相關(guān)且有界的,即
其中,我們只需要知道正常數(shù)byd的存在性。
定義跟蹤誤差ek(t)=y(tǒng)d,k(t)-yk(t),t∈{0,1,λ,t}。由(10)式,我們可以得到
ek(t+1)=y(tǒng)d,k(t+1)-yk(t)-φ(t)δrk(t)=φ(t)(φ(t)-1yd,k(t+1)-φ(t)-1yk(t)-δrk(t))(11)
令ζk(t)=y(tǒng)d,k(t+1)-yk(t)∈rn,θ(t)=φ(t)-1∈rn×n。等式(11)可重寫成
ek(t+1)=φ(t)[θ(t)ζk(t)-δrk(t)](12)
那么,第k次的學(xué)習(xí)控制律可表述如下
其中,
其中,
其中,與其它的自適應(yīng)ilc[14-20]不同,ζk(t)=y(tǒng)d,k(t+1)-yk(t)是線性函數(shù),與系統(tǒng)輸出和參考軌跡有關(guān)。因此,自動滿足關(guān)于線性增長條件。
其中,所提的ldm-ailc是一種數(shù)據(jù)驅(qū)動的方法,因?yàn)榭刂破鞯脑O(shè)計(jì)和分析僅用到系統(tǒng)輸入輸出的可測數(shù)據(jù)。未知參數(shù)θ(t)是隨迭代估計(jì)的,也是只用到控制系統(tǒng)可測的i/o數(shù)據(jù)。
針對mimo非線性離散時間系統(tǒng)所提出的ldm-ailc方案,在假設(shè)1–3滿足的條件下,控制律(13)與學(xué)習(xí)更新律(14)能夠保證:
(a)對于所有的t∈{0,λ,t},k=1,2,λ,ppd矩陣估計(jì)
(b)當(dāng)k趨于無窮時,跟蹤誤差ek(t),t∈{1,λ,t},沿迭代軸趨于零。
定義參數(shù)估計(jì)誤差
注意以下性質(zhì)
性質(zhì)1.
性質(zhì)2.trace(qtvyt)=trace(qtvyt)t=vtqy
其中,a,b,c是方陣,q∈rm×n,v∈rm×1,y∈rn×1。
定義
根據(jù)(14)式,等式(b2)變成
由于以上性質(zhì)2,(b3)變?yōu)?/p>
在(14)式兩邊同時減去θ(t),并用關(guān)系式(b1),可得
考慮到(b5),(b4)式可重寫為
再用關(guān)系式(b1),我們有
由于0<abφ<2,q>0,很明顯
由(b7)和(b8),很容易得到
或者
根據(jù)定理1和假設(shè)3,0<δ≤||φ(t)||≤bφ,所以θ(t)是有界的。進(jìn)一步,
將(b7)的兩邊從0到k求和,得
由于v0(t)是有界的,vk(t)是非負(fù)有界的,考慮到(b8)和(b11),可得
根據(jù)ζk(t)的定義,有
其中,
因此,根據(jù)收斂性質(zhì)(b12)與(b13)即可得到對于所有的t∈{1,λ,t},ek(t)沿迭代軸漸近收斂。
為了驗(yàn)證本發(fā)明方法的正確性,對本發(fā)明的方法進(jìn)行了以下仿真:
對于仿真,我們考慮一個區(qū)間的快速路被分為12個區(qū)段。每個區(qū)段的長度為0.5km。進(jìn)入第1區(qū)段的初始交通量為每小時1600輛車輛。該模型中使用的參數(shù)如下:vi(0)=50km/h,vfree=80km/h,ρjam=80veh/lane/km,l=1.8,m=1.7,κ=13veh/km,τ=0.01h,h=0.00417h,γ=35km2/h,ri(0)=0veh/h,α=0.95。
在第2區(qū)段有一個入口匝道口,已知交通需求,有兩個出口匝道口分別位于第5區(qū)段和第9區(qū)段,出口流量未知。以此來模擬高峰時段的交通情況。未知的出口流量實(shí)際上是作為模擬第2區(qū)段的外部干擾。
注意,序列需求實(shí)際上對入口匝道的控制輸入施加了一些約束,例如:在k時刻入口匝道的交通流率不能超過當(dāng)前需求與當(dāng)前在入口匝道等待序列的和;因此
其中,li(t)是指在t時刻第i個入口匝道可能存在的等待序列的長度;ηi(t)是在t時刻第i個入口匝道交通需求量(veh/h);在本文仿真中ion=2,指存在入口匝道的區(qū)段數(shù)。另一方面,等待序列是入口匝道的需求與實(shí)際流量的差的累積,即
li(t+1)=li(t)+t[ηi(t)-ri(t)],i∈ion(16)
期望的快速路交通密度是ρd,k=30+0.1sin(πk/50),如圖2所示,它是隨迭代次數(shù)不斷變化的。隨機(jī)初始交通密度選的是ρi,k(0)=30+0.01rand,如圖3所示。
在仿真中,我們選擇a=0.1,c=0.01,θ0(t)=0.002,u0(t)=0。應(yīng)用所提的ldm-ailc方法,學(xué)習(xí)收斂性如圖4所示。其中橫軸是迭代次數(shù),縱軸是跟蹤誤差的最大絕對值
從圖2-4可看出所提ldm-ailc方法的有效性。盡管初始值隨機(jī)以及參考軌跡沿迭代軸隨機(jī)變化,跟蹤誤差仍然漸進(jìn)地逼近零。