:本發(fā)明屬于自動(dòng)駕駛車輛控制領(lǐng)域,具體涉及一種自動(dòng)駕駛車輛貝葉斯模型預(yù)測軌跡跟蹤控制方法。
背景技術(shù)
0、
背景技術(shù):
1、自動(dòng)駕駛技術(shù)依靠感知定位系統(tǒng)、決策規(guī)劃系統(tǒng)和控制執(zhí)行系統(tǒng)的協(xié)同工作,使車輛能夠在沒有人類駕駛員干預(yù)的情況下自主行駛。自動(dòng)駕駛車輛被視為緩解和預(yù)防交通事故的有力且前景廣闊的解決方案,在控制執(zhí)行系統(tǒng)中,通過控制油門、剎車和方向盤使自動(dòng)駕駛車輛盡量減少與預(yù)期路徑的偏差,并確保平穩(wěn)的軌跡跟蹤。一個(gè)經(jīng)常被忽略的關(guān)鍵因素是自動(dòng)駕駛車輛轉(zhuǎn)向系統(tǒng)的滯后,轉(zhuǎn)向滯后也被稱為轉(zhuǎn)向動(dòng)力學(xué),指的是輪胎從接收到轉(zhuǎn)向命令并轉(zhuǎn)動(dòng)產(chǎn)生所需的轉(zhuǎn)向角的過程。自動(dòng)駕駛車輛依靠精確的軌跡跟蹤來安全有效地在復(fù)雜的環(huán)境中導(dǎo)航,然而轉(zhuǎn)向滯后影響著軌跡跟蹤的橫向控制性能,因此,在控制算法的設(shè)計(jì)中解決轉(zhuǎn)向滯后具有重要意義。
2、模型預(yù)測控制算法是一種能夠直接處理約束的最優(yōu)化控制算法,廣泛應(yīng)用于自動(dòng)駕駛車輛軌跡跟蹤控制中,它使用系統(tǒng)模型預(yù)測未來的系統(tǒng)狀態(tài),并考慮當(dāng)前狀態(tài)和未來一段時(shí)間內(nèi)可能的控制輸入,求解一個(gè)有限時(shí)域的優(yōu)化問題,從而得到一系列最優(yōu)的控制輸入。系統(tǒng)模型的準(zhǔn)確性直接影響未來系統(tǒng)狀態(tài)的預(yù)測準(zhǔn)確性,從而直接影響控制效果,并且控制器的參數(shù)設(shè)置也直接影響控制效果。為了獲得更好的控制性能,貝葉斯優(yōu)化框架為控制器參數(shù)整定問題提供了一種有效的解決方案,該方案通過高斯過程來建模未知的控制性能函數(shù),并通過采集函數(shù)得到優(yōu)化后的控制器參數(shù)。除了控制器參數(shù)調(diào)優(yōu)外,貝葉斯優(yōu)化框架也用于辨識(shí)未知?jiǎng)討B(tài)系統(tǒng)的模型,根據(jù)控制系統(tǒng)采集的數(shù)據(jù),迭代更新動(dòng)態(tài)模型以提高控制性能。
3、因此,通過結(jié)合貝葉斯優(yōu)化算法和模型預(yù)測控制算法解決轉(zhuǎn)向滯后下的自動(dòng)駕駛車輛軌跡跟蹤問題具有重要的意義。
技術(shù)實(shí)現(xiàn)思路
0、
技術(shù)實(shí)現(xiàn)要素:
1、本發(fā)明的目的是針對(duì)現(xiàn)有自動(dòng)駕駛車輛軌跡跟蹤控制中轉(zhuǎn)向滯后和參數(shù)整定問題,提出一種貝葉斯模型預(yù)測控制算法,從而同時(shí)實(shí)現(xiàn)對(duì)轉(zhuǎn)向滯后的補(bǔ)償和控制器參數(shù)的自動(dòng)整定。
2、本發(fā)明的技術(shù)解決方案為:一種自動(dòng)駕駛車輛貝葉斯模型預(yù)測軌跡跟蹤控制方法,該方法內(nèi)容包括以下步驟:
3、步驟1:建立具有轉(zhuǎn)向滯后特性的自動(dòng)駕駛車輛運(yùn)動(dòng)學(xué)模型;
4、步驟2:基于軌跡跟蹤場景設(shè)計(jì)輸入約束;
5、步驟3:基于具有轉(zhuǎn)向滯后的車輛運(yùn)動(dòng)學(xué)模型設(shè)計(jì)模型預(yù)測控制算法;
6、步驟4:設(shè)計(jì)貝葉斯優(yōu)化算法。
7、進(jìn)一步,所述具有轉(zhuǎn)向滯后特性的自動(dòng)駕駛車輛運(yùn)動(dòng)學(xué)模型建立過程:
8、假設(shè)車輛的前后輪均為剛體,只沿著車輪滾動(dòng)的方向前進(jìn),將自動(dòng)駕駛車輛的運(yùn)動(dòng)學(xué)模型考慮為沒有載荷傳遞的自行車模型,車輛后軸中心點(diǎn)所滿足的運(yùn)動(dòng)學(xué)方程為:
9、
10、其中,x(t)和y(t)分別表示車輛后軸中心在大地坐標(biāo)系下x軸分量和y軸分量,為車輛的橫擺角,v(t)為車輛的速度;由車輛前軸中心和后軸中心的幾何關(guān)系可得:
11、
12、其中,xf(t)和yf(t)分別為車輛前軸中心在大地坐標(biāo)系下的x軸分量和y軸分量,l為車輛軸距;由于車輪無側(cè)向滑動(dòng),因此車輛前軸中心點(diǎn)和后軸中心點(diǎn)均滿足的非完整約束為:
13、
14、其中,δ(t)為車輛前輪偏角;在自動(dòng)駕駛車輛在轉(zhuǎn)向過程中,計(jì)算平臺(tái)通過控制局域網(wǎng)把期望轉(zhuǎn)向角δd(t)發(fā)給線控底盤,線控底盤驅(qū)動(dòng)轉(zhuǎn)向電機(jī)從而得到車輛前輪偏角δ(t),車輛前輪偏角δ(t)和期望轉(zhuǎn)向角δd(t)被建模為一節(jié)慣性環(huán)節(jié):
15、
16、其中,τs是一個(gè)描述轉(zhuǎn)向滯后特性的參數(shù);經(jīng)過以上公式的聯(lián)立推導(dǎo)將具有轉(zhuǎn)向滯后的車輛前軸中心運(yùn)動(dòng)學(xué)模型整理為:
17、
18、其中,ω(t)為車輛橫擺角速度;通過前向歐拉法以采樣周期t將運(yùn)動(dòng)學(xué)方程離散化為:
19、
20、其中,列向量形式的車輛狀態(tài)為車輛的控制輸入為u(k)=[v(k),δd(k)]t。
21、進(jìn)一步,所述軌跡跟蹤場景下控制輸入約束的設(shè)計(jì),具體過程如下:
22、首先,設(shè)計(jì)輸入約束條件,車輛的最大速度和前輪轉(zhuǎn)角分別受到車輛性能和機(jī)械結(jié)構(gòu)的約束,并且為了保證軌跡跟蹤控制的平滑性和穩(wěn)定性,轉(zhuǎn)向角約束應(yīng)與速度相關(guān),速度越大,期望的前輪轉(zhuǎn)角范圍越小,因此車輛的輸入約束表示為:
23、
24、其中,vmax表示車輛最大速度的絕對(duì)值,δmax車輛的最大左前輪偏角和最大右前輪偏角的絕對(duì)值。
25、進(jìn)一步,所述模型預(yù)測控制算法設(shè)計(jì),具體過程如下:
26、在軌跡跟蹤控制中,跟蹤誤差e(k)定義在車輛坐標(biāo)系中,根據(jù)大地坐標(biāo)系和車輛坐標(biāo)系之間的旋轉(zhuǎn)關(guān)系,得到縱向誤差ex(k)和橫向誤差ey(k)的表達(dá)式:
27、
28、其中,xr(k)和yr(k)分別表示參考軌跡在大地坐標(biāo)系下的x軸分量和y軸分量,并且參考軌跡滿足自動(dòng)駕駛車輛離散的的運(yùn)動(dòng)學(xué)方程:
29、
30、其中,表示參考航向角,vr(k)和ωr(k)分別表示參考速度和參考偏航角速度;經(jīng)過以上公式的聯(lián)立推導(dǎo)得到軌跡跟蹤誤差e(k)的遞推方程:
31、
32、其中,ue(k)表示輸入誤差,具體寫為:
33、
34、其中,偏航角誤差將本專利模型預(yù)測控制算法的預(yù)測時(shí)域設(shè)為np,在k時(shí)刻,優(yōu)化問題被設(shè)計(jì)為:
35、
36、其中,i=1,2,…,np-1,u(k)表示控制輸入序列u(k)=[u(k|k),u(k+1|k),…,u(k+np-1|k)]t,
37、代價(jià)函數(shù)為:
38、
39、其中,n(e(k+i|k),ue(k+i|k))和t(e(k+np|k))分別表示階段成本和終端成本,分別定義為:
40、
41、通過階段成本和終端成本使車輛狀態(tài)沿著更快接近目標(biāo)狀態(tài)的方向改變,其中,權(quán)重矩陣q,r和p分別設(shè)置為
42、
43、其中,q1,q2,r1,r2是正權(quán)重系數(shù),各權(quán)重系數(shù)用來確定解優(yōu)化問題時(shí)各狀態(tài)的比重,具有鮮明的物理意義,為了保證各權(quán)重系數(shù)的適用性,采用貝葉斯優(yōu)化器對(duì)各權(quán)重系數(shù)進(jìn)行迭代優(yōu)化。
44、進(jìn)一步,進(jìn)行貝葉斯優(yōu)化器的設(shè)計(jì),具體過程如下:
45、為了獲得最優(yōu)的軌跡跟蹤控制性能,需要根據(jù)自動(dòng)駕駛車輛的實(shí)際情況調(diào)整模型預(yù)測控制器的權(quán)重系數(shù)q1,q2,r1,r2和轉(zhuǎn)向滯后模型參數(shù)τs;在軌跡跟蹤控制中,軌跡跟蹤誤差的均方根和峰值通常用于描述軌跡跟蹤控制的性能,令θ=[τs,q1,q2,r1,r2]表示待優(yōu)化的參數(shù),描述軌跡跟蹤性能的函數(shù)被設(shè)計(jì)為:
46、g(θ)=ω1s1(θ)+ω2s2(θ)
47、其中,ω1和ω2是正權(quán)重參數(shù),s1(θ)和s2(θ)分別表示軌跡跟蹤誤差的峰值和均方根,s1(θ)和s2(θ)被定義為:
48、
49、因此,貝葉斯優(yōu)化器的優(yōu)化目標(biāo)被寫為:
50、
51、其中,集合θ:={θ|θmin≤θ≤θmax}表示參數(shù)的優(yōu)化范圍,θmin和θmax分別表示待優(yōu)化參數(shù)θ向量的最小值和最大值;由于軌跡跟蹤性能函數(shù)g(θ)是未知的,因此采用高斯過程回歸的方法尋找從輸入向量θ到軌跡跟蹤性能函數(shù)g(θ)的非線性映射;高斯過程通過一個(gè)核函數(shù)描述兩個(gè)輸入點(diǎn)之間的相似度,決定數(shù)據(jù)點(diǎn)之間的相關(guān)性,對(duì)于任意兩個(gè)參數(shù)θi∈θ和θj∈θ,核函數(shù)被定義為
52、
53、其中,σf和λ是衡量函數(shù)g(θ)平滑性的參數(shù),給定一組已有的觀測數(shù)據(jù)高斯過程基于歷史觀測數(shù)據(jù)集對(duì)任意參數(shù)θ∈θ下的軌跡跟蹤性能函數(shù)g(θ)進(jìn)行預(yù)測,預(yù)測的均值和方差為:
54、μ(θ)=kk-1g
55、σ2(θ)=κ(θ,θ)-kk-1kt
56、其中,協(xié)方差向量k=[κ(θ1,θ),κ(θ2,θ),…,κ(θn,θ)],輸出向量g=[g(θ1),g(θ2),…,g(θn)],協(xié)方差矩陣k定義為:
57、
58、貝葉斯優(yōu)化器的目的是找到軌跡跟蹤性能函數(shù)g(θ)最小值所對(duì)應(yīng)的最優(yōu)參數(shù)向量θ*,根據(jù)已有觀測數(shù)據(jù)集貝葉斯優(yōu)化器通過采集函數(shù)α(θ)來計(jì)算下一個(gè)采樣位置θn+1,采集函數(shù)被設(shè)計(jì)為:
59、α(θ)=μ(θ)-κwσ(θ)
60、其中,κw是表示置信區(qū)間大小的常數(shù);因此下次的參數(shù)被更新為:
61、
62、在整個(gè)軌跡跟蹤過程中,貝葉斯優(yōu)化器采集軌跡跟蹤控制的結(jié)果,并對(duì)模型預(yù)測控制器的參數(shù)和轉(zhuǎn)向滯后模型參數(shù)進(jìn)行迭代更新,最后收斂到使軌跡跟蹤控制性能最優(yōu)的參數(shù)θ*。
63、有益效果
64、本發(fā)明與現(xiàn)有技術(shù)相比有如下優(yōu)點(diǎn):
65、1、本發(fā)明在模型預(yù)測控制算法設(shè)計(jì)中考慮了轉(zhuǎn)向滯后對(duì)控制性能的影響,把轉(zhuǎn)向動(dòng)力學(xué)模型引入到模型預(yù)測控制算法中,模型預(yù)測控制算法基于模型預(yù)測系統(tǒng)的動(dòng)態(tài)行為并進(jìn)行優(yōu)化,從而對(duì)轉(zhuǎn)向滯后進(jìn)行補(bǔ)償以提高控制性能。
66、2、本發(fā)明設(shè)計(jì)了一個(gè)貝葉斯優(yōu)化器,根據(jù)車輛的行駛數(shù)據(jù),對(duì)轉(zhuǎn)向動(dòng)力學(xué)模型參數(shù)和模型預(yù)測控制算法參數(shù)進(jìn)行動(dòng)態(tài)調(diào)整和優(yōu)化,以達(dá)到最優(yōu)的控制效果,貝葉斯優(yōu)化器使得數(shù)據(jù)閉環(huán),以提升控制效果。
67、3、本發(fā)明設(shè)計(jì)了一種貝葉斯模型預(yù)測控制算法,控制結(jié)構(gòu)簡單,同時(shí)實(shí)現(xiàn)數(shù)據(jù)閉環(huán),實(shí)現(xiàn)了轉(zhuǎn)向動(dòng)力學(xué)模型參數(shù)和模型預(yù)測控制算法參數(shù)的動(dòng)態(tài)調(diào)整,以提升軌跡跟蹤控制效果,具有一定的指導(dǎo)意義,非常適用于自動(dòng)駕駛車輛的軌跡跟蹤控制。
68、本發(fā)明方法不依賴于自動(dòng)駕駛車輛精確的數(shù)學(xué)模型,能夠?qū)崿F(xiàn)自動(dòng)駕駛車輛的軌跡跟蹤控制,平均控制精度可達(dá)到:
69、 橫向誤差 縱向誤差 橫擺角誤差 0.072m 0.048m 0.018rad