本公開實(shí)施例涉及控制,尤其涉及一種基于自適應(yīng)動(dòng)態(tài)規(guī)劃的變后掠飛行器預(yù)設(shè)性能控制方法。
背景技術(shù):
1、變后掠飛行器是一類能依據(jù)不同飛行任務(wù)與飛行環(huán)境自主改變機(jī)翼后掠角大小,以實(shí)現(xiàn)更好的氣動(dòng)特性和最優(yōu)飛行性能的新型飛行器,在航空航天等領(lǐng)域具有極大的發(fā)展?jié)摿εc應(yīng)用價(jià)值。相較于固定翼飛行器來說,飛行器變形過程中氣動(dòng)特性、轉(zhuǎn)動(dòng)慣量、質(zhì)心位置等參數(shù)發(fā)生明顯變化,對飛行器控制系統(tǒng)的設(shè)計(jì)提出了新的挑戰(zhàn)和更高的要求。因此,使飛行器在變形過程中實(shí)現(xiàn)姿態(tài)控制當(dāng)前研究的熱點(diǎn)問題。
2、目前針對變后掠飛行器控制方法已有一些研究成果。研究的主要方向主要集中在如何對變形過程帶來的未知?jiǎng)討B(tài)干擾與強(qiáng)不確定性進(jìn)行有效估計(jì),并設(shè)計(jì)相應(yīng)補(bǔ)償控制器。經(jīng)典控制方法,存在適應(yīng)性不足的問題,難以保證在不確定因素下飛行器的穩(wěn)定。智能控制方法雖然可以有效提高飛行器的適應(yīng)能力,但現(xiàn)有的方法多依賴于大量數(shù)據(jù)采集與離線訓(xùn)練,而實(shí)際控制系統(tǒng)中對于狀態(tài)的采集能力有限,難以達(dá)到足夠的數(shù)據(jù)實(shí)現(xiàn)對于網(wǎng)絡(luò)的訓(xùn)練。
3、可見,亟需一種控制精度高、響應(yīng)速度快和魯棒性強(qiáng)的基于自適應(yīng)動(dòng)態(tài)規(guī)劃的變后掠飛行器預(yù)設(shè)性能控制方法。
技術(shù)實(shí)現(xiàn)思路
1、有鑒于此,本公開實(shí)施例提供一種基于自適應(yīng)動(dòng)態(tài)規(guī)劃的變后掠飛行器預(yù)設(shè)性能控制,至少部分解決現(xiàn)有技術(shù)中存在控制精度、響應(yīng)速度和魯棒性較差的問題。
2、本公開實(shí)施例提供了一種基于自適應(yīng)動(dòng)態(tài)規(guī)劃的變后掠飛行器預(yù)設(shè)性能控制方法,包括:
3、步驟1,構(gòu)建用于姿態(tài)控制的變后掠飛行器運(yùn)動(dòng)模型;
4、步驟2,基于預(yù)設(shè)性能框架,構(gòu)造預(yù)設(shè)性能函數(shù),通過同胚映射得到轉(zhuǎn)換后的誤差系統(tǒng),將變后掠飛行器運(yùn)動(dòng)模型分為姿態(tài)角回路與姿態(tài)角速度回路兩個(gè)子系統(tǒng)分別進(jìn)行控制器設(shè)計(jì),得到姿態(tài)角回路對應(yīng)的虛擬控制器和姿態(tài)角速度回路對應(yīng)的穩(wěn)態(tài)控制器;
5、步驟3,引入代價(jià)函數(shù)將飛行器姿態(tài)跟蹤控制問題轉(zhuǎn)化為最優(yōu)控制問題的求解,基于自適應(yīng)動(dòng)態(tài)規(guī)劃技術(shù)構(gòu)建actor-critic網(wǎng)絡(luò)在線求解bellman方程,得到最優(yōu)補(bǔ)償控制器;
6、步驟4,根據(jù)穩(wěn)態(tài)控制器和最優(yōu)補(bǔ)償控制器得到變后掠飛行器控制器,并基于具體飛行工況對控制器性能進(jìn)行數(shù)值仿真。
7、根據(jù)本公開實(shí)施例的一種具體實(shí)現(xiàn)方式,所述步驟1具體包括:
8、步驟1.1,建立用于姿態(tài)控制的變后掠飛行器運(yùn)動(dòng)模型
9、
10、式中,為姿態(tài)角向量,分別表示俯仰角、偏航角和滾轉(zhuǎn)角,w=[wx?wy?wz]t為姿態(tài)角速度向量,wx,wy,wz分別表示滾轉(zhuǎn)角速度、偏航角速度和俯仰角速度,ib為未考慮變形時(shí)轉(zhuǎn)動(dòng)慣量矩陣,δi為變形導(dǎo)致的附加轉(zhuǎn)動(dòng)慣量矩陣,ma為氣動(dòng)力矩,mf為變形引起的附加力矩,為本體系下機(jī)翼安裝點(diǎn)的位置矢量,為機(jī)翼質(zhì)心相對機(jī)翼安裝點(diǎn)的旋轉(zhuǎn)矢量,d為集總擾動(dòng),矩陣r,w×的表達(dá)式如下:
11、
12、步驟1.2,定義狀態(tài)量x1=θ,x2=ω,定義變后掠飛行器控制器u=[δx?δy?δz]t由穩(wěn)態(tài)控制器ud和最優(yōu)補(bǔ)償控制器uf組成,δx,δy,δz分別為滾轉(zhuǎn)、偏航、俯仰通道的等效舵偏角,得到面向姿態(tài)控制的變后掠飛行器運(yùn)動(dòng)模型:
13、
14、式中,
15、u=ud+uf
16、i=ib+δi
17、f2=i-1(-ω×ibω+m0)
18、
19、g2=i-1g
20、
21、其中,為操縱力矩系數(shù),為阻尼力矩系數(shù),q為動(dòng)壓,v為飛行器速度大小,s為參考面積,l為參考長度。
22、根據(jù)本公開實(shí)施例的一種具體實(shí)現(xiàn)方式,所述步驟2具體包括:
23、步驟2.1,針對姿態(tài)角回路子系統(tǒng)設(shè)計(jì)控制器,定義姿態(tài)角跟蹤指令為x1d,則姿態(tài)角跟蹤誤差e1(t)=[e11?e12?e13]t=x1-x1d,設(shè)計(jì)預(yù)設(shè)性能函數(shù)ρi(t),i=1,2,3表示三個(gè)不同通道,姿態(tài)角跟蹤誤差滿足約束:-ρi(t)<e1i(t)<ρi(t);
24、步驟2.2,設(shè)計(jì)同胚映射函數(shù)將性能約束空間變換到無約束空間,得到轉(zhuǎn)換后的誤差系統(tǒng):
25、
26、式中,ε1=[ε11?ε12?ε13]t為映射后的誤差變量,
27、步驟2.3,設(shè)計(jì)姿態(tài)角回路對應(yīng)的虛擬控制器x2d為
28、x2d=r-1[x2c,1?x2c,2?x2c,3]t
29、
30、式中,k1=[k11?k12?k13]t為虛擬控制器增益;
31、步驟2.4,定義姿態(tài)角速度跟蹤誤差e2=x2-x2d,其導(dǎo)數(shù)作為誤差系統(tǒng):
32、
33、步驟2.5,基于預(yù)設(shè)性能框架的設(shè)計(jì)姿態(tài)角速度回路對應(yīng)的穩(wěn)態(tài)控制器ud如下:
34、ud=g2-1(-f2(x2d)-k2e2+ξ2)
35、其中,ξ1為對于虛擬控制器x2d倒數(shù)的估計(jì)值,k2為穩(wěn)態(tài)控制器增益。
36、根據(jù)本公開實(shí)施例的一種具體實(shí)現(xiàn)方式,所述步驟3具體包括:
37、步驟3.1,將穩(wěn)態(tài)控制器ud代入姿態(tài)角速度回路,將誤差系統(tǒng)變換為:
38、
39、式中,fe=f2-f2(x2d),為虛擬控制器導(dǎo)數(shù)的估計(jì)誤差;
40、步驟3.2,設(shè)計(jì)代價(jià)函數(shù)為:
41、j(e2(t))=r(e2(t),uf(t))+γr(e2(t+δt),uf(t+δt))+γ2r(e2(t+2δt),uf(t+2δt))+···
42、=r(e2(t),uf(t))+γj(e2(t+δt))
43、式中,r(e2(t),uf(t))=e2(t)tqe2(t)+uf(t)truf(t)為當(dāng)前采樣時(shí)刻的效用函數(shù),δt為采樣步長,γ為折扣系數(shù),q,r為正定矩陣;
44、步驟3.3,設(shè)計(jì)最優(yōu)代價(jià)函數(shù)j*(e2(t)),滿足bellman方程:
45、
46、步驟3.4,分別構(gòu)建critic網(wǎng)絡(luò)與actor網(wǎng)絡(luò)來擬合最優(yōu)代價(jià)函數(shù)j*和最優(yōu)補(bǔ)償控制器uf作為最優(yōu)控制問題的解。
47、根據(jù)本公開實(shí)施例的一種具體實(shí)現(xiàn)方式,所述步驟3.4具體包括:
48、步驟3.4.1,構(gòu)建critic網(wǎng)絡(luò)擬合最優(yōu)代價(jià)函數(shù),其中,所述critic網(wǎng)絡(luò)包含一個(gè)輸入層、一個(gè)隱藏層和一個(gè)輸出層,其輸入向量ci=[e2t?x2dt]t,輸出向量將代價(jià)函數(shù)估計(jì)值表示為:
49、
50、式中,wc為critic網(wǎng)絡(luò)的權(quán)重參數(shù),φc(·)為激活函數(shù);
51、步驟3.4.2,構(gòu)建actor網(wǎng)絡(luò)擬合最優(yōu)補(bǔ)償控制器uf,其中,所述actor網(wǎng)絡(luò)包含一個(gè)輸入層、一個(gè)隱藏層和一個(gè)輸出層,其輸入向量ai=e2,輸出向量ao=uf,將最優(yōu)補(bǔ)償控制器uf表示為:
52、uf=watφa(ai)
53、式中,wa為actor網(wǎng)絡(luò)的權(quán)重參數(shù),φa(·)為actor網(wǎng)絡(luò)激活函數(shù)。
54、根據(jù)本公開實(shí)施例的一種具體實(shí)現(xiàn)方式,所述步驟3.4.1之前,所述方法還包括:
55、定義critic網(wǎng)絡(luò)的估計(jì)誤差為:
56、
57、critic網(wǎng)絡(luò)權(quán)重更新的目標(biāo)函數(shù)設(shè)計(jì)為:
58、
59、基于梯度下降策略,得到critic網(wǎng)絡(luò)權(quán)重參數(shù)的更新策略為:
60、
61、式中,ηc為critic網(wǎng)絡(luò)學(xué)習(xí)率;
62、根據(jù)critic網(wǎng)絡(luò)權(quán)重參數(shù)的更新策略對critic網(wǎng)絡(luò)的權(quán)重參數(shù)進(jìn)行更新。
63、根據(jù)本公開實(shí)施例的一種具體實(shí)現(xiàn)方式,步驟3.4.2之前,所述方法還包括:
64、定義actor網(wǎng)絡(luò)的估計(jì)誤差為:
65、
66、actor網(wǎng)絡(luò)權(quán)重更新的目標(biāo)函數(shù)設(shè)計(jì)為:
67、
68、基于梯度下降策略,得到actor網(wǎng)絡(luò)權(quán)重參數(shù)的更新策略為:
69、
70、式中,ηa為actor網(wǎng)絡(luò)學(xué)習(xí)率,為激活函數(shù)對于輸入的梯度;
71、根據(jù)actor網(wǎng)絡(luò)權(quán)重參數(shù)的更新策略對actor網(wǎng)絡(luò)的權(quán)重參數(shù)進(jìn)行更新。
72、本公開實(shí)施例中的基于自適應(yīng)動(dòng)態(tài)規(guī)劃的變后掠飛行器預(yù)設(shè)性能控制方案,包括:步驟1,構(gòu)建用于姿態(tài)控制的變后掠飛行器運(yùn)動(dòng)模型;步驟2,基于預(yù)設(shè)性能框架,構(gòu)造預(yù)設(shè)性能函數(shù),通過同胚映射得到轉(zhuǎn)換后的誤差系統(tǒng),將變后掠飛行器運(yùn)動(dòng)模型分為姿態(tài)角回路與姿態(tài)角速度回路兩個(gè)子系統(tǒng)分別進(jìn)行控制器設(shè)計(jì),得到姿態(tài)角回路對應(yīng)的虛擬控制器和姿態(tài)角速度回路對應(yīng)的穩(wěn)態(tài)控制器;步驟3,引入代價(jià)函數(shù)將飛行器姿態(tài)跟蹤控制問題轉(zhuǎn)化為最優(yōu)控制問題的求解,基于自適應(yīng)動(dòng)態(tài)規(guī)劃技術(shù)構(gòu)建actor-critic網(wǎng)絡(luò)在線求解bellman方程,得到最優(yōu)補(bǔ)償控制器;步驟4,根據(jù)穩(wěn)態(tài)控制器和最優(yōu)補(bǔ)償控制器得到變后掠飛行器控制器,并基于具體飛行工況對控制器性能進(jìn)行數(shù)值仿真。
73、本公開實(shí)施例的有益效果為:通過本公開的方案,基于預(yù)設(shè)性能框架與反步控制思想設(shè)計(jì)的基礎(chǔ)控制器,可以保證整個(gè)飛行過程中姿態(tài)角誤差始終處于預(yù)設(shè)的性能包絡(luò)中,收斂速度快,有效抑制超調(diào)量,極大提高了控制系統(tǒng)的穩(wěn)態(tài)性能與瞬態(tài)性能。同時(shí)為增加了控制器在不同飛行環(huán)境下的魯棒性與適應(yīng)性,采用自適應(yīng)動(dòng)態(tài)規(guī)劃技術(shù)設(shè)計(jì)反饋控制器,無需進(jìn)行離線訓(xùn)練,可以直接進(jìn)行在線學(xué)習(xí),依據(jù)當(dāng)前跟蹤誤差等數(shù)據(jù)進(jìn)行實(shí)時(shí)更新,以補(bǔ)償氣動(dòng)參數(shù)等不確定性因素帶來的擾動(dòng),提高了控制精度,響應(yīng)速度和魯棒性。