本發(fā)明屬于非線(xiàn)性系統(tǒng)的自適應(yīng)控制技術(shù)領(lǐng)域,具體涉及一種非線(xiàn)性系統(tǒng)的自適應(yīng)學(xué)習(xí)預(yù)設(shè)性能控制方法。
背景技術(shù):
很多實(shí)際工程系統(tǒng)(如航天器、空間機(jī)器人等)都可以寫(xiě)成euler-lagrange形式,因此對(duì)euler-lagrange系統(tǒng)的魯棒控制一直是控制領(lǐng)域研究的熱點(diǎn)?,F(xiàn)有針對(duì)euler-lagrange系統(tǒng)的控制方法主要有滑模控制、預(yù)測(cè)模型控制、控制等。但是這些提及的控制方法都嚴(yán)重依賴(lài)于euler-lagrange系統(tǒng)的動(dòng)力學(xué)模型。由于系統(tǒng)的不確定性以及外界環(huán)境的干擾,精確的euler-lagrange系統(tǒng)模型往往難以獲得,為了實(shí)現(xiàn)對(duì)帶有未知非線(xiàn)性的euler-lagrange系統(tǒng)的魯棒控制,基于神經(jīng)網(wǎng)絡(luò)和模糊系統(tǒng)的自適應(yīng)控制方法不斷被提出,雖然這些自適應(yīng)控制能夠很好的實(shí)現(xiàn)對(duì)euler-lagrange系統(tǒng)的魯棒控制,但是由于在控制過(guò)程中采用神經(jīng)網(wǎng)絡(luò)或者模糊系統(tǒng)對(duì)未知非線(xiàn)性系統(tǒng)的逼近,帶來(lái)模型近似誤差問(wèn)題,以及設(shè)計(jì)的自適應(yīng)控制律只在神經(jīng)網(wǎng)絡(luò)或者模糊近似器所在的緊集合上有效問(wèn)題。因此,如何克服這些問(wèn)題是euler-lagrange系統(tǒng)控制領(lǐng)域值得深究的研究方向。
近年來(lái),隨著人工智能理論和技術(shù)的不斷發(fā)展,基于數(shù)據(jù)學(xué)習(xí)的自適應(yīng)控制被提出。該自適應(yīng)方法僅依賴(lài)于系統(tǒng)的輸入輸出數(shù)據(jù),有效地克服了基于系統(tǒng)動(dòng)力學(xué)模型控制方法的局限性。但是基于數(shù)據(jù)學(xué)習(xí)的自適應(yīng)控制方法卻嚴(yán)重依賴(lài)于初始允許控制策略,并以此來(lái)為后續(xù)的學(xué)習(xí)控制律提供可靠的穩(wěn)定狀態(tài)序列,這對(duì)于實(shí)際帶有未知的非線(xiàn)性euler-lagrange系統(tǒng)來(lái)說(shuō),具有應(yīng)用上的不可擴(kuò)展性。而如何結(jié)合基于數(shù)據(jù)學(xué)習(xí)的自適應(yīng)控制的優(yōu)點(diǎn)來(lái)實(shí)現(xiàn)對(duì)帶有未知非線(xiàn)性的euler-lagrange系統(tǒng)的低復(fù)雜度魯棒控制是值得深究的課題。
除此之外,現(xiàn)有針對(duì)euler-lagrange系統(tǒng)的瞬態(tài)與穩(wěn)態(tài)性能多依賴(lài)于繁復(fù)的后驗(yàn)調(diào)參,難以先驗(yàn)設(shè)計(jì)。因此如何實(shí)現(xiàn)對(duì)不確定euler-lagrange控制系統(tǒng)的瞬態(tài)與穩(wěn)態(tài)性能的先驗(yàn)設(shè)計(jì)也是值得考慮的問(wèn)題。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明所要解決的技術(shù)問(wèn)題在于針對(duì)上述現(xiàn)有技術(shù)中的不足,提供一種非線(xiàn)性系統(tǒng)的自適應(yīng)學(xué)習(xí)預(yù)設(shè)性能控制方法,針對(duì)不確定euler-lagrange非線(xiàn)性系統(tǒng)控制問(wèn)題。
本發(fā)明采用以下技術(shù)方案:
一種非線(xiàn)性系統(tǒng)的自適應(yīng)學(xué)習(xí)預(yù)設(shè)性能控制方法,包括以下步驟:
s1、建立euler-lagrange動(dòng)力學(xué)系統(tǒng)模型;
s2、對(duì)所述動(dòng)力學(xué)系統(tǒng)模型進(jìn)行預(yù)設(shè)性能控制,設(shè)計(jì)標(biāo)稱(chēng)預(yù)設(shè)性能控制器;
s3、針對(duì)評(píng)價(jià)網(wǎng)絡(luò),基于自適應(yīng)動(dòng)態(tài)規(guī)劃,定義增強(qiáng)性能信號(hào)
進(jìn)一步的,步驟s1中,定義變量r=q,
其中,r為廣義位置,v為速度,m-1(r)為正定對(duì)稱(chēng)轉(zhuǎn)動(dòng)慣量,c(r,v)為科里奧利矩陣,g(r)為重力矢量,τ為控制力矩,d為外界未知有界干擾。
進(jìn)一步的,步驟s2中,所述標(biāo)稱(chēng)預(yù)設(shè)性能控制器為:
其中:τp,i為第i維預(yù)設(shè)性能控制輸入,ki為待設(shè)計(jì)的正的控制增益,
進(jìn)一步的,定義所述動(dòng)力學(xué)系統(tǒng)模型的預(yù)設(shè)性能為:
其中:
進(jìn)一步的,定義流形如下:
s=ev+βer
其中,s=[s1,...,sn]t∈rn為濾波誤差,β∈rn×n為待設(shè)計(jì)正定對(duì)角矩陣,ev=v-vd為廣義速度誤差,er=r-rd∈rn為廣義位置誤差,vd為廣義期望速度,rd為期望位置。
進(jìn)一步的,步驟s3中,所述增強(qiáng)性能信號(hào)
其中:s為濾波誤差,τc∈rn自適應(yīng)學(xué)習(xí)補(bǔ)償控制項(xiàng),q,r分別為正定矩陣。
進(jìn)一步的,步驟s3中,最優(yōu)的補(bǔ)償控制輸入在評(píng)價(jià)網(wǎng)絡(luò)待優(yōu)化的長(zhǎng)時(shí)間性能為:
三層神經(jīng)網(wǎng)絡(luò)對(duì)執(zhí)行層相應(yīng)補(bǔ)償控制近似為:
其中,τc,i為第i維補(bǔ)償控制輸入,i=1,...,n,ωc1,k=[ωc1,k1,...,ωc1,k2n]t為輸入層與隱藏層的權(quán)重參數(shù),
進(jìn)一步的,步驟s3中,對(duì)于輸入層與隱藏層以及隱藏層與輸出層之間的權(quán)重參數(shù)可以利用梯度下降法實(shí)現(xiàn)更新。
進(jìn)一步的,所述基于學(xué)習(xí)的自適應(yīng)預(yù)設(shè)性能控制器τ為:
其中,τp,i為標(biāo)稱(chēng)預(yù)設(shè)性能控制輸入,τc,i為補(bǔ)償控制輸入,ki為正的控制增益,ξi為伴隨變量,γs,i為預(yù)設(shè)性能的下界增益,
與現(xiàn)有技術(shù)相比,本發(fā)明至少具有以下有益效果:
本發(fā)明一種非線(xiàn)性系統(tǒng)的自適應(yīng)學(xué)習(xí)預(yù)設(shè)性能控制方法,通過(guò)建立euler-lagrange動(dòng)力學(xué)系統(tǒng)模型,并對(duì)所述動(dòng)力學(xué)系統(tǒng)模型進(jìn)行預(yù)設(shè)性能控制,設(shè)計(jì)標(biāo)稱(chēng)預(yù)設(shè)性能控制器,然后基于自適應(yīng)動(dòng)態(tài)規(guī)劃,設(shè)計(jì)基于學(xué)習(xí)的自適應(yīng)控制器,在不需要euler-lagrange系統(tǒng)模型信息基礎(chǔ)上,僅依賴(lài)于系統(tǒng)的輸入/輸出數(shù)據(jù),就可以實(shí)現(xiàn)對(duì)受控euler-lagrange系統(tǒng)的魯棒自適應(yīng)控制,并且系統(tǒng)對(duì)未知不確定性以及外界干擾具有較強(qiáng)的魯棒性以及自適應(yīng)性,受控euler-lagrange系統(tǒng)的瞬態(tài)與穩(wěn)態(tài)性能可以實(shí)現(xiàn)先驗(yàn)的設(shè)計(jì)。
進(jìn)一步的,在只需要不確定euler-lagrange系統(tǒng)的輸入輸出數(shù)據(jù)基礎(chǔ)上,基于自適應(yīng)動(dòng)態(tài)規(guī)劃方法,形成自適應(yīng)補(bǔ)償控制律,能夠增強(qiáng)標(biāo)稱(chēng)預(yù)設(shè)性能控制器對(duì)未知不確定性以及外界干擾的魯棒性以及自適應(yīng)性。
綜上所述,本發(fā)明在不需要系統(tǒng)確切的動(dòng)力學(xué)模型基礎(chǔ)上,僅依賴(lài)于系統(tǒng)的輸入/輸出數(shù)據(jù),設(shè)計(jì)出一種低復(fù)雜度的魯棒自適應(yīng)控制器,使得受控的euler-lagrange系統(tǒng)的瞬態(tài)與穩(wěn)態(tài)性能能夠得到先驗(yàn)設(shè)計(jì),同時(shí)又可避免傳統(tǒng)基于數(shù)據(jù)學(xué)習(xí)控制嚴(yán)重依賴(lài)初始允許控制策略的缺點(diǎn)。
下面通過(guò)附圖和實(shí)施例,對(duì)本發(fā)明的技術(shù)方案做進(jìn)一步的詳細(xì)描述。
附圖說(shuō)明
圖1為地面小車(chē)第一維流形響應(yīng)圖;
圖2為地面小車(chē)第二維流形響應(yīng)圖;
圖3為地面小車(chē)第三維流形響應(yīng)圖;
圖4為地面小車(chē)系統(tǒng)輸出追蹤圖;
圖5為地面小車(chē)三維控制輸入示意圖;
圖6為地面小車(chē)二維軌跡追蹤圖。
具體實(shí)施方式
本發(fā)明公開(kāi)了一種不確定euler-lagrange非線(xiàn)性系統(tǒng)的自適應(yīng)學(xué)習(xí)預(yù)設(shè)性能控制方法,針對(duì)不確定euler-lagrange非線(xiàn)性系統(tǒng)控制問(wèn)題,提出一種僅依賴(lài)系統(tǒng)輸入/輸出信息的低復(fù)雜度魯棒自適應(yīng)控制方法,實(shí)現(xiàn)對(duì)不確定euler-lagrange系統(tǒng)的魯棒追蹤控制,并且避開(kāi)傳統(tǒng)基于模型控制方法設(shè)計(jì)復(fù)雜度高以及傳統(tǒng)基于數(shù)據(jù)學(xué)習(xí)控制方法嚴(yán)重依賴(lài)初始允許控制策略等缺點(diǎn)。
具體步驟如下:
s1、euler-lagrange動(dòng)力學(xué)系統(tǒng)描述
本發(fā)明針對(duì)euler-lagrange的系統(tǒng)模型為:
其中,q=[q1,...,qn]t∈rn為廣義坐標(biāo)向量,n為系統(tǒng)維數(shù),t是向量轉(zhuǎn)置,rn為n維歐幾里得空間,m(q)∈rn×n為正定對(duì)稱(chēng)轉(zhuǎn)動(dòng)慣量;
定義變量r=q,
其中,r,v∈rn為廣義位置與速度。
s2、標(biāo)稱(chēng)預(yù)設(shè)性能控制器
針對(duì)系統(tǒng)模型(2),定義流形如下:
s=ev+βer(3)
其中,s=[s1,…,sn]t∈rn為濾波誤差,β∈rn×n為待設(shè)計(jì)正定對(duì)角矩陣,ev=v-vd為廣義速度誤差,er=r-rd∈rn為廣義位置誤差,vd為廣義期望速度,rd為期望位置。
為了實(shí)現(xiàn)對(duì)系統(tǒng)模型(2)的預(yù)設(shè)性能控制,定義預(yù)設(shè)性能如下:
其中,
其中:τp,i為第i維預(yù)設(shè)性能控制輸入,ki為待設(shè)計(jì)的正的控制增益,
s3、基于學(xué)習(xí)的自適應(yīng)控制器設(shè)計(jì)
為了增強(qiáng)步驟s2設(shè)計(jì)的標(biāo)稱(chēng)預(yù)設(shè)性能控制器對(duì)未知干擾以及不確定性的魯棒性與自適應(yīng)性,基于自適應(yīng)動(dòng)態(tài)規(guī)劃(adaptivedynamicprogramming-adp),設(shè)計(jì)基于學(xué)習(xí)的自適應(yīng)控制器。
在adp中,通常基于神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)評(píng)價(jià)-執(zhí)行動(dòng)作網(wǎng)絡(luò),分別對(duì)增強(qiáng)性能信號(hào)以及控制序列進(jìn)行近似最優(yōu)求解。
首先針對(duì)評(píng)價(jià)網(wǎng)絡(luò),定義增強(qiáng)性能信號(hào)為:
其中,
對(duì)于評(píng)價(jià)網(wǎng)絡(luò),待優(yōu)化的長(zhǎng)時(shí)間性能:
其中,
則最優(yōu)的補(bǔ)償控制輸入在優(yōu)化式(7)得到,即:
對(duì)于式(8)的貝爾曼最優(yōu)性問(wèn)題,難以得到解析的解,因此采用3層神經(jīng)網(wǎng)絡(luò)進(jìn)行近似,即:
其中,ωc1,k=[ωc1,k1,...,ωc1,k2n]t為輸入層與隱藏層的權(quán)重參數(shù),
對(duì)于輸入層與隱藏層以及隱藏層與輸出層之間的權(quán)重參數(shù)可以利用梯度下降法實(shí)現(xiàn)更新。
對(duì)于執(zhí)行層,相應(yīng)的補(bǔ)償控制用3層神經(jīng)網(wǎng)絡(luò)近似為:
其中,τc,i(i=1,...,n)為第i維補(bǔ)償控制輸入,其他參數(shù)含義類(lèi)同式(9)。
通過(guò)迭代求解式(9)與(10),最終實(shí)現(xiàn)穩(wěn)定的在線(xiàn)學(xué)習(xí)補(bǔ)償控制器的計(jì)算。
基于式(5)與式(10)的計(jì)算,可以得到基于學(xué)習(xí)的自適應(yīng)預(yù)設(shè)性能控制器τ為:
其中,τp,i為標(biāo)稱(chēng)預(yù)設(shè)性能控制輸入,τc,i為補(bǔ)償控制輸入,ki為正的控制增益,ξi為伴隨變量,γs,i為預(yù)設(shè)性能的下界增益,
實(shí)施例
以地面小車(chē)定點(diǎn)追蹤控制為仿真對(duì)象,其中仿真實(shí)驗(yàn)中三個(gè)預(yù)設(shè)性能函數(shù)的12個(gè)參數(shù)ρs,10,ρs,20,ρs,30,ρs,1∞,ρs,2∞,ρs,3∞,κs,1,κs,2,κs,3,,
地面小車(chē)的各項(xiàng)參數(shù)為:慣性矩陣m=diag{m1,m2,m3},其中m1=500kg,m2=1000kg,m3=700kgm2,科里奧利矩陣c為:
其中:
評(píng)價(jià)-執(zhí)行層的隱藏層節(jié)點(diǎn)個(gè)數(shù)都為10,且輸入層與隱藏層,以及隱藏層與輸出層的權(quán)重參數(shù)初始值在[-0.3,0.3],[-0.2,0.2]區(qū)間上任意取。
折扣參數(shù)因子為0.95,評(píng)價(jià)-執(zhí)行網(wǎng)絡(luò)訓(xùn)練的容許誤差為10-5,單次訓(xùn)練的周期為300步。
在仿真過(guò)程中加入的外界干擾力矩d為:
其中,t為當(dāng)前時(shí)刻。
圖1至圖3表明小車(chē)預(yù)設(shè)的性能在設(shè)計(jì)的控制律下得到的有效保證,圖4表明小車(chē)的三維輸出(橫側(cè)向位置極其偏航角)在設(shè)計(jì)的控制器下快速收斂到期望的位置,其中,y1,y2,y3分別為橫向、縱向位置以及偏航角度,圖5表明小車(chē)的三個(gè)控制通道的輸入滿(mǎn)足控制飽和約束,因此仿真的結(jié)果驗(yàn)證了理論方法的正確性。
請(qǐng)參閱圖6,通過(guò)對(duì)小車(chē)平面位置追蹤的跟蹤控制,仿真結(jié)果驗(yàn)證了理論的正確性,并表明在不需要知道小車(chē)具體動(dòng)力學(xué)模型信息基礎(chǔ)上,僅依賴(lài)于小車(chē)的輸入/輸出信息即可實(shí)現(xiàn)對(duì)小車(chē)的魯棒自適應(yīng)控制,顯示了該方法相比于傳統(tǒng)基于模型控制方法的簡(jiǎn)單有效性。
以上內(nèi)容僅為說(shuō)明本發(fā)明的技術(shù)思想,不能以此限定本發(fā)明的保護(hù)范圍,凡是按照本發(fā)明提出的技術(shù)思想,在技術(shù)方案基礎(chǔ)上所做的任何改動(dòng),均落入本發(fā)明權(quán)利要求書(shū)的保護(hù)范圍之內(nèi)。