一種非線(xiàn)性系統(tǒng)的自適應(yīng)學(xué)習(xí)預(yù)設(shè)性能控制方法與流程

文檔序號(hào)：11285096閱讀：1007來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專(zhuān)利>控制;調(diào)節(jié)裝置的制造及其應(yīng)用技術(shù)

一種非線(xiàn)性系統(tǒng)的自適應(yīng)學(xué)習(xí)預(yù)設(shè)性能控制方法與流程

本發(fā)明屬于非線(xiàn)性系統(tǒng)的自適應(yīng)控制技術(shù)領(lǐng)域，具體涉及一種非線(xiàn)性系統(tǒng)的自適應(yīng)學(xué)習(xí)預(yù)設(shè)性能控制方法。

背景技術(shù)：

很多實(shí)際工程系統(tǒng)(如航天器、空間機(jī)器人等)都可以寫(xiě)成euler-lagrange形式，因此對(duì)euler-lagrange系統(tǒng)的魯棒控制一直是控制領(lǐng)域研究的熱點(diǎn)?，F(xiàn)有針對(duì)euler-lagrange系統(tǒng)的控制方法主要有滑模控制、預(yù)測(cè)模型控制、控制等。但是這些提及的控制方法都嚴(yán)重依賴(lài)于euler-lagrange系統(tǒng)的動(dòng)力學(xué)模型。由于系統(tǒng)的不確定性以及外界環(huán)境的干擾，精確的euler-lagrange系統(tǒng)模型往往難以獲得，為了實(shí)現(xiàn)對(duì)帶有未知非線(xiàn)性的euler-lagrange系統(tǒng)的魯棒控制，基于神經(jīng)網(wǎng)絡(luò)和模糊系統(tǒng)的自適應(yīng)控制方法不斷被提出，雖然這些自適應(yīng)控制能夠很好的實(shí)現(xiàn)對(duì)euler-lagrange系統(tǒng)的魯棒控制，但是由于在控制過(guò)程中采用神經(jīng)網(wǎng)絡(luò)或者模糊系統(tǒng)對(duì)未知非線(xiàn)性系統(tǒng)的逼近，帶來(lái)模型近似誤差問(wèn)題，以及設(shè)計(jì)的自適應(yīng)控制律只在神經(jīng)網(wǎng)絡(luò)或者模糊近似器所在的緊集合上有效問(wèn)題。因此，如何克服這些問(wèn)題是euler-lagrange系統(tǒng)控制領(lǐng)域值得深究的研究方向。

近年來(lái)，隨著人工智能理論和技術(shù)的不斷發(fā)展，基于數(shù)據(jù)學(xué)習(xí)的自適應(yīng)控制被提出。該自適應(yīng)方法僅依賴(lài)于系統(tǒng)的輸入輸出數(shù)據(jù)，有效地克服了基于系統(tǒng)動(dòng)力學(xué)模型控制方法的局限性。但是基于數(shù)據(jù)學(xué)習(xí)的自適應(yīng)控制方法卻嚴(yán)重依賴(lài)于初始允許控制策略，并以此來(lái)為后續(xù)的學(xué)習(xí)控制律提供可靠的穩(wěn)定狀態(tài)序列，這對(duì)于實(shí)際帶有未知的非線(xiàn)性euler-lagrange系統(tǒng)來(lái)說(shuō)，具有應(yīng)用上的不可擴(kuò)展性。而如何結(jié)合基于數(shù)據(jù)學(xué)習(xí)的自適應(yīng)控制的優(yōu)點(diǎn)來(lái)實(shí)現(xiàn)對(duì)帶有未知非線(xiàn)性的euler-lagrange系統(tǒng)的低復(fù)雜度魯棒控制是值得深究的課題。

除此之外，現(xiàn)有針對(duì)euler-lagrange系統(tǒng)的瞬態(tài)與穩(wěn)態(tài)性能多依賴(lài)于繁復(fù)的后驗(yàn)調(diào)參，難以先驗(yàn)設(shè)計(jì)。因此如何實(shí)現(xiàn)對(duì)不確定euler-lagrange控制系統(tǒng)的瞬態(tài)與穩(wěn)態(tài)性能的先驗(yàn)設(shè)計(jì)也是值得考慮的問(wèn)題。

技術(shù)實(shí)現(xiàn)要素：

本發(fā)明所要解決的技術(shù)問(wèn)題在于針對(duì)上述現(xiàn)有技術(shù)中的不足，提供一種非線(xiàn)性系統(tǒng)的自適應(yīng)學(xué)習(xí)預(yù)設(shè)性能控制方法，針對(duì)不確定euler-lagrange非線(xiàn)性系統(tǒng)控制問(wèn)題。

本發(fā)明采用以下技術(shù)方案：

一種非線(xiàn)性系統(tǒng)的自適應(yīng)學(xué)習(xí)預(yù)設(shè)性能控制方法，包括以下步驟：

s1、建立euler-lagrange動(dòng)力學(xué)系統(tǒng)模型；

s2、對(duì)所述動(dòng)力學(xué)系統(tǒng)模型進(jìn)行預(yù)設(shè)性能控制，設(shè)計(jì)標(biāo)稱(chēng)預(yù)設(shè)性能控制器；

s3、針對(duì)評(píng)價(jià)網(wǎng)絡(luò)，基于自適應(yīng)動(dòng)態(tài)規(guī)劃，定義增強(qiáng)性能信號(hào)采用三層神經(jīng)網(wǎng)絡(luò)對(duì)最優(yōu)的補(bǔ)償控制輸入進(jìn)行近似，采用三層神經(jīng)網(wǎng)絡(luò)對(duì)執(zhí)行層補(bǔ)償控制進(jìn)行近似，最終實(shí)現(xiàn)基于學(xué)習(xí)的自適應(yīng)預(yù)設(shè)性能控制器。

進(jìn)一步的，步驟s1中，定義變量r＝q，所述動(dòng)力學(xué)系統(tǒng)模型為：

其中，r為廣義位置，v為速度，m^-1(r)為正定對(duì)稱(chēng)轉(zhuǎn)動(dòng)慣量，c(r,v)為科里奧利矩陣，g(r)為重力矢量，τ為控制力矩，d為外界未知有界干擾。

進(jìn)一步的，步驟s2中，所述標(biāo)稱(chēng)預(yù)設(shè)性能控制器為：

其中：τp,i為第i維預(yù)設(shè)性能控制輸入，ki為待設(shè)計(jì)的正的控制增益，為統(tǒng)一誤差，或(-1,κs,i)，κ為正的常量，ξs,i為正的伴隨參量。

進(jìn)一步的，定義所述動(dòng)力學(xué)系統(tǒng)模型的預(yù)設(shè)性能為：

其中：κs,i∈[0,1],是單調(diào)遞減函數(shù)。

進(jìn)一步的，定義流形如下：

s＝ev+βer

其中，s＝[s1,...,sn]^t∈rⁿ為濾波誤差，β∈r^n×n為待設(shè)計(jì)正定對(duì)角矩陣，ev＝v-vd為廣義速度誤差，er＝r-rd∈rⁿ為廣義位置誤差，vd為廣義期望速度，rd為期望位置。

進(jìn)一步的，步驟s3中，所述增強(qiáng)性能信號(hào)為：

其中：s為濾波誤差，τc∈rⁿ自適應(yīng)學(xué)習(xí)補(bǔ)償控制項(xiàng)，q,r分別為正定矩陣。

進(jìn)一步的，步驟s3中，最優(yōu)的補(bǔ)償控制輸入在評(píng)價(jià)網(wǎng)絡(luò)待優(yōu)化的長(zhǎng)時(shí)間性能為：

三層神經(jīng)網(wǎng)絡(luò)對(duì)執(zhí)行層相應(yīng)補(bǔ)償控制近似為：

其中，τc,i為第i維補(bǔ)償控制輸入，i＝1,...,n，ωc1,k＝[ωc1,k1,...,ωc1,k2n]^t為輸入層與隱藏層的權(quán)重參數(shù)，為隱藏層與輸出層之間的權(quán)重參數(shù)，φc,k為神經(jīng)網(wǎng)絡(luò)激活函數(shù)，nc為評(píng)價(jià)層隱藏層節(jié)點(diǎn)個(gè)數(shù)。

進(jìn)一步的，步驟s3中，對(duì)于輸入層與隱藏層以及隱藏層與輸出層之間的權(quán)重參數(shù)可以利用梯度下降法實(shí)現(xiàn)更新。

進(jìn)一步的，所述基于學(xué)習(xí)的自適應(yīng)預(yù)設(shè)性能控制器τ為：

其中，τp,i為標(biāo)稱(chēng)預(yù)設(shè)性能控制輸入，τc,i為補(bǔ)償控制輸入，ki為正的控制增益，ξi為伴隨變量，γs,i為預(yù)設(shè)性能的下界增益，為預(yù)設(shè)性能的上界增益，為執(zhí)行網(wǎng)絡(luò)第一層神經(jīng)網(wǎng)絡(luò)權(quán)重，φa,k為執(zhí)行網(wǎng)絡(luò)中隱藏層激活函數(shù)，為神經(jīng)網(wǎng)絡(luò)的輸入信號(hào)。

與現(xiàn)有技術(shù)相比，本發(fā)明至少具有以下有益效果：

本發(fā)明一種非線(xiàn)性系統(tǒng)的自適應(yīng)學(xué)習(xí)預(yù)設(shè)性能控制方法，通過(guò)建立euler-lagrange動(dòng)力學(xué)系統(tǒng)模型，并對(duì)所述動(dòng)力學(xué)系統(tǒng)模型進(jìn)行預(yù)設(shè)性能控制，設(shè)計(jì)標(biāo)稱(chēng)預(yù)設(shè)性能控制器，然后基于自適應(yīng)動(dòng)態(tài)規(guī)劃，設(shè)計(jì)基于學(xué)習(xí)的自適應(yīng)控制器，在不需要euler-lagrange系統(tǒng)模型信息基礎(chǔ)上，僅依賴(lài)于系統(tǒng)的輸入/輸出數(shù)據(jù)，就可以實(shí)現(xiàn)對(duì)受控euler-lagrange系統(tǒng)的魯棒自適應(yīng)控制，并且系統(tǒng)對(duì)未知不確定性以及外界干擾具有較強(qiáng)的魯棒性以及自適應(yīng)性，受控euler-lagrange系統(tǒng)的瞬態(tài)與穩(wěn)態(tài)性能可以實(shí)現(xiàn)先驗(yàn)的設(shè)計(jì)。

進(jìn)一步的，在只需要不確定euler-lagrange系統(tǒng)的輸入輸出數(shù)據(jù)基礎(chǔ)上，基于自適應(yīng)動(dòng)態(tài)規(guī)劃方法，形成自適應(yīng)補(bǔ)償控制律，能夠增強(qiáng)標(biāo)稱(chēng)預(yù)設(shè)性能控制器對(duì)未知不確定性以及外界干擾的魯棒性以及自適應(yīng)性。

綜上所述，本發(fā)明在不需要系統(tǒng)確切的動(dòng)力學(xué)模型基礎(chǔ)上，僅依賴(lài)于系統(tǒng)的輸入/輸出數(shù)據(jù)，設(shè)計(jì)出一種低復(fù)雜度的魯棒自適應(yīng)控制器，使得受控的euler-lagrange系統(tǒng)的瞬態(tài)與穩(wěn)態(tài)性能能夠得到先驗(yàn)設(shè)計(jì)，同時(shí)又可避免傳統(tǒng)基于數(shù)據(jù)學(xué)習(xí)控制嚴(yán)重依賴(lài)初始允許控制策略的缺點(diǎn)。

下面通過(guò)附圖和實(shí)施例，對(duì)本發(fā)明的技術(shù)方案做進(jìn)一步的詳細(xì)描述。

附圖說(shuō)明

圖1為地面小車(chē)第一維流形響應(yīng)圖；

圖2為地面小車(chē)第二維流形響應(yīng)圖；

圖3為地面小車(chē)第三維流形響應(yīng)圖；

圖4為地面小車(chē)系統(tǒng)輸出追蹤圖；

圖5為地面小車(chē)三維控制輸入示意圖；

圖6為地面小車(chē)二維軌跡追蹤圖。

具體實(shí)施方式

本發(fā)明公開(kāi)了一種不確定euler-lagrange非線(xiàn)性系統(tǒng)的自適應(yīng)學(xué)習(xí)預(yù)設(shè)性能控制方法，針對(duì)不確定euler-lagrange非線(xiàn)性系統(tǒng)控制問(wèn)題，提出一種僅依賴(lài)系統(tǒng)輸入/輸出信息的低復(fù)雜度魯棒自適應(yīng)控制方法，實(shí)現(xiàn)對(duì)不確定euler-lagrange系統(tǒng)的魯棒追蹤控制，并且避開(kāi)傳統(tǒng)基于模型控制方法設(shè)計(jì)復(fù)雜度高以及傳統(tǒng)基于數(shù)據(jù)學(xué)習(xí)控制方法嚴(yán)重依賴(lài)初始允許控制策略等缺點(diǎn)。

具體步驟如下：

s1、euler-lagrange動(dòng)力學(xué)系統(tǒng)描述

本發(fā)明針對(duì)euler-lagrange的系統(tǒng)模型為：

其中，q＝[q1,...,qn]^t∈rⁿ為廣義坐標(biāo)向量，n為系統(tǒng)維數(shù)，t是向量轉(zhuǎn)置，rⁿ為n維歐幾里得空間，m(q)∈r^n×n為正定對(duì)稱(chēng)轉(zhuǎn)動(dòng)慣量；為科里奧利矩陣；g(q)為重力矢量；τ,d∈rⁿ為控制力矩以及外界未知有界干擾。

定義變量r＝q，則式(1)等價(jià)轉(zhuǎn)化為：

其中，r,v∈rⁿ為廣義位置與速度。

s2、標(biāo)稱(chēng)預(yù)設(shè)性能控制器

針對(duì)系統(tǒng)模型(2)，定義流形如下：

s＝ev+βer(3)

其中，s＝[s1,…,sn]^t∈rⁿ為濾波誤差，β∈r^n×n為待設(shè)計(jì)正定對(duì)角矩陣，ev＝v-vd為廣義速度誤差，er＝r-rd∈rⁿ為廣義位置誤差，vd為廣義期望速度，rd為期望位置。

為了實(shí)現(xiàn)對(duì)系統(tǒng)模型(2)的預(yù)設(shè)性能控制，定義預(yù)設(shè)性能如下：

其中，ρs，i0＞ρs，i∞＞0，κs,i∈[0,1],是單調(diào)遞減函數(shù)。在式(4)預(yù)設(shè)性能下，設(shè)計(jì)的標(biāo)稱(chēng)預(yù)設(shè)性能控制器為：

其中：τp,i為第i維預(yù)設(shè)性能控制輸入，ki為待設(shè)計(jì)的正的控制增益，為統(tǒng)一誤差，或(-1,κs,i)，κ為正的常量，ξs,i為正的伴隨參量，即

s3、基于學(xué)習(xí)的自適應(yīng)控制器設(shè)計(jì)

為了增強(qiáng)步驟s2設(shè)計(jì)的標(biāo)稱(chēng)預(yù)設(shè)性能控制器對(duì)未知干擾以及不確定性的魯棒性與自適應(yīng)性，基于自適應(yīng)動(dòng)態(tài)規(guī)劃(adaptivedynamicprogramming-adp)，設(shè)計(jì)基于學(xué)習(xí)的自適應(yīng)控制器。

在adp中，通常基于神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)評(píng)價(jià)-執(zhí)行動(dòng)作網(wǎng)絡(luò)，分別對(duì)增強(qiáng)性能信號(hào)以及控制序列進(jìn)行近似最優(yōu)求解。

首先針對(duì)評(píng)價(jià)網(wǎng)絡(luò)，定義增強(qiáng)性能信號(hào)為：

其中，為評(píng)價(jià)網(wǎng)絡(luò)的增強(qiáng)性能信號(hào)，τc∈rⁿ為自適應(yīng)學(xué)習(xí)補(bǔ)償控制項(xiàng)，q,r分別為正定矩陣，t為向量的轉(zhuǎn)置。

對(duì)于評(píng)價(jià)網(wǎng)絡(luò)，待優(yōu)化的長(zhǎng)時(shí)間性能：

其中，為復(fù)合信號(hào)，η∈(0,1)為折扣因子，t為當(dāng)前時(shí)刻，δt為采用步長(zhǎng)。

則最優(yōu)的補(bǔ)償控制輸入在優(yōu)化式(7)得到，即：

對(duì)于式(8)的貝爾曼最優(yōu)性問(wèn)題，難以得到解析的解，因此采用3層神經(jīng)網(wǎng)絡(luò)進(jìn)行近似，即：

其中，ωc1,k＝[ωc1,k1,...,ωc1,k2n]^t為輸入層與隱藏層的權(quán)重參數(shù)，為隱藏層與輸出層之間的權(quán)重參數(shù)，φc,k為神經(jīng)網(wǎng)絡(luò)激活函數(shù)(可以用線(xiàn)性激活函數(shù)、s型函數(shù)等)，nc為評(píng)價(jià)層隱藏層節(jié)點(diǎn)個(gè)數(shù)。

對(duì)于輸入層與隱藏層以及隱藏層與輸出層之間的權(quán)重參數(shù)可以利用梯度下降法實(shí)現(xiàn)更新。

對(duì)于執(zhí)行層，相應(yīng)的補(bǔ)償控制用3層神經(jīng)網(wǎng)絡(luò)近似為：

其中，τc,i(i＝1,...,n)為第i維補(bǔ)償控制輸入，其他參數(shù)含義類(lèi)同式(9)。

通過(guò)迭代求解式(9)與(10)，最終實(shí)現(xiàn)穩(wěn)定的在線(xiàn)學(xué)習(xí)補(bǔ)償控制器的計(jì)算。

基于式(5)與式(10)的計(jì)算，可以得到基于學(xué)習(xí)的自適應(yīng)預(yù)設(shè)性能控制器τ為：

實(shí)施例

以地面小車(chē)定點(diǎn)追蹤控制為仿真對(duì)象，其中仿真實(shí)驗(yàn)中三個(gè)預(yù)設(shè)性能函數(shù)的12個(gè)參數(shù)ρs,10,ρs,20,ρs,30,ρs,1∞,ρs,2∞,ρs,3∞,κs,1,κs,2,κs,3,,分別取為6,35,3,0.05,0.1,0.05,0.02,0.02,0.05；控制增益k1,k2,k3分別取600,800,200；流形參數(shù)β＝diag{1,1,2}。

地面小車(chē)的各項(xiàng)參數(shù)為：慣性矩陣m＝diag{m1,m2,m3}，其中m1＝500kg,m2＝1000kg,m3＝700kgm²，科里奧利矩陣c為：

其中：

評(píng)價(jià)-執(zhí)行層的隱藏層節(jié)點(diǎn)個(gè)數(shù)都為10，且輸入層與隱藏層，以及隱藏層與輸出層的權(quán)重參數(shù)初始值在[-0.3,0.3],[-0.2,0.2]區(qū)間上任意取。

折扣參數(shù)因子為0.95，評(píng)價(jià)-執(zhí)行網(wǎng)絡(luò)訓(xùn)練的容許誤差為10^-5，單次訓(xùn)練的周期為300步。

在仿真過(guò)程中加入的外界干擾力矩d為：

其中，t為當(dāng)前時(shí)刻。

圖1至圖3表明小車(chē)預(yù)設(shè)的性能在設(shè)計(jì)的控制律下得到的有效保證，圖4表明小車(chē)的三維輸出(橫側(cè)向位置極其偏航角)在設(shè)計(jì)的控制器下快速收斂到期望的位置，其中，y1,y2,y3分別為橫向、縱向位置以及偏航角度，圖5表明小車(chē)的三個(gè)控制通道的輸入滿(mǎn)足控制飽和約束，因此仿真的結(jié)果驗(yàn)證了理論方法的正確性。

請(qǐng)參閱圖6，通過(guò)對(duì)小車(chē)平面位置追蹤的跟蹤控制，仿真結(jié)果驗(yàn)證了理論的正確性，并表明在不需要知道小車(chē)具體動(dòng)力學(xué)模型信息基礎(chǔ)上，僅依賴(lài)于小車(chē)的輸入/輸出信息即可實(shí)現(xiàn)對(duì)小車(chē)的魯棒自適應(yīng)控制，顯示了該方法相比于傳統(tǒng)基于模型控制方法的簡(jiǎn)單有效性。

以上內(nèi)容僅為說(shuō)明本發(fā)明的技術(shù)思想，不能以此限定本發(fā)明的保護(hù)范圍，凡是按照本發(fā)明提出的技術(shù)思想，在技術(shù)方案基礎(chǔ)上所做的任何改動(dòng)，均落入本發(fā)明權(quán)利要求書(shū)的保護(hù)范圍之內(nèi)。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁(yè)1 2

該技術(shù)已申請(qǐng)專(zhuān)利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：羅建軍;魏才盛;袁建平;王明明;朱戰(zhàn)霞;殷澤陽(yáng)
技術(shù)所有人：西北工業(yè)大學(xué)
我是此專(zhuān)利的發(fā)明人

該領(lǐng)域下的技術(shù)專(zhuān)家
如您需求助技術(shù)專(zhuān)家，請(qǐng)點(diǎn)此查看客服電話(huà)進(jìn)行咨詢(xún)。
1、唐老師：1.高效節(jié)能裝備 2.流動(dòng)穩(wěn)定性 3.汽車(chē)流場(chǎng)分析和淀粉糖工藝技術(shù)。
2、孫老師：1.振動(dòng)信號(hào)時(shí)頻分析理論與測(cè)試系統(tǒng)設(shè)計(jì) 2.汽車(chē)檢測(cè)系統(tǒng)設(shè)計(jì) 3.汽車(chē)電子控制系統(tǒng)設(shè)計(jì)
3、王老師：電子信息處理、先進(jìn)檢測(cè)方法和智能化儀表
4、周老師：1.智能電網(wǎng) 2.新能源利用 3.泛在電力物聯(lián)網(wǎng)
5、趙老師：檢測(cè)與控制技術(shù)、機(jī)器人技術(shù)、機(jī)電一體化技術(shù)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專(zhuān)家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢(xún)問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種非線(xiàn)性系統(tǒng)的自適應(yīng)學(xué)習(xí)預(yù)設(shè)性能控制方法與流程