本發(fā)明屬于迭代學(xué)習(xí)控制技術(shù)、自適應(yīng)控制技術(shù)和反演控制技術(shù)領(lǐng)域,尤其涉及一種導(dǎo)彈PID控制器參數(shù)自適應(yīng)調(diào)節(jié)的方法。
背景技術(shù):迭代學(xué)習(xí)控制的概念與方法最早由日本學(xué)者Uchiyama于1978年提出,它特別適合那些具有重復(fù)運(yùn)動性質(zhì)的被控對象,這種控制方法不依賴于系統(tǒng)的精確數(shù)學(xué)模型,能夠以非常簡單的方式處理不確定性相當(dāng)高的非線性強(qiáng)耦合動態(tài)系統(tǒng)。經(jīng)過近三十年的發(fā)展,迭代學(xué)習(xí)控制已經(jīng)廣泛應(yīng)用到很多領(lǐng)域,并與自適應(yīng)控制、魯棒控制、模糊控制和神經(jīng)網(wǎng)絡(luò)相結(jié)合,成為了一門既具備良好的工程可實(shí)現(xiàn)性又具備理論研究價值的學(xué)科。PID控制器是一種工程實(shí)用性強(qiáng)且應(yīng)用非常廣泛的控制器。傳統(tǒng)的導(dǎo)彈PID控制器設(shè)計(jì)方法在進(jìn)行參數(shù)調(diào)試時,首先要設(shè)計(jì)飛行彈道并選取具有代表性的彈道點(diǎn)作為特征點(diǎn),隨后在特征點(diǎn)處對導(dǎo)彈模型進(jìn)行線性化和參數(shù)固化,并以各特征點(diǎn)對應(yīng)的線性模型為對象,通過不斷對控制器參數(shù)進(jìn)行試湊,最終得到比較理想的控制器參數(shù)。最后再根據(jù)導(dǎo)彈所處氣動環(huán)境在不同階段采用不同的控制器參數(shù),從而達(dá)到對導(dǎo)彈全方位控制的目的。這種設(shè)計(jì)方法存在兩個方面的缺陷:第一,控制器的調(diào)試完全靠科研人員的工作經(jīng)驗(yàn),而且當(dāng)特征點(diǎn)較多時,調(diào)試工作量會變得過大而難以承受;第二,控制器參數(shù)是根據(jù)導(dǎo)彈不同飛行階段分別給出的,控制器在整個彈道上是不連續(xù)的。
技術(shù)實(shí)現(xiàn)要素:分析導(dǎo)彈PID控制器的設(shè)計(jì)過程不難發(fā)現(xiàn),控制器參數(shù)的調(diào)試工作實(shí)際上具有迭代特性。它是一個不斷重復(fù)的仿真—調(diào)整—再仿真—再調(diào)整過程,與常規(guī)迭代學(xué)習(xí)控制的不同之處在于它需要調(diào)試人員對指令跟蹤情況進(jìn)行判斷,并根據(jù)經(jīng)驗(yàn)對參數(shù)進(jìn)行人工調(diào)節(jié),而不是利用狀態(tài)誤差對控制器進(jìn)行自動修正??紤]到上述特點(diǎn),結(jié)合迭代學(xué)習(xí)控制思想,本發(fā)明提出一種實(shí)現(xiàn)導(dǎo)彈PID控制器參數(shù)自動調(diào)節(jié)的思路:借鑒迭代學(xué)習(xí)控制的思想,以整個全彈道導(dǎo)彈系統(tǒng)為迭代對象,將每次PID控制器參數(shù)調(diào)試過程看作迭代學(xué)習(xí)控制理論中系統(tǒng)的一次迭代運(yùn)行,利用上一次迭代時系統(tǒng)的跟蹤誤差,按照一定的規(guī)律對下一次系統(tǒng)運(yùn)行時的PID控制器參數(shù)進(jìn)行調(diào)節(jié),如此不斷的循環(huán)運(yùn)行整個導(dǎo)彈系統(tǒng),形成一種大循環(huán)迭代學(xué)習(xí)機(jī)制,實(shí)現(xiàn)導(dǎo)彈PID控制器參數(shù)的自動尋優(yōu)。此即本發(fā)明所提出的大循環(huán)迭代學(xué)習(xí)思想。這種思想在實(shí)踐中具備較強(qiáng)的可操作性,但在研究中存在兩個難點(diǎn)問題:第一,如何建立導(dǎo)彈PID控制器參數(shù)大循環(huán)迭代學(xué)習(xí)控制系統(tǒng)的數(shù)學(xué)模型;第二,采用何種方法設(shè)計(jì)PID控制器參數(shù)迭代學(xué)習(xí)律,所設(shè)計(jì)的PID控制器參數(shù)自適應(yīng)迭代學(xué)習(xí)控制系統(tǒng)是否收斂,如何證明其穩(wěn)定性。為攻克上述難題,本發(fā)明以導(dǎo)彈俯仰通道為例,建立其數(shù)學(xué)模型,充分利用迭代學(xué)習(xí)控制技術(shù)、自適應(yīng)控制技術(shù)和反演控制技術(shù)設(shè)計(jì)PID控制器參數(shù)迭代學(xué)習(xí)律,并證明所設(shè)計(jì)迭代學(xué)習(xí)控制系統(tǒng)的收斂性。該思想一旦在工程上得到實(shí)現(xiàn),能實(shí)現(xiàn)導(dǎo)彈PID控制器參數(shù)的自動整定,并將徹底改變傳統(tǒng)的導(dǎo)彈PID控制器設(shè)計(jì)方法,大幅減小導(dǎo)彈PID控制器設(shè)計(jì)的工作量,縮短設(shè)計(jì)周期。在理論研究方面,導(dǎo)彈PID控制器參數(shù)迭代學(xué)習(xí)技術(shù)及其穩(wěn)定性方面的研究將填補(bǔ)國內(nèi)外相關(guān)領(lǐng)域的研究空白,具有重要的理論意義?;诖笱h(huán)思想的導(dǎo)彈PID控制器參數(shù)自適應(yīng)迭代學(xué)習(xí)控制方案包含兩個方面的核心技術(shù):(1)導(dǎo)彈PID控制器參數(shù)大循環(huán)迭代學(xué)習(xí)方案設(shè)計(jì);(2)導(dǎo)彈PID控制器參數(shù)大循環(huán)迭代學(xué)習(xí)控制系統(tǒng)建模、自適應(yīng)迭代學(xué)習(xí)律設(shè)計(jì)及穩(wěn)定性分析。一、導(dǎo)彈PID控制器參數(shù)大循環(huán)迭代學(xué)習(xí)方案設(shè)計(jì)導(dǎo)彈PID控制器參數(shù)大循環(huán)迭代學(xué)習(xí)方案運(yùn)行流程如圖1所示。導(dǎo)彈PID控制器參數(shù)大循環(huán)迭代學(xué)習(xí)方案的具體實(shí)施可按以下幾步進(jìn)行:(1)根據(jù)導(dǎo)彈傳感器的具體情況,設(shè)計(jì)導(dǎo)彈三通道PID控制器,從而確定導(dǎo)彈控制器形式,明確需要調(diào)節(jié)的控制器參數(shù);(2)根據(jù)實(shí)際任務(wù)需求設(shè)計(jì)導(dǎo)彈程序飛行階段彈道,并選取具有代表性的彈道點(diǎn)作為特征點(diǎn),經(jīng)簡單調(diào)試得到各特征點(diǎn)處能夠使系統(tǒng)穩(wěn)定的PID控制器參數(shù),并通過插值得到PID控制器參數(shù)在整個彈道上的初始值;(3)根據(jù)實(shí)際控制器需求,建立適用于迭代學(xué)習(xí)控制系統(tǒng)設(shè)計(jì)的數(shù)學(xué)模型;(4)利用迭代學(xué)習(xí)控制技術(shù)、自適應(yīng)控制技術(shù)和反演控制技術(shù)設(shè)計(jì)PID控制器參數(shù)自適應(yīng)迭代學(xué)習(xí)控制系統(tǒng),得到迭代學(xué)習(xí)控制器和自適應(yīng)迭代學(xué)習(xí)律的具體表達(dá)式;(5)利用基于Lyapunov-like函數(shù)的穩(wěn)定性理論證明所設(shè)計(jì)PID控制器參數(shù)自適應(yīng)迭代學(xué)習(xí)控制系統(tǒng)的穩(wěn)定性;(6)以六自由度非線性導(dǎo)彈模型為仿真試驗(yàn)對象,以第二步得到的控制器參數(shù)為初始值,利用步驟S4得到的自適應(yīng)迭代學(xué)習(xí)控制器和自適應(yīng)迭代學(xué)習(xí)律對PID控制器參數(shù)進(jìn)行迭代學(xué)習(xí),直至獲得滿足控制要求的PID控制器參數(shù)。二、導(dǎo)彈PID控制器參數(shù)大循環(huán)迭代學(xué)習(xí)控制系統(tǒng)建模、自適應(yīng)迭代學(xué)習(xí)律設(shè)計(jì)及穩(wěn)定性分析在已有的研究文獻(xiàn)中,鮮有PID控制器參數(shù)迭代尋優(yōu)方面的研究工作,對于此類迭代學(xué)習(xí)控制系統(tǒng)的建模與穩(wěn)定性分析方面的研究則為空白。針對這一研究現(xiàn)狀,本發(fā)明建立了所提出的PID控制器參數(shù)大循環(huán)迭代學(xué)習(xí)方案的數(shù)學(xué)模型,并利用自適應(yīng)迭代學(xué)習(xí)控制技術(shù)設(shè)計(jì)了相應(yīng)的迭代學(xué)習(xí)律,得到了穩(wěn)定性定理,保證了所設(shè)計(jì)方案在理論上的正確性。這里以俯仰通道為例,給出迭代學(xué)習(xí)控制系統(tǒng)設(shè)計(jì)技術(shù)及穩(wěn)定性分析的簡要情況。與所設(shè)計(jì)的導(dǎo)彈PID控制器參數(shù)大循環(huán)迭代學(xué)習(xí)方案相對應(yīng)的控制系統(tǒng)結(jié)構(gòu)如圖2所示。在不考慮通道之間交聯(lián)的前提下,導(dǎo)彈縱向通道的數(shù)學(xué)模型可表示為其中:α為導(dǎo)彈攻角;ωz為導(dǎo)彈俯仰角速度;θ為導(dǎo)彈速度傾角;m為導(dǎo)彈質(zhì)量;V為導(dǎo)彈速度;P為導(dǎo)彈推力;為具有時變特性的導(dǎo)彈氣動參數(shù);Jz為導(dǎo)彈轉(zhuǎn)動慣量;ny為導(dǎo)彈在速度坐標(biāo)系內(nèi)的縱向過載。為簡化模型,本發(fā)明進(jìn)行以下三個方面的簡化:(1)考慮到gcosθ/V這一項(xiàng)一般情況下比較小,這里忽略該項(xiàng);(2)考慮到俯仰舵對升力的貢獻(xiàn)較小,忽略這一項(xiàng);(3)考慮到這一項(xiàng)也比較小,這里也忽略該項(xiàng)。經(jīng)簡化后的方程可表示為:定義顯然,ny是關(guān)于攻角α的非線性函數(shù),若用h1(·)表示兩者之間的非線性關(guān)系,則ny=h1(α(t),t)(4)注1:對導(dǎo)彈而言,攻角α(t)的變化范圍一般在[-5°,7°]之間,由(2)式中過載和攻角之間的關(guān)系可知,ny與α之間滿足一種近似線性關(guān)系,利用現(xiàn)有文獻(xiàn)中的方法設(shè)計(jì)濾波器,可以通過對過載指令nyc濾波得到攻角指令αc。另外,由(2)式可知函數(shù)h1(α(t),t)是連續(xù)可導(dǎo)的。則方程可進(jìn)一步寫為其中,f1(·):R×[0,T]→R、f2(·):R2×[0,T]→R、h(·):R2×[0,T]→R2為與模型(2)相對應(yīng)的函數(shù),這三個函數(shù)都是連續(xù)可導(dǎo)的時變非線性函數(shù),g1(t)、g2(t)為控制參數(shù),顯然,在這里g1(t)=1。至此得到了導(dǎo)彈縱向通道的數(shù)學(xué)模型,可見它具有嚴(yán)格反饋的數(shù)學(xué)形式,下面將以此模型為對象進(jìn)行控制系統(tǒng)設(shè)計(jì)。注2:這里假設(shè)f1(·)、f2(·)和h(·)均為未知函數(shù),g1(t)、g2(t)均為未知時變參數(shù),并在此基礎(chǔ)上進(jìn)行自適應(yīng)迭代學(xué)習(xí)律設(shè)計(jì)和穩(wěn)定性分析,這樣做的目的是為了證明本發(fā)明所提出的設(shè)計(jì)方案可以應(yīng)用到與式(5)類似的非線性時變系統(tǒng),具有良好的可推廣性。由于考慮的是系統(tǒng)(5)的迭代學(xué)習(xí)控制問題,因此,這里的研究對象應(yīng)該是在有限時間t∈[0,T]上可重復(fù)運(yùn)行的系統(tǒng),它可表示為其中,k為迭代次數(shù)標(biāo)記??刂颇繕?biāo):給定期望軌跡y1d(t)(即期望的過載指令信號nyc(t)),設(shè)計(jì)PID控制器uk(t)及相應(yīng)的PID控制器參數(shù)自適應(yīng)迭代學(xué)習(xí)律,使得在任意迭代次數(shù)k,系統(tǒng)所有的狀態(tài)量在Lpe-范數(shù)意義下有界,且系統(tǒng)的輸出量y1,k(t)在有限時間[0,T]上對期望軌跡y1d(t)的跟蹤誤差足夠小,在這里定義為在-范數(shù)意義下有界,即存在某個k*∈Z+,使得對于任意的k>k*,下式滿足:其中,εt>0為一個小量,定義為誤差容許量。Lpe-范數(shù)定義為其中,||·||為任意向量·的相容范數(shù),t∈[0,T]。當(dāng)||·||pe存在時(即||·||pe有限時),我們稱·∈Lpe。這里對系統(tǒng)做如下基本假設(shè):假設(shè)1:系統(tǒng)在每次迭代時的初始條件滿足:xk+1(0)=xk(0)=x0=xd(0),k=0,1,2,...。注3:彈道仿真的初始值就是導(dǎo)彈發(fā)射原點(diǎn)處的狀態(tài)值,這里研究的是全彈道仿真階段PID控制器參數(shù)調(diào)節(jié)問題,只需在每次仿真開始前將系統(tǒng)初值設(shè)為期望狀態(tài)即可。假設(shè)2:系統(tǒng)(6)期望的狀態(tài)軌跡和輸出軌跡分別為xd(t)=[x1d(t),x2d(t)]T和yd(t)=[y1d(t),y2d(t)]T,xd(t)和yd(t)在[0,T]上是連續(xù)可導(dǎo)的,且存在唯一的期望輸入函數(shù)ud(t),使得xd(t)、yd(t)和ud(t)滿足方程(5),即注4:假設(shè)2實(shí)際上是對導(dǎo)彈跟蹤能力、指令設(shè)計(jì)和控制器設(shè)計(jì)合理性的要求,這些是研究的前提,顯然是能夠滿足的,因此假設(shè)2是合理的。根據(jù)大循環(huán)PID控制器參數(shù)迭代學(xué)習(xí)控制方案,所設(shè)計(jì)的控制器形式為其中e1,k(t),e2,k(t)為系統(tǒng)誤差狀態(tài)量,其定義將在后面給出。根據(jù)假設(shè)2,必然存在理想的PID控制器參數(shù)使得理想的輸入函數(shù)ud(t)滿足注5:由于xd(t)和yd(t)在[0,T]上連續(xù)可導(dǎo),顯然ud(t)也是連續(xù)可導(dǎo)的,從而必然存在在[0,T]上連續(xù)可導(dǎo)的PID控制器參數(shù)使得(10)式得到滿足。假設(shè)3:系統(tǒng)的控制參數(shù)滿足以下兩個條件:(1)g1(t),g2(t)的符號已知,且存在未知常量使得對任意的t∈[0,T],始終成立;(2)g1(t),g2(t)對時間的導(dǎo)數(shù)存在且有界,即存在未知常量Ni>0,i=1,2,使得注6:g(t)實(shí)際上是導(dǎo)彈的氣動參數(shù),根據(jù)導(dǎo)彈的數(shù)學(xué)模型可知,假設(shè)3是能夠得到滿足的。為說明本文所提出方法的通用性,這里不失一般性的假設(shè)gi(t)>0,i=1,2,則存在未知常量使得始終成立。定義誤差狀態(tài)量其中,α1,k(t)為虛擬控制量,其定義將在后面給出。設(shè)計(jì)系統(tǒng)控制量為其中,為第k次迭代時的PID控制器參數(shù),它們分別是對最優(yōu)控制器參數(shù)的估計(jì)值,其自適應(yīng)迭代學(xué)習(xí)律設(shè)計(jì)如下:式(15)中,分別為為第k+1次和第k次迭代時對最優(yōu)控制器參數(shù)的估計(jì)值;e1.k(t),e2,k(t)為系統(tǒng)誤差狀態(tài)量;為控制器參數(shù)估計(jì)值的初始值,kp0(t),ki0(t),kd0(t)表示其初始值對應(yīng)的具體函數(shù);β1,β2,β3>0為設(shè)計(jì)自適應(yīng)參數(shù)。注7:這里在PID控制器比例環(huán)節(jié)系數(shù)中引入了這一項(xiàng),這樣可以避免增長型自適應(yīng)迭代學(xué)習(xí)律的出現(xiàn),能夠較好的改善自適應(yīng)迭代學(xué)習(xí)律的性能。經(jīng)穩(wěn)定性分析,最終可以得到如下的定理:定理:考慮式(5)所描述的二階嚴(yán)格反饋非線性系統(tǒng),在假設(shè)1~3的前提下,設(shè)計(jì)虛擬迭代學(xué)習(xí)控制器和PID控制器(12),采用PID控制器參數(shù)自適應(yīng)迭代學(xué)習(xí)律(13)~(15),可以得到如下的結(jié)論:(1)系統(tǒng)所有的信號均有界,且對任意的t∈[0,T]和k∈Z+,系統(tǒng)誤差狀態(tài)量ei,k(t)∈L∞e,i=1,2,PID控制器參數(shù)估計(jì)誤差控制量uk(t)∈L∞e,其中L∞e、L2e為Lpe-范數(shù)在p=∞和p=2時對應(yīng)的范數(shù);(2)系統(tǒng)的狀態(tài)量滿足PID控制器參數(shù)滿足其中為第k+1次與第k次迭代時對控制器參數(shù)的估計(jì)值之差。最終控制目標(biāo)將得到實(shí)現(xiàn)。附圖說明圖1是本發(fā)明導(dǎo)彈PID控制器參數(shù)大循環(huán)迭代學(xué)習(xí)方案設(shè)計(jì)流程示意圖;圖2是本發(fā)明導(dǎo)彈PID控制器參數(shù)大循環(huán)迭代學(xué)習(xí)控制系統(tǒng)原理圖;圖3是本發(fā)明導(dǎo)彈俯仰通道PID控制系統(tǒng)結(jié)構(gòu)圖;圖4是本發(fā)明導(dǎo)彈偏航通道PID控制系統(tǒng)結(jié)構(gòu)圖;圖5是本發(fā)明導(dǎo)彈與虛擬目標(biāo)相對運(yùn)動關(guān)系圖;圖6是本發(fā)明導(dǎo)彈縱向程序飛行彈道及特征點(diǎn)選取示意圖;圖7是本發(fā)明誤差積分量隨迭代變化情況;圖8是本發(fā)明誤差積分量隨迭代變化情況圖9是本發(fā)明不同迭代次數(shù)導(dǎo)彈對期望彈道的跟蹤情況具體實(shí)施方式本發(fā)明提供了一種導(dǎo)彈PID控制器參數(shù)自適應(yīng)調(diào)節(jié)的方法,技術(shù)要點(diǎn)在于:本發(fā)明針對傳統(tǒng)導(dǎo)彈PID控制器設(shè)計(jì)過程中所存在的設(shè)計(jì)周期長、人力消耗大等問題,通過對PID控制器參數(shù)的調(diào)試過程進(jìn)行充分分析,利用調(diào)試過程本身所具有的迭代特性,提出了一種導(dǎo)彈PID控制器參數(shù)大循環(huán)迭代尋優(yōu)思想,并基于這一思想提出了相應(yīng)的導(dǎo)彈PID控制器參數(shù)大循環(huán)自適應(yīng)迭代學(xué)習(xí)方案,實(shí)現(xiàn)了PID控制器參數(shù)的自動調(diào)節(jié)與尋優(yōu),從而達(dá)到減小人力資源消耗、提高工作效率、縮短設(shè)計(jì)周期的目的。具體設(shè)計(jì)方案包括六個部分:一、導(dǎo)彈PID控制系統(tǒng)設(shè)計(jì)。根據(jù)實(shí)際控制需求,對導(dǎo)彈三通道PID控制器進(jìn)行設(shè)計(jì),確定需要調(diào)節(jié)的PID控制器參數(shù)。二、導(dǎo)彈程序飛行彈道設(shè)計(jì)及特征點(diǎn)提取。首先,根據(jù)需求設(shè)計(jì)程序飛行彈道,得到系統(tǒng)的期望軌跡;其次,在程序彈道上選取具有代表性的彈道點(diǎn)作為特征點(diǎn),通過特征點(diǎn)仿真與插值得到PID控制器參數(shù)在完整彈道上的初始值,為后續(xù)全彈道仿真做好準(zhǔn)備。三、導(dǎo)彈自適應(yīng)迭代學(xué)習(xí)控制系統(tǒng)數(shù)學(xué)模型建立。根據(jù)實(shí)際控制需求,基于一些合理假設(shè),通過推導(dǎo)得到適用于迭代學(xué)習(xí)控制系統(tǒng)設(shè)計(jì)的數(shù)學(xué)模型,作為后續(xù)控制系統(tǒng)設(shè)計(jì)的控制對象。四、導(dǎo)彈PID控制器參數(shù)自適應(yīng)迭代學(xué)習(xí)控制系統(tǒng)設(shè)計(jì)。根據(jù)所提出的導(dǎo)彈PID控制器參數(shù)大循環(huán)迭代尋優(yōu)思想,針對第三步得到的數(shù)學(xué)模型,利用迭代學(xué)習(xí)控制技術(shù)、自適應(yīng)控制技術(shù)和反演控制技術(shù)設(shè)計(jì)迭代學(xué)習(xí)控制器和自適應(yīng)迭代學(xué)習(xí)律,實(shí)現(xiàn)導(dǎo)彈PID控制器參數(shù)的自動調(diào)節(jié)。五、導(dǎo)彈PID控制器參數(shù)大循環(huán)自適應(yīng)迭代學(xué)習(xí)控制系統(tǒng)穩(wěn)定性分析。針對所設(shè)計(jì)的導(dǎo)彈PID控制器參數(shù)自適應(yīng)迭代學(xué)習(xí)控制系統(tǒng),利用基于Lyapunov-like函數(shù)的穩(wěn)定性理論進(jìn)行穩(wěn)定性分析,在理論上證明所提出設(shè)計(jì)方案的正確性。六、全彈道仿真試驗(yàn)驗(yàn)證。以六自由度非線性導(dǎo)彈模型為仿真對象,利用MATLAB語言編程實(shí)現(xiàn)所提出的設(shè)計(jì)方案,通過仿真試驗(yàn)驗(yàn)證所提出理論的正確性和有效性。本發(fā)明所提出的設(shè)計(jì)方法是先進(jìn)控制理論與工程實(shí)踐良好結(jié)合的實(shí)例,是自適應(yīng)迭代學(xué)習(xí)控制技術(shù)在工程實(shí)踐中的具體應(yīng)用。它不依賴于精確的數(shù)學(xué)模型,易于實(shí)現(xiàn),而且控制系統(tǒng)的設(shè)計(jì)經(jīng)過了嚴(yán)格的理論推導(dǎo),理論體系完整,能夠?qū)崿F(xiàn)導(dǎo)彈PID控制器參數(shù)的自適應(yīng)迭代尋優(yōu),實(shí)現(xiàn)導(dǎo)彈對程序飛行彈道的完全跟蹤,所做的理論研究是對國內(nèi)外相關(guān)研究領(lǐng)域的有力補(bǔ)充。所提出的設(shè)計(jì)思想和理論體系能夠應(yīng)用到類似的控制器參數(shù)調(diào)節(jié)問題,具有廣泛應(yīng)用前景。為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖及實(shí)施例,對本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。下面將以某導(dǎo)彈的程序發(fā)射階段為例,按所提出的設(shè)計(jì)方法逐步設(shè)計(jì)導(dǎo)彈PID控制器參數(shù)大循環(huán)迭代學(xué)習(xí)控制系統(tǒng),并通過仿真實(shí)驗(yàn)驗(yàn)證所提出方法的正確性和有效性。一、導(dǎo)彈三通道PID控制系統(tǒng)設(shè)計(jì)(1)俯仰通道PID控制器設(shè)計(jì)俯仰通道采取攻角PID控制,即(α,ωz)控制,其結(jié)構(gòu)如圖3所示,對應(yīng)的控制器的形式為:UF=kp1(α-αc)+kd1ωz+ki1∫(α-αc)dt(16)其中:kp1、ki1、kd1分別為PID控制器參數(shù);α為導(dǎo)彈實(shí)際攻角,αc為攻角指令信號,ωz為導(dǎo)彈俯仰角速度;UF為導(dǎo)彈俯仰通道控制輸入量。(2)俯仰通道PID控制器設(shè)計(jì)偏航通道控制根據(jù)糾偏方式的不同有兩種不同的選擇:一種是使用側(cè)滑角進(jìn)行轉(zhuǎn)彎(STT),此時可以直接對側(cè)滑角進(jìn)行控制,同時控制滾轉(zhuǎn)通道保持零位;另一種情況是使用滾轉(zhuǎn)通道進(jìn)行轉(zhuǎn)彎(BTT),此時需要直接對滾轉(zhuǎn)角進(jìn)行控制,同時控制側(cè)滑角為零。這里通過直接對側(cè)滑角進(jìn)行控制實(shí)現(xiàn)轉(zhuǎn)彎,即(β,ωy)控制,其結(jié)構(gòu)如圖4所示,對應(yīng)的控制器形式為:UH=kp2(β-βc)+kd2ωy+ki2∫(β-βc)dt(17)其中:kp2、ki2、kd2為導(dǎo)彈偏航通道PID控制器參數(shù);β為導(dǎo)彈實(shí)際側(cè)滑角,βc為側(cè)滑角指令信號,ωy為導(dǎo)彈偏航角速度;UH為導(dǎo)彈偏航通道控制輸入量。(3)滾轉(zhuǎn)通道控制器設(shè)計(jì)由于采取STT的轉(zhuǎn)彎方式,滾轉(zhuǎn)通道只需將滾轉(zhuǎn)角穩(wěn)定在零即可,這里通過角速度反饋來實(shí)現(xiàn),設(shè)計(jì)控制器形式為:UG=kd3ωx(18)其中:kd3為角速度反饋系數(shù);ωx為導(dǎo)彈偏航角速度;UG為導(dǎo)彈滾轉(zhuǎn)通道控制輸入量。由此可得需要調(diào)整的PID控制器參數(shù)為kp1、kd1、ki1、kp2、kd2、ki2。二、導(dǎo)彈程序飛行彈道設(shè)計(jì)及特征點(diǎn)提取本發(fā)明利用虛擬目標(biāo)比例導(dǎo)引技術(shù)對程序飛行彈道進(jìn)行設(shè)計(jì),這里以導(dǎo)彈縱向平面為例設(shè)計(jì)彈道,給出指令生成算法。導(dǎo)彈與目標(biāo)之間的相對運(yùn)動關(guān)系如圖5所示,假設(shè)所設(shè)計(jì)虛擬目標(biāo)的速度為VT,速度傾角為θT,平面坐標(biāo)為(xT,yT);導(dǎo)彈速度為VM,速度傾角為θM,平面坐標(biāo)為(xM,yM);彈-目相對距離為R。則導(dǎo)彈與目標(biāo)之間的相對視線角q的變化率為其中:由此可得導(dǎo)彈期望的彈道傾角θc的變化率為進(jìn)一步可得期望的過載指令信號nyc為在得到過載指令后,可參考現(xiàn)有文獻(xiàn)中的方法構(gòu)建一個二階濾波器對過載指令進(jìn)行濾波得到攻角指令(張友安等,空空導(dǎo)彈控制系統(tǒng)魯棒動態(tài)逆設(shè)計(jì)[J],系統(tǒng)工程與電子技術(shù),2004年第8期),由此可得控制器所要求的指令信號。根據(jù)所設(shè)計(jì)的PID控制器參數(shù)大循環(huán)迭代學(xué)習(xí)方案,控制器參數(shù)在整個彈道上的初值要通過對特征點(diǎn)處的線性模型進(jìn)行粗調(diào),并將粗調(diào)得到的控制器參數(shù)依時間進(jìn)行線性插值得到,因此要針對所設(shè)計(jì)的彈道選取具有代表性的彈道點(diǎn)作為特征點(diǎn)。這里以縱向平面為例,給出具體的彈道設(shè)計(jì)過程及特征點(diǎn)選取方法。設(shè)定導(dǎo)彈從原點(diǎn)發(fā)射,發(fā)射后一直保持爬升,在50s左右轉(zhuǎn)向15000平飛,并保持飛行至100s。所設(shè)計(jì)虛擬目標(biāo)在縱向平面內(nèi)的飛行坐標(biāo)(xm,ym)可表示為xm=17000+400×t(22)ym=15000上式意味著虛擬目標(biāo)在15000m的高空,從橫坐標(biāo)為17000m處開始以VT=400m/s的速度作勻速直線運(yùn)動。設(shè)定導(dǎo)彈初始發(fā)射速度為50m/s,速度傾角為15°,發(fā)射后以145m/s2的加速度保持加速,速度達(dá)到750m/s后保持勻速運(yùn)動,按導(dǎo)引律(8)進(jìn)行質(zhì)點(diǎn)仿真可得到理想的程序飛行彈道如圖6所示。導(dǎo)彈在飛行過程中的氣動參數(shù)主要取決于導(dǎo)彈所處的高度和速度,這里根據(jù)彈道的實(shí)際情況選取了四個特征點(diǎn),對應(yīng)的時刻分別為t1=15s、t2=25s、t3=40s和t4=70s,相應(yīng)的縱向平面坐標(biāo)分別為(8606.4,2988.3)、(14479.2,7381.8)、(24336.2,12543.1)和(46916.2,15001.5),坐標(biāo)單位為米。前三個特征點(diǎn)反映了導(dǎo)彈爬升階段的氣動特征,第四個特征點(diǎn)反映了導(dǎo)彈平飛階段的氣動特征。在得到如圖6所示的特征點(diǎn)后,為獲得PID控制器參數(shù)的初值,首先需要得到各個特征點(diǎn)處能夠使系統(tǒng)基本穩(wěn)定的PID控制器參數(shù)。比較常用的一種方法是特征點(diǎn)仿真法,采用這種方法時需要對特征點(diǎn)處對應(yīng)的數(shù)學(xué)模型進(jìn)行線性化和參數(shù)固化,并針對這種線性模型通過仿真調(diào)試得到其控制器參數(shù),針對這里的具體情況,其線性模型可表示為:通過獲取不同特征點(diǎn)處對應(yīng)的氣動參數(shù),按式(23)所示的方程構(gòu)建仿真模型,采用式(16)所示的PID控制器,通過粗調(diào)可以得到各特征點(diǎn)處能夠使系統(tǒng)基本穩(wěn)定的控制器參數(shù),通過對各特征點(diǎn)處對應(yīng)的PID控制器參數(shù)按時間軸進(jìn)行插值就可以得到整個彈道上能夠使導(dǎo)彈系統(tǒng)基本穩(wěn)定的控制器參數(shù),從而可將此控制器參數(shù)作為后面全彈道仿真中PID控制器參數(shù)的初值使用,實(shí)現(xiàn)對迭代學(xué)習(xí)控制系統(tǒng)的初始化。這里的特征點(diǎn)仿真方法與傳統(tǒng)方法不同之處在于這里只需要通過粗調(diào)得到能夠使系統(tǒng)基本穩(wěn)定的參數(shù)即可,不需要實(shí)現(xiàn)精確控制,工作量相對而言會小很多。由于這種方法是工程上常用的方法,這里就不再對其原理進(jìn)行演示了。需要特別指出的是,在后面的全彈道仿真試驗(yàn)中會發(fā)現(xiàn),在對實(shí)際模型進(jìn)行控制時,可能不一定需要進(jìn)行特征點(diǎn)仿真,只需簡單調(diào)試就能獲得使系統(tǒng)基本穩(wěn)定的PID控制器參數(shù),這組參數(shù)也能作為迭代學(xué)習(xí)控制系統(tǒng)的初值使用,只是其跟蹤誤差會比較大,但這也很好的檢驗(yàn)了所設(shè)計(jì)大循環(huán)迭代學(xué)習(xí)控制系統(tǒng)的調(diào)節(jié)能力。只有在通過簡單調(diào)試不能得到期望的PID控制器參數(shù)時,才需要采用這里提到的特征點(diǎn)仿真法進(jìn)行初始化。對于側(cè)向通道而言,由于采用的是側(cè)滑角控制,其數(shù)學(xué)模型與縱向通道基本一致,因此可以采用與縱向通道相同的方法獲取指令信號并選取特征點(diǎn)。三、導(dǎo)彈自適應(yīng)迭代學(xué)習(xí)控制系統(tǒng)數(shù)學(xué)模型建立本部分的目的是為了得到適用于迭代學(xué)習(xí)控制系統(tǒng)設(shè)計(jì)的數(shù)學(xué)模型,具體的建模過程已經(jīng)在發(fā)明內(nèi)容的第二部分中給出,這里就不再重復(fù)了,其數(shù)學(xué)模型為:四、導(dǎo)彈PID控制器參數(shù)自適應(yīng)迭代學(xué)習(xí)控制系統(tǒng)設(shè)計(jì)由于考慮的是系統(tǒng)(24)的迭代學(xué)習(xí)控制問題,因此,這里的研究對象應(yīng)該是在有限時間t∈[0,T]上可重復(fù)運(yùn)行的系統(tǒng),它可表示為其中k為迭代次數(shù)標(biāo)記。基本假設(shè)1-假設(shè)3及控制目標(biāo)已經(jīng)在發(fā)明內(nèi)容的第二部分中給出,這里也不再贅述了,下面將直接開始對自適應(yīng)迭代學(xué)習(xí)控制系統(tǒng)進(jìn)行設(shè)計(jì)。Step1:考察(25)式的第一個子系統(tǒng),定義誤差狀態(tài)量其中α1,k(t)為虛擬控制量,則第一個子系統(tǒng)的誤差狀態(tài)方程為設(shè)計(jì)虛擬控制量為α1,k(t)=-k1e1,k(t)(28)其中為設(shè)計(jì)控制器參數(shù),γ>0為未知常量。選取Lyapunov-like函數(shù)為對第k次迭代和第k-1次迭代的Lyapunov-like函數(shù)取差分可得由假設(shè)1可知e1,k(0)=0,考慮誤差方程(27),利用假設(shè)2可得由于f1(·)連續(xù)可導(dǎo),它必然也Lipschitz連續(xù)的,則對任意的t∈[0,T]和x1,k,x1d∈R,存在未知常量M1>0,使得|f1(x1,k,t)-f1(x1d,t)|≤M1|x1,k-x1d|(32)考慮到這一性質(zhì),將所設(shè)計(jì)的虛擬控制量(28)代入(31)式可得Step2:考察(25)式的第二個子系統(tǒng),其誤差狀態(tài)方程為設(shè)計(jì)自適應(yīng)PID迭代學(xué)習(xí)控制器為其中,為第k次迭代時的PID控制器參數(shù),它們分別是對最優(yōu)控制器參數(shù)的估計(jì)值,其具體定義將在后面的推導(dǎo)中給出??刂破鲄?shù)的自適應(yīng)迭代學(xué)習(xí)律設(shè)計(jì)如下:其中:β1,β2,β3>0為設(shè)計(jì)自適應(yīng)參數(shù);kp0(t),ki0(t),kd0(t)為所設(shè)定的PID控制器參數(shù)初值,可以采用前面提到的特征點(diǎn)仿真和插值的方法得到,它們均為有界量。選取Lyapunov-like函數(shù)為其中和為控制器參數(shù)估計(jì)誤差。對第k次迭代和第k-1次迭代的Lyapunov-like函數(shù)取差分可得下面分別對式(40)中各項(xiàng)進(jìn)行考察,第二項(xiàng)可展開為由于f2(·)是連續(xù)可導(dǎo)的,它必然也是Lipschitz連續(xù)的,對任意的t∈[0,T]和x1,k,x1d,x2,k,x2d∈R,存在未知常量M2>0,使得|f2(x1,k,x2,k,t)-f2(x1d,x2d,t)|≤M2(|x1,k-x1d|+|x2,k-x2d|)(42)考慮到三角不等式|a+b|≤|a|+|b|,并將(28)式代入可得|f2(x1,k,x2,k,t)-f2(x1d,x2d,t)|≤M2|x1,k-x1d|+(M2|x2,k-x2d|-M2\α1,k|)+M2|α1,k|≤(1+k1)M2|e1,k(t)|+M2|e2,k(t)|(43)另一方面,考慮到則將(43)和(44)式代入(41)式并對不等式右側(cè)進(jìn)行放大可得其中,γ>0為未知常量。利用關(guān)系式(a-b)2-(a-c)2=(c-b)(2(a-b)+(b-c)),(40)式的剩余各項(xiàng)可分別展開為其中為第k次和第次迭代時PID控制器參數(shù)估計(jì)值的偏差。將(33)式及(45)-(48)式一并代入(40)式可得將所設(shè)計(jì)的控制器(35)和自適應(yīng)迭代學(xué)習(xí)律(36)-(38)代入(49)式,同時考慮到關(guān)系式(10),經(jīng)整理可得其中:且五、導(dǎo)彈PID控制器參數(shù)大循環(huán)自適應(yīng)迭代學(xué)習(xí)控制系統(tǒng)穩(wěn)定性分析關(guān)于所設(shè)計(jì)控制系統(tǒng)的穩(wěn)定性定理已在發(fā)明內(nèi)容的第二部分中給出,在通常的設(shè)計(jì)過程中,要通過穩(wěn)定性分析才能得到該定理,這里給出設(shè)計(jì)過程中所需開展的穩(wěn)定性證明過程如下:證明:先考察V2,k(T)的有界性,對(50)式取t=T,則上式表明,ΔV2,k(T)≤0,則V2,k(T)隨著迭代次數(shù)k的增加是非增的,只要V2,1(T)有界,就能保證V2,k(T)有界。因此,先考察V2,1(T)的有界性。對所設(shè)計(jì)的Lyapunov函數(shù)(39)式求導(dǎo),將所設(shè)計(jì)的控制器和自適應(yīng)律代入,并令迭代次數(shù)k=1可得對上式中的第三項(xiàng)進(jìn)行變換可得其中,0<χ1<1/2為某未知常量。同理,對于(57)式中的第四項(xiàng)和第五項(xiàng),必然也存在相應(yīng)的未知常量0<χ2,χ3<1/2,使得將(58)-(60)代入(57)式,并對該不等式右側(cè)進(jìn)行放大可得由發(fā)明內(nèi)容部分中的注5可知期望的控制器參數(shù)在[0,T]上連續(xù)可導(dǎo),所設(shè)定的控制器參數(shù)初值kp0(t),ki0(t),kd0(t)也有界,因此必然存在未知常量εP,εI,εD>0,使得對任意的t∈[0,T],有于是,(61)式可進(jìn)一步轉(zhuǎn)化為對上式兩端在[0,T]取積分可得由假設(shè)1可知,V2,1(0)=0,則(63)式表明V2,1(T)有界,從而V2,k(T)對任意的k∈Z+有界。下面考察V2,k(t)對任意t∈[0,T]和k∈Z+的有界性。定義兩個新的Lyapunov-like函數(shù)為顯然,所定義的Lyapunov函數(shù)滿足前面已經(jīng)證明V2,k(T)有界,則和也是有界的。特別的,對于而言,存在使得則對上式取k=k-1,則另一方面,對(50)式右側(cè)進(jìn)行放大可得合并(68)和(69)式可得(70)式表明V2,k(t)對任意的k∈Z+和t∈[0,T]有界,根據(jù)Lpe-范數(shù)的定義知ei,k(t)∈L∞e,i=1,2,KP,k(t),KI,k(t),KD,k(t)∈L2e。由uk(t)的表達(dá)式可知,uk(t)∈L∞e。至此定理1的結(jié)論(1)得證,下面將證明結(jié)論(2)。在迭代軸上重復(fù)利用式(56)可得對式(71)進(jìn)行等效變換,進(jìn)一步得由前面的推導(dǎo)知,V2,1(T)和V2,k(T)對任意的k∈Z+有界,令k→+∞,式(72)表明無窮級數(shù)和有界,利用無窮級數(shù)的性質(zhì),則且由此定理得證。由于函數(shù)h1(·,·)在定義域內(nèi)是連續(xù)可導(dǎo)的,它必然也是Lipschitz連續(xù)的,則對于任意的x1,k,x1d∈R和t∈[0,T],存在未知常量ρh>0,使得|y1,k(t)-y1d(t)|=|h1(x1,k,t)-h1(x1d,t)|≤ρh|x1,k-x1d|=ρh|e1,k|(73)因此由定理1的結(jié)論2可知這意味著對于任意的小量存在某個k*∈Z+,使得當(dāng)k>k*時,下式成立:因此,存在某個k*∈Z+,使得當(dāng)k>k*時,有從而控制目標(biāo)將會實(shí)現(xiàn)。注8:偏航通道的數(shù)學(xué)模型與俯仰通道完全相同,可以采取完全相同的自適應(yīng)迭代學(xué)習(xí)律和穩(wěn)定性分析方法,不再贅述。六、全彈道仿真試驗(yàn)驗(yàn)證根據(jù)第二部分所設(shè)計(jì)的程序彈道,通過全彈道仿真對所提出導(dǎo)彈PID控制器參數(shù)大循環(huán)迭代學(xué)習(xí)方案的正確性進(jìn)行了驗(yàn)證。限于篇幅,這里只給出了俯仰通道的仿真結(jié)果。設(shè)定導(dǎo)彈在縱向平面內(nèi)從初始坐標(biāo)(0,1)以50m/s的初速度發(fā)射,初始發(fā)射角度為15度,導(dǎo)彈飛行時間100s。導(dǎo)彈期望彈道及期望的攻角指令信號由第二部分給出的設(shè)計(jì)方法獲得。設(shè)計(jì)控制器參數(shù)k1=10,PID控制器參數(shù)自適應(yīng)參數(shù)迭代學(xué)習(xí)律(13)-(15)的調(diào)節(jié)參數(shù)分別為β1=0.1、β2=0.002和β3=0.004。根據(jù)設(shè)計(jì)方案,PID控制器參數(shù)的初始值應(yīng)當(dāng)通過特征點(diǎn)仿真獲取,但在這里為簡便起見,這里直接設(shè)定控制器初值為采用上面這組參數(shù)對控制器進(jìn)行調(diào)試,可以發(fā)現(xiàn)這組PID控制器參數(shù)基本能夠使導(dǎo)彈系統(tǒng)穩(wěn)定,只是在跟蹤期望指令信號時,存在較大的跟蹤誤差。實(shí)際上,通過對特征點(diǎn)仿真技術(shù)進(jìn)行粗調(diào),必然能夠獲得性能更好的控制器參數(shù),以這樣的控制器參數(shù)作為迭代學(xué)習(xí)控制系統(tǒng)的初值,PID控制器參數(shù)必將以更快的速度完成參數(shù)尋優(yōu)。這里將通過簡單試湊得到的常值作為PID控制器參數(shù)的初值,實(shí)際上是放寬了對迭代學(xué)習(xí)控制系統(tǒng)初值的要求。根據(jù)所設(shè)計(jì)的PID控制器(12)式,在調(diào)整過程中實(shí)際的PID控制器的參數(shù)初值為設(shè)定全彈道程序在有限時間[0,100s]上迭代運(yùn)行3500次,仿真結(jié)果如圖7-圖9所示。圖7和圖8為誤差積分量和隨迭代次數(shù)變化情況,可見隨著迭代的進(jìn)行,誤差積分量逐漸減小,當(dāng)?shù)M(jìn)行到三千多次時,誤差積分量收斂到零,這意味著系統(tǒng)狀態(tài)量已經(jīng)實(shí)現(xiàn)了對期望指令信號的完全跟蹤,這與定理1的結(jié)論2完全吻合。本發(fā)明所提出設(shè)計(jì)方案的最終目的是為了實(shí)現(xiàn)導(dǎo)彈對期望彈道的完全跟蹤,圖9為不同迭代次數(shù)導(dǎo)彈對期望彈道的跟蹤情況,可見在使用簡單調(diào)試獲得的控制器參數(shù)時,導(dǎo)彈對期望彈道的跟蹤誤差達(dá)上千米,誤差較大,隨著控制器參數(shù)的不斷調(diào)整,導(dǎo)彈對期望彈道的跟蹤誤差越來越小,最終實(shí)現(xiàn)了對期望彈道的完全跟蹤,可見控制目標(biāo)已經(jīng)完全實(shí)現(xiàn)。在整個設(shè)計(jì)過程中,只對四個參數(shù)進(jìn)行了簡單的調(diào)試,控制器參數(shù)的初始值也是通過粗調(diào)獲得的,仿真工作量相對傳統(tǒng)的PID控制器設(shè)計(jì)而言大幅減小,而且最終得到的PID控制器參數(shù)能夠?qū)崿F(xiàn)對期望軌跡的完全跟蹤,性能比傳統(tǒng)調(diào)試得到的控制器參數(shù)而言有很大改進(jìn),所做的全彈道仿真試驗(yàn)充分說明了本發(fā)明為導(dǎo)彈PID控制器設(shè)計(jì)技術(shù)所帶來的革新。相比于現(xiàn)有技術(shù)的缺點(diǎn)和不足,本發(fā)明具有以下有益效果:(1)所設(shè)計(jì)的自適應(yīng)迭代學(xué)習(xí)律結(jié)構(gòu)簡單,易于實(shí)現(xiàn);(2)所提出的方案不依賴于系統(tǒng)的精確模型;(3)設(shè)計(jì)過程中需要人為調(diào)試的參數(shù)較少,工作量小;(4)最終得到的控制器參數(shù)是連續(xù)的時變參數(shù),且能夠?qū)崿F(xiàn)對期望軌跡的完全跟蹤,具有良好的動態(tài)和穩(wěn)態(tài)性能;(5)所提出的方案具有完整的數(shù)學(xué)模型和穩(wěn)定性證明,理論體系完善;(6)所提出的方案可推廣到其它非線性控制系統(tǒng)。以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換和改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。