專利名稱:非線性時變自適應控制器及其控制方法
技術(shù)領域:
本發(fā)明涉及各行業(yè)中被控對象或生產(chǎn)過程的控制技術(shù),具體涉及自適應高精度控制復雜系統(tǒng)的一種非線性時變自適應控制器及其控制方法。
背景技術(shù):
各行業(yè)的被控對象日益復雜,常用的控制裝置和方法雖然有效,但在不斷增長的高精度的要求下,越來越顯得不能滿足人們需求。
目前廣泛使用的比例-積分-微分(PID)控制器能夠為線性時不變的單輸入/單輸出系統(tǒng)提供令人滿意的控制效果。但對于多輸入/多輸出的復雜系統(tǒng)、或不能完全線性化、或被控系統(tǒng)中存在非線性干擾或擾動、或被控對象參數(shù)隨時間變化的情況,采用PID控制器,其控制效果就會受到極大的影響或根本不能適用。
其他先進的控制技術(shù)(例如預測控制、魯棒控制、最優(yōu)控制和自適應控制)都是為了解決上述問題而發(fā)展出來的。但所有這些控制技術(shù)的控制效果都極大地依賴于被控對象的動力學模型和線性化程度。由于在實際應用中,所有被控對象或多或少存在非線性和不確定性,所以對實際控制性能也存在著影響。而且,這些技術(shù)理論復雜,算法實施的成本和代價也相當大。
專家系統(tǒng)、模糊控制等智能控制策略在一定的應用范圍內(nèi)實現(xiàn)了多變量、非線性系統(tǒng)的控制,但其控制效果極大地依賴于專家的經(jīng)驗,其控制精度受到專家的知識和各種設計因素的限制。
人工神經(jīng)網(wǎng)絡以其獨特的非線性適應能力、自適應、糾錯和泛化能力不斷地被人們嘗試地廣泛應用于包括控制領域在內(nèi)的眾多領域中,并取得了可喜的成果。與其它一般方法不同,人工神經(jīng)網(wǎng)絡的控制參數(shù),不是通過計算獲得的,往往是通過計算樣本對,經(jīng)過成千、甚至上萬次的反復訓練得到組成所設計的網(wǎng)絡權(quán)值。正是因為如此,除了那些用于自適應分類、采用非監(jiān)督式學習工作方式的網(wǎng)絡外,一般用于控制領域中的網(wǎng)絡設計都是采用監(jiān)督式的學習方式,經(jīng)過離線的權(quán)值訓練,然后再將網(wǎng)絡加入到實際系統(tǒng)中進行工作,并依靠網(wǎng)絡自身的泛化能力來適應被控系統(tǒng)的環(huán)境及其參數(shù)的變化。但是,當系統(tǒng)的參數(shù)或環(huán)境所受的干擾或擾動量使其變化超出了一定的范圍,就有可能使得神經(jīng)網(wǎng)絡的功能下降甚至作用失效。為了避免網(wǎng)絡失效,保持網(wǎng)絡功能的有效性,人們己想出不少改進方案,主要的思想為在網(wǎng)絡工作的同時,采用輔助手段,對工作中受環(huán)境或系統(tǒng)參數(shù)變化的系統(tǒng)連續(xù)不斷地獲取新的數(shù)據(jù),然后并行地對網(wǎng)絡權(quán)值進行訓練,并固定在一定的時間間隔內(nèi)對網(wǎng)絡權(quán)值進行修正,以達到滿足變化的需要。這一方案是可行的,在一定情況下是有效的,不過它只適用于系統(tǒng)變量變化較慢的過程控制。當被控系統(tǒng)被控變量變化較快時,現(xiàn)有的包括改進的神經(jīng)網(wǎng)絡控制器及其控制策略就不能滿足系統(tǒng)的要求。另外,神經(jīng)網(wǎng)絡控制器的不透明性以及網(wǎng)絡結(jié)構(gòu)的復雜性和控制效果的泛化能力至今沒有得到很好的解決。
為此,目前對于能夠簡單且有效地用以控制各種復雜系統(tǒng)的控制器的要求仍然存在,這種控制器應當既具有神經(jīng)網(wǎng)絡自學習和自適應的能力又能夠?qū)崟r在線地進行控制器本身參數(shù)的修正與調(diào)節(jié),以處理系統(tǒng)中所存在的不確定因素和變化。并且這種控制裝置應該只依賴于系統(tǒng)特性的閉環(huán)實時輸入/輸出,可以不需要被控系統(tǒng)精確的數(shù)字模型。
發(fā)明內(nèi)容
技術(shù)問題本發(fā)明的目的是提供一種非線性時變自適應控制器及其控制方法,該控制器是由一種帶有局部連接遞歸的神經(jīng)網(wǎng)絡組成,其結(jié)構(gòu)簡單、網(wǎng)絡參數(shù)物理意義明確,設計方法方便,能夠根據(jù)每一時刻閉環(huán)系統(tǒng)誤差性能指標進行網(wǎng)絡權(quán)值實時在線調(diào)整,并對被控對象提供非線性、自適應控制的實時在線控制。
技術(shù)方案本發(fā)明的技術(shù)解決方案如下本發(fā)明的非線性時變自適應控制器,包括輸入端、輸出端和控制單元,其特征在于控制單元的結(jié)構(gòu)為帶有局部連接遞歸的神經(jīng)網(wǎng)絡;所述神經(jīng)網(wǎng)絡由輸入層、隱含層和輸出層組成,其中輸入層具有s個神經(jīng)元輸入節(jié)點,該節(jié)點數(shù)s為被控對象的可測輸出變量數(shù);隱含層具有最多3個神經(jīng)元節(jié)點,分別為積分節(jié)點、微分節(jié)點和比例節(jié)點;輸出層具有單個神經(jīng)元節(jié)點;隱含層和輸出層的激活函數(shù)都是線性函數(shù);神經(jīng)網(wǎng)絡輸入層各節(jié)點與隱含層各節(jié)點之間為相互全連接,各節(jié)點之間通過隱含層網(wǎng)絡連接權(quán)值wij作用,并且在隱含層分別進行加權(quán)求和后,作為積分節(jié)點的加權(quán)求和節(jié)點、比例節(jié)點的加權(quán)求和節(jié)點、微分節(jié)點的加權(quán)求和節(jié)點;積分節(jié)點的加權(quán)求和節(jié)點和積分節(jié)點之間、比例節(jié)點的加權(quán)求和節(jié)點和比例節(jié)點之間、微分節(jié)點的加權(quán)求和節(jié)點和微分節(jié)點之間通過激活函數(shù)相連;隱含層的積分節(jié)點、微分節(jié)點形成自遞歸回路;輸出層網(wǎng)絡連接權(quán)值wi,通過輸出層的激活函數(shù),與輸出層的神經(jīng)元節(jié)點相連;輸入層的各神經(jīng)元節(jié)點還作為網(wǎng)絡控制器的輸入端與被控對象輸出變量Y(k)反饋后的比較器相連接,輸出層的神經(jīng)元節(jié)點還作為網(wǎng)絡控制器的輸出端與被控對象的輸入端相連接。
所述神經(jīng)元輸入節(jié)點ej為具有負反饋的閉環(huán)控制系統(tǒng)的誤差信號;在隱含層存在部分自遞歸回路,其中隱含層的積分節(jié)點a1具有輸出反饋,它通過將該節(jié)點的輸出,進行單位延時反饋到該節(jié)點的積分節(jié)點的加權(quán)求和節(jié)點n1實現(xiàn)的,該積分節(jié)點a1a1(k)=Σj=1sw1j(k)ej(k)+a1(k-1);]]>隱含層的微分節(jié)點a3帶有激活反饋,它是通過將該節(jié)點的微分節(jié)點的加權(quán)求和節(jié)點n3的輸出,進行負單位延時再反饋到該微分節(jié)點的加權(quán)求和節(jié)點n3的輸入實現(xiàn)的,該微分節(jié)點a3a3(k)=Σj=1sw3j(k)ej(k)-Σj=1sw3j(k-1)ej(k-1);]]>而隱含層的比例節(jié)點a2為不帶有任何反饋的常規(guī)節(jié)點,其比例節(jié)點a2a2(k)=Σj=1sw2j(k)ej(k);]]>輸出層神經(jīng)元節(jié)點的最終輸出變量為uu(k)=Σi=13wi(k)ai(k).]]>所述神經(jīng)網(wǎng)絡隱含層的網(wǎng)絡連接權(quán)值wij初始值為根據(jù)常規(guī)的控制方法對被控對象所設計一組使系統(tǒng)穩(wěn)定的線性控制器參數(shù),如,比例控制器參數(shù)、微分控制器參數(shù)、積分控制器參數(shù);而輸出層網(wǎng)絡連接權(quán)值wi的初始值全部取1。
所述神經(jīng)網(wǎng)絡在每一個采樣周期里計算網(wǎng)絡連接權(quán)值修正公式中的各個學習速率的選取原則是使系統(tǒng)穩(wěn)定,其最佳取值范圍為10-3~10-4之間。
首先,在最初采樣周期里,在所述控制器中確定網(wǎng)絡連接權(quán)值初始值作為該采樣周期里的網(wǎng)絡連接權(quán)值,即所述神經(jīng)網(wǎng)絡隱含層的網(wǎng)絡連接權(quán)值wij初始值為根據(jù)常規(guī)的控制方法對被控對象所設計的一組使系統(tǒng)穩(wěn)定的線性控制器參數(shù),如,比例控制器參數(shù)、微分控制器參數(shù)、積分控制器參數(shù);而輸出層網(wǎng)絡連接權(quán)值wi的初始值全部取1;然后,網(wǎng)絡輸入層直接讀取具有負反饋的閉環(huán)控制系統(tǒng)的誤差信號并傳輸?shù)诫[含層中;網(wǎng)絡隱含層根據(jù)該誤差信號與該采樣周期里的網(wǎng)絡連接權(quán)值,根據(jù)積分節(jié)點a1a1(k)=Σj=1sw1j(k)ej(k)+a1(k-1);]]>比例節(jié)點a2a2(k)=Σj=1sw2j(k)ej(k);]]>微分節(jié)點a3a3(k)=Σj=1sw3j(k)ej(k)-Σj=1sw3j(k-1)ej(k-1),]]>計算隱含層積分節(jié)點(a1)、比例節(jié)點a2、微分節(jié)點(a3)的數(shù)值;同時,在10-3~10-4之間選定一組學習速率ηi和ηij的數(shù)值,并根據(jù)網(wǎng)絡輸入的誤差信號,每一個采樣周期里,計算輸出層網(wǎng)絡連接權(quán)值wiwi(k+1)=wi(k)+ηi·2·Σj=1s{ej(k)·sgnΔyj(k)Δu(k)}ai(k),]]>以及隱含層網(wǎng)絡連接權(quán)值wij:wij(k+1)=wij(k)+2ηijΣj=1s{ej(k)·sgnΔyj(k)Δu(k)}wi(k)·ej(k),]]>并將其作為下一個采樣周期的網(wǎng)絡連接權(quán)值儲存起來;最后,網(wǎng)絡輸出層根據(jù)隱含層所計算出的各節(jié)點的數(shù)值及已有的該采樣周期里的網(wǎng)絡連接權(quán)值wi,根據(jù)uu(k)=Σi=13wi(k)ai(k),]]>計算網(wǎng)絡最終輸出變量u,并作為控制量對被控對象進行控制;在以后的采樣周期里,重復以上過程,即可完成實現(xiàn)對被控對象實時在線的控制。
具體的說,本發(fā)明的第一個方面是局部連接遞歸神經(jīng)網(wǎng)絡控制器的設計,本發(fā)明的第二個方面是通過該控制器對被控對象實現(xiàn)自適應控制的實時在線控制策略。
有益效果本發(fā)明的優(yōu)點和積極效果是1)控制器結(jié)構(gòu)簡單。網(wǎng)絡結(jié)構(gòu)為含有一個隱含層的局部連接遞歸神經(jīng)網(wǎng)絡,并且網(wǎng)絡隱含層中的神經(jīng)元節(jié)點數(shù)最多只有3個,對任意被控制對象,根據(jù)具體要求的系統(tǒng)輸出變量來確定網(wǎng)絡結(jié)構(gòu)。作為控制器,網(wǎng)絡輸出只有一個——控制量。
2)網(wǎng)絡參數(shù)容易確定。對網(wǎng)絡連接權(quán)值的設計過程要求不高,僅要求用常規(guī)的PID控制器設計出的一組使系統(tǒng)穩(wěn)定的控制器參數(shù)作為本控制策略中神經(jīng)網(wǎng)絡連接權(quán)值的初始值。
3)網(wǎng)絡設計對被控對象的要求簡單。網(wǎng)絡的設計只要求利用被控變量,即網(wǎng)絡輸入只是利用被控對象的可測輸出變量,只采用由系統(tǒng)本身所已有傳感器測量到的狀態(tài)量;對被控對象模型無其他要求。
4)網(wǎng)絡設計簡單、控制策略容易實現(xiàn)。除了網(wǎng)絡連接權(quán)值的初始值以外,網(wǎng)絡的其他參數(shù)就只有計算網(wǎng)絡連接權(quán)值修正公式中的各個學習速率的值。它們的選取原則是只要使系統(tǒng)穩(wěn)定即可,我們給出了最佳的取值范圍為10-3~10-4之間。網(wǎng)絡連接權(quán)值的修正方式是和一般控制器設計中的參數(shù)根據(jù)控制律在每個采樣周期內(nèi)通過新獲得的部分參數(shù)計算出來的一樣,進行實時在線的修正,不需要進行一般神經(jīng)網(wǎng)絡連接權(quán)值修正的離線訓練過程。
采用人工神經(jīng)網(wǎng)絡進行實時控制的思想新。作為控制器的神經(jīng)網(wǎng)絡,它的連接權(quán)值修正方式是和一般控制器設計中的參數(shù)根據(jù)控制律在每個采樣周期內(nèi)通過新獲得的部分參數(shù)計算出來的一樣,進行實時在線的修正,這種將自動控制的思想用于人工神經(jīng)網(wǎng)絡連接權(quán)值修正中是人工神經(jīng)網(wǎng)絡的設計(訓練)及其工作中不存在的新概念。
5)通用的非線性自適應控制策略。采用神經(jīng)網(wǎng)絡來作為自動控制系統(tǒng)的一種控制方法,并使所發(fā)明的網(wǎng)絡同時具有的非線性、實時在線、自適應控制的特性,這是目前國內(nèi)外已有的線性控制策略(如PID,最優(yōu)控制,極點配置、自校正自適應等)所不具備的。也是目前所有的非線性控制器所不具備的。
6)所發(fā)明的網(wǎng)絡同時還是一個多輸入/單輸出的多變量控制器。為解決一大類多變量控制問題提供了簡單、實用有效的途徑。
本發(fā)明的神經(jīng)網(wǎng)絡控制器及其控制方法使網(wǎng)絡結(jié)構(gòu)的不透明性和網(wǎng)絡結(jié)構(gòu)的復雜性以及控制效果的泛化能力同時得到很好的解決。
按照一般人工神經(jīng)網(wǎng)絡觀點在一定的范圍內(nèi),網(wǎng)絡作用的效果是和網(wǎng)絡隱含層的節(jié)點數(shù)成正比的,而本網(wǎng)絡卻恰恰只使用了一般被認為是過少的3個隱含層節(jié)點。這一點一是得益于本網(wǎng)絡采用的是遞歸網(wǎng)絡,不是一般的前向網(wǎng)絡。另一點是因為本網(wǎng)絡結(jié)構(gòu)通過遞歸,構(gòu)造出了一個自動控制系統(tǒng)中最常用、通常對線性、定常、時不變系統(tǒng)也是最有效的PID控制器的類型。同時,由于采用的是實時在線的控制策略,是根據(jù)每一采樣周期所獲得的系統(tǒng)誤差,以及上一采樣周期的權(quán)值,計算下一采樣周期網(wǎng)絡權(quán)值及其控制量。以此方式所求得的控制量,由于控制律中的各個參數(shù)是隨時間變化的,加上采用的是遞歸網(wǎng)絡,所以網(wǎng)絡所表現(xiàn)出的控制效果是非線性、時變、自適應的控制。
本網(wǎng)絡控制策略的自適應性來自人工神經(jīng)網(wǎng)絡的優(yōu)點,但是一般神經(jīng)網(wǎng)絡只能離線學習,本控制策略卻做到在每一個采樣周期實時在線地調(diào)節(jié)網(wǎng)絡參數(shù),這是一般神經(jīng)網(wǎng)絡控制策略所做不到的。這一功能的實現(xiàn),滿足了控制系統(tǒng)實時控制的要求,是將人工神經(jīng)網(wǎng)絡與自動控制思想有效和有機的結(jié)合,這是本發(fā)明的最大創(chuàng)新之處。正是這一點的實現(xiàn),能夠保證被控系統(tǒng)的精度能夠不斷地被進一步地提高,以達到一般控制策略所達不到的期望效果。
圖1是采用本發(fā)明局部連接遞歸神經(jīng)網(wǎng)絡控制器的閉反饋控制系統(tǒng)方框圖;其中有網(wǎng)絡控制器1、被控對象2、比較器3;神經(jīng)元輸入節(jié)點e1,e2,…es;給定期望輸入R(k)、誤差E(k)、控制量U(k)、輸出變量Y(k);圖2是本發(fā)明中局部連接遞歸神經(jīng)網(wǎng)絡控制器的結(jié)構(gòu)圖;其中有積分節(jié)點a1、微分節(jié)點a3和比例節(jié)點a2;隱含層網(wǎng)絡連接權(quán)值wij、輸出層網(wǎng)絡連接權(quán)值為wi、隱含層和輸出層的激活函數(shù)f、單位延時z-1。
圖3是本發(fā)明網(wǎng)絡控制系統(tǒng)的另一種應用方式結(jié)構(gòu)圖;圖4a、圖4b是倒立擺系統(tǒng)實際控制結(jié)果圖。
具體實施方案以下結(jié)合附圖和實例,進一步說明本發(fā)明。
如附圖1所示,網(wǎng)絡控制器由s個輸入層神經(jīng)元節(jié)點ej(j=1,2,…s),1個輸出層神經(jīng)元節(jié)點u和3個隱含層神經(jīng)元節(jié)點組成;隱含層與輸出層的激活函數(shù)均為線性函數(shù),在隱含層存在部分自遞歸回路,其中,隱含層輸出的積分節(jié)點節(jié)點為a1的第一個神經(jīng)元節(jié)點具有輸出反饋(z-1表示單位延時);而隱含層輸出的積分節(jié)點節(jié)點為a3的第三個神經(jīng)元節(jié)點帶有激活反饋。
由附圖2所示網(wǎng)絡結(jié)構(gòu)圖,可得隱含層各節(jié)點在k時刻的輸出ai(k)(i=1,2,3)分別為a1(k)=f(n1)=Σj=1sw1j(k)ej(k)+a1(k-1)---(1)]]>a2(k)=f(n2)=Σj=1sw2j(k)ej(k)---(2)]]>a3(k)=f(n3)=Σj=1sw3j(k)ej(k)-Σj=1sw3j(k-1)ej(k-1)---(3)]]>網(wǎng)絡的最終輸出為u(k)=Σi=13wi(k)ai(k)---(4)]]>
由網(wǎng)絡結(jié)構(gòu)圖及其所得到的網(wǎng)絡輸入/輸出關系式可以看出由于帶有輸出反饋,隱含層第一個神經(jīng)元節(jié)點的輸入/輸出關系式(1)等價于a1(k)=Σj=1sw1j(k)ej(k)1-z-1,]]>呈現(xiàn)出積分特性,因而稱之為積分節(jié)點;而由于帶有激活反饋,隱含層第三個神經(jīng)元節(jié)點的輸入/輸出關系式(3)等價于a3(k)=[Σj=1sw3j(k)ej(k)](1-z-1),]]>呈現(xiàn)出微分特性,因而稱之為微分節(jié)點;隱含層第二個神經(jīng)元節(jié)點的輸入/輸出關系式(2)本身就呈現(xiàn)出比例特性,因而稱之為比例節(jié)點。所以,整個網(wǎng)絡在對輸入/輸出關系的調(diào)整上,表現(xiàn)出的是比例(第二個節(jié)點)+微分(第三節(jié)點)+積分(第一個節(jié)點)的特性。這種特性正是通常人們十分熟悉和常用的控制器,但一般只適用于線性、定常、時不變系統(tǒng)的應用,對于非線性、時變以及各類需要自適應控制的復雜系統(tǒng),此種控制器很難達到期望的性能,本發(fā)明則通過局部連接遞歸神經(jīng)網(wǎng)絡及其控制方法實現(xiàn)了這種愿望。
作為一般控制器的設計原則,我們的控制目標確定為使被控對象在網(wǎng)絡控制器作用后的閉環(huán)系統(tǒng)輸出與系統(tǒng)的給定期望輸入之間的誤差為最小。
設系統(tǒng)直接通過傳感器可測得的輸出變量為yj(k),j(j=1,2,…s)為可測輸出變量的數(shù)目;系統(tǒng)給定期望輸入為rj(k),j=1,2,…s,則對第j個輸出變量,其誤差函數(shù)定義為Jm(j)=Σj=1s{1mΣk=1m[rj-yj(k)]2}---(5)]]>其中,m≥1,為計算J(j)所使用的采樣總數(shù)。當m>1時,則每采樣m次后,記錄所有的r(k)、y(k),k=1,2,…,m,并根據(jù)(5)式計算出系統(tǒng)Jm(j),然后進行網(wǎng)絡權(quán)值的修正。特別地,當取m=1時,(5)式變?yōu)镴1(j)=Σj=1s[rj(k)-yj(k)]2---(6)]]>為用于每一個采樣周期后的誤差函數(shù)。
網(wǎng)絡權(quán)值的修正公式采用帶有彈性算法的梯度下降法,即根據(jù)誤差函數(shù)(6)分別對wi和wij求一階偏導數(shù),并同時采用變化率以及彈性算法中的符號法來處理其中的某些求導關系,由此可得網(wǎng)絡輸出層連接權(quán)值的修正公式為
wi(k+1)=wi(k)+ηi·2·Σj=1s{ej(k)·sgnΔyj(k)Δu(k)}ai(k)---(7)]]>wij(k+1)=wij(k)+2ηijΣj=1s{ej(k)·sgnΔyj(k)Δu(k)}wi(k)·ej(k)---(8)]]>其中,ej(k)=rj(k)-yj(k)。
網(wǎng)絡連接權(quán)值初始值的選取原則是在網(wǎng)絡權(quán)值初始值的運行之下,系統(tǒng)是穩(wěn)定的。根據(jù)這個原則可以有多種網(wǎng)絡權(quán)值初始值的選取方法。比如,只要采用任意常規(guī)線性控制器如PID、狀態(tài)反饋最優(yōu)控制器LQR等設計出一個穩(wěn)定控制器(控制精度可以不高),那么以此線性控制器的參數(shù),就可以作為該網(wǎng)絡隱含層權(quán)值的初始值?;蛘?,提取任意一組在某種穩(wěn)定控制器控制下的控制器的輸入/輸出數(shù)據(jù),用此組數(shù)據(jù)對網(wǎng)絡控制器進行適當?shù)膸浊Т蔚暮唵斡柧殻杂柧毥Y(jié)束后的網(wǎng)絡隱含層權(quán)值參數(shù)作為網(wǎng)絡連接權(quán)值的初始值。而網(wǎng)絡輸出層權(quán)值的初始值全部取1。由于網(wǎng)絡連接權(quán)值初始值能夠與常規(guī)線性控制器的參數(shù)相對應,具有明確的物理意義,因而所發(fā)明的網(wǎng)絡控制器在內(nèi)部結(jié)構(gòu)上具有很好的透明性。
網(wǎng)絡權(quán)值修正公式中的各個學習速率ηi和ηij的選取原則是使系統(tǒng)穩(wěn)定,其最佳取值范圍為10-3~10-4之間。
所發(fā)明的網(wǎng)絡控制器及其控制方法特別適用于以下情況1)被控系統(tǒng)中存在著不可建模的因素或非線性復雜模型的情況。
2)被控系統(tǒng)中存在不確定因素引起的參數(shù)變化和工作環(huán)境不斷變化的情況。
3)被控系統(tǒng)存在著不確定的干擾或擾動。
4)在已有的控制系統(tǒng)存在情況下,希望進一步提高系統(tǒng)的控制精度。
對于非線性復雜模型的情況下的應用,對被控系統(tǒng)進行線性(化)的模型建立,并通過最簡單的如PID控制器的設計,使控制系統(tǒng)可控。然后只要將PID參數(shù)作為網(wǎng)絡的初始值賦給網(wǎng)絡權(quán)值,用網(wǎng)絡代替PID控制器,讓控制系統(tǒng)運行起來,通過網(wǎng)絡的實時在線的控制,讓權(quán)值的在線調(diào)節(jié),來自適應被控系統(tǒng)的非線性因素和未建模因素的影響,達到不斷提高系統(tǒng)的跟蹤精度的目的。
對于第2和第3種情況,只要原系統(tǒng)存在正常情況下的控制參數(shù)能夠以某種形式給出,如PID或LQY、極點配置或常規(guī)控制方式,則可以將其用來作為網(wǎng)絡的初始參數(shù),將網(wǎng)絡直接作為控制器與被控過程串連,并組成反饋回路,按圖1形式實現(xiàn)控制系統(tǒng)結(jié)構(gòu)圖即可。
如果原系統(tǒng)已經(jīng)存在控制器,并且不希望替換原系統(tǒng)的控制器,此時可以將網(wǎng)絡作為一個單獨控制器與原控制器相并聯(lián),接成如圖3所示的結(jié)構(gòu)圖。
圖3同樣適用于上述4種情況。它的好處是不用改變原有系統(tǒng)的結(jié)構(gòu)體系,只是簡單地將網(wǎng)絡控制器并聯(lián)其中,即可達到對系統(tǒng)內(nèi)部參數(shù)變化以及外部各種干擾和擾動因素對被控過程所產(chǎn)生不利影響的消除作用,網(wǎng)絡通過每個采樣周期的實時在線的調(diào)節(jié)來消除誤差,保持系統(tǒng)穩(wěn)定,達到不斷提高控制精度的目的。
本發(fā)明的網(wǎng)絡控制器及其控制方法的具體設計步驟及其實時在線控制策略1)確定所要控制的被控對象的輸出變量的數(shù)目,并以此來確定網(wǎng)絡輸入節(jié)點的數(shù)目s;2)根據(jù)常規(guī)控制方法在被控系統(tǒng)上的一般控制情況,確定隱含節(jié)點是只采用一個、兩個或是三個;3)將常規(guī)控制方法所獲得的參數(shù)KP、KI或KD,或者通過實際運行一種穩(wěn)定控制器所獲得的一組控制器數(shù)據(jù),對網(wǎng)絡進行幾千次的訓練,來獲得網(wǎng)絡隱含層權(quán)值的初始值wij(0);網(wǎng)絡輸出層權(quán)值初始值wi(0)全部取1;4)在10-3~10-4之間選取學習速率的大小;5)將網(wǎng)絡與被控對象串聯(lián),并接成閉環(huán)系統(tǒng)如圖1所示;6)運行系統(tǒng),在每一個k采樣周期內(nèi)(1)讀取系統(tǒng)輸出變量yj(k);(2)計算所有變量的誤差值ej(k)=rj(k)-yj(k);(3)根據(jù)公式(1)、(2)和(3)分別計算網(wǎng)絡隱含層輸出a1(k)、a2(k)和a3(k);(4)根據(jù)公式(4)計算控制量u(k);(5)根據(jù)公式(7)和(8)分別計算wi(k+1)和wij(k+1);(6)k=k+1;(7)輸出控制量u(k);(8)返回到第6)步驟中的第(1)步,實現(xiàn)實時在線的重復運行。
本發(fā)明的實施例如下我們具體設計一個單級倒立擺的局部遞歸神經(jīng)網(wǎng)絡控制器。實驗裝置采用直線型單級倒立擺。眾所周知,它有兩個可測輸出變量小車位移x及倒立擺擺角θ。采用常規(guī)的線性二次狀態(tài)反饋控制器LQY可得被控倒立擺的被控變量有4個小車位移x及其速度 ,倒立擺擺桿擺角θ及其角速度 。通過最優(yōu)控制器的設計可得反饋矩陣K值為 倒立擺的控制目的是為了使擺桿的擺角保持在0°,小車位置也盡量保持平衡不動,即給定期望輸入R=
。此時實際上是在進行狀態(tài)調(diào)節(jié),即有ej=rj-yj=-yj,j=1,2y1=x,y2=θ根據(jù)已有的K值,網(wǎng)絡初始權(quán)值可選擇如下w11=0,w21=kx,w31=kx.]]>w12=0,w22=kθ,w32=kθ.]]>實際系統(tǒng)的控制結(jié)果如圖4所示。作為對比,我們同時將采用LQY最優(yōu)控制器的控制效果也同時給出,實驗中的網(wǎng)絡所有的學習速率η均取為0.001,采樣周期為0.01秒。圖4(a)為倒立擺系統(tǒng)擺桿角度控制效果,圖4(b)為倒立擺系統(tǒng)小車位置控制效果,其中實線為神經(jīng)網(wǎng)絡控制器的控制效果,虛線為LQY控制器的控制效果。從圖4當中可以看出,不論是在擺桿角度的控制還是小車位置的控制上,神經(jīng)網(wǎng)絡的控制效果與LQY的相比都不遜色,尤其是神經(jīng)網(wǎng)絡控制器在對小車位置的穩(wěn)態(tài)控制效果上還比LQY更加接近中心點,具有更高的控制精度。
權(quán)利要求
1.一種非線性時變自適應控制器,包括輸入端、輸出端和控制單元,其特征在于控制單元的結(jié)構(gòu)為帶有局部連接遞歸的神經(jīng)網(wǎng)絡;所述神經(jīng)網(wǎng)絡由輸入層、隱含層和輸出層組成,其中輸入層具有s個神經(jīng)元輸入節(jié)點(ej),該節(jié)點數(shù)s為被控對象的可測輸出變量數(shù);隱含層具有最多3個神經(jīng)元節(jié)點,分別為積分節(jié)點(a1)、微分節(jié)點(a3)和比例節(jié)點(a2);輸出層具有單個神經(jīng)元節(jié)點(u);隱含層和輸出層的激活函數(shù)(f)都是線性函數(shù);神經(jīng)網(wǎng)絡輸入層各節(jié)點與隱含層各節(jié)點之間為相互全連接,各節(jié)點之間通過隱含層網(wǎng)絡連接權(quán)值wij作用,并且在隱含層分別進行加權(quán)求和后,作為積分節(jié)點的加權(quán)求和節(jié)點(n1)、比例節(jié)點的加權(quán)求和節(jié)點(n2)、微分節(jié)點的加權(quán)求和節(jié)點(n3);積分節(jié)點的加權(quán)求和節(jié)點(n1)和積分節(jié)點(a1)之間、比例節(jié)點的加權(quán)求和節(jié)點(n2)和比例節(jié)點(a2)之間、微分節(jié)點的加權(quán)求和節(jié)點(n3)和微分節(jié)點(a3)之間通過激活函數(shù)(f)相連;隱含層的積分節(jié)點(a1)、微分節(jié)點(a3)形成自遞歸回路;輸出層網(wǎng)絡連接權(quán)值wi,通過輸出層的激活函數(shù)(f),與輸出層的神經(jīng)元節(jié)點(u)相連;輸入層的各神經(jīng)元節(jié)點還作為網(wǎng)絡控制器(1)的輸入端與被控對象輸出變量Y(k)反饋后的比較器(3)相連接,輸出層的神經(jīng)元節(jié)點(u)還作為網(wǎng)絡控制器(1)的輸出端與被控對象(2)的輸入端相連接。
2.根據(jù)權(quán)利要求1所述的非線性時變自適應控制器,其特征在于所述神經(jīng)元輸入節(jié)點(ej)為具有負反饋的閉環(huán)控制系統(tǒng)的誤差信號;在隱含層存在部分自遞歸回路,其中隱含層的積分節(jié)點(a1)具有輸出反饋,它通過將該節(jié)點的輸出,進行單位延時反饋到該節(jié)點的積分節(jié)點的加權(quán)求和節(jié)點(n1)實現(xiàn)的,該積分節(jié)點a1a1(k)=Σj=1sw1j(k)ej(k)+a1(k-1);]]>隱含層的微分節(jié)點(a3)帶有激活反饋,它是通過將該節(jié)點的微分節(jié)點的加權(quán)求和節(jié)點(n3)的輸出,進行負單位延時再反饋到該微分節(jié)點的加權(quán)求和節(jié)點(n3)的輸入實現(xiàn)的,該微分節(jié)點a3a3(k)=Σj=1sw3j(k)ej(k)-Σj=1sw3j(k-1)ej(k-1);]]>而隱含層的比例節(jié)點(a2)為不帶有任何反饋的常規(guī)節(jié)點,其比例節(jié)點a2a2(k)=Σj=1sw2j(k)ej(k);]]>輸出層神經(jīng)元節(jié)點的最終輸出變量為uu(k)=Σi=13wi(k)ai(k).]]>
3.根據(jù)權(quán)利要求1所述的非線性時變自適應控制器,其特征在于所述神經(jīng)網(wǎng)絡隱含層的網(wǎng)絡連接權(quán)值wij初始值為根據(jù)常規(guī)的控制方法對被控對象所設計一組使系統(tǒng)穩(wěn)定的線性控制器參數(shù),如,比例控制器參數(shù)、微分控制器參數(shù)、積分控制器參數(shù);而輸出層網(wǎng)絡連接權(quán)值wi的初始值全部取1。
4.根據(jù)權(quán)利要求1所述的非線性時變自適應控制器,其特征在于所述神經(jīng)網(wǎng)絡在每一個采樣周期里計算網(wǎng)絡連接權(quán)值修正公式中的各個學習速率的選取原則是使系統(tǒng)穩(wěn)定,其最佳取值范圍為10-3~10-4之間。
5.一種用于權(quán)利要求1所述的非線性時變自適應控制器的控制方法,其特征在于首先,在最初采樣周期里,在所述控制器中確定網(wǎng)絡連接權(quán)值初始值作為該采樣周期里的網(wǎng)絡連接權(quán)值,即所述神經(jīng)網(wǎng)絡隱含層的網(wǎng)絡連接權(quán)值wij初始值為根據(jù)常規(guī)的控制方法對被控對象所設計的一組使系統(tǒng)穩(wěn)定的線性控制器參數(shù),如,比例控制器參數(shù)、微分控制器參數(shù)、積分控制器參數(shù);而輸出層網(wǎng)絡連接權(quán)值wi的初始值全部取1;然后,網(wǎng)絡輸入層直接讀取具有負反饋的閉環(huán)控制系統(tǒng)的誤差信號并傳輸?shù)诫[含層中;網(wǎng)絡隱含層根據(jù)該誤差信號與該采樣周期里的網(wǎng)絡連接權(quán)值,根據(jù)積分節(jié)點a1a2(k)=Σj=1sw1j(k)ej(k)+a1(k-1);]]>比例節(jié)點a2a2(k)=Σj=1sw2j(k)ej(k);]]>微分節(jié)點a3a3(k)=Σj=1sw3j(k)ej(k)-Σj=1sw3j(k-1)ej(k-1),]]>計算隱含層積分節(jié)點(a1)、比例節(jié)點a2、微分節(jié)點(a3)的數(shù)值;同時,在10-3~10-4之間選定一組學習速率ηi和ηij的數(shù)值,并根據(jù)網(wǎng)絡輸入的誤差信號,每一個采樣周期里,計算輸出層網(wǎng)絡連接權(quán)值wiwi(k+1)=wi(k)+ηi·2·Σj=1s{ej(k)·sgnΔyj(k)Δu(k)}ai(k),]]>以及隱含層網(wǎng)絡連接權(quán)值wijwij(k+1)=wij(k)+2ηijΣj=1s{ej(k)·sgnΔyj(k)Δu(k)}wi(k)·ej(k),]]>并將其作為下一個采樣周期的網(wǎng)絡連接權(quán)值儲存起來;最后,網(wǎng)絡輸出層根據(jù)隱含層所計算出的各節(jié)點的數(shù)值及已有的該采樣周期里的網(wǎng)絡連接權(quán)值wi,根據(jù)uu(k)=Σi=13wi(k)ai(k),]]>計算網(wǎng)絡最終輸出變量u,并作為控制量對被控對象進行控制;在以后的采樣周期里,重復以上過程,即可完成實現(xiàn)對被控對象實時在線的控制。
全文摘要
非線性時變自適應控制器及其控制方法,涉及各行業(yè)中被控對象或生產(chǎn)過程的控制技術(shù)??刂茊卧慕Y(jié)構(gòu)為帶有局部連接遞歸的神經(jīng)網(wǎng)絡;所述神經(jīng)網(wǎng)絡由輸入層、隱含層和輸出層組成,其中輸入層具有s個神經(jīng)元輸入節(jié)點e
文檔編號G05B13/02GK1490689SQ03152989
公開日2004年4月21日 申請日期2003年9月11日 優(yōu)先權(quán)日2003年9月11日
發(fā)明者叢爽, 李國棟, 姬北辰, 叢 爽 申請人:中國科學技術(shù)大學