本技術(shù)涉及控制理論,尤其涉及非線性電機(jī)伺服系統(tǒng)的最優(yōu)軌跡跟蹤控制方法及裝置。
背景技術(shù):
1、軌跡跟蹤控制旨在設(shè)計(jì)控制策略,使受控系統(tǒng)能夠跟蹤預(yù)定義的軌跡。傳統(tǒng)的控制方法,如pid控制器等,依賴于對(duì)系統(tǒng)的精確建模和參數(shù)設(shè)定。然而,實(shí)際系統(tǒng)通常具有復(fù)雜的動(dòng)態(tài)特性,例如非線性等,這使得傳統(tǒng)方法往往難以達(dá)到理想的跟蹤性能。最優(yōu)跟蹤控制作為現(xiàn)代控制理論的一個(gè)重要分支,通過在給定約束條件下最小化指定的代價(jià)函數(shù)來實(shí)現(xiàn)對(duì)系統(tǒng)軌跡的跟蹤。代價(jià)函數(shù)通常包括跟蹤誤差和控制輸入,控制策略的生成不僅要保證跟蹤誤差最小化,還要兼顧控制輸入的合理性,避免過度的資源消耗,在控制領(lǐng)域具有重要意義。
2、求解最優(yōu)跟蹤控制問題的方法主要有變分法和動(dòng)態(tài)規(guī)劃法,然而,由于實(shí)際中的電機(jī)系統(tǒng)非線性強(qiáng)、精確模型難以準(zhǔn)確獲得,這兩種方法的求解往往極其困難。
技術(shù)實(shí)現(xiàn)思路
1、本技術(shù)旨在至少在一定程度上解決相關(guān)技術(shù)中的技術(shù)問題之一。
2、為此,本技術(shù)的第一個(gè)目的在于提出一種非線性電機(jī)伺服系統(tǒng)的最優(yōu)軌跡跟蹤控制方法,不依賴于系統(tǒng)的精確模型,能夠處理任意非線性系統(tǒng)狀態(tài)受不等式約束的最優(yōu)跟蹤控制問題。
3、本技術(shù)的第二個(gè)目的在于提出一種非線性電機(jī)伺服系統(tǒng)的最優(yōu)軌跡跟蹤控制裝置。
4、為達(dá)上述目的,本技術(shù)第一方面實(shí)施例提出了一種非線性電機(jī)伺服系統(tǒng)的最優(yōu)軌跡跟蹤控制方法,包括:
5、建立電機(jī)系統(tǒng)跟蹤控制的誤差動(dòng)態(tài)模型,引入新的狀態(tài)變量將誤差動(dòng)態(tài)模型轉(zhuǎn)化為增廣系統(tǒng)模型,并確定狀態(tài)不等式約束下的最優(yōu)跟蹤控制問題的描述形式;
6、基于增廣系統(tǒng)模型,利用函數(shù)近似方法建立未知?jiǎng)討B(tài)系統(tǒng)的辨識(shí)模型;
7、通過并行學(xué)習(xí)方法,利用在線數(shù)據(jù)和歷史數(shù)據(jù)預(yù)估辨識(shí)模型中的未知參數(shù);
8、基于辨識(shí)模型,通過迭代算法更新控制輸入,對(duì)狀態(tài)不等式約束下的最優(yōu)跟蹤控制問題進(jìn)行求解,得到最優(yōu)跟蹤控制策略。
9、本技術(shù)實(shí)施例的非線性電機(jī)伺服系統(tǒng)的最優(yōu)軌跡跟蹤控制方法,通過建立電機(jī)系統(tǒng)跟蹤控制的誤差動(dòng)態(tài)模型,并引入新的狀態(tài)變量將時(shí)變誤差系統(tǒng)轉(zhuǎn)化為非時(shí)變?cè)鰪V系統(tǒng),進(jìn)一步得到狀態(tài)不等式約束下的最優(yōu)跟蹤控制問題的描述形式;基于增廣系統(tǒng)模型,利用函數(shù)近似方法強(qiáng)大的非線性映射能力來建立未知?jiǎng)討B(tài)系統(tǒng)的參數(shù)辨識(shí)模型;通過并行學(xué)習(xí)方法,同時(shí)利用在線數(shù)據(jù)和已有的歷史數(shù)據(jù)來估計(jì)辨識(shí)模型中的未知參數(shù);基于辨識(shí)模型,通過迭代算法來更新控制輸入,得到不等式約束下的最優(yōu)跟蹤控制策略。本技術(shù)不依賴電機(jī)系統(tǒng)精確模型,實(shí)現(xiàn)了在保證電機(jī)系統(tǒng)狀態(tài)滿足已有的約束的同時(shí),最小化有限時(shí)域內(nèi)的跟蹤誤差和控制能耗,符合工程實(shí)際需求;本技術(shù)所考慮系統(tǒng)為非線性系統(tǒng),具有現(xiàn)實(shí)意義。
10、可選地,在本技術(shù)的一個(gè)實(shí)施例中,建立電機(jī)系統(tǒng)跟蹤控制的誤差動(dòng)態(tài)模型,包括:
11、定義電機(jī)非線性系統(tǒng)為:
12、
13、其中,是系統(tǒng)狀態(tài),為系統(tǒng)初始時(shí)刻,為系統(tǒng)初始狀態(tài),是系統(tǒng)控制輸入,為u輸入系統(tǒng)后的系統(tǒng)狀態(tài),為系統(tǒng)的動(dòng)態(tài)函數(shù),
14、定義電機(jī)非線性系統(tǒng)狀態(tài)約束為:
15、
16、其中,為維列向量函數(shù),代表存在個(gè)不等式約束;
17、定義系統(tǒng)跟蹤信號(hào)為,跟蹤誤差為,對(duì)于最優(yōu)跟蹤控制問題,采用二次型性能指標(biāo)表示代價(jià)函數(shù),代價(jià)函數(shù)表示為:
18、
19、其中,代表一段預(yù)先確定的時(shí)間間隔,,為實(shí)對(duì)稱正定矩陣,
20、誤差動(dòng)態(tài)模型的動(dòng)態(tài)函數(shù)以及不等式約束表示為:
21、
22、引入新的狀態(tài)變量將誤差動(dòng)態(tài)模型轉(zhuǎn)化為增廣系統(tǒng)模型,包括:
23、假設(shè)跟蹤信號(hào)由未知?jiǎng)討B(tài)函數(shù)生成,未知?jiǎng)討B(tài)函數(shù)表示為:
24、
25、定義新的狀態(tài)變量,增廣系統(tǒng)表示為:
26、
27、新的狀態(tài)變量所滿足的不等式約束為:
28、
29、代價(jià)函數(shù)表示為:
30、
31、其中,矩陣定義為:
32、
33、確定狀態(tài)不等式約束下的最優(yōu)跟蹤控制問題的描述形式,包括:
34、對(duì)于不等式約束,構(gòu)造kelley-bryson罰函數(shù)作為代價(jià)函數(shù),并將最優(yōu)跟蹤控制問題的求解轉(zhuǎn)化無約束問題的求解,構(gòu)造的代價(jià)函數(shù)表示為:
35、
36、其中,為一個(gè)單調(diào)遞增的序列,且滿足,罰函數(shù)中項(xiàng)為階躍函數(shù),公式化為:
37、
38、當(dāng)增廣系統(tǒng)狀態(tài)滿足所給定的不等式約束時(shí),,無約束問題的解滿足的條件為:
39、
40、最優(yōu)性條件的簡(jiǎn)化形式為:
41、
42、其中,為協(xié)態(tài)量,為哈密頓函數(shù),,。
43、可選地,在本技術(shù)的一個(gè)實(shí)施例中,基于增廣系統(tǒng)模型,利用函數(shù)近似方法建立未知?jiǎng)討B(tài)系統(tǒng)的辨識(shí)模型,包括:
44、令代表增廣系統(tǒng)未知?jiǎng)討B(tài)函數(shù)的第項(xiàng),利用函數(shù)近似方法將其近似為:
45、
46、其中,為權(quán)重系數(shù),為隱藏層個(gè)神經(jīng)元的激活函數(shù),為對(duì)應(yīng)的近似誤差;
47、定義權(quán)重系數(shù)的估計(jì)值為,令矩陣,,令激活函數(shù)向量為,未知?jiǎng)討B(tài)系統(tǒng)的參數(shù)辨識(shí)模型表示為:。
48、可選地,在本技術(shù)的一個(gè)實(shí)施例中,通過并行學(xué)習(xí)方法,利用在線數(shù)據(jù)和歷史數(shù)據(jù)預(yù)估辨識(shí)模型中的未知參數(shù),包括:
49、采集在任意時(shí)刻下增廣系統(tǒng)的歷史數(shù)據(jù)點(diǎn),歷史數(shù)據(jù)點(diǎn)為,歷史數(shù)據(jù)點(diǎn)包括增廣系統(tǒng)的狀態(tài)、控制輸入以及狀態(tài)的導(dǎo)數(shù),定義矩陣,所采集的歷史數(shù)據(jù)集合滿足;
50、利用歷史數(shù)據(jù)集合以及在線數(shù)據(jù)更新辨識(shí)模型中的未知參數(shù),更新時(shí)的自適應(yīng)更新律表示為:
51、
52、其中,和分別代表第次迭代過程中增廣系統(tǒng)狀態(tài)值和系數(shù)矩陣的估計(jì)值,、為學(xué)習(xí)率,和分別是第次迭代過程中增廣系統(tǒng)狀態(tài)和系數(shù)矩陣的估計(jì)誤差。
53、可選地,在本技術(shù)的一個(gè)實(shí)施例中,最優(yōu)跟蹤控制策略的生成過程包括:
54、步驟s1:初始化系數(shù)、、,設(shè)定精度誤差、、,選取初始控制輸入以及初始系數(shù)矩陣估計(jì)值,測(cè)量在初始控制輸入下的原系統(tǒng)狀態(tài),計(jì)算對(duì)應(yīng)的增廣系統(tǒng)的軌線以及代價(jià)函數(shù),令,,其中,;
55、步驟s2:通過求解第一方程組更新控制輸入,其中,第一方程組表示為:
56、
57、其中,,代表系數(shù)矩陣的前n列;
58、步驟s3:通過求解第二方程組更新系數(shù)矩陣,其中,第二方程組表示為:
59、
60、步驟s4:通過更新后的控制輸入計(jì)算增廣系統(tǒng)的軌線以及對(duì)應(yīng)的代價(jià)函數(shù);
61、步驟s5:重復(fù)進(jìn)行步驟s2-s4,在每次重復(fù)后,令,,、為迭代步長,直至,
62、步驟s6:重復(fù)進(jìn)行步驟s2-s5,在每次重復(fù)后,令,,,直至控制輸入以及辨識(shí)模型收斂于給定的精度誤差,其中,控制輸入收斂于給定的精度誤差,表示為:,辨識(shí)模型收斂于給定的精度誤差,表示為:;
63、步驟s7:重復(fù)步驟s2-s6,在每次重復(fù)后,令,,,,,為迭代步長,直至增廣系統(tǒng)的狀態(tài)在給定的精度誤差下滿足不等式約束,得到辨識(shí)模型參數(shù)以及最優(yōu)跟蹤控制策略,其中,增廣系統(tǒng)的狀態(tài)在給定的精度誤差下滿足不等式約束,表示為:。
64、為達(dá)上述目的,本技術(shù)第二方面實(shí)施例提出了一種非線性電機(jī)伺服系統(tǒng)的最優(yōu)軌跡跟蹤控制裝置,包括:
65、系統(tǒng)建立模塊,用于建立電機(jī)系統(tǒng)跟蹤控制的誤差動(dòng)態(tài)模型,引入新的狀態(tài)變量將誤差動(dòng)態(tài)模型轉(zhuǎn)化為增廣系統(tǒng)模型,并確定狀態(tài)不等式約束下的最優(yōu)跟蹤控制問題的描述形式;
66、系統(tǒng)建立模塊,還用于基于增廣系統(tǒng)模型,利用函數(shù)近似方法建立未知?jiǎng)討B(tài)系統(tǒng)的辨識(shí)模型;
67、系統(tǒng)辨識(shí)模塊,用于通過并行學(xué)習(xí)方法,利用在線數(shù)據(jù)和歷史數(shù)據(jù)預(yù)估辨識(shí)模型中的未知參數(shù);
68、計(jì)算求解模塊,用于基于辨識(shí)模型,通過迭代算法更新控制輸入,對(duì)狀態(tài)不等式約束下的最優(yōu)跟蹤控制問題進(jìn)行求解,得到最優(yōu)跟蹤控制策略。
69、本技術(shù)附加的方面和優(yōu)點(diǎn)將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本技術(shù)的實(shí)踐了解到。