本發(fā)明涉及多智能體控制領(lǐng)域,尤其涉及基于未知輸入狀態(tài)互估計(jì)的多智能體協(xié)同編隊(duì)控制方法。
背景技術(shù):
1、多智能體系統(tǒng)具有自主性、容錯(cuò)性、靈活性和可擴(kuò)展性等優(yōu)點(diǎn),而被廣泛應(yīng)用在空間開(kāi)發(fā)與探測(cè)、緊急搜救、衛(wèi)星編隊(duì)、多彈協(xié)同等領(lǐng)域。多智能體協(xié)同編隊(duì)問(wèn)題是協(xié)同控制的一個(gè)基本問(wèn)題,在已知自身和相鄰智能體全部狀態(tài)的情況下,狀態(tài)反饋是一種多智能體系統(tǒng)實(shí)現(xiàn)編隊(duì)控制的經(jīng)典方法。然而在實(shí)際應(yīng)用中,受系統(tǒng)本身或傳感器的限制,獲取智能體的全部狀態(tài)信息是不現(xiàn)實(shí)的。解決此問(wèn)題的一個(gè)方法是利用傳感器測(cè)量到的有限信息設(shè)計(jì)狀態(tài)觀測(cè)器實(shí)現(xiàn)對(duì)真實(shí)狀態(tài)的重構(gòu),再利用重構(gòu)的狀態(tài)設(shè)計(jì)編隊(duì)控制器來(lái)保證編隊(duì)任務(wù)的實(shí)現(xiàn)。
2、目前,多智能體系統(tǒng)狀態(tài)估計(jì)方法主要是分布式的狀態(tài)估計(jì)方法,例如,《distributed?kalman?filtering?for?sensor?networks》提出的經(jīng)典分布式卡爾曼一致濾波算法融合多智能體一致性理論和卡爾曼濾波,只需要節(jié)點(diǎn)的局部測(cè)量信息,隨著迭代次數(shù)增加,網(wǎng)絡(luò)中所有傳感器節(jié)點(diǎn)的狀態(tài)估計(jì)值都能趨于一致。
3、或者,yuezu?lv,?zhongkui?li,?and?zhisheng?duan在《minimal-orderspecified-time?unknown?input?observers》中提出了以觀測(cè)器技術(shù)為基礎(chǔ),在僅利用局部的測(cè)量信息的情況下,設(shè)計(jì)分布式觀測(cè)器實(shí)現(xiàn)一致性估計(jì)。
4、可知,現(xiàn)有狀態(tài)估計(jì)算法的實(shí)現(xiàn)依賴于局部測(cè)量信息的準(zhǔn)確性,這意味著現(xiàn)有狀態(tài)估計(jì)技術(shù)在有傳感器測(cè)量失效的情況下是無(wú)法實(shí)現(xiàn)的。
技術(shù)實(shí)現(xiàn)思路
1、為解決上述問(wèn)題,本發(fā)明提供一種基于未知輸入狀態(tài)互估計(jì)的多智能體協(xié)同編隊(duì)控制方法,考慮用分布式狀態(tài)估計(jì)技術(shù),解決編隊(duì)控制中完全狀態(tài)無(wú)法獲取的問(wèn)題,進(jìn)一步提出新穎的分布式狀態(tài)互估計(jì)算法,解決現(xiàn)有狀態(tài)估計(jì)算法在傳感器測(cè)量輸出失效時(shí)估計(jì)失敗的問(wèn)題,確保傳感器測(cè)量輸出失效情況下編隊(duì)任務(wù)的實(shí)現(xiàn)。
2、為實(shí)現(xiàn)上述目的,本發(fā)明提供了基于未知輸入狀態(tài)互估計(jì)的多智能體協(xié)同編隊(duì)控制方法,包括以下步驟:
3、s1、基于多智能體系統(tǒng)構(gòu)建智能體的狀態(tài)互估計(jì)機(jī)理模型;
4、s2、根據(jù)圖論知識(shí)構(gòu)建多智能體系統(tǒng)的通信拓?fù)浣Y(jié)構(gòu);
5、s3、結(jié)合步驟s1構(gòu)建的智能體的狀態(tài)互估計(jì)機(jī)理模型和步驟s2構(gòu)建的多智能體系統(tǒng)的通信拓?fù)浣Y(jié)構(gòu),為每個(gè)智能體構(gòu)造分布式狀態(tài)互估計(jì)器,并確定分布式狀態(tài)互估計(jì)器中的增益矩陣;
6、s4、根據(jù)每個(gè)智能體對(duì)所有狀態(tài)的估計(jì)值,為每個(gè)智能體構(gòu)建基于一致性理論的編隊(duì)控制策略;
7、s5、智能體傳感器測(cè)量失效,返回步驟s3重新確定分布式狀態(tài)互估計(jì)器中的增益矩陣。
8、優(yōu)選的,步驟s1具體包括以下步驟:
9、s11、建立多智能體系統(tǒng)的狀態(tài)動(dòng)力學(xué)模型:
10、(1)
11、式中,為智能體的狀態(tài)的導(dǎo)數(shù),為智能體的維實(shí)際狀態(tài),為智能體的維有界的控制輸入,為多智能體系統(tǒng)中智能體的總個(gè)數(shù),和分別為狀態(tài)矩陣和輸入矩陣;
12、s12、基于狀態(tài)動(dòng)力學(xué)模型,結(jié)合傳感器的測(cè)量輸出構(gòu)造狀態(tài)互估計(jì)機(jī)理模型。
13、優(yōu)選的,步驟s12具體包括以下步驟:
14、記多智能體系統(tǒng)所有的狀態(tài),分別表示第個(gè)智能體的狀態(tài),每個(gè)智能體上傳感器的測(cè)量輸出用于測(cè)量自身狀態(tài)信息,以及測(cè)量傳感器測(cè)量范圍內(nèi)的其他智能體的狀態(tài)信息,每個(gè)智能體的狀態(tài)互估計(jì)機(jī)理模型表達(dá)式如下:
15、(2)
16、式中,為狀態(tài)的導(dǎo)數(shù);為維的傳感器測(cè)量輸出;為多智能體系統(tǒng)中所有智能體的狀態(tài);表示由狀態(tài)矩陣演化的矩陣,,表示kronecker積運(yùn)算,是維度為的單位矩陣;為多智能系統(tǒng)中個(gè)智能體的控制輸入;表示由輸入矩陣演化的矩陣,且;為的輸出矩陣;
17、系統(tǒng)矩陣滿足如下秩條件:
18、,(3)
19、式中,表示系統(tǒng)矩陣的秩,是維度為的單位矩陣,為多智能體系統(tǒng)的復(fù)頻率范圍,表示多智能體系統(tǒng)中個(gè)智能體的傳感器輸出矩陣,且,分別表示第個(gè)智能體的輸出矩陣,表示控制輸入的維度,表示所有智能體測(cè)量輸出的總維度,且。
20、優(yōu)選的,在步驟s2中,利用通信拓?fù)鋱D模型描述多智能體系統(tǒng)的通信關(guān)系:
21、由個(gè)智能體組成的多智能體系統(tǒng)的通信拓?fù)溆蓤D描述,其中表示智能體節(jié)點(diǎn)的集合,且,分別表示智能體的第個(gè)節(jié)點(diǎn);表示智能體邊的集合,且;表示鄰接矩陣,且;表示鄰接矩陣中第行第列元素;
22、若智能體接收到智能體的信息,則判定智能體為智能體的鄰居,則有,且;否則,故智能體的鄰居用集合表示;智能體的鄰居個(gè)數(shù);用表示多智能體系統(tǒng)的laplacian矩陣,表示laplacian矩陣中第行第列元素;
23、計(jì)算:
24、(4)
25、式中,為入度矩陣,且,為第個(gè)入度矩陣的元素。
26、優(yōu)選的,步驟s2構(gòu)建的多智能體系統(tǒng)的通信拓?fù)鋱D滿足如下要求:
27、多智能體系統(tǒng)的通信拓?fù)鋱D為有向圖,且任意兩個(gè)智能體之間均存在有向通信路徑:智能體和智能體之間存在多個(gè)智能體使得通信鏈路。
28、優(yōu)選的,步驟s3所述的分布式狀態(tài)互估計(jì)器包含分布式輸出跟蹤器和分布式未知輸入觀測(cè)器。
29、優(yōu)選的,步驟s3具體包括以下步驟:
30、s31、為每個(gè)智能體設(shè)計(jì)如下分布式輸出跟蹤估計(jì)器:
31、(5)
32、式中,為第個(gè)智能體對(duì)多智能體系統(tǒng)中個(gè)智能體輸出的估計(jì),,分別表示第個(gè)智能體的輸出,的維度為,其中,表示第個(gè)智能體測(cè)量輸出的維度;為第個(gè)智能體對(duì)個(gè)智能體所有狀態(tài)的估計(jì),的維度為;表示一個(gè)輔助矩陣,且,分別表示輔助矩陣對(duì)角線上第個(gè)元素;為滑模非線性項(xiàng);
33、s32、為每個(gè)智能體構(gòu)建分布式未知輸入觀測(cè)器:
34、(6)
35、式中,為維未知輸入的輔助變量;表示的導(dǎo)數(shù);表示對(duì)角正定矩陣,且;表示由系統(tǒng)矩陣和演化的矩陣,且;為使得hurwitz穩(wěn)定的增益矩陣;表示與矩陣維度相同的單位矩陣;表示所有智能體的狀態(tài)的漸進(jìn)收斂值;
36、s33、確定增益常數(shù)的取值范圍:
37、為正的常數(shù)增益,且滿足以下條件:
38、(7)
39、式中,表示一個(gè)由(7)式計(jì)算得到的常數(shù);、分別表示增益矩陣的最大特征值和增益矩陣的最小特征值;表示增益矩陣的最大奇異值;表示矩陣的最小特征值;為使得正定的對(duì)角正定矩陣;表示一個(gè)常數(shù),且;為正定矩陣,滿足,為正定矩陣;為所有智能體的輸出的漸進(jìn)收斂值。
40、優(yōu)選的,步驟s31所述的滑模非線性項(xiàng)的計(jì)算公式如下:
41、(8)
42、式中,為正的常數(shù),且滿足,為控制輸入的上界;表示維單位矩陣;表示一個(gè)向量,且,,分別表示第個(gè)智能體的通信關(guān)系與測(cè)量輸出維度相關(guān)的單位矩陣演化的輔助矩陣,為使得正定的對(duì)角正定矩陣;為的最小特征值;為矩陣或向量的歐幾里得范數(shù)。
43、優(yōu)選的,步驟s4具體包括以下步驟:
44、s41、根據(jù)每個(gè)智能體的狀態(tài)互估計(jì)器重構(gòu)的整體狀態(tài),為每個(gè)智能體設(shè)計(jì)如下局部的編隊(duì)控制策略:
45、(9)
46、式中,表示第個(gè)智能體對(duì)自身狀態(tài)的估計(jì);表示第個(gè)智能體對(duì)自身狀態(tài)的估計(jì);表示常數(shù)增益;表示反饋增益矩陣;表示第個(gè)智能體的期望位置;表示第個(gè)智能體的期望位置,同時(shí)智能體的編隊(duì)滿足;
47、s42、確定編隊(duì)控制策略中常數(shù)增益和反饋增益矩陣的取值:
48、取常數(shù)增益,反饋增益矩陣,其中為使得的正定矩陣,形成定常編隊(duì)構(gòu)型并維持。
49、優(yōu)選的,步驟s5具體包含以下子步驟:
50、s51、假定第個(gè)智能體傳感器測(cè)量輸出失效時(shí),記失效后的輸出矩陣表達(dá)式如下:
51、(10)
52、式中,分別表示第個(gè)智能體的輸出矩陣,其中第個(gè)智能體的輸出矩陣全部置零;
53、如果失效后的系統(tǒng)矩陣滿足如下秩條件:
54、,(11)
55、則執(zhí)行步驟s52;
56、s52、檢測(cè)到有智能體的測(cè)量輸出失效后,保持分布式狀態(tài)互估計(jì)器形式不變,根據(jù)步驟s31-s33重新確定分布式輸出跟蹤器和分布式未知輸入觀測(cè)器中的常數(shù)增益和增益矩陣,基于重新確定的常數(shù)增益和增益矩陣估計(jì)所有智能體的狀態(tài)。
57、本發(fā)明具有以下有益效果:
58、1、為每個(gè)智能體構(gòu)造基于未知輸入觀測(cè)器的狀態(tài)互估計(jì)器,保證每個(gè)智能體均可以實(shí)現(xiàn)對(duì)智能體系統(tǒng)所有狀態(tài)的估計(jì),從而解決了現(xiàn)有狀態(tài)估計(jì)算法在智能體傳感器測(cè)量輸出失效時(shí)估計(jì)失敗的問(wèn)題;
59、2、為每個(gè)智能體構(gòu)造的編隊(duì)控制算法,只根據(jù)自己的狀態(tài)互估計(jì)值進(jìn)行設(shè)計(jì),有效避免了編隊(duì)控制中多智能體間的信息交互,一定程度上增加了編隊(duì)控制算法的魯棒性。
60、下面通過(guò)附圖和實(shí)施例,對(duì)本發(fā)明的技術(shù)方案做進(jìn)一步的詳細(xì)描述。