本發(fā)明屬于多智能體集群控制領(lǐng)域,更具體地,涉及一種基于ode-pde的編隊(duì)控制方法及系統(tǒng)。
背景技術(shù):
1、近年來(lái),隨著通信技術(shù)和人工智能技術(shù)的快速發(fā)展,多智能體系統(tǒng)的協(xié)同控制由于其在無(wú)人機(jī)群、智能交通、微電網(wǎng)群等領(lǐng)域的應(yīng)用前景受到了廣泛關(guān)注。編隊(duì)控制,指控制系統(tǒng)中的各實(shí)體對(duì)象自初始位置移動(dòng)至指定的目標(biāo)位置或著形成指定的隊(duì)形,是一類(lèi)典型的多智能體系統(tǒng)協(xié)同控制問(wèn)題。實(shí)際需求的日益復(fù)雜化導(dǎo)致多智能體系統(tǒng)規(guī)模必然日益增長(zhǎng)。為了應(yīng)用智能體系統(tǒng)解決實(shí)際集群系統(tǒng)的控制問(wèn)題,需要先建立集群系統(tǒng)對(duì)應(yīng)的多智能體系統(tǒng)模型,多智能體系統(tǒng)模型中,每個(gè)智能體對(duì)應(yīng)集群系統(tǒng)中的一個(gè)實(shí)體對(duì)象,例如,無(wú)人機(jī)群對(duì)應(yīng)的多智能體系統(tǒng)中,每個(gè)智能體對(duì)應(yīng)一臺(tái)無(wú)人機(jī);智能交通系統(tǒng)對(duì)應(yīng)的多智能體系統(tǒng)中,每個(gè)智能體對(duì)應(yīng)一臺(tái)無(wú)人車(chē)或一個(gè)交通信號(hào)燈;微電網(wǎng)群對(duì)應(yīng)的多智能體系統(tǒng)中,每個(gè)智能體對(duì)應(yīng)一個(gè)微電網(wǎng)。建立對(duì)應(yīng)的多智能體系統(tǒng)模型后,即可借助多智能體系統(tǒng)相關(guān)理論方法進(jìn)行后續(xù)的控制。
2、目前絕大多數(shù)多智能體協(xié)同控制的研究采用ode(ordinary?differentialequation,常微分方程)方法,該方法需要針對(duì)每一個(gè)智能體都建立一個(gè)ode模型,以描述各智能體的動(dòng)力學(xué)行為,該方法面向大規(guī)模多智能體系統(tǒng)時(shí),建立的ode模型高維且復(fù)雜,給相關(guān)的穩(wěn)定性分析和控制器設(shè)計(jì)帶來(lái)巨大挑戰(zhàn)。
3、為了解決這一問(wèn)題,一些學(xué)者最近提出了基于pde(partial?differentialequation,偏微分方程)的大規(guī)模多智能體系統(tǒng)協(xié)同控制方法,與基于ode的方法相比,pde方法的主要優(yōu)勢(shì)在于能夠利用單個(gè)pde有效地表示大規(guī)模多智能體系統(tǒng)的集體動(dòng)力學(xué),且無(wú)論智能體數(shù)量如何變化,都能始終保持一致的分析復(fù)雜性。
4、目前,pde方法僅適用于有限空間中存在足夠多智能體的場(chǎng)景,即要求空間中的智能體必須密集分布。然而,實(shí)際多智能體系統(tǒng)的分布形式具有多樣性,即一部分智能體密集分布,而另一部分智能體很可能稀疏分布,因此現(xiàn)有pde方法的適用范圍十分有限。
5、此外,實(shí)際多智能體系統(tǒng)往往面臨以下三個(gè)問(wèn)題:(1)實(shí)際系統(tǒng)往往要求實(shí)現(xiàn)控制目標(biāo)的時(shí)間是有限的,需要快速完成協(xié)同控制任務(wù);(2)由于軟硬件設(shè)施的限制,通信拓?fù)錈o(wú)法保證恒定不變;(3)由于智能體本身的復(fù)雜性,實(shí)際智能體的非線性往往是復(fù)雜且未知的。但是,現(xiàn)有基于pde的多智能體系統(tǒng)的研究中并未考慮這三種因素,導(dǎo)致理論結(jié)果過(guò)于理想化,實(shí)用性不強(qiáng)。
6、總體而言,如何有效利用多智能體系統(tǒng)的協(xié)同控制實(shí)現(xiàn)任意規(guī)模、任意分布的系統(tǒng)的編隊(duì)控制,是一個(gè)亟待解決的問(wèn)題。
技術(shù)實(shí)現(xiàn)思路
1、針對(duì)現(xiàn)有技術(shù)的缺陷和改進(jìn)需求,本發(fā)明提供了一種基于ode-pde的編隊(duì)控制方法及系統(tǒng),其目的在于,有效利用多智能體系統(tǒng)的協(xié)同控制實(shí)現(xiàn)任意規(guī)模、任意分布的系統(tǒng)的編隊(duì)控制。
2、為實(shí)現(xiàn)上述目的,按照本發(fā)明的一個(gè)方面,提供了一種基于ode-pde的編隊(duì)控制方法,包括:
3、建立待控制系統(tǒng)對(duì)應(yīng)的異構(gòu)多智能體系統(tǒng)模型;異構(gòu)多智能體系統(tǒng)模型中,每個(gè)智能體對(duì)應(yīng)待控制系統(tǒng)中的一個(gè)實(shí)體對(duì)象;
4、基于ode模型建立異構(gòu)多智能體系統(tǒng)模型中各智能體的動(dòng)力學(xué)方程,用于描述智能體的速度、智能體間的通信協(xié)議及智能體位置的非線性函數(shù)值之間的關(guān)系;通信協(xié)議與用于控制速度變化的控制信號(hào)相關(guān);異構(gòu)多智能體系統(tǒng)模型中,稀疏分布的智能體與密集分布的智能體對(duì)應(yīng)的非線性函數(shù)不同;
5、基于各智能體的動(dòng)力學(xué)方程得到各智能體的實(shí)際位置相對(duì)于目標(biāo)位置的ode跟蹤誤差系統(tǒng)模型,并將所有密集分布的智能體對(duì)應(yīng)的ode跟蹤誤差系統(tǒng)模型進(jìn)行連續(xù)化處理,得到各稀疏分布智能體對(duì)應(yīng)的ode誤差系統(tǒng)模型和密集分布的智能體共享的pde誤差系統(tǒng)模型;
6、在任意 t時(shí)刻,按照如下步驟進(jìn)行編隊(duì)控制:
7、步驟s1:對(duì)于每一個(gè)稀疏分布的智能體,將其位置 m i( t)輸入至第一rbf神經(jīng)網(wǎng)絡(luò),得到一元非線性函數(shù)值 f i( m i( t)),并計(jì)算用于控制其速度變化的控制信號(hào)為:;
8、對(duì)于每一個(gè)密集分布的智能體,將其位置 s( z, t)輸入至第二rbf神經(jīng)網(wǎng)絡(luò),得到二元非線性函數(shù)值 g( s( z, t)),并計(jì)算用于控制其速度變化的控制信號(hào)為:;
9、步驟s2:對(duì)于每一個(gè)稀疏分布的智能體,將其對(duì)應(yīng)的一元非線性函數(shù)值 f i( m i( t))和控制信號(hào)代入其所對(duì)應(yīng)的ode誤差系統(tǒng)模型,以計(jì)算相應(yīng)的跟蹤誤差;對(duì)于每一個(gè)密集分布的智能體,將其對(duì)應(yīng)的二元非線性函數(shù)值 g( s( z, t))和控制信號(hào)代入密集分布的智能體所共享的pde誤差系統(tǒng)模型,以計(jì)算相應(yīng)的跟蹤誤差;
10、步驟s3:判斷所有智能體對(duì)應(yīng)的跟蹤誤差是否均收斂,若是,則編隊(duì)控制結(jié)束;若否,則向各智能體繼續(xù)更新控制信號(hào),使得所有智能體對(duì)應(yīng)的跟蹤誤差均收斂,并使實(shí)體對(duì)象執(zhí)行相應(yīng)的動(dòng)作;
11、其中,表示密集分布智能體的相對(duì)位置, l表示密集分布智能體的分布范圍;為第一rbf神經(jīng)網(wǎng)絡(luò)的權(quán)值向量;第二rbf神經(jīng)網(wǎng)絡(luò)為二元的rbf神經(jīng)網(wǎng)絡(luò),且為第二rbf神經(jīng)網(wǎng)絡(luò)的二元權(quán)值向量;和均為已知的連續(xù)rbf向量。
12、進(jìn)一步地,異構(gòu)多智能體系統(tǒng)模型中,稀疏分布的智能體與其他智能體通信的信號(hào)強(qiáng)度變化由第一半馬爾可夫過(guò)程刻畫(huà),密集分布的智能體與其他智能體通信的信號(hào)強(qiáng)度變化由第二半馬爾可夫過(guò)程刻畫(huà);第一半馬爾可夫過(guò)程和第二半馬爾科夫過(guò)程相互獨(dú)立,且第一半馬爾可夫過(guò)程和第二半馬爾可夫過(guò)程中,每個(gè)模態(tài)對(duì)應(yīng)一個(gè)信號(hào)強(qiáng)度。
13、進(jìn)一步地,稀疏分布的智能體與其他智能體之間的通信協(xié)議 u i( t)為:
14、
15、密集分布的智能體與其他智能體之間的通信協(xié)議 c i( t)為:
16、;
17、其中, i表示智能體編號(hào),表示稀疏分布的智能體的編號(hào),表示密集分布的智能體的編號(hào), n表示異構(gòu)多智能體系統(tǒng)模型中稀疏分布智能體的數(shù)量, v表示異構(gòu)多智能體系統(tǒng)模型中密集分布智能體的異構(gòu)數(shù)量; m k( t)表示稀疏分布的智能體在 t時(shí)刻的位置;表示密集分布智能體在 t時(shí)刻的位置;表示密集分布智能體的分布間隔;表示稀疏分布智能體的目標(biāo)位置,表示稀疏分布智能體的目標(biāo)位置;表示密集分布智能體在 t時(shí)刻的控制信號(hào),表示密集分布智能體在 t時(shí)刻的控制信號(hào);表示稀疏分布的智能體編號(hào),表示密集分布的智能體編號(hào);、、和均為半馬爾可夫切換拓?fù)錂?quán)值,且;表示通信時(shí)滯,,且的變化率滿足,表示最大通信時(shí)滯,表示通信時(shí)滯最大變化率。
18、進(jìn)一步地,稀疏分布的智能體對(duì)應(yīng)的ode誤差系統(tǒng)模型為:
19、;
20、密集分布的智能體對(duì)應(yīng)的ode誤差系統(tǒng)模型為:
21、;
22、其中,表示 t時(shí)刻稀疏分布智能體的跟蹤誤差,,表示的變化率;表示 t時(shí)刻密集分布智能體的跟蹤誤差,,表示的變化率;
23、將所有密集分布智能體對(duì)應(yīng)的ode誤差系統(tǒng)模型進(jìn)行連續(xù)化處理后,
24、得到的各稀疏分布智能體對(duì)應(yīng)的ode誤差系統(tǒng)模型和密集分布的智能體共享的pde誤差系統(tǒng)模型分別為:
25、;
26、其中,表示 t時(shí)刻、位置為 z的密集分布智能體的跟蹤誤差;,,;通過(guò)在密集分布智能體兩端設(shè)置兩個(gè)錨點(diǎn),可以把密集分布的智能體共享的pde誤差系統(tǒng)模型的邊界條件描述為:。
27、進(jìn)一步地,和均按照基于投影規(guī)則的自適應(yīng)更新率進(jìn)行更新;
28、的自適應(yīng)更新率和的自適應(yīng)更新率分別為:
29、;
30、;
31、其中,
32、,
33、,
34、,
35、,
36、其中,、、、、、、 、、、均表示神經(jīng)網(wǎng)絡(luò)參數(shù);,表示第一rbf神經(jīng)網(wǎng)絡(luò)理想的權(quán)值向量;,表示第二rbf神經(jīng)網(wǎng)絡(luò)理想的二元權(quán)值向量。
37、進(jìn)一步地,以、、、、和作為控制器增益,則控制器增益的確定方式包括:
38、構(gòu)造如下滿足有限時(shí)間穩(wěn)定性的線性矩陣不等式:
39、;
40、如果存在正定標(biāo)量、,且存在正定常數(shù)、、、、、,負(fù)定常數(shù),以及任意標(biāo)量和,,使得對(duì)于任意的、和,上述線性矩陣不等式均成立,則將、、、、和的取值作為相應(yīng)的控制器增益;
41、為上三角矩陣,其中的各非零元素表達(dá)式分別為:,,,,,,,,,,,,,,,,,,,,;,表示半馬爾可夫切換拓?fù)錂?quán)值;,表示第一半馬爾可夫過(guò)程中模態(tài)間的轉(zhuǎn)移率,表示的數(shù)學(xué)期望;,表示第二半馬爾可夫過(guò)程中模態(tài)間的轉(zhuǎn)移率,表示的數(shù)學(xué)期望;和分別表示第一半馬爾可夫過(guò)程和第二半馬爾可夫過(guò)程的模態(tài)集合, m1和 m2分別表示第一半馬爾可夫過(guò)程和第二半馬爾科夫過(guò)程的模態(tài)總數(shù)。
42、按照本發(fā)明的又一個(gè)方面,提供了一種基于ode-pde的編隊(duì)控制系統(tǒng),包括:初始化模塊、ode模型建立模塊、ode-pde誤差模型建立模塊、一元非線性函數(shù)逼近器、二元非線性函數(shù)逼近器、第一神經(jīng)自適應(yīng)控制器、第二神經(jīng)自適應(yīng)控制器、第一誤差跟蹤模塊、第二誤差跟蹤模塊以及控制模塊;
43、初始化模塊,用于建立待控制系統(tǒng)對(duì)應(yīng)的異構(gòu)多智能體系統(tǒng)模型;異構(gòu)多智能體系統(tǒng)模型中,每個(gè)智能體對(duì)應(yīng)待控制系統(tǒng)中的一個(gè)實(shí)體對(duì)象;
44、ode模型建立模塊,用于基于ode模型建立異構(gòu)多智能體系統(tǒng)模型中各智能體的動(dòng)力學(xué)方程,用于描述智能體的速度、智能體間的通信協(xié)議及智能體位置的非線性函數(shù)值之間的關(guān)系;通信協(xié)議與用于控制速度變化的控制信號(hào)相關(guān);異構(gòu)多智能體系統(tǒng)模型中,稀疏分布的智能體與密集分布的智能體對(duì)應(yīng)的非線性函數(shù)不同;
45、ode-pde誤差模型建立模塊,用于基于各智能體的動(dòng)力學(xué)方程得到各智能體的實(shí)際位置相對(duì)于目標(biāo)位置的ode跟蹤誤差系統(tǒng)模型,并將所有密集分布的智能體對(duì)應(yīng)的ode跟蹤誤差系統(tǒng)模型進(jìn)行連續(xù)化處理,得到各稀疏分布智能體對(duì)應(yīng)的ode誤差系統(tǒng)模型和密集分布的智能體共享的pde誤差系統(tǒng)模型;
46、一元非線性函數(shù)逼近器,用于在 t時(shí)刻,對(duì)于每一個(gè)稀疏分布的智能體,將其位置 m i( t)輸入至第一rbf神經(jīng)網(wǎng)絡(luò),得到一元非線性函數(shù)值 f i( m i( t));
47、二元非線性函數(shù)逼近器,用于在 t時(shí)刻,對(duì)于每一個(gè)密集分布的智能體,將其位置 s( z, t)輸入至第二rbf神經(jīng)網(wǎng)絡(luò),得到二元非線性函數(shù)值 g( s( z, t));
48、第一神經(jīng)自適應(yīng)控制器,用于在 t時(shí)刻,對(duì)于每一個(gè)稀疏分布的智能體,計(jì)算用于控制其速度變化的控制信號(hào)為:;
49、第二神經(jīng)自適應(yīng)控制器,用于在 t時(shí)刻,對(duì)于每一個(gè)密集分布的智能體,計(jì)算用于控制其速度變化的控制信號(hào)為:;
50、第一誤差跟蹤模塊,用于對(duì)于每一個(gè)稀疏分布的智能體,將其對(duì)應(yīng)的一元非線性函數(shù)值 f i( m i( t))和控制信號(hào)代入其所對(duì)應(yīng)的ode誤差系統(tǒng)模型,以計(jì)算相應(yīng)的跟蹤誤差;
51、第二誤差跟蹤模塊,用于對(duì)于每一個(gè)密集分布的智能體,將其對(duì)應(yīng)的二元非線性函數(shù)值 g( s( z, t))和控制信號(hào)代入密集分布的智能體所共享的pde誤差系統(tǒng)模型,以計(jì)算相應(yīng)的跟蹤誤差;
52、控制模塊,用于在 t時(shí)刻判斷所有智能體對(duì)應(yīng)的跟蹤誤差是否收斂,若是,則結(jié)束編隊(duì)控制;若否,則對(duì)各智能體繼續(xù)更新控制信號(hào),使得所有智能體對(duì)應(yīng)的跟蹤誤差均收斂,并使實(shí)體對(duì)象執(zhí)行相應(yīng)的動(dòng)作;
53、其中,表示密集分布智能體的相對(duì)位置, l表示密集分布智能體的分布范圍;第一rbf神經(jīng)網(wǎng)絡(luò)的權(quán)值向量;第二rbf神經(jīng)網(wǎng)絡(luò)為二元的rbf神經(jīng)網(wǎng)絡(luò),且為第二rbf神經(jīng)網(wǎng)絡(luò)的二元權(quán)值向量;和均為已知的連續(xù)rbf向量。
54、按照本發(fā)明的又一個(gè)方面,提供了一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序;計(jì)算機(jī)程序被處理器執(zhí)行時(shí),實(shí)現(xiàn)本發(fā)明提供的上述基于ode-pde的編隊(duì)控制方法。
55、按照本發(fā)明的又一個(gè)方面,提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),包括存儲(chǔ)的計(jì)算機(jī)程序;計(jì)算機(jī)程序被處理器執(zhí)行時(shí),控制計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)所在設(shè)備執(zhí)行本發(fā)明提供的上述基于ode-pde的編隊(duì)控制方法。
56、按照本發(fā)明的又一個(gè)方面,提供了一種電子設(shè)備,包括:
57、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),用于存儲(chǔ)計(jì)算機(jī)程序;
58、以及處理器,用于讀取計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中的計(jì)算機(jī)程序,執(zhí)行本發(fā)明提供的上述基于ode-pde的編隊(duì)控制方法。
59、總體而言,通過(guò)本發(fā)明所構(gòu)思的以上技術(shù)方案,能夠取得以下有益效果:
60、(1)本發(fā)明提供的基于ode-pde的編隊(duì)控制方法,建立待控制系統(tǒng)對(duì)應(yīng)的異構(gòu)多智能體系統(tǒng)模型后,先建立各智能體對(duì)應(yīng)的ode模型并基于此建立用于反映各智能體跟蹤誤差變化率的ode誤差系統(tǒng)模型,之后通過(guò)將所有密集分布的智能體對(duì)應(yīng)的ode誤差系統(tǒng)模型進(jìn)行連續(xù)化處理,得到密集分布的智能體共享的pde誤差系統(tǒng)模型,基于相應(yīng)的誤差系統(tǒng)模型即可實(shí)現(xiàn)后續(xù)的編隊(duì)控制。本發(fā)明中,每個(gè)稀疏分布的智能體對(duì)應(yīng)一個(gè)ode誤差系統(tǒng)模型,所有密集分布的智能體共享一個(gè)pde誤差系統(tǒng)模型,由此提出了一種新的ode-pde分析方法,一方面,與普遍采用的ode方法相比,由于多智能體系統(tǒng)中稀疏分布的智能體數(shù)量往往較少,本發(fā)明用一個(gè)pde誤差系統(tǒng)模型和少數(shù)幾個(gè)ode誤差系統(tǒng)模型即可準(zhǔn)確刻畫(huà)大規(guī)模多智能體系統(tǒng)的集體動(dòng)力學(xué),在分析簡(jiǎn)便性方面具備明顯的優(yōu)勢(shì),對(duì)于大規(guī)模系統(tǒng)也可進(jìn)行更有效的控制。另一方面,與現(xiàn)有的pde方法相比,本發(fā)明可適用于智能體稀疏/密集混合分布的情形,因此,本發(fā)明具備更廣泛的適用性??傮w而言,本發(fā)明能有效利用多智能體系統(tǒng)的協(xié)同控制實(shí)現(xiàn)任意規(guī)模、任意分布的系統(tǒng)的編隊(duì)控制。
61、(2)本發(fā)明所建立的異構(gòu)多智能體系統(tǒng)模型中,稀疏分布的智能體與密集分布的智能體對(duì)應(yīng)的非線性函數(shù)不同,充分考慮了系統(tǒng)的異構(gòu)性,并且對(duì)于稀疏分布的智能體和密集分布的智能體,分別使用一元rbf神經(jīng)網(wǎng)絡(luò)和二元rbf神經(jīng)網(wǎng)絡(luò)逼近相應(yīng)的非線性函數(shù),rbf神經(jīng)網(wǎng)絡(luò)通過(guò)多個(gè)rbf來(lái)逼近目標(biāo)曲線,在智能體的非線性復(fù)雜且未知的情況下,也可以準(zhǔn)確得到相應(yīng)的非線性函數(shù)值。此外,本發(fā)明通過(guò)構(gòu)造二元基函數(shù)直接逼近二元非線性函數(shù),有效降低了現(xiàn)有rbf神經(jīng)網(wǎng)絡(luò)逼近二元非線性函數(shù)過(guò)程中的精度損失。
62、(3)在本發(fā)明的優(yōu)選方案中,使用兩個(gè)相互獨(dú)立的半馬爾可夫過(guò)程分別刻畫(huà)稀疏分布的智能體和密集分布的智能體與其他智能體間通信的信號(hào)強(qiáng)度變化,其中半馬爾可夫切換規(guī)則會(huì)根據(jù)不同的智能體拓?fù)浣Y(jié)構(gòu)而變化,由此能夠描述異構(gòu)多智能體系統(tǒng)中不一致的拓?fù)淝袚Q現(xiàn)象,進(jìn)一步提高編隊(duì)控制的實(shí)用性。
63、(4)在本發(fā)明的優(yōu)選方案中,為控制信號(hào)計(jì)算所依賴的rbf神經(jīng)網(wǎng)絡(luò)的權(quán)值向量設(shè)計(jì)了基于投影規(guī)則的自適應(yīng)更新率,由此實(shí)現(xiàn)了一種新的基于投影規(guī)則的神經(jīng)自適應(yīng)控制方案,并構(gòu)造了可實(shí)現(xiàn)誤差系統(tǒng)有限時(shí)間穩(wěn)定性的線性矩陣不等式,基于該不等式確定相關(guān)的控制器增益,由此可以實(shí)現(xiàn)誤差系統(tǒng)的實(shí)際有限時(shí)間穩(wěn)定性,更能滿足實(shí)際系統(tǒng)的時(shí)效性要求,進(jìn)一步提高編隊(duì)控制的實(shí)用性。