本發(fā)明屬于智能體控制技術(shù)領(lǐng)域,更為具體地講,涉及一種三維空間中多智能體系統(tǒng)的定位及環(huán)繞控制方法。
背景技術(shù):
多智能體系統(tǒng)的定位及環(huán)繞(包圍),是指通過對目標(biāo)的探測和智能體個體間的信息交互,設(shè)計控制協(xié)議,使得多智能體系統(tǒng)接近目標(biāo)并按照預(yù)定的包圍結(jié)構(gòu)對目標(biāo)形成包圍。分布式包圍控制在工程領(lǐng)域具有重要的應(yīng)用背景,包括:利用機(jī)器人的偵查問題;聯(lián)合救助或保護(hù)問題;資源定位問題;復(fù)雜和危險環(huán)境的監(jiān)測和預(yù)警工作等。
早期關(guān)于多智能體系統(tǒng)的包圍控制算法,通常假設(shè)可以獲得目標(biāo)的全部位置信息,然而,獲得全部位置信息需要的成本較高。因而,近期很多學(xué)者針對不完備的位置信息情況下的包圍控制展開了研究,建立了基于相對距離的包圍控制算法。但是,在實際的工程應(yīng)用中,很多情況下無法獲得相對距離信息,因而,基于方位角信息的包圍控制算法更具有重要意義。本發(fā)明就是在這樣一種背景下開展的。
盡管,目前已經(jīng)存在一些基于方位角信息的包圍控制算法的結(jié)果,然而大多數(shù)是針對二維環(huán)境展開的,而在三維空間中研究包圍控制問題具有重要的應(yīng)用價值,并且二維空間中的結(jié)果可以作為三維相關(guān)結(jié)果的特例。此外,大多數(shù)現(xiàn)有成果研究的是單一智能體的環(huán)繞問題或是特殊結(jié)構(gòu)的環(huán)繞問題。然而,研究多個智能體對目標(biāo)的環(huán)繞更有意義,因為多體合作可以實現(xiàn)單一個體無法實現(xiàn)的任務(wù)。另外,由于編隊問題可以看為一致性問題的延伸,所以一致環(huán)繞問題更值得研究。
技術(shù)實現(xiàn)要素:
本發(fā)明的目的在于克服現(xiàn)有技術(shù)的不足,提供一種三維空間中多智能體系統(tǒng)的定位及環(huán)繞控制方法,通過建立估計器并借助于估計器對目標(biāo)未知位置進(jìn)行定位,再通過設(shè)計分布式控制器和協(xié)調(diào)器,實現(xiàn)智能體系統(tǒng)對于未知目標(biāo)的幾類不同的環(huán)繞。
為實現(xiàn)上述發(fā)明目的,本發(fā)明一種三維空間中多智能體系統(tǒng)的定位及環(huán)繞控制方法,其特征在于,包括以下步驟:
(1)、建立估計器并利用對目標(biāo)位置進(jìn)行定位;
(1.1)、估計器
其中,表示一階導(dǎo),τij(t),j=1,2,3表示智能體體坐標(biāo)系的三個坐標(biāo)軸上的單位矢量,由智能體與目標(biāo)之間的方位角和環(huán)繞軌道的法向量決定,上角標(biāo)T表示轉(zhuǎn)置;xi(t)表示第i個智能體的位置;
(1.2)、判斷估計器是否收斂,如果收斂進(jìn)入步驟(1.3),如果不收斂則進(jìn)入步驟(1.2);
(1.3)、以環(huán)繞軌道的法向量為基準(zhǔn),將智能體與目標(biāo)間的方位角作為的輸入信號,利用對三維空間中多智能體系統(tǒng)中的目標(biāo)位置進(jìn)行定位;
(2)、建立控制器,使智能體完成對目標(biāo)的環(huán)繞;
其中,||*||表示歐式范數(shù),ρi表示第i個智能體環(huán)繞目標(biāo)的期望半徑,vi表示第i個智能體環(huán)繞目標(biāo)的期望速度,表示第i個智能體的協(xié)調(diào)器,ni表示第i個智能體對目標(biāo)的環(huán)繞軌道法向量;
(3)、根據(jù)多智能體間的信息交互情況,建立協(xié)調(diào)器,使多智能體系統(tǒng)按照一定的協(xié)調(diào)關(guān)系對目標(biāo)進(jìn)行環(huán)繞控制;
(3.1)、當(dāng)多智能體間有信息交互時,利用多智能體對目標(biāo)進(jìn)行一致環(huán)繞;
建立協(xié)調(diào)器
以智能體與目標(biāo)之間的方位角作為的輸入信號,當(dāng)滿足vi/ρi=vj/ρj≠0和時,多智能體系統(tǒng)實現(xiàn)對目標(biāo)的一致環(huán)繞;其中,kψ、μ為可設(shè)計的參數(shù),是由符號函數(shù)sgn構(gòu)造的函數(shù),即ψi(t)表示第i個智能體與目標(biāo)之間的方位角,n表示多智能體個數(shù);
(3.2)、當(dāng)多智能體間無信息交互時,利用多智能體對目標(biāo)進(jìn)行均勻環(huán)繞或一致環(huán)繞;
(a)、當(dāng)每個智能體間為完全探測時,利用多智能體對目標(biāo)進(jìn)行均勻環(huán)繞或一致環(huán)繞;
均勻環(huán)繞時,建立協(xié)調(diào)器
以相鄰智能體相對目標(biāo)形成的夾角作為的輸入信號,當(dāng)滿足vi=v≠0及時,多智能體系統(tǒng)實現(xiàn)對目標(biāo)均勻環(huán)繞;其中,為可設(shè)計的參數(shù),δi(t)表示智能體i和智能體i+1相對目標(biāo)形成的夾角,v和ρ表示每個智能體環(huán)繞目標(biāo)的期望速度和期望半徑,且均相同;
一致環(huán)繞時,建立協(xié)調(diào)器
以相鄰智能體相對目標(biāo)形成的夾角作為的輸入信號,當(dāng)滿足vi=v≠0及時,多智能體系統(tǒng)實現(xiàn)對目標(biāo)一致環(huán)繞;其中,為可設(shè)計的參數(shù);
(b)、當(dāng)每個智能體間的探測關(guān)系滿足生成樹時,將多智能體系統(tǒng)按照生成樹分成多個組,再利用每組多智能體對目標(biāo)進(jìn)行一致環(huán)繞;
建立協(xié)調(diào)器
以相鄰智能體相對目標(biāo)形成的夾角作為的輸入信號,當(dāng)滿足vi=vl≠0,i∈{i|xi∈L},及kl<vl/(2πρl)時,按照生成樹分成的各組智能體均實現(xiàn)對目標(biāo)的一致環(huán)繞,其中,kl為可設(shè)計的參數(shù),l表示按生成樹分組的組標(biāo)號,vl和ρl表示第l組智能體環(huán)繞目標(biāo)的期望速度和期望半徑,且均相同。
本發(fā)明的發(fā)明目的是這樣實現(xiàn)的:
本發(fā)明一種三維空間中多智能體系統(tǒng)的定位及環(huán)繞控制方法,首先建立了對未知目標(biāo)的估計器,結(jié)合估計器的平面收斂性,對目標(biāo)未知位置進(jìn)行定位;其次,設(shè)計分布式控制器和協(xié)調(diào)器,結(jié)合多智能體間有通信及無通信兩種情況,建立了三種環(huán)繞算法,實現(xiàn)智能體系統(tǒng)對于未知目標(biāo)的不同類的環(huán)繞。
同時,本發(fā)明一種三維空間中多智能體系統(tǒng)的定位及環(huán)繞控制方法還具有以下有益效果:
1、本發(fā)明是在3D中實現(xiàn)定位及環(huán)繞,這更具備實際應(yīng)用價值,因為在空間中我們需要考慮三維的情形;
2、本發(fā)明是考慮了多個智能體的協(xié)同,現(xiàn)有的結(jié)果通常只考慮了單一智能體對目標(biāo)的包圍,雖有很少結(jié)果考慮了多個智能體的情形,但是是在2D中實現(xiàn)的;
3、本發(fā)明考慮了多種形式的環(huán)繞,包括:多個軌道的環(huán)繞;一致環(huán)繞(多個智能體最終收斂到一起);均勻分布的環(huán)繞(智能體均勻分布在環(huán)繞軌道),顯然這提供了更廣泛的應(yīng)用前景;
4、本發(fā)明考慮只有方位角可測情況下的環(huán)繞定位(區(qū)別于距離和角度均可測),這具有實際的應(yīng)用價值,因為通常在GPS失效的情況下,測得距離信息是有難度的。
附圖說明
圖1是本發(fā)明一種三維空間中多智能體系統(tǒng)的定位及環(huán)繞控制方法流程圖;
圖2是多智能體系統(tǒng)拓?fù)浣Y(jié)構(gòu)圖;
圖3是圖2所示拓?fù)浣Y(jié)構(gòu)圖在相同期望軌道時的系統(tǒng)運(yùn)動軌跡仿真圖;
圖4是圖2所示拓?fù)浣Y(jié)構(gòu)圖在不同期望軌道時的系統(tǒng)運(yùn)動軌跡仿真圖;
圖5是目標(biāo)可以完全被探測時多智能體系統(tǒng)的均勻環(huán)繞軌跡仿真圖;
圖6是目標(biāo)可以完全被探測時多智能體系統(tǒng)的一致環(huán)繞軌跡仿真圖;
圖7是子群X1及X2中的生成樹;
圖8是含有生成樹時多智能一致環(huán)繞軌跡仿真圖。
具體實施方式
下面結(jié)合附圖對本發(fā)明的具體實施方式進(jìn)行描述,以便本領(lǐng)域的技術(shù)人員更好地理解本發(fā)明。需要特別提醒注意的是,在以下的描述中,當(dāng)已知功能和設(shè)計的詳細(xì)描述也許會淡化本發(fā)明的主要內(nèi)容時,這些描述在這里將被忽略。
實施例
為了方便描述,先對具體實施方式中出現(xiàn)的相關(guān)專業(yè)術(shù)語進(jìn)行說明:
本發(fā)明建立了智能體系統(tǒng)在三維環(huán)境下對僅可獲悉方位信息的未知目標(biāo)的定位及環(huán)繞控制方案。本發(fā)明建立了三種環(huán)繞算法,第一種算法是在有通信情況下實現(xiàn)的,而另外兩種是在沒有通信的情況下實現(xiàn)的。
其中,第一種算法假定方位信息可以在鄰居個體間分享,利用該算法可實現(xiàn)智能體系統(tǒng)在不同軌道對目標(biāo)的環(huán)繞。第二種算法不要求智能體間有通信,但要求每個智能體都能夠獲得其他智能體的方位角,該算法能夠?qū)崿F(xiàn)智能體系統(tǒng)在同一軌道對目標(biāo)的環(huán)繞,隨著協(xié)調(diào)器選取不同,這種環(huán)繞可以是一致的也可以是均勻的。第三種算法同樣不要求智能體間有通信,但要求智能體系統(tǒng)可以按照有向樹探測拓?fù)浞纸M,該算法使得位于同一有向樹探測拓?fù)渲械闹悄荏w能夠以相同的軌道環(huán)繞目標(biāo)。下面結(jié)合實施對本發(fā)明進(jìn)行詳細(xì)說明,具體如下。
圖1是本發(fā)明一種三維空間中多智能體系統(tǒng)的定位及環(huán)繞控制方法流程圖。在本實施例中,如圖1所示,本發(fā)明一種三維空間中多智能體系統(tǒng)的定位及環(huán)繞控制方法,包括以下步驟:
S1、建立估計器并利用對目標(biāo)位置進(jìn)行定位;
S1.1、估計器
其中,表示一階導(dǎo),τij(t),j=1,2,3表示智能體體坐標(biāo)系的三個坐標(biāo)軸上的單位矢量,由智能體與目標(biāo)之間的方位角和環(huán)繞軌道的法向量決定,上角標(biāo)T表示轉(zhuǎn)置;xi(t)表示第i個智能體的位置;
估計器的主要作用是實現(xiàn)定位,通過該步可知,估計器的構(gòu)造需要xi(t),而它正是控制器的輸出,因此定位是否能夠?qū)崿F(xiàn)依賴于智能體的控制;
S1.2、利用估計器對目標(biāo)位置進(jìn)行定位時,需要先判斷估計器是否收斂,只有當(dāng)估計器收斂時才能對目標(biāo)位置進(jìn)行定位;
其中,估計器進(jìn)行收斂判斷的方法為:
1)、在T坐標(biāo)系下的坐標(biāo)記為[ri1(t) ri2(t) ri3(t)]T;證明估計器與目標(biāo)的偏差在τi2和τi3軸的坐標(biāo)趨于0,即:
其中,r表示目標(biāo)的位置;
2)、設(shè)智能體運(yùn)動速率在τi2軸分量正定有界,即存在實數(shù)及使得對所有t≥0滿足那么,當(dāng)t→∞時,ri1(t)→0;
3)、設(shè)存在及R+為正實數(shù),R為實數(shù),使得對所有t≥0滿足那么通過步驟S2所設(shè)計的控制器能夠使得估計器收斂,則由1)及2)有,
當(dāng)估計器收斂時,進(jìn)入步驟S1.3,否則進(jìn)入步驟S1.2進(jìn)行重新判斷;
S1.3、以環(huán)繞軌道的法向量為基準(zhǔn),將智能體與目標(biāo)間的方位角作為的輸入信號,利用對三維空間中多智能體系統(tǒng)中的目標(biāo)位置進(jìn)行定位;
S2、建立控制器,使智能體完成對目標(biāo)的環(huán)繞;
其中,||*||表示歐式范數(shù),ρi表示第i個智能體環(huán)繞目標(biāo)的期望半徑,vi表示第i個智能體環(huán)繞目標(biāo)的期望速度,表示第i個智能體的協(xié)調(diào)器,ni表示第i個智能體對目標(biāo)的環(huán)繞軌道法向量;
控制器的主要作用是實現(xiàn)環(huán)繞,通過該步驟可知:控制器的構(gòu)建需要而它正是估計器;其次,控制器同時給智能體系統(tǒng)的協(xié)調(diào)留有裕度,即引入?yún)f(xié)調(diào)器
S3、根據(jù)多智能體間的信息交互情況,建立協(xié)調(diào)器,使多智能體系統(tǒng)按照一致環(huán)繞、均勻環(huán)繞等協(xié)調(diào)關(guān)系對目標(biāo)進(jìn)行環(huán)繞控制;
S3.1、當(dāng)多智能體間有信息交互時,利用多智能體對目標(biāo)進(jìn)行一致環(huán)繞;
根據(jù)控制器對協(xié)調(diào)器的要求,建立協(xié)調(diào)器
以智能體與目標(biāo)之間的方位角作為的輸入信號,當(dāng)滿足vi/ρi=vj/ρj≠0和kψ<vi/[(n-1)(2π)μρi]時,多智能體系統(tǒng)實現(xiàn)對目標(biāo)的一致環(huán)繞;其中,kψ、μ為可設(shè)計的參數(shù),是由符號函數(shù)sgn構(gòu)造的函數(shù),即ψi(t)表示第i個智能體與目標(biāo)之間的方位角,n表示智能體個數(shù);
設(shè)t=0時所有智能體已經(jīng)處于目標(biāo)軌道,再證明智能體系統(tǒng)最終達(dá)成一致環(huán)繞,即limt→∞[ψj(t)-ψi(t)]=0,i=1,2,…,n,j=1,2,…,n。
令由于即ψi(t)=-vit/ρi+φi(t)。顯然成立:
可以證明φi(t),i=1,2,…,n,是收斂的,從而,結(jié)論成立。
S3.2、當(dāng)多智能體間無信息交互時,利用多智能體對目標(biāo)進(jìn)行均勻環(huán)繞或一致環(huán)繞;
(a)、設(shè)每個智能體可以獲悉目標(biāo)和其它智能體的方位信息,即每個智能體間為完全探測時,利用多智能體對目標(biāo)進(jìn)行均勻環(huán)繞或一致環(huán)繞;
均與環(huán)繞:
根據(jù)控制器對協(xié)調(diào)器的要求,建立協(xié)調(diào)器
以相鄰智能體相對目標(biāo)形成的夾角作為的輸入信號,當(dāng)滿足vi=v≠0及時,多智能體系統(tǒng)實現(xiàn)對目標(biāo)均勻環(huán)繞;其中,為可設(shè)計的參數(shù),δi(t)表示智能體i和智能體i+1相對目標(biāo)形成的夾角,v和ρ表示每個智能體環(huán)繞目標(biāo)的期望速度和期望半徑,且均相同;
設(shè)t=0時所有智能體已經(jīng)處于目標(biāo)軌道,再證明智能體系統(tǒng)最終達(dá)成均勻環(huán)繞,即limt→∞[δi(t)-δi-1(t)]=0,i=1,2,…,n。
令由于即ψi(t)=-vt/ρ+φi(t)。顯然,δi(t)=ii+1(t)-ψi(t)=φi+1(t)-φi(t),并且那么
選擇李雅普諾夫函數(shù)為計算得到:
基于拉塞爾不變原理,上述結(jié)論成立。
一致環(huán)繞:
根據(jù)控制器對協(xié)調(diào)器的要求,建立協(xié)調(diào)器
以相鄰智能體相對目標(biāo)形成的夾角作為的輸入信號,當(dāng)滿足vi=v≠0及時,多智能體系統(tǒng)實現(xiàn)對目標(biāo)一致環(huán)繞;其中,為可設(shè)計的參數(shù)。
設(shè)t=0時所有智能體已經(jīng)處于目標(biāo)軌道,再證明智能體系統(tǒng)最終達(dá)成一致環(huán)繞,即只需證明存在i0∈{1,2,…,n}使得并且limt→∞δi(t)=0,i≠i0。
令但此時所以
選擇李雅普諾夫函數(shù)為通過計算得到
利用及李雅普諾夫理論,結(jié)論成立。
(b)、當(dāng)每個智能體間的探測關(guān)系滿足生成樹時,將多智能體系統(tǒng)按照生成樹分成多個組,再利用每組多智能體對目標(biāo)進(jìn)行一致環(huán)繞;
根據(jù)控制器對協(xié)調(diào)器的要求,建立協(xié)調(diào)器
以相鄰智能體相對目標(biāo)形成的夾角作為的輸入信號,當(dāng)滿足vi=vl≠0,i∈{i|xi∈L},及kl<vl/(2πρl)時,按照生成樹分成的各組智能體均實現(xiàn)對目標(biāo)的一致環(huán)繞,其中,kl為可設(shè)計的參數(shù),l表示按生成樹分組的組標(biāo)號,vl和ρl表示第l組智能體環(huán)繞目標(biāo)的期望速度和期望半徑,且均相同。
設(shè)t=0時所有智能體已經(jīng)處于目標(biāo)軌道,再證明智能體系統(tǒng)最終達(dá)成一致環(huán)繞;
設(shè)每個子群僅有一個生成樹,下面僅需要證明如果父個體是收斂的,那么xi也是收斂的,即:如果那么limt→∞δi(t)=0。
令顯然,結(jié)合步驟(b)中的協(xié)調(diào)器得到通過計算得到它的解為:
對方程兩端取極限,并考慮到產(chǎn)生limt→∞δi(t)=0。結(jié)論成立。
協(xié)調(diào)器的主要作用是實現(xiàn)智能體間的協(xié)調(diào),它通過參與控制實現(xiàn)多種智能體系統(tǒng)的協(xié)調(diào)關(guān)系。
實驗仿真
本發(fā)明目的是設(shè)計三維空間中對于未知目標(biāo)的定位及環(huán)繞控制方案。為了說明本發(fā)明技術(shù)方案中的相關(guān)設(shè)計要點(diǎn)及參數(shù)設(shè)計方法,這里通過一個具有代表性的系統(tǒng)來展示。
在本實施例中,仿真和檢驗都在Matlab和Simulink環(huán)境下進(jìn)行的。在仿真過程中,采用了固定步長5ms。ODE算子采用4階Runge-Kutta法。本實施例中,考慮系統(tǒng)中有6個智能體的情形,并且初始位置記為X(0)=[x1(0) x2(0) x3(0) x4(0) x5(0) x6(0)],那么
假設(shè)目標(biāo)的位置為r=[1 0 0]T。軌線O(r,1.2,[0 1 1]T)簡記為OR,O(r,1.2,[0 -1 1]T)及O(r,0.8,[0 -1 1]T)分別記為OL和Ol。
(1)、有通信時的一致環(huán)繞
多智能體系統(tǒng)X的拓?fù)浣Y(jié)構(gòu)如圖2所示。假定方位信息可以在具有鄰居關(guān)系的個體間分享,并且每個智能體具有相同的期望軌跡OL。利用本發(fā)明提供的算法,我們給出了針對上述系統(tǒng)的仿真結(jié)果,如圖3所示,其中,vi取值為-π/5,,kψ和μ分別為及0.5。
我們進(jìn)一步展示了等方位角的環(huán)繞運(yùn)動。假定智能體x1及x4具有期望軌線OL,而智能體x2及x5具有期望軌線Ol,智能體x3及x6具有期望軌線OR。那么,取vi為-π/5,v2=v5=-2i/15,i=1,3,4,6,其它的參數(shù)與上相同,所得到的仿真結(jié)果如圖4所示。
仿真結(jié)果顯示,當(dāng)拓?fù)浣Y(jié)構(gòu)為無向的和聯(lián)通時,利用本發(fā)明所提供的算法能夠?qū)崿F(xiàn)多智能體系統(tǒng)對目標(biāo)的定位及一致環(huán)繞。這里,期望的軌線可以是相同的,也可以是不同的。
(2)、無通信且信息可以完全探測
假定每個智能體具有相同的期望軌線OL。那么,利用本發(fā)明所提供的算法,我們建立的仿真結(jié)果如圖5,6所示,其中,vi選取為-π/5,及均選為1/12。
仿真結(jié)果顯示,當(dāng)多智能體系統(tǒng)具有完全探測能力時,無通信時,本發(fā)明所提供的算法能夠?qū)崿F(xiàn)多智能體系統(tǒng)對目標(biāo)的定位及均勻環(huán)繞或一致環(huán)繞。
(3)、探測關(guān)系無交流且具有生成樹
假定多智能體系統(tǒng)被分為兩組,X1={x1,x2}及X2={x3,x4,x5,x6},且X1及X2中的生成樹如圖7所示。子群X1具有期望的軌線OR,X2具有期望的軌線Ol。那么,利用本發(fā)明所提供的算法,我們建立的仿真結(jié)果如圖8所示。其中,v1及v2取為-π/5,vi,i=3,4,5,6,取為-2π/15,而kl取為1/12。
仿真結(jié)果顯示,當(dāng)多智能體系統(tǒng)具有多個分組,每個分組具有一個生成樹時,利用本發(fā)明所提供的算法,在不需要通信的情況下能夠?qū)崿F(xiàn)每組多智能體系統(tǒng)對目標(biāo)的定位及一致環(huán)繞。
盡管上面對本發(fā)明說明性的具體實施方式進(jìn)行了描述,以便于本技術(shù)領(lǐng)域的技術(shù)人員理解本發(fā)明,但應(yīng)該清楚,本發(fā)明不限于具體實施方式的范圍,對本技術(shù)領(lǐng)域的普通技術(shù)人員來講,只要各種變化在所附的權(quán)利要求限定和確定的本發(fā)明的精神和范圍內(nèi),這些變化是顯而易見的,一切利用本發(fā)明構(gòu)思的發(fā)明創(chuàng)造均在保護(hù)之列。