本發(fā)明涉及多智能體系統(tǒng)一致性領(lǐng)域,具體涉及一種在切換拓撲條件下基于topsis綜合決策的多智能體系統(tǒng)一致性算法。
背景技術(shù):
0、技術(shù)背景
1、自然界中的許多生物,如螞蟻、鳥類和魚類,通過群體行為和信息交流來完成復(fù)雜的任務(wù),這種群體協(xié)作的機制啟發(fā)了多智能體系統(tǒng)的設(shè)計。多智能體系統(tǒng)是一種分布式控制系統(tǒng),系統(tǒng)中的智能體可以通過簡單的局部交互規(guī)則與鄰域智能體進行通信交流,自治地調(diào)整自己的狀態(tài),使得在整體層面上呈現(xiàn)出一種有序的協(xié)同運動和智能行為。
2、一致性問題是多智能體系統(tǒng)中的關(guān)鍵,它關(guān)注如何通過分布式控制算法使所有智能體的狀態(tài)(如位置、速度等)最終達到一致。一致性問題是通過設(shè)計合理的分布式控制算法(即一致性協(xié)議)解決,良好的算法能夠促進智能體之間的有效通信和合作,即使在環(huán)境變化的情況下,也能使系統(tǒng)狀態(tài)趨于統(tǒng)一。
3、網(wǎng)絡(luò)拓撲結(jié)構(gòu)分為固定拓撲和切換拓撲兩類。固定拓撲結(jié)構(gòu)是指隨著環(huán)境和時間的變化多智能體系統(tǒng)的網(wǎng)絡(luò)拓撲結(jié)構(gòu)固定不變;切換拓撲結(jié)構(gòu)是指多智能體系統(tǒng)的網(wǎng)絡(luò)拓撲結(jié)構(gòu)隨著環(huán)境的變化和時間的推移而變化。通常,智能體依據(jù)一致性協(xié)議與鄰域智能體進行通信交流,智能體位置狀態(tài)發(fā)生變化或者智能體發(fā)生故障時,系統(tǒng)的網(wǎng)絡(luò)拓撲結(jié)構(gòu)也會隨之發(fā)生變化。
4、在現(xiàn)有的分布式系統(tǒng)中,離散時間模型存在智能體初始數(shù)量和拓撲結(jié)構(gòu)的不確定性以及時變性,導(dǎo)致在現(xiàn)有一致性協(xié)議作用下收斂緩慢。因此,關(guān)鍵問題在于如何在離散時間模型下設(shè)計出基于切換拓撲的分布式一致性協(xié)議,使得在保持系統(tǒng)穩(wěn)定的前提下有效提高收斂速度。
5、本發(fā)明提出一種基于topsis綜合決策的切換拓撲下多智能體系統(tǒng)一致性方法。通過提取拓撲網(wǎng)絡(luò)諸多屬性信息,可以得知智能體與智能體之間的內(nèi)在聯(lián)系;通過topsis綜合決策方法,可以全面準確地評價智能體,篩選出利于收斂的重要智能體,并基于此設(shè)計一致性協(xié)議,促進系統(tǒng)收斂。
技術(shù)實現(xiàn)思路
1、本發(fā)明目的是解決現(xiàn)有一致性算法在大規(guī)模密集多智能體系統(tǒng)結(jié)構(gòu)下收斂過慢甚至無法收斂問題,提供了一種基于topsis模型的重要智能體評價策略,篩選出更有價值的鄰居智能體進行通信,降低大量通信代價;同時,設(shè)計一個新的一致性協(xié)議,來提升收斂速度。
2、本發(fā)明中提出的topsis綜合決策多智能體系統(tǒng)一致性方法,通過對離散時間下每一時刻的拓撲進行分析來進行智能體狀態(tài)更新和演化,具體步驟如下:
3、s100:切換拓撲下分布式離散時間模型多智能體系統(tǒng)下,在時刻,所有智能體感知并存儲通信半徑內(nèi)的所有鄰居智能體信息;
4、s200:結(jié)合智能體信息所構(gòu)成的拓撲結(jié)構(gòu),設(shè)計一個基于topsis模型的重要智能體評價篩選策略,篩選出重要智能體,使智能體只與重要智能體交互,而不是與鄰域內(nèi)所有智能體交互;
5、s300:設(shè)計一致性協(xié)議,并根據(jù)篩選出的重要智能體,計算出下一時刻智能體的候選狀態(tài);
6、s400:所有智能體根據(jù)一致性協(xié)議計算出自身下一時刻的狀態(tài)進行演化,進而得到下一時刻整個系統(tǒng)智能體的狀態(tài)情況,并進行多智能體系統(tǒng)一致性判定。
7、進一步地,步驟s100中所述的鄰居智能體信息,主要包括兩個方面:
8、(1)鄰居智能體狀態(tài)信息:;
9、(2)拓撲結(jié)構(gòu)屬性信息:鄰居的鄰居數(shù),記作、與所有鄰居的共同鄰居數(shù),記作、與所有鄰居的狀態(tài)距離,記作。與所有鄰居的共同鄰居數(shù)定義表達式如下:
10、
11、其中,表示集合的模數(shù);與所有鄰居的狀態(tài)距離定義表達式如下:
12、
13、其中,表示l2范數(shù)。
14、進一步地,步驟s200中所述設(shè)計一個基于topsis模型的重要智能體評價篩選策略,其步驟包括:
15、s210:決策矩陣構(gòu)建:設(shè)智能體在時刻下有個鄰居智能體,其對應(yīng)集合為,屬性信息集為(分別對應(yīng)權(quán)利要求3所述鄰居的鄰居數(shù)、與所有鄰居的共同鄰居數(shù)、與所有鄰居的狀態(tài)距離三個屬性),對的值為,形成決策矩陣:
16、
17、s220:規(guī)范化處理:由于不同屬性的描述單位不一,數(shù)值上差異巨大,導(dǎo)致量綱效應(yīng),所以需要進行規(guī)范化處理,將不同單位的屬性值轉(zhuǎn)換到同一尺度上,得到規(guī)范化處理后的矩陣,其中轉(zhuǎn)換規(guī)則如下所示:
18、
19、s230:確定正理想狀態(tài)以及負理想狀態(tài):正理想狀態(tài)代表的是某一屬性信息下從所有待評價鄰居中選出的最優(yōu)值的集合,用表示;負理想狀態(tài)代表的是某一屬性信息下從所有待評價鄰居中選出的最差值的集合,用表示。其中,集合元素定義如下:
20、
21、
22、所述確定正負理想狀態(tài)中,鄰居的鄰居數(shù)、與所有鄰居的共同鄰居數(shù)為正向指標,與所有鄰居的狀態(tài)距離為負向指標,故正理想狀態(tài)中前兩個屬性取最大值,第三個屬性取最小值;負理想狀態(tài)中前兩個屬性取最小值,第三個屬性取最大值。
23、s240:計算每個鄰居狀態(tài)到正理想狀態(tài)和負理想狀態(tài)的歐氏距離:用表示第個鄰居智能體狀態(tài)到正理想狀態(tài)的距離;用表示第個鄰居智能體狀態(tài)到負理想狀態(tài)的距離;具體定義式如下:
24、
25、
26、s250:計算每個鄰居智能體狀態(tài)的評價參考值:評價參考值記為,其定義式如下:
27、
28、s260:篩選重要鄰居智能體:將評價參考值從大到小進行排序,選取評價參考值前三所對應(yīng)的鄰居智能體,將其加入到重要鄰居集中,完成篩選。
29、進一步地,步驟s300中所述設(shè)計的分布式一致性協(xié)議,其步驟如下:
30、s310:計算候選狀態(tài)值:依據(jù)智能體狀態(tài)信息的維度,分維度進行考慮,新的候選狀態(tài)求解具體可以表示為:
31、
32、其中,表示在第維度上的候選狀態(tài)值,表示在所有篩選出的重要鄰居中的第維度上的狀態(tài)的最大值,表示在所有篩選出的重要鄰居中的第維度上的狀態(tài)的最小值。
33、s320:一致性演化規(guī)則:根據(jù)步驟s310所計算出的候選狀態(tài)值,一致性協(xié)議可以表示為智能體當前時刻的狀態(tài)加上所計算得出的候選狀態(tài)值,其表達式可表示為:
34、
35、其中,表示權(quán)衡系數(shù),影響著系統(tǒng)的收斂速度。
36、進一步地,步驟s400中,所述的系統(tǒng)一致性判定規(guī)則是,對于任意兩個智能體與,若均滿足條件:
37、
38、其中,表示閾值,一般而言,表示l2范數(shù)。
39、則可以認為系統(tǒng)達成一致性狀態(tài),收斂完畢;否則重復(fù)步驟s100,進行下一時刻的演化。
40、本發(fā)明與現(xiàn)有技術(shù)相比具有以下優(yōu)點:
41、(1)本發(fā)明能夠綜合拓撲多屬性信息進行決策。相比于其他智能體選擇策略,本發(fā)明通過挖掘和利用智能體所構(gòu)成的拓撲結(jié)構(gòu),將多種屬性信息列入決策參考,對于重要智能體的判斷更加精準;
42、(2)本發(fā)明能夠準確量化智能體重要性。相比于其他評價策略,基于topsis模型進行綜合計算會更加準確,對于智能體狀態(tài)評價參考值的量化更加合理;
43、(3)本發(fā)明能夠加快多智能體系統(tǒng)的收斂進程。相比于傳統(tǒng)一致性協(xié)議,本發(fā)明不僅減少了交互鄰居智能體數(shù),而且盡最大程度增加每一時刻的狀態(tài)變化量,可以幫助智能體減少通信代價的同時更快地達成狀態(tài)一致,加快系統(tǒng)整體收斂進度。