本技術(shù)涉及機(jī)器人控制,尤其涉及非線性約束下混合積分離散神經(jīng)網(wǎng)絡(luò)的機(jī)器人控制方法。
背景技術(shù):
1、機(jī)器人的控制涉及多種非線性問題,以及不同動態(tài)環(huán)境,包括考慮工作空間的障礙物、運(yùn)動約束和任務(wù)要求。許多實(shí)際應(yīng)用中,大多數(shù)機(jī)器人的控制系統(tǒng)是基于數(shù)字控制器運(yùn)行的,即控制器本身是離散時間系統(tǒng),因此導(dǎo)致連續(xù)時間求解器在實(shí)際應(yīng)用中不夠高效,可能產(chǎn)生數(shù)值誤差和響應(yīng)延遲。
2、現(xiàn)有方案大多在連續(xù)時間下設(shè)計求解器,通常涉及復(fù)雜的非線性優(yōu)化問題,導(dǎo)致計算負(fù)荷較重,實(shí)時性較差,尤其是在實(shí)時控制任務(wù)中表現(xiàn)不理想,不利于實(shí)際作業(yè)。
技術(shù)實(shí)現(xiàn)思路
1、本技術(shù)實(shí)施例的主要目的在于提出非線性約束下混合積分離散神經(jīng)網(wǎng)絡(luò)的機(jī)器人控制方案,以提高機(jī)器人控制任務(wù)的精度和計算效率,提升機(jī)器人控制任務(wù)的穩(wěn)定性和適應(yīng)性。
2、為實(shí)現(xiàn)上述目的,本技術(shù)實(shí)施例的一方面提出了非線性約束下混合積分離散神經(jīng)網(wǎng)絡(luò)的機(jī)器人控制方法,所述方法包括以下步驟:
3、構(gòu)建機(jī)器人控制問題;其中,所述機(jī)器人控制問題包括目標(biāo)函數(shù)和約束方程;
4、根據(jù)拉格朗日乘子和非線性函數(shù)構(gòu)建所述機(jī)器人控制問題的偏差方程;
5、基于所述偏差方程構(gòu)建混合積分型神經(jīng)網(wǎng)絡(luò)求解器;
6、將所述混合積分型神經(jīng)網(wǎng)絡(luò)求解器轉(zhuǎn)換為離散時間下的矩陣形式作為離散時間模型;
7、將所述機(jī)器人控制問題的預(yù)期目標(biāo)輸入到所述離散時間模型,求解得到關(guān)節(jié)角目標(biāo)解;
8、將所述關(guān)節(jié)角目標(biāo)解發(fā)送到機(jī)器人的控制器,利用所述控制器根據(jù)所述關(guān)節(jié)角目標(biāo)解控制所述機(jī)器人運(yùn)動。
9、在一些實(shí)施例中,所述構(gòu)建機(jī)器人控制問題,包括以下步驟:
10、構(gòu)建所述機(jī)器人控制問題的所述目標(biāo)函數(shù)為:
11、;
12、其中,,表示機(jī)器人在時刻各關(guān)節(jié)的角速度值,為機(jī)器人的自由度;
13、構(gòu)建所述機(jī)器人控制問題的所述約束方程為:
14、;
15、其中,為等式約束方程,為不等式約束方程。
16、在一些實(shí)施例中,所述根據(jù)拉格朗日乘子和非線性函數(shù)構(gòu)建所述機(jī)器人控制問題的偏差方程,包括以下步驟:
17、根據(jù)拉格朗日乘子和非線性函數(shù)構(gòu)建所述機(jī)器人控制問題的偏差方程為:
18、;
19、其中,為所述偏差方程,;為所述機(jī)器人控制問題的解,;、分別為所述等式約束方程和所述不等式約束方程的拉格朗日乘子;為所述不等式約束方程的非線性函數(shù)關(guān)系。
20、在一些實(shí)施例中,所述基于所述偏差方程構(gòu)建混合積分型神經(jīng)網(wǎng)絡(luò)求解器,包括以下步驟:
21、構(gòu)建混合積分型神經(jīng)網(wǎng)絡(luò)的表達(dá)式;
22、所述混合積分型神經(jīng)網(wǎng)絡(luò)的表達(dá)式為:
23、;
24、其中,為所述混合積分型神經(jīng)網(wǎng)絡(luò)的表達(dá)式;為常數(shù);為積分變量,所述積分變量的積分下限是0,第一積分上限是t,第二積分上線是;
25、根據(jù)所述偏差方程和所述混合積分型神經(jīng)網(wǎng)絡(luò)的表達(dá)式構(gòu)建所述混合積分型神經(jīng)網(wǎng)絡(luò)求解器;
26、所述混合積分型神經(jīng)網(wǎng)絡(luò)求解器為:
27、;
28、其中,為所述混合積分型神經(jīng)網(wǎng)絡(luò)求解器;為干擾項;
29、具體為:
30、;
31、其中,、為非線性函數(shù)關(guān)系的函數(shù)表達(dá)式,為所述等式約束方程的維度,為所述不等式約束方程的維度;
32、具體為:
33、;
34、具體為:
35、;
36、其中,表示對角矩陣。
37、在一些實(shí)施例中,所述將所述混合積分型神經(jīng)網(wǎng)絡(luò)求解器轉(zhuǎn)換為離散時間下的矩陣形式作為離散時間模型,包括以下步驟:
38、將所述混合積分型神經(jīng)網(wǎng)絡(luò)求解器轉(zhuǎn)換為矩陣形式;
39、矩陣形式的所述混合積分型神經(jīng)網(wǎng)絡(luò)求解器為:
40、;
41、其中,為所述偏差方程的積分項,;為所述偏差方程的雙積分項,;為中間參數(shù),用于化簡表達(dá)式,);,為的逆矩陣;
42、構(gòu)建離散時間表達(dá)式;
43、所述離散時間表達(dá)式為:
44、;
45、其中,為離散時間序列的導(dǎo)數(shù),為所述離散時間序列;為采樣周期;
46、根據(jù)所述離散時間表達(dá)式將矩陣形式的所述混合積分型神經(jīng)網(wǎng)絡(luò)求解器轉(zhuǎn)換為離散時間下的矩陣形式作為所述離散時間模型;
47、所述離散時間模型為:
48、;
49、其中,為在時間步為k時的值,為在時間步為k時的值,為在時間步為k時的值,為在時間步為k時的值,為在時間步為k時的值,為第k個時間步對應(yīng)的時間值,為干擾項在時間步為k時的值;k?為整數(shù),表示離散時間步的索引,k的取值范圍在0到6;
50、),。
51、在一些實(shí)施例中,所述將所述機(jī)器人控制問題的預(yù)期目標(biāo)輸入到所述離散時間模型,求解得到關(guān)節(jié)角目標(biāo)解,包括以下步驟:
52、將所述預(yù)期目標(biāo)的向量輸入到所述離散時間模型;
53、利用所述離散時間模型基于所述預(yù)期目標(biāo)的向量求解所述偏差方程為0時的解作為所述關(guān)節(jié)角目標(biāo)解。
54、在一些實(shí)施例中,所述方法還包括以下步驟:
55、獲取所述機(jī)器人的末端執(zhí)行器的當(dāng)前位置;
56、計算所述末端執(zhí)行器的當(dāng)前位置與當(dāng)前所述關(guān)節(jié)角目標(biāo)解的對應(yīng)位置之間的偏差值;
57、若所述偏差值大于預(yù)設(shè)閾值,則返回所述將所述機(jī)器人控制問題的預(yù)期目標(biāo)輸入到所述離散時間模型,求解得到最新的所述關(guān)節(jié)角目標(biāo)解;
58、基于最新的所述關(guān)節(jié)角目標(biāo)解,執(zhí)行所述將所述關(guān)節(jié)角目標(biāo)解發(fā)送到機(jī)器人的控制器,利用所述控制器根據(jù)所述關(guān)節(jié)角目標(biāo)解控制所述機(jī)器人運(yùn)動。
59、為實(shí)現(xiàn)上述目的,本技術(shù)實(shí)施例的另一方面提出了非線性約束下混合積分離散神經(jīng)網(wǎng)絡(luò)的機(jī)器人控制裝置,所述裝置包括:
60、控制問題構(gòu)建單元,用于構(gòu)建機(jī)器人控制問題;其中,所述機(jī)器人控制問題包括目標(biāo)函數(shù)和約束方程;
61、偏差方程構(gòu)建單元,用于根據(jù)拉格朗日乘子和非線性函數(shù)構(gòu)建所述機(jī)器人控制問題的偏差方程;
62、求解器構(gòu)建單元,用于基于所述偏差方程構(gòu)建混合積分型神經(jīng)網(wǎng)絡(luò)求解器;
63、求解器轉(zhuǎn)換單元,用于將所述混合積分型神經(jīng)網(wǎng)絡(luò)求解器轉(zhuǎn)換為離散時間下的矩陣形式作為離散時間模型;
64、關(guān)節(jié)角求解單元,用于將所述機(jī)器人控制問題的預(yù)期目標(biāo)輸入到所述離散時間模型,求解得到關(guān)節(jié)角目標(biāo)解;
65、機(jī)器人控制單元,用于將所述關(guān)節(jié)角目標(biāo)解發(fā)送到機(jī)器人的控制器,利用所述控制器根據(jù)所述關(guān)節(jié)角目標(biāo)解控制所述機(jī)器人運(yùn)動。
66、為實(shí)現(xiàn)上述目的,本技術(shù)實(shí)施例的另一方面提出了一種電子設(shè)備,所述電子設(shè)備包括存儲器和處理器,所述存儲器存儲有計算機(jī)程序,所述處理器執(zhí)行所述計算機(jī)程序時實(shí)現(xiàn)上述的方法。
67、為實(shí)現(xiàn)上述目的,本技術(shù)實(shí)施例的另一方面提出了一種計算機(jī)可讀存儲介質(zhì),所述計算機(jī)可讀存儲介質(zhì)存儲有計算機(jī)程序,所述計算機(jī)程序被處理器執(zhí)行時實(shí)現(xiàn)上述的方法。
68、本技術(shù)實(shí)施例至少包括以下有益效果:
69、本技術(shù)可以構(gòu)建機(jī)器人控制問題;其中,機(jī)器人控制問題包括目標(biāo)函數(shù)和約束方程;根據(jù)拉格朗日乘子和非線性函數(shù)構(gòu)建機(jī)器人控制問題的偏差方程;基于偏差方程構(gòu)建混合積分型神經(jīng)網(wǎng)絡(luò)求解器;將混合積分型神經(jīng)網(wǎng)絡(luò)求解器轉(zhuǎn)換為離散時間下的矩陣形式作為離散時間模型;將機(jī)器人控制問題的預(yù)期目標(biāo)輸入到離散時間模型,求解得到關(guān)節(jié)角目標(biāo)解;將關(guān)節(jié)角目標(biāo)解發(fā)送到機(jī)器人的控制器,利用控制器根據(jù)關(guān)節(jié)角目標(biāo)解控制機(jī)器人運(yùn)動。通過結(jié)合神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)能力和積分方程的求解特性,能夠在離散時間下規(guī)劃機(jī)器人的關(guān)節(jié)角進(jìn)而驅(qū)動機(jī)器人運(yùn)動,可實(shí)現(xiàn)機(jī)器人的實(shí)時控制和快速響應(yīng),并適應(yīng)動態(tài)環(huán)境中的變化,同時提高了魯棒性、穩(wěn)定性以及適應(yīng)性。