本發(fā)明涉及機器人控制領(lǐng)域和不確定非線性動態(tài)系統(tǒng)控制領(lǐng)域,特別涉及一種多自由度機器人的仿生智力控制方法。
背景技術(shù):
:多關(guān)節(jié)機械臂是mimo系統(tǒng)控制的典型對象。與自適應(yīng)nn穩(wěn)定性分析技術(shù)結(jié)合,目前機械臂控制取得了很多成果,比如:為了提升軌跡跟蹤控制的精度和綜合性能,一些學(xué)者針對末端執(zhí)行器的位置跟蹤任務(wù),設(shè)計了無需有效載荷質(zhì)量先驗信息的在線nn自適應(yīng)控制器;一些學(xué)者通過nn控制實現(xiàn)了機器人與不確定粘性環(huán)境的交互;一些學(xué)者結(jié)合小腦模型關(guān)節(jié)控制(cmac)和回聲狀態(tài)網(wǎng)絡(luò),針對非光滑的非線性動力學(xué)系統(tǒng)提出了一種輸出跟蹤誤差受限的魯棒位置控制方法。由于這些控制策略中采用的是固定結(jié)構(gòu)的nn模型,因此在實際使用場景中存在如下問題:nn控制以萬能逼近定理(uat)為嚴格前提,在控制器設(shè)計和集成階段需要確保nn能夠安全有效地發(fā)揮學(xué)習(xí)/近似能力,一旦nn參數(shù)設(shè)置不恰當(dāng),不僅會使nn整體逼近能力喪失,還會影響系統(tǒng)的平穩(wěn)安全運行。其主要問題在于缺少系統(tǒng)化、通用性強的參數(shù)選取方法,包括神經(jīng)元個數(shù),基函數(shù)及其結(jié)構(gòu)參數(shù)(如,高斯基函數(shù)的中心和寬度參數(shù))等。在絕大多數(shù)nn控制方法中,這些參數(shù)往往需要人工選定,而不能根據(jù)系統(tǒng)的實際輸出進行自動調(diào)整,使得系統(tǒng)控制性能對這些參數(shù)格外敏感。比如,設(shè)置過多的神經(jīng)元會造成參數(shù)過擬合并且加重運算負擔(dān),設(shè)置過少則會達不到學(xué)習(xí)的效果;再比如,rbf-nn設(shè)計中,若高斯基函數(shù)中心與寬度的設(shè)計不在nn輸入有效的映射范圍內(nèi),則會導(dǎo)致rbf-nn失效。雖然通過梯度下降法能夠得到在線調(diào)節(jié)的參數(shù),但卻存在局部最優(yōu)解的情況,并且很難從理論上證明系統(tǒng)的全局一致最終收斂。為鞏固nn性能并確保功能的有效性,研究人員作出了各種嘗試,比如切換控制方法,自組織控制方法,以及基于受限李雅普諾夫函數(shù)的方法??傮w來說,傳統(tǒng)nn控制的設(shè)計與分析過程十分復(fù)雜,所建立的控制器通常結(jié)構(gòu)復(fù)雜,而且需要占用大量的系統(tǒng)在線運算資源。技術(shù)實現(xiàn)要素:有鑒于此,本發(fā)明的目的是提供一種多自由度機器人的類腦學(xué)習(xí)控制方法,類腦學(xué)習(xí)控制方法:brainlearningassociatedcontrol,blac,其針對具有跳變擾動和未知不確定性的多自由度機器人系統(tǒng),以解決在關(guān)節(jié)空間(方陣情形)與笛卡爾空間(非方陣情形)中多自由度機器人系統(tǒng)輸出的軌跡跟蹤問題,旨在避免線性化處理過程和繁瑣的設(shè)計流程,改善系統(tǒng)的自學(xué)習(xí)和自適應(yīng)能力。本發(fā)明多自由度機器人的類腦學(xué)習(xí)控制方法,包括以下步驟:多自由度機器人的類腦學(xué)習(xí)控制方法,其特征在于:包括以下步驟:步驟一、建立多自由度機器人系統(tǒng)動力學(xué)模型;對于含有n個旋轉(zhuǎn)關(guān)節(jié)的剛性電驅(qū)動機械臂,其動力學(xué)方程為:其中,q=[q1,...,qn]t∈rn,分別表示關(guān)節(jié)角位移,關(guān)節(jié)角速度和關(guān)節(jié)角加速度向量;d(q)∈rn×n為對稱正定慣性矩陣,為向心力與科氏力矩,g(q)∈rn和分別為重力與摩擦力,δ(t)∈rn表示外部擾動和建模不確定性;u∈rl為系統(tǒng)控制輸入信號,表示關(guān)節(jié)電機產(chǎn)生的實際力矩與控制信號間的非線性映射;記機械臂末端執(zhí)行器的位姿為p=[p1,...,pm]t∈rm,m表示末端執(zhí)行器在笛卡爾任務(wù)空間的自由度,且滿足m≤n以涵蓋冗余運動情形;并引入如下多入多出非仿射系統(tǒng):其中,系統(tǒng)狀態(tài)向量x=[x1,...,xn]t∈rn;控制輸入向量u=[u1,...,ul]t∈rl;系統(tǒng)輸出y=[y1,...,yn]t∈rn;f(·)=[f1(·),...,fn(·)]t∈rn和fd(x,t)=[fd1,...,fdn]t∈rn分別表示未知光滑非線性函數(shù)向量和不確定外界擾動或子系統(tǒng)故障引起的額外跳變;根據(jù)中值定理可知存在k=1,...,n,j=1,...,l,使得非仿射函數(shù)fk(·)滿足且定義跟蹤誤差e(t)=y(tǒng)-yd=[e1,...,en]t,取β>0為一已知常數(shù),定義濾波誤差向量:其關(guān)于時間的導(dǎo)數(shù)為:其中,集總不確定性項l(·)表示為l(·)=f(x,0)±fd(x,t)+yd且虛擬控制增益矩陣中間變量當(dāng)b(·)為未知且非必須對稱型方陣時,控制器唯一可用信息是(b+bt)/2為正定或負定,正定(b+bt)/2的最小特征值恒正,故存在某未知正常數(shù)ω使得當(dāng)b(·)為部分已知的非方矩陣時,將其解耦表示為b(x,u)=a(x)m(x,u),其中a(·)∈rn×l為已知有界的行滿秩矩陣,m(·)∈rl×l為完全未知且非必須對稱型方陣;已知a(m+mt)at/2為對稱且正定,故存在某未知正常數(shù)ν使得步驟二、構(gòu)建基于msae-nn的智能控制器u:1)采用多內(nèi)涵自調(diào)節(jié)型神經(jīng)網(wǎng)絡(luò)msae-nn對l(·)的l2范數(shù)上界進行重構(gòu),即其中為輸入信號,分別為第i個子網(wǎng)絡(luò)的第j個神經(jīng)元新增神經(jīng)元和將被剔除神經(jīng)元的基函數(shù),是時變理想權(quán)值;且有重構(gòu)誤差|ε(z)|<εc<∞;又因為和ε(z)有界,故存在未知常量wε使得||wε(z,t)||≤wε;2)設(shè)計機器人系統(tǒng)在關(guān)節(jié)空間空間的控制器u:給定理想關(guān)節(jié)角度軌跡qd(t)∈rn,則關(guān)節(jié)角位移跟蹤誤差向量表示為:ej=q-qd∈rn濾波誤差sj(t)及其動特性設(shè)計神經(jīng)自適應(yīng)控制器u如下其中控制參數(shù)k0>0,θ>0,β1>||sj(0)||,γ0>0,γ1>02)設(shè)計機器人系統(tǒng)在笛卡爾任務(wù)空間的控制器u給定末端執(zhí)行器理想位姿pd(t)∈rm,則其位姿跟蹤誤差向量表示為:ec=p-pd∈rm濾波誤差sc(t)及其動特性為:顯然,當(dāng)m<l時,b(·)為非方矩陣。結(jié)合情形2,b(·)可被分解為兩矩陣相乘形式,即b(·)=am,并且符合行滿秩矩陣a=j(luò)(q)∈rm×l,正定對稱方陣設(shè)計神經(jīng)神經(jīng)自適應(yīng)控制器u如下其中控制參數(shù)k0>0,θ>0,β1>||sc(0)||,γ0>0,γ1>0;步驟三、將控制器u作用到步驟一)建立的機器人系統(tǒng),使輸出y(t)按給定精度β0跟蹤期望軌跡xd(t),同時確保系統(tǒng)跟蹤誤差e(t)在t≥0有界。本發(fā)明的有益效果:本發(fā)明多自由度機器人的類腦學(xué)習(xí)控制方法,其解決了在關(guān)節(jié)空間(方陣情形)與笛卡爾空間(非方陣情形)中多自由度機器人系統(tǒng)輸出的軌跡跟蹤問題。與絕大多數(shù)機器人神經(jīng)網(wǎng)絡(luò)控制方法不同的是,類腦學(xué)習(xí)控制方法完整地繼承了msae-nn的優(yōu)質(zhì)特性,網(wǎng)絡(luò)具有結(jié)構(gòu)多元化的基函數(shù)以及時變的理想權(quán)值,并且能夠根據(jù)系統(tǒng)當(dāng)前的輸出偏差對神經(jīng)元個數(shù)進行實時調(diào)整。這一方面避免了人工通過反復(fù)試驗的方式來配置nn相關(guān)參數(shù)的繁冗過程;另一方面,有助于鞏固與強化系統(tǒng)的自學(xué)習(xí)和自適應(yīng)能力,提升其整體智能程度。值得一提的是,由于控制算法本身并不依賴機器人動力學(xué)模型的精確信息,并且也無需計算傳統(tǒng)nn中龐大規(guī)模的權(quán)值估計向量,而是通過引入虛擬參數(shù)的方式巧妙地將矩陣運算轉(zhuǎn)化為標(biāo)量運算,因此所設(shè)計的控制器具有結(jié)構(gòu)簡單的特點,即使對于存在高度不確定非線性的系統(tǒng),也能以較低的成本在工程系統(tǒng)中集成。附圖說明圖1為含有3個旋轉(zhuǎn)關(guān)節(jié)的三連桿平面機械臂的結(jié)構(gòu)示意圖。圖2為使用四種控制策略得到的末端執(zhí)行器的軌跡跟蹤情況示意圖。圖3為在四種控制方法作用下末端執(zhí)行器的位置跟蹤誤差演變情況示意圖。圖4為描繪blac、對照組2和3的權(quán)值/虛擬參數(shù)變化情況的示意圖。圖5為blac方法和對照組2的神經(jīng)元實時調(diào)節(jié)結(jié)果示意圖。圖6和圖7分別為四種控制策略產(chǎn)生的關(guān)節(jié)控制信號及相應(yīng)關(guān)節(jié)角度輸出結(jié)果的示意圖。具體實施方式下面結(jié)合附圖和實施例對本發(fā)明作進一步描述。本實施例多自由度機器人的類腦學(xué)習(xí)控制方法,包括以下步驟:步驟一、建立多自由度機器人系統(tǒng)動力學(xué)模型;對于含有n個旋轉(zhuǎn)關(guān)節(jié)的剛性電驅(qū)動機械臂,其動力學(xué)方程為:其中,q=[q1,...,qn]t∈rn,分別表示關(guān)節(jié)角位移,關(guān)節(jié)角速度和關(guān)節(jié)角加速度向量;d(q)∈rn×n為對稱正定慣性矩陣,為向心力與科氏力矩,g(q)∈rn和分別為重力與摩擦力,δ(t)∈rn表示外部擾動和建模不確定性;u∈rl為系統(tǒng)控制輸入信號,表示關(guān)節(jié)電機產(chǎn)生的實際力矩與控制信號間的非線性映射。記機械臂末端執(zhí)行器的位姿為p=[p1,...,pm]t∈rm,m表示末端執(zhí)行器在笛卡爾任務(wù)空間的自由度,且滿足m≤n以涵蓋冗余運動情形。并引入如下多入多出非仿射系統(tǒng):其中,系統(tǒng)狀態(tài)向量x=[x1,...,xn]t∈rn;控制輸入向量u=[u1,...,ul]t∈rl;系統(tǒng)輸出y=[y1,...,yn]t∈rn;f(·)=[f1(·),...,fn(·)]t∈rn和fd(x,t)=[fd1,...,fdn]t∈rn分別表示未知光滑非線性函數(shù)向量和不確定外界擾動或子系統(tǒng)故障引起的額外跳變。根據(jù)中值定理可知存在k=1,...,n,j=1,...,l,使得非仿射函數(shù)fk(·)滿足且定義跟蹤誤差e(t)=y(tǒng)-yd=[e1,...,en]t,取β>0為一已知常數(shù),定義濾波誤差向量:其關(guān)于時間的導(dǎo)數(shù)為:其中,集總不確定性項l(·)表示為l(·)=f(x,0)±fd(x,t)+yd且虛擬控制增益矩陣中間變量當(dāng)b(·)為未知且非必須對稱型方陣時,控制器唯一可用信息是(b+bt)/2為正定或負定,正定(b+bt)/2的最小特征值恒正,故存在某未知正常數(shù)ω使得當(dāng)b(·)為部分已知的非方矩陣時,將其解耦表示為b(x,u)=a(x)m(x,u),其中a(·)∈rn×l為已知有界的行滿秩矩陣,m(·)∈rl×l為完全未知且非必須對稱型方陣;已知a(m+mt)at/2為對稱且正定,故存在某未知正常數(shù)ν使得步驟二、構(gòu)建基于msae-nn的智能控制器u:1)采用多內(nèi)涵自調(diào)節(jié)神經(jīng)網(wǎng)絡(luò)(msae-nn即:多內(nèi)涵自調(diào)節(jié)神經(jīng)網(wǎng)絡(luò))對l(·)的l2范數(shù)上界進行重構(gòu),即其中為輸入信號,φi,j(z)分別為第i個子網(wǎng)絡(luò)的第j個神經(jīng)元新增神經(jīng)元和將被剔除神經(jīng)元的基函數(shù),是時變理想權(quán)值;且有重構(gòu)誤差|ε(z)|<εc<∞;又因為和ε(z)有界,故存在未知常量wε使得||wε(z,t)||≤wε。2)設(shè)計機器人系統(tǒng)在關(guān)節(jié)空間的控制器u:給定理想關(guān)節(jié)角度軌跡qd(t)∈rn,則關(guān)節(jié)角位移跟蹤誤差向量表示為:ej=q-qd∈rn濾波誤差sj(t)及其動特性設(shè)計神經(jīng)自適應(yīng)控制器u如下其中控制參數(shù)k0>0,θ>0,β1>||sj(0)||,γ0>0,γ1>0。2)設(shè)計機器人系統(tǒng)在笛卡爾任務(wù)空間的控制器u給定末端執(zhí)行器理想位姿pd(t)∈rm,則其位姿跟蹤誤差向量表示為:ec=p-pd∈rm濾波誤差sc(t)及其動特性為:顯然,當(dāng)m<l時,b(·)為非方矩陣。結(jié)合情形2,b(·)可被分解為兩矩陣相乘形式,即b(·)=am,并且符合行滿秩矩陣a=j(luò)(q)∈rm×l,正定對稱方陣設(shè)計神經(jīng)自適應(yīng)控制器u如下其中控制參數(shù)k0>0,θ>0,β1>||sc(0)||,γ0>0,γ1>0。步驟三、將控制器u作用到步驟一)建立的機器人系統(tǒng),使輸出y(t)按給定精度β0跟蹤期望軌跡xd(t),同時確保系統(tǒng)跟蹤誤差e(t)在t≥0有界。下面通過仿真實驗,對本實施例中多自由度機器人的類腦學(xué)習(xí)控制方法的有效性進行驗證:以圖1所示含有3個旋轉(zhuǎn)關(guān)節(jié)的三連桿平面機械臂為被控系統(tǒng),驗證blac方法在mimo系統(tǒng)上的有效性,多輸入多輸出:multiple-inputmultiple-output,mimo。該機械臂系統(tǒng)動力學(xué)方程在步驟一中給出,現(xiàn)給出其詳細數(shù)據(jù):連桿i連桿1連桿2連桿3mi[kg]0.50.50.5li[m]0.30.60.8lci[m]0.150.30.4ii[kg·m2]1.51.00.5給定機器人末端執(zhí)行器理想位姿為pd=[xd,yd]t=[cos(πt),sin(πt)]t,實際位姿p=[x,y]t,三個關(guān)節(jié)角度初始值為q(0)=[q1,q2,q3]t=[-18°,30°,30°]t,關(guān)節(jié)角速度初始值為估計虛擬參數(shù)初值控制參數(shù)k0=20,權(quán)值學(xué)習(xí)參數(shù)γ0=0.005,γ1=100,θ=0.05,hurwitz多項式參數(shù)β=5,受限李函數(shù)的界β1=||1.1×sc(0)||>||sc(0)。msae-nn的配置中,神經(jīng)元自動增減閾值因子ρ=0.1和χ=0.1,網(wǎng)絡(luò)訓(xùn)練輸入采用升余弦函數(shù)(raisedcosinebasisfunctions,rcbfs)和高斯函數(shù)(gaussianbasisfunctions,gbfs)共同作為神經(jīng)元的基函數(shù),并且兩類基函數(shù)對應(yīng)的神經(jīng)元初始數(shù)量均為5個,即網(wǎng)絡(luò)中共含10個神經(jīng)元。系統(tǒng)仿真總時間為4秒,控制周期1毫秒。仿真結(jié)果如下:圖2給出了使用四種控制策略得到的末端執(zhí)行器的軌跡跟蹤情況。圖3展現(xiàn)了四種控制方法作用下末端執(zhí)行器的位置跟蹤誤差演變情況。可以清晰看出,在外界擾動和未建模動態(tài)存在時,blac方法的精度要高于其他三種方法。值得一提的是,由于blac和對照組2均啟用了神經(jīng)元自動增減策略,其結(jié)果要比另外兩個對照組效果好。圖4描繪了blac、對照組2和3的權(quán)值/虛擬參數(shù)變化情況。從圖中發(fā)現(xiàn),固定結(jié)構(gòu)的nn已失去權(quán)值更新能力。因此,在圖2中,對照組1和3的軌跡曲線幾乎完全重合,進一步印證了固定結(jié)構(gòu)的nn控制在網(wǎng)絡(luò)參數(shù)選取不恰當(dāng)時,nn存在失效問題。注意到,對照組3的方法并未產(chǎn)生發(fā)散結(jié)果的原因在于其含有與組1完全相同的反饋控制單元。圖5中給出了blac方法和對照組2的神經(jīng)元實時調(diào)節(jié)結(jié)果。其中,粗線表示采用了gbf和rcbf兩種類型的神經(jīng)元的blac方法,虛線和點劃線分別表示rcbf型和gbf型神經(jīng)元在msae-nn中的各自數(shù)量變化情況;黑色粗線為僅采用單一rcbfs的對照組2方法。圖6和圖7給出了四種控制策略產(chǎn)生的關(guān)節(jié)控制信號及相應(yīng)關(guān)節(jié)角度輸出結(jié)果。由于在2秒后引入了頻率為5hz的擾動信號,控制器會隨之產(chǎn)生相應(yīng)頻率的變化,而非產(chǎn)生抖動。有趣的是,在引入擾動后blac方法與對照組2均能使跟蹤誤差得到收斂,體現(xiàn)了神經(jīng)元自調(diào)節(jié)策略對nn自學(xué)習(xí)能力的強化作用。最后說明的是,以上實施例僅用以說明本發(fā)明的技術(shù)方案而非限制,盡管參照較佳實施例對本發(fā)明進行了詳細說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解,可以對本發(fā)明的技術(shù)方案進行修改或者等同替換,而不脫離本發(fā)明技術(shù)方案的宗旨和范圍,其均應(yīng)涵蓋在本發(fā)明的權(quán)利要求范圍當(dāng)中。當(dāng)前第1頁12