亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

基于動(dòng)態(tài)運(yùn)動(dòng)基元學(xué)習(xí)模型的移動(dòng)機(jī)器人路徑規(guī)劃方法與流程

文檔序號(hào):12270126閱讀:1509來源:國(guó)知局
基于動(dòng)態(tài)運(yùn)動(dòng)基元學(xué)習(xí)模型的移動(dòng)機(jī)器人路徑規(guī)劃方法與流程

本發(fā)明涉及移動(dòng)機(jī)器人路徑規(guī)劃領(lǐng)域,具體是一種基于動(dòng)態(tài)運(yùn)動(dòng)基元學(xué)習(xí)模型的移動(dòng)機(jī)器人路徑規(guī)劃方法。



背景技術(shù):

路徑規(guī)劃是移動(dòng)機(jī)器人的關(guān)鍵技術(shù)之一,它在一定程度上標(biāo)志著移動(dòng)機(jī)器人智能水平的高低,能快速找出一條便捷、無碰撞的路徑不僅保證了移動(dòng)機(jī)器人自身的安全,更體現(xiàn)了機(jī)器人的高效性和可靠性。

目前,常用到的機(jī)器人路徑規(guī)劃方法有人工勢(shì)場(chǎng)法、模糊邏輯模型、遺傳等模型。人工勢(shì)場(chǎng)法是路徑規(guī)劃模型中較成熟且較高效的規(guī)劃方法,以其簡(jiǎn)單的數(shù)學(xué)計(jì)算被廣泛使用。但是傳統(tǒng)的人工勢(shì)場(chǎng)法存在局部極小點(diǎn)和目標(biāo)不可達(dá)等問題。目前,有多種解決局部極小點(diǎn)的辦法,如啟發(fā)式搜索,隨機(jī)逃走法等,但這些改進(jìn)的人工勢(shì)場(chǎng)法只是對(duì)機(jī)器人施加附加的控制力,沒有從根本上解決問題。遺傳模型是一種基于遺傳和自然選擇的多搜索模型,具有魯棒、靈活、在種群中搜索不易落入局部最小點(diǎn)等優(yōu)點(diǎn)。但遺傳模型在進(jìn)行機(jī)器人路徑規(guī)劃時(shí)存在種群規(guī)模大、搜索空間大、容易陷入局部極小點(diǎn)、收斂速度慢等問題。

以上傳統(tǒng)的機(jī)器人路徑規(guī)劃模型主要存在以下兩個(gè)方面的問題:

(1)任務(wù)是特定的,僅僅針對(duì)某一任務(wù)有很好性能,而不具有泛化推廣能力;

(2)學(xué)習(xí)往往是離線的,這就導(dǎo)致了對(duì)新的場(chǎng)景要重新訓(xùn)練學(xué)習(xí),實(shí)時(shí)性很差。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明要解決的技術(shù)問題是:針對(duì)上述的移動(dòng)機(jī)器人路徑規(guī)劃方法中所存在的實(shí)時(shí)性差,以及移動(dòng)機(jī)器人完成任務(wù)單一的問題,提出一種基于動(dòng)態(tài)運(yùn)動(dòng)基元學(xué)習(xí)模型的路徑規(guī)劃方法。能夠?qū)崟r(shí)搜索路徑,與其自主避障功能結(jié)合起來能有效地提高路徑規(guī)劃的效率,此外,機(jī)器人在完成新的任務(wù)時(shí),可以不用重新訓(xùn)練樣本而保持原來樣本軌跡的特性到達(dá)新的目標(biāo)位置。

為解決上述技術(shù)問題,本發(fā)明提供如下技術(shù)方案:

一種基于動(dòng)態(tài)運(yùn)動(dòng)基元學(xué)習(xí)模型的移動(dòng)機(jī)器人路徑規(guī)劃方法,其特征在于主要包括如下步驟:

步驟1:對(duì)機(jī)器人運(yùn)動(dòng)的二維環(huán)境進(jìn)行建模,模擬機(jī)器人運(yùn)動(dòng)的二維環(huán)境界面,機(jī)器人用小實(shí)心圓來代替,障礙物為各種平面圖形;

步驟2:利用手柄對(duì)機(jī)器人的操控,使機(jī)器人能從起點(diǎn)避免與障礙物碰撞而到達(dá)目標(biāo)點(diǎn);

步驟3:在步驟2進(jìn)行的過程中,采集機(jī)器人運(yùn)動(dòng)軌跡數(shù)據(jù)作為動(dòng)態(tài)運(yùn)動(dòng)基元學(xué)習(xí)模型的樣本點(diǎn),所述機(jī)器人運(yùn)動(dòng)軌跡數(shù)據(jù)包括位移、速度和加速度;

步驟4:根據(jù)步驟3得到的機(jī)器人運(yùn)動(dòng)軌跡時(shí)的位移、速度和加速度數(shù)據(jù),將這些數(shù)據(jù)作為訓(xùn)練樣本,通過動(dòng)態(tài)運(yùn)動(dòng)基元算法對(duì)樣本進(jìn)行訓(xùn)練得到機(jī)器人運(yùn)動(dòng)軌跡所對(duì)應(yīng)的最佳權(quán)重值;

步驟5:針對(duì)特定任務(wù)設(shè)置初始參數(shù),所述初始參數(shù)包括機(jī)器人運(yùn)動(dòng)的起點(diǎn)和終點(diǎn),根據(jù)步驟4得到的最佳權(quán)重值,規(guī)劃出通過動(dòng)態(tài)運(yùn)動(dòng)基元模型學(xué)習(xí)后的路徑,該路徑具有原樣本軌跡的特性,即起點(diǎn)和終點(diǎn)一致,并且其運(yùn)行軌跡與樣本軌跡大致相同;

步驟6:在步驟5的基礎(chǔ)上,加入圓形障礙物,并且在原有的動(dòng)力學(xué)方程中加入耦合項(xiàng),從而構(gòu)建帶有避障功能的動(dòng)力學(xué)系統(tǒng),實(shí)現(xiàn)動(dòng)態(tài)運(yùn)動(dòng)基元學(xué)習(xí)模型的自主避障功能;

步驟7:在步驟5的基礎(chǔ)上,改變機(jī)器人運(yùn)動(dòng)的目標(biāo)位置,在不重新訓(xùn)練樣本的前提下,僅僅改變目標(biāo)位置的參數(shù),機(jī)器人仍能自主到達(dá)新的目標(biāo)點(diǎn)位置,即機(jī)器人可以完成不針對(duì)某一指定任務(wù),而對(duì)于其他的任務(wù)也具有泛化推廣的能力。

上述技術(shù)方案中,步驟1中對(duì)機(jī)器人運(yùn)動(dòng)的二維環(huán)境進(jìn)行建模,建模的要求為:移動(dòng)機(jī)器人的活動(dòng)范圍在一個(gè)有限的二維空間;以移動(dòng)機(jī)器人的尺寸為基準(zhǔn),將障礙物的尺寸向外擴(kuò)展,將機(jī)器人看作一個(gè)質(zhì)點(diǎn);障礙物由各種平面圖形組成,數(shù)目有限,并且在機(jī)器人移動(dòng)過程中這些障礙物不會(huì)發(fā)生變化和移動(dòng)。

上述技術(shù)方案中,步驟2具體過程如下:

步驟2-1:讀取機(jī)器人手柄的數(shù)據(jù),當(dāng)手柄向上下或左右推動(dòng)時(shí),該界面實(shí)時(shí)的顯示機(jī)器人在建模環(huán)境中運(yùn)動(dòng)的位移、速度和加速度;

步驟2-2:遙控手柄,人為的規(guī)劃出一條機(jī)器人能從起始點(diǎn)到達(dá)終點(diǎn)的最優(yōu)路徑,考慮到機(jī)器人一般只能前后和左右運(yùn)動(dòng),因此規(guī)劃出來的路徑也是前后或者左右運(yùn)動(dòng)的路徑,規(guī)劃出來的軌跡也叫做樣本軌跡;

步驟2-3:在規(guī)劃路徑時(shí),要避開障礙物,并且用數(shù)據(jù)保存的方法將樣本軌跡的位移、速度和加速度的值記錄下來,并作為樣本數(shù)據(jù)。

上述技術(shù)方案中,步驟4包括如下具體步驟:

步驟4-1:建立動(dòng)態(tài)運(yùn)動(dòng)基元的數(shù)學(xué)模型:動(dòng)態(tài)運(yùn)動(dòng)基元一般用來形成離散的運(yùn)動(dòng),對(duì)于單一的自由度位移y,引入帶有恒定系數(shù)線性微分方程并稱之為動(dòng)力學(xué)系統(tǒng),此系統(tǒng)作為對(duì)運(yùn)動(dòng)學(xué)習(xí)的基礎(chǔ):

式中:

x和v分別是系統(tǒng)的位移和速度;x0和g分別是初始位置和目標(biāo)位置;τ是時(shí)間伸縮因子;K是彈簧的彈性系數(shù);D是系統(tǒng)處于臨界狀態(tài)下的阻尼系數(shù);f是非線性函數(shù),用于生成任意復(fù)雜的運(yùn)動(dòng);

步驟4-2:設(shè)置初始參數(shù),機(jī)器人運(yùn)動(dòng)的起始點(diǎn)x0和目標(biāo)點(diǎn)g,時(shí)間常數(shù)τ,彈簧的彈性系數(shù)K,系統(tǒng)處于臨界狀態(tài)下的阻尼系數(shù)D;非線性函數(shù)f用于形成任意復(fù)雜的運(yùn)動(dòng),定義f為:

式中:

ψi(s)是徑向基核函數(shù),i表示第i個(gè)徑向基核函數(shù)ψi(s),其取值范圍是1到N,其中N表示徑向基核函數(shù)的個(gè)數(shù);徑向基核函數(shù)定義為:

ψi(s)=exp(-hi(s-ci)2) (4)

式中:

ci是徑向基核函數(shù)的中心,hi>0且決定核函數(shù)的寬;其中hN=hN-1,i=1,...N,α為任意正常數(shù);

公式(3)中的函數(shù)f并不取決于時(shí)間參數(shù),而是取決于相位變量s,s的表達(dá)形式為:

式中:

s是關(guān)于時(shí)間t的函數(shù),α為任意正常數(shù),τ是時(shí)間伸縮因子;由方程(5)可知s是由1到0單調(diào)遞減的,因此方程(5)稱為正則系統(tǒng);

步驟4-3:將步驟3中得到的樣本數(shù)據(jù)代入公式(1)和公式(2)中,因?yàn)檎齽t系統(tǒng)是可積分的,即s可以根據(jù)參數(shù)τ計(jì)算出來,所以訓(xùn)練樣本中的非線性擾動(dòng)f′(s)可以表示成:

根據(jù)最小誤差準(zhǔn)則函數(shù)J來求解最佳權(quán)重值wi,其中最小誤差準(zhǔn)則函數(shù)的表達(dá)式為:

J=∑s(f′(s)-f(s))2 (7)

當(dāng)J取最小時(shí)的wi就是最佳的權(quán)重值。

上述技術(shù)方案中,步驟5包括如下具體步驟:

步驟5-1:當(dāng)機(jī)器人執(zhí)行指定的任務(wù)時(shí),設(shè)置機(jī)器人的起點(diǎn)位置與終點(diǎn)位置;

步驟5-2:樣本數(shù)據(jù)是二維的,也即包括x軸方向上的數(shù)據(jù)和y軸方向上的數(shù)據(jù),將x軸方向上的數(shù)據(jù)按照步驟4進(jìn)行訓(xùn)練,得到x軸方向上的最佳權(quán)重值,代入步驟5-1中的起點(diǎn)和終點(diǎn)值,計(jì)算出x方向上通過動(dòng)態(tài)運(yùn)動(dòng)基元模型學(xué)習(xí)后的位移、速度和加速度;

步驟5-3:將y軸方向上的數(shù)據(jù)按照步驟4進(jìn)行訓(xùn)練,得到y(tǒng)軸方向上的最佳權(quán)重值,代入步驟5-1中的起點(diǎn)和終點(diǎn)值,計(jì)算出y方向上通過動(dòng)態(tài)運(yùn)動(dòng)基元模型學(xué)習(xí)后的位移、速度和加速度;

步驟5-4:讀入步驟5-2和步驟5-3中得到的數(shù)據(jù),分別得到x軸和y軸兩個(gè)方向的運(yùn)動(dòng)數(shù)據(jù),在二維平面上輸出運(yùn)動(dòng)的軌跡仿真圖,即完成基于動(dòng)態(tài)運(yùn)動(dòng)基元學(xué)習(xí)模型對(duì)移動(dòng)機(jī)器人的路徑規(guī)劃。

上述技術(shù)方案中,步驟6中所加入的障礙物是以(0.4,0.4)為圓心坐標(biāo),半徑為0.1m的圓。

本發(fā)明的方法開始以簡(jiǎn)單的線性動(dòng)態(tài)系統(tǒng)(一組微分方程)開始研究,通過轉(zhuǎn)換系統(tǒng)將簡(jiǎn)單的線性動(dòng)態(tài)系統(tǒng)轉(zhuǎn)換成非線性系統(tǒng),并且通過吸引子來形成任意復(fù)雜的運(yùn)動(dòng),這樣就能較簡(jiǎn)單的對(duì)非線性系統(tǒng)進(jìn)行研究。其中,用微分方程來表示的優(yōu)點(diǎn)在于誤差可以自動(dòng)的被校正,而且微分方程都是以固定的格式形成的,按照這個(gè)固定的格式僅僅只需要簡(jiǎn)單的改變一個(gè)目標(biāo)參數(shù),就能適應(yīng)新的環(huán)境,即可以對(duì)新目標(biāo)進(jìn)行泛化;基于動(dòng)態(tài)運(yùn)動(dòng)基元學(xué)習(xí)的方法是在線學(xué)習(xí)的,對(duì)于新的情形不用重新學(xué)習(xí),能實(shí)時(shí)的跟蹤目標(biāo)位置。因而,在避障方面上,通過構(gòu)建帶避障功能的動(dòng)力學(xué)系統(tǒng)實(shí)現(xiàn)自主避障,并且動(dòng)態(tài)運(yùn)動(dòng)基元模型的在線學(xué)習(xí)特征和其自主避障功能相結(jié)合提高了路徑規(guī)劃的效率。

與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是:

(1)本發(fā)明提出一種基于動(dòng)態(tài)運(yùn)動(dòng)基元學(xué)習(xí)模型的移動(dòng)機(jī)器人路徑規(guī)劃方法,該學(xué)習(xí)模型具有泛化推廣能力,機(jī)器人在完成新的任務(wù)時(shí),可以不用重新訓(xùn)練樣本而保持原來樣本軌跡的特性到達(dá)新的目標(biāo)位置。

(2)本發(fā)明提出的路徑規(guī)劃模型在搜索路徑時(shí)是實(shí)時(shí)的,與其自主避障功能結(jié)合起來能有效地提高路徑規(guī)劃的效率。

附圖說明

圖1是本發(fā)明基于動(dòng)態(tài)運(yùn)動(dòng)基元學(xué)習(xí)模型的移動(dòng)機(jī)器人路徑規(guī)劃過程示意圖;

圖2是本發(fā)明中模擬機(jī)器人運(yùn)動(dòng)的二維環(huán)境;其中直線型軌跡代表樣本軌跡;各種形狀的圖形(如矩形、圓形、橢圓形)表示二維環(huán)境中的障礙物;

圖3是本發(fā)明中動(dòng)態(tài)運(yùn)動(dòng)基元學(xué)習(xí)模型的自主避障仿真圖;

圖4是本發(fā)明中動(dòng)態(tài)運(yùn)動(dòng)基元學(xué)習(xí)模型所具有泛化推廣能力的仿真圖;

圖5是訓(xùn)練的樣本軌跡與通過動(dòng)態(tài)運(yùn)動(dòng)基元模型學(xué)習(xí)后的軌跡對(duì)比圖。

具體實(shí)施方式

為了進(jìn)一步說明本發(fā)明的技術(shù)方案,下面結(jié)合附圖1-5對(duì)本發(fā)明進(jìn)行詳細(xì)的說明。

步驟1:模擬機(jī)器人運(yùn)動(dòng)的二維環(huán)境界面,其界面上機(jī)器人用小實(shí)心圓來代替,障礙物為各種平面圖形;設(shè)置機(jī)器人運(yùn)動(dòng)的二維環(huán)境界面為正方形(長(zhǎng)和寬都為1m),機(jī)器人用一個(gè)直徑為5mm的小實(shí)心圓來代替。

步驟2:利用OPENCV(Open Source Computer Vision Library)實(shí)現(xiàn)手柄對(duì)機(jī)器人的操控,使機(jī)器人能從起點(diǎn)避免與障礙物碰撞到達(dá)目標(biāo)點(diǎn);

步驟2-1:基于MFC(Microsoft Foundation Classes)界面編寫一個(gè)上位機(jī)軟件,該軟件可以讀取機(jī)器人手柄的數(shù)據(jù),當(dāng)手柄向上下或左右推動(dòng)時(shí),該界面可以實(shí)時(shí)的顯示機(jī)器人在建模環(huán)境中運(yùn)動(dòng)的位移、速度和加速度;

步驟2-2:遙控手柄,人為的規(guī)劃出一條機(jī)器人能從起始點(diǎn)到達(dá)終點(diǎn)的最優(yōu)路徑,考慮到機(jī)器人一般只能前后和左右運(yùn)動(dòng),因此規(guī)劃出來的路徑也是前后或者左右運(yùn)動(dòng)的路徑,規(guī)劃出來的軌跡也叫做樣本軌跡;

步驟2-3:在規(guī)劃路徑時(shí),要避開障礙物,并且用數(shù)據(jù)保存的方法將樣本軌跡的位移、速度和加速度的值記錄下來,并作為樣本數(shù)據(jù);

步驟2中使用的是基于MFC編寫的上位機(jī)軟件,通過對(duì)手柄的操控就能實(shí)現(xiàn)對(duì)機(jī)器人的控制。其中設(shè)置手柄推桿的位移為機(jī)器人運(yùn)動(dòng)時(shí)的速度大小,其中控制機(jī)器人運(yùn)動(dòng)速度的范圍為-5mm/s~5mm/s。

步驟3:在步驟2進(jìn)行的過程中,采集機(jī)器人運(yùn)動(dòng)軌跡數(shù)據(jù)作為動(dòng)態(tài)運(yùn)動(dòng)基元學(xué)習(xí)模型的樣本點(diǎn),其中機(jī)器人運(yùn)動(dòng)軌跡數(shù)據(jù)包括其位移、速度和加速度值的大小;

步驟4:根據(jù)步驟3得到的機(jī)器人運(yùn)動(dòng)軌跡時(shí)的位移、速度和加速度,將這些數(shù)據(jù)作為DMP學(xué)習(xí)模型的訓(xùn)練樣本,通過對(duì)樣本的訓(xùn)練得到機(jī)器人運(yùn)動(dòng)軌跡所對(duì)應(yīng)的最佳權(quán)重值;

步驟4-1:建立動(dòng)態(tài)運(yùn)動(dòng)基元的數(shù)學(xué)模型。動(dòng)態(tài)運(yùn)動(dòng)基元一般用來形成離散的運(yùn)動(dòng),對(duì)于單一的自由度位移y,引入帶有恒定系數(shù)線性微分方程并稱之為動(dòng)力學(xué)系統(tǒng),此系統(tǒng)作為對(duì)運(yùn)動(dòng)學(xué)習(xí)的基礎(chǔ):

式中:

x和v分別是系統(tǒng)的位移和速度;x0和g分別是初始位置和目標(biāo)位置;τ是時(shí)間伸縮因子;K是彈簧的彈性系數(shù);D是系統(tǒng)處于臨界狀態(tài)下的阻尼系數(shù);f是非線性函數(shù),用于生成任意復(fù)雜的運(yùn)動(dòng);

步驟4-2:設(shè)置初始參數(shù),機(jī)器人運(yùn)動(dòng)的起始點(diǎn)x0和目標(biāo)點(diǎn)g,時(shí)間常數(shù)τ,彈簧的彈性系數(shù)K,系統(tǒng)處于臨界狀態(tài)下的阻尼系數(shù)D;非線性函數(shù)f用于形成任意復(fù)雜的運(yùn)動(dòng),定義為:

式中:

ψi(s)是徑向基核函數(shù),i表示第i個(gè)徑向基核函數(shù)ψi(s),其取值范圍是1到N,其中N表示徑向基核函數(shù)的個(gè)數(shù);徑向基核函數(shù)定義為:

ψi(s)=exp(-hi(s-ci)2) (4)

式中:

ci是徑向基核函數(shù)的中心,hi>0且決定核函數(shù)的寬;其中hN=hN-1,i=1,...N,α為任意正常數(shù);

公式(3)中的函數(shù)f并不取決于時(shí)間參數(shù),而是取決于相位變量s,s的表達(dá)形式為:

式中:

s是關(guān)于時(shí)間t的函數(shù),α為任意正常數(shù),τ是時(shí)間伸縮因子;由方程(5)可知s是由1到0單調(diào)遞減的,因此方程(5)稱為正則系統(tǒng);

步驟4-3:將步驟3中得到的樣本數(shù)據(jù)代入上述公式中,因?yàn)檎齽t系統(tǒng)是可積分的,即s可以根據(jù)參數(shù)τ計(jì)算出來,所以訓(xùn)練樣本中的非線性擾動(dòng)f′(s)可以表示成:

根據(jù)最小誤差準(zhǔn)則函數(shù)J來求解最佳權(quán)重值wi,其中最小誤差準(zhǔn)則函數(shù)的表達(dá)式為:

J=∑s(f′(s)-f(s))2 (7)

當(dāng)J取最小時(shí)的wi就是最佳的權(quán)重值;

步驟5:針對(duì)特定任務(wù)設(shè)置初始參數(shù)(機(jī)器人運(yùn)動(dòng)的起點(diǎn)和終點(diǎn)),根據(jù)步驟4得到的最佳權(quán)重值,規(guī)劃出通過動(dòng)態(tài)運(yùn)動(dòng)基元模型學(xué)習(xí)后的路徑,該路徑具有原樣本軌跡的特性;

步驟5-1:當(dāng)機(jī)器人執(zhí)行指定的任務(wù)時(shí),設(shè)置機(jī)器人的起點(diǎn)位置與終點(diǎn)位置;

步驟5-2:樣本數(shù)據(jù)是二維的(x軸方向上的數(shù)據(jù)和y軸方向上的數(shù)據(jù)),將x軸方向上的數(shù)據(jù)按照步驟4進(jìn)行訓(xùn)練,得到x軸方向上的最佳權(quán)重值,代入步驟5-1中的起點(diǎn)和終點(diǎn)值,就可以計(jì)算出x方向上通過動(dòng)態(tài)運(yùn)動(dòng)基元模型學(xué)習(xí)后的位移、速度和加速度;

步驟5-3:將y軸方向上的數(shù)據(jù)按照步驟4進(jìn)行訓(xùn)練,得到y(tǒng)軸方向上的最佳權(quán)重值,代入步驟5-1中的起點(diǎn)和終點(diǎn)值,就可以計(jì)算出y方向上通過動(dòng)態(tài)運(yùn)動(dòng)基元模型學(xué)習(xí)后的位移、速度和加速度;

步驟5-4:將步驟5-2和步驟5-3中得到的數(shù)據(jù)通過MATLAB讀入,得到x軸和y軸兩個(gè)方向的運(yùn)動(dòng)數(shù)據(jù),在二維平面上輸出運(yùn)動(dòng)的軌跡仿真圖,即完成基于動(dòng)態(tài)運(yùn)動(dòng)基元學(xué)習(xí)模型對(duì)移動(dòng)機(jī)器人的路徑規(guī)劃。

步驟6:在步驟5的基礎(chǔ)上,加入圓形障礙物,并且在原有的動(dòng)力學(xué)方程中加入耦合項(xiàng),從而構(gòu)建帶有避障功能的動(dòng)力學(xué)系統(tǒng),實(shí)現(xiàn)了動(dòng)態(tài)運(yùn)動(dòng)基元學(xué)習(xí)模型的自主避障功能;

步驟6-1:在步驟5-4的基礎(chǔ)上,加入圓形障礙物,其中障礙物是以(0.4,0.4)為圓心坐標(biāo),半徑為0.1m的圓;

步驟6-2:在步驟4-1給出的動(dòng)力學(xué)系統(tǒng)方程的基礎(chǔ)上加入耦合項(xiàng)P(x,v)來構(gòu)建帶有避障功能的動(dòng)力學(xué)系統(tǒng),其中耦合項(xiàng)P(x,v)的表達(dá)式為:

式中:

是以為軸,為旋轉(zhuǎn)角的旋轉(zhuǎn)矩陣,矢量是障礙物的位置,γ與β是常量,θ是軌跡上的點(diǎn)與障礙物的距離矢量與軌跡上那一點(diǎn)的相對(duì)速度之間的夾角;

步驟6-3:給定耦合項(xiàng)P(x,v)公式中的常數(shù)項(xiàng)初值,其中γ=8,旋轉(zhuǎn)矩陣R表示成:

步驟6-4:通過構(gòu)建帶有避障功能的動(dòng)力學(xué)系統(tǒng),加入步驟6-1中所述的障礙物,機(jī)器人仍能避開障礙物到達(dá)目標(biāo)點(diǎn),其中帶有避障功能的動(dòng)力學(xué)系統(tǒng)的數(shù)學(xué)表達(dá)式為:

由圖3可以看出,動(dòng)態(tài)運(yùn)動(dòng)基元模型具有自主避障的功能;

步驟7:在步驟5的基礎(chǔ)上,改變機(jī)器人運(yùn)動(dòng)的目標(biāo)位置,在不重新訓(xùn)練樣本的前提下,僅僅改變目標(biāo)位置的參數(shù),機(jī)器人仍能自主的到達(dá)新的目標(biāo)點(diǎn)位置,即機(jī)器人可以完成不針對(duì)某一指定任務(wù),而對(duì)于其他的任務(wù)也具有泛化推廣的能力。

步驟7-1:在步驟5-4的基礎(chǔ)上,改變機(jī)器人目標(biāo)點(diǎn)的位置為(0.5,0.5),代入步驟4,得到在不重新訓(xùn)練樣本的前提下,動(dòng)態(tài)運(yùn)動(dòng)基元模型學(xué)習(xí)后的軌跡;

步驟7-2:在步驟5-4的基礎(chǔ)上,改變機(jī)器人目標(biāo)點(diǎn)的位置為(0.8,0.8),代入步驟4,得到在不重新訓(xùn)練樣本的前提下,動(dòng)態(tài)運(yùn)動(dòng)基元模型學(xué)習(xí)后的軌跡;

步驟7-3:由圖4可知,在步驟7-1和步驟7-2中,機(jī)器人可以到達(dá)新的目標(biāo)位置,并且保持原樣本軌跡的特性,因此證明了動(dòng)態(tài)運(yùn)動(dòng)基元學(xué)習(xí)模型所具有的泛化推廣能力;

綜上,本發(fā)明基于動(dòng)態(tài)運(yùn)動(dòng)基元學(xué)習(xí)模型實(shí)現(xiàn)對(duì)機(jī)器人的路徑規(guī)劃,該學(xué)習(xí)模型的在線學(xué)習(xí)特征和其自主避障功能相結(jié)合提高了路徑規(guī)劃的效率,并且該模型具有泛化推廣能力。本發(fā)明的提出,提高了移動(dòng)機(jī)器人的智能性,為移動(dòng)機(jī)器人在路徑規(guī)劃、避障與導(dǎo)航等相關(guān)領(lǐng)域提供了參考。

當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1