本發(fā)明涉及機(jī)器人編程系統(tǒng)的領(lǐng)域。更具體而言,本發(fā)明應(yīng)用于控制基于有關(guān)節(jié)的肢體或使用它們來回走動的機(jī)器人(尤其是人或動物形式的機(jī)器人)的運(yùn)動。從機(jī)器人具有下述特定人外觀屬性的時(shí)刻開始,機(jī)器人可以被認(rèn)定為是類人機(jī):頭部,軀干、雙臂、雙手等。然而,類人機(jī)器人可能或多或少地是復(fù)雜的。它的肢體可能具有較多或較少數(shù)量的關(guān)節(jié)。它可以靜態(tài)地或動態(tài)地控制其自身的平衡,并在基座上滾動。它可以從環(huán)境中獲取信號(“聽”、“看”、“觸摸”、“感測”等),并根據(jù)或多或少復(fù)雜的行為做出反應(yīng),并通過語音或通過手勢與其它機(jī)器人或人類進(jìn)行交互。對于目前這一代的類人機(jī)器人,程序員能夠創(chuàng)建可以或多或少復(fù)雜的情景,作為機(jī)器人做出反應(yīng)/執(zhí)行的事件/動作的序列。這些動作可以有條件的,其取決于與機(jī)器人交互的人的某些行為。但是在第一代的這些類人機(jī)器人中,在開發(fā)工具包中完成應(yīng)用程序編程,并且每個(gè)應(yīng)用程序需要由觸發(fā)事件來啟動,該觸發(fā)事件的發(fā)生已經(jīng)包括在應(yīng)用程序中。
背景技術(shù):
因此,需要一種類人機(jī)器人,其能夠過上“自主生活”,如同能夠根據(jù)他正演變的環(huán)境以確定的方式行動的人類一樣。本發(fā)明的目的在于通過提供一種機(jī)器人來克服現(xiàn)有技術(shù)的機(jī)器人的局限性,該機(jī)器人能夠自主地確定適應(yīng)其正演變的環(huán)境的其生活的序列,而無需程序員的任何干預(yù)。
我們考慮具有連接到身體(也被稱為上身)的移動基座的機(jī)器人。
由移動基座的輪子作用在地面上的法向力很大程度上依賴于其身體的位置和加速度。因此,移動基座遭受強(qiáng)烈的滑移。此外,由于機(jī)器人與其支撐基座尺寸相比的重要高度,機(jī)器人可能易于跌倒。
在文獻(xiàn)中,可以找到關(guān)于具有動力學(xué)穩(wěn)定性約束的移動機(jī)器人的控制以及關(guān)于類人式雙腿機(jī)器人的控制的一些論文。
一些最近的工作涉及控制具有由諸如機(jī)械臂之類的肢體所引起的動力學(xué)約束的機(jī)器人。K.Mingeuk等已經(jīng)致力于使用動力學(xué)約束對輪式平臺的穩(wěn)定:“Stabilization of a rapid four-wheeled mobile platform using the zmp stabilization method”。他們使用直接線性二次調(diào)節(jié)器(LQR)方法來控制平臺。該方法的不便之處在于,所受到的動力學(xué)約束需要具有在平臺的中間處的CoP(壓力中心)。CoP是機(jī)器人與地面之間的接觸力的重心。這個(gè)方法涉及損失若干DoF(自由度):實(shí)際上,為了防止機(jī)器人跌倒,CoP需要僅在由輪子與地面之間的接觸點(diǎn)限定的凸多邊形中。
在另一篇論文中,Y.Li等提出了一種具有動力學(xué)約束的移動機(jī)器人的簡單控制器:“The dynamic stability criterion on the wheel-based humanoid robot based on zmp modeling”。與K.Mingeuk和其它刊物的區(qū)別在于它考慮到完全CoP約束,其為不等式約束的總和。該控制器是針對機(jī)器人的完整模型迭代的比例積分微分控制,以便找到CoP在支撐多邊形中的扭矩命令。
關(guān)于類人機(jī)器人,P.B.Wieber、H.Diedam和A.Herdt說明了一種控制具有高度受約束動態(tài)的類人雙腿機(jī)器人的方法:“Walking without thinking about it”。這個(gè)最近的方案涉及基于3d線性倒立擺模型的線性預(yù)測控制。使用機(jī)器人的簡單模型,該控制律預(yù)測未來其狀態(tài)的動態(tài),以確保發(fā)送到機(jī)器人的當(dāng)前命令不會在幾秒鐘內(nèi)引起不可避免的跌倒。關(guān)于兩足類人機(jī)器人NAO,該控制律的實(shí)現(xiàn)可以在D.Gouaillier、C.Collette和K.Kilner所寫的論文“Omni-directional closed-loop walk for nao”中找到。但是機(jī)器人NAO很小,并且該方法特別是對于如圖1所示的較高的類人機(jī)器人不會給出良好的結(jié)果,該較高的類人機(jī)器人例如具有以下特征:
-20個(gè)自由度(DoF)(在頭部160上的2個(gè)DoF,在手臂170上的2×6個(gè)DoF,在腿部180上的3個(gè)DoF以及在移動基座140中的3個(gè)DoF);實(shí)際上,類人機(jī)器人具有至少5個(gè)DoF(頭部的1個(gè)DoF,每條腿1個(gè)DoF,每條手臂1個(gè)DoF),
-1.37m的高度110,
-0.65m的寬度130,
-0.40m的深度120,
-30kg的總質(zhì)量,
-一條腿180連接到具有三個(gè)輪子141的全向基座140。移動基座具有0.422m長度的三角形形狀,并且能夠以1:4m/s-1的最大速度和1:7m/s-2的加速度在短時(shí)間內(nèi)移動機(jī)器人。標(biāo)稱速度和加速度為0:5m/s-1和1:0m/s-2。
一個(gè)解決方案是設(shè)計(jì)具有與機(jī)器人的高度相比大的全向基座的機(jī)器人;但于是我們有以下缺點(diǎn):過大的所需空間和機(jī)器人身體的弱點(diǎn)。
因此需要控制類人機(jī)器人的移動基座及類人機(jī)器人的身體,同時(shí)考慮到它們的動力學(xué)約束。
技術(shù)實(shí)現(xiàn)要素:
為此,本發(fā)明提供了一種類人機(jī)器人,其具有連接到全向移動式地面基座的身體,并且配備有:
-身體位置傳感器和基座位置傳感器,用于提供測量,
-致動器,包括關(guān)節(jié)電機(jī)和位于全向移動式基座中的至少3個(gè)輪子,其中,具有至少1個(gè)全向輪,
-單元,用于將測量結(jié)果轉(zhuǎn)換為有用數(shù)據(jù),
-控制器,用于使用機(jī)器人模型和預(yù)定(preordered)的位置和速度參考根據(jù)有用數(shù)據(jù)來計(jì)算位置、速度和加速度命令,
-單元,用于將命令轉(zhuǎn)換為用于致動器的指令。
類人機(jī)器人的主要特征在于機(jī)器人模型是雙質(zhì)點(diǎn)模型,并且命令基于具有根據(jù)采樣時(shí)間周期和多個(gè)預(yù)測樣本的離散時(shí)間的線性模型預(yù)測性控制律,并且被表示為具有如下各項(xiàng)的二次優(yōu)化公式:
-以下各項(xiàng)的加權(quán)總和:
-基座位置目標(biāo),
-基座速度目標(biāo),
-與CoP和基座中心之間的距離有關(guān)的目標(biāo),CoP是機(jī)器人與地面之間的接觸力的重心,
具有預(yù)定義的權(quán)重,以及
-預(yù)定義的線性約束集合,它們是:
-移動基座的最大速度和加速度,
-身體的運(yùn)動限制,
-CoP限制。
這個(gè)機(jī)器人能夠在考慮動力學(xué)約束的同時(shí)控制機(jī)器人的移動基座及其身體兩者。它通過預(yù)測未來機(jī)器人的動力學(xué)模型行為而使得具有高速度和加速度運(yùn)動是可能的。
控制器的優(yōu)點(diǎn)為:
-時(shí)間預(yù)測的概念,其允許在高速度和加速度下控制高約束的動力學(xué)系統(tǒng),預(yù)測未來行為;
-高度模塊化,其允許在以下各項(xiàng)之間具有許多選擇:優(yōu)先化軌跡跟蹤;如果機(jī)器人被嚴(yán)重干擾,優(yōu)先化魯棒性;或最小化加速度變化率以保護(hù)機(jī)器人的機(jī)械部分;
-管理任何線性約束集合作為運(yùn)動限制、穩(wěn)定性或魯棒性限制及移動基座限制的可能性。
有利地,加權(quán)數(shù)值穩(wěn)定性目標(biāo)被添加至目標(biāo)的加權(quán)總和。
身體的運(yùn)動限制可以為空。
根據(jù)本發(fā)明的實(shí)施例,至少一個(gè)輪子是全向的。
有利地,地面是平坦且水平的。
本發(fā)明還提供了一種用于控制類人機(jī)器人的方法,該類人機(jī)器人具有連接到全向移動式地面基座的身體以及致動器,所述致動器包括位于全向移動式基座中的至少3個(gè)輪子,并且具有至少1個(gè)全向輪,該方法包括根據(jù)閉環(huán)方案實(shí)施的以下步驟:
-檢索身體的位置測量結(jié)果和基座的位置測量結(jié)果,
-將這些位置測量結(jié)果轉(zhuǎn)換為觀察(或有用)的位置測量結(jié)果,
-使用控制律來計(jì)算身體速度和基座速度命令,該命令基于具有根據(jù)采樣時(shí)間周期和多個(gè)預(yù)測樣本的離散時(shí)間的線性模型預(yù)測性控制律,并且被表示為具有以下各項(xiàng)的加權(quán)總和的二次優(yōu)化公式:
-基座位置目標(biāo),
-基座速度目標(biāo),
-與CoP和基座中心之間的距離有關(guān)的目標(biāo),CoP是機(jī)器人與地面之間的接觸力的重心,
具有預(yù)定義的權(quán)重,以及線性約束集合,它們是:
-移動基座的最大速度和加速度,
-身體的運(yùn)動限制,
-CoP限制。
-將這些命令轉(zhuǎn)換為用于機(jī)器人致動器的指令。
本發(fā)明還提供了一種計(jì)算機(jī)程序,包括當(dāng)在計(jì)算機(jī)上運(yùn)行時(shí)適合于執(zhí)行前述權(quán)利要求所述的方法的計(jì)算機(jī)代碼。
附圖說明
依據(jù)下面對多個(gè)示例性實(shí)施例及其附圖的說明將更好地理解本發(fā)明并且其各個(gè)特征和優(yōu)點(diǎn)將顯現(xiàn)出來,在附圖中:
-圖1示出了本發(fā)明的多個(gè)實(shí)施例中的類人機(jī)器人的物理架構(gòu);
-圖2示出了本發(fā)明的多個(gè)實(shí)施例中的類人機(jī)器人的軟件模塊的功能架構(gòu);
-圖3示出了根據(jù)本發(fā)明設(shè)計(jì)的機(jī)器人的質(zhì)量重新分配的模塊化;
-圖4例示了約束的幾何表示;
-圖5示出了具有針對四個(gè)不同實(shí)驗(yàn)(圖5a,圖5b,圖5c和圖5d)的CoP位置和移動基座CoM參考位置的邊界限制的移動基座CoM(質(zhì)心)、上身CoM、CoP的x,y軌跡。
在附圖中,相同的元件以相同的附圖標(biāo)記來標(biāo)記。
具體實(shí)施方式
圖1示出了本發(fā)明的多個(gè)實(shí)施例中的類人機(jī)器人的物理架構(gòu)。
認(rèn)為圖上的特定機(jī)器人100僅僅是可以實(shí)施本發(fā)明的類人機(jī)器人的示例。圖上的機(jī)器人的下肢180對于行走不起作用,但是可以在其基座140上沿任何方向移動,基座140在它所放置的表面上滾動。舉例來說,該機(jī)器人具有可以約為120cm的高度110,約為65cm的深度120和約為40cm的寬度130。在具體實(shí)施例中,本發(fā)明的機(jī)器人具有平板計(jì)算機(jī)150,借助于平板計(jì)算機(jī)150機(jī)器人可以將消息(音頻、視頻、網(wǎng)頁)傳送到其環(huán)境,或通過平板計(jì)算機(jī)的觸覺界面從用戶接收輸入。除了平板計(jì)算機(jī)的處理器之外,本發(fā)明的機(jī)器人還使用其自己主板的處理器,可以例如是來自IntelTM的ATOMTM Z530。在本發(fā)明的具體實(shí)施例中,本發(fā)明的機(jī)器人還有利地包括專用于處理母板與致動器之間的數(shù)據(jù)流的處理器,該致動器控制肢體中的關(guān)節(jié)和機(jī)器人用作輪子的球的電機(jī)。取決于確切的關(guān)節(jié)所需的最大扭矩的幅度,電機(jī)可以是不同類型的。例如,可以使用來自e-minebeaTM的電刷式直流無芯電機(jī)(例如,SE24P2CTCA),或來自MaxonTM的無刷直流電動機(jī)(例如,EC45_70W)。MRE優(yōu)選地是使用霍爾效應(yīng)的類型,具有12或14位精度。
在本發(fā)明的實(shí)施例中,圖1上顯示的機(jī)器人還包括各種傳感器。它們中的一些用于控制機(jī)器人的位置和運(yùn)動。這是例如位于機(jī)器人的軀干中的慣性單元的情況,包括3軸陀螺儀和3軸加速度計(jì)。機(jī)器人還可以包括片上系統(tǒng)(SOC)類型的在機(jī)器人的前額上的兩個(gè)2D彩色RGB攝像機(jī)(頂部和底部),例如來自Shenzen V-Vision Technology LtdTM的攝像機(jī)(OV5640),其具有每秒5幀、500萬像素的分辨率以及約57°水平和44°垂直的視場(FOV)。一個(gè)3D傳感器還可以包括在機(jī)器人的眼睛后面,例如ASUS XTIONTM SOC傳感器,其具有每秒20幀、0.3兆像素的分辨率,具有與2D攝像機(jī)大約相同的FOV。本發(fā)明的機(jī)器人還可以配備有激光線發(fā)生器,例如三個(gè)在頭部中并且三個(gè)在基座中,以便能夠感測其相對于其環(huán)境中的物體/生物的位置。本發(fā)明的機(jī)器人還可以包括能夠感測其環(huán)境中的聲音的麥克風(fēng)。在實(shí)施例中,可以在機(jī)器人的頭部上植入在1kHz下具有300mV/Pa+/-3dB的靈敏度和300Hz至12kHz(相對于1kHz的-10dB)的頻率范圍的四個(gè)麥克風(fēng)。本發(fā)明的機(jī)器人還可以包括兩個(gè)聲納傳感器,其可以位于其基座的前部和后部處,以測量距其環(huán)境中的物體/人的距離。機(jī)器人還可以包括在其頭部和其手上的觸覺傳感器,以允許與人進(jìn)行交互。
為了翻譯其情緒并與在其環(huán)境中的人進(jìn)行交流,本發(fā)明的機(jī)器人還可以包括:
-LED,例如在其眼睛、耳朵中和其肩部上;
-位于其耳朵中的揚(yáng)聲器,例如兩個(gè)揚(yáng)聲器。
本發(fā)明的機(jī)器人可以通過以太網(wǎng)RJ45或WiFi 802.11連接與基站或其它機(jī)器人進(jìn)行通信。
本發(fā)明的機(jī)器人可以由具有約400Wh能量的磷酸鐵鋰電池供電。機(jī)器人可以接入適合所包括的電池類型的充電站。
鑒于傳感器的測量,使用啟動由每個(gè)肢體限定的鏈和在每個(gè)肢體的末端處限定的效應(yīng)器的算法由機(jī)器人的電機(jī)來控制機(jī)器人的位置/運(yùn)動。
圖2示出了本發(fā)明的多個(gè)實(shí)施例中的類人機(jī)器人的軟件模塊的功能架構(gòu)。
本發(fā)明的目的在于提供一種方法,以允許類人機(jī)器人以自主方式執(zhí)行活動,而不需要程序員的任何干預(yù)來預(yù)測機(jī)器人將面對的狀況。在現(xiàn)有技術(shù)中,機(jī)器人能夠執(zhí)行已經(jīng)編程并上傳到其主板的場景。這些場景可以包括對其環(huán)境中變化的狀況的反應(yīng),但是機(jī)器人不能夠?qū)ι形搭A(yù)測并且包括在被上傳到其主板或可遠(yuǎn)程訪問的代碼中的狀況做出反應(yīng)。相比之下,本發(fā)明的目的在于允許機(jī)器人自主地行動,即使鑒于尚未被程序員預(yù)測的事件/狀況。這個(gè)目標(biāo)通過在圖2上顯示的功能架構(gòu)來實(shí)現(xiàn)。
該功能架構(gòu)大體上包括四個(gè)主要的軟件模塊。
服務(wù)模塊210包括至少三種類型的服務(wù):
-提取器服務(wù)211,其從關(guān)于圖1所述的類型的機(jī)器人傳感器接收輸入讀數(shù);預(yù)處理這些傳感器讀數(shù),以便提取與機(jī)器人的位置、在其環(huán)境中的物體/人的識別、所述物體/人的距離、由人發(fā)音的詞語或其情緒相關(guān)的相關(guān)數(shù)據(jù)(也稱為有用數(shù)據(jù));提取器服務(wù)的示例是:人感知,以感知人在機(jī)器人附近的存在,運(yùn)動檢測,以檢測這些人的運(yùn)動;聲音定位,以定位聲音,觸摸檢測,以解釋在機(jī)器人觸覺傳感器上的觸摸,語音識別,情感識別,以通過人的詞語或手勢來識別由機(jī)器人附近的人所表達(dá)的情感;
-致動器服務(wù)212,其控制機(jī)器人的物理動作,例如運(yùn)動,以啟動關(guān)節(jié)或基座的電機(jī),跟蹤器,以跟蹤人在機(jī)器人的環(huán)境中的運(yùn)動,機(jī)器人的LED的照明,以傳達(dá)情緒,動畫語音(語音和手勢的組合),行為;行為是可以表達(dá)機(jī)器人的情緒并允許其執(zhí)行復(fù)雜動作的運(yùn)動、詞語、照明的組合。
-系統(tǒng)服務(wù)213,其尤其包括數(shù)據(jù)服務(wù);數(shù)據(jù)服務(wù)提供存儲的數(shù)據(jù),無論是暫時(shí)的還是長期的;數(shù)據(jù)服務(wù)的示例為:
○用戶會話服務(wù),其存儲用戶數(shù)據(jù),以及他們對機(jī)器人所做的操作的歷史;
○包管理器服務(wù),其提供由機(jī)器人執(zhí)行的過程的可擴(kuò)展儲存,具有其高級定義、啟動條件和標(biāo)簽。
活動模塊220包括已經(jīng)被預(yù)編程的機(jī)器人的行為221。行為的編程可以使用圖形集成開發(fā)環(huán)境(ChoregapheTM)來實(shí)現(xiàn),該圖形集成開發(fā)環(huán)境是根據(jù)No.EP2435216公開的歐洲專利申請(被指定給本專利申請的申請人)的對象。借助于ChoregapheTM編程的行為結(jié)合了基于時(shí)間的邏輯和基于事件的邏輯。每個(gè)行為被標(biāo)記有清單222,清單222是特別地包括行為的啟動條件的文本文件。這些啟動條件基于提取器211能夠感知的內(nèi)容。
思維模塊230負(fù)責(zé)選擇一個(gè)或若干活動來啟動。為此,思維訂閱提取器并評估所有安裝的活動的啟動條件。這些條件的變量是基于事件的。因此,有效地,只有包含變化的變量的條件語句需要重新評估?;谂判蛩惴?、其優(yōu)先級和生命周期(見下文)的結(jié)果,可以啟動活動,而一些活動可能已停止。
執(zhí)行的活動將依賴于對服務(wù)的API(法語表達(dá)“Application Pour Interface”的縮寫詞)調(diào)用以執(zhí)行它已經(jīng)被編程要做的任務(wù)。每當(dāng)活動在臺上或停止,思維就收集關(guān)于其何時(shí)發(fā)生、條件的當(dāng)前狀態(tài)以及看起來有利于學(xué)習(xí)的用戶反饋的數(shù)據(jù)。
如果現(xiàn)有提取器事件不足以滿足條件,開發(fā)人員就可以創(chuàng)建附加提取器來生成新事件,并將其連同其應(yīng)用程序分配在包中。
為此,通過控制活動的選擇并且基于提取器的讀數(shù)和在被稱為選擇器的思維中執(zhí)行的算法來啟動致動器,思維模塊230將服務(wù)模塊和活動模塊聯(lián)系在一起。選擇器的示例為:
-自主生活231,其執(zhí)行活動;基于情形的環(huán)境,思維可以告知自主生活關(guān)注哪個(gè)活動(見下面的示例);任何活動都具有對模塊API的所有調(diào)用過程的完全訪問權(quán)限;活動可以包括約束,其將指導(dǎo)自主生活關(guān)注于確定的活動;
-基本認(rèn)知232,其訂閱提取器服務(wù),例如人感知、運(yùn)動檢測和聲音定位,以告知運(yùn)動服務(wù)來進(jìn)行移動;思維根據(jù)情形來配置基本認(rèn)知的行為;在其它時(shí)間,基本認(rèn)知要么獨(dú)立地動作,要么由運(yùn)行的活動來配置。
-對話233,其訂閱語音識別提取器并使用動畫語音致動器服務(wù)來說話;基于情形的環(huán)境,思維可以告訴對話要關(guān)注的話題;清單中的元數(shù)據(jù)將這個(gè)信息連結(jié)在思維中;對話還具有用于管理對話的算法,并且通常獨(dú)立地動作。
執(zhí)行引擎240啟動API調(diào)用來調(diào)用服務(wù)。
本發(fā)明的目的更具體而言涉及類人機(jī)器人的位置、速度和平衡控制,同時(shí)考慮其動力學(xué)約束。
根據(jù)本發(fā)明,為了同時(shí)允許基座140和上身190的高速度和加速度,并且不喪失機(jī)器人的平衡,我們需要預(yù)測未來的軌跡的穩(wěn)定性。此外,預(yù)先獲知直接按控制律規(guī)劃的軌跡的機(jī)會使得軌跡跟蹤有效得多。
本發(fā)明基于根據(jù)模型預(yù)測控制理論的控制律。這種類型的控制器的主要優(yōu)點(diǎn)在于考慮未來以決定發(fā)送到機(jī)器人的下一個(gè)命令。這是有用的,因?yàn)樵诟叨燃s束的系統(tǒng)中,例如該機(jī)器人的動態(tài),我們不能確定機(jī)器人能夠僅利用當(dāng)前狀態(tài)的估計(jì)來保持其穩(wěn)定性(或平衡)。
機(jī)器人被建模為如圖3所示的雙質(zhì)點(diǎn)模型。第一質(zhì)點(diǎn)b表示移動基座質(zhì)心(CoM),第二質(zhì)點(diǎn)c表示上身CoM;移動基座140與身體(或上身)190之間的接合處被認(rèn)為不具有質(zhì)量。該模型被存儲為系統(tǒng)數(shù)據(jù)服務(wù)213。
為了具有實(shí)時(shí)控制,機(jī)器人的模型需要盡可能簡單。我們需要計(jì)算基座作用在地面上的力的良好近似。機(jī)器人中的質(zhì)量的重新分配不能通過單個(gè)質(zhì)點(diǎn)模型來完成,因?yàn)榇蠹s一半的質(zhì)量集中在基座中,而其余的質(zhì)量在上身中。
我們現(xiàn)在可以針對這個(gè)系統(tǒng)寫出牛頓方程和歐拉方程,其中,軸z是垂直軸,而x和y是兩個(gè)水平軸:
其中,mc和mb是分別與c和b有關(guān)的質(zhì)量,和是用于每個(gè)質(zhì)點(diǎn)的角動量。對應(yīng)于由移動基座作用在上身上的力,并且對應(yīng)于由地面作用在移動基座的三個(gè)輪子上的力。
另外,p是力的CoP,它是它們的重心。由于其定義,p僅被限定在由三個(gè)輪子的接觸點(diǎn)所表示的凸多邊形中。
在該模型中,(1)和(2)直接意味著b與c之間的距離不是常數(shù)。
并且在這個(gè)模型中,我們直接考慮c與b之間的動量(3)(4)。這意味著我們忽略了由手臂引起的動量。我們可以這樣做,因?yàn)樵谖覀兊牟僮鞯那闆r下,不存在快速移動。組合方程(1)(2)(3)(4),我們可以寫出系統(tǒng)的動力方程:
我們可以在方程(5)中注意到,兩個(gè)質(zhì)量模型的動力方程簡單地是兩個(gè)單個(gè)質(zhì)量模型的和。
現(xiàn)在,為了使方程(5)線性化,我們做出一些假設(shè)。首先,我們可以忽略總角動量因?yàn)槲覀冞x擇僅考慮c與b之間的動量。其次,因?yàn)槲覀兙哂腥哂喽葯C(jī)器人,我們可以圍繞x和y軸移動c的CoM,而不修改其在z軸上的位置。因此,我們考慮約束在恒定值h的cz;這個(gè)假設(shè)對于獲得線性模型是重要的,但沒有這個(gè)假設(shè),機(jī)器人仍然可以在其基座上滾動。此外,為了簡化說明,我們優(yōu)選地考慮平坦且水平的地面,因此pz=0,但是機(jī)器人可以在沒有這個(gè)假設(shè)的情況下移動。沒有DoF來控制bz的位置,我們可以將其設(shè)定為常數(shù)1。最后,我們會注意到gx=gy=0并且gz=g重力范數(shù)(norm)。
利用這些假設(shè)和注釋,我們可以重寫方程(5)如下:
我們現(xiàn)在可以使用方程(6),以便提供CoP與基座和身體的位置和加速度之間的線性關(guān)系:
有趣的是發(fā)現(xiàn),由于項(xiàng)h和l,兩個(gè)質(zhì)量模型的CoP不是兩個(gè)一質(zhì)量CoP的加權(quán)重心??紤]這個(gè)近似的唯一方式是定義h=l,因此c與b之間沒有動量是可能的。我們可以得出結(jié)論,兩質(zhì)量模型CoP與兩個(gè)一質(zhì)量模型CoP的重心之間的這個(gè)差異對應(yīng)于c與b之間的動量的效應(yīng)。
魯棒性標(biāo)準(zhǔn)也用于確定機(jī)器人模型。我們考慮由每個(gè)輪子與地面的接觸點(diǎn)表示的凸多邊形;這個(gè)D多邊形的示例如圖4所示。根據(jù)定義,我們始終有為了使得隨著旋轉(zhuǎn)CoP約束不變,在以b為中心的機(jī)器人的框架中,我們設(shè)計(jì)了保守的約束:其中,是半徑r的以b為中心的圓,具有屬性
量化這個(gè)系統(tǒng)的魯棒性是一個(gè)未決的問題。在沒有干擾力的任何模型化的情況下,我們不能做出有關(guān)方向、幅度和它們的動態(tài)的任何假設(shè)。機(jī)器人補(bǔ)償干擾的能力可以與c的CoP和CoM位置聯(lián)系起來。由于它們能夠移動,機(jī)器人可以對強(qiáng)烈的干擾做出反應(yīng)。我們可以注意到,在沒有關(guān)于干擾的任何假設(shè)的情況下,如果它們接近b,則c的CoP和CoM位置沿任何方向具有移動的最大范圍。因此,我們提出魯棒性標(biāo)準(zhǔn)ζ,其在最大魯棒性的情況下等于0:
ζ=ζf||p-b||+(1-ζf)||c-b|| (8)
其中,ζf是在范圍[0;1]中的因子,其確定我們認(rèn)為最重要的什么類型的魯棒性以CoP為中心或者以c的CoM為中心。
定義了機(jī)器人模型,我們可以解決控制律。該控制律例如被存儲為調(diào)用運(yùn)動API的系統(tǒng)數(shù)據(jù)服務(wù)213。
為了定義受控身體和基座(c和b)的動態(tài)行為,我們必須首先選擇預(yù)測的持續(xù)時(shí)間(范圍)以及每個(gè)采樣時(shí)刻之間的周期。選擇盡可能小的范圍和盡可能大的周期將減少計(jì)算時(shí)間,但是還將降低控制的穩(wěn)定性和魯棒性,這取決于動態(tài)類。
為了保持系統(tǒng)的線性,我們?yōu)樯眢w和基座軌跡選擇3階的多項(xiàng)式類來具有連續(xù)的CoP軌跡,以便避免機(jī)器人中的力的峰值。此外,在該控制器中,以采樣周期T對時(shí)間進(jìn)行采樣。預(yù)測樣本的數(shù)量是N。
這種控制的另一個(gè)優(yōu)點(diǎn)是很容易管理許多不等式約束,為機(jī)器人的運(yùn)動限制,移動基座的最大速度和加速度以及CoP限制。
我們可以使用歐拉顯式方法來寫出每個(gè)狀態(tài)之間的關(guān)系:
采樣周期T的選擇有重大意義。允許軌跡在兩個(gè)樣本之間的約束之外,因?yàn)槲覀儍H在每個(gè)采樣時(shí)刻約束軌跡。出于實(shí)時(shí)的原因,我們不能為T選擇太小的值。因此,有必要考慮每個(gè)約束中的溢出作為安全裕量。
考慮并且針對c的導(dǎo)數(shù)及b和p以同樣的方式。此外,考慮初始狀態(tài)并且針對以同樣的方式。
使用方程(9)(10)(11),我們可以寫出命令和身體軌跡(C,和)的每個(gè)導(dǎo)數(shù)之間的關(guān)系:
其中:
同樣的方式用于定義b的動態(tài)。我們可以注意到,Uc,和是可逆的,因?yàn)樗鼈兪窃趯蔷€上沒有零的平方下三角矩陣。
關(guān)于p,使用方程(6),我們可以寫出這個(gè)關(guān)系:
其中:
在可以用于解決確定滿足這些位置、魯棒性和動態(tài)行為條件的這種控制律的問題的不同方法中,我們已經(jīng)選擇將其作為優(yōu)化問題來解決。為了解決這個(gè)優(yōu)化問題,我們選擇將其公式表示為在線性約束下的最小二乘最小化或者表示為具有目標(biāo)和線性約束的二次優(yōu)化。主要原因是這種問題的求解器計(jì)算速度快。添加非線性約束或非二次最小化目標(biāo)顯著地增加了計(jì)算時(shí)間。
優(yōu)化變量對應(yīng)于受控身體和基座因此,每個(gè)目標(biāo)和約束必須被表達(dá)為X的函數(shù)。
1)控制目標(biāo):
目標(biāo)Oi將被表示為最小二乘最小化和QP(二次問題)公式:
Xt是轉(zhuǎn)置時(shí)的X。
第一個(gè)目標(biāo)是跟蹤控制。在這個(gè)控制中,我們選擇進(jìn)行位置/速度跟蹤。令和位置和速度目標(biāo)超過范圍。使用(13),我們可以寫出速度控制目標(biāo)O1:
使用(12)我們可以寫出位置控制目標(biāo)O2:
下一個(gè)目標(biāo)是魯棒性最大化。通過最小化ζ,我們使魯棒性最大化。令Upbb=Upb–Ub。使用(8)、(12)、(16)我們可以寫出魯棒性控制O3:
Q3=ζfQ3p+(1-ζf)Q3c (24)
優(yōu)選地,我們定義另一目標(biāo)以避免機(jī)器人上的加速度變化率的峰值;所以我們向控制添加加速度變化率最小化目標(biāo)O4:
p4=0 (27)
關(guān)于這個(gè)第四個(gè)目標(biāo),我們可以注意到,當(dāng)機(jī)器人跌倒時(shí),c和b的軌跡呈指數(shù)增長。因此,通過最小化這些軌跡的加速度變化率,我們直接增大對c和b的指數(shù)發(fā)散的避免,這有助于穩(wěn)定機(jī)器人。
2)控制約束:
在下文中,約束Ri將被表達(dá)為QP線性不等式約束公式:
第一個(gè)約束R1是為了保證穩(wěn)定性:ζ必須小于或等于1。該約束不是線性的,因此我們引入一組保守的線性約束來對此進(jìn)行近似。我們選擇使用如圖4所示的圓中內(nèi)切的約束的八邊形形狀:它定義CoP限制約束。令約束R1寫成如下:
第二個(gè)約束R2涉及移動基座的限制。令和為移動基座的最大速度和加速度。我們可以寫出約束R2如下:
第三個(gè)也是最后一個(gè)約束R3涉及身體的運(yùn)動限制。由于其關(guān)節(jié),機(jī)器人可以在圍繞移動基座的CoM的矩形區(qū)域中移動其上身的CoM。令kxy為矩形形狀的限制,約束R3被寫為如下:
R3:-kxy≤cxy-bxy≤kxy (32)
身體的運(yùn)動限制可以為零。于是我們有:cxy=bxy。
為了以這些目標(biāo)和約束來解決這個(gè)優(yōu)化問題,我們使用線性二次問題求解器。關(guān)于求解QP的一些文獻(xiàn)可以在J.Nocedal和S.J.Wright 2000的書“Numerical optimization,second edition”中找到。這種求解器找到這樣的問題的最優(yōu)解:
其中,Q是對稱和正定的。使用方程(19)、(21)、(25)、(27)、(29)、(31)、(33),我們可以填寫Q,p,V,v-和v+的值:
Q=α1Q1+α2Q2+α3Q3+α4Q4+α5Q5 (35)
p=α1p1+α2p2+α3p3+α4p4+α5p5 (36)
其中,αi是與每個(gè)目標(biāo)相關(guān)聯(lián)的權(quán)重。它們可以實(shí)驗(yàn)地選擇。
αi值的選擇對于定義控制律的行為是基本的。每個(gè)αi之間的相對差距定義了哪個(gè)目標(biāo)將被優(yōu)先排序,哪個(gè)目標(biāo)將被忽略。如果α1和α2大于其它權(quán)重,則軌跡跟蹤將是非常有效的,但是魯棒性將不太有效,并且身體和基座的加速度變化率可能會高。如果α3大于其它權(quán)重,機(jī)器人將對強(qiáng)干擾是非常魯棒的。我們可以注意到,在這種行為模式中,如果我們將正速度定義為跟蹤目標(biāo),則機(jī)器人將在向前移動之前開始向后,以便以CoP為中心。權(quán)重α4對c和b的軌跡具有平滑效應(yīng),如果該權(quán)重大于另一個(gè),則最優(yōu)解將不動。因此,該權(quán)重必須小。
通過選擇適當(dāng)?shù)臋?quán)重可以獲得一些其它行為。如果兩個(gè)目標(biāo)之間的相對差距是大的(若干數(shù)量級),則較小目標(biāo)將幾乎在較大目標(biāo)的零空間中得以計(jì)算。當(dāng)我們想要一個(gè)偽約束,使用這個(gè)特性是有用的,其中如果該偽約束不能被滿足,則可以放寬。例如,我們可以添加上身的CoM的高加權(quán)目標(biāo),以使其以移動基座位置為中心,以便具有良好的視覺行為。這將具有在可能的時(shí)候?qū)oM固定在移動基座位置處的效果,但是在這是不可能的情況下,該偽約束將被放寬。
權(quán)重集合可以是固定的,這意味著我們已經(jīng)預(yù)先選擇了我們是否想要具有較好的軌跡跟蹤或魯棒性。
參考圖2,機(jī)器人模型和控制律被存儲為行為221;它們由執(zhí)行引擎240并由服務(wù)模塊210根據(jù)包括以下步驟的閉環(huán)方案來實(shí)施:
-從傳感器檢索身體的位置測量和基座的位置測量,
-使用提取器211將這些位置測量轉(zhuǎn)換為觀察的位置測量,
-使用先前描述的控制律,在系統(tǒng)服務(wù)213中計(jì)算身體速度和基座速度命令,
-對這些身體和基座速度進(jìn)行積分,以將它們提供給提取器211,
-將這些命令(身體和基座的位置和速度)轉(zhuǎn)換為用于機(jī)器人致動器212的指令:基座的輪子和機(jī)器人的關(guān)節(jié)。
為了驗(yàn)證該控制律,已經(jīng)進(jìn)行了一些實(shí)驗(yàn);結(jié)合圖5對它們進(jìn)行了說明。這里呈現(xiàn)的控制器已經(jīng)在類人機(jī)器人上以閉環(huán)被實(shí)施;通過每次設(shè)置初始狀態(tài)和的值來給出反饋。對于由每個(gè)輪子角度的位置傳感器來測量該值,并且對于由每個(gè)機(jī)器人關(guān)節(jié)上的位置傳感器來測量該值。由于移動基座上的三個(gè)傳感器,只有當(dāng)假定輪子不在地面上滑動時(shí),才能知道機(jī)器人在世界上的真實(shí)位置我們?yōu)榈孛婧洼喿舆x擇一種材料,以確保這一假設(shè)。關(guān)于控制器,我們經(jīng)驗(yàn)性地選擇2s的預(yù)測時(shí)間長度以及100ms的采樣周期T。則樣本N的數(shù)量為20。
在四個(gè)實(shí)驗(yàn)中,位置/速度參考已經(jīng)以如下形式被發(fā)送到控制器:以恒定速度前進(jìn),并且在軌跡的中途改變軌跡方向。位置參考和速度參考包括在軌跡參考中。該軌跡不能由機(jī)器人執(zhí)行,因?yàn)樗枰獰o限加速度來瞬時(shí)改變速度方向。因此,控制器必須通過根據(jù)定義的權(quán)重集合計(jì)算最優(yōu)和可行的軌跡來予以處理。
具有圖5a所示結(jié)果的實(shí)驗(yàn)1對應(yīng)于使軌跡跟蹤優(yōu)先于魯棒性:α1,α2>α3。在該示例中,α1=α2=100,α3=10,α4=0.0001。首先,我們可以看到在軌跡中途控制器中預(yù)測的效果。移動基座在參考軌跡改變之前開始轉(zhuǎn)動。目標(biāo)是更好地最小化整個(gè)預(yù)測時(shí)間中的跟蹤誤差。我們還可以看到上身的CoM大部分在移動基座軌跡曲線中。控制器已經(jīng)做到這一點(diǎn),以便通過最小化CoP與移動基座CoM之間的距離來優(yōu)化整個(gè)預(yù)測時(shí)間中的魯棒性。最后,我們可以看到在軌跡的末端,沒有位置跟蹤的有限收斂。這是由于缺乏位置積分目標(biāo)。
具有圖5b所示結(jié)果的實(shí)驗(yàn)2對應(yīng)于使魯棒性優(yōu)先于軌跡跟蹤:α3>α1,α2。在該示例中,α1=α2=100,α3=500000,α4=0.0001。我們可以看到,與實(shí)驗(yàn)1相比,CoP與移動基座CoM之間的距離顯著地較小。由于我們不能具有良好的跟蹤和良好的魯棒性兩者,我們可以注意到,軌跡跟蹤在軌跡的中間處的問題點(diǎn)周圍較差。要記住的重要的一點(diǎn)是,對于恒定的權(quán)重集合,當(dāng)機(jī)器人不能同時(shí)做到魯棒性和軌跡跟蹤兩者時(shí),我們必須達(dá)到魯棒性與軌跡跟蹤之間的折衷。
具有圖5c所示結(jié)果的實(shí)驗(yàn)3對應(yīng)于第一個(gè)實(shí)驗(yàn)的權(quán)重集合,但是借助于1-質(zhì)量模型,而不是2-質(zhì)量模型。我們可以注意到,移動基座軌跡跟蹤保持相同,但是由于較差的模型,整個(gè)身體和基座CoM具有較少的DoF以嘗試優(yōu)化魯棒性。通過更快地移動以及對于較大的移動,這導(dǎo)致在錯(cuò)誤的時(shí)間上身的行為較差。我們可以注意到,在這個(gè)機(jī)器人的高速度下,1-質(zhì)量模型是不穩(wěn)定的且機(jī)器人會跌倒,而2-質(zhì)量模型保持穩(wěn)定。在該示例中,α1=α2=100,α3=10,α4=0.0001。
具有圖5d所示結(jié)果的實(shí)驗(yàn)4對應(yīng)于第一個(gè)實(shí)驗(yàn)的權(quán)重集合,借助于2-質(zhì)量模型但是在開環(huán)中(其對應(yīng)于將b和c直接設(shè)置至它們各自的命令)。我們可以明顯看到,機(jī)器人具有許多漂移并且不能跟隨參考軌跡。我們還可以注意到,機(jī)器人的測量行為比在閉環(huán)中更為不平穩(wěn)。它還具有使機(jī)器人的軌跡平滑的效果。在該示例中,α1=α2=100,α3=10,4=0.0001。
我們已經(jīng)說明了一種具有全向移動式基座的新的受控機(jī)器人。機(jī)器人的控制器的優(yōu)點(diǎn)是:
-時(shí)間預(yù)測的概念,其允許在高速度和加速度下控制高約束動力學(xué)系統(tǒng),預(yù)測它們的未來行為;
-高度模塊化,其允許在以下各項(xiàng)之間具有許多選擇:優(yōu)先化軌跡跟蹤;如果機(jī)器人被嚴(yán)重干擾,優(yōu)先化魯棒性;或最小化加速度變化率以保護(hù)機(jī)器人的機(jī)械部分;
-管理任何線性約束集合作為運(yùn)動限制、穩(wěn)定性或魯棒性限制及移動基座限制的可能性。