亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

機(jī)器人裝置及其行為控制方法

文檔序號(hào):6465038閱讀:219來源:國知局
專利名稱:機(jī)器人裝置及其行為控制方法
技術(shù)領(lǐng)域
本發(fā)明涉及機(jī)器人裝置及控制其行為的方法。
背景技術(shù)
近年來,仿照動(dòng)物,比如狗的外貌形成的機(jī)器人裝置正在出現(xiàn)在市場上。這種機(jī)器人裝置響應(yīng)外部信息或其自身內(nèi)部狀態(tài),比如其感覺狀態(tài),行動(dòng)像動(dòng)物。在這些機(jī)器人當(dāng)中,存在著能做出踢球這樣的行為的一種,同時(shí)也存在為其提供學(xué)習(xí)功能的一種。在這些學(xué)習(xí)功能中,一種為語音學(xué)習(xí)功能。
寵物型機(jī)器人中的一個(gè)最終目標(biāo)是,產(chǎn)生逼真的機(jī)器人裝置,或換句話說,構(gòu)造一個(gè)可擴(kuò)充的系統(tǒng)。
迄今為止已經(jīng)通過提高機(jī)器人裝置的外觀復(fù)雜性,嘗試接近構(gòu)造逼真機(jī)器人裝置的目標(biāo)。這也考慮到學(xué)習(xí)或成長元素。
但是,在組裝這些功能時(shí),常規(guī)的做法一直是改變對(duì)于行為產(chǎn)生固定設(shè)定的概率狀態(tài)機(jī)的概率,或整個(gè)地更換狀態(tài)機(jī)。
雖然通過與用戶或外部世界的交互改變了行為發(fā)生的頻率,從而提高了適合于機(jī)器人裝置的復(fù)雜性,但是,不能夠說,這樣的復(fù)雜性在設(shè)計(jì)者(編程者)原來預(yù)先假定的行為或反應(yīng)的范圍之外。相似地,機(jī)器人能夠識(shí)別的對(duì)象受到限制,使得機(jī)器人裝置不能夠識(shí)別編程者設(shè)定的之外的對(duì)象。這表示當(dāng)前機(jī)器人裝置缺乏確定如何對(duì)未知刺激做出反應(yīng)的能力。
下面是產(chǎn)生可擴(kuò)充系統(tǒng)所需要的而其可能在設(shè)計(jì)者設(shè)定的范圍外的能力(1)識(shí)別未知刺激的能力;(2)產(chǎn)生新行為的能力;和(3)針對(duì)未知刺激選擇適當(dāng)行為的能力。
如果考慮到所指的機(jī)器人裝置是寵物型的機(jī)器人的這一事實(shí),則寵物型機(jī)器人與人類交互的能力是特別重要的。事實(shí)上,在學(xué)習(xí)各種未知事物時(shí),寵物型機(jī)器人通過與人類的交互學(xué)習(xí)它們。
在與人類交互中最重要的是通過語言交流。至于識(shí)別未知刺激的能力(1),最佳分類、獲取作為符號(hào)的名字和獲取行為的名字,被認(rèn)為是第一步驟。這是稱為語言獲取的研究領(lǐng)域。如所指出的,關(guān)鍵的是這些符號(hào)是物理相關(guān)或以物理為基礎(chǔ)的。
例如,這點(diǎn)在如下的報(bào)告中指出Kaplan等人的報(bào)告(在下面稱為參考資料1,Kaplan,F(xiàn).撰寫的“交談(Talking)AIBO與自主的四腿機(jī)器人的語言交互的第一試驗(yàn)(First experimentation of verbal interactionswith an autonomous four-legged robot)”,刊載在關(guān)于交互作用智能媒體的CELE-Twente專題研討會(huì)會(huì)議錄(proceedings of the CECLE-Twentte oninteracting agents)中,2000年10月),Roy等人的報(bào)告(下面稱為參考資料2,Roy,D.和Pentland A.撰寫的“從自然聲至視覺輸入學(xué)習(xí)字(LearningWords from Natural Audio-Visual Input)”,刊載在關(guān)于口語語言處理的國際會(huì)議會(huì)議錄(Proceedings of International Conference on SpokenLanguage Processing)中,1998年),和Steels等人的報(bào)告(下面稱為參考資料3,Steels,L.撰寫的“以感知為基礎(chǔ)的意義創(chuàng)造(Perceptually GroundedMeaning Creation)”,刊載在關(guān)于多智能媒體系統(tǒng)的國際會(huì)議會(huì)議錄(Proceedings of the International Conference on Multi-Agent System)中,1996年)。
上述(2)的行為獲取,可以用通過模仿的行為獲取、通過強(qiáng)化學(xué)習(xí)的行為獲取和從進(jìn)化計(jì)算的行為獲取示范說明。
例如,這點(diǎn)在以下報(bào)告中指出Damasio的報(bào)告(下面稱為參考資料4,Damasio,A.撰寫的“Descartes’Error情感和人的大腦(Emotion,and theHuman Brain)”,Putman出版集團(tuán)(Putman Publishing Group),1994年),Mataric的報(bào)告(下面稱為參考資料5,Mataric,M.撰寫的“作為模仿基礎(chǔ)的傳感發(fā)動(dòng)機(jī)基原將感知聯(lián)結(jié)到動(dòng)作和將生物學(xué)聯(lián)結(jié)到機(jī)器人(Sensory-Motor Primitives as a basis for ImitationLinking Perception to Actinand Biology to Robotics)”,刊載在C.Nehniv和K.Dautenhalm(eds)著“動(dòng)物和人工制品的模仿(Imitation in Animals and Artifacts)”中,MIT出版社(press)出版,2000年)。
至于對(duì)未知刺激的適當(dāng)?shù)姆磻?yīng)行為(3),只報(bào)告了在現(xiàn)實(shí)世界中的極原始行為,或在虛擬世界中的幾個(gè)相關(guān)行為。
上述能力(3)的涵義是,如何獲取對(duì)象對(duì)機(jī)器人裝置所具有的意義,例如,它是否是食物,玩具或可怕的東西。在該方面,不僅從身體上使識(shí)別對(duì)象與之相關(guān)或授之所識(shí)別對(duì)象的基礎(chǔ)知識(shí)是必須的,而且識(shí)別該識(shí)別對(duì)象如何影響機(jī)器人裝置的內(nèi)部狀態(tài),如例如,主要情感或次要情感也是必須的。

發(fā)明內(nèi)容
鑒于上述技術(shù)狀態(tài),本發(fā)明的目的是提供一種制造得更逼真的機(jī)器人裝置以及控制所述機(jī)器人裝置的行為的方法。
為解決上述問題,本發(fā)明的機(jī)器人裝置包括行為控制部件,用于使機(jī)器人裝置將信息獲取行為作為屬于自主行為的行為進(jìn)行執(zhí)行。這樣構(gòu)造的機(jī)器人裝置將信息獲取行為表明為屬于自主行為的行為。
為解決上述問題,機(jī)器人裝置的行為控制方法也使機(jī)器人裝置將信息獲取行為作為屬于自主行為的行為進(jìn)行執(zhí)行。通過這樣的行為控制方法,所述機(jī)器人裝置將信息獲取行為表明為屬于自主行為的行為。
為解決上述問題,本發(fā)明的機(jī)器人裝置包括意義獲取部件,用于獲取對(duì)象的意義。這樣構(gòu)造的機(jī)器人裝置獲取對(duì)象的意義。
為解決上述問題,本發(fā)明的機(jī)器人裝置的行為控制方法還獲取、當(dāng)基于內(nèi)部狀態(tài)行動(dòng)的機(jī)器人裝置對(duì)對(duì)象采取行動(dòng)時(shí)產(chǎn)生的、機(jī)器人裝置的內(nèi)部狀態(tài)變化,作為對(duì)象的意義。
用機(jī)器人裝置的行為控制方法,所述機(jī)器人基于其內(nèi)部狀態(tài)行動(dòng),并獲取當(dāng)基于內(nèi)部狀態(tài)行動(dòng)的機(jī)器人對(duì)對(duì)象采取行動(dòng)時(shí)產(chǎn)生的內(nèi)部狀態(tài)變化,作為對(duì)象的意義。
為達(dá)到上述目的,機(jī)器人裝置還包括語音輸入部件,和特征化多個(gè)字序列的多個(gè)模型,其中,基于發(fā)出字序列時(shí)占優(yōu)勢(shì)的字序列的特征值對(duì)所述模型進(jìn)行分類。所述機(jī)器人還包括語音輸入評(píng)估部件,用于根據(jù)字序列特征化模型,評(píng)估由語音輸入部件生成的語音輸入;以及字序列指定部件,用于基于語音輸入評(píng)估部件的評(píng)估值指定語音輸入的字序列。
用這樣構(gòu)造的機(jī)器人裝置,基于字序列特征化模型,用語音輸入評(píng)估部件評(píng)估由語音輸入部件生成的語音輸入,所述的字序列特征化模型是基于發(fā)出的字序列的特征值分類的,并且,基于語音輸入評(píng)估部件的評(píng)估值,由字序列指定部件指定語音輸入的字序列。這使得機(jī)器人裝置能夠?qū)⑤斎胝Z音指定為最佳字序列。
為解決上述問題,本發(fā)明的機(jī)器人裝置的行為控制方法也包括語音輸入步驟;語音輸入評(píng)估步驟,根據(jù)特征化多個(gè)字序列的多個(gè)模型,評(píng)估在語音輸入步驟生成的語音輸入;以及字序列指定步驟,基于在語音輸入評(píng)估步驟中獲得的評(píng)估值指定語音輸入的字序列。該行為控制方法使得機(jī)器人裝置能夠?qū)⑤斎胝Z音指定為最佳字序列。
為解決上述問題,本發(fā)明的機(jī)器人裝置還包括控制部件,用于執(zhí)行指向?qū)W習(xí)對(duì)象的行為控制。這樣構(gòu)造的機(jī)器人裝置執(zhí)行指向其學(xué)習(xí)對(duì)象的行為。
為解決上述問題,本發(fā)明的機(jī)器人裝置的行為控制方法還控制機(jī)器人裝置的行為,從而自主行動(dòng)的機(jī)器人將指向其學(xué)習(xí)對(duì)象。通過機(jī)器人裝置的行為控制方法,所述機(jī)器人執(zhí)行指向其學(xué)習(xí)對(duì)象的行為。
為解決上述問題,本發(fā)明的機(jī)器人裝置還包括檢測對(duì)象的傳感器;用于評(píng)估所述傳感器的輸入信號(hào)的感知評(píng)估部分;內(nèi)部狀態(tài)管理部分,為其饋送感知評(píng)估部分的評(píng)估結(jié)果以管理根據(jù)所述結(jié)果改變的虛假內(nèi)部狀態(tài);以及存儲(chǔ)部件,用于存儲(chǔ)對(duì)象和基于對(duì)象的內(nèi)部狀態(tài)變化之間的關(guān)系。
用這樣構(gòu)造的機(jī)器人裝置,當(dāng)檢測到對(duì)象時(shí),將基于所檢測的對(duì)象的內(nèi)部狀態(tài)變化和所述對(duì)象相關(guān)地存儲(chǔ)在存儲(chǔ)部件中。
為解決上述問題,本發(fā)明的機(jī)器人部件的行為控制方法還包括感知評(píng)估步驟,評(píng)估檢測到對(duì)象的傳感器的輸入信號(hào);內(nèi)部狀態(tài)管理部分,用于管理基于感知評(píng)估步驟中的評(píng)估結(jié)果改變的虛假內(nèi)部狀態(tài);以及存儲(chǔ)步驟,存儲(chǔ)對(duì)象和基于對(duì)象的內(nèi)部狀態(tài)變化之間的關(guān)系。將基于所檢測的對(duì)象的內(nèi)部狀態(tài)的變化和對(duì)象相關(guān)地存儲(chǔ)在存儲(chǔ)部件中。用這樣構(gòu)造的機(jī)器人裝置的行為控制方法,當(dāng)檢測到對(duì)象時(shí),將基于所檢測的對(duì)象的內(nèi)部狀態(tài)變化和所述對(duì)象相關(guān)地存儲(chǔ)在存儲(chǔ)部件中。
通過閱讀如附圖所示的本發(fā)明的實(shí)施例,本發(fā)明的其它目的、特征和優(yōu)點(diǎn)將變得更加清楚。


圖1是實(shí)施本發(fā)明的機(jī)器人裝置的外觀透視圖;圖2是說明所述機(jī)器人裝置的電路結(jié)構(gòu)的方框圖;圖3是說明所述機(jī)器人的軟件結(jié)構(gòu)的方框圖;
圖4是說明所述機(jī)器人的軟件結(jié)構(gòu)中應(yīng)用層的方框圖;圖5是說明所述機(jī)器人的軟件結(jié)構(gòu)的應(yīng)用層結(jié)構(gòu)的方框圖;圖6是說明所述應(yīng)用層的行為模型庫結(jié)構(gòu)的方框圖;圖7說明了作為所述機(jī)器人裝置的行為決定的信息的有限概率自動(dòng)機(jī);圖8說明了為有限概率自動(dòng)機(jī)的每個(gè)節(jié)點(diǎn)提供的狀態(tài)轉(zhuǎn)換表;圖9是說明選擇行為的構(gòu)成單元的方框圖;圖10是說明通過感知選擇行為的構(gòu)成單元方框圖;圖11說明了子系統(tǒng)的指定例子;圖12是說明行為選擇結(jié)構(gòu)的一個(gè)更具體的構(gòu)成單元的方框圖;圖13說明了包括機(jī)器人裝置的網(wǎng)絡(luò)系統(tǒng);圖14是說明直到機(jī)器人裝置通過協(xié)同注意實(shí)現(xiàn)信息獲取行為或信息確認(rèn)行為一直執(zhí)行的操作序列的流程圖;圖15A和15B說明了為可選的單一顏色的輸入圖像的顏色分段;圖16A和16B說明了包括人類的輸入圖像的顏色分段;圖17說明了顏色分段的集群;圖18A和18B說明了輸入圖像的集群;圖19說明了通過顏色分段切片分析外形的結(jié)果;圖20說明實(shí)現(xiàn)了對(duì)發(fā)出的語音的識(shí)別的構(gòu)成單元的方框圖;圖21說明了用于輸入未知語言的HMM的示意結(jié)構(gòu);圖22說明了語音識(shí)別的結(jié)果;圖23說明了與內(nèi)部狀態(tài)相關(guān)的信息;圖24說明了虛擬胃和虛擬膀胱之間關(guān)系;圖25是說明學(xué)習(xí)存儲(chǔ)器結(jié)構(gòu)的方框圖;圖26說明了從根據(jù)外部或內(nèi)部狀態(tài)的刺激的信息,通過協(xié)同注意,實(shí)現(xiàn)信息獲取行為或信息確認(rèn)行為的處理過程。
具體實(shí)施例方式
下面參照附圖詳細(xì)說明本發(fā)明的優(yōu)選實(shí)施例。本實(shí)施例旨在說明一種自主地響應(yīng)周圍環(huán)境(外部刺激)和內(nèi)部狀態(tài)而行為的自主機(jī)器人裝置。
在本實(shí)施例中,首先說明機(jī)器人裝置的結(jié)構(gòu),隨后詳細(xì)說明利用所述機(jī)器人取得的日常功能。(1)本實(shí)施例機(jī)器人裝置的結(jié)構(gòu)如圖1所示,所述機(jī)器人裝置是模仿動(dòng)物,比如狗的所謂寵物機(jī)器人,并且由分別連接在軀干單元2的左右側(cè)的前后側(cè)的腿單元3A、3B、3C和3D以及分別連接到軀干單元2的前后端的頭部單元4和尾部單元5構(gòu)成。
參見圖2,軀干單元2包括控制器單元16,該控制器單元16包括CPU(中央處理單元)10內(nèi)部總線上的內(nèi)連、DRAM(動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器)11、快速ROM(只讀存儲(chǔ)器)12、PC(個(gè)人計(jì)算機(jī))卡接口電路13和信號(hào)處理電路14、以及作為機(jī)器人裝置1的電源的電池17。在軀干單元2中還裝有檢測機(jī)器人裝置1的運(yùn)動(dòng)姿勢(shì)和運(yùn)動(dòng)加速度的角速度傳感器18和加速度傳感器19。
在頭部單元4上安裝在位的有CCD(電荷耦合器件)照相機(jī)20,用于將成像外部狀態(tài);接觸傳感器21,用于檢測由物理動(dòng)作,如用戶的‘打擊’或‘輕拍’造成的壓力;距離傳感器22,用于測量到放置在前面的對(duì)象的距離;話筒23,用于收集外部聲音;揚(yáng)聲器24,用于輸出如哀鳴的聲音;以及LED(發(fā)光二極管),相當(dāng)于機(jī)器人裝置1的眼睛。
為腿單元3A至3D的關(guān)節(jié)部分、腿單元3A至3D和軀干單元2的各連接部分、頭部單元4和軀干單元2的各連接部分以及尾部單元5的尾部5A的連接部分提供對(duì)應(yīng)于自由度數(shù)目的數(shù)個(gè)執(zhí)行器251至25n和電位計(jì)261至26n。例如,執(zhí)行器251至25n包括伺服電動(dòng)機(jī)。腿單元3A至3D由伺服電動(dòng)機(jī)的驅(qū)動(dòng)控制,轉(zhuǎn)換到目標(biāo)姿勢(shì)或運(yùn)動(dòng)。
各個(gè)傳感器,如角速度傳感器18、加速度傳感器19、接觸傳感器21、觸地傳感器23R/L、姿勢(shì)傳感器24、距離傳感器25、話筒26、距離傳感器22、話筒23、擴(kuò)音器24以及電位計(jì)251至25n經(jīng)相關(guān)的集線器271至27n;連接到控制器16的信號(hào)處理電路14,而成像裝置20和電池17直接連接到信號(hào)處理電路14。
信號(hào)處理電路14順序地捕獲從上述各傳感器提供的傳感器數(shù)據(jù)、圖像數(shù)據(jù)或語音數(shù)據(jù),以使這些數(shù)據(jù)順序地經(jīng)內(nèi)部總線15存儲(chǔ)在DRAM11中的預(yù)定位置。另外,信號(hào)處理電路14順序地捕獲由電池17提供的指示剩余電池容量的剩余電池容量數(shù)據(jù),以將如此捕獲的數(shù)據(jù)存儲(chǔ)在DRAM11中的預(yù)定位置。
當(dāng)CPU10執(zhí)行機(jī)器人裝置1的操作控制時(shí),順序利用如此存儲(chǔ)在DRAM11中的各個(gè)傳感器數(shù)據(jù)、圖像數(shù)據(jù)、語音數(shù)據(jù)以及剩余電池容量數(shù)據(jù)。
實(shí)際中,在機(jī)器人裝置1啟動(dòng)的初始階段,CPU10為得到DRAM11中的存儲(chǔ)內(nèi)容,直接地或通過PC卡接口電路13讀取插在軀干單元2的PC卡槽(未說明了)中的存儲(chǔ)器卡28或存儲(chǔ)在快速ROM12中控制程序。
然后,CPU10根據(jù)從信號(hào)處理電路14順序存儲(chǔ)到DRAM11的傳感器數(shù)據(jù)、圖像數(shù)據(jù)、語音數(shù)據(jù)或剩余電池容量數(shù)據(jù),檢查其自身狀態(tài)和周圍狀態(tài),以及用戶可能發(fā)出的命令或行動(dòng)。
CPU10根據(jù)檢查的結(jié)果和存儲(chǔ)在11中的控制程序,還確定下一個(gè)隨之發(fā)生的動(dòng)作,同時(shí)根據(jù)如此確定的結(jié)果,在需要時(shí)驅(qū)動(dòng)執(zhí)行器251至25n,產(chǎn)生行為,如在上下方向或左右方向搖動(dòng)頭部單元4,或移動(dòng)腿單元3A至3D以行走或跳躍。
在需要時(shí),CPU10產(chǎn)生語音數(shù)據(jù),并將如此產(chǎn)生的數(shù)據(jù)作為語音信號(hào)通過信號(hào)處理電路14發(fā)送到揚(yáng)聲器24,以向外部輸出從語音信號(hào)推導(dǎo)出的語音,或開/關(guān)或閃耀LED。
以這種方式,本機(jī)器人裝置1能夠響應(yīng)其自身狀態(tài)和周圍狀態(tài),或用戶的命令或動(dòng)作,而自主地行為。(2)控制程序的軟件結(jié)構(gòu)圖3說明了機(jī)器人裝置1中上述控制程序的軟件結(jié)構(gòu)。在圖3中,器件驅(qū)動(dòng)程序?qū)?0位于控制程序的最下層,并形成為由多個(gè)器件驅(qū)動(dòng)程序組成的器件驅(qū)動(dòng)程序組31。每個(gè)器件驅(qū)動(dòng)程序是一個(gè)允許直接訪問在普通計(jì)算機(jī)中使用的硬件,如圖像拾取裝置20(圖2)或計(jì)時(shí)器的對(duì)象,并且響應(yīng)相關(guān)硬件的中斷執(zhí)行處理。
機(jī)器人服務(wù)器對(duì)象32由虛擬機(jī)器人33、電源管理程序34、器件驅(qū)動(dòng)程序管理程序35以及設(shè)計(jì)的機(jī)器人36組成。所述電源管理程序34由一組負(fù)責(zé)在電源之間切換的軟件項(xiàng)目組成。所述器件驅(qū)動(dòng)程序管理程序35由一組軟件項(xiàng)目組成,管理各種其它器件驅(qū)動(dòng)程序。所述設(shè)計(jì)的機(jī)器人36由管理所述機(jī)器人裝置1的機(jī)構(gòu)的一組軟件項(xiàng)目組成。位于器件驅(qū)動(dòng)程序?qū)?0的最下層的虛擬機(jī)器人33由提供訪問硬件項(xiàng)目的接口的一組軟件項(xiàng)目組成,它包括上述各種傳感器和執(zhí)行器251至25n。
管理程序?qū)ο?7由對(duì)象管理程序38和服務(wù)管理程序39組成。對(duì)象管理程序38是一組管理包括機(jī)器人的服務(wù)器對(duì)象32、中間件層40和應(yīng)用層41中的各軟件項(xiàng)目的引導(dǎo)和結(jié)束的軟件項(xiàng)目,而服務(wù)管理程序39是一組根據(jù)存儲(chǔ)器卡28(圖2)中存儲(chǔ)的連接文件中陳述的關(guān)于各對(duì)象之間連接的信息,管理各對(duì)象間連接的軟件項(xiàng)目。
中間件層40位于機(jī)器人服務(wù)器對(duì)象32的上層,并且由提供機(jī)器人裝置1的基本功能,如圖像處理或語音處理的一組軟件項(xiàng)目組成。應(yīng)用程序?qū)?1位于中間件層40的上層,并且是根據(jù)組成中間件層40的軟件項(xiàng)目處理的結(jié)果決定機(jī)器人裝置1的行為的一組軟件項(xiàng)目。
圖4示說明了中間件層40和應(yīng)用層41的具體的軟件結(jié)構(gòu)。
參見圖4,中間件層40是由識(shí)別系統(tǒng)60和輸出系統(tǒng)69組成。所述識(shí)別系統(tǒng)60具有用于噪音、溫度或亮度檢測、音階(sound scale)識(shí)別、距離或姿勢(shì)檢測,用于接觸傳感器,用于運(yùn)動(dòng)檢測和顏色識(shí)別的信號(hào)處理模塊58至58以及輸入語義轉(zhuǎn)換器模塊59。所述輸出系統(tǒng)69具有輸出語義轉(zhuǎn)換器模塊68以及用于姿勢(shì)管理、跟蹤、運(yùn)動(dòng)再現(xiàn)、行走、從跌倒?fàn)顟B(tài)的恢復(fù)、LED閃光和聲音再現(xiàn)的信號(hào)處理模塊61至67。
識(shí)別系統(tǒng)60的信號(hào)處理模塊50至58從由機(jī)器人服務(wù)器對(duì)象32的虛擬機(jī)器人33從DRAM11(圖2)讀出的以進(jìn)行處理的傳感器數(shù)據(jù)、圖像數(shù)據(jù)和語音數(shù)據(jù)中捕獲相關(guān)的數(shù)據(jù),并向輸入語義轉(zhuǎn)換器模塊59發(fā)送處理的結(jié)果。應(yīng)注意,虛擬機(jī)器人33構(gòu)造為用于根據(jù)預(yù)定通信協(xié)議交換或轉(zhuǎn)換信號(hào)的組件。
輸入語義轉(zhuǎn)換器模塊59識(shí)別自身狀態(tài)、周圍的狀態(tài)、用戶命令或動(dòng)作,如‘煩惱’、‘急躁’、‘光’、‘檢測到一個(gè)球’、‘檢測到跌倒’、‘被擊打’、‘被輕拍’、‘聽見do-mi-so音階’、‘檢測到運(yùn)動(dòng)的對(duì)象’、或‘檢測到障礙’以向應(yīng)用程序?qū)?1(圖3)輸出識(shí)別的結(jié)果。
應(yīng)用層41由五個(gè)模塊組成,即,行為模型庫70、行為切換模塊71、學(xué)習(xí)模塊72、感覺模型73及本能模型74,如圖5所示。
在行為模型庫70中,提供有與多個(gè)預(yù)選條件項(xiàng)目,如‘剩余電池容量低’、‘從跌倒?fàn)顟B(tài)恢復(fù)’、‘要躲避的障礙’、‘要表達(dá)的感覺’、或‘檢測到一個(gè)球’相關(guān)的各獨(dú)立行為模塊701至70n,如圖6所示。
當(dāng)從輸入語義轉(zhuǎn)換器模塊59提供了識(shí)別的結(jié)果、或從提供最后的識(shí)別結(jié)果的時(shí)間起過了預(yù)定的時(shí)間時(shí),行為模型701至70n在參照感覺模型73中保存的情感參數(shù)值、和參照本能模型74中保存的相應(yīng)愿望的參數(shù)值的同時(shí)、決定下面的行為以將決定的結(jié)果發(fā)送到行為切換模塊71。
在本實(shí)施例中,行為模型701至70n使用稱為有限概率自動(dòng)機(jī)的算法作為決定下一個(gè)行為的技術(shù)。該算法根據(jù)對(duì)于內(nèi)連各節(jié)點(diǎn)NODE0至NODEn的弧ARC1至ARCn1設(shè)定的轉(zhuǎn)換概率的值P1至Pn概率地確定從節(jié)點(diǎn)NODE0至NODEn中的哪一個(gè)到這些節(jié)點(diǎn)NODE0至NODEn中的哪一個(gè)將進(jìn)行轉(zhuǎn)換。
具體而言,每個(gè)行為模型701至70n包括圖8所示的每個(gè)節(jié)點(diǎn)NODE0至NODEn的狀態(tài)轉(zhuǎn)換表80,與這些節(jié)點(diǎn)NODE0至NODEn相關(guān)地形成其自身的行為模型701至70n。
在狀態(tài)轉(zhuǎn)換表80中,作為節(jié)點(diǎn)NODE0至NODEn中轉(zhuǎn)換條件的輸入事件(識(shí)別的結(jié)果),以優(yōu)先級(jí)的序列,列表在‘輸入事件名’的列中,并且在列‘?dāng)?shù)據(jù)名’和‘?dāng)?shù)據(jù)范圍’的相關(guān)行中陳述轉(zhuǎn)換條件的其它條件。
因此,在圖8的狀態(tài)轉(zhuǎn)換表80中說明了的節(jié)點(diǎn)NODE100中,假定‘檢測到球’(BALL)的識(shí)別結(jié)果,則與識(shí)別結(jié)果一起假定的球的大小(SIZE)是‘從1至1000’,代表向另一個(gè)節(jié)點(diǎn)轉(zhuǎn)換的條件。相似地,假定識(shí)別結(jié)果‘檢測到障礙’(OBSTACLE),與識(shí)別結(jié)果一起假定的到所述障礙的距離(DISTANCE)是“從0至100”的范圍,代表向另一個(gè)節(jié)點(diǎn)轉(zhuǎn)換的條件。
而且在當(dāng)前的節(jié)點(diǎn)NODE100中,如果沒有輸入任何識(shí)別結(jié)果,但是在行為模型701至70n周期地參考的參數(shù)值當(dāng)中,保存在感覺模型73中的,各情感和愿望的參數(shù)值當(dāng)中的參數(shù)值‘高興’(JOY),‘驚奇’(SURPRISE)或‘悲傷’(SADNESS)中任何一個(gè)在‘50至100’之間的范圍中,則可以做出向另一個(gè)節(jié)點(diǎn)的轉(zhuǎn)換。
而且,在狀態(tài)轉(zhuǎn)換表80中,從節(jié)點(diǎn)NODE0至NODEn能夠做出向其轉(zhuǎn)換的節(jié)點(diǎn)名表示在列‘向其它節(jié)點(diǎn)轉(zhuǎn)換的概率’中的行‘轉(zhuǎn)換的目的地節(jié)點(diǎn)’中。另外,在列‘輸入事件名’、‘?dāng)?shù)據(jù)名’和‘?dāng)?shù)據(jù)范圍’中陳述的所有條件滿足時(shí),可以將向其它節(jié)點(diǎn)NODE0至NODEn轉(zhuǎn)換的概率列入在列‘向其它節(jié)點(diǎn)轉(zhuǎn)換概率’的相對(duì)應(yīng)位置。在向節(jié)點(diǎn)NODE0至NODEn轉(zhuǎn)換時(shí)要輸出的行為表示在列‘向其它節(jié)點(diǎn)轉(zhuǎn)換概率’中的行‘輸出行為’中。同時(shí),列‘向其它節(jié)點(diǎn)轉(zhuǎn)換的概率’中的每行概率值的總和是100%。
因此,在圖8的狀態(tài)轉(zhuǎn)換表80表示的節(jié)點(diǎn)NODE100中,假設(shè)識(shí)別結(jié)果‘檢測到球’并且球的大小(SIZE)是‘從0至100’的范圍,那么,能夠以30%的概率做出向‘節(jié)點(diǎn)NODE120(節(jié)點(diǎn)120)’轉(zhuǎn)換,然后輸出行為‘ACTION1’。
在行為模型701至70n的每個(gè)中,每個(gè)都如該狀態(tài)轉(zhuǎn)換表80中陳述的那樣多個(gè)節(jié)點(diǎn)NODE0至NODEn的集合交連在一起,從而,假定從輸入語義轉(zhuǎn)換器模塊59給出識(shí)別結(jié)果,則利用NODE0至NODEn的狀態(tài)轉(zhuǎn)換表概率地確定下一個(gè)行為,并且將該決定的結(jié)果輸出到行為切換模塊71。
圖5說明了的行為切換模塊71,向中間件層40的輸出語義轉(zhuǎn)換器模塊68發(fā)送命令,以在從行為模型庫70的各個(gè)行為模型701至70n輸出的各行為當(dāng)中,選擇具有預(yù)定的較高優(yōu)先級(jí)的從行為模型701至70n輸出的一個(gè)行為,并且執(zhí)行該行為。該命令在下面稱為行為命令。在本實(shí)施例中,在圖6中說明了的行為模型701至70n的給定一個(gè)的優(yōu)先級(jí)排列(the order ofpriority)越高,在圖6中的所述的行為模型的等級(jí)(rank)越低。
行為切換模塊71根據(jù)在行為結(jié)束后輸出語義轉(zhuǎn)換器模塊68提供的行為完成信息,通知學(xué)習(xí)模塊72、感覺模型73和本能模型74該行為結(jié)束的效果。
將從輸出語義轉(zhuǎn)換器模塊68提供的識(shí)別結(jié)果中的作為用戶動(dòng)作,如‘輕拍’或‘打擊’接收的指令的識(shí)別結(jié)果饋送到學(xué)習(xí)模塊72。
學(xué)習(xí)模塊72根據(jù)識(shí)別結(jié)果和從行為切換模塊71來的通知,改變行為模型庫70中的行為701至70n的轉(zhuǎn)換概率,從而,在動(dòng)作是‘輕拍’(‘訓(xùn)斥’)或‘打擊’(‘表揚(yáng)’)時(shí),所述行為的發(fā)生概率將分別增加或降低。
另一方面,感覺模型73保存表示六種情感類型每一個(gè)的強(qiáng)度的參數(shù),即,高興(JOY)、悲傷(SADNESS)、憤怒(ANGER)、驚奇(SURPRISE)、厭惡(DISGUST)和恐懼(FEAR)。感覺模型73根據(jù)輸入語義轉(zhuǎn)換器模塊59提供的特定識(shí)別結(jié)果,如‘被輕拍’或‘被打擊’,逝去的時(shí)間以及從行為切換模塊71來的通知周期地修改這些情感類型的參數(shù)值。
特別地,感覺模型73根據(jù)下列公式(1)計(jì)算下一周期的當(dāng)前情感類型的參數(shù)值E[t+1]E[t+1]=E[t]+ke×ΔE[t] ...(1)其中ΔE[t]為由預(yù)定的公式根據(jù),例如輸入語義轉(zhuǎn)換器模塊59提供的識(shí)別結(jié)果、機(jī)器人裝置在相關(guān)時(shí)間的行為或根據(jù)從前一個(gè)改變事件時(shí)間開始已逝去的時(shí)間計(jì)算的情感類型的變化量,E[t]是情感類型的當(dāng)前參數(shù)值,以及ke是表示情感類型的敏感度的系數(shù)。感覺模型73用這樣計(jì)算的值代替情感類型的當(dāng)前參數(shù)值E[t],以修改情感類型的參數(shù)值。以相似的方式,感覺模型73修改情感類型的總體的參數(shù)值。
從輸出語義轉(zhuǎn)換器模塊68來的各識(shí)別結(jié)果和通知將對(duì)各情感類型參數(shù)值的改變量ΔE[t]具有怎樣的影響是預(yù)先確定的,從而,識(shí)別結(jié)果‘被輕拍’顯著地影響情感類型‘憤怒’的參數(shù)值的改變量ΔE[t],而識(shí)別結(jié)果‘被輕拍’顯著地影響情感類型‘高興’的參數(shù)值的改變量ΔE[t]。
輸出語義轉(zhuǎn)換器模塊68的通知是所謂的行為反饋信息(行為結(jié)束信息)和關(guān)于行為發(fā)生的結(jié)果的信息。感覺模型73還根據(jù)該信息改變感覺。例如,通過‘吠’的動(dòng)作可以降低憤怒的感覺水平。同時(shí),輸出語義轉(zhuǎn)換器模塊68來的通知也輸入到學(xué)習(xí)模塊72,然后,它根據(jù)該通知改變行為模型701至70n的相應(yīng)轉(zhuǎn)換概率。
同時(shí),由行為切換模塊71的輸出(適應(yīng)于該感覺的行為)可以做出行為結(jié)果的反饋。
另一方面,本能模型74保存表示五個(gè)相互獨(dú)立的愿望的強(qiáng)度參數(shù),即‘練習(xí)愿望’、‘好感愿望’、‘食欲’及‘好奇’。本能模型74根據(jù)輸入語義轉(zhuǎn)換器模塊59提供的識(shí)別結(jié)果、逝去的時(shí)間以及從行為切換模塊71來的通知,周期地修改這些愿望的參數(shù)值。
特別地,本能模型74關(guān)于‘練習(xí)愿望’、‘好感愿望’和‘好奇’在預(yù)定的周期使用下面的公式,計(jì)算在下個(gè)周期中的這些愿望的參數(shù)值I[k+1]I[k+1]=I[k]+ki×ΔI[k] ...(2)其中,ΔI[k]是由預(yù)定公式根據(jù)識(shí)別結(jié)果、逝去的時(shí)間及輸出語義轉(zhuǎn)換器模塊68的通知計(jì)算的在相關(guān)時(shí)間的所述愿望的改變量,I[k]是愿望的當(dāng)前參數(shù)值,以及ki是表示所述愿望的敏感度的系數(shù),并且用計(jì)算的結(jié)果代替當(dāng)前參數(shù)值I[k],以修改愿望的參數(shù)值。本能模型74修改除了‘食欲’外的各愿望的參數(shù)值。
從輸出語義轉(zhuǎn)換器模塊模塊68來的識(shí)別結(jié)果和通知對(duì)各愿望的參數(shù)值的改變量ΔI[k]的影響是預(yù)先確定的,從而,例如,從輸出語義轉(zhuǎn)換器模塊68來的通知顯著影響‘疲勞’參數(shù)值的改變量ΔI[k]。
在本實(shí)施例中,各個(gè)情感類型和各個(gè)愿望的參數(shù)在從0至100的范圍內(nèi)改變,而系數(shù)ke和ki的值對(duì)各個(gè)情感類型和各個(gè)愿望獨(dú)立地進(jìn)行設(shè)定。
如圖4所示,中間件層40的輸出語義轉(zhuǎn)換器模塊68將如上所述的應(yīng)用層41的行為切換模塊71提供的抽象的行為命令,如‘往前走’、‘高興’、‘喊叫’或‘跟蹤(跟蹤一個(gè)球)’發(fā)送到輸出系統(tǒng)69的信號(hào)處理模塊61至67。
假定一行為命令,信號(hào)處理模塊61至67根據(jù)該行為命令,產(chǎn)生將提供到相關(guān)執(zhí)行器251至25n(圖2)以執(zhí)行該行為的伺服命令值、要從揚(yáng)聲器24(圖2)輸出的聲音語音數(shù)據(jù)、和/或要向‘眼睛’LED提供的驅(qū)動(dòng)數(shù)據(jù),并且以這樣的順序,通過機(jī)器人服務(wù)器對(duì)象32的虛擬機(jī)器人33和信號(hào)處理電路14(圖2)將這些數(shù)據(jù)發(fā)送到相關(guān)的執(zhí)行器251至25n、揚(yáng)聲器24或LED。
以這種方式,機(jī)器人裝置1能夠根據(jù)控制程序響應(yīng)其自身內(nèi)部狀態(tài)、周圍的狀態(tài)(外部狀態(tài))或用戶的命令或動(dòng)作,執(zhí)行自主的行為。(3)本發(fā)明在機(jī)器人裝置上的應(yīng)用現(xiàn)在說明的技術(shù)代表將本發(fā)明應(yīng)用于機(jī)器人裝置的基礎(chǔ)。(3-1)系統(tǒng)結(jié)構(gòu)的概況首先,在下面說明實(shí)現(xiàn)基于情感的符號(hào)獲取的系統(tǒng)結(jié)構(gòu)的概況。
首先,在構(gòu)造系統(tǒng)時(shí)存在以下問題。通過本發(fā)明的系統(tǒng)解決了這些問題,并且將實(shí)現(xiàn)現(xiàn)有技術(shù)未能實(shí)現(xiàn)的逼真的機(jī)器人。
首先存在下面問題(Req-1)語言獲取行為如何嵌入機(jī)器人裝置1的自主行為系統(tǒng);(Req-2)基于情感的符號(hào)將如何構(gòu)造;(Req-3)要識(shí)別的現(xiàn)實(shí)世界的對(duì)象如何分類;以及(Req-4)機(jī)器人裝置1和人類如何將注意引向相同的對(duì)象,即,如何解決共同注意的問題。
首先,問題(Req-1)是通過集成生態(tài)學(xué)模型產(chǎn)生的自主行為的方法和基于物理的符號(hào)的獲取的方法而解決的。
應(yīng)注意,通過生態(tài)學(xué)模型產(chǎn)生自主行為是在,例如Arkin的報(bào)告(下面稱為參考資料6,Arkin,R.C.,F(xiàn)ujita,M.,Takagi,T.,和Hasegawa,R.撰寫的“生態(tài)學(xué)模型...(Ethological Model...)”提交到ICRA至2001),和Bates的報(bào)告(下稱參考資料7,Bates,J.撰寫的“在交互的世界和oz項(xiàng)目中的特征本性(Nature of character in interactive worlds and the oz project)”“技術(shù)報(bào)告(Technical Report)CMU-CS-92-200”,Carnegie Mellon大學(xué),1992年10月)中提出的技術(shù)。
基于物理的符號(hào)獲取的方法是在前述的參考資料1-3中提出的技術(shù)。
特別地,將作為滿足關(guān)于信息的饑餓感覺的行為的信息獲取行為定義為自主行為之一,并且將‘吃’信息的信息獲取行為實(shí)現(xiàn)為與吃食物的行為相似的子系統(tǒng)。作為要獲取的對(duì)象的信息是對(duì)象和意義的名稱。
所述子系統(tǒng)是規(guī)定機(jī)器人裝置1的行為的子系統(tǒng),所述的機(jī)器人裝置1具有依賴于行為種類的多種子系統(tǒng)。該子系統(tǒng)主要由感知和內(nèi)部狀態(tài)確定。
至于(Req-2)基于情感的符號(hào)問題,通過將激發(fā)所述行為的內(nèi)部狀態(tài)變化與那時(shí)的輸入和行為相關(guān)聯(lián)來解決。特別地,不是通過將輸入時(shí)內(nèi)部狀態(tài)其本身,而是將針對(duì)輸入的內(nèi)部狀態(tài)變化,與那時(shí)的輸入和行為相關(guān)聯(lián),而使對(duì)象對(duì)個(gè)人的意義與滿足內(nèi)部狀態(tài)時(shí)激起的情感之間相關(guān)聯(lián)。
至于(Req-3),通過用感知分類對(duì)象,和通過將統(tǒng)計(jì)模型用作作為感知檢測到的顏色等的分類器,適當(dāng)?shù)胤诸愐R(shí)別的現(xiàn)實(shí)世界的對(duì)象。
機(jī)器人裝置與在計(jì)算機(jī)中構(gòu)造的虛擬世界中提出的,如在El至Nasr等人的報(bào)告(下面稱為參考資料8,El-Nasr,M.,Loeger,T.,和Yen,J.撰寫的“PETTEI帶有情感衍生智能的寵物(A pet with Evolving EmtionallyIntelligence)”刊載在“自主智能體的國際會(huì)議會(huì)議錄(procedings ofInternational Conference on Autonomous Agents)”中,2000)中提出的合成生物之間的不同是機(jī)器人裝置必須能夠在現(xiàn)實(shí)世界中操作。在現(xiàn)實(shí)世界的對(duì)象中,顏色、形狀等連續(xù)地分布在各特征空間中。而且,缺乏編程的簡單觀察對(duì)象不能夠揭示它實(shí)際具有的意義。所以,在解決上述問題(Req-3)中,使用統(tǒng)計(jì)模型作為感知的分類器。
由通過利用該生態(tài)模型的行為選擇中注意力引向?qū)ο髸r(shí)執(zhí)行所述行為的一部分,自發(fā)地執(zhí)行共同的注意力,而解決(Req-4)的共同注意問題。
共同注意或協(xié)同注意是現(xiàn)實(shí)世界中符號(hào)獲取的重要功能之一。在Burner的報(bào)告(下面稱為參考資料9,Bruner,J.撰寫“學(xué)習(xí)如何用字做事情(Learning how to do things with wordz)”刊載在J.Brunner和A.Garton著的“人的生長和發(fā)展(Human growth and development)”,Wolfstan CollegeLectures,Clarendon出版社,1978年)中,例如在認(rèn)識(shí)心理學(xué)中指出共同注意在嬰兒的學(xué)習(xí)過程中起重要的作用。這是引導(dǎo)方和被引導(dǎo)方,這里為嬰兒共同擁有感興趣對(duì)象的能力,由于嬰兒自發(fā)地朝引導(dǎo)者手指指出的方向,或沿引導(dǎo)者的視線看。
通過利用注意引向某個(gè)對(duì)象時(shí)執(zhí)行所述行為的生態(tài)模型的行為選擇的一部分,自發(fā)地將該共同注意納入到自主行為中。
首先,簡要說明考慮生態(tài)研究的行為控制。例如在上述的參考資料6中討論了生態(tài)運(yùn)動(dòng)控制技術(shù)。
接下來,全面地說明其結(jié)構(gòu),以及如何將信息獲取行為集成在自主機(jī)器人裝置1的軟件中,以及與共同注意相關(guān)的解決方法。
在生態(tài)模型中的關(guān)鍵點(diǎn)是,通過內(nèi)部狀態(tài)和外部刺激選擇行為,并且在產(chǎn)生行為評(píng)估(行為值)時(shí),獨(dú)立評(píng)估和相關(guān)(融合)從內(nèi)部狀態(tài)產(chǎn)生的動(dòng)機(jī)和從外部刺激來的釋放信號(hào)。這使得將內(nèi)部變量抑制到一定程度內(nèi)的體內(nèi)平衡(homeostatic)的行為能夠產(chǎn)生。同時(shí),體內(nèi)平衡的行為是表現(xiàn)為例如將內(nèi)部變量保持在固定水平上的行為。
圖9說明了一種允許對(duì)彼此相關(guān)的內(nèi)部變量和外部刺激進(jìn)行獨(dú)立評(píng)估的配置。圖10說明了一種實(shí)現(xiàn)體內(nèi)平衡的行為的配置,更具體地說,說明了一種其中系統(tǒng)地構(gòu)造行為,并且解釋外部環(huán)境以獲得外部刺激從而選擇保持固定內(nèi)部狀態(tài)的行為的配置。
參見圖9,說明攝取行為的情況。動(dòng)機(jī)產(chǎn)生器101評(píng)估并輸出從內(nèi)部狀態(tài)如饑餓程度來的攝取行為的動(dòng)機(jī)值。釋放機(jī)構(gòu)102評(píng)估并輸出與攝取行為相關(guān)的外部刺激,例如,如果存在食物的話,攝取行為的釋放信號(hào),。動(dòng)機(jī)值和釋放信號(hào)彼此獨(dú)立地被評(píng)估。
行為評(píng)估器103評(píng)估動(dòng)機(jī)值和釋放信號(hào),并輸出行為本身的評(píng)估值作為行為值。存在多個(gè)對(duì)其每一個(gè)都獨(dú)立計(jì)算行為值,并輸出到稍后說明的動(dòng)作選擇單元的行為。動(dòng)作選擇器選擇給出最高評(píng)估的行為以執(zhí)行這樣選擇的行為。
通過定義動(dòng)機(jī)產(chǎn)生器101從而使當(dāng)內(nèi)部狀態(tài)偏離最適宜的范圍時(shí),將采取使內(nèi)部狀態(tài)能夠恢復(fù)到它原來范圍的動(dòng)作,實(shí)現(xiàn)了試圖獲取行為的對(duì)象的廣義的行為定義,如果外部世界存在該對(duì)象的話,從而可以實(shí)現(xiàn)體內(nèi)平衡行為。(3-3)基于情感的符號(hào)獲取的體系基于情感的符號(hào)獲取實(shí)現(xiàn)相對(duì)于未知對(duì)象的情感獲取行為作為自主行為的一部分。
作為一個(gè)例子,圖12說明了一個(gè)實(shí)現(xiàn)基于情感的符號(hào)獲取作為自主行為一部分的配置。在此系統(tǒng)構(gòu)造中的要點(diǎn)可以列為(i)能夠辨別輸入是未知的輸入還是先前已知的輸入的每個(gè)通道的分類器;(ii)用于存儲(chǔ)每個(gè)通道分類結(jié)果與內(nèi)部變量的改變時(shí)間的相關(guān)存儲(chǔ)器;以及(iii)通過生態(tài)模型將內(nèi)部變量和外部刺激結(jié)合。
以上是系統(tǒng)構(gòu)造的要點(diǎn)。同時(shí),如果外部刺激是已知刺激,則啟動(dòng)根據(jù)通常生態(tài)模型的體內(nèi)平衡行為的自主行為。
根據(jù)本發(fā)明實(shí)現(xiàn)的基于情感的符號(hào)獲取,其特征為存儲(chǔ)對(duì)象對(duì)哪個(gè)內(nèi)部狀態(tài)是至關(guān)重要的,并從而顯著地不同于通常的基于物理的符號(hào)獲取。
因此,基于情感的符號(hào)獲取將對(duì)象與基于情感的信息相關(guān)。通過將信息與對(duì)象相關(guān),使釋放機(jī)構(gòu)能夠評(píng)估對(duì)于新的對(duì)象要采取哪個(gè)動(dòng)作。
而且,通過將內(nèi)部狀態(tài)變化(內(nèi)部變量)作為與對(duì)象相關(guān)的相關(guān)存儲(chǔ)器,能夠從所述相關(guān)存儲(chǔ)器輸出在次要情感中存儲(chǔ)的內(nèi)部變量中的改變以產(chǎn)生第二階的情感,如高興或恐懼作為情感。
這使得能夠與見到的對(duì)象相關(guān)地,作為情感表現(xiàn)行為,產(chǎn)生表達(dá),影響行為選擇,或調(diào)整運(yùn)動(dòng)。(3-4)情感獲取(吃)行為為實(shí)現(xiàn)作為自主行為一部分的信息獲取行為,定義下面稱為信息獲取行為子系統(tǒng)的子系統(tǒng),它具有作為內(nèi)部狀態(tài)因子的與信息獲取愿望相關(guān)的各變量,在下面稱其為信息獲取變量。
例如,將信息獲取行為子系統(tǒng)定義為是一個(gè)內(nèi)部模型,其信息獲取變量在對(duì)其相關(guān)存儲(chǔ)器為未知的輸入進(jìn)行學(xué)習(xí)的情況下得以增加,并且隨著時(shí)間而減少。在所述信息獲取變量被耗盡時(shí),該信息獲取行為子系統(tǒng)產(chǎn)生信息獲取行為的動(dòng)機(jī)。
而且,在這種情況下,當(dāng)輸入(信息)是未知時(shí),釋放機(jī)構(gòu)產(chǎn)生釋放信號(hào)。這使得獲取信息的行為,象吃食物的行為那樣,能夠作為內(nèi)部變量和外部刺激的融合而產(chǎn)生。
在信息獲取的愿望增加時(shí),尋找未知對(duì)象的行為和諸如對(duì)未知對(duì)象問‘這是什么?’的詢問的行為,是表現(xiàn)為信息獲取行為的特定行為的典型行為。一般是通過與用戶對(duì)話形成這樣的行為。
通過構(gòu)造這樣的系統(tǒng),通過基于好奇的對(duì)話能夠?qū)崿F(xiàn)信息獲取,并進(jìn)一步地自然地在自主行為中嵌入信息獲取行為。即,信息獲取行為是作為機(jī)器人裝置1中的實(shí)現(xiàn)為自主行為的交互的新元素實(shí)現(xiàn)。(3-5)共同注意共同注意或協(xié)同注意自發(fā)地被嵌入在系統(tǒng)中。在該系統(tǒng)結(jié)構(gòu)中,根據(jù)共同注意的信息獲取行為(吃信息)如下執(zhí)行假定通過如上所述的各內(nèi)部變量和各外部刺激的融合,由動(dòng)作選擇單元116選擇了信息獲取行為。
激發(fā)釋放機(jī)構(gòu)102發(fā)出釋放信號(hào)的對(duì)象是進(jìn)行信息獲取的目標(biāo)。如果從內(nèi)部狀態(tài)的饑餓感覺單獨(dú)地選擇該行為,則進(jìn)行尋找,并且給定對(duì)象變成所述信息獲取行為的目標(biāo)。因此,執(zhí)行行為獲取的目標(biāo)變成共同注意的目標(biāo)。
如果機(jī)器人具有主動(dòng)性,即,如果信息獲取行為從內(nèi)部狀態(tài)的饑餓感覺引起,則機(jī)器人裝置1接近目標(biāo),并將其手指指向目標(biāo)以激發(fā)操縱者的人的注意力從而實(shí)現(xiàn)共同注意。
如果用戶具有主動(dòng)性,即,如果根據(jù)釋放機(jī)構(gòu)102發(fā)出的釋放信號(hào)指定目標(biāo),機(jī)器人裝置1首先發(fā)出聲音或移動(dòng)對(duì)象以激發(fā)用戶的注意。用戶可以對(duì)此作出響應(yīng)指向所述目標(biāo),如用手指指向目標(biāo),做出詢問‘這是什么?’。當(dāng)該手指或詢問選擇了行為獲取行為時(shí),機(jī)器人裝置1指定用手指指向的對(duì)象作為對(duì)象。因此,即使用戶具有主動(dòng)性,也實(shí)現(xiàn)了對(duì)相同目標(biāo)的共同注意。
因此,在本系統(tǒng)中,共同注意作為如愿地對(duì)內(nèi)部狀態(tài)予以注意,或?qū)?qiáng)烈的外部刺激予以注意的一般概念的一部分,納入到系統(tǒng)中。(3-6)內(nèi)部狀態(tài)和情感(內(nèi)部變量和情感)的改變參見圖12,將情感部分120大致分成感知內(nèi)部狀態(tài)部分131、內(nèi)部狀態(tài)部分132和情感部分133。
第一個(gè)內(nèi)部狀態(tài)部分132管理內(nèi)部狀態(tài)本身的動(dòng)態(tài)。所述內(nèi)部狀態(tài)包括作為虛擬變量的營養(yǎng)、水、疲勞和好奇,這將在下面序列說明(圖23)。除了上述的外,這些內(nèi)部變量可以包括在活的有機(jī)體或動(dòng)物中發(fā)現(xiàn)的其它內(nèi)部變量。內(nèi)部狀態(tài)部分132監(jiān)視各個(gè)保養(yǎng)所需的各狀態(tài)以檢測所監(jiān)視的值偏離了最佳值。為維持恒定所需的行為,內(nèi)部狀態(tài)部分132還向動(dòng)機(jī)產(chǎn)生器發(fā)送促使保持內(nèi)部狀態(tài)所需行為的信號(hào)。
第二部分,即,感知內(nèi)部狀態(tài)132,是分析從內(nèi)部傳感器或外部傳感器來的輸入以向內(nèi)部狀態(tài)管理單元輸入該分析結(jié)果的部分。所述傳感器信號(hào)分析對(duì)應(yīng)于真實(shí)動(dòng)物情況下的,有關(guān)從血液中的糖的比例檢測到的飲食的信息,或有關(guān)疲勞的信息。在機(jī)器人裝置1中,傳感器信號(hào)是剩余電池容量的分析。在機(jī)器人裝置1中,預(yù)先假設(shè)偽食欲,并且通過執(zhí)行適當(dāng)?shù)膭?dòng)作產(chǎn)生輸入信號(hào)以維持偽恒定內(nèi)部狀態(tài)。
第三部分,即,情感部分133,是通過內(nèi)部變量的改變,產(chǎn)生愉快或不愉快的感覺以產(chǎn)生與高興或憤怒相對(duì)應(yīng)的情感的部分。該情感部分133也稱為第二階情感,并根據(jù)稱為第一階情感的內(nèi)部情感的滿足程度產(chǎn)生愉快或不愉快的信號(hào)。而且,情感部分133從這些愉快信號(hào)、不愉快信號(hào)、喚醒程度或確信狀態(tài)產(chǎn)生諸如高興、悲傷或憤怒的情感。第二階情感用于情感表現(xiàn)的行為,諸如產(chǎn)生面部表情或產(chǎn)LED的相應(yīng)光模式。
如圖12所示,內(nèi)部狀態(tài)的這些改變,通過學(xué)習(xí)存儲(chǔ)器(相關(guān)存儲(chǔ)器)140用于學(xué)習(xí)的時(shí)序。這意味著當(dāng)內(nèi)部狀態(tài)發(fā)生重大改變時(shí)進(jìn)行學(xué)習(xí)。將內(nèi)部狀態(tài)和情感狀態(tài)輸入到行為產(chǎn)生單元的動(dòng)機(jī)產(chǎn)生器用作各行為的誘因刺激。(3-7)未知刺激的感知在現(xiàn)實(shí)世界中機(jī)器人裝置1的開發(fā)中,感覺‘識(shí)別’是一個(gè)嚴(yán)重的任務(wù)。具體而言,在現(xiàn)實(shí)環(huán)境下的實(shí)時(shí)識(shí)別,它提出一個(gè)關(guān)鍵問題,即,隨各種因素變化的輸入應(yīng)視為是與已經(jīng)學(xué)習(xí)的信息相同,還是應(yīng)判斷為是新的刺激。
近來,統(tǒng)計(jì)或概率模式分類的技術(shù)在識(shí)別領(lǐng)域已取得顯著結(jié)果。這是將在特征空間中分布的輸入抽樣處理為最小化風(fēng)險(xiǎn)函數(shù)并找出它的參數(shù)的統(tǒng)計(jì)問題的識(shí)別技巧。在稍后說明的,當(dāng)前是語音識(shí)別的主流的Hidden-Markov-Model(HMM),是也屬于該范疇的的識(shí)別技術(shù)。HMM也是圖像識(shí)別的代表性識(shí)別技術(shù)。
在本系統(tǒng)中,使用該統(tǒng)計(jì)模式識(shí)別的技術(shù),檢查給定的輸入是否是未知對(duì)象或已知對(duì)象。
在統(tǒng)計(jì)模式識(shí)別中,給出給定對(duì)象是否是它的原型的概率或可能性,并用于辨別對(duì)象是未知的或已知的刺激。而且,如果在給定傳感器通道的特征空間中的距離較小以致通過該單獨(dú)的通道決定是困難的,則可以用另一個(gè)通道觀察顯著差異,使得能夠調(diào)節(jié)原來空間中的辨別參數(shù)。(3-8)存儲(chǔ)感覺的學(xué)習(xí)存儲(chǔ)器(與情感相關(guān)的相關(guān)存儲(chǔ)器)學(xué)習(xí)存儲(chǔ)器(相關(guān)存儲(chǔ)器)用于進(jìn)行伴隨由作為誘因的各感知通道的輸出引起的內(nèi)部狀態(tài)改變的學(xué)習(xí)。在此,學(xué)習(xí)意味著對(duì)與引起內(nèi)部狀態(tài)改變的對(duì)象,即影響內(nèi)部狀態(tài)的對(duì)象相結(jié)合作為誘因的內(nèi)部狀態(tài)變化的存儲(chǔ)。
應(yīng)注意內(nèi)部狀態(tài)變化是根據(jù),例如,傳感器信號(hào)分析中能夠?qū)嶋H地測定的量,比如在關(guān)節(jié)中消耗的電流,以及根據(jù)如在(3-5)內(nèi)部狀態(tài)和情感中的改變(內(nèi)部變量和情感)中所述的偽測定的量(對(duì)吃虛擬食物的操作的檢測)產(chǎn)生的。在關(guān)節(jié)中消耗的電流由運(yùn)動(dòng)的次數(shù)確定,并且代表,例如,疲勞因子。
和相關(guān)性一樣,根據(jù)從感知通道發(fā)送的原型數(shù)目和對(duì)所述原型合適的概率學(xué)習(xí)同時(shí)發(fā)生的事件之間的相似性。在這些事件當(dāng)中,有所謂的基于物理的符號(hào),如通過行為產(chǎn)生發(fā)送的對(duì)象名。這些符號(hào)也通過學(xué)習(xí)獲取。
同時(shí),作為誘因的內(nèi)部狀態(tài)變化和對(duì)對(duì)象采取的行為也相關(guān)地進(jìn)行存儲(chǔ)。結(jié)果是對(duì)由對(duì)對(duì)象采取什么行為產(chǎn)生內(nèi)部狀態(tài)的什么變化的存儲(chǔ)。這樣的學(xué)習(xí)代表基于情感的符號(hào)的獲取。
應(yīng)注意,情感是內(nèi)部狀態(tài)的直接改變,因此稱為第一階情感。但是,因?yàn)榈谝浑A情感的改變可以引起第二階情感,所以該情感是基于,例如,恐懼的符號(hào)。(3-9)子系統(tǒng)和行為根據(jù)圖10說明了的一組多個(gè)可分類的行為的子系統(tǒng)1151至115n控制行為。子系統(tǒng)1151至115n是分級(jí)結(jié)構(gòu)和樹狀結(jié)構(gòu),其最上層表明是實(shí)際的子系統(tǒng)。
在上述生態(tài)學(xué)研究的參考資料6中,即Arkin等人的報(bào)告中,列出精明(canny)行為必須和足夠的子系統(tǒng)。在參考資料6中報(bào)告的技術(shù)的特征是,將攝取行為(研究性的)定義為吃的行為的子系統(tǒng)。例如,攝取行為的子系統(tǒng)將食物定義為吃的行為。這理想地使得能夠產(chǎn)生將作為內(nèi)部狀態(tài)的剩余電池容量保持在某個(gè)范圍內(nèi)的行為,并且產(chǎn)生生成尋找充電地點(diǎn)的行為的動(dòng)機(jī)的行為,即產(chǎn)生充電或自動(dòng)充電的愿望。
在本系統(tǒng)中,本概念作為信息獲取的一個(gè)步驟引入,并且提供對(duì)應(yīng)于‘新穎信息的學(xué)習(xí)量’的行為作為內(nèi)部狀態(tài)的一項(xiàng),同時(shí)也定義隨比如時(shí)間因素降低的內(nèi)部狀態(tài)的動(dòng)態(tài)范圍。在內(nèi)部狀態(tài)的該動(dòng)態(tài)中,產(chǎn)生對(duì)應(yīng)于‘學(xué)習(xí)量’的行為,象電池的情況那樣。例如,機(jī)器人裝置1以使‘學(xué)習(xí)量’保持在一定范圍內(nèi)的方式動(dòng)作,并且如果‘學(xué)習(xí)量’耗盡,則尋找獲取新穎信息的未知對(duì)象。而且,當(dāng)未知對(duì)象作為外部刺激存在時(shí),機(jī)器人裝置1接近它并通過實(shí)施‘這是什么?’的詢問行為指向它。另外,機(jī)器人裝置1通過相關(guān)存儲(chǔ)器產(chǎn)生學(xué)習(xí)操作者說出的名字的行為。同時(shí),信息量是相應(yīng)于正在學(xué)習(xí)的對(duì)象的特征確定的或是隨時(shí)間的逝去降低的改變量。
而且,當(dāng)學(xué)習(xí)了對(duì)象的名字時(shí),能夠定義獲取所述對(duì)象的名字對(duì)內(nèi)部狀態(tài)具有的意義的行為。這可以通過測試對(duì)象的某個(gè)行為和在內(nèi)部狀態(tài)已改變時(shí),通過進(jìn)行行為和內(nèi)部狀態(tài)變化之間的相關(guān)學(xué)習(xí)而實(shí)現(xiàn)。(4)對(duì)實(shí)際機(jī)器人裝置的應(yīng)用(實(shí)施)(4-1)四腿機(jī)器人裝置的結(jié)構(gòu)(增強(qiáng)四腿機(jī)器人平臺(tái))現(xiàn)在說明其上安裝上述系統(tǒng)的四腿機(jī)器人裝置1。圖13說明了具有作為組成元件的機(jī)器人裝置1的網(wǎng)絡(luò)系統(tǒng)的例子。
在此網(wǎng)絡(luò)系統(tǒng)中,機(jī)器人裝置1借助于TCP/IP(發(fā)送控制/因特網(wǎng)協(xié)議)使用無線LAN卡161連接到網(wǎng)絡(luò)。
機(jī)器人裝置1包括CPU,其特性為主操作處理系統(tǒng)(MOPS)R4XXX約為100兆指令/秒(MIPS);以及16兆字節(jié)的主存儲(chǔ)器。該機(jī)器人裝置1包括作為輸出的執(zhí)行原始行為(基本姿勢(shì)轉(zhuǎn)換、尋找對(duì)象、跟蹤對(duì)象、接近對(duì)象、踢對(duì)象、吃對(duì)象等)的軟件;以及作為輸入的具有一串發(fā)音標(biāo)記的語音對(duì)象。機(jī)器人裝置1還存儲(chǔ)著用于使用相當(dāng)于機(jī)器人眼睛的LED做出幾個(gè)表達(dá)的命令。
在該機(jī)器人裝置1中,已經(jīng)構(gòu)造上述系統(tǒng),同時(shí)機(jī)器人裝置1實(shí)現(xiàn)了作為自主行為的一部分的信息獲取行為。
借助于機(jī)器人裝置1連接的網(wǎng)絡(luò)系統(tǒng)的優(yōu)點(diǎn),與在機(jī)器人裝置1上執(zhí)行的相似的操作能夠在工作站163上進(jìn)行。以下面的方式進(jìn)行在工作站163上的處理過程。
機(jī)器人裝置1捕獲輸入圖像信號(hào),并通過無線局域網(wǎng)LAN用無線LAN卡161將所述圖像發(fā)送到訪問點(diǎn)162。將所發(fā)送圖像經(jīng)以太網(wǎng)從訪問點(diǎn)162發(fā)送到工作站163。
將在機(jī)器人裝置1上各關(guān)節(jié)角的檢測結(jié)構(gòu)和傳感器檢測信息,如接觸傳感器或加速度傳感器獲得的信息,發(fā)送到工作站,正像從機(jī)器人裝置1向工作站163發(fā)送圖像一樣。如果處理是由工作站163進(jìn)行,則語音由工作站163提供的話筒輸入,而不使用機(jī)器人裝置1的話筒。
在工作站163上,使用上述的輸入信號(hào)如圖像,執(zhí)行上述的感知、各內(nèi)部變量的評(píng)估,行為子系統(tǒng)或動(dòng)作的選擇。這些功能可以通過在工作站上設(shè)計(jì)OPEN-R對(duì)象實(shí)現(xiàn),如同在機(jī)器人裝置1中一樣,通過,例如,安裝在Linux操作系統(tǒng)上的SONY公司制造的OPEN-R并通過自由互連網(wǎng)絡(luò)上對(duì)象而實(shí)現(xiàn)。例如,各操作當(dāng)前正根據(jù)混合在一起的Matlab程序和在Linux操作系統(tǒng)上的OPEN-R對(duì)象進(jìn)行。(4-2)實(shí)現(xiàn)的功能和試驗(yàn)結(jié)果通過應(yīng)用本發(fā)明,將機(jī)器人裝置1設(shè)計(jì)為通過作為自主行為的一部分的共同注意,最終實(shí)現(xiàn)信息獲取行為或情感確認(rèn)行為。具體而言,如圖14所示,機(jī)器人裝置1用共同注意(步驟S4)通過自主行為(步驟S1)、對(duì)象輸入(步驟S2)和行為選擇(步驟S3),最終實(shí)現(xiàn)信息獲取行為和信息確認(rèn)行為。機(jī)器人裝置1將這些階段作為自主行為的一部分進(jìn)行處理。(4-2-1)感知部分參見圖10,在機(jī)器人裝置1中提供感知部分111。具體而言,如圖12所示,感知部分121包括用于理解圖像的顏色感知部分122和形狀感知部分123,接觸感知部分(接觸部分)124,以及用于理解聲音的聲音感知部分125。
具體而言,顏色感知部分122是實(shí)現(xiàn)從對(duì)象信息自動(dòng)顏色分段的部分,如下面說明的那樣;形狀感知部分12是根據(jù)圖像信息分析對(duì)象形狀的部分;以及聲音感知部分125是與從話筒輸入的語音相應(yīng)的語音識(shí)別的部分。下面說明這些感知部分進(jìn)行的處理。
接觸感知部分124(接觸部分)通過所謂的肌膚球傳感器的信號(hào)與對(duì)象接觸,所述傳感器為在機(jī)器人裝置1的足底上提供的所謂肌膚球。(4-2-1-1)自動(dòng)顏色分段首先,基于輸入感知刺激進(jìn)行使用顏色的顏色分段。該顏色分段使得能夠刻劃出任意單一顏色的多個(gè)對(duì)象。另外,在顏色分段中,使用通過在沒有教師下學(xué)習(xí)的分群算法進(jìn)行的顏色分段。
圖15A和15B分別說明了人工繪制的對(duì)象及其顏色分段結(jié)果。圖16A和16B分別說明了包括人的手和面部的自然圖像及其顏色分段結(jié)果。
應(yīng)注意輸入圖像在從較窄視角(5341度)的相機(jī)輸入到系統(tǒng)時(shí),已經(jīng)通過了低通濾光器,從而減小到8860像素。為將該因素考慮在內(nèi),逐像素地獨(dú)立進(jìn)行顏色分段。通過這樣做,基本能夠?qū)崟r(shí)獲得圖15B和16B說明了的良好結(jié)果。
通常在RGB空間或規(guī)范化RGB空間中進(jìn)行顏色分段。因?yàn)橄鄼C(jī)信號(hào)是Y、Cr和Cb格式的,所以,將(Nr,Nb)的二維空間=(atan(Cr/Y),atan(Cb/Y))用作顏色空間。考慮到向RGB空間映射時(shí)執(zhí)行的計(jì)算量及量化誤差,這樣做可以達(dá)到極有效的處理。
同時(shí),該顏色分段用作形狀分析的預(yù)處理。
下面是上述顏色分段中分群算法的處理步驟(i)至(vi)的例子。
在步驟(i),均勻地排列適當(dāng)數(shù)目的原型。
在步驟(ii),向所有像素提供最接近的原型的級(jí)層(class 1evels to theclosest prototype)用下面公式(3)作為距離。d=(dhue/σhue)2+(dsat/σsat)2-------(3)]]>在上述公式中,hue和sat分別表示,如在從適當(dāng)?shù)娜訄D像的分布的起點(diǎn)可以看到的,如圖17所示。一般來說,Hue<sat。即,可以將上述距離認(rèn)為是在色調(diào)方向中的加權(quán)誤差。
在步驟(iii),如果屬于原型的像素?cái)?shù)目較小,則改變?cè)汀?br> 在步驟(iv),將原型移動(dòng)到具有相同類標(biāo)號(hào)(class label)的平均位置。
在步驟(v),如果兩個(gè)或更多原型的距離小于一定距離,則將這些原型一起組合到一個(gè)原型。
在步驟(vi),如果修改原型位置的次數(shù)不頻繁,或已到達(dá)適當(dāng)值,則終止操作。如果為相反情況,則處理過程回到上述步驟(ii),重新開始處理。
圖18A和18B說明了輸入圖像的分群狀態(tài)。圖18A和18B說明了一種分析以前存儲(chǔ)的皮膚顏色區(qū)域(area)以檢測指出的方向以及剝離出(strip out)延長線上的對(duì)象的情況。在隨后將說明的共同注意中使用該信息。(4-2-1-2)形狀分析用相對(duì)大小和旋轉(zhuǎn)具有不變性的Fourier描述符(descriptor)執(zhí)行形狀分析。在該形狀分析中,F(xiàn)ourier描述符空間(第64維)中的L2范數(shù)(norm)用于分類。通過FD空間表示輸入對(duì)象,并且,用到最接近的原型的距離,確定所述原型是否是新的原型。圖19說明了通過顏色分段獲得的對(duì)象形狀分析的結(jié)果。(4-2-1-3)語音識(shí)別作為語言識(shí)別,使用利用HMM的連續(xù)語音識(shí)別。該技術(shù)可以通過在上述參考資料5中提出的技術(shù)示范地說明。
參見圖20,為該系統(tǒng)提供語音輸入單元171、具有多個(gè)HMM的HMM寄存器172、輸入未知語言的HMM173以及比較器174。
HMM寄存器172的HMM是研究過日語音素并在開始時(shí)將需要的字記錄其中的HMM。在HMM寄存器172的HMM中,包括后來獲取的和學(xué)到的字。記錄或獲取的字的例子包括名詞和動(dòng)詞。在HMM寄存器172的HMM中將輸入的音素序列作為置信度的度數(shù)評(píng)估。
輸入未知語言的HMM173是獲取未知字的HMM。如圖21所示,該輸入未知語言的HMM173具有陳述并連接到所有音素狀態(tài)的所有音素模型。如圖21所示,如果做出語音輸入‘bouruu’,則輸入未知語言的HMM173將它識(shí)別為‘booru’。
由已經(jīng)記錄或獲取字的HMM和輸入未知語言的HMM173評(píng)估輸入音素序列。此時(shí),使用驗(yàn)證值,在比較器174中評(píng)估顯示最大匹配的在距離HMM的距離。如果驗(yàn)證值大于預(yù)定值,將所述音素序列作為新的音素系列重新標(biāo)記,所述新音素序列作為HMM寄存器172的HMM被記錄。
通過例子說明HMM寄存器172僅包括作為HMM的兩個(gè)記錄的字‘tomare(stop)’和‘kere(kick)’的情況。圖22說明了使用該系統(tǒng)的結(jié)果。
圖22說明了在右側(cè)記錄的字的輸入信號(hào)的驗(yàn)證值。同時(shí),驗(yàn)證值越小,置信度越高。
例如,系統(tǒng)估計(jì)語音‘tomare’是音素序列‘tomare’的輸入,此時(shí)驗(yàn)證值是0.136。
另一方面,對(duì)于在從圖22的頂部第三行中的未知字‘booru(ball)’,與其最佳匹配的模型是‘tomare’,此時(shí)驗(yàn)證值極高,等于4.835。從而,分配并記錄了一個(gè)新的符號(hào)‘未知(unknown)-1’。因此,對(duì)于下一個(gè)語音輸入,即,從圖22的頂部第四行上示出的語音輸入‘booru(ball)’,未知-1的HMM是最靠近的,驗(yàn)證值是小值0.41,從而未知-1正確地獲取到‘booru(ball)’。
而且,因?yàn)镠MM能夠識(shí)別連續(xù)的語音,故對(duì)于圖22中從頂部起的第七個(gè)語音,緊接著在先前獲取的標(biāo)記未知至1,能夠識(shí)別符號(hào)‘kere’。
在這種語音識(shí)別系統(tǒng)中,如果獲取到名詞‘booru’,則機(jī)器人裝置1能夠通過命令‘booru kere(kick a ball)’踢球。(4-2-1-4)感覺部分(情感部分)圖23說明了內(nèi)部狀態(tài)(各內(nèi)部變量)和與其相關(guān)的行為(各子系統(tǒng))之間的關(guān)系。
參照攝取行為的心理學(xué)模型,該例建議了為維持通常內(nèi)部狀態(tài)的假想的體內(nèi)營養(yǎng)積累緩沖器和排泄緩沖器,并將積累量定義為內(nèi)部變量。內(nèi)部變量的例子包括能量至2(虛擬食物)和虛擬排泄物。
如圖24所示,通過將假想胃(體內(nèi)營養(yǎng)積累緩沖器)和假想膀胱或腸(排泄物緩沖器)相關(guān),將假想胃中的積累量的降低設(shè)計(jì)成導(dǎo)致例如假想膀胱中的積累量的增加。
如圖23所示,內(nèi)部變量具有根據(jù)某些因素增加或降低的動(dòng)態(tài)。動(dòng)機(jī)產(chǎn)生器的基本工作是提高相應(yīng)行為組(子系統(tǒng))的動(dòng)機(jī)以將內(nèi)部變量保持在允許的范圍內(nèi)的。
安裝虛擬食物或水主要是考慮為改善機(jī)器人裝置1的娛樂性。另外,存在與電能或疲勞其固有語義等同的內(nèi)部變量。這些也構(gòu)成圖2 3所示的隨增加或減少因素變化的動(dòng)態(tài)。將相關(guān)子系統(tǒng)的動(dòng)機(jī)產(chǎn)生器設(shè)計(jì)成激勵(lì)行為以將這些動(dòng)態(tài)保持在固定值。安裝了所謂充電裝置作為自主行為的機(jī)器人裝置1的這種自動(dòng)充電行為是可以期待的。然而,如果沒有為機(jī)器人裝置1提供這樣的充電裝置,則機(jī)器人裝置1執(zhí)行請(qǐng)求充電的行為,并且讓某人(人類)將它的電池充電。
對(duì)于相關(guān)存儲(chǔ)器獲取的信息準(zhǔn)備了相似的內(nèi)部狀態(tài)變量。用相關(guān)存儲(chǔ)器,計(jì)算和發(fā)送獲取的內(nèi)部信息量。在這種情況下,除了忘卻的情況,相關(guān)存儲(chǔ)器的內(nèi)部信息量僅增加。然而,忘卻不必安裝。通過在適當(dāng)?shù)臅r(shí)間段結(jié)合各相應(yīng)的信息量作為增加的因素、構(gòu)成暫時(shí)減少因素的簡單動(dòng)態(tài)、以形成信息獲取行為子系統(tǒng)的動(dòng)機(jī)。(4-2-1-5)學(xué)習(xí)存儲(chǔ)器部分(相關(guān)存儲(chǔ)器部分)圖25說明了在信息獲取中機(jī)器人裝置1使用的相關(guān)存儲(chǔ)器140的具體結(jié)構(gòu)。如圖25所示,該相關(guān)存儲(chǔ)器140包括短期存儲(chǔ)器181、長期存儲(chǔ)器182以及注意對(duì)象存儲(chǔ)器183。具體地提供該相關(guān)存儲(chǔ)器140,如圖12所示。
通過上述結(jié)構(gòu),相關(guān)存儲(chǔ)器140作為具有某個(gè)顏色和某個(gè)形狀的名字的實(shí)體的存儲(chǔ)單元以及作為該實(shí)體對(duì)機(jī)器人裝置1的內(nèi)部狀態(tài)具有的意義的存儲(chǔ)單元進(jìn)行工作。
短期存儲(chǔ)器(STM)181存儲(chǔ)與ID號(hào)一起提供的圖像中的對(duì)象信息。此時(shí)的對(duì)象信息是顏色原型數(shù)(CP-I)和形狀原型數(shù)(SP-j)的信息。短期存儲(chǔ)器181也被饋送從語音處理輸入的一個(gè)語音的字序列。
圖像數(shù)據(jù)被饋送顏色原型數(shù)(CP-I)和形狀原型數(shù)(SP-j),以獲取對(duì)象名字和對(duì)內(nèi)部狀態(tài)的影響(delta-I)。如圖12所示,這些組合在一起并發(fā)送到行為產(chǎn)生器150。如果未獲取對(duì)象名(HMM-k)或?qū)?nèi)部狀態(tài)的影響(delta-I),則將這些作為零信息留下和發(fā)送。將語音數(shù)據(jù)直接發(fā)送到行為產(chǎn)生器150。
另一方面,在行動(dòng)選擇單元116選擇行為(Action)和對(duì)象(Obj-ID)。該信息從下面說明的行為狀態(tài)機(jī)向相關(guān)存儲(chǔ)器140發(fā)送。與對(duì)象(Obj-ID)相應(yīng)的信息從短期存儲(chǔ)器181存儲(chǔ)到注意對(duì)象存儲(chǔ)器183中。同時(shí),將短期存儲(chǔ)器181中存儲(chǔ)的說出的字序列直接發(fā)送到注意對(duì)象存儲(chǔ)器183。
用作為誘因的內(nèi)部變量的變化設(shè)置從注意對(duì)象存儲(chǔ)器183到作為固有相關(guān)存儲(chǔ)器182工作的長期存儲(chǔ)器182的學(xué)習(xí)的時(shí)序。因此,當(dāng)在對(duì)象上執(zhí)行動(dòng)作期間改變了內(nèi)部變量時(shí),將內(nèi)部變量的變化值與對(duì)象相關(guān)地進(jìn)行存儲(chǔ)。(4-2-1-6)行為產(chǎn)生部分現(xiàn)在說明作為規(guī)定機(jī)器人裝置1行為的子系統(tǒng)的信息獲取行為子系統(tǒng)151n。如圖26所示,將信息獲取行為子系統(tǒng)子系統(tǒng)151n構(gòu)造為分級(jí)的結(jié)構(gòu)。
在行為子系統(tǒng)層中,有一個(gè)軟件對(duì)象。
在上述第一階內(nèi)部存儲(chǔ)量偏離適當(dāng)范圍時(shí),構(gòu)造所述軟件對(duì)象的動(dòng)機(jī)產(chǎn)生器101用于輸出動(dòng)機(jī)值。
MC_val=1-tanh(Int_val)+ε...(4)另一方面,釋放機(jī)構(gòu)102檢查從相關(guān)存儲(chǔ)器140發(fā)送的對(duì)象。釋放機(jī)構(gòu)102考慮與人指向相關(guān)的當(dāng)前未知的和感知(釋放)因素。在這些釋放因素當(dāng)中有例如,對(duì)象(Object)的對(duì)象名(ObjName)、顏色名(CcolorName)、形狀名(ShapeName)以及對(duì)對(duì)象內(nèi)部變量改變的影響(ActDelta-1)。
除非就作為釋放因素獲得的東西做了信息定義,釋放機(jī)構(gòu)102產(chǎn)生釋放信號(hào)。與對(duì)象相關(guān)地確定釋放機(jī)構(gòu)102輸出的釋放信號(hào)的值作為關(guān)于一個(gè)對(duì)象的未定義信息的積累值。例如,只有對(duì)象名(ObjName)和對(duì)對(duì)象內(nèi)部變量的影響(ActDelta-1)可以成為對(duì)象。
釋放機(jī)構(gòu)102評(píng)估存在對(duì)象的釋放信號(hào)、以選擇具有最大值的對(duì)象、從而輸出指定如此選定的對(duì)象(Obj)的ID和釋放信號(hào)。
例如,如果將蘋果指定為對(duì)象,機(jī)器人裝置1使用上述形狀或顏色分析,分析它的形狀或顏色以評(píng)估顏色名(ColorName)和形狀名(ShapeName)作為釋放因素。如果所述蘋果被預(yù)先記錄,則獲取高的評(píng)估值,從而所述對(duì)象被識(shí)別是蘋果。輸出將蘋果指定為選定對(duì)象的ID和這時(shí)的釋放信號(hào)。如果所述蘋果沒有預(yù)先記錄,則將未定義的蘋果的數(shù)積累求和,并與作為未知對(duì)象的蘋果相關(guān)。
釋放機(jī)構(gòu)102設(shè)置為產(chǎn)生與人指向相應(yīng)的更大的釋放信號(hào)。在做出指向的對(duì)象檢測時(shí),不管對(duì)象是未知對(duì)象或已知對(duì)象,釋放機(jī)構(gòu)102都產(chǎn)生釋放信號(hào)。潛在的涵義是,顯然指向是人發(fā)出的信息獲取或確認(rèn)請(qǐng)求,因此,如愿地引發(fā)信息獲取行而不明顯地依賴于內(nèi)部狀態(tài),或如愿地執(zhí)行對(duì)于先前已知對(duì)象的確認(rèn)行為。
在信息獲取行為子系統(tǒng)151n中,作為行為評(píng)估值(行為值),獲得該釋放信號(hào)和動(dòng)機(jī)值的乘積。以相似的方式,每個(gè)其它規(guī)定,例如吃的子系統(tǒng),使用輸入到信息獲取行為子系統(tǒng)151n的該釋放信號(hào)和動(dòng)機(jī)值以獲得行為評(píng)估值(行為值)。
動(dòng)作選擇單元116將各子系統(tǒng)的行為評(píng)估值(行為值)進(jìn)行比較、以選擇具有最大行為值的子系統(tǒng)作為要執(zhí)行的子系統(tǒng)。這里說明信息獲取行為子系統(tǒng)151n中的行為值保持為最大的情況。
同時(shí),選定子系統(tǒng)需要連續(xù)一段時(shí)間被選中。例如,通過相互抑制或疲勞因子使其成為可能。
在選中信息獲取行為子系統(tǒng)151n時(shí),如圖26所示,處理過程轉(zhuǎn)移到稱為模式MD的層。在模式MD中,以相似的方式進(jìn)行信息選擇。具體而言,在模式(Mode)中,區(qū)分上層的選擇是通過指向指出的對(duì)象,或是機(jī)器人裝置本身選擇的對(duì)象,即,未知的對(duì)象。如果在該模式(Mode)中做出該區(qū)別,則在被稱為模塊MJ的下層中做出關(guān)于具體行為的評(píng)估。根據(jù)該選擇,在動(dòng)作選擇單元116中選擇指定的行為。
以這種方式,如果對(duì)象是已知的對(duì)象,則機(jī)器人裝置1執(zhí)行確認(rèn)行為。如果對(duì)象是未知對(duì)象,則機(jī)器人裝置1執(zhí)行獲取行為。信息獲取行為可以如下執(zhí)行,即,如果獲取了關(guān)于對(duì)象名(ObjName)和對(duì)內(nèi)部變量的改變的影響(ActDelta-Int)的兩類信息,則可以檢查在子系統(tǒng)上給出最大評(píng)估值的對(duì)象以選擇一個(gè)信息。
至于在執(zhí)行確認(rèn)行為的情況中的處理過程,向與確認(rèn)行為相關(guān)的狀態(tài)機(jī)發(fā)送命令,并執(zhí)行所述名字的確認(rèn)行為。在機(jī)器人裝置1執(zhí)行視覺跟蹤時(shí),機(jī)器人裝置1接近人指向的對(duì)象,并將其手指,即,前肢指向?qū)ο?,表現(xiàn)與‘這是XX,不是嗎?’相應(yīng)的行為。在陳述規(guī)定行為的行為序列的狀態(tài)機(jī)的控制下實(shí)現(xiàn)這樣的行為。
至于對(duì)象名(ObjName)的獲取行為的處理過程,將其輸出發(fā)送到負(fù)責(zé)獲取相應(yīng)對(duì)象名(ObjName)的狀態(tài)機(jī)。
在對(duì)象名(ObjName)獲取行為中,機(jī)器人裝置在執(zhí)行視覺跟蹤時(shí)接近對(duì)象,并指向它以表現(xiàn)出與‘它的名字是什么?’相應(yīng)的行為。而且,此時(shí)用距離對(duì)象的距離做出適當(dāng)?shù)男袨榭刂?。該行為由指示?guī)定所述行為的行為序列的狀態(tài)機(jī)實(shí)現(xiàn)。
緊接著‘它的名字是什么’,可以使用重復(fù)地確認(rèn)對(duì)于從語音識(shí)別單元輸出有效的任何輸入音素序列的狀態(tài)機(jī),。
另一方面,如果選擇了對(duì)內(nèi)部變量的改變的影響(AcrDelta-Int)的獲取行為,即,根據(jù)內(nèi)部變量改變獲取未知對(duì)象的獲取行為,則與對(duì)象相關(guān)地隨機(jī)選擇數(shù)個(gè)行為,并予以執(zhí)行。此時(shí)產(chǎn)生的對(duì)內(nèi)部變量的的變化的影響(AcrDelta-Int),由相關(guān)存儲(chǔ)器評(píng)估。因?yàn)檫@將對(duì)象與內(nèi)部狀態(tài)相關(guān)聯(lián),所以將對(duì)新對(duì)象內(nèi)部變量改變的影響實(shí)現(xiàn)為意義獲取。
例如,如果內(nèi)部狀態(tài)在看見蘋果時(shí)改變到‘愉快’,則內(nèi)部狀態(tài)改變與作為對(duì)象的蘋果相關(guān)聯(lián)。隨后,機(jī)器人裝置1將蘋果解釋為‘愉快’。這意味著,蘋果的意義獲取在機(jī)器人裝置1上得以實(shí)現(xiàn)。
同時(shí),如上所述,將本發(fā)明應(yīng)用于機(jī)器人裝置1,能夠通過例如,軟件實(shí)現(xiàn)。
工業(yè)可應(yīng)用性使用本發(fā)明,如上所述,機(jī)器人裝置1能夠?qū)⑿畔@取行為實(shí)現(xiàn)為自主行為的一部分,并將共同注意作為最佳行為執(zhí)行。另外,機(jī)器人裝置在信息獲取行為中能夠獲取未知對(duì)象的意義,作為內(nèi)部狀態(tài)改變。這使得機(jī)器人裝置更逼真。
權(quán)利要求
1.一種執(zhí)行自主行為的機(jī)器人裝置,包括行為控制部件,用于使機(jī)器人裝置執(zhí)行信息獲取行為作為自主行為。
2.如權(quán)利要求1所述的機(jī)器人裝置,其中所述信息獲取行為是將語言作為信息獲取的語言獲取行為。
3.如權(quán)利要求1所述的機(jī)器人裝置,至少基于內(nèi)部狀態(tài)執(zhí)行自主行為;所述行為控制部件使機(jī)器人裝置基于內(nèi)部狀態(tài)的恒定性執(zhí)行信息獲取行為。
4.如權(quán)利要求3所述的機(jī)器人裝置,還包括信息獲取模型,具有信息獲取愿望的參數(shù)作為所述內(nèi)部狀態(tài)改變的因素;當(dāng)所述信息獲取愿望參數(shù)為預(yù)置閾值時(shí),所述行為控制部件表現(xiàn)所述信息獲取行為。
5.如權(quán)利要求4所述的機(jī)器人裝置,其中所述信息獲取愿望參數(shù)隨時(shí)間的逝去而改變。
6.如權(quán)利要求4所述的機(jī)器人裝置,其中所述信息獲取愿望參數(shù)表示求知欲。
7.如權(quán)利要求4所述的機(jī)器人裝置,其中所述信息獲取愿望參數(shù)是所獲取的信息量。
8.如權(quán)利要求4所述的機(jī)器人裝置,其中所述信息獲取愿望參數(shù)是已學(xué)習(xí)的新信息量。
9.如權(quán)利要求8所述的機(jī)器人裝置,其中學(xué)習(xí)量是隨時(shí)間的逝去而減少的學(xué)習(xí)量;以及其中如果所述學(xué)習(xí)量比預(yù)置閾值低,則所述行為控制部件表現(xiàn)所述信息獲取行為。
10.一種控制機(jī)器人裝置的行為的方法,包括使機(jī)器人裝置執(zhí)行信息獲取行為作為自主行為。
11.一種機(jī)器人裝置,包括意義獲取部件,用于獲取對(duì)象的意義。
12.如權(quán)利要求11所述的機(jī)器人裝置,其中所述意義獲取部件獲取發(fā)生在對(duì)所述對(duì)象采取行動(dòng)的所述機(jī)器人裝置上的所述內(nèi)部狀態(tài)的變化,作為所述對(duì)象的意義。
13.如權(quán)利要求12所述的機(jī)器人裝置,還包括內(nèi)部狀態(tài)監(jiān)視部件,用于檢測所述內(nèi)部狀態(tài);所述意義獲取部件獲取由所述內(nèi)部狀態(tài)監(jiān)視部件檢測到的對(duì)所述對(duì)象采取行動(dòng)的所述機(jī)器人的所述內(nèi)部狀態(tài)的變化,作為所述對(duì)象的意義。
14.如權(quán)利要求11所述的機(jī)器人裝置,還包括相關(guān)存儲(chǔ)器部件,用于將所獲取對(duì)象的意義與所述對(duì)象相關(guān)地進(jìn)行存儲(chǔ)。
15.一種控制機(jī)器人裝置的行為的方法,包括獲取當(dāng)基于其內(nèi)部狀態(tài)行動(dòng)的機(jī)器人裝置對(duì)對(duì)象采取行動(dòng)時(shí)產(chǎn)生的所述內(nèi)部狀態(tài)的變化,作為所述對(duì)象的意義。
16.一種機(jī)器人裝置,包括語音輸入部件;特征化多個(gè)字序列的多個(gè)模型,所述模型已基于說出字序列時(shí)占優(yōu)勢(shì)的所述字序列的特征值進(jìn)行了分類;語音輸入評(píng)估部件,用于根據(jù)所述字序列特征化模型評(píng)估所述語音輸入部件形成的語音輸入;以及字序列指定部件,用于基于所述語音輸入部件的評(píng)估值指定所述語音輸入的字序列。
17.如權(quán)利要求16所述的機(jī)器人裝置,其中所述語音輸入評(píng)估部件包括特征值檢測部分,用于檢測與由所述語音輸入部件形成的語音輸入的字序列相關(guān)的特征值;以及評(píng)估部分,用于基于所述字序列特征化模型評(píng)估所述特征值檢測部分檢測到的語音輸入的特征值。
18.如權(quán)利要求17所述的機(jī)器人裝置,還包括模型寄存部件,用于當(dāng)對(duì)所述語音輸入的特征值的評(píng)估較低時(shí),記錄由所述特征值檢測部分檢測到的語音輸入的字序列的特征值,作為新的語音序列特征化模型。
19.如權(quán)利要求16所述的機(jī)器人裝置,其中所述字序列特征化模型具有音素學(xué)習(xí)獲取的字序列的特征值。
20.一種機(jī)器人裝置的行為控制方法,所述方法包括語音輸入步驟;語音輸入評(píng)估步驟,根據(jù)特征化多個(gè)字序列的多個(gè)模型,評(píng)估在所述語音輸入步驟形成的語音輸入,所述模型已基于說出字序列時(shí)占優(yōu)勢(shì)的所述字序列的特征值進(jìn)行了分類;以及字序列指定步驟,基于在所述語音輸入評(píng)估步驟獲得的評(píng)估值指定所述語音輸入的字序列。
21.一種自主行動(dòng)的機(jī)器人裝置,包括控制部件,用于指向機(jī)器人學(xué)習(xí)對(duì)象的行為控制;
22.如權(quán)利要求21所述的機(jī)器人裝置,包括控制部件,用于使機(jī)器人與基于外部刺激指定為優(yōu)先學(xué)習(xí)的對(duì)象的對(duì)象交互。
23.如權(quán)利要求21所述的機(jī)器人裝置,還包括指向其學(xué)習(xí)對(duì)象,作為表示好奇的行為。
24.如權(quán)利要求21所述的機(jī)器人裝置,形成至少帶有肢體的像動(dòng)物的外貌;所述控制部件執(zhí)行用所述肢體指向正在學(xué)習(xí)的對(duì)象的行為控制。
25.一種自主行動(dòng)的機(jī)器人裝置的行為控制方法,所述方法包括控制機(jī)器人裝置的行為以使機(jī)器人會(huì)指向其學(xué)習(xí)對(duì)象。
26.一種自主行動(dòng)的機(jī)器人裝置,包括傳感器,用于檢測對(duì)象;感知評(píng)估部分,用于評(píng)估從所述傳感器輸入的輸入信號(hào);內(nèi)部狀態(tài)管理部分,被饋送所述感知評(píng)估部分的評(píng)估結(jié)果以基于所述結(jié)果管理虛擬的內(nèi)部狀態(tài);以及存儲(chǔ)器部件,用于存儲(chǔ)所述對(duì)象和基于所述對(duì)象的所述內(nèi)部狀態(tài)的變化之間的關(guān)系;將檢測到的基于所述對(duì)象的所述內(nèi)部狀態(tài)的變化和所述對(duì)象相關(guān)地存儲(chǔ)在所述存儲(chǔ)器部件中。
27.如權(quán)利要求26所述的機(jī)器人裝置,還包括情感部分,用于基于所述內(nèi)部狀態(tài)的變化產(chǎn)生虛擬的情感;將所述對(duì)象和對(duì)象的與情感有關(guān)的信息存儲(chǔ)在所述存儲(chǔ)器部件中。
28.如權(quán)利要求26所述的機(jī)器人裝置,還包括行為產(chǎn)生部分;所述內(nèi)部狀態(tài)管理部分監(jiān)管所述內(nèi)部狀態(tài)以保持所述內(nèi)部狀態(tài)的恒定,當(dāng)所述恒定被擾亂時(shí),所述內(nèi)部狀態(tài)管理部分向所述行為產(chǎn)生部分發(fā)送第一信號(hào);所述行為產(chǎn)生部分基于所述第一信號(hào)產(chǎn)生保持所述恒定的行為。
29.如權(quán)利要求28所述的機(jī)器人裝置(1),其中將所述內(nèi)部狀態(tài)的變化和保持所述恒定的行為相關(guān)地存儲(chǔ)在所述存儲(chǔ)器部件中。
30.如權(quán)利要求28所述的機(jī)器人裝置(1),其中所述內(nèi)部狀態(tài)管理部分具有信息獲取愿望變量,并基于所述信息獲取愿望變量的值向所述行為產(chǎn)生部分發(fā)送第二信號(hào);以及其中所述行為產(chǎn)生部分基于所述第二信號(hào)產(chǎn)生信息獲取行為。
31.一種自主行動(dòng)機(jī)器人裝置的行為控制方法,包括感知評(píng)估步驟,評(píng)估從檢測對(duì)象的傳感器輸入的信號(hào);內(nèi)部狀態(tài)管理部分,用于管理基于所述感知評(píng)估步驟中的評(píng)估結(jié)果改變的虛擬的內(nèi)部狀態(tài);以及存儲(chǔ)步驟,存儲(chǔ)所述對(duì)象和基于所述對(duì)象的所述內(nèi)部狀態(tài)的變化之間的關(guān)系;將檢測到的基于對(duì)象的內(nèi)部狀態(tài)的變化和所述對(duì)象相關(guān)地存儲(chǔ)在所述存儲(chǔ)器部件中。
全文摘要
一種通過根據(jù)傳感器單元(120)獲得的信息等改變?cè)谇楦袉卧?130)中的感情等而顯示出作為自主行為的信息捕獲行為的機(jī)器人裝置。所述機(jī)器人裝置包括行為控制部件,用于提供語言捕獲行為;意義捕獲部件;以及控制部件,用于執(zhí)行指示其自身學(xué)習(xí)對(duì)象的行為控制。所述機(jī)器人裝置將基于對(duì)象的內(nèi)部狀態(tài)變化和所述對(duì)象彼此相關(guān)地存儲(chǔ)在存儲(chǔ)器部件中。
文檔編號(hào)G06N3/00GK1396857SQ01804288
公開日2003年2月12日 申請(qǐng)日期2001年10月11日 優(yōu)先權(quán)日2000年10月13日
發(fā)明者藤田雅博, 高木剛, 堀中里香, 橫野順, 加布里爾·科斯塔, 下村秀樹, 南野活樹 申請(qǐng)人:索尼公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1