亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

機器人設備、控制機器人設備動作的方法、以及外力檢測設備和方法

文檔序號:2822281閱讀:473來源:國知局
專利名稱:機器人設備、控制機器人設備動作的方法、以及外力檢測設備和方法
技術(shù)領域
本發(fā)明一般涉及機器人設備、控制機器人設備動作的方法、和外力檢測設備和方法。
背景技術(shù)
一般來說,知識獲取或語言獲取主要以視頻信息和音頻信息的關(guān)聯(lián)存儲為基礎。
“從自然音頻-視頻輸入學習字詞”(由Deb Roy和Alex Pentland所著)(以下將稱作文獻1)公開了從輸入語音和輸入圖像學習語言的教義。文獻1中的學習方法被概述如下。
將圖像信號和語音信號(聲音信號)相互同時或按不同時間供應給學習系統(tǒng)。在文獻1中,這種相互同時或按不同時間供應的一對圖像和語音的事件被稱作“AV事件”。
當圖像信號和語音信號如此供應時,進行圖像處理,以便通過圖像處理從圖像信號中檢測顏色和形狀,同時進行語音處理,以便依據(jù)語音信號檢測遞歸神經(jīng)網(wǎng)絡并進行語音信號的音素分析。具體地說,根據(jù)圖像特征空間中的特征將輸入圖像歸類到每個類別(特殊圖像識別類別或圖像識別類別)。同時,根據(jù)聲音特征空間中的特征將輸入語音歸類到每個類別(特殊聲音識別類別或聲音識別類別)。該特征空間由

圖1所示的多個元素組成。例如,對于圖像信號,特征空間由元素是色差信號和亮度信號的二維或三維空間組成。由于輸入圖像具有這樣一個特征空間中的元素的預定映象,因此可以根據(jù)該元素映象識別顏色。在該特征空間中,考慮到識別顏色的距離,進行分類。
對于例如聲音的識別,利用了連續(xù)識別HMM(隱含的馬爾可夫模型)方法。連續(xù)識別HMM方法(下面簡稱為“HMM”)允許語音信號按音素序列被識別。此外,上述的遞歸神經(jīng)網(wǎng)絡是通過其將信號反饋到輸入層側(cè)的一種神經(jīng)網(wǎng)絡。
根據(jù)涉及同時發(fā)生的相關(guān)(相關(guān)學習),將已歸類的音素與用于學習目的的圖像處理所分類的刺激物(圖像)進行相關(guān)。也就是,獲得表示為一個圖像的事物的名稱和說明,作為學習結(jié)果。
如圖2所示,在上述學習中,根據(jù)每一個基于圖像信息形成的圖像類別鑒別(識別)輸入圖像,該圖像類別包括“紅色物”、“藍色物”、…;同時根據(jù)每一個依據(jù)聲音信息形成的類別鑒別(識別)輸入語音,該聲音類別包括所發(fā)出的“紅色”、“藍色”、“黃色”、…。
然后,通過相關(guān)學習將上述分類的圖像和語音進行相關(guān)處理,因而,當“紅色物”作為輸入圖像被供應時,圖2中的學習系統(tǒng)200可以輸出“紅色”的音素序列(發(fā)出聲音),作為相關(guān)學習的結(jié)果。
最近,已經(jīng)提出了一種可以響應周圍環(huán)境(外部因素)和內(nèi)部狀態(tài)(諸如情緒或本能的內(nèi)部因素)自主地進行舉止的機器人設備。這種機器人設備(下面稱之為“機器人”)被設計成與人類或環(huán)境進行交互作用。例如,人們已經(jīng)提出了所謂的寵物機器人和類似物,每個具有類似動物的外形和類似動物的舉止。
例如,這樣一種機器人所具有的學習各種信息的能力導致其娛樂性能的改善。特別是,學習動作或舉止的能力將增加與機器人玩耍的樂趣。
上述應用于被設計成可控制動作的機器人的學習方法(如文獻1所述)遇到了以下問題。
首先,上述學習方法不適合設置以對機器人行動進行控制。
如文獻1所述,如果響應輸入信號建立一個被存儲字或輸入信號被判斷為一個新信號,則將建立發(fā)聲方式并輸出適當?shù)囊羲匦蛄?。然而,當機器人與人類或環(huán)境進行交互時,不需要發(fā)出輸入的信號,而是需要響應該輸入進行適當?shù)男袆印?br> 此外,當根據(jù)圖像特征空間和聲音特征空間中的距離進行分類時,所獲得的圖像和語音將是圖像和聲音特征空間中彼此接近的信息。然而,在某些情況下,機器人需要響應圖像和語音進行不同動作。在這種情況下,必須為合適的動作做出分類。然而,傳統(tǒng)的方法不能適應這種需求。
傳統(tǒng)的知識或語言獲取系統(tǒng)主要包括以下部件(1)分類圖像信號和生成新類別的裝置;(2)分類聲頻信號和生成新類別的裝置;(3)將項(1)和項(2)彼此進行相關(guān)或者相互關(guān)聯(lián)地學習圖像和聲音的裝置。
當然,某些傳統(tǒng)的知識或語言獲取系統(tǒng)使用不同于上述功能的部件。但是上述三個功能是這種系統(tǒng)的基本功能。
上述項(1)和(2)中的分類包括特征空間中的映象,用預見知識進行有效信號的參數(shù)辨別,使用概率分類等。
一般來說,圖像例如可以通過以下兩種方式來識別控制用于每種顏色,比如顏色空間中的紅、藍、綠和黃色的顏色模板的閾值;或者,根據(jù)現(xiàn)有顏色存儲區(qū)域與特征空間中的輸入顏色之間的距離,為出現(xiàn)的顏色刺激確定每種顏色的概率。例如,對于已經(jīng)分類為圖1所示特征空間中的一個特征的區(qū)域,依據(jù)輸入圖像的特征所確定的區(qū)域到現(xiàn)存特征區(qū)域的距離,確定分類的概率。此外,神經(jīng)網(wǎng)絡的方法可以有效用于此目的。
另一方面,為了學習語音,將通過音素檢測由HMM供應的音素序列與所存儲的音素序列進行相互比較,并且根據(jù)比較結(jié)果按概率識別一個字。
按上述項(1)和項(2)生成新類別的裝置包括估算一個輸入信號,以確定它是否屬于現(xiàn)存類別。當確定輸入信號屬于現(xiàn)存類別時,認為它屬于該類別并被反饋到分類方法。另一方面,如果判斷該輸入信號不屬于任何類別,則生成一個新類別并進行學習,用于根據(jù)輸入的刺激進行分類。
新類別按下列方式生成。例如,如果判斷一個圖像類別不屬于任何現(xiàn)存類別(圖像A的類別,圖像B的類別,…),則劃分現(xiàn)存類別(例如,圖像A的類別)以生成圖3A所示的新圖像類別。如果判斷一個聲音類別不屬于任何現(xiàn)存類別(聲音α類別,聲音β類別,…),則劃分現(xiàn)存類別(例如,聲音β類別),以生成圖3B所示的新聲音類別。
此外,項(3)中的圖像和聲音的關(guān)聯(lián)包括關(guān)聯(lián)存儲器或類似物。
用于圖像的辨別類別被稱作矢量(以下,將稱之為“圖像識別矢量”)IC[i](i=0,1,…NIC-1),用于聲音的辨別類別被稱作矢量(以下,將稱之為“聲音識別矢量”)SC[j](j=0,1,…NSC-1)。對于所呈現(xiàn)的圖像信號和聲音信號(為學習而供應),分別將每個識別類別的概率或估算結(jié)果設置給矢量值。
在一個自檢索關(guān)聯(lián)存儲器(self-recalling associative memory)中,將圖像識別矢量IC和聲音識別矢量SC構(gòu)成由下列等式(1)和(2)給定的單個矢量CV[n]=IC[n](0≤n<NIC)…………………………………(1)
CV[n]=SC[n-NIC](0≤n<NSC)……………………………(2)需要說明的是,在自檢索關(guān)聯(lián)存儲器領域,由Hopfield提出的所謂的Hopfield網(wǎng)絡是眾所周知的。
上述矢量被變換成將在下面說明的單個矢量。假定矢量CV是列矢量,則通過將下式(3)給出的矩陣delta W增加到當前存儲的矩陣W中構(gòu)成自檢索關(guān)聯(lián)存儲器。
delta_W=CV×trans(CV) …………………………………(3)因而,可以將一個圖像刺激(輸入圖像)當作一個類別,并且將作為語音識別結(jié)果的一個字(例如,HMM的類別)與該類別相關(guān)聯(lián)。通過呈現(xiàn)一個新圖像(例如,紅色物)和輸入語音“紅色”,使每個圖像和聲音類別按圖像刺激物的紅色來描述,以便具有刺激物的適當尺寸或特征空間的距離,同樣,每個類別對語音“紅色”的音素序列的適當范圍起作用。這些類別被處理為上述等式中的相關(guān)矩陣并且被隨機地平均,使圖像和語音類別關(guān)于同樣刺激物具有高位值,即,它們之間具有高相關(guān)。因而,當紅色圖像被呈現(xiàn)時,存儲與紅色圖像關(guān)聯(lián)的HMM類別“紅色(發(fā)出的聲音)”。
另一方面,“Perceptually Grounded Meaning Creation”(by Luc Steels,ICMAS,Kyoto,1996)(以下將稱作“文獻2”)公開了一種通過稱之為“辨別游戲”的試驗的意圖獲取。下面概述該辨別游戲。
“辨別游戲”系統(tǒng)包括多個不限于上述圖像和聲音的傳感器通道和特征檢測器。一個稱作“代理(agent)”(比如,軟件)的事物借助特征檢測器,嘗試區(qū)別新近呈現(xiàn)的對象與另一個對象(已經(jīng)被識別的對象),即,根據(jù)特征區(qū)別諸多對象。如果沒有可以區(qū)別諸多對象的特征,則建立對應于新近呈現(xiàn)的對象的新特征檢測器。如果一個對象沒有可區(qū)別另一個對象的特征,即,當對應的特征檢測器不能用于該對象時,則判斷該代理贏得該辨別游戲。如果一個對象具有對應的特征檢測器,則判定該代理是游戲的獲勝者。
然后,整個系統(tǒng)根據(jù)“自然選擇論者”的原理進行工作。也就是,贏得游戲的對象具有較高的生存概率,而輸?shù)粲螒虻膶ο髮⒔⑿碌奶卣鳈z測器。然而,該新的特征檢測器將在下一個游戲中使用,并且不知道該檢測器是否將提供一個正確結(jié)果。因而,能夠更好進行區(qū)別的代理將生存。
該辨別游戲已經(jīng)在上文中概述。換言之,這種辨別游戲可以被看作經(jīng)自然選擇建立更好的特征檢測器的方法。
此外,“自適應語言的自發(fā)自組織”(by Luc Steels,Muggleton,S.(ed),1996,Machine,Intelligence 15)(下面稱作“文獻3”)給出通過“語言游戲”方法的語言生成。該“語言游戲”包括以下三個步驟第一步傳播(聲音)。
第二步創(chuàng)建。在此步驟中,代理建立一個新字,并且將它與一個新特征關(guān)聯(lián)。
第三步自組織。在此步驟中,系統(tǒng)通過分類和選擇進行自組織。
更具體地說,該語言游戲包括用于所謂的圖像處理的第一步驟;用于與語言處理相聯(lián)系的字(然而,實際上,不識別語音,而是輸入所謂的字符)的第二步驟;和將第一步驟(步驟1)中獲得的圖像與字相關(guān)聯(lián)的第三步驟。前述的辨別游戲沒有相當于第二步驟的部分,它僅適用于現(xiàn)存特征空間中造成的區(qū)別。
此外,“Language Acquisition with A Conceptual Structure-Based SpeechInput from Perceptual Information”(Iwasaki和Tamura,索尼計算機科學實驗室)(以下稱作文獻4)公開了使用用于語音識別的HMM的語法和典型圖案(圓、三角或其它形狀,紅、藍和其它顏色)的獲取,其中,在用于圖像識別的計算機的監(jiān)視器上彩色顯示圖像。
在文獻4中,用戶同時對圖4所示的監(jiān)視器210上的圖案(對象)點擊指點器或鼠標(用指示的指點器212),和發(fā)出“紅色圓形物”或類似的聲音。在文獻3的語言游戲中,用于彩色圖像的辨別游戲理論和HMM語音識別被用來按概率實現(xiàn)第一至第三步驟。
對于新類別的生成,實行一個預定的檢驗方法。在文獻4公開的方法中,當判別應當通過使用用于語音識別的HMM的檢驗生成一個新類別時,細分HMM以生成新類別。
此外,通過指點指針和點擊鼠標選擇的圖案211(第一對象(Obj1))被移動到如圖4箭頭所指示的第二對象(Obj2),同時,供應發(fā)出的語音“攀登”,以識別在監(jiān)視器210上形成的圖案的運動。如此識別的運動通過HMM分類。
如上所述,各種用于知識或語言獲取的技術(shù)已經(jīng)被提出。然而,這些技術(shù)在以下的涉及機器人的動作獲取(動作學習)方面是不利的。
(1)輸入信號的特征空間中的距離和輸入信號的類別歸屬的估價;(2)動作的創(chuàng)建和估價;
(3)機器人與用戶之間的目標對象的共享。所謂的目標對象共享。
解決上述問題(1)是困難的,因為對輸入圖像信號的類別歸屬的估價僅受到圖像信號、同一時間供應的聲音信號的影響,或者受到基于這兩個信號檢索的存儲信息的影響。需要說明的是,類別歸屬估價是用于輸入信號屬于那個類別的類別索引。
假定已經(jīng)輸入的一個圖像信號被認為在特征空間上非常接近現(xiàn)存類別中的圖像信號。在此情況下,如圖5A所示,類別A和類別B在圖像特征空間中彼此接近。然而,假定如此輸入的圖像信號用來生成新類別。
另一方面,如果在這些條件下判斷已經(jīng)輸入一個語音信號,作為相應于該圖像信號的對象的其它信息,并且該輸入的語音信號距現(xiàn)存類別非常遠,則將為該對象生成用于語音信號的一個新類別。所以,假定例如,如圖5B所示,聲音α的類別(相應于圖像A類別的聲音類別)和聲音β的類別(相應于圖像B類別的聲音類別)在聲音特征空間中被不同地映象,所以可以設置閾值S2。
因此,如果根據(jù)特征空間作出的聲音的類別歸屬估價可以反映圖像的類別歸屬估價,則能夠生成用于該圖像的新類別。例如,通過反映聲音特征空間中類別歸屬估價,可以在彼此接近的圖像A和B的類別之間設置閾值S1,以區(qū)別如圖5A所示的類別。也就是,通過參考任何其它類別歸屬估價,可以更適當?shù)貙崿F(xiàn)一個類別的歸屬。
然而,若圖像信號或語音信號的類別彼此非常接近,則上述情況不足以生成圖像或語音的新類別。這意味著當圖像類別或聲音類別在它們的相應特征空間中彼此接近時,如圖6A和圖6B所示,不可能區(qū)別它們,盡管從第三特征空間來看它們具有相當不同的特征。第三特征空間可以表現(xiàn)出動作特征。
所以,本發(fā)明的目的是克服現(xiàn)有技術(shù)的上述缺點,該目的是通過提供一種適合于適當?shù)貐^(qū)別其相應特征空間中的對象的機器人設備和控制該機器人設備的動作的方法來實現(xiàn)的。
當被判斷屬于新類別的信號供應給機器人設備時,上述問題(2)在于生成機器人設備的新動作以及估價該新動作。
對于傳統(tǒng)技術(shù),語言創(chuàng)建的估價相當于所生成的動作的估價。對于文獻3公開的技術(shù),生成任意的音素序列。它將是包含在輸入信號,可能是圖像信號中的對象的名稱或類似物。然而,將不生成產(chǎn)生動作的任意運動系列。
例如,即使生成了具有四個腿(具有例如3個自由度)的機器人設備的各關(guān)節(jié)角的任意系列,機器人設備也不會進行任何有意義的運動。當生成語言時,語言的音素序列將僅僅是對象名稱。然而,如何估價所生成的動作好或不好將成為一個問題。
此外,本發(fā)明的具有克服現(xiàn)有技術(shù)的上述缺點的另一個目的,該目的是通過提供適合于生成輸入的適當動作的機器人設備和控制該機器人設備的的動作的方法實現(xiàn)的。
上述問題(3)是所謂的目標對象共享(共享的關(guān)注)。造成該問題的原因是機器人設備感知的信息非常不穩(wěn)定。例如,當用戶或訓練者在不對著機器人設備的圖像信號輸入單元(例如CCD攝像機)的方向上,試著通過手持橙色球和發(fā)出“橙色球”聲音來教導機器人設備時,如果機器人設備視野內(nèi)的一個對象是粉紅色盒,則機器人設備將“粉紅色盒”與語音“橙色球”相聯(lián)系。
在文獻4中,通過把指針指向圖案211和點擊鼠標,將監(jiān)視器210上的圖案211指定為目標對象。然而,實際上沒有指點或指定這種目標對象的任何裝置。甚至在文獻2和3公開的理論被應用于機器人設備的情況下,機器人設備的訓練者或用戶將隨意選擇他或她視野內(nèi)的某些事物的一個、并根據(jù)他的記憶發(fā)出所選擇事物的名稱,使機器人設備注意到作為機器人設備將識別的目標對象的所選擇的事物。然而,實際上這不是機器人設備可以識別目標對象的任何學習。
此外,本發(fā)明具有克服現(xiàn)有技術(shù)的上述缺點的另一個目的,該目的是通過提供適合共享一個目標對象(關(guān)注共享)以恰當?shù)刈R別目標對象的機器人設備和控制該機器人設備的動作的方法實現(xiàn)的。
傳統(tǒng)的機器人設備通過設置在頭部的觸摸傳感器或類似物檢測施加到頭部或其它部位的外力,由此與用戶進行交互。然而,該交互將受到所設置的傳感器的數(shù)量和設置的位置的限制。
本發(fā)明的公開所以,本發(fā)明的一個目的是克服現(xiàn)有技術(shù)上述缺點,該目的通過提供一種機器人、外力檢測器和一種檢測外力的方法來實現(xiàn),能夠確保與用戶的觸摸(外力)交互作用中的更高自由度。
本發(fā)明的另一個目的是提供一種能夠適當?shù)刈R別其特征空間中的每個對象的機器人設備和控制該機器人設備動作的方法。
本發(fā)明的另一個目的是提供一種能夠響應輸入生成適當動作的機器人設備和控制該機器人設備動作的方法。
本發(fā)明的另一個目的是提供一種能夠共享目標對象(關(guān)注共享)以恰當識別目標對象的機器人設備和控制該機器人設備動作的方法。
本發(fā)明的另一個目的是提供一種機器人、外力檢測器和檢測外力的方法,能夠確保與用戶的觸摸(外力)交互作用中的更高自由度。
上述目的可以通過提供一種機器人設備來實現(xiàn),該機器人設備包括用于檢測觸摸的裝置;用于檢測在觸摸檢測裝置的觸摸檢測的同時或恰好之前或之后供應的信息的裝置;存儲裝置,用于相關(guān)聯(lián)地存儲相應于觸摸檢測所作出的動作和輸入信息檢測裝置所檢測的輸入信息;和檢索動作的裝置,用于根據(jù)新近獲取的信息從存儲裝置的信息中檢索動作,以控制機器人設備進行動作。
在上述機器人設備中,輸入信息檢測裝置檢測恰好在觸摸檢測裝置的觸摸檢測之前或者之后供應的信息,將響應觸摸作出的動作和輸入信息檢測裝置檢測的輸入信息相互關(guān)聯(lián)地存儲到存儲裝置中,并且動作控制裝置根據(jù)新近獲取的輸入信息從存儲裝置的信息中檢索動作,以控制機器人設備進行動作。
因而,在上述機器人設備中,相互關(guān)聯(lián)地存儲輸入信息和當該輸入信息被檢測時作出的動作,以及當再次供應與該輸入信息相同的信息時,再現(xiàn)相應動作。
此外,上述目的可以通過提供一種控制機器人設備動作的方法來實現(xiàn),該方法包括以下步驟檢測對機器人設備所作出的觸摸;檢測在觸摸檢測步驟的觸摸檢測的同時或恰好之前或之后供應的信息;將響應觸摸檢測步驟中的觸摸檢測所作出的動作和輸入信息檢測步驟中檢測的輸入信息相互關(guān)聯(lián)地存入一個存儲裝置中;和根據(jù)新近獲取的信息從存儲裝置的信息中檢索動作,以控制機器人進行動作。
在上述機器人設備動作控制方法中,輸入信息和該輸入信息被檢測時作出的動作被相互關(guān)聯(lián)地存儲,并且當再次供應與該輸入信息相同的信息時,再現(xiàn)相應動作。
此外,上述目的可以通過提供一種機器人設備來實現(xiàn),該機器人設備包括檢測輸入信息的裝置;存儲裝置,用于存儲由輸入信息檢測裝置檢測的輸入信息和動作結(jié)果信息,該動作結(jié)果信息表現(xiàn)出相應于輸入信息檢測裝置檢測的輸入信息所作出的動作結(jié)果;和識別動作結(jié)果信息的裝置,用于根據(jù)新近供應的輸入信息識別存儲裝置中的動作結(jié)果信息,以控制機器人設備根據(jù)動作結(jié)果信息進行動作。
在上述機器人設備中,表現(xiàn)出相應于由輸入信息檢測裝置檢測的輸入信息所作出的動作的結(jié)果的動作結(jié)果信息和輸入信息被相互關(guān)聯(lián)地存儲,并且根據(jù)新近供應的輸入信息識別存儲裝置中的動作結(jié)果信息,以控制機器人設備根據(jù)動作結(jié)果信息進行動作。
因而,在上述機器人設備中,輸入信息和表現(xiàn)出相應于輸入信息而作出的動作的動作結(jié)果信息被相互關(guān)聯(lián)地存儲,并且當再次供應同樣的信息時,根據(jù)相應于輸入信息的動作結(jié)果信息檢索過去的動作,以控制機器人設備進行適當動作。
此外,上述目的可以通過提供一種控制機器人設備動作的方法來實現(xiàn),該方法包括以下步驟將動作結(jié)果信息和輸入信息相互關(guān)聯(lián)地存儲到一個存儲裝置中,該動作結(jié)果信息表現(xiàn)出相應于輸入信息檢測裝置檢測的輸入信息而作出的動作結(jié)果;和根據(jù)新近供應的輸入信息識別存儲裝置中的動作結(jié)果信息,以根據(jù)動作結(jié)果信息控制機器人設備進行動作。
借助上述的機器人設備動作控制方法,機器人設備相互關(guān)聯(lián)地存儲輸入信息和表現(xiàn)出根據(jù)輸入信息作出的動作結(jié)果的動作結(jié)果信息,并且當相同的輸入信息再次供應時,根據(jù)與輸入信息相對應的動作結(jié)果信息檢索過去的動作,以控制機器人設備做適當?shù)膭幼鳌?br> 此外,上述目的可以通過提供一種機器人設備來實現(xiàn),該機器人設備包括檢測輸入信息的裝置;特征檢測裝置,用于檢測由輸入信息檢測裝置檢測的輸入信息的特征;根據(jù)所檢測的特征對輸入信息進行分類的裝置;根據(jù)輸入信息控制機器人設備做動作的裝置;和改變分類的裝置,用于根據(jù)動作結(jié)果信息改變已經(jīng)使機器人設備作出動作的輸入信息的分類,該動作結(jié)果信息表現(xiàn)出機器人設備在動作控制裝置的控制下作出的動作結(jié)果。
在上述機器人設備中,輸入信息檢測裝置檢測的輸入信息的特征由特征檢測裝置檢測,輸入信息根據(jù)檢測的特征進行分類,機器人設備由動作控制裝置控制以根據(jù)輸入信息的分類進行動作,以及根據(jù)表現(xiàn)出機器人設備在動作控制裝置的控制下作出的動作結(jié)果的動作結(jié)果信息改變已經(jīng)使機器人設備動作的輸入信息的分類。
因而上述的機器人設備相應于輸入信息的分類進行動作,并且根據(jù)動作結(jié)果改變分類。
此外,上述目的可以通過提供一種控制機器人設備動作的方法來實現(xiàn),該方法包括以下步驟檢測由輸入信息檢測裝置檢測的輸入信息的特征;根據(jù)特征檢測步驟中檢測的特征對輸入信息分類;根據(jù)信息分類步驟中作出的輸入信息的分類控制機器人設備進行動作;和根據(jù)動作結(jié)果信息改變已經(jīng)使機器人設備作出動作的輸入信息的分類,該動作結(jié)果信息表現(xiàn)出在動作控制步驟控制下機器人設備作出的動作結(jié)果。
借助上述的機器人設備動作控制方法,控制機器人設備相應于輸入信息的分類進行動作,并且根據(jù)動作結(jié)果改變分類。
此外,上述目的可以通過提供一種機器人設備來實現(xiàn),該機器人設備包括用于識別目標對象的裝置;勇于存儲有關(guān)由目標對象識別裝置識別的目標對象的信息的裝置;和控制裝置,根據(jù)新近檢測的對象的信息和存儲在存儲裝置中有關(guān)目標對象的信息控制機器人設備進行動作。
上述機器人設備將目標對象識別裝置識別的目標對象的信息存儲到存儲裝置中,并且動作控制裝置控制機器人設備根據(jù)新近檢測的對象的信息和存儲在存儲裝置中的目標對象的信息進行動作。
由此,上述機器人設備存儲目標對象,并且當相同對象的信息被再次供應時,機器人設備進行預定的動作。
此外,上述目的可以通過提供一種控制機器人設備動作的方法來實現(xiàn),該方法包括以下步驟識別目標對象;將目標對象識別步驟中識別的目標對象的信息存儲到存儲裝置中;和根據(jù)新近檢測的對象的信息和存儲裝置中存儲的目標對象的信息,控制機器人設備進行動作。
借助上述機器人設備動作控制方法,機器人設備存儲目標對象,并且當相同對象的信息被再次供應時,機器人設備進行預定動作。
此外,上目的可以通過提供一種機器人設備來實現(xiàn),該機器人設備包括諸多運動部件;移動運動部件的諸多關(guān)節(jié);檢測裝置,用于檢測經(jīng)運動部件被施加了外力的關(guān)節(jié)的狀態(tài);和學習裝置,相互關(guān)聯(lián)地學習檢測裝置檢測的關(guān)節(jié)狀態(tài)和外力。
在上述機器人設備中,經(jīng)運動部件被施加了外力的關(guān)節(jié)的狀態(tài)可以由檢測裝置檢測,并且學習裝置相互關(guān)聯(lián)地學習由檢測裝置檢測的關(guān)節(jié)狀態(tài)和外力。也就是,機器人設備學習與相應于作用于運動部件的外力而變化的關(guān)節(jié)狀態(tài)目關(guān)聯(lián)的外力。
此外,上述目的可以通過提供一種外力檢測器來實現(xiàn),該檢測器包括檢測用于移動運動部件的關(guān)節(jié)的狀態(tài)的裝置;和檢測外力的裝置,用于根據(jù)關(guān)節(jié)狀態(tài)檢測裝置檢測的關(guān)節(jié)狀態(tài),檢測作用于運動部件的外力。
在上述外力檢測裝置中,移動運動部件的關(guān)節(jié)的狀態(tài)由關(guān)節(jié)狀態(tài)檢測裝置檢測,并且根據(jù)關(guān)節(jié)狀態(tài)檢測裝置檢測的關(guān)節(jié)狀態(tài)檢測作用于運動部件的外力。即,外力檢測器根據(jù)移動該運動部件的關(guān)節(jié)狀態(tài),檢測作用于運動部件的外力。
此外,上述目的可以通過提供一種檢測外力的方法來實現(xiàn),該方法包括以下步驟檢測用于移動運動部件的關(guān)節(jié)的狀態(tài);根據(jù)所檢測的關(guān)節(jié)狀態(tài)檢測作用于該運動部件的外力;和根據(jù)移動該運動部件的關(guān)節(jié)的狀態(tài)檢測作用于該運動部件的外力。
附圖簡要說明圖1示出用于檢測輸入信號的特征的特征空間;圖2是學習系統(tǒng)的方框圖,包括圖像和聲音信息的識別類別;圖3A和圖3B解釋新識別類別的生成;圖4借助來自知覺信息的基于概念結(jié)構(gòu)的語音解釋語言獲取(如Iwahashi等人的文獻4);圖5A和圖5B解釋圖像特征空間與聲音特征空間的關(guān)系;圖6A至圖6C解釋圖像特征空間、聲音特征空間和第三特征空間之間的關(guān)系;圖7是本發(fā)明的機器人設備的示意圖;圖8是圖7中機器人設備的電路配置的方框圖;圖9是圖7中機器人設備的軟件配置的方框圖;圖10是圖7中機器人設備的軟件配置的中間件層(middleware layer)的方框圖;圖11是圖7中機器人設備的軟件配置的應用層的方框圖;圖12是圖11中應用層的動作模型庫的方框圖;圖13解釋有限概率自動機,是用于確定機器人設備動作的信息;圖14示出在有限概率自動機的每個節(jié)點中準備的狀態(tài)轉(zhuǎn)換表;圖15是本發(fā)明的圖7中機器人設備的一部分方框圖;圖16A和圖16B解釋對機器人設備移動的教導;圖17A和圖17B示出教導機器人設備移動的辨別單元;圖18是用于學習移動的辨別器的方框圖;圖19是移動學習中使用的脈沖寬度的特征曲線,示出機器人設備處于立位時的脈沖寬度;圖20是移動學習中使用的脈沖寬度的特征曲線,示出在其背部向前推處于立位的機器人設備時的脈沖寬度;圖21是移動學習中使用的脈沖寬度的特征曲線,示出在其背部向后推處于立位的機器人設備時的脈沖寬度;圖22是移動學習中使用的脈沖寬度的特征曲線,示出在其頸部向上推處于立位的機器人設備時的脈沖寬度;圖23是移動學習中使用的脈沖寬度的特征曲線,示出在其背部向下推處于立位的機器人設備時的脈沖寬度;圖24是移動學習中使用的脈沖寬度的特征曲線,示出在其頸部向上推處于坐位的機器人設備時的脈沖寬度;圖25是移動學習中使用的脈沖寬度的特征曲線,示出在其頸部向下推處于坐位的機器人設備時的脈沖寬度;圖26是機器人裝置的愉快/不愉快判斷單元的方框圖;圖27解釋一種神經(jīng)網(wǎng)絡;圖28是用于學習外力的本發(fā)明機器人設備的配置的方框圖;圖29示出三層反向傳播的神經(jīng)網(wǎng)絡;圖30示出三層反向傳播神經(jīng)網(wǎng)絡的每一層中的神經(jīng)元的系統(tǒng);圖31是S形函數(shù)的特征曲線;圖32是學習次數(shù)與平均誤差之間關(guān)系的特征曲線;圖33是機器人設備中語音識別單元的詳細方框圖;圖34是機器人設備中關(guān)聯(lián)存儲器/檢索存儲器和動作生成器的方框圖;圖35是機器人設備中使用的關(guān)聯(lián)存儲器/檢索存儲器的方框圖;圖36是機器人設備中傳感器數(shù)據(jù)處理器的詳細方框圖;圖37A至圖37E解釋通過手指的指示用于目標對象識別的共享學習;圖38是關(guān)聯(lián)存儲器系統(tǒng)的示意方框圖;圖39顯示圖38的關(guān)聯(lián)存儲器中使用的兩層分層型的競爭學習神經(jīng)網(wǎng)絡的一個例子;圖40顯示由輸入圖案激活的輸入神經(jīng)元與未激活的神經(jīng)元以及競爭層內(nèi)的神經(jīng)元之間的關(guān)系變化的實例,這種變化是由信號出現(xiàn)時間造成的;圖41顯示用來檢驗機器人設備的動作決定操作的分層動作決定系統(tǒng)的內(nèi)容樹;圖42顯示在第一操作檢驗中包含在本能中的Hunger(饑餓)和Sleepy(困倦)的時間變化;圖43顯示在第一操作檢驗中包含在情緒中的Activity(活躍)、Pleasantness(愉快)和Certainty(確定)的時間變化;圖44顯示在第一操作檢驗中作為動機的吃(Eat)和睡(Sleep)的時間變化;圖45顯示在第二操作檢驗中本能的時間變化;圖46顯示在第二操作檢驗中情緒的時間變化;圖47顯示在第二操作檢驗中釋放機構(gòu)(release mechanism,RM)的時間變化。
實現(xiàn)本發(fā)明的最佳模式下面將結(jié)合附圖詳細說明實現(xiàn)本發(fā)明的最佳模式。最佳模式涉及一種相應于周圍環(huán)境(外部因素)或內(nèi)部狀態(tài)(內(nèi)部因素)自主地進行舉止的自主機器人設備。
首先將說明機器人設備的結(jié)構(gòu),然后詳細說明本發(fā)明在機器人設備中的應用。
(1)本發(fā)明的機器人設備的結(jié)構(gòu)如圖7所示,機器人設備(下面將簡稱為“機器人”)總的用標號1表示。該機器人是一個取“狗”的外形的寵物機器人。如圖所示,機器人1包括身體單元2;分別連接到身體單元2的左前部和右前部以及左后部和右后部的腿部單元3A至3D;和分別連接到身體單元2的前部和尾部的頭部單元4和尾部單元5。
如圖8所示,身體單元2內(nèi)設有CPU(中央處理單元)10、DRAM(動態(tài)隨機存取存儲器)11、快速ROM(只讀存儲器)12、PC(個人計算機)卡接口電路13和信號處理單元14,它們經(jīng)內(nèi)部總線15彼此連接,以形成一個控制器16;此外,還還設有向機器人1提供電源的電池17。身體單元2內(nèi)還設有角速度傳感器18和加速度傳感器19,以檢測機器人1的方位和加速度等。
頭部單元4內(nèi)設有分別在各自位置的攝取機器人1周圍環(huán)境的CCD(電荷耦合器件)攝像機20;觸摸傳感器21,檢測作為諸如用戶的“輕拍”或“擊打”物理動作給予機器人1的壓力;距離傳感器22,測量到存在于機器人1前面的對象的距離;采集外部聲音的麥克風23;輸出聲音,比如吠聲的揚聲器24;如機器人1的“眼睛”的LED(發(fā)光二極管)(未示出)等。
此外,在腿部單元3A至3D的關(guān)節(jié)、腿部單元3A至3D與身體單元2之間的鉸鏈軸、頭部單元4與身體單元2之間的鉸鏈軸以及尾巴5A與尾部單元5之間的鉸鏈軸內(nèi)分別設有傳動器251至25n和電位計261至26n。每個關(guān)節(jié)和鉸鏈軸中使用的傳動器和電位計的數(shù)量取決于傳動器和電位計的自由度。例如,傳動器251至25n的每一個使用伺服電動機。當驅(qū)動伺服電動機時,控制腿部單元3A至3D變換目標姿態(tài)或進行運動。
角速度傳感器18、加速度傳感器19、觸摸傳感器21、距離傳感器22、麥克風23、揚聲器24、LED、傳動器251至25n和電位計261至26n的每一個經(jīng)過集線器271至27n相應的一個連接到控制器16的信號處理電路14,CCD攝像機20和電池17直接連接信號處理電路14。
需要說明的是,來自角速度傳感器18、加速度傳感器19和電位計261至26n的信號在下面將要說明的運動(動作)學習中使用。
信號處理電路14順序地獲取從上述傳感器的每一個所供應的數(shù)據(jù)(下面將稱之為“傳感器數(shù)據(jù)”)、圖像數(shù)據(jù)和語音數(shù)據(jù),并且經(jīng)內(nèi)部總線15將它們存儲到DRAM 11中。此外,信號處理電路14順序地獲取從電池17供應的數(shù)據(jù)并指示電池17中的剩余電勢,并把它們的每一個存儲到DRAM 11中。
根據(jù)存儲在DRAM 11中的傳感器數(shù)據(jù)、圖像數(shù)據(jù)、語音數(shù)據(jù)和剩余電池電勢數(shù)據(jù)的每一個,CPU 10將控制機器人1的動作。
實際上,當電源最初供應給機器人1時,CPU10經(jīng)PC卡接口電路13或者直接地從身體單元2的PC卡槽(未示出)中設置的存儲卡28或者快速ROM12中讀出控制程序,并且將它存入DRAM 11中。
此外,CPU 10根據(jù)上述從信號處理電路14順序存儲到DRAM 11中的傳感器數(shù)據(jù)、圖像數(shù)據(jù)、剩余電池電勢數(shù)據(jù),確定機器人1的內(nèi)部狀態(tài)、機器人1的周圍環(huán)境、用戶的指令或動作的存在等。
此外,CPU10根據(jù)確定的結(jié)果和DRAM 11中存儲的控制程序決定下一步動作,并且根據(jù)確定的結(jié)果驅(qū)動用于下一步動作的傳動器251至25n中所必需的傳動器,從而使頭部單元4搖頭或點頭,搖擺尾部單元5的尾巴5A或者驅(qū)動腿部單元3A至3D行走。
此時,CPU 10根據(jù)需要生成語音數(shù)據(jù),并且經(jīng)信號處理電路14將語音信號供應給揚聲器24,從而輸出依據(jù)語音信號建立的聲音或語音、接通或斷開或閃爍LED。
由此,機器人1相應于其內(nèi)部狀態(tài)或周圍環(huán)境或用戶的指令或動作,自主地進行舉止。
(2)控制程序的軟件結(jié)構(gòu)機器人1的上述控制程序具有圖9所示的軟件結(jié)構(gòu)。如圖所示,設備驅(qū)動器層30位于控制程序的最下層,并且由包括多個設備驅(qū)動器的設備驅(qū)動器集31組成。在此情況下,每個設備驅(qū)動器是允許直接訪問CCD攝像機20(參見圖8)和在計算機中使用的諸如定時器之類的普通硬件的對象,并且借助適當?shù)挠布袛噙M行工作。
如圖9所示,機器人服務器對象32也位于設備驅(qū)動器層30的最底層。該對象32例如包括包含軟件組的虛擬機器人33,該軟件組提供用于訪問諸如上述各種傳感器、傳動器251至25n等的硬件的接口;電源管理器34,包含管理電源切換等的軟件組;設備驅(qū)動器管理器35,包括管理其它各種設備驅(qū)動器的軟件組;和被設計的機器人36,包含管理機器人1的機構(gòu)的軟件組。
在此還提供包括對象管理器38和服務管理器39的管理器對象37。對象管理器38是一個軟件組,分別管理包含在機器人服務器對象32、中間件層40和應用層41中的每個軟件組的啟動和終止。服務管理器39是一個軟件組,根據(jù)存儲卡28中存儲的關(guān)聯(lián)文件所規(guī)定的對象之間關(guān)系的信息,管理對象之間的關(guān)聯(lián)(參見圖8)。
中間件層40位于機器人服務器對象32的上面,包括提供諸如圖像處理、語音處理等機器人的基本功能的軟件組。應用層41位于中間件層40的上面,包括根據(jù)由中間件層40所含有的每個軟件組實行處理的結(jié)果來決定機器人1的動作的軟件組。
圖10詳細地示出中間件層40和應用層41的軟件結(jié)構(gòu)。
如圖10所示,中間件層40包括識別系統(tǒng)60,包括分別用于噪聲檢測、溫度檢測、亮度檢測、音節(jié)(scale)檢測、距離檢測、姿態(tài)檢測、觸摸檢測、運動檢測和顏色識別的信號處理模塊50至58、以及輸入語義轉(zhuǎn)換器模塊59;和輸出系統(tǒng)69,包括輸出語義轉(zhuǎn)換器模塊68和分別用于姿態(tài)管理、跟蹤、運動再現(xiàn)、行走、翻轉(zhuǎn)恢復、點亮LED和語音再現(xiàn)的信號處理模塊61至67。
識別系統(tǒng)60中的信號處理模塊50至58獲取由機器人服務器對象32中的虛擬機器人33從DRAM 11讀出的傳感器數(shù)據(jù)、圖像數(shù)據(jù)和語音數(shù)據(jù)中適當?shù)臄?shù)據(jù),按預定方式處理該數(shù)據(jù),并把該數(shù)據(jù)處理結(jié)果供應給輸入語義轉(zhuǎn)換器模塊59。在該實例中,虛擬機器人33被構(gòu)成為在預定通信規(guī)則下傳遞或轉(zhuǎn)換信號的功能塊。
根據(jù)信號處理模塊50至58供應的數(shù)據(jù)處理結(jié)果,輸入語義轉(zhuǎn)換器模塊59識別機器人1的內(nèi)部狀態(tài)和周圍環(huán)境,比如“噪聲”、“熱”、“亮度”、“檢測到球”、“檢測到翻轉(zhuǎn)”、“輕拍”、“擊打”、“聽到音節(jié)”、“檢測到運動對象”或“檢測到障礙物”、以及來自用戶的指令或動作,并且把識別結(jié)構(gòu)輸出給應用層41(參見圖8)。
如圖11所示,應用層41由五個模塊組成,包括動作模型庫70、動作切換模塊71、學習模塊72、情緒模塊73和本能模塊74。
如圖12所示,動作模型庫70內(nèi)設有獨立動作模塊701至70n,它們分別對應于某些預選條件項目,比如“電池電勢已經(jīng)變低”、“用于翻轉(zhuǎn)的恢復”、“用于繞過障礙物”、“用于表達情緒”、“已經(jīng)檢測到球”等。
例如,當這些動作模塊701至70n被供應輸入語義轉(zhuǎn)換器模塊59的識別結(jié)果時,或者當這些模塊被供應最終識別結(jié)果之后已經(jīng)經(jīng)過預定時間時,這些模塊根據(jù)需要參考情緒模塊73所保存的適當?shù)那榫w參數(shù)值和本能模塊74所保存的適當?shù)挠麉?shù)值決定機器人1進行的下一步動作(下面將作進一步說明),并且將決定結(jié)果輸出給動作切換模塊71。
需要說明的是,在本發(fā)明的該實施例中,動作模塊701至70n作為決定后續(xù)動作的裝置,采用所謂的“有限概率自動機”算法,分別根據(jù)為弧線ARC1至ARCn設置的轉(zhuǎn)換概率P1至Pn,推測決定圖13所示的節(jié)點(狀態(tài))NODE0至NODEn的哪個節(jié)點轉(zhuǎn)換,以及該節(jié)點轉(zhuǎn)換到這些節(jié)點的哪一個其它節(jié)點,其中這些弧線提供節(jié)點NODE0至NODEn之間的連接。
具體地說,動作模型701至70n的每一個具有如圖14所示的狀態(tài)轉(zhuǎn)換表80,它分別對應于包含在動作模型701至70n內(nèi)的節(jié)點NODE0至NODEn的每一個。
也就是說,在狀態(tài)轉(zhuǎn)換表80中,作為NODE0至NODEn之間的轉(zhuǎn)換條件得到的輸入事件(識別結(jié)果)按優(yōu)先順序輸入到由“輸入事件名稱”欄所覆蓋的行中,對轉(zhuǎn)換條件附加的條件數(shù)據(jù)被輸入到由“數(shù)據(jù)名稱”和“數(shù)據(jù)范圍”欄所覆蓋的行中。
因此,如圖14的狀態(tài)轉(zhuǎn)換表80所示,它示出NODE100轉(zhuǎn)換到其它節(jié)點的條件,即當給出“BALL(機器人已經(jīng)檢測到球)”的識別結(jié)果,并且與該識別結(jié)果共同給出的“SIZE(球的大小)”是“0,1000(0至1000)”時。此外,當“OBSTACLE(機器人1已經(jīng)檢測到障礙物)”作為識別結(jié)果給出,以及與該識別結(jié)果一同給出的“DISTANCE(障礙物與機器人之間的距離)”是“0,100(0至100)”時,節(jié)點NODE100可以轉(zhuǎn)換到另一個節(jié)點。
此外,當分別涉及動作模型701至70n的情緒模型73和本能模型74中所保存的情緒和欲望的、在情緒模型73中保存的這些運動“JOY”、“SURPRISE”和“SADNESS”的參數(shù)值循環(huán)地取“50,100(50至100)”值時,即使沒有識別結(jié)果的輸入,節(jié)點NODE100也轉(zhuǎn)換到另一個節(jié)點。
在狀態(tài)轉(zhuǎn)換表80中,節(jié)點NODE0至NODEn的每一個可以轉(zhuǎn)換到的節(jié)點的名稱被列在由“轉(zhuǎn)換到其它節(jié)點(Di)的概率”欄所覆蓋的“轉(zhuǎn)換目的地節(jié)點”行中,當“輸入事件名稱”、“數(shù)據(jù)名稱”和“數(shù)據(jù)范圍”欄中給出的所有要求分別被滿足時將可能出現(xiàn)的轉(zhuǎn)換到其它節(jié)點NODE0至NODEn的概率被列在“轉(zhuǎn)換到其它節(jié)點(Di)的概率”欄的相應位置上,以及當狀態(tài)轉(zhuǎn)換到節(jié)點NODE0至NODEn時輸出的動作被列在由“轉(zhuǎn)換到其它節(jié)點(Di)的概率”欄覆蓋的“輸出動作”行中。需要說明是由“轉(zhuǎn)換到其它節(jié)點(Di)的概率”欄所覆蓋的行中的轉(zhuǎn)換概率的總和是100(%)。
因此,當“BALL(已經(jīng)檢測到球)”作為識別結(jié)果給出和與該識別結(jié)果一同給出的“SIZE(球的大小)”是“0,1000(0至1000)”時,圖14所示的狀態(tài)轉(zhuǎn)換表80中的節(jié)點NODE100可以轉(zhuǎn)換到節(jié)點NODE120(節(jié)點120)的轉(zhuǎn)換概率是30%。此時,機器人1將進行動作“ACTION1”。
配置每個動作模型,以便按狀態(tài)轉(zhuǎn)換表80給出的許多模型701至70n彼此鏈接。例如,當從輸入語義轉(zhuǎn)換器模塊59供應識別結(jié)果時,相應節(jié)點NODE0至NODEn的狀態(tài)轉(zhuǎn)換表被用來推測地決定后續(xù)動作,并且將決定結(jié)果輸出到動作切換模塊71。
圖11所示的動作切換模塊71選擇動作模型庫70中動作模型701至70n輸出的多條動作中預定的高優(yōu)先級動作,并且把執(zhí)行該動作的命令(下面將稱作“動作命令”)發(fā)送給中間件層40的輸出語義轉(zhuǎn)換器模塊68。需要說明的是,在該實施例中,從圖12的動作模型701至70n中較低的一個輸出的動作被設置為具有較高的優(yōu)先級,其優(yōu)先級高于從較高動作模型輸出的那些動作的優(yōu)先級。
當動作被完成時,動作切換模塊71根據(jù)輸出語義轉(zhuǎn)換器模塊68供給的動作完成信息,通知學習模塊72、情緒模塊73和本能模塊74動作完成。
另一方面,學習模塊72被供應有輸入語義轉(zhuǎn)換器59所供應的識別結(jié)果之中的,由用戶按諸如“擊打”、“輕拍”等的動作教導機器人的識別結(jié)果。
學習模塊72改變動作模型庫70的動作模型701至70n中相應模型的轉(zhuǎn)換概率。根據(jù)識別結(jié)果和來自動作切換模塊71的信息,當機器人1例如被擊打時(=訓斥),學習模塊72減少動作的表現(xiàn)(express)概率,而當機器人1例如被輕拍(=贊揚)時提升該表現(xiàn)概率。
另一方面,情緒模型73保存有指示總共六個情緒“愉快”、“悲傷”、“生氣”、“驚喜”、“厭惡”、“恐懼”的每一個的強度的參數(shù)。情緒模型73根據(jù)輸出語義轉(zhuǎn)換器模塊59所供應的諸如“擊打”、“輕拍”等特定的識別結(jié)果、逝去的時間和動作切換模塊71的信息,周期性地更新這些情緒的參數(shù)值。
更具體地說,情緒模塊73使用預定的計算式,依據(jù)輸入語義轉(zhuǎn)換器模塊59所供應的識別結(jié)果、此時機器人1的舉止和自先前更新起逝去的時間,每次計算情緒的變化。然后,通過取該情緒變化為ΔE[t],該情緒的當前參數(shù)值為E[t]以及指示對該情緒的靈敏度的因數(shù)為ke,情緒模塊73通過計算式(4)確定在下一個周期中情緒的參數(shù)值E[t+1],并且用情緒參數(shù)值E[t+1]替代情緒的當前參數(shù)值E[t],由此更新情緒的參數(shù)值。情緒模型73還以相同方式更新所有剩余情緒中的參數(shù)值。
E[t+1]=E[t]+ke×ΔE[t]……………………(4)需要說明的是,識別結(jié)果和來自輸出語義轉(zhuǎn)換器模塊68的信息的每一個對每個情緒的參數(shù)值的變化ΔE[t]的影響有多大是預先確定的。該確定是,使例如“擊打”的識別結(jié)果將對“生氣”情緒的參數(shù)值的變化ΔE[t]具有很大的影響,而“輕拍”的識別結(jié)果將對“愉快”情緒的參數(shù)值的變化ΔE[t]有很大的影響。
來自輸出語義轉(zhuǎn)換器模塊68的信息是所謂的對動作的反饋信息(動作完成信息)。即,它是關(guān)于動作表現(xiàn)結(jié)果的信息。情緒模塊73將用這種信息改變該情緒。例如,“吠叫”動作降低“生氣”情緒的等級。需要說明的是,來自輸出語義轉(zhuǎn)換器模塊68的信息還被供應給上述的學習模塊72,該學習模塊72根據(jù)來自輸出語義轉(zhuǎn)換器模塊68的信息為動作模型701至70n中適當?shù)囊粋€更新轉(zhuǎn)換概率。
需要說明的是,動作的結(jié)果可以由動作切換模塊71的輸出(具有加在其上的感覺的動作)反饋。
另一方面,本能模型74擁有指示總共四個獨立欲望“鍛煉”、“友情”、“食欲”和“好奇心”的每一個的強度的參數(shù)。本能模型74根據(jù)從輸入語義轉(zhuǎn)換器模塊59供應的識別結(jié)果、逝去時間和來自動作切換模塊71的信息,周期性地更新這些欲望的參數(shù)值。
具體地說,本能模塊74使用預定的計算式,依據(jù)輸出語義轉(zhuǎn)換器68供應的識別結(jié)果、逝去時間和來自輸出語義轉(zhuǎn)換器模塊68的信息,每次計算欲望“鍛煉”、“友情”、和“好奇心”每一個的變化。然后,通過取欲望變化為ΔI[k],取欲望的當前參數(shù)值為I[k],以及取指示對欲望的靈敏度的因數(shù)為ki,本能模塊74通過周期性地計算式(5)確定下一個周期中的欲望參數(shù)值I[k+1],并且用參數(shù)值I[k+1]替代欲望的當前參數(shù)值I[k],由此更新欲望的參數(shù)值。本能模塊74還以相同方式更新除“食欲”之外的所有剩余欲望的參數(shù)值。
I[k+1]=I[k]+ki×ΔI[k] ………………(5)需要說明的是,識別結(jié)果和來自輸出語義轉(zhuǎn)換器模塊68的信息中每一個對每個欲望的參數(shù)值的變化ΔI[k]有多大影響是預先確定的。該確定是,使例如來自輸出語義轉(zhuǎn)換器模塊68的信息將對“疲勞”狀態(tài)的參數(shù)值的變化ΔI[k]具有很大的影響。
需要說明的是,情緒和欲望(本能)的每一個具有其限制范圍為0至100的可變參數(shù)值范圍,并且還使因數(shù)ke和ki的每一個具有為情緒和欲望中的每一個所設置的值。
另一方面,如圖10所示,中間件層40的輸出語義轉(zhuǎn)換器模塊68向輸出系統(tǒng)69的信號處理模塊61至67中適當?shù)囊粋€供應抽象動作命令,類似于上述的應用層41的動作切換模塊71所供應的“向前運動”、“愉快”、“吠叫”或“跟蹤(球)”。
根據(jù)所供應的動作命令,信號處理模塊61至67生成供應給傳動器251至25n中適當?shù)囊粋€的伺服指令、將從揚聲器24(參見圖8)輸出的語音的語音數(shù)據(jù)、或者供應給作為機器人“眼睛”的LED的驅(qū)動數(shù)據(jù),以執(zhí)行動作,并且按照該命令經(jīng)過機器人服務器對象32中的虛擬機器人33和信號處理電路14(參見圖8)向251至25n中適當?shù)囊粋€和揚聲器24或LED發(fā)送數(shù)據(jù)。
如上所述,機器人1適合根據(jù)控制程序,相應于機器人內(nèi)部狀態(tài)和環(huán)境(外部)狀態(tài)或用戶的指令或動作自主地動作。
(3)相應于環(huán)境改變本能和情緒機器人1還適于例如在明亮環(huán)境中興奮,而在黑暗環(huán)境中平靜。即,機器人1適合于具有相應于機器人1周圍環(huán)境中的三個因素“噪聲”、“溫度”和“亮度”中的每一個因素(下面將稱作“環(huán)境因素”)的范圍而改變的情緒和本能。
具體地說,機器人1具有檢測周圍環(huán)境的外部傳感器,除了設置在各自適當位置的上述CCD攝像機20、距離傳感器22、觸摸傳感器21和麥克風23之外,還包括溫度傳感器或熱傳感器(未示出),以檢測環(huán)境溫度。中間件層40的識別系統(tǒng)60包括分別對應于上述傳感器的用于噪聲檢測、溫度檢測和亮度檢測的信號處理模塊50至52。
噪聲檢測信號處理模塊50根據(jù)經(jīng)過機器人服務器對象32中的虛擬機器人33、麥克風23(參見圖8)給出的語音數(shù)據(jù)檢測周圍環(huán)境噪聲水平,并且將檢測結(jié)果輸出給輸入語義轉(zhuǎn)換器模塊59。
溫度檢測信號處理模塊5 1根據(jù)經(jīng)過虛擬機器人33、熱傳感器供給的傳感器數(shù)據(jù)檢測周圍環(huán)境溫度,并且將檢測結(jié)果輸出給輸入語義轉(zhuǎn)換器模塊59。
亮度檢測信號處理模塊52根據(jù)經(jīng)過虛擬機器人33、CCD攝像機20(參見圖8)供給的圖像數(shù)據(jù)檢測周圍環(huán)境亮度,并且將檢測結(jié)果輸出給輸入語義轉(zhuǎn)換器模塊59。
輸入語義轉(zhuǎn)換器模塊59根據(jù)信號處理模塊50至52的輸出,識別周圍環(huán)境“噪聲”、“溫度”和“亮度”中每一個的程度,并把識別結(jié)果輸出給應用模塊41的內(nèi)部狀態(tài)模塊(參見圖11)。
具體地說,輸入語義轉(zhuǎn)換器模塊59根據(jù)噪聲檢測信號處理模塊50的輸出,識別周圍環(huán)境“噪聲”的程度,并把類似“嘈雜”或“平靜”的識別結(jié)果輸出給情緒模型73、本能模型74等。
此外,輸入語義轉(zhuǎn)換器模塊59根據(jù)溫度檢測信號處理模塊51的輸出,識別周圍環(huán)境“溫度”的程度,并把類似“熱”或“冷”的識別結(jié)果輸出給情緒模型73、本能模型74等。
此外,輸入語義轉(zhuǎn)換器模塊59根據(jù)亮度檢測信號處理模塊52的輸出,識別周圍環(huán)境“亮度”的程度,并把類似“明亮”或“黑暗”的識別結(jié)果輸出給情緒模型73、本能模型74等。
情緒模型73根據(jù)輸入語義轉(zhuǎn)換器模塊59所供應的上述各種識別結(jié)果,通過計算式(4)改變每個情緒的參數(shù)值。
然后,情緒模型73根據(jù)從輸入語義轉(zhuǎn)換器模塊59供應的關(guān)于“噪聲”、“溫度”和“亮度”的識別結(jié)果,為一個預定的適當情緒增加或減小式(4)中的因數(shù)ke的值。
具體地說,例如,當識別結(jié)果“嘈雜”被供應時,情緒模型73將“生氣”情緒的因數(shù)ke的值增加一個預定數(shù)。另一方面,當所供應的識別結(jié)果是“平靜”時,情緒模型74將“生氣”情緒的因數(shù)ke的值減少一個預定數(shù)。由此,“生氣”情緒的參數(shù)值將在周圍環(huán)境“噪聲”的影響下改變。
此外,當供應識別結(jié)果“熱”時,情緒模型73將“愉快”情緒的因數(shù)ke的值減少一個預定數(shù)。另一方面,當所供應的識別結(jié)果是“冷”時,情緒模型73將“悲傷”情緒的因數(shù)ke的值增加一個預定數(shù)。由此,“悲傷”情緒的參數(shù)值將在周圍環(huán)境“溫度”的影響下改變。
此外,當供應識別結(jié)果“明亮”時,情緒模型73將“恐懼”情緒的因數(shù)ke的值減少一個預定數(shù)。另一方面,當所供應的識別結(jié)果是“黑暗”時,情緒模型73將“恐懼”情緒的因數(shù)ke的值增加一個預定數(shù)。由此,“恐懼”情緒的參數(shù)值將在周圍環(huán)境“亮度”的影響下改變。
類似地,本能模型74根據(jù)輸入語義轉(zhuǎn)換器模塊59供應的上述各種識別結(jié)果,通過計算式(5)來改變每一個欲望的參數(shù)值。
此外,本能模型74根據(jù)從輸入語義轉(zhuǎn)換器模塊59供應的關(guān)于“噪聲”、“溫度”和“亮度”的識別結(jié)果,為一個預定的適當欲望增加或減少式(5)中的因數(shù)ki的值。
此外,例如當供應識別結(jié)果“嘈雜”和“明亮”時,本能模型74將“疲勞”狀態(tài)的因數(shù)ki的值減少一個預定數(shù)。另一方面,當所供應的識別結(jié)果是“平靜”和“黑暗”時,本能模型74將“疲勞”狀態(tài)的因數(shù)ki的值增加一個預定數(shù)。此外,例如當識別結(jié)果是“熱”或“冷”時,本能模型74將“疲勞”的因數(shù)ki的值增加一個預定數(shù)。
因而,當機器人1例如處于“嘈雜”環(huán)境中時,“生氣”情緒的參數(shù)值容易增加,而“疲勞”狀態(tài)的參數(shù)值容易減少,所以機器人1通常將進行“被激怒”動作。另一方面,當機器人1的周圍環(huán)境是“平靜”時,“生氣”情緒的參數(shù)值容易減少,而“疲勞”狀態(tài)的參數(shù)值容易增加,所以機器人1通常將“輕輕地”動作。
另外,當機器人1處于“熱”環(huán)境中時,“愉快”情緒的參數(shù)值容易減少,而“疲勞”狀態(tài)的參數(shù)值容易增加,所以機器人1通常將顯示“懶惰”動作。另一方面,當機器人1處于“冷的”周圍環(huán)境中時,“悲傷”情緒的參數(shù)值容易增加,“疲勞”狀態(tài)的參數(shù)值也容易增加,所以機器人1通常將“以抱怨冷”的方式動作。
當機器人1處于“明亮”環(huán)境中時,“愉快”情緒的參數(shù)值容易增加,而“疲勞”狀態(tài)的參數(shù)值容易減少,所以機器人1通常將顯示“興奮”動作。另一方面,當機器人1處于“黑暗”周圍環(huán)境中時,“愉快”情緒的參數(shù)值容易增加,“疲勞”狀態(tài)的參數(shù)值也容易增加,所以機器人1通常將“輕輕地”動作。
機器人1以上述方式構(gòu)成,并且可以具有相應于周圍環(huán)境變化的情緒和本能,并且根據(jù)其情緒和本能的狀態(tài)自主地動作。
(4)本發(fā)明的應用(4-1)一般說明適用于本發(fā)明的機器人1的基本部分將在下面說明。機器人1被構(gòu)成學習與圖像信號和語音信號(聲音信號)相關(guān)聯(lián)的動作,并且在學習后,用關(guān)聯(lián)該動作的圖像信號和語音信號啟動動作。在下面的說明中,主要說明使機器人1學習與語音或聲音相關(guān)聯(lián)的動作的一個例子。然而,當然,也可以使機器人1學習與圖像關(guān)聯(lián)的動作。具體地說,根據(jù)本發(fā)明,機器人1按以下方式構(gòu)成如圖15所示,機器人1包括語音識別單元101,傳感器數(shù)據(jù)處理器102,本能/情緒存儲單元103,關(guān)聯(lián)存儲器/檢索存儲器104和動作生成器105。
語音識別單元101起到一個輸入信息檢測器的作用,檢測與檢測觸摸機器人1的觸摸傳感器(例如,圖8中的觸摸傳感器21)的觸摸檢測同時或者剛好之前或之后供應的信息。關(guān)聯(lián)存儲器/檢索存儲器104彼此關(guān)聯(lián)地存儲響應觸摸所作出的動作和由語音識別單元101檢測的輸入信息(語音信號)。動作生成器105作為動作控制器來工作,提供存儲在關(guān)聯(lián)存儲器/檢索存儲器104中的并且與新近獲取的輸入信息(語音信號)相關(guān)的動作。此外,傳感器數(shù)據(jù)處理器102響應例如觸摸傳感器(未示出)的觸摸檢測工作,以使機器人1進行動作。下面將具體說明這些機器人部件所起的作用。
語音識別單元101處理從外部(麥克風23)供應的語音信號,把它們識別為預定的語言。具體地說,語音識別單元101采用HMM,通過基于HMM的多個識別類別將輸入語音識別為音素序列。
語音識別單元101還能夠經(jīng)過學習基于現(xiàn)存類別生成增加數(shù)量的類別。例如,當給定一個未識別的語音時,語音識別單元101將劃分現(xiàn)存類別,以生成圖6B所示的新類別。具體地說,語音識別單元101為一個輸入語音劃分具有特定因數(shù)(歸屬估價)的現(xiàn)存類別,以生成新類別。例如,劃分具有較少特征的類別的部分,以提供新類別。由此,語音識別單元101可以識別預注冊的語言以及新語言。
傳感器數(shù)據(jù)處理器102根據(jù)傳感器數(shù)據(jù)的變化生成教導機器人的運動(動作)的信號。也就是,傳感器數(shù)據(jù)處理器102識別輸入動作信息。
將教導給機器人的運動可以是例如預置的運動,也可以是用戶設置的新運動。此外,可以選擇性地生成已經(jīng)設置的任何運動。
對機器人預置運動的教導是,例如通過輸入觸摸傳感器的傳感器數(shù)據(jù)觸發(fā)機器人的預置運動。例如,機器人被預置為,當機器人背部設置的預定觸摸傳感器被推動時,時機器人從“站立”位置轉(zhuǎn)換到“坐”位置。即,當處于“站立位置”的機器人的背部上的觸摸傳感器被推動時,教導機器人實際轉(zhuǎn)換到“坐”位置。
需要說明的是,這種用于對機器人運動的教導的傳感器可以設置在頭部或腿部邊緣。通過在任意位置設置這種傳感器,能夠教導機器人各種運動。
此外,對機器人進行新設置的運動的教導可以例如通過改變運動部件(關(guān)節(jié))的控制信號來進行。運動部件包括例如設置在腿部單元3A至3D的關(guān)節(jié)上的傳動器(伺服電動機)251至25n,腿部單元3A至3D與身體單元2之間的鉸鏈軸,頭部單元4與身體單元2之間的鉸鏈軸,尾部單元5與尾巴5A之間的鉸鏈軸等。
例如,當機器人1的運動部件被用戶強制運動時,將出現(xiàn)對運動部件的負載。對運動部件的負載將產(chǎn)生一個信號,它不同于在運動部件正常運動期間(沒有外部負載)時出現(xiàn)的信號,例如對運動部件的伺服信號。機器人1姿態(tài)的改變,即機器人1的運動可以依據(jù)該信號得知。由此,通過存儲該信號,用戶推動的運動可以被教導為對機器人1的新運動。下面將進一步說明這種新運動的教導。此外,根據(jù)本發(fā)明,機器人1適合于從這種信號變化中檢測外力(外部負載),從而如下面將進一步說明的那樣學習該外力。
此外,傳感器數(shù)據(jù)處理器102可以識別機器人1必須學習的動作的類別。例如,機器人1可以根據(jù)動作特征空間中的特征識別其類別,來學習輸入動作信息。
本能/情緒存儲單元103存儲與上述的語音和動作關(guān)聯(lián)的情緒的信息。也就是,本能/情緒存儲單元103使用來自上述本能模型或情緒模型的輸入傳感器信號等改變本能或情緒。
關(guān)聯(lián)存儲器/檢索存儲器104根據(jù)來自上述的語音識別單元101、傳感器數(shù)據(jù)處理器102和本能/情緒存儲單元103的信息進行學習,然后根據(jù)該學習生成相應于輸入語音和圖像的動作信息。關(guān)聯(lián)存儲器/檢索存儲器104利用在上文中已經(jīng)結(jié)合式(1)和(2)進行了說明的、基于圖像和語音類別彼此相關(guān)的關(guān)聯(lián)存儲器的傳統(tǒng)原理,并且相關(guān)聯(lián)地存儲每個信息。
例如,當傳感器數(shù)據(jù)處理器102從傳感器數(shù)據(jù)中檢測從“站立”位置轉(zhuǎn)換到“坐”位置的運動教導,并且在傳感器數(shù)據(jù)處理器102檢測教導的同時或者剛好之前或之后,語音識別單元101識別發(fā)出的語言“向后”時,關(guān)聯(lián)存儲器/檢索存儲器104將彼此關(guān)聯(lián)地存儲(學習)從“站立”轉(zhuǎn)換到“坐”位置的運動和發(fā)出的語言“向后”。一般來說這與教導一條真狗“坐下”相同。
此外,只有當輸入運動和語言被成對預置時,關(guān)聯(lián)存儲器/檢索存儲器104才適合于通過將輸入運動和輸入語言相互關(guān)聯(lián)(觸發(fā))來學習輸入運動。例如,如果發(fā)出的語言“向后”與上述的所謂“坐下”運動的教導同時或剛好之前或之后給出,關(guān)聯(lián)存儲器/檢索存儲器104將學習(存儲)與發(fā)出的語言“向后”相關(guān)聯(lián)(聯(lián)系)的運動。然而,如果輸入語言是不同于“向后”的任何語言,則將不能學習該運動。
此外,關(guān)聯(lián)存儲器/檢索存儲器104可以通過將識別的運動或語言與本能/情緒存儲單元103輸出的本能和情緒相關(guān)聯(lián)來學習運動。例如,如果關(guān)聯(lián)存儲器/檢索存儲器104在按語音(發(fā)出的語言)輸入的運動學習中感到恐懼(害怕),則它可以學習(存儲)這種與“害怕”情緒相關(guān)聯(lián)的這種語音。
如上所述,關(guān)聯(lián)存儲器/檢索存儲器104學習(存儲)彼此關(guān)聯(lián)(聯(lián)系)的語音、運動或情緒,并且在學習之后,它將根據(jù)學習結(jié)果生成相應于輸入圖像、語音等的動作信息。
動作生成器105基于上述關(guān)聯(lián)存儲器/檢索存儲器104輸出的動作信息生成動作。例如,當學習上述的“向后”的教導之后,所發(fā)出的語言“向后”被送給關(guān)聯(lián)存儲器/檢索存儲器104時,動作生成器105將產(chǎn)生從“站立”位置到“坐下”位置的轉(zhuǎn)換。
如上所述,機器人1將能夠?qū)W習與語音信息和傳感器信號(數(shù)據(jù))的變化相關(guān)聯(lián)的動作,根據(jù)輸入語音執(zhí)行作為學習結(jié)果的動作(運動)。
下面將說明機器人1例如依據(jù)“坐下”運動的學習進行一系列操作直至輸出該運動的過程。
在學習期間,觸摸機器人1,與此同時或剛好之前或之后,給機器人1語音(聲音信號),如圖16A所示。語音信號是例如“向后”。所供應的觸摸信號等于從“站立”位置轉(zhuǎn)換到“坐下”位置的運動的教導,以改變來自與該運動有關(guān)的運動部件的傳感器信號。需要說明的是,觸摸傳感器或者按鈕(例如,“坐下”的教導按鈕)可以按上述方式設置在一個預定位置,以便通過操作(推動)觸摸傳感器或按鈕來教導機器人運動。在此情況下,供應觸摸信號是指通過操作這種觸摸傳感器生成信號。
使用上述的教導操作,將教導機器人1進行圖16A中的從(A-1)轉(zhuǎn)換到(A-2)的運動。
在如此教導之后,機器人1將轉(zhuǎn)換到如圖16A中(A-2)所示的“坐下”位置。當學習期間給出教導機器人1的發(fā)音(聲音信號)、例如圖16B的(B-1)中的“向后”時,機器人移動到學習期間教導的、如圖16B中(B-2)所示的位置。
將教導給機器人的運動不限于上述的方式。也就是,在給出語音(說話)的同時或者前后,可以從機器人背部向前推動機器人1,使機器人頸部上抬或下壓、或者抬高前腿,以便教導機器人1這些運動。通過將運動的這種教導與相應的發(fā)音相關(guān)聯(lián),可以教導機器人1例如“伏臥”、“站立”或“搖擺”的運動。
此外,機器人1可以按下述方式學習。
首先,機器人1將在學習運動中學習“踢”。具體地說,用戶(訓練者)將操作前腿,并教導機器人1“踢”東西。機器人1待學習的運動可以是預置的或者是新的。另一方面,經(jīng)語言識別學習的發(fā)音“紅色”和根據(jù)圖像識別的紅顏色被彼此關(guān)聯(lián)地存儲。
作為這種學習的結(jié)果,機器人1將識別發(fā)出的語言“踢紅色的東西”,然后將踢“紅色”的東西作為生成的動作。例如,紅色對象通過輸入圖像的分段和識別圖像的紅色部分來識別。也就是,機器人1將識別包括諸多紅色段的東西,以作為去踢的對象。
在上述實施例中,語音信息與動作相關(guān)聯(lián),但本發(fā)明不局限于這種聯(lián)系。例如,圖像信息可以與動作信息相關(guān)聯(lián)。在此情況下,機器人1裝備有圖像識別單元,用于從諸如(例如)CCD攝像機20的攝像單元供應的圖像信號中識別特定的圖像。
此外,已經(jīng)描述了關(guān)于本能/情緒存儲單元103輸出的本能或情緒與學習的動作或發(fā)出的語言相聯(lián)系的上述實施例。然而,本發(fā)明不局限于這種聯(lián)系。例如,后面發(fā)生的本能或情緒可以鏈接目前的動作和發(fā)出的語言。
此外,在機器人1中,輸出(真實動作)所產(chǎn)生的情緒、作為該情緒的動機的輸入(例如,發(fā)出的語言或圖像)以及輸出本身(真實動作)可以被存儲(學習)。由此,在學習后的真實現(xiàn)場中,機器人1可以從輸入語言等中檢索相應存儲的情緒,以進行預定的動作,而不提供應當相應于輸入語言內(nèi)在地提供的任何輸出(動作)。
通過存儲(學習)觸摸(動作)一個紅色東西(輸入)時產(chǎn)生的情緒,例如,檢測到高溫時的恐懼感覺(害怕),機器人1可以在以后看見紅色東西(輸入)時檢索害怕,從而作出表現(xiàn)害怕的動作(作出預定動作)。也就是,機器人1可以進行任何適當動作,而不重復過去的諸如觸摸紅色東西的動作。
在此情況下,關(guān)聯(lián)存儲器/檢索存儲器104將以相互關(guān)聯(lián)的方式存儲表現(xiàn)為相應于由語音識別單元101檢測的語音信號而作出的動作結(jié)果的動作結(jié)果信息和語音信號,并且動作生成器105根據(jù)關(guān)聯(lián)存儲器/檢索存儲器104基于新語音信號識別的動作結(jié)果控制動作。
此外,機器人1可以影響輸入的其它空間,影響輸入信號的特征空間中的情緒和動作以影響該輸入信號的分類。也就是,如圖6A、圖6B和圖6C所示,當類別在圖像和語音的特征空間中彼此接近時,參考第三特征空間(例如,動作特征空間)分類該圖像和語音。
具體地說,在響應由圖像信號表征的第一輸入對象(圖像)進行第一動作的情況下,給予機器人1獎賞(例如,輕拍),而當機器人響應非常相似于該圖像特征空間中的第一對象的第二對象,還進行作為分類結(jié)果(第一和第二對象在該圖像特征空間中彼此接近)的第一動作時,則給予機器人懲罰(例如“擊打”);該機器人1適合于響應第二和該第二對象的后續(xù)輸入進行不同于第一動作的任何動作。也就是,另一個特征空間中的分類結(jié)果(此情況下的動作結(jié)果)被用來影響另一個分類或分類策略。
在此情況中,語音識別單元101具有作為以下部件的功能輸入信息檢測器;特征檢測器,檢測由輸入信息檢測器檢測的語音信號的特征;信息分類單元,根據(jù)特征分類語音信號。需要提醒的是,基于特征的語音信號分類相當于HMM的分類。需要說明的是,特征提取器122(將結(jié)合圖33進行詳細說明)執(zhí)行特征檢測器的功能,而圖33所示的HMM單元123執(zhí)行信息分類單元的功能。
此外,語音識別單元101具有作為分類改變器的功能,該分類改變器在動作生成器105的控制下,根據(jù)表現(xiàn)為機器人1進行的動作結(jié)果的動作結(jié)果信息改變已經(jīng)引發(fā)動作的語音信號的分類(識別類別)。需要說明的是,通過關(guān)聯(lián)進行的學習可以是通過將機器人1被獎賞時所作出的動作與刺激(語音、圖像、動作或類似物)相關(guān)聯(lián)進行的學習。
本發(fā)明的機器人1的所有部件已經(jīng)在前面說明。下面將進一步說明每個部件。
(4-2)任意動作的學習(傳感器數(shù)據(jù)處理器的詳細說明)如上所述,機器人1學習是預置運動或任意運動的運動(動作)。下面將說明機器人1如何學習任意運動,即,新運動。
機器人1的關(guān)節(jié)由相應的如上所述的伺服電動機控制。在機器人1中,基于來自CPU 10的角度指定(角度指定信息)生成按時間系列的角度,并且作為結(jié)果,機器人1將表現(xiàn)一個運動。
此外,伺服控制器提供諸多信號,包括從設置在每個關(guān)節(jié)中的電位計供應的實際關(guān)節(jié)角度,和供應給每個伺服電動機的脈沖信號。使用該脈沖信號,而不是用于教導機器人1上述預置運動的來自觸摸傳感器的傳感器信號(傳感器數(shù)據(jù)),教導機器人1任意運動。
為了學習該任意運動,機器人1包括圖17A所示的辨別單元111。該辨別單元111相當于圖15中的傳感器數(shù)據(jù)處理器102,它為機器人1學習任意運動而構(gòu)造。辨別單元111專用于機器人1根據(jù)供應給每個關(guān)節(jié)伺服電動機的控制信號的脈寬學習運動。
需要注意的是,機器人1適合于變換各種姿態(tài),因而當學習一種運動時它將不保持任何一種恒定的姿態(tài)。因此,機器人1必須被教導“站立”和“坐下”位置中的相似運動。即,必須與機器人1的每種姿態(tài)相關(guān)聯(lián),通過使用控制運動部件(關(guān)節(jié))的運動的脈寬來教導機器人1進行運動。
為此,辨別單元111包括如圖17B所示的多個辨別器1111、1112,…,其每一個用于一種姿態(tài)。例如,第一辨別器1111被提供用來學習“坐下”位置的運動,第二辨別器1112被提供用來學習“站立”位置的運動。
根據(jù)機器人1當前姿態(tài)的信息,辨別單元111選擇多個辨別器1111、1112,…中預期的一個,用于機器人1學習任意姿態(tài)的運動。
需要說明的是,表示當前姿態(tài)的姿態(tài)信息可以從例如電位計261至26n、角速度傳感器18或加速度傳感器19所供應的重力信息中檢測。此外,可以根據(jù)來自動作生成器105的作為運動部件控制信號輸出的命令,獲取當前姿態(tài)信息。
通過將沒有給機器人1施加外力時出現(xiàn)的脈寬與施加外力時出現(xiàn)的脈寬進行比較,實現(xiàn)教導(學習)。也就是,供應給處于正常狀態(tài)下(沒有施加的外力)的每個關(guān)節(jié)(伺服電動機)的脈沖信號的寬度取固定在一定限度內(nèi)的圖案,而在機器人1被施加外力時,供應給該關(guān)節(jié)的脈沖信號的寬度將具有不同于正常狀態(tài)下的關(guān)節(jié)所顯示的圖案。為了通過向機器人施加外力教導機器人1運動,上述關(guān)系(脈寬圖案之間的差別)被用來獲取關(guān)于運動的信息。具體地說,按照下面將說明的方式實現(xiàn)運動學習。
例如,當根據(jù)處于站立位置的姿態(tài)信息識別機器人1時,在施加給機器人1用于教導運動的外力時出現(xiàn)的脈沖寬度將供應給第一辨別器1111,在同一時間還供應指定給該運動的信息給該辨別器。例如,用于運動教導的脈沖寬度是用于如下式(6)所示的所謂的PID控制的信號的脈沖寬度。更具體地說,將PWM控制的脈沖用于此目的。P=Pg×en+Ig×Σi=0neiΔt+Dg×en-en-1ΔT-----(6)]]>其中,ei是時間i的誤差(電位計中目標角度與當前角度(實際角度)之間的差值),Pg、Ig和Dg是常數(shù)。用于運動學習的脈寬是通過計算式(6)獲得的P值。
例如,矢量被用作脈寬的信息,當分別為運動學習和要被教導的運動的目的將外力施加給機器人1時出現(xiàn)該脈寬。五維矢量[V0,V1,V2,V3,V4]被用作指定給要被教導的運動的信息。有了該矢量的五個元素V0、V1、V2、V3和V4,就能夠識別五個類型的刺激。下面將詳細說明教導。
當從背部向后推動機器人1時,提供從此時產(chǎn)生的脈寬中獲得的矢量P1和打算運動的信息O1=
。例如,如圖18所示,辨別器1111提供有脈寬矢量(向后)P1和

矢量元素V0、V1、V2、V3和V4的每一個被學習為0與1之間的實數(shù)(具有浮點)。(要學習的)刺激部分越大,矢量元素就越接近1。例如,一個矢量被獲取為如
的實數(shù),以作為具有信息O1=
的運動學習的結(jié)果。
此外,當從背部向前推動機器人1時,提供從此時產(chǎn)生的脈寬中獲得的矢量P2和打算運動的信息O2=
。當機器人1頸部被下推時,提供從此時產(chǎn)生的脈寬中獲得的矢量P3和打算運動的信息O3=
。當機器人1頸部被上推時,提供從此時產(chǎn)生的脈寬中獲得的矢量P4和打算運動的信息O4=
。此外,例如,還提供從不施加外力時出現(xiàn)的脈寬中獲得的矢量P0和打算運動的信息O0=[1,0,0,0,0]。將矢量P0和信息O0與上述矢量和信息進行比較,以學習打算的運動。
圖19至圖25示出脈寬的例子,其中水平軸顯示關(guān)節(jié)的位置,而垂直軸顯示由所謂的PWM脈沖獲得的值。
圖19顯示當機器人1處于站立位置時的脈寬(脈沖信號的值)。在圖中,“FR1”指示前右腿的第一關(guān)節(jié)(肩關(guān)節(jié))的位置,“FR2”指示前右腿的第二關(guān)節(jié)(膝關(guān)節(jié))的位置,“FR3”指示前右腿的第三關(guān)節(jié)(踝關(guān)節(jié))的位置。“FL1”指示前左腿的第一關(guān)節(jié)(肩關(guān)節(jié))的位置,“FL2”指示前左腿的第二關(guān)節(jié)(膝關(guān)節(jié))的位置,“FL3”指示前左腿的第三關(guān)節(jié)(踝關(guān)節(jié))的位置。“HR1”指示后右腿的第一關(guān)節(jié)(肩關(guān)節(jié))的位置,“HR2”指示后右腿的第二關(guān)節(jié)(膝關(guān)節(jié))的位置,“HR3”指示后右腿的第三關(guān)節(jié)(踝關(guān)節(jié))的位置。“HL1”指示后左腿的第一關(guān)節(jié)(肩關(guān)節(jié))的位置,“HL2”指示后左腿的第二關(guān)節(jié)(膝關(guān)節(jié))的位置,“HL3”指示后左腿的第三關(guān)節(jié)(踝關(guān)節(jié))的位置?!癏ead 1”、“Head 2”和“Head 3”分別指示頸關(guān)節(jié)的位置。上述情況還適用于圖20至圖25。因而,當機器人1處于一個狀態(tài)(姿態(tài)或運動)時,可以獲得總共15個脈寬。也就是,可以獲得如包括15維元素的矢量那樣的用于上述學習的矢量P。
當從背部向前推處于站立位置的機器人1時,產(chǎn)生具有如圖20所示寬度的脈沖。當從背部向后推處于站立位置的機器人1時,如此產(chǎn)生的脈沖寬度將是如圖21所示的那樣。當從頭部向上推處于站立位置的機器人1時,產(chǎn)生具有如圖22所示寬度的脈沖。當從頭部下壓處于站立位置的機器人1時,將產(chǎn)生具有圖23所示寬度的脈沖。當右腿支持處于站立位置的機器人1時,將產(chǎn)生具有如圖24所示寬度的脈沖。當左腿支持處于站立位置的機器人1時,產(chǎn)生具有如圖25所示寬度的脈沖。根據(jù)這些脈沖寬度,辨別器111檢測機器人1的相應姿態(tài),用于學習運動。
此外,機器人1包括如圖26所示的愉快/不愉快判斷單元112,以便象真實動物那樣進行運動學習。
從傳感器數(shù)據(jù)處理器102接收輸出時,愉快/不愉快判斷單元112判斷該數(shù)據(jù)是定義愉快的情緒值、還是定義不愉快的情緒值,并輸出相應的動作信息。例如,當情緒模型73中定義不愉快的情緒具有較大數(shù)值時,愉快/不愉快判斷單元112輸出將使動作避免不愉快的動作信息,當從背部向后推動機器人1時,愉快/不愉快判斷單元112將傳感器數(shù)據(jù)處理器102的輸出判斷為定義不愉快的情緒值,并且輸出轉(zhuǎn)換到“坐下”位置的動作信息。此外,當從背部向前推動或者從頸部下壓機器人1時,愉快/不愉快判斷單元112將來自傳感器數(shù)據(jù)處理器102的數(shù)據(jù)判斷為定義不愉快的情緒值,并輸出轉(zhuǎn)換到“伏臥”位置的動作信息。當向上提處于伏臥位置的機器人1的頸部時,愉快/不愉快判斷單元112將來自傳感器數(shù)據(jù)處理器102的數(shù)據(jù)判斷為定義不愉快的情緒值,并且輸出轉(zhuǎn)換到“坐下”位置的動作信息。當向上提處于坐下位置的機器人1的頸部時,愉快/不愉快判斷單元112將來自傳感器數(shù)據(jù)處理器102的數(shù)據(jù)判斷為定義不愉快的情緒值,并且輸出轉(zhuǎn)換到“站立”位置的動作信息。也就是說,當作用于機器人1的外力如此之大以致感覺不愉快時,機器人1將進行上述運動。動作生成器105根據(jù)上述動作信息生成動作。
像教導一條真狗或類似物一個姿態(tài)那樣,被施加動作或外力的機器人1將學習從它感覺到對這樣一種處理不愉快的當前位置轉(zhuǎn)換到任何其它位置。
需要說明的是,教導機器人1一個動作需要多次重復外力或動作的應用。此外,重復該教導或教導可以用于其它姿態(tài)(其它辨別器)。每一個辨別器被構(gòu)成具有例如分層的神經(jīng)網(wǎng)絡,用于一種學習。如圖27所示,例如一個三層神經(jīng)網(wǎng)絡包括輸入層、隱藏層和輸出層。在此情況下,學習或教導的過程將概述如下。
在輸入層,相應于輸入層形成傳感器信號或類似物被供應給每個神經(jīng)元。在隱藏層,提取經(jīng)輸入層的每一個神經(jīng)元發(fā)送的數(shù)據(jù)特征。具體地說,隱藏層中的每個神經(jīng)元備注輸入數(shù)據(jù)的某些特征,并提取用于估價。在輸出層,將來自隱藏層的神經(jīng)元的諸多特征組合在一起,以作出最終決定。
在上述三層神經(jīng)網(wǎng)絡中,建立基于反向傳播的學習,它適合于構(gòu)建例如辨別器。由此,通過在背部向后推動機器人1,向辨別器供應O1=
,后者將輸出一個接近
的數(shù)值(實數(shù))。
如上所述,機器人1可以經(jīng)過辨別單元111學習任意運動。因而通過學習彼此關(guān)聯(lián)的圖像和語音信號,機器人1可以響應給予的預定發(fā)音(語音信號),作出一個機器人相應于該預定發(fā)音已經(jīng)學習的動作。
(4-3)學習施加給機器人1的外力在上面的說明中,已經(jīng)說明了任意運動的學習。在任意運動的學習中,機器人1學習由所施加的外力推動機器人1的運動(姿態(tài)),并且響應給予的預定發(fā)音(語音信號)作出運動。下面將說明這種外力類型的學習。在學習被施加的外力的類型之后,當施加機器人1已經(jīng)學習的外力時,機器人1可以進行預定運動。具體地說,在機器人1已經(jīng)學習了用于轉(zhuǎn)換到坐下位置的施加到腰部的外力時,當用相當于該外力的外力作用于該機器人1的腰部時,該機器人將識別該外力輸入并且進行作為預定運動的例如坐下運動。下面將進一步說明外力的學習。
如圖28所示,為了學習外力,機器人1含有運動部件151;移動運動部件的關(guān)節(jié)單元152;檢測器153,檢測具有經(jīng)運動部件151施加的外力的關(guān)節(jié)單元152的狀態(tài);和學習單元160,彼此關(guān)聯(lián)的學習由檢測器153檢測的關(guān)節(jié)單元152的狀態(tài)和外力。在學習了關(guān)節(jié)單元152的狀態(tài)和外力之后,當施加外力時,機器人1可以根據(jù)關(guān)節(jié)單元152的狀態(tài)識別外力的類型。如圖6和圖8所示,運動部件151包括腿部單元3A至3D;頭部單元4和尾部單元5,這些部件與身體單元2結(jié)合并且由傳動器251至25n驅(qū)動。關(guān)節(jié)單元152包括諸多傳動器,具體地說是構(gòu)成諸多傳動器的諸多電動機。
由于上述結(jié)構(gòu),機器人1通過使用供應給電動機(傳動器)的PWM脈沖,可以學習外力。如上所述,在機器人1中,腿部單元3A至3D、頭部單元4和尾部單元5的每一個部件都用關(guān)節(jié)與身體單元2聯(lián)結(jié),它們是運動部件。腿部單元3A至3D的每一個包括與多個關(guān)節(jié)(肩關(guān)節(jié),膝關(guān)節(jié)和踝關(guān)節(jié))彼此聯(lián)結(jié)的多個運動部件;腿部單元3A至3D用諸多關(guān)節(jié)分別聯(lián)結(jié)到身體單元2的前左部、前右部、后左部和后右部;頭部單元4和尾部單元5分別用諸多關(guān)節(jié)聯(lián)結(jié)到身體單元2的前端和后端。能夠使運動部件運動的關(guān)節(jié)由傳動器251至25n組成。PWM脈沖信號被供應給電動機(被聯(lián)結(jié)的傳動器251至25n)。
PWM脈沖信號的寬度依賴于經(jīng)運動部件151(上述的每個單元)向其施加有外力的關(guān)節(jié)(電動機)152的狀態(tài)。即,它被計算為誤差或每個關(guān)節(jié)(電動機)的目標角度與實際角度之間的差值。由此,當外力被施加給機器人1時,誤差將是很大的,脈寬也是很大的。也就是說,當較大的外力施加于機器人1時,PWM脈沖信號的寬度將是很大的。因而,機器人1通過使用這種PWM脈沖信號來學習外力。檢測器153檢測PWM脈沖信號的寬度,作為經(jīng)運動部件151外力作用于其上的關(guān)節(jié)單元152的狀態(tài)。需要說明的是,由于PWM脈沖信號的寬度被計算為上述的每個關(guān)節(jié)(電動機)的目標角度和實際角度之間的誤差或差值,因此由檢測器153檢測的關(guān)節(jié)單元152的狀態(tài)可以說成是每個關(guān)節(jié)(電動機)的目標角度和實際角度之間的誤差或差值。還需要說明的是,可以作為圖8所示的信號處理電路14的一個功能和其它功能、或者通過軟件或目標程序?qū)嵤z測器153。
在該實施例中,施加給腿部單元3A至3D中的電動機(關(guān)節(jié))的PWM脈沖信號和施加給身體單元2和頭部單元4中的電動機(關(guān)節(jié))的PWM脈沖信號被用作在學習外力時的PWM脈沖信號,下面將要進一步說明。圖19至圖25示出施加給關(guān)節(jié)(電動機)的這種PWM脈沖信號的變化,用于學習施加給機器人的外力。正如通過比較圖20所示的當從背部向前推動機器人1時出現(xiàn)的脈沖寬度圖案和圖21所示的當從背部向后推動機器人1時出現(xiàn)的脈沖寬度圖案所看到的那樣,PWM脈沖的寬度通常是關(guān)于“0”(x軸)對稱的。
在外力學習中,當各種外力施加于機器人1時出現(xiàn)的PWM脈沖寬度的圖案(具體地說是矢量)被用作學習單元160中的學習數(shù)據(jù),其中神經(jīng)網(wǎng)絡被用于外力學習。該學習單元160由例如軟件或目標程序來實現(xiàn)。
對于神經(jīng)網(wǎng)絡,層連接型網(wǎng)絡的反向傳播神經(jīng)網(wǎng)絡被用于外力學習。反向傳播神經(jīng)網(wǎng)絡對圖案識別是高度自適應的。該實施例使用三層反向傳播神經(jīng)網(wǎng)絡,包括輸入層161、隱藏層(中間層)162和輸出層163,如圖29和圖30所示。
在三層反向傳播神經(jīng)網(wǎng)絡中,當學習外力后,信息(脈寬)Din從觸摸傳感器供應到輸入層161時,輸出層163將輸出與觸摸傳感器所供應的信息Din相對應的有關(guān)已經(jīng)學習的外力的類型的信息Dout。
三層反向傳播神經(jīng)網(wǎng)絡中的輸入層161、隱藏層162和輸出層163按下面將要說明的方式構(gòu)成。
輸入層161具有多個神經(jīng)元(該實施例中是18個神經(jīng)元)。也就是輸入層161被供應用于外力學習的18個數(shù)據(jù)。機器人1具有三種類型的當前姿態(tài),例如“站立”、“坐下”和“睡覺”。施加給每個關(guān)節(jié)(關(guān)節(jié)中的電動機)PWM脈沖信號的寬度有15種類型(12種類型(=3種類型×4)供4個腿單元使用,3種類型供頭部單元使用)。因此,總共18種類型的PWM脈沖寬度作為數(shù)據(jù)供給輸入層161。
用于關(guān)節(jié)狀態(tài)的外力學習的當前姿態(tài)依賴于機器人1的姿態(tài),也就是說,由于脈沖寬度依賴于機器人1的姿態(tài)。
輸入層161供應有一個圖案,它是包括如來自觸摸傳感器的信息DIn的各種脈沖寬度的矢量。需要說明的是,在該實施例中,由于輸入脈沖寬度在[-512,512]的范圍內(nèi)取值,因此它被下式(7)歸一化Input=(P+|Pmin|)/(Pmax+|Pmin|)………(7)其中,P是測量的脈沖寬度,Pmax最大脈沖寬度(512),Pmin是最小脈沖寬度(-512)。由于關(guān)于姿態(tài)的輸入數(shù)據(jù)取值為
(0或者1),因此脈中寬度不必歸一化。
隱藏層162具有多個神經(jīng)元(在該實施例中是17個神經(jīng)元)。神經(jīng)元的數(shù)量通過所謂的拇指(thumb)規(guī)則確定。也就是說,輸入層161中的神經(jīng)元數(shù)量和輸出層163中的神經(jīng)元數(shù)量被平均,然后平滑平均的結(jié)果,以確定神經(jīng)元數(shù)量。通過拇指規(guī)則確定的隱藏層162中的神經(jīng)元數(shù)量“numOfHidden”,由下式(8)給出numOFHidden=(numOfInput+numOfOuput)/2+2=14+α…(8)其中,“numOfInput”是輸入層161中的神經(jīng)元數(shù)量,“numOfOuput”是輸出層163中的神經(jīng)元的數(shù)量,α是通過平滑增加或較少的值。在式(8)中通過把“18”設置為輸入層161中的神經(jīng)元數(shù)量“numOfInput”和把“10”設置為輸出層153中的神經(jīng)元數(shù)量“numOfOuput”,將提供隱藏層162中“numOFHidden”17個神經(jīng)元。
輸出層163具有多個神經(jīng)元(該實施例中有10個)。由于輸出層163中有10個神經(jīng)元,機器人1通過學習可以識別10種類型的外力。也就是說,機器人1可以識別10種類型的外力,包括例如“ForceForward”(在背部向前推機器人1的外力,如圖20所示)“ForceBackward”(在背部向后推機器人1的外力,如圖21所示),“RightHandUp”(抬高右手的外力,如圖24所示),“LeftHandUp”(抬高左手的外力,如圖25所示),“BothHandUp”(抬高雙手的外力,未示出),“HeadUp”(抬高頭部的外力,如圖22所示),“HeadDown”(下推頭部的外力,如圖23所示),“HeadRight”(向右推頭部的外力,未示出),“HeadLeft”(向左推頭部的外力,未示出)和“Noforce”(未施加外力,如圖9所示)。
輸入層161、隱藏層162和輸出層163被構(gòu)成上述結(jié)構(gòu)。各種輸入/輸出函數(shù)可以在隱藏層162和輸出層163中使用,但是在該實施例中,使用所謂的S形函數(shù)。與所謂的閾(threhold)函數(shù)不同,S形函數(shù)具有如圖31所示的提供對輸入總和進行平滑改變的輸出的特征。
三層反向傳播神經(jīng)元網(wǎng)絡用來學習各種外力,如下所述。
外力學習是通過向網(wǎng)絡(學習單元160)提供一對如圖30所示的輸入矢量數(shù)據(jù)和教導信號矢量數(shù)據(jù)進行的。供應訓練者矢量數(shù)據(jù),使某些神經(jīng)元輸出“1”,而其它神經(jīng)元輸出“0”。也就是,“1”被供應給要被識別的類型的外力,而“0”被供應給所有其它類型的外力。
中間層或隱藏層162提供輸出yi(1),作為通過計算由下式(9)給出的S形函數(shù)“sigmoid()”得到的輸入和的結(jié)果,輸出層163提供輸出yj(2),作為通過計算由下式(10)給出的S形函數(shù)“sigmoid()”得到的輸入和的結(jié)果。下式(11)用來更新加權(quán),也就是,學習加權(quán)。S形函數(shù)“sigmoid()”是由下式(12)給出的函數(shù)。yj(1)=sigmoid(Σi=0numOfInputWijai)--(9)]]>yj(2)=sigmoid(Σi=0numOfHiddenWij(2)ai(1))--(10)]]>Wij(m+1)(t)=Wij(m+1)(t-1)-ϵyi(m)(t)Zi(m+1)+βwij(m+1)(t-1)(m=0,1)---(11)]]>
sigmoid(x)=1/(1+exp(-x))………………(12)其中,ai是每個輸入脈沖信號的寬度,zi是誤差反向傳播輸出,ε是學習函數(shù),β是運動系數(shù)。學習函數(shù)(ε)和運動系數(shù)(β)是對學習速度影響很大的因數(shù)。例如,在如該實施例構(gòu)成的機器人1中,學習速度可以被定為具有ε=0.2和β=0.4的最佳值。
輸入矢量數(shù)據(jù)的輸入和訓練者矢量數(shù)據(jù)的輸入被重復多次,直至供應給神經(jīng)網(wǎng)絡的輸入矢量數(shù)據(jù)與訓練者矢量數(shù)據(jù)之間的差值或誤差小于閾值。然后,結(jié)束學習。例如,當下式(13)給出的平均誤差小于閾值時,結(jié)束該學習誤差=(∑|te-a|2)/numOfOutput………………(13)其中a是輸入矢量數(shù)據(jù),te是訓練者矢量數(shù)據(jù)。
例如,機器人1被設計成在在線學習(連續(xù)學習)中重復10次學習同樣的數(shù)據(jù)。另外,將機器人1設計成連續(xù)學習大約20次相同圖案的數(shù)據(jù)。這樣,機器人1將學習總共大約800個樣本。
圖32示出學習次數(shù)和平均誤差之間的關(guān)系示例。如圖32所示,當學習已經(jīng)進行了約50次時平均誤差最小,這意味著進行50次嘗試后結(jié)束學習。需要說明的是,通常隨機地給出加權(quán)因數(shù)的初始值,它依賴于學習應當重復多少次的初始值。也就是說,根據(jù)該初始值,該學習在上述情況中將嘗試約50次結(jié)束,但在其它情況中學習約嘗試150次。
三層反向傳播神經(jīng)網(wǎng)絡按上述方式學習外力。因而,機器人1可以接收多種類型的輸入外力(多次供應一個外力)并且學習與關(guān)節(jié)單元152的狀態(tài)(例如PWM脈寬)關(guān)聯(lián)的多個輸入外力,以識別(分類)外力。需要注意的是,例如機器人1通過所謂的通用性檢驗證實外力是否已經(jīng)被成功地分類。
具體地說,例如,當用外力在機器人1腰部作用于機器人1時,通過上述學習識別施加到腰部的外力被包含在曾經(jīng)學習過的多種外力之中。具體地說,由施加在腰部的外力產(chǎn)生的脈寬(圖案)對應于供應給每一個關(guān)節(jié)單元152的任何一個PWM脈寬(圖案),從而按對應的坐下運動坐下。由此用戶通過觸摸(外力)發(fā)出的指令自由度可以保證機器人1進行許多類型的運動。
需要注意的是,在上述說明中已經(jīng)說明了使用三層反向傳播神經(jīng)網(wǎng)絡的學習,但是學習單元當然還可以使用任何其它的學習方法。例如,學習單元可以使用SVM(support vector machine,支持矢量機)分類施加給機器人1的外力。SVM是如在感知器中用于線性分類外力的一種方法。具體地說,SVM在非線性空間中映射一次數(shù)據(jù),并且在該空間確定超平面分離,因而可以解決實際的非線性問題。
典型地,在圖案識別中,當試驗樣本x=(x1,x2,x3,…,xn)時,可以確定式(14)給定的識別函數(shù)f(x)f(x)=Σj=1nvjxj+b------(14)]]>假定檢查(supervise)標記是y=(y1,y2,y3,…,yn),將在下式(15)給出的約束條件下解決使‖v‖2最小的問題約束yj(vTxi+b)≥1 ……(15)這樣一種約束問題可以用拉格朗日的待定因子方法解決。通過引入拉格朗日因子,該問題可以被表示為下式(16)L(w,b,a)=12||v||2-Σi=1tai((xiTv+b)-1)------(16)]]>通過在下式(17)中對b和v求偏微分,可以解決下式(18)給出的二次規(guī)劃問題。該約束由下式(19)給出。
L/b=L/v=0 ………(17)maxΣai-1/2ΣαiαjyiyjxiTxj---(18)]]>約束αi≥0,∑αiyi=0 ………(19)當特征空間中的維數(shù)小于訓練樣本數(shù)目時,引入一個松弛變量ξ≥0,將約束改變到由下式(20)給出的那樣約束yi(vTxi+b)≥1-ξi…………(20)為了最優(yōu),將式(21)給出的目標函數(shù)最優(yōu)化1/2‖v‖2+C∑ξi…………(21)其中C是指定放松約束的范圍的系數(shù)。用于C的數(shù)值必須通過試驗來確定。涉及拉格朗日因子α的問題被轉(zhuǎn)變?yōu)橄率?22)。約束由下式(23)給出。maxΣai-1/2αiαjyiyjxiTxj------(22)]]>約束0≤αi≤C,∑αiyi=0 ………(23)然而,對于上述操作,不能解決非線性問題。所以,引入是非線性映射函數(shù)的核函數(shù)K(x,x’),數(shù)據(jù)在高維空間中被映射一次并且在該空間中線性分離。因而,數(shù)據(jù)可以被處理為按原維數(shù)線性地分離。使用映射Φ,可以通過下式(24)給出核函數(shù),并且由下式(25)給出判別函數(shù)。
K(x,x’)=Φ(x)TΦ(x’) …………(24)f(Φ(x))=vTΦ(x)+b=∑αiyiK(x,xi)+b…………(25)外部函數(shù)是通過計算由下式(26)給出的函數(shù)學習的,其約束由下式(27)給出max∑ai-1/2∑αiαjyiyjK(xi,xj) ……(26)約束0≤αi≤C,∑αiyi=0 ……(27)該核函數(shù)可以是由下式(28)給出的高斯核函數(shù)K(x,x′)=exp(-|x-x′|2σ2)-------(28)]]>動作可以根據(jù)上述原理通過SVM來分類。
在上述說明中,已經(jīng)描述了機器人1根據(jù)關(guān)節(jié)單元的狀態(tài)學習外力的情況。然而,也可以僅根據(jù)關(guān)節(jié)的狀態(tài)通過檢測作用于機器人1上的外力來進行學習。為此,機器人1包括檢測移動運動部件的關(guān)節(jié)的狀態(tài)的檢測器,和根據(jù)關(guān)節(jié)狀態(tài)檢測器檢測的關(guān)節(jié)狀態(tài)檢測作用于運動部件上的外力的檢測器。這些檢測器可以是圖28所示的檢測器153。
按上述方式構(gòu)成的機器人1可以根據(jù)關(guān)節(jié)的狀態(tài)檢測已經(jīng)施加給關(guān)節(jié)的外力。關(guān)節(jié)狀態(tài)檢測器和外力檢測器可以通過例如軟件或目標程序來實施。因此,機器人1可以不用專用檢測器(硬件)檢測施加給它的外力。也可以說成是機器人1不使用任何特定元件就可以學習外力。
需要注意的是,上述機器人1中的外力檢測系統(tǒng)是所謂的外力檢測器。該外力檢測系統(tǒng)當然可以被應用于除機器人1之外的其它裝置。
在該實施例中,供應給形成腿部單元3A至3D的關(guān)節(jié)的電動機的PWM脈沖信號和供應給形成身體單元2和頭部單元4的關(guān)節(jié)的電動機的PWM脈沖信號被用于學習外力。然而,本發(fā)明不局限于這些PWM脈沖信號,供應給形成任何其他關(guān)節(jié)的電動機的PWM脈沖信號也可以被使用。
此外,在上述說明中,已經(jīng)描述了用于學習外力的PWM脈沖信號。然而,本發(fā)明不局限于任何PWM脈沖信號,也可以將依據(jù)外力變化的信號用于學習該外力。
(4-4)識別語音信號(語音識別單元的詳細說明)下面,將詳細說明語音信號的識別。為了識別語音信號,如圖33所示,機器人1包括語音(聲音)信號輸入單元121;特征提取器122和HMM單元123。特征提取器122和HMM單元123被包含在語音識別單元101中,如圖15所示。
聲音信號輸入單元121被供應機器人1周圍的聲音。即,例如,該單元是上述的麥克風23。來自聲音信號輸入單元121的聲音信號(語音信號)被輸出給特征提取器122。
特征提取器122檢測聲音信號的特征,并將檢測的特征輸出給下游HMM單元123。
HMM單元123采用根據(jù)檢測的特征分類輸入的聲音信號的隱含馬爾可夫模型。例如,它根據(jù)多個類別識別聲音信號。然后,HMM單元123輸出根據(jù)每一個類別識別的結(jié)果為相應于每個字類別的概率,例如作為矢量值。
使用上述部件,機器人1識別來自麥克風23或類似物的輸入語音為音素序列。
然后將語音識別單元101的HMM單元識別的語言信息[S0,S1,S2]和已經(jīng)由傳感器數(shù)據(jù)處理器102獲取的關(guān)于運動的信息[V0,V1,V2,V3,V4]一起供應給圖34所示的關(guān)聯(lián)存儲器/檢索存儲器104。
在學習中,關(guān)聯(lián)存儲器檢/索存儲器104相互關(guān)聯(lián)地存儲上述信息。學習之后,關(guān)聯(lián)存儲器/檢索存儲器104將根據(jù)輸入信息輸出動作信息,例如,矢量值形式的動作信息[B0,B1,B2,B3]。
如圖35所示,例如,在作為語音識別結(jié)果的語言“向后”和作為動作獲取結(jié)果的矢量
已經(jīng)被供應給關(guān)聯(lián)存儲器/檢索存儲器104用于學習的情況下,如果在學習之后將發(fā)出的語言“向后”供應給關(guān)聯(lián)存儲器/檢索存儲器104,則關(guān)聯(lián)存儲器/檢索存儲器104將輸出用于“向后”運動的動作信息
。
在上述說明中,已經(jīng)說明了機器人1通過關(guān)聯(lián)檢索進行的學習。下面將描述通過便于識別目標對象的共享關(guān)注來進行的學習。
(5)共享關(guān)注學習語音或圖像的機器人1被設計用來根據(jù)背景噪聲識別特定語音或圖像,并取作目標對象。共享關(guān)注便于識別這樣的目標對象。例如,通過生成受訓者(機器人1)可以根據(jù)其指定目標對象的刺激,比如震動或搖擺目標對象(視覺刺激)或發(fā)音(聲音刺激),能夠形成共享關(guān)注。
對于共享關(guān)注,如圖36所示,機器人1包括圖像信號輸入單元131;分段單元132和目標對象檢測器133。分段單元132和目標對象檢測器133的功能是識別目標對象。上述的動作生成器105根據(jù)如此識別并存儲在關(guān)聯(lián)存儲器/檢索存儲器104中的目標對象信息和新對象的信息提供動作。
圖像信號輸入單元131拍攝機器人1的周圍環(huán)境。具體地說,該單元是如圖8所示的CCD攝像機20。來自圖像信號輸入單元131的圖像信號被供應給分段單元132。
分段單元132對圖像信號進行分段,例如,根據(jù)顏色分段?!胺侄巍笔怯糜谧R別圖像中的區(qū)域和檢查該區(qū)域的特征或者映射特征空間中的特征。分段能夠辨別目標對象和拾取的圖像中的背景。由分段單元132如此分段的圖像信號被供應給下游的目標對象檢測器133。
目標對象檢測器133從上述分段的圖像信息中檢測(識別)顯著的部分(目標對象)。檢測器133檢測例如運動部分,也就是隨時間改變的部分,作為當該部分滿足一定需求時的來自分段圖像的目標對象。下面將進一步說明目標對象的檢測。
首先,為分段圖像中的特定區(qū)域的運動部分(隨時間變化部分)設置注意量級?!白⒁饬考墶笔悄繕藢ο笞R別的索引。當根據(jù)運動識別目標對象時,該注意量級將隨該運動而變化。
該特定區(qū)域被跟蹤,以便根據(jù)其注意量級判斷它是否是目標對象。當注意量級滿足一定需求時,機器人1將該特定區(qū)域識別為目標對象,即,使機器人1“注意”它。
為了識別與其運動相一致的目標對象,當使一條狗注意該目標對象時,該真狗或類似物的訓練者將搖動或擺動該目標對象吸引狗的注意。例如,當教導受訓者“玻璃杯”時,訓練者將搖動它,同時向受訓者發(fā)出“玻璃杯”的聲音。
目標對象檢測器133跟蹤特定區(qū)域,當其注意量級像預定的那樣,即,當運動改變預定量時,目標對象檢測器133將特定區(qū)域識別為目標對象,使機器人1關(guān)注該特定區(qū)域。具體地說,當注意量級等于或超過閾值時,機器人1將關(guān)注該特定區(qū)域。
如上所述,目標對象檢測器133借助分段單元132設置用于特定區(qū)域的注意量級,以檢測(識別)目標對象。
圖像信號輸入單元131包括能夠使機器人1進行共享關(guān)注的分段單元132和目標對象檢測器133。
因此,如上所述,機器人1能夠恰當?shù)刈R別目標對象,以恰當?shù)嘏c圖像信息或動作相關(guān)聯(lián)地學習它。
在上述實施例中,目標對象是根據(jù)由機器人1共享關(guān)注中的目標對象的運動來識別的。然而,本發(fā)明不局限于該識別方式。例如,可以根據(jù)語音識別目標對象。在此情況下,當語音出現(xiàn)時,機器人1將注意力集中到該語音的起源,并將該語音識別為目標對象。例如,設置用于語音,即,該語音的方向和該語音的音量的注意量級,并且當該方向和音量滿足一定要求時將該語音識別為目標對象。
此外,對目標對象的關(guān)注可以隨時間消逝而減弱。作為選擇,也可以設置為,當與目標對象的關(guān)聯(lián)變得平穩(wěn)時減弱對該目標對象的關(guān)注。由此能夠關(guān)注新的刺激(圖像輸入和語音輸入)并且觸發(fā)(開始)學習。
另外,可以將較大的數(shù)值設置為當在一定條件下、例如隨著時間消逝對目標對象的注意較弱時的閾值。此外,可以在同一時間為兩個或多個目標對象設置注意量級。該注意量級可以被設置給對象的運動或語音。例如,可以為一個對象設置運動的注意量級,同時為另一個對象設置語音的注意量級。
因而,當一個被注意的對象(特定區(qū)域)正在被檢查(例如,正在檢查諸如顏色、形狀等的特征)的時候,可以通過另一個刺激(例如語音或圖像)為任何其它對象設置注意量級。應當注意的是,由于當前正在注意的對象具有如上所述的較高的注意量級,因此即使在通過另一個刺激為另一個對象設置注意量級時,也可以連續(xù)檢查事先選擇的對象片刻。
當目前正在注意的對象的注意度已經(jīng)減弱時,機器人1的關(guān)注可以轉(zhuǎn)到具有另一個刺激的對象,即,其注意度已經(jīng)增加的對象。
此外,可以用目標對象的運動作為刺激、以及用用戶或訓練者的手指作為刺激來實施共享關(guān)注。也就是說,手指指點的對象可以被識別為目標對象。
上述的共享關(guān)注是按照人與人之間的正常交互提出的。在此情況下,例如經(jīng)過分段檢測的皮膚顏色區(qū)域被取作特定區(qū)域,并且關(guān)注該區(qū)域。下面結(jié)合圖37進行說明。
如圖37所示,假定已經(jīng)在一種環(huán)境中拾取了其中一個人用手142指向錐形物141的圖像。需要說明的是,在下面將要說明的處理中,一個對象可以經(jīng)歷一次圖像處理,例如,考慮到計算速度等,為圖像處理提供一個低通濾波器。
皮膚顏色部分從圖像中提取。在此情況下,顏色特征空間被用來檢測皮膚顏色部分的特征,并且從該圖像中提取皮膚顏色部分。因而,如圖37B所示,手142被提取。
然后,如圖37C所示,確定手142的縱向方向,因為指向?qū)ο蟮氖值男螤钔ǔJ情L方形的。例如,縱向方向被確定為如圖37C的直線143所指示的那樣。
此外,如此確定的縱向方向在如圖37D所示的原始圖像中被設置,以識別如圖37E所示的對象。也就是,手指所指的錐形物141被識別。例如,手指端部的圖像被取下作為一個樣本,在顏色特征空間中識別圖像的顏色,從而識別具有該顏色的區(qū)域。由此,能夠識別具有相同顏色,例如黃色的錐形物141。
此外,共享關(guān)注不局限于上述的情況,也可以是關(guān)注例如訓練者或用戶的視線所達到的對象。
此外,可以提供用于檢查機器人1是否進行共享關(guān)注的裝置。也就是,當目標對象被共享關(guān)注識別時,機器人1作出預定動作。例如,當機器人1已經(jīng)識別(跟蹤)為教導機器人1而搖動的對象時,可以使機器人1作出諸如搖動或點頭的動作,從而通知用戶或訓練者機器人1已經(jīng)識別了該對象。因此,訓練者或用戶能夠確認機器人1是否已經(jīng)成功跟蹤或者識別訓練者為了教導而向機器人1顯示的對象。
如上所述,機器人1可以通過這樣的與用戶或訓練者的交互作用估價它自己的動作,并且自己學習最適當?shù)膭幼鳌?br> 此外,機器人1可以相互關(guān)聯(lián)地存儲動作和其它任何刺激,比如對于傳感器的語音,以便僅響應該語音進行動作。
下面將結(jié)合圖38詳細說明關(guān)聯(lián)存儲器系統(tǒng)。圖38所示的關(guān)聯(lián)存儲器系統(tǒng)被設計來存儲和檢索四個感覺通道輸入圖案(pattern)(顏色、形狀,語音和本能)。正如將從圖38所看到的那樣,某些圖案和原型被事先準備,用于進入包括顏色識別單元201、形狀識別單元202和語音識別單元203的每一個通道,并且例如將二進制ID(識別信息)附加在每個原型上。識別單元201至203的每一個識別輸入圖案對應哪一個原型,并且向關(guān)聯(lián)存儲器210的短期存儲器211輸出輸入圖案,即,顏色原型、形狀原型和語音原型的ID。來自語音識別單元203的語音原型ID經(jīng)過語義轉(zhuǎn)換器(SC)204到達短期存儲器211,與此同時音素信號也送入該短期存儲器211。語義變換器(SC)204作出語義和語法標記。至于本能,本能狀態(tài)模型(ISM)單元205提供本能(例如,好奇心)的變化(δ值),作為輸入給關(guān)聯(lián)存儲器210的短期存儲器211的模擬值。
關(guān)聯(lián)存儲器210包括短期存儲器211,長期存儲器212和關(guān)注存儲器213。此外,在關(guān)聯(lián)存儲器系統(tǒng)中,提供了與短期存儲器211關(guān)聯(lián)的釋放機構(gòu)(RM)221和舉止網(wǎng)絡(BeNet)222。RM(釋放機構(gòu))221和BeNet(舉止網(wǎng)絡)222也被稱作“動作生成器”。
在圖38所示的關(guān)聯(lián)存儲器系統(tǒng)中,顏色識別單元201將顏色原型ID附加到由顏色分段模塊分段的每一個對象上,并且將數(shù)據(jù)供應給關(guān)聯(lián)存儲器210。語音識別單元203輸出由用戶或訓練者發(fā)音的字的原型ID,并將它與發(fā)音的音素序列一同發(fā)送給關(guān)聯(lián)存儲器210。因而,該存儲和關(guān)聯(lián)能夠使機器人1發(fā)出字音。來自每個通道的輸入信息被存儲在關(guān)聯(lián)存儲器210中的短期存儲器211中,并且保持預定時間,例如保持相當于一百個對象的時間。
關(guān)聯(lián)存儲器210檢索過去是否已經(jīng)存儲了輸入圖案。如果關(guān)聯(lián)存儲器210可以檢索它,則將該輸入圖案按照原樣發(fā)送給RM 221和BeNet 222。當關(guān)聯(lián)存儲器221可以檢索該輸入圖案時,將一個檢索方向附加到輸入圖案上,并且將數(shù)據(jù)發(fā)送給RM 221和BeNet 222。
BeNet 222檢查來自顏色識別單元201的顏色分段模塊的標志(共享關(guān)注標志),轉(zhuǎn)換成鎖存命令,而不論是否存在用戶按上述方式用手指作出的共享關(guān)注,并且將該鎖存命令發(fā)送給關(guān)聯(lián)存儲器210。由于從BeNet 222供應了鎖存命令,因此關(guān)聯(lián)存儲器210基于幀數(shù)搜索與該幀數(shù)匹配的對象,并且將該對象存儲到關(guān)注存儲器中。如果本能的δ值足夠大,則將它從關(guān)注存儲器213存儲到長期存儲器212。本能的δ值可以取模擬值,例如0至100。通過存儲80的δ值,可以檢索數(shù)值80。
下面將結(jié)合圖39詳細說明關(guān)聯(lián)存儲器,圖39示出兩層分層神經(jīng)網(wǎng)絡的一個實例。圖39所示的實例是競爭學習網(wǎng)絡,包括作為第一層的輸入層231和作為第二層的競爭層232,其中輸入層231的第i單元(神經(jīng)元)與競爭層232的第j單元之間的相關(guān)加權(quán)是Wji。該競爭學習網(wǎng)絡以兩種模式工作存儲和檢索。在存儲模式中,競爭地存儲輸入圖案;在檢索模式中,從部分輸入圖案中檢索過去存儲的圖案。在輸入側(cè)提供有與顏色、形狀、語音和本能的輸入x1,x2,…,xm相對應的m個神經(jīng)元。例如,當提供20個神經(jīng)元用于顏色原型ID、形狀原型ID和語音原型ID的每一種以及提供6個神經(jīng)元用于本能類型時,該神經(jīng)元總計為66個(20+20+20+6)。競爭層232中的每個神經(jīng)元描述一個符號,競爭層232中的神經(jīng)元的數(shù)量等于可以被存儲的神經(jīng)元或圖案的數(shù)量。在競爭學習網(wǎng)絡中,原型ID和本能類型可以被組合成48,000個圖案(=20×20×20×6)。例如,事實上在競爭學習網(wǎng)絡中應當提供約300個神經(jīng)元。
下面解釋存儲模式。假定輸入層231與競爭層232之間的加權(quán)Wji取0至1之間的值。最初的關(guān)聯(lián)加權(quán)是隨機確定的。存儲(儲存)是通過選擇在競爭層中競爭獲勝的神經(jīng)元并且通過增加所選神經(jīng)元與輸入神經(jīng)元之間的關(guān)聯(lián)的強度(force)(關(guān)聯(lián)加權(quán)Wji)完成的。當為輸入圖案矢量[x1,x2,…xn]識別相應于例如神經(jīng)元x1的原型ID(第一顏色原型ID)時,該神經(jīng)元x1被觸發(fā),然后將順序觸發(fā)為形狀和語音按上述相同方式識別的神經(jīng)元。觸發(fā)的神經(jīng)元取值“+1”,而未被觸發(fā)的神經(jīng)元取值為“-1”。
通過計算下式(29)在輸入側(cè)為神經(jīng)元x1確定輸出(競爭)神經(jīng)元yj的值yi=Σi=0numOfInputWjiXi-------(29)]]>此外,依據(jù)下式確定將贏得競爭的神經(jīng)元max{yi}獲勝神經(jīng)元與輸入神經(jīng)元之間的關(guān)聯(lián)根據(jù)下列Kohonen更新規(guī)則進行更新ΔWji=α(x1-Wji)其中α學習系數(shù)Wji(new)=ΔWji+Wji(old)用L2Norm歸一化結(jié)果,以提供下式(30)Wji(new)=Wji(new)Σi=0numOfInputWji2--------(30)]]>關(guān)聯(lián)加權(quán)指示所謂的學習本能,并且是一個“存儲(memory)”。
在該競爭學習網(wǎng)絡中,學習系數(shù)是α=0.5。當相似的圖案順序地出現(xiàn)在網(wǎng)絡上時,可以檢索曾經(jīng)存儲過的圖案,并且?guī)缀鯖]有失敗。
需要說明的是,關(guān)聯(lián)存儲應當是在連續(xù)學習的處理中,頻繁存儲的圖案的存儲將更強,而不頻繁存儲的圖案的存儲將更弱。在本實施例中采用這樣的關(guān)聯(lián)存儲。也就是,通過調(diào)整學習系數(shù)和關(guān)聯(lián)存儲可以調(diào)整該存儲。例如,當為圖案設置小系數(shù)時,需要一個用于相對強存儲的出現(xiàn)時間(epoch)。此外,能夠相應于出現(xiàn)時間降低學習系數(shù),例如,降低當出現(xiàn)時間較大時為圖案初始設置的大學習系數(shù)。因而,未經(jīng)常出現(xiàn)的圖案的存儲不需要更新許多次,對于存儲將成為待定的結(jié)果,將檢索不同于已經(jīng)存儲的圖案的圖案,或者不能達到用于檢索的檢索閾值。然而,由于不能夠獲得新符號或圖案,因此靈活的關(guān)聯(lián)存儲系統(tǒng)可以被實施,即使其容量受到限制。
下面將解釋檢索模式。
假定某些輸入圖案矢量[x1,x2,…xn]出現(xiàn)在關(guān)聯(lián)存儲系統(tǒng)。輸入矢量可以是原型ID或原型ID的似然或概率。輸出(競爭)神經(jīng)元yj的值通過計算關(guān)于輸入側(cè)的神經(jīng)元xi的上式(29)來確定。根據(jù)每個通道的似然,競爭神經(jīng)元的觸發(fā)值也描述似然。重要的是,來自多個通道的似然輸入可以連結(jié)在一起,以確定一般似然。在該實施例中,只檢索一個圖案,并且通過計算下式確定獲勝神經(jīng)元max{yj}如此確定的神經(jīng)元的編號對應于符號的編號,并且通過逆矩陣的計算檢索輸入圖案,也就是Y=W·XX=W-1·Y=WT·Y下面將說明輸入圖案出現(xiàn)和耦合系數(shù)的編號。
在該實施例中,將學習系數(shù)設置高數(shù)值,然后立刻著手存儲已出現(xiàn)的圖案。學習嘗試的次數(shù)和此刻的耦合系數(shù)之間的關(guān)系被檢查。還可以通過計算上式(29)確定輸入圖案與競爭層中符號神經(jīng)元之間的耦合系數(shù)。
圖40示出被輸入圖案激活的神經(jīng)元與已經(jīng)獲得符號的競爭層中的神經(jīng)元之間的關(guān)系(激活輸入,active input),和未被激活的神經(jīng)元與關(guān)聯(lián)層中的神經(jīng)元之間的關(guān)系(未激活輸入)。在圖40中,水平軸指示出現(xiàn)時間,而垂直軸指示激活。正如從圖40看到的那樣,在激活輸入的情況下,出現(xiàn)時間越大,輸入圖案與符號神經(jīng)元之間的關(guān)聯(lián)就變得越強。這是因為,在第一出現(xiàn)時間,較大地更新了該存儲,以便在第二出現(xiàn)時間,突然增強該關(guān)聯(lián)。通過設置較低的學習系數(shù)將得到平穩(wěn)的激活輸入的曲線。然而,在未激活輸入的情況下,與未被新圖案激活的神經(jīng)元的關(guān)聯(lián)較弱。
需要說明的是,建立關(guān)聯(lián)存儲系統(tǒng)應當考慮出現(xiàn)時間以及頻繁出現(xiàn)的圖案的出現(xiàn)頻度,該頻繁出現(xiàn)的圖案最好根據(jù)優(yōu)先原理被存儲,因為存儲容量是固定的(有限的)。關(guān)于這一點,最好引入遺忘函數(shù)。例如,因諸如來自識別單元的噪聲之類的非線性因素而造成已經(jīng)錯誤存儲的圖案僅出現(xiàn)一次,但也許不能被存儲,并且更優(yōu)先地存儲新近出現(xiàn)的重要圖案,同時遺忘出現(xiàn)時間短和出現(xiàn)頻度低的圖案。
應當注意的是,在該實施例中,學習系數(shù)被固定,并且根據(jù)閾值檢驗輸入圖案是否是新的,但是可以改變該學習系數(shù)并且將它公式化以確定閾值。
下面將說明對許多輸入圖案的響應。
表1中示出當各種圖案被供應給關(guān)聯(lián)存儲系統(tǒng)時,對其操作進行檢驗的結(jié)果。
表1


在表1中,顏色、形狀、語音和本能中每一個的原型ID用如1,2,…的數(shù)字指示,而被檢索的原型ID則用加括號的數(shù)字如(1),(2),…指示。
正如將從表2中可以看到的那樣,在最初存儲輸入圖案[1,1,1,1]之后,當顏色“1”和形狀“3”被第五出現(xiàn)供應時,只根據(jù)顏色1檢索圖案[1,3,(1),(1)]。然而,對于圖案[1,3,3,1]被第六出現(xiàn)存儲之后的第七出現(xiàn)來說,則響應顏色“1”和形狀“3”的輸入檢索圖案[1,3(3),(1)]。
當存儲容量是20個符號時,正常地存儲如表2所示的20種輸入圖案,但是當出現(xiàn)如表3所示的多于20種輸入圖案(總共400種圖案)時,將改寫早期存儲的如[1,1,1,1]的符號,同時將作為一個存儲保持后來學習的圖案。
表2

表3


如表3所示,只能獲得(保持)在最后學習的符號之前學習的20個符號。
假定一個符號是否是新符號是根據(jù)條件“一個輸入圖案,其中兩個或多個神經(jīng)元在激活方面是不同的”來進行判斷的,對例如顏色和形狀的任何一個彼此不同的多個事物不能彼此一致地命名。然而,在這些事物其顏色和形狀都互不相同的情況下,它們可以被彼此一致地命名。也就是說,圖案[1,1,1,1]和[2,1,1,1]不能被同時存儲,而圖案[1,1,1,1]和[2,2,1,1]可以被同時存儲。在此情況下,可以存儲如表4的輸入圖案。
表4

在上面已經(jīng)描述的關(guān)聯(lián)存儲系統(tǒng)中,由于存儲容量被限制,因此應該有效利用。為此目的,頻繁出現(xiàn)或使用的圖案最好應當優(yōu)先存儲。
此外,最好是,出于存儲容量的考慮,它應當做到能夠遺忘未被存儲的圖案,而存儲重要的新輸入圖案。為此,應當使用下面的耦合系數(shù)遺忘函數(shù)fWnew=f(Wold)其中Wnew是新的耦合系數(shù),Wold是舊耦合系數(shù)。最簡單的遺忘函數(shù)是每當出現(xiàn)一個圖案時,減少與競爭層中失敗神經(jīng)元的耦合系數(shù)。例如,新耦合系數(shù)Wnew可以按使用舊耦合系數(shù)Wold和遺忘耦合系數(shù)Wforget的下式來確定Wnew=f(Wold)=Wold-Wforget由此,可以減弱與未出現(xiàn)的圖案的耦合,并且能夠遺忘不頻繁使用的不重要的圖案。對于具有人類特點的機器人,它是自然的,并且最好根據(jù)人類大腦生理學領域的研究結(jié)果設置遺忘函數(shù)f。
該實施例已經(jīng)對字(名詞)的存儲作了說明。然而,它最好考慮存儲意圖和一段情節(jié)以及獲得動詞。例如,通過獲取“踢”的動作來獲得字“踢”。
為了判斷輸入圖案是否是新的,將為競爭層中獲勝神經(jīng)元的激活設置閾值。然而,由于它必需重新調(diào)整該激活,作為輸入通道增加的數(shù)量,因此最好在例如執(zhí)行程序的進程中自動計算激活。
此外,在輸入通道數(shù)已經(jīng)增加到多模態(tài)的情況下,最好考慮每個通道的歸一化。
下面將說明本發(fā)明的機器人的舉止,涉及38中的ISM(內(nèi)部狀態(tài)模型)單元205。也就是,在應用行為學方法決定舉止的機器人中,根據(jù)下面將要詳細說明的外因因素和內(nèi)因因素實現(xiàn)用于檢查動作創(chuàng)建的操作檢驗。
在該實施例中,分別使用了八種用于內(nèi)部狀態(tài)的樣板(gauge)和對應于這八種樣板的八種本能。這八種樣板包括Nourishment(食物),Movement(運動),Urine(尿),Tiredness(疲倦),Affection(友愛),Curiosity(好奇心)和Sleepy(困倦),八種本能包括Hunger(饑餓),Defecation(通便),Thirst(口渴),Urination(撒尿),Exercise(鍛煉),Affection(友愛),Curiosity(好奇心)和Sleepy(困倦)。
本能狀態(tài)隨著例如由生物周期性通知的時間消逝而變化,或者隨著檢測器輸入和成功/失敗而變化。變化的范圍是0至100,變化的程度依賴于例如personality_gauge.cfg和personality_perception.cfg中的系數(shù)。
此外,當即使用已經(jīng)達到最大值的愿望也不能進行動作時,建立挫折(Frustration);當樣板如期變化時,則清除該挫折。
在操作檢驗中,依據(jù)圖41所示的多個片段的分層結(jié)構(gòu)(樹結(jié)構(gòu))形成的內(nèi)容樹被用作采用行為學方法的動作選擇/決定系統(tǒng)。內(nèi)容樹包括,從頂部到底部的,一個系統(tǒng)、子系統(tǒng)、模式和模塊。較高層中的動作的多個部分是諸如愿望的抽象動作,而較低層中動作的多個部分是實現(xiàn)這些愿望的具體動作。圖41所示的樹是為基于行為模型的最小動作和用于學習的檢驗設計的,該模型使用語音識別和操作檢驗轉(zhuǎn)換到樹。操作檢驗用圖41中的樹支持的本能和相應的樣板進行的,即,該本能包括Hunger(饑餓)、Affction(友愛)、Curiosity(好奇心)和Sleepy(困倦),相應樣板包括Nourishment(食物)、Affection(友愛)、Curiosity(好奇心)和Sleepy(困倦)。需要說明的是,在實際的操作檢驗中,代碼被用來指示模塊執(zhí)行中的成功或失敗的標志(標準),并且樣板與本能之間使用線性對應,但是本發(fā)明不限于這些方式。
在該實施例中,沿多個軸線表達情緒。具體地說,刺激(Activation)和愉快(Pleasantness)被用作軸線,此外還使用了Certainty(可信度)。即,一個情緒沿著三個軸線(即,三維)來表達。刺激是生物被激活或困倦的程度,依賴于主要在生物中發(fā)現(xiàn)的生物周期;愉快是指示本能有多少被實現(xiàn)或未實現(xiàn)的程度;可信度是機器人當前關(guān)注的事物確實性如何的程度。為了確定愉快,使用了上述八種樣板和八種本能(然而,在操作檢驗中至多使用四種樣本或四種本能)。刺激、愉快和可信度的每一個取落入-100至100范圍內(nèi)的值,并且愉快和可信度隨著時間消逝而變化,以便總是取值“0”。另外,包括在本能中的刺激取值“0”,并且生物周期取實際上的初始值。
愉快反映本能的實現(xiàn)。當存在機器人正在關(guān)注的事物時,使用關(guān)于可視對象的實際可信度,刺激基本上依賴于生物周期的值,但是當困倦已經(jīng)變化時,刺激隨困倦變化的結(jié)果而變化。
在該實施例中,上述操作被限制,使生物周期僅靠刺激來反映,在此情況下可信度在0至100的范圍內(nèi)變化。當然,本發(fā)明不限于這些方式。
下面將結(jié)合圖42至44說明關(guān)于睡覺和吃飯的操作檢驗的第一實例。在該第一實例中,用本能而不是固定的饑餓和睡覺來檢查由圖41的內(nèi)容樹中的模塊作出的尋找./吃飯和睡覺的變化。圖42示出包含在本能中的饑餓和困倦的時間變化,圖43示出情緒中包含的刺激、愉快和可信度的時間變化,以及圖44示出作為動機的睡覺和吃飯的時間變化。
如將從圖42至44看到的那樣,輕拍允許將機器人轉(zhuǎn)換到睡覺樹,擊打允許讓機器人離開睡覺樹(未示出)。當饑餓增加時,機器人可以前進到吃飯樹。當饑餓緩和時,機器人可以轉(zhuǎn)換到睡覺樹。即使機器人被擊打時刺激也將不能變化的原因是,本能未變化到睡覺時的最小值,即等于-100。當饑餓變?yōu)樽畲笾禃r,也就是變成100時,受挫將具有一個增加的值(未示出),所以愉快將略微增加。
下面將說明操作檢驗的第二實例,其中使用了包括Nourishment(食物)、Affection(友愛)、Curiosity(好奇心)和Sleepy(困倦)的四種樣板。圖45至圖47示出機器人舉止的變化和圖41所示的內(nèi)容樹中本能值的變化。圖46示出情緒隨時間的變化,圖47示出釋放機構(gòu)的時間變化。
如圖45至47所示,通過輕拍轉(zhuǎn)換到睡覺樹、由于饑餓轉(zhuǎn)換到吃飯樹、以及由于好奇心轉(zhuǎn)換到信息獲取被分別作出。當甚至包含在本能中的好奇心是最大值時也不能作出動作時,愉快已經(jīng)被變化到不愉快。此外,當輕拍機器人增加困倦時,愉快被增強,由此搜索舒適(Comfort)。
操作檢驗的結(jié)果表明行為動作選擇/決定系統(tǒng)有效地操作,其中行為學方法基于圖41所示的內(nèi)容樹。
工業(yè)應用性如上文已經(jīng)說明的那樣,在本發(fā)明的機器人中,恰好在觸摸傳感器檢測觸摸之前或之后供應的信息被信息檢測器檢測;相應于觸摸傳感器的觸摸檢測作出的動作與輸入信息檢測器檢測的輸入信息相互關(guān)聯(lián)地存儲到存儲單元中;動作控制器根據(jù)新近獲取的輸入信息從存儲單元中的信息中檢索動作;作出動作,以相互關(guān)聯(lián)地存儲輸入信息和檢測輸入信息時得到的動作;并且相同的輸入信息被再次供應時作出相應的動作。
在本發(fā)明的機器人中采用的動作控制方法包括以下步驟檢測對機器人作出的觸摸;檢測恰好在觸摸檢測步驟中的觸摸檢測之前或之后供應的信息;將相應于觸摸檢測步驟中的觸摸檢測所作出的動作和輸入信息檢測步驟中檢測的輸入信息相互關(guān)聯(lián)地存儲到存儲單元中;以及根據(jù)新近獲取的輸入信息從存儲單元的信息中檢索動作以控制機器人作出動作。
在本發(fā)明的機器人中,輸入信息和輸入信息被檢測時作出的動作被相互關(guān)聯(lián)地存儲,并且當與該輸入信息相同的信息被再次供應時,作出相應動作。
此外,在本發(fā)明的機器人中,表現(xiàn)為相應于由輸入信息檢測器檢測的輸入信息作出的動作結(jié)果的動作結(jié)果信息和輸入信息相互關(guān)聯(lián)地被存儲到存儲單元中;動作控制器根據(jù)新輸入信息識別存儲單元中的動作結(jié)果信息,動作根據(jù)動作結(jié)果信息作出;輸入信息和表現(xiàn)為相應于輸入信息作出的動作結(jié)果的動作結(jié)果信息被相互關(guān)聯(lián)地存儲;并且當相同的輸入信息再次供應時,可以根據(jù)相應的動作結(jié)果信息檢索過去的動作,作出適當?shù)膭幼鳌?br> 在本發(fā)明的機器人中采用的動作控制方法包括以下步驟將表現(xiàn)為相應于由輸入信息檢測器檢測的輸入信息作出的動作結(jié)果的動作結(jié)果信息和輸入信息相互關(guān)聯(lián)地存儲到存儲單元中;根據(jù)新輸入信息識別存儲單元中的動作結(jié)果信息,以控制機器人根據(jù)動作結(jié)果信息作出動作。
在本發(fā)明的機器人中,輸入信息和表現(xiàn)為相應于輸入信息作出的動作結(jié)果的動作結(jié)果信息被相互關(guān)聯(lián)地存儲;并且當相同的輸入信息再次供應時,可以根據(jù)相應的動作結(jié)果信息檢索過去的動作,作出適當?shù)膭幼鳌?br> 此外,在本發(fā)明的機器人中,輸入信息檢測器檢測的輸入信息的特征被特征檢測器檢測;信息分類單元根據(jù)該特征對輸入信息進行分類;動作控制器根據(jù)輸入信息的分類使機器人進行動作;分類改變器根據(jù)表現(xiàn)為機器人在動作控制器控制下作出的動作的結(jié)果的動作結(jié)果信息,改變已經(jīng)使機器人動作的輸入信息的分類;機器人相應于輸入信息的分類進行動作,從而允許根據(jù)機器人動作的結(jié)果改變輸入信息的分類。
本發(fā)明的機器人中采用的動作控制方法包括以下步驟檢測由輸入信息檢測器檢測的輸入信息的特征;根據(jù)特征檢測步驟中檢測的特征對輸入信息進行分類;根據(jù)信息分類步驟作出的輸入信息的分類控制機器人進行動作;根據(jù)表現(xiàn)為由動作控制步驟中控制的機器人作出的動作的結(jié)果的動作結(jié)果信息,改變已經(jīng)使機器人動作的輸入信息的分類。
本發(fā)明的機器人可以相應于輸入信息的分類進行動作,并且根據(jù)機器人動作的結(jié)果改變輸入信息的分類。
此外,本發(fā)明的機器人將目標對象識別單元識別的目標對象的信息存儲到存儲單元中;根據(jù)新近檢測的對象和存儲目標對象的存儲單元中存儲的目標對象的信息,進行動作;因而,當相同對象被再次供應時以預定方式進行動作。
此外,本發(fā)明的機器人中采用的動作控制方法包括以下步驟識別目標對象;將目標對象識別步驟中識別的目標對象的信息存儲到存儲單元中;根據(jù)新近檢測的信息和該存儲單元中存儲的目標對象的信息,控制機器人進行動作。
本發(fā)明的機器人存儲目標對象,并且當識別目標被再次供應時,以預定方式進行動作。
此外,本發(fā)明的機器人包括多個運動部件;移動運動部件的多個關(guān)節(jié),多個檢測器,其每一個檢測經(jīng)運動部件被施加了外力的關(guān)節(jié)的狀態(tài);和學習單元,相互關(guān)聯(lián)地學習檢測器檢測的關(guān)節(jié)狀態(tài)和外力,以便經(jīng)運動部件被施加了外力的關(guān)節(jié)的狀態(tài)可以被檢測器檢測,并且學習單元可以相互關(guān)聯(lián)地學習檢測器檢測的關(guān)節(jié)狀態(tài)和外力。也就是,機器人可以相關(guān)聯(lián)地學習外力與相應于作用于運動部件的外力而變化的關(guān)節(jié)狀態(tài)。
此外,本發(fā)明的外力檢測器包括關(guān)節(jié)狀態(tài)檢測器,檢測移動運動部件的關(guān)節(jié)的狀態(tài);和外力檢測器,根據(jù)關(guān)節(jié)狀態(tài)檢測器檢測的關(guān)節(jié)狀態(tài)檢測作用于運動部件的外力,以便移動該運動部件的關(guān)節(jié)狀態(tài)可以被關(guān)節(jié)狀態(tài)檢測器檢測,以及作用于運動部件的外力可以根據(jù)關(guān)節(jié)狀態(tài)檢測器檢測的關(guān)節(jié)狀態(tài)進行檢測。即,外力檢測器可以根據(jù)移動運動部件的關(guān)節(jié)的狀態(tài)檢測作用于運動部件的外力。
此外,本發(fā)明的外力檢測方法包括以下步驟檢測移動運動部件的關(guān)節(jié)的狀態(tài);根據(jù)所檢測的關(guān)節(jié)狀態(tài)檢測作用于運動部件的外力;和根據(jù)移動該運動部件的關(guān)節(jié)的狀態(tài)檢測作用于運動部件外力。
需要說明的是,本發(fā)明不局限于上文中已經(jīng)說明的實施例,非限制性和說明性的關(guān)聯(lián)存儲系統(tǒng)的實例和用于操作檢驗的內(nèi)容樹可以以各種方式修改。在不背離所附權(quán)利要求范圍和精神的條件下,可以對本發(fā)明進行各種修改。
權(quán)利要求
1.一種機器人設備,包括用于檢測觸摸的裝置;用于檢測恰好在觸摸檢測裝置的觸摸檢測的同時或之前或之后供應的信息的裝置;存儲裝置,用于相關(guān)聯(lián)地存儲相應于觸摸檢測所作出的動作和輸入信息檢測裝置所檢測的輸入信息;和檢索動作的裝置,用于根據(jù)新近獲取的信息從存儲裝置的信息中檢索動作,以控制機器人設備進行動作。
2.根據(jù)權(quán)利要求1所述的機器人設備,其中相應于觸摸檢測裝置的觸摸檢測所作出的動作是觸摸的外部負載造成的運動部件的位移的結(jié)果;和觸摸檢測裝置依據(jù)外部負載造成的對運動部件的控制信號的變化檢測觸摸。
3.根據(jù)權(quán)利要求1所述的機器人設備,還包括用于使機器人設備相應于觸摸檢測裝置的觸摸檢測進行動作的裝置;存儲裝置,相互關(guān)聯(lián)地存儲相應于觸摸檢測裝置的觸摸檢測所作出的動作和輸入信息檢測裝置所檢測的輸入信息。
4.根據(jù)權(quán)利要求1所述的機器人設備,其中輸入信息檢測裝置至少檢測圖像信息或者語音信息。
5.一種控制機器人設備動作的方法,該方法包括以下步驟檢測對機器人設備所作的觸摸;檢測恰好在觸摸檢測步驟的觸摸檢測的同時或之前或之后供應的信息;將響應觸摸檢測步驟中的觸摸檢測所作出的動作和輸入信息檢測步驟中檢測的輸入信息相互關(guān)聯(lián)地存入存儲裝置中;和根據(jù)新近獲取的信息從存儲裝置的信息中檢索動作,以控制機器人進行動作。
6.一種機器人設備,包括用于檢測輸入信息的裝置;存儲裝置,用于存儲由輸入信息檢測裝置檢測的輸入信息和動作結(jié)果信息,該動作結(jié)果信息表現(xiàn)出相應于輸入信息檢測裝置檢測的輸入信息所作出的動作結(jié)果;和識別動作結(jié)果信息的裝置,用于根據(jù)新近供應的輸入信息識別存儲裝置中的動作結(jié)果信息,以控制機器人設備根據(jù)動作結(jié)果信息進行動作。
7.根據(jù)權(quán)利要求6所述的機器人設備,其中情緒相應于外部因素和/或內(nèi)部因素而變化,并且根據(jù)該情緒的狀態(tài)作出動作;存儲裝置相互關(guān)聯(lián)地存儲作為動作結(jié)果信息的、根據(jù)輸入信息作出的動作得到的情緒狀態(tài)和輸入信息;和動作控制裝置根據(jù)輸入信息從存儲裝置中檢索相應的情緒狀態(tài),以根據(jù)該情緒狀態(tài)控制機器人設備進行動作。
8.根據(jù)權(quán)利要求6所述的機器人設備,其中輸入信息檢測裝置至少檢測圖像信息或語音信息。
9.一種控制機器人設備動作的方法,該方法包括以下步驟將動作結(jié)果信息和輸入信息相互關(guān)聯(lián)地存儲到存儲裝置中,該動作結(jié)果信息表現(xiàn)出相應于輸入信息檢測裝置檢測的輸入信息而作出的動作的結(jié)果;和根據(jù)新近供應的輸入信息識別存儲裝置中的動作結(jié)果信息,以根據(jù)動作結(jié)果信息控制機器人設備進行動作。
10.一種機器人設備,包括用于檢測輸入信息的裝置;檢測輸入信息特征的裝置,用于檢測由輸入信息檢測裝置檢測的輸入信息的特征;根據(jù)所檢測的特征對輸入信息進行分類的裝置;根據(jù)輸入信息控制機器人設備做動作的裝置;和改變分類的裝置,用于根據(jù)動作結(jié)果信息改變已經(jīng)使機器人設備作出動作的輸入信息的分類,該動作結(jié)果信息表現(xiàn)出機器人設備在動作控制裝置的控制下作出的動作結(jié)果。
11.根據(jù)權(quán)利要求10所述的機器人設備,其中輸入信息是圖像信息或者語音信息。
12.根據(jù)權(quán)利要求10所述的機器人設備,其中分類改變裝置在動作結(jié)果信息指示動作結(jié)果不合意時,改變輸入信息的分類。
13.一種控制機器人設備動作的方法,該方法包括以下步驟檢測由輸入信息檢測裝置檢測的輸入信息的特征;根據(jù)特征檢測步驟中檢測的特征對輸入信息分類;根據(jù)信息分類步驟中作出的輸入信息的分類,控制機器人設備進行動作;和根據(jù)動作結(jié)果信息改變已經(jīng)使機器人設備作出動作的輸入信息的分類,該動作結(jié)果信息表現(xiàn)出在動作控制步驟控制下機器人設備作出的動作結(jié)果。
14.一種機器人設備,包括用于識別目標對象的裝置;用于存儲由目標對象識別裝置識別的目標對象的信息的裝置;和控制裝置,用于根據(jù)新近檢測的對象的信息和存儲在存儲裝置中的目標對象的信息控制機器人設備進行動作。
15.根據(jù)權(quán)利要求14所述的機器人設備,其中目標對象識別裝置將輸入圖像信息分段,以檢測分段區(qū)域的時間變化,并識別與時間變化已經(jīng)達到預定值的區(qū)域相對應的對象。
16.根據(jù)權(quán)利要求14所述的機器人設備,其中目標對象識別裝置根據(jù)輸入語音信息識別目標對象。
17.根據(jù)權(quán)利要求16所示的機器人設備,其中目標對象識別裝置至少依據(jù)輸入語音信息的音量或者方向信息識別目標對象。
18.根據(jù)權(quán)利要求14所述的機器人設備,其中目標對象識別裝置檢測教導目標對象的訓練者的視線,以便依據(jù)該視線識別目標對象。
19.一種控制機器人設備動作的方法,該方法包括以下步驟識別目標對象;將目標對象識別步驟中識別的該目標對象的信息存儲到存儲裝置中;和根據(jù)新近檢測的對象的信息和存儲在存儲裝置中的目標對象的信息,控制機器人設備進行動作。
20.一種機器人設備,包括諸多運動部件;移動諸多運動部件的諸多關(guān)節(jié);檢測裝置,用于檢測經(jīng)運動部件被施加了外力的關(guān)節(jié)的狀態(tài);和學習裝置,相互關(guān)聯(lián)的學習由檢測裝置檢測的關(guān)節(jié)狀態(tài)和外力。
21.根據(jù)權(quán)利要求20所述的機器人設備,其中檢測裝置檢測經(jīng)運動部件作用于關(guān)節(jié)上的外力,作為關(guān)節(jié)的狀態(tài);和學習裝置相互關(guān)聯(lián)地學習由檢測裝置檢測的外力和對運動部件的外力。
22.根據(jù)權(quán)利要求20所述的機器人設備,其中檢測裝置檢測關(guān)節(jié)狀態(tài)的目標值與測量值之間的差值;和學習裝置相互關(guān)聯(lián)地學習由檢測裝置檢測的測量值與目標值之間的差值和外力。
23.根據(jù)權(quán)利要求22所述的機器人設備,其中檢測裝置檢測外力造成的對關(guān)節(jié)的控制信號的變化;和學習裝置學習檢測裝置檢測的已變化的控制信號和外力。
24.根據(jù)權(quán)利要求20所述的機器人設備,還包括動作控制裝置,用于使機器人設備根據(jù)學習裝置的學習結(jié)果和學習之后的關(guān)節(jié)狀態(tài)進行動作。
25.根據(jù)權(quán)利要求20所述的機器人設備,其中學習裝置通過包含輸入層、隱藏層和輸出層的神經(jīng)網(wǎng)絡進行學習。
26.一種外力檢測器,包括關(guān)節(jié)狀態(tài)檢測裝置,用于檢測移動運動部件的關(guān)節(jié)的狀態(tài);和外力檢測裝置,用于根據(jù)關(guān)節(jié)狀態(tài)檢測裝置檢測的關(guān)節(jié)狀態(tài),檢測作用于運動部件上的外力。
27.根據(jù)權(quán)利要求26所述的檢測器,其中檢測裝置檢測關(guān)節(jié)狀態(tài)的目標值與測量值之間的差值;和外力檢測裝置根據(jù)該檢測裝置檢測的測量值與目標值之間的差值檢測外力。
28.根據(jù)權(quán)利要求27所述的檢測器,其中檢測裝置檢測經(jīng)運動部件施加的外力所造成的對關(guān)節(jié)的控制信號的變化;和外力檢測裝置根據(jù)檢測裝置檢測的已變化的控制信號檢測外力。
29.一種檢測外力的方法,該方法包括以下步驟檢測移動運動部件的關(guān)節(jié)的狀態(tài);根據(jù)所檢測的關(guān)節(jié)狀態(tài)檢測作用于該運動部件的外力;和根據(jù)移動該運動部件的關(guān)節(jié)的狀態(tài)檢測作用于運動部件的外力。
全文摘要
本發(fā)明提出的機器人(1)包括:語音識別單元(101),檢測在觸摸傳感器的觸摸檢測的同時或者之前或之后供應的信息;關(guān)聯(lián)存儲器/檢索存儲器(104),相互關(guān)聯(lián)地存儲相應于觸摸所作出的動作和語音識別單元(101)檢測的輸入信息(語音信號);和動作生成器(105),根據(jù)新近獲得的輸入信息(語音信號)控制機器人(1)作出由關(guān)聯(lián)存儲器/檢索存儲器(104)所檢索的動作。該機器人(1)還包括傳感器數(shù)據(jù)處理器(102),允許機器人(1)相應于觸摸傳感器的觸摸檢測進行動作。因而,機器人(1)可以學習與諸如語音信號的輸入信號相關(guān)聯(lián)的動作。
文檔編號G10L15/26GK1380846SQ01801273
公開日2002年11月20日 申請日期2001年4月2日 優(yōu)先權(quán)日2000年3月31日
發(fā)明者藤田雅博, 高木剛, 長谷川里香, 花形理, 橫野順, 加布里爾·科斯塔, 下村秀樹 申請人:索尼公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1