專利名稱:身體性聲反應(yīng)玩具的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種進(jìn)行會(huì)話娛樂的玩具或利用聲音實(shí)現(xiàn)意思表達(dá)的身體性聲反應(yīng)玩具。
近年來流行對(duì)聲音有反應(yīng)而活動(dòng)手足或頭的玩具。例如美國專利USP4,923,428中揭示的“互動(dòng)說話玩具(Interactive talking toy)”就是這種玩具。這些玩具隨聲音執(zhí)行特定動(dòng)作造型或組合執(zhí)行多個(gè)動(dòng)作造型,因而并非是生成為交流動(dòng)作(對(duì)人類的思想溝通起到促進(jìn)或變得親近的動(dòng)作)的動(dòng)作造型。而是讓無法養(yǎng)動(dòng)物等寵物的都市樓宇內(nèi)的獨(dú)處者、尤其是女性中得到好感,目前銷售許多這種玩具。
同樣利用聲音的玩具還有對(duì)聲音進(jìn)行錄放的留言裝置。這種玩具將預(yù)先錄音的發(fā)言人聲音隨機(jī)器人動(dòng)作重放,以便實(shí)現(xiàn)意思表達(dá)。這通過聲音解決時(shí)間性隔離。而這種對(duì)聲音的利用,并非是玩具,也可以視為用記錄聲音的盒式磁帶對(duì)話的留言手段。與僅僅是文字的意思表達(dá)相比,由于傳達(dá)的是發(fā)信人活生生的聲音,因而可以比書信實(shí)現(xiàn)更為順暢或親密的交流。這通過聲音解決距離性隔離。
對(duì)聲音產(chǎn)生反應(yīng)的玩具,對(duì)獨(dú)處的人的精神穩(wěn)定因素具有意義,而玩具的反應(yīng)很重要。但現(xiàn)有的這類玩具只是簡(jiǎn)單地輸入聲音,反饋與振幅大小成正比的動(dòng)作,存在不怎么能融入情感這種問題。而利用聲音的意思表達(dá),不會(huì)讓距離或時(shí)間上分離的雙方感到距離或時(shí)間差的存在,在實(shí)現(xiàn)順暢或親密的交流方面有利。但這種意思表達(dá)手段也存在說話一側(cè)和傾聽一側(cè)只是與手足不?;顒?dòng)的機(jī)器人對(duì)話,難以在聲音中融入情感這種缺點(diǎn)。因此,對(duì)進(jìn)行會(huì)話娛樂的玩具或利用聲音實(shí)現(xiàn)意思表達(dá)的玩具等聲音玩具,研究容易融入情感的手段。
研究的結(jié)果,開發(fā)出一種身體性聲反應(yīng)玩具,由聲音輸入輸出部、聲反應(yīng)模擬人格和模擬人格控制部構(gòu)成,聲音輸入輸出部承擔(dān)外部的聲音輸入或至外部的聲音輸出,模擬人格控制部根據(jù)經(jīng)過聲音輸入輸出部的聲音確定聲反應(yīng)模擬人格的舉動(dòng)并使該聲反應(yīng)模擬人格動(dòng)作。該身體性聲反應(yīng)玩具也可以對(duì)聲音輸入輸出部增加數(shù)據(jù)輸入輸出部和數(shù)據(jù)變換部構(gòu)成,數(shù)據(jù)輸入輸出部承擔(dān)外部的非聲音數(shù)據(jù)輸入或至外部的非聲音數(shù)據(jù)輸出,數(shù)據(jù)變換部實(shí)現(xiàn)非聲音數(shù)據(jù)與聲音的相互變換,與聲音輸入輸出部進(jìn)行聲音交換。數(shù)據(jù)輸入輸出部將聲音以外可以合成聲音的數(shù)據(jù)輸入輸出。模擬人格控制部根據(jù)聲音確定機(jī)器人的舉動(dòng),但可變換為模擬聲音的信號(hào)(準(zhǔn)聲音)的話,即便未必能判別含義也行。數(shù)據(jù)變換部承擔(dān)這種數(shù)據(jù)與聲音或準(zhǔn)聲音之間的相互變換。數(shù)據(jù)合成的聲音或準(zhǔn)聲音經(jīng)過聲音輸入輸出部送至模擬人格控制部。
聲反應(yīng)模擬人格以基本上模仿人類的方式為佳,但也可以是擬人化的動(dòng)植物、其他無機(jī)物、想象的生物或物體。如下文所述,本發(fā)明隨聲音的通斷,作出人類說者或聽者共同擁有會(huì)話節(jié)奏的舉動(dòng),即作出交流動(dòng)作,因而只要作出這種舉動(dòng),說者或聽者是原本無機(jī)物的交通工具或建筑、其他想象中的生物或物體都行。變形物體或建筑等倒是融入親和力玩具方面拿手的,故而較佳。聽者控制部或說者控制部由計(jì)算機(jī)構(gòu)成。機(jī)器人是將驅(qū)動(dòng)電路與計(jì)算機(jī)(或?qū)S锰幚硇酒?連接進(jìn)行控制驅(qū)動(dòng)的。計(jì)算機(jī)可以按硬件或軟件方式構(gòu)成聲音輸入輸出部、數(shù)據(jù)輸入輸出部、數(shù)據(jù)變換部,而且控制方式變更也很方便。
具體來說,(1)聲反應(yīng)模擬人格是聽者機(jī)器人,模擬人格控制部是聽者控制部,聽者機(jī)器人響應(yīng)聲音進(jìn)行點(diǎn)頭動(dòng)作、張口閉口動(dòng)作、眨眼動(dòng)作或身體姿勢(shì)動(dòng)作這種舉動(dòng),聽者控制部根據(jù)經(jīng)過聲音輸入輸出部的聲音確定聽者機(jī)器人舉動(dòng),使聽者機(jī)器人動(dòng)作。
而且,(2)聲反應(yīng)模擬人格是說者機(jī)器人,模擬人格控制部是說者控制部,說者機(jī)器人響應(yīng)聲音進(jìn)行頭部姿態(tài)動(dòng)作、張口閉口動(dòng)作、眨眼動(dòng)作或身體姿勢(shì)動(dòng)作這種舉動(dòng),說者控制部根據(jù)經(jīng)過聲音輸入輸出部的聲音確定說者機(jī)器人舉動(dòng),使說者機(jī)器人動(dòng)作。
此外,(3)聲反應(yīng)模擬人格是說者和聽者共用機(jī)器人,模擬人格控制部是說者和聽者控制部,共用機(jī)器人響應(yīng)聲音進(jìn)行點(diǎn)頭動(dòng)作、頭部姿態(tài)動(dòng)作、張口閉口動(dòng)作、眨眼動(dòng)作或身體姿勢(shì)動(dòng)作這種舉動(dòng),聽者控制部根據(jù)經(jīng)過聲音輸入輸出部的聲音確定共用機(jī)器人作為聽者的舉動(dòng)使該共用機(jī)器人動(dòng)作,而說者控制部根據(jù)經(jīng)過聲音輸入輸出部的聲音確定共用機(jī)器人作為說者的舉動(dòng)使該共用機(jī)器人動(dòng)作。
即使在顯示部上利用動(dòng)畫等顯示模擬聽者或模擬說者來替代機(jī)器人,本發(fā)明的基本作用、效果也沒有改變。顯示部上可顯示的模擬說者或模擬聽者可以利用采用真實(shí)圖像進(jìn)行應(yīng)答的合成圖像、另行制作圖像的CG(計(jì)算機(jī)圖形)、動(dòng)畫。聽者控制部或說者控制部用計(jì)算機(jī)時(shí),計(jì)算機(jī)對(duì)合成圖像、CG或動(dòng)畫進(jìn)行合成,在計(jì)算機(jī)顯示部上顯示所述各活動(dòng)影像。
用上述顯示部的場(chǎng)合,具體來說,(4)聲反應(yīng)模擬人格是顯示聽者的聽者顯示部,模擬人格控制部是聽者控制部,聽者顯示部響應(yīng)聲音在聽者顯示部上顯示進(jìn)行點(diǎn)頭動(dòng)作、張口閉口動(dòng)作、眨眼動(dòng)作或身體姿勢(shì)動(dòng)作這種舉動(dòng)的模擬聽者,聽者控制部根據(jù)經(jīng)過聲音輸入輸出部的聲音確定模擬聽者舉動(dòng),使聽者顯示部上顯示的模擬聽者活動(dòng)。
或者,(5)聲反應(yīng)模擬人格是顯示說者的說者顯示部,模擬人格控制部是說者控制部,說者顯示部響應(yīng)聲音信號(hào)在說者顯示部上顯示進(jìn)行頭部姿態(tài)動(dòng)作、張口閉口動(dòng)作、眨眼動(dòng)作或身體姿勢(shì)動(dòng)作這種舉動(dòng)的模擬說者,說者控制部根據(jù)經(jīng)過聲音輸入輸出部的聲音確定模擬說者舉動(dòng),使說者顯示部上顯示的模擬說者活動(dòng)。
或者,(6)聲反應(yīng)模擬人格是顯示聽者和說者的共用顯示部,模擬人格控制部是聽者控制部和說者控制部,共用顯示部響應(yīng)聲音信號(hào)在同一空間中分別顯示進(jìn)行點(diǎn)頭動(dòng)作、頭部姿態(tài)動(dòng)作、張口閉口動(dòng)作、眨眼動(dòng)作或身體姿勢(shì)動(dòng)作這種舉動(dòng)的模擬說者和模擬聽者,聽者控制部根據(jù)經(jīng)過聲音輸入輸出部的聲音確定模擬聽者舉動(dòng),使上述共用顯示部上顯示的該模擬聽者活動(dòng),而說者控制部根據(jù)經(jīng)過聲音輸入輸出部的聲音確定模擬說者舉動(dòng),使共用顯示部上顯示的模擬說者活動(dòng)。
本發(fā)明用作會(huì)話娛樂的玩具時(shí),聲音輸入輸出部直接與受話器或揚(yáng)聲器交換聲音。而用作意思表達(dá)的玩具時(shí),通過另外增設(shè)的聲音錄/放部,將聲音記錄于記錄媒體上送給對(duì)方,靠重放出來進(jìn)行接收。基于數(shù)據(jù)的場(chǎng)合,可讓數(shù)據(jù)記錄/回放部記錄、回放數(shù)據(jù)。記錄媒體可與聲音輸入輸出部、數(shù)據(jù)輸入輸出部一體構(gòu)成,但除了記錄媒體以外還用外部存儲(chǔ)裝置的話,便可處理更長時(shí)間的聲音或數(shù)據(jù)。對(duì)于外部存儲(chǔ)裝置來說,可利用各種磁帶(包含盒式磁帶)、磁盤、磁光盤、用到存儲(chǔ)器的各種媒體。上述外部存儲(chǔ)裝置大多為可檫除記錄內(nèi)容并重復(fù)利用的,但一次性意思表達(dá)就行時(shí),也可以利用CD-ROM、CD-R、DVD-ROM、唱片。
重要的聲反應(yīng)模擬人格其舉動(dòng),對(duì)于聲反應(yīng)模擬人格是說者還是聽者有所不同。(a)作為聽者的聲反應(yīng)模擬人格其舉動(dòng)(交流動(dòng)作)由點(diǎn)頭動(dòng)作、眨眼動(dòng)作或身體姿勢(shì)動(dòng)作的選擇性組合所組成,點(diǎn)頭動(dòng)作按根據(jù)聲音通斷所推定的點(diǎn)頭預(yù)測(cè)值超過點(diǎn)頭閾值的點(diǎn)頭動(dòng)作定時(shí)執(zhí)行,眨眼動(dòng)作按以上述點(diǎn)頭動(dòng)作定時(shí)為起始點(diǎn)且隨時(shí)間呈指數(shù)分布的眨眼動(dòng)作定時(shí)執(zhí)行,身體姿勢(shì)動(dòng)作按根據(jù)聲音通斷所推定的點(diǎn)頭預(yù)測(cè)值超過身體姿勢(shì)閾值的身體姿勢(shì)動(dòng)作定時(shí)執(zhí)行。
而且,(b)作為說者的聲反應(yīng)模擬人格其舉動(dòng)(交流動(dòng)作)由頭部姿態(tài)動(dòng)作、張口閉口動(dòng)作、眨眼動(dòng)作或身體姿勢(shì)動(dòng)作的選擇性組合所組成,姿態(tài)動(dòng)作按根據(jù)聲音通斷所推定的姿態(tài)預(yù)測(cè)值超過姿態(tài)閾值的姿態(tài)動(dòng)作定時(shí)執(zhí)行,眨眼動(dòng)作則按根據(jù)聲音通斷所推定的眨眼預(yù)測(cè)值超過眨眼閾值的眨眼動(dòng)作定時(shí)執(zhí)行,身體姿勢(shì)動(dòng)作則按根據(jù)聲音通斷所推定的姿態(tài)預(yù)測(cè)值或身體姿勢(shì)預(yù)測(cè)值超過身體姿勢(shì)閾值的身體姿勢(shì)動(dòng)作定時(shí)執(zhí)行。
如此確定的舉動(dòng)(交流動(dòng)作),在模擬聽者和說者之間(或模擬說者和聽者之間)營造出會(huì)話的節(jié)奏,出現(xiàn)身體性參與現(xiàn)象(也簡(jiǎn)稱為參與現(xiàn)象)。這種參與現(xiàn)象創(chuàng)造出說話或傾聽的輕松氣氛,使機(jī)器人或顯示部?jī)?nèi)動(dòng)畫等演繹的模擬說者或模擬聽者融入情感。
舉動(dòng)中的組合是自由的。例如模擬說者用頭部姿態(tài)動(dòng)作替代點(diǎn)頭動(dòng)作,或是模擬聽者基本上不用張口閉口動(dòng)作。身體姿勢(shì)動(dòng)作是在得到點(diǎn)頭動(dòng)作定時(shí)的算法當(dāng)中利用數(shù)值低于點(diǎn)頭閾值的身體姿勢(shì)閾值得到身體姿勢(shì)動(dòng)作定時(shí)的。而且,身體姿勢(shì)動(dòng)作隨聲音的變化驅(qū)動(dòng)活動(dòng)部位,根據(jù)聲音選擇身體活動(dòng)部位,或選擇預(yù)定的動(dòng)作造型(活動(dòng)部位組合以及各部分動(dòng)作量)。對(duì)身體姿勢(shì)動(dòng)作的活動(dòng)部位或動(dòng)作造型的選擇,使點(diǎn)頭動(dòng)作和身體姿勢(shì)動(dòng)作的聯(lián)系自然。這樣,本發(fā)明除了張口閉口動(dòng)作或基于聲音振幅的身體各部位動(dòng)作以外,還利用模擬聽者以點(diǎn)頭動(dòng)作定時(shí)為中心、模擬說者以姿態(tài)動(dòng)作為中心的舉動(dòng),實(shí)現(xiàn)交流動(dòng)作。
這樣,重要的點(diǎn)頭動(dòng)作定時(shí)利用一比較算法,比較靠線性或非線性耦合點(diǎn)頭動(dòng)作相對(duì)聲音得到的預(yù)測(cè)模型、例如MA模型(移動(dòng)平均值模型Moving-AverageModel)或神經(jīng)網(wǎng)絡(luò)模型(Neural Network Model)所得到的點(diǎn)頭預(yù)測(cè)值和預(yù)定的點(diǎn)頭閾值來確定。本發(fā)明中,模擬聽者場(chǎng)合用的是聲音與點(diǎn)頭動(dòng)作相關(guān)聯(lián)的預(yù)測(cè)模型,而模擬說者場(chǎng)合用的是聲音與頭部動(dòng)作相關(guān)聯(lián)的預(yù)測(cè)模型。這些算法將聲音當(dāng)作隨時(shí)間通斷的電信號(hào)俘獲,將這種隨時(shí)間通斷的電信號(hào)得到的點(diǎn)頭預(yù)測(cè)值(說者場(chǎng)合為頭部姿態(tài)預(yù)測(cè)值)與點(diǎn)頭閾值(說者場(chǎng)合為頭部姿態(tài)閾值)或身體姿勢(shì)閾值比較,導(dǎo)出點(diǎn)頭動(dòng)作定時(shí)或身體姿勢(shì)動(dòng)作定時(shí)。由于是以簡(jiǎn)單電信號(hào)通斷為基礎(chǔ)的,因而計(jì)算量較少,即便將性能低的CPU用于實(shí)時(shí)確定舉動(dòng),也不失即時(shí)響應(yīng)性。本發(fā)明特征在于,根據(jù)將聲音視為電信號(hào)時(shí)的通斷,引發(fā)參與現(xiàn)象。而且,除了上述通斷以外,還可以一并考慮電信號(hào)隨時(shí)間變化所給出的韻律或抑揚(yáng)聲調(diào)。
附圖簡(jiǎn)要說明
圖1是模擬熊玩偶的身體性聲反應(yīng)玩具(品名“傳話太郎”)的構(gòu)成圖。圖2是該玩具進(jìn)行聽者控制時(shí)的流程圖。圖3是該玩具進(jìn)行說者控制時(shí)的流程圖。圖4是利用熊動(dòng)畫造型的身體性聲反應(yīng)玩具(品名“傳話太郎”)的構(gòu)成圖。圖5是作為應(yīng)用例的身體性聲反應(yīng)玩具(品名“說話太郎”)的構(gòu)成圖。
圖1和圖4例子,是用兼作模擬聽者或模擬說者的玩偶1或動(dòng)畫2構(gòu)成的。也可以僅構(gòu)成模擬聽者,僅構(gòu)成模擬說者。
圖1例子在熊玩偶1當(dāng)中內(nèi)置了受話器3、揚(yáng)聲器4、聲音輸入輸出部5、模擬人格控制部6和聲音錄/放部7。玩偶1按模擬聽者工作時(shí),便按下聽者開關(guān)8將模擬人格控制部6設(shè)定為聽者控制部,由聲音輸入輸出部5將受話器3收集的聲音送給模擬人格控制部6,使玩偶1按模擬聽者動(dòng)作。聲音同時(shí)送給聲音錄/放部7,記錄于記錄媒體9中。而玩偶1按模擬說者工作時(shí),通過按下說者開關(guān)10將模擬人格控制部6設(shè)定為說者控制部,由聲音輸入輸出部5將聲音錄/放部7對(duì)記錄媒體9進(jìn)行重放得到的聲音送給模擬人格控制部6,使玩偶1按模擬說者動(dòng)作。聲音同時(shí)由聲音輸入輸出部送給揚(yáng)聲器4播放到外部。實(shí)現(xiàn)意思表達(dá)時(shí),將玩偶1本身與記錄媒體9一起交換,或是實(shí)現(xiàn)意思表達(dá)的兩者具有相同的本發(fā)明玩具而僅僅交換記錄媒體9。本例雖然是玩偶1兼作模擬聽者和模擬說者的例子,但玩具僅僅有其中之一時(shí),則以表達(dá)源具有模擬聽者、表達(dá)對(duì)象具有模擬說者的情形為前提,僅交換記錄媒體9。
例如可以在盒式磁帶錄音機(jī)中將聲音輸入輸出部5和聲音錄/放部7一體構(gòu)成,可在微機(jī)中將模擬人格控制部6做成一整體。各部分裝入玩偶1的位置是自由的。本例中,令工裝褲左紐扣為聽者開關(guān)8,其右紐扣為說者開關(guān)10,受話器3和揚(yáng)聲器4埋入頭部,對(duì)于工裝褲胸袋安排盒式磁帶錄音機(jī)的磁帶插入口,軀體部分內(nèi)置構(gòu)成聲音輸入輸出部5和聲音錄/放部7的盒式錄音機(jī)和構(gòu)成模擬人格控制部6的微機(jī)(圖1中虛線四邊形內(nèi))。各部分為電器或電子設(shè)備,通過內(nèi)置電池或AC適配器(未圖示)供電。
玩偶1作為模擬聽者動(dòng)作時(shí),在按下聽者開關(guān)8的狀態(tài)下,由受話器3收集向熊1發(fā)話的使用者的聲音,并由聲音輸入輸出部5取得,由聲音錄/放部7錄音到盒式磁帶(記錄媒體)9上。同時(shí),聲音輸入輸出部5將聲音傳送給作為聽者控制部動(dòng)作的模擬人格控制部6,按照?qǐng)D2所示的模擬聽者控制流程,分別有選擇地使頭部驅(qū)動(dòng)手段13、眼睛驅(qū)動(dòng)手段14和身體驅(qū)動(dòng)手段15動(dòng)作,使玩偶1進(jìn)行適宜的點(diǎn)頭動(dòng)作、眨眼動(dòng)作和身體姿勢(shì)動(dòng)作。對(duì)于身體姿勢(shì)動(dòng)作來說,除了點(diǎn)頭以外,還有頭部?jī)A斜或轉(zhuǎn)動(dòng)、手勢(shì)或手彎曲、軀體彎曲或轉(zhuǎn)動(dòng)、以及足部姿勢(shì)或足部彎曲。作為模擬聽者開口閉口是不自然的,因而沒有開口閉口動(dòng)作,但也可以并用開口閉口動(dòng)作。頭部驅(qū)動(dòng)手段13、眼睛驅(qū)動(dòng)手段14和身體驅(qū)動(dòng)手段15可以利用電動(dòng)機(jī)、螺線管、汽缸、形狀記憶合金或電磁鐵,或者可利用曲柄運(yùn)動(dòng)或齒輪運(yùn)動(dòng)。
玩偶1作為模擬說者動(dòng)作時(shí),由聲音錄/放部7重放經(jīng)過錄音的盒式磁帶((記錄媒體)9,通過聲音輸入輸出部5從揚(yáng)聲器4當(dāng)中播放聲音。并且,聲音還從聲音輸入輸出部5傳送給作為說者控制部的模擬人格控制部6,按照?qǐng)D3所示的模擬說者控制流程,分別有選擇地使眼睛驅(qū)動(dòng)手段14、口部驅(qū)動(dòng)驅(qū)動(dòng)手段16和身體驅(qū)動(dòng)手段15動(dòng)作,使玩偶1進(jìn)行適宜的頭部姿態(tài)動(dòng)作、眨眼動(dòng)作、張口閉口動(dòng)作或身體姿勢(shì)動(dòng)作。眼睛驅(qū)動(dòng)手段14、口部驅(qū)動(dòng)手段16和身體驅(qū)動(dòng)手段15除了可以利用電動(dòng)機(jī)、螺線管、汽缸、形狀記憶合金或電磁鐵以外,還可利用曲柄運(yùn)動(dòng)或齒輪運(yùn)動(dòng)。
模擬聽者控制流程中各動(dòng)作定時(shí)確定當(dāng)中,最重要的是點(diǎn)頭動(dòng)作定時(shí),除了身體各部分基于開口閉口動(dòng)作或聲音振幅的動(dòng)作以外,眨眼動(dòng)作或身體姿勢(shì)動(dòng)作要么以點(diǎn)頭動(dòng)作定時(shí)為基礎(chǔ)(眨眼動(dòng)作),要么利用同樣的算法(身體姿勢(shì)動(dòng)作)。具體來說,如下所述。首先,根據(jù)聲音輸入輸出部5給出的聲音,在模擬人格控制部6內(nèi)對(duì)推定模擬聽者的點(diǎn)頭動(dòng)作定時(shí)(點(diǎn)頭推定)。本例中,利用聲音線性耦合對(duì)點(diǎn)頭動(dòng)作進(jìn)行預(yù)測(cè)的模型采用MA模型。該點(diǎn)頭推定根據(jù)隨時(shí)間變化的聲音實(shí)時(shí)地計(jì)算時(shí)刻變化的點(diǎn)頭預(yù)測(cè)值的。這里,比較點(diǎn)頭預(yù)測(cè)值和預(yù)先設(shè)定的點(diǎn)頭閾值,當(dāng)點(diǎn)頭預(yù)測(cè)值超過點(diǎn)頭閾值時(shí),便取為點(diǎn)頭動(dòng)作定時(shí),使頭部驅(qū)動(dòng)手段13按點(diǎn)頭動(dòng)作定時(shí)動(dòng)作,執(zhí)行點(diǎn)頭動(dòng)作。眨眼動(dòng)作將最初得到的點(diǎn)頭動(dòng)作定時(shí)設(shè)定為初始眨眼動(dòng)作定時(shí),以初始眨眼動(dòng)作定時(shí)(=初始點(diǎn)頭動(dòng)作定時(shí))為起點(diǎn),得到隨時(shí)間具有指數(shù)分布的眨眼動(dòng)作定時(shí)。這種與點(diǎn)頭動(dòng)作有關(guān)系的眨眼動(dòng)作,可視為會(huì)話當(dāng)中聽者較為自然的反應(yīng),因而給對(duì)玩偶1說話的人,營造出容易說話的氛圍(出現(xiàn)參與現(xiàn)象)。身體姿勢(shì)動(dòng)作是預(yù)先制作出熊1各部分活動(dòng)部位(例如手、軀體、足)組合的多個(gè)動(dòng)作造型,每一身體姿勢(shì)動(dòng)作定時(shí)從這些多個(gè)動(dòng)作造型當(dāng)中選擇動(dòng)作造型加以執(zhí)行。具體來說,較好是按照聲音大小形成手腕姿勢(shì)的話,則在身體姿勢(shì)動(dòng)作上加上強(qiáng)弱。這種動(dòng)作造型的選擇,實(shí)現(xiàn)的是沒有機(jī)械性重復(fù)的自然的身體姿勢(shì)動(dòng)作。此外,還考慮選擇活動(dòng)部位獨(dú)立或連帶地動(dòng)作,還根據(jù)聲音信號(hào)經(jīng)語言分析得到的所帶的含義對(duì)身體姿勢(shì)動(dòng)作進(jìn)行控制。
上述說明,對(duì)于模擬人格控制部6起到說者控制部作用的情形也一樣。但考慮熊1的舉動(dòng)隨著是模擬聽者還是模擬說者而有所不同,因而在導(dǎo)出點(diǎn)頭預(yù)測(cè)值或姿態(tài)預(yù)測(cè)值的預(yù)測(cè)模型方面設(shè)置差異(對(duì)于模擬聽者M(jìn)A模型使聲音與點(diǎn)頭動(dòng)作相關(guān)聯(lián),對(duì)于模擬說者M(jìn)A模型使聲音與頭部姿態(tài)動(dòng)作相關(guān)聯(lián)),或身體姿勢(shì)閾值對(duì)于模擬聽者或模擬說者采用不同數(shù)值??紤]到裝置的成本,聽者控制部和說者控制部不必單獨(dú)構(gòu)成,況且各控制流程相似,因而可以在硬件方面形成一體的模擬人格控制部6,在內(nèi)部分開利用控制流程。
圖4例子,是顯示器17將上述熊一樣的動(dòng)畫2當(dāng)作模擬聽者或模擬說者顯示的身體性聲反應(yīng)玩具。與圖1例子不同之處在于,不是用聲音確定動(dòng)畫20的舉動(dòng),而是用文本數(shù)據(jù)所合成的聲音使模擬人格控制部6動(dòng)作。例如,計(jì)算機(jī)18內(nèi)按硬件或軟件方式構(gòu)成數(shù)據(jù)輸入輸出部19、數(shù)據(jù)記錄/回放部20、數(shù)據(jù)變換部21、模擬人格控制部6。數(shù)據(jù)利用鍵盤12輸入數(shù)據(jù)輸入輸出部19,由數(shù)據(jù)變換部21合成聲音再通過聲音輸入輸出部5從揚(yáng)聲器4當(dāng)中播放出來。鍵盤12還承擔(dān)模擬人格控制部6對(duì)聽者控制和說者控制進(jìn)行的切換。本例情形,由數(shù)據(jù)記錄/回放部20將數(shù)據(jù)保存至記錄媒體9,或由聲音錄/放部7將所合成的聲音保存至記錄媒體9。而且,從揚(yáng)聲器中播放聲音時(shí),較好是將數(shù)據(jù)輸入輸出部19所應(yīng)回放的數(shù)據(jù)顯示成由模擬說者動(dòng)畫2橫向說出的對(duì)白22。
作為特殊應(yīng)用例,可示意圖5所示的身體性聲反應(yīng)玩具。本例記錄媒體9采用市場(chǎng)上銷售的音樂CD或游戲軟件(以軟件內(nèi)記錄的聲音數(shù)據(jù)或可進(jìn)行聲音合成的文本數(shù)據(jù)為對(duì)象),例如將對(duì)音樂CD進(jìn)行回放得到的信號(hào)靠接線輸入送到聲音輸入輸出部5(送入數(shù)據(jù)時(shí)將經(jīng)過數(shù)據(jù)輸入輸出部19、數(shù)據(jù)變換部21后得到的聲音輸入聲音輸入輸出部5,參照?qǐng)D4),從揚(yáng)聲器4當(dāng)中播放音樂,同時(shí)使作為說者的玩偶1活動(dòng)。由于是以實(shí)現(xiàn)玩偶1動(dòng)作為目的的,因而與圖1例子不同,模擬人格控制部6采用的是頭驅(qū)動(dòng)手段13也進(jìn)行適當(dāng)驅(qū)動(dòng)的說者控制流程。以往,使身體符合音樂CD活動(dòng)的人物造型或玩具有很多,但應(yīng)用本發(fā)明的話,玩偶1便出現(xiàn)參與現(xiàn)象,因而在視覺上動(dòng)作得容易融入情感,對(duì)音樂欣賞或游戲更有興致。這時(shí),玩具1動(dòng)作本身在視覺上也具有娛樂效果。同樣,還可以考慮將電話或電視的聲音通過接線輸入使僅僅為聲音的電話加以視覺化進(jìn)行娛樂,或以對(duì)電視有反應(yīng)的玩偶1的動(dòng)作進(jìn)行娛樂。
本發(fā)明提供一利用聲音并且更容易融入情感的玩具。具體來說,人們作為說者時(shí),模擬聽者同時(shí)擁有與說者會(huì)話的節(jié)奏,出現(xiàn)參與現(xiàn)象,能夠使會(huì)話融入情感。而當(dāng)作進(jìn)行聲音(或數(shù)據(jù))記錄的傳話裝置時(shí),可將說者感情流露的話語記錄到記錄媒體上。而人們作為傾聽者時(shí),通過模擬說者表示出與所重放聲音相適合的舉動(dòng)(交流動(dòng)作),在與聽者之間共同擁有會(huì)話的節(jié)奏,利用參與現(xiàn)象實(shí)現(xiàn)更為順暢或親密的意思表達(dá)。
作為傳話裝置的身體性聲反應(yīng)玩具,還可以僅交換記錄媒體便實(shí)現(xiàn)意思的表達(dá)。這時(shí),傳達(dá)發(fā)出方和傳達(dá)接收方兩者都有本發(fā)明身體性聲反應(yīng)玩具最好,但例如僅僅是單方具有身體性聲反應(yīng)玩具,也可以在記錄時(shí)將所要傳達(dá)的聲音融入情感,或者可以在重放時(shí)情感豐富地表現(xiàn)所傳達(dá)的聲音。這意味著,即便在記錄媒體為盒式磁帶且一方用盒式磁帶錄音機(jī)的情形,只要另一方擁有本發(fā)明身體性聲反應(yīng)玩具,便可以享有本發(fā)明效果。
這樣,本發(fā)明便提供一種更容易融入情感的身體性聲反應(yīng)玩具。因此,對(duì)于以往利用聲音的玩具也可考慮如同上述例子的應(yīng)用。最為簡(jiǎn)易的應(yīng)用是進(jìn)行與例如音樂CD回放或游戲聲音數(shù)據(jù)相一致的動(dòng)作的機(jī)器人或動(dòng)畫。此外,還可以是與電話連接并對(duì)說者隨聲附和或與對(duì)方聲音相一致動(dòng)作的機(jī)器人或動(dòng)畫。這樣的應(yīng)用例,通過組合以點(diǎn)頭或頭部姿態(tài)為中心的身體各部位動(dòng)作,可以實(shí)現(xiàn)更為自然、易為人們所接受的前所未有的情感融入。
權(quán)利要求
1.一種身體性聲反應(yīng)玩具,其特征在于,由聲音輸入輸出部、聲反應(yīng)模擬人格和模擬人格控制部構(gòu)成,聲音輸入輸出部承擔(dān)外部的聲音輸入或至外部的聲音輸出,模擬人格控制部根據(jù)經(jīng)過聲音輸入輸出部的聲音確定聲反應(yīng)模擬人格的舉動(dòng),并使該聲反應(yīng)模擬人格動(dòng)作。
2.如權(quán)利要求1所述的身體性聲反應(yīng)玩具,其特征在于,對(duì)聲音輸入輸出部增加數(shù)據(jù)輸入輸出部和數(shù)據(jù)變換部構(gòu)成,數(shù)據(jù)輸入輸出部承擔(dān)外部的非聲音數(shù)據(jù)輸入或至外部的非聲音數(shù)據(jù)輸出,數(shù)據(jù)變換部實(shí)現(xiàn)非聲音數(shù)據(jù)與聲音的相互變換,與聲音輸入輸出部進(jìn)行聲音交換。
3.如權(quán)利要求1所述的身體性聲反應(yīng)玩具,其特征在于,聲反應(yīng)模擬人格是聽者機(jī)器人,模擬人格控制部是聽者控制部,聽者機(jī)器人響應(yīng)聲音進(jìn)行點(diǎn)頭動(dòng)作、張口閉口動(dòng)作、眨眼動(dòng)作或身體姿勢(shì)動(dòng)作這種舉動(dòng),聽者控制部根據(jù)經(jīng)過聲音輸入輸出部的聲音確定聽者機(jī)器人舉動(dòng),使該聽者機(jī)器人動(dòng)作。
4.如權(quán)利要求1所述的身體性聲反應(yīng)玩具,其特征在于,聲反應(yīng)模擬人格是說者機(jī)器人,模擬人格控制部是說者控制部,說者機(jī)器人響應(yīng)聲音進(jìn)行頭部姿態(tài)動(dòng)作、張口閉口動(dòng)作、眨眼動(dòng)作或身體姿勢(shì)動(dòng)作這種舉動(dòng),說者控制部根據(jù)經(jīng)過聲音輸入輸出部的聲音確定說者機(jī)器人舉動(dòng),使該說者機(jī)器人動(dòng)作。
5.如權(quán)利要求1所述的身體性聲反應(yīng)玩具,其特征在于,聲反應(yīng)模擬人格是說者和聽者共用機(jī)器人,模擬人格控制部是說者和聽者控制部,共用機(jī)器人響應(yīng)聲音進(jìn)行點(diǎn)頭動(dòng)作、頭部姿態(tài)動(dòng)作、張口閉口動(dòng)作、眨眼動(dòng)作或身體姿勢(shì)動(dòng)作這種舉動(dòng),聽者控制部根據(jù)經(jīng)過聲音輸入輸出部的聲音確定共用機(jī)器人作為聽者的舉動(dòng)使該共用機(jī)器人動(dòng)作,而說者控制部根據(jù)經(jīng)過聲音輸入輸出部的聲音確定共用機(jī)器人作為說者的舉動(dòng)使該共用機(jī)器人動(dòng)作。
6.如權(quán)利要求1所述的身體性聲反應(yīng)玩具,其特征在于,聲反應(yīng)模擬人格是顯示聽者的聽者顯示部,模擬人格控制部是聽者控制部,聽者顯示部響應(yīng)聲音在聽者顯示部上顯示進(jìn)行點(diǎn)頭動(dòng)作、張口閉口動(dòng)作、眨眼動(dòng)作或身體姿勢(shì)動(dòng)作這種舉動(dòng)的模擬聽者,聽者控制部根據(jù)經(jīng)過聲音輸入輸出部的聲音確定模擬聽者舉動(dòng),使聽者顯示部上顯示的該模擬聽者活動(dòng)。
7.如權(quán)利要求1所述的身體性聲反應(yīng)玩具,其特征在于,聲反應(yīng)模擬人格是顯示說者的說者顯示部,模擬人格控制部是說者控制部,說者顯示部響應(yīng)聲音信號(hào)在說者顯示部上顯示進(jìn)行頭部姿態(tài)動(dòng)作、張口閉口動(dòng)作、眨眼動(dòng)作或身體姿勢(shì)動(dòng)作這種舉動(dòng)的模擬說者,說者控制部根據(jù)經(jīng)過聲音輸入輸出部的聲音確定模擬說者舉動(dòng),使說者顯示部上顯示的該模擬說者活動(dòng)。
8.如權(quán)利要求1所述的身體性聲反應(yīng)玩具,其特征在于,聲反應(yīng)模擬人格是顯示聽者和說者的共用顯示部,模擬人格控制部是聽者控制部和說者控制部,共用顯示部響應(yīng)聲音信號(hào)在同一空間中分別顯示進(jìn)行點(diǎn)頭動(dòng)作、頭部姿態(tài)動(dòng)作、張口閉口動(dòng)作、眨眼動(dòng)作或身體姿勢(shì)動(dòng)作這種舉動(dòng)的模擬說者和模擬聽者,聽者控制部根據(jù)經(jīng)過聲音輸入輸出部的聲音確定模擬聽者舉動(dòng),使上述共用顯示部上顯示的該模擬聽者活動(dòng),而說者控制部根據(jù)經(jīng)過聲音輸入輸出部的聲音確定模擬說者舉動(dòng),使共用顯示部上顯示的模擬說者活動(dòng)。
9.如權(quán)利要求1所述的身體性聲反應(yīng)玩具,其特征在于,作為聽者的聲反應(yīng)模擬人格其舉動(dòng)由點(diǎn)頭動(dòng)作、眨眼動(dòng)作或身體姿勢(shì)動(dòng)作的選擇性組合所組成,點(diǎn)頭動(dòng)作按根據(jù)聲音通斷所推定的點(diǎn)頭預(yù)測(cè)值超過點(diǎn)頭閾值的點(diǎn)頭動(dòng)作定時(shí)執(zhí)行,眨眼動(dòng)作按以上述點(diǎn)頭動(dòng)作定時(shí)為起始點(diǎn)且隨時(shí)間呈指數(shù)分布的眨眼動(dòng)作定時(shí)執(zhí)行,身體姿勢(shì)動(dòng)作按根據(jù)聲音通斷所推定的點(diǎn)頭預(yù)測(cè)值超過身體姿勢(shì)閾值的身體姿勢(shì)動(dòng)作定時(shí)執(zhí)行。
10.如權(quán)利要求1所述的身體性聲反應(yīng)玩具,其特征在于,作為說者的聲反應(yīng)模擬人格其舉動(dòng)由頭部姿態(tài)動(dòng)作、張口閉口動(dòng)作、眨眼動(dòng)作或身體姿勢(shì)動(dòng)作的選擇性組合所組成,姿態(tài)動(dòng)作按根據(jù)聲音通斷所推定的姿態(tài)預(yù)測(cè)值超過姿態(tài)閾值的姿態(tài)動(dòng)作定時(shí)執(zhí)行,眨眼動(dòng)作按根據(jù)聲音通斷所推定的眨眼預(yù)測(cè)值超過眨眼閾值的眨眼動(dòng)作定時(shí)執(zhí)行,身體姿勢(shì)動(dòng)作按根據(jù)聲音通斷所推定的姿態(tài)預(yù)測(cè)值或身體姿勢(shì)預(yù)測(cè)值超過身體姿勢(shì)閾值的身體姿勢(shì)動(dòng)作定時(shí)執(zhí)行。
11.如權(quán)利要求1所述的身體性聲反應(yīng)玩具,其特征在于,對(duì)聲音輸入輸出部增加聲音錄/放部構(gòu)成。
12.如權(quán)利要求2所述的身體性聲反應(yīng)玩具,其特征在于,對(duì)數(shù)據(jù)輸入輸出部增加數(shù)據(jù)記錄/回放部構(gòu)成。
全文摘要
本發(fā)明提供一種屬于易于融入情感的身體性聲反應(yīng)玩具的機(jī)器人或顯示器上的動(dòng)畫形象,由聲音輸入輸出部、聲反應(yīng)模擬人格、模擬人格控制部所構(gòu)成,聲音輸入輸出部承擔(dān)外部的聲音輸入或至外部的聲音輸出,模擬人格控制部根據(jù)經(jīng)過聲音輸入輸出部的聲音確定聲反應(yīng)模擬人格舉動(dòng),并使聲反應(yīng)模擬人格動(dòng)作。
文檔編號(hào)A63H3/28GK1305858SQ0011997
公開日2001年8月1日 申請(qǐng)日期2000年6月30日 優(yōu)先權(quán)日1999年6月30日
發(fā)明者渡邊富夫, 小川浩基 申請(qǐng)人:對(duì)話支援技術(shù)株式會(huì)社