專利名稱:語(yǔ)音對(duì)話設(shè)備、方法和機(jī)器人設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及語(yǔ)音對(duì)話系統(tǒng)和方法以及機(jī)器人設(shè)備,例如,適合于娛樂(lè)用的機(jī)器人。
背景技術(shù):
由語(yǔ)音對(duì)話系系統(tǒng)通過(guò)語(yǔ)音與人進(jìn)行對(duì)話的方法可以根據(jù)內(nèi)容分為兩類。它們是“有場(chǎng)景(scenario)對(duì)話”和“無(wú)場(chǎng)景對(duì)話”。
在這兩類方法之中,“無(wú)場(chǎng)景對(duì)話”方法是一種稱為“非人工智能”的對(duì)話方法,它是通過(guò)E1iza為代表的一個(gè)簡(jiǎn)單答復(fù)句子產(chǎn)生算法而實(shí)現(xiàn)的(見(jiàn)非專利文獻(xiàn)1)。
在“無(wú)場(chǎng)景的對(duì)話”方法中,如圖36所示,通過(guò)重復(fù)一個(gè)反復(fù)的過(guò)程來(lái)進(jìn)行處理(步驟SP92),如果用戶說(shuō)出幾句話,語(yǔ)音對(duì)話系統(tǒng)就對(duì)這些話進(jìn)行話音識(shí)別(步驟SP90),并根據(jù)識(shí)別結(jié)果來(lái)產(chǎn)生答復(fù)句子,以及用聲音發(fā)出此答復(fù)句子(步驟SP91)。
在“無(wú)場(chǎng)景的對(duì)話”方法中的問(wèn)題是如果用戶不發(fā)聲的話,對(duì)話就不進(jìn)行。例如,如果圖36的步驟SP91中產(chǎn)生的響應(yīng)是促使用戶說(shuō)出下一句的內(nèi)容,那么對(duì)話進(jìn)行,然而,如果不是,例如,如果用戶進(jìn)入“不能說(shuō)下一句話”的狀況,語(yǔ)音對(duì)話系統(tǒng)就繼續(xù)等待用戶發(fā)聲并且不進(jìn)行對(duì)話。
進(jìn)而,在“無(wú)場(chǎng)景對(duì)話”方法中,由于對(duì)話沒(méi)有場(chǎng)景,因此,有這樣的問(wèn)題,這就是在圖36的步驟SP91中,在產(chǎn)生響應(yīng)時(shí),在對(duì)話流中難于產(chǎn)生所考慮的答復(fù)句子。例如,難于進(jìn)行這樣的處理,這就是在聽(tīng)到用戶的簡(jiǎn)述過(guò)后(profile over)之后,語(yǔ)音對(duì)話系統(tǒng)將它反映在對(duì)話中。
另一方面,“有場(chǎng)景對(duì)話”是這樣的一個(gè)對(duì)話方法,其中,通過(guò)語(yǔ)音對(duì)話系統(tǒng)根據(jù)預(yù)定的場(chǎng)景連續(xù)地發(fā)聲來(lái)進(jìn)行對(duì)話,并且它的進(jìn)行是通過(guò)兩輪(turn)的組合來(lái)完成的,即,一輪是語(yǔ)音對(duì)話系統(tǒng)單方面地講話,另一輪是語(yǔ)音對(duì)話系統(tǒng)詢問(wèn)用戶并進(jìn)而響應(yīng)用戶對(duì)問(wèn)題的答復(fù)。應(yīng)當(dāng)說(shuō)明的是,“輪”是指對(duì)話中明顯獨(dú)立的發(fā)聲或者是對(duì)話的一個(gè)單元。
在這種對(duì)話方法的情況下,用戶只答復(fù)問(wèn)題,因此,用戶并沒(méi)有失去他所說(shuō)的東西。進(jìn)而,可以用問(wèn)題的內(nèi)容來(lái)限制用戶的言詞,因此,在語(yǔ)音對(duì)話系統(tǒng)根據(jù)用戶的答復(fù)做出進(jìn)一步響應(yīng)的輪中,答復(fù)句子的設(shè)計(jì)是比較容易的。例如,作為語(yǔ)音對(duì)話系統(tǒng)向用戶提問(wèn)的一輪,只準(zhǔn)備“是”和“否”兩種答案就行了。此外,還有一個(gè)優(yōu)點(diǎn),這就是語(yǔ)音對(duì)話系統(tǒng)能通過(guò)使用一個(gè)情節(jié)流(a flow of story)來(lái)產(chǎn)生答復(fù)句子。
專利文獻(xiàn)1“Artificial Unintelligence Review”,[在線],[于2003年3月14日(Heisei15)查到],互聯(lián)網(wǎng)<URLhttp//www.ycf.nanet.cojp/-skato/muno/review.htm>
然而,這個(gè)對(duì)話方法也有一些問(wèn)題。首先,由于語(yǔ)音對(duì)話系統(tǒng)只能根據(jù)假設(shè)用戶的答復(fù)內(nèi)容而事先設(shè)計(jì)出來(lái)的場(chǎng)景來(lái)講話,因此,在用戶說(shuō)出預(yù)料之外的話時(shí),該語(yǔ)音對(duì)話系統(tǒng)就不能做出響應(yīng)。
例如,對(duì)于能用“是/否”來(lái)答復(fù)的提問(wèn),如果用戶答復(fù)兩者皆可,但是,他從未想過(guò)這樣的一個(gè)事情或類似的事情,語(yǔ)音對(duì)話系統(tǒng)不能做出任何響應(yīng),即使做出響應(yīng),也只能是對(duì)用戶答復(fù)的極不合適的響應(yīng)。進(jìn)而,在這樣的情況下,以后情節(jié)變得不自然的可能性就會(huì)升高。
其次,難于設(shè)置以下兩輪出現(xiàn)比率的程度,即,一輪語(yǔ)音對(duì)話系統(tǒng)單方面講話和一輪語(yǔ)音對(duì)話系統(tǒng)向用戶提問(wèn)并進(jìn)而根據(jù)用戶對(duì)問(wèn)題的答復(fù)加以響應(yīng)。
實(shí)際上,在上述的語(yǔ)音對(duì)話系統(tǒng)中,如果前一輪太頻繁,那就造成語(yǔ)音對(duì)話系統(tǒng)單方面對(duì)用戶講話的印象,而用戶并不感覺(jué)到“正在進(jìn)行對(duì)話”。相反,如果后一輪太頻繁,那就造成這樣的感覺(jué),用戶是在答復(fù)對(duì)用戶的調(diào)查或查詢;在此情況下,用戶也不感覺(jué)到“在進(jìn)行對(duì)話”。
相應(yīng)地,可以考慮,通過(guò)解決常規(guī)的語(yǔ)音對(duì)話系統(tǒng)中的問(wèn)題,語(yǔ)音對(duì)話系統(tǒng)能和用戶進(jìn)行正常的對(duì)話,并能明顯地改進(jìn)可行性和娛樂(lè)能力。
發(fā)明內(nèi)容
本發(fā)明考慮到以上各點(diǎn),本發(fā)明于提供一種語(yǔ)音對(duì)話系統(tǒng)、語(yǔ)音對(duì)話方法和機(jī)器人設(shè)備,它們能夠和用戶進(jìn)行自然對(duì)話。
為了解決上述的問(wèn)題,根據(jù)本發(fā)明,在該語(yǔ)音對(duì)話系統(tǒng)中,提供了對(duì)話控制裝置,用于根據(jù)由話音識(shí)別裝置的話音識(shí)別結(jié)果并按照以前給出的場(chǎng)景來(lái)控制與用戶的對(duì)話,該話音識(shí)別裝置對(duì)用戶的講話進(jìn)行話音識(shí)別;還提供了響應(yīng)產(chǎn)生裝置,用于產(chǎn)生與用戶講話內(nèi)容相應(yīng)的答復(fù)句子,并響應(yīng)來(lái)自對(duì)話控制裝置的請(qǐng)求。對(duì)話控制裝置根據(jù)用戶講話的內(nèi)容對(duì)響應(yīng)產(chǎn)生裝置提出請(qǐng)求,以產(chǎn)生作為場(chǎng)合要求的答復(fù)句子。
因此,在該語(yǔ)音對(duì)話系統(tǒng)中,能夠防止與用戶的對(duì)話變得不自然,并且能給上述的用戶一種“正在進(jìn)行對(duì)話”的感覺(jué)。
此外,根據(jù)本發(fā)明,第一步是對(duì)用戶的講話進(jìn)行話音識(shí)別;第二步是根據(jù)話音識(shí)別的結(jié)果并按照以前給出的場(chǎng)景來(lái)控制與用戶的對(duì)話,如果需要,就產(chǎn)生與用戶講話的內(nèi)容相應(yīng)的答復(fù)句子;第三步是在再現(xiàn)的場(chǎng)景或在所產(chǎn)生的答復(fù)句子中對(duì)一個(gè)句子進(jìn)行語(yǔ)音合成處理。在第二步中,根據(jù)用戶講話的內(nèi)容并產(chǎn)生與用戶講話內(nèi)容相應(yīng)的、作為場(chǎng)合要求的答復(fù)句子。
因此,利用該語(yǔ)音對(duì)話方法,能防止與用戶的對(duì)話變得不自然,并能給上述的用戶一種“正在進(jìn)行對(duì)話”的感覺(jué)。
此外,根據(jù)本發(fā)明,在機(jī)器人設(shè)備中,提供了對(duì)話控制裝置,用于根據(jù)由話音識(shí)別裝置的話音識(shí)別結(jié)果并按照以前給出的場(chǎng)景來(lái)控制與用戶的對(duì)話,該話音識(shí)別裝置對(duì)用戶的講話進(jìn)行話音識(shí)別,還提供了響應(yīng)產(chǎn)生裝置,用于產(chǎn)生與用戶講話內(nèi)容相應(yīng)的答復(fù)句子,并響應(yīng)來(lái)自對(duì)話控制裝置的請(qǐng)求。對(duì)話控制裝置根據(jù)用戶講話的內(nèi)容對(duì)響應(yīng)產(chǎn)生裝置提出請(qǐng)求,以產(chǎn)生作為場(chǎng)合要求的答復(fù)句子。
結(jié)果,在此機(jī)器人裝置中,能夠防止與用戶的對(duì)話變得不自然,并能給上述的用戶一種“正在進(jìn)行對(duì)話”的感覺(jué)。
圖1是根據(jù)本發(fā)明的具體實(shí)施例示出了機(jī)器人的外部結(jié)構(gòu)的透視圖。
圖2是根據(jù)本發(fā)明的具體實(shí)施例示出了機(jī)器人的外部結(jié)構(gòu)的透視圖。
圖3是根據(jù)本發(fā)明的具體實(shí)施例來(lái)說(shuō)明機(jī)器人的外部結(jié)構(gòu)的概念圖。
圖4是根據(jù)本發(fā)明的具體實(shí)施例來(lái)說(shuō)明機(jī)器人的內(nèi)部結(jié)構(gòu)的概念圖。
圖5是根據(jù)本發(fā)明的具體實(shí)施例來(lái)說(shuō)明機(jī)器人的內(nèi)部結(jié)構(gòu)的方塊圖。
圖6是用于說(shuō)明由與對(duì)話控制相關(guān)的主控制部分處理的內(nèi)容的方塊圖。
圖7是用于說(shuō)明場(chǎng)景的結(jié)構(gòu)的概念圖。
圖8示出了每個(gè)塊的腳本格式(script format)示意圖。
圖9示出了單句場(chǎng)景塊的程序結(jié)構(gòu)的例子的示意圖。
圖10示出了再現(xiàn)單句場(chǎng)景塊的程序的流程圖。
圖11示出了提問(wèn)塊程序結(jié)構(gòu)的例子的示意圖。
圖12示出了再現(xiàn)提問(wèn)塊的過(guò)程的流程圖。
圖13示出了語(yǔ)義學(xué)定義文件的例子的示意圖。
圖14示出了第一提問(wèn)/答復(fù)塊的程序結(jié)構(gòu)的例子的示意圖。
圖15示出了再現(xiàn)第一提問(wèn)/答復(fù)塊的過(guò)程的流程圖。
圖16示出了要用在響應(yīng)產(chǎn)生部分中的標(biāo)簽的類型。
圖17示出了答復(fù)句子產(chǎn)生規(guī)則文件的例子的示意圖。
圖18示出了答復(fù)句子產(chǎn)生規(guī)則文件的例子的示意圖。
圖19示出了答復(fù)句子產(chǎn)生規(guī)則文件的例子的示意圖。
圖20示出了答復(fù)句子產(chǎn)生規(guī)則文件的例子的示意圖。
圖21示出了答復(fù)句子產(chǎn)生規(guī)則文件的例子的示意圖。
圖22示出了規(guī)則表的例子的示意圖。
圖23示出了第二提問(wèn)/答復(fù)塊的程序結(jié)構(gòu)的例子的示意圖。
圖24示出了再現(xiàn)第二個(gè)提問(wèn)/答復(fù)塊的過(guò)程的流程圖。
圖25示出了第三個(gè)提問(wèn)/答復(fù)塊的程序結(jié)構(gòu)的例子的示意圖。
圖26示出了再現(xiàn)第三個(gè)提問(wèn)/答復(fù)塊的過(guò)程的流程圖。
圖27示出了第四個(gè)提問(wèn)/答復(fù)塊的程序結(jié)構(gòu)的例子的示意圖。
圖28示出了再現(xiàn)第四提問(wèn)/答復(fù)塊的過(guò)程的流程圖。
圖29示出了第一對(duì)話塊的程序結(jié)構(gòu)的例子的示意圖。
圖30示出了第一對(duì)話塊的程序結(jié)構(gòu)的例子的示意圖。
圖31示出了再現(xiàn)第一對(duì)話塊的過(guò)程的流程圖。
圖32示出了插入提示的列表的概念圖。
圖33示出了第二對(duì)話塊的程序結(jié)構(gòu)的例子的示意圖。
圖34示出了第二對(duì)話塊的程序結(jié)構(gòu)的例子的示意圖。
圖35示出了再現(xiàn)第二對(duì)話塊的程序的流程圖。
圖36是說(shuō)明了人工非智能的對(duì)話系統(tǒng)的流程圖。
具體實(shí)施例方式
以下,參照附圖來(lái)詳細(xì)說(shuō)明本發(fā)明的實(shí)施例。
(1)根據(jù)實(shí)施例的機(jī)器人的普通結(jié)構(gòu)參照?qǐng)D1和圖2,附圖標(biāo)記1通常表示根據(jù)本發(fā)明的雙足機(jī)器人。頭部單元3是放置在軀干單元2之上,具有相同結(jié)構(gòu)的臂膀單元4A和4B分別放在軀干單元2的左上部分和右上部分,具有相同結(jié)構(gòu)的腿部單元5A和5B分別安裝在軀干單元2的左下部分和右下部分的預(yù)定位置上。
在軀干單元2中,構(gòu)成軀干上部分的框架10和構(gòu)成軀干下部分的腰基11通過(guò)腰關(guān)節(jié)機(jī)構(gòu)12連接起來(lái)。腰關(guān)節(jié)機(jī)構(gòu)12的致動(dòng)器A1和A2是分別驅(qū)動(dòng)的,腰關(guān)節(jié)機(jī)構(gòu)12固定在構(gòu)成軀干下部分形成的腰基11上,從而,如圖3所示,軀干的上部分能夠隨著彼此正交的輥軸13和俯仰軸14的各自獨(dú)立的轉(zhuǎn)動(dòng)而轉(zhuǎn)動(dòng)。
頭部單元3是安裝在肩基15的頂端的中心部位上,而肩基15是通過(guò)頸關(guān)節(jié)機(jī)構(gòu)16固定在框架10的上端。分別驅(qū)動(dòng)上述的頸關(guān)節(jié)機(jī)構(gòu)16的致動(dòng)器A3和A4,從而,如圖3所示,頭部單元3能夠隨著彼此正交的俯仰軸17和偏轉(zhuǎn)軸18的各自獨(dú)立的轉(zhuǎn)動(dòng)而轉(zhuǎn)動(dòng)。
胳膊單元4A和4B通過(guò)肩關(guān)節(jié)機(jī)構(gòu)19分別安裝在肩基15的左端和右端。分別驅(qū)動(dòng)相應(yīng)的肩關(guān)節(jié)機(jī)構(gòu)19的致動(dòng)器A5和A6,從而,如圖3所示,相應(yīng)于彼此正交的俯仰軸20和輥軸21的轉(zhuǎn)動(dòng),能夠分別獨(dú)立地轉(zhuǎn)動(dòng)胳膊單元4A和4B。
在此情況下,在胳膊單元4A和4B的每一個(gè)之中,構(gòu)成前臂部分的致動(dòng)器A8通過(guò)臂關(guān)節(jié)機(jī)構(gòu)22和構(gòu)成上臂部分的致動(dòng)器A7的輸出軸相連。手部分23安裝在上述的前臂部分的端部。
在胳膊單元4A和4B中,通過(guò)驅(qū)動(dòng)致動(dòng)器A7,前臂部分能夠隨著圖3所示的偏轉(zhuǎn)軸24的轉(zhuǎn)動(dòng)而轉(zhuǎn)動(dòng),通過(guò)驅(qū)動(dòng)致動(dòng)器A8,前臂部分也能夠隨著圖3所示的俯仰軸25的轉(zhuǎn)動(dòng)而轉(zhuǎn)動(dòng)。
在另一方面,通過(guò)髖關(guān)節(jié)機(jī)構(gòu)26分別將腿單元5A和5B安裝在構(gòu)成軀干下部的腰基11上。分別驅(qū)動(dòng)相應(yīng)的髖關(guān)節(jié)機(jī)構(gòu)26的致動(dòng)器A9和A11,從而,如圖3所示,隨著彼此正交的偏轉(zhuǎn)軸27、輥軸28和俯仰軸29的轉(zhuǎn)動(dòng)能夠分別獨(dú)立地轉(zhuǎn)動(dòng)髖關(guān)節(jié)機(jī)構(gòu)26。
在此情況下,在腿單元5A和5B的每一個(gè)之中,構(gòu)成大腿下面部分的框架32通過(guò)膝關(guān)節(jié)機(jī)構(gòu)31與構(gòu)成大腿部分的框架30的下端相連,腳部分34通過(guò)踝關(guān)節(jié)機(jī)構(gòu)33與上述框架32的下端相連。
因此,在腿單元5A和5B中,通過(guò)驅(qū)動(dòng)構(gòu)成膝關(guān)節(jié)機(jī)構(gòu)31的致動(dòng)器A12可以讓大腿下面部分隨著圖3所示的俯仰軸35的轉(zhuǎn)動(dòng)而轉(zhuǎn)動(dòng)。進(jìn)而,通過(guò)分別驅(qū)動(dòng)踝關(guān)節(jié)機(jī)構(gòu)33的致動(dòng)器A13和A14可以讓腳部分34隨著圖3所示的、彼此正交的俯仰軸36和輥軸37的轉(zhuǎn)動(dòng)而分別獨(dú)立地轉(zhuǎn)動(dòng)。
如圖4所示,在構(gòu)成人體單元2的軀干的下面部分的腰基11的背面上,安置了控制單元42,其中,用于控制上述的機(jī)器人1的全部運(yùn)動(dòng)的主控制部分40、如像電源電路和通信電路的外圍電路41和電池45等(圖5)含于盒子之中。
控制單元42與各個(gè)子控制部分43A到43D相連,而這些子控制單元又分別安裝在一些組成單元(人體單元2、頭部單元3、胳膊單元4A和4B、腿單元5A和5B)之中。因而,可將必要的電源電壓提供給這些子控制部分43A到43D上,并且,控制單元42能夠和這些子控制部分43A到43D進(jìn)行通信。
子控制部分43A到43D中的每一個(gè)都與分別在相應(yīng)的組成單元中的致動(dòng)器A1到A14相連,因此,能將在上述的組成單元中的每個(gè)致動(dòng)器A1到A14驅(qū)動(dòng)到規(guī)定的狀態(tài),這個(gè)狀態(tài)是根據(jù)從主控制部分40給出的各種控制命令分別指定的。
如圖5所示,在頭部單元3中,各種外部傳感器都分別安裝在預(yù)定的位置上,這些外部傳感器如像起著機(jī)器人1的眼睛作用的電荷耦合器件(CCD)像機(jī)50、起著耳朵作用的麥克風(fēng)51、起著嘴巴作用的揚(yáng)聲器52。
觸摸傳感器53作為外部傳感器安置在手部分23和腳部分34上。此外,在控制部件42中,還包含如像電池傳感器54和加速傳感器55的內(nèi)部傳感器。
CCD像機(jī)50攝取周圍的圖像,并將所得到的視頻信號(hào)S1A發(fā)送給主控制部分40。麥克風(fēng)51拾取各種外部聲音,并將所得到的音頻信號(hào)S1B發(fā)送給主控制部分40。每一個(gè)觸摸傳感器53都檢測(cè)在外部物體上的物理接觸,并將檢測(cè)的結(jié)果作為壓力檢測(cè)信號(hào)S1C發(fā)送給主控制部分40。
電池傳感器54在預(yù)定周期中檢測(cè)電池45的剩余量,并將檢測(cè)的結(jié)果作為剩余電池檢測(cè)信號(hào)S2A發(fā)送給主控制部分40。加速傳感器55在預(yù)定周期中檢測(cè)三個(gè)軸向(x軸、y軸和z軸)上的加速,并將檢測(cè)的結(jié)果作為加速檢測(cè)信號(hào)S2B發(fā)送給主控制部分40。
主控制部分40的配置有具有中央處理器(CPU)的微型計(jì)算機(jī)、用作為只讀存儲(chǔ)器(ROM)的內(nèi)部存儲(chǔ)器40A和隨機(jī)存取存儲(chǔ)器(RAM)等。主控制器40根據(jù)外部傳感器信號(hào)S1和內(nèi)部傳感器信號(hào)S2,并通過(guò)確定是否觸摸了外部的物體來(lái)確定機(jī)器人1的周圍的狀態(tài)和內(nèi)部的狀態(tài),如像視頻信號(hào)S1A、音頻信號(hào)S1B和壓力檢測(cè)信號(hào)S1C之類的外部傳感器信號(hào)S1,分別是由如像CCD攝像機(jī)50、麥克風(fēng)51和觸摸傳感器53的各個(gè)外部傳感器提供的,如像剩余電池檢測(cè)信號(hào)S2A和加速檢測(cè)信號(hào)S2B的內(nèi)部傳感器信號(hào)S2,分別是由如像電池感測(cè)器54和加速感測(cè)器55的各個(gè)內(nèi)部感測(cè)器提供的。
然后,主控制器部分40根據(jù)確定結(jié)果、事先存儲(chǔ)在內(nèi)部存儲(chǔ)器40A中的控制程序以及存儲(chǔ)在那時(shí)裝載的外部存儲(chǔ)器56中的內(nèi)部參數(shù)來(lái)確定下一個(gè)運(yùn)動(dòng),并根據(jù)確定結(jié)果將控制命令發(fā)送到相應(yīng)的子控制部分43A-43D之中。結(jié)果,在子控制部分43A-43D的控制下,根據(jù)控制命令驅(qū)動(dòng)相應(yīng)的致動(dòng)器A1-A14。這樣,就可以由機(jī)器人執(zhí)行各種運(yùn)動(dòng),如像在所有方向上擺動(dòng)頭部單元3,抬舉胳膊單元4A和4B以及走路。
主控制部分40通過(guò)對(duì)由麥克風(fēng)51提供的上述音頻信號(hào)S1B的預(yù)定話音識(shí)別處理來(lái)識(shí)別用戶講話的內(nèi)容,并根據(jù)上述的識(shí)別向揚(yáng)聲器52提供音頻信號(hào)S3。從而,向外面發(fā)出合成話音以與用戶進(jìn)行對(duì)話。
按照這種方式,機(jī)器人1能夠根據(jù)周圍的狀態(tài)和內(nèi)部的狀態(tài)自動(dòng)移動(dòng),并且也能和用戶進(jìn)行對(duì)話。
(2)由與對(duì)話控制相關(guān)的主控制部分40進(jìn)行的處理(2-1)由與對(duì)話控制相關(guān)的主控制部分40進(jìn)行處理的內(nèi)容下面將要說(shuō)明由與對(duì)話控制相關(guān)的主控制部分40進(jìn)行處理的內(nèi)容。
如圖6所示,如果按照功能對(duì)在機(jī)器人1中、由與對(duì)話控制相關(guān)的主控制部分40進(jìn)行處理的內(nèi)容進(jìn)行分類,可以分為如下幾類話音識(shí)別部分60,用以對(duì)用戶發(fā)出的語(yǔ)音進(jìn)行語(yǔ)音識(shí)別;場(chǎng)景再現(xiàn)部分62,用于根據(jù)預(yù)先給定的場(chǎng)景,并根據(jù)上述話音識(shí)別部分60的識(shí)別結(jié)果來(lái)控制與用戶的對(duì)話;響應(yīng)產(chǎn)生部分63,用以產(chǎn)生響應(yīng)來(lái)自場(chǎng)景再現(xiàn)部分62的請(qǐng)求的答復(fù)句子;和語(yǔ)音合成部分64,用以產(chǎn)生由場(chǎng)景再現(xiàn)部分62再現(xiàn)的場(chǎng)景61的一個(gè)句子或由響應(yīng)產(chǎn)生部分63產(chǎn)生的答復(fù)句子的合成語(yǔ)音。應(yīng)當(dāng)說(shuō)明的是,在下面的說(shuō)明中,限定“一個(gè)句子”表示講話時(shí)暫停的一個(gè)單元,這就是說(shuō),“一個(gè)句子”可能并不總是“一句話”。
在此,話音識(shí)別部分60具有根據(jù)由麥克風(fēng)51提供的音頻信號(hào)S1B來(lái)執(zhí)行預(yù)定的話音識(shí)別處理的功能(圖5),并能識(shí)別在話語(yǔ)單元(word unit)中的含于上述音頻信號(hào)S1B中的話音。話音識(shí)別部分60向場(chǎng)景再現(xiàn)部分62提供這些識(shí)別出來(lái)的作為字符串?dāng)?shù)據(jù)D1的詞語(yǔ)。
場(chǎng)景再現(xiàn)部分62通過(guò)從上述外存儲(chǔ)器56到內(nèi)存儲(chǔ)器40A中讀取在多輪(turn)對(duì)話上提供的多種場(chǎng)景61的數(shù)據(jù)來(lái)管理話音(提示),該話音是通過(guò)將其存儲(chǔ)在外部存儲(chǔ)器56中而事先給定的(圖5),并應(yīng)是在與用戶的一系列的對(duì)話過(guò)程中由上述的機(jī)器人1說(shuō)出來(lái)的。
在與用戶對(duì)話時(shí),在這些多種場(chǎng)景61中,場(chǎng)景再現(xiàn)部分62選擇適合用戶的場(chǎng)景61并再現(xiàn)場(chǎng)景61,該用戶是由面孔識(shí)別部分(未示出)根據(jù)由CCD像器50(圖5)提供的圖像信號(hào)S1A而被識(shí)別和鑒定出來(lái)的,并成為對(duì)話的另一方。于是,將與由機(jī)器人1發(fā)出的相應(yīng)語(yǔ)音的字符串?dāng)?shù)據(jù)D2順序地提供給語(yǔ)音合成部分64。
進(jìn)而,如果場(chǎng)景再現(xiàn)部分62根據(jù)由話音識(shí)別部分60提供的字符串?dāng)?shù)據(jù)D1確認(rèn)用戶對(duì)機(jī)器人1的提問(wèn)給出了意想不到的話作為答復(fù),那么,場(chǎng)景再現(xiàn)部分62就向響應(yīng)產(chǎn)生部分63提供上述的字符串?dāng)?shù)據(jù)D1和答復(fù)句子產(chǎn)生請(qǐng)求COM。
由非人工智能模塊構(gòu)成響應(yīng)產(chǎn)生部分63,以便用如像Eliza引擎的簡(jiǎn)單答復(fù)句子產(chǎn)生算法來(lái)生成答復(fù)句子。如果答復(fù)句子產(chǎn)生請(qǐng)求COM是由場(chǎng)景再現(xiàn)部分62提供的,響應(yīng)產(chǎn)生部分63就根據(jù)字符串?dāng)?shù)據(jù)D1來(lái)產(chǎn)生答復(fù)句子,該字符串?dāng)?shù)據(jù)D1是和答復(fù)句子產(chǎn)生請(qǐng)求COM一起提供的,并通過(guò)場(chǎng)景再現(xiàn)部分62將它的字符串?dāng)?shù)據(jù)D3提供給語(yǔ)音合成部分64。
語(yǔ)音合成部分64根據(jù)由場(chǎng)景再現(xiàn)部分62提供的字符串?dāng)?shù)據(jù)D2或由響應(yīng)產(chǎn)生部分63提供的字符串?dāng)?shù)據(jù)D3,并通過(guò)上述的場(chǎng)景再現(xiàn)部分62來(lái)產(chǎn)生合成語(yǔ)音,并將所獲得的上述合成語(yǔ)音的音頻信號(hào)S3提供給話筒52(圖5)。從而,從話筒52發(fā)出基于音頻信號(hào)S3的合成語(yǔ)音。
按照這個(gè)方式,在機(jī)器人1中,通過(guò)合成“有場(chǎng)景的對(duì)話”和“沒(méi)有場(chǎng)景的對(duì)話”能夠進(jìn)行講話。例如,即使用戶對(duì)機(jī)器人1的提問(wèn)作了意想不到的答復(fù),機(jī)器人1也能合適地響應(yīng)這個(gè)答復(fù)。
(2-2)場(chǎng)景61的結(jié)構(gòu)(2-2-1)場(chǎng)景61的一般結(jié)構(gòu)下面,將要說(shuō)明在機(jī)器人1中的場(chǎng)景61的結(jié)構(gòu)。
如圖7所示,在機(jī)器人1的情況下,通過(guò)按照任意次序排列任意數(shù)量的多種塊BL(BL1-BL8)來(lái)形成每個(gè)場(chǎng)景61,這些塊為一輪對(duì)話中(one turn)提供機(jī)器人1的動(dòng)作,該對(duì)話包括應(yīng)當(dāng)由機(jī)器人1說(shuō)出的一個(gè)句子。
在此,在機(jī)器人1的情況下,作為在與用戶的對(duì)話中對(duì)包含機(jī)器人1講話內(nèi)容在一輪提供動(dòng)作的上述程序(以下稱之為塊BL(BL1-BL8)),有八個(gè)類型的塊BL1-BL8。接著,將要說(shuō)明這八個(gè)類型的塊BL1-BL8的結(jié)構(gòu)以及用場(chǎng)景再現(xiàn)部分62來(lái)再現(xiàn)這八個(gè)類型的塊BL1-BL8中的每一個(gè)的過(guò)程。
要注意的是,下面將要說(shuō)明的“單句場(chǎng)景塊BL1”和“提問(wèn)塊BL2”已經(jīng)存在了,其后將要說(shuō)明的塊BL3-BL8中的每一個(gè)都從未存在過(guò),并且這些塊對(duì)機(jī)器人1而言,都是特別的。
此外,在下面的圖9、11、14、23、25、27、29、30、33和34中,將根據(jù)圖8所示的規(guī)則來(lái)說(shuō)明每個(gè)腳本(程序結(jié)構(gòu))。在每個(gè)塊BL的再現(xiàn)處理中,場(chǎng)景再現(xiàn)部分62向語(yǔ)音合成部分64提供字符串?dāng)?shù)據(jù)D2,并根據(jù)這個(gè)規(guī)則向響應(yīng)產(chǎn)生部分63給出答復(fù)句子產(chǎn)生請(qǐng)求。
(2-2-2)單句場(chǎng)景塊BL1在場(chǎng)景61中,單句場(chǎng)景塊BL1是僅由一個(gè)句子組成,例如,它有圖9所示的程序結(jié)構(gòu)。
在再現(xiàn)單句場(chǎng)景塊BL1時(shí),根據(jù)圖10所示的再現(xiàn)單句場(chǎng)景塊RT1的過(guò)程,在步驟SP1中,場(chǎng)景再現(xiàn)部分62再現(xiàn)由塊制造者提供的一個(gè)句子,并將它的字符串?dāng)?shù)據(jù)D2提供給語(yǔ)音合成部分64。然后,場(chǎng)景再現(xiàn)部分62停止該單句場(chǎng)景塊BL1的再現(xiàn)處理,然后,繼續(xù)進(jìn)行下面的塊BL的再現(xiàn)處理。
(2-2-3)提問(wèn)塊BL2提問(wèn)塊BL2是在向用戶提問(wèn)題或類似情況下所用的塊BL,例如,它有圖11所示的程序結(jié)構(gòu)。在提問(wèn)塊BL2中,它促使用戶講話,并且機(jī)器人1根據(jù)用戶對(duì)提問(wèn)的答復(fù)是否是肯定的,說(shuō)出由塊制作者提供的、肯定或否定的提示。
實(shí)際上,在再現(xiàn)提問(wèn)塊BL2時(shí),根據(jù)圖12所示的再現(xiàn)提問(wèn)塊RT2的過(guò)程,首先,在步驟SP10中,場(chǎng)景再現(xiàn)部分62再現(xiàn)由塊制造者提供的一個(gè)句子,將它的字符串?dāng)?shù)據(jù)D2提供給語(yǔ)音合成部分64。然后,在下面的步驟SP11中,場(chǎng)景再現(xiàn)部分62等待用戶對(duì)此的答復(fù)(講話)。
如果很快識(shí)別了根據(jù)來(lái)自話音識(shí)別部分60的字符串?dāng)?shù)據(jù)D1答復(fù)的用戶,場(chǎng)景再現(xiàn)部分62繼續(xù)進(jìn)行步驟SP12,以確定答復(fù)的內(nèi)容是否是肯定的。
如果在步驟SP12中得到的是肯定的結(jié)果,場(chǎng)景再現(xiàn)部分62就繼續(xù)進(jìn)行步驟SP13,以再現(xiàn)肯定的答復(fù)句子,并將它的字符串?dāng)?shù)據(jù)D2提供給語(yǔ)音合成部分64,以及停止該提問(wèn)塊BL2的再現(xiàn)處理,然后,場(chǎng)景再現(xiàn)部分62繼續(xù)進(jìn)行下面的塊BL的再現(xiàn)處理。
與此相反,如果在步驟SP12中得到的是否定的結(jié)果,場(chǎng)景再現(xiàn)部分62就繼續(xù)進(jìn)行步驟SP14,以確定在步驟SP11中所識(shí)別的用戶的答復(fù)是否是否定的。
如果在步驟SP14中得到的是肯定的結(jié)果,場(chǎng)景再現(xiàn)部分62就繼續(xù)進(jìn)行步驟SP15,以再現(xiàn)否定的答復(fù)句子,并將它的字符串?dāng)?shù)據(jù)D2提供給語(yǔ)音合成部分64,然后停止該提問(wèn)塊BL2的再現(xiàn)處理,然后,場(chǎng)景再現(xiàn)部分62繼續(xù)進(jìn)行下面的塊BL的再現(xiàn)處理。
與此相反,如果在步驟SP14中得到的是否定的結(jié)果,場(chǎng)景再現(xiàn)部分62就停止按原樣該提問(wèn)塊BL2的再現(xiàn)處理。然后,場(chǎng)景再現(xiàn)部分62繼續(xù)進(jìn)行下面的塊BL的再現(xiàn)處理。
注意的是,在機(jī)器人1的情況下,作為用于確定用戶的響應(yīng)是肯定還是否定的裝置,場(chǎng)景再現(xiàn)部分62有圖13中示出的語(yǔ)義定義文件。
場(chǎng)景再現(xiàn)部分62參照該語(yǔ)義定義文件并根據(jù)由話音識(shí)別部分60提供的字符串?dāng)?shù)據(jù)D1來(lái)確定用戶的答復(fù)是肯定的還是否定的。
(2-2-4)第一提問(wèn)/答復(fù)塊BL3(無(wú)循環(huán))類似于上述的提問(wèn)塊BL2,第一提問(wèn)/答復(fù)塊BL3是一個(gè)用在向用戶提問(wèn)或類似情況下的塊BL,并且,例如有示于圖14中的程序結(jié)構(gòu)。第一提問(wèn)/答復(fù)塊BL3是這樣設(shè)計(jì)的,以致即使用戶對(duì)提問(wèn)等的答復(fù)既不是肯定的也不是否定的,機(jī)器人1也能做出響應(yīng)。
實(shí)際上,在再現(xiàn)第一提問(wèn)/答復(fù)塊BL3時(shí),根據(jù)示于圖15的再現(xiàn)第一提問(wèn)/答復(fù)塊的過(guò)程,首先,就步驟SP20-SP25而言,場(chǎng)景再現(xiàn)部分62進(jìn)行與上述再現(xiàn)提問(wèn)塊RT2的過(guò)程的步驟SP10-SP14類似的處理(圖12)。
如果在步驟SP24中得到否定的結(jié)果,場(chǎng)景再現(xiàn)部分62就向響應(yīng)產(chǎn)生部分63(圖6)提供答復(fù)句子產(chǎn)生請(qǐng)求COM和表示某種規(guī)則的標(biāo)簽,以便用由話音識(shí)別部分60在那時(shí)提供的字符串?dāng)?shù)據(jù)D1來(lái)產(chǎn)生如示于圖16中的、要產(chǎn)生的答復(fù)句子(SPECIFIC、GENERAL、LAST、SPECFIC ST、GENERAL ST、LAST)。注意的是,塊的制作者已經(jīng)確定了此時(shí)要由場(chǎng)景再現(xiàn)部分62提供給響應(yīng)產(chǎn)生部分63的標(biāo)簽(例如,見(jiàn)圖14中的節(jié)點(diǎn)號(hào)為“1060”的那行)。
此時(shí),在圖17-21的例子中,響應(yīng)產(chǎn)生部分63具有多個(gè)文件,其中,按照分別對(duì)應(yīng)于要產(chǎn)生的答復(fù)句子的每一種產(chǎn)生規(guī)則,提供了相應(yīng)答復(fù)句子的產(chǎn)生規(guī)則。此外,響應(yīng)產(chǎn)生部分63具有示于圖22中的規(guī)則表,其中,已將這些文件與要由場(chǎng)景再現(xiàn)部分62提供的標(biāo)簽關(guān)聯(lián)。
按照這種方式,響應(yīng)產(chǎn)生部分63參看這個(gè)規(guī)則表,并且,那時(shí)根據(jù)該文件、由場(chǎng)景再現(xiàn)部分62提供的標(biāo)簽和由話音識(shí)別部分60提供的字符串?dāng)?shù)據(jù)D1,響應(yīng)產(chǎn)生部分63依照相應(yīng)的答復(fù)句子產(chǎn)生規(guī)則產(chǎn)生答復(fù)句子,并通過(guò)場(chǎng)景再現(xiàn)部分62將它的字符串?dāng)?shù)據(jù)D3提供給語(yǔ)音合成部分64。
然后,場(chǎng)景再現(xiàn)部分62停止此第一提問(wèn)/答復(fù)塊BL3的再現(xiàn)處理,并繼續(xù)進(jìn)行在此之后的塊BL的再現(xiàn)處理。
(2-2-5)第二提問(wèn)/答復(fù)塊BL4(循環(huán)類型1)與提問(wèn)塊BL2相似,第二提問(wèn)/答復(fù)塊BL4是用在向用戶提問(wèn)等的情況下的一個(gè)塊BL,例如,它有示于圖23中的程序結(jié)構(gòu)。在用戶對(duì)提問(wèn)等的答復(fù)既不是肯定又不是否定的情況下,考慮到在響應(yīng)產(chǎn)生部分63中要產(chǎn)生的答復(fù)句子內(nèi)容,第二提問(wèn)/答復(fù)塊BL4將用于防止對(duì)話變得不自然。
具體地說(shuō),例如,在再現(xiàn)上面用圖15說(shuō)明的第一提問(wèn)/答復(fù)塊RT3的過(guò)程的步驟SP26中,在響應(yīng)產(chǎn)生部分63產(chǎn)生請(qǐng)求句(例如,“試用不同的話來(lái)說(shuō)相同的事情”)或提問(wèn)句(例如,“這是真的嗎?”)的情況下,如果在完成了步驟SP26的處理之后,場(chǎng)景再現(xiàn)部分62繼續(xù)進(jìn)行下一個(gè)塊BL的再現(xiàn)處理,用戶就不能答復(fù)請(qǐng)求或提問(wèn),因此,對(duì)話就變得不自然了。
因此,在第二提問(wèn)/答復(fù)塊BL4中設(shè)計(jì)是這樣的,以致在響應(yīng)產(chǎn)生部分63產(chǎn)生答復(fù)句子時(shí),在可能產(chǎn)生用戶能像上面的答復(fù)句子那樣,用“是”或“否”來(lái)響應(yīng)的提問(wèn)句的情況下,就能夠接受用戶對(duì)此提問(wèn)的響應(yīng)。
實(shí)際上,在再現(xiàn)第二提問(wèn)/答復(fù)塊BL4時(shí),根據(jù)圖24中所示的再現(xiàn)第二提問(wèn)/答復(fù)塊BL4,就步驟SP30-SP36而言,場(chǎng)景再現(xiàn)部分62進(jìn)行與上述過(guò)程中的步驟SP20-SP26相似的處理,以便再現(xiàn)第三個(gè)塊RT3。
在步驟SP36中,場(chǎng)景再現(xiàn)部分62請(qǐng)求響應(yīng)產(chǎn)生部分63產(chǎn)生答復(fù)句子。照此方式,如果接收由響應(yīng)產(chǎn)生部分63產(chǎn)生的答復(fù)句子的字符串?dāng)?shù)據(jù)D3,場(chǎng)景再現(xiàn)部分62就將其提供給語(yǔ)音合成部分64,并確定此答復(fù)句子是否是循環(huán)類型(loop type)。
明確地說(shuō),響應(yīng)產(chǎn)生部分63是這樣來(lái)設(shè)計(jì)的,以便在向場(chǎng)景再現(xiàn)部分62提供通過(guò)接收?qǐng)鼍霸佻F(xiàn)部分62的請(qǐng)求而產(chǎn)生的答復(fù)句子的字符串?dāng)?shù)據(jù)D3時(shí),并在答復(fù)句子是提問(wèn)句的情況下,用戶能夠用“是”或“否”來(lái)答復(fù),它將表明答復(fù)句子是第一循環(huán)類型的屬性信息加到上述字符串?dāng)?shù)據(jù)D3,在答復(fù)句子是用戶不能用“是”或“否”來(lái)答復(fù)的請(qǐng)求句或類似句子的情況下,它將表明答復(fù)句子是第二循環(huán)類型的屬性信息加到上述的字符串?dāng)?shù)據(jù)D3上,在答復(fù)句子是用戶不必響應(yīng)的陳述句的情況下,就把表明答復(fù)句子是非循環(huán)類的屬性信息加到上述的字符串?dāng)?shù)據(jù)D3。
照此方式,在再現(xiàn)此第二提問(wèn)/答復(fù)塊BL4時(shí),在再現(xiàn)第二提問(wèn)/答復(fù)塊BL4的過(guò)程的步驟SP36中,根據(jù)由響應(yīng)產(chǎn)生部分63用答復(fù)句子的字符串?dāng)?shù)據(jù)D3提供的上述答復(fù)句子的屬性信息,如果答復(fù)句子是第一循環(huán)類型,場(chǎng)景再現(xiàn)部分62就回到步驟SP31,隨后,重復(fù)步驟SP31-SP36的處理,直到在步驟SP37得到肯定的結(jié)果為止。
如果在步驟SP37中很快得到肯定的結(jié)果,響應(yīng)產(chǎn)生部分63就產(chǎn)生無(wú)循環(huán)類型的答復(fù)句子,場(chǎng)景再現(xiàn)部分62就停止第二提問(wèn)/答復(fù)塊BL4再現(xiàn)處理,然后再繼續(xù)進(jìn)行在此之后的塊BL的再現(xiàn)處理。
(2-2-6)第三提問(wèn)/答復(fù)塊BL5(循環(huán)類型2)與第二提問(wèn)/答復(fù)塊BI4相似,在用戶對(duì)提問(wèn)等的響應(yīng)既不是肯定的又不是否定的情況下,考慮到要在響應(yīng)產(chǎn)生部分63中產(chǎn)生的答復(fù)句子的內(nèi)容,第三提問(wèn)/答復(fù)塊BL5是用于防止對(duì)話變得不自然的塊,例如,它具有圖25中所示的程序結(jié)構(gòu)。
在此情況下,在第三提問(wèn)/答復(fù)塊BL5中,是這樣設(shè)計(jì)的,以致在響應(yīng)產(chǎn)生部分63產(chǎn)生答復(fù)句子時(shí),在如像上面那樣的答復(fù)句子的情況下,產(chǎn)生了用戶不能用“是”或“否”來(lái)答復(fù)的句子,例如,如像“試用不同的話來(lái)說(shuō)同一件事情”之類的請(qǐng)求句或者是如像“你對(duì)此作何想法?”之類的提問(wèn)句,此時(shí),就能接受用戶對(duì)它的響應(yīng)并且機(jī)器人1也能對(duì)此做出響應(yīng)。
實(shí)際上,在再現(xiàn)第三提問(wèn)/答復(fù)塊BL5時(shí),根據(jù)再現(xiàn)圖26中所示的第三提問(wèn)/答復(fù)塊RT5的過(guò)程,就步驟SP40-SP46而言,場(chǎng)景再現(xiàn)部分62進(jìn)行與再現(xiàn)第一提問(wèn)/答復(fù)塊RT3的上述過(guò)程中的步驟SP20-SP26相似的處理(圖15)。
接著,場(chǎng)景再現(xiàn)部分62進(jìn)行到步驟SP47,以便根據(jù)加到由響應(yīng)產(chǎn)生部分63提供的、字符串?dāng)?shù)據(jù)D3的屬性信息來(lái)確定基于字符串?dāng)?shù)據(jù)D3的答復(fù)句子是否是上述的第二循環(huán)類型。
在響應(yīng)句子為第二循環(huán)類型的情況下,場(chǎng)景再現(xiàn)部分62回到步驟SP46,隨后,重復(fù)步驟SP46-SP48-SP46的處理,直到在步驟SP47中得到否定結(jié)果為止。
在步驟SP47中,如果很快地得到了肯定的結(jié)果,響應(yīng)產(chǎn)生部分63就產(chǎn)生非循環(huán)類型的答復(fù)句子,而場(chǎng)景再現(xiàn)部分62就停止第三提問(wèn)/答復(fù)塊BL5的再現(xiàn)程序,然后再繼續(xù)進(jìn)行在此之后的塊BL的再現(xiàn)處理。
(2-2-7)第四提問(wèn)/答復(fù)塊BL6(循環(huán)類型3)與第二和第三提問(wèn)/答復(fù)塊BL4和BL5相似,在用戶對(duì)提問(wèn)等的響應(yīng)既不是肯定的又不是否定的情況下,考慮到要在響應(yīng)產(chǎn)生部分63中產(chǎn)生的答復(fù)句子的內(nèi)容,第四提問(wèn)/答復(fù)塊BL6是用于防止對(duì)話變得不自然的塊,例如,它有著圖27中所示的那樣的程序結(jié)構(gòu)。
在此情況下,在第四提問(wèn)/答復(fù)塊BL6中,是這樣設(shè)計(jì)的,以致場(chǎng)景再現(xiàn)部分62能夠應(yīng)付響應(yīng)產(chǎn)生部分63產(chǎn)生的答復(fù)句子是上述的第一循環(huán)類型和第二循環(huán)類型的兩種情況。
實(shí)際上,在再現(xiàn)第四提問(wèn)/答復(fù)塊BL6時(shí),根據(jù)再現(xiàn)示于圖28中的第四提問(wèn)/答復(fù)塊BL6的過(guò)程,就步驟SP50-SP56而言,場(chǎng)景再現(xiàn)部分62進(jìn)行與再現(xiàn)第一提問(wèn)/答復(fù)塊RT3的上述過(guò)程中的步驟SP20-SP26相似的處理(圖15)。
在步驟SP56的處理之后,場(chǎng)景再現(xiàn)部分62繼續(xù)進(jìn)行到步驟SP57,以便根據(jù)加到由響應(yīng)產(chǎn)生部分63提供的字符串?dāng)?shù)據(jù)D3的屬性信息來(lái)確定所產(chǎn)生的答復(fù)句子是否是上述第一循環(huán)類型的還是第二循環(huán)類型。
在答復(fù)句子是第一循環(huán)類型或者是第二循環(huán)類型的情況下,場(chǎng)景再現(xiàn)部分62繼續(xù)進(jìn)行步驟SP58,以確定上述答復(fù)句子是否是第一循環(huán)類型的。
如果在步驟SP58中得到的是肯定的結(jié)果,場(chǎng)景再現(xiàn)部分62就回到步驟SP51。如果在步驟SP58中得到的是否定結(jié)果,場(chǎng)景再現(xiàn)部分62就繼續(xù)進(jìn)行到步驟59以等待用戶的響應(yīng)。如果很快做出了響應(yīng),場(chǎng)景再現(xiàn)部分62就根據(jù)來(lái)自話音識(shí)別部分60的字符串?dāng)?shù)據(jù)D1來(lái)識(shí)別這個(gè),然后回到步驟SP56。此后,場(chǎng)景再現(xiàn)部分62重復(fù)步驟SP51-SP59的處理,直到在步驟SP57中得到否定的結(jié)果為止。
如果在步驟SP57中,很快地得到了肯定的結(jié)果,響應(yīng)產(chǎn)生部分63就產(chǎn)生非循環(huán)類的答復(fù)句子,而場(chǎng)景再現(xiàn)部分62就停止第四提問(wèn)/答復(fù)塊BL6的再現(xiàn)處理,然后再繼續(xù)進(jìn)行在此之后的塊BL的再現(xiàn)處理。
(2-2-8)第一對(duì)話塊BL(無(wú)循環(huán))第一對(duì)話塊BL7是用于增加使用戶講話的機(jī)會(huì)的塊BL,它具有如圖29和30所示的程序結(jié)構(gòu)。注意的是,例如,圖29示出了在有提示的情況下的程序結(jié)構(gòu)的例子,而圖30示出了在沒(méi)有提示的情況下的程序結(jié)構(gòu)的例子。
例如,通過(guò)將第一對(duì)話塊BL7直接放在上面圖9和圖10所述一個(gè)句子場(chǎng)景塊BL1之后,能夠增加對(duì)話的輪次;它能給用戶一個(gè)“正在進(jìn)行對(duì)話”的感覺(jué)。
此外,例如,通過(guò)讓機(jī)器人1再現(xiàn)話語(yǔ)(提示),如像“我也這樣想?!?,“那是錯(cuò)誤的嗎?”和“你是怎么想的?”,用戶就變得易于表達(dá)。因此,在第一對(duì)話塊BL7中,是這樣設(shè)計(jì)的,以使得在等待用戶講話之前,場(chǎng)景再現(xiàn)部分62再現(xiàn)一個(gè)示于圖中的句子(提示)。然而,由于在緊前面再現(xiàn)的塊BL中,根據(jù)機(jī)器人1講話的內(nèi)容,這個(gè)句子有時(shí)變成為不必要的了,因此,將其設(shè)計(jì)為是可省略的。
實(shí)際上,在再現(xiàn)第一對(duì)話塊BL7時(shí),根據(jù)再現(xiàn)示于圖31中的第一對(duì)話塊RT7的程序,首先,在步驟SP60中,場(chǎng)景再現(xiàn)部分62再現(xiàn)示于圖中的可省略的提示,該提示是由塊制作者按照?qǐng)龊弦蠖峁┑?,然后,在下一個(gè)步驟SP61中,場(chǎng)景再現(xiàn)部分62等待用戶對(duì)其的講話。
如果場(chǎng)景再現(xiàn)部分62根據(jù)來(lái)自話音識(shí)別部分60的字符串?dāng)?shù)據(jù)D1很快識(shí)別了講話的用戶,它就繼續(xù)進(jìn)行步驟SP62,以用上述的字符串?dāng)?shù)據(jù)D1向響應(yīng)產(chǎn)生部分63提供答復(fù)句子產(chǎn)生請(qǐng)求COM。
結(jié)果,根據(jù)字符串?dāng)?shù)據(jù)D1和答復(fù)句子產(chǎn)生請(qǐng)求COM,在響應(yīng)產(chǎn)生部分63中產(chǎn)生答復(fù)句子,并將其字符串D3通過(guò)場(chǎng)景再現(xiàn)部分62提供給語(yǔ)音合成部分64。
然后,場(chǎng)景對(duì)話塊62停止第一對(duì)話塊BL7的再現(xiàn)處理,然后繼續(xù)進(jìn)行在此之后的塊BL的再現(xiàn)處理。
(2-2-9)第二對(duì)話塊BL8(循環(huán))第二對(duì)話塊BL8與第一對(duì)話塊BL7一樣,是用于增加使用戶講話的機(jī)會(huì)的塊BL,例如,它有示于圖33或圖34中的程序結(jié)構(gòu)。要注意的是,圖33示出了在有提示的情況下的程序結(jié)構(gòu)的例子,圖34示出了在沒(méi)有提示的情況下的程序結(jié)構(gòu)的例子。
在上述的圖31說(shuō)明的、用于再現(xiàn)第一對(duì)話塊RT7的過(guò)程的步驟SP62中,如果響應(yīng)產(chǎn)生部分63有可能產(chǎn)生作為答復(fù)句子的提問(wèn)句或請(qǐng)求句的話,那么,第二對(duì)話塊BL8就是有效的。
實(shí)際上,在再現(xiàn)第二對(duì)話塊BL8時(shí),根據(jù)用于再現(xiàn)圖35所示的第8塊RT8的過(guò)程,就步驟SP70-SP72而言,場(chǎng)景再現(xiàn)部分62進(jìn)行與上述用于再現(xiàn)第一對(duì)話塊RT7的過(guò)程的步驟SP60-SP62相似的處理(圖31)。
在下一個(gè)步驟SP73中,場(chǎng)景再現(xiàn)部分62根據(jù)上述加到由響應(yīng)產(chǎn)生部分63提供的字符串?dāng)?shù)據(jù)D3的屬性信息來(lái)確定答復(fù)句子是否是第二循環(huán)類型。
如果在步驟SP73中得到肯定的結(jié)果,場(chǎng)景再現(xiàn)部分62就回到步驟SP71,隨后,重復(fù)步驟SP71-SP73的循環(huán),直到在步驟SP73中得到否定的結(jié)果為止。
如果在步驟SP73中,很快地得到了否定的結(jié)果,響應(yīng)產(chǎn)生部分63產(chǎn)生無(wú)循環(huán)類型的答復(fù)句子,場(chǎng)景再現(xiàn)部分62就停止第二對(duì)話塊BL8的再現(xiàn)處理,并繼續(xù)進(jìn)行在此之后的塊BL的再現(xiàn)處理。
(3)制作場(chǎng)景61的方法下面,將要說(shuō)明利用上面的第一到第九塊BL1-BL9來(lái)制作場(chǎng)景的方法。
作為利用上述的塊BL1-BL9的各種結(jié)構(gòu)來(lái)制作場(chǎng)景61的方法,有第一場(chǎng)景制作方法和第二場(chǎng)景制作方法兩種,在第一場(chǎng)景制作方法中,場(chǎng)景61將完全從開(kāi)頭制作起,在第一場(chǎng)景制作方法中,將通過(guò)對(duì)現(xiàn)有的場(chǎng)景61增加一些修改來(lái)制作新的場(chǎng)景61。
在此情況下,在第一場(chǎng)景制作方法中,如上面的圖7所述,通過(guò)將任意數(shù)量的八種不同的塊BL1-BL8按照任意的次序串行排列起來(lái),并根據(jù)場(chǎng)景制作場(chǎng)景的個(gè)人愛(ài)好分別在每個(gè)塊BL中提供必要的句子,就能制作想要的場(chǎng)景61。
進(jìn)而,在第二場(chǎng)景制作方法中,根據(jù)由上述的單句場(chǎng)景塊BL1和提問(wèn)塊BL2組成的現(xiàn)有的場(chǎng)景61,能夠通過(guò)下述方法容易地制作的新場(chǎng)景61[1]用第一到第四提問(wèn)/答復(fù)塊BL3-BL6之一來(lái)改變提問(wèn)塊BL2(根據(jù)前面的和后面的塊BL的內(nèi)容,它可以是第一或第二對(duì)話塊BL7-BL8)。
緊接在單句場(chǎng)景塊BL1后面,插入一個(gè)或多個(gè)第一或第二對(duì)話塊BL7或BL8(根據(jù)前面的和后面的塊BL的內(nèi)容,它可以是單句場(chǎng)景塊BL1、提問(wèn)塊BL2或第一到第四提問(wèn)/答復(fù)塊BL3-BL6)。
(4)實(shí)施例的操作和效果根據(jù)上面的結(jié)構(gòu),在機(jī)器人1中,在場(chǎng)景再現(xiàn)部分62的控制之下,在正常狀態(tài)中,按照?qǐng)鼍?1與用戶進(jìn)行“有場(chǎng)景的對(duì)話”,另一方面,如果用戶做出了在場(chǎng)景61中的意想不到的或類似的響應(yīng),就用在響應(yīng)產(chǎn)生部分63中產(chǎn)生的答復(fù)句子來(lái)進(jìn)行“無(wú)場(chǎng)景的對(duì)話”。
相應(yīng)地,在機(jī)器人1中,即使用戶做出了在場(chǎng)景61中的意想不到的響應(yīng),也能對(duì)其回饋一個(gè)合適的響應(yīng)。它能有效地防止此后的情況變得不自然。
此外,在機(jī)器人1中,能夠通過(guò)按任意順序排列任意數(shù)量的多種塊BL來(lái)制作場(chǎng)景61,其中,對(duì)一輪對(duì)話提供了機(jī)器人1的動(dòng)作,其中包含要由機(jī)器人1說(shuō)出的句子。因此,為了使其變得容易,通過(guò)使用現(xiàn)有的場(chǎng)景61,也能夠用較少的工序來(lái)輕易地制作令人感興趣的場(chǎng)景。
根據(jù)上述的結(jié)構(gòu),在場(chǎng)景再現(xiàn)部分62的控制下,在正常的狀態(tài)中,按照?qǐng)鼍?1來(lái)與用戶進(jìn)行“有場(chǎng)景的對(duì)話”,另一方面,在用戶給出在場(chǎng)景61中意料不到的響應(yīng)或類似的情況下,就用在響應(yīng)產(chǎn)生部分63中產(chǎn)生的答復(fù)句子來(lái)進(jìn)行“無(wú)場(chǎng)景的對(duì)話”。從而,能夠防止與用戶的對(duì)話變得不自然,與此同時(shí),還能給上面的用戶“在進(jìn)行對(duì)話”的感覺(jué)。這樣,就能實(shí)現(xiàn)與用戶進(jìn)行自然對(duì)話的機(jī)器人。
(5)其它實(shí)施例在上述的實(shí)施例中,已經(jīng)討論了將本發(fā)明用于按圖1到5構(gòu)成的機(jī)器人1的情況。然而,本發(fā)明并不只限于此,除了用于與人進(jìn)行對(duì)話的各種對(duì)話系統(tǒng)而外,它也能廣泛地用于具有其它各種結(jié)構(gòu)的機(jī)器人設(shè)備上。
在上述實(shí)施例中,已經(jīng)討論了這樣的情況,為構(gòu)成場(chǎng)景61的多個(gè)塊BL配備了上述八種類型。然而,本發(fā)明不限于此,也可以由其結(jié)構(gòu)在這八種類型以外的塊來(lái)制作場(chǎng)景61,或者,也可以通過(guò)配備除了這八個(gè)類型之外的別的類型的塊來(lái)制作場(chǎng)景61。
在上述的實(shí)施例中,已經(jīng)討論了使用單個(gè)的響應(yīng)產(chǎn)生部分63的情況。然而,本發(fā)明不限于此,例如,在第三塊BL3到第八塊BL8(步驟SP26、SP36、SP46、SP56、SP62和SP72)中,可以分別相應(yīng)于請(qǐng)求響應(yīng)產(chǎn)生部分63產(chǎn)生答復(fù)句子的步驟來(lái)提供若干專用的響應(yīng)產(chǎn)生部分。此處,配備有兩種類型,一種是“不產(chǎn)生提問(wèn)句和請(qǐng)求句”的響應(yīng)產(chǎn)生部分,一種是“可能產(chǎn)生提問(wèn)句和請(qǐng)求句”的響應(yīng)產(chǎn)生部分,并且可以根據(jù)情況有選擇地使用它們。
在上述的實(shí)施例中,已經(jīng)討論了在第二到第六塊BL2-BL6中的情況,提供了用于確定用戶的響應(yīng)是肯定的還是否定的步驟(SP12、SP14、SP22、SP24、SP32、SP34、SP42、SP44、SP52和SP54)。然而,本發(fā)明不限于此,還可以提供用于與另一話語(yǔ)(word)相匹配的步驟來(lái)代替它們。
具體地說(shuō),例如,也能這樣來(lái)進(jìn)行設(shè)計(jì),以便機(jī)器人1向用戶提出如像“你出生在哪個(gè)轄區(qū)?”這樣的問(wèn)題,并相應(yīng)于用戶對(duì)這個(gè)問(wèn)題的答復(fù)的話音識(shí)別結(jié)果來(lái)確定轄區(qū)。
在上述的實(shí)施例中,已經(jīng)討論了將第四到第六塊BL4-BL6以及第八塊BL8(步驟SP37、SP47、SP57和SP73)的循環(huán)次數(shù)設(shè)置為無(wú)限制的情況,然而,本發(fā)明并不只限于此,可以提供一個(gè)用于計(jì)算循環(huán)次數(shù)的計(jì)數(shù)器,以便根據(jù)計(jì)數(shù)器所計(jì)的數(shù)字來(lái)限制循環(huán)的次數(shù)。
在上述的實(shí)施例中,已經(jīng)討論了將等待用戶講話的等待時(shí)間設(shè)置為無(wú)限制的情況(例如,在再現(xiàn)提問(wèn)塊RT2的過(guò)程中的步驟SP11)。然而,本發(fā)明并不只限于此,而且,上面的等待時(shí)間也可以是有限的。例如,也可以這樣來(lái)設(shè)計(jì),如果在機(jī)器人1講話后10秒鐘內(nèi)用戶還不講話,就再現(xiàn)以前配備的超時(shí)響應(yīng),并繼續(xù)進(jìn)行下一個(gè)塊BL的再現(xiàn)處理。
在上述的實(shí)施例中,已經(jīng)討論了通過(guò)串行排列塊BL來(lái)構(gòu)成場(chǎng)景61的情況。然而,本發(fā)明并不只限于此,在場(chǎng)景61中通過(guò)并行排列塊BL或用類似方式也可以提供一些分支(branch)。
在上述的實(shí)施例中,已經(jīng)討論了在與用戶的對(duì)話中機(jī)器人只發(fā)出聲音的情況。然而,本發(fā)明并不只限于此,機(jī)器人除了有語(yǔ)音之外,還可以有移動(dòng)(動(dòng)作)。
在上述的實(shí)施例中,已經(jīng)討論了不接受來(lái)自用戶的請(qǐng)求的情況。然而,本發(fā)明并不只限于此,而且可以這樣來(lái)制作場(chǎng)景,以便能夠接收用戶的如像“停止”和“請(qǐng)?jiān)彙敝惖恼?qǐng)求。
在上述的實(shí)施例中,如圖6所示,已經(jīng)討論了將以下若干部分組合在一起的情況話音識(shí)別部分60,作為話音識(shí)別裝置用于對(duì)用戶的講話進(jìn)行話音識(shí)別;場(chǎng)景再現(xiàn)部分62,作為對(duì)話控制裝置用于根據(jù)話音識(shí)別部分60的話音識(shí)別結(jié)果和以前指定的場(chǎng)景61來(lái)控制與用戶的對(duì)話;響應(yīng)產(chǎn)生部分63,作為響應(yīng)產(chǎn)生裝置用于根據(jù)用戶講話的內(nèi)容產(chǎn)生答復(fù)句子,以對(duì)來(lái)自場(chǎng)景再現(xiàn)部分62的請(qǐng)求做出響應(yīng);語(yǔ)音合成部分64,作為語(yǔ)音合成裝置用于對(duì)由場(chǎng)景再現(xiàn)部分62再現(xiàn)的場(chǎng)景61的一個(gè)句子或者由響應(yīng)產(chǎn)生部分63產(chǎn)生的答復(fù)句子進(jìn)行語(yǔ)音合成處理。然而,本發(fā)明并不只限于此,例如,可將由響應(yīng)產(chǎn)生部分63提供的字符串?dāng)?shù)據(jù)D3直接提供給語(yǔ)音合成部分64。與話音識(shí)別部分60、場(chǎng)景再現(xiàn)部分62、響應(yīng)產(chǎn)生部分63和語(yǔ)音合成部分64的組合一樣,還能夠廣泛地運(yùn)用除此之外的各種組合。
根據(jù)如上所述本發(fā)明,在語(yǔ)音對(duì)話系統(tǒng)中提供了以下裝置對(duì)話控制裝置,用于根據(jù)對(duì)用戶的講話進(jìn)行話音識(shí)別的話音識(shí)別裝置的話音識(shí)別結(jié)果和以前給定的場(chǎng)景61來(lái)控制與用戶的對(duì)話;響應(yīng)產(chǎn)生裝置,用于根據(jù)用戶講話的內(nèi)容來(lái)產(chǎn)生答復(fù)句子,并響應(yīng)來(lái)自對(duì)話控制裝置的請(qǐng)求。對(duì)話控制裝置請(qǐng)求響應(yīng)產(chǎn)生裝置根據(jù)用戶講話內(nèi)容來(lái)產(chǎn)生作為場(chǎng)合要求的答復(fù)句子。從而,能夠避免與用戶的對(duì)話變得不自然,與此同時(shí),能夠給上述用戶“正在進(jìn)行對(duì)話”的感覺(jué)。這樣就能實(shí)現(xiàn)能夠與用戶進(jìn)行自然對(duì)話的語(yǔ)音對(duì)話系統(tǒng)。
根據(jù)本發(fā)明,提出了以下幾個(gè)步驟第一步是對(duì)用戶的講話進(jìn)行話音識(shí)別;第二步是根據(jù)話音識(shí)別的結(jié)果和以前指定的場(chǎng)景來(lái)控制與用戶的對(duì)話,并作為場(chǎng)合要求、根據(jù)用戶講話內(nèi)容來(lái)產(chǎn)生答復(fù)句子;第三步是對(duì)再現(xiàn)場(chǎng)景的一個(gè)句子或所產(chǎn)生的答復(fù)句子進(jìn)行語(yǔ)音合成處理。在第二步中,作為場(chǎng)合要求、根據(jù)用戶講話內(nèi)容來(lái)產(chǎn)生答復(fù)句子,從而,能夠避免與用戶的對(duì)話變得不自然,與此同時(shí),能夠給上述的用戶一個(gè)“正在進(jìn)行對(duì)話”的感覺(jué)。這樣,就能實(shí)現(xiàn)能夠與用戶進(jìn)行自然對(duì)話的語(yǔ)音對(duì)話方法。
此外,根據(jù)本發(fā)明,在機(jī)器人設(shè)備中,提供了以下幾種裝置對(duì)話控制裝置,用于根據(jù)對(duì)用戶的講話進(jìn)行話音識(shí)別的話音識(shí)別裝置的話音識(shí)別結(jié)果和以前指定的場(chǎng)景來(lái)控制與用戶的對(duì)話;響應(yīng)產(chǎn)生裝置,用于根據(jù)用戶講話的內(nèi)容來(lái)產(chǎn)生答復(fù)句子,并響應(yīng)來(lái)自對(duì)話控制裝置的請(qǐng)求。對(duì)話控制裝置請(qǐng)求響應(yīng)產(chǎn)生裝置根據(jù)用戶講話的內(nèi)容來(lái)產(chǎn)生作為場(chǎng)合要求的答復(fù)句子。從而,能夠避免與用戶的對(duì)話變得不自然,與此同時(shí),能夠給上述的用戶一個(gè)“正在進(jìn)行對(duì)話”的感覺(jué)。這樣就能實(shí)現(xiàn)能夠與用戶進(jìn)行自然對(duì)話的機(jī)器人設(shè)備。
產(chǎn)業(yè)上的可利用性除了娛樂(lè)用的機(jī)器人而外,本發(fā)明還廣泛地適用于各種具有語(yǔ)音對(duì)話功能的設(shè)備,例如,個(gè)人計(jì)算機(jī)。
權(quán)利要求
1.一種語(yǔ)音對(duì)話系統(tǒng),該系統(tǒng)包括話音識(shí)別裝置,用于對(duì)用戶的講話進(jìn)行話音識(shí)別;對(duì)話控制裝置,用于根據(jù)由所述話音識(shí)別裝置的話音識(shí)別結(jié)果、按照以前給定的場(chǎng)景來(lái)控制與所述用戶的對(duì)話;響應(yīng)產(chǎn)生裝置,用于產(chǎn)生與用戶的講話內(nèi)容相應(yīng)的答復(fù)句子,并響應(yīng)來(lái)自所述對(duì)話控制裝置的請(qǐng)求;話音合成裝置,用于對(duì)由所述對(duì)話控制裝置再現(xiàn)的所述場(chǎng)景中的一個(gè)句子或?qū)τ伤鲰憫?yīng)產(chǎn)生裝置產(chǎn)生的所述答復(fù)句子進(jìn)行話音合成處理;和所述語(yǔ)音對(duì)話系統(tǒng),其中,所述對(duì)話控制裝置根據(jù)所述用戶的講話內(nèi)容、請(qǐng)求所述響應(yīng)產(chǎn)生裝置產(chǎn)生作為場(chǎng)合要求的所述答復(fù)句子。
2.根據(jù)權(quán)利要求1的語(yǔ)音對(duì)話系統(tǒng),其中,所述對(duì)話控制裝置根據(jù)由所述響應(yīng)產(chǎn)生裝置產(chǎn)生的所述答復(fù)句子的屬性來(lái)控制與所述用戶的所述對(duì)話。
3.根據(jù)權(quán)利要求1的語(yǔ)音對(duì)話系統(tǒng),其中,通過(guò)按任意順序組合為與所述用戶一輪對(duì)話提供的、任意數(shù)量的并具有相應(yīng)預(yù)定格式的多種類型的若干塊來(lái)制作所述場(chǎng)景。
4.根據(jù)權(quán)利要求3的語(yǔ)音對(duì)話系統(tǒng),其中包括,作為所述塊之一,第一個(gè)塊具有第一再現(xiàn)步驟,用于再現(xiàn)所述一個(gè)句子,以促使所述用戶講話;第一講話等待和識(shí)別步驟,用于在上述的第一再現(xiàn)步驟之后,等待所述用戶的講話,并在所述用戶講話時(shí),識(shí)別上面講話的內(nèi)容;第二再現(xiàn)步驟,在所述第一講話等待和識(shí)別步驟之后,根據(jù)上面講話的內(nèi)容是肯定的還是否定的,來(lái)再現(xiàn)以前提供的一個(gè)相應(yīng)的句子。
5.根據(jù)權(quán)利要求4的語(yǔ)音對(duì)話系統(tǒng),包括作為所述塊之一,第二塊具有第一答復(fù)句子請(qǐng)求的產(chǎn)生步驟,當(dāng)在所述第一講話等待和識(shí)別步驟中所識(shí)別的所述用戶的講話內(nèi)容既非是肯定的也非否定的時(shí),就請(qǐng)求所述響應(yīng)產(chǎn)生裝置產(chǎn)生相應(yīng)于所述用戶講話的內(nèi)容的所述答復(fù)句子。
6.根據(jù)權(quán)利要求5的語(yǔ)音對(duì)話系統(tǒng),包括作為所述塊之一,第三塊具有第一循環(huán),其中,如果所述答復(fù)句子的屬性是第一循環(huán)類型,就返回到所述第一講話等待和識(shí)別步驟,所述答復(fù)句子是由響應(yīng)所述第一答復(fù)句子請(qǐng)求的產(chǎn)生步驟中的所述請(qǐng)求的響應(yīng)產(chǎn)生部分產(chǎn)生的。
7.根據(jù)權(quán)利要求5的語(yǔ)音對(duì)話系統(tǒng),其中包括作為所述塊之一,第四塊具有第二循環(huán),其中,如果所述答復(fù)句子的屬性是第二循環(huán)類型,就等待所述用戶的講話,并且在所述用戶講話時(shí),就識(shí)別上面講話的內(nèi)容,然后返回到所述答復(fù)句子請(qǐng)求的產(chǎn)生步驟,所述答復(fù)句子是由響應(yīng)所述第一產(chǎn)生答復(fù)句子的請(qǐng)求步驟中的所述請(qǐng)求的響應(yīng)產(chǎn)生部分產(chǎn)生的。
8.根據(jù)權(quán)利要求5的語(yǔ)音對(duì)話系統(tǒng),包括作為所述塊之一,第五塊具有確定步驟,用于確定所述答復(fù)句子的屬性,該答復(fù)句子是由所述第一產(chǎn)生答復(fù)句子的請(qǐng)求步驟中的所述請(qǐng)求的響應(yīng)產(chǎn)生部分產(chǎn)生的。第一循環(huán),其中,如果在上述確定步驟中確定的所述答復(fù)句子的所述屬性是第一循環(huán)類型,就返回到所述第一講話等待和識(shí)別步驟;和第二循環(huán),其中,如果在上述確定步驟中確定的所述答復(fù)句子的所述屬性是第二循環(huán)類型,就等待所述用戶的講話,并在所述用戶講話時(shí),識(shí)別上面講話的內(nèi)容,然后返回到所述答復(fù)句子請(qǐng)求的產(chǎn)生步驟。
9.根據(jù)權(quán)利要求3的語(yǔ)音對(duì)話系統(tǒng),包括作為所述塊之一,第六塊具有第二再現(xiàn)步驟,用于再現(xiàn)所述一個(gè)句子,如果需要,可在所述場(chǎng)景中省略這個(gè)句子;第二講話等待和識(shí)別步驟,用于在所述第二再現(xiàn)步驟之后等待所述用戶的講話,并在所述用戶講話時(shí),用于識(shí)別上述講話的內(nèi)容;和第二答復(fù)句子請(qǐng)求的產(chǎn)生步驟,在所述第二講話等待和識(shí)別步驟之后,用于請(qǐng)求所述響應(yīng)產(chǎn)生裝置產(chǎn)生相應(yīng)于所述用戶講話的內(nèi)容的所述答復(fù)句子。
10.根據(jù)權(quán)利要求9的語(yǔ)音對(duì)話系統(tǒng),其中包括作為所述塊之一,第七塊具有第三循環(huán),其中,如果答復(fù)句子的屬性是第三循環(huán)類型,就返回到所述第二講話等待和識(shí)別步驟,所述答復(fù)句子是由響應(yīng)所述第二答復(fù)句子請(qǐng)求的產(chǎn)生步驟中的所述請(qǐng)求的響應(yīng)產(chǎn)生部分產(chǎn)生的。
11.一種語(yǔ)音對(duì)話方法,其中包括第一步驟,用于對(duì)用戶的講話進(jìn)行話音識(shí)別;第二步驟,用于根據(jù)所述話音識(shí)別的結(jié)果、按照以前給定的場(chǎng)景來(lái)控制與用戶的對(duì)話,并且如果需要,產(chǎn)生與所述用戶講話的內(nèi)容相應(yīng)的答復(fù)句子;第三步驟,用于對(duì)所述再現(xiàn)場(chǎng)景中的一個(gè)句子或?qū)λa(chǎn)生的答復(fù)句子進(jìn)行話音合成處理;所述語(yǔ)音對(duì)話方法,其中,在所述第二步驟中,根據(jù)所述用戶講話內(nèi)容,產(chǎn)生作為場(chǎng)合要求的、與所述用戶講話內(nèi)容相應(yīng)的所述答復(fù)句子。
12.根據(jù)權(quán)利要求11的語(yǔ)音對(duì)話方法,其中,在所述第二步驟中,根據(jù)所產(chǎn)生的答復(fù)句子的屬性來(lái)控制與所述用戶的對(duì)話。
13.根據(jù)權(quán)利要求11的語(yǔ)音對(duì)話方法,其中,通過(guò)按任意順序組合為與所述用戶一輪對(duì)話提供的、任意數(shù)量的并具有相應(yīng)預(yù)定格式的多種類型的若干塊來(lái)制作所述場(chǎng)景。
14.根據(jù)權(quán)利要求13的語(yǔ)音對(duì)話方法,包括作為所述塊之一,第一個(gè)塊具有第一再現(xiàn)步驟,用于再現(xiàn)所述一個(gè)句子,以促使所述用戶講話;第一講話等待和識(shí)別步驟,用于在上述的第一再現(xiàn)步驟之后,等待所述用戶的講話,并在所述用戶講話時(shí),識(shí)別上面講話的內(nèi)容;第二再現(xiàn)步驟,在所述第一講話等待和識(shí)別步驟之后,根據(jù)上面講話的內(nèi)容是肯定的還是否定的,來(lái)再現(xiàn)以前提供的一個(gè)相應(yīng)的句子。
15.根據(jù)權(quán)利要求14的語(yǔ)音對(duì)話方法,其中包括作為所述塊之一,第二塊具有第一答復(fù)句子請(qǐng)求的產(chǎn)生步驟,當(dāng)在所述第一講話等待和識(shí)別步驟中識(shí)別的所述用戶的講話的內(nèi)容既非是肯定也非是否定時(shí),用于產(chǎn)生與所述用戶講話的內(nèi)容相應(yīng)的所述答復(fù)句子。
16.根據(jù)權(quán)利要求15的語(yǔ)音對(duì)話方法,包括作為所述塊之一,第三塊具有第一循環(huán),其中,如果在所述第一答復(fù)句子產(chǎn)生步驟中產(chǎn)生的所述答復(fù)句子的屬性是第一循環(huán)類型,就返回到所述第一講話等待和識(shí)別步驟。
17.根據(jù)權(quán)利要求15的語(yǔ)音對(duì)話方法,包括作為所述塊之一,第四塊具有第二循環(huán),其中,如果在所述第一答復(fù)句子產(chǎn)生步驟中產(chǎn)生的所述答復(fù)句子的屬性是第二循環(huán)類型,就等待所述用戶的講話,并在所述用戶講話時(shí),識(shí)別上述講話的內(nèi)容,然后返回到所述答復(fù)句子產(chǎn)生步驟。
18.根據(jù)權(quán)利要求15的語(yǔ)音對(duì)話方法,包括作為所述塊之一,第五塊具有如下步驟確定步驟,用于確定在第一答復(fù)句子產(chǎn)生步驟中產(chǎn)生的所述答復(fù)句子的屬性;第一循環(huán),其中,如果在上述確定步驟中確定的所述答復(fù)句子的屬性是第一循環(huán)類型,就返回到所述第一講話等待和識(shí)別步驟;第二循環(huán),其中,如果在上述確定步驟中確定的所述答復(fù)句子的屬性是第二循環(huán)類型,就等待所述用戶的講話,并在用戶講話時(shí),識(shí)別上述講話的內(nèi)容,然后返回到所述答復(fù)句子產(chǎn)生步驟。
19.根據(jù)權(quán)利要求13的語(yǔ)音對(duì)話方法,其中包括作為所述塊之一,第六塊具有如下步驟第二再現(xiàn)步驟,如果需要,用于再現(xiàn)在所述場(chǎng)景中可以省略的一個(gè)句子;第二講話等待和識(shí)別步驟,用于在所述第二再現(xiàn)步驟后,等待所述用戶的講話,并在用戶講話時(shí),用于識(shí)別上述講話的內(nèi)容;第二答復(fù)句子產(chǎn)生步驟,在所述第二講話等待和識(shí)別步驟之后,用于產(chǎn)生與所述用戶講話的內(nèi)容相應(yīng)的所述答復(fù)句子。
20.根據(jù)權(quán)利要求19的語(yǔ)音對(duì)話方法,其中包括作為所述塊之一,第七塊具有一個(gè)第三循環(huán),其中,如果在所述第二答復(fù)句子產(chǎn)生步驟中產(chǎn)生的所述答復(fù)句子的屬性是第三循環(huán)類型,就返回到所述第二講話等待和識(shí)別步驟。
21.一種機(jī)器人設(shè)備,包括話音識(shí)別裝置,用于對(duì)用戶的講話進(jìn)行話音識(shí)別;對(duì)話控制裝置,用于根據(jù)由所述話音識(shí)別裝置的話音識(shí)別結(jié)果,并按照以前給定的場(chǎng)景來(lái)控制與所述用戶的對(duì)話;響應(yīng)產(chǎn)生裝置,用于產(chǎn)生與所述用戶的講話內(nèi)容相應(yīng)的答復(fù)句子,并響應(yīng)來(lái)自所述對(duì)話控制裝置的請(qǐng)求;話音合成裝置,用于對(duì)由所述對(duì)話控制裝置再現(xiàn)的所述場(chǎng)景中的一個(gè)句子或者由所述響應(yīng)產(chǎn)生裝置產(chǎn)生的所述答復(fù)句子進(jìn)行話音合成處理;所述機(jī)器人設(shè)備,其中,根據(jù)所述用戶講話的內(nèi)容,所述對(duì)話控制裝置請(qǐng)求所述響應(yīng)產(chǎn)生裝置產(chǎn)生作為場(chǎng)合要求的所述答復(fù)句子。
全文摘要
在傳統(tǒng)的語(yǔ)音對(duì)話設(shè)備中,有著難于與用戶進(jìn)行自然對(duì)話的情況。對(duì)用戶的話音進(jìn)行話音識(shí)別,并根據(jù)話音識(shí)別的結(jié)果,按照預(yù)定的場(chǎng)景來(lái)控制與用戶的對(duì)話,并且,如果必要的話,根據(jù)用戶話音的內(nèi)容而生成響應(yīng)句子,從而音頻合成一個(gè)再現(xiàn)場(chǎng)景的句子或者生成的響應(yīng)句子。
文檔編號(hào)G10L13/00GK1781140SQ200480011340
公開(kāi)日2006年5月31日 申請(qǐng)日期2004年3月16日 優(yōu)先權(quán)日2003年3月20日
發(fā)明者廣江厚夫, 下村秀樹(shù), 赫爾穆特·勒克, 南野活樹(shù), 加藤晴 申請(qǐng)人:索尼株式會(huì)社