亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

控制方法以及控制裝置與流程

文檔序號(hào):11521414閱讀:225來(lái)源:國(guó)知局
控制方法以及控制裝置與流程

本公開(kāi)涉及通過(guò)語(yǔ)音來(lái)進(jìn)行機(jī)器(設(shè)備)控制的控制方法、控制裝置以及程序。



背景技術(shù):

以往,已知通過(guò)語(yǔ)音進(jìn)行機(jī)器控制的語(yǔ)音對(duì)話裝置。然而,在以往的語(yǔ)音對(duì)話裝置中,存在如下問(wèn)題:誤將在語(yǔ)音對(duì)話裝置的周圍進(jìn)行的對(duì)話、從電視機(jī)和/或收音機(jī)等發(fā)出的語(yǔ)音等噪音識(shí)別為是用戶對(duì)語(yǔ)音對(duì)話裝置說(shuō)的話,導(dǎo)致錯(cuò)誤地使機(jī)器工作。

為了解決該問(wèn)題,在專利文獻(xiàn)1中公開(kāi)了:進(jìn)行用于確認(rèn)語(yǔ)音的識(shí)別結(jié)果的確認(rèn)說(shuō)話,并在由用戶說(shuō)出表示肯定的單詞時(shí),進(jìn)行識(shí)別出的內(nèi)容的控制。另外,在專利文獻(xiàn)2中公開(kāi)了:對(duì)朝向控制對(duì)象機(jī)器的視線和/或手指動(dòng)作等進(jìn)行檢測(cè),僅在檢測(cè)出這些動(dòng)作的情況下,使基于語(yǔ)音對(duì)話的控制有效。

現(xiàn)有技術(shù)文獻(xiàn)

專利文獻(xiàn)

專利文獻(xiàn)1:日本特開(kāi)昭59-071927號(hào)公報(bào)

專利文獻(xiàn)2:日本特開(kāi)2007-121576號(hào)公報(bào)



技術(shù)實(shí)現(xiàn)要素:

發(fā)明所要解決的問(wèn)題

然而,上述專利文獻(xiàn)1、2需要進(jìn)一步的改善。

用于解決問(wèn)題的技術(shù)方案

本公開(kāi)的一個(gè)技術(shù)方案中的方法是在控制裝置中控制多個(gè)機(jī)器的方法,所述控制裝置具備麥克風(fēng)、傳感器以及揚(yáng)聲器,所述麥克風(fēng)收集所述控制裝置周邊的聲音,所述傳感器感測(cè)所述多個(gè)機(jī)器周邊的人物,所述控制方法包括:從由所述麥克風(fēng)收集到的聲音中提取用于控制所述多個(gè)機(jī)器的說(shuō)話;基于所述說(shuō)話,確定所述多個(gè)機(jī)器中作為控制對(duì)象的對(duì)象機(jī)器;基于表示所述傳感器感測(cè)到的結(jié)果的感測(cè)數(shù)據(jù),判定是否要控制所述對(duì)象機(jī)器;在判定為要控制所述對(duì)象機(jī)器的情況下,針對(duì)所述說(shuō)話生成用于對(duì)要控制所述對(duì)象機(jī)器這一情況進(jìn)行確認(rèn)的應(yīng)答語(yǔ)音,使所述揚(yáng)聲器輸出所述應(yīng)答語(yǔ)音。

發(fā)明效果

根據(jù)本公開(kāi),能夠在通過(guò)語(yǔ)音進(jìn)行機(jī)器控制的情況下,結(jié)合用戶的狀態(tài)或者機(jī)器周圍的狀態(tài),兼顧實(shí)現(xiàn)防止由語(yǔ)音的誤識(shí)別所致的機(jī)器的誤工作以及提高用戶的便利性。

附圖說(shuō)明

圖1是表示實(shí)施方式1中的語(yǔ)音對(duì)話裝置的全貌的一例的圖。

圖2是表示實(shí)施方式1中的語(yǔ)音對(duì)話裝置的處理流程的一例的圖。

圖3是表示實(shí)施方式1中的語(yǔ)音對(duì)話裝置的處理流程的與圖1至圖2不同的一例的圖。

圖4是表示實(shí)施方式1中的語(yǔ)音對(duì)話裝置的處理流程的與圖1至圖3不同的一例的圖。

圖5是表示實(shí)施方式2中的語(yǔ)音對(duì)話裝置的全貌的一例的圖。

圖6是表示實(shí)施方式2中的語(yǔ)音對(duì)話裝置的處理流程的一例的圖。

圖7是表示實(shí)施方式3中的語(yǔ)音對(duì)話裝置的全貌的一例的圖。

圖8是表示實(shí)施方式3中的語(yǔ)音對(duì)話裝置的處理流程的一例的圖。

標(biāo)號(hào)說(shuō)明

100、200、300:語(yǔ)音對(duì)話裝置

110:輸入部

111:傳感部

112:語(yǔ)音輸入部

120、220、320:語(yǔ)音對(duì)話處理部

121:狀態(tài)識(shí)別部

122、222:語(yǔ)音識(shí)別部

123、223:意圖理解部

124、324:行動(dòng)選擇部

125:機(jī)器控制部

126:應(yīng)答生成部

127:語(yǔ)音合成部

130:輸出部

131:語(yǔ)音輸出部

140:控制對(duì)象機(jī)器

228:觸發(fā)字識(shí)別部

328:控制受理定時(shí)器

具體實(shí)施方式

(成為本公開(kāi)的基礎(chǔ)的見(jiàn)解)

有關(guān)語(yǔ)音對(duì)話裝置的技術(shù)正在被進(jìn)行研究,所述語(yǔ)音對(duì)話裝置從用戶說(shuō)出的語(yǔ)音中解析說(shuō)話的內(nèi)容,并根據(jù)解析結(jié)果提供機(jī)器的控制和/或信息提供等服務(wù)。在語(yǔ)音對(duì)話裝置中,并不通過(guò)畫(huà)面操作、按鈕操作等復(fù)雜的操作,而是通過(guò)基于語(yǔ)音的直觀且容易的操作,進(jìn)行機(jī)器的控制和/或信息取得。另一方面,作為課題,存在誤識(shí)別周圍的對(duì)話、從電視機(jī)和/或收音機(jī)等發(fā)出的語(yǔ)音這一問(wèn)題。

針對(duì)這種問(wèn)題,在上述專利文獻(xiàn)1涉及的技術(shù)中,通過(guò)追加對(duì)語(yǔ)音的識(shí)別結(jié)果進(jìn)行確認(rèn)的步驟,避免因語(yǔ)音的誤識(shí)別導(dǎo)致的使機(jī)器誤工作。另外,在上述專利文獻(xiàn)2涉及的技術(shù)中,通過(guò)控制基于用戶的視線和/或手指動(dòng)作確定出的控制對(duì)象機(jī)器,防止對(duì)控制對(duì)象以外的機(jī)器的控制和/或由噪音的輸入所致的機(jī)器的誤工作。

然而,用戶通過(guò)語(yǔ)音控制的對(duì)象的機(jī)器和/或用戶利用基于語(yǔ)音的控制的場(chǎng)景是多種多樣的,根據(jù)控制對(duì)象的機(jī)器和/或利用的場(chǎng)景,每次說(shuō)話時(shí)都確認(rèn)語(yǔ)音的識(shí)別結(jié)果有可能很麻煩,或者說(shuō)話時(shí)有可能無(wú)法使視線和/或手指動(dòng)作朝向控制對(duì)象的機(jī)器。

例如,對(duì)于在機(jī)器前對(duì)冰箱、微波爐、烤箱、屋子和/或房間的門等的門的開(kāi)閉工作進(jìn)行語(yǔ)音控制這樣的場(chǎng)景,每次說(shuō)出“打開(kāi)門”等時(shí),都對(duì)“打開(kāi)門嗎”等確認(rèn)說(shuō)話進(jìn)行應(yīng)答是麻煩的。另外,對(duì)于將物品放入冰箱等在搬運(yùn)物品的過(guò)程中通過(guò)語(yǔ)音進(jìn)行冰箱門的開(kāi)閉控制這樣的場(chǎng)景,難以意識(shí)到冰箱的配置位置地進(jìn)行說(shuō)話、或者進(jìn)行手指動(dòng)作。另外,在利用能夠通過(guò)語(yǔ)音控制來(lái)調(diào)節(jié)水量的水龍頭、能夠通過(guò)語(yǔ)音控制來(lái)點(diǎn)火的煤氣爐和/或電磁爐的場(chǎng)景中,也難以在廚房的作業(yè)過(guò)程中使視線朝向控制對(duì)象的機(jī)器。

這樣,在以往的語(yǔ)音對(duì)話裝置中,并未對(duì)兼顧實(shí)現(xiàn)防止由語(yǔ)音的誤識(shí)別所致的機(jī)器的誤工作以及提高用戶的便利性進(jìn)行研究。

本公開(kāi)的目的在于提供能夠在通過(guò)語(yǔ)音進(jìn)行機(jī)器控制的情況下,結(jié)合用戶的狀態(tài)或者機(jī)器周圍的狀態(tài),兼顧實(shí)現(xiàn)防止由語(yǔ)音的誤識(shí)別所致的機(jī)器的誤工作以及提高用戶的便利性的技術(shù)。

(1)本公開(kāi)的一個(gè)技術(shù)方案的方法是在控制裝置中控制多個(gè)機(jī)器的方法,所述控制裝置具備麥克風(fēng)、傳感器以及揚(yáng)聲器,所述麥克風(fēng)收集所述控制裝置周邊的聲音,所述傳感器感測(cè)所述多個(gè)機(jī)器周邊的人物,所述控制方法包括:從由所述麥克風(fēng)收集到的聲音中提取用于控制所述多個(gè)機(jī)器的說(shuō)話;基于所述說(shuō)話,確定所述多個(gè)機(jī)器中作為控制對(duì)象的對(duì)象機(jī)器;基于表示所述傳感器感測(cè)到的結(jié)果的感測(cè)數(shù)據(jù),判定是否要控制所述對(duì)象機(jī)器;在判定為要控制所述對(duì)象機(jī)器的情況下,針對(duì)所述說(shuō)話生成用于對(duì)要控制所述對(duì)象機(jī)器這一情況進(jìn)行確認(rèn)的應(yīng)答語(yǔ)音,使所述揚(yáng)聲器輸出所述應(yīng)答語(yǔ)音。

根據(jù)該構(gòu)成,在用戶的狀態(tài)或者控制對(duì)象機(jī)器周圍的狀態(tài)是適合于控制的狀態(tài)的情況下,能夠抑制不必要地念誦確認(rèn)應(yīng)答文,迅速地進(jìn)行用戶所請(qǐng)求的機(jī)器控制。由此,能夠提高用戶的便利性。

另一方面,在用戶的狀態(tài)以及控制對(duì)象機(jī)器周圍的狀態(tài)并非適合于控制的狀態(tài)的情況下,能夠念誦確認(rèn)應(yīng)答文,抑制由于周圍的噪音等語(yǔ)音的誤識(shí)別而使機(jī)器誤工作的可能。

即,根據(jù)該構(gòu)成,能夠結(jié)合用戶的狀態(tài)或者機(jī)器周圍的狀態(tài),兼顧實(shí)現(xiàn)防止由語(yǔ)音的誤識(shí)別所致的機(jī)器的誤工作以及提高用戶的便利性。

(2)在上述技術(shù)方案中,也可以為,在判定為要控制所述對(duì)象機(jī)器的情況下,進(jìn)一步,通過(guò)解析所述說(shuō)話來(lái)確定所述對(duì)象機(jī)器的控制項(xiàng)目;生成與所述控制項(xiàng)目對(duì)應(yīng)的指令。

根據(jù)該構(gòu)成,在用戶的狀態(tài)或者控制對(duì)象機(jī)器周圍的狀態(tài)是適合于控制的狀態(tài)的情況下,能夠抑制不必要地念誦確認(rèn)應(yīng)答文,迅速地進(jìn)行用戶所預(yù)想的控制對(duì)象機(jī)器的控制。

(3)在上述技術(shù)方案中,也可以為,所述感測(cè)數(shù)據(jù)表示從所述對(duì)象機(jī)器起的第1范圍內(nèi)是否存在人物,在所述感測(cè)數(shù)據(jù)表示從所述對(duì)象機(jī)器起的所述第1范圍內(nèi)不存在所述人物的情況下,判定為要控制所述對(duì)象機(jī)器。

根據(jù)該構(gòu)成,在未在控制對(duì)象機(jī)器周圍檢測(cè)出人物,可認(rèn)為即使進(jìn)行控制對(duì)象機(jī)器的門的開(kāi)閉等有動(dòng)作的控制,發(fā)生事故的可能性也低的情況下,能夠抑制不必要地念誦確認(rèn)應(yīng)答文,迅速地進(jìn)行用戶所請(qǐng)求的機(jī)器控制。由此,能夠提高用戶的便利性。

(4)在上述技術(shù)方案中,也可以為,所述傳感器是攝像頭,所述感測(cè)數(shù)據(jù)是所述攝像頭拍攝所述第1范圍而得到的圖像。

根據(jù)該構(gòu)成,能夠恰當(dāng)?shù)貦z測(cè)出能夠通過(guò)拍攝裝置拍攝的包括控制對(duì)象機(jī)器在內(nèi)的預(yù)定的范圍內(nèi)是否存在人物。

(5)在上述技術(shù)方案中,也可以為,所述控制裝置還具備存儲(chǔ)器,所述方法還包括:在所述圖像表示所述第1范圍內(nèi)存在所述人物的情況下,基于所述人物的臉部或者軀體的特征和預(yù)先存儲(chǔ)于所述存儲(chǔ)器的表示多個(gè)人的臉部或者軀體的特征的信息,確定所述人物;基于預(yù)先存儲(chǔ)于所述存儲(chǔ)器的表示各所述多個(gè)人與各聲紋之間的對(duì)應(yīng)關(guān)系的信息、和從所述說(shuō)話中提取出的聲紋,判定與所確定出的所述人物對(duì)應(yīng)的聲紋是否與從所述說(shuō)話中提取出的聲紋一致;在判定為與所確定出的所述人物對(duì)應(yīng)的聲紋與從所述說(shuō)話中提取出的聲紋一致的情況下,基于所述圖像,判定所確定出的所述人物的視線是否朝向所述對(duì)象機(jī)器;在判定為所確定出的所述人物的視線朝向所述對(duì)象機(jī)器的情況下,判定為要控制所述對(duì)象機(jī)器。

根據(jù)該構(gòu)成,在處于控制對(duì)象機(jī)器周圍的進(jìn)行了說(shuō)話的用戶使視線朝向控制對(duì)象機(jī)器,可認(rèn)為該用戶關(guān)注著控制對(duì)象機(jī)器的情況下,能夠抑制不必要地念誦確認(rèn)應(yīng)答文,迅速地進(jìn)行用戶所請(qǐng)求的機(jī)器控制。由此,能夠提高用戶的便利性。

(6)在上述技術(shù)方案中,也可以為,所述控制裝置還具備存儲(chǔ)器,所述方法還包括:在所述圖像表示所述第1范圍內(nèi)存在所述人物的情況下,基于所述人物的臉部或者軀體的特征和預(yù)先存儲(chǔ)于所述存儲(chǔ)器的表示多個(gè)人的臉部或者軀體的特征的信息,確定所述人物;基于預(yù)先存儲(chǔ)于所述存儲(chǔ)器的表示各所述多個(gè)人與各聲紋之間的對(duì)應(yīng)關(guān)系的信息、和從所述說(shuō)話中提取出的聲紋,判定與所確定出的所述人物對(duì)應(yīng)的聲紋是否與從所述說(shuō)話中提取出的聲紋一致;在判定為與所確定出的所述人物對(duì)應(yīng)的聲紋與從所述說(shuō)話中提取出的聲紋一致的情況下,基于所述圖像,判定所確定出的所述人物的臉部是否朝向所述對(duì)象機(jī)器;在判定為所確定出的所述人物的臉部朝向所述對(duì)象機(jī)器的情況下,判定為要控制所述對(duì)象機(jī)器。

根據(jù)該構(gòu)成,在進(jìn)行了說(shuō)話的用戶使臉部朝向控制對(duì)象機(jī)器,可認(rèn)為該用戶關(guān)注著控制對(duì)象機(jī)器的情況下,能夠抑制不必要地念誦確認(rèn)應(yīng)答文,迅速地進(jìn)行用戶所請(qǐng)求的機(jī)器控制。由此,能夠提高用戶的便利性。

(7)在上述技術(shù)方案中,也可以為,所述控制裝置還具備存儲(chǔ)器,所述方法還包括:在所述圖像表示所述第1范圍內(nèi)存在所述人物的情況下,基于從所述圖像中提取出的所述人物的臉部或者軀體的特征和預(yù)先存儲(chǔ)于所述存儲(chǔ)器的表示多個(gè)人的臉部或者軀體的特征的信息,確定所述人物;基于預(yù)先存儲(chǔ)于所述存儲(chǔ)器的表示各所述多個(gè)人與各聲紋之間的對(duì)應(yīng)關(guān)系的信息、和從所述說(shuō)話中提取出的聲紋,判定與所確定出的所述人物對(duì)應(yīng)的聲紋是否與從所述說(shuō)話中提取出的聲紋一致;在判定為與所確定出的所述人物對(duì)應(yīng)的聲紋與從所述說(shuō)話中提取出的聲紋一致的情況下,基于所述圖像,判定所確定出的所述人物的軀體是否朝向所述對(duì)象機(jī)器;在判定為所確定出的所述人物的軀體朝向所述對(duì)象機(jī)器的情況下,判定為要控制所述對(duì)象機(jī)器。

根據(jù)該構(gòu)成,在進(jìn)行了說(shuō)話的用戶使軀體朝向控制對(duì)象機(jī)器,可認(rèn)為該用戶關(guān)注著控制對(duì)象機(jī)器的情況下,能夠抑制不必要地念誦確認(rèn)應(yīng)答文,迅速地進(jìn)行用戶所請(qǐng)求的機(jī)器控制。由此,能夠提高用戶的便利性。

(8)在上述技術(shù)方案中,也可以為,所述說(shuō)話是第1說(shuō)話,所述方法還包括:在輸出所述應(yīng)答語(yǔ)音后,從由所述麥克風(fēng)收集到的聲音中提取出針對(duì)所述應(yīng)答語(yǔ)音的第2說(shuō)話的情況下,判定所述第1說(shuō)話的第1說(shuō)話者和所述第2說(shuō)話的第2說(shuō)話者是否相同;在判定為所述第1說(shuō)話者和所述第2說(shuō)話者相同的情況下,生成用于控制所述對(duì)象機(jī)器的指令。

根據(jù)該構(gòu)成,在誤將周圍的噪音等語(yǔ)音識(shí)別為是第二說(shuō)話的情況下,能夠防止進(jìn)行與第一說(shuō)話對(duì)應(yīng)的機(jī)器控制。

(9)在上述技術(shù)方案中,也可以為,通過(guò)比較從所述第1說(shuō)話中提取出的第1聲紋、和從所述第2說(shuō)話中提取出的第2聲紋,判定所述第1說(shuō)話者和所述第2說(shuō)話者是否相同。

根據(jù)該構(gòu)成,能夠通過(guò)第一說(shuō)話以及第二說(shuō)話的聲紋,高精度地判定第一說(shuō)話以及第二說(shuō)話的說(shuō)話者是否相同。

(10)在上述技術(shù)方案中,也可以為,所述說(shuō)話是第1說(shuō)話,所述指令是第1指令,所述方法還包括:在生成所述第1指令后的預(yù)定時(shí)間內(nèi),從由所述麥克風(fēng)收集到的聲音中提取出用于控制所述對(duì)象機(jī)器的第2說(shuō)話的情況下,判定所述第1說(shuō)話的第1說(shuō)話者和所述第2說(shuō)話的第2說(shuō)話者是否相同;在判定為所述第1說(shuō)話和所述第2說(shuō)話相同的情況下,并不針對(duì)所述第2說(shuō)話生成用于對(duì)要控制所述對(duì)象機(jī)器這一情況進(jìn)行確認(rèn)的應(yīng)答語(yǔ)音,而生成與所述第2說(shuō)話對(duì)應(yīng)的第2指令。

根據(jù)該構(gòu)成,在由一個(gè)用戶連續(xù)地進(jìn)行了用于控制同一機(jī)器的說(shuō)話的情況下,能夠避免連續(xù)地對(duì)該用戶念誦確認(rèn)應(yīng)答文。由此,能夠提高用戶的便利性。

(11)在上述技術(shù)方案中,也可以為,通過(guò)比較從所述第1說(shuō)話中提取出的第1聲紋、和從所述第2說(shuō)話中提取出的第2聲紋,判定所述第1說(shuō)話者和所述第2說(shuō)話者是否相同。

根據(jù)該構(gòu)成,能夠通過(guò)第三說(shuō)話以及第四說(shuō)話的聲紋,高精度地判定第三說(shuō)話以及第四說(shuō)話的說(shuō)話者是否相同。

(12)在上述技術(shù)方案中,也可以為,還包括:定期地判定從由所述麥克風(fēng)收集到的聲音中提取出的說(shuō)話中是否含有成為用于控制所述對(duì)象機(jī)器的觸發(fā)的預(yù)定的單詞;在判定為從由所述麥克風(fēng)收集到的聲音中提取出的說(shuō)話中含有所述預(yù)定的單詞的情況下,不管對(duì)于是否要控制所述對(duì)象機(jī)器的判定結(jié)果如何,均通過(guò)解析所述說(shuō)話來(lái)確定所述對(duì)象機(jī)器的控制項(xiàng)目;生成與所述控制項(xiàng)目對(duì)應(yīng)的指令。

根據(jù)該構(gòu)成,能夠在用戶說(shuō)出意味著機(jī)器控制的契機(jī)的預(yù)定的單詞,該用戶進(jìn)行機(jī)器控制的意圖明確的情況下,并不念誦確認(rèn)應(yīng)答文,而迅速地進(jìn)行與說(shuō)話對(duì)應(yīng)的機(jī)器控制。由此,能夠提高用戶的便利性。

(13)在上述技術(shù)方案中,還包括:在判定為不控制所述對(duì)象機(jī)器的情況下,定期地基于表示所述傳感器感測(cè)到的結(jié)果的感測(cè)數(shù)據(jù),判定是否要控制所述對(duì)象機(jī)器;當(dāng)在從由所述麥克風(fēng)收集到的聲音中提取出用于控制所述多個(gè)機(jī)器的說(shuō)話后的預(yù)定時(shí)間內(nèi),判定為要控制所述對(duì)象機(jī)器的情況下,生成針對(duì)所述說(shuō)話的用于控制所述對(duì)象機(jī)器的指令。

根據(jù)該構(gòu)成,即使在用戶的狀態(tài)以及控制對(duì)象機(jī)器周圍的狀態(tài)并非適合于控制的狀態(tài)的情況下進(jìn)行了用于控制機(jī)器的說(shuō)話,通過(guò)在該說(shuō)話后的預(yù)定期間內(nèi),用戶的狀態(tài)或者控制對(duì)象機(jī)器周圍的狀態(tài)轉(zhuǎn)變?yōu)檫m合于控制的狀態(tài),也能夠進(jìn)行與說(shuō)話對(duì)應(yīng)的機(jī)器控制。由此,在用戶在移動(dòng)過(guò)程中進(jìn)行用于控制機(jī)器的說(shuō)話這樣的場(chǎng)景中,能夠提高用戶的便利性。

另外,本公開(kāi)不僅公開(kāi)如上的特征性的執(zhí)行處理的方法,而且還公開(kāi)具備用于執(zhí)行方法中包含的特征性的步驟的處理部的控制裝置。另外,還公開(kāi)使計(jì)算機(jī)執(zhí)行這種控制方法中包含的特征性的各步驟的計(jì)算機(jī)程序。當(dāng)然,可以使這種計(jì)算機(jī)程序經(jīng)由cd-rom等計(jì)算機(jī)可讀取的非臨時(shí)性的記錄介質(zhì)或者互聯(lián)網(wǎng)等通信網(wǎng)絡(luò)來(lái)流通。

此外,以下說(shuō)明的實(shí)施方式均表示本公開(kāi)的一個(gè)具體例。在以下的實(shí)施方式中表示的數(shù)值、形狀、構(gòu)成要素、步驟、步驟的順序等是一例,并非旨在限定本公開(kāi)。另外,對(duì)于以下的實(shí)施方式中的構(gòu)成要素中的、沒(méi)有記載在表示最上位概念的獨(dú)立權(quán)利要求中的構(gòu)成要素,作為任意的構(gòu)成要素進(jìn)行說(shuō)明。另外,在所有的實(shí)施方式中,也可以組合各自的內(nèi)容。

(實(shí)施方式1)

圖1是表示實(shí)施方式1中的語(yǔ)音對(duì)話裝置的全貌的一例的圖。如圖1所示,語(yǔ)音對(duì)話裝置100通過(guò)光纖、無(wú)線、公共電話線路等未圖示的網(wǎng)絡(luò)與控制對(duì)象機(jī)器140連接。此外,對(duì)語(yǔ)音對(duì)話裝置100可以連接至少一個(gè)以上的控制對(duì)象機(jī)器140?;蛘撸部梢詷?gòu)成為物理性地將語(yǔ)音對(duì)話裝置100分別組裝于各控制對(duì)象機(jī)器140。

語(yǔ)音對(duì)話裝置100具備輸入部110、語(yǔ)音對(duì)話處理部120以及輸出部130。

輸入部110具備傳感部111和語(yǔ)音輸入部112。傳感部111具備一個(gè)以上的能夠取得與控制對(duì)象機(jī)器140的周圍狀態(tài)有關(guān)的信息的設(shè)備。例如,傳感部111具備人感傳感器、攝像頭(拍攝裝置)以及視線傳感器。

人感傳感器使用紅外線和/或超聲波等來(lái)檢測(cè)從控制對(duì)象機(jī)器140到預(yù)定距離內(nèi)是否存在人物,并將表示檢測(cè)結(jié)果的數(shù)據(jù)(傳感器數(shù)據(jù))向后述的語(yǔ)音對(duì)話處理部120輸出。攝像頭對(duì)包括控制對(duì)象機(jī)器140的預(yù)定范圍進(jìn)行拍攝,并將表示拍攝到的圖像的數(shù)據(jù)(傳感器數(shù)據(jù))向后述的語(yǔ)音對(duì)話處理部120輸出。

視線傳感器內(nèi)置有對(duì)包括控制對(duì)象機(jī)器140的預(yù)定范圍進(jìn)行拍攝的攝像頭(以下稱為內(nèi)置攝像頭)。視線傳感器基于內(nèi)置攝像頭拍攝到的圖像中包含的黑眼珠以及白眼珠的區(qū)域,確定人物的視線方向,并將表示所確定的人物的視線方向的數(shù)據(jù)(傳感器數(shù)據(jù))向后述的語(yǔ)音對(duì)話處理部120輸出。對(duì)于人物的視線方向,例如以內(nèi)置攝像頭拍攝到的圖像中的垂直方向等預(yù)定方向?yàn)榛鶞?zhǔn),通過(guò)人物的視線方向傾斜了多少度來(lái)表示。此外,視線傳感器也可以輸出用其他形式表示人物的視線方向的數(shù)據(jù)。

另外,傳感部111也可以具備紅外線攝像頭和/或溫度傳感器等能夠取得與控制對(duì)象機(jī)器140的周圍狀態(tài)有關(guān)的信息的其他設(shè)備,所述紅外線攝像頭輸出表示用紅外線對(duì)包括控制對(duì)象機(jī)器140的預(yù)定范圍進(jìn)行拍攝而得到的圖像的數(shù)據(jù),所述溫度傳感器檢測(cè)控制對(duì)象機(jī)器140附近的溫度并輸出表示檢測(cè)出的溫度的數(shù)據(jù)。

語(yǔ)音輸入部112將輸入到集音設(shè)備(集音裝置)的語(yǔ)音數(shù)據(jù)向后述的語(yǔ)音對(duì)話處理部120輸出。集音設(shè)備例如包括安裝于語(yǔ)音對(duì)話裝置100主體的指向性麥克風(fēng)和/或以有線或者無(wú)線方式與語(yǔ)音對(duì)話裝置100連接的手持式麥克風(fēng)、領(lǐng)夾式麥克風(fēng)以及臺(tái)式麥克風(fēng)等。另外,語(yǔ)音輸入部112也可以通過(guò)在與智能手機(jī)和/或平板電腦等具有集音功能以及通信功能的設(shè)備之間進(jìn)行通信,取得輸入到該設(shè)備的語(yǔ)音數(shù)據(jù),將該取得的語(yǔ)音數(shù)據(jù)向后述的語(yǔ)音對(duì)話處理部120輸出。

語(yǔ)音對(duì)話處理部120由根據(jù)程序而工作的cpu(centralprocessingunit,中央處理器)實(shí)現(xiàn)。語(yǔ)音對(duì)話處理部120作為狀態(tài)識(shí)別部121(判定部)、語(yǔ)音識(shí)別部122(檢測(cè)部)、意圖理解部123(辨別部)、行動(dòng)選擇部124、機(jī)器控制部125、應(yīng)答生成部126(生成部)以及語(yǔ)音合成部127進(jìn)行工作。

狀態(tài)識(shí)別部121基于傳感部111輸出的一個(gè)以上的數(shù)據(jù)(以下稱為輸出數(shù)據(jù)),判定用戶的狀態(tài)或者控制對(duì)象機(jī)器140周圍的狀態(tài)是否為適合于控制的狀態(tài)。

狀態(tài)識(shí)別部121在通過(guò)執(zhí)行公知的模式識(shí)別處理,識(shí)別為上述攝像頭的輸出數(shù)據(jù)所表示的控制對(duì)象機(jī)器140的周圍的圖像中不包括人物的情況下,判斷為是未在控制對(duì)象機(jī)器140的周圍檢測(cè)出人物的狀態(tài)。在該情況下,由于可認(rèn)為即使進(jìn)行控制對(duì)象機(jī)器140的門的開(kāi)閉等有動(dòng)作的控制,發(fā)生事故的可能性也低,因此,狀態(tài)識(shí)別部121判定為控制對(duì)象機(jī)器140周圍的狀態(tài)是適合于控制的狀態(tài)。

另外,設(shè)上述人感傳感器的輸出數(shù)據(jù)所表示的檢測(cè)結(jié)果示出在從控制對(duì)象機(jī)器140到預(yù)定距離內(nèi)不存在人物。在該情況下,狀態(tài)識(shí)別部121也判斷為是未在控制對(duì)象機(jī)器140的周圍檢測(cè)出人物的狀態(tài),判定為控制對(duì)象機(jī)器140周圍的狀態(tài)是適合于控制的狀態(tài)。

另一方面,設(shè)在上述攝像頭的輸出數(shù)據(jù)所表示的控制對(duì)象機(jī)器140周圍的圖像中包括人物?;蛘?,設(shè)上述人感傳感器的輸出數(shù)據(jù)所表示的檢測(cè)結(jié)果示出在從控制對(duì)象機(jī)器140到預(yù)定距離內(nèi)存在人物。在這些情況下,狀態(tài)識(shí)別部121判斷為是在控制對(duì)象機(jī)器140的周圍檢測(cè)出人物的狀態(tài)。在該情況下,狀態(tài)識(shí)別部121基于預(yù)先存儲(chǔ)的表示上述視線傳感器以及控制對(duì)象機(jī)器140的配置位置的信息,判定上述視線傳感器的輸出數(shù)據(jù)所表示的人物的視線方向是否為從上述視線傳感器的配置位置朝向控制對(duì)象機(jī)器140的配置位置的方向。

狀態(tài)識(shí)別部121在判定為人物的視線方向是從視線傳感器的配置位置朝向控制對(duì)象機(jī)器140的配置位置的方向時(shí),判斷為該人物的視線朝向控制對(duì)象機(jī)器140。在該情況下,可認(rèn)為該人物是為了使用控制對(duì)象機(jī)器140而使視線朝向控制對(duì)象機(jī)器140并關(guān)注著控制對(duì)象機(jī)器140的、控制對(duì)象機(jī)器140的用戶。因此,狀態(tài)識(shí)別部121在判斷為該人物的視線朝向控制對(duì)象機(jī)器140的情況下,判定為控制對(duì)象機(jī)器140的用戶的狀態(tài)是適合于控制的狀態(tài)。

此外,在狀態(tài)識(shí)別部121判斷為是在控制對(duì)象機(jī)器140的周圍檢測(cè)出人物的狀態(tài)的情況下,也可以基于上述攝像頭的輸出數(shù)據(jù)所表示的控制對(duì)象機(jī)器140周圍的圖像,判斷是否是該人物的視線、臉部或者軀體朝向控制對(duì)象機(jī)器140的狀態(tài)。而且,在狀態(tài)識(shí)別部121判斷為是該人物的視線、臉部或者軀體朝向控制對(duì)象機(jī)器140的狀態(tài)的情況下,也可以判定為控制對(duì)象機(jī)器140的用戶的狀態(tài)是適合于控制的狀態(tài)。

在該情況下,在狀態(tài)識(shí)別部121通過(guò)執(zhí)行公知的模式識(shí)別處理,識(shí)別為上述攝像頭的輸出數(shù)據(jù)所表示的控制對(duì)象機(jī)器140周圍的圖像中包括人物的眼睛的情況下,基于黑眼珠以及白眼珠的區(qū)域和預(yù)先存儲(chǔ)的表示上述攝像頭以及控制對(duì)象機(jī)器140的配置位置的信息,判斷人物的視線是否朝向控制對(duì)象機(jī)器140即可。

同樣地,在狀態(tài)識(shí)別部121使用公知的模式識(shí)別技術(shù),識(shí)別為上述攝像頭的輸出數(shù)據(jù)所表示的控制對(duì)象機(jī)器140的周圍的圖像中包括人物的臉部或者軀體的情況下,基于人物的臉部或者軀體的區(qū)域、和預(yù)先存儲(chǔ)的表示上述攝像頭以及控制對(duì)象機(jī)器140的配置位置的信息,判斷人物的臉部或者軀體是否朝向控制對(duì)象機(jī)器140即可。

語(yǔ)音識(shí)別部122通過(guò)執(zhí)行公知的語(yǔ)音識(shí)別處理,檢測(cè)語(yǔ)音輸入部112輸出的語(yǔ)音數(shù)據(jù)所表示的語(yǔ)音中包含的人物發(fā)出的語(yǔ)音,生成表示該說(shuō)話的內(nèi)容的文本數(shù)據(jù)。

意圖理解部123通過(guò)執(zhí)行公知的語(yǔ)言解析處理,解析語(yǔ)音識(shí)別部122生成的文本數(shù)據(jù)所表示的說(shuō)話的內(nèi)容,進(jìn)行該說(shuō)話的意圖解釋。例如,意圖理解部123通過(guò)執(zhí)行所謂基于規(guī)則的語(yǔ)言解析處理,解析說(shuō)話的內(nèi)容。具體而言,意圖理解部123在預(yù)先確定的規(guī)則中,當(dāng)在說(shuō)話的內(nèi)容中包含與可由語(yǔ)音對(duì)話裝置100執(zhí)行的任務(wù)(task)相關(guān)聯(lián)的他動(dòng)詞(及物動(dòng)詞)的單詞的情況下,解釋為該說(shuō)話是請(qǐng)求執(zhí)行與該他動(dòng)詞的單詞相關(guān)聯(lián)的任務(wù)的說(shuō)話。此外,可由語(yǔ)音對(duì)話裝置100執(zhí)行的任務(wù)包括用于控制機(jī)器的任務(wù)和/或用于取得互聯(lián)網(wǎng)上提供的信息的任務(wù)等。

另外,意圖理解部123將說(shuō)話內(nèi)容中包含的名詞單詞解釋為任務(wù)的參數(shù)。例如,用于控制機(jī)器的任務(wù)的參數(shù)包括成為控制的對(duì)象的控制對(duì)象機(jī)器。用于取得信息的任務(wù)的參數(shù)包括要取得的對(duì)象的信息和/或用于訪問(wèn)該信息的取得地的地址信息等。也就是說(shuō),意圖理解部123將請(qǐng)求執(zhí)行用于控制機(jī)器的任務(wù)的說(shuō)話內(nèi)容中包含的名詞單詞,辨別為對(duì)有關(guān)機(jī)器進(jìn)行控制的對(duì)象的控制對(duì)象機(jī)器140。

以下,說(shuō)明由意圖理解部123進(jìn)行的說(shuō)話的意圖解釋的具體例。在本具體例中,設(shè)冰箱以及微波爐作為控制對(duì)象機(jī)器140而與語(yǔ)音對(duì)話裝置100連接。另外,設(shè)語(yǔ)音識(shí)別部122生成的文本數(shù)據(jù)所表示的說(shuō)話的內(nèi)容是“打開(kāi)冰箱”。另外,設(shè)在上述規(guī)則中,對(duì)于用于進(jìn)行打開(kāi)控制對(duì)象機(jī)器140的門的控制的任務(wù),關(guān)聯(lián)有他動(dòng)詞“打開(kāi)”。

在該情況下,與用于進(jìn)行打開(kāi)控制對(duì)象機(jī)器140的門的控制的任務(wù)相關(guān)聯(lián)的他動(dòng)詞“打開(kāi)”包含于作為說(shuō)話的內(nèi)容的“打開(kāi)冰箱”中。因此,意圖理解部123解釋為該說(shuō)話是請(qǐng)求執(zhí)行用于進(jìn)行打開(kāi)控制對(duì)象機(jī)器140的門的控制的任務(wù)的說(shuō)話。

另外,由于作為說(shuō)話的內(nèi)容的“打開(kāi)冰箱”中包含名詞的單詞“冰箱”,因此,意圖理解部123解釋為該任務(wù)的參數(shù)是冰箱。也就是說(shuō),意圖理解部123將冰箱辨別為控制對(duì)象機(jī)器140。這樣,意圖理解部123解釋為該說(shuō)話是請(qǐng)求進(jìn)行打開(kāi)冰箱門的控制的說(shuō)話。

此外,意圖理解部123也可以通過(guò)所謂機(jī)器學(xué)習(xí)等統(tǒng)計(jì)性解析方法等其他的解析方法來(lái)解析說(shuō)話的內(nèi)容,進(jìn)行說(shuō)話的意圖解釋。

行動(dòng)選擇部124基于由意圖理解部123得到的意圖解釋的結(jié)果以及由狀態(tài)識(shí)別部121得到的判定結(jié)果,選擇是使機(jī)器控制部125執(zhí)行機(jī)器控制,還是使應(yīng)答生成部126生成確認(rèn)應(yīng)答文,或是執(zhí)行其他任務(wù)。關(guān)于確認(rèn)應(yīng)答文,將在后面進(jìn)行說(shuō)明。

機(jī)器控制部125在行動(dòng)選擇部124的指示下,生成用于對(duì)控制對(duì)象機(jī)器140進(jìn)行控制的機(jī)器控制命令,將該機(jī)器控制命令向控制對(duì)象機(jī)器140輸出。由此,控制對(duì)象機(jī)器140進(jìn)行按照從機(jī)器控制部125輸入的機(jī)器控制命令的工作。

應(yīng)答生成部126在行動(dòng)選擇部124的指示下,生成確認(rèn)應(yīng)答文,將表示該確認(rèn)應(yīng)答文的文本數(shù)據(jù)向語(yǔ)音合成部127輸出。確認(rèn)應(yīng)答文是指用于讓用戶確認(rèn)說(shuō)話的內(nèi)容、回答確認(rèn)結(jié)果的文章。例如,在說(shuō)話的內(nèi)容是“打開(kāi)冰箱”的情況下,確認(rèn)應(yīng)答文為“打開(kāi)電冰箱嗎”,成為對(duì)說(shuō)話的內(nèi)容進(jìn)行重問(wèn)的內(nèi)容。

具體而言,行動(dòng)選擇部124在使應(yīng)答生成部126生成確認(rèn)應(yīng)答文的情況下,將輸入到意圖理解部123的表示說(shuō)話的內(nèi)容的文本數(shù)據(jù)向應(yīng)答生成部126輸出。應(yīng)答生成部126通過(guò)執(zhí)行公知的語(yǔ)言解析處理,解析該被輸入的文本數(shù)據(jù)所表示的說(shuō)話的內(nèi)容,生成對(duì)該說(shuō)話的內(nèi)容進(jìn)行重問(wèn)的內(nèi)容的確認(rèn)應(yīng)答文。

語(yǔ)音合成部127通過(guò)執(zhí)行公知的語(yǔ)音合成處理,將表示由應(yīng)答生成部126輸入的確認(rèn)應(yīng)答文的文本數(shù)據(jù)轉(zhuǎn)換為表示該確認(rèn)應(yīng)答文的語(yǔ)音數(shù)據(jù),并向輸出部130輸出。

輸出部130具備一個(gè)以上的語(yǔ)音輸出部131。語(yǔ)音輸出部131輸出下述語(yǔ)音:即語(yǔ)音合成部127輸出的語(yǔ)音數(shù)據(jù)所表示的語(yǔ)音。語(yǔ)音輸出部131例如是組裝于語(yǔ)音對(duì)話裝置100的揚(yáng)聲器。此外,語(yǔ)音輸出部131也可以由通過(guò)有線或者無(wú)線方式與語(yǔ)音對(duì)話裝置100連接的揚(yáng)聲器構(gòu)成。

在實(shí)施方式1的例子中,輸出部130具備一個(gè)以上的語(yǔ)音輸出部131,但也可以代替語(yǔ)音輸出部131,而在組裝于語(yǔ)音對(duì)話裝置100的顯示器等顯示設(shè)備和/或與語(yǔ)音對(duì)話裝置100連接的外部的顯示設(shè)備中,顯示應(yīng)答生成部126生成的文本數(shù)據(jù)所表示的確認(rèn)應(yīng)答文等。

另外,也可以將輸入部110、狀態(tài)識(shí)別部121、語(yǔ)音識(shí)別部122、應(yīng)答生成部126、語(yǔ)音合成部127以及輸出部130設(shè)置于與語(yǔ)音對(duì)話裝置100連接的各控制對(duì)象機(jī)器140。與此同時(shí),也可以使能夠在與語(yǔ)音對(duì)話裝置100之間通信的外部服務(wù)器作為意圖理解部123、行動(dòng)選擇部124以及機(jī)器控制部125進(jìn)行工作。

以下,使用圖2,說(shuō)明在實(shí)施方式1中根據(jù)說(shuō)話的用戶的狀態(tài)或者控制對(duì)象機(jī)器140周圍的狀態(tài)是否是適合于控制的狀態(tài),判斷是否語(yǔ)音輸出確認(rèn)應(yīng)答文,直至進(jìn)行機(jī)器控制的處理流程。圖2是表示實(shí)施方式1中的語(yǔ)音對(duì)話裝置100的處理流程的一例的圖。

當(dāng)集音設(shè)備中被輸入表示用戶的說(shuō)話的語(yǔ)音數(shù)據(jù),語(yǔ)音輸入部112將該語(yǔ)音數(shù)據(jù)向語(yǔ)音識(shí)別部122輸出時(shí)(步驟s101:是),語(yǔ)音識(shí)別部122通過(guò)執(zhí)行語(yǔ)音識(shí)別處理,檢測(cè)被輸入的語(yǔ)音數(shù)據(jù)所表示的語(yǔ)音中包含的用戶發(fā)出的語(yǔ)音,生成表示該說(shuō)話的內(nèi)容的文本數(shù)據(jù)(步驟s102)。意圖理解部123通過(guò)執(zhí)行語(yǔ)言解析處理,解析語(yǔ)音識(shí)別部122生成的文本數(shù)據(jù)所表示的說(shuō)話的內(nèi)容,進(jìn)行該說(shuō)話的意圖解釋(步驟s103)。

在由意圖理解部123解釋為用戶的說(shuō)話是請(qǐng)求執(zhí)行與用于控制機(jī)器的任務(wù)不同的其他任務(wù)的說(shuō)話的情況下(步驟s104:否),行動(dòng)選擇部124基于由意圖理解部123得到的意圖解釋的結(jié)果,執(zhí)行用戶所請(qǐng)求的上述其他任務(wù)(步驟s111)。

另一方面,在由意圖理解部123解釋為用戶的說(shuō)話是請(qǐng)求執(zhí)行用于控制機(jī)器的任務(wù)的說(shuō)話(以下稱為請(qǐng)求機(jī)器控制的說(shuō)話)的情況下(步驟s104:是),狀態(tài)識(shí)別部121判定說(shuō)話的用戶的狀態(tài)(以下稱為用戶的狀態(tài))或者控制對(duì)象機(jī)器140周圍的狀態(tài)(以下稱為機(jī)器周圍的狀態(tài))是否處于適合于控制的狀態(tài)(步驟s105)。

在狀態(tài)識(shí)別部121判定為用戶的狀態(tài)或者機(jī)器周圍的狀態(tài)是適合于控制的狀態(tài)的情況下(步驟s105:是),行動(dòng)選擇部124基于由意圖理解部123得到的意圖解釋的結(jié)果,指示機(jī)器控制部125,以使其進(jìn)行用戶所請(qǐng)求的控制對(duì)象機(jī)器140的控制。由此,機(jī)器控制部125生成用于進(jìn)行該被指示的控制對(duì)象機(jī)器140的控制的機(jī)器控制命令,將該機(jī)器控制命令向控制對(duì)象機(jī)器140輸出(步驟s106)。其結(jié)果,控制對(duì)象機(jī)器140進(jìn)行按照被輸入的機(jī)器控制命令的工作。

另一方面,在狀態(tài)識(shí)別部121判定為用戶的狀態(tài)以及機(jī)器周圍的狀態(tài)并非適合于控制的狀態(tài)的情況下(步驟s105:否),行動(dòng)選擇部124使應(yīng)答生成部126生成確認(rèn)應(yīng)答文。當(dāng)應(yīng)答生成部126生成確認(rèn)應(yīng)答文,并輸出表示確認(rèn)應(yīng)答文的文本數(shù)據(jù)時(shí),行動(dòng)選擇部124使語(yǔ)音合成部127生成表示該確認(rèn)應(yīng)答文的語(yǔ)音數(shù)據(jù),使語(yǔ)音輸出部131輸出表現(xiàn)該語(yǔ)音數(shù)據(jù)所表示的確認(rèn)應(yīng)答文的語(yǔ)音(步驟s107)。也就是說(shuō),語(yǔ)音輸出部131通過(guò)語(yǔ)音念誦確認(rèn)應(yīng)答文。

相應(yīng)地,設(shè)用戶例如進(jìn)行了“確定”、“是”等受理確認(rèn)的說(shuō)話(以下稱為確認(rèn)受理說(shuō)話)。在該情況下,雖然在圖2中省略了圖示,但進(jìn)行與步驟s101~s103同樣的處理。其結(jié)果,當(dāng)由意圖理解部123解釋為用戶的說(shuō)話是確認(rèn)受理說(shuō)話時(shí)(步驟s108:是),行動(dòng)選擇部124執(zhí)行上述的步驟s106。

另一方面,當(dāng)在沒(méi)有由用戶做出確認(rèn)受理說(shuō)話的狀態(tài)下(步驟s108:否),經(jīng)過(guò)了預(yù)先確定的一定的時(shí)間的情況下,行動(dòng)選擇部124取消由用戶實(shí)施的控制對(duì)象機(jī)器140的控制的請(qǐng)求(步驟s110)。此外,上述的一定的時(shí)間也可以按每個(gè)控制對(duì)象機(jī)器140而個(gè)別地確定。

另外,在由用戶進(jìn)行說(shuō)話,由此進(jìn)行了與步驟s101~s102同樣的處理的結(jié)果是,通過(guò)意圖理解部123解釋為用戶的說(shuō)話并非確認(rèn)受理說(shuō)話的情況下(步驟s109:是),行動(dòng)選擇部124也取消由用戶實(shí)施的控制對(duì)象機(jī)器140的控制的請(qǐng)求(步驟s110)。

根據(jù)以上所述的本實(shí)施方式1的語(yǔ)音對(duì)話裝置100,在用戶進(jìn)行了請(qǐng)求控制機(jī)器的說(shuō)話的情況下,在用戶的狀態(tài)或者控制對(duì)象機(jī)器140周圍的狀態(tài)是適合于控制的狀態(tài)的情況下,能夠抑制不必要地念誦確認(rèn)應(yīng)答文,迅速地進(jìn)行用戶所請(qǐng)求的機(jī)器控制。由此,能夠提高用戶的便利性。另一方面,在用戶的狀態(tài)以及控制對(duì)象機(jī)器140周圍的狀態(tài)并非適合于控制的狀態(tài)的情況下,能夠念誦確認(rèn)應(yīng)答文,抑制由于周圍的噪音等語(yǔ)音的誤識(shí)別而使機(jī)器誤工作的可能。

另外,狀態(tài)識(shí)別部121在判斷為說(shuō)話的用戶的視線、臉部或者軀體是未朝向控制對(duì)象機(jī)器140的狀態(tài)的情況下,判定為用戶的狀態(tài)并非適合于控制的狀態(tài)。在該情況下,念誦確認(rèn)應(yīng)答文。由此,能夠排除在用戶未關(guān)注控制對(duì)象機(jī)器140的狀態(tài)時(shí),因不念誦確認(rèn)應(yīng)答文而進(jìn)行控制對(duì)象機(jī)器140的門的開(kāi)閉等有動(dòng)作的控制,從而發(fā)生事故的危險(xiǎn)性。

此外,在步驟s103中,意圖理解部123在用戶的說(shuō)話的內(nèi)容僅包含與機(jī)器控制關(guān)聯(lián)的他動(dòng)詞的情況下,即使解釋為該說(shuō)話是請(qǐng)求機(jī)器控制的說(shuō)話,由于說(shuō)話的內(nèi)容沒(méi)有包含名詞,因此也無(wú)法辨別控制對(duì)象機(jī)器140。

在該情況下,意圖理解部123也可以生成詢問(wèn)控制對(duì)象機(jī)器140的詢問(wèn)文,使用語(yǔ)音合成部127以及語(yǔ)音輸出部131,用語(yǔ)音輸出該生成的詢問(wèn)文。相應(yīng)地,在由用戶進(jìn)行表示控制對(duì)象機(jī)器140的說(shuō)話,進(jìn)行了與步驟s101、s102同樣的處理之后,意圖理解部123也可以將該說(shuō)話的內(nèi)容所含的表示控制對(duì)象機(jī)器140的名詞辨別為上述任務(wù)的參數(shù)、也就是控制對(duì)象機(jī)器140。

另外,在步驟s108中,解釋為用戶的說(shuō)話是確認(rèn)受理說(shuō)話(第二說(shuō)話)的情況下,也可以對(duì)于在步驟s101中輸出的請(qǐng)求機(jī)器控制的說(shuō)話(第一說(shuō)話)的語(yǔ)音數(shù)據(jù)、和該步驟s108中的通過(guò)與步驟s101同樣的處理輸出的確認(rèn)受理說(shuō)話的語(yǔ)音數(shù)據(jù),判定聲紋是否一致,僅在一致的情況下進(jìn)行被用戶請(qǐng)求的機(jī)器控制。

以下,使用圖3對(duì)該情況的處理流程進(jìn)行說(shuō)明。此外,到狀態(tài)識(shí)別部121判定用戶的狀態(tài)或者機(jī)器周圍的狀態(tài)是否為適合于控制的狀態(tài)為止的處理流程與圖2所示的步驟s101~s105相同,因此省略說(shuō)明。

在狀態(tài)識(shí)別部121判定為用戶的狀態(tài)以及機(jī)器周圍的狀態(tài)并非適合于控制的狀態(tài)的情況下(步驟s105:否),行動(dòng)選擇部124存儲(chǔ)在步驟s101中輸出的、請(qǐng)求執(zhí)行與機(jī)器控制有關(guān)的任務(wù)的說(shuō)話(以下稱為控制請(qǐng)求說(shuō)話)的語(yǔ)音數(shù)據(jù)(步驟s201)。

然后,與步驟s107同樣地,行動(dòng)選擇部124使應(yīng)答生成部126生成確認(rèn)應(yīng)答文,使用語(yǔ)音合成部127以及語(yǔ)音輸出部131,輸出表示該確認(rèn)應(yīng)答文的語(yǔ)音(步驟s202)。

相應(yīng)地,設(shè)用戶進(jìn)行確認(rèn)受理說(shuō)話的結(jié)果是,通過(guò)與步驟s108同樣的處理,由意圖理解部123解釋為用戶的說(shuō)話是確認(rèn)受理說(shuō)話(步驟s203:是)。在該情況下,行動(dòng)選擇部124通過(guò)執(zhí)行公知的聲紋比較處理,判定在步驟s201中存儲(chǔ)的控制請(qǐng)求說(shuō)話的語(yǔ)音數(shù)據(jù)所表示的語(yǔ)音的聲紋、和步驟s203中的通過(guò)與步驟s101同樣的處理輸出的確認(rèn)受理說(shuō)話的語(yǔ)音數(shù)據(jù)所表示的語(yǔ)音的聲紋是否一致(步驟s204)。

行動(dòng)選擇部124在判定為聲紋一致的情況下,判斷為進(jìn)行控制請(qǐng)求說(shuō)話的用戶和進(jìn)行確認(rèn)受理說(shuō)話的用戶是同一人物(步驟s204:是),與步驟s106同樣地,使機(jī)器控制部125執(zhí)行用戶所請(qǐng)求的機(jī)器控制(步驟s205)。

另一方面,行動(dòng)選擇部124在判定為聲紋不一致的情況下(步驟s204:否),判斷為進(jìn)行控制請(qǐng)求說(shuō)話的用戶和進(jìn)行確認(rèn)受理說(shuō)話的用戶并非同一人物,取消由用戶提出的控制的請(qǐng)求(步驟s207)。由此,能夠防止在將周圍的噪音等語(yǔ)音誤識(shí)別為是確認(rèn)受理說(shuō)話的情況下,進(jìn)行由控制請(qǐng)求說(shuō)話所請(qǐng)求的機(jī)器控制。

當(dāng)在沒(méi)有由用戶做出確認(rèn)受理說(shuō)話的狀態(tài)下(步驟s203:否),經(jīng)過(guò)了預(yù)先確定的一定的時(shí)間的情況下,或者,在步驟s203中解釋為用戶的說(shuō)話并非確認(rèn)受理說(shuō)話的情況下(步驟s206:是),行動(dòng)選擇部124也取消由用戶提出的控制的請(qǐng)求(步驟s207)。

另外,當(dāng)在從根據(jù)檢測(cè)到用于控制機(jī)器的第一說(shuō)話(第三說(shuō)話),而生成與第一說(shuō)話對(duì)應(yīng)的機(jī)器控制命令后,到經(jīng)過(guò)預(yù)定的期間之前,檢測(cè)到用于控制該機(jī)器的第二說(shuō)話(第四說(shuō)話)的情況下,對(duì)于第一說(shuō)話的語(yǔ)音數(shù)據(jù)和第二說(shuō)話的語(yǔ)音數(shù)據(jù),判定聲紋是否一致,在一致的情況下,也可以不生成確認(rèn)應(yīng)答文,而生成與第二說(shuō)話對(duì)應(yīng)的機(jī)器控制命令。以下,使用圖4對(duì)該情況的處理流程進(jìn)行說(shuō)明。

在按照?qǐng)D2所示的處理流程,由機(jī)器控制部125生成與第一說(shuō)話對(duì)應(yīng)的機(jī)器控制命令,實(shí)施了與第一說(shuō)話對(duì)應(yīng)的機(jī)器控制的情況下(步驟s301:是),行動(dòng)選擇部124存儲(chǔ)在圖2所示的步驟s101中輸出的第一說(shuō)話的語(yǔ)音數(shù)據(jù)(步驟s302)。

設(shè)在該狀態(tài)下,進(jìn)行了第二說(shuō)話,且進(jìn)行了與步驟s101~s103同樣的處理的結(jié)果是,由意圖理解部123解釋為第二說(shuō)話是請(qǐng)求與作為對(duì)應(yīng)于第一說(shuō)話的機(jī)器控制的對(duì)象的控制對(duì)象機(jī)器140相同的控制對(duì)象機(jī)器140的機(jī)器控制的說(shuō)話(步驟s304:是)。在該情況下,與步驟s105同樣地,狀態(tài)識(shí)別部121判定用戶的狀態(tài)或者機(jī)器周圍的狀態(tài)是否處于適合于控制的狀態(tài)(步驟s305)。

在狀態(tài)識(shí)別部121判定為用戶的狀態(tài)以及機(jī)器周圍的狀態(tài)并非適合于控制的狀態(tài)的情況下(步驟s305:否),行動(dòng)選擇部124通過(guò)執(zhí)行公知的聲紋比較處理,判定在步驟s302中存儲(chǔ)的第一說(shuō)話的語(yǔ)音數(shù)據(jù)所表示的語(yǔ)音的聲紋、和步驟s304中的通過(guò)與步驟s101同樣的處理輸出的第二說(shuō)話的語(yǔ)音數(shù)據(jù)所表示的語(yǔ)音的聲紋是否一致(s307)。

行動(dòng)選擇部124在判定為聲紋一致的情況下,判斷為進(jìn)行第一說(shuō)話的用戶和進(jìn)行第二說(shuō)話的用戶是同一人物(步驟s307:是),與步驟s106同樣地,使機(jī)器控制部125執(zhí)行由第二說(shuō)話所請(qǐng)求的機(jī)器控制(步驟s306)。

另一方面,行動(dòng)選擇部124在判定為聲紋不一致的情況下(步驟s307:否),判斷為是與進(jìn)行第一說(shuō)話的用戶不同的另一用戶進(jìn)行了第二說(shuō)話,進(jìn)行圖2所示的步驟s107。由此,能夠抑制下述情況:在與進(jìn)行第一說(shuō)話的用戶不同的另一用戶繼第一說(shuō)話之后進(jìn)行了請(qǐng)求機(jī)器控制的第二說(shuō)話的情況下,盡管該另一用戶的狀態(tài)以及控制對(duì)象機(jī)器140的狀態(tài)并非適合于控制的狀態(tài),也并不念誦針對(duì)第二說(shuō)話的確認(rèn)應(yīng)答文,而實(shí)施與第二說(shuō)話對(duì)應(yīng)的機(jī)器控制。

另外,當(dāng)在沒(méi)有做出請(qǐng)求與作為對(duì)應(yīng)于第一說(shuō)話的機(jī)器控制的對(duì)象的控制對(duì)象機(jī)器140相同的控制對(duì)象機(jī)器140的機(jī)器控制的第二說(shuō)話的狀態(tài)下(步驟s304:否),經(jīng)過(guò)了預(yù)先確定的一定的期間的情況下(步驟s309:是),行動(dòng)選擇部124廢棄在步驟s302中存儲(chǔ)的第一說(shuō)話的語(yǔ)音數(shù)據(jù)(步驟s310)。

如果按照?qǐng)D4所示的處理流程進(jìn)行處理,在由同一用戶連續(xù)地進(jìn)行了請(qǐng)求同一機(jī)器的機(jī)器控制的說(shuō)話的情況下,能夠避免該用戶連續(xù)地進(jìn)行確認(rèn)受理說(shuō)話。

此外,設(shè)按照?qǐng)D2~圖4所示的各處理流程進(jìn)行處理,進(jìn)行了控制對(duì)象機(jī)器140的機(jī)器控制之后,即使經(jīng)過(guò)一定的時(shí)間,也未進(jìn)行使控制對(duì)象機(jī)器140返回到進(jìn)行該機(jī)器控制之前的狀態(tài)的控制。在該情況下,行動(dòng)選擇部124也可以自動(dòng)地進(jìn)行返回到進(jìn)行該機(jī)器控制之前的狀態(tài)的控制。

例如,設(shè)實(shí)施了由用戶的說(shuō)話所請(qǐng)求的打開(kāi)冰箱門的控制。在該狀態(tài)下,即使經(jīng)過(guò)一定的時(shí)間,也未進(jìn)行請(qǐng)求關(guān)閉冰箱門的控制的說(shuō)話的情況下,行動(dòng)選擇部124也可以自動(dòng)地進(jìn)行關(guān)閉冰箱門的控制。由此,能夠防止忘記關(guān)門,防止即使在萬(wàn)一由于周圍的噪音等語(yǔ)音的誤識(shí)別而錯(cuò)誤地使機(jī)器工作了的情況下,門變?yōu)榇蜷_(kāi)不變的狀態(tài)。也就是說(shuō),在如門的開(kāi)閉控制那樣,進(jìn)行了一方的控制后,要進(jìn)行回到原狀態(tài)的控制的情況下,本構(gòu)成是有用的。

另外,也可以為,狀態(tài)識(shí)別部121使用公知的模式識(shí)別技術(shù),在由傳感部111具備的攝像頭拍攝到的圖像中包含人物的情況下,識(shí)別該圖像中包含的人物的臉部和/或軀體等的特征,基于該特征來(lái)確定該人物。與此同時(shí),也可以預(yù)先存儲(chǔ)被認(rèn)為會(huì)利用語(yǔ)音對(duì)話裝置100的人物的聲紋。

而且,在圖3所示的處理流程中,行動(dòng)選擇部124也可以省略步驟s201,在步驟s204中,使用預(yù)先存儲(chǔ)的聲紋中的、該狀態(tài)識(shí)別部121所確定的、進(jìn)行了控制請(qǐng)求說(shuō)話的用戶的聲紋。同樣地,在圖4所示的處理流程中,行動(dòng)選擇部124也可以省略步驟s302,在步驟s307中,使用預(yù)先存儲(chǔ)的聲紋中的、該狀態(tài)識(shí)別部121所確定的、進(jìn)行了第一說(shuō)話的用戶的聲紋。

(實(shí)施方式2)

在實(shí)施方式2中,其特征在于,持續(xù)地嘗試從被輸入到集音設(shè)備的語(yǔ)音數(shù)據(jù)中檢測(cè)意味著基于語(yǔ)音的機(jī)器控制的契機(jī)的、預(yù)定的觸發(fā)字,在檢測(cè)到觸發(fā)字的情況下,不依據(jù)用戶的狀態(tài)或者機(jī)器周圍的狀態(tài)是否為適合于控制的狀態(tài)的判定結(jié)果,進(jìn)行說(shuō)話的意圖解釋,基于該意圖解釋的結(jié)果,生成與說(shuō)話對(duì)應(yīng)的機(jī)器控制命令。此外,在以下的說(shuō)明中,為了簡(jiǎn)化說(shuō)明,對(duì)與上述實(shí)施方式1同樣的構(gòu)成部分附加同一標(biāo)號(hào),并簡(jiǎn)化說(shuō)明。

圖5是表示實(shí)施方式2中的語(yǔ)音對(duì)話裝置200的全貌的圖。語(yǔ)音對(duì)話裝置200與圖1所示的語(yǔ)音對(duì)話裝置100的不同點(diǎn)在于,語(yǔ)音對(duì)話處理部220還作為觸發(fā)字識(shí)別部228進(jìn)行工作。另外,不同點(diǎn)還在于,語(yǔ)音識(shí)別部222將生成的文本數(shù)據(jù)還輸出到觸發(fā)字識(shí)別部228。另外,不同點(diǎn)還在于,意圖理解部223基于狀態(tài)識(shí)別部121的判定結(jié)果或者觸發(fā)字識(shí)別部228的后述的判定結(jié)果,使與意圖理解部123同樣的說(shuō)話的意圖解釋處理有效。

觸發(fā)字識(shí)別部228通過(guò)執(zhí)行公知的語(yǔ)言解析處理,解析語(yǔ)音識(shí)別部222生成的文本數(shù)據(jù)所表示的說(shuō)話的內(nèi)容,檢測(cè)該說(shuō)話的內(nèi)容中是否包含意味著基于語(yǔ)音的機(jī)器控制的契機(jī)的、預(yù)定的觸發(fā)字(例如“麥克風(fēng)開(kāi)啟”等)。

以下,使用圖6來(lái)說(shuō)明實(shí)施方式2中的處理流程。在由狀態(tài)識(shí)別部121判定為用戶的狀態(tài)或者機(jī)器周圍的狀態(tài)是適合于控制的狀態(tài)的情況下(步驟s401:是),意圖理解部223使意圖解釋處理有效(步驟s403)。另外,在由狀態(tài)識(shí)別部121判定為用戶的狀態(tài)以及機(jī)器周圍的狀態(tài)并非適合于控制的狀態(tài)的情況下(步驟s401:否),當(dāng)由觸發(fā)字識(shí)別部228檢測(cè)到觸發(fā)字時(shí)(步驟s402:是),意圖理解部223也使意圖解釋處理有效(步驟s403)。

當(dāng)由狀態(tài)識(shí)別部121判定為用戶的狀態(tài)以及機(jī)器周圍的狀態(tài)并非適合于控制的狀態(tài)(步驟s401:否),且并未由觸發(fā)字識(shí)別部228檢測(cè)到觸發(fā)字時(shí)(步驟s402:否),進(jìn)行步驟s401。由此,觸發(fā)字識(shí)別部228持續(xù)地嘗試檢測(cè)觸發(fā)字。

在意圖解釋處理被設(shè)為有效的狀態(tài)下,當(dāng)集音設(shè)備中被輸入表示用戶的說(shuō)話的語(yǔ)音數(shù)據(jù),語(yǔ)音輸入部112將該語(yǔ)音數(shù)據(jù)向語(yǔ)音識(shí)別部222輸出時(shí)(步驟s404:是),意圖理解部223解析語(yǔ)音識(shí)別部222生成的文本數(shù)據(jù)所表示的說(shuō)話的內(nèi)容,進(jìn)行該說(shuō)話的意圖解釋(步驟s405)。在該情況下,行動(dòng)選擇部124基于由意圖理解部223得到的意圖解釋的結(jié)果,執(zhí)行由用戶的說(shuō)話所請(qǐng)求的任務(wù)(步驟s406)。

當(dāng)在步驟s403中意圖解釋處理被設(shè)為有效后,在用戶未說(shuō)話的狀態(tài)下(步驟s404:否),經(jīng)過(guò)了預(yù)先確定的一定的時(shí)間、或者由狀態(tài)識(shí)別部121判定為用戶的狀態(tài)或者機(jī)器周圍的狀態(tài)并非適合于控制的狀態(tài)的情況下(步驟s407:是),意圖理解部223使意圖解釋處理無(wú)效(步驟s408)。

另一方面,在未經(jīng)過(guò)預(yù)先確定的一定的時(shí)間(未超時(shí))、并且由狀態(tài)識(shí)別部121判定為用戶的狀態(tài)或者機(jī)器周圍的狀態(tài)是適合于控制的狀態(tài)的情況下(步驟s407:否),成為等待由用戶進(jìn)行的說(shuō)話的狀態(tài)。

根據(jù)以上所述的實(shí)施方式2的語(yǔ)音對(duì)話裝置200,在由觸發(fā)字識(shí)別部228解釋為用戶的說(shuō)話是觸發(fā)字的說(shuō)話的情況下,不依照狀態(tài)識(shí)別部121的判定結(jié)果,使意圖理解部223的意圖解釋處理有效,進(jìn)行與用戶的說(shuō)話對(duì)應(yīng)的機(jī)器控制。由此,能夠在用戶說(shuō)出觸發(fā)字,該用戶進(jìn)行機(jī)器控制的意圖明確的情況下,并不念誦確認(rèn)應(yīng)答文,而迅速地進(jìn)行與說(shuō)話對(duì)應(yīng)的機(jī)器控制。由此,用戶的便利性提高。另外,在用戶的狀態(tài)或者機(jī)器周圍的狀態(tài)處于適合于控制的狀態(tài)的情況下,用戶能夠不進(jìn)行觸發(fā)字的說(shuō)話,而迅速地進(jìn)行所請(qǐng)求的機(jī)器控制。由此,能夠提高用戶的便利性。

此外,也可以省略步驟s401,觸發(fā)字識(shí)別部228通過(guò)重復(fù)步驟s402直到檢測(cè)到觸發(fā)字,從而持續(xù)地嘗試檢測(cè)觸發(fā)字。而且,意圖理解部223也可以僅在由觸發(fā)字識(shí)別部228檢測(cè)到觸發(fā)字的情況下(步驟s402:是),使意圖解釋處理有效。

(實(shí)施方式3)

在實(shí)施方式3中,其特征在于,即使在判定為用戶的狀態(tài)以及機(jī)器周圍的狀態(tài)并非適合于控制的狀態(tài)的情況下,也繼續(xù)判定用戶的狀態(tài)或者機(jī)器周圍的狀態(tài)是否為適合于控制的狀態(tài),并在從檢測(cè)到用戶的說(shuō)話起到預(yù)定的期間內(nèi),判定為用戶的狀態(tài)或者機(jī)器周圍的狀態(tài)是適合于控制的狀態(tài)的情況下,生成與說(shuō)話對(duì)應(yīng)的機(jī)器控制命令。此外,在以下的說(shuō)明中,為了簡(jiǎn)化說(shuō)明,對(duì)與上述實(shí)施方式1同樣的構(gòu)成部分附加同一標(biāo)號(hào),并簡(jiǎn)化說(shuō)明。

圖7是表示實(shí)施方式3中的語(yǔ)音對(duì)話裝置300的全貌的圖。語(yǔ)音對(duì)話裝置300與圖1所示的語(yǔ)音對(duì)話裝置100不同點(diǎn)在于,在語(yǔ)音對(duì)話處理部320中還設(shè)置有控制受理定時(shí)器328。另外,不同點(diǎn)還在于,行動(dòng)選擇部324進(jìn)而基于由控制受理定時(shí)器328實(shí)施的時(shí)間經(jīng)過(guò)的通知來(lái)進(jìn)行工作。

在控制受理定時(shí)器328中,當(dāng)在用戶的狀態(tài)以及機(jī)器周圍的狀態(tài)并非適合于控制的狀態(tài)的狀態(tài)下,進(jìn)行了請(qǐng)求機(jī)器控制的說(shuō)話的情況下,通過(guò)行動(dòng)選擇部324,設(shè)定從進(jìn)行了該說(shuō)話到用戶的狀態(tài)或者機(jī)器周圍的狀態(tài)轉(zhuǎn)變至適合于控制的狀態(tài)為止的容許時(shí)間??刂剖芾矶〞r(shí)器328在被設(shè)定了該容許時(shí)間后,當(dāng)經(jīng)過(guò)了該容許時(shí)間時(shí),將經(jīng)過(guò)了容許時(shí)間這一情況通知給行動(dòng)選擇部324。

行動(dòng)選擇部324當(dāng)在用戶的狀態(tài)以及機(jī)器周圍的狀態(tài)并非適合于控制的狀態(tài)的狀態(tài)下進(jìn)行了請(qǐng)求機(jī)器控制的說(shuō)話的情況下,對(duì)控制受理定時(shí)器328設(shè)定上述容許時(shí)間。行動(dòng)選擇部324在該設(shè)定后、由控制受理定時(shí)器328通知經(jīng)過(guò)了容許時(shí)間之前,在用戶的狀態(tài)或者機(jī)器周圍的狀態(tài)轉(zhuǎn)變至適合于控制的狀態(tài)的情況下,進(jìn)行與實(shí)施方式1的行動(dòng)選擇部124同樣的工作。

以下,使用圖8來(lái)說(shuō)明實(shí)施方式3中的處理流程。此外,關(guān)于步驟s101~s104、s111,與圖2的處理流程同樣地執(zhí)行,因此省略說(shuō)明。在步驟s102中由語(yǔ)音識(shí)別部122檢測(cè)到用戶的說(shuō)話后,由意圖理解部123解釋為該用戶的說(shuō)話是請(qǐng)求機(jī)器控制的說(shuō)話的情況下(步驟s104:是),行動(dòng)選擇部324對(duì)控制受理定時(shí)器328設(shè)定預(yù)先確定的容許時(shí)間(步驟s505)。對(duì)控制受理定時(shí)器328設(shè)定了容許時(shí)間后,狀態(tài)識(shí)別部121判定用戶的狀態(tài)或者機(jī)器周圍的狀態(tài)是否為適合于控制的狀態(tài)(步驟s506)。

在狀態(tài)識(shí)別部121判定為用戶的狀態(tài)或者機(jī)器周圍的狀態(tài)是適合于控制的狀態(tài)的情況下(步驟506:是),與步驟s106同樣地,行動(dòng)選擇部324使機(jī)器控制部125執(zhí)行用戶所請(qǐng)求的機(jī)器控制(步驟s507)。

另一方面,在狀態(tài)識(shí)別部121判定為用戶的狀態(tài)以及機(jī)器周圍的狀態(tài)并非適合于控制的狀態(tài)的情況下(步驟s506:否),行動(dòng)選擇部324等待用戶的狀態(tài)或者機(jī)器周圍的狀態(tài)轉(zhuǎn)移為適合于控制的狀態(tài),直到被控制受理定時(shí)器328通知經(jīng)過(guò)了容許時(shí)間為止(步驟s508:否)。由此,行動(dòng)選擇部324即使在由狀態(tài)識(shí)別部121判定為用戶的狀態(tài)以及機(jī)器周圍的狀態(tài)并非適合于控制的狀態(tài)的情況下(步驟s506:否),仍使?fàn)顟B(tài)識(shí)別部121繼續(xù)判定用戶的狀態(tài)或者機(jī)器周圍的狀態(tài)是否為適合于控制的狀態(tài)。

當(dāng)在狀態(tài)識(shí)別部121沒(méi)有判定為用戶的狀態(tài)或者機(jī)器周圍的狀態(tài)是適合于控制的狀態(tài)的狀態(tài)下,被控制受理定時(shí)器328通知經(jīng)過(guò)了容許時(shí)間的情況下(步驟s508:是),行動(dòng)選擇部324取消由用戶實(shí)施的機(jī)器控制的請(qǐng)求(步驟s509)。

根據(jù)以上所述的實(shí)施方式3的語(yǔ)音對(duì)話裝置300,即使在用戶的狀態(tài)以及機(jī)器周圍的狀態(tài)并非適合于控制的狀態(tài)的情況下進(jìn)行了請(qǐng)求機(jī)器控制的說(shuō)話,通過(guò)在該說(shuō)話后到經(jīng)過(guò)容許時(shí)間為止的期間中,用戶的狀態(tài)或者機(jī)器周圍的狀態(tài)轉(zhuǎn)變?yōu)檫m合于控制的狀態(tài),也能夠進(jìn)行該機(jī)器控制。

例如,設(shè)以向冰箱的收納為目的,用戶在門口等遠(yuǎn)離冰箱的位置,并且在冰箱周圍存在人物的狀態(tài)下,一邊拿著要收納的食品,一邊進(jìn)行請(qǐng)求打開(kāi)冰箱門的控制的說(shuō)話。此時(shí),根據(jù)實(shí)施方式3的語(yǔ)音對(duì)話裝置300,在步驟s506中,狀態(tài)識(shí)別部121判定為用戶的狀態(tài)以及機(jī)器周圍的狀態(tài)并非適合于控制的狀態(tài)。然而,用戶在上述說(shuō)話后到經(jīng)過(guò)容許時(shí)間的期間內(nèi),移動(dòng)到冰箱前并使視線、臉部或者軀體朝向冰箱時(shí),或者冰箱的周圍變得不存在人物時(shí),在步驟s506中,由狀態(tài)識(shí)別部121判定為用戶的狀態(tài)成為適合于控制的狀態(tài)。然后,在步驟s507中,執(zhí)行打開(kāi)冰箱門的控制。

這樣,根據(jù)實(shí)施方式3的語(yǔ)音對(duì)話裝置300,尤其在從遠(yuǎn)離控制對(duì)象機(jī)器140的位置接近控制對(duì)象機(jī)器140的移動(dòng)過(guò)程中進(jìn)行請(qǐng)求機(jī)器控制的說(shuō)話這樣的場(chǎng)景中,能夠提高用戶的便利性。此外,關(guān)于容許時(shí)間,設(shè)想該場(chǎng)景從而例如確定為十余秒即可。但是,并非旨在將容許時(shí)間限定于此。另外,在步驟s505中,行動(dòng)選擇部324也可以根據(jù)在步驟s104中所辨別出的控制對(duì)象機(jī)器140,個(gè)別地設(shè)定不同的容許時(shí)間。

當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1