本發(fā)明涉及對(duì)用戶的發(fā)聲進(jìn)行識(shí)別的語音識(shí)別系統(tǒng)。
背景技術(shù):
以往,已知有始終對(duì)用戶的發(fā)聲進(jìn)行識(shí)別并執(zhí)行與識(shí)別結(jié)果相對(duì)應(yīng)的處理的語音識(shí)別系統(tǒng)(例如參照專利文獻(xiàn)1)。這種語音識(shí)別系統(tǒng)在不對(duì)下述內(nèi)容,即:是用戶打算對(duì)系統(tǒng)進(jìn)行語音操作而進(jìn)行了發(fā)聲,還是僅僅是用戶彼此的對(duì)話中的發(fā)聲進(jìn)行判斷的情況下進(jìn)行識(shí)別處理,并執(zhí)行與識(shí)別結(jié)果相對(duì)應(yīng)的處理。
例如,在用戶彼此進(jìn)行了“超市和便利店哪個(gè)好?”“還是便利店好吧”這樣的對(duì)話的情況下,用戶并非打算進(jìn)行語音操作而進(jìn)行發(fā)聲,但由于語音識(shí)別系統(tǒng)始終對(duì)用戶的發(fā)聲進(jìn)行識(shí)別,因此,識(shí)別出了“超市”和“便利店”這樣的單詞,并執(zhí)行與這些識(shí)別結(jié)果相對(duì)應(yīng)的處理。
另外,語音識(shí)別系統(tǒng)在用戶發(fā)聲的識(shí)別失敗的情況下,需要對(duì)識(shí)別失敗的情況和識(shí)別失敗的原因等進(jìn)行語音輸出并通知給用戶。因此,即使在要對(duì)如上所述的用戶彼此的對(duì)話進(jìn)行識(shí)別卻失敗了的情況下,也仍輸出內(nèi)容為識(shí)別失敗的語音。
現(xiàn)有技術(shù)文獻(xiàn)
專利文獻(xiàn)
專利文獻(xiàn)1:日本專利特開2008-14818號(hào)公報(bào)
技術(shù)實(shí)現(xiàn)要素:
發(fā)明所要解決的技術(shù)問題
由于現(xiàn)有的語音識(shí)別系統(tǒng)采用如上所述的結(jié)構(gòu),因此,即使用戶不打算進(jìn)行語音操作而進(jìn)行了發(fā)聲,但還是自作主張地執(zhí)行了與識(shí)別結(jié)果相對(duì)應(yīng)的處理,從而顯示出與正在顯示的畫面大不相同的畫面,或者輸出了內(nèi)容為識(shí)別失敗的語音。這對(duì)用戶來說會(huì)感到郁悶并使不快感增加。
另一方面,在用戶打算進(jìn)行語音操作而進(jìn)行了發(fā)聲的情況下,語音識(shí)別系統(tǒng)必須執(zhí)行與識(shí)別結(jié)果相對(duì)應(yīng)的處理,在識(shí)別失敗的情況下需要將該內(nèi)容通知給用戶。
本發(fā)明是為了解決上述的問題而完成的,其目的在于,在始終對(duì)用戶的發(fā)聲進(jìn)行識(shí)別的語音識(shí)別系統(tǒng)中,使用戶的不快感降低。
用于解決技術(shù)問題的技術(shù)手段
本發(fā)明所涉及的語音識(shí)別系統(tǒng)是始終對(duì)用戶所發(fā)出的語音進(jìn)行識(shí)別,并基于識(shí)別結(jié)果來對(duì)被控制裝置進(jìn)行控制的語音識(shí)別系統(tǒng),該語音識(shí)別系統(tǒng)包括:語音操作意圖判斷部,該語音操作意圖判斷部針對(duì)所識(shí)別出的發(fā)聲,判斷用戶有無操作被控制裝置的意圖;以及控制狀態(tài)變更部,該控制狀態(tài)變更部在語音操作意圖判斷部中判斷為無操作意圖的情況下,與判斷為有操作意圖的情況相比,將被控制裝置的控制的狀態(tài)向不讓用戶意識(shí)到的方向進(jìn)行變更。
發(fā)明效果
根據(jù)本發(fā)明,在判斷為用戶無操作意圖的情況下,與判斷為有操作意圖的情況相比,使被控制裝置的控制的狀態(tài)向不讓用戶意識(shí)到的方向進(jìn)行變更,因此,能降低用戶的不快感。
附圖說明
圖1是表示應(yīng)用了本發(fā)明實(shí)施方式1所涉及的語音識(shí)別系統(tǒng)的導(dǎo)航系統(tǒng)的一個(gè)示例的框圖。
圖2是表示語音操作意圖的判斷項(xiàng)目和可靠度的一個(gè)示例的圖。
圖3是表示控制狀態(tài)的示例的圖。
圖4是表示控制狀態(tài)的其它示例的圖。
圖5是表示根據(jù)“有語音操作意圖”的可靠度定義了不同的控制狀態(tài)的示例的圖。
圖6是表示根據(jù)“有語音操作意圖”的可靠度定義了不同的控制狀態(tài)的其它示例的圖。
圖7是表示導(dǎo)航部基于控制狀態(tài)來執(zhí)行處理的示例的圖。
圖8是對(duì)實(shí)施方式1所涉及的語音識(shí)別系統(tǒng)的動(dòng)作進(jìn)行說明的流程圖。
具體實(shí)施方式
下面,為了更詳細(xì)地說明本發(fā)明,根據(jù)附圖對(duì)本發(fā)明的實(shí)施方式進(jìn)行說明。
此外,在以下的實(shí)施方式中,列舉將本發(fā)明所涉及的語音識(shí)別系統(tǒng)運(yùn)用于車輛等移動(dòng)體用的導(dǎo)航系統(tǒng)(被控制裝置)的情況作為示例來進(jìn)行說明,但只要是具有語音操作功能的系統(tǒng)即可,可以適用于任何系統(tǒng)。
實(shí)施方式1.
圖1是表示應(yīng)用了本發(fā)明實(shí)施方式1所涉及的語音識(shí)別系統(tǒng)10的導(dǎo)航系統(tǒng)的一個(gè)示例的框圖。該導(dǎo)航系統(tǒng)包括導(dǎo)航部1、指示輸入部2、顯示器3、揚(yáng)聲器4、麥克風(fēng)5、攝像頭6、語音獲取部11、語音識(shí)別部12、語音識(shí)別辭典13、語音操作意圖判斷部14、控制狀態(tài)變更部15、控制狀態(tài)存儲(chǔ)部16、語音分析部17、狀態(tài)獲取部18及視線檢測(cè)部19。此外,導(dǎo)航系統(tǒng)的構(gòu)成要素也可以分散于網(wǎng)絡(luò)上的服務(wù)器、智能手機(jī)等移動(dòng)終端、車載設(shè)備。
語音獲取部11、語音識(shí)別部12、語音識(shí)別辭典13、語音操作意圖判斷部14、控制狀態(tài)變更部15、控制狀態(tài)存儲(chǔ)部16、語音分析部17、狀態(tài)獲取部18及視線檢測(cè)部19構(gòu)成語音識(shí)別系統(tǒng)10。
該語音識(shí)別系統(tǒng)10由未圖示的CPU(Central Processing Unit:中央處理器)等構(gòu)成,通過該CPU執(zhí)行規(guī)定的程序,從而實(shí)現(xiàn)作為語音獲取部11、語音識(shí)別部12、語音識(shí)別辭典13、語音操作意圖判斷部14、控制狀態(tài)變更部15、控制狀態(tài)存儲(chǔ)部16、語音分析部17、狀態(tài)獲取部18及視線檢測(cè)部19的功能。
導(dǎo)航部1利用從GPS(Global Positioning System:全球定位系統(tǒng))接收機(jī)等所獲取的移動(dòng)體的當(dāng)前位置信息以及存儲(chǔ)于地圖數(shù)據(jù)庫中的信息,來生成要顯示于顯示器3的繪制信息。地圖數(shù)據(jù)庫中例如包含有關(guān)于道路的“道路信息”(道路的位置等)、關(guān)于設(shè)施的“設(shè)施信息”(設(shè)施的類別、名稱、位置等)、“各種文字信息”(地名、設(shè)施名、交叉路口名、道路名等)、以及表示設(shè)施和道路編號(hào)等的“各種圖標(biāo)信息”等。
另外,導(dǎo)航部1根據(jù)來自指示輸入部2的指示或來自后述的控制狀態(tài)變更部15的指示,來進(jìn)行移動(dòng)路徑等的檢索、向顯示器3進(jìn)行的顯示指示和畫面轉(zhuǎn)換、向揚(yáng)聲器4發(fā)出的語音輸出指示等各種控制。
例如,導(dǎo)航部1使用用戶通過對(duì)指示輸入部2的操作或?qū)φZ音識(shí)別系統(tǒng)10的語音操作而設(shè)定的設(shè)施或地點(diǎn)、以及移動(dòng)體的當(dāng)前位置和地圖數(shù)據(jù)庫的信息等,來計(jì)算從當(dāng)前位置到用戶所設(shè)定的設(shè)施等為止的路徑。然后,導(dǎo)航部1生成用于沿該路徑來引導(dǎo)移動(dòng)體的指引引導(dǎo)圖和指引引導(dǎo)消息,并向顯示器3和揚(yáng)聲器4發(fā)出輸出該所生成的信息的指示。
指示輸入部2接受由用戶手動(dòng)進(jìn)行的指示的輸入。例如,可以列舉出對(duì)經(jīng)由硬件開關(guān)、組裝于顯示器3的觸摸傳感器、或者設(shè)置于把手等的遙控器或獨(dú)立的遙控器接受到的用戶的指示進(jìn)行識(shí)別的識(shí)別裝置。
顯示器3例如是LCD(Liquid Crystal Display:液晶顯示器)、HUD(Head-Up Display:抬頭顯示器)或者儀表板等,基于導(dǎo)航部1的指示在畫面上進(jìn)行繪制。
揚(yáng)聲器4基于導(dǎo)航部1的指示來輸出語音。
麥克風(fēng)5獲取(采集)用戶所發(fā)出的語音。對(duì)于麥克風(fēng)5,例如使用全向性麥克風(fēng)、將多個(gè)全向性麥克風(fēng)排列成陣列狀從而能對(duì)指向特性進(jìn)行調(diào)整的陣列麥克風(fēng)、或者僅在一個(gè)方向具有指向性從而無法對(duì)指向特性進(jìn)行調(diào)整的單向性麥克風(fēng)等。
攝像頭6對(duì)用戶進(jìn)行拍攝。攝像頭6的圖像信息被用于后述的視線檢測(cè)部19中對(duì)用戶的視線進(jìn)行檢測(cè)。
語音獲取部11導(dǎo)入由麥克風(fēng)5所獲取到的用戶發(fā)聲、即所輸入的語音,并利用例如PCM(Pulse Code Modulation:脈沖編碼調(diào)制)來進(jìn)行A/D(Analog/Digital:模/數(shù))轉(zhuǎn)換。另外,語音獲取部11根據(jù)數(shù)字化后的語音信號(hào)來對(duì)符合用戶發(fā)聲的內(nèi)容的語音區(qū)間進(jìn)行檢測(cè)。
語音識(shí)別部12提取出由語音獲取部11所檢測(cè)出的語音區(qū)間的語音數(shù)據(jù)的特征量,基于該特征量,利用語音識(shí)別辭典13來進(jìn)行識(shí)別處理,并輸出識(shí)別結(jié)果。作為識(shí)別處理,使用例如HMM(Hidden Markov Model:隱式馬爾克夫模型)法這樣的一般方法來進(jìn)行即可。
此外,識(shí)別結(jié)果中包含識(shí)別結(jié)果字符串,同時(shí)還可以包含表示匹配度的得分。
此外,在搭載于車載導(dǎo)航系統(tǒng)等的語音識(shí)別功能中,通常會(huì)對(duì)系統(tǒng)明確表示(指示)用戶發(fā)聲的開始。為此,會(huì)在觸摸面板上顯示、或在方向盤上設(shè)置指示語音識(shí)別開始的按鈕(以下,稱為“語音識(shí)別開始指示部”)。然后,在用戶按下語音識(shí)別開始指示部后,對(duì)發(fā)出的語音進(jìn)行識(shí)別。即,語音識(shí)別開始指示部輸出語音識(shí)別開始信號(hào),若語音識(shí)別部接受該信號(hào),則在接受該信號(hào)后從由語音獲取部獲取的語音數(shù)據(jù)中檢測(cè)出符合用戶發(fā)聲的內(nèi)容的語音區(qū)間,并進(jìn)行上述識(shí)別處理。
然而,本實(shí)施方式1中的語音識(shí)別部12即使沒有上述那樣的由用戶進(jìn)行的語音識(shí)別開始指示,也始終對(duì)用戶發(fā)聲的內(nèi)容進(jìn)行識(shí)別。即,語音識(shí)別部12即使未接收到語音識(shí)別開始信號(hào),也始終反復(fù)進(jìn)行下述處理:提取出語音獲取部11所檢測(cè)出的語音區(qū)間的語音數(shù)據(jù)的特征量,基于該特征量,利用語音識(shí)別辭典13來進(jìn)行識(shí)別處理,并輸出語音識(shí)別結(jié)果。
語音操作意圖判斷部14判斷用戶是否具有對(duì)系統(tǒng)進(jìn)行語音操作的意圖而進(jìn)行了發(fā)聲,并輸出該判斷結(jié)果。以下,將語音操作意圖判斷部14判斷為用戶具有進(jìn)行語音操作的意圖而進(jìn)行了發(fā)聲的情況設(shè)為“有語音操作意圖”,將不是如此的情況設(shè)為“無語音操作意圖”來進(jìn)行說明。關(guān)于語音操作意圖的有無的判斷項(xiàng)目將在后文中進(jìn)行描述。
控制狀態(tài)存儲(chǔ)部16對(duì)于語音識(shí)別部12中的每個(gè)識(shí)別對(duì)象語,將在“有語音操作意圖”的情況下對(duì)導(dǎo)航部1進(jìn)行指示的控制狀態(tài)、以及在“無語音操作意圖”的情況下對(duì)導(dǎo)航部1進(jìn)行指示的控制狀態(tài)與識(shí)別對(duì)象語相對(duì)應(yīng)關(guān)聯(lián)來進(jìn)行存儲(chǔ)。
另外,控制狀態(tài)存儲(chǔ)部16在語音識(shí)別部12進(jìn)行語音識(shí)別失敗時(shí),對(duì)“有語音操作意圖”的情況和“無語音操作意圖”的情況定義對(duì)導(dǎo)航部1進(jìn)行指示的控制狀態(tài)并進(jìn)行存儲(chǔ)。
所謂控制狀態(tài),是指運(yùn)用本實(shí)施方式1所涉及的語音識(shí)別系統(tǒng)10的被控制裝置的各種動(dòng)作。例如,在導(dǎo)航系統(tǒng)中,控制狀態(tài)是畫面轉(zhuǎn)換、應(yīng)答語音及通知聲的輸出內(nèi)容、系統(tǒng)所具有的目的地設(shè)定等各功能的執(zhí)行等各種動(dòng)作。
“無語音操作意圖”的情況的控制狀態(tài)被定義為,與“有語音操作意圖”的情況的控制狀態(tài)相比,不會(huì)對(duì)用戶造成打擾,即,用戶意識(shí)到導(dǎo)航系統(tǒng)的程度變小。
在“無語音操作意圖”的情況下,與“有語音操作意圖”的情況相比,例如采用減小語音輸出的音量、或減少語音輸出內(nèi)容或顯示內(nèi)容的信息量、或停止語音輸出等不讓用戶意識(shí)到導(dǎo)航系統(tǒng)那樣的控制狀態(tài)。
關(guān)于控制狀態(tài)的具體例,將在后文中描述。
控制狀態(tài)變更部15參照控制狀態(tài)存儲(chǔ)部16,基于語音識(shí)別部12所輸出的識(shí)別結(jié)果和語音操作意圖判斷部14所輸出的判斷結(jié)果來決定控制狀態(tài),并向?qū)Ш讲?輸出該所決定的控制狀態(tài)。
接著,對(duì)語音操作意圖判斷部14所進(jìn)行的有無語音操作意圖判斷的判斷項(xiàng)目、以及獲取或生成該判斷時(shí)所使用的信息的構(gòu)成要素進(jìn)行說明。
(1)基于用戶所發(fā)出的語音的音量、音高、清晰度、用戶的發(fā)聲速度及語音的發(fā)聲源的方向中的至少一個(gè)來進(jìn)行的有無語音操作意圖的判斷
(1)的情況下,語音識(shí)別系統(tǒng)10包括語音分析部17。
語音分析部17對(duì)由語音獲取部11所輸出的語音數(shù)據(jù)進(jìn)行分析,對(duì)用戶所發(fā)出的語音的音量、音高、清晰度、用戶的發(fā)聲速度、語音的發(fā)聲源的方向中的至少一個(gè)進(jìn)行計(jì)算。
此外,關(guān)于音量、音高、清晰度、用戶的發(fā)聲速度和發(fā)聲源的方向的計(jì)算方法,使用公知技術(shù)即可,因此省略說明。
這里,首先以清晰度為例來進(jìn)行說明。
語音操作意圖判斷部14獲取由語音分析部17所計(jì)算出的清晰度,對(duì)該清晰度的大小是否為預(yù)定閾值以上(或者比閾值要大)進(jìn)行判定。在該清晰度為預(yù)定閾值以上的情況下,語音操作意圖判斷部14判斷為“有語音操作意圖”。另一方面,在該清晰度小于預(yù)定閾值的情況下,語音操作意圖判斷部14判斷為“無語音操作意圖”。
或者,語音操作意圖判斷部14對(duì)從語音分析部17所獲取到的清晰度是否為過去多次獲取到的清晰度的平均值以上(或者,比平均值要大)進(jìn)行判定。在該清晰度為該平均值以上的情況下,語音操作意圖判斷部14判斷為“有語音操作意圖”。另一方面,在該清晰度小于該平均值的情況下,語音操作意圖判斷部14判斷為“無語音操作意圖”。
語音操作意圖判斷部14通過與使用清晰度的有無語音操作意圖的判斷相同的方法,使用用戶所發(fā)出的語音的音量或音高,來對(duì)有無語音操作意圖進(jìn)行判斷。
例如,在使用發(fā)聲語音的音量的情況下,語音操作意圖判斷部14在從語音分析部17所獲取到的發(fā)聲語音的音量為過去多次發(fā)聲語音的音量的平均值以上(或者比平均值要大)的情況下,判斷為“有語音操作意圖”。
例如,在使用發(fā)聲語音的音高的情況下,語音操作意圖判斷部14在從語音分析部17所獲取到的發(fā)聲語音的音高為過去多次發(fā)聲語音的音高的平均值以上(或者比平均值要大)的情況下,判斷為“有語音操作意圖”。
接著,以發(fā)聲速度為例來進(jìn)行說明。
語音操作意圖判斷部14獲取由語音分析部17所計(jì)算出的發(fā)聲速度,對(duì)該發(fā)聲速度是否小于預(yù)定閾值(或者為平均值以下)進(jìn)行判定。在該發(fā)聲速度小于預(yù)定閾值的情況下,語音操作意圖判斷部14判斷為“有語音操作意圖”。另一方面,在該發(fā)聲速度為預(yù)定閾值以上的情況下,語音操作意圖判斷部14判斷為“無語音操作意圖”。
或者,語音操作意圖判斷部14在從語音分析部17所獲取到的發(fā)聲速度小于過去多次獲取到的發(fā)聲速度的平均值(或者為閾值以下)的情況下,判斷為“有語音操作意圖”,在并非如此的情況下,判斷為“無語音操作意圖”。
此外,在將清晰度等與過去的平均值相比較來對(duì)有無語音操作意圖進(jìn)行判斷時(shí),可以考慮到利用語音分析部17計(jì)算清晰度等時(shí)的誤差,從而在平均值上加上(或減去)預(yù)先設(shè)定的值。將對(duì)平均值加上(或減去)的值設(shè)為與誤差間具有有意差的值。
接著,以語音的發(fā)聲源的方向?yàn)槔齺磉M(jìn)行說明。
語音操作意圖判斷部14獲取由語音分析部17所計(jì)算出的語音的發(fā)聲源的方向。當(dāng)在多個(gè)方向上存在發(fā)聲源的情況下,語音操作意圖判斷部14確定用戶正在與其它用戶進(jìn)行對(duì)話,從而判斷為“無語音操作意圖”。另一方面,在發(fā)聲源為一個(gè)的情況下,語音操作意圖判斷部14判斷為“有語音操作意圖”。
(2)基于識(shí)別結(jié)果的種類來進(jìn)行的有無語音操作意圖的判斷
(2)的情況下,無需上述(1)的語音分析部17。
語音操作意圖判斷部14獲取由語音識(shí)別部12所輸出的識(shí)別結(jié)果。然后,語音操作意圖判斷部14判定該識(shí)別結(jié)果是否為用于對(duì)運(yùn)用了本語音識(shí)別系統(tǒng)10的被控制裝置(本實(shí)施方式1中為導(dǎo)航系統(tǒng))進(jìn)行操作的命令,在是該命令的情況下,判斷為“有語音操作意圖”。在并非如此的情況下,判斷為“無語音操作意圖”。
(3)基于識(shí)別履歷來進(jìn)行的有無語音操作意圖的判斷
(3)的情況下,無需上述(1)的語音分析部17。
語音操作意圖判斷部14獲取由語音識(shí)別部12所輸出的識(shí)別結(jié)果。
另外,語音操作意圖判斷部14存儲(chǔ)從語音識(shí)別部12所獲取到的識(shí)別結(jié)果并存儲(chǔ)至少一個(gè)以上來作為識(shí)別履歷。
然后,語音操作意圖判斷部14基于識(shí)別履歷,在識(shí)別結(jié)果所包含的識(shí)別得分變?yōu)轭A(yù)定閾值以下的情況(即,語音識(shí)別部12所進(jìn)行的識(shí)別處理雖然成功但匹配度較低的情況)、或者語音識(shí)別部12所進(jìn)行的識(shí)別處理失敗的情況連續(xù)發(fā)生兩次以上時(shí),判斷為“有語音操作意圖”。語音操作意圖判斷部14可以將識(shí)別得分為預(yù)定閾值以下的情況與識(shí)別處理失敗的情況相區(qū)別來進(jìn)行計(jì)數(shù),也可以不加區(qū)別地進(jìn)行計(jì)數(shù)。
此外,語音操作意圖判斷部14在連續(xù)兩次以上出現(xiàn)識(shí)別結(jié)果所包含的識(shí)別得分為預(yù)定閾值以下且各識(shí)別結(jié)果字符串相同的情況下,也可以判斷為“有語音操作意圖”。
在車內(nèi)噪聲較大等狀況下,在用戶所發(fā)出的語音的識(shí)別得分較低或識(shí)別失敗的情況下,導(dǎo)航部1不進(jìn)行用戶打算進(jìn)行的動(dòng)作,因此,若用戶有操作意圖,則再一次重復(fù)發(fā)聲的可能性較高。因此,在(3)中,若用戶重復(fù)發(fā)聲,則視為有語音操作的意圖,若僅為1次的發(fā)聲,則視為無語音操作的意圖。例如,當(dāng)用戶連續(xù)兩次發(fā)出“便利店”的語音,且語音識(shí)別部12連續(xù)兩次識(shí)別處理失敗時(shí),語音操作意圖判斷部14判斷為“有語音操作意圖”,因此,在用戶的第三次發(fā)聲的識(shí)別處理成功的情況下,該第三次發(fā)聲的識(shí)別結(jié)果為“有語音操作意圖”。
此外,在用戶發(fā)出“便利店”的語音并且其識(shí)別得分為閾值以下的情況下,在第二次發(fā)聲時(shí)存在改為“便利商店”等說法的可能性,因此,無論各發(fā)聲的識(shí)別結(jié)果字符串相同還是不同都沒問題。
(4)基于運(yùn)用語音識(shí)別系統(tǒng)10的系統(tǒng)等的動(dòng)作狀態(tài)來進(jìn)行的有無語音操作意圖的判斷
(4)的情況下,語音識(shí)別系統(tǒng)10包括狀態(tài)獲取部18。無需上述(1)的語音分析部17。
狀態(tài)獲取部18從導(dǎo)航部1獲取導(dǎo)航系統(tǒng)的動(dòng)作狀態(tài)。
語音操作意圖判斷部14預(yù)先定義下述推測(cè)為用戶想要操作導(dǎo)航系統(tǒng)、或者處于操作中的系統(tǒng)的動(dòng)作狀態(tài),例如,用戶進(jìn)行的規(guī)定的操作后的結(jié)果顯示中(例如,設(shè)施檢索結(jié)果的列表顯示中等)以及用戶進(jìn)行的按下按鍵等操作中等。
語音操作意圖判斷部14在狀態(tài)獲取部18所獲取到的導(dǎo)航系統(tǒng)的動(dòng)作狀態(tài)與預(yù)先定義的動(dòng)作狀態(tài)相一致的情況下,判斷為“有語音操作意圖”,在與預(yù)先定義的動(dòng)作狀態(tài)不一致的情況下,判斷為“無語音操作意圖”。
例如,在設(shè)施檢索結(jié)果列表的顯示中,用戶進(jìn)行從列表中選擇一個(gè)設(shè)施等打算對(duì)導(dǎo)航系統(tǒng)進(jìn)行操作的動(dòng)作的可能性較高,因此,語音操作意圖判斷部14在導(dǎo)航系統(tǒng)的動(dòng)作狀態(tài)為列表顯示中的情況下,判斷為“有語音操作意圖”。
或者,語音操作意圖判斷部14也可以對(duì)每個(gè)導(dǎo)航系統(tǒng)的動(dòng)作狀態(tài)預(yù)先定義是“有語音操作意圖”還是“無語音操作意圖”。
例如,用戶在從設(shè)施檢索結(jié)果列表等列表中選擇項(xiàng)目的情況下,進(jìn)行語音操作,在按下設(shè)施檢索條件設(shè)定等的按鈕來將分層菜單向下移動(dòng)的情況下,存在經(jīng)由指示輸入部2來進(jìn)行手動(dòng)操作的傾向。因此,將導(dǎo)航系統(tǒng)的動(dòng)作狀態(tài)為列表顯示中的情況定義為“有語音操作意圖”,將分層菜單顯示中的情況定義為“無語音操作意圖”。語音操作意圖判斷部14對(duì)與狀態(tài)獲取部18所獲取到的導(dǎo)航系統(tǒng)的動(dòng)作狀態(tài)相一致的定義進(jìn)行檢索,根據(jù)該定義來判斷是“有語音操作意圖”還是“無語音操作意圖”。
另外,例如,由于用戶在手動(dòng)操作中切換至語音操作的可能性較低,因此,也可以將導(dǎo)航系統(tǒng)的動(dòng)作狀態(tài)為手動(dòng)操作中的情況定義為“無語音操作意圖”。具體而言,狀態(tài)獲取部18經(jīng)由導(dǎo)航部1獲取用戶對(duì)指示輸入部2進(jìn)行操作的操作狀態(tài),在語音操作意圖判斷部14基于該操作狀態(tài)而判斷為用戶正在對(duì)顯示中的列表等進(jìn)行手動(dòng)操作的情況下,根據(jù)手動(dòng)操作中的定義來判斷為“無語音操作意圖”。
(5)基于發(fā)聲中或發(fā)聲前的視線來進(jìn)行的有無語音操作意圖的判斷
(5)的情況下,語音識(shí)別系統(tǒng)10包括視線檢測(cè)部19。無需上述(1)的語音分析部17和(4)的狀態(tài)獲取部18。
視線檢測(cè)部19對(duì)攝像頭6所獲取到的圖像信息進(jìn)行分析,檢測(cè)用戶的視線。語音操作意圖判斷部14基于視線檢測(cè)部19所檢測(cè)出的視線信息,來對(duì)用戶是否正看著例如顯示器3等導(dǎo)航系統(tǒng)的構(gòu)成要素或顯示于顯示器3的代理商等的圖像進(jìn)行判定。
此外,關(guān)于視線檢測(cè)方法和基于視線信息來判定是否正看著特定對(duì)象的方法,使用公知技術(shù)即可,因此省略說明。
另外,語音操作意圖判斷部14對(duì)語音獲取部11請(qǐng)求獲取語音區(qū)間的語音數(shù)據(jù)。然后,語音操作意圖判斷部14在從語音獲取部11獲取到了語音數(shù)據(jù)時(shí)(即,用戶正在發(fā)聲時(shí)),并且在判斷為用戶正在看著顯示器3等的情況下,判斷為“有語音操作意圖”。另一方面,語音操作意圖判斷部14在判斷為用戶未看著顯示器3等的情況下,判斷為“無語音操作意圖”。
這里,語音操作意圖判斷部14也可以在從語音獲取部11獲取到了語音數(shù)據(jù)時(shí),并且在判斷為至少在規(guī)定期間以前(例如發(fā)聲的0.5秒前)用戶正在看著顯示器3等的情況下,判斷為“有語音操作意圖”?;蛘?,語音操作意圖判斷部14還可以在用戶一邊看著顯示器3等一邊進(jìn)行發(fā)聲的情況下,判斷為“有語音操作意圖”。
語音操作意圖判斷部14利用上述(1)~(5)中的至少一種方法來判斷有無語音操作意圖即可,語音分析部17、狀態(tài)獲取部18及視線檢測(cè)部19并非必須的構(gòu)成要素。
此外,語音操作意圖判斷部14在判斷為“有語音操作意圖”的情況下,也可以將該判斷結(jié)果的可靠度(以下說明中記載為“可靠度”)與該判斷結(jié)果一起進(jìn)行輸出。
“可靠度”表示用戶實(shí)際打算對(duì)系統(tǒng)進(jìn)行語音操作從而發(fā)聲的可能性的高低。即,與語音操作意圖判斷部14使用被定義為具有較低“可靠度”的判斷項(xiàng)目來判斷為“有語音操作意圖”的情況相比,在語音操作意圖判斷部14使用被定義為具有較高“可靠度”的判斷項(xiàng)目來判斷為“有語音操作意圖”的情況下,判斷為用戶實(shí)際打算對(duì)系統(tǒng)進(jìn)行語音操作從而發(fā)聲的可能性較高。
圖2表示語音操作意圖的判斷項(xiàng)目和可靠度的一個(gè)示例。在該示例中,可靠度用“高”和“低”這兩個(gè)值來表示,“高”表示可靠度較高,“低”表示可靠度較低,但可靠度例如也可以如“高”“中”“低”那樣取多階梯的值,或者也可以如“1~100”那樣取連續(xù)的值。
圖3~圖6示出了控制狀態(tài)存儲(chǔ)部16所存儲(chǔ)的控制狀態(tài)的示例。
圖3(a)表示針對(duì)識(shí)別對(duì)象語的“有語音操作意圖”和“無語音操作意圖”的控制狀態(tài)的一個(gè)示例。
對(duì)于識(shí)別對(duì)象語“便利店”,作為“有語音操作意圖”的情況的控制狀態(tài),定義有“對(duì)本車周邊的便利店進(jìn)行檢索并顯示檢索結(jié)果的列表”。另一方面,作為“無語音操作意圖”的情況的控制狀態(tài),定義有“什么也不做”。
對(duì)于識(shí)別對(duì)象語“Mr.Child(小先生)”,作為“有語音操作意圖”的情況的控制狀態(tài),定義有“顯示Mr.Child的專輯列表”。另一方面,作為“無語音操作意圖”的情況的控制狀態(tài),定義有“什么也不做”。該“Mr.Child”設(shè)想為藝術(shù)家名稱。
此外,這里示出了功能的執(zhí)行及畫面顯示的示例,但也可以設(shè)為包含語音輸出。例如,也可以進(jìn)行內(nèi)容為執(zhí)行檢索以及內(nèi)容為列表顯示檢索結(jié)果等的語音輸出。
另外,圖3(b)表示語音識(shí)別失敗時(shí)的控制狀態(tài),作為“有語音操作意圖”的情況的控制狀態(tài),定義有通知識(shí)別失敗這一內(nèi)容的動(dòng)作,例如“輸出‘無法識(shí)別。請(qǐng)?jiān)僖淮伟l(fā)聲’的語音”。另一方面,作為“無語音操作意圖”的情況的控制狀態(tài),定義有“什么也不做”。
此外,這里僅示出了語音輸出的示例,但也可以包含畫面顯示。例如,在“有語音操作意圖”的情況下,可以將內(nèi)容為識(shí)別失敗的字幕顯示于畫面。
圖4(a)表示針對(duì)識(shí)別對(duì)象語的“有語音操作意圖”和“無語音操作意圖”的控制狀態(tài)的另一個(gè)示例。在圖3的示例中,將“無語音操作意圖”的情況下的控制狀態(tài)設(shè)為“什么也不做”,從而與“有語音操作意圖”的情況的控制狀態(tài)相比,不會(huì)將用戶的意識(shí)向?qū)Ш较到y(tǒng)引導(dǎo)。與之相對(duì),在圖4的示例中,即使是“無語音操作意圖”的情況,也仍進(jìn)行某些動(dòng)作,但將因該動(dòng)作而使用戶意識(shí)到導(dǎo)航系統(tǒng)的程度設(shè)得比“有語音操作意圖”時(shí)要小。
例如,在圖4(a)中,對(duì)于識(shí)別對(duì)象語“便利店”,“無語音操作意圖”的情況的控制狀態(tài)被定義為“生成用于執(zhí)行本車周邊的便利店檢索的按鈕并進(jìn)行顯示”,而非“什么也不做”。
這里,圖7示出基于控制狀態(tài)來執(zhí)行處理的示例。圖7(a)是圖4(a)的“對(duì)本車周邊的便利店進(jìn)行檢索并顯示檢索結(jié)果的列表”的情況下的顯示器3的畫面顯示例。在畫面上放大顯示有檢索結(jié)果的列表,使用戶容易意識(shí)到導(dǎo)航系統(tǒng)。另一方面,圖7(b)是圖4(b)的“生成用于執(zhí)行本車周邊的便利店檢索的按鈕并進(jìn)行顯示”的情況下的顯示器3的畫面顯示例。在地圖畫面上僅顯示“便利店”這一按鈕,使用戶意識(shí)到導(dǎo)航系統(tǒng)的程度比圖7(a)的情況要小。
此外,在對(duì)執(zhí)行檢索等內(nèi)容進(jìn)行語音輸出的情況下,可以對(duì)控制狀態(tài)進(jìn)行定義,使得與“有語音操作意圖”的情況相比,“無語音操作意圖”的情況下音量變小。
另外,在圖4(b)中,作為語音識(shí)別失敗時(shí)的控制狀態(tài),在“有語音操作意圖”的情況下,定義為“輸出‘無法識(shí)別。請(qǐng)?jiān)僖淮伟l(fā)聲’的語音”,在“無語音操作意圖”的情況下,定義為“輸出通知聲”。
由此,通過在“無語音操作意圖”的情況下僅輸出“嘭”等通知聲,從而與“有語音操作意圖”的情況相比,不會(huì)讓用戶意識(shí)到導(dǎo)航系統(tǒng)。
另外,如圖4(c)所示,作為語音識(shí)別失敗時(shí)的控制狀態(tài),在“有語音操作意圖”的情況下,定義為“以音量8輸出‘無法識(shí)別。請(qǐng)?jiān)僖淮伟l(fā)聲’的語音”,在“無語音操作意圖”的情況下,定義為“以音量3輸出‘無法識(shí)別。請(qǐng)?jiān)僖淮伟l(fā)聲’的語音”。
由此,通過在“無語音操作意圖”的情況下減小向用戶進(jìn)行通知的語音的音量,從而與“有語音操作意圖”的情況相比,不會(huì)讓用戶意識(shí)到導(dǎo)航系統(tǒng)。
接著,利用圖5來對(duì)根據(jù)“有語音操作意圖”的可靠度來定義不同控制狀態(tài)的示例進(jìn)行說明。
圖5(a)表示針對(duì)識(shí)別對(duì)象語的“有語音操作意圖”的可靠度“高”、“無語音操作意圖”的可靠度“低”、以及“無語音操作意圖”的控制狀態(tài)的一個(gè)示例。
例如,對(duì)于識(shí)別對(duì)象語“便利店”,作為“有語音操作意圖”且可靠度“高”的情況的控制狀態(tài),定義有“對(duì)本車周邊的便利店進(jìn)行檢索并顯示距離本車位置最近的便利店的信息”。另一方面,作為“有語音操作意圖”且可靠度“低”的情況的控制狀態(tài),定義有“對(duì)本車周邊的便利店進(jìn)行檢索并顯示檢索結(jié)果的列表”。而且,作為“無語音操作意圖”的情況的控制狀態(tài),定義有“生成用于執(zhí)行本車周邊的便利店檢索的按鈕”。
另外,在圖5(b)中,作為語音識(shí)別失敗時(shí)的控制狀態(tài),在“有語音操作意圖”且可靠度“高”的情況下,定義為“輸出‘無法識(shí)別。請(qǐng)?jiān)僖淮伟l(fā)聲’的語音”,在“有語音操作意圖”且可靠度“低”的情況下,定義為“僅輸出通知聲”,在“無語音操作意圖”的情況下,定義為“什么也不做”。
此外,也可以在可靠度較高的情況下增大音量,在可靠度較低的情況下減小音量。
此外,還可以根據(jù)“有語音操作意圖”的可靠度為預(yù)定基準(zhǔn)值以下(或者小于基準(zhǔn)值)還是大于該基準(zhǔn)值(或者為基準(zhǔn)值以上),來對(duì)控制狀態(tài)進(jìn)行定義。即,即使是“有語音操作意圖”,在可靠度為預(yù)定基準(zhǔn)值以下的情況下,也可以判斷為“無語音操作意圖”。
圖6(a)(b)示出了一個(gè)示例。在圖6(a)的示例中,在針對(duì)識(shí)別對(duì)象語的“有語音操作意圖”的可靠度為“低”的情況下,與“無語音操作意圖”的情況同樣地定義控制狀態(tài)。在圖6(b)的示例中,在語音識(shí)別失敗且“有語音操作意圖”的可靠度為“低”的情況下,與“無語音操作意圖”的情況同樣地定義控制狀態(tài)。
接著,利用圖8所示的流程圖,來對(duì)實(shí)施方式1的語音識(shí)別系統(tǒng)10的動(dòng)作進(jìn)行說明。
首先,語音獲取部11導(dǎo)入由麥克風(fēng)5所獲取到的用戶發(fā)聲、即所輸入的語音,利用例如PCM來進(jìn)行A/D轉(zhuǎn)換,從而對(duì)語音區(qū)間進(jìn)行檢測(cè)(步驟ST01)。
接著,語音識(shí)別部12對(duì)語音獲取部11所檢測(cè)出的語音區(qū)間的語音數(shù)據(jù)進(jìn)行識(shí)別,輸出識(shí)別結(jié)果(步驟ST02)。
接下來,語音操作意圖判斷部14獲取用于判斷有無語音操作意圖的信息(步驟ST03),對(duì)有無語音操作意圖進(jìn)行判斷,輸出判斷結(jié)果(步驟ST04)。
然后,控制狀態(tài)變更部15參照控制狀態(tài)存儲(chǔ)部16,基于語音識(shí)別部12所輸出的識(shí)別結(jié)果和語音操作意圖判斷部14所輸出的判斷結(jié)果來決定控制狀態(tài),并向?qū)Ш讲?輸出該所決定的控制狀態(tài)(步驟ST05)。
最后,導(dǎo)航部1基于控制狀態(tài)變更部15所指示的控制狀態(tài)來執(zhí)行處理(步驟ST06)。
下面,利用具體例來進(jìn)行說明。
首先,對(duì)用戶發(fā)聲的語音識(shí)別成功的情況的示例進(jìn)行說明。
這里,設(shè)用戶A和用戶B同乘。另外,語音分析部17僅對(duì)用戶發(fā)聲的清晰度進(jìn)行計(jì)算,控制狀態(tài)存儲(chǔ)部16中保存有圖4(a)(b)所示的內(nèi)容。此外,清晰度的范圍為“0~100”,將預(yù)定閾值設(shè)為“50”。
設(shè)用戶A對(duì)用戶B發(fā)出“最喜歡哪家便利店的飯團(tuán)?”的語音。利用麥克風(fēng)5來采集該發(fā)聲,語音獲取部11導(dǎo)入由麥克風(fēng)5所獲取到的語音并進(jìn)行A/D轉(zhuǎn)換(步驟ST01)。語音識(shí)別部12如上所述,始終對(duì)語音獲取部11所獲取到的語音數(shù)據(jù)進(jìn)行識(shí)別處理,因此,對(duì)由語音獲取部11進(jìn)行數(shù)字化后的用戶A的發(fā)聲進(jìn)行識(shí)別,并輸出“便利店”作為識(shí)別結(jié)果(步驟ST02)。
接著,語音分析部17對(duì)語音獲取部11所獲取到的語音數(shù)據(jù)進(jìn)行分析,計(jì)算用戶A的發(fā)聲的清晰度,語音操作意圖判斷部14獲取該清晰度(步驟ST03)。
這里,設(shè)所計(jì)算出的清晰度為“40”。
由于語音分析部17所計(jì)算出的清晰度小于預(yù)定閾值“50”,因此,語音操作意圖判斷部14確定用戶并非打算對(duì)系統(tǒng)進(jìn)行語音操作而發(fā)聲,從而判斷為“無語音操作意圖”(步驟ST04)。
然后,控制狀態(tài)變更部15參照控制狀態(tài)存儲(chǔ)部16的圖4(a)的內(nèi)容,來決定識(shí)別對(duì)象語為“便利店”且“無語音操作意圖”的情況下的控制狀態(tài)。在本示例中,決定為“生成用于執(zhí)行本車周邊的便利店檢索的按鈕并進(jìn)行顯示”(步驟ST05)。
最后,導(dǎo)航部1基于控制狀態(tài)變更部15所決定的控制狀態(tài),來執(zhí)行處理。其結(jié)果是,如圖7(b)所示,將用于執(zhí)行本車周邊的便利店檢索的按鈕顯示于顯示器3(步驟ST06)。
另一方面,設(shè)為下述情況:由于車內(nèi)噪聲較大等狀況,在步驟ST02中語音識(shí)別部12所輸出的識(shí)別結(jié)果所包含的識(shí)別得分為規(guī)定閾值以下,或者語音識(shí)別處理失敗。
在這種情況下,在步驟ST05中,控制狀態(tài)變更部15參照控制狀態(tài)存儲(chǔ)部16的圖4(b)的內(nèi)容,來決定“識(shí)別結(jié)果失敗”且“無語音操作意圖”的情況下的控制狀態(tài)。在該示例中,決定為“輸出通知聲”。
其結(jié)果是,從揚(yáng)聲器4輸出例如像“嘭”這樣的通知聲(步驟ST06)。
接著,說明用戶A向?qū)Ш较到y(tǒng)發(fā)出“想去便利店”的語音的情況下的動(dòng)作。
圖8的步驟ST01、步驟ST02的處理與上述情況相同,因此省略說明。設(shè)語音分析部17計(jì)算出清晰度為“70”,語音操作意圖判斷部14獲取該清晰度(步驟ST03)。
由于語音分析部17所計(jì)算出的清晰度“70”為預(yù)定閾值“50”以上,因此,語音操作意圖判斷部14確定用戶打算對(duì)系統(tǒng)進(jìn)行語音操作而發(fā)聲,從而判斷為“有語音操作意圖”(步驟ST04)。
然后,控制狀態(tài)變更部15參照控制狀態(tài)存儲(chǔ)部16的圖4(a)的內(nèi)容,來決定識(shí)別對(duì)象語為“便利店”且“有語音操作意圖”的情況下的控制狀態(tài)。在本示例中,決定為“對(duì)本車周邊的便利店進(jìn)行檢索并顯示檢索結(jié)果的列表”(步驟ST05)。
最后,導(dǎo)航部1基于控制狀態(tài)變更部15所決定的控制狀態(tài),來執(zhí)行處理。其結(jié)果是,如圖7(a)所示,將執(zhí)行了本車周邊的便利店檢索而得的結(jié)果的列表顯示于顯示器3(步驟ST06)。
另一方面,設(shè)為下述情況:車內(nèi)噪聲較大,在步驟ST02中語音識(shí)別部12所輸出的識(shí)別結(jié)果所包含的識(shí)別得分為規(guī)定閾值以下,或者語音識(shí)別處理失敗。
在這種情況下,在步驟ST05中,控制狀態(tài)變更部15參照控制狀態(tài)存儲(chǔ)部16的圖4(b)的內(nèi)容,來決定“識(shí)別結(jié)果失敗”且“有語音操作意圖”的情況下的控制狀態(tài)。在本示例中,決定為“輸出‘無法識(shí)別。請(qǐng)?jiān)僖淮伟l(fā)聲’的語音”。
其結(jié)果是,從揚(yáng)聲器4輸出“無法識(shí)別。請(qǐng)?jiān)僖淮伟l(fā)聲”的語音(步驟ST06)。
如上所述,根據(jù)實(shí)施方式1,語音識(shí)別系統(tǒng)10始終對(duì)用戶所發(fā)出的語音進(jìn)行識(shí)別,并基于識(shí)別結(jié)果來對(duì)導(dǎo)航系統(tǒng)進(jìn)行控制,在該語音識(shí)別系統(tǒng)10中,構(gòu)成為包括:語音操作意圖判斷部14,該語音操作意圖判斷部14對(duì)所識(shí)別出的發(fā)聲判斷用戶是否具有操作導(dǎo)航系統(tǒng)的意圖;以及控制狀態(tài)變更部15,該控制狀態(tài)變更部15在語音操作意圖判斷部14中判斷為沒有操作意圖的情況下,與判斷為有操作意圖的情況相比,將導(dǎo)航系統(tǒng)的控制的狀態(tài)向不讓用戶意識(shí)到的方向進(jìn)行變更。由于與判斷為用戶打算進(jìn)行語音操作而發(fā)聲的情況相比,將判斷為是不打算進(jìn)行語音操作的發(fā)聲的情況下的識(shí)別結(jié)果所對(duì)應(yīng)的控制狀態(tài)變更為不讓用戶意識(shí)到的狀態(tài),因此,能減輕用戶的不快感和郁悶感。
另外,根據(jù)實(shí)施方式1,語音操作意圖判斷部14在判斷為具有操作的意圖的情況下,對(duì)表示該操作的意圖達(dá)到何種程度的可靠度進(jìn)行判斷,控制狀態(tài)變更部15在語音操作意圖判斷部14中判斷出的可靠度較低的情況下,與可靠度較高的情況相比將導(dǎo)航系統(tǒng)的控制狀態(tài)向不讓用戶意識(shí)到的方向進(jìn)行變更。因此,能根據(jù)用戶實(shí)際打算進(jìn)行語音操作而發(fā)聲的可能性的高低來變更控制狀態(tài),能進(jìn)一步減輕用戶的不快感和郁悶感。另外,能對(duì)用戶彼此的自然的對(duì)話進(jìn)行識(shí)別,從而在不妨礙用戶彼此的對(duì)話的情況下對(duì)用戶可能希望的動(dòng)作進(jìn)行提示。
另外,根據(jù)實(shí)施方式1,控制狀態(tài)變更部15在用戶所發(fā)出的語音的識(shí)別失敗的情況下,對(duì)導(dǎo)航系統(tǒng)進(jìn)行控制,使其向用戶通知識(shí)別失敗,并在關(guān)于發(fā)聲的操作意圖的可靠度較低的情況下,與可靠度較高的情況相比,將該通知的狀態(tài)向不讓用戶意識(shí)到的方向進(jìn)行變更。
另外,在利用語音來通知識(shí)別失敗的情況下,控制狀態(tài)變更部15在關(guān)于發(fā)聲的操作意圖的可靠度較低的情況下,與可靠度較高的情況相比,減小該語音的音量。
因此,能減輕將識(shí)別失敗通知給用戶時(shí)的不快感和郁悶感。
另外,根據(jù)實(shí)施方式1,語音操作意圖判斷部14在發(fā)聲來自多個(gè)方向的情況下,判斷為沒有操作的意圖。因此,能在不會(huì)妨礙用戶彼此的對(duì)話的情況下減輕不快感和郁悶感。
另外,根據(jù)實(shí)施方式1,控制狀態(tài)變更部15在用戶所發(fā)出的語音的識(shí)別失敗的情況下,對(duì)被控制裝置進(jìn)行控制,使其向用戶通知識(shí)別失敗,并且在關(guān)于發(fā)聲判斷為無操作意圖的情況下,與判斷為有操作意圖的情況相比,將該通知的狀態(tài)向不讓用戶意識(shí)到的方向進(jìn)行變更。因此,能減輕將識(shí)別失敗通知給用戶時(shí)的不快感和郁悶感。
此外,本發(fā)明可以在該發(fā)明的范圍內(nèi)對(duì)實(shí)施方式的任意構(gòu)成要素進(jìn)行變形,或省略實(shí)施方式的任意的構(gòu)成要素。
工業(yè)上的實(shí)用性
本發(fā)明所涉及的語音識(shí)別系統(tǒng)根據(jù)用戶是否是打算進(jìn)行語音操作而進(jìn)行了發(fā)聲,來對(duì)與識(shí)別結(jié)果相對(duì)應(yīng)的控制狀態(tài)進(jìn)行切換,因此,適用于始終對(duì)用戶的發(fā)聲進(jìn)行識(shí)別的語音識(shí)別系統(tǒng)等。
標(biāo)號(hào)說明
1 導(dǎo)航部
2 指示輸入部
3 顯示器
4 揚(yáng)聲器
5 麥克風(fēng)
6 攝像頭
10 語音識(shí)別系統(tǒng)
11 語音獲取部
12 語音識(shí)別部
13 語音識(shí)別辭典
14 語音操作意圖判斷部
15 控制狀態(tài)變更部
16 控制狀態(tài)存儲(chǔ)部
17 語音分析部
18 狀態(tài)獲取部
19 視線檢測(cè)部