語音識(shí)別系統(tǒng)的制作方法

文檔序號(hào)：12513519閱讀：235來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

本發(fā)明涉及對(duì)用戶的發(fā)聲進(jìn)行識(shí)別的語音識(shí)別系統(tǒng)。

背景技術(shù)：

以往，已知有始終對(duì)用戶的發(fā)聲進(jìn)行識(shí)別并執(zhí)行與識(shí)別結(jié)果相對(duì)應(yīng)的處理的語音識(shí)別系統(tǒng)(例如參照專利文獻(xiàn)1)。這種語音識(shí)別系統(tǒng)在不對(duì)下述內(nèi)容，即：是用戶打算對(duì)系統(tǒng)進(jìn)行語音操作而進(jìn)行了發(fā)聲，還是僅僅是用戶彼此的對(duì)話中的發(fā)聲進(jìn)行判斷的情況下進(jìn)行識(shí)別處理，并執(zhí)行與識(shí)別結(jié)果相對(duì)應(yīng)的處理。

例如，在用戶彼此進(jìn)行了“超市和便利店哪個(gè)好？”“還是便利店好吧”這樣的對(duì)話的情況下，用戶并非打算進(jìn)行語音操作而進(jìn)行發(fā)聲，但由于語音識(shí)別系統(tǒng)始終對(duì)用戶的發(fā)聲進(jìn)行識(shí)別，因此，識(shí)別出了“超市”和“便利店”這樣的單詞，并執(zhí)行與這些識(shí)別結(jié)果相對(duì)應(yīng)的處理。

另外，語音識(shí)別系統(tǒng)在用戶發(fā)聲的識(shí)別失敗的情況下，需要對(duì)識(shí)別失敗的情況和識(shí)別失敗的原因等進(jìn)行語音輸出并通知給用戶。因此，即使在要對(duì)如上所述的用戶彼此的對(duì)話進(jìn)行識(shí)別卻失敗了的情況下，也仍輸出內(nèi)容為識(shí)別失敗的語音。

現(xiàn)有技術(shù)文獻(xiàn)

專利文獻(xiàn)

專利文獻(xiàn)1：日本專利特開2008-14818號(hào)公報(bào)

技術(shù)實(shí)現(xiàn)要素：

發(fā)明所要解決的技術(shù)問題

由于現(xiàn)有的語音識(shí)別系統(tǒng)采用如上所述的結(jié)構(gòu)，因此，即使用戶不打算進(jìn)行語音操作而進(jìn)行了發(fā)聲，但還是自作主張地執(zhí)行了與識(shí)別結(jié)果相對(duì)應(yīng)的處理，從而顯示出與正在顯示的畫面大不相同的畫面，或者輸出了內(nèi)容為識(shí)別失敗的語音。這對(duì)用戶來說會(huì)感到郁悶并使不快感增加。

另一方面，在用戶打算進(jìn)行語音操作而進(jìn)行了發(fā)聲的情況下，語音識(shí)別系統(tǒng)必須執(zhí)行與識(shí)別結(jié)果相對(duì)應(yīng)的處理，在識(shí)別失敗的情況下需要將該內(nèi)容通知給用戶。

本發(fā)明是為了解決上述的問題而完成的，其目的在于，在始終對(duì)用戶的發(fā)聲進(jìn)行識(shí)別的語音識(shí)別系統(tǒng)中，使用戶的不快感降低。

用于解決技術(shù)問題的技術(shù)手段

本發(fā)明所涉及的語音識(shí)別系統(tǒng)是始終對(duì)用戶所發(fā)出的語音進(jìn)行識(shí)別，并基于識(shí)別結(jié)果來對(duì)被控制裝置進(jìn)行控制的語音識(shí)別系統(tǒng)，該語音識(shí)別系統(tǒng)包括：語音操作意圖判斷部，該語音操作意圖判斷部針對(duì)所識(shí)別出的發(fā)聲，判斷用戶有無操作被控制裝置的意圖；以及控制狀態(tài)變更部，該控制狀態(tài)變更部在語音操作意圖判斷部中判斷為無操作意圖的情況下，與判斷為有操作意圖的情況相比，將被控制裝置的控制的狀態(tài)向不讓用戶意識(shí)到的方向進(jìn)行變更。

發(fā)明效果

根據(jù)本發(fā)明，在判斷為用戶無操作意圖的情況下，與判斷為有操作意圖的情況相比，使被控制裝置的控制的狀態(tài)向不讓用戶意識(shí)到的方向進(jìn)行變更，因此，能降低用戶的不快感。

附圖說明

圖1是表示應(yīng)用了本發(fā)明實(shí)施方式1所涉及的語音識(shí)別系統(tǒng)的導(dǎo)航系統(tǒng)的一個(gè)示例的框圖。

圖2是表示語音操作意圖的判斷項(xiàng)目和可靠度的一個(gè)示例的圖。

圖3是表示控制狀態(tài)的示例的圖。

圖4是表示控制狀態(tài)的其它示例的圖。

圖5是表示根據(jù)“有語音操作意圖”的可靠度定義了不同的控制狀態(tài)的示例的圖。

圖6是表示根據(jù)“有語音操作意圖”的可靠度定義了不同的控制狀態(tài)的其它示例的圖。

圖7是表示導(dǎo)航部基于控制狀態(tài)來執(zhí)行處理的示例的圖。

圖8是對(duì)實(shí)施方式1所涉及的語音識(shí)別系統(tǒng)的動(dòng)作進(jìn)行說明的流程圖。

具體實(shí)施方式

下面，為了更詳細(xì)地說明本發(fā)明，根據(jù)附圖對(duì)本發(fā)明的實(shí)施方式進(jìn)行說明。

此外，在以下的實(shí)施方式中，列舉將本發(fā)明所涉及的語音識(shí)別系統(tǒng)運(yùn)用于車輛等移動(dòng)體用的導(dǎo)航系統(tǒng)(被控制裝置)的情況作為示例來進(jìn)行說明，但只要是具有語音操作功能的系統(tǒng)即可，可以適用于任何系統(tǒng)。

實(shí)施方式1.

圖1是表示應(yīng)用了本發(fā)明實(shí)施方式1所涉及的語音識(shí)別系統(tǒng)10的導(dǎo)航系統(tǒng)的一個(gè)示例的框圖。該導(dǎo)航系統(tǒng)包括導(dǎo)航部1、指示輸入部2、顯示器3、揚(yáng)聲器4、麥克風(fēng)5、攝像頭6、語音獲取部11、語音識(shí)別部12、語音識(shí)別辭典13、語音操作意圖判斷部14、控制狀態(tài)變更部15、控制狀態(tài)存儲(chǔ)部16、語音分析部17、狀態(tài)獲取部18及視線檢測(cè)部19。此外，導(dǎo)航系統(tǒng)的構(gòu)成要素也可以分散于網(wǎng)絡(luò)上的服務(wù)器、智能手機(jī)等移動(dòng)終端、車載設(shè)備。

語音獲取部11、語音識(shí)別部12、語音識(shí)別辭典13、語音操作意圖判斷部14、控制狀態(tài)變更部15、控制狀態(tài)存儲(chǔ)部16、語音分析部17、狀態(tài)獲取部18及視線檢測(cè)部19構(gòu)成語音識(shí)別系統(tǒng)10。

該語音識(shí)別系統(tǒng)10由未圖示的CPU(Central Processing Unit：中央處理器)等構(gòu)成，通過該CPU執(zhí)行規(guī)定的程序，從而實(shí)現(xiàn)作為語音獲取部11、語音識(shí)別部12、語音識(shí)別辭典13、語音操作意圖判斷部14、控制狀態(tài)變更部15、控制狀態(tài)存儲(chǔ)部16、語音分析部17、狀態(tài)獲取部18及視線檢測(cè)部19的功能。

導(dǎo)航部1利用從GPS(Global Positioning System：全球定位系統(tǒng))接收機(jī)等所獲取的移動(dòng)體的當(dāng)前位置信息以及存儲(chǔ)于地圖數(shù)據(jù)庫中的信息，來生成要顯示于顯示器3的繪制信息。地圖數(shù)據(jù)庫中例如包含有關(guān)于道路的“道路信息”(道路的位置等)、關(guān)于設(shè)施的“設(shè)施信息”(設(shè)施的類別、名稱、位置等)、“各種文字信息”(地名、設(shè)施名、交叉路口名、道路名等)、以及表示設(shè)施和道路編號(hào)等的“各種圖標(biāo)信息”等。

另外，導(dǎo)航部1根據(jù)來自指示輸入部2的指示或來自后述的控制狀態(tài)變更部15的指示，來進(jìn)行移動(dòng)路徑等的檢索、向顯示器3進(jìn)行的顯示指示和畫面轉(zhuǎn)換、向揚(yáng)聲器4發(fā)出的語音輸出指示等各種控制。

例如，導(dǎo)航部1使用用戶通過對(duì)指示輸入部2的操作或?qū)φZ音識(shí)別系統(tǒng)10的語音操作而設(shè)定的設(shè)施或地點(diǎn)、以及移動(dòng)體的當(dāng)前位置和地圖數(shù)據(jù)庫的信息等，來計(jì)算從當(dāng)前位置到用戶所設(shè)定的設(shè)施等為止的路徑。然后，導(dǎo)航部1生成用于沿該路徑來引導(dǎo)移動(dòng)體的指引引導(dǎo)圖和指引引導(dǎo)消息，并向顯示器3和揚(yáng)聲器4發(fā)出輸出該所生成的信息的指示。

指示輸入部2接受由用戶手動(dòng)進(jìn)行的指示的輸入。例如，可以列舉出對(duì)經(jīng)由硬件開關(guān)、組裝于顯示器3的觸摸傳感器、或者設(shè)置于把手等的遙控器或獨(dú)立的遙控器接受到的用戶的指示進(jìn)行識(shí)別的識(shí)別裝置。

顯示器3例如是LCD(Liquid Crystal Display：液晶顯示器)、HUD(Head-Up Display：抬頭顯示器)或者儀表板等，基于導(dǎo)航部1的指示在畫面上進(jìn)行繪制。

揚(yáng)聲器4基于導(dǎo)航部1的指示來輸出語音。

麥克風(fēng)5獲取(采集)用戶所發(fā)出的語音。對(duì)于麥克風(fēng)5，例如使用全向性麥克風(fēng)、將多個(gè)全向性麥克風(fēng)排列成陣列狀從而能對(duì)指向特性進(jìn)行調(diào)整的陣列麥克風(fēng)、或者僅在一個(gè)方向具有指向性從而無法對(duì)指向特性進(jìn)行調(diào)整的單向性麥克風(fēng)等。

攝像頭6對(duì)用戶進(jìn)行拍攝。攝像頭6的圖像信息被用于后述的視線檢測(cè)部19中對(duì)用戶的視線進(jìn)行檢測(cè)。

語音獲取部11導(dǎo)入由麥克風(fēng)5所獲取到的用戶發(fā)聲、即所輸入的語音，并利用例如PCM(Pulse Code Modulation：脈沖編碼調(diào)制)來進(jìn)行A/D(Analog/Digital：模/數(shù))轉(zhuǎn)換。另外，語音獲取部11根據(jù)數(shù)字化后的語音信號(hào)來對(duì)符合用戶發(fā)聲的內(nèi)容的語音區(qū)間進(jìn)行檢測(cè)。

語音識(shí)別部12提取出由語音獲取部11所檢測(cè)出的語音區(qū)間的語音數(shù)據(jù)的特征量，基于該特征量，利用語音識(shí)別辭典13來進(jìn)行識(shí)別處理，并輸出識(shí)別結(jié)果。作為識(shí)別處理，使用例如HMM(Hidden Markov Model：隱式馬爾克夫模型)法這樣的一般方法來進(jìn)行即可。

此外，識(shí)別結(jié)果中包含識(shí)別結(jié)果字符串，同時(shí)還可以包含表示匹配度的得分。

此外，在搭載于車載導(dǎo)航系統(tǒng)等的語音識(shí)別功能中，通常會(huì)對(duì)系統(tǒng)明確表示(指示)用戶發(fā)聲的開始。為此，會(huì)在觸摸面板上顯示、或在方向盤上設(shè)置指示語音識(shí)別開始的按鈕(以下，稱為“語音識(shí)別開始指示部”)。然后，在用戶按下語音識(shí)別開始指示部后，對(duì)發(fā)出的語音進(jìn)行識(shí)別。即，語音識(shí)別開始指示部輸出語音識(shí)別開始信號(hào)，若語音識(shí)別部接受該信號(hào)，則在接受該信號(hào)后從由語音獲取部獲取的語音數(shù)據(jù)中檢測(cè)出符合用戶發(fā)聲的內(nèi)容的語音區(qū)間，并進(jìn)行上述識(shí)別處理。

然而，本實(shí)施方式1中的語音識(shí)別部12即使沒有上述那樣的由用戶進(jìn)行的語音識(shí)別開始指示，也始終對(duì)用戶發(fā)聲的內(nèi)容進(jìn)行識(shí)別。即，語音識(shí)別部12即使未接收到語音識(shí)別開始信號(hào)，也始終反復(fù)進(jìn)行下述處理：提取出語音獲取部11所檢測(cè)出的語音區(qū)間的語音數(shù)據(jù)的特征量，基于該特征量，利用語音識(shí)別辭典13來進(jìn)行識(shí)別處理，并輸出語音識(shí)別結(jié)果。

語音操作意圖判斷部14判斷用戶是否具有對(duì)系統(tǒng)進(jìn)行語音操作的意圖而進(jìn)行了發(fā)聲，并輸出該判斷結(jié)果。以下，將語音操作意圖判斷部14判斷為用戶具有進(jìn)行語音操作的意圖而進(jìn)行了發(fā)聲的情況設(shè)為“有語音操作意圖”，將不是如此的情況設(shè)為“無語音操作意圖”來進(jìn)行說明。關(guān)于語音操作意圖的有無的判斷項(xiàng)目將在后文中進(jìn)行描述。

控制狀態(tài)存儲(chǔ)部16對(duì)于語音識(shí)別部12中的每個(gè)識(shí)別對(duì)象語，將在“有語音操作意圖”的情況下對(duì)導(dǎo)航部1進(jìn)行指示的控制狀態(tài)、以及在“無語音操作意圖”的情況下對(duì)導(dǎo)航部1進(jìn)行指示的控制狀態(tài)與識(shí)別對(duì)象語相對(duì)應(yīng)關(guān)聯(lián)來進(jìn)行存儲(chǔ)。

另外，控制狀態(tài)存儲(chǔ)部16在語音識(shí)別部12進(jìn)行語音識(shí)別失敗時(shí)，對(duì)“有語音操作意圖”的情況和“無語音操作意圖”的情況定義對(duì)導(dǎo)航部1進(jìn)行指示的控制狀態(tài)并進(jìn)行存儲(chǔ)。

所謂控制狀態(tài)，是指運(yùn)用本實(shí)施方式1所涉及的語音識(shí)別系統(tǒng)10的被控制裝置的各種動(dòng)作。例如，在導(dǎo)航系統(tǒng)中，控制狀態(tài)是畫面轉(zhuǎn)換、應(yīng)答語音及通知聲的輸出內(nèi)容、系統(tǒng)所具有的目的地設(shè)定等各功能的執(zhí)行等各種動(dòng)作。

“無語音操作意圖”的情況的控制狀態(tài)被定義為，與“有語音操作意圖”的情況的控制狀態(tài)相比，不會(huì)對(duì)用戶造成打擾，即，用戶意識(shí)到導(dǎo)航系統(tǒng)的程度變小。

在“無語音操作意圖”的情況下，與“有語音操作意圖”的情況相比，例如采用減小語音輸出的音量、或減少語音輸出內(nèi)容或顯示內(nèi)容的信息量、或停止語音輸出等不讓用戶意識(shí)到導(dǎo)航系統(tǒng)那樣的控制狀態(tài)。

關(guān)于控制狀態(tài)的具體例，將在后文中描述。

控制狀態(tài)變更部15參照控制狀態(tài)存儲(chǔ)部16，基于語音識(shí)別部12所輸出的識(shí)別結(jié)果和語音操作意圖判斷部14所輸出的判斷結(jié)果來決定控制狀態(tài)，并向?qū)Ш讲?輸出該所決定的控制狀態(tài)。

接著，對(duì)語音操作意圖判斷部14所進(jìn)行的有無語音操作意圖判斷的判斷項(xiàng)目、以及獲取或生成該判斷時(shí)所使用的信息的構(gòu)成要素進(jìn)行說明。

(1)基于用戶所發(fā)出的語音的音量、音高、清晰度、用戶的發(fā)聲速度及語音的發(fā)聲源的方向中的至少一個(gè)來進(jìn)行的有無語音操作意圖的判斷

(1)的情況下，語音識(shí)別系統(tǒng)10包括語音分析部17。

語音分析部17對(duì)由語音獲取部11所輸出的語音數(shù)據(jù)進(jìn)行分析，對(duì)用戶所發(fā)出的語音的音量、音高、清晰度、用戶的發(fā)聲速度、語音的發(fā)聲源的方向中的至少一個(gè)進(jìn)行計(jì)算。

此外，關(guān)于音量、音高、清晰度、用戶的發(fā)聲速度和發(fā)聲源的方向的計(jì)算方法，使用公知技術(shù)即可，因此省略說明。

這里，首先以清晰度為例來進(jìn)行說明。

語音操作意圖判斷部14獲取由語音分析部17所計(jì)算出的清晰度，對(duì)該清晰度的大小是否為預(yù)定閾值以上(或者比閾值要大)進(jìn)行判定。在該清晰度為預(yù)定閾值以上的情況下，語音操作意圖判斷部14判斷為“有語音操作意圖”。另一方面，在該清晰度小于預(yù)定閾值的情況下，語音操作意圖判斷部14判斷為“無語音操作意圖”。

或者，語音操作意圖判斷部14對(duì)從語音分析部17所獲取到的清晰度是否為過去多次獲取到的清晰度的平均值以上(或者，比平均值要大)進(jìn)行判定。在該清晰度為該平均值以上的情況下，語音操作意圖判斷部14判斷為“有語音操作意圖”。另一方面，在該清晰度小于該平均值的情況下，語音操作意圖判斷部14判斷為“無語音操作意圖”。

語音操作意圖判斷部14通過與使用清晰度的有無語音操作意圖的判斷相同的方法，使用用戶所發(fā)出的語音的音量或音高，來對(duì)有無語音操作意圖進(jìn)行判斷。

例如，在使用發(fā)聲語音的音量的情況下，語音操作意圖判斷部14在從語音分析部17所獲取到的發(fā)聲語音的音量為過去多次發(fā)聲語音的音量的平均值以上(或者比平均值要大)的情況下，判斷為“有語音操作意圖”。

例如，在使用發(fā)聲語音的音高的情況下，語音操作意圖判斷部14在從語音分析部17所獲取到的發(fā)聲語音的音高為過去多次發(fā)聲語音的音高的平均值以上(或者比平均值要大)的情況下，判斷為“有語音操作意圖”。

接著，以發(fā)聲速度為例來進(jìn)行說明。

語音操作意圖判斷部14獲取由語音分析部17所計(jì)算出的發(fā)聲速度，對(duì)該發(fā)聲速度是否小于預(yù)定閾值(或者為平均值以下)進(jìn)行判定。在該發(fā)聲速度小于預(yù)定閾值的情況下，語音操作意圖判斷部14判斷為“有語音操作意圖”。另一方面，在該發(fā)聲速度為預(yù)定閾值以上的情況下，語音操作意圖判斷部14判斷為“無語音操作意圖”。

或者，語音操作意圖判斷部14在從語音分析部17所獲取到的發(fā)聲速度小于過去多次獲取到的發(fā)聲速度的平均值(或者為閾值以下)的情況下，判斷為“有語音操作意圖”，在并非如此的情況下，判斷為“無語音操作意圖”。

此外，在將清晰度等與過去的平均值相比較來對(duì)有無語音操作意圖進(jìn)行判斷時(shí)，可以考慮到利用語音分析部17計(jì)算清晰度等時(shí)的誤差，從而在平均值上加上(或減去)預(yù)先設(shè)定的值。將對(duì)平均值加上(或減去)的值設(shè)為與誤差間具有有意差的值。

接著，以語音的發(fā)聲源的方向?yàn)槔齺磉M(jìn)行說明。

語音操作意圖判斷部14獲取由語音分析部17所計(jì)算出的語音的發(fā)聲源的方向。當(dāng)在多個(gè)方向上存在發(fā)聲源的情況下，語音操作意圖判斷部14確定用戶正在與其它用戶進(jìn)行對(duì)話，從而判斷為“無語音操作意圖”。另一方面，在發(fā)聲源為一個(gè)的情況下，語音操作意圖判斷部14判斷為“有語音操作意圖”。

(2)基于識(shí)別結(jié)果的種類來進(jìn)行的有無語音操作意圖的判斷

(2)的情況下，無需上述(1)的語音分析部17。

語音操作意圖判斷部14獲取由語音識(shí)別部12所輸出的識(shí)別結(jié)果。然后，語音操作意圖判斷部14判定該識(shí)別結(jié)果是否為用于對(duì)運(yùn)用了本語音識(shí)別系統(tǒng)10的被控制裝置(本實(shí)施方式1中為導(dǎo)航系統(tǒng))進(jìn)行操作的命令，在是該命令的情況下，判斷為“有語音操作意圖”。在并非如此的情況下，判斷為“無語音操作意圖”。

(3)基于識(shí)別履歷來進(jìn)行的有無語音操作意圖的判斷

(3)的情況下，無需上述(1)的語音分析部17。

語音操作意圖判斷部14獲取由語音識(shí)別部12所輸出的識(shí)別結(jié)果。

另外，語音操作意圖判斷部14存儲(chǔ)從語音識(shí)別部12所獲取到的識(shí)別結(jié)果并存儲(chǔ)至少一個(gè)以上來作為識(shí)別履歷。

然后，語音操作意圖判斷部14基于識(shí)別履歷，在識(shí)別結(jié)果所包含的識(shí)別得分變?yōu)轭A(yù)定閾值以下的情況(即，語音識(shí)別部12所進(jìn)行的識(shí)別處理雖然成功但匹配度較低的情況)、或者語音識(shí)別部12所進(jìn)行的識(shí)別處理失敗的情況連續(xù)發(fā)生兩次以上時(shí)，判斷為“有語音操作意圖”。語音操作意圖判斷部14可以將識(shí)別得分為預(yù)定閾值以下的情況與識(shí)別處理失敗的情況相區(qū)別來進(jìn)行計(jì)數(shù)，也可以不加區(qū)別地進(jìn)行計(jì)數(shù)。

此外，語音操作意圖判斷部14在連續(xù)兩次以上出現(xiàn)識(shí)別結(jié)果所包含的識(shí)別得分為預(yù)定閾值以下且各識(shí)別結(jié)果字符串相同的情況下，也可以判斷為“有語音操作意圖”。

在車內(nèi)噪聲較大等狀況下，在用戶所發(fā)出的語音的識(shí)別得分較低或識(shí)別失敗的情況下，導(dǎo)航部1不進(jìn)行用戶打算進(jìn)行的動(dòng)作，因此，若用戶有操作意圖，則再一次重復(fù)發(fā)聲的可能性較高。因此，在(3)中，若用戶重復(fù)發(fā)聲，則視為有語音操作的意圖，若僅為1次的發(fā)聲，則視為無語音操作的意圖。例如，當(dāng)用戶連續(xù)兩次發(fā)出“便利店”的語音，且語音識(shí)別部12連續(xù)兩次識(shí)別處理失敗時(shí)，語音操作意圖判斷部14判斷為“有語音操作意圖”，因此，在用戶的第三次發(fā)聲的識(shí)別處理成功的情況下，該第三次發(fā)聲的識(shí)別結(jié)果為“有語音操作意圖”。

此外，在用戶發(fā)出“便利店”的語音并且其識(shí)別得分為閾值以下的情況下，在第二次發(fā)聲時(shí)存在改為“便利商店”等說法的可能性，因此，無論各發(fā)聲的識(shí)別結(jié)果字符串相同還是不同都沒問題。

(4)基于運(yùn)用語音識(shí)別系統(tǒng)10的系統(tǒng)等的動(dòng)作狀態(tài)來進(jìn)行的有無語音操作意圖的判斷

(4)的情況下，語音識(shí)別系統(tǒng)10包括狀態(tài)獲取部18。無需上述(1)的語音分析部17。

狀態(tài)獲取部18從導(dǎo)航部1獲取導(dǎo)航系統(tǒng)的動(dòng)作狀態(tài)。

語音操作意圖判斷部14預(yù)先定義下述推測(cè)為用戶想要操作導(dǎo)航系統(tǒng)、或者處于操作中的系統(tǒng)的動(dòng)作狀態(tài)，例如，用戶進(jìn)行的規(guī)定的操作后的結(jié)果顯示中(例如，設(shè)施檢索結(jié)果的列表顯示中等)以及用戶進(jìn)行的按下按鍵等操作中等。

語音操作意圖判斷部14在狀態(tài)獲取部18所獲取到的導(dǎo)航系統(tǒng)的動(dòng)作狀態(tài)與預(yù)先定義的動(dòng)作狀態(tài)相一致的情況下，判斷為“有語音操作意圖”，在與預(yù)先定義的動(dòng)作狀態(tài)不一致的情況下，判斷為“無語音操作意圖”。

例如，在設(shè)施檢索結(jié)果列表的顯示中，用戶進(jìn)行從列表中選擇一個(gè)設(shè)施等打算對(duì)導(dǎo)航系統(tǒng)進(jìn)行操作的動(dòng)作的可能性較高，因此，語音操作意圖判斷部14在導(dǎo)航系統(tǒng)的動(dòng)作狀態(tài)為列表顯示中的情況下，判斷為“有語音操作意圖”。

或者，語音操作意圖判斷部14也可以對(duì)每個(gè)導(dǎo)航系統(tǒng)的動(dòng)作狀態(tài)預(yù)先定義是“有語音操作意圖”還是“無語音操作意圖”。

例如，用戶在從設(shè)施檢索結(jié)果列表等列表中選擇項(xiàng)目的情況下，進(jìn)行語音操作，在按下設(shè)施檢索條件設(shè)定等的按鈕來將分層菜單向下移動(dòng)的情況下，存在經(jīng)由指示輸入部2來進(jìn)行手動(dòng)操作的傾向。因此，將導(dǎo)航系統(tǒng)的動(dòng)作狀態(tài)為列表顯示中的情況定義為“有語音操作意圖”，將分層菜單顯示中的情況定義為“無語音操作意圖”。語音操作意圖判斷部14對(duì)與狀態(tài)獲取部18所獲取到的導(dǎo)航系統(tǒng)的動(dòng)作狀態(tài)相一致的定義進(jìn)行檢索，根據(jù)該定義來判斷是“有語音操作意圖”還是“無語音操作意圖”。

另外，例如，由于用戶在手動(dòng)操作中切換至語音操作的可能性較低，因此，也可以將導(dǎo)航系統(tǒng)的動(dòng)作狀態(tài)為手動(dòng)操作中的情況定義為“無語音操作意圖”。具體而言，狀態(tài)獲取部18經(jīng)由導(dǎo)航部1獲取用戶對(duì)指示輸入部2進(jìn)行操作的操作狀態(tài)，在語音操作意圖判斷部14基于該操作狀態(tài)而判斷為用戶正在對(duì)顯示中的列表等進(jìn)行手動(dòng)操作的情況下，根據(jù)手動(dòng)操作中的定義來判斷為“無語音操作意圖”。

(5)基于發(fā)聲中或發(fā)聲前的視線來進(jìn)行的有無語音操作意圖的判斷

(5)的情況下，語音識(shí)別系統(tǒng)10包括視線檢測(cè)部19。無需上述(1)的語音分析部17和(4)的狀態(tài)獲取部18。

視線檢測(cè)部19對(duì)攝像頭6所獲取到的圖像信息進(jìn)行分析，檢測(cè)用戶的視線。語音操作意圖判斷部14基于視線檢測(cè)部19所檢測(cè)出的視線信息，來對(duì)用戶是否正看著例如顯示器3等導(dǎo)航系統(tǒng)的構(gòu)成要素或顯示于顯示器3的代理商等的圖像進(jìn)行判定。

此外，關(guān)于視線檢測(cè)方法和基于視線信息來判定是否正看著特定對(duì)象的方法，使用公知技術(shù)即可，因此省略說明。

另外，語音操作意圖判斷部14對(duì)語音獲取部11請(qǐng)求獲取語音區(qū)間的語音數(shù)據(jù)。然后，語音操作意圖判斷部14在從語音獲取部11獲取到了語音數(shù)據(jù)時(shí)(即，用戶正在發(fā)聲時(shí))，并且在判斷為用戶正在看著顯示器3等的情況下，判斷為“有語音操作意圖”。另一方面，語音操作意圖判斷部14在判斷為用戶未看著顯示器3等的情況下，判斷為“無語音操作意圖”。

這里，語音操作意圖判斷部14也可以在從語音獲取部11獲取到了語音數(shù)據(jù)時(shí)，并且在判斷為至少在規(guī)定期間以前(例如發(fā)聲的0.5秒前)用戶正在看著顯示器3等的情況下，判斷為“有語音操作意圖”?；蛘?，語音操作意圖判斷部14還可以在用戶一邊看著顯示器3等一邊進(jìn)行發(fā)聲的情況下，判斷為“有語音操作意圖”。

語音操作意圖判斷部14利用上述(1)～(5)中的至少一種方法來判斷有無語音操作意圖即可，語音分析部17、狀態(tài)獲取部18及視線檢測(cè)部19并非必須的構(gòu)成要素。

此外，語音操作意圖判斷部14在判斷為“有語音操作意圖”的情況下，也可以將該判斷結(jié)果的可靠度(以下說明中記載為“可靠度”)與該判斷結(jié)果一起進(jìn)行輸出。

“可靠度”表示用戶實(shí)際打算對(duì)系統(tǒng)進(jìn)行語音操作從而發(fā)聲的可能性的高低。即，與語音操作意圖判斷部14使用被定義為具有較低“可靠度”的判斷項(xiàng)目來判斷為“有語音操作意圖”的情況相比，在語音操作意圖判斷部14使用被定義為具有較高“可靠度”的判斷項(xiàng)目來判斷為“有語音操作意圖”的情況下，判斷為用戶實(shí)際打算對(duì)系統(tǒng)進(jìn)行語音操作從而發(fā)聲的可能性較高。

圖2表示語音操作意圖的判斷項(xiàng)目和可靠度的一個(gè)示例。在該示例中，可靠度用“高”和“低”這兩個(gè)值來表示，“高”表示可靠度較高，“低”表示可靠度較低，但可靠度例如也可以如“高”“中”“低”那樣取多階梯的值，或者也可以如“1～100”那樣取連續(xù)的值。

圖3～圖6示出了控制狀態(tài)存儲(chǔ)部16所存儲(chǔ)的控制狀態(tài)的示例。

圖3(a)表示針對(duì)識(shí)別對(duì)象語的“有語音操作意圖”和“無語音操作意圖”的控制狀態(tài)的一個(gè)示例。

對(duì)于識(shí)別對(duì)象語“便利店”，作為“有語音操作意圖”的情況的控制狀態(tài)，定義有“對(duì)本車周邊的便利店進(jìn)行檢索并顯示檢索結(jié)果的列表”。另一方面，作為“無語音操作意圖”的情況的控制狀態(tài)，定義有“什么也不做”。

對(duì)于識(shí)別對(duì)象語“Mr.Child(小先生)”，作為“有語音操作意圖”的情況的控制狀態(tài)，定義有“顯示Mr.Child的專輯列表”。另一方面，作為“無語音操作意圖”的情況的控制狀態(tài)，定義有“什么也不做”。該“Mr.Child”設(shè)想為藝術(shù)家名稱。

此外，這里示出了功能的執(zhí)行及畫面顯示的示例，但也可以設(shè)為包含語音輸出。例如，也可以進(jìn)行內(nèi)容為執(zhí)行檢索以及內(nèi)容為列表顯示檢索結(jié)果等的語音輸出。

另外，圖3(b)表示語音識(shí)別失敗時(shí)的控制狀態(tài)，作為“有語音操作意圖”的情況的控制狀態(tài)，定義有通知識(shí)別失敗這一內(nèi)容的動(dòng)作，例如“輸出‘無法識(shí)別。請(qǐng)?jiān)僖淮伟l(fā)聲’的語音”。另一方面，作為“無語音操作意圖”的情況的控制狀態(tài)，定義有“什么也不做”。

此外，這里僅示出了語音輸出的示例，但也可以包含畫面顯示。例如，在“有語音操作意圖”的情況下，可以將內(nèi)容為識(shí)別失敗的字幕顯示于畫面。

圖4(a)表示針對(duì)識(shí)別對(duì)象語的“有語音操作意圖”和“無語音操作意圖”的控制狀態(tài)的另一個(gè)示例。在圖3的示例中，將“無語音操作意圖”的情況下的控制狀態(tài)設(shè)為“什么也不做”，從而與“有語音操作意圖”的情況的控制狀態(tài)相比，不會(huì)將用戶的意識(shí)向?qū)Ш较到y(tǒng)引導(dǎo)。與之相對(duì)，在圖4的示例中，即使是“無語音操作意圖”的情況，也仍進(jìn)行某些動(dòng)作，但將因該動(dòng)作而使用戶意識(shí)到導(dǎo)航系統(tǒng)的程度設(shè)得比“有語音操作意圖”時(shí)要小。

例如，在圖4(a)中，對(duì)于識(shí)別對(duì)象語“便利店”，“無語音操作意圖”的情況的控制狀態(tài)被定義為“生成用于執(zhí)行本車周邊的便利店檢索的按鈕并進(jìn)行顯示”，而非“什么也不做”。

這里，圖7示出基于控制狀態(tài)來執(zhí)行處理的示例。圖7(a)是圖4(a)的“對(duì)本車周邊的便利店進(jìn)行檢索并顯示檢索結(jié)果的列表”的情況下的顯示器3的畫面顯示例。在畫面上放大顯示有檢索結(jié)果的列表，使用戶容易意識(shí)到導(dǎo)航系統(tǒng)。另一方面，圖7(b)是圖4(b)的“生成用于執(zhí)行本車周邊的便利店檢索的按鈕并進(jìn)行顯示”的情況下的顯示器3的畫面顯示例。在地圖畫面上僅顯示“便利店”這一按鈕，使用戶意識(shí)到導(dǎo)航系統(tǒng)的程度比圖7(a)的情況要小。

此外，在對(duì)執(zhí)行檢索等內(nèi)容進(jìn)行語音輸出的情況下，可以對(duì)控制狀態(tài)進(jìn)行定義，使得與“有語音操作意圖”的情況相比，“無語音操作意圖”的情況下音量變小。

另外，在圖4(b)中，作為語音識(shí)別失敗時(shí)的控制狀態(tài)，在“有語音操作意圖”的情況下，定義為“輸出‘無法識(shí)別。請(qǐng)?jiān)僖淮伟l(fā)聲’的語音”，在“無語音操作意圖”的情況下，定義為“輸出通知聲”。

由此，通過在“無語音操作意圖”的情況下僅輸出“嘭”等通知聲，從而與“有語音操作意圖”的情況相比，不會(huì)讓用戶意識(shí)到導(dǎo)航系統(tǒng)。

另外，如圖4(c)所示，作為語音識(shí)別失敗時(shí)的控制狀態(tài)，在“有語音操作意圖”的情況下，定義為“以音量8輸出‘無法識(shí)別。請(qǐng)?jiān)僖淮伟l(fā)聲’的語音”，在“無語音操作意圖”的情況下，定義為“以音量3輸出‘無法識(shí)別。請(qǐng)?jiān)僖淮伟l(fā)聲’的語音”。

由此，通過在“無語音操作意圖”的情況下減小向用戶進(jìn)行通知的語音的音量，從而與“有語音操作意圖”的情況相比，不會(huì)讓用戶意識(shí)到導(dǎo)航系統(tǒng)。

接著，利用圖5來對(duì)根據(jù)“有語音操作意圖”的可靠度來定義不同控制狀態(tài)的示例進(jìn)行說明。

圖5(a)表示針對(duì)識(shí)別對(duì)象語的“有語音操作意圖”的可靠度“高”、“無語音操作意圖”的可靠度“低”、以及“無語音操作意圖”的控制狀態(tài)的一個(gè)示例。

例如，對(duì)于識(shí)別對(duì)象語“便利店”，作為“有語音操作意圖”且可靠度“高”的情況的控制狀態(tài)，定義有“對(duì)本車周邊的便利店進(jìn)行檢索并顯示距離本車位置最近的便利店的信息”。另一方面，作為“有語音操作意圖”且可靠度“低”的情況的控制狀態(tài)，定義有“對(duì)本車周邊的便利店進(jìn)行檢索并顯示檢索結(jié)果的列表”。而且，作為“無語音操作意圖”的情況的控制狀態(tài)，定義有“生成用于執(zhí)行本車周邊的便利店檢索的按鈕”。

另外，在圖5(b)中，作為語音識(shí)別失敗時(shí)的控制狀態(tài)，在“有語音操作意圖”且可靠度“高”的情況下，定義為“輸出‘無法識(shí)別。請(qǐng)?jiān)僖淮伟l(fā)聲’的語音”，在“有語音操作意圖”且可靠度“低”的情況下，定義為“僅輸出通知聲”，在“無語音操作意圖”的情況下，定義為“什么也不做”。

此外，也可以在可靠度較高的情況下增大音量，在可靠度較低的情況下減小音量。

此外，還可以根據(jù)“有語音操作意圖”的可靠度為預(yù)定基準(zhǔn)值以下(或者小于基準(zhǔn)值)還是大于該基準(zhǔn)值(或者為基準(zhǔn)值以上)，來對(duì)控制狀態(tài)進(jìn)行定義。即，即使是“有語音操作意圖”，在可靠度為預(yù)定基準(zhǔn)值以下的情況下，也可以判斷為“無語音操作意圖”。

圖6(a)(b)示出了一個(gè)示例。在圖6(a)的示例中，在針對(duì)識(shí)別對(duì)象語的“有語音操作意圖”的可靠度為“低”的情況下，與“無語音操作意圖”的情況同樣地定義控制狀態(tài)。在圖6(b)的示例中，在語音識(shí)別失敗且“有語音操作意圖”的可靠度為“低”的情況下，與“無語音操作意圖”的情況同樣地定義控制狀態(tài)。

接著，利用圖8所示的流程圖，來對(duì)實(shí)施方式1的語音識(shí)別系統(tǒng)10的動(dòng)作進(jìn)行說明。

首先，語音獲取部11導(dǎo)入由麥克風(fēng)5所獲取到的用戶發(fā)聲、即所輸入的語音，利用例如PCM來進(jìn)行A/D轉(zhuǎn)換，從而對(duì)語音區(qū)間進(jìn)行檢測(cè)(步驟ST01)。

接著，語音識(shí)別部12對(duì)語音獲取部11所檢測(cè)出的語音區(qū)間的語音數(shù)據(jù)進(jìn)行識(shí)別，輸出識(shí)別結(jié)果(步驟ST02)。

接下來，語音操作意圖判斷部14獲取用于判斷有無語音操作意圖的信息(步驟ST03)，對(duì)有無語音操作意圖進(jìn)行判斷，輸出判斷結(jié)果(步驟ST04)。

然后，控制狀態(tài)變更部15參照控制狀態(tài)存儲(chǔ)部16，基于語音識(shí)別部12所輸出的識(shí)別結(jié)果和語音操作意圖判斷部14所輸出的判斷結(jié)果來決定控制狀態(tài)，并向?qū)Ш讲?輸出該所決定的控制狀態(tài)(步驟ST05)。

最后，導(dǎo)航部1基于控制狀態(tài)變更部15所指示的控制狀態(tài)來執(zhí)行處理(步驟ST06)。

下面，利用具體例來進(jìn)行說明。

首先，對(duì)用戶發(fā)聲的語音識(shí)別成功的情況的示例進(jìn)行說明。

這里，設(shè)用戶A和用戶B同乘。另外，語音分析部17僅對(duì)用戶發(fā)聲的清晰度進(jìn)行計(jì)算，控制狀態(tài)存儲(chǔ)部16中保存有圖4(a)(b)所示的內(nèi)容。此外，清晰度的范圍為“0～100”，將預(yù)定閾值設(shè)為“50”。

設(shè)用戶A對(duì)用戶B發(fā)出“最喜歡哪家便利店的飯團(tuán)？”的語音。利用麥克風(fēng)5來采集該發(fā)聲，語音獲取部11導(dǎo)入由麥克風(fēng)5所獲取到的語音并進(jìn)行A/D轉(zhuǎn)換(步驟ST01)。語音識(shí)別部12如上所述，始終對(duì)語音獲取部11所獲取到的語音數(shù)據(jù)進(jìn)行識(shí)別處理，因此，對(duì)由語音獲取部11進(jìn)行數(shù)字化后的用戶A的發(fā)聲進(jìn)行識(shí)別，并輸出“便利店”作為識(shí)別結(jié)果(步驟ST02)。

接著，語音分析部17對(duì)語音獲取部11所獲取到的語音數(shù)據(jù)進(jìn)行分析，計(jì)算用戶A的發(fā)聲的清晰度，語音操作意圖判斷部14獲取該清晰度(步驟ST03)。

這里，設(shè)所計(jì)算出的清晰度為“40”。

由于語音分析部17所計(jì)算出的清晰度小于預(yù)定閾值“50”，因此，語音操作意圖判斷部14確定用戶并非打算對(duì)系統(tǒng)進(jìn)行語音操作而發(fā)聲，從而判斷為“無語音操作意圖”(步驟ST04)。

然后，控制狀態(tài)變更部15參照控制狀態(tài)存儲(chǔ)部16的圖4(a)的內(nèi)容，來決定識(shí)別對(duì)象語為“便利店”且“無語音操作意圖”的情況下的控制狀態(tài)。在本示例中，決定為“生成用于執(zhí)行本車周邊的便利店檢索的按鈕并進(jìn)行顯示”(步驟ST05)。

最后，導(dǎo)航部1基于控制狀態(tài)變更部15所決定的控制狀態(tài)，來執(zhí)行處理。其結(jié)果是，如圖7(b)所示，將用于執(zhí)行本車周邊的便利店檢索的按鈕顯示于顯示器3(步驟ST06)。

另一方面，設(shè)為下述情況：由于車內(nèi)噪聲較大等狀況，在步驟ST02中語音識(shí)別部12所輸出的識(shí)別結(jié)果所包含的識(shí)別得分為規(guī)定閾值以下，或者語音識(shí)別處理失敗。

在這種情況下，在步驟ST05中，控制狀態(tài)變更部15參照控制狀態(tài)存儲(chǔ)部16的圖4(b)的內(nèi)容，來決定“識(shí)別結(jié)果失敗”且“無語音操作意圖”的情況下的控制狀態(tài)。在該示例中，決定為“輸出通知聲”。

其結(jié)果是，從揚(yáng)聲器4輸出例如像“嘭”這樣的通知聲(步驟ST06)。

接著，說明用戶A向?qū)Ш较到y(tǒng)發(fā)出“想去便利店”的語音的情況下的動(dòng)作。

圖8的步驟ST01、步驟ST02的處理與上述情況相同，因此省略說明。設(shè)語音分析部17計(jì)算出清晰度為“70”，語音操作意圖判斷部14獲取該清晰度(步驟ST03)。

由于語音分析部17所計(jì)算出的清晰度“70”為預(yù)定閾值“50”以上，因此，語音操作意圖判斷部14確定用戶打算對(duì)系統(tǒng)進(jìn)行語音操作而發(fā)聲，從而判斷為“有語音操作意圖”(步驟ST04)。

然后，控制狀態(tài)變更部15參照控制狀態(tài)存儲(chǔ)部16的圖4(a)的內(nèi)容，來決定識(shí)別對(duì)象語為“便利店”且“有語音操作意圖”的情況下的控制狀態(tài)。在本示例中，決定為“對(duì)本車周邊的便利店進(jìn)行檢索并顯示檢索結(jié)果的列表”(步驟ST05)。

最后，導(dǎo)航部1基于控制狀態(tài)變更部15所決定的控制狀態(tài)，來執(zhí)行處理。其結(jié)果是，如圖7(a)所示，將執(zhí)行了本車周邊的便利店檢索而得的結(jié)果的列表顯示于顯示器3(步驟ST06)。

另一方面，設(shè)為下述情況：車內(nèi)噪聲較大，在步驟ST02中語音識(shí)別部12所輸出的識(shí)別結(jié)果所包含的識(shí)別得分為規(guī)定閾值以下，或者語音識(shí)別處理失敗。

在這種情況下，在步驟ST05中，控制狀態(tài)變更部15參照控制狀態(tài)存儲(chǔ)部16的圖4(b)的內(nèi)容，來決定“識(shí)別結(jié)果失敗”且“有語音操作意圖”的情況下的控制狀態(tài)。在本示例中，決定為“輸出‘無法識(shí)別。請(qǐng)?jiān)僖淮伟l(fā)聲’的語音”。

其結(jié)果是，從揚(yáng)聲器4輸出“無法識(shí)別。請(qǐng)?jiān)僖淮伟l(fā)聲”的語音(步驟ST06)。

如上所述，根據(jù)實(shí)施方式1，語音識(shí)別系統(tǒng)10始終對(duì)用戶所發(fā)出的語音進(jìn)行識(shí)別，并基于識(shí)別結(jié)果來對(duì)導(dǎo)航系統(tǒng)進(jìn)行控制，在該語音識(shí)別系統(tǒng)10中，構(gòu)成為包括：語音操作意圖判斷部14，該語音操作意圖判斷部14對(duì)所識(shí)別出的發(fā)聲判斷用戶是否具有操作導(dǎo)航系統(tǒng)的意圖；以及控制狀態(tài)變更部15，該控制狀態(tài)變更部15在語音操作意圖判斷部14中判斷為沒有操作意圖的情況下，與判斷為有操作意圖的情況相比，將導(dǎo)航系統(tǒng)的控制的狀態(tài)向不讓用戶意識(shí)到的方向進(jìn)行變更。由于與判斷為用戶打算進(jìn)行語音操作而發(fā)聲的情況相比，將判斷為是不打算進(jìn)行語音操作的發(fā)聲的情況下的識(shí)別結(jié)果所對(duì)應(yīng)的控制狀態(tài)變更為不讓用戶意識(shí)到的狀態(tài)，因此，能減輕用戶的不快感和郁悶感。

另外，根據(jù)實(shí)施方式1，語音操作意圖判斷部14在判斷為具有操作的意圖的情況下，對(duì)表示該操作的意圖達(dá)到何種程度的可靠度進(jìn)行判斷，控制狀態(tài)變更部15在語音操作意圖判斷部14中判斷出的可靠度較低的情況下，與可靠度較高的情況相比將導(dǎo)航系統(tǒng)的控制狀態(tài)向不讓用戶意識(shí)到的方向進(jìn)行變更。因此，能根據(jù)用戶實(shí)際打算進(jìn)行語音操作而發(fā)聲的可能性的高低來變更控制狀態(tài)，能進(jìn)一步減輕用戶的不快感和郁悶感。另外，能對(duì)用戶彼此的自然的對(duì)話進(jìn)行識(shí)別，從而在不妨礙用戶彼此的對(duì)話的情況下對(duì)用戶可能希望的動(dòng)作進(jìn)行提示。

另外，根據(jù)實(shí)施方式1，控制狀態(tài)變更部15在用戶所發(fā)出的語音的識(shí)別失敗的情況下，對(duì)導(dǎo)航系統(tǒng)進(jìn)行控制，使其向用戶通知識(shí)別失敗，并在關(guān)于發(fā)聲的操作意圖的可靠度較低的情況下，與可靠度較高的情況相比，將該通知的狀態(tài)向不讓用戶意識(shí)到的方向進(jìn)行變更。

另外，在利用語音來通知識(shí)別失敗的情況下，控制狀態(tài)變更部15在關(guān)于發(fā)聲的操作意圖的可靠度較低的情況下，與可靠度較高的情況相比，減小該語音的音量。

因此，能減輕將識(shí)別失敗通知給用戶時(shí)的不快感和郁悶感。

另外，根據(jù)實(shí)施方式1，語音操作意圖判斷部14在發(fā)聲來自多個(gè)方向的情況下，判斷為沒有操作的意圖。因此，能在不會(huì)妨礙用戶彼此的對(duì)話的情況下減輕不快感和郁悶感。

另外，根據(jù)實(shí)施方式1，控制狀態(tài)變更部15在用戶所發(fā)出的語音的識(shí)別失敗的情況下，對(duì)被控制裝置進(jìn)行控制，使其向用戶通知識(shí)別失敗，并且在關(guān)于發(fā)聲判斷為無操作意圖的情況下，與判斷為有操作意圖的情況相比，將該通知的狀態(tài)向不讓用戶意識(shí)到的方向進(jìn)行變更。因此，能減輕將識(shí)別失敗通知給用戶時(shí)的不快感和郁悶感。

此外，本發(fā)明可以在該發(fā)明的范圍內(nèi)對(duì)實(shí)施方式的任意構(gòu)成要素進(jìn)行變形，或省略實(shí)施方式的任意的構(gòu)成要素。

工業(yè)上的實(shí)用性

本發(fā)明所涉及的語音識(shí)別系統(tǒng)根據(jù)用戶是否是打算進(jìn)行語音操作而進(jìn)行了發(fā)聲，來對(duì)與識(shí)別結(jié)果相對(duì)應(yīng)的控制狀態(tài)進(jìn)行切換，因此，適用于始終對(duì)用戶的發(fā)聲進(jìn)行識(shí)別的語音識(shí)別系統(tǒng)等。

標(biāo)號(hào)說明

1 導(dǎo)航部

2 指示輸入部

3 顯示器

4 揚(yáng)聲器

5 麥克風(fēng)

6 攝像頭

10 語音識(shí)別系統(tǒng)

11 語音獲取部

12 語音識(shí)別部

13 語音識(shí)別辭典

14 語音操作意圖判斷部