基于聲音的選擇裝置以及選擇方法

文檔序號(hào)：2829151閱讀：150來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂(lè)器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：基于聲音的選擇裝置以及選擇方法
技術(shù)領(lǐng)域：
本發(fā)明涉及用于通過(guò)聲音選擇由系統(tǒng)提示的項(xiàng)目的基于聲音的選擇裝置、以及選擇方法。
背景技術(shù)：
以往，作為基于聲音的選擇裝置，已知在通過(guò)聲音指定了控制對(duì)象后依次用聲音輸出并選擇控制內(nèi)容的選擇項(xiàng)目的技術(shù)(例如，特開平3-293400號(hào)公報(bào))。
按照特開平3-293400號(hào)公報(bào)中記載的技術(shù)，可以控制開關(guān)而使聲音控制系統(tǒng)成為可動(dòng)作的狀態(tài)，通過(guò)在該狀態(tài)下將成為控制對(duì)象的設(shè)備的名稱發(fā)聲來(lái)識(shí)別該名稱，該名稱的設(shè)備的控制項(xiàng)目依次通過(guò)聲音合成被發(fā)聲，在發(fā)聲了適當(dāng)?shù)目刂祈?xiàng)目的階段通過(guò)發(fā)聲為“是”，執(zhí)行與該項(xiàng)目相應(yīng)的控制。
而且，還已知以下技術(shù)(例如，特開平6-149534號(hào)公報(bào))利用投影儀將個(gè)人計(jì)算機(jī)的畫面設(shè)為大畫面來(lái)顯示，并基于該畫面，通過(guò)發(fā)聲在該畫面上顯示的項(xiàng)目來(lái)強(qiáng)調(diào)顯示該項(xiàng)目，如果操作執(zhí)行按鈕，則顯示該項(xiàng)目的細(xì)節(jié)，可以進(jìn)行該項(xiàng)目的細(xì)節(jié)的監(jiān)視、控制。
但是，在特開平3-293400號(hào)公報(bào)和特開平6-149534號(hào)公報(bào)中記載的技術(shù)中，沒(méi)有提供具體地受理與系統(tǒng)提示的選擇項(xiàng)目重疊的用戶的聲音的方法，因此，在通常的聲音識(shí)別方法中，在通過(guò)合成聲音輸出選擇項(xiàng)目中難以進(jìn)行聲音識(shí)別，同時(shí)從系統(tǒng)提示的選擇項(xiàng)目的輸出方法也被限定于聲音，例如，存在不能通過(guò)聲音直接進(jìn)行音樂(lè)或圖像等的選擇的問(wèn)題。

發(fā)明內(nèi)容
本發(fā)明是處理這樣的以往的問(wèn)題而完成的，提供基于聲音的選擇裝置和選擇方法，即使在通過(guò)合成聲音輸出選擇項(xiàng)目中，將音樂(lè)或圖像等作為了選擇項(xiàng)目的情況下也可以進(jìn)行聲音識(shí)別。
本發(fā)明的基于聲音的選擇裝置具有以下結(jié)構(gòu)，即包括輸出單元，輸出用于引導(dǎo)選擇項(xiàng)目的引導(dǎo)聲音；聲音識(shí)別單元，對(duì)在由所述輸出單元輸出的所述引導(dǎo)聲音的輸出中或者在其輸出結(jié)束后一定時(shí)間內(nèi)發(fā)聲的、用于選擇所述選擇項(xiàng)目的選擇指示進(jìn)行識(shí)別；以及對(duì)話控制/結(jié)果選擇單元，在由所述聲音識(shí)別單元識(shí)別出所述選擇指示的情況下，選擇所述被選擇指示的選擇項(xiàng)目。
通過(guò)該結(jié)構(gòu)，可以通過(guò)在由輸出單元輸出引導(dǎo)聲音期間、該輸出結(jié)束并經(jīng)過(guò)一定時(shí)間前發(fā)出用于選擇選擇項(xiàng)目的聲音，由聲音識(shí)別單元選擇該選擇項(xiàng)目，即使在引導(dǎo)聲音的輸出中也可以選擇選擇項(xiàng)目。
而且，本發(fā)明的基于聲音的選擇裝置具有以下結(jié)構(gòu)，即在由所述輸出單元輸出的所述引導(dǎo)聲音的輸出中或者在其輸出結(jié)束后一定時(shí)間內(nèi)選擇指示未被發(fā)聲的情況下，所述對(duì)話控制/結(jié)果選擇單元進(jìn)行控制，以便將用于引導(dǎo)所述選擇項(xiàng)目的下一個(gè)選擇項(xiàng)目的引導(dǎo)聲音輸出到所述輸出單元。
通過(guò)該結(jié)構(gòu)，可以在未發(fā)出用于選擇選擇項(xiàng)目的聲音的情況下，不斷地在一定時(shí)間后輸出用于引導(dǎo)下一個(gè)選擇項(xiàng)目的引導(dǎo)聲音，在喜好的選擇項(xiàng)目中任意地發(fā)出選擇指示，并選擇該選擇項(xiàng)目。
而且，本發(fā)明的基于聲音的選擇裝置具有以下結(jié)構(gòu)，即所述聲音識(shí)別單元包括聲音去除單元，從被輸入到所述聲音識(shí)別單元的聲音中減去由所述輸出單元輸出的所述引導(dǎo)聲音。
通過(guò)該結(jié)構(gòu)，由輸出單元輸出的引導(dǎo)聲音被輸入聲音識(shí)別單元，可以盡量排除對(duì)聲音識(shí)別單元進(jìn)行的選擇指示的聲音識(shí)別產(chǎn)生障礙，即使在引導(dǎo)聲音輸出中也可以正確地識(shí)別選擇指示。
而且，本發(fā)明的基于聲音的選擇裝置具有以下結(jié)構(gòu)，即其中還包括樂(lè)曲再現(xiàn)單元，再現(xiàn)對(duì)應(yīng)于所述引導(dǎo)聲音的樂(lè)曲的一部分或者全部，所述聲音識(shí)別單元對(duì)在由所述樂(lè)曲再現(xiàn)單元再現(xiàn)所述樂(lè)曲期間或者再現(xiàn)結(jié)束后一定時(shí)間內(nèi)被輸入的選擇指示進(jìn)行聲音識(shí)別。
通過(guò)該結(jié)構(gòu)，僅通過(guò)在用于引導(dǎo)聲音的樂(lè)曲的再現(xiàn)中，或者在其之后一定時(shí)間內(nèi)發(fā)出用于選擇指示選擇項(xiàng)目的聲音，就可以選擇并聽取該樂(lè)曲。
而且，本發(fā)明的基于聲音的選擇裝置具有以下結(jié)構(gòu)，即其中還包括生成對(duì)應(yīng)于所述引導(dǎo)聲音的圖像的圖像生成單元，所述圖像識(shí)別單元對(duì)在由所述圖像生成單元生成所述圖像期間或者生成后一定時(shí)間內(nèi)被輸入的選擇指示進(jìn)行聲音識(shí)別。
通過(guò)該結(jié)構(gòu)，僅通過(guò)在生成并顯示對(duì)應(yīng)于引導(dǎo)聲音的圖像期間，或者在其之后一定時(shí)間內(nèi)發(fā)出用于選擇指示選擇項(xiàng)目的聲音，就可以選擇該圖像，例如，如果為靜止圖像，則可以原樣繼續(xù)觀看靜止圖像，如果是活動(dòng)圖像，則可以繼續(xù)該活動(dòng)畫面并觀看。
而且，本發(fā)明的基于聲音的選擇裝置具有以下結(jié)構(gòu)，即其中還包括輸入等待時(shí)間設(shè)定單元，在由所述輸出單元輸出的所述引導(dǎo)聲音的輸出中或者在其輸出結(jié)束后設(shè)定一定時(shí)間，所述聲音識(shí)別單元對(duì)在由所述輸入等待時(shí)間設(shè)定單元設(shè)定的所述一定時(shí)間內(nèi)被發(fā)聲的、用于選擇所述選擇項(xiàng)目的選擇指示進(jìn)行識(shí)別。
通過(guò)該結(jié)構(gòu)，可以通過(guò)在由輸出單元輸出引導(dǎo)聲音期間、或該輸出結(jié)束并經(jīng)過(guò)被設(shè)置的一定時(shí)間的輸入等待時(shí)間前發(fā)出用于選擇選擇項(xiàng)目的聲音，由聲音識(shí)別單元選擇該選擇項(xiàng)目，即使在引導(dǎo)聲音的輸出中也可以更確實(shí)地選擇選擇項(xiàng)目。
進(jìn)而，本發(fā)明的基于聲音的選擇方法具有以下結(jié)構(gòu)，即包括輸出步驟，輸出用于引導(dǎo)選擇項(xiàng)目的引導(dǎo)聲音；聲音識(shí)別步驟，對(duì)在所述輸出步驟中輸出的所述引導(dǎo)聲音的輸出中或者在其輸出結(jié)束后一定時(shí)間內(nèi)發(fā)聲的、用于選擇所述選擇項(xiàng)目的選擇指示進(jìn)行識(shí)別；以及對(duì)話控制/結(jié)果選擇步驟，在由所述聲音識(shí)別步驟識(shí)別出所述選擇指示的情況下，選擇所述被選擇指示的選擇項(xiàng)目。
通過(guò)該結(jié)構(gòu)，通過(guò)在輸出步驟中引導(dǎo)聲音被輸出期間、其輸出結(jié)束并在經(jīng)過(guò)一定期間之前發(fā)出用于選擇選擇項(xiàng)目的聲音，可以通過(guò)聲音識(shí)別步驟選擇該選擇項(xiàng)目，即使在引導(dǎo)聲音輸出中也可以選擇選擇項(xiàng)目。
如上所述，本發(fā)明的基于聲音的選擇裝置包括輸出單元，輸出用于引導(dǎo)選擇項(xiàng)目的引導(dǎo)聲音；聲音識(shí)別單元，對(duì)在由所述輸出單元輸出的所述引導(dǎo)聲音的輸出中或者在其輸出結(jié)束后一定時(shí)間內(nèi)發(fā)聲的、用于選擇所述選擇項(xiàng)目的選擇指示進(jìn)行識(shí)別；以及對(duì)話控制/結(jié)果選擇單元，在由所述聲音識(shí)別單元識(shí)別出所述選擇指示的情況下，選擇所述被選擇指示的選擇項(xiàng)目，通過(guò)在由輸出單元輸出引導(dǎo)聲音期間、該輸出結(jié)束并經(jīng)過(guò)一定時(shí)間前發(fā)出用于選擇選擇項(xiàng)目的聲音，由聲音識(shí)別單元選擇該選擇項(xiàng)目，即使在引導(dǎo)聲音的輸出中也可以選擇選擇項(xiàng)目。
而且，本發(fā)明的基于聲音的選擇方法具有以下步驟，即包括輸出步驟，輸出用于引導(dǎo)選擇項(xiàng)目的引導(dǎo)聲音；聲音識(shí)別步驟，對(duì)在所述輸出步驟中輸出的所述引導(dǎo)聲音的輸出中或者在其輸出結(jié)束后一定時(shí)間內(nèi)發(fā)聲的、用于選擇所述選擇項(xiàng)目的選擇指示進(jìn)行識(shí)別；以及對(duì)話控制/結(jié)果選擇步驟，在由所述聲音識(shí)別步驟識(shí)別出所述選擇指示的情況下，選擇所述被選擇指示的選擇項(xiàng)目，通過(guò)在輸出步驟中引導(dǎo)聲音被輸出期間、其輸出結(jié)束并在經(jīng)過(guò)一定期間之前發(fā)出用于選擇選擇項(xiàng)目的聲音，可以通過(guò)聲音識(shí)別步驟選擇該選擇項(xiàng)目，即使在引導(dǎo)聲音輸出中也可以選擇選擇項(xiàng)目。
本發(fā)明的基于聲音的選擇裝置包括輸出單元，輸出用于引導(dǎo)選擇項(xiàng)目的引導(dǎo)聲音；輸入等待時(shí)間設(shè)定單元，在由所述輸出單元輸出的所述引導(dǎo)聲音的輸出中或者在其輸出結(jié)束后設(shè)定一定時(shí)間；聲音識(shí)別單元，對(duì)在由所述輸入等待時(shí)間設(shè)定單元設(shè)定的所述一定時(shí)間內(nèi)被發(fā)聲的、用于選擇所述選擇項(xiàng)目的選擇指示進(jìn)行識(shí)別；以及對(duì)話控制/結(jié)果選擇單元，在由所述聲音識(shí)別單元識(shí)別出所述選擇指示的情況下，選擇所述被選擇指示的選擇項(xiàng)目，通過(guò)在由輸出單元輸出引導(dǎo)聲音期間、該輸出結(jié)束并經(jīng)過(guò)一定時(shí)間前發(fā)出用于選擇選擇項(xiàng)目的聲音，由聲音識(shí)別單元選擇該選擇項(xiàng)目，即使在引導(dǎo)聲音的輸出中也可以選擇選擇項(xiàng)目。

圖1是表示本發(fā)明的實(shí)施方式1中的基于聲音的選擇裝置的概略結(jié)構(gòu)的方框圖。
圖2是表示本發(fā)明的實(shí)施方式1中的基于聲音的選擇裝置的動(dòng)作的流程圖。
圖3是表示本發(fā)明的實(shí)施方式1中的基于聲音的選擇裝置的動(dòng)作的時(shí)序圖。
圖4是表示本發(fā)明的實(shí)施方式2中的基于聲音的選擇裝置的概略結(jié)構(gòu)的方框圖。
圖5是表示本發(fā)明的實(shí)施方式2中的基于聲音的選擇裝置的動(dòng)作的流程圖。
圖6是表示本發(fā)明的實(shí)施方式2中的基于聲音的選擇裝置的動(dòng)作的時(shí)序圖。
圖7是表示本發(fā)明的實(shí)施方式3中的基于聲音的選擇裝置的概略結(jié)構(gòu)的方框圖。
圖8是表示本發(fā)明的實(shí)施方式3中的基于聲音的選擇裝置的動(dòng)作的流程圖。
圖9是表示本發(fā)明的實(shí)施方式3中的基于聲音的選擇裝置的動(dòng)作的時(shí)序圖。
圖10是表示本發(fā)明的實(shí)施方式4中的基于聲音的選擇裝置的概略結(jié)構(gòu)的方框圖。
圖11是表示本發(fā)明的實(shí)施方式4中的基于聲音的選擇裝置的動(dòng)作的流程圖。
圖12是表示本發(fā)明的實(shí)施方式4中的基于聲音的選擇裝置的動(dòng)作的時(shí)序圖。
標(biāo)號(hào)說(shuō)明101 揚(yáng)聲器102 麥克風(fēng)103 系統(tǒng)聲音去除單元104 濾波器系數(shù)學(xué)習(xí)單元105 自自適應(yīng)濾波器單元106 聲音識(shí)別單元107，1007對(duì)話控制/結(jié)果選擇單元108，1008響應(yīng)生成單元109 響應(yīng)聲音數(shù)據(jù)庫(kù)110 減法器411 音樂(lè)再現(xiàn)單元412 音樂(lè)數(shù)據(jù)庫(kù)413 混頻器單元700 顯示器711 圖像生成單元712 圖像/活動(dòng)畫面數(shù)據(jù)庫(kù)1011 輸入等待時(shí)間設(shè)定單元具體實(shí)施方式
以下，參照附圖對(duì)本發(fā)明的實(shí)施方式進(jìn)行說(shuō)明。
(實(shí)施方式1)圖1是表示本發(fā)明的實(shí)施方式1中的基于聲音的選擇裝置的概略結(jié)構(gòu)的方框圖。
如圖1所示，本發(fā)明的實(shí)施方式1中的基于聲音的選擇裝置包括作為對(duì)用戶輸出作為引導(dǎo)的聲音或聲音響應(yīng)的系統(tǒng)側(cè)的聲音的輸出單元的揚(yáng)聲器(聲音輸出單元)101；將用戶發(fā)出的聲音變換為聲音信號(hào)的麥克風(fēng)102；作為將與揚(yáng)聲器101輸出的引導(dǎo)聲相當(dāng)?shù)妮敵鱿喈?dāng)信號(hào)從由麥克風(fēng)102輸出的聲音信號(hào)中去除的聲音去除單元的系統(tǒng)聲音去除單元103；根據(jù)從麥克風(fēng)102輸出的、通過(guò)系統(tǒng)聲音去除單元103去除重疊信號(hào)部分而得到的聲音信號(hào)，識(shí)別用戶聲音的發(fā)話內(nèi)容的聲音識(shí)別單元106；根據(jù)由聲音識(shí)別單元106得到的用戶聲音的內(nèi)容選擇對(duì)應(yīng)的響應(yīng)聲音而控制與用戶的對(duì)話，同時(shí)選擇結(jié)果的對(duì)話控制/結(jié)果選擇單元107；存儲(chǔ)了響應(yīng)聲音數(shù)據(jù)的響應(yīng)聲音數(shù)據(jù)庫(kù)109；根據(jù)對(duì)話控制/結(jié)果選擇單元107的輸出，利用響應(yīng)聲音數(shù)據(jù)庫(kù)109的數(shù)據(jù)來(lái)生成用于輸出到揚(yáng)聲器101或系統(tǒng)聲音去除單元103的聲音響應(yīng)信號(hào)的響應(yīng)生成單元108。
系統(tǒng)聲音去除單元103包括濾波器系數(shù)學(xué)習(xí)單元104，根據(jù)從麥克風(fēng)102輸出的聲音信號(hào)和從響應(yīng)生成單元108輸出的響應(yīng)聲音信號(hào)，例如一邊學(xué)習(xí)利用LMS(Least Mean Square)/牛頓算法得到的濾波器系數(shù)(脈沖響應(yīng))，一邊調(diào)整為最佳；自自適應(yīng)濾波器單元105，根據(jù)作為來(lái)自濾波器系數(shù)學(xué)習(xí)單元104的輸出的脈沖響應(yīng)校正并輸出響應(yīng)聲音信號(hào)；以及減法器110，從麥克風(fēng)102輸出的聲音信號(hào)中減去由自適應(yīng)濾波器單元105輸出的輸出信號(hào)。
聲音識(shí)別單元106包括音響處理單元，對(duì)從麥克風(fēng)102輸出的、由系統(tǒng)聲音去除單元103減去了聲音響應(yīng)的相當(dāng)重疊部分的聲音信號(hào)進(jìn)行音響處理；音素識(shí)別單元，根據(jù)由音響處理單元得到的聲音的最小單位選出并識(shí)別最相似的音素候選；辭典數(shù)據(jù)庫(kù)，存儲(chǔ)與聲音對(duì)話系統(tǒng)的利用目的關(guān)聯(lián)的單詞等；語(yǔ)言處理單元，根據(jù)在音素識(shí)別單元得到的音素和來(lái)自辭典數(shù)據(jù)庫(kù)的聲音數(shù)據(jù)選定單詞的候選，并執(zhí)行用于利用句子結(jié)構(gòu)、含義、文理等的語(yǔ)言信息得到正確的文章的語(yǔ)言處理。
而且，音響處理單元例如構(gòu)成為利用LPC倒頻譜(Linear PredictorCoefficient Cepstrum線性預(yù)測(cè)系數(shù)化倒頻譜)等，將從麥克風(fēng)102輸出的聲音信號(hào)變換為所謂特征量向量的時(shí)間系列的向量，并推測(cè)聲音頻譜的大概形狀(頻譜包絡(luò))。
而且，音素識(shí)別部例如構(gòu)成為利用HMM(Hidden Markov Model隱藏馬爾可夫模型)法等，根據(jù)輸入的聲音，利用由音響處理單元提取的音響參數(shù)，進(jìn)行聲音信號(hào)的音素記號(hào)化，與預(yù)先準(zhǔn)備的標(biāo)準(zhǔn)音素模型比較，選出與其最相似的音素的候選。
另一方面，對(duì)話控制/結(jié)果選擇單元107根據(jù)由聲音識(shí)別單元106識(shí)別的聲音信號(hào)的內(nèi)容，選擇控制響應(yīng)內(nèi)容并將其輸出到響應(yīng)生成單元108，同時(shí)選擇輸出結(jié)果。
響應(yīng)生成單元108根據(jù)由對(duì)話控制/結(jié)果選擇單元107決定的內(nèi)容，利用來(lái)自響應(yīng)聲音數(shù)據(jù)庫(kù)109的數(shù)據(jù)來(lái)生成響應(yīng)聲音信號(hào)，輸出到揚(yáng)聲器101。
接著，利用圖2、圖3詳細(xì)地說(shuō)明本發(fā)明的實(shí)施方式1中的基于聲音的選擇裝置的動(dòng)作。
而且，圖2是說(shuō)明本發(fā)明的實(shí)施方式1中的基于聲音的選擇裝置的動(dòng)作的流程圖，圖3是時(shí)序圖。
首先，在進(jìn)入選擇開始動(dòng)作時(shí)，基于對(duì)話控制/結(jié)果選擇單元107的控制，選擇項(xiàng)目的計(jì)數(shù)器N被設(shè)為1(步驟201)。在選擇項(xiàng)目的計(jì)數(shù)器N被設(shè)為1時(shí)，接著響應(yīng)生成單元108根據(jù)來(lái)自對(duì)話控制/結(jié)果選擇單元107的指令將引導(dǎo)聲音從響應(yīng)聲音數(shù)據(jù)庫(kù)109輸出到揚(yáng)聲器101(步驟202)。
例如，如圖3的時(shí)序圖所示那樣，將“請(qǐng)從下面中選擇希望的曲名?！蹦菢拥囊龑?dǎo)聲音(301)輸出到揚(yáng)聲器101。
如果引導(dǎo)聲音從揚(yáng)聲器101輸出，則接著進(jìn)行聲音識(shí)別的起動(dòng)，以便可以對(duì)來(lái)自用戶的選擇指示進(jìn)行聲音識(shí)別(步驟203)。由此，聲音識(shí)別單元106如圖3所示那樣起動(dòng)(302)。
如果聲音識(shí)別單元106起動(dòng)，則接著根據(jù)對(duì)話控制/結(jié)果選擇單元107的控制，響應(yīng)生成單元108訪問(wèn)響應(yīng)聲音數(shù)據(jù)庫(kù)109，輸出對(duì)應(yīng)于第一個(gè)選擇項(xiàng)目的聲音數(shù)據(jù)(步驟204)。
即，由此，例如如圖3所示那樣，將“青鳉的學(xué)校?！钡囊龑?dǎo)聲音(303)輸出到揚(yáng)聲器101。于是，“青鳉的學(xué)校?！钡囊龑?dǎo)聲音(303)被輸出的期間308A，以及在該輸出結(jié)束后的一定期間(輸入等待時(shí)間)308B成為可以選擇第一個(gè)選擇項(xiàng)目的“青鳉的學(xué)校”的時(shí)間308。隱藏，如果在該期間308用戶發(fā)出了指示選擇的語(yǔ)言，例如“就是它！”的語(yǔ)言，則可以選擇“青鳉的學(xué)校”。
在可以選擇“青鳉的學(xué)?！钡钠陂g308，如果用戶沒(méi)有發(fā)出進(jìn)行選擇指示的語(yǔ)言，例如“就是它！”的語(yǔ)言的情況下，選擇項(xiàng)目的計(jì)數(shù)器N中加1，成為輸出對(duì)應(yīng)于下一個(gè)選擇項(xiàng)目的引導(dǎo)聲音的狀態(tài)。
即，在輸出對(duì)應(yīng)于選擇項(xiàng)目的聲音時(shí)(步驟204)，對(duì)話控制/結(jié)果選擇單元107執(zhí)行在該選擇項(xiàng)目的提示中或者提示結(jié)束后一定時(shí)間內(nèi)用戶是否發(fā)出了指示選擇的語(yǔ)言的聲音的判定(步驟205)。
在用戶進(jìn)行了選擇指示的情況下(步驟205中“是”的情況)，此時(shí)，例如雖然選擇了“青鳉的學(xué)?！?，但是未進(jìn)行選擇指示的情況下(步驟205中“否”的情況下)，對(duì)選擇項(xiàng)目的計(jì)數(shù)器N加1(步驟206)，成為輸出對(duì)應(yīng)于下一個(gè)選擇項(xiàng)目的聲音，即對(duì)應(yīng)于第二個(gè)選擇項(xiàng)目的引導(dǎo)聲音的狀態(tài)(步驟204)。
由此，響應(yīng)生成單元108訪問(wèn)響應(yīng)聲音數(shù)據(jù)庫(kù)109，將第二個(gè)引導(dǎo)聲音的例如“掃晴娘?！钡囊龑?dǎo)聲音(304)輸出到揚(yáng)聲器101。
這時(shí)，在輸出“掃晴娘?！钡囊龑?dǎo)聲音(304)的期間309A，以及該輸出結(jié)束之后的一定時(shí)間(輸入等待時(shí)間)309B也成為可選擇第二個(gè)選擇項(xiàng)目的“掃晴娘”的期間309，在該期間309中如果用戶發(fā)出了選擇指示的語(yǔ)言，例如“就是它！”的語(yǔ)言的聲音，則可以選擇作為第二個(gè)選擇項(xiàng)目的“掃晴娘”。
在選擇項(xiàng)目提示中，或者在提示結(jié)束后一定時(shí)間內(nèi)，用戶未發(fā)出指示選擇的語(yǔ)言，例如“就是它！”的聲音的情況下，該情況被對(duì)話控制/結(jié)果選擇單元107判定(步驟205)，在該判定后，分支到“否”的路徑，與以前一樣，對(duì)選擇項(xiàng)目的計(jì)數(shù)器N加1(步驟206)，輸出對(duì)應(yīng)于下面的第三個(gè)選擇項(xiàng)目的引導(dǎo)聲音(步驟204)。
然后，由此響應(yīng)生成單元108訪問(wèn)響應(yīng)聲音數(shù)據(jù)庫(kù)109，作為第三個(gè)引導(dǎo)聲音，例如將“閃閃的星?！钡囊龑?dǎo)聲音(305)輸出到揚(yáng)聲器101。
在第三個(gè)引導(dǎo)聲音“閃閃的星?！?305)被輸出期間310A，以及輸出結(jié)束后的一定期間(輸入等待時(shí)間)310B，為可以選擇作為第三個(gè)選擇項(xiàng)目的“閃閃的星”的時(shí)間310，在該期間310中，如果用戶發(fā)出了選擇指示的語(yǔ)言，例如“就是它！”的語(yǔ)言的聲音，則可以選擇作為第三個(gè)選擇項(xiàng)目的“閃閃的星”。
在圖3中，用戶為了對(duì)作為第三個(gè)選擇項(xiàng)目的“閃閃的星”進(jìn)行選擇指示，在第三個(gè)引導(dǎo)聲音“閃閃的星?！?305)被輸出期間，或者在其后的一定期間，發(fā)出用于選擇它的聲音，例如“就是它！”的指示聲音(306)。
這里，如果在輸出引導(dǎo)聲音“閃閃的星?！?305)期間，用戶發(fā)出了“就是它！”的指示聲音(306)，則引導(dǎo)聲音“閃閃的星”(305)和“就是它！”(306)的指示聲音重疊地被輸入到麥克風(fēng)102，但是通過(guò)系統(tǒng)聲音去除單元103將與引導(dǎo)聲音相當(dāng)部分的信號(hào)，即“閃閃的星”(305)的聲音相當(dāng)?shù)牟糠值男盘?hào)從輸入到麥克風(fēng)102的信號(hào)中去除，在聲音識(shí)別單元106中可以正確地識(shí)別用戶發(fā)聲的指示聲音“就是它！”(306)。
在圖2中，在選擇項(xiàng)目提示中，或者在提示結(jié)束后一定時(shí)間內(nèi)用戶發(fā)出了選擇指示的語(yǔ)言，例如“就是它！”的語(yǔ)言的聲音的情況下，它被聲音識(shí)別單元106識(shí)別，在對(duì)話控制/結(jié)果選擇單元107被判定(步驟205)，分支到“是”的路徑。
在分支到“是”的路徑時(shí)，進(jìn)行聲音識(shí)別從而結(jié)束該聲音識(shí)別(步驟207)，選擇這時(shí)的選擇項(xiàng)目(步驟208)，以后，根據(jù)被選擇的結(jié)果，例如“閃閃的星”，對(duì)話控制/結(jié)果選擇單元107進(jìn)行對(duì)話控制。
而且，雖然未圖示，但是構(gòu)成為在最后的選擇項(xiàng)目被提示的階段，在雖然經(jīng)過(guò)一定時(shí)間，但未從用戶發(fā)出選擇指示的語(yǔ)言的聲音的情況下，從揚(yáng)聲器101進(jìn)行超時(shí)的警告，結(jié)束聲音識(shí)別而中止選擇。
如上所述，按照本發(fā)明的實(shí)施方式1，在系統(tǒng)基于聲音提示選擇項(xiàng)目的期間，或者提示結(jié)束后被設(shè)置的輸入等待時(shí)間內(nèi)，用戶發(fā)出了進(jìn)行選擇指示的語(yǔ)言的聲音的情況下，可以選擇發(fā)出了該選擇指示的語(yǔ)言的階段的選擇項(xiàng)目。
(實(shí)施方式2)圖4是表示本發(fā)明的實(shí)施方式2中的基于聲音的選擇裝置的概略結(jié)構(gòu)的方框圖，圖5是說(shuō)明該裝置的動(dòng)作的流程圖，圖6是說(shuō)明該裝置的動(dòng)作的時(shí)序圖。
而且，在圖4～圖6中，賦予與圖1～圖3所示的實(shí)施方式1相同標(biāo)號(hào)、號(hào)碼等的部分表示與圖1～圖3所示的實(shí)施方式1相同的結(jié)構(gòu)、相同的內(nèi)容的部分，這里省略其詳細(xì)的說(shuō)明。
在本實(shí)施方式中，除了實(shí)施方式1的結(jié)構(gòu)，還具有由對(duì)話控制/結(jié)果選擇單元107的指令控制的音樂(lè)再現(xiàn)單元411；以及存儲(chǔ)多個(gè)音樂(lè)的音樂(lè)數(shù)據(jù)庫(kù)412。
音樂(lè)再現(xiàn)單元411被構(gòu)成為通過(guò)來(lái)自對(duì)話控制/結(jié)果選擇單元107的指令訪問(wèn)音樂(lè)數(shù)據(jù)庫(kù)412，并且再現(xiàn)在對(duì)話控制/結(jié)果選擇單元107中指示的音樂(lè)。然后，由音樂(lè)再現(xiàn)單元411再現(xiàn)的音樂(lè)經(jīng)由混頻器單元413與來(lái)自響應(yīng)生成單元108的輸出一起輸出到揚(yáng)聲器101。
在圖6中，基于音樂(lè)輸出的引導(dǎo)音樂(lè)603～605分別對(duì)應(yīng)于圖3的引導(dǎo)聲音303～305。
因此，按照本實(shí)施方式，如圖5、圖6所示，不僅輸出作為選擇項(xiàng)目的引導(dǎo)聲音，而且還同時(shí)輸出對(duì)應(yīng)于該選擇項(xiàng)目的音樂(lè)及其本身，在選擇音樂(lè)的情況下更方便。
即，按照本實(shí)施方式，在實(shí)施方式1中，輸出對(duì)應(yīng)于第N個(gè)選擇項(xiàng)目的引導(dǎo)聲音的步驟204變?yōu)檩敵鰧?duì)應(yīng)于第N個(gè)選擇項(xiàng)目的音樂(lè)的步驟504，在該步驟504中，如果依次輸出對(duì)應(yīng)于第N個(gè)選擇項(xiàng)目的引導(dǎo)聲音和對(duì)應(yīng)于第N個(gè)選擇項(xiàng)目的音樂(lè)兩者，則首先曲名被輸出，接著音樂(lè)被輸出，所以在選擇音樂(lè)的情況下變得更方便。
而且，這里，為選擇而輸出的音樂(lè)也可以不是音樂(lè)全部(一個(gè)樂(lè)曲全體)，例如，僅序曲或者副曲(サビ)部分就足夠。于是，不論為選擇而輸出的音樂(lè)全部或者僅序曲或副曲部分，在為選擇而輸出的音樂(lè)已被選擇的情況下，通過(guò)音樂(lè)再現(xiàn)單元411，可以原樣繼續(xù)并輸出該音樂(lè)，也可以暫時(shí)返回音樂(lè)的最初后輸出。
這樣，按照本實(shí)施方式，將音樂(lè)作為選擇項(xiàng)目提示，并且如果在該期間，或者提示結(jié)束后一定時(shí)間內(nèi)用戶發(fā)出選擇指示的語(yǔ)言的聲音，則可以容易地選擇該用戶希望的音樂(lè)。
(實(shí)施方式3)圖7是表示本發(fā)明的實(shí)施方式2中的基于聲音的選擇裝置的概略結(jié)構(gòu)的方框圖，圖8是說(shuō)明該裝置的動(dòng)作的流程圖，圖9是說(shuō)明該裝置的動(dòng)作的時(shí)序圖。
而且，在圖7～圖9中，賦予與圖1～圖3所示的實(shí)施方式1相同標(biāo)號(hào)、號(hào)碼等的部分表示與圖1～圖3所示的實(shí)施方式1相同的結(jié)構(gòu)、相同的內(nèi)容的部分，這里省略其詳細(xì)的說(shuō)明。
在本實(shí)施方式中，除了實(shí)施方式1的結(jié)構(gòu)，還包括由對(duì)話控制/結(jié)果選擇單元107的指令控制的圖像生成單元711；存儲(chǔ)多個(gè)靜止畫面、活動(dòng)畫面等的圖像的圖像/活動(dòng)畫面數(shù)據(jù)庫(kù)712；以及顯示由圖像生成單元711生成的圖像的顯示器700。
圖像生成單元711被構(gòu)成為通過(guò)來(lái)自對(duì)話控制/結(jié)果選擇單元107的指示訪問(wèn)圖像/活動(dòng)畫面數(shù)據(jù)庫(kù)712，并輸出在對(duì)話控制/結(jié)果選擇單元107中指示的靜止畫面、活動(dòng)畫面等圖像數(shù)據(jù)，并且生成圖像。然后，圖像生成單元711生成的圖像被顯示在顯示器700中。
在圖9中，基于聲音輸出的引導(dǎo)聲音901、基于對(duì)顯示器的顯示的引導(dǎo)圖像903～905分別對(duì)應(yīng)于圖3的引導(dǎo)聲音301、303～305。
因此，按照本實(shí)施方式，如圖8、圖9所示，不僅輸出成為選擇項(xiàng)目的引導(dǎo)聲音，而且還同時(shí)在顯示器700上顯示對(duì)應(yīng)于該選擇項(xiàng)目的圖像，在選擇選擇項(xiàng)目時(shí)更方便。
即，按照本實(shí)施方式，在實(shí)施方式1中，輸出對(duì)應(yīng)于第N個(gè)選擇項(xiàng)目的引導(dǎo)聲音的步驟204變?yōu)檩敵鰧?duì)應(yīng)于第N個(gè)選擇項(xiàng)目的圖像的步驟804，在該步驟804中，輸出對(duì)應(yīng)于第N個(gè)選擇項(xiàng)目的引導(dǎo)聲音和對(duì)應(yīng)于第N個(gè)選擇項(xiàng)目的圖像兩者，前者從揚(yáng)聲器101作為聲音，后者在顯示器700中作為圖像或者活動(dòng)畫面被顯示。因此，以它們?yōu)榛A(chǔ)，可以更容易地選擇選擇項(xiàng)目。
而且，在為選擇而輸出的圖像為活動(dòng)畫面時(shí)，也可以不是該活動(dòng)畫面的全部，例如，僅最初的或者子畫面的一定時(shí)間就足夠。于是，無(wú)論為選擇而輸出的圖像的全部還是僅一定時(shí)間，在為選擇而輸出的圖像已被選擇的情況下，都可以通過(guò)圖像生成單元711原樣繼續(xù)并顯示該圖像，也可以暫時(shí)返回活動(dòng)畫面的最初后顯示。
這樣，按照本實(shí)施方式，除了選擇項(xiàng)目的引導(dǎo)聲音，還將與其對(duì)應(yīng)的圖像也作為選擇項(xiàng)目進(jìn)行提示，并且如果在該提示的時(shí)間或者提示結(jié)束后一定時(shí)間內(nèi)用戶發(fā)出了選擇指示的語(yǔ)言的聲音，則可以選擇該用戶希望的選擇項(xiàng)目，所以，例如具有繪畫或電影等圖像本身很好，在音樂(lè)的情況下，通過(guò)提示護(hù)封(jacket)的圖像，也可以更容易地選擇音樂(lè)的效果。
(實(shí)施方式4)在上述各實(shí)施方式中，例如如圖3所示，沒(méi)有積極地設(shè)置用于選擇的時(shí)間308B、309B等的結(jié)構(gòu)，但是利用圖10至圖12對(duì)具有設(shè)置用于該選擇的時(shí)間308B、309B等的輸入等待時(shí)間設(shè)定單元的基于聲音的選擇裝置進(jìn)行說(shuō)明。
通過(guò)具有該輸入等待時(shí)間設(shè)定單元，可以更確實(shí)地進(jìn)行聲音識(shí)別。
圖10是表示本發(fā)明的實(shí)施方式4中的基于聲音的選擇裝置的概略結(jié)構(gòu)的方框圖，圖11是說(shuō)明該裝置的動(dòng)作的流程圖，圖12是說(shuō)明該裝置的動(dòng)作的時(shí)序圖。
在圖10中，由于本實(shí)施方式的基本的結(jié)構(gòu)與上述實(shí)施方式1記載的基于聲音的選擇裝置的結(jié)構(gòu)圖一樣，所以這里僅對(duì)兩者的不同點(diǎn)進(jìn)行說(shuō)明，并且對(duì)于其他的基本的結(jié)構(gòu)、動(dòng)作加以省略。
本實(shí)施方式的對(duì)話控制/結(jié)果選擇單元1007和響應(yīng)生成單元1008與實(shí)施方式1的對(duì)應(yīng)部分具有不同的功能，而且，在本實(shí)施方式中，具有與對(duì)話控制/結(jié)果選擇單元1007和響應(yīng)生成單元1008連接的輸入等待時(shí)間設(shè)定單元1011。
與實(shí)施方式1一樣，在對(duì)話控制/結(jié)果選擇單元1007的控制下聲音識(shí)別單元106起動(dòng)時(shí)，響應(yīng)生成單元1008訪問(wèn)響應(yīng)聲音數(shù)據(jù)庫(kù)109，并且輸出對(duì)應(yīng)于選擇項(xiàng)目的聲音數(shù)據(jù)。
進(jìn)而，在對(duì)話控制/結(jié)果選擇單元1007中，判定對(duì)應(yīng)于選擇項(xiàng)目的聲音數(shù)據(jù)是否完成輸出。
對(duì)話控制/結(jié)果選擇單元1007的判定的結(jié)果，在確認(rèn)了聲音數(shù)據(jù)已被輸出時(shí)，通過(guò)設(shè)定用戶用于響應(yīng)的期間的輸入等待時(shí)間設(shè)定單元1011設(shè)定輸入等待時(shí)間。
在響應(yīng)生成單元1008中，在該輸入等待時(shí)間的期間，通過(guò)對(duì)話控制/結(jié)果選擇單元1007禁止其動(dòng)作。
接著，利用圖11和圖12對(duì)本實(shí)施方式的基于聲音的選擇裝置的動(dòng)作進(jìn)行說(shuō)明，但是由于到聲音識(shí)別的起動(dòng)為止(步驟201～步驟203)與實(shí)施方式1的動(dòng)作一樣，所以這里省略。
在步驟203中聲音識(shí)別單元106起動(dòng)時(shí)，接著，根據(jù)對(duì)話控制/結(jié)果選擇單元1007的控制，響應(yīng)生成單元1008訪問(wèn)響應(yīng)聲音數(shù)據(jù)庫(kù)109，并且輸出與第一個(gè)選擇項(xiàng)目對(duì)應(yīng)的聲音數(shù)據(jù)(步驟204)。
即，由此，例如如圖12所示，將“青鳉的學(xué)校?！钡囊龑?dǎo)聲音(303)輸出到揚(yáng)聲器101。
接著，對(duì)話控制/結(jié)果選擇單元1007進(jìn)行“青鳉的學(xué)校。”的引導(dǎo)聲音(303)的輸出是否已結(jié)束的判定。
判定的結(jié)果，引導(dǎo)聲音(303)的輸出結(jié)束的情況下，輸入等待時(shí)間設(shè)定單元1011在對(duì)話控制/結(jié)果選擇單元1007的控制下設(shè)定輸入等待時(shí)間1208B(步驟1109)。
于是，“青鳉的學(xué)校?！钡囊龑?dǎo)聲音(303)被輸出的期間308A，以及該輸出結(jié)束后的一定時(shí)間1208B成為可選擇作為第一個(gè)選擇項(xiàng)目的“青鳉的學(xué)?！钡臅r(shí)間1208。因此，如果在該期間1208用戶發(fā)出了指示選擇的語(yǔ)言，例如“就是它！”的語(yǔ)言的聲音，則可以選擇“青鳉的學(xué)校”。
對(duì)話控制/結(jié)果選擇單元1007在由輸入等待時(shí)間設(shè)定單元1011設(shè)定的輸入時(shí)間期間，禁止響應(yīng)生成單元1008的動(dòng)作，以便不通過(guò)響應(yīng)生成單元1008產(chǎn)生下一個(gè)引導(dǎo)聲音或者由于誤動(dòng)作產(chǎn)生引導(dǎo)聲音等。
是否禁止響應(yīng)生成單元1008的動(dòng)作，通過(guò)是否經(jīng)過(guò)了輸入等待時(shí)間設(shè)定單元1011設(shè)定的時(shí)間的判定來(lái)進(jìn)行。
接著，在可以選擇“青鳉的學(xué)?！钡钠陂g1208，用戶未發(fā)出選擇指示的語(yǔ)言，例如“就是它！”的語(yǔ)言的聲音的情況下，對(duì)選擇項(xiàng)目的計(jì)數(shù)器N加1，成為輸出對(duì)應(yīng)于下一個(gè)選擇項(xiàng)目的引導(dǎo)聲音的狀態(tài)。
即，在步驟204中輸出對(duì)應(yīng)于選擇項(xiàng)目的聲音時(shí)，在該選擇項(xiàng)目的提示中，或者提示結(jié)束以后，對(duì)話控制/結(jié)果選擇單元1007進(jìn)行在由步驟S1109設(shè)定的輸入等待時(shí)間的一定時(shí)間內(nèi)用戶是否發(fā)出了指示選擇的語(yǔ)言的聲音的判定(步驟1105)。
接著，在輸入等待時(shí)間中用戶發(fā)出了指示選擇的語(yǔ)言的聲音的情況下(步驟1105中的“是”的情況)，這里，例如雖然選擇了“青鳉的學(xué)?！?，但是沒(méi)有發(fā)出指示選擇的語(yǔ)言的聲音的情況下(步驟1105中的“否”的情況)，對(duì)選擇項(xiàng)目的計(jì)數(shù)器N加1(步驟1106)，成為輸出與下一個(gè)選擇項(xiàng)目對(duì)應(yīng)的聲音，即與第二個(gè)選擇項(xiàng)目對(duì)應(yīng)的引導(dǎo)聲音的狀態(tài)(步驟204)。
這時(shí)，在圖12中，對(duì)應(yīng)第二個(gè)或者第三個(gè)選擇項(xiàng)目，引導(dǎo)聲音(304或者305)輸出的期間309A或者310A，以及各個(gè)輸出結(jié)束后的各個(gè)一定時(shí)間1209B或者1210B成為可以選擇第二個(gè)或者第三個(gè)選擇項(xiàng)目的時(shí)間1209或1210。
這之后的處理與實(shí)施方式1的圖2所示的動(dòng)作一樣。
如上所述，在本實(shí)施方式中，通過(guò)具有輸入等待時(shí)間設(shè)定單元1011，可以等待用戶的響應(yīng)，并且積極地設(shè)定等待時(shí)間。
通過(guò)這樣積極地設(shè)定等待時(shí)間，下一個(gè)引導(dǎo)聲音不會(huì)在輸入等待時(shí)間內(nèi)被誤輸出，從而侵占輸入等待時(shí)間，可以一定確實(shí)地設(shè)置用戶的可響應(yīng)的期間。
本實(shí)施方式的具有輸入等待時(shí)間設(shè)定單元1011的結(jié)構(gòu)也可以應(yīng)用于上述實(shí)施方式2或?qū)嵤┓绞?的結(jié)構(gòu)，不用說(shuō)也可以得到與本實(shí)施方式一樣的動(dòng)作和效果。
而且，本發(fā)明也可以適當(dāng)?shù)亟M合上述各實(shí)施方式，例如，除了選擇項(xiàng)目的引導(dǎo)聲音，也可以通過(guò)將與其對(duì)應(yīng)的圖像和樂(lè)曲也作為選擇項(xiàng)目提示，通過(guò)在該提示的時(shí)間，或者提示結(jié)束后被設(shè)置的一定時(shí)間的輸入等待時(shí)間內(nèi)用戶發(fā)出選擇指示的語(yǔ)言的聲音，該用戶可以選擇希望的選擇項(xiàng)目。
產(chǎn)業(yè)上的可利用性本發(fā)明的基于聲音的選擇裝置具有以下結(jié)構(gòu)，即包括輸出單元，輸出用于引導(dǎo)選擇項(xiàng)目的引導(dǎo)聲音；聲音識(shí)別單元，對(duì)在由輸出單元輸出的引導(dǎo)聲音的輸出中或者在其輸出結(jié)束后一定時(shí)間內(nèi)發(fā)聲的、用于選擇選擇項(xiàng)目的選擇指示進(jìn)行識(shí)別；以及對(duì)話控制/結(jié)果選擇單元，在由聲音識(shí)別單元識(shí)別出選擇指示的情況下，選擇被選擇指示的選擇項(xiàng)目，可以廣泛地用于汽車音響、汽車空調(diào)等車載用電子設(shè)備，或者電子黑板、投影儀等電子事務(wù)設(shè)備、殘疾人用的家庭用電子設(shè)備等。
權(quán)利要求
1.一種基于聲音的選擇裝置，包括輸出單元，輸出用于引導(dǎo)選擇項(xiàng)目的引導(dǎo)聲音；聲音識(shí)別單元，對(duì)在由所述輸出單元輸出的所述引導(dǎo)聲音的輸出中或者在其輸出結(jié)束后一定時(shí)間內(nèi)發(fā)聲的、用于選擇所述選擇項(xiàng)目的選擇指示進(jìn)行識(shí)別；以及對(duì)話控制/結(jié)果選擇單元，在由所述聲音識(shí)別單元識(shí)別出所述選擇指示的情況下，選擇所述被選擇指示的選擇項(xiàng)目。
2.如權(quán)利要求1所述的基于聲音的選擇裝置，其特征在于，在由所述輸出單元輸出的所述引導(dǎo)聲音的輸出中或者在其輸出結(jié)束后一定時(shí)間內(nèi)選擇指示未被發(fā)聲的情況下，所述對(duì)話控制/結(jié)果選擇單元進(jìn)行控制，以便將用于引導(dǎo)所述選擇項(xiàng)目的下一個(gè)選擇項(xiàng)目的引導(dǎo)聲音輸出到所述輸出單元。
3.如權(quán)利要求1所述的基于聲音的選擇裝置，其特征在于，所述聲音識(shí)別單元包括聲音去除單元，從被輸入到所述聲音識(shí)別單元的聲音中減去由所述輸出單元輸出的所述引導(dǎo)聲音。
4.如權(quán)利要求1所述的基于聲音的選擇裝置，其特征在于，其中還包括樂(lè)曲再現(xiàn)單元，再現(xiàn)對(duì)應(yīng)于所述引導(dǎo)聲音的樂(lè)曲的一部分或者全部，所述聲音識(shí)別單元對(duì)在由所述樂(lè)曲再現(xiàn)單元再現(xiàn)所述樂(lè)曲期間或者再現(xiàn)結(jié)束后一定時(shí)間內(nèi)被輸入的選擇指示進(jìn)行聲音識(shí)別。
5.如權(quán)利要求1所述的基于聲音的選擇裝置，其特征在于，其中還包括生成對(duì)應(yīng)于所述引導(dǎo)聲音的圖像的圖像生成單元，所述圖像識(shí)別單元對(duì)在由所述圖像生成單元生成所述圖像期間或者生成后一定時(shí)間內(nèi)被輸入的選擇指示進(jìn)行聲音識(shí)別。
6.如權(quán)利要求1所述的基于聲音的選擇裝置，其特征在于，其中還包括輸入等待時(shí)間設(shè)定單元，在由所述輸出單元輸出的所述引導(dǎo)聲音的輸出中或者在其輸出結(jié)束后設(shè)定一定時(shí)間，所述聲音識(shí)別單元對(duì)在由所述輸入等待時(shí)間設(shè)定單元設(shè)定的所述一定時(shí)間內(nèi)被發(fā)聲的、用于選擇所述選擇項(xiàng)目的選擇指示進(jìn)行識(shí)別。
7.一種基于聲音的選擇方法，包括輸出步驟，輸出用于引導(dǎo)選擇項(xiàng)目的引導(dǎo)聲音；聲音識(shí)別步驟，對(duì)在所述輸出步驟中輸出的所述引導(dǎo)聲音的輸出中或者在其輸出結(jié)束后一定時(shí)間內(nèi)發(fā)聲的、用于選擇所述選擇項(xiàng)目的選擇指示進(jìn)行識(shí)別；以及對(duì)話控制/結(jié)果選擇步驟，在由所述聲音識(shí)別步驟識(shí)別出所述選擇指示的情況下，選擇所述被選擇指示的選擇項(xiàng)目。
全文摘要
通過(guò)具有輸出單元(101)，輸出用于引導(dǎo)選擇項(xiàng)目的引導(dǎo)聲音；聲音識(shí)別單元(106)，識(shí)別在由輸出單元(101)輸出的引導(dǎo)聲音的輸出中或者其輸出之后一定時(shí)間內(nèi)發(fā)聲的、用于選擇選擇項(xiàng)目的選擇指示；以及對(duì)話控制/結(jié)果選擇單元(107)，在由聲音識(shí)別單元(106)識(shí)別出選擇指示的情況下，選擇被選擇指示的選擇項(xiàng)目，通過(guò)在由輸出單元(101)輸出引導(dǎo)聲音期間，或者其輸出結(jié)束并經(jīng)過(guò)一定時(shí)間前發(fā)出用于選擇選擇項(xiàng)目的聲音，可以通過(guò)聲音識(shí)別單元(106)選擇該選擇項(xiàng)目，即使在引導(dǎo)聲音的輸出中也可以選擇選擇項(xiàng)目。
文檔編號(hào)G10L15/22GK1969315SQ20058001944
公開日2007年5月23日申請(qǐng)日期2005年12月20日優(yōu)先權(quán)日2004年12月21日
發(fā)明者野村和也申請(qǐng)人:松下電器產(chǎn)業(yè)株式會(huì)社

完整全部詳細(xì)技術(shù)資料下載