專利名稱:基于聲音的選擇裝置以及選擇方法
技術(shù)領(lǐng)域:
本發(fā)明涉及用于通過(guò)聲音選擇由系統(tǒng)提示的項(xiàng)目的基于聲音的選擇裝置、以及選擇方法。
背景技術(shù):
以往,作為基于聲音的選擇裝置,已知在通過(guò)聲音指定了控制對(duì)象后依次用聲音輸出并選擇控制內(nèi)容的選擇項(xiàng)目的技術(shù)(例如,特開平3-293400號(hào)公報(bào))。
按照特開平3-293400號(hào)公報(bào)中記載的技術(shù),可以控制開關(guān)而使聲音控制系統(tǒng)成為可動(dòng)作的狀態(tài),通過(guò)在該狀態(tài)下將成為控制對(duì)象的設(shè)備的名稱發(fā)聲來(lái)識(shí)別該名稱,該名稱的設(shè)備的控制項(xiàng)目依次通過(guò)聲音合成被發(fā)聲,在發(fā)聲了適當(dāng)?shù)目刂祈?xiàng)目的階段通過(guò)發(fā)聲為“是”,執(zhí)行與該項(xiàng)目相應(yīng)的控制。
而且,還已知以下技術(shù)(例如,特開平6-149534號(hào)公報(bào))利用投影儀將個(gè)人計(jì)算機(jī)的畫面設(shè)為大畫面來(lái)顯示,并基于該畫面,通過(guò)發(fā)聲在該畫面上顯示的項(xiàng)目來(lái)強(qiáng)調(diào)顯示該項(xiàng)目,如果操作執(zhí)行按鈕,則顯示該項(xiàng)目的細(xì)節(jié),可以進(jìn)行該項(xiàng)目的細(xì)節(jié)的監(jiān)視、控制。
但是,在特開平3-293400號(hào)公報(bào)和特開平6-149534號(hào)公報(bào)中記載的技術(shù)中,沒(méi)有提供具體地受理與系統(tǒng)提示的選擇項(xiàng)目重疊的用戶的聲音的方法,因此,在通常的聲音識(shí)別方法中,在通過(guò)合成聲音輸出選擇項(xiàng)目中難以進(jìn)行聲音識(shí)別,同時(shí)從系統(tǒng)提示的選擇項(xiàng)目的輸出方法也被限定于聲音,例如,存在不能通過(guò)聲音直接進(jìn)行音樂(lè)或圖像等的選擇的問(wèn)題。
發(fā)明內(nèi)容
本發(fā)明是處理這樣的以往的問(wèn)題而完成的,提供基于聲音的選擇裝置和選擇方法,即使在通過(guò)合成聲音輸出選擇項(xiàng)目中,將音樂(lè)或圖像等作為了選擇項(xiàng)目的情況下也可以進(jìn)行聲音識(shí)別。
本發(fā)明的基于聲音的選擇裝置具有以下結(jié)構(gòu),即包括輸出單元,輸出用于引導(dǎo)選擇項(xiàng)目的引導(dǎo)聲音;聲音識(shí)別單元,對(duì)在由所述輸出單元輸出的所述引導(dǎo)聲音的輸出中或者在其輸出結(jié)束后一定時(shí)間內(nèi)發(fā)聲的、用于選擇所述選擇項(xiàng)目的選擇指示進(jìn)行識(shí)別;以及對(duì)話控制/結(jié)果選擇單元,在由所述聲音識(shí)別單元識(shí)別出所述選擇指示的情況下,選擇所述被選擇指示的選擇項(xiàng)目。
通過(guò)該結(jié)構(gòu),可以通過(guò)在由輸出單元輸出引導(dǎo)聲音期間、該輸出結(jié)束并經(jīng)過(guò)一定時(shí)間前發(fā)出用于選擇選擇項(xiàng)目的聲音,由聲音識(shí)別單元選擇該選擇項(xiàng)目,即使在引導(dǎo)聲音的輸出中也可以選擇選擇項(xiàng)目。
而且,本發(fā)明的基于聲音的選擇裝置具有以下結(jié)構(gòu),即在由所述輸出單元輸出的所述引導(dǎo)聲音的輸出中或者在其輸出結(jié)束后一定時(shí)間內(nèi)選擇指示未被發(fā)聲的情況下,所述對(duì)話控制/結(jié)果選擇單元進(jìn)行控制,以便將用于引導(dǎo)所述選擇項(xiàng)目的下一個(gè)選擇項(xiàng)目的引導(dǎo)聲音輸出到所述輸出單元。
通過(guò)該結(jié)構(gòu),可以在未發(fā)出用于選擇選擇項(xiàng)目的聲音的情況下,不斷地在一定時(shí)間后輸出用于引導(dǎo)下一個(gè)選擇項(xiàng)目的引導(dǎo)聲音,在喜好的選擇項(xiàng)目中任意地發(fā)出選擇指示,并選擇該選擇項(xiàng)目。
而且,本發(fā)明的基于聲音的選擇裝置具有以下結(jié)構(gòu),即所述聲音識(shí)別單元包括聲音去除單元,從被輸入到所述聲音識(shí)別單元的聲音中減去由所述輸出單元輸出的所述引導(dǎo)聲音。
通過(guò)該結(jié)構(gòu),由輸出單元輸出的引導(dǎo)聲音被輸入聲音識(shí)別單元,可以盡量排除對(duì)聲音識(shí)別單元進(jìn)行的選擇指示的聲音識(shí)別產(chǎn)生障礙,即使在引導(dǎo)聲音輸出中也可以正確地識(shí)別選擇指示。
而且,本發(fā)明的基于聲音的選擇裝置具有以下結(jié)構(gòu),即其中還包括樂(lè)曲再現(xiàn)單元,再現(xiàn)對(duì)應(yīng)于所述引導(dǎo)聲音的樂(lè)曲的一部分或者全部,所述聲音識(shí)別單元對(duì)在由所述樂(lè)曲再現(xiàn)單元再現(xiàn)所述樂(lè)曲期間或者再現(xiàn)結(jié)束后一定時(shí)間內(nèi)被輸入的選擇指示進(jìn)行聲音識(shí)別。
通過(guò)該結(jié)構(gòu),僅通過(guò)在用于引導(dǎo)聲音的樂(lè)曲的再現(xiàn)中,或者在其之后一定時(shí)間內(nèi)發(fā)出用于選擇指示選擇項(xiàng)目的聲音,就可以選擇并聽取該樂(lè)曲。
而且,本發(fā)明的基于聲音的選擇裝置具有以下結(jié)構(gòu),即其中還包括生成對(duì)應(yīng)于所述引導(dǎo)聲音的圖像的圖像生成單元,所述圖像識(shí)別單元對(duì)在由所述圖像生成單元生成所述圖像期間或者生成后一定時(shí)間內(nèi)被輸入的選擇指示進(jìn)行聲音識(shí)別。
通過(guò)該結(jié)構(gòu),僅通過(guò)在生成并顯示對(duì)應(yīng)于引導(dǎo)聲音的圖像期間,或者在其之后一定時(shí)間內(nèi)發(fā)出用于選擇指示選擇項(xiàng)目的聲音,就可以選擇該圖像,例如,如果為靜止圖像,則可以原樣繼續(xù)觀看靜止圖像,如果是活動(dòng)圖像,則可以繼續(xù)該活動(dòng)畫面并觀看。
而且,本發(fā)明的基于聲音的選擇裝置具有以下結(jié)構(gòu),即其中還包括輸入等待時(shí)間設(shè)定單元,在由所述輸出單元輸出的所述引導(dǎo)聲音的輸出中或者在其輸出結(jié)束后設(shè)定一定時(shí)間,所述聲音識(shí)別單元對(duì)在由所述輸入等待時(shí)間設(shè)定單元設(shè)定的所述一定時(shí)間內(nèi)被發(fā)聲的、用于選擇所述選擇項(xiàng)目的選擇指示進(jìn)行識(shí)別。
通過(guò)該結(jié)構(gòu),可以通過(guò)在由輸出單元輸出引導(dǎo)聲音期間、或該輸出結(jié)束并經(jīng)過(guò)被設(shè)置的一定時(shí)間的輸入等待時(shí)間前發(fā)出用于選擇選擇項(xiàng)目的聲音,由聲音識(shí)別單元選擇該選擇項(xiàng)目,即使在引導(dǎo)聲音的輸出中也可以更確實(shí)地選擇選擇項(xiàng)目。
進(jìn)而,本發(fā)明的基于聲音的選擇方法具有以下結(jié)構(gòu),即包括輸出步驟,輸出用于引導(dǎo)選擇項(xiàng)目的引導(dǎo)聲音;聲音識(shí)別步驟,對(duì)在所述輸出步驟中輸出的所述引導(dǎo)聲音的輸出中或者在其輸出結(jié)束后一定時(shí)間內(nèi)發(fā)聲的、用于選擇所述選擇項(xiàng)目的選擇指示進(jìn)行識(shí)別;以及對(duì)話控制/結(jié)果選擇步驟,在由所述聲音識(shí)別步驟識(shí)別出所述選擇指示的情況下,選擇所述被選擇指示的選擇項(xiàng)目。
通過(guò)該結(jié)構(gòu),通過(guò)在輸出步驟中引導(dǎo)聲音被輸出期間、其輸出結(jié)束并在經(jīng)過(guò)一定期間之前發(fā)出用于選擇選擇項(xiàng)目的聲音,可以通過(guò)聲音識(shí)別步驟選擇該選擇項(xiàng)目,即使在引導(dǎo)聲音輸出中也可以選擇選擇項(xiàng)目。
如上所述,本發(fā)明的基于聲音的選擇裝置包括輸出單元,輸出用于引導(dǎo)選擇項(xiàng)目的引導(dǎo)聲音;聲音識(shí)別單元,對(duì)在由所述輸出單元輸出的所述引導(dǎo)聲音的輸出中或者在其輸出結(jié)束后一定時(shí)間內(nèi)發(fā)聲的、用于選擇所述選擇項(xiàng)目的選擇指示進(jìn)行識(shí)別;以及對(duì)話控制/結(jié)果選擇單元,在由所述聲音識(shí)別單元識(shí)別出所述選擇指示的情況下,選擇所述被選擇指示的選擇項(xiàng)目,通過(guò)在由輸出單元輸出引導(dǎo)聲音期間、該輸出結(jié)束并經(jīng)過(guò)一定時(shí)間前發(fā)出用于選擇選擇項(xiàng)目的聲音,由聲音識(shí)別單元選擇該選擇項(xiàng)目,即使在引導(dǎo)聲音的輸出中也可以選擇選擇項(xiàng)目。
而且,本發(fā)明的基于聲音的選擇方法具有以下步驟,即包括輸出步驟,輸出用于引導(dǎo)選擇項(xiàng)目的引導(dǎo)聲音;聲音識(shí)別步驟,對(duì)在所述輸出步驟中輸出的所述引導(dǎo)聲音的輸出中或者在其輸出結(jié)束后一定時(shí)間內(nèi)發(fā)聲的、用于選擇所述選擇項(xiàng)目的選擇指示進(jìn)行識(shí)別;以及對(duì)話控制/結(jié)果選擇步驟,在由所述聲音識(shí)別步驟識(shí)別出所述選擇指示的情況下,選擇所述被選擇指示的選擇項(xiàng)目,通過(guò)在輸出步驟中引導(dǎo)聲音被輸出期間、其輸出結(jié)束并在經(jīng)過(guò)一定期間之前發(fā)出用于選擇選擇項(xiàng)目的聲音,可以通過(guò)聲音識(shí)別步驟選擇該選擇項(xiàng)目,即使在引導(dǎo)聲音輸出中也可以選擇選擇項(xiàng)目。
本發(fā)明的基于聲音的選擇裝置包括輸出單元,輸出用于引導(dǎo)選擇項(xiàng)目的引導(dǎo)聲音;輸入等待時(shí)間設(shè)定單元,在由所述輸出單元輸出的所述引導(dǎo)聲音的輸出中或者在其輸出結(jié)束后設(shè)定一定時(shí)間;聲音識(shí)別單元,對(duì)在由所述輸入等待時(shí)間設(shè)定單元設(shè)定的所述一定時(shí)間內(nèi)被發(fā)聲的、用于選擇所述選擇項(xiàng)目的選擇指示進(jìn)行識(shí)別;以及對(duì)話控制/結(jié)果選擇單元,在由所述聲音識(shí)別單元識(shí)別出所述選擇指示的情況下,選擇所述被選擇指示的選擇項(xiàng)目,通過(guò)在由輸出單元輸出引導(dǎo)聲音期間、該輸出結(jié)束并經(jīng)過(guò)一定時(shí)間前發(fā)出用于選擇選擇項(xiàng)目的聲音,由聲音識(shí)別單元選擇該選擇項(xiàng)目,即使在引導(dǎo)聲音的輸出中也可以選擇選擇項(xiàng)目。
圖1是表示本發(fā)明的實(shí)施方式1中的基于聲音的選擇裝置的概略結(jié)構(gòu)的方框圖。
圖2是表示本發(fā)明的實(shí)施方式1中的基于聲音的選擇裝置的動(dòng)作的流程圖。
圖3是表示本發(fā)明的實(shí)施方式1中的基于聲音的選擇裝置的動(dòng)作的時(shí)序圖。
圖4是表示本發(fā)明的實(shí)施方式2中的基于聲音的選擇裝置的概略結(jié)構(gòu)的方框圖。
圖5是表示本發(fā)明的實(shí)施方式2中的基于聲音的選擇裝置的動(dòng)作的流程圖。
圖6是表示本發(fā)明的實(shí)施方式2中的基于聲音的選擇裝置的動(dòng)作的時(shí)序圖。
圖7是表示本發(fā)明的實(shí)施方式3中的基于聲音的選擇裝置的概略結(jié)構(gòu)的方框圖。
圖8是表示本發(fā)明的實(shí)施方式3中的基于聲音的選擇裝置的動(dòng)作的流程圖。
圖9是表示本發(fā)明的實(shí)施方式3中的基于聲音的選擇裝置的動(dòng)作的時(shí)序圖。
圖10是表示本發(fā)明的實(shí)施方式4中的基于聲音的選擇裝置的概略結(jié)構(gòu)的方框圖。
圖11是表示本發(fā)明的實(shí)施方式4中的基于聲音的選擇裝置的動(dòng)作的流程圖。
圖12是表示本發(fā)明的實(shí)施方式4中的基于聲音的選擇裝置的動(dòng)作的時(shí)序圖。
標(biāo)號(hào)說(shuō)明101 揚(yáng)聲器102 麥克風(fēng)103 系統(tǒng)聲音去除單元104 濾波器系數(shù)學(xué)習(xí)單元105 自自適應(yīng)濾波器單元106 聲音識(shí)別單元107,1007對(duì)話控制/結(jié)果選擇單元108,1008響應(yīng)生成單元109 響應(yīng)聲音數(shù)據(jù)庫(kù)110 減法器411 音樂(lè)再現(xiàn)單元412 音樂(lè)數(shù)據(jù)庫(kù)413 混頻器單元700 顯示器711 圖像生成單元712 圖像/活動(dòng)畫面數(shù)據(jù)庫(kù)1011 輸入等待時(shí)間設(shè)定單元具體實(shí)施方式
以下,參照附圖對(duì)本發(fā)明的實(shí)施方式進(jìn)行說(shuō)明。
(實(shí)施方式1)圖1是表示本發(fā)明的實(shí)施方式1中的基于聲音的選擇裝置的概略結(jié)構(gòu)的方框圖。
如圖1所示,本發(fā)明的實(shí)施方式1中的基于聲音的選擇裝置包括作為對(duì)用戶輸出作為引導(dǎo)的聲音或聲音響應(yīng)的系統(tǒng)側(cè)的聲音的輸出單元的揚(yáng)聲器(聲音輸出單元)101;將用戶發(fā)出的聲音變換為聲音信號(hào)的麥克風(fēng)102;作為將與揚(yáng)聲器101輸出的引導(dǎo)聲相當(dāng)?shù)妮敵鱿喈?dāng)信號(hào)從由麥克風(fēng)102輸出的聲音信號(hào)中去除的聲音去除單元的系統(tǒng)聲音去除單元103;根據(jù)從麥克風(fēng)102輸出的、通過(guò)系統(tǒng)聲音去除單元103去除重疊信號(hào)部分而得到的聲音信號(hào),識(shí)別用戶聲音的發(fā)話內(nèi)容的聲音識(shí)別單元106;根據(jù)由聲音識(shí)別單元106得到的用戶聲音的內(nèi)容選擇對(duì)應(yīng)的響應(yīng)聲音而控制與用戶的對(duì)話,同時(shí)選擇結(jié)果的對(duì)話控制/結(jié)果選擇單元107;存儲(chǔ)了響應(yīng)聲音數(shù)據(jù)的響應(yīng)聲音數(shù)據(jù)庫(kù)109;根據(jù)對(duì)話控制/結(jié)果選擇單元107的輸出,利用響應(yīng)聲音數(shù)據(jù)庫(kù)109的數(shù)據(jù)來(lái)生成用于輸出到揚(yáng)聲器101或系統(tǒng)聲音去除單元103的聲音響應(yīng)信號(hào)的響應(yīng)生成單元108。
系統(tǒng)聲音去除單元103包括濾波器系數(shù)學(xué)習(xí)單元104,根據(jù)從麥克風(fēng)102輸出的聲音信號(hào)和從響應(yīng)生成單元108輸出的響應(yīng)聲音信號(hào),例如一邊學(xué)習(xí)利用LMS(Least Mean Square)/牛頓算法得到的濾波器系數(shù)(脈沖響應(yīng)),一邊調(diào)整為最佳;自自適應(yīng)濾波器單元105,根據(jù)作為來(lái)自濾波器系數(shù)學(xué)習(xí)單元104的輸出的脈沖響應(yīng)校正并輸出響應(yīng)聲音信號(hào);以及減法器110,從麥克風(fēng)102輸出的聲音信號(hào)中減去由自適應(yīng)濾波器單元105輸出的輸出信號(hào)。
聲音識(shí)別單元106包括音響處理單元,對(duì)從麥克風(fēng)102輸出的、由系統(tǒng)聲音去除單元103減去了聲音響應(yīng)的相當(dāng)重疊部分的聲音信號(hào)進(jìn)行音響處理;音素識(shí)別單元,根據(jù)由音響處理單元得到的聲音的最小單位選出并識(shí)別最相似的音素候選;辭典數(shù)據(jù)庫(kù),存儲(chǔ)與聲音對(duì)話系統(tǒng)的利用目的關(guān)聯(lián)的單詞等;語(yǔ)言處理單元,根據(jù)在音素識(shí)別單元得到的音素和來(lái)自辭典數(shù)據(jù)庫(kù)的聲音數(shù)據(jù)選定單詞的候選,并執(zhí)行用于利用句子結(jié)構(gòu)、含義、文理等的語(yǔ)言信息得到正確的文章的語(yǔ)言處理。
而且,音響處理單元例如構(gòu)成為利用LPC倒頻譜(Linear PredictorCoefficient Cepstrum線性預(yù)測(cè)系數(shù)化倒頻譜)等,將從麥克風(fēng)102輸出的聲音信號(hào)變換為所謂特征量向量的時(shí)間系列的向量,并推測(cè)聲音頻譜的大概形狀(頻譜包絡(luò))。
而且,音素識(shí)別部例如構(gòu)成為利用HMM(Hidden Markov Model隱藏馬爾可夫模型)法等,根據(jù)輸入的聲音,利用由音響處理單元提取的音響參數(shù),進(jìn)行聲音信號(hào)的音素記號(hào)化,與預(yù)先準(zhǔn)備的標(biāo)準(zhǔn)音素模型比較,選出與其最相似的音素的候選。
另一方面,對(duì)話控制/結(jié)果選擇單元107根據(jù)由聲音識(shí)別單元106識(shí)別的聲音信號(hào)的內(nèi)容,選擇控制響應(yīng)內(nèi)容并將其輸出到響應(yīng)生成單元108,同時(shí)選擇輸出結(jié)果。
響應(yīng)生成單元108根據(jù)由對(duì)話控制/結(jié)果選擇單元107決定的內(nèi)容,利用來(lái)自響應(yīng)聲音數(shù)據(jù)庫(kù)109的數(shù)據(jù)來(lái)生成響應(yīng)聲音信號(hào),輸出到揚(yáng)聲器101。
接著,利用圖2、圖3詳細(xì)地說(shuō)明本發(fā)明的實(shí)施方式1中的基于聲音的選擇裝置的動(dòng)作。
而且,圖2是說(shuō)明本發(fā)明的實(shí)施方式1中的基于聲音的選擇裝置的動(dòng)作的流程圖,圖3是時(shí)序圖。
首先,在進(jìn)入選擇開始動(dòng)作時(shí),基于對(duì)話控制/結(jié)果選擇單元107的控制,選擇項(xiàng)目的計(jì)數(shù)器N被設(shè)為1(步驟201)。在選擇項(xiàng)目的計(jì)數(shù)器N被設(shè)為1時(shí),接著響應(yīng)生成單元108根據(jù)來(lái)自對(duì)話控制/結(jié)果選擇單元107的指令將引導(dǎo)聲音從響應(yīng)聲音數(shù)據(jù)庫(kù)109輸出到揚(yáng)聲器101(步驟202)。
例如,如圖3的時(shí)序圖所示那樣,將“請(qǐng)從下面中選擇希望的曲名?!蹦菢拥囊龑?dǎo)聲音(301)輸出到揚(yáng)聲器101。
如果引導(dǎo)聲音從揚(yáng)聲器101輸出,則接著進(jìn)行聲音識(shí)別的起動(dòng),以便可以對(duì)來(lái)自用戶的選擇指示進(jìn)行聲音識(shí)別(步驟203)。由此,聲音識(shí)別單元106如圖3所示那樣起動(dòng)(302)。
如果聲音識(shí)別單元106起動(dòng),則接著根據(jù)對(duì)話控制/結(jié)果選擇單元107的控制,響應(yīng)生成單元108訪問(wèn)響應(yīng)聲音數(shù)據(jù)庫(kù)109,輸出對(duì)應(yīng)于第一個(gè)選擇項(xiàng)目的聲音數(shù)據(jù)(步驟204)。
即,由此,例如如圖3所示那樣,將“青鳉的學(xué)校?!钡囊龑?dǎo)聲音(303)輸出到揚(yáng)聲器101。于是,“青鳉的學(xué)校?!钡囊龑?dǎo)聲音(303)被輸出的期間308A,以及在該輸出結(jié)束后的一定期間(輸入等待時(shí)間)308B成為可以選擇第一個(gè)選擇項(xiàng)目的“青鳉的學(xué)校”的時(shí)間308。隱藏,如果在該期間308用戶發(fā)出了指示選擇的語(yǔ)言,例如“就是它!”的語(yǔ)言,則可以選擇“青鳉的學(xué)校”。
在可以選擇“青鳉的學(xué)?!钡钠陂g308,如果用戶沒(méi)有發(fā)出進(jìn)行選擇指示的語(yǔ)言,例如“就是它!”的語(yǔ)言的情況下,選擇項(xiàng)目的計(jì)數(shù)器N中加1,成為輸出對(duì)應(yīng)于下一個(gè)選擇項(xiàng)目的引導(dǎo)聲音的狀態(tài)。
即,在輸出對(duì)應(yīng)于選擇項(xiàng)目的聲音時(shí)(步驟204),對(duì)話控制/結(jié)果選擇單元107執(zhí)行在該選擇項(xiàng)目的提示中或者提示結(jié)束后一定時(shí)間內(nèi)用戶是否發(fā)出了指示選擇的語(yǔ)言的聲音的判定(步驟205)。
在用戶進(jìn)行了選擇指示的情況下(步驟205中“是”的情況),此時(shí),例如雖然選擇了“青鳉的學(xué)?!?,但是未進(jìn)行選擇指示的情況下(步驟205中“否”的情況下),對(duì)選擇項(xiàng)目的計(jì)數(shù)器N加1(步驟206),成為輸出對(duì)應(yīng)于下一個(gè)選擇項(xiàng)目的聲音,即對(duì)應(yīng)于第二個(gè)選擇項(xiàng)目的引導(dǎo)聲音的狀態(tài)(步驟204)。
由此,響應(yīng)生成單元108訪問(wèn)響應(yīng)聲音數(shù)據(jù)庫(kù)109,將第二個(gè)引導(dǎo)聲音的例如“掃晴娘?!钡囊龑?dǎo)聲音(304)輸出到揚(yáng)聲器101。
這時(shí),在輸出“掃晴娘?!钡囊龑?dǎo)聲音(304)的期間309A,以及該輸出結(jié)束之后的一定時(shí)間(輸入等待時(shí)間)309B也成為可選擇第二個(gè)選擇項(xiàng)目的“掃晴娘”的期間309,在該期間309中如果用戶發(fā)出了選擇指示的語(yǔ)言,例如“就是它!”的語(yǔ)言的聲音,則可以選擇作為第二個(gè)選擇項(xiàng)目的“掃晴娘”。
在選擇項(xiàng)目提示中,或者在提示結(jié)束后一定時(shí)間內(nèi),用戶未發(fā)出指示選擇的語(yǔ)言,例如“就是它!”的聲音的情況下,該情況被對(duì)話控制/結(jié)果選擇單元107判定(步驟205),在該判定后,分支到“否”的路徑,與以前一樣,對(duì)選擇項(xiàng)目的計(jì)數(shù)器N加1(步驟206),輸出對(duì)應(yīng)于下面的第三個(gè)選擇項(xiàng)目的引導(dǎo)聲音(步驟204)。
然后,由此響應(yīng)生成單元108訪問(wèn)響應(yīng)聲音數(shù)據(jù)庫(kù)109,作為第三個(gè)引導(dǎo)聲音,例如將“閃閃的星?!钡囊龑?dǎo)聲音(305)輸出到揚(yáng)聲器101。
在第三個(gè)引導(dǎo)聲音“閃閃的星?!?305)被輸出期間310A,以及輸出結(jié)束后的一定期間(輸入等待時(shí)間)310B,為可以選擇作為第三個(gè)選擇項(xiàng)目的“閃閃的星”的時(shí)間310,在該期間310中,如果用戶發(fā)出了選擇指示的語(yǔ)言,例如“就是它!”的語(yǔ)言的聲音,則可以選擇作為第三個(gè)選擇項(xiàng)目的“閃閃的星”。
在圖3中,用戶為了對(duì)作為第三個(gè)選擇項(xiàng)目的“閃閃的星”進(jìn)行選擇指示,在第三個(gè)引導(dǎo)聲音“閃閃的星?!?305)被輸出期間,或者在其后的一定期間,發(fā)出用于選擇它的聲音,例如“就是它!”的指示聲音(306)。
這里,如果在輸出引導(dǎo)聲音“閃閃的星?!?305)期間,用戶發(fā)出了“就是它!”的指示聲音(306),則引導(dǎo)聲音“閃閃的星”(305)和“就是它!”(306)的指示聲音重疊地被輸入到麥克風(fēng)102,但是通過(guò)系統(tǒng)聲音去除單元103將與引導(dǎo)聲音相當(dāng)部分的信號(hào),即“閃閃的星”(305)的聲音相當(dāng)?shù)牟糠值男盘?hào)從輸入到麥克風(fēng)102的信號(hào)中去除,在聲音識(shí)別單元106中可以正確地識(shí)別用戶發(fā)聲的指示聲音“就是它!”(306)。
在圖2中,在選擇項(xiàng)目提示中,或者在提示結(jié)束后一定時(shí)間內(nèi)用戶發(fā)出了選擇指示的語(yǔ)言,例如“就是它!”的語(yǔ)言的聲音的情況下,它被聲音識(shí)別單元106識(shí)別,在對(duì)話控制/結(jié)果選擇單元107被判定(步驟205),分支到“是”的路徑。
在分支到“是”的路徑時(shí),進(jìn)行聲音識(shí)別從而結(jié)束該聲音識(shí)別(步驟207),選擇這時(shí)的選擇項(xiàng)目(步驟208),以后,根據(jù)被選擇的結(jié)果,例如“閃閃的星”,對(duì)話控制/結(jié)果選擇單元107進(jìn)行對(duì)話控制。
而且,雖然未圖示,但是構(gòu)成為在最后的選擇項(xiàng)目被提示的階段,在雖然經(jīng)過(guò)一定時(shí)間,但未從用戶發(fā)出選擇指示的語(yǔ)言的聲音的情況下,從揚(yáng)聲器101進(jìn)行超時(shí)的警告,結(jié)束聲音識(shí)別而中止選擇。
如上所述,按照本發(fā)明的實(shí)施方式1,在系統(tǒng)基于聲音提示選擇項(xiàng)目的期間,或者提示結(jié)束后被設(shè)置的輸入等待時(shí)間內(nèi),用戶發(fā)出了進(jìn)行選擇指示的語(yǔ)言的聲音的情況下,可以選擇發(fā)出了該選擇指示的語(yǔ)言的階段的選擇項(xiàng)目。
(實(shí)施方式2)圖4是表示本發(fā)明的實(shí)施方式2中的基于聲音的選擇裝置的概略結(jié)構(gòu)的方框圖,圖5是說(shuō)明該裝置的動(dòng)作的流程圖,圖6是說(shuō)明該裝置的動(dòng)作的時(shí)序圖。
而且,在圖4~圖6中,賦予與圖1~圖3所示的實(shí)施方式1相同標(biāo)號(hào)、號(hào)碼等的部分表示與圖1~圖3所示的實(shí)施方式1相同的結(jié)構(gòu)、相同的內(nèi)容的部分,這里省略其詳細(xì)的說(shuō)明。
在本實(shí)施方式中,除了實(shí)施方式1的結(jié)構(gòu),還具有由對(duì)話控制/結(jié)果選擇單元107的指令控制的音樂(lè)再現(xiàn)單元411;以及存儲(chǔ)多個(gè)音樂(lè)的音樂(lè)數(shù)據(jù)庫(kù)412。
音樂(lè)再現(xiàn)單元411被構(gòu)成為通過(guò)來(lái)自對(duì)話控制/結(jié)果選擇單元107的指令訪問(wèn)音樂(lè)數(shù)據(jù)庫(kù)412,并且再現(xiàn)在對(duì)話控制/結(jié)果選擇單元107中指示的音樂(lè)。然后,由音樂(lè)再現(xiàn)單元411再現(xiàn)的音樂(lè)經(jīng)由混頻器單元413與來(lái)自響應(yīng)生成單元108的輸出一起輸出到揚(yáng)聲器101。
在圖6中,基于音樂(lè)輸出的引導(dǎo)音樂(lè)603~605分別對(duì)應(yīng)于圖3的引導(dǎo)聲音303~305。
因此,按照本實(shí)施方式,如圖5、圖6所示,不僅輸出作為選擇項(xiàng)目的引導(dǎo)聲音,而且還同時(shí)輸出對(duì)應(yīng)于該選擇項(xiàng)目的音樂(lè)及其本身,在選擇音樂(lè)的情況下更方便。
即,按照本實(shí)施方式,在實(shí)施方式1中,輸出對(duì)應(yīng)于第N個(gè)選擇項(xiàng)目的引導(dǎo)聲音的步驟204變?yōu)檩敵鰧?duì)應(yīng)于第N個(gè)選擇項(xiàng)目的音樂(lè)的步驟504,在該步驟504中,如果依次輸出對(duì)應(yīng)于第N個(gè)選擇項(xiàng)目的引導(dǎo)聲音和對(duì)應(yīng)于第N個(gè)選擇項(xiàng)目的音樂(lè)兩者,則首先曲名被輸出,接著音樂(lè)被輸出,所以在選擇音樂(lè)的情況下變得更方便。
而且,這里,為選擇而輸出的音樂(lè)也可以不是音樂(lè)全部(一個(gè)樂(lè)曲全體),例如,僅序曲或者副曲(サビ)部分就足夠。于是,不論為選擇而輸出的音樂(lè)全部或者僅序曲或副曲部分,在為選擇而輸出的音樂(lè)已被選擇的情況下,通過(guò)音樂(lè)再現(xiàn)單元411,可以原樣繼續(xù)并輸出該音樂(lè),也可以暫時(shí)返回音樂(lè)的最初后輸出。
這樣,按照本實(shí)施方式,將音樂(lè)作為選擇項(xiàng)目提示,并且如果在該期間,或者提示結(jié)束后一定時(shí)間內(nèi)用戶發(fā)出選擇指示的語(yǔ)言的聲音,則可以容易地選擇該用戶希望的音樂(lè)。
(實(shí)施方式3)圖7是表示本發(fā)明的實(shí)施方式2中的基于聲音的選擇裝置的概略結(jié)構(gòu)的方框圖,圖8是說(shuō)明該裝置的動(dòng)作的流程圖,圖9是說(shuō)明該裝置的動(dòng)作的時(shí)序圖。
而且,在圖7~圖9中,賦予與圖1~圖3所示的實(shí)施方式1相同標(biāo)號(hào)、號(hào)碼等的部分表示與圖1~圖3所示的實(shí)施方式1相同的結(jié)構(gòu)、相同的內(nèi)容的部分,這里省略其詳細(xì)的說(shuō)明。
在本實(shí)施方式中,除了實(shí)施方式1的結(jié)構(gòu),還包括由對(duì)話控制/結(jié)果選擇單元107的指令控制的圖像生成單元711;存儲(chǔ)多個(gè)靜止畫面、活動(dòng)畫面等的圖像的圖像/活動(dòng)畫面數(shù)據(jù)庫(kù)712;以及顯示由圖像生成單元711生成的圖像的顯示器700。
圖像生成單元711被構(gòu)成為通過(guò)來(lái)自對(duì)話控制/結(jié)果選擇單元107的指示訪問(wèn)圖像/活動(dòng)畫面數(shù)據(jù)庫(kù)712,并輸出在對(duì)話控制/結(jié)果選擇單元107中指示的靜止畫面、活動(dòng)畫面等圖像數(shù)據(jù),并且生成圖像。然后,圖像生成單元711生成的圖像被顯示在顯示器700中。
在圖9中,基于聲音輸出的引導(dǎo)聲音901、基于對(duì)顯示器的顯示的引導(dǎo)圖像903~905分別對(duì)應(yīng)于圖3的引導(dǎo)聲音301、303~305。
因此,按照本實(shí)施方式,如圖8、圖9所示,不僅輸出成為選擇項(xiàng)目的引導(dǎo)聲音,而且還同時(shí)在顯示器700上顯示對(duì)應(yīng)于該選擇項(xiàng)目的圖像,在選擇選擇項(xiàng)目時(shí)更方便。
即,按照本實(shí)施方式,在實(shí)施方式1中,輸出對(duì)應(yīng)于第N個(gè)選擇項(xiàng)目的引導(dǎo)聲音的步驟204變?yōu)檩敵鰧?duì)應(yīng)于第N個(gè)選擇項(xiàng)目的圖像的步驟804,在該步驟804中,輸出對(duì)應(yīng)于第N個(gè)選擇項(xiàng)目的引導(dǎo)聲音和對(duì)應(yīng)于第N個(gè)選擇項(xiàng)目的圖像兩者,前者從揚(yáng)聲器101作為聲音,后者在顯示器700中作為圖像或者活動(dòng)畫面被顯示。因此,以它們?yōu)榛A(chǔ),可以更容易地選擇選擇項(xiàng)目。
而且,在為選擇而輸出的圖像為活動(dòng)畫面時(shí),也可以不是該活動(dòng)畫面的全部,例如,僅最初的或者子畫面的一定時(shí)間就足夠。于是,無(wú)論為選擇而輸出的圖像的全部還是僅一定時(shí)間,在為選擇而輸出的圖像已被選擇的情況下,都可以通過(guò)圖像生成單元711原樣繼續(xù)并顯示該圖像,也可以暫時(shí)返回活動(dòng)畫面的最初后顯示。
這樣,按照本實(shí)施方式,除了選擇項(xiàng)目的引導(dǎo)聲音,還將與其對(duì)應(yīng)的圖像也作為選擇項(xiàng)目進(jìn)行提示,并且如果在該提示的時(shí)間或者提示結(jié)束后一定時(shí)間內(nèi)用戶發(fā)出了選擇指示的語(yǔ)言的聲音,則可以選擇該用戶希望的選擇項(xiàng)目,所以,例如具有繪畫或電影等圖像本身很好,在音樂(lè)的情況下,通過(guò)提示護(hù)封(jacket)的圖像,也可以更容易地選擇音樂(lè)的效果。
(實(shí)施方式4)在上述各實(shí)施方式中,例如如圖3所示,沒(méi)有積極地設(shè)置用于選擇的時(shí)間308B、309B等的結(jié)構(gòu),但是利用圖10至圖12對(duì)具有設(shè)置用于該選擇的時(shí)間308B、309B等的輸入等待時(shí)間設(shè)定單元的基于聲音的選擇裝置進(jìn)行說(shuō)明。
通過(guò)具有該輸入等待時(shí)間設(shè)定單元,可以更確實(shí)地進(jìn)行聲音識(shí)別。
圖10是表示本發(fā)明的實(shí)施方式4中的基于聲音的選擇裝置的概略結(jié)構(gòu)的方框圖,圖11是說(shuō)明該裝置的動(dòng)作的流程圖,圖12是說(shuō)明該裝置的動(dòng)作的時(shí)序圖。
在圖10中,由于本實(shí)施方式的基本的結(jié)構(gòu)與上述實(shí)施方式1記載的基于聲音的選擇裝置的結(jié)構(gòu)圖一樣,所以這里僅對(duì)兩者的不同點(diǎn)進(jìn)行說(shuō)明,并且對(duì)于其他的基本的結(jié)構(gòu)、動(dòng)作加以省略。
本實(shí)施方式的對(duì)話控制/結(jié)果選擇單元1007和響應(yīng)生成單元1008與實(shí)施方式1的對(duì)應(yīng)部分具有不同的功能,而且,在本實(shí)施方式中,具有與對(duì)話控制/結(jié)果選擇單元1007和響應(yīng)生成單元1008連接的輸入等待時(shí)間設(shè)定單元1011。
與實(shí)施方式1一樣,在對(duì)話控制/結(jié)果選擇單元1007的控制下聲音識(shí)別單元106起動(dòng)時(shí),響應(yīng)生成單元1008訪問(wèn)響應(yīng)聲音數(shù)據(jù)庫(kù)109,并且輸出對(duì)應(yīng)于選擇項(xiàng)目的聲音數(shù)據(jù)。
進(jìn)而,在對(duì)話控制/結(jié)果選擇單元1007中,判定對(duì)應(yīng)于選擇項(xiàng)目的聲音數(shù)據(jù)是否完成輸出。
對(duì)話控制/結(jié)果選擇單元1007的判定的結(jié)果,在確認(rèn)了聲音數(shù)據(jù)已被輸出時(shí),通過(guò)設(shè)定用戶用于響應(yīng)的期間的輸入等待時(shí)間設(shè)定單元1011設(shè)定輸入等待時(shí)間。
在響應(yīng)生成單元1008中,在該輸入等待時(shí)間的期間,通過(guò)對(duì)話控制/結(jié)果選擇單元1007禁止其動(dòng)作。
接著,利用圖11和圖12對(duì)本實(shí)施方式的基于聲音的選擇裝置的動(dòng)作進(jìn)行說(shuō)明,但是由于到聲音識(shí)別的起動(dòng)為止(步驟201~步驟203)與實(shí)施方式1的動(dòng)作一樣,所以這里省略。
在步驟203中聲音識(shí)別單元106起動(dòng)時(shí),接著,根據(jù)對(duì)話控制/結(jié)果選擇單元1007的控制,響應(yīng)生成單元1008訪問(wèn)響應(yīng)聲音數(shù)據(jù)庫(kù)109,并且輸出與第一個(gè)選擇項(xiàng)目對(duì)應(yīng)的聲音數(shù)據(jù)(步驟204)。
即,由此,例如如圖12所示,將“青鳉的學(xué)校?!钡囊龑?dǎo)聲音(303)輸出到揚(yáng)聲器101。
接著,對(duì)話控制/結(jié)果選擇單元1007進(jìn)行“青鳉的學(xué)校。”的引導(dǎo)聲音(303)的輸出是否已結(jié)束的判定。
判定的結(jié)果,引導(dǎo)聲音(303)的輸出結(jié)束的情況下,輸入等待時(shí)間設(shè)定單元1011在對(duì)話控制/結(jié)果選擇單元1007的控制下設(shè)定輸入等待時(shí)間1208B(步驟1109)。
于是,“青鳉的學(xué)校?!钡囊龑?dǎo)聲音(303)被輸出的期間308A,以及該輸出結(jié)束后的一定時(shí)間1208B成為可選擇作為第一個(gè)選擇項(xiàng)目的“青鳉的學(xué)?!钡臅r(shí)間1208。因此,如果在該期間1208用戶發(fā)出了指示選擇的語(yǔ)言,例如“就是它!”的語(yǔ)言的聲音,則可以選擇“青鳉的學(xué)校”。
對(duì)話控制/結(jié)果選擇單元1007在由輸入等待時(shí)間設(shè)定單元1011設(shè)定的輸入時(shí)間期間,禁止響應(yīng)生成單元1008的動(dòng)作,以便不通過(guò)響應(yīng)生成單元1008產(chǎn)生下一個(gè)引導(dǎo)聲音或者由于誤動(dòng)作產(chǎn)生引導(dǎo)聲音等。
是否禁止響應(yīng)生成單元1008的動(dòng)作,通過(guò)是否經(jīng)過(guò)了輸入等待時(shí)間設(shè)定單元1011設(shè)定的時(shí)間的判定來(lái)進(jìn)行。
接著,在可以選擇“青鳉的學(xué)?!钡钠陂g1208,用戶未發(fā)出選擇指示的語(yǔ)言,例如“就是它!”的語(yǔ)言的聲音的情況下,對(duì)選擇項(xiàng)目的計(jì)數(shù)器N加1,成為輸出對(duì)應(yīng)于下一個(gè)選擇項(xiàng)目的引導(dǎo)聲音的狀態(tài)。
即,在步驟204中輸出對(duì)應(yīng)于選擇項(xiàng)目的聲音時(shí),在該選擇項(xiàng)目的提示中,或者提示結(jié)束以后,對(duì)話控制/結(jié)果選擇單元1007進(jìn)行在由步驟S1109設(shè)定的輸入等待時(shí)間的一定時(shí)間內(nèi)用戶是否發(fā)出了指示選擇的語(yǔ)言的聲音的判定(步驟1105)。
接著,在輸入等待時(shí)間中用戶發(fā)出了指示選擇的語(yǔ)言的聲音的情況下(步驟1105中的“是”的情況),這里,例如雖然選擇了“青鳉的學(xué)?!?,但是沒(méi)有發(fā)出指示選擇的語(yǔ)言的聲音的情況下(步驟1105中的“否”的情況),對(duì)選擇項(xiàng)目的計(jì)數(shù)器N加1(步驟1106),成為輸出與下一個(gè)選擇項(xiàng)目對(duì)應(yīng)的聲音,即與第二個(gè)選擇項(xiàng)目對(duì)應(yīng)的引導(dǎo)聲音的狀態(tài)(步驟204)。
這時(shí),在圖12中,對(duì)應(yīng)第二個(gè)或者第三個(gè)選擇項(xiàng)目,引導(dǎo)聲音(304或者305)輸出的期間309A或者310A,以及各個(gè)輸出結(jié)束后的各個(gè)一定時(shí)間1209B或者1210B成為可以選擇第二個(gè)或者第三個(gè)選擇項(xiàng)目的時(shí)間1209或1210。
這之后的處理與實(shí)施方式1的圖2所示的動(dòng)作一樣。
如上所述,在本實(shí)施方式中,通過(guò)具有輸入等待時(shí)間設(shè)定單元1011,可以等待用戶的響應(yīng),并且積極地設(shè)定等待時(shí)間。
通過(guò)這樣積極地設(shè)定等待時(shí)間,下一個(gè)引導(dǎo)聲音不會(huì)在輸入等待時(shí)間內(nèi)被誤輸出,從而侵占輸入等待時(shí)間,可以一定確實(shí)地設(shè)置用戶的可響應(yīng)的期間。
本實(shí)施方式的具有輸入等待時(shí)間設(shè)定單元1011的結(jié)構(gòu)也可以應(yīng)用于上述實(shí)施方式2或?qū)嵤┓绞?的結(jié)構(gòu),不用說(shuō)也可以得到與本實(shí)施方式一樣的動(dòng)作和效果。
而且,本發(fā)明也可以適當(dāng)?shù)亟M合上述各實(shí)施方式,例如,除了選擇項(xiàng)目的引導(dǎo)聲音,也可以通過(guò)將與其對(duì)應(yīng)的圖像和樂(lè)曲也作為選擇項(xiàng)目提示,通過(guò)在該提示的時(shí)間,或者提示結(jié)束后被設(shè)置的一定時(shí)間的輸入等待時(shí)間內(nèi)用戶發(fā)出選擇指示的語(yǔ)言的聲音,該用戶可以選擇希望的選擇項(xiàng)目。
產(chǎn)業(yè)上的可利用性本發(fā)明的基于聲音的選擇裝置具有以下結(jié)構(gòu),即包括輸出單元,輸出用于引導(dǎo)選擇項(xiàng)目的引導(dǎo)聲音;聲音識(shí)別單元,對(duì)在由輸出單元輸出的引導(dǎo)聲音的輸出中或者在其輸出結(jié)束后一定時(shí)間內(nèi)發(fā)聲的、用于選擇選擇項(xiàng)目的選擇指示進(jìn)行識(shí)別;以及對(duì)話控制/結(jié)果選擇單元,在由聲音識(shí)別單元識(shí)別出選擇指示的情況下,選擇被選擇指示的選擇項(xiàng)目,可以廣泛地用于汽車音響、汽車空調(diào)等車載用電子設(shè)備,或者電子黑板、投影儀等電子事務(wù)設(shè)備、殘疾人用的家庭用電子設(shè)備等。
權(quán)利要求
1.一種基于聲音的選擇裝置,包括輸出單元,輸出用于引導(dǎo)選擇項(xiàng)目的引導(dǎo)聲音;聲音識(shí)別單元,對(duì)在由所述輸出單元輸出的所述引導(dǎo)聲音的輸出中或者在其輸出結(jié)束后一定時(shí)間內(nèi)發(fā)聲的、用于選擇所述選擇項(xiàng)目的選擇指示進(jìn)行識(shí)別;以及對(duì)話控制/結(jié)果選擇單元,在由所述聲音識(shí)別單元識(shí)別出所述選擇指示的情況下,選擇所述被選擇指示的選擇項(xiàng)目。
2.如權(quán)利要求1所述的基于聲音的選擇裝置,其特征在于,在由所述輸出單元輸出的所述引導(dǎo)聲音的輸出中或者在其輸出結(jié)束后一定時(shí)間內(nèi)選擇指示未被發(fā)聲的情況下,所述對(duì)話控制/結(jié)果選擇單元進(jìn)行控制,以便將用于引導(dǎo)所述選擇項(xiàng)目的下一個(gè)選擇項(xiàng)目的引導(dǎo)聲音輸出到所述輸出單元。
3.如權(quán)利要求1所述的基于聲音的選擇裝置,其特征在于,所述聲音識(shí)別單元包括聲音去除單元,從被輸入到所述聲音識(shí)別單元的聲音中減去由所述輸出單元輸出的所述引導(dǎo)聲音。
4.如權(quán)利要求1所述的基于聲音的選擇裝置,其特征在于,其中還包括樂(lè)曲再現(xiàn)單元,再現(xiàn)對(duì)應(yīng)于所述引導(dǎo)聲音的樂(lè)曲的一部分或者全部,所述聲音識(shí)別單元對(duì)在由所述樂(lè)曲再現(xiàn)單元再現(xiàn)所述樂(lè)曲期間或者再現(xiàn)結(jié)束后一定時(shí)間內(nèi)被輸入的選擇指示進(jìn)行聲音識(shí)別。
5.如權(quán)利要求1所述的基于聲音的選擇裝置,其特征在于,其中還包括生成對(duì)應(yīng)于所述引導(dǎo)聲音的圖像的圖像生成單元,所述圖像識(shí)別單元對(duì)在由所述圖像生成單元生成所述圖像期間或者生成后一定時(shí)間內(nèi)被輸入的選擇指示進(jìn)行聲音識(shí)別。
6.如權(quán)利要求1所述的基于聲音的選擇裝置,其特征在于,其中還包括輸入等待時(shí)間設(shè)定單元,在由所述輸出單元輸出的所述引導(dǎo)聲音的輸出中或者在其輸出結(jié)束后設(shè)定一定時(shí)間,所述聲音識(shí)別單元對(duì)在由所述輸入等待時(shí)間設(shè)定單元設(shè)定的所述一定時(shí)間內(nèi)被發(fā)聲的、用于選擇所述選擇項(xiàng)目的選擇指示進(jìn)行識(shí)別。
7.一種基于聲音的選擇方法,包括輸出步驟,輸出用于引導(dǎo)選擇項(xiàng)目的引導(dǎo)聲音;聲音識(shí)別步驟,對(duì)在所述輸出步驟中輸出的所述引導(dǎo)聲音的輸出中或者在其輸出結(jié)束后一定時(shí)間內(nèi)發(fā)聲的、用于選擇所述選擇項(xiàng)目的選擇指示進(jìn)行識(shí)別;以及對(duì)話控制/結(jié)果選擇步驟,在由所述聲音識(shí)別步驟識(shí)別出所述選擇指示的情況下,選擇所述被選擇指示的選擇項(xiàng)目。
全文摘要
通過(guò)具有輸出單元(101),輸出用于引導(dǎo)選擇項(xiàng)目的引導(dǎo)聲音;聲音識(shí)別單元(106),識(shí)別在由輸出單元(101)輸出的引導(dǎo)聲音的輸出中或者其輸出之后一定時(shí)間內(nèi)發(fā)聲的、用于選擇選擇項(xiàng)目的選擇指示;以及對(duì)話控制/結(jié)果選擇單元(107),在由聲音識(shí)別單元(106)識(shí)別出選擇指示的情況下,選擇被選擇指示的選擇項(xiàng)目,通過(guò)在由輸出單元(101)輸出引導(dǎo)聲音期間,或者其輸出結(jié)束并經(jīng)過(guò)一定時(shí)間前發(fā)出用于選擇選擇項(xiàng)目的聲音,可以通過(guò)聲音識(shí)別單元(106)選擇該選擇項(xiàng)目,即使在引導(dǎo)聲音的輸出中也可以選擇選擇項(xiàng)目。
文檔編號(hào)G10L15/22GK1969315SQ20058001944
公開日2007年5月23日 申請(qǐng)日期2005年12月20日 優(yōu)先權(quán)日2004年12月21日
發(fā)明者野村和也 申請(qǐng)人:松下電器產(chǎn)業(yè)株式會(huì)社