語音識別裝置制造方法
【專利摘要】根據(jù)本發(fā)明的語音識別裝置,對于由語音識別部從用戶的語音內(nèi)容中提取出的關(guān)鍵字,將根據(jù)用戶的操作來進(jìn)行顯示的內(nèi)容和次數(shù)作為歷史信息進(jìn)行存儲,通過判定是否進(jìn)行了規(guī)定次數(shù)以上的相同操作以及顯示來設(shè)定檢索等級,由此能夠在下一次提取出相同的關(guān)鍵字時,立即提示出用戶所要求的等級的信息,能夠始終高效地提供用戶所需的詳細(xì)信息,從而提高了用戶的便利性。
【專利說明】
語音識別裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及對用戶所說出的語音進(jìn)行識別并檢索信息的語音識別裝置。
【背景技術(shù)】
[0002]在搭載于車載導(dǎo)航系統(tǒng)等的語音識別功能中,通常搭乘者(用戶)會向系統(tǒng)明確表示(指示)發(fā)話的開始。為此,會在觸摸面板上顯示、或在方向盤上設(shè)置指示語音識別開始的按鈕(以下記為“語音識別開始指示部”)。接著,在語音識別開始指示部被搭乘者(用戶)按下之后,對所說出的語音進(jìn)行識別。即,語音識別開始指示部輸出語音識別開始信號,若語音識別部接受該信號,則在接受該信號之后從由語音獲取部獲取的音頻數(shù)據(jù)中檢測出與搭乘者(用戶)所說的內(nèi)容相應(yīng)的音頻區(qū)間,由此來進(jìn)行語音識別處理。
[0003]然而,也存在即使沒有來自搭乘者(用戶)的語音識別開始指示,也始終對搭乘者(用戶)所說的內(nèi)容進(jìn)行識別的語音識別裝置。即,語音識別部即使沒有接受語音識別開始信號,也反復(fù)進(jìn)行以下處理,即:從語音獲取部所獲取的音頻數(shù)據(jù)中檢測出與搭乘者(用戶)所說的內(nèi)容相應(yīng)的音頻區(qū)間,提取出該音頻區(qū)間的音頻數(shù)據(jù)的特征量,并基于該特征量使用識別詞典來進(jìn)行識別處理,從而輸出語音識別結(jié)果的字符串?;蛘撸谠撟址畞頇z索數(shù)據(jù)庫,并顯示檢索結(jié)果。
[0004]例如在專利文獻(xiàn)I中,公開了下述語音識別裝置,在該語音識別裝置中,始終輸入用戶所說出的語音來進(jìn)行語音識別,并顯示該識別結(jié)果,然后用戶利用操作按鈕來進(jìn)行確定操作,由此執(zhí)行基于識別結(jié)果的處理。
現(xiàn)有技術(shù)文獻(xiàn)專利文獻(xiàn)
[0005]專利文獻(xiàn)1:
日本專利特開2008-14818號公報
【發(fā)明內(nèi)容】
發(fā)明所要解決的技術(shù)問題
[0006]然而,在例如專利文獻(xiàn)I這樣的現(xiàn)有語音識別裝置中,存在以下問題,即:在識別出相同語音的情況下,始終僅顯示同一等級的檢索結(jié)果。即存在下述問題:例如,當(dāng)用戶說出“加油站”時,始終僅顯示附近的加油站的站名和位置,用戶為了獲知每個加油站的價格,每次都必須另外進(jìn)行規(guī)定的操作。
[0007]本發(fā)明是為了解決上述問題而完成的,其目的在于提供一種語音識別裝置,該語音識別裝置能夠立即示出用戶所要求的等級的信息。
解決技術(shù)問題所采用的技術(shù)方案
[0008]為實(shí)現(xiàn)上述目的,本發(fā)明的語音識別裝置的特征在于,包括:語音獲取部,該語音獲取部檢測并獲取用戶所說出的語音;語音識別部,該語音識別部對由所述語音獲取部獲取到的音頻數(shù)據(jù)進(jìn)行識別,并提取出關(guān)鍵字;操作輸入部,該操作輸入部接受來自所述用戶的操作輸入;顯示部,該顯示部向所述用戶提示信息;操作應(yīng)答解析部,該操作應(yīng)答解析部基于由所述操作輸入部接受到的信息和所述顯示部所顯示的信息,確定所述用戶的操作;操作顯示歷史存儲部,該操作顯示歷史存儲部對于由所述語音識別部提取出的每個關(guān)鍵字,將根據(jù)由所述操作應(yīng)答解析部所確定的操作而顯示在所述顯示部的顯示內(nèi)容及其顯示次數(shù)作為歷史信息進(jìn)行存儲;檢索等級設(shè)定部,該檢索等級設(shè)定部根據(jù)所述操作顯示歷史存儲部所存儲的歷史信息,設(shè)定由所述語音識別部提取出的關(guān)鍵字的檢索等級;信息檢索控制部,該信息檢索控制部根據(jù)由所述檢索等級設(shè)定部所設(shè)定的檢索等級,將由所述語音識別部提取出的關(guān)鍵字作為檢索關(guān)鍵詞來檢索信息,并獲得檢索結(jié)果;以及信息提示控制部,該信息提示控制部指示所述顯示部顯示由所述信息檢索控制部所獲取的檢索結(jié)果,所述檢索等級設(shè)定部對于由所述語音識別部提取出的關(guān)鍵字,當(dāng)所述操作顯示歷史存儲部所存儲的歷史信息中的顯示次數(shù)為規(guī)定次數(shù)以上時,改變所述檢索等級。
發(fā)明效果
[0009]根據(jù)本發(fā)明的語音識別裝置,能夠立即提示用戶所要求的等級的信息,能夠始終高效地提供用戶所需的詳細(xì)信息,從而提高了用戶的便利性。
【專利附圖】
【附圖說明】
[0010]圖1是表示導(dǎo)航裝置的顯示畫面例的圖。
圖2是表示實(shí)施方式I的語音識別裝置的一個示例的框圖。
圖3是表示檢索等級的定義例的圖。
圖4是表示信息檢索控制部所設(shè)定的每個關(guān)鍵字的檢索等級的示例的圖。
圖5是表示操作顯示歷史存儲部所存儲的每個關(guān)鍵字的用戶操作歷史和顯示歷史的圖。
圖6是表示實(shí)施方式I的語音識別裝置的動作的流程圖。
圖7是表示關(guān)于操作顯示歷史存儲部所存儲的一個關(guān)鍵字(加油站)的操作歷史和顯示歷史被更新的示例的圖。
圖8是表示檢索結(jié)果的顯示例的圖。
圖9是表示實(shí)施方式2的語音識別裝置的一個示例的框圖。
圖10是表示實(shí)施方式2的語音識別裝置的動作的流程圖。
圖11是表示實(shí)施方式3的語音識別裝置的一個示例的框圖。
圖12是表示實(shí)施方式3的語音識別裝置的動作的流程圖。
圖13是表示實(shí)施方式4的語音識別裝置的一個示例的框圖。
圖14是表示實(shí)施方式4的語音識別裝置的動作的流程圖。
【具體實(shí)施方式】
[0011]下面,參照附圖對本發(fā)明的實(shí)施方式進(jìn)行詳細(xì)說明。
首先,對作為本發(fā)明的前提的組裝有語音識別裝置的導(dǎo)航裝置進(jìn)行說明。圖1是表示一般的導(dǎo)航裝置的顯示畫面例的圖。
[0012]例如,在搭載有該導(dǎo)航裝置的車內(nèi),在導(dǎo)航裝置的畫面70中顯示有用于通常的道路引導(dǎo)的地圖和本車標(biāo)記71的狀態(tài)下,進(jìn)行下述對話。 用戶A 汽油快用完啦”
用戶B 附近不知道有沒有加油站啊”
[0013]于是,對應(yīng)于該語音內(nèi)容中所包含的種類名(本例中為“加油站”)的種類名圖標(biāo)72顯示在導(dǎo)航裝置的畫面70中(圖1(a))。若用戶按下該圖標(biāo)72,則檢索當(dāng)前位置附近的加油站,并將加油站的例如名稱和地址等作為檢索結(jié)果以檢索結(jié)果列表73的方式進(jìn)行顯示(圖1 (b))。
[0014]接著,若用戶選擇所顯示的檢索結(jié)果中的一個,則以設(shè)施標(biāo)記74的方式顯示所選擇的加油站的位置信息,并且顯示詳情按鈕75 (例如“營業(yè)時間”按鈕75a和“價格”按鈕75b),從而顯示該加油站的詳細(xì)信息,例如營業(yè)時間、汽油價格等(圖1(c))。此處,若用戶按下“營業(yè)時間”的按鈕75a,則顯示該加油站的營業(yè)時間(圖1(d))。
[0015]在以下的實(shí)施方式中,均以基于上述加油站這一種類的設(shè)施檢索為例來進(jìn)行說明,但本發(fā)明中進(jìn)行檢索的信息并不限于這種設(shè)施信息,也可以是交通信息、天氣信息、地址信息、新聞、音樂信息、電影信息、節(jié)目信息等。
[0016]實(shí)施方式1.圖2是表示本發(fā)明的實(shí)施方式I的語音識別裝置的一個示例的框圖。該語音識別裝置組裝在搭載于車輛(移動體)的導(dǎo)航裝置中進(jìn)行使用,其包括:語音獲取部1、語音識別部
2、語音識別詞典3、信息數(shù)據(jù)庫4、信息檢索控制部5、信息提示控制部6、顯示部7、操作輸入部8、操作應(yīng)答解析部9、操作顯示歷史存儲部10、以及檢索等級設(shè)定部11。
[0017]語音獲取部I獲取由麥克風(fēng)收集的用戶語音即輸入的音頻,并利用PCM(PulseCode Modulat1n:脈沖編碼調(diào)制)進(jìn)行A/D (Analog/Digital:模擬/數(shù)字)轉(zhuǎn)換。
[0018]語音識別部2從經(jīng)過語音獲取部I進(jìn)行了數(shù)字化后的音頻信號中檢測出與用戶所說的內(nèi)容相應(yīng)的音頻區(qū)間,提取出該音頻區(qū)間的音頻數(shù)據(jù)的特征量,基于該特征量使用語音識別詞典3進(jìn)行識別處理,從而輸出語音識別結(jié)果的字符串。另外,作為識別處理,使用例如HMM(Hidden Markov Model:隱式馬爾克夫模型)法這樣的一般方法來進(jìn)行即可。
[0019]在搭載于車載導(dǎo)航系統(tǒng)等的語音識別功能中,通常搭乘者(用戶)會向系統(tǒng)明確表示(指示)發(fā)話的開始。因此,會在觸摸面板上顯示、或在方向盤上設(shè)置指示語音識別開始的按鈕(以下記為語音識別開始指示部)。于是,在語音識別開始指示部被用戶按下之后,對所說出的語音進(jìn)行識別。即,語音識別開始指示部輸出語音識別開始信號,若語音識別部接受該信號,則在接受該信號之后從由語音獲取部獲取的音頻數(shù)據(jù)中檢測出與用戶所說的內(nèi)容相應(yīng)的音頻區(qū)間,由此來進(jìn)行上述識別處理。
[0020]然而,本實(shí)施方式I的語音識別部2即使沒有上述那樣的由用戶說出的語音識別開始指示,也始終對用戶所說出的內(nèi)容進(jìn)行識別。即,語音識別部2即使沒有接受到語音識別開始信號,在組裝有該語音識別裝置的導(dǎo)航裝置啟動的情況下,也始終反復(fù)地進(jìn)行以下處理,即:從由語音獲取部I所獲取的音頻數(shù)據(jù)中檢測出與用戶所說出的內(nèi)容相應(yīng)的音頻區(qū)間,提取出該音頻區(qū)間的音頻數(shù)據(jù)的特征量,并基于該特征量使用語音識別詞典3來進(jìn)行識別處理,從而輸出語音識別結(jié)果的字符串。在下述的實(shí)施方式中也一樣。
[0021]信息數(shù)據(jù)庫4存儲有設(shè)施信息、地址信息、以及歌曲信息等中的至少一個以上。設(shè)施信息中例如包含有設(shè)施名稱、設(shè)施所屬的種類、位置數(shù)據(jù)、營業(yè)時間、有無停車場等,地址信息中例如包含有地址、位置數(shù)據(jù)等,歌曲信息中例如包含有專輯名、藝術(shù)家名、歌曲名、年代等信息。另外,此處,以信息數(shù)據(jù)庫4中存儲有設(shè)施信息的情況為例進(jìn)行說明,但也可以存儲交通信息、天氣信息、地址信息、新聞、音樂信息、電影信息、節(jié)目信息等。信息數(shù)據(jù)庫4例如可以存儲于HDD、閃存,或者可以存儲在網(wǎng)絡(luò)上通過通信單元(未圖示)來訪問。
[0022]信息檢索控制部5根據(jù)后述的檢索等級設(shè)定部11所設(shè)定的檢索等級,將語音識別部2輸出的關(guān)鍵字作為檢索關(guān)鍵詞對信息數(shù)據(jù)庫4進(jìn)行檢索,由此來獲取信息。這里,檢索等級是表示從信息數(shù)據(jù)庫4獲取到何種程度(哪一層級)的詳細(xì)信息為止的指標(biāo),并對每個關(guān)鍵字進(jìn)行定義。
[0023]圖3表不檢索等級的定義例。例如,在將關(guān)鍵字“加油站”作為檢索關(guān)鍵詞進(jìn)行檢索的情況下,若所設(shè)定的檢索等級為“ 1”,則獲取至設(shè)施名稱和地址信息為止,若檢索等級為“2”,則除了設(shè)施名稱和地址信息之外,還獲取營業(yè)時間和汽油價格中的至少一個以上的指定項(xiàng)目的信息。在沒有設(shè)定檢索等級的情況下,信息檢索控制部5不進(jìn)行檢索處理。另夕卜,也可以通過設(shè)定檢索等級為“O”來作為沒有設(shè)定檢索等級的情況。
[0024]圖4示出由后述的檢索等級設(shè)定部11在信息檢索控制部5中所設(shè)定的每個關(guān)鍵字的檢索等級的示例。此處,在如圖3的關(guān)鍵字“加油站”那樣在相同的檢索等級中存在多個項(xiàng)目的情況下,可以如圖4(a)所示那樣,設(shè)定一個項(xiàng)目來作為附加信息。在該情況下,除了設(shè)施名稱和地址信息之外,還獲取營業(yè)時間信息。此外,也可以如圖4(b)所示那樣設(shè)定多個項(xiàng)目來作為附加信息。并且,也可以在僅設(shè)定了檢索等級的情況下,獲取關(guān)于該等級的所有項(xiàng)目的信息。
[0025]信息提示控制部6指示后述的顯示部7顯示與檢索等級相對應(yīng)的圖標(biāo)、以及由信息檢索控制部5所獲取的檢索結(jié)果的指示。具體而言,在沒有設(shè)定檢索等級的情況下,顯示圖1 (a)所示的種類名圖標(biāo)72,在設(shè)定有檢索等級的情況下,以圖1 (b)所示的檢索結(jié)果列表73的方式顯示由信息檢索控制部5所獲取的檢索結(jié)果。
[0026]顯示部7是一體顯示型觸摸面板,例如由LCD (Liquid Crystal Display:液晶顯示器)和接觸式傳感器構(gòu)成,根據(jù)來自信息提示控制部6的指示來顯示檢索結(jié)果。用戶可通過直接觸摸顯示部(觸摸面板)7來進(jìn)行操作。
[0027]操作輸入部8是接受來自用戶的操作輸入并將該指示輸入到車載用導(dǎo)航裝置的操作按鍵、操作按鈕、觸摸面板等。用戶所作出的各種指示可以列舉出對利用設(shè)置于車載用導(dǎo)航組合裝置的硬件開關(guān)、顯示器上所設(shè)定并顯示的觸摸開關(guān)、或者設(shè)置于方向盤等的遙控器或單獨(dú)的遙控器作出的指示進(jìn)行識別的識別裝置等中所用到的指示。
[0028]操作應(yīng)答解析部9基于操作輸入部8所接受的信息和顯示部7所顯示的畫面的信息等,來確定用戶的操作。關(guān)于對用戶操作的確定,并不是本發(fā)明的本質(zhì)內(nèi)容,使用公知的技術(shù)即可,因此省略說明。
[0029]操作顯示歷史存儲部10示如下存儲部:即,針對由語音識別部2提取出的每個關(guān)鍵字,將基于由操作應(yīng)答解析部9所確定的用戶的操作而顯示在顯示部7中的顯示內(nèi)容及其顯示次數(shù)作為歷史信息進(jìn)行存儲。圖5示出了操作顯示歷史存儲部10所存儲的每個關(guān)鍵字的用戶的歷史信息。例如,如圖5所示,針對每個關(guān)鍵字,將根據(jù)用戶的操作所顯示的內(nèi)容以及顯示該內(nèi)容的次數(shù)成對地進(jìn)行存儲,若由操作應(yīng)答解析部9確定了用戶的操作,則增加針對該操作所顯示的內(nèi)容的次數(shù)并進(jìn)行保存。
[0030]檢索等級設(shè)定部11參照操作顯示歷史存儲部10所存儲的歷史信息,根據(jù)該歷史信息在信息檢索控制部5中設(shè)定作為檢索關(guān)鍵詞的每個關(guān)鍵字的檢索等級。此處,在信息檢索控制部5中所設(shè)定的檢索等級是與顯示次數(shù)在規(guī)定的顯示次數(shù)以上的顯示內(nèi)容(或者顯示次數(shù)超過規(guī)定的顯示次數(shù)的顯示內(nèi)容)相對應(yīng)的等級。于是,對于由語音識別部2提取出的關(guān)鍵字,當(dāng)操作顯示歷史存儲部10中所存儲的歷史信息中的顯示次數(shù)在規(guī)定次數(shù)以上時,改變檢索等級,且每當(dāng)顯不次數(shù)達(dá)到規(guī)定次數(shù)以上時,提聞檢索等級。
[0031]例如,在將作為閾值的規(guī)定次數(shù)設(shè)為3次的情況下,在圖5所示的關(guān)鍵字“加油站”中,層級I的名稱、地址的顯示次數(shù)為6次,層級2的營業(yè)時間的顯示次數(shù)為2次,價格的顯示次數(shù)為O次,因此,將檢索顯示次數(shù)符合規(guī)定次數(shù)即3次以上的名稱、地址的檢索等級設(shè)定為“1”(參照圖3)。并且,若此時用戶進(jìn)行顯示營業(yè)時間的操作,則營業(yè)時間的顯示次數(shù)更新為3次,因此,在下一次提取出關(guān)鍵字“加油站”時,由于營業(yè)時間的顯示次數(shù)達(dá)到規(guī)定次數(shù)即3次以上,因而將檢索等級提高到“2”。
[0032]在顯示次數(shù)超過規(guī)定次數(shù)的項(xiàng)目有多個的情況下,例如設(shè)定針對層級最深的顯示內(nèi)容的檢索等級即可。例如,在作為閾值的規(guī)定次數(shù)同樣設(shè)為3次的情況下,在圖5所示的關(guān)鍵字“便利店”中,層級I的名稱、地址的顯示次數(shù)為5次,層級2的營業(yè)時間的顯示次數(shù)和推薦商品的顯示次數(shù)均為4次,因此符合規(guī)定次數(shù)即3次以上,且設(shè)定對層級最深的顯示內(nèi)容即營業(yè)時間和推薦商品進(jìn)行檢索的檢索等級為“2”(參照圖3)。
[0033]此處,關(guān)于作為閾值的規(guī)定次數(shù),均以3次進(jìn)行說明,但對于所有的關(guān)鍵字,可以使用相同的值,也可以對每個關(guān)鍵字使用不同的值。
另外,這里所示的檢索等級的設(shè)定方法是一個示例,也可以設(shè)定為使用其他方法所決定的檢索等級。
[0034]接著,利用圖6所示的流程圖,對實(shí)施方式I的語音識別裝置的動作進(jìn)行說明。 首先,語音獲取部I獲取由麥克風(fēng)收集的用戶語音即輸入的音頻,并利用PCM進(jìn)行A/D
轉(zhuǎn)換(步驟STO I)。
接著,語音識別部2從經(jīng)過語音獲取部I進(jìn)行了數(shù)字化后的音頻信號中檢測出與用戶所說出的內(nèi)容相應(yīng)的音頻區(qū)間,提取出該音頻區(qū)間的音頻數(shù)據(jù)的特征量,基于該特征量使用語音識別詞典3來進(jìn)行識別處理,提取作為關(guān)鍵字的字符串并進(jìn)行輸出(步驟ST02)。
[0035]接著,信息檢索控制部5在由檢索等級設(shè)定部11設(shè)定了檢索等級的情況下(步驟ST03為是的情況下),根據(jù)該檢索等級,將由語音識別部2輸出的關(guān)鍵字作為檢索關(guān)鍵詞來對信息數(shù)據(jù)庫4進(jìn)行檢索,從而獲取信息(步驟ST04)。然后,信息提示控制部6指示顯示部7顯示由信息檢索控制部5所獲取的檢索結(jié)果(步驟ST05)。
[0036]另一方面,在沒有設(shè)定檢索等級的情況下(步驟ST03為否的情況下),顯示與該關(guān)鍵字相對應(yīng)的圖標(biāo)(步驟ST06)。
接著,若用戶通過操作輸入部8操作顯示畫面,則操作應(yīng)答解析部9對該操作進(jìn)行解析,確定用戶的操作(步驟ST07),對于該檢索關(guān)鍵字,增加根據(jù)所確定的用戶操作而顯示的內(nèi)容的次數(shù),并更新操作顯示歷史存儲部10中所保存的操作歷史、顯示歷史(步驟ST08)。
[0037]檢索等級設(shè)定部11對于步驟ST02中提取出的關(guān)鍵字,判定操作顯示歷史存儲部10中所保存的顯示內(nèi)容的次數(shù)是否在預(yù)先設(shè)定的閾值即規(guī)定次數(shù)以上(步驟ST09)。若判定為不是規(guī)定次數(shù)以上的顯示內(nèi)容(步驟ST09為否的情況),則返回步驟STOl。另一方面,若判定為是規(guī)定次數(shù)以上的顯示內(nèi)容(步驟ST09為是的情況),則基于該內(nèi)容來決定檢索等級,并對信息檢索控制部5設(shè)定檢索等級(步驟ST10)。
[0038]下面,列舉具體例來進(jìn)行說明。另外,為了便于說明,將初始狀態(tài)設(shè)為信息檢索控制部5中未設(shè)定檢索等級,各關(guān)鍵字的畫面顯示次數(shù)均為O。此外,將檢索等級設(shè)定部11中進(jìn)行判定時的閾值即“規(guī)定次數(shù)”設(shè)為2次。
[0039]例如,在搭載有導(dǎo)航裝置的車內(nèi),在導(dǎo)航裝置的畫面70中顯示有用于通常的道路引導(dǎo)的地圖和本車標(biāo)記71的狀態(tài)下,進(jìn)行下述對話:
用戶A 汽油快用完啦”
用戶B 附近不知道有沒有加油站啊”
若進(jìn)行了上述對話,則利用語音識別部2對經(jīng)過語音獲取部I進(jìn)行了數(shù)字化后的音頻信號進(jìn)行識別,提取出關(guān)鍵字“加油站”并進(jìn)行輸出(步驟ST01、步驟ST02)。
[0040]此處,如上所述,在初始狀態(tài)下,由于信息檢索控制部5中未對關(guān)鍵字“加油站”設(shè)定檢索等級,因此,不利用信息檢索控制部5對信息數(shù)據(jù)庫4進(jìn)行檢索(步驟ST03為否的情況)。于是,對應(yīng)于檢索等級未設(shè)定的顯示,即“加油站”的種類名圖標(biāo)73以例如圖1(a)所示那樣的方式顯示在顯示部7的畫面70上(步驟ST06)。
[0041]接著,若用戶進(jìn)行圖1(a)、(b)、(C)所示的操作,從而顯示圖1(d)那樣的畫面,則操作應(yīng)答解析部9根據(jù)這些圖1(a)、(b)、(C)的操作,確定進(jìn)行名稱、地址的顯示和營業(yè)時間的顯示,并且,對于關(guān)鍵字“加油站”,增加名稱、地址的顯示次數(shù)和營業(yè)時間的顯示次數(shù),并更新操作顯示歷史存儲部10的內(nèi)容(步驟ST07、步驟ST08)。其結(jié)果是,在操作顯示歷史存儲部10中,對于關(guān)鍵字“加油站”,保存有以下歷史記錄,即:名稱、地址的顯示次數(shù)為“I”、營業(yè)時間的顯示次數(shù)為“I”、價格的顯示次數(shù)為“O”。
[0042]接著,若在其他時間用戶進(jìn)行上述對話,并進(jìn)行到名稱、地址的顯示為止,則操作顯示歷史存儲部10所存儲的信息如圖7(a)所示,對于關(guān)鍵字“加油站”,其內(nèi)容變?yōu)槊Q、地址的顯示次數(shù)為“2”,營業(yè)時間的顯示次數(shù)為“1”,價格的顯示次數(shù)為“0”,由于名稱、地址的顯示次數(shù)在閾值即規(guī)定次數(shù)“2”以上,因此,對信息檢索控制部5設(shè)定檢索等級“ I”(步驟 ST09、步驟 ST10)。
[0043]并且,若在其他時間用戶進(jìn)行上述對話,則對于關(guān)鍵字“加油站”,在信息檢索控制部5中設(shè)定了檢索等級“1”,因此,從信息數(shù)據(jù)庫4獲取名稱、地址信息,并且作為檢索結(jié)果,如圖8(a)所示那樣顯示檢索結(jié)果列表73(步驟ST03為是的情況,步驟ST04、步驟ST05)。此處,若用戶選擇檢索結(jié)果中的一個,則顯示圖1(c)所示的畫面。并且,操作顯示歷史存儲部10中所存儲的信息如圖7 (b)所示那樣,其內(nèi)容變?yōu)槊Q、地址的顯示次數(shù)為“3”,營業(yè)時間的顯示次數(shù)為“2”,價格的顯示次數(shù)為“0”,由于營業(yè)時間的顯示次數(shù)在閾值即規(guī)定次數(shù)“2”以上,因此對信息檢索控制部5設(shè)定檢索等級“2”,附加信息“營業(yè)時間”。
[0044]同樣地,在操作顯示歷史存儲部10中所存儲的信息為圖7(b)所示那樣的情況下,當(dāng)用戶還在其他時間進(jìn)行了上述對話,則對于關(guān)鍵字“加油站”,在信息檢索控制部5中設(shè)定了檢索等級“2”、以及附加信息“營業(yè)時間”,因此,從信息數(shù)據(jù)庫4獲取到營業(yè)時間為止的信息,并且作為檢索結(jié)果,如圖8(b)所示那樣顯示包含有營業(yè)時間的檢索結(jié)果列表73。此處,若用戶選擇檢索結(jié)果中的一個,則顯示圖1(d)所示的畫面。
[0045]在操作顯示歷史存儲部10中所存儲的信息像如圖7(c)所示那樣,名稱、地址的顯示次數(shù)為“4”,營業(yè)時間的顯示次數(shù)為“2”、價格的顯示次數(shù)為“2”,在此情況下,由于所有的項(xiàng)目均在檢索等級設(shè)定部11的判定中所使用的閾值即規(guī)定次數(shù)“2”以上,因此,對信息檢索控制部5設(shè)定檢索等級“2”、附加信息“營業(yè)時間”和“價格”(或者沒有附加信息)。
[0046]在該狀態(tài)下,若用戶再次進(jìn)行上述對話,則對于關(guān)鍵字“加油站”,由于信息檢索控制部5中設(shè)定了檢索等級“2”、附加信息“營業(yè)時間”和“價格”(或者沒有附加信息),因此,從信息數(shù)據(jù)庫4中獲取到營業(yè)時間和價格為止的信息,并且作為檢索結(jié)果,如圖8(c)所示那樣顯示包含營業(yè)時間和價格在內(nèi)的檢索結(jié)果列表73。
[0047]如上所述,根據(jù)本實(shí)施方式1,對于由語音識別部從用戶的語音內(nèi)容中提取出的關(guān)鍵字,將根據(jù)用戶的操作來進(jìn)行顯示的內(nèi)容和次數(shù)作為歷史信息進(jìn)行存儲,通過判定用戶是否進(jìn)行了規(guī)定次數(shù)以上的相同操作以及顯示,例如用戶在瀏覽“加油站”的信息時每次都要進(jìn)行營業(yè)時間的確認(rèn)等,來設(shè)定檢索等級,由此能夠在下一次提取出相同的關(guān)鍵字時,立即示出用戶所要求的等級的信息,能夠始終高效地提供用戶所需的詳細(xì)信息,因而提高了用戶的便利性。
[0048]實(shí)施方式2.圖9是表示本發(fā)明的實(shí)施方式2的語音識別裝置的一個示例的框圖。另外,對于與實(shí)施方式I所說明的結(jié)構(gòu)相同的結(jié)構(gòu)標(biāo)注相同的標(biāo)號,并省略重復(fù)說明。以下所示的實(shí)施方式2中,與實(shí)施方式I相比,還具備鳴動設(shè)定部12,用于在用戶對由語音識別部2所識別出的關(guān)鍵字的信息顯示次數(shù)在規(guī)定次數(shù)以上(或超過規(guī)定次數(shù))時,促使用戶引起注意。
[0049]信息檢索控制部5基于用戶對由語音識別部2所識別出的關(guān)鍵字的信息顯示次數(shù),在由檢索設(shè)定部11將檢索等級設(shè)定為“I”以上時(或者設(shè)定了大于規(guī)定值的檢索等級時),對鳴動設(shè)定部12進(jìn)行輸出的指示。
鳴動設(shè)定部12若接受到來自信息檢索控制部5的指示,則改變導(dǎo)航裝置的設(shè)定以進(jìn)行規(guī)定的輸出。此處,規(guī)定的輸出是指例如座椅的振動、通知音的輸出、內(nèi)容為識別到該關(guān)鍵字的音頻輸出等通過預(yù)先設(shè)定的振動或音頻來進(jìn)行的鳴動輸出。
[0050]接著,利用圖10所示的流程圖,對實(shí)施方式2的語音識別裝置的動作進(jìn)行說明。 關(guān)于步驟STll?ST19的處理,由于與實(shí)施方式I中圖6的流程圖的步驟STOl?ST09
相同,因此省略說明。
然后,對于由語音識別部2提取出的關(guān)鍵字,在判定為操作歷史、顯示歷史是規(guī)定次數(shù)以上的顯示內(nèi)容的情況下(步驟ST19為是的情況),與實(shí)施方式I同樣地設(shè)定檢索等級(步驟ST20),然后鳴動設(shè)定部12改變鳴動設(shè)定從而進(jìn)行規(guī)定的輸出(步驟ST21)。
[0051]如上所述,根據(jù)本實(shí)施方式2,對于由語音識別部從用戶的語音內(nèi)容中提取出的關(guān)鍵字,若判定為過去用戶進(jìn)行了規(guī)定次數(shù)以上(或超過規(guī)定次數(shù))的與該關(guān)鍵字相關(guān)的信息顯示,則根據(jù)該關(guān)鍵字的檢索等級,由鳴動設(shè)定部進(jìn)行基于振動或音頻的規(guī)定輸出,由此來促使用戶引起注意,因此,用戶能夠恰當(dāng)?shù)卣J(rèn)識到處于可立即提示符合該檢索等級的詳細(xì)信息的狀態(tài)。
[0052]實(shí)施方式3.圖11是表示本發(fā)明的實(shí)施方式3的語音識別裝置的一個示例的框圖。此外,對于與實(shí)施方式1、2所說明的結(jié)構(gòu)相同的結(jié)構(gòu)標(biāo)注相同的標(biāo)號,并省略重復(fù)說明。以下所示的實(shí)施方式3中,與實(shí)施方式2相比,還具備檢索等級初始化部13,能夠在用戶想要初始化的情況下通過說話來對操作顯示歷史存儲部10所存儲的歷史信息進(jìn)行初始化。
[0053]語音識別詞典3構(gòu)成為還能夠?qū)Α俺跏蓟?、“?fù)位”等表示將操作顯示歷史存儲部10中所存儲的歷史信息恢復(fù)至初始狀態(tài)的命令的關(guān)鍵字進(jìn)行識別,語音識別部2將該關(guān)鍵字作為識別結(jié)果進(jìn)行輸出。
檢索等級初始化部13在利用語音識別部2提取出“初始化”、“復(fù)位”等表示恢復(fù)初始狀態(tài)的命令的關(guān)鍵字時,對操作顯示歷史存儲部10中所存儲的歷史信息進(jìn)行初始化。
[0054]接著,利用圖12所示的流程圖,對實(shí)施方式3的語音識別裝置的動作進(jìn)行說明。 步驟ST31?32和步驟ST35?42與實(shí)施方式2中圖10的流程圖的步驟STll?ST12
及步驟ST13?20相同,因此省略說明。
[0055]接著,在步驟ST32中,當(dāng)由語音識別部2提取出的關(guān)鍵字是“初始化”、“復(fù)位”等表示恢復(fù)初始狀態(tài)的命令的關(guān)鍵字時(步驟ST33為是的情況下),對操作顯示歷史存儲部10中所存儲的信息進(jìn)行初始化,即恢復(fù)初始狀態(tài)(步驟ST34)。在提取出除此以外的關(guān)鍵字的情況下,進(jìn)行步驟ST35之后的處理。
[0056]如上所述,根據(jù)本實(shí)施方式3,在利用語音識別部從用戶的語音內(nèi)容中提取出的關(guān)鍵字是“初始化”、“復(fù)位”等表示恢復(fù)初始狀態(tài)的命令的關(guān)鍵字的情況下,對操作顯示歷史存儲部中所存儲的歷史信息進(jìn)行初始化,因此,在不希望顯示與檢索等級相應(yīng)的詳細(xì)信息的情況、用戶改變了想法的情況等用戶想要進(jìn)行初始化的情況下,只要說出表示該命令的關(guān)鍵字,就能夠?qū)⒉僮黠@示歷史存儲部的內(nèi)容恢復(fù)至初始狀態(tài)。
[0057]實(shí)施方式4.圖13是表示本發(fā)明的實(shí)施方式4的語音識別裝置的一個示例的框圖。此外,對于與實(shí)施方式I?3中所說明的結(jié)構(gòu)相同的結(jié)構(gòu)標(biāo)注相同的標(biāo)號,并省略重復(fù)說明。以下所示的實(shí)施方式4中,與實(shí)施方式I相比,還具備說話者識別部14,該說話者識別部14用于變更每個說話者(說話的用戶)所參照的歷史信息。
[0058]說話者識別部14對經(jīng)過語音獲取部I進(jìn)行數(shù)字化后的音頻信號進(jìn)行解析,由此來識別說話者(說話的用戶)。此處,關(guān)于說話者的識別方法,并不是本發(fā)明的本質(zhì)內(nèi)容,使用公知的技術(shù)即可,因此省略說明。
[0059]操作顯示歷史存儲部10對于每一位用戶保持圖5所示的歷史信息。于是,若說話者識別部14識別出說話者(說話的用戶),則使與該識別出的用戶相對應(yīng)的歷史信息變?yōu)橛行?。其他的處理與實(shí)施方式I相同,因此省略說明。設(shè)定為說話者識別部14所識別出的說話者是對操作輸入部8進(jìn)行操作的用戶。
[0060]檢索等級設(shè)定部11參照操作顯示歷史存儲部10中所存儲的歷史信息中有效的歷史信息,根據(jù)該歷史信息在信息檢索控制部5中設(shè)定作為檢索關(guān)鍵詞的每個關(guān)鍵字的檢索等級。
[0061]接著,利用圖14所示的流程圖,對實(shí)施方式4的語音識別裝置的動作進(jìn)行說明。 首先,語音獲取部I獲取由麥克風(fēng)收集的用戶語音即輸入的音頻,并利用例如PCM進(jìn)行
A/D轉(zhuǎn)換(步驟ST51)。
接著,說話者識別部14對由語音獲取部I獲取的音頻信號進(jìn)行解析,由此來識別說話者(步驟ST52)。
[0062]接著,操作應(yīng)答解析部9將操作顯示歷史存儲部10中與由說話者識別部14識別出的說話者相對應(yīng)的歷史信息設(shè)為有效(步驟ST53)。
關(guān)于之后的步驟ST54?ST62的處理,由于與實(shí)施方式I中圖6的流程圖的步驟ST02?STlO相同,因此省略說明。
[0063]如上所述,根據(jù)本實(shí)施方式4,根據(jù)用戶的語音對說話者進(jìn)行識別,通過參照對每個說話者存儲的歷史信息來設(shè)定檢索等級,并顯示與該檢索等級相對應(yīng)的詳細(xì)信息,因此,即使使用組裝有該語音識別裝置的導(dǎo)航裝置的用戶發(fā)生變化,也能夠立即提示出各用戶所要求的等級的信息,能夠始終高效地提供用戶所需的詳細(xì)信息,從而能夠進(jìn)一步提高用戶的便利性。
[0064]另外,在上述實(shí)施方式中,設(shè)為始終對用戶的語音內(nèi)容進(jìn)行識別,但也可以僅在規(guī)定的期間(例如,用戶按下用于進(jìn)行語音識別的按鈕,在按住該按鈕的期間,或者在按下該按鈕后的規(guī)定時間內(nèi))進(jìn)行語音識別。另外,也可以設(shè)為用戶能夠設(shè)定是始終進(jìn)行識別還是僅在規(guī)定的期間內(nèi)進(jìn)行識別。
[0065]然而,如上述實(shí)施方式所示那樣,通過在用戶沒有意識到的情況下,在組裝有語音識別裝置的導(dǎo)航裝置啟動時始終進(jìn)行語音獲取和語音識別,從而只要存在某些語音,就自動地進(jìn)行語音獲取和語音識別,并從語音識別結(jié)果中提取出關(guān)鍵字,設(shè)定檢索等級,從而立即示出用戶所要求的等級的信息,因此,無需用于獲取語音或開始語音識別的用戶手動操作或輸入的意思等,能夠始終高效地提供用戶所需的詳細(xì)信息。
[0066]在上述實(shí)施方式中,對將該語音識別裝置組裝入車載用導(dǎo)航裝置的情況進(jìn)行了說明,但可組裝本發(fā)明的語音識別裝置的裝置并不限于車載用導(dǎo)航裝置,只要是包含人、車輛、鐵路、船舶或飛機(jī)等在內(nèi)的移動體用的導(dǎo)航裝置、便攜式導(dǎo)航裝置、便攜式信息處理裝置等能夠通過用戶與裝置之間的對話來檢索信息并進(jìn)行顯示的裝置,則本發(fā)明可適用于任意的方式。
[0067]另外,本申請發(fā)明可以在其發(fā)明的范圍內(nèi)對各實(shí)施方式進(jìn)行自由組合,或?qū)Ω鲗?shí)施方式的任意構(gòu)成要素進(jìn)行變形、或省略各實(shí)施方式中的任意的構(gòu)成要素。
工業(yè)上的實(shí)用性
[0068]可組裝有本發(fā)明的語音識別裝置的裝置不限于車載用導(dǎo)航裝置,只要是包含人、車輛、鐵路、船舶或飛機(jī)等在內(nèi)的移動體用的導(dǎo)航裝置、便攜式導(dǎo)航裝置、便攜式信息處理裝置等能夠通過用戶與裝置之間的對話來檢索信息并進(jìn)行顯示的裝置,則本發(fā)明可適用于任意的方式。
標(biāo)號說明
[0069]I語音獲取部、2語音識別部、3語音識別詞典、4信息數(shù)據(jù)庫、5信息檢索控制部、6信息提示控制部、7顯示部、8操作輸入部、9操作應(yīng)答解析部、10操作顯示歷史存儲部、11檢索等級設(shè)定部、12鳴動設(shè)定部、13檢索等級初始化部、14說話者識別部、70導(dǎo)航裝置的畫面、71本車標(biāo)記、72種類名圖標(biāo)、73檢索結(jié)果列表、74設(shè)施標(biāo)記、75詳情按鈕。
【權(quán)利要求】
1.一種語音識別裝置,其特征在于,包括: 語音獲取部,該語音獲取部檢測并獲取用戶所說出的語音; 語音識別部,該語音識別部對由所述語音獲取部獲取到的音頻數(shù)據(jù)進(jìn)行識別,并提取出關(guān)鍵字; 操作輸入部,該操作輸入部接受來自所述用戶的操作輸入; 顯示部,該顯示部向所述用戶提示信息; 操作應(yīng)答解析部,該操作應(yīng)答解析部基于由所述操作輸入部接受到的信息和所述顯示部所顯示的信息,確定所述用戶的操作; 操作顯示歷史存儲部,該操作顯示歷史存儲部對于由所述語音識別部提取出的每個關(guān)鍵字,將根據(jù)由所述操作應(yīng)答解析部確定的操作而顯示在所述顯示部的顯示內(nèi)容及其顯示次數(shù)作為歷史信息進(jìn)行存儲; 檢索等級設(shè)定部,該檢索等級設(shè)定部根據(jù)所述操作顯示歷史存儲部所存儲的歷史信息,設(shè)定由所述語音識別部提取出的關(guān)鍵字的檢索等級; 信息檢索控制部,該信息檢索控制部根據(jù)由所述檢索等級設(shè)定部所設(shè)定的檢索等級,將由所述語音識別部提取出的關(guān)鍵字作為檢索關(guān)鍵詞來檢索信息,從而獲得檢索結(jié)果;以及 信息提示控制部,該信息提示控制部指示所述顯示部顯示由所述信息檢索控制部所獲取的檢索結(jié)果, 所述檢索等級設(shè)定部對于由所述語音識別部提取出的關(guān)鍵字,在所述操作顯示歷史存儲部所存儲的歷史信息中的顯示次數(shù)為規(guī)定次數(shù)以上時,改變所述檢索等級。
2.如權(quán)利要求1所述的語音識別裝置,其特征在于, 所述檢索等級設(shè)定部對于由所述語音識別部提取出的關(guān)鍵字,每當(dāng)所述操作顯示歷史存儲部所存儲的歷史信息中的顯示次數(shù)在所述規(guī)定次數(shù)以上時,提高所述檢索等級。
3.如權(quán)利要求1所述的語音識別裝置,其特征在于, 所述信息檢索控制部將由所述語音識別部提取出的關(guān)鍵字作為檢索關(guān)鍵詞來進(jìn)行檢索的信息是設(shè)施信息、交通信息、天氣信息、地址信息、新聞、音樂信息、電影信息或節(jié)目信息中的任一個。
4.如權(quán)利要求1所述的語音識別裝置,其特征在于, 還包括說話者識別部,該說話者識別部用于確定說出由所述語音獲取部獲取到的語音的用戶, 所述操作顯示歷史存儲部對于每一位用戶存儲歷史信息,將由所述說話者識別部確定的用戶的歷史信息設(shè)為有效, 所述檢索等級設(shè)定部參照所述操作顯示歷史存儲部中設(shè)為有效的歷史信息,來設(shè)定所述檢索等級。
5.如權(quán)利要求1所述的語音識別裝置,其特征在于, 還包括鳴動設(shè)定部,該鳴動設(shè)定部根據(jù)所述檢索等級,通過振動或音頻來促使所述用戶引起注意。
6.如權(quán)利要求1所述的語音識別裝置,其特征在于, 還包括檢索等級初始化部,該檢索等級初始化部在由所述語音識別部提取出的關(guān)鍵字是表示恢復(fù)初始狀態(tài)的命令的關(guān)鍵字的情況下,將所述操作顯示歷史存儲部中所存儲的歷史信息恢復(fù)至初始狀態(tài)。
【文檔編號】G06F3/16GK104428766SQ201280074470
【公開日】2015年3月18日 申請日期:2012年7月3日 優(yōu)先權(quán)日:2012年7月3日
【發(fā)明者】丸田裕三 申請人:三菱電機(jī)株式會社