本發(fā)明涉及能實現(xiàn)語音識別的語音識別裝置及語音識別方法。
背景技術(shù):
::提出了通過內(nèi)置語音識別裝置對來自用戶的語音進(jìn)行語音識別,從而能輸入地址的導(dǎo)航系統(tǒng)。在將上述導(dǎo)航系統(tǒng)用于歐洲等地區(qū)時,具有設(shè)定為導(dǎo)航系統(tǒng)所使用的語言的語言(以下記載為“系統(tǒng)設(shè)定語言”)與表示目的地的語言不同的情況。例如,在用戶是英國人而目的地是德國的地址的情況下,假設(shè)系統(tǒng)設(shè)定語言為英語,表示目的地的語言為德語。用于進(jìn)行地名的語音識別的地名的音素(相當(dāng)于發(fā)音記號)由地圖制作公司提供,通常提供該地名所表示的地區(qū)中主要使用的語言的音素。例如,對于德國地名的音素,使用德語的音素。因此,在表示目的地的語言是德語的情況下,從效率的觀點來看,優(yōu)選使用由地圖制作公司提供的德語的音素構(gòu)成的語音識別辭典,并且使用與此對應(yīng)的德語的語音識別引擎。另一方面,對于系統(tǒng)設(shè)定語言,通常使用用戶的母語。因此,在系統(tǒng)設(shè)定語言是英語的情況下,優(yōu)選使用英語的語音識別引擎。因此,在系統(tǒng)設(shè)定語言是英語而表示目的地的語言是德語的情況下,關(guān)于表示目的地的語言所優(yōu)選的語音識別辭典與關(guān)于系統(tǒng)設(shè)定語言所優(yōu)選的語音識別辭典是不同的。然而,具有存在于英語及德語的一種語言中的音素(發(fā)音)不存在于另一種語言中的情況,因此存在以下問題:無法利用英語及德語的一種語言的語音識別引擎來處理另一種語言的音素。為了解決該問題,提出了如下技術(shù):使用將某一語言a的音素a與另一語言b的音素b中與該音素a相同或最接近的音素b相對應(yīng)的語音識別辭典(例如專利文獻(xiàn)1)。若使用上述語音識別辭典,則能將語言a的音素置換為語言b的音素并利用語言b的語音識別引擎來進(jìn)行語音識別。下面,在語音識別辭典中有時也將某個語言的音素與另一語言的音素相對應(yīng)的情況記載為“音素的映射”。現(xiàn)有技術(shù)文獻(xiàn)專利文獻(xiàn)專利文獻(xiàn)1:日本專利特開2011-033874號公報技術(shù)實現(xiàn)要素:發(fā)明所要解決的技術(shù)問題然而,在現(xiàn)有的語音識別裝置中存在如下問題:即、無法對混合存在多種語言的語音進(jìn)行語音識別,此外,實施了上述音素的映射的語音識別辭典的數(shù)據(jù)大小較大。因此,本發(fā)明是鑒于上述問題點而完成的,其目的在于,提供一種能抑制語音識別辭典的數(shù)據(jù)大小、并能對混合存在多種語言的語音進(jìn)行語音識別的技術(shù)。解決技術(shù)問題的技術(shù)方案本發(fā)明所涉及的語音識別裝置包括:語音識別辭典,該語音識別辭典規(guī)定了語音識別對象的詞匯;以及語音識別處理電路,該語音識別處理電路利用語音識別辭典來進(jìn)行輸入語音的語音識別。語音識別處理電路包含能利用各個預(yù)先設(shè)定的語言的音素進(jìn)行語音識別的多個語言用語音識別處理電路。語音識別辭典包含:多個第1辭典,該多個第1辭典用于分別由多個語言用語音識別處理電路利用與自身相對應(yīng)的語言即對應(yīng)語言的音素來進(jìn)行第1詞匯的語音識別;以及多個第2辭典,該多個第2辭典用于分別由多個語言用語音識別處理電路將不同于對應(yīng)語言的語言即其他語言的音素置換為對應(yīng)語言的音素并進(jìn)行第2詞匯的語音識別,該多個第2辭典將關(guān)于第2詞匯的其他語言的音素映射到對應(yīng)語言的音素。語音識別裝置還包括:語音識別語言設(shè)定處理電路,該語音識別語言設(shè)定處理電路從多個語言用語音識別處理電路中設(shè)定語音識別所要使用的語言用語音識別處理電路;以及語音識別辭典設(shè)定處理電路,該語音識別辭典設(shè)定處理電路從多個第1辭典中設(shè)定用于由語音識別語言設(shè)定處理電路所設(shè)定的語言用語音識別處理電路利用對應(yīng)語言的音素來進(jìn)行第1詞匯的語音識別的第1辭典,并且從多個第2辭典中設(shè)定用于由語音識別語言設(shè)定處理電路所設(shè)定的語言用語音識別處理電路將其他語言的音素置換為對應(yīng)語言的音素并進(jìn)行第2詞匯的語音識別的第2辭典。本發(fā)明所涉及的語音識別方法包括如下步驟:準(zhǔn)備語音識別辭典的步驟,所述語音識別辭典規(guī)定了語音識別對象的詞匯;以及利用語音識別辭典來進(jìn)行輸入語音的語音識別的步驟。進(jìn)行語音識別的步驟包含準(zhǔn)備多個語言用語音識別處理電路的步驟,所述多個語言用語音識別處理電路能利用各個預(yù)先設(shè)定的語言的音素來進(jìn)行語音識別。準(zhǔn)備語音識別辭典的步驟包含如下步驟:準(zhǔn)備多個第1辭典及多個第2辭典,其中,所述多個第1辭典用于分別由多個語言用語音識別處理電路利用與自身相對應(yīng)的語言即對應(yīng)語言的音素來進(jìn)行第1詞匯的語音識別,所述多個第2辭典與用于分別由多個語言用語音識別處理電路將不同于對應(yīng)語言的語言即其他語言的音素置換為對應(yīng)語言的音素并進(jìn)行第2詞匯的語音識別,所述多個第2辭典將關(guān)于第2詞匯的其他語言的音素映射到對應(yīng)語言的音素。語音識別方法還包括如下步驟:從多個語言用語音識別處理電路中設(shè)定語音識別所要使用的語言用語音識別處理電路的步驟;以及從多個第1辭典中設(shè)定用于由設(shè)定的語言用語音識別處理電路利用對應(yīng)語言的音素來進(jìn)行第1詞匯的語音識別的第1辭典、并從多個第2辭典中設(shè)定用于由設(shè)定的語言用語音識別處理電路將其他語言的音素置換為對應(yīng)語言的音素并進(jìn)行第2詞匯的語音識別的第2辭典的步驟。發(fā)明效果根據(jù)本發(fā)明,能抑制語音識別辭典的數(shù)據(jù)大小,并能對混合存在多種語言的語音進(jìn)行語音識別。本發(fā)明的目的、特征、方式以及優(yōu)點通過以下詳細(xì)的說明和附圖來進(jìn)一步闡明。附圖說明圖1是表示實施方式1所涉及的語音識別裝置的硬件結(jié)構(gòu)的框圖。圖2是表示實施方式1所涉及的語音識別裝置的主要結(jié)構(gòu)的框圖。圖3是表示實施方式1所涉及的語音識別裝置的結(jié)構(gòu)的框圖。圖4是用于說明實施方式1所涉及的音素的映射的圖。圖5是表示實施方式1所涉及的語音識別裝置的動作的流程圖。圖6是表示實施方式2所涉及的語音識別裝置的結(jié)構(gòu)的框圖。圖7是表示實施方式2所涉及的語音識別裝置的動作的流程圖。具體實施方式<實施方式1>下面,以將本發(fā)明的實施方式1所涉及的語音識別裝置搭載于導(dǎo)航系統(tǒng)(或?qū)Ш窖b置)的結(jié)構(gòu)為例進(jìn)行說明。圖1是表示本實施方式1所涉及的語音識別裝置的硬件結(jié)構(gòu)的框圖。圖1的語音識別裝置具備例如由cpu(centralprocessingunit:中央處理單元)等構(gòu)成的處理器81及例如由半導(dǎo)體存儲器等構(gòu)成的存儲器82。圖2是表示實施方式1所涉及的語音識別裝置的主要功能結(jié)構(gòu)的框圖。圖2的語音識別裝置包括語音識別部4、語音識別辭典5、語音識別語言設(shè)定部6及語音識別辭典設(shè)定部7。此處,語音識別部4、語音識別語言設(shè)定部6及語音識別辭典設(shè)定部7通過由圖1的處理器81執(zhí)行存儲于存儲器82等存儲裝置的程序,從而作為該處理器81的功能來實現(xiàn)。另外,上述功能也可以由多個處理器81來協(xié)作實現(xiàn)。語音識別辭典5對應(yīng)于圖1的存儲器82、未圖示的hdd(harddiskdrive:硬盤驅(qū)動器)等存儲裝置。圖3是表示該語音識別裝置的主要功能結(jié)構(gòu)及附加功能結(jié)構(gòu)的框圖。另外,僅由圖3所示的附加結(jié)構(gòu)僅僅是與本發(fā)明間接相關(guān)的結(jié)構(gòu),除了以下說明的結(jié)構(gòu)以外也能適用各種結(jié)構(gòu)。圖3的語音識別裝置除了圖2的結(jié)構(gòu)要素以外還具備語音輸入部1、語音獲取部2、聲響分析部3。接著,對本實施方式1所涉及的語音識別裝置的圖2及圖3的各結(jié)構(gòu)要素進(jìn)行詳細(xì)說明。語音輸入部1從外部(例如用戶)獲取語音。語音獲取部2對由語音輸入部1獲取的語音進(jìn)行數(shù)字信號化,從而生成語音信號。聲響分析部3對語音信號進(jìn)行分析并轉(zhuǎn)換成聲響特征的矢量序列或聲響特征的時間序列。語音識別部4利用規(guī)定有語音識別對象的詞匯的語音識別辭典5,進(jìn)行輸入語音(聲響特征的矢量序列或聲響特征的時間序列)的語音識別。其結(jié)果是,語音識別部4從語音識別辭典5的詞匯中輸出最正確的詞匯。本實施方式1中,語音識別部4包含多個語言用語音識別部即語言用語音識別部4a、4b、4c(以下匯總記載為“語言用語音識別部4a~4c”)。語言用語音識別部4a~4c分別是能利用預(yù)先設(shè)定的語言的音素進(jìn)行語音識別的語音識別引擎。例如,語言用語音識別部4a具有用于識別與自身相對應(yīng)的語言a的聲響模型(未圖示),能利用該語言a的音素進(jìn)行語音識別。語言用語音識別部4b及語言用語音識別部4c也同樣地構(gòu)成,分別能利用與自身相對應(yīng)的語言b及語言c的音素進(jìn)行語音識別。另外,以下的說明中,將與各個語言用語音識別部4a~4c相對應(yīng)的語言記載為“對應(yīng)語言”,將不同于對應(yīng)語言的語言記載為“其他語言”。具體而言,語言a對于語言用語音識別部4a而言為對應(yīng)語言a,而對于語言用語音識別部4b而言為其他語言a。語音識別部4適當(dāng)利用語言用語音識別部4a~4c中的任一個語言用語音識別部,從而能適當(dāng)?shù)剡M(jìn)行對應(yīng)語言a~c中的一個的語音識別。語音識別辭典5規(guī)定有語音識別對象的詞匯。本實施方式1中,語音識別辭典5包含多個作為第1辭典的地名辭典51a、51b、51c(以下匯總記載為“地名辭典51a~51c”),門牌辭典52aa、52bb、52cc,多個作為第2辭典的門牌辭典52ba、52ca、52ab、52cb、52ac、52bc。另外,以下的說明中,將門牌辭典52ba、52ca、52ab、52cb、52ac、52bc匯總記載為“門牌辭典52ba~52bc”。地名辭典51a~51c是用于由語言用語音識別部4a~4c分別利用對應(yīng)語言a~c的音素進(jìn)行地名的詞匯(第1詞匯)的語音識別的辭典。例如,地名辭典51a中規(guī)定有主要使用對應(yīng)語言a的地名的詞匯。語言用語音識別部4a利用上述地名辭典51a,從而能根據(jù)對應(yīng)語言a的音素的輸入語音來進(jìn)行確定對應(yīng)語言a的音素的地名的語音識別。然而,由于通常對應(yīng)語言a的音素與語言b、c的音素不同,語言用語音識別部4a無法根據(jù)不同于對應(yīng)語言a的其他語言b、c等的音素的輸入語音來進(jìn)行確定對應(yīng)語言a的音素的地名的語音識別。該情況對于語言用語音識別部4b、4c而言也同樣。地名辭典52aa、52bb、52cc是用于由語言用語音識別部4a~4c分別利用對應(yīng)語言a~c的音素進(jìn)行門牌(housenumber)的詞匯(第1詞匯)的語音識別的辭典。例如,語言用語音識別部4a利用門牌辭典52aa,從而能根據(jù)對應(yīng)語言a的音素的輸入語音來進(jìn)行確定對應(yīng)語言a的音素的門牌的語音識別。該情況對于語言用語音識別部4b、4c而言也同樣。門牌辭典52ba、52ca是用于由語言用語音識別部4a將其他語言b、c的音素置換為對應(yīng)語言a的音素并進(jìn)行門牌的詞匯(第2詞匯、預(yù)先設(shè)定的數(shù)字的詞匯)的語音識別的辭典。圖4是用于說明門牌辭典52aa、52ba、52ca的圖。如圖4所示,對除門牌辭典52aa以外的門牌辭典52ba、52ca實施音素的映射。門牌辭典52ba是將關(guān)于門牌的詞匯(第2詞匯,預(yù)先設(shè)定的數(shù)字的詞匯)的其他語言b的音素b映射到對應(yīng)語言a的音素a中的與該音素b相同或最接近的音素a的語音識別辭典。門牌辭典52ca是將關(guān)于門牌的詞匯(第2詞匯,預(yù)先設(shè)定的數(shù)字的詞匯)的其他語言c的音素c映射到對應(yīng)語言a的音素a中的與該音素c相同或最接近的音素a的語音識別辭典。另外,能對音素的映射應(yīng)用例如專利文獻(xiàn)1所公開的技術(shù)等。語言用語音識別部4a利用門牌辭典52aa,從而能根據(jù)對應(yīng)語言a的音素的輸入語音進(jìn)行確定對應(yīng)語言a的音素的門牌的語音識別。語言用語音識別部4a利用門牌辭典52ba,從而能將其他語言b的音素的輸入語音置換為對應(yīng)語言a的音素中的相同或類似的音素的語音,根據(jù)置換后的輸入語音進(jìn)行確定對應(yīng)語言a的音素的門牌的語音識別。語言用語音識別部4a利用門牌辭典52ca,從而能將其他語言c的音素的輸入語音置換為對應(yīng)語言a的音素中的相同或類似的音素的語音,根據(jù)置換后的輸入語音進(jìn)行確定對應(yīng)語言a的音素的門牌的語音識別。如上所述,語言用語音識別部4a能利用門牌辭典52aa、52ba、52ca進(jìn)行語音識別。以上對門牌辭典52ba、52ca進(jìn)行了說明,但圖2、3的門牌辭典52ab、52cb、52ac、52bc也同樣。也就是說,門牌辭典52ab、52cb是用于由語言用語音識別部4b將其他語言a、c的音素置換為對應(yīng)語言b的音素并進(jìn)行門牌的詞匯的語音識別的語音識別辭典,是將關(guān)于門牌的詞匯的其他語言a、c的音素映射到對應(yīng)語言b的音素的語音識別辭典。門牌辭典52ac、52bc是用于由語言用語音識別部4c將其他語言a、b的音素置換為對應(yīng)語言c的音素并進(jìn)行門牌的詞匯的語音識別的語音識別辭典,是將關(guān)于門牌的詞匯的其他語言a、b的音素映射到對應(yīng)語言c的音素的語音識別辭典。語音識別語言設(shè)定部6從語言用語音識別部4a~4c中設(shè)定語音識別所要使用的一個語言用語音識別部。本實施方式1中,由用戶預(yù)先設(shè)定上述導(dǎo)航系統(tǒng)中的目的地(例如經(jīng)由地、最終到達(dá)地等),語音識別語言設(shè)定部6基于該目的地設(shè)定語音識別所要使用的一個語言用語音識別部。例如,語音識別語言設(shè)定部6預(yù)先存儲有將多個地區(qū)和各地區(qū)所主要使用的語言相對應(yīng)的表格。然后,語音識別語言設(shè)定部6從該表格中獲取與目的地的地名所屬地區(qū)相對應(yīng)的語言,設(shè)定對該獲取到的語言進(jìn)行語音識別的語言用語音識別部。以下的說明中,將語音識別語言設(shè)定部6所設(shè)定的語言用語言識別部記載為“設(shè)定語音識別部”。接著,對由語音識別辭典設(shè)定部7所進(jìn)行的地名辭典及門牌辭典的設(shè)定進(jìn)行說明。語音識別辭典設(shè)定部7從地名辭典51a~51c中設(shè)定用于由設(shè)定語音識別部(設(shè)定于語音識別語言設(shè)定部6的語言用語音識別部)利用對應(yīng)語言的音素進(jìn)行地名的語音識別的地名辭典。例如,在設(shè)定語音識別部是語言用語音識別部4a的情況下,語音識別辭典設(shè)定部7設(shè)定地名辭典51a。此外,在系統(tǒng)設(shè)定語言(由導(dǎo)航系統(tǒng)設(shè)定的語言)與設(shè)定語音識別部的對應(yīng)語言相同的情況下,語音識別辭典設(shè)定部7從門牌辭典52aa、52bb、52cc中設(shè)定用于由設(shè)定語音識別部利用對應(yīng)語言的音素進(jìn)行門牌的語音識別的門牌辭典。例如,在設(shè)定語音識別部是語言用語音識別部4a,系統(tǒng)設(shè)定語言是語言用語音識別部4a的對應(yīng)語言a的情況下,語音識別辭典設(shè)定部7設(shè)定門牌辭典52aa。另一方面,在系統(tǒng)設(shè)定語言是不同于設(shè)定語音識別部的對應(yīng)語言的其他語言的情況下,語音識別辭典設(shè)定部7從門牌辭典52ba~52bc中設(shè)定用于由設(shè)定語音識別部將其他語言的音素置換為對應(yīng)語言的音素并進(jìn)行門牌的語音識別的門牌辭典。例如,在設(shè)定語音識別部是語言用語音識別部4a、系統(tǒng)設(shè)定語言是語言用語音識別部4a的其他語言b的情況下,語音識別辭典設(shè)定部7設(shè)定門牌辭典52ba。也就是說,在系統(tǒng)設(shè)定語言是其他語言的情況下,語音識別辭典設(shè)定部7將其他語言與系統(tǒng)設(shè)定語言相同的門牌辭典設(shè)定作為用于由設(shè)定語音識別部將其他語言的音素置換為對應(yīng)語言的音素并進(jìn)行語音識別的門牌辭典。另外,設(shè)定語音識別部構(gòu)成為對于輸入語音的輸入順序的預(yù)先設(shè)定的第1部分進(jìn)行利用了地名辭典(地名辭典51a~51c中的任一個地名辭典)的語音識別。并且,設(shè)定語音識別部構(gòu)成為對于輸入語音的輸入順序的預(yù)先設(shè)定的第2部分進(jìn)行利用了門牌辭典(門牌辭典52aa、52bb、52cc及門牌辭典52ba~52bc中的任一個門牌辭典)的語音識別。此處,通常在語音輸入地址的一個話語中,地名比門牌先說出的情況較多,因此,本實施方式1中,將上述第1部分應(yīng)用于輸入語音的輸入順序的前半部分,將上述第2部分應(yīng)用于輸入語音的輸入順序的后半部分。<動作>圖5是表示本實施方式1所涉及的語音識別裝置的動作的流程圖。另外,以下的說明中,以如下情況為例進(jìn)行說明:即、目的地為德國的地址(目的地的語言為德語),系統(tǒng)設(shè)定語言為英語,德語的語言用語音識別部為語言用語音識別部4a,德語的地名辭典為地名辭典51a,將英語的音素映射到德語的音素的門牌辭典為門牌辭典52ba。然而,這僅是一個示例,并不限于此。首先,步驟s1中,語音輸入部1獲取(接受)來自用戶的語音(話語)。步驟s2中,語音獲取部2根據(jù)由語音輸入部1獲取的語音來生成語音信號。步驟s3中,聲響分析部3對語音信號進(jìn)行分析并轉(zhuǎn)換成聲響特征的矢量序列或聲響特征的時間序列等。步驟s4中,語音識別語言設(shè)定部6基于目的地從語言用語音識別部4a~4c中設(shè)定(選定)語言用語音識別部。上述示例中,由于目的地是德國的地名,因此語音識別語言設(shè)定部6設(shè)定德語的語言用語音識別部4a。即,設(shè)定語音識別部成為德語的言語用語音識別部4a。步驟s5中,語音識別辭典設(shè)定部7從地名辭典51a~51c中設(shè)定(選定)用于由設(shè)定語音識別部利用對應(yīng)語言的音素進(jìn)行地名的語音識別的地名辭典。上述示例中,設(shè)定語音識別部為德語的語言用語音識別部4a,因此語音識別辭典設(shè)定部7設(shè)定德語的地名辭典51a。步驟s6中,語音識別辭典設(shè)定部7從門牌辭典52aa、52bb、52cc及地名辭典52ba~52bc中設(shè)定(選定)用于由設(shè)定語音識別部利用系統(tǒng)設(shè)定語言的音素進(jìn)行語音識別的門牌辭典。上述示例中,設(shè)定語音識別部是德語的語言用語音識別部4a,系統(tǒng)設(shè)定語言是英語,因此語音識別辭典設(shè)定部7設(shè)定將英語的音素映射到德語的音素的門牌辭典52ba。步驟s7中,語音識別部4參照語音識別辭典5,對經(jīng)聲響分析的聲響數(shù)據(jù)進(jìn)行語音識別,輸出最正確的識別結(jié)果。上述示例中,德語的語言用語音識別部4a對輸入語音的輸入順序的前半部分進(jìn)行利用了地名辭典51a的語音識別,對輸入語音的輸入順序的后半部分進(jìn)行利用了實施映射后的門牌辭典52ba的語音識別。步驟s7中從語音識別部4輸出的識別結(jié)果從未圖示的揚聲器進(jìn)行語音輸出,或顯示于未圖示的顯示器裝置中。之后,結(jié)束圖5的動作。<實施方式1的總結(jié)>例如,假設(shè)作為用戶的英國人(系統(tǒng)設(shè)定語言為英語)將德國的地址作為目的地進(jìn)行語音輸入的情況。此時,預(yù)想在英國人以德語的發(fā)音說出德國的地名(例如“stuttgartneckarstrasse”)后,以英語的發(fā)音說出門牌(例如“one,two,three(1,2,3)”)的情況。此處,本實施方式1所涉及的語音識別裝置例如能利用第1辭典(地名辭典51a~51c)對“stuttgartneckarstrasse”進(jìn)行語音識別。然后,本實施方式1所涉及的語音識別裝置能例如利用對“one,two,three”實施音素的映射后的第2辭典(門牌辭典52ba~52bc)進(jìn)行語音識別。根據(jù)上述結(jié)構(gòu),能對例如混合存在有德語及英語等多個語言的一個話語進(jìn)行語音識別。此外,由于對地名等不實施音素的映射,從而能降低實施了數(shù)據(jù)大小較大的音素的映射的語音識別辭典的比例。其結(jié)果是,能抑制語音識別辭典的數(shù)據(jù)大小。并且,也能期待誤識別的降低。此外,本實施方式1所涉及的語音識別裝置對輸入語音的輸入順序的預(yù)先設(shè)定的第1部分進(jìn)行利用了地名辭典的語音識別,對輸入語音的輸入順序的預(yù)先設(shè)定的第2部分進(jìn)行利用了門牌辭典的語音識別。由此,能提高語音識別的精度。<實施方式1的變形例>實施方式1中,實施了音素的映射的各第2辭典(門牌辭典52ba~52bc)的第2詞匯是門牌的詞匯。然而,并不限于此,各第2辭典的第2詞匯可以應(yīng)用郵政編碼等預(yù)先設(shè)定的數(shù)字的詞匯。此外,各第2辭典的第2詞匯也可以應(yīng)用導(dǎo)航系統(tǒng)中poi(pointofinterest:興趣點)的預(yù)先設(shè)定的目錄的詞匯。并且,在系統(tǒng)設(shè)定語言是其他語言的情況下,語音識別辭典設(shè)定部7將其他語言與系統(tǒng)設(shè)定語言相同的第2辭典設(shè)定作為用于由設(shè)定語音識別部將其他語言的音素置換為對應(yīng)語言的音素并進(jìn)行上述目錄的詞匯的語音識別的第2辭典。例如,假設(shè)在輸入了“worldheritage(世界遺產(chǎn))”這種英語的poi的目錄的語音后輸入了“aachenerdom”這種德語的poi的語音的情況。對于該假設(shè),可以在德語的言語用語音識別部4a對輸入語音的輸入順序的前半部分進(jìn)行利用了將英語的音素映射到德語的音素的第2辭典的語音識別,對輸入語音的輸入順序的后半部分進(jìn)行利用了德語的第1辭典的語音識別。在采用以上結(jié)構(gòu)的情況下,對于目錄及poi也能獲得與實施方式1相同的效果。此外,各第2辭典的第2詞匯也可以應(yīng)用導(dǎo)航系統(tǒng)中預(yù)先設(shè)定的命令的詞匯。并且,在系統(tǒng)設(shè)定語言是其他語言的情況下,語音識別辭典設(shè)定部7將其他語言與系統(tǒng)設(shè)定語言相同的第2辭典設(shè)定作為用于由設(shè)定語音識別部將其他語言的音素置換為對應(yīng)語言的音素并進(jìn)行上述命令的詞匯的語音識別的第2辭典。例如,假設(shè)在輸入了“navigateto(導(dǎo)航去)”這種英語的命令的語音后輸入“aachenerdom”這種德語的poi的語音的情況。對于該假設(shè),可以在德語的言語用語音識別部4a對輸入語音的輸入順序的前半部分進(jìn)行利用了將英語的音素映射到德語的音素的第2辭典的語音識別,對輸入語音的輸入順序的后半部分進(jìn)行利用了德語的第1辭典的語音識別。在采用以上結(jié)構(gòu)的情況下,也能獲得與實施方式1同樣的效果。另外,例如在輸入了“play(播放)”這種英語的命令的語音后輸入表示德語的曲名的語音的情況、及在輸入了“call(呼叫)”這種英語的命令的語音后輸入表示德語的人名的語音的情況也相同。另外,在實施方式1說明的結(jié)構(gòu)中,利用未對地名實施音素的映射的第1辭典,利用對門牌實施了音素的映射的第2辭典。然而,并不限于此,也可以利用未對門牌實施了音素的映射的第1辭典,對地名實施了音素的映射的第2辭典。然而,如實施方式1所示,相比對大量存在的地名進(jìn)行音素的映射的情況,對僅少量存在的門牌進(jìn)行音素的映射的情況能更有效地抑制語音識別辭典的數(shù)據(jù)大小。另外,以上說明的變形例也能應(yīng)用于后述的實施方式2及之后的實施方式中。<實施方式2>實施方式1中,作為由用戶預(yù)先設(shè)定導(dǎo)航系統(tǒng)中的目的地(例如經(jīng)由地、最終到達(dá)地等)的情況,語音識別語言設(shè)定部7基于該目的地設(shè)定了語音識別所要使用的一個語言用語音識別部。然而,實際的運用中,有時在說話前并未預(yù)先設(shè)定上述目的地。因此,如以下說明的那樣,本實施方式2中,即使未預(yù)先設(shè)定目的地,也能進(jìn)行與實施方式1同樣的動作。圖6是表示本實施方式2所涉及的語音識別裝置的結(jié)構(gòu)的框圖。另外,本實施方式2所涉及的語音識別裝置中,對與以上說明的結(jié)構(gòu)要素相同或類似的部分標(biāo)注相同的參照標(biāo)號,并主要對不同部分進(jìn)行說明。圖6的語音識別裝置除了圖3的結(jié)構(gòu)要素以外還具備語音存儲部8及一次識別結(jié)果判定部9。此處,語音識別部8與圖1的存儲器82等存儲裝置相對應(yīng)。一次識別結(jié)果判定部9通過由圖1的處理器81執(zhí)行存儲于存儲器82等存儲裝置中的程序,從而作為該處理器81的功能來實現(xiàn)。另外,上述功能也可以由多個處理器81來協(xié)作實現(xiàn)。語音存儲部8為了對于一個輸入語音由語音識別部4進(jìn)行多次語音識別而暫時存儲該一個輸入語音(此處為由聲響分析部3轉(zhuǎn)換后的聲響特征的矢量序列或聲響特征的時間序列)。語音存儲部8在每次語音識別時都能利用即可,這樣的語音存儲部8能利用現(xiàn)有技術(shù)來實現(xiàn),因此省略語音存儲部8的詳細(xì)說明及動作。另外,如后文詳細(xì)說明的那樣,本實施方式2中,對于一個輸入語音,由語音識別部4進(jìn)行兩次的語音識別。通過其中第一次的語音識別來獲取目的地的語言。即,在進(jìn)行了第一次的語音識別后,成為實質(zhì)上與預(yù)先設(shè)定了目的地的狀態(tài)相同的情況。然后,在第二次的語音識別中進(jìn)行與實施方式1同樣的語音識別。本實施方式2中,語音識別辭典5包含多個地名辭典51a~51c、門牌及命令辭典53aa、53bb、53cc、多個作為第2辭典的門牌及命令辭典53ba、53ca、53ab、53cb、53ac、53bc。另外,以下的說明中,將門牌及命令辭典53ba、53ca、53ab、53cb、53ac、53bc匯總記載為“門牌及命令辭典53ba~53bc”。并且,語音識別辭典5還包含多個作為第3辭典的命令及垃圾辭典54a、54b、54c(以下匯總記載為“命令及垃圾辭典54a~54c”)。語音識別辭典5中的地名辭典51a~51c與實施方式1所涉及的地名辭典51a~51c相同。門牌及命令辭典53aa、53bb、53cc是將實施方式1所涉及的門牌辭典52aa、52bb、52cc的門牌置換為門牌及導(dǎo)航系統(tǒng)的命令后的辭典。因此,例如語言用語音識別部4a利用門牌及命令辭典53aa,從而能根據(jù)對應(yīng)語言a的音素的輸入語音來進(jìn)行確定對應(yīng)語言a的音素的地名及命令的語音識別。另外,設(shè)為導(dǎo)航系統(tǒng)的命令包含“navigatetogermany(導(dǎo)航去德國)”及“navigatetofrench(導(dǎo)航去法國)”等。門牌及命令辭典53ba~53bc是將實施方式1所涉及的門牌辭典52ba~52bc的門牌置換為門牌及導(dǎo)航系統(tǒng)的命令后的辭典。因此,例如語言用語音識別部4a利用門牌及命令辭典53ba,從而能根據(jù)其他語言b的音素的輸入語音,將該其他語言b的音素置換為對應(yīng)語言a的音素,并能根據(jù)置換后的輸入語音進(jìn)行確定對應(yīng)語言a的音素的門牌及命令的語音識別。命令及垃圾辭典54a~54c是用于由各個語言用語音識別部4a~4c分別利用對應(yīng)語言的音素進(jìn)行包含垃圾識別在內(nèi)的第一次的語音識別的辭典。下面,以如下情況為例進(jìn)行說明:即、命令及垃圾辭典54a的對應(yīng)語言a為德語,“navigierendeutschland”及“navigierenfrankreich”等導(dǎo)航系統(tǒng)的命令被設(shè)定于命令及垃圾辭典54a。此外,以如下情況為例進(jìn)行說明:即、命令及垃圾辭典54b的對應(yīng)語言b為英語,“navigatetogermany”及“navigatetofrench”等導(dǎo)航系統(tǒng)的命令被設(shè)定于命令及垃圾辭典54b。然而,這些僅是一個示例,并不限于此。垃圾識別是利用被稱為垃圾聲響模型的模型來進(jìn)行識別的識別方法。根據(jù)上述垃圾識別,無論對于何種話語,均能輸出表示該話語與辭典內(nèi)的幾個詞匯分別一致的程度的識別分?jǐn)?shù)。例如,英語的語言用語音識別部4b利用命令及垃圾辭典54b進(jìn)行包含垃圾識別在內(nèi)的語音識別。該情況下,無論輸入語音是“navigatetogermanystuttgartneckarstrasse”及“navigatetogermanyaachenerdom”的哪一個,語言用語音識別部4b對“navigatetogermany<...>”的語音識別的結(jié)果賦予比“navigatetofrench<…>”等的語音識別的結(jié)果要高的識別分?jǐn)?shù)。另外,<…>通常是表示垃圾識別結(jié)果的記號。本實施方式2中,對導(dǎo)航系統(tǒng)中預(yù)先設(shè)定的多個命令進(jìn)行如上所述的垃圾識別。并且,各命令設(shè)為包含表示可設(shè)定為導(dǎo)航系統(tǒng)的目的地的地名、國名、以及它們所使用的語言的至少一個的詞匯(例如上述的deutschland、frankreich、germany、french等)。一次識別結(jié)果判定部9基于利用了命令及垃圾辭典54a~54c的第一次的語音識別的結(jié)果中所包含的垃圾識別的結(jié)果,來判定第二次的語音識別所要使用的語言。本實施方式2中,一次識別結(jié)果判定部9基于垃圾識別的結(jié)果從多個命令中決定一個命令,基于該一個命令中所包含的地名、國名及表示它們所使用的語言的至少一種語言的詞匯,來判定第二次的語音識別所要使用的語言。例如,作為使用了命令及垃圾辭典54a~54c的第一次的語音識別的結(jié)果中所包含的垃圾識別的結(jié)果,“navigatetogermany<…>”的識別分?jǐn)?shù)最高。該情況下,一次識別結(jié)果判定部9將多個命令中識別分?jǐn)?shù)最高的“navigatetogermany”決定作為上述一個命令,并基于該命令中所包含的“germany”將第二次的語音識別所使用的語言判定為“德語”。語音識別辭典設(shè)定部7在系統(tǒng)設(shè)定語言是其他語言的情況下,將其他語言與系統(tǒng)設(shè)定語言相同的門牌及命令辭典設(shè)定作為用于由設(shè)定語音識別部將其他語言的音素置換為對應(yīng)語言的音素并進(jìn)行門牌及命令(第2詞匯)的語音識別的門牌及命令辭典53ba~53bc。<動作>圖7是表示本實施方式2所涉及的語音識別裝置的動作的流程圖。另外,下面以如下情況為例進(jìn)行說明:即、系統(tǒng)設(shè)定語言為英語,德語的語言用語音識別部是語言用語音識別部4a,英語的語言用語音識別部是語言用語音識別部4b,德語的地名辭典為地名辭典51a,將英語的音素映射到德語的音素后的門牌及命令辭典為門牌及命令辭典53ba,英語的命令及垃圾辭典為命令及垃圾辭典54b。并且,以如下情況為例進(jìn)行說明:英語發(fā)音的命令“navigatetogermany”、德語發(fā)音的地名“stuttgartneckarstrasse”、英語發(fā)音的門牌“one,two,three”被依次輸入。然而,這僅是一個示例,并不限于此。首先,步驟s11~s13中進(jìn)行與實施方式1所涉及的步驟s1~s3相同的動作。之后,步驟s14中,語音存儲部8存儲由聲響分析部3轉(zhuǎn)換后的聲響特征的矢量序列或聲響特征的時間序列。步驟s15中,語音識別語言設(shè)定部6基于系統(tǒng)設(shè)定語言,從語言用語音識別部4a~4c中設(shè)定第一次的語音識別中所要使用的語言用語音識別部。上述示例中,系統(tǒng)設(shè)定語言為英語,因此語音識別語言設(shè)定部6設(shè)定英語的語言用語音識別部4b。另外,以下的說明中,有時也將步驟s15中語音識別語言設(shè)定部6所設(shè)定的語言用語言識別部記載為“第一次的設(shè)定語音識別部”。步驟s16中,語音識別辭典設(shè)定部7從命令及垃圾辭典54a~54c中設(shè)定用于由第一次的設(shè)定語音識別部利用對應(yīng)語言的音素進(jìn)行包含垃圾識別在內(nèi)的語音識別的命令及垃圾辭典。上述示例中,第一次的設(shè)定語音識別部為英語的語言用語音識別部4b,因此語音識別辭典設(shè)定部7設(shè)定英語的命令及垃圾辭典54b。步驟s17中,語音識別部4參照語音識別辭典5,對經(jīng)聲響分析的聲響數(shù)據(jù)進(jìn)行第一次的語音識別,輸出最正確的識別結(jié)果。上述示例中,英語的語言用語音識別部4b對輸入語音“navigatetogermanystuttgartneckarstrasseone,two,three”進(jìn)行包含利用了命令及垃圾辭典54b的垃圾識別在內(nèi)的語音識別。作為該垃圾識別的結(jié)果,對“navigatetogermany<…>”這一命令賦予最高的識別分?jǐn)?shù)。步驟s18中,一次識別結(jié)果判定部9基于垃圾識別的結(jié)果,從多個命令中決定一個命令,基于該一個命令中所包含的地名、國名及表示它們所使用的語言的至少一種語言的詞匯,來判定第二次的語音識別所要使用的語言。也就是說,一次識別結(jié)果判定部9對與實施方式1中的目的地的語言實質(zhì)相同的語言進(jìn)行判定。上述示例中,一次識別結(jié)果判定部9從多個命令中決定識別分?jǐn)?shù)最高的“navigatetogermany”,并基于該命令中所包含的“germany”將第二次的語音識別所使用的語言即目的地的語言判定為“德語”。步驟s19中進(jìn)行與實施方式1所涉及的步驟s4相同的動作。具體而言,語音識別語言設(shè)定部6基于一次識別結(jié)果判定部9判定得到的語言,從語言用語音識別部4a~4c中設(shè)定語言用語音識別部來作為第二次的語音識別所要使用的語言用語音識別部。上述示例中,由于目的地的語言是德語,因此語音識別語言設(shè)定部6設(shè)定德語的語言用語音識別部4a。另外,以下的說明中,將步驟s19中語音識別語言設(shè)定部6所設(shè)定的語言用語言識別部記載為“第二次的設(shè)定語音識別部”。步驟s20中進(jìn)行與實施方式1所涉及的步驟s5相同的動作。具體而言,語音識別辭典設(shè)定部7從地名辭典51a~51c中設(shè)定用于由第二次的設(shè)定語音識別部利用對應(yīng)語言的音素進(jìn)行地名(第1詞匯)的語音識別的地名辭典。上述示例中,第二次的設(shè)定語音識別部為德語的語言用語音識別部4a,因此語音識別辭典設(shè)定部7設(shè)定德語的地名辭典51a。步驟s21中進(jìn)行與實施方式1所涉及的步驟s6相同的動作。具體而言,語音識別辭典設(shè)定部7從門牌及命令辭典53aa、53bb、53cc和門牌及命令辭典53ba~53bc中設(shè)定用于由第二次的設(shè)定語音識別部利用系統(tǒng)設(shè)定語言的音素進(jìn)行門牌及命令(第2詞匯)的語音識別的門牌及命令辭典。上述示例中,第二次的設(shè)定語音識別部是德語的語言用語音識別部4a,系統(tǒng)設(shè)定語言是英語,因此語音識別辭典設(shè)定部7設(shè)定將英語的音素映射到德語的音素后的門牌及命令辭典53ba。步驟s22中,將存儲于語音存儲部8的聲響特征的矢量序列或聲響特征的時間序列、即與進(jìn)行第一次的語音識別后的聲響特征相同的聲響特征的矢量序列或聲響特征的時間序列輸入至語音識別部4。步驟s23中,語音識別部4參照語音識別辭典5,對輸入的聲響數(shù)據(jù)進(jìn)行第二次的語音識別,輸出最正確的識別結(jié)果。上述示例中,德語的語言用語音識別部4a對輸入語音“stuttgartneckarstrasse”進(jìn)行利用了地名辭典51a的語音識別,對輸入語音“navigatetogermany”及輸入語音“one,two,three”進(jìn)行利用了實施映射后的門牌及命令辭典53ba的語音識別。步驟s23中從語音識別部4輸出的識別結(jié)果從未圖示的揚聲器進(jìn)行語音輸出,或顯示于未圖示的顯示器裝置中。之后,結(jié)束圖7的動作。<實施方式2的總結(jié)>在如上所述的本實施方式2所涉及的語音識別裝置中,也能獲得與實施方式1相同的效果。并且,本實施方式2中,對一個輸入語音進(jìn)行包含垃圾識別在內(nèi)的第一次的語音識別,從而獲取目的地的語言,并通過設(shè)定了目的地的語言的第二次的語音識別對該一個輸入語音進(jìn)行與實施方式1同樣的語音識別。因此,能省去預(yù)先設(shè)定目的地的過程。<實施方式2的變形例>實施方式2中,在第二次的語音識別時,對輸入語音(聲響特征的矢量序列或聲響特征的時間序列)的命令部分進(jìn)行了語音識別,該語音識別利用了實施映射后的門牌及命令辭典。然而,并不限于此,若能從輸入語音(音響特征的矢量序列或音響特征的時間序列)去除命令部分(例如“navigatetogermany”),則可以在剩余的部分(例如“stuttgartneckarstrasseone,two,three”)中,對前半部分進(jìn)行利用了地名辭典的語音識別,對后半部分進(jìn)行利用了門牌辭典的語音識別。也就是說,在該情況下,不使用門牌及命令辭典53aa、53bb、53cc、53ba~53bc,而能與實施方式1同樣地使用門牌辭典52aa、52bb、52cc、52ba~52bc。此外,實施方式2中,對未設(shè)定目的地的語言的情況進(jìn)行了說明,但并不限于此。例如,在未設(shè)定要檢索的人名的語言的情況下,在依次輸入了英語發(fā)音的命令“calljapanese”、日語發(fā)音的人名“やまだたろう”時,也能與上述同樣地進(jìn)行語音識別。<其他的變形例>以上說明中,語音識別部4通過由圖1的處理器81執(zhí)行存儲于存儲器82等存儲裝置中的程序來實現(xiàn)。然而,并不限于上述作為軟件來實現(xiàn)的語音識別部4,也可以由與該語音識別部4具有同樣的功能的硬件來實現(xiàn)。也就是說,語音識別裝置可以具備作為上位概念的語音識別處理電路,該上位概念在作為軟件來實現(xiàn)的語音識別部4和與語音識別部4具有同樣的功能的硬件兩者之間是共通的。此外,語音識別裝置可以包括同樣的語言用語音識別處理電路以作為語言用語音識別部4a~4c的上位概念,包括同樣的語音識別語言設(shè)定處理電路以作為語音識別語言設(shè)定部6的上位概念,包括同樣的語音識別辭典設(shè)定處理電路以作為語音識別辭典設(shè)定部7的上位概念。同樣地,實施方式2所涉及的語音識別裝置可以具備同樣的一次識別結(jié)果判定處理電路以作為一次識別結(jié)果判定部9的上位概念。此外,以上說明的語音識別裝置不僅是能搭載于車輛的導(dǎo)航裝置,也包含將便攜式導(dǎo)航裝置(portablenavigationdevice)、通信終端(例如便攜式電話、智能手機(jī)、及平板電腦等移動終端)、安裝于上述設(shè)備的應(yīng)用程序的功能、及服務(wù)器等進(jìn)行適當(dāng)組合來作為系統(tǒng)而構(gòu)成的語音識別系統(tǒng)。該情況下,以上說明的語音識別裝置的各功能或各結(jié)構(gòu)要素可以分散地配置于構(gòu)建上述系統(tǒng)的各設(shè)備,也可以集中配置于某一個設(shè)備。另外,本發(fā)明在其發(fā)明的范圍內(nèi)能夠自由地對各實施方式和各變形例進(jìn)行組合,或者適當(dāng)?shù)貙Ω鲗嵤┓绞胶透髯冃卫M(jìn)行變形、省略。雖然對本發(fā)明進(jìn)行了詳細(xì)的說明,但上述的說明在所有的方式中均為例示,本發(fā)明并不限于此。未進(jìn)行例示的無數(shù)的變形例可在不脫離本發(fā)明的范圍的情況下設(shè)想得到。標(biāo)號說明4語音識別部、4a、4b、4c語言用語音識別部、5語音識別辭典、6語音識別語言設(shè)定部、7語音識別辭典設(shè)定部、8語音存儲部、9一次識別結(jié)果判定部、51a、51b、51c地名辭典、52aa、52ba、52ca、52ab、52bb、52cb、52ac、52bc、52cc門牌辭典、53aa、53ba、53ca、53ab、53bb、53cb、53ac、53bc、53cc門牌及命令辭典、54a、54b、54c命令及垃圾辭典。當(dāng)前第1頁12當(dāng)前第1頁12