專利名稱:聲音識(shí)別裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種具有多個(gè)聲音識(shí)別辭典以進(jìn)行聲音識(shí)別的聲音識(shí)別裝置, 特別涉及一種具有與便攜式電話等外部連接設(shè)備對(duì)應(yīng)的聲音識(shí)別辭典的聲音 識(shí)別裝置。
背景技術(shù):
一般,在聲音識(shí)別裝置中,參照聲音識(shí)別辭典中所登錄的單詞(詞匯)以進(jìn) 行聲音識(shí)別,為了提高聲音識(shí)別率,必須在聲音識(shí)別辭典中登錄較多的單詞。 因此,在聲音識(shí)別裝置中,有的具有用戶向現(xiàn)有的聲音識(shí)別辭典中追加登錄單 詞以更新聲音識(shí)別辭典的功能以及/或者生成用戶個(gè)人用的聲音識(shí)別辭典的功 能。例如,在聲音識(shí)別裝置中,有的當(dāng)生成利用聲音輸入而生成電子郵件中所 使用的聲音識(shí)別辭典時(shí),如果檢測(cè)出開(kāi)始郵件生成處理,則讀入應(yīng)用中所取得 的文件數(shù)據(jù)并分析文件數(shù)據(jù),抽出現(xiàn)有的聲音識(shí)別辭典中所不存在的未知詞, 從而生成包含所抽出的未知詞的聲音識(shí)別辭典(例如,參照專利文獻(xiàn)l)。再有,有的在生成、更新聲音識(shí)別辭典時(shí),在第l分析辭典存儲(chǔ)部中存儲(chǔ)登錄有日常所使用的詞匯的表述以及讀法等的第l分析辭典,在第2分析辭典存 儲(chǔ)部中存儲(chǔ)登錄有特殊的詞匯的表述以及讀法等的第2分析辭典, 一方面在文 本分析部中使用兩個(gè)分析辭典以進(jìn)行詞素分析,另一方面當(dāng)用讀法賦予部2向 輸入詞素賦予讀法時(shí),與第2分析辭典的登錄詞匯相關(guān)并向?qū)?yīng)表中記錄第2分 析辭典的詞匯/讀法的組合和其他候補(bǔ)/讀法候補(bǔ)的組合,利用聲音識(shí)別辭典生 成部并根據(jù)對(duì)應(yīng)表的內(nèi)容來(lái)生成聲音識(shí)別辭典,并且根據(jù)使識(shí)別詞匯與第2分 析辭典的音素表述以及其他的音素表述候補(bǔ)對(duì)應(yīng)而生成聲音識(shí)別辭典(例如,參 照專利文獻(xiàn)2)。專利文獻(xiàn)l:日本專利特開(kāi)2004 — 233577號(hào)公報(bào)(第3頁(yè) 第9頁(yè),圖1 圖9) 專利文獻(xiàn)2:日本專利特開(kāi)2003 — 271183號(hào)公報(bào)(第6頁(yè) 第12頁(yè),圖1 圖47)因?yàn)橐酝穆曇糇R(shí)別裝置是如上所述那樣構(gòu)成,所以生成、更新聲音識(shí)別 辭典時(shí)的對(duì)象限定為能夠發(fā)送接收文件數(shù)據(jù)的應(yīng)用對(duì)象,由于與聲音識(shí)別裝置 連接的外部連接設(shè)備的不同,識(shí)別時(shí)單詞的使用頻率有很大不同,而且如果考 慮到由于外部連接設(shè)備的不同而引起識(shí)別時(shí)使用的單詞、詞匯也不同,則對(duì)于 生成、更新單一的應(yīng)用對(duì)象(S卩,單一的外部連接設(shè)備)用的聲音識(shí)別辭典,就 存在著如果外部連接設(shè)備不同、則不能夠有效地進(jìn)行聲音識(shí)別的問(wèn)題。另外,在以往的聲音識(shí)別裝置中,因?yàn)樵趩我坏穆曇糇R(shí)別辭典中登錄分析 后的單詞,所以如果增加登錄單詞數(shù),則使聲音識(shí)別辭典的檢索花費(fèi)較長(zhǎng)時(shí)間, 不僅不能夠有效地進(jìn)行聲音識(shí)別,而且有時(shí)相似詞增多,降低識(shí)別率。本發(fā)明正是為了解決上述問(wèn)題而設(shè)計(jì)的,其目的在于得到一種能夠根據(jù)外 部連接設(shè)備有效地進(jìn)行聲音識(shí)別的聲音識(shí)別裝置。發(fā)明內(nèi)容本發(fā)明的聲音識(shí)別裝置,其特征在于,參照聲音識(shí)別辭典以對(duì)輸入聲音進(jìn)行聲音識(shí)別并且輸出聲音識(shí)別結(jié)果,其包括與外部連接設(shè)備連接且從外部連接設(shè)備取得其種類、同時(shí)取得登錄于外部連接設(shè)備中的數(shù)據(jù)的外部信息取得單元;從數(shù)據(jù)中將詞匯進(jìn)行抽出以作為抽出詞匯、對(duì)抽出詞匯進(jìn)行分析并且將讀法賦予該抽出詞匯以作為分析數(shù)據(jù)的詞匯抽出分析單元;以及在與種類對(duì)應(yīng)的聲音識(shí)別辭典中存儲(chǔ)分析數(shù)據(jù)的辭典生成單元,對(duì)每種外部連接設(shè)備具有聲音 識(shí)別辭典。如上所述,根據(jù)本發(fā)明,由于其構(gòu)成為對(duì)于聲音識(shí)別結(jié)果判定是否是誤 識(shí)別,如果判定為是誤識(shí)別,則切換聲音識(shí)別辭典而繼續(xù)進(jìn)行聲音識(shí)別處理, 所以用戶不進(jìn)行特別的操作,而能夠切換聲音識(shí)別辭典以進(jìn)行聲音識(shí)別,結(jié)果 具有能夠縮短聲音識(shí)別處理時(shí)間且提高識(shí)別率的效果。
圖l是與外部連接設(shè)備一起表示根據(jù)本發(fā)明實(shí)施形態(tài)l的聲音識(shí)別裝置的 一個(gè)例子的框圖。圖2是用于說(shuō)明在圖1所示的聲音識(shí)別裝置中向聲音識(shí)別辭典登錄詞匯的 流程圖。圖3是用于說(shuō)明在圖1所示的聲音識(shí)別裝置中聲音識(shí)別辭典的更新以及新 生成的流程圖。圖4是與外部連接設(shè)備一起表示根據(jù)本發(fā)明實(shí)施形態(tài)2的聲音識(shí)別裝置的 一個(gè)例子的框圖。圖5是用于說(shuō)明在圖4所示的聲音識(shí)別裝置中將聲音識(shí)別辭典設(shè)置為有效 的動(dòng)作的流程圖。圖6是與外部連接設(shè)備一起表示根據(jù)本發(fā)明實(shí)施形態(tài)3的聲音識(shí)別裝置的 一個(gè)例子的框圖。圖7是用于說(shuō)明在圖6所示的聲音識(shí)別裝置中外部信息詞匯分析單元的動(dòng) 作的流程圖。圖8是用于說(shuō)明在圖6所示的聲音識(shí)別裝置中詞匯候補(bǔ)提示單元的動(dòng)作的 示意圖,(a)以及(b)分別是表示由詞匯候補(bǔ)提示單元所提示的詞匯候補(bǔ)的例子的 示意圖。
具體實(shí)施方式
下面,為了更加詳細(xì)地說(shuō)明本發(fā)明,參照附圖來(lái)說(shuō)明用于實(shí)施本發(fā)明的最 佳形態(tài)。實(shí)施形態(tài)l圖l是表示根據(jù)本發(fā)明實(shí)施形態(tài)l的聲音識(shí)別裝置的一個(gè)例子的框圖,圖示 的聲音識(shí)別裝置10例如在汽車導(dǎo)航裝置中使用。聲音識(shí)別裝置10具有話筒等 的聲音輸入單元ll、聲音識(shí)別單元12、以及多個(gè)聲音識(shí)別辭典(下面僅稱為辭 典)13—1至13 — N(N為2以上的整數(shù)),同時(shí)具有外部信息取得單元14、外部信 息詞匯抽出單元15、外部信息詞匯分析單元16、外部信息辭典生成單元(辭典生 成單元)17、詞匯分析用辭典18、以及CDDB(光盤數(shù)據(jù)庫(kù)將與音樂(lè)CD中所收 錄的樂(lè)曲相關(guān)的信息提供給用戶的CD再生軟件或者外圍設(shè)備用的數(shù)據(jù)庫(kù))19。 然后,多個(gè)外部連接設(shè)備20—1至20 — N與外部信息取得單元14連接。另外,利用外部信息詞匯抽出單元15、外部信息詞匯分析單元16、詞匯分 析用辭典18、以及CDDB19構(gòu)成詞匯抽出分析單元,利用詞匯分析用辭典18以 及CDDB19構(gòu)成分析辭典。外部連接設(shè)備20—l至20 —N是例如便攜式電話、小型音樂(lè)播放器(例如, iPod(商品名))、鍵盤、或者PDA(Personal Digital Assistant:個(gè)人數(shù)字助理),是互不相同的裝置,辭典13—1至13 — N分別與外部連接設(shè)備20—1至20 — N對(duì)應(yīng)。 當(dāng)進(jìn)行聲音識(shí)別時(shí),將從聲音輸入單元ll所輸入的聲音給與聲音識(shí)別單元12,聲音識(shí)別單元12參照后述所生成的辭典13—1至13 — N之中的某1個(gè)來(lái)識(shí)別輸入聲音,并且輸出聲音識(shí)別結(jié)果。即,當(dāng)對(duì)外部連接設(shè)備20 — n(n為l至N的任意數(shù))進(jìn)行聲音識(shí)別時(shí),使用辭典13—n來(lái)進(jìn)行聲音識(shí)別。另外,根據(jù)上述聲音識(shí)別結(jié)果,例如,在汽車導(dǎo)航裝置中,進(jìn)行畫(huà)面的變化或者外部連接設(shè)備20 — n的操作,變化后的畫(huà)面或者外部連接設(shè)備的操作結(jié)果顯示在監(jiān)視器等上。 接著說(shuō)明動(dòng)作。如果參照?qǐng)D1及圖2來(lái)說(shuō)明辭典13—1至13—N的生成,則現(xiàn)在如果將外部連 接設(shè)備20 — n與外部信息取得設(shè)備14連接,則從外部連接設(shè)備20 — n將用于確定 設(shè)備的ID信號(hào)給與外部信息取得單元14。通過(guò)這樣,外部信息取得單元14判別 外部連接設(shè)備20 — n的種類。接著,當(dāng)外部信息取得單元14在取得存儲(chǔ)于外部連接設(shè)備20 — n內(nèi)的數(shù)據(jù) (例如,如果為便攜式電話,則為接收郵件,如果為iPod,則為曲名、藝術(shù)家名、 專輯名稱等)(步驟ST1)之后,向外部信息辭典生成單元17通知外部連接設(shè)備20 一n的類別(種類)(步驟ST2)。另外,如果變更與外部信息取得單元14連接的外 部連接設(shè)備20 — n,則同樣地要執(zhí)行步驟ST1以及ST2。將用外部信息取得單元14取得的數(shù)據(jù)給與外部信息詞匯抽出單元15,這里 抽出成為分析對(duì)象的部分(例如,接收郵件的正文、曲名、藝術(shù)家名、或者專輯 名稱等),以作為抽出數(shù)據(jù),并將其給與外部信息詞匯分析單元16(步驟ST3)。當(dāng)所抽出的數(shù)據(jù)是郵件文章那樣的文章時(shí),用外部信息詞匯分析單元16進(jìn) 行詞素分析,參照詞匯分析用辭典18,將文章劃分為單詞,將分析時(shí)所得到的 讀法賦予各單詞而得到分析數(shù)據(jù)(步驟ST4)。另一方面,當(dāng)所抽出的數(shù)據(jù)是曲名 或者藝術(shù)家名等單詞時(shí),外部信息詞匯分析單元16將其表述作為關(guān)鍵詞,來(lái)檢 索CDDB19,取得讀法并賦予該詞匯以作為分析數(shù)據(jù)。將這些分析數(shù)據(jù)從外部信息詞匯分析單元16傳遞到外部信息辭典生成單 元17,外部信息辭典生成單元17根據(jù)從外部信息取得單元14送來(lái)的外部連接設(shè) 備種類,向與外部連接設(shè)備20 — n對(duì)應(yīng)的辭典13 — n中存儲(chǔ)分析數(shù)據(jù)(步驟ST5)。 這樣,能夠與外部連接設(shè)備20—1至20 — N對(duì)應(yīng)生成辭典13 — 1至13—N。然而,上述的辭典13—1至13—N保存于存儲(chǔ)器中的辭典保存區(qū)域中,且不會(huì)被規(guī)定的用戶以外的用戶刪除。因此,每次起動(dòng)聲音識(shí)別裝置IO、或者切換外部連接設(shè)備20 —n時(shí),使用與外部連接設(shè)備20 — n對(duì)應(yīng)的辭典13 — n。接著,如果參照?qǐng)D3來(lái)詳細(xì)地說(shuō)明上述步驟ST5,則在用外部信息辭典生成 單元17將分析數(shù)據(jù)存儲(chǔ)于辭典13 — n時(shí),首先,根據(jù)外部連接設(shè)備20 — n的種類 來(lái)判定是否存在相應(yīng)的辭典13 — n(種類判定單元步驟ST6),如果不存在相應(yīng) 的辭典13 —n,則在辭典保存區(qū)域中重新生成辭典13—n(辭典生成單元步驟 ST7),并將分析數(shù)據(jù)存儲(chǔ)于該新辭典13 — n中。另一方面,在步驟ST6中,當(dāng)判定為與外部連接設(shè)備20 — n對(duì)應(yīng)的辭典13 一n存在時(shí),外部信息辭典生成單元17檢查辭典13 — n中的詞匯,檢查是否有與 分析數(shù)據(jù)一致的詞匯。即,從分析數(shù)據(jù)中抽出辭典13 — n中不存在的數(shù)據(jù)(步驟 ST8),僅將辭典13—n中不存在的分析數(shù)據(jù)保存在辭典13—n中,更新辭典13 — n(辭典更新單元步驟ST9)。然后,外部信息辭典生成單元17去除已經(jīng)存在于 辭典13 — n中的分析數(shù)據(jù)。另外,在更新辭典時(shí),也可以在存在于辭典的詞匯之中刪除不包含于分析 數(shù)據(jù)中的詞匯。通過(guò)這樣,能夠防止存儲(chǔ)于辭典中的數(shù)據(jù)量增加,其結(jié)果能夠 有效地進(jìn)行聲音識(shí)別。如上所述,根據(jù)本實(shí)施形態(tài)l,因?yàn)槭歉鶕?jù)外部連接設(shè)備的種類來(lái)生成辭 典那樣構(gòu)成,所以如果使用每個(gè)外部連接設(shè)備的辭典來(lái)進(jìn)行聲音識(shí)別,則不僅 能夠提高識(shí)別效率,而且具有提高識(shí)別率、且能夠容易地利用聲音輸入來(lái)操作 外部連接設(shè)備的效果。根據(jù)本實(shí)施形態(tài)l,如果將外部連接設(shè)備與外部信息取得單元連接,則自 動(dòng)更新對(duì)應(yīng)的辭典,其結(jié)果,具有在用戶無(wú)意識(shí)的情況下能夠進(jìn)行辭典更新的 效果。實(shí)施形態(tài)2圖4是表示根據(jù)本發(fā)明實(shí)施形態(tài)2的聲音識(shí)別裝置的一個(gè)例子的框圖,在圖 示的聲音識(shí)別裝置30中,對(duì)于與圖1所示的聲音識(shí)別裝置10具有相同的構(gòu)成要 素,標(biāo)上相同的參照編號(hào)。聲音識(shí)別裝置30還具有聲音識(shí)別辭典控制單元31, 外部信息取得單元14也將外部連接設(shè)備20 — n的種類通知聲音識(shí)別辭典控制單 元31。再參照?qǐng)D5,現(xiàn)在如果變更外部連接設(shè)備20 — n,則如上所述,在外部信息 取得單元14從外部連接設(shè)備20 — n中取得數(shù)據(jù)(步驟ST10)之后,將外部信息設(shè)備20 — n的種類通知外部信息辭典取得單元17,同時(shí)將外部信息設(shè)備20 —n的種類 通知聲音識(shí)別辭典控制單元31(步驟ST11)。根據(jù)與圖l相關(guān)的說(shuō)明,從用外部信息取得單元14取得的數(shù)據(jù)中,利用外 部信息詞匯抽出單元15抽出成為分析對(duì)象的部分以作為抽出數(shù)據(jù),并且送給外 部信息詞匯分析單元16(步驟ST12)。于是,在外部信息詞匯分析單元16中,參 照詞匯分析用辭典18或者CDDB19,得到分析數(shù)據(jù)(附帶讀法的詞匯)(步驟 ST13)。外部信息辭典生成單元17根據(jù)從外部信息取得單元14送來(lái)的外部連接 設(shè)備種類,將分析數(shù)據(jù)存儲(chǔ)于與外部連接設(shè)備20 —n對(duì)應(yīng)的辭典I3 — n中(步驟 ST14)。另一方面,聲音識(shí)別辭典控制單元31根據(jù)外部連接設(shè)備種類將與該外部連 接設(shè)備20 — n對(duì)應(yīng)的辭典13 — n設(shè)置為有效(步驟ST15)。另外,在將多個(gè)外部連 接設(shè)備與外部信息取得單元14連接時(shí),將分別與這些多個(gè)外部連接設(shè)備對(duì)應(yīng)的 辭典設(shè)置為有效。如上所述,根據(jù)本實(shí)施形態(tài)2,因?yàn)槭歉鶕?jù)外部連接設(shè)備的種類來(lái)將對(duì)應(yīng) 的辭典設(shè)置為有效那樣構(gòu)成,所以在進(jìn)行聲音識(shí)別時(shí),如果將外部連接設(shè)備與 外部信息取得單元連接,則能夠切換辭典,并且具有在用戶無(wú)意識(shí)切換辭典的 情況下、能夠進(jìn)行聲音輸入的效果。根據(jù)本實(shí)施形態(tài)2,只有對(duì)應(yīng)于與外部信息取得單元連接的外部連接設(shè)備 的辭典是有效的,其結(jié)果,具有如下效果在進(jìn)行聲音識(shí)別時(shí)能夠減少必須參 照的辭典,不僅能夠有效進(jìn)行聲音識(shí)別,而且能夠提高識(shí)別率。實(shí)施形態(tài)3圖6是表示根據(jù)本發(fā)明實(shí)施形態(tài)3的聲音識(shí)別裝置的一個(gè)例子的框圖,在圖 示的聲音識(shí)別裝置40中,對(duì)于與圖1所示的聲音識(shí)別裝置10具有相同的構(gòu)成要 素,標(biāo)上相同的參照編號(hào)。聲音識(shí)別裝置40還具有詞匯候補(bǔ)選擇單元41以及詞 匯候補(bǔ)提示單元42,如后所述,當(dāng)利用外部信息詞匯分析單元16分析用外部信 息詞匯抽出單元15抽出的抽出數(shù)據(jù)(詞匯)的結(jié)果是所得到的分析數(shù)據(jù)(附帶讀 法的詞匯)中存在著波動(dòng)時(shí)(例如,存在多個(gè)詞匯候補(bǔ)的情況),外部信息詞匯分 析單元16將該情況與詞匯候補(bǔ)提示單元42聯(lián)系。用詞匯候補(bǔ)提示單元42將多個(gè)詞匯候補(bǔ)顯示于例如監(jiān)視器(未圖示)上,從 而催促用戶進(jìn)行選擇。如果用戶利用詞匯候補(bǔ)選擇單元41從多個(gè)詞匯候補(bǔ)中選 擇l個(gè)詞匯候補(bǔ)以作為選擇詞匯,則將該選擇詞匯給與外部信息詞匯分析單元16,外部信息詞匯分析單元16將選擇詞匯作為分析數(shù)據(jù)并傳送到外部信息辭典 生成單元17。于是,外部信息辭典生成單元17根據(jù)從外部信息取得單元14送來(lái) 的外部連接設(shè)備種類,將分析數(shù)據(jù)存儲(chǔ)于與外部連接設(shè)備20 — n對(duì)應(yīng)的辭典13 一n中。再參照?qǐng)D7以及圖8,現(xiàn)在如果將iPod那樣的音樂(lè)數(shù)據(jù)再生設(shè)備作為外部連 接設(shè)備20 — n以與外部信息取得單元14連接,則如上所述,外部信息取得單元 14將外部連接設(shè)備20 — n的種類送到外部信息辭典生成單元17,同時(shí)從外部連 接設(shè)備20 — n取得數(shù)據(jù)(步驟ST16),并將該數(shù)據(jù)送到外部信息詞匯抽出單元15。外部信息詞匯抽出單元15從用外部信息取得單元14所取得的數(shù)據(jù)中抽出 成為分析對(duì)象的部分(這里,例如抽出曲名、藝術(shù)家名、以及專輯名稱等的數(shù)據(jù) 步驟ST17),作為抽出數(shù)據(jù)送到外部信息詞匯分析單元16。在外部信息詞匯分 析單元16中,首先判定抽出數(shù)據(jù)是否是郵件文章那樣的文章(步驟ST18),如果 抽出數(shù)據(jù)是文章,則外部信息詞匯分析單元16進(jìn)行詞素分析,參照詞匯分析用 辭典18,將文章劃分為單詞(詞匯),將分析時(shí)所得到的讀法賦予各單詞以得到 分析數(shù)據(jù)(步驟ST19)。該分析數(shù)據(jù)從外部信息詞匯分析單元16送到外部信息辭典生成單元17,外 部信息辭典生成單元17將分析數(shù)據(jù)存儲(chǔ)于與從外部信息取得單元14送來(lái)的外 部連接設(shè)備20 — n的種類對(duì)應(yīng)的辭典20 —n中(步驟ST20)。另一方面,在步驟ST18中,如果判定抽出數(shù)據(jù)不是文章,則在外部信息詞 匯分析單元16中將該表述作為關(guān)鍵詞以檢索CDDB19(步驟ST21),判定是否存 在作為檢索結(jié)果的詞匯(g卩,判斷是否具有一致的詞匯步驟ST22)。如果具有 一致的詞匯,則外部信息詞匯分析單元16將讀法賦予該詞匯以作為分析數(shù)據(jù)(步 驟ST23)。然后,利用外部信息辭典生成單元17來(lái)進(jìn)行步驟ST20。然而,如果曲名、藝術(shù)家名、或者專輯名稱中存在波動(dòng),則與抽出數(shù)據(jù)一 致的詞匯不存在于CDDB19中,在步驟ST22中,外部信息詞匯分析單元16判斷 為檢索結(jié)果不存在。例如,如圖8(a)所示,在外部連接設(shè)備20 — n中登錄的數(shù)據(jù) 的表述是[OOOX口],如果CDDB19中登錄的詞匯的表述是[OOOAX]以及 [OOOXA]等,則與抽出數(shù)據(jù)一致的登錄詞匯不存在于CDDB19中。在這種情 況下,在外部信息詞匯分析單元16中,將與抽出數(shù)據(jù)相似的詞匯作為詞匯候補(bǔ) 以進(jìn)行選擇(步驟ST24),并利用詞匯候補(bǔ)提示單元42在監(jiān)視器(提示部)43上提 示詞匯候補(bǔ)。10在圖8(a)所示的例子中,若在提示部43上將[OOOAX]及[OOOX]作為 詞匯候補(bǔ)進(jìn)行提示,用戶利用詞匯候補(bǔ)選擇單元41從詞匯候補(bǔ)中選擇1個(gè)詞匯 候補(bǔ)作為選擇詞匯,則在步驟ST23中,外部信息詞匯分析單元16對(duì)選擇詞匯賦 予讀法,作為分析數(shù)據(jù)。然后,利用外部信息辭典生成單元17進(jìn)行步驟ST20。在外部信息詞匯分析單元16中判定抽出數(shù)據(jù)與登錄詞匯的類似度時(shí),使用 抽出數(shù)據(jù)的表述與登錄詞匯的表述的字符串長(zhǎng)度或字符的一致數(shù)、變換為假名 時(shí)的字符串長(zhǎng)度或字符的一致數(shù)等,求出類似度(錯(cuò)誤字?jǐn)?shù)相對(duì)于字?jǐn)?shù)的比 例)。例如,類似度具有0 (完全不一致) 100 (完全一致)的情況,若類似 度是預(yù)先規(guī)定的閾值(例如80)以上,則外部信息詞匯分析單元16將該詞匯作 為詞匯候補(bǔ),利用詞匯候補(bǔ)提示單元42在提示部43上提示。在圖示的例子中, 步驟ST22及ST24相當(dāng)于類似詞匯判定單元。在圖8(b)所示的例子中,登錄于外部連接設(shè)備20 — n中的數(shù)據(jù)的表述是 [Wish Comes True],如果登錄于CDDB19中的詞匯的表述是[Wish Come True] 等,則雖然在CDDB19中不存在與抽出數(shù)據(jù)一致的登錄詞匯,但根據(jù)類似判定, 外部信息詞匯分析單元16利用詞匯候補(bǔ)提示單元42在提示部43上顯示[Wish Come True]以作為詞匯候補(bǔ)。如上所述,根據(jù)本實(shí)施形態(tài)3,由于其構(gòu)成為,即使當(dāng)與登錄于外部連接 設(shè)備中的數(shù)據(jù)的表述一致的單詞不存在時(shí),如果提示類似的詞匯候補(bǔ)以使用戶 從詞匯候補(bǔ)中選擇l個(gè)詞匯候補(bǔ),則也作為選擇詞匯登錄于辭典中,所以具有 能夠提高辭典的詞匯的精度、并且能夠降低誤識(shí)別率的效果。工業(yè)上的實(shí)用性如上所述,本發(fā)明的聲音識(shí)別裝置由于能夠根據(jù)外部連接設(shè)備來(lái)有效地進(jìn) 行聲音識(shí)別,所以適用于例如便攜式電話等中所使用的聲音識(shí)別裝置。
權(quán)利要求
1.一種聲音識(shí)別裝置,其特征在于,該聲音識(shí)別裝置參照聲音識(shí)別辭典以對(duì)輸入聲音進(jìn)行聲音識(shí)別并且輸出聲音識(shí)別結(jié)果,在該聲音識(shí)別裝置中,包括與外部連接設(shè)備連接且從該外部連接設(shè)備取得其種類、同時(shí)取得登錄于所述外部連接設(shè)備中的數(shù)據(jù)的外部信息取得單元;從所述數(shù)據(jù)中對(duì)詞匯進(jìn)行抽出以作為抽出詞匯、對(duì)該抽出詞匯進(jìn)行分析并且將讀法賦予該抽出詞匯以作為分析數(shù)據(jù)的詞匯抽出分析單元;以及在與所述種類對(duì)應(yīng)的所述聲音識(shí)別辭典中存儲(chǔ)所述分析數(shù)據(jù)的辭典生成單元,每種所述外部連接設(shè)備都具有所述聲音識(shí)別辭典。
2. 如權(quán)利要求l中所述的聲音識(shí)別裝置,其特征在于, 辭典生成單元具有接收分析數(shù)據(jù)時(shí)判定是否存在與外部連接設(shè)備的種類對(duì)應(yīng)的聲音識(shí)別辭典的 種類判定單元;如果與所述外部連接設(shè)備的種類對(duì)應(yīng)的聲音識(shí)別辭典不存在、則新生成與該 種類對(duì)應(yīng)的聲音識(shí)別辭典的辭典生成單元;以及如果與所述外部連接設(shè)備的種類對(duì)應(yīng)的聲音識(shí)別辭典存在、則更新與該種類 對(duì)應(yīng)的聲音識(shí)別辭典的辭典更新單元。
3. 如權(quán)利要求l中所述的聲音識(shí)別裝置,其特征在于,還具有接收與外部信息取得單元連接的外部連接設(shè)備的種類、并且只將與 該種類對(duì)應(yīng)的聲音識(shí)別辭典設(shè)置為有效的聲音識(shí)別辭典控制單元。
4. 如權(quán)利要求l中所述的聲音識(shí)別裝置,其特征在于, 詞匯抽出分析單元具有 分析抽出詞匯時(shí)用的分析辭典;以及如果與所述抽出詞匯一致的詞匯不存在于所述分析辭典中、則判定與該抽出 詞匯類似的詞匯是否存在于所述分析辭典中的類似詞匯判定單元,所述聲音識(shí)別裝置還包括如果與所述抽出詞匯類似的詞匯存在于所述分析 辭典中、則將該類似的詞匯作為詞匯候補(bǔ)以進(jìn)行提示的詞匯候補(bǔ)提示單元。
5.如權(quán)利要求4中所述的聲音識(shí)別裝置,其特征在于,所述聲音識(shí)別裝置還具有從利用詞匯候補(bǔ)提示單元所提示的詞匯候補(bǔ)中選擇l個(gè)詞匯候補(bǔ)作為選擇詞匯的詞匯候補(bǔ)選擇單元,詞匯分析單元將讀法賦予所述選擇詞匯以作為分析數(shù)據(jù)。
全文摘要
聲音識(shí)別裝置(10)參照聲音識(shí)別辭典以對(duì)輸入聲音進(jìn)行聲音識(shí)別并且輸出聲音識(shí)別結(jié)果,其包括與外部連接設(shè)備(20-1)至(20-N)連接且從外部連接設(shè)備取得其種類、同時(shí)取得登錄于外部連接設(shè)備中的數(shù)據(jù)的外部信息取得單元(14);從數(shù)據(jù)中將詞匯進(jìn)行抽出以作為抽出詞匯并對(duì)抽出詞匯進(jìn)行分析、并且將讀法賦予該抽出詞匯以作為分析數(shù)據(jù)的詞匯抽出分析單元(15)和(16);以及在與種類對(duì)應(yīng)的聲音識(shí)別辭典中存儲(chǔ)分析數(shù)據(jù)的辭典生成單元(17),對(duì)每種外部連接設(shè)備具有聲音識(shí)別辭典(13-1)至(13-N)。
文檔編號(hào)G10L15/06GK101326571SQ20068004643
公開(kāi)日2008年12月17日 申請(qǐng)日期2006年8月18日 優(yōu)先權(quán)日2005年12月7日
發(fā)明者岡田玲子, 大澤政信, 海老原充 申請(qǐng)人:三菱電機(jī)株式會(huì)社