專利名稱:聲音合成裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及例如在汽車導(dǎo)航裝置等中輸出引導(dǎo)聲音等的聲音合成裝 置,特別是涉及對輸出的聲音的聲調(diào)進行控制的技術(shù)。
背景技術(shù):
以往,已知有被稱為TTS(Text-to-Speech;文本聲音轉(zhuǎn)換)的技術(shù),該 TTS推斷日文的漢字和假名夾雜的和漢混淆文的讀音和聲調(diào)并進行朗讀。 作為利用了該技術(shù)的裝置,專利文獻1披露了能夠利用文本聲音轉(zhuǎn)換將接 收到的電子郵件正確無誤地加以朗讀的電子郵件終端裝置。該電子郵件終端裝置在個人信息適應(yīng)變換部中,使用電子郵件的郵件 地址、和姓名等個人信息,對應(yīng)于個人信息對接收到的電子郵件信息進行 修正,并添加補充信息。然后,在通報單元的文本聲音轉(zhuǎn)換部中,對該信 息加工后的電子郵件進行文本聲音轉(zhuǎn)換并加以通報。專利文獻l:日本專利特開2001—325191號公報然而,在上述的現(xiàn)有技術(shù)中,例如對于"三田"這樣的記述存在諸如"卄 ^夕',,或"S夕,,的多種讀法的單詞,并不一定能夠如用戶所期待的那樣朗讀, 有可能會發(fā)生誤讀。另一方面,為了防止誤讀,已知有使用僅由不包含聲調(diào)信息的"讀音" 構(gòu)成的讀音信息來進行朗讀的方法,但根據(jù)該方法,存在如下問題,艮口, 朗讀變得無聲調(diào)而平坦,難以讓人聽懂。發(fā)明內(nèi)容本發(fā)明是為了解決上述問題而完成的,提供一種能以用戶所期待的讀 音及聲調(diào)輸出聲音的聲音合成裝置。為了解決上述問題,本發(fā)明的聲音合成裝置包括聲調(diào)詞典,該聲調(diào)3詞典將記述語言的記述信息及表示讀法的讀音信息、與對該語言的讀音的 聲調(diào)進行規(guī)定的聲調(diào)信息相互對應(yīng)來加以存儲;聲調(diào)詞典檢索部,該聲調(diào) 詞典檢索部從聲調(diào)詞典中檢索與從外部輸入的記述信息及讀音信息對應(yīng)的 聲調(diào)信息,并獲取附加該檢索出的聲調(diào)信息后的讀音信息即帶聲調(diào)的讀音 信息;聲音合成部,該聲音合成部根據(jù)由聲調(diào)詞典檢索部獲取到的帶聲調(diào)的讀音信息來合成聲音波形;及聲音重放部,該聲音重放部根據(jù)由聲音合 成部合成后的聲音波形來重放聲音。根據(jù)本發(fā)明的聲音合成裝置,由于采用如下結(jié)構(gòu),即,從聲調(diào)詞典中 讀出與從外部輸入的記述信息及讀音信息對應(yīng)的帶聲調(diào)的讀音信息,根據(jù) 該讀出的帶聲調(diào)的讀音信息產(chǎn)生聲音,因此不會發(fā)生誤讀,而且能以用戶 所期待的聲調(diào)輸出聲音,
圖1是表示本發(fā)明的實施方式1的聲音合成裝置的結(jié)構(gòu)的方框圖。圖2是表示應(yīng)用了本發(fā)明的實施方式1的聲音合成裝置的汽車導(dǎo)航裝 置的結(jié)構(gòu)的方框圖。圖3是表示應(yīng)用了本發(fā)明的實施方式1的聲音合成裝置的汽車導(dǎo)航裝 置中使用的登錄地信息編輯畫面的例子的圖。圖4是表示將本發(fā)明的實施方式1的聲音合成裝置應(yīng)用于汽車導(dǎo)航裝 置時的聲調(diào)詞典檢索部中執(zhí)行的處理的流程圖。圖5是用于說明應(yīng)用了本發(fā)明的實施方式1的聲音合成裝置的汽車導(dǎo) 航裝置的動作的圖。圖6是表示本發(fā)明的實施方式2的聲音合成裝置的結(jié)構(gòu)的方框圖。圖7是表示應(yīng)用了本發(fā)明的實施方式2的聲音合成裝置的汽車導(dǎo)航裝 置的結(jié)構(gòu)的方框圖。圖8是表示應(yīng)用了本發(fā)明的實施方式2的聲音合成裝置的汽車導(dǎo)航裝 置中使用的登錄地信息編輯畫面的例子的圖。圖9是表示將本發(fā)明的實施方式2的聲音合成裝置應(yīng)用于汽車導(dǎo)航裝 置時的聲調(diào)詞典檢索部中執(zhí)行的處理的流程圖。4圖10是用于說明應(yīng)用了本發(fā)明的實施方式2的聲音合成裝置的汽車導(dǎo)航裝置的動作的圖。 標(biāo)號說明1、 la聲音合成裝置,11聲調(diào)詞典,12、 12a聲調(diào)詞典檢索部, 13 聲音合成部,14聲音重放部,15聲調(diào)檢索失敗處理部具體實施方式
下面,參照附圖詳細說明本發(fā)明的實施方式。 實施方式1.圖1是表示本發(fā)明的實施方式1的聲音合成裝置1的結(jié)構(gòu)的方框圖。 該聲音合成裝置l包括聲調(diào)詞典11、聲調(diào)詞典檢索部12、聲音合成部13、 及聲音重放部14。聲調(diào)詞典11將用于記述語言的記述信息及表示讀法的讀音信息、與對 該語言的讀音的聲調(diào)進行規(guī)定的聲調(diào)信息相互對應(yīng)來加以存儲。聲調(diào)詞典 檢索部12對該聲調(diào)詞典11進行訪問。聲調(diào)詞典檢索部12將從外部輸入的記述信息及讀音信息發(fā)送到聲調(diào)詞 典11,從聲調(diào)詞典11中檢索與這些信息對應(yīng)的聲調(diào)信息,獲取附加該檢索 出的聲調(diào)信息后的讀音信息(以下稱為"帶聲調(diào)的讀音信息")。由該聲調(diào)詞典 檢索部12獲取到的帶聲調(diào)的讀音信息被發(fā)送到聲音合成部13。聲音合成部13根據(jù)從聲調(diào)詞典檢索部12發(fā)送來的帶聲調(diào)的讀音信息 來合成聲音波形。由該聲音合成部B合成后的聲音波形被發(fā)送到聲音重放 部14。聲音重放部14例如由揚聲器構(gòu)成,根據(jù)從聲音合成部13發(fā)送來的聲 音波形輸出聲音。圖2是表示應(yīng)用了本發(fā)明的實施方式1的聲音合成裝置1的汽車導(dǎo)航 裝置的結(jié)構(gòu)的方框圖。該汽車導(dǎo)航裝置包括聲音合成裝置1、登錄地信息編 輯部21、及登錄地引導(dǎo)處理部22。登錄地信息編輯部21將如圖3所示的登錄地信息編輯畫面輸出到未圖 示的顯示裝置。用戶可使用該登錄地信息編輯畫面,輸入登錄地的記述和讀音。圖3示出輸入"自宅,,作為登錄地的記述、輸入"y夕夕,,作為登錄地的 讀音的例子。登錄地信息編輯部21將使用該登錄地信息編輯畫面輸入的登 錄地的記述及讀音加以存儲,以分別作為登錄地的記述信息及讀音信息。 該登錄地信息編輯部21中存有的記述信息及讀音信息被登錄地引導(dǎo)處理部 22讀出。登錄地引導(dǎo)處理部22在檢測出由從未圖示的當(dāng)前位置檢測裝置獲取到 的當(dāng)前位置數(shù)據(jù)所示的當(dāng)前位置接近登錄地的情況下,從登錄地信息編輯 部21中讀出與該登錄地對應(yīng)的記述信息及讀音信息,發(fā)送到聲音合成裝置 1。由此,如上所述,在聲音合成裝置1中合成聲音并加以輸出。接著,參照圖4所示的流程圖及圖2所示的汽車導(dǎo)航裝置的方框圖, 以聲調(diào)詞典檢索部12中執(zhí)行的處理為中心,說明應(yīng)用于上述汽車導(dǎo)航裝置 的實施方式1的聲音合成裝置1的動作。現(xiàn)假設(shè)利用登錄地信息編輯部21的處理己登錄如圖3所示的登錄地信 息。登錄地引導(dǎo)處理部22在檢測出接近登錄地時,從登錄地信息編輯部21 中,將作為該登錄地的記述信息存有的"自宅"及作為讀音信息存有的"7', 夕"加以讀出,發(fā)送到聲音合成裝置1的聲調(diào)詞典檢索部12。聲調(diào)詞典檢索部12首先從登錄地引導(dǎo)處理部22接受記述信息"自宅" 和讀音信息"、 '夕夕,,(步驟STll)。接著,聲調(diào)詞典檢索部12從聲調(diào)詞典U 中,檢索與記述信息"自宅"及讀音信息"y'夕,"對應(yīng)的聲調(diào)信息(步驟ST12)。 在該步驟ST12中,若檢索出對應(yīng)的聲調(diào)信息,則聲調(diào)詞典檢索部12從聲 調(diào)詞典11獲取帶聲調(diào)的讀音信息"-'夂^"。帶聲調(diào)的讀音信息的聲調(diào)位置 用"'"符號來表示。接著,聲調(diào)詞典檢索部12將步驟ST12中從聲調(diào)詞典11獲取到的帶聲 調(diào)的讀音信息"、"夕夕,,發(fā)送到聲音合成部13(步驟ST13)。此后,聲音合成 部13根據(jù)從聲調(diào)詞典檢索部12發(fā)送來的帶聲調(diào)的讀音信息"'7''》,"來合 成聲音波形,并將其發(fā)送到聲音重放部14。聲音重放部14根據(jù)從聲音合成 部13發(fā)送來的聲音波形,輸出聲音。由此,如圖5所示,在當(dāng)前位置(本 車位置)接近登錄地時,不會發(fā)生誤讀,而且以適當(dāng)?shù)穆曊{(diào)輸出讀作"^夕夕,, 的合成聲音。如上所述,根據(jù)本發(fā)明的實施方式1的聲音合成裝置,由于采用如下 結(jié)構(gòu),即,從聲調(diào)詞典11中讀出與從外部輸入的記述信息及讀音信息對應(yīng) 的帶聲調(diào)的讀音信息,而產(chǎn)生聲音,因此不會發(fā)生誤讀,而且能以用戶所 期待的聲調(diào)輸出聲音。實施方式2.圖6是表示本發(fā)明的實施方式2的聲音合成裝置la的結(jié)構(gòu)的方框圖。 該聲音合成裝置la采用如下結(jié)構(gòu),即,通過對圖1所示的實施方式1的聲 音合成裝置1的聲調(diào)詞典檢索部12添加聲調(diào)檢索失敗處理部15,從而變更 為新的聲調(diào)詞典檢索部12a。在聲調(diào)詞典檢索部12a未能從聲調(diào)詞典11中檢索出聲調(diào)信息的情況 下,聲調(diào)檢索失敗處理部15將從外部輸入的、未附加聲調(diào)信息的讀音信息 發(fā)送到聲音合成部13。圖7是表示應(yīng)用了上述實施方式2的聲音合成裝置la的汽車導(dǎo)航裝置 的結(jié)構(gòu)的方框圖。該汽車導(dǎo)航裝置僅在聲音合成裝置1被變更為聲音合成 裝置la這一點上與實施方式1的汽車導(dǎo)航裝置不同。這里,用戶使用如圖8所示的登錄地信息編輯畫面,輸入"自宅"作為 登錄地的記述,輸入與登錄地的記述不同的"'7 * 7 * "'作為登錄地的讀 音,登錄地信息編輯部21將這些被輸入的登錄地的記述及讀音分別作為登 錄地的記述信息及讀音信息加以存儲。在這種情況下,聲調(diào)詞典11中對于 記述信息"自宅,,及讀音信息""夕夕,,存儲有'力',夕夕,,的聲調(diào)信息,而不存 在與"'7 * "7 >々"對應(yīng)的聲調(diào)信息。接著,參照圖9所示的流程圖及圖7所示的汽車導(dǎo)航裝置的方框圖, 以聲調(diào)詞典檢索部12a中執(zhí)行的處理為中心,說明應(yīng)用于上述汽車導(dǎo)航裝 置的實施方式2的聲音合成裝置la的動作。在已登錄如圖8所示的登錄地信息的狀態(tài)下,登錄地引導(dǎo)處理部22在 檢測出接近登錄地時,從登錄地信息編輯部21中,將作為該登錄地的記述 信息存有的"自宅"及作為讀音信息存有的"'7 * 7 ^夕"加以讀出,發(fā)送到聲 音合成裝置la的聲調(diào)詞典檢索部12a。聲調(diào)詞典檢索部12a首先從登錄地引導(dǎo)處理部22接受記述信息"自宅"7和讀音信息"'7 * 7 〉夕"(步驟ST21)。接著,聲調(diào)詞典檢索部12a從聲調(diào) 詞典11中,檢索與記述信息"自宅"及讀音信息"'y * 7 :夕"對應(yīng)的聲調(diào)信 息(步驟ST22)。接著,聲調(diào)詞典檢索部12a檢查聲調(diào)詞典11中是否存在與記述信息及 讀音信息對應(yīng)的聲調(diào)信息(步驟ST23)。在該步驟ST23中,若判斷為存在與 記述信息及讀音信息對應(yīng)的聲調(diào)信息,則與上述實施方式1的聲音合成裝 置的動作中說明的情況相同,即,與登錄地信息為記述信息"自宅"及讀音 信息"-夕,"的情況相同,聲調(diào)詞典檢索部12a從聲調(diào)詞典ll獲取帶聲調(diào) 的讀音信息。接著,聲調(diào)詞典檢索部12a將步驟ST22中從聲調(diào)詞典11獲取到的帶 聲調(diào)的讀音信息發(fā)送到聲音合成部13(步驟ST24)。此后,聲音合成部13 根據(jù)從聲調(diào)詞典檢索部12發(fā)送來的帶聲調(diào)的讀音信息來合成聲音波形,并 將其發(fā)送到聲音重放部14。聲音重放部14根據(jù)從聲音合成部13發(fā)送來的 聲音波形,輸出聲音。由此,與上述實施方式1的聲音合成裝置1相同, 在當(dāng)前位置(本車位置)接近登錄地時,不會發(fā)生誤讀,而且以用戶所期待的 聲調(diào)輸出合成聲音。在上述步驟ST23中,若判斷為聲調(diào)詞典11中不存在與記述信息及讀 音信息對應(yīng)的聲調(diào)信息,則聲調(diào)詞典檢索部12a的聲調(diào)檢索失敗處理部15 將步驟ST21中輸入的讀音信息"7 * 7 夕"發(fā)送到聲音合成部13(步驟 ST25)。此后,聲音合成部13根據(jù)從聲調(diào)詞典檢索部12發(fā)送來的未附加聲 調(diào)信息的讀音信息"7 * ^ ;夂"來合成聲音波形,并將其發(fā)送到聲音重放 部14。聲音重放部14根據(jù)從聲音合成部13發(fā)送來的聲音波形,輸出聲音。 由此,如圖IO所示,在當(dāng)前位置(本車位置)接近登錄地時,輸出讀作"'7* 7、〉夕,,的合成聲音,雖然不是用戶所期待的聲調(diào),但不會發(fā)生誤讀。如上所述,根據(jù)本發(fā)明的實施方式2的聲音合成裝置,由于采用如下 結(jié)構(gòu),即,即使聲調(diào)詞典11中不存在與從外部輸入的記述信息及讀音信息 對應(yīng)的聲調(diào)信息時,也產(chǎn)生無聲調(diào)的聲音,因此雖然不是用戶所期待的聲 調(diào),但也能輸出合成聲音而不發(fā)生誤讀。此外,上述實施方式l及實施方式2的聲音合成裝置是以日文的和漢8混淆文作為聲音合成的對象,但也可應(yīng)用于中文。與中文的"讀音"相當(dāng)?shù)钠匆?pinyin)中包含稱為四聲的聲調(diào)信息。因而,基本上能以正確的聲調(diào)合 成聲音,而不會僅用拼音發(fā)生誤讀。然而,由于根據(jù)不含四聲的拼音和漢 字能容易理解聲調(diào),因此通常很少輸入四聲。因此,若使用"漢字"作為記述信息,使用"無四聲的拼音"作為讀音信息, 使用"有四聲的拼音"作為聲調(diào)信息,則本發(fā)明也可應(yīng)用于中文。
權(quán)利要求
1.一種聲音合成裝置,其特征在于,包括聲調(diào)詞典,該聲調(diào)詞典將記述語言的記述信息及表示讀法的讀音信息、與對該語言的讀音的聲調(diào)進行規(guī)定的聲調(diào)信息相互對應(yīng)來加以存儲;聲調(diào)詞典檢索部,該聲調(diào)詞典檢索部從所述聲調(diào)詞典中檢索與從外部輸入的記述信息及讀音信息對應(yīng)的聲調(diào)信息,并獲取附加該檢索出的聲調(diào)信息后的讀音信息即帶聲調(diào)的讀音信息;聲音合成部,該聲音合成部根據(jù)由所述聲調(diào)詞典檢索部獲取到的帶聲調(diào)的讀音信息來合成聲音波形;及聲音重放部,該聲音重放部根據(jù)由所述聲音合成部合成后的聲音波形來重放聲音。
2. 如權(quán)利要求l所述的聲音合成裝置,其特征在于, 聲調(diào)詞典檢索部包括聲調(diào)檢索失敗處理部,在未能從聲調(diào)詞典中檢索出聲調(diào)信息的情況下,該聲調(diào)檢索失敗處理部將從外部輸入的未附加聲調(diào) 信息的讀音信息發(fā)送到聲音合成部,聲音合成部根據(jù)從所述聲調(diào)檢索失敗處理部發(fā)送來的未附加聲調(diào)信息 的讀音信息來合成聲音波形。
全文摘要
本發(fā)明提供能以用戶所期待的讀音及聲調(diào)輸出聲音的聲音合成裝置。該聲音合成裝置包括聲調(diào)詞典(11),該聲調(diào)詞典(11)將用于記述語言的記述信息及表示讀法的讀音信息、與對該語言的讀音的聲調(diào)進行規(guī)定的聲調(diào)信息相互對應(yīng)來加以存儲;聲調(diào)詞典檢索部(12),該聲調(diào)詞典檢索部(12)從聲調(diào)詞典中檢索與從外部輸入的記述信息及讀音信息對應(yīng)的聲調(diào)信息,并獲取附加該檢索出的聲調(diào)信息后的讀音信息即帶聲調(diào)的讀音信息;聲音合成部(13),該聲音合成部(13)根據(jù)由聲調(diào)詞典檢索部獲取到的帶聲調(diào)的讀音信息來合成聲音波形;及聲音重放部(14),該聲音重放部(14)根據(jù)由聲音合成部合成后的聲音波形來重放聲音。
文檔編號G10L13/08GK101645266SQ200910159280
公開日2010年2月10日 申請日期2009年8月5日 優(yōu)先權(quán)日2008年8月6日
發(fā)明者古田訓(xùn), 竹里尚嘉, 藤井洋一 申請人:三菱電機株式會社