專利名稱:語(yǔ)音合成裝置,語(yǔ)音合成方法,以及程序的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種語(yǔ)音合成裝置,語(yǔ)音合成方法及其程序。
背景技術(shù):
作為用于合成語(yǔ)音的方法,已知有一種被稱為錄音編輯方法的方 法。該錄音編輯方法被用于位于基站、車(chē)輛導(dǎo)航系統(tǒng)等的語(yǔ)音輔助系 統(tǒng)。
該錄音編輯系統(tǒng)是用于將單詞與表示事先讀出該單詞的語(yǔ)音的語(yǔ) 音數(shù)據(jù)關(guān)聯(lián)起來(lái)),將要經(jīng)受語(yǔ)音合成的句子分為單詞,以及接著獲得 與這些單詞相關(guān)的語(yǔ)音數(shù)據(jù)并組合該語(yǔ)音數(shù)據(jù)的方法(例如,參見(jiàn)曰
本專利公開(kāi)No.l0-49193)。
發(fā)明內(nèi)容
如果簡(jiǎn)單地將語(yǔ)音數(shù)據(jù)段彼此組合,則該合成的語(yǔ)音就會(huì)不自然, 這是因?yàn)檎Z(yǔ)音音調(diào)分量的頻率通常會(huì)在語(yǔ)音數(shù)據(jù)段之間的邊界上發(fā)生 不連續(xù)地變化。
作為解決該問(wèn)題的方法,可以認(rèn)為該方法就是用于制備多個(gè)語(yǔ)音 數(shù)據(jù)段,其中該語(yǔ)音數(shù)據(jù)表示通過(guò)不同的韻律來(lái)讀出相同音素的語(yǔ)音,
同時(shí)對(duì)將要經(jīng)受語(yǔ)音合成的句子進(jìn)行韻律預(yù)測(cè),選擇與該預(yù)測(cè)結(jié)果相 匹配的語(yǔ)音片段數(shù)據(jù)并對(duì)其進(jìn)行組合。
但是,如果通過(guò)錄音編輯方法利用為每個(gè)音素準(zhǔn)備的語(yǔ)音數(shù)據(jù)而 獲得更自然的合成語(yǔ)音,則就需要用于存儲(chǔ)語(yǔ)音數(shù)據(jù)的存儲(chǔ)裝置具有 很大的存儲(chǔ)容量。要檢索的數(shù)據(jù)量也會(huì)變得很大。
因此,作為用于通過(guò)簡(jiǎn)單的結(jié)構(gòu)就能迅速地產(chǎn)生自然合成語(yǔ)音的 方法,可以考慮這樣一種方法,就是用于使得語(yǔ)音數(shù)據(jù)成為以大于 或長(zhǎng)于音素為單位的語(yǔ)音片段數(shù)據(jù),其中該語(yǔ)音片段數(shù)據(jù)表示波形, 并且將與該韻律預(yù)測(cè)結(jié)果匹配的語(yǔ)音片段數(shù)據(jù)與對(duì)沒(méi)有被選中的一部 分語(yǔ)音片段數(shù)據(jù)執(zhí)行該規(guī)定的合成方法而生成的語(yǔ)音片段數(shù)據(jù)進(jìn)行連 接。
利用通過(guò)規(guī)定的合成方法而得到的語(yǔ)音數(shù)據(jù)表示的語(yǔ)音的音頻質(zhì) 量通常比通過(guò)語(yǔ)音數(shù)據(jù)表'示的語(yǔ)音的音頻質(zhì)量更差一些。因此,在該 方法中,讀出的語(yǔ)音中對(duì)應(yīng)于該語(yǔ)音片段數(shù)據(jù)的部分是質(zhì)量非常高的 聲音,或者通過(guò)規(guī)定的合成方法獲得的部分是質(zhì)量非常低的聲音。這 就會(huì)使得該讀出的語(yǔ)音在總體上對(duì)聽(tīng)眾來(lái)說(shuō)是很奇怪的。
考慮到上面的情況,本發(fā)明是適宜的,并且意圖提供一種語(yǔ)音合 成裝置,語(yǔ)音合成方法以及程序,用于通過(guò)簡(jiǎn)單的結(jié)構(gòu)就能夠迅速地 生成自然的合成語(yǔ)音。
技術(shù)方案
為了實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明第一方面的語(yǔ)音合成裝置的特征 就在于包括
語(yǔ)音片段存儲(chǔ)裝置,用于存儲(chǔ)多段語(yǔ)音片段數(shù)據(jù),其中該語(yǔ)音片 段數(shù)據(jù)表示語(yǔ)音片段;
選擇裝置,用于輸入表示句子的句子信息并執(zhí)行如下處理,用于 從每段語(yǔ)音片段數(shù)據(jù)中選擇具有共用語(yǔ)音的語(yǔ)音片段數(shù)據(jù)的多個(gè)片段 以及形成該句子的讀音;
缺失部分合成裝置,用于合成表示該語(yǔ)音波形的語(yǔ)音數(shù)據(jù),其中 對(duì)于該語(yǔ)音該選擇裝置無(wú)法從形成該句子的語(yǔ)音中選擇語(yǔ)音片段數(shù) 據(jù);以及
用于通過(guò)將由該選擇裝置選擇的語(yǔ)音片段數(shù)據(jù)與由該缺失部分合 成裝置合成的語(yǔ)音數(shù)據(jù)彼此組合來(lái)生成表示合成語(yǔ)音片段的數(shù)據(jù)的裝 置;其中
該選擇裝置還包括確定裝置,用于確定具有共用語(yǔ)音的語(yǔ)音數(shù)據(jù) 與形成該句子的整個(gè)語(yǔ)音中由被選擇的語(yǔ)音數(shù)據(jù)表示的讀音的比率是 否達(dá)到了預(yù)定值;以及
如果確定該比率沒(méi)有達(dá)到預(yù)定值,則該選擇裝置取消對(duì)于該語(yǔ)音 片段數(shù)據(jù)的選擇并且進(jìn)行該語(yǔ)音片段數(shù)據(jù)無(wú)法被選擇的處理。
根據(jù)本發(fā)明第二方面的語(yǔ)音合成裝置的特征就在于包括 語(yǔ)音片段存她裝置,用于存儲(chǔ)多段語(yǔ)音片段數(shù)據(jù),其中該語(yǔ)音片 段數(shù)據(jù)表示語(yǔ)音片段;
韻律預(yù)測(cè)裝置,用于輸入表示句子的句子信息并預(yù)測(cè)形成該句子
的語(yǔ)音的韻律;
選擇裝置,用于執(zhí)行以下處理,用于從該語(yǔ)音片段數(shù)據(jù)中選擇具 有共用語(yǔ)音的語(yǔ)音片段數(shù)據(jù)的片段以及構(gòu)成該句子的讀音,其中該讀 音的韻律在預(yù)定條件下與韻律預(yù)測(cè)結(jié)果匹配;
缺失部分合成裝置,用于合成表示該語(yǔ)音片段波形的語(yǔ)音數(shù)據(jù), 其中對(duì)于該語(yǔ)音該選擇裝置無(wú)法從形成該句子的語(yǔ)音中選擇該語(yǔ)音的 語(yǔ)音片段數(shù)據(jù);以及
用于通過(guò)將由該選擇裝置選擇的語(yǔ)音片段數(shù)據(jù)與由該缺失部分合 成裝置合成的語(yǔ)音數(shù)據(jù)彼此組合來(lái)生成表示合成語(yǔ)音片段的數(shù)據(jù)的裝 置;其中
該選擇裝置還包括確定裝置,用于確定具有共用語(yǔ)音的語(yǔ)音數(shù)據(jù) 與形成該句子的整個(gè)語(yǔ)音中由被選擇的語(yǔ)音數(shù)據(jù)表示的讀音的比率是 否達(dá)到了預(yù)定值;以及
如果確定該比率沒(méi)有達(dá)到預(yù)定值,則該選擇裝置取消對(duì)于該語(yǔ)音 片段數(shù)據(jù)的選擇并且進(jìn)行該語(yǔ)音片段數(shù)據(jù)無(wú)法被選擇的處理。
該選擇裝置可以從選擇的對(duì)象中去除在預(yù)定條件下其韻律與韻律 預(yù)測(cè)結(jié)果不匹配的語(yǔ)音片段數(shù)據(jù)。
該缺失部分合成裝置可以包括
存儲(chǔ)裝置,用于存儲(chǔ)多個(gè)數(shù)據(jù)段,其中該數(shù)據(jù)表示音素或者構(gòu)成 該音素的碎片;以及
合成裝置,用于通過(guò)如下方式來(lái)合成表示該語(yǔ)音的波形的語(yǔ)音數(shù) 據(jù)標(biāo)識(shí)包括在語(yǔ)音中的音素(其中選擇裝置無(wú)法選擇該語(yǔ)音的語(yǔ)音 片段數(shù)據(jù)),從該存儲(chǔ)裝置中獲得表示被標(biāo)識(shí)的音素或者形成該音素的 碎片的數(shù)據(jù)片段,并且將它們彼此組合。
該缺失部分合成裝置可以包括
缺失部分韻律預(yù)測(cè)裝置,用于預(yù)測(cè)語(yǔ)音的韻律,其中該選擇裝置 無(wú)法選擇該語(yǔ)音的語(yǔ)音片段數(shù)據(jù);其中
該合成裝置通過(guò)如下方式來(lái)合成表示該語(yǔ)音的波形的語(yǔ)音數(shù)據(jù) 標(biāo)識(shí)包括在語(yǔ)音中的音素(其中選擇裝置無(wú)法選擇該語(yǔ)音的語(yǔ)音片段 數(shù)據(jù)),從該存儲(chǔ)裝置中獲得表示被標(biāo)識(shí)的音素或者形成該音素的碎片 的數(shù)據(jù),對(duì)該獲得的數(shù)據(jù)進(jìn)行轉(zhuǎn)換,使得該音素或者由該數(shù)據(jù)表示的 語(yǔ)音片段與通過(guò)該缺失部分韻律預(yù)測(cè)裝置的韻律預(yù)測(cè)結(jié)果相匹配,以 及將轉(zhuǎn)換后的數(shù)據(jù)段彼此組合。
該缺失部分韻律預(yù)測(cè)裝置可以根據(jù)韻律預(yù)測(cè)裝置預(yù)測(cè)的韻律來(lái)合 成表示該語(yǔ)音片段的波形的語(yǔ)音數(shù)據(jù),其中該選擇裝置無(wú)法選擇該語(yǔ) 音的語(yǔ)音片段數(shù)據(jù)。
該語(yǔ)音片段存儲(chǔ)裝置可以存儲(chǔ)表示該語(yǔ)音片段的音調(diào)的時(shí)間順序 變化的韻律數(shù)據(jù),其中該語(yǔ)音片段由與該語(yǔ)音片段數(shù)據(jù)相關(guān)的語(yǔ)音片 段數(shù)據(jù)表示;
其中該選擇裝置可以選擇具有共用語(yǔ)音的語(yǔ)音片段數(shù)據(jù)以及構(gòu)成 該句子的讀音,其中由與該語(yǔ)音片段數(shù)據(jù)相關(guān)的韻律數(shù)據(jù)表示的音調(diào)
的時(shí)間順序變化最接近于該韻律的預(yù)測(cè)結(jié)果。該語(yǔ)音合成裝置可以還包括語(yǔ)速轉(zhuǎn)換裝置,用于獲得用來(lái)指定講 述該合成語(yǔ)音的速度條件的語(yǔ)速數(shù)據(jù),以及選擇或者轉(zhuǎn)換該語(yǔ)音片段 和/或形成表示合成語(yǔ)音的數(shù)據(jù)的語(yǔ)音數(shù)據(jù),使得該語(yǔ)速數(shù)據(jù)表示在滿 足指定條件的速度下講述的語(yǔ)音。
該語(yǔ)速轉(zhuǎn)換裝置可以通過(guò)從語(yǔ)音片段數(shù)據(jù)和/或構(gòu)成表示該合成 語(yǔ)音的數(shù)據(jù)的語(yǔ)音數(shù)據(jù)中去除表示標(biāo)記的部分,或者將表示碎片的部 分增加至語(yǔ)音片段數(shù)據(jù)和/或語(yǔ)音數(shù)據(jù)來(lái)轉(zhuǎn)換該語(yǔ)音片段數(shù)據(jù)和/或該 語(yǔ)音數(shù)據(jù),使得該語(yǔ)速數(shù)據(jù)表示在滿足指定條件的速度下講述的語(yǔ)音。
該語(yǔ)音片段存儲(chǔ)裝置可以存儲(chǔ)表示與該語(yǔ)音片段數(shù)據(jù)相關(guān)的語(yǔ)音 片段數(shù)據(jù)的讀音的音標(biāo)數(shù)據(jù);其中
該選擇裝置可以將該語(yǔ)音片段數(shù)據(jù)當(dāng)作其讀音與語(yǔ)音一樣的語(yǔ)音
片段數(shù)據(jù),其中表示讀音的音標(biāo)數(shù)據(jù)與該語(yǔ)音片段數(shù)據(jù)相關(guān),并且該 讀音與形成該句子的語(yǔ)音的讀音相匹配。
根據(jù)本發(fā)明第三方面的語(yǔ)音合成方法的特征就在于包括 語(yǔ)音片段存儲(chǔ)步驟,用于存儲(chǔ)多段語(yǔ)音片段數(shù)據(jù),其中該語(yǔ)音片
段數(shù)據(jù)表示語(yǔ)音片段;
選擇步驟,用于輸入表示句子的句子信息并執(zhí)行如下處理,用于 從每段語(yǔ)音片段數(shù)據(jù)中選擇具有共用語(yǔ)音的語(yǔ)音片段數(shù)據(jù)的片段以及
形成該句子的讀音;
缺失部分合成步驟,用于合成表示該語(yǔ)音波形的語(yǔ)音數(shù)據(jù),其中 對(duì)于該語(yǔ)音該選擇裝置無(wú)法從形成該句子的語(yǔ)音中選擇該語(yǔ)音的語(yǔ)音 片段數(shù)據(jù);以及
用于通過(guò)將選擇的語(yǔ)音片段數(shù)據(jù)與合成的語(yǔ)音數(shù)據(jù)相互組合來(lái)生 成表示合成語(yǔ)音片段的數(shù)據(jù)的步驟;其中
該選擇步驟還包括確定步驟,用于確定具有共用語(yǔ)音的語(yǔ)音數(shù)據(jù) 與形成該句子的整個(gè)語(yǔ)音中由被選擇的語(yǔ)音數(shù)據(jù)表示的讀音的比率是 否達(dá)到了預(yù)定值;以及
如果確定該比率沒(méi)有達(dá)到預(yù)定值,則該選擇步驟取消對(duì)于該語(yǔ)音 片段數(shù)據(jù)的選擇并且進(jìn)行該語(yǔ)音片段數(shù)據(jù)無(wú)法被選擇的處理。
根據(jù)本發(fā)明第四方面的語(yǔ)音合成方法的特征就在于包括-語(yǔ)音片段存儲(chǔ)步驟,用于存儲(chǔ)多段語(yǔ)音片段數(shù)據(jù),其中該語(yǔ)音片
段數(shù)據(jù)表示語(yǔ)音片段;
韻律預(yù)測(cè)步驟,用于輸入表示句子的句子信息并預(yù)測(cè)構(gòu)成該句子
的語(yǔ)音的韻律;
選擇步驟,用于執(zhí)行以下處理,用于從該語(yǔ)音片段數(shù)據(jù)中選擇具 有共用語(yǔ)音的語(yǔ)音片段數(shù)據(jù)的片段以及構(gòu)成該句子的讀音,其中該讀 音的韻律在預(yù)定條件下與韻律預(yù)測(cè)結(jié)果匹配;
缺失部分合成步驟,用于合成表示該語(yǔ)音波形的語(yǔ)音數(shù)據(jù),其中 無(wú)法從形成該句子的語(yǔ)音中選擇該語(yǔ)音的語(yǔ)音片段數(shù)據(jù);以及
用于通過(guò)將被選擇的語(yǔ)音片段數(shù)據(jù)與被合成的語(yǔ)音數(shù)據(jù)相互組合 來(lái)生成表示合成語(yǔ)音的數(shù)據(jù)的步驟;其中
該選擇步驟還包括確定步驟,用于確定具有共用語(yǔ)音的語(yǔ)音數(shù)據(jù) 與形成該句子的整個(gè)語(yǔ)音中由被選擇的語(yǔ)音數(shù)據(jù)表示的讀音的比率是 否達(dá)到了預(yù)定值;以及
如果確定該比率沒(méi)有達(dá)到預(yù)定值,則該選擇步驟取消對(duì)于該語(yǔ)音 片段數(shù)據(jù)的選擇并且進(jìn)行該語(yǔ)音片段數(shù)據(jù)無(wú)法被選擇的處理。
根據(jù)本發(fā)明第五方面的程序使得計(jì)算機(jī)起到如下作用
語(yǔ)音片段存儲(chǔ)裝置,用于存儲(chǔ)多段語(yǔ)音片段數(shù)據(jù),其中該語(yǔ)音片 段數(shù)據(jù)表示語(yǔ)音片段;
選擇裝置,用于輸入表示句子的句子信息并執(zhí)行如下處理,用于 從每段語(yǔ)音片段數(shù)據(jù)中選擇具有共用語(yǔ)音的語(yǔ)音片段數(shù)據(jù)的片段以及 形成該句子的讀音;
缺失部分合成裝置,用于合成表示該語(yǔ)音波形的語(yǔ)音數(shù)據(jù),其中 對(duì)于該語(yǔ)音選擇裝置無(wú)法從形成該句子的語(yǔ)音中選擇該語(yǔ)音的語(yǔ)音片 段數(shù)據(jù);以及
用于通過(guò)將由該選擇裝置選擇的語(yǔ)音片段數(shù)據(jù)與由該缺失部分合 成裝置合成的語(yǔ)音數(shù)據(jù)相互組合來(lái)生成表示合成語(yǔ)音片段的數(shù)據(jù)的裝 置;其特征在于
該選擇裝置還包括確定裝置,用于確定具有共用語(yǔ)音的語(yǔ)音數(shù)據(jù) 與形成該句子的整個(gè)語(yǔ)音中由被選擇的語(yǔ)音數(shù)據(jù)表示的讀音的比率是 否達(dá)到了預(yù)定值;以及
如果確定該比率沒(méi)有達(dá)到預(yù)定值,則該選擇裝置取消對(duì)于該語(yǔ)音 片段數(shù)據(jù)的選擇并且進(jìn)行該語(yǔ)音片段數(shù)據(jù)無(wú)法被選擇的處理。
根據(jù)本發(fā)明第六方面的程序使得計(jì)算機(jī)起到如下作用 語(yǔ)音片段存儲(chǔ)裝置,用于存儲(chǔ)多段語(yǔ)音片段數(shù)據(jù),其中該語(yǔ)音片 段數(shù)據(jù)表示語(yǔ)音片段;
韻律預(yù)測(cè)裝置,用于輸入表示句子的句子信息并預(yù)測(cè)構(gòu)成該句子
的語(yǔ)音的韻律;
選擇裝置,用于執(zhí)行以下處理,用于從該語(yǔ)音片段數(shù)據(jù)中選擇具 有共用語(yǔ)音的語(yǔ)音片段數(shù)據(jù)的片段以及構(gòu)成該句子的讀音,其中該讀 音的韻律在預(yù)定條件下與韻律預(yù)測(cè)結(jié)果匹配;
缺失部分合成裝置,用于合成表示該語(yǔ)音波形的語(yǔ)音數(shù)據(jù),其中 對(duì)于該語(yǔ)音選擇裝置無(wú)法從形成該句子的語(yǔ)音中選擇該語(yǔ)音的語(yǔ)音片 段數(shù)據(jù);以及
用于通過(guò)將由該選擇裝置選擇的語(yǔ)音片段數(shù)據(jù)與由該缺失部分合 成裝置合成的語(yǔ)音數(shù)據(jù)相互組合來(lái)生成表示合成語(yǔ)音的數(shù)據(jù)的裝置; 其特征在于
該選擇裝置還包括確定裝置,用于確定具有共用語(yǔ)音的語(yǔ)音數(shù)據(jù) 與形成該句子的整個(gè)語(yǔ)音中由被選擇的語(yǔ)音數(shù)據(jù)表示的讀音的比率是 否達(dá)到了預(yù)定值;以及
如果確定該比率沒(méi)有達(dá)到預(yù)定值,則該選擇裝置取消對(duì)于該語(yǔ)音 片段數(shù)據(jù)的選擇并且進(jìn)行該語(yǔ)音片段數(shù)據(jù)無(wú)法被選擇的處理。
本發(fā)明的優(yōu)點(diǎn)
如上所述,根據(jù)本發(fā)明,實(shí)現(xiàn)了一種語(yǔ)音合成裝置,語(yǔ)音合成方 法,及其程序,用于通過(guò)簡(jiǎn)單的結(jié)構(gòu)就能夠迅速地生成自然的合成語(yǔ)
音
圖1為顯示根據(jù)本發(fā)明第一實(shí)施例的語(yǔ)音合成系統(tǒng)的配置的方框
圖2為示意性地顯示語(yǔ)音片段數(shù)據(jù)庫(kù)的數(shù)據(jù)結(jié)構(gòu)的圖3為顯示根據(jù)本發(fā)明第二實(shí)施例的語(yǔ)音合成系統(tǒng)的配置的方框
圖4為顯示如下情況的處理的流程圖,其中在該情況下,執(zhí)行根 據(jù)本發(fā)明第一實(shí)施例的語(yǔ)音合成系統(tǒng)的功能的個(gè)人計(jì)算機(jī)獲得了自由
文本數(shù)據(jù);
圖5為顯示如下情況的處理的流程圖,其中在該情況下,執(zhí)行根 據(jù)本發(fā)明第一實(shí)施例的語(yǔ)音合成系統(tǒng)的功能的個(gè)人計(jì)算機(jī)獲得了配信 字符串?dāng)?shù)據(jù);
圖6為顯示如下情況的處理的流程圖,其中在該情況下,執(zhí)行根 據(jù)本發(fā)明第一實(shí)施例的語(yǔ)音合成系統(tǒng)的功能的個(gè)人計(jì)算機(jī)獲得了標(biāo)準(zhǔn) 尺寸消息數(shù)據(jù)以及發(fā)聲速度數(shù)據(jù);
圖7為顯示如下情況的處理的流程圖,其中在該情況下,執(zhí)行圖 3中單元體功能的個(gè)人計(jì)算機(jī)獲得了自由文本數(shù)據(jù);
圖8為顯示如下情況的處理的流程圖,其中在該情況下,執(zhí)行圖 3中單元體功能的個(gè)人計(jì)算機(jī)獲得了配信字符串?dāng)?shù)據(jù);以及
圖9為顯示如下情況的處理的流程圖,其中在該情況下,執(zhí)行圖 3中單元體功能的個(gè)人計(jì)算機(jī)獲得了標(biāo)準(zhǔn)尺寸消息數(shù)據(jù)以及發(fā)聲速度 數(shù)據(jù)。
具體實(shí)施例方式
下面將參照附圖來(lái)描述本發(fā)明的實(shí)施例。(第一實(shí)施例)
圖1為顯示根據(jù)本發(fā)明第一實(shí)施例的語(yǔ)音合成系統(tǒng)的配置的方框圖。
如圖中所示,該語(yǔ)音合成系統(tǒng)包括單元體Ml和語(yǔ)音片段寄存器 單元R。
該單元體M1包括語(yǔ)言處理部分1,常規(guī)字典2,用戶字典3,規(guī) 則合成部分4,語(yǔ)音片段編輯部分5,檢索部分6,語(yǔ)音片段數(shù)據(jù)庫(kù)7, 擴(kuò)展部分8,以及語(yǔ)速轉(zhuǎn)換部分9。在它們之中,規(guī)則合成部分4包括 聲音處理部分41,檢索部分42,擴(kuò)展部分43以及波形數(shù)據(jù)庫(kù)44。
該語(yǔ)言處理部分1,聲音處理部分41,檢索部分42,擴(kuò)展部分43, 語(yǔ)音片段編輯部分5,檢索部分6,擴(kuò)展部分8,以及語(yǔ)速轉(zhuǎn)換部分9 中的每一個(gè)都包括處理器,例如CPU (中央處理單元),DSP (數(shù)字信 號(hào)處理器)等,以及用于存儲(chǔ)將由該處理器執(zhí)行的程序的存儲(chǔ)器,它 們都執(zhí)行將在后面描述的處理。
單個(gè)處理器可以執(zhí)行該語(yǔ)言處理部分1,聲音處理部分41,檢索 部分42,擴(kuò)展部分43,語(yǔ)音片段編輯部分5,檢索部分6,擴(kuò)展部分8, 以及語(yǔ)速轉(zhuǎn)換部分9的部分或者全部功能。因此,例如執(zhí)行擴(kuò)展部分 43的功能的處理器也能夠執(zhí)行擴(kuò)展部分8的功能。單個(gè)處理器可以涵 蓋聲音處理部分41,檢索部分42,以及擴(kuò)展部分43的功能。
該常規(guī)字典2包括非易失性存儲(chǔ)器,例如PROM (可編程只讀存 儲(chǔ)器),硬盤(pán)裝置等。在該常規(guī)字典2中,由該語(yǔ)音合成系統(tǒng)的制造商 等事先存儲(chǔ)了單詞,其中該單詞包括彼此相關(guān)的表意字(例如,漢字 字符)以及表示該單詞等的讀音的表音字(例如,假名或音標(biāo))。
該用戶字典3包括數(shù)據(jù)可重寫(xiě)非易失性存儲(chǔ)器,例如EEPROM(電
可擦除/可編程只讀存儲(chǔ)器),硬盤(pán)裝置等,以及控制電路,其用于控制 將數(shù)據(jù)寫(xiě)入到非易失性存儲(chǔ)器中去。該處理器可以執(zhí)行該控制電路的 功能。作為選擇地,執(zhí)行該語(yǔ)言處理部分1,聲音處理部分41,檢索
部分42,擴(kuò)展部分43,語(yǔ)音片段編輯部分5,檢索部分6,擴(kuò)展部分8, 以及語(yǔ)速轉(zhuǎn)換部分9的部分或者全部功能的處理器可以執(zhí)行該用戶字 典3的控制電路的功能。
該用戶字典3根據(jù)用戶的操作從外部等獲得包括表意字和表音字 (其表示該單詞等的讀音)的單詞,并且彼此相關(guān)地存儲(chǔ)它們。該用
戶字典3只需要存儲(chǔ)沒(méi)有存儲(chǔ)在常規(guī)字典2中的單詞等以及表示該單 詞等的讀音的音標(biāo)。
該波形數(shù)據(jù)庫(kù)44包括非易失性存儲(chǔ)器,例如PROM,硬盤(pán)裝置等。 該波形數(shù)據(jù)庫(kù)44存儲(chǔ)有音標(biāo),以及壓縮的波形數(shù)據(jù),其中該壓縮的波 形數(shù)據(jù)是在由該語(yǔ)音合成系統(tǒng)的制造商事先對(duì)表示由音標(biāo)表示的單位 語(yǔ)音的波形的波形數(shù)據(jù)進(jìn)行彼此相關(guān)的熵編碼時(shí)獲得的。該單位語(yǔ)音 足夠短,以至于能夠在規(guī)定的合成方法中使用,且特別地以音素或VCV (元音-輔音-元音)音節(jié)為單位被分開(kāi)的語(yǔ)音。經(jīng)受熵編碼之前的波形 數(shù)據(jù)僅僅需要包括,例如,將經(jīng)受PCM (脈沖編碼調(diào)制)數(shù)字格式數(shù) 據(jù)。
該語(yǔ)音片段數(shù)據(jù)庫(kù)7包括非易失性存儲(chǔ)器例如PROM,硬盤(pán)裝置等。
該語(yǔ)音片段數(shù)據(jù)庫(kù)7將數(shù)據(jù)存儲(chǔ)在例如圖2中所示的數(shù)據(jù)結(jié)構(gòu)中。 也就是說(shuō),如圖所示,存儲(chǔ)在該語(yǔ)音片段數(shù)據(jù)庫(kù)7中的數(shù)據(jù)被分為四 部分,即報(bào)頭部分HDR,索引部分IDX,目錄部分DIR,以及數(shù)據(jù)部 分DAT。
該數(shù)據(jù)事先由例如該語(yǔ)音合成系統(tǒng)的制造商存儲(chǔ)在語(yǔ)音片段數(shù)據(jù)
庫(kù)7中,和/或當(dāng)該語(yǔ)音片段寄存器單位R執(zhí)行將在后面描述的操作時(shí) 存儲(chǔ)該數(shù)據(jù)。
該報(bào)頭部分HDR存儲(chǔ)的數(shù)據(jù)用于識(shí)別該語(yǔ)音片段數(shù)據(jù)庫(kù)7,索引 部分IDX,目錄部分DIR,以及數(shù)據(jù)部分DAT的數(shù)據(jù)量,數(shù)據(jù)格式, 以及表示屬性,例如版權(quán)等的數(shù)據(jù)。
該數(shù)據(jù)部分DAT存儲(chǔ)壓縮語(yǔ)音片段數(shù)據(jù),其中該壓縮波形數(shù)據(jù)是 在對(duì)表示語(yǔ)音片段的波形的語(yǔ)音片段數(shù)據(jù)進(jìn)行熵編碼時(shí)獲得的。
該語(yǔ)音片段是指一系列的部分之一,其中的每一個(gè)都包括一個(gè)或 多個(gè)語(yǔ)音音素。通常,該語(yǔ)音片段由用于一個(gè)或多個(gè)單詞的部分構(gòu)成。 該語(yǔ)音片段可以包括連接詞。
經(jīng)受熵編碼之前的語(yǔ)音片段數(shù)據(jù)只需要包括與經(jīng)受熵編碼之前的 波形數(shù)據(jù)相同格式的數(shù)據(jù),用于生成上述壓縮波形數(shù)據(jù)(例如,經(jīng)受 PCM的數(shù)字格式的數(shù)據(jù))。
對(duì)于每段壓縮語(yǔ)音數(shù)據(jù),該目錄部分DIR存儲(chǔ)
(A) 表示音標(biāo)的數(shù)據(jù),其中該音標(biāo)表示用該壓縮語(yǔ)音片段數(shù)據(jù)表 示的語(yǔ)音片段的讀音(語(yǔ)音片段讀音數(shù)據(jù)),
(B) 表示存儲(chǔ)位置的頂端地址的數(shù)據(jù),其中在該存儲(chǔ)位置上存儲(chǔ) 有壓縮語(yǔ)音片段數(shù)據(jù),
(C) 表示壓縮語(yǔ)音片段數(shù)據(jù)的數(shù)據(jù)長(zhǎng)度的數(shù)據(jù)
(D) 表示用壓縮片段數(shù)據(jù)表示的語(yǔ)音片段的發(fā)聲速度(播放數(shù)據(jù) 時(shí)的時(shí)間長(zhǎng)度)的數(shù)據(jù)(速度缺省值數(shù)據(jù)),以及
(E) 表示彼此相關(guān)的語(yǔ)音片段音調(diào)分量的頻率的時(shí)間順序變化的 數(shù)據(jù)(音調(diào)分量數(shù)據(jù))。(假設(shè)地址被添加至該語(yǔ)音片段數(shù)據(jù)庫(kù)7的存 儲(chǔ)部分)。
圖2舉例說(shuō)明了如下的情況,其中具有表示語(yǔ)音片段讀音
"SAITAMA"的波形的數(shù)據(jù)的1410h個(gè)字節(jié)量的壓縮語(yǔ)音片段數(shù)據(jù)被 存儲(chǔ)在頂端地址為001A36A6h的邏輯位置上,作為包括在數(shù)據(jù)部分 DAT中的數(shù)據(jù)。(在該說(shuō)明書(shū)和附圖中,添加在末端的數(shù)字"h"表示 十六進(jìn)制數(shù)字)。
至少來(lái)自上述(A) - (E)的數(shù)據(jù)片段集合中的數(shù)據(jù)(A)(即, 語(yǔ)音片段讀音數(shù)據(jù))被存儲(chǔ)在該語(yǔ)音片段數(shù)據(jù)庫(kù)7的存儲(chǔ)器部分中, 因?yàn)樗前凑崭鶕?jù)語(yǔ)音片段讀音數(shù)據(jù)所表示的音標(biāo)確定的順序來(lái)進(jìn)行 分類的(例如,如果該音標(biāo)為假名,則根據(jù)日語(yǔ)假名表地址的降序?qū)?該數(shù)據(jù)段進(jìn)行分類)。
上述音調(diào)分量數(shù)據(jù)只需要由數(shù)據(jù)構(gòu)成,其中該數(shù)據(jù)表示關(guān)于從語(yǔ) 音片段的頭部開(kāi)始經(jīng)歷時(shí)間的線性函數(shù)的截距P以及在語(yǔ)音片段音調(diào) 分量的頻率由線性函數(shù)近似表示的情況下的斜率a 。(斜度a的單位只 需要為例如赫茲/秒,并且分?jǐn)?shù)e的單位只需要為例如赫茲)。'
假設(shè)該音調(diào)分量數(shù)據(jù)還包括表示由壓縮語(yǔ)音片段數(shù)據(jù)表示的語(yǔ)音 片段是否被作為鼻輔音讀出,以及是否被作為清輔音讀出的數(shù)據(jù)(未 示出)。
該索引部分IDX存儲(chǔ)的數(shù)據(jù)用于根據(jù)該語(yǔ)音片段讀音數(shù)據(jù)來(lái)識(shí) 別出該數(shù)據(jù)在直接部分DIR中的大致邏輯位置。特別地,它存儲(chǔ)了彼 此相關(guān)的假名字符以及表示地址范圍的數(shù)據(jù)(直接地址),其中在該地 址(目錄地址)上顯示了其開(kāi)頭字符為假名字符的語(yǔ)音片段讀音數(shù)據(jù), 假設(shè)該語(yǔ)音片段讀音數(shù)據(jù)表示假名。
單個(gè)非易失性存儲(chǔ)器可以執(zhí)行常規(guī)字典2,用戶字典3,波形數(shù)據(jù) 庫(kù)44以及語(yǔ)音片段數(shù)據(jù)庫(kù)7的部分或全部功能。
如圖中所示,該語(yǔ)音片段寄存器單元R包括記錄語(yǔ)音片段數(shù)據(jù)集 存儲(chǔ)部分10,語(yǔ)音片段數(shù)據(jù)庫(kù)生成部分11以及壓縮部分12。該語(yǔ)音
片段寄存器單元R可以可拆卸地與語(yǔ)音片段數(shù)據(jù)庫(kù)7相連。在這種情 況下,當(dāng)該語(yǔ)音片段寄存器單元R處于與該單元體Ml斷開(kāi)的狀態(tài)下 時(shí),可以使得該單元體M1指向?qū)⒃诤竺婷枋龅牟僮?,以下情況下除外, 即新數(shù)據(jù)被寫(xiě)入到該語(yǔ)音片段數(shù)據(jù)庫(kù)7中。
該記錄語(yǔ)音片段數(shù)據(jù)集存儲(chǔ)部分10包括數(shù)據(jù)可重寫(xiě)非易失性存 儲(chǔ)器,例如,硬盤(pán)裝置等。
該記錄語(yǔ)音片段數(shù)據(jù)集存儲(chǔ)部分10存儲(chǔ)了由該語(yǔ)音合成系統(tǒng)的 制造商等事先彼此相關(guān)的表示該語(yǔ)音片段的讀音的音標(biāo),以及表示當(dāng) 收集人實(shí)際發(fā)音的語(yǔ)音片段時(shí)獲得的波形的音頻片段數(shù)據(jù)。該語(yǔ)音片 段數(shù)據(jù)只需要由,例如,將經(jīng)受PCM的數(shù)字格式的數(shù)據(jù)構(gòu)成。
該語(yǔ)音片段數(shù)據(jù)庫(kù)生成部分11和壓縮部分12包括處理器,例如 CPU等,以及用于存儲(chǔ)將由該處理器執(zhí)行的程序的存儲(chǔ)器,并且執(zhí)行 根據(jù)該程序?qū)⒃诤竺婷枋龅奶幚怼?br>
單個(gè)處理器可以執(zhí)行語(yǔ)音片段數(shù)據(jù)庫(kù)生成部分11以及壓縮部分 12的部分或全部功能。執(zhí)行語(yǔ)音處理器l,聲音處理部分41,檢索部 分42,擴(kuò)展部分43,語(yǔ)音片段編輯部分5,檢索部分6,擴(kuò)展部分8, 以及語(yǔ)速轉(zhuǎn)換部分9的部分或者全部功能的處理器可以進(jìn)一步執(zhí)行該 語(yǔ)音片段數(shù)據(jù)庫(kù)生成部分11以及壓縮部分12的功能。執(zhí)行該語(yǔ)音片 段數(shù)據(jù)庫(kù)生成部分11以及壓縮部分12的功能的處理器還可以執(zhí)行作 為該記錄語(yǔ)音片段數(shù)據(jù)集存儲(chǔ)部分10的控制電路的功能。
該語(yǔ)音片段數(shù)據(jù)庫(kù)生成部分11從記錄語(yǔ)音片段數(shù)據(jù)集存儲(chǔ)部分 10中讀出彼此相關(guān)的音標(biāo)和語(yǔ)音片段數(shù)據(jù),并且識(shí)別出該語(yǔ)音音調(diào)分 量頻率的時(shí)間順序變化以及用語(yǔ)音片段數(shù)據(jù)表示的發(fā)聲速度。
例如,只需要對(duì)該語(yǔ)音片段數(shù)據(jù)的采樣數(shù)進(jìn)行計(jì)數(shù)就可以識(shí)別出 該發(fā)聲速度。 '
另一方面,例如,只需要對(duì)該語(yǔ)音片段數(shù)據(jù)進(jìn)行倒譜分析就能夠 識(shí)別出語(yǔ)音音調(diào)分量頻率的時(shí)間順序變化。特別地,由語(yǔ)音片段數(shù)據(jù) 表示的波形在時(shí)間軸上被分為多個(gè)小片斷,每個(gè)獲得的小片段的強(qiáng)度 被轉(zhuǎn)化為與初始值的對(duì)數(shù)相同的虛擬值(該對(duì)數(shù)的底數(shù)可以任意確 定),并且通過(guò)快速傅立葉變換方法(或者,用于生成表示作為離散變 量的結(jié)果的數(shù)據(jù)的另一種方法將經(jīng)受該傅立葉變換)得到其中其值改 變的每個(gè)小片斷的頻譜(即,倒譜)。接著,給出了該倒譜的最大值的 頻率中的最小值被識(shí)別作為小片段中音調(diào)分量的頻率。
如果通過(guò)按照日本專利申請(qǐng)No. 2003-108172中披露的方法將該 語(yǔ)音片段數(shù)據(jù)轉(zhuǎn)換為音調(diào)波形數(shù)據(jù)來(lái)識(shí)別出該時(shí)間順序變化,則有希 望得到識(shí)別該音調(diào)分量頻率的時(shí)間順序變化的優(yōu)選結(jié)果,'并接著根據(jù) 該音調(diào)波形數(shù)據(jù)來(lái)識(shí)別該時(shí)間順序變化。特別地,只需要過(guò)濾該語(yǔ)音 片段數(shù)據(jù)和提取該音調(diào)信號(hào),根據(jù)該提取出的音調(diào)信號(hào)將用語(yǔ)音片段 數(shù)據(jù)表示的波形分為單位音調(diào)長(zhǎng)度的部分,根據(jù)每個(gè)部分與音調(diào)信號(hào) 的相互關(guān)系來(lái)識(shí)別出相位之間的偏移,以及調(diào)整各個(gè)部分的相位就能 夠?qū)⒃撜Z(yǔ)音片段數(shù)據(jù)轉(zhuǎn)換為音調(diào)波形信號(hào)。接著,只需要通過(guò)使用得 到的音調(diào)波形信號(hào)作為語(yǔ)音片段數(shù)據(jù)來(lái)進(jìn)行倒譜分析就能夠識(shí)別出音 調(diào)分量頻率的時(shí)間順序變化。
另一方面,該語(yǔ)音片段數(shù)據(jù)生成部分11將從記錄語(yǔ)音片段數(shù)據(jù)集 存儲(chǔ)部分IO讀出的語(yǔ)音片段數(shù)據(jù)提供給壓縮部分12。
該壓縮部分12通過(guò)對(duì)由語(yǔ)音片段數(shù)據(jù)生成部分11提供的語(yǔ)音片 段數(shù)據(jù)進(jìn)行熵編碼來(lái)生成壓縮語(yǔ)音片段數(shù)據(jù),并將該壓縮語(yǔ)音片段數(shù) 據(jù)返回給語(yǔ)音片段數(shù)據(jù)生成部分11。 當(dāng)識(shí)別出該語(yǔ)音片段數(shù)據(jù)的音調(diào)分量頻率和發(fā)聲速度的時(shí)間順序 變化,并且該語(yǔ)音片段數(shù)據(jù)經(jīng)受熵編碼并通過(guò)該壓縮部分12被返回作 為壓縮語(yǔ)音片段數(shù)據(jù)時(shí),該語(yǔ)音片段數(shù)據(jù)生成部分11將該壓縮語(yǔ)音片
段數(shù)據(jù)寫(xiě)入到語(yǔ)音片段數(shù)據(jù)庫(kù)7的存儲(chǔ)器中,作為包括在數(shù)據(jù)部分DAT 中的數(shù)據(jù)。
該語(yǔ)音片段數(shù)據(jù)生成部分11將從記錄語(yǔ)音片段數(shù)據(jù)集存儲(chǔ)部分 10中讀出的音標(biāo)寫(xiě)入到語(yǔ)音片段數(shù)據(jù)庫(kù)7的存儲(chǔ)器中作為語(yǔ)音片段讀 音數(shù)據(jù),使得該音標(biāo)表示由該被寫(xiě)入的壓縮語(yǔ)音片段數(shù)據(jù)表示的語(yǔ)音 片段的讀音。
該語(yǔ)音片段數(shù)據(jù)生成部分11還識(shí)別出該語(yǔ)音片段數(shù)據(jù)庫(kù)7的存儲(chǔ) 器中的頂端地址,并將該地址寫(xiě)入到該語(yǔ)音片段數(shù)據(jù)庫(kù)7的存儲(chǔ)器中, 作為上述數(shù)據(jù)(B)。
還可以識(shí)別該壓縮語(yǔ)音片段數(shù)據(jù)的數(shù)據(jù)長(zhǎng)度,并將該識(shí)別出的數(shù) 據(jù)長(zhǎng)度寫(xiě)入到該語(yǔ)音片段數(shù)據(jù)庫(kù)7的存儲(chǔ)器中,作為數(shù)據(jù)(C)。
生成表示由壓縮語(yǔ)音片段數(shù)據(jù)表示的音調(diào)分量頻率以及語(yǔ)音片段 的發(fā)聲速度的時(shí)間順序變化的識(shí)別結(jié)果的數(shù)據(jù),并將該數(shù)據(jù)寫(xiě)入到語(yǔ) 音片段數(shù)據(jù)庫(kù)7的存儲(chǔ)器中,作為速度缺省值數(shù)據(jù)和音調(diào)分量數(shù)據(jù)。
現(xiàn)在,將描述該語(yǔ)音合成系統(tǒng)的操作。
在該說(shuō)明中,假設(shè)該語(yǔ)音處理部分1首先從外部獲得自由文本數(shù) 據(jù),其中在該自由文本數(shù)據(jù)中,包括由用戶準(zhǔn)備的表意字的句子(自 由文本)使得該語(yǔ)音合成系統(tǒng)為其合成語(yǔ)音。
這里,該語(yǔ)言處理部分1可以通過(guò)任何方法來(lái)獲得自由文本數(shù)據(jù)。
例如,它可以通過(guò)接口電路(未示出)從外部裝置或者網(wǎng)絡(luò)獲得自由 文本數(shù)據(jù),或者可以通過(guò)記錄介質(zhì)驅(qū)動(dòng)裝置從記錄介質(zhì)驅(qū)動(dòng)裝置(未
示出)中設(shè)置的記錄介質(zhì)(例如,軟盤(pán)(注冊(cè)商標(biāo))或者CD-ROM)
中讀取自由文本數(shù)據(jù)。
執(zhí)行該語(yǔ)言處理部分1的功能的處理器可以將由該處理器執(zhí)行的 其他處理中使用的文本數(shù)據(jù)傳送給該語(yǔ)言處理部分1的處理,作為自 由文本數(shù)據(jù)。
上述該處理器執(zhí)行的其他處理可以包括如下處理使得該處理器 執(zhí)行代理裝置的功能,即通過(guò)獲得表示語(yǔ)音的語(yǔ)音數(shù)據(jù),通過(guò)對(duì)語(yǔ)音 數(shù)據(jù)執(zhí)行語(yǔ)音識(shí)別來(lái)識(shí)別由該語(yǔ)音表示的語(yǔ)音數(shù)據(jù),根據(jù)該識(shí)別出的 語(yǔ)音片段來(lái)識(shí)別該語(yǔ)音的講述者請(qǐng)求的內(nèi)容,以及識(shí)別出應(yīng)該進(jìn)行的 處理,以實(shí)現(xiàn)該識(shí)別出的請(qǐng)求。
當(dāng)該語(yǔ)言處理部分1獲得自由文本數(shù)據(jù)時(shí),通過(guò)檢索該常規(guī)字典
2和用戶字典3來(lái)識(shí)別出表示包括在自由文本中的每個(gè)表意字的讀音的
音標(biāo)。接著,用該識(shí)別出的音標(biāo)來(lái)代替表意字。接著,該語(yǔ)言處理部 分1將通過(guò)用音標(biāo)來(lái)替換自由文本中的全部表意字而得到的音標(biāo)串提
供給聲音處理部分41。
當(dāng)將音標(biāo)串從語(yǔ)言處理部分1提供給該聲音處理部分41時(shí),該聲 音處理部分41指示該檢索部分42為包括在該音標(biāo)串中的每個(gè)音標(biāo)檢 索由該音標(biāo)表示的單位語(yǔ)音的波形。
響應(yīng)于該指示,該檢索部分42在該波形數(shù)據(jù)庫(kù)44中檢索表示由 包括在該音標(biāo)串中的每個(gè)音標(biāo)表示的單位語(yǔ)音的波形的壓縮波形數(shù) 據(jù)。接著,將該檢索到的壓縮波形數(shù)據(jù)提供給擴(kuò)展部分43。
該擴(kuò)展部分43在對(duì)從檢索部分42提供的壓縮波形數(shù)據(jù)進(jìn)行壓縮
之前恢復(fù)該波形數(shù)據(jù),并將該恢復(fù)后的波形數(shù)據(jù)返回給檢索部分42。
該檢索部分42將從擴(kuò)展部分43返回的波形數(shù)據(jù)提供給聲音處理部分 41,作為檢索結(jié)果。
該聲音處理部分41將從檢索部分42提供的波形數(shù)據(jù)按照在由語(yǔ) 言處理部分1提供的音標(biāo)串中排列的音標(biāo)順序提供給語(yǔ)音片段編輯部 分5。
當(dāng)將波形數(shù)據(jù)從聲音處理部分41提供給該語(yǔ)音片段編輯部分5 時(shí),該語(yǔ)音片段編輯部分5按照提供的順序?qū)⒉ㄐ螖?shù)據(jù)片段彼此組合, 并輸出其作為表示合成語(yǔ)音的數(shù)據(jù)(合成語(yǔ)音數(shù)據(jù))。根據(jù)該自由文本
數(shù)據(jù)合成的合成語(yǔ)音等同于按照規(guī)定的合成方法合成的語(yǔ)音。
該語(yǔ)音片段編輯部分5可以通過(guò)任何方法來(lái)輸出該合成語(yǔ)音數(shù) 據(jù)。例如,它可以通過(guò)D/A (數(shù)字-模擬)轉(zhuǎn)換器或者揚(yáng)聲器(未示出) 來(lái)播放該由合成語(yǔ)音數(shù)據(jù)表示的合成語(yǔ)音。它還可以通過(guò)接口電路(未 示出)將該合成語(yǔ)音數(shù)據(jù)發(fā)送至外部裝置或網(wǎng)絡(luò),或者通過(guò)記錄介質(zhì) 驅(qū)動(dòng)裝置將該合成語(yǔ)音數(shù)據(jù)寫(xiě)入到該記錄介質(zhì)驅(qū)動(dòng)裝置(未示出)中 設(shè)置的記錄介質(zhì)中去。執(zhí)行該語(yǔ)音片段編輯部分5的功能的處理器可 以將該合成語(yǔ)音數(shù)據(jù)發(fā)送至該處理器正在執(zhí)行的其他處理。
假設(shè)該聲音處理部分41從外部獲得表示所配信的音標(biāo)串的數(shù)據(jù) (配信字符串?dāng)?shù)據(jù))。(該聲音處理部分41可以按照任意方法來(lái)獲得配 信字符串?dāng)?shù)據(jù)。例如,可以按照與語(yǔ)言處理部分1中用戶獲得自由文 本數(shù)據(jù)相同的方法來(lái)獲得配信字符串?dāng)?shù)據(jù))。
在這種情況下,該聲音處理部分41將用配信字符串?dāng)?shù)據(jù)表示的音 標(biāo)串當(dāng)作由語(yǔ)言處理部分l提供的音標(biāo)串。結(jié)果,由檢索部分42來(lái)檢 索對(duì)應(yīng)于包括在由配信字符串表示的音標(biāo)串中的音標(biāo)的壓縮波形數(shù) 據(jù),并由擴(kuò)展部分43對(duì)壓縮之前的波形數(shù)據(jù)進(jìn)行恢復(fù)。通過(guò)聲音處理部分41將恢復(fù)的每段波形數(shù)據(jù)提供給語(yǔ)音片段編輯部分5。該語(yǔ)音片
段編輯部分5按照配信字符串表示的音標(biāo)串中音標(biāo)的排列順序?qū)⒉ㄐ?br>
數(shù)據(jù)片段彼此組合,并輸出其作為表示合成語(yǔ)音的數(shù)據(jù)。根據(jù)該配信 字符串?dāng)?shù)據(jù)合成的合成語(yǔ)音數(shù)據(jù)還表示按照規(guī)定的合成方法合成的語(yǔ)
音
假設(shè)該語(yǔ)音片段編輯部分5接著獲得標(biāo)準(zhǔn)尺寸的消息數(shù)據(jù),發(fā)聲
速度數(shù)據(jù)以及匹配程度數(shù)據(jù)。
該標(biāo)準(zhǔn)尺寸消息數(shù)據(jù)表示作為音標(biāo)串的標(biāo)準(zhǔn)尺寸的消息,該發(fā)聲 速度數(shù)據(jù)表示由該標(biāo)準(zhǔn)尺寸消息數(shù)據(jù)表示的標(biāo)準(zhǔn)尺寸消息的發(fā)聲速度 的給定值(說(shuō)出該標(biāo)準(zhǔn)尺寸尺寸消息所需時(shí)間長(zhǎng)度的給定值)。該匹配
程度數(shù)據(jù)用于指定將在后面由檢索部分6執(zhí)行的檢索處理中的檢索條 件。假設(shè)該匹配程度數(shù)據(jù)可以為"1", "2",以及"3"以下的任何值, 其中"3"為最嚴(yán)格的檢索條件。
該語(yǔ)音片段編輯部分5可以通過(guò)任何方法來(lái)獲得標(biāo)準(zhǔn)尺寸消息數(shù) 據(jù),發(fā)聲速度數(shù)據(jù)或者匹配程度數(shù)據(jù)。例如,它可以通過(guò)與語(yǔ)言處理 部分1獲得自由文本數(shù)據(jù)相同的方法來(lái)獲得標(biāo)準(zhǔn)尺寸消息數(shù)據(jù),發(fā)聲 速度數(shù)據(jù)或者匹配程度數(shù)據(jù)。
當(dāng)該標(biāo)準(zhǔn)尺寸消息數(shù)據(jù),發(fā)聲速度數(shù)據(jù)以及匹配程度數(shù)據(jù)被提供 給語(yǔ)音片段編輯部分5時(shí),該語(yǔ)音片段編輯部分5就會(huì)指示檢索部分6 去檢索與該音標(biāo)相關(guān)的所有壓縮語(yǔ)音片段數(shù)據(jù),其中該音標(biāo)與表示包 括在標(biāo)準(zhǔn)尺寸消息中的語(yǔ)音片段的讀音的音標(biāo)相匹配。
響應(yīng)于該語(yǔ)音片段編輯部分5的指示,該檢索部分6在該語(yǔ)音片 段數(shù)據(jù)庫(kù)7中檢索相應(yīng)的壓縮語(yǔ)音片段數(shù)據(jù),上述對(duì)應(yīng)于相應(yīng)的壓縮 語(yǔ)音片段數(shù)據(jù)的語(yǔ)音片段讀音數(shù)據(jù),速度缺省值數(shù)據(jù)以及音調(diào)分量數(shù) 據(jù),并將該檢索到的壓縮波形數(shù)據(jù)提供給擴(kuò)展部分43。如果有多段壓
縮語(yǔ)音片段數(shù)據(jù)對(duì)應(yīng)于該共用表音字串和表意字串,則所有片段的相 應(yīng)的壓縮語(yǔ)音片段數(shù)據(jù)都被檢索作為將在語(yǔ)音合成中使用的候選數(shù) 據(jù)。另一方面,如果該檢索部分6具有對(duì)于其來(lái)說(shuō)沒(méi)有任何壓縮語(yǔ)音 片段數(shù)據(jù)被檢索出來(lái)的語(yǔ)音片段,則該檢索部分6產(chǎn)生用于識(shí)別該相 應(yīng)語(yǔ)音片段的數(shù)據(jù)(下文中,被稱為缺少部分識(shí)別數(shù)據(jù))。
該擴(kuò)展部分43對(duì)從檢索部分6提供的壓縮語(yǔ)音片段數(shù)據(jù)被壓縮之 前的語(yǔ)音片段數(shù)據(jù)進(jìn)行恢復(fù),并將其返回給檢索部分6。該檢索部分6 將由該擴(kuò)展部分43返回的語(yǔ)音片段數(shù)據(jù),檢索到的語(yǔ)音片段讀音數(shù)據(jù), 速度缺省值數(shù)據(jù)以及音調(diào)分量數(shù)據(jù)作為檢索結(jié)果提供給語(yǔ)速轉(zhuǎn)換部分 9。如果產(chǎn)生了缺少部分識(shí)別數(shù)據(jù),則該缺少部分識(shí)別數(shù)據(jù)也被提供給 語(yǔ)速轉(zhuǎn)換部分9。
另一方面,該語(yǔ)音片段編輯部分5指示該語(yǔ)速轉(zhuǎn)換部分9對(duì)提供 給語(yǔ)速轉(zhuǎn)換部分9的語(yǔ)音片段數(shù)據(jù)進(jìn)行轉(zhuǎn)換,并使得由該語(yǔ)音片段數(shù) 據(jù)表示的語(yǔ)音片段的對(duì)間長(zhǎng)度與由該發(fā)聲速度數(shù)據(jù)表示的速度相匹 配。
響應(yīng)于來(lái)自于該語(yǔ)音片段編輯部分5的指示,該語(yǔ)速轉(zhuǎn)換部分9 對(duì)從該檢索部分6提供的語(yǔ)音片段數(shù)據(jù)進(jìn)行轉(zhuǎn)換,以與該指示相匹配, 并將該數(shù)據(jù)提供給語(yǔ)音片段編輯部分5。特別地,例如,該語(yǔ)速轉(zhuǎn)換部 分9只需要根據(jù)檢索出的速度缺省值數(shù)據(jù)來(lái)識(shí)別由該檢索部分6提供 的語(yǔ)音片段數(shù)據(jù)的初始時(shí)間長(zhǎng)度,接著對(duì)該語(yǔ)音片段數(shù)據(jù)進(jìn)行重新采 樣,并使得該該語(yǔ)音片段數(shù)據(jù)的采樣數(shù)成為與由該語(yǔ)音片段編輯部分5 指示的速度相匹配的時(shí)間長(zhǎng)度。
該語(yǔ)速轉(zhuǎn)換部分9還將從該檢索部分6提供的語(yǔ)音片段讀音數(shù)據(jù) 以及音調(diào)分量數(shù)據(jù)提供給語(yǔ)音片段編輯部分5。如果將該缺少部分識(shí)別 數(shù)據(jù)從檢索部分6提供給語(yǔ)速轉(zhuǎn)換部分9,則該語(yǔ)速轉(zhuǎn)換部分9進(jìn)一步 將該缺少部分識(shí)別數(shù)據(jù)提供給語(yǔ)音片段編輯部分5。
如果該發(fā)聲速度數(shù)據(jù)沒(méi)有被提供給語(yǔ)音片段編輯部分5,則該語(yǔ) 音片段編輯部分5只需要指示該語(yǔ)速轉(zhuǎn)換部分9將提供給該語(yǔ)速轉(zhuǎn)換
部分9的語(yǔ)音片段數(shù)據(jù)提供給語(yǔ)音片段編輯部分5,而不進(jìn)行轉(zhuǎn)換。響 應(yīng)于該指示,該語(yǔ)速轉(zhuǎn)換部分9將從檢索部分6提供的語(yǔ)音片段數(shù)據(jù) 按照原樣提供給語(yǔ)音片段編輯部分5。
當(dāng)語(yǔ)速轉(zhuǎn)換部分9將該語(yǔ)音片段數(shù)據(jù),語(yǔ)音片段讀音數(shù)據(jù)以及音 調(diào)分量數(shù)據(jù)提供給語(yǔ)音片段編輯部分5時(shí),該語(yǔ)音片段編輯部分5就 會(huì)從提供的多段語(yǔ)音片段數(shù)據(jù)中選擇一段語(yǔ)音片段藪據(jù),其中該語(yǔ)音 片段數(shù)據(jù)表示能夠與該語(yǔ)音片段的波形相近似的波形,并且該語(yǔ)音片 段形成了用于一個(gè)語(yǔ)音片段的標(biāo)準(zhǔn)尺寸消息。這里,該語(yǔ)音片段編輯 部分5根據(jù)獲得的匹配程度數(shù)據(jù)來(lái)設(shè)置是否使得滿足任何條件的波形 成為標(biāo)準(zhǔn)尺寸消息的語(yǔ)音片段附近的波形。
特別地,該語(yǔ)音片段編輯部分5首先通過(guò)根據(jù)韻律預(yù)測(cè)方法例如 "Fujisake模型"、"ToBI (Tone and Break Indeces )"等,對(duì)由標(biāo)準(zhǔn)尺寸 消息數(shù)據(jù)表示的標(biāo)準(zhǔn)尺寸消息進(jìn)行分析來(lái)預(yù)測(cè)該標(biāo)準(zhǔn)尺寸消息的韻律 (重音,聲調(diào),重讀,音素的時(shí)間長(zhǎng)度等)。
接著,該語(yǔ)音片段編輯部分5
(1) 選擇由該語(yǔ)速轉(zhuǎn)換部分9提供的所有語(yǔ)音片段數(shù)據(jù)(即,其 讀音與標(biāo)準(zhǔn)尺寸消息中的語(yǔ)音片段相匹配的語(yǔ)音片段數(shù)據(jù))作為標(biāo)準(zhǔn) 尺寸消息中語(yǔ)音片段波形附近的語(yǔ)音片段數(shù)據(jù),如果該匹配程度數(shù)據(jù) 的值為"1"。
(2) 如果該匹配程度數(shù)據(jù)的值為"2",則該語(yǔ)音片段編輯部分5
選擇該語(yǔ)音片段數(shù)據(jù)作為標(biāo)準(zhǔn)尺寸消息中該語(yǔ)音片段波形附近的語(yǔ)音
片段數(shù)據(jù),只要滿足條件(l)(即,與表示讀音的音標(biāo)相匹配的條件),
以及在表示語(yǔ)音片段數(shù)據(jù)的音調(diào)分量頻率的時(shí)間順序變化的音調(diào)分量 數(shù)據(jù)的內(nèi)容與包括在標(biāo)準(zhǔn)尺寸消息中的語(yǔ)音片段的重音預(yù)測(cè)結(jié)果之間
存在預(yù)定量或更多的牢固相互關(guān)系(所謂的韻律)(例如,如果重讀位 置的時(shí)間差就是預(yù)定量或更小)。通過(guò)標(biāo)準(zhǔn)尺寸消息的韻律預(yù)測(cè)結(jié)果就 能夠識(shí)別出標(biāo)準(zhǔn)尺寸消息中語(yǔ)音片段重音的預(yù)測(cè)結(jié)果。例如,該語(yǔ)音 片段編輯部分5只需要解釋音調(diào)分量的頻率被預(yù)測(cè)為最高的位置作為 該重音的預(yù)測(cè)位置。另一方面,對(duì)于由該語(yǔ)音片段數(shù)據(jù)表示的語(yǔ)音片 段的重音位置,它只需要根據(jù)上述音調(diào)分量數(shù)據(jù)識(shí)別出音調(diào)分量的頻 率最高的位置,并且將該位置解釋為重音位置。可以對(duì)整個(gè)句子預(yù)測(cè) 該韻律。作為選擇地,可以將該句子分為預(yù)定單元并對(duì)每個(gè)單元進(jìn)行 預(yù)測(cè)來(lái)預(yù)測(cè)韻律。
(3)如果該匹配程度數(shù)據(jù)的值為"3",'則該語(yǔ)音片段編輯部分5 選擇該語(yǔ)音片段數(shù)據(jù)作為標(biāo)準(zhǔn)尺寸消息中該語(yǔ)音片段波形附近的語(yǔ)音 片段數(shù)據(jù),只要滿足條件(2)(即,與表示讀音的音標(biāo)和重音相匹配 的條件),以及由該語(yǔ)音片段數(shù)據(jù)表示的語(yǔ)音被讀作鼻輔音還是清輔音 與標(biāo)準(zhǔn)尺寸消息韻律的預(yù)測(cè)結(jié)果相匹配。該語(yǔ)音片段編輯部分5只需 要根據(jù)由語(yǔ)速轉(zhuǎn)換部分9提供的音調(diào)分量數(shù)據(jù)來(lái)確定由該語(yǔ)音片段數(shù) 據(jù)表示的語(yǔ)音被讀作鼻輔音還是清輔音。
如果該語(yǔ)音片段編輯部分5對(duì)于語(yǔ)音片段具有與它自己設(shè)置的條 件相匹配的多段語(yǔ)音片段數(shù)據(jù),則它就根據(jù)比該設(shè)置的條件更嚴(yán)格的 條件將該多段語(yǔ)音片段數(shù)據(jù)收縮變窄為片段。
特別地,該語(yǔ)音片段編輯部分5進(jìn)行如下操作如果設(shè)置條件對(duì) 應(yīng)于匹配程度數(shù)據(jù)值"1"并且存在多段相應(yīng)的語(yǔ)音片段數(shù)據(jù),例如, 則它就會(huì)選擇還與對(duì)應(yīng)于匹配程度數(shù)據(jù)值"2"的檢索條件相匹配的片 段。如果選擇了多段語(yǔ)音片段數(shù)據(jù),則它進(jìn)一步從選擇結(jié)果中選擇與 對(duì)應(yīng)于匹配程度數(shù)據(jù)值"3"的檢索條件相匹配的片段。如果它通過(guò)對(duì) 應(yīng)于匹配程度數(shù)據(jù)值"3"的檢索條件而使得多個(gè)片段收縮變窄并且仍 舊具有多段語(yǔ)音片段數(shù)據(jù),則它只需要根據(jù)任意的標(biāo)準(zhǔn)對(duì)剩余的片段
進(jìn)行收縮變窄。
接著,該語(yǔ)音片段編輯部分5確定表示該語(yǔ)音片段讀音的音標(biāo)串 的字符數(shù)與形成該標(biāo)準(zhǔn)尺寸消息數(shù)據(jù)的音標(biāo)串的字符總數(shù)的比率(或 者,除了表示由從語(yǔ)速轉(zhuǎn)換部分9提供的缺少部分識(shí)別數(shù)據(jù)指示的語(yǔ) 音片段的讀音的部分以外的部分與形成該標(biāo)準(zhǔn)尺寸消息數(shù)據(jù)的音標(biāo)串
中字符總數(shù)的比率)是否達(dá)到了預(yù)定閾值,其中為該語(yǔ)音片段選擇了 表示能夠被近似的波形的語(yǔ)音片段數(shù)據(jù)。
如果確定上述比率達(dá)到了該閾值并且如果也從語(yǔ)速轉(zhuǎn)換部分9提 供了該缺少部分識(shí)別數(shù)據(jù),則該語(yǔ)音片段編輯部分5從該標(biāo)準(zhǔn)尺寸消 息數(shù)據(jù)中提取出表示由該缺少部分識(shí)'別數(shù)據(jù)表示的語(yǔ)音片段的讀音的
音標(biāo)串,并將其提供給聲音處理部分41,并且指示該聲音處理部分合
成該語(yǔ)音片段的波形。
該被指示的聲音處理部分41將從語(yǔ)音片段編輯部分5提供的音標(biāo) 串當(dāng)作由配信字符串?dāng)?shù)據(jù)表示的音標(biāo)串。結(jié)果,由該檢索部分42檢索 出表示由包括在該音標(biāo)串中的音標(biāo)表示的語(yǔ)音波形的壓縮波形數(shù)據(jù), 并由擴(kuò)展部分43將壓縮波形數(shù)據(jù)恢復(fù)至初始波形,并通過(guò)檢索部分42 將其提供給聲音處理部分41 。該聲音處理部分41將該波形數(shù)據(jù)提供給 語(yǔ)音片段編輯部分5。
當(dāng)該波形數(shù)據(jù)被從聲音處理部分41返回至語(yǔ)音片段編輯部分5 時(shí),它將該波形數(shù)據(jù)以及由語(yǔ)音片段編輯部分5從語(yǔ)速轉(zhuǎn)換部分9提 供的語(yǔ)音片段數(shù)據(jù)中選擇的波形數(shù)據(jù)按照由標(biāo)準(zhǔn)尺寸消息數(shù)據(jù)表示的 標(biāo)準(zhǔn)尺寸消息中音標(biāo)串中音標(biāo)的排列順序彼此組合,并將其輸出作為 表示合成語(yǔ)音的數(shù)據(jù)。
如果由該語(yǔ)速轉(zhuǎn)換部分9提供的數(shù)據(jù)不包括缺少部分識(shí)別數(shù)據(jù), 則該語(yǔ)音片段編輯部分5只需要立即將由該語(yǔ)音片段編輯部分5選擇
的多段語(yǔ)音片段數(shù)據(jù)按照由標(biāo)準(zhǔn)尺寸消息數(shù)據(jù)表示的標(biāo)準(zhǔn)尺寸消息中 音標(biāo)串中音標(biāo)的排列順序彼此組合,并將其輸出作為表示合成語(yǔ)音的
數(shù)據(jù),而不需要指示該聲音處理部分41來(lái)合成該波形。
另一方面,如果確定上述比率沒(méi)有達(dá)到閾值,則該語(yǔ)音片段編輯 部分5確定在該語(yǔ)音合成中不使用該語(yǔ)音片段數(shù)據(jù)(換句話說(shuō),取消 選擇該語(yǔ)音片段數(shù)據(jù)),并將形成該標(biāo)準(zhǔn)尺寸消息數(shù)據(jù)的整個(gè)音標(biāo)串提
供給聲音處理部分41,以及指示該聲音處理部分41來(lái)合成該語(yǔ)音片段
的波形。
該被指示的聲音處理部分41將從語(yǔ)音片段編輯部分5提供的音標(biāo) 串當(dāng)作由配信字符串?dāng)?shù)據(jù)表示'的音標(biāo)串。結(jié)果,該聲音處理部分41將 表示由包括在該音標(biāo)串中的音標(biāo)表示的語(yǔ)音波形的波形數(shù)據(jù)提供給語(yǔ) 音片段編輯部分5。
當(dāng)該波形數(shù)據(jù)被從聲音處理部分41返回至語(yǔ)音片段編輯部分5 時(shí),它按照由標(biāo)準(zhǔn)尺寸消息數(shù)據(jù)表示的標(biāo)準(zhǔn)尺寸消息中語(yǔ)音片段的排 列順序組合該多段波形數(shù)據(jù),并將其輸出作為表示合成語(yǔ)音的數(shù)據(jù)。
在根據(jù)本發(fā)明第一實(shí)施例的上述語(yǔ)音合成系統(tǒng)中,根據(jù)韻律預(yù)測(cè) 結(jié)果通過(guò)錄音編輯方法將表示語(yǔ)音片段波形的多段語(yǔ)音片段數(shù)據(jù)自然 地組合,其中該語(yǔ)音片段可以為比音素更大的單位,使得合成讀出該 標(biāo)準(zhǔn)尺寸消息的語(yǔ)音。該語(yǔ)音片段數(shù)據(jù)庫(kù)7的存儲(chǔ)容量可以比用于存 儲(chǔ)每個(gè)音素的波形的存儲(chǔ)器容量更小,并且可以進(jìn)行快速檢索。這樣, 該語(yǔ)音合成系統(tǒng)又小又輕便,并且還能夠適于快速處理。
如果能夠被由形成該標(biāo)準(zhǔn)尺寸消息的整個(gè)語(yǔ)音片段中的語(yǔ)音片段 數(shù)據(jù)表示的語(yǔ)音片段近似的一部分語(yǔ)音片段沒(méi)有達(dá)到上述閾值,則該 語(yǔ)音合成系統(tǒng)通過(guò)規(guī)定的合成方法對(duì)該整個(gè)標(biāo)準(zhǔn)尺寸消息進(jìn)行語(yǔ)音分 析,而不需要使用表示能夠近似用于語(yǔ)音分析的語(yǔ)音片段的語(yǔ)音片段 數(shù)據(jù)。這樣,如果該標(biāo)準(zhǔn)尺寸消息包括能夠被由語(yǔ)音片段數(shù)據(jù)表示的 語(yǔ)音片段近似的少量語(yǔ)音片段,合成語(yǔ)音中語(yǔ)音片段質(zhì)量的不均勻性
也不是很突出,使得它幾乎沒(méi)有不自然的聲音。
該語(yǔ)音合成系統(tǒng)的結(jié)構(gòu)并不僅限于上面所提到的。
例如,該波形數(shù)據(jù)或語(yǔ)音片段數(shù)據(jù)不需要一定是PCM格式的數(shù) 據(jù),并且該數(shù)據(jù)可以具有任何數(shù)據(jù)格式。
該波形數(shù)據(jù)庫(kù)44或語(yǔ)音片段數(shù)據(jù)庫(kù)7不需要存儲(chǔ)處于將經(jīng)受數(shù)據(jù) 壓縮的狀態(tài)中的波形數(shù)據(jù)或語(yǔ)音片段數(shù)據(jù)。如果該波形數(shù)據(jù)庫(kù)44或語(yǔ) 音片段數(shù)據(jù)庫(kù)7存儲(chǔ)'了處于沒(méi)有將經(jīng)受數(shù)據(jù)壓縮的狀態(tài)中的波形數(shù)據(jù) 或語(yǔ)音片段數(shù)據(jù),則該單元體M1不需要具有擴(kuò)展單元43。
該波形數(shù)據(jù)庫(kù)44不需要以單獨(dú)地分開(kāi)的形式存儲(chǔ)單位語(yǔ)音。它可 以存儲(chǔ)由多個(gè)單位語(yǔ)音形成的語(yǔ)音的波形,以及用于識(shí)別每個(gè)單元語(yǔ) 音在該波形中占據(jù)的位置的數(shù)據(jù)。在這種情況下,該語(yǔ)音片段數(shù)據(jù)庫(kù)7 可以執(zhí)行該波形數(shù)據(jù)庫(kù)44的功能。也就是說(shuō), 一系列語(yǔ)音數(shù)據(jù)片段可 以被按照與語(yǔ)音片段數(shù)據(jù)庫(kù)7中相同的方式存儲(chǔ)在波形數(shù)據(jù)庫(kù)44中。 在這種情況下,針對(duì)每個(gè)音素的音調(diào)信息等被存儲(chǔ)在彼此相關(guān)的語(yǔ)音 數(shù)據(jù)中,以便于被用作波形數(shù)據(jù)庫(kù)。
該語(yǔ)音片段數(shù)據(jù)生成部分11可以通過(guò)記錄介質(zhì)驅(qū)動(dòng)裝置從該記錄 介質(zhì)驅(qū)動(dòng)裝置(未示出)中設(shè)置的記錄介質(zhì)中讀出語(yǔ)音片段數(shù)據(jù)或音 標(biāo)串,其中該語(yǔ)音片段數(shù)據(jù)或音標(biāo)串使得用于新壓縮的語(yǔ)音片段數(shù)據(jù) 的素材被添加至該語(yǔ)音片段數(shù)據(jù)庫(kù)7。
該語(yǔ)音片段寄存器單元R不需要必須具有該記錄語(yǔ)音片段數(shù)據(jù)集 存儲(chǔ)部分10。
該音調(diào)分量數(shù)據(jù)也可以是表示由該語(yǔ)音片段數(shù)據(jù)表示的語(yǔ)音片段 的音調(diào)長(zhǎng)度的時(shí)間順序變化的數(shù)據(jù)。在這種情況下,該語(yǔ)音片段編輯
部分5只需要根據(jù)該音調(diào)分量數(shù)據(jù)來(lái)識(shí)別該音調(diào)長(zhǎng)度最短的位置(即, 頻率最高的位置),并將該位置解釋為重音位置。
該語(yǔ)音片段編輯部分5預(yù)先存儲(chǔ)表示特定語(yǔ)音片段的韻律的韻律 寄存器數(shù)據(jù),并且如果該標(biāo)準(zhǔn)尺寸消息包括該特定語(yǔ)音片段,則它可 以將該由韻律寄存器數(shù)據(jù)表示的韻律當(dāng)作韻律預(yù)測(cè)的結(jié)果。
該語(yǔ)音片段編輯部分5還可以存儲(chǔ)過(guò)去的韻律預(yù)測(cè)結(jié)果作為韻律
寄存器數(shù)據(jù)。
該語(yǔ)音片段數(shù)據(jù)生成部分11可以包括麥克風(fēng),放大器,采樣電路,
A/D (模擬-數(shù)字)轉(zhuǎn)換器以及PCM編碼器。在這種情況下,該語(yǔ)音片 段數(shù)據(jù)生成部分11可以通過(guò)如下方式來(lái)生成語(yǔ)音片段數(shù)據(jù),即對(duì)表示 由它自己的麥克風(fēng)收集的語(yǔ)音的語(yǔ)音信號(hào)進(jìn)行放大,對(duì)該信號(hào)迸行采 樣和A/D轉(zhuǎn)換,以及接著對(duì)該釆樣后的語(yǔ)音信號(hào)進(jìn)行PCM調(diào)制,而不 是從記錄語(yǔ)音片段數(shù)據(jù)集存儲(chǔ)部分10中獲得語(yǔ)音片段數(shù)據(jù)。
該語(yǔ)音片段編輯部分5可以通過(guò)將從聲音處理部分41返回的波形 數(shù)據(jù)提供給語(yǔ)速轉(zhuǎn)換部分9來(lái)將由波形數(shù)據(jù)表示的波形的時(shí)間長(zhǎng)度與 由發(fā)聲速度數(shù)據(jù)表示的速度相匹配。
該語(yǔ)音片段編輯部分5可以通過(guò)例如語(yǔ)言處理部分1來(lái)獲得自由 文本數(shù)據(jù),并且通過(guò)進(jìn)行實(shí)質(zhì)上與選擇標(biāo)準(zhǔn)尺寸消息的語(yǔ)音片段數(shù)據(jù) 的處理相同的處理來(lái)選擇至少與包括在由該文本數(shù)據(jù)表示的自由文本 中的一部分語(yǔ)音(音標(biāo)串)相匹配的語(yǔ)音片段數(shù)據(jù),以便于在語(yǔ)音合 成中使用它。
在這種情況下,該聲音處理部分41不需要使得該檢索部分42為 由該語(yǔ)音片段編輯部分5選擇的語(yǔ)音片段而檢索表示該語(yǔ)音片段波形 的波形數(shù)據(jù)。該語(yǔ)音片段編輯部分5只需要將不需要被聲音處理部分41合成的語(yǔ)音片段報(bào)告給該聲音處理部分41,使得該聲音處理部分41 響應(yīng)于該報(bào)告而停止檢索形成該語(yǔ)音片段的單位語(yǔ)音的波形。
該語(yǔ)音片段編輯部分5可以例如通過(guò)聲音處理部分41來(lái)獲得配信
字符串?dāng)?shù)據(jù),通過(guò)進(jìn)行實(shí)質(zhì)上與選擇標(biāo)準(zhǔn)尺寸消息的語(yǔ)音片段數(shù)據(jù)的 處理相同的處理來(lái)選擇表示包括在由該配信字符串?dāng)?shù)據(jù)表示的配信字 符串中的音標(biāo)串的語(yǔ)音片段數(shù)據(jù),以便于在語(yǔ)音合成中使用它。在這
種情況下,該聲音處理部分41不需要使得該檢索部分42為由該語(yǔ)音 片段編輯部分5選擇的語(yǔ)音片段數(shù)據(jù)表示的語(yǔ)音片段而檢索表示該語(yǔ) 音片段'波形的波形數(shù)據(jù)。
(第二實(shí)施例)
現(xiàn)在,將描述本發(fā)明的第二實(shí)施例。圖3為顯示根據(jù)本發(fā)明第二 實(shí)施例的語(yǔ)音合成系統(tǒng)的配置的方框圖。如圖中所示,該語(yǔ)音合成系 統(tǒng)與第一實(shí)施例一樣也包括單元體M2和語(yǔ)音片段寄存器單元R。在它
們中,語(yǔ)音片段寄存器單元R具有實(shí)質(zhì)上與第一實(shí)施例中相同的結(jié)構(gòu)。
該單元體M2包括語(yǔ)言處理部分1,常規(guī)字典2,用戶字典3,規(guī) 則合成部分4,語(yǔ)音片段編輯部分5,檢索部分6,語(yǔ)音片段數(shù)據(jù)庫(kù)7, 擴(kuò)展部分8,以及語(yǔ)速轉(zhuǎn)換部分9。在它們中,該語(yǔ)言處理部分l,常 規(guī)字典2,用戶字典3,以及語(yǔ)音片段數(shù)據(jù)庫(kù)7具有實(shí)質(zhì)上與第一實(shí)施 例中相同的結(jié)構(gòu)。
該語(yǔ)言處理部分l,語(yǔ)音片段編輯部分5,檢索部分6,擴(kuò)展部分 8,以及語(yǔ)速轉(zhuǎn)換部分9中的每一個(gè)都包括處理器,例如CPU, DSP等, 以及用于存儲(chǔ)將由該處理器執(zhí)行的程序的存儲(chǔ)器,它們都執(zhí)行將在后 面描述的處理。單個(gè)處理器可以執(zhí)行該語(yǔ)言處理部分1,檢索部分42, 擴(kuò)展部分43,語(yǔ)音片段編輯部分5,檢索部分6,以及語(yǔ)速轉(zhuǎn)換部分9
的部分或者全部功能。
該規(guī)則合成部分4與第一實(shí)施例一樣也包括聲音處理部分41,檢
索部分42,擴(kuò)展部分43以及波形數(shù)據(jù)庫(kù)44。在它們當(dāng)中,聲音處理 部分41,檢索部分42,以及擴(kuò)展部分43中的每一個(gè)都包括處理器, 例如CPU, DSP等,以及用于存儲(chǔ)將由該處理器執(zhí)行的程序的存儲(chǔ)器, 它們都進(jìn)行將在后面描述的處理。
單個(gè)處理器可以執(zhí)行該聲音處理部分41,檢索部分42以及擴(kuò)展 部分43的部分或者全部功能。執(zhí)行該語(yǔ)言處理部分l,聲音處理部分 41,檢索部分42,擴(kuò)展部分43,語(yǔ)音片段編輯部分5,檢索部分6, '擴(kuò)展部分8,以及語(yǔ)速轉(zhuǎn)換部分9的部分或全部功能的處理器還可以進(jìn) 一步執(zhí)行聲音處理部分41,檢索部分42,以及擴(kuò)展部分43的部分或 全部功能。因此,該擴(kuò)展部分8也可以執(zhí)行,例如,該規(guī)則合成部分4 的擴(kuò)展部分43的功能。
該波形數(shù)據(jù)庫(kù)44包括非易失性存儲(chǔ)器,例如PROM,硬盤(pán)裝置等。 該波形數(shù)據(jù)庫(kù)44存儲(chǔ)有音形字,以及壓縮波形數(shù)據(jù),其中獲得該壓縮 波形數(shù)據(jù)作為表示碎片的碎片波形數(shù)據(jù),其中該碎片形成了通過(guò)該語(yǔ) 音合成系統(tǒng)的制造商事先經(jīng)受彼此相關(guān)的熵編碼的音標(biāo)(即,用于一 個(gè)形成音素的語(yǔ)音波形的周期(或者,某一數(shù)量)的語(yǔ)音)表示的音 素。熵編碼之前的碎片波形數(shù)據(jù)可以包括例如經(jīng)受PCM的數(shù)字格式數(shù) 據(jù)。
該語(yǔ)音片段編輯部分5包括匹配語(yǔ)音片段確定部分51,韻律預(yù)測(cè) 部分52,以及輸出合成部分53。該匹配語(yǔ)音片段確定部分51,韻律預(yù) 測(cè)部分52,以及輸出合成部分53中的每一個(gè)都包括處理器,例如CPU, DSP (數(shù)字信號(hào)處理器)等,以及存儲(chǔ)器,用于存儲(chǔ)將由該處理器執(zhí)行 的程序,它們都執(zhí)行將在后面描述的處理。
單個(gè)處理器可以執(zhí)行該匹配語(yǔ)音片段確定部分51,韻律預(yù)測(cè)部分 52,以及輸出合成部分53的部分或者全部功能。執(zhí)行該語(yǔ)言處理部分
1,聲音處理部分41,檢索部分42,擴(kuò)展部分43,語(yǔ)音片段編輯部分 5,檢索部分6,擴(kuò)展部分8,以及語(yǔ)速轉(zhuǎn)換部分9的部分或全部功能 的處理器還可以進(jìn)一步執(zhí)行匹配語(yǔ)音片段確定部分51,韻律預(yù)測(cè)部分 52,以及輸出合成部分53的部分或全部功能。因此,用于執(zhí)行該輸出 合成部分53的功能的處理器可以進(jìn)一步執(zhí)行,例如,語(yǔ)速轉(zhuǎn)換部分9 的功能。
現(xiàn)在,將描述圖3中的語(yǔ)音合成系統(tǒng)的操作。
首先,假設(shè)該語(yǔ)言處理部分1實(shí)質(zhì)上從外部獲得了與第一實(shí)施例 中相同的自由文本數(shù)據(jù)。在這種情況下,該語(yǔ)言處理部分1通過(guò)執(zhí)行 實(shí)質(zhì)上與第一實(shí)施例中相同的處理來(lái)用音標(biāo)替換包括在該自由文本中 的表意字。接著,它將通過(guò)該替換的結(jié)果得到的音標(biāo)串提供給規(guī)則合 成部分4的聲音處理部分41。
當(dāng)將音標(biāo)串從語(yǔ)言處理部分1提供給聲音處理部分41時(shí),該聲音 處理部分41指示該檢索部分42來(lái)為包括在音標(biāo)串中的每個(gè)音標(biāo)檢索 形成了由該音標(biāo)表示的音素的碎片波形。該聲音處理部分41將該音標(biāo) 串提供給語(yǔ)音片段編輯部分5的韻律預(yù)測(cè)部分52。
響應(yīng)于該指示,該檢索部分42在該波形數(shù)據(jù)庫(kù)44中檢索與該指 示所述相匹配的壓縮波形數(shù)據(jù)。接著,它將檢索出來(lái)的壓縮波形數(shù)據(jù) 提供給擴(kuò)展部分43。
該擴(kuò)展部分43從該檢索部分42提供的壓縮波形數(shù)據(jù)恢復(fù)壓縮之 前的碎片波形數(shù)據(jù),并將該恢復(fù)后的波形數(shù)據(jù)返回給檢索部分42。該 檢索部分42將從擴(kuò)展部分43返回的碎片波形數(shù)據(jù)提供給聲音處理部 分41,作為檢索的結(jié)果。
另一方面,從聲音處理部分41將音標(biāo)串提供給韻律預(yù)測(cè)部分52,
該韻律預(yù)測(cè)部分52通過(guò)根據(jù)例如與第一實(shí)施例中該語(yǔ)音片段編輯部分 5進(jìn)行的相同韻律預(yù)測(cè)方法進(jìn)行分析而生成表示由該音標(biāo)串表示的語(yǔ) 音韻律的預(yù)測(cè)結(jié)果的韻律預(yù)測(cè)數(shù)據(jù)。接著,將該韻律預(yù)測(cè)數(shù)據(jù)提供給 聲音處理部分41。
當(dāng)從檢索部分42將碎片波形數(shù)據(jù)提供給聲音處理部分41并且從 韻律預(yù)測(cè)部分52將韻律預(yù)測(cè)數(shù)據(jù)提供給聲音處理部分41時(shí),該聲音 處理部分41就通過(guò)使用該碎片波形數(shù)據(jù)而生成表示語(yǔ)音波形的語(yǔ)音波 形數(shù)據(jù),其中該語(yǔ)音波形是由包括在由該語(yǔ)言處理部分ll提供的音標(biāo) 串中的每個(gè)音標(biāo)表示的。
特別地,該聲音處理部分41根據(jù)由該韻律預(yù)測(cè)部分52提供的韻 律預(yù)測(cè)數(shù)據(jù)來(lái)識(shí)別包括由該檢索部分42提供的每段碎片波形數(shù)據(jù)表示 的碎片的音素的時(shí)間長(zhǎng)度。接著,該聲音處理部分41只需要獲得最接 近于被由碎片波形數(shù)據(jù)表示的碎片時(shí)間長(zhǎng)度分割的音素的被識(shí)別時(shí)間 長(zhǎng)度數(shù)值的整數(shù),并且通過(guò)將多段該碎片波形數(shù)據(jù)與得到的整數(shù)彼此 組合來(lái)生成語(yǔ)音波形數(shù)據(jù)。
不僅通過(guò)根據(jù)韻律預(yù)測(cè)數(shù)據(jù)確定由該語(yǔ)音波形數(shù)據(jù)表示的語(yǔ)音時(shí) 間長(zhǎng)度,而且還通過(guò)處理包括在該語(yǔ)音波形數(shù)據(jù)中的碎片波形數(shù)據(jù), 該聲音處理部分41可以使得由該語(yǔ)音波形數(shù)據(jù)表示的語(yǔ)音具有與由韻 律預(yù)測(cè)數(shù)據(jù)表示的韻律相匹配的重讀,聲調(diào)等。
接著,該聲音處理部分41將該生成的語(yǔ)音波形數(shù)據(jù)按照由語(yǔ)言處 理部分1提供的音標(biāo)串中音標(biāo)的排列順序提供給該語(yǔ)音片段編輯部分5 中的輸出合成部分53。
當(dāng)該聲音波形數(shù)據(jù)被從聲音處理部分41提供給輸出合成部分53 時(shí),該輸出合成部分53按照從該聲音處理部分41提供的順序組合這 些語(yǔ)音波形數(shù)據(jù)片段,并將其輸出作為合成的聲音數(shù)據(jù)。根據(jù)該自由
文本數(shù)據(jù)合成的合成聲音對(duì)應(yīng)于按照該規(guī)則合成方法合成的語(yǔ)音。
該輸出合成部分53輸出合成語(yǔ)音數(shù)據(jù)的方法也與第一實(shí)施例的
語(yǔ)音片段編輯部分5中采取的一樣,并且可以是任意的。因此,可以 通過(guò)例如D/A轉(zhuǎn)換器或者揚(yáng)聲器(未示出)來(lái)播放由該合成語(yǔ)音數(shù)據(jù)
表示的合成語(yǔ)音。還可以通過(guò)接口電路(未示出)將該合成語(yǔ)音數(shù)據(jù) 發(fā)送至外部裝置或網(wǎng)絡(luò),或者通過(guò)記錄介質(zhì)驅(qū)動(dòng)裝置將該合成語(yǔ)音數(shù) 據(jù)寫(xiě)入到該記錄介質(zhì)驅(qū)動(dòng)裝置(未示出)中設(shè)置的記錄介質(zhì)中去。執(zhí)
行該輸出合成部分53的功能的處理器可以將該合成語(yǔ)音數(shù)據(jù)發(fā)送至該 處理器正在執(zhí)行的其他處理。
假設(shè)該聲音處理部分41實(shí)質(zhì)上獲得了與第一實(shí)施例中相同的配 信字符串。(該聲音處理部分41可以按照任意方法來(lái)獲得配信字符串 數(shù)據(jù)。例如,可以按照與語(yǔ)言處理部分1中用戶獲得自由文本數(shù)據(jù)相 同的方法來(lái)獲得配信字符串?dāng)?shù)據(jù))。
在這種情況下,該聲音處理部分41將用配信字符串?dāng)?shù)據(jù)表示的音 標(biāo)串當(dāng)作從該語(yǔ)言處理部分1提供的音標(biāo)串。結(jié)果,由檢索部分42檢 索出表示碎片的壓縮波形數(shù)據(jù),其中該碎片形成了由包括在該配信字 符串表示的音標(biāo)串中的音標(biāo)表示的音素,并由擴(kuò)展部分43對(duì)壓縮之前 的碎片波形數(shù)據(jù)進(jìn)行恢復(fù)。另一方面,該韻律預(yù)測(cè)部分52根據(jù)韻律預(yù) 測(cè)方法對(duì)由該配信字符串表示的音標(biāo)串進(jìn)行分析。結(jié)果,生成了表示 關(guān)于由該音標(biāo)串表示的語(yǔ)音韻律的預(yù)測(cè)結(jié)果的韻律預(yù)測(cè)數(shù)據(jù)。接著, 該聲音處理部分41根據(jù)每段恢復(fù)的碎片波形數(shù)據(jù)和韻律預(yù)測(cè)數(shù)據(jù)來(lái)生 成表示語(yǔ)音波形的語(yǔ)音波形數(shù)據(jù),其中該語(yǔ)音波形由包括在由配信字 符串?dāng)?shù)據(jù)表示的音標(biāo)串中的每個(gè)音標(biāo)表示。該輸出合成部分53將生成 的語(yǔ)音波形數(shù)據(jù)按照由配信字符串表示的音標(biāo)串中音標(biāo)的排列順序進(jìn) 行組合,并將其輸出作為合成語(yǔ)音數(shù)據(jù)。根據(jù)該配信字符串?dāng)?shù)據(jù)被合 成的該合成語(yǔ)音數(shù)據(jù)還表示規(guī)則合成方法中合成的語(yǔ)音。
接下來(lái),假設(shè)該語(yǔ)音片段編輯部分5的匹配語(yǔ)音片段確定部分51 實(shí)質(zhì)上獲得了與第一實(shí)施例中相同的標(biāo)準(zhǔn)尺寸消息數(shù)據(jù),發(fā)聲速度數(shù) 據(jù)以及匹配程度數(shù)據(jù)。(該匹配語(yǔ)音片段確定部分51可以通過(guò)任意方 式獲得該標(biāo)準(zhǔn)尺寸消息數(shù)據(jù),發(fā)聲速度數(shù)據(jù)以及匹配程度數(shù)據(jù)。例如, 可以按照與語(yǔ)言處理部分1獲得自由文本數(shù)據(jù)相同的方法來(lái)獲得標(biāo)準(zhǔn) 尺寸消息數(shù)據(jù),發(fā)聲速度數(shù)據(jù)以及匹配程度數(shù)據(jù)。)
當(dāng)該標(biāo)準(zhǔn)尺寸消息數(shù)據(jù),發(fā)聲速度數(shù)據(jù)以及匹配程度數(shù)據(jù)被提供
給匹配語(yǔ)音片段確定部分51時(shí),該匹配語(yǔ)音片段確定部分51指示該 檢索部分6檢索該壓縮語(yǔ)音片段數(shù)據(jù),對(duì)應(yīng)于該壓縮語(yǔ)音片段數(shù)據(jù), 該音標(biāo)與表示包括在標(biāo)準(zhǔn)尺寸消息中的語(yǔ)音片段讀音的音標(biāo)相匹配。
響應(yīng)于來(lái)自匹配語(yǔ)音片段確定部分51的指示,該檢索部分6與檢 索部分6在第一實(shí)施例一樣在該語(yǔ)音片段數(shù)據(jù)庫(kù)7中檢索所有的相應(yīng) 的壓縮語(yǔ)音片段數(shù)據(jù),與相應(yīng)的壓縮語(yǔ)音片段數(shù)據(jù)相關(guān)的上述語(yǔ)音片 段讀音數(shù)據(jù),速度缺省值以及音調(diào)分量數(shù)據(jù),并將檢索出的壓縮波形 數(shù)據(jù)提供給擴(kuò)展部分43。另一方面,如果存在一些語(yǔ)音片段,其中對(duì) 于該語(yǔ)音片段來(lái)說(shuō)該壓縮的語(yǔ)音片段數(shù)據(jù)無(wú)法被檢索出來(lái),則就會(huì)生 成用于識(shí)別相應(yīng)語(yǔ)音片段的缺少部分識(shí)別數(shù)據(jù)。
該擴(kuò)展部分43從該檢索部分6提供的壓縮語(yǔ)音片段數(shù)據(jù)中恢復(fù)壓 縮前的語(yǔ)音片段數(shù)據(jù),并將其返回給檢索部分6。該檢索部分6將從擴(kuò) 展部分43返回的語(yǔ)音片段數(shù)據(jù),以及檢索出的語(yǔ)音片段讀音數(shù)據(jù),速 度缺省值數(shù)據(jù)和音調(diào)分量數(shù)據(jù)提供給語(yǔ)速轉(zhuǎn)換部分9,作為檢索結(jié)果。 如果產(chǎn)生了該缺少部分識(shí)別數(shù)據(jù),則該缺少部分識(shí)別數(shù)據(jù)也會(huì)被提供 給語(yǔ)速轉(zhuǎn)換部分9。
另一方面,該匹配語(yǔ)音片段確定部分51指示該語(yǔ)速轉(zhuǎn)換部分9對(duì) 提供給該語(yǔ)速轉(zhuǎn)換部分9的語(yǔ)音片段數(shù)據(jù)進(jìn)行轉(zhuǎn)換,使得由該語(yǔ)音片 段數(shù)據(jù)表示的語(yǔ)音片段的時(shí)間長(zhǎng)度與由發(fā)聲速度數(shù)據(jù)表示的速度相匹
配。
響應(yīng)于該匹配語(yǔ)音片段確定部分51的指示,該語(yǔ)速轉(zhuǎn)換部分9對(duì)
由檢索部分6提供的語(yǔ)音片段數(shù)據(jù)進(jìn)行轉(zhuǎn)換,以與該指示相匹配,并 將其提供給匹配語(yǔ)音片段確定部分51。特別地,它只需要通過(guò)調(diào)整該
部分的長(zhǎng)度就能夠使得整個(gè)語(yǔ)音片段數(shù)據(jù)的采樣數(shù)成為由該匹配語(yǔ)音
片段確定部分51指示的速度,因?yàn)樗鼘臋z索部分6提供的語(yǔ)音片段 數(shù)據(jù)分割為表示各個(gè)音素的部分,對(duì)于獲得的各個(gè)部分,從該部分中 識(shí)別出表示碎片的局部,其中該碎片形成了由該部分表示的音素,復(fù) 制該識(shí)別出的局部(一個(gè)或多個(gè)局部)并將其插入在該部分中,或者 從該部分中去除該局部(一個(gè)或多個(gè)局部)。該語(yǔ)速轉(zhuǎn)換部分9只需要 為各個(gè)部分確定表示要被插入或被去除碎片的部分的數(shù)據(jù),使得剩余 的由各個(gè)部分表示的音素之間的時(shí)間長(zhǎng)度的比率實(shí)質(zhì)上相同。因此, 可以比簡(jiǎn)單組合以及合成該音素的情況更細(xì)致地調(diào)整該語(yǔ)音。
該語(yǔ)速轉(zhuǎn)換部分9還將從檢索部分6提供的語(yǔ)音片段讀音數(shù)據(jù)和 音調(diào)分量數(shù)據(jù)提供給匹配語(yǔ)音片段確定部分51。如果該缺少部分識(shí)別 數(shù)據(jù)是從檢索部分6提供的,則該語(yǔ)速轉(zhuǎn)換部分9進(jìn)一步還將該缺少 部分識(shí)別數(shù)據(jù)提供給匹配語(yǔ)音片段確定部分51。
如果該發(fā)聲速度數(shù)據(jù)沒(méi)有被提供給匹配語(yǔ)音片段確定部分51,則 該匹配語(yǔ)音片段確定部分51只需要指示該語(yǔ)速轉(zhuǎn)換部分9將提供給語(yǔ) 速轉(zhuǎn)換部分9的語(yǔ)音片段數(shù)據(jù)提供給匹配語(yǔ)音片段確定部分51,而不 需要轉(zhuǎn)換該語(yǔ)音片段數(shù)據(jù),并且該語(yǔ)速轉(zhuǎn)換部分9實(shí)際上只需要響應(yīng) 于該指示而將從檢索部分6提供的語(yǔ)音片段數(shù)據(jù)提供給匹配語(yǔ)音片段 確定部分51。如果被提供給語(yǔ)速轉(zhuǎn)換部分9的語(yǔ)音片段數(shù)據(jù)的采樣數(shù) 已經(jīng)與時(shí)間長(zhǎng)度相匹配,其中該時(shí)間長(zhǎng)度與由該匹配語(yǔ)音片段確定部 分51指示的速度相匹配,則該語(yǔ)速轉(zhuǎn)換部分9實(shí)際上只需要將該語(yǔ)音 片段數(shù)據(jù)提供給匹配語(yǔ)音片段確定部分51,因?yàn)槠洳恍枰M(jìn)行任何轉(zhuǎn) 換。
當(dāng)將該語(yǔ)音片段數(shù)據(jù),語(yǔ)音片段讀音數(shù)據(jù)以及音調(diào)分量數(shù)據(jù)從語(yǔ) 速轉(zhuǎn)換部分9提供給匹配語(yǔ)音片段確定部分51時(shí),根據(jù)對(duì)應(yīng)于該匹配 程度數(shù)據(jù)值的條件,通過(guò)如第一實(shí)施例中的語(yǔ)音片段編輯部分5的用
于一個(gè)語(yǔ)音片段的一段語(yǔ)音片段數(shù)據(jù),該匹配語(yǔ)音片段確定部分51從 被提供給匹配語(yǔ)音片段確定部分51的語(yǔ)音片段數(shù)據(jù)中選擇表示能夠被
近似于形成標(biāo)準(zhǔn)尺寸消息的語(yǔ)音片段波形的語(yǔ)音片段數(shù)據(jù)。
這里,如果存在一語(yǔ)音片段,其中對(duì)于該語(yǔ)音片段來(lái)說(shuō),無(wú)法從
該語(yǔ)速轉(zhuǎn)換部分9提供的語(yǔ)音片段數(shù)據(jù)中選擇滿足對(duì)應(yīng)于該匹配程度 數(shù)據(jù)值的條件的語(yǔ)音片段數(shù)據(jù),則該匹配語(yǔ)音片段確定部分51確定將 該相應(yīng)的語(yǔ)音片段數(shù)據(jù)當(dāng)作語(yǔ)音片段,其中對(duì)于該語(yǔ)音片段來(lái)說(shuō),該 檢索部分6無(wú)法檢索出該壓縮語(yǔ)音片段數(shù)據(jù)(即,由上述缺少部分識(shí) 別數(shù)據(jù)表示的語(yǔ)音片段)。
接著,與第一實(shí)施例中的語(yǔ)音片段編輯部分5 —樣,該匹配語(yǔ)音 片段確定部分51確定表示該語(yǔ)音片段讀音的音標(biāo)串的字符數(shù)與形成該 標(biāo)準(zhǔn)尺寸消息數(shù)據(jù)的音標(biāo)串的字符總數(shù)的比率(或者,除了表示由從 語(yǔ)速轉(zhuǎn)換部分9提供的缺少部分識(shí)別數(shù)據(jù)指示的語(yǔ)音片段的讀音的部 分以外的部分與形成該標(biāo)準(zhǔn)尺寸消息數(shù)據(jù)的音標(biāo)串中字符總數(shù)的比 率)是否達(dá)到了預(yù)定閾值,其中表示能夠被近似的波形的語(yǔ)音片段數(shù) 據(jù)選擇該語(yǔ)音片段。
接著,如果確定上述比率已經(jīng)達(dá)到了該閾值,則該匹配語(yǔ)音片段 確定部分51將該選擇的語(yǔ)音片段數(shù)據(jù)提供給輸出合成部分53,作為滿 足對(duì)應(yīng)于該匹配程度數(shù)據(jù)值條件的數(shù)據(jù)。在這種情況下,如果也從語(yǔ) 速轉(zhuǎn)換部分9將缺少部分識(shí)別數(shù)據(jù)提供給匹配語(yǔ)音片段確定部分51, 或者如果存在數(shù)據(jù)片段,其中對(duì)于該數(shù)據(jù)片段來(lái)說(shuō),沒(méi)有滿足對(duì)應(yīng)于 該匹配程度數(shù)據(jù)值條件的語(yǔ)音片段數(shù)據(jù)能被選擇,則該匹配語(yǔ)音片段 確定部分51從標(biāo)準(zhǔn)尺寸消息數(shù)據(jù)中提取出表示由該缺少部分識(shí)別數(shù)據(jù)
(包括有語(yǔ)音片段,其中對(duì)于該語(yǔ)音片段來(lái)說(shuō),沒(méi)有滿足對(duì)應(yīng)于該匹 配程度數(shù)據(jù)值條件的語(yǔ)音片段數(shù)據(jù)能被選擇)表示的語(yǔ)音片段讀音的 音標(biāo)串,并將其提供給聲音處理部分41,指示它來(lái)合成該語(yǔ)音片段的波形。
該被指示的聲音處理部分41將從匹配語(yǔ)音片段確定部分51提供 的音標(biāo)串作為由配信字符串表示的音標(biāo)串。結(jié)果,該檢索部分42檢索
出表示碎片的壓縮波形數(shù)據(jù),其中該碎片形成了由包括在音標(biāo)串中的 音標(biāo)表示的音素,并且由擴(kuò)展部分43恢復(fù)壓縮之前的碎片波形數(shù)據(jù)。 另一方面,該韻律預(yù)測(cè)部分52生成韻律預(yù)測(cè)數(shù)據(jù),其中該韻律預(yù)測(cè)數(shù) 據(jù)表示由該音標(biāo)串表示的語(yǔ)音片段韻律的預(yù)測(cè)結(jié)果。接著,該聲音處 理部分41根據(jù)各個(gè)恢復(fù)的碎片波形數(shù)據(jù)和韻律預(yù)測(cè)數(shù)據(jù)來(lái)生成語(yǔ)音波 形數(shù)據(jù),其中該語(yǔ)音波形數(shù)據(jù)表示由包括在音標(biāo)串中的各個(gè)音標(biāo)表示 的語(yǔ)音波形,并將該生成的語(yǔ)音波形數(shù)據(jù)提供給輸出合成部分53。
該匹配語(yǔ)音片段確定部分51可以將對(duì)應(yīng)于由韻律預(yù)測(cè)數(shù)據(jù)中的 缺少部分識(shí)別數(shù)據(jù)表示的語(yǔ)音片段的部分提供給聲音處理部分41,其 中該韻律預(yù)測(cè)數(shù)據(jù)已經(jīng)由該韻律預(yù)測(cè)部分52生成并且被提供給匹配語(yǔ) 音片段確定部分51。在這種情況下,該處理部分41不需要使得該韻律 預(yù)測(cè)部分52再一次對(duì)該語(yǔ)音片段進(jìn)行韻律預(yù)測(cè)。這就使得能夠按照比 通過(guò)精密單元如語(yǔ)音片段進(jìn)行韻律預(yù)測(cè)的情況更自然的方式進(jìn)行發(fā) 聲。
另一方面,如果確定上述比率沒(méi)有達(dá)到該閾值,則該匹配語(yǔ)音片 段確定部分51就確定在語(yǔ)音合成中不使用該語(yǔ)音片段數(shù)據(jù),并且將形 成該標(biāo)準(zhǔn)尺寸消息數(shù)據(jù)的整個(gè)音標(biāo)串提供給聲音處理部分41,并指示 合成該語(yǔ)音片段波形。
將表示由包括在音標(biāo)串中的音標(biāo)表示的語(yǔ)音波形的語(yǔ)音波形數(shù)據(jù)提供 給輸出合成部分53。
當(dāng)從聲音處理部分41提供了由該碎片波形數(shù)據(jù)生成的語(yǔ)音波形
數(shù)據(jù)并且從匹配語(yǔ)音片段確定部分51提供了語(yǔ)音片段數(shù)據(jù)時(shí),該輸出 合成部分53對(duì)包括在提供的語(yǔ)音波形數(shù)據(jù)的各個(gè)片段中的碎片波形數(shù) 據(jù)的片數(shù)進(jìn)行調(diào)整,以使得由該語(yǔ)音波形數(shù)據(jù)表示的語(yǔ)音的時(shí)間長(zhǎng)度 與由從匹配語(yǔ)音片段確定部分51提供的語(yǔ)音片段數(shù)據(jù)表示的語(yǔ)音片段 的發(fā)聲速度相匹配。
特別地,該輸出合成部分53只需要識(shí)別出由包括在語(yǔ)音片段數(shù)據(jù) 中的每個(gè)上述部分表示的音素的時(shí)間長(zhǎng)度與由匹配語(yǔ)音片段確定部分 51增加或降低的初始時(shí)間的比率,并且增加或降低每個(gè)語(yǔ)音波形數(shù)據(jù) 中碎片波形數(shù)據(jù)的片數(shù),使得由從聲音處理部分41提供的語(yǔ)音波形數(shù) 據(jù)表示的音素的時(shí)間長(zhǎng)度在比率方面改變。為識(shí)別該比率,該輸出合 成部分53只需要從檢索部分6獲得在生成由該匹配語(yǔ)音片段確定部分 51提供的語(yǔ)音片段數(shù)據(jù)時(shí)使用的初始語(yǔ)音片段數(shù)據(jù),并且逐個(gè)識(shí)別兩 段語(yǔ)音片段數(shù)據(jù)之間彼此表示相同音素的部分。接著,它只需要識(shí)別 包括在由匹配語(yǔ)音片段確定部分51提供的語(yǔ)音片段數(shù)據(jù)中識(shí)別出的部
分中增加或降低的碎片數(shù)與包括在從檢索部分獲得的語(yǔ)音片段數(shù)據(jù)中 識(shí)別出的部分中的碎片數(shù)的比率,作為增加或降低的音素的時(shí)間長(zhǎng)度 的比率。
如果由該語(yǔ)音波形數(shù)據(jù)表示的音素的時(shí)間長(zhǎng)度已經(jīng)與由匹配語(yǔ)音 片段確定部分51提供的語(yǔ)音片段數(shù)據(jù)表示的語(yǔ)音片段的速度校準(zhǔn),或 者如果不存在從匹配語(yǔ)音片段確定部分51提供給輸出合成部分53的 語(yǔ)音片段數(shù)據(jù)(特別地,例如上述比率沒(méi)有達(dá)到閾值或者如果沒(méi)有選 擇語(yǔ)音片段數(shù)據(jù)),則該輸出合成部分53不需要調(diào)整語(yǔ)音波形數(shù)據(jù)中 碎片波形數(shù)據(jù)的數(shù)量。
接著,該輸出合成部分53將已經(jīng)被調(diào)整碎片波形數(shù)據(jù)片數(shù)的語(yǔ)音 波形數(shù)據(jù)與從匹配語(yǔ)音片段確定部分51提供的語(yǔ)音片段數(shù)據(jù)按照由標(biāo) 準(zhǔn)尺寸消息數(shù)據(jù)表示的標(biāo)準(zhǔn)尺寸消息中排列的語(yǔ)音片段和音素的順序 彼此組合,并將其輸出作為表示合成聲音的數(shù)據(jù)。
如果從語(yǔ)速轉(zhuǎn)換部分9提供的數(shù)據(jù)不包括標(biāo)準(zhǔn)尺寸消息數(shù)據(jù),則 它只需要按照由標(biāo)準(zhǔn)尺寸消息數(shù)據(jù)表示的標(biāo)準(zhǔn)尺寸消息中排列的音標(biāo)
的順序?qū)⒂烧Z(yǔ)音片段編輯部分5選擇的語(yǔ)音片段數(shù)據(jù)組合,并立即將 其輸出作為表示合成數(shù)據(jù)的數(shù)據(jù),而不需要指示該聲音處理部分41來(lái)
合成波形。
在上述本發(fā)明第二實(shí)施例的語(yǔ)音合成系統(tǒng)中,可以通過(guò)錄音編輯 方法根據(jù)韻律的預(yù)測(cè)結(jié)果來(lái)將表示語(yǔ)音片段波形的語(yǔ)音片段數(shù)據(jù)的片 段彼此自然地組合,其中該語(yǔ)音片段可以為比音素更大的單位,并且 合成讀出該標(biāo)準(zhǔn)尺寸消息的語(yǔ)音。
另一方面,通過(guò)使用表示碎片的壓縮波形數(shù)據(jù)的規(guī)則組合方法來(lái) 合成無(wú)法選擇適當(dāng)?shù)恼Z(yǔ)音片段數(shù)據(jù)的語(yǔ)音片段,其中該碎片為比音素 還小的單位。因?yàn)樵搲嚎s波形數(shù)據(jù)表示碎片的波形,因此該波形數(shù)據(jù)
庫(kù)44的存儲(chǔ)容量小于該壓縮波形數(shù)據(jù)表示音素波形情況下的存儲(chǔ)器容 量,并且能夠進(jìn)行快速檢索。因此,該語(yǔ)音合成系統(tǒng)又小又輕便,并 且還能夠適于快速處理。
通過(guò)使用碎片來(lái)進(jìn)行規(guī)則合成的情況與通過(guò)使用音素來(lái)進(jìn)行規(guī)則 合成的情況的不同之處就在于能夠進(jìn)行語(yǔ)音分析,而不會(huì)受到出現(xiàn)在 音素末端部分中的特定波形的影響。因此,第一種情況能夠產(chǎn)生具有 很少種碎片的自然語(yǔ)音。
也就是說(shuō),已經(jīng)知道的是,同時(shí)受到在前音素以及在后音素影響 的特定波形出現(xiàn)在邊界中,而在該邊界上從人發(fā)聲的語(yǔ)音中的在前音
素轉(zhuǎn)移至在后音素。另一方面,當(dāng)進(jìn)行收集時(shí),規(guī)則合成中使用的音 素已經(jīng)在末端包括了特定波形。因此,如果通過(guò)使用音素進(jìn)行規(guī)則合 成,則需要準(zhǔn)備很多種類的音素來(lái)在音素之間的邊界上再現(xiàn)各種形式 的波形,或者應(yīng)該通過(guò)合成不同于語(yǔ)音的合成語(yǔ)音來(lái)滿足,其中該語(yǔ) 音在音素之間的邊界上的波形很自然。在通過(guò)使用碎片來(lái)進(jìn)行規(guī)則合 成的情況下,可以通過(guò)事先從除了音素末端以外的部分收集碎片來(lái)消 除音素之間邊界上的特定波形帶來(lái)的影響。因此,可以產(chǎn)生自然的語(yǔ) 音,而不需要準(zhǔn)備很多種類的音素。
在能夠由形成標(biāo)準(zhǔn)尺寸消息的整個(gè)語(yǔ)音片段中的語(yǔ)音片段數(shù)據(jù)表 示的語(yǔ)音片段近似的語(yǔ)音片段的比率沒(méi)有達(dá)到上述閾值的情況下,該 語(yǔ)音合成系統(tǒng)也按照規(guī)則合成方法對(duì)整個(gè)標(biāo)準(zhǔn)尺寸消息進(jìn)行語(yǔ)音合 成,而不需要使用表示能夠在語(yǔ)音合成中被近似的語(yǔ)音片段的語(yǔ)音片 段數(shù)據(jù)。因此,即使該標(biāo)準(zhǔn)尺寸消息具有少量能夠被由語(yǔ)音片段數(shù)據(jù) 表示的語(yǔ)音片段近似的語(yǔ)音片段,該合成語(yǔ)音中語(yǔ)音片段的質(zhì)量也沒(méi) 有顯著的不均勻,而這幾乎不會(huì)帶來(lái)異常。
本發(fā)明第二實(shí)施例的語(yǔ)音合成系統(tǒng)的結(jié)構(gòu)不僅限于上述結(jié)構(gòu)。
例如,該碎片波形數(shù)據(jù)不需要為PCM格式數(shù)據(jù)并且可以具有任意 數(shù)據(jù)格式。該波形數(shù)據(jù)庫(kù)44在受到數(shù)據(jù)壓縮的情況下不需要存儲(chǔ)碎片 波形數(shù)據(jù)或語(yǔ)音片段數(shù)據(jù)。如果該波形數(shù)據(jù)庫(kù)44在沒(méi)有受到數(shù)據(jù)壓縮 的情況下存儲(chǔ)了碎片波形數(shù)據(jù),則該單元體M2就不需要具有擴(kuò)展部分 43。
該波形數(shù)據(jù)庫(kù)44在單獨(dú)狀態(tài)下不需要存儲(chǔ)碎片波形。例如,它可 以存儲(chǔ)由多個(gè)碎片形成的語(yǔ)音波形,以及用于識(shí)別單個(gè)碎片在波形中 出現(xiàn)的位置的數(shù)據(jù)。在這種情況下,該語(yǔ)音片段數(shù)據(jù)庫(kù)7可以執(zhí)行波 形數(shù)據(jù)庫(kù)44的功能。
該匹配語(yǔ)音片段確定部分51預(yù)先存儲(chǔ)了韻律寄存器數(shù)據(jù);并且如 果該特定語(yǔ)音片段被包括在標(biāo)準(zhǔn)尺寸消息中,則可以將由韻律寄存器 數(shù)據(jù)表示的韻律當(dāng)作韻律預(yù)測(cè)的結(jié)果,這與第一實(shí)施例的語(yǔ)音片段編 輯部分5所作的一樣。作為選擇地,該匹配語(yǔ)音片段確定部分51可以 重新存儲(chǔ)過(guò)去的韻律預(yù)測(cè)結(jié)果作為韻律寄存器數(shù)據(jù)。
該匹配語(yǔ)音片段確定部分51可以通過(guò)進(jìn)行實(shí)質(zhì)上與用于選擇表 示包括在標(biāo)準(zhǔn)尺寸消息中的語(yǔ)音片段波形附近的波形的語(yǔ)音片段數(shù)據(jù) 相同的處理,以及與第一實(shí)施例的語(yǔ)音片段編輯部分5 —樣在語(yǔ)音合 成中使用它們來(lái)獲得自由文本數(shù)據(jù)或配信字符串?dāng)?shù)據(jù)。在這種情況下,
該聲音處理部分41不需要使得該檢索部分43為由匹配語(yǔ)音片段確定 部分51選擇的語(yǔ)音片段數(shù)據(jù)表示的語(yǔ)音片段來(lái)檢索表示該語(yǔ)音片段波 形的波形數(shù)據(jù)。該匹配語(yǔ)音片段確定部分51可以將該聲音處理部分41 不需要合成的語(yǔ)音片段報(bào)告給聲音處理部分41,并且該聲音處理部分 41可以響應(yīng)于該報(bào)告而停止檢索形成該語(yǔ)音片段的單位語(yǔ)音的波形。
該由波形數(shù)據(jù)庫(kù)44存儲(chǔ)的壓縮波形數(shù)據(jù)不需要表示碎片,并且可 以是,例如表示由波形數(shù)據(jù)庫(kù)44存儲(chǔ)的音標(biāo)表示的單位語(yǔ)音波形的波 形數(shù)據(jù),或者與第一實(shí)施例一樣在對(duì)波形數(shù)據(jù)進(jìn)行熵編碼時(shí)獲得的數(shù) 據(jù)。
該波形數(shù)據(jù)庫(kù)44可以同時(shí)存儲(chǔ)表示碎片波形的數(shù)據(jù)以及表示音 素波形的數(shù)據(jù)。在這種情況下,該聲音處理部分41可以使得該檢索部 分42來(lái)檢索由包括在配信字符串等中的音標(biāo)表示的音素,并就對(duì)于其 沒(méi)有相應(yīng)音素被檢索出的音標(biāo)來(lái)說(shuō),使得該檢索部分42來(lái)檢索表示碎 片的數(shù)據(jù),其中該碎片形成了由音標(biāo)表示的音素,并且通過(guò)使用表示 碎片的檢索出來(lái)的數(shù)據(jù)使得該檢索部分42生成表示音素的數(shù)據(jù)。
該語(yǔ)速轉(zhuǎn)換部分9可以使用任何方法來(lái)使得由語(yǔ)音片段數(shù)據(jù)表示 的語(yǔ)音片段的時(shí)間長(zhǎng)度與由發(fā)聲速度數(shù)據(jù)表示的速度相匹配。因此,該語(yǔ)速轉(zhuǎn)換部分9可以對(duì)由檢索部分6提供的語(yǔ)音片段數(shù)據(jù)進(jìn)行重新 采樣,并且增加或降低該語(yǔ)音片段數(shù)據(jù)的采樣數(shù),以同第一實(shí)施例中 的處理一樣與對(duì)應(yīng)于時(shí)間長(zhǎng)度的數(shù)量相匹配,其中該時(shí)間長(zhǎng)度與由匹 配語(yǔ)音片段確定部分51指示的發(fā)聲速度相匹配。
該單元體M2不需要包括語(yǔ)速轉(zhuǎn)換部分9。如果該單元體M2不包 括語(yǔ)速轉(zhuǎn)換部分9,則該韻律預(yù)測(cè)部分52可以預(yù)測(cè)發(fā)聲速度,并且該 匹配語(yǔ)音片段確定部分51可以在用于在由檢索部分6獲得的語(yǔ)音片斷 數(shù)據(jù)中進(jìn)行確定的預(yù)定條件下選擇其發(fā)聲速度與韻律預(yù)測(cè)部分52的預(yù) 測(cè)結(jié)果相匹配的語(yǔ)音片段數(shù)據(jù),并從選擇對(duì)象中去除其發(fā)聲速度與預(yù) 測(cè)結(jié)果不匹配的語(yǔ)音片段數(shù)據(jù)。該語(yǔ)音片段數(shù)據(jù)庫(kù)7可以存儲(chǔ)多個(gè)具 有相同讀音和不同發(fā)聲速度的語(yǔ)音片段數(shù)據(jù)。
該輸出合成部分53可以使用任何方法將由語(yǔ)音波形數(shù)據(jù)表示的 音素時(shí)間長(zhǎng)度與由語(yǔ)音片段數(shù)據(jù)表示的語(yǔ)音片段的發(fā)聲速度相匹配。 因此,該輸出合成部分53可以識(shí)別出由包括在被匹配語(yǔ)音片段確定部
分51增加或降低的語(yǔ)音片段數(shù)據(jù)中的每個(gè)部分表示的音素時(shí)間長(zhǎng)度與 原始時(shí)間長(zhǎng)度的比率,接著對(duì)該語(yǔ)音波形數(shù)據(jù)重新進(jìn)行采樣,以及將 該語(yǔ)音波形數(shù)據(jù)的采樣數(shù)增加或降低至對(duì)應(yīng)于時(shí)間長(zhǎng)度的數(shù)量,其中 該時(shí)間長(zhǎng)度與由匹配語(yǔ)音片段確定部分51識(shí)別出的發(fā)聲速度相匹配。
對(duì)于每個(gè)語(yǔ)音片段來(lái)說(shuō),該發(fā)聲速度可以是不同的。(因此,該發(fā) 聲速度數(shù)據(jù)可以用于指定對(duì)于每個(gè)語(yǔ)音片段來(lái)說(shuō)是不同的發(fā)聲速度。) 接著,該輸出合成部分53可以通過(guò)插入兩個(gè)語(yǔ)音片段的發(fā)聲速度(例 如,線性內(nèi)插法)來(lái)確定兩個(gè)語(yǔ)音片段之間語(yǔ)音的發(fā)聲速度,并對(duì)表 示語(yǔ)音的語(yǔ)音波形數(shù)據(jù)進(jìn)行轉(zhuǎn)換,以與確定的發(fā)聲速度相匹配,用于 具有不同發(fā)聲速度的每個(gè)語(yǔ)音的語(yǔ)音波形數(shù)據(jù),其中該不同的發(fā)聲速 度被置于兩個(gè)語(yǔ)音片段之間。
例如,該輸出合成部分53可以對(duì)從聲音處理部分41返回的語(yǔ)音
波形數(shù)據(jù)進(jìn)行轉(zhuǎn)換,以使得該語(yǔ)音的時(shí)間長(zhǎng)度與由提供給匹配語(yǔ)音片 段確定部分51的發(fā)聲速度數(shù)據(jù)識(shí)別出的速度相匹配,即使該語(yǔ)音波形 數(shù)據(jù)表示形成了讀出自由文本或配信字符串的語(yǔ)音的語(yǔ)音。
在上述系統(tǒng)中,該韻律預(yù)測(cè)部分52可以對(duì)整個(gè)句子進(jìn)行韻律預(yù)測(cè)
(包括預(yù)測(cè)發(fā)聲速度),或者通過(guò)預(yù)定單元進(jìn)行韻律預(yù)測(cè)。在對(duì)整個(gè)句 子進(jìn)行韻律預(yù)測(cè)時(shí),如果存在具有相同讀音的語(yǔ)音片段,則可以進(jìn)一 步確定該韻律在預(yù)定條件下是否匹配。如果該讀音匹配,則可以采用
該語(yǔ)音片段。對(duì)于沒(méi)有出現(xiàn)相同語(yǔ)音片段的部分,該規(guī)則合成部分4
可以根據(jù)碎片產(chǎn)生語(yǔ)音。在這種情況下,可以根據(jù)對(duì)于韻律的預(yù)測(cè)結(jié) 果來(lái)調(diào)整將根據(jù)碎片來(lái)合成的部分的音調(diào)或速度,其中該韻律預(yù)測(cè)是 對(duì)整個(gè)句子或者通過(guò)預(yù)定單元來(lái)進(jìn)行的。這就實(shí)現(xiàn)了自然語(yǔ)音,即使 對(duì)根據(jù)該碎片產(chǎn)生的語(yǔ)音片段和語(yǔ)音進(jìn)行組合以將其合成。
如果輸入給語(yǔ)音處理部分1的字符串為音標(biāo)串,則該語(yǔ)音處理部 分1可以進(jìn)行除了韻律預(yù)測(cè)以外的公知的自然語(yǔ)言分析處理,并且該
匹配語(yǔ)音片段確定部分51可以根據(jù)該自然語(yǔ)言分析處理的結(jié)果來(lái)選擇 語(yǔ)音片段。這就能夠通過(guò)使用對(duì)每個(gè)字的字符串進(jìn)行分析的結(jié)果來(lái)選 擇語(yǔ)音片段(部分語(yǔ)音,例如名詞,動(dòng)詞),這就導(dǎo)致了該語(yǔ)音比簡(jiǎn)單 地選擇與音標(biāo)串相匹配的語(yǔ)音片段的情況更自然。
在第一和第二實(shí)施例中,與閾值進(jìn)行比較的對(duì)象不需要是字符數(shù)。 例如,可以確定實(shí)際檢索出來(lái)的語(yǔ)音片段數(shù)量與語(yǔ)音片段總數(shù)的比率 是否達(dá)到了預(yù)定閾值。
雖然已經(jīng)描述了本發(fā)明的實(shí)施例,但根據(jù)本發(fā)明的語(yǔ)音合成裝置 可以由通用計(jì)算機(jī)系統(tǒng)而不是專用系統(tǒng)來(lái)實(shí)現(xiàn)。
例如,用于執(zhí)行上述處理的單元體Ml可以被配置為程序,該程 序是從存儲(chǔ)了程序的記錄介質(zhì)(CD-ROM, MO,軟盤(pán)(注冊(cè)商標(biāo))等)
安裝的,并且使得個(gè)人計(jì)算機(jī)執(zhí)行上述語(yǔ)言處理部分1,常規(guī)字典2,
用戶字典3,聲音處理部分41,檢索部分42,擴(kuò)展部分43,波形數(shù)據(jù) 庫(kù)44,語(yǔ)音片段編輯部分5,檢索部分6,語(yǔ)音片段數(shù)據(jù)庫(kù)7,擴(kuò)展部 分8,以及語(yǔ)速轉(zhuǎn)換部分9的工作。
用于執(zhí)行上述處理的語(yǔ)音片段寄存器單元R可以被配置為程序, 該程序是從存儲(chǔ)了程序的記錄介質(zhì)安裝的,并使得個(gè)人計(jì)算機(jī)執(zhí)行上 述記錄語(yǔ)音片段數(shù)據(jù)集存儲(chǔ)部分10,語(yǔ)音片段數(shù)據(jù)生成部分11,以及 壓縮部分12的工作。
接著,假設(shè)通過(guò)執(zhí)行程序起到單元體M1或語(yǔ)音片段寄存器單元R 的作用的個(gè)人計(jì)算機(jī)執(zhí)行圖4-6中所示的處理,作為對(duì)應(yīng)于圖1中的語(yǔ) 音合成系統(tǒng)的工作的處理。
圖4為顯示如下情況的處理的流程圖,其中在該情況下個(gè)人計(jì)算 機(jī)獲得了自由文本數(shù)據(jù)。'
圖5為顯示如下情況的處理的流程圖,其中在該情況下個(gè)人計(jì)算 機(jī)獲得了配信字符串?dāng)?shù)據(jù)。
圖6為顯示如下情況的處理的流程圖,其中在該情況下個(gè)人計(jì)算 機(jī)獲得了標(biāo)準(zhǔn)尺寸消息數(shù)據(jù)以及語(yǔ)速數(shù)據(jù)。
也就是說(shuō),當(dāng)個(gè)人計(jì)算機(jī)從外部獲得上述自由文本數(shù)據(jù)時(shí)(步驟 SlOl,圖4),它通過(guò)在常規(guī)字典2或用戶字典3中檢索音標(biāo)來(lái)識(shí)別出 表示包括在由自由文本數(shù)據(jù)表示的自由文本中的每個(gè)表意字的讀音的 音標(biāo),并用識(shí)別出的音標(biāo)替換該表意字(步驟S102)。該個(gè)人計(jì)算機(jī)可 以通過(guò)任何方法獲得該自由文本數(shù)據(jù)。
當(dāng)獲得音標(biāo)時(shí)(其中該音標(biāo)表示用音標(biāo)來(lái)替換自由文本中的全部
表意字的結(jié)果),該個(gè)人計(jì)算機(jī)在波形數(shù)據(jù)庫(kù)44中檢索由關(guān)于包括在 音標(biāo)串中的每個(gè)音標(biāo)的音標(biāo)表示的單位語(yǔ)音波形,并檢索出表示由包 括在音標(biāo)串中的每個(gè)音標(biāo)表示的單位語(yǔ)音波形的壓縮波形數(shù)據(jù)(步驟
S103)。
接著,該個(gè)人計(jì)算機(jī)從檢索到的壓縮波形數(shù)據(jù)中恢復(fù)壓縮之前的 波形數(shù)據(jù)(步驟S104),將恢復(fù)的波形數(shù)據(jù)片段按照音標(biāo)串中排列的音 標(biāo)的順序彼此組合,并將其輸出作為合成語(yǔ)音數(shù)據(jù)(步驟S105)。該個(gè) 人計(jì)算機(jī)可以通過(guò)任何方法輸出該合成語(yǔ)音。
當(dāng)該個(gè)人計(jì)算機(jī)通過(guò)任意方法從外部獲得上述配信字符串?dāng)?shù)據(jù)時(shí) (圖5,步驟S201),它在波形數(shù)據(jù)庫(kù)44中檢索由關(guān)于包括在配信字 符串表示的音標(biāo)串中的每個(gè)音標(biāo)的音標(biāo)表示的單位語(yǔ)音波形,并檢索
出表示由包括在音標(biāo)串中的每個(gè)音標(biāo)表示的單位語(yǔ)音波形的壓縮波形 數(shù)據(jù)(步驟S202)。
接著,該個(gè)人計(jì)算機(jī)從檢索到的壓縮波形數(shù)據(jù)中恢復(fù)壓縮之前的 波形數(shù)據(jù)(步驟S203),將恢復(fù)的波形數(shù)據(jù)片段按照音標(biāo)串中排列的音 標(biāo)的順序彼此組合,并將其輸出作為合成語(yǔ)音數(shù)據(jù)(步驟S204),這與 步驟S105的處理相同。
當(dāng)該個(gè)人計(jì)算機(jī)通過(guò)任意方法從外部獲得上述標(biāo)準(zhǔn)尺寸消息數(shù)據(jù) 和發(fā)聲速度數(shù)據(jù)時(shí)(圖6,步驟S301),它首先檢索出所有的壓縮語(yǔ)音 片段數(shù)據(jù),其中與表示包括在由標(biāo)準(zhǔn)尺寸消息數(shù)據(jù)表示的標(biāo)準(zhǔn)尺寸消 息中的語(yǔ)音片段的讀音的音標(biāo)匹配的音標(biāo)與該壓縮語(yǔ)音片段數(shù)據(jù)相關(guān) (步驟S302)。
在步驟S302,它還檢索出與相應(yīng)壓縮語(yǔ)音片段數(shù)據(jù)相關(guān)的語(yǔ)音片 段讀音數(shù)據(jù),速度缺省值數(shù)據(jù)以及音調(diào)分量數(shù)據(jù)。如果多段壓縮語(yǔ)音 片段數(shù)據(jù)對(duì)應(yīng)于語(yǔ)音片段,則它檢索出所有的相應(yīng)壓縮語(yǔ)音片段數(shù)據(jù)的片段。另一方面,如果存在沒(méi)有壓縮語(yǔ)音片段數(shù)據(jù)被檢索出來(lái)的語(yǔ) 音片段,則它就會(huì)產(chǎn)生上述的缺少部分識(shí)別數(shù)據(jù)。
接著,該個(gè)人計(jì)算機(jī)從檢索出來(lái)的壓縮波形數(shù)據(jù)中恢復(fù)壓縮之前 的語(yǔ)音片段數(shù)據(jù)(步驟S303)。接著,它通過(guò)與上述語(yǔ)音片段編輯部分 5進(jìn)行的相同處理對(duì)恢復(fù)后的語(yǔ)音片段數(shù)據(jù)片段進(jìn)行轉(zhuǎn)換,以使得由該 語(yǔ)音片段數(shù)據(jù)表示的語(yǔ)音片段的時(shí)間長(zhǎng)度與由該發(fā)聲速度數(shù)據(jù)表示的
速度相匹配(步驟S304)。如果沒(méi)有提供發(fā)聲速度數(shù)據(jù),則不需要對(duì)該 恢復(fù)后的語(yǔ)音片段數(shù)據(jù)進(jìn)行轉(zhuǎn)換。
接著,該個(gè)人計(jì)算機(jī)通過(guò)根據(jù)韻律預(yù)測(cè)方法對(duì)由標(biāo)準(zhǔn)尺寸消息數(shù) 據(jù)表示的標(biāo)準(zhǔn)尺寸消息進(jìn)行分析來(lái)預(yù)測(cè)該標(biāo)準(zhǔn)尺寸消息的韻律(步驟 S305)。接著,它通過(guò)執(zhí)行與上述語(yǔ)音片段編輯部分5相同的處理,根 據(jù)由從外部獲得的匹配程度數(shù)據(jù)表示的標(biāo)準(zhǔn),通過(guò)用于語(yǔ)音片段的一 段語(yǔ)音片段數(shù)據(jù),從其時(shí)間長(zhǎng)度被轉(zhuǎn)換的語(yǔ)音片段數(shù)據(jù)中選擇表示最 接近于形成該標(biāo)準(zhǔn)尺寸消息的語(yǔ)音片段波形的波形的一段語(yǔ)音片段數(shù) 據(jù)(步驟S306)。
特別地,在步驟S306,該個(gè)人計(jì)算機(jī)例如根據(jù)上述條件(1) - (3)
識(shí)別出語(yǔ)音片段數(shù)據(jù)。也就是說(shuō),假設(shè)如果該匹配程度數(shù)據(jù)值為"1", 則其讀音與標(biāo)準(zhǔn)尺寸消息中的語(yǔ)音片段匹配的所有語(yǔ)音片段數(shù)據(jù)的片
段被認(rèn)為是表示標(biāo)準(zhǔn)尺寸消息中的語(yǔ)音片段波形。如果該匹配程度數(shù) 據(jù)值為"2",只要表示讀音的音標(biāo)匹配,并且表示語(yǔ)音片段數(shù)據(jù)的音 調(diào)分量頻率的時(shí)間順序變化的音調(diào)分量數(shù)據(jù)的內(nèi)容與包括在標(biāo)準(zhǔn)尺寸 消息中的語(yǔ)音片段的重音預(yù)測(cè)結(jié)果相匹配,則就可以認(rèn)為該語(yǔ)音片段 數(shù)據(jù)表示標(biāo)準(zhǔn)尺寸消息中的語(yǔ)音片段波形。如果該匹配程度數(shù)據(jù)值為 "3",只要表示讀音的音標(biāo)和重讀匹配,以及關(guān)于由該語(yǔ)音片段數(shù)據(jù) 表示的語(yǔ)音是否被讀作清輔音還是鼻輔音的確定結(jié)果與標(biāo)準(zhǔn)尺寸消息 的韻律預(yù)測(cè)結(jié)果相匹配,則就可以認(rèn)為該語(yǔ)音片段數(shù)據(jù)表示標(biāo)準(zhǔn)尺寸
消息中的語(yǔ)音片段波形。
如果對(duì)于語(yǔ)音片段來(lái)說(shuō),有與該匹配程度數(shù)據(jù)表示的標(biāo)準(zhǔn)相匹配 的多段語(yǔ)音片段數(shù)據(jù),則假設(shè)根據(jù)比這些設(shè)置更嚴(yán)格的條件將這些段 語(yǔ)音片段數(shù)據(jù)收縮變窄為一個(gè)片段。
接著,該個(gè)人計(jì)算機(jī)確定表示該語(yǔ)音片段讀音的音標(biāo)串的字符數(shù) 與形成該標(biāo)準(zhǔn)尺寸消息數(shù)據(jù)的音標(biāo)串的字符總數(shù)的比率(或者,除了
表示由在步驟S302生成的缺少部分識(shí)別數(shù)據(jù)表示的語(yǔ)音片段的讀音的
部分以外的部分與形成該標(biāo)準(zhǔn)尺寸消息數(shù)據(jù)的音標(biāo)串中字符總數(shù)的比
率)是否達(dá)到了預(yù)定閾值,其屮在步驟S306選擇該語(yǔ)音片段的語(yǔ)音片 段數(shù)據(jù)(步驟S307)。
如果確定上述比率達(dá)到了該閾值并且只要該個(gè)人計(jì)算機(jī)已經(jīng)在步 驟S302生成了缺少部分識(shí)別數(shù)據(jù),則該個(gè)人計(jì)算機(jī)按照如下方式來(lái)恢 復(fù)表示由音標(biāo)串中的每個(gè)音標(biāo)表示的語(yǔ)音波形的波形數(shù)據(jù),即通過(guò)從 該標(biāo)準(zhǔn)尺寸消息數(shù)據(jù)中提取出表示由該缺少部分識(shí)別數(shù)據(jù)表示的語(yǔ)音 片段的讀音的音標(biāo)串,以及對(duì)于音標(biāo)串的每個(gè)音素,通過(guò)以與由配信
字符串?dāng)?shù)據(jù)表示的音標(biāo)串相同的方式處理的提取出來(lái)的音標(biāo)串執(zhí)行上 述步驟S202-S203的處理(步驟S308)。
接著,該個(gè)人計(jì)算機(jī)將該恢復(fù)的波形數(shù)據(jù)與在步驟S306選擇的語(yǔ) 音片段數(shù)據(jù)按照由標(biāo)準(zhǔn)尺寸消息數(shù)據(jù)表示的標(biāo)準(zhǔn)尺寸消息中音標(biāo)串中 排列的音標(biāo)的順序進(jìn)行組合,并將其輸出作為表示合成語(yǔ)音的數(shù)據(jù)(步 驟S309)。
另一方面,如果在步驟S307確定上述比率沒(méi)有達(dá)到閾值,則該個(gè)
人計(jì)算機(jī)通過(guò)確定在語(yǔ)音合成中沒(méi)有使用語(yǔ)音片段數(shù)據(jù),并且通過(guò)按 照與配信字符串?dāng)?shù)據(jù)表示的語(yǔ)音串相同的方式處理的提取出的音標(biāo)串
對(duì)形成標(biāo)準(zhǔn)尺寸消息數(shù)據(jù)的整個(gè)音標(biāo)串的每個(gè)音素執(zhí)行上述步驟 S202-S203的處理來(lái)恢復(fù)表示由音標(biāo)串中的每個(gè)音標(biāo)表示的語(yǔ)音波形
的波形數(shù)據(jù)(步驟S310)。接著,它將該恢復(fù)的波形數(shù)據(jù)段按照由標(biāo)準(zhǔn) 尺寸消息數(shù)據(jù)表示的標(biāo)準(zhǔn)尺寸消息中音標(biāo)串中音標(biāo)的排列順序進(jìn)行組
合,并將其輸出作為表示合成語(yǔ)音的數(shù)據(jù)(步驟S311)。
例如,用于執(zhí)行上述處理的單元體M2可以被配置為程序,該程 序是從存儲(chǔ)了程序的記錄介質(zhì)安裝的,并且使得個(gè)人計(jì)算機(jī)執(zhí)行上述 語(yǔ)言處理部分l,常規(guī)字典2,用戶字典3,聲音處理部分41,檢索部 分42,擴(kuò)展部分43,波形數(shù)據(jù)庫(kù)44,語(yǔ)音片段編輯部分5,檢索部分 6,語(yǔ)音片段數(shù)據(jù)庫(kù)7,擴(kuò)展部分8,以及語(yǔ)速轉(zhuǎn)換部分9的工作。
接著,假設(shè)通過(guò)執(zhí)行程序起到單元體M2或語(yǔ)音片段寄存器單元R 的作用的個(gè)人計(jì)算機(jī)執(zhí)行圖7-9中所示的處理,作為對(duì)應(yīng)于圖3中的語(yǔ) 音合成系統(tǒng)的工作的處理。
圖7為顯示如下情況的處理的流程圖,其中在該情況下執(zhí)行單元 體M2功能的個(gè)人計(jì)算機(jī)獲得了自由文本數(shù)據(jù)。
圖8為顯示如下情況的處理的流程圖,其中在該情況下執(zhí)行單元 體M2功能的個(gè)人計(jì)算機(jī)獲得了配信字符串。
圖9為顯示如下情況的處理的流程圖,其中在該情況下執(zhí)行單元 體M2功能的個(gè)人計(jì)算機(jī)獲得了標(biāo)準(zhǔn)尺寸消息數(shù)據(jù)和發(fā)聲速度數(shù)據(jù)。
也就是說(shuō),當(dāng)個(gè)人計(jì)算機(jī)從外部獲得上述自由文本數(shù)據(jù)時(shí)(步驟 S401,圖7),它通過(guò)在常規(guī)字典2或用戶字典3中檢索音標(biāo)來(lái)識(shí)別出 表示包括在由自由文本數(shù)據(jù)表示的自由文本中的每個(gè)表意字的讀音的 音標(biāo),并用識(shí)別出的音標(biāo)替換該表意字(步驟S402)。該個(gè)人計(jì)算機(jī)可 以通過(guò)任何方法獲得該自由文本數(shù)據(jù)。
當(dāng)獲得表示用音標(biāo)來(lái)替換自由文本中的全部表意字的結(jié)果的音標(biāo)
串時(shí),該個(gè)人計(jì)算機(jī)在波形數(shù)據(jù)庫(kù)44中檢索由關(guān)于包括在音標(biāo)串中的 每個(gè)音標(biāo)的音標(biāo)表示的單位語(yǔ)音的波形,并檢索出表示碎片波形的壓 縮波形數(shù)據(jù),其中該碎片形成了由包括在音標(biāo)串中的每個(gè)音標(biāo)表示的
音素(步驟S403),并從檢索到的壓縮波形數(shù)據(jù)中恢復(fù)壓縮之前的碎片 波形數(shù)據(jù)(步驟S404)。
另一方面,該個(gè)人計(jì)算機(jī)通過(guò)根據(jù)韻律預(yù)測(cè)方法對(duì)自由文本數(shù)據(jù) 進(jìn)行分析來(lái)預(yù)測(cè)由自由文本表示的語(yǔ)音的韻律(步驟S405)。接著,它 根據(jù)步驟S405的韻律預(yù)測(cè)結(jié)果來(lái)生成在步驟S404恢復(fù)的碎片波形數(shù) 據(jù)以及語(yǔ)音波形麵據(jù)'(步驟S406),將獲得的波形數(shù)據(jù)片段按照音標(biāo)串 中排列的音標(biāo)的順序彼此組合,并將其輸出作為合成語(yǔ)音數(shù)據(jù)(步驟 S407)。該個(gè)人計(jì)算機(jī)可以通過(guò)任何方法來(lái)輸出合成的語(yǔ)音數(shù)據(jù)。
當(dāng)該個(gè)人計(jì)算機(jī)通過(guò)任意方法從外部獲得上述配信字符串?dāng)?shù)據(jù)時(shí) (圖8,步驟S501),它執(zhí)行如下處理,對(duì)于以與上述步驟S403-S404 一樣包括在由配信字符串?dāng)?shù)據(jù)表示的音標(biāo)串中的每個(gè)音標(biāo),檢索出表 示形成由音標(biāo)表示的音素的碎片波形的壓縮波形數(shù)據(jù),并且從檢索到 的壓縮波形數(shù)據(jù)中恢復(fù)碎片波形數(shù)據(jù)(步驟S502)。
當(dāng)該個(gè)人計(jì)算機(jī)通過(guò)根據(jù)韻律預(yù)測(cè)方法對(duì)配信字符串進(jìn)行分析來(lái) 預(yù)測(cè)由配信字符串表示的語(yǔ)音的韻律時(shí)(步驟S503),它根據(jù)步驟S503 的韻律預(yù)測(cè)結(jié)果來(lái)生成在步驟S502恢復(fù)的碎片波形數(shù)據(jù)以及語(yǔ)音波形 數(shù)據(jù)(步驟S504),通過(guò)采取與步驟S407相同的處理來(lái)將獲得的波形 數(shù)據(jù)片段按照音標(biāo)串中排列的音標(biāo)的順序彼此組合,并將其輸出作為 合成語(yǔ)音數(shù)據(jù)(步驟S505)。
另一方面,當(dāng)該個(gè)人計(jì)算機(jī)通過(guò)任意方法獲得上述標(biāo)準(zhǔn)尺寸消息 數(shù)據(jù)以及發(fā)聲速度數(shù)據(jù)時(shí)(步驟S601,圖9),它首先檢索出所有段的 壓縮語(yǔ)音片段數(shù)據(jù),其中該壓縮語(yǔ)音片段與音標(biāo)相關(guān),而該音標(biāo)與表 示包括在由標(biāo)準(zhǔn)尺寸數(shù)據(jù)表示的標(biāo)準(zhǔn)尺寸消息中的語(yǔ)音片段讀音的音
標(biāo)相匹配(步驟S602)。
在步驟S602,它還檢索出與相應(yīng)壓縮語(yǔ)音片段數(shù)據(jù)相關(guān)的上述語(yǔ) 音片段讀音數(shù)據(jù),速度缺省值數(shù)據(jù)以及音調(diào)分量數(shù)據(jù)。如果多段壓縮 語(yǔ)音片段數(shù)據(jù)對(duì)應(yīng)于語(yǔ)音片段,則它檢索所有的相應(yīng)壓縮語(yǔ)音片段數(shù) 據(jù)的片段。另一方面,如果存在對(duì)于其沒(méi)有壓縮語(yǔ)音片段數(shù)據(jù)被檢索 出來(lái)的語(yǔ)音片段,則它就會(huì)產(chǎn)生上述缺少部分識(shí)別數(shù)據(jù)。
接著,該個(gè)人計(jì)算機(jī)從檢索出來(lái)的壓縮波形數(shù)據(jù)中恢復(fù)壓縮之前 的語(yǔ)音片'段數(shù)據(jù)(步驟S603)。接著,它通過(guò)與上述語(yǔ)音片段編輯部分 5進(jìn)行的相同處理對(duì)恢復(fù)后的語(yǔ)音片段數(shù)據(jù)片段進(jìn)行轉(zhuǎn)換,以使得由該 語(yǔ)音片段數(shù)據(jù)表示的語(yǔ)音片段的時(shí)間長(zhǎng)度與由該發(fā)聲速度數(shù)據(jù)表示的 速度相匹配(步驟S604)。如果沒(méi)有提供發(fā)聲速度數(shù)據(jù),則不需要對(duì)該 恢復(fù)后的語(yǔ)音片段數(shù)據(jù)進(jìn)行轉(zhuǎn)換。
接著,該個(gè)人計(jì)算機(jī)通過(guò)根據(jù)韻律預(yù)測(cè)方法對(duì)由標(biāo)準(zhǔn)尺寸消息數(shù) 據(jù)表示的標(biāo)準(zhǔn)尺寸消息進(jìn)行分析來(lái)預(yù)測(cè)該標(biāo)準(zhǔn)尺寸消息的韻律(步驟 S605)。接著,它通過(guò)執(zhí)行與上述匹配語(yǔ)音片段確定部分51執(zhí)行的相 同處理,根據(jù)由從外部獲得的匹配程度數(shù)據(jù)表示的標(biāo)準(zhǔn),通過(guò)用于語(yǔ) 音片段的一段語(yǔ)音片段數(shù)據(jù),從轉(zhuǎn)換其語(yǔ)音片段的時(shí)間長(zhǎng)度的語(yǔ)音片 段數(shù)據(jù)中選擇表示最接近于形成該標(biāo)準(zhǔn)尺寸消息的語(yǔ)音片段波形的波 形的一段語(yǔ)音片段數(shù)據(jù)(步驟S606)。
特別地,在步驟S606,該個(gè)人計(jì)算機(jī)例如通過(guò)進(jìn)行與上述步驟 S306相同的處理根據(jù)上述條件(1) - (3)識(shí)別出語(yǔ)音片段數(shù)據(jù)。假設(shè) 如果對(duì)于一個(gè)語(yǔ)音片段來(lái)說(shuō)存在與由匹配程度數(shù)據(jù)表示的標(biāo)準(zhǔn)相匹配 的多段語(yǔ)音片段數(shù)據(jù),則它根據(jù)比這些設(shè)置更嚴(yán)格的條件將這些段語(yǔ) 音片段數(shù)據(jù)收縮變窄為一片段。還假設(shè)如果存在一語(yǔ)音片段,其中對(duì) 于該語(yǔ)音片段來(lái)說(shuō)沒(méi)有語(yǔ)音片段數(shù)據(jù)滿足對(duì)應(yīng)于該匹配程度數(shù)據(jù)值的 條件,則它確定將該相應(yīng)的語(yǔ)音片段當(dāng)作對(duì)于其沒(méi)有壓縮語(yǔ)音片段數(shù)
據(jù)被檢索出來(lái)的語(yǔ)音片段,并且例如,生成缺少部分識(shí)別數(shù)據(jù)。
接下來(lái),與第二實(shí)施例的匹配語(yǔ)音片段確定部分53所作的一樣, 該個(gè)人計(jì)算機(jī)確定表示該語(yǔ)音片段讀音的音標(biāo)串的字符數(shù)與形成該標(biāo) 準(zhǔn)尺寸消息數(shù)據(jù)的音標(biāo)串的字符總數(shù)的比率(或者,除了表示由在步
驟S602或S606生成的缺少部分識(shí)別數(shù)據(jù)表示的語(yǔ)音片段的讀音的部 分以外的部分與形成該標(biāo)準(zhǔn)尺寸消息數(shù)據(jù)的音標(biāo)串中字符總數(shù)的比 率)是否達(dá)到了預(yù)定閾值,其中對(duì)于該語(yǔ)音片段來(lái)說(shuō),選擇表示能夠 被近似的波形的語(yǔ)音片段數(shù)據(jù)(步驟S607)。
如果確定上述比率達(dá)到了該閾值并且如果該個(gè)人計(jì)算機(jī)已經(jīng)在步 驟S602或S606生成了缺少部分識(shí)別數(shù)據(jù),則它通過(guò)如下方式生成表 示由音標(biāo)字符串中的每個(gè)音標(biāo)表示的語(yǔ)音波形的語(yǔ)音波形數(shù)據(jù),即從 該標(biāo)準(zhǔn)尺寸消息數(shù)據(jù)中提取出表示由該缺少部分識(shí)別數(shù)據(jù)表示的語(yǔ)音 片段的讀音的音標(biāo)串,以及對(duì)于提取出的音標(biāo)串的每個(gè)音素,通過(guò)被 當(dāng)作由配信字符串?dāng)?shù)據(jù)表示的音標(biāo)串的提取出來(lái)的音標(biāo)串來(lái)進(jìn)行與上 述步驟S502-S504相同的處理(步驟S608)。
在步驟S608,該個(gè)人計(jì)算機(jī)可以通過(guò)使用在步驟S605的韻律預(yù) 測(cè)結(jié)果來(lái)生成語(yǔ)音波形數(shù)據(jù),而不是進(jìn)行對(duì)應(yīng)于步驟S503處理的處理。
接著,該個(gè)人計(jì)算機(jī)通過(guò)執(zhí)行與上述輸出合成部分進(jìn)行的相同處 理來(lái)調(diào)整包括在步驟S608生成的語(yǔ)音波形數(shù)據(jù)中的碎片波形數(shù)據(jù)的片
段的數(shù)目,以使得由該語(yǔ)音波形數(shù)據(jù)表示的語(yǔ)音時(shí)間長(zhǎng)度與在由步驟 S606選擇的語(yǔ)音片段數(shù)據(jù)表示的語(yǔ)音片段的發(fā)聲速度相匹配(步驟 S609)
也就是說(shuō),該個(gè)人計(jì)算機(jī)只需要識(shí)別出由包括在步驟S606選擇的 語(yǔ)音片段數(shù)據(jù)中的每個(gè)上述部分表示的音素的時(shí)間長(zhǎng)度與在步驟S609 的初始時(shí)間長(zhǎng)度的比率,例如,增加或者降低每個(gè)語(yǔ)音波形數(shù)據(jù)中碎
片波形數(shù)據(jù)的片數(shù),以便于通過(guò)比率來(lái)改變由在步驟S608生成的語(yǔ)音 波形數(shù)據(jù)表示的語(yǔ)音的時(shí)間長(zhǎng)度。為識(shí)別該比率,該個(gè)人計(jì)算機(jī)只需
要識(shí)別出表示在步驟S606選擇的語(yǔ)音片段數(shù)據(jù)中相同的語(yǔ)音的部分 (發(fā)聲速度轉(zhuǎn)換之后的語(yǔ)音片段數(shù)據(jù))以及初始語(yǔ)音片段,即在步驟 S604經(jīng)受轉(zhuǎn)換之前的語(yǔ)音片段數(shù)據(jù),并且識(shí)別出包括在經(jīng)受發(fā)聲速度 轉(zhuǎn)換增加或降低之后在該初始語(yǔ)音片段數(shù)據(jù)中識(shí)別出的部分中的碎片 數(shù)量與包括在初始語(yǔ)音數(shù)據(jù)中識(shí)別出的部分中的碎片數(shù)量的比率,作 為增加或降低的語(yǔ)音時(shí)間長(zhǎng)度的比率。
如果由語(yǔ)音波形數(shù)據(jù)表示的語(yǔ)音的時(shí)間長(zhǎng)度與由經(jīng)受發(fā)聲速度轉(zhuǎn) 換之后的語(yǔ)音片段數(shù)據(jù)表示的語(yǔ)音片段的速度相匹配,或者如果在步 驟S606沒(méi)有選擇語(yǔ)音片段數(shù)據(jù),則該個(gè)人計(jì)算機(jī)不需要調(diào)整該語(yǔ)音片 段數(shù)據(jù)中碎片波形數(shù)據(jù)的片段的數(shù)目。
接著,該個(gè)人計(jì)算機(jī)將已經(jīng)經(jīng)過(guò)了步驟S609的處理的語(yǔ)音波形數(shù) 據(jù)與在步驟S606選擇的語(yǔ)音片段數(shù)據(jù)按照由標(biāo)準(zhǔn)尺寸消息數(shù)據(jù)表示的 標(biāo)準(zhǔn)尺寸消息中排列的音標(biāo)串的順序進(jìn)行組合,并將其輸出作為表示 合成語(yǔ)音的數(shù)據(jù)(步驟S610)。
另一方面,在步驟S607,如果確定上述比率沒(méi)有達(dá)到閾值,則該 個(gè)人計(jì)算機(jī)確定在語(yǔ)音合成中不使用語(yǔ)音片段數(shù)據(jù),并且通過(guò)被當(dāng)作
由配信字符串?dāng)?shù)據(jù)表示的音標(biāo)串的語(yǔ)音片段數(shù)據(jù)對(duì)形成該標(biāo)準(zhǔn)尺寸消 息數(shù)據(jù)的整個(gè)音標(biāo)串的每個(gè)音素執(zhí)行與上述步驟S502-S504相同的處 理來(lái)生成表示由音標(biāo)串中的每個(gè)音標(biāo)表示的語(yǔ)音波形的語(yǔ)音波形數(shù)據(jù) (步驟S611)。該個(gè)人計(jì)算機(jī)可以在S605通過(guò)使用韻律預(yù)測(cè)結(jié)果生成 語(yǔ)音波形數(shù)據(jù),而不是在步驟S611執(zhí)行對(duì)應(yīng)于在步驟S503的處理的 處理。
接著,該個(gè)人計(jì)算機(jī)將在步驟S611生成的多段語(yǔ)音波形數(shù)據(jù)按照 由標(biāo)準(zhǔn)尺寸消息數(shù)據(jù)表示的標(biāo)準(zhǔn)尺寸消息中排列的音標(biāo)串的順序彼此
組合,并將其輸出作為表示合成語(yǔ)音的數(shù)據(jù)(步驟S612)。
例如,可以將使得個(gè)人計(jì)算機(jī)執(zhí)行單元體M2和語(yǔ)音片段寄存器 單元R的功能的程序上傳到通信電路的公告板(BBS),并且通過(guò)通信 電路進(jìn)行分布。作為選擇地,還可以通過(guò)表示程序的信號(hào)來(lái)對(duì)載波進(jìn) 行調(diào)制,發(fā)出該得到的調(diào)制波,使得接收該調(diào)制波的裝置通過(guò)對(duì)調(diào)制 波進(jìn)行解調(diào)來(lái)恢復(fù)程序。
接著,當(dāng)該程序被激活并且在OS的控制下被執(zhí)行作為其他應(yīng)用 程序時(shí),能夠進(jìn)行上述處理。
如果該OS負(fù)責(zé)一部分處理,或者該OS形成本發(fā)明的一部分組件, 則該記錄介質(zhì)可以通過(guò)被去除的部分來(lái)存儲(chǔ)程序。在本發(fā)明中,還假 設(shè)該記錄介質(zhì)存儲(chǔ)了程序,該程序用于啟用在這種情況下由計(jì)算機(jī)執(zhí) 行的每個(gè)功能或每個(gè)步驟。
權(quán)利要求
1.一種語(yǔ)音合成裝置,其特征在于包括語(yǔ)音片段存儲(chǔ)裝置,用于存儲(chǔ)多段表示語(yǔ)音片段的語(yǔ)音片段數(shù)據(jù);選擇裝置,用于輸入表示句子的句子信息并執(zhí)行如下處理從每段所述語(yǔ)音片段數(shù)據(jù)中選擇具有共用語(yǔ)音的語(yǔ)音片段數(shù)據(jù)的片段以及形成所述句子的讀音;缺失部分合成裝置,用于對(duì)于所述選擇裝置無(wú)法從形成所述句子的語(yǔ)音中選擇其語(yǔ)音片段數(shù)據(jù)的語(yǔ)音,合成表示該語(yǔ)音波形的語(yǔ)音數(shù)據(jù);以及用于通過(guò)將由所述選擇裝置選擇的語(yǔ)音片段數(shù)據(jù)與由所述缺失部分合成裝置合成的語(yǔ)音數(shù)據(jù)相互組合來(lái)生成表示合成語(yǔ)音的數(shù)據(jù)的裝置;其中所述選擇裝置還包括確定裝置,用于確定具有共用語(yǔ)音的語(yǔ)音數(shù)據(jù)與形成所述句子的整個(gè)語(yǔ)音中由被選擇的語(yǔ)音數(shù)據(jù)表示的讀音的比率是否達(dá)到了預(yù)定值;以及如果確定所述比率沒(méi)有達(dá)到所述預(yù)定值,該選擇裝置取消對(duì)于語(yǔ)音片段數(shù)據(jù)的選擇并且進(jìn)行所述語(yǔ)音片段數(shù)據(jù)無(wú)法被選擇的處理。
2. —種語(yǔ)音合成裝置,其特征在于包括語(yǔ)音片段存儲(chǔ)裝置,用于存儲(chǔ)多段表示語(yǔ)音片段的語(yǔ)音片段數(shù)據(jù); 韻律預(yù)測(cè)裝置,用于輸入表示句子的句子信息并預(yù)測(cè)構(gòu)成該句子 的語(yǔ)音的韻律;選擇裝置,用于執(zhí)行以下處理從所述語(yǔ)音片段數(shù)據(jù)中選擇具有 共用語(yǔ)音的語(yǔ)音片段數(shù)據(jù)的片段以及構(gòu)成所述句子的讀音,其中所述 讀音的韻律在預(yù)定條件下與韻律預(yù)測(cè)結(jié)果匹配;缺失部分合成裝置,用于對(duì)于所述選擇裝置無(wú)法從形成所述句子 的語(yǔ)音中選擇其語(yǔ)音片段數(shù)據(jù)的語(yǔ)音,合成表示語(yǔ)音片段波形的語(yǔ)音 數(shù)據(jù);以及用于通過(guò)將由所述選擇裝置選擇的語(yǔ)音片段數(shù)據(jù)與由所述缺失部 分合成裝置合成的語(yǔ)音數(shù)據(jù)相互組合來(lái)生成表示合成語(yǔ)音的數(shù)據(jù)的裝 置;其中所述選擇裝置還包括確定裝置,用于確定具有共用語(yǔ)音的語(yǔ)音與 形成所述句子的整個(gè)語(yǔ)音中由被選擇的語(yǔ)音數(shù)據(jù)表示的讀音的比率是 否達(dá)到了預(yù)定值;以及如果確定所述比率沒(méi)有達(dá)到所述預(yù)定值,該選擇裝置取消對(duì)于該 語(yǔ)音片段數(shù)據(jù)的選擇并且進(jìn)行該語(yǔ)音片段數(shù)據(jù)無(wú)法被選擇的處理。
3. 根據(jù)權(quán)利要求2的語(yǔ)音合成裝置,其特征在于 所述選擇裝置從選擇的對(duì)象中去除在所述預(yù)定條件下其韻律'與韻律預(yù)測(cè)結(jié)果不匹配的語(yǔ)音片段數(shù)據(jù)。
4. 根據(jù)權(quán)利要求2或3的語(yǔ)音合成裝置,其特征在于 所述缺失部分合成裝置包括存儲(chǔ)裝置,用于存儲(chǔ)多個(gè)數(shù)據(jù)段,其中所述數(shù)據(jù)表示音素或者構(gòu) 成該音素的碎片;以及 '合成裝置,用于通過(guò)如下方式來(lái)合成表示語(yǔ)音波形的語(yǔ)音數(shù)據(jù)-標(biāo)識(shí)包括在其語(yǔ)音片段數(shù)據(jù)無(wú)法由所述選擇裝置選擇的語(yǔ)音中的音 素,從所述存儲(chǔ)裝置中獲得表示被標(biāo)識(shí)的音素或者形成該音素的碎片 的數(shù)據(jù)片段,并且將它們彼此組合。
5. 根據(jù)權(quán)利要求4的語(yǔ)音合成裝置,其特征在于所述缺失部分合成裝置包括缺失部分韻律預(yù)測(cè)裝置,用于預(yù)測(cè)所述語(yǔ)音的韻律,其中所述選 擇裝置無(wú)法選擇該語(yǔ)音的語(yǔ)音片段數(shù)據(jù),其中所述合成裝置通過(guò)如下方式來(lái)合成表示語(yǔ)音波形的語(yǔ)音數(shù)據(jù)標(biāo) 識(shí)包括在所述語(yǔ)音中的音素,其中所述選擇裝置無(wú)法選擇所述語(yǔ)音的 語(yǔ)音片段數(shù)據(jù),從所述存儲(chǔ)裝置中獲得表示被標(biāo)識(shí)的音素或者形成該 音素的碎片的數(shù)據(jù),對(duì)所述獲得的數(shù)據(jù)進(jìn)行轉(zhuǎn)換,使得該音素或者由 數(shù)據(jù)表示的語(yǔ)音片段與通過(guò)所述缺失部分韻律預(yù)測(cè)裝置的韻律的預(yù)測(cè) 結(jié)果相匹配,以及將轉(zhuǎn)換后的數(shù)據(jù)段彼此組合。
6. 根據(jù)權(quán)利要求2、 3或4的語(yǔ)音合成裝置,其特征在于 所述缺失部分合成裝置根據(jù)由所述韻律預(yù)測(cè)裝置預(yù)測(cè)的韻律,對(duì)于所述選擇裝置無(wú)法選擇其語(yǔ)音片段數(shù)據(jù)的語(yǔ)音,來(lái)合成表示語(yǔ)音片 段波形的語(yǔ)音數(shù)據(jù)。
7. 根據(jù)權(quán)利要求2-6中任何一個(gè)的語(yǔ)音合成裝置,其特征在于 所述語(yǔ)音片段存儲(chǔ)裝置存儲(chǔ)表示與所述語(yǔ)音片段數(shù)據(jù)相關(guān)的語(yǔ)音片段的音調(diào)的時(shí)間順序變化的韻律數(shù)據(jù),其中所述語(yǔ)音片段由語(yǔ)音片 段數(shù)據(jù)來(lái)表示,其中所述選擇裝置選擇具有共用語(yǔ)音的語(yǔ)音片段數(shù)據(jù)以及構(gòu)成所 述句子的讀音,其中由與所述語(yǔ)音片段數(shù)據(jù)相關(guān)的韻律數(shù)據(jù)表示的音 調(diào)的時(shí)間順序變化最接近于來(lái)自每段語(yǔ)音片段數(shù)據(jù)的韻律預(yù)測(cè)結(jié)果。
8. 根據(jù)權(quán)利要求1-7中任何一個(gè)的語(yǔ)音合成裝置,其特征在于包括語(yǔ)速轉(zhuǎn)換裝置,用于獲得用來(lái)指定講述所述合成語(yǔ)音的速度條件 的語(yǔ)速數(shù)據(jù),以及選擇或者轉(zhuǎn)換語(yǔ)音片段和/或形成表示所述合成語(yǔ)音 的數(shù)據(jù)的語(yǔ)音數(shù)據(jù),使得所述語(yǔ)速數(shù)據(jù)表示在滿足指定條件的速度下 講述的語(yǔ)音。
9. 根據(jù)權(quán)利要求8的語(yǔ)音合成裝置,其特征在于 所述語(yǔ)速轉(zhuǎn)換裝置通過(guò)從語(yǔ)音片段數(shù)據(jù)和/或構(gòu)成表示所述合成語(yǔ)音的數(shù)據(jù)的語(yǔ)音數(shù)據(jù)中去除表示碎片的部分,或者將表示碎片的部 分增加至語(yǔ)音片段數(shù)據(jù)和/或語(yǔ)音數(shù)據(jù)來(lái)轉(zhuǎn)換語(yǔ)音片段數(shù)據(jù)和/或語(yǔ)音 數(shù)據(jù),使得所述語(yǔ)速數(shù)據(jù)表示在滿足指定條件的速度下講述的語(yǔ)音。
10. 根據(jù)權(quán)利要求1-9中任何一個(gè)的語(yǔ)音合成裝置,其特征在于 所述語(yǔ)音片段存儲(chǔ)裝置存儲(chǔ)與所述語(yǔ)音片段數(shù)據(jù)相關(guān)的表示語(yǔ)音片段數(shù)據(jù)的讀音的音標(biāo)數(shù)據(jù),其中所述選擇裝置將語(yǔ)音片段數(shù)據(jù)當(dāng)作其讀音與語(yǔ)音一樣的語(yǔ)音片段 數(shù)據(jù),其中表示讀音的音標(biāo)數(shù)據(jù)與該語(yǔ)音片段數(shù)據(jù)相關(guān),并且該讀音 與形成所述句子的語(yǔ)音的讀音相匹配。
11. 一種語(yǔ)音合成方法,其特征在于包括語(yǔ)音片段存儲(chǔ)步驟,用于存儲(chǔ)多段表示語(yǔ)音片段的語(yǔ)音片段數(shù)據(jù);選擇步驟,用于輸入表示句子的句子信息,并且進(jìn)行如下處理 從每段所述語(yǔ)音片段數(shù)據(jù)中選擇具有共用語(yǔ)音的語(yǔ)音片段數(shù)據(jù)的片段 以及形成所述句子的讀音; '缺失部分合成步驟,用于對(duì)于無(wú)法從形成所述句子的語(yǔ)音中選擇 其語(yǔ)音片段數(shù)據(jù)的語(yǔ)音,合成表示該語(yǔ)音波形的語(yǔ)音數(shù)據(jù);以及用于通過(guò)將被選擇的語(yǔ)音片段數(shù)據(jù)與合成的語(yǔ)音數(shù)據(jù)相互組合來(lái) 生成表示合成語(yǔ)音的數(shù)據(jù)的步驟;其中所述選擇步驟還包括確定步驟,用于確定具有共用語(yǔ)音的語(yǔ)音與 形成所述句子的整個(gè)語(yǔ)音中由被選擇的語(yǔ)音數(shù)據(jù)表示的讀音的比率是 否達(dá)到了預(yù)定值;以及如果確定所述比率沒(méi)有達(dá)到預(yù)定值,該選擇步驟取消對(duì)于語(yǔ)音片 段數(shù)據(jù)的選擇并且進(jìn)行所述語(yǔ)音片段數(shù)據(jù)無(wú)法被選擇的處理。
12. —種語(yǔ)音合成方法,其特征在于包括語(yǔ)音片段存儲(chǔ)步驟,用于存儲(chǔ)多段表示語(yǔ)音片段的語(yǔ)音片段數(shù)據(jù); 韻律預(yù)測(cè)步驟,用于輸入表示句子的句子信息并預(yù)測(cè)構(gòu)成該句子 的語(yǔ)音的韻律;選擇步驟,用于從每段所述語(yǔ)音片段數(shù)據(jù)中選擇具有共用語(yǔ)音的 語(yǔ)音片段數(shù)據(jù)的片段以及構(gòu)成所述句子的讀音,其中所述讀音的韻律 在預(yù)定條件下與韻律預(yù)測(cè)結(jié)果匹配;缺失部分合成步驟,用于對(duì)于無(wú)法從形成所述句子的語(yǔ)音中選擇 其語(yǔ)音片段數(shù)據(jù)的語(yǔ)音,合成表示語(yǔ)音片段波形的語(yǔ)音數(shù)據(jù);以及用于通過(guò)將被選擇的語(yǔ)音片段數(shù)據(jù)與合成的語(yǔ)音數(shù)據(jù)相互組合來(lái)生成表示合成語(yǔ)音的數(shù)據(jù)的步驟;其中所述選擇步驟還包括確定步驟,用于確定具有共用語(yǔ)音的語(yǔ)音與 形成所述句子的整個(gè)語(yǔ)音中由被選擇的語(yǔ)音數(shù)據(jù)表示的讀音的比率是 否達(dá)到了預(yù)定值;以及如果確定所述比率沒(méi)有達(dá)到所述預(yù)定值,則該選擇步驟取消對(duì)于 該語(yǔ)音片段數(shù)據(jù)的選擇并且進(jìn)行該語(yǔ)音片段數(shù)據(jù)無(wú)法被選擇的處理。
13. —種使得計(jì)算機(jī)執(zhí)行如下功能的程序語(yǔ)音片段存儲(chǔ)裝置,用于存儲(chǔ)多段表示語(yǔ)音片段的語(yǔ)音片段數(shù)據(jù); 選擇裝置,用于輸入表示句子的句子信息'并執(zhí)行如下處理從每段所述語(yǔ)音片段數(shù)據(jù)中選擇具有共用語(yǔ)音的語(yǔ)音片段數(shù)據(jù)的片段以及形成所述句子的讀音;缺失部分合成裝置,用于對(duì)于所述選擇裝置無(wú)法從形成所述句子的語(yǔ)音中選擇其語(yǔ)音片段數(shù)據(jù)的語(yǔ)音,合成表示該語(yǔ)音波形的語(yǔ)音數(shù)據(jù);以及用于通過(guò)將由所述選擇裝置選擇的語(yǔ)音片段數(shù)據(jù)與由所述缺失部 分合成裝置合成的語(yǔ)音數(shù)據(jù)相互組合來(lái)生成表示合成語(yǔ)音的數(shù)據(jù)的裝 置;其中所述選擇裝置還包括確定裝置,用于確定具有共用語(yǔ)音的語(yǔ)音與 形成所述句子的整個(gè)語(yǔ)音中由被選擇的語(yǔ)音數(shù)據(jù)表示的讀音的比率是 否達(dá)到了預(yù)定值;以及如果確定所述比率沒(méi)有達(dá)到所述預(yù)定值,則該選擇裝置取消對(duì)于 語(yǔ)音片段數(shù)據(jù)的選擇并且進(jìn)行所述語(yǔ)音片段數(shù)據(jù)無(wú)法被選擇的處理。
14. 一種使得計(jì)算機(jī)執(zhí)行如下功能的程序語(yǔ)音片段存儲(chǔ)裝置,用于存儲(chǔ)多段表示語(yǔ)音片段的語(yǔ)音片段數(shù)據(jù); 韻律預(yù)測(cè)裝置,用于輸入表示句子的句子信息并預(yù)測(cè)構(gòu)成該句子 的語(yǔ)音的韻律;選擇裝置,用于執(zhí)行以下處理從所述語(yǔ)音片段數(shù)據(jù)中選擇具有 共用語(yǔ)音的語(yǔ)音片段數(shù)據(jù)的片段以及構(gòu)成所述句子的讀音,其中所述 讀音的韻律在預(yù)定條件下與韻律預(yù)測(cè)結(jié)果匹配;缺失部分合成裝置,用于對(duì)于所述選擇裝置無(wú)法從形成所述句子 的語(yǔ)音中選擇其語(yǔ)音片段數(shù)據(jù)的語(yǔ)音,合成表示語(yǔ)音片段波形的語(yǔ)音數(shù)據(jù);以及用于通過(guò)將由所述選擇裝置選擇的語(yǔ)音片段數(shù)據(jù)與由所述缺失部 分合成裝置合成的語(yǔ)音數(shù)據(jù)相互組合來(lái)生成表示合成語(yǔ)音的數(shù)據(jù)的裝 置;其中所述選擇裝置還包括確定裝置,用于確定具有共用語(yǔ)音的語(yǔ)音與 形成所述句子的整個(gè)語(yǔ)音中由被選擇的語(yǔ)音數(shù)據(jù)表示的讀音的比率是 否達(dá)到了預(yù)定值;以及如果確定所述比率沒(méi)有達(dá)到所述預(yù)定值,則該選擇裝置取消對(duì)于 該語(yǔ)音片段數(shù)據(jù)的選擇并且進(jìn)行該語(yǔ)音片段數(shù)據(jù)無(wú)法被選擇的處理。
全文摘要
語(yǔ)音片段編輯部分(5)從語(yǔ)音片段數(shù)據(jù)庫(kù)(7)中檢索關(guān)于語(yǔ)音片段的語(yǔ)音片段數(shù)據(jù),其中該語(yǔ)音片段的讀音與固定消息中語(yǔ)音片段的讀音相匹配,并對(duì)該語(yǔ)音片段進(jìn)行轉(zhuǎn)換,以便于與由該發(fā)聲速度數(shù)據(jù)指定的速度相匹配。該語(yǔ)音片段編輯部分(5)預(yù)測(cè)固定消息的韻律,并根據(jù)該韻律預(yù)測(cè)結(jié)果逐個(gè)地選擇與該固定消息的每個(gè)語(yǔ)音片段最匹配的檢索到的語(yǔ)音片段數(shù)據(jù)的項(xiàng)。但是,如果對(duì)應(yīng)于該語(yǔ)音片段數(shù)據(jù)的被選擇的項(xiàng)的部分語(yǔ)音片段沒(méi)有達(dá)到預(yù)定值,則取消該選擇。關(guān)于沒(méi)有被選擇的語(yǔ)音片段,將表示每個(gè)單位語(yǔ)音波形的波形數(shù)據(jù)提供給聲音處理部分(41)。將該選擇的語(yǔ)音片段數(shù)據(jù)與提供的波形數(shù)據(jù)互連,從而生成表示合成語(yǔ)音的數(shù)據(jù)。這樣,就提供了一種語(yǔ)音合成裝置,用于迅速地產(chǎn)生合成語(yǔ)音,而這種簡(jiǎn)單結(jié)構(gòu)不會(huì)帶來(lái)任何不舒服的感覺(jué)。
文檔編號(hào)G10L13/06GK101171624SQ20068001560
公開(kāi)日2008年4月30日 申請(qǐng)日期2006年3月10日 優(yōu)先權(quán)日2005年3月11日
發(fā)明者佐藤寧 申請(qǐng)人:株式會(huì)社建伍