專利名稱:漢字發(fā)音資料庫(kù)生成系統(tǒng)及其方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種資料庫(kù)生成系統(tǒng)及其方法,尤其涉及一種漢字發(fā)音的資 料庫(kù)生成系統(tǒng)及其方法。
背景技術(shù):
對(duì)于現(xiàn)有的語(yǔ)音技術(shù)而言,分為真人語(yǔ)音以及語(yǔ)音合成(Text To Speech, TTS )兩種不同的語(yǔ)音技術(shù)。
真人語(yǔ)音技術(shù)是對(duì)于需要發(fā)音的單字、字詞以及單句,通過(guò)人的發(fā)音, 將需要發(fā)音的單字、字詞以及單句進(jìn)行朗讀,并且錄制人的發(fā)音,這種真人 語(yǔ)音技術(shù)優(yōu)點(diǎn)在于由于采用錄制人的發(fā)音,因此對(duì)于發(fā)音具有高度的正確性。
但是,真人語(yǔ)音技術(shù)缺點(diǎn)在于由于采用錄制人的發(fā)音,因此,對(duì)于不 同的單字、字詞以及單句需要錄制不同的語(yǔ)音檔案,會(huì)占據(jù)不小的儲(chǔ)存空間, 又因?yàn)檎嫒苏Z(yǔ)音技術(shù)僅能對(duì)已錄制過(guò)的單字、字詞以及單句進(jìn)行發(fā)音,因此 將無(wú)法任意的朗讀單字、字詞以及單句。
而語(yǔ)音合成技術(shù)為人工產(chǎn)生的發(fā)音,將單字、字詞、單句以及文章的內(nèi) 容,通過(guò)語(yǔ)音合成器,產(chǎn)生出與單字、字詞、單句以及文章的內(nèi)容相對(duì)應(yīng)的 人工發(fā)音,這種語(yǔ)音合成技術(shù)的優(yōu)點(diǎn)在于由于語(yǔ)音合成技術(shù)是通過(guò)語(yǔ)音合 成器來(lái)產(chǎn)生對(duì)應(yīng)的人工發(fā)音,因此可以對(duì)不同單字、字詞、單句以及文章的 內(nèi)容進(jìn)行人工發(fā)音,并且所占用的儲(chǔ)存空間減少很多。
但是,語(yǔ)音合成技術(shù)的缺點(diǎn)在于由于語(yǔ)音合成技術(shù)是通過(guò)語(yǔ)音合成器 來(lái)產(chǎn)生對(duì)應(yīng)的人工發(fā)音,在使用上來(lái)說(shuō),會(huì)有發(fā)音不標(biāo)準(zhǔn)、音調(diào)錯(cuò)亂、發(fā)音 錯(cuò)誤以及聽(tīng)起來(lái)模糊不清的問(wèn)題。
通過(guò)比較真人語(yǔ)音技術(shù)以及語(yǔ)音合成技術(shù),可以明顯地看出來(lái),真人語(yǔ)音技術(shù)的優(yōu)點(diǎn)卻是語(yǔ)音合成技術(shù)的缺點(diǎn),真人語(yǔ)音技術(shù)的缺點(diǎn)卻是語(yǔ)音合成
技術(shù)的優(yōu)點(diǎn);是否能有效地將真人語(yǔ)音技術(shù)以及語(yǔ)音合成技術(shù)的優(yōu)點(diǎn)整合, 即可以相互解決真人語(yǔ)音技術(shù)以及語(yǔ)音合成技術(shù)的缺點(diǎn),這方面是值得研究 的部份。
綜上所述,可知先前技術(shù)中長(zhǎng)期以來(lái)一直存在真人語(yǔ)音技術(shù)占用存儲(chǔ)空 間過(guò)大且無(wú)法對(duì)任意文章進(jìn)行發(fā)音的問(wèn)題,以及語(yǔ)音合成技術(shù)發(fā)音不準(zhǔn)、音 調(diào)不準(zhǔn)等問(wèn)題,因此有必要提出改進(jìn)的技術(shù)手段,來(lái)解決此一問(wèn)題。
發(fā)明內(nèi)容
有鑒于先前技術(shù)存在真人語(yǔ)音技術(shù)占用存儲(chǔ)空間過(guò)大且無(wú)法對(duì)任意文 章進(jìn)行發(fā)音的問(wèn)題,以及語(yǔ)音合成技術(shù)發(fā)音不準(zhǔn)、音調(diào)不準(zhǔn)等問(wèn)題,本發(fā)明 遂揭露一種漢字發(fā)音資料庫(kù)生成系統(tǒng)及其方法,其中
本發(fā)明所揭露的漢字發(fā)音資料庫(kù)生成系統(tǒng),漢字發(fā)音規(guī)則為聲母音節(jié)、 韻母音節(jié)以及音調(diào)的組合,包含錄制模塊、儲(chǔ)存模塊、語(yǔ)音資料庫(kù)、生成
模塊以及漢字發(fā)音資料庫(kù)。
其中,錄制模塊,分別將聲母音節(jié)和音調(diào)的組合、以及韻母音節(jié)和音調(diào) 的組合,錄制為數(shù)個(gè)音節(jié);儲(chǔ)存模塊,用以將音節(jié)儲(chǔ)存為語(yǔ)音資料庫(kù);生成 模塊,依據(jù)每一漢字配置至少一音節(jié)組合,并將音節(jié)組合對(duì)應(yīng)至語(yǔ)音資料庫(kù) 的音節(jié),以生成漢字發(fā)音資料庫(kù)。
本發(fā)明所揭露的漢字發(fā)音資料庫(kù)生成方法,漢字發(fā)音規(guī)則為聲母音節(jié)、 韻母音節(jié)以及音調(diào)的組合,包含下列步驟
首先,分別錄制聲母音節(jié)和音調(diào)的組合、以及韻母音節(jié)和音調(diào)的組合為 數(shù)個(gè)音節(jié);接著,儲(chǔ)存音節(jié)至語(yǔ)音資料庫(kù);最后,依據(jù)每一漢字配置至少一 音節(jié)組合,并將音節(jié)組合對(duì)應(yīng)至語(yǔ)音資料庫(kù)的音節(jié),以生成漢字發(fā)音資料庫(kù)。
本發(fā)明所揭露的漢字發(fā)音資料庫(kù)生成系統(tǒng)與方法如上,與先前技術(shù)之間 的差異在于本發(fā)明分別將聲母音節(jié)與音調(diào)的組合、韻母音節(jié)與音調(diào)的組合, 錄制為數(shù)個(gè)音節(jié),并儲(chǔ)存至語(yǔ)音資料庫(kù),接著對(duì)每一個(gè)漢字配置至少一音節(jié) 組合,用以生成漢字發(fā)音資料庫(kù);通過(guò)漢字發(fā)音資料庫(kù)與語(yǔ)音資料庫(kù)的對(duì)應(yīng)關(guān)系,可以針對(duì)每一個(gè)漢字進(jìn)行個(gè)別的發(fā)音,因此,只需要儲(chǔ)存基本的音節(jié), 以及漢字對(duì)應(yīng)的音節(jié)組合,語(yǔ)音資料所占據(jù)的儲(chǔ)存空間將縮小許多,并且可 以對(duì)不同的單字、字詞、單句以及文章的內(nèi)容進(jìn)行發(fā)音,可以解決先前技術(shù)
存在真人語(yǔ)音技術(shù)占用存儲(chǔ)空間過(guò)大且無(wú)法對(duì)任意文章進(jìn)行發(fā)音的問(wèn)題,以
及語(yǔ)音合成技術(shù)發(fā)音不準(zhǔn)、音調(diào)不準(zhǔn)等問(wèn)題。
通過(guò)上述的技術(shù)手段,本發(fā)明可以達(dá)成減少語(yǔ)音資料儲(chǔ)存空間以及對(duì)任 意文章進(jìn)行發(fā)音的技術(shù)功效。
圖1為本發(fā)明漢字發(fā)音資料庫(kù)生成系統(tǒng)方框圖。
圖2為本發(fā)明漢字發(fā)音資料庫(kù)生成方法流程圖。
圖3為本發(fā)明語(yǔ)音資料庫(kù)內(nèi)容示意圖。
圖4為本發(fā)明漢字發(fā)音資料庫(kù)內(nèi)容示意圖。
圖5為本發(fā)明語(yǔ)音資料庫(kù)及漢字發(fā)音資料庫(kù)關(guān)聯(lián)示意圖。
具體實(shí)施例方式
以下將配合附圖及實(shí)施例來(lái)詳細(xì)說(shuō)明本發(fā)明的實(shí)施方式,藉此對(duì)本發(fā)明 如何應(yīng)用技術(shù)手段來(lái)解決技術(shù)問(wèn)題并達(dá)成技術(shù)功效的實(shí)現(xiàn)過(guò)程能充分理解 并據(jù)以實(shí)施。
以下將說(shuō)明本發(fā)明中漢字發(fā)音資料庫(kù)生成系統(tǒng),并請(qǐng)同時(shí)參考圖1所 示,圖1為本發(fā)明漢字發(fā)音資料庫(kù)生成系統(tǒng)方框圖。本發(fā)明所揭露的漢字發(fā) 音資料庫(kù)生成系統(tǒng),漢字發(fā)音規(guī)則為聲母音節(jié)、韻母音節(jié)以及音調(diào)的組合, 包含錄制模塊10、儲(chǔ)存模塊20、語(yǔ)音資料庫(kù)30、生成模塊40以及漢字 發(fā)音資料庫(kù)50。
首先,使用者可以通過(guò)錄制模塊IO分別將聲母音節(jié)和音調(diào)的組合、以 及韻母音節(jié)和音調(diào)的組合錄制為數(shù)個(gè)音節(jié), 一個(gè)音節(jié)可以只有聲母音節(jié)、聲
母音節(jié)和音調(diào)的組合、只有韻母音節(jié)或者韻母音節(jié)和音調(diào)的組合。
分別以注音符號(hào)以及拼音符號(hào)舉例來(lái)說(shuō),注音符號(hào)只有聲母音節(jié)的音節(jié)有r勺j、 「jm、 「pm…等,拼音符號(hào)只有聲母音節(jié)的音節(jié)有rb」、
「p」、「m」…等;注音符號(hào)為聲母音節(jié)和音調(diào)的組合的音節(jié)有「尸 J 、
r卩'」…等,拼音符號(hào)為聲母音節(jié)和音調(diào)的組合的音節(jié)有「sh」、「zJ…
等;注音符號(hào)只有韻母音節(jié)的音節(jié)有「 丫」、r C」、「亡」…等,拼音符 號(hào)只有韻母音節(jié)的音節(jié)有「a」、「o」、rej…等;注音符號(hào)為韻母音節(jié)
和音調(diào)的組合的音節(jié)有「 X v」、「 I 、 J…等,拼音符號(hào)為韻母音節(jié)和音 調(diào)的組合的音節(jié)有「u」、n」…等。
將所有的只有聲母音節(jié)的音節(jié)、聲母音節(jié)和音調(diào)的組合的音節(jié)、只有韻 母音節(jié)的音節(jié)、以及韻母音節(jié)和音調(diào)的組合的音節(jié)通過(guò)錄制^t塊io錄制完
成后,接著,會(huì)通過(guò)儲(chǔ)存模塊20將所有錄制的音節(jié)儲(chǔ)存至語(yǔ)音資料庫(kù)30中, 這個(gè)語(yǔ)音資料庫(kù)30即為發(fā)音的基本資料庫(kù)。
當(dāng)建立完成語(yǔ)音資料庫(kù)30后,接著,生成模塊40會(huì)依據(jù)漢字發(fā)音規(guī)則 為每一漢字配置至少一音節(jié)組合,并將音節(jié)組合對(duì)應(yīng)至語(yǔ)音資料庫(kù)30的音
節(jié),以生成漢字發(fā)音資料庫(kù)50。
所謂的漢字發(fā)音規(guī)則,即一個(gè)漢字的發(fā)音為一個(gè)聲母音節(jié)配合一個(gè)韻母 音節(jié)以及音調(diào)以形成一個(gè)漢字的發(fā)音;音節(jié)組合即為一個(gè)聲母音節(jié)配合一個(gè) 韻母音節(jié)以及音調(diào),等同于一個(gè)漢字的發(fā)音,因此,所生成的漢字發(fā)音資料 庫(kù)50包含漢字、詞語(yǔ)以及分別對(duì)應(yīng)漢字和詞語(yǔ)的音節(jié)組合,漢字發(fā)音資料 庫(kù)50中音節(jié)組合以「聲母音節(jié)+韻母音節(jié)音調(diào)J的形式儲(chǔ)存,例如漢字
r你j的音節(jié)組合,其注音符號(hào)以及拼音符號(hào)分別為「3+1 3」以及rn
+ i3 J 。
在漢字的音節(jié)組合中,會(huì)有缺少聲母音節(jié)或韻母音節(jié)以及聲母音節(jié)或韻 母音節(jié)不發(fā)音的情形,此時(shí)將以符號(hào)字符取代該音節(jié)組合中聲母音節(jié)或韻母 音節(jié)。
分別以注音符號(hào)以及拼音符號(hào)舉例來(lái)說(shuō),缺少聲母音節(jié)的漢字r額J , 注音符號(hào)以及拼音符號(hào)分別為r亡'」以及re」,此時(shí)為缺少聲母音節(jié)的 情形,因此本實(shí)施例中以符號(hào)字符「 $」取代聲母音節(jié),所以在漢字發(fā)音資 料庫(kù)50中r額」的音節(jié)組合,注音符號(hào)以及拼音符號(hào)分別為r $ +亡2」 以及r $ + e2 J 。在拼音符號(hào)中,還有一種規(guī)則,具有聲母音節(jié)但是卻不發(fā)音,以漢字「衣J
為例,拼音符號(hào)為「yi』,此時(shí)的聲母音節(jié)「y」是不發(fā)音的,因此,本實(shí) 施例中以符號(hào)字符「 $」取代聲母音節(jié),所以在漢字發(fā)音資料庫(kù)50中「衣J 的音節(jié)組合,注音符號(hào)以及拼音符號(hào)分別為「 $ + —」以及「 $ + il J 。
對(duì)于注音符號(hào)缺少韻母音節(jié)的漢字,以漢字「只」為例,注音符號(hào)為 rikv」,此時(shí)為缺少韻母音節(jié)的情形,因此本實(shí)施例中以符號(hào)字符r $ j 取代韻母音節(jié),所以在漢字發(fā)音資料庫(kù)50中「只」的音節(jié)組合為「 ik 3 + $ J 。
對(duì)照于拼音符號(hào)而言,注音符號(hào)缺少韻母音節(jié)在拼音符號(hào)中為韻母不發(fā) 音的規(guī)則,同樣以漢字「只」為例,拼音符號(hào)為「zhU ,此時(shí)為韻母不發(fā) 音的規(guī)則,因此本實(shí)施例中以符號(hào)字符「 $」取代韻母音節(jié),所以在漢字發(fā) 音資料庫(kù)50中「只」的音節(jié)組合為「 zh3 + $ J 。
當(dāng)一個(gè)漢字中配置超過(guò)一個(gè)音節(jié)組合時(shí),這種漢字即稱為多音字,可以 依照姓氏、動(dòng)詞、形容詞以及發(fā)音頻率等規(guī)則,優(yōu)先排列多個(gè)音節(jié)組合的配 置順序,以所設(shè)定的規(guī)則為優(yōu)先,將符合設(shè)定規(guī)則的音節(jié)組合優(yōu)先配置順序。
除此之外,本系統(tǒng)還可以包含字詞模塊61,用以將具有多音字字詞及 對(duì)應(yīng)多音字字詞的音節(jié)組合儲(chǔ)存至漢字發(fā)音資料庫(kù)50,當(dāng)所需要發(fā)音的詞 語(yǔ)中與漢字發(fā)音資料庫(kù)50儲(chǔ)存的與其對(duì)應(yīng)的多音字字詞中相同漢字越多 時(shí),就會(huì)優(yōu)先進(jìn)行發(fā)音。
例如r為人」以及r為人民」這兩個(gè)詞語(yǔ),r為人」的注音符號(hào)以及 拼音符號(hào)分別為「 乂 1 '日h '」以及「 wei ren」,「為人民J的注音符 號(hào)以及4并音符號(hào)分別為「乂\、日、'nl一'」以及r weirenmin」, 通過(guò)字詞模塊61分別在漢字發(fā)音資料庫(kù)50儲(chǔ)存的音節(jié)組合,「為人」即為 「乂 + "V2日+~2」以及「 w + ei2r + en2」,r為人民J即為r 乂 + \ 4 日+h2門+ |、2」以及r w + ei4 r + en2 m + in2 J 。
因此,當(dāng)遇到r他的為人」以及「他為人民服務(wù)」,r他的為人」所比 對(duì)到的多音字字詞為「為人」,而r他為人民服務(wù)」所比對(duì)到的多音字字詞 為r為人」以及i"為人民」兩個(gè)多音字字詞,選擇多音字字詞中相同漢字較 多的字詞作為發(fā)音標(biāo)準(zhǔn),因此,「他為人民服務(wù)」選擇「為人民」作為發(fā)音標(biāo)準(zhǔn),經(jīng)過(guò)上述的選擇后,「他的為人」以及r他為人民服務(wù)」都可以正確 地進(jìn)行發(fā)音。
在錄制音節(jié)時(shí),由于所儲(chǔ)存的音節(jié)占據(jù)的容量有限,因此可以釆用波形 音頻格式(wav)進(jìn)行儲(chǔ)存,并且可以通過(guò)音節(jié)控制模塊62對(duì)預(yù)先錄制的 音節(jié)進(jìn)行處理,可以控制每一個(gè)音節(jié)的播放時(shí)間以控制發(fā)音速度,使得發(fā)音 會(huì)更接近真人發(fā)音。
接著,以一個(gè)具體的實(shí)施例來(lái)解說(shuō)本發(fā)明的運(yùn)作方式及流程,并請(qǐng)參照 圖2、圖3、圖4以及圖5所示。圖2為本發(fā)明漢字發(fā)音資料庫(kù)生成方法流 程圖;圖3為本發(fā)明語(yǔ)音資料庫(kù)內(nèi)容示意圖;圖4為本發(fā)明漢字發(fā)音資料庫(kù) 內(nèi)容示意圖;圖5為本發(fā)明語(yǔ)音資料庫(kù)及漢字發(fā)音資料庫(kù)關(guān)聯(lián)示意圖。
如圖3所示,使用者可以通過(guò)錄制模塊10分別將聲母音節(jié)和音調(diào)的組 合、以及韻母音節(jié)和音調(diào)的組合錄制為數(shù)個(gè)音節(jié)(步驟100),以實(shí)施例而 言,注音符號(hào)71 「 T J以及拼音符號(hào)72 「x」相互對(duì)應(yīng),通過(guò)錄制模塊10 所錄制的音節(jié)73為「 x.wav」;注音符號(hào)71 r —厶2」以及4并音符號(hào)72「 ing2 J 相互對(duì)應(yīng),通過(guò)錄制模塊10所錄制的音節(jié)73為「 ing2.wav」;注音符號(hào)71 r卩J以及拼音符號(hào)72 r z J相互對(duì)應(yīng),通過(guò)錄制模塊10所錄制的音節(jié)73 為r z.wav」;注音符號(hào)71 r 3 3」以及4并音符號(hào)72 「 ou3」相互對(duì)應(yīng),通過(guò) 錄制模塊10所錄制的音節(jié)73為r ou3.wav J 。
在錄制音節(jié)時(shí),由于所儲(chǔ)存的音節(jié)占據(jù)的容量有限,因此可以采用波形 音頻格式(wav)進(jìn)行儲(chǔ)存,并且可以通過(guò)音節(jié)控制模塊62對(duì)預(yù)先錄制的 音節(jié)進(jìn)行處理,可以控制每一個(gè)音節(jié)的播放時(shí)間以控制發(fā)音速度(步驟420), 使得發(fā)音會(huì)更接近真人發(fā)音。
接著,會(huì)通過(guò)儲(chǔ)存模塊20將所有錄制的音節(jié)73儲(chǔ)存至語(yǔ)音資料庫(kù)30 (步驟200)中,這個(gè)語(yǔ)音資料庫(kù)30即為發(fā)音的基本資料庫(kù),并請(qǐng)參照?qǐng)D3 所示。
如圖4所示,當(dāng)建立完成語(yǔ)音資料庫(kù)30后,接著,生成模塊40會(huì)依據(jù) 漢字發(fā)音規(guī)則為每一漢語(yǔ)字詞74配置至少一注音音節(jié)組合75以及至少一4并 音音節(jié)組合76,并將注音音節(jié)組合75以及^f音音節(jié)組合76對(duì)應(yīng)至語(yǔ)音資 料庫(kù)30的音節(jié)73,以生成漢字發(fā)音資料庫(kù)50 (步驟300),漢字發(fā)音資料庫(kù)50與語(yǔ)音資料庫(kù)30之間的對(duì)應(yīng)關(guān)系請(qǐng)參考圖5所示。
在漢語(yǔ)字詞74的注音音節(jié)組合75以及拼音音節(jié)組合76中,會(huì)有缺少 聲母音節(jié)或韻母音節(jié)以及聲母音節(jié)或韻母音節(jié)不發(fā)音的情形,此時(shí)將以符號(hào) 字符取代注音音節(jié)組合75以及拼音音節(jié)組合76中的聲母音節(jié)或是韻母音
節(jié)
以實(shí)施例來(lái)說(shuō),漢語(yǔ)字詞74 「額」,注音符號(hào)71以及拼音符號(hào)72分 別為「亡'」以及「e」,此時(shí)為缺少聲母音節(jié)的情形,因此本實(shí)施例中以 符號(hào)字符「 $」取代聲母音節(jié),所以在漢字發(fā)音資料庫(kù)50中漢語(yǔ)字詞74「額J 的注音音節(jié)組合75以.及拼音音節(jié)組合76分別為「 $ +亡2 J以及r $ + e2 J。
在拼音符號(hào)中,還有一種規(guī)則,具有聲母音節(jié)但是卻不發(fā)音,實(shí)施例中 的漢語(yǔ)字詞74 「衣」,拼音符號(hào)72為「 yi」,此時(shí)的聲母音節(jié)「 y」是不發(fā) 音的,因此,本實(shí)施例中以符號(hào)字符「 $」取代聲母音節(jié),所以在漢字發(fā)音 資料庫(kù)50中漢語(yǔ)字詞74 「衣」的注音音節(jié)組合75以及拼音音節(jié)組合76分 別為「 $ + —」以及r $ + il J 。
實(shí)施例中的漢語(yǔ)字詞74 「只」為注音符號(hào)中缺少韻母音節(jié)的漢字,其 注音符號(hào)71為「蟲v」,此時(shí)為缺少韻母音節(jié)的情形,因此本實(shí)施例中以 符號(hào)字符「 $」取代韻母音節(jié),所以在漢字發(fā)音資料庫(kù)50漢語(yǔ)字詞74中「只J 的注音音節(jié)組合75為「蟲3 + $ J 。
對(duì)照于拼音符號(hào)而言,注音符號(hào)缺少韻母音節(jié)在拼音符號(hào)中為韻母不發(fā) 音的規(guī)則,同樣以漢語(yǔ)字詞74 「只J為例,其4并音符號(hào)72為「zhi」,此時(shí) 為韻母不發(fā)音的規(guī)則,因此本實(shí)施例中以符號(hào)字符「 $ j取代韻母音節(jié),所 以在漢字發(fā)音資料庫(kù)50漢語(yǔ)字詞74中r只」的拼音音節(jié)組合76為「 zh3 + $ J 。
實(shí)施例中的漢語(yǔ)字詞74「啊」,為標(biāo)準(zhǔn)多音字的實(shí)施例,同時(shí)具有五 種音調(diào),其注音符號(hào)71以及拼音符號(hào)72分別為r 丫」、「 丫 '」、「 丫 v J 、
r 丫 、 j及r 丫 j以及r al j 、 r a2 j 、 r a3 j 、 r a4 j及r a5 j ,在漢 字發(fā)音資料庫(kù)50漢語(yǔ)字詞74中「啊」的注音音節(jié)組合75以及拼音音節(jié)組 合76分別為「$+丫1」、「$+丫2」、「$+丫3」、「$+丫4」及
r $ + 丫 5 J以及r $ + al J 、 r $ + a2 j 、 r $ + a3 j 、 r $ + a4 j及r $+ a5 J 。
除此之外,也可以通過(guò)字詞模塊61將具有多音字字詞及對(duì)應(yīng)多音字字詞的注音音節(jié)組合75以及拼音音節(jié)組合76儲(chǔ)存至漢字發(fā)音資料庫(kù)50 (步驟410),當(dāng)所需要發(fā)音的漢語(yǔ)字詞74中與漢字發(fā)音資料庫(kù)50存儲(chǔ)的多音字字詞中相同漢字越多時(shí),會(huì)優(yōu)先進(jìn)行發(fā)音。
以實(shí)施例而言,r 4亍走J以及r行業(yè)J這兩個(gè)漢i吾字詞74, r行走J的注音符號(hào)71以及拼音符號(hào)72分別為「 丁 1厶'卩3 v」以及「xingzou J,r行業(yè)」的注音符號(hào)71以及拼音符號(hào)72分別為r廠尤,I廿、J以及r hangye」,通過(guò)字詞模塊61分別在漢字發(fā)音資料庫(kù)50儲(chǔ)存的注音音節(jié)組合75以及拼音音節(jié)組合76中,r行走J即為「丁+|厶2卩+ 33」以及「 x+ ing2 z + ou3」,r 4亍業(yè)J即為「廠+尤2 $+|廿4」以及「 h + ang2 $+ ye4 J 。
最后,如圖5所示,漢字發(fā)音資料庫(kù)50的注音音節(jié)組合75以及拼音音節(jié)組合76對(duì)應(yīng)至語(yǔ)音資料庫(kù)30的音節(jié)73,如圖所示,r行走」的注音音節(jié)組合75以及拼音音節(jié)組合76為「丁+ 1/_2卩+ 73」以及「乂 + ing2 z+ ou3」,其中,「 T」以及「 x」與語(yǔ)音資料庫(kù)30的音節(jié)73 r x.wav」對(duì)應(yīng);r I厶2」以及「 ing2」與語(yǔ)音資料庫(kù)30的音節(jié)73 r ing2.wav」對(duì)應(yīng);r卩J以及r z」與語(yǔ)音資料庫(kù)30的音節(jié)73 「 z.wav」對(duì)應(yīng);「33」以及「 ou3 J與語(yǔ)音資料庫(kù)30的音節(jié)73 「 ou3.wav」對(duì)應(yīng)。
因此,當(dāng)需要進(jìn)行「行走J的發(fā)音時(shí),即可以讀取對(duì)應(yīng)的音節(jié)73檔案,并且播放,即可以達(dá)到發(fā)音的功能。
綜上所述,可知本發(fā)明與先前技術(shù)之間的差異在于本發(fā)明分別將聲母音節(jié)與音調(diào)的組合、韻母音節(jié)與音調(diào)的組合,錄制為數(shù)個(gè)音節(jié),并儲(chǔ)存至語(yǔ)音資料庫(kù),接著對(duì)每一個(gè)漢字配置至少一音節(jié)組合,用以生成漢字發(fā)音資料庫(kù);通過(guò)漢字發(fā)音資料庫(kù)與語(yǔ)音資料庫(kù)的對(duì)應(yīng)關(guān)系,可以針對(duì)每一個(gè)漢字進(jìn)行個(gè)別的發(fā)音,因此,只需要儲(chǔ)存基本的音節(jié),以及漢字對(duì)應(yīng)的音節(jié)組合,語(yǔ)音資料所占據(jù)的儲(chǔ)存空間將縮小許多,并且可以對(duì)不同的單字、字詞、單句以及文章的內(nèi)容進(jìn)行發(fā)音,藉由此一技術(shù)手段可以解決先前技術(shù)存在真人語(yǔ)音技術(shù)占用存儲(chǔ)空間過(guò)大且無(wú)法對(duì)任意文章進(jìn)行發(fā)音的問(wèn)題,以及語(yǔ)音合成技術(shù)發(fā)音不準(zhǔn)、音調(diào)不準(zhǔn)等問(wèn)題,進(jìn)而達(dá)成減少語(yǔ)音資料儲(chǔ)存空間以及對(duì)任意文章進(jìn)行發(fā)音的技術(shù)功效。
雖然本發(fā)明所揭露的實(shí)施方式如上,但所述的內(nèi)容并非用以直接限定本發(fā)明的專利保護(hù)范圍。任何本發(fā)明所屬技術(shù)領(lǐng)域中具有通常知識(shí)者,在不脫離本發(fā)明所揭露的精神和范圍的前提下,可以在實(shí)施的形式上及細(xì)節(jié)上作些許更動(dòng)。本發(fā)明的專利保護(hù)范圍,仍須以所附的權(quán)利要求書所界定的范圍為準(zhǔn)。
權(quán)利要求
1、一種漢字發(fā)音資料庫(kù)生成系統(tǒng),漢字發(fā)音規(guī)則為一聲母音節(jié)、一韻母音節(jié)以及一音調(diào)的組合,其特征在于,包含一錄制模塊,分別將所述聲母音節(jié)及所述音調(diào)的組合、以及所述韻母音節(jié)及所述音調(diào)的組合,錄制為數(shù)個(gè)音節(jié);一儲(chǔ)存模塊,用以將所述音節(jié)儲(chǔ)存為一語(yǔ)音資料庫(kù);及一生成模塊,依據(jù)每一漢字配置至少一音節(jié)組合,并將所述音節(jié)組合對(duì)應(yīng)至所述語(yǔ)音資料庫(kù)的所述音節(jié),以生成一漢字發(fā)音資料庫(kù)。
2、 如權(quán)利要求1所述的漢字發(fā)音資料庫(kù)生成系統(tǒng),其特征在于,所述 音節(jié)組合中,缺少所述聲母音節(jié)或所述韻母音節(jié)、或者所述聲母音節(jié)或所述 韻母音節(jié)不發(fā)音時(shí),以一符號(hào)字符取代該音節(jié)組合中的該聲母音節(jié)或該韻母音節(jié)。
3、 如權(quán)利要求1所述的漢字發(fā)音資料庫(kù)生成系統(tǒng),其特征在于,所述 音節(jié)組合包含通過(guò)姓氏、動(dòng)詞、形容詞以及發(fā)音頻率,優(yōu)先排列所述音節(jié)組 合的配置順序。
4、 如權(quán)利要求1所述的漢字發(fā)音資料庫(kù)生成系統(tǒng),其特征在于,還包 含一字詞模塊,用以將具有多音字字詞的所述音節(jié)組合儲(chǔ)存至所述漢字發(fā)音 資料庫(kù)。
5、 如權(quán)利要求1所述的漢字發(fā)音資料庫(kù)生成系統(tǒng),其特征在于,還包 含一音節(jié)控制模塊,用以控制所述音節(jié)的播放時(shí)間以控制發(fā)音速度。
6、 一種漢字發(fā)音資料庫(kù)生成方法,漢字發(fā)音規(guī)則為一聲母音節(jié)、 一韻 母音節(jié)以及一音調(diào)的組合,其特征在于,包含下列步驟分別錄制所述聲母音節(jié)及所述音調(diào)的組合、以及所述韻母音節(jié)及所述音 調(diào)的組合為數(shù)個(gè)音節(jié);儲(chǔ)存所述音節(jié)至一語(yǔ)音資料庫(kù);及依據(jù)每一漢字配置至少一音節(jié)組合,并將所述音節(jié)組合對(duì)應(yīng)至所述語(yǔ)音 資料庫(kù)的所述音節(jié),以生成一漢字發(fā)音資料庫(kù)。
7、 如權(quán)利要求6所述的漢字發(fā)音資料庫(kù)生成方法,其特征在于,所述 音節(jié)組合中,缺少所述聲母音節(jié)或所述韻母音節(jié)、或者所述聲母音節(jié)或所述 韻母音節(jié)不發(fā)音時(shí),以一符號(hào)字符取代該聲母音節(jié)或該韻母音節(jié)。
8、 如權(quán)利要求6所述的漢字發(fā)音資料庫(kù)生成方法,其特征在于,所述 音節(jié)組合包含通過(guò)姓氏、動(dòng)詞、形容詞以及發(fā)音頻率,優(yōu)先排列所述音節(jié)組 合的配置順序。
9、 如權(quán)利要求6所述的漢字發(fā)音資料庫(kù)生成方法,其特征在于,還包 含儲(chǔ)存具有多音字字詞的所述音節(jié)組合至所述漢字發(fā)音資料庫(kù)的步驟。
10、 如權(quán)利要求6所述的漢字發(fā)音資料庫(kù)生成方法,其特征在于,還包 含控制所述音節(jié)的播放時(shí)間以控制發(fā)音速度的步驟。
全文摘要
一種漢字發(fā)音資料庫(kù)生成系統(tǒng)及其方法,其通過(guò)分別將聲母音節(jié)和音調(diào)的組合以及韻母音節(jié)和音調(diào)的組合,錄制為數(shù)個(gè)音節(jié)儲(chǔ)存為語(yǔ)音資料庫(kù),給漢字配置音節(jié)組合生成漢字發(fā)音資料庫(kù);通過(guò)漢字發(fā)音資料庫(kù)以及語(yǔ)音資料庫(kù)對(duì)應(yīng)的技術(shù)手段,可以解決先前技術(shù)中所存在的真人語(yǔ)音技術(shù)占用存儲(chǔ)空間過(guò)大且無(wú)法對(duì)任意文章進(jìn)行發(fā)音的問(wèn)題,以及語(yǔ)音合成技術(shù)發(fā)音不準(zhǔn)、音調(diào)不準(zhǔn)等問(wèn)題,藉此可以達(dá)成減少語(yǔ)音資料儲(chǔ)存空間以及對(duì)任意文章進(jìn)行發(fā)音的技術(shù)功效。
文檔編號(hào)G10L13/08GK101556796SQ20081008976
公開(kāi)日2009年10月14日 申請(qǐng)日期2008年4月10日 優(yōu)先權(quán)日2008年4月10日
發(fā)明者程新軍, 邱全成 申請(qǐng)人:英業(yè)達(dá)股份有限公司