提高合成語(yǔ)音韻律自然度的方法及系統(tǒng)的制作方法
【專(zhuān)利摘要】本發(fā)明公開(kāi)了一種提高合成語(yǔ)音韻律自然度的方法及系統(tǒng),該方法包括:接收待合成文本;確定對(duì)應(yīng)所述文本的基本合成單元序列,所述基本合成單元序列包括一個(gè)或多個(gè)基本合成單元;確定各基本合成單元是否弱讀;獲取所述基本合成單元對(duì)應(yīng)的合成參數(shù)模型,并且如果所述基本合成單元為弱讀,則對(duì)所述基本合成單元對(duì)應(yīng)的合成參數(shù)模型進(jìn)行弱讀化處理,得到更新的合成參數(shù)模型;生成對(duì)應(yīng)所述基本合成單元序列的合成參數(shù)模型序列;根據(jù)所述合成參數(shù)模型序列生成連續(xù)語(yǔ)音。利用本發(fā)明,可以簡(jiǎn)單有效地提高連續(xù)合成語(yǔ)音的自然度。
【專(zhuān)利說(shuō)明】
提高合成語(yǔ)音韻律自然度的方法及系統(tǒng)
技術(shù)領(lǐng)域
[0001]本發(fā)明涉及語(yǔ)音合成技術(shù)領(lǐng)域,尤其涉及一種提高合成語(yǔ)音韻律自然度的方法及系統(tǒng)。
【背景技術(shù)】
[0002]實(shí)現(xiàn)人機(jī)之間人性化、智能化的有效交互,構(gòu)建高效自然的人機(jī)交流環(huán)境,已經(jīng)成為當(dāng)前信息技術(shù)應(yīng)用和發(fā)展的迫切需求。語(yǔ)音合成技術(shù)將文字信息轉(zhuǎn)化為自然的語(yǔ)音信號(hào),實(shí)現(xiàn)任意文本的實(shí)時(shí)轉(zhuǎn)換,改變了傳統(tǒng)通過(guò)錄音回放實(shí)現(xiàn)機(jī)器開(kāi)口說(shuō)話的繁瑣操作,并節(jié)省了系統(tǒng)存儲(chǔ)空間,在信息交互日益增多的當(dāng)今特別是在信息內(nèi)容需要經(jīng)常變動(dòng)的動(dòng)態(tài)查詢(xún)應(yīng)用方面發(fā)揮了越來(lái)越重要的作用。
[0003]近年來(lái),隨著信息社會(huì)的需求發(fā)展,用戶(hù)對(duì)人機(jī)交互提出了更高的要求,高自然度的語(yǔ)音合成效果已經(jīng)成為高性能語(yǔ)音合成系統(tǒng)的重要標(biāo)志。字詞間斷(break)及字音重讀(focus)等反映語(yǔ)音抑揚(yáng)頓挫節(jié)奏感的韻律問(wèn)題受到越來(lái)越多研究人員的關(guān)注。字詞間斷可以通過(guò)詞性等句法信息分析加以解決,在訓(xùn)練數(shù)據(jù)足量的情況下可以獲得80%以上的正確率,滿足實(shí)用需求。而字音重讀的問(wèn)題由于涉及語(yǔ)義焦點(diǎn)分析尚不能很好解決,對(duì)此很多語(yǔ)音合成系統(tǒng)常采用避免提供字音重讀功能的方法,導(dǎo)致合成語(yǔ)音在調(diào)上沒(méi)有高低起伏的節(jié)奏感,影響了合成的自然效果。
[0004]在現(xiàn)有技術(shù)中,一般采用基于語(yǔ)義分析的重音預(yù)測(cè)方法,即通過(guò)語(yǔ)義分析確定連續(xù)輸入文本的焦點(diǎn)進(jìn)而確定需要重讀的合成單元并標(biāo)注,然后根據(jù)重音預(yù)測(cè)結(jié)果和合成特征獲得相應(yīng)的合成模型,進(jìn)而得到連續(xù)合成語(yǔ)音信號(hào)。然而重音預(yù)測(cè)存在很大的不確定性,其預(yù)測(cè)結(jié)果往往不夠準(zhǔn)確,特別是在內(nèi)容不限的文本中更容易產(chǎn)生問(wèn)題,在重讀信息用在了不合適的地方時(shí)會(huì)帶來(lái)明顯的負(fù)面影響。
【發(fā)明內(nèi)容】
[0005]本發(fā)明實(shí)施例提供一種提高合成語(yǔ)音韻律自然度的方法及系統(tǒng),以提高連續(xù)合成語(yǔ)音的自然度。
[0006]為實(shí)現(xiàn)上述目的,本發(fā)明的技術(shù)方案是:
[0007]—種提高合成語(yǔ)音韻律自然度的方法,包括:
[0008]接收待合成文本;
[0009]確定對(duì)應(yīng)所述文本的基本合成單元序列,所述基本合成單元序列包括一個(gè)或多個(gè)基本合成單元;
[0010]確定各基本合成單元是否弱讀;
[0011]獲取所述基本合成單元對(duì)應(yīng)的合成參數(shù)模型,并且如果所述基本合成單元為弱讀,則對(duì)所述基本合成單元對(duì)應(yīng)的合成參數(shù)模型進(jìn)行弱讀化處理,得到更新的合成參數(shù)模型;
[0012]生成對(duì)應(yīng)所述基本合成單元序列的合成參數(shù)模型序列;
[0013]根據(jù)所述合成參數(shù)模型序列生成連續(xù)語(yǔ)音。
[0014]優(yōu)選地,所述確定所述基本合成單元是否弱讀包括:
[0015]獲取所述基本合成單元所屬的音節(jié)串和/或音節(jié);
[0016]確定所述音節(jié)串和/或音節(jié)是否為弱讀,如果是,則確定所述基本合成單元為弱讀。
[0017]優(yōu)選地,所述確定所述音節(jié)串和/或音節(jié)是否弱讀包括:
[0018]檢查所述基本合成單元所屬的音節(jié)串是否在預(yù)設(shè)的弱讀詞表中;
[0019]如果是,則確定所述基本合成單元弱讀;
[0020]否則,檢查所述基本合成單元所屬的音節(jié)是否在預(yù)設(shè)的弱讀詞表中;
[0021]如果所述基本合成單元所屬的音節(jié)在預(yù)設(shè)的弱讀詞表中,則提取所述音節(jié)的韻律特征,然后根據(jù)所述音節(jié)的韻律特征及預(yù)先構(gòu)建的弱讀決策樹(shù)確定所述音節(jié)是否弱讀;如果所述音節(jié)弱讀,則所述基本合成單元弱讀,否則所述基本合成單元不弱讀;
[0022]如果所述基本合成單元所屬的音節(jié)不在預(yù)設(shè)的弱讀詞表中,則確定所述基本合成單元不弱讀。
[0023]優(yōu)選地,所述弱讀詞表的構(gòu)建過(guò)程包括:
[0024]獲取候選弱讀詞,形成弱讀詞集;
[0025]獲取訓(xùn)練語(yǔ)料;
[0026]依次計(jì)算所述弱讀詞集中各候選弱讀詞在所述訓(xùn)練語(yǔ)料中的弱讀頻度;
[0027]如果所述弱讀頻度大于頻度閾值,則確定所述候選弱讀詞為弱讀詞;
[0028]由確定的弱讀詞生成弱讀詞表。
[0029]優(yōu)選地,所述弱讀決策樹(shù)的構(gòu)建過(guò)程包括:
[0030]獲取基于弱讀詞表的大量文本作為訓(xùn)練數(shù)據(jù);
[0031]對(duì)所述訓(xùn)練數(shù)據(jù)進(jìn)行分詞處理,并確定各分詞包含的各音節(jié);
[0032]對(duì)所述各音節(jié)進(jìn)行韻律標(biāo)注,韻律標(biāo)注信息包括:弱讀信息;
[0033]根據(jù)所述訓(xùn)練文本數(shù)據(jù)及對(duì)應(yīng)的各音節(jié)的韻律標(biāo)注信息,訓(xùn)練得到弱讀決策樹(shù)。
[0034]優(yōu)選地,所述對(duì)所述基本合成單元對(duì)應(yīng)的合成參數(shù)模型進(jìn)行弱讀化處理,得到更新的合成參數(shù)模型包括:
[0035]獲取所述合成參數(shù)模型的模型參數(shù),所述模型參數(shù)包括:時(shí)長(zhǎng)參數(shù)、基頻參數(shù)、能量參數(shù);
[0036]根據(jù)預(yù)先訓(xùn)練得到的映射規(guī)則更新所述模型參數(shù),得到更新的合成參數(shù)模型。
[0037]—種提高合成語(yǔ)音韻律自然度的系統(tǒng),所述系統(tǒng)包括:
[0038]接收模塊,用于接收待合成文本;
[0039]基本合成單元序列確定模塊,用于確定對(duì)應(yīng)所述文本的基本合成單元序列,所述基本合成單元序列中包括一個(gè)或多個(gè)基本合成單元;
[0040]弱讀預(yù)測(cè)模塊,用于確定各基本合成單元是否弱讀;
[0041]合成參數(shù)模型獲取模塊,用于獲取所述基本合成單元對(duì)應(yīng)的合成參數(shù)模型;
[0042]弱讀化處理模塊,用于在所述基本合成單元為弱讀時(shí),對(duì)所述基本合成單元對(duì)應(yīng)的合成參數(shù)模型進(jìn)行弱讀化處理,得到更新的合成參數(shù)模型;
[0043]合成參數(shù)模型序列生成模塊,用于生成對(duì)應(yīng)所述基本合成單元序列的合成參數(shù)模型序列;
[0044]合成模塊,用于根據(jù)所述合成參數(shù)模型序列生成連續(xù)語(yǔ)音。
[0045]優(yōu)選地,所述弱讀預(yù)測(cè)模塊包括:
[0046]獲取單元,用于獲取各基本合成單元所屬的音節(jié)串和/或音節(jié);
[0047]確定單元,用于確定所述音節(jié)串和/或音節(jié)是否為弱讀,如果是,則確定所述基本合成單元為弱讀。
[0048]優(yōu)選地,所述確定單元包括:
[0049]檢查單元,用于檢查所述基本合成單元所屬的音節(jié)串是否在預(yù)設(shè)的弱讀詞表中;如果是,則確定所述音節(jié)弱讀;否則,檢查所述基本合成單元所屬的音節(jié)是否在預(yù)設(shè)的弱讀詞表中;如果是,則觸發(fā)提取單元提取所述音節(jié)的韻律特征;否則確定所述基本合成單元不弱讀;
[0050]提取單元,用于根據(jù)所述檢查單元的觸發(fā)提取所述音節(jié)的韻律特征;
[0051]判斷單元,用于根據(jù)所述提取單元提取的音節(jié)的韻律特征及預(yù)先構(gòu)建的弱讀決策樹(shù)確定所述音節(jié)是否弱讀,并且如果所述音節(jié)弱讀,則確定所述基本合成單元弱讀,否則確定所述基本合成單元不弱讀。
[0052]優(yōu)選地,所述系統(tǒng)還包括:弱讀詞表構(gòu)建模塊,用于構(gòu)建所述弱讀詞表。
[0053]優(yōu)選地,所述系統(tǒng)還包括:弱讀決策樹(shù)構(gòu)建模塊,用于構(gòu)建所述弱讀決策樹(shù)。
[0054]優(yōu)選地,所述弱讀化處理模塊包括:
[0055]模型參數(shù)獲取單元,用于獲取所述合成參數(shù)模型的模型參數(shù),所述模型參數(shù)包括:時(shí)長(zhǎng)參數(shù)、基頻參數(shù)、能量參數(shù);
[0056]參數(shù)更新單元,用于根據(jù)預(yù)先訓(xùn)練得到的映射規(guī)則更新所述模型參數(shù),得到更新的合成參數(shù)模型。
[0057]本發(fā)明實(shí)施例提供的提高合成語(yǔ)音韻律自然度的方法及系統(tǒng),通過(guò)處理較為容易的弱讀現(xiàn)象,實(shí)現(xiàn)連續(xù)語(yǔ)音的整體起伏的效果,填補(bǔ)了當(dāng)前語(yǔ)義理解技術(shù)對(duì)語(yǔ)音合成中重音預(yù)測(cè)尚未達(dá)到實(shí)用效果的空白。而且,相對(duì)于現(xiàn)有技術(shù),本發(fā)明實(shí)施例的方案對(duì)弱讀的預(yù)測(cè)不僅準(zhǔn)確而且高效,大大改善了連續(xù)合成語(yǔ)音的自然度。
【附圖說(shuō)明】
[0058]為了更清楚地說(shuō)明本發(fā)明實(shí)施的技術(shù)方案,下面將對(duì)實(shí)施例中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0059]圖1示出了本發(fā)明實(shí)施例提高合成語(yǔ)音韻律自然度的方法的流程圖;
[0060]圖2示出了本發(fā)明實(shí)施例中基本合成單元弱讀預(yù)測(cè)的流程圖;
[0061 ] 圖3示出了本發(fā)明實(shí)施例中弱讀決策樹(shù)的構(gòu)建流程圖;
[0062]圖4示出了本發(fā)明實(shí)施例中對(duì)合成參數(shù)模型進(jìn)行弱讀化處理的流程圖;
[0063]圖5示出了本發(fā)明實(shí)施例提高合成語(yǔ)音韻律自然度的系統(tǒng)的結(jié)構(gòu)框圖;
[0064]圖6示出了本發(fā)明實(shí)施例中弱讀化處理模塊的結(jié)構(gòu)框圖。
【具體實(shí)施方式】
[0065]下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0066]現(xiàn)有的采用基于語(yǔ)義分析的重音預(yù)測(cè)方法存在很大的不確定性,其預(yù)測(cè)結(jié)果往往不夠準(zhǔn)確,分析其原因,主要有以下幾點(diǎn):
[0067]1.一般來(lái)說(shuō)占據(jù)詞典的絕大多數(shù)的實(shí)詞(如名詞、動(dòng)詞等)都可能重讀,對(duì)其窮盡列舉是不可能的任務(wù)。
[0068]2.單憑句法層面的控制很難確定重讀詞,只有具備了語(yǔ)義信息才有可能確定重讀信息,這還需更高層次的智能化處理,現(xiàn)有技術(shù)對(duì)語(yǔ)義的智能化處理能力還十分有限。
[0069]3.目前重音預(yù)測(cè)采用的特征參數(shù)主要是詞性(POS)、詞長(zhǎng)、詞在韻律結(jié)構(gòu)中所處的位置等和語(yǔ)義無(wú)關(guān)的參數(shù),其對(duì)預(yù)測(cè)結(jié)果沒(méi)有直接的指導(dǎo)意義,相應(yīng)的基于這些特征參數(shù)的預(yù)測(cè)結(jié)果也不太可靠。
[0070]基于上述分析,針對(duì)連續(xù)語(yǔ)音合成系統(tǒng)中對(duì)合成語(yǔ)音高低起伏效果的需求、以及現(xiàn)有技術(shù)對(duì)重讀準(zhǔn)確判斷能力不足的情況,本發(fā)明實(shí)施例提出了一種合成文本弱讀預(yù)測(cè)的方法及系統(tǒng),實(shí)現(xiàn)了弱讀預(yù)測(cè)結(jié)果的高效準(zhǔn)確性。相應(yīng)地,還提出了一種基于弱讀預(yù)測(cè)的語(yǔ)音合成方法及系統(tǒng),通過(guò)處理較為容易的弱讀現(xiàn)象,即利用“輕”反襯“重”,解決調(diào)上起伏的問(wèn)題。具體地,本發(fā)明實(shí)施例的方案通過(guò)對(duì)連續(xù)文本中部分字詞弱讀化處理來(lái)實(shí)現(xiàn)合成連續(xù)語(yǔ)音高低起伏的自然效果,進(jìn)而大大改善了連續(xù)合成語(yǔ)音的自然度。
[0071]對(duì)于不同的語(yǔ)言,弱讀通常表現(xiàn)為不同的詞及特點(diǎn),比如,漢語(yǔ)普通話中的輕聲詞、藏語(yǔ)中的虛詞、英文和很多西方語(yǔ)言中的虛詞(介詞、連接詞等)等。弱讀因素在句中的作用相對(duì)明確,通??梢酝ㄟ^(guò)詞性、甚至語(yǔ)音確定,一般不會(huì)超越句法層面,即不涉及語(yǔ)義。因此處理弱讀比重讀的代價(jià)小很多。
[0072]為此,本發(fā)明實(shí)施例的提高合成語(yǔ)音韻律自然度的方法及系統(tǒng),基于弱讀預(yù)測(cè),高效、準(zhǔn)確地確定合成文本中的弱讀單元,從而為語(yǔ)音合成提供準(zhǔn)確的韻律信息?;诖?,在語(yǔ)音合成時(shí),如果基本合成單元的韻律特征包括弱讀特征,則獲取該基本合成單元對(duì)應(yīng)的弱讀合成參數(shù)模型或弱讀語(yǔ)音片段;如果基本合成單元的韻律特征不包括弱讀特征,則獲取該基本合成單元對(duì)應(yīng)的常規(guī)合成參數(shù)模型或常規(guī)語(yǔ)音片段。這樣,利用這些相應(yīng)的合成參數(shù)模型或語(yǔ)音片段生成連續(xù)語(yǔ)音,有效地解決了調(diào)上起伏的問(wèn)題。
[0073]如圖1所示,示出了本發(fā)明實(shí)施例提高合成語(yǔ)音韻律自然度的方法的流程,包括以下步驟:
[0074]步驟101,接收待合成文本。
[0075]步驟102,確定對(duì)應(yīng)所述文本的基本合成單元序列,所述基本合成單元序列包括一個(gè)或多個(gè)基本合成單元。
[0076]具體地,可以通過(guò)字音轉(zhuǎn)換,得到對(duì)應(yīng)所述文本的各基本合成單元,并由所述基本合成單元形成與所述文本對(duì)應(yīng)的基本合成單元序列。
[0077]所述基本合成單元是指最小的合成單元,對(duì)于西方語(yǔ)言,通常采用音素作為基本合成單元,例如:英文單詞tone所包含的音素有三個(gè),它們是t, ow, ng;基于音節(jié)的聲調(diào)語(yǔ)言可以將聲母/韻母作為基本合成單元,例如聲母一詞的聲母韻母序列是sh, eng, m, U。其中韻母eng包含兩個(gè)音素e, ng。
[0078]步驟103,確定各基本合成單元是否弱讀。
[0079]具體地,可以獲取各基本合成單元所屬的音節(jié)串和/或音節(jié),然后確定所述音節(jié)串和/或音節(jié)是否為弱讀,如果是,則確定所述基本合成單元為弱讀。
[0080]音節(jié)是語(yǔ)音結(jié)構(gòu)的基本單位。在漢語(yǔ)中一般來(lái)說(shuō)一個(gè)漢語(yǔ)的讀音即為一個(gè)音節(jié)。在英語(yǔ)中,一個(gè)元音可構(gòu)成一個(gè)音節(jié),一個(gè)元音和一個(gè)或幾個(gè)輔音音素結(jié)合也可以構(gòu)成一個(gè)音節(jié)。
[0081]需要說(shuō)明的是,一個(gè)音節(jié)可以對(duì)應(yīng)一個(gè)或多個(gè)基本合成單元。例如“聲母”是一個(gè)分詞,它包括兩個(gè)音節(jié),每個(gè)音節(jié)都包含一個(gè)聲母,一個(gè)韻母(sh, eng, m, u),因此“聲母” 一詞包含四個(gè)基本合成單元。相應(yīng)地,如果一個(gè)音節(jié)串或音節(jié)為弱讀,則其對(duì)應(yīng)的所有基本合成單元均弱讀。
[0082]步驟104,獲取所述基本合成單元對(duì)應(yīng)的合成參數(shù)模型,并且如果所述基本合成單元為弱讀,則對(duì)所述基本合成單元對(duì)應(yīng)的合成參數(shù)模型進(jìn)行弱讀化處理,得到更新的合成參數(shù)模型。
[0083]所述合成參數(shù)模型為聲學(xué)模型。需要說(shuō)明的是,一個(gè)基本合成單元在不同的語(yǔ)境下,可能會(huì)弱讀,也可能不弱讀。因此,在本發(fā)明實(shí)施例中,對(duì)于需要弱讀的基本合成單元,對(duì)其合成參數(shù)模型進(jìn)行弱讀化處理,使模型參數(shù)能更好地體現(xiàn)語(yǔ)音的高低起伏變化。而對(duì)于非弱讀的基本合成單元,則不對(duì)其合成參數(shù)模型進(jìn)行弱讀化處理。
[0084]對(duì)合成參數(shù)模型進(jìn)行弱讀化處理的具體過(guò)程將在后面詳細(xì)描述。
[0085]步驟105,生成對(duì)應(yīng)所述基本合成單元序列的合成參數(shù)模型序列。
[0086]即由基本合成單元序列中的各基本合成單元對(duì)應(yīng)的合成參數(shù)模型依序排列,得到所述合成參數(shù)模型序列。其中包括沒(méi)有經(jīng)過(guò)弱讀化處理的合成參數(shù)模型和經(jīng)過(guò)弱讀化處理的合成參數(shù)模型。也就是說(shuō),如果其中的基本合成單元為弱讀,則其對(duì)應(yīng)的合成參數(shù)模型是經(jīng)過(guò)弱讀化處理后的合成參數(shù)模型;如果其中的基本合成單元為非弱讀,則其對(duì)應(yīng)的合成參數(shù)模型是原始獲取的合成參數(shù)模型,這些原始獲取的合成參數(shù)模型可以看作是正常發(fā)音時(shí)的合成參數(shù)模型。
[0087]步驟106,根據(jù)所述合成參數(shù)模型序列生成連續(xù)語(yǔ)音。
[0088]可見(jiàn),本發(fā)明實(shí)施例提供的提高合成語(yǔ)音韻律自然度的方法,通過(guò)處理較為容易的弱讀現(xiàn)象,即利用“輕”反襯“重”,有效地解決了調(diào)上起伏的問(wèn)題,較好地實(shí)現(xiàn)了連續(xù)語(yǔ)音的整體起伏效果。
[0089]如圖2所示,是本發(fā)明實(shí)施例中基本合成單元弱讀預(yù)測(cè)的流程圖。
[0090]需要說(shuō)明的是,對(duì)于基本合成單元序列中的每個(gè)基本合成單元,都需要依次進(jìn)行檢查,確定其是否弱讀,具體包括以下步驟:
[0091]步驟201,獲取當(dāng)前檢查的基本合成單元。
[0092]步驟202,檢查是否有所述基本合成單元所屬的音節(jié)串;如果是,則執(zhí)行步驟203 ;否則,執(zhí)行步驟204。
[0093]具體地,可以對(duì)待合成文本進(jìn)行分詞處理,并確定得到的各分詞包含的各音節(jié)串和/或音節(jié),從而得到所述基本合成單元所屬的音節(jié)串或音節(jié)。
[0094]步驟203,檢查所述音節(jié)串是否在預(yù)設(shè)的弱讀詞表中;如果是,則執(zhí)行步驟208 ;否貝IJ,執(zhí)行步驟204。
[0095]步驟204,獲取所述基本合成單元所屬的音節(jié)。
[0096]步驟205,檢查所述音節(jié)是否在預(yù)設(shè)的弱讀詞表中。如果是,則執(zhí)行步驟206 ;否貝IJ,執(zhí)行步驟209。
[0097]弱讀音節(jié)容易捕捉且數(shù)量較少,因而相對(duì)容易窮盡。在本發(fā)明實(shí)施例中,可以預(yù)先基于對(duì)訓(xùn)練語(yǔ)料的統(tǒng)計(jì)建立弱讀詞表,具體地,可以按照以下過(guò)程進(jìn)行:
[0098](I)獲取候選弱讀詞,形成弱讀詞集。在實(shí)際應(yīng)用中,可以將所有虛詞作為候選弱讀詞。
[0099](2)獲取訓(xùn)練語(yǔ)料。
[0100](3)依次計(jì)算所述弱讀詞集中各候選弱讀詞在所述訓(xùn)練語(yǔ)料中的弱讀頻度。
[0101](4)如果所述弱讀頻度大于頻度閾值,則確定所述候選弱讀詞為弱讀詞;
[0102](5)由確定的弱讀詞生成弱讀詞表。
[0103]當(dāng)然,在實(shí)際應(yīng)用中,還可以通過(guò)其它方法構(gòu)建弱讀詞表,比如統(tǒng)計(jì)模型方法,對(duì)此本發(fā)明實(shí)施例不做限定。
[0104]步驟206,提取所述音節(jié)的韻律特征。
[0105]所述音節(jié)的韻律特征可以包括以下一種或多種特征:音節(jié)所在分詞的詞性、音節(jié)所在分詞中的位置等。
[0106]步驟207,根據(jù)所述音節(jié)的韻律特征及預(yù)先構(gòu)建的弱讀決策樹(shù)確定所述基本合成單元是否弱讀。
[0107]具體地,首先根據(jù)音節(jié)的韻律特征及預(yù)先構(gòu)建的弱讀決策樹(shù)確定所述音節(jié)是否弱讀;如果所述音節(jié)弱讀,則所述基本合成單元弱讀,否則所述基本合成單元不弱讀。
[0108]步驟208,確定所述基本合成單元弱讀。
[0109]考慮到相同單詞在不同的上下文環(huán)境下具有不同的功能,特別是在擔(dān)當(dāng)不同詞性時(shí),其往往具有不同的表現(xiàn)力,因而弱讀具有一定的不確定性。對(duì)此本發(fā)明實(shí)施例進(jìn)一步根據(jù)預(yù)先建立的弱讀決策樹(shù)確定當(dāng)前檢查的音節(jié)在具體上下文情況下是否弱讀。
[0110]弱讀決策樹(shù)的構(gòu)建過(guò)程及利用該弱讀決策樹(shù)確定音節(jié)是否弱讀的具體過(guò)程將在后面詳細(xì)說(shuō)明。
[0111]步驟209,確定所述基本合成單元不弱讀。
[0112]如圖3所示,是本發(fā)明實(shí)施例中弱讀決策樹(shù)的構(gòu)建流程,包括以下步驟:
[0113]步驟301,獲取基于弱讀詞表的大量文本作為訓(xùn)練數(shù)據(jù)。
[0114]步驟302,對(duì)所述訓(xùn)練數(shù)據(jù)進(jìn)行分詞處理,并確定各分詞包含的各音節(jié)。
[0115]步驟303,對(duì)所述音節(jié)進(jìn)行韻律標(biāo)注,韻律標(biāo)注信息包括:弱讀信息。
[0116]具體地,可以根據(jù)訓(xùn)練數(shù)據(jù)對(duì)應(yīng)的語(yǔ)音數(shù)據(jù)對(duì)各音節(jié)進(jìn)行韻律標(biāo)注。
[0117]在實(shí)際應(yīng)用中,韻律標(biāo)注信息還可進(jìn)一步包括:弱讀音節(jié)在分詞中的位置、弱讀音節(jié)所在分詞的詞性等。
[0118]步驟304,根據(jù)所述訓(xùn)練數(shù)據(jù)及對(duì)應(yīng)的各音節(jié)的韻律標(biāo)注信息,訓(xùn)練得到弱讀決策樹(shù)。
[0119]具體地,首先初始化弱讀決策樹(shù),然后從所述弱讀決策樹(shù)的根節(jié)點(diǎn)開(kāi)始,根據(jù)預(yù)先建立的問(wèn)題集(該問(wèn)題集包含所有和弱讀相關(guān)的信息)依次考察每個(gè)非葉節(jié)點(diǎn),如果當(dāng)前考察的節(jié)點(diǎn)需要分裂,則對(duì)當(dāng)前考察的節(jié)點(diǎn)進(jìn)行分裂,并獲取分裂后的子節(jié)點(diǎn)及所述子節(jié)點(diǎn)對(duì)應(yīng)的訓(xùn)練數(shù)據(jù);否則,將當(dāng)前考察節(jié)點(diǎn)標(biāo)記為葉節(jié)點(diǎn);當(dāng)所有非葉節(jié)點(diǎn)考察完成后,得到所述弱讀決策樹(shù)。
[0120]需要說(shuō)明的是,在實(shí)際應(yīng)用中,也可以采用其它方法構(gòu)建弱讀決策樹(shù),對(duì)此本發(fā)明實(shí)施例不做限定。
[0121]下面舉例說(shuō)明基于上述弱讀決策樹(shù)進(jìn)行弱讀預(yù)測(cè)的過(guò)程。
[0122]例如對(duì)于待合成的文本:紅隊(duì)和藍(lán)隊(duì)共有四十九本書(shū)。
[0123]進(jìn)行分詞處理,得到:紅隊(duì)/和(連詞)/藍(lán)隊(duì)/共/有(存在動(dòng)詞)/四十九(數(shù)詞)/本/書(shū)。
[0124]弱讀預(yù)測(cè):其中音節(jié)“和” “有” “十”在弱讀詞表中,因此只需要對(duì)這三個(gè)音節(jié)進(jìn)行判斷是否弱讀。
[0125]根據(jù)弱讀預(yù)測(cè)決策樹(shù)有如下判斷:
[0126](I)弱讀音節(jié)所在分詞是否虛詞?如果是則弱讀?!昂汀狈蠗l件,確定為弱讀;
[0127](2)弱讀音節(jié)所在分詞是否存在動(dòng)詞?如果是,前面是否有否定詞?如果是,則弱讀?!坝小彪m為存在動(dòng)詞,但是前面沒(méi)有否定詞,確定為非弱讀;
[0128](3)弱讀音節(jié)所在分詞是否數(shù)詞?如果是,是否位于詞中?如果是則弱讀。“十”所在分詞為數(shù)詞,并位于詞中,確定為弱讀。
[0129]如果一個(gè)音節(jié)弱讀,則該音節(jié)對(duì)應(yīng)的所有基本合成單元均弱讀,反之亦然。
[0130]需要說(shuō)明的是,本發(fā)明實(shí)施例中所述的合成參數(shù)模型為聲學(xué)模型。
[0131]一般來(lái)說(shuō)相對(duì)正常讀音,弱讀基本合成單元會(huì)有以下特點(diǎn):
[0132](I)弱讀基本合成單元的語(yǔ)音時(shí)長(zhǎng)往往較短;
[0133](2)弱讀基本合成單元的基頻曲線更趨向于聲調(diào)范圍的中值,即原來(lái)基頻曲線較高的語(yǔ)音單元,基頻曲線會(huì)相對(duì)降低,而原來(lái)基頻曲線較低的語(yǔ)音單元,基頻曲線會(huì)相對(duì)抬尚;
[0134](3)弱讀基本合成單元的能量較低。
[0135]基于上述特點(diǎn),在本發(fā)明實(shí)施例中,可以首先訓(xùn)練各弱讀基本合成單元對(duì)應(yīng)的聲學(xué)模型,并和對(duì)應(yīng)的非弱讀基本合成單元進(jìn)行聲學(xué)對(duì)比,確定時(shí)長(zhǎng)、能量、基頻方面弱讀與非弱讀之間的差異規(guī)則。然后在對(duì)合成參數(shù)模型進(jìn)行弱讀化時(shí)通過(guò)縮短時(shí)長(zhǎng)、降低或抬高基頻、降低能量等規(guī)則更新模型參數(shù)以實(shí)現(xiàn)弱讀效果。
[0136]如圖4所示,是本發(fā)明實(shí)施例中對(duì)合成參數(shù)模型進(jìn)行弱讀化處理的流程圖,包括以下步驟:
[0137]步驟401,獲取所述合成參數(shù)模型的模型參數(shù),所述模型參數(shù)包括:時(shí)長(zhǎng)參數(shù)、基頻參數(shù)、能量參數(shù);
[0138]步驟402,根據(jù)預(yù)先訓(xùn)練得到的映射規(guī)則更新所述模型參數(shù),得到更新的合成參數(shù)模型。
[0139]上述映射規(guī)則的訓(xùn)練過(guò)程如下:
[0140]在實(shí)際應(yīng)用中,可以分別訓(xùn)練合成參數(shù)模型中的時(shí)長(zhǎng)參數(shù)、基頻參數(shù)、能量參數(shù)對(duì)應(yīng)的映射規(guī)則,具體如下:
[0141]1、時(shí)長(zhǎng)參數(shù)映射規(guī)則
[0142](I)獲取訓(xùn)練數(shù)據(jù);
[0143](2)確定所述訓(xùn)練數(shù)據(jù)中的弱讀基本合成單元;
[0144](3)計(jì)算所述弱讀基本合成單元在弱讀和非弱讀兩種情況下的時(shí)長(zhǎng)比值,并將其作為時(shí)長(zhǎng)參數(shù)映射規(guī)則。
[0145]由于一個(gè)音節(jié)對(duì)應(yīng)了一個(gè)或多個(gè)基本合成單元,因此,為了使映射規(guī)則更準(zhǔn)確,可以分別計(jì)算所述基本合成單元在音節(jié)中不同位置(即音節(jié)首、音節(jié)中、音節(jié)末這三個(gè)位置)、在弱讀和非弱讀兩種情況下的時(shí)長(zhǎng)均值;然后再根據(jù)該均值計(jì)算在弱讀和非弱讀兩種情況下的時(shí)長(zhǎng)比值。
[0146]基于上述時(shí)長(zhǎng)參數(shù)映射規(guī)則,在對(duì)合成參數(shù)模型進(jìn)行弱讀化處理時(shí),可以按照基本合成單元在音節(jié)中的不同位置,將該合成參數(shù)模型中的時(shí)長(zhǎng)參數(shù)根據(jù)上述時(shí)長(zhǎng)比值進(jìn)行調(diào)整。
[0147]2、基頻參數(shù)映射規(guī)則
[0148]時(shí)長(zhǎng)是個(gè)標(biāo)量,基頻是個(gè)矢量,一個(gè)基本合成單元對(duì)應(yīng)一條基頻曲線。為了簡(jiǎn)化規(guī)貝IJ,可以利用基本合成單元的平均基頻進(jìn)行參數(shù)映射,具體如下:
[0149](I)獲取訓(xùn)練數(shù)據(jù);
[0150](2)確定所述訓(xùn)練數(shù)據(jù)中的弱讀基本合成單元;
[0151](3)計(jì)算所述弱讀基本合成單元在弱讀和非弱讀兩種情況下的平均基頻比值,并將其作為基頻參數(shù)映射規(guī)則。
[0152]基于上述基頻參數(shù)映射規(guī)則,在對(duì)合成參數(shù)模型進(jìn)行弱讀化處理時(shí),可以按照基本合成單元在音節(jié)中的不同位置,將該合成參數(shù)模型中的基頻參數(shù)根據(jù)上述基頻比值進(jìn)行調(diào)整。
[0153]3、能量參數(shù)映射規(guī)則
[0154]能量也是個(gè)矢量,一個(gè)基本合成單元對(duì)應(yīng)一條能量曲線??梢圆捎煤突l參數(shù)映射規(guī)則完全相同的方法,進(jìn)行能量參數(shù)映射。在此不贅述。
[0155]本發(fā)明實(shí)施例提供的提高合成語(yǔ)音韻律自然度的方法,針對(duì)連續(xù)語(yǔ)音合成系統(tǒng)中對(duì)合成語(yǔ)音高低起伏效果的需求,基于對(duì)弱讀音節(jié)的預(yù)測(cè),對(duì)弱讀音節(jié)對(duì)應(yīng)的基本合成單元的合成參數(shù)模型進(jìn)行弱讀化處理,實(shí)現(xiàn)連續(xù)語(yǔ)音的整體起伏的效果。該方案通過(guò)處理較為容易的弱讀現(xiàn)象,利用“輕”反襯“重”,實(shí)現(xiàn)連續(xù)語(yǔ)音的整體起伏的效果,填補(bǔ)了當(dāng)前語(yǔ)義理解技術(shù)對(duì)語(yǔ)音合成中重音預(yù)測(cè)尚未達(dá)到實(shí)用效果的空白,大大改善了連續(xù)合成語(yǔ)音的自然度。
[0156]另外,需要說(shuō)明的是,在語(yǔ)音合成中,還可以同時(shí)考慮弱讀及重讀因素,進(jìn)一步改善連續(xù)合成語(yǔ)音的自然度。
[0157]相應(yīng)地,本發(fā)明實(shí)施例還提供一種語(yǔ)音合成系統(tǒng),如圖5所示,是該系統(tǒng)的一種結(jié)構(gòu)框圖。
[0158]在該實(shí)施例中,所述系統(tǒng)包括:
[0159]接收模塊501,用于接收待合成文本;
[0160]基本合成單元序列確定模塊502,用于確定對(duì)應(yīng)所述文本的基本合成單元序列,所述基本合成單元序列中包括一個(gè)或多個(gè)基本合成單元;
[0161]弱讀預(yù)測(cè)模塊503,用于確定各基本合成單元是否弱讀;
[0162]合成參數(shù)模型獲取模塊504,用于獲取所述基本合成單元對(duì)應(yīng)的合成參數(shù)模型;
[0163]弱讀化處理模塊505,用于在所述基本合成單元為弱讀時(shí),對(duì)所述基本合成單元對(duì)應(yīng)的合成參數(shù)模型進(jìn)行弱讀化處理,得到更新的合成參數(shù)模型;
[0164]合成參數(shù)模型序列生成模塊506,用于生成對(duì)應(yīng)所述基本合成單元序列的合成參數(shù)模型序列;
[0165]合成模塊507,用于根據(jù)所述合成參數(shù)模型序列生成連續(xù)語(yǔ)音。
[0166]上述弱讀預(yù)測(cè)模塊503具體可以采用前面介紹的弱讀預(yù)測(cè)方法確定各基本合成單元是否弱讀,弱讀預(yù)測(cè)模塊503的一種具體結(jié)構(gòu)可以包括以下各單元:
[0167]獲取單元,用于獲取各基本合成單元所屬的音節(jié)串和/或音節(jié);
[0168]確定單元,用于確定所述音節(jié)串和/或音節(jié)是否為弱讀,如果是,則確定所述基本合成單元為弱讀。
[0169]其中,上述確定單元可以包括:
[0170]檢查單元,用于檢查所述基本合成單元所屬的音節(jié)串是否在預(yù)設(shè)的弱讀詞表中;如果是,則確定所述音節(jié)弱讀;否則,檢查所述基本合成單元所屬的音節(jié)是否在預(yù)設(shè)的弱讀詞表中;如果是,則觸發(fā)提取單元提取所述音節(jié)的韻律特征;否則確定所述基本合成單元不弱讀;
[0171]上述提取單元,用于根據(jù)所述檢查單元的觸發(fā)提取所述音節(jié)的韻律特征,
[0172]判斷單元,用于根據(jù)所述提取單元提取的韻律特征及預(yù)先構(gòu)建的弱讀決策樹(shù)確定所述音節(jié)是否弱讀,并且如果所述音節(jié)弱讀,則確定所述基本合成單元弱讀,否則確定所述基本合成單元不弱讀。
[0173]上述弱讀詞表及弱讀決策樹(shù)可以由本發(fā)明語(yǔ)音合成系統(tǒng)構(gòu)建,也可以由其它系統(tǒng)構(gòu)建,對(duì)此本發(fā)明實(shí)施例不做限定。如果由本發(fā)明語(yǔ)音合成系統(tǒng)構(gòu)建,則在該系統(tǒng)中還可以進(jìn)一步包括:弱讀詞表構(gòu)建模塊和弱讀決策樹(shù)構(gòu)建模塊,分別用于構(gòu)建弱讀詞表及弱讀決策樹(shù)。根據(jù)具體構(gòu)建方法的不同,這兩個(gè)模塊可以分別有相適應(yīng)的結(jié)構(gòu),對(duì)此不做限定。
[0174]上述弱讀化處理模塊505的一種具體結(jié)構(gòu)如圖6所示,包括:
[0175]模型參數(shù)獲取單元601,用于獲取所述合成參數(shù)模型的模型參數(shù),所述模型參數(shù)包括:時(shí)長(zhǎng)參數(shù)、基頻參數(shù)、能量參數(shù);
[0176]參數(shù)更新單元602,用于根據(jù)預(yù)先訓(xùn)練得到的映射規(guī)則更新所述模型參數(shù),得到更新的合成參數(shù)模型。
[0177]在實(shí)際應(yīng)用中,所述映射規(guī)則可以由本發(fā)明系統(tǒng)預(yù)先訓(xùn)練,還可以由其它系統(tǒng)預(yù)先訓(xùn)練。
[0178]如果由本發(fā)明系統(tǒng)訓(xùn)練,則在該系統(tǒng)中還需要進(jìn)一步包括:映射規(guī)則訓(xùn)練模塊(未圖示),用于構(gòu)建反映非弱讀合成參數(shù)與弱讀合成參數(shù)對(duì)應(yīng)關(guān)系的映射規(guī)則。
[0179]映射規(guī)則訓(xùn)練模塊可以針對(duì)合成參數(shù)模型的模型參數(shù),分別訓(xùn)練時(shí)長(zhǎng)參數(shù)映射規(guī)貝IJ、基頻參數(shù)映射規(guī)則、能量參數(shù)映射規(guī)則。具體訓(xùn)練過(guò)程可參照前面本發(fā)明方法實(shí)施例中的描述,在此不再贅述。
[0180]相應(yīng)地,參數(shù)更新單元602需要根據(jù)相應(yīng)的映射規(guī)則來(lái)更新各模型參數(shù)。
[0181]本發(fā)明實(shí)施例提供的提高合成語(yǔ)音韻律自然度的系統(tǒng),在語(yǔ)音合成時(shí),通過(guò)處理較為容易的弱讀現(xiàn)象,實(shí)現(xiàn)連續(xù)語(yǔ)音的整體起伏的效果,填補(bǔ)了當(dāng)前語(yǔ)義理解技術(shù)對(duì)語(yǔ)音合成中重音預(yù)測(cè)尚未達(dá)到實(shí)用效果的空白,大大改善了連續(xù)合成語(yǔ)音的自然度。
[0182]本說(shuō)明書(shū)中的各個(gè)實(shí)施例均采用遞進(jìn)的方式描述,各個(gè)實(shí)施例之間相同相似的部分互相參見(jiàn)即可,每個(gè)實(shí)施例重點(diǎn)說(shuō)明的都是與其他實(shí)施例的不同之處。尤其,對(duì)于系統(tǒng)實(shí)施例而言,由于其基本相似于方法實(shí)施例,所以描述得比較簡(jiǎn)單,相關(guān)之處參見(jiàn)方法實(shí)施例的部分說(shuō)明即可。以上所描述的系統(tǒng)實(shí)施例僅僅是示意性的,其中所述作為分離部件說(shuō)明的單元及模塊可以是或者也可以不是物理上分開(kāi)的。另外,還可以根據(jù)實(shí)際的需要選擇其中的部分或者全部單元和模塊來(lái)實(shí)現(xiàn)本實(shí)施例方案的目的。本領(lǐng)域普通技術(shù)人員在不付出創(chuàng)造性勞動(dòng)的情況下,即可以理解并實(shí)施。
[0183]以上依據(jù)圖式所示的實(shí)施例詳細(xì)說(shuō)明了本發(fā)明的構(gòu)造、特征及作用效果,以上所述僅為本發(fā)明的較佳實(shí)施例,但本發(fā)明不以圖面所示限定實(shí)施范圍,凡是依照本發(fā)明的構(gòu)想所作的改變,或修改為等同變化的等效實(shí)施例,仍未超出說(shuō)明書(shū)與圖示所涵蓋的精神時(shí),均應(yīng)在本發(fā)明的保護(hù)范圍內(nèi)。
【主權(quán)項(xiàng)】
1.一種提高合成語(yǔ)音韻律自然度的方法,其特征在于,包括: 接收待合成文本; 確定對(duì)應(yīng)所述文本的基本合成單元序列,所述基本合成單元序列包括一個(gè)或多個(gè)基本合成單元; 確定各基本合成單元是否弱讀; 獲取所述基本合成單元對(duì)應(yīng)的合成參數(shù)模型,并且如果所述基本合成單元為弱讀,則對(duì)所述基本合成單元對(duì)應(yīng)的合成參數(shù)模型進(jìn)行弱讀化處理,得到更新的合成參數(shù)模型;生成對(duì)應(yīng)所述基本合成單元序列的合成參數(shù)模型序列; 根據(jù)所述合成參數(shù)模型序列生成連續(xù)語(yǔ)音。2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述確定所述基本合成單元是否弱讀包括: 獲取所述基本合成單元所屬的音節(jié)串和/或音節(jié); 確定所述音節(jié)串和/或音節(jié)是否為弱讀,如果是,則確定所述基本合成單元為弱讀。3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述確定所述音節(jié)串和/或音節(jié)是否弱讀包括: 檢查所述基本合成單元所屬的音節(jié)串是否在預(yù)設(shè)的弱讀詞表中; 如果是,則確定所述基本合成單元弱讀; 否則,檢查所述基本合成單元所屬的音節(jié)是否在預(yù)設(shè)的弱讀詞表中; 如果所述基本合成單元所屬的音節(jié)在預(yù)設(shè)的弱讀詞表中,則提取所述音節(jié)的韻律特征,然后根據(jù)所述音節(jié)的韻律特征及預(yù)先構(gòu)建的弱讀決策樹(shù)確定所述音節(jié)是否弱讀;如果所述音節(jié)弱讀,則所述基本合成單元弱讀,否則所述基本合成單元不弱讀; 如果所述基本合成單元所屬的音節(jié)不在預(yù)設(shè)的弱讀詞表中,則確定所述基本合成單元不弱讀。4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述弱讀詞表的構(gòu)建過(guò)程包括: 獲取候選弱讀詞,形成弱讀詞集; 獲取訓(xùn)練語(yǔ)料; 依次計(jì)算所述弱讀詞集中各候選弱讀詞在所述訓(xùn)練語(yǔ)料中的弱讀頻度; 如果所述弱讀頻度大于頻度閾值,則確定所述候選弱讀詞為弱讀詞; 由確定的弱讀詞生成弱讀詞表。5.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述弱讀決策樹(shù)的構(gòu)建過(guò)程包括: 獲取基于弱讀詞表的大量文本作為訓(xùn)練數(shù)據(jù); 對(duì)所述訓(xùn)練數(shù)據(jù)進(jìn)行分詞處理,并確定各分詞包含的各音節(jié); 對(duì)所述各音節(jié)進(jìn)行韻律標(biāo)注,韻律標(biāo)注信息包括:弱讀信息; 根據(jù)所述訓(xùn)練文本數(shù)據(jù)及對(duì)應(yīng)的各音節(jié)的韻律標(biāo)注信息,訓(xùn)練得到弱讀決策樹(shù)。6.根據(jù)權(quán)利要求1至5任一項(xiàng)所述的方法,其特征在于,所述對(duì)所述基本合成單元對(duì)應(yīng)的合成參數(shù)模型進(jìn)行弱讀化處理,得到更新的合成參數(shù)模型包括: 獲取所述合成參數(shù)模型的模型參數(shù),所述模型參數(shù)包括:時(shí)長(zhǎng)參數(shù)、基頻參數(shù)、能量參數(shù); 根據(jù)預(yù)先訓(xùn)練得到的映射規(guī)則更新所述模型參數(shù),得到更新的合成參數(shù)模型。7.一種提高合成語(yǔ)音韻律自然度的系統(tǒng),其特征在于,所述系統(tǒng)包括: 接收模塊,用于接收待合成文本; 基本合成單元序列確定模塊,用于確定對(duì)應(yīng)所述文本的基本合成單元序列,所述基本合成單元序列中包括一個(gè)或多個(gè)基本合成單元; 弱讀預(yù)測(cè)模塊,用于確定各基本合成單元是否弱讀; 合成參數(shù)模型獲取模塊,用于獲取所述基本合成單元對(duì)應(yīng)的合成參數(shù)模型; 弱讀化處理模塊,用于在所述基本合成單元為弱讀時(shí),對(duì)所述基本合成單元對(duì)應(yīng)的合成參數(shù)模型進(jìn)行弱讀化處理,得到更新的合成參數(shù)模型; 合成參數(shù)模型序列生成模塊,用于生成對(duì)應(yīng)所述基本合成單元序列的合成參數(shù)模型序列; 合成模塊,用于根據(jù)所述合成參數(shù)模型序列生成連續(xù)語(yǔ)音。8.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,所述弱讀預(yù)測(cè)模塊包括: 獲取單元,用于獲取各基本合成單元所屬的音節(jié)串和/或音節(jié); 確定單元,用于確定所述音節(jié)串和/或音節(jié)是否為弱讀,如果是,則確定所述基本合成單元為弱讀。9.根據(jù)權(quán)利要求8所述的系統(tǒng),其特征在于,所述確定單元包括: 檢查單元,用于檢查所述基本合成單元所屬的音節(jié)串是否在預(yù)設(shè)的弱讀詞表中;如果是,則確定所述音節(jié)弱讀;否則,檢查所述基本合成單元所屬的音節(jié)是否在預(yù)設(shè)的弱讀詞表中;如果是,則觸發(fā)提取單元提取所述音節(jié)的韻律特征;否則確定所述基本合成單元不弱讀; 提取單元,用于根據(jù)所述檢查單元的觸發(fā)提取所述音節(jié)的韻律特征; 判斷單元,用于根據(jù)所述提取單元提取的音節(jié)的韻律特征及預(yù)先構(gòu)建的弱讀決策樹(shù)確定所述音節(jié)是否弱讀,并且如果所述音節(jié)弱讀,則確定所述基本合成單元弱讀,否則確定所述基本合成單元不弱讀。10.根據(jù)權(quán)利要求9所述的系統(tǒng),其特征在于,所述系統(tǒng)還包括:弱讀詞表構(gòu)建模塊,用于構(gòu)建所述弱讀詞表。11.根據(jù)權(quán)利要求9所述的系統(tǒng),其特征在于,所述系統(tǒng)還包括:弱讀決策樹(shù)構(gòu)建模塊,用于構(gòu)建所述弱讀決策樹(shù)。12.根據(jù)權(quán)利要求7至11任一項(xiàng)所述的系統(tǒng),其特征在于,所述弱讀化處理模塊包括: 模型參數(shù)獲取單元,用于獲取所述合成參數(shù)模型的模型參數(shù),所述模型參數(shù)包括:時(shí)長(zhǎng)參數(shù)、基頻參數(shù)、能量參數(shù); 參數(shù)更新單元,用于根據(jù)預(yù)先訓(xùn)練得到的映射規(guī)則更新所述模型參數(shù),得到更新的合成參數(shù)模型。
【文檔編號(hào)】G10L13/10GK105895075SQ201510038454
【公開(kāi)日】2016年8月24日
【申請(qǐng)日】2015年1月26日
【發(fā)明人】祖漪清, 王祖燕, 黃維, 邵鵬飛, 胡國(guó)平, 胡郁, 劉慶峰
【申請(qǐng)人】科大訊飛股份有限公司