本發(fā)明涉及藏語信息處理領(lǐng)域,具體涉及一種藏語聲調(diào)預(yù)測方法及系統(tǒng)。
背景技術(shù):
語音合成是語言信息處理中的重要組成部分,是指把文本通過一定的轉(zhuǎn)換后,輸出語音的過程,并盡量使合成的語音具有良好的自然度與可懂度,文本處理是語音合成系統(tǒng)的前端文本分析處理。其中,藏語聲調(diào)預(yù)測方法由于藏語發(fā)音的獨特性,是藏語文本處理中研究的一個重點。
藏語包括拉薩話、康巴話、安多話等,其中以拉薩話為主。拉薩話的一個突出語音特征就是有聲調(diào),以下所述的藏語主要指拉薩話。藏語語音合成方法主要包括字音轉(zhuǎn)換和聲調(diào)預(yù)測等。簡單地說,聲調(diào)就是音的高低升降。由于藏語本身存在的特殊性,使得藏語的多聲調(diào)模式詞在不同韻律邊界處的聲調(diào)信息不同,而聲調(diào)的變化會嚴重影響語義的理解。如果不能準確地預(yù)測藏語的聲調(diào)調(diào)型,將會降低藏語字音轉(zhuǎn)換的應(yīng)用效果?,F(xiàn)有的藏語聲調(diào)預(yù)測方法一般都是基于規(guī)則的方法,即對音節(jié)的聲母、韻母進行分類,根據(jù)分類后的聲母和韻母的組合情況,通過查聲調(diào)調(diào)型表得到音節(jié)的聲調(diào)調(diào)型。但是,現(xiàn)有方法對聲調(diào)調(diào)型變化機制的分析不夠完整,未考慮到藏語自身的特性,導(dǎo)致現(xiàn)有的藏語聲調(diào)預(yù)測方法不能準確預(yù)測多聲調(diào)模式詞在不同韻律邊界處的聲調(diào),使得藏語語音合成的自然度降低,甚至影響可懂度。
技術(shù)實現(xiàn)要素:
本發(fā)明實施例提供一種藏語聲調(diào)預(yù)測方法及系統(tǒng),解決藏語中多聲調(diào)模式詞在不同韻律邊界處的聲調(diào)不同的問題,以使藏語語音合成更加自然。
為此,本發(fā)明實施例提供如下技術(shù)方案:
一種藏語聲調(diào)預(yù)測方法,包括:
接收待處理藏語文本;
對所述待處理藏語文本進行分詞處理,得到各詞單元;
根據(jù)所述詞單元在所述待處理藏語文本中的上下文環(huán)境信息,確定所述詞單元的詞性;
預(yù)測所述待處理藏語文本的韻律邊界,并根據(jù)韻律邊界處詞單元的詞性,調(diào)整韻律邊界處的詞單元邊界;
根據(jù)各詞單元的詞性,對調(diào)整詞單元邊界后的待處理藏語文本的音節(jié)單元進行聲調(diào)預(yù)測,得到待處理藏語文本的聲調(diào)信息。
優(yōu)選的,所述根據(jù)所述各詞單元在所述待處理藏語文本中的上下文環(huán)境信息,確定所述各詞單元的詞性包括:
對待處理藏語文本進行分句;
預(yù)測所述詞單元在句中的詞性;
確定所述詞單元的類型;
根據(jù)所述詞單元的類型,調(diào)整所述詞單元的詞性。
優(yōu)選的,所述對待處理藏語文本進行分句包括:
預(yù)測各詞單元的一級詞性,所述一級詞性包括:動詞、實詞、代詞、虛詞、一般詞綴、動詞構(gòu)型詞綴;
如果單垂符前一個詞單元的一級詞性是動詞或動詞構(gòu)型詞綴,則單垂符處為句邊界;
如果單垂符前一個詞單元的一級詞性不是動詞或動詞構(gòu)型詞綴,則通過統(tǒng)計建模的方法預(yù)測句邊界。
優(yōu)選的,所述預(yù)測各詞單元的一級詞性包括:
獲取各詞單元的候選一級詞性;
提取當前詞單元的上下文相關(guān)特征;
根據(jù)當前詞單元的上下文相關(guān)特征,通過統(tǒng)計建模的方法從當前詞單元的候選一級詞性中確定當前詞單元的一級詞性。
優(yōu)選的,所述詞單元的類型包括以下任意一種或多種:多聲調(diào)模式詞、虛詞、詞綴、常規(guī)詞。
優(yōu)選的,所述根據(jù)韻律邊界處詞單元的詞性,調(diào)整韻律邊界處的詞單元邊界包括:
當韻律邊界處的詞單元為多聲調(diào)模式詞單元,且詞性為動詞或形容詞時,以音節(jié)為單位拆分多聲調(diào)模式詞單元,利用拆分后音節(jié)單元進行后續(xù)聲調(diào)預(yù)測。
一種藏語聲調(diào)預(yù)測系統(tǒng),包括:
接收模塊,用于接收藏語文本;
分詞模塊,用于對所述待處理藏語文本進行分詞處理,得到各詞單元;
詞性確定模塊,用于根據(jù)所述詞單元在所述待處理藏語文本中的上下文環(huán)境信息,確定所述詞單元的詞性;
詞單元邊界調(diào)整模塊,用于預(yù)測所述待處理藏語文本的韻律邊界,并根據(jù)韻律邊界處詞單元的詞性,調(diào)整韻律邊界處的詞單元邊界;
聲調(diào)預(yù)測模塊,用于根據(jù)各詞單元的詞性,對調(diào)整詞單元邊界后的待處理藏語文本的音節(jié)單元進行聲調(diào)預(yù)測,得到待處理藏語文本的聲調(diào)信息。
優(yōu)選的,所述詞性確定模塊包括:
分句單元,用于對待處理藏語文本進行分句;
詞性預(yù)測單元,用于預(yù)測各詞單元在句中的詞性;
詞類型確定單元,用于確定各詞單元的類型;
詞性調(diào)整單元,用于根據(jù)詞單元的類型,調(diào)整詞單元的詞性。
優(yōu)選的,所述分句單元包括:
一級詞性預(yù)測子單元,用于預(yù)測各詞單元的一級詞性,所述一級詞性包括:動詞、實詞、代詞、虛詞、一般詞綴、動詞構(gòu)型詞綴;
第一句邊界確定子單元,用于如果單垂符前一個詞單元的一級詞性是動詞或動詞構(gòu)型詞綴,則單垂符處為句邊界;
第二句邊界確定子單元,用于如果單垂符前一個詞單元的一級詞性不是動詞或動詞構(gòu)型詞綴,則通過統(tǒng)計建模的方法預(yù)測句邊界。
優(yōu)選的,所述第一句邊界確定子單元具體用于:通過查表獲得各詞單元的候選一級詞性;提取當前詞單元的上下文相關(guān)特征;根據(jù)當前詞單元的上下文相關(guān)特征,通過統(tǒng)計建模的方法從當前詞單元的候選一級詞性中確定當前詞單元的一級詞性。
優(yōu)選的,所述詞單元邊界調(diào)整模塊具體用于:當韻律邊界處的詞單元為多 聲調(diào)模式詞單元,且詞性為動詞或形容詞時,以音節(jié)為單位拆分多聲調(diào)模式詞單元,利用拆分后音節(jié)單元進行后續(xù)聲調(diào)預(yù)測。
本發(fā)明實施例提供的一種藏語聲調(diào)預(yù)測方法及系統(tǒng),通過將接收的待處理藏語文本進行分詞處理,得到各詞單元,并確定各詞單元的類型,然后依據(jù)詞單元的類型對獲取的韻律邊界處詞單元邊界進行調(diào)整,并預(yù)測調(diào)整詞單元邊界后的待處理藏語文本的詞單元聲調(diào)。由于在預(yù)測詞單元聲調(diào)過程中,根據(jù)詞單元詞性調(diào)整了藏語文本中韻律邊界處的詞單元邊界,并根據(jù)調(diào)整后的韻律邊界處的詞單元的詞性,預(yù)測韻律邊界處的詞單元的聲調(diào),從而解決藏語中多聲調(diào)模式詞在不同韻律邊界處的聲調(diào)不同的問題,提高藏語語音合成的自然度,并確保其可懂度。
附圖說明
為了更清楚地說明本申請實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明中記載的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,還可以根據(jù)這些附圖獲得其他的附圖。
圖1是本發(fā)明實施例提供的藏語聲調(diào)預(yù)測方法的流程圖;
圖2是本發(fā)明實施例提供的藏語聲調(diào)預(yù)測系統(tǒng)的一種結(jié)構(gòu)示意圖;
圖3是本發(fā)明實施例提供的藏語文本處理系統(tǒng)的一種結(jié)構(gòu)示意圖。
具體實施方式
為了使本技術(shù)領(lǐng)域的人員更好地理解本發(fā)明實施例的方案,下面結(jié)合附圖和實施方式對本發(fā)明作進一步的詳細說明。以下實施例是示例性的,僅用于解釋本發(fā)明,而不能解釋為對本發(fā)明的限制。
為了更好地理解本發(fā)明,下面首先對現(xiàn)有技術(shù)中藏語聲調(diào)預(yù)測方法進行簡單說明。現(xiàn)有的藏語聲調(diào)預(yù)測方法一般是采用基于規(guī)則的方法對待處理文本的聲調(diào)進行預(yù)測,例如:根據(jù)聲母韻母的組合方式,查聲調(diào)調(diào)型表得到音節(jié)的聲調(diào)調(diào)型。藏語中單音節(jié)聲調(diào)是通過聲母和韻母來確定的,其中,聲母是由前加字、上加字、基字、下加字構(gòu)成的,聲母的聲調(diào)分為高和低兩類,表示音節(jié)聲 調(diào)的起點為高和低。通常,基字是濁的情況聲母為高,基字是清的情況聲母為低。前加字、上加字會改變基字聲調(diào)得高低。韻母是由元音字符、后加字、再后加字構(gòu)成的,根據(jù)韻母的韻尾可以將韻母分為3類,即長韻母、促韻母、單元音韻母。對當前詞單元中音節(jié)進行聲調(diào)預(yù)測時,首先根據(jù)聲母韻母類型表確定當前音節(jié)聲韻母的類型組合,所述聲韻母類型表一般由領(lǐng)域?qū)<覙?gòu)建;然后查找聲調(diào)調(diào)型表,確定聲母韻母組合的音節(jié)聲調(diào)調(diào)型,所述聲調(diào)調(diào)型表中包含了聲母和韻母各種組合的聲調(diào)調(diào)型,一般基于規(guī)則的方法構(gòu)建,所述規(guī)則描述了藏語的語言特性。如音節(jié)其中,基字是前加字為聲母為屬于高類;前加字為不改變聲母屬性,元音符號為后加字為韻母為屬于促韻母,從而確定音節(jié)的聲韻母組合為高的聲母和促的韻母,通過查聲調(diào)調(diào)型表,得到音節(jié)的聲調(diào)為降調(diào)(f)。然而,現(xiàn)有技術(shù)未結(jié)合藏語本身存在的特性,如未考慮多聲調(diào)模式詞在不同韻律邊界處的聲調(diào)隨詞性變化而不同的問題,從而造成語音系統(tǒng)的應(yīng)用效果下降。
本發(fā)明提供的藏語聲調(diào)預(yù)測方法及系統(tǒng),通過對待處理藏語文本進行分詞處理獲得各詞單元,并預(yù)測各詞單元的詞性,然后獲得待處理藏語文本的韻律邊界,并根據(jù)韻律邊界詞單元的詞性,調(diào)整其詞邊界,解決多聲調(diào)模式詞在不同韻律邊界處,聲調(diào)不同的問題,隨后對調(diào)整詞單元邊界后的待處理藏語文本進行聲調(diào)預(yù)測,得到待處理藏語文本的聲調(diào)信息。由于調(diào)整了韻律邊界處詞單元的邊界,并根據(jù)調(diào)整詞邊界后詞單元的詞性,預(yù)測其聲調(diào),解決了多聲調(diào)模式詞在不同韻律邊界處時的變調(diào)問題,使得預(yù)測的聲調(diào)更準確,有效提升了語音系統(tǒng)的應(yīng)用效果。
為了更好的理解本發(fā)明的技術(shù)方案和技術(shù)效果,以下將結(jié)合流程圖和具體的實施例進行詳細的描述。
如圖1所示,是本發(fā)明實施例提供的藏語聲調(diào)預(yù)測方法的流程圖,包括以下步驟:
步驟101,接收待處理藏語文本。
步驟102,對待處理藏語文本進行分詞處理,得到各詞單元。
在本實施例中,可以根據(jù)藏語分詞原則進行分詞。
具體的,首先以雙垂符為標記進行分段,然后在以雙垂符或單垂符為標記的分段內(nèi)進行分詞,得到以雙垂符或單垂符為邊界的待處理文本相應(yīng)分詞串。
進一步地,得到待處理文本相應(yīng)分詞串后,還可以對所述待處理文本分詞串中可能為黏著格助詞的格助詞進行標記,所述黏著格助詞指詞單元后接具有黏著特性的格助詞,所述格助詞會以后加字的形式與被黏著詞單元最后一個音節(jié)結(jié)合成一個音節(jié),并且在讀音上成為這個音節(jié)的韻尾。
步驟103,根據(jù)所述各詞單元在所述待處理藏語文本中的上下文環(huán)境信息,確定所述各詞單元的詞性。
在實際應(yīng)用中,可以通過查表或采用統(tǒng)計建模的方法等確定各詞單元的詞性,在本實施例中,通過各詞單元在句中的上下文相關(guān)特征,通過統(tǒng)計建模的方法預(yù)測各詞單元的詞性,然后再根據(jù)詞單元的類型,調(diào)整各詞單元的詞性,以保障獲得的詞單元的詞性的準確性,具體可以包括:
對待處理藏語文本進行分句;
預(yù)測各詞單元在句中的詞性;
根據(jù)詞單元的類型,調(diào)整詞單元的詞性。
步a)對待處理藏語文本進行分句
由于藏語句子的基本組成結(jié)構(gòu)為“主語-賓語-謂語”;因此,對待處理文本進行分句時,首先要確定謂語動詞位置。本實施例根據(jù)單垂符前一個詞單元的一級詞性來確定單垂符對應(yīng)的邊界是否為句邊界。其中,所述一級詞性包括:動詞、實詞、代詞、虛詞、一般詞綴、動詞構(gòu)型詞綴,所述對待處理藏語文本進行分句可以包括:
預(yù)測各詞單元的一級詞性;
根據(jù)各詞單元的一級詞性確定句邊界。
在實際應(yīng)用中,可以通過統(tǒng)計建模的方法進行詞單元的一級詞性預(yù)測,具體預(yù)測時,首先通過查表獲得各詞單元的候選一級詞性;然后提取當前詞單元的上下文相關(guān)特征,其中,上下文相關(guān)特征可以為當前詞單元前一個和/或后一個詞單元的候選一級詞性,及當前詞單元的侯選一級詞性等;最后根據(jù)當前詞單元的上下文相關(guān)特征,通過統(tǒng)計建模的方法從當前詞單元的候選一級詞性 中確定當前詞單元的一級詞性,其中,統(tǒng)計模型如決策樹模型,一級詞性具體可以包括:
1.實詞,具體包括:名詞、形容詞、副詞、數(shù)詞;
2.代詞,例如指示代詞(我)、(你)、(他);
3.虛詞,具體包括:格助詞、連詞、介詞;
4.動詞;
5.一般詞綴,具體包括:名詞詞綴、形容詞詞綴、副詞詞綴、動詞構(gòu)詞詞綴,所述動詞構(gòu)詞詞綴是指加在動詞后改變原有語義的動詞詞綴;
6.動詞構(gòu)型詞綴,具體包括:后綴、語氣詞、助動詞、動詞詞綴串,所述動詞構(gòu)型詞綴一般加在動詞后不改變動詞原本語義的動詞詞綴,動詞構(gòu)型詞綴表達的是句法功能。所述動詞詞綴串即多個動詞構(gòu)型詞綴同時出現(xiàn)時的連接形式。
根據(jù)各詞單元的一級詞性確定句邊界時,具體可以為:判斷單垂符前一個詞單元的一級詞性是否為動詞或動詞構(gòu)型詞綴,如果是,則認為單垂符為句邊界;否則,基于統(tǒng)計建模的方法預(yù)測句邊界,所述統(tǒng)計模型如決策樹模型,得到待處理藏語文本的句邊界。
需要說明的是,在本實施例中,雙垂符對應(yīng)的邊界,既是段邊界,也是句邊界。而單垂符對應(yīng)的邊界不一定是句邊界,也有可能是短語邊界或詞邊界。
步驟b)預(yù)測各詞單元在句中的詞性
由于一級詞性包含多種不同詞性信息,如一級詞性為實詞時,包含名詞、形容詞、副詞、數(shù)詞四種詞性信息,使得詞單元的一級詞性和聲調(diào)還不是一對一的關(guān)系,由于多聲調(diào)模式詞的詞性不同時,聲調(diào)也可能不同,如多聲調(diào)模式詞作為名詞時的聲調(diào)與作為形容詞時的聲調(diào)可能不同。因此,本實施例在分句后,根據(jù)詞單元在句中的上下文特征,預(yù)測詞單元的具體詞性,即詞單元的二級詞性;所述二級詞性與通常意義的詞性相同,如名詞、形容詞等。本實施例在各分句內(nèi)對每個詞單元進行二級詞性預(yù)測,具體預(yù)測方法與現(xiàn)有技術(shù)相同,如采用統(tǒng)計建模的方法進行預(yù)測,得到每個詞單元的二級詞性。
步驟c)確定詞單元的類型
由于藏語文本中同一詞單元在不同的上下文環(huán)境中,會擔當不同的詞性,表現(xiàn)出不同的聲調(diào),以句為單位預(yù)測的二級詞性范圍較大,容易導(dǎo)致預(yù)測得到的二級詞性不準確;為了更準確的預(yù)測待處理藏語文本的聲調(diào)信息,需要確保步驟b)獲取各詞單元的二級詞性的準確度??梢酝ㄟ^詞單元的類型進一步對步驟b)預(yù)測的詞單元的二級詞性進行調(diào)整,因此,需要先確定詞單元的類型。
在實際應(yīng)用中,可根據(jù)聲調(diào)在不同語境的表現(xiàn)形式將詞單元劃分為4種類型,即多聲調(diào)模式詞、虛詞、詞綴、常規(guī)詞,具體如下:
1.虛詞:不同聲母的虛詞在孤立音節(jié)時,聲調(diào)不同;如高聲母在不同后加字的作用下,聲調(diào)為h(高)、f(降);低聲母在不同后加字的作用下,聲調(diào)為l(低)、r(升);在語流中,幾乎所有虛詞聲調(diào)都讀成為l或r,如格助詞、連詞、介詞、狀態(tài)、語氣詞等都讀的較低;
2.多聲調(diào)模式詞:多聲調(diào)模式詞單元在作為不同詞性時,聲調(diào)不同,如:拉丁轉(zhuǎn)寫為khrom skor,做名詞時聲調(diào)組合模式為hh,做動詞時聲調(diào)組合模式是fr。
3.詞綴:以弱讀方式發(fā)音,與中文普通話的輕聲較類似,如ba、wa、bo、pa、po、ma、mo等。
4.常規(guī)詞:聲調(diào)存在內(nèi)在的變調(diào)規(guī)律。例如,兩個音節(jié)單念時都讀成低調(diào)l的音節(jié)組成一個詞,并不是讀成ll,而是往往會讀成lh,即第二音節(jié)的低調(diào)變成了高調(diào)。
在本實施例中,可以通過查各種詞單元類型詞典的方式獲得詞單元的類型,還可以通過預(yù)先對待處理藏語文本進行人工標注類型的方式獲得詞單元的類型。
步驟d)根據(jù)詞單元的類型,調(diào)整詞單元的詞性。
在本實施例中,根據(jù)各詞單元的類型調(diào)整詞單元的詞性,確保各詞單元的二級詞性的準確度。例如,可根據(jù)詞單元的類型及其上下文相關(guān)特征,調(diào)整詞單元的詞性。此外,還可以通過統(tǒng)計建模的方法調(diào)整詞單元的詞性。具體的,詞單元的詞性調(diào)整可以分為以下幾種情況:
1.虛詞單元詞性調(diào)整
虛詞的作用是連接不同的句子成分,由于具有不同作用的虛詞在形式上相同,但在實際語境中可能擔當不同的詞性,即虛詞具有兼類詞性;本實施例中,根據(jù)詞單元的上下文環(huán)境或者使用統(tǒng)計建模的方法進行虛詞詞性調(diào)整,以獲得準確的各詞單元的二級詞性。例如,格助詞也可能是連詞,通過句子中各個成分的連接情況可以確定格助詞在句子的具體位置是當格助詞還是當連詞。
2.多聲調(diào)模式詞單元詞性調(diào)整
以調(diào)整后的虛詞為邊界劃分待處理文本片段,對多聲調(diào)模式詞單元進行詞性調(diào)整,具體根據(jù)上下文環(huán)境或者使用統(tǒng)計建模的方法調(diào)整多聲調(diào)模式詞的詞性。例如,多聲調(diào)模式詞單元(兩個“/”標記之間)在如下兩個句子中詞性不同:
①.
其中,在句末當動詞,表示發(fā)生、出現(xiàn),聲調(diào)組合為rl;
②.
其中,在此句中當名詞表示歷史、傳記,聲調(diào)組合為lr。
詞性調(diào)整時,根據(jù)所在上下文環(huán)境,進行相應(yīng)調(diào)整。
3.詞綴單元及常規(guī)詞單元詞性調(diào)整
詞綴單元所在詞單元和常規(guī)詞單元直接使用各詞單元的二級詞性,本實施例不進行詞性調(diào)整。需要說明的是,詞綴分為獨立詞綴和固定依附于其他詞單元的詞綴部分兩種,在本實施例中,設(shè)定獨立詞綴及詞綴部分的詞性相同,例如,獨立詞綴及固定依附其他詞單元的詞綴部分的詞性都可以為詞綴。
步驟104,預(yù)測所述待處理藏語文本的韻律邊界,并根據(jù)韻律邊界處詞單元的詞性,調(diào)整韻律邊界處的詞單元邊界。
韻律邊界指言語交流中,為了表達語義信息,而出現(xiàn)的詞與詞之間的停頓,韻律邊界處的多聲調(diào)模式詞的詞性與韻律邊界有關(guān),且聲調(diào)會隨著詞性的改變 而改變,因此,需要根據(jù)韻律邊界處詞單元的詞性,調(diào)整韻律邊界處的詞單元邊界。
在本實施例中,首先,對待處理文本進行韻律邊界預(yù)測,例如,對停頓位置的預(yù)測即為韻律邊界的預(yù)測,具體邊界預(yù)測過程與現(xiàn)有技術(shù)相同,例如,可根據(jù)詞單元的上下文相關(guān)信息,采用統(tǒng)計建模方法進行韻律邊界預(yù)測;然后,根據(jù)韻律邊界處詞單元調(diào)整后的二級詞性,調(diào)整韻律邊界處的詞單元邊界。具體的,當韻律邊界處的詞單元的類型為多聲調(diào)模型式詞單元,并且其二級詞性為動詞或形容詞時,以音節(jié)為單位拆分多聲調(diào)模式詞單元,利用拆分后的音節(jié)單元進行聲調(diào)預(yù)測。
步驟105,根據(jù)各詞單元的詞性,對調(diào)整詞單元邊界后的待處理藏語文本的音節(jié)單元進行聲調(diào)預(yù)測,得到待處理藏語文本的聲調(diào)信息。
在實際應(yīng)用中,可以以音節(jié)單元為聲調(diào)的承載單元對所述待處理藏語文本中所有詞單元中每個音節(jié)單元進行聲調(diào)預(yù)測,如根據(jù)聲調(diào)預(yù)測特征,通過查聲調(diào)調(diào)型表來確定每個音節(jié)單元的聲調(diào),其中,聲調(diào)預(yù)測特征可以為當前音節(jié)的聲母類別、當前音節(jié)的韻母類別、當前音節(jié)前后音節(jié)的聲母韻母類別、當前音節(jié)所在詞單元中的位置、當前音節(jié)所在詞單元的長度、當前音節(jié)所在詞單元的詞性等。此外,可以根據(jù)藏語發(fā)音的聲調(diào)規(guī)律對詞單元的聲調(diào)進行調(diào)整,例如,將所有詞綴設(shè)為弱讀,具體可以設(shè)定詞綴的所有音節(jié)單元為弱讀,常用詞綴如ba,wa,bo,pa,po,ma,mo。
進一步的,通過本實施例獲取的各音節(jié)單元的聲調(diào)可以應(yīng)用于語音合成領(lǐng)域,例如,可以將本實施例進行聲調(diào)預(yù)測的過程在完成藏語字音轉(zhuǎn)換之后進行,從而使最終合成的藏語語音更加自然。
本發(fā)明實施例提供的藏語聲調(diào)預(yù)測方法,通過將接收的待處理藏語文本進行分詞處理,得到各詞單元,并確定各詞單元的類型,然后依據(jù)詞單元的類型對獲取的韻律邊界處詞單元邊界進行調(diào)整,使得根據(jù)詞單元的詞性對調(diào)整詞單元邊界后的藏語文本,進行聲調(diào)預(yù)測時,考慮了多聲調(diào)模式詞的詞性對韻律邊界處詞單元的聲調(diào)的影響,能解決藏語中多聲調(diào)模式詞在不同韻律邊界處的聲調(diào)不同的問題,以使藏語語音合成更加自然。
相應(yīng)的,本發(fā)明還提供了藏語聲調(diào)預(yù)測系統(tǒng),如圖2所示,包括:
接收模塊201,用于接收藏語文本;
分詞模塊202,用于對所述待處理藏語文本進行分詞處理,得到各詞單元;
詞性確定模塊203,用于根據(jù)所述詞單元在所述待處理藏語文本中的上下文環(huán)境信息,確定所述詞單元的詞性;
詞單元邊界調(diào)整模塊204,用于預(yù)測所述待處理藏語文本的韻律邊界,并根據(jù)韻律邊界處詞單元的詞性,調(diào)整韻律邊界處的詞單元邊界;
聲調(diào)預(yù)測模塊205,用于根據(jù)各詞單元的詞性,對調(diào)整詞單元邊界后的待處理藏語文本的音節(jié)單元進行聲調(diào)預(yù)測,得到待處理藏語文本的聲調(diào)信息。
在實際應(yīng)用中,本實施例通過各詞單元在其所在句中的上下文相關(guān)特征來確定其詞性,所述詞性確定模塊203包括:
分句單元,用于對待處理藏語文本進行分句;
詞性預(yù)測單元,用于預(yù)測各詞單元在句中的詞性;
詞類型確定單元,用于確定各詞單元的類型;
詞性調(diào)整單元,用于根據(jù)詞單元的類型,調(diào)整詞單元的詞性。
其中,通過待處理藏語文本中的單垂符前一個詞單元的一級詞性或通過統(tǒng)計建模的方法預(yù)測句邊界,所述分句單元包括:
一級詞性預(yù)測子單元,用于預(yù)測各詞單元的一級詞性,所述一級詞性包括:動詞、實詞、代詞、虛詞、一般詞綴、動詞構(gòu)型詞綴;
第一句邊界確定子單元,用于如果單垂符前一個詞單元的一級詞性是動詞或動詞構(gòu)型詞綴,則單垂符處為句邊界;
第二句邊界確定子單元,用于如果單垂符前一個詞單元的一級詞性不是動詞或動詞構(gòu)型詞綴,則通過統(tǒng)計建模的方法預(yù)測句邊界。
在實際應(yīng)用中,所述第一句邊界確定子單元具體用于:通過查表獲得各詞單元的候選一級詞性;提取當前詞單元的上下文相關(guān)特征;根據(jù)當前詞單元的上下文相關(guān)特征,通過統(tǒng)計建模的方法從當前詞單元的候選一級詞性中確定當前詞單元的一級詞性。其中,所述特征如當前詞單元的前后詞單元一級詞性信息及當前詞單元在句中的位置等。
在本實施例中,所述詞單元邊界調(diào)整模塊204具體可用于:當韻律邊界處 的詞單元為多聲調(diào)模式詞單元,且詞性為動詞或形容詞時,以音節(jié)為單位拆分多聲調(diào)模式詞單元,利用拆分后的音節(jié)單元進行聲調(diào)預(yù)測。
最終,通過聲調(diào)預(yù)測模塊205,根據(jù)詞性確定模塊203獲得的各詞單元的詞性,對調(diào)整詞單元邊界后的待處理藏語文本的音節(jié)單元進行聲調(diào)預(yù)測,得到待處理藏語文本的聲調(diào)信息。
當然,在實際應(yīng)用中,該系統(tǒng)還可進一步包括:存儲模塊(未圖示),用于保存詞典信息、聲調(diào)預(yù)測結(jié)果等。這樣,以方便對待處理藏語文本進行計算機自動處理,并存儲合成語音相關(guān)信息等。
在實際應(yīng)用中,所述系統(tǒng)可以應(yīng)用于藏語語音合成領(lǐng)域中,例如,該系統(tǒng)301可與字音轉(zhuǎn)換系統(tǒng)302等共同作為文本處理系統(tǒng)400的子系統(tǒng),通過該文本處理系統(tǒng)進行藏語文本處理,以提高藏語語音合成的自然度,如圖3所示。
本發(fā)明實施例提供的藏語聲調(diào)預(yù)測系統(tǒng),將接收模塊201接收的待處理藏語文本,通過分詞模塊202進行分詞處理,得到各詞單元,然后通過詞性確定模塊203確定各詞單元的類型,依據(jù)詞性確定模塊203的結(jié)果對待處理藏語文本的韻律邊界處詞單元邊界進行調(diào)整,使得該系統(tǒng)根據(jù)詞單元的詞性對韻律邊界處詞單元進行聲調(diào)預(yù)測時,考慮了多聲調(diào)模式詞的詞性對韻律邊界處詞單元的聲調(diào)的影響,能解決藏語中多聲調(diào)模式詞在不同韻律邊界處的聲調(diào)不同的問題,以使藏語語音合成更加自然。
本說明書中的各個實施例均采用遞進的方式描述,各個實施例之間相同相似的部分互相參見即可,每個實施例重點說明的都是與其他實施例的不同之處。尤其,對于系統(tǒng)實施例而言,由于其基本相似于方法實施例,所以描述得比較簡單,相關(guān)之處參見方法實施例的部分說明即可。以上所描述的系統(tǒng)實施例僅僅是示意性的,其中所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網(wǎng)絡(luò)單元上??梢愿鶕?jù)實際的需要選擇其中的部分或者全部模塊來實現(xiàn)本實施例方案的目的。本領(lǐng)域普通技術(shù)人員在不付出創(chuàng)造性勞動的情況下,即可以理解并實施。
以上對本發(fā)明實施例進行了詳細介紹,本文中應(yīng)用了具體實施方式對本發(fā)明進行了闡述,以上實施例的說明只是用于幫助理解本發(fā)明的方法及設(shè)備;同 時,對于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明的思想,在具體實施方式及應(yīng)用范圍上均會有改變之處,綜上所述,本說明書內(nèi)容不應(yīng)理解為對本發(fā)明的限制。