亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種面向多時(shí)間尺度韻律特征的語(yǔ)音轉(zhuǎn)換方法

文檔序號(hào):2829104閱讀:526來(lái)源:國(guó)知局
專利名稱:一種面向多時(shí)間尺度韻律特征的語(yǔ)音轉(zhuǎn)換方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種語(yǔ)音轉(zhuǎn)換技術(shù),尤其是一種基于雙隱馬爾科夫模型的多時(shí)間尺度韻律特征的語(yǔ)音轉(zhuǎn)換方法,屬于語(yǔ)音信號(hào)處理技術(shù)領(lǐng)域。
背景技術(shù)
語(yǔ)音轉(zhuǎn)換是語(yǔ)音信號(hào)處理領(lǐng)域近年來(lái)新興的研究分支,是在說(shuō)話人識(shí)別和語(yǔ)音合成的研究基礎(chǔ)上進(jìn)行的,同時(shí)也是這兩個(gè)分支內(nèi)涵的豐富和延拓。語(yǔ)音轉(zhuǎn)換的目標(biāo)是改變?cè)凑f(shuō)話人語(yǔ)音中的個(gè)性特征信息,使之具有目標(biāo)說(shuō)話人的個(gè)性特征,從而使轉(zhuǎn)換后的語(yǔ)音聽起來(lái)就像是目標(biāo)說(shuō)話人的聲音,而其中的語(yǔ)義信息保持不變。性能良好的語(yǔ)音轉(zhuǎn)換系統(tǒng),既要保持重構(gòu)語(yǔ)音的聽覺(jué)質(zhì)量,又要兼顧轉(zhuǎn)換后的目標(biāo)說(shuō)話人個(gè)性特征是否準(zhǔn)確,現(xiàn)有的語(yǔ)音轉(zhuǎn)換算法大多單純關(guān)注頻譜特征的準(zhǔn)確轉(zhuǎn)換,重建的語(yǔ)音盡管與目標(biāo)說(shuō)話人聲音個(gè)性相似,但存在發(fā)音模糊和不連續(xù)現(xiàn)象,自然度較差。由于韻律信息的表述具有復(fù)雜性和不穩(wěn)定性,對(duì)其建立有效的數(shù)學(xué)模型和參數(shù)提取存在一定的困難與挑戰(zhàn),一直以來(lái)對(duì)韻律特征轉(zhuǎn)換的研究成果較少。然而,眾所周知,韻律特性對(duì)語(yǔ)音信號(hào)的可懂度和自然度貢獻(xiàn)顯著,隨著和諧人機(jī)交互技術(shù)的進(jìn)一步發(fā)展,對(duì)韻律特性的重視和深入研究在語(yǔ)音轉(zhuǎn)換、情感語(yǔ)音合成和情感識(shí)別等情感信息處理領(lǐng)域達(dá)成廣泛共識(shí)。在韻律特性研究方面,傳統(tǒng)觀點(diǎn)認(rèn)為韻律特征指的是超音段特征,即語(yǔ)音信號(hào)在超音段層次上表現(xiàn)出來(lái)的時(shí)間演變特性,并且認(rèn)為這種特性與語(yǔ)音音段在時(shí)間軸的排列順序無(wú)關(guān),然而本質(zhì)上韻律特性與音段類特性之間存在有相關(guān)性,因此這種觀點(diǎn)存在一定的局限性。相關(guān)的文獻(xiàn)比如1.PadmalayaPattnaik, Shreela Dash. A study onprosody analysis.1nternational Journal of Computational EngineeringResearch, 2012,2(5):1594-1599.2.Takashi Nose, Takao Kobayash1. Speaker-1ndependent HMM-based voiceconversionusing adaptive quantization of the fundamental frequency. Speech Communication, 2011,53(7) :973_985。另一種觀點(diǎn)認(rèn)為,韻律特征是一類參數(shù)的集合,這類參數(shù)描述的是語(yǔ)音信號(hào)由不同層次成分構(gòu)成時(shí)的組織結(jié)構(gòu)和特有規(guī)律,這種觀點(diǎn)提取的語(yǔ)音參數(shù)著重于描述不同層次語(yǔ)義單元在構(gòu)成語(yǔ)音信號(hào)時(shí)的結(jié)構(gòu)特點(diǎn)。相關(guān)的文獻(xiàn)比如3·K. Sreenivasa Rao. Voice conversion by mapping thespeaker—specificfeatures using pitch synchronous approach. Computer Speech andLanguage, 2010,24(3) : 474-494.4. Raul Fernandez, Rosalind Picard. Recognizing affect from speechprosody usinghierarchical graphical models. Speech Communication,2011,53(9-10):1088-1103。

發(fā)明內(nèi)容
本發(fā)明的所要解決的技術(shù)問(wèn)題是提供一種面向多時(shí)間尺度韻律特征的語(yǔ)音轉(zhuǎn)換方法,達(dá)到增強(qiáng)轉(zhuǎn)換語(yǔ)音中的說(shuō)話人個(gè)性特征的同時(shí)提高轉(zhuǎn)換語(yǔ)音的聽覺(jué)質(zhì)量與自然度。本發(fā)明為解決以上技術(shù)問(wèn)題采用如下技術(shù)方案一種面向多時(shí)間尺度韻律特征的語(yǔ)音轉(zhuǎn)換方法,包括訓(xùn)練階段和轉(zhuǎn)換階段,其中所述訓(xùn)練階段包括如下步驟一種面向多時(shí)間尺度韻律特征的語(yǔ)音轉(zhuǎn)換方法,包括訓(xùn)練階段和轉(zhuǎn)換階段,其中所述訓(xùn)練階段包括如下步驟步驟A,語(yǔ)音信號(hào)預(yù)處理對(duì)目標(biāo)說(shuō)話人和源說(shuō)話人輸入的語(yǔ)音信號(hào),分別依次進(jìn)行預(yù)加重、分幀和加窗處理;步驟B,語(yǔ)音特征矢量提取,所述語(yǔ)音特征矢量包括語(yǔ)音頻譜特征和多時(shí)間尺度韻律特征,其中所述多時(shí)間尺度韻律特征包括短語(yǔ)尺度下的韻律特征、音節(jié)尺度下的韻律特征、語(yǔ)句尺度下的韻律特征,具體提取步驟如下對(duì)步驟A預(yù)處理后的源說(shuō)話人和目標(biāo)說(shuō)話人的語(yǔ)音信號(hào)分別進(jìn)行時(shí)域參數(shù)分析提取,得到源說(shuō)話人和目標(biāo)說(shuō)話人在音節(jié)尺度、語(yǔ)句尺度下的韻律特征;同時(shí)對(duì)步驟A預(yù)處理后的源說(shuō)話人和目標(biāo)說(shuō)話人的語(yǔ)音信號(hào)基于諧波加噪聲模型進(jìn)行分解,求取語(yǔ)音信號(hào)的諧波成分和噪聲成分,然后對(duì)諧波加噪聲模型的參數(shù)進(jìn)一步降維與量化,最終分別得到源說(shuō)話人和目標(biāo)說(shuō)話人的語(yǔ)音信號(hào)的語(yǔ)音頻譜特征、短語(yǔ)尺度下的韻律特征;步驟C,根據(jù)步驟B得到的源說(shuō)話人、目標(biāo)說(shuō)話人的語(yǔ)音信號(hào)的多時(shí)間尺度韻律特征,對(duì)于每一個(gè)時(shí)間尺度下的源說(shuō)話人、目標(biāo)說(shuō)話人的韻律特征,分別采用雙隱馬爾科夫模型進(jìn)行建模,進(jìn)行動(dòng)態(tài)特性和統(tǒng)計(jì)特性的分析,實(shí)現(xiàn)各時(shí)間尺度下的韻律特征的轉(zhuǎn)換;步驟D,根據(jù)步驟B得到的源說(shuō)話人、目標(biāo)說(shuō)話人的語(yǔ)音信號(hào)的語(yǔ)音頻譜特征,采用聯(lián)合高斯混合模型進(jìn)行建模,實(shí)現(xiàn)頻譜特征的轉(zhuǎn)換;所述轉(zhuǎn)換階段包括如下步驟步驟E,輸入源說(shuō)話人新的語(yǔ)音,對(duì)源說(shuō)話人輸入的新的語(yǔ)音信號(hào)依次進(jìn)行步驟A所述的語(yǔ)音信號(hào)預(yù)處理和步驟B所述的語(yǔ)音特征矢量提取操作,得到源說(shuō)話人新的語(yǔ)音信號(hào)的頻譜特征和多時(shí)間尺度韻律特征;步驟F,對(duì)步驟E得到的源說(shuō)話人新的語(yǔ)音信號(hào)的每個(gè)時(shí)間尺度韻律特征,采用上述步驟C得到的該時(shí)間尺度下的雙隱馬爾科夫模型分別進(jìn)行語(yǔ)音韻律特征轉(zhuǎn)換;步驟G,對(duì)步驟E得到的源說(shuō)話人新的語(yǔ)音信號(hào)的頻譜特征,采用上述步驟D得到的高斯混合模型進(jìn)行語(yǔ)音頻譜轉(zhuǎn)換,得到轉(zhuǎn)換后的目標(biāo)說(shuō)話人的頻譜特征;步驟H,對(duì)步驟F和G轉(zhuǎn)換后的語(yǔ)音韻律特征和頻譜特征經(jīng)過(guò)諧波加噪聲模型進(jìn)行合成,最終得到轉(zhuǎn)換后的語(yǔ)音。作為本發(fā)明的面向多時(shí)間尺度韻律特征的語(yǔ)音轉(zhuǎn)換方法的進(jìn)一步優(yōu)化方案,所述步驟A的預(yù)處理步驟中,所述預(yù)加重處理的預(yù)加重系數(shù)為O. 96,分幀處理按20ms分幀,所述加窗處理采用漢明窗進(jìn)行加窗處理。
作為本發(fā)明的面向多時(shí)間尺度韻律特征的語(yǔ)音轉(zhuǎn)換方法的進(jìn)一步優(yōu)化方案,步驟B的多時(shí)間尺度韻律特征具體提取步驟如下B-1,對(duì)短語(yǔ)尺度下的韻律特征,采用矢量量化對(duì)經(jīng)過(guò)諧波加噪聲模型分解后得到的基頻軌跡進(jìn)行碼本量化,結(jié)合整個(gè)語(yǔ)句中的最大基頻,最小基頻以及基頻平均值—起構(gòu)成短語(yǔ)尺度下的韻律特征;B-2,對(duì)音節(jié)尺度下的韻律特征、語(yǔ)句尺度下的韻律特征,i,對(duì)音節(jié)尺度下的韻律特征,對(duì)于語(yǔ)音信號(hào),選用時(shí)長(zhǎng)結(jié)合標(biāo)注音節(jié)的短時(shí)均方能量參數(shù)RMSs來(lái)描述,所述時(shí)長(zhǎng)采用標(biāo)注音節(jié)的持續(xù)采樣點(diǎn)數(shù){Ds,s=l,2,…S}來(lái)描述,其中s表示語(yǔ)句中S個(gè)音節(jié)中的第s個(gè)音節(jié),s、S均為正整數(shù);考慮到相鄰音節(jié)之間的動(dòng)態(tài)特性,將當(dāng)前音節(jié)與下一音節(jié)參數(shù)之間的差值A(chǔ)11=Dp1-Ds作為補(bǔ)充特征,并且加入整句中音節(jié)持續(xù)時(shí)長(zhǎng)的平均值A(chǔ)VGd和音節(jié)能量的平均值A(chǔ)VGkms構(gòu)成聯(lián)合特征;ii,對(duì)語(yǔ)句尺度下的韻律特征,采用整個(gè)語(yǔ)句的逐幀有效聲壓級(jí)值的量化碼本來(lái)表征,所述的逐幀有效聲壓級(jí)值根據(jù)公式SPLt=20 X log (RMSt/ (2 X 10_5))計(jì)算,其中RMSt表示語(yǔ)句中第t幀的短時(shí)均方能量。作為本發(fā)明的面向多時(shí)間尺度韻律特征的語(yǔ)音轉(zhuǎn)換方法的進(jìn)一步優(yōu)化方案,步驟C所述每一時(shí)間尺度下的源說(shuō)話人、目標(biāo)說(shuō)話人的韻律特征的轉(zhuǎn)換,具體實(shí)現(xiàn)過(guò)程如下第一步,首先采用動(dòng)態(tài)時(shí)間規(guī)整算法對(duì)源說(shuō)話人的該時(shí)間尺度韻律特征參數(shù)和目標(biāo)說(shuō)話人的該時(shí)間尺度韻律特征參數(shù)進(jìn)行對(duì)齊操作,所述的源說(shuō)話人的該時(shí)間尺度韻律特征參數(shù)用I =表示,目標(biāo)說(shuō)話人的該時(shí)間尺度韻律特征參數(shù)用
=T5(和Ty分別表示源說(shuō)話人和目標(biāo)說(shuō)話人語(yǔ)音信號(hào)在該時(shí)間尺度下韻律特征總的幀數(shù),Xt和yt分別表示源說(shuō)話人和目標(biāo)說(shuō)話人語(yǔ)音信號(hào)在該時(shí)間尺度下的第t幀韻律特征參數(shù);第二步,采用期望最大化算法訓(xùn)練雙隱馬爾科夫模型參數(shù)集λ ={ λ χ,λγ},所述參數(shù)集中的λ χ對(duì)應(yīng)于源說(shuō)話人的隱馬爾科夫模型,在模型訓(xùn)練過(guò)程中,與源說(shuō)話人的特征矢
量序列X = (X15X2,目對(duì)應(yīng)的狀態(tài)序列是5^ =Pxi + ,··_、},所述參數(shù)集中的λ Y
對(duì)應(yīng)于目標(biāo)說(shuō)話人的隱馬爾科夫模型,在模型訓(xùn)練過(guò)程中,與目標(biāo)說(shuō)話人的特征矢量序列
htun,··.A I相對(duì)應(yīng)的狀態(tài)序列是·=Pw 第三步,求解Sy在具有最大聯(lián)合概率P (Y,SY,X,Sx I λ)時(shí)的隱狀態(tài)序列對(duì)(Κ,Ο,用公式表示為;
權(quán)利要求
1.一種面向多時(shí)間尺度韻律特征的語(yǔ)音轉(zhuǎn)換方法,其特征在于,包括訓(xùn)練階段和轉(zhuǎn)換階段,其中所述訓(xùn)練階段包括如下步驟步驟A,語(yǔ)音信號(hào)預(yù)處理對(duì)目標(biāo)說(shuō)話人和源說(shuō)話人輸入的語(yǔ)音信號(hào),分別依次進(jìn)行預(yù)加重、分幀和加窗處理;步驟B,語(yǔ)音特征矢量提取,所述語(yǔ)音特征矢量包括語(yǔ)音頻譜特征和多時(shí)間尺度韻律特征,其中所述多時(shí)間尺度韻律特征包括短語(yǔ)尺度下的韻律特征、音節(jié)尺度下的韻律特征、語(yǔ)句尺度下的韻律特征,具體提取步驟如下對(duì)步驟A預(yù)處理后的源說(shuō)話人和目標(biāo)說(shuō)話人的語(yǔ)音信號(hào)分別進(jìn)行時(shí)域參數(shù)分析提取, 得到源說(shuō)話人和目標(biāo)說(shuō)話人在音節(jié)尺度、語(yǔ)句尺度下的韻律特征;同時(shí)對(duì)步驟A預(yù)處理后的源說(shuō)話人和目標(biāo)說(shuō)話人的語(yǔ)音信號(hào)基于諧波加噪聲模型進(jìn)行分解,求取語(yǔ)音信號(hào)的諧波成分和噪聲成分,然后對(duì)諧波加噪聲模型的參數(shù)進(jìn)一步降維與量化,最終分別得到源說(shuō)話人和目標(biāo)說(shuō)話人的語(yǔ)音信號(hào)的語(yǔ)音頻譜特征、短語(yǔ)尺度下的韻律特征;步驟C,根據(jù)步驟B得到的源說(shuō)話人、目標(biāo)說(shuō)話人的語(yǔ)音信號(hào)的多時(shí)間尺度韻律特征, 對(duì)于每一個(gè)時(shí)間尺度下的源說(shuō)話人、目標(biāo)說(shuō)話人的韻律特征,分別采用雙隱馬爾科夫模型進(jìn)行建模,進(jìn)行動(dòng)態(tài)特性和統(tǒng)計(jì)特性的分析,實(shí)現(xiàn)各時(shí)間尺度下的韻律特征的轉(zhuǎn)換;步驟D,根據(jù)步驟B得到的源說(shuō)話人、目標(biāo)說(shuō)話人的語(yǔ)音信號(hào)的語(yǔ)音頻譜特征,采用聯(lián)合高斯混合模型進(jìn)行建模,實(shí)現(xiàn)頻譜特征的轉(zhuǎn)換;所述轉(zhuǎn)換階段包括如下步驟步驟E,輸入源說(shuō)話人新的語(yǔ)音,對(duì)源說(shuō)話人輸入的新的語(yǔ)音信號(hào)依次進(jìn)行步驟A所述的語(yǔ)音信號(hào)預(yù)處理和步驟B所述的語(yǔ)音特征矢量提取操作,得到源說(shuō)話人新的語(yǔ)音信號(hào)的頻譜特征和多時(shí)間尺度韻律特征;步驟F,對(duì)步驟E得到的源說(shuō)話人新的語(yǔ)音信號(hào)的每個(gè)時(shí)間尺度韻律特征,采用上述步驟C得到的該時(shí)間尺度下的雙隱馬爾科夫模型分別進(jìn)行語(yǔ)音韻律特征轉(zhuǎn)換;步驟G,對(duì)步驟E得到的源說(shuō)話人新的語(yǔ)音信號(hào)的頻譜特征,采用上述步驟D得到的高斯混合模型進(jìn)行語(yǔ)音頻譜轉(zhuǎn)換,得到轉(zhuǎn)換后的目標(biāo)說(shuō)話人的頻譜特征;步驟H,對(duì)步驟F和G轉(zhuǎn)換后的語(yǔ)音韻律特征和頻譜特征經(jīng)過(guò)諧波加噪聲模型進(jìn)行合成,最終得到轉(zhuǎn)換后的語(yǔ)音。
2.根據(jù)權(quán)利要求1所述的面向多時(shí)間尺度韻律特征的語(yǔ)音轉(zhuǎn)換方法,其特征在于,所述步驟A的預(yù)處理步驟中,所述預(yù)加重處理的預(yù)加重系數(shù)為O. 96,分幀處理按20ms分幀,所述加窗處理采用漢明窗進(jìn)行加窗處理。
3.根據(jù)權(quán)利要求1所述的面向多時(shí)間尺度韻律特征的語(yǔ)音轉(zhuǎn)換方法,其特征在于,所述步驟B的多時(shí)間尺度韻律特征具體提取步驟如下B-1,對(duì)短語(yǔ)尺度下的韻律特征,采用矢量量化對(duì)經(jīng)過(guò)諧波加噪聲模型分解后得到的基頻軌跡進(jìn)行碼本量化,結(jié)合整個(gè)語(yǔ)句中的最大基頻,最小基頻& \\以及基頻平均值 。一起構(gòu)成短語(yǔ)尺度下的韻律特征;B-2,對(duì)音節(jié)尺度下的韻律特征、語(yǔ)句尺度下的韻律特征,i,對(duì)音節(jié)尺度下的韻律特征,對(duì)于語(yǔ)音信號(hào),選用時(shí)長(zhǎng)結(jié)合標(biāo)注音節(jié)的短時(shí)均方能量參數(shù)RMSs來(lái)描述,所述時(shí)長(zhǎng)采用標(biāo)注音節(jié)的持續(xù)采樣點(diǎn)數(shù){Ds,s=l, 2,…S}來(lái)描述,其中s 表示語(yǔ)句中S個(gè)音節(jié)中的第s個(gè)音節(jié),s、S均為正整數(shù);考慮到相鄰音節(jié)之間的動(dòng)態(tài)特性, 將當(dāng)前音節(jié)與下一音節(jié)參數(shù)之間的差值Λ D=Dp1-Ds作為補(bǔ)充特征,并且加入整句中音節(jié)持續(xù)時(shí)長(zhǎng)的平均值A(chǔ)VGd和音節(jié)能量的平均值A(chǔ)VGkms構(gòu)成聯(lián)合特征;ii,對(duì)語(yǔ)句尺度下的韻律特征,采用整個(gè)語(yǔ)句的逐幀有效聲壓級(jí)值的量化碼本來(lái)表征, 所述的逐幀有效聲壓級(jí)值根據(jù)公式SPLt=20XlOg(RMSt/(2X10_5))計(jì)算,其中RMSt表示語(yǔ)句中第t幀的短時(shí)均方能量。
4.根據(jù)權(quán)利要求1所述的面向多時(shí)間尺度韻律特征的語(yǔ)音轉(zhuǎn)換方法,其特征在于,步驟C所述每一時(shí)間尺度下的源說(shuō)話人、目標(biāo)說(shuō)話人的韻律特征的轉(zhuǎn)換,具體實(shí)現(xiàn)過(guò)程如下第一步,首先采用動(dòng)態(tài)時(shí)間規(guī)整算法對(duì)源說(shuō)話人的該時(shí)間尺度韻律特征參數(shù)和目標(biāo)說(shuō)話人的該時(shí)間尺度韻律特征參數(shù)進(jìn)行對(duì)齊操作,所述的源說(shuō)話人的該時(shí)間尺度韻律特征參數(shù)用Z = Iiz2,…,七,…·^—}表示,目標(biāo)說(shuō)話人的該時(shí)間尺度韻律特征參數(shù)用F = P1,凡,…,I…,3 I表示,其中=T5^P Ty分別表示源說(shuō)話人和目標(biāo)說(shuō)話人語(yǔ)音信號(hào)在該時(shí)間尺度下韻律特征總的幀數(shù),Xt和yt分別表示源說(shuō)話人和目標(biāo)說(shuō)話人語(yǔ)音信號(hào)在該時(shí)間尺度下的第t幀韻律特征參數(shù);第二步,采用期望最大化算法訓(xùn)練雙隱馬爾科夫模型參數(shù)集λ={λχ,λγ},所述參數(shù)集中的λ χ對(duì)應(yīng)于源說(shuō)話人的隱馬爾科夫模型,在模型訓(xùn)練過(guò)程中,與源說(shuō)話人的特征矢量序列Z-“,·^, , ^ ^1相對(duì)應(yīng)的狀態(tài)序列是5'1 =| ,···5·Χ2^,所述參數(shù)集中的λ Y 對(duì)應(yīng)于目標(biāo)說(shuō)話人的隱馬爾科夫模型,在模型訓(xùn)練過(guò)程中,與目標(biāo)說(shuō)話人的特征矢量序列 F = ,>,2,…,JV · ·,>Vr I相對(duì)應(yīng)的狀態(tài)序列是& =…^ ;第三步,求解Sjp Sy在具有最大聯(lián)合概率P (Y,Sy, X,Sx I λ )時(shí)的隱狀態(tài)序列對(duì)(K, , 用公式表示為;
5.根據(jù)權(quán)利要求1所述的面向多時(shí)間尺度韻律特征的語(yǔ)音轉(zhuǎn)換方法,其特征在于,所述步驟F對(duì)每一個(gè)時(shí)間尺度下的韻律特征進(jìn)行轉(zhuǎn)換的具體實(shí)現(xiàn)過(guò)程如下第一步,在轉(zhuǎn)換階段,對(duì)源說(shuō)話人新輸入的語(yǔ)音信號(hào)在該時(shí)間尺度下的韻律特征 X= Ix1, X2,-,xt,…χτ},其中下標(biāo)T表示源說(shuō)話人新輸入的語(yǔ)音信號(hào)在該時(shí)間尺度下的韻律特征總的幀數(shù),t=l,2,···,Τ,基于源說(shuō)話人的隱馬爾科夫模型λ X得到相對(duì)應(yīng)的狀態(tài)序列 Sx;第二步,對(duì)于源說(shuō)話人新輸入的在該時(shí)間尺度下的第t幀韻律特征向量Xt,在隱狀態(tài) K 時(shí),根據(jù)訓(xùn)練階段得到的轉(zhuǎn)換函數(shù)求解預(yù)估計(jì)變量丸,
全文摘要
本發(fā)明公開了一種面向多時(shí)間尺度韻律特征的語(yǔ)音轉(zhuǎn)換方法,屬于語(yǔ)音信號(hào)處理技術(shù)領(lǐng)域。該方法首先對(duì)語(yǔ)音信號(hào)進(jìn)行多時(shí)間尺度下的韻律特征分析與參數(shù)化提取,其次基于雙隱馬爾科夫模型對(duì)提取的多時(shí)間尺度韻律特征建立轉(zhuǎn)換模型;最后在轉(zhuǎn)換階段,形成目標(biāo)說(shuō)話人的估計(jì)特征,得到轉(zhuǎn)換后的語(yǔ)音。本發(fā)明不僅能夠?qū)崿F(xiàn)對(duì)韻律特性從整體到局部細(xì)致完整的刻畫,克服韻律信息表述的模糊性和復(fù)雜性,而且通過(guò)時(shí)序性統(tǒng)計(jì)模型的建立,實(shí)現(xiàn)多時(shí)間尺度的韻律特征轉(zhuǎn)換,增強(qiáng)轉(zhuǎn)換語(yǔ)音的說(shuō)話人個(gè)性信息,同時(shí)提高轉(zhuǎn)換語(yǔ)音的可懂度和自然度。
文檔編號(hào)G10L15/02GK103021418SQ20121053874
公開日2013年4月3日 申請(qǐng)日期2012年12月13日 優(yōu)先權(quán)日2012年12月13日
發(fā)明者李燕萍, 張玲華 申請(qǐng)人:南京郵電大學(xué)
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1