技術(shù)總結(jié)
本發(fā)明公開了用于將文字轉(zhuǎn)換為具有情感內(nèi)容的語音的技術(shù)。在一個(gè)方面中,使用中性模型針對腳本預(yù)測情感中性聲軌跡,并且使用情感特有模型獨(dú)立地預(yù)測情感特有聲軌跡調(diào)整。中性軌跡和情感特有調(diào)整被組合來生成具有情感內(nèi)容的變換語音輸出。在另一方面中,通過根據(jù)語境和狀態(tài)變化的情感特有因子來變換用于中性聲音的統(tǒng)計(jì)參數(shù)模型的狀態(tài)參數(shù)。情感依賴調(diào)整因子可以使用情感特有判定樹或者不同于判定樹的用于中性聲音模型的其他集群方案來進(jìn)行集群和存儲。
技術(shù)研發(fā)人員:欒劍;何磊;M·梁
受保護(hù)的技術(shù)使用者:微軟技術(shù)許可有限責(zé)任公司
文檔號碼:201580048224
技術(shù)研發(fā)日:2015.09.07
技術(shù)公布日:2017.05.17