專利名稱:聲音合成方法和裝置、詞典構(gòu)筑方法和計(jì)算機(jī)可讀媒體的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及適用于視頻游戲等的聲音合成方法、用于聲音合成的詞典構(gòu)筑方法、聲音合成裝置及記錄聲音合成程序的計(jì)算機(jī)可讀媒體。
近年來,隨著電話報(bào)時(shí)、銀行ATM聲音引導(dǎo)之類需反復(fù)輸出聲音信息(人所講的言詞)的服務(wù)的普及和各種電氣制品等人機(jī)界面要求的提高,希望由機(jī)械輸出聲音信息的需求增大。
作為以往輸出聲音信息的方法,有一種真人朗讀預(yù)定的引導(dǎo)詞或文章并把它預(yù)先存儲(chǔ)在存儲(chǔ)裝置中,然后在所需場(chǎng)面原樣重現(xiàn)加以輸出的方法(下文稱為記錄重現(xiàn)法)。還有一種在存儲(chǔ)裝置中存儲(chǔ)與構(gòu)成聲音信息的各種詞對(duì)應(yīng)的聲音數(shù)據(jù),然后根據(jù)任意輸入的字符串(文本),組合該聲音數(shù)據(jù)加以輸出的方法(所謂聲音合成方法)。
在上述記錄重現(xiàn)方法中,可輸出高品質(zhì)的聲音信息。但另一方面,也有不能輸出確定的引導(dǎo)詞和文章以外的聲音信息,而且需要容量與引導(dǎo)詞和文章數(shù)量成比例的存儲(chǔ)裝置這些缺陷。
另一方面,在聲音合成方法中,可輸出對(duì)應(yīng)于任意輸入的字符串,即對(duì)應(yīng)于任意詞的聲音信息,且與上述記錄重現(xiàn)方法相比,其需要的存儲(chǔ)容量也小。但是,存在有些字符串變成留有不自然感的聲音信息這樣的缺陷。
可是,在近來視頻游戲中,隨著游戲機(jī)主體性能的提高和存儲(chǔ)媒體存儲(chǔ)容量的增加,游戲中登場(chǎng)角色的聲音信息與BGM和效果音一起輸出的可能性增大。
這時(shí),在視頻游戲這種娛樂性高的場(chǎng)合,強(qiáng)烈希望每個(gè)游戲角色輸出音質(zhì)不同的聲音信息,而且輸出反映講話時(shí)感性、狀況的聲音信息。進(jìn)而,也迫切希望由游戲角色念游戲者任意輸入、設(shè)定的游戲者角色姓名(稱呼)。
如果要用上述的記錄重現(xiàn)方法實(shí)現(xiàn)適合上述希望的聲音信息輸出,則必須對(duì)游戲者任意輸入、設(shè)定的游戲者角色姓名(稱呼)這種遍及幾千至幾萬詞全部進(jìn)行聲音收錄、重現(xiàn)。為此,收錄所需時(shí)間和費(fèi)用、必需的存儲(chǔ)裝置容量變得十分龐大,事實(shí)上,不可能實(shí)施。
另一方面,用聲音合成方法,任意輸入、設(shè)定的游戲者角色姓名發(fā)聲比較容易。但,以往的聲音合成方法僅以產(chǎn)生明了的自然聲音信息為目標(biāo),因而根本不能合成與講話人的個(gè)性、講話時(shí)的感性和狀況相應(yīng)的聲音信息,即不能根據(jù)每個(gè)游戲角色輸出音質(zhì)不同的聲音信息,不能輸出反映游戲角色的感情、狀況的聲音信息。
本發(fā)明的目的在于提供一種適合視頻游戲這種娛樂性高的用途且能產(chǎn)生與講話者的個(gè)性、講話時(shí)的感情和狀況或各種講話內(nèi)容相應(yīng)的聲音信息的聲音合成方法,用于聲音合成的詞典構(gòu)筑方法,聲音合成裝置及記錄聲音合成程序的計(jì)算機(jī)可讀媒體。
為了達(dá)到上述目的,本發(fā)明的一種采用單詞詞典、韻律詞典和波形詞典生成聲音信息的聲音合成方法,該方法包括下述步驟設(shè)定講話者或講話時(shí)感情、狀況或講話內(nèi)容中至少一個(gè)不同的多個(gè)聲音合成處理作業(yè)單位(下文稱為任務(wù));至少構(gòu)筑與各任務(wù)對(duì)應(yīng)的韻律詞典和波形詞典;在與任務(wù)指定的同時(shí)輸入要合成的字符串時(shí),用與該任務(wù)對(duì)應(yīng)的單詞詞典、韻律詞典和波形詞典進(jìn)行聲音合成處理。
根據(jù)本發(fā)明,聲音合成處理分成多個(gè)講話者,講話時(shí)的多個(gè)感情、狀況,多個(gè)講話內(nèi)容等任務(wù),每個(gè)任務(wù)構(gòu)筑詞典進(jìn)行聲音合成,因此易于產(chǎn)生與講話者個(gè)性、講話時(shí)的感情與狀況、講話內(nèi)容對(duì)應(yīng)的聲音信息。
上述多個(gè)任務(wù)中的每個(gè)任務(wù)的詞典,由下述步驟構(gòu)筑生成與任務(wù)對(duì)應(yīng)的單詞詞典;從單詞詞典的全部單詞中選出可成為模型的字符串生成聲音收錄腳本;按照聲音收錄腳本收錄講話者的聲音;由所述收錄的聲音構(gòu)筑韻律詞典和波形詞典;對(duì)各任務(wù)進(jìn)行上述步驟。
上述每個(gè)任務(wù)的詞典由下述步驟構(gòu)筑生成與任務(wù)對(duì)應(yīng)的單詞詞典和單詞變形現(xiàn)則;按照與所述任務(wù)對(duì)應(yīng)的單詞變形規(guī)則,對(duì)與任務(wù)對(duì)應(yīng)的單詞詞典中包含的全部單詞進(jìn)行變形處理;從經(jīng)變形處理的單詞詞典中的全部單詞選出可成為模型的字符串生成聲音收錄腳本;根據(jù)聲音收錄腳本收錄講話者的聲音;從所述收錄的聲音構(gòu)筑韻律詞典和波形詞典;對(duì)各任務(wù)進(jìn)行上述步驟。
每個(gè)上述任務(wù)的詞典由下述步驟構(gòu)筑生成與任務(wù)對(duì)應(yīng)的單詞變形規(guī)則;按照與任務(wù)對(duì)應(yīng)的單詞變形規(guī)則,對(duì)單詞詞典所包含的全部單詞進(jìn)行變形處理;從經(jīng)變形處理的單詞詞典中的全部單詞選出可成為模型的字符串生成聲音收錄腳本;根據(jù)聲音收錄腳本收錄講話者的聲音;從所述收錄的聲音構(gòu)筑韻律詞典和波形詞典;對(duì)各任務(wù)進(jìn)行上述步驟。
根據(jù)本發(fā)明,可簡(jiǎn)單生成與任務(wù)相應(yīng)的聲音收錄腳本,根據(jù)該腳本收錄聲音構(gòu)筑各詞典,進(jìn)行字符串變形處理,由此,可不增加詞典容量,易于生成含多樣表現(xiàn)內(nèi)容的聲音信息。
采用這些詞典的聲音合成方法包括下述步驟根據(jù)與要合成的字符串一起輸入的任務(wù)指定,切換單詞詞典、韻律詞典和波形詞典;采用切換后的單詞詞典、韻律詞典和波形詞典,對(duì)與要合成的字符串對(duì)應(yīng)的聲音信息進(jìn)行合成處理。
這時(shí),在各詞典是收錄許多至少含一個(gè)字符的單詞及其語調(diào)類型的單詞詞典、收錄表示對(duì)收錄于所述單詞詞典中的單詞的韻律的韻律模型數(shù)據(jù)中的代表性韻律數(shù)據(jù)的韻律詞典、把收錄聲音作為合成單位的聲音數(shù)據(jù)加以收錄的波形詞典時(shí),該聲音合成處理包括下述步驟從單詞詞典判定要合成的字符串的語調(diào)類型;根據(jù)要合成的字符串與語調(diào)類型,從韻律詞典選擇韻律模型數(shù)據(jù);根據(jù)選擇的韻律模型數(shù)據(jù),從波形詞典選擇與要合成的字符串各字符對(duì)應(yīng)的波形數(shù)據(jù);相互連接所述選擇的波形數(shù)據(jù)。
采用這些詞典的另一聲音合成方法,包括下述步驟根據(jù)與要合成的字符串一起輸入的任務(wù)指定,切換單詞詞典、韻律詞典、波形詞典和單詞變形規(guī)則;按照單詞變形規(guī)則對(duì)要合成的字符串進(jìn)行變形處理;采用切換后的單詞詞典、韻律詞典和波形詞典對(duì)與變形處理后的字符串對(duì)應(yīng)的聲音信息進(jìn)行合成處理。
采用這些詞典的另一聲音合成方法,包括下述步驟根據(jù)與要合成的字符串一起輸入的任務(wù)指定,切換韻律詞典、波形詞典和單詞變形規(guī)則;按照單詞變形規(guī)則對(duì)要合成的字符進(jìn)行變形處理;采用單詞詞典、切換后的韻律詞典和波形詞典,對(duì)與變形處理后的字符串對(duì)應(yīng)的聲音信息進(jìn)行合成處理。
這時(shí),在各詞典是收錄許多至少含一個(gè)字符的單詞及其語詞類型的單詞詞典、收錄表示對(duì)收錄于所述單詞詞典中的單詞的韻律的韻律模型數(shù)據(jù)中的代表性韻律數(shù)據(jù)的韻律詞典、把收錄聲音作為合成單位的聲音數(shù)據(jù)加以收錄的波形詞典且單詞變形規(guī)則是收錄字符串變形規(guī)則的單詞變形規(guī)則時(shí),該聲音合成處理包括下述步驟從單詞詞典或單詞變形規(guī)則判定要合成的字符串的語調(diào)類型;根據(jù)要合成的字符串與語調(diào)類型,從韻律詞典選擇韻律模型數(shù)據(jù);根據(jù)選擇的韻律模型數(shù)據(jù),從波形詞典選擇與要合成的字符串的各字符對(duì)應(yīng)的波形數(shù)據(jù);相互連接所述選擇的波形數(shù)據(jù)。
采用上述詞典的聲音合成裝置包括根據(jù)與要合成的字符串一起輸入的任務(wù)指定,切換單詞詞典、韻律詞典和波形詞典的手段;采用切換后的單詞詞典、韻律詞典和波形詞典,對(duì)與要合成的字符串對(duì)應(yīng)的聲音信息進(jìn)行合成處理的手段。
采用上述詞典的另一聲音合成裝置包括根據(jù)與要合成的字符串一起輸入的任務(wù)指定,切替單詞詞典、韻律詞典、波形詞典和單詞變形規(guī)則的手段;按照單詞變形規(guī)則對(duì)要合成的字符串進(jìn)行變形處理的手段;采用切換后的單詞詞典、韻律詞典和波形詞典,對(duì)與變形處理后的字符串對(duì)應(yīng)的聲音信息進(jìn)行合成處理的手段。
采用上述詞典的另一聲音合成裝置包括根據(jù)與要合成的字符串一起輸入的任務(wù)指定,切換韻律詞典、波形詞典和單詞變形規(guī)則的手段;按照單詞變形規(guī)則對(duì)要合成的字符串進(jìn)行變形處理的手段;采用單詞詞典、切換后的韻律詞典和波形詞典對(duì)與變形處理后的字符串對(duì)應(yīng)的聲音信息進(jìn)行合成處理的手段。
上述聲音合成裝置通過一種記錄聲音合成程序的計(jì)算機(jī)可讀媒體加以實(shí)現(xiàn),該媒體在所述程序被計(jì)算機(jī)讀取時(shí),使該計(jì)算機(jī)在功能上包括下述手段與講話者或講話時(shí)的感情、狀況或講話內(nèi)容中至少一個(gè)不同的多個(gè)聲音合成處理任務(wù)分別對(duì)應(yīng)的單詞詞典、韻律詞典和波形詞典;根據(jù)與要合成的字符串一起輸入的任務(wù)指定切換單詞詞典、韻律詞典和波形詞典的手段;采用切換后的單詞詞典、韻律詞典和波形詞典對(duì)與要合成的字符串對(duì)應(yīng)的聲音信息進(jìn)行合成處理的手段。
上述聲音合成裝置通過一種記錄聲音合成程序的計(jì)算機(jī)可讀媒體加以實(shí)現(xiàn),該媒體在所述程序被計(jì)算機(jī)讀取時(shí),使該計(jì)算機(jī)在功能上包括下述手段與講話者或講話時(shí)的感情、狀況或進(jìn)話內(nèi)容中至少一個(gè)不同的多個(gè)聲音合成處理任務(wù)分別對(duì)應(yīng)的單詞詞典、韻律詞典、波形詞典和單詞變形規(guī)則;根據(jù)與要合成的字符串一起輸入的任務(wù)指定,切換單詞詞典、韻律詞典、波形詞典和單詞變形規(guī)則的手段;按照單詞變形規(guī)則對(duì)要合成的字符串進(jìn)行變形處理的手段;采用切換后的單詞詞典、韻律詞典和波形詞典對(duì)與變形處理后的字符串對(duì)應(yīng)的聲音信息進(jìn)行合成處理的手段。
上述聲音合成裝置通過一種記錄聲音合成程序的計(jì)算機(jī)可讀媒體加以實(shí)現(xiàn),該媒體在所述程序被計(jì)算機(jī)讀取時(shí),使該計(jì)算機(jī)在功能上包括下述手段單詞詞典、及與講話者或講話時(shí)的感情、狀態(tài)之一不同的多個(gè)聲音合成處理任務(wù)分別對(duì)應(yīng)的韻律詞典、波形詞典和單詞變形規(guī)則;根據(jù)與要合成的字符串一起輸入的任務(wù)指定切換韻律詞典、波形詞典和單詞變形規(guī)則的手段;按照單詞變形規(guī)則對(duì)要合成的字符串進(jìn)行變形處理的手段;采用單詞詞典、切換后的韻律詞典和波形詞典,對(duì)與變形處理后的字符串對(duì)應(yīng)的聲音信息進(jìn)行合成處理的手段。
通過以下說明及附圖,本發(fā)明的上述和其它目的、特征、優(yōu)點(diǎn)會(huì)變得更為明了。
圖1是整體表示本發(fā)明聲音合成方法的流程圖。
圖2是任務(wù)說明圖。
圖3是具體任務(wù)一個(gè)例子的示圖。
圖4是表示本發(fā)明用于聲音合成的詞典構(gòu)筑方法的流程圖。
圖5是單詞變形規(guī)則一個(gè)例子示圖。
圖6是選出的字符串一個(gè)例子示圖。
圖7是根據(jù)單詞詞典、單詞變形規(guī)則、字符串選出規(guī)則產(chǎn)生聲音收錄腳本的情況的一個(gè)例子示圖。
圖8是表示本發(fā)明聲音合成方法的流程圖。
圖9是本發(fā)明聲音合成裝置的功能框圖。
下面敘述本發(fā)明的最佳實(shí)施例。
圖1是表示本發(fā)明的聲音合成方法(含用于聲音合成的詞典構(gòu)筑的廣義聲音合成方法)的整體流程圖。
首先,設(shè)定多個(gè)聲音合成處理任務(wù),這些任務(wù)中講話者或講話時(shí)的感情、狀況或講話內(nèi)容中至少有一個(gè)不同(S1)。根據(jù)聲音合成目的由手工操作進(jìn)行該作業(yè)。
圖2用于說明任務(wù),圖1,A1、A2、A3表示多個(gè)不同講話者,B1、B2、B3表示多個(gè)不同感情、狀況,C1、C2、C3表示多個(gè)不同講話內(nèi)容。這里,所謂講話內(nèi)容不僅表示單一的詞,還表示向?qū)Ψ秸泻舻脑~、高興時(shí)發(fā)出的言詞等根據(jù)一定定義的詞集合。
圖2中,講話者A1,在感情、狀況為B1時(shí)發(fā)表內(nèi)容為C1的講話這種情況(A1-B1-C1)為一個(gè)任務(wù)。講話者A1在感情、狀況為B2時(shí)發(fā)表內(nèi)容C1的講話這種情況(A1-B2-C1)為另一個(gè)任務(wù)。同樣,講話者A2在感情、狀況為B1時(shí)發(fā)表內(nèi)容為C2的講話這種情況(A2-B1-C2),講話者A2在感情、狀況為B2時(shí)發(fā)表內(nèi)容為C3的講話這種情況(A2-B2-C3),講話者A3在感情、狀況為B3時(shí)發(fā)表內(nèi)容為C2的講話這種情況(A3-B3-C2)各自為另一任務(wù)。
這里,常常不必設(shè)定包羅全部多個(gè)講話者、多種講話時(shí)感情,狀況、多種講話內(nèi)容的任務(wù)。即,即使如果對(duì)講話者A1設(shè)定感情、狀況B1,B2,B3且對(duì)感情、狀況B1,B2,B3各自設(shè)定講話內(nèi)容C1、C2、C3,設(shè)定全部9種任務(wù),有時(shí)對(duì)講話者A2也僅設(shè)定感情、狀況B1、B2,且對(duì)該感情、狀況B1僅設(shè)定講話內(nèi)容C1、C2,對(duì)感情、狀況B2僅設(shè)定講話內(nèi)容C3,即僅全部設(shè)定3種任務(wù)。設(shè)定怎樣的任務(wù)根據(jù)聲音合成目的任意決定。
雖然這里講話者、講話時(shí)的感情、狀況及講話內(nèi)容均以多個(gè)進(jìn)行說明,但也可按照聲音合成的目的,把其中任1或2項(xiàng)限定為一種設(shè)定任務(wù)。
圖3表示具體任務(wù)的一個(gè)例子,這里以視頻游戲中合成游戲角色的聲音信息為例,尤其表示講話內(nèi)容僅限于對(duì)游戲者角色的招呼這一例子。
在圖3中,對(duì)名為“黑卡利(ひカリ)”的講話者(游戲角色)設(shè)定“幼年時(shí)的普通招呼”、“成為高中生時(shí)的普通招呼”、“成為高中生時(shí)電話中的普通招呼”、“自白、重逢時(shí)富感情的招呼”這4種感情、狀況,這些分別設(shè)定作為任務(wù)1、2、3、4。對(duì)名為“阿卡奈(ぁカね)”的講話者設(shè)定“普通招呼”、“電話中普通招呼”,“自白、放學(xué)時(shí)親切的招呼”這3種感情、狀況,這些分別設(shè)定作為任務(wù)5、6、7。
各任務(wù)中的信息例子示出附加后述的每個(gè)任務(wù)的單詞變形處理后的例子。圖中“奇亞恩(ちゃん)”、“庫恩(くん)(君)”是日語中的敬稱。
然后,對(duì)每個(gè)如上所述設(shè)定的任務(wù)構(gòu)筑聲音合成所必需的詞典,即單詞詞典、韻律詞典和波形詞典(S2)。
這里,所謂單詞詞典是指收錄許多包含至少一個(gè)字符的單詞及其語調(diào)類型的部分,若以例如圖3中說明的任務(wù)而言,單詞詞典是收錄預(yù)想輸入的許多表示游戲者角色姓名的單詞及其語調(diào)類型的部分。所謂韻律詞典是指收錄韻律模型數(shù)據(jù)中代表性的韻律模型數(shù)據(jù)的部分,該韻律模型數(shù)據(jù)對(duì)收錄于單詞詞典的單詞表示韻律。所謂波形詞典是指把收錄聲音作為合成單位的聲音數(shù)據(jù)(音素片)加以收錄的部分。
如果加以后文所述的單詞變形處理,則講話者或感情、狀況不同的任務(wù)可共用單詞詞典,特別如果講話內(nèi)容限定一種,則可僅為一個(gè)單詞詞典。
通過未圖示的輸入手段和游戲系統(tǒng)等,輸入要合成的字符串和指定任務(wù)時(shí),采用與該任務(wù)對(duì)應(yīng)的單詞詞典、韻律詞典及波形詞典進(jìn)行聲音合成處理(S3)。
圖4是表示用于本發(fā)明聲音全成的詞典構(gòu)筑方法的流程圖。
首先,用手工操作生成與上述設(shè)定的多個(gè)任務(wù)的講話者,講話時(shí)的感情、狀況,講話內(nèi)容相應(yīng)的單詞詞典(S21)。這時(shí),根據(jù)需要,產(chǎn)生單詞變形規(guī)則(S22)。
這里,所謂單詞變形規(guī)則是確定把收錄于單詞詞典的單詞變換處理成與講話者或感情、狀況不同的任務(wù)所對(duì)應(yīng)的單詞的規(guī)則。通過該變換處理,如上所述,可把一個(gè)單詞詞典作為與講話者或感情狀況不同的任務(wù)虛擬對(duì)應(yīng)的多個(gè)單詞詞典使用。
圖5表示單詞變形規(guī)則的一個(gè)例子,在這里表示與圖3中說明過的“任務(wù)5”對(duì)應(yīng)的變形規(guī)則,即從姓名(游戲者角色名)生成2拍(モ-ラ)(日文字母計(jì)數(shù)單位)外號(hào)名作為對(duì)游戲角色招呼時(shí)的規(guī)則為例子。
接著,從上述產(chǎn)生的單詞詞典或單詞詞典和單詞變形規(guī)則,選擇與某任務(wù)對(duì)應(yīng)的單詞詞典或單詞詞典和單詞變形規(guī)則(S23)。這對(duì),若有單詞變形規(guī)則就進(jìn)行單詞變形處理(S24)。
單詞變形處理,根據(jù)與任務(wù)對(duì)應(yīng)的單詞變形規(guī)則,對(duì)與該任務(wù)對(duì)應(yīng)的單詞詞典中所包含的全部單詞進(jìn)行變形處理。
對(duì)圖3、圖5的例子而言,這種處理是逐個(gè)取出收錄于單詞詞典的游戲角色名,若是2拍以上的通常名,則在最前面2拍所對(duì)應(yīng)的字符后附加“庫恩”;如果是1拍的名字,則在該1拍所對(duì)應(yīng)的字符上附加“-(長(zhǎng)音)”及“庫恩”;如果是其它特殊的名字,則附加長(zhǎng)音、促音、撥音等變形,生成外號(hào)名;或在生成外號(hào)名時(shí),還進(jìn)行使語調(diào)為第一拍升高等的對(duì)語調(diào)的變形處理。
接著,從收錄于上述單詞詞典的全部單詞中或?qū)χ右詥卧~變形處理的全部單詞中,根據(jù)字符串選出規(guī)則,選出字符串,生成聲音收錄腳本(S25)。
所謂字符串選出規(guī)則是從收錄于單詞詞典的全部單詞或?qū)χ郊訂卧~變形處理的全部單詞中選出可成為模型的字符串的規(guī)則。例如,在從上述收錄許多游戲者角色名的單詞詞典中,選出可成為模式的字符串,即選出名字時(shí),可采用(1)從1拍至6拍的名字,(2)至少采用一個(gè)每拍分別不同的語調(diào)類型的單詞。根據(jù)該規(guī)則選出的字符串的一個(gè)例子示于圖6。
單詞詞典所含的單詞,如果詞典產(chǎn)生時(shí)使講話內(nèi)容的定義越窄,則限定模式、類似度大的單詞越多。在單詞詞典中包含很多類似度大的單詞時(shí),向各單詞賦予表示其重要度、出現(xiàn)概率(頻度)的信息,把利用該信息的選擇基準(zhǔn)與上述拍數(shù)和指定的語調(diào)類型等一起包含在字符串選出規(guī)則中,由此,在聲音收錄腳本中,包含實(shí)際聲音合成中作為要合成的字符串輸入的字符串或與其類似的字符串的概率高,從而,可提高實(shí)際聲音合成的品位。
接著,按照如上所述生成的任務(wù)所對(duì)應(yīng)的聲音收錄腳本,收錄講話者的聲音(S26)。這時(shí)一種通常的工序在演播室邀請(qǐng)與任務(wù)相應(yīng)的講話者(配聲演員等)按照腳本講,用話筒收錄其聲音,記錄在錄音機(jī)中。
最后,由收錄的聲音構(gòu)筑韻律詞典和波形詞典(S27)。根據(jù)該收錄聲音構(gòu)筑詞典的詳細(xì)處理,不是本申請(qǐng)的對(duì)象,可照用公知的算法和處理方法,因而這里省略其說明。
對(duì)全部任務(wù)重復(fù)進(jìn)行上述處理(S28)。在如上所述,通過單詞變形處理,把一個(gè)單詞詞典作為與講話者或感情、狀況不同的任務(wù)虛擬對(duì)應(yīng)的多個(gè)單詞詞典處理時(shí),單詞詞典按原樣,僅對(duì)應(yīng)于單詞變形規(guī)則不同的任務(wù)進(jìn)行選擇。S24~S27的處理不必對(duì)每個(gè)任務(wù)全部順序進(jìn)行,也可同時(shí)并行進(jìn)行。
圖7示出一個(gè)例子根據(jù)與任務(wù)對(duì)應(yīng)的單詞變形規(guī)則,對(duì)收錄在預(yù)定任務(wù)所對(duì)應(yīng)的單詞詞典中的單詞進(jìn)行變形處理,進(jìn)而,產(chǎn)生按字符串選出規(guī)則選出并與預(yù)定任務(wù)對(duì)應(yīng)的聲音收錄腳本。
這里,單詞變形規(guī)則是圖3說明過的“任務(wù)2”所對(duì)應(yīng)的變形規(guī)則,即在名字(游戲角色名)上附加“庫恩”作為對(duì)游戲角色的招呼加以生成時(shí)的規(guī)則。字符串選擇規(guī)則是(1)變形后在3拍至8拍以內(nèi),(2)至少采用一個(gè)全部拍中每個(gè)均不同的語調(diào)類型的單詞,(3)出現(xiàn)概率高的詞優(yōu)先,(4)預(yù)定收錄在腳本中的字符串個(gè)數(shù)(超過該指定的時(shí)刻選擇結(jié)束)。
在本例中,雖然“阿基約希庫恩(ぁきょしくん)”、“姆茨約希庫恩(むフょしくん)”均是6拍,且同樣具有中間拍升高型語調(diào)類型(圖中實(shí)線所示),但“阿基約?!背霈F(xiàn)的概率高,因而選擇“阿基約希庫恩”,輸出至腳本。又,“沙愛摩恩扎部勞烏庫恩(さぇもんさぶろぅくん)”是10拍,因而不輸出至腳本。
在上述用于聲音合成的詞典構(gòu)筑方法中,包含人工操作的生成詞典及聲音收錄等現(xiàn)場(chǎng)作業(yè),因而不能通過裝置或程序來實(shí)現(xiàn)全部工序,但對(duì)于單詞變形工序、字符串選出工序,可通過按照各自規(guī)則進(jìn)行處理的裝置或程序來實(shí)現(xiàn)。
圖8是表示聲音合成方法(這里,是采用如上所述生成的每個(gè)任務(wù)的單詞詞典、韻律詞典和波形詞典,進(jìn)行實(shí)際聲音合成的狹義的聲音合成方法)的流程圖。
首先,當(dāng)通過沒有圖示的輸入手段和游戲系統(tǒng)等輸入要合成的字符串和指定任務(wù)時(shí),根據(jù)該指定的任務(wù),切換單詞詞典、韻律詞典和波形詞典,在詞典構(gòu)筑階段進(jìn)行單詞變形處理時(shí)還切換單詞變形規(guī)則(S31)。
接著,在詞典構(gòu)筑階段進(jìn)行單詞變形處理時(shí),按照上述切換的單詞變形規(guī)則,對(duì)要合成的字符串進(jìn)行單詞變形處理(S32)。這里所用的單詞變形規(guī)則,基本上按原樣使用詞典構(gòu)筑階段所用的規(guī)則。
接著,由單詞詞典或單詞變形規(guī)則判定要合成字符串的語調(diào)類型(S33)。具體而言,比較要合成的字符串與收錄在單調(diào)詞典的單詞,若是同一單詞,則采用其語調(diào)類型;若不是,則采用同一拍數(shù)的單詞中具有類似字符串的單詞的語調(diào)類型。在沒有同一單詞時(shí),操作者(游戲者)可從與要合成的字符串相同拍數(shù)的單詞中可出現(xiàn)的全部語調(diào)類型中,通過未圖示的輸入手段任意進(jìn)行選擇。
這時(shí),在上述單詞變形處理階段,對(duì)上述詞典構(gòu)筑中已說明的語調(diào)進(jìn)行變形處理時(shí),采用按照上述單詞變形規(guī)則的語調(diào)類型。
接著,根據(jù)要合成的字符串與語調(diào)類型,從韻律詞典選擇韻律模型數(shù)據(jù)(S34),根據(jù)選擇的韻律模型數(shù)據(jù),從波形詞典選擇與要合成的字符串的各字符對(duì)應(yīng)的波形數(shù)據(jù)(S35),該選擇的波形數(shù)據(jù)彼此連接(S36),生成合成聲音數(shù)據(jù)。
關(guān)于S34~S36的處理細(xì)節(jié),不是本申請(qǐng)的對(duì)象,可原樣采用公知的算法和處理方法,因而省略其說明。
圖9是本發(fā)明聲音合成裝置的功能框圖,圖中,11-1、11-2、……11-11是任務(wù)1、任務(wù)2……任務(wù)n所用的詞典,12-1、12-2、……12-n是任務(wù)1、任務(wù)2、……任務(wù)n所用變形規(guī)則,13是詞典、變形規(guī)則切換手段,14是單詞變形手段,15是語調(diào)類型判定手段,16是韻律模型選擇手段,17是波形選擇手段,18是波形連接手段。
任務(wù)1~任務(wù)n所用詞典11-1~11-n,分別是任務(wù)1~任務(wù)n用的單詞詞典、韻律詞典和波形詞典(的存儲(chǔ)部)。任務(wù)1~任務(wù)n用變形規(guī)則12-1~12-n分別是任務(wù)1~任務(wù)n用的單詞變形規(guī)則(的存儲(chǔ)部)。
詞典、變形規(guī)則切換手段13,根據(jù)與要合成的字符串一起輸入的指定任務(wù),切換使用的任務(wù)1~任務(wù)n用詞典11-1~11-n及任務(wù)1~任務(wù)n用變形規(guī)則12-1~12-n并分別選擇該詞典和規(guī)則中之一,向各部分提供。
單向變形手段14,按照上述選擇的單詞變形規(guī)則,對(duì)要合成的字符串進(jìn)行變形處理。語調(diào)類型判定手段15,根據(jù)選擇的單詞詞典或單詞變形規(guī)則,判定要合成的字符串的語調(diào)類型。
韻律模型選擇手段,根據(jù)要合成的字符串與語調(diào)類型,從選擇的韻律詞典選擇韻律模型數(shù)據(jù)。波形選擇手段17,根據(jù)選擇的韻律模擬數(shù)據(jù),從選擇的波形詞典選擇與要合成字符串的各字符對(duì)應(yīng)的波形數(shù)據(jù)。波形連接手段18相互連接選擇的波形數(shù)據(jù),生成合成聲音數(shù)據(jù)。
本說明書記載的最佳形態(tài)僅是例示,而不是用以限定。發(fā)明范圍由所附權(quán)利要求所示,落入該權(quán)利要求精神中的全部變形均包含在本發(fā)明中。
權(quán)利要求
1.一種采用單詞詞典、韻律詞典和波形詞典生成聲音信息的聲音合成方法,其特征在于,該方法包括下述步驟設(shè)定講話者或講話時(shí)感情、狀況或講話內(nèi)容中至少一個(gè)不同的多個(gè)聲音合成處理任務(wù);至少構(gòu)筑與各任務(wù)對(duì)應(yīng)的韻律詞典和波形詞典;在與任務(wù)指定的同時(shí)輸入要合成的字符串時(shí),用與該任務(wù)對(duì)應(yīng)的單詞詞典、韻律詞典和波形詞典進(jìn)行聲音合成處理。
2.一種用于聲音合成的詞典構(gòu)筑方法,是一種構(gòu)筑進(jìn)話者或講話時(shí)感情、狀況或講話內(nèi)容中至少一個(gè)不同的多個(gè)聲音合成處理任務(wù)各自對(duì)應(yīng)的單詞詞典、韻律詞典和波形詞典的詞典構(gòu)筑方法,其特征在于,該方法包括下述步驟生成與任務(wù)對(duì)應(yīng)的單詞詞典;從單詞詞典的全部單詞中選出可成為模型的字符串生成聲音收錄腳本;按照聲音收錄腳本收錄講話者的聲音;由所述收錄的聲音構(gòu)筑韻律詞典和波形詞典;對(duì)各任務(wù)進(jìn)行上述步驟。
3.一種用于聲音合成的詞典構(gòu)筑方法,是一種構(gòu)筑進(jìn)話者或講話時(shí)感情、狀況或講話內(nèi)容中至少一個(gè)不同的多個(gè)聲音合成處理任務(wù)各自對(duì)應(yīng)的單詞詞典、韻律詞典和波形詞典的詞典構(gòu)筑方法,其特征在于,該方法包括下述步驟生成與任務(wù)對(duì)應(yīng)的單詞詞典和單詞變形現(xiàn)則;按照與所述任務(wù)對(duì)應(yīng)的單詞變形規(guī)則,對(duì)與任務(wù)對(duì)應(yīng)的單詞詞典中包含的全部單詞進(jìn)行變形處理;從經(jīng)變形處理的單詞詞典中的全部單詞選出可成為模型的字符串生成聲音收錄腳本;根據(jù)聲音收錄腳本收錄講話者的聲音;從所述收錄的聲音構(gòu)筑韻律詞典和波形詞典;對(duì)各任務(wù)進(jìn)行上述步驟。
4.一種用于聲音合成的詞典構(gòu)筑方法,是一種構(gòu)筑單詞詞典、與講話者或講話時(shí)的感情、狀況之一不同的多個(gè)聲音合成處理任務(wù)分別對(duì)應(yīng)的韻律詞典和波形詞典的詞典構(gòu)筑方法,其特征在于,該方法包括下步驟生成與任務(wù)對(duì)應(yīng)的單詞變形規(guī)則;按照與任務(wù)對(duì)應(yīng)的單詞變形規(guī)則,對(duì)單詞詞典所包含的全部單詞進(jìn)行變形處理;從經(jīng)變形處理的單詞詞典中的全部單詞選出可成為模型的字符串生成聲音收錄腳本;根據(jù)聲音收錄腳本收錄講話者的聲音;從所述收錄的聲音構(gòu)筑韻律詞典和波形詞典;對(duì)各任務(wù)進(jìn)行上述步驟。
5.一種采用與講話者或講話時(shí)的感情、狀況或講話內(nèi)容中至少一個(gè)不同的多個(gè)聲音合成處理任務(wù)分別對(duì)應(yīng)的單詞詞典、韻律詞典和波形詞典進(jìn)行聲音合成的方法,其特征在于,該方法包括下述步驟根據(jù)與要合成的字符串一起輸入的任務(wù)指定,切換單詞詞典、韻律詞典和波形詞典;采用切換后的單詞詞典、韻律詞典和波形詞典,對(duì)與要合成的字符串對(duì)應(yīng)的聲音信息進(jìn)行合成處理。
6.如權(quán)利要求5所述的聲音合成方法,其特征在于,在各詞典是收錄許多至少含一個(gè)字符的單詞及其語調(diào)類型的單詞詞典、收錄表示對(duì)收錄于所述單詞詞典中的單詞的韻律的韻律模型數(shù)據(jù)中的代表性韻律數(shù)據(jù)的韻律詞典、把收錄聲音作為合成單位的聲音數(shù)據(jù)加以收錄的波形詞典時(shí),該聲音合成處理包括下述步驟從單詞詞典判定要合成的字符串的語調(diào)類型;根據(jù)要合成的字符串與語調(diào)類型,從韻律詞典選擇韻律模型數(shù)據(jù);根據(jù)選擇的韻律模型數(shù)據(jù),從波形詞典選擇與要合成的字符串各字符對(duì)應(yīng)的波形數(shù)據(jù);相互連接所述選擇的波形數(shù)據(jù)。
7.一種采用與講話者或講話時(shí)的感情、狀況或講話內(nèi)容中至少一個(gè)不同的多個(gè)聲音合成處理任務(wù)分別對(duì)應(yīng)的單詞詞典、韻律詞典和波形詞典及單詞變形規(guī)則進(jìn)行聲音合成的方法,其特征在于,該方法包括下述步驟根據(jù)與要合成的字符串一起輸入的任務(wù)指定,切換單詞詞典、韻律詞典、波形詞典和單詞變形規(guī)則;按照單詞變形規(guī)則對(duì)要合成的字符串進(jìn)行變形處理;采用切換后的單詞詞典、韻律詞典和波形詞典對(duì)與變形處理后的字符串對(duì)應(yīng)的聲音信息進(jìn)行合成處理。
8.如權(quán)利要求7所述的聲音合成方法,其特征在于,在各詞典是收錄許多至少含一個(gè)字符的單詞及其語調(diào)類型的單詞詞典、收錄表示對(duì)收錄于所述單詞詞典中的單詞的韻律的韻律模型數(shù)據(jù)中的代表性韻律數(shù)據(jù)的韻律詞典、把收錄聲音作為合成單位的聲音數(shù)據(jù)加以收錄的波形詞典時(shí),該聲音合成處理包括下述步驟從單詞詞典或單詞變形規(guī)則判定要合成的字符串的語調(diào)類型;根據(jù)要合成的字符串和語調(diào)類型,從韻律詞典選擇韻律模型數(shù)據(jù);根據(jù)選擇的韻律模型數(shù)據(jù),從波形詞典選擇與要合成的字符串的各字符對(duì)應(yīng)的波形數(shù)據(jù);相互連接所述選擇的波形數(shù)據(jù)。
9.一種采用單詞詞典、與講話者或講話時(shí)的感情、狀況之一不同的多個(gè)聲音合成處理任務(wù)分別對(duì)應(yīng)的韻律詞典、波形詞典和單詞變形規(guī)則的聲音合成方法,其特征在于,該方法包括下述步驟根據(jù)與要合成的字符串一起輸入的任務(wù)指定,切換韻律詞典、波形詞典和單詞變形規(guī)則;按照單詞變形規(guī)則對(duì)要合成的字符進(jìn)行變形處理;采用單詞詞典、切換后的韻律詞典和波形詞典,對(duì)與變形處理后的字符串對(duì)應(yīng)的聲音信息進(jìn)行合成處理。
10.如權(quán)利要求9所述的聲音合成方法,其特征在于,在各詞典是收錄許多至少含一個(gè)字符的單詞及其語調(diào)類型的單詞詞典、收錄表示對(duì)收錄于所述單詞詞典中的單詞的韻律的韻律模型數(shù)據(jù)中的代表性韻律數(shù)據(jù)的韻律詞典、把收錄聲音作為合成單位的聲音數(shù)據(jù)加以收錄的波形詞典且單詞變形規(guī)則是收錄字符串變形規(guī)則的單詞變形規(guī)則時(shí),該聲音合成處理包括下述步驟從單詞詞典或單詞變形規(guī)則判定要合成的字符串的語調(diào)類型;根據(jù)要合成的字符串與語調(diào)類型,從韻律詞典選擇韻律模型數(shù)據(jù);根據(jù)選擇的韻律模型數(shù)據(jù),從波形詞典選擇與要合成的字符串的各字符對(duì)應(yīng)的波形數(shù)據(jù);相互連接所述選擇的波形數(shù)據(jù)。
11.一種采用與講話者或講話時(shí)的感情、狀況或講話內(nèi)容中至少一個(gè)不同的多個(gè)聲音合成處理任務(wù)分別對(duì)應(yīng)的單詞詞典、韻律詞典和波形詞典的聲音合成裝置,其特征在于,它包括根據(jù)與要合成的字符串一起輸入的任務(wù)指定,切換單詞詞典、韻律詞典和波形詞典的手段;采用切換后的單詞詞典、韻律詞典和波形詞典,對(duì)與要合成的字符串對(duì)應(yīng)的聲音信息進(jìn)行合成處理的手段。
12.如權(quán)利要求11所述的聲音合成裝置,其特征在于,在各詞典是收錄許多至少含一個(gè)字符的單詞及其語調(diào)類型的單詞詞典、收錄表示對(duì)收錄于所述單詞詞典中的單詞的韻律的韻律模型數(shù)據(jù)中的代表性韻律數(shù)據(jù)的韻律詞典、把收錄聲音作為合成單位的聲音數(shù)據(jù)加以收錄的波形詞典時(shí),聲音合成處理手段包括由單詞詞典判定要合成字符串的語調(diào)類型的手段;根據(jù)要合成的字符串和語調(diào)類型,從韻律詞典選擇韻律模型數(shù)據(jù)的手段;根據(jù)選擇的韻律模型數(shù)據(jù),從波形詞典選擇與要合成的字符串的各字符對(duì)應(yīng)的波形數(shù)據(jù);相互連接所述選擇的波形數(shù)據(jù)的手段。
13.一種采用與講話者或講話時(shí)的感情、狀況或講話內(nèi)容中至少一個(gè)不同的多個(gè)聲音合成處理任務(wù)分別對(duì)應(yīng)的單詞詞典、韻律詞典和波形詞典及單詞變形規(guī)則的聲音合成裝置,其特征在于,它包括根據(jù)與要合成的字符串一起輸入的任務(wù)指定,切替單詞詞典、韻律詞典、波形詞典和單詞變形規(guī)則的手段;按照單詞變形規(guī)則對(duì)要合成的字符串進(jìn)行變形處理的手段;采用切換后的單詞詞典、韻律詞典和波形詞典,對(duì)與變形處理后的字符串對(duì)應(yīng)的聲音信息進(jìn)行合成處理的手段。
14.如權(quán)利要求13所述的聲音合成裝置,其特征在于,在各詞典是收錄許多至少含一個(gè)字符的單詞及其語調(diào)類型的單詞詞典、收錄表示對(duì)收錄于所述單詞詞典中的單詞的韻律的韻律模型數(shù)據(jù)中的代表性韻律數(shù)據(jù)的韻律詞典、把收錄聲音作為合成單位的聲音數(shù)據(jù)加以收錄的波形詞典且單詞變形規(guī)則是收錄字符串變形規(guī)則的單詞變形規(guī)則時(shí),聲音合成處理手段包括由單詞詞典或單詞變形規(guī)則判定要合成字符串的語調(diào)類型的手段;根據(jù)要合成字符串與語調(diào)類型,從韻律詞典選擇韻律模型數(shù)據(jù)的手段;根據(jù)選擇的韻律模型數(shù)據(jù),從波形詞典選擇與要合成字符串各字符對(duì)應(yīng)的波形數(shù)據(jù)的手段;相互連接所述選擇的波形數(shù)據(jù)的手段。
15.一種采用單詞詞典、與講話者或講話時(shí)的感情、狀況之一不同的多個(gè)聲音合成處理任務(wù)分別對(duì)應(yīng)的韻律詞典、波形詞典和單詞變形規(guī)則的聲音合成裝置,其特征在于,它包括根據(jù)與要合成的字符串一起輸入的任務(wù)指定,切換韻律詞典、波形詞典和單詞變形規(guī)則的手段;按照單詞變形規(guī)則對(duì)要合成的字符串進(jìn)行變形處理的手段;采用單詞詞典、切換后的韻律詞典和波形詞典對(duì)與變形處理后的字符串對(duì)應(yīng)的聲音信息進(jìn)行合成處理的手段。
16.如權(quán)利要求15所述的聲音合成裝置,其特征在于,在各詞典是收錄許多至少含一個(gè)字符的單詞及其語調(diào)類型的單詞詞典、收錄表示對(duì)收錄于所述單詞詞典中的單詞的韻律的韻律模型數(shù)據(jù)中的代表性韻律數(shù)據(jù)的韻律詞典、把收錄聲音作為合成單位的聲音數(shù)據(jù)加以收錄的波形詞典且單詞變形規(guī)則是收錄字符串變形規(guī)則的單詞變形規(guī)則時(shí),聲音合成處理手段包括從單詞詞典或單詞變形規(guī)則判定要合成字符串的語調(diào)類型的手段;根據(jù)要合成字符串與語調(diào)類型從韻律詞典選擇韻律模型數(shù)據(jù)的手段;根據(jù)選擇的韻律模型數(shù)據(jù),從波形詞典選擇與要合成的字符串各字符對(duì)應(yīng)的波形數(shù)據(jù)的手段;相互連接所述選擇的波形數(shù)據(jù)的手段。
17.一種記錄聲音合成程序的計(jì)算機(jī)可讀媒體,其特征在于,所述程序在被計(jì)算機(jī)讀取時(shí),使該計(jì)算機(jī)在功能上包括下述手段與講話者或講話時(shí)的感情、狀況或講話內(nèi)容中至少一個(gè)不同的多個(gè)聲音合成處理任務(wù)分別對(duì)應(yīng)的單詞詞典、韻律詞典和波形詞典;根據(jù)與要合成的字符串一起輸入的任務(wù)指定切換單詞詞典、韻律詞典和波形詞典的手段;采用切換后的單詞詞典、韻律詞典和波形詞典對(duì)與要合成的字符串對(duì)應(yīng)的聲音信息進(jìn)行合成處理的手段。
18.如權(quán)利要求17所述的記錄聲音合成程序的計(jì)算機(jī)可讀媒體,其特征在于,在各詞典是收錄許多至少含一個(gè)字符的單詞及其語調(diào)類型的單詞詞典、收錄表示對(duì)收錄于所述單詞詞典中的單詞的韻律的韻律模型數(shù)據(jù)中的代表性韻律數(shù)據(jù)的韻律詞典、把收錄聲音作為合成單位的聲音數(shù)據(jù)加以收錄的波形詞典時(shí),聲音合成處理手段包括由單詞詞典判定要合成字符串的語調(diào)類型的手段;根據(jù)要合成的字符串和語調(diào)類型,從韻律詞典選擇韻律模型數(shù)據(jù)的手段;根據(jù)選擇的韻律模型數(shù)據(jù),從波形詞典選擇與要合成的字符串的各字符對(duì)應(yīng)的波形數(shù)據(jù);相互連接所述選擇的波形數(shù)據(jù)的手段。
19.一種記錄聲音合成程序的計(jì)算機(jī)可讀媒體,其特征在于,所述程序在被計(jì)算機(jī)讀取時(shí),使該計(jì)算機(jī)在功能上包括下述手段與講話者或講話時(shí)的感情、狀況或講話內(nèi)容中至少一個(gè)不同的多個(gè)聲音合成處理任務(wù)分別對(duì)應(yīng)的單詞詞典、韻律詞典、波形詞典和單詞變形規(guī)則;根據(jù)與要合成的字符串一起輸入的任務(wù)指定,切換單詞詞典、韻律詞典、波形詞典和單詞變形規(guī)則的手段;按照單詞變形規(guī)則對(duì)要合成的字符串進(jìn)行變形處理的手段;采用切換后的單詞詞典、韻律詞典和波形詞典對(duì)與變形處理后的字符串對(duì)應(yīng)的聲音信息進(jìn)行合成處理的手段。
20.如權(quán)利要求19所述的計(jì)算機(jī)可讀媒體,其特征在于,在各詞典是收錄許多至少含一個(gè)字符的單詞及其語調(diào)類型的單詞詞典、收錄表示對(duì)收錄于所述單詞詞典中的單詞的韻律的韻律模型數(shù)據(jù)中的代表性韻律數(shù)據(jù)的韻律詞典、把收錄聲音作為合成單位的聲音數(shù)據(jù)加以收錄的波形詞典且單詞變形規(guī)則是收錄字符串變形規(guī)則的單詞變形規(guī)則時(shí),聲音合成處理手段包括由單詞詞典或單詞變形規(guī)則判定要合成的字符串的語調(diào)類型的手段;根據(jù)要合成的字符串和語調(diào)類型,從韻律詞典選擇韻律模型數(shù)據(jù)的手段;根據(jù)選擇的韻律模型數(shù)據(jù),從波形詞典選擇與要合成的字符串的各字符對(duì)應(yīng)的波形數(shù)據(jù);相互連接所述選擇的波形數(shù)據(jù)的手段。
21.一種記錄聲音合成程序的計(jì)算機(jī)可讀媒體,其特征在于,所述程序在被計(jì)算機(jī)讀取時(shí),使該計(jì)算機(jī)在功能上包括下述手段單詞詞典、與講話者或講話時(shí)的感情、狀態(tài)之一不同的多個(gè)聲音合成處理任務(wù)分別對(duì)應(yīng)的韻律詞典、波形詞典和單詞變形規(guī)則;根據(jù)與要合成的字符串一起輸入的任務(wù)指定切換韻律詞典、波形詞典和單詞變形規(guī)則的手段;按照單詞變形規(guī)則對(duì)要合成的字符串進(jìn)行變形處理的手段;采用單詞詞典、切換后的韻律詞典和波形詞典,對(duì)與變形處理后的字符串對(duì)應(yīng)的聲音信息進(jìn)行合成處理的手段。
22.如權(quán)利要求21所述的計(jì)算機(jī)可讀媒體,其特征在于,在各詞典是收錄許多至少含一個(gè)字符的單詞及其語調(diào)類型的單詞詞典、收錄表示對(duì)收錄于所述單詞詞典中的單詞的韻律的韻律模型數(shù)據(jù)中的代表性韻律數(shù)據(jù)的韻律詞典、把收錄聲音作為合成單位的聲音數(shù)據(jù)加以收錄的波形詞典且單詞變形規(guī)則是收錄字符串變形規(guī)則的單詞變形規(guī)則時(shí),聲音合成處理手段包括由單詞詞典或單詞變形規(guī)則判定要合成的字符串的語調(diào)類型的手段;根據(jù)要合成的字符串和語調(diào)類型,從韻律詞典選擇韻律模型數(shù)據(jù)的手段;根據(jù)選擇的韻律模型數(shù)據(jù),從波形詞典選擇與要合成的字符串的各字符對(duì)應(yīng)的波形數(shù)據(jù);相互連接所述選擇的波形數(shù)據(jù)的手段。
全文摘要
設(shè)定講話者或進(jìn)話時(shí)的感情、狀況或講話內(nèi)容中至少一個(gè)不同的多個(gè)聲音合成處理任務(wù)(S1),構(gòu)筑與各任務(wù)對(duì)應(yīng)的單詞詞典、韻律詞典和波形詞典(S2),在由游戲系統(tǒng)等輸入要合成的字符串及指定任務(wù)時(shí)采用該指定任務(wù)的單詞詞典、韻律詞典和波形詞典進(jìn)行聲音合成處理(S3),由此可生成反映講話者個(gè)性和講話時(shí)的感情、狀況、講話內(nèi)容的聲音信息。
文檔編號(hào)G10L13/04GK1282017SQ00120198
公開日2001年1月31日 申請(qǐng)日期2000年7月21日 優(yōu)先權(quán)日1999年7月21日
發(fā)明者笠井 治, 溝口稔幸 申請(qǐng)人:科樂美股份有限公司, 科樂美東京電腦娛樂股份有限公司