專(zhuān)利名稱(chēng):聲音合成裝置、聲音合成方法和程序的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及聲音合成技術(shù),特別地,用于根據(jù)文本合成聲音的聲音合 成裝置、聲音合成方法和程序。
背景技術(shù):
最近,隨著計(jì)算機(jī)高性能化、小型化,聲音合成技術(shù)在汽車(chē)導(dǎo)航裝置、
移動(dòng)電話、PC、機(jī)器人等各種裝置上安裝并利用。伴隨著對(duì)各種裝置的應(yīng)
用的普及,利用聲音合成裝置的環(huán)境多樣化。
現(xiàn)有的一般的聲音合成裝置中,對(duì)于發(fā)音符號(hào)串(含有讀、句法/詞類(lèi) 信息、語(yǔ)調(diào)類(lèi)型等的文本解析結(jié)果),韻律(例如,音調(diào)頻率模式、振幅、 持續(xù)時(shí)長(zhǎng))生成、單位波形(例如,具有從自然聲音中所提取的音調(diào)長(zhǎng)或 音節(jié)時(shí)長(zhǎng)程度的長(zhǎng)度的波形)選擇、波形生成處理結(jié)果原則上唯一地決定。 即,聲音合成裝置不管在什么樣的情況和環(huán)境中,始終采用同樣的發(fā)聲形 式(聲音的大小和發(fā)聲速度、韻律、聲調(diào)等)進(jìn)行聲音合成。
但是,實(shí)際上如果觀察人類(lèi)的發(fā)聲,即使在講同樣文本的情況下,也 是按照講話者的情況、感情、意圖等來(lái)控制發(fā)聲形式。因此,始終采用同 樣發(fā)聲形式的現(xiàn)有聲音合成裝置未必可以說(shuō)是充分地有效地利用聲音這 種傳播介質(zhì)的特征。
為解決聲音合成裝置的這樣的問(wèn)題,有人進(jìn)行了按照用戶(hù)環(huán)境(聲音 合成裝置利用者存在的場(chǎng)所的情況和環(huán)境)動(dòng)態(tài)地改變韻律生成/單位波形 選擇,由此產(chǎn)生適合用戶(hù)環(huán)境的合成聲音,改善用戶(hù)使用方便的這種嘗試。 例如,專(zhuān)利文獻(xiàn)1中,公開(kāi)了按照表示用戶(hù)環(huán)境明暗和用戶(hù)位置等的信息, 選擇音韻/韻律的控制規(guī)則的聲音合成系統(tǒng)的構(gòu)成。
另外,專(zhuān)利文獻(xiàn)2中,公開(kāi)了根據(jù)周?chē)胍舻哪芰孔V、頻率分布信息, 控制輔音功率、音調(diào)頻率、以及取樣頻率的聲音合成裝置的構(gòu)成。
更迸一步地,專(zhuān)利文獻(xiàn)3中,公幵了根據(jù)包含有時(shí)間、日期、和星期
的各種計(jì)時(shí)信息,控制發(fā)聲速度、音調(diào)頻率、音量、以及音質(zhì)的聲音合成 裝置。
下面說(shuō)明構(gòu)成本發(fā)明背景技術(shù)的公開(kāi)了音樂(lè)信號(hào)的分析、檢索方法的 非專(zhuān)利文獻(xiàn)K3。非專(zhuān)利文獻(xiàn)1,公開(kāi)了采用分析音樂(lè)信號(hào)的短時(shí)間振幅
頻譜或離散小波(wavelet)變換系數(shù)來(lái)得到音樂(lè)特征(樂(lè)器構(gòu)成、節(jié)奏結(jié) 構(gòu)),從而推斷音樂(lè)類(lèi)型的類(lèi)型推斷方法。
非專(zhuān)利文獻(xiàn)2中,公開(kāi)了采用樹(shù)結(jié)構(gòu)型矢量量化法,根據(jù)音樂(lè)信號(hào)的 Mel頻率推斷音樂(lè)類(lèi)型的音樂(lè)類(lèi)型推斷方法。
非專(zhuān)利文獻(xiàn)3中,公開(kāi)了采用頻譜的直方圖進(jìn)行相似度計(jì)算、檢索音 樂(lè)信號(hào)的方法。
專(zhuān)利文獻(xiàn)1:日本特開(kāi)第3595041號(hào)公報(bào)
專(zhuān)利文獻(xiàn)2:日本特開(kāi)平11-15495號(hào)公報(bào)
專(zhuān)利文獻(xiàn)3:日本特開(kāi)平11-161298號(hào)公報(bào)
非專(zhuān)禾lj文獻(xiàn) 1: Tzanetakis, Essl, Cook: "Automatic Musical Genre Classification of Audio Signals", Proceedings of ISMIR 2001, pp.205畫(huà)210, 2001.
非專(zhuān)禾U文獻(xiàn)2: Hoashi, Matsumoto, Inoue: "Personalization of User Profiles for Content-based Music Retrieval Based on Relevance Feedback", Proceedings of ACM Multimedia 2003, pp. 110-119, 2003.
非專(zhuān)利文獻(xiàn)3:木村、他「夕、'口一,/"&枝刈D^導(dǎo)入L/i音々映像 O高速探索j ,電子情報(bào)通信學(xué)會(huì)論文誌D-n, Vol. J85-D-n, No. 10, pp.l552-1562,2002年10月
為了吸引聽(tīng)眾的注意以及讓訊息給聽(tīng)眾以深刻印象的目的, 一般和自 然聲音一起播送BGM (background music,以下稱(chēng)為BGM)。例如,電視 和收音機(jī)的新聞、信息提供節(jié)—目,大多在解說(shuō)背景中播送BGM。
如果分析該節(jié)目,雖然有些是按照說(shuō)話者的發(fā)聲形式選擇BGM,特 別是該BGM屬于的音樂(lè)類(lèi)型,但也能夠發(fā)現(xiàn)在說(shuō)話者方面采用了意識(shí)到 BGM的說(shuō)話方式。例如,天氣預(yù)報(bào)和交通信息中,伴隨容易傾聽(tīng)的平穩(wěn) 曲調(diào)的BGM, 一般用平穩(wěn)語(yǔ)調(diào)進(jìn)行廣播。但是,即使是相同的內(nèi)容,在
特定節(jié)目中和實(shí)況轉(zhuǎn)播等中,常常以有張力的聲音進(jìn)行廣播。
并且在帶著悲哀朗讀詩(shī)的時(shí)候,將布魯士舞曲音樂(lè)作為BGM使用, 說(shuō)話者也進(jìn)行含有感情的朗讀。此外還能夠看出想要演出神秘氣氛的情況 下選擇宗教音樂(lè),快活的語(yǔ)調(diào)的情況下選擇流行歌曲音樂(lè)這樣的關(guān)系。
另一方面,利用上述種類(lèi)聲音合成裝置的環(huán)境多樣化,將含有上述
BGM的各種音樂(lè)進(jìn)行再現(xiàn)的場(chǎng)所(用戶(hù)環(huán)境)中,盡管輸出合成聲音的
機(jī)會(huì)變多,包含有上述專(zhuān)利文獻(xiàn)1等中記載的技術(shù)方案的現(xiàn)有聲音合成裝 置中,在控制合成聲音的發(fā)聲形式方面,由于不能考慮用戶(hù)環(huán)境中存在的 音樂(lè),存在發(fā)聲形式與周?chē)囊魳?lè)不能協(xié)調(diào)的問(wèn)題。
發(fā)明內(nèi)容
本發(fā)明,是鑒于上述情況而產(chǎn)生的發(fā)明,其目的在于,提供聲音合成 裝置、聲音合成方法以及程序,能夠合成與用戶(hù)環(huán)境中存在的音樂(lè)協(xié)調(diào)的聲音。
根據(jù)本發(fā)明的第l個(gè)觀點(diǎn),提供一種聲音合成裝置,其特征在于,按 照所輸入的音樂(lè)信號(hào)自動(dòng)選擇發(fā)聲形式。更具體地,上述聲音合成裝置具
備分析音樂(lè)信號(hào)并決定適合該音樂(lè)信號(hào)分析結(jié)果的發(fā)聲形式的發(fā)聲形式 選擇部;和按照上述發(fā)聲形式合成聲音的聲音合成部。
根據(jù)本發(fā)明的第2個(gè)觀點(diǎn),提供一種采用聲音合成裝置產(chǎn)生合成聲音
的聲音合成方法,其特征在于,包含有上述聲音合成裝置分析所輸入的
音樂(lè)信號(hào)并決定適合該音樂(lè)信號(hào)的分析結(jié)果的發(fā)聲形式的步驟;和上述音
樂(lè)合成裝置按照上述發(fā)聲形式合成聲音的步驟。
根據(jù)本發(fā)明的第3個(gè)觀點(diǎn),提供一種在構(gòu)成聲音合成裝置的計(jì)算機(jī)上
執(zhí)行的程序和保存該程序的記錄介質(zhì),該程序在上述計(jì)算機(jī)上執(zhí)行下列處
理分析所輸入的音樂(lè)信號(hào),從預(yù)先所準(zhǔn)備的發(fā)聲形式中,決定適合上述
音樂(lè)信號(hào)分析結(jié)果的發(fā)聲形式的處理;和按照上述發(fā)聲形式合成聲音的處理。
根據(jù)本發(fā)明,能夠采用同用戶(hù)環(huán)境BGM等音樂(lè)取得協(xié)調(diào)的發(fā)聲形式 而產(chǎn)生合成聲音。結(jié)果,能夠輸出可以吸引用戶(hù)注意的合成聲音、以及不 破壞BGM具有的氣氛和傾聽(tīng)BGM的用戶(hù)的情緒的合成聲音。
圖1是對(duì)涉及本發(fā)明第1實(shí)施方式的聲音合成裝置的構(gòu)成進(jìn)行示意的 框圖。
圖2是對(duì)涉及本發(fā)明第1實(shí)施方式的聲音合成裝置中使用的音樂(lè)類(lèi)型 與發(fā)聲形式以及發(fā)聲形式參數(shù)之間的關(guān)系進(jìn)行定義的表的一個(gè)例子。
圖3是用于對(duì)涉及本發(fā)明第1實(shí)施方式的聲音合成裝置的工作進(jìn)行說(shuō) 明的流程圖。
圖4是對(duì)涉及本發(fā)明第2實(shí)施方式的聲音合成裝置的構(gòu)成進(jìn)行示意的 框圖。
圖5是對(duì)涉及本發(fā)明第2實(shí)施方式的聲音合成裝置中使用的音樂(lè)類(lèi)型 與發(fā)聲形式以及發(fā)聲形式參數(shù)之間的關(guān)系進(jìn)行定義的表的一個(gè)例子。
圖6是用于對(duì)涉及本發(fā)明第2實(shí)施方式的聲音合成裝置的工作進(jìn)行說(shuō) 明的流程圖。
圖7是對(duì)涉及本發(fā)明第3實(shí)施方式的聲音合成裝置的構(gòu)成進(jìn)行示意的 框圖。
圖8是用于對(duì)涉及本發(fā)明第3實(shí)施方式的聲音合成裝置的工作進(jìn)行說(shuō) 明的流程圖。
圖9是對(duì)涉及本發(fā)明第4實(shí)施方式的聲音合成裝置的構(gòu)成進(jìn)行示意的 框圖。
圖10是用于對(duì)涉及本發(fā)明第4實(shí)施方式的聲音合成裝置的工作進(jìn)行 說(shuō)明的流程圖。 符號(hào)說(shuō)明 11韻律生成部 12單位波形選擇部 13波形生成部
15, ~15N韻律生成規(guī)則記憶部
16, 16N單位波形數(shù)據(jù)記憶部 17合成聲音功率調(diào)整部
18合成聲音功率計(jì)算部
19音樂(lè)信號(hào)功率計(jì)算部
21音樂(lè)類(lèi)型推斷部
23、 27發(fā)聲形式選擇部
24、 28發(fā)聲形式信息記憶部 31音樂(lè)屬性信息檢索部
32音樂(lè)屬性信息記憶部 35音樂(lè)再現(xiàn)部 36再現(xiàn)音樂(lè)信息取得部 37音樂(lè)數(shù)據(jù)記憶部
具體實(shí)施例方式
接著,對(duì)用于實(shí)施本發(fā)明的最佳的方式參照附圖進(jìn)行詳細(xì)說(shuō)明。圖1 是對(duì)涉及本發(fā)明第1個(gè)實(shí)施方式的聲音合成裝置的構(gòu)成進(jìn)行示意的框圖。
參照?qǐng)Dl,涉及本實(shí)施方式的聲音合成裝置具備韻律生成部ll、單位波
形選擇部12、波形生成部13、韻律生成規(guī)則記憶部15,至15N、單位波形 數(shù)據(jù)記憶部16,至16N、音樂(lè)類(lèi)型推斷部21、發(fā)聲形式選擇部23和發(fā)聲形 式信息記憶部24。
韻律生成部11是用于從基于發(fā)聲形式所選擇的韻律生成規(guī)則和發(fā)音 符號(hào)串產(chǎn)生韻律信息的處理部件。
單位波形選擇部12是用于從基于發(fā)聲形式所選擇的單位波形數(shù)據(jù)、 發(fā)音符號(hào)串和韻律信息選擇單位波形的處理部件。
波形生成部13是用于從韻律信息和單位波形數(shù)據(jù)產(chǎn)生合成聲音波形 的處理部件。
韻律生成規(guī)則記憶部15,至15N中保存通過(guò)各發(fā)聲形式實(shí)現(xiàn)合成聲音 所必需的韻律生成規(guī)則(例如,音調(diào)頻率模式、振幅、持續(xù)時(shí)長(zhǎng)等)。
同韻律生成規(guī)則記憶部的情況相同,單位波形數(shù)據(jù)記憶部16,至16N
中保存通過(guò)各發(fā)聲形式實(shí)現(xiàn)合成聲音所必需的單位波形數(shù)據(jù)(例如,具有
從自然聲音中所提取的音調(diào)長(zhǎng)和音節(jié)時(shí)間長(zhǎng)程度的長(zhǎng)度的波形)。
另外,上述韻律生成規(guī)則記憶部15,至15N和單位波形數(shù)據(jù)記憶部16,
至16N中應(yīng)保存的韻律生成規(guī)則和單位波形數(shù)據(jù),能夠通過(guò)對(duì)適合各發(fā)聲 形式的自然聲音進(jìn)行收集、分析而產(chǎn)生。
以下,本實(shí)施方式中,作為下列情況進(jìn)行說(shuō)明從有活力的聲音所產(chǎn) 生的有活力的聲音的實(shí)現(xiàn)所必需的韻律生成規(guī)則和單位波形數(shù)據(jù)保存在 韻律生成規(guī)則記憶部15,和單位波形數(shù)據(jù)記憶部16,中,從平穩(wěn)的聲音所 產(chǎn)生的平穩(wěn)的聲音的實(shí)現(xiàn)所必需的韻律生成規(guī)則和單位波形數(shù)據(jù)保存在 韻律生成規(guī)則記憶部152和單位波形數(shù)據(jù)記憶部162中,從耳語(yǔ)聲所產(chǎn)生
的韻律生成規(guī)則和單位波形數(shù)據(jù)保存在韻律生成規(guī)則記憶部153和單位波 形數(shù)據(jù)記憶部163中,從標(biāo)準(zhǔn)聲音所產(chǎn)生的韻律生成規(guī)則和單位波形數(shù)據(jù) 保存在韻律生成規(guī)則記憶部15w和單位波形數(shù)據(jù)記憶部16w中。另外,從 自然聲音產(chǎn)生韻律生成規(guī)則和單位波形數(shù)據(jù)的方法,能夠不依賴(lài)發(fā)聲形 式,采用和從標(biāo)準(zhǔn)聲音產(chǎn)生的情況相同的方法。
音樂(lè)類(lèi)型推斷部21是用于對(duì)所輸入的音樂(lè)信號(hào)屬于的音樂(lè)類(lèi)型進(jìn)行 推斷的處理部件。
發(fā)聲形式選擇部23是用于根據(jù)音樂(lè)類(lèi)型決定發(fā)聲形式的處理部件, 該音樂(lè)類(lèi)型根據(jù)發(fā)聲形式信息記憶部24中保存的表所推斷出。
發(fā)聲形式信息記憶部24中保存有對(duì)圖2中舉例說(shuō)明的音樂(lè)類(lèi)型同發(fā) 聲形式以及發(fā)聲形式參數(shù)之間的關(guān)系進(jìn)行定義的表。發(fā)聲形式參數(shù)是指韻 律生成規(guī)則記憶部號(hào)碼和單位波形數(shù)據(jù)記憶部號(hào)碼,通過(guò)將與各號(hào)碼對(duì)應(yīng) 的韻律生成規(guī)則和單位波形數(shù)據(jù)進(jìn)行編組,實(shí)現(xiàn)按照特定發(fā)聲形式合成聲 音。另外,圖2的例子中,雖然為說(shuō)明方便定義了發(fā)聲形式和發(fā)聲形式參 數(shù)兩者,但是,由于發(fā)聲形式選擇部23中使用的只是發(fā)聲形式參數(shù),因 此,能夠省略發(fā)聲形式的定義。
相反的,發(fā)聲形式信息記憶部24中,只定義音樂(lè)類(lèi)型同發(fā)聲形式之 間的關(guān)系,發(fā)聲形式同韻律生成規(guī)則以及單位波形數(shù)據(jù)之間的對(duì)應(yīng)關(guān)系, 能夠采用韻律生成部11和單位波形選擇部12,選擇適合各發(fā)聲形式的韻 律生成規(guī)則和單位波形數(shù)據(jù)。
并且,圖2的例子中,雖然準(zhǔn)備了多個(gè)發(fā)聲形式,但是,能夠只準(zhǔn)備 1種發(fā)聲形式的單位波形數(shù)據(jù),根據(jù)韻律生成規(guī)則的改變進(jìn)行發(fā)聲形式的 轉(zhuǎn)換。該情況,能夠更加降低聲音合成裝置的記憶容量和處理量。 更進(jìn)一步地,上述發(fā)聲形式信息記憶部24中定義的音樂(lè)類(lèi)型信息同 發(fā)聲形式之間的對(duì)應(yīng)關(guān)系,也可以按用戶(hù)喜好而改變,也可以從預(yù)先所準(zhǔn) 備的多個(gè)對(duì)應(yīng)關(guān)系的組合中由用戶(hù)按照喜好進(jìn)行選擇。
繼續(xù)地,參照附圖對(duì)涉及本實(shí)施方式的聲音合成裝置的工作詳細(xì)說(shuō) 明。圖3是對(duì)涉及本實(shí)施方式的聲音合成裝置的工作進(jìn)行示意的流程圖。
參照?qǐng)D3,首先,音樂(lè)類(lèi)型推斷部21,從所輸入的音樂(lè)信號(hào),提取頻譜和 倒譜(cepstrum)等的音樂(lè)信號(hào)的特征量,推斷所輸入的音樂(lè)屬于的音樂(lè) 類(lèi)型,向發(fā)聲形式選擇部23輸出(步驟A1)。該音樂(lè)類(lèi)型推斷方法能夠 使用之前提出的非專(zhuān)利文獻(xiàn)1、非專(zhuān)利文獻(xiàn)2等中所記載的公知的方法。
另外,在不存在BGM的情況和屬于推斷對(duì)象外的音樂(lè)類(lèi)型的音樂(lè)被 輸入的情況下,不將特定的類(lèi)型名,而將"其它"作為音樂(lè)類(lèi)型向發(fā)聲形式 選擇部23輸出。
接著,發(fā)聲形式選擇部23,根據(jù)音樂(lè)類(lèi)型推斷部21所轉(zhuǎn)達(dá)的推斷音 樂(lè)類(lèi)型,從發(fā)聲形式信息記憶部24中所記憶的表(參照?qǐng)D2)選擇相應(yīng)的 發(fā)聲形式,將為實(shí)現(xiàn)所選擇的發(fā)聲形式所必需的發(fā)聲形式參數(shù)向韻律生成 部ll和單位波形選擇部12轉(zhuǎn)達(dá)(步驟A2)。
根據(jù)圖2,例如,所推斷的音樂(lè)類(lèi)型為流行歌曲的情況,選擇有活力 的聲音作為發(fā)聲形式,容易傾聽(tīng)的情況選擇平穩(wěn)的聲音,宗教音樂(lè)的情況 選擇耳語(yǔ)聲。所推斷的音樂(lè)類(lèi)型在圖2的表中不存在的情況下,同音樂(lè)類(lèi)
型為"其它"的情況相同,選擇標(biāo)準(zhǔn)的發(fā)聲形式。
繼續(xù)地,韻律生成部ll,參照從發(fā)聲形式選擇部23所供給的發(fā)聲形 式參數(shù),從韻律生成規(guī)則記憶部15i至15N中,選擇具有發(fā)聲形式選擇部 23所指定的記憶部號(hào)碼的韻律生成規(guī)則記憶部。然后,根據(jù)所選擇的韻律 生成規(guī)則記憶部的韻律生成規(guī)則,從所輸入的發(fā)音符號(hào)串產(chǎn)生韻律信息, 向單位波形選擇部12和波形生成部13轉(zhuǎn)達(dá)(步驟A3)。
繼續(xù)地,單位波形選擇部12,參照從發(fā)聲形式選擇部23所轉(zhuǎn)達(dá)的發(fā) 聲形式參數(shù),從單位波形數(shù)據(jù)記憶部16,至16n中,選擇具有發(fā)聲形式選 擇部23所指定的記憶部號(hào)碼的單位波形數(shù)據(jù)記憶部。然后,根據(jù)所輸入 的發(fā)音符號(hào)串和從韻律生成部11所供給的韻律信息,從所選擇的單位波 形數(shù)據(jù)記憶部選擇單位波形,向波形生成部13轉(zhuǎn)達(dá)(步驟A4)。
最后,波形生成部13,根據(jù)從韻律生成部11所轉(zhuǎn)達(dá)的韻律信息,連
接從單位波形選擇部12所供給的單位波形,輸出合成聲音信號(hào)(步驟A5)。 如上所述,根據(jù)本實(shí)施方式,能夠按照通過(guò)與用戶(hù)環(huán)境BGM取得了 調(diào)和的韻律和單位波形實(shí)現(xiàn)的發(fā)聲形式,產(chǎn)生合成聲音。
另外,上述實(shí)施方式中,雖然按發(fā)聲形式準(zhǔn)備單位波形數(shù)據(jù)記憶部16, 至16N,但是,還能夠只設(shè)置標(biāo)準(zhǔn)聲音的單位波形數(shù)據(jù)記憶部。該情況下, 雖然只按照韻律生成規(guī)則控制發(fā)聲形式,但是,單位波形數(shù)據(jù)與以韻律生 成規(guī)則為首的其它的數(shù)據(jù)相比,數(shù)據(jù)大小大,因此產(chǎn)生能夠大幅度消減合 成裝置整體的記憶容量的優(yōu)點(diǎn)。
上述第l實(shí)施方式中,合成聲音的功率沒(méi)有成為控制對(duì)象,不管在釆 用耳語(yǔ)聲輸出合成聲音的情況下,還是在通過(guò)有活力的聲音輸出合成聲音 的情況下,功率都是相同的。例如,根據(jù)BGM和發(fā)聲形式的對(duì)應(yīng)關(guān)系, 能夠想到如果合成聲音的音量比背景音樂(lè)過(guò)大就損壞協(xié)調(diào),根據(jù)場(chǎng)合的不 同變得刺耳。反過(guò)來(lái),能夠想到如果合成聲音的音量比背景音樂(lè)過(guò)小,則 不僅僅損壞協(xié)調(diào),而且變得難以聽(tīng)見(jiàn)合成聲音。
這里,對(duì)于上述加以改良,將合成聲音的功率也追加為控制對(duì)象的本 發(fā)明的第2實(shí)施方式,參照附圖詳細(xì)進(jìn)行說(shuō)明。圖4是示意涉及本發(fā)明第 2實(shí)施方式的聲音合成裝置構(gòu)成的框圖。
參照?qǐng)D4,本實(shí)施方式的聲音合成裝置,對(duì)于涉及上述第l實(shí)施方式 的聲音合成裝置(參照?qǐng)D1),再增加了下列部分合成聲音功率調(diào)整部 17、合成聲音功率計(jì)算部18和音樂(lè)信號(hào)功率計(jì)算部19。而且,按照?qǐng)D4 所示,本實(shí)施方式中,代替上述第1實(shí)施方式的發(fā)聲形式選擇部23和發(fā) 聲形式信息記憶部24,配置有發(fā)聲形式選擇部27和發(fā)聲形式信息記憶部 28。
發(fā)聲形式信息記憶部28中,保存有對(duì)圖5中舉例說(shuō)明的音樂(lè)類(lèi)型同 發(fā)聲形式以及發(fā)聲形式參數(shù)的關(guān)系進(jìn)行定義的表。同上述第1實(shí)施方式的 發(fā)聲形式信息記憶部24中保持的表(參照?qǐng)D2)之間的不同點(diǎn)在于增加了 功率比。
該功率比是用合成聲音的功率除以音樂(lè)信號(hào)的功率的值。g口,如果功 率比大于l.O,則表示合成聲音的功率比音樂(lè)信號(hào)的功率大。參照?qǐng)D5,例 如,音樂(lè)類(lèi)型被推斷為流行歌曲的情況,發(fā)聲形式是有活力的聲音,功率 比設(shè)定為1.2,按照超過(guò)音樂(lè)信號(hào)功率的功率(1.2倍)輸出合成聲音。同 樣地,發(fā)聲形式為平穩(wěn)的聲音時(shí)設(shè)定功率比為1.0,耳語(yǔ)聲的情況設(shè)定為
0.9,標(biāo)準(zhǔn)聲音的情況設(shè)定為1.0。
繼續(xù)地,對(duì)于涉及本實(shí)施方式的聲音合成裝置的工作,參照附圖詳細(xì)
說(shuō)明。圖6是示意涉及本實(shí)施方式的聲音合成裝置的工作的流程圖。音樂(lè) 類(lèi)型推斷(步驟Al) 波形生成(步驟A5)為止的期間,雖然同上述第1 實(shí)施方式大致相同,但是不同點(diǎn)在于,步驟A2中,發(fā)聲形式選擇部27根 據(jù)從音樂(lè)類(lèi)型推斷部21所轉(zhuǎn)達(dá)的推斷音樂(lè)類(lèi)型,將發(fā)聲形式信息記憶部 28中所記憶的功率比向合成聲音功率調(diào)整部17轉(zhuǎn)達(dá)(步驟A2)。
步驟A5中,如果波形生成結(jié)束,音樂(lè)信號(hào)功率計(jì)算部19,對(duì)所輸入 的音樂(lè)信號(hào)的平均功率進(jìn)行計(jì)算,向合成聲音功率調(diào)整部17轉(zhuǎn)達(dá)(步驟 Bl)。如果信號(hào)樣本號(hào)碼為n、音樂(lè)信號(hào)為x(n),例如按照下面式子(1) 表示的一次泄漏(!J 一夕/leaky)積分,能夠求出音樂(lè)信號(hào)的平均功率Pm(n)。
徵1〗
其中,a是一次泄漏積分的時(shí)間常數(shù)。由于為了防止合成聲音和BGM 的平均音量的差變大而計(jì)算功率,最好將a設(shè)定為0.9等大的值,計(jì)算長(zhǎng) 時(shí)間平均功率。反過(guò)來(lái),如果將a的值設(shè)定為0.1這樣的小的值而計(jì)算功 率,則合成聲音的音量變化變得頻繁并且大,有可能變得難于聽(tīng)到合成聲 音。另外,能夠代替上面式子而使用移動(dòng)平均和輸入信號(hào)的所有樣本的平 均值等。
繼續(xù)地,合成聲音功率計(jì)算部18,計(jì)算從波形生成部13所供給的合 成聲音的平均功率,向合成聲音功率調(diào)整部17轉(zhuǎn)達(dá)(步驟B2)。合成聲 音功率的計(jì)算中,能夠采用同上述音樂(lè)信號(hào)功率相同的方法。
最后,合成聲音功率調(diào)整部17,根據(jù)從音樂(lè)信號(hào)功率計(jì)算部19供給 的音樂(lè)信號(hào)功率、從合成聲音功率計(jì)算部18供給的合成聲音功率、從發(fā) 聲形式選擇部27供給的發(fā)聲形式參數(shù)中的功率比,對(duì)從波形生成部13供
16
給的合成聲音信號(hào)的功率進(jìn)行調(diào)整,并作為功率調(diào)整結(jié)束聲音合成信號(hào)輸 出(步驟B3)。更具體地,合成聲音功率調(diào)整部17調(diào)整合成聲音的功率, 以使得最終輸出的合成聲音信號(hào)的功率和音樂(lè)信號(hào)功率的比接近從發(fā)聲
形式選擇部27所供給的功率比的值。
更直接地,采用音樂(lè)信號(hào)功率、合成聲音信號(hào)功率、功率比求出功率 調(diào)整系數(shù),并與合成聲音信號(hào)相乘來(lái)實(shí)現(xiàn)。因此,功率調(diào)整系數(shù)中,音樂(lè) 信號(hào)和功率調(diào)整結(jié)束合成聲音的功率比,有必要使用與從發(fā)聲形式選擇部
27所供給的功率比大致一致的值。如果音樂(lè)信號(hào)功率為Pm,合成聲音功 率為Ps,功率比為r,則音樂(lè)調(diào)整系數(shù)c用下面式子給出。
徵2]
并且,如果功率調(diào)整前的合成聲音信號(hào)為y,(n),功率調(diào)整后的合成聲 音信號(hào)》(n)用下面式子給出。 [數(shù)3]
h (") = ^1(")
以上那樣,能夠進(jìn)行細(xì)微控制,選擇有活力的聲音的情況下,讓合成 聲音功率比標(biāo)準(zhǔn)聲音稍大,選擇耳語(yǔ)聲的情況下,讓功率稍小,能夠?qū)崿F(xiàn) 更加同BGM取得協(xié)調(diào)的發(fā)聲形式。
上述第1、第2實(shí)施方式中,雖然采用了推定輸入音樂(lè)的類(lèi)型的方案, 但是,如果使用近幾年的探索/對(duì)照方法,就能夠更細(xì)致地分析輸入音樂(lè)。 以下,參照附圖對(duì)于本發(fā)明的第3實(shí)施方式詳細(xì)說(shuō)明,第3實(shí)施方式對(duì)于 上述加以改良。圖7是對(duì)涉及本發(fā)明第3實(shí)施方式的聲音合成裝置的構(gòu)成 進(jìn)行示意的框圖。
參照?qǐng)D7,涉及本實(shí)施方式的聲音合成裝置,對(duì)于涉及上述第1實(shí)施 方式的聲音合成裝置(參照?qǐng)Dl),增加音樂(lè)屬性信息記憶部32的同時(shí),
代替音樂(lè)類(lèi)型推斷部21而配置有音樂(lè)屬性信息檢索部31。
音樂(lè)屬性信息檢索部31是用于從所輸入的音樂(lè)信號(hào)提取頻譜等特征
量的處理部件。音樂(lè)屬性信息記憶部32中,各種音樂(lè)信號(hào)的特征量和該
音樂(lè)信號(hào)的音樂(lè)類(lèi)型單獨(dú)地記錄,根據(jù)對(duì)照特征量,能夠確定音樂(lè)并決定 類(lèi)型。
使用上述特征量的音樂(lè)信號(hào)的檢索中,能夠使用非專(zhuān)利文獻(xiàn)3中公開(kāi)
的通過(guò)頻譜的直方圖進(jìn)行相似度計(jì)算的方法。
繼續(xù)地,對(duì)于涉及本實(shí)施方式的聲音合成裝置的工作參照附圖詳細(xì)說(shuō)
明。圖8是對(duì)涉及本實(shí)施方式的聲音合成裝置的工作進(jìn)行示意的流程圖。 相對(duì)于上述第1實(shí)施方式,音樂(lè)類(lèi)型推斷(步驟Al)部不同且其他已經(jīng) 說(shuō)明完,因此以下對(duì)于圖8的步驟D1詳細(xì)說(shuō)明。
首先,音樂(lè)屬性信息檢索部31從所輸入的音樂(lè)信號(hào)提取頻譜等特征 量。接著,音樂(lè)屬性信息檢索部31分別計(jì)算音樂(lè)屬性信息記憶部32中保 存的音樂(lè)的全部特征量和所輸入的音樂(lè)信號(hào)的特征量的相似度。然后,將 具有最高相似度的音樂(lè)的音樂(lè)類(lèi)型信息向發(fā)聲形式選擇部轉(zhuǎn)達(dá)(步驟D1)。
另外,步驟D1中,相似度的最大值,在低于所預(yù)先設(shè)定的閾值的情 況下,音樂(lè)屬性信息檢索部31,判斷為與所輸入的音樂(lè)信號(hào)相對(duì)應(yīng)的音樂(lè) 沒(méi)有記錄在音樂(lè)屬性信息記憶部32中,并將"其他"作為音樂(lè)類(lèi)型輸出。
以上那樣,根據(jù)本實(shí)施方式,由于使用對(duì)于各個(gè)音樂(lè)單獨(dú)地記錄了音 樂(lè)類(lèi)型的音樂(lè)屬性信息記憶部32,能夠按照比上述第l、第2實(shí)施方式更 高的精度確定音樂(lè)類(lèi)型,并反映在發(fā)聲形式上。
另外,構(gòu)筑音樂(lè)屬性信息記憶部32時(shí),如果記憶曲名、藝術(shù)家名、 作曲者名等的屬性信息,則能夠根據(jù)音樂(lè)類(lèi)型以外的屬性信息決定發(fā)聲形 式。
而且,如果音樂(lè)屬性信息記憶部32中記憶的音樂(lè)的種類(lèi)數(shù)目多,則 雖然能夠確定很多的音樂(lè)信號(hào)的類(lèi)型,但是,音樂(lè)屬性信息記憶部32的 容量變大。根據(jù)需要,可以在音樂(lè)合成裝置外部配置音樂(lè)屬性信息記憶部 32,在計(jì)算音樂(lè)信號(hào)特征量的相似度時(shí),使用有線和無(wú)線通信部件對(duì)音樂(lè) 屬性信息記憶部32進(jìn)行訪問(wèn)。
繼續(xù)地,對(duì)于涉及上述第1實(shí)施方式的聲音合成裝置,增加了 BGM
等樂(lè)曲再現(xiàn)功能的本發(fā)明的第4實(shí)施方式,參照附圖詳細(xì)說(shuō)明。 [第4實(shí)施方式]
圖9是對(duì)涉及本發(fā)明第4實(shí)施方式的聲音合成裝置的構(gòu)成進(jìn)行示意的
框圖。參照?qǐng)D9,涉及本實(shí)施方式的聲音合成裝置,對(duì)于涉及上述第l實(shí) 施方式的聲音合成裝置(參照?qǐng)D1),增加音樂(lè)再現(xiàn)部35、音樂(lè)數(shù)據(jù)記憶 部37的同時(shí),代替音樂(lè)類(lèi)型推斷部21而配置再現(xiàn)音樂(lè)信息取得部36。
音樂(lè)數(shù)據(jù)記憶部37中保存有音樂(lè)信號(hào)、該音樂(lè)的曲號(hào)碼和音樂(lè)類(lèi)型。 音樂(lè)再現(xiàn)部35,按照包含有曲號(hào)碼和音量、再現(xiàn),停止'倒退,快進(jìn)等各種命 令的再現(xiàn)指令,通過(guò)揚(yáng)聲器和耳機(jī)等,將音樂(lè)數(shù)據(jù)記憶部37中保存的音 樂(lè)信號(hào)進(jìn)行輸出。而且,音樂(lè)再現(xiàn)部35,對(duì)于再現(xiàn)音樂(lè)信息取得部36, 供給再現(xiàn)中的音樂(lè)的曲號(hào)碼。
再現(xiàn)音樂(lè)信息取得部36是與上述第1實(shí)施方式的音樂(lè)類(lèi)型推斷部21 相同的處理部件,從音樂(lè)數(shù)據(jù)記憶部37取出與從音樂(lè)再現(xiàn)部35所供給的 曲號(hào)碼相對(duì)應(yīng)的音樂(lè)的類(lèi)型信息,向發(fā)聲形式選擇部23轉(zhuǎn)達(dá)。
繼續(xù)地,對(duì)于涉及本實(shí)施方式的聲音合成裝置的工作參照附圖詳細(xì)說(shuō) 明。圖IO是對(duì)涉及本實(shí)施方式的聲音合成裝置的工作進(jìn)行示意的流程圖。 由于相對(duì)于上述第1實(shí)施方式,音樂(lè)類(lèi)型推斷(步驟Al)的部分不同且 其他己經(jīng)說(shuō)明完,以下,對(duì)于圖10的步驟D2、 D3詳細(xì)說(shuō)明。
音樂(lè)再現(xiàn)部35,如果再現(xiàn)所指定的音樂(lè),將該曲號(hào)碼向再現(xiàn)音樂(lè)信息 取得部36供給(步驟D2)。
再現(xiàn)音樂(lè)信息取得部36,從音樂(lè)數(shù)據(jù)記憶部37取出與從音樂(lè)再現(xiàn)部 35供給的曲號(hào)碼相對(duì)應(yīng)的音樂(lè)的類(lèi)型信息,向發(fā)聲形式選擇部23傳達(dá)(步 驟D3)。
根據(jù)本實(shí)施例,音樂(lè)類(lèi)型的推斷處理和檢索處理是不必要的,能夠可 靠地確定再現(xiàn)中的BGM的音樂(lè)類(lèi)型等。當(dāng)然,在音樂(lè)再現(xiàn)部35,能夠?qū)?再現(xiàn)中的音樂(lè)的類(lèi)型信息從音樂(lè)數(shù)據(jù)記憶部37直接取得的情況下,能夠 取消再現(xiàn)音樂(lè)信息取得部36,從音樂(lè)再現(xiàn)部35向發(fā)聲形式選擇部23直接 供給音樂(lè)類(lèi)型。
而且,音樂(lè)類(lèi)型信息沒(méi)有記錄在音樂(lè)數(shù)據(jù)記憶部37中的情況下,能 夠使用音樂(lè)類(lèi)型推斷部21代替再現(xiàn)音樂(lè)信息取得部36,推斷音樂(lè)類(lèi)型。
而且,如果在音樂(lè)數(shù)據(jù)記憶部37記錄有類(lèi)型以外的音樂(lè)屬性信息, 如上述第3實(shí)施方式中說(shuō)明的那樣,可以改變發(fā)聲形式選擇部23以及發(fā) 聲形式信息記憶部24,以使得能夠通過(guò)類(lèi)型以外的屬性信息決定發(fā)聲形 式。
以上,雖然對(duì)本發(fā)明各實(shí)施方式進(jìn)行了說(shuō)明,但本發(fā)明的技術(shù)范圍, 不限于上述實(shí)施方式,能夠按照聲音合成裝置的用途、方法等,加以各種 變形,或者,采用等同物。
權(quán)利要求
1. 一種聲音合成裝置,其特征在于具有分析音樂(lè)信號(hào)并決定適合該音樂(lè)信號(hào)分析結(jié)果的發(fā)聲形式的發(fā)聲形式選擇部;和根據(jù)上述發(fā)聲形式合成聲音的聲音合成部,按照所輸入的音樂(lè)信號(hào)自動(dòng)選擇發(fā)聲形式。
2. 根據(jù)權(quán)利要求1所述的聲音合成裝置,其特征在于 上述聲音合成部具有根據(jù)上述發(fā)聲形式產(chǎn)生韻律信息的韻律生成部;和 根據(jù)上述發(fā)聲形式選擇單位波形的單位波形選擇部。
3. 根據(jù)權(quán)利要求1所述的聲音合成裝置,其特征在于 上述聲音合成部具有記憶每個(gè)發(fā)聲形式的韻律生成規(guī)則的韻律生成規(guī)則記憶部; 按每個(gè)發(fā)聲形式記憶單位波形的單位波形記憶部;參照根據(jù)上述發(fā)聲形式所選擇的韻律生成規(guī)則,根據(jù)發(fā)音符號(hào)串產(chǎn)生 韻律信息的韻律生成部;從單位波形記憶部中所記憶的單位波形中選擇對(duì)應(yīng)上述發(fā)音符號(hào)串 和上述韻律信息的單位波形的單位波形選擇部;和根據(jù)上述韻律信息合成上述單位波形而產(chǎn)生合成聲音波形的波形生 成部。
4. 根據(jù)權(quán)利要求1至3的任一個(gè)所述的聲音合成裝置,其特征在于 還具有從關(guān)聯(lián)音樂(lè)和其屬性并記憶的音樂(lè)屬性信息記憶部,檢索與所輸入的音樂(lè)信號(hào)的分析結(jié)果相對(duì)應(yīng)的數(shù)據(jù),推斷上述所輸入的音樂(lè)的屬性 的音樂(lè)屬性信息檢索部,上述發(fā)聲形式選擇部,通過(guò)選擇與上述所輸入的音樂(lè)的屬性相對(duì)應(yīng)的 發(fā)聲形式,來(lái)決定上述發(fā)聲形式。
5. 根據(jù)權(quán)利要求1至3的任一個(gè)所述的聲音合成裝置,其特征在于具有分析上述音樂(lè)信號(hào)并推斷上述音樂(lè)屬于的音樂(lè)類(lèi)型的音樂(lè)類(lèi)型 推斷部,上述發(fā)聲形式選擇部,通過(guò)選擇與上述音樂(lè)類(lèi)型相對(duì)應(yīng)的發(fā)聲形式, 來(lái)決定上述發(fā)聲形式。
6. 根據(jù)權(quán)利要求1至3的任一個(gè)所述的聲音合成裝置,其特征在于 還具有關(guān)聯(lián)音樂(lè)信號(hào)和屬性信息并記憶的音樂(lè)數(shù)據(jù)記憶部; 對(duì)上述音樂(lè)數(shù)據(jù)記憶部中所保存的音樂(lè)信號(hào)進(jìn)行再現(xiàn)的音樂(lè)再現(xiàn)部;和參照上述音樂(lè)數(shù)據(jù)記憶部,取得所再現(xiàn)的音樂(lè)的屬性信息的再現(xiàn)音樂(lè) 信息取得部,上述發(fā)聲形式選擇部根據(jù)上述屬性信息決定發(fā)聲形式。
7. 根據(jù)權(quán)利要求6所述的聲音合成裝置,其特征在于 上述發(fā)聲形式選擇部,根據(jù)上述屬性信息中包含有的音樂(lè)類(lèi)型決定上述發(fā)聲形式。
8. 根據(jù)權(quán)利要求1至7的任一個(gè)所述的聲音合成裝置,其特征在于 還具有按照上述音樂(lè)信號(hào)的功率,對(duì)根據(jù)上述發(fā)聲形式所產(chǎn)生的上述合成聲音波形的功率進(jìn)行調(diào)整的合成聲音功率調(diào)整部。
9. 根據(jù)權(quán)利要求1至7的任一個(gè)所述的聲音合成裝置,其特征在于還具有分析上述音樂(lè)信號(hào)而求出音樂(lè)信號(hào)功率的音樂(lè)信號(hào)功率計(jì)算部;和 分析上述合成聲音波形而求出合成聲音的功率的合成聲音功率計(jì)算部;禾n '參照預(yù)先按每個(gè)發(fā)聲形式設(shè)定的上述音樂(lè)信號(hào)的功率和上述合成聲 音的功率的比率,從而按照上述音樂(lè)信號(hào)的功率,對(duì)根據(jù)上述發(fā)聲形式所 產(chǎn)生的上述合成聲音波形的功率進(jìn)行調(diào)整的合成聲音功率調(diào)整部。
10. —種聲音合成方法,使用聲音合成裝置而產(chǎn)生合成聲音,包括 上述聲音合成裝置,分析所輸入的音樂(lè)信號(hào),決定適合該音樂(lè)信號(hào)分析結(jié)果的發(fā)聲形式的步驟;和上述聲音合成裝置根據(jù)上述發(fā)聲形式合成聲音的步驟。
11. 根據(jù)權(quán)利要求IO所述的聲音合成方法,其特征在于還包括上述聲音合成裝置根據(jù)上述發(fā)聲形式產(chǎn)生韻律信息的步驟;和 上述聲音合成裝置根據(jù)上述發(fā)聲形式選擇單位波形的步驟, 上述聲音合成裝置釆用上述韻律信息和上述單位波形合成聲音。
12. 根據(jù)權(quán)利要求10所述的聲音合成方法,其特征在于 上述聲音合成裝置根據(jù)上述發(fā)聲形式合成聲音的步驟,含有, 上述聲音合成裝置,參照從韻律生成規(guī)則記憶部中所記憶的韻律生成規(guī)則中按照上述發(fā)聲形式所選擇的韻律生成規(guī)則,根據(jù)發(fā)音符號(hào)串產(chǎn)生韻 律信息的步驟;和上述聲音合成裝置從按上述發(fā)聲形式所準(zhǔn)備的單位波形中,選擇與上 述發(fā)音符號(hào)串和上述韻律信息相對(duì)應(yīng)的單位波形的步驟;和上述聲音合成裝置根據(jù)上述韻律信息合成上述單位波形并產(chǎn)生合成 聲音波形的步驟。
13. 根據(jù)權(quán)利要求10至12的任一個(gè)所述的聲音合成方法,其特征在于還包括上述聲音合成裝置從關(guān)聯(lián)音樂(lè)和其屬性并記憶的音樂(lè)屬性信 息記憶部,檢索與所輸入的音樂(lè)信號(hào)的分析結(jié)果相對(duì)應(yīng)的數(shù)據(jù),并對(duì)上述 所輸入的音樂(lè)的屬性進(jìn)行推斷的步驟,通過(guò)選擇與上述所輸入的音樂(lè)信號(hào)的屬性相對(duì)應(yīng)的發(fā)聲形式,來(lái)決定 適合上述音樂(lè)信號(hào)的分析結(jié)果的發(fā)聲形式。
14. 根據(jù)權(quán)利要求10至12的任一個(gè)所述的聲音合成方法,其特征在于還包括上述聲音合成裝置分析上述音樂(lè)信號(hào)并推斷該音樂(lè)屬于的音 樂(lè)類(lèi)型的步驟,上述聲音合成裝置通過(guò)選擇與上述音樂(lè)類(lèi)型相對(duì)應(yīng)的發(fā)聲形式,來(lái)決 定適合上述音樂(lè)信號(hào)的分析結(jié)果的發(fā)聲形式。
15. 根據(jù)權(quán)利要求10至12的任一個(gè)所述的聲音合成方法,其特征在于還包括上述聲音合成裝置,對(duì)關(guān)聯(lián)音樂(lè)信號(hào)和屬性信息并記憶的音樂(lè)數(shù)據(jù)記憶部中所保存的音樂(lè)信號(hào)進(jìn)行再現(xiàn)的步驟;和上述聲音合成裝置,參照上述音樂(lè)數(shù)據(jù)記憶部,取得所再現(xiàn)的音樂(lè)的 屬性信息的步驟,上述聲音合成裝置,代替所輸入的音樂(lè)信號(hào)的分析,根據(jù)上述屬性信 息決定發(fā)聲形式。
16. 根據(jù)權(quán)利要求15所述的聲音合成方法,其特征在于 上述聲音合成裝置,根據(jù)上述屬性信息中包含有的音樂(lè)類(lèi)型決定上述發(fā)聲形式。
17. 根據(jù)權(quán)利要求10至16的任一個(gè)所述的聲音合成方法,其特征在 于,還包括上述聲音合成裝置,對(duì)根據(jù)上述發(fā)聲形式所產(chǎn)生的上述合成聲音波形 的功率按照上述音樂(lè)信號(hào)的功率進(jìn)行調(diào)整的步驟。
18. 根據(jù)權(quán)利要求10至16的任一個(gè)所述的聲音合成方法,其特征在于,還包括上述聲音合成裝置分析上述音樂(lè)信號(hào)并求出音樂(lè)信號(hào)功率的步驟;上述聲音合成裝置分析上述合成聲音波形并求出合成聲音功率的步驟;禾口上述聲音合成裝置,參照預(yù)先按發(fā)聲形式所設(shè)定的上述音樂(lè)信號(hào)的功 率和上述合成聲音的功率的比率,對(duì)根據(jù)上述發(fā)聲形式所產(chǎn)生的上述合成 聲音波形的功率按照上述音樂(lè)信號(hào)的功率進(jìn)行調(diào)整的步驟。
19. 一種程序,在構(gòu)成聲音合成裝置的計(jì)算機(jī)上執(zhí)行,在上述計(jì)算機(jī)上執(zhí)行下列處理分析所輸入的音樂(lè)信號(hào),從預(yù)先準(zhǔn)備的發(fā)聲形式中決定適合上述音樂(lè)信號(hào)的分析結(jié)果的發(fā)聲形式的處理;和 根據(jù)上述發(fā)聲形式合成聲音的處理。
20. 根據(jù)權(quán)利要求19所述的程序,其特征在于 經(jīng)過(guò)根據(jù)上述發(fā)聲形式產(chǎn)生韻律信息的處理;和根據(jù)上述發(fā)聲形式選擇單位波形的處理后, 使用上述韻律信息和上述單位波形,進(jìn)行合成聲音的處理。
21. —種權(quán)利要求19所述的程序,其特征在于 經(jīng)過(guò) 參照從與上述計(jì)算機(jī)所連接的韻律生成規(guī)則記憶部中所記憶的韻律 生成規(guī)則中按照上述發(fā)聲形式所選擇的韻律生成規(guī)則,根據(jù)發(fā)音符號(hào)串產(chǎn) 生韻律信息的處理;和從上述計(jì)算機(jī)所連接的單位波形記憶部中按上述發(fā)聲形式所準(zhǔn)備的 單位波形中,選擇與上述發(fā)音符號(hào)串和上述韻律信息相對(duì)應(yīng)的單位波形的 處理后,根據(jù)上述韻律信息合成上述單位波形,并進(jìn)行合成聲音的處理。
22. 根據(jù)權(quán)利要求19至21的任一個(gè)所述的程序,其特征在于還包括從關(guān)聯(lián)音樂(lè)和其屬性并記憶的音樂(lè)屬性信息記憶部,檢索與 所輸入的音樂(lè)信號(hào)的分析結(jié)果相對(duì)應(yīng)的數(shù)據(jù),并推斷上述所輸入的音樂(lè)的 屬性的處理,通過(guò)選擇與上述所輸入的音樂(lè)的屬性相對(duì)應(yīng)的發(fā)聲形式,來(lái)進(jìn)行決定 適合上述音樂(lè)信號(hào)的分析結(jié)果的發(fā)聲形式的處理。
23. 根據(jù)權(quán)利要求19至21的任一個(gè)所述的程序,其特征在于,還包括分析上述音樂(lè)信號(hào)并推斷上述音樂(lè)屬于的音樂(lè)類(lèi)型的處理;和通過(guò)選擇與上述音樂(lè)類(lèi)型相對(duì)應(yīng)的發(fā)聲形式,來(lái)進(jìn)行決定適合上述音 樂(lè)信號(hào)的分析結(jié)果的發(fā)聲形式的處理。
24. 根據(jù)權(quán)利要求19至21的任一個(gè)所述的程序,其特征在于:還在上述計(jì)算機(jī)中執(zhí)行對(duì)關(guān)聯(lián)音樂(lè)信號(hào)和屬性信息并記憶的音樂(lè)數(shù)據(jù)記憶部中所保存的音樂(lè)信號(hào)進(jìn)行再現(xiàn)的處理;和參照上述音樂(lè)數(shù)據(jù)記憶部,取得所再現(xiàn)的音樂(lè)的屬性信息的處理, 上述計(jì)算機(jī),代替所輸入的音樂(lè)信號(hào)的分析,根據(jù)上述屬性信息決定 發(fā)聲形式。
25. 根據(jù)權(quán)利要求24所述的程序,其特征在于上述計(jì)算機(jī),根據(jù)上述屬性信息中包含的音樂(lè)類(lèi)型決定上述發(fā)聲形式。
26. 根據(jù)權(quán)利要求19至25的任一個(gè)所述的程序,其特征在于還包括對(duì)根據(jù)上述發(fā)聲形式產(chǎn)生的上述合成聲音波形的功率按照上 述音樂(lè)信號(hào)的功率進(jìn)行調(diào)整的處理。
27.根據(jù)權(quán)利要求19至25的任一個(gè)所述的程序,其特征在于,還包括分析上述音樂(lè)信號(hào)并求出音樂(lè)信號(hào)的功率的處理; 分析上述合成聲音波形并求出合成聲音功率的處理;和 參照預(yù)先按發(fā)聲形式所設(shè)定的上述音樂(lè)信號(hào)的功率和上述合成聲音的功率的比率,對(duì)根據(jù)上述發(fā)聲形式所產(chǎn)生的上述合成聲音波形的功率按照上述音樂(lè)信號(hào)的功率進(jìn)行調(diào)整的處理。
全文摘要
本發(fā)明的目的在于,提供能夠生成合成聲音的裝置、方法,該合成聲音具有同音樂(lè)取得協(xié)調(diào)的發(fā)聲形式。聲音合成裝置的音樂(lè)類(lèi)型推斷部21中,推斷所輸入的音樂(lè)信號(hào)屬于的音樂(lè)類(lèi)型,發(fā)聲形式選擇部23中,參照發(fā)聲形式信息記憶部24,根據(jù)音樂(lè)類(lèi)型決定發(fā)聲形式。韻律生成部11中,參照從韻律生成規(guī)則記憶部15<sub>1</sub>至15<sub>N</sub>中根據(jù)發(fā)聲形式所選擇的韻律生成規(guī)則記憶部,根據(jù)發(fā)音符號(hào)串產(chǎn)生韻律信息。單位波形選擇部12中,參照從單位波形數(shù)據(jù)記憶部16<sub>1</sub>至16<sub>N</sub>中根據(jù)發(fā)聲形式所選擇的單位波形數(shù)據(jù)記憶部,根據(jù)發(fā)音符號(hào)串和韻律信息選擇單位波形。波形生成部13中,從韻律信息和單位波形數(shù)據(jù)產(chǎn)生合成聲音波形。
文檔編號(hào)G10L13/10GK101379549SQ20078000488
公開(kāi)日2009年3月4日 申請(qǐng)日期2007年2月1日 優(yōu)先權(quán)日2006年2月8日
發(fā)明者加藤正德 申請(qǐng)人:日本電氣株式會(huì)社