專利名稱:語音波形內(nèi)插裝置及方法
技術(shù)領(lǐng)域:
本發(fā)明涉及語音波形的內(nèi)插裝置,例如涉及在分組通信系統(tǒng)中,用 于在接收側(cè)再生與語音分組的傳送途中消失的語音分組相當(dāng)?shù)恼Z音波形 的語音波形內(nèi)插裝置。并且,涉及例如可用于對蓄積的語音段的數(shù)據(jù)進(jìn) 行編輯或加工而生成新的語音數(shù)據(jù)的語音編輯/加工處理系統(tǒng)的語音波形 內(nèi)插裝置。
下面,將前者的語音分組通信系統(tǒng)作為代表例進(jìn)行說明。
背景技術(shù):
近年來,在因特網(wǎng)普及的背景下,經(jīng)由IP (Internet Protocol)網(wǎng)絡(luò) 來傳送將語音數(shù)據(jù)分組化的語音分組的、所謂VoIP (Voice over IP)通信 系統(tǒng)正在迅速普及。
在像這樣以分組單位來傳送PCM數(shù)據(jù)的IP網(wǎng)絡(luò)中,若應(yīng)接收的語 音分組的一部分消失或缺失,則導(dǎo)致通過該語音分組再生的語音的語音 質(zhì)量變差。因此,以往就已提出各種極力不會使用戶察覺到因該語音分 組消失等而引起的語音質(zhì)量劣化的方法。
作為該語音分組消失掩蔽方法之一,已知有ITU-T (International Telecommunication Union:國際電信聯(lián)盟)豐示準(zhǔn)G. 711 Appendix I。在該 G. 711 Appendix I中規(guī)定的分組消失掩蔽方法中,首先,利用波形相關(guān), 提取作為語音的物理特性之一的音調(diào)周期。并且,在與消失的語音分組 相當(dāng)?shù)牟糠?,重?fù)配置該提取的音調(diào)圖案,從而生成消失掩蔽信號。另 外,在連續(xù)消失語音分組的情況下,使該消失掩蔽信號慢慢衰減。
此外,還提出了幾種消失語音的內(nèi)插再生方法,例如可舉出下述的 [專利文獻(xiàn)1] [專利文獻(xiàn)3]。中公開了如下方式,即,賦予根據(jù)分組消失前正常接
6收到的語音數(shù)據(jù)估計(jì)的、音調(diào)周期的波動和功率變動,生成消失掩蔽信 號。并且,在[專利文獻(xiàn)2]中,參照分組消失前及消失后的分組之中的 至少一方,利用該音調(diào)變動特性和功率變動特性,估計(jì)語音消失區(qū)間的 音調(diào)變動及功率變動。并且,公開了一種通過使用該估計(jì)出的特性來再
生語音消失區(qū)間的語音波形的方式。此外,在[專利文獻(xiàn)3]中公開了如下
方式,g卩,通過非標(biāo)準(zhǔn)化差分運(yùn)算處理,計(jì)算與缺失之前輸入的語音分 組信號之間的最佳匹配波形,根據(jù)計(jì)算結(jié)果的最小值,由缺失之前輸入 的語音分組信號,決定要內(nèi)插的內(nèi)插信號。
專利文獻(xiàn)l:日本特開2001-228896號公報(bào) 專利文獻(xiàn)2: WO 2004/068098號公報(bào) 專利文獻(xiàn)3:日本特開平2-4062號公報(bào)
根據(jù)上述現(xiàn)有的消失語音的波形內(nèi)插方法,提取消失分組的前一個 波形或后一個波形,提取其音調(diào)周期,重復(fù)該音調(diào)波形,從而生成內(nèi)插 語音波形。該情況下,由于提取該消失分組的前一個或后一個波形,所 以無論該提取出的波形如何,都同樣地重復(fù)音調(diào)波形,生成內(nèi)插語音波 形。
用于上述用于生成內(nèi)插語音波形的前一個波形例如在母音的中間附 近,振幅為一定值以上,且振幅變動也小,比較穩(wěn)定時(shí),可以生成幾乎 沒有音質(zhì)劣化的語音波形。但是,例如在從母音變?yōu)檩o音,共振峰變化 較大的過渡部分,或呼氣段落末尾等,發(fā)生分組消失的情況下,即使上 述用于生成內(nèi)插語音波形的波形是自相關(guān)性高的周期性波形,也會出現(xiàn) 蜂鳴聲這樣的再生音,有時(shí)引起音質(zhì)劣化。將該情況示于圖。
圖14是表示發(fā)送語音波形(A)、以及對該發(fā)送來的語音波形(A) 之中的因語音分組消失而引起的波形缺失部分進(jìn)行內(nèi)插的內(nèi)插語音波 形(B)的圖。圖14 (A)中,一連串的語音波形之中的、因發(fā)生分組消 失(分組遺失)而在語音分組中發(fā)生缺失的部分表示為Pa。根據(jù)上述現(xiàn) 有的方法,始終提取該缺失部分Pa的前一個分組Pb,如圖14 (B)所示, 作為重復(fù)的分組Pb',插入配置到缺失部分Pa。
該pb'的波形似乎是不錯的波形,但若作為實(shí)際語音再生,則成為使用戶感到不快的蜂鳴聲。
發(fā)明內(nèi)容
因此,本發(fā)明是鑒于上述問題而提出的,其目的在于,提供一種不 產(chǎn)生不愉快的再生音的語音波形內(nèi)插裝置。
并且,本發(fā)明的目的還在于,提供一種用于解決上述情況的語音波 形內(nèi)插方法、以及用于計(jì)算機(jī)的語音波形內(nèi)插程序。
如下面使用
基于本發(fā)明的語音波形內(nèi)插裝置如下,其由如 下部分構(gòu)成-
(i) 語音存儲部,其存儲語音數(shù)據(jù);
(ii) 內(nèi)插波形生成部,其針對所述語音數(shù)據(jù)的一部分,利用該語音
數(shù)據(jù)的另一部分進(jìn)行內(nèi)插,生成語音數(shù)據(jù);
(m)波形結(jié)合部,其將來自所述語音存儲部的語音數(shù)據(jù)和替代該 語音數(shù)據(jù)的一部分的來自所述內(nèi)插波形生成部的內(nèi)插語音數(shù)據(jù)結(jié)合;以 及
(iv)內(nèi)插波形設(shè)定功能部,其判斷所述語音數(shù)據(jù)的一部分作為應(yīng) 由所述內(nèi)插波形生成部進(jìn)行內(nèi)插的內(nèi)插語音數(shù)據(jù)是否合適,選擇判斷為 合適的語音數(shù)據(jù),將該語音數(shù)據(jù)設(shè)定為所述內(nèi)插語音數(shù)據(jù)。其中,本發(fā) 明的最大的特征在于,上述(iv)的內(nèi)插波形設(shè)定功能部。
該內(nèi)插波形設(shè)定功能部(iv)具體還包括振幅信息分析單元,其 對來自所述語音存儲部的所述語音數(shù)據(jù),進(jìn)行其振幅信息分析;以及語 音波形判斷部,其根據(jù)該分析結(jié)果,判斷作為所述內(nèi)插語音數(shù)據(jù)是否合 適。
進(jìn)一步詳細(xì)地說,計(jì)算語音數(shù)據(jù)的每單位幀的振幅信息,根據(jù)時(shí)間 方向的振幅值,求出振幅包絡(luò)線,根據(jù)該振幅包絡(luò)線,確定應(yīng)該用于波 形內(nèi)插的附近波形在振幅包絡(luò)線上的位置。根據(jù)所確定的位置的振幅信 息,在上述語音波形判斷部中判斷是否是適合于上述重復(fù)的波形。
圖1是表示本發(fā)明的基本結(jié)構(gòu)的圖。
圖2是進(jìn)一步具體表示圖1的基本結(jié)構(gòu)的圖。
圖3是表示與圖14 (A)的波形相同的波形(A)、將波形(A)包
含在中間的長時(shí)間的語音波形(B)、以及通過波形(B)的振幅值計(jì)算得
到的振幅包絡(luò)線(C)的圖。
圖4是表示分組通信系統(tǒng)的語音波形內(nèi)插裝置的第一例的圖。 圖5是表示與圖14 (A)的波形相同的波形(A)、以及通過背景噪
聲區(qū)間內(nèi)插的語音波形(B)的圖。
圖6是表示與圖14 (A)的波形相同的波形(A)、以及通過后方語
音數(shù)據(jù)內(nèi)插的語音波形(B)的圖。
圖7是表示語音波形內(nèi)插裝置的第二例的圖。
圖8是表示圖7所示的語音波形內(nèi)插裝置的動作的流程圖。
圖9是進(jìn)一步詳細(xì)表示圖8所示的步驟S19的流程圖。
圖IO是表示語音波形內(nèi)插裝置的第三例的圖。
圖11是表示語音波形內(nèi)插裝置的第四例的圖。
圖12是表示對圖14 (A)的波形進(jìn)行變形的一例(A)、以及通過前
方語音數(shù)據(jù)內(nèi)插的語音波形(B)的圖。
圖13是表示圖6和圖12所示的進(jìn)行波形內(nèi)插時(shí)的動作的流程圖。 圖14是表示發(fā)送語音波形(A)、以及對該發(fā)送來的語音波形(A)
之中的因語音分組消失而引起的波形缺失部分進(jìn)行內(nèi)插的內(nèi)插語音波
形(B)的圖。
符號說明
l語音波形內(nèi)插裝置;2語音存儲部;3內(nèi)插波形生成部;4波形結(jié) 合部;5內(nèi)插波形設(shè)定功能部;6振幅信息分析部;7語音波形判斷部;8 振幅值計(jì)算部;9振幅信息存儲部;11有聲/無聲判斷部;12判斷闊值判 斷部;13振幅使用范圍設(shè)定部;14發(fā)言者識別部;15判斷閾值存儲部; 16振幅使用范圍存儲部
具體實(shí)施例方式
圖1是表示本發(fā)明的基本結(jié)構(gòu)的圖。如圖1所示,本發(fā)明涉及的語 音波形內(nèi)插裝置l具有語音存儲部2,其存儲語音數(shù)據(jù)Din;內(nèi)插波形 生成部3,其針對語音數(shù)據(jù)Di。的一部分,利用該語音數(shù)據(jù)Din的另一部 分進(jìn)行內(nèi)插,生成語音數(shù)據(jù)De;波形結(jié)合部4,其將來自語音存儲部2 的語音數(shù)據(jù)Din和替代該一部分的來自內(nèi)插波形生成部3的內(nèi)插語音數(shù) 據(jù)Dc結(jié)合,作為語音數(shù)據(jù)D。ut輸出;以及內(nèi)插波形設(shè)定功能部5,其判
斷上述的語音數(shù)據(jù)DiJ勺一部分作為應(yīng)在內(nèi)插波形生成部3內(nèi)插的內(nèi)插語
音數(shù)據(jù)是否合適,選擇判斷為合適的語音數(shù)據(jù),將該語音數(shù)據(jù)設(shè)定為內(nèi)
插語音數(shù)據(jù)Dc。
在此,內(nèi)插波形設(shè)定功能部5包括振幅信息分析單元6,其對來 自語音存儲部2的語音數(shù)據(jù)Din,進(jìn)行其振幅信息分析;以及語音波形判
斷部7,其根據(jù)該分析結(jié)果,判斷作為內(nèi)插語音數(shù)據(jù)De是否合適。
圖2是進(jìn)一步具體表示圖1的基本結(jié)構(gòu)的圖。另外,通過整個圖,
對相同結(jié)構(gòu)要素賦予相同標(biāo)號或符號。
圖2中進(jìn)一步具體表示圖1的振幅信息分析單元6。即,振幅信息
分析單元6具有振幅值計(jì)算部8,其計(jì)算語音數(shù)據(jù)Din的振幅值,得到
時(shí)間方向的振幅值;以及振幅信息存儲部9,其將該計(jì)算出的振幅值作為 振幅信息臨時(shí)存儲。該振幅值計(jì)算部8還計(jì)算振幅包絡(luò)線或該振幅的最 大值及最小值。
在此,語音波形判斷部7根據(jù)由上述時(shí)間方向的振幅信息確定的振 幅包絡(luò)線上的位置,判斷作為內(nèi)插語音數(shù)據(jù)Dc是否合適。另外,本圖 的右上所示的SW是擇一切換下述兩種情況的信號來作為輸出語音數(shù) 據(jù)D。ut的開關(guān),g卩,使輸入語音數(shù)據(jù)Din直接通過,或是包含通過內(nèi)插得
到的來自波形結(jié)合部5的內(nèi)插語音數(shù)據(jù)De的語音數(shù)據(jù)。在此,為了便于
理解本發(fā)明的原理,參照圖3。
圖3是表示與圖14 (A)的波形相同的波形(A)、將波形(A)包 含在中間的長時(shí)間的語音波形(B)、以及通過波形(B)的振幅值計(jì)算(8) 得到的振幅包絡(luò)線(C)的圖。本圖(A)的Pa部分發(fā)生語音分組消失的情況下,在語音波形判斷部7中判斷與該消失分組的前一個分組相當(dāng)?shù)?語音波形Pb作為內(nèi)插波形(De)是否合適。
為了說明該語音波形判斷部7中的判斷方法,參照圖3的(B)及(C)。
語音波形判斷部7對作為內(nèi)插波形的幾個候補(bǔ)進(jìn)行如下判斷將在振幅
信息分析部6中對以模擬波形表示時(shí)為該圖(B)所示的輸入語音數(shù)
據(jù)D,n進(jìn)行分析的結(jié)果,gP,以模擬表示時(shí)為該圖(C)所示的振幅包絡(luò)
線EV,作為輸入時(shí),作為該內(nèi)插波形是否合適。
該情況下,以該候補(bǔ)位于振幅包絡(luò)線EV上的哪一位置作為判斷基 準(zhǔn)。在此,分析本圖(C)的振幅包絡(luò)線EV, Pb部分的語音波形位于振
幅局部變小的位置,不能成為上述內(nèi)插波形的候補(bǔ)。并且,Pe,部分或Pc2
部分的各語音波形位于取振幅包絡(luò)線的極小值的位置,也不能成為上述 內(nèi)插波形的候補(bǔ)。此外,Pd部分語音波形僅接在振幅包絡(luò)線上的無聲區(qū)
間S的前面,也不能成為內(nèi)插波形的候補(bǔ)。若將這些Pb、 Pcl、 Pc2、 Pd的
任意一個所在的語音波形用作內(nèi)插波形,則例如會再生上述的蜂鳴聲那
樣的聲音。在此,本發(fā)明中,作為在內(nèi)插波形生成部3中用作內(nèi)插波形 的圖3 (C)的振幅包絡(luò)線(EV)上的波形,選擇不位于Pb、 Pel、 Pc2、 Pd等的波形。
通過上述的本發(fā)明的原理來實(shí)現(xiàn)用于語音編輯/加工處理系統(tǒng)的語 音內(nèi)插裝置或用于分組通信系統(tǒng)的語音波形內(nèi)插裝置。
前者的用于語音編輯/加工處理系統(tǒng)的語音波形內(nèi)插裝置由如下部 分構(gòu)成語音存儲部2,其蓄積多個語音段,進(jìn)行保持;內(nèi)插波形生成 部3,其通過重復(fù)使用該語音段,對一連串的語音數(shù)據(jù)Din的一部分迸行 內(nèi)插,生成語音數(shù)據(jù)D。;波形結(jié)合部4,其將存儲于語音存儲部2的語 音數(shù)據(jù)和替代其一部分的來自內(nèi)插波形生成部4的內(nèi)插語音數(shù)據(jù)結(jié)合;
以及內(nèi)插波形設(shè)定功能部5,其判斷語音數(shù)據(jù)的一部分作為應(yīng)在內(nèi)插波形 生成部3內(nèi)插的內(nèi)插語音數(shù)據(jù)是否合適,選擇判斷為合適的語音數(shù)據(jù),
將該語音數(shù)據(jù)設(shè)定為內(nèi)插語音數(shù)據(jù)。若使用該語音波形內(nèi)插裝置,例如 在進(jìn)行語音合成波形的標(biāo)簽中的輔音的音素邊界的決定處理時(shí),并且, 進(jìn)行語音合成時(shí)的語音段的配置處理時(shí),或者,進(jìn)行語速變換處理的情
11況下,決定語音段長度延長的語音段時(shí),能夠判斷相應(yīng)音段是否合適。
另一方面,后者的用于分組通信系統(tǒng)的語音波形內(nèi)插裝置由如下部 分構(gòu)成語音存儲部2,其按順序存儲依次接收的各分組之中、正常接收
到的各分組具有的語音數(shù)據(jù);內(nèi)插波形生成部3,其在因分組的消失(廢
棄或延遲)而在語音數(shù)據(jù)Din的一部分上發(fā)生缺失時(shí),利用語音數(shù)據(jù)Din
的另一部分對該缺失部進(jìn)行內(nèi)插,生成語音數(shù)據(jù)Dc;波形結(jié)合部4,其
將存儲于語音存儲部2的語音數(shù)據(jù)Din和替代該一部分的來自內(nèi)插波形生
成部3的內(nèi)插語音數(shù)據(jù)Dc結(jié)合;以及內(nèi)插波形設(shè)定功能部5,其判斷語
音數(shù)據(jù)Din的一部分作為應(yīng)在內(nèi)插波形生成部3內(nèi)插的內(nèi)插語音數(shù)據(jù)c是
否合適,選擇判斷為合適的語音數(shù)據(jù),將該語音數(shù)據(jù)設(shè)定為該內(nèi)插語音數(shù)據(jù)。
圖4是表示上述分組通信系統(tǒng)的語音波形內(nèi)插裝置的第一例的圖。 本圖中,參考符號"F"表示從分組通信網(wǎng)絡(luò)正常接收語音分組時(shí)激活的模 塊,另一方面,參考符號"G"表示檢測到來自分組通信網(wǎng)絡(luò)的一連串的語 音分組之中存在缺失的語音分組時(shí)激活的模塊。其中,這些模塊F及G 內(nèi)的結(jié)構(gòu)與圖2所示的結(jié)構(gòu)相同。
作為本發(fā)明要部的內(nèi)插波形設(shè)定功能部5由振幅值計(jì)算部8、振幅 信息存儲部9以及語音波形判斷部7構(gòu)成。在上述分組通信網(wǎng)絡(luò)中的分 組通信中,在分組正常接收區(qū)間,輸入語音數(shù)據(jù)Din被保存于語音存儲 部2。振幅值計(jì)算部8根據(jù)語音存儲部2中的語音數(shù)據(jù)Din,計(jì)算幀單位 的振幅值,計(jì)算振幅包絡(luò)線信息、振幅最大值、振幅最小值等振幅信息。 振幅信息存儲部9保存由振幅值計(jì)算部8計(jì)算出的振幅信息。
在發(fā)生分組消失的情況下,當(dāng)從語音存儲部2輸入該消失的分組的 前方或后方的波形位置到語音波形判斷部7時(shí),語音波形判斷部7確定 該部分在振幅包絡(luò)線(EV)上的位置。判斷應(yīng)作為內(nèi)插波形候補(bǔ)的波形 是否在振幅包絡(luò)線(EV)上的極小值位置或是無聲區(qū)間S的前一部分Pd, 將該判斷結(jié)果通知給內(nèi)插波形生成部3。
內(nèi)插波形生成部3按照該判斷結(jié)果,生成分組消失區(qū)間的波形。此 外,波形結(jié)合部4將正常接收到的區(qū)間的語音波形和由內(nèi)插波形生成部3生成的內(nèi)插區(qū)間的波形結(jié)合,并使這些波形的連結(jié)部分圓滑,將結(jié)合波 形作為輸出語音數(shù)據(jù)D。ut。
而且,語音波形判斷部7判斷作為替代候補(bǔ)的內(nèi)插語音數(shù)據(jù)R在振 幅包絡(luò)線(EV)上的位置至少是振幅極小位置Pel、 Pe2或是無聲區(qū)間的 前一位置Pd時(shí),不將該部分的語音數(shù)據(jù)釆用為內(nèi)插語音數(shù)據(jù)Dc,搜索該 部分的語音數(shù)據(jù)以外的位置上的其他語音數(shù)據(jù),或搜索背景噪聲區(qū)間(參 見圖5)。
圖5是表示與圖14 (A)的波形相同的波形(A)、以及通過背景噪 聲區(qū)間內(nèi)插的語音波形(B)的圖。圖5 (B)的參考符號Pn表示背景噪 聲區(qū)間。在判斷分組消失區(qū)間(Pa)的前一區(qū)間不適合波形重復(fù)的情況下, 也可以不通過該重復(fù)生成波形,而替代于此,將背景噪聲數(shù)據(jù)配置在分 組消失區(qū)間Pa。該背景噪聲區(qū)間的語音數(shù)據(jù)利用存儲于語音存儲部2的 語音數(shù)據(jù)和有聲/無聲的判斷結(jié)果(參見圖7的有聲/無聲判斷部11),僅 提取無聲的噪聲部分的語音數(shù)據(jù)來使用。另外,背景噪聲數(shù)據(jù)也時(shí)時(shí)刻
刻發(fā)生變化,所以使用區(qū)間優(yōu)選使用盡量接近消失分組Pa的語音數(shù)據(jù)。
此外,語音波形判斷部7將依次出現(xiàn)在應(yīng)被內(nèi)插的語音數(shù)據(jù)Din的時(shí) 間軸上的前方的前方語音數(shù)據(jù)的任意一個以及、依次出現(xiàn)在該應(yīng)被內(nèi)插 的語音數(shù)據(jù)Din的時(shí)間軸上的后方的后方語音數(shù)據(jù)的任意一個的至少一 方,設(shè)定為作為上述代替候補(bǔ)的內(nèi)插語音數(shù)據(jù)Dc (參見圖6)。
圖6是表示與圖14 (A)的波形相同的波形(A)、以及通過上述后 方語音數(shù)據(jù)(P》內(nèi)插的語音波形(B)的圖。圖6的內(nèi)插波形生成例是, 不僅對消失分組的前方的語音數(shù)據(jù)進(jìn)行判斷,還對消失分組的后方的語 音數(shù)據(jù)進(jìn)行判斷,生成內(nèi)插波形的例子。判斷為消失分組的前一個分組 不適合重復(fù)、而消失分組的后一個分組適合重復(fù)的情況下,重復(fù)配置該 判斷為合適的后方分組的語音數(shù)據(jù),從而生成內(nèi)插區(qū)間的波形De。但是, 只有在允許語音發(fā)生些許延遲的情況下,才能夠利用后方語音數(shù)據(jù)。
另外,內(nèi)插波形的生成方法當(dāng)然也可以相互組合,在基于波形重復(fù) 的內(nèi)插波形上重疊噪聲波形,或者在分組消失連續(xù)且較長的情況下,分 為消失分組區(qū)間的前半和后半,變更波形生成方法。圖7是表示語音波形內(nèi)插裝置的第二例的圖。圖7和圖4 (第一例) 之間的差異在于,追加了有聲/無聲判斷部11。即,基于該第二例的語音 波形內(nèi)插裝置1還具備將存儲于語音存儲部2的語音數(shù)據(jù)Din分類成有聲 部分和無聲部分來進(jìn)行判斷的有聲/無聲判斷部11,針對判斷出的有聲部 分,通過振幅計(jì)算部8計(jì)算其振幅最大值和振幅變動率,將該結(jié)果保持 在振幅信息存儲部9中;針對判斷出的無聲部分,通過振幅計(jì)算部8計(jì) 算其振幅平均值,將該結(jié)果保持在振幅信息存儲部9中。進(jìn)一步詳細(xì)說 明如下。
輸入語音數(shù)據(jù)Din被輸入到有聲/無聲判斷部11,被分類成語音區(qū)間 和無聲區(qū)間。在下一段的振幅值計(jì)算部8中,根據(jù)存儲于語音存儲部2 的輸入語音數(shù)據(jù)Din,以幀單位(例如4msec)計(jì)算語音的振幅值。除了 表示該振幅值的時(shí)間方向的變化的振幅包絡(luò)線(EV)的信息之外,還根 據(jù)上述有聲/無聲判斷部11進(jìn)行分類的結(jié)果,分別計(jì)算有聲區(qū)間的振幅的 最大值和最小值、語音區(qū)間的平均振幅。而且,在振幅信息存儲部9中 保存如上所述由振幅值計(jì)算部8計(jì)算出的振幅信息和有聲/無聲的判斷結(jié) 果。
在發(fā)生了分組消失的情況下,若從語音存儲部2輸入消失分組的前 方(或后方)的波形位置到語音波形判斷部7,則該語音波形判斷部7確 定該部分在振幅包絡(luò)線(EV)上的位置。判斷應(yīng)作為內(nèi)插候補(bǔ)的波形是 否是振幅包絡(luò)線(EV)上的極小值位置或是無聲區(qū)間S的前一部分。如 上所述,參見圖5,使用實(shí)際的語音波形進(jìn)行了說明。
引入上述有聲/無聲判斷部ll具有如下優(yōu)點(diǎn),不僅最大值、最小值、 極小值的計(jì)算精度有所提高,振幅值計(jì)算部8中的運(yùn)算負(fù)荷減輕。下面, 說明引入了該有聲/無聲判斷部11時(shí)的動作流程。
圖8是表示圖7所示的語音波形內(nèi)插裝置的動作的流程圖。圖8中,
步驟Slh判斷是否正常收到了分組。
步驟S12:若進(jìn)行了上述的正常接收(是),則取入其中的l個分組 數(shù)據(jù)(語音數(shù)據(jù)),
步驟S13:將該輸入語音數(shù)據(jù)Din存儲到語音存儲部2中。
14步驟S14:此外,上述有聲/無聲判斷部ll對語音數(shù)據(jù)Din進(jìn)行有聲 部分和無聲部分的分類處理,
步驟S15:根據(jù)該分類結(jié)果,進(jìn)行判斷。
步驟S16:通過上述判斷,判斷為有聲時(shí),計(jì)算語音數(shù)據(jù)的振幅包 絡(luò)線(EV)和該振幅的最大值,
步驟S17:另一方面,通過上述判斷,判斷為無聲時(shí),計(jì)算出該無 聲語音的振幅平均值(即,有聲語音的振幅的最小值),
步驟S18:將這些計(jì)算數(shù)據(jù)保持在振幅信息存儲部9中。
步驟S19:在上述初始步驟Sll中判斷為未能正常接收到分組(分
組消失)時(shí),根據(jù)在步驟S18中保持的振幅信息,進(jìn)行基于上述語音波
形判斷部7的判斷,
步驟S20:如上所述,通過內(nèi)插波形生成部3生成內(nèi)插語音數(shù)據(jù)Dc。 步驟S21:進(jìn)一步利用波形結(jié)合部4將輸入語音數(shù)據(jù)Din和內(nèi)插語音
數(shù)據(jù)De圓滑地結(jié)合,
步驟S22:得到輸出語音數(shù)據(jù)D。ut。在此,進(jìn)一步詳細(xì)說明上述步
驟S19。
圖9是更加詳細(xì)地表示圖8的步驟S19的流程圖。圖9中,
步驟S31:語音波形判斷部7調(diào)查要作為內(nèi)插語音波形候補(bǔ)的、振 幅包絡(luò)線EV (圖3)上的位置的振幅變化率。該振幅變化率較小之處包 含作為內(nèi)插波形不合適的部分。
步驟S32:但是,從振幅變化率較小的部分之中,通過下面的3個 步驟的判斷,判斷出作為內(nèi)插波形不合適的位置。首先,若(振幅值-振 幅最小值) <無聲前一區(qū)間判斷閾值,則立即判斷作為內(nèi)插波形不合適, 將判斷標(biāo)志設(shè)為OFF (不可使用)。
步驟S33:若上述不等式的成立為"否",則接著,調(diào)查(振幅值-振 幅最小值) <極小值判斷閾值1的不等式是否成立,
步驟S34:若該不等式成立(是),則進(jìn)一步調(diào)査(振幅最大值-振幅 值)<極小值判斷閾值2的不等式是否成立,
步驟S35:若該不等式成立(是),則最終不允許該語音數(shù)據(jù)作為內(nèi)插波形使用(判斷標(biāo)志K)FF)。參見上述圖3可知,例如進(jìn)入到本圖中 的振幅范圍"TH"內(nèi)時(shí),設(shè)定為不可使用。
步驟S36:因此,若上述步驟S31、 S33及S34的判斷結(jié)果的任意一 個為"否",則允許該語音數(shù)據(jù)作為內(nèi)插波形使用(判斷標(biāo)志-ON)。
圖10是表示語音波形內(nèi)插裝置的第三例的圖,圖11是表示語音波 形內(nèi)插裝置的第四例的圖。
簡單地說,第三例和第四例示出還具備判斷閾值設(shè)定部12的語音波 形內(nèi)插裝置,該判斷閾值設(shè)定部12根據(jù)存儲于語音存儲部2的語音數(shù) 據(jù)Di。和存儲于振幅信息存儲部9的振幅信息,設(shè)定語音波形判斷部7中 判斷作為內(nèi)插語音數(shù)據(jù)De是否合適時(shí)的振幅判斷閾值Tl,
并且還示出具備發(fā)言者識別部14的語音波形內(nèi)插裝置(圖ll),從 而對識別出的每個發(fā)言者設(shè)定上述振幅判斷閾值Tl,
還示出具備振幅使用范圍設(shè)定部13的語音波形內(nèi)插裝置(圖10、 圖11),該振幅使用范圍設(shè)定部13設(shè)定應(yīng)使用語音波形判斷部7所使用 的振幅信息之中的哪一范圍。
為了與時(shí)時(shí)刻刻變化的語音數(shù)據(jù)Dh對應(yīng),判斷閾值設(shè)定部12根據(jù) 語音存儲部2的語音數(shù)據(jù)和振幅信息存儲部9的振幅信息,計(jì)算進(jìn)行語 音波形判斷時(shí)的判斷閾值T1,存儲于判斷閾值存儲部15。另外,下面示 出各種判斷閾值的具體例。
-呼氣段落末尾判斷閾值=(無聲區(qū)間)振幅平均值xl.2
-極小值判斷閾值1=(有聲區(qū)間)振幅最小值xl.2 (參見圖9的S33)
-極小值判斷閾值2=(有聲區(qū)間)振幅最大值x0.8 (參見圖9的S34)
另一方面,在圖10和圖11的振幅使用范圍設(shè)定部13中設(shè)定語音波 形判斷部7所使用的振幅信息的使用范圍。作為振幅信息的使用范圍的 設(shè)定方式,可以考慮,(i)設(shè)定為時(shí)間范圍;(ii)參考有聲/無聲判斷 部11的判斷結(jié)果,將夾在2個無聲區(qū)間的有聲區(qū)間設(shè)定為振幅的使用范 圍;(iii)參考有聲/無聲判斷部11的判斷結(jié)果,將一呼氣段落設(shè)定為振 幅的使用范圍。
進(jìn)一步詳細(xì)說明上述(i) (iii)如下
16(i) 指定例如分組消失前3秒鐘的時(shí)間;
(ii) 根據(jù)有聲/無聲判斷部11的判斷結(jié)果,將夾在無聲和無聲之間 的區(qū)間設(shè)定為振幅使用范圍,無聲不僅包含只有背景噪聲的區(qū)間,還包 括摩擦音(例如"日語廿行"音的輔音部分)或爆破音(例如"日語夕行,, 音的輔音部分);
(iii) 根據(jù)有聲/無聲判斷部11的判斷結(jié)果,將一個呼氣段落、即一 口氣敘述的范圍設(shè)定為振幅使用范圍。
圖10和圖11的語音波形判斷部7使用振幅信息存儲部9的振幅信 息、判斷閾值存儲部15的判斷閾值、振幅使用范圍存儲部16的振幅使 用范圍,判斷語音波形是否是可重復(fù)使用的語音波形。
并且,由振幅信息存儲部9得到保持于振幅使用范圍存儲部16內(nèi)的 位于振幅使用范圍內(nèi)的振幅信息,計(jì)算振幅最小值、振幅最大值等。此 外,使用判斷閾值存儲部15的判斷閾值進(jìn)行判斷,對于此時(shí)的判斷方法, 如圖9所示的流程圖。
圖11的第四例中的發(fā)言者識別部14根據(jù)語音存儲部2的語音數(shù) 據(jù)Din,對發(fā)言者進(jìn)行識別。對于發(fā)言者的識別方法,通過FFT(Fast Fourier Transform,快速傅里葉變換)對語音數(shù)據(jù)迸行頻率變換,調(diào)查其平均頻 率、共振峰,從而進(jìn)行識別。根據(jù)發(fā)言者的不同,從母音轉(zhuǎn)移到輔音時(shí) 的振幅變化率有所不同,極小值部分的輔音的振幅平均值也不同,此外, 振幅最大值和振幅最小值之差也不同。在此,在判斷閾值存儲部15中存 儲各發(fā)言者的閾值信息。
在發(fā)生語音分組消失的情況下,根據(jù)語音存儲部2的語音數(shù)據(jù)識別 發(fā)言者,語音波形判斷部7使用保持于判斷閾值存儲部15內(nèi)的各發(fā)言者 的閾值信息,判斷波形,但此時(shí),通過使用各發(fā)言者的閾值,能夠進(jìn)一 步提高判斷性能。
波形內(nèi)插的方法如上所述有很多種。例如,上述的圖5和圖6所示 的方法,下面還示出一種方法。
圖12是表示對圖14 (A)的波形進(jìn)行變形的一例(A)、以及通過前 方語音數(shù)據(jù)內(nèi)插的語音波形(B)的圖。圖12的波形生成例是,僅使用消失分組Pa的前方語音波形數(shù)據(jù),生成內(nèi)插區(qū)間(W區(qū)間)波形的例子。 在判斷為分組消失區(qū)間(Pa)的前一區(qū)間(U區(qū)間)的語音波形不適合波 形重復(fù)使用的情況下,再判斷前方分組(V區(qū)間),其結(jié)果,判斷為適合 波形重復(fù)使用的情況下,將V區(qū)間的波形重復(fù)配置在W區(qū)間,再連續(xù)配 置U區(qū)間的波形,從而生成內(nèi)插區(qū)間W的波形PV。
此外,作為其他方式,使用消失分組的后方語音波形數(shù)據(jù)的情況下, 該消失分組區(qū)間后一個區(qū)間被判斷為不適合波形重復(fù)使用時(shí),再判斷其 后方的分組,判斷為在此處適合重復(fù)使用的情況下,首先,僅配置一次 認(rèn)為適合重復(fù)使用的上述區(qū)間的波形,重復(fù)使用上述后方分組的波形,
使它們相連,從而能夠生成內(nèi)插區(qū)間w的波形。
圖13是表示進(jìn)行圖6和圖12所示的波形內(nèi)插時(shí)的動作的流程圖。 圖13中,
步驟S41:在內(nèi)插波形設(shè)定功能部5中得到作為判斷對象的輸入語 音信號(Din)。
步驟S42:判斷形成該輸入語音信號的分組是消失分組的前方分組 還是后方分組,
步驟S43:若是前方分組,則對該波形(參見圖12的U區(qū)間)進(jìn)行 判斷。
步驟S44:根據(jù)該判斷結(jié)果,認(rèn)為該前方分組不適合在內(nèi)插區(qū)間重 復(fù)使用時(shí)(否);
步驟S45:進(jìn)一步將再前一個分組(圖12的V區(qū)間)作為判斷對象, 重復(fù)相同操作;
步驟S46:在步驟S44中判斷為適合在內(nèi)插區(qū)間重復(fù)使用吋(是), 通過該判斷為適合的前方波形,生成該內(nèi)插區(qū)間的波形。并且,其他內(nèi) 插方法如下。
步驟S47:在上述步驟S42中,判斷形成輸入語音信號的分組是消 失分組的前方分組還是后方分組,若是后方分組,則對其波形(參見圖6 的P》進(jìn)行判斷。
步驟S48:通過該判斷結(jié)果,認(rèn)為該后方分組不適合在內(nèi)插區(qū)間重復(fù)使用時(shí)(否),
步驟S49:將再后一個的分組作為判斷對象,重復(fù)相同操作,
步驟S50:在步驟S48中判斷為適合在內(nèi)插區(qū)間重復(fù)使用時(shí)(是),
通過該認(rèn)為合適的后方波形,生成在該內(nèi)插區(qū)間的波形。
以上所述的本發(fā)明的語音波形內(nèi)插裝置還可以作為方法的步驟來實(shí)
現(xiàn)。即, 一種語音波形內(nèi)插方法,針對所存儲的語音數(shù)據(jù)De的一部分, 利用該語音數(shù)據(jù)的另一部分進(jìn)行內(nèi)插,生成語音數(shù)據(jù),所述語音波形內(nèi)
插方法包括(i)存儲語音數(shù)據(jù)Din的第一步驟;(ii)第二步驟,判斷該 語音數(shù)據(jù)的一部分作為應(yīng)內(nèi)插的內(nèi)插語音數(shù)據(jù)Dc是否合適,選擇判斷為 合適的語音數(shù)據(jù),將該語音數(shù)據(jù)設(shè)定為內(nèi)插語音數(shù)據(jù)De;以及(iii)將 在第一步驟(i)中存儲的語音數(shù)據(jù)和在第二步驟(ii)中設(shè)定的內(nèi)插語音 數(shù)據(jù)D。結(jié)合的第三步驟。
此外,所述語音波形內(nèi)插方法在第二步驟(ii)中包括對在第一步 驟(i)中存儲的語音數(shù)據(jù)Din分析其振幅信息的分析步驟;以及根據(jù)其 分析結(jié)果判斷作為內(nèi)插語音數(shù)據(jù)De是否合適的語音波形判斷步驟。
并且,本發(fā)明可以作為語音波形內(nèi)插程序表現(xiàn),該語音波形內(nèi)插程
序使計(jì)算機(jī)針對所存儲的語音數(shù)據(jù)Din的一部分,利用該語音數(shù)據(jù)的另一
部分進(jìn)行內(nèi)插,生成語音數(shù)據(jù),所述語音波形內(nèi)插程序使計(jì)算機(jī)執(zhí)行如
下步驟(i)存儲語音數(shù)據(jù)Din的第一步驟;(ii)第二步驟,判斷該語音 數(shù)據(jù)的一部分作為應(yīng)內(nèi)插的內(nèi)插語音數(shù)據(jù)Dc是否合適,選擇判斷為合適 的語音數(shù)據(jù),將該語音數(shù)據(jù)設(shè)定為內(nèi)插語音數(shù)據(jù)Dc;以及(iii)將在第 一步驟(i)中存儲的語音數(shù)據(jù)和在第二步驟(ii)中設(shè)定的內(nèi)插語音數(shù)據(jù) 結(jié)合的第三步驟。
權(quán)利要求
1.一種語音波形內(nèi)插裝置,其特征在于,所述語音波形內(nèi)插裝置具有語音存儲部,其存儲語音數(shù)據(jù);內(nèi)插波形生成部,其針對所述語音數(shù)據(jù)的一部分,利用該語音數(shù)據(jù)的另一部分進(jìn)行內(nèi)插,生成語音數(shù)據(jù);波形結(jié)合部,其將來自所述語音存儲部的語音數(shù)據(jù)和替代該語音數(shù)據(jù)的一部分的來自所述內(nèi)插波形生成部的內(nèi)插語音數(shù)據(jù)結(jié)合;以及內(nèi)插波形設(shè)定功能部,其判斷所述語音數(shù)據(jù)的一部分作為應(yīng)在所述內(nèi)插波形生成部中內(nèi)插的內(nèi)插語音數(shù)據(jù)是否合適,選擇判斷為合適的語音數(shù)據(jù),將該合適的語音數(shù)據(jù)設(shè)定為所述內(nèi)插語音數(shù)據(jù)。
2. 根據(jù)權(quán)利要求1所述的語音波形內(nèi)插裝置,其特征在于,所述內(nèi) 插波形設(shè)定功能部包括-振幅信息分析單元,其針對來自所述語音存儲部的所述語音數(shù)據(jù), 分析其振幅信息;以及語音波形判斷部,其根據(jù)其分析結(jié)果,判斷作為所述內(nèi)插語音數(shù)據(jù) 是否合適。
3. 根據(jù)權(quán)利要求1所述的語音波形內(nèi)插裝置,其特征在于, 所述振幅信息分析單元具有振幅值計(jì)算部,其計(jì)算所述語音數(shù)據(jù)的振幅值,得到時(shí)間方向的振 幅值;以及振幅信息存儲部,其將該計(jì)算出的振幅值作為振幅信息臨時(shí)存儲, 所述語音波形判斷部根據(jù)由所述時(shí)間方向的振幅信息確定的振幅包 絡(luò)線上的位置,判斷作為所述內(nèi)插語音數(shù)據(jù)是否合適。
4. 根據(jù)權(quán)利要求3所述的語音波形內(nèi)插裝置,其特征在于,所述語 音波形判斷部在判斷為作為替代候補(bǔ)的所述內(nèi)插語音數(shù)據(jù)的所述振幅包 絡(luò)線上的位置至少是振幅極小值位置或無聲區(qū)間的前一位置時(shí),不將相 應(yīng)部分的語音數(shù)據(jù)作為所述內(nèi)插語音數(shù)據(jù)釆用,而搜索相應(yīng)部分的語音數(shù)據(jù)以外的位置上的其他語音數(shù)據(jù)或背景噪音區(qū)間。
5. 根據(jù)權(quán)利要求4所述的語音波形內(nèi)插裝置,其特征在于,所述語音波形判斷部將在應(yīng)被內(nèi)插的所述語音數(shù)據(jù)的時(shí)間軸上的前方依次出現(xiàn) 的前方語音數(shù)據(jù)的任意一個、以及在應(yīng)被內(nèi)插的所述語音數(shù)據(jù)的時(shí)間軸 上的后方依次出現(xiàn)的后方語音數(shù)據(jù)的任意一個的至少一方,設(shè)為作為所 述替代候補(bǔ)的所述內(nèi)插語音數(shù)據(jù)。
6. 根據(jù)權(quán)利要求3所述的語音波形內(nèi)插裝置,其特征在于,所述語 音波形內(nèi)插裝置還具有將存儲于所述語音存儲部的所述語音數(shù)據(jù)分類成 有聲部分和無聲部分來進(jìn)行判斷的有聲/無聲判斷部,對于判斷出的有聲 部分,在所述振幅計(jì)算部中計(jì)算其振幅最大值和振幅變動率,將其結(jié)果 保持在所述振幅信息存儲部中,針對判斷出的無聲部分,在所述振幅計(jì) 算部中計(jì)算其振幅平均值,將其結(jié)果保持在所述振幅信息存儲部中。
7. 根據(jù)權(quán)利要求3所述的語音波形內(nèi)插裝置,其特征在于,所述語 音波形內(nèi)插裝置還具備判斷閾值設(shè)定部,該判斷閾值設(shè)定部根據(jù)存儲于 所述語音存儲部的所述語音數(shù)據(jù)和存儲于所述振幅信息存儲部的振幅信 息,設(shè)定所述語音波形判斷部中判斷作為所述內(nèi)插語音數(shù)據(jù)是否合適時(shí) 的振幅判斷閾值。
8. 根據(jù)權(quán)利要求7所述的語音波形內(nèi)插裝置,其特征在于,所述語 音波形內(nèi)插裝置還具備發(fā)言者識別部,對識別出的每個發(fā)言者設(shè)定所述 振幅判斷閾值。
9. 根據(jù)權(quán)利要求6所述的語音波形內(nèi)插裝置,其特征在于,所述語 音波形內(nèi)插裝置還具備振幅使用范圍設(shè)定部,該振幅使用范圍設(shè)定部設(shè) 定應(yīng)使用所述語音波形判斷部所使用的所述振幅信息之中的哪個范圍。
10. 根據(jù)權(quán)利要求9所述的語音波形內(nèi)插裝置,其特征在于,所述 振幅使用范圍設(shè)定為時(shí)間范圍。
11. 根據(jù)權(quán)利要求9所述的語音波形內(nèi)插裝置,其特征在于,所述振 幅使用范圍參考所述有聲/無聲判斷部的判斷結(jié)果,將夾在2個無聲區(qū)間 的有聲區(qū)間設(shè)定為振幅的使用范圍。
12. 根據(jù)權(quán)利要求9所述的語音波形內(nèi)插裝置,其特征在于,所述振幅使用范圍參考所述有聲/無聲判斷部的判斷結(jié)果,將一個呼氣段落設(shè) 定為振幅使用范圍。
13. —種用于分組通信系統(tǒng)的語音波形內(nèi)插裝置,其特征在于,所 述語音波形內(nèi)插裝置具有語音存儲部,其按順序存儲依次接收的各分組之中、正常接收到的各分組具有的語音數(shù)據(jù);內(nèi)插波形生成部,其在因分組的消失而在所述語音數(shù)據(jù)的一部分上 發(fā)生缺失時(shí),利用所述語音數(shù)據(jù)的另一部分對該缺失部進(jìn)行內(nèi)插,生成內(nèi)插語音數(shù)據(jù);波形結(jié)合部,其將存儲于所述語音存儲部的語音數(shù)據(jù)和替代該語音 數(shù)據(jù)的一部分的來自所述內(nèi)插波形生成部的內(nèi)插語音數(shù)據(jù)結(jié)合;以及內(nèi)插波形設(shè)定功能部,其判斷所述語音數(shù)據(jù)的一部分作為應(yīng)在所述 內(nèi)插波形生成部內(nèi)插的內(nèi)插語音數(shù)據(jù)是否合適,選擇判斷為合適的語音 數(shù)據(jù),將該合適的語音數(shù)據(jù)設(shè)定為所述內(nèi)插語音數(shù)據(jù)。
14. 一種用于語音編輯/加工處理系統(tǒng)的語音波形內(nèi)插裝置,其特征 在于,所述語音波形內(nèi)插裝置具有語音存儲部,其蓄積多個語音段,并保持;內(nèi)插波形生成部,其生成通過所述語音段的重復(fù)使用而對一連串語 音數(shù)據(jù)的一部分進(jìn)行內(nèi)插的語音數(shù)據(jù);波形結(jié)合部,其將存儲于所述語音存儲部的語音數(shù)據(jù)和替代該語音 數(shù)據(jù)的一部分的來自所述內(nèi)插波形生成部的內(nèi)插語音數(shù)據(jù)結(jié)合;以及內(nèi)插波形設(shè)定功能部,其判斷所述語音數(shù)據(jù)的一部分作為應(yīng)在所述 內(nèi)插波形生成部內(nèi)插的內(nèi)插語音數(shù)據(jù)是否合適,選擇判斷為合適的語音 數(shù)據(jù),將該合適的語音數(shù)據(jù)設(shè)定為所述內(nèi)插語音數(shù)據(jù)。
15. —種語音波形內(nèi)插方法,針對所存儲的語音數(shù)據(jù)的一部分,利用 該語音數(shù)據(jù)的另一部分迸行內(nèi)插,生成語音數(shù)據(jù),該語音波形內(nèi)插方法 的特征在于,所述語音波形內(nèi)插方法包括存儲所述語音數(shù)據(jù)的第一步驟;第二步驟,判斷所述語音數(shù)據(jù)的一部分作為應(yīng)內(nèi)插的所述內(nèi)插語音數(shù)據(jù)是否合適,選擇判斷為合適的語音數(shù)據(jù),將該合適的語音數(shù)據(jù)設(shè)定為所述內(nèi)插語音數(shù)據(jù);以及將在所述第一步驟中存儲的語音數(shù)據(jù)和在所述第二步驟中設(shè)定的所 述內(nèi)插語音數(shù)據(jù)結(jié)合的第三步驟。
16. 根據(jù)權(quán)利要求15所述的語音波形內(nèi)插方法,其特征在于,所述 第二步驟包括對在所述第一步驟中存儲的所述語音數(shù)據(jù)分析其振幅信息的分析步 驟;以及語音波形判斷步驟,根據(jù)其分析結(jié)果,判斷作為所述內(nèi)插語音數(shù)據(jù) 是否合適。
17. —種語音波形內(nèi)插程序,使計(jì)算機(jī)針對所存儲的語音數(shù)據(jù)的一 部分,利用該語音數(shù)據(jù)的另一部分進(jìn)行內(nèi)插,生成語音數(shù)據(jù),該語音波 形內(nèi)插程序的特征在于,所述語音波形內(nèi)插程序執(zhí)行如下步驟存儲所述語音數(shù)據(jù)的第一步驟;第二步驟,判斷所述語音數(shù)據(jù)的一部分作為應(yīng)內(nèi)插的所述內(nèi)插語音 數(shù)據(jù)是否合適,選擇判斷為合適的語音數(shù)據(jù),將該語音數(shù)據(jù)設(shè)定為所述 內(nèi)插語音數(shù)據(jù);以及將在所述第一步驟中存儲的語音數(shù)據(jù)和在所述第二步驟中設(shè)定的所 述內(nèi)插語音數(shù)據(jù)結(jié)合的第三步驟。
全文摘要
本發(fā)明涉及一種語音波形內(nèi)插裝置及方法,其針對所存儲的語音數(shù)據(jù)(D<sub>in</sub>)的一部分,利用該語音數(shù)據(jù)的另一部分進(jìn)行內(nèi)插,生成語音數(shù)據(jù)(D<sub>c</sub>)。為此,所述語音波形內(nèi)插裝置具有語音存儲部(2);生成內(nèi)插語音數(shù)據(jù)(D<sub>c</sub>)的內(nèi)插波形生成部(3);輸出通過語音數(shù)據(jù)(D<sub>c</sub>)將一部分替換的語音數(shù)據(jù)(D<sub>out</sub>)的波形結(jié)合部(4);以及內(nèi)插波形設(shè)定功能部(5),其判斷上述語音數(shù)據(jù)的另一部分作為在內(nèi)插波形生成部(3)中生成的內(nèi)插語音數(shù)據(jù)(D<sub>c</sub>)是否合適,并選擇合適的語音數(shù)據(jù)。
文檔編號G10L19/08GK101542593SQ20078004330
公開日2009年9月23日 申請日期2007年3月12日 優(yōu)先權(quán)日2007年3月12日
發(fā)明者松本智佳子 申請人:富士通株式會社