亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

用于建模語音頻譜的系統(tǒng)和方法

文檔序號:2830563閱讀:458來源:國知局
專利名稱:用于建模語音頻譜的系統(tǒng)和方法
技術(shù)領(lǐng)域
本發(fā)明總體涉及語音處理。更特別地,本發(fā)明涉及諸如語音編 碼、話音轉(zhuǎn)換和文本到語音合成的語音處理應(yīng)用。
背景技術(shù)
本部分意在提供在權(quán)利要求書中陳述的本發(fā)明的背景或上下 文。本文的描述可包括將被貫徹的概念,但前面被表達(dá)和貫徹的內(nèi) 容并非是必須的。因而,除非在本文指出,在此部分所描述的并非 是在該申請中的說明書和權(quán)利要求書的現(xiàn)有技術(shù),以及并非通過包 含于此部分內(nèi)而承認(rèn)其為現(xiàn)有技術(shù)。許多語音模型依賴于基于線性預(yù)測(LP)的方法,其中使用 LP系數(shù)對聲道(vocal tract)進(jìn)行建模。繼而,使用進(jìn)一步的技術(shù)對 激勵信號(即,LP殘差(residual))建模。下面是一些傳統(tǒng)技術(shù)。 第一,可將激勵建模為周期性脈沖(在話音語音(voiced speech )期 間)或者噪聲(在非話音語音(unvoiced speech )期間)。然而,由 于話音/非話音硬決策,限制了可獲得的質(zhì)量。第二,可使用激勵頻 譜對激勵建模,其將在時變的截止頻率之下的激勵頻譜認(rèn)為是話音 的,而將在該頻率之上的激勵頻譜認(rèn)為是非話音的。這種頻帶切分 方法能夠在語音信號的許多部分上令人滿意地執(zhí)行,但是問題依然 出現(xiàn),尤其是在具有混合的聲音和噪聲語音的頻譜的情況下。第三, 可使用多帶激勵(MBE, multiband excitation )模型。在此模型中, 頻譜可包括若干話音的頻帶和非話音的頻帶(多達(dá)諧波的數(shù)量)。 對于每個頻帶執(zhí)行單獨的話音/非話音決策。盡管在一些情況下是相 當(dāng)可接受的,但是MBE模型的性能關(guān)于對多個頻帶的話音/非話音 硬決策依然具有受限的質(zhì)量。第四,在波形內(nèi)插(WI, waveforminterpolation)語音編碼中,將激勵建模為慢漸變波形(SEW, slowly evolving waveform ) 和快漸變波形 (REW, rapidly evolving waveform) 。 SEW對應(yīng)于話音的貢獻(xiàn),而REW代表非話音的分布。 不幸的是,由于高復(fù)雜度和對于獲得SEW和REW的完美分割不總 是可行,此模型受到損害。因此,希望提供 一 種改進(jìn)的用于建模語音頻譜的系統(tǒng)和方法, 以解決上面提出的許多問題。發(fā)明內(nèi)容本發(fā)明的多種實施方式提供了用于以話音的和非話音的貢獻(xiàn) 二者能夠共存于某頻率的方式來建模語音的系統(tǒng)和方法。為將復(fù)雜 度保持在適中的程度,使用三組頻譜帶(或者高達(dá)三種不同類型的 頻帶)。在一個特定實施方式中,最低頻帶或頻帶組完全是話音的, 中間頻帶或頻帶組包含話音的和非話音的貢獻(xiàn)兩者,而最高頻帶或 頻帶組是完全非話音的。此種實現(xiàn)在需要的場合提供了高的建模精 度,并且也以低計算負(fù)載支持較簡單的情況??墒褂帽景l(fā)明的實施 方式用于語音編碼和其它語音處理應(yīng)用,諸如文本到語音合成和話 音轉(zhuǎn)換。本發(fā)明的多種實施方式在語音建模,尤其在較弱的話音語音的 情況下,提供了高精度,與此同時,僅承受適中的計算負(fù)載。多種 實施方式相對于傳統(tǒng)裝置也提供了在精度和復(fù)雜度之間的改進(jìn)的平衡。當(dāng)結(jié)合附圖而考慮時,從下文的詳細(xì)描述中,本發(fā)明的這些和 其它優(yōu)點和特征,連同其操作的方式和組織將變得明顯,其中貫穿 下文描述的若干附圖,相同的單元具有相同的數(shù)字。


圖1是示出了可以如何實現(xiàn)多種實施方式的流程圖;圖2是可在本發(fā)明的實現(xiàn)中使用的移動電話的透視圖;以及圖3是對圖2移動電話的電話電路的示意性展現(xiàn)。
具體實施例方式
本發(fā)明的多種實施方式提供了用于以話音的和非話音的貢獻(xiàn) 二者能夠共存于某頻率的方式來建模語音的系統(tǒng)和方法。為將復(fù)雜 度保持在適中的程度,使用三個頻譜帶集合(或者高達(dá)三種不同類 型的頻帶)。在一個特定實施方式中,最低頻帶或頻帶組完全是話 音的,中間頻帶或頻帶組包含話音的和非話音的貢獻(xiàn)兩者,而最高 頻帶或頻帶組是完全非話音的。此種實現(xiàn)在需要的場合提供了高的 建模精度,并且也以低計算負(fù)載支持較簡單的情況。可使用本發(fā)明 的實施方式用于語音編碼和其它語音處理應(yīng)用,諸如文本到語音合 成和語音轉(zhuǎn)換。
本發(fā)明的多種實施方式在語音建模,尤其在較弱的話音語音的 情況下,提供了高精度,與此同時,僅承受適中的計算負(fù)載。多種 實施方式相對于傳統(tǒng)裝置也提供了在精度和復(fù)雜度之間的改進(jìn)的平衡。
圖1是示出了本發(fā)明的一個特定實施方式的實現(xiàn)的流程圖。在 圖1的100,接收語音幀(例如,20毫秒幀)作為輸入。在110,計 算當(dāng)前幀的音高估計(pitch estimate ),并獲得對在音高頻率及其諧 波所采樣的頻譜(或激勵頻譜)的估計。然而,應(yīng)當(dāng)指出,可用不 同于音高諧波的方式對頻譜采樣。在120,在每個諧波頻率執(zhí)行調(diào)聲 估計。作為對獲得話音(例如,使用值1.0指出)和非話音(例如, 使用值0.0指出)之間硬決策的替代,獲得"調(diào)聲似然性(voicing likelihood),,(例如,在從0.0到l.O的范圍之間)。由于本質(zhì)上調(diào) 聲不是離散值,可將多種已知估計技術(shù)用于此過程。
在130,指明話音頻帶??赏ㄟ^以下來對此加以實現(xiàn)從頻譜 的低頻端開始,并經(jīng)過針對諧波頻率的調(diào)聲值,直到調(diào)聲似然性下 降到預(yù)先確定的閾值(例如0.9)之下。話音頻帶的寬度甚至可以為 0,或者如果需要的話,話音頻帶可覆蓋整個頻譜。在140,指明非話音頻帶??赏ㄟ^以下來對此加以實現(xiàn)開始于頻i普的高頻端,經(jīng) 過針對諧波頻率的調(diào)聲值,直到調(diào)聲似然性大于預(yù)先確定的閾值(例 如O.l)。同話音頻帶類似,非話音頻帶的寬度可以是0,或者,如 果必要的話,該頻帶也可覆蓋整個頻語。應(yīng)當(dāng)指出,對于話音頻帶 和非話音頻帶二者,可使用多種比例和/或范圍,以及如果必要或者 需要的話,可將個別的"話音值"和"非話音值"定位在頻譜的多 個部分。在150,將在話音頻帶和非話音頻帶之間的頻譜區(qū)域指定為 混合頻帶。如同用于話音頻帶和非話音頻帶的情況,混合頻帶的寬 度可從0延伸到覆蓋整個頻譜。如果必須或者需要的話,也可用其 它方式定義混合頻帶。
在160,創(chuàng)建針對混合頻帶的"調(diào)聲形狀(voicing shape ),,。 用于執(zhí)行此動作的一種選項同樣地涉及〗吏用調(diào)聲似然性。例如,如 果在調(diào)聲估計中使用的窗口 (bins)寬于諧波間隔,那么可使用在此 點或者在下面解釋的180處的內(nèi)插來重定義形狀。在語音編碼的情 況下,可進(jìn)一步處理或簡化調(diào)聲形狀,以允許對信息的有效壓縮。 在簡單的情況下,可使用該頻帶內(nèi)的線性模型。
在170,存儲所獲得的模型的參數(shù)(在語音編碼的情況下), 或者在話音轉(zhuǎn)換的情況下,傳遞所獲得的模型的參數(shù)用于進(jìn)一步處 理或者用于語音合成。在180,基于模型參數(shù)重建頻語的振幅和相位。 在話音頻帶中,假定相位是線性演化(evolve linearly)。在非話音 頻帶,相位可以是隨機的。在混合頻帶中,可以將兩種貢獻(xiàn)組合以 實現(xiàn)組合的振幅和相位值,或者可使用兩種單獨的值來表示兩種貢 獻(xiàn)(依賴于合成技術(shù))。在190,將頻i普轉(zhuǎn)換到時域。此轉(zhuǎn)換可使用 例如離散傅立葉變換或正弦振蕩器而發(fā)生??赏ㄟ^執(zhí)行線性預(yù)測合 成濾波器或者通過是用傳統(tǒng)上已知的其它過程來將所合成的激勵轉(zhuǎn) 換為語音而實現(xiàn)語音建模的其余部分。
如同此處所討論的,從110到170的項特別地涉及語音分析或 編碼,而從180到190的項特別地涉及語音合成或解碼。
除了在圖1中描繪的過程,以及如同上面所討論的,對編碼和解碼過程的多種變化也是可能的。例如,處理框架和參數(shù)估計算法 可不同于上面所討論的那些。此外,可使用不同的調(diào)聲檢測算法, 以及每個頻率窗口的寬度可以是可變的。而且,該建模僅使用混合 頻帶,或者可以使用代表三種不同頻帶類型的頻帶,而替代對每種 類型的一個頻帶的使用。依然進(jìn)一步地,可用不同于上面所討論的 方式來執(zhí)行對調(diào)聲形狀的確定,以及合成方法的細(xì)節(jié)可以是多樣的。 本發(fā)明的多種實施方式在語音建模,尤其在較弱的話音語音的 情況下,提供了高精度,與此同時,僅承受適中的計算負(fù)載。多種 實施方式相對于傳統(tǒng)裝置也提供了在精度和復(fù)雜度之間的改進(jìn)的平 衡。
實現(xiàn)本發(fā)明的多種實施方式的設(shè)備可使用多種傳輸技術(shù)來通
信,傳輸技術(shù)包括但不限于碼分多址(CDMA)、全球移動通信系 統(tǒng)(GSM)、通用移動通信系統(tǒng)(UMTS)、時分多址(TDMA)、 頻分多址(FDMA)、傳輸控制協(xié)議/因特網(wǎng)協(xié)議(TCP/IP)、短消 息傳送服務(wù)(SMS)、多媒體消息傳送服務(wù)(MMS)、電子郵件、 即時消息傳送服務(wù)(IMS)、藍(lán)牙、IEEE802.il等。通信設(shè)備可使 用包括但不限于射頻、紅外、激光、線纜連接及其類似的多種介質(zhì) 而通信。
圖2和3示出了其中可實現(xiàn)本發(fā)明的一種代表性移動電話12。 然而,應(yīng)當(dāng)理解,本發(fā)明并非意在限制于移動電話12或者其它電子 設(shè)備的一種特定類型。圖2和3的移動電話12包括外殼30、液晶顯 示器形式的顯示器32、鍵區(qū)34、麥克風(fēng)36、耳機38、電池40、紅 外端口42、天線44、根據(jù)本發(fā)明的實施方式的UICC形式的智能卡 46、讀卡器48、無線電接口電路52、編解碼器電路54、控制器56 和存儲器58。單獨的電路和單元全都是現(xiàn)有技術(shù)中(例如,Nokia 系列的移動電話中)公知的類型。
在方法步驟的 一般上下文中描述了本發(fā)明,通過包括諸如程序 代碼的由在網(wǎng)絡(luò)環(huán)境中的計算機執(zhí)行的計算機可執(zhí)行指令的程序產(chǎn) 品,可將其實現(xiàn)于一種實施方式。 一般地,程序模塊包括執(zhí)行特定任務(wù)或?qū)崿F(xiàn)特定抽象數(shù)據(jù)類型的例程、程序、對象、組件、數(shù)據(jù)結(jié) 構(gòu)等。同數(shù)據(jù)結(jié)構(gòu)相關(guān)聯(lián)的計算機可執(zhí)行指令,以及程序模塊,代
指令或相關(guān)聯(lián)的數(shù)據(jù)結(jié)構(gòu)的特定序列代表了用于實現(xiàn)在此類步驟中 描述的功能的對應(yīng)活動的例子。
可用標(biāo)準(zhǔn)編程技術(shù),使用基于規(guī)則的邏輯以及用于實現(xiàn)多種動
作的其它邏輯,實現(xiàn)本發(fā)明的軟件和web實現(xiàn)。也應(yīng)當(dāng)指出,此處 以及在權(quán)利要求書中所使用的單詞"組件"和"模塊"意在包括使 用一行或多行軟件代碼的實現(xiàn),和/或硬件實現(xiàn),和/或接收手工輸入 的裝置。
已經(jīng)為了示出和描述的目的而展現(xiàn)了本發(fā)明的實施方式的前 述描述。并非意在窮盡或限制本發(fā)明于所公開的精確形式,以及按 照上述教導(dǎo),調(diào)整和變化是可能的,或者從本發(fā)明的實踐中可獲得 調(diào)整和變化。選擇和描述實施方式以便解釋本發(fā)明的原則及其實際 應(yīng)用,以允許所屬領(lǐng)域技術(shù)人員來在多種實施方式中用適合于特定 使用目的的多種調(diào)整來利用本發(fā)明。
權(quán)利要求
1. 一種獲得語音幀模型的方法,包括獲得對所述語音幀的頻譜估計;為在所估計的頻譜內(nèi)的每個頻點分配調(diào)聲似然值;標(biāo)識包括具有第一集合的調(diào)聲似然值的頻點的至少一個話音頻帶;標(biāo)識包括具有第二集合的調(diào)聲似然值的頻點的至少一個非話音頻帶;標(biāo)識包括具有第三集合的調(diào)聲似然值的頻點的至少一個混合頻帶;創(chuàng)建針對頻點的所述至少一個混合頻帶的調(diào)聲形狀。
2. 根據(jù)權(quán)利要求1的所述方法,其中所述至少 一 個話音頻帶包括具有在第 一 取值范圍內(nèi)的調(diào)聲似然 值的頻點;所述至少 一 個非話音頻帶包括具有在第二取值范圍內(nèi)的調(diào)聲似 然值的頻點;所述至少一個混合頻帶包括具有在所述至少一個話音頻帶和所 述至少 一 個非話音頻帶之間的調(diào)聲似然值的頻點。
3. 根據(jù)權(quán)利要求1或2的所述方法,其中在所確定的音高頻率 及其諧波上采樣用于所述語音幀的頻譜估計。
4. 根據(jù)權(quán)利要求1-3中任一項的所述方法,進(jìn)一步包括存儲用 于所獲得的模型的參數(shù)。
5. 根據(jù)權(quán)利要求1-4中任一項的所述方法,進(jìn)一步包括向遠(yuǎn)程 設(shè)備傳送用于所獲得的模型的參數(shù)。
6. 根據(jù)權(quán)利要求1-5中任一項的所述方法,進(jìn)一步包括進(jìn)一步 處理用于所獲得的模型的參數(shù)。
7. 根據(jù)權(quán)利要求1-6中任一項的所述方法,其中使用在所述至 少 一 個混合頻帶中的調(diào)聲似然值而實現(xiàn)對調(diào)聲形狀的創(chuàng)建。
8. 根據(jù)權(quán)利要求1-7中任一項的所述方法,其中對調(diào)聲形狀的創(chuàng)建包括在所述至少 一個混合頻帶中的調(diào)聲似然值之間內(nèi)插值。
9. 根據(jù)權(quán)利要求1和3-8中任一項的所述方法,其中所述至少 一個話音頻帶、所述至少一個非話音頻帶和所述至少一個混合頻帶 中的至少其一,覆蓋了頻點的整個頻譜。
10. 根據(jù)權(quán)利要求1和3-9中任一項的所述方法,其中所述至少 一個話音頻帶、所述至少一個非話音頻帶和所述至少一個混合頻帶 中的至少其一,沒有覆蓋頻點的頻語的任何部分。
11. 根據(jù)權(quán)利要求1-7中任一項的所述方法,其中所述至少一個 話音頻帶、所述至少一個非話音頻帶和所述至少一個混合頻帶中的 每個,包括單一頻帶。
12. —種實現(xiàn)于計算機可讀介質(zhì)中的計算機程序產(chǎn)品,用于獲得語音幀模型,所述計算機程序產(chǎn)品包括用于執(zhí)行權(quán)利要求1的動 作的計算機代碼。
13. —種裝置,包括 處理器,以及存儲器單元,其通信地連接到所述處理器,并包括用于獲得語 音幀模型的計算機代碼,所述存儲器單元包括用于獲得對所述語音幀的頻譜的估計的計算機代碼;用于為在所估計的頻譜內(nèi)的每個頻點分配調(diào)聲似然值的計算機代碼;用于標(biāo)識包括具有在第 一 取值范圍內(nèi)的調(diào)聲似然值的頻點的至 少 一 個話音頻帶的計算機代碼;用于標(biāo)識包括具有在第二取值范圍內(nèi)的調(diào)聲似然值的頻點的至 少 一 個非話音頻帶的計算機代碼;用于標(biāo)識包括具有在所述至少一個話音頻帶和所述至少一個非 話音頻帶之間的調(diào)聲似然值的頻點的至少 一 個混合頻帶的計算機代 碼;以及用于創(chuàng)建針對頻點的所述至少 一 個混合頻帶的調(diào)聲形狀的計算機代碼。
14. 根據(jù)權(quán)利要求13的所述裝置,其中所述至少 一 個話音頻帶包括具有在第 一 取值范圍內(nèi)的調(diào)聲似然 值的頻點;所述至少一個非話音頻帶包括具有在第二取值范圍內(nèi)的調(diào)聲似 然值的頻點;以及所述至少一個混合頻帶包括具有在所述至少一個話音頻帶和所 述至少 一 個非話音頻帶之間的調(diào)聲似然值的頻點。
15. 根據(jù)權(quán)利要求13或14的所述裝置,其中在所確定的音高 頻率及其諧波上采樣用于所述語音幀的頻譜估計。
16. 根據(jù)權(quán)利要求13-15中任一項的所述裝置,其中使用在至少 一個混合頻帶中的話音似然值而實現(xiàn)對所述調(diào)聲形狀的所述創(chuàng)建。
17. 根據(jù)權(quán)利要求13以及權(quán)利要求15-16中任一項的所述裝置, 其中所述至少一個話音頻帶、所述至少一個非話音頻帶和所述至少 一個混合頻帶中的至少其 一 ,覆蓋了頻點的整個頻譜。
18. 根據(jù)權(quán)利要求13以及權(quán)利要求15-17中任一項的所述裝置, 其中所述至少一個話音頻帶、所述至少一個非話音頻帶和所述至少 一個混合頻帶中的至少其一 ,沒有覆蓋頻點的頻譜的任何部分。
19. 一種裝置,包括用于獲得對語音幀的頻譜的估計的裝置; 用于為在所估計的頻譜內(nèi)的每個頻點分配調(diào)聲似然值的裝置; 用于標(biāo)識包括具有第 一集合的調(diào)聲似然值的頻點的至少一個話 音頻帶的裝置;用于標(biāo)識包括具有第二集合的調(diào)聲似然值的頻點的至少 一 個非 話音頻帶的裝置;用于標(biāo)識包括具有第三集合的調(diào)聲似然值的頻點的至少 一 個混 合頻帶的裝置;用于創(chuàng)建針對頻點的所述至少 一 個混合頻帶的調(diào)聲形狀的裝置。
20. 根據(jù)權(quán)利要求19的所述裝置,其中所述至少 一 個話音頻帶包括具有在第 一 取值范圍內(nèi)的調(diào)聲似然 值的頻點;所述至少一個非話音頻帶包括具有在第二取值范圍內(nèi)的調(diào)聲似 然值的頻點;以及所述至少一個混合頻帶包括具有在所述至少一個話音頻帶和所 述至少 一 個非話音頻帶之間的調(diào)聲似然值的頻點。
21. —種用于合成在頻語上的語音幀模型的方法,包括 基于所述頻語的參數(shù)而重建所述頻語的振幅和相位值,所述頻語包括至少一個話音頻帶,至少一個非話音頻帶和至少一個混合頻 帶,所述話音頻帶包括具有第一集合的調(diào)聲似然值的頻點,所述非 話音頻帶包括具有第二集合的調(diào)聲似然值的頻點,所述混合頻帶包 括具有第二集合的調(diào)聲似然值的頻點;以及 將所述頻譜轉(zhuǎn)換到時域。
22. 根據(jù)權(quán)利要求21的所述方法,其中使用傅立葉變換將所述 頻語轉(zhuǎn)換到時域。
23. 根據(jù)權(quán)利要求21的所述方法,其中使用正弦振蕩器將所述 頻i普轉(zhuǎn)換到時域。
24. 根據(jù)權(quán)利要求21-23中任一項的所述方法,其中,為了重建 所述頻譜,將針對所述至少一個話音頻帶的相位值假定為線性演化。
25. 根據(jù)權(quán)利要求21-24中任一項的所述方法,其中,為了重建 所述頻語,將針對所述至少 一個非話音頻帶的相位值假定為隨機的。
26. 根據(jù)權(quán)利要求21-25中任一項的所述方法,其中,為了重建 所述頻譜,針對所述至少 一 個混合頻帶的振幅和相位值包括針對話 音貢獻(xiàn)和非話音貢獻(xiàn)的各自的振幅和相位值的組合。
27. 根據(jù)權(quán)利要求21-25中任一項的所述方法,其中,為了重建 所述頻錯,針對所述至少 一 個混合頻帶的振幅和相位值的每個包括 兩個單獨的值。
28. 根據(jù)權(quán)利要求21-27中任一項的所述方法,其中所述至少一個話音頻帶、所述至少一個非話音頻帶和所述至少一個混合頻帶中 的每個,包括單一頻帶。
29. —種實現(xiàn)于計算機可讀介質(zhì)中的計算機程序產(chǎn)品,用于合 成在頻譜上的語音幀模型,所述計算機程序產(chǎn)品包括用于執(zhí)行權(quán)利 要求21的動作的計算機代碼。
30. —種裝置,包括 處理器,以及存儲器單元,其通信地連接到所述處理器,并包括用于合成在 頻鐠上的語音幀模型的計算機代碼,所述存儲器單元包括用于基于所述頻譜的參數(shù)而重建所述頻譜的振幅和相位值的計 算機代碼,所述頻譜包括至少一個話音頻帶,至少一個非話音頻帶 和至少 一 個混合頻帶,所述話音頻帶包括具有第 一 集合的調(diào)聲似然 值的頻點,所述非話音頻帶包括具有第二集合的調(diào)聲似然值的頻點, 所述混合頻帶包括具有第二集合的調(diào)聲似然值的頻點;以及用于將所述頻譜轉(zhuǎn)換到時域的計算機代碼。
31. 根據(jù)權(quán)利要求30的所述裝置,其中,為了重建所述頻譜, 針對所述至少 一 個非話音頻帶的相位值是隨機的。
32. 根據(jù)權(quán)利要求30的所述裝置,其中,為了重建所述頻譜, 針對所述至少 一 個混合頻帶的振幅和相位值包括針對話音貢獻(xiàn)和非 話音貢獻(xiàn)的各自的振幅和相位值的組合。
33. 根據(jù)權(quán)利要求30-32中任一項的所述裝置,其中所述至少一 個話音頻帶、所述至少一個非話音頻帶和所述至少一個混合頻帶中 的每個,包括單一頻帶。
34. —種裝置,包括用于基于所述頻譜的參數(shù)而重建所述頻譜的振幅和相位值的裝 置,所述頻譜包括至少一個話音頻帶,至少一個非話音頻帶和至少 一個混合頻帶,所述話音頻帶包括具有第 一 集合的調(diào)聲似然值的頻 點,所述非話音頻帶包括具有第二集合的調(diào)聲似然值的頻點,所述 混合頻帶包括具有第二集合的調(diào)聲似然值的頻點;以及用于將所述頻譜轉(zhuǎn)換到時域的裝置。
35.根據(jù)權(quán)利要求34的所述裝置,其中,為了重建所述頻譜, 針對所述至少 一 個混合頻帶的振幅和相位值包括針對話音貢獻(xiàn)和非 話音貢獻(xiàn)的各自的振幅和相位值的組合。
全文摘要
一種用于以話音貢獻(xiàn)和非話音貢獻(xiàn)二者能夠共存于某頻率的方式建模語音的系統(tǒng)和方法。在多種實施方式中,使用三種頻帶(或高達(dá)三種不同類型的頻帶)。在一個實施方式中,最低頻帶或頻帶組完全是話音的,中間頻帶或頻帶組包含話音貢獻(xiàn)和非話音貢獻(xiàn)兩者,而最高頻帶或頻帶組是完全非話音的。可將本發(fā)明的實施方式用于語音編碼和其它語音處理應(yīng)用。
文檔編號G10L19/08GK101536087SQ200780041119
公開日2009年9月16日 申請日期2007年9月26日 優(yōu)先權(quán)日2006年11月6日
發(fā)明者J·尼爾米南, S·伊瑪南 申請人:諾基亞公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1