用于編碼的語音業(yè)務(wù)的速率降低的方法和設(shè)備的制作方法

文檔序號：2830572閱讀：225來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：用于編碼的語音業(yè)務(wù)的速率降低的方法和設(shè)備的制作方法
技術(shù)領(lǐng)域：
本發(fā)明大體上涉及語音編碼，并且特別地，涉及用于在分組網(wǎng)中傳播(travel)的編碼語音業(yè)務(wù)(voice traffic)的速率降低的方法和設(shè)備。

背景技術(shù)：
在移動(dòng)電話系統(tǒng)中，需要輔助信息(例如，信令信息、開銷、增強(qiáng)的前向糾錯(cuò)信道編碼)來調(diào)整、控制以及協(xié)調(diào)系統(tǒng)的配置與操作。在一些情況下，當(dāng)在使用遠(yuǎn)端移動(dòng)設(shè)備時(shí)，可能需要將輔助信息傳遞給遠(yuǎn)端移動(dòng)設(shè)備。當(dāng)這種情況出現(xiàn)時(shí)，移動(dòng)設(shè)備和基站將輔助信息與語音業(yè)務(wù)組合。如果通向遠(yuǎn)端移動(dòng)設(shè)備的無線鏈路的帶寬完全地被占據(jù)，則語音業(yè)務(wù)的編碼速率將需要被降低以便為輔助信息留出空間。
在另一種情形中，分組網(wǎng)絡(luò)中的擁塞可能需要速率降低以便允許呼叫在兩個(gè)端點(diǎn)之間繼續(xù)被至少最低限度地支持以使得該呼叫不掉線。這樣的對于速率降低的需求可能在任意時(shí)間出現(xiàn)，而與在分組網(wǎng)絡(luò)中傳播的語音業(yè)務(wù)的編碼速率無關(guān)。
為了在承載編碼語音業(yè)務(wù)的分組中實(shí)現(xiàn)速率降低，已經(jīng)提出了幾種方法。一種實(shí)現(xiàn)在分組網(wǎng)絡(luò)中傳播的編碼語音業(yè)務(wù)的速率降低的更根本的方法是丟棄分組。在該操作模式下，編碼語音業(yè)務(wù)的分組(或者多個(gè)分組)被抑制(即不被發(fā)送，或“空白”)以便或者在分組網(wǎng)絡(luò)中的下游或者在與遠(yuǎn)端移動(dòng)設(shè)備的無線鏈路上釋放帶寬。然而，這樣的對分組的激烈刪除的結(jié)果是所恢復(fù)語音的退化，這會(huì)導(dǎo)致可識度(intelligibility)的嚴(yán)重?fù)p失。
稍微更復(fù)雜的用于在分組網(wǎng)絡(luò)中傳播的編碼語音業(yè)務(wù)的速率降低的復(fù)用技術(shù)包括解碼(即，合成)接收到的以原始(即，較高)速率編碼的編碼語音業(yè)務(wù)的分組。該完全地合成的語音信號然后被以較低的速率重新編碼，由此保存某些原始語音的特征，同時(shí)釋放帶寬以插入輔助信息或者減輕網(wǎng)絡(luò)擁塞。將編碼語音業(yè)務(wù)解碼為恢復(fù)的語音和以不同(即，較低的)速率重新編碼所恢復(fù)的語音的操作被稱為轉(zhuǎn)碼(transcoding)(或者“串聯(lián)(tandem)操作”)，其具有如下缺點(diǎn)其需要用于全編解碼器的處理和存儲(chǔ)器資源，僅僅用來提供速率降低的功能。就大多數(shù)編解碼器而言，與提供如上所述的類型的速率降低的功能相關(guān)聯(lián)的額外的資源/成本對于大多數(shù)實(shí)施方式而言被認(rèn)為過高。另外，當(dāng)語音被合成并然后被重新編碼時(shí)，轉(zhuǎn)碼使語音承受可能的退化。
此外，上述兩種技術(shù)可能導(dǎo)致在所需的速率降低的延長時(shí)段期間語音質(zhì)量的嚴(yán)重退化，當(dāng)例如兩個(gè)空中接口對于移動(dòng)到移動(dòng)呼叫而言需要以不同的分組速率運(yùn)行時(shí)可能出現(xiàn)這樣的情況。在此情況下，發(fā)源自近端移動(dòng)設(shè)備的編碼語音業(yè)務(wù)可能需要在被傳送到遠(yuǎn)端移動(dòng)設(shè)備之前由網(wǎng)絡(luò)進(jìn)行減少直到無線電條件得以改善為止。這樣的狀況可能持續(xù)幾秒乃至幾分鐘，當(dāng)使用傳統(tǒng)的速率降低的方法時(shí)，其趨向于對可識度造成顯著的不利影響。
因此，在行業(yè)中存在對用于降低在分組網(wǎng)絡(luò)中傳播的編碼語音業(yè)務(wù)的編碼速率而又不顯著地影響語音質(zhì)量的改進(jìn)的機(jī)制的需要。

發(fā)明內(nèi)容
本發(fā)明的第一主要方面是設(shè)法提供用于將用于當(dāng)前幀的較高速率語音參數(shù)轉(zhuǎn)換為用于當(dāng)前幀的較低速率語音參數(shù)的轉(zhuǎn)換實(shí)體。該轉(zhuǎn)換實(shí)體包括第一解碼器，其被配置成產(chǎn)生用于一系列幀中的每一個(gè)幀的相應(yīng)目標(biāo)激勵(lì)信號，所述一系列幀包括當(dāng)前幀和先前幀，用于給定幀的目標(biāo)激勵(lì)信號基于給定幀的相應(yīng)第一固定組成(contribution)和給定幀的相應(yīng)第一自適應(yīng)(adaptive)組成。該轉(zhuǎn)換實(shí)體還包括第二解碼器，其被配置成產(chǎn)生當(dāng)前幀的第二自適應(yīng)組成并且還被配置成可選擇地工作在第一模式或者第二模式下。在第一模式下，根據(jù)先前幀的第一固定組成來生成當(dāng)前幀的第二自適應(yīng)組成。在第二模式下，根據(jù)先前幀的第二固定組成來生成當(dāng)前幀的第二自適應(yīng)組成。第二解碼器被配置成響應(yīng)于對當(dāng)前幀的速率降低請求而工作在第二模式下。該轉(zhuǎn)換實(shí)體還包括處理模塊，其被配置成確定用于當(dāng)前幀的模糊(dimmed)激勵(lì)參數(shù)，其被包含在用于當(dāng)前幀的較低速率語音參數(shù)中。根據(jù)用于當(dāng)前幀的目標(biāo)激勵(lì)信號和當(dāng)前幀的第二自適應(yīng)組成來生成用于當(dāng)前幀的模糊激勵(lì)參數(shù)，用于當(dāng)前幀的模糊激勵(lì)參數(shù)被用來生成當(dāng)前幀的第二固定組成。用于當(dāng)前幀的模糊激勵(lì)參數(shù)。
本發(fā)明的第二主要方面是設(shè)法提供一種設(shè)備，其包括上述的轉(zhuǎn)換實(shí)體和分組化(packetizing)實(shí)體，所述分組化實(shí)體被配置成將用于當(dāng)前幀的較低速率語音參數(shù)插入輸出分組中。
本發(fā)明的第三主要方面是設(shè)法提供用于將用于當(dāng)前幀的較高速率語音參數(shù)轉(zhuǎn)換為用于當(dāng)前幀的較低速率語音參數(shù)的轉(zhuǎn)換實(shí)體。該轉(zhuǎn)換實(shí)體包括第一裝置，用于產(chǎn)生用于一系列幀中的每一個(gè)幀的相應(yīng)目標(biāo)激勵(lì)信號，所述一系列幀包括當(dāng)前幀和先前幀，用于給定幀的目標(biāo)激勵(lì)信號基于當(dāng)前幀的相應(yīng)第一固定組成和給定幀的相應(yīng)第一自適應(yīng)組成。該轉(zhuǎn)換實(shí)體還包括第二裝置，用于產(chǎn)生當(dāng)前幀的第二自適應(yīng)組成并且還被配置成可選擇地工作在第一模式或者第二模式下。在第一模式下，根據(jù)先前幀的第一固定組成來生成當(dāng)前幀的第二自適應(yīng)組成。在第二模式下，根據(jù)先前幀的第二固定組成來生成第一幀的第二自適應(yīng)組成。第二裝置被配置成響應(yīng)于對當(dāng)前幀的速率降低請求而工作在第二模式下。該轉(zhuǎn)換實(shí)體還包括第三裝置，用于確定用于當(dāng)前幀的模糊激勵(lì)參數(shù)，所述模糊激勵(lì)參數(shù)被包含在用于當(dāng)前幀的較低速率語音參數(shù)中。根據(jù)用于當(dāng)前幀的目標(biāo)激勵(lì)信號和當(dāng)前幀的第二自適應(yīng)組成，生成用于當(dāng)前幀的模糊激勵(lì)參數(shù)，用于當(dāng)前幀的模糊激勵(lì)參數(shù)被用來生成當(dāng)前幀的第二固定組成。
本發(fā)明的第四主要方面設(shè)法提供包括計(jì)算機(jī)可讀程序代碼的計(jì)算機(jī)可讀介質(zhì)，所述計(jì)算機(jī)可讀程序代碼能被計(jì)算設(shè)備執(zhí)行以使得計(jì)算設(shè)備執(zhí)行將用于當(dāng)前幀的較高速率語音參數(shù)轉(zhuǎn)換為用于當(dāng)前幀的較低速率語音參數(shù)的方法。計(jì)算機(jī)可讀程序代碼包括第一計(jì)算機(jī)可讀程序代碼，用于使得計(jì)算設(shè)備產(chǎn)生用于一系列幀中的每一個(gè)幀的相應(yīng)目標(biāo)激勵(lì)信號，所述一系列幀包括當(dāng)前幀和先前幀，用于給定幀的目標(biāo)激勵(lì)信號基于給定幀的相應(yīng)第一固定組成和給定幀的相應(yīng)第一自適應(yīng)組成。計(jì)算機(jī)可讀程序代碼還包括第二計(jì)算機(jī)可讀程序代碼，用于使得計(jì)算設(shè)備在第一和第二模式之一下產(chǎn)生當(dāng)前幀的第二自適應(yīng)組成，其中在所述第二模式下的操作響應(yīng)于對當(dāng)前幀的速率降低請求。在第一模式下，根據(jù)先前幀的第一固定組成來生成當(dāng)前幀的第二自適應(yīng)組成。在第二模式下，根據(jù)先前幀的第二固定組成來生成當(dāng)前幀的第二自適應(yīng)組成。計(jì)算機(jī)可讀程序代碼還包括第三計(jì)算機(jī)可讀程序代碼，用于使得計(jì)算設(shè)備確定用于當(dāng)前幀的模糊激勵(lì)參數(shù)，所述模糊激勵(lì)參數(shù)被包含在用于當(dāng)前幀的較低速率語音參數(shù)中。根據(jù)用于當(dāng)前幀的目標(biāo)激勵(lì)信號和當(dāng)前幀的第二自適應(yīng)組成，生成用于當(dāng)前幀的模糊激勵(lì)參數(shù)，用于當(dāng)前幀的模糊激勵(lì)參數(shù)被用來生成當(dāng)前幀的第二固定組成。
本發(fā)明的第五主要方面設(shè)法提供將與共振峰(formant)頻率含量相關(guān)的N個(gè)編碼的較高速率參數(shù)的集合轉(zhuǎn)換為與共振峰頻率含量相關(guān)的N個(gè)編碼的較低速率參數(shù)的集合的方法。該方法包括識別在N個(gè)編碼的較高速率參數(shù)的集合中編碼的較高速率參數(shù)的多個(gè)子集。針對在N個(gè)編碼的較低速率參數(shù)的集合中的編碼的較低速率參數(shù)的多個(gè)子集中的每個(gè)特定子集，該方法包括從在編碼的較高速率參數(shù)的子集中的一個(gè)或多個(gè)對應(yīng)子集中的編碼的較高速率參數(shù)得到(derive)在編碼的較低速率參數(shù)的所述特定子集中的編碼的較低速率參數(shù)，其中N個(gè)編碼的較低速率參數(shù)能夠使用比N個(gè)編碼的較高速率參數(shù)更少的位(bit)來表示。
本發(fā)明的第六主要方面設(shè)法提供包括計(jì)算機(jī)可讀程序代碼的計(jì)算機(jī)可讀介質(zhì)，所述計(jì)算機(jī)可讀程序代碼能被計(jì)算設(shè)備執(zhí)行以使得計(jì)算設(shè)備執(zhí)行將與共振峰頻率含量相關(guān)的N個(gè)編碼的較高速率參數(shù)的集合轉(zhuǎn)換為與共振峰頻率含量相關(guān)的N個(gè)編碼的較低速率參數(shù)的集合的方法。計(jì)算機(jī)可讀程序代碼包括第一計(jì)算機(jī)可讀程序代碼，其使得計(jì)算設(shè)備識別在N個(gè)編碼的較高速率參數(shù)的集合中的編碼的較高速率參數(shù)的多個(gè)子集；第二計(jì)算機(jī)可讀程序代碼，其使得計(jì)算設(shè)備針對在N個(gè)編碼的較低速率參數(shù)的集合中的編碼的較低速率參數(shù)的多個(gè)子集中的每個(gè)特定子集，從在編碼的較高速率參數(shù)的子集中的一個(gè)或多個(gè)對應(yīng)子集中的編碼的較高速率參數(shù)得到在編碼的較低速率參數(shù)的所述特定子集中的編碼的較低速率參數(shù)；其中N個(gè)編碼的較低速率參數(shù)能夠使用比N個(gè)編碼的較高速率參數(shù)更少的位來表示。
本發(fā)明的第七主要方面設(shè)法提供處理語音幀的原始參數(shù)表示的方法，語音幀的原始參數(shù)表示包括與共振峰頻率含量相關(guān)的較高速率參數(shù)和與激勵(lì)信號相關(guān)的較高速率參數(shù)。該方法包括接收對語音幀的速率降低請求；通過在不從所述與共振峰頻率含量相關(guān)的較高速率參數(shù)合成共振峰頻率含量的情況下處理所述與共振峰頻率含量相關(guān)的較高速率參數(shù)來產(chǎn)生與共振峰頻率含量相關(guān)的較低速率參數(shù)；通過在不從所述與共振峰頻率含量相關(guān)的較高速率參數(shù)合成共振峰頻率含量的情況下處理所述與激勵(lì)信號相關(guān)的較高速率參數(shù)來產(chǎn)生與激勵(lì)信號相關(guān)的較低速率參數(shù)；輸出語音幀的模糊參數(shù)表示，其包括所述與共振峰頻率含量相關(guān)的較低速率參數(shù)和所述與激勵(lì)信號相關(guān)的較低速率參數(shù)；所述與共振峰頻率含量相關(guān)的較低速率參數(shù)和所述與激勵(lì)信號相關(guān)的較低速率參數(shù)的組合比所述與共振峰頻率含量相關(guān)的較高速率參數(shù)和所述與激勵(lì)信號相關(guān)的較高速率參數(shù)的組合占據(jù)更少的位。
本發(fā)明的第八主要方面設(shè)法提供用于處理語音幀的原始參數(shù)表示的轉(zhuǎn)換實(shí)體，語音幀的原始參數(shù)表示包括與共振峰頻率含量相關(guān)的較高速率參數(shù)和與激勵(lì)信號相關(guān)的較高速率參數(shù)，該轉(zhuǎn)換實(shí)體包括用于接收對語音幀的速率降低請求的裝置；用于通過在不從所述與共振峰頻率含量相關(guān)的較高速率參數(shù)合成共振峰頻率含量的情況下處理所述與共振峰頻率含量相關(guān)的較高速率參數(shù)來產(chǎn)生與共振峰頻率含量相關(guān)的較低速率參數(shù)的裝置；用于通過在不從所述與共振峰頻率含量相關(guān)的較高速率參數(shù)合成共振峰頻率含量的情況下處理所述與激勵(lì)信號相關(guān)的較高速率參數(shù)來產(chǎn)生與激勵(lì)信號相關(guān)的較低速率參數(shù)的裝置；用于輸出語音幀的模糊參數(shù)表示的裝置，語音幀的模糊參數(shù)表示包括所述與共振峰頻率含量相關(guān)的較低速率參數(shù)和所述與激勵(lì)信號相關(guān)的較低速率參數(shù)；其中所述與共振峰頻率含量相關(guān)的較低速率參數(shù)和所述與激勵(lì)信號相關(guān)的較低速率參數(shù)的組合比所述與共振峰頻率含量相關(guān)的較高速率參數(shù)和所述與激勵(lì)信號相關(guān)的較高速率參數(shù)的組合占據(jù)更少的位。
本發(fā)明的第九主要方面設(shè)法提供包括計(jì)算機(jī)可讀程序代碼的計(jì)算機(jī)可讀介質(zhì)，所述計(jì)算機(jī)可讀程序代碼能被計(jì)算設(shè)備執(zhí)行以使得計(jì)算設(shè)備執(zhí)行處理語音幀的原始參數(shù)表示的方法，語音幀的原始參數(shù)表示包括與共振峰頻率含量相關(guān)的較高速率參數(shù)和與激勵(lì)信號相關(guān)的較高速率參數(shù)。計(jì)算機(jī)可讀程序代碼包括第一計(jì)算機(jī)可讀程序代碼，其用于使得計(jì)算設(shè)備接收對語音幀的速率降低請求；第二計(jì)算機(jī)可讀程序代碼，其用于使得計(jì)算設(shè)備通過在不從所述與共振峰頻率含量相關(guān)的較高速率參數(shù)合成共振峰頻率含量的情況下處理所述與共振峰頻率含量相關(guān)的較高速率參數(shù)來產(chǎn)生與共振峰頻率含量相關(guān)的較低速率參數(shù)；第三計(jì)算機(jī)可讀程序代碼，其用于使得計(jì)算設(shè)備通過在不從所述與共振峰頻率含量相關(guān)的較高速率參數(shù)合成共振峰頻率含量的情況下處理所述與激勵(lì)信號相關(guān)的較高速率參數(shù)來產(chǎn)生與激勵(lì)信號相關(guān)的較低速率參數(shù)；第四計(jì)算機(jī)可讀程序代碼，其用于使得計(jì)算設(shè)備輸出語音幀的模糊參數(shù)表示，其包括所述與共振峰頻率含量相關(guān)的較低速率參數(shù)和所述與激勵(lì)信號相關(guān)的較低速率參數(shù)；其中所述與共振峰頻率含量相關(guān)的較低速率參數(shù)和所述與激勵(lì)信號相關(guān)的較低速率參數(shù)的組合比所述與共振峰頻率含量相關(guān)的較高速率參數(shù)和所述與激勵(lì)信號相關(guān)的較高速率參數(shù)的組合占據(jù)更少的位。
本發(fā)明的第十主要方面設(shè)法提供將用于當(dāng)前幀的較高速率語音參數(shù)轉(zhuǎn)換為用于當(dāng)前幀的較低速率語音參數(shù)的方法。該方法包括產(chǎn)生用于一系列幀中的每一個(gè)幀的相應(yīng)目標(biāo)激勵(lì)信號，所述一系列幀包括當(dāng)前幀和先前幀，用于給定幀的目標(biāo)激勵(lì)信號基于給定幀的相應(yīng)第一固定組成和給定幀的相應(yīng)第一自適應(yīng)組成。該方法還包括在第一和第二模式之一下產(chǎn)生當(dāng)前幀的第二自適應(yīng)組成，其中，在第一模式下，根據(jù)先前幀的第一固定組成來生成當(dāng)前幀的第二自適應(yīng)組成，其中在第二模式下，根據(jù)先前幀的第二固定組成來生成當(dāng)前幀的第二自適應(yīng)組成，并且其中在所述第二模式下的操作響應(yīng)于對當(dāng)前幀的速率降低請求。該方法還包括確定用于當(dāng)前幀的模糊激勵(lì)參數(shù)，用于當(dāng)前幀的模糊激勵(lì)參數(shù)被包含在用于當(dāng)前幀的較低速率語音參數(shù)中，用于當(dāng)前幀的模糊激勵(lì)參數(shù)是根據(jù)用于當(dāng)前幀的目標(biāo)激勵(lì)信號和當(dāng)前幀的第二自適應(yīng)組成來生成的，用于當(dāng)前幀的模糊目標(biāo)激勵(lì)參數(shù)被用來生成當(dāng)前幀的第二固定組成。
在結(jié)合附圖閱讀了本發(fā)明具體實(shí)施例的以下描述后，本發(fā)明的這些及其他方面和特征對于本領(lǐng)域普通技術(shù)人員來說將變得很明顯。

在附圖中圖1是根據(jù)本發(fā)明的具體的非限制性實(shí)施例的移動(dòng)電話體系結(jié)構(gòu)的框圖，其包括用于把包含在所接收的分組中的語音幀的示例性原始參數(shù)表示轉(zhuǎn)換為被置于輸出分組中的示例性模糊參數(shù)表示的轉(zhuǎn)換實(shí)體；圖2是示出對語音幀的示例性原始參數(shù)表示中的各種參數(shù)的位分配的表；圖3除了描述將輔助信息插入所接收的分組之外，還描繪了語音幀的示例性模糊參數(shù)表示中的減少的位數(shù)；圖4示出示例性原始參數(shù)表示中的在示例性模糊參數(shù)表示中不存在的某些參數(shù)；圖5A指示與共振峰頻率含量相關(guān)的參數(shù)，其存在于示例性原始參數(shù)表示中，并且也存在于示例性模糊參數(shù)表示中，但是對示例性模糊參數(shù)表示分配較少的位；圖5B圖示出轉(zhuǎn)換實(shí)體如何實(shí)現(xiàn)將與共振峰頻率含量相關(guān)的參數(shù)分解成單獨(dú)的譜信息；圖5C示出在示例性原始參數(shù)表示中的譜信息的集合，其被用于創(chuàng)建示例性模糊參數(shù)表示中的譜信息的集合；圖6A示出與激勵(lì)信號相關(guān)的參數(shù)，其存在于原始參數(shù)表示中，并且也存在于模糊參數(shù)表示中，但是對模糊參數(shù)表示分配較少的總體位；圖6B是圖示出轉(zhuǎn)換實(shí)體在將與激勵(lì)信號相關(guān)的參數(shù)從示例性原始參數(shù)表示轉(zhuǎn)換為示例性模糊參數(shù)表示中的功能。
應(yīng)當(dāng)明確地理解，描述和附圖僅為了對本發(fā)明的某些實(shí)施例進(jìn)行說明，并且輔助理解。它們并非是對本發(fā)明的限制。

具體實(shí)施例方式 參考圖1，示出了移動(dòng)電話體系結(jié)構(gòu)，其中無線設(shè)備10與無線設(shè)備12通過核心分組網(wǎng)絡(luò)14進(jìn)行通信。為簡單起見僅僅示出一個(gè)方向的通信(從無線設(shè)備10到無線設(shè)備12)，但是應(yīng)該理解的是通信通常預(yù)期是雙向的。為了清楚起見，無線設(shè)備10將被稱為近端無線設(shè)備，無線設(shè)備12將被稱為遠(yuǎn)端無線設(shè)備。
在核心分組網(wǎng)絡(luò)14的邊緣是兩個(gè)基站/控制器16、18?；?控制器16擔(dān)當(dāng)近端無線設(shè)備10和核心分組網(wǎng)絡(luò)14之間的網(wǎng)關(guān)，而基站/控制器18擔(dān)當(dāng)核心分組網(wǎng)絡(luò)14和遠(yuǎn)端無線設(shè)備12之間的網(wǎng)關(guān)。由此，為了使由近端無線設(shè)備10發(fā)送的分組到達(dá)遠(yuǎn)端無線設(shè)備12，近端無線設(shè)備10通過無線鏈路20將分組傳送到基站/控制器16，其通過核心分組網(wǎng)絡(luò)14將分組轉(zhuǎn)發(fā)到基站/控制器18，其接著通過第二無線鏈路22將分組轉(zhuǎn)發(fā)到遠(yuǎn)端無線設(shè)備12。
本領(lǐng)域技術(shù)人員將理解涉及基站/控制器16和18的物理配置以及因此名稱對于本發(fā)明來說不是至關(guān)重要的。由此，在不脫離本發(fā)明精神的情況下可以使用術(shù)語網(wǎng)關(guān)、路由器、開關(guān)、控制器、網(wǎng)絡(luò)實(shí)體等等。
近端無線設(shè)備10包括聲碼器(vocoder)(或者語音編解碼器)24，其將連續(xù)的語音幀26(例如，持續(xù)時(shí)間為二十(20)毫秒)編碼成相應(yīng)的編碼語音業(yè)務(wù)的分組28。編碼語音業(yè)務(wù)的分組28包含語音幀26的參數(shù)(而不是采樣)表示，編碼語音業(yè)務(wù)的分組28是從語音幀26得到的。參數(shù)表示被優(yōu)化以包含某些臨界(critical)參數(shù)，所述臨界參數(shù)允許遠(yuǎn)端聲碼器(例如遠(yuǎn)端無線設(shè)備12中的聲碼器30)以足夠的可識度再生語音幀26。使用參數(shù)表示的主要優(yōu)勢是當(dāng)與采樣的語音相比較時(shí)，它需要的帶寬量減少。由此，聲碼器(諸如聲碼器24、30)的使用在移動(dòng)環(huán)境中是流行的。然而，應(yīng)該理解的是本發(fā)明不限于移動(dòng)環(huán)境。
不同的聲碼器設(shè)法使用不同的準(zhǔn)確度來編碼不同的參數(shù)。事實(shí)上，一些聲碼器(諸如聲碼器24)甚至允許該編碼方案從一個(gè)語音幀到下一個(gè)語音幀變化，這取決于所討論的語音幀的測得特征。一個(gè)簡單的方法是確定語音幀(諸如語音幀26)是有聲的、還是無聲的、還是在轉(zhuǎn)移中(in transition)，也就是說，是包含強(qiáng)的共振峰頻率含量、還是不包含強(qiáng)的共振峰頻率含量、還是落在中間的某處。如果語音幀26是有聲的或者是在某些轉(zhuǎn)移中(例如，沉默到語音)，那么需要更多的參數(shù)(以較高的準(zhǔn)確度)，但是如果語音幀26是無聲的或者在某些其他轉(zhuǎn)移中(例如，語音到沉默)，那么需要較少的參數(shù)(以較低的準(zhǔn)確度)，以便當(dāng)在遠(yuǎn)端聲碼器處(在本例中是聲碼器30)恢復(fù)語音時(shí)獲得語音的可比擬的(comparable)可識度。由此，可以利用能夠以多個(gè)不同速率操作的聲碼器，聲碼器的適當(dāng)?shù)姆窍拗菩詫?shí)例包括EVRC-A(增強(qiáng)的可變速率編解碼器修訂版A)、QCELP 13K(TIA-733)、SMV(可選模式聲碼器)、EVRC-B、AMR(自適應(yīng)多速率)、ITU-T G.729、ITU-T G723.1，以及其他可能的聲碼器。雖然在整個(gè)說明書中EVRC-A將被用作實(shí)例，但是本領(lǐng)域技術(shù)人員將理解，本發(fā)明可以同樣適用于其他上述的聲碼器和可以為本領(lǐng)域技術(shù)人員所知的或者正在為(或者將為)將來使用所開發(fā)的其他聲碼器。
因此考慮EVRC-A的具體的非限制性實(shí)例，實(shí)際存在三種工作模式，即全速率、半速率和八分之一速率。為了獲得關(guān)于EVRC-A聲碼器和輸入特定模式的決策的更多信息，讀者可參考http://www.3gpp2.com/Publichtml/specs/C.S0014-A v1.0040426.pdf，其在此引用作為參考。圖2在左手列中且以總結(jié)的方式示出對于每個(gè)語音幀26而言可得到的參數(shù)，在相鄰列示出當(dāng)聲碼器24工作在全速率模式下時(shí)分配給每個(gè)參數(shù)的位數(shù)。將觀察到，譜轉(zhuǎn)移參數(shù)被分配一(1)位、線譜信息被分配二十八(28)位、基音(pitch)延遲被分配七(7)位、增量(delta)延遲被分配五(5)位、自適應(yīng)碼本(ACB)增益被分配九(9)位、固定碼本(FCB)形狀(shape)被分配一百零五(105)位、固定碼本(FCB)增益被分配十五(15)位、幀能量不被分配任何位、一(1)位被保留，總共為一百七十一(171)個(gè)“基本(primary)業(yè)務(wù)”位。
在接下來的相鄰列中，圖2示出當(dāng)聲碼器24工作在半速率模式下時(shí)分配給每個(gè)參數(shù)的位數(shù)。將觀察到，譜轉(zhuǎn)移參數(shù)不被分配任何位、線譜信息被分配二十二(22)位、基音延遲被分配七(7)位、增量延遲不被分配任何位、自適應(yīng)碼本(ACB)增益被分配九(9)位、固定碼本(FCB)形狀被分配三十(30)位、固定碼本(FCB)增益被分配十二(12)位、幀能量不被分配任何位、沒有任何位被保留，總共為八十(80)個(gè)基本業(yè)務(wù)位。
在最右邊的列中，圖2示出當(dāng)聲碼器24工作在八分之一速率模式下時(shí)分配給每個(gè)參數(shù)的位數(shù)。將觀察到，僅向以下參數(shù)分配位，包括線譜信息和幀能量，每個(gè)具有八(8)位，總共十六(16)個(gè)基本業(yè)務(wù)位。
在圖1的移動(dòng)電話體系結(jié)構(gòu)中，可能需要輔助信息32(包括但不限于信令信息、開銷、增強(qiáng)的前向糾錯(cuò)信道編碼)來調(diào)整、控制和協(xié)調(diào)該體系結(jié)構(gòu)的各種元件的配置與操作，諸如無線設(shè)備10、12和基站/控制器16、18。輔助信息32還可以包括諸如文本消息、即時(shí)消息和/或電子郵件消息之類的通信數(shù)據(jù)。當(dāng)遠(yuǎn)端無線設(shè)備12涉及于利用基站/控制器18和遠(yuǎn)端無線設(shè)備12之間的無線鏈路上的全部可用帶寬的呼叫中(即，在生成的語音幀需要使用全速率參數(shù)表示期間)時(shí)，則需要速率降低的方法以允許輔助信息32在該呼叫期間到達(dá)遠(yuǎn)端無線設(shè)備12。類似地，當(dāng)在核心分組網(wǎng)絡(luò)14中存在擁塞(這減少了可以用來支持與遠(yuǎn)端無線設(shè)備12的呼叫的帶寬)時(shí)，需要速率降低方法來保持該呼叫仍在進(jìn)行。
相應(yīng)地，在該具體非限制性實(shí)例中，并且根據(jù)本發(fā)明的非限制性實(shí)施例，基站/控制器18包括處理實(shí)體52，其包括轉(zhuǎn)換實(shí)體34和分組化實(shí)體50。轉(zhuǎn)換實(shí)體34被配置成執(zhí)行“模糊(dimming)”操作，也就是說，將包含在所接收的分組28中的語音幀的原始參數(shù)表示轉(zhuǎn)換為語音幀的模糊參數(shù)表示。分組化實(shí)體50被配置成將模糊參數(shù)表示置于輸出分組38中。分組化實(shí)體50還可以將輔助信息32置于輸出分組38中。
執(zhí)行模糊操作的轉(zhuǎn)換實(shí)體34對“速率降低請求”40進(jìn)行響應(yīng)，該速率降低請求指示希望降低所接收的分組28的語音編碼速率。速率降低請求40，在非限制性實(shí)例中可以體現(xiàn)為模糊和突發(fā)(dim-and-burst)的請求，可以由基站/控制器18或者另一網(wǎng)絡(luò)實(shí)體視情況而定地生成，其多個(gè)原因?qū)τ诒绢I(lǐng)域技術(shù)人員來說將是很明顯的。速率降低請求40可以影響一個(gè)單獨(dú)的接收分組28或者一系列連續(xù)接收的分組42。
雖然在圖1中基站/控制器18被示為包括用于執(zhí)行模糊操作的轉(zhuǎn)換實(shí)體34，但是應(yīng)當(dāng)理解可以由在基站/控制器16中實(shí)施的轉(zhuǎn)換實(shí)體和/或在近端無線設(shè)備10和遠(yuǎn)端無線設(shè)備12之間的任何其他網(wǎng)絡(luò)實(shí)體執(zhí)行該模糊操作。在核心分組網(wǎng)絡(luò)14內(nèi)可能出現(xiàn)對轉(zhuǎn)換實(shí)體34的需要，例如用來減輕網(wǎng)絡(luò)擁塞。
圖3圖示出就示例性接收分組28和對應(yīng)的示例性輸出分組38而言轉(zhuǎn)換實(shí)體34的功能。本領(lǐng)域技術(shù)人員將會(huì)理解分組28、38中的每一個(gè)具有各自的首部28A、38A和各自的有效載荷28B、38B。正如所看到的，所接收的分組28的有效載荷28B包括語音幀的原始參數(shù)表示320，在該具體示例中，它是由近端無線設(shè)備10中的聲碼器24所產(chǎn)生的全速率表示。由此，在原始參數(shù)表示320中存在一百七十一(171)個(gè)業(yè)務(wù)位。額外的模式位(未示出)可以放在該171個(gè)業(yè)務(wù)位之前，其指示分組28包括語音幀的原始參數(shù)表示(而不是模糊參數(shù)表示)。
由轉(zhuǎn)換實(shí)體34執(zhí)行的模糊操作包含通過將原始參數(shù)表示320轉(zhuǎn)換為具有更少位的模糊參數(shù)表示330來對速率降低請求40進(jìn)行響應(yīng)。在這種情況下，模糊參數(shù)表示330具有與半速率參數(shù)表示相同的位數(shù)，即八十(80)位。這些八十(80)位被置于輸出分組38中，留下九十一(91)個(gè)附加位，如果所接收的分組28已經(jīng)由基站/控制器18僅僅以它的原始形式被轉(zhuǎn)發(fā)，那么九十一(91)個(gè)附加位將已經(jīng)被消耗。然而，模糊操作現(xiàn)在已經(jīng)釋放了這些位，從而使得它們可用來傳輸輔助信息32，或者干脆不被傳輸，由此減少了基站/控制器18與遠(yuǎn)端無線設(shè)備12之間的無線鏈路22上的帶寬。在非限制性示例性實(shí)施例中，上述的模式位(未示出)可以被用于指示分組38包含語音幀的模糊參數(shù)表示(而不是原始參數(shù)表示)。
現(xiàn)在將描述一個(gè)如下方式的具體的非限制性實(shí)例，其中轉(zhuǎn)換實(shí)體34將原始參數(shù)表示320轉(zhuǎn)換為模糊參數(shù)表示330。
忽略的參數(shù) 原始參數(shù)表示320中的某些參數(shù)被忽略并且由此不出現(xiàn)在模糊參數(shù)表示330中。如圖4所示，這是具有一(1)位的譜轉(zhuǎn)移參數(shù)、五(5)位的增量延遲和保留位的情形，這些位都沒有出現(xiàn)在模糊參數(shù)表示330中。
與共振峰頻率含量相關(guān)的參數(shù) 與共振峰頻率含量相關(guān)的參數(shù)包括線譜信息，參考圖5A，線譜信息在原始參數(shù)表示320中占據(jù)二十八(28)位，但在模糊參數(shù)表示330中僅僅占據(jù)二十二(22)位?，F(xiàn)在參考圖5B描述這樣的方式，其中單獨(dú)的位被分配給每個(gè)參數(shù)表示中的線譜信息。在本實(shí)例中，線譜信息包含線譜對，但是這不應(yīng)被視為限制。
具體地，與共振峰頻率含量相關(guān)的參數(shù)包括十(10)個(gè)組分(component)線譜對，表示為Ω1、Ω2...Ω10。當(dāng)然，不同的聲碼器可以利用不同數(shù)目的線譜對，并且由此此處所使用的數(shù)目僅僅是特定說明，而不應(yīng)被視為限制。具體參考圖5B，因此，注意到原始參數(shù)表示320中的十(10)個(gè)線譜對被分組為四個(gè)線譜對集合，即第一集合中的Ω1和Ω2，第二集合中的Ω3和Ω4，第三集合中的Ω5、Ω6和Ω7，和第四集合中的Ω8、Ω9和Ω10。每個(gè)線譜對集合分別使用單獨(dú)的“碼本”來編碼，即，碼本1用于第一集合，等等。碼本能夠被定義為可加索引的(indexable)數(shù)據(jù)庫，其存儲(chǔ)與每個(gè)條目相關(guān)聯(lián)的某些特征。
每個(gè)碼本的內(nèi)容被優(yōu)化以便產(chǎn)生相關(guān)聯(lián)集合中的線譜對的高效聯(lián)合編碼。由此，碼本大小不同。就被用于聯(lián)合編碼線譜對Ω1和Ω2的碼本1而言，六十四(64)個(gè)條目(即，六位)被認(rèn)為是足夠的。由此，每六位的組合用來索引碼本1中的不同條目，對于線譜對Ω1和Ω2，其包含64個(gè)可能的特征組合。這有時(shí)稱為分裂(split)矢量量化。類似地，用來聯(lián)合編碼線譜對Ω3和Ω4的碼本2也包含六十四個(gè)條目(即，六位)。就用來聯(lián)合編碼線譜對Ω5、Ω6和Ω7的碼本3而言，其具有五百一十二(512)個(gè)條目，其對應(yīng)于九位的索引。最后，用來聯(lián)合編碼線譜對Ω8、Ω9和Ω10的碼本4具有一百二十八(128)個(gè)條目，其對應(yīng)七位的索引。
繼續(xù)參考圖5B，模糊參數(shù)表示320中的十(10)個(gè)線譜對被分為三個(gè)線譜對集合，即第一集合中的Ω1、Ω2和Ω3，第二集合中的Ω4、Ω5和Ω6，第三集合中的Ω7、Ω8、Ω9和Ω10。每個(gè)線譜對集合通過使用單獨(dú)的碼本來分別編碼，即，碼本5用于第一集合，碼本6用于第二集合并且碼本7用于第三集合。每個(gè)碼本的內(nèi)容被優(yōu)化以便產(chǎn)生相關(guān)聯(lián)集合中的線譜對的高效聯(lián)合編碼。由此，如同碼本1、2、3和4的情況一樣，碼本5、6和7也大小不同，但是與碼本1、2、3和4具有很少相似性。就用來聯(lián)合編碼線譜對Ω1、Ω2和Ω3的碼本5而言，一百二十八(128)個(gè)條目(即，七位)被認(rèn)為是足夠的。就用來聯(lián)合編碼線譜對Ω4、Ω5和Ω6的碼本6而言，其也包含一百二十八(128)個(gè)條目(即七位)。最后，用來聯(lián)合編碼線譜對Ω7、Ω8、Ω9和Ω10的碼本7具有兩百五十六個(gè)條目，其對應(yīng)于八位的索引。注意到，碼本5、6和7應(yīng)該是由聲碼器30使用來對與已經(jīng)在由近端無線設(shè)備10的聲碼器24產(chǎn)生的半速率表示中被編碼的共振峰頻率含量相關(guān)聯(lián)的參數(shù)進(jìn)行解碼的那些碼本。
為了減少位的數(shù)目，轉(zhuǎn)換實(shí)體34包括適當(dāng)?shù)碾娐贰④浖?或控制邏輯以用于實(shí)施輸入-輸出變換，該輸入-輸出變換根據(jù)以下參考圖5C所描述的技術(shù)來生成。具體地，在原始參數(shù)表示320中的線譜對的第一集合和第二集合的一部分被映射到模糊參數(shù)表示330中的線譜對的第一集合。第一映射530可以用于此目的。第一映射530的結(jié)果基本上忽略了線譜對Ω4的組成，該結(jié)果引起選擇對模糊參數(shù)表示330中的線譜對Ω1、Ω2和Ω3進(jìn)行編碼的七位索引。另外，在原始參數(shù)表示320中的線譜對的第二集合的一部分和第三集合的一部分被映射到模糊參數(shù)表示330中的線譜對的第二集合。第二映射540可以用于此目的。第二映射540的結(jié)果基本上忽略了線譜對Ω3和Ω7的組成，該結(jié)果引起選擇對模糊參數(shù)表示330中的線譜對Ω4、Ω5和Ω6進(jìn)行編碼的七位索引。最后，在原始參數(shù)表示320中的線譜對的第三集合的一部分連同第四集合被映射到模糊參數(shù)表示330中的線譜對的第三集合和最后集合。第三映射550可以用于此目的。第三映射550的結(jié)果基本上忽略了線譜對Ω5和Ω6的組成，該結(jié)果引起選擇對模糊參數(shù)表示330中的線譜對Ω7、Ω8、Ω9和Ω10進(jìn)行編碼的八位索引。
映射530、540和550的內(nèi)容能夠以離線的方式被優(yōu)化以確保例如就原始參數(shù)表示320中的線譜對的所有可能的組合而言穩(wěn)定性因素得以滿足。穩(wěn)定性因素的實(shí)例不應(yīng)被視為限制，其確保線譜對是遞增順序并且確保兩個(gè)連續(xù)線譜對之間是最短距離?？商鎿Q地，因?yàn)樵趫?zhí)行穩(wěn)定性檢查時(shí)牽涉到的處理很小，這樣的處理能夠針對線譜對Ω1...Ω10的特定集合實(shí)時(shí)執(zhí)行。
注意到，輸入-輸出變換不需要從原始參數(shù)表示320中的線譜對來合成語音(乃至其共振峰頻率含量)。因而，與語音合成相關(guān)聯(lián)的計(jì)算資源被節(jié)省下來。
當(dāng)然，本領(lǐng)域技術(shù)人員將會(huì)理解，待執(zhí)行的映射530、540、550的數(shù)目取決于原始參數(shù)表示320和模糊參數(shù)表示330中的線譜對的組群之間的關(guān)系。并且，線譜對的數(shù)目本身是設(shè)計(jì)選擇，本領(lǐng)域技術(shù)人員將理解不存在對于從原始參數(shù)表示320映射到模糊參數(shù)表示330的線譜對的數(shù)目的具體限制。在某些情況下，可以做出設(shè)計(jì)選擇以使得原始參數(shù)表示320中的一個(gè)或多個(gè)線譜對被忽略，并且由此不出現(xiàn)在模糊參數(shù)表示330中。
與激勵(lì)信號相關(guān)的參數(shù) 與激勵(lì)信號相關(guān)的參數(shù)包括基音延遲、ACB增益、FCB形狀和FCB增益。它們是也被稱為“激勵(lì)參數(shù)”。參考圖6A，在具體實(shí)施例中，不視為限制，基音延遲的七(7)位和ACB增益的九(9)位被未改變地置于模糊參數(shù)表示330中。另一方面，分配給FCB形狀的位數(shù)從一百零五(105)個(gè)減少到三十(30)個(gè)，而分配給FCB增益的位數(shù)從十五(15)個(gè)減少到十二(12)個(gè)?，F(xiàn)在將參考圖6B來描述通過轉(zhuǎn)換實(shí)體34實(shí)現(xiàn)位數(shù)減少的方式。
具體地，轉(zhuǎn)換實(shí)體34還包括適當(dāng)?shù)碾娐贰④浖?或控制邏輯，用于實(shí)施第一解碼器602和第二解碼器604。
第一解碼器602包括固定組分信號發(fā)生器606，其對用于當(dāng)前幀的原始參數(shù)表示320中的FCB形狀和FCB增益起作用以生成當(dāng)前幀的固定碼本組成608。本領(lǐng)域技術(shù)人員熟悉用于生成諸如固定碼本組成608之類的信號的技術(shù)，因此在這里不需要詳述這樣的技術(shù)。當(dāng)前幀的固定碼本組成608由固定組分信號發(fā)生器606產(chǎn)生，然后被饋送到雙輸入求和塊610的輸入端。求和塊610的另一個(gè)輸入此后被稱為當(dāng)前幀的“全速率自適應(yīng)碼本組成”609，其包含由用于當(dāng)前幀的原始參數(shù)表示320中的基音延遲(或者“基音滯后”)延遲的并由用于當(dāng)前幀的原始參數(shù)表示320中的ACB增益放大的求和塊610的先前存儲(chǔ)的輸出。(在求和塊610的先前存儲(chǔ)的輸出變換為當(dāng)前幀的全速率自適應(yīng)碼本組成609的過程中，也可以對求和塊610的先前存儲(chǔ)的輸出執(zhí)行諸如平滑和濾波之類的其他操作)。
求和塊610的輸出然后被重新計(jì)算并被存儲(chǔ)在存儲(chǔ)器中以供下一個(gè)幀使用等等。此后被稱為用于當(dāng)前幀的“目標(biāo)激勵(lì)信號”611的求和塊610的輸出因此是下列各項(xiàng)的組合(i)當(dāng)前幀的固定碼本組成608和(ii)當(dāng)前幀的全速率自適應(yīng)碼本組成609，其本身基于用于先前幀的目標(biāo)激勵(lì)信號611但是受到用于當(dāng)前幀的原始參數(shù)表示320中的ACB增益和基音延遲的影響。
對第二解碼器604的操作而言，其取決于是否存在速率降低請求40。
情況1沒有速率降低請求如果尚未有速率降低請求40，則將會(huì)理解不需要模糊參數(shù)表示330并且不使用轉(zhuǎn)換實(shí)體34。然而，為了對可能發(fā)生的速率降低請求40做準(zhǔn)備，轉(zhuǎn)換實(shí)體34仍然嘗試跟蹤遠(yuǎn)端無線設(shè)備12處的遠(yuǎn)端聲碼器30的狀態(tài)。
為此目的，當(dāng)不存在對所接收的分組28的速率降低請求40時(shí)，第二解碼器604工作在第一模式下，由此，由固定組分信號發(fā)生器606產(chǎn)生的當(dāng)前幀的固定碼本組成608被饋送到雙輸入求和614的第一輸入端。求和塊614的另一個(gè)輸入，此后被稱為當(dāng)前幀的“模糊自適應(yīng)碼本組成”613，其包含由用于當(dāng)前幀的原始參數(shù)表示320中的基音延遲(或者“基音滯后”)延遲并且由用于當(dāng)前幀的原始參數(shù)表示320中的ACB增益放大的、求和塊614的先前存儲(chǔ)的輸出614A。(在求和塊614的先前存儲(chǔ)的輸出變換為當(dāng)前幀的模糊自適應(yīng)碼本組成613的過程中，也可以對求和塊614的先前存儲(chǔ)的輸出614A執(zhí)行諸如平滑和濾波之類的其他操作)。求和塊614的輸出614A然后被重新計(jì)算并被存儲(chǔ)在存儲(chǔ)器中，以供與速率降低請求相關(guān)聯(lián)的或不相關(guān)聯(lián)的下一個(gè)幀使用。
情況2接收到速率降低請求當(dāng)轉(zhuǎn)換實(shí)體34接收到對所接收的分組28的速率降低請求40時(shí)，第二解碼器604進(jìn)入第二工作模式。
在該第二工作模式下，第一步是生成用于當(dāng)前幀的“模糊FCB形狀”622和“模糊FCB增益”624，其被用作用于當(dāng)前幀的模糊參數(shù)表示330中的FCB形狀和FCB增益。用于當(dāng)前幀的模糊FCB形狀622和模糊FCB增益624由包括向量量化器618和比較器612的處理模塊生成。具體地，比較器612被饋送以(i)用于當(dāng)前幀的目標(biāo)激勵(lì)信號611(接收自第一解碼器602)和(ii)用于當(dāng)前幀的模糊自適應(yīng)碼本組成613(接收自第二解碼器604)。在具體的非限制性實(shí)施例中，比較器612的輸出(此后稱為“差異信號”615)表示用于當(dāng)前幀的目標(biāo)激勵(lì)信號611與當(dāng)前幀的模糊自適應(yīng)碼本組成613之間的差異。
現(xiàn)在，回想起來，用于當(dāng)前幀的目標(biāo)激勵(lì)信號611是當(dāng)前幀的固定碼本組成608和當(dāng)前幀的全速率自適應(yīng)碼本組成609的和。也應(yīng)注意到，直到接收到速率降低請求40之前，第二解碼器604已經(jīng)一直工作在第一模式下，這意味著當(dāng)前幀的全速率自適應(yīng)碼本組成609將與當(dāng)前幀的模糊自適應(yīng)碼本組成613相同，這是因?yàn)樵诟鹘獯a器602、604中曾使用相同的系數(shù)(ACB增益和基音延遲)。因此，直到接收到速率降低請求40之前，比較器612的輸出處的差異信號615將跟蹤固定碼本組成608。
現(xiàn)在考慮用于當(dāng)前幀的模糊FCB形狀622和模糊FCB增益624被用于驅(qū)動(dòng)第二固定組分信號發(fā)生器616以產(chǎn)生輸出617。還考慮提供開關(guān)裝置620(可以以例如硬件、軟件和/或控制邏輯來實(shí)現(xiàn))，該開關(guān)裝置620能夠有選擇地用輸出617而不是第一組分信號608來饋入求和塊614的第一輸入端。
在這些條件下，顯然差異信號615表示想要第二固定組分信號發(fā)生器616的輸出617處的信號是什么樣的，如果想要求和塊614的輸出614A盡可能地(根據(jù)某一準(zhǔn)則，例如最小二乘方)類似用于當(dāng)前幀的目標(biāo)激勵(lì)信號611，從而最小化語音質(zhì)量損傷。為此目的，使用與遠(yuǎn)端無線設(shè)備12中的遠(yuǎn)端聲碼器30相同的碼本，向量量化器618將差異信號615編碼為上述的模糊FCB形狀622和模糊FCB增益624。根據(jù)本發(fā)明的具體的非限制性實(shí)施例，向量量化器618是被用來確定模糊FCB形狀622和模糊FCB增益624的半速率向量量化器618。
第二固定組分信號發(fā)生器616的輸出617基于模糊FCB形狀622和模糊FCB增益624，該輸出617然后被傳遞通過求和塊614，在此處它被添加到當(dāng)前幀的模糊自適應(yīng)碼本組成613中(如上所示計(jì)算的)。求和塊614的輸出614A然后被重新計(jì)算并被存儲(chǔ)在存儲(chǔ)器中，以供與速率降低請求相關(guān)聯(lián)的或不相關(guān)聯(lián)的下一個(gè)幀使用。
在非限制性實(shí)施例中，模糊FCB形狀622和模糊FCB增益624只限于能夠通過分配給模糊參數(shù)表示330中的相應(yīng)參數(shù)的位數(shù)來編碼的值。在該具體的非限制性實(shí)例中，模糊FCB形狀622是能夠通過分配給其的三十(30)位來編碼的值，而模糊FCB增益624是能夠通過分配給其的十二(12)位來編碼的值。
將會(huì)理解，模糊FCB形狀622和模糊FCB增益624可以取決于下面的所有四個(gè)原始參數(shù)表示320中的FCB形狀、FCB增益、基音延遲和ACB增益。
還應(yīng)當(dāng)理解，如果接收到針對在所接收分組的系列42中的第二連續(xù)的接收分組的速率降低請求40，則第二解碼器604將繼續(xù)工作在第二模式下，由此求和塊614的第一輸入由第二固定組分信號發(fā)生器616的輸出617提供。如果沒有針對所接收分組的系列42中的給定接收分組請求速率降低請求40，那么第二解碼器604中的開關(guān)單元620恢復(fù)到第一模式，由此求和塊614的第一輸入由固定信號分量信號發(fā)生器606產(chǎn)生的固定碼本組成608來提供。
因此將會(huì)理解，通過使用圖6B的系統(tǒng)，更具體地說，通過即使當(dāng)不存在速率降低請求40時(shí)仍保持第二解碼器604活動(dòng)(active)，可以跟蹤遠(yuǎn)端聲碼器30的存儲(chǔ)器狀態(tài)，當(dāng)速率降低請求40最終被接收時(shí)，這允許對模糊FCB形狀622和模糊FCB增益624的更優(yōu)化選擇。這使得當(dāng)速率降低在進(jìn)行中時(shí)所感知的語音質(zhì)量得以改善。因此將會(huì)理解，根據(jù)本發(fā)明的實(shí)施例從語音幀的較高速率參數(shù)表示創(chuàng)建語音幀的較低速率參數(shù)表示引起可與不存在速率降低的情況相比較的感知語音質(zhì)量。同時(shí)，此處描述的技術(shù)比轉(zhuǎn)碼(即，恢復(fù)全速率語音和以半速率重新編碼)需要更少的計(jì)算工作量。
可以通過簡化向量量化器618的設(shè)計(jì)來獲得計(jì)算性能的進(jìn)一步改進(jìn)。例如，向量量化器618可以使用查找表來確定模糊FCB增益624，并且可以使用經(jīng)驗(yàn)的脈沖抽選(decimation)(即，除去一半的非零脈沖)來確定模糊FCB形狀622。所感知的語音質(zhì)量的額外改進(jìn)也是可能的，這要以更大的計(jì)算復(fù)雜度為代價(jià)。例如，能夠選擇不僅自適應(yīng)地確定模糊FCB增益624和模糊FCB形狀622，還可以確定ACB增益和/或基音延遲。計(jì)算復(fù)雜度與語音質(zhì)量之間的權(quán)衡因此是固有的約束條件并且能夠向一方或另一方傾斜，這取決于設(shè)計(jì)選擇。
應(yīng)該重申EVRC-A僅僅是作為實(shí)例來使用的，并且其他聲碼器將由其他位分配和其他參數(shù)一起來表征。本領(lǐng)域技術(shù)人員因此將理解，如上所述的技術(shù)仍然有效并且可以被用于設(shè)計(jì)用于以在計(jì)算上高效的方式從語音幀的較高速率參數(shù)表示創(chuàng)建語音幀的較低速率參數(shù)表示的技術(shù)，該方式不需要整個(gè)語音采樣被恢復(fù)并且因此不需要與共振峰頻率含量(即線譜信息)相關(guān)的參數(shù)被識別和重新編碼。這樣，本發(fā)明能夠應(yīng)用于其他聲碼器，例如QCELP 13K(TIA-733)、SMV(可選模式聲碼器)、EVRC-B、AMR(自適應(yīng)多速率)、ITU-T G.729和ITU-T G723.1，這是幾個(gè)具體的非限制性實(shí)例。
本領(lǐng)域技術(shù)人員還將理解雖然上面的描述集中于語音幀的全速率參數(shù)表示已經(jīng)降為半速率參數(shù)表示的情況，但是本發(fā)明也適用于其他速率降低方案，例如但不限于全速率到八分之一速率、半速率到八分之一速率和一般地(N/M)th速率到(n/m)th速率(其中，N/M＞n/m)，只要(n/m)th速率仍然適用于語音幀。
本領(lǐng)域技術(shù)人員還將理解的是，在一些實(shí)施例中，轉(zhuǎn)換實(shí)體34的功能可以被實(shí)現(xiàn)為預(yù)編程的硬件或者固件元件(例如，專用集成電路(ASIC)、電可擦可編程只讀存儲(chǔ)器(EEPROM)等)或者其他相關(guān)部件。在其他實(shí)施例中，轉(zhuǎn)換實(shí)體34可以被實(shí)現(xiàn)為能訪問用來存儲(chǔ)用于ALU操作的程序指令的代碼存儲(chǔ)器(未示出)的運(yùn)算邏輯單元(ALU)。所述程序指令可被存儲(chǔ)在固定的、有形的并且能被轉(zhuǎn)換實(shí)體34直接讀取的介質(zhì)上(例如，可拆裝的磁盤、CD-ROM、ROM、固定磁盤、USB驅(qū)動(dòng)器)，或者所述程序指令可以被遠(yuǎn)程地存儲(chǔ)但是可經(jīng)由通過傳輸介質(zhì)連接到網(wǎng)絡(luò)的調(diào)制解調(diào)器或者其他接口裝置(例如，通信適配器)而傳送到轉(zhuǎn)換實(shí)體34。該傳輸介質(zhì)可以是有形的介質(zhì)(例如，光學(xué)或者模擬通信線路)或者是使用無線技術(shù)(例如，微波、紅外線或者其他傳輸方案)實(shí)施的介質(zhì)。
雖然已經(jīng)描述并且示出了本發(fā)明的具體實(shí)施例，但對于本領(lǐng)域技術(shù)人員而言將很明顯的是在不背離所附權(quán)利要求所限定的本發(fā)明的范圍的情況下能夠進(jìn)行大量的修改和變化。
權(quán)利要求
1.一種用于將用于當(dāng)前幀的較高速率語音參數(shù)轉(zhuǎn)換為用于當(dāng)前幀的較低速率語音參數(shù)的轉(zhuǎn)換實(shí)體，所述轉(zhuǎn)換實(shí)體包括
-第一解碼器，被配置成產(chǎn)生用于一系列幀中的每一個(gè)幀的相應(yīng)目標(biāo)激勵(lì)信號，所述一系列幀包括當(dāng)前幀和先前幀，用于給定幀的目標(biāo)激勵(lì)信號基于給定幀的相應(yīng)第一固定組成和給定幀的相應(yīng)第一自適應(yīng)組成；
-第二解碼器，被配置成產(chǎn)生當(dāng)前幀的第二自適應(yīng)組成并且還被配置成可選擇地工作在第一模式或者第二模式下；
-在第一模式下，根據(jù)先前幀的第一固定組成來生成當(dāng)前幀的第二自適應(yīng)組成；
-在第二模式下，根據(jù)先前幀的第二固定組成來生成當(dāng)前幀的第二自適應(yīng)組成；
-第二解碼器被配置成響應(yīng)于對當(dāng)前幀的速率降低請求而工作在第二模式下；
-處理模塊，被配置成確定用于當(dāng)前幀的模糊激勵(lì)參數(shù)，所述用于當(dāng)前幀的模糊激勵(lì)參數(shù)是根據(jù)用于當(dāng)前幀的目標(biāo)激勵(lì)信號和當(dāng)前幀的第二自適應(yīng)組成來生成的，所述用于當(dāng)前幀的模糊激勵(lì)參數(shù)被用來生成當(dāng)前幀的第二固定組成；
-其中用于當(dāng)前幀的模糊激勵(lì)參數(shù)被包含在用于當(dāng)前幀的較低速率語音參數(shù)中。
2.如權(quán)利要求1所述的轉(zhuǎn)換實(shí)體，其中用于當(dāng)前幀的較高速率語音參數(shù)包括用于當(dāng)前幀的較高速率參數(shù)的第一子集，其中用于當(dāng)前幀的較高速率參數(shù)的第一子集被用來生成當(dāng)前幀的第一固定組成。
3.如權(quán)利要求2所述的轉(zhuǎn)換實(shí)體，其中用于當(dāng)前幀的較高速率語音參數(shù)還包括用于當(dāng)前幀的較高速率參數(shù)的第二子集，其中用于當(dāng)前幀的較高速率參數(shù)的第二子集被用來生成當(dāng)前幀的第一自適應(yīng)組成。
4.如權(quán)利要求3所述的轉(zhuǎn)換實(shí)體，其中當(dāng)前幀的第一自適應(yīng)組成是另外根據(jù)先前幀的第一固定組成來生成的。
5.如權(quán)利要求4所述的轉(zhuǎn)換實(shí)體，其中用于當(dāng)前幀的目標(biāo)激勵(lì)信號是當(dāng)前幀的第一固定組成與當(dāng)前幀的第一自適應(yīng)組成的和。
6.如權(quán)利要求4所述的轉(zhuǎn)換實(shí)體，其中用于先前幀的較高速率語音參數(shù)包括用于先前幀的較高速率參數(shù)的第一子集，并且其中用于先前幀的較高速率參數(shù)的第一子集被用來生成先前幀的第一固定組成。
7.如權(quán)利要求6所述的轉(zhuǎn)換實(shí)體，其中用于當(dāng)前幀的模糊激勵(lì)參數(shù)比用于當(dāng)前幀的較高速率參數(shù)的第一子集占據(jù)更少的位。
8.如權(quán)利要求7所述的轉(zhuǎn)換實(shí)體，其中用于當(dāng)前幀的較高速率參數(shù)的第一子集包括固定碼本形狀和固定碼本增益。
9.如權(quán)利要求8所述的轉(zhuǎn)換實(shí)體，其中用于當(dāng)前幀的模糊激勵(lì)參數(shù)包括第二固定碼本形狀和第二固定碼本增益。
10.如權(quán)利要求9所述的轉(zhuǎn)換實(shí)體，其中用于當(dāng)前幀的較高速率參數(shù)的第二子集也被包含在用于當(dāng)前幀的較低速率語音參數(shù)中。
11.如權(quán)利要求10所述的轉(zhuǎn)換實(shí)體，其中用于當(dāng)前幀的較高速率語音參數(shù)的第二子集包括自適應(yīng)碼本增益和基音滯后。
12.如權(quán)利要求1所述的轉(zhuǎn)換實(shí)體，其中第二解碼器被配置成在沒有速率降低請求的情況下工作在第一模式下。
13.如權(quán)利要求6所述的轉(zhuǎn)換實(shí)體，其中用于先前幀的較高速率語音參數(shù)還包括用于先前幀的較高速率激勵(lì)參數(shù)的第二子集，并且其中用于先前幀的較高速率激勵(lì)參數(shù)的第二子集被用來生成先前幀的第二固定組成。
14.如權(quán)利要求13所述的轉(zhuǎn)換實(shí)體，其中所述用于先前幀的較高速率語音參數(shù)的第二子集包括自適應(yīng)碼本增益和基音滯后。
15.如權(quán)利要求1所述的轉(zhuǎn)換實(shí)體，其中所述處理模塊包括向量量化器和比較器。
16.如權(quán)利要求15所述的轉(zhuǎn)換實(shí)體，其中所述比較器被配置成確定在用于當(dāng)前幀的目標(biāo)激勵(lì)信號與當(dāng)前幀的第二自適應(yīng)組成之間的差異。
17.如權(quán)利要求16所述的轉(zhuǎn)換實(shí)體，其中所述向量量化器被配置成執(zhí)行向量量化以根據(jù)所述差異確定用于當(dāng)前幀的模糊激勵(lì)參數(shù)。
18.如權(quán)利要求17所述的轉(zhuǎn)換實(shí)體，其中用于當(dāng)前幀的模糊激勵(lì)參數(shù)包括固定碼本形狀和固定碼本增益。
19.如權(quán)利要求1所述的轉(zhuǎn)換實(shí)體，其中用于當(dāng)前幀的較高速率語音參數(shù)是全速率語音參數(shù)并且其中用于當(dāng)前幀的較低速率語音參數(shù)是半速率語音參數(shù)。
20.如權(quán)利要求1所述的轉(zhuǎn)換實(shí)體，其中用于當(dāng)前幀的較高速率語音參數(shù)不是全速率語音參數(shù)或者其中用于當(dāng)前幀的較低速率語音參數(shù)不是半速率語音參數(shù)。
21.一種設(shè)備，包括如權(quán)利要求1所述的轉(zhuǎn)換實(shí)體，和被配置成將用于當(dāng)前幀的較低速率語音參數(shù)插入輸出分組中的分組化實(shí)體。
22.如權(quán)利要求21所述的設(shè)備，其中分組化實(shí)體還被配置成將輔助信息插入輸出分組中。
23.如權(quán)利要求22所述的設(shè)備，輔助信息包括信令信息、開銷和增強(qiáng)的前向糾錯(cuò)信道編碼中的至少一個(gè)。
24.如權(quán)利要求22所述的設(shè)備，輔助信息包括文本消息、即時(shí)消息和電子郵件消息中的至少一個(gè)。
25.如權(quán)利要求1所述的轉(zhuǎn)換實(shí)體，其中用于當(dāng)前幀的較高速率語音參數(shù)包括用于當(dāng)前幀的與共振峰頻率含量相關(guān)的較高速率參數(shù)，并且其中用于當(dāng)前幀的較低速率語音參數(shù)還包括用于當(dāng)前幀的與共振峰頻率含量相關(guān)的模糊參數(shù)，用于當(dāng)前幀的與共振峰頻率含量相關(guān)的模糊參數(shù)比用于當(dāng)前幀的與共振峰頻率含量相關(guān)的較高速率參數(shù)占據(jù)更少的位。
26.如權(quán)利要求25所述的轉(zhuǎn)換實(shí)體，還被配置成根據(jù)所述用于當(dāng)前幀的與共振峰頻率含量相關(guān)的較高速率參數(shù)來產(chǎn)生所述用于當(dāng)前幀的與共振峰頻率含量相關(guān)的較低速率參數(shù)。
27.如權(quán)利要求26所述的轉(zhuǎn)換實(shí)體，其中所述用于當(dāng)前幀的與共振峰頻率含量相關(guān)的較低速率參數(shù)是在不合成語音信號的情況下根據(jù)所述用于當(dāng)前幀的與共振峰頻率含量相關(guān)的較高速率參數(shù)來產(chǎn)生的。
28.一種用于將用于當(dāng)前幀的較高速率語音參數(shù)轉(zhuǎn)換為用于當(dāng)前幀的較低速率語音參數(shù)的轉(zhuǎn)換實(shí)體，所述轉(zhuǎn)換實(shí)體包括
-第一裝置，用于產(chǎn)生用于一系列幀中的每一個(gè)幀的相應(yīng)目標(biāo)激勵(lì)信號，所述一系列幀包括當(dāng)前幀和先前幀，用于給定幀的目標(biāo)激勵(lì)信號基于當(dāng)前幀的相應(yīng)第一固定組成和給定幀的相應(yīng)第一自適應(yīng)組成；
-第二裝置，用于產(chǎn)生當(dāng)前幀的第二自適應(yīng)組成并且還被配置成可選擇地工作在第一模式或者第二模式下；
-在第一模式下，根據(jù)先前幀的第一固定組成來生成當(dāng)前幀的第二自適應(yīng)組成；
-在第二模式下，根據(jù)先前幀的第二固定組成來生成第一幀的第二自適應(yīng)組成；
-第二裝置被配置成響應(yīng)于對當(dāng)前幀的速率降低請求而工作在第二模式下；
-第三裝置，用于確定用于當(dāng)前幀的模糊激勵(lì)參數(shù)，用于當(dāng)前幀的模糊激勵(lì)參數(shù)是根據(jù)用于當(dāng)前幀的目標(biāo)激勵(lì)信號和當(dāng)前幀的第二自適應(yīng)組成來生成的，用于當(dāng)前幀的模糊激勵(lì)參數(shù)被用來生成當(dāng)前幀的第二固定組成；
-其中用于當(dāng)前幀的模糊激勵(lì)參數(shù)被包含在用于當(dāng)前幀的較低速率語音參數(shù)中。
29.一種包括計(jì)算機(jī)可讀程序代碼的計(jì)算機(jī)可讀介質(zhì)，所述計(jì)算機(jī)可讀程序代碼能被計(jì)算設(shè)備執(zhí)行以使得計(jì)算設(shè)備執(zhí)行將用于當(dāng)前幀的較高速率語音參數(shù)轉(zhuǎn)換為用于當(dāng)前幀的較低速率語音參數(shù)的方法，所述計(jì)算機(jī)可讀程序代碼包括
-第一計(jì)算機(jī)可讀程序代碼，用于使得計(jì)算設(shè)備產(chǎn)生用于一系列幀中的每一個(gè)幀的相應(yīng)目標(biāo)激勵(lì)信號，所述一系列幀包括當(dāng)前幀和先前幀，用于給定幀的目標(biāo)激勵(lì)信號基于給定幀的相應(yīng)第一固定組成和給定幀的相應(yīng)第一自適應(yīng)組成；
-第二計(jì)算機(jī)可讀程序代碼，用于使得計(jì)算設(shè)備在第一和第二模式之一下產(chǎn)生當(dāng)前幀的第二自適應(yīng)組成；
-在第一模式下，根據(jù)先前幀的第一固定組成來生成當(dāng)前幀的第二自適應(yīng)組成；
-在第二模式下，根據(jù)先前幀的第二固定組成來生成當(dāng)前幀的第二自適應(yīng)組成；
-其中在所述第二模式下的工作響應(yīng)于對當(dāng)前幀的速率降低請求；
-第三計(jì)算機(jī)可讀程序代碼，用于使得計(jì)算設(shè)備確定用于當(dāng)前幀的模糊激勵(lì)參數(shù)，用于當(dāng)前幀的模糊激勵(lì)參數(shù)是根據(jù)用于當(dāng)前幀的目標(biāo)激勵(lì)信號和當(dāng)前幀的第二自適應(yīng)組成來生成的，用于當(dāng)前幀的模糊激勵(lì)參數(shù)被用來生成當(dāng)前幀的第二固定組成；
-其中用于當(dāng)前幀的模糊激勵(lì)參數(shù)被包含在用于當(dāng)前幀的較低速率語音參數(shù)中。
30.一種將與共振峰頻率含量相關(guān)的N個(gè)編碼的較高速率參數(shù)的集合轉(zhuǎn)換為與共振峰頻率含量相關(guān)的N個(gè)編碼的較低速率參數(shù)的集合的方法，所述方法包括
-識別在N個(gè)編碼的較高速率參數(shù)的集合中的編碼的較高速率參數(shù)的多個(gè)子集；
-針對在N個(gè)編碼的較低速率參數(shù)的集合中的編碼的較低速率參數(shù)的多個(gè)子集中的每個(gè)特定子集，從編碼的較高速率參數(shù)的子集中的一個(gè)或多個(gè)對應(yīng)子集中的編碼的較高速率參數(shù)得到在編碼的較低速率參數(shù)的所述特定子集中的編碼的較低速率參數(shù)；
-其中N個(gè)編碼的較低速率參數(shù)能夠使用比N個(gè)編碼的較高速率參數(shù)更少的位來表示。
31.如權(quán)利要求30所述的方法，其中所述得到包括執(zhí)行映射。
32.如權(quán)利要求30所述的方法，其中在編碼的較低速率參數(shù)的所述特定子集中的編碼的較低速率參數(shù)共同地表示進(jìn)入碼本中的條目。
33.如權(quán)利要求32所述的方法，其中編碼的較高速率參數(shù)的子集中的所述一個(gè)或多個(gè)對應(yīng)子集中的每一個(gè)中的編碼的較高速率參數(shù)共同地表示相應(yīng)碼本中的相應(yīng)條目。
34.如權(quán)利要求30所述的方法，其中編碼的較高速率參數(shù)表示線譜信息。
35.如權(quán)利要求34所述的方法，其中編碼的較高速率參數(shù)標(biāo)識線譜對。
36.如權(quán)利要求34所述的方法，其中N個(gè)編碼的較高速率參數(shù)與全編碼速率對應(yīng)并且其中N個(gè)編碼的較低速率參數(shù)與半編碼速率對應(yīng)。
37.如權(quán)利要求34所述的方法，其中N個(gè)編碼的較高速率參數(shù)不與全編碼速率對應(yīng)或者其中N個(gè)編碼的較低速率參數(shù)不與半編碼速率對應(yīng)。
38.如權(quán)利要求30所述的方法，其中N＝10。
39.一種包括計(jì)算機(jī)可讀程序代碼的計(jì)算機(jī)可讀介質(zhì)，所述計(jì)算機(jī)可讀程序代碼能被計(jì)算設(shè)備執(zhí)行以使得計(jì)算設(shè)備執(zhí)行將與共振峰頻率含量相關(guān)的N個(gè)編碼的較高速率參數(shù)的集合轉(zhuǎn)換為與共振峰頻率含量相關(guān)的N個(gè)編碼的較低速率參數(shù)的集合的方法，所述計(jì)算機(jī)可讀程序代碼包括
-第一計(jì)算機(jī)可讀程序代碼，用于使得計(jì)算設(shè)備識別N個(gè)編碼的較高速率參數(shù)的集合中的編碼的較高速率參數(shù)的多個(gè)子集；
-第二計(jì)算機(jī)可讀程序代碼，用于使得計(jì)算設(shè)備針對在N個(gè)編碼的較低速率參數(shù)的集合中的編碼的較低速率參數(shù)的多個(gè)子集中的每個(gè)特定子集，從在編碼的較高速率參數(shù)的子集中的一個(gè)或多個(gè)對應(yīng)子集中的編碼的較高速率參數(shù)得到在編碼的較低速率參數(shù)的所述特定子集中的編碼的較低速率參數(shù)；
-其中N個(gè)編碼的較低速率參數(shù)能夠使用比N個(gè)編碼的較高速率參數(shù)更少的位來表示。
40.一種處理當(dāng)前語音幀的原始參數(shù)表示的方法，當(dāng)前幀的原始參數(shù)表示包括與共振峰頻率含量相關(guān)的較高速率參數(shù)和與激勵(lì)信號相關(guān)的較高速率參數(shù)，所述方法包括
-接收對當(dāng)前幀的速率降低請求；
-通過在不從所述與共振峰頻率含量相關(guān)的較高速率參數(shù)合成共振峰頻率含量的情況下處理所述與共振峰頻率含量相關(guān)的較高速率參數(shù)來產(chǎn)生與共振峰頻率含量相關(guān)的較低速率參數(shù)；
-通過在不從所述與共振峰頻率含量相關(guān)的較高速率參數(shù)合成共振峰頻率含量的情況下處理所述與激勵(lì)信號相關(guān)的較高速率參數(shù)來產(chǎn)生與激勵(lì)信號相關(guān)的較低速率參數(shù)；
-輸出當(dāng)前幀的模糊參數(shù)表示，所述當(dāng)前幀的模糊參數(shù)表示包括所述與共振峰頻率含量相關(guān)的較低速率參數(shù)和所述與激勵(lì)信號相關(guān)的較低速率參數(shù)；
-所述與共振峰頻率含量相關(guān)的較低速率參數(shù)和所述與激勵(lì)信號相關(guān)的較低速率參數(shù)的組合比所述與共振峰頻率含量相關(guān)的較高速率參數(shù)和所述與激勵(lì)信號相關(guān)的較高速率參數(shù)占據(jù)更少的位。
41.如權(quán)利要求40所述的方法，其中所述處理所述與激勵(lì)信號相關(guān)的較高速率參數(shù)包括處理與關(guān)聯(lián)于當(dāng)前幀的原始參數(shù)表示的激勵(lì)信號相關(guān)的較高速率參數(shù)的版本。
42.如權(quán)利要求41所述的方法，其中所述處理所述與激勵(lì)信號相關(guān)的較高速率參數(shù)還包括處理與關(guān)聯(lián)于先前幀的相應(yīng)參數(shù)表示的激勵(lì)信號相關(guān)的較高速率參數(shù)的至少一個(gè)版本。
43.如權(quán)利要求40所述的方法，其中所述產(chǎn)生所述與共振峰頻率含量相關(guān)的較低速率參數(shù)包括執(zhí)行映射。
44.如權(quán)利要求40所述的方法，其中所述產(chǎn)生所述與激勵(lì)信號相關(guān)的較低速率參數(shù)包括
-產(chǎn)生用于一系列幀中的每一個(gè)幀的相應(yīng)目標(biāo)激勵(lì)信號，所述一系列幀包括當(dāng)前幀和先前幀，用于給定幀的目標(biāo)激勵(lì)信號基于給定幀的相應(yīng)第一固定組成和給定幀的相應(yīng)第一自適應(yīng)組成；
-產(chǎn)生當(dāng)前幀的第二自適應(yīng)組成，其中或者根據(jù)先前幀的第一固定組成或者響應(yīng)于所述對當(dāng)前幀的速率降低請求根據(jù)先前幀的第二固定組成來生成當(dāng)前幀的第二自適應(yīng)組成；
-確定用于當(dāng)前幀的模糊激勵(lì)參數(shù)，根據(jù)用于當(dāng)前幀的目標(biāo)激勵(lì)信號和當(dāng)前幀的第二自適應(yīng)組成來生成用于當(dāng)前幀的模糊激勵(lì)參數(shù)，用于當(dāng)前幀的模糊激勵(lì)參數(shù)被用來生成當(dāng)前幀的第二固定組成；
-其中用于當(dāng)前幀的模糊激勵(lì)參數(shù)被包含在與激勵(lì)信號相關(guān)的較低速率參數(shù)中。
45.一種用于處理當(dāng)前語音幀的原始參數(shù)表示的轉(zhuǎn)換實(shí)體，當(dāng)前幀的原始參數(shù)表示包括與共振峰頻率含量相關(guān)的較高速率參數(shù)和與激勵(lì)信號相關(guān)的較高速率參數(shù)，所述轉(zhuǎn)換實(shí)體包括
-用于接收對當(dāng)前幀的速率降低請求的裝置；
-用于通過在不從所述與共振峰頻率含量相關(guān)的較高速率參數(shù)合成共振峰頻率含量的情況下處理所述與共振峰頻率含量相關(guān)的較高速率參數(shù)來產(chǎn)生與共振峰頻率含量相關(guān)的較低速率參數(shù)的裝置；
-用于通過在不從所述與共振峰頻率含量相關(guān)的較高速率參數(shù)合成共振峰頻率含量的情況下處理所述與激勵(lì)信號相關(guān)的較高速率參數(shù)來產(chǎn)生與激勵(lì)信號相關(guān)的較低速率參數(shù)的裝置；
-用于輸出當(dāng)前幀的模糊參數(shù)表示的裝置，所述當(dāng)前幀的模糊參數(shù)表示包括所述與共振峰頻率含量相關(guān)的較低速率參數(shù)和所述與激勵(lì)信號相關(guān)的較低速率參數(shù)；
-其中所述與共振峰頻率含量相關(guān)的較低速率參數(shù)和所述與激勵(lì)信號相關(guān)的較低速率參數(shù)的組合比所述與共振峰頻率含量相關(guān)的較高速率參數(shù)和所述與激勵(lì)信號相關(guān)的較高速率參數(shù)的組合占據(jù)更少的位。
46.一種包括計(jì)算機(jī)可讀程序代碼的計(jì)算機(jī)可讀介質(zhì)，所述計(jì)算機(jī)可讀程序代碼能被計(jì)算設(shè)備執(zhí)行以使得計(jì)算設(shè)備執(zhí)行處理當(dāng)前語音幀的原始參數(shù)表示的方法，當(dāng)前幀的原始參數(shù)表示包括與共振峰頻率含量相關(guān)的較高速率參數(shù)和與激勵(lì)信號相關(guān)的較高速率參數(shù)，所述計(jì)算機(jī)可讀程序代碼包括
-第一計(jì)算機(jī)可讀程序代碼，用于使得計(jì)算設(shè)備接收對當(dāng)前幀的速率降低請求；
-第二計(jì)算機(jī)可讀程序代碼，用于使得計(jì)算設(shè)備通過在不從所述與共振峰頻率含量相關(guān)的較高速率參數(shù)合成共振峰頻率含量的情況下處理所述與共振峰頻率含量相關(guān)的較高速率參數(shù)來產(chǎn)生與共振峰頻率含量相關(guān)的較低速率參數(shù)；
-第三計(jì)算機(jī)可讀程序代碼，用于使得計(jì)算設(shè)備通過在不從所述與共振峰頻率含量相關(guān)的較高速率參數(shù)合成共振峰頻率含量的情況下處理所述與激勵(lì)信號相關(guān)的較高速率參數(shù)來產(chǎn)生與激勵(lì)信號相關(guān)的較低速率參數(shù)；
-第四計(jì)算機(jī)可讀程序代碼，用于使得計(jì)算設(shè)備輸出當(dāng)前幀的模糊參數(shù)表示，所述當(dāng)前幀的模糊參數(shù)表示包括所述與共振峰頻率含量相關(guān)的較低速率參數(shù)和所述與激勵(lì)信號相關(guān)的較低速率參數(shù)；
-其中所述與共振峰頻率含量相關(guān)的較低速率參數(shù)和所述與激勵(lì)信號相關(guān)的較低速率參數(shù)的組合比所述與共振峰頻率含量相關(guān)的較高速率參數(shù)和所述與激勵(lì)信號相關(guān)的較高速率參數(shù)的組合占據(jù)更少的位。
47.一種將用于當(dāng)前幀的較高速率語音參數(shù)轉(zhuǎn)換為用于當(dāng)前幀的較低速率語音參數(shù)的方法，包括
-產(chǎn)生用于一系列幀中的每一個(gè)幀的相應(yīng)目標(biāo)激勵(lì)信號，所述一系列幀包括當(dāng)前幀和先前幀，用于給定幀的目標(biāo)激勵(lì)信號基于給定幀的相應(yīng)第一固定組成和給定幀的相應(yīng)第一自適應(yīng)組成；
-在第一和第二模式之一下產(chǎn)生當(dāng)前幀的第二自適應(yīng)組成；
-在第一模式下，根據(jù)先前幀的第一固定組成來生成當(dāng)前幀的第二自適應(yīng)組成；
-在第二模式下，根據(jù)先前幀的第二固定組成來生成當(dāng)前幀的第二自適應(yīng)組成；
-其中在所述第二模式下的工作響應(yīng)于對當(dāng)前幀的速率降低請求；
-確定用于當(dāng)前幀的模糊激勵(lì)參數(shù)，用于當(dāng)前幀的模糊激勵(lì)參數(shù)被包含在用于當(dāng)前幀的較低速率語音參數(shù)中，用于當(dāng)前幀的模糊激勵(lì)參數(shù)是根據(jù)用于當(dāng)前幀的目標(biāo)激勵(lì)信號和當(dāng)前幀的第二自適應(yīng)組成來生成的，用于當(dāng)前幀的模糊激勵(lì)參數(shù)被用來生成當(dāng)前幀的第二固定組成。
全文摘要
用于將較高速率語音參數(shù)轉(zhuǎn)換為包括模糊激勵(lì)參數(shù)的較低速率參數(shù)的轉(zhuǎn)換實(shí)體和方法。該轉(zhuǎn)換實(shí)體包括第一解碼器，第一解碼器被配置成根據(jù)第一固定組成和第一自適應(yīng)組成，從較高速率參數(shù)產(chǎn)生目標(biāo)激勵(lì)。該轉(zhuǎn)換實(shí)體還包括第二解碼器，第二解碼器被配置成產(chǎn)生第二自適應(yīng)組成，并且被配置成可選擇地工作在第一或者第二模式下。在第一模式下，根據(jù)先前幀的第一固定組成來生成第二自適應(yīng)組分，而在第二模式下，根據(jù)先前幀的第二固定組成來生成第二自適應(yīng)組分。第二解碼器響應(yīng)于速率降低請求而工作在第二模式下。處理模塊根據(jù)目標(biāo)激勵(lì)和第二自適應(yīng)組成來確定模糊激勵(lì)參數(shù)，以用于生成當(dāng)前幀的第二固定組成。
文檔編號G10L19/08GK101617361SQ200780043174
公開日2009年12月30日申請日期2007年9月28日優(yōu)先權(quán)日2006年9月28日
發(fā)明者L·布羅克巴, 余漢生申請人:北方電訊網(wǎng)絡(luò)有限公司

完整全部詳細(xì)技術(shù)資料下載