有效的語音流轉(zhuǎn)換的制作方法

文檔序號：2829291閱讀：425來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：：有效的語音流轉(zhuǎn)換的制作方法
技術(shù)領(lǐng)域：
：本發(fā)明總體上涉及語音數(shù)據(jù)通信，并且尤其涉及用于將編碼的語音流從第一編碼方案轉(zhuǎn)換成第二編碼方案的方法和裝置。
背景技術(shù)：
：終端之間例如語音、音頻或視頻數(shù)據(jù)之類的數(shù)據(jù)的通信通常經(jīng)由通過通信網(wǎng)絡(luò)發(fā)送的編碼的數(shù)據(jù)流來實現(xiàn)。為了將編碼的數(shù)據(jù)流從發(fā)送終端傳送到接收終端，首先由發(fā)送終端的編碼器依照一定的編碼方案對該數(shù)據(jù)流進(jìn)行編碼。執(zhí)行所述編碼通常是為了壓縮數(shù)據(jù)并且使其適應(yīng)通信的其他要求。編碼的數(shù)據(jù)流經(jīng)由通信網(wǎng)絡(luò)發(fā)送到接收終端，其中所接收的編碼的數(shù)據(jù)流由解碼器解碼以便由接收終端進(jìn)行進(jìn)一步的處理。這種端到端通信依賴于發(fā)送端的編碼器和接收端的解碼器是兼容的。代碼轉(zhuǎn)換器(transc。der)是一種執(zhí)行第一數(shù)據(jù)流到第二數(shù)據(jù)流的轉(zhuǎn)換的設(shè)備，所述第一數(shù)據(jù)流依照笫一編碼方案來編碼，所述第二數(shù)據(jù)流對應(yīng)于第一數(shù)據(jù)流，但是依照第二編碼方案來編碼。因此，如果發(fā)送/接收終端中的編碼器/解碼器對不兼容，那么可以在通信網(wǎng)絡(luò)中安裝一個或多個代碼轉(zhuǎn)換器，使得可以經(jīng)由通信網(wǎng)絡(luò)將編碼的數(shù)據(jù)流傳輸?shù)浇邮战K端，由此接收終端能夠解碼所接收的編碼的數(shù)據(jù)流。在通信網(wǎng)絡(luò)中的不同位置處需要代碼轉(zhuǎn)換器。在一些通信網(wǎng)絡(luò)中，具有不同傳輸比特率的傳輸模式是可用的，以便克服例如容量問題或鏈路質(zhì)量問題。這樣的不同比特率可以用于整個端到端通信上或者僅用于某些部分上。有時終端沒有對所有的可替換比特率有所準(zhǔn)備，這意味著必須在通信網(wǎng)絡(luò)中采用一個或多個代碼轉(zhuǎn)換器來將編碼的數(shù)據(jù)流轉(zhuǎn)換成合適的編碼方案。代碼轉(zhuǎn)換通常需要對依照第一編碼方案編碼的編碼的語音流進(jìn)行解碼并且接著依照第二編碼方案對所述解碼語音流進(jìn)行編碼。這種匯接(tandeming)通常使用標(biāo)準(zhǔn)化的解碼器和編碼器。因此，完全的代碼轉(zhuǎn)換一般要求完整的解碼器和完整的編碼器。然而，其中對所有編碼參數(shù)都進(jìn)行重新計算的這種匯接代碼轉(zhuǎn)換的現(xiàn)有解決方案消耗了大量的7計算能力，因為就周期和諸如可編程R0M、靜態(tài)RAM和動態(tài)RAM之類的存儲器而言，完全的代碼轉(zhuǎn)換是相當(dāng)復(fù)雜的。此外，重新編碼使得語音表示退化，這降低了最終的語音質(zhì)量。而且，由于處理時間以及在第二編解碼器中可能存在的先行(lookahead)語音樣本緩沖器而引入了延遲。這種延遲特別對于實時或準(zhǔn)實時通信(例如語音、視頻、音頻播出或其組合)來說是有害的。已經(jīng)努力來對代表依照預(yù)定義算法編碼的數(shù)據(jù)流的編碼參數(shù)進(jìn)行代碼轉(zhuǎn)換，以便直接形成一組全新的、代表依照第二編碼方案編碼的數(shù)據(jù)流的編碼參數(shù)，而不必經(jīng)過合成語音的狀態(tài)。然而，這樣的任務(wù)是復(fù)雜的，并且產(chǎn)生了許多種類的偽像。在3G(UTRAN)網(wǎng)絡(luò)中，自適應(yīng)多速率(AMR)編碼方案在長時間內(nèi)將是主流聲音編解碼器。"AMR-12.2"(依照3GPP/TS-26.071)是一種以12.2kbit/s的比特率操作的代數(shù)碼激勵線性預(yù)測(ACELP)編碼器。幀的大小為20ms,具有4個5ms的子幀。使用了5ms的先行。采用了非連續(xù)傳輸(DTX)功能，用于AMR-12.2聲音編解碼器。對于2.xG(GERAN)網(wǎng)絡(luò)，則是GSM-EFR將在相當(dāng)長時間段內(nèi)在網(wǎng)絡(luò)節(jié)點中占主導(dǎo)地位，即使引入能夠?qū)崿F(xiàn)AMR編碼方案的手持設(shè)備，情況也將如此。GSM-EFR編解碼器(依照3GPP/TS-06.51)也基于將20ms語音幀劃分成4個子幀的12.2kbit/sACELP編碼器。不過，沒有使用先行。采用了非連續(xù)傳輸(DTX)功能，但是用于GSM-EFR聲音編解碼器，這與AMR-12.2相比是不同的。因此對于兩種類型的網(wǎng)絡(luò)之間的通信而言，需要解碼到PCM域(64kbit/s)中或者在參數(shù)域(12.2kbps)中分別在AMR-12.2和GSM-EFR之間來回進(jìn)行直接的代碼轉(zhuǎn)換。由于在AMR算法中用于聲音活動檢測(VAD)的先行緩沖器的原因，GSM-EFR到AMR-12.2方向的完全代碼轉(zhuǎn)換(匯4妻)將添加至少5ms的附加延遲。完全代碼轉(zhuǎn)換的實際處理延遲也將在一定程度上增大總體延遲。由于AMR-12.2和GSM-EFR編解碼器共享相同的核心壓縮方案(12.2kbit/sACELP編碼器將20ms的語音幀劃分成4個子幀)，因此可以設(shè)想，能夠設(shè)計出低復(fù)雜度的直接轉(zhuǎn)換方案。于是，相比于完全代碼轉(zhuǎn)換情況下的64kbit/s通信，這也將提供網(wǎng)絡(luò)邊界上的完全的l2.Abit/S通信。一種可能的方法會是基于另一種編碼方案的解碼器對一種編碼方案創(chuàng)建的語音幀的直接使用。然而，已經(jīng)進(jìn)行了若干測試，其展現(xiàn)了嚴(yán)重的語音偽像，特別是出現(xiàn)了令人心煩的噪聲脈沖串。在公布的美國專利申請2003/0177004中，公開了一種用于將基于CELP的壓縮聲音比特流從源編解碼代碼轉(zhuǎn)換到目的編解碼的方法。來自輸入CELP比特流的一個或多個源CELP參數(shù)^L解包并插值成目的編解碼格式，以便克服幀大小、采樣率等方面的差異。在美國專利6260009中，公開了一種用于基于CELP到基于CELP的聲碼器分組變換的方法和裝置。該裝置包括共振峰參數(shù)變換器和激勵參數(shù)變換器。提供了共振峰濾波器系數(shù)和輸出碼書以及基頻(pitch)參數(shù)。這些現(xiàn)有技術(shù)系統(tǒng)中沒有一種討論了具有相似核心壓縮方案的編解碼系統(tǒng)的任何剩余互操作性問題。
發(fā)明內(nèi)容現(xiàn)有技術(shù)語音代碼轉(zhuǎn)換方法和設(shè)備的一般問題是它們引入了令人心煩的偽像，例如延遲、降低的總體語音質(zhì)量或者出現(xiàn)的噪聲脈沖串(burst)。另一個一般問題是所需的計算要求相對較高。因此，本發(fā)明的總體目的是提供使用較小的計算能力同時保持質(zhì)量級別的語音代碼轉(zhuǎn)換。換言之，目的是提供沒有主觀質(zhì)量退化的低復(fù)雜度語音流轉(zhuǎn)換。本發(fā)明的另一個目的是提供用于在涉及的編碼方案的參數(shù)域之間進(jìn)行直接轉(zhuǎn)換的語音代碼轉(zhuǎn)換，其中所述涉及的編碼方案對于語音幀使用相似的核心壓縮方案。上述目的是通過依照隨附專利權(quán)利要求的方法和裝置來實現(xiàn)的?？偟恼f來，第一語音編碼方案的語音幀用作第二語音編碼方案的語音幀，其中這些語音編碼方案對于語音幀使用相似的核心壓縮方案，所述相似的核心壓縮方案優(yōu)選地是比特流兼容的。優(yōu)選地，通過確定諸如語音類型轉(zhuǎn)變之類的預(yù)定語音演變(例如在一定時段的語音靜默之后語音開始)的出現(xiàn)，或者通過對第一語音編碼方案和第二語音編碼方案之間的能量參數(shù)進(jìn)行試探性解碼并且接著進(jìn)行比較，來識別這兩種語音編碼方案之間的能量參數(shù)中的狀態(tài)失配的出現(xiàn)。隨后，在狀態(tài)失配出現(xiàn)后調(diào)節(jié)第二語音編碼方案的至少一個幀中的能量參數(shù)。本發(fā)明還給出了提供這種代碼轉(zhuǎn)換功能的代碼轉(zhuǎn)換器和通信系統(tǒng)。從而，對初始語音幀進(jìn)行單獨地處理并且提供用于改善格式轉(zhuǎn)換的主觀性能的優(yōu)選算法和設(shè)備。在特定實施例中，提供了能夠?qū)MR-12.2流轉(zhuǎn)換成GSM-EFR流以及將GSM-EFR流轉(zhuǎn)換成AMR-12.2流的有效轉(zhuǎn)換方案。優(yōu)選地，結(jié)合對于靜音描述符參數(shù)的重新量化來修改初始語音幀中的參數(shù)以便補償狀態(tài)缺陷。優(yōu)選地，修改話音脈沖串中的初始語音幀的語音參數(shù)，以便補償與舒適噪聲參數(shù)的重新量化和再同步有關(guān)的編解碼狀態(tài)差異。在另外的特定實施例中，給出了對于G.729(ITU-T8kbps)到/來自AMR7.4(DAMPS-EFR)的編解碼器提供低復(fù)雜度轉(zhuǎn)換的可能性的有效轉(zhuǎn)換方案。在另外的特定實施例中，給出了提供在PDC-EFR編解碼器和AMR67之間的相似轉(zhuǎn)換的有效轉(zhuǎn)換方案。本發(fā)明具有許多優(yōu)點?？梢栽诘捅忍芈蕝?shù)域而不是以高比特率語音流執(zhí)行利用不同編碼方案的網(wǎng)絡(luò)間通信。對于AMR-12.2到GSM-EFR的情況，核心網(wǎng)絡(luò)(CN)可以使用AMR-12.2到GSM-EFR分組(<16kbps)的分組傳送而不是傳送64kbps的PCM流。此外，相比于匯接編碼的語音，編解碼語音的質(zhì)量將得到改善。而且，潛在地存在總體延遲的降低，因為例如在EFR到AMR-12.2的轉(zhuǎn)換中不需要任何先行緩沖器并且處理延遲將小于代碼轉(zhuǎn)換延遲。通過參照結(jié)合了附圖的下列描述，可以充分理解本發(fā)明及其目的和優(yōu)點，其中圖1為包括代碼轉(zhuǎn)換功能的通信系統(tǒng)的示意圖；圖2A和B為圖解說明了^f皮解碼的幀的示圖；圖3為依照本發(fā)明方法的一個實施例的主要步驟的流程圖；圖4A-C為圖解說明了被解碼的語音的例子的示圖；圖5A為圖解說明了分別在GSM-EFR和AMR-12.2中的DTX期間的SID結(jié)構(gòu)的時間圖5B為圖解說明了在DTX期間用于從GSM-EFR到AMR-12.2的代碼轉(zhuǎn)換的SID結(jié)構(gòu)轉(zhuǎn)換的時間圖5C為圖解說明了在DTX期間用于從AMR-12.2到GSM-EFR的代碼轉(zhuǎn)換的SID結(jié)構(gòu)轉(zhuǎn)換的時間圖6A為從GSM-EFR到AMR-12.2的代碼轉(zhuǎn)換器實施例的主要部分的框圖6B為從AMR-12.2到GSM-EFR的代碼轉(zhuǎn)換器實施例的主要部分的框圖。具體實施例方式本發(fā)明涉及在具有相似核心壓縮方案的編碼方案之間的代碼轉(zhuǎn)換。通過"核心壓縮方案"，應(yīng)當(dāng)理解基本編碼原理的類型、所使用的參數(shù)、比特率以及所釆用的語音幀的基本幀結(jié)構(gòu)。在下面討論的示例性實施例中，所述兩個編碼方案是AMR-12.2(依照3GPP/TS-26.071)和GSM-EFR(依照3GPP/TS-06.51)。這兩種方案都利用了12.2kbit/sACELP編碼。此外，兩個方案都利用了包括被劃分成4個子幀的20ms幀的幀結(jié)構(gòu)。語音幀中的比特分配也是相同的。因此，普通語音幀的比特流從一個編碼方案到另一個編碼方案是兼容的，即這兩個語音編碼方案對于包含編碼的語音的幀是比特流兼容的。換言之，包含編碼的語音的幀在這兩個語音編碼方案之間是可互操作的。然而，這兩個編碼方案對于采用的非語音幀具有不同的參數(shù)量化器。這些幀稱為SID幀(靜音描述)。當(dāng)對于給定編碼方案激活VAD(聲音活動檢測)/DTX(非連續(xù)傳輸)時，使用SID幀。具有相似核心壓縮方案的一對編解碼器的另一個例子是G.7"(ITU-T8kbps)編解碼器和AMR7.4(DAMPS-EFR)編解碼器，因為它們具有相同的子幀結(jié)構(gòu)，共享大多數(shù)編碼參數(shù)和量化器，例如基頻滯后和固定的革新碼書結(jié)構(gòu)。此外，它們還共享相同的基頻和碼書增益重構(gòu)點。然而，LSP(線譜對)量化器有一定的區(qū)別，幀結(jié)構(gòu)不同并且規(guī)定的DTX功能不同。一對相關(guān)的編碼方案的再一個例子是PDC-EFR編解碼器和AMR67編解碼器。它們僅在DTX定時和SID傳送方案方面有區(qū)別。另外，具有的幀在比特分配或幀大小方面稍有不同的編解碼器也可以是本發(fā)明的主題。例如，幀長度為另一相關(guān)編解碼器的幀長度的整數(shù)倍的編解碼器也可以適用于實現(xiàn)本發(fā)明的構(gòu)思。因此，本領(lǐng)域技術(shù)人員應(yīng)當(dāng)認(rèn)識到，本發(fā)明的原理不應(yīng)當(dāng)局限于所述示例性賣施例的特定編解碼器，而是可以普遍適用于具有相似核心壓縮方案的任何編解碼器對。圖1圖解說明了包括兩個通信系統(tǒng)2和3的電信系統(tǒng)1。通信網(wǎng)絡(luò)3為使用AMR-12.2聲音編解碼器的3G(UTRAN)網(wǎng)絡(luò)。通信網(wǎng)絡(luò)2為使用GSM-EFR聲音編解碼器的2.xG(GERAN)網(wǎng)絡(luò)。當(dāng)適用于在通信網(wǎng)《備2中進(jìn)行通信的終端4應(yīng)當(dāng)與適用于在通信網(wǎng)絡(luò)3中進(jìn)行通信的終端5通信時，必須在沿著通信路徑11的某個地方執(zhí)行代碼轉(zhuǎn)換?？梢詫SM-EFR到AMR-12.24戈碼轉(zhuǎn)^奐器6和AMR-12.2到GSM-EFR^f戈碼轉(zhuǎn):換器7設(shè)置在通信網(wǎng)絡(luò)2的接口節(jié)點8中，這導(dǎo)致依照AMR-12.2編碼的語音在兩個通信網(wǎng)絡(luò)2、3之間傳輸。可替換地，也可以將代碼轉(zhuǎn)換器6、7共同設(shè)置在通信網(wǎng)絡(luò)3的接口節(jié)點9中，這導(dǎo)致依照GSM-EFR編碼的語音在兩個通信網(wǎng)絡(luò)2、3之間傳輸。也可以將代碼轉(zhuǎn)換器6和7設(shè)置在各自的接口節(jié)點8、9中或者設(shè)置在這兩個節(jié)點中，由此被傳送的語音幀可以依照任一種語音編碼方案來進(jìn)行轉(zhuǎn)換。AMR是用于提供多速率編碼的標(biāo)準(zhǔn)化系統(tǒng)。有8種范圍從4.75kbit/s到12.2kbit/s的不同比特率可用，其中記為AMR-12.2的最高比特率才莫式在本公開中受到特別關(guān)注。這個自適應(yīng)多速率語音編碼器基于ACELP技術(shù)。5ms的先行用于允許在所有8種模式之間進(jìn)行切換。表1中示出了對于AMR-12.2模式的比特分配。為了進(jìn)行LP分析和量化，對于每個幀計算兩個LP濾波器。利用l階MA預(yù)測LSF殘余的分裂矩陣量化來聯(lián)合量化這些濾波器。表1對于AMR-12.2和GSM-EFR幀的比特分配<table>tableseeoriginaldocumentpage12</column></row><table>AMR-12.2采用了自適應(yīng)碼書增益的直接量化以及代數(shù)碼書增益的MA預(yù)測量化。標(biāo)量開環(huán)量化用于自適應(yīng)和固定碼書增益。A匪-12.2還提供了DTX(非連續(xù)傳輸)功能，用于在沒有語音活動的時段期間節(jié)省資源。低速率SID消息以低的更新率被發(fā)送以便通知背景噪聲的狀態(tài)。在AMR-12.2中，發(fā)送笫一消息"AMRSID—FIRST"，其除了應(yīng)當(dāng)啟動噪聲注入之外，不包含任何頻譜或增益信息。該消息之后是包含絕對量化的LSP和幀能量的"AMRSID-UPDATE"消息。"AMRSID—UPDATE"消息隨后每8幀傳送一次，^f旦是不與網(wǎng)絡(luò)超幀結(jié)構(gòu)同步。當(dāng)要重新啟動語音編碼時，將語音增益編解碼器狀態(tài)設(shè)置成基于最后的"AMRSID-UPDATE"消息中的舒適噪聲能量的動態(tài)值。GSM-EFR也是標(biāo)準(zhǔn)化的系統(tǒng)，其增強GSM的通信以便包括12.2kbit/s的比特率。GSM-EFR語音編碼器也基于ACELP技術(shù)。沒有使用先行。比特分配與AMR-12.2中的相同，如上表l中所示。GSM-EFR也提供了DTX功能。在這里，SID消息也被發(fā)送來通知所述狀態(tài)，但是具有另一種編碼格式和另一種定時結(jié)構(gòu)。在每個語音到噪聲轉(zhuǎn)變中的初始SID幀之后，每24幀規(guī)則地傳送一次單一類型SID幀，其與GERAN超幀結(jié)構(gòu)同步。語音幀LSP和增益量化表被再度用于SID消息，但是幀增益和量化的LSP的德耳塔(delta)(差分)編碼用于采用的非語音幀。當(dāng)要重新啟動語音編碼時，將語音增益編解碼器狀態(tài)重置為固定值。由上可知，AMR-12.2和GSM-EFR編解碼器之間有著驚人的相似性。至少對于包含編碼的語音的幀而言，AMR-12.2語音編碼方案和GSM-EFR語音編碼方案的核心壓縮方案是比特流兼容的。然而，存在在這兩種編解碼器之間進(jìn)行代碼轉(zhuǎn)換時必須加以考慮的區(qū)別。在GSM-EFR和AMR-12.2中，對于舒適噪聲(CN)譜和能量參數(shù)進(jìn)行不同地量化。如上所述，EFRSID包含LSP和編碼增益，兩者都根據(jù)在7幀DTX延遲釋放(hangover)時段期間收集的參考數(shù)據(jù)來進(jìn)行德耳塔量化。AMRSID—UPDATE包含絕對量化的LSP和幀能量，而AMRSID—FIRST不包含任何頻鐠或增益信息，它只是有關(guān)應(yīng)當(dāng)啟動噪聲注入的通知。另一個重要的區(qū)別是在DTX時段期間不同的編碼增益預(yù)測器重置機制。GSM-EFR編碼器將預(yù)測器狀態(tài)重置成常量，而AMR編碼器根據(jù)最近的SID—UPDATE消息中的能量來設(shè)置初始預(yù)測器狀態(tài)。其原因在于，如果按照GSM-EFR方式來重置狀態(tài)，那么更低速率的AMR才莫式?jīng)]有足夠的比特用于初始語音幀的增益量化。在GSM-EFR到AMR-12.2轉(zhuǎn)換中，為了對德耳塔量化的GSM-EFRCN參數(shù)進(jìn)行代碼轉(zhuǎn)換，首先必須對其進(jìn)行解碼。代碼轉(zhuǎn)換器因而必須包括完整的GSM-EFRSID參數(shù)解碼器。但是不需要合成。然后，可以用AMR-12.2量化器直接對解碼的LSF/LSP進(jìn)行量化。為了從GSM-EFRCN增益轉(zhuǎn)換到AMRCN幀能量，還必須估計LPC合成濾波器的增益。在為了研究GSM-EFR和AMR-12.2之間的互操作性而進(jìn)行的測試中，發(fā)現(xiàn)了令人心煩的噪聲脈沖串。這些令人心煩的噪聲脈沖串主要出現(xiàn)在話音的開始處，例如在DTX時段的末尾處。因此，推斷從GSM-EFR到AMR-12.2的代碼轉(zhuǎn)換的主要問題在于不同的編碼增益預(yù)測器狀態(tài)的初始化。在DTX期間，AMR-12.2預(yù)測器總是凈皮初始化成相等或者大于GSM-EFR的值。只有在遠(yuǎn)程編碼器舒適噪聲級別足夠低時，它們才被初始化成相同的值。圖2A和2B圖解說明了信號的事件過程。圖2A代表依照GSM-EFR編碼方案編碼和解碼的語音信號，即正常的EFR編碼并且接著正常的EFR解碼。語音信號已經(jīng)存在。在時刻tl，開始靜音時段，即只有噪聲的片段。GSM-EFR編碼通過發(fā)送SID消息來啟動DTX過程。在噪聲片段的中間，將單一幀分類成語音幀。在時刻t2,由編碼器的聲音活動檢測算法確定的幀類型于是指示幀包含普通語音，但是聲音波形中不存在實際的語音。時刻t2處語音開始的指示導(dǎo)致重新啟動普通的GSM-EFR編碼。圖2B示出了在正常的EFR編碼之后是對于相同噪聲片段的正常AMR122解碼的情況下將出現(xiàn)的能量脈沖串。圖2B因而代表與圖2A中相同的信號，該信號也依照GSM-EFR來編碼，^f旦是現(xiàn)在是依照AMR-12.2編碼方案來解碼的，所述AMR-U.2編碼方案祐:調(diào)節(jié)以便符合GSM-EFRDTX功能。因此，在連續(xù)語音編碼期間(即時刻tl之前)的語音信號被正確解碼。在靜音期間，該被解碼的信號取決于所執(zhí)行的特定SID裝置的調(diào)節(jié)，但是將相對容易地給出合理的背景噪聲級別，如圖2B所示。然而，恰好在語音指示時，即在時刻t2處，出現(xiàn)了大的能量脈沖串，在所述大的能量脈沖串之后被解碼的信號返回到對應(yīng)于由GSM-EFR解碼本身實現(xiàn)的級別的更精確的級別。該能量脈沖串實際上與靜音時段之后的第一語音幀的出現(xiàn)關(guān)聯(lián)。圖4A和4B中描繪了類似的情況，其圖解說明了當(dāng)在編解碼方案之間使用不同的互操作時語音開始的例子。在圖4A中，時刻t2處語音的開始被圖示為由GSM-EFR進(jìn)行編碼和解碼。在圖4B中，對應(yīng)的信號由GSM-EFR編碼，但是依照AMR-12.2來解碼，而沒有任何進(jìn)一步的修改。這些不同的初始化方案的結(jié)果在于，除非CN(舒適噪聲)級別足夠低，否則話音脈沖串(即第一幀)中初始(例如前4個)子幀的去量化編碼增益將非常高。這在圖4B中可以看作信號的飽和。在測試期間所觀察到的最壞的情況中，被解碼增益高達(dá)18倍(25dB)，導(dǎo)致非常響的、令人心煩的并且有時有害的聲音尖峰。這種最壞的情況在GSM-EFR編碼器輸入背景噪聲信號具有非常高的能量使得AMR-12.2預(yù)測的值將基于狀態(tài)值"0"的時候出現(xiàn)。該狀態(tài)從被轉(zhuǎn)換的GSM-EFRSID信息中導(dǎo)出。GSM-EFR預(yù)測器狀態(tài)〗直為"-2381",其是從在第一傳送的SID幀中重置的GSM-EFR中得到的。這種狀態(tài)差異的聲學(xué)效果通常是，在AMR-12.2合成中聽到約為10ms長的小噪聲脈沖串"blipp，，，參見圖2B。然而，偶爾當(dāng)?shù)谝徽Z音子幀包含濁音語音的時候，所述效果幾乎是使得合成濾波器飽和的爆炸聲，以及潛在地甚至對聽眾耳朵有害的合成，如圖4B所示的。從聲音質(zhì)量的角度來看，這兩種效果都是不能接受的。在另一個方向即AMR-12.2到GSM-EFR方向的^f戈碼轉(zhuǎn):換中，增益差異將沿相反的方向。于是，增益值將在第一幀中降低，但是在第二幀的第一子幀中將是正確的。結(jié)果是語音的開始有衰減，這也是不希望的。AMR-12.2到GSM-EFR的合成具有更低的啟動幅度，但是波形仍然與GSM-EFR合成匹配得很好。在認(rèn)識到令人心煩的語音偽像的原因起源于在能量參數(shù)中出現(xiàn)的狀態(tài)失配時，就可以采取行動，所述能量參數(shù)例如上述實施例中的增益因子。首先，應(yīng)當(dāng)識別出狀態(tài)失配出現(xiàn)的時機。其次，當(dāng)出現(xiàn)這種失配時，應(yīng)當(dāng)調(diào)節(jié)該能量參數(shù)來減少可察覺的偽像。這樣的調(diào)節(jié)優(yōu)選地應(yīng)當(dāng)在狀態(tài)失配出現(xiàn)之后在一個或多個幀中進(jìn)行?？梢园凑詹煌姆绞絹碜R別狀態(tài)失配的出現(xiàn)。一種方法是跟蹤語音特征的演變并且識別預(yù)定語音演變何時出現(xiàn)。預(yù)定語音演變可以例如是像在上述所研究情況中的語音類型轉(zhuǎn)變。上述特定情況可以定義為在一定時段的語音靜默之后語音開始的預(yù)定語音演變。圖3為圖解說明了依照本發(fā)明方法的一個實施例的主要步驟的流程圖。該過程在步驟200中開始。在步驟210中，第一語音編碼方案的語音幀用作第二語音編碼方案的語音幀。第一語音編碼方案和第二語音編碼方案對于語音幀使用了相似的核心壓縮方案。在步驟212中，識別在所述第一語音編碼方案和所述第二語音編碼方案之間能量參數(shù)中的狀態(tài)失配的出現(xiàn)。在這個實施例中，步驟212包括另外的部分步驟214和216。在步驟214中，跟蹤語音的演變。在步驟216中，確定例如預(yù)定語音類型轉(zhuǎn)變之類的預(yù)定語音演變是否出現(xiàn)。特別地，可以檢測出在一定時段的語音靜默之后語音的開始。如果沒有發(fā)現(xiàn)所述預(yù)定語音演變，那么結(jié)束該過程或者像在下面描述的那樣重復(fù)該過程。如果發(fā)現(xiàn)了所述預(yù)定語音演變，那么該過程繼續(xù)到步驟218。在步驟218中，在狀態(tài)失配出現(xiàn)之后在第二語音編碼方案的幀的至少一個幀中調(diào)節(jié)能量參數(shù)。該過程在步驟299中結(jié)束。在實踐中，只要存在待處理的語音幀，就重復(fù)該過程，如箭頭220所示。狀態(tài)失配的出現(xiàn)還可以通過更直接的方法來檢測?？梢詫τ傻谝徽Z音編碼方案編碼的語音的能量參數(shù)進(jìn)行解碼。同樣，可以對使用第二編碼方案的語音的能量參數(shù)進(jìn)行解碼。通過比較按照這種方式獲得的能量參數(shù)，太大的差異意味著存在狀態(tài)失配。然后，可以對于每個子幀連續(xù)地執(zhí)行增益調(diào)節(jié)，直到檢測的狀態(tài)失配可以忽略不計為止。假定通過監(jiān)視語音靜默時段之后的語音的啟動來檢測狀態(tài)失配。另外假定從GSM-EFR到AMR-12.2的代碼轉(zhuǎn)換。于是，調(diào)節(jié)增益的一種解決方案會是修改每個話音脈沖串中語音幀的第一耦合中的編碼增益參數(shù)，直到AMR-12.2解碼器增益預(yù)測器狀態(tài)與GSM-EFR編碼器狀態(tài)會聚為止。為此，代碼轉(zhuǎn)換器必須跟蹤GSM-EFR和AMR-12.2的預(yù)測器狀態(tài)二者。按照語音質(zhì)量觀點，最佳的方法然后計算用于AMR-12.2的新編碼增益參數(shù)，其準(zhǔn)則是去量化的增益應(yīng)當(dāng)?shù)扔诩俣ǖ腉SM-EFR解碼器中的去量化的增益。實驗表明，在AMR-12.2預(yù)測器會聚并且等于GSM-EFR預(yù)測器之前，一般需要調(diào)節(jié)2到5個語音幀。這種方法將使得AMR-12.2解碼器與GSM-EFR具有近乎完美的增益匹配。然而由于量化器飽和的原因，仍然會出現(xiàn)少許的失配。如果在話音脈沖串中的第一子幀中增益量化器飽和了并且先前的CN級別足夠高，那么這一般發(fā)生在話音脈沖串的第二子幀中。于是，由于預(yù)測器中的值更高，第一AMR-12.2子幀的編碼增益將顯著降低。然后，將這個低值移位到AMR-12.2解碼器的預(yù)測器存儲器中，但是另一方面，所述假定的GSM-EFR解碼器移位到最大值(飽和的量化器)。于是在第二子幀中，AMR-12.2突然具有更低的預(yù)測，因為預(yù)測器存儲器中最新的值具有最高的強度。然后如果第二子幀的增益參數(shù)太高，那么隨著代碼轉(zhuǎn)換器設(shè)法補償預(yù)測器的失配，新的A藍(lán)-12.2增益參數(shù)將會飽和。因此，解碼的編碼增益將會太低。這種量化飽和效應(yīng)幾乎不能察覺，但是可能的改進(jìn)將是同時對于兩個或多個子幀計算AMR編碼增益，然后能夠使得總體能量對于更長的積分時l殳是正確的。上述增益的"近乎完美的"匹配要求對兩種語音編碼方案的預(yù)測器狀態(tài)進(jìn)行監(jiān)視。在大多數(shù)情況下，可獲得不那么復(fù)雜但是次優(yōu)的解決方案。在一個實施例中，通過指標(biāo)域中的預(yù)定因子來簡單地調(diào)節(jié)編碼增益指標(biāo)。在實驗中，已經(jīng)測試了只對第一子幀的能量參數(shù)一分為二以便消除過度預(yù)測，即在指標(biāo)域中將能量參數(shù)降低50%。然后，比特域操作可以保證大大地降低增益，這種操作在大多數(shù)情況下會是足夠的。在編碼的比特流上容易實現(xiàn)能量參數(shù)指標(biāo)降低因子為2",其中n為大于0的整數(shù)。在實踐中的確發(fā)現(xiàn)，與理想情況相比，這種簡化的增益轉(zhuǎn)換算法工作時具有非常小的質(zhì)量退化。另一種指標(biāo)域方法將是利用至少~15個指標(biāo)步驟來一直降低第一增益指標(biāo)值，這對應(yīng)于大約-22dB的狀態(tài)降低。甚至將能量參數(shù)設(shè)為零也是可能的，由此在出現(xiàn)狀態(tài)失配之后抑制了所述第一幀。另一種方法是只丟棄每個話音脈沖串中的第一語音幀。如果利用小的值來初始化GSM-EFR增益預(yù)測器狀態(tài)，那么第一輸入語音幀中的增益指標(biāo)通常將是相當(dāng)高的。結(jié)果是對于第二語音幀的預(yù)測增益比對于第一語音幀的預(yù)測增益高。因此，通過對于AMR-12.2流丟棄完整的第一語音幀，AMR-12.2解碼器對于其第一語音幀(即對于第二GSM-EFR語音幀)具有太低的而不是太高的預(yù)測增益。這種方法在最初20ms內(nèi)對于波形具有顯著的影響。非常令人驚奇的是，語音的主觀退化相當(dāng)?shù)?。但是，每個話音脈沖串中的初始濁音的確在一定程度上釋放了其"沖擊"。調(diào)節(jié)過程還可以包括在狀態(tài)失配出現(xiàn)之前的幀期間根據(jù)基于舒適噪聲能量的估計來改變能量參數(shù)。該調(diào)節(jié)也可以根據(jù)外部能量信息來進(jìn)行。調(diào)節(jié)步驟的定時還可以依照不同的方法來實現(xiàn)。一般情況下，對狀態(tài)失配出現(xiàn)之后的第一幀進(jìn)行調(diào)節(jié)。不過，可以對于每個子幀單獨地執(zhí)行調(diào)節(jié)步驟，或者對于整個幀共同地執(zhí)行調(diào)節(jié)步驟。優(yōu)選地，在頭一幀或頭兩幀中將編碼增益降低預(yù)定指標(biāo)倍數(shù)，以便例如使得AMR-12.2解碼器中的預(yù)測增益降低。然而，在更復(fù)雜的方法中，實際增益失配的測量可以確定何時跳過調(diào)節(jié)步驟。上面進(jìn)行的討論，i設(shè)了從GSM-EFR到AMR-12.2的代碼轉(zhuǎn)換。原則上，同樣的原理對于從AMR-12.2到GSM-EFR的代碼轉(zhuǎn)換也是有效的。在這樣的情況下，能量參數(shù)的減小通常不是有用的，因為GSM-EFR的能量參數(shù)被低估了。GSM-EFR的預(yù)測器總是被初始化成比AMR-12.2更小或者相等的值，并且從而預(yù)測增益總是更小或相等。其效果在于，對于話音脈沖串中第一語音幀的被解碼增益將會太低。在大多數(shù)情況下，這種退化在單次談話情況中幾乎不能被察覺。即使可能不是必須的，也的確可能通過對于/人AMR-12.2到GSM-EFR的代碼轉(zhuǎn)換調(diào)節(jié)第一語音幀中的編碼增益來改善所述代碼轉(zhuǎn)換。在這種情況下，指標(biāo)域中的任何直接調(diào)節(jié)都將導(dǎo)致增益指標(biāo)的增大。圖4C圖解說明了當(dāng)應(yīng)用本發(fā)明時的典型的事件過程。與圖4A和4B中相同的信號被提供。圖4C代表與圖4A中相同的語音信號，該語音信號也依照GSM-EFR來編碼，^f旦是現(xiàn)在依照AMR-12.2編碼方案來解碼，所述AMR-12.2編碼方案被調(diào)節(jié)成符合GSM-EFRDTX功能并且包括上述依照本發(fā)明的增益調(diào)節(jié)例程。容易看出，話音的開始按照比圖4B在的情況可靠得多的方式來重構(gòu)。通過在靜音時段之后將第一語音幀的第一子幀中的增益指標(biāo)降低2倍來調(diào)節(jié)增益。由于GSM-EFR和AMR-12.2的語音幀比特流可互才喿作并且活動時l殳開始處的增益問題可以通過上述方法來解決，因此能夠?qū)崿F(xiàn)有效的轉(zhuǎn)換。這兩個編解碼方案之間的剩余的大的差異與SID信息有關(guān)。然而，可以優(yōu)選地在SID幀的參數(shù)域中執(zhí)行SID信息的代碼轉(zhuǎn)換，以及SID信息(即SID量化(率)和時機)的定時的調(diào)節(jié)。圖5A在上部圖解說明了對于GSM-EFR編碼的DTX時l爻的時間圖。在時刻t3之前存在語音。然后，GSM-EFR編碼器利用第一SID幀標(biāo)記DTX時段的開始，其中笫一SID幀直接在最后的語音幀之后。規(guī)則的SID幀以24幀的時段來發(fā)送，其與GERAN空中接口測量報告同步。在圖5A中，GERAN空中接口測量報告出現(xiàn)在時刻t4和t5。這意味著根據(jù)對于語音結(jié)束和GERAN同步的檢測時刻，在第一SID幀和第二SID(規(guī)則SID)之間發(fā)送的時間可以在0和23幀之間變化。遠(yuǎn)程SID同步是利用稱為TAF(時間對準(zhǔn)標(biāo)志)的狀態(tài)標(biāo)志來執(zhí)行的。在圖5A的下部，圖解說明了對于AMR-12.2編碼的DTX時l殳的時間圖。AMR-12.2編解碼器在時刻t6;險測到語音結(jié)束后立即發(fā)送初始的SID—FIRST幀。然后在3幀之后的時刻t7處，發(fā)送SID—UPDATE幀。之后，每8幀重復(fù)一次SID—UPDATE幀。當(dāng)執(zhí)行圖5A所圖解說明的兩個編碼方案之間的代碼轉(zhuǎn)換時，有必要執(zhí)行SID消息速率和定時的轉(zhuǎn)換。換言之，所述代碼轉(zhuǎn)換涉及將第一語音編碼方案的靜音描述幀中的靜音描述參數(shù)轉(zhuǎn)換成第二語音編碼方案的靜音描述幀中的靜音描述參數(shù)的功能。首先考慮從GSM-EFR到AMR-12.2的代碼轉(zhuǎn)換。這在圖5B中進(jìn)行了示意性的圖解說明。輸入的語音依照頂部時間線來編碼。由于從語音到背景噪聲的轉(zhuǎn)變，SID幀出現(xiàn)在時刻t3。隨后，像GERAN所決定的，附加的規(guī)則SID幀出現(xiàn)在時刻t4和t5。在時刻t3，DTX時段的第一指示通過初始GSM-EFRSID幀的接受而接收。GSM-EFRSID幀的內(nèi)容凈皮存儲，并且AMRSID—FIRST幀依照AMR-12.2編碼方案來生成。由于在AMR-12.2中舒適噪聲更新率更快，所述轉(zhuǎn)換算法必須具有其自身的AMR噪聲更新同步狀態(tài)機。因此，AMR-12.2的SID—UPDATE幀在SID—FIRST幀之后3個幀的時刻t6處創(chuàng)建。來自初始GSM-EFRSID的SID參數(shù);故轉(zhuǎn)換并且在SID—UPDATE幀中被發(fā)送。用于另外的AMR-12.2SID—UPDATE幀的簡單解決方案是連續(xù)地保存來自最近接收的GSM-EFRSID的SID參數(shù)并且只要應(yīng)當(dāng)發(fā)送AMR-12.2SID—UPDATE幀時就重復(fù)它們。^旦是，與GSM-EFR解碼器將提供的能量輪廓相比，該方法對于代碼轉(zhuǎn)換的AMR-12.2舒適噪聲將得到稍微不那么平滑的能量輪廓。其原因在于解碼器中的參數(shù)重復(fù)和參數(shù)插值。該效果幾乎不能察覺，但是可以通過對AMR-12.2SID—UPDATE幀中的能量參數(shù)進(jìn)行濾波并且從而創(chuàng)建更平滑的變體來潛在地加以消除。現(xiàn)在，，可替代地考慮從AMR-12.2到GSM-EFR的代碼轉(zhuǎn)換。這在圖5C中進(jìn)行了示意性的圖解說明。輸入的語音依照底部時間線來編碼。SID—FIRST幀出現(xiàn)在語音結(jié)束處的時刻t3。這是DTX時段開始的指示。為了能夠?qū)SM-EFRSID參數(shù)進(jìn)行德耳塔量化，代碼轉(zhuǎn)換器需要按照與GSM-EFR解碼器相同的方式根據(jù)DTX釋放延遲時段計算CN參考。這意味著在語音時段期間更新能量值和LSF歷史并且具有狀態(tài)機來確定何時已經(jīng)添加了釋放延遲時段。遺憾的是，從復(fù)雜度的觀點來看，在正常19操作情況下，在SID-FIRST和SID—UPDATE之間使用的能量值基于AMR-12.2合成濾波器輸出(在后置濾波之前)。因此，AMR-12.2到GSM-EFR的轉(zhuǎn)換需要合成非后置濾波的語音值以便更新其能量狀態(tài)?？商鎿Q地，可以基于LPC增益、自適應(yīng)碼書增益和固定碼書增益的知識來估計這些能量值。此外，AMR-12.2錯誤隱藏單元使用合成的能量值來更新其背景噪聲檢測器。可以通過計算濾波器增益來將AMR-12.2SID—UPDATE能量轉(zhuǎn)換成GSM-EFRSID增益。由于在SID—FIRST幀中沒有CN參數(shù)一皮發(fā)送，因此代碼轉(zhuǎn)換器必須按照在SID-FIRST一皮接收時AMR-12.2解碼器所做的相同方式來計算第一GSM-EFRSID的CN參數(shù)。然后，可以將SID—FIRST幀轉(zhuǎn)換成初始GSM-EFRSID幀。因此，估計用于輸入的AMR-12.2SID—FIRST幀的靜音描述符參數(shù)并且將估計的靜音描述符參數(shù)量化成第一GSM-EFR靜音描述。在會話中最初GSM-EFRSID的創(chuàng)建啟動了本地TAF計數(shù)器。第一GSM-EFRSID幀的實際GERAN空中接口傳輸將通過遠(yuǎn)程下行鏈路發(fā)送器中的功能與遠(yuǎn)程GERANTAF同步。遠(yuǎn)程下行鏈路發(fā)送器負(fù)責(zé)存儲最近的SID幀并且與實際遠(yuǎn)程TAF同步(與測量報告同步)地發(fā)送它。由于代碼轉(zhuǎn)換器TAF—jfe不與遠(yuǎn)程GERANTXTAF對準(zhǔn)，因而在接收終端處對于GSM-EFRSID出現(xiàn)了延遲At,所述GSM-EFRSID基于本地TAF來發(fā)送。在最壞的情況下，規(guī)則SID在發(fā)送之前可以;故延遲高達(dá)23個幀。連續(xù)的SID—UPDATE不能被直接轉(zhuǎn)換，而是，最近的SID參數(shù)(頻譜和能量)被存儲。然后，代碼轉(zhuǎn)換器保持本地TAF計數(shù)器來確定何時量化最近的參數(shù)并且創(chuàng)建新的GSM-EFRSID。最后，執(zhí)行對于最近被存儲的被接收靜音描述參數(shù)的量化，以便將其包含在新的GSM-EFR靜音描述幀中。下面討論本發(fā)明的另一方面。這里，噪聲的能量級別是由于CN參考矢量狀態(tài)方面的失配引起的問題。然而，這個方面也利用了狀態(tài)失配的識別以及依照所述基本原理的調(diào)節(jié)。這個特定實施例的目的是校正舒適噪聲級別而不是合成語音。如果在呼叫開始之后的一段時間啟動轉(zhuǎn)換，一般會出現(xiàn)這些問題。通過這種異步啟動，在必須轉(zhuǎn)換SID幀之前不能保證構(gòu)造出CN參考矢量。對于兩個方向的轉(zhuǎn)換，幾乎會出現(xiàn)相同的問題。異步啟動的嚴(yán)重性在很大程度上取決于每隔多久轉(zhuǎn)換算法被重置。如果對于每次空中接口切換都重置轉(zhuǎn)換算法，那么問題的情況將頻繁出現(xiàn)并且認(rèn)為問題是嚴(yán)重的。如果另一方面只是例如出于源信號有關(guān)的原因而進(jìn)行重置，那么很可能會認(rèn)為退化是可以忽略不計的。例如每次執(zhí)行DTMF音調(diào)插入時，情況會是這樣。首先，處理了在語音期間啟動代碼轉(zhuǎn)換的問題。如果啟動代碼轉(zhuǎn)換時存在的話音脈沖串持續(xù)長的時間，使得能夠更新CN參考矢量，那么就不會有問題。否則，問題將與在DTX期間啟動的問題相似，這在下面進(jìn)一步加以描述。采用50%的平均聲音活動因子(VAF),這將與靜音或背景噪聲期間的啟動一樣普通?，F(xiàn)在，轉(zhuǎn)到DTX時段或背景噪聲時段期間的啟動。這是在到達(dá)代碼轉(zhuǎn)換器的初始幀序列為跟隨了規(guī)則SID或SID—UPDATE幀的任意數(shù)量的N0-DATA時存在的情況。當(dāng)最初的規(guī)則SID或SID一UPDATE幀到達(dá)代碼轉(zhuǎn)換器時，GSM-EFRCN參考矢量將仍然處于其初始狀態(tài)，導(dǎo)致被代碼轉(zhuǎn)換的SID(例如GSM-EFR或AMR-12.2)將在AMR-12.2的情況下獲得非常低的增益或能量。對于被代碼轉(zhuǎn)換的所有連續(xù)SID幀來說，一直存在相同的情況，直到語音時段已經(jīng)過去，該語音時段對于GSM-EFRCN參考矢量的更新時間足夠長。存在解決這個問題的幾種方法。一種可能是不對任何SID信息進(jìn)行代碼轉(zhuǎn)換，直到已經(jīng)真正更新了CN參考矢量。如果解碼器沒有收到任何SID,那么它在進(jìn)入DTX消音狀態(tài)之前將從先前接收的數(shù)據(jù)中持續(xù)地生成噪聲。在AMR-12.2到GSM-EFR代碼轉(zhuǎn)換的情況下，這種方法在消音出現(xiàn)之前將保持噪聲級別高達(dá)480ms的更長時間。另一方面，這種方法將消音到完全靜音，而錯誤的SID將至少留下非常低的噪聲最低限度(noisefloor)。GSM-EFR到AMR-12.2代碼轉(zhuǎn)換將表現(xiàn)出相似的行為方式。另一種方法是將上面給出的方法與SID代碼轉(zhuǎn)換相結(jié)合。如果初始輸入為NO-DATA或者SID,那么可以為輸入的語音幀等待大約400ms,而不造成任何消音。然后，如果開始對輸入的SID進(jìn)行代碼轉(zhuǎn)換，那么至少避免了背景噪聲的總體消音。然而，確保解碼器真正合成正確的噪聲級別的可靠方式是生成語音幀，直到已經(jīng)更新了解碼器CN參考矢量。通過解碼SID幀或者通過窺視(peek)TF0情況中可用的PCM流，這對于AMR-12.2到GSM-EFR代碼轉(zhuǎn)換是直接的，其在下面將進(jìn)一步詳加討i侖。啟動GSM-EFR到AMR-12.2代碼轉(zhuǎn)換器時，不必使得CN參考矢量能夠解碼GSM-EFRCN數(shù)據(jù)。因此，窺視PCM流是獲得正確的噪聲級別再現(xiàn)的唯一方式。對于TFO(無匯接操作)情況，緩解GSM-EFR解碼器以及GSM-EFR到AMR-12.2轉(zhuǎn)換器的異步啟動問題的一種可能的解決方案是將RXDTX處理機狀態(tài)的子集從GSM-EFR解碼器轉(zhuǎn)移到GSM-EFR到AMR-12.2轉(zhuǎn)換器。在相反方向(AMR-12.2到GSM-EFR)下，類似的轉(zhuǎn)移也是可能的?？梢詫τ捎诘诙€問題(噪聲級別)造成的原始問題(語音能量脈沖串)進(jìn)行觀測。在其中進(jìn)入代碼轉(zhuǎn)換器的初始幀序列為跟隨了語音幀的少量NO-DATA幀的情況下，不可能使用高級的編碼增益調(diào)節(jié)算法，因為代碼轉(zhuǎn)換器不清楚編碼器和解碼器的增益預(yù)測器狀態(tài)。然而，通過假設(shè)最壞的情況并且將AMR預(yù)測器初始化成最大初始值，可以保證被解碼的增益至少低于目標(biāo)增益。對于GSM-EFR到AMR-12.2轉(zhuǎn)換，長靜音間隔的問題可以通過實現(xiàn)熱啟動TFO解決方案來緩解。然后，將從GERAN輸入的數(shù)據(jù)作為GSM-EFR流而傳輸。于是，GSM-EFR到A匪-12.2SID轉(zhuǎn)換器優(yōu)選地可以利用來自GSM-EFR解碼器的輸出TFOPCM數(shù)據(jù)來啟動。熱啟動GSM-EFR到AMR-12.2SID轉(zhuǎn)換器所需的變量的最小集合是參考增益狀態(tài)、合成增益以及GSM-EFR錯誤隱藏中使用的增益。對于完整的熱啟動，也會需要LSF參考矢量變量以及用于參考增益與參考LSF的緩沖器和插值計數(shù)器。對于AMR-12.2到GSM-EFR轉(zhuǎn)換，情況是類似的。這里，將從UTRAN或GERAN輸入的數(shù)據(jù)作為AMR-12.2流而傳輸。對于AMR-12.2SID-UPDATE幀的絕對CN能量量化應(yīng)當(dāng)僅僅使得傳輸指示延遲釋放時段的結(jié)束的變量是必要的。使用SID-UPDATE幀中的能量信息使得設(shè)置EFR狀態(tài)的合理估計成為可能。為了進(jìn)一步改進(jìn)該解決方案，還可以等待第二AMR_SID_UPDATE以提供一定程度上更加安全的能量估計。圖6A為從GSM-EFR到AMR-12.2的代碼轉(zhuǎn)換器6實施例的主要部分的框圖。在輸入端20處接收依照GSM-EFR編碼方案編碼的幀。在輸入控制部分41中對這些幀進(jìn)行分析。將依照GSM-EFR語音編碼方案的所有幀轉(zhuǎn)送到識別器42,以便依照上面深入討論的過程來識別編碼增益中狀態(tài)失配的出現(xiàn)。將語音幀轉(zhuǎn)送到增益調(diào)節(jié)器部分43，其中優(yōu)選地依照上面討論的過程之一來調(diào)節(jié)編碼增益參數(shù)。如果在識別器42中識別出狀態(tài)失配，則執(zhí)行增益調(diào)節(jié)，并且該增益調(diào)節(jié)優(yōu)選地在一個或一些幀期間持續(xù)。將可能帶有被調(diào)節(jié)增益參數(shù)的語音幀提供給輸出控制部分44,從該輸出控制部分44將幀發(fā)送到輸出端30。依照本發(fā)明，可以認(rèn)為這些幀是由AMR-12.2編碼方案編碼的。從而提供了用于將GSM-EFR語音編碼方案的語音幀用作AMR-12.2語音編碼方案的語音幀的裝置45，作為識別器42、增益調(diào)節(jié)器部分43以及輸入控制部分41和輸出控制部分44的至少一部分。如果識別器42利用直接檢測方法，那么該識別器依次包括用于由GSM-EFR語音編碼方案編碼的語音的能量參數(shù)的解碼器；用于利用AMR-12,2語音編碼方案的語音的能量參數(shù)的解碼器；以及連接到這些解碼器的比較器，用于比較這些能量參數(shù)。優(yōu)選地，語音代碼轉(zhuǎn)換器6還包括SID轉(zhuǎn)換器46,該SID轉(zhuǎn)換器46也被設(shè)置成從來自輸入控制部分41的輸入流中接收所有幀。SID轉(zhuǎn)換器46被設(shè)置用于將第一GSM-EFRSID幀轉(zhuǎn)換成AMR-12.2SID—FIRST幀。將最近接收的GSM-EFRSID幀的SID參數(shù)存儲在存儲器48中，并且無論何時要發(fā)送AMRSID_UPDATE幀，則將所述SID參數(shù)用于SID參數(shù)到AMR-12.2SID-UPDATE幀的轉(zhuǎn)換。優(yōu)選地，SID轉(zhuǎn)換器46附加地包括濾波器47，用于對AMRSID-UPDATE幀的能量參數(shù)進(jìn)行濾波；以及量化器。輸出控制部分44從增益調(diào)節(jié)器部分43接收語音幀并且從SID轉(zhuǎn)換器46接收AMR-12.2SID(SID—FIRST、SID_UPDATE)幀。輸出控制部分44還包括定時控制裝置和用于N0_DATA幀的發(fā)生器。圖6B為從AMR-12.2到GSM-EFR的代碼轉(zhuǎn)換器7實施例的主要部分的框圖。在輸入端21處接收依照AMR-12.2編碼方案編碼的幀。代碼轉(zhuǎn)換器7的大多數(shù)部分與圖6A的代碼轉(zhuǎn)換器6中的部分類似，并且不進(jìn)一步進(jìn)行討論。但是，在輸出端31處發(fā)送用于認(rèn)為是依照GSM-EFR而編碼的幀。語音代碼轉(zhuǎn)換器7的SID轉(zhuǎn)換器46被設(shè)置用于將AMR-12.2SID幀轉(zhuǎn)換成GSM-EFRSID幀。AMR-12.2SID—FIRST幀被轉(zhuǎn)換成第一GSM-EFRSID幀。SID轉(zhuǎn)換器46將從AMRSID—UPDATE幀中接收的SID參數(shù)存儲在存儲器48中，該SID轉(zhuǎn)換器也存儲從所接收的AMRSID—FIRST幀中得到的被解碼SID參數(shù)。TAF狀態(tài)機49保留本地TAF狀態(tài)?？刂撇糠?0使用TAF狀態(tài)機49的TAF狀態(tài)來確定何時將從SID轉(zhuǎn)換器46發(fā)送新的GSM-EFRSID幀?？刂撇糠?0啟動從存儲器中取出被存儲的SID參數(shù)到估計器51,其中對諸如能量值和LSF之類的SID參數(shù)進(jìn)行估計。將被估計的SID參數(shù)轉(zhuǎn)送給量化器52,該量化器被設(shè)置成對要包含在新的GSM-EFRSID幀中的最近SID參數(shù)進(jìn)行量化。上述實施例應(yīng)當(dāng)被理解為本發(fā)明的一些說明性實例。本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解，在不脫離本發(fā)明的范圍的情況下可以對這些實施例進(jìn)行各種修改、組合和變化。特別地，可以將不同實施例中的不同部分解決方案組合在技術(shù)上可能的其他結(jié)構(gòu)中。但是，本發(fā)明的范圍是由隨附的權(quán)利要求來限定的。參考文獻(xiàn)美國專利申請2003/0177004美國專利62600093GPP/TS-26.0713GPP/TS-06.5權(quán)利要求1.用于將語音從第一語音編碼方案代碼轉(zhuǎn)換到第二語音編碼方案的方法，所述語音編碼方案使用相似的用于語音幀的核心壓縮方案，該方法包括步驟將所述第一語音編碼方案的語音幀用作(210)所述第二語音編碼方案的語音幀；識別(212)在所述第一語音編碼方案和所述第二語音編碼方案之間能量參數(shù)中的狀態(tài)失配的出現(xiàn)；以及在所述狀態(tài)失配的出現(xiàn)之后調(diào)節(jié)(218)所述能量參數(shù)。2.依照權(quán)利要求1所述的方法，其中所述調(diào)節(jié)步驟(218)包括在所述狀態(tài)失配出現(xiàn)之后在所述第二語音編碼方案的幀的至少一個幀中調(diào)節(jié)所述能量參數(shù)。3.依照權(quán)利要求1或2所述的方法，其中所述第一語音編碼方案和所述第二語音編碼方案的所述核心壓縮方案對于包含編碼的語音的幀來說是比特流兼容的。4.依照權(quán)利要求l、2或3所述的方法，其中所述識別步驟(H2)包括確定(216)預(yù)定語音演變的出現(xiàn)的步驟。5.依照權(quán)利要求4所述的方法，其中所述預(yù)定語音演變是語音類型轉(zhuǎn)變。6.依照權(quán)利要求5所述的方法，其中所述預(yù)定語音演變是在一定時段的語音靜默之后語音的開始。7.依照權(quán)利要求1、2或3所述的方法，其中所述識別步驟(H2)依次包括步驟對由所述第一語音編碼方案編碼的語音的第一能量參數(shù)進(jìn)行解碼；對使用所述第二語音編碼方案的所述語音的第二能量參數(shù)進(jìn)行解碼；以及比較所述第一能量參數(shù)和所述第二能量參數(shù)。8.依照權(quán)利要求1-7中任何一項所述的方法，其中所述調(diào)節(jié)步驟(218)包括將所述能量參數(shù)改變預(yù)定因子的步驟。9.依照權(quán)利要求8所述的方法，其中所述預(yù)定因子是指標(biāo)域中的預(yù)定因子。10.依照權(quán)利要求8所述的方法，其中所述調(diào)節(jié)步驟(218)包括步驟根據(jù)所述第一語音編碼方案編碼的語音的所述第一能量參數(shù)和所述第二語音編碼方案編碼的語音的所述第二能量參數(shù)之間的比較來改變所述能量參數(shù)。11.依照權(quán)利要求1-9中任何一項所述的方法，其中對于所迷狀態(tài)失配出現(xiàn)之后的最初n個子幀執(zhí)行所述調(diào)節(jié)步驟(218)，其中n〉0。12.依照權(quán)利要求10所述的方法，其中對于每個子幀連續(xù)地執(zhí)行所述調(diào)節(jié)步驟(218),直到所述狀態(tài)失配可以忽略不計為止。13.依照權(quán)利要求1-7中任何一項所述的方法，其中所述調(diào)節(jié)步驟(218)包括步驟在所述狀態(tài)失配出現(xiàn)之前的幀期間根據(jù)基于舒適噪聲能量的估計來改變所述能量參數(shù)。14.依照權(quán)利要求1所述的方法，其中所述調(diào)節(jié)步驟(218)包括基于外部能量信息改變所述能量參數(shù)的量化狀態(tài)的步驟。15.依照權(quán)利要求1-14中任何一項所述的方法，包括另外的步驟將所述第一語音編碼方案的靜音描述幀中的靜音描述參數(shù)轉(zhuǎn)換成所述第二語音編碼方案的靜音描述幀中的靜音描述參數(shù)。16.依照權(quán)利要求1-15中任何一項所述的方法，其中所述第一語音編碼方案是GSM-EFR并且所述第二語音編碼方案是AMR-12.2。17.依照權(quán)利要求16所述的方法，其中所述調(diào)節(jié)步驟(218)包括將所述能量參數(shù)指標(biāo)降低因子為2"的步驟，其中n為大于O的整數(shù)。18.依照權(quán)利要求16所述的方法，其中所述調(diào)節(jié)步驟(218)包括將所述能量參數(shù)設(shè)置為Q的步驟，由此抑制所述狀態(tài)失配出現(xiàn)之后的所述第一子幀。19.依照權(quán)利要求16所述的方法，包括步驟將第一GSM-EFR靜音描述幀轉(zhuǎn)換成AMRSID—FIRST幀。20.依照權(quán)利要求19所述的方法，包括另外的步驟無論何時要發(fā)送AMRSID-UPDATE幀，都將最近接收的GSM-EFR^爭音描述幀的靜音描述參數(shù)用作AMRSID_UPDATE幀的靜音描述參數(shù)的基礎(chǔ)。21.依照權(quán)利要求20所述的方法，包括另外的步驟對所述AMRSID—UPDATE幀的能量參數(shù)進(jìn)行濾波。22.依照權(quán)利要求1-15中任何一項所述的方法，其中所述第一語音編碼方案是AMR-12.2并且所述第二語音編碼方案是GSM-EFR。23.依照權(quán)利要求22所述的方法，包括步驟將AMRSID—FIRST幀轉(zhuǎn)換成第一GSM-EFR靜音描述幀。24.依照權(quán)利要求23所述的方法，其中轉(zhuǎn)換步驟依次包括步驟估計用于輸入的AMRSID-FIRST幀的靜音描述符參數(shù)；以及將所述估計的靜音描述符參數(shù)量化成第一GSM-EFR靜音描述。25.依照權(quán)利要求23或24所述的方法，包括另外的步驟存儲從AMRSID—UPDATE幀中接收的靜音描述參數(shù)；j呆留本地TAF狀態(tài)；確定何時將從所述TAF狀態(tài)發(fā)送新的GSM-EFR靜音描述幀；對要包含在所述新的GSM-EFR靜音描述幀中最近的所述被存儲的所接收的靜音描述參數(shù)進(jìn)行量化。26.語音代碼轉(zhuǎn)換器(6;7),其將幀從第一語音編碼方案代碼轉(zhuǎn)換到第二語音編碼方案，所述語音編碼方案使用相似的用于語音幀的核心壓縮方*,該語音代碼轉(zhuǎn)換器包括用于將所述第一語音編碼方案的語音幀用作所述第二語音編碼方案的語音幀的裝置(45);用于識別在所述第一語音編碼方案和所述第二語音編碼方案之間能量參數(shù)中的狀態(tài)失配的出現(xiàn)的裝置(42);以及用于在所述狀態(tài)失配的出現(xiàn)之后調(diào)節(jié)所述能量參數(shù)的裝置(43),其連接到所述用于識別的裝置(42)。27.依照權(quán)利要求26所述的語音代碼轉(zhuǎn)換器，其中所述用于調(diào)節(jié)的裝置(43)被設(shè)置用于在所述狀態(tài)失配出現(xiàn)之后在所述第二語音編碼方案的幀的至少一個幀中調(diào)節(jié)所述能量參數(shù)。28.依照權(quán)利要求26或27所述的語音代碼轉(zhuǎn)換器，其中所述第一語音編碼方案和所述第二語音編碼方案的所述核心壓縮方案對于包含編碼的語音的幀來說是比特流兼容的。29.依照權(quán)利要求26、27或28所述的語音代碼轉(zhuǎn)換器，其中所述用于識別的裝置(42)包括所述用于確定預(yù)定語音演變的出現(xiàn)的裝置。30.依照權(quán)利要求29所述的語音代碼轉(zhuǎn)換器，其中所述預(yù)定語音演變是語音類型轉(zhuǎn)變。31.依照權(quán)利要求30所述的語音代碼轉(zhuǎn)換器，其中所述預(yù)定語音演變是在一定時段的語音靜默之后語音的開始。32.依照權(quán)利要求26、27或28所述的語音代碼轉(zhuǎn)換器，其中所述用于識別的裝置(42)依次包括所述第一語音編碼方案編碼的語音的第一能量參數(shù)的解碼器；使用所述第二語音編碼方案的所述語音的第二能量參數(shù)的解碼器；以及連接到所述第一能量參數(shù)的所述解碼器和所述第二能量參數(shù)的所述解碼器的比較器，其用于比較所述第一能量參數(shù)和所述第二能量參數(shù)。33.依照權(quán)利要求26-32中任何一項所述的語音代碼轉(zhuǎn)換器，其中所述用于調(diào)節(jié)的裝置(43)包括用于將所述能量參數(shù)改變預(yù)定因子的裝置。34.依照權(quán)利要求33所述的語音代碼轉(zhuǎn)換器，其中所述預(yù)定因子是指標(biāo)域中的預(yù)定因子。35.依照權(quán)利要求32所述的語音代碼轉(zhuǎn)換器，其中所述用于調(diào)節(jié)的裝置(43)被設(shè)置用于根據(jù)所述第一語音編碼方案編碼的語音的所述第一能量參數(shù)和所述第二語音編碼方案編碼的語音的所述第二能量參數(shù)之間的比較來改變所述能量參數(shù)。36.依照權(quán)利要求33或34所述的語音代碼轉(zhuǎn)換器，其中所述用于調(diào)節(jié)的裝置(43)^皮設(shè)置成影響所述狀態(tài)失配出現(xiàn)之后的第一子幀。37.依照權(quán)利要求35所述的語音代碼轉(zhuǎn)換器，其中所述用于調(diào)節(jié)的裝置(43)被設(shè)置用于對于每個子幀連續(xù)地進(jìn)行操作，直到所述狀態(tài)失配可以忽略不計為止。38.依照權(quán)利要求26-32中任何一項所述的語音代碼轉(zhuǎn)換器，其中所述用于調(diào)節(jié)的裝置(43)包括用于在所述狀態(tài)失配出現(xiàn)之前的幀期間基于舒適噪聲能量來估計能量參數(shù)的裝置以及用于基于所述估計來改變所述能量參數(shù)的裝置。39.依照權(quán)利要求26-38中任何一項所述的語音代碼轉(zhuǎn)換器，進(jìn)一步包括用于將所述第一語音編碼方案的靜音描述幀中的靜音描述參數(shù)轉(zhuǎn)換成所述第二語音編碼方案的靜音描述幀中的靜音描述參數(shù)的裝置(46)。40.依照權(quán)利要求26-39中任何一項所述的GSM-EFR到AMR-12.2語音代碼轉(zhuǎn)換器(6)。41.依照權(quán)利要求40所述的GSM-EFR到AMR-12.2語音代碼轉(zhuǎn)換器，其中所述用于調(diào)節(jié)的裝置(43)被設(shè)置用于將所述能量參數(shù)指標(biāo)降低因子為2n，其中n為大于0的整數(shù)。42.依照權(quán)利要求40所述的GSM-EFR到AMR-12.2語音代碼轉(zhuǎn)換器，其中所述用于調(diào)節(jié)的裝置(43)被設(shè)置用于將所述能量參數(shù)設(shè)置為0，由此抑制所述狀態(tài)失配出現(xiàn)之后的所述第一子幀。43.依照權(quán)利要求40所述的GSM-EFR到AMR12.2語音代碼轉(zhuǎn)換器，包括用于將第一GSM-EFR靜音描述幀轉(zhuǎn)換成AMRSID-FIRST幀的裝置。44.依照權(quán)利要求43所述的GSM-EFR到AMR12.2語音^(戈碼轉(zhuǎn)換器，進(jìn)一步包括無論何時要發(fā)送AMRSID-UPDATE幀，都將最近接收的GSM-EFR靜音描述幀的靜音描述參數(shù)用作AMRSID—UPDATE幀的靜音描述參數(shù)的基礎(chǔ)的裝置。45.依照權(quán)利要求44所述的GSM-EFR到AMR12.2語音代碼轉(zhuǎn)換器，包括用于所述AMRSID—UPDATE幀的能量參數(shù)的濾波器。46.依照權(quán)利要求26-39中任何一項所述的AMR12.2到GSM-EFR語音代碼轉(zhuǎn)換器(7)。47.依照權(quán)利要求46所述的AMR12.2到GSM-EFR語音代碼轉(zhuǎn)換器，包括用于將AMRSID—FIRST幀轉(zhuǎn)換成第一GSM-EFR靜音描述幀的裝置。48.依照權(quán)利要求47所述的AMR12.2到GSM-EFR語音〗戈碼轉(zhuǎn)換器，其中所述用于轉(zhuǎn)換的裝置被設(shè)置成估計用于到達(dá)的AMRSID-FIRST幀的靜音描述符參數(shù)并且將所述估計的靜音描述符參數(shù)量化成第一GSM-EFR靜音描述。49.依照權(quán)利要求47或48所述的AMR12.2到GSM-EFR語音代碼轉(zhuǎn)換器，進(jìn)一步包括從AMRSID_UPDATE幀中接收的靜音描述參數(shù)的存儲器(48);用于保留本地TAF狀態(tài)的裝置(49);用于確定何時將從所述TAF狀態(tài)發(fā)送新的GSM-EFR靜音描述幀的裝置(50);用于對要包含在所述新的GSM-EFR靜音描述幀中的最近的所述被存儲一皮接收靜音描述參數(shù)進(jìn)行量化的裝置(52)。50.電信系統(tǒng)(1),包括依照權(quán)利要求26-49中任何一項所述的語音代碼轉(zhuǎn)換器(6;7)。全文摘要將第一語音編碼方案的語音幀用作(210)第二語音編碼方案的語音幀，其中所述語音編碼方案使用相似的用于語音幀的核心壓縮方案，其優(yōu)選地是比特流兼容的。優(yōu)選地，通過確定(214)諸如語音類型轉(zhuǎn)變之類的預(yù)定語音演變(例如在一定時段的語音靜默之后語音開始)的出現(xiàn)，或者通過對第一語音編碼方案和第二語音編碼方案之間的能量參數(shù)進(jìn)行試探性解碼并且接著進(jìn)行比較，來識別(216)這兩種語音編碼方案之間的能量參數(shù)中的狀態(tài)失配的出現(xiàn)。隨后，在狀態(tài)失配出現(xiàn)后調(diào)節(jié)(218)第二語音編碼方案的至少一個幀中的能量參數(shù)。本發(fā)明還給出了提供這種代碼轉(zhuǎn)換功能的代碼轉(zhuǎn)換器和通信系統(tǒng)。文檔編號G10L19/00GK101322181SQ200580052199公開日2008年12月10日申請日期2005年11月30日優(yōu)先權(quán)日2005年11月30日發(fā)明者J·斯維德伯格,N·桑德格倫申請人:艾利森電話股份有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：N.桑德格倫;J.斯維德伯格
技術(shù)所有人：艾利森電話股份有限公司
我是此專利的發(fā)明人

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

語音轉(zhuǎn)換成文本相關(guān)技術(shù)

視頻語音轉(zhuǎn)換器相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

有效的語音流轉(zhuǎn)換的制作方法