亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種定速率自適應(yīng)多速率編碼器及編碼方法

文檔序號(hào):2837372閱讀:352來(lái)源:國(guó)知局
專利名稱:一種定速率自適應(yīng)多速率編碼器及編碼方法
技術(shù)領(lǐng)域
本發(fā)明涉及自適應(yīng)多速率編碼器及其編碼方法,具體涉及到自適應(yīng)多速率編碼器在以定 速率方式完成可多速率的編碼時(shí),編碼方和解碼方的一致性問(wèn)題。
背景技術(shù)
碼激勵(lì)線性預(yù)糖編碼器自1985年被提出以來(lái)得到了廣泛的應(yīng)用。在碼分多址(CDMA)和 通用移動(dòng)通信系統(tǒng)(UMTS)的聲碼器中都使用了碼激勵(lì)線性預(yù)瀾編碼器的技術(shù)。
碼激勵(lì)線性預(yù)溯包括了線性預(yù)淵和量化、自適應(yīng)碼書搜索和固定碼書搜索。因?yàn)檎Z(yǔ)音本 身有靜默期,可以通過(guò)降低這些靜默期間的數(shù)據(jù)速率有效壓縮語(yǔ)音數(shù)據(jù)的傳輸速率,高通公 司的申請(qǐng)?zhí)枮?2104618.9的可變速率聲碼器的專利就是關(guān)于上述方法的一個(gè)方案。
在UMTS中使用了自適應(yīng)多速率(AMR)語(yǔ)音編碼,自適應(yīng)多速率(AMR)語(yǔ)音編碼是3GPP (第三代移動(dòng)通信伙伴計(jì)劃)制定的應(yīng)用于第三代移動(dòng)通信中的語(yǔ)音壓縮編碼,自適應(yīng)多速 率(AMR)語(yǔ)音編碼又分為自適應(yīng)多速率窄帶(AMR-NB)語(yǔ)音編碼、自適應(yīng)多速率寬帶(AMR-冊(cè)) 語(yǔ)音編碼和自適應(yīng)多速率寬帶改進(jìn)型(AMR-冊(cè)+)語(yǔ)音編碼,這些編碼方法都基于碼書激勵(lì)線 性線性預(yù)湖技術(shù)。自適應(yīng)多速率(AMR)編解碼方式中采用的碼書激勵(lì)線性預(yù)測(cè)編碼器將一個(gè) 話音信號(hào)幀分成若干個(gè)子幀,進(jìn)行線性預(yù)溯和量化、自適應(yīng)碼書搜索和量化以及固定碼書搜 索和量化。AMR-NB (自適應(yīng)多速率窄帶)語(yǔ)音編碼支持八種速率的編碼速率12.2、 10.2、 7,95、 7.40、 6.70、 5.90、 5.15、 4.75 kb/s (千比特/秒),以及低速率(1.80kb/s)的背 景噪聲編碼速率,3GPP的TS26.071-500的章節(jié)5的表格i (Table 1)給出了上述這些自適 應(yīng)多速率窄帶的速率的對(duì)應(yīng)縮寫AMR—12.20、 AMR—10.20、 AMR—7.95、 AMR_7. 40、 AMR_6.70、 AMR一5.90、 AMR_5.15、 AMR—4.75以及AMR一SID;自適應(yīng)多速率寬帶(AMR-冊(cè))語(yǔ)音編碼也支 持八種速率的編碼速率23.85、 23.05、 19.85、 18.25、 15.85、 14.25、 12.65、 & 85、 6.6kb/s, 以及低速率U. 75kb/s)的背景噪聲編碼速率,、3GPP的TS26.17卜500的章節(jié)5的表格l(Table 1)給出了上述這些自適應(yīng)多速率寬帶的速率的對(duì)應(yīng)縮寫AMR-冊(cè)_23.85、 AMR-冊(cè)—23.05、 AMR-WB—19.85、纖-冊(cè)—18.25、纖-冊(cè)一15.85、 AMR-冊(cè)」4.25、 AMR-WB_12.65、 AMR-冊(cè)一8.85、 AMR-冊(cè)—6.60以及AMR-WB—SID。
線性預(yù)測(cè)和量化包括了將采樣得到的話音信號(hào)幀或經(jīng)過(guò)預(yù)處理的話音信號(hào)幀組成一個(gè) 序列,用一個(gè)窗函數(shù)乘該序列中的聲音樣本,以提供一個(gè)加窗的聲音數(shù)據(jù)幀由所述加窗的 聲音數(shù)據(jù)幀計(jì)算一組自相關(guān)系數(shù);用萊文遜一杜賓(Levinson-Durbin)算法由所述自相關(guān)系 數(shù)組計(jì)算一組線性預(yù)測(cè)系數(shù)將所述線性預(yù)溯系數(shù)組轉(zhuǎn)換到另一個(gè)頻譜域;根據(jù)編碼指令中 的速率量化所述轉(zhuǎn)換到另一個(gè)頻譜域上的系數(shù)組,例如,IO階的一組線頻譜對(duì)(LSP)的值,
或16階的一組聲抗納頻譜對(duì)(ISP)的值,關(guān)于線頻譜對(duì)(LSP),最早在宋和江發(fā)表于國(guó)際 語(yǔ)言語(yǔ)音和信號(hào)處理會(huì)議(ICASSP)' 84中的文章"線頻譜對(duì)(LSP)和語(yǔ)音數(shù)據(jù)壓縮"中有說(shuō) 明,高通公司的申請(qǐng)?zhí)枮?2104618.9的可變速率聲碼器的專利中也有說(shuō)明,在3GPP的TS(技 術(shù)規(guī)范)26090和3GPP2的C. S0014-A中也都有說(shuō)明,關(guān)于聲抗納頻譜對(duì)(ISP),可以在3GPP 的TS261恥的5.2. 3章節(jié)-線性預(yù)淵系數(shù)到聲抗納頻譜對(duì)轉(zhuǎn)換(LP to ISP Conversion)中找 到說(shuō)明。
在碼激勵(lì)線性預(yù)測(cè)編碼過(guò)程中,自適應(yīng)碼書搜索和固定碼書搜索得到的最佳碼書矢量信 號(hào)乘以各自的最佳增益后相加,其和為激勵(lì)信號(hào)。激勵(lì)信號(hào)是編碼過(guò)程中一定要使用的,碼 激勵(lì)線性預(yù)溯編碼是搜索與原始語(yǔ)音之間誤差最小的基于激勵(lì)信號(hào)的合成語(yǔ)音。
自適應(yīng)多速率窄帶(AMR-NB)和自適應(yīng)多速率寬帶(AMR-WB)都包括了自適應(yīng)碼書搜索 的過(guò)程,3GPP的TS26.090對(duì)自適應(yīng)多速率窄帶的自適應(yīng)碼書搜索作了說(shuō)明,例如, TS26.090-310版本的5. 6節(jié);TS26.190對(duì)自適應(yīng)多速率寬帶的自適應(yīng)碼書搜索作了說(shuō)明。自 適應(yīng)碼書搜索包含了基于以前激勵(lì)信號(hào)的閉環(huán)基音(Pitch)搜索和此后的按選定的整數(shù)和分 數(shù)基音延遲進(jìn)行的內(nèi)插以前激勵(lì)信號(hào)得到自適應(yīng)碼書矢量的計(jì)算。
閉環(huán)基音搜索是通過(guò)原始語(yǔ)音和重構(gòu)語(yǔ)音之間的均方加權(quán)誤差的最小化來(lái)完成的,所述 最小化需要從搜索范圍內(nèi)的每個(gè)延時(shí)值所對(duì)應(yīng)的均方加權(quán)誤差中找出最小的均方加權(quán)誤差, 每個(gè)延時(shí)值所對(duì)應(yīng)的均方加權(quán)誤差由自適應(yīng)碼書搜索目標(biāo)信號(hào)(target signal)和加權(quán)合成 濾波器(weighted synthesis filter)對(duì)以前激勵(lì)信號(hào)的響應(yīng)所確定。對(duì)自適應(yīng)多速率窄帶 來(lái)說(shuō),3GPP的TS26.090"310版本中的5.6節(jié)對(duì)此做了說(shuō)明,就是先求解由下面的式(l)表 示的特征項(xiàng)R(k)最大時(shí)的整數(shù)延時(shí)值k得到最佳整數(shù)延遲,
x(n)是目標(biāo)信號(hào),yk是在整數(shù)延時(shí)k處的過(guò)去激勵(lì)信號(hào)的經(jīng)過(guò)濾波的值,在最佳整數(shù)延遲附近 的分?jǐn)?shù)延時(shí)值是通過(guò)內(nèi)插歸一化的特征項(xiàng)ROO得到的,搜索最大的分?jǐn)?shù)延時(shí)值可得到最佳分 數(shù)延遲,存放激勵(lì)信號(hào)值的是激勵(lì)緩沖器(u(n),n-- (143+11),…,39,),其中搜索階段的值 (u(n),n:0,1,…,39,)是線性殘差(LP residual);對(duì)自適應(yīng)多速率寬帶來(lái)說(shuō),3GPP的 TS26.190-510版本中的5.7節(jié)對(duì)此做了說(shuō)明,就是先求解由下面的式(2)表示的特征項(xiàng)Tk 最大時(shí)的整數(shù)延時(shí)值k得到最佳整數(shù)延遲,
在最佳整數(shù)延遲附近的分?jǐn)?shù)延時(shí)值也是通過(guò)內(nèi)插歸一化的特征項(xiàng)Tk得到的,搜索最大的分?jǐn)?shù) 延時(shí)值可得到最佳分?jǐn)?shù)延遲,存放激勵(lì)信號(hào)值的是激勵(lì)緩沖器(u(n), n =-(231+17), "',63,),同樣搜索階段的值(u(n),n-0,1,…,63,)也是線性殘差(LP residual).激勵(lì)緩沖器中的搜索階段之前的激勵(lì)信號(hào)值(u(n),n〈0)是以前的子幀的激勵(lì)信
號(hào)值。每個(gè)子喊的激勵(lì)信號(hào)是當(dāng)前本子幀的自適應(yīng)碼書矢量信號(hào)按量化的自適應(yīng)碼書增益值 放大后的得到信號(hào),同固定碼書矢量信號(hào)按量化的固定碼書增益值放大后的得到信號(hào)進(jìn)行疊 加所得到的信號(hào),關(guān)于這一點(diǎn),可以參見3GPP的TS26.090"310版本的5.9節(jié),其中式(64) 是激勵(lì)信號(hào)值的數(shù)學(xué)表示;也可以參見TS26.190-510版本的5. 10節(jié),其中式(56)是激勵(lì)信 號(hào)值的數(shù)學(xué)表示。
自適應(yīng)多速率窄帶(AMR-NB)和自適應(yīng)多速率寬帶(A服-冊(cè))語(yǔ)音解碼過(guò)程中,對(duì)每一 幀都進(jìn)行LP(線性預(yù)測(cè))濾波器參數(shù)解碼,從而形成用于重構(gòu)每一子幀的語(yǔ)音信號(hào)的每個(gè)子幀 的LP濾波器系數(shù);每個(gè)子幀的激勵(lì)信號(hào)的構(gòu)造方法是將自適應(yīng)碼書矢量信號(hào)按自適應(yīng)碼書 增益值放大后得到的信號(hào),同固定碼書矢量信號(hào)按固定碼書增益值放大后得到的信號(hào)進(jìn)行疊 加,這里的自適應(yīng)碼書增益值和固定碼書矢量信號(hào)是按照解碼得到的自適應(yīng)碼書增益索引和 固定碼書索引從量化表找到的量化值;所述的自適應(yīng)碼書矢量信號(hào)對(duì)于AMR-NB來(lái)說(shuō)是基于包 含上一個(gè)子幀的激勵(lì)信號(hào)的激勵(lì)緩沖器里的過(guò)去連續(xù)的154個(gè)樣本點(diǎn)上的激勵(lì)信號(hào)的合成信 號(hào),所述的自適應(yīng)碼書矢量信號(hào)對(duì)于AMR-冊(cè)來(lái)說(shuō)是基于包含上一個(gè)子幀的激勵(lì)信號(hào)的激勵(lì)緩 沖器里的過(guò)去連續(xù)的248個(gè)樣本點(diǎn)上的激勵(lì)信號(hào)的合成信號(hào),當(dāng)上一子楨的基音延遲小于一 個(gè)子幀的時(shí)間長(zhǎng)度時(shí),僅需要一個(gè)子幀的激勵(lì)信號(hào),即,解碼自適應(yīng)碼書索引得到的的整數(shù) 和分?jǐn)?shù)基音延遲,按所述整數(shù)和分?jǐn)?shù)基音延遲對(duì)上一個(gè)子幀的激勵(lì)信號(hào)進(jìn)行內(nèi)插得到自適應(yīng) 碼書矢量信號(hào)。
自適應(yīng)多速率窄帶(AMR-NB)和自適應(yīng)多速率寬帶(AMR-冊(cè))語(yǔ)音編碼都包括了固定碼 書增益量化的過(guò)程,固定碼書增益量化包括基于以前子幀的量化能量預(yù)測(cè)誤差(quantified prediction error)得到的預(yù)測(cè)增益(或固定碼書預(yù)測(cè)增益),以及固定碼書增益和所述的預(yù) 測(cè)增益(或固定碼書預(yù)測(cè)增益)之間的修正因子的量化。子幀的量化能量預(yù)淵誤差(quantified prediction error)就是所述修正因子的對(duì)數(shù)按固定比例放大后的值。
3GPP的TS26.090對(duì)自適應(yīng)多速率窄帶的固定碼書增益量化作了說(shuō)明,例如, TS26.090~310版本的5.8節(jié)中的式(54)和(56),也就是下面的式(3)和(4)說(shuō)明量化 能量預(yù)測(cè)誤差如何影響預(yù)測(cè)增益的,
刷=1>,辨"-0 (3)<formula>formula see original document page 6</formula>
式(3)是第n個(gè)子幀預(yù)渕能量(predicted energy) f(w)的定義,取值為
的[bl b2 b3 b4]是移動(dòng)平均(MA)預(yù)潲系數(shù),效ifc)就是第k個(gè)子幀的量化能量預(yù)溯誤 差;式(4)是固定碼書預(yù)測(cè)增益(predicted fixed-codebook gain) gV的定義,f是更新 能量(innovation energy)的平均值并且根據(jù)速率的不同取不同的常數(shù)值,例如12.2^/3時(shí)-為36分貝(dB), 是平均更新能量(ra^an innovation energy)。固定碼書增益和固定碼書預(yù) 測(cè)增益之間的修正因子為前者與后者的比值而7526.090-310版本的5.8節(jié)中的式(58)說(shuō) 明能量預(yù)測(cè)誤差R (n)就是20乘上述修正因子的對(duì)數(shù),量化能量預(yù)測(cè)誤差則是20乘量化修 正因子的對(duì)數(shù)。
1526.190對(duì)自適應(yīng)多速率寬帶的固定碼書增益量化作了說(shuō)明,例如,TS26.0190-510版 本的5.9節(jié)。中的式(50)和(52),也就是下面的式(5)和(6)說(shuō)明量化能量預(yù)測(cè)誤差如 何影響預(yù)測(cè)增益的,
<formula>formula see original document page 7</formula>(6)
式(5)是第n個(gè)子幀預(yù)測(cè)能量(predicted energy) f(")的定義,取值為
的[bl b2 b3 b4]是移動(dòng)平均(MA)預(yù)測(cè)系數(shù),浙A:)就是第k個(gè)子幀的量化能量預(yù)測(cè)誤差; 式(6)是預(yù)溯增益(predicted gain) ^的定義,,是取值為30分貝(dB)的更新能量 (innovation energy)的平均值,£i是平均更新能量(mean innovation energy) c固定碼書增 益和預(yù)測(cè)增益之間的修正因子為前者與后者的比值;而TS26.0190~510版本的5.9節(jié)中的式 (53)說(shuō)明能量預(yù)溯誤差R (n)就是20乘上述修正因子的對(duì)數(shù),量化能量預(yù)溯誤差則是20 乘量化修正因子的對(duì)數(shù)。
采樣數(shù)字話音楨經(jīng)預(yù)處理后形成的數(shù)字話音幀經(jīng)過(guò)線性預(yù)溯和量化、自適應(yīng)碼書搜索和 固定碼書搜索后所形成的合成數(shù)字話音幀的共振峰主要由線性預(yù)測(cè)所使用的線性預(yù)測(cè)分析 (LPC)所決定,更確切一點(diǎn),對(duì)AMR-NB來(lái)說(shuō),就是LSP轉(zhuǎn)換為預(yù)測(cè)(LP)系數(shù)后, 一個(gè)10 階線性預(yù)測(cè)合成濾波器(linear prediction synthesis filter)就可以按式(7)確定,其 中的^ G=/,...,附,附-H))是量化了的預(yù)測(cè)(LP)系數(shù);對(duì)AMR-冊(cè)來(lái)說(shuō),就是ISP轉(zhuǎn)換為預(yù) 測(cè)(LP)系數(shù)后, 一個(gè)16階線性預(yù)辦合成濾波器也可以按式(7)確定,其中的咸(,=/,...,/ , 加-16)是量化了的預(yù)測(cè)(LP)系數(shù)。
對(duì)于AMR-NB和AMR-冊(cè)來(lái)說(shuō),將激勵(lì)信號(hào)通過(guò)線性預(yù)滴合成濾波器濾波后的輸出就是合 成數(shù)字話音幀,所以,線性預(yù)湄合成濾波器的極點(diǎn)對(duì)應(yīng)了合成數(shù)字話音幀的共振峰的頻率和 帶寬,這些共振峰反映在時(shí)域上的波形的強(qiáng)度上,對(duì)聽覺(jué)影響很大。

發(fā)明內(nèi)容
要解決的技術(shù)問(wèn)題
按申請(qǐng)?zhí)枮?00410068056.7的專利申請(qǐng)中的第一個(gè)實(shí)施例所給出的信息構(gòu)造一個(gè)如圖1 所示的帶靜音描述(SID)幀自動(dòng)生成選項(xiàng)的自適應(yīng)多速率編碼器的實(shí)現(xiàn)方案,圖1所示的一 個(gè)變速率可雙速率編碼的自適應(yīng)多速率型(AMR-冊(cè))編碼器,具有2個(gè)語(yǔ)音編碼模塊101和 102,數(shù)字話音信號(hào)1 (或經(jīng)預(yù)處理過(guò)的數(shù)字話音信號(hào)1)同時(shí)向帶話音激活檢溯的話音編碼 功能模塊100的語(yǔ)音編碼模塊102和語(yǔ)音編碼模塊101輸出,102輸出的是話音編碼幀12,
101輸出的是話音編碼幀19,帶話音激活檢瀕的話音編碼功能模塊100的不連續(xù)發(fā)送控制和 操作模塊和語(yǔ)音編碼模塊101分別輸出自適應(yīng)多速率(AMR)幀類型信號(hào)11和16,帶話音激 活檢淵的話音編碼功能模塊100的語(yǔ)音編碼模塊102輸出話音編碼幀12,語(yǔ)音編碼模塊101 輸出的是話音編碼楨19,話音編碼楨12和19的每幀比特?cái)?shù)分別取決于編碼速率指示信號(hào)17 和18,編碼速率指示信號(hào)17和18是編碼速率控制模塊將速率命令信號(hào)9中的2個(gè)速率分解 成的1個(gè)速率1路的2路輸出。不連續(xù)發(fā)送控制和操作模塊輸出自適應(yīng)多速率(AMR)幀類型 信號(hào)11到多路語(yǔ)音編碼復(fù)用模塊和語(yǔ)音編碼模塊,自適應(yīng)多速率(AMR)楨類型信號(hào)11指示: 信息比特14是否是有效的自適應(yīng)多速率編碼幀,自適應(yīng)多速率編碼楨的速率,所述自適應(yīng)多 速率編碼楨的速率為活動(dòng)話音幀的速率或靜音描述幀的速率,當(dāng)自適應(yīng)多速率編碼幀的速率 是靜音描述幀時(shí),信息比特14是舒適噪聲發(fā)送模塊輸出的靜音描述(SID)幀13。語(yǔ)音編碼 模塊101輸出自適應(yīng)多速率話音編碼幀19及其自適應(yīng)多速率(AMR)幀類型信號(hào)16,自適應(yīng) 多速率(AMR)幀類型信號(hào)16表示自適應(yīng)多速率話音編碼幀19的速率。多路語(yǔ)音編碼復(fù)用模 塊將來(lái)自不連續(xù)發(fā)送和操作模塊的信息比特14和自適應(yīng)多速率話音編碼幀19合并成話音幀 編碼序列2,合并的方法是當(dāng)自適應(yīng)多速率(AMR)幀類型信號(hào)11指示信息比特14無(wú)效時(shí), 設(shè)置話音幀編碼序列2的速率指示為無(wú)效的話音幀編碼序列;當(dāng)自適應(yīng)多速率(AMR)幀類型 信號(hào)11指示信息比特M是靜音描述楨時(shí),設(shè)置話音幀編碼序列2的速率指示為靜音描述幀, 將信息比特14放到話音楨編碼序列2的話音楨編碼序列里;當(dāng)自適應(yīng)多速率(AMR)幀類型 信號(hào)11指示信息比特14是非靜音描述幀時(shí),把信息比特14和19 一同放到話音幀編碼序列 2的話音幀編碼序列里,同時(shí)設(shè)置話音幀編碼序列2的速率指示為自適應(yīng)多速率(AMR)幀類 型信號(hào)11和16所指示的速率。
可以發(fā)現(xiàn),在上述方案中,執(zhí)行單個(gè)活動(dòng)話音編碼速率(非背景噪聲編碼速率)的編碼任 務(wù)的語(yǔ)音編碼模塊需要獨(dú)立完成線性預(yù)測(cè)分析和量化、開環(huán)基音分析、脈沖響應(yīng)計(jì)算、目標(biāo) 信號(hào)計(jì)算、自適應(yīng)碼書搜索、固定碼書搜索、自適應(yīng)碼書和固定碼書增益的量化和存儲(chǔ)器修 改。
現(xiàn)考察在圖1所示編碼器從初始狀態(tài)啟動(dòng)并且話音激活檢測(cè)對(duì)話音幀的判斷都是活動(dòng)話 音的情況下,單一 23.05kb/s的編碼速率切換為23. 05kb/s和8.85kb/s的雙速率后又回到單 一 23.05kb/s速率。
考慮從單一 23.05kb/s速率到23.05kb/s和8.85kb/s的雙速率這一切換原來(lái)語(yǔ)音編碼 模塊102和101都工作在23. 05kb/s速率,切換到23.05kb/s和8.85kb/s雙速率后,語(yǔ)音編 碼模塊102工作在23.05kb/s速率,語(yǔ)音編碼模塊101工作在8.85kb/s速率。語(yǔ)音編碼模塊 101和語(yǔ)音編碼模塊102具有同樣的激勵(lì)信號(hào)以及其它狀態(tài)值,狀態(tài)值指語(yǔ)音編碼模塊編碼 過(guò)程所使用的不斷變化的變量的值,例如上一楨的ISP參數(shù)、激勵(lì)信號(hào)以及上一幀的量化能 量預(yù)測(cè)誤差等等,因?yàn)閮蓚€(gè)語(yǔ)音編碼模塊此時(shí)的各種狀態(tài)值都是同樣的語(yǔ)音編碼模塊基于同 樣的初始狀態(tài)值以23.05kb/s速率對(duì)切換前的上一個(gè)話音信號(hào)幀編碼所產(chǎn)生的,語(yǔ)音編碼模 塊102和101基于一致的狀態(tài)值進(jìn)行編碼分別產(chǎn)生23.05kb/s和8. 85kb/s的自適應(yīng)多速率寬 帶編碼幀。
再考慮當(dāng)編碼器的幀編碼速率又從23.05kb/s和8.85kb/s的雙速率回單一 23. 05kb/s速 率的切換原來(lái)語(yǔ)音編碼模塊102和101分別工作在23.05kb/s速率和8.85kb/s速率,回到
單速率后,編碼器的語(yǔ)音編碼模塊102和101都工作在23.05kb/s速率下,多路話音編碼復(fù)用 模塊對(duì)于語(yǔ)音編碼模塊102和101輸出的23.05kb/s速率編碼幀只能兩者取其一地放到話音 幀編碼序列2中,這樣,切換回來(lái)后的第一個(gè)話音信號(hào)喊編碼因所述兩者取其一的限制有2 種結(jié)果。這個(gè)兩者取其一的選擇對(duì)譯碼方的影響和信道上傳送的內(nèi)容有關(guān):從單一 23.05kb/s 速率切換為23.05kb/s和8.85kb/s的雙速率后,編碼器產(chǎn)生的包含雙速率幀的話音幀編碼序 列2中被放在信道上傳送的是23.05kb/s速率幀,那么在從23.05kb/s和8.85kb/s的雙速率 切換回23.05kb/s速率后,多路話音編碼復(fù)用模塊選擇語(yǔ)音編碼模塊102的23.05kb/s速率 編碼幀放到話音幀編碼序列2里能使譯碼器收到精確的編碼幀;從單一 23.05kb/s速率切換 為23.05kb/s和8.85kb/s的雙速率后,如果在信道上傳送的是23. 05kb/s和8. 85kb/s的雙 速率話音編碼幀序列2之中的8.85kb/s速率楨,那么在從23.05kb/s和8.85kb/s的雙速率 切換回23.05kb/s速率后,多路話音編碼復(fù)用模塊選擇語(yǔ)音編碼模塊101的23.05kb/s速率 幀放到話音幀編碼序列2里能使譯碼器收到精確的編碼幀。但是多路話音編碼復(fù)用模塊對(duì)2 個(gè)同一速率速率幀無(wú)法區(qū)別,只能隨便選擇,所以,切換回來(lái)后的23.05kb/s速率編碼的兩 者取其一的選擇限制使得接收方有可能與發(fā)送方語(yǔ)音編碼模塊在編碼速率轉(zhuǎn)換上不一致。
不光是從多速率切換到單速率時(shí)有編譯碼雙方使用不完全一致的速率的問(wèn)題,如果編碼 器一直以多速率方式運(yùn)行也有同樣的問(wèn)題,當(dāng)自適應(yīng)多速率寬帶(AMR-冊(cè))編碼器的幀編碼 速率一直是23.05kb/s和8.85kb/s的雙速率并行輸出,如圖1所示的實(shí)現(xiàn)方式的可雙速率編 碼的自適應(yīng)多速率寬帶(AMR-冊(cè))編碼器,語(yǔ)音編碼模塊102為話音信號(hào)幀的23.05kb/s速 率幀編碼,語(yǔ)音編碼模塊IOI為話音信號(hào)幀的8.85kb/s速率幀編碼,當(dāng)話音激活檢測(cè)的結(jié)果 一直是活動(dòng)話音時(shí),編碼器的輸出是包含23.05kb/s和8.85kb/s速率幀的話音幀編碼序列, 相當(dāng)于,語(yǔ)音編碼模塊102和語(yǔ)音編碼模塊101各自沿用原有速率編碼。如果在信道上傳送 的是上一個(gè)話音信號(hào)幀的編碼幀是23.05kb/s速率的,對(duì)于接收方的譯碼器來(lái)說(shuō),23.05kb/s 速率的語(yǔ)音編碼模塊102對(duì)當(dāng)前話音信號(hào)幀的編碼是精確的;但如果中被選到信道上發(fā)給譯 碼方的上一個(gè)話音信號(hào)幀的編碼幀是8.85kb/s速率幀,對(duì)于接收方的譯碼器來(lái)說(shuō),23. 05kb/s 速率的語(yǔ)音編碼模塊102對(duì)當(dāng)前話音信號(hào)幀的編碼是不夠精確的。當(dāng)選到信道上發(fā)給譯碼方 的話音信號(hào)幀的編碼幀的速率不斷變化,對(duì)于接收方的譯碼器來(lái)說(shuō),語(yǔ)音編碼模塊102和101 的編碼都不精確,它也就無(wú)法收到較精確的編碼幀。
綜上所述,采用可變速率多速率方式對(duì)話音信號(hào)幀進(jìn)行自適應(yīng)多速率編碼時(shí),因被放到 信道上的編碼幀的速率變化使譯碼器收到的編碼幀的速率發(fā)生變化會(huì)造成譯碼誤差。當(dāng)這種 譯碼誤差逐幀傳遞時(shí),對(duì)話音聽覺(jué)質(zhì)量影響較大。如果被放到信道上的自適應(yīng)多速率編碼幀 的速率變化非常頻繁,話音質(zhì)量會(huì)嚴(yán)重惡化。
對(duì)于本發(fā)明所致力于的定速率多速率編碼器來(lái)說(shuō),它沒(méi)有SID幀自動(dòng)生成的功能,并且 它將背景噪聲編碼速率的編碼功能和活動(dòng)話音速率的編碼功能合并在一個(gè)模塊中,如圖2所 示的不帶靜默期檢測(cè)選項(xiàng)自適應(yīng)多速率寬帶(AMR-冊(cè))編碼器的實(shí)現(xiàn)方案,以該方案實(shí)現(xiàn)的 自適應(yīng)多速率寬帶(AMR-冊(cè))語(yǔ)音編碼器為考察對(duì)象,可以發(fā)現(xiàn),不僅需要執(zhí)行單速率編碼 任務(wù)的語(yǔ)音編碼模塊獨(dú)立完成線性預(yù)瀏分析和量化、開環(huán)基音分析、脈沖響應(yīng)計(jì)算、目標(biāo)信 號(hào)計(jì)算、自適應(yīng)碼書搜索、固定碼書搜索、自適應(yīng)碼書和固定碼書增益的量化和存儲(chǔ)器修改, 還需要至少有一個(gè)語(yǔ)音編碼模塊能完成靜音描述(SID)楨的整個(gè)編碼過(guò)程。具體到圖2的例子
中, 一個(gè)可雙速率編碼的自適應(yīng)多速率寬帶(AMR-冊(cè))編碼器,具有2個(gè)語(yǔ)音編碼模塊101 和102,具有2個(gè)語(yǔ)音編碼模塊101和102,它們比圖l中的語(yǔ)音編碼模塊多出了編碼靜音描 述(SID)幀的功能,在后面圖3和圖4中的語(yǔ)音編碼模塊也具有編碼靜音描述(SID)幀的功能。 數(shù)字話音信號(hào)1 (或經(jīng)預(yù)處理過(guò)的數(shù)字話音信號(hào)1)同時(shí)向語(yǔ)音編碼模塊102和101輸出,語(yǔ) 音編碼模塊102輸出的是自適應(yīng)多速率寬帶編碼幀12, 101輸出的是自適應(yīng)多速率寬帶編碼 楨19,語(yǔ)音編碼模塊102和101分別輸出自適應(yīng)多速率(AMR)幀類型信號(hào)11和16,自適應(yīng) 多速率(AMR)幀類型信號(hào)11和16分別表示自適應(yīng)多速率寬帶編碼幀12和19的速率,自適 應(yīng)多速率寬帶編碼幀12和19的每幀比特?cái)?shù)分別取決于編碼速率指示信號(hào)17和18,編碼速 率指示信號(hào)17和18是編碼速率控制模塊將速率命令信號(hào)9中的速率分解成的1個(gè)速率1'路 的2路輸出。多路語(yǔ)音編碼復(fù)用模塊將自適應(yīng)多速率寬帶編碼幀12和19合并成話音信號(hào)幀 編碼序列2,合并的方法是:當(dāng)適應(yīng)多速率(A服)幀類型信號(hào)11和16指示的編碼幀速率不 同時(shí),把自適應(yīng)多速率寬帶編碼幀12和19里的信息比特一同放到話音楨編碼序列2的話音幀 編碼序列里,同時(shí)設(shè)置話音幀編碼序列2的速率指示為自適應(yīng)多速率(AMR)喊類型信號(hào)11 和16所指示的速率;當(dāng)U和16指示的編碼幀速率相同時(shí),任選自適應(yīng)多速率寬帶編碼幀 12和19其中之一放到話音幀編碼序列2里,同時(shí)設(shè)置話音楨編碼序列2的速率指示為所述 相同的編碼幀速率。
圖2所示編碼器從初始狀態(tài)啟動(dòng)的單一 23.05kb/s的編碼速率切換為23.05kb/s和靜音 描述(SID)楨的雙速率后又回到單一23.05"/5速率。
考慮從單一 23.05kb/s速率到23.05kb/s和背景噪聲編碼速率(AMR-冊(cè)一SID)的雙速率 這一切換:原來(lái)語(yǔ)音編碼模塊102和101都工作在23.05kb/s速率,切換到23.05kb/s和 AMR-WB—SID雙速率后,語(yǔ)音編碼模塊102工作在23.05kb/s速率,語(yǔ)音編碼模塊101工作在 背景噪聲編碼速率(AMR-冊(cè)—SID)速率;語(yǔ)音編碼模塊101和語(yǔ)音編碼模塊102切換前具有同 樣的激勵(lì)信號(hào)以及其它狀態(tài)值,例如上一幀的ISP參數(shù)、激勵(lì)信號(hào)以及上一幀的量化能量預(yù) 測(cè)誤差等等,因?yàn)閮蓚€(gè)語(yǔ)音編碼模塊此時(shí)的各種狀態(tài)值都是同樣的語(yǔ)音編碼模塊按同樣的初 始狀態(tài)值以23.05kb/s速率對(duì)切換前的同樣的上一個(gè)話音信號(hào)幀編碼所產(chǎn)生的,語(yǔ)音編碼模 塊102和101基于一致的狀態(tài)值進(jìn)行編碼分別產(chǎn)生23.05kb/s和靜音描述(SID)幀的自適應(yīng) 多速率寬帶編碼幀。
再考慮當(dāng)編碼器的幀編碼速率又從23.05"/8和背景噪聲編碼速率(AMR-冊(cè)—SID)的雙 速率回單一背景噪聲編碼速率(AMR-WB一SID)的切換原來(lái)語(yǔ)音編碼模塊102和101分別工 作在23.051^/5速率和背景噪聲編碼速率(AMR-WB_SID),回到單速率后,編碼器的語(yǔ)音編碼 模塊102和101都工作在23.05kb/s速率下,多路話音編碼復(fù)用模塊對(duì)于語(yǔ)音編碼模塊102 和101輸出的23.05kb/s速率編碼幀只能兩者取其一地放到話音幀編碼序列2中,這樣,切 換回來(lái)后的第一個(gè)話音信號(hào)楨編碼因所述兩者取其一的限制有2種結(jié)果。這個(gè)兩者取其一的 選擇對(duì)譯碼方的影響和信道上傳送的內(nèi)容有關(guān):從單一 23.05kb/s速率切換為23.05kb/s和背 景噪聲編碼速率(AMR-WB一SID)的雙速率后,編碼器產(chǎn)生的包含雙速率幀的話音幀編碼序列 2中被放在信道上傳送的是23.05kb/s速率幀,那么在從23.05kb/s和背景噪聲編碼速率 (AMR-WB一SID)的雙速率切換回23.05kb/s速率后,多路話音編碼復(fù)用模塊選擇語(yǔ)音編碼模 塊102的23. 05kb/s速率編碼械放到話音幀編碼序列2里能使譯碼器收到精確的編碼幀;從單一 23.05kb/s速率切換為23.05kb/s和背景噪聲編碼速率(AMR-WB_SID)的雙速率后,如 果在信道上傳送的是23.05kb/s和靜音描述(SID)幀的雙速率話音編碼幀序列2之中的靜音 描述(SID)幀速率幀,那么在從23.05kb/s和背景噪聲編碼速率(AMR-冊(cè)—SID)的雙速率切 換回23.05kb/s速率后,多路話音編碼復(fù)用模塊選擇語(yǔ)音編碼模塊101的23.05kb/s速率幀 放到話音幀編碼序列2里能使譯碼器收到精確的編碼幀。但是多路話音編碼復(fù)用模塊對(duì)2個(gè) 同一速率速率楨無(wú)法區(qū)別,只能隨便選擇,所以,切換回來(lái)后的23.05kb/s速率編碼的兩者 取其一的選擇限制使得接收方有可能與發(fā)送方語(yǔ)音編碼模塊在編碼速率轉(zhuǎn)換上不一致。
不光是從多速率切換到單速率時(shí)有編譯碼雙方使用不完全一致的速率的問(wèn)題,如果編碼 器一直以多速率方式運(yùn)行也有同樣的問(wèn)題,當(dāng)自適應(yīng)多速率寬帶(AMR-WB)編碼器的幀編碼 速率一直是23.05kb/s和背景噪聲編碼速率(AMR-冊(cè)一SID)的雙速率并行輸出,以圖2所示 的實(shí)現(xiàn)方式的可雙速率編碼的自適應(yīng)多速率寬帶(AMR-冊(cè))編碼器,語(yǔ)音編碼模塊102為話 音信號(hào)楨的23. 05kb/s速率幀編碼,語(yǔ)音編碼模塊101為話音信號(hào)幀的背景噪聲編碼速率 (AMR-WB—SID)編碼,編碼器的輸出是包含23.05kb/s和靜音描述(SID)幀速率幀的話音幀 編碼序列,相當(dāng)于,語(yǔ)音編碼模塊102和語(yǔ)音編碼模塊101各自沿用原有速率編碼。如果在 信道上傳送的是上一個(gè)話音信號(hào)幀的編碼幀是23.05kb/s速率的,對(duì)于接收方的譯碼器來(lái)說(shuō), 23.05kb/s速率的語(yǔ)音編碼模塊102對(duì)當(dāng)前話音信號(hào)楨的編碼是精確的;但如果中被選到信 道上發(fā)給譯碼方的上一個(gè)話音信號(hào)幀的編碼幀是靜音描述(SID)幀,對(duì)于接收方的譯碼器來(lái) 說(shuō),23.05kb/s速率的語(yǔ)音編碼模塊102對(duì)當(dāng)前話音信號(hào)幀的編碼是很不精確的。當(dāng)選到信 道上發(fā)給譯碼方的話音信號(hào)幀的編碼楨的速率不斷變化,對(duì)于接收方的譯碼器來(lái)說(shuō),語(yǔ)音編 碼模塊102和101的編碼都不精確,它也就無(wú)法收到精確的編碼幀。
綜上所述,采用定速率多速率方式對(duì)話音信號(hào)幀進(jìn)行自適應(yīng)多速率編碼時(shí),會(huì)同變速率 多速率編碼器一樣會(huì)因被放到信道上的編碼幀的速率變化會(huì)造成譯碼誤差,并且這種速率變 化還涉及到了背景噪聲編碼速率(AMR-冊(cè)一SID),這是因?yàn)樗母鱾€(gè)語(yǔ)音編碼模塊嚴(yán)格按照指 定的編碼速率來(lái)編碼,不象變速率多速率方式的編碼器那樣在VAD檢測(cè)到靜默期時(shí)就將所有 語(yǔ)音編碼模塊的關(guān)鍵狀態(tài)值復(fù)位,使得編譯碼方的所有關(guān)鍵狀態(tài)值回到一致。并且一旦這種 譯碼誤差逐幀傳遞時(shí),對(duì)話音聽覺(jué)質(zhì)量影響較大。
無(wú)論是可變速率還是定速率方式,多速率的自適應(yīng)多速率窄帶(AMR-NB)編碼器或多速 率的自適應(yīng)多速率寬帶(AMR-冊(cè))編碼器都要受被放到信道上給譯碼器的編碼幀的編碼速率 速率變化的影響,相對(duì)于同一話音信號(hào),它的語(yǔ)音編碼模塊的編碼速率與譯碼器所收到的編 碼幀的編碼速率在轉(zhuǎn)換上不一致,本發(fā)明要抑制所述的編碼速率在轉(zhuǎn)換上的不一致對(duì)話音信 號(hào)所造成的損害。
技術(shù)方案
本發(fā)明解決上述問(wèn)題的方法就是:盡管編碼器中的每個(gè)語(yǔ)音編碼模塊的編碼速率的轉(zhuǎn)換 和譯碼器所處理的編碼幀的編碼速率的轉(zhuǎn)換可以不一致,但要保證編碼器中的每個(gè)語(yǔ)音編碼 模塊和譯碼器能參照一致的激勵(lì)信號(hào)。
從背景技術(shù)的介紹可以知道:按整數(shù)和分?jǐn)?shù)基音延遲對(duì)激勵(lì)緩沖器里包含上一子幀的激
勵(lì)信號(hào)進(jìn)行內(nèi)插得到自適應(yīng)碼書矢量信號(hào),該自適應(yīng)碼書矢量信號(hào)再按量化的自適應(yīng)碼書增 益值放大后的得到信號(hào),同固定碼書矢量信號(hào)按量化的固定碼書增益值放大后的得到信號(hào)進(jìn) 行疊加,所得到的信號(hào)就是激勵(lì)信號(hào)。
編碼器中必定有一個(gè)語(yǔ)音編碼模塊為當(dāng)前幀產(chǎn)生的自適應(yīng)多速率編碼幀被譯碼器收到, 該語(yǔ)音編碼模塊在用上一楨的第四子幀及其之前的激勵(lì)信號(hào)中的激勵(lì)信號(hào)合成當(dāng)前幀的激勵(lì)
信號(hào)時(shí)用到的參數(shù)中和譯碼器所用到的一致的有整數(shù)和分?jǐn)?shù)基音延遲、自適應(yīng)碼書矢量的 量化增益、固定碼書矢量和量化的修正因子,因?yàn)樗鼈儽恢苯泳幋a到自適應(yīng)多速率編碼幀中 了,因此只要編碼器的該語(yǔ)音編碼模塊和譯碼器在另一個(gè)參數(shù)-固定碼書矢量的量化增益上也 一致,該語(yǔ)音編碼模塊和譯碼器基于一致的激勵(lì)信號(hào)所合成的激勵(lì)信號(hào)也完全一致,只要編 碼器和譯碼器之間的通信過(guò)程中無(wú)差錯(cuò)發(fā)生,編碼器的語(yǔ)音編碼模塊和譯碼器之間的激勵(lì)信 號(hào)的一致性是逐幀傳遞的。
對(duì)于自適應(yīng)多速率寬帶編碼器有如下的技術(shù)方案,
一種可按多個(gè)編碼速率編碼的定速率自適應(yīng)多速率寬帶(AMR-WB)編碼方法,其特征在于
接收按多個(gè)編碼速率編碼的先前輸入信號(hào)幀的編碼速率的指定指示;
按照所述指定指示的編碼速率從所述指定指示的先前輸入信號(hào)幀的包含第四子幀的 連續(xù)248個(gè)樣本點(diǎn)的多個(gè)速率的激勵(lì)信號(hào)中選出一個(gè)激勵(lì)信號(hào);
按照所述指定指示的編碼速率從所述指定指示的先前輸入信號(hào)幀的多個(gè)速率的量化 能量預(yù)測(cè)誤差中選出一個(gè)速率的四個(gè)子幀的量化能量預(yù)測(cè)誤差;
根據(jù)所述選出的激勵(lì)信號(hào)和量化能量預(yù)溯誤差生成編碼輸出。
對(duì)于自適應(yīng)多速率窄帶(AMR-NB)的編碼器,有如下技術(shù)方案,
一種可按多個(gè)編碼速率編碼的定速率自適應(yīng)多速率窄帶(AMR-NB)編碼方法,其特征在于 接收按多個(gè)編碼速率編碼的先前輸入信號(hào)幀的編碼速率的指定指示;
按照所述指定指示的編碼速率從所述指定指示的先前輸入信號(hào)幀的包含第四子幀的 連續(xù)154個(gè)樣本點(diǎn)的多個(gè)速率的激勵(lì)信號(hào)中選出一個(gè)激勵(lì)信號(hào);
按照所述指定指示的編碼速率從所述指定指示的先前輸入信號(hào)幀的多個(gè)速率的量化 能量預(yù)溯誤差中選出一個(gè)速率的四個(gè)子幀的量化能量預(yù)測(cè)誤差-.
根據(jù)所述選出的激勵(lì)信號(hào)和量化能量預(yù)測(cè)誤差生成編碼輸出。
在啟動(dòng)時(shí)編碼器的所有語(yǔ)音編碼模塊和譯碼器具有一致的初始狀態(tài)值,因此,它們的激 勵(lì)信號(hào)和量化能量預(yù)測(cè)誤差都完全一致。如果在此基礎(chǔ)上編碼器執(zhí)行單速率編碼,編碼器的 所有語(yǔ)音編碼模塊都以該單速率編碼,它們產(chǎn)生同樣的編碼幀具有同樣的狀態(tài)值,和譯碼器 保持一致的激勵(lì)信號(hào)和量化能量預(yù)測(cè)誤差。
自適應(yīng)多速率(AMR)編碼器將整數(shù)和分?jǐn)?shù)基音延遲、自適應(yīng)碼書矢量的量化增益和固定 碼書矢量直接編碼到自適應(yīng)多速率(AMJO編碼幀中,并不直接對(duì)固定碼書增益編碼,而是對(duì) 固定碼書增益和固定碼書預(yù)測(cè)增益(或預(yù)測(cè)增益)之間的修正因子量化編碼,譯碼器譯碼得 到量化的修正因子后還要計(jì)算固定碼書預(yù)測(cè)增益(或預(yù)測(cè)增益)gV,譯碼器將固定碼書預(yù)測(cè) 增益(或預(yù)測(cè)增益)A乘量化的修正因子才得到固定碼書矢量的量化增益。 對(duì)于自適應(yīng)多速率窄帶聲碼器來(lái)說(shuō),在前面式(4)所示的固定碼書預(yù)渕增益g^的計(jì)算 式中只有子楨的預(yù)測(cè)能量(predicted energy) f( )依賴于和前面的子幀的編碼有關(guān)的狀態(tài) 值一量化能量預(yù)淵誤差,更新能量的平均值,的取值只和當(dāng)前的編碼速率有關(guān),平均更新能 量?jī)H和固定碼書矢量有關(guān),關(guān)于這一點(diǎn),在TS26.090"310版本的5.8節(jié)中的式(55)給 出了說(shuō)明。
對(duì)于自適應(yīng)多速率寬帶聲碼器來(lái)說(shuō),在前面式(6)所示的預(yù)測(cè)增益A的計(jì)算式中的相 關(guān)變量,只有子幀的預(yù)溯能量(predicted energy) f")依賴于和前面的子幀的編碼有關(guān)的 狀態(tài)值一量化能量預(yù)測(cè)誤差,更新能量的平均值£的取值不變,平均更新能量五'僅和固定碼 書矢量有關(guān),36 的1526.190~510版本的5.9節(jié)中的式(51)給出了說(shuō)明。
自適應(yīng)多速率窄帶譯碼器對(duì)語(yǔ)音編碼模塊產(chǎn)生的編碼幀譯碼,因?yàn)獒槍?duì)同一個(gè)編碼幀, 所以譯碼器和該語(yǔ)音編碼模塊雙方的更新能量的平均值Z和平均更新能量五/完全一致,如果 使用同樣的上一楨的四個(gè)子幀的量化能量預(yù)淵誤差來(lái)計(jì)算子幀的預(yù)溯能量^( ),雙方的固 定碼書預(yù)測(cè)增益A完全一致。
同樣,自適應(yīng)多速率寬帶譯碼器對(duì)語(yǔ)音編碼模塊產(chǎn)生的編碼楨譯碼,因?yàn)獒槍?duì)同一個(gè)編 碼幀,所以譯碼器和該語(yǔ)音編碼模塊雙方的更新能量的平均值J和平均更新能量五i完全一 致,如果使用同樣的上一幀的四個(gè)子楨的量化能量預(yù)溯誤差,雙方的預(yù)溯增益A完全一致。
當(dāng)編碼器第一次以多編碼速率的方式編碼話音信號(hào)幀時(shí),編碼器中的每個(gè)語(yǔ)音編碼模塊 能參照和譯碼器一致的激勵(lì)信號(hào)和量化能量預(yù)瀕誤差,并且,編碼器中總有一個(gè)語(yǔ)音編碼模 塊產(chǎn)生的編碼幀要被譯碼器收到,譯碼器從收到的編碼幀中直接得到和該語(yǔ)音編碼模塊一致 的基音延遲、 一致的自適應(yīng)碼書量化增益、 一致的固定碼書矢量和一致的量化修正因子,將 固定碼書預(yù)測(cè)增益(或預(yù)測(cè)增益)g^乘一致的量化的修正因子得到量化固定碼書增益;因?yàn)?譯碼器和該語(yǔ)音編碼模塊參照一致的量化能量預(yù)測(cè)誤差且針對(duì)同樣的編碼幀,它們的預(yù)測(cè)增 益(或固定碼書預(yù)溯增益)gV完全一致,所以它們的量化固定碼書增益也完全一致;譯碼器 根據(jù)一致的上一幀子幀的激勵(lì)信號(hào)和基音延遲合成一致的自適應(yīng)碼書矢量,并將自適應(yīng)碼書 矢量和固定碼書矢量乘以各自的量化增益后相加的和作為新的子幀的激勵(lì)信號(hào),新的子幀的 激勵(lì)信號(hào)和該語(yǔ)音編碼模塊的激勵(lì)信號(hào)完全一致;編碼器在接收到指定指示前無(wú)法確定和譯 碼器的新的子幀的激勵(lì)信號(hào)有一致關(guān)系的語(yǔ)音編碼模塊,但不影響它執(zhí)行線性預(yù)測(cè)與分析和 量化等這些不需要激勵(lì)信號(hào)的編碼操作;當(dāng)編碼器得到它第一次多速率編碼的話音信號(hào)幀的 指定指示后,和譯碼器的新的子幀的激勵(lì)信號(hào)取得一致的語(yǔ)音編碼模塊被確定,所有其他語(yǔ)
音編碼模塊都參照該語(yǔ)音編碼模塊的子幀的激勵(lì)信號(hào)。這一過(guò)程不斷重復(fù),所以,編碼器在 使用和譯碼器一致的上一幀子幀的激勵(lì)信號(hào)的條件下能合成新的一致的下一幀子幀的激勵(lì)信
號(hào),激勵(lì)信號(hào)的一致性也會(huì)逐幀傳遞,激勵(lì)信號(hào)的一致性也能得到較長(zhǎng)時(shí)間的保持。
編碼話音信號(hào)幀時(shí)應(yīng)能使用編碼上一幀最后一個(gè)子楨時(shí)產(chǎn)生的對(duì)所有激勵(lì)緩沖器里的激 勵(lì)信號(hào)的更新,即,圖1中的語(yǔ)音編碼模塊101和102應(yīng)該能使用對(duì)方的激勵(lì)緩沖器里的激 勵(lì)信號(hào),使得編碼話音信號(hào)幀時(shí)所用到的上一幀最后一個(gè)子幀的it勵(lì)信號(hào)可自由選擇,這和 當(dāng)前單速率編碼器中語(yǔ)音編碼模塊只使用自身編碼上一話音信號(hào)幀時(shí)產(chǎn)生的最后一個(gè)子幀的
一個(gè)激勵(lì)信號(hào)有極大的區(qū)別,這是因?yàn)?,?duì)于編碼在信道上傳送的上一個(gè)自適應(yīng)多速率(AMR) 幀的過(guò)程中產(chǎn)生的存放在激勵(lì)緩沖器里的激勵(lì)信號(hào)來(lái)說(shuō),存放它的激勵(lì)緩沖器可以屬于編碼
器中的任何一個(gè)語(yǔ)音編碼模塊。
以前面要解決的技術(shù)問(wèn)題中的以圖1所示的從單一 23.05kb/s速率切換為23. 05kb/s和 8.85kb/s的雙速率后再切換到23.05kb/s速率時(shí)的編譯碼雙方的處理過(guò)程為例,自適應(yīng)多速 率寬帶(AMR-冊(cè))編碼器的23.05kb/s和8.85kb/s的雙速率編碼產(chǎn)生的放在激勵(lì)緩沖器中的 激勵(lì)信號(hào)有2種,對(duì)以23.05化/3單速率編碼下一個(gè)話音信號(hào)幀來(lái)說(shuō),這2種激勵(lì)信號(hào)均可 使用,由前文可知在該單速率編碼輸出之前有一個(gè)兩者取其一的限制,如果在再切換到 23.05kb/s速率后的自適應(yīng)碼書搜索之前,編碼器接收到23.05kb/s和8.85kb/s的雙速率編 碼輸出中的8.85kb/s速率幀被放到信道上傳送的信息(指定指示),上述2種激勵(lì)信號(hào)中語(yǔ) 音編碼模塊101按8.85kb/s速率編碼所產(chǎn)生的激勵(lì)信號(hào)和量化能量預(yù)測(cè)誤差就被選出,作為 有效激勵(lì)信號(hào)和有效量化能量預(yù)測(cè)誤差,有效激勵(lì)信號(hào)和有效量化能量預(yù)測(cè)誤差就是接收方 譯碼所使用的激勵(lì)信號(hào)和量化能量預(yù)測(cè)誤差,語(yǔ)音編碼模塊102和101都基于該8.85kb/s速 率的激勵(lì)信號(hào)的量化能量預(yù)瀏誤差執(zhí)行23.05kb/s速率編碼,對(duì)于譯碼器來(lái)說(shuō),102和101 輸出的編碼幀都是基于同樣的激勵(lì)信號(hào)和量化能量預(yù)測(cè)誤差,因而多路話音編碼復(fù)用模塊取 102和101輸出的編碼幀中任何一個(gè)都可以。
按照上述技術(shù)方案,可多速率編碼的自適應(yīng)多速率編碼器的因被放到信道上的編碼楨的 速率變化對(duì)譯碼器造成的誤差減少了 ,這是因?yàn)?編碼器中所有的語(yǔ)音編碼模塊都可以參照和 譯碼器一致的上一幀的子幀的激勵(lì)信號(hào);譯碼器按一致的量化能量預(yù)測(cè)誤差和收到的自適應(yīng) 多速率編碼幀中給出的參數(shù)合成激勵(lì)信號(hào),譯碼器所收到的自適應(yīng)多速率編碼幀是編碼器中 的某個(gè)語(yǔ)音編碼模塊發(fā)出的,該語(yǔ)音編碼模塊合成激勵(lì)信號(hào)所用的參數(shù)就有它編碼到譯碼器 所收到的自適應(yīng)多速率編碼幀里的參數(shù),所以,譯碼器合成的激勵(lì)信號(hào)與該語(yǔ)音編碼模塊生 成的激勵(lì)信號(hào)還是一致的。
值得指出的是上述這些方案并不僅僅適用于編碼命令中的多個(gè)速率都是非背景噪聲編碼 速率的情形,對(duì)于編碼命令中的多個(gè)速率包括背景噪聲編碼速率的情形同樣適用,靜音描述 (SID)幀中不包括基音延遲、自適應(yīng)碼書增益、固定碼書矢量和修正因子這些參數(shù),但執(zhí)行靜 音描述(SID)楨編碼的語(yǔ)音編碼模塊和對(duì)靜音描述(SID)幀譯碼的譯碼器都將各自的激勵(lì)信號(hào) 和量化能量預(yù)測(cè)誤差復(fù)位成初始值。所以,盡管靜音描述(SID)楨編碼不需要上一幀的激勵(lì)信 號(hào)和量化能量預(yù)測(cè)誤差,但對(duì)靜音描述(SID)幀的下一活動(dòng)話音幀的編碼需要該活動(dòng)話音幀的 上一幀的激勵(lì)信號(hào)和量化能量預(yù)測(cè)誤差。
當(dāng)背景噪聲編碼速率和活動(dòng)話音編碼速率的雙速率編碼完成后,下一個(gè)幀編碼是使用因 靜音描述(SID)幀編碼而被復(fù)位的激勵(lì)信號(hào)和量化能量預(yù)測(cè)誤差還是使用因活動(dòng)話音編碼速 率編碼而產(chǎn)生的激勵(lì)信號(hào)和量化能量預(yù)溯誤差同樣由指定指示決定,因?yàn)橐员尘霸肼暰幋a速 率和活動(dòng)話音編碼速率這樣的雙速率方式編碼的先前話音信號(hào)幀的指定指示會(huì)給出信道上傳 送的該話音信號(hào)幀的編碼楨的編碼速率,該編碼速率就是下一個(gè)幀編碼所基于的激勵(lì)信號(hào)和 量化能量預(yù)獮誤差的速率,在本文中,激勵(lì)信號(hào)的速率是指對(duì)話音信號(hào)幀編碼產(chǎn)生該激勵(lì)信 號(hào)時(shí)所按照的編碼速率,量化能量預(yù)測(cè)誤差的速率是指對(duì)話音信號(hào)幀編碼產(chǎn)生該量化能量預(yù) 溯誤差時(shí)所按照的編碼速率。
以前面要解決的技術(shù)問(wèn)題中的以圖1所示的從單一 23. 05kb/s速率切換為23.05kb/s和 AMR-WB—SID的雙速率后再切換到23.05kb/s速率時(shí)的編譯碼雙方的處理過(guò)程為例,自適應(yīng)多
速率寬帶(AMR-WB)編碼器的23.05kb/s和AMR-冊(cè)一SID的雙速率編碼產(chǎn)生的放在激勵(lì)緩沖器 中的激勵(lì)信號(hào)有2種,對(duì)以23.05kb/s單速率編碼下一個(gè)話音信號(hào)幀來(lái)說(shuō),這2種激勵(lì)信號(hào) 均可使用,由前文可知在該單速率編碼輸出之前有一個(gè)兩者取其一的限制,如果在再切換到 23.05kb/s速率后的自適應(yīng)碼書搜索之前,編碼器接收到23.05kb/s和AMR-冊(cè)—SID的雙速率 編碼輸出中的SID幀被放到信道上傳送的信息(指定指示),上述2種激勵(lì)信號(hào)中語(yǔ)音編碼模 塊101按AMR-冊(cè)一SID速率編碼所產(chǎn)生的復(fù)位后的激勵(lì)信號(hào)和量化能量預(yù)測(cè)誤差就被選出,作 為有效激勵(lì)信號(hào)和有效量化能量預(yù)測(cè)誤差,有效激勵(lì)信號(hào)和有效量化能量預(yù)溯誤差就是接收 方譯碼所使用的激勵(lì)信號(hào)和量化能量預(yù)測(cè)誤差,語(yǔ)音編碼模塊102和101都基于該AMR-冊(cè)一SID 速率的激勵(lì)信號(hào)的量化能量預(yù)測(cè)誤差執(zhí)行23.051^/5速率編碼,對(duì)于譯碼器來(lái)說(shuō),102和101 輸出的編碼楨都是基于同樣的激勵(lì)信號(hào)和量化能量預(yù)測(cè)誤差,因而多路話音編碼復(fù)用模塊取 102和101輸出的編碼幀中任何一個(gè)都可以(因?yàn)樽g碼器也使用一致的關(guān)鍵狀態(tài)值復(fù)位后的 激勵(lì)信號(hào)和量化能量預(yù)測(cè)誤差)。
由于本發(fā)明是非可變速率的編碼速率固定的編碼器方案,話音信號(hào)幀的SID幀自動(dòng)生成 不在編碼器中實(shí)現(xiàn),因此編碼器不會(huì)象可變速率編碼器一樣自動(dòng)產(chǎn)生靜音描述(SID)幀,只有 當(dāng)編碼命令中的編碼速率是背景噪聲編碼速率時(shí)編碼器才會(huì)輸出靜音描述(SID)楨。
當(dāng)編碼命令中同時(shí)包含背景噪聲編碼速率和其它編碼速率時(shí),輸出到無(wú)線接入部分的編 碼包含了活動(dòng)話音編碼幀和背景噪聲編碼幀(靜音描述(SID)楨),無(wú)線接入部分可以根據(jù)非 背景噪聲編碼速率的編碼信號(hào)幀的譯碼后的合成聲音信號(hào)幀決定采用哪個(gè)編碼速率的編碼 幀,這樣的做法對(duì)話音質(zhì)量的影響最小。因此,可以將按非背景噪聲編碼速率進(jìn)行編碼所需要 的線性預(yù)溯和量化、自適應(yīng)碼書搜索和固定碼書搜索所得到的激勵(lì)信號(hào)通過(guò)線性預(yù)測(cè)所確定 的線性預(yù)測(cè)合成濾波器所產(chǎn)生的合成數(shù)字聲音信號(hào)對(duì)外輸出。
在自適應(yīng)多速率寬帶編碼器的技術(shù)方案中增加以下的內(nèi)容
在所述多個(gè)編碼速率中包含背景噪聲編碼速率時(shí)輸出非背景噪聲編碼速率的合成數(shù)字聲 音幀。
在自適應(yīng)多速率窄帶編碼器的技術(shù)方案中增加以下的內(nèi)容
在所述多個(gè)編碼速率中包含背景噪聲編碼速率時(shí)輸出非背景噪聲編碼速率的合成數(shù)字聲 音幀。
本發(fā)明的關(guān)于包含背景噪聲編碼速率的多速率編碼的裝置的技術(shù)方案如下,對(duì)于自適應(yīng) 多速率寬帶型(AMR-冊(cè))和自適應(yīng)多速率窄帶(AMR-NB)技術(shù)的編碼器有如下的技術(shù)方案
一種按背景噪聲編碼速率和非背景噪聲編碼速率編碼的定速率自適應(yīng)多速率寬帶 (AMR-冊(cè))編碼器,其特征在于,它包括接收按兩個(gè)編碼速率編碼的先前輸入信號(hào)幀的編碼 速率的指定指示的裝置;
按所述的兩個(gè)編碼速率中的非背景噪聲編碼速率對(duì)當(dāng)前輸入信號(hào)幀進(jìn)行線性預(yù)測(cè)、 自適應(yīng)碼書搜索和固定碼書搜索從而生成合成數(shù)字聲音信號(hào)楨的裝置;
按照所述指定指示的編碼速率從所述指定指示的先前輸入信號(hào)幀的第四子幀及其之 前的兩^Ht率的激勵(lì)信號(hào)中選出一個(gè)激勵(lì)信號(hào)的裝置;
按照所述指定指示的編碼速率從所述指定指示的先前輸入信號(hào)幀的兩個(gè)速率的量化
能量預(yù)測(cè)誤差中選出一個(gè)速率的四個(gè)子幀的量化能量預(yù)淵誤差的裝置,在這里需要指出
當(dāng)AMR-冊(cè)—SID幀編碼完成后其四個(gè)子楨的量化能量預(yù)灑誤差和編碼前的完全相同;
根據(jù)所述選出的激勵(lì)信號(hào)和選出的量化能量預(yù)渕誤差生成編碼輸出的裝置。
一種按背景噪聲編碼速率和非背景噪聲編碼速率編碼的定速率自適應(yīng)多速率窄帶 (AMR-NB)編碼器,其特征在于,它包括接收按兩個(gè)編碼速率編碼的先前輸入信號(hào)幀的編碼 速率的指定指示的裝置;
按所述的兩個(gè)編碼速率中的非背景噪聲編碼速率對(duì)當(dāng)前輸入信號(hào)幀進(jìn)行線性預(yù)測(cè)、 自適應(yīng)碼書搜索和固定碼書搜索從而生成合成數(shù)字聲音信號(hào)幀的裝置;
按照所述指定指示的編碼速率從所述指定指示的先前輸入信號(hào)幀的第四子幀及其之 前的兩個(gè)速率的激勵(lì)信號(hào)中選出一個(gè)激勵(lì)信號(hào)的裝置
按照所述指定指示的編碼速率從所述指定指示的先前輸入信號(hào)幀的兩個(gè)速率的量化 能量預(yù)溯誤差中選出一個(gè)速率的四個(gè)子幀的量化能量預(yù)測(cè)誤差的裝置;
根據(jù)所述選出的激勵(lì)信號(hào)和選出的量化能量預(yù)賴誤差生成編碼輸出的裝置。 有益效果
本發(fā)明使得可多速率編碼的自適應(yīng)多速率編碼器可以用其多個(gè)語(yǔ)音編碼模塊分別對(duì)上一 話音信號(hào)幀編碼時(shí)產(chǎn)生的激勵(lì)信號(hào)中的任何一個(gè)激勵(lì)信號(hào)和任何一個(gè)速率的量化能量預(yù)測(cè)誤 差為當(dāng)前幀進(jìn)行自適應(yīng)多速率編碼,并且一旦通過(guò)指定指示接收到該上一楨多速率編碼輸出 序列中被放在信道上傳送給譯碼器的自適應(yīng)多速率編碼幀的速率,就立即將為該速率編碼所 產(chǎn)生的激勵(lì)信號(hào)作為有效激勵(lì)信號(hào),立即為將該速率編碼所產(chǎn)生的量化能量預(yù)溯誤差作為有 效量化能量預(yù)溯誤差。這樣,接收方譯碼器與編碼器中的一個(gè)語(yǔ)音編碼模塊,分別參照一致 的上一幀子幀的有效激勵(lì)信號(hào)和有效量化能量預(yù)測(cè)誤差, 一方使用信道上的收到的編碼幀中 的參數(shù),另一方使用自己編碼到該編碼楨中去的參數(shù),分別生成各自子幀的激勵(lì)信號(hào)和合成 語(yǔ)音,所以接收方譯碼器合成的的激勵(lì)信號(hào)與所述語(yǔ)音編碼模塊合成的激勵(lì)信號(hào)完全一致。 基于一致的激勵(lì)信號(hào)的譯碼器譯碼產(chǎn)生的合成語(yǔ)音能較好地還原原始聲音。本發(fā)明使得編碼 器能使用和譯碼器完全一致的激勵(lì)信號(hào),從而最大程度地消除了因被放到信道上的編碼幀的 編碼速率變化造成的譯碼誤差的影響。本發(fā)明還使得定速率編碼器可以在靜默期使用靜音描 述(SID)楨來(lái)抑制譯碼誤差的逐幀傳遞,這對(duì)于不使用靜音描述楨自動(dòng)生成的編碼器非常重 要。


圖l是變速率的可皿率編碼的自適應(yīng)多速率寬帶(AMR-冊(cè))編碼器的原理框圖。 圖2是定速率可雙速率編碼的自適應(yīng)多速率寬帶(AMR-冊(cè))編碼器的原理框圖。
圖3是帶有指定指示接收接口的可雙速率編碼的定速率自適應(yīng)多速率編碼器的原理框 圖,適用于寬帶(AMR-冊(cè))編碼器和窄帶(AMR-NB)編碼器》圖4是的帶話音靜默期檢測(cè)的可雙速率編碼的定速率自適應(yīng)多速率寬帶(AMR-冊(cè))編碼器 的原理框圖,它也適用于窄帶(AMR-NB)編碼器。
具體實(shí)施例方式
實(shí)施例l, 一個(gè)可雙速率編碼的自適應(yīng)多速率寬帶(AMR-冊(cè))編碼器,如圖3所示,帶幀 序號(hào)的話音信號(hào)幀1同時(shí)向語(yǔ)音編碼模塊102的模式1編碼模塊和語(yǔ)音編碼模塊101的模式 2編碼模塊輸出,模式l編碼模塊將自適應(yīng)多速率(AMR)編碼楨12和自適應(yīng)多速率(AMR) 幀類型信號(hào)11 一同發(fā)送到多路話音編碼復(fù)用模塊,并將自適應(yīng)多速率(AMR)幀類型信號(hào)11 單獨(dú)發(fā)送給激勵(lì)及能量誤差指示模塊;模式2編碼模塊將自適應(yīng)多速率(AMR)編碼楨19和 自適應(yīng)多速率(AMR)楨類型信號(hào)16 —同發(fā)送到多路話音編碼復(fù)用模塊,并將自適應(yīng)多速率 (A鵬)楨類型信號(hào)16單獨(dú)發(fā)送給激勵(lì)及能量誤差指示模塊。自適應(yīng)多速率(AMR)幀類型信 號(hào)11指示自適應(yīng)多速率編碼楨12的速率和幀序號(hào),自適應(yīng)多速率(AMR)幀類型信號(hào)16指 示自適應(yīng)多速率編碼楨19的速率和幀序號(hào),自適應(yīng)多速率編碼幀12和19的速率分別取決于 編碼速率指示信號(hào)17和18,編碼速率指示信號(hào)17和18是編碼速率控制模塊將編碼速率命 令信號(hào)9中的速率分解成的1個(gè)速率1路的發(fā)送到語(yǔ)音編碼模塊的2路輸出信號(hào)。多路語(yǔ)音 編碼復(fù)用模塊將幀序號(hào)相同的自適應(yīng)多速率話音編碼幀12和19合并成包含幀序號(hào)、速率指 示和信息比特的話音幀編碼序列2,合并的方法是:設(shè)置話音幀編碼序列2的楨序號(hào)為自適應(yīng) 多速率(AMR)幀類型信號(hào)11和16中的相同的幀序號(hào),并且,當(dāng)自適應(yīng)多速率(AMR)幀類 型信號(hào)11和16表示的速率不相同時(shí),把自適應(yīng)多速率編碼幀12和19 一同放到話音幀編碼 序列2的信息比特里,同時(shí)將自適應(yīng)多速率(AMR)幀類型信號(hào)11和16的速率一起放到話音 幀編碼序列2的速率指示中;當(dāng)自適應(yīng)多速率(AMR)幀類型信號(hào)11和16表示的速率相同時(shí), 任選自適應(yīng)多速率編碼幀12和19中的一個(gè)放到話音幀編碼序列2的信息比特里,同時(shí)設(shè)置 話音幀編碼序列2的速率指示為所述相同的速率。模式1編碼模塊和模式2編碼模塊分別輸 出激勵(lì)信號(hào)31和34到各自所屬的語(yǔ)音編碼模塊的激勵(lì)緩沖器里,語(yǔ)音編碼模塊102的激勵(lì) 緩沖器向語(yǔ)音編碼模塊102中的模式1編碼模塊和語(yǔ)音編碼模塊101中的模式2編碼模塊提 供激勵(lì)信號(hào)33。語(yǔ)音編碼模塊101的激勵(lì)緩沖器向語(yǔ)音編碼模塊101中的模式2編碼模塊和 語(yǔ)音編碼模塊102中的模式1編碼模塊提供激勵(lì)信號(hào)35。語(yǔ)音編碼模塊102的模式1編碼模 塊輸出量化能量預(yù)測(cè)誤差30到語(yǔ)音編碼模塊102的量化能量預(yù)測(cè)誤差緩存器,語(yǔ)音編碼模塊 101的模式2編碼模塊輸出量化能量預(yù)溯誤差36到語(yǔ)音編碼模塊101的量化能量預(yù)測(cè)誤差緩 存器,語(yǔ)音編碼模塊102的的量化能量預(yù)溯誤差緩存器向語(yǔ)音編碼模塊102的模式1編碼模 塊和語(yǔ)音編碼模塊101的模式2編碼模塊提供量化能量預(yù)測(cè)誤差32。語(yǔ)音編碼模塊101的量 化能量預(yù)測(cè)誤差緩存器向語(yǔ)音編碼模塊101的模式2編碼模塊和語(yǔ)音編碼模塊102的模式1 編碼模塊提供量化能量預(yù)測(cè)誤差37,激勵(lì)及能量誤差指示模塊接收先前輸入信號(hào)幀的編碼速 率的指定指示信號(hào)20,先前輸入信號(hào)幀的編碼速率的指定指示信號(hào)20包含了幀序號(hào)和速率, 激勵(lì)及能量誤差指示模塊用指示信號(hào)20中的幀序號(hào)和速率同以前收到的自適應(yīng)多速率(AMR) 幀類型信號(hào)11和16中的幀序號(hào)和速率比較,當(dāng)指示信號(hào)20中的幀序號(hào)和速率同以前收到的 自適應(yīng)多速率(A瓶)幀類型信號(hào)11中的相同時(shí),發(fā)出激勵(lì)及能量誤差選擇指令21和22,
分別指示語(yǔ)音編碼模塊102中的模式1編碼模塊和語(yǔ)音編碼模塊101中的模式2編碼模塊應(yīng) 基于語(yǔ)音編碼模塊102中的激勵(lì)緩沖器中的激勵(lì)信號(hào)和量化能量預(yù)測(cè)誤差緩存器中的量化能 量預(yù)測(cè)誤差值編碼;當(dāng)指示信號(hào)20中的幀序號(hào)和速率同以前收到的自適應(yīng)多速率(AMR)幀 類型信號(hào)16中的相同時(shí),發(fā)出激勵(lì)及能量誤差選擇指令21和22分別到語(yǔ)音編碼模塊102和 101,分別指示語(yǔ)音編碼模塊102中的模式1編碼模塊和語(yǔ)音編碼模塊101中的模式2編碼模 塊應(yīng)基于語(yǔ)音編碼模塊101中的激勵(lì)緩沖器中的激勵(lì)信號(hào)和量化能量預(yù)測(cè)誤差緩存器中的量 化能量預(yù)測(cè)誤差值編碼。
圖3所示的編碼器從初始狀態(tài)開始編碼,第一個(gè)話音信號(hào)幀以23.05kb/s速率編碼,第 二個(gè)話音信號(hào)幀及以后的幀都是以23.05kb/s和8.85kb/s的雙速率編碼。對(duì)于第二個(gè)話音信 號(hào)幀的編碼輸出——包含23.05kb/s和8.85kb/s兩種速率編碼幀的編碼序列來(lái)說(shuō),只有 8.85kb/s速率的編碼幀被發(fā)送到信道上;對(duì)于第三個(gè)及其之后的話音信號(hào)幀的編碼輸出—— 同樣包含23.05kb/s和8.85kb/s兩種速率編碼幀的編碼序列來(lái)說(shuō),23.05kb/s速率的編碼幀 被發(fā)送到信道上。在本實(shí)施例中,使用話音幀編碼序列2的無(wú)線接入部分在編碼器的語(yǔ)音編 碼模塊開始自適應(yīng)碼書搜索之前就將先前的上一個(gè)楨的編碼速率的指定指示發(fā)送到編碼器。
幀指定指激勵(lì)與編碼102101編碼在信道編碼后與譯激勵(lì)及能量誤差
序示的內(nèi)能量誤速率的編的編輸出上的編碼器激勵(lì)信指示模塊中的記
號(hào)容(幀序差選擇碼速碼速中的碼幀的號(hào)一致的語(yǔ)錄(語(yǔ)音編碼模
號(hào),速率)指令率率速率速率音編碼模塊塊,幀序號(hào),速率)
1沒(méi)有沒(méi)有23.0523.0523.0523.0523.05102 101102, 1, 23.05
101, 1, 23.05
21, 23.05101或 10223.0523.058.8523.058.85101102, 2, 23.05
8.858.85101, 2, 8.85
32, 8.8510123.0523.058.8523.0523.05102102, 3, 23.05
8.858.85101, 3, 8.85
43, 23.0510223.0523.058.8523.0523.05102102, 4, 23.05
8.858.85101, 4, 8.85
表格1
表格1說(shuō)明了上述的第一楨到第四幀時(shí)的編碼執(zhí)行情況,其中每一行第三列"激勵(lì)及能 量誤差選擇指令"的內(nèi)容是根據(jù)上一行的最后一列"激勵(lì)及能量誤差指示模塊中的記錄(語(yǔ)音 編碼模塊,幀序號(hào),速率)"的內(nèi)容和第二列"指定指示的內(nèi)容(幀序號(hào),速率)"的內(nèi)容比較后 產(chǎn)生的,這也就是激勵(lì)及能量誤差指示模塊根據(jù)接收到的自適應(yīng)多速率幀類型信號(hào)和指定指 示后所執(zhí)行的操作。在這里,編碼速率控制模塊在收到雙速率編碼指令時(shí),發(fā)出編碼速率指示
信號(hào)17讓語(yǔ)音編碼模塊102執(zhí)行23.05kb/s的編碼任務(wù),發(fā)出編碼速率指示信號(hào)18讓語(yǔ)音 編碼模塊101執(zhí)行8.85kb/s的編碼任務(wù),但這并不是編碼速率控制模塊的唯一的選擇。
編碼器中的語(yǔ)音編碼模塊在編碼每個(gè)話音信號(hào)幀的每個(gè)子幀時(shí),都要用到上一個(gè)子幀的 激勵(lì)信號(hào),語(yǔ)音編碼模塊102和101以相同的初始狀態(tài)和同樣的編碼速率23.05kb/s對(duì)第一 幀編碼產(chǎn)生相同的編碼幀和狀態(tài)值,譯碼器和兩個(gè)語(yǔ)音編碼模塊中的任何一個(gè)的激勵(lì)信號(hào)和 量化能量預(yù)溯誤差都是一致的。然后,語(yǔ)音編碼模塊102以23.05kb/s對(duì)第二J(^編碼產(chǎn)生編
碼楨和激勵(lì)信號(hào),語(yǔ)音編碼模塊101以8,85kb/s對(duì)第二楨編碼產(chǎn)生編碼幀和激勵(lì)信號(hào),因?yàn)?第二楨的編碼輸出中僅有語(yǔ)音編碼模塊101產(chǎn)生的編碼幀第三幀被放到信道上,所以到第二 幀為止,譯碼器和語(yǔ)音編碼模塊101在速率轉(zhuǎn)換上完全一致,兩者之間的激勵(lì)信號(hào)和量化能 量預(yù)淵誤差完全一致。第三楨編碼時(shí),編碼器中有23.05kb/s和8.85kb/s第二楨的子幀的激 勵(lì)信號(hào)和量化能量預(yù)測(cè)誤差可以使用,當(dāng)收到的指定指示給出用第二幀的8.85kb/s的激勵(lì)信 號(hào)和量化能量預(yù)湄誤差后,就可以從以23.05kb/s和8.85kb/s速率編碼的第二械的第四子幀 及其之前的激勵(lì)信號(hào)中選出以8.85kb/s速率編碼的第二幀的第四子幀及其之前的激勵(lì)信號(hào), 工作在23.05kb/s的語(yǔ)音編碼模塊102根據(jù)此激勵(lì)信號(hào)(語(yǔ)音編碼模塊101編碼第二幀時(shí)產(chǎn) 生的激勵(lì)信號(hào))計(jì)算出整數(shù)和分?jǐn)?shù)基音延遲,并按所述整數(shù)和分?jǐn)?shù)基音延遲對(duì)該澉勵(lì)信號(hào)進(jìn) 行內(nèi)插得到第三幀的第一子幀的自適應(yīng)碼書矢量信號(hào),然后再計(jì)算出自適應(yīng)碼書增益并量化, 接著,執(zhí)行固定碼本搜索,最終得到固定碼書矢量和量化的固定碼書增益;上述的整數(shù)和分 數(shù)基音延遲、自適應(yīng)碼書量化增益、固定碼書矢量被直接地編碼到語(yǔ)音編碼模塊102輸出的 自適應(yīng)多速率寬帶編碼幀中,量化的固定碼書增益則以量化的修正因子的形式間接地被編碼 到自適應(yīng)多速率寬帶編碼楨中;工作在&85kb/s的語(yǔ)音編碼模塊101根據(jù)同樣的激勵(lì)信號(hào)(語(yǔ) 音編碼模塊101編碼第二幀時(shí)產(chǎn)生的激勵(lì)信號(hào))執(zhí)行類似的操作。從表格1中看出第三個(gè)話 音信號(hào)楨的編碼輸出中被放到信道上傳送的是語(yǔ)音編碼模塊102輸出的自適應(yīng)多速率寬帶 23.05kb/s速率的編碼幀,譯碼器收到該自適應(yīng)多速率寬帶編碼幀后可直接解碼得到整數(shù)和 分?jǐn)?shù)基音延遲、自適應(yīng)碼書量化增益、和固定碼書矢量,并用直接解碼得到的修正因子乘預(yù)測(cè) 增益得到量化的固定碼書增益,譯碼器使用的四個(gè)第二幀的子幀的量化能量預(yù)溯誤差值和語(yǔ) 音編碼模塊101完成第二幀編碼時(shí)產(chǎn)生的第二轔的四個(gè)子楨的量化能量預(yù)淵誤差值完全相 同,也就是和語(yǔ)音編碼模塊102編碼第三幀時(shí)使用的四個(gè)第二幀的子幀的量化能量預(yù)測(cè)誤差 值完全相同,根據(jù)技術(shù)方案中對(duì)預(yù)測(cè)增益的計(jì)算的說(shuō)明,可以看出譯碼器直接解碼得到的修 正因子乘預(yù)淵增益得到量化的固定碼書增益和語(yǔ)音編碼模塊102編碼時(shí)使用的量化的固定碼 書增益完全相同,譯碼器用和語(yǔ)音編碼模塊102所用的第二幀第四子幀及其之前的8.85kb/s 的激勵(lì)信號(hào)一致的激勵(lì)信號(hào)按照這些參數(shù)合成第三幀第一子幀的激勵(lì)信號(hào),基于激勵(lì)信號(hào)再 重構(gòu)合成語(yǔ)音,第三幀的其他子幀的激勵(lì)信號(hào)和合成語(yǔ)音也就可以按上個(gè)子幀的激勵(lì)信號(hào)和 編碼幀中的參數(shù)計(jì)算得出。于是,譯碼器合成第三楨的激勵(lì)信號(hào)和語(yǔ)音編碼模塊102合成 23.05kb/s的激勵(lì)信號(hào)也取得了一致。譯碼器的第三幀的四個(gè)子楨的量化能量預(yù)溯誤差由直 接解碼得到的修正因子所確定,譯碼器生成第三幀的量化能量預(yù)測(cè)誤差和語(yǔ)音編碼模塊102 生成的量化能量預(yù)瀕誤差也取得了一致。所以譯碼器的激勵(lì)信號(hào)始終與編碼器中的一個(gè)語(yǔ)音 編碼模塊的激勵(lì)信號(hào)和量化能量預(yù)瀕誤差保持一致,譯碼器和某一個(gè)語(yǔ)音編碼模塊分別基于 一致的激勵(lì)信號(hào)使用同一編碼幀中的線性預(yù)淵分析量化參數(shù)重構(gòu)的合成語(yǔ)音就非常接近,因 此譯碼器能較好地還原原始話音信號(hào)。
實(shí)施例2—圖4所示的帶合成數(shù)字話音信號(hào)的可雙速率編碼的自適應(yīng)多速率窄帶(AMR-NB) 編碼器,它比圖3所示的不同之處是模式1編碼模塊的子模塊預(yù)測(cè)合成濾波器模塊輸出激勵(lì)信 號(hào)33經(jīng)濾波后的生成的合成數(shù)字話音信號(hào)8。編碼速率控制模塊接收帶幀序號(hào)的話音信號(hào)幀 1的輸入和速率命令信號(hào)9的輸入,當(dāng)速率命令信號(hào)9中包含AMR_SID速率時(shí),編碼速率控 制模塊輸出讓預(yù)溯合成濾波器輸出合成數(shù)字信號(hào)8的命令39。
權(quán)利要求
1.一種可按多個(gè)編碼速率編碼的定速率自適應(yīng)多速率窄帶編碼方法,其特征在于接收按多個(gè)編碼速率編碼的先前輸入信號(hào)幀的編碼速率的指定指示;按照所述指定指示的編碼速率從所述指定指示的先前輸入信號(hào)幀的包含第四子幀的連續(xù)154個(gè)樣本點(diǎn)的多個(gè)編碼速率的激勵(lì)信號(hào)中選出一個(gè)編碼速率的激勵(lì)信號(hào);按照所述指定指示的編碼速率從所述指定指示的先前輸入信號(hào)幀的多個(gè)速率的量化能量預(yù)測(cè)誤差中選出一個(gè)編碼速率的四個(gè)子幀的量化能量預(yù)測(cè)誤差;根據(jù)所述選出的激勵(lì)信號(hào)和所述選出的量化能量預(yù)測(cè)誤差生成編碼輸出。
2. 根據(jù)權(quán)利要求1的方法,其特征在于檢測(cè)所述多個(gè)編碼速率是否包含背景噪聲編碼速率,若檢測(cè)結(jié)果為是,則輸出非背景 噪聲編碼速率的合成數(shù)字信號(hào)幀。
3. —種可按多個(gè)編碼速率編碼的定速率自適應(yīng)多速率寬帶編碼方法,其特征在于接收按多個(gè)編碼速率編碼的先前輸入信號(hào)幀的編碼速率的指定指示;按照所述指定指示的編碼速率從所述指定指示的先前輸入信號(hào)幀的包含第四子幀的 連續(xù)248個(gè)樣本點(diǎn)的多個(gè)編碼速率的激勵(lì)信號(hào)中選出一個(gè)編碼速率的激勵(lì)信號(hào);按照所述指定指示的編碼速率從所述指定指示的先前輸入信號(hào)幀的多個(gè)編碼速率的 量化能量預(yù)測(cè)誤差中選出一個(gè)編碼速率的四個(gè)子幀的量化能量預(yù)淵誤差;根據(jù)所述選出的激勵(lì)信號(hào)和所述選出的量化能量預(yù)測(cè)誤差生成編碼輸出。
4. 根據(jù)權(quán)利要求3的方法,其特征在于檢測(cè)所述多個(gè)編碼速率是否包含背景噪聲編碼速率,若檢測(cè)結(jié)果為是,則輸出非背景 噪聲編碼速率的合成數(shù)字信號(hào)幀。
5. —種按背景噪聲編碼速率和非背景噪聲編碼速率編碼的定速率自適應(yīng)多速率窄帶編碼器, 其特征在于,它包括接收按兩個(gè)編碼速率編碼的先前輸入信號(hào)幀的編碼速率的指定指示 的裝置;按所述的兩個(gè)編碼速率中的非背景噪聲編碼速率對(duì)當(dāng)前輸入信號(hào)幀進(jìn)行線性預(yù)測(cè)、 自適應(yīng)碼書搜索和固定碼書搜索從而生成合成數(shù)字聲音信號(hào)幀的裝置;按照所述指定指示的編碼速率從所述指定指示的先前輸入信號(hào)楨的包含第四子幀的 連續(xù)154個(gè)樣本點(diǎn)的兩個(gè)編碼速率的激勵(lì)信號(hào)中選出一個(gè)編碼速率的激勵(lì)信號(hào)的裝置;按照所述指定指示的編碼速率從所述指定指示的先前輸入信號(hào)幀的兩個(gè)編碼速率的 量化能量預(yù)溯誤差中選出一個(gè)編碼速率的四個(gè)子幀的量化能量預(yù)測(cè)誤差的裝置; 根據(jù)所述選出的激勵(lì)信號(hào)和選出的量化能量預(yù)測(cè)誤差生成編碼輸出的裝置。
6. —種按背景噪聲編碼速率和非背景噪聲編碼速率編碼的定速率自適應(yīng)多速率寬帶編碼器, 其特征在于,它包括接收按兩個(gè)編碼速率編碼的先前輸入信號(hào)幀的編碼速率的指定指示 的裝置;按所述的兩個(gè)編碼速率中的非背景噪聲編碼速率對(duì)當(dāng)前輸入信號(hào)幀進(jìn)行線性預(yù)測(cè)、 自適應(yīng)碼書搜索和固定碼書搜索從而生成合成數(shù)字聲音信號(hào)幀的裝置;按照所述指定指示的編碼速率從所述指定指示的先前輸入信號(hào)幀的包含第四子幀的 連續(xù)248個(gè)樣本點(diǎn)的兩個(gè)編碼速率的激勵(lì)信號(hào)中選出一個(gè)編碼速率的激勵(lì)信號(hào)的裝置;按照所述指定指示的編碼速率從所述指定指示的先前輸入信號(hào)楨的兩個(gè)編碼速率的 量化能量預(yù)測(cè)誤差中選出一個(gè)編碼速率的四個(gè)子幀的量化能量預(yù)測(cè)誤差的裝置; 根據(jù)所述選出的激勵(lì)信號(hào)和選出的量化能量預(yù)渕誤差生成編碼輸出的裝置。
全文摘要
本發(fā)明提出一種定速率可多速率編碼的自適應(yīng)多速率編碼的方法和裝置,使得編碼器和譯碼器能長(zhǎng)時(shí)間保持一致的激勵(lì)信號(hào),從而使譯碼器合成的聲音信號(hào)更為準(zhǔn)確地還原原始聲音。本發(fā)明可應(yīng)用于第三代移動(dòng)通信系統(tǒng)——通用移動(dòng)通信系統(tǒng)(UMTS)作為可變速率自適應(yīng)多速率編碼器的替代。
文檔編號(hào)G10L19/14GK101373595SQ20071014734
公開日2009年2月25日 申請(qǐng)日期2007年8月20日 優(yōu)先權(quán)日2007年8月20日
發(fā)明者為 向 申請(qǐng)人:為 向
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1