劃分的增益形狀向量編碼的制作方法
【技術(shù)領(lǐng)域】
[0001] 本文公開的本發(fā)明大體上設(shè)及增益形狀向量編碼和解碼,具體地,設(shè)及劃分的增 益形狀向量量化。
【背景技術(shù)】
[0002] 針對例如音頻和/或視頻的編碼方法通常包括對信號分段的某種類型的量化。已 知無約束向量量化(VQ)對于具有特定長度的分組樣本(即,向量)是有用的量化方法。但是, 存儲器和捜索復(fù)雜度限制導(dǎo)致了結(jié)構(gòu)化向量量化器的發(fā)展。不同的結(jié)構(gòu)在捜索復(fù)雜度和存 儲器要求方面具有不同的折中。一種針對結(jié)構(gòu)化向量量化的傳統(tǒng)方法是增益形狀向量量 化,其中使用形狀向量r和增益G來表示目標(biāo)向量X:
[0004] 增益形狀向量量化的構(gòu)思是對增益和形狀分量對Ir, G}進(jìn)行量化,而不是直接對 目標(biāo)向量進(jìn)行量化。然后,使用形狀量化器(針對歸一化的(norma 1 i Z ed)形狀輸入對其進(jìn)行 調(diào)諧)和增益量化器(其處理信號的動態(tài)性)來對增益和形狀分量進(jìn)行編碼。由于劃分成動 態(tài)性和形狀(還表示為精細(xì)結(jié)構(gòu))非常符合感知聽覺模型,所W該結(jié)構(gòu)常用于音頻編碼。
[0005] 此外,許多音頻編解碼器(比如IETF化USW及口U-T G.719)使用增益形狀向量量 化來對目標(biāo)音頻信號的頻譜系數(shù)進(jìn)行編碼。運(yùn)兩種編解碼器都使用固定的頻帶結(jié)構(gòu)來將頻 譜分成多個分段,并且頻帶結(jié)構(gòu)不存在對目標(biāo)向量的任何改變的自適應(yīng)。
[0006] 增益形狀量化的一個問題是找到合適的向量長度。較長的向量引起向量內(nèi)的較大 變化,從而形狀量化器需要處理信號的動態(tài)性。較短的向量降低向量內(nèi)的動態(tài)性,但可能會 受到W下事實(shí)的影響:形狀VQ的較低維度利用樣本修正的能力較差。此外,增益編碼的開銷 會隨著分割數(shù)量的增加而增加,運(yùn)使得留給形狀編碼的比特更少。
【發(fā)明內(nèi)容】
[0007] 期望實(shí)現(xiàn)高效的增益形狀向量編碼和解碼。
[000引根據(jù)第一方面,提供了一種用于支持劃分的增益形狀向量編碼的方法。將由媒體 編碼器執(zhí)行所述方法,其中,對每個向量分段的編碼受到與允許用于對向量分段進(jìn)行編碼 的最大比特?cái)?shù)量Bmax相關(guān)的限制。所述方法包括:確定針對目標(biāo)向量X的分段的初始數(shù)量 ^_init; W及基于向量比特預(yù)算和化_init,進(jìn)一步確定平均每分段比特?cái)?shù)量BaVG。所述方法還 包括:基于Np_init個分段的能量W及Bmax和Bavc之差,確定將在增益形狀向量編碼中針對向量 X使用的分段的最終數(shù)量。
[0009]根據(jù)第二方面,提供了一種用于支持劃分的增益形狀向量解碼的方法。將由媒體 解碼器執(zhí)行所述方法,其中,增益形狀向量X的每個向量分段的表示受到與允許用于對向量 分段進(jìn)行編碼的最大比特?cái)?shù)量Bmax相關(guān)的限制。所述方法包括:針對將被重構(gòu)的向量Xq,確 定分段的初始數(shù)量。所述方法還包括:從媒體編碼器接收對是否針對向量Xq應(yīng)用了增加數(shù) 量的分段的指示。所述方法還包括:基于所接收的指示,確定用于向量Xq的解碼的分段的最 終數(shù)量。
[0010] 根據(jù)第=方面,提供了一種媒體編碼器,該媒體編碼器能夠操作W執(zhí)行劃分的增 益形狀向量編碼,其中,對每個向量分段的編碼受到與允許用于對向量分段進(jìn)行編碼的最 大比特?cái)?shù)量Bmax相關(guān)的限制。所述媒體編碼器被配置為:確定針對目標(biāo)向量X的分段的初始 數(shù)量化_init; W及基于向量比特預(yù)算和化_init,確定針對向量X的平均每分段比特?cái)?shù)量BaVG。 所述媒體編碼器還被配置為:基于化_init個分段的能量W及Bmax和Bavg之差,確定將在增益形 狀向量編碼中使用的分段的最終數(shù)量。
[0011] 根據(jù)第四方面,提供了一種媒體解碼器,該媒體解碼器能夠操作W執(zhí)行增益形狀 向量解碼,其中,增益形狀向量X的每個向量分段的表示受到與允許用于對向量分段進(jìn)行編 碼的最大比特?cái)?shù)量Bmax相關(guān)的限制。所述媒體解碼器被配置為:針對將被重構(gòu)的向量Xq,確 定分段的初始數(shù)量化W及進(jìn)一步從媒體編碼器接收對是否針對向量Xq應(yīng)用了增加數(shù) 量的分段的指示。所述媒體解碼器還被配置為:基于所接收的指示,確定用于向量Xq的解碼 的分段的最終數(shù)量。
[0012] 根據(jù)第五方面,提供了一種無線設(shè)備,該無線設(shè)備包括根據(jù)第=方面的媒體編碼 器。
[0013] 根據(jù)第六方面,提供了一種無線設(shè)備,該無線設(shè)備包括根據(jù)第四方面的媒體解碼 器。
[0014] 根據(jù)第屯方面,提供了一種計(jì)算機(jī)程序,該計(jì)算機(jī)程序包括指令,所述指令當(dāng)在至 少一個處理器上執(zhí)行時使所述至少一個處理器執(zhí)行根據(jù)第一和/或第二方面的方法。
[0015] 根據(jù)第八方面,提供了一種載體,該載體包含第屯方面的計(jì)算機(jī)程序。
【附圖說明】
[0016] 根據(jù)W下對附圖中示出的實(shí)施例更具體的描述,本文公開的技術(shù)的W上和其他目 的、特征和優(yōu)點(diǎn)將顯而易見。附圖不必按比例繪制,相反重點(diǎn)在于說明本文公開的技術(shù)的原 理。
[0017] 圖1-2是示出了根據(jù)示例實(shí)施例由編碼器執(zhí)行的方法的流程圖。
[0018] 圖3a示出了針對多個向量分段的Eavg和每分段平均能量。
[0019] 圖3b示出了針對多個向量分段的Bmax和Bavg。
[0020]圖4是示出了根據(jù)示例實(shí)施例由編碼器執(zhí)行的方法的流程圖。
[0021 ]圖5-6是示出了根據(jù)示例實(shí)施例由解碼器執(zhí)行的方法的流程圖。
[0022] 圖7是示出了形狀方差隨劃分?jǐn)?shù)量的總體下降。
[0023] 圖8示出了目標(biāo)向量(上圖)和針對3個劃分(中圖)和4個劃分(下圖)的相應(yīng)能量的 示例。注意的是,具有4個劃分的模型更接近地符合目標(biāo)向量中的能量動態(tài)性。
[0024] 圖9是示出了在針對增益形狀量化對目標(biāo)向量進(jìn)行劃分中的折中的圖。較低數(shù)量 的劃分不能足夠好地歸一化形狀向量。較高數(shù)量的劃分需要較大的比特開銷來發(fā)送增益, 結(jié)果為形狀編碼留下數(shù)量不足的比特。
[0025] 圖10示出了目標(biāo)向量和針對2路和3路劃分的相應(yīng)分段能量的示例。
[0026] 圖11是示出了分段能量的方差隨著圖10中的目標(biāo)向量被劃分成的分段的數(shù)量的 變化的圖。
[0027] 圖12a-14示出了根據(jù)示例實(shí)施例的編碼器和/或解碼器的不同實(shí)現(xiàn)。
【具體實(shí)施方式】
[0028] 本文描述的實(shí)施例的構(gòu)思用于在給定特定尺寸的目標(biāo)向量的情況下分析形狀和 確定分成子向量的合適分辨率(resolution)。在音頻編解碼器的情況下,運(yùn)可W減少量化 誤差并增加感知質(zhì)量。此外,本文描述的一些實(shí)施例的目的在于,找到切片(section)的優(yōu) 化數(shù)量,即目標(biāo)向量的劃分的數(shù)量。
[0029] 本文的實(shí)施例設(shè)及一種用于支持劃分的增益形狀向量編碼的方法。在對每個向量 分段的編碼受到與最大比特?cái)?shù)量Bmax相關(guān)的限制的情況下,旨在由媒體編碼器執(zhí)行所述方 法。也就是說,在允許用于對向量分段進(jìn)行編碼的最大比特?cái)?shù)是Bmax的情況中。運(yùn)一限制可 能是由于媒體編碼器的例如處理能力和/或存儲容量導(dǎo)致的。下文將參考圖1描述根據(jù)示例 實(shí)施例的方法。圖1中所示的方法包括:針對目標(biāo)向量X,確定(101)針對目標(biāo)向量X的分段的 初始數(shù)量Np_init??蒞基于例如Bmax和比特預(yù)算(即分配用于對整個向量X進(jìn)行編碼的比特?cái)?shù) 量)確定數(shù)量化_init。所述方法還包括:基于向量比特預(yù)算和化_init,確定(102)每分段的平 均比特?cái)?shù)Bavg。注意到,在運(yùn)一階段,無需實(shí)際對向量X進(jìn)行劃分,即使已經(jīng)確定了分段的初 始數(shù)量和可用于初始向量分段的平均比特?cái)?shù)量也是如此。所述方法還包括:基于化_init個分 段的能量W及Bmax和Bavc之差,確定將在增益形狀向量編碼中使用的分段的最終數(shù)量化。通 過基于運(yùn)些參數(shù)確定分段的最終數(shù)量,能夠在目標(biāo)向量上高效地分配比特預(yù)算的比特,運(yùn) 將在下文中進(jìn)一步詳細(xì)描述。對分段數(shù)量的確定可W備選地被表達(dá)為確定劃分?jǐn)?shù)量,運(yùn)是 因?yàn)榉侄蔚臄?shù)量和劃分的數(shù)量是緊密相關(guān)的。備選地,術(shù)語"劃分"可W用來表示分段。
[0030] 然后,可W向媒體解碼器指示所確定的分段的最終數(shù)量化,W便使得媒體解碼器 能夠充分地對經(jīng)編碼的增益形狀向量進(jìn)行解碼。應(yīng)該注意的是,不必指示分段的實(shí)際數(shù)量, 而是指示與所確定的分段的初始數(shù)量相比的改變。關(guān)于對化_init的確定,可W將分段的運(yùn)一 初始數(shù)量提供給編碼器和解碼器。在運(yùn)種情況中,術(shù)語"確定"將是指例如為了使用確立 化_1。:11;,或類似。
[0031] 在如圖2所示的一個實(shí)施例中,對分段的最終數(shù)量的確定包括:當(dāng)化_init個分段的 能量與Bmax和Bav込差之間的關(guān)系滿足標(biāo)準(zhǔn)時,增加(204)分段(和劃分)的數(shù)量。運(yùn)里,"增 加 "分段的數(shù)量的意思是相比于分段的初始數(shù)量化_init而增加。例如,可W增加一個劃分(和 分段),導(dǎo)致分段的最終數(shù)量化=然后,可W通過合適的方式向媒體解碼器指示 (205)分段數(shù)量的增加。有利地,使用盡可能少的比特來向解碼器指示分段的最終數(shù)量。當(dāng) 增加預(yù)定數(shù)量的分段(或劃分)(例如一個)時,可W使用單個比特向媒體解碼器指示分段 (或劃分)的最終增加后的數(shù)量,該單個比特通常被稱為標(biāo)志(flag)。例如,當(dāng)應(yīng)用了增加后 的數(shù)量的分段時,所述比特可W被設(shè)置為"r或"真(true)",當(dāng)將使用初始數(shù)量的分段時, 所述比特可W被設(shè)置為"0"或"偽(false)"。也就是說,對分段的最終數(shù)量的確定還可W包 括:當(dāng)個分段的能量與Bmax和Bavg之差之間的關(guān)系不滿足所述標(biāo)準(zhǔn)時或當(dāng)沒有滿足相 應(yīng)的標(biāo)準(zhǔn)時,確定(206 )應(yīng)該使用分段的初始數(shù)量化_init,即化=^_init。運(yùn)在圖2中被示為 動作206。
[0032] 對分段的最終數(shù)量化的確定可W包括:當(dāng)目標(biāo)向量分段能量與針對目標(biāo)向量X的 平均每分段能量值Eavg的最大偏差大于基于Bmax和Bavg之差的闊值時,針對目標(biāo)向量X,相比 于初始數(shù)量增加