用于能復(fù)原的矢量量化的方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本申請(qǐng)涉及編碼,特別且非排他地涉及語音或音頻編碼。
【背景技術(shù)】
[0002] 音頻信號(hào)如語音或音樂被編碼以便例如實(shí)現(xiàn)音頻信號(hào)的高效傳輸或存儲(chǔ)。
[0003] 音頻編碼器和解碼器被用于表示基于音頻的信號(hào),諸如音樂和背景噪聲。這種類 型的編碼器通常對(duì)于編碼過程不利用語音模型,而是使用用于表示包括語音在內(nèi)的所有類 型的音頻信號(hào)的過程。
[0004] 語音編碼器和解碼器(編解碼器)通常針對(duì)語音信號(hào)被優(yōu)化,并且可以以固定的 或可變的比特率工作。
[0005] 來自語音和音頻編解碼器的系數(shù)可以使用矢量量化技術(shù)進(jìn)行量化。特別地,一些 系數(shù)可以使用預(yù)測(cè)量化進(jìn)行量化,由此,具有多個(gè)系數(shù)的先前的量化矢量被用于預(yù)測(cè)具有 多個(gè)系數(shù)的當(dāng)前矢量的值。
[0006] 然而,使用預(yù)測(cè)來對(duì)矢量進(jìn)行量化會(huì)在解碼的語音或音頻信號(hào)中產(chǎn)生惱人的非自 然信號(hào)(artefact)。這特別會(huì)在幀擦除事件期間出現(xiàn),特別是在矢量量化器中長時(shí)間進(jìn)行 預(yù)測(cè)之后出現(xiàn)。
【發(fā)明內(nèi)容】
[0007] 下面的實(shí)施例的目標(biāo)在于解決上述問題。
[0008] 根據(jù)本發(fā)明的一個(gè)方面,提供了一種方法,包括:使用矢量量化器的預(yù)測(cè)操作模式 量化具有多個(gè)系數(shù)的矢量,其中矢量量化器能夠以預(yù)測(cè)操作模式或非預(yù)測(cè)操作模式工作, 以及其中所述多個(gè)系數(shù)與一幀音頻樣本相關(guān)聯(lián);確定當(dāng)具有多個(gè)系數(shù)的矢量遭受幀擦除事 件時(shí),具有多個(gè)恢復(fù)的系數(shù)的矢量,所述多個(gè)恢復(fù)的系數(shù)與具有多個(gè)系數(shù)的矢量相對(duì)應(yīng);將 具有多個(gè)系數(shù)的矢量與具有多個(gè)恢復(fù)的系數(shù)的矢量進(jìn)行比較;以及為具有與后續(xù)一幀音頻 樣本相關(guān)聯(lián)的多個(gè)系數(shù)的矢量確定矢量量化器的操作模式,其中所述操作模式取決于所述 比較。
[0009] 將具有多個(gè)系數(shù)的矢量與具有多個(gè)恢復(fù)的系數(shù)的矢量進(jìn)行比較可以包括:確定具 有多個(gè)系數(shù)的矢量和具有多個(gè)恢復(fù)的系數(shù)的矢量之間的失真度量;以及將所確定的失真度 量與預(yù)先確定的閾值進(jìn)行比較。
[0010] 所述一幀音頻樣本可以根據(jù)從多種編碼模式中選擇的一種編碼模式進(jìn)行編碼,以 及取決于所述比較來確定矢量量化器的操作模式可以包括:取決于所述比較以及從多種編 碼模式中選擇的所述一種編碼模式,來確定矢量量化器的操作模式。
[0011] 具有多個(gè)恢復(fù)的系數(shù)的矢量可以由幀差錯(cuò)隱藏過程的至少一部分產(chǎn)生。
[0012] 所述幀差錯(cuò)隱藏過程的所述至少一部分可以與配置成對(duì)具有多個(gè)系數(shù)的矢量進(jìn) 行解量化的解碼器處的幀差錯(cuò)隱藏過程的至少一部分等效。
[0013] 所述失真度量可以是具有多個(gè)系數(shù)的矢量和具有多個(gè)恢復(fù)的系數(shù)的矢量之間的 歐幾里德距離。
[0014] 可替換地,所述失真度量可以是具有多個(gè)系數(shù)的矢量和具有多個(gè)恢復(fù)的系數(shù)的矢 量之間的L1范數(shù)距離。
[0015] 具有多個(gè)系數(shù)的矢量可以優(yōu)選地是具有代表所述一幀音頻樣本的多個(gè)譜系數(shù)的 多個(gè)系數(shù)的矢量。
[0016] 具有代表所述一幀音頻樣本的多個(gè)譜系數(shù)的多個(gè)系數(shù)的矢量可以是具有多個(gè)線 譜頻率的矢量。
[0017] 根據(jù)本發(fā)明另一方面,提供了一種裝置,其配置成:使用矢量量化器的預(yù)測(cè)操作 模式量化具有多個(gè)系數(shù)的矢量,其中矢量量化器能夠以預(yù)測(cè)操作模式或非預(yù)測(cè)操作模式工 作,以及其中所述多個(gè)系數(shù)與一幀音頻樣本相關(guān)聯(lián);確定當(dāng)具有多個(gè)系數(shù)的矢量遭受幀擦 除事件時(shí),具有多個(gè)恢復(fù)的系數(shù)的矢量,所述多個(gè)恢復(fù)的系數(shù)與具有多個(gè)系數(shù)的矢量相對(duì) 應(yīng);將具有多個(gè)系數(shù)的矢量與具有多個(gè)恢復(fù)的系數(shù)的矢量進(jìn)行比較;以及為具有與后續(xù)一 幀音頻樣本相關(guān)聯(lián)的多個(gè)系數(shù)的矢量確定矢量量化器的操作模式,其中所述操作模式取決 于所述比較。
[0018] 配置成將具有多個(gè)系數(shù)的矢量與具有多個(gè)恢復(fù)的系數(shù)的矢量進(jìn)行比較的裝置可 以還被配置成:確定具有多個(gè)系數(shù)的矢量和具有多個(gè)恢復(fù)的系數(shù)的矢量之間的失真度量; 以及將所確定的失真度量與預(yù)先確定的閾值進(jìn)行比較。
[0019] 所述一幀音頻樣本可以根據(jù)從多種編碼模式中選擇的一種編碼模式進(jìn)行編碼,以 及配置成取決于所述比較來確定矢量量化器的操作模式的所述裝置可以被配置成:取決 于所述比較以及從多種編碼模式中選擇的所述一種編碼模式,來確定矢量量化器的操作模 式。
[0020] 所述裝置可以被配置成通過使用幀差錯(cuò)隱藏過程的至少一部分來產(chǎn)生具有多個(gè) 恢復(fù)的系數(shù)的矢量。
[0021] 所述幀差錯(cuò)隱藏過程的所述至少一部分可以與配置成對(duì)具有多個(gè)系數(shù)的矢量進(jìn) 行解量化的解碼器處的幀差錯(cuò)隱藏過程的至少一部分等效。
[0022] 所述失真度量可以是具有多個(gè)系數(shù)的矢量和具有多個(gè)恢復(fù)的系數(shù)的矢量之間的 歐幾里德距離。
[0023] 可替換地,所述失真度量可以是具有多個(gè)系數(shù)的矢量和具有多個(gè)恢復(fù)的系數(shù)的矢 量之間的L1范數(shù)距離。
[0024] 具有多個(gè)系數(shù)的矢量可以是具有代表所述一幀音頻樣本的多個(gè)譜系數(shù)的多個(gè)系 數(shù)的矢量。
[0025] 具有代表所述一幀音頻樣本的多個(gè)譜系數(shù)的多個(gè)系數(shù)的矢量可以是具有多個(gè)線 譜頻率的矢量。
[0026] 根據(jù)本發(fā)明的另一方面,提供了一種裝置,包括:至少一個(gè)處理器,以及包括一個(gè) 或多個(gè)程序的計(jì)算機(jī)代碼的至少一個(gè)存儲(chǔ)器,至少一個(gè)存儲(chǔ)器和計(jì)算機(jī)代碼配置成與至少 一個(gè)處理器一起使所述裝置至少:使用矢量量化器的預(yù)測(cè)操作模式量化具有多個(gè)系數(shù)的矢 量,其中矢量量化器能夠以預(yù)測(cè)操作模式或非預(yù)測(cè)操作模式工作,以及其中所述多個(gè)系數(shù) 與一幀音頻樣本相關(guān)聯(lián);確定當(dāng)具有多個(gè)系數(shù)的矢量遭受幀擦除事件時(shí),具有多個(gè)恢復(fù)的 系數(shù)的矢量,所述多個(gè)恢復(fù)的系數(shù)與具有多個(gè)系數(shù)的矢量相對(duì)應(yīng);將具有多個(gè)系數(shù)的矢量 與具有多個(gè)恢復(fù)的系數(shù)的矢量進(jìn)行比較;以及為具有與后續(xù)一幀音頻樣本相關(guān)聯(lián)的多個(gè)系 數(shù)的矢量確定矢量量化器的操作模式,其中所述操作模式取決于所述比較。
[0027]配置成使所述裝置至少將具有多個(gè)系數(shù)的矢量與具有多個(gè)恢復(fù)的系數(shù)的矢量進(jìn) 行比較的、與至少一個(gè)處理器一起的至少一個(gè)存儲(chǔ)器和計(jì)算機(jī)代碼可以還被配置成使所述 裝置至少:確定具有多個(gè)系數(shù)的矢量和具有多個(gè)恢復(fù)的系數(shù)的矢量之間的失真度量;以及 將所確定的失真度量與預(yù)先確定的閾值進(jìn)行比較。
[0028] 所述一幀音頻樣本可以根據(jù)從多種編碼模式中選擇的一種編碼模式進(jìn)行編碼,以 及其中配置成使所述裝置至少取決于所述比較來確定矢量量化器的操作模式的、與至少一 個(gè)處理器一起的至少一個(gè)存儲(chǔ)器和計(jì)算機(jī)代碼可以被配置成使所述裝置至少:取決于所述 比較以及從多種編碼模式中選擇的所述一種編碼模式,來確定矢量量化器的操作模式。
[0029] 至少一個(gè)存儲(chǔ)器和計(jì)算機(jī)代碼可以配置成與至少一個(gè)處理器一起使所述裝置至 少:通過使用幀差錯(cuò)隱藏過程的至少一部分來產(chǎn)生具有多個(gè)恢復(fù)的系數(shù)的矢量。
[0030]所述幀差錯(cuò)隱藏過程的所述至少一部分可以與配置成對(duì)具有多個(gè)系數(shù)的矢量進(jìn) 行解量化的解碼器處的幀差錯(cuò)隱藏過程的至少一部分等效。
[0031]所述失真度量可以是具有多個(gè)系數(shù)的矢量和具有多個(gè)恢復(fù)的系數(shù)的矢量之間的 歐幾里德距離。
[0032] 可替換地,所述失真度量可以是具有多個(gè)系數(shù)的矢量和具有多個(gè)恢復(fù)的系數(shù)的矢 量之間的L1范數(shù)距離。
[0033] 具有多個(gè)系數(shù)的矢量可以優(yōu)選地是具有代表所述一幀音頻樣本的多個(gè)譜系數(shù)的 多個(gè)系數(shù)的矢量。
[0034] 具有代表所述一幀音頻樣本的多個(gè)譜系數(shù)的多個(gè)系數(shù)的矢量可以是具有多個(gè)線 譜頻率的矢量。
[0035] 根據(jù)本發(fā)明的又一方面,提供了一種計(jì)算機(jī)程序代碼,所述計(jì)算機(jī)程序代碼在由 處理器執(zhí)行時(shí)實(shí)現(xiàn):使用矢量量化器的預(yù)測(cè)操作模式量化具有多個(gè)系數(shù)的矢量,其中矢量 量化器能夠以預(yù)測(cè)操作模式或非預(yù)測(cè)操作模式工作,以及其中所述多個(gè)系數(shù)與一幀音頻樣 本相關(guān)聯(lián);確定當(dāng)具有多個(gè)系數(shù)的矢量遭受幀擦除事件時(shí),具有多個(gè)恢復(fù)的系數(shù)的矢量,所 述多個(gè)恢