專利名稱:編碼方法、解碼方法、編碼裝置、解碼裝置、程序及記錄介質(zhì)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及通過(guò)矢量量化對(duì)例如聲音或音樂(lè)等音響,圖像等信號(hào)序列進(jìn)行編碼或解碼的技術(shù)。
背景技術(shù):
在專利文獻(xiàn)I中記載的編碼裝置中,首先用歸一化值除輸入信號(hào)進(jìn)行歸一化。歸一化值被量化,生成量化索引。歸一化的輸入信號(hào)被矢量量化,生成量化代表矢量的索引。
生成的量化索引及量化代表矢量被輸出到解碼裝置。在解碼裝置中,量化索引被解碼生成歸一化值。量化代表矢量的索引被解碼生成樣本列。生成的樣本列各自的樣本乘以歸一化值而得到的值的列作為解碼信號(hào)樣本列。另一方面,作為量化噪聲少的高能率的矢量量化方法,廣泛使用例如SVQ法(球形矢量量化(Spherical Vector Quantization),例如參照非專利文獻(xiàn)I)等在預(yù)先設(shè)定的量化比特?cái)?shù)的范圍內(nèi),集中多個(gè)輸入信號(hào)并進(jìn)行量化的矢量量化方法。在SVQ 法中,使用量化歸一化值對(duì) MDCT(Modif ied Discrete Cosine Transform,修改離散余弦變換)系數(shù)等輸入信號(hào)的各樣本進(jìn)行歸一化,歸一化的各樣本集中于每個(gè)子帶并被量化。此時(shí),根據(jù)每個(gè)子帶的聽覺重要度,動(dòng)態(tài)分配與各子帶對(duì)應(yīng)的碼的比特?cái)?shù)(量化比特?cái)?shù))。另外,在SVQ法中,假設(shè)輸入信號(hào)的稀疏性,輸入信號(hào)的主要分量?jī)?yōu)先被量化。因此,可將如高次諧波或母音那樣僅僅零星存在頻域中的能量的輸入信號(hào)(稀疏信號(hào))高精度地量化。但是,在用SVQ法將在許多頻率中分布能量的輸入信號(hào)的各樣本進(jìn)行了量化的情況下,在從量化值復(fù)原的解碼信號(hào)中不存在理應(yīng)存在于輸入信號(hào)中的頻率分量(解碼信號(hào)缺損頻率分量)的頻度升高。這樣,解碼信號(hào)缺損頻率分量的情況下,解碼信號(hào)的某頻率分量的有無(wú)在時(shí)間上不連續(xù)變化的頻度升高。人們對(duì)這種頻率分量的有無(wú)在時(shí)間上不連續(xù)變化較為敏感。輸入信號(hào)為例如音響信號(hào)的情況下,這種變化有時(shí)作為被稱為音樂(lè)噪聲的噪聲而被感知。另外,在輸入信號(hào)為圖像信號(hào)的情況下,有時(shí)會(huì)產(chǎn)生相當(dāng)于音響信號(hào)中所說(shuō)的音樂(lè)噪聲那樣的塊狀噪聲。下面,將音樂(lè)噪聲及塊狀噪聲統(tǒng)稱為“音樂(lè)噪聲等”。與此相對(duì),與SVQ法相比,有解碼信號(hào)缺損頻率分量的頻度比較低的AVQ法(幾何矢量量化(Algebraic Vector Quantization),例如參照非專利文獻(xiàn)2)的矢量量化方法。AVQ法與SVQ法同樣是假設(shè)了信號(hào)的稀疏性的方法,但能夠獲得可復(fù)原比SVQ法多的頻率分量的量化值。現(xiàn)有技術(shù)文獻(xiàn)專利文獻(xiàn)專利文獻(xiàn)I:日本特開平7 - 261800號(hào)公報(bào)非專利文獻(xiàn)非專利文獻(xiàn)I :Recommendation ITU-T G. 729. I, SERIES G: TRANSMISSION SYSTEMSAND MEDIA, DIGITAL SYSTEMS ANDNETW0RKS, Digital terminal equipments-Codingof analogue signals bymethods other than PCM, G. 729-based embedded variablebit-rate coder:An8_32kbit/s scalable wideband coder bitstream interoperablewith G. 729.非專利文獻(xiàn)2: Recommendation ITU-T G. 718, SERIES G: TRANSMISSION SYSTEMSAND MEDIA, DIGITAL SYSTEMS ANDNETWORKS, Digital terminal equipments-Coding ofvoice and audio signals, Frame error robust narrow-band and wideband embeddedvariable bit-rate coding of speech and audiofrom8-32kbit/s.
發(fā)明內(nèi)容
發(fā)明要解決的課題但是,與SVQ法相比,AVQ法的幅度的量化精度較粗。即使解碼信號(hào)缺損頻率分量 的頻度較低,如果幅度的量化精度較粗,也會(huì)產(chǎn)生音樂(lè)噪聲等。這種問(wèn)題不限于AVQ法,與基于量化精度產(chǎn)生音樂(lè)噪聲等的情況是相同的。另外,這種問(wèn)題不限于輸入信號(hào)為頻域的信號(hào)的情況,在輸入信號(hào)為時(shí)域的信號(hào)的情況下也會(huì)產(chǎn)生。在本發(fā)明中,提供一種降低基于量化精度產(chǎn)生的音樂(lè)噪聲等的技術(shù)。用于解決課題的手段在編碼中,輸出索引信息,該索引信息表示多組與樣本各自的位置相對(duì)應(yīng)的預(yù)定的系數(shù)的組中、使樣本的值與將樣本的量化值和與樣本各自的位置相對(duì)應(yīng)的系數(shù)相乘的值之間的誤差對(duì)于所有樣本位置的和為最小的系數(shù)的組。在解碼中,求出與輸入的矢量量化索引對(duì)應(yīng)的多個(gè)值,作為與多個(gè)樣本位置相對(duì)應(yīng)的解碼值,使用輸入的索引信息表示的與多個(gè)樣本位置相對(duì)應(yīng)的預(yù)定的系數(shù)的組,輸出將與各樣本位置相對(duì)應(yīng)的解碼值和該系數(shù)相乘的值。發(fā)明效果在編碼中,輸出表示與多個(gè)樣本各自的量化值相乘的多個(gè)系數(shù)的組的索引信息,因此能夠減小解碼時(shí)的量化誤差,并能夠減小音樂(lè)噪聲等。在解碼中,將索引信息表示的多個(gè)系數(shù)與多個(gè)解碼值相乘,因此能夠減小量化誤差,并能夠減小音樂(lè)噪聲等。
圖I是編碼裝置及解碼裝置的例子的功能方框圖。圖2是編碼方法的例子的流程圖。圖3是步驟E4的例子的流程圖。圖4是解碼方法的例子的流程圖。圖5是步驟D3的例子的流程圖。圖6是示例輸入信號(hào)、量化值、斜度系數(shù)(斜率校正增益)之間的關(guān)系的圖。
具體實(shí)施例方式下面,對(duì)該發(fā)明的一實(shí)施方式詳細(xì)地進(jìn)行說(shuō)明。(構(gòu)成)
如圖I所示,實(shí)施方式的編碼裝置11例如包含歸一化值計(jì)算部112、歸一化值量化部113、矢量量化部115及斜度計(jì)算部116 (相當(dāng)于“系數(shù)組選擇部”)。如圖I所例示,實(shí)施方式的解碼裝置12例如包含歸一化值解碼部121、矢量解碼部122及斜度校正部124。根據(jù)需要,編碼裝置11例如也可以包含頻域轉(zhuǎn)換部111。解碼裝置12例如也可以包含時(shí)域轉(zhuǎn)換部125、平滑化部126。(編碼處理)編碼裝置11執(zhí)行圖2示例的編碼方法的各步驟。輸入信號(hào)X (k)被輸入歸一化值計(jì)算部112、矢量量化部115及斜度計(jì)算部116。該例的輸入信號(hào)X (k)為將音響信號(hào)等時(shí)間序列信號(hào)即時(shí)域信號(hào)X (η)轉(zhuǎn)換到頻域而得到的頻域信號(hào)。頻域的輸入信號(hào)X (k)也可以直接輸入編碼裝置11,頻域轉(zhuǎn)換部111也可以將輸入的時(shí)域的輸入信號(hào)X (η)轉(zhuǎn)換為頻域而生成頻域的輸入信號(hào)X (k)。頻域轉(zhuǎn)換部111生成頻域的輸入信號(hào)X (k)的情況下,頻域轉(zhuǎn)換部111將輸入的時(shí)域的輸入信號(hào)X (η) 通過(guò)例如MDCT (Modified Discrete Cosine Transform)轉(zhuǎn)換為頻域的輸入信號(hào)X (k)并輸出。η為在時(shí)域中的信號(hào)的號(hào)碼(離散時(shí)間號(hào)碼),k為在頻域的信號(hào)(樣本)的號(hào)碼(離散頻率號(hào)碼)。η的值越大對(duì)應(yīng)的時(shí)間越晚。k的值越大對(duì)應(yīng)的頻率越高。設(shè)I幀由L個(gè)樣本構(gòu)成,則時(shí)域信號(hào)X (η)每幀均被轉(zhuǎn)換為頻域,生成構(gòu)成L個(gè)頻率分量的頻域的輸入信號(hào)X(k) (k = 0,1,…,L—l)。L為規(guī)定的正數(shù),例如64或80等比I大的整數(shù)。另外,在使用MDCT的情況下,由輸入的時(shí)間序列信號(hào)即L個(gè)樣本構(gòu)成的每幀向頻域轉(zhuǎn)換,作為該轉(zhuǎn)換對(duì)象的幀在每1/2幀,即每L/2個(gè)樣本被偏移。歸一化值計(jì)算部112在每一幀計(jì)算代表被輸入的輸入信號(hào)X (k)的L個(gè)樣本中的規(guī)定的個(gè)數(shù)Ctl的樣本的值即歸一化值,XcT (步驟El)。,XcT是指,Xtl的上標(biāo)橫杠的值。在此,τ設(shè)定為對(duì)于I幀中的L個(gè)樣本中由規(guī)定的個(gè)數(shù)Cci的樣本構(gòu)成的各子帶唯一分配的O以上的整數(shù)。Ctl為L(zhǎng)或I及L以外的L的公約數(shù)。另外,將Ctl設(shè)為L(zhǎng)是指對(duì)每L個(gè)樣本求出歸一化值。將Ctl設(shè)為I及L以外的L的公約數(shù)是指將L個(gè)樣本分割為子帶,對(duì)構(gòu)成各子帶的每Ctl個(gè)樣本求出歸一化值。例如,在設(shè)定為L(zhǎng) = 64,且由八個(gè)頻率分量構(gòu)成子帶的情況下,構(gòu)成八個(gè)子帶,計(jì)算各子帶的歸一化值。另外,在CtlSL的情況下τ =0,歸一化值,XcT為代表L個(gè)樣本的值。即,在Ctl為L(zhǎng)的情況下,在每巾貞計(jì)算一個(gè)歸一化值τXtl'另一方面,在Ctl為I及L以外的L的公約數(shù)的情況下,τ為與I幀中的各子帶對(duì)應(yīng)的整數(shù)τ = O,…,(IVCci)-I,歸一化值TXcT為代表屬于與τ對(duì)應(yīng)的子幀的Ctl個(gè)樣本的值。S卩,在Ctl為I及L以外的L的公約數(shù)的情況下,在每幀計(jì)算(IVCtl)個(gè)歸一化值,XcT ( τ = 0,…,(L/C0)-l)o另外,與Cci的值無(wú)關(guān),k = τ · C0,…,(τ + I)· Qrl。由歸一化值計(jì)算部112計(jì)算的τ XcT被送入歸一化值量化部113。[歸一化值τXcT的具體例]歸一化值τΧ(!—為代表Ctl個(gè)樣本的值。換言之,歸一化值τΧ(!—為與Ctl個(gè)樣本對(duì)應(yīng)的值。歸一化值τΧ?!睦訛閷?duì)于如下的Ctl個(gè)樣本的冪平均值的平方根。[數(shù)I]
權(quán)利要求
1.一種編碼方法,其具有 矢量量化步驟,集中多個(gè)樣本并進(jìn)行矢量量化,求出矢量量化索引和所述多個(gè)樣本各自的量化值;以及 系數(shù)組選擇步驟,輸出索引信息,該索引信息表示多組與所述樣本各自的位置相對(duì)應(yīng)的預(yù)定的系數(shù)的組中、使所述樣本的值與將所述樣本的量化值和與所述樣本各自的位置相對(duì)應(yīng)的系數(shù)相乘的值之間的誤差對(duì)于所有的樣本位置的和為最小的系數(shù)的組。
2.根據(jù)權(quán)利要求I的編碼方法,其中, 所述系數(shù)的組由處于平面上的直線上的系數(shù)構(gòu)成,所述平面采用與對(duì)應(yīng)于所述系數(shù)所 對(duì)應(yīng)的樣本的位置的時(shí)間或頻率相對(duì)應(yīng)的值作為第一軸,采用所述系數(shù)的值作為第二軸。
3.根據(jù)權(quán)利要求I的編碼方法,其中, 所述系數(shù)的組由偏向平面上的直線或特定的曲線而分布的系數(shù)構(gòu)成,所述平面采用對(duì)應(yīng)于所述系數(shù)所對(duì)應(yīng)的樣本的位置的時(shí)間或頻率的值作為第一軸,采用所述系數(shù)的值作為第二軸。
4.根據(jù)權(quán)利要求I 3中任ー項(xiàng)的編碼方法,其中, 所述系數(shù)組選擇步驟輸出的索引信息的比特?cái)?shù),為從分配用干與矢量量化索引對(duì)應(yīng)的碼的比特?cái)?shù)中減去實(shí)際用于與所述矢量量化索引對(duì)應(yīng)的碼的比特?cái)?shù)而得到的數(shù)以下。
5.一種解碼方法,其具有 矢量解碼步驟,求出與輸入的矢量量化索引對(duì)應(yīng)的多個(gè)值,作為與多個(gè)樣本位置相對(duì)應(yīng)的解碼值;以及 系數(shù)乘法步驟,使用輸入的索引信息表示的與所述多個(gè)樣本位置相對(duì)應(yīng)的預(yù)定的系數(shù)的組,輸出與所述各樣本位置相對(duì)應(yīng)的、所述解碼值和所述系數(shù)相乘的值。
6.根據(jù)權(quán)利要求5的解碼方法,其中, 所述系數(shù)的組由處于平面上的直線上的系數(shù)構(gòu)成,所述平面采用與對(duì)應(yīng)于所述系數(shù)所對(duì)應(yīng)的樣本的位置的時(shí)間或頻率相對(duì)應(yīng)的值作為第一軸,采用所述系數(shù)的值作為第二軸。
7.根據(jù)權(quán)利要求5的解碼方法,其中, 所述系數(shù)的組由偏向平面上的直線或特定的曲線而分布的系數(shù)構(gòu)成,所述平面采用對(duì)應(yīng)于所述系數(shù)所對(duì)應(yīng)的樣本的位置的時(shí)間或頻率的值作為第一軸,采用所述系數(shù)的值作為第二軸。
8.一種編碼裝置,其具有 矢量量化部,集中多個(gè)樣本并進(jìn)行矢量量化,求出矢量量化索引和所述多個(gè)樣本各自的量化值;以及 系數(shù)組選擇部,輸出索引信息,該索引信息表示多組與所述樣本各自的位置相對(duì)應(yīng)的預(yù)定的系數(shù)的組中、使所述樣本的值與將所述樣本的量化值和與所述樣本各自的位置相對(duì)應(yīng)的系數(shù)相乘的值之間的誤差對(duì)于所有的樣本位置的和為最小的系數(shù)的組。
9.根據(jù)權(quán)利要求8的編碼裝置,其中, 所述系數(shù)的組由處于平面上的直線上的系數(shù)構(gòu)成,所述平面采用與對(duì)應(yīng)于所述系數(shù)所對(duì)應(yīng)的樣本的位置的時(shí)間或頻率相對(duì)應(yīng)的值作為第一軸,采用所述系數(shù)的值作為第二軸。
10.根據(jù)權(quán)利要求8的編碼裝置,其中, 所述系數(shù)的組由偏向平面上的直線或特定的曲線而分布的系數(shù)構(gòu)成,所述平面采用對(duì)應(yīng)于所述系數(shù)所對(duì)應(yīng)的樣本的位置的時(shí)間或頻率的值作為第一軸,采用所述系數(shù)的值作為第二軸。
11.根據(jù)權(quán)利要求8 10中任一項(xiàng)的編碼裝置,其中,所述系數(shù)組選擇步驟輸出的索引信息的比特?cái)?shù),為從分配用于與矢量量化索引相對(duì)應(yīng)的碼的比特?cái)?shù)中減去實(shí)際用于與所述矢量量化索引相對(duì)應(yīng)的碼的比特?cái)?shù)而得到的數(shù)以下。
12.—種解碼裝置,其具有 矢量解碼部,求出與輸入的矢量量化索引相對(duì)應(yīng)的多個(gè)值,作為與多個(gè)樣本位置相對(duì)應(yīng)的解碼值;以及 系數(shù)乘法部,使用輸入的索引信息表示的與所述多個(gè)樣本位置相對(duì)應(yīng)的預(yù)定的系數(shù)的組,輸出與所述各樣本位置相對(duì)應(yīng)的、所述解碼值和所述系數(shù)相乘的值。
13.根據(jù)權(quán)利要求12的解碼裝置,其中,所述系數(shù)的組由處于平面上的直線上的系數(shù)構(gòu)成,所述平面采用與對(duì)應(yīng)于所述系數(shù)所對(duì)應(yīng)的樣本的位置的時(shí)間或頻率相對(duì)應(yīng)的值作為第一軸,采用所述系數(shù)的值作為第二軸。
14.根據(jù)權(quán)利要求12的解碼裝置,其中,所述系數(shù)的組由偏向平面上的直線或特定的曲線而分布的系數(shù)構(gòu)成,所述平面采用對(duì)應(yīng)于所述系數(shù)所對(duì)應(yīng)的樣本的位置的時(shí)間或頻率的值作為第一軸,采用所述系數(shù)的值作為第二軸。
15.一種程序,其用于使計(jì)算機(jī)執(zhí)行權(quán)利要求I的編碼方法的各步驟。
16.一種程序,其用于使計(jì)算機(jī)執(zhí)行權(quán)利要求5的解碼方法的各步驟。
17.一種計(jì)算機(jī)可讀取的記錄介質(zhì),其儲(chǔ)存用于使計(jì)算機(jī)執(zhí)行權(quán)利要求I的編碼方法的各步驟的程序。
18.一種計(jì)算機(jī)可讀取的記錄介質(zhì),其儲(chǔ)存用于使計(jì)算機(jī)執(zhí)行權(quán)利要求5的解碼方法的各步驟的程序。
全文摘要
在編碼中,輸出索引信息,該索引信息表示多組與樣本各自的位置相對(duì)應(yīng)的預(yù)定的系數(shù)的組中、使樣本的值與將樣本的量化值和與樣本各自的位置相對(duì)應(yīng)的系數(shù)相乘的值之間的誤差對(duì)于所有樣本位置的和為最小的系數(shù)的組。在解碼中,求出與輸入的矢量量化索引對(duì)應(yīng)的多個(gè)值作為與多個(gè)樣本位置相對(duì)應(yīng)的解碼值,使用輸入的索引信息表示的與多個(gè)樣本位置相對(duì)應(yīng)的預(yù)定的系數(shù)的組,輸出將與各樣本位置相對(duì)應(yīng)的解碼值和該系數(shù)相乘的值。
文檔編號(hào)G10L19/02GK102959871SQ201180031929
公開日2013年3月6日 申請(qǐng)日期2011年7月4日 優(yōu)先權(quán)日2010年7月5日
發(fā)明者福井勝宏, 佐佐木茂明, 日和崎佑介, 小山翔一, 堤公孝 申請(qǐng)人:日本電信電話株式會(huì)社