處理音頻信號(hào)的方法和設(shè)備的制作方法
【專利摘要】本發(fā)明提供一種處理音頻信號(hào)的方法和設(shè)備,所述方法包括步驟:接收對應(yīng)于多個(gè)譜系數(shù)的輸入音頻信號(hào);基于所述輸入信號(hào)的能量來獲得位置信息,所述位置信息指示所述譜系數(shù)中的特定譜系數(shù)的位置;利用所述位置信息以及所述譜系數(shù)產(chǎn)生形狀矢量;通過搜索對應(yīng)于所述形狀矢量的碼本來確定碼本索引;以及傳輸所述碼本索引和所述位置信息,其中通過利用從所述譜系數(shù)選擇的部分來產(chǎn)生所述形狀矢量,以及基于所述位置信息來選擇所述選擇的部分。
【專利說明】處理音頻信號(hào)的方法和設(shè)備
[0001] 本申請是2013年2月25日提交的國際申請日為2011年8月23日的申請?zhí)枮?201180041093. 7 (PCT/KR2011/006222)的,發(fā)明名稱為"處理音頻信號(hào)的方法和設(shè)備"的專 利申請的分案申請。
【技術(shù)領(lǐng)域】
[0002] 本發(fā)明涉及用于處理音頻信號(hào)的設(shè)備及其方法。雖然本發(fā)明適合于廣范圍的應(yīng) 用,但是它特別適合于對音頻信號(hào)編碼或解碼。
【背景技術(shù)】
[0003] 壓縮編碼是指一系列的通過通信線路傳送數(shù)字信息,或在適合于存儲(chǔ)介質(zhì)的形式 存儲(chǔ)數(shù)字化信息的信號(hào)處理技術(shù)。在一般情況下,視頻,音頻和文本進(jìn)行壓縮編碼。特別是, 對于音頻進(jìn)行壓縮編碼的技術(shù)被稱為音頻壓縮。
[0004] 音頻壓縮技術(shù)可包括對音頻信號(hào)進(jìn)行頻率變換(例如,MDCT(修正離散余弦變 換))的方法。在這樣做時(shí),將作為MDCT的結(jié)果的MDCT系數(shù)傳輸給解碼器。如果這樣的話, 解碼器通過利用MDCT系數(shù)進(jìn)行頻率逆變換(例如,iMDCT (逆MDCT)),來重建音頻信號(hào)。
[0005] 然而,近來,隨著各種各樣的媒體和數(shù)據(jù)傳輸媒體的發(fā)展,人們需要一種用于有效 地處理視頻信號(hào)的方法和裝置。
【發(fā)明內(nèi)容】
[0006] 技術(shù)問題
[0007] 但是,在傳輸MDCT系數(shù)的過程中,如果傳輸全部數(shù)據(jù),則可能引起降低比特率效 率的問題。如果傳輸諸如脈沖等等的數(shù)據(jù),則可能引起降低重建速率的問題。
[0008] 技術(shù)方案
[0009] 因此,本發(fā)明旨在基本上避免由于現(xiàn)有技術(shù)的限制和缺點(diǎn)所致的一個(gè)或多個(gè)問 題。本發(fā)明的目的是提供一種處理音頻信號(hào)的設(shè)備及其方法,通過其基于能量產(chǎn)生的形狀 矢量(shape vector)可用于傳輸譜系數(shù)(例如,MDCT系數(shù))。
[0010] 本發(fā)明的另一目的是提供一種處理音頻信號(hào)的設(shè)備及其方法,通過其形狀矢量被 歸一化(normalize)然后被傳輸,以在傳輸形狀矢量時(shí)縮小動(dòng)態(tài)范圍。
[0011] 本發(fā)明的另一目的是提供一種處理音頻信號(hào)的設(shè)備及其方法,通過其在傳輸每步 驟產(chǎn)生的多個(gè)歸一化值時(shí),對除了值的平均值之外的其余值進(jìn)行矢量量化。
[0012] 有益效果
[0013] 因此,本發(fā)明提供以下效果和/或特點(diǎn)。
[0014] 首先,在傳輸譜系數(shù)時(shí),當(dāng)傳輸基于能量產(chǎn)生的形狀矢量時(shí),能夠以較少的比特?cái)?shù) 提高重建速度。
[0015] 第二,因?yàn)閷⑿螤钍噶繗w一化然后傳輸,所以本發(fā)明縮小了動(dòng)態(tài)范圍,從而提高了 比特效率。
[0016] 第三,本發(fā)明通過在多級中重復(fù)形狀矢量產(chǎn)生步驟來傳輸多個(gè)形狀矢量,從而在 不顯著提高比特率的情況下更準(zhǔn)確地重建譜系數(shù)。
[0017] 第四,在傳輸歸一化值時(shí),本發(fā)明單獨(dú)地傳輸多個(gè)歸一化值的平均值,并且只矢量 量化與差分矢量(differential vector)相對應(yīng)的值,從而提高了比特效率。
[0018] 第五,對歸一化值差分矢量進(jìn)行的矢量量化的結(jié)果幾乎與SNR以及分配給差分矢 量的總比特?cái)?shù)無關(guān),但是與形狀矢量的總比特?cái)?shù)高度相關(guān)。因此,雖然將較少的比特?cái)?shù)分配 給歸一化值差分矢量,但是在不對重建速度造成顯著麻煩方面是有利的。
【專利附圖】
【附圖說明】
[0019] 圖1是根據(jù)本發(fā)明實(shí)施例的音頻信號(hào)處理設(shè)備的方框圖。
[0020] 圖2是描述用于產(chǎn)生形狀矢量的處理的示意圖。
[0021] 圖3是描述用于通過多級(m = 0,…)處理產(chǎn)生形狀矢量的處理的示意圖。
[0022] 圖4示出形狀矢量的矢量量化所必需的碼本的一個(gè)示例。
[0023] 圖5是形狀矢量的總比特?cái)?shù)與信噪比(SNR)之間的關(guān)系的示意圖。
[0024] 圖6是歸一化值差分碼矢量的總比特?cái)?shù)與信噪比(SNR)之間的關(guān)系的示意圖。
[0025] 圖7是用于比特流中包括的元素的語法的一個(gè)示例的示意圖。
[0026] 圖8是根據(jù)本發(fā)明一個(gè)實(shí)施例的音頻信號(hào)處理設(shè)備中的解碼器的構(gòu)造的示意圖。
[0027] 圖9是其中實(shí)現(xiàn)根據(jù)本發(fā)明一個(gè)實(shí)施例的音頻信號(hào)處理設(shè)備的產(chǎn)品的示意性方 框圖。
[0028] 圖10是說明其中實(shí)現(xiàn)根據(jù)本發(fā)明一個(gè)實(shí)施例的音頻信號(hào)處理設(shè)備的產(chǎn)品之間的 關(guān)系的不意圖。
[0029] 圖11是其中實(shí)現(xiàn)根據(jù)本發(fā)明一個(gè)實(shí)施例的音頻信號(hào)處理設(shè)備的移動(dòng)終端的示意 性方框圖。
【具體實(shí)施方式】
[0030] 為了實(shí)現(xiàn)這些和其他優(yōu)點(diǎn)并根據(jù)本發(fā)明的目的,如同具體實(shí)施并寬泛描述的,根 據(jù)本發(fā)明一個(gè)實(shí)施例的處理音頻信號(hào)的方法可包括步驟:接收對應(yīng)于多個(gè)譜系數(shù)的輸入音 頻信號(hào),基于輸入信號(hào)的能量來獲得位置信息,所述位置信息指示多個(gè)譜系數(shù)中的特定一 個(gè)的位置,利用所述位置信息以及所述譜系數(shù)來產(chǎn)生形狀矢量,通過搜索對應(yīng)于所述形狀 矢量的碼本來確定碼本索引,以及傳輸所述碼本索引和所述位置信息,其中利用從所述譜 系數(shù)選擇的部分來產(chǎn)生所述形狀矢量,并且其中基于所述位置信息來選擇所選擇的部分。
[0031] 根據(jù)本發(fā)明,所述方法可進(jìn)一步包括步驟:產(chǎn)生關(guān)于指定譜系數(shù)的符號(hào)信息以及 傳輸所述符號(hào)信息,其中進(jìn)一步基于所述符號(hào)信息來產(chǎn)生所述形狀矢量。
[0032] 根據(jù)本發(fā)明,所述方法可進(jìn)一步包括步驟:產(chǎn)生用于所選擇的部分的歸一化值。碼 本索引確定步驟可包括步驟:通過利用歸一化值將所述形狀矢量歸一化來產(chǎn)生歸一化形狀 矢量,以及通過搜索對應(yīng)于所述歸一化形狀矢量的碼本來確定所述碼本索引。
[0033] 根據(jù)本發(fā)明,所述方法可進(jìn)一步包括步驟:計(jì)算第一級到第M級歸一化值的平均 值,利用從所述第一級到第M級歸一化值減去所述平均值所得到的值來產(chǎn)生差分矢量,通 過搜索對應(yīng)于所述差分矢量的碼本來確定所述歸一化值索引,以及傳輸所述平均值以及對 應(yīng)于所述歸一化值的歸一化索引。
[0034] 根據(jù)本發(fā)明,輸入音頻信號(hào)可包括第(m+1)級輸入信號(hào),所述形狀矢量可包括第 (m+1)級形狀矢量,所述歸一化值可包括第(m+1)級歸一化值,并且基于第m級輸入信號(hào)、第 m級形狀矢量以及第m級歸一化值可產(chǎn)生第(m+1)級輸入信號(hào)。
[0035] 根據(jù)本發(fā)明,碼本索引確定步驟可包括步驟:利用包括加權(quán)因子和所述形狀矢量 的成本函數(shù)來搜索所述碼本,以及確定對應(yīng)于所述形狀矢量的碼本索引,所述加權(quán)因子可 根據(jù)所選擇的部分而變化。
[0036] 根據(jù)本發(fā)明,所述方法可進(jìn)一步包括步驟:利用所述輸入音頻信號(hào)以及對應(yīng)于所 述碼本索引的形狀碼矢量來產(chǎn)生殘差信號(hào),以及通過對所述殘差信號(hào)進(jìn)行頻率包絡(luò)編譯來 產(chǎn)生包絡(luò)參數(shù)索引。
[0037] 為了進(jìn)一步實(shí)現(xiàn)這些和其他優(yōu)點(diǎn)并根據(jù)本發(fā)明的目的,根據(jù)本發(fā)明另一實(shí)施例用 于處理音頻信號(hào)的設(shè)備可包括:位置檢測單元,接收對應(yīng)于多個(gè)譜系數(shù)的輸入音頻信號(hào),所 述位置檢測單元基于輸入信號(hào)的能量來獲得位置信息,所述位置信息指示多個(gè)譜系數(shù)中的 特定一個(gè)的位置;形狀矢量產(chǎn)生單元,利用所述位置信息以及所述譜系數(shù)來產(chǎn)生形狀矢量; 矢量量化單元,通過搜索對應(yīng)于所述形狀矢量的碼本來確定碼本索引;以及復(fù)用單元,傳輸 所述碼本索引和所述位置信息,其中利用從所述譜系數(shù)選擇的部分來產(chǎn)生所述形狀矢量, 并且其中基于所述位置信息來選擇所選擇的部分。
[0038] 根據(jù)本發(fā)明,所述位置檢測單元可產(chǎn)生關(guān)于指定譜系數(shù)的符號(hào)信息,所述復(fù)用單 元可傳輸所述符號(hào)信息,并且可進(jìn)一步基于所述符號(hào)信息來產(chǎn)生所述形狀矢量。
[0039] 根據(jù)本發(fā)明,所述形狀矢量產(chǎn)生單元可進(jìn)一步產(chǎn)生用于所選擇的部分的歸一化 值,并通過利用所述歸一化值將所述形狀矢量歸一化來產(chǎn)生歸一化形狀矢量。此外,所述矢 量量化單元可通過搜索對應(yīng)于所述歸一化形狀矢量的碼本來確定所述碼本索引。
[0040] 根據(jù)本發(fā)明,所述設(shè)備可進(jìn)一步包括用于計(jì)算第一級到第M級歸一化值的平均值 的歸一化值編碼單元,所述歸一化值編碼單元利用從第一級到第M級歸一化值減去所述平 均值所得到的值來產(chǎn)生差分矢量,歸一化值編碼單元通過搜索對應(yīng)于所述差分矢量的碼本 來確定所述歸一化值索引,歸一化值編碼單元傳輸所述平均值以及對應(yīng)于所述歸一化值的 歸一化索引。
[0041] 根據(jù)本發(fā)明,所述輸入音頻信號(hào)可包括第(m+1)級輸入信號(hào),所述形狀矢量可包 括第(m+1)級形狀矢量,所述歸一化值可包括第(m+1)級歸一化值,以及基于第m級輸入信 號(hào)、第m級形狀矢量以及第m級歸一化值可產(chǎn)生第(m+1)級輸入信號(hào)。
[0042] 根據(jù)本發(fā)明,所述矢量量化單元可利用包括加權(quán)因子和所述形狀矢量的成本函數(shù) 來搜索所述碼本,并確定對應(yīng)于所述形狀矢量的碼本索引。此外,所述加權(quán)因子可根據(jù)所選 擇的部分而變化。
[0043] 根據(jù)本發(fā)明,所述設(shè)備可進(jìn)一步包括殘差編碼單元,其用于利用所述輸入音頻信 號(hào)以及對應(yīng)于所述碼本索引的形狀碼矢量來產(chǎn)生殘差信號(hào),所述殘差編碼單元通過對所述 殘差信號(hào)進(jìn)行頻率包絡(luò)編譯來產(chǎn)生包絡(luò)參數(shù)索引。
[0044] 本發(fā)明模式
[0045] 下面詳細(xì)參照本發(fā)明的優(yōu)選實(shí)施例,其示例在附圖中示出。首先,不將本說明書和 權(quán)利要求書中使用的術(shù)語或詞語解釋為限于一般含義或字典含義,而是應(yīng)當(dāng)基于發(fā)明人能 夠適當(dāng)?shù)叵薅ㄐg(shù)語的概念以便以最佳方式描述發(fā)明人的發(fā)明的原理,來解釋為與本發(fā)明的 技術(shù)構(gòu)思相匹配的含義和概念。本公開中公開的實(shí)施例和附圖中示出的構(gòu)造只是一個(gè)優(yōu)選 實(shí)施例,并不代表本發(fā)明的全部技術(shù)構(gòu)思。因此,應(yīng)當(dāng)理解,本發(fā)明涵蓋本發(fā)明的修改和變 型,只要它們落入提交本申請時(shí)所附權(quán)利要求書及其等同物的范圍之內(nèi)。
[0046] 根據(jù)本發(fā)明,可根據(jù)以下參照來解釋以下術(shù)語,并可將本說明書中未公開的其他 術(shù)語解釋為與本發(fā)明的技術(shù)構(gòu)思相匹配的以下含義和概念。具體而言,可以選擇性地將"編 譯"解釋為"編碼"或"解碼",并且本公開中的"信息"是一般包括值、參數(shù)、系數(shù)、元素等等 的術(shù)語,并且有時(shí)候可將其含義解釋為不同,本發(fā)明不限于此。
[0047] 在本公開中,廣義上,音頻信號(hào)在概念上區(qū)別于視頻信號(hào),并指示可以通過聽覺方 式識(shí)別的所有種類的信號(hào)。狹義上,音頻信號(hào)表示沒有語音特性或者具有少量語音特性的 信號(hào)。應(yīng)當(dāng)在廣義上解釋本發(fā)明的音頻信號(hào)。但是,如果作為區(qū)別于語音信號(hào)來使用,則本 發(fā)明的音頻信號(hào)可以理解為狹義上的音頻信號(hào)。
[0048] 雖然將編譯僅指定為編碼,但是也可將其解釋為包括編碼和解碼兩者。
[0049] 圖1是根據(jù)本發(fā)明實(shí)施例的音頻信號(hào)處理設(shè)備的方框圖。參照圖1,編碼器100包 括位置檢測單元110和形狀矢量產(chǎn)生單元120。編碼器100進(jìn)一步包括矢量量化單元130、 第(m+1)級輸入信號(hào)產(chǎn)生單元140、歸一化值編碼單元150、殘差產(chǎn)生單元160、殘差編碼單 元170以及復(fù)用單元180的至少其中之一。編碼器100可以進(jìn)一步包括被配置為產(chǎn)生譜系 數(shù)的變換單元(附圖中未示出),或者可以從外部設(shè)備接收譜系數(shù)。
[0050] 在以下描述中,示意性說明上述組件的功能。首先,接收或產(chǎn)生編碼器100的譜系 數(shù),從譜系數(shù)檢測高能量采樣的位置,基于檢測的位置產(chǎn)生歸一化形狀矢量,進(jìn)行歸一化, 然后進(jìn)行矢量量化。在后續(xù)的級(m= 1,…,M-1)中對信號(hào)重復(fù)進(jìn)行形狀矢量的產(chǎn)生、歸一 化和矢量量化。對通過多個(gè)級產(chǎn)生的多個(gè)歸一化值進(jìn)行編碼,經(jīng)由形狀矢量產(chǎn)生編碼結(jié)果 的殘差,然后對產(chǎn)生的殘差進(jìn)行殘差編譯。
[0051] 在以下描述中,詳細(xì)說明上述組件的功能。
[0052] 首先,位置檢測單元110接收譜系數(shù)作為(第一級(m = 0)的)輸入信號(hào)\,然后 從系數(shù)檢測具有最大采樣能量的系數(shù)的位置。在這種情況下,譜系數(shù)對應(yīng)于單個(gè)幀(例如, 20ms)的音頻信號(hào)的頻率變換的結(jié)果。例如,如果頻率變換包括MDCT,則對應(yīng)的結(jié)果可包括 MDCT(修正離散余弦變換)系數(shù)。此外,它可以對應(yīng)于以低頻帶(4kHz或更低)上的頻率分 量構(gòu)造的MDCT系數(shù)。
[0053] 第一級(m = 0)的輸入信號(hào)\是一組總共N個(gè)譜系數(shù),并且可表示如下。
[0054] [公式 1]
[0055] X〇 = [x0(0), x0(l), --?, x0(N-l)]
[0056] 在公式1中,\表示第一級(m = 0)的輸入信號(hào),N表示譜系數(shù)的總數(shù)。
[0057] 位置檢測單元110確定用于第一級(m = 0)的輸入信號(hào)\的具有最大采樣能量 的系數(shù)所對應(yīng)的頻率(或頻率位置)km如下。
[0058] [公式 2]
【權(quán)利要求】
1. 一種解碼音頻信號(hào)的方法,包括: 接收位置信息、符號(hào)信息、碼本索引、歸一化平均值、歸一化值索引、包絡(luò)參數(shù)索引W及 平均能量; 利用所述位置信息W及所述符號(hào)信息來獲得對應(yīng)于所述碼本索引的形狀碼矢量; 獲得對應(yīng)于所述歸一化值索引的歸一化值差分碼矢量; 通過將所述歸一化平均值加到所述歸一化值差分碼矢量,來產(chǎn)生歸一化值碼矢量;W 及 利用所述形狀碼矢量W及所述歸一化值碼矢量重建第一合成信號(hào)。
2. 根據(jù)權(quán)利要求1所述的方法,進(jìn)一步包括 利用所述包絡(luò)參數(shù)索引W及所述平均能量產(chǎn)生第二合成信號(hào)。
3. 根據(jù)權(quán)利要求2所述的方法,進(jìn)一步包括 利用第一合成信號(hào)W及第二合成信號(hào)重建譜系數(shù)。
4. 根據(jù)權(quán)利要求2所述的方法, 其中所述生成第二合成信號(hào)包括: 利用所述包絡(luò)參數(shù)索引W及所述平均能量重建包絡(luò)參數(shù);W及 通過將隨機(jī)信號(hào)乘W所述包絡(luò)參數(shù)產(chǎn)生所述第二合成信號(hào)。
5. 根據(jù)權(quán)利要求2所述的方法, 其中所述生成第二合成信號(hào)包括: 利用所述包絡(luò)參數(shù)索引W及所述平均能量重建包絡(luò)參數(shù); 利用常數(shù)值調(diào)節(jié)所述包絡(luò)參數(shù);W及 通過將隨機(jī)信號(hào)乘W所述調(diào)節(jié)的包絡(luò)參數(shù)產(chǎn)生所述第二合成信號(hào)。
6. 根據(jù)權(quán)利要求4所述的方法, 其中利用所述包絡(luò)參數(shù)索引W及所述平均能量重建包絡(luò)參數(shù)包括: 獲得對應(yīng)于所述包絡(luò)參數(shù)索引的去除平均值的分裂碼矢量; 組合所述獲得的分裂碼矢量;W及 將所述平均能量加到所述分裂碼矢量。
7. 根據(jù)權(quán)利要求1所述的方法, 其中利用碼本獲得所述歸一化值差分碼矢量。
8. -種用于解碼音頻信號(hào)的設(shè)備,包括: 解復(fù)用單元,所述解復(fù)用單元接收位置信息、符號(hào)信息、碼本索引、歸一化平均值、歸一 化值索引、包絡(luò)參數(shù)索引W及平均能量; 形狀矢量重建單元,所述形狀矢量重建單元利用所述位置信息W及所述符號(hào)信息來獲 得對應(yīng)于所述碼本索引的形狀碼矢量; 歸一化值解碼單元,所述歸一化值解碼單元獲得對應(yīng)于所述歸一化值索引的歸一化值 差分碼矢量,并且通過將所述歸一化平均值加到所述歸一化值差分碼矢量來產(chǎn)生歸一化值 碼矢量;W及 第一合成單元,所述第一合成單元利用所述形狀碼矢量W及所述歸一化值碼矢量重建 第一合成信號(hào)。
9. 根據(jù)權(quán)利要求8所述的設(shè)備,進(jìn)一步包括: 殘差獲得單元,所述殘差獲得單元利用所述包絡(luò)參數(shù)索引w及所述平均能量產(chǎn)生第二 合成信號(hào)。
10. 根據(jù)權(quán)利要求9所述的設(shè)備,進(jìn)一步包括: 第二合成單元,所述第二合成單元利用第一合成信號(hào)W及第二合成信號(hào)重建譜系數(shù)。
11. 根據(jù)權(quán)利要求9所述的設(shè)備, 其中所述生成第二合成信號(hào)包括: 利用所述包絡(luò)參數(shù)索引W及所述平均能量重建包絡(luò)參數(shù);W及 通過將隨機(jī)信號(hào)乘W所述包絡(luò)參數(shù)產(chǎn)生所述第二合成信號(hào)。
12. 根據(jù)權(quán)利要求9所述的設(shè)備, 其中所述生成第二合成信號(hào)包括: 利用所述包絡(luò)參數(shù)索引W及所述平均能量重建包絡(luò)參數(shù); 利用常數(shù)值調(diào)節(jié)所述包絡(luò)參數(shù);W及 通過將隨機(jī)信號(hào)乘W所述調(diào)節(jié)的包絡(luò)參數(shù)產(chǎn)生所述第二合成信號(hào)。
13. 根據(jù)權(quán)利要求11所述的設(shè)備, 其中利用所述包絡(luò)參數(shù)索引W及所述平均能量重建包絡(luò)參數(shù)包括: 獲得對應(yīng)于所述包絡(luò)參數(shù)索引的去除平均值的分裂碼矢量; 組合所述獲得的分裂碼矢量;W及 將所述平均能量加到所述分裂碼矢量。
14. 根據(jù)權(quán)利要求8所述的設(shè)備, 其中利用碼本獲得所述歸一化值差分碼矢量。
【文檔編號(hào)】G10L19/02GK104347079SQ201410539250
【公開日】2015年2月11日 申請日期:2011年8月23日 優(yōu)先權(quán)日:2010年8月24日
【發(fā)明者】李昌憲, 丁奎赫, 金洛榕, 田惠晶, 李炳錫, 姜仁圭 申請人:Lg電子株式會(huì)社