專利名稱:編碼裝置、解碼裝置以及其方法
技術領域:
本發(fā)明涉及將信號編碼傳輸?shù)耐ㄐ畔到y(tǒng)中使用的編碼裝置、解碼裝置以及其方 法
背景技術:
在以因特網(wǎng)通信為代表的分組通信系統(tǒng)或移動通信系統(tǒng)等系統(tǒng)中,在傳輸語音/ 音樂信號時,為了提高語音/音樂信號的傳輸效率,通常使用壓縮/編碼技術。另外,近年 來,除了對語音/音樂信號單純地以低比特率進行編碼之外,對于將更寬帶的語音/音樂信 號進行編碼的技術的需求不斷提高。對于這種需求,開發(fā)了各種各樣的技術,以對寬帶的語音/音樂信號進行編碼也 不使編碼后的信息量大幅度增加。例如,在專利文獻1中,在變換一定時間的輸入音響信號 所得的頻譜數(shù)據(jù)中,生成頻率的高頻部分的特征作為輔助信息,并將其與低頻部分的編碼 信息一起輸出。具體而言,將頻率的高頻部分的頻譜數(shù)據(jù)分為多個組,并在各個組中,將確 定與該組的頻譜最近似的低頻部分的頻譜的信息作為輔助信息。另外,在專利文獻2中,舉 出了如下的技術,即將高頻信號分割為多個子帶,對每個所述子帶,判定子帶內的信號與 低頻信號的相似度,并根據(jù)該判定結果,變更輔助信息的結構(子帶內的振幅參數(shù)、相似的 低頻信號的位置參數(shù)、高頻/低頻間的殘差信號參數(shù))。專利文獻1 特開2003-140692號公報專利文獻2 特開2004-4530號公報
發(fā)明內容
發(fā)明需要解決的問題然而,在上述專利文獻1和專利文獻2中,為了生成高頻信號(高頻部分的頻譜數(shù) 據(jù)),對高頻信號的每個子帶(組),分別獨立地進行與高頻部分相似的低頻信號的判定,不 能說具有足夠的編碼效率。尤其是在以低比特率對輔助信息進行編碼時,使用計算出的輔 助信息生成的解碼語音的質量不充分,根據(jù)情況也有可能產生異常噪聲。本發(fā)明的目的在于,提供能夠基于寬帶信號的低頻部分的頻譜數(shù)據(jù),對高頻部分 的頻譜數(shù)據(jù)高效率地進行編碼,改善解碼信號的質量的編碼裝置、解碼裝置以及其方法。解決問題的方案本發(fā)明的編碼裝置所采用的結構包括第一編碼單元,對輸入信號的規(guī)定頻率以 下的低頻部分進行編碼而生成第一編碼信息;解碼單元,對所述第一編碼信息進行解碼而 生成解碼信號;以及第二編碼單元,將所述輸入信號的比所述規(guī)定頻率高的高頻部分分割 為多個子帶,從所述輸入信號或所述解碼信號,通過使用相鄰的子帶的估計結果估計所述 多個子帶的各個子帶而生成第二編碼信息。本發(fā)明的解碼裝置所采用的結構包括接收單元,接收由編碼裝置生成的第一編 碼信息和第二編碼信息,所述第一編碼信息是對輸入信號的規(guī)定頻率以下的低頻部分進行編碼而獲得的信息,所述第二編碼信息是將所述輸入信號的比所述規(guī)定頻率高的高頻部分 分割為多個子帶,從所述輸入信號、或者對所述第一編碼信息進行解碼而獲得的第一解碼 信號,使用相鄰的子帶的估計結果估計所述多個子帶的各個子帶而獲得的信息;第一解碼 單元,對所述第一編碼信息進行解碼而生成第二解碼信號;以及第二解碼單元,使用由采用 所述第二編碼信息獲得的、相鄰的子帶的解碼結果,從所述第二解碼信號估計所述輸入信 號的高頻部分,從而生成第三解碼信號。本發(fā) 明的編碼方法,包括以下步驟對輸入信號的規(guī)定頻率以下的低頻部分進行 編碼而生成第一編碼信息;對所述第一編碼信息進行解碼而生成解碼信號;以及將所述輸 入信號的比所述規(guī)定頻率高的高頻部分分割為多個子帶,并從所述輸入信號或者所述解碼 信號,使用相鄰的子帶的估計結果估計所述多個子帶的各個子帶,從而生成第二編碼信息。本發(fā)明的解碼方法,包括以下步驟接收由編碼裝置生成的第一編碼信息和第二 編碼信息,所述第一編碼信息是對輸入信號的規(guī)定頻率以下的低頻部分進行編碼而獲得的 信息,所述第二編碼信息是將所述輸入信號的比所述規(guī)定頻率高的高頻部分分割為多個子 帶,從所述輸入信號、或者對所述第一編碼信息進行解碼而獲得的第一解碼信號,使用相鄰 的子帶的估計結果估計所述多個子帶的各個子帶而獲得的信息;對所述第一編碼信息進行 解碼而生成第二解碼信號;以及使用由采用所述第二編碼信息獲得的、相鄰的子帶的解碼 結果,從所述第二解碼信號估計所述輸入信號的高頻部分,從而生成第三解碼信號。發(fā)明的效果根據(jù)本發(fā)明,在基于低頻部分的頻譜數(shù)據(jù)生成作為編碼對象的信號的高頻部分的 頻譜數(shù)據(jù)時,通過利用高頻的子帶間的相關,進行基于相鄰的子帶的編碼結果的編碼,能夠 對寬帶信號的高頻部分的頻譜數(shù)據(jù)高效率地進行編碼,能夠改善解碼信號的質量。
圖1是用于說明本發(fā)明的編碼中包含的搜索處理的概要的圖。圖2是表示具有本發(fā)明的實施方式1的編碼裝置和解碼裝置的通信系統(tǒng)的結構的 方框圖。圖3是表示圖2所示的編碼裝置的內部的主要結構的方框圖。圖4是表示圖3所示的第2層編碼單元的內部的主要結構的方框圖。圖5是用于說明圖4所示的濾波單元中的濾波處理的詳情的圖。圖6是表示在圖4所示的搜索單元中對子帶SBp搜索最佳基音系數(shù)Tp’的處理的 步驟的流程圖。圖7是表示圖2所示的解碼裝置的內部的主要結構的方框圖。圖8是表示圖7所示的第2層解碼單元的內部的主要結構的方框圖。圖9是表示本發(fā)明的實施方式2的編碼裝置的內部的主要結構的方框圖。圖10是表示本發(fā)明的實施方式2的解碼裝置的內部的主要結構的方框圖。圖11是表示本發(fā)明的實施方式3的編碼裝置的內部的主要結構的方框圖。圖12是表示圖11所示的第2層編碼單元的內部的主要結構的方框圖。圖13是表示本發(fā)明的實施方式3的解碼裝置的內部的主要結構的方框圖。圖14是表示圖13所示的第2層解碼單元的內部的主要結構的方框圖。
圖15是表示本發(fā)明的實施方式4的編碼裝置的內部的主要結構的方框圖。圖16是表示圖15所示的第1層編碼單元的內部的主要結構的方框圖。圖17是表示圖15所示的第2層編碼單元的內部的主要結構的方框圖。圖18是表示本發(fā)明的實施方式4的解碼裝置的內部的主要結構的方框圖。圖19是表示圖18所示的第1層解碼單元的內部的主要結構的方框圖。
圖20是表示圖18所示的第2層解碼單元的內部的主要結構的方框圖。圖21是表示本發(fā)明的實施方式5的第2層編碼單元的內部的主要結構的方框圖。圖22是表示本發(fā)明的實施方式6的第2層編碼單元的內部的主要結構的方框圖。圖23是表示本發(fā)明的實施方式6的第2層解碼單元的內部的主要結構的方框圖。
具體實施例方式以下,參照附圖詳細地說明本發(fā)明的實施方式。另外,作為本發(fā)明的編碼裝置和解 碼裝置,以語音編碼裝置和語音解碼裝置為例進行說明。首先,使用圖1說明本發(fā)明的編碼中包含的搜索處理的概要。圖1的(a)表示輸入 信號的頻譜,圖1的(b)表示對輸入信號的低頻部分的編碼數(shù)據(jù)進行解碼所得的頻譜(第 1層解碼頻譜)。另外,這里,舉例說明將電話頻帶(0 3. 4kHz)的信號頻帶擴展為寬帶 (0 7kHz)的信號的情況。也就是說,輸入信號的采樣頻率為16kHz,并且從低頻編碼單元 輸出的解碼信號的采樣頻率為8kHz。這里,在對輸入信號的高頻部分進行編碼時,將輸入信 號的頻譜的高頻部分分割為多個子帶(在圖1中為從1st到5th為止的五個子帶結構),對 每個子帶,搜索對于第1層解碼頻譜最近似高頻部分的頻譜的部分。在圖1中,第1搜索范圍和第2搜索范圍表示搜索分別與第1子帶(1st)和第2 子帶(2nd)相似的解碼低頻頻譜(后述的第1層解碼頻譜)的一部分(頻帶)的范圍。這 里,第1搜索范圍例如取Tmin (OkHz)到Tmax為止的范圍。頻率A表示通過搜索發(fā)現(xiàn)的與第 1子帶相似的解碼低頻頻譜的部分頻帶1st'的開始位置,頻率B表示頻帶1st'的末端部 分。接下來,在進行與第2子帶(2nd)對應的搜索時,利用搜索已經(jīng)結束的第1子帶(1st) 的搜索結果。具體而言,在與第1子帶(1st)最近似的部分1st'的末端部分附近的范圍、 即第2搜索范圍中,進行與第2子帶(2nd)近似的解碼低頻頻譜的部分頻帶的搜索。進行 了與第2子帶對應的搜索的結果,例如與第2子帶相似的解碼低頻頻譜的部分頻帶2nd'的 開始位置為C,末端部分為D。與第3子帶、第4子帶、第5子帶各自對應的搜索也同樣地使 用與相鄰的前一個子帶對應的搜索的結果進行。由此,能夠進行利用了子帶間的相關的高 效率的近似部分搜索,能夠提高高頻部分的頻譜的編碼性能。另外,在圖1中,舉例說明了 輸入信號的采樣頻率為16kHz的情況,但本發(fā)明并不限于此,也同樣地能夠適用于輸入信 號的采樣頻率為8kHz、或者32kHz等的情況。也就是說,本發(fā)明不受到輸入信號的采樣頻率 的限制。(實施方式1)圖2是表示具有本發(fā)明的實施方式1的編碼裝置和解碼裝置的通信系統(tǒng)的結構的 方框圖。在圖2中,通信系統(tǒng)包括編碼裝置和解碼裝置,它們處于各自經(jīng)由傳輸路徑而可通 信的狀態(tài)。另外,編碼裝置和解碼裝置通常都被安裝在基站裝置或者通信終端裝置等上使 用。
編碼裝置101對輸入信號進行每N樣本劃分(N為自然數(shù)),將N樣本作為一幀,
對每幀進行編碼。這里,假設將作為編碼的對象的輸入信號表示為Xn(n = 0.....Ν-1)。η
表示在被每N樣本劃分了的輸入信號中,第η+l信號要素。編碼后的輸入信息(編碼信息) 通過傳輸路徑102,被發(fā)送到解碼裝置103。解碼裝置103接收通過傳輸路徑102從編碼裝置101發(fā)送的編碼信息,將其解碼, 獲得輸出信號。圖3是表示圖2所示的編碼裝置101的內部的主要結構的方框圖。在將輸入信號 的采樣頻率設為SRinput時,下采樣處理單元201將輸入信號的采樣頻率從SRinput下采樣到 SRbase(SRbase < SRinput)為止,將進行了下采樣的輸入信號作為下采樣后輸入信號,輸出到第 1層編碼單元202。第1層編碼單元202對從下采樣處理單元201輸入的下采樣后輸入信號,例如使 用CELP(Code Excited Linear Prediction,碼激勵線性預測)方式的語音編碼方法進行編 碼而生成第1層編碼信息,并將生成的第1層編碼信息輸出到第1層解碼單元203和編碼 信息合并單元207。第1層解碼單元203對從第1層編碼單元202輸入的第1層編碼信息,例如使用 CELP方式的語音解碼方法進行解碼而生成第1層解碼信號,并將生成的第1層解碼信號輸 出到上采樣處理單元204。上采樣處理單元204將從第1層解碼單元203輸入的第1層解碼信號的采樣頻率 從SRbase上采樣到SRinput為止,并將進行了上采樣的第1層解碼信號作為上采樣后第1層解 碼信號,輸出到正交變換處理單元205。正交變換處理單元205在內部具有緩沖器Uifl1^P buf2n(n = 0.....N_l),對輸
入信號Xn和從上采樣處理單元204輸入的上采樣后第1層解碼信號yn進行改進離散余弦 變換(MDCT -Modified Discrete Cosine Transform)。接下來,說明正交變換處理單元205的正交變換處理的計算步驟和向內部緩沖器 的數(shù)據(jù)輸出。首先,正交變換處理單元205通過下式(1)和式(2),以“0”作為初始值分別將緩 沖器bufln和buf2n進行初始化。bufln = 0(n = 0, —, Ν-1)...(1)buf2n = 0(η = 0,…,Ν-1)... (2)接下來,正交變換處理單元205對輸入信號Xn和上采樣后第1層解碼信號yn,根據(jù) 下式(3)和式⑷進行MDCT處理,求輸入信號的MDCT系數(shù)(以下,稱為“輸入頻譜”)S2 (k) 和上采樣后第1層解碼信號In的MDCT系數(shù)(以下,稱為“第1層解碼頻譜” )Sl (k)。湖謂—嚴+ 1+,+ ]…⑶_)二|於>[(2” + 1+二燦 + 1)1 一,...," —D …⑷這里,k表示一幀中各個樣本的索引。正交變換處理單元205通過下式(5)求作 為使輸入信號Xn與緩沖器bunn結合的矢量的xn’。另外,正交變換處理單元205通過下式 (6)求作為使上采樣后第1層解碼信號In與緩沖器buf2n結合的矢量的yn’。
權利要求
編碼裝置,包括第一編碼單元,對輸入信號的規(guī)定頻率以下的低頻部分進行編碼而生成第一編碼信息;解碼單元,對所述第一編碼信息進行解碼而生成解碼信號;以及第二編碼單元,將所述輸入信號的比所述規(guī)定頻率高的高頻部分分割為多個子帶,從所述輸入信號或所述解碼信號,通過使用相鄰的子帶的估計結果估計所述多個子帶的各個子帶而生成第二編碼信息。
2.如權利要求1所述的編碼裝置, 所述第二編碼單元包括分割單元,將所述輸入信號的所述高頻部分分割為N個子帶,獲得所述N個子帶各自的 開始位置和帶寬作為頻帶分割信息,其中,N為大于1的整數(shù);濾波單元,對所述解碼信號進行濾波,生成從第一估計信號到第N估計信號為止的N個 第η估計信號,其中,η= 1,2,...,Ν;設定單元,使在所述濾波單元中使用的基音系數(shù)變化并進行設定; 搜索單元,從所述基音系數(shù)中,搜索使所述第η估計信號與第η子帶的相似程度為最大 的系數(shù)作為第η最佳基音系數(shù);以及復用單元,將從第一最佳基音系數(shù)到第N最佳基音系數(shù)為止的N個最佳基音系數(shù)與所 述頻帶分割信息進行復用而獲得所述第二編碼信息,所述設定單元使為了估計第一子帶而在所述濾波單元中使用的基音系數(shù),在規(guī)定的范 圍中變化并進行設定,使為了估計第二子帶之后的第m子帶而在所述濾波單元中使用的基 音系數(shù),在與第m-1最佳基音系數(shù)對應的范圍、或者所述規(guī)定的范圍中變化并進行設定,其 中,m = 2,3, . . . , N。
3.如權利要求2所述的編碼裝置,所述設定單元將包含所述第m-1最佳基音系數(shù)的規(guī)定寬度的范圍作為與所述第m-1最 佳基音系數(shù)對應的范圍設定所述基音系數(shù)。
4.如權利要求2所述的編碼裝置,所述設定單元將包含所述第m-1子帶的帶寬和所述第m-1最佳基音系數(shù)相加所得的基 音系數(shù)的規(guī)定寬度的范圍作為與所述第m-1最佳基音系數(shù)對應的范圍設定所述基音系數(shù)。
5.如權利要求2所述的編碼裝置,所述設定單元使為了估計所述第二子帶之后的所有的第m子帶的各個子帶而在所述 濾波單元中使用的基音系數(shù),在與所述第m-1最佳基音系數(shù)對應的范圍中變化并進行設定。
6.如權利要求2所述的編碼裝置,所述設定單元使為了估計所述第二子帶之后的第m子帶中每隔規(guī)定數(shù)的第m子帶而在 所述濾波單元中使用的基音系數(shù),在所述規(guī)定的范圍中變化并進行設定,使為了估計除此 之外的第m子帶而在所述濾波單元中使用的基音系數(shù),在與所述第m-1最佳基音系數(shù)對應 的范圍中變化并進行設定。
7.如權利要求2所述的編碼裝置,所述設定單元在所述多個子帶中高頻的子帶越高,將所述解碼信號的越低的頻帶作為所述規(guī)定的范圍設定所述基音系數(shù)。
8.如權利要求2所述的編碼裝置,所述設定單元在所述多個子帶中高頻的子帶越高,將所述解碼信號的越高的頻帶作為 所述規(guī)定的范圍設定所述基音系數(shù)。
9.如權利要求2所述的編碼裝置,還包括判定單元,計算所述第m子帶與第m-1子帶之間的相關作為第m相關,判定N-I個所述 第m相關的各個相關是否為規(guī)定級別以上,所述設定單元使為了估計在所述判定單元中所述第m相關被判定為規(guī)定級別以上的 所述第m子帶而在所述濾波單元中使用的所述基音系數(shù),在與所述第m-1最佳基音系數(shù)對 應的范圍中變化并進行設定,使為了估計在所述判定單元中所述第m相關被判定為比規(guī)定級別低的所述第m子帶而 在所述濾 波單元中使用的所述基音系數(shù),在所述規(guī)定的范圍中變化并進行設定。
10.如權利要求2所述的編碼裝置,還包括判定單元,計算所述第m子帶與所述第m-1子帶之間的相關作為第m相關,判定N-I個 所述第m相關中規(guī)定級別以上的所述第m相關的數(shù)是否為規(guī)定數(shù)以上,所述設定單元在由所述判定單元判定出所述規(guī)定級別以上的所述第m相關的數(shù)為規(guī) 定數(shù)以上時,使為了估計所述第二子帶之后的所有的所述第m子帶的各個子帶而在所述濾 波單元中使用的所述基音系數(shù),在與所述第m-1最佳基音系數(shù)對應的范圍中變化并進行設 定,在由所述判定單元判定出所述規(guī)定級別以上的所述第m相關的數(shù)比規(guī)定數(shù)小時,使為 了估計所述第二子帶之后的所有的所述第m子帶的各個子帶而在所述濾波單元中使用的 所述基音系數(shù),在所述規(guī)定的范圍中變化并進行設定。
11.如權利要求9所述的編碼裝置,所述判定單元計算所述N個子帶各自的頻譜平坦度測量,并計算所述第m子帶與所述 第m-1子帶的頻譜平坦度測量之差或者之比的絕對值的倒數(shù)作為所述第m相關。
12.如權利要求9所述的編碼裝置,所述判定單元計算所述N個子帶各自的能量,并計算所述第m子帶與所述第m-1子帶 的所述能量之差或者之比的絕對值的倒數(shù)作為所述第m相關。
13.如權利要求2所述的編碼裝置,所述設定單元將所述m-1最佳基音系數(shù)的值與預先設定的閾值比較,并根據(jù)比較結 果,增加或者減少搜索為了估計所述第m子帶而在所述濾波單元中使用的基音系數(shù)時的搜 索項數(shù)。
14.如權利要求2所述的編碼裝置,所述設定單元將所述第m-1最佳基音系數(shù)的值與預先設定的閾值比較,并根據(jù)比較結 果,切換為了估計所述第m子帶而在所述濾波單元中使用的基音系數(shù)的設定方法。
15.如權利要求14所述的編碼裝置,所述設定單元切換使基音系數(shù)在所述規(guī)定的范圍中變化并進行設定的方法和使基音 系數(shù)在與所述第m-1最佳基音系數(shù)對應的范圍中變化并進行設定的方法。
16.通信終端裝置,具有權利要求1所述的編碼裝置。
17.基站裝置,具有權利要求1所述的編碼裝置。
18.解碼裝置,包括 接收單元,接收由編碼裝置生成的第一編碼信息和第二編碼信息,所述第一編碼信息 是對輸入信號的規(guī)定頻率以下的低頻部分進行編碼而獲得的信息,所述第二編碼信息是將 所述輸入信號的比所述規(guī)定頻率高的高頻部分分割為多個子帶,從所述輸入信號、或者對 所述第一編碼信息進行解碼而獲得的第一解碼信號,使用相鄰的子帶的估計結果估計所述 多個子帶的各個子帶而獲得的信息;第一解碼單元,對所述第一編碼信息進行解碼而生成第二解碼信號;以及第二解碼單元,使用由采用所述第二編碼信息獲得的、相鄰的子帶的解碼結果,從所述 第二解碼信號估計所述輸入信號的高頻部分,從而生成第三解碼信號。
19.通信終端裝置,具有權利要求18所述的解碼裝置。
20.基站裝置,具有權利要求18所述的解碼裝置。
21.編碼方法,包括以下步驟對輸入信號的規(guī)定頻率以下的低頻部分進行編碼而生成第一編碼信息;對所述第一編碼信息進行解碼而生成解碼信號;以及將所述輸入信號的比所述規(guī)定頻率高的高頻部分分割為多個子帶,并從所述輸入信號 或者所述解碼信號,使用相鄰的子帶的估計結果估計所述多個子帶的各個子帶,從而生成 第二編碼信息。
22.解碼方法,包括以下步驟接收由編碼裝置生成的第一編碼信息和第二編碼信息,所述第一編碼信息是對輸入信 號的規(guī)定頻率以下的低頻部分進行編碼而獲得的信息,所述第二編碼信息是將所述輸入信 號的比所述規(guī)定頻率高的高頻部分分割為多個子帶,從所述輸入信號、或者對所述第一編 碼信息進行解碼而獲得的第一解碼信號,使用相鄰的子帶的估計結果估計所述多個子帶的 各個子帶而獲得的信息;對所述第一編碼信息進行解碼而生成第二解碼信號;以及使用由采用所述第二編碼信息獲得的、相鄰的子帶的解碼結果,從所述第二解碼信號 估計所述輸入信號的高頻部分,從而生成第三解碼信號。
全文摘要
在從解碼信號的低頻估計高頻的頻帶擴展中提高解碼信號的質量。第1層編碼單元(202)對輸入信號的規(guī)定頻率以下的低頻部分進行編碼而生成第1層編碼信息,第1層解碼單元(203)對第1層編碼信息進行解碼而生成第1層解碼信號,第2層編碼單元(206)將輸入信號的比規(guī)定頻率高的高頻部分分割為多個子帶,使用與低頻側相鄰的子帶的估計結果,從輸入信號或者第1層解碼信號估計多個子帶的各個子帶,并生成包含該多個子帶的估計結果的第2編碼信息。
文檔編號G10L21/04GK101971253SQ200980108430
公開日2011年2月9日 申請日期2009年3月13日 優(yōu)先權日2008年3月14日
發(fā)明者山梨智史, 押切正浩 申請人:松下電器產業(yè)株式會社