語(yǔ)音編碼裝置、解碼裝置和語(yǔ)音編碼方法、解碼方法

文檔序號(hào)：2836120閱讀：173來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂(lè)器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：語(yǔ)音編碼裝置、解碼裝置和語(yǔ)音編碼方法、解碼方法
技術(shù)領(lǐng)域：
本發(fā)明涉及可擴(kuò)展編碼方式的通信系統(tǒng)所使用的編碼裝置、解碼裝置以及其方法。
背景技術(shù)：
在移動(dòng)通信系統(tǒng)中，為了有效利用電波資源，要求將語(yǔ)音信號(hào)壓縮為低比特率后傳輸。另一方面，希望提高通話語(yǔ)音的質(zhì)量和實(shí)現(xiàn)富有現(xiàn)場(chǎng)感的通話業(yè)務(wù)，為實(shí)現(xiàn)此目的，不僅是語(yǔ)音信號(hào)的高質(zhì)量，而且也希望高質(zhì)量地對(duì)頻帶更寬的音頻信號(hào)等語(yǔ)音信號(hào)以外的信號(hào)進(jìn)行編碼。對(duì)于這樣兩個(gè)相對(duì)立的要求，分層地結(jié)合多個(gè)編碼技術(shù)的技術(shù)備受矚目。該技術(shù)為分層地組合第一層和第二層，所述第一層為通過(guò)適合于語(yǔ)音信號(hào)的模式以低比特率對(duì)輸入信號(hào)進(jìn)行編碼，所述第二層為通過(guò)適合于語(yǔ)音以外的信號(hào)的模式對(duì)輸入信號(hào)與第一層的解碼信號(hào)之間的差分信號(hào)進(jìn)行編碼。從編碼裝置獲得的比特流具有可擴(kuò)展性，即，即使從比特流的一部分的信息中也可獲得解碼信號(hào)的性質(zhì)，所以一般將這樣分層地進(jìn)行編碼的技術(shù)稱為可擴(kuò)展編碼(分層編碼)。對(duì)可擴(kuò)展編碼方式而言，根據(jù)其性質(zhì)，能夠靈活地對(duì)應(yīng)比特率不同的網(wǎng)絡(luò)間的通信，所以也可以說(shuō)其適合于以IP協(xié)議逐步結(jié)合多樣的網(wǎng)絡(luò)的、今后的網(wǎng)絡(luò)環(huán)境。作為使用基于 MPEG-4 (Moving Picture Experts Group phase-4 運(yùn)動(dòng)圖像專家組階段4)標(biāo)準(zhǔn)化的技術(shù)來(lái)實(shí)現(xiàn)可擴(kuò)展編碼的例子，例如有非專利文獻(xiàn)1公開(kāi)的技術(shù)。該技術(shù)是，在第一層中使用適合于語(yǔ)音信號(hào)的CELP (Code Excited Linear Prediction 碼激勵(lì)線性預(yù)測(cè))編碼，在第二層中，對(duì)從原信號(hào)中減去第一層解碼信號(hào)所得的殘差信號(hào)，使 M AAC(Advanced Audio Coder) ^ TwinVQ(Transform Domain Weighted Interleave Vector Quantization ；頻域加權(quán)交織矢量量化)等變換編碼。另一方面，非專利文獻(xiàn)2分開(kāi)了下述方法，即，使用模塊化的TwinVQ作為基本構(gòu)成單位,對(duì)所期望的頻帶的MDCT (Modified discrete cosine transform 改進(jìn)離散余弦變換)系數(shù)分層地進(jìn)行編碼。將該模塊共用化而多次使用，從而能夠?qū)崿F(xiàn)簡(jiǎn)單且自由性較高的可擴(kuò)展編碼。在該方法中，雖然基本采用預(yù)先規(guī)定作為各分層(layer)的編碼對(duì)象的子帶的結(jié)構(gòu)，但也公開(kāi)了下述結(jié)構(gòu)，即，根據(jù)輸入信號(hào)的性質(zhì)，在預(yù)先規(guī)定的頻帶中使作為各分層的編碼對(duì)象的子帶的位置變動(dòng)。非專利文獻(xiàn)1 三木弼一編著、「MPEG-4 ^ t^r」、初版、(株)工業(yè)調(diào)查會(huì)、1998 年 9 月 30 日、p. 126-127非專利文獻(xiàn)2:神明夫他、「階層的變換符號(hào)化基本 J ο t構(gòu)成 Λ —巧夂 > 楽音符號(hào)化」、電子情報(bào)通信學(xué)會(huì)論文誌Α，Vol. J83-A, No. 3，pp. 241-252，2000年3月非專利文獻(xiàn)3:"AMR Wideband Speech Codec ；Transcoding functions，，，3GPP TS 26. 190, March 2001# 專禾Ij JC ^ 4 :"Source-Controlled-Variable-Rate Multimode Wideband Speech Codec (VMR-ffB), Service options 62 and 63 for Spread Spectrum Systems，，， 3GPP2 C. S0052-A, April 2005非專利文獻(xiàn)5:“匕。？子7 4卟夕〗J >夕’tc J易帯域拡張技術(shù)全用…tz 7/10/15kHz帶域HW >音聲符號(hào)化方式”，音講論集3-11-4，pp. 327-328，March 200
發(fā)明內(nèi)容
本發(fā)明需要解決的問(wèn)題但是，關(guān)鍵是在改善輸出信號(hào)的語(yǔ)音質(zhì)量后，如何設(shè)定第二層編碼單元的子帶 (目標(biāo)頻帶)。根據(jù)非專利文獻(xiàn)2公開(kāi)的方法，預(yù)先決定作為第二層的編碼對(duì)象的子帶(圖 1A)。此時(shí)存在下述問(wèn)題，由于總是提高規(guī)定的子帶的質(zhì)量，從而在誤差分量集中在該子帶以外的頻帶時(shí)無(wú)法獲得充分的語(yǔ)音質(zhì)量的改善效果。另外，記載有下述技術(shù)，根據(jù)輸入信號(hào)的性質(zhì)，在預(yù)先決定的頻帶中使作為各分層的編碼對(duì)象的子帶的位置變動(dòng)(圖1B)，但是將子帶的可采用的位置限定在規(guī)定的頻帶中，所以并沒(méi)有解決上述的問(wèn)題。而且，假設(shè)使子帶的可采用的頻帶為輸入信號(hào)的全頻帶的情況下，也存在用于確定子帶的位置的運(yùn)算量增加的問(wèn)題。另外，在增加了層數(shù)時(shí)，由于需要對(duì)每層確定子帶的位置，該問(wèn)題更加明顯。本發(fā)明的目的在于，提供能夠在可擴(kuò)展編碼方式中，以較少的運(yùn)算量從全頻帶中正確地確定誤差較大的頻帶的編碼裝置、解碼裝置以及其方法。解決問(wèn)題的方案本發(fā)明的編碼裝置采用的結(jié)構(gòu)，包括第一層編碼單元，對(duì)輸入變換系數(shù)進(jìn)行編碼處理，生成第一層編碼數(shù)據(jù)；第一層解碼單元，使用所述第一層編碼數(shù)據(jù)進(jìn)行解碼處理，生成第一層解碼變換系數(shù)；以及第二層編碼單元，對(duì)作為所述輸入變換系數(shù)與所述第一層解碼變換系數(shù)之間的誤差的第一層誤差變換系數(shù)中、所述誤差最大的目標(biāo)頻帶部分進(jìn)行編碼處理，從而生成第二層編碼數(shù)據(jù)，所述第二層編碼單元包括第一位置確定單元，在全頻帶中，以規(guī)定的第一步長(zhǎng)搜索具有比所述目標(biāo)頻帶寬的帶寬且所述誤差最大的第一頻帶，并生成表示了確定的第一頻帶的第一位置信息；第二位置確定單元，在所述第一頻帶中，以比所述第一步長(zhǎng)短的第二步長(zhǎng)搜索所述目標(biāo)頻帶，并生成表示了確定的目標(biāo)頻帶的第二位置信息；以及編碼單元，對(duì)根據(jù)所述第一位置信息和所述第二位置信息確定的目標(biāo)頻帶所包含的所述第一層誤差變換系數(shù)進(jìn)行編碼而生成編碼信息。本發(fā)明的解碼裝置采用的結(jié)構(gòu)，包括接收單元，接收第一層編碼數(shù)據(jù)、第二層編碼數(shù)據(jù)、第一位置信息以及第二位置信息，該第一層編碼數(shù)據(jù)為對(duì)輸入變換系數(shù)進(jìn)行編碼處理而獲得的數(shù)據(jù)，該第二層編碼數(shù)據(jù)為在對(duì)作為將所述第一層編碼數(shù)據(jù)解碼而獲得的第一層解碼變換系數(shù)與所述輸入變換系數(shù)之間的誤差的第一層誤差變換系數(shù)中，對(duì)所述誤差最大的目標(biāo)頻帶部分進(jìn)行編碼處理而獲得的數(shù)據(jù)，該第一位置信息表示具有比所述目標(biāo)頻帶寬的帶寬且所述誤差最大的第一頻帶，該第二位置信息表示所述第一頻帶中的所述目標(biāo)頻帶；第一層解碼單元，對(duì)所述第一層編碼數(shù)據(jù)進(jìn)行解碼而生成第一層解碼變換系數(shù)；第二層解碼單元，根據(jù)所述第一位置信息和所述第二位置信息確定所述目標(biāo)頻帶，并對(duì)所述第二層編碼數(shù)據(jù)進(jìn)行解碼而生成第一層解碼誤差變換系數(shù)；以及加法單元，將所述第一層解碼變換系數(shù)與所述第一層解碼誤差變換系數(shù)相加而生成第二層解碼變換系數(shù)。本發(fā)明的編碼方法采用的方法，包括第一層編碼步驟，對(duì)輸入變換系數(shù)進(jìn)行編碼處理，生成第一層編碼數(shù)據(jù)；第一層解碼步驟，使用所述第一層編碼數(shù)據(jù)進(jìn)行解碼處理，生成第一層解碼變換系數(shù)；以及第二層編碼步驟，對(duì)作為所述輸入變換系數(shù)與所述第一層解碼變換系數(shù)之間的誤差的第一層誤差變換系數(shù)中、所述誤差最大的目標(biāo)頻帶部分進(jìn)行編碼處理，生成第二層編碼數(shù)據(jù)，所述第二層編碼步驟包括第一位置確定步驟，在全頻帶中，以規(guī)定的第一步長(zhǎng)搜索具有比所述目標(biāo)頻帶寬的帶寬且所述誤差最大的第一頻帶，并生成表示了確定的第一頻帶的第一位置信息；第二位置確定步驟，在所述第一頻帶中，以比所述第一步長(zhǎng)短的第二步長(zhǎng)搜索所述目標(biāo)頻帶，并生成表示了確定的目標(biāo)頻帶的第二位置信息；以及編碼步驟，對(duì)根據(jù)所述第一位置信息和所述第二位置信息確定的目標(biāo)頻帶所包含的所述第一層誤差變換系數(shù)進(jìn)行編碼而生成編碼信息。本發(fā)明的解碼方法采用的方法，包括接收步驟，接收第一層編碼數(shù)據(jù)、第二層編碼數(shù)據(jù)、第一位置信息以及第二位置信息，該第一層編碼數(shù)據(jù)為對(duì)輸入變換系數(shù)進(jìn)行編碼處理而獲得的數(shù)據(jù)，該第二層編碼數(shù)據(jù)為在對(duì)作為將所述第一層編碼數(shù)據(jù)解碼而獲得的第一層解碼變換系數(shù)與所述輸入變換系數(shù)之間的誤差的第一層誤差變換系數(shù)中，對(duì)所述誤差最大的目標(biāo)頻帶部分進(jìn)行編碼處理而獲得的數(shù)據(jù)，該第一位置信息表示具有比所述目標(biāo)頻帶寬的帶寬且所述誤差最大的第一頻帶，該第二位置信息表示所述第一頻帶中的所述目標(biāo)頻帶；第一層解碼步驟，對(duì)所述第一層編碼數(shù)據(jù)進(jìn)行解碼而生成第一層解碼變換系數(shù)；第二層解碼步驟，根據(jù)所述第一位置信息和所述第二位置信息確定所述目標(biāo)頻帶，并對(duì)所述第二層編碼數(shù)據(jù)進(jìn)行解碼而生成第一層解碼誤差變換系數(shù)；以及相加步驟，將所述第一層解碼變換系數(shù)與所述第一層解碼誤差變換系數(shù)相加而生成第二層解碼變換系數(shù)。本發(fā)明還提供一種語(yǔ)音編碼裝置，包括第一層編碼單元，對(duì)輸入語(yǔ)音信號(hào)進(jìn)行編碼處理，生成第一層編碼數(shù)據(jù)；第一層解碼單元，使用所述第一層編碼數(shù)據(jù)進(jìn)行解碼處理，生成第一層解碼信號(hào)；第一層誤差變換系數(shù)計(jì)算單元，將作為所述輸入語(yǔ)音信號(hào)和所述第一層解碼信號(hào)的誤差的第一層誤差信號(hào)變換為頻域而計(jì)算第一層誤差變換系數(shù)；以及第二層編碼單元，對(duì)所述第一層誤差變換系數(shù)進(jìn)行編碼處理，生成第二層編碼數(shù)據(jù)，所述第二層編碼單元包括頻帶選擇單元，從具有規(guī)定的帶寬并以比所述帶寬窄的步長(zhǎng)排列的多個(gè)頻帶候補(bǔ)中，基于所述頻帶候補(bǔ)中的所述第一層誤差變換系數(shù)的能量的大小選擇第一頻帶，并生成表示了選擇的第一頻帶的位置的第一位置信息；脈沖位置確定單元，在所述選擇出的第一頻帶中，在以比所述步長(zhǎng)短的步長(zhǎng)設(shè)定了的脈沖候補(bǔ)位置中確定多個(gè)脈沖的位置，生成表示了確定的多個(gè)脈沖的位置的第二位置信息；以及編碼數(shù)據(jù)生成單元，使用所述第一位置信息和所述第二位置信息，生成所述第二層編碼數(shù)據(jù)。本發(fā)明還提供一種語(yǔ)音解碼裝置，包括接收單元，接收第一層編碼數(shù)據(jù)和第二層編碼數(shù)據(jù)，所述第一層編碼數(shù)據(jù)是在語(yǔ)音編碼裝置中對(duì)輸入語(yǔ)音信號(hào)進(jìn)行編碼處理而得到的編碼數(shù)據(jù)，所述第二層編碼數(shù)據(jù)是在所述語(yǔ)音編碼裝置中將作為對(duì)所述第一層編碼數(shù)據(jù)進(jìn)行解碼所得的第一層解碼信號(hào)和所述輸入語(yǔ)音信號(hào)的誤差的第一層誤差信號(hào)變換為頻域而計(jì)算第一層誤差變換系數(shù)，對(duì)該第一層誤差變換系數(shù)進(jìn)行編碼處理而得到的編碼數(shù)據(jù)；第一層解碼單元，對(duì)所述第一層編碼數(shù)據(jù)進(jìn)行解碼，生成第一層解碼信號(hào)；第二層解碼單元，對(duì)所述第二層編碼數(shù)據(jù)進(jìn)行解碼，生成第一層解碼誤差變換系數(shù)；時(shí)域變換單元，將所述第一層解碼誤差變換系數(shù)變換為時(shí)域而生成第一層解碼誤差信號(hào)；以及加法單元，將所述第一層解碼信號(hào)和所述第一層解碼誤差信號(hào)相加而生成解碼信號(hào)，所述第二層解碼單元對(duì)所述第二層編碼數(shù)據(jù)進(jìn)行解碼，生成表示了具有規(guī)定帶寬的第一頻帶的位置的第一位置信息以及表示了所述第一頻帶中多個(gè)脈沖的位置的第二位置信息，以及使用所述第一位置信息和所述第二位置信息，確定所述多個(gè)脈沖的位置而生成所述第一層解碼誤差變換系數(shù)。本發(fā)明還提供一種語(yǔ)音編碼方法，包括第一層編碼步驟，對(duì)輸入語(yǔ)音信號(hào)進(jìn)行編碼處理，生成第一層編碼數(shù)據(jù)；第一層解碼步驟，使用所述第一層編碼數(shù)據(jù)進(jìn)行解碼處理，生成第一層解碼信號(hào)；第一層誤差變換系數(shù)計(jì)算步驟，將作為所述輸入語(yǔ)音信號(hào)和所述第一層解碼信號(hào)的誤差的第一層誤差信號(hào)變換為頻域而計(jì)算第一層誤差變換系數(shù)；以及第二層編碼步驟，對(duì)所述第一層誤差變換系數(shù)進(jìn)行編碼處理，生成第二層編碼數(shù)據(jù)，所述第二層編碼步驟包括頻帶選擇步驟，從具有規(guī)定的帶寬并以比所述帶寬窄的步長(zhǎng)排列的多個(gè)頻帶候補(bǔ)中，基于所述頻帶候補(bǔ)中的所述第一層誤差變換系數(shù)的能量的大小選擇第一頻帶，并生成表示了選擇的第一頻帶的位置的第一位置信息；脈沖位置確定步驟，在所述選擇出的第一頻帶中，在以比所述步長(zhǎng)短的步長(zhǎng)設(shè)定了的脈沖候補(bǔ)位置中確定多個(gè)脈沖的位置，生成表示了確定的多個(gè)脈沖的位置的第二位置信息；以及編碼數(shù)據(jù)生成步驟，使用所述第一位置信息和所述第二位置信息，生成所述第二層編碼數(shù)據(jù)。本發(fā)明還提供一種語(yǔ)音解碼方法，包括
接收步驟，接收第一層編碼數(shù)據(jù)和第二層編碼數(shù)據(jù)，所述第一層編碼數(shù)據(jù)是在語(yǔ)音編碼方法中對(duì)輸入語(yǔ)音信號(hào)進(jìn)行編碼處理而得到的編碼數(shù)據(jù)，所述第二層編碼數(shù)據(jù)是在所述語(yǔ)音編碼方法中將作為對(duì)所述第一層編碼數(shù)據(jù)進(jìn)行解碼所得的第一層解碼信號(hào)和所述輸入語(yǔ)音信號(hào)的誤差的第一層誤差信號(hào)變換為頻域而計(jì)算第一層誤差變換系數(shù)，對(duì)該第一層誤差變換系數(shù)進(jìn)行編碼處理而得到的編碼數(shù)據(jù)；第一層解碼步驟，對(duì)所述第一層編碼數(shù)據(jù)進(jìn)行解碼，生成第一層解碼信號(hào)；第二層解碼步驟，對(duì)所述第二層編碼數(shù)據(jù)進(jìn)行解碼，生成第一層解碼誤差變換系數(shù)；時(shí)域變換步驟，將所述第一層解碼誤差變換系數(shù)變換為時(shí)域而生成第一層解碼誤差信號(hào)；以及加法步驟，將所述第一層解碼信號(hào)和所述第一層解碼誤差信號(hào)相加而生成解碼信號(hào)，在所述第二層解碼步驟對(duì)所述第二層編碼數(shù)據(jù)進(jìn)行解碼，生成表示了具有規(guī)定帶寬的第一頻帶的位置的第一位置信息以及表示了所述第一頻帶中多個(gè)脈沖的位置的第二位置信息，以及使用所述第一位置信息和所述第二位置信息，確定所述多個(gè)脈沖的位置而生成所述第一層解碼誤差變換系數(shù)。發(fā)明的效果根據(jù)本發(fā)明，通過(guò)第一位置確定單元，在輸入信號(hào)的全頻帶中，以相對(duì)較寬的帶寬和相對(duì)較長(zhǎng)的步長(zhǎng)(step size)，搜索并確定誤差較大的頻帶，第二位置確定單元在由第一位置確定單元所確定的頻帶中，以相對(duì)較窄的帶寬和相對(duì)較短的步長(zhǎng)，搜索并確定目標(biāo)頻帶(誤差最大的頻帶)，從而能夠以較少的運(yùn)算量從全頻帶中正確地確定誤差較大的頻帶，改善音質(zhì)。

圖IA 圖IC是表示以往的語(yǔ)音編碼裝置的第二層編碼單元的編碼頻帶的圖。圖2是表示本發(fā)明實(shí)施方式1的編碼裝置的主要結(jié)構(gòu)的方框圖。圖3是表示圖2所示的第二層編碼單元的結(jié)構(gòu)的方框圖。圖4是表示圖3所示的第一位置確定單元確定的頻帶的位置的圖。圖5是表示圖3所示的第一位置確定單元確定的頻帶的其他位置的圖。圖6是表示圖3所示的第二位置確定單元確定的目標(biāo)頻帶的位置的圖。圖7是表示圖3所示的編碼單元的結(jié)構(gòu)的方框圖。圖8是表示本發(fā)明實(shí)施方式1的解碼裝置的主要結(jié)構(gòu)的方框圖。圖9是表示圖8所示的第二層解碼單元的結(jié)構(gòu)的方框圖。圖10是表示從圖9所示的配置單元輸出的第一層解碼誤差變換系數(shù)的情形的圖。圖11是表示圖3所示的第二位置確定單元確定的目標(biāo)頻率的位置的圖。圖12是表示圖7所示的編碼單元的另外的形態(tài)的結(jié)構(gòu)的方框圖。圖13是表示圖9所示的第二層解碼單元的另外的形態(tài)的結(jié)構(gòu)的方框圖。圖14是表示本發(fā)明實(shí)施方式3的編碼裝置的第二層編碼單元的結(jié)構(gòu)的方框圖。
圖15A 圖15C是表示實(shí)施方式3的編碼裝置的多個(gè)子位置確定單元確定的目標(biāo)頻率的位置的圖。圖16是表示本發(fā)明實(shí)施方式4的編碼裝置的第二層編碼單元的結(jié)構(gòu)的方框圖。圖17是表示圖16所示的編碼單元的結(jié)構(gòu)的方框圖。圖18是表示圖17的第二位置信息碼本中存儲(chǔ)的各個(gè)第二位置信息候補(bǔ)具有三個(gè)目標(biāo)頻率時(shí)的編碼單元的圖。圖19是表示圖16所示的編碼單元的另外的結(jié)構(gòu)的方框圖。圖20是表示本發(fā)明實(shí)施方式5的第二層編碼單元的結(jié)構(gòu)的方框圖。圖21是表示圖20所示的第一位置確定單元確定的頻帶的位置的圖。圖22是表示實(shí)施方式6的編碼裝置的主要結(jié)構(gòu)的方框圖。圖23是表示圖22所示的編碼裝置的第一層編碼單元的結(jié)構(gòu)的方框圖。圖24是表示圖22所示的編碼裝置的第一層解碼單元的結(jié)構(gòu)的方框圖。圖25是表示對(duì)應(yīng)于圖22所示的編碼裝置的解碼裝置的主要結(jié)構(gòu)的方框圖。圖26是表示實(shí)施方式7的編碼裝置的主要結(jié)構(gòu)的方框圖。圖27是表示對(duì)應(yīng)于圖26所示的編碼裝置的解碼裝置的主要結(jié)構(gòu)的方框圖。圖28是表示實(shí)施方式7的其他形態(tài)的編碼裝置的主要結(jié)構(gòu)的方框圖。圖29A是表示圖28所示的第二層編碼單元中的頻帶的位置的圖。圖29B是表示圖28所示的第三層編碼單元中的頻帶的位置的圖。圖29C是表示圖28所示的第四層編碼單元中的頻帶的位置的圖。圖30是表示對(duì)應(yīng)于圖28所示的編碼裝置的解碼裝置的主要結(jié)構(gòu)的方框圖。圖31A是表示圖28所示的第二層編碼單元中的頻帶的其他位置的圖。圖31B是表示圖28所示的第三層編碼單元中的頻帶的其他位置的圖。圖31C是表示圖28所示的第四層編碼單元中的頻帶的其他位置的圖。圖32是用來(lái)說(shuō)明實(shí)施方式8的第一位置確定單元的動(dòng)作的圖。圖33是表示實(shí)施方式8的第一位置確定單元的結(jié)構(gòu)的方框圖。圖34是例示實(shí)施方式8的第一位置信息構(gòu)成單元中構(gòu)成第一位置信息的情形的圖。圖35是用于說(shuō)明實(shí)施方式8的解碼處理的圖。圖36是用于說(shuō)明實(shí)施方式8的變形(variation)的圖。圖37是用于說(shuō)明實(shí)施方式8的變形的圖。
具體實(shí)施例方式下面，參照附圖詳細(xì)地說(shuō)明本發(fā)明的實(shí)施方式。(實(shí)施方式1)圖2是表示本發(fā)明實(shí)施方式1的編碼裝置的主要結(jié)構(gòu)的方框圖。圖2所示的編碼裝置100包括頻域變換單元101、第一層編碼單元102、第一層解碼單元103、減法單元 104、第二層編碼單元105以及復(fù)用單元106。頻域變換單元101將時(shí)域的輸入信號(hào)變換為頻域的信號(hào)(輸入變換系數(shù))，并將輸入變換系數(shù)輸出到第一層編碼單元102。
第一層編碼單元102對(duì)輸入變換系數(shù)進(jìn)行編碼處理，生成第一層編碼數(shù)據(jù)，并將該第一層編碼數(shù)據(jù)輸出到第一層解碼單元103和復(fù)用單元106。第一層解碼單元103使用第一層編碼數(shù)據(jù)進(jìn)行解碼處理，生成第一層解碼變換系數(shù)，并將其輸出到減法單元104。減法單元104從輸入變換系數(shù)中減去由第一層解碼單元103生成的第一層解碼變換系數(shù)而生成第一層誤差變換系數(shù)，并將該第一層誤差變換系數(shù)輸出到第二層編碼單元 105。第二層編碼單元105對(duì)減法單元104輸出的第一層誤差變換系數(shù)進(jìn)行編碼處理，生成第二層編碼數(shù)據(jù)，并將該第二層編碼數(shù)據(jù)輸出到復(fù)用單元106。復(fù)用單元106將由第一層編碼單元102求得的第一層編碼數(shù)據(jù)與由第二層編碼單元105求得的第二層編碼數(shù)據(jù)進(jìn)行復(fù)用而形成比特流，并將其作為最終的編碼數(shù)據(jù)輸出到通信路徑。圖3是表示圖2所示的第二層編碼單元105的結(jié)構(gòu)的方框圖。圖3所示的第二層編碼單元105包括第一位置確定單元201、第二位置確定單元202、編碼單元203以及復(fù)用單元204。第一位置確定單元201使用從減法單元104輸入的第一層誤差變換系數(shù)，以規(guī)定的帶寬和規(guī)定的步長(zhǎng)搜索作為編碼對(duì)象的頻帶可采用的頻帶，將表示確定了的頻帶的信息作為第一位置信息輸出到第二位置確定單元202、編碼單元203以及復(fù)用單元204。另外，在后面敘述第一位置確定單元201的細(xì)節(jié)。另外，該確定了的頻帶也可以稱為“范圍”或“區(qū)域”。第二位置確定單元202在由第一位置確定單元201確定的頻帶中，以比第一位置確定單元201中的帶寬窄的帶寬和比第一位置確定單元201中的步長(zhǎng)短的步長(zhǎng)搜索目標(biāo)頻帶，將用于表示確定了的目標(biāo)頻帶的信息作為第二位置信息輸出到編碼單元203和復(fù)用單元204。另外，在后面敘述第二位置確定單元202的細(xì)節(jié)。編碼單元203對(duì)根據(jù)第一位置信息和第二位置信息確定的目標(biāo)頻帶所包含的第一層誤差變換系數(shù)進(jìn)行編碼，生成編碼信息并將其輸出到復(fù)用單元204。另外，在后面敘述編碼單元203的細(xì)節(jié)。復(fù)用單元204將第一位置信息、第二位置信息以及編碼信息進(jìn)行復(fù)用，生成第二層編碼數(shù)據(jù)并將其輸出。另外，該復(fù)用單元204并不是必須的，也可以將這些信息直接輸出到圖2所示的復(fù)用單元106。圖4是表示圖3所示的第一位置確定單元201所確定的頻帶的圖。在圖4中，第一位置確定單元201從以預(yù)先規(guī)定的帶寬所設(shè)定的三個(gè)頻帶中確定一個(gè)頻帶，將該頻帶的位置信息作為第一位置信息輸出到第二位置確定單元202、編碼單元 203以及復(fù)用單元204。圖4所示的各個(gè)頻帶被設(shè)定為，具有目標(biāo)頻帶以上的帶寬(假設(shè)頻帶1為F1以上而小于F3、頻帶2為F2以上而小于F4、頻帶3為F3以上而小于F5)。另外，在本實(shí)施方式中各個(gè)頻帶被設(shè)定為，具有相同的帶寬，但也可以設(shè)定為，各個(gè)頻帶具有不同的帶寬。例如，也可以設(shè)定為像人的聽(tīng)覺(jué)的臨界帶寬那樣，位于低頻段的頻帶的帶寬較窄，而位于高頻段的頻帶的帶寬較寬。接著，說(shuō)明由第一位置確定單元201進(jìn)行的頻帶的確定方法。這里，第一位置確定單元201以第一層誤差變換系數(shù)的能量的大小為基準(zhǔn)，確定頻帶。將第一層誤差變換系數(shù)表示為ei(k)，通過(guò)下式(1)計(jì)算各個(gè)頻帶所包含的第一層誤差變換系數(shù)的能量&(土)。
權(quán)利要求
1.語(yǔ)音編碼裝置，包括第一層編碼單元，對(duì)輸入語(yǔ)音信號(hào)進(jìn)行編碼處理，生成第一層編碼數(shù)據(jù)；第一層解碼單元，使用所述第一層編碼數(shù)據(jù)進(jìn)行解碼處理，生成第一層解碼信號(hào)；第一層誤差變換系數(shù)計(jì)算單元，將作為所述輸入語(yǔ)音信號(hào)和所述第一層解碼信號(hào)的誤差的第一層誤差信號(hào)變換為頻域而計(jì)算第一層誤差變換系數(shù)；以及第二層編碼單元，對(duì)所述第一層誤差變換系數(shù)進(jìn)行編碼處理，生成第二層編碼數(shù)據(jù)，所述第二層編碼單元包括頻帶選擇單元，從具有規(guī)定的帶寬并以比所述帶寬窄的步長(zhǎng)排列的多個(gè)頻帶候補(bǔ)中，基于所述頻帶候補(bǔ)中的所述第一層誤差變換系數(shù)的能量的大小選擇第一頻帶，并生成表示了選擇的第一頻帶的位置的第一位置信息；脈沖位置確定單元，在所述選擇出的第一頻帶中，在以比所述步長(zhǎng)短的步長(zhǎng)設(shè)定了的脈沖候補(bǔ)位置中確定多個(gè)脈沖的位置，生成表示了確定的多個(gè)脈沖的位置的第二位置信息；以及編碼數(shù)據(jù)生成單元，使用所述第一位置信息和所述第二位置信息，生成所述第二層編碼數(shù)據(jù)。
2.如權(quán)利要求1所述的語(yǔ)音編碼裝置，所述脈沖位置確定單元基于第一層誤差變換系數(shù)的能量的大小，確定脈沖的位置。
3.如權(quán)利要求1或權(quán)利要求2所述的語(yǔ)音編碼裝置，所述第二層編碼單元還包括增益編碼單元，基于所述第一層誤差變換系數(shù)，生成表示所述脈沖位置中的脈沖的振幅的增益信息，所述編碼數(shù)據(jù)生成單元，還使用所述增益信息生成第二層編碼數(shù)據(jù)。
4.如權(quán)利要求1所述的語(yǔ)音編碼裝置，所述頻帶選擇單元從比預(yù)先設(shè)定了的基準(zhǔn)頻率低的低頻域中選擇所述第一頻帶。
5.語(yǔ)音解碼裝置，包括接收單元，接收第一層編碼數(shù)據(jù)和第二層編碼數(shù)據(jù)，所述第一層編碼數(shù)據(jù)是在語(yǔ)音編碼裝置中對(duì)輸入語(yǔ)音信號(hào)進(jìn)行編碼處理而得到的編碼數(shù)據(jù)，所述第二層編碼數(shù)據(jù)是在所述語(yǔ)音編碼裝置中將作為對(duì)所述第一層編碼數(shù)據(jù)進(jìn)行解碼所得的第一層解碼信號(hào)和所述輸入語(yǔ)音信號(hào)的誤差的第一層誤差信號(hào)變換為頻域而計(jì)算第一層誤差變換系數(shù)，對(duì)該第一層誤差變換系數(shù)進(jìn)行編碼處理而得到的編碼數(shù)據(jù)；第一層解碼單元，對(duì)所述第一層編碼數(shù)據(jù)進(jìn)行解碼，生成第一層解碼信號(hào)；第二層解碼單元，對(duì)所述第二層編碼數(shù)據(jù)進(jìn)行解碼，生成第一層解碼誤差變換系數(shù)；時(shí)域變換單元，將所述第一層解碼誤差變換系數(shù)變換為時(shí)域而生成第一層解碼誤差信號(hào)；以及加法單元，將所述第一層解碼信號(hào)和所述第一層解碼誤差信號(hào)相加而生成解碼信號(hào)，所述第二層解碼單元對(duì)所述第二層編碼數(shù)據(jù)進(jìn)行解碼，生成表示了具有規(guī)定帶寬的第一頻帶的位置的第一位置信息以及表示了所述第一頻帶中多個(gè)脈沖的位置的第二位置信息，以及使用所述第一位置信息和所述第二位置信息，確定所述多個(gè)脈沖的位置而生成所述第一層解碼誤差變換系數(shù)。
6.如權(quán)利要求5所述的語(yǔ)音解碼裝置，所述第二層解碼單元對(duì)所述第二層編碼數(shù)據(jù)進(jìn)行解碼而生成表示所述脈沖的振幅的增益信息，還使用所述增益信息生成所述第一層解碼誤差變換系數(shù)。
7.語(yǔ)音編碼方法，包括第一層編碼步驟，對(duì)輸入語(yǔ)音信號(hào)進(jìn)行編碼處理，生成第一層編碼數(shù)據(jù)；第一層解碼步驟，使用所述第一層編碼數(shù)據(jù)進(jìn)行解碼處理，生成第一層解碼信號(hào)；第一層誤差變換系數(shù)計(jì)算步驟，將作為所述輸入語(yǔ)音信號(hào)和所述第一層解碼信號(hào)的誤差的第一層誤差信號(hào)變換為頻域而計(jì)算第一層誤差變換系數(shù)；以及第二層編碼步驟，對(duì)所述第一層誤差變換系數(shù)進(jìn)行編碼處理，生成第二層編碼數(shù)據(jù)，所述第二層編碼步驟包括頻帶選擇步驟，從具有規(guī)定的帶寬并以比所述帶寬窄的步長(zhǎng)排列的多個(gè)頻帶候補(bǔ)中，基于所述頻帶候補(bǔ)中的所述第一層誤差變換系數(shù)的能量的大小選擇第一頻帶，并生成表示了選擇的第一頻帶的位置的第一位置信息；脈沖位置確定步驟，在所述選擇出的第一頻帶中，在以比所述步長(zhǎng)短的步長(zhǎng)設(shè)定了的脈沖候補(bǔ)位置中確定多個(gè)脈沖的位置，生成表示了確定的多個(gè)脈沖的位置的第二位置信息；以及編碼數(shù)據(jù)生成步驟，使用所述第一位置信息和所述第二位置信息，生成所述第二層編碼數(shù)據(jù)。
8.語(yǔ)音解碼方法，包括接收步驟，接收第一層編碼數(shù)據(jù)和第二層編碼數(shù)據(jù)，所述第一層編碼數(shù)據(jù)是在語(yǔ)音編碼方法中對(duì)輸入語(yǔ)音信號(hào)進(jìn)行編碼處理而得到的編碼數(shù)據(jù)，所述第二層編碼數(shù)據(jù)是在所述語(yǔ)音編碼方法中將作為對(duì)所述第一層編碼數(shù)據(jù)進(jìn)行解碼所得的第一層解碼信號(hào)和所述輸入語(yǔ)音信號(hào)的誤差的第一層誤差信號(hào)變換為頻域而計(jì)算第一層誤差變換系數(shù)，對(duì)該第一層誤差變換系數(shù)進(jìn)行編碼處理而得到的編碼數(shù)據(jù)；第一層解碼步驟，對(duì)所述第一層編碼數(shù)據(jù)進(jìn)行解碼，生成第一層解碼信號(hào)；第二層解碼步驟，對(duì)所述第二層編碼數(shù)據(jù)進(jìn)行解碼，生成第一層解碼誤差變換系數(shù)；時(shí)域變換步驟，將所述第一層解碼誤差變換系數(shù)變換為時(shí)域而生成第一層解碼誤差信號(hào)；以及加法步驟，將所述第一層解碼信號(hào)和所述第一層解碼誤差信號(hào)相加而生成解碼信號(hào)，在所述第二層解碼步驟對(duì)所述第二層編碼數(shù)據(jù)進(jìn)行解碼，生成表示了具有規(guī)定帶寬的第一頻帶的位置的第一位置信息以及表示了所述第一頻帶中多個(gè)脈沖的位置的第二位置信息，以及使用所述第一位置信息和所述第二位置信息，確定所述多個(gè)脈沖的位置而生成所述第一層解碼誤差變換系數(shù)。
全文摘要
公開(kāi)了能夠以較少的運(yùn)算量從全頻帶中正確地確定誤差較大的頻帶的編碼裝置等。在該裝置中，第一位置確定單元(201)使用表示了對(duì)輸入信號(hào)的解碼信號(hào)的誤差的第一層誤差變換系數(shù)，在輸入信號(hào)的全頻帶中，以相對(duì)較寬的帶寬搜索誤差較大的頻帶，生成表示了確定的頻帶的第一位置信息，第二位置確定單元(202)在第一位置確定單元(201)所確定的頻帶中，以相對(duì)較窄的帶寬搜索誤差較大的目標(biāo)頻帶，生成表示了確定的目標(biāo)頻帶的第二位置信息，編碼單元(203)對(duì)目標(biāo)頻帶所包含的第一層解碼誤差變換系數(shù)進(jìn)行編碼而生成編碼信息。第一位置信息、第二位置信息以及編碼信息被發(fā)送給通信對(duì)方。
文檔編號(hào)G10L19/02GK102394066SQ20111042495
公開(kāi)日2012年3月28日申請(qǐng)日期2008年2月29日優(yōu)先權(quán)日2007年3月2日
發(fā)明者山梨智史, 押切正浩, 森井利幸申請(qǐng)人:松下電器產(chǎn)業(yè)株式會(huì)社

完整全部詳細(xì)技術(shù)資料下載