用于編碼和解碼統(tǒng)合的語音與音頻的設(shè)備的制作方法

文檔序號：2823196閱讀：206來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：用于編碼和解碼統(tǒng)合的語音與音頻的設(shè)備的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及一種用于統(tǒng)合地編碼和解碼語音信號(speech signal)和音頻信號 (audio signal)的設(shè)備和方法。更具體地說，本發(fā)明涉及一種設(shè)備和方法，其可以解決信號扭曲(distortion)的問題，根據(jù)幀的推移改變選擇出的模塊，從而在不發(fā)生扭曲的前提下改變模塊，當(dāng)編解碼器包括至少兩個編碼/解碼模塊時，其以不同的結(jié)構(gòu)進(jìn)行操作，并根據(jù) 每個幀的輸入特征，選擇和操作所述至少兩個編碼/解碼模塊中的一個。
背景技術(shù)：
語音信號和音頻信號有不同的特征。因此，以往使用語音信號和音頻信號的獨特特征來獨立研究用于語音信號的語音編解碼器和用于音頻信號的音頻編解碼器，而且，已為語音編解碼器和音頻編解碼器各自開發(fā)了標(biāo)準(zhǔn)編解碼器。目前，由于通信服務(wù)和廣播服務(wù)已被整合或融合，有必要使用單一的編解碼器來統(tǒng)合地處理具有不同類型特征的語音信號和音頻信號。但是，現(xiàn)有的語音編解碼器或音頻編解碼器，無法提供所需的統(tǒng)一編解碼器的功能。具體來說，具有最佳性能的音頻編解碼器無法針對語音信號提供令人滿意的功能，而具有最佳性能的語音編解碼器也無法針對音頻信號提供令人滿意的功能。因此，現(xiàn)有編解碼器不適用于統(tǒng)一的語音/音頻編解碼器。因此，需要一種技術(shù)，其可根據(jù)輸入信號的特征來選擇相應(yīng)的模塊，從而最佳地編碼和解碼相應(yīng)的信號。

發(fā)明內(nèi)容
技術(shù)目的本發(fā)明的一個方面，提供一種用于統(tǒng)合地編碼和解碼語音信號和音頻信號的設(shè)備和方法，其可以將語音編解碼器模塊和音頻編解碼器模塊結(jié)合，并根據(jù)輸入信號的特征有選擇地應(yīng)用編解碼器模塊，由此提高性能。本發(fā)明的另一個方面，還提供一種用于統(tǒng)合地編碼和解碼語音信號和音頻信號的設(shè)備和方法，其可以使用前一個模塊的信息，直到隨著時間的推移選定的編解碼器模塊改變，從而解決由于連續(xù)的模塊操作造成信號扭曲的問題。本發(fā)明的另一個方面，還提供一種用于統(tǒng)合地編碼和解碼語音信號和音頻信號的設(shè)備和方法，其可以在要求時域混疊消除(TDAC :time-domainaliasing cancellation)操作的改進(jìn)離散余弦變換(MDCT :Modified DiscreteCosine Transform)模塊中沒有提供用于重疊的前一個模塊信息時，使用額外的體系，從而使TDAC操作可行并執(zhí)行正常的基于 MDCT的編解碼器操作。技術(shù)方案根據(jù)本發(fā)明的一個方面，提供一種用于統(tǒng)合地編碼語音信號和音頻信號的編碼設(shè) 備，所述編碼設(shè)備包括模塊選擇單元，其分析輸入信號的特征并選擇用于編碼輸入信號的第一幀的第一編碼模塊；語音編碼單元，其根據(jù)所述模塊選擇單元的選擇來編碼輸入信號，并生成語音比特流；音頻編碼單元，其根據(jù)所述模塊選擇單元的選擇來編碼輸入信號，并生成音頻比特流；和比特流生成單元，其根據(jù)所述模塊選擇單元的選擇，從語音編碼單元或音頻編碼單元生成輸出比特流。在這種情況下，所述編碼設(shè)備可進(jìn)一步包括模塊緩沖器，其存儲選擇出的第一編碼模塊的模塊標(biāo)識符(ID)，并將對應(yīng)第一幀的前一楨的第二編碼模塊的信息傳輸至語音編碼單元和音頻編碼單元；和輸入緩沖器，其存儲輸入信號并輸出前一個輸入信號，即前一幀的輸入信號。所述比特流生成單元，可將選擇出的第一編碼模塊的模塊ID及其比特流結(jié)合來生成輸出比特流。此外，所述模塊選擇單元可提取選擇出的第一編碼模塊的模塊ID，來將提取出的模塊ID傳輸至模塊緩沖器和比特流生成單元。此外，所述語音編碼單元包括第一語音編碼器，當(dāng)?shù)谝痪幋a模塊與第二編碼模塊相同時，其將輸入信號編碼為代碼激勵線性預(yù)測(CELP =CodeExcitation Linear Prediction)結(jié)構(gòu)；和編碼初始化單元，當(dāng)?shù)谝痪幋a模塊與第二編碼模塊不同時，其決定用于第一語音編碼器的編碼的初始值。此外，當(dāng)?shù)谝痪幋a模塊與第二編碼模塊相同時，所述第一語音編碼器，使用第一語音編碼器的內(nèi)部初始值來編碼輸入信號。當(dāng)?shù)谝痪幋a模塊與第二編碼模塊不同時，所述第一語音編碼器，使用由編碼初始化單元決定出的初始值來編碼輸入信號。此外，所述編碼初始化單元可包括線性預(yù)測編碼(LPC =Linear PredictiveCoder)分析器，其對前一個輸入信號計算LPC系數(shù)；線性譜對(LSP LinearSpectrum Pair)轉(zhuǎn)換器，其將計算出的LPC系數(shù)轉(zhuǎn)換為LSP值；LPC殘差信號計算器，其使用前一個輸入信號和LPC系數(shù)來計算LPC殘差信號；編碼初始值決定單元，其使用 LPC系數(shù)、LSP值、LPC殘差信號，來決定用于第一語音編碼器的編碼的初始值。此外，所述音頻編碼單元可包括第一音頻編碼器，當(dāng)?shù)谝痪幋a模塊與第二編碼模塊相同時，其通過改進(jìn)離散余弦變換(MDCT)操作來編碼輸入信號；第二語音編碼器，當(dāng)?shù)?一編碼模塊與第二編碼模塊不同時，其將輸入信號編碼為CELP結(jié)構(gòu)；第二音頻編碼器，當(dāng) 第一編碼模塊與第二編碼模塊不同時，其通過MDCT操作來編碼輸入信號；多路復(fù)用器，其選擇第一音頻編碼器的輸出、第二語音編碼器的輸出、和第二音頻編碼器的輸出來生成輸出比特流。此外，當(dāng)?shù)谝痪幋a模塊與第二編碼模塊不同時，所述第二語音編碼器，將對應(yīng)第一幀的前1/2樣本的輸入信號進(jìn)行編碼。此外，所述第二音頻編碼器可包括零輸入響應(yīng)計算器，在終止第二語音編碼器的編碼操作之后，其對LPC濾波器計算零輸入響應(yīng)；第一轉(zhuǎn)換器，其將對應(yīng)第一幀的前1/2樣本的輸入信號轉(zhuǎn)換為零；和第二轉(zhuǎn)換器，其從對應(yīng)第一幀的前1/2樣本的輸入信號中減去零輸入響應(yīng)，其中，第二音頻編碼器，將第一轉(zhuǎn)換器轉(zhuǎn)換的信號和第二轉(zhuǎn)換器轉(zhuǎn)換的信號進(jìn) 行編碼。根據(jù)本發(fā)明的另一個方面，提供一種統(tǒng)合地解碼語音信號和音頻信號的解碼設(shè) 備，所述解碼設(shè)備包括模塊選擇單元，其分析輸入比特流的特征并選擇用于解碼輸入比特流的第一幀的第一解碼模塊；語音解碼單元，其根據(jù)所述模塊選擇單元的選擇來解碼輸入比特流，并生成語音信號；音頻解碼單元，其根據(jù)所述模塊選擇單元的選擇來解碼輸入比特流，并生成音頻信號；和輸出生成單元，其根據(jù)所述模塊選擇單元的選擇，從語音解碼單元的語音信號或音頻解碼單元的音頻信號中選擇一個，來將輸出信號輸出。在這種情況下，所述解碼設(shè)備可進(jìn)一步包括模塊緩沖器，其存儲選擇出的第一解碼模塊的模塊標(biāo)識符(ID)，并將對應(yīng)第一幀的前一楨的第二解碼模塊的信息傳輸至語音解碼單元和音頻解碼單元；和輸出緩沖器，其存儲輸出信號并輸出前一個輸出信號，即前一幀的輸出信號。此外，所述音頻解碼單元可包括第一音頻解碼器，當(dāng)?shù)谝唤獯a模塊與第二解碼模塊相同時，其通過反改進(jìn)離散余弦變換(IMDCT :Inverse ModifiedDiscrete Cosine Transform)操作來解碼輸入比特流；第二語音解碼器，當(dāng)?shù)谝唤獯a模塊與第二解碼模塊不同時，其將輸入比特流解碼為CELP結(jié)構(gòu)；第二音頻解碼器，當(dāng)?shù)谝唤獯a模塊與第二解碼模塊不同時，其通過IMDCT操作來解碼輸入比特流；信號恢復(fù)單元，其從第二語音解碼器的輸出和第二音頻解碼器的輸出計算最終輸出；和輸出選擇器，其從第一音頻解碼器的輸出和信號恢復(fù)單元的輸出中選擇一個輸出。技術(shù)效果根據(jù)示例性實施例，提供一種用于統(tǒng)合地編碼和解碼語音信號和音頻信號的設(shè)備和方法，其可以將語音編解碼器模塊和音頻編解碼器模塊結(jié)合，并根據(jù)輸入信號的特征有選擇地應(yīng)用編解碼器模塊，由此提高性能。根據(jù)示例性實施例，提供一種用于統(tǒng)合地編碼和解碼語音信號和音頻信號的設(shè)備和方法，其可以使用前一個模塊的信息，直到隨著時間的推移選定的編解碼器模塊改變，從而解決由于連續(xù)的模塊操作造成信號扭曲的問題。根據(jù)示例性實施例，提供一種用于統(tǒng)合地編碼和解碼語音信號和音頻信號的設(shè)備和方法，其可以在要求時域混疊消除(TDAC time-domain aliasingcancellation)操作的改進(jìn)離散余弦變換(MDCT)模塊中沒有提供用于重疊的前一個模塊信息時，使用額外的體系，從而使TDAC操作可行并執(zhí)行正常的基于MDCT的編解碼器操作。

圖1是示出根據(jù)本發(fā)明一個實施例的用于統(tǒng)合地編碼語音信號和音頻信號的編碼設(shè)備的框圖；圖2是示出圖1的語音編碼單元的一個例子的框圖；圖3是示出圖1的音頻編碼單元的一個例子的框圖；圖4是描述圖3的音頻編碼單元的操作的示圖；圖5是示出根據(jù)本發(fā)明一個實施例的用于統(tǒng)合地解碼語音信號和音頻信號的解碼設(shè)備的框圖；圖6是示出圖5的語音解碼單元的一個例子的框圖；圖7是示出圖5的音頻解碼單元的一個例子的框圖；圖8是描述圖7的音頻解碼單元的操作的示圖；圖9是示出根據(jù)本發(fā)明一個實施例的用于統(tǒng)合地編碼語音信號和音頻信號的編碼方法的流程圖；圖10是示出根據(jù)本發(fā)明一個實施例的用于統(tǒng)合地解碼語音信號和音頻信號的解碼方法的流程圖。
具體實施例方式現(xiàn)在將參照附圖對本發(fā)明的實施例進(jìn)行詳細(xì)描述，所述實施例的示例在附圖中被示出，其中相同的參考數(shù)字始終表示相同的元素。下面將參照數(shù)字描述實施例，以對本發(fā)明進(jìn)行說明。在這里，假設(shè)統(tǒng)一編解碼器包括兩個編碼模塊和兩個解碼模塊，如代碼激勵線性預(yù)測(CELP =Code Excitation Linear Prediction)結(jié)構(gòu)的語音編碼模塊和語音解碼模塊，和執(zhí)行改進(jìn)離散余弦變換(MDCT =Modified Discrete CosineTransform)操作的音頻編碼模塊和音頻解碼模塊。圖1是示出根據(jù)本發(fā)明一個實施例的用于統(tǒng)合地編碼語音信號和音頻信號的編碼設(shè)備100的框圖。參考圖1，編碼設(shè)備100可包括模塊選擇單元110、語音編碼單元130、音頻編碼單元140以及比特流生成單元150。另外，該編碼設(shè)備100可進(jìn)一步包括模塊緩沖器120和輸入緩沖器160。模塊選擇單元110可分析輸入信號的特征，以選擇用于編碼輸入信號的第一幀的第一編碼模塊。此外，模塊選擇單元110可對輸入信號進(jìn)行分析以確定編碼當(dāng)前幀的模塊標(biāo)識符(ID)，并可將輸入信號傳輸至選擇出的第一編碼模塊并將模塊ID輸入至比特流生成單元150。模塊緩沖器120可存儲選擇出的第一編碼模塊的模塊ID，并將對應(yīng)第一幀的之前一楨的第二編碼模塊的信息傳輸至語音編碼單元130和音頻編碼單元140。輸入緩沖器160可存儲輸入信號并輸出前一個輸入信號，即前一幀的輸入信號。具體來說，輸入緩沖器160可存儲輸出信號并輸入當(dāng)前幀前一幀的前一個輸入信號。語音編碼單元130可根據(jù)所述模塊選擇單元110的選擇來編碼輸入信號，以生成語音比特流。以下將參考圖2的細(xì)節(jié)，對語音編碼單元130進(jìn)行說明。圖2是示出圖1的語音編碼單元130的一個例子的框圖。參考圖2，語音編碼單元130可包括編碼初始化單元210和第一語音編碼器220。當(dāng)?shù)谝痪幋a模塊與第二編碼模塊不同時，編碼初始化單元210可決定用于第一語音編碼器220的編碼的初始值。具體來說，只有在前一幀已經(jīng)執(zhí)行了 MDCT操作時，編碼初始化單元210才可接收前一個模塊并決定第一語音編碼器220的初始值。在這里，初始化編碼單元210可包括線性預(yù)測編碼(LPC :Linear Predictive Coder)分析器211、線性譜對(LSP=Linear Spectrum Pair)轉(zhuǎn)換器212、LPC殘差信號計算器213和編碼初始值決定單元214。LPC分析器211可對前一個輸入信號計算LPC系數(shù)。具體來說，LPC分析器212可接收前一個輸入信號，使用與第一語音編碼器220相同的體系來執(zhí)行LPC分析，從而計算并輸出對應(yīng)前一個輸入信號的LPC系數(shù)。LSP轉(zhuǎn)換器212可將計算出的LPC系數(shù)轉(zhuǎn)換為LSP值。LPC殘余信號計算器213可使用前一個輸入信號和LPC系數(shù)來計算LPC殘差信號。編碼初始值決定單元214，可使用LPC系數(shù)、LSP值、LPC殘差信號，來決定用于第一語音編碼器的編碼的初始值。具體來說，編碼初始值決定單元214可使用LPC系數(shù)、LSP 值、LPC殘差信號等，決定并輸出表中的第一語音編碼器220要求的初始值。當(dāng)?shù)谝痪幋a模塊與第二編碼模塊相同時，第一語音編碼器220可將輸入信號編碼為CELP結(jié)構(gòu)。在這里，當(dāng)?shù)谝痪幋a模塊與第二編碼模塊相同時，第一語音編碼器220可使用第一語音編碼器220的內(nèi)部初始值來編碼輸入信號。當(dāng)?shù)谝痪幋a模塊與第二編碼模塊不同時，第一語音編碼器可使用由編碼初始化單元210決定出的初始值來編碼輸入信號。例如，第一語音編碼器220可接收已對當(dāng)前楨前面的楨即前一楨而執(zhí)行了編碼的前一個模塊。當(dāng) 前一楨已經(jīng)執(zhí)行了 CELP操作時，第一語音編碼器220可使用CELP體系來編碼對應(yīng)當(dāng)前幀的輸入信號。在這種情況下，第一語音編碼器220可進(jìn)行連續(xù)的CELP操作，從而使用內(nèi)部提供的前一個信息繼續(xù)進(jìn)行編碼操作，來生成比特流。當(dāng)前一楨已執(zhí)行了 MDCT操作時，第一語音編碼器220可擦除所有用于CELP編碼的前一個信息，并使用編碼初始化單元210提供的初始值執(zhí)行編碼操作，生成比特流。再次參照圖1，音頻編碼單元140可根據(jù)模塊選擇單元110的選擇來編碼輸入信號來生成音頻比特流。以下，將參照圖3和4的細(xì)節(jié)進(jìn)一步對音頻編碼單元140進(jìn)行說明。圖3是示出圖1的音頻編碼單元140的一個例子的框圖。參考圖3，音頻編碼單元140可包括第二語音編碼器310、第二音頻編碼器320、第一音頻編碼器330、多路復(fù)用器；340。當(dāng)?shù)谝痪幋a模塊與第二編碼模塊相同時，第一音頻編碼器330可通過MDCT操作來編碼輸入信號。具體來說，第一音頻編碼器可330接收前一個模塊。當(dāng)前一楨已執(zhí)行了 MDCT操作時，第一音頻編碼器330可使用MDCT操作來編碼對應(yīng)當(dāng)前幀的輸入信號，從而生成比特流。生成的比特流可被輸入到多路復(fù)用器340中。參考圖4，X表示當(dāng)前幀412的一個輸入信號。xl和x2表示把輸入信號X 二等分成1/2幀長度所生成的信號。當(dāng)前幀412的MDCT操作可被應(yīng)用到包括對應(yīng)隨后幀413的信號Y在內(nèi)的信號X和Y中。MDCT可在將窗口 wl、w2、w3、w4乘以被信號X和Y之后執(zhí)行。在這里，wl、w2、w3、w4表示將整個窗口以幀的長度劃分而生成的窗口塊。當(dāng)前一幀411 已經(jīng)執(zhí)行了 CELP操作時，第一音頻編碼器330可以不執(zhí)行任何操作。當(dāng)?shù)谝痪幋a模塊與第二編碼模塊不同時，第二語音編碼器310可將輸入信號編碼為CELP結(jié)構(gòu)。在這里，第二語音編碼器310可接收前一個模塊。當(dāng)前一幀411已經(jīng)執(zhí)行了 CELP操作時，第二語音信號編碼器310可編碼信號xl來輸出比特流，并可將所述比特流輸出至多路復(fù)用器340。當(dāng)前一幀411已經(jīng)執(zhí)行了 CELP操作時，第二語音信號編碼器310可連續(xù)地連接到前一幀411，由此執(zhí)行編碼操作而無須進(jìn)行初始化。當(dāng)前一楨411已經(jīng)執(zhí)行了 MDCT操作，第二語音編碼310可以不執(zhí)行任何操作。當(dāng)?shù)谝痪幋a模塊與第二編碼模塊不同時，第二音頻編碼器320可通過MDCT操作來編碼輸入信號。在這里，第二音頻編碼器320可接收前一個模塊。當(dāng)前一幀411已經(jīng)執(zhí)行了 CELP操作時，第二音頻編碼器320可使用下面第一至第三體系中的任何一個來編碼輸入信號。第一體系可根據(jù)現(xiàn)有的MDCT操作編碼輸入信號。第二體系可將輸入信號修改外xl =0，并使用以現(xiàn)有的MDCT操作為根據(jù)的體系編碼其結(jié)果。第三體系可對在第二語音編碼器310終止信號xl的編碼操作之后獲得的LPC濾波器計算零輸入響應(yīng)X3430，并可根據(jù)x2 =x2-x3來修改信號x2，并基于xl = 0修改輸入信號，并根據(jù)現(xiàn)有的MDCT操作編碼其結(jié)果。音頻解碼模塊(未示出)的信號恢復(fù)操作，可根據(jù)應(yīng)用第二音頻編碼器320的體系決定。當(dāng)前一楨已經(jīng)執(zhí)行了 MDCT操作時，第二音頻編碼器320可以不執(zhí)行任何操作。對于上面的編碼操作，第二音頻編碼器320可包括零輸入響應(yīng)計算器(未示出)，在終止第二語音編碼器310的編碼操作之后，其對LPC濾波器計算零輸入響應(yīng)；第一轉(zhuǎn)換器(未示出)，其將對應(yīng)第一幀的前1/2樣本的輸入信號轉(zhuǎn)換為零；和第二轉(zhuǎn)換器(未示出)，其從對應(yīng)第一幀的后1/2樣本的輸入信號中減去零輸入響應(yīng)。所述第二音頻編碼器 320，可將第一轉(zhuǎn)換器轉(zhuǎn)換的信號和第二轉(zhuǎn)換器轉(zhuǎn)換的信號進(jìn)行編碼。多路復(fù)用器340可選擇選擇第一音頻編碼器330的輸出、第二語音編碼器310的輸出、和第二音頻編碼器330的輸出來生成輸出比特流。在這里，多路復(fù)用器340可將比特流結(jié)合以生成最終比特流。當(dāng)前一幀執(zhí)行了 MDCT操作時，最終比特流可以與第一音頻編碼器330的輸出比特流相同。再次參照圖1，比特流生成單元150可將選擇出的第一編碼模塊的模塊ID及選擇出的第一編碼模塊的比特流結(jié)合來生成輸出比特流。比特流生成單元150可結(jié)合模塊ID 和對應(yīng)模塊號ID的比特流，來生成最終比特流。圖5是示出根據(jù)本發(fā)明一個實施例的用于統(tǒng)合地解碼語音信號和音頻信號的解碼設(shè)備500的框圖。參考圖5，解碼設(shè)備500可包括模塊選擇單元510、語音解碼單元530，音頻解碼單元540和輸出生成單元550。此外，解碼設(shè)備500可進(jìn)一步包括模塊緩沖器520和輸出緩沖器 560。模塊選擇單元510可分析輸入比特流的特征以選擇用于解碼輸入比特流的第一幀的第一解碼模塊。具體來說，模塊選擇單元510可分析從輸入比特流傳輸來的模塊，來輸出模塊ID并將輸入比特流傳輸至相應(yīng)的解碼模塊。語音解碼單元530可根據(jù)模塊選擇單元510的選擇來解碼輸入比特流，并生成語音信號。具體來說，語音解碼單元530可執(zhí)行CELP為基礎(chǔ)的語音解碼操作。以下，將參照圖的細(xì)節(jié)6進(jìn)一步對語音解碼單元530進(jìn)行說明。圖6是示出圖5的語音解碼單元530的一個例子的框圖。參考圖6，語音解碼單元530可包括解碼初始化單元610和的第一語音解碼器 620。當(dāng)?shù)谝唤獯a模塊與第二解碼模塊不同時，解碼初始化單元610可決定用于第一語音解碼器620的解碼的初始值。具體來說，解碼初始化單元610可接收前一個模塊。只有在前一幀已經(jīng)執(zhí)行了 MDCT操作時，解碼初始化單元610才可決定要提供給第一語音解碼器 620的初始值。在這里，初始化解碼單元610可包括LPC分析器611、LSP轉(zhuǎn)換器612、LPC 殘差信號計算器613、和解碼初始值決定單元614。LPC分析器611可對前一個輸出信號計算LPC系數(shù)。具體來說，LPC分析器611可接收前一個輸出信號，并使用與第一語音解碼器620相同的體系來執(zhí)行LPC分析，從而計算并輸出對應(yīng)前一個輸出信號的LPC系數(shù)。LSP轉(zhuǎn)換器612可將計算出的LPC系數(shù)轉(zhuǎn)換為LSP值。LPC殘差信號計算器613可使用前一個輸出信號和LPC系數(shù)來計算LPC殘差信號。解碼初始值決定單元614可使用LPC系數(shù)、LSP值、LPC殘差信號，來決定用于第一語音解碼器620的解碼的初始值。解碼初始值決定單元614可使用LPC系數(shù)、LSP值、LPC 殘差信號等，決定并輸出表中的第一語音解碼器620要求的初始值。當(dāng)?shù)谝唤獯a模塊與第二解碼模塊相同時，第一語音解碼器620將輸入比特流解碼為CELP結(jié)構(gòu)。在這里，當(dāng)?shù)谝唤獯a模塊與第二解碼模塊相同時，第一語音解碼器620可使用第一語音解碼器620的內(nèi)部初始值來解碼輸入比特流。當(dāng)?shù)谝唤獯a模塊與第二解碼模塊不同時，第一語音解碼器620可使用由解碼初始化單元610決定出的初始值來解碼輸入比特流。具體來說，第一語音解碼器620可接收已為當(dāng)前楨前一楨即前一楨執(zhí)行了解碼的前一個模塊。當(dāng)所述前一楨已執(zhí)行了 CELP操作時，第一語音解碼器620可使用CELP體系來解碼對應(yīng)當(dāng)前幀的輸入比特流。在這種情況下，第一語音解碼器620可進(jìn)行連續(xù)的CELP操作，從而使用內(nèi)部提供的前一個信息繼續(xù)進(jìn)行解碼操作，來生成輸出信號。當(dāng)所述前一楨已執(zhí)行了 MDCT操作時，第一語音解碼器620可擦除所有用于CELP解碼的前一個信息，并使用解碼初始化單元610提供的初始值執(zhí)行解碼操作，生成輸出信號。再次參照圖5，所述音頻解碼單元540可根據(jù)模塊選擇單元510的選擇來解碼輸入比特流，并生成音頻信號。下文，將參照圖7和圖8的細(xì)節(jié)對音頻解碼單元540進(jìn)行進(jìn)一步說明。圖7是示出圖5的音頻解碼單元MO的一個例子的框圖。參考圖7，音頻解碼單元540可包括第二語音解碼器710、第二音頻解碼器720、第一音頻解碼器730、信號恢復(fù)單元740和輸出選擇器750。當(dāng)?shù)谝唤獯a模塊與第二解碼模塊相同時，第一音頻解碼器730可通過反改進(jìn)離散余弦變換(IMDCT=Inverse MDCT)操作來解碼輸入比特流。具體來說，第一音頻解碼器730 可接收前一個模塊。當(dāng)前一楨已執(zhí)行了 IMDCT操作時，第一音頻解碼器730可使用IMDCT 操作來解碼對應(yīng)當(dāng)前幀的輸入比特流，從而生成輸出信號。具體來說，第一音頻解碼器730 可接收當(dāng)前幀的輸入比特流，根據(jù)現(xiàn)有技術(shù)執(zhí)行IMDCT操作，應(yīng)用一個窗口由此來執(zhí)行時域混疊消除(TDAC :time-domain aliasing cancellation)操作，并輸出最終輸出信號。當(dāng) 前一楨執(zhí)行CELP操作時，第一音頻解碼器730可不執(zhí)行任何操作。參考圖8，當(dāng)?shù)谝唤獯a模塊與第二解碼模塊不同時，第二語音解碼器710可將輸入比特流解碼為CELP結(jié)構(gòu)。具體來說，在這里，第二語音解碼器710可接收前一個模塊。當(dāng) 前一幀已經(jīng)執(zhí)行了 CELP操作時，第二語音信號解碼器710可根據(jù)現(xiàn)有的語音解碼體系來解碼輸入比特流以生成輸出信號。在這里，第二語音解碼器710的輸出信號可以是X4820并具有1/2幀的長度。由于前一幀已經(jīng)執(zhí)行了 CELP操作，第二語音信號解碼器710可連續(xù)地連接到前一幀，由此執(zhí)行解碼操作而無須進(jìn)行初始化。當(dāng)?shù)谝唤獯a模塊與第二解碼模塊不同時，第二音頻解碼器720可通過IMDCT操作來解碼輸入比特流。在這里，在IMDCT操作之后，第二音頻解碼器720可只應(yīng)用一個窗口并獲取輸出信號而不執(zhí)行TDAC操作。此外，在圖8中，ab 830可表示第二音頻解碼器720的輸出信號。a和b可被定義為具有1/2幀長度的信號。信號恢復(fù)單元740，可從第二語音解碼器710的輸出和第二音頻解碼器720的輸出計算最終輸出。此外，信號恢復(fù)單元710可獲取當(dāng)前幀的最終輸出信號，并將該輸出信號定義為gh850，如圖8所示。在這里，g和h可被定義為具有1/2幀長度的信號。信號恢復(fù)單元740可任何時候都定義g = x4并使用下列體系之一根據(jù)第二音頻解碼器的操作來解碼信號h。第一體系可根據(jù)下列公式1獲得h。在這里，假設(shè)進(jìn)行一般的窗口操作。在下面的公式1中，R表示將基于1/2幀的長度時間軸旋轉(zhuǎn)信號。 [公式 1]
權(quán)利要求
1.一種統(tǒng)合地編碼語音信號和音頻信號的編碼設(shè)備，所述編碼設(shè)備包括模塊選擇單元，其分析輸入信號的特征并選擇用于編碼輸入信號的第一幀的第一編碼模塊；語音編碼單元，其根據(jù)所述模塊選擇單元的選擇來編碼輸入信號，并生成語音比特流；音頻編碼單元，其根據(jù)所述模塊選擇單元的選擇來編碼輸入信號，并生成音頻比特流；和比特流生成單元，其根據(jù)所述模塊選擇單元的選擇，從語音編碼單元或音頻編碼單元生成輸出比特流。
2.如權(quán)利要求1所述的編碼設(shè)備，進(jìn)一步包括模塊緩沖器，其存儲選擇出的第一編碼模塊的模塊標(biāo)識符(ID)，并將對應(yīng)第一幀的前一楨的第二編碼模塊的信息傳輸至語音編碼單元和音頻編碼單元；和輸入緩沖器，其存儲輸入信號并輸出前一個輸入信號，即前一幀的輸入信號，其中，所述比特流生成單元，將選擇出的第一編碼模塊的模塊ID及其比特流結(jié)合來生成輸出比特流。
3.如權(quán)利要求2所述的編碼設(shè)備，其中，所述模塊選擇單元，提取選擇出的第一編碼模塊的模塊ID，來將提取出的模塊ID傳輸至模塊緩沖器和比特流生成單元。
4.如權(quán)利要求2所述的編碼設(shè)備，其中，所述語音編碼單元包括第一語音編碼器，當(dāng)?shù)谝痪幋a模塊與第二編碼模塊相同時，其將輸入信號編碼為代碼激勵線性預(yù)測(CELP)結(jié)構(gòu)；和編碼初始化單元，當(dāng)?shù)谝痪幋a模塊與第二編碼模塊不同時，其決定用于第一語音編碼器的編碼的初始值。
5.如權(quán)利要求4所述的編碼設(shè)備，其中當(dāng)?shù)谝痪幋a模塊與第二編碼模塊相同時，所述第一語音編碼器，使用第一語音編碼器的內(nèi)部初始值來編碼輸入信號，且當(dāng)?shù)谝痪幋a模塊與第二編碼模塊不同時，所述第一語音編碼器，使用由編碼初始化單元決定出的初始值來編碼輸入信號。
6.如權(quán)利要求4所述的編碼設(shè)備，其中，所述編碼初始化單元包括線性預(yù)測編碼(LPC)分析器，其對前一個輸入信號計算LPC系數(shù)；線性譜對(LSP)轉(zhuǎn)換器，其將計算出的LPC系數(shù)轉(zhuǎn)換為LSP值；LPC殘差信號計算器，其使用前一個輸入信號和LPC系數(shù)來計算LPC殘差信號；編碼初始值決定單元，其使用LPC系數(shù)、LSP值、LPC殘差信號，來決定用于第一語音編碼器的編碼的初始值。
7.如權(quán)利要求2所述的編碼設(shè)備，其中，所述音頻編碼單元包括第一音頻編碼器，當(dāng)?shù)谝痪幋a模塊與第二編碼模塊相同時，其通過改進(jìn)離散余弦變換 (MDCT)操作來編碼輸入信號；第二語音編碼器，當(dāng)?shù)谝痪幋a模塊與第二編碼模塊不同時，其將輸入信號編碼為CELP 結(jié)構(gòu)；第二音頻編碼器，當(dāng)?shù)谝痪幋a模塊與第二編碼模塊不同時，其通過MDCT操作來編碼輸入信號；多路復(fù)用器，其選擇第一音頻編碼器的輸出、第二語音編碼器的輸出、和第二音頻編碼器的輸出來生成輸出比特流。
8.如權(quán)利要求7所述的編碼設(shè)備，其中，當(dāng)?shù)谝痪幋a模塊與第二編碼模塊不同時，所述第二語音編碼器，將對應(yīng)第一幀的前1/2樣本的輸入信號進(jìn)行編碼。
9.如權(quán)利要求7所述的編碼設(shè)備，其中，所述第二音頻編碼器包括零輸入響應(yīng)計算器，在終止第二語音編碼器的編碼操作之后，其對LPC濾波器計算零輸入響應(yīng)；第一轉(zhuǎn)換器，其將對應(yīng)第一幀的前1/2樣本的輸入信號轉(zhuǎn)換為零；和第二轉(zhuǎn)換器，其從對應(yīng)第一幀的后1/2樣本的輸入信號中減去零輸入響應(yīng)，其中，第二音頻編碼器，將第一轉(zhuǎn)換器轉(zhuǎn)換的信號和第二轉(zhuǎn)換器轉(zhuǎn)換的信號進(jìn)行編碼。
10.一種統(tǒng)合地解碼語音信號和音頻信號的解碼設(shè)備，所述解碼設(shè)備包括模塊選擇單元，其分析輸入比特流的特征并選擇用于解碼輸入比特流的第一幀的第一解碼模塊；語音解碼單元，其根據(jù)所述模塊選擇單元的選擇來解碼輸入比特流，并生成語音信號；音頻解碼單元，其根據(jù)所述模塊選擇單元的選擇來解碼輸入比特流，并生成音頻信號；和輸出生成單元，其根據(jù)所述模塊選擇單元的選擇，從語音解碼單元的語音信號或音頻解碼單元的音頻信號中選擇一個，來將輸出信號輸出。
11.如權(quán)利要求10所述的解碼設(shè)備，進(jìn)一步包括模塊緩沖器，其存儲選擇出的第一解碼模塊的模塊標(biāo)識符(ID)，并將對應(yīng)第一幀的前一楨的第二解碼模塊的信息傳輸至語音解碼單元和音頻解碼單元；和輸出緩沖器，其存儲輸出信號并輸出前一個輸出信號，即前一幀的輸出信號。
12.如權(quán)利要求11所述的解碼設(shè)備，其中，所述語音解碼單元包括第一語音解碼器，當(dāng)?shù)谝唤獯a模塊與第二解碼模塊相同時，其將輸入比特流解碼為 CELP結(jié)構(gòu)；和解碼初始化單元，當(dāng)?shù)谝唤獯a模塊與第二解碼模塊不同時，其決定用于第一語音解碼器的解碼的初始值。
13.如權(quán)利要求12所述的解碼設(shè)備，其中，所述解碼初始化單元包括 LPC分析器，其對前一個輸出信號計算LPC系數(shù)；LSP轉(zhuǎn)換器，其將計算出的LPC系數(shù)轉(zhuǎn)換為LSP值；LPC殘差信號計算器，其使用前一個輸出信號和LPC系數(shù)來計算LPC殘差信號；解碼初始值決定單元，其使用LPC系數(shù)、LSP值、LPC殘差信號，來決定用于第一語音解碼器的解碼的初始值。
14.如權(quán)利要求12所述的解碼設(shè)備，其中當(dāng)?shù)谝唤獯a模塊與第二解碼模塊相同時，所述第一語音解碼器，使用第一語音解碼器的內(nèi)部初始值來解碼輸入比特流，且當(dāng)?shù)谝唤獯a模塊與第二解碼模塊不同時，所述第一語音解碼器，使用由解碼初始化單元決定出的初始值來解碼輸入比特流。
15.如權(quán)利要求11所述的解碼設(shè)備，其中，所述音頻解碼單元包括第一音頻解碼器，當(dāng)?shù)谝唤獯a模塊與第二解碼模塊相同時，其通過反改進(jìn)離散余弦變換(IMDCT)操作來解碼輸入比特流；第二語音解碼器，當(dāng)?shù)谝唤獯a模塊與第二解碼模塊不同時，其將輸入比特流解碼為 CELP結(jié)構(gòu)；第二音頻解碼器，當(dāng)?shù)谝唤獯a模塊與第二解碼模塊不同時，其通過IMDCT操作來解碼輸入比特流；信號恢復(fù)單元，其從第二語音解碼器的輸出和第二音頻解碼器的輸出計算最終輸出；和輸出選擇器，其從第一音頻解碼器的輸出和信號恢復(fù)單元的輸出中選擇一個輸出。
16.如權(quán)利要求15所述的解碼設(shè)備，其中，當(dāng)?shù)谝唤獯a模塊與第二解碼模塊不同時，所述第二語音解碼器，將對應(yīng)第一幀的前1/2樣本的輸入比特流進(jìn)行解碼來將輸入信號輸出ο
17.如權(quán)利要求15所述的解碼設(shè)備，其中，所述信號恢復(fù)單元，將第二語音解碼器的輸入，決定為對應(yīng)第一幀的前1/2的樣本的輸出信號。
18.如權(quán)利要求15所述的解碼設(shè)備，其中，所述信號恢復(fù)單元，根據(jù)下列公式1來決定對應(yīng)第一楨的后1/2樣本的輸出信號[公式1]fa — W2W1rX4rI I—“雄w2w2 ‘其中，h表示對應(yīng)第一楨的后1/2樣本的輸出信號，b表示第二音頻解碼器的輸出信號， x4表示第二語音解碼器的輸出信號，wl和w2表示窗口，wlK表示對wl基于1/2幀的長度執(zhí) 行時間軸旋轉(zhuǎn)生成的信號，X4e表示對x4基于1/2幀的長度執(zhí)行時間軸旋轉(zhuǎn)生成的信號。
19.如權(quán)利要求15所述的解碼設(shè)備，其中，所述信號恢復(fù)單元，根據(jù)下列公式2來決定對應(yīng)第一楨的后1/2樣本的輸出信號[公式2]其中，h表示對應(yīng)第一楨的后1/2樣本的輸出信號，b表示第二音頻解碼器的輸出信號， w2表示窗口。
20.如權(quán)利要求15所述的解碼設(shè)備，其中，所述信號恢復(fù)單元，根據(jù)下列公式3來決定對應(yīng)第一楨的后1/2樣本的輸出信號 [公式3]其中，h表示對應(yīng)第一楨的后1/2樣本的輸出信號，b表示第二音頻解碼器的輸出信號， w2表示窗口，x5表示在解碼第二語音解碼器的輸出信號之后的對LPC濾波器的零輸入響應(yīng)。
全文摘要
本發(fā)明提供了一種統(tǒng)合地編碼和解碼語音信號(speech signal)和音頻信號(audio signal)的編碼設(shè)備，所述用于統(tǒng)合地編碼語音信號和音頻信號的編碼設(shè)備可包括模塊選擇單元(110)，其分析輸入信號的特征并選擇用于編碼輸入信號的第一幀的第一編碼模塊；語音編碼單元(130)，其根據(jù)所述模塊選擇單元(110)的選擇來編碼輸入信號，并生成語音比特流；音頻編碼單元(140)，其根據(jù)所述模塊選擇單元(110)的選擇來編碼輸入信號，并生成音頻比特流；和比特流生成單元(150)，其根據(jù)所述模塊選擇單元(110)的選擇，從語音編碼單元(130)或音頻編碼單元(140)生成輸出比特流。
文檔編號G10L19/14GK102150205SQ200980135711
公開日2011年8月10日申請日期2009年7月14日優(yōu)先權(quán)日2008年7月14日
發(fā)明者姜京玉, 張大永, 樸浩綜, 樸榮喆, 李泰辰, 洪鎮(zhèn)佑, 白承權(quán), 金珉第申請人:光云大學(xué)校產(chǎn)學(xué)協(xié)力團, 韓國電子通信研究院

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：李泰辰
技術(shù)所有人：韓國電子通信研究院
我是此專利的發(fā)明人

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

音頻編解碼芯片相關(guān)技術(shù)

音頻編解碼相關(guān)技術(shù)

silk音頻編解碼協(xié)議相關(guān)技術(shù)

音頻編解碼技術(shù)相關(guān)技術(shù)

音頻編解碼matlab相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

用于編碼和解碼統(tǒng)合的語音與音頻的設(shè)備的制作方法