對音頻/語音信號進行編碼和解碼的方法和設(shè)備的制作方法

文檔序號：2823223閱讀：186來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：對音頻/語音信號進行編碼和解碼的方法和設(shè)備的制作方法
技術(shù)領(lǐng)域：
示例實施例涉及一種對音頻/語音信號進行編碼和解碼的方法和設(shè)備。
背景技術(shù)：
編解碼器可被分為語音編解碼器和音頻編解碼器。語音編解碼器可使用語音建模在50Hz到7kHz的范圍的頻帶中對信號進行編碼/解碼。一般來說，語音編解碼器可通過對聲帶和聲道進行建模來提取語音信號的參數(shù)，以執(zhí)行編碼和解碼。音頻編解碼器可通過應(yīng)用心理聲學(xué)建模(如高效高級音頻編碼(HE-AAC))在OHz到MHz的范圍的頻帶中對信號進行編碼/解碼。音頻編解碼器可基于人類聽覺特征，通過去除不易察覺的信號來執(zhí)行編碼和解碼。語音編解碼器雖然適合于對語音信號進行編碼/解碼，但由于聲音質(zhì)量的下降，語音編解碼器不適合于對音頻信號進行編碼/解碼。此外，當(dāng)音頻編解碼器對語音信號進行編碼/解碼時，可能降低信號壓縮效率。

發(fā)明內(nèi)容
示例實施例可提供一種對音頻/語音信號進行編碼和解碼的方法和設(shè)備，所述方法和設(shè)備可有效地對語音信號、音頻信號以及語音信號和音頻信號的混合信號進行編碼和解碼。本總體發(fā)明構(gòu)思的另外特征和效用將在下面的描述中部分地闡明，并且從描述中部分是清楚的，或者通過本總體發(fā)明構(gòu)思的實施可以被得知。根據(jù)本總體發(fā)明構(gòu)思的示例實施例，可提供一種對音頻/語音信號進行編碼的設(shè) 備，所述設(shè)備包括信號變換單元，將輸入的音頻信號或語音信號變換為高頻率分辨率信號和高時間分辨率信號中的至少一個；心理聲學(xué)建模單元，控制信號變換單元；時域編碼單元，基于語音建模，對由信號變換單元變換的信號進行編碼；量化單元，對從信號變換單元和時域編碼單元中的至少一個輸出的信號進行量化。根據(jù)本總體發(fā)明構(gòu)思的示例實施例，還可提供一種對音頻/語音信號進行編碼的設(shè)備，所述設(shè)備包括參數(shù)立體聲處理單元，處理輸入的音頻信號或語音信號的立體聲信息；處理輸入的音頻信號或語音信號的高頻信號的單元；信號變換單元，將輸入的音頻信號或語音信號變換為高頻率分辨率信號和高時間分辨率信號中的至少一個；心理聲學(xué)建模單元，控制信號變換單元；時域編碼單元，基于語音建模，對由信號變換單元變換的信號進行編碼；量化單元，對從信號變換單元和時域編碼單元中的至少一個輸出的信號進行量化。根據(jù)本總體發(fā)明構(gòu)思的示例實施例，還可提供了一種對音頻/語音信號進行編碼的設(shè)備，所述設(shè)備包括信號變換單元，將輸入的音頻信號或語音信號變換為高頻率分辨率信號和高時間分辨率信號中的至少一個；心理聲學(xué)建模單元，控制信號變換單元；低碼率確定單元，確定變換的信號是否處于低碼率；時域編碼單元，當(dāng)變換的信號處于低碼率時，基于語音建模，對變換的信號進行編碼；時間噪聲整形單元，對變換的信號進行整形；高碼率立體聲單元，對整形的信號的立體聲信息進行編碼；量化單元，對來自高碼率立體聲單元的輸出信號和來自時域編碼單元的輸出信號中的至少一個進行量化。根據(jù)本總體發(fā)明構(gòu)思的示例實施例，還可提供一種對音頻/語音信號進行解碼的設(shè)備，所述設(shè)備包括分辨率確定單元，基于關(guān)于時域編碼或頻域編碼的信息，確定當(dāng)前幀信號是高頻率分辨率信號還是高時間分辨率信號，所述信息包括在比特流中；反量化單元，當(dāng)分辨率確定單元確定所述信號是高頻率分辨率信號時，對比特流進行反量化；時域，從比特流中解碼出用于反線性預(yù)測的附加信息，并使用該附加信息來恢復(fù)高時間分辨率信號；反信號變換單元，將來自的輸出信號和來自反量化單元的輸出信號中的至少一個反變換到時域的音頻信號或語音信號。根據(jù)本總體發(fā)明構(gòu)思的示例實施例，還可提供一種對音頻/語音信號進行解碼的設(shè)備，所述設(shè)備包括反量化單元，對比特流進行反量化；高碼率立體聲系統(tǒng)/解碼器，對反量化的信號進行解碼；時間噪聲整形器/解碼器，處理由高碼率立體聲系統(tǒng)/解碼器解碼的信號；反信號變換單元，將處理的信號反變換到時域的音頻信號或語音信號，其中，通過將輸入的音頻信號或語音信號變換為高頻率分辨率信號和高時間分辨率信號中的至少一個來產(chǎn)生比特流。根據(jù)本總體發(fā)明構(gòu)思的示例實施例，對音頻/語音信號進行編碼和解碼的方法和設(shè)備可有效地對語音信號、音頻信號以及語音信號和音頻信號的混合信號進行編碼和解碼。此外，根據(jù)本總體發(fā)明構(gòu)思的示例性實施例，對音頻/語音信號進行編碼和解碼的方法和設(shè)備可使用較少比特執(zhí)行編碼和解碼，從而可提高聲音質(zhì)量。本總體發(fā)明構(gòu)思的另外效用將在下面的描述中部分地闡明，并且從描述中部分是清楚的，或者通過實施例的實施可以被得知。本總體發(fā)明構(gòu)思的示例性實施例還提供了一種對音頻信號和語音信號進行編碼的方法，所述方法包括接收至少一個音頻信號和至少一個語音信號；將接收的音頻信號和接收的語音信號中的至少一個變換為頻率分辨率信號和時域分辨率信號中的至少一個；對變換的信號進行編碼；對變換的信號和編碼的信號中的至少一個進行量化。本總體發(fā)明構(gòu)思的示例性實施例還提供了一種對音頻信號和語音信號進行解碼的方法，所述方法包括使用接收的信號的比特流中的關(guān)于時域編碼或頻域編碼的信息，來確定當(dāng)前幀信號是頻率分辨率信號還是時域分辨率信號；當(dāng)接收的信號是頻率分辨率信號時，對比特流進行反量化；從比特流中的信息進行反線性預(yù)測，并使用該信息來恢復(fù)時域分辨率信號；將反量化的信號和恢復(fù)的時域分辨率信號中的至少一個反變換到時域的音頻信號或語音信號。

從下面通過結(jié)合附圖對示例實施例的描述中，本總體發(fā)明構(gòu)思的這些和/或其它特征及效用將會變得清楚，并且更易于理解，其中圖1是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實施例的對音頻/語音信號進行編碼的設(shè)備的框圖；圖2是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實施例的對音頻/語音信號進行解碼的設(shè)備的框圖；圖3是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實施例的對音頻/ 設(shè)備的框圖；圖4是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實施例的對音頻/ 設(shè)備的框圖；圖5是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實施例的對音頻/ 設(shè)備的框圖；圖6是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實施例的對音頻/ 設(shè)備的框圖；圖7是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實施例的對音頻/ 設(shè)備的框圖；圖8是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實施例的對音頻/ 設(shè)備的框圖；圖9是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實施例的對音頻/ 設(shè)備的框圖；圖10是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實施例的對音頻的設(shè)備的框圖；圖11是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實施例的對音頻的設(shè)備的框圖；圖12是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實施例的對音頻的設(shè)備的框圖；圖13是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實施例的對音頻的設(shè)備的框圖；圖14是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實施例的對音頻的設(shè)備的框圖；圖15是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實施例的對音頻的設(shè)備的框圖；圖16是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實施例的對音頻的方法的流程圖；圖17是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實施例的對音頻的方法的流程圖。
語音信號進行編碼的語音信號進行解碼的語音信號進行編碼的語音信號進行編碼的語音信號進行解碼的語音信號進行編碼的語音信號進行解碼的 /語音信號進行編碼 /語音信號進行解碼 /語音信號進行編碼 /語音信號進行解碼 /語音信號進行編碼 /語音信號進行解碼 /語音信號進行編碼 /語音信號進行解碼
具體實施例方式現(xiàn)在將詳細地參照示例實施例，其示例在附圖中示出，其中，相同的標(biāo)號始終表示相同的元件。以下通過參照附圖描述示例性實施例以解釋本公開。圖1是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實施例的對音頻/語音信號進行編碼的設(shè)備的框圖。參照圖1，對音頻/語音信號進行編碼的設(shè)備可包括信號變換單元110、心理聲學(xué) 建模單元120、時域編碼單元130、量化單元140、參數(shù)立體聲處理單元150、高頻信號處理單元160和復(fù)用單元170。信號變換單元110可將輸入的音頻信號或語音信號變換為高分辨率信號(high frequentcy resoluteion signal)禾口 / 或高時間分辨率信號(high temporal resolution signal)0心理聲學(xué)建模單元120可控制信號變換單元110將輸入的音頻信號或語音信號變換為高頻率分辨率信號和/或高時間分辨率信號。具體地，心理聲學(xué)建模單元120可計算用于量化的掩蔽閾值(masking threshold)，并至少使用計算的掩蔽閾值來控制信號變換單元110將輸入的音頻信號或語音信號變換為高頻率分辨率信號和/或高時間分辨率信號。時域編碼單元130可至少使用語音建模來對由信號變換單元110變換的信號進行編碼。具體地，心理聲學(xué)建模單元120可將信息信號提供給時域編碼單元130以控制時域編碼單元130。在這種情況下，時域編碼單元130可包括預(yù)測單元(未示出)。預(yù)測單元可通過對由信號變換單元110變換的信號應(yīng)用語音建模并去除相關(guān)信息來對數(shù)據(jù)進行編碼。此外，預(yù)測單元可包括短時預(yù)測器和長時預(yù)測器。量化單元140可對從信號變換單元110和/時域編碼單元130輸出的信號進行量化和編碼。在這種情況下，量化單元140可包括碼激勵線性預(yù)測(CELP)單元，用于模擬去除了相關(guān)信息的信號。在圖1中未示出CELP單元。參數(shù)立體聲處理單元150可處理輸入的音頻信號或語音信號的立體聲信息。高頻信號處理單元160可處理輸入的音頻信號或語音信號的高頻信息。以下，將更詳細地描述對音頻/語音信號進行編碼的設(shè)備。信號變換單元110可將頻譜系數(shù)劃分為多個頻帶。心理聲學(xué)建模單元120可分析頻譜特性并確定多個頻帶的每個頻帶的時域分辨率或頻域分辨率。當(dāng)高時間分辨率適合于特定頻帶時，可由利用變換方案的反變換單元(如反調(diào)制重疊變換(IMLT)單元)來對特定頻帶中的頻譜系數(shù)進行變換，可由時域編碼單元130對變換的信號進行編碼。反變換單元可包括在信號變換單元110中。在這種情況下，時域編碼單元130可包括短時預(yù)測器和長時預(yù)測器。當(dāng)輸入的信號是語音信號時，由于提高的時域分辨率，時域編碼單元130可有效地反映語音產(chǎn)生單元的特性。具體地，短時預(yù)測器可處理從信號變換單元110接收的數(shù)據(jù)，并可去除時域中的采樣點的短時相關(guān)信息。此外，長時預(yù)測器可處理已執(zhí)行短時預(yù)測的殘差信號數(shù)據(jù)，從而可去除長時相關(guān)信息。量化單元140可計算輸入的比特率的步長?？商幚砹炕瘑卧?40的量化的采樣點和附加信息以去除可能包括(例如)算術(shù)編碼或霍夫曼編碼的統(tǒng)計相關(guān)信息?？梢砸孕∮?21cbpS的比特率來操作參數(shù)立體聲處理單元150。此外，擴展運動圖像專家組(MPEG)立體聲處理單元可被用作參數(shù)立體聲處理單元150。高頻信號處理單元 160可有效地對高頻信號進行編碼。復(fù)用單元170可將上述單元中的一個或多個單元的輸出信號輸出為比特流。可使用壓縮方案(如算術(shù)編碼、霍夫曼編碼或任何其它合適的壓縮編碼)來產(chǎn)生比特流。圖2是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實施例的對音頻/語音信號進行解碼的設(shè)備的框圖。參照圖2，對音頻/語音信號進行解碼的設(shè)備可包括分辨率確定單元210、時域解碼單元220、反量化單元230、反信號變換單元M0、高頻信號處理單元250和參數(shù)立體聲處理單元洸0。分辨率確定單元210可基于關(guān)于時域編碼或頻域編碼的信息，確定當(dāng)前幀信號是高頻率分辨率信號還是高時間分辨率信號。所述信息可包括在比特流中。反量化單元230可基于分辨率確定單元210的輸出信號來對比特流進行反量化。時域220可從反量化單元230接收反量化的信號，從比特流中解碼出用于反線性預(yù)測的附加信息，并至少使用所述附加信息和所述反量化的信號來恢復(fù)高時間分辨率信號。反信號變換單元240可將來自時域解碼單元220的輸出信號和/或來自反量化單元230的反量化的信號反變換到時域的音頻信號或語音信號。反頻變調(diào)制重疊變換(FV-MLT)可以是反信號變換單元M0。高頻信號處理單元250可處理反變換的信號的高頻信號，參數(shù)立體聲處理單元 260可處理反變換的信號的立體聲信息?？蓪⒈忍亓鬏斎氲椒戳炕瘑卧?30、高頻信號處理單元250和參數(shù)立體聲處理單元沈0以對比特流進行解碼。圖3是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實施例的對音頻/語音信號進行編碼的設(shè)備的框圖。參照圖3，對音頻/語音信號進行編碼的設(shè)備可包括信號變換單元310、心理聲學(xué) 建模單元320、時間噪聲(temporal noise)整形單元330、高碼率(high rate)立體聲單元；340、量化單元350、高頻信號處理單元360和復(fù)用單元370。信號變換單元310可將輸入的音頻信號或語音信號變換為高頻率分辨率信號和/ 或高時間分辨率信號。改進離散余弦變換(MDCT)可被用作信號變換單元310。心理聲學(xué)建模單元320可控制信號變換單元310將輸入的音頻信號或語音信號變換為高頻率分辨率信號和/或高時間分辨率信號。時間噪聲整形單元330可對變換的信號的時域噪聲進行整形。高碼率立體聲單元340可對變換的信號的立體聲信息進行編碼。量化單元350可對從時間噪聲整形單元330和/或高碼率立體聲單元340輸出的信號進行量化。高頻信號處理單元360可處理音頻信號或語音信號的高頻信號。復(fù)用單元370可將上述的單元的每個單元的輸出信號輸出為比特流?？墒褂脡嚎s 方案(如算術(shù)編碼、霍夫曼編碼或任何其它適合的編碼)來產(chǎn)生比特流。圖4是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實施例的對音頻/語音信號進行解碼的設(shè)備的框圖。參照圖4，對音頻/語音信號進行解碼的設(shè)備可包括反量化單元410、高碼率立體聲系統(tǒng)/解碼器420、時間噪聲整形器/解碼器430、反信號變換單元440和高頻信號處理單元450。反量化單元410可對比特流進行反量化。高碼率立體聲系統(tǒng)/解碼器420可對反量化的信號進行解碼。時間噪聲整形器/ 解碼器430可對在對音頻/語音信號進行編碼的設(shè)備中執(zhí)行時域整形的信號進行解碼。反信號變換單元440可將解碼的信號反變換到時域的音頻信號或語音信號。反 MDCT可被用作反信號變換單元440。高頻信號處理單元450可處理反變換的解碼的信號的高頻信號。圖5是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實施例的對音頻/語音信號進行編碼的設(shè)備的框圖。參照圖5，CELP單元可包括在對音頻/語音信號進行編碼的設(shè)備的時域編碼單元 520中，然而，CELP單元可包括在圖1中的量化單元140中。也就是說，時域編碼單元520可包括短時預(yù)測器、長時預(yù)測器和CELP單元。CELP 單元可指示模擬去除了相關(guān)信息的信號的激勵建模模塊。當(dāng)信號變換單元在心理聲學(xué)建模單元的控制下，將輸入的音頻信號或語音信號變換為高時間分辨率信號時，時域編碼單元130可在不在頻譜量化單元510中對高時間分辨率信號進行量化的情況下，或作為可選，通過使在頻譜量化單元510中對高時間分辨率信號的量化最小化，來對變換的高時域分辨信號進行編碼。包括在時域編碼單元520中的CELP單元可對短時相關(guān)信息和長時相關(guān)信息的殘差信號進行編碼。圖6是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實施例的對音頻/語音信號進行編碼的設(shè)備的框圖。參照圖6，圖1中示出的對音頻/語音信號進行編碼的設(shè)備還可包括切換單元 610。切換單元610可至少使用關(guān)于時域編碼或頻域編碼的信息來選擇任何一個或多個量化單元620的量化和時域編碼單元630的編碼。量化單元620可以是頻譜量化單元。圖7是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實施例的對音頻/語音信號進行解碼的設(shè)備的框圖。參照圖7，圖2中示出的對音頻/語音信號進行解碼的設(shè)備還可包括切換單元 710。切換單元710可至少根據(jù)分辨率確定單元的確定來控制切換到時域解碼單元730或頻譜反量化單元720。圖8是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實施例的對音頻/語音信號進行編碼的設(shè)備的框圖。參照圖8，圖1中示出的對音頻/語音信號進行編碼的設(shè)備還可包括下采樣單元 810。下采樣單元810可將輸入的信號下采樣為低頻信號?？赏ㄟ^下采樣來產(chǎn)生低頻信號，當(dāng)?shù)皖l信號處于高碼率和低碼率的雙重碼率時，可執(zhí)行下采樣。也就是說，當(dāng)以與高頻信號處理單元的采樣率的一半或四分之一相應(yīng)的低采樣率操作低頻信號編碼方案的采樣頻率時，可利用低頻信號。當(dāng)參數(shù)立體聲處理單元包括在對音頻/語音信號進行編碼的設(shè)備中時，可在參數(shù)立體聲處理單元執(zhí)行正交鏡像濾波器(QMF)合成時執(zhí)行下采樣。在這種情況下，高碼率可以是高于641ibpS的碼率，低碼率可以是低于641ibpS的碼率。圖9是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實施例的對音頻/語音信號進行解碼的設(shè)備的框圖。分辨率確定單元910可至少部分基于關(guān)于時域編碼或頻域編碼的信息，確定當(dāng)前幀信號是高頻率分辨率信號還是高時間分辨率信號。所述信息可包括在比特流中。反量化單元920可基于分辨率確定單元910的輸出信號來對比特流進行反量化。時域解碼單元930可從反量化單元920接收編碼的殘差信號，從比特流中解碼出用于反線性預(yù)測的附加信息，并使用所述附加信息和所述殘差信號來恢復(fù)高時間分辨率信號。反信號變換單元940可將來自時域解碼單元930的輸出信號和/或來自反量化單元920的反量化的信號反變換到時域的音頻信號或語音信號。在這種情況下，高頻信號處理單元950可在圖9的對音頻/語音信號進行解碼的設(shè)備中執(zhí)行上采樣。圖10是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實施例的對音頻/語音信號進行編碼的設(shè)備的框圖。參照圖10，圖5中示出的對音頻/語音信號進行編碼的設(shè)備還可包括下采樣單元 1010。也就是說，可通過下采樣產(chǎn)生低頻信號。當(dāng)應(yīng)用參數(shù)立體聲處理單元1020時，在參數(shù)立體聲處理單元1020可執(zhí)行QMF合成以產(chǎn)生縮混(downmix)信號時，下采樣單元1010可執(zhí)行下采樣。時域編碼單元1030可包括短時預(yù)測器、長時預(yù)測器和CELP單元。圖11是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實施例的對音頻/語音信號進行解碼的設(shè)備的框圖。分辨率確定單元1110可基于關(guān)于時域編碼或頻域編碼的信息，確定當(dāng)前幀信號是高頻率分辨率信號還是高時間分辨率信號。所述信息可包括在比特流中。當(dāng)分辨率確定單元1110確定當(dāng)前幀信號是高頻率分辨率信號時，頻譜反量化單元1130可至少部分基于分辨率確定單元1110的輸出信號來對比特流進行反量化。當(dāng)分辨率確定單元1110確定當(dāng)前幀信號是高時間分辨率信號時，時域解碼單元 1120可恢復(fù)高時間分辨率信號。反信號變換單元1140可將來自時域解碼單元1120的輸出信號和/或來自頻譜反量化單元1130的反量化的信號反變換到時域的音頻信號或語音信號。此外，高頻信號處理單元1150可在圖11的對音頻/語音信號進行解碼的設(shè)備中執(zhí)行上采樣。圖12是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實施例的對音頻/語音信號進行編碼的設(shè)備的框圖。參照圖12，圖6中示出的對音頻/語音信號進行編碼的設(shè)備還包括下采樣單元 1210。也就是說，可通過下采樣來產(chǎn)生低頻信號。當(dāng)應(yīng)用參數(shù)立體聲處理單元1220時，在參數(shù)立體聲處理單元1220執(zhí)行QMF合成時，下采樣單元1210可執(zhí)行下采樣。圖12的對音頻/語音信號進行編碼的設(shè)備的上/下采樣因子可以是(例如)高頻信號處理單元的采樣率的一半或四分之一。也就是說，當(dāng)以48kHz輸入信號時，可通過上 /下采樣使用24kHz或12kHz。圖13是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實施例的對音頻/語音信號進行解碼的設(shè)備的框圖。參照圖13，圖2中示出的對音頻/語音信號進行解碼的設(shè)備還可包括切換單元。也就是說，切換單元可控制切換到時域解碼單元1320或頻譜反量化單元1310。圖14是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實施例的對音頻/語音信號進行編碼的設(shè)備的框圖。參照圖14，圖1中示出的對音頻/語音信號進行編碼的設(shè)備和圖3中示出的對音頻/語音信號進行編碼的設(shè)備可至少部分組合。也就是說，當(dāng)作為低碼率確定單元1430基于預(yù)定的低碼率和高碼率的確定的結(jié) 果，變換的信號處于低碼率時，可操作信號變換單元1410、時域編碼單元1440和量化單元 1470。當(dāng)變換的信號處于高碼率時，可操作信號變換單元1410、時間噪聲整形單元1450和高碼率立體聲單元1460?？苫陬A(yù)定標(biāo)準打開/關(guān)閉參數(shù)立體聲處理單元1481和高頻信號處理單元1491。此外，可不同時操作高碼率立體聲單元1460和參數(shù)立體聲處理單元1481。此外，可基于預(yù) 定信息在高頻信號處理確定單元1490和參數(shù)立體聲處理確定單元1480的控制下，分別操作高頻信號處理單元1491和參數(shù)立體聲處理單元1481。圖15是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實施例的對音頻/語音信號進行解碼的設(shè)備的框圖。參照圖15，圖2中示出的對音頻/語音信號進行解碼的設(shè)備和圖4中示出的對音頻/語音信號進行解碼的設(shè)備可至少部分組合。也就是說，當(dāng)作為低碼率確定單元1510的確定的結(jié)果，變換的信號處于高碼率時，可操作高碼率立體聲系統(tǒng)/解碼器1520、時間噪聲整形器/解碼器1530和反信號變換單元1540。當(dāng)變換的信號處于低碼率時，可操作分辨率確定單元1550、時域解碼單元1560 和高頻信號處理單元1570。此外，可基于預(yù)定信息在高頻信號處理確定單元和參數(shù)立體聲處理確定單元的控制下，分別操作高頻信號處理單元1570和參數(shù)立體聲處理單元1580。圖16是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實施例的對音頻/語音信號進行編碼的方法的流程圖。在操作S1610中，輸入的音頻信號或語音信號可被變換為頻域。在操作S1620中，可確定是否要執(zhí)行變換到時域。還可進一步包括對輸入的音頻信號或語音信號進行下采樣的操作。至少根據(jù)操作S 1620中確定的結(jié)果，在操作S 1630中，輸入的音頻信號或語音信號可被變換為高頻率分辨率信號和/或高時間分辨率信號。也就是說，當(dāng)將要執(zhí)行變換到時域時，在操作S 1630中，輸入的音頻信號或語音信號可被變換為高時間分辨率信號并可被量化。當(dāng)將不執(zhí)行變換到時域時，在操作S 1640，輸入的音頻信號或語音信號可被量化并被編碼。
圖17是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實施例的對音頻/語音信號進行解碼的方法的流程圖。在操作S 1710中，可確定當(dāng)前幀信號是高頻率分辨率信號還是高時間分辨率信號。在這種情況下，所述確定可基于關(guān)于時域編碼或頻域編碼的信息，并且所述信息可包括在比特流中。在操作S 1720中，可對比特流進行反量化。在操作S 1730中，可接收反量化的信號，可從比特流中解碼出用于反線性預(yù)測的附加信息，并且可使用所述附加信息和編碼的殘差信號來恢復(fù)高時間分辨率信號。在操作S 1740中，可將從時域解碼單元輸出的信號和/或來自反量化單元的反量化的信號反變換到時域的音頻信號或語音信號。本總體發(fā)明構(gòu)思還可實現(xiàn)為計算機可讀介質(zhì)上的計算機可讀代碼。計算機可讀介質(zhì)可包括計算機可讀記錄介質(zhì)和計算機可讀傳輸介質(zhì)。計算機可讀記錄介質(zhì)是可將數(shù)據(jù)存儲為其后可由計算機系統(tǒng)讀取的程序的任何數(shù)據(jù)存儲裝置。所述計算機可讀記錄介質(zhì)的示例包括只讀存儲器(ROM)、隨機存取存儲器(RAM)、CD-ROM、磁帶、軟盤和光學(xué)數(shù)據(jù)存儲裝置。所述計算機可讀記錄介質(zhì)也可分布于聯(lián)網(wǎng)的計算機系統(tǒng)上，以便所述計算機可讀代碼以分布方式被存儲和執(zhí)行。計算機可讀傳輸介質(zhì)可通過載波或信號發(fā)送(例如，通過因特網(wǎng)的有線數(shù)據(jù)傳輸或無線數(shù)據(jù)傳輸)。此外，本總體發(fā)明構(gòu)思所屬的領(lǐng)域的程序員可容易解釋實現(xiàn)本總體發(fā)明構(gòu)思的功能程序、代碼和代碼段。雖然已經(jīng)示出和描述了本總體發(fā)明構(gòu)思的若干示例實施例，但是本領(lǐng)域的技術(shù)人員應(yīng)該理解，在不脫離本總體發(fā)明構(gòu)思的原理和精神的范圍內(nèi)可對這些示例實施例進行改變，本總體發(fā)明構(gòu)思的范圍由權(quán)利要求及其等同物限定。
權(quán)利要求
1.一種對音頻/語音信號進行編碼的設(shè)備，所述設(shè)備包括信號變換單元，將輸入的音頻信號或語音信號變換為高頻率分辨率信號和高時間分辨率信號中的至少一個；心理聲學(xué)建模單元，控制信號變換單元；時域編碼單元，基于語音建模，對由信號變換單元變換的信號進行編碼；量化單元，對從信號變換單元和時域編碼單元中的至少一個輸出的信號進行量化。
2.如權(quán)利要求1所述的設(shè)備，其中，量化單元包括碼激勵線性預(yù)測(CELP)，模擬去除了相關(guān)信息的信號。
3.一種對音頻/語音信號進行編碼的設(shè)備，所述設(shè)備包括參數(shù)立體聲處理單元，處理輸入的音頻信號或語音信號的立體聲信息；高頻信號處理單元，處理輸入的音頻信號或語音信號的高頻信號；信號變換單元，將輸入的音頻信號或語音信號變換為高頻率分辨率信號和高時間分辨率信號中的至少一個；心理聲學(xué)建模單元，控制信號變換單元；時域編碼單元，基于語音建模，對由信號變換單元變換的信號進行編碼；量化單元，對從信號變換單元和時域編碼單元中的至少一個輸出的信號進行量化。
4.如權(quán)利要求3所述的設(shè)備，其中，時域編碼單元包括CELP，模擬去除了相關(guān)信息的信號。
5.如權(quán)利要求3所述的設(shè)備，其中，量化單元是頻譜量化單元，還包括切換單元，根據(jù)變換的音頻信號或語音信號是高頻率分辨率信號還是高時間分辨率信號，選擇來自的頻譜量化單元和時域編碼單元的輸出信號中的任何一個。
6.如權(quán)利要求3所述的設(shè)備，還包括下采樣單元，對音頻信號或語音信號進行下采樣。
7.如權(quán)利要求3所述的設(shè)備，其中，信號變換單元包括頻變調(diào)制重疊變換(FV-MLT)和改進離散余弦變換(MDCT)中的至少一個。
8.如權(quán)利要求3所述的設(shè)備，其中，心理聲學(xué)建模單元在量化期間將關(guān)于噪聲的信息提供給量化單元。
9.如權(quán)利要求3所述的設(shè)備，其中，時域編碼單元還包括預(yù)測單元，將語音建模應(yīng)用到由信號變換單元變換的信號，并去除相關(guān)信息。
10.一種對音頻/語音信號進行解碼的設(shè)備，所述設(shè)備包括分辨率確定單元，基于關(guān)于時域編碼或頻域編碼的信息，確定當(dāng)前幀信號是高頻率分辨率信號還是高時間分辨率信號，所述信息包括在比特流中；反量化單元，當(dāng)分辨率確定單元確定信號是高頻率分辨率信號時，對比特流進行反量化；時域解碼單元，從比特流中解碼出用于反線性預(yù)測的附加信息，并使用所述附加信息來恢復(fù)高時間分辨率信號；反信號變換單元，將來自時域解碼單元的輸出信號和來自反量化單元的輸出信號中的至少一個反變換到時域的音頻信號或語音信號。
11.如權(quán)利要求10的設(shè)備，其中，所述設(shè)備還包括以下單元中的至少一個高頻信號解碼單元，處理反變換的信號的高頻信號；參數(shù)立體聲處理單元，處理反變換的信號的立體聲信息。
12.—種對音頻/語音信號進行編碼的設(shè)備，所述設(shè)備包括信號變換單元，將輸入的音頻信號或語音信號變換為高頻率分辨率信號和高時間分辨率信號中的至少一個；心理聲學(xué)建模單元，控制信號變換單元；時間噪聲整形單元，對變換的高頻率分辨率信號和變換的高時間分辨率信號中的至少一個進行整形；高碼率立體聲單元，對變換的信號的立體聲信息進行編碼；量化單元，對從時間噪聲整形單元和高碼率立體聲單元中的至少一個輸出的信號進行量化。
13.如權(quán)利要求12所述的設(shè)備，還包括高頻信號處理單元，處理音頻信號或語音信號的高頻信號。
14.一種對音頻/語音信號進行解碼的設(shè)備，所述設(shè)備包括反量化單元，對比特流進行反量化；高碼率立體聲系統(tǒng)/解碼器，對反量化的信號進行解碼；時間噪聲整形器/解碼器，處理由高碼率立體聲系統(tǒng)/解碼器解碼的信號；反信號變換單元，將處理的信號反變換到時域的音頻信號或語音信號，其中，通過將輸入的音頻信號或語音信號變換為高頻率分辨率信號和高時間分辨率信號中的至少一個來產(chǎn)生比特流。
15.如權(quán)利要求14所述的設(shè)備，還包括高頻信號處理單元，處理反變換的信號的高頻信號。
16.一種對音頻/語音信號進行編碼的設(shè)備，所述設(shè)備包括信號變換單元，將輸入的音頻信號或語音信號變換為高頻率分辨率信號和高時間分辨率信號中的至少一個；心理聲學(xué)建模單元，控制信號變換單元；低碼率確定單元，確定變換的信號是否具有低碼率；時域編碼單元，當(dāng)變換的信號具有低碼率時，基于語音建模來對變換的信號進行編碼；時間噪聲整形單元，對變換的信號進行整形；高碼率立體聲單元，對整形的信號的立體聲信息進行編碼；量化單元，對來自高碼率立體聲單元的輸出信號和來自時域編碼單元的輸出信號中的至少一個進行量化。
17.如權(quán)利要求16所述的設(shè)備，還包括參數(shù)立體聲處理確定單元，基于預(yù)定信息確定是否操作參數(shù)立體聲處理單元；參數(shù)立體聲處理單元，當(dāng)確定參數(shù)立體聲處理單元將被操作時，處理輸入的高頻信號的立體聲信息；高頻信號處理確定單元，基于其它預(yù)定信息確定是否操作高頻信號處理單元；高頻信號處理單元，當(dāng)確定高頻信號處理單元將被操作時，處理輸入的高頻信號。
18.一種對音頻/語音信號進行編碼的方法，所述方法包括將輸入的音頻信號或語音信號變換為高頻率分辨率信號和高時間分辨率信號中的至少一個，并基于心理聲學(xué)建?？刂谱儞Q的信號；至少部分基于語音建模，對變換的信號進行時間編碼；對變換的信號和時間編碼的信號中的至少一個進行量化。
19.一種對音頻/語音信號進行解碼的方法，所述方法包括至少部分基于包括在比特流中的關(guān)于時域編碼或頻域編碼的信息，確定當(dāng)前幀信號是高頻率分辨率信號還是高時間分辨率信號；當(dāng)所述信號被確定為高頻率分辨率信號時，對比特流進行反量化；從比特流中解碼出用于反線性預(yù)測的附加信息，并使用所述附加信息來恢復(fù)高時間分辨率信號；將恢復(fù)的信號和反量化的信號中的至少一個反變換到時域的音頻信號或語音信號。
20.一種對音頻信號和語音信號進行編碼的方法，所述方法包括接收至少一個音頻信號和至少一個語音信號；將接收的音頻信號和接收的語音信號中的至少一個變換為頻率分辨率信號和時間分辨率信號中的至少一個；對變換的信號進行編碼；對變換的信號和編碼的信號中的至少一個進行量化。
21.一種對音頻信號和語音信號進行解碼的方法，所述方法包括使用接收的信號的比特流中的關(guān)于時域編碼或頻域編碼的信息，來確定當(dāng)前幀信號高頻率分辨率信號還是時間分辨率信號；當(dāng)接收的信號是頻率分辨率信號時，對比特流進行反量化；從比特流中的信息進行反線性預(yù)測，并使用所述信息來恢復(fù)時間分辨率信號；將反量化的信號和恢復(fù)的時域分辨率信號中的至少一個反變換到時域的音頻信號或語音信號。
全文摘要
提供了一種對音頻/語音信號進行編碼和解碼的方法和設(shè)備。輸入的音頻信號或語音信號可被變換為高頻率分辨率信號和高時間分辨率信號中的至少一個?？赏ㄟ^確定合適的分辨率來對信號進行編碼，可對編碼的信號進行解碼，從而，可處理音頻信號、語音信號以及音頻信號和語音信號的混合信號。
文檔編號G10L19/12GK102150202SQ200980135987
公開日2011年8月10日申請日期2009年7月14日優(yōu)先權(quán)日2008年7月14日
發(fā)明者吳殷美, 成昊相, 朱基峴, 金美英, 金重會申請人:三星電子株式會社

完整全部詳細技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：吳殷美
技術(shù)所有人：三星電子株式會社
我是此專利的發(fā)明人

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

音頻編解碼芯片相關(guān)技術(shù)

音頻編解碼相關(guān)技術(shù)

silk音頻編解碼協(xié)議相關(guān)技術(shù)

音頻編解碼技術(shù)相關(guān)技術(shù)

音頻編解碼matlab相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

對音頻/語音信號進行編碼和解碼的方法和設(shè)備的制作方法