亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行編碼和解碼的方法和設(shè)備的制造方法

文檔序號(hào):10595527閱讀:236來(lái)源:國(guó)知局
對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行編碼和解碼的方法和設(shè)備的制造方法
【專利摘要】提供了一種對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行編碼和解碼的方法和設(shè)備。輸入的音頻信號(hào)或語(yǔ)音信號(hào)可被變換為高頻率分辨率信號(hào)和高時(shí)間分辨率信號(hào)中的至少一個(gè)??赏ㄟ^(guò)確定合適的分辨率來(lái)對(duì)信號(hào)進(jìn)行編碼,可對(duì)編碼的信號(hào)進(jìn)行解碼,從而,可處理音頻信號(hào)、語(yǔ)音信號(hào)以及音頻信號(hào)和語(yǔ)音信號(hào)的混合信號(hào)。
【專利說(shuō)明】
對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行編碼和解碼的方法和設(shè)備[0001 ] 本申請(qǐng)是申請(qǐng)日為2009年7月14日,申請(qǐng)?zhí)枮椤?00980135987.5”,標(biāo)題為“對(duì)音頻/ 語(yǔ)音信號(hào)進(jìn)行編碼和解碼的方法和設(shè)備”的發(fā)明專利申請(qǐng)的分案申請(qǐng)。
技術(shù)領(lǐng)域
[0002]示例實(shí)施例涉及一種對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行編碼和解碼的方法和設(shè)備。【背景技術(shù)】
[0003]編解碼器可被分為語(yǔ)音編解碼器和音頻編解碼器。語(yǔ)音編解碼器可使用語(yǔ)音建模在50Hz到7kHz的范圍的頻帶中對(duì)信號(hào)進(jìn)行編碼/解碼。一般來(lái)說(shuō),語(yǔ)音編解碼器可通過(guò)對(duì)聲帶和聲道進(jìn)行建模來(lái)提取語(yǔ)音信號(hào)的參數(shù),以執(zhí)行編碼和解碼。音頻編解碼器可通過(guò)應(yīng)用心理聲學(xué)建模(如高效高級(jí)音頻編碼(HE-AAC))在0Hz到24Hz的范圍的頻帶中對(duì)信號(hào)進(jìn)行編碼/解碼。音頻編解碼器可基于人類聽(tīng)覺(jué)特征,通過(guò)去除不易察覺(jué)的信號(hào)來(lái)執(zhí)行編碼和解碼。
[0004]語(yǔ)音編解碼器雖然適合于對(duì)語(yǔ)音信號(hào)進(jìn)行編碼/解碼,但由于聲音質(zhì)量的下降,語(yǔ)音編解碼器不適合于對(duì)音頻信號(hào)進(jìn)行編碼/解碼。此外,當(dāng)音頻編解碼器對(duì)語(yǔ)音信號(hào)進(jìn)行編碼/解碼時(shí),可能降低信號(hào)壓縮效率。
【發(fā)明內(nèi)容】

[0005]示例實(shí)施例可提供一種對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行編碼和解碼的方法和設(shè)備,所述方法和設(shè)備可有效地對(duì)語(yǔ)音信號(hào)、音頻信號(hào)以及語(yǔ)音信號(hào)和音頻信號(hào)的混合信號(hào)進(jìn)行編碼和解碼。
[0006]本總體發(fā)明構(gòu)思的另外特征和效用將在下面的描述中部分地闡明,并且從描述中部分是清楚的,或者通過(guò)本總體發(fā)明構(gòu)思的實(shí)施可以被得知。
[0007]根據(jù)本總體發(fā)明構(gòu)思的示例實(shí)施例,可提供一種對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行編碼的設(shè)備,所述設(shè)備包括:信號(hào)變換單元,將輸入的音頻信號(hào)或語(yǔ)音信號(hào)變換為高頻率分辨率信號(hào)和高時(shí)間分辨率信號(hào)中的至少一個(gè);心理聲學(xué)建模單元,控制信號(hào)變換單元;時(shí)域編碼單元,基于語(yǔ)音建模,對(duì)由信號(hào)變換單元變換的信號(hào)進(jìn)行編碼;量化單元,對(duì)從信號(hào)變換單元和時(shí)域編碼單元中的至少一個(gè)輸出的信號(hào)進(jìn)行量化。
[0008]根據(jù)本總體發(fā)明構(gòu)思的示例實(shí)施例,還可提供一種對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行編碼的設(shè)備,所述設(shè)備包括:參數(shù)立體聲處理單元,處理輸入的音頻信號(hào)或語(yǔ)音信號(hào)的立體聲信息;高頻信號(hào)處理單元,處理輸入的音頻信號(hào)或語(yǔ)音信號(hào)的高頻信號(hào);信號(hào)變換單元,將輸入的音頻信號(hào)或語(yǔ)音信號(hào)變換為高頻率分辨率信號(hào)和高時(shí)間分辨率信號(hào)中的至少一個(gè);心理聲學(xué)建模單元,控制信號(hào)變換單元;時(shí)域編碼單元,基于語(yǔ)音建模,對(duì)由信號(hào)變換單元變換的信號(hào)進(jìn)行編碼;量化單元,對(duì)從信號(hào)變換單元和時(shí)域編碼單元中的至少一個(gè)輸出的信號(hào)進(jìn)行量化。
[0009]根據(jù)本總體發(fā)明構(gòu)思的示例實(shí)施例,還可提供了一種對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行編碼的設(shè)備,所述設(shè)備包括:信號(hào)變換單元,將輸入的音頻信號(hào)或語(yǔ)音信號(hào)變換為高頻率分辨率信號(hào)和高時(shí)間分辨率信號(hào)中的至少一個(gè);心理聲學(xué)建模單元,控制信號(hào)變換單元;低碼率確定單元,確定變換的信號(hào)是否處于低碼率;時(shí)域編碼單元,當(dāng)變換的信號(hào)處于低碼率時(shí),基于語(yǔ)音建模,對(duì)變換的信號(hào)進(jìn)行編碼;時(shí)間噪聲整形單元,對(duì)變換的信號(hào)進(jìn)行整形;高碼率立體聲單元,對(duì)整形的信號(hào)的立體聲信息進(jìn)行編碼;量化單元,對(duì)來(lái)自高碼率立體聲單元的輸出信號(hào)和來(lái)自時(shí)域編碼單元的輸出信號(hào)中的至少一個(gè)進(jìn)行量化。
[0010]根據(jù)本總體發(fā)明構(gòu)思的示例實(shí)施例,還可提供一種對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行解碼的設(shè)備,所述設(shè)備包括:分辨率確定單元,基于關(guān)于時(shí)域編碼或頻域編碼的信息,確定當(dāng)前幀信號(hào)是高頻率分辨率信號(hào)還是高時(shí)間分辨率信號(hào),所述信息包括在比特流中;反量化單元, 當(dāng)分辨率確定單元確定所述信號(hào)是高頻率分辨率信號(hào)時(shí),對(duì)比特流進(jìn)行反量化;時(shí)域解碼單元,從比特流中解碼出用于反線性預(yù)測(cè)的附加信息,并使用該附加信息來(lái)恢復(fù)高時(shí)間分辨率信號(hào);反信號(hào)變換單元,將來(lái)自時(shí)域解碼單元的輸出信號(hào)和來(lái)自反量化單元的輸出信號(hào)中的至少一個(gè)反變換到時(shí)域的音頻信號(hào)或語(yǔ)音信號(hào)。
[0011]根據(jù)本總體發(fā)明構(gòu)思的示例實(shí)施例,還可提供一種對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行解碼的設(shè)備,所述設(shè)備包括:反量化單元,對(duì)比特流進(jìn)行反量化;高碼率立體聲系統(tǒng)/解碼器,對(duì)反量化的信號(hào)進(jìn)行解碼;時(shí)間噪聲整形器/解碼器,處理由高碼率立體聲系統(tǒng)/解碼器解碼的信號(hào);反信號(hào)變換單元,將處理的信號(hào)反變換到時(shí)域的音頻信號(hào)或語(yǔ)音信號(hào),其中,通過(guò)將輸入的音頻信號(hào)或語(yǔ)音信號(hào)變換為高頻率分辨率信號(hào)和高時(shí)間分辨率信號(hào)中的至少一個(gè)來(lái)產(chǎn)生比特流。
[0012]根據(jù)本總體發(fā)明構(gòu)思的示例實(shí)施例,對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行編碼和解碼的方法和設(shè)備可有效地對(duì)語(yǔ)音信號(hào)、音頻信號(hào)以及語(yǔ)音信號(hào)和音頻信號(hào)的混合信號(hào)進(jìn)行編碼和解碼。
[0013]此外,根據(jù)本總體發(fā)明構(gòu)思的示例性實(shí)施例,對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行編碼和解碼的方法和設(shè)備可使用較少比特執(zhí)行編碼和解碼,從而可提高聲音質(zhì)量。
[0014]本總體發(fā)明構(gòu)思的另外效用將在下面的描述中部分地闡明,并且從描述中部分是清楚的,或者通過(guò)實(shí)施例的實(shí)施可以被得知。
[0015]本總體發(fā)明構(gòu)思的示例性實(shí)施例還提供了一種對(duì)音頻信號(hào)和語(yǔ)音信號(hào)進(jìn)行編碼的方法,所述方法包括:接收至少一個(gè)音頻信號(hào)和至少一個(gè)語(yǔ)音信號(hào);將接收的音頻信號(hào)和接收的語(yǔ)音信號(hào)中的至少一個(gè)變換為頻率分辨率信號(hào)和時(shí)域分辨率信號(hào)中的至少一個(gè);對(duì)變換的信號(hào)進(jìn)行編碼;對(duì)變換的信號(hào)和編碼的信號(hào)中的至少一個(gè)進(jìn)行量化。
[0016]本總體發(fā)明構(gòu)思的示例性實(shí)施例還提供了一種對(duì)音頻信號(hào)和語(yǔ)音信號(hào)進(jìn)行解碼的方法,所述方法包括:使用接收的信號(hào)的比特流中的關(guān)于時(shí)域編碼或頻域編碼的信息,來(lái)確定當(dāng)前幀信號(hào)是頻率分辨率信號(hào)還是時(shí)域分辨率信號(hào);當(dāng)接收的信號(hào)是頻率分辨率信號(hào)時(shí),對(duì)比特流進(jìn)行反量化;從比特流中的信息進(jìn)行反線性預(yù)測(cè),并使用該信息來(lái)恢復(fù)時(shí)域分辨率信號(hào);將反量化的信號(hào)和恢復(fù)的時(shí)域分辨率信號(hào)中的至少一個(gè)反變換到時(shí)域的音頻信號(hào)或語(yǔ)音信號(hào)?!靖綀D說(shuō)明】
[0017]從下面通過(guò)結(jié)合附圖對(duì)示例實(shí)施例的描述中,本總體發(fā)明構(gòu)思的這些和/或其它特征及效用將會(huì)變得清楚,并且更易于理解,其中:
[0018]圖1是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實(shí)施例的對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行編碼的設(shè)備的框圖;
[0019]圖2是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實(shí)施例的對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行解碼的設(shè)備的框圖;
[0020]圖3是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實(shí)施例的對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行編碼的設(shè)備的框圖;
[0021]圖4是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實(shí)施例的對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行解碼的設(shè)備的框圖;
[0022]圖5是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實(shí)施例的對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行編碼的設(shè)備的框圖;
[0023]圖6是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實(shí)施例的對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行編碼的設(shè)備的框圖;
[0024]圖7是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實(shí)施例的對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行解碼的設(shè)備的框圖;
[0025]圖8是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實(shí)施例的對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行編碼的設(shè)備的框圖;
[0026]圖9是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實(shí)施例的對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行解碼的設(shè)備的框圖;
[0027]圖10是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實(shí)施例的對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行編碼的設(shè)備的框圖;
[0028]圖11是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實(shí)施例的對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行解碼的設(shè)備的框圖;
[0029]圖12是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實(shí)施例的對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行編碼的設(shè)備的框圖;
[0030]圖13是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實(shí)施例的對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行解碼的設(shè)備的框圖;
[0031]圖14是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實(shí)施例的對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行編碼的設(shè)備的框圖;
[0032]圖15是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實(shí)施例的對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行解碼的設(shè)備的框圖;
[0033]圖16是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實(shí)施例的對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行編碼的方法的流程圖;
[0034]圖17是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實(shí)施例的對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行解碼的方法的流程圖?!揪唧w實(shí)施方式】
[0035]現(xiàn)在將詳細(xì)地參照示例實(shí)施例,其示例在附圖中示出,其中,相同的標(biāo)號(hào)始終表示相同的元件。以下通過(guò)參照附圖描述示例性實(shí)施例以解釋本公開(kāi)。
[0036]圖1是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實(shí)施例的對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行編碼的設(shè)備的框圖。[〇〇37]參照?qǐng)D1,對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行編碼的設(shè)備可包括:信號(hào)變換單元110、心理聲學(xué)建模單元120、時(shí)域編碼單元130、量化單元140、參數(shù)立體聲處理單元150、高頻信號(hào)處理單元160和復(fù)用單元170。[〇〇38]信號(hào)變換單元110可將輸入的音頻信號(hào)或語(yǔ)音信號(hào)變換為高分辨率信號(hào)(high frequentcy resolute1n signal)和/或高時(shí)間分辨率信號(hào)(high temporal resolut1n signal)〇[〇〇39]心理聲學(xué)建模單元120可控制信號(hào)變換單元110將輸入的音頻信號(hào)或語(yǔ)音信號(hào)變換為高頻率分辨率信號(hào)和/或高時(shí)間分辨率信號(hào)。[0〇4〇]具體地,心理聲學(xué)建模單元1 2 0可計(jì)算用于量化的掩蔽閾值(m a s k i n g threshold),并至少使用計(jì)算的掩蔽閾值來(lái)控制信號(hào)變換單元110將輸入的音頻信號(hào)或語(yǔ)音信號(hào)變換為高頻率分辨率信號(hào)和/或高時(shí)間分辨率信號(hào)。[〇〇41]時(shí)域編碼單元130可至少使用語(yǔ)音建模來(lái)對(duì)由信號(hào)變換單元110變換的信號(hào)進(jìn)行編碼。[〇〇42]具體地,心理聲學(xué)建模單元120可將信息信號(hào)提供給時(shí)域編碼單元130以控制時(shí)域編碼單元130。
[0043] 在這種情況下,時(shí)域編碼單元130可包括預(yù)測(cè)單元(未示出)。預(yù)測(cè)單元可通過(guò)對(duì)由信號(hào)變換單元110變換的信號(hào)應(yīng)用語(yǔ)音建模并去除相關(guān)信息來(lái)對(duì)數(shù)據(jù)進(jìn)行編碼。此外,預(yù)測(cè)單元可包括短時(shí)預(yù)測(cè)器和長(zhǎng)時(shí)預(yù)測(cè)器。
[0044] 量化單元140可對(duì)從信號(hào)變換單元110和/時(shí)域編碼單元130輸出的信號(hào)進(jìn)行量化和編碼。
[0045] 在這種情況下,量化單元140可包括碼激勵(lì)線性預(yù)測(cè)(CELP)單元,用于模擬去除了相關(guān)信息的信號(hào)。在圖1中未示出CELP單元。[〇〇46]參數(shù)立體聲處理單元150可處理輸入的音頻信號(hào)或語(yǔ)音信號(hào)的立體聲信息。高頻信號(hào)處理單元160可處理輸入的音頻信號(hào)或語(yǔ)音信號(hào)的高頻信息。
[0047]以下,將更詳細(xì)地描述對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行編碼的設(shè)備。[〇〇48]信號(hào)變換單元110可將頻譜系數(shù)劃分為多個(gè)頻帶。心理聲學(xué)建模單元120可分析頻譜特性并確定多個(gè)頻帶的每個(gè)頻帶的時(shí)域分辨率或頻域分辨率。
[0049]當(dāng)高時(shí)間分辨率適合于特定頻帶時(shí),可由利用變換方案的反變換單元(如反調(diào)制重疊變換(IMLT)單元)來(lái)對(duì)特定頻帶中的頻譜系數(shù)進(jìn)行變換,可由時(shí)域編碼單元130對(duì)變換的信號(hào)進(jìn)行編碼。反變換單元可包括在信號(hào)變換單元110中。
[0050] 在這種情況下,時(shí)域編碼單元130可包括短時(shí)預(yù)測(cè)器和長(zhǎng)時(shí)預(yù)測(cè)器。[〇〇51]當(dāng)輸入的信號(hào)是語(yǔ)音信號(hào)時(shí),由于提高的時(shí)域分辨率,時(shí)域編碼單元130可有效地反映語(yǔ)音產(chǎn)生單元的特性。具體地,短時(shí)預(yù)測(cè)器可處理從信號(hào)變換單元110接收的數(shù)據(jù),并可去除時(shí)域中的采樣點(diǎn)的短時(shí)相關(guān)信息。此外,長(zhǎng)時(shí)預(yù)測(cè)器可處理已執(zhí)行短時(shí)預(yù)測(cè)的殘差信號(hào)數(shù)據(jù),從而可去除長(zhǎng)時(shí)相關(guān)信息。
[0052]量化單元140可計(jì)算輸入的比特率的步長(zhǎng)??商幚砹炕瘑卧?40的量化的采樣點(diǎn)和附加信息以去除可能包括(例如)算術(shù)編碼或霍夫曼編碼的統(tǒng)計(jì)相關(guān)信息。
[0053] 可以以小于32kbps的比特率來(lái)操作參數(shù)立體聲處理單元150。此外,擴(kuò)展運(yùn)動(dòng)圖像專家組(MPEG)立體聲處理單元可被用作參數(shù)立體聲處理單元150。高頻信號(hào)處理單元160可有效地對(duì)高頻信號(hào)進(jìn)行編碼。[〇〇54]復(fù)用單元170可將上述單元中的一個(gè)或多個(gè)單元的輸出信號(hào)輸出為比特流??墒褂脡嚎s方案(如算術(shù)編碼、霍夫曼編碼或任何其它合適的壓縮編碼)來(lái)產(chǎn)生比特流。
[0055]圖2是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實(shí)施例的對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行解碼的設(shè)備的框圖。
[0056]參照?qǐng)D2,對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行解碼的設(shè)備可包括:分辨率確定單元210、時(shí)域解碼單元220、反量化單元230、反信號(hào)變換單元240、高頻信號(hào)處理單元250和參數(shù)立體聲處理單元260。
[0057]分辨率確定單元210可基于關(guān)于時(shí)域編碼或頻域編碼的信息,確定當(dāng)前幀信號(hào)是高頻率分辨率信號(hào)還是高時(shí)間分辨率信號(hào)。所述信息可包括在比特流中。[〇〇58]反量化單元230可基于分辨率確定單元210的輸出信號(hào)來(lái)對(duì)比特流進(jìn)行反量化。 [0〇59]時(shí)域解碼單元220可從反量化單元230接收反量化的信號(hào),從比特流中解碼出用于反線性預(yù)測(cè)的附加信息,并至少使用所述附加信息和所述反量化的信號(hào)來(lái)恢復(fù)高時(shí)間分辨率信號(hào)。
[0060]反信號(hào)變換單元240可將來(lái)自時(shí)域解碼單元220的輸出信號(hào)和/或來(lái)自反量化單元 230的反量化的信號(hào)反變換到時(shí)域的音頻信號(hào)或語(yǔ)音信號(hào)。[0061 ]反頻變調(diào)制重疊變換(FV-MLT)可以是反信號(hào)變換單元240。[〇〇62]高頻信號(hào)處理單元250可處理反變換的信號(hào)的高頻信號(hào),參數(shù)立體聲處理單元260 可處理反變換的信號(hào)的立體聲信息。[0〇63] 可將比特流輸入到反量化單元230、高頻信號(hào)處理單元250和參數(shù)立體聲處理單元 260以對(duì)比特流進(jìn)行解碼。
[0064]圖3是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實(shí)施例的對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行編碼的設(shè)備的框圖。[〇〇65]參照?qǐng)D3,對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行編碼的設(shè)備可包括:信號(hào)變換單元310、心理聲學(xué)建模單元320、時(shí)間噪聲(temporal noise)整形單元330、高碼率(high rate)立體聲單元 340、量化單元350、高頻信號(hào)處理單元360和復(fù)用單元370。
[0066]信號(hào)變換單元310可將輸入的音頻信號(hào)或語(yǔ)音信號(hào)變換為高頻率分辨率信號(hào)和/ 或高時(shí)間分辨率信號(hào)。[〇〇67]改進(jìn)離散余弦變換(MDCT)可被用作信號(hào)變換單元310。
[0068]心理聲學(xué)建模單元320可控制信號(hào)變換單元310將輸入的音頻信號(hào)或語(yǔ)音信號(hào)變換為高頻率分辨率信號(hào)和/或高時(shí)間分辨率信號(hào)。[〇〇69]時(shí)間噪聲整形單元330可對(duì)變換的信號(hào)的時(shí)域噪聲進(jìn)行整形。[〇〇7〇]高碼率立體聲單元340可對(duì)變換的信號(hào)的立體聲信息進(jìn)行編碼。[〇〇71] 量化單元350可對(duì)從時(shí)間噪聲整形單元330和/或高碼率立體聲單元340輸出的信號(hào)進(jìn)行量化。[〇〇72]高頻信號(hào)處理單元360可處理音頻信號(hào)或語(yǔ)音信號(hào)的高頻信號(hào)。
[0073]復(fù)用單元370可將上述的單元的每個(gè)單元的輸出信號(hào)輸出為比特流??墒褂脡嚎s方案(如算術(shù)編碼、霍夫曼編碼或任何其它適合的編碼)來(lái)產(chǎn)生比特流。
[0074]圖4是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實(shí)施例的對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行解碼的設(shè)備的框圖。[〇〇75]參照?qǐng)D4,對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行解碼的設(shè)備可包括:反量化單元410、高碼率立體聲系統(tǒng)/解碼器420、時(shí)間噪聲整形器/解碼器430、反信號(hào)變換單元440和高頻信號(hào)處理單元 450 〇[0〇76]反量化單元410可對(duì)比特流進(jìn)行反量化。[〇〇77]高碼率立體聲系統(tǒng)/解碼器420可對(duì)反量化的信號(hào)進(jìn)行解碼。時(shí)間噪聲整形器/解碼器430可對(duì)在對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行編碼的設(shè)備中執(zhí)行時(shí)域整形的信號(hào)進(jìn)行解碼。[〇〇78]反信號(hào)變換單元440可將解碼的信號(hào)反變換到時(shí)域的音頻信號(hào)或語(yǔ)音信號(hào)。反 MDCT可被用作反信號(hào)變換單元440。[〇〇79]高頻信號(hào)處理單元450可處理反變換的解碼的信號(hào)的高頻信號(hào)。
[0080]圖5是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實(shí)施例的對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行編碼的設(shè)備的框圖。
[0081]參照?qǐng)D5,CELP單元可包括在對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行編碼的設(shè)備的時(shí)域編碼單元 520中,然而,CELP單元可包括在圖1中的量化單元140中。[〇〇82]也就是說(shuō),時(shí)域編碼單元520可包括:短時(shí)預(yù)測(cè)器、長(zhǎng)時(shí)預(yù)測(cè)器和CELP單元。CELP單元可指示模擬去除了相關(guān)信息的信號(hào)的激勵(lì)建模模塊。
[0083]當(dāng)信號(hào)變換單元在心理聲學(xué)建模單元的控制下,將輸入的音頻信號(hào)或語(yǔ)音信號(hào)變換為高時(shí)間分辨率信號(hào)時(shí),時(shí)域編碼單元130可在不在頻譜量化單元510中對(duì)高時(shí)間分辨率信號(hào)進(jìn)行量化的情況下,或作為可選,通過(guò)使在頻譜量化單元510中對(duì)高時(shí)間分辨率信號(hào)的量化最小化,來(lái)對(duì)變換的高時(shí)域分辨信號(hào)進(jìn)行編碼。
[0084]包括在時(shí)域編碼單元520中的CELP單元可對(duì)短時(shí)相關(guān)信息和長(zhǎng)時(shí)相關(guān)信息的殘差f目號(hào)進(jìn)行編碼。
[0085]圖6是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實(shí)施例的對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行編碼的設(shè)備的框圖。[〇〇86]參照?qǐng)D6,圖1中示出的對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行編碼的設(shè)備還可包括切換單元610。
[0087]切換單元610可至少使用關(guān)于時(shí)域編碼或頻域編碼的信息來(lái)選擇任何一個(gè)或多個(gè)量化單元620的量化和時(shí)域編碼單元630的編碼。量化單元620可以是頻譜量化單元。
[0088]圖7是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實(shí)施例的對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行解碼的設(shè)備的框圖。
[0089]參照?qǐng)D7,圖2中示出的對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行解碼的設(shè)備還可包括切換單元710。 切換單元710可至少根據(jù)分辨率確定單元的確定來(lái)控制切換到時(shí)域解碼單元730或頻譜反量化單元720。
[0090]圖8是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實(shí)施例的對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行編碼的設(shè)備的框圖。
[0091]參照?qǐng)D8,圖1中示出的對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行編碼的設(shè)備還可包括下采樣單元 810〇[〇〇92]下采樣單元810可將輸入的信號(hào)下采樣為低頻信號(hào)??赏ㄟ^(guò)下采樣來(lái)產(chǎn)生低頻信號(hào),當(dāng)?shù)皖l信號(hào)處于高碼率和低碼率的雙重碼率時(shí),可執(zhí)行下采樣。也就是說(shuō),當(dāng)以與高頻信號(hào)處理單元的采樣率的一半或四分之一相應(yīng)的低采樣率操作低頻信號(hào)編碼方案的采樣頻率時(shí),可利用低頻信號(hào)。當(dāng)參數(shù)立體聲處理單元包括在對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行編碼的設(shè)備中時(shí),可在參數(shù)立體聲處理單元執(zhí)行正交鏡像濾波器(QMF)合成時(shí)執(zhí)行下采樣。[〇〇93] 在這種情況下,高碼率可以是高于64kbps的碼率,低碼率可以是低于64kbps的碼率。
[0094]圖9是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實(shí)施例的對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行解碼的設(shè)備的框圖。
[0095]分辨率確定單元910可至少部分基于關(guān)于時(shí)域編碼或頻域編碼的信息,確定當(dāng)前幀信號(hào)是高頻率分辨率信號(hào)還是高時(shí)間分辨率信號(hào)。所述信息可包括在比特流中。[〇〇96]反量化單元920可基于分辨率確定單元910的輸出信號(hào)來(lái)對(duì)比特流進(jìn)行反量化。 [〇〇97]時(shí)域解碼單元930可從反量化單元920接收編碼的殘差信號(hào),從比特流中解碼出用于反線性預(yù)測(cè)的附加信息,并使用所述附加信息和所述殘差信號(hào)來(lái)恢復(fù)高時(shí)間分辨率信號(hào)。[〇〇98]反信號(hào)變換單元940可將來(lái)自時(shí)域解碼單元930的輸出信號(hào)和/或來(lái)自反量化單元 920的反量化的信號(hào)反變換到時(shí)域的音頻信號(hào)或語(yǔ)音信號(hào)。[〇〇99]在這種情況下,高頻信號(hào)處理單元950可在圖9的對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行解碼的設(shè)備中執(zhí)行上采樣。
[0100]圖10是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實(shí)施例的對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行編碼的設(shè)備的框圖。
[0101]參照?qǐng)D10,圖5中示出的對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行編碼的設(shè)備還可包括下采樣單元 1010。也就是說(shuō),可通過(guò)下采樣產(chǎn)生低頻信號(hào)。
[0102]當(dāng)應(yīng)用參數(shù)立體聲處理單元1020時(shí),在參數(shù)立體聲處理單元1020可執(zhí)行QMF合成以產(chǎn)生縮混(downmix)信號(hào)時(shí),下采樣單元1010可執(zhí)行下采樣。時(shí)域編碼單元1030可包括短時(shí)預(yù)測(cè)器、長(zhǎng)時(shí)預(yù)測(cè)器和CELP單元。
[0103]圖11是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實(shí)施例的對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行解碼的設(shè)備的框圖。
[0104]分辨率確定單元1110可基于關(guān)于時(shí)域編碼或頻域編碼的信息,確定當(dāng)前幀信號(hào)是高頻率分辨率信號(hào)還是高時(shí)間分辨率信號(hào)。所述信息可包括在比特流中。
[0105]當(dāng)分辨率確定單元1110確定當(dāng)前幀信號(hào)是高頻率分辨率信號(hào)時(shí),頻譜反量化單元 1130可至少部分基于分辨率確定單元1110的輸出信號(hào)來(lái)對(duì)比特流進(jìn)行反量化。
[0106]當(dāng)分辨率確定單元1110確定當(dāng)前幀信號(hào)是高時(shí)間分辨率信號(hào)時(shí),時(shí)域解碼單元 1120可恢復(fù)高時(shí)間分辨率信號(hào)。
[0107]反信號(hào)變換單元1140可將來(lái)自時(shí)域解碼單元1120的輸出信號(hào)和/或來(lái)自頻譜反量化單元1130的反量化的信號(hào)反變換到時(shí)域的音頻信號(hào)或語(yǔ)音信號(hào)。
[0108]此外,高頻信號(hào)處理單元1150可在圖11的對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行解碼的設(shè)備中執(zhí)行上采樣。
[0109]圖12是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實(shí)施例的對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行編碼的設(shè)備的框圖。
[0110]參照?qǐng)D12,圖6中示出的對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行編碼的設(shè)備還包括下采樣單元 1210。也就是說(shuō),可通過(guò)下采樣來(lái)產(chǎn)生低頻信號(hào)。
[0111]當(dāng)應(yīng)用參數(shù)立體聲處理單元1220時(shí),在參數(shù)立體聲處理單元1220執(zhí)行QMF合成時(shí), 下采樣單元1210可執(zhí)行下采樣。
[0112]圖12的對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行編碼的設(shè)備的上/下采樣因子可以是(例如)高頻信號(hào)處理單元的采樣率的一半或四分之一。也就是說(shuō),當(dāng)以48kHz輸入信號(hào)時(shí),可通過(guò)上/下采樣使用24kHz或12kHz。
[0113]圖13是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實(shí)施例的對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行解碼的設(shè)備的框圖。
[0114]參照?qǐng)D13,圖2中示出的對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行解碼的設(shè)備還可包括切換單元。也就是說(shuō),切換單元可控制切換到時(shí)域解碼單元1320或頻譜反量化單元1310。
[0115]圖14是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實(shí)施例的對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行編碼的設(shè)備的框圖。
[0116]參照?qǐng)D14,圖1中示出的對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行編碼的設(shè)備和圖3中示出的對(duì)音頻/ 語(yǔ)音信號(hào)進(jìn)行編碼的設(shè)備可至少部分組合。
[0117]也就是說(shuō),當(dāng)作為低碼率確定單元1430基于預(yù)定的低碼率和高碼率的確定的結(jié)果,變換的信號(hào)處于低碼率時(shí),可操作信號(hào)變換單元1410、時(shí)域編碼單元1440和量化單元 1470。當(dāng)變換的信號(hào)處于高碼率時(shí),可操作信號(hào)變換單元1410、時(shí)間噪聲整形單元1450和高碼率立體聲單元1460。
[0118] 可基于預(yù)定標(biāo)準(zhǔn)打開(kāi)/關(guān)閉參數(shù)立體聲處理單元1481和高頻信號(hào)處理單元1491。 此外,可不同時(shí)操作高碼率立體聲單元1460和參數(shù)立體聲處理單元1481。此外,可基于預(yù)定信息在高頻信號(hào)處理確定單元1490和參數(shù)立體聲處理確定單元1480的控制下,分別操作高頻信號(hào)處理單元1491和參數(shù)立體聲處理單元1481。
[0119]圖15是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實(shí)施例的對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行解碼的設(shè)備的框圖。
[0120]參照?qǐng)D15,圖2中示出的對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行解碼的設(shè)備和圖4中示出的對(duì)音頻/ 語(yǔ)音信號(hào)進(jìn)行解碼的設(shè)備可至少部分組合。[〇121]也就是說(shuō),當(dāng)作為低碼率確定單元1510的確定的結(jié)果,變換的信號(hào)處于高碼率時(shí), 可操作高碼率立體聲系統(tǒng)/解碼器1520、時(shí)間噪聲整形器/解碼器1530和反信號(hào)變換單元 1540。當(dāng)變換的信號(hào)處于低碼率時(shí),可操作分辨率確定單元1550、時(shí)域解碼單元1560和高頻信號(hào)處理單元1570。此外,可基于預(yù)定信息在高頻信號(hào)處理確定單元和參數(shù)立體聲處理確定單元的控制下,分別操作高頻信號(hào)處理單元1570和參數(shù)立體聲處理單元1580。
[0122]圖16是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實(shí)施例的對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行編碼的方法的流程圖。
[0123]在操作S 1610中,輸入的音頻信號(hào)或語(yǔ)音信號(hào)可被變換為頻域。在操作S 1620中, 可確定是否要執(zhí)行變換到時(shí)域。
[0124]還可進(jìn)一步包括對(duì)輸入的音頻信號(hào)或語(yǔ)音信號(hào)進(jìn)行下采樣的操作。
[0125]至少根據(jù)操作S 1620中確定的結(jié)果,在操作S 1630中,輸入的音頻信號(hào)或語(yǔ)音信號(hào)可被變換為高頻率分辨率信號(hào)和/或高時(shí)間分辨率信號(hào)。
[0126]也就是說(shuō),當(dāng)將要執(zhí)行變換到時(shí)域時(shí),在操作S 1630中,輸入的音頻信號(hào)或語(yǔ)音信號(hào)可被變換為高時(shí)間分辨率信號(hào)并可被量化。當(dāng)將不執(zhí)行變換到時(shí)域時(shí),在操作S 1640,輸入的音頻信號(hào)或語(yǔ)音信號(hào)可被量化并被編碼。
[0127]圖17是示出根據(jù)本總體發(fā)明構(gòu)思的示例性實(shí)施例的對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行解碼的方法的流程圖。
[0128]在操作S 1710中,可確定當(dāng)前幀信號(hào)是高頻率分辨率信號(hào)還是高時(shí)間分辨率信號(hào)。
[0129]在這種情況下,所述確定可基于關(guān)于時(shí)域編碼或頻域編碼的信息,并且所述信息可包括在比特流中。[〇13〇] 在操作S 1720中,可對(duì)比特流進(jìn)行反量化。
[0131]在操作S 1730中,可接收反量化的信號(hào),可從比特流中解碼出用于反線性預(yù)測(cè)的附加信息,并且可使用所述附加信息和編碼的殘差信號(hào)來(lái)恢復(fù)高時(shí)間分辨率信號(hào)。
[0132]在操作S 1740中,可將從時(shí)域解碼單元輸出的信號(hào)和/或來(lái)自反量化單元的反量化的信號(hào)反變換到時(shí)域的音頻信號(hào)或語(yǔ)音信號(hào)。
[0133]本總體發(fā)明構(gòu)思還可實(shí)現(xiàn)為計(jì)算機(jī)可讀介質(zhì)上的計(jì)算機(jī)可讀代碼。計(jì)算機(jī)可讀介質(zhì)可包括計(jì)算機(jī)可讀記錄介質(zhì)和計(jì)算機(jī)可讀傳輸介質(zhì)。計(jì)算機(jī)可讀記錄介質(zhì)是可將數(shù)據(jù)存儲(chǔ)為其后可由計(jì)算機(jī)系統(tǒng)讀取的程序的任何數(shù)據(jù)存儲(chǔ)裝置。所述計(jì)算機(jī)可讀記錄介質(zhì)的示例包括:只讀存儲(chǔ)器(R0M)、隨機(jī)存取存儲(chǔ)器(RAM)、CD-R0M、磁帶、軟盤(pán)和光學(xué)數(shù)據(jù)存儲(chǔ)裝置。所述計(jì)算機(jī)可讀記錄介質(zhì)也可分布于聯(lián)網(wǎng)的計(jì)算機(jī)系統(tǒng)上,以便所述計(jì)算機(jī)可讀代碼以分布方式被存儲(chǔ)和執(zhí)行。計(jì)算機(jī)可讀傳輸介質(zhì)可通過(guò)載波或信號(hào)發(fā)送(例如,通過(guò)因特網(wǎng)的有線數(shù)據(jù)傳輸或無(wú)線數(shù)據(jù)傳輸)。此外,本總體發(fā)明構(gòu)思所屬的領(lǐng)域的程序員可容易解釋實(shí)現(xiàn)本總體發(fā)明構(gòu)思的功能程序、代碼和代碼段。
[0134]雖然已經(jīng)示出和描述了本總體發(fā)明構(gòu)思的若干示例實(shí)施例,但是本領(lǐng)域的技術(shù)人員應(yīng)該理解,在不脫離本總體發(fā)明構(gòu)思的原理和精神的范圍內(nèi)可對(duì)這些示例實(shí)施例進(jìn)行改變,本總體發(fā)明構(gòu)思的范圍由權(quán)利要求及其等同物限定。
【主權(quán)項(xiàng)】
1.一種用于對(duì)音頻或語(yǔ)音信號(hào)進(jìn)行解碼的方法,所述方法包括:基于包括在比特流中的編碼彳目息,確定彳目號(hào)是在頻域中被編碼還是在LP域中被編碼; 當(dāng)確定信號(hào)是在頻域中被編碼時(shí),對(duì)信號(hào)進(jìn)行無(wú)損解碼和反量化;當(dāng)確定信號(hào)是在LP域中被編碼時(shí),通過(guò)使用線性預(yù)測(cè)來(lái)重建信號(hào);將被解碼并被反量化的信號(hào)反變換為時(shí)域信號(hào)。2.如權(quán)利要求1所述的方法,還包括:使用被反變換的信號(hào)或被重建的信號(hào)產(chǎn)生高頻帶信號(hào)。3.如權(quán)利要求2所述的方法,還包括:從高頻帶信號(hào)以及被反變換的信號(hào)或被重建的信號(hào)產(chǎn)生立體聲信號(hào)。4.如權(quán)利要求1所述的方法,其中,重建信號(hào)的步驟包括:通過(guò)至少使用長(zhǎng)期預(yù)測(cè)因子來(lái)重建在LP域中被編碼的信號(hào)。5.如權(quán)利要求1所述的方法,還包括:當(dāng)確定信號(hào)是在頻域中被編碼時(shí),對(duì)被解碼并被反量化的信號(hào)執(zhí)行時(shí)間噪聲整形。6.—種用于對(duì)音頻或語(yǔ)音信號(hào)進(jìn)行解碼的設(shè)備,所述設(shè)備包括:確定單兀,基于包括在比特流中的編碼彳目息,確定彳目號(hào)是在頻域中被編碼還是在L P域 中被編碼;頻域解碼單元,當(dāng)確定單元確定信號(hào)是在頻域中被編碼時(shí),對(duì)信號(hào)進(jìn)行無(wú)損解碼和反 量化;LP域解碼單元,當(dāng)確定單元確定信號(hào)是在LP域中被編碼時(shí),通過(guò)使用線性預(yù)測(cè)來(lái)重建信號(hào);反變換單元,將被解碼并被反量化的信號(hào)反變換為時(shí)域信號(hào)。7.如權(quán)利要求6所述的設(shè)備,還包括:高頻產(chǎn)生單元,使用被反變換的信號(hào)或被重建的信號(hào)產(chǎn)生高頻帶信號(hào)。8.如權(quán)利要求7所述的設(shè)備,還包括:立體聲處理單元,從高頻帶信號(hào)以及被反變換的信號(hào)或被重建的信號(hào)產(chǎn)生立體聲信號(hào)。9.如權(quán)利要求6所述的設(shè)備,其中,LP域解碼單元被構(gòu)造為:通過(guò)至少使用長(zhǎng)期預(yù)測(cè)因 子來(lái)重建在LP域中被編碼的信號(hào)。10.如權(quán)利要求6所述的設(shè)備,還包括:時(shí)間噪聲整形單元,當(dāng)確定單元確定信號(hào)是在頻域中被編碼時(shí),對(duì)被解碼并被反量化 的信號(hào)執(zhí)行時(shí)間噪聲整形。
【文檔編號(hào)】G10L19/20GK105957532SQ201610515415
【公開(kāi)日】2016年9月21日
【申請(qǐng)日】2009年7月14日
【發(fā)明人】吳殷美, 金重會(huì), 成昊相, 金美英, 朱基峴
【申請(qǐng)人】三星電子株式會(huì)社
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1