編碼裝置和方法、解碼裝置和方法以及程序的制作方法
【專利摘要】本技術(shù)涉及能夠以較低代碼量獲得高質(zhì)量音頻的編碼裝置和方法、解碼裝置和方法以及程序?;跇?gòu)成輸入信號(hào)的多個(gè)子帶的子帶信號(hào),區(qū)間數(shù)確定特征量計(jì)算電路計(jì)算用于確定將要處理的區(qū)間分割成連續(xù)幀區(qū)間的分割數(shù)的區(qū)間數(shù)確定特征量,所述連續(xù)幀區(qū)間包括已選擇相同估計(jì)系數(shù)的幀。準(zhǔn)高頻子帶功率差計(jì)算電路基于區(qū)間數(shù)確定特征量來確定要處理的區(qū)間中的連續(xù)幀區(qū)間的數(shù)目,針對每個(gè)連續(xù)幀區(qū)間選擇用于通過估計(jì)確定輸入信號(hào)的高頻分量的估計(jì)系數(shù),并生成包含用于獲得估計(jì)系數(shù)的系數(shù)索引的數(shù)據(jù)。高頻編碼電路對獲得的數(shù)據(jù)進(jìn)行編碼,并且生成高頻編碼數(shù)據(jù)。本技術(shù)可應(yīng)用于編碼裝置。
【專利說明】編碼裝置和方法、解碼裝置和方法以及程序
【技術(shù)領(lǐng)域】
[0001]本技術(shù)涉及一種編碼裝置和編碼方法、解碼裝置和解碼方法以及程序,更具體地涉及被配置成以較少編碼量獲得高質(zhì)量音頻的編碼裝置和編碼方法、解碼裝置和解碼方法以及程序。
【背景技術(shù)】
[0002]一種對音頻信號(hào)進(jìn)行編碼的方法包括HE-AAC (高效MPEG (運(yùn)動(dòng)圖像專家組)4AAC(高級(jí)音頻編碼)(ISO 標(biāo)準(zhǔn) /IEC 14496-3)、AAC (MPEG2AAC) (ISO 標(biāo)準(zhǔn) /IEC13818-7)等。
[0003]例如,作為對音頻信號(hào)進(jìn)行編碼的方法,已經(jīng)提出了如下方法:其中,輸出通過對低頻分量進(jìn)行編碼而獲得的低頻編碼信息以及根據(jù)低頻分量和高頻分量生成的用于獲得高頻分量的估計(jì)值的高頻編碼信息,作為通過對音頻信號(hào)進(jìn)行編碼而獲得的代碼(例如參見專利文獻(xiàn)I)。在該方法中,高頻編碼信息包含計(jì)算高頻分量的估計(jì)值所需要的信息,諸如標(biāo)定因子、幅值調(diào)節(jié)系數(shù)和譜殘差,以用于獲得高頻分量。
[0004]當(dāng)對代碼進(jìn)行解碼時(shí),對低頻編碼信息進(jìn)行解碼而獲得的低頻分量和通過基于對高頻編碼信息進(jìn)行解碼而獲得的信息來估計(jì)高頻分量獲得的高頻分量被組合,以再現(xiàn)音頻信號(hào)。
[0005]在這類編碼方法中,僅用于獲得高頻分量的估計(jì)值的信息被編碼作為關(guān)于高頻信號(hào)分量的信息,因此可以改善編碼效率同時(shí)抑制聲音質(zhì)量的退化。
[0006]引用列表
[0007]專利文獻(xiàn)
[0008]專利文獻(xiàn)1:W0 2006/049205A
【發(fā)明內(nèi)容】
[0009]本發(fā)明要解決的問題
[0010]然而,在上述技術(shù)中,雖然可以獲得高質(zhì)量音頻作為對代碼進(jìn)行解碼的結(jié)果,但是應(yīng)該針對音頻信號(hào)的每個(gè)處理單位生成用于計(jì)算高頻分量的估計(jì)值的信息,這不能確定高頻編碼信息的編碼量充分小。
[0011]鑒于以上方面實(shí)現(xiàn)了本技術(shù),以使得能夠以較少編碼量獲得高質(zhì)量音頻。
[0012]問題的解決方案
[0013]根據(jù)本技術(shù)的第一方面的編碼裝置包括:子帶分割單元,被配置成生成輸入信號(hào)的低頻側(cè)的子帶的低頻子帶信號(hào)和輸入信號(hào)的高頻側(cè)的子帶的高頻子帶信號(hào);準(zhǔn)高頻子帶功率計(jì)算單元,被配置成基于低頻子帶信號(hào)和預(yù)定估計(jì)系數(shù)來計(jì)算準(zhǔn)高頻子帶功率,所述準(zhǔn)高頻子帶功率是高頻子帶信號(hào)的高頻子帶功率的估計(jì)值;特征量計(jì)算單元,被配置成基于低頻子帶信號(hào)或高頻子帶信號(hào)中的至少之一來計(jì)算區(qū)間數(shù)確定特征量;確定單元,被配置成基于區(qū)間數(shù)確定特征量來確定在包括輸入信號(hào)的多個(gè)幀的處理目標(biāo)區(qū)間中的連續(xù)幀區(qū)間的數(shù)目,所述連續(xù)幀區(qū)間包括這樣的幀,針對所述幀,選擇相同的估計(jì)系數(shù);選擇單元,被配置成在通過基于所確定的連續(xù)幀區(qū)間的數(shù)目分割處理目標(biāo)區(qū)間而獲得的每個(gè)連續(xù)幀區(qū)間中,基于準(zhǔn)高頻子帶功率和高頻子帶功率來從多個(gè)估計(jì)系數(shù)中選擇構(gòu)成連續(xù)幀區(qū)間的幀的估計(jì)系數(shù);生成單元,被配置成生成下述數(shù)據(jù):所述數(shù)據(jù)用于獲得在構(gòu)成處理目標(biāo)區(qū)間的每個(gè)連續(xù)幀區(qū)間的幀中選擇的估計(jì)系數(shù);低頻編碼單元,被配置成對輸入信號(hào)的低頻信號(hào)進(jìn)行編碼以生成低頻編碼數(shù)據(jù);以及復(fù)用單元,被配置成對所述數(shù)據(jù)和低頻編碼數(shù)據(jù)進(jìn)行復(fù)用以生成輸出代碼串。
[0014]區(qū)間數(shù)確定特征量可以被定義為指示高頻子帶功率之和的特征量。
[0015]區(qū)間數(shù)確定特征量可以被定義為指示高頻子帶功率之和的時(shí)間變化的特征量。
[0016]區(qū)間數(shù)確定特征量可以被定義為指示所述輸入信號(hào)的頻率概況(frequencyprofile)的特征量。
[0017]區(qū)間數(shù)確定特征量可以被定義為多個(gè)特征量的線性和或非線性和。
[0018]編碼裝置還包括評(píng)估值和計(jì)算單元,該評(píng)估值和計(jì)算單元被配置成基于指示針對每個(gè)估計(jì)系數(shù)計(jì)算的、幀中的準(zhǔn)高頻子帶功率與高頻子帶功率之間的誤差的評(píng)估值,針對每個(gè)估計(jì)系數(shù)來計(jì)算構(gòu)成連續(xù)幀區(qū)間的每個(gè)幀的評(píng)估值之和。選擇單元可以基于針對每個(gè)估計(jì)系數(shù)計(jì)算的評(píng)估值之和來選擇連續(xù)幀區(qū)間的幀的估計(jì)系數(shù)。
[0019]通過用所確定的連續(xù)幀區(qū)間的數(shù)目來均等地分割處理目標(biāo)區(qū)間而獲得的每個(gè)區(qū)間可以被定義為連續(xù)幀區(qū)間。
[0020]選擇單元可以基于針對在用所確定的連續(xù)幀區(qū)間的數(shù)目分割處理目標(biāo)區(qū)間時(shí)能夠取得的處理目標(biāo)區(qū)間的分割的每個(gè)組合的評(píng)估值之和,來選擇連續(xù)幀區(qū)間的幀的估計(jì)系數(shù);從組合之中識(shí)別使得構(gòu)成處理目標(biāo)區(qū)間的所有幀的所選擇的估計(jì)系數(shù)的評(píng)估值之和最小化的組合;以及將每個(gè)幀中選擇的估計(jì)系數(shù)定義為所識(shí)別的組合中的對應(yīng)幀的估計(jì)系數(shù)。
[0021]編碼裝置還包括被配置成對所述數(shù)據(jù)進(jìn)行編碼以生成高頻編碼數(shù)據(jù)的高頻編碼單元。復(fù)用單元可以通過將高頻編碼數(shù)據(jù)和低頻編碼數(shù)據(jù)進(jìn)行復(fù)用而生成輸出代碼串。
[0022]確定單元還可以基于所確定的連續(xù)幀區(qū)間的數(shù)目來計(jì)算處理目標(biāo)區(qū)間的高頻編碼數(shù)據(jù)的編碼量,并且低頻編碼單元可以以下述編碼量對低頻信號(hào)進(jìn)行編碼:所述編碼量是根據(jù)預(yù)先針對處理目標(biāo)區(qū)間確定的編碼量和所計(jì)算的高頻編碼數(shù)據(jù)的編碼量而確定的。
[0023]根據(jù)本技術(shù)的第一方面的編碼方法或程序包括步驟:生成輸入信號(hào)的低頻側(cè)的子帶的低頻子帶信號(hào)和輸入信號(hào)的高頻側(cè)的子帶的高頻子帶信號(hào);基于低頻子帶信號(hào)和預(yù)定估計(jì)系數(shù)來計(jì)算準(zhǔn)高頻子帶功率,所述準(zhǔn)高頻子帶功率是高頻子帶信號(hào)的高頻子帶功率的估計(jì)值;基于低頻子帶信號(hào)或高頻子帶信號(hào)中的至少之一來計(jì)算區(qū)間數(shù)確定特征量;基于區(qū)間數(shù)確定特征量來確定在包括所述輸入信號(hào)的多個(gè)幀的處理目標(biāo)區(qū)間中的連續(xù)幀區(qū)間的數(shù)目,所述連續(xù)幀區(qū)間包括這樣的幀,針對所述幀,選擇相同的估計(jì)系數(shù);在通過基于所確定的連續(xù)幀區(qū)間的數(shù)目分割處理目標(biāo)區(qū)間而獲得的每個(gè)連續(xù)幀區(qū)間中,基于所述準(zhǔn)高頻子帶功率和所述高頻子帶功率來從多個(gè)估計(jì)系數(shù)中選擇構(gòu)成所述連續(xù)幀區(qū)間的幀的估計(jì)系數(shù);生成下述數(shù)據(jù):所述數(shù)據(jù)用于獲得在構(gòu)成處理目標(biāo)區(qū)間的每個(gè)連續(xù)幀區(qū)間的幀中選擇的估計(jì)系數(shù);通過對輸入信號(hào)的低頻信號(hào)進(jìn)行編碼來生成低頻編碼數(shù)據(jù);以及通過對所述數(shù)據(jù)和低頻編碼數(shù)據(jù)進(jìn)行復(fù)用來生成輸出代碼串。[0024]根據(jù)本技術(shù)的第一方面,生成輸入信號(hào)的低頻側(cè)的子帶的低頻子帶信號(hào)和輸入信號(hào)的高頻側(cè)的子帶的高頻子帶信號(hào),基于低頻子帶信號(hào)和預(yù)定估計(jì)系數(shù)來計(jì)算準(zhǔn)高頻子帶功率,所述準(zhǔn)高頻子帶功率是高頻子帶信號(hào)的高頻子帶功率的估計(jì)值,基于低頻子帶信號(hào)或高頻子帶信號(hào)中的至少之一來計(jì)算區(qū)間數(shù)確定特征量,基于區(qū)間數(shù)確定特征量來確定在包括輸入信號(hào)的多個(gè)幀的處理目標(biāo)區(qū)間中的連續(xù)幀區(qū)間的數(shù)目,所述連續(xù)幀區(qū)間包括這樣的幀,針對所述幀,選擇相同的估計(jì)系數(shù),在通過基于所確定的連續(xù)幀區(qū)間的數(shù)目分割處理目標(biāo)區(qū)間而獲得的每個(gè)連續(xù)幀區(qū)間中,基于準(zhǔn)高頻子帶功率和高頻子帶功率來從多個(gè)估計(jì)系數(shù)中選擇構(gòu)成連續(xù)幀區(qū)間的幀的估計(jì)系數(shù),生成用于獲得在構(gòu)成處理目標(biāo)區(qū)間的每個(gè)連續(xù)幀區(qū)間的幀中選擇的估計(jì)系數(shù)的數(shù)據(jù),通過對輸入信號(hào)的低頻信號(hào)進(jìn)行編碼來生成低頻編碼數(shù)據(jù),并通過對所述數(shù)據(jù)和低頻編碼數(shù)據(jù)進(jìn)行復(fù)用來生成輸出代碼串。
[0025]根據(jù)本技術(shù)的第二方面的解碼裝置包括:解復(fù)用單元,被配置成將輸入代碼串解復(fù)用成用于獲得在構(gòu)成處理目標(biāo)區(qū)間的每個(gè)連續(xù)幀區(qū)間的幀中選擇的估計(jì)系數(shù)的數(shù)據(jù)、以及通過對輸入信號(hào)的低頻信號(hào)進(jìn)行編碼而獲得的低頻編碼數(shù)據(jù),所述數(shù)據(jù)是基于下述操作的結(jié)果而生成的:基于輸入信號(hào)的低頻子帶信號(hào)和預(yù)定估計(jì)系數(shù)來計(jì)算輸入信號(hào)的高頻子帶信號(hào)的高頻子帶功率的估計(jì)值;基于從輸入信號(hào)中提取的區(qū)間數(shù)確定特征量來確定在包括輸入信號(hào)的多個(gè)幀的處理目標(biāo)區(qū)間中的連續(xù)幀區(qū)間的數(shù)目,所述連續(xù)幀區(qū)間包括這樣的幀,針對所述幀,選擇相同的估計(jì)系數(shù);以及在通過基于所確定的連續(xù)幀區(qū)間的數(shù)目分割處理目標(biāo)區(qū)間而獲得的每個(gè)連續(xù)幀區(qū)間中,基于估計(jì)值和高頻子帶功率來從多個(gè)估計(jì)系數(shù)中選擇構(gòu)成連續(xù)幀區(qū)間的幀的估計(jì)系數(shù);低頻解碼單元,被配置成對低頻編碼數(shù)據(jù)進(jìn)行解碼以生成低頻信號(hào);高頻信號(hào)生成單元,被配置成基于從所述數(shù)據(jù)獲得的估計(jì)系數(shù)和根據(jù)解碼獲得的低頻信號(hào)來生成高頻信號(hào);以及組合單元,被配置成基于高頻信號(hào)和根據(jù)解碼獲得的低頻信號(hào)來生成輸出信號(hào)。
[0026]解碼裝置還包括:高頻解碼單元,被配置成對所述數(shù)據(jù)進(jìn)行解碼以獲得估計(jì)系數(shù)。
[0027]基于指示針對每個(gè)估計(jì)系數(shù)計(jì)算的、幀中的估計(jì)值與高頻子帶功率之間的誤差的評(píng)估值,可以針對每個(gè)估計(jì)系數(shù)來計(jì)算構(gòu)成連續(xù)幀區(qū)間的每個(gè)幀的評(píng)估值之和,并且基于針對每個(gè)估計(jì)系數(shù)計(jì)算的評(píng)估值之和,可以選擇連續(xù)幀區(qū)間的幀的估計(jì)系數(shù)。
[0028]通過用所確定的連續(xù)幀區(qū)間的數(shù)目均等地分割處理目標(biāo)區(qū)間而獲得的每個(gè)區(qū)間可以被定義為連續(xù)幀區(qū)間。
[0029]基于針對在用所確定的連續(xù)幀區(qū)間的數(shù)目分割處理目標(biāo)區(qū)間時(shí)能夠取得的處理目標(biāo)區(qū)間的分割的每個(gè)組合的評(píng)估值之和,可以選擇連續(xù)幀區(qū)間的幀的估計(jì)系數(shù);從組合之中可以識(shí)別使得構(gòu)成處理目標(biāo)區(qū)間的所有幀的所選擇的估計(jì)系數(shù)的評(píng)估值之和最小化的組合;以及將每個(gè)幀中選擇的估計(jì)系數(shù)可以被定義為所識(shí)別的組合中的對應(yīng)幀的估計(jì)系數(shù)。
[0030]根據(jù)本技術(shù)的第二方面的解碼方法或程序包括步驟:將輸入代碼串解復(fù)用成用于獲得在構(gòu)成處理目標(biāo)區(qū)間的每個(gè)連續(xù)幀區(qū)間的幀中選擇的估計(jì)系數(shù)的數(shù)據(jù)、以及通過對輸入信號(hào)的低頻信號(hào)進(jìn)行編碼而獲得的低頻編碼數(shù)據(jù),所述數(shù)據(jù)是基于下述操作的結(jié)果而生成的:基于輸入信號(hào)的低頻子帶信號(hào)和預(yù)定估計(jì)系數(shù)來計(jì)算輸入信號(hào)的高頻子帶信號(hào)的高頻子帶功率的估計(jì)值;基于從輸入信號(hào)中提取的區(qū)間數(shù)確定特征量來確定在包括輸入信號(hào)的多個(gè)幀的處理目標(biāo)區(qū)間中的連續(xù)幀區(qū)間的數(shù)目,所述連續(xù)幀區(qū)間包括這樣的幀,針對所述幀,選擇相同的估計(jì)系數(shù);以及在通過基于所確定的連續(xù)幀區(qū)間的數(shù)目分割處理目標(biāo)區(qū)間而獲得的每個(gè)連續(xù)幀區(qū)間中,基于估計(jì)值和高頻子帶功率來從多個(gè)估計(jì)系數(shù)中選擇構(gòu)成連續(xù)幀區(qū)間的幀的估計(jì)系數(shù);通過對低頻編碼數(shù)據(jù)進(jìn)行解碼來生成低頻信號(hào);基于從所述數(shù)據(jù)獲得的估計(jì)系數(shù)和根據(jù)解碼獲得的低頻信號(hào)來生成高頻信號(hào);以及基于高頻信號(hào)和根據(jù)解碼獲得的低頻信號(hào)來生成輸出信號(hào)。
[0031]根據(jù)本技術(shù)的第二方面,將輸入代碼串解復(fù)用成用于獲得在構(gòu)成處理目標(biāo)區(qū)間的每個(gè)連續(xù)幀區(qū)間的幀中選擇的估計(jì)系數(shù)的數(shù)據(jù)、以及通過對輸入信號(hào)的低頻信號(hào)進(jìn)行編碼而獲得的低頻編碼數(shù)據(jù),所述數(shù)據(jù)是基于下述操作的結(jié)果而生成的:基于輸入信號(hào)的低頻子帶信號(hào)和預(yù)定估計(jì)系數(shù)來計(jì)算輸入信號(hào)的高頻子帶信號(hào)的高頻子帶功率的估計(jì)值;基于從輸入信號(hào)中提取的區(qū)間數(shù)確定特征量來確定在包括所述輸入信號(hào)的多個(gè)幀的處理目標(biāo)區(qū)間中的連續(xù)幀區(qū)間的數(shù)目,所述連續(xù)幀區(qū)間包括這樣的幀,針對所述幀,選擇相同的估計(jì)系數(shù);以及在通過基于所確定的連續(xù)幀區(qū)間的數(shù)目分割處理目標(biāo)區(qū)間而獲得的每個(gè)連續(xù)幀區(qū)間中,基于估計(jì)值和高頻子帶功率來從多個(gè)估計(jì)系數(shù)中選擇構(gòu)成連續(xù)幀區(qū)間的幀的估計(jì)系數(shù);通過對低頻編碼數(shù)據(jù)進(jìn)行解碼來生成低頻信號(hào);基于從所述數(shù)據(jù)獲得的估計(jì)系數(shù)和根據(jù)解碼獲得的低頻信號(hào)來生成高頻信號(hào);以及基于高頻信號(hào)和根據(jù)解碼獲得的低頻信號(hào)來生成輸出信號(hào)。
[0032]本發(fā)明的效果
[0033]根據(jù)本技術(shù)的第一和第二方面,能夠以較少編碼量獲得高質(zhì)量音頻。
【專利附圖】
【附圖說明】
[0034]圖1是示出輸入信號(hào)的子帶的示意圖。
[0035]圖2是示出通過可變長度系統(tǒng)進(jìn)行高頻分量的編碼的示意圖。
[0036]圖3是示出通過固定長度系統(tǒng)進(jìn)行高頻分量的編碼的示意圖。
[0037]圖4是示出根據(jù)本技術(shù)的編碼裝置的配置示例的框圖。
[0038]圖5是編碼處理的流程圖。
[0039]圖6是示出解碼裝置的配置示例的框圖。
[0040]圖7是編碼處理的流程圖。
[0041]圖8是編碼處理的流程圖。
[0042]圖9是編碼處理的流程圖。
[0043]圖10是編碼處理的流程圖。
[0044]圖11是編碼處理的流程圖。
[0045]圖12是示出編碼裝置的另一配置示例的框圖。
[0046]圖13是編碼處理的流程圖。
[0047]圖14是示出計(jì)算機(jī)的配置示例的框圖。
【具體實(shí)施方式】
[0048]下面參照附圖詳細(xì)描述本技術(shù)的示例性實(shí)施例。
[0049]<本技術(shù)的概述>
[0050][關(guān)于輸入信號(hào)的編碼][0051]本技術(shù)是通過接收例如音頻信號(hào)(諸如音樂信號(hào))作為輸入信號(hào)來執(zhí)行輸入信號(hào)的編碼。
[0052]在執(zhí)行輸入信號(hào)的編碼的編碼裝置中,如圖1所示,輸入信號(hào)在編碼時(shí)被分割成均具有預(yù)定帶寬的多個(gè)頻帶(下文中為“子帶”)的子帶信號(hào)。在圖1中,豎軸表示輸入信號(hào)的每個(gè)頻率的功率,而橫軸表示輸入信號(hào)的頻率。在該圖中,曲線Cll表示輸入信號(hào)的每個(gè)頻率分量的功率,而豎直方向上的虛線表示每個(gè)子帶的邊界位置。
[0053]當(dāng)輸入信號(hào)被分割成子帶的子帶信號(hào)時(shí),通過預(yù)定編碼系統(tǒng)對輸入信號(hào)的頻率分量當(dāng)中的等于或低于預(yù)設(shè)頻率的低頻側(cè)的分量進(jìn)行編碼,以生成低頻編碼數(shù)據(jù)。
[0054]在圖1所示的示例中,具有等于或低于具有用于識(shí)別每個(gè)子帶的索引Sb的子帶Sb的上限頻率的頻率的子帶被定義為輸入信號(hào)的低頻分量,具有高于子帶Sb的上限頻率的頻率的子帶被定義為輸入信號(hào)的高頻分量。
[0055]當(dāng)獲得低頻編碼數(shù)據(jù)時(shí),基于輸入信號(hào)的低頻分量和高頻分量生成用于再現(xiàn)高頻分量的每個(gè)子帶的子帶信號(hào)的信息,并且通過預(yù)定編碼系統(tǒng)以適當(dāng)方式對信息進(jìn)行編碼以生成高頻編碼數(shù)據(jù)。
[0056]具體地,根據(jù)包括在低頻側(cè)具有最高頻率且在頻率方向上連續(xù)布置的子帶sb-3至子帶Sb的四個(gè)子帶的分量、以 及包括在高頻側(cè)連續(xù)布置的子帶sb+1至子帶eb的(eb- (sb+1) +1)個(gè)子帶的分量,來生成高頻編碼數(shù)據(jù)。
[0057]子帶sb+1是與子帶sb鄰接的位于最低頻側(cè)的高頻子帶,而子帶eb是在連續(xù)布置的子帶sb+1至子帶eb中具有最高頻率的子帶。
[0058]通過對高頻分量進(jìn)行編碼而獲得的高頻編碼數(shù)據(jù)是用于通過估計(jì)生成高頻側(cè)的子帶ib (其中sb+1 ^ ib^ eb)的子帶信號(hào)的信息,并且高頻編碼數(shù)據(jù)包括用于獲得用于估計(jì)每個(gè)子帶信號(hào)的估計(jì)系數(shù)的系數(shù)索引。
[0059]也就是,在子帶ib的子帶信號(hào)的估計(jì)中,采用與低頻側(cè)的每個(gè)子帶kb(其中sb -3^kb^sb)的子帶的功率相乘的系數(shù)Aib(kb)以及包括作為常數(shù)項(xiàng)的系數(shù)Bib的估計(jì)系數(shù)。高頻編碼數(shù)據(jù)中包括的系數(shù)索引是用于獲得包含每個(gè)子帶ib的系數(shù)Aib (kb)的估計(jì)系數(shù)和系數(shù)Bib的集合的信息,例如,用于識(shí)別估計(jì)系數(shù)的集合的信息。
[0060]當(dāng)以上述方式獲得低頻編碼數(shù)據(jù)和高頻編碼數(shù)據(jù)時(shí),將低頻編碼數(shù)據(jù)和高頻編碼數(shù)據(jù)復(fù)用以生成輸出代碼串,然后輸出該輸出代碼串。
[0061]以此方式,通過將用于獲得估計(jì)系數(shù)的系數(shù)索引包括在高頻編碼數(shù)據(jù)中,與包括標(biāo)度因子(scale factor)、幅值調(diào)節(jié)系數(shù)等以計(jì)算每個(gè)幀的高頻分量的情況相比,可以大大減少高頻編碼數(shù)據(jù)的編碼量。
[0062]此外,接收輸出代碼串的解碼裝置通過對低頻編碼數(shù)據(jù)進(jìn)行解碼而獲得包括低頻側(cè)的每個(gè)子帶的子帶信號(hào)的解碼低頻信號(hào),并通過估計(jì)從解碼低頻信號(hào)以及通過對高頻編碼數(shù)據(jù)進(jìn)行解碼而獲得的信息來生成高頻側(cè)的每個(gè)子帶的子帶信號(hào)。以這種方式獲得的輸出信號(hào)是通過對編碼輸入信號(hào)進(jìn)行解碼而獲得的信號(hào)。
[0063][關(guān)于輸出代碼串]
[0064]在輸入信號(hào)的編碼中,針對要處理的幀,從針對輸入信號(hào)的對應(yīng)于預(yù)定時(shí)間長度的每個(gè)區(qū)間(即針對每個(gè)幀)預(yù)先準(zhǔn)備的多個(gè)估計(jì)系數(shù)之中選擇適當(dāng)?shù)墓烙?jì)系數(shù)。
[0065]在編碼裝置中,通過將系數(shù)索引在時(shí)間方向上改變的時(shí)間信息和改變的系數(shù)索引的值包括在高頻編碼數(shù)據(jù)中,而不將每個(gè)幀的系數(shù)索引按原樣包括在高頻編碼數(shù)據(jù)中,來實(shí)現(xiàn)編碼量的進(jìn)一步減少。
[0066]具體地,當(dāng)輸入信號(hào)是不存在每個(gè)頻率分量在時(shí)間方向上的改變的穩(wěn)態(tài)信號(hào)時(shí),所選擇的估計(jì)系數(shù)(即其系數(shù)索引)通常在時(shí)間方向上連續(xù)繼續(xù)下去。因此,為了減少高頻編碼數(shù)據(jù)中包括的系數(shù)索引在時(shí)間方向上的信息量,當(dāng)執(zhí)行輸入信號(hào)的較高頻率分量的編碼時(shí),適當(dāng)?shù)厍袚Q可變長度系統(tǒng)和固定長度系統(tǒng)。
[0067][關(guān)于可變長度系統(tǒng)]
[0068]下面描述通過可變長度系統(tǒng)和固定長度系統(tǒng)進(jìn)行的高頻分量的編碼。
[0069]當(dāng)對高頻分量進(jìn)行編碼時(shí),針對預(yù)先確定的預(yù)定幀長度的區(qū)間在可變長度系統(tǒng)與固定長度系統(tǒng)之間執(zhí)行切換。例如,在以下描述中,每隔16幀在可變長度系統(tǒng)與固定長度系統(tǒng)之間執(zhí)行切換,并且輸入信號(hào)的16幀的區(qū)間可以被稱作處理目標(biāo)區(qū)間。也就是,在編碼裝置中,以作為處理目標(biāo)區(qū)間的16幀為單位將輸出代碼串輸出。
[0070]首先,描述可變長度系統(tǒng)。在通過可變長度系統(tǒng)進(jìn)行的高頻分量的編碼中,包括系統(tǒng)標(biāo)志、系數(shù)索引、區(qū)間信息和數(shù)目信息的數(shù)據(jù)被編碼并作為高頻編碼數(shù)據(jù)輸出。
[0071]系統(tǒng)標(biāo)志是指示用于生成高頻編碼數(shù)據(jù)的系統(tǒng)的信息,即指示在對高頻分量進(jìn)行編碼時(shí)在可變長度系統(tǒng)與固定長度系統(tǒng)之間選擇哪個(gè)系統(tǒng)的信息。
[0072]區(qū)間信息是指示包括處理目標(biāo)區(qū)間中所包括的連續(xù)幀并針對其選擇相同系數(shù)索引的區(qū)間(下文中為“連續(xù)幀區(qū)間”)的長度的信息。數(shù)目信息是指示處理目標(biāo)區(qū)間中所包括的連續(xù)幀區(qū)間的數(shù)目的信息。
[0073]例如,在可變長度系統(tǒng)中,如圖2所示,從位置FSTl到位置FSEl的16幀的區(qū)間被定義為一個(gè)處理目標(biāo)區(qū)間。在圖2中,水平方向表示時(shí)間,而一個(gè)方塊表示一幀。此外,指示幀的方塊中的數(shù)值表示用于識(shí)別為幀選擇的估計(jì)系數(shù)的系數(shù)索引的值。
[0074]在通過可變長度系統(tǒng)進(jìn)行高頻分量的編碼時(shí),首先,處理目標(biāo)區(qū)間被分割成連續(xù)幀區(qū)間,每個(gè)連續(xù)幀區(qū)間包括選擇相同系數(shù)索引的連續(xù)幀。也就是,分別選擇不同系數(shù)索引的彼此鄰接的幀之間的邊界位置被定義為連續(xù)幀區(qū)間之間的邊界位置。
[0075]在本示例中,處理目標(biāo)區(qū)間被分割成三個(gè)區(qū)間,包括從位置FSTl到位置FCl的區(qū)間、從位置FCl到位置FC2的區(qū)間以及從位置FC2到位置FSEl的區(qū)間。例如,在從位置FSTl到位置FCl的連續(xù)幀區(qū)間中,在每個(gè)幀中選擇相同系數(shù)索引“2”。
[0076]當(dāng)處理目標(biāo)區(qū)間以上述方式被分割成連續(xù)幀區(qū)間時(shí),生成下述數(shù)據(jù):該數(shù)據(jù)包括指示連續(xù)幀區(qū)間的數(shù)目的數(shù)目信息、在每個(gè)連續(xù)幀區(qū)間中選擇的系數(shù)索引、指示每個(gè)連續(xù)幀區(qū)間的長度的區(qū)間信息以及處理目標(biāo)區(qū)間中的系統(tǒng)標(biāo)志。
[0077]在這種情況下,處理目標(biāo)區(qū)間被分割成三個(gè)連續(xù)幀區(qū)間,指示連續(xù)幀區(qū)間的數(shù)目“3”的信息被定義為數(shù)目信息。在圖2中,數(shù)目信息被表示為“num_length=3”。
[0078]例如,處理目標(biāo)區(qū)間中的第一連續(xù)幀區(qū)間的區(qū)間信息被表示為以連續(xù)幀區(qū)間中的幀為單位的長度“5”,并且在圖2中被表示為“l(fā)ength0=5”。此外,每條區(qū)間信息被配置成識(shí)別從處理目標(biāo)區(qū)間的頭開始的連續(xù)幀區(qū)間的順序。換言之,在區(qū)間信息中,還包括用于識(shí)別處理目標(biāo)區(qū)間中的連續(xù)幀區(qū)間的位置的信息。
[0079]當(dāng)生成包括用于處理目標(biāo)區(qū)間的數(shù)目信息、系數(shù)索引、區(qū)間信息和系統(tǒng)標(biāo)志的數(shù)據(jù)時(shí),該數(shù)據(jù)被編碼并輸出作為高頻編碼數(shù)據(jù)。在這種情況下,當(dāng)針對多個(gè)幀連續(xù)選擇相同系數(shù)索引時(shí),不需要針對每個(gè)幀傳送系數(shù)索引,減少要傳送的輸出代碼串的數(shù)據(jù)量,結(jié)果,可以更高效地執(zhí)行編碼和解碼。
[0080][關(guān)于固定長度系統(tǒng)]
[0081]下面描述通過固定長度系統(tǒng)進(jìn)行的高頻分量的編碼。
[0082]在固定長度系統(tǒng)中,如圖3所示,包括16個(gè)幀的處理目標(biāo)區(qū)間被均等地分割成具有預(yù)定數(shù)目的幀的區(qū)間(下文中為“固定長度區(qū)間”)。在圖3中,水平方向表示時(shí)間,而一個(gè)方塊表示一幀。此外,指示幀的方塊中的數(shù)值表示用于識(shí)別為幀選擇的估計(jì)系數(shù)的系數(shù)索引的值。此外,在圖3中,對與圖2所示的部分相對應(yīng)的部分賦予相同的附圖標(biāo)記,并且省略其描述。
[0083]在固定長度系統(tǒng)中,處理目標(biāo)區(qū)間被分割成多個(gè)固定長度區(qū)間。在這種情況下,確定固定長度區(qū)間的長度以使得在固定長度區(qū)間中的每個(gè)幀中選擇的系數(shù)索引相同并且使固定長度區(qū)間的長度最大化。
[0084]在圖3所示的示例中,固定長度區(qū)間的長度(下文中簡化為“固定長度”)為4幀,并且處理目標(biāo)區(qū)間被均等地分割成四個(gè)固定長度區(qū)間。也就是,處理目標(biāo)區(qū)間被分割成從位置FSTl到位置FC21的區(qū)間、從位置FC21到位置FC22的區(qū)間、從位置FC22到位置FC23的區(qū)間以及從位置FC23到位置FSEl的區(qū)間。這些固定長度區(qū)間中的系數(shù)索引在處理目標(biāo)區(qū)間的頭處從固定長度區(qū)間開始按順序被表示為“ I ”、“ 2 ”、“ 2 ”和“ 3 ”。
[0085]當(dāng)處理目標(biāo)區(qū)間以上述方式被分割成多個(gè)固定長度區(qū)間時(shí),生成包括處理目標(biāo)區(qū)間中的指示固定長度區(qū)間的 固定長度的固定長度索引、系數(shù)索引、切換標(biāo)志和系統(tǒng)標(biāo)志的數(shù)據(jù)。
[0086]切換標(biāo)志是指示固定長度區(qū)間之間的邊界位置的信息,即在預(yù)定固定長度區(qū)間的最后一幀與緊挨著該預(yù)定固定長度區(qū)間的固定長度區(qū)間的第一幀之間是否改變系數(shù)索引。例如,當(dāng)在從處理目標(biāo)區(qū)間的頭開始的第(i+1)固定長度區(qū)間與第(i+2)固定長度區(qū)間之間的邊界位置處改變系數(shù)索引時(shí),第i (i=0, I, 2,...)個(gè)切換標(biāo)志81^(1?18_;[被設(shè)置為“I”,當(dāng)不改變系數(shù)索引時(shí),第i (i=0, 1,2,...)個(gè)切換標(biāo)志gridflg_i被設(shè)置為“O”。
[0087]在圖3所示的示例中,因?yàn)榈谝还潭ㄩL度區(qū)間的系數(shù)索引“I”與第二固定長度區(qū)間的系數(shù)索引“2”不同,所以在處理目標(biāo)區(qū)間的第一固定長度區(qū)間的邊界位置(位置FC21)處的切換標(biāo)志gridflg_0被設(shè)置為“I”。此外,因?yàn)榈诙潭ㄩL度區(qū)間的系數(shù)索引“2”與第三固定長度區(qū)間的系數(shù)索引“2”相同,所以在位置FC22處的切換標(biāo)志gridflg_l被設(shè)置為“O”。
[0088]此外,固定長度索引的值被設(shè)置為根據(jù)固定長度而獲得的值。具體地,例如,固定長度索引Iengthjd被設(shè)置為滿足固定長度fixed_length=16/2length-1d的值。在圖3所示的示例中,因?yàn)楣潭ㄩL度fixed_length=4,所以固定長度索引length_id=2。
[0089]當(dāng)處理目標(biāo)區(qū)間被分割成固定長度區(qū)間并且生成包括固定長度索引、系數(shù)索引、切換標(biāo)志和系統(tǒng)標(biāo)志的數(shù)據(jù)時(shí),該數(shù)據(jù)被編碼并輸出作為高頻編碼數(shù)據(jù)。
[0090]在圖3所示的示例中,包括位置FC21至位置FC23處的切換標(biāo)志gridflg_0=l、gridflg_l=0和gridflg_2=l,固定長度索引length_id=2,固定長度區(qū)間的系數(shù)索引“I”、“2”和“3”以及指示固定長度系統(tǒng)的系統(tǒng)標(biāo)志的數(shù)據(jù)被編碼并輸出作為高頻編碼數(shù)據(jù)。
[0091]固定長度區(qū)間之間的邊界位置處的切換標(biāo)志被配置成識(shí)別從處理目標(biāo)區(qū)間的頭開始邊界位置處的切換標(biāo)志的順序。換言之,在切換標(biāo)志中,包括用于識(shí)別處理目標(biāo)區(qū)間中的固定長度區(qū)間的邊界位置的信息。
[0092]此外,按照選擇系數(shù)索引的順序,即按照布置固定長度區(qū)間的順序來布置高頻編碼數(shù)據(jù)中所包括的系數(shù)索引。例如,在圖3所示的示例中,按照系數(shù)索引和“3”的順序布置固定長度區(qū)間,并且這些系數(shù)索引包括在該數(shù)據(jù)中。
[0093]雖然在圖3所示的示例中從處理目標(biāo)區(qū)間的頭開始第二固定長度區(qū)間和第三固定長度區(qū)間的系數(shù)索引為“2”,但是構(gòu)成了僅一個(gè)系數(shù)索引“2”包括在處理目標(biāo)區(qū)間中。當(dāng)連續(xù)固定長度區(qū)間的系數(shù)索引相同時(shí),即當(dāng)連續(xù)固定長度區(qū)間之間的邊界位置處的切換標(biāo)志為“0”時(shí),僅一個(gè)系數(shù)索引包括在高頻編碼數(shù)據(jù)中,而不是將針對相應(yīng)的固定長度區(qū)間的數(shù)目的相同的系數(shù)索引包括在高頻編碼數(shù)據(jù)中。
[0094]以這種方式,當(dāng)根據(jù)包括固定長度索引、系數(shù)索引、切換標(biāo)志和系統(tǒng)標(biāo)志的數(shù)據(jù)生成高頻編碼數(shù)據(jù)時(shí),不需要針對每個(gè)幀傳送系數(shù)索引,因此可以減少要傳送的輸出代碼串的數(shù)據(jù)量。結(jié)果,可以更高效地執(zhí)行編碼和解碼。
[0095][關(guān)于連續(xù)幀區(qū)間的數(shù)目]
[0096]在對輸入信號(hào)進(jìn)行編碼時(shí),基于輸入信號(hào)的每個(gè)子帶的子帶信號(hào)來確定構(gòu)成處理目標(biāo)區(qū)間的連續(xù)幀區(qū)間的最優(yōu)數(shù)目,基于所確定的連續(xù)幀區(qū)間的數(shù)目來選擇每個(gè)幀的系數(shù)索引(估計(jì)系數(shù))。例如,基于根據(jù)高頻側(cè)的子帶的子帶功率而確定的特征量(在下文中為“區(qū)間數(shù)確定特征量”)來確定構(gòu)成處理目標(biāo)區(qū)間的連續(xù)幀區(qū)間的最優(yōu)數(shù)目。
[0097]以這種方式,通過基于指示高頻分量的特征的區(qū)間數(shù)確定特征量來確定構(gòu)成處理目標(biāo)區(qū)間的連續(xù)幀區(qū)間的數(shù)目,可以防止為每個(gè)幀選擇的系數(shù)索引在時(shí)間方向上多于必要地變化。
[0098]結(jié)果,處理目標(biāo)區(qū)間的高頻編碼數(shù)據(jù)中所包括的系數(shù)索引的數(shù)目等可以被抑制為必要最低限度,因此可以進(jìn)一步減少高頻編碼數(shù)據(jù)的編碼量。
[0099]此外,由于諸如估計(jì)誤差的高頻分量的特征取決于估計(jì)系數(shù),因此,如果系數(shù)索引在時(shí)間方向上多于必要地變化,則在通過解碼獲得的音頻信號(hào)中生成解碼前輸入信號(hào)中不存在的非自然頻率包絡(luò)的時(shí)間變化,其在聽覺上使聲音質(zhì)量退化。這種聲音質(zhì)量的退化在具有高頻分量的較少時(shí)間變化的穩(wěn)態(tài)音頻信號(hào)中是顯著的。
[0100]然而,如果在適當(dāng)?shù)卮_定構(gòu)成處理目標(biāo)區(qū)間的連續(xù)幀區(qū)間的數(shù)目之后選擇每個(gè)幀的系數(shù)索引,則可以防止系數(shù)索引多于必要地變化。結(jié)果,可以抑制通過解碼獲得的音頻的高頻分量的非自然時(shí)間變化,因此可以提高聲音質(zhì)量。
[0101]〈第一實(shí)施例〉
[0102][編碼裝置的示例結(jié)構(gòu)]
[0103]下面描述上述用于對輸入信號(hào)進(jìn)行編碼的編碼技術(shù)的示例性實(shí)施例。首先,描述用于執(zhí)行輸入信號(hào)的編碼的編碼裝置的配置。圖4是示出了編碼裝置的配置示例的框圖。
[0104]編碼裝置11包括低通濾波器31、低頻編碼電路32、子帶分割電路33、特征量計(jì)算電路34、準(zhǔn)高頻子帶功率計(jì)算電路35、區(qū)間數(shù)確定特征量計(jì)算電路36、準(zhǔn)高頻子帶功率差計(jì)算電路37、高頻編碼電路38、以及復(fù)用電路39。在編碼裝置11中,要編碼的輸入信號(hào)被提供給低通濾波器31和子帶分割電路33。
[0105]低通濾波器31利用預(yù)定截止頻率對提供的輸入信號(hào)進(jìn)行濾波,并且將處于比截止頻率更低的頻率區(qū)域的所獲得的信號(hào)(下文中為“低頻信號(hào)”)提供給低頻編碼電路32和子帶分割電路33。
[0106]低頻編碼電路32對從低通濾波器31提供的低頻信號(hào)進(jìn)行編碼,并將所獲得的低頻編碼數(shù)據(jù)提供給復(fù)用電路39。
[0107]子帶分割電路33將從低通濾波器31提供的低頻信號(hào)均等地分割成多個(gè)子帶的子帶信號(hào)(下文中為“低頻子帶信號(hào)”),并將所獲得的低頻子帶信號(hào)提供給特征量計(jì)算電路34和區(qū)間數(shù)確定特征量計(jì)算電路36。低頻子帶信號(hào)是在輸入信號(hào)的低頻側(cè)的子帶的信號(hào)。
[0108]此外,子帶分割電路33將所提供的輸入信號(hào)均等地分割成多個(gè)子帶的子帶信號(hào),并將通過分割獲得的子帶信號(hào)之中的高頻側(cè)的預(yù)定頻帶中所包括的子帶的子帶信號(hào)提供給區(qū)間數(shù)確定特征量計(jì)算電路36和準(zhǔn)高頻子帶功率差計(jì)算電路37。在下文中,從子帶分割電路33提供給區(qū)間數(shù)確定特征量計(jì)算電路36和準(zhǔn)高頻子帶功率差計(jì)算電路37的子帶的子帶信號(hào)還被稱作高頻子帶信號(hào)。
[0109]特征量計(jì)算電路34基于從子帶分割電路33提供的低頻子帶信號(hào)來計(jì)算特征量,并將所計(jì)算的特征量提供給準(zhǔn)高頻子帶功率計(jì)算電路35。
[0110]準(zhǔn)高頻子帶功率計(jì)算電路35基于從特征量計(jì)算電路34提供的特征量來計(jì)算高頻子帶信號(hào)的功率的估計(jì)值(下文中還被稱為“準(zhǔn)高頻子帶功率”),并將所計(jì)算的準(zhǔn)高頻子帶功率提供給準(zhǔn)高頻子帶功率差計(jì)算電路37。通過統(tǒng)計(jì)學(xué)習(xí)獲得的估計(jì)系數(shù)的多個(gè)集合被記錄在準(zhǔn)高頻子帶功率計(jì)算電路35中,并且基于估計(jì)系數(shù)和特征量來計(jì)算準(zhǔn)高頻子帶功率。
[0111]區(qū)間數(shù)確定特征量計(jì)算電路36基于從子帶分割電路33提供的低頻子帶信號(hào)和高頻子帶信號(hào)來計(jì)算區(qū)間數(shù)確定特征量,并將所計(jì)算的區(qū)間數(shù)確定特征量提供給準(zhǔn)高頻子帶功率差計(jì)算電路37。
[0112]準(zhǔn)高頻子帶功率差計(jì)算電路37針對每個(gè)幀選擇指示適于估計(jì)幀的高頻分量的估計(jì)系數(shù)的系數(shù)索引。準(zhǔn)高頻子帶功率差計(jì)算電路37包括確定單元51、評(píng)估值和計(jì)算單元52、選擇單元53和生成單元54。
[0113]確定單元51基于從區(qū)間數(shù)確定特征量計(jì)算電路36提供的區(qū)間數(shù)確定特征量來確定構(gòu)成處理目標(biāo)區(qū)間的連續(xù)幀區(qū)間的數(shù)目。
[0114]準(zhǔn)高頻子帶功率差計(jì)算電路37基于從子帶分割電路33提供的高頻子帶信號(hào)的功率(下文中還被稱作“高頻子帶功率”)以及從準(zhǔn)高頻子帶功率計(jì)算電路35提供的準(zhǔn)高頻子帶功率來針對每個(gè)幀計(jì)算每個(gè)估計(jì)系數(shù)的評(píng)估值。該評(píng)估值是指示輸入信號(hào)的實(shí)際高頻分量與通過使用估計(jì)系數(shù)估計(jì)的高頻分量之間的誤差的值。
[0115]評(píng)估值和計(jì)算單元52基于確定單元51所確定的連續(xù)幀區(qū)間的數(shù)目和每個(gè)幀的評(píng)估值來計(jì)算連續(xù)幀的評(píng)估值之和。選擇單元53基于評(píng)估值和計(jì)算單元52所計(jì)算的評(píng)估值之和來選擇每個(gè)幀的系數(shù)索引。
[0116]生成單元54基于輸入信號(hào)的處理目標(biāo)區(qū)間的每個(gè)幀中的系數(shù)索引的選擇結(jié)果來在可變長度系統(tǒng)與固定長度系統(tǒng)之間執(zhí)行切換,通過所選擇的系統(tǒng)生成用于獲得高頻編碼數(shù)據(jù)的數(shù)據(jù),并且將所生成的數(shù)據(jù)提供給高頻編碼電路38。
[0117]高頻編碼電路38對從準(zhǔn)高頻子帶功率差計(jì)算電路37提供的數(shù)據(jù)進(jìn)行編碼,并將所獲得的高頻編碼數(shù)據(jù)提供給復(fù)用電路39。復(fù)用電路39將來自低頻編碼電路32的低頻編碼數(shù)據(jù)和來自高頻編碼電路38的高頻編碼數(shù)據(jù)復(fù)用,并輸出復(fù)用的數(shù)據(jù)作為輸出代碼串。
[0118][編碼處理的描述]
[0119]圖4所示的編碼裝置11被提供輸入信號(hào),在被指示對輸入信號(hào)進(jìn)行編碼時(shí)執(zhí)行編碼處理,并將輸出代碼串輸出到解碼裝置。下面參照圖5所示的流程圖描述通過編碼裝置11進(jìn)行的編碼處理。針對每個(gè)預(yù)設(shè)數(shù)目的幀,即每個(gè)處理目標(biāo)區(qū)間,執(zhí)行該編碼處理。
[0120]在步驟S11,低通濾波器31通過使用低通濾波器利用預(yù)定截止頻率對所提供的要處理的幀的輸入信號(hào)進(jìn)行濾波,并且將所獲得的低頻信號(hào)提供給低頻編碼電路32和子帶分割電路33。
[0121]在步驟S12,低頻編碼電路32對從低通濾波器31提供的低頻信號(hào)進(jìn)行編碼,并且將所獲得的低頻編碼數(shù)據(jù)提供給復(fù)用電路39。
[0122]在步驟S13,子帶分割電路33將輸入信號(hào)和低頻信號(hào)均等地分割成均具有預(yù)定帶寬的多個(gè)子帶信號(hào)。
[0123]也就是,子帶分割電路33將輸入信號(hào)分割成多個(gè)子帶的子帶信號(hào),并將通過分割獲得的高頻側(cè)的子帶sb+Ι至子帶eb的子帶信號(hào)提供給區(qū)間數(shù)確定特征量計(jì)算電路36和準(zhǔn)高頻子帶功率差計(jì)算電路37。
[0124]此外,子帶分割電路33將來自低通濾波器31的低頻信號(hào)分割成多個(gè)子帶的子帶信號(hào),并將通過分割獲得的低頻側(cè)的子帶sb-3至子帶Sb的子帶信號(hào)提供給特征量計(jì)算電路34和區(qū)間數(shù)確定特征量計(jì)算電路36。
[0125]在步驟S14,區(qū)間數(shù)確定特征量計(jì)算電路36基于從子帶分割電路33提供的低頻子帶信號(hào)和高頻子帶信號(hào)來計(jì)算區(qū)間數(shù)確定特征量,并將所計(jì)算的區(qū)間數(shù)確定特征量提供給準(zhǔn)高頻子帶功率差計(jì)算電路37。
[0126]例如,區(qū)間數(shù)確定特征量計(jì)算電路36通過計(jì)算以下等式(I)來計(jì)算作為要處理的中貞J的估計(jì)帶寬的子帶功率和powerhigh(J),即高頻側(cè)的子帶的子帶信號(hào)的功率的和。
[0127][數(shù)學(xué)公式I]
[0128]
【權(quán)利要求】
1.一種編碼裝置,包括: 子帶分割單元,被配置成生成輸入信號(hào)的低頻側(cè)的子帶的低頻子帶信號(hào)和所述輸入信號(hào)的高頻側(cè)的子帶的高頻子帶信號(hào); 準(zhǔn)高頻子帶功率計(jì)算單元,被配置成基于所述低頻子帶信號(hào)和預(yù)定估計(jì)系數(shù)來計(jì)算準(zhǔn)高頻子帶功率,所述準(zhǔn)高頻子帶功率是所述高頻子帶信號(hào)的高頻子帶功率的估計(jì)值; 特征量計(jì)算單元,被配置成基于所述低頻子帶信號(hào)或所述高頻子帶信號(hào)中的至少之一來計(jì)算區(qū)間數(shù)確定特征量; 確定單元,被配置成基于所述區(qū)間數(shù)確定特征量來確定在包括所述輸入信號(hào)的多個(gè)幀的處理目標(biāo)區(qū)間中的連續(xù)幀區(qū)間的數(shù)目,所述連續(xù)幀區(qū)間包括下述幀:針對所述幀,選擇相同的估計(jì)系數(shù); 選擇單元,被配置成在通過基于所確定的連續(xù)幀區(qū)間的數(shù)目分割所述處理目標(biāo)區(qū)間而獲得的每個(gè)連續(xù)幀區(qū)間中,基于所述準(zhǔn)高頻子帶功率和所述高頻子帶功率來從多個(gè)估計(jì)系數(shù)中選擇構(gòu)成所述連續(xù)幀區(qū)間的幀的估計(jì)系數(shù); 生成單元,被配置成生成下述數(shù)據(jù):所述數(shù)據(jù)用于獲得在構(gòu)成所述處理目標(biāo)區(qū)間的每個(gè)所述連續(xù)幀區(qū)間的幀中選擇的所述估計(jì)系數(shù); 低頻編碼單元,被配置成對所述輸入信號(hào)的低頻信號(hào)進(jìn)行編碼以生成低頻編碼數(shù)據(jù);以及 復(fù)用單元,被配置成對所述數(shù)據(jù)和所述低頻編碼數(shù)據(jù)進(jìn)行復(fù)用以生成輸出代碼串。
2.根據(jù)權(quán)利要求1所述的編碼裝置,其中所述區(qū)間數(shù)確定特征量包括指示所述高頻子帶功率之和的特征量。
3.根據(jù)權(quán)利要求1所述的編碼裝置,其中所述區(qū)間數(shù)確定特征量包括指示所述高頻子帶功率之和的時(shí)間變化的特征量。
4.根據(jù)權(quán)利要求1所述的編碼裝置,其中所述區(qū)間數(shù)確定特征量包括指示所述輸入信號(hào)的頻率概況的特征量。
5.根據(jù)權(quán)利要求1所述的編碼裝置,其中所述區(qū)間數(shù)確定特征量包括多個(gè)特征量的線性和或非線性和。
6.根據(jù)權(quán)利要求1所述的編碼裝置,還包括:評(píng)估值和計(jì)算單元,被配置成基于指示針對每個(gè)所述估計(jì)系數(shù)計(jì)算的 、幀中的所述準(zhǔn)高頻子帶功率與所述高頻子帶功率之間的誤差的評(píng)估值,針對每個(gè)所述估計(jì)系數(shù)來計(jì)算構(gòu)成所述連續(xù)幀區(qū)間的每個(gè)幀的所述評(píng)估值之和,其中 所述選擇單元被配置成基于針對每個(gè)所述估計(jì)系數(shù)計(jì)算的所述評(píng)估值之和來選擇所述連續(xù)幀區(qū)間的幀的估計(jì)系數(shù)。
7.根據(jù)權(quán)利要求6所述的編碼裝置,其中通過用所確定的連續(xù)幀區(qū)間的數(shù)目來均等地分割所述處理目標(biāo)區(qū)間而獲得的每個(gè)區(qū)間被定義為所述連續(xù)幀區(qū)間。
8.根據(jù)權(quán)利要求6所述的編碼裝置,其中,所述選擇單元被配置成:基于針對在用所確定的連續(xù)幀區(qū)間的數(shù)目分割所述處理目標(biāo)區(qū)間時(shí)能夠取得的所述處理目標(biāo)區(qū)間的分割的每個(gè)組合的所述評(píng)估值之和,來選擇所述連續(xù)幀區(qū)間的幀的估計(jì)系數(shù);從所述組合之中識(shí)別使得構(gòu)成所述處理目標(biāo)區(qū)間的所有幀的所選擇的估計(jì)系數(shù)的所述評(píng)估值之和最小化的組合;以及將每個(gè)幀中選擇的所述估計(jì)系數(shù)定義為所識(shí)別的組合中的對應(yīng)幀的估計(jì)系數(shù)。
9.根據(jù)權(quán)利要求1所述的編碼裝置,還包括:高頻編碼單元,被配置成對所述數(shù)據(jù)進(jìn)行編碼以生成高頻編碼數(shù)據(jù),其中 所述復(fù)用單元被配置成通過將所述高頻編碼數(shù)據(jù)和所述低頻編碼數(shù)據(jù)進(jìn)行復(fù)用而生成所述輸出代碼串。
10.根據(jù)權(quán)利要求9所述的編碼裝置,其中 所述確定單元被配置成還基于所確定的連續(xù)幀區(qū)間的數(shù)目來計(jì)算所述處理目標(biāo)區(qū)間的高頻編碼數(shù)據(jù)的編碼量,并且 所述低頻編碼單元被配置成以下述編碼量對所述低頻信號(hào)進(jìn)行編碼:所述編碼量是根據(jù)預(yù)先針對所述處理目標(biāo)區(qū)間確定的編碼量和所計(jì)算的高頻編碼數(shù)據(jù)的編碼量而確定的。
11.一種編碼方法,包括步驟: 生成輸入信號(hào)的低頻側(cè)的子帶的低頻子帶信號(hào)和所述輸入信號(hào)的高頻側(cè)的子帶的高頻子帶信號(hào); 基于所述低頻子帶信號(hào)和預(yù)定估計(jì)系數(shù)來計(jì)算準(zhǔn)高頻子帶功率,所述準(zhǔn)高頻子帶功率是所述高頻子帶信號(hào)的高頻子帶功率的估計(jì)值; 基于所述低頻子帶信號(hào)或所述高頻子帶信號(hào)中的至少之一來計(jì)算區(qū)間數(shù)確定特征量; 基于所述區(qū)間數(shù)確定特征量來確定在包括所述輸入信號(hào)的多個(gè)幀的處理目標(biāo)區(qū)間中的連續(xù)幀區(qū)間的數(shù)目,所述連續(xù)幀區(qū)間包括下述幀:針對所述幀,選擇相同的估計(jì)系數(shù);在通過基于所確定的連續(xù)幀區(qū)間的數(shù)目分割所述處理目標(biāo)區(qū)間而獲得的每個(gè)連續(xù)幀區(qū)間中,基于所述準(zhǔn)高頻子帶功率和所述高頻子帶功率來從多個(gè)估計(jì)系數(shù)中選擇構(gòu)成所述連續(xù)幀區(qū)間的幀的估計(jì)系數(shù);` 生成下述數(shù)據(jù):所述數(shù)據(jù)用于獲得在構(gòu)成所述處理目標(biāo)區(qū)間的每個(gè)所述連續(xù)幀區(qū)間的幀中選擇的所述估計(jì)系數(shù); 通過對所述輸入信號(hào)的低頻信號(hào)進(jìn)行編碼來生成低頻編碼數(shù)據(jù);以及 通過對所述數(shù)據(jù)和所述低頻編碼數(shù)據(jù)進(jìn)行復(fù)用來生成輸出代碼串。
12.—種程序,被配置成使計(jì)算機(jī)執(zhí)行步驟: 生成輸入信號(hào)的低頻側(cè)的子帶的低頻子帶信號(hào)和所述輸入信號(hào)的高頻側(cè)的子帶的高頻子帶信號(hào); 基于所述低頻子帶信號(hào)和預(yù)定估計(jì)系數(shù)來計(jì)算準(zhǔn)高頻子帶功率,所述準(zhǔn)高頻子帶功率是所述高頻子帶信號(hào)的高頻子帶功率的估計(jì)值; 基于所述低頻子帶信號(hào)或所述高頻子帶信號(hào)中的至少之一來計(jì)算區(qū)間數(shù)確定特征量; 基于所述區(qū)間數(shù)確定特征量來確定在包括所述輸入信號(hào)的多個(gè)幀的處理目標(biāo)區(qū)間中的連續(xù)幀區(qū)間的數(shù)目,所述連續(xù)幀區(qū)間包括下述幀:針對所述幀,選擇相同的估計(jì)系數(shù);在通過基于所確定的連續(xù)幀區(qū)間的數(shù)目分割所述處理目標(biāo)區(qū)間而獲得的每個(gè)連續(xù)幀區(qū)間中,基于所述準(zhǔn)高頻子帶功率和所述高頻子帶功率來從多個(gè)估計(jì)系數(shù)中選擇構(gòu)成所述連續(xù)幀區(qū)間的幀的估計(jì)系數(shù); 生成下述數(shù)據(jù):所述數(shù)據(jù)用于獲得在構(gòu)成所述處理目標(biāo)區(qū)間的每個(gè)所述連續(xù)幀區(qū)間的幀中選擇的所述估計(jì)系數(shù);通過對所述輸入信號(hào)的低頻信號(hào)進(jìn)行編碼來生成低頻編碼數(shù)據(jù);以及 通過對所述數(shù)據(jù)和所述低頻編碼數(shù)據(jù)進(jìn)行復(fù)用來生成輸出代碼串。
13.一種解碼裝置,包括: 解復(fù)用單元,被配置成將輸入代碼串解復(fù)用成用于獲得在構(gòu)成處理目標(biāo)區(qū)間的每個(gè)連續(xù)幀區(qū)間的幀中選擇的估計(jì)系數(shù)的數(shù)據(jù)、以及通過對輸入信號(hào)的低頻信號(hào)進(jìn)行編碼而獲得的低頻編碼數(shù)據(jù),所述數(shù)據(jù)是基于下述操作的結(jié)果而生成的:基于輸入信號(hào)的低頻子帶信號(hào)和預(yù)定估計(jì)系數(shù)來計(jì)算所述輸入信號(hào)的高頻子帶信號(hào)的高頻子帶功率的估計(jì)值;基于從所述輸入信號(hào)中提取的區(qū)間數(shù)確定特征量來確定在包括所述輸入信號(hào)的多個(gè)幀的處理目標(biāo)區(qū)間中的連續(xù)幀區(qū)間的數(shù)目,所述連續(xù)幀區(qū)間包括這樣的幀,針對所述幀,選擇相同的估計(jì)系數(shù);以及在通過基于所確定的連續(xù)幀區(qū)間的數(shù)目分割所述處理目標(biāo)區(qū)間而獲得的每個(gè)所述連續(xù)幀區(qū)間中,基于所述估計(jì)值和所述高頻子帶功率來從多個(gè)估計(jì)系數(shù)中選擇構(gòu)成所述連續(xù)幀區(qū)間的幀的估計(jì)系數(shù); 低頻解碼單元,被配置成對所述低頻編碼數(shù)據(jù)進(jìn)行解碼以生成低頻信號(hào); 高頻信號(hào)生成單元,被配置成基于從所述數(shù)據(jù)獲得的所述估計(jì)系數(shù)和從所述解碼獲得的所述低頻信號(hào)來生成高頻信號(hào);以及 組合單元,被配置成基于所述高頻信號(hào)和從所述解碼獲得的所述低頻信號(hào)來生成輸出信號(hào)。
14.根據(jù)權(quán)利要求13 所述的解碼裝置,還包括:高頻解碼單元,被配置成對所述數(shù)據(jù)進(jìn)行解碼以獲得所述估計(jì)系數(shù)。
15.根據(jù)權(quán)利要求14所述的解碼裝置,其中 基于指示針對每個(gè)所述估計(jì)系數(shù)計(jì)算的、所述幀中的所述估計(jì)值與所述高頻子帶功率之間的誤差的評(píng)估值,針對每個(gè)所述估計(jì)系數(shù)來計(jì)算構(gòu)成所述連續(xù)幀區(qū)間的每個(gè)幀的所述評(píng)估值之和,并且 基于針對每個(gè)所述估計(jì)系數(shù)計(jì)算的所述評(píng)估值之和,選擇所述連續(xù)幀區(qū)間的幀的估計(jì)系數(shù)。
16.根據(jù)權(quán)利要求15所述的解碼裝置,其中,通過用所確定的連續(xù)幀區(qū)間的數(shù)目均等地分割所述處理目標(biāo)區(qū)間而獲得的每個(gè)區(qū)間被定義為所述連續(xù)幀區(qū)間。
17.根據(jù)權(quán)利要求15所述的解碼裝置,其中 基于針對在用所確定的連續(xù)幀區(qū)間的數(shù)目分割所述處理目標(biāo)區(qū)間時(shí)能夠取得的所述處理目標(biāo)區(qū)間的分割的每個(gè)組合的所述評(píng)估值之和,來選擇所述連續(xù)幀區(qū)間的幀的估計(jì)系數(shù); 從所述組合之中識(shí)別使得構(gòu)成所述處理目標(biāo)區(qū)間的所有幀的所選擇的估計(jì)系數(shù)的所述評(píng)估值之和最小化的組合;以及 將每個(gè)幀中選擇的所述估計(jì)系數(shù)定義為所識(shí)別的組合中的對應(yīng)幀的估計(jì)系數(shù)。
18.一種解碼方法,包括步驟: 將輸入代碼串解復(fù)用成用于獲得在構(gòu)成處理目標(biāo)區(qū)間的每個(gè)連續(xù)幀區(qū)間的幀中選擇的估計(jì)系數(shù)的數(shù)據(jù)、以及通過對輸入信號(hào)的低頻信號(hào)進(jìn)行編碼而獲得的低頻編碼數(shù)據(jù),所述數(shù)據(jù)是基于下述操作的結(jié)果而生成的:基于輸入信號(hào)的低頻子帶信號(hào)和預(yù)定估計(jì)系數(shù)來計(jì)算所述輸入信號(hào)的高頻子帶信號(hào)的高頻子帶功率的估計(jì)值;基于從所述輸入信號(hào)中提取的區(qū)間數(shù)確定特征量來確定在包括所述輸入信號(hào)的多個(gè)幀的處理目標(biāo)區(qū)間中的連續(xù)幀區(qū)間的數(shù)目,所述連續(xù)幀區(qū)間包括這樣的幀,針對所述幀,選擇相同的估計(jì)系數(shù);以及在通過基于所確定的連續(xù)幀區(qū)間的數(shù)目分割所述處理目標(biāo)區(qū)間而獲得的每個(gè)所述連續(xù)幀區(qū)間中,基于所述估計(jì)值和所述高頻子帶功率來從多個(gè)估計(jì)系數(shù)中選擇構(gòu)成所述連續(xù)幀區(qū)間的幀的估計(jì)系數(shù); 通過對所述低頻編碼數(shù)據(jù)進(jìn)行解碼來生成低頻信號(hào); 基于從所述數(shù)據(jù)獲得的所述估計(jì)系數(shù)和從所述解碼獲得的所述低頻信號(hào)來生成高頻信號(hào);以及 基于所述高頻信號(hào)和從所述解碼獲得的所述低頻信號(hào)來生成輸出信號(hào)。
19.一種程序,被配置成使計(jì)算機(jī)執(zhí)行步驟: 將輸入代碼串解復(fù)用成用于獲得在構(gòu)成處理目標(biāo)區(qū)間的每個(gè)連續(xù)幀區(qū)間的幀中選擇的估計(jì)系數(shù)的數(shù)據(jù)、以及通過對輸入信號(hào)的低頻信號(hào)進(jìn)行編碼而獲得的低頻編碼數(shù)據(jù),所述數(shù)據(jù)是基于下述操作的結(jié)果而生成的:基于輸入信號(hào)的低頻子帶信號(hào)和預(yù)定估計(jì)系數(shù)來計(jì)算所述輸入信號(hào)的高頻子帶信號(hào)的高頻子帶功率的估計(jì)值;基于從所述輸入信號(hào)中提取的區(qū)間數(shù)確定特征量來確定在包括所述輸入信號(hào)的多個(gè)幀的處理目標(biāo)區(qū)間中的連續(xù)幀區(qū)間的數(shù)目,所述連續(xù)幀區(qū)間包括這樣的幀,針對所述幀,選擇相同的估計(jì)系數(shù);以及在通過基于所確定的連續(xù)幀區(qū)間的數(shù)目分割所述處理目標(biāo)區(qū)間而獲得的每個(gè)所述連續(xù)幀區(qū)間中,基于所述估計(jì)值和所述高頻子帶功率來從多個(gè)估計(jì)系數(shù)中選擇構(gòu)成所述連續(xù)幀區(qū)間的幀的估計(jì)系數(shù); 通過對所述低頻編碼數(shù)據(jù)進(jìn)行解碼來生成低頻信號(hào); 基于從所述數(shù)據(jù)獲得的所述估計(jì)系數(shù)和從所述解碼獲得的所述低頻信號(hào)來生成高頻信號(hào);以及 基于所述高頻信號(hào)和從所述解碼獲得的所述低頻信號(hào)來生成輸出信號(hào)。
【文檔編號(hào)】G10L19/02GK103765510SQ201280040029
【公開日】2014年4月30日 申請日期:2012年8月14日 優(yōu)先權(quán)日:2011年8月24日
【發(fā)明者】山本優(yōu)樹, 知念徹 申請人:索尼公司