編碼設(shè)備和解碼設(shè)備的制作方法

文檔序號(hào)：2820991閱讀：230來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：編碼設(shè)備和解碼設(shè)備的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及采用一個(gè)諸如正交變換的方法通過用一個(gè)較少量的編碼數(shù)據(jù)流對(duì)通過將時(shí)域中的音頻信號(hào)、例如聲音和音樂信號(hào)變換成頻域內(nèi)的信號(hào)所獲得的信號(hào)進(jìn)行編碼來(lái)壓縮數(shù)據(jù)的編碼方法，以及用于在接收到編碼數(shù)據(jù)流時(shí)擴(kuò)展數(shù)據(jù)并獲得音頻信號(hào)的解碼方法。
背景技術(shù)：
目前已經(jīng)開發(fā)出了幾種對(duì)音頻信號(hào)進(jìn)行編碼和解碼的方法。特別地，近來(lái)，在ISO/IEC中被在國(guó)際上標(biāo)準(zhǔn)化的IS13818-7被公知并被高度評(píng)價(jià)為是一個(gè)具有高效率的再現(xiàn)高質(zhì)量聲音的編碼方法。這個(gè)編碼方法被稱為高級(jí)音頻編碼(AAC)。近年來(lái)，AAC被采用在被稱為MPEG4的標(biāo)準(zhǔn)中，并且已經(jīng)開發(fā)出一個(gè)具有添加到IS13818-7的一些擴(kuò)展功能的被稱為MPEG-4 AAC的系統(tǒng)。在MPEG-4AAC的介紹部分描述了編碼過程的一個(gè)例子。
下面是參考圖1對(duì)于一個(gè)采用常規(guī)編碼方法的音頻編碼設(shè)備的解釋。圖1是顯示一個(gè)常規(guī)編碼設(shè)備100的結(jié)構(gòu)的方框圖。編碼設(shè)備100包括時(shí)間—頻率變換單元101、頻譜放大單元102、頻譜量化單元103、霍夫曼編碼單元104和編碼數(shù)據(jù)流傳輸單元105。以預(yù)定時(shí)間間隔將一個(gè)通過以預(yù)定頻率對(duì)一個(gè)模擬音頻信號(hào)采樣而獲得的在時(shí)間軸上的數(shù)字音頻信號(hào)分成各個(gè)預(yù)定數(shù)目的樣本，并通過時(shí)間—頻率變換單元101變換成頻率軸上的數(shù)據(jù)，然后作為到編碼設(shè)備100的輸入信號(hào)送給頻譜放大單元102。頻譜放大單元102以一個(gè)特定增益放大在各個(gè)預(yù)定波帶中包括的頻譜。頻譜量化單元103用一個(gè)預(yù)定的變換表達(dá)式對(duì)放大的頻譜進(jìn)行量化。在AAC方法的情況下，量化是通過將以浮點(diǎn)表示的頻譜數(shù)據(jù)舍入成一個(gè)整數(shù)值來(lái)進(jìn)行的?；舴蚵幋a單元104根據(jù)霍夫曼編碼對(duì)其一組特定條中的量化的頻譜數(shù)據(jù)進(jìn)行編碼，并根據(jù)霍夫曼編碼對(duì)頻譜放大單元102中的各個(gè)預(yù)定頻帶中的增益以及指定用于量化的變換表達(dá)式的數(shù)據(jù)進(jìn)行編碼，然后將其代碼發(fā)送到編碼數(shù)據(jù)流傳輸單元105。將霍夫曼編碼的數(shù)據(jù)流從編碼數(shù)據(jù)流傳輸單元105通過一個(gè)傳輸信道或一個(gè)記錄介質(zhì)傳輸?shù)揭粋€(gè)解碼設(shè)備，并由解碼設(shè)備重構(gòu)為時(shí)間軸上的音頻信號(hào)。常規(guī)的編碼設(shè)備的操作即如上所述。
然而，在常規(guī)的編碼設(shè)備100中，壓縮數(shù)據(jù)量的能力取決于霍夫曼編碼單元104或類似單元的性能，因此在以高壓縮率、即以少量數(shù)據(jù)進(jìn)行編碼時(shí)，需要充分提高頻譜放大單元102中的增益，并對(duì)由頻譜量化單元103獲得的量化的頻譜流編碼，以使其是霍夫曼編碼單元104中的一個(gè)較少量的數(shù)據(jù)。依據(jù)這個(gè)方法，如果編碼是為了使數(shù)據(jù)量更少而進(jìn)行的，則用于再現(xiàn)的聲音和音樂的頻率帶寬實(shí)際上變得很窄。因此，不能否定，聲音和音樂對(duì)于人的聽覺來(lái)說將是沙啞的。其結(jié)果是，不可能保持聲音質(zhì)量。這是一個(gè)問題。
并且，在常規(guī)的編碼設(shè)備100內(nèi)，在時(shí)間—頻率變換單元101中以每個(gè)預(yù)定間隔(樣本數(shù))將在時(shí)間軸上表示的輸入信號(hào)變換成頻率軸上表示的頻譜。因此，在這個(gè)后一階段用于編碼的量化的信號(hào)是頻率軸上的頻譜。對(duì)一個(gè)量化過程來(lái)說，通過例如將頻譜數(shù)據(jù)中的小數(shù)點(diǎn)值舍入成一個(gè)整數(shù)值的處理而具有一些量化誤差是不可避免的。與在頻率軸上容易估計(jì)在信號(hào)中產(chǎn)生的量化誤差這個(gè)事實(shí)相反的是，在時(shí)間軸上則是困難的。由于這一點(diǎn)，不容易通過估計(jì)在時(shí)間軸上反映的量化誤差來(lái)提高編碼設(shè)備的時(shí)間分辨能力。并且，如果可分配給編碼的數(shù)據(jù)量足夠多，則有可能提高頻率分辨能力和時(shí)間分辨能力。但如果分配用于編碼的數(shù)據(jù)量較小，則在這兩方面提高都是非常困難的。
考慮到上述問題，本發(fā)明的目的在于提供一種能夠以高級(jí)別的時(shí)間分辨能力以高壓縮比對(duì)一個(gè)音頻信號(hào)編碼的編碼設(shè)備，以及一種能夠?qū)掝l帶上的頻譜數(shù)據(jù)解碼的解碼設(shè)備。

發(fā)明內(nèi)容
依據(jù)本發(fā)明的編碼設(shè)備是一個(gè)對(duì)通過依據(jù)時(shí)間—頻率變換來(lái)變換一個(gè)輸入初始信號(hào)而獲得的在頻域中的信號(hào)進(jìn)行編碼、并產(chǎn)生一個(gè)輸出信號(hào)的編碼設(shè)備，包括第一頻帶指定單元，可用于基于輸入初始信號(hào)的特性為一部分頻譜指定一個(gè)頻帶；時(shí)間變換單元，可用于根據(jù)頻率—時(shí)間變換將指定頻帶中的一個(gè)信號(hào)變換成一個(gè)信號(hào)；以及，編碼單元，可用于對(duì)由時(shí)間變換單元獲得的信號(hào)和至少一部分頻譜進(jìn)行編碼，并從編碼信號(hào)和編碼頻譜產(chǎn)生一個(gè)輸出信號(hào)。
并且，本發(fā)明的解碼設(shè)備是一個(gè)對(duì)通過對(duì)一個(gè)輸入初始信號(hào)編碼而獲得的編碼數(shù)據(jù)流進(jìn)行解碼、并輸出一個(gè)頻譜的解碼設(shè)備，包括解碼單元，可用于提取在輸入編碼數(shù)據(jù)流中包含的編碼數(shù)據(jù)流的一部分，并對(duì)提取出的編碼數(shù)據(jù)流解碼；頻率變換單元，可用于將通過對(duì)提取出的編碼數(shù)據(jù)流解碼而獲得的信號(hào)變換成一個(gè)頻譜；以及，合成單元，可用于在頻率軸上合成通過對(duì)從輸入編碼數(shù)據(jù)流的其他部分提取出的編碼數(shù)據(jù)流解碼而獲得的一個(gè)頻譜和由頻率變換單元獲得的頻譜。
如上所述，依據(jù)本發(fā)明的編碼設(shè)備和解碼設(shè)備，通過在時(shí)域中的編碼之外還增加時(shí)域中的編碼，變得能夠以較高的編碼效率選擇一個(gè)域中的編碼并減少所輸出的編碼數(shù)據(jù)流的比特量。此外，通過增加時(shí)域中的編碼，變得容易提高時(shí)間分辨能力以及頻率分辨能力。
并且，依據(jù)本發(fā)明的編碼設(shè)備和解碼設(shè)備可以以低比特率提供一個(gè)寬頻帶的編碼音頻數(shù)據(jù)流。對(duì)于較低頻率區(qū)域中的一個(gè)分量，其頻率的微觀結(jié)構(gòu)通過采用一個(gè)諸如霍夫曼編碼的壓縮技術(shù)來(lái)編碼。對(duì)于較高頻率區(qū)域中的一個(gè)分量，只對(duì)通過用較低頻率區(qū)域中的頻譜替代較高頻率區(qū)域中的頻譜而再現(xiàn)的主要數(shù)據(jù)進(jìn)行編碼，而不對(duì)其微觀結(jié)構(gòu)編碼，以使得由高頻中的分量的編碼所使用的數(shù)據(jù)量可以最少。
依據(jù)本發(fā)明的解碼設(shè)備，由于高頻區(qū)域中的分量是通過在再現(xiàn)音頻信號(hào)時(shí)在解碼過程中處理較低頻率區(qū)域中的頻譜的再現(xiàn)而產(chǎn)生的，所以可以容易地由低比特率來(lái)實(shí)現(xiàn)，并且可以在比由常規(guī)解碼設(shè)備以同一比率再現(xiàn)的更寬的頻帶中再現(xiàn)聲音。

圖1是顯示常規(guī)編碼設(shè)備的結(jié)構(gòu)的方框圖。
圖2是顯示依據(jù)本發(fā)明的第一實(shí)施例的解碼設(shè)備的結(jié)構(gòu)的方框圖。
圖3是顯示由圖2所示的時(shí)間—頻率變換單元進(jìn)行的時(shí)間—頻率變換的一個(gè)例子的示意圖。
圖4A是顯示輸入到時(shí)間—頻率變換單元中的時(shí)域中的一個(gè)音頻信號(hào)的示意圖。在該示意圖中，假定根據(jù)頻率變換在某一時(shí)刻要變換一個(gè)在等效于第N幀的一部分中的信號(hào)。
圖4B是顯示對(duì)圖4A所示的第N幀中的音頻信號(hào)在某一時(shí)刻執(zhí)行時(shí)間—頻率變換而獲得的一個(gè)頻譜。
圖5A是顯示與圖4A在同一時(shí)間軸上的音頻信號(hào)的第N幀是如何被分成用于其第一半的子幀1和用于其第二半的子幀2的示意圖。
圖5B是顯示通過將圖5A所示的子幀1中的時(shí)域中的音頻信號(hào)變換成頻域中的一個(gè)信號(hào)而獲得的頻譜的示意圖。
圖5C是顯示通過將圖5A所示的子幀2中的時(shí)域中的音頻信號(hào)變換成頻域中的一個(gè)信號(hào)而獲得的頻譜的示意圖。
圖6A是顯示與圖4A相同的時(shí)域中的音頻信號(hào)(第N幀)是如何被分成(M+1)段子幀的示意圖。
圖6B是顯示通過將一幀中的音頻輸入信號(hào)分成(M+1)段子幀并由每個(gè)子幀執(zhí)行時(shí)間—頻率變換而獲得的頻譜的示意圖。
圖7A是顯示通過對(duì)一幀中的音頻信號(hào)在某一時(shí)刻執(zhí)行時(shí)間—頻率變換而獲得的頻譜上的頻帶BandA中包含的樣本的示意圖。
圖7B是顯示通過將一幀中的音頻輸入信號(hào)分成(M+1)段并由每個(gè)子幀對(duì)其執(zhí)行時(shí)間—頻率變換而獲得的頻譜上的頻帶BandB中包含的樣本的示意圖。
圖8A是顯示通過對(duì)一幀中的音頻信號(hào)在某一時(shí)刻執(zhí)行時(shí)間—頻率變換而獲得的頻譜上的頻帶BandC中的樣本的示意圖。
圖8B是顯示通過將一幀中的音頻輸入信號(hào)分成(M+1)段子幀并由每個(gè)子幀對(duì)其執(zhí)行時(shí)間—頻率變換而獲得的頻譜上的頻帶BandD中的樣本的示意圖。
圖9A是顯示通過對(duì)一幀中的音頻信號(hào)在某一時(shí)刻執(zhí)行時(shí)間—頻率變換而獲得的頻譜上的頻帶BandC中的樣本的示意圖。
圖9B是采用水平軸上的時(shí)間和垂直軸上的頻譜系數(shù)為圖8B所示的每個(gè)樣本(頻譜系數(shù))重繪的示意圖。
圖10是顯示由圖2所示的編碼數(shù)據(jù)流產(chǎn)生單元對(duì)一個(gè)時(shí)間—頻率信號(hào)編碼的示意圖。
圖11是顯示時(shí)間—頻率變換單元的一個(gè)輸出信號(hào)是如何對(duì)應(yīng)于指示由一個(gè)時(shí)間變換單元依據(jù)時(shí)間變換而變換的頻帶的數(shù)據(jù)的示意圖。
圖12是顯示依據(jù)本發(fā)明的第一實(shí)施例的解碼設(shè)備的結(jié)構(gòu)的方框圖。
圖13是顯示依據(jù)本發(fā)明的第二實(shí)施例的編碼設(shè)備的結(jié)構(gòu)的方框圖。
圖14是顯示參考其他頻帶在一個(gè)目標(biāo)頻帶中產(chǎn)生一個(gè)編碼數(shù)據(jù)流的方法的一個(gè)例子的示意圖。
圖15是顯示參考其他頻帶在目標(biāo)頻帶中產(chǎn)生編碼數(shù)據(jù)流的方法的另一個(gè)例子的示意圖。
圖16是顯示參考其他頻帶在目標(biāo)頻帶中產(chǎn)生編碼數(shù)據(jù)流的方法的其他例子的示意圖。
圖17是顯示通過采用一個(gè)參考頻帶中的已經(jīng)被量化和編碼的編碼數(shù)據(jù)流將一個(gè)目標(biāo)域中的頻譜在頻域中合成的方法的一個(gè)例子的示意圖。
圖18是顯示通過采用一個(gè)參考頻帶中的已經(jīng)被量化和編碼的編碼數(shù)據(jù)流將一個(gè)目標(biāo)域中的頻譜在時(shí)域中合成的方法的一個(gè)例子的示意圖。
圖19A是顯示一個(gè)指示通過將一個(gè)作為參考頻帶的頻帶A的頻域中的一個(gè)信號(hào)變換成時(shí)域中的信號(hào)而獲得的一個(gè)信號(hào)的向量Ta的示意圖。
圖19B是顯示一個(gè)指示通過將一個(gè)作為參考頻帶的頻帶B的頻域中的一個(gè)信號(hào)變換成時(shí)域中的信號(hào)而獲得的一個(gè)信號(hào)的向量Tb的示意圖。
圖19C是對(duì)于通過在向量Ta上施加一個(gè)增益控制來(lái)指示一個(gè)近似于向量Tb的向量的情況，顯示一個(gè)近似向量Tb’的示意圖。
圖20是顯示依據(jù)第二實(shí)施例的解碼設(shè)備的結(jié)構(gòu)的方框圖。
圖21A是顯示由圖2所示的編碼數(shù)據(jù)流產(chǎn)生單元產(chǎn)生的編碼數(shù)據(jù)流的數(shù)據(jù)結(jié)構(gòu)的一個(gè)例子的示意圖。
圖21B是顯示由圖13所示的編碼數(shù)據(jù)流產(chǎn)生單元產(chǎn)生的編碼數(shù)據(jù)流的數(shù)據(jù)結(jié)構(gòu)的一個(gè)例子的示意圖。
具體實(shí)施例方式
下面將參考附圖(圖2～圖20)解釋依據(jù)本發(fā)明的實(shí)施例的編碼設(shè)備和解碼設(shè)備。
(第一實(shí)施例)圖2是顯示依據(jù)本發(fā)明的第一實(shí)施例的編碼設(shè)備200的結(jié)構(gòu)的方框圖。編碼設(shè)備200是一個(gè)提取出在時(shí)間軸上表示的音頻輸入信號(hào)的時(shí)間特性并在基于提取出的時(shí)間特性將一個(gè)頻譜的一部分部分地變換成時(shí)域中的一個(gè)頻率信號(hào)之后編碼的編碼設(shè)備，包括時(shí)間—頻率變換單元201、頻率特性提取單元202、時(shí)間特性提取單元203、時(shí)間變換單元204和編碼數(shù)據(jù)流產(chǎn)生單元205。
時(shí)間—頻率變換單元201將音頻輸入信號(hào)從時(shí)間軸上的一個(gè)離散信號(hào)變換成具有規(guī)則間隔的頻譜數(shù)據(jù)。更具體地，時(shí)間—頻率變換單元201例如基于作為一單位的一幀(1024個(gè)樣本)變換在時(shí)域中的某一時(shí)刻的音頻信號(hào)，并作為變換結(jié)果為1024個(gè)樣本或類似產(chǎn)生一個(gè)頻譜系數(shù)。MDCT變換或類似被用作時(shí)間—頻率變換，并作為變換結(jié)果產(chǎn)生一個(gè)MDCT系數(shù)或類似。從其向時(shí)間變換單元204輸出由時(shí)間特性提取單元203指定的頻帶中的多個(gè)頻譜系數(shù)，并向頻率特性提取單元202輸出頻帶中的其他頻譜系數(shù)。
頻率特性提取單元202提取出頻譜的頻率特性，基于提取出的特性對(duì)于頻域中的量化和編碼的情況選擇一個(gè)帶有較差的編碼效率的頻帶，將其從由時(shí)間—頻率變換單元201輸出的頻譜劃分出來(lái)，并將其輸出到時(shí)間變換單元204。將除此之外的頻帶的頻譜輸入到編碼數(shù)據(jù)流產(chǎn)生單元205。
時(shí)間特性提取單元203分析音頻輸入信號(hào)的時(shí)間特性，判定當(dāng)在編碼數(shù)據(jù)流產(chǎn)生單元205進(jìn)行量化時(shí)是時(shí)間分辨能力優(yōu)先還是頻率分辨能力優(yōu)先，并指定一個(gè)其中判定時(shí)間分辨能力優(yōu)先的頻帶。時(shí)間變換單元204采用一個(gè)全部可逆的變換表達(dá)式將在其中判定時(shí)間分辨能力優(yōu)先的頻帶中的頻譜和由頻率特性提取單元202選擇的頻帶中的頻譜變換成一個(gè)被指示為頻譜系數(shù)中的時(shí)間改變的時(shí)間—頻率信號(hào)。在因而量化了從時(shí)間—頻率變換單元201輸入的頻譜以及從時(shí)間變換單元204輸入的時(shí)間—頻率信號(hào)之后，編碼數(shù)據(jù)流產(chǎn)生單元205對(duì)其進(jìn)行編碼。此外，編碼數(shù)據(jù)流產(chǎn)生單元205將諸如標(biāo)題的附加數(shù)據(jù)附在編碼數(shù)據(jù)上，并根據(jù)一個(gè)預(yù)定格式產(chǎn)生一個(gè)編碼數(shù)據(jù)流，將產(chǎn)生的編碼數(shù)據(jù)流輸出到編碼設(shè)備200的外部。
圖3是顯示由圖2所示的時(shí)間—頻率變換單元201進(jìn)行的時(shí)間—頻率變換的一個(gè)例子的示意圖。例如，如圖3所示，時(shí)間—頻率變換單元201以允許一些重疊的規(guī)則的時(shí)間間隔在時(shí)間軸上劃分離散信號(hào)，并執(zhí)行變換。與第N幀(N是一個(gè)正整數(shù))形成對(duì)比，圖3顯示了通過允許第(N+1)幀的一半與第N幀重疊來(lái)提取出第(N+1)幀并對(duì)其進(jìn)行變換的情況。一般來(lái)說，時(shí)間—頻率變換單元201通過改進(jìn)的離散余弦變換(MDCT)來(lái)變換數(shù)據(jù)。然而，時(shí)間—頻率變換單元201的變換方法并不限于MDCT。它可以是多相濾波器或傅立葉變換。由于相關(guān)領(lǐng)域技術(shù)人員熟悉MDCT、多相濾波器和傅立葉變換中的任何一種，因此這里省略對(duì)它們的解釋。
圖4A是顯示輸入到時(shí)間—頻率變換單元201的時(shí)域中的音頻信號(hào)的示意圖。假設(shè)在同一圖中在某一時(shí)刻對(duì)在等效于第N幀的部分中的信號(hào)進(jìn)行了頻率變換。圖4B是顯示通過對(duì)圖4A所示的第N幀中的音頻信號(hào)在某一時(shí)刻執(zhí)行時(shí)間—頻率變換而獲得的一個(gè)頻譜的示意圖。這個(gè)示意圖是采用垂直軸上的頻率和水平軸上的用于該頻率的頻譜系數(shù)值而繪出的。如圖所示，對(duì)于第N幀的時(shí)域中的信號(hào)被變換成頻域中的信號(hào)。圖4B所示頻譜指示在圖4A所示的一幀持續(xù)時(shí)間內(nèi)在音頻信號(hào)中包含的一個(gè)頻率分量的特性。當(dāng)在時(shí)間—頻率變換單元201中采用MDCT時(shí)，時(shí)域中的信號(hào)和頻域中的信號(hào)具有相同數(shù)目的有效樣本。關(guān)于有效樣本的數(shù)目，在MDCT的情況下，如果圖4A所示的第N幀中的樣本數(shù)目是2048個(gè)樣本，則圖4B所示的獨(dú)立頻率系數(shù)(MDCT系數(shù))的數(shù)目是1024個(gè)樣本。然而，因?yàn)镸DCT是一種如圖3所示各幀由其他幀的一半覆蓋的算法，因此在圖4A中新輸入的樣本數(shù)目是1024個(gè)樣本。因此，圖4A和圖4B中的樣本數(shù)目在每個(gè)數(shù)據(jù)量方面被認(rèn)為是相同的，因此基于這一點(diǎn)將有效樣本的數(shù)目看作是1024。第N幀中的有效樣本的數(shù)目可以如上所述是1024，但也可以是128或其他任何任意值。這個(gè)值是在本發(fā)明的編碼設(shè)備200和解碼設(shè)備之間預(yù)先確定的。
另一方面，除了時(shí)間—頻率變換單元201之外，音頻輸入信號(hào)還被輸入到時(shí)間特性提取單元203。時(shí)間特性提取單元203分析一個(gè)給定音頻輸入信號(hào)的時(shí)間改變，并在音頻輸入信號(hào)被量化時(shí)判定是時(shí)間分辨能力應(yīng)該被優(yōu)先還是頻率分辨能力應(yīng)該被優(yōu)先。也就是說，時(shí)間特性提取單元203判定音頻輸入信號(hào)應(yīng)該在頻域還是在時(shí)域中被量化。這意味著當(dāng)量化發(fā)生在時(shí)域中時(shí)，音頻輸入信號(hào)的時(shí)間改變由時(shí)域中的信號(hào)通知給解碼設(shè)備。這進(jìn)一步基于下面的事實(shí)a)量化帶有一些量化誤差；以及b)雖然當(dāng)量化發(fā)生在頻域時(shí)，誤差可以存在于頻域中的一特定值范圍內(nèi)，但難以掌握誤差分布在時(shí)域中的哪一值范圍內(nèi)。這是由于當(dāng)量化在頻域中進(jìn)行時(shí)可以執(zhí)行高頻率分辨能力、而當(dāng)量化發(fā)生在時(shí)域中時(shí)可以執(zhí)行高時(shí)間分辨能力的原因。并且，當(dāng)一幀給定音頻輸入信號(hào)被分成多個(gè)時(shí)間子幀時(shí)，在屬于每個(gè)子幀的信號(hào)的平均能量與其相鄰子幀的平均能量相比有大的改變的情況下，假設(shè)在音頻輸入信號(hào)的音量上已經(jīng)有一個(gè)迅速的改變，例如一個(gè)沖擊。在這種情況下，量化誤差在時(shí)域上散布不是更可取的。由于這一點(diǎn)，時(shí)間特性提取單元203判定在這樣的頻帶上的量化上給予時(shí)間分辨能力比頻率分辨能力高的優(yōu)先權(quán)。根據(jù)編碼設(shè)備的實(shí)施方法定義時(shí)間特性提取單元203在判定平均能量中的改變大時(shí)所使用的閾值(例如，對(duì)于在相鄰子幀之間的平均能量差的閾值)。然后，時(shí)間特性提取單元203為音頻輸入信號(hào)指定一個(gè)應(yīng)該在時(shí)域中對(duì)其完成量化的頻帶。頻帶和帶寬的選擇不限于上面的情況。關(guān)于指定頻帶的方法，首先，指定在時(shí)域中的一個(gè)包含一個(gè)給出最大振幅的樣本的信號(hào)(峰值信號(hào))，并計(jì)算峰值信號(hào)的頻率。此外，時(shí)間特性提取單元203例如根據(jù)峰值信號(hào)的大小確定一個(gè)帶寬，并指定具有所確定的帶寬的一個(gè)頻帶，包括作為計(jì)算結(jié)果而獲得的頻率或一個(gè)與其接近的頻率。在時(shí)間特性提取單元203中，將對(duì)于時(shí)間分辨能力被優(yōu)先還是頻率分辨能力被優(yōu)先的判定結(jié)果以及指示指定頻帶的數(shù)據(jù)輸出到時(shí)間—頻率變換單元201和編碼數(shù)據(jù)流產(chǎn)生單元205。
頻率特性提取單元202分析作為時(shí)間—頻率變換單元201的輸出信號(hào)的頻譜的特性，并指定一個(gè)最好在時(shí)域中被量化的頻帶。例如，考慮編碼數(shù)據(jù)流產(chǎn)生單元205中的編碼效率，有編碼效率在一個(gè)其中相鄰頻譜系數(shù)在頻譜中廣泛散布的頻帶或一個(gè)其中相鄰頻譜系數(shù)的正負(fù)代碼被頻繁切換或類似的頻帶中未被提高的多個(gè)情況。因此，頻率特性提取單元202從輸入的頻譜對(duì)一個(gè)可用于這些的頻帶采樣，將其輸出到時(shí)間變換單元204，并且還將一個(gè)不可應(yīng)用于這些的頻帶象現(xiàn)在這樣輸出到編碼數(shù)據(jù)流產(chǎn)生單元205。同時(shí)，將指定輸出到時(shí)間變換單元204的頻帶的數(shù)據(jù)輸出到編碼數(shù)據(jù)流產(chǎn)生單元205。
在編碼數(shù)據(jù)流產(chǎn)生單元205，合并頻率特性提取單元202的輸出信號(hào)(指定頻譜和頻帶的數(shù)據(jù))、時(shí)間特性提取單元203的判定結(jié)果和指定頻帶的數(shù)據(jù)以及時(shí)間變換單元204的輸出信號(hào)(一個(gè)頻率—時(shí)間信號(hào))，并產(chǎn)生編碼數(shù)據(jù)流。
圖5A是顯示在與圖4A中的一個(gè)相同的時(shí)間軸上的音頻信號(hào)中如何將一個(gè)第N幀分成用于其第一半的子幀1和用于其第二半的子幀2的示意圖。雖然示意圖顯示了子幀1和子幀2具有相同長(zhǎng)度的情況，但其長(zhǎng)度不必是相同的，或者可以彼此重疊。此后，恰如圖5所示，采用子幀1和子幀2具有相同長(zhǎng)度的情況來(lái)簡(jiǎn)化解釋。
圖5B是顯示通過將圖5A所示的子幀1的時(shí)域中的音頻信號(hào)變換成頻域中的一個(gè)信號(hào)而獲得的頻譜的示意圖。圖5C是顯示通過將圖5A所示的子幀2的時(shí)域中的音頻信號(hào)變換成頻域中的一個(gè)信號(hào)而獲得的頻譜的示意圖。從時(shí)域到頻域的變換是僅僅采用每個(gè)子幀中的音頻信號(hào)來(lái)進(jìn)行的，并假定由變換獲得的頻域中的信號(hào)(頻譜)通過執(zhí)行其逆變換(頻率—時(shí)間變換)將被完全恢復(fù)成時(shí)域中的初始信號(hào)。有離散傅立葉變換和離散余弦變換可用作這種頻率變換方法。由于它們與相關(guān)領(lǐng)域技術(shù)人員所熟悉的類似，所以這里省略其說明。前面提到的MDCT變換是將具有時(shí)間上的一些相互重疊的一幀中的時(shí)域中的信號(hào)變換成頻域中的一個(gè)信號(hào)。然而，這引起用于重構(gòu)時(shí)域中的信號(hào)的延遲，使得它不能用于導(dǎo)出圖5B和圖5C中的頻譜的情況。由于引起一個(gè)延遲的同樣的原因，不使用多相濾波器或類似方法。
由于圖5B和圖5C中的第N幀中的頻譜被分成幀的第一半和第二半，在子幀1和子幀2中分別包含的樣本數(shù)等于該幀中的樣本數(shù)量的一半。圖5A和圖5B中的頻譜的樣本數(shù)分別等于幀中的樣本數(shù)量的一半，因此這些圖在頻率軸方向以樣本的雙倍間隔顯示了與圖4B所示頻帶相同頻帶中的頻率分量的比率中的改變。如圖4B所示，當(dāng)在某一時(shí)刻對(duì)該幀中的音頻輸入信號(hào)執(zhí)行時(shí)間—頻率變換時(shí)，獲得了顯示出在該幀中的整個(gè)音頻輸入信號(hào)中包含的頻率分量的一個(gè)比率的頻譜。但如圖5B和5C所示，如果該幀中的音頻輸入信號(hào)被分成根據(jù)時(shí)間—頻率變換將其分別變換成的第一半和第二半，則顯然在每部分音頻信號(hào)中包含的頻率分量的比率在音頻輸入信號(hào)的第N幀的第一半和第二半之間是不同的。也就是說，圖5B和圖5C所示的頻譜表明了在第N幀的第一半和第二半中的音頻信號(hào)的頻率分量的比率中的時(shí)間改變。
上述的圖5B和圖5C顯示了在將第N幀分成兩個(gè)子幀并對(duì)每個(gè)子幀執(zhí)行時(shí)間—頻率變換的情況下的頻譜的例子。下面參考圖6A和圖6B描述將第N幀進(jìn)一步分成(M+1)段更小的子幀的情況。圖6A是顯示如何將與圖4A相同的時(shí)域中的音頻信號(hào)(第N幀)分成(M+1)段子幀的示意圖。圖6B是顯示通過將一幀中的音頻輸入信號(hào)分成(M+1)段子幀并對(duì)每個(gè)子幀執(zhí)行時(shí)間—頻率變換而獲得的頻譜的示意圖。在圖6A和圖6B中，將在任意位置(例如，第P個(gè)位置(P是一個(gè)整數(shù)))的子幀的時(shí)域中的一個(gè)信號(hào)SubP變換成一個(gè)由至少相同數(shù)目的樣本或更多樣本組成的頻譜系數(shù)Spect_SubP。下面假設(shè)將其變換成包含相同數(shù)目的樣本的頻譜以簡(jiǎn)化解釋。以與此類似的方式，當(dāng)圖6B所示的(M+1)段頻譜(頻譜系數(shù)Spect_Sub0～頻譜系數(shù)Spect_SubM)與圖5B和圖5C所示的頻譜相比較，雖然樣本間隔在頻率軸方向上變得更寬，但在時(shí)間軸方向上更詳細(xì)地指示了第N幀的頻率分量中的時(shí)間改變。
接著，下面采用圖7A和圖7B描述通過對(duì)一幀中的音頻輸入信號(hào)執(zhí)行時(shí)間—頻率變換而獲得的頻譜如何對(duì)應(yīng)于通過由每個(gè)子幀執(zhí)行時(shí)間—頻率變換而獲得的頻譜。圖7A是顯示在通過對(duì)該幀中的音頻信號(hào)在某一時(shí)刻執(zhí)行時(shí)間—頻率變換而獲得的頻譜上的頻帶BandA中包含的一個(gè)樣本的示意圖。圖7A的頻譜與圖4B所示的頻譜相同。并且，圖7B是顯示在通過將該幀中的音頻輸入信號(hào)分成(M+1)段子幀并由每個(gè)子幀執(zhí)行時(shí)間—頻率變換而獲得的頻譜上的頻帶BandB中包含的一個(gè)樣本的示意圖。也就是說，圖7B中的頻譜與圖6B中所示的頻譜相同。圖7A中的頻譜的頻帶BandA和圖7B中的頻譜的頻帶BandB指示相同的頻帶區(qū)域。也就是說，在整個(gè)幀中，在頻帶BandA中包含的樣本數(shù)等于在頻帶BandB中包含的樣本數(shù)。這表明圖7A的頻帶BandA中的頻譜系數(shù)的數(shù)據(jù)(圖中的黑菱形)等效于圖7B的頻帶BandB中的所有子幀中的頻譜系數(shù)中的一個(gè)(圖中的黑菱形)。這里，不需要通過以一個(gè)變換表達(dá)式對(duì)頻帶BandA中的頻譜系數(shù)執(zhí)行時(shí)間變換來(lái)獲得與頻帶BandB中的頻譜系數(shù)完全一致的頻譜系數(shù)。頻帶BandA中的頻譜系數(shù)等效于頻帶BandB中的頻譜系數(shù)是重要的。因此，可以考慮用表達(dá)在頻帶BandB中的所有子頻帶中的樣本(頻譜系數(shù))來(lái)替代對(duì)頻帶BandA中的每個(gè)樣本(頻譜系數(shù))的描述。也就是說，在依據(jù)本發(fā)明的第一實(shí)施例的編碼設(shè)備200中，對(duì)于其中判定時(shí)間分辨能力被優(yōu)先的頻帶BandA，頻帶BandB中的頻譜系數(shù)被量化和編碼，而不是對(duì)頻帶BandA中的頻譜系數(shù)量化和編碼。也就是說，時(shí)間變換單元204例如對(duì)由時(shí)間—頻率變換單元201獲得的頻譜中的其中判定時(shí)間分辨能力被優(yōu)先的頻帶BandA執(zhí)行一個(gè)等效于DCT變換的逆變換(頻率—時(shí)間變換)的變換表達(dá)式，并輸出一個(gè)等效于圖7B所示的頻帶BandB中的所有樣本(頻譜系數(shù))的頻譜系數(shù)。
依據(jù)圖7A和圖7B所指示的頻帶BandA和頻帶BandB的帶寬，為了更好地理解對(duì)于時(shí)間變換單元204的時(shí)間變換方法的解釋，下面利用圖8A和圖8B描述當(dāng)將頻帶BandD的帶寬選擇為在每個(gè)子頻帶中剛好具有屬于頻帶BandD的一段樣本時(shí)的情況。圖8A是顯示通過對(duì)一幀中的音頻信號(hào)執(zhí)行時(shí)間—頻率變換而獲得的頻譜上的頻帶BandC中的一個(gè)樣本的示意圖。圖8B是顯示通過將一幀中的音頻輸入信號(hào)分成(M+1)段子幀并由每個(gè)子幀對(duì)其執(zhí)行時(shí)間—頻率變換而獲得的頻譜上的頻帶BandD中的一個(gè)樣本的示意圖。圖8A中的頻譜與圖4B中所示的頻譜相同，圖8B中的頻譜與圖6B中所示的頻譜相同。并且，圖8A中的頻譜中的頻帶BandC和圖8B中的頻譜中的頻帶BandD顯示了相同的頻帶。在圖8B中，當(dāng)將頻帶BandD的帶寬選擇為在每個(gè)(M+1)段子頻帶中具有屬于頻帶BandD的一段樣本(頻譜系數(shù))時(shí)，與圖8A所示的頻譜中的頻帶是同一頻帶的頻帶BandC中的樣本數(shù)是(M+1)段。因?yàn)閷儆趫D8B所示的頻帶BandD的每個(gè)樣本是從每個(gè)(M+1)段子幀選擇出的，如果采用水平軸上的時(shí)間和垂直軸上的頻譜系數(shù)繪出每個(gè)樣本，則可以說它指示了在音頻信號(hào)的一幀中的屬于頻帶BandC中的頻譜系數(shù)中的時(shí)間改變。
與圖8A類似，圖9A是顯示通過對(duì)一幀中的音頻信號(hào)在某一時(shí)刻執(zhí)行時(shí)間—頻率變換而獲得的頻譜上的頻帶BandC中的一個(gè)樣本的示意圖。圖9B是采用水平軸上的時(shí)間和垂直軸上的頻譜系數(shù)值為圖8B所示的每個(gè)樣本(頻譜系數(shù))重繪的示意圖。已經(jīng)解釋過，如圖9B所示的重繪的、通過在同一頻帶BandD中的(M+1)段子幀的每一個(gè)提取出一個(gè)樣本而組成的信號(hào)等效于由時(shí)間變換單元204獲得的時(shí)間—頻率信號(hào)，并且是指示有關(guān)頻帶BandD的頻譜系數(shù)的時(shí)間改變的時(shí)間—頻率信號(hào)。如上所述，圖9A所示的頻帶BandC中的每個(gè)樣本(頻譜系數(shù))可以被看待為與圖9B中的時(shí)間—頻率信號(hào)(頻帶BandD)幾乎相同的數(shù)據(jù)。因此，在下面的解釋中，將量化圖9A中的頻譜系數(shù)指示為“執(zhí)行Qf”，將量化圖9B中的時(shí)間—頻率信號(hào)指示為“執(zhí)行Qt”。
在依據(jù)本發(fā)明的第一實(shí)施例的編碼設(shè)備200內(nèi)的圖2所示的時(shí)間變換單元204中，由時(shí)間—頻率變換單元201獲得的頻譜的頻譜系數(shù)的一部分、即在圖9A中的頻帶BandC中包含的頻譜系數(shù)流被變換成圖9B中的時(shí)域中的時(shí)間—頻率信號(hào)。經(jīng)過這個(gè)變換等效于從圖8A中的頻帶BandC中包含的頻譜系數(shù)流到圖8B中的頻帶BandD中包含的頻譜系數(shù)流的變換，這已經(jīng)在前面解釋過了?；蛘?，等效于從圖7A中的頻帶BandA中的頻譜系數(shù)流到圖7B 中的頻帶BandB中的頻譜系數(shù)流的變換。
圖2所示的編碼數(shù)據(jù)流產(chǎn)生單元205對(duì)經(jīng)過如上變換的來(lái)自時(shí)間—頻率變換單元201的輸出和來(lái)自時(shí)間變換單元204的輸出進(jìn)行量化和編碼，并輸出編碼數(shù)據(jù)流。關(guān)于編碼數(shù)據(jù)流產(chǎn)生單元205中的量化和編碼的具體方法，使用諸如霍夫曼編碼和向量量化的公知技術(shù)。
并且，編碼數(shù)據(jù)流產(chǎn)生單元205可以將位于具有較小振幅波動(dòng)的一部分中的時(shí)間—頻率信號(hào)的幾段樣本分成組，然后對(duì)每組的平均增益進(jìn)行量化和編碼。圖10是顯示由圖2所示的編碼數(shù)據(jù)流產(chǎn)生單元205對(duì)時(shí)間—頻率信號(hào)的編碼的示意圖。如圖10所示，編碼數(shù)據(jù)流產(chǎn)生單元205例如分別為一個(gè)從頻譜系數(shù)Spec_Sub_0到頻譜系數(shù)Spec_Sub_2的樣本組和一個(gè)從頻譜系數(shù)Spec_Sub_3到頻譜系數(shù)Spec_Sub_M的樣本組找到平均增益Gt1和平均增益Gt2，并對(duì)指定每個(gè)樣本組和每個(gè)組中的平均增益的數(shù)據(jù)進(jìn)行量化和編碼，而不是對(duì)從頻譜系數(shù)Spec_Sub_0到頻譜系數(shù)Spec_Sub_M的時(shí)間—頻率信號(hào)本身進(jìn)行量化和編碼。在這種情況下，如果時(shí)間—頻率信號(hào)在編碼設(shè)備200和對(duì)從編碼設(shè)備200輸出的編碼數(shù)據(jù)流解碼的解碼設(shè)備之間被預(yù)先限定為例如表達(dá)為“樣本組中的第一樣本號(hào)，樣本組中的最后一個(gè)樣本號(hào)，樣本組中的平均增益”，則圖10所示的時(shí)間—頻率信號(hào)可以表達(dá)為兩個(gè)數(shù)據(jù)組(0，2，Gt1)和(3，M，Gt2)。并且，在這種情況下，不需要為時(shí)間—頻率信號(hào)將全部每個(gè)樣本都聚集起來(lái)?？梢灾粚⒃诰哂休^小振幅波動(dòng)的部分中的樣本聚集起來(lái)。對(duì)于具有極端(radical)振幅波動(dòng)的部分，每個(gè)樣本中的頻譜系數(shù)值本身可以被量化和編碼。
此外，在編碼數(shù)據(jù)流產(chǎn)生單元205中，指示哪個(gè)頻帶被進(jìn)行時(shí)間變換的數(shù)據(jù)與時(shí)間—頻率變換單元201的輸出中的編碼數(shù)據(jù)流一起輸出。圖11是顯示時(shí)間—頻率變換單元201的一個(gè)輸出信號(hào)是如何對(duì)應(yīng)于指示由時(shí)間變換單元204進(jìn)行了時(shí)間變換的頻帶的數(shù)據(jù)的示意圖。在同一圖中，垂直軸顯示頻率，水平軸顯示對(duì)應(yīng)于垂直軸上的頻率的頻譜系數(shù)。在時(shí)間—頻率變換單元201中采用MDCT變換的情況下，頻譜系數(shù)在同一圖中指示MDCT系數(shù)。并且，在作為時(shí)間—頻率變換單元201的輸出信號(hào)的頻譜中，虛線所示部分是未被編碼數(shù)據(jù)流產(chǎn)生單元205量化和編碼的部分。相反，在編碼數(shù)據(jù)流產(chǎn)生單元205中，對(duì)應(yīng)于這個(gè)頻帶的時(shí)間—頻率信號(hào)被量化和編碼。同一圖描述了對(duì)于將頻率軸方向分成5個(gè)頻帶、并從其低頻開始按照Qf、Qt、Qf、Qt和Qf的順序進(jìn)行量化的情況的一個(gè)例子。這樣，從編碼數(shù)據(jù)流產(chǎn)生單元205輸出的編碼數(shù)據(jù)流至少包括指示每個(gè)頻帶是在時(shí)域中還是在頻域中被量化和編碼的數(shù)據(jù)以及在每個(gè)頻帶中被編碼和量化的數(shù)據(jù)。頻帶劃分的數(shù)目和在編碼設(shè)備200中的用于每個(gè)頻帶的量化方法(即，是Qf還是Qt)不是固定的，并不限于這個(gè)例子。
圖12是顯示依據(jù)本發(fā)明的第一實(shí)施例的解碼設(shè)備1200的結(jié)構(gòu)的方框圖。這個(gè)解碼設(shè)備1200是一個(gè)對(duì)編碼設(shè)備200輸出的編碼數(shù)據(jù)流解碼、并輸出一個(gè)具有高級(jí)別的時(shí)間分辨能力的音頻信號(hào)的解碼設(shè)備，包括編碼數(shù)據(jù)流分離單元1201、時(shí)間—頻率信號(hào)產(chǎn)生單元1202、頻率變換單元1 203、頻譜產(chǎn)生單元1204和頻率—時(shí)間變換單元1205。編碼數(shù)據(jù)流分離單元1201從作為輸入信號(hào)的編碼數(shù)據(jù)流分離出在指示為“Qf”的頻帶中的編碼數(shù)據(jù)和在指示為“Qt”的頻帶中的編碼數(shù)據(jù)，將在指示為“Qf”的頻帶中的編碼數(shù)據(jù)輸出到頻譜產(chǎn)生單元1204，將在指示為“Qt”的頻帶中的編碼數(shù)據(jù)輸出到時(shí)間—頻率信號(hào)產(chǎn)生單元1202。在指示為“Qf”的頻帶中的編碼數(shù)據(jù)是在編碼設(shè)備200中在頻域量化和編碼的數(shù)據(jù)。在指示為“Qt”的頻帶中的編碼數(shù)據(jù)是在編碼設(shè)備200中在時(shí)域量化和編碼的數(shù)據(jù)。
頻譜產(chǎn)生單元1204對(duì)輸入的編碼數(shù)據(jù)解碼，進(jìn)一步對(duì)其反量化，并產(chǎn)生頻率軸上的一個(gè)頻譜。另一方面，時(shí)間—頻率信號(hào)產(chǎn)生單元1202對(duì)輸入的編碼數(shù)據(jù)解碼，對(duì)其反量化，并在時(shí)間上產(chǎn)生時(shí)間軸上的一個(gè)時(shí)間—頻率信號(hào)。在時(shí)間上產(chǎn)生的時(shí)間—頻率信號(hào)被輸入到頻率變換單元1203。頻率變換單元1203通過采用一個(gè)等效于由編碼設(shè)備200的時(shí)間變換單元204所采用的變換表達(dá)式的逆變換的變換表達(dá)式以數(shù)目小于一幀中的樣本數(shù)的多個(gè)樣本為單位將輸入的時(shí)間—頻率信號(hào)從時(shí)域中的頻譜系數(shù)變換到頻域中的頻譜系數(shù)。將指示時(shí)間—頻率信號(hào)中所表達(dá)出的時(shí)間改變的數(shù)據(jù)反映在作為依據(jù)上面的描述對(duì)該幀的部分變換的結(jié)果而獲得的頻譜系數(shù)上，并將這個(gè)頻譜系數(shù)輸出到頻率—時(shí)間變換單元1205。在頻率—時(shí)間變換單元1205中，將作為頻譜產(chǎn)生單元1204和頻率變換單元1203的輸出信號(hào)的頻域中的頻譜在頻率軸上合成，并變換成在時(shí)間軸上的一個(gè)音頻信號(hào)。這樣，由時(shí)間—頻率信號(hào)表達(dá)的時(shí)間分量可以反映在從頻譜產(chǎn)生單元1204輸出的頻譜上，并且可以獲得一個(gè)具有高時(shí)間分辨能力的音頻信號(hào)。在頻率—時(shí)間變換單元1205，使用一種是在編碼設(shè)備200進(jìn)行的時(shí)間—頻率變換單元201的逆過程的變換方法。例如，如果在編碼設(shè)備200中的時(shí)間—頻率變換單元201中使用MDCT變換，則在頻率—時(shí)間變換單元1205中使用逆MDCT變換。以這種方式獲得的頻率—時(shí)間變換單元1205的輸出例如是一個(gè)由電壓上的離散時(shí)間改變所表達(dá)的一個(gè)音頻輸出信號(hào)。
如上所述，依據(jù)本發(fā)明的第一實(shí)施例中的編碼設(shè)備200和解碼設(shè)備1200，可以選擇是在時(shí)域還是在頻域中對(duì)一個(gè)任意頻帶的一特定時(shí)間幀中的音頻信號(hào)進(jìn)行編碼。因此，這個(gè)方法提供了比僅僅在頻域中的編碼方法或僅僅在時(shí)域中的編碼方法更靈活和更有效的數(shù)據(jù)編碼的可能性。其結(jié)果是，使得能夠在一給定量的數(shù)據(jù)內(nèi)對(duì)許多數(shù)據(jù)編碼，并實(shí)現(xiàn)高質(zhì)量的再現(xiàn)音頻信號(hào)。
雖然在第一實(shí)施例中時(shí)間特性提取單元203判定當(dāng)子幀之間的平均能量的改變(即，相鄰子幀之間的差)大于預(yù)先限定的閾值時(shí)時(shí)間分辨能力應(yīng)該被優(yōu)先，但時(shí)間特性提取單元203判定是時(shí)間分辨能力被優(yōu)先還是頻率分辨能力被優(yōu)先的判決標(biāo)準(zhǔn)并不限于上述方法。并且，在上面的實(shí)施例中，雖然頻率特性提取單元202判定對(duì)于其中鄰接頻譜系數(shù)在頻譜上廣泛散布的頻帶或其中正負(fù)代碼被頻繁切換的頻帶應(yīng)該實(shí)現(xiàn)時(shí)域中的量化，但對(duì)這個(gè)判決的判決標(biāo)準(zhǔn)也不限于上述方法。
(第二實(shí)施例)下面描述本發(fā)明的第二實(shí)施例。第二實(shí)施例中的量化和編碼方法與第一實(shí)施例中的不同。在第一實(shí)施例中，對(duì)于由每幀變換到頻域中的音頻輸入信號(hào)，該幀中的一特定頻帶中的信號(hào)象現(xiàn)在這樣被量化，但另一個(gè)頻帶中的信號(hào)被重新變換到時(shí)域中，然后量化時(shí)域中的信號(hào)。在本發(fā)明的第二實(shí)施例中，不是僅僅用選定頻帶中的信號(hào)實(shí)現(xiàn)量化和編碼，而是由其他頻帶中的信號(hào)執(zhí)行量化和編碼。
圖13是顯示依據(jù)本發(fā)明的第二實(shí)施例的編碼設(shè)備1300的結(jié)構(gòu)的方框圖。編碼設(shè)備1300包括時(shí)間—頻率變換單元1301、頻率特性提取單元1302、時(shí)間特性提取單元1303、量化和編碼單元1304、參考頻帶判定單元1305、時(shí)間變換單元1306、時(shí)間合成和編碼單元1307、頻率合成和編碼單元1308和編碼數(shù)據(jù)流產(chǎn)生單元1309。在同一圖中，時(shí)間—頻率變換單元1301、頻率特性提取單元1302、時(shí)間特性提取單元1303和時(shí)間變換單元1306分別與圖2所示的編碼設(shè)備200中的時(shí)間—頻率變換單元201、頻率特性提取單元202、時(shí)間特性提取單元203和時(shí)間變換單元204幾乎是相同的。
音頻輸入信號(hào)以一特定時(shí)間長(zhǎng)度的每一幀被輸入到時(shí)間—頻率變換單元1301和時(shí)間特性提取單元1303。時(shí)間—頻率變換單元1301將時(shí)域中的輸入信號(hào)變換成頻域中的一個(gè)信號(hào)。時(shí)間—頻率變換單元1301例如采用MDCT變換來(lái)獲得一個(gè)MDCT系數(shù)。
頻率特性提取單元1302分析作為時(shí)間—頻率變換單元201的輸出的由每幀變換的頻譜系數(shù)的頻率特性，并以與圖2中的頻率特性提取單元202相同的方式指定一個(gè)最好以給予時(shí)間分辨能力優(yōu)先權(quán)來(lái)量化的頻帶。
以與圖2中的時(shí)間特性提取單元203相同的方式，時(shí)間特性提取單元1303判定是時(shí)間分辨能力應(yīng)該被優(yōu)先還是頻率分辨能力應(yīng)該被優(yōu)先來(lái)在每幀量化音頻信號(hào)輸入。在時(shí)間特性提取單元1303，因?yàn)椴恍枰韵嗤臅r(shí)間分辨能力或相同的頻率分辨能力對(duì)輸入信號(hào)的所有頻帶量化和編碼，所以可以由每個(gè)子幀或每個(gè)頻帶來(lái)作出判決。
對(duì)于由時(shí)間—頻率變換單元1301獲得的頻域中的信號(hào)(頻譜系數(shù))，量化和編碼單元1304由每個(gè)預(yù)先限定的頻帶對(duì)信號(hào)量化和編碼。這個(gè)量化和編碼單元1304采用相關(guān)領(lǐng)域的技術(shù)人員所熟悉的公知技術(shù)、例如向量量化和霍夫曼編碼對(duì)數(shù)據(jù)量化和編碼。量化和編碼單元1304在內(nèi)部包含一個(gè)在圖中未顯示的存儲(chǔ)器，將已經(jīng)被編碼的編碼數(shù)據(jù)流和編碼之前的頻譜保存在其存儲(chǔ)器中，并將在由參考頻帶判定單元1305判定的頻帶中的編碼數(shù)據(jù)流或編碼之前的頻譜輸出到參考頻帶判定單元1305。
依據(jù)頻率特性提取單元1302和時(shí)間特性提取單元1303的判決結(jié)果，參考頻帶判定單元1305判定在作為量化和編碼單元1304的輸出的編碼數(shù)據(jù)流中的應(yīng)該為由頻率特性提取單元1302和時(shí)間特性提取單元1303指定的頻帶而參考的一個(gè)頻帶。具體地，對(duì)于由時(shí)間特性提取單元1301指定的頻帶，參考頻帶判定單元1305只在時(shí)域中對(duì)第一個(gè)指定頻帶量化和編碼，而不參考其他頻帶，并參考頻帶中的頻譜在時(shí)域中對(duì)剩余頻帶進(jìn)行編碼。此外，對(duì)于由頻率特性提取單元1302指定的頻帶，如果等效于一個(gè)整數(shù)的倍數(shù)(即，諧音的關(guān)系)的信號(hào)分量的頻譜系數(shù)被包含在由頻率特性提取單元1302指定的頻帶中，則參考頻帶判定單元1305在頻域中例如僅僅對(duì)包括頻譜系數(shù)的頻帶中的包含一個(gè)最低頻率的分量(頻譜系數(shù))的頻帶進(jìn)行量化和編碼。例如，如果8kHz、16kHz和24kHz的頻率分量分別被包含在由頻率特性提取單元1302指定的頻帶中，則只對(duì)包含8kHz的頻率分量的頻帶進(jìn)行量化和編碼。對(duì)于除此之外的任何頻帶，例如包含16kHz的頻率分量的頻帶和包含24kHz的頻率分量的頻帶，判定將參考作為參考頻帶的包含最低頻率(8kHz)的分量(頻譜系數(shù))的頻帶來(lái)在頻域中對(duì)其編碼。如果未包含等效于由頻率特性提取單元1302指定的頻帶中的諧音的頻譜系數(shù)，則頻率特性提取單元1302判定不參考其他頻帶在時(shí)域中對(duì)這些頻帶量化和編碼。
接著，參考圖14到16描述參考頻帶判定單元1305的行為。圖14是顯示用于參考其他頻帶產(chǎn)生一個(gè)目標(biāo)頻帶的編碼數(shù)據(jù)流的方法的一個(gè)例子的示意圖。垂直軸顯示頻率，水平軸顯示圖中的頻率的頻譜系數(shù)值。在圖14中，頻帶Base1和頻帶Base2都是其頻域信號(hào)(頻譜)的系數(shù)已經(jīng)被量化和編碼單元1304量化和編碼的頻帶的一部分。另一方面，在指示為“Qt1”和“Qt2”的頻帶中的信號(hào)的含義是分別采用頻帶Base1和頻帶Base2的頻譜系數(shù)進(jìn)行量化和編碼的信號(hào)。例如，“Qt1”意味著采用頻帶Base1的信號(hào)根據(jù)時(shí)域變換被量化和編碼，“Qf2”意味著采用Base2的信號(hào)在頻域被量化和編碼。此外，采用Base1的頻帶信號(hào)來(lái)表達(dá)“Qt1”的參數(shù)被定義為參數(shù)Gt1，采用頻帶Base2的頻帶信號(hào)來(lái)表達(dá)“Qf2”的參數(shù)被定義為參數(shù)Gf2。這意味著頻帶“Qt1”中的信號(hào)由在時(shí)域中表達(dá)的頻帶Base1的頻帶中的信號(hào)用參數(shù)Gt1所指示的參數(shù)來(lái)量化和編碼，頻帶“Qf2”中的信號(hào)由在頻域中表達(dá)的頻帶Base2的頻帶中的信號(hào)(但不需要變換，因?yàn)樗呀?jīng)被在頻域中表達(dá))用參數(shù)Gf2所指示的參數(shù)來(lái)量化和編碼。然而，用于劃分頻帶的方法、其順序和數(shù)量并不限于這些。
圖15是顯示用于參考其他頻帶產(chǎn)生目標(biāo)頻帶的編碼數(shù)據(jù)流的方法的另一個(gè)例子的示意圖。與在圖15中的情況一樣，信號(hào)“Qt”可以通過采用已經(jīng)分別用參數(shù)Gt1和參數(shù)Gt2在量化和編碼單元1304中量化和編碼的頻帶Base1和頻帶Base2這兩個(gè)頻帶(在時(shí)域中表達(dá))由加法之和來(lái)表達(dá)。圖16是顯示用于參考其他頻帶產(chǎn)生目標(biāo)頻帶的編碼數(shù)據(jù)流的方法的其他例子的示意圖。與在圖16中的情況一樣，信號(hào)“Qf”可以通過采用已經(jīng)分別用參數(shù)Gf1和參數(shù)Gf2在量化和編碼單元1304中量化和編碼的頻帶Base1和頻帶Base2這兩個(gè)頻帶(在頻域中表達(dá))由加法之和來(lái)表達(dá)。圖15和圖16中的任一種情況顯示了采用已經(jīng)被量化和編碼的兩個(gè)頻帶中的信號(hào)來(lái)對(duì)一特定頻帶量化和編碼的情況，但頻帶數(shù)并不限于兩個(gè)。在參考頻帶判定單元1305中，一幀中的頻譜系數(shù)中的由時(shí)間特性提取單元203指定的要進(jìn)行量化和編碼的頻帶(目標(biāo)頻帶)通過采用由量化和編碼單元1304量化和編碼的任一個(gè)頻帶(參考頻帶)來(lái)表達(dá)，并判定是否要對(duì)其進(jìn)行量化和編碼。
接著，參考圖17解釋頻率合成和編碼單元1308。圖17是顯示通過采用一個(gè)被參考頻帶中的已經(jīng)被量化和編碼的編碼數(shù)據(jù)流將一個(gè)目標(biāo)域中的頻譜在頻域中合成的方法的一個(gè)例子的示意圖。如上所述，假設(shè)參考頻帶和目標(biāo)頻帶中的信號(hào)已經(jīng)被參考頻帶判定單元1305選擇。在圖17中，頻帶A是參考頻帶，頻帶B是目標(biāo)頻帶。為了簡(jiǎn)化解釋，頻帶A中的信號(hào)和頻帶B中的信號(hào)分別由相同數(shù)目的元素組成，并分別被描述為向量Fa和向量Fb。另外，將每個(gè)向量分成兩個(gè)，即，向量Fa＝(Fa0，F(xiàn)a1)，向量Fb＝(Fb0，F(xiàn)b1)。Fa0、Fa1、Fb0和Fb1是向量。Fa0的元素?cái)?shù)與Fb0的元素?cái)?shù)相同，F(xiàn)a1的元素?cái)?shù)與Fb1的元素?cái)?shù)相同。Fa0的元素?cái)?shù)可以與Fa1的元素?cái)?shù)相同也可以不同。定義一個(gè)參數(shù)Gb＝(Gb0，Gb1)。參數(shù)Gb是一個(gè)向量，但Gb0和Gb1是標(biāo)量值。采用向量Fa和參數(shù)Gb將作為向量Fb的近似的向量Fb’定義為下面的公式 Fb’＝Gb*Fa＝(Gb0*Fa0，Gb1*Fa1)以這種方式，通過從目標(biāo)頻帶A的頻域中的信號(hào)乘以控制合成比的參數(shù)Gb獲得一個(gè)乘積來(lái)合成頻帶B的頻域中的信號(hào)。此外，頻率合成和編碼單元1308對(duì)顯示哪一參考頻帶表達(dá)一特定目標(biāo)頻帶的數(shù)據(jù)以及用于在所參考頻帶上的增益控制的參數(shù)Gb進(jìn)行量化和編碼。為了簡(jiǎn)化解釋，已經(jīng)描述了目標(biāo)頻帶和參考頻帶被分成兩個(gè)向量的情況。但它們也可以被分成少于兩個(gè)或多于兩個(gè)。并且，對(duì)頻帶的劃分可以是均勻的或不均勻的。
下面參考圖18描述時(shí)間合成和編碼單元1307。圖18是顯示通過采用參考頻帶中的已經(jīng)被量化和編碼的編碼數(shù)據(jù)流將目標(biāo)域中的頻譜在時(shí)域中合成的方法的一個(gè)例子的示意圖。如上所述，假設(shè)參考頻帶中的一個(gè)信號(hào)和目標(biāo)頻帶中的一個(gè)信號(hào)已經(jīng)由參考頻帶判定單元1305選擇。在圖18中，假設(shè)頻帶A是參考頻帶，頻帶B是目標(biāo)頻帶。為了簡(jiǎn)化解釋，頻帶A中的信號(hào)和頻帶B中的信號(hào)分別由相同數(shù)目的元素組成。時(shí)間變換單元1306以與第一實(shí)施例的時(shí)間變換單元204相同的方式將頻帶A和頻帶B中的頻域中的信號(hào)變換成時(shí)域中的信號(hào)(Tt)。這里，假設(shè)通過變換頻帶A和頻帶B的頻域中的信號(hào)而獲得的信號(hào)分別是向量Ta和向量Tb。另外，向量Ta和向量Tb可以被劃分如下Ta＝(Ta0，Ta1)；Tb＝(Tb0，Tb1)。Ta0、Ta1、Tb0、Tb1是向量。Ta0的元素?cái)?shù)與Tb0的元素?cái)?shù)相同，Ta1的元素?cái)?shù)與Tb1的元素?cái)?shù)相同。然而，Ta0的元素?cái)?shù)與Ta1的元素?cái)?shù)可以相同也可以不相同。并且，這里定義參數(shù)Gb＝(Gb0，Gb1)。Gb0和Gb1分別是標(biāo)量值。圖19A、圖19B和圖19C是顯示通過采用向量Ta作為頻帶A的時(shí)域中的信號(hào)來(lái)將向量Tb近似為頻帶B的時(shí)域中的信號(hào)的方法的一個(gè)例子的示意圖。圖19A是顯示表達(dá)通過將作為參考頻帶的頻帶A的頻域中的信號(hào)變換成時(shí)域中的信號(hào)而獲得的信號(hào)的向量Ta的示意圖。圖19B是顯示表達(dá)通過將作為目標(biāo)頻帶的頻帶B的頻域中的信號(hào)變換成時(shí)域中的信號(hào)而獲得的信號(hào)的向量Tb的示意圖。圖19C是對(duì)于通過在向量Ta上執(zhí)行一個(gè)增益控制來(lái)表達(dá)一個(gè)近似于向量Tb的向量的情況顯示一個(gè)近似向量Tb’的示意圖。如圖19A、圖19B和圖19C所示，參數(shù)Gb的值被確定為使得向量Ta乘以Gb近似于向量Tb。
例如，采用向量Ta和參數(shù)Gb將近似向量Tb’定義為下面的公式[公式2]Tb’＝Gb*Ta＝(Gb0*Ta0，Gb1*Ta1)以這種方式，由參考頻帶A的時(shí)域中的信號(hào)與執(zhí)行增益控制的參數(shù)Gb來(lái)合成目標(biāo)頻帶B的時(shí)域中的信號(hào)。因此，在時(shí)間合成和編碼單元1307中，對(duì)顯示哪一參考頻帶被用于表達(dá)一特定目標(biāo)頻帶的數(shù)據(jù)以及用于在所參考頻帶上的增益控制的參數(shù)Gb進(jìn)行量化和編碼。為了簡(jiǎn)化解釋，已經(jīng)描述了目標(biāo)頻帶和參考頻帶被分成兩個(gè)向量的情況。但它們也可以被分成少于兩個(gè)或多于兩個(gè)。并且，對(duì)頻帶的劃分可以是均勻的或不均勻的。
在編碼數(shù)據(jù)流產(chǎn)生單元1309中，根據(jù)一個(gè)預(yù)定格式將量化和編碼單元1304、頻率合成和編碼單元1308、時(shí)間合成和編碼單元1307、頻率特性提取單元1302和時(shí)間特性提取單元1303的輸出打包，并與其一起產(chǎn)生編碼數(shù)據(jù)流。因此，作為編碼設(shè)備1300的輸出信號(hào)的編碼數(shù)據(jù)流包含下面的數(shù)據(jù)1.通過對(duì)一個(gè)參考頻帶和一個(gè)既不是參考頻帶也不是目標(biāo)頻帶的頻帶中的信號(hào)進(jìn)行量化和編碼而獲得的數(shù)據(jù)；2.指示參考頻帶和目標(biāo)頻帶之間的關(guān)系的數(shù)據(jù)；3.指示如何采用參考頻帶中的信號(hào)對(duì)目標(biāo)頻帶進(jìn)行量化和編碼的數(shù)據(jù)；4.指示在哪個(gè)域、時(shí)域或頻域中參考頻帶、目標(biāo)頻帶和一個(gè)被分類為不是這兩個(gè)中的任一種的頻帶被量化和編碼的數(shù)據(jù)；等等。并且，參考頻帶和目標(biāo)頻帶中的樣本數(shù)和與每個(gè)頻帶相關(guān)的頻率被直接或間接包含在編碼數(shù)據(jù)流中。
下面參考圖20描述依據(jù)本發(fā)明的第二實(shí)施例的解碼設(shè)備2000。圖20是顯示依據(jù)第二實(shí)施例的解碼設(shè)備2000的結(jié)構(gòu)的方框圖。這個(gè)解碼設(shè)備2000是一個(gè)對(duì)編碼設(shè)備1300產(chǎn)生的編碼數(shù)據(jù)流解碼并輸出一個(gè)音頻輸出信號(hào)的解碼設(shè)備，包括編碼數(shù)據(jù)流分離單元2001、參考頻率信號(hào)產(chǎn)生單元2002、時(shí)間變換單元2003、時(shí)間合成單元2004、頻率變換單元2005、頻率合成單元2006和頻率—時(shí)間變換單元2007。解碼設(shè)備2000中的頻率—時(shí)間變換單元2007、時(shí)間變換單元2003和頻率變換單元2005與第一實(shí)施例中的頻率—時(shí)間變換單元1205、時(shí)間變換單元1306和頻率變換單元1203分別具有相同的結(jié)構(gòu)。編碼數(shù)據(jù)流分離單元2001讀取輸入編碼數(shù)據(jù)流中的一個(gè)標(biāo)題等，并分離出在編碼數(shù)據(jù)流中包含的下列數(shù)據(jù)1.通過對(duì)一個(gè)參考頻帶和一個(gè)既不是參考頻帶也不是目標(biāo)頻帶的頻帶中的信號(hào)進(jìn)行量化和編碼而獲得的數(shù)據(jù)；2.指示參考頻帶和目標(biāo)頻帶之間的關(guān)系的數(shù)據(jù)；3.指示如何采用參考頻帶中的信號(hào)對(duì)目標(biāo)頻帶進(jìn)行量化和編碼的數(shù)據(jù)；4.指示在哪個(gè)域、時(shí)域或頻域中參考頻帶和目標(biāo)頻帶被量化和編碼，并將其輸出到每個(gè)對(duì)應(yīng)單元中的數(shù)據(jù)。參考頻率信號(hào)產(chǎn)生單元2002使用相關(guān)領(lǐng)域的技術(shù)人員所熟悉的公知的解碼方法、例如霍夫曼解碼，并對(duì)頻域中的信號(hào)編碼。這意味著圖14到圖16中的Base1和Base2的信號(hào)被解碼。并且，這意味著圖17和圖18中的頻帶A的頻域中的信號(hào)被解碼。
下面參考圖17解釋頻率合成單元2006的行動(dòng)。如圖17所示，被表達(dá)為頻帶A中的向量Fa的頻域中的信號(hào)(頻譜)是通過在參考頻率信號(hào)產(chǎn)生單元2002中對(duì)從編碼數(shù)據(jù)流分離單元2001輸入到參考頻率信號(hào)產(chǎn)生單元2002的參考頻率中的數(shù)據(jù)進(jìn)行解碼和反量化而獲得的。另一方面，被表達(dá)為頻帶B中的向量Fb的頻域中的信號(hào)(頻譜)由依據(jù)公式1采用向量Fa和參數(shù)Gb合成的近似向量Fb’來(lái)近似。用于增益控制的參數(shù)Gb是通過在編碼數(shù)據(jù)流分離單元2001中從編碼數(shù)據(jù)流分離出來(lái)而獲得的，指示頻帶A是頻帶B的參考頻帶的數(shù)據(jù)也是通過在編碼數(shù)據(jù)流分離單元2001中從編碼數(shù)據(jù)流分離出來(lái)而獲得的。這樣，在頻率合成單元2006，通過產(chǎn)生近似向量Fb’來(lái)產(chǎn)生作為參考頻帶的頻帶B的頻域中的信號(hào)Fb。
接著，參考圖18解釋時(shí)間合成單元2004的行動(dòng)。在圖18中，由向量Ta所指示的頻帶A的時(shí)域中的信號(hào)(時(shí)間—頻率信號(hào))是通過由時(shí)間變換單元2003對(duì)由參考頻率信號(hào)產(chǎn)生單元2002獲得的向量Fa所指示的頻譜執(zhí)行時(shí)間變換(圖18中的過程Tf)而獲得的。并且，在作為目標(biāo)頻帶的頻帶B中的由向量Tb所指示的時(shí)域中的信號(hào)(時(shí)間—頻率信號(hào))由近似向量Tb’來(lái)近似。這個(gè)近似向量Tb’根據(jù)公式2由向量Ta和參數(shù)Gb組成。這樣，在時(shí)間合成單元2004中，通過產(chǎn)生近似向量Tb’來(lái)產(chǎn)生作為目標(biāo)頻帶的頻帶B的時(shí)域中的信號(hào)Tb。用于增益控制的參數(shù)Gb和指示頻帶A是頻帶B的參考頻帶的數(shù)據(jù)是從編碼數(shù)據(jù)流分離單元2001獲得的。由時(shí)間合成單元2004獲得的表示為近似向量Tb’的時(shí)域中的信號(hào)被頻率變換單元2005變換成頻域中的一個(gè)信號(hào)。在頻率—時(shí)間變換單元2007中，將參考頻率信號(hào)產(chǎn)生單元2002、頻率合成單元2006和頻率變換單元2005的輸出合成為頻率軸上的一個(gè)信號(hào)分量。此外，頻率—時(shí)間變換單元2007對(duì)所合成的頻譜執(zhí)行編碼設(shè)備1300的時(shí)間—頻率變換單元1301的時(shí)間—頻率變換的逆變換，并獲得時(shí)域中的音頻輸出信號(hào)。頻率—時(shí)間變換單元2007中的頻率—時(shí)間變換(例如，逆MDCT變換)可以用相關(guān)領(lǐng)域的技術(shù)人員所熟悉的公知技術(shù)來(lái)容易地實(shí)現(xiàn)。
圖21A是顯示由圖2中的編碼數(shù)據(jù)流產(chǎn)生單元205產(chǎn)生的編碼數(shù)據(jù)流的數(shù)據(jù)結(jié)構(gòu)的一個(gè)例子的示意圖。圖21B是顯示由圖13中的編碼數(shù)據(jù)流產(chǎn)生單元1309產(chǎn)生的編碼數(shù)據(jù)流的數(shù)據(jù)結(jié)構(gòu)的一個(gè)例子的示意圖。在圖21A和21B中所示的每個(gè)頻帶的帶寬可以是也可以不是固定帶寬。在第一實(shí)施例的編碼設(shè)備200中，由頻率特性提取單元202和時(shí)間特性提取單元203指定的頻帶中的頻譜在由時(shí)間變換單元204進(jìn)一步變換成一個(gè)時(shí)間—頻率信號(hào)之后被量化和編碼。除此之外的任何頻帶在作為該頻譜時(shí)被量化和編碼。例如，圖21A顯示了由頻率特性提取單元202和時(shí)間特性提取單元203指定的頻帶是頻帶1和頻帶4的情況。如圖21A和21B所示，在每個(gè)頻帶前面描述一個(gè)標(biāo)題。在圖21A中，在每個(gè)標(biāo)題中描述一個(gè)標(biāo)志，顯示出在哪個(gè)域、是時(shí)域還是頻域中對(duì)頻帶中的編碼數(shù)據(jù)流進(jìn)行量化和編碼的。例如，在頻帶1和頻帶4的標(biāo)題中分別描述了標(biāo)志qm＝t，顯示出頻帶1和頻帶4中的編碼數(shù)據(jù)流t_quantize在時(shí)域中被量化和編碼。并且，在頻帶2和頻帶3的標(biāo)題中描述了標(biāo)志qm＝f，顯示出頻帶2和頻帶3中的編碼數(shù)據(jù)流f_quantize在頻域中被量化和編碼。這里，編碼數(shù)據(jù)流f_quantize和編碼數(shù)據(jù)流t_quantize是通過分別在頻域和時(shí)域中對(duì)頻譜進(jìn)行量化和編碼而獲得的編碼數(shù)據(jù)流。
并且，在第二實(shí)施例的編碼設(shè)備1300中，由下面四種類型的編碼方法對(duì)由頻率特性提取單元1302和時(shí)間特性提取單元1303指定的頻帶中的頻譜進(jìn)行編碼1.不參考其他頻帶在頻域中量化和編碼。
2.參考其他頻帶在頻域中編碼。
3.不參考其他頻帶在時(shí)域中量化和編碼。
4.參考其他頻帶在時(shí)域中編碼。
因此，在編碼數(shù)據(jù)流中的每個(gè)頻帶的標(biāo)題中描述了一個(gè)顯示該頻帶是否參考其他頻帶的標(biāo)志、一個(gè)顯示如果參考的話參考哪個(gè)頻帶的頻帶號(hào)、一個(gè)控制參考頻帶的增益的參數(shù)等等。如圖21B所示，例如，在頻帶1的標(biāo)題中描述了一個(gè)顯示頻帶1中的編碼數(shù)據(jù)流t_quantize在時(shí)域中被量化和編碼的標(biāo)志qm＝t。在頻帶2的標(biāo)題中描述了一個(gè)顯示頻帶2中的編碼數(shù)據(jù)流f_quantize在頻域中被量化和編碼的標(biāo)志qm＝f。此外，在頻帶3中描述了下面的元素標(biāo)志qm＝ref，顯示出實(shí)際上不包含通過在時(shí)域中對(duì)頻譜進(jìn)行量化和編碼而獲得的編碼數(shù)據(jù)流，并參考其他頻帶產(chǎn)生頻帶3；頻帶號(hào)ref＝1，顯示出頻帶1是頻帶3的參考頻帶；參數(shù)Gain_info，控制參考頻帶頻帶1的增益；等等。并且，以與頻帶3相同的方式，在頻帶4中描述了如下元素標(biāo)志qm＝ref，顯示出實(shí)際上不包含通過對(duì)頻譜進(jìn)行量化和編碼而獲得的編碼數(shù)據(jù)流，并參考其他頻帶產(chǎn)生頻帶4；頻帶號(hào)ref＝2，顯示出頻帶2是頻帶4的參考頻帶；參數(shù)Gain_info，控制參考頻帶頻帶2的增益；等等。在頻帶3中，因?yàn)轭l帶號(hào)ref＝1顯示出參考在頻域中量化和編碼的頻帶1，這隱含著頻帶3是在頻域中編碼的。在頻帶4中，因?yàn)轭l帶號(hào)ref＝2表明參考在時(shí)域中量化和編碼的頻帶2，這隱含著頻帶4是在時(shí)域中編碼的。
在圖21A中，在編碼數(shù)據(jù)流中的每個(gè)頻帶的標(biāo)題中描述了一個(gè)顯示在哪個(gè)域、是時(shí)域還是頻域中對(duì)頻帶中的編碼數(shù)據(jù)流進(jìn)行量化和編碼的標(biāo)志。但如果預(yù)先確定了在哪個(gè)域中對(duì)哪一頻帶進(jìn)行量化和編碼，則不需要這個(gè)標(biāo)志。并且，在圖21B中，在每個(gè)編碼數(shù)據(jù)流中的每個(gè)頻帶的標(biāo)題中描述了一個(gè)顯示該頻帶是否參考其他頻帶的標(biāo)志以及一個(gè)指定用于該頻帶的參考頻帶的頻帶號(hào)。但如果預(yù)先確定了哪一頻帶參考哪一頻帶，則不需要這些數(shù)據(jù)。
在依據(jù)本發(fā)明的第二實(shí)施例的編碼設(shè)備1300和解碼設(shè)備2000中，如果將參考頻帶選擇為一個(gè)帶有較低頻率分量的頻帶，將目標(biāo)頻帶選擇為一個(gè)帶有比參考頻帶高的頻率分量的頻帶，用一個(gè)現(xiàn)有的編碼方法對(duì)參考頻帶編碼，并將產(chǎn)生目標(biāo)頻帶中的分量的代碼編碼為補(bǔ)充數(shù)據(jù)，則進(jìn)一步可以使用現(xiàn)有的編碼方法和少量的補(bǔ)充數(shù)據(jù)來(lái)再現(xiàn)一個(gè)寬頻帶中的聲音。當(dāng)將AAC方法用作一個(gè)現(xiàn)有的音頻編碼方法時(shí)，只要產(chǎn)生目標(biāo)頻帶中的分量的編碼數(shù)據(jù)被包括在AAC方法的Fill_element中，甚至在與AAC方法兼容的解碼方法中，也可以在不發(fā)出噪聲的情況下對(duì)編碼數(shù)據(jù)流解碼。當(dāng)使用依據(jù)本發(fā)明的第二實(shí)施例的解碼方法時(shí)，還可以從相對(duì)較小量的數(shù)據(jù)再現(xiàn)一個(gè)更寬頻帶上的聲音。
當(dāng)使用結(jié)構(gòu)如上所述的本發(fā)明的編碼設(shè)備和解碼設(shè)備時(shí)，除了可以實(shí)現(xiàn)頻域中的數(shù)據(jù)編碼之外，還可以實(shí)現(xiàn)時(shí)域中的數(shù)據(jù)編碼。因此，通過選擇一種具有更高編碼效率的編碼方法，對(duì)于再現(xiàn)的被解碼的聲音可以高效率地提高頻率分辨能力和時(shí)間分辨能力。并且，因?yàn)橥ㄟ^重新使用已經(jīng)被編碼的頻帶中的信號(hào)可以用較小數(shù)據(jù)量來(lái)構(gòu)造編碼音頻數(shù)據(jù)流，所以可以將編碼音頻數(shù)據(jù)流的比特率保持在較低水平。另外，如果使用相同的比特率，可以提供一個(gè)能夠獲得具有高級(jí)別聲音質(zhì)量的音頻信號(hào)的編碼音頻數(shù)據(jù)流。此外，如果為時(shí)間變換單元1306、時(shí)間變換單元2003和頻率變換單元2005選擇一個(gè)不需要用于劃分信號(hào)的時(shí)間重疊的分析合成類型的正交變換方法，則可以去除編碼設(shè)備和解碼設(shè)備中的任何附加算術(shù)延遲，使得這在編碼和解碼過程中需要考慮延遲的應(yīng)用上具有一個(gè)優(yōu)點(diǎn)。
在上面的第二實(shí)施例中，參考頻帶判定單元1305為頻率特性提取單元1302和時(shí)間特性提取單元1303指定的頻帶判定四種類型的編碼方法，但其實(shí)際的判決方法并不限于上面這些。
工業(yè)實(shí)用性依據(jù)本發(fā)明的編碼設(shè)備可用作為位于用于包括BS和CS的衛(wèi)星廣播的廣播基站中的音頻編碼設(shè)備，作為用于通過諸如因特網(wǎng)的通信網(wǎng)絡(luò)來(lái)分布內(nèi)容的內(nèi)容分布服務(wù)器的音頻編碼設(shè)備，以及進(jìn)一步作為由通用計(jì)算機(jī)執(zhí)行的用于對(duì)音頻信號(hào)編碼的程序。
另外，依據(jù)本發(fā)明的解碼設(shè)備不僅可用作為位于家庭中的STB中的音頻解碼設(shè)備，還作為一個(gè)由通用計(jì)算機(jī)、PDA、移動(dòng)電話等執(zhí)行的用于對(duì)音頻信號(hào)解碼的程序、以及在STB或通用計(jì)算機(jī)中包括的僅用于對(duì)音頻信號(hào)解碼的電路板、LSI等，并進(jìn)一步作為插入到STB或通用計(jì)算機(jī)中的IC卡。
權(quán)利要求
1.一種對(duì)通過根據(jù)時(shí)間—頻率變換來(lái)變換一個(gè)輸入初始信號(hào)而獲得的頻域中的一個(gè)信號(hào)進(jìn)行編碼并產(chǎn)生一個(gè)輸出信號(hào)的編碼設(shè)備，包括第一頻帶指定單元，可用于基于輸入初始信號(hào)的特性為一部分頻譜指定一個(gè)頻帶；時(shí)間變換單元，可用于根據(jù)頻率—時(shí)間變換將指定頻帶中的一個(gè)信號(hào)變換成一個(gè)信號(hào)；以及，編碼單元，可用于對(duì)由時(shí)間變換單元獲得的信號(hào)和至少一部分頻譜進(jìn)行編碼，并從編碼信號(hào)和編碼頻譜產(chǎn)生一個(gè)輸出信號(hào)。
2.依據(jù)權(quán)利要求1的編碼設(shè)備，其中，時(shí)間變換單元根據(jù)頻率—時(shí)間變換將指定頻帶中的信號(hào)變換成一個(gè)指示一個(gè)在與頻譜相同的時(shí)間上的頻率分量的時(shí)間改變的信號(hào)。
3.依據(jù)權(quán)利要求2的編碼設(shè)備，其中，編碼設(shè)備進(jìn)一步包括時(shí)域近似單元，可用于指定頻譜的兩個(gè)或多個(gè)頻帶，并采用一個(gè)指示在一個(gè)指定頻帶中包含的頻率分量的時(shí)間改變的信號(hào)來(lái)近似一個(gè)指示在另一個(gè)指定頻帶中的頻率分量的時(shí)間改變的信號(hào)，以及編碼單元對(duì)用于由時(shí)域近似單元指定的頻帶的近似的信號(hào)進(jìn)行編碼。
4.依據(jù)權(quán)利要求3的編碼設(shè)備，其中，時(shí)域近似單元產(chǎn)生指定在頻譜中用于近似的頻帶和被近似的頻帶的數(shù)據(jù)。
5.依據(jù)權(quán)利要求4的編碼設(shè)備，其中，時(shí)域近似單元進(jìn)一步產(chǎn)生指示用于被近似的信號(hào)的近似的信號(hào)的增益的數(shù)據(jù)。
6.依據(jù)權(quán)利要求5的編碼設(shè)備，其中，編碼單元不對(duì)被近似的信號(hào)進(jìn)行編碼，而是對(duì)由時(shí)域近似單元產(chǎn)生的指定用于近似的頻帶的數(shù)據(jù)和指示增益的數(shù)據(jù)進(jìn)行編碼。
7.依據(jù)權(quán)利要求1的編碼設(shè)備，其中，第一頻帶指定單元為一個(gè)在輸入初始信號(hào)的平均能量上具有一個(gè)大的改變的部分指定一個(gè)頻帶。
8.依據(jù)權(quán)利要求1的編碼設(shè)備，其中，編碼設(shè)備進(jìn)一步包括第二頻帶指定單元，可用于基于頻譜特性為一部分頻譜指定一個(gè)頻帶，以及時(shí)間變換單元根據(jù)頻率—時(shí)間變換將指定頻帶的一個(gè)信號(hào)變換成一個(gè)信號(hào)。
9.依據(jù)權(quán)利要求8的編碼設(shè)備，其中，編碼設(shè)備進(jìn)一步包括頻域近似單元，可用于指定在頻譜中包含的兩個(gè)或多個(gè)頻帶，并采用指定頻帶中的一個(gè)的頻譜來(lái)近似另一個(gè)頻帶的頻譜，以及編碼單元對(duì)用于由頻域近似單元指定的頻帶的近似的頻譜進(jìn)行編碼。
10.依據(jù)權(quán)利要求9的編碼設(shè)備，其中，頻域近似單元產(chǎn)生指定在頻譜中用于近似的頻帶和被近似的頻帶的數(shù)據(jù)。
11.依據(jù)權(quán)利要求10的編碼設(shè)備，其中，頻域近似單元進(jìn)一步產(chǎn)生指示用于被近似的頻譜的近似的頻譜的增益的數(shù)據(jù)。
12.依據(jù)權(quán)利要求11的編碼設(shè)備，其中，編碼單元不對(duì)被近似的頻譜進(jìn)行編碼，而是對(duì)由頻域近似單元產(chǎn)生的指定用于近似的頻帶的數(shù)據(jù)和指示增益的數(shù)據(jù)進(jìn)行編碼。
13.依據(jù)權(quán)利要求8的編碼設(shè)備，其中，第二頻帶指定單元指定一個(gè)在頻譜中具有廣泛散布的頻譜系數(shù)的頻帶。
14.一種對(duì)通過對(duì)一個(gè)輸入初始信號(hào)編碼而獲得的編碼數(shù)據(jù)流進(jìn)行解碼、并輸出一個(gè)頻譜的解碼設(shè)備，包括解碼單元，可用于提取在輸入編碼數(shù)據(jù)流中包含的編碼數(shù)據(jù)流的一部分，并對(duì)提取出的編碼數(shù)據(jù)流解碼；頻率變換單元，可用于將通過對(duì)提取出的編碼數(shù)據(jù)流解碼而獲得的信號(hào)變換成一個(gè)頻譜以及，合成單元，可用于在頻率軸上合成通過對(duì)從輸入編碼數(shù)據(jù)流的其他部分提取出的編碼數(shù)據(jù)流解碼而獲得的一個(gè)頻譜和由頻率變換單元獲得的頻譜。
15.依據(jù)權(quán)利要求14的解碼設(shè)備，其中，由頻率變換單元獲得的頻譜和通過對(duì)從編碼數(shù)據(jù)流的其他部分提取出的編碼數(shù)據(jù)流解碼而獲得的頻譜是指示對(duì)于相同輸入初始信號(hào)的在同一時(shí)間的一個(gè)信號(hào)的頻譜。
16.依據(jù)權(quán)利要求15的解碼設(shè)備，其中，解碼設(shè)備進(jìn)一步包括時(shí)間近似單元，可用于用一個(gè)從其他頻帶中的編碼數(shù)據(jù)流解碼出的信號(hào)來(lái)近似由提取出的編碼數(shù)據(jù)流指示的頻帶，以及頻率變換單元將被近似的信號(hào)變換成一個(gè)頻譜。
17.依據(jù)權(quán)利要求16的解碼設(shè)備，其中，時(shí)間近似單元根據(jù)在提取出的編碼數(shù)據(jù)流中包含的數(shù)據(jù)指定被用于由編碼數(shù)據(jù)流所指示的頻帶的近似的信號(hào)的一個(gè)頻帶，并采用所指定頻帶的信號(hào)執(zhí)行近似。
18.依據(jù)權(quán)利要求17的解碼設(shè)備，其中，時(shí)間近似單元進(jìn)一步通過從提取出的編碼數(shù)據(jù)流中包含的數(shù)據(jù)讀取用于被近似的信號(hào)的近似的信號(hào)的增益，并通過采用所讀取的增益調(diào)節(jié)指定頻帶中的信號(hào)的振幅來(lái)近似頻帶。
19.依據(jù)權(quán)利要求17的編碼設(shè)備，其中，時(shí)間近似單元指定一個(gè)已經(jīng)變換成頻譜的頻帶，根據(jù)頻率—時(shí)間變換將指定頻帶的頻譜變換成一個(gè)信號(hào)，并采用變換所獲得的信號(hào)來(lái)近似一個(gè)由提取出的編碼數(shù)據(jù)流所指示的頻帶。
20.依據(jù)權(quán)利要求16的編碼設(shè)備，其中，解碼設(shè)備進(jìn)一步包括頻率近似單元，可用于用從其他頻帶中的編碼數(shù)據(jù)流解碼出的頻譜來(lái)近似由提取出的編碼數(shù)據(jù)流所指示的頻帶，以及，除了通過對(duì)從輸入編碼數(shù)據(jù)流的其他部分提取出的編碼數(shù)據(jù)流解碼而獲得的頻譜以及由頻率變換單元獲得的頻譜之外，合成單元進(jìn)一步在頻率軸上合成由頻率近似單元近似的頻譜。
21.依據(jù)權(quán)利要求20的解碼設(shè)備，其中，頻率近似單元根據(jù)在提取出的編碼數(shù)據(jù)流中包含的數(shù)據(jù)指定被用于由編碼數(shù)據(jù)流所指示的頻帶的近似的頻譜的一個(gè)頻帶，并采用所指定頻帶的頻譜執(zhí)行近似。
22.依據(jù)權(quán)利要求21的解碼設(shè)備，其中，頻率近似單元進(jìn)一步通過從提取出的編碼數(shù)據(jù)流中包含的數(shù)據(jù)讀取用于被近似的頻譜的近似的頻譜的增益，并通過采用所讀取的增益調(diào)節(jié)指定頻帶中的頻譜的振幅來(lái)近似頻帶。
23.一種對(duì)通過根據(jù)時(shí)間—頻率變換來(lái)變換一個(gè)輸入初始信號(hào)而獲得的頻域中的一個(gè)信號(hào)進(jìn)行編碼并產(chǎn)生一個(gè)輸出信號(hào)的編碼方法，包括第一頻帶指定步驟，用于基于輸入初始信號(hào)的特性為一部分頻譜指定一個(gè)頻帶；時(shí)間變換步驟，用于根據(jù)頻率—時(shí)間變換將指定頻帶中的一個(gè)信號(hào)變換成一個(gè)信號(hào)；以及，編碼步驟，用于對(duì)由時(shí)間變換步驟獲得的信號(hào)和至少一部分頻譜進(jìn)行編碼，并從編碼信號(hào)和編碼頻譜產(chǎn)生一個(gè)輸出信號(hào)。
24.一種對(duì)通過對(duì)一個(gè)輸入初始信號(hào)編碼而獲得的編碼數(shù)據(jù)流進(jìn)行解碼、并輸出一個(gè)頻譜的解碼方法，包括解碼步驟，用于提取在輸入編碼數(shù)據(jù)流中包含的編碼數(shù)據(jù)流的一部分，并對(duì)提取出的編碼數(shù)據(jù)流解碼；頻率變換步驟，用于將通過對(duì)提取出的編碼數(shù)據(jù)流解碼而獲得的信號(hào)變換成一個(gè)頻譜；以及，合成步驟，用于在頻率軸上合成通過對(duì)從輸入編碼數(shù)據(jù)流的其他部分提取出的編碼數(shù)據(jù)流解碼而獲得的一個(gè)頻譜和由頻率變換步驟獲得的頻譜。
25.一種對(duì)通過根據(jù)時(shí)間—頻率變換來(lái)變換一個(gè)輸入初始信號(hào)而獲得的頻域中的一個(gè)信號(hào)進(jìn)行編碼并產(chǎn)生一個(gè)輸出信號(hào)的程序，所述程序使計(jì)算機(jī)執(zhí)行第一頻帶指定步驟，用于基于輸入初始信號(hào)的特性為一部分頻譜指定一個(gè)頻帶；時(shí)間變換步驟，用于根據(jù)頻率—時(shí)間變換將指定頻帶中的一個(gè)信號(hào)變換成一個(gè)信號(hào)；以及，編碼步驟，用于對(duì)由時(shí)間變換步驟獲得的信號(hào)和至少一部分頻譜進(jìn)行編碼，并從編碼信號(hào)和編碼頻譜產(chǎn)生一個(gè)輸出信號(hào)。
26.一種對(duì)通過對(duì)一個(gè)輸入初始信號(hào)編碼而獲得的編碼數(shù)據(jù)流進(jìn)行解碼、并輸出一個(gè)頻譜的程序，所述程序使計(jì)算機(jī)執(zhí)行解碼步驟，用于提取在輸入編碼數(shù)據(jù)流中包含的編碼數(shù)據(jù)流的一部分，并對(duì)提取出的編碼數(shù)據(jù)流解碼；頻率變換步驟，用于將通過對(duì)提取出的編碼數(shù)據(jù)流解碼而獲得的信號(hào)變換成一個(gè)頻譜；以及，合成步驟，用于在頻率軸上合成通過對(duì)從輸入編碼數(shù)據(jù)流的其他部分提取出的編碼數(shù)據(jù)流解碼而獲得的一個(gè)頻譜和由頻率變換步驟獲得的頻譜。
全文摘要
一種編碼設(shè)備(200)包括時(shí)間特性提取單元(203)，基于時(shí)域中的一個(gè)音頻輸入信號(hào)的特性為一部分頻譜指定一個(gè)頻帶；時(shí)間變換單元(204)，根據(jù)頻率一時(shí)間變換將指定頻帶中的一個(gè)信號(hào)變換成一個(gè)信號(hào)；以及，編碼數(shù)據(jù)流產(chǎn)生單元(205)，對(duì)由時(shí)間變換單元(204)獲得的信號(hào)和至少一部分頻譜進(jìn)行編碼，并從編碼信號(hào)和編碼頻譜產(chǎn)生一個(gè)輸出編碼數(shù)據(jù)流。
文檔編號(hào)G10L19/02GK1516865SQ0380041
公開日2004年7月28日申請(qǐng)日期2003年4月7日優(yōu)先權(quán)日2002年4月11日
發(fā)明者津島峰生, 則松武志, 志, 也, 田中直也申請(qǐng)人:松下電器產(chǎn)業(yè)株式會(huì)社

完整全部詳細(xì)技術(shù)資料下載