專利名稱:編碼設(shè)備和解碼設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及采用一個(gè)諸如正交變換的方法通過用一個(gè)較少量的編碼數(shù)據(jù)流對(duì)通過將時(shí)域中的音頻信號(hào)、例如聲音和音樂信號(hào)變換成頻域內(nèi)的信號(hào)所獲得的信號(hào)進(jìn)行編碼來(lái)壓縮數(shù)據(jù)的編碼方法,以及用于在接收到編碼數(shù)據(jù)流時(shí)擴(kuò)展數(shù)據(jù)并獲得音頻信號(hào)的解碼方法。
背景技術(shù):
目前已經(jīng)開發(fā)出了幾種對(duì)音頻信號(hào)進(jìn)行編碼和解碼的方法。特別地,近來(lái),在ISO/IEC中被在國(guó)際上標(biāo)準(zhǔn)化的IS13818-7被公知并被高度評(píng)價(jià)為是一個(gè)具有高效率的再現(xiàn)高質(zhì)量聲音的編碼方法。這個(gè)編碼方法被稱為高級(jí)音頻編碼(AAC)。近年來(lái),AAC被采用在被稱為MPEG4的標(biāo)準(zhǔn)中,并且已經(jīng)開發(fā)出一個(gè)具有添加到IS13818-7的一些擴(kuò)展功能的被稱為MPEG-4 AAC的系統(tǒng)。在MPEG-4AAC的介紹部分描述了編碼過程的一個(gè)例子。
下面是參考圖1對(duì)于一個(gè)采用常規(guī)編碼方法的音頻編碼設(shè)備的解釋。圖1是顯示一個(gè)常規(guī)編碼設(shè)備100的結(jié)構(gòu)的方框圖。編碼設(shè)備100包括時(shí)間—頻率變換單元101、頻譜放大單元102、頻譜量化單元103、霍夫曼編碼單元104和編碼數(shù)據(jù)流傳輸單元105。以預(yù)定時(shí)間間隔將一個(gè)通過以預(yù)定頻率對(duì)一個(gè)模擬音頻信號(hào)采樣而獲得的在時(shí)間軸上的數(shù)字音頻信號(hào)分成各個(gè)預(yù)定數(shù)目的樣本,并通過時(shí)間—頻率變換單元101變換成頻率軸上的數(shù)據(jù),然后作為到編碼設(shè)備100的輸入信號(hào)送給頻譜放大單元102。頻譜放大單元102以一個(gè)特定增益放大在各個(gè)預(yù)定波帶中包括的頻譜。頻譜量化單元103用一個(gè)預(yù)定的變換表達(dá)式對(duì)放大的頻譜進(jìn)行量化。在AAC方法的情況下,量化是通過將以浮點(diǎn)表示的頻譜數(shù)據(jù)舍入成一個(gè)整數(shù)值來(lái)進(jìn)行的?;舴蚵幋a單元104根據(jù)霍夫曼編碼對(duì)其一組特定條中的量化的頻譜數(shù)據(jù)進(jìn)行編碼,并根據(jù)霍夫曼編碼對(duì)頻譜放大單元102中的各個(gè)預(yù)定頻帶中的增益以及指定用于量化的變換表達(dá)式的數(shù)據(jù)進(jìn)行編碼,然后將其代碼發(fā)送到編碼數(shù)據(jù)流傳輸單元105。將霍夫曼編碼的數(shù)據(jù)流從編碼數(shù)據(jù)流傳輸單元105通過一個(gè)傳輸信道或一個(gè)記錄介質(zhì)傳輸?shù)揭粋€(gè)解碼設(shè)備,并由解碼設(shè)備重構(gòu)為時(shí)間軸上的音頻信號(hào)。常規(guī)的編碼設(shè)備的操作即如上所述。
然而,在常規(guī)的編碼設(shè)備100中,壓縮數(shù)據(jù)量的能力取決于霍夫曼編碼單元104或類似單元的性能,因此在以高壓縮率、即以少量數(shù)據(jù)進(jìn)行編碼時(shí),需要充分提高頻譜放大單元102中的增益,并對(duì)由頻譜量化單元103獲得的量化的頻譜流編碼,以使其是霍夫曼編碼單元104中的一個(gè)較少量的數(shù)據(jù)。依據(jù)這個(gè)方法,如果編碼是為了使數(shù)據(jù)量更少而進(jìn)行的,則用于再現(xiàn)的聲音和音樂的頻率帶寬實(shí)際上變得很窄。因此,不能否定,聲音和音樂對(duì)于人的聽覺來(lái)說將是沙啞的。其結(jié)果是,不可能保持聲音質(zhì)量。這是一個(gè)問題。
并且,在常規(guī)的編碼設(shè)備100內(nèi),在時(shí)間—頻率變換單元101中以每個(gè)預(yù)定間隔(樣本數(shù))將在時(shí)間軸上表示的輸入信號(hào)變換成頻率軸上表示的頻譜。因此,在這個(gè)后一階段用于編碼的量化的信號(hào)是頻率軸上的頻譜。對(duì)一個(gè)量化過程來(lái)說,通過例如將頻譜數(shù)據(jù)中的小數(shù)點(diǎn)值舍入成一個(gè)整數(shù)值的處理而具有一些量化誤差是不可避免的。與在頻率軸上容易估計(jì)在信號(hào)中產(chǎn)生的量化誤差這個(gè)事實(shí)相反的是,在時(shí)間軸上則是困難的。由于這一點(diǎn),不容易通過估計(jì)在時(shí)間軸上反映的量化誤差來(lái)提高編碼設(shè)備的時(shí)間分辨能力。并且,如果可分配給編碼的數(shù)據(jù)量足夠多,則有可能提高頻率分辨能力和時(shí)間分辨能力。但如果分配用于編碼的數(shù)據(jù)量較小,則在這兩方面提高都是非常困難的。
考慮到上述問題,本發(fā)明的目的在于提供一種能夠以高級(jí)別的時(shí)間分辨能力以高壓縮比對(duì)一個(gè)音頻信號(hào)編碼的編碼設(shè)備,以及一種能夠?qū)掝l帶上的頻譜數(shù)據(jù)解碼的解碼設(shè)備。
發(fā)明內(nèi)容
依據(jù)本發(fā)明的編碼設(shè)備是一個(gè)對(duì)通過依據(jù)時(shí)間—頻率變換來(lái)變換一個(gè)輸入初始信號(hào)而獲得的在頻域中的信號(hào)進(jìn)行編碼、并產(chǎn)生一個(gè)輸出信號(hào)的編碼設(shè)備,包括第一頻帶指定單元,可用于基于輸入初始信號(hào)的特性為一部分頻譜指定一個(gè)頻帶;時(shí)間變換單元,可用于根據(jù)頻率—時(shí)間變換將指定頻帶中的一個(gè)信號(hào)變換成一個(gè)信號(hào);以及,編碼單元,可用于對(duì)由時(shí)間變換單元獲得的信號(hào)和至少一部分頻譜進(jìn)行編碼,并從編碼信號(hào)和編碼頻譜產(chǎn)生一個(gè)輸出信號(hào)。
并且,本發(fā)明的解碼設(shè)備是一個(gè)對(duì)通過對(duì)一個(gè)輸入初始信號(hào)編碼而獲得的編碼數(shù)據(jù)流進(jìn)行解碼、并輸出一個(gè)頻譜的解碼設(shè)備,包括解碼單元,可用于提取在輸入編碼數(shù)據(jù)流中包含的編碼數(shù)據(jù)流的一部分,并對(duì)提取出的編碼數(shù)據(jù)流解碼;頻率變換單元,可用于將通過對(duì)提取出的編碼數(shù)據(jù)流解碼而獲得的信號(hào)變換成一個(gè)頻譜;以及,合成單元,可用于在頻率軸上合成通過對(duì)從輸入編碼數(shù)據(jù)流的其他部分提取出的編碼數(shù)據(jù)流解碼而獲得的一個(gè)頻譜和由頻率變換單元獲得的頻譜。
如上所述,依據(jù)本發(fā)明的編碼設(shè)備和解碼設(shè)備,通過在時(shí)域中的編碼之外還增加時(shí)域中的編碼,變得能夠以較高的編碼效率選擇一個(gè)域中的編碼并減少所輸出的編碼數(shù)據(jù)流的比特量。此外,通過增加時(shí)域中的編碼,變得容易提高時(shí)間分辨能力以及頻率分辨能力。
并且,依據(jù)本發(fā)明的編碼設(shè)備和解碼設(shè)備可以以低比特率提供一個(gè)寬頻帶的編碼音頻數(shù)據(jù)流。對(duì)于較低頻率區(qū)域中的一個(gè)分量,其頻率的微觀結(jié)構(gòu)通過采用一個(gè)諸如霍夫曼編碼的壓縮技術(shù)來(lái)編碼。對(duì)于較高頻率區(qū)域中的一個(gè)分量,只對(duì)通過用較低頻率區(qū)域中的頻譜替代較高頻率區(qū)域中的頻譜而再現(xiàn)的主要數(shù)據(jù)進(jìn)行編碼,而不對(duì)其微觀結(jié)構(gòu)編碼,以使得由高頻中的分量的編碼所使用的數(shù)據(jù)量可以最少。
依據(jù)本發(fā)明的解碼設(shè)備,由于高頻區(qū)域中的分量是通過在再現(xiàn)音頻信號(hào)時(shí)在解碼過程中處理較低頻率區(qū)域中的頻譜的再現(xiàn)而產(chǎn)生的,所以可以容易地由低比特率來(lái)實(shí)現(xiàn),并且可以在比由常規(guī)解碼設(shè)備以同一比率再現(xiàn)的更寬的頻帶中再現(xiàn)聲音。
圖1是顯示常規(guī)編碼設(shè)備的結(jié)構(gòu)的方框圖。
圖2是顯示依據(jù)本發(fā)明的第一實(shí)施例的解碼設(shè)備的結(jié)構(gòu)的方框圖。
圖3是顯示由圖2所示的時(shí)間—頻率變換單元進(jìn)行的時(shí)間—頻率變換的一個(gè)例子的示意圖。
圖4A是顯示輸入到時(shí)間—頻率變換單元中的時(shí)域中的一個(gè)音頻信號(hào)的示意圖。在該示意圖中,假定根據(jù)頻率變換在某一時(shí)刻要變換一個(gè)在等效于第N幀的一部分中的信號(hào)。
圖4B是顯示對(duì)圖4A所示的第N幀中的音頻信號(hào)在某一時(shí)刻執(zhí)行時(shí)間—頻率變換而獲得的一個(gè)頻譜。
圖5A是顯示與圖4A在同一時(shí)間軸上的音頻信號(hào)的第N幀是如何被分成用于其第一半的子幀1和用于其第二半的子幀2的示意圖。
圖5B是顯示通過將圖5A所示的子幀1中的時(shí)域中的音頻信號(hào)變換成頻域中的一個(gè)信號(hào)而獲得的頻譜的示意圖。
圖5C是顯示通過將圖5A所示的子幀2中的時(shí)域中的音頻信號(hào)變換成頻域中的一個(gè)信號(hào)而獲得的頻譜的示意圖。
圖6A是顯示與圖4A相同的時(shí)域中的音頻信號(hào)(第N幀)是如何被分成(M+1)段子幀的示意圖。
圖6B是顯示通過將一幀中的音頻輸入信號(hào)分成(M+1)段子幀并由每個(gè)子幀執(zhí)行時(shí)間—頻率變換而獲得的頻譜的示意圖。
圖7A是顯示通過對(duì)一幀中的音頻信號(hào)在某一時(shí)刻執(zhí)行時(shí)間—頻率變換而獲得的頻譜上的頻帶BandA中包含的樣本的示意圖。
圖7B是顯示通過將一幀中的音頻輸入信號(hào)分成(M+1)段并由每個(gè)子幀對(duì)其執(zhí)行時(shí)間—頻率變換而獲得的頻譜上的頻帶BandB中包含的樣本的示意圖。
圖8A是顯示通過對(duì)一幀中的音頻信號(hào)在某一時(shí)刻執(zhí)行時(shí)間—頻率變換而獲得的頻譜上的頻帶BandC中的樣本的示意圖。
圖8B是顯示通過將一幀中的音頻輸入信號(hào)分成(M+1)段子幀并由每個(gè)子幀對(duì)其執(zhí)行時(shí)間—頻率變換而獲得的頻譜上的頻帶BandD中的樣本的示意圖。
圖9A是顯示通過對(duì)一幀中的音頻信號(hào)在某一時(shí)刻執(zhí)行時(shí)間—頻率變換而獲得的頻譜上的頻帶BandC中的樣本的示意圖。
圖9B是采用水平軸上的時(shí)間和垂直軸上的頻譜系數(shù)為圖8B所示的每個(gè)樣本(頻譜系數(shù))重繪的示意圖。
圖10是顯示由圖2所示的編碼數(shù)據(jù)流產(chǎn)生單元對(duì)一個(gè)時(shí)間—頻率信號(hào)編碼的示意圖。
圖11是顯示時(shí)間—頻率變換單元的一個(gè)輸出信號(hào)是如何對(duì)應(yīng)于指示由一個(gè)時(shí)間變換單元依據(jù)時(shí)間變換而變換的頻帶的數(shù)據(jù)的示意圖。
圖12是顯示依據(jù)本發(fā)明的第一實(shí)施例的解碼設(shè)備的結(jié)構(gòu)的方框圖。
圖13是顯示依據(jù)本發(fā)明的第二實(shí)施例的編碼設(shè)備的結(jié)構(gòu)的方框圖。
圖14是顯示參考其他頻帶在一個(gè)目標(biāo)頻帶中產(chǎn)生一個(gè)編碼數(shù)據(jù)流的方法的一個(gè)例子的示意圖。
圖15是顯示參考其他頻帶在目標(biāo)頻帶中產(chǎn)生編碼數(shù)據(jù)流的方法的另一個(gè)例子的示意圖。
圖16是顯示參考其他頻帶在目標(biāo)頻帶中產(chǎn)生編碼數(shù)據(jù)流的方法的其他例子的示意圖。
圖17是顯示通過采用一個(gè)參考頻帶中的已經(jīng)被量化和編碼的編碼數(shù)據(jù)流將一個(gè)目標(biāo)域中的頻譜在頻域中合成的方法的一個(gè)例子的示意圖。
圖18是顯示通過采用一個(gè)參考頻帶中的已經(jīng)被量化和編碼的編碼數(shù)據(jù)流將一個(gè)目標(biāo)域中的頻譜在時(shí)域中合成的方法的一個(gè)例子的示意圖。
圖19A是顯示一個(gè)指示通過將一個(gè)作為參考頻帶的頻帶A的頻域中的一個(gè)信號(hào)變換成時(shí)域中的信號(hào)而獲得的一個(gè)信號(hào)的向量Ta的示意圖。
圖19B是顯示一個(gè)指示通過將一個(gè)作為參考頻帶的頻帶B的頻域中的一個(gè)信號(hào)變換成時(shí)域中的信號(hào)而獲得的一個(gè)信號(hào)的向量Tb的示意圖。
圖19C是對(duì)于通過在向量Ta上施加一個(gè)增益控制來(lái)指示一個(gè)近似于向量Tb的向量的情況,顯示一個(gè)近似向量Tb’的示意圖。
圖20是顯示依據(jù)第二實(shí)施例的解碼設(shè)備的結(jié)構(gòu)的方框圖。
圖21A是顯示由圖2所示的編碼數(shù)據(jù)流產(chǎn)生單元產(chǎn)生的編碼數(shù)據(jù)流的數(shù)據(jù)結(jié)構(gòu)的一個(gè)例子的示意圖。
圖21B是顯示由圖13所示的編碼數(shù)據(jù)流產(chǎn)生單元產(chǎn)生的編碼數(shù)據(jù)流的數(shù)據(jù)結(jié)構(gòu)的一個(gè)例子的示意圖。
具體實(shí)施例方式
下面將參考附圖(圖2~圖20)解釋依據(jù)本發(fā)明的實(shí)施例的編碼設(shè)備和解碼設(shè)備。
(第一實(shí)施例)圖2是顯示依據(jù)本發(fā)明的第一實(shí)施例的編碼設(shè)備200的結(jié)構(gòu)的方框圖。編碼設(shè)備200是一個(gè)提取出在時(shí)間軸上表示的音頻輸入信號(hào)的時(shí)間特性并在基于提取出的時(shí)間特性將一個(gè)頻譜的一部分部分地變換成時(shí)域中的一個(gè)頻率信號(hào)之后編碼的編碼設(shè)備,包括時(shí)間—頻率變換單元201、頻率特性提取單元202、時(shí)間特性提取單元203、時(shí)間變換單元204和編碼數(shù)據(jù)流產(chǎn)生單元205。
時(shí)間—頻率變換單元201將音頻輸入信號(hào)從時(shí)間軸上的一個(gè)離散信號(hào)變換成具有規(guī)則間隔的頻譜數(shù)據(jù)。更具體地,時(shí)間—頻率變換單元201例如基于作為一單位的一幀(1024個(gè)樣本)變換在時(shí)域中的某一時(shí)刻的音頻信號(hào),并作為變換結(jié)果為1024個(gè)樣本或類似產(chǎn)生一個(gè)頻譜系數(shù)。MDCT變換或類似被用作時(shí)間—頻率變換,并作為變換結(jié)果產(chǎn)生一個(gè)MDCT系數(shù)或類似。從其向時(shí)間變換單元204輸出由時(shí)間特性提取單元203指定的頻帶中的多個(gè)頻譜系數(shù),并向頻率特性提取單元202輸出頻帶中的其他頻譜系數(shù)。
頻率特性提取單元202提取出頻譜的頻率特性,基于提取出的特性對(duì)于頻域中的量化和編碼的情況選擇一個(gè)帶有較差的編碼效率的頻帶,將其從由時(shí)間—頻率變換單元201輸出的頻譜劃分出來(lái),并將其輸出到時(shí)間變換單元204。將除此之外的頻帶的頻譜輸入到編碼數(shù)據(jù)流產(chǎn)生單元205。
時(shí)間特性提取單元203分析音頻輸入信號(hào)的時(shí)間特性,判定當(dāng)在編碼數(shù)據(jù)流產(chǎn)生單元205進(jìn)行量化時(shí)是時(shí)間分辨能力優(yōu)先還是頻率分辨能力優(yōu)先,并指定一個(gè)其中判定時(shí)間分辨能力優(yōu)先的頻帶。時(shí)間變換單元204采用一個(gè)全部可逆的變換表達(dá)式將在其中判定時(shí)間分辨能力優(yōu)先的頻帶中的頻譜和由頻率特性提取單元202選擇的頻帶中的頻譜變換成一個(gè)被指示為頻譜系數(shù)中的時(shí)間改變的時(shí)間—頻率信號(hào)。在因而量化了從時(shí)間—頻率變換單元201輸入的頻譜以及從時(shí)間變換單元204輸入的時(shí)間—頻率信號(hào)之后,編碼數(shù)據(jù)流產(chǎn)生單元205對(duì)其進(jìn)行編碼。此外,編碼數(shù)據(jù)流產(chǎn)生單元205將諸如標(biāo)題的附加數(shù)據(jù)附在編碼數(shù)據(jù)上,并根據(jù)一個(gè)預(yù)定格式產(chǎn)生一個(gè)編碼數(shù)據(jù)流,將產(chǎn)生的編碼數(shù)據(jù)流輸出到編碼設(shè)備200的外部。
圖3是顯示由圖2所示的時(shí)間—頻率變換單元201進(jìn)行的時(shí)間—頻率變換的一個(gè)例子的示意圖。例如,如圖3所示,時(shí)間—頻率變換單元201以允許一些重疊的規(guī)則的時(shí)間間隔在時(shí)間軸上劃分離散信號(hào),并執(zhí)行變換。與第N幀(N是一個(gè)正整數(shù))形成對(duì)比,圖3顯示了通過允許第(N+1)幀的一半與第N幀重疊來(lái)提取出第(N+1)幀并對(duì)其進(jìn)行變換的情況。一般來(lái)說,時(shí)間—頻率變換單元201通過改進(jìn)的離散余弦變換(MDCT)來(lái)變換數(shù)據(jù)。然而,時(shí)間—頻率變換單元201的變換方法并不限于MDCT。它可以是多相濾波器或傅立葉變換。由于相關(guān)領(lǐng)域技術(shù)人員熟悉MDCT、多相濾波器和傅立葉變換中的任何一種,因此這里省略對(duì)它們的解釋。
圖4A是顯示輸入到時(shí)間—頻率變換單元201的時(shí)域中的音頻信號(hào)的示意圖。假設(shè)在同一圖中在某一時(shí)刻對(duì)在等效于第N幀的部分中的信號(hào)進(jìn)行了頻率變換。圖4B是顯示通過對(duì)圖4A所示的第N幀中的音頻信號(hào)在某一時(shí)刻執(zhí)行時(shí)間—頻率變換而獲得的一個(gè)頻譜的示意圖。這個(gè)示意圖是采用垂直軸上的頻率和水平軸上的用于該頻率的頻譜系數(shù)值而繪出的。如圖所示,對(duì)于第N幀的時(shí)域中的信號(hào)被變換成頻域中的信號(hào)。圖4B所示頻譜指示在圖4A所示的一幀持續(xù)時(shí)間內(nèi)在音頻信號(hào)中包含的一個(gè)頻率分量的特性。當(dāng)在時(shí)間—頻率變換單元201中采用MDCT時(shí),時(shí)域中的信號(hào)和頻域中的信號(hào)具有相同數(shù)目的有效樣本。關(guān)于有效樣本的數(shù)目,在MDCT的情況下,如果圖4A所示的第N幀中的樣本數(shù)目是2048個(gè)樣本,則圖4B所示的獨(dú)立頻率系數(shù)(MDCT系數(shù))的數(shù)目是1024個(gè)樣本。然而,因?yàn)镸DCT是一種如圖3所示各幀由其他幀的一半覆蓋的算法,因此在圖4A中新輸入的樣本數(shù)目是1024個(gè)樣本。因此,圖4A和圖4B中的樣本數(shù)目在每個(gè)數(shù)據(jù)量方面被認(rèn)為是相同的,因此基于這一點(diǎn)將有效樣本的數(shù)目看作是1024。第N幀中的有效樣本的數(shù)目可以如上所述是1024,但也可以是128或其他任何任意值。這個(gè)值是在本發(fā)明的編碼設(shè)備200和解碼設(shè)備之間預(yù)先確定的。
另一方面,除了時(shí)間—頻率變換單元201之外,音頻輸入信號(hào)還被輸入到時(shí)間特性提取單元203。時(shí)間特性提取單元203分析一個(gè)給定音頻輸入信號(hào)的時(shí)間改變,并在音頻輸入信號(hào)被量化時(shí)判定是時(shí)間分辨能力應(yīng)該被優(yōu)先還是頻率分辨能力應(yīng)該被優(yōu)先。也就是說,時(shí)間特性提取單元203判定音頻輸入信號(hào)應(yīng)該在頻域還是在時(shí)域中被量化。這意味著當(dāng)量化發(fā)生在時(shí)域中時(shí),音頻輸入信號(hào)的時(shí)間改變由時(shí)域中的信號(hào)通知給解碼設(shè)備。這進(jìn)一步基于下面的事實(shí)a)量化帶有一些量化誤差;以及b)雖然當(dāng)量化發(fā)生在頻域時(shí),誤差可以存在于頻域中的一特定值范圍內(nèi),但難以掌握誤差分布在時(shí)域中的哪一值范圍內(nèi)。這是由于當(dāng)量化在頻域中進(jìn)行時(shí)可以執(zhí)行高頻率分辨能力、而當(dāng)量化發(fā)生在時(shí)域中時(shí)可以執(zhí)行高時(shí)間分辨能力的原因。并且,當(dāng)一幀給定音頻輸入信號(hào)被分成多個(gè)時(shí)間子幀時(shí),在屬于每個(gè)子幀的信號(hào)的平均能量與其相鄰子幀的平均能量相比有大的改變的情況下,假設(shè)在音頻輸入信號(hào)的音量上已經(jīng)有一個(gè)迅速的改變,例如一個(gè)沖擊。在這種情況下,量化誤差在時(shí)域上散布不是更可取的。由于這一點(diǎn),時(shí)間特性提取單元203判定在這樣的頻帶上的量化上給予時(shí)間分辨能力比頻率分辨能力高的優(yōu)先權(quán)。根據(jù)編碼設(shè)備的實(shí)施方法定義時(shí)間特性提取單元203在判定平均能量中的改變大時(shí)所使用的閾值(例如,對(duì)于在相鄰子幀之間的平均能量差的閾值)。然后,時(shí)間特性提取單元203為音頻輸入信號(hào)指定一個(gè)應(yīng)該在時(shí)域中對(duì)其完成量化的頻帶。頻帶和帶寬的選擇不限于上面的情況。關(guān)于指定頻帶的方法,首先,指定在時(shí)域中的一個(gè)包含一個(gè)給出最大振幅的樣本的信號(hào)(峰值信號(hào)),并計(jì)算峰值信號(hào)的頻率。此外,時(shí)間特性提取單元203例如根據(jù)峰值信號(hào)的大小確定一個(gè)帶寬,并指定具有所確定的帶寬的一個(gè)頻帶,包括作為計(jì)算結(jié)果而獲得的頻率或一個(gè)與其接近的頻率。在時(shí)間特性提取單元203中,將對(duì)于時(shí)間分辨能力被優(yōu)先還是頻率分辨能力被優(yōu)先的判定結(jié)果以及指示指定頻帶的數(shù)據(jù)輸出到時(shí)間—頻率變換單元201和編碼數(shù)據(jù)流產(chǎn)生單元205。
頻率特性提取單元202分析作為時(shí)間—頻率變換單元201的輸出信號(hào)的頻譜的特性,并指定一個(gè)最好在時(shí)域中被量化的頻帶。例如,考慮編碼數(shù)據(jù)流產(chǎn)生單元205中的編碼效率,有編碼效率在一個(gè)其中相鄰頻譜系數(shù)在頻譜中廣泛散布的頻帶或一個(gè)其中相鄰頻譜系數(shù)的正負(fù)代碼被頻繁切換或類似的頻帶中未被提高的多個(gè)情況。因此,頻率特性提取單元202從輸入的頻譜對(duì)一個(gè)可用于這些的頻帶采樣,將其輸出到時(shí)間變換單元204,并且還將一個(gè)不可應(yīng)用于這些的頻帶象現(xiàn)在這樣輸出到編碼數(shù)據(jù)流產(chǎn)生單元205。同時(shí),將指定輸出到時(shí)間變換單元204的頻帶的數(shù)據(jù)輸出到編碼數(shù)據(jù)流產(chǎn)生單元205。
在編碼數(shù)據(jù)流產(chǎn)生單元205,合并頻率特性提取單元202的輸出信號(hào)(指定頻譜和頻帶的數(shù)據(jù))、時(shí)間特性提取單元203的判定結(jié)果和指定頻帶的數(shù)據(jù)以及時(shí)間變換單元204的輸出信號(hào)(一個(gè)頻率—時(shí)間信號(hào)),并產(chǎn)生編碼數(shù)據(jù)流。
圖5A是顯示在與圖4A中的一個(gè)相同的時(shí)間軸上的音頻信號(hào)中如何將一個(gè)第N幀分成用于其第一半的子幀1和用于其第二半的子幀2的示意圖。雖然示意圖顯示了子幀1和子幀2具有相同長(zhǎng)度的情況,但其長(zhǎng)度不必是相同的,或者可以彼此重疊。此后,恰如圖5所示,采用子幀1和子幀2具有相同長(zhǎng)度的情況來(lái)簡(jiǎn)化解釋。
圖5B是顯示通過將圖5A所示的子幀1的時(shí)域中的音頻信號(hào)變換成頻域中的一個(gè)信號(hào)而獲得的頻譜的示意圖。圖5C是顯示通過將圖5A所示的子幀2的時(shí)域中的音頻信號(hào)變換成頻域中的一個(gè)信號(hào)而獲得的頻譜的示意圖。從時(shí)域到頻域的變換是僅僅采用每個(gè)子幀中的音頻信號(hào)來(lái)進(jìn)行的,并假定由變換獲得的頻域中的信號(hào)(頻譜)通過執(zhí)行其逆變換(頻率—時(shí)間變換)將被完全恢復(fù)成時(shí)域中的初始信號(hào)。有離散傅立葉變換和離散余弦變換可用作這種頻率變換方法。由于它們與相關(guān)領(lǐng)域技術(shù)人員所熟悉的類似,所以這里省略其說明。前面提到的MDCT變換是將具有時(shí)間上的一些相互重疊的一幀中的時(shí)域中的信號(hào)變換成頻域中的一個(gè)信號(hào)。然而,這引起用于重構(gòu)時(shí)域中的信號(hào)的延遲,使得它不能用于導(dǎo)出圖5B和圖5C中的頻譜的情況。由于引起一個(gè)延遲的同樣的原因,不使用多相濾波器或類似方法。
由于圖5B和圖5C中的第N幀中的頻譜被分成幀的第一半和第二半,在子幀1和子幀2中分別包含的樣本數(shù)等于該幀中的樣本數(shù)量的一半。圖5A和圖5B中的頻譜的樣本數(shù)分別等于幀中的樣本數(shù)量的一半,因此這些圖在頻率軸方向以樣本的雙倍間隔顯示了與圖4B所示頻帶相同頻帶中的頻率分量的比率中的改變。如圖4B所示,當(dāng)在某一時(shí)刻對(duì)該幀中的音頻輸入信號(hào)執(zhí)行時(shí)間—頻率變換時(shí),獲得了顯示出在該幀中的整個(gè)音頻輸入信號(hào)中包含的頻率分量的一個(gè)比率的頻譜。但如圖5B和5C所示,如果該幀中的音頻輸入信號(hào)被分成根據(jù)時(shí)間—頻率變換將其分別變換成的第一半和第二半,則顯然在每部分音頻信號(hào)中包含的頻率分量的比率在音頻輸入信號(hào)的第N幀的第一半和第二半之間是不同的。也就是說,圖5B和圖5C所示的頻譜表明了在第N幀的第一半和第二半中的音頻信號(hào)的頻率分量的比率中的時(shí)間改變。
上述的圖5B和圖5C顯示了在將第N幀分成兩個(gè)子幀并對(duì)每個(gè)子幀執(zhí)行時(shí)間—頻率變換的情況下的頻譜的例子。下面參考圖6A和圖6B描述將第N幀進(jìn)一步分成(M+1)段更小的子幀的情況。圖6A是顯示如何將與圖4A相同的時(shí)域中的音頻信號(hào)(第N幀)分成(M+1)段子幀的示意圖。圖6B是顯示通過將一幀中的音頻輸入信號(hào)分成(M+1)段子幀并對(duì)每個(gè)子幀執(zhí)行時(shí)間—頻率變換而獲得的頻譜的示意圖。在圖6A和圖6B中,將在任意位置(例如,第P個(gè)位置(P是一個(gè)整數(shù)))的子幀的時(shí)域中的一個(gè)信號(hào)SubP變換成一個(gè)由至少相同數(shù)目的樣本或更多樣本組成的頻譜系數(shù)Spect_SubP。下面假設(shè)將其變換成包含相同數(shù)目的樣本的頻譜以簡(jiǎn)化解釋。以與此類似的方式,當(dāng)圖6B所示的(M+1)段頻譜(頻譜系數(shù)Spect_Sub0~頻譜系數(shù)Spect_SubM)與圖5B和圖5C所示的頻譜相比較,雖然樣本間隔在頻率軸方向上變得更寬,但在時(shí)間軸方向上更詳細(xì)地指示了第N幀的頻率分量中的時(shí)間改變。
接著,下面采用圖7A和圖7B描述通過對(duì)一幀中的音頻輸入信號(hào)執(zhí)行時(shí)間—頻率變換而獲得的頻譜如何對(duì)應(yīng)于通過由每個(gè)子幀執(zhí)行時(shí)間—頻率變換而獲得的頻譜。圖7A是顯示在通過對(duì)該幀中的音頻信號(hào)在某一時(shí)刻執(zhí)行時(shí)間—頻率變換而獲得的頻譜上的頻帶BandA中包含的一個(gè)樣本的示意圖。圖7A的頻譜與圖4B所示的頻譜相同。并且,圖7B是顯示在通過將該幀中的音頻輸入信號(hào)分成(M+1)段子幀并由每個(gè)子幀執(zhí)行時(shí)間—頻率變換而獲得的頻譜上的頻帶BandB中包含的一個(gè)樣本的示意圖。也就是說,圖7B中的頻譜與圖6B中所示的頻譜相同。圖7A中的頻譜的頻帶BandA和圖7B中的頻譜的頻帶BandB指示相同的頻帶區(qū)域。也就是說,在整個(gè)幀中,在頻帶BandA中包含的樣本數(shù)等于在頻帶BandB中包含的樣本數(shù)。這表明圖7A的頻帶BandA中的頻譜系數(shù)的數(shù)據(jù)(圖中的黑菱形)等效于圖7B的頻帶BandB中的所有子幀中的頻譜系數(shù)中的一個(gè)(圖中的黑菱形)。這里,不需要通過以一個(gè)變換表達(dá)式對(duì)頻帶BandA中的頻譜系數(shù)執(zhí)行時(shí)間變換來(lái)獲得與頻帶BandB中的頻譜系數(shù)完全一致的頻譜系數(shù)。頻帶BandA中的頻譜系數(shù)等效于頻帶BandB中的頻譜系數(shù)是重要的。因此,可以考慮用表達(dá)在頻帶BandB中的所有子頻帶中的樣本(頻譜系數(shù))來(lái)替代對(duì)頻帶BandA中的每個(gè)樣本(頻譜系數(shù))的描述。也就是說,在依據(jù)本發(fā)明的第一實(shí)施例的編碼設(shè)備200中,對(duì)于其中判定時(shí)間分辨能力被優(yōu)先的頻帶BandA,頻帶BandB中的頻譜系數(shù)被量化和編碼,而不是對(duì)頻帶BandA中的頻譜系數(shù)量化和編碼。也就是說,時(shí)間變換單元204例如對(duì)由時(shí)間—頻率變換單元201獲得的頻譜中的其中判定時(shí)間分辨能力被優(yōu)先的頻帶BandA執(zhí)行一個(gè)等效于DCT變換的逆變換(頻率—時(shí)間變換)的變換表達(dá)式,并輸出一個(gè)等效于圖7B所示的頻帶BandB中的所有樣本(頻譜系數(shù))的頻譜系數(shù)。
依據(jù)圖7A和圖7B所指示的頻帶BandA和頻帶BandB的帶寬,為了更好地理解對(duì)于時(shí)間變換單元204的時(shí)間變換方法的解釋,下面利用圖8A和圖8B描述當(dāng)將頻帶BandD的帶寬選擇為在每個(gè)子頻帶中剛好具有屬于頻帶BandD的一段樣本時(shí)的情況。圖8A是顯示通過對(duì)一幀中的音頻信號(hào)執(zhí)行時(shí)間—頻率變換而獲得的頻譜上的頻帶BandC中的一個(gè)樣本的示意圖。圖8B是顯示通過將一幀中的音頻輸入信號(hào)分成(M+1)段子幀并由每個(gè)子幀對(duì)其執(zhí)行時(shí)間—頻率變換而獲得的頻譜上的頻帶BandD中的一個(gè)樣本的示意圖。圖8A中的頻譜與圖4B中所示的頻譜相同,圖8B中的頻譜與圖6B中所示的頻譜相同。并且,圖8A中的頻譜中的頻帶BandC和圖8B中的頻譜中的頻帶BandD顯示了相同的頻帶。在圖8B中,當(dāng)將頻帶BandD的帶寬選擇為在每個(gè)(M+1)段子頻帶中具有屬于頻帶BandD的一段樣本(頻譜系數(shù))時(shí),與圖8A所示的頻譜中的頻帶是同一頻帶的頻帶BandC中的樣本數(shù)是(M+1)段。因?yàn)閷儆趫D8B所示的頻帶BandD的每個(gè)樣本是從每個(gè)(M+1)段子幀選擇出的,如果采用水平軸上的時(shí)間和垂直軸上的頻譜系數(shù)繪出每個(gè)樣本,則可以說它指示了在音頻信號(hào)的一幀中的屬于頻帶BandC中的頻譜系數(shù)中的時(shí)間改變。
與圖8A類似,圖9A是顯示通過對(duì)一幀中的音頻信號(hào)在某一時(shí)刻執(zhí)行時(shí)間—頻率變換而獲得的頻譜上的頻帶BandC中的一個(gè)樣本的示意圖。圖9B是采用水平軸上的時(shí)間和垂直軸上的頻譜系數(shù)值為圖8B所示的每個(gè)樣本(頻譜系數(shù))重繪的示意圖。已經(jīng)解釋過,如圖9B所示的重繪的、通過在同一頻帶BandD中的(M+1)段子幀的每一個(gè)提取出一個(gè)樣本而組成的信號(hào)等效于由時(shí)間變換單元204獲得的時(shí)間—頻率信號(hào),并且是指示有關(guān)頻帶BandD的頻譜系數(shù)的時(shí)間改變的時(shí)間—頻率信號(hào)。如上所述,圖9A所示的頻帶BandC中的每個(gè)樣本(頻譜系數(shù))可以被看待為與圖9B中的時(shí)間—頻率信號(hào)(頻帶BandD)幾乎相同的數(shù)據(jù)。因此,在下面的解釋中,將量化圖9A中的頻譜系數(shù)指示為“執(zhí)行Qf”,將量化圖9B中的時(shí)間—頻率信號(hào)指示為“執(zhí)行Qt”。
在依據(jù)本發(fā)明的第一實(shí)施例的編碼設(shè)備200內(nèi)的圖2所示的時(shí)間變換單元204中,由時(shí)間—頻率變換單元201獲得的頻譜的頻譜系數(shù)的一部分、即在圖9A中的頻帶BandC中包含的頻譜系數(shù)流被變換成圖9B中的時(shí)域中的時(shí)間—頻率信號(hào)。經(jīng)過這個(gè)變換等效于從圖8A中的頻帶BandC中包含的頻譜系數(shù)流到圖8B中的頻帶BandD中包含的頻譜系數(shù)流的變換,這已經(jīng)在前面解釋過了?;蛘?,等效于從圖7A中的頻帶BandA中的頻譜系數(shù)流到圖7B 中的頻帶BandB中的頻譜系數(shù)流的變換。
圖2所示的編碼數(shù)據(jù)流產(chǎn)生單元205對(duì)經(jīng)過如上變換的來(lái)自時(shí)間—頻率變換單元201的輸出和來(lái)自時(shí)間變換單元204的輸出進(jìn)行量化和編碼,并輸出編碼數(shù)據(jù)流。關(guān)于編碼數(shù)據(jù)流產(chǎn)生單元205中的量化和編碼的具體方法,使用諸如霍夫曼編碼和向量量化的公知技術(shù)。
并且,編碼數(shù)據(jù)流產(chǎn)生單元205可以將位于具有較小振幅波動(dòng)的一部分中的時(shí)間—頻率信號(hào)的幾段樣本分成組,然后對(duì)每組的平均增益進(jìn)行量化和編碼。圖10是顯示由圖2所示的編碼數(shù)據(jù)流產(chǎn)生單元205對(duì)時(shí)間—頻率信號(hào)的編碼的示意圖。如圖10所示,編碼數(shù)據(jù)流產(chǎn)生單元205例如分別為一個(gè)從頻譜系數(shù)Spec_Sub_0到頻譜系數(shù)Spec_Sub_2的樣本組和一個(gè)從頻譜系數(shù)Spec_Sub_3到頻譜系數(shù)Spec_Sub_M的樣本組找到平均增益Gt1和平均增益Gt2,并對(duì)指定每個(gè)樣本組和每個(gè)組中的平均增益的數(shù)據(jù)進(jìn)行量化和編碼,而不是對(duì)從頻譜系數(shù)Spec_Sub_0到頻譜系數(shù)Spec_Sub_M的時(shí)間—頻率信號(hào)本身進(jìn)行量化和編碼。在這種情況下,如果時(shí)間—頻率信號(hào)在編碼設(shè)備200和對(duì)從編碼設(shè)備200輸出的編碼數(shù)據(jù)流解碼的解碼設(shè)備之間被預(yù)先限定為例如表達(dá)為“樣本組中的第一樣本號(hào),樣本組中的最后一個(gè)樣本號(hào),樣本組中的平均增益”,則圖10所示的時(shí)間—頻率信號(hào)可以表達(dá)為兩個(gè)數(shù)據(jù)組(0,2,Gt1)和(3,M,Gt2)。并且,在這種情況下,不需要為時(shí)間—頻率信號(hào)將全部每個(gè)樣本都聚集起來(lái)??梢灾粚⒃诰哂休^小振幅波動(dòng)的部分中的樣本聚集起來(lái)。對(duì)于具有極端(radical)振幅波動(dòng)的部分,每個(gè)樣本中的頻譜系數(shù)值本身可以被量化和編碼。
此外,在編碼數(shù)據(jù)流產(chǎn)生單元205中,指示哪個(gè)頻帶被進(jìn)行時(shí)間變換的數(shù)據(jù)與時(shí)間—頻率變換單元201的輸出中的編碼數(shù)據(jù)流一起輸出。圖11是顯示時(shí)間—頻率變換單元201的一個(gè)輸出信號(hào)是如何對(duì)應(yīng)于指示由時(shí)間變換單元204進(jìn)行了時(shí)間變換的頻帶的數(shù)據(jù)的示意圖。在同一圖中,垂直軸顯示頻率,水平軸顯示對(duì)應(yīng)于垂直軸上的頻率的頻譜系數(shù)。在時(shí)間—頻率變換單元201中采用MDCT變換的情況下,頻譜系數(shù)在同一圖中指示MDCT系數(shù)。并且,在作為時(shí)間—頻率變換單元201的輸出信號(hào)的頻譜中,虛線所示部分是未被編碼數(shù)據(jù)流產(chǎn)生單元205量化和編碼的部分。相反,在編碼數(shù)據(jù)流產(chǎn)生單元205中,對(duì)應(yīng)于這個(gè)頻帶的時(shí)間—頻率信號(hào)被量化和編碼。同一圖描述了對(duì)于將頻率軸方向分成5個(gè)頻帶、并從其低頻開始按照Qf、Qt、Qf、Qt和Qf的順序進(jìn)行量化的情況的一個(gè)例子。這樣,從編碼數(shù)據(jù)流產(chǎn)生單元205輸出的編碼數(shù)據(jù)流至少包括指示每個(gè)頻帶是在時(shí)域中還是在頻域中被量化和編碼的數(shù)據(jù)以及在每個(gè)頻帶中被編碼和量化的數(shù)據(jù)。頻帶劃分的數(shù)目和在編碼設(shè)備200中的用于每個(gè)頻帶的量化方法(即,是Qf還是Qt)不是固定的,并不限于這個(gè)例子。
圖12是顯示依據(jù)本發(fā)明的第一實(shí)施例的解碼設(shè)備1200的結(jié)構(gòu)的方框圖。這個(gè)解碼設(shè)備1200是一個(gè)對(duì)編碼設(shè)備200輸出的編碼數(shù)據(jù)流解碼、并輸出一個(gè)具有高級(jí)別的時(shí)間分辨能力的音頻信號(hào)的解碼設(shè)備,包括編碼數(shù)據(jù)流分離單元1201、時(shí)間—頻率信號(hào)產(chǎn)生單元1202、頻率變換單元1 203、頻譜產(chǎn)生單元1204和頻率—時(shí)間變換單元1205。編碼數(shù)據(jù)流分離單元1201從作為輸入信號(hào)的編碼數(shù)據(jù)流分離出在指示為“Qf”的頻帶中的編碼數(shù)據(jù)和在指示為“Qt”的頻帶中的編碼數(shù)據(jù),將在指示為“Qf”的頻帶中的編碼數(shù)據(jù)輸出到頻譜產(chǎn)生單元1204,將在指示為“Qt”的頻帶中的編碼數(shù)據(jù)輸出到時(shí)間—頻率信號(hào)產(chǎn)生單元1202。在指示為“Qf”的頻帶中的編碼數(shù)據(jù)是在編碼設(shè)備200中在頻域量化和編碼的數(shù)據(jù)。在指示為“Qt”的頻帶中的編碼數(shù)據(jù)是在編碼設(shè)備200中在時(shí)域量化和編碼的數(shù)據(jù)。
頻譜產(chǎn)生單元1204對(duì)輸入的編碼數(shù)據(jù)解碼,進(jìn)一步對(duì)其反量化,并產(chǎn)生頻率軸上的一個(gè)頻譜。另一方面,時(shí)間—頻率信號(hào)產(chǎn)生單元1202對(duì)輸入的編碼數(shù)據(jù)解碼,對(duì)其反量化,并在時(shí)間上產(chǎn)生時(shí)間軸上的一個(gè)時(shí)間—頻率信號(hào)。在時(shí)間上產(chǎn)生的時(shí)間—頻率信號(hào)被輸入到頻率變換單元1203。頻率變換單元1203通過采用一個(gè)等效于由編碼設(shè)備200的時(shí)間變換單元204所采用的變換表達(dá)式的逆變換的變換表達(dá)式以數(shù)目小于一幀中的樣本數(shù)的多個(gè)樣本為單位將輸入的時(shí)間—頻率信號(hào)從時(shí)域中的頻譜系數(shù)變換到頻域中的頻譜系數(shù)。將指示時(shí)間—頻率信號(hào)中所表達(dá)出的時(shí)間改變的數(shù)據(jù)反映在作為依據(jù)上面的描述對(duì)該幀的部分變換的結(jié)果而獲得的頻譜系數(shù)上,并將這個(gè)頻譜系數(shù)輸出到頻率—時(shí)間變換單元1205。在頻率—時(shí)間變換單元1205中,將作為頻譜產(chǎn)生單元1204和頻率變換單元1203的輸出信號(hào)的頻域中的頻譜在頻率軸上合成,并變換成在時(shí)間軸上的一個(gè)音頻信號(hào)。這樣,由時(shí)間—頻率信號(hào)表達(dá)的時(shí)間分量可以反映在從頻譜產(chǎn)生單元1204輸出的頻譜上,并且可以獲得一個(gè)具有高時(shí)間分辨能力的音頻信號(hào)。在頻率—時(shí)間變換單元1205,使用一種是在編碼設(shè)備200進(jìn)行的時(shí)間—頻率變換單元201的逆過程的變換方法。例如,如果在編碼設(shè)備200中的時(shí)間—頻率變換單元201中使用MDCT變換,則在頻率—時(shí)間變換單元1205中使用逆MDCT變換。以這種方式獲得的頻率—時(shí)間變換單元1205的輸出例如是一個(gè)由電壓上的離散時(shí)間改變所表達(dá)的一個(gè)音頻輸出信號(hào)。
如上所述,依據(jù)本發(fā)明的第一實(shí)施例中的編碼設(shè)備200和解碼設(shè)備1200,可以選擇是在時(shí)域還是在頻域中對(duì)一個(gè)任意頻帶的一特定時(shí)間幀中的音頻信號(hào)進(jìn)行編碼。因此,這個(gè)方法提供了比僅僅在頻域中的編碼方法或僅僅在時(shí)域中的編碼方法更靈活和更有效的數(shù)據(jù)編碼的可能性。其結(jié)果是,使得能夠在一給定量的數(shù)據(jù)內(nèi)對(duì)許多數(shù)據(jù)編碼,并實(shí)現(xiàn)高質(zhì)量的再現(xiàn)音頻信號(hào)。
雖然在第一實(shí)施例中時(shí)間特性提取單元203判定當(dāng)子幀之間的平均能量的改變(即,相鄰子幀之間的差)大于預(yù)先限定的閾值時(shí)時(shí)間分辨能力應(yīng)該被優(yōu)先,但時(shí)間特性提取單元203判定是時(shí)間分辨能力被優(yōu)先還是頻率分辨能力被優(yōu)先的判決標(biāo)準(zhǔn)并不限于上述方法。并且,在上面的實(shí)施例中,雖然頻率特性提取單元202判定對(duì)于其中鄰接頻譜系數(shù)在頻譜上廣泛散布的頻帶或其中正負(fù)代碼被頻繁切換的頻帶應(yīng)該實(shí)現(xiàn)時(shí)域中的量化,但對(duì)這個(gè)判決的判決標(biāo)準(zhǔn)也不限于上述方法。
(第二實(shí)施例)下面描述本發(fā)明的第二實(shí)施例。第二實(shí)施例中的量化和編碼方法與第一實(shí)施例中的不同。在第一實(shí)施例中,對(duì)于由每幀變換到頻域中的音頻輸入信號(hào),該幀中的一特定頻帶中的信號(hào)象現(xiàn)在這樣被量化,但另一個(gè)頻帶中的信號(hào)被重新變換到時(shí)域中,然后量化時(shí)域中的信號(hào)。在本發(fā)明的第二實(shí)施例中,不是僅僅用選定頻帶中的信號(hào)實(shí)現(xiàn)量化和編碼,而是由其他頻帶中的信號(hào)執(zhí)行量化和編碼。
圖13是顯示依據(jù)本發(fā)明的第二實(shí)施例的編碼設(shè)備1300的結(jié)構(gòu)的方框圖。編碼設(shè)備1300包括時(shí)間—頻率變換單元1301、頻率特性提取單元1302、時(shí)間特性提取單元1303、量化和編碼單元1304、參考頻帶判定單元1305、時(shí)間變換單元1306、時(shí)間合成和編碼單元1307、頻率合成和編碼單元1308和編碼數(shù)據(jù)流產(chǎn)生單元1309。在同一圖中,時(shí)間—頻率變換單元1301、頻率特性提取單元1302、時(shí)間特性提取單元1303和時(shí)間變換單元1306分別與圖2所示的編碼設(shè)備200中的時(shí)間—頻率變換單元201、頻率特性提取單元202、時(shí)間特性提取單元203和時(shí)間變換單元204幾乎是相同的。
音頻輸入信號(hào)以一特定時(shí)間長(zhǎng)度的每一幀被輸入到時(shí)間—頻率變換單元1301和時(shí)間特性提取單元1303。時(shí)間—頻率變換單元1301將時(shí)域中的輸入信號(hào)變換成頻域中的一個(gè)信號(hào)。時(shí)間—頻率變換單元1301例如采用MDCT變換來(lái)獲得一個(gè)MDCT系數(shù)。
頻率特性提取單元1302分析作為時(shí)間—頻率變換單元201的輸出的由每幀變換的頻譜系數(shù)的頻率特性,并以與圖2中的頻率特性提取單元202相同的方式指定一個(gè)最好以給予時(shí)間分辨能力優(yōu)先權(quán)來(lái)量化的頻帶。
以與圖2中的時(shí)間特性提取單元203相同的方式,時(shí)間特性提取單元1303判定是時(shí)間分辨能力應(yīng)該被優(yōu)先還是頻率分辨能力應(yīng)該被優(yōu)先來(lái)在每幀量化音頻信號(hào)輸入。在時(shí)間特性提取單元1303,因?yàn)椴恍枰韵嗤臅r(shí)間分辨能力或相同的頻率分辨能力對(duì)輸入信號(hào)的所有頻帶量化和編碼,所以可以由每個(gè)子幀或每個(gè)頻帶來(lái)作出判決。
對(duì)于由時(shí)間—頻率變換單元1301獲得的頻域中的信號(hào)(頻譜系數(shù)),量化和編碼單元1304由每個(gè)預(yù)先限定的頻帶對(duì)信號(hào)量化和編碼。這個(gè)量化和編碼單元1304采用相關(guān)領(lǐng)域的技術(shù)人員所熟悉的公知技術(shù)、例如向量量化和霍夫曼編碼對(duì)數(shù)據(jù)量化和編碼。量化和編碼單元1304在內(nèi)部包含一個(gè)在圖中未顯示的存儲(chǔ)器,將已經(jīng)被編碼的編碼數(shù)據(jù)流和編碼之前的頻譜保存在其存儲(chǔ)器中,并將在由參考頻帶判定單元1305判定的頻帶中的編碼數(shù)據(jù)流或編碼之前的頻譜輸出到參考頻帶判定單元1305。
依據(jù)頻率特性提取單元1302和時(shí)間特性提取單元1303的判決結(jié)果,參考頻帶判定單元1305判定在作為量化和編碼單元1304的輸出的編碼數(shù)據(jù)流中的應(yīng)該為由頻率特性提取單元1302和時(shí)間特性提取單元1303指定的頻帶而參考的一個(gè)頻帶。具體地,對(duì)于由時(shí)間特性提取單元1301指定的頻帶,參考頻帶判定單元1305只在時(shí)域中對(duì)第一個(gè)指定頻帶量化和編碼,而不參考其他頻帶,并參考頻帶中的頻譜在時(shí)域中對(duì)剩余頻帶進(jìn)行編碼。此外,對(duì)于由頻率特性提取單元1302指定的頻帶,如果等效于一個(gè)整數(shù)的倍數(shù)(即,諧音的關(guān)系)的信號(hào)分量的頻譜系數(shù)被包含在由頻率特性提取單元1302指定的頻帶中,則參考頻帶判定單元1305在頻域中例如僅僅對(duì)包括頻譜系數(shù)的頻帶中的包含一個(gè)最低頻率的分量(頻譜系數(shù))的頻帶進(jìn)行量化和編碼。例如,如果8kHz、16kHz和24kHz的頻率分量分別被包含在由頻率特性提取單元1302指定的頻帶中,則只對(duì)包含8kHz的頻率分量的頻帶進(jìn)行量化和編碼。對(duì)于除此之外的任何頻帶,例如包含16kHz的頻率分量的頻帶和包含24kHz的頻率分量的頻帶,判定將參考作為參考頻帶的包含最低頻率(8kHz)的分量(頻譜系數(shù))的頻帶來(lái)在頻域中對(duì)其編碼。如果未包含等效于由頻率特性提取單元1302指定的頻帶中的諧音的頻譜系數(shù),則頻率特性提取單元1302判定不參考其他頻帶在時(shí)域中對(duì)這些頻帶量化和編碼。
接著,參考圖14到16描述參考頻帶判定單元1305的行為。圖14是顯示用于參考其他頻帶產(chǎn)生一個(gè)目標(biāo)頻帶的編碼數(shù)據(jù)流的方法的一個(gè)例子的示意圖。垂直軸顯示頻率,水平軸顯示圖中的頻率的頻譜系數(shù)值。在圖14中,頻帶Base1和頻帶Base2都是其頻域信號(hào)(頻譜)的系數(shù)已經(jīng)被量化和編碼單元1304量化和編碼的頻帶的一部分。另一方面,在指示為“Qt1”和“Qt2”的頻帶中的信號(hào)的含義是分別采用頻帶Base1和頻帶Base2的頻譜系數(shù)進(jìn)行量化和編碼的信號(hào)。例如,“Qt1”意味著采用頻帶Base1的信號(hào)根據(jù)時(shí)域變換被量化和編碼,“Qf2”意味著采用Base2的信號(hào)在頻域被量化和編碼。此外,采用Base1的頻帶信號(hào)來(lái)表達(dá)“Qt1”的參數(shù)被定義為參數(shù)Gt1,采用頻帶Base2的頻帶信號(hào)來(lái)表達(dá)“Qf2”的參數(shù)被定義為參數(shù)Gf2。這意味著頻帶“Qt1”中的信號(hào)由在時(shí)域中表達(dá)的頻帶Base1的頻帶中的信號(hào)用參數(shù)Gt1所指示的參數(shù)來(lái)量化和編碼,頻帶“Qf2”中的信號(hào)由在頻域中表達(dá)的頻帶Base2的頻帶中的信號(hào)(但不需要變換,因?yàn)樗呀?jīng)被在頻域中表達(dá))用參數(shù)Gf2所指示的參數(shù)來(lái)量化和編碼。然而,用于劃分頻帶的方法、其順序和數(shù)量并不限于這些。
圖15是顯示用于參考其他頻帶產(chǎn)生目標(biāo)頻帶的編碼數(shù)據(jù)流的方法的另一個(gè)例子的示意圖。與在圖15中的情況一樣,信號(hào)“Qt”可以通過采用已經(jīng)分別用參數(shù)Gt1和參數(shù)Gt2在量化和編碼單元1304中量化和編碼的頻帶Base1和頻帶Base2這兩個(gè)頻帶(在時(shí)域中表達(dá))由加法之和來(lái)表達(dá)。圖16是顯示用于參考其他頻帶產(chǎn)生目標(biāo)頻帶的編碼數(shù)據(jù)流的方法的其他例子的示意圖。與在圖16中的情況一樣,信號(hào)“Qf”可以通過采用已經(jīng)分別用參數(shù)Gf1和參數(shù)Gf2在量化和編碼單元1304中量化和編碼的頻帶Base1和頻帶Base2這兩個(gè)頻帶(在頻域中表達(dá))由加法之和來(lái)表達(dá)。圖15和圖16中的任一種情況顯示了采用已經(jīng)被量化和編碼的兩個(gè)頻帶中的信號(hào)來(lái)對(duì)一特定頻帶量化和編碼的情況,但頻帶數(shù)并不限于兩個(gè)。在參考頻帶判定單元1305中,一幀中的頻譜系數(shù)中的由時(shí)間特性提取單元203指定的要進(jìn)行量化和編碼的頻帶(目標(biāo)頻帶)通過采用由量化和編碼單元1304量化和編碼的任一個(gè)頻帶(參考頻帶)來(lái)表達(dá),并判定是否要對(duì)其進(jìn)行量化和編碼。
接著,參考圖17解釋頻率合成和編碼單元1308。圖17是顯示通過采用一個(gè)被參考頻帶中的已經(jīng)被量化和編碼的編碼數(shù)據(jù)流將一個(gè)目標(biāo)域中的頻譜在頻域中合成的方法的一個(gè)例子的示意圖。如上所述,假設(shè)參考頻帶和目標(biāo)頻帶中的信號(hào)已經(jīng)被參考頻帶判定單元1305選擇。在圖17中,頻帶A是參考頻帶,頻帶B是目標(biāo)頻帶。為了簡(jiǎn)化解釋,頻帶A中的信號(hào)和頻帶B中的信號(hào)分別由相同數(shù)目的元素組成,并分別被描述為向量Fa和向量Fb。另外,將每個(gè)向量分成兩個(gè),即,向量Fa=(Fa0,F(xiàn)a1),向量Fb=(Fb0,F(xiàn)b1)。Fa0、Fa1、Fb0和Fb1是向量。Fa0的元素?cái)?shù)與Fb0的元素?cái)?shù)相同,F(xiàn)a1的元素?cái)?shù)與Fb1的元素?cái)?shù)相同。Fa0的元素?cái)?shù)可以與Fa1的元素?cái)?shù)相同也可以不同。定義一個(gè)參數(shù)Gb=(Gb0,Gb1)。參數(shù)Gb是一個(gè)向量,但Gb0和Gb1是標(biāo)量值。采用向量Fa和參數(shù)Gb將作為向量Fb的近似的向量Fb’定義為下面的公式 Fb’=Gb*Fa=(Gb0*Fa0,Gb1*Fa1)以這種方式,通過從目標(biāo)頻帶A的頻域中的信號(hào)乘以控制合成比的參數(shù)Gb獲得一個(gè)乘積來(lái)合成頻帶B的頻域中的信號(hào)。此外,頻率合成和編碼單元1308對(duì)顯示哪一參考頻帶表達(dá)一特定目標(biāo)頻帶的數(shù)據(jù)以及用于在所參考頻帶上的增益控制的參數(shù)Gb進(jìn)行量化和編碼。為了簡(jiǎn)化解釋,已經(jīng)描述了目標(biāo)頻帶和參考頻帶被分成兩個(gè)向量的情況。但它們也可以被分成少于兩個(gè)或多于兩個(gè)。并且,對(duì)頻帶的劃分可以是均勻的或不均勻的。
下面參考圖18描述時(shí)間合成和編碼單元1307。圖18是顯示通過采用參考頻帶中的已經(jīng)被量化和編碼的編碼數(shù)據(jù)流將目標(biāo)域中的頻譜在時(shí)域中合成的方法的一個(gè)例子的示意圖。如上所述,假設(shè)參考頻帶中的一個(gè)信號(hào)和目標(biāo)頻帶中的一個(gè)信號(hào)已經(jīng)由參考頻帶判定單元1305選擇。在圖18中,假設(shè)頻帶A是參考頻帶,頻帶B是目標(biāo)頻帶。為了簡(jiǎn)化解釋,頻帶A中的信號(hào)和頻帶B中的信號(hào)分別由相同數(shù)目的元素組成。時(shí)間變換單元1306以與第一實(shí)施例的時(shí)間變換單元204相同的方式將頻帶A和頻帶B中的頻域中的信號(hào)變換成時(shí)域中的信號(hào)(Tt)。這里,假設(shè)通過變換頻帶A和頻帶B的頻域中的信號(hào)而獲得的信號(hào)分別是向量Ta和向量Tb。另外,向量Ta和向量Tb可以被劃分如下Ta=(Ta0,Ta1);Tb=(Tb0,Tb1)。Ta0、Ta1、Tb0、Tb1是向量。Ta0的元素?cái)?shù)與Tb0的元素?cái)?shù)相同,Ta1的元素?cái)?shù)與Tb1的元素?cái)?shù)相同。然而,Ta0的元素?cái)?shù)與Ta1的元素?cái)?shù)可以相同也可以不相同。并且,這里定義參數(shù)Gb=(Gb0,Gb1)。Gb0和Gb1分別是標(biāo)量值。圖19A、圖19B和圖19C是顯示通過采用向量Ta作為頻帶A的時(shí)域中的信號(hào)來(lái)將向量Tb近似為頻帶B的時(shí)域中的信號(hào)的方法的一個(gè)例子的示意圖。圖19A是顯示表達(dá)通過將作為參考頻帶的頻帶A的頻域中的信號(hào)變換成時(shí)域中的信號(hào)而獲得的信號(hào)的向量Ta的示意圖。圖19B是顯示表達(dá)通過將作為目標(biāo)頻帶的頻帶B的頻域中的信號(hào)變換成時(shí)域中的信號(hào)而獲得的信號(hào)的向量Tb的示意圖。圖19C是對(duì)于通過在向量Ta上執(zhí)行一個(gè)增益控制來(lái)表達(dá)一個(gè)近似于向量Tb的向量的情況顯示一個(gè)近似向量Tb’的示意圖。如圖19A、圖19B和圖19C所示,參數(shù)Gb的值被確定為使得向量Ta乘以Gb近似于向量Tb。
例如,采用向量Ta和參數(shù)Gb將近似向量Tb’定義為下面的公式[公式2]Tb’=Gb*Ta=(Gb0*Ta0,Gb1*Ta1)以這種方式,由參考頻帶A的時(shí)域中的信號(hào)與執(zhí)行增益控制的參數(shù)Gb來(lái)合成目標(biāo)頻帶B的時(shí)域中的信號(hào)。因此,在時(shí)間合成和編碼單元1307中,對(duì)顯示哪一參考頻帶被用于表達(dá)一特定目標(biāo)頻帶的數(shù)據(jù)以及用于在所參考頻帶上的增益控制的參數(shù)Gb進(jìn)行量化和編碼。為了簡(jiǎn)化解釋,已經(jīng)描述了目標(biāo)頻帶和參考頻帶被分成兩個(gè)向量的情況。但它們也可以被分成少于兩個(gè)或多于兩個(gè)。并且,對(duì)頻帶的劃分可以是均勻的或不均勻的。
在編碼數(shù)據(jù)流產(chǎn)生單元1309中,根據(jù)一個(gè)預(yù)定格式將量化和編碼單元1304、頻率合成和編碼單元1308、時(shí)間合成和編碼單元1307、頻率特性提取單元1302和時(shí)間特性提取單元1303的輸出打包,并與其一起產(chǎn)生編碼數(shù)據(jù)流。因此,作為編碼設(shè)備1300的輸出信號(hào)的編碼數(shù)據(jù)流包含下面的數(shù)據(jù)1.通過對(duì)一個(gè)參考頻帶和一個(gè)既不是參考頻帶也不是目標(biāo)頻帶的頻帶中的信號(hào)進(jìn)行量化和編碼而獲得的數(shù)據(jù);2.指示參考頻帶和目標(biāo)頻帶之間的關(guān)系的數(shù)據(jù);3.指示如何采用參考頻帶中的信號(hào)對(duì)目標(biāo)頻帶進(jìn)行量化和編碼的數(shù)據(jù);4.指示在哪個(gè)域、時(shí)域或頻域中參考頻帶、目標(biāo)頻帶和一個(gè)被分類為不是這兩個(gè)中的任一種的頻帶被量化和編碼的數(shù)據(jù);等等。并且,參考頻帶和目標(biāo)頻帶中的樣本數(shù)和與每個(gè)頻帶相關(guān)的頻率被直接或間接包含在編碼數(shù)據(jù)流中。
下面參考圖20描述依據(jù)本發(fā)明的第二實(shí)施例的解碼設(shè)備2000。圖20是顯示依據(jù)第二實(shí)施例的解碼設(shè)備2000的結(jié)構(gòu)的方框圖。這個(gè)解碼設(shè)備2000是一個(gè)對(duì)編碼設(shè)備1300產(chǎn)生的編碼數(shù)據(jù)流解碼并輸出一個(gè)音頻輸出信號(hào)的解碼設(shè)備,包括編碼數(shù)據(jù)流分離單元2001、參考頻率信號(hào)產(chǎn)生單元2002、時(shí)間變換單元2003、時(shí)間合成單元2004、頻率變換單元2005、頻率合成單元2006和頻率—時(shí)間變換單元2007。解碼設(shè)備2000中的頻率—時(shí)間變換單元2007、時(shí)間變換單元2003和頻率變換單元2005與第一實(shí)施例中的頻率—時(shí)間變換單元1205、時(shí)間變換單元1306和頻率變換單元1203分別具有相同的結(jié)構(gòu)。編碼數(shù)據(jù)流分離單元2001讀取輸入編碼數(shù)據(jù)流中的一個(gè)標(biāo)題等,并分離出在編碼數(shù)據(jù)流中包含的下列數(shù)據(jù)1.通過對(duì)一個(gè)參考頻帶和一個(gè)既不是參考頻帶也不是目標(biāo)頻帶的頻帶中的信號(hào)進(jìn)行量化和編碼而獲得的數(shù)據(jù);2.指示參考頻帶和目標(biāo)頻帶之間的關(guān)系的數(shù)據(jù);3.指示如何采用參考頻帶中的信號(hào)對(duì)目標(biāo)頻帶進(jìn)行量化和編碼的數(shù)據(jù);4.指示在哪個(gè)域、時(shí)域或頻域中參考頻帶和目標(biāo)頻帶被量化和編碼,并將其輸出到每個(gè)對(duì)應(yīng)單元中的數(shù)據(jù)。參考頻率信號(hào)產(chǎn)生單元2002使用相關(guān)領(lǐng)域的技術(shù)人員所熟悉的公知的解碼方法、例如霍夫曼解碼,并對(duì)頻域中的信號(hào)編碼。這意味著圖14到圖16中的Base1和Base2的信號(hào)被解碼。并且,這意味著圖17和圖18中的頻帶A的頻域中的信號(hào)被解碼。
下面參考圖17解釋頻率合成單元2006的行動(dòng)。如圖17所示,被表達(dá)為頻帶A中的向量Fa的頻域中的信號(hào)(頻譜)是通過在參考頻率信號(hào)產(chǎn)生單元2002中對(duì)從編碼數(shù)據(jù)流分離單元2001輸入到參考頻率信號(hào)產(chǎn)生單元2002的參考頻率中的數(shù)據(jù)進(jìn)行解碼和反量化而獲得的。另一方面,被表達(dá)為頻帶B中的向量Fb的頻域中的信號(hào)(頻譜)由依據(jù)公式1采用向量Fa和參數(shù)Gb合成的近似向量Fb’來(lái)近似。用于增益控制的參數(shù)Gb是通過在編碼數(shù)據(jù)流分離單元2001中從編碼數(shù)據(jù)流分離出來(lái)而獲得的,指示頻帶A是頻帶B的參考頻帶的數(shù)據(jù)也是通過在編碼數(shù)據(jù)流分離單元2001中從編碼數(shù)據(jù)流分離出來(lái)而獲得的。這樣,在頻率合成單元2006,通過產(chǎn)生近似向量Fb’來(lái)產(chǎn)生作為參考頻帶的頻帶B的頻域中的信號(hào)Fb。
接著,參考圖18解釋時(shí)間合成單元2004的行動(dòng)。在圖18中,由向量Ta所指示的頻帶A的時(shí)域中的信號(hào)(時(shí)間—頻率信號(hào))是通過由時(shí)間變換單元2003對(duì)由參考頻率信號(hào)產(chǎn)生單元2002獲得的向量Fa所指示的頻譜執(zhí)行時(shí)間變換(圖18中的過程Tf)而獲得的。并且,在作為目標(biāo)頻帶的頻帶B中的由向量Tb所指示的時(shí)域中的信號(hào)(時(shí)間—頻率信號(hào))由近似向量Tb’來(lái)近似。這個(gè)近似向量Tb’根據(jù)公式2由向量Ta和參數(shù)Gb組成。這樣,在時(shí)間合成單元2004中,通過產(chǎn)生近似向量Tb’來(lái)產(chǎn)生作為目標(biāo)頻帶的頻帶B的時(shí)域中的信號(hào)Tb。用于增益控制的參數(shù)Gb和指示頻帶A是頻帶B的參考頻帶的數(shù)據(jù)是從編碼數(shù)據(jù)流分離單元2001獲得的。由時(shí)間合成單元2004獲得的表示為近似向量Tb’的時(shí)域中的信號(hào)被頻率變換單元2005變換成頻域中的一個(gè)信號(hào)。在頻率—時(shí)間變換單元2007中,將參考頻率信號(hào)產(chǎn)生單元2002、頻率合成單元2006和頻率變換單元2005的輸出合成為頻率軸上的一個(gè)信號(hào)分量。此外,頻率—時(shí)間變換單元2007對(duì)所合成的頻譜執(zhí)行編碼設(shè)備1300的時(shí)間—頻率變換單元1301的時(shí)間—頻率變換的逆變換,并獲得時(shí)域中的音頻輸出信號(hào)。頻率—時(shí)間變換單元2007中的頻率—時(shí)間變換(例如,逆MDCT變換)可以用相關(guān)領(lǐng)域的技術(shù)人員所熟悉的公知技術(shù)來(lái)容易地實(shí)現(xiàn)。
圖21A是顯示由圖2中的編碼數(shù)據(jù)流產(chǎn)生單元205產(chǎn)生的編碼數(shù)據(jù)流的數(shù)據(jù)結(jié)構(gòu)的一個(gè)例子的示意圖。圖21B是顯示由圖13中的編碼數(shù)據(jù)流產(chǎn)生單元1309產(chǎn)生的編碼數(shù)據(jù)流的數(shù)據(jù)結(jié)構(gòu)的一個(gè)例子的示意圖。在圖21A和21B中所示的每個(gè)頻帶的帶寬可以是也可以不是固定帶寬。在第一實(shí)施例的編碼設(shè)備200中,由頻率特性提取單元202和時(shí)間特性提取單元203指定的頻帶中的頻譜在由時(shí)間變換單元204進(jìn)一步變換成一個(gè)時(shí)間—頻率信號(hào)之后被量化和編碼。除此之外的任何頻帶在作為該頻譜時(shí)被量化和編碼。例如,圖21A顯示了由頻率特性提取單元202和時(shí)間特性提取單元203指定的頻帶是頻帶1和頻帶4的情況。如圖21A和21B所示,在每個(gè)頻帶前面描述一個(gè)標(biāo)題。在圖21A中,在每個(gè)標(biāo)題中描述一個(gè)標(biāo)志,顯示出在哪個(gè)域、是時(shí)域還是頻域中對(duì)頻帶中的編碼數(shù)據(jù)流進(jìn)行量化和編碼的。例如,在頻帶1和頻帶4的標(biāo)題中分別描述了標(biāo)志qm=t,顯示出頻帶1和頻帶4中的編碼數(shù)據(jù)流t_quantize在時(shí)域中被量化和編碼。并且,在頻帶2和頻帶3的標(biāo)題中描述了標(biāo)志qm=f,顯示出頻帶2和頻帶3中的編碼數(shù)據(jù)流f_quantize在頻域中被量化和編碼。這里,編碼數(shù)據(jù)流f_quantize和編碼數(shù)據(jù)流t_quantize是通過分別在頻域和時(shí)域中對(duì)頻譜進(jìn)行量化和編碼而獲得的編碼數(shù)據(jù)流。
并且,在第二實(shí)施例的編碼設(shè)備1300中,由下面四種類型的編碼方法對(duì)由頻率特性提取單元1302和時(shí)間特性提取單元1303指定的頻帶中的頻譜進(jìn)行編碼1.不參考其他頻帶在頻域中量化和編碼。
2.參考其他頻帶在頻域中編碼。
3.不參考其他頻帶在時(shí)域中量化和編碼。
4.參考其他頻帶在時(shí)域中編碼。
因此,在編碼數(shù)據(jù)流中的每個(gè)頻帶的標(biāo)題中描述了一個(gè)顯示該頻帶是否參考其他頻帶的標(biāo)志、一個(gè)顯示如果參考的話參考哪個(gè)頻帶的頻帶號(hào)、一個(gè)控制參考頻帶的增益的參數(shù)等等。如圖21B所示,例如,在頻帶1的標(biāo)題中描述了一個(gè)顯示頻帶1中的編碼數(shù)據(jù)流t_quantize在時(shí)域中被量化和編碼的標(biāo)志qm=t。在頻帶2的標(biāo)題中描述了一個(gè)顯示頻帶2中的編碼數(shù)據(jù)流f_quantize在頻域中被量化和編碼的標(biāo)志qm=f。此外,在頻帶3中描述了下面的元素標(biāo)志qm=ref,顯示出實(shí)際上不包含通過在時(shí)域中對(duì)頻譜進(jìn)行量化和編碼而獲得的編碼數(shù)據(jù)流,并參考其他頻帶產(chǎn)生頻帶3;頻帶號(hào)ref=1,顯示出頻帶1是頻帶3的參考頻帶;參數(shù)Gain_info,控制參考頻帶頻帶1的增益;等等。并且,以與頻帶3相同的方式,在頻帶4中描述了如下元素標(biāo)志qm=ref,顯示出實(shí)際上不包含通過對(duì)頻譜進(jìn)行量化和編碼而獲得的編碼數(shù)據(jù)流,并參考其他頻帶產(chǎn)生頻帶4;頻帶號(hào)ref=2,顯示出頻帶2是頻帶4的參考頻帶;參數(shù)Gain_info,控制參考頻帶頻帶2的增益;等等。在頻帶3中,因?yàn)轭l帶號(hào)ref=1顯示出參考在頻域中量化和編碼的頻帶1,這隱含著頻帶3是在頻域中編碼的。在頻帶4中,因?yàn)轭l帶號(hào)ref=2表明參考在時(shí)域中量化和編碼的頻帶2,這隱含著頻帶4是在時(shí)域中編碼的。
在圖21A中,在編碼數(shù)據(jù)流中的每個(gè)頻帶的標(biāo)題中描述了一個(gè)顯示在哪個(gè)域、是時(shí)域還是頻域中對(duì)頻帶中的編碼數(shù)據(jù)流進(jìn)行量化和編碼的標(biāo)志。但如果預(yù)先確定了在哪個(gè)域中對(duì)哪一頻帶進(jìn)行量化和編碼,則不需要這個(gè)標(biāo)志。并且,在圖21B中,在每個(gè)編碼數(shù)據(jù)流中的每個(gè)頻帶的標(biāo)題中描述了一個(gè)顯示該頻帶是否參考其他頻帶的標(biāo)志以及一個(gè)指定用于該頻帶的參考頻帶的頻帶號(hào)。但如果預(yù)先確定了哪一頻帶參考哪一頻帶,則不需要這些數(shù)據(jù)。
在依據(jù)本發(fā)明的第二實(shí)施例的編碼設(shè)備1300和解碼設(shè)備2000中,如果將參考頻帶選擇為一個(gè)帶有較低頻率分量的頻帶,將目標(biāo)頻帶選擇為一個(gè)帶有比參考頻帶高的頻率分量的頻帶,用一個(gè)現(xiàn)有的編碼方法對(duì)參考頻帶編碼,并將產(chǎn)生目標(biāo)頻帶中的分量的代碼編碼為補(bǔ)充數(shù)據(jù),則進(jìn)一步可以使用現(xiàn)有的編碼方法和少量的補(bǔ)充數(shù)據(jù)來(lái)再現(xiàn)一個(gè)寬頻帶中的聲音。當(dāng)將AAC方法用作一個(gè)現(xiàn)有的音頻編碼方法時(shí),只要產(chǎn)生目標(biāo)頻帶中的分量的編碼數(shù)據(jù)被包括在AAC方法的Fill_element中,甚至在與AAC方法兼容的解碼方法中,也可以在不發(fā)出噪聲的情況下對(duì)編碼數(shù)據(jù)流解碼。當(dāng)使用依據(jù)本發(fā)明的第二實(shí)施例的解碼方法時(shí),還可以從相對(duì)較小量的數(shù)據(jù)再現(xiàn)一個(gè)更寬頻帶上的聲音。
當(dāng)使用結(jié)構(gòu)如上所述的本發(fā)明的編碼設(shè)備和解碼設(shè)備時(shí),除了可以實(shí)現(xiàn)頻域中的數(shù)據(jù)編碼之外,還可以實(shí)現(xiàn)時(shí)域中的數(shù)據(jù)編碼。因此,通過選擇一種具有更高編碼效率的編碼方法,對(duì)于再現(xiàn)的被解碼的聲音可以高效率地提高頻率分辨能力和時(shí)間分辨能力。并且,因?yàn)橥ㄟ^重新使用已經(jīng)被編碼的頻帶中的信號(hào)可以用較小數(shù)據(jù)量來(lái)構(gòu)造編碼音頻數(shù)據(jù)流,所以可以將編碼音頻數(shù)據(jù)流的比特率保持在較低水平。另外,如果使用相同的比特率,可以提供一個(gè)能夠獲得具有高級(jí)別聲音質(zhì)量的音頻信號(hào)的編碼音頻數(shù)據(jù)流。此外,如果為時(shí)間變換單元1306、時(shí)間變換單元2003和頻率變換單元2005選擇一個(gè)不需要用于劃分信號(hào)的時(shí)間重疊的分析合成類型的正交變換方法,則可以去除編碼設(shè)備和解碼設(shè)備中的任何附加算術(shù)延遲,使得這在編碼和解碼過程中需要考慮延遲的應(yīng)用上具有一個(gè)優(yōu)點(diǎn)。
在上面的第二實(shí)施例中,參考頻帶判定單元1305為頻率特性提取單元1302和時(shí)間特性提取單元1303指定的頻帶判定四種類型的編碼方法,但其實(shí)際的判決方法并不限于上面這些。
工業(yè)實(shí)用性依據(jù)本發(fā)明的編碼設(shè)備可用作為位于用于包括BS和CS的衛(wèi)星廣播的廣播基站中的音頻編碼設(shè)備,作為用于通過諸如因特網(wǎng)的通信網(wǎng)絡(luò)來(lái)分布內(nèi)容的內(nèi)容分布服務(wù)器的音頻編碼設(shè)備,以及進(jìn)一步作為由通用計(jì)算機(jī)執(zhí)行的用于對(duì)音頻信號(hào)編碼的程序。
另外,依據(jù)本發(fā)明的解碼設(shè)備不僅可用作為位于家庭中的STB中的音頻解碼設(shè)備,還作為一個(gè)由通用計(jì)算機(jī)、PDA、移動(dòng)電話等執(zhí)行的用于對(duì)音頻信號(hào)解碼的程序、以及在STB或通用計(jì)算機(jī)中包括的僅用于對(duì)音頻信號(hào)解碼的電路板、LSI等,并進(jìn)一步作為插入到STB或通用計(jì)算機(jī)中的IC卡。
權(quán)利要求
1.一種對(duì)通過根據(jù)時(shí)間—頻率變換來(lái)變換一個(gè)輸入初始信號(hào)而獲得的頻域中的一個(gè)信號(hào)進(jìn)行編碼并產(chǎn)生一個(gè)輸出信號(hào)的編碼設(shè)備,包括第一頻帶指定單元,可用于基于輸入初始信號(hào)的特性為一部分頻譜指定一個(gè)頻帶;時(shí)間變換單元,可用于根據(jù)頻率—時(shí)間變換將指定頻帶中的一個(gè)信號(hào)變換成一個(gè)信號(hào);以及,編碼單元,可用于對(duì)由時(shí)間變換單元獲得的信號(hào)和至少一部分頻譜進(jìn)行編碼,并從編碼信號(hào)和編碼頻譜產(chǎn)生一個(gè)輸出信號(hào)。
2.依據(jù)權(quán)利要求1的編碼設(shè)備,其中,時(shí)間變換單元根據(jù)頻率—時(shí)間變換將指定頻帶中的信號(hào)變換成一個(gè)指示一個(gè)在與頻譜相同的時(shí)間上的頻率分量的時(shí)間改變的信號(hào)。
3.依據(jù)權(quán)利要求2的編碼設(shè)備,其中,編碼設(shè)備進(jìn)一步包括時(shí)域近似單元,可用于指定頻譜的兩個(gè)或多個(gè)頻帶,并采用一個(gè)指示在一個(gè)指定頻帶中包含的頻率分量的時(shí)間改變的信號(hào)來(lái)近似一個(gè)指示在另一個(gè)指定頻帶中的頻率分量的時(shí)間改變的信號(hào),以及編碼單元對(duì)用于由時(shí)域近似單元指定的頻帶的近似的信號(hào)進(jìn)行編碼。
4.依據(jù)權(quán)利要求3的編碼設(shè)備,其中,時(shí)域近似單元產(chǎn)生指定在頻譜中用于近似的頻帶和被近似的頻帶的數(shù)據(jù)。
5.依據(jù)權(quán)利要求4的編碼設(shè)備,其中,時(shí)域近似單元進(jìn)一步產(chǎn)生指示用于被近似的信號(hào)的近似的信號(hào)的增益的數(shù)據(jù)。
6.依據(jù)權(quán)利要求5的編碼設(shè)備,其中,編碼單元不對(duì)被近似的信號(hào)進(jìn)行編碼,而是對(duì)由時(shí)域近似單元產(chǎn)生的指定用于近似的頻帶的數(shù)據(jù)和指示增益的數(shù)據(jù)進(jìn)行編碼。
7.依據(jù)權(quán)利要求1的編碼設(shè)備,其中,第一頻帶指定單元為一個(gè)在輸入初始信號(hào)的平均能量上具有一個(gè)大的改變的部分指定一個(gè)頻帶。
8.依據(jù)權(quán)利要求1的編碼設(shè)備,其中,編碼設(shè)備進(jìn)一步包括第二頻帶指定單元,可用于基于頻譜特性為一部分頻譜指定一個(gè)頻帶,以及時(shí)間變換單元根據(jù)頻率—時(shí)間變換將指定頻帶的一個(gè)信號(hào)變換成一個(gè)信號(hào)。
9.依據(jù)權(quán)利要求8的編碼設(shè)備,其中,編碼設(shè)備進(jìn)一步包括頻域近似單元,可用于指定在頻譜中包含的兩個(gè)或多個(gè)頻帶,并采用指定頻帶中的一個(gè)的頻譜來(lái)近似另一個(gè)頻帶的頻譜,以及編碼單元對(duì)用于由頻域近似單元指定的頻帶的近似的頻譜進(jìn)行編碼。
10.依據(jù)權(quán)利要求9的編碼設(shè)備,其中,頻域近似單元產(chǎn)生指定在頻譜中用于近似的頻帶和被近似的頻帶的數(shù)據(jù)。
11.依據(jù)權(quán)利要求10的編碼設(shè)備,其中,頻域近似單元進(jìn)一步產(chǎn)生指示用于被近似的頻譜的近似的頻譜的增益的數(shù)據(jù)。
12.依據(jù)權(quán)利要求11的編碼設(shè)備,其中,編碼單元不對(duì)被近似的頻譜進(jìn)行編碼,而是對(duì)由頻域近似單元產(chǎn)生的指定用于近似的頻帶的數(shù)據(jù)和指示增益的數(shù)據(jù)進(jìn)行編碼。
13.依據(jù)權(quán)利要求8的編碼設(shè)備,其中,第二頻帶指定單元指定一個(gè)在頻譜中具有廣泛散布的頻譜系數(shù)的頻帶。
14.一種對(duì)通過對(duì)一個(gè)輸入初始信號(hào)編碼而獲得的編碼數(shù)據(jù)流進(jìn)行解碼、并輸出一個(gè)頻譜的解碼設(shè)備,包括解碼單元,可用于提取在輸入編碼數(shù)據(jù)流中包含的編碼數(shù)據(jù)流的一部分,并對(duì)提取出的編碼數(shù)據(jù)流解碼;頻率變換單元,可用于將通過對(duì)提取出的編碼數(shù)據(jù)流解碼而獲得的信號(hào)變換成一個(gè)頻譜以及,合成單元,可用于在頻率軸上合成通過對(duì)從輸入編碼數(shù)據(jù)流的其他部分提取出的編碼數(shù)據(jù)流解碼而獲得的一個(gè)頻譜和由頻率變換單元獲得的頻譜。
15.依據(jù)權(quán)利要求14的解碼設(shè)備,其中,由頻率變換單元獲得的頻譜和通過對(duì)從編碼數(shù)據(jù)流的其他部分提取出的編碼數(shù)據(jù)流解碼而獲得的頻譜是指示對(duì)于相同輸入初始信號(hào)的在同一時(shí)間的一個(gè)信號(hào)的頻譜。
16.依據(jù)權(quán)利要求15的解碼設(shè)備,其中,解碼設(shè)備進(jìn)一步包括時(shí)間近似單元,可用于用一個(gè)從其他頻帶中的編碼數(shù)據(jù)流解碼出的信號(hào)來(lái)近似由提取出的編碼數(shù)據(jù)流指示的頻帶,以及頻率變換單元將被近似的信號(hào)變換成一個(gè)頻譜。
17.依據(jù)權(quán)利要求16的解碼設(shè)備,其中,時(shí)間近似單元根據(jù)在提取出的編碼數(shù)據(jù)流中包含的數(shù)據(jù)指定被用于由編碼數(shù)據(jù)流所指示的頻帶的近似的信號(hào)的一個(gè)頻帶,并采用所指定頻帶的信號(hào)執(zhí)行近似。
18.依據(jù)權(quán)利要求17的解碼設(shè)備,其中,時(shí)間近似單元進(jìn)一步通過從提取出的編碼數(shù)據(jù)流中包含的數(shù)據(jù)讀取用于被近似的信號(hào)的近似的信號(hào)的增益,并通過采用所讀取的增益調(diào)節(jié)指定頻帶中的信號(hào)的振幅來(lái)近似頻帶。
19.依據(jù)權(quán)利要求17的編碼設(shè)備,其中,時(shí)間近似單元指定一個(gè)已經(jīng)變換成頻譜的頻帶,根據(jù)頻率—時(shí)間變換將指定頻帶的頻譜變換成一個(gè)信號(hào),并采用變換所獲得的信號(hào)來(lái)近似一個(gè)由提取出的編碼數(shù)據(jù)流所指示的頻帶。
20.依據(jù)權(quán)利要求16的編碼設(shè)備,其中,解碼設(shè)備進(jìn)一步包括頻率近似單元,可用于用從其他頻帶中的編碼數(shù)據(jù)流解碼出的頻譜來(lái)近似由提取出的編碼數(shù)據(jù)流所指示的頻帶,以及,除了通過對(duì)從輸入編碼數(shù)據(jù)流的其他部分提取出的編碼數(shù)據(jù)流解碼而獲得的頻譜以及由頻率變換單元獲得的頻譜之外,合成單元進(jìn)一步在頻率軸上合成由頻率近似單元近似的頻譜。
21.依據(jù)權(quán)利要求20的解碼設(shè)備,其中,頻率近似單元根據(jù)在提取出的編碼數(shù)據(jù)流中包含的數(shù)據(jù)指定被用于由編碼數(shù)據(jù)流所指示的頻帶的近似的頻譜的一個(gè)頻帶,并采用所指定頻帶的頻譜執(zhí)行近似。
22.依據(jù)權(quán)利要求21的解碼設(shè)備,其中,頻率近似單元進(jìn)一步通過從提取出的編碼數(shù)據(jù)流中包含的數(shù)據(jù)讀取用于被近似的頻譜的近似的頻譜的增益,并通過采用所讀取的增益調(diào)節(jié)指定頻帶中的頻譜的振幅來(lái)近似頻帶。
23.一種對(duì)通過根據(jù)時(shí)間—頻率變換來(lái)變換一個(gè)輸入初始信號(hào)而獲得的頻域中的一個(gè)信號(hào)進(jìn)行編碼并產(chǎn)生一個(gè)輸出信號(hào)的編碼方法,包括第一頻帶指定步驟,用于基于輸入初始信號(hào)的特性為一部分頻譜指定一個(gè)頻帶;時(shí)間變換步驟,用于根據(jù)頻率—時(shí)間變換將指定頻帶中的一個(gè)信號(hào)變換成一個(gè)信號(hào);以及,編碼步驟,用于對(duì)由時(shí)間變換步驟獲得的信號(hào)和至少一部分頻譜進(jìn)行編碼,并從編碼信號(hào)和編碼頻譜產(chǎn)生一個(gè)輸出信號(hào)。
24.一種對(duì)通過對(duì)一個(gè)輸入初始信號(hào)編碼而獲得的編碼數(shù)據(jù)流進(jìn)行解碼、并輸出一個(gè)頻譜的解碼方法,包括解碼步驟,用于提取在輸入編碼數(shù)據(jù)流中包含的編碼數(shù)據(jù)流的一部分,并對(duì)提取出的編碼數(shù)據(jù)流解碼;頻率變換步驟,用于將通過對(duì)提取出的編碼數(shù)據(jù)流解碼而獲得的信號(hào)變換成一個(gè)頻譜;以及,合成步驟,用于在頻率軸上合成通過對(duì)從輸入編碼數(shù)據(jù)流的其他部分提取出的編碼數(shù)據(jù)流解碼而獲得的一個(gè)頻譜和由頻率變換步驟獲得的頻譜。
25.一種對(duì)通過根據(jù)時(shí)間—頻率變換來(lái)變換一個(gè)輸入初始信號(hào)而獲得的頻域中的一個(gè)信號(hào)進(jìn)行編碼并產(chǎn)生一個(gè)輸出信號(hào)的程序,所述程序使計(jì)算機(jī)執(zhí)行第一頻帶指定步驟,用于基于輸入初始信號(hào)的特性為一部分頻譜指定一個(gè)頻帶;時(shí)間變換步驟,用于根據(jù)頻率—時(shí)間變換將指定頻帶中的一個(gè)信號(hào)變換成一個(gè)信號(hào);以及,編碼步驟,用于對(duì)由時(shí)間變換步驟獲得的信號(hào)和至少一部分頻譜進(jìn)行編碼,并從編碼信號(hào)和編碼頻譜產(chǎn)生一個(gè)輸出信號(hào)。
26.一種對(duì)通過對(duì)一個(gè)輸入初始信號(hào)編碼而獲得的編碼數(shù)據(jù)流進(jìn)行解碼、并輸出一個(gè)頻譜的程序,所述程序使計(jì)算機(jī)執(zhí)行解碼步驟,用于提取在輸入編碼數(shù)據(jù)流中包含的編碼數(shù)據(jù)流的一部分,并對(duì)提取出的編碼數(shù)據(jù)流解碼;頻率變換步驟,用于將通過對(duì)提取出的編碼數(shù)據(jù)流解碼而獲得的信號(hào)變換成一個(gè)頻譜;以及,合成步驟,用于在頻率軸上合成通過對(duì)從輸入編碼數(shù)據(jù)流的其他部分提取出的編碼數(shù)據(jù)流解碼而獲得的一個(gè)頻譜和由頻率變換步驟獲得的頻譜。
全文摘要
一種編碼設(shè)備(200)包括時(shí)間特性提取單元(203),基于時(shí)域中的一個(gè)音頻輸入信號(hào)的特性為一部分頻譜指定一個(gè)頻帶;時(shí)間變換單元(204),根據(jù)頻率一時(shí)間變換將指定頻帶中的一個(gè)信號(hào)變換成一個(gè)信號(hào);以及,編碼數(shù)據(jù)流產(chǎn)生單元(205),對(duì)由時(shí)間變換單元(204)獲得的信號(hào)和至少一部分頻譜進(jìn)行編碼,并從編碼信號(hào)和編碼頻譜產(chǎn)生一個(gè)輸出編碼數(shù)據(jù)流。
文檔編號(hào)G10L19/02GK1516865SQ0380041
公開日2004年7月28日 申請(qǐng)日期2003年4月7日 優(yōu)先權(quán)日2002年4月11日
發(fā)明者津島峰生, 則松武志, 志, 也, 田中直也 申請(qǐng)人:松下電器產(chǎn)業(yè)株式會(huì)社