專利名稱:編碼裝置和解碼裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及用于編碼和解碼數(shù)字音頻數(shù)據(jù)的技術(shù)。
背景技術(shù):
近年來,已開發(fā)出許多種音頻壓縮方法。MPEG-2的高級音頻編碼(MPEG-2 AAC)就是這些編碼方法中的一種,MPEG-2 AAC在“ISO/IEC 13818-7(MPEG-2 Advanced Audio Coding,AAC)”中進(jìn)行了詳細(xì)的定義。
下面參照圖1說明常規(guī)的編碼和解碼過程。圖1是表示遵照MPEG-2 AAC的常規(guī)編碼裝置300和常規(guī)解碼裝置400的方框圖。編碼裝置300根據(jù)MPEG-2 AAC接收并編碼一音頻信號,編碼裝置300包括一個音頻信號輸入單元310,一個變換單元320,一個量化單元331,一個編碼單元332,和一個流輸出單元340。
音頻信號輸入單元310接收以44.1kHz的取樣頻率取樣而產(chǎn)生的數(shù)字音頻數(shù)據(jù)。音頻信號輸入單元310從這個數(shù)字音頻數(shù)據(jù)中提取連續(xù)的1024個取樣。該1024個取樣是一個編碼單元并被稱為一個幀。
變換單元320根據(jù)修正的離散余弦變換(MDCT)將提取的時域內(nèi)的取樣(以下稱為“取樣數(shù)據(jù)”)變換為頻域內(nèi)的包含1024個取樣的頻譜數(shù)據(jù)。然后這個頻譜數(shù)據(jù)被分為許多個組,每個組都包含至少一個取樣并模擬人類聽覺的一個臨界頻帶。每個這樣的組被稱為一個“比例因子頻帶”。
量化單元331接收來自變換單元320的頻譜數(shù)據(jù),并以對應(yīng)于每個比例因子頻帶的一個歸一化因子將其量化。該歸一化因子被稱為一個“比例因子”,通過該比例因子量化的每組頻譜數(shù)據(jù)以下稱為“量化數(shù)據(jù)”。
根據(jù)霍夫曼編碼,編碼單元332將量化數(shù)據(jù)和用于量化數(shù)據(jù)的每個比例因子進(jìn)行編碼。在編碼比例因子之前,編碼單元332為每個比例因子規(guī)定在兩個連續(xù)的比例因子頻帶中的兩個比例因子值的一個差值。然后編碼單元332對每個規(guī)定的差值和在幀起始的比例因子頻帶中使用的一個比例因子進(jìn)行編碼。
流輸出單元340接收來自編碼單元332的編碼信號,將其變換為MPEG-2 AAC比特流并輸出。該比特流可以通過傳輸介質(zhì)被傳輸至解碼裝置400,也可以記錄在記錄介質(zhì)上,例如壓縮光盤(CD)和數(shù)字通用光盤(DVD)這樣的光盤,或半導(dǎo)體,硬盤等。
解碼裝置400用于將編碼裝置300編碼的比特流進(jìn)行解碼,其包括一個流輸入單元410,一個解碼單元421,一個解量化單元422,一個逆變換單元430,和一個音頻信號輸出單元440。
流輸入單元410通過一傳輸介質(zhì)來接收編碼裝置300所編碼的MPEG-2 AAC比特流,或從一記錄介質(zhì)重建比特流。然后流輸入單元410從該比特流中提取編碼信號。
解碼單元421對提取的編碼信號進(jìn)行解碼,該編碼信號具有用于流的格式,以便產(chǎn)生量化數(shù)據(jù)。
解量化單元422對量化數(shù)據(jù)(當(dāng)使用MPEG-2 AAC時為霍夫曼編碼)解量化以產(chǎn)生頻域內(nèi)的頻譜數(shù)據(jù)。
逆變換單元430將頻譜數(shù)據(jù)變換為時域內(nèi)的取樣數(shù)據(jù)。對于MPEG-2 AAC,這種變換是根據(jù)反向的修正離散余弦變換(IMDCT)進(jìn)行的。
音頻信號輸出單元440將逆變換單元430輸出的取樣數(shù)據(jù)組結(jié)合起來,并作為數(shù)字音頻數(shù)據(jù)輸出。
在MPEG-2 AAC中,由MDCT變換決定的取樣數(shù)據(jù)的長度可根據(jù)輸入的音頻信號而改變。當(dāng)將被執(zhí)行MDCT的取樣數(shù)據(jù)由256個取樣構(gòu)成時,該取樣數(shù)據(jù)是基于短塊塊的。當(dāng)將被執(zhí)行MDCT的取樣數(shù)據(jù)由2048個取樣構(gòu)成時,該取樣數(shù)據(jù)是基于長塊塊的。該短塊塊和長塊塊表示一個音頻塊的大小。
當(dāng)數(shù)字音頻數(shù)據(jù)以44.1kHz的取樣頻率被取樣且施加的是短塊塊塊時,編碼裝置300從該取樣音頻數(shù)據(jù)中提取128個取樣和兩組64個取樣,這兩組64個取樣是在緊接著該128個取樣之前和之后獲得的,也就是總計256個取樣。這兩組64個取樣與另外兩組緊接著當(dāng)前128取樣之前和之后提取的128個取樣相重疊。所提取的音頻數(shù)據(jù)根據(jù)MDCT變換為由256個取樣構(gòu)成的頻譜數(shù)據(jù),而其中只有一半,即128個取樣被量化和編碼。8個連續(xù)的窗口,其中每個都包含由128個取樣構(gòu)成的頻譜數(shù)據(jù),被當(dāng)作由1024個取樣構(gòu)成的一個幀,這個幀是受隨后處理支配的一個單元,所述處理包括量化和編碼。
這樣,基于一個短塊的窗口包括128個取樣而基于一個長塊的窗口包括1024個取樣。當(dāng)由短塊表示的22.05kHz再生頻帶的音頻數(shù)據(jù)與由長塊表示的相同音頻數(shù)據(jù)相比較時,雖然由長塊表示的音頻數(shù)據(jù)由于使用了更多的取樣來表示相同的音頻數(shù)據(jù),從而可以實現(xiàn)更好的聲音品質(zhì),但由短塊表示的音頻數(shù)據(jù)即使對基于短周期的音頻信號也具有較好的時間分辨率。也就是說,若一個窗口內(nèi)的提取音頻信號包含一個沖擊脈沖(高幅值的尖脈沖),則其在長塊中的破壞性遠(yuǎn)比在短塊中更大,這是由于沖擊脈沖可以影響基于長塊的窗口內(nèi)的多達(dá)1024個取樣。而對于短塊,沖擊脈沖的破壞性被限制在由128個取樣構(gòu)成的一個窗口內(nèi),而其他窗口的頻譜不會受沖擊脈沖的影響,從而可實現(xiàn)原始聲音的更準(zhǔn)確的再現(xiàn)。
由編碼裝置300編碼并被發(fā)送至解碼裝置400的音頻數(shù)據(jù)的質(zhì)量可以通過例如編碼音頻數(shù)據(jù)的一個再生頻帶被測量。當(dāng)輸入信號以例如44.1kHz的取樣頻率被取樣時,該信號的一個再生頻帶為22.05kHz。當(dāng)具有22.05kHz的再生頻帶或22.05kHz附近更寬的再生頻帶的音頻信號被編碼為無劣化的編碼音頻數(shù)據(jù),且所有的編碼音頻數(shù)據(jù)都被傳輸至解碼裝置時,該音頻數(shù)據(jù)可以被再現(xiàn)為高品質(zhì)的聲音。然而再生頻帶的寬度會影響頻譜數(shù)據(jù)值的數(shù)目,進(jìn)而影響用于傳輸?shù)臄?shù)據(jù)量。例如,當(dāng)輸入音頻信號在44.1kHz的取樣頻率被取樣時,由該信號產(chǎn)生的頻譜數(shù)據(jù)由1024個取樣構(gòu)成,其具有22.05kHz的再生頻帶。為了保證22.05kHz的再生頻帶,該頻譜數(shù)據(jù)的所有1024個取樣都需要被傳輸。這就要求對音頻信號的有效編碼,從而將編碼音頻信號的比特量限制在傳輸信道的傳輸率范圍內(nèi)。
通過低速率的傳輸信道,例如手機(jī),來傳輸多達(dá)1024個取樣的頻譜數(shù)據(jù)是不現(xiàn)實的。也就是說,當(dāng)具有一個寬再生頻帶的所有頻譜數(shù)據(jù)都以這樣低的傳輸速率來傳輸,同時整個頻譜數(shù)據(jù)的比特量都根據(jù)低傳輸速率而調(diào)整時,則分配給每個頻帶的數(shù)據(jù)的比特量將變得非常少。這將會加劇量化噪聲效應(yīng),以致解碼后聲音品質(zhì)下降。
為了避免這樣的劣化,有許多種音頻信號編碼方法來實現(xiàn)有效的音頻信號傳輸,其中包括MPEG-2 AAC,根據(jù)這些編碼方法,每組頻譜數(shù)據(jù)被分配以適當(dāng)?shù)臋?quán)重,低權(quán)重的數(shù)值就不進(jìn)行傳輸。通過這種方法,在對人類聽覺很重要的低頻帶中的頻譜數(shù)據(jù)被分配以足夠的比特量,從而增強(qiáng)了其編碼的精確度,同時高頻帶中的頻譜數(shù)據(jù)被認(rèn)為不太重要,往往不進(jìn)行傳送。
雖然在MPEG-2 AAC中使用了這樣的技術(shù),但是現(xiàn)在仍然需要實現(xiàn)高品質(zhì)再現(xiàn)和更高壓縮效率的音頻編碼技術(shù)。換句話說,對實現(xiàn)以低傳輸速率傳送高頻帶和低頻帶的音頻信號的技術(shù)的需求是不斷增長的。
發(fā)明內(nèi)容
考慮到上述問題,本發(fā)明的編碼裝置接收和編碼音頻信號,并包括變換單元,用于以預(yù)定的時間間隔提取一部分接收的音頻信號,并變換所提取的每個部分以在每個幀周期內(nèi)產(chǎn)生多個窗口頻譜,其中所產(chǎn)生的窗口頻譜由短塊組成,并表示出頻率頻譜隨著時間是如何變化的;判斷單元用于將窗口頻譜相互比較以判斷在所比較的窗口頻譜中是否存在預(yù)定程度的相似性;替換單元,用于當(dāng)判斷單元判斷存在相似性時,將所產(chǎn)生的窗口頻譜中的一第一窗口頻譜的高頻部分替換為一個預(yù)定值;其中該第一窗口頻譜和同樣是所產(chǎn)生的窗口頻譜之一的一第二窗口頻譜共用第二窗口頻譜的高頻部分;第一量化單元用于量化多個窗口頻譜以在替換單元的操作之后產(chǎn)生多個量化的窗口頻譜;第一編碼單元用于編碼量化的窗口頻譜以產(chǎn)生第一編碼數(shù)據(jù);和輸出單元用于輸出所產(chǎn)生的第一編碼數(shù)據(jù)。
由于上述在每個幀周期內(nèi)由變換單元產(chǎn)生的由短塊組成的多個窗口頻譜,相鄰的窗口頻譜很可能彼此相似。當(dāng)判斷單元判斷在第一和第二窗口頻譜之間存在相似性時,第一窗口頻譜的高頻部分不進(jìn)行量化和編碼。而是將此高頻部分由第二窗口頻譜的高頻部分來代表。更詳細(xì)地,第一窗口頻譜的高頻部分被替換為預(yù)定值。當(dāng)預(yù)定值使用的值例如為“0”時,此高頻部分的量化和編碼操作可被簡化。并且,該高頻部分的比特量可以被顯著減少。
可與上述編碼裝置一起使用的解碼裝置,可接收和解碼表示音頻信號的編碼數(shù)據(jù)。該編碼數(shù)據(jù)包括一第一區(qū)域內(nèi)的第一編碼數(shù)據(jù)。該解碼裝置包括第一解碼單元,用于解碼第一區(qū)域內(nèi)的第一編碼數(shù)據(jù)以產(chǎn)生第一解碼數(shù)據(jù);第一解量化單元,用于解量化第一解碼數(shù)據(jù)以在每個幀周期內(nèi)產(chǎn)生多個窗口頻譜,其中所產(chǎn)生的窗口頻譜由短塊組成,并表示出頻率頻譜隨著時間是如何變化的;判斷單元,用于(a)監(jiān)視所產(chǎn)生的窗口頻譜,從而找到其高頻部分由預(yù)定值組成的一第一窗口頻譜,(b)判斷該第一窗口頻譜的高頻部分將由包含在多個窗口頻譜中的一第二窗口頻譜的高頻部分來重建;第二解量化單元,用于(a)從第一解量化單元獲得第二窗口頻譜的高頻部分,(b)復(fù)制所獲得的高頻部分,(c)將復(fù)制的高頻部分與第一窗口頻譜關(guān)聯(lián),(d)輸出所復(fù)制的高頻部分;和音頻信號輸出單元,用于(a)從第二解量化單元獲得所復(fù)制的高頻部分,并從第一解量化單元獲得第一窗口頻譜,(b)將第一窗口頻譜的高頻部分替換為復(fù)制的高頻部分,(c)將包含替換高頻部分的第一窗口頻譜變換為時域內(nèi)的音頻信號,(d)輸出該音頻信號。
上述解碼裝置在每個幀周期內(nèi)接收一個窗口頻譜的至少一個高頻部分,根據(jù)判斷單元的判斷而復(fù)制該高頻部分,并使用復(fù)制的高頻部分作為其他窗口頻譜的一個高頻部分。結(jié)果,本解碼裝置就能夠以相對于常規(guī)解碼裝置更高的品質(zhì)而再現(xiàn)高頻帶的聲音。
這里,當(dāng)編碼裝置的判斷單元判斷存在相似性時,替換單元還可將第一窗口頻譜的一個低頻部分替換為一個預(yù)定值。
當(dāng)不同的窗口頻譜彼此具有預(yù)定程度的相似性時,上述編碼裝置不僅將高頻部分,還將其中一個窗口頻譜的低頻部分替換為一個預(yù)定值。當(dāng)該預(yù)定值例如為“0”時,該替換部分的量化和編碼操作被簡化。并且,通過被替換為值“0”的低頻部分和高頻部分的比特量的減少,所得到的編碼數(shù)據(jù)的比特量可被大大減少。
以下將說明與上述編碼裝置一起使用的解碼裝置。當(dāng)找到由具有預(yù)定值的多個數(shù)據(jù)組構(gòu)成的一個窗口頻譜時,判斷單元可判斷所找到的窗口頻譜的高頻部分將由第二窗口頻譜的高頻部分來重建。根據(jù)判斷單元的判斷結(jié)果,第二解量化單元可從第一解量化單元獲得包括高頻和低頻部分的整個第二窗口頻譜,復(fù)制所獲得的第二窗口頻譜,將復(fù)制的第二窗口頻譜與找到的窗口頻譜關(guān)聯(lián),并輸出復(fù)制的第二窗口頻譜。音頻信號輸出單元可將找到的整個窗口頻譜替換為復(fù)制的第二窗口頻譜,將替換的窗口頻譜變換為時域內(nèi)的音頻信號,并輸出該音頻信號。
在每個幀周期內(nèi),上述解碼裝置可接收至少一個包括高頻和低頻部分的窗口頻譜,并根據(jù)判斷單元的判斷結(jié)果而復(fù)制接收的窗口頻譜,以重建其他窗口頻譜。由接收的高頻部分,本解碼裝置就能夠以相對于常規(guī)解碼裝置更高的品質(zhì)而再現(xiàn)高頻帶的聲音,雖然由于判斷單元的判斷所使用的預(yù)定標(biāo)準(zhǔn),低頻部分中可能會引入一定誤差。
對于上述編碼裝置,多個窗口頻譜中的每一個可能都由數(shù)據(jù)組構(gòu)成。編碼裝置還可包括第二量化單元,用于以一預(yù)定的歸一化因子來量化輸入到第一量化單元的每個窗口頻譜內(nèi)的一峰值附近的一定組的數(shù)據(jù);其中在第二量化單元的量化之前,第一量化單元量化一定組的數(shù)據(jù)以產(chǎn)生具有一個預(yù)定值的多組量化數(shù)據(jù);第二編碼單元,用于編碼多組量化數(shù)據(jù)以產(chǎn)生第二編碼數(shù)據(jù)。輸出單元可輸出第二編碼數(shù)據(jù)和第一編碼數(shù)據(jù)。
當(dāng)上述第一量化單元由一個窗口頻譜內(nèi)一峰值附近的一定組的數(shù)據(jù)產(chǎn)生具有相同預(yù)定值的多組量化數(shù)據(jù)時,第二量化單元使用一個預(yù)定的歸一化因子來量化該一定組的數(shù)據(jù)。結(jié)果,第二量化單元產(chǎn)生了多組量化數(shù)據(jù),這些量化數(shù)據(jù)的值是不連續(xù)的相同預(yù)定值。也就是說,第二量化單元的量化可校正由一個窗口頻譜內(nèi)一峰值附近的多組頻譜數(shù)據(jù)所導(dǎo)致的誤差。
這里,與上述編碼裝置一起使用的解碼裝置可以是這樣。由解碼裝置接收的編碼數(shù)據(jù)也包括第二編碼數(shù)據(jù),該數(shù)據(jù)是通過一預(yù)定的歸一化因子量化一窗口頻譜的一部分而產(chǎn)生的,該預(yù)定的歸一化因子不同于第一編碼數(shù)據(jù)中量化相同的窗口頻譜所使用的歸一化因子。解碼裝置還可包括第二分離單元,用于從接收的編碼數(shù)據(jù)的第二區(qū)域中分離出第二編碼數(shù)據(jù);第二解碼單元,用于解碼分離的第二編碼數(shù)據(jù)以獲得第二解碼數(shù)據(jù)。第二解量化單元還可以(a)監(jiān)視由第一解量化單元產(chǎn)生的多個窗口頻譜,從而找到一個窗口頻譜中連續(xù)包含預(yù)定值的一部分,(b)確定對應(yīng)于找到部分并包含在第二解碼數(shù)據(jù)中的一個部分,(c)使用該預(yù)定的歸一化因子來解量化該確定的部分,以獲得由多組數(shù)據(jù)構(gòu)成的解量化部分。音頻信號輸出單元還可以(a)將第二解量化單元找到的部分替換為多組數(shù)據(jù),(b)將包含多組頻譜數(shù)據(jù)的窗口頻譜變換為時域內(nèi)的音頻信號,(c)輸出該音頻信號。
當(dāng)編碼裝置的第一量化單元由一個窗口頻譜內(nèi)一峰值附近的一定組的數(shù)據(jù)而產(chǎn)生具有相同預(yù)定值的量化數(shù)據(jù)組時,解碼裝置的第二解量化單元可粗略地重建該一定組的數(shù)據(jù)。也就是說,第二解量化單元校正了在窗口頻譜的一峰值附近的多組頻譜數(shù)據(jù)中導(dǎo)致的誤差。從而,本解碼裝置能夠比常規(guī)解碼裝置更準(zhǔn)確地再現(xiàn)整個再生頻帶內(nèi)窗口頻譜的峰值附近的聲音。
圖1是表示遵照常規(guī)MPEG-2 AAC的常規(guī)編碼和解碼裝置的結(jié)構(gòu)的方框圖。
圖2是表示本發(fā)明的編碼裝置和解碼裝置的結(jié)構(gòu)的方框圖。
圖3A和3B表示圖2中所示編碼裝置對音頻信號進(jìn)行變換的處理。
圖4表示圖2中所示判斷單元如何判斷較高頻率頻譜數(shù)據(jù)由其他頻譜數(shù)據(jù)來代表的例子。
圖5A,5B,5C表示由圖3所示的流輸出單元在在其中插入第二編碼信號(共用信息)的一個比特流的數(shù)據(jù)結(jié)構(gòu)。
圖6A,6B,6C表示由流輸出單元在其中插入第二編碼信號的一個比特流的另一種數(shù)據(jù)結(jié)構(gòu)。
圖7是表示圖2中所示第一量化單元為確定比例因子而執(zhí)行的操作的流程圖。
圖8是表示判斷單元在一幀內(nèi)對共用頻譜數(shù)據(jù)做出判斷而執(zhí)行的示例操作的流程圖。
圖9是表示圖2中所示第二解量化單元為復(fù)制較高頻率頻譜數(shù)據(jù)而執(zhí)行的示例操作的流程圖。
圖10表示作為判斷單元為每個基于短塊的窗口所產(chǎn)生的子信息(比例因子)的特定例子的頻譜數(shù)據(jù)的波形圖。
圖11是表示判斷單元為產(chǎn)生該子信息而執(zhí)行的操作的流程圖。
圖12是表示本發(fā)明第二實施例的編碼裝置和解碼裝置的結(jié)構(gòu)的方框圖。
圖13表示圖12所示的判斷單元如何判斷頻譜數(shù)據(jù)由其他頻譜數(shù)據(jù)來代表的例子。
圖14是表示本發(fā)明第三實施例的編碼裝置和解碼裝置的結(jié)構(gòu)的方框圖。
圖15是表示第三實施例的編碼裝置和解碼裝置的其他結(jié)構(gòu)的方框圖。
圖16是表示在本發(fā)明的編碼裝置和常規(guī)編碼裝置之間使用特定值的量化結(jié)果的差異的一個表格。
圖17A,17B,17C表示編碼裝置如何校正峰值附近的量化數(shù)據(jù)中的誤差的一個例子。
具體實施例方式
第一實施例以下具體說明了作為本發(fā)明實施例的編碼裝置100和解碼裝置200。圖2是表示編碼裝置100和解碼裝置200的結(jié)構(gòu)的方框圖。編碼裝置100此編碼裝置100在傳輸之前有效地減少了編碼的音頻比特流的比特量。當(dāng)本編碼裝置100和常規(guī)編碼裝置產(chǎn)生相同比特量的編碼音頻比特流時,本編碼裝置100產(chǎn)生的音頻比特流可由解碼裝置200重建為比常規(guī)編碼裝置產(chǎn)生的音頻比特流更高品質(zhì)的音頻信號。更具體的,編碼裝置100通過以下操作減少了編碼音頻比特流的比特量。對于短塊,編碼裝置100共同傳輸8個塊(即窗口),每個窗口由128個取樣構(gòu)成。當(dāng)較高頻帶中不同組的頻譜數(shù)據(jù)有兩個或更多窗口相似時,編碼裝置100用其中一組頻譜數(shù)據(jù)代表其他相似組的頻譜數(shù)據(jù)以減少其比特量。以下,較高頻帶中的頻譜數(shù)據(jù)被稱為“較高頻率頻譜數(shù)據(jù)”。編碼裝置100包括音頻信號輸入單元110,變換單元120,第一量化單元131,第一編碼單元132,第二編碼單元134,判斷單元137,和流輸出單元140。
音頻信號輸入單元110接收數(shù)字音頻數(shù)據(jù),例如MPEG-2 AAC的數(shù)字音頻數(shù)據(jù)。該數(shù)字音頻數(shù)據(jù)以44.1kHz的取樣頻率被取樣。音頻信號輸入單元110從該數(shù)字音頻數(shù)據(jù)中,在大約2.9毫秒(msec)的周期內(nèi)提取128個取樣,并另外獲得兩組64個取樣,其中一組緊接著所提取的128取樣之前,另一組緊接在該128取樣之后。這兩組64個取樣與另外兩組128個取樣相重合,該另外兩組128取樣是緊接在當(dāng)前的128取樣之前和之后提取的。從而,在一次提取中總共獲得256個取樣。(以下,由音頻信號輸入單元112這樣獲得的數(shù)字音頻數(shù)據(jù)被稱為“取樣數(shù)據(jù)”。)和常規(guī)技術(shù)一樣,變換單元120將時域內(nèi)的取樣數(shù)據(jù)變換到頻域內(nèi)的頻譜數(shù)據(jù)。根據(jù)MPEG-2 AAC,對由256個取樣構(gòu)成的取樣數(shù)據(jù)執(zhí)行MDCT,從而產(chǎn)生基于短塊的由256個取樣構(gòu)成的頻譜數(shù)據(jù)。作為MDCT變換結(jié)果而產(chǎn)生的頻譜數(shù)據(jù)值的分布是對稱的,從而256個取樣中只有一半(即128個取樣)被用作隨后的操作。由128個取樣組成的這種單元以下被稱為一個窗口。8個窗口,即,1024個取樣構(gòu)成一個幀。
然后變換單元113將每個窗口內(nèi)的頻譜數(shù)據(jù)分為多個組,每個組都包括至少一個取樣(或者,實際情況是,總數(shù)目為四的倍數(shù)的取樣)。每個這樣的組被稱為一個比例因子頻帶。對于MPEG-2 AAC,一個幀中包含的比例因子頻帶的總數(shù)是基于塊的尺寸和取樣頻率而定義的,包含在每個比例因子頻帶中的頻譜數(shù)據(jù)的取樣的數(shù)目也是基于該頻率而定義的。在較低頻帶中的取樣被更精細(xì)地分為多個包含更少取樣的比例因子頻帶的組,而較高頻帶中的取樣被更粗略地分為多個包含更多取樣的比例因子頻帶的組。當(dāng)使用短塊和44.1kHz的取樣頻率時,每個窗口都包含14個比例因子頻帶,每個窗口中的128個取樣代表一個22.05kHz的再生頻帶。
圖3A和3B表示圖2所示的編碼裝置100進(jìn)行的音頻信號變換的處理。圖3A表示以短塊為單位的由音頻信號輸入單元110提取的時域內(nèi)取樣數(shù)據(jù)的波形圖。圖3B表示對應(yīng)于由變換單元120執(zhí)行MDCT后的一個幀的頻譜數(shù)據(jù)的波形圖。該圖的垂直和水平軸線分別表示頻譜值和頻率。雖然圖3A和3B中是由模擬波形來表示取樣數(shù)據(jù)和頻譜數(shù)據(jù)的,實際上它們都是數(shù)字信號。這也適用于在隨后的圖中表示的波形。還應(yīng)注意已經(jīng)執(zhí)行了MDCT的頻譜數(shù)據(jù),例如圖3B所示,可以是負(fù)值,雖然為了便于說明圖3B只表示出由正值構(gòu)成的波形圖。
如圖3A所示,音頻信號輸入單元110接收數(shù)字音頻信號,從該數(shù)字音頻信號提取128個取樣,并另外獲得兩組64個取樣,其中一組緊接著所提取的128取樣之前,另一組緊接在該128取樣之后。這兩組64取樣與另外兩組128取樣相重合,該另外兩組128取樣是緊接在當(dāng)前提取的128取樣之前和之后提取的。從而音頻信號輸入單元110總共獲得256個取樣,并將它們作為取樣數(shù)據(jù)輸出到變換單元120。變換單元120根據(jù)MDCT對這些取樣數(shù)據(jù)進(jìn)行變換以產(chǎn)生由256個取樣構(gòu)成的頻譜數(shù)據(jù)。由于根據(jù)MDCT進(jìn)行變換的頻譜數(shù)據(jù)形成了對稱的頻譜,因此只有256個取樣的一半,即,128個取樣在隨后的操作中被處理。圖3B表示以這種方式產(chǎn)生的頻譜數(shù)據(jù),其由對應(yīng)于一個幀的8個窗口構(gòu)成。每個窗口包括大約每2.9毫秒產(chǎn)生的128個取樣。也就是說,圖3B中每個窗口中的128個取樣表示圖3A中以電壓表示的由128個取樣構(gòu)成的音頻信號的頻率成分的比特量(即大小)。
以下說明判斷單元137對變換單元120輸出的8個窗口的每一個中的頻譜數(shù)據(jù)進(jìn)行的判斷。判斷單元137判斷一個窗口中較高頻帶中的頻譜數(shù)據(jù)是否可以由另一個窗口中的另一個較高頻率頻譜數(shù)據(jù)來代表。當(dāng)判斷為是時,判斷單元137將這兩個窗口其中一個的較高頻率頻譜數(shù)據(jù)值變?yōu)椤?”。該判斷可以通過例如規(guī)定兩個相鄰窗口中的兩組頻譜數(shù)據(jù)之間的能量差異來進(jìn)行。若規(guī)定的能量差異小于一個預(yù)定閾值,判斷單元137就判斷兩個窗口其中一個的頻譜數(shù)據(jù)可以由前述另一個窗口的另一組頻譜數(shù)據(jù)來代表。之后,判斷單元137為每個窗口產(chǎn)生一個標(biāo)志,指示當(dāng)前判斷的窗口中的頻譜數(shù)據(jù)是否可以由前述其他窗口的其他頻譜數(shù)據(jù)來代表。然后判斷單元137產(chǎn)生共用信息,該信息包括所產(chǎn)生的標(biāo)志以表示哪個窗口可以與其它窗口共用頻譜數(shù)據(jù)。
第一量化單元131接收來自判斷單元137的頻譜數(shù)據(jù),并為每個比例因子頻帶確定一個比例因子。第一量化單元131然后通過使用一個確定的比例因子對每個比例因子頻帶中的頻譜數(shù)據(jù)進(jìn)行歸一化和量化以產(chǎn)生量化數(shù)據(jù),并將量化數(shù)據(jù)和使用的比例因子輸出到第一編碼單元132。更詳細(xì)的,第一量化單元131為每個比例因子頻帶都確定一個適當(dāng)?shù)谋壤蜃?,從而使得到的編碼幀具有在傳輸信道的傳送速率范圍內(nèi)的比特量。
第一編碼單元132接收量化數(shù)據(jù)的1024個取樣和量化使用的比例因子,并根據(jù)霍夫曼編碼對它們進(jìn)行編碼,以產(chǎn)生一預(yù)定流格式的第一編碼信號。為了編碼比例因子,第一編碼單元132計算比例因子的值之間的差值,并對所計算的差值和一幀內(nèi)第一比例因子頻帶中使用的一比例因子進(jìn)行編碼。
第二編碼單元134接收來自判斷單元137的共用信息,并對其進(jìn)行霍夫曼編碼以產(chǎn)生一預(yù)定流格式的第二編碼信號。
流輸出單元140接收來自第一編碼單元132的第一編碼信號,將報頭(header)報頭信息和其他必要的次級信息插入到第一編碼信號中,并將其變換為MPEG-2 AAC的比特流。流輸出單元140還接收來自第二編碼單元134的第二編碼信號,并將其放置在上述MPEG-2 AAC的比特流的一個區(qū)域,該區(qū)域或者可以被常規(guī)的解碼裝置忽略,或者對該區(qū)域不定義任何操作。特別的,該區(qū)域可以是填充部分(Fill Element)或數(shù)據(jù)流單元(DSE)。從編碼裝置100輸出的比特流通過用于便攜電話和因特網(wǎng)的通信網(wǎng)絡(luò)和傳輸介質(zhì),例如有線電視和數(shù)字電視的廣播波被送至解碼裝置200。該比特流還可以被記錄在記錄介質(zhì)上,例如包括CD和DVD的光盤,半導(dǎo)體和硬盤。
在實際的MPEG-2 AAC中,可能還要另外使用一些其它的技術(shù),包括例如增益控制、瞬時噪音定形(TNS,Temporal NoiseControl)、心理聲學(xué)模型、M/S(Mid/Side)立體聲、聲強(qiáng)立體聲(intensitystereo)、預(yù)測等工具,以及其它的如保留比特(bit reservoir)和用于改變塊大小的方法等。
解碼裝置200解碼裝置200接收編碼比特流,并根據(jù)共用信息由比特流重建寬頻帶內(nèi)的數(shù)字音頻數(shù)據(jù)。解碼裝置200包括流輸入單元210,第一解碼單元221,第一解量化單元222,第二解碼單元223,第二解量化單元224,集成(integrate)單元225,逆變換單元230,和音頻信號輸出單元240。
流輸入單元210通過記錄介質(zhì)或傳輸介質(zhì)接收來自編碼裝置100的編碼比特流,該傳輸介質(zhì)和傳輸介質(zhì)包括用于手機(jī)的通信網(wǎng)絡(luò),因特網(wǎng),有線電視的傳輸信道,和廣播波。然后,流輸入單元210從編碼比特流中由常規(guī)解碼裝置400解碼的一個區(qū)域提取第一編碼信號。流輸入單元210還從該相同比特流的另一個區(qū)域提取第二編碼信號(共用信息),該另一個區(qū)域或者被常規(guī)解碼裝置400所忽略或者對其未定義任何操作。流輸入單元210分別向第一和第二解碼單元221和223輸出第一和第二編碼信號。
第一解碼單元221接收第一編碼信號,即,流格式為霍夫曼編碼的數(shù)據(jù),將其解碼為量化數(shù)據(jù),并輸出該量化數(shù)據(jù)。
第二解碼單元223接收第二編碼信號,將其解碼為共用信息,并輸出該共用信息。
當(dāng)涉及由第二解碼單元223輸出的共用信息時,第二解量化單元224對由第一解量化單元222輸出的、由兩個窗口共用的一部分頻譜數(shù)據(jù)進(jìn)行復(fù)制并輸出。
集成單元225對從第一和第二解量化單元223和224輸出的兩組頻譜數(shù)據(jù)一起進(jìn)行集成。更具體的,集成單元225接收來自第一解量化單元222的頻譜數(shù)據(jù),還從第二解量化單元224接收頻譜數(shù)據(jù)和頻率的指定。集成單元225然后將從第一解量化單元222接收的、并由上述指定的頻率所規(guī)定的頻譜數(shù)據(jù)的值改變?yōu)閺牡诙饬炕瘑卧?24輸出的頻譜數(shù)據(jù)的值。類似的,當(dāng)接收來自第二解量化單元224的較高頻率頻譜數(shù)據(jù)和窗口的指定時,集成單元225將從第一解量化單元222輸出的、并由指定窗口所規(guī)定的較高頻率頻譜數(shù)據(jù)的值,改變?yōu)閺牡诙炕瘑卧?24接收的較高頻率頻譜數(shù)據(jù)的值。
逆變換單元230接收來自集成單元225的集成的頻譜數(shù)據(jù),并對頻域內(nèi)的頻譜數(shù)據(jù)執(zhí)行IMDCT,將其變?yōu)橛蓵r域內(nèi)1024個取樣構(gòu)成的取樣數(shù)據(jù)。
音頻信號輸出單元240將從逆變換單元230輸出的取樣數(shù)據(jù)組順序的放在一起以產(chǎn)生并輸出數(shù)字音頻數(shù)據(jù)。
在本實施例中,一個窗口內(nèi)的較高頻率頻譜數(shù)據(jù)代表上述8個窗口中另一個窗口內(nèi)另外的較高頻率頻譜數(shù)據(jù)。這樣,通過不同窗口間的共用頻譜數(shù)據(jù)的比特量,減少了傳輸數(shù)據(jù)的比特量,同時使重建頻譜數(shù)據(jù)中的劣化最小。
圖4示出了根據(jù)判斷單元137的判斷,較高頻率頻譜數(shù)據(jù)在不同窗口間如何共用的一個例子。該圖中示出的頻譜數(shù)據(jù)對應(yīng)于一個幀,并由圖3B中所示的短塊產(chǎn)生。圖4中示出的每個窗口被垂直虛線分為兩半,左半邊表示從0kHz到11.025kHz的較低頻率再生頻帶,右半邊表示從11.025kHz到22.05kHz的較高頻率再生頻帶。
包含在兩個相鄰窗口中的兩個頻譜很可能具有相似的波形圖,如圖4所示,因為每個窗口都是在短周期內(nèi)提取的。在這種情況下,判斷單元137就判斷這兩個窗口其中一個的較高頻率頻譜數(shù)據(jù)代表另一個窗口的較高頻率頻譜數(shù)據(jù)。例如,假設(shè)第一和第二窗口中的頻譜是相似的,且從第三到第八窗口中的頻譜是相似的。則判斷單元137判斷在第一和第二窗口間較高頻率頻譜數(shù)據(jù)被共用,且在第三和隨后的窗口間另外的較高頻率頻譜數(shù)據(jù)被共用。在這種情況下,在圖中由箭頭表示的范圍內(nèi)的頻譜數(shù)據(jù)組被傳輸(以及量化和編碼)。在第二窗口和第四到第八窗口中的其他較高頻率頻譜數(shù)據(jù)組不進(jìn)行傳輸,并且這些頻譜數(shù)據(jù)組被判斷單元137改變?yōu)椤?”。
圖5A-5C表示包含共用信息的第二編碼信號被流輸出單元140插入到其中的編碼比特流的數(shù)據(jù)結(jié)構(gòu)。圖5A表示這種編碼比特流的區(qū)域,圖5B和5C表示MPEG-2 AAC的比特流的示例性數(shù)據(jù)結(jié)構(gòu)。圖5B中的陰影部分為填充部分區(qū)域,其中被填充為“0”以調(diào)整比特流的數(shù)據(jù)長度。圖5C所示的陰影部分為DSE區(qū)域,其中只有物理結(jié)構(gòu),例如比特長度,根據(jù)MPEG-2 AAC被定義,用于其未來的擴(kuò)充。如圖5A所示,由第二編碼單元134編碼的共用信息被指定ID(識別)信息并被放入比特流中的一個區(qū)域內(nèi),例如填充部分和DSE。
當(dāng)常規(guī)解碼裝置400接收在填充部分區(qū)域中包含第二編碼信號的比特流時,解碼裝置400并不監(jiān)視將第二編碼信號檢測出作為被解碼信號,而是忽略它。當(dāng)接收在DSE區(qū)域中包含第二編碼信號的比特流時,常規(guī)解碼裝置400可以讀出該第二編碼信號,但不執(zhí)行響應(yīng)于此讀出的任何操作,因為對解碼裝置400未定義響應(yīng)于第二編碼信號的任何操作。通過將第二編碼信號插入到比特流的上述其中一個區(qū)域,接收由編碼裝置100編碼的比特流的常規(guī)解碼裝置400并不將第二編碼信號作為編碼音頻信號來進(jìn)行解碼。從而使常規(guī)解碼裝置400避免了由于第二編碼信號的解碼失敗而產(chǎn)生的噪聲。結(jié)果,即使常規(guī)解碼裝置400也可以常規(guī)方式順利地從第一編碼信號單獨再現(xiàn)聲音。
可插入第二編碼信號的填充部分區(qū)域最初被提供報頭信息,如圖5A所示。該報頭信息包括以下信息,例如識別該填充部分的填充部分ID,和規(guī)定整個填充部分的比特長度的數(shù)據(jù)。類似的,可插入第二編碼信號的DSE區(qū)域最初也被提供報頭信息,如圖5A所示。該報頭信息包括以下信息,例如指示隨后數(shù)據(jù)為DSE的DSE ID,和規(guī)定整個DSE的比特長度的數(shù)據(jù)。流輸出單元140將包括ID信息和共用信息的第二編碼信號插入到存儲該報頭信息的區(qū)域之后的一個區(qū)域。
該ID信息表示隨后的編碼信息是否由本發(fā)明的編碼裝置100所產(chǎn)生。例如,“0001”的ID信息指示隨后的信息是由編碼裝置100編碼的共用信息。另一方面,“1000”的ID信息指示隨后的信息不是由編碼裝置100所編碼的。當(dāng)ID信息為“0001”時,本發(fā)明的解碼裝置200使第二解碼單元223解碼隨后的編碼信息以獲得共用信息,并根據(jù)獲得的共用信息來重建每個窗口中的較高頻率頻譜數(shù)據(jù)。但是,當(dāng)ID信息為“1000”時,解碼裝置200則忽略隨后的編碼信息。這種ID信息被插入到第二編碼信號中,從而使本發(fā)明的第二編碼信號清楚地區(qū)別于基于其他標(biāo)準(zhǔn)的其他編碼信息,該其他編碼信息可以被插入到不會被常規(guī)解碼裝置400檢測出作為存儲將被解碼的編碼音頻信號的例如填充部分和DSE的區(qū)域中填充部分。
上述ID信息還可以被用來通知解碼裝置200第二編碼信號還包括基于本發(fā)明但不是共用信息的其他附加信息(例如子信息),如果此附加信息以隨后實施例所述的方式被提供的話。該ID信息不需要被置于第二編碼信號的開始,并可以被置于編碼共用信息之后或者是共用信息一部分的區(qū)域中。
圖6A-6C表示第一和第二編碼信號被流輸出單元140插入到其中的編碼音頻比特流的其他示例性的數(shù)據(jù)結(jié)構(gòu)。這些圖中所示的編碼音頻比特流不一定必須符合MPEG-2 AAC。圖6A示出了存儲有各對應(yīng)于一個不同幀的多個第一編碼信號的流1。圖6B示出了以對應(yīng)于流1的幀的、以幀為單位只連續(xù)存儲第二編碼信號的流2。該流2對每個幀存儲如圖5A所示增加有報頭信息和ID信息的共用信息。如圖6A和6B所示,流輸出單元140可將第一和第二編碼信號置入到可通過不同信道傳輸?shù)姆蛛x的流1和2中。
當(dāng)?shù)谝缓偷诙幋a信號通過不同的比特流傳輸時,就有可能首先傳輸或累積包含有關(guān)于較低頻帶中音頻數(shù)據(jù)的信息的比特流,其是一種基本信息,然后根據(jù)需要傳輸或增加關(guān)于較高頻率頻譜數(shù)據(jù)的信息。
當(dāng)包含第二編碼信號的編碼音頻比特流僅為提供給本發(fā)明的解碼裝置200而產(chǎn)生時,第二編碼信號可以被插入到報頭信息的不同于上述區(qū)域的某個確定區(qū)域中,該區(qū)域是由編碼裝置100和解碼裝置200預(yù)先確定的?;蛘撸蓪⒌诙幋a信號插入到第一編碼信號的預(yù)定部分,或者插入到報頭信息的預(yù)定部分和所述的某個確定區(qū)域中。當(dāng)?shù)诙幋a信號被插入到規(guī)定部分和/或區(qū)域中時,該規(guī)定部分/區(qū)域不一定必須是一個單獨的連續(xù)區(qū)域,而可以是分散的區(qū)域。圖6C示出了在音頻比特流的報頭信息和第一編碼信號的分散的區(qū)域中都存儲有第二編碼信號的編碼音頻比特流的這種例子的數(shù)據(jù)結(jié)構(gòu)。在這種情況下,ID信息和報頭信息被添加至將被存儲為音頻比特流中的第二編碼信息的共用信息中。
以下參照圖7,8,11的流程圖和圖10的波形圖說明編碼裝置100和解碼裝置200的操作。
圖7表示第一量化單元131所執(zhí)行的為每個比例因子頻帶確定比例因子的操作的流程圖。第一量化單元131確定對應(yīng)一個幀的所有比例因子頻帶共用的一個比例因子的初始值(步驟S91)。使用該確定初始值的比例因子,第一量化單元131量化從判斷單元137輸出的一個幀的頻譜數(shù)據(jù)以產(chǎn)生量化數(shù)據(jù),計算每兩個相鄰比例因子頻帶所使用的比例因子的差值,并對量化數(shù)據(jù)、所計算的差值,和該幀的第一比例因子頻帶所使用的比例因子進(jìn)行霍夫曼編碼(步驟S92),以產(chǎn)生霍夫曼編碼數(shù)據(jù)。上述量化和編碼只是為了計數(shù)該幀的比特總數(shù)而執(zhí)行的,因此例如報頭這樣的信息不會被添加至量化和編碼的結(jié)果中。之后,第一量化單元131判斷該霍夫曼編碼數(shù)據(jù)的比特數(shù)量是否超過了一預(yù)定的比特數(shù)量(步驟S93)。如果是,則第一量化單元131降低該比例因子的初始值(步驟S101),并用該降低初始值的比例因子執(zhí)行量化和霍夫曼編碼。然后第一量化單元131判斷霍夫曼編碼數(shù)據(jù)的比特數(shù)量是否超過了該預(yù)定的比特數(shù)量(步驟S93)。第一量化單元131重復(fù)這些步驟,直到判斷霍夫曼編碼數(shù)據(jù)的比特數(shù)量沒有超過預(yù)定的比特數(shù)量。
基于霍夫曼編碼數(shù)據(jù)的比特數(shù)量沒有超過預(yù)定比特數(shù)量的判斷,第一量化單元131重復(fù)循環(huán)A(步驟S94~S98和S100)以為每個比例因子頻帶確定一個比例因子。也就是說,第一量化單元131對步驟S92所產(chǎn)生的每組量化數(shù)據(jù)在比例因子頻帶內(nèi)進(jìn)行解量化以產(chǎn)生一組解量化的頻譜數(shù)據(jù)(步驟S95),并計算在產(chǎn)生的解量化的頻譜數(shù)據(jù)組和對應(yīng)于該解量化頻譜數(shù)據(jù)的原始頻譜數(shù)據(jù)組之間的絕對差值。第一量化單元131然后對該比例因子頻帶內(nèi)所有的解量化頻譜數(shù)據(jù)組計算出的這些差值進(jìn)行合計(步驟S96)。然后,第一量化單元131判斷差值的合計值是否小于一個預(yù)定值(步驟S97)。如果是,則第一量化單元131對下一個比例因子頻帶執(zhí)行循環(huán)A(步驟S94~S98)。如果不是,則第一量化單元131增加該比例因子的值并使用增加的比例因子對同一比例因子頻帶內(nèi)的每組原始頻譜數(shù)據(jù)進(jìn)行量化(步驟S100)。第一量化單元131然后對每組量化數(shù)據(jù)進(jìn)行解量化(步驟S95),計算在每組解量化頻譜數(shù)據(jù)和對應(yīng)該解量化頻譜數(shù)據(jù)組的一組原始頻譜數(shù)據(jù)之間的絕對差值,并對計算的差值進(jìn)行合計(步驟S96)。然后,第一量化單元131再次判斷該差值的合計值是否小于一個預(yù)定值(步驟S97)。如果不是,則第一量化單元131增加該比例因子的值(步驟S100),并重復(fù)循環(huán)A(步驟S94~S98和S100)。
在確定比例因子之后,對于該幀內(nèi)使上述差值的合計值小于預(yù)定值(步驟S98)的所有比例因子頻帶,第一量化單元131使用所規(guī)定的比例因子來量化對應(yīng)于該幀的所有頻譜數(shù)據(jù)組以產(chǎn)生量化的數(shù)據(jù)組。第一量化單元131然后對所有量化數(shù)據(jù)組、在兩個相鄰比例因子頻帶中使用的每對比例因子間的差值,和第一比例因子頻帶中使用的一個比例因子進(jìn)行霍夫曼編碼,以產(chǎn)生編碼數(shù)據(jù)。第一量化單元131然后判斷編碼數(shù)據(jù)的比特數(shù)量是否超過預(yù)定的比特數(shù)量(步驟S99)。如果是,則第一量化單元131降低比例因子的初始值(步驟S101)直到該比特數(shù)量等于或小于預(yù)定比特數(shù)量,然后執(zhí)行循環(huán)A(步驟S94~S98和S100)以確定每個比例因子頻帶的比例因子。當(dāng)判斷編碼數(shù)據(jù)的比特數(shù)量沒有超過預(yù)定比特數(shù)量時(步驟S99),第一量化單元131指定循環(huán)A中規(guī)定的每個比例因子作為該幀內(nèi)每個比例因子頻帶的實際比例因子。
應(yīng)注意第一量化單元131根據(jù)例如與心理聲學(xué)模型相關(guān)的數(shù)據(jù)來進(jìn)行上述步驟S97的判斷(關(guān)于差值的合計值是否小于預(yù)定值)。
在圖7所示的上述操作中,第一量化單元131先設(shè)定相對大的值作為比例因子的初始值,如果霍夫曼編碼數(shù)據(jù)的比特數(shù)量小于預(yù)定的比特數(shù)量,則降低該初始值,但這不是必須的。也就是說,第一量化單元131實際上可以設(shè)定一個相對低的值作為比例因子的初始值,并逐漸增加該初始值,直到它判斷霍夫曼編碼數(shù)據(jù)的比特數(shù)量超出了預(yù)定的比特數(shù)量。當(dāng)判斷為是時,第一量化單元131確定在當(dāng)前設(shè)定的初始值之前的那個初始值為該比例因子的初始值。
還是在圖7所示的上述操作中,每個比例因子頻帶的比例因子是這樣確定的,就是使一個幀的全部霍夫曼編碼數(shù)據(jù)的比特數(shù)量小于該預(yù)定比特數(shù)量,雖然這并不是必需的。也就是說,每個比例因子都可以這樣確定,即,使每個比例因子頻帶中的每個量化數(shù)據(jù)組的比特數(shù)量小于一個預(yù)定的比特數(shù)量。
圖8是表示判斷單元137所執(zhí)行的、進(jìn)行關(guān)于一個幀內(nèi)將被共用的頻譜數(shù)據(jù)的判斷并產(chǎn)生判斷結(jié)果作為共用信息的操作的流程圖。這里,判斷單元137產(chǎn)生8個窗口的判斷結(jié)果作為由8個標(biāo)志(即8個比特)構(gòu)成的共用信息,其中表示為“0”的標(biāo)志指示一個窗口內(nèi)具有此標(biāo)志的較高頻率頻譜數(shù)據(jù)將被傳輸?shù)浇獯a裝置200,表示為“1”的標(biāo)志指示一個窗口內(nèi)具有此標(biāo)志的較高頻率頻譜數(shù)據(jù)由其他窗口的其他較高頻率頻譜數(shù)據(jù)來代表。
判斷單元137從變換單元120接收8個窗口中的第一窗口內(nèi)的頻譜數(shù)據(jù),將接收的頻譜數(shù)據(jù)輸出到第一量化單元131,并將共用信息的第一標(biāo)志(即比特)設(shè)為“0”(步驟S1)。之后,判斷單元137重復(fù)執(zhí)行循環(huán)B(步驟S2到S9)以對隨后從第二到第八的剩下七個窗口的每一個進(jìn)行判斷。
判斷單元137聚焦在一個窗口上,并計算此窗口內(nèi)的頻譜數(shù)據(jù)與距離本聚焦窗口最近且標(biāo)志為“0”的之前的窗口內(nèi)的頻譜數(shù)據(jù)之間的能量差異(步驟S3)。判斷單元137然后判斷所計算的能量差異是否小于預(yù)定的閾值(步驟S4)。
如果是,則判斷單元137確定所聚焦的窗口和之前的窗口包括相似的頻譜,因此聚焦窗口內(nèi)的較高頻率頻譜數(shù)據(jù)可以由之前窗口內(nèi)的較高頻率頻譜數(shù)據(jù)來代表。判斷單元137然后將聚焦窗口內(nèi)的較高頻率頻譜數(shù)據(jù)的值改變?yōu)椤?”(步驟S5),并將對應(yīng)于該窗口的共用信息的一個比特設(shè)為“1”(步驟S6)。另一方面,當(dāng)判斷該能量差異不小于預(yù)定閾值時,判斷單元137確定聚焦窗口內(nèi)的較高頻率頻譜數(shù)據(jù)不能被之前窗口內(nèi)的較高頻率頻譜數(shù)據(jù)來代表。在這種情況下,判斷單元137將聚焦窗口內(nèi)的所有頻譜數(shù)據(jù)原樣輸出到第一量化單元131(步驟S7),并將對應(yīng)于聚焦窗口的共用信息比特設(shè)為“0”(步驟S8)。
例如,假定判斷單元137當(dāng)前聚焦在第二窗口。則判斷單元137計算各由128個取樣構(gòu)成的第二窗口和第一窗口之間相同頻率的頻譜值的差值。然后判斷單元137合計對兩個窗口所計算的所有差值,從而規(guī)定第一窗口和第二窗口之間頻譜數(shù)據(jù)的能量差異(步驟S3),并判斷該能量差異是否小于預(yù)定的閾值(步驟S4)。
當(dāng)判斷該能量差異小于該預(yù)定閾值時,判斷單元137確定第一和第二窗口包括相似的頻譜,且第二窗口內(nèi)的較高頻率頻譜數(shù)據(jù)可以被第一窗口內(nèi)的較高頻率頻譜數(shù)據(jù)代表。因此判斷單元137將第二窗口內(nèi)的較高頻率頻譜數(shù)據(jù)值改變?yōu)椤?”(步驟S5),并將對應(yīng)于第二窗口的共用信息的一個比特設(shè)為“1”。
這樣第二窗口的判斷就結(jié)束了(步驟S9),然后判斷單元137對第三窗口執(zhí)行循環(huán)B(步驟S2)。也就是說,判斷單元137計算第一和第三窗口之間頻譜數(shù)據(jù)的能量差異(步驟S3)。更詳細(xì)的,判斷單元137計算第一窗口和第三窗口之間相同頻率的頻譜值的差值。然后判斷單元137合計所有計算的差值,以確定第一窗口和第三窗口之間頻譜數(shù)據(jù)的能量差異,并判斷該確定的能量差異是否小于預(yù)定的閾值(步驟S4)。
基于能量差異不小于預(yù)定閾值的判斷,判斷單元137確定在第一和第三窗口中的兩個頻譜彼此不相似,且第三窗口中的頻譜數(shù)據(jù)不能被第一窗口中的頻譜數(shù)據(jù)代表。這樣,判斷單元137就將第三窗口中的所有頻譜數(shù)據(jù)都原樣輸出到第一量化單元131(步驟S7),并將對應(yīng)第三窗口的共用信息比特設(shè)為“0”(步驟S8)。
這樣第三窗口的判斷就結(jié)束了(步驟S9),然后判斷單元137對第四窗口執(zhí)行循環(huán)B(步驟S2)。判斷單元137計算在第四窗口與距離第四窗口最近且標(biāo)志為“0”的之前的一個窗口(即,其頻譜數(shù)據(jù)被原樣輸出而沒有被置換為“0”)之間的頻譜數(shù)據(jù)之間的能量差異。之前的窗口就是第三窗口。這樣,判斷單元137重復(fù)執(zhí)行基于循環(huán)B的判斷,直到其結(jié)束第八個窗口的判斷,從而結(jié)束整個幀的操作。因此,該幀內(nèi)的頻譜數(shù)據(jù)被輸出到第一量化單元131,并為該幀產(chǎn)生8比特的共用信息“01011111”。該共用信息指示第一窗口內(nèi)的較高頻率頻譜數(shù)據(jù)代表第二窗口內(nèi)的較高頻率頻譜數(shù)據(jù),且第三窗口內(nèi)的較高頻率頻譜數(shù)據(jù)代表第四窗口到第八窗口的連續(xù)窗口內(nèi)的較高頻率頻譜數(shù)據(jù)。該共用信息也可以用其他方式表示。例如,當(dāng)預(yù)定包括較高頻率頻譜數(shù)據(jù)的第一窗口的全部頻譜數(shù)據(jù)都被傳輸時,共用信息的第一比特可以被省略,從而共用信息可以被表示為7個比特“101111”。判斷單元137然后將所產(chǎn)生的共用信息輸出到第二編碼單元134,并對下一幀執(zhí)行上述操作。
在上述操作中,判斷單元137使用構(gòu)成每個窗口的全部128取樣通過計算可確定兩個窗口中頻譜的能量差異,但這并不是必要的。還有可能只用兩個窗口中較高頻率的64個取樣確定能量差異。判斷單元137然后將此確定的能量差異與預(yù)定閾值相比較。
在上述操作中,判斷單元137總是原樣輸出第一窗口中的較高頻率頻譜數(shù)據(jù)而沒有將它們的值替換為“0”,但這也不是必要的。例如,判斷單元137可以在一幀內(nèi)的8個窗口中找到相對于其他7個窗口中的任一個具有最小能量差異的一個窗口。判斷單元137然后傳輸(以及量化和編碼)找到的窗口或是以能量差異值順序而排列(先從最小值開始)的預(yù)定數(shù)目的窗口中的全部頻譜數(shù)據(jù)。這樣,第一窗口中的較高頻率頻譜數(shù)據(jù)并不總是被傳送。
在上述實施例中,關(guān)于一個窗口中的較高頻率譜數(shù)據(jù)是否可以被之前窗口中的其他較高頻率頻譜數(shù)據(jù)所表示的判斷是基于兩個窗口間能量差異的計算而進(jìn)行的。然而,該判斷并不是必須基于能量差異的計算而進(jìn)行,并可能進(jìn)行以下的變型。在一個變型實施例中,在頻率軸上規(guī)定了一個窗口內(nèi)的所有頻譜數(shù)據(jù)組中具有最高絕對值的一組頻譜數(shù)據(jù)的一個位置(即,一個頻率)。在兩個窗口內(nèi)規(guī)定該頻率軸上的位置,并找到這兩個規(guī)定位置之間的差值。當(dāng)找到的差值小于一預(yù)定閾值時,判斷單元137判斷一個窗口中的較高頻率頻譜數(shù)據(jù)可以被其他窗口中的其他較高頻率頻譜數(shù)據(jù)所代表。在另一個變型實施例中,當(dāng)兩個窗口所包含的頻譜具有相同數(shù)目的峰值和/或頻率軸上峰值的位置彼此相似時,判斷單元137可以判斷一個窗口中的較高頻率頻譜數(shù)據(jù)可以被其他窗口中的其他較高頻率頻譜數(shù)據(jù)所代表??梢员容^兩個窗口的比例因子頻帶之間的這種峰值的數(shù)目和位置,并根據(jù)頻譜的相似性給出每個窗口的計分,從而依據(jù)每個窗口中頻譜的主要特性作出判斷。作為另一個變型例子,可以對兩個窗口確定窗口中具有最高絕對值的頻譜數(shù)據(jù)的一個位置。當(dāng)對兩個窗口所確定的位置彼此相似時,也可以判斷一個窗口中的較高頻率頻譜數(shù)據(jù)可以被標(biāo)志為“0”的之前的另一個窗口中的較高頻率頻譜數(shù)據(jù)所代表。在另一個變型實施例中,可以通過以下步驟進(jìn)行判斷(a)對每個窗口中的一個頻譜執(zhí)行預(yù)定的函數(shù),(b)比較兩個窗口中執(zhí)行的結(jié)果,和(c)根據(jù)此比較結(jié)果進(jìn)行上述判斷。作為另一個變型例子,還可以使單獨的一組較高頻率頻譜數(shù)據(jù)在預(yù)定的窗口之間共用而不用參考兩組較高頻率頻譜數(shù)據(jù)間的相似性。例如,在偶數(shù)窗口,如第二,第四,或第六個窗口中的頻譜數(shù)據(jù)可以代表奇數(shù)窗口中的頻譜數(shù)據(jù),反之亦然。還可以預(yù)先決定較高頻率頻譜數(shù)據(jù)的值不會被替換為“0”的窗口。例如,可以確定一個窗口,該窗口中的較高頻率頻譜數(shù)據(jù)代表其他7個窗口中的較高頻率頻譜數(shù)據(jù)。
在另一個變型實施例中,當(dāng)每個窗口在較高頻帶或整個頻帶包括多個峰值時,多個峰值的頻率被指定。然后在兩個不同窗口中被規(guī)定的頻率被相互比較以找到差異。當(dāng)每個找到的差異是在預(yù)定閾值的范圍內(nèi)時,判斷單元137就判斷一個窗口中的較高頻率頻譜數(shù)據(jù)可以被其他窗口中的較高頻率頻譜數(shù)據(jù)所代表。還可以合計所規(guī)定的每個差值,如果合計的差值小于閾值,則判斷單元137判斷較高頻率譜數(shù)據(jù)被兩個窗口所共用。
解碼裝置200接收編碼裝置100所產(chǎn)生的編碼音頻比特流,并使第一解碼單元221根據(jù)常規(guī)步驟解碼第一編碼信號以產(chǎn)生由1024個取樣構(gòu)成的量化數(shù)據(jù)。當(dāng)對應(yīng)于該量化數(shù)據(jù)的頻譜數(shù)據(jù)基于圖8中的示例步驟而產(chǎn)生的時候,第二窗口和第四到第八窗口中的較高頻率頻譜數(shù)據(jù)的所有值都為“0”。第二解量化單元224包括能夠存儲從第一解量化單元222輸出的至少一個窗口的較高頻率頻譜數(shù)據(jù)的存儲器。第二解量化單元224在對窗口的解量化期間查閱每個窗口的一個標(biāo)志。當(dāng)該標(biāo)志表示為“0”時,第二解量化單元224將從第一解量化單元222輸出的較高頻率頻譜數(shù)據(jù)放置到上述存儲器中。隨后,第二解量化單元224查閱下一個窗口的一個標(biāo)志。當(dāng)該標(biāo)志表示為“1”時,第二解量化單元224復(fù)制并輸出存儲在存儲器中的較高頻率頻譜數(shù)據(jù),然后繼續(xù)該復(fù)制直到識別出一個標(biāo)志為“0”的窗口。作為上述存儲器,可以使用常規(guī)解碼裝置400中的常規(guī)的存儲器,以便存儲對應(yīng)于一個幀的頻譜數(shù)據(jù)。因此并不需要對常規(guī)解碼裝置400提供新的存儲器。如果提供了新的存儲器來實現(xiàn)本發(fā)明,則可以在此存儲器中提供新的存儲區(qū)域,以存儲指示將被復(fù)制的窗口的開始和該窗口內(nèi)較高頻率頻譜數(shù)據(jù)的開始的指針。然而,當(dāng)解碼裝置中預(yù)先設(shè)定一個步驟從而解碼裝置可以根據(jù)上述兩個位置的頻率在存儲器中搜索這兩個位置的時候,并不需要這種新的存儲區(qū)域。當(dāng)頻譜數(shù)據(jù)的上述兩個位置的搜索時間應(yīng)當(dāng)被減少時,設(shè)置該新的存儲器是必要的。以下將參照圖9的流程圖說明第二解量化單元224的具體操作。
圖9是表示第二解量化單元224為復(fù)制較高頻率頻譜數(shù)據(jù)而執(zhí)行的操作的流程圖。這里假定第二解量化單元224具有能夠存儲至少由64個取樣構(gòu)成的較高頻率頻譜數(shù)據(jù)的存儲器。第二解量化單元224對一個幀內(nèi)的每個窗口執(zhí)行循環(huán)C(步驟S71)。也就是說,第二解量化單元224查閱該窗口的標(biāo)志。當(dāng)標(biāo)志為“0”時(步驟S72),第二解量化單元224將第一解量化單元222輸出的較高頻率頻譜數(shù)據(jù)存儲在上述存儲器中(步驟S73)。當(dāng)標(biāo)志不為“0”時(步驟S72),第二解量化單元224將存儲在存儲器中的較高頻率頻譜數(shù)據(jù)輸出到集成單元225(步驟S74)。對該幀內(nèi)的每個窗口重復(fù)執(zhí)行循環(huán)C的上述步驟(步驟S75)。
更詳細(xì)的,第二解量化單元224接收第二解碼單元223所解碼的共用信息,并查閱共用信息的對應(yīng)于當(dāng)前聚焦窗口的一個比特,以判斷該比特,即,該標(biāo)志是否為“0”(步驟S72)。如果是,表示當(dāng)前窗口的較高頻率頻譜數(shù)據(jù)的值沒有被替換為“0”,則第二解量化單元224將第一解量化單元222輸出的較高頻率頻譜數(shù)據(jù)存儲在上述存儲器中(步驟S73)。如果存儲器在這個點存儲有其他數(shù)據(jù),則第二解量化單元224更新該存儲器。另一方面,當(dāng)?shù)诙饬炕瘑卧?24判斷該標(biāo)志不為“0”時(步驟S72),就表示第一解量化單元222輸出的較高頻率頻譜數(shù)據(jù)是由“0”值構(gòu)成的。則第二解量化單元222從存儲器讀出頻譜數(shù)據(jù)并向集成單元225輸出所讀出的頻譜數(shù)據(jù)作為對應(yīng)于當(dāng)前窗口的數(shù)據(jù)(步驟S74)。結(jié)果在集成單元225中,所讀出的較高頻率頻譜數(shù)據(jù)替換了從第一解量化單元222輸出的當(dāng)前窗口的較高頻率頻譜數(shù)據(jù)。
例如,假定當(dāng)前聚焦的是第一窗口且共用信息對應(yīng)于第一窗口的第一比特(即標(biāo)志)為“0”。則第二解量化單元224將從第一解量化單元222傳送的第一窗口中的較高頻率頻譜數(shù)據(jù)寫入到存儲器中,從而存儲器被更新(步驟S73)。在這種情況下,第二解量化單元224沒有將此頻譜數(shù)據(jù)輸出到集成單元225,從而第一解量化單元222輸出的頻譜數(shù)據(jù)被輸出到集成單元225然后輸出到逆變換單元230。
在第一窗口的操作之后,聚焦第二窗口。這里假定共用信息的第二比特(即標(biāo)志)為“1”。則第二解量化單元224從存儲器讀出第一窗口的較高頻率頻譜數(shù)據(jù),并將讀出的頻譜數(shù)據(jù)作為對應(yīng)于第二窗口的較高頻率頻譜數(shù)據(jù)輸出到集成單元225(步驟S74)。另一方面,第一解量化單元222已將第二窗口的頻譜數(shù)據(jù)輸出到集成單元225。此頻譜數(shù)據(jù)在其較高頻帶內(nèi)包含有“0”值。此“0”值的較高頻率頻譜數(shù)據(jù)被集成單元225改變?yōu)樽畛醢诘谝淮翱谥胁⒈坏诙饬炕瘑卧?24從存儲器讀出的上述頻譜數(shù)據(jù)。
根據(jù)來自編碼裝置100的共用信息,解碼裝置200復(fù)制標(biāo)志為“0”的一個窗口內(nèi)的較高頻率頻譜數(shù)據(jù),并使用復(fù)制的頻譜數(shù)據(jù)作為標(biāo)志為“1”的一個窗口的較高頻率頻譜數(shù)據(jù)。
在此復(fù)制之后,如果需要還可以調(diào)整所復(fù)制的頻譜數(shù)據(jù)的幅值,雖然在上述例子中并未執(zhí)行該調(diào)整。此調(diào)整可通過將每個復(fù)制的頻譜值乘以一個預(yù)定的系數(shù),例如0.5,來實現(xiàn)。該系數(shù)可以是一個固定值,也可以根據(jù)頻帶或第一解量化單元222輸出的頻譜數(shù)據(jù)而改變。
上述系數(shù)可通過解碼裝置100預(yù)先計算,并添加至包含共用信息的第二編碼信號。作為上述系數(shù),一個比例因子或是量化數(shù)據(jù)的一個值都可以被添加到第二編碼信號。用于調(diào)整幅值的方法并不局限于上述的例子,其他調(diào)整方法也可以使用。
在上述例子中,標(biāo)志為“0”的窗口中的較高頻率頻譜數(shù)據(jù)以常規(guī)方法被量化,編碼,和傳輸,但是其他的例子也是可行的。例如,對應(yīng)于標(biāo)志為“0”的較高頻率頻譜數(shù)據(jù)可能不進(jìn)行傳輸,也就是說,所有較高頻率頻譜數(shù)據(jù)的值都被替換為“0”。相反的,對標(biāo)志為“0”的窗口中的較高頻率頻譜數(shù)據(jù)產(chǎn)生子信息,對子信息編碼,并與編碼的共用信息一起插入到第二編碼信號中。該子信息表示較高頻帶中的音頻信號,并可能包含該音頻信號的代表值。例如,該子信息可指示以下信息中的一種。
(1)較高頻帶中比例因子頻帶的比例因子,每個比例因子由較高頻帶中的每個比例因子頻帶中具有最大絕對值的頻譜數(shù)據(jù)而產(chǎn)生值為“1”的量化數(shù)據(jù)。
(2)量化數(shù)據(jù)的值,該值根據(jù)對所有的比例因子頻帶共用的一個預(yù)定比例因子,通過量化在每個比例因子頻帶中具有最大絕對值的較高頻率頻譜數(shù)據(jù)而產(chǎn)生。
(3)以下其中一個位置(a)在每個比例因子頻帶中具有最大絕對值的頻譜數(shù)據(jù);(b)在每個較高頻帶中具有最大絕對值的頻譜數(shù)據(jù)。
(4)較高頻帶中預(yù)定位置的頻譜數(shù)據(jù)值的正/負(fù)符號。
(5)用來復(fù)制較低頻帶中的頻譜數(shù)據(jù)以代表較高頻率頻譜數(shù)據(jù)(當(dāng)這兩組頻譜彼此相似時)的復(fù)制方法。
上述信息(1)~(5)中的兩個或更多可以相互結(jié)合以產(chǎn)生子信息。解碼裝置200根據(jù)該子信息而重建較高頻率頻譜數(shù)據(jù)。
以下將說明上述(1)中描述的比例因子被作為子信息的情況。
圖10表示頻譜數(shù)據(jù)的波形圖的一個具體例子,從該頻譜數(shù)據(jù)可產(chǎn)生對應(yīng)于一個基于短塊的窗口的子信息(即比例因子)。在該圖中,比例因子頻帶間的邊界在較低頻帶中以頻率軸上的短劃標(biāo)記來表示,在較高頻帶中以垂直的虛線來表示。但為了便于說明,這些邊界被簡化了,它們的實際位置與圖中所示的位置不同。
變換單元120輸出的頻譜數(shù)據(jù)中,由實線波形表示的較低頻率頻譜數(shù)據(jù)被輸出到第一量化單元131,以常規(guī)方式進(jìn)行量化。另一方面,由虛線波形表示的較高頻率頻譜數(shù)據(jù)被表示為判斷單元137計算出的子信息(即比例因子)。以下將參照圖11的流程圖說明判斷單元137產(chǎn)生該子信息的過程。
判斷單元137對11.025kHz到22.05kHz的較高頻帶內(nèi)的所有比例因子頻帶計算比例因子(步驟S11)。每個比例因子由在每個比例因子頻帶中具有最大絕對值的頻譜數(shù)據(jù)而產(chǎn)生值為“1”的量化數(shù)據(jù)。
判斷單元137確定在以高于11.025kHz的頻率開始的較高頻帶開始處的一個比例因子頻帶中具有最大絕對值的頻譜數(shù)據(jù)(即峰值)(步驟S12)。這里假定該規(guī)定的峰值的位置由圖10中的①表示,且該峰值為“256”。
判斷單元137然后將峰值“256”和原始的比例因子值以圖7所示步驟相似的方式代入預(yù)定公式中,以計算產(chǎn)生值為“1”的量化數(shù)據(jù)的一個比例因子(步驟S13)。結(jié)果,判斷單元137計算出一個比例因子,例如“24”。
之后,判斷單元137規(guī)定下一個比例因子頻帶中頻譜數(shù)據(jù)的一個峰值(步驟S12)。這里假定判斷單元137規(guī)定了圖中表示為②的位置上的一個峰值,該峰值為“312”。判斷單元137然后計算出一個比例因子,例如“32”,以量化峰值“312”從而產(chǎn)生值為“1”的量化數(shù)據(jù)(步驟S13)。
類似的,對于第三比例因子頻帶,判斷單元137計算出一個比例因子,例如“26”,以量化表示為③的峰值“288”,從而產(chǎn)生值為“1”的量化數(shù)據(jù)。對于第四比例因子頻帶,判斷單元137計算出一個比例因子,例如“18”,以量化表示為④的峰值“203”,從而產(chǎn)生值為“1”的量化數(shù)據(jù)。
當(dāng)較高頻帶中所有比例因子頻帶的比例因子以這種方式都被計算完后(步驟S14),判斷單元137將所計算的比例因子作為較高頻率頻譜數(shù)據(jù)的子信息輸出到第二編碼單元134,并結(jié)束操作。
在該子信息中,每個比例因子頻帶中的較高頻率頻譜數(shù)據(jù)由一個單獨的比例因子來表示。當(dāng)較高頻帶中的每個比例因子值由從“0”到“255”中的一個值來表示的時候,該比例因子(在圖示的例子中總數(shù)為4)可以由8個比特來表示。如果這些比例因子間的差值被霍夫曼編碼,則它們的比特量可以顯著減少。雖然這種子信息只表示較高頻帶中每個比例因子頻帶的一個比例因子,這種子信息的使用與常規(guī)方法相比顯著減少了頻譜數(shù)據(jù)的量,在常規(guī)方法中大量的較高頻率頻譜數(shù)據(jù)組被量化從而產(chǎn)生了相同大量的量化數(shù)據(jù)組。
以下說明解碼裝置200重建這種較高頻率頻譜數(shù)據(jù)的過程。解碼裝置200或者產(chǎn)生具有固定值的較高頻率頻譜數(shù)據(jù)組或者產(chǎn)生較低頻帶中每組頻譜數(shù)據(jù)的復(fù)制。解碼裝置200然后將產(chǎn)生的頻譜數(shù)據(jù)組或是復(fù)制乘以上述比例因子以重建較高頻率頻譜數(shù)據(jù)。由于上述比例因子值(如圖10所示)基本上與比例因子頻帶中的峰值成正比,因此由解碼裝置200重建的頻譜數(shù)據(jù)與由輸入到編碼裝置100的音頻信號而直接產(chǎn)生的頻譜數(shù)據(jù)基本相似。
作為另一種方法,可以規(guī)定以下(a)和(b)之間的一個比率(a)由上述固定值或者較低頻帶中頻譜數(shù)據(jù)的復(fù)制構(gòu)成的較高頻率頻譜數(shù)據(jù)的最大絕對值;(b)通過使用比例因子頻帶的一個比例因子,對值為“1”的量化數(shù)據(jù)解量化而產(chǎn)生的每個比例因子頻帶中,較高頻率頻譜數(shù)據(jù)的最大絕對值。解碼裝置200然后使用該規(guī)定的比率作為與每個比例因子頻帶中的較高頻率頻譜數(shù)據(jù)相乘的系數(shù),從而該頻譜數(shù)據(jù)以更高的準(zhǔn)確性被重建。
以上述相同的方式,較高頻率頻譜數(shù)據(jù)可以由(2)的子信息,即通過對在每個比例因子頻帶中具有最大絕對值的頻譜數(shù)據(jù)進(jìn)行量化而產(chǎn)生的量化數(shù)據(jù),來重建。
以下說明由解碼裝置200執(zhí)行的操作,當(dāng)該子信息是上述信息(3)和(4)其中一個,即以下的其中一個的時侯(a)或者是在每個比例因子頻帶中具有最大絕對值的頻譜數(shù)據(jù)的一個位置,或者是在較高頻帶中具有最大絕對值的頻譜數(shù)據(jù)的一個位置;和(b)較高頻帶中在預(yù)定位置上的一組頻譜數(shù)據(jù)值的正/負(fù)符號。解碼裝置200可產(chǎn)生一個具有預(yù)定波形的頻譜或復(fù)制較低頻帶中的一個頻譜。解碼裝置200然后調(diào)整所產(chǎn)生/復(fù)制的頻譜從而得到由子信息(3)或(4)所表示的一個波形。
當(dāng)子信息是上述信息(5)時,即用來復(fù)制較低頻帶中的頻譜數(shù)據(jù)以代表較高頻率頻譜數(shù)據(jù)(在上述兩組頻譜數(shù)據(jù)彼此相似的時候)的復(fù)制方法,判斷單元137進(jìn)行下述操作。以與規(guī)定不同窗口內(nèi)相似頻譜類似的方式,判斷單元137規(guī)定了包括與較高頻帶中的一個頻譜相類似的一個頻譜的較低頻帶中的一個比例因子頻帶。所規(guī)定的比例因子頻帶被指定一個數(shù)字,該數(shù)字被用作子信息的一部分。
當(dāng)較低頻率的頻譜以上述方式被復(fù)制,用于產(chǎn)生較高頻率的頻譜時,該復(fù)制可以在兩個方向,即從低頻部分向高頻部分的方向或相反方向,的其中一個方向上執(zhí)行。該復(fù)制方向還可以被添加至子信息(5)中。并且,在有或沒有原始較低頻率頻譜反轉(zhuǎn)的符號的情況下都可以執(zhí)行該復(fù)制。這種復(fù)制頻譜的符號也可以被添加至子信息(5)中,從而解碼裝置200通過復(fù)制子信息(5)所指示的較低頻率頻譜來重建每個比例因子頻帶中的較高頻率頻譜。由于重建的較高頻率頻譜和其原始頻譜之間的差異與較低頻帶中的差異相比表現(xiàn)為聲音差異的可能性較小,因此子信息(5)可以充分表示較高頻率頻譜的波形。
在上述例子中,判斷單元137計算量化較高頻率頻譜數(shù)據(jù)的一個比例因子以產(chǎn)生值為“1”的量化數(shù)據(jù)。然而該量化數(shù)據(jù)的值也可以不是“1”,而可以是其它預(yù)定的值。
在上述實施例中,只有比例因子被編碼作為子信息。然而還可以編碼其它的信息作為子信息,該其他信息為,例如量化數(shù)據(jù),特性頻譜位置的信息,頻譜的正/負(fù)符號的信息,和產(chǎn)生噪音的方法。這種不同類型的信息可以被結(jié)合在一起作為將被編碼的子信息。如果將,例如表示幅值比率的系數(shù)和具有最大絕對值的頻譜數(shù)據(jù)位置,與上述由頻譜數(shù)據(jù)的最大絕對值可產(chǎn)生具有預(yù)定值的量化數(shù)據(jù)的比例因子結(jié)合起來,并將該結(jié)合信息作為將被編碼的子信息,將更為有效。
上述實施例表明判斷單元137可產(chǎn)生共用信息,雖然這并不是必要的。當(dāng)本解碼裝置100不產(chǎn)生共用信息時,第二編碼單元134就不是必需的,但需要解碼裝置200來規(guī)定共用相同較高頻率頻譜數(shù)據(jù)的窗口。為此,第二解量化單元224包括用于存儲至少對應(yīng)于一個窗口的較高頻率頻譜數(shù)據(jù)的存儲器。例如,一旦第一解量化單元222結(jié)束每個窗口內(nèi)頻譜數(shù)據(jù)的解量化,第二解量化單元224就將值不為“0”的較高頻率的解量化頻譜數(shù)據(jù)的64個取樣放入存儲器。同時,第二解量化單元224從第一解量化單元222輸出的窗口中檢測包含值都為“0”的較高頻率頻譜數(shù)據(jù)的一個窗口,將檢測出的窗口與存儲器中存儲的較高頻率頻譜數(shù)據(jù)關(guān)聯(lián),并輸出存儲的頻譜數(shù)據(jù)。例如,當(dāng)向集成單元225輸出存儲的頻譜數(shù)據(jù)時,第二解量化單元224通過向集成單元225發(fā)送規(guī)定所檢測窗口的一個數(shù)字,將存儲器中存儲的較高頻率頻譜數(shù)據(jù)與檢測的窗口關(guān)聯(lián)。在集成單元225中,該發(fā)送數(shù)字所規(guī)定的窗口內(nèi)的較高頻率頻譜數(shù)據(jù)被存儲器中存儲的較高頻率頻譜數(shù)據(jù)的復(fù)制所替換。
當(dāng)執(zhí)行上述操作時,編碼裝置100不必發(fā)送一個幀的第一窗口內(nèi)的較高頻率頻譜數(shù)據(jù)。這時,編碼裝置100在該幀的前一半內(nèi)插入其較高頻率頻譜數(shù)據(jù)將被傳輸?shù)浇獯a裝置200的這些窗口。然后,一直監(jiān)視著第一解量化單元222的解量化結(jié)果的第二解量化單元224規(guī)定該第一窗口內(nèi)的較高頻率頻譜數(shù)據(jù)的值都為“0”。第二解量化單元224然后在隨后的窗口中搜索包含較高頻率頻譜數(shù)據(jù)的值都為“0”的一個窗口。找到該窗口后,第二解量化單元224將該找到窗口內(nèi)的較高頻率頻譜數(shù)據(jù)輸出到集成單元225。這時,第二解量化單元224還復(fù)制該較高頻率頻譜數(shù)據(jù),并將復(fù)制的頻譜數(shù)據(jù)存入存儲器中。之后第二解量化單元224將此復(fù)制的頻譜數(shù)據(jù)與隨后檢測的較高頻率頻譜數(shù)據(jù)的值都為“0”的一個窗口關(guān)聯(lián),并將復(fù)制輸出到集成單元225,從而值為“0”的頻譜數(shù)據(jù)被替換為復(fù)制的值。
當(dāng)使用低傳輸速率的傳輸信道時,常規(guī)的技術(shù)通常會省略較高頻率頻譜數(shù)據(jù)的傳輸。然而上述實施例的編碼裝置100可傳輸對應(yīng)于基于短塊的8個窗口中的至少一個窗口的較高頻率頻譜數(shù)據(jù)。這就使解碼裝置200在較高頻帶中也能夠以高品質(zhì)來再現(xiàn)音頻信號。并且,對于本編碼裝置100,具有相似頻譜的不同窗口可共用較高頻率頻譜數(shù)據(jù)。結(jié)果,對于較高頻率頻譜數(shù)據(jù)沒有被傳輸?shù)浇獯a裝置200的那些窗口,也可以再現(xiàn)與原始聲音類似的聲音。
上述實施例描述了44.1kHz的取樣頻率,但本發(fā)明并不局限于44.1kHz,也可以是其它的頻率。上述實施例說明了以11.025kHz開始的較高頻帶,但高頻帶和低頻帶之間的邊界也可以不是11.025kHz,而可以是其它的頻率。
在上述實施例中,ID信息被附加到共用信息等包含在音頻比特流中第二編碼信號的信息中。但是當(dāng)比特流中的一個區(qū)域,例如填充部分或DSE,只存儲由本編碼裝置100所編碼的信息,或是當(dāng)包含第二編碼信號的音頻比特流只能被本發(fā)明的解碼裝置200解碼時,此ID信息并不是必須被加入到共用信息中。在這種情況下,解碼裝置200總是從為編碼裝置100和解碼裝置200所確定的一個區(qū)域(例如填充部分)中提取第二編碼信號,并解碼共用信息。
上述實施例僅說明了使用短塊作為MDCT變換單位的情況。然而,當(dāng)使用長塊作為MDCT的塊長度時,可以將本發(fā)明的編碼裝置100和解碼裝置200的功能相應(yīng)地如常規(guī)的編碼裝置300和解碼裝置400一樣相交換。更具體的,編碼裝置100和解碼裝置200中的單元被交換并進(jìn)行以下操作。音頻信號輸入單元110提取1024個取樣,并額外提取兩組512個取樣,其中一組512取樣覆蓋之前提取的1024個取樣的一部分,而另一組512取樣覆蓋下一次提取的1024個取樣的一部分。變換單元120同時對2048個取樣執(zhí)行MDCT變換以產(chǎn)生由2048個取樣構(gòu)成的頻譜數(shù)據(jù),其中的一半(即1024個取樣)被分為預(yù)定的49個比例因子頻帶。判斷單元137從變換單元120接收所產(chǎn)生的頻譜數(shù)據(jù),并將其原樣輸出到第一量化單元131。第二編碼單元134暫時停止其操作。解碼裝置200的流輸入單元210并不從編碼的音頻比特流中提取第二編碼信號,第二解碼單元223和第二解量化單元224也暫時停止它們的操作。集成單元225從第一解量化單元222接收頻譜數(shù)據(jù),并將接收的數(shù)據(jù)原樣輸出到逆變換單元230。
通過編碼裝置100和解碼裝置200交換功能,例如一個慢拍旋律(slow tempo),就可以基于長塊被傳輸和解碼,以提供高聲音品質(zhì),而頻繁產(chǎn)生沖擊脈沖的快拍旋律(quick tempo),就可以基于短塊被傳輸和解碼以提供更好的時間分辨率。
第二實施例以下將參照圖12和13說明第二實施例的編碼裝置101和解碼裝置201,這里將重點說明與第一實施例不同的特征。圖12是表示編碼裝置101和解碼裝置201的結(jié)構(gòu)的方框圖。
編碼裝置101當(dāng)使用短塊作為MDCT的塊長度時,編碼裝置101確定包含的頻譜數(shù)據(jù)組彼此相似的兩個或更多窗口。編碼裝置101然后使其中一個確定窗口內(nèi)的一組頻譜數(shù)據(jù)代表其它確定窗口內(nèi)的其他組頻譜數(shù)據(jù)。在本實施例中,一組頻譜數(shù)據(jù)代表整個頻率范圍內(nèi)的其他頻譜數(shù)據(jù)組。從而編碼裝置101減少了編碼的音頻比特流的比特量。編碼裝置101包括音頻信號輸入單元110,變換單元120,第一量化單元131,第一編碼單元132,第二編碼單元134,判斷單元138,和流輸出單元140。
判斷單元138與第一實施例的判斷單元137的不同之處在于,本判斷單元138用于判斷一個窗口內(nèi)的頻譜數(shù)據(jù)是否代表整個頻帶內(nèi),包括較低頻帶和較高頻帶內(nèi)其他窗口的不同頻譜數(shù)據(jù)。也就是說,本實施例減少了較低頻帶內(nèi)音頻信號的數(shù)據(jù)量,其中較低頻帶要求比較高頻帶更高的準(zhǔn)確性來再現(xiàn)原始聲音。更詳細(xì)的,判斷單元138聚焦包含從變換單元120輸出的頻譜數(shù)據(jù)的8個窗口中的每一個,并判斷該聚焦窗口內(nèi)的頻譜數(shù)據(jù)是否可以被8個窗口中的其他窗口內(nèi)的其他頻譜數(shù)據(jù)來代表?;谠擃l譜數(shù)據(jù)可以被其他頻譜數(shù)據(jù)所代表的判斷,判斷單元138將該聚焦窗口內(nèi)所有頻譜數(shù)據(jù)的值都改變?yōu)椤?”,并產(chǎn)生上述共用信息。
例如,假定判斷單元138判斷第二窗口內(nèi)的頻譜數(shù)據(jù)可以被第一窗口內(nèi)的頻譜數(shù)據(jù)所代表,且從第四到第八窗口內(nèi)的頻譜數(shù)據(jù)可以被第三窗口內(nèi)的頻譜數(shù)據(jù)所代表。則判斷單元138將第二窗口和第四到第八窗口內(nèi)的所有頻譜數(shù)據(jù)的值都改變?yōu)椤?”,并輸出共用信息為“01011111”。結(jié)果,第一量化單元131量化的頻譜數(shù)據(jù)的比特量遠(yuǎn)遠(yuǎn)小于常規(guī)的頻譜數(shù)據(jù),這是因為第二窗口和第四到第八窗口內(nèi)的所有頻譜數(shù)據(jù)的值都為“0”。
解碼裝置201
解碼裝置201對編碼裝置101編碼的音頻比特流進(jìn)行解碼,并包括流輸入單元210,第一解碼單元221,第一解量化單元222,第二解碼單元223,第二解量化單元226,集成單元227,逆變換單元230,和音頻信號輸出單元240。
第二解量化單元226查閱第二解碼單元223解碼的共用信息。對于共用信息(即標(biāo)志)為“0”的一個窗口,第二解量化單元226復(fù)制已被第一解量化單元222解量化的頻譜數(shù)據(jù),并將復(fù)制的頻譜數(shù)據(jù)存入存儲器。之后,第二解量化單元226將該復(fù)制與隨后的標(biāo)志為“1”的一個窗口關(guān)聯(lián),并將復(fù)制輸出到集成單元227。
集成單元227對從第一解量化單元222輸出的頻譜數(shù)據(jù)和從第二解量化單元226輸出的頻譜數(shù)據(jù)進(jìn)行集成。該集成是以窗口為單位進(jìn)行的。
圖13表示判斷單元138如何判斷一組頻譜數(shù)據(jù)可代表不同組的頻譜數(shù)據(jù)的一個例子。該圖示出了通過圖3B所示的基于短塊進(jìn)行MDCT變換而產(chǎn)生的頻譜數(shù)據(jù)。例如,當(dāng)輸入音頻信號的取樣頻率為44.1kHz時,每個窗口中再生頻帶的范圍是從0kHz到22.05kHz,如圖所示。
正如前面所述,當(dāng)窗口是基于短塊而產(chǎn)生的時候,包含在相鄰兩個窗口中的兩組頻譜很可能具有相似的波形,因為這些窗口是以短周期被提取的。當(dāng)判斷第一和第二窗口中的頻譜彼此相似且第三窗口到第八窗口中的頻譜也彼此相似時,判斷單元138就判斷第二窗口中的頻譜數(shù)據(jù)可以被第一窗口中的頻譜數(shù)據(jù)所代表,且第四到第八窗口中的頻譜數(shù)據(jù)可以被第三窗口中的頻譜數(shù)據(jù)所代表。這樣,圖中實線波形所表示的頻譜數(shù)據(jù)被量化和編碼,以便傳輸?shù)浇獯a裝置201,而其他窗口,即第二窗口和第三到第八窗口中頻譜數(shù)據(jù)的值被替換為“0”。當(dāng)解碼裝置201接收值都為“0”的頻譜數(shù)據(jù)時,解碼裝置201就復(fù)制標(biāo)志為“0”的之前窗口中的頻譜數(shù)據(jù),并使用該復(fù)制作為接收的頻譜數(shù)據(jù)的一個重建形式。
當(dāng)較低頻帶和較高頻帶中的頻譜數(shù)據(jù)被包含相似頻譜的不同窗口所共用時,編碼音頻比特流的數(shù)據(jù)量被大大減少了。然而人類的聽覺對較低頻帶的音頻信號非常敏感,因此判斷單元138就需要比第一實施例更精確地判斷頻譜的相似性。更具體的,判斷單元138使用與第一實施例的判斷單元137基本相同的判斷方法,但本判斷單元138使用一個更低的閾值來判斷和/或使用多種判斷方法,從而進(jìn)行高度準(zhǔn)確的判斷。還應(yīng)注意本編碼裝置101不允許在未經(jīng)判斷單元137的相似性判斷的情況下向解碼裝置201單獨傳輸預(yù)定窗口內(nèi)的頻譜數(shù)據(jù),因為本實施例中由于前述原因相似性判斷不能被省略。
判斷單元138不像判斷單元137那樣必須產(chǎn)生共用信息。這種情況下,第二編碼單元134就是不必要的。這可以通過,例如以下方式來實現(xiàn)。判斷單元138規(guī)定了包含相似頻譜的窗口,并將它們歸為相同的組。然后判斷單元138產(chǎn)生關(guān)于該分組的信息,并將產(chǎn)生的信息輸出到第一量化單元131。這個組內(nèi)至少一個窗口中的頻譜數(shù)據(jù)像常規(guī)技術(shù)那樣被量化,編碼,并傳輸?shù)浇獯a裝置201。另一方面,在同一組下除了該至少一個窗口的其他窗口內(nèi)的其他頻譜數(shù)據(jù)的值被替換為“0”。注意每個組開始的一個窗口內(nèi)的頻譜數(shù)據(jù)不是必須代表同一組內(nèi)其他窗口的其他頻譜數(shù)據(jù)。同樣,一個單獨窗口內(nèi)的頻譜數(shù)據(jù)也不是必須代表同一組內(nèi)其他窗口中的其他頻譜數(shù)據(jù)。
上述分組通常是使用常規(guī)手段對短塊進(jìn)行的,因此僅作簡單說明。通過該分組,包含相似頻譜的窗口被分在同一組,在同一組下的這些窗口使用相同的比例因子。對于分組執(zhí)行與上述對窗口間共用的頻譜數(shù)據(jù)的相似性判斷類似的相似性判斷。當(dāng)取樣頻率為44.1kHz且使用短塊時,每個窗口通常被定義為包含14個比例因子頻帶,從而每個窗口內(nèi)存在14個比例因子。相應(yīng)的,當(dāng)更多的窗口被分在同一組時,將被傳輸?shù)谋壤蜃拥谋忍亓烤妥兊酶佟?br>
判斷單元138也可以計算同一組內(nèi)不同窗口內(nèi)相同頻率的頻譜值的平均值,如果這些窗口的頻譜彼此間足夠相似的話。判斷單元138對每個頻譜計算這種平均頻譜值,產(chǎn)生由整個頻率中的128個平均頻譜值構(gòu)成的一個新窗口,并將該產(chǎn)生的新窗口作為一個幀開始處的一個代表窗口。(并非必需將此代表窗口置于幀的開始處。)判斷單元138然后將同一組下其他窗口內(nèi)的頻譜值改變?yōu)椤?”,并將這些窗口輸出到第一量化單元131。
當(dāng)編碼裝置101不產(chǎn)生共用信息時,也可進(jìn)行以下操作。對于編碼裝置101和解碼裝置201,預(yù)先確定編碼裝置101只量化,編碼,和傳輸每個組開始的一個窗口內(nèi)的頻譜數(shù)據(jù)。對于同一組下其他窗口內(nèi)的頻譜數(shù)據(jù),編碼裝置101將它們的頻譜值改變?yōu)椤?”以便將它們傳輸?shù)浇獯a裝置201。解碼裝置201的第二解量化單元226復(fù)制每個組開始處的一個窗口內(nèi)的頻譜數(shù)據(jù),同時查閱關(guān)于分組的解碼信息,將復(fù)制的頻譜數(shù)據(jù)與同一組下第一窗口之后的每個窗口結(jié)合,并將其輸出到解量化單元227,然后執(zhí)行集成。
當(dāng)編碼裝置101不產(chǎn)生共用信息且第一窗口可以由替換為“0”的值構(gòu)成時,可以執(zhí)行以下操作。根據(jù)關(guān)于分組的共用信息,解碼裝置201的第二解量化單元226監(jiān)視從第一解量化單元222輸出的解量化頻譜數(shù)據(jù)。若檢測到第一解量化單元222輸出的頻譜數(shù)據(jù)的值為“0”,則第二解量化單元226在同一組下的其他窗口中搜索與檢測到的頻譜數(shù)據(jù)具有相同頻率的頻譜數(shù)據(jù),從而找到值不為“0”的頻譜數(shù)據(jù)。第二解量化單元226然后復(fù)制找到的頻譜數(shù)據(jù)的值,并將其輸出到集成單元227,然后執(zhí)行集成。
也可以進(jìn)行以下的操作。當(dāng)?shù)谝唤饬炕瘑卧?22解量化的一個窗口內(nèi)的頻譜數(shù)據(jù)的值都為“0”時,第二解量化單元226搜索同一組內(nèi)的其他窗口,以找到包含的頻譜數(shù)據(jù)值不為“0”的窗口。找到這樣的窗口后,第二解量化單元226復(fù)制找到的窗口中的頻譜數(shù)據(jù),將復(fù)制的頻譜數(shù)據(jù)與上述值為“0”的頻譜數(shù)據(jù)結(jié)合,并將復(fù)制的頻譜數(shù)據(jù)輸出到集成單元227。
被判斷單元138分組到一起的許多窗口可以包括頻譜數(shù)據(jù)值沒被替換為“0”的多個窗口,這樣的窗口組可以被輸出到第一量化單元131。這時,解碼裝置201的第二解量化單元226檢測值為“0”的頻譜數(shù)據(jù)作為第一解量化單元222解量化的結(jié)果,搜索同一組下的其他窗口以找到具有與檢測到的頻譜數(shù)據(jù)相同頻率且值不為“0”的某個特定頻譜數(shù)據(jù)。上述“某個特定頻譜數(shù)據(jù)”是下列其中一種(a)通過上述搜索第一次找到的頻譜數(shù)據(jù);(b)在搜索到的窗口中具有最大值的頻譜數(shù)據(jù);和(c)在搜索到的窗口中具有最小值的頻譜數(shù)據(jù)。第二解量化單元226然后復(fù)制該找到的某個特定頻譜數(shù)據(jù)。
當(dāng)被判斷單元138分組到一起的許多窗口中包括頻譜數(shù)據(jù)值沒被替換為“0”的上述多個窗口時,可以進(jìn)行以下操作。在解碼裝置201的第二解量化單元226檢測出值為“0”的頻譜數(shù)據(jù)作為第一解量化單元222的解量化結(jié)果之后,第二解量化單元226在同一組中搜索不包括“0”值的頻譜數(shù)據(jù)的其他窗口,以便找到以下的其中一種窗口(a)在搜索到的窗口中包含頻譜數(shù)據(jù)的最大峰值的一個窗口;(b)在搜索到的窗口中能量最大的窗口。第二解量化單元226然后復(fù)制所找到的窗口中的所有頻譜數(shù)據(jù)。
對于本實施例,當(dāng)8個窗口中的不同窗口包含彼此相似的頻譜時,這些不同的窗口共用相同的頻譜數(shù)據(jù)。這樣可以使編碼音頻比特流的數(shù)據(jù)量最小,同時使重建的頻譜數(shù)據(jù)的質(zhì)量劣化最小。
當(dāng)然如果需要也可以調(diào)整第二解量化單元226所復(fù)制的頻譜數(shù)據(jù)的幅值。這種調(diào)整可以通過將每個頻譜值乘以一個預(yù)定的系數(shù),例如“0.5”來實現(xiàn)。該系數(shù)可以是一個固定值,也可以根據(jù)頻帶或第一解量化單元222輸出的頻譜數(shù)據(jù)而改變。該系數(shù)可以不是預(yù)定的值。例如,該系數(shù)可以被作為子信息被添加至第二編碼信號。一個比例因子值或者量化數(shù)據(jù)的一個量化值都可以被用作該系數(shù)并添加到第二編碼信號中。
本實施例還可以將標(biāo)志為“0”的窗口內(nèi)的較高頻率頻譜數(shù)據(jù)的值替換為“0”,并產(chǎn)生該較高頻率頻譜數(shù)據(jù)的子信息,如第一實施例所述。這樣,第二編碼信號就包括子信息和共用信息。也就是說,對于標(biāo)志為“0”的窗口內(nèi)的頻譜數(shù)據(jù),編碼裝置102按常規(guī)操作只量化和編碼較低頻率的頻譜數(shù)據(jù)。編碼裝置101將上述窗口中的較高頻率頻譜數(shù)據(jù)看作“0”,將其量化和編碼,并像第一實施例那樣產(chǎn)生關(guān)于較高頻率頻譜數(shù)據(jù)的子信息。編碼裝置101然后編碼該子信息和共用信息。當(dāng)接收到標(biāo)志為“0”的窗口時,解碼裝置201通過以上述相同的方式解量化第一編碼信號來重建較低頻率頻譜數(shù)據(jù),并根據(jù)子信息重建較高頻率頻譜數(shù)據(jù)。對于標(biāo)志為“1”的窗口內(nèi)頻譜數(shù)據(jù)的重建,解碼裝置201可復(fù)制標(biāo)志為“0”的窗口內(nèi)全部頻率范圍的上述重建的頻譜數(shù)據(jù)。
第三實施例以下將參照圖14~17來說明第三實施例的編碼裝置102和解碼裝置202,重點說明本實施例不同于第一實施例的特征。圖14是表示編碼裝置102和解碼裝置202的結(jié)構(gòu)的方框圖。
編碼裝置102本編碼裝置102可重建產(chǎn)生“0”值的量化數(shù)據(jù)的頻譜數(shù)據(jù),因為這種頻譜數(shù)據(jù)與具有最大絕對值的頻譜數(shù)據(jù)相鄰。編碼裝置102所處理的頻譜數(shù)據(jù)是基于長塊的。所重建的頻譜數(shù)據(jù)隨后由將被傳輸?shù)浇獯a裝置202的具有較小比特量的數(shù)據(jù)來代表。編碼裝置102包括音頻信號輸入單元111,變換單元121,第一量化單元151,第一編碼單元152,第二量化單元153,第二編碼單元154,和流輸出單元160。
音頻信號輸入單元111接收數(shù)字音頻數(shù)據(jù),例如基于MPEG-2AAC的音頻數(shù)據(jù),并以44.1kHz的取樣頻率取樣。由此數(shù)字音頻數(shù)據(jù),音頻信號輸入單元110在23.2毫秒的一個周期內(nèi)提取連續(xù)的1024個取樣。音頻信號輸入單元110額外獲取兩組512個取樣,其中一組512個取樣覆蓋之前提取的1024個取樣的一部分,而另一組512個取樣覆蓋下一次提取的1024個取樣的一部分。因此音頻信號輸入單元110共獲得2048個取樣。
變換單元121從音頻信號輸入單元110接收2048個取樣,并將時域內(nèi)的2048個取樣根據(jù)MDCT變換轉(zhuǎn)換為頻域內(nèi)的頻譜數(shù)據(jù)。該頻譜數(shù)據(jù)由2048個取樣構(gòu)成并具有對稱的波形圖。因此,2048個取樣中只有一半(即1024個取樣)被用作隨后的操作。變換單元121然后將這些取樣分為對應(yīng)于比例因子頻帶的多個組,每個組都包括至少一個取樣(或者,實際情況是總數(shù)為四的倍數(shù)個取樣)。當(dāng)取樣頻率為44.1kHz時,各基于長塊的幀都包括49個比例因子頻帶。
第一量化單元151接收來自變換單元121的頻譜數(shù)據(jù),并為該頻譜數(shù)據(jù)的每個比例因子頻帶確定一個比例因子。第一量化單元151然后通過使用預(yù)定的比例因子來量化每個比例因子頻帶中的頻譜數(shù)據(jù)以產(chǎn)生量化數(shù)據(jù),并將量化數(shù)據(jù)輸出到第一編碼單元152。
第一編碼單元152接收該量化數(shù)據(jù)和用于該量化數(shù)據(jù)的比例因子,并對量化數(shù)據(jù)、比例因子的差值等進(jìn)行霍夫曼編碼,作為用于預(yù)定流的格式的第一編碼信號。
第二量化單元153監(jiān)視從第一量化單元151輸出的量化數(shù)據(jù),以便檢測每個比例因子頻帶中值為“0”的10個量化數(shù)據(jù)取樣,因為這些值是由比例因子頻帶中與具有最大絕對值的頻譜數(shù)據(jù)相鄰的頻譜數(shù)據(jù)而產(chǎn)生的。這10個取樣包括緊鄰著由最大絕對值的頻譜數(shù)據(jù)而產(chǎn)生的量化數(shù)據(jù)之前的5個取樣,和緊接在此量化數(shù)據(jù)之后的5個取樣。第二量化單元153然后從變換單元121獲得對應(yīng)于檢測到的10個頻譜數(shù)據(jù)的取樣的頻譜值,并使用在編碼裝置102和解碼裝置202之間預(yù)先確定的一個比例因子來量化所獲得的頻譜數(shù)據(jù),從而產(chǎn)生量化數(shù)據(jù)。第二量化單元153然后用較小比特量的數(shù)據(jù)表示此量化數(shù)據(jù),并向第二編碼單元154輸出該量化數(shù)據(jù)。
第二編碼單元154接收該量化數(shù)據(jù),對其進(jìn)行霍夫曼編碼,成為用于流的格式的第二編碼信號。之后,第二編碼單元154向流輸出單元160輸出該第二編碼信號。注意第二量化單元154量化使用的比例因子沒有被編碼。
流輸出單元160接收來自第一編碼單元152的第一編碼信號,加入報頭信息和其他必要的次級信息至該第一編碼信號,并將其變換為MPEG-2 AAC的比特流。流輸出單元160還接收來自第二編碼單元154的第二編碼信號,并將其放入上述MPEG-2 AAC比特流中的一個區(qū)域,該區(qū)域被常規(guī)解碼裝置忽略,或者對其未定義操作。
解碼裝置202根據(jù)解碼的第二編碼信號,解碼裝置202重建頻譜數(shù)據(jù),并由此產(chǎn)生值為“0”的量化數(shù)據(jù),因為該頻譜數(shù)據(jù)與具有最大絕對值的頻譜數(shù)據(jù)相鄰。解碼裝置202包括流輸入單元260,第一解碼單元251,第一解量化單元252,第二解碼單元253,第二解量化單元254,集成單元255,逆變換單元231,和音頻信號輸出單元241。
流輸入單元260接收來自編碼裝置102的編碼音頻比特流,從該編碼比特流中提取第一和第二編碼信號,并輸出第一和第二編碼信號分別到第一解碼單元251和第二解碼單元253。
第一解碼單元251接收第一編碼信號,即流格式的霍夫曼編碼數(shù)據(jù),并將其解碼為量化數(shù)據(jù)。
第一解量化單元252接收來自第一解碼單元251的量化數(shù)據(jù),將其解量化以產(chǎn)生22.05kHz再生頻帶的1024取樣構(gòu)成的頻譜數(shù)據(jù)。
第二解碼單元253接收來自流輸入單元260的第二編碼信號,將其解碼為由10個取樣構(gòu)成的量化數(shù)據(jù),該10個取樣是由緊鄰最大絕對值的頻譜數(shù)據(jù)之前和之后的10個頻譜數(shù)據(jù)的取樣而產(chǎn)生的。第二解碼單元253然后將該量化數(shù)據(jù)輸出到第二解量化單元254。
第二解量化單元254使用預(yù)定的比例因子對量化數(shù)據(jù)解量化,以產(chǎn)生頻譜數(shù)據(jù)的10個取樣。第二解量化單元254查閱第一解量化單元252輸出的頻譜數(shù)據(jù),以便檢測出值為“0”的10個取樣,因為這些取樣緊鄰著具有最大絕對值的頻譜值。隨后,第二解量化單元254確定所檢測的10個取樣的頻率,將產(chǎn)生的10個取樣與規(guī)定的頻率關(guān)聯(lián),并將產(chǎn)生的10個取樣輸出到集成單元225。
集成單元225對第一和第二解量化單元252和254輸出的頻譜數(shù)據(jù)一起進(jìn)行集成,并將集成后的頻譜數(shù)據(jù)輸出到逆變換單元231。更詳細(xì)的,集成單元255中,從第一解量化單元252中輸出并被上述頻率所的頻譜值被第二解量化單元254輸出的頻譜值(產(chǎn)生的10個取樣)所替換。
逆變換單元231接收來自集成單元225的由1024個取樣構(gòu)成的集成頻譜數(shù)據(jù),并對頻域內(nèi)的頻譜數(shù)據(jù)執(zhí)行IMDCT變換,使其成為時域內(nèi)的音頻信號。
音頻信號輸出單元241將逆變換單元231輸出的取樣數(shù)據(jù)組順序地結(jié)合以產(chǎn)生并輸出數(shù)字音頻數(shù)據(jù)。
如上所述,編碼裝置102使用與第一量化單元151所用的不同的另一個比例因子,對每個比例因子頻帶中緊鄰著具有最大絕對值的頻譜數(shù)據(jù)之前和之后的頻譜數(shù)據(jù)進(jìn)行編碼,從而得到的量化數(shù)據(jù)的值不為“0”,這不同于常規(guī)技術(shù),在常規(guī)技術(shù)中由最大絕對值附近的頻譜數(shù)據(jù)產(chǎn)生的量化數(shù)據(jù)的值為“0”。這樣產(chǎn)生的編碼信號可實現(xiàn)更高的聲音品質(zhì)并增加了整個再生頻帶內(nèi)峰值附近的再生信號的準(zhǔn)確性。
在上述實施例中,第二量化單元153將變換單元121輸出的頻譜數(shù)據(jù)量化,雖然第二量化單元153量化的頻譜數(shù)據(jù)并不局限于變換單元121輸出的量化數(shù)據(jù)。例如,第二量化單元153可量化第一解量化單元151輸出的量化數(shù)據(jù)解量化而產(chǎn)生的頻譜數(shù)據(jù)。執(zhí)行這種操作的編碼裝置102如圖15所示。
圖15是表示這種編碼裝置102和相應(yīng)解碼裝置202的結(jié)構(gòu)的方框圖。編碼裝置102包括音頻信號輸入單元111,變換單元121,第一量化單元151,第一編碼單元152,第二量化單元156,第二編碼單元154,解量化單元155,和流輸出單元160。
第二量化單元156通過解量化單元155監(jiān)視第一量化單元151的量化結(jié)果,以便確定產(chǎn)生“0”值頻譜數(shù)據(jù)的10個頻譜數(shù)據(jù)取樣,因為這些取樣與最大絕對值的頻譜數(shù)據(jù)相鄰。第二量化單元156然后從解量化單元155獲得確定的10個頻譜數(shù)據(jù)的取樣,并使用一個預(yù)定的比例因子對它們進(jìn)行量化。
解量化單元155對從第一量化單元151輸出的量化數(shù)據(jù)進(jìn)行解量化以產(chǎn)生頻譜數(shù)據(jù),并向第二量化單元156輸出所產(chǎn)生的頻譜數(shù)據(jù)和原始的頻譜數(shù)據(jù)。
以下將參照圖16和17說明上述編碼裝置102和解碼裝置202的處理過程。
當(dāng)編碼裝置102的第一量化單元151使用所確定的一個比例因子以常規(guī)技術(shù)執(zhí)行量化從而使每個編碼幀的比特量限制在傳輸信道的傳輸速率范圍內(nèi)時,與具有最大絕對值的頻譜數(shù)據(jù)相鄰的頻譜數(shù)據(jù)往往會變?yōu)椤?”值的量化數(shù)據(jù)。當(dāng)解碼裝置202解碼此量化數(shù)據(jù)時,得到的頻譜數(shù)據(jù)在最大絕對值的頻譜數(shù)據(jù)附近的值也為“0”,該最大絕對值的頻譜數(shù)據(jù)是被單獨地準(zhǔn)確重建的。這種值為“0”的頻譜數(shù)據(jù)會引起量化誤差,這將降低再現(xiàn)音頻信號的質(zhì)量。
當(dāng)比例因子被調(diào)整以避免與最大絕對值的頻譜數(shù)據(jù)相鄰的頻譜數(shù)據(jù)的值變?yōu)椤?”,然后用調(diào)整后的比例因子執(zhí)行量化的時候,得到的量化數(shù)據(jù)會具有非常大的值。這是不希望出現(xiàn)的,特別是當(dāng)編碼音頻比特流通過傳輸信道傳輸?shù)臅r候,因為編碼音頻比特流的比特量很可能會根據(jù)量化數(shù)據(jù)的最大值而增加。
圖16是表示常規(guī)編碼裝置300和本發(fā)明的編碼裝置102關(guān)于具體值的量化結(jié)果的差異的表500。對于常規(guī)編碼裝置300,量化單元331從變換單元320接收,例如包括值{10,40,100,30}的頻譜數(shù)據(jù)501,并使用根據(jù)編碼音頻比特流的一個幀的比特量而確定的一個比例因子來量化此頻譜數(shù)據(jù)501。結(jié)果,產(chǎn)生了例如包括值{0,0,1,0}的量化數(shù)據(jù)502。與頻譜數(shù)據(jù)的最大值“100”相鄰的頻譜數(shù)據(jù)的值被變換為“0”值的量化數(shù)據(jù)。常規(guī)的編碼裝置300編碼此量化數(shù)據(jù)502,該量化數(shù)據(jù)502被編碼并傳輸至解碼裝置400。當(dāng)解碼裝置400的解量化單元422對該量化數(shù)據(jù)502解量化時,得到的頻譜數(shù)據(jù)505的值為{0,0,100,0}。
另一方面,對于本發(fā)明的編碼裝置102,當(dāng)?shù)谝涣炕瘑卧?51接收來自變換單元121的包括值{10,40,100,30}的上述頻譜數(shù)據(jù)501,并量化頻譜數(shù)據(jù)501時,得到的量化數(shù)據(jù)與上述包括值{0,0,1,0}的量化數(shù)據(jù)502相同。此量化數(shù)據(jù)502然后被原樣輸出到第一編碼單元152。為了補(bǔ)充量化數(shù)據(jù)502,本編碼裝置102還包括第二量化單元153/156,該第二量化單元使用一個預(yù)定的比例因子量化上述頻譜數(shù)據(jù)501。第二量化單元153/156產(chǎn)生例如包括值{1,4,10,3}的量化數(shù)據(jù)。在量化數(shù)據(jù)503的這些值中,最小值為“1”,因此降低當(dāng)前比例因子從而使該最小值為“0”。相應(yīng)地,該量化數(shù)據(jù)503由不包括最大值附近“0”值的可能的最小值構(gòu)成,雖然量化數(shù)據(jù)503的最大值為“10”,這是不夠低的。
相應(yīng)的,第二量化單元153/156使用一個指數(shù)函數(shù)或類似的函數(shù)來表示量化數(shù)據(jù)503以減少量化數(shù)據(jù)503的比特量。因此第二量化單元153/156產(chǎn)生例如包括值{1,2,0,2}的量化數(shù)據(jù)504。
更詳細(xì)的,該量化數(shù)據(jù)504的第一個值“1”表示“2”,作為“2”的“1”次方,第二個值“2”表示“4”,作為“2”的“2”次方,第三個值“0”表示最大絕對值的頻譜數(shù)據(jù)是由此量化值而產(chǎn)生的。最大絕對值的頻譜數(shù)據(jù)可以由第一編碼信號而準(zhǔn)確地重建,該第一編碼信號包括第一量化單元151所使用的一個比例因子和值為“1”的量化數(shù)據(jù)。因為第二編碼單元154不編碼每個比例因子頻帶中最大絕對值的頻譜數(shù)據(jù),所以得到的第二編碼信號的比特量被進(jìn)一步減少。量化數(shù)據(jù)504的第四個值“2”表示“4”,作為“2”的“2”次方。雖然包括值{1,2,0,2}的此量化數(shù)據(jù)504與包括值{1,4,10,3}的量化數(shù)據(jù)503不匹配,量化數(shù)據(jù)504仍可以只使用兩個比特來代表所有的值。解碼裝置202由從第一編碼信號獲得的量化數(shù)據(jù)502和從第二編碼信號獲得的量化數(shù)據(jù)504來重建頻譜數(shù)據(jù)。結(jié)果,得到了包括值{20,40,100,40}的頻譜數(shù)據(jù)505。
對于上述編碼裝置102,從第二量化單元153/156輸出的量化數(shù)據(jù)由較小比特量的數(shù)據(jù)來代表,從而使第二編碼信號的比特量最小化。并且,由解碼裝置202重建的頻譜數(shù)據(jù)與原始頻譜數(shù)據(jù)即使在峰值附近也大致相同,雖然這種峰值附近的頻譜數(shù)據(jù)為了減少編碼數(shù)據(jù)的比特量,通常只被重建為“0”值。因此本編碼裝置102實現(xiàn)了原始聲音更準(zhǔn)確的再現(xiàn)。
在上述實施例中,由第二量化單元153產(chǎn)生的量化數(shù)據(jù)由基數(shù)“2”的指數(shù)來表示。然而該基數(shù)并不局限于“2”,也可以是其他值,包括不是整數(shù)的其他值。使用指數(shù)函數(shù)來表示第二量化單元153的量化數(shù)據(jù)也并非必需,其他函數(shù)也可以被使用。
圖17A~17C表示編碼裝置102校正量化中的誤差的一個例子。圖17A表示從圖14和15所示的變換單元121輸出的頻譜的一部分的波形圖。在圖17A中,最外側(cè)的兩個垂直虛線表示一個比例因子頻帶(表示為“sfb”),在該比例因子頻帶內(nèi)的中央的垂直虛線表示該比例因子頻帶內(nèi)具有最大絕對值的頻譜數(shù)據(jù)的一個頻率。該中線兩側(cè)是兩個虛線,表示與最大絕對值的頻譜數(shù)據(jù)相鄰的10個頻譜數(shù)據(jù)取樣的范圍。圖17B表示作為圖17A所示的頻譜數(shù)據(jù)的量化結(jié)果的、由圖14和15所示的第一量化單元151產(chǎn)生的量化數(shù)據(jù)的例子。圖17C表示作為圖17A所示的頻譜數(shù)據(jù)的量化結(jié)果的、由圖14和15所示的第二量化單元153/156產(chǎn)生的量化數(shù)據(jù)的例子。在圖17A~17C中,水平軸表示頻率。圖17A中的垂直軸表示頻譜值,圖17B和17C中的垂直軸表示量化數(shù)據(jù)的量化值。
比例因子頻帶中的多組頻譜數(shù)據(jù)被歸一化并使用對整個比例因子頻帶共用的一個比例因子來量化。當(dāng)此比例因子是根據(jù)整個幀的比特量來確定且該頻譜數(shù)據(jù)的最大絕對值如圖17A所示相對很大的時候,很可能最大絕對值的頻譜數(shù)據(jù)變成值不為“0”的量化數(shù)據(jù)如圖17B所示,但同一頻帶中的其他頻譜數(shù)據(jù)的值一般都為“0”。這種量化數(shù)據(jù)從第一量化單元151輸出到第一編碼單元152。對于本編碼裝置102,圖17C所示的量化數(shù)據(jù)也是由第二量化單元153/156產(chǎn)生的,并作為第二編碼信號被傳輸?shù)浇獯a裝置202。也就是說,第二量化單元153/156由最大絕對值的頻譜數(shù)據(jù)而產(chǎn)生具有“0”值的量化數(shù)據(jù),同時第二量化單元153/156還量化與此頻譜數(shù)據(jù)相鄰的10個取樣。
第二量化單元153/156使用一個預(yù)定的比例因子進(jìn)行量化。當(dāng)此預(yù)定的比例因子恰好與第一量化單元151使用的一個比例因子相近時,如果第一量化單元151產(chǎn)生的量化數(shù)據(jù)值為“0”的話,得到的量化數(shù)據(jù)很可能值為“0”。因此適用于每個比例因子頻帶的一個比例因子被預(yù)先確定以提供給第二量化單元153/156,以便當(dāng)?shù)谝涣炕瘑卧?51產(chǎn)生的量化數(shù)據(jù)值為“0”時,在更多的比例因子頻帶中得到如圖17C所示非零值的量化數(shù)據(jù)。
也就是說,第二量化單元153/156由變換單元121或解量化單元155得到如圖17B所示被第一量化單元151量化的頻譜數(shù)據(jù)。第二量化單元153/156然后使用一個預(yù)定的比例因子量化得到的頻譜數(shù)據(jù)以產(chǎn)生量化數(shù)據(jù),使量化數(shù)據(jù)由較小比特量的數(shù)據(jù)來表示,并將其輸出到第二編碼單元154。從而第二量化單元153/156通過以下三個措施使第二編碼信號的比特量最小化(1)對編碼裝置102和解碼裝置202使用預(yù)先確定的比例因子和函數(shù),從而比例因子和函數(shù)不需要被編碼;(2)不量化最大絕對值的頻譜數(shù)據(jù);和(3)使用一個函數(shù)來表示由與最大絕對值的頻譜數(shù)據(jù)相鄰的10個頻譜數(shù)據(jù)取樣而產(chǎn)生的量化數(shù)據(jù)。
在上述實施例中,第二量化單元153/156量化兩組連續(xù)的5個頻譜數(shù)據(jù)取樣。然而第二量化單元153/156量化的頻譜數(shù)據(jù)取樣并非必須是連續(xù)排列的,如果它們得到的量化值“0”出現(xiàn)在由最大絕對值的頻譜數(shù)據(jù)而產(chǎn)生的量化值的附近的話。更具體的,第二量化單元153/156查閱第一量化單元151的量化結(jié)果,以便確定存在于具有最大絕對值并由此產(chǎn)生“0”值的量化數(shù)據(jù)組的頻譜數(shù)據(jù)兩側(cè)的5個頻譜數(shù)據(jù)取樣。第二量化單元153/156然后使用所述的預(yù)定比例因子來量化所確定的頻譜數(shù)據(jù)取樣,以產(chǎn)生量化數(shù)據(jù),用較少量的比特代表該量化數(shù)據(jù),并將這些比特輸出到第二編碼單元154。解碼裝置202的第二解量化單元254監(jiān)視第一解量化單元252產(chǎn)生的解量化的頻譜數(shù)據(jù),并確定位于最大絕對值的解量化頻譜數(shù)據(jù)兩側(cè)的上述“0”值的5個頻譜數(shù)據(jù)取樣。第二解量化單元254還解量化第二編碼信號中的量化數(shù)據(jù)以產(chǎn)生頻譜數(shù)據(jù),將此頻譜數(shù)據(jù)與規(guī)定的10個取樣結(jié)合,并將其輸出到集成單元255。
第二量化單元153量化的頻譜數(shù)據(jù)的取樣數(shù)目并不局限于包括兩組5個取樣的數(shù)目10,該兩組5個取樣位于最大絕對值的頻譜數(shù)據(jù)兩側(cè)。這些取樣的數(shù)目可以更少也可以大于5個。第二量化單元153還可以根據(jù)每個幀的編碼比特流的比特量而確定這些取樣的數(shù)目。在這種情況下,該取樣的數(shù)目和這些取樣的量化數(shù)據(jù)可以被包含在第二編碼信號中。
在本實施例中,第二量化單元153/156使用一個預(yù)定的比例因子進(jìn)行量化。然而也可以對每個比例因子頻帶計算一個適當(dāng)?shù)谋壤蜃?,并使每個計算的比例因子包含在第二編碼信號中。例如,通過計算可以產(chǎn)生最大值“7”的量化數(shù)據(jù)的一個比例因子,傳輸量化數(shù)據(jù)所要求的數(shù)據(jù)的比特量可以被減少。
在本實施例中,第二編碼信號只包括第二量化單元153/156產(chǎn)生的量化數(shù)據(jù)或者這種量化數(shù)據(jù)和比例因子。然而第二編碼信號還可能包括其他信息。也就是說,編碼裝置102也可以產(chǎn)生表示較高頻率頻譜數(shù)據(jù)的子信息,如第一實施例所述,以及使用一個預(yù)定的比例因子來量化10個頻譜數(shù)據(jù)取樣,以產(chǎn)生量化數(shù)據(jù)。該量化數(shù)據(jù)和該子信息包含在第二編碼信號中。在這種情況下,編碼裝置102就不傳輸較高頻率頻譜數(shù)據(jù)及其比例因子,并且解碼裝置202根據(jù)子信息來重建較高頻率頻譜數(shù)據(jù)。在圖10和11中以及第一實施例的末尾已描述了用于短塊的子信息。用于長塊的子信息也可以通過與用于短塊的子信息相同的方式來產(chǎn)生,除了用于長塊的子信息對應(yīng)于較高頻帶中的512個取樣,而用于短塊的子信息對應(yīng)于較高頻帶中的64個取樣。基于長塊的取樣被放置到基于長塊的比例因子頻帶中。當(dāng)?shù)谌龑嵤├凶有畔⒁赃@種方式被添加時,編碼音頻比特流的比特量可以通過較高頻率量化數(shù)據(jù)的比特量和比例因子被減少。
上面描述的子信息是為每個比例因子頻帶而產(chǎn)生的。然而也可以為兩個或更多的比例因子頻帶產(chǎn)生單獨一組子信息。也可以為單獨一個比例因子頻帶產(chǎn)生兩組子信息。
本實施例的子信息可對每個信道或者對兩個或更多信道編碼。
在上述情況下,根據(jù)子信息來復(fù)制較低頻帶中的頻譜數(shù)據(jù)以重建較高頻率頻譜數(shù)據(jù)并不是必需的。相反,較高頻率頻譜數(shù)據(jù)可以只由第二編碼信號來產(chǎn)生。
本發(fā)明的編碼裝置102和解碼裝置202,可以簡單地通過為常規(guī)的編碼裝置增加第二量化單元153/156和第二編碼單元154,以及為常規(guī)的解碼裝置增加第二解碼單元253和第二解量化單元254而實現(xiàn)。從而不需要過多的改變常規(guī)編碼和解碼裝置的結(jié)構(gòu)就可以實現(xiàn)編碼裝置102和解碼裝置202。
通過使用常規(guī)MPEG-2 AAC作為一個例子已經(jīng)描述了第三實施例,然而其它的音頻編碼方法,包括最新研究的編碼方法,都可以被用于本發(fā)明。
第三實施例的第二編碼信號可以被附加在第一編碼信號的尾端,如第一實施例的圖5B所示,或者被附加在報頭信息的尾部,如圖5C所示。然而應(yīng)注意,本發(fā)明的第一編碼信號是基于長塊的,因此一個幀的第一編碼信號對應(yīng)于1024個取樣構(gòu)成的音頻信號。當(dāng)常規(guī)解碼裝置400以這種方式接收包含在編碼音頻比特流中的第二編碼信號時,解碼裝置400可無誤差的再現(xiàn)編碼音頻比特流。第二編碼信號可以被插入第一編碼信號或報頭信息中。編碼比特流中第二編碼信號被插入的區(qū)域可以不連續(xù)的排列,也可以是分散的,如圖6C所示,其中第二編碼信號被插入到報頭信息和第一編碼信號中的不連續(xù)區(qū)域。還可以將第二編碼信號和第一編碼信號包含在分離的比特流中,如圖6A,6B所示。從而有可能預(yù)先傳輸或累積音頻信號的基本部分,如果需要再隨后傳輸較高頻帶中音頻信號的信息。
第三實施例已描述了包含兩個量化單元和兩個編碼單元的編碼裝置102。然而編碼裝置102也可以包含三個或更多個量化單元和編碼單元。
類似的,解碼裝置202可以包括三個或更多個解量化單元和解碼單元,雖然第三實施例描述了包括兩個解量化單元和兩個解碼單元的解碼裝置102。
本發(fā)明描述的操作不僅可以通過硬件實現(xiàn)也可以用軟件實現(xiàn)?;蛘卟糠植僮饔糜布崿F(xiàn)而剩余部分用軟件實現(xiàn)。
本發(fā)明的編碼裝置100,101,102可以被安裝在內(nèi)容分配系統(tǒng)內(nèi)的廣播站中,并可以將本發(fā)明的編碼音頻特流傳輸?shù)桨ń獯a裝置200,201或202的內(nèi)容分配系統(tǒng)的一個接收裝置。
工業(yè)實用性本發(fā)明的編碼裝置可以用于作為衛(wèi)星廣播,包括BS(廣播衛(wèi)星)和CS(通信衛(wèi)星)的廣播站使用的音頻編碼裝置,或者作為通過通信網(wǎng)絡(luò)例如因特網(wǎng),來分配內(nèi)容的內(nèi)容分配服務(wù)器使用的音頻編碼裝置。本編碼裝置作為通用計算機(jī)進(jìn)行音頻信號編碼所執(zhí)行的程序也是非常有用的。
本發(fā)明的解碼裝置不僅可以用于作為家用STB中提供的音頻解碼裝置,而且可以作為通用計算機(jī)進(jìn)行音頻信號解碼所執(zhí)行的程序,STB或通用計算機(jī)中的電路板和LSI,以及STB或通用計算機(jī)中插入的IC卡。
權(quán)利要求
1.一種接收和編碼音頻信號的編碼裝置,包括變換單元,用于以預(yù)定的時間間隔提取一部分接收的音頻信號,并變換所提取的每個部分以在每個幀周期內(nèi)產(chǎn)生多個窗口頻譜,其中所產(chǎn)生的窗口頻譜由短塊組成,并表示出頻率頻譜隨著時間是如何變化的;判斷單元,用于將窗口頻譜相互比較,以判斷在所比較的窗口頻譜中是否存在預(yù)定程度的相似性;替換單元,用于在判斷單元判斷存在相似性時,將所產(chǎn)生的窗口頻譜中的一第一窗口頻譜的高頻部分替換為一個預(yù)定值,其中該第一窗口頻譜和同樣是所產(chǎn)生的窗口頻譜之一的一第二窗口頻譜共用第二窗口頻譜的高頻部分;第一量化單元,用于量化多個窗口頻譜,以在替換單元的操作之后產(chǎn)生多個量化的窗口頻譜;第一編碼單元,用于編碼量化的窗口頻譜以產(chǎn)生第一編碼數(shù)據(jù);和輸出單元,用于輸出所產(chǎn)生的第一編碼數(shù)據(jù)。
2.如權(quán)利要求1的編碼裝置,還包括平均單元,用于(a)為每個頻率確定第一和第二窗口頻譜的高頻部分的一個平均值,以產(chǎn)生由多個所確定的平均值構(gòu)成的新的高頻部分,(b)將第二窗口頻譜的高頻部分替換為新的高頻部分,其中第一量化單元在平均單元和替換單元的操作之后量化每個窗口頻譜。
3.如權(quán)利要求1的編碼裝置,還包括共用信息產(chǎn)生單元,用于產(chǎn)生表示判斷單元對多個窗口頻譜的每一個的判斷結(jié)果的共用信息;和第二編碼單元,用于編碼所產(chǎn)生的共用信息以產(chǎn)生第二編碼數(shù)據(jù),其中輸出單元還輸出該第二編碼數(shù)據(jù)。
4.如權(quán)利要求3的編碼裝置,其中判斷單元確定多個窗口頻譜間一個能量差異,并在所確定的能量差異小于一個預(yù)定閾值時判斷存在相似性。
5.如權(quán)利要求3的編碼裝置,其中判斷單元確定頻率軸上多個窗口頻譜的每一個的一個峰值的位置,將窗口頻譜的所確定位置相互比較,并根據(jù)比較結(jié)果做出判斷。
6.如權(quán)利要求3的編碼裝置,其中判斷單元使用一個預(yù)定的函數(shù)變換多個窗口頻譜,將變換的窗口頻譜相互比較,并根據(jù)比較結(jié)果做出判斷。
7.如權(quán)利要求3的編碼裝置,還包括,子信息產(chǎn)生單元,用于產(chǎn)生表示第二窗口頻譜的高頻部分特性的子信息,其中第二編碼單元將所產(chǎn)生的子信息和共用信息編碼,以產(chǎn)生第二編碼數(shù)據(jù),和替換單元也將第二窗口頻譜的高頻部分替換為一個預(yù)定的值。
8.如權(quán)利要求7的編碼裝置,其中多個窗口頻譜的每一個被分為多個頻帶,和子信息產(chǎn)生單元對第二窗口頻譜的高頻部分的每個頻帶計算一個歸一化因子,并使用每個計算的歸一化因子作為子信息,其中每個計算的歸一化因子被用于量化每個頻帶中的一個峰值,從而產(chǎn)生在高頻部分的所有頻帶中都相同的一個量化值。
9.如權(quán)利要求7的編碼裝置,其中多個窗口頻譜的每一個被分為多個頻帶,和子信息產(chǎn)生單元使用所有頻帶共用的一個歸一化因子來量化第二窗口頻譜的高頻部分中每個頻帶的一個峰值,并將該量化結(jié)果用作為子信息。
10.如權(quán)利要求7的編碼裝置,其中多個窗口頻譜的每一個被分為多個頻帶,和子信息產(chǎn)生單元確定頻率軸上的一個位置,在該位置存在第二窗口頻譜的高頻部分的每個頻帶中的一個峰值,并將每個所確定的位置用作為子信息。
11.如權(quán)利要求7的編碼裝置,其中多個窗口頻譜的每一個都是一個修正的離散余弦變換(MDCT)的系數(shù),并被分為多個頻帶,和子信息產(chǎn)生單元確定第二窗口頻譜的高頻部分中頻率軸上的預(yù)定位置上存在的一個值的正/負(fù)符號,并將該確定的正/負(fù)符號用作為子信息。
12.如權(quán)利要求7的編碼裝置,其中多個窗口頻譜的每一個被分為多個頻帶,和子信息產(chǎn)生單元(a)對高頻部分的每個頻帶的頻譜產(chǎn)生確定了第二窗口頻譜的低頻部分中的一個頻譜的信息,其中每個確定的頻譜都最相似于第二窗口頻譜的高頻部分的一個頻帶內(nèi)的一個頻譜,和(b)將所產(chǎn)生的信息用作為子信息。
13.如權(quán)利要求12的編碼裝置,其中子信息產(chǎn)生單元所產(chǎn)生的信息被表示為識別該確定頻譜的一個數(shù)字。
14.如權(quán)利要求3的編碼裝置,其中輸出單元包括流輸出單元,用于(a)將第一編碼數(shù)據(jù)變換為具有預(yù)定格式的編碼音頻流,(b)將第二編碼數(shù)據(jù)放置到編碼音頻流中允許預(yù)定格式的自由使用的一個區(qū)域中,和(c)輸出該編碼音頻流。
15.如權(quán)利要求14的編碼裝置,還包括信息添加單元,用于將識別信息添加至第二編碼數(shù)據(jù),該識別信息表示第二編碼數(shù)據(jù)是由第二編碼單元產(chǎn)生的,其中流輸出單元將已添加了識別信息的第二編碼數(shù)據(jù)放置到編碼音頻流的區(qū)域中。
16.如權(quán)利要求3的編碼裝置,其中輸出單元還包括第二流輸出單元,用于(a)將第一編碼數(shù)據(jù)變換為具有預(yù)定格式的編碼音頻流,(b)將第二編碼數(shù)據(jù)放置到不同于存有第一編碼數(shù)據(jù)的編碼音頻流的第二流中,和(c)輸出該第二流和音頻流。
17.如權(quán)利要求1的編碼裝置,其中當(dāng)判斷單元判斷存在相似性時,替換單元還將第一窗口頻譜的一個低頻部分替換為一個預(yù)定的值。
18.如權(quán)利要求1的編碼裝置,其中多個窗口頻譜中的每一個由多組數(shù)據(jù)構(gòu)成,和編碼裝置還包括第二量化單元,用于以一預(yù)定的歸一化因子來量化輸入給第一量化單元的每個窗口頻譜中峰值附近的特定組數(shù)據(jù),其中在第二量化單元的量化之前,第一量化單元量化該特定組數(shù)據(jù)以產(chǎn)生具有預(yù)定值的多組量化數(shù)據(jù);和第二編碼單元,用于編碼第二量化單元所量化的多組數(shù)據(jù),從而產(chǎn)生第二編碼數(shù)據(jù),其中輸出單元輸出該第二編碼數(shù)據(jù)和第一編碼數(shù)據(jù)。
19.如權(quán)利要求18的編碼裝置,其中在產(chǎn)生多組量化數(shù)據(jù)之后,第二量化單元使用一個預(yù)定的函數(shù)來變換該多組量化數(shù)據(jù),從而該多組量化數(shù)據(jù)在被編碼后比特量減少。
20.如權(quán)利要求19的編碼裝置,其中多個窗口頻譜的每一個被分為多個頻帶,第一量化單元對每個頻帶執(zhí)行量化,和第二量化單元不量化每個頻帶中的一個峰值并用一個預(yù)定的值來表示該峰值。
21.如權(quán)利要求20的編碼裝置,其中第二量化單元還包括因子確定單元,用于確定第二量化單元所使用的歸一化因子,以產(chǎn)生具有預(yù)定比特量的多組量化數(shù)據(jù),和第二量化單元使用該確定的歸一化因子來量化該特定組數(shù)據(jù)以產(chǎn)生預(yù)定比特量的多組量化數(shù)據(jù),并輸出該多組量化數(shù)據(jù)和所確定的歸一化因子。
22.一種接收和解碼表示音頻信號的編碼數(shù)據(jù)的解碼裝置,其中該編碼數(shù)據(jù)包括第一區(qū)域內(nèi)的第一編碼數(shù)據(jù),該解碼裝置包括第一解碼單元,用于解碼第一區(qū)域內(nèi)的第一編碼數(shù)據(jù)以產(chǎn)生第一解碼數(shù)據(jù);第一解量化單元,用于解量化第一解碼數(shù)據(jù)以在每個幀周期內(nèi)產(chǎn)生多個窗口頻譜,其中所產(chǎn)生的窗口頻譜由短塊組成,并表示出頻率頻譜隨著時間是如何變化的;判斷單元,用于(a)監(jiān)視所產(chǎn)生的窗口頻譜,從而找到其高頻部分由預(yù)定值組成的一第一窗口頻譜,(b)判斷該第一窗口頻譜的高頻部分將由包含在多個窗口頻譜中的一第二窗口頻譜的高頻部分來重建;第二解量化單元,用于(a)從第一解量化單元獲得第二窗口頻譜的高頻部分,(b)復(fù)制所獲得的高頻部分,(c)將復(fù)制的高頻部分與第一窗口頻譜相關(guān)聯(lián),(d)輸出所復(fù)制的高頻部分;和音頻信號輸出單元,用于(a)從第二解量化單元獲得所復(fù)制的高頻部分,并從第一解量化單元獲得第一窗口頻譜,(b)將第一窗口頻譜的高頻部分替換為復(fù)制的高頻部分,(c)將包含替換的高頻部分的第一窗口頻譜變換為時域內(nèi)的音頻信號,(d)輸出該音頻信號。
23.如權(quán)利要求22的解碼裝置,其中解碼裝置所接收的編碼數(shù)據(jù)還包括,在第二區(qū)域中的關(guān)于第一窗口頻譜和第二窗口頻譜的編碼共用信息,和該解碼裝置還包括分離單元,用于從接收的編碼數(shù)據(jù)的第二區(qū)域中分離出編碼的共用信息;第二解碼單元,用于解碼所分離的共用信息以獲得解碼的共用信息,其中第二解量化單元根據(jù)該解碼的共用信息進(jìn)行操作。
24.如權(quán)利要求23的解碼裝置,其中解碼裝置所接收的編碼數(shù)據(jù)還包括,第二區(qū)域中的表示第二窗口頻譜的高頻部分特性的編碼子信息,分離單元還從接收的編碼數(shù)據(jù)的第二區(qū)域中分離出編碼子信息,第二解碼單元還解碼該分離的編碼子信息以獲得解碼的子信息,第二解量化單元根據(jù)解碼子信息和共用信息而產(chǎn)生第二窗口頻譜的高頻部分,將所產(chǎn)生的高頻部分與第一窗口頻譜相關(guān)聯(lián),并輸出該產(chǎn)生的高頻部分,和音頻信號輸出單元將第一窗口頻譜的高頻部分替換為所產(chǎn)生的高頻部分,并將包含所產(chǎn)生的高頻部分的第一窗口頻譜變換為時域內(nèi)的音頻信號,并輸出該音頻信號。
25.如權(quán)利要求24的解碼裝置,其中多個窗口頻譜的每一個被分為多個頻帶,子信息是第二窗口頻譜的高頻部分的每個頻帶的一個歸一化因子,其中每個歸一化因子被用于量化高頻部分的每個頻帶中的一個峰值,從而產(chǎn)生該高頻部分的所有頻帶中都相同的一個量化值,和第二解量化單元使用解碼子信息中所示的每個歸一化因子來解量化每個頻帶中的量化值以得到每個峰值,并產(chǎn)生第二窗口頻譜的包括將每個獲得峰值作為每個頻帶中峰值的高頻部分。
26.如權(quán)利要求24的解碼裝置,其中多個窗口頻譜的每一個被分為多個頻帶,該子信息是第二窗口頻譜的高頻部分中每個頻帶內(nèi)的一個量化峰值,每個量化峰值使用高頻部分中所有頻帶共用的一個歸一化因子被量化,第二解量化單元使用該單獨的歸一化因子來解量化顯示為子信息的每個量化峰值以得到每個峰值,并產(chǎn)生第二窗口頻譜的包括將每個獲得峰值作為每個頻帶中峰值的高頻部分。
27.如權(quán)利要求24的解碼裝置,其中多個窗口頻譜的每一個被分為多個頻帶,子信息表示在頻率軸上第二窗口頻譜的高頻部分的每個頻帶中的峰值存在的一個位置,和第二解量化單元產(chǎn)生高頻部分,在該高頻部分中每個頻帶中的一個峰值出現(xiàn)在該子信息所示位置上。
28.如權(quán)利要求24的解碼裝置,其中多個窗口頻譜的每一個都是一個修正離散余弦變換(MDCT)的系數(shù),并被分為多個頻帶,子信息是存在于第二窗口頻譜的高頻部分中頻率軸的預(yù)定位置上的一個值的正/負(fù)符號,和第二解量化單元產(chǎn)生預(yù)定位置上包含具有解碼子信息所示正/負(fù)符號的值的高頻部分。
29.如權(quán)利要求24的解碼裝置,其中多個窗口頻譜的每一個被分為多個頻帶,子信息對高頻部分每個頻帶的一個頻譜確定了第二窗口頻譜低頻部分中的一個頻譜,其中每個所確定的頻譜與第二窗口頻譜高頻部分的頻帶中的一個頻譜最相似,和第二量化單元(a)從第一解量化單元產(chǎn)生的低頻部分的頻譜中找到由子信息所確定的每個頻譜,(b)復(fù)制每個找到的頻譜以產(chǎn)生多個復(fù)制頻譜,和(c)產(chǎn)生第二窗口頻譜中由產(chǎn)生的復(fù)制頻譜構(gòu)成的高頻部分。
30.如權(quán)利要求23的解碼裝置,其中由解碼裝置接收的編碼數(shù)據(jù)是具有預(yù)定格式的編碼音頻流,第二區(qū)域是允許預(yù)定格式的自由使用的一個區(qū)域,分離單元從第二區(qū)域中分離出包括編碼共用信息的數(shù)據(jù),和第二解碼單元分析該分離的數(shù)據(jù),并只對編碼共用信息進(jìn)行解碼,即使在被分析的分離數(shù)據(jù)包括識別編碼共用信息的識別信息時。
31.如權(quán)利要求23的解碼裝置,其中根據(jù)解碼的共用信息,第二解量化單元復(fù)制整個第二窗口頻譜并將復(fù)制的第二窗口頻譜與第一窗口頻譜相關(guān)聯(lián),和音頻信號輸出單元將第一窗口頻譜替換為復(fù)制的第二窗口頻譜,并將該替換的第一窗口頻譜變換為時域內(nèi)的音頻信號。
32.如權(quán)利要求22的解碼裝置,其中第二解量化單元用一預(yù)定的系數(shù),放大第二窗口頻譜的復(fù)制高頻部分的幅值,并將具有放大幅值的復(fù)制高頻部分與第一窗口頻譜相關(guān)聯(lián),并輸出該復(fù)制的高頻部分。
33.如權(quán)利要求22的解碼裝置,其中當(dāng)找到由都具有一個預(yù)定值的多組數(shù)據(jù)構(gòu)成的一個窗口頻譜時,判斷單元判斷該找到的窗口頻譜的高頻部分將由第二窗口頻譜的高頻部分來重建,根據(jù)判斷單元的判斷結(jié)果,第二解量化單元從第一解量化單元獲得包括高頻和低頻部分的整個第二窗口頻譜,復(fù)制所獲得的第二窗口頻譜,將復(fù)制的第二窗口頻譜與找到的窗口頻譜相關(guān)聯(lián),并輸出該復(fù)制的第二窗口頻譜,和音頻信號輸出單元將整個找到的窗口頻譜替換為復(fù)制的第二窗口頻譜,將替換的窗口頻譜變換為時域內(nèi)的音頻信號,并輸出該音頻信號。
34.如權(quán)利要求22的解碼裝置,其中解碼裝置所接收的編碼數(shù)據(jù)還包括第二編碼數(shù)據(jù),該數(shù)據(jù)是通過用一預(yù)定的歸一化因子量化一部分窗口頻譜而產(chǎn)生的,該預(yù)定的歸一化因子不同于第一編碼數(shù)據(jù)中量化相同的窗口頻譜所使用的歸一化因子,和解碼裝置還可包括第二分離單元,用于從接收的編碼數(shù)據(jù)的第二區(qū)域中分離出第二編碼數(shù)據(jù);第二解碼單元,用于解碼分離的第二編碼數(shù)據(jù)以獲得第二解碼數(shù)據(jù),其中第二解量化單元還可以(a)監(jiān)視由第一解量化單元產(chǎn)生的多個窗口頻譜,從而找到一個窗口頻譜中連續(xù)地包含預(yù)定值的一部分,(b)確定對應(yīng)于找到部分并包含在第二解碼數(shù)據(jù)中的一個部分,(c)使用該預(yù)定的歸一化因子來解量化該確定部分,以獲得由多組數(shù)據(jù)構(gòu)成的解量化部分,音頻信號輸出單元還可以(a)將第二解量化單元找到的部分替換為多組數(shù)據(jù),(b)將包含多組數(shù)據(jù)的窗口頻譜變換為時域內(nèi)的音頻信號,(c)輸出該音頻信號。
35.如權(quán)利要求34的解碼裝置,其中第二解量化單元使用一個預(yù)定的函數(shù)來變換第二解碼數(shù)據(jù)的所確定部分,然后解量化該變換部分以獲得解量化部分。
36.如權(quán)利要求35的解碼裝置,其中自第二解碼數(shù)據(jù),第二解量化單元可以(a)提取預(yù)定的歸一化因子和用該預(yù)定歸一化因子量化的確定部分,(b)使用該預(yù)定函數(shù)來變換所提取的部分以產(chǎn)生一個變換部分,(c)使用該提取的歸一化因子來解量化該變換部分,以獲得解量化部分。
37.一種程序,可使計算機(jī)作為接收和編碼音頻信號的編碼裝置操作,包括變換步驟,用于以預(yù)定的時間間隔提取一部分接收的音頻信號,并變換所提取的每個部分以在每個幀周期內(nèi)產(chǎn)生多個窗口頻譜,其中所產(chǎn)生的窗口頻譜由短塊組成,并表示出頻率頻譜隨著時間是如何變化的;判斷步驟,用于將窗口頻譜相互比較,以判斷在所比較的窗口頻譜中是否存在預(yù)定程度的相似性;替換步驟,用于在判斷步驟判斷存在相似性時,將所產(chǎn)生的窗口頻譜中的一第一窗口頻譜的高頻部分替換為一個預(yù)定值,其中第一窗口頻譜和同樣是所產(chǎn)生的窗口頻譜之一的一第二窗口頻譜共用第二窗口頻譜的高頻部分;第一量化步驟,用于量化多個窗口頻譜以在替換步驟之后產(chǎn)生多個量化的窗口頻譜;第一編碼步驟,用于編碼量化的窗口頻譜以產(chǎn)生第一編碼數(shù)據(jù);和輸出步驟,用于輸出所產(chǎn)生的第一編碼數(shù)據(jù)。
38.一種程序,可使計算機(jī)作為接收和解碼表示音頻信號的編碼數(shù)據(jù)的解碼裝置操作,包括第一解碼步驟,用于解碼接收的編碼數(shù)據(jù)中的第一編碼數(shù)據(jù)以產(chǎn)生第一解碼數(shù)據(jù);第一解量化步驟,用于解量化第一解碼數(shù)據(jù)以在每個幀周期內(nèi)產(chǎn)生多個窗口頻譜,其中所產(chǎn)生的窗口頻譜由短塊組成,并表示出頻率頻譜隨著時間是如何變化的;判斷步驟,用于(a)監(jiān)視所產(chǎn)生的窗口頻譜,從而找到其高頻部分由預(yù)定值組成的一第一窗口頻譜,(b)判斷該第一窗口頻譜的高頻部分將由包含在多個窗口頻譜中的一第二窗口頻譜的一個高頻部分來重建;第二解量化步驟,用于(a)獲得第一解量化步驟中產(chǎn)生的第二窗口頻譜的高頻部分,(b)復(fù)制所獲得的高頻部分,(c)將復(fù)制的高頻部分與第一窗口頻譜結(jié)合,(d)輸出所復(fù)制的高頻部分;和音頻信號輸出步驟,用于(a)獲得第二解量化步驟中輸出的復(fù)制高頻部分,和第一解量化步驟中產(chǎn)生的第一窗口頻譜,(b)將第一窗口頻譜的高頻部分替換為復(fù)制的高頻部分,(c)將包含替換的高頻部分的第一窗口頻譜變換為時域內(nèi)的音頻信號,(d)輸出該音頻信號。
39.一種記錄介質(zhì),其中存儲的一個程序可使計算機(jī)作為接收和編碼音頻信號的編碼裝置操作,該程序包括變換步驟,用于以預(yù)定的時間間隔提取一部分接收的音頻信號,并變換所提取的每個部分以在每個幀周期內(nèi)產(chǎn)生多個窗口頻譜,其中所產(chǎn)生的窗口頻譜由短塊組成,并表示出頻率頻譜隨著時間是如何變化的;判斷步驟,用于將窗口頻譜相互比較,以判斷在所比較的窗口頻譜中是否存在預(yù)定程度的相似性;替換步驟,用于在判斷步驟判斷存在相似性時,將所產(chǎn)生的窗口頻譜中的一第一窗口頻譜的高頻部分替換為一個預(yù)定值,其中第一窗口頻譜和同樣是所產(chǎn)生的窗口頻譜之一的一第二窗口頻譜共用第二窗口頻譜的高頻部分;第一量化步驟,用于量化多個窗口頻譜以在替換步驟之后產(chǎn)生多個量化的窗口頻譜;第一編碼步驟,用于編碼量化的窗口頻譜以產(chǎn)生第一編碼數(shù)據(jù);和輸出步驟,用于輸出所產(chǎn)生的第一編碼數(shù)據(jù)。
40.一種記錄介質(zhì),其中存儲的一個程序可使計算機(jī)作為接收和解碼表示音頻信號的編碼數(shù)據(jù)的解碼裝置操作,該程序包括第一解碼步驟,用于解碼接收的編碼數(shù)據(jù)中的第一編碼數(shù)據(jù)以產(chǎn)生第一解碼數(shù)據(jù);第一解量化步驟,用于解量化第一解碼數(shù)據(jù)以在每個幀周期內(nèi)產(chǎn)生多個窗口頻譜,其中所產(chǎn)生的窗口頻譜由短塊組成,并表示出頻率頻譜隨著時間是如何變化的;判斷步驟,用于(a)監(jiān)視所產(chǎn)生的窗口頻譜,從而找到其高頻部分由預(yù)定值組成的一第一窗口頻譜,(b)判斷該第一窗口頻譜的高頻部分將由包含在多個窗口頻譜中的一第二窗口頻譜的一個高頻部分來重建;第二解量化步驟,用于(a)獲得第一解量化步驟中產(chǎn)生的第二窗口頻譜的高頻部分,(b)復(fù)制所獲得的高頻部分,(c)將復(fù)制的高頻部分與第一窗口頻譜相關(guān)聯(lián),(d)輸出所復(fù)制的高頻部分;和音頻信號輸出步驟,用于(a)獲得第二解量化步驟中輸出的復(fù)制高頻部分,和第一解量化步驟中產(chǎn)生的第一窗口頻譜,(b)將第一窗口頻譜的高頻部分替換為復(fù)制的高頻部分,(c)將包含替換的高頻部分的第一窗口頻譜變換為時域內(nèi)的音頻信號,(d)輸出該音頻信號。
41.一種包括一編碼裝置和一解碼裝置的音頻數(shù)據(jù)分配系統(tǒng),其中該編碼裝置通過記錄介質(zhì)和傳輸信道中的一種以低比特率將包含編碼音頻數(shù)據(jù)的比特流傳輸?shù)皆摻獯a裝置,其中該編碼裝置包括變換單元,用于以預(yù)定的時間間隔提取一部分接收的音頻信號,并變換所提取的每個部分以在每個幀周期內(nèi)產(chǎn)生多個窗口頻譜,其中所產(chǎn)生的窗口頻譜由短塊組成,并表示出頻率頻譜隨著時間是如何變化的;判斷單元,用于將窗口頻譜相互比較,以判斷在所比較的窗口頻譜中是否存在預(yù)定程度的相似性;替換單元,用于在判斷單元判斷存在相似性時,將所產(chǎn)生的窗口頻譜中的一第一窗口頻譜的高頻部分替換為一個預(yù)定值;其中該第一窗口頻譜和同樣是所產(chǎn)生的窗口頻譜之一的一第二窗口頻譜共用第二窗口頻譜的高頻部分;第一量化單元,用于量化多個窗口頻譜以在替換單元的操作之后產(chǎn)生多個量化的窗口頻譜;第一編碼單元,用于編碼量化的窗口頻譜以產(chǎn)生編碼數(shù)據(jù);和輸出單元,用于輸出所產(chǎn)生的編碼數(shù)據(jù),其中該解碼裝置,包括第一解碼單元,用于解碼包括在從編碼裝置輸出的編碼數(shù)據(jù)的一第一區(qū)域內(nèi)的第一編碼數(shù)據(jù)以產(chǎn)生第一解碼數(shù)據(jù);第一解量化單元,用于解量化第一解碼數(shù)據(jù)以在每個幀周期內(nèi)產(chǎn)生多個窗口頻譜,其中所產(chǎn)生的窗口頻譜由短塊組成,并表示出頻率頻譜隨著時間是如何變化的;判斷單元,用于(a)監(jiān)視所產(chǎn)生的窗口頻譜,從而找到其高頻部分具有預(yù)定值的一第一窗口頻譜,(b)判斷該第一窗口頻譜的高頻部分將由第二窗口頻譜的高頻部分來重建;第二解量化單元,用于(a)由第一解量化單元獲得第二窗口頻譜的高頻部分,(b)復(fù)制所獲得的高頻部分,(c)將復(fù)制的高頻部分與第一窗口頻譜相關(guān)聯(lián),(d)輸出所復(fù)制的高頻部分;和音頻信號輸出單元,用于(a)從第二解量化單元獲得復(fù)制的高頻部分,和從第一解量化單元獲得第一窗口頻譜,(b)將第一窗口頻譜的高頻部分替換為復(fù)制的高頻部分,(c)將包含替換的高頻部分的第一窗口頻譜變換為時域內(nèi)的音頻信號,(d)輸出該音頻信號。
全文摘要
一種編碼裝置(100),包括變換單元(120),用于以預(yù)定的時間間隔提取一部分輸入的音頻信號,并變換所提取的每個部分以產(chǎn)生由短塊組成的多個窗口;判斷單元(137)用于將窗口頻譜相互比較以判斷是否存在預(yù)定程度的相似性,當(dāng)存在相似性時將所產(chǎn)生的窗口中的一第一窗口的高頻部分替換為值“O”;其中該第一窗口和同樣是所產(chǎn)生的窗口之一的一第二窗口共用第二窗口的高頻部分;第一量化單元(131)用于在替換操作之后量化所產(chǎn)生的窗口,第一編碼單元(132)用于編碼量化的窗口以產(chǎn)生編碼數(shù)據(jù);和流輸出單元(140),用于輸出所產(chǎn)生的編碼數(shù)據(jù)。
文檔編號G10L21/038GK1484822SQ02803419
公開日2004年3月24日 申請日期2002年10月30日 優(yōu)先權(quán)日2001年11月2日
發(fā)明者西尾孝 , 西尾孝祐, 則松武志, 志, 津島峰生, 生, 也, 田中直也 申請人:松下電器產(chǎn)業(yè)株式會社