專利名稱:編碼設(shè)備,解碼設(shè)備以及音頻數(shù)據(jù)分配系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種壓縮/編碼和擴(kuò)展/解碼音頻信號(hào)從而再生高質(zhì)量的聲音的技術(shù)。
背景技術(shù):
近年來,出現(xiàn)了多種音頻信號(hào)的壓縮/編碼和擴(kuò)展/解碼的方法。MPEG-2高級(jí)音頻編碼(以后被稱為“MPEG-2 AAC”或“AAC”)就是一種這樣的技術(shù)。(參看“IS13818-7”(MPEG-2高級(jí)音頻編碼,AAC)作者M(jìn).Bosi等,1997年4月)。
附圖1是一個(gè)方框圖,表明根據(jù)傳統(tǒng)的AAC方法的編碼設(shè)備和解碼設(shè)備的功能結(jié)構(gòu)。
編碼設(shè)備1000是一個(gè)根據(jù)AAC編碼方法壓縮和編碼輸入音頻信號(hào)的設(shè)備,該設(shè)備包括一個(gè)A/D轉(zhuǎn)換器1050,一個(gè)音頻信號(hào)輸入單元1100,一個(gè)變換單元1200,一個(gè)量化單元1400,一個(gè)編碼單元以及一個(gè)流輸出單元1900。
A/D轉(zhuǎn)換器1050以例如22.05kHz的采樣頻率對(duì)輸入信號(hào)進(jìn)行采樣,并將模擬音頻信號(hào)轉(zhuǎn)換成一個(gè)數(shù)字音頻數(shù)據(jù)串。每當(dāng)音頻輸入單元1100讀取了輸入信號(hào)的音頻數(shù)據(jù)串的1024個(gè)取樣的時(shí)候(這些1024個(gè)取樣以后被稱為一“幀”),它將音頻數(shù)據(jù)串分離成2048個(gè)數(shù)據(jù)取樣,這些取樣數(shù)據(jù)具有兩組各一半的取樣,用于在該幀被覆蓋前后所獲得的幀(512)。
變換單元1200對(duì)在時(shí)間域由音頻數(shù)據(jù)輸入單元1100分離的2048個(gè)數(shù)據(jù)取樣執(zhí)行改進(jìn)離散余弦變換(MDCT),將其變換成頻率域的頻譜數(shù)據(jù)。頻譜數(shù)據(jù)的1024個(gè)取樣,即變換獲得的頻譜數(shù)據(jù)的一半,表示11.025kHz或者更小的再生帶寬,并且被分為多個(gè)組。每個(gè)組都被設(shè)定從而包括一個(gè)或者多個(gè)頻譜數(shù)據(jù)取樣。而且,每個(gè)組模擬人類聽覺的臨界帶寬,其被稱為一個(gè)“比例因子頻帶(scale factorband)”。
量化單元1400在比例因子頻帶內(nèi)量化變換單元1200所產(chǎn)生的頻譜數(shù)據(jù),在每一個(gè)比例因子頻帶內(nèi)利用一個(gè)標(biāo)準(zhǔn)化因子將其量化為預(yù)定數(shù)目比特。該標(biāo)準(zhǔn)化因子被稱為一個(gè)“比例因子”。而且,利用每一個(gè)比例因子對(duì)每個(gè)頻譜數(shù)據(jù)進(jìn)行量化的結(jié)果被稱為一個(gè)“量化值”。編碼單元1500根據(jù)霍夫曼編碼編碼量化單元1400量化的數(shù)據(jù),就是每一個(gè)比例因子,以及使用該比例因子量化的頻譜數(shù)據(jù)。
流輸出單元1900將產(chǎn)生于編碼單元1500的編碼信號(hào)變換成一個(gè)AAC比特流格式,并將其輸出。從編碼設(shè)備1000輸出的比特流通過傳輸介質(zhì)或者記錄介質(zhì)被傳送到編碼設(shè)備2000。
解碼設(shè)備2000是一個(gè)解碼編碼設(shè)備1000編碼的比特流的設(shè)備,該設(shè)備包括一個(gè)流輸入單元2100,一個(gè)解碼單元2200,一個(gè)解量化單元2300,一個(gè)逆變換單元2800,一個(gè)音頻數(shù)據(jù)輸出單元2900以及一個(gè)D/A轉(zhuǎn)換器2950。
流輸入單元2100通過傳輸介質(zhì)或者通過記錄介質(zhì)接收編碼設(shè)備1000編碼的比特流,并且從接收的比特流中讀取編碼信號(hào)。解碼單元200然后解碼霍夫曼編碼的信號(hào)從而產(chǎn)生量化數(shù)據(jù)。
解量化單元2300利用比例因子對(duì)解碼單元2200解碼的量化數(shù)據(jù)進(jìn)行解量化。逆變換單元2800對(duì)解量化單元2300產(chǎn)生的頻率域的頻譜數(shù)據(jù)的1024個(gè)取樣執(zhí)行逆改進(jìn)離散余弦變換(IMDCT),將其變換成時(shí)間域的1024個(gè)取樣的音頻數(shù)據(jù)。音頻數(shù)據(jù)輸出單元2900順序合并逆變換單元2800產(chǎn)生的時(shí)間域的1024個(gè)取樣的音頻數(shù)據(jù),并且以時(shí)間順序逐個(gè)輸出這組1024個(gè)取樣的音頻數(shù)據(jù)。D/A轉(zhuǎn)換器2950以22.05kHz的采樣頻率將數(shù)字音頻數(shù)據(jù)轉(zhuǎn)換成模擬音頻數(shù)據(jù)。
在上述的根據(jù)傳統(tǒng)AAC標(biāo)準(zhǔn)的編碼設(shè)備1000以及解碼設(shè)備2000中,每一個(gè)取樣數(shù)據(jù)能夠被壓縮為1比特或者更小。此外,由于在低頻帶內(nèi)的1024個(gè)頻譜數(shù)據(jù)取樣被編碼,這些取樣具有較高的聽覺優(yōu)先級(jí),所以音頻數(shù)據(jù)能夠以相對(duì)較高的質(zhì)量被再生,低頻帶表示為11.025kHz或者更小的再生帶寬,其為采樣頻率的一半。
但是,在根據(jù)傳統(tǒng)的AAC方法(現(xiàn)有技術(shù)1)的編碼設(shè)備1000和解碼設(shè)備2000中,由于采樣頻率是22.05kHz,將被編碼的頻譜數(shù)據(jù)中沒有在11.025kHz以上帶寬內(nèi)的數(shù)據(jù)。因此就存在著一個(gè)問題,期望聽到包括在11.025kHz以上帶寬內(nèi)的更高質(zhì)量的聲音的要求就無法被滿足。
為了解決這一問題,考慮將圖1中的應(yīng)用于編碼設(shè)備1000中的A/D轉(zhuǎn)換器1050以及解碼設(shè)備2000的D/A轉(zhuǎn)換器2950的采樣頻率提高到22.05kHz的一倍,就是44.1kHz(現(xiàn)有技術(shù)2)。
但是,如果采樣頻率為44.1kHz,位于高于11.025kHz以上的較高頻帶寬內(nèi)的512個(gè)頻譜數(shù)據(jù)取樣能夠被編碼,同時(shí)保持一個(gè)壓縮比例,但是在低頻帶內(nèi)的具有聽覺較高優(yōu)先級(jí)的頻譜數(shù)據(jù)就會(huì)降低為一半,就是512個(gè)取樣。換句話說,采樣頻率與低頻帶內(nèi)的頻譜數(shù)據(jù)的數(shù)目是呈交替變換(trade-off)的關(guān)系的,二者無法同時(shí)被提高。因此就產(chǎn)生了另一個(gè)問題就是整體的聲音質(zhì)量被劣化了。
這種問題在根據(jù)其它方法(例如MP3.AC3等)的編碼設(shè)備和解碼設(shè)備中都會(huì)出現(xiàn)。
本發(fā)明被設(shè)計(jì)用于解決上述的問題,并且本發(fā)明的目的是提供一種能夠?qū)崿F(xiàn)高質(zhì)量的聲音再生同時(shí)不增加編碼后的數(shù)據(jù)量的編碼設(shè)備和解碼設(shè)備。
發(fā)明內(nèi)容
為了實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明的編碼設(shè)備是一種能夠編碼音頻數(shù)據(jù)的編碼設(shè)備,包括一個(gè)分離單元,用于將音頻數(shù)據(jù)流分離成一個(gè)固定數(shù)目的連續(xù)音頻數(shù)據(jù);一個(gè)變換單元,用于將分離的音頻數(shù)據(jù)變換成頻率域的頻譜數(shù)據(jù);一個(gè)劃分單元,用于將變換單元獲得的頻譜數(shù)據(jù)劃分成在頻率f1Hz或者更低的低頻帶的頻譜數(shù)據(jù)以及在高于f1Hz的高頻帶寬內(nèi)的頻譜數(shù)據(jù);一個(gè)低頻帶編碼單元用于量化低頻帶內(nèi)劃分的頻譜數(shù)據(jù)并且編碼該量化數(shù)據(jù);一個(gè)子信息產(chǎn)生單元,用于產(chǎn)生表明來自于高頻帶內(nèi)的劃分的頻譜數(shù)據(jù)的高頻帶的頻譜特性;一個(gè)高頻帶編碼單元,用于編碼產(chǎn)生的子信息;以及一個(gè)輸出單元,用于集成(integrate)低頻帶編碼單元產(chǎn)生的編碼以及高頻帶編碼單元產(chǎn)生的編碼,并且輸出集成碼,其中f1是采樣頻率f2的一半或者更小,在頻率f2處產(chǎn)生音頻數(shù)據(jù)串。
在根據(jù)本發(fā)明的編碼設(shè)備中,變換單元輸出分離單元所分離的音頻數(shù)據(jù)中的在f1或者更低的低頻帶內(nèi)的頻譜數(shù)據(jù),同時(shí),輸出高于f1的高頻帶內(nèi)的頻譜數(shù)據(jù)。被劃分單元?jiǎng)澐值牡皖l帶內(nèi)的頻譜數(shù)據(jù)被量化和編碼,高頻帶內(nèi)的頻譜數(shù)據(jù)被編碼成表示高頻帶的特性的子信息。高頻帶編碼單元編碼產(chǎn)生的子信息。因此,高頻帶內(nèi)的音頻信號(hào)能夠被編碼從而再生高質(zhì)量的聲音,此外低頻帶寬內(nèi)的音頻信號(hào)能夠以與向下采樣(down-sampling)同樣的方式被編碼,而基本上不增加數(shù)據(jù)的總量。
這里,f1是f2/4,并且變換單元能夠?qū)⒁纛l數(shù)據(jù)變換成0~2×f1Hz,劃分單元能夠?qū)?~2×f1Hz的頻譜數(shù)據(jù)劃分成在頻率f1Hz或者更低的低頻帶的頻譜數(shù)據(jù)以及在f1Hz以上直至2×f1Hz的高頻帶內(nèi)的頻譜數(shù)據(jù)。或者,在頻率f1Hz或者更低的低頻帶的頻譜數(shù)據(jù)包括n個(gè)頻譜數(shù)據(jù)取樣,分離單元能夠?qū)⒁纛l數(shù)據(jù)串分離成用于產(chǎn)生2×n個(gè)頻譜數(shù)據(jù)取樣所需數(shù)目的音頻數(shù)據(jù),變換單元能夠?qū)澐值囊纛l數(shù)據(jù)變換成2×n個(gè)頻譜數(shù)據(jù)取樣,劃分單元能夠?qū)?×n個(gè)頻譜數(shù)據(jù)取樣劃分成低頻帶內(nèi)的n個(gè)頻譜數(shù)據(jù)取樣以及高頻帶內(nèi)的n個(gè)頻譜數(shù)據(jù)取樣。或者,分離單元能夠?qū)⒁纛l數(shù)據(jù)串分離成2×n個(gè)頻譜數(shù)據(jù)取樣,這些頻譜數(shù)據(jù)取樣包括與作為一個(gè)編碼單元的一幀相對(duì)應(yīng)的n個(gè)音頻數(shù)據(jù)取樣以及在該幀之前和之后的鄰近的兩幀中的兩組n/2個(gè)音頻數(shù)據(jù)取樣,變換單元對(duì)分離的2×n個(gè)音頻數(shù)據(jù)取樣執(zhí)行MDCT,將其變換成包括2×n個(gè)頻譜數(shù)據(jù)取樣的0~2×f1Hz的頻譜。
而且,根據(jù)本發(fā)明的解碼設(shè)備是一個(gè)能夠解碼經(jīng)記錄介質(zhì)或者傳輸介質(zhì)輸入的編碼數(shù)據(jù)的設(shè)備,包括一個(gè)抽取單元,用于抽取包含在編碼數(shù)據(jù)中的低頻帶的編碼數(shù)據(jù)以及高頻帶的編碼數(shù)據(jù);一個(gè)低頻帶解量化單元,用于解碼和解量化由抽取單元抽取的低頻帶的編碼數(shù)據(jù),從而輸出在頻率f1Hz或者更低的低頻帶的頻譜數(shù)據(jù);一個(gè)子信息解碼單元,用于解碼由抽取單元抽取的高頻帶的編碼數(shù)據(jù),從而產(chǎn)生表明高頻帶的頻譜數(shù)據(jù)特性的子信息;一個(gè)高頻帶解量化單元,用于基于子信息解碼單元產(chǎn)生的子信息,輸出高頻帶內(nèi)的頻譜數(shù)據(jù);一個(gè)集成單元,用于集成低頻帶解量化單元輸出的低頻帶的頻譜數(shù)據(jù)和高頻帶解量化單元輸出的高頻帶的頻譜數(shù)據(jù);一個(gè)逆變換單元,用于將集成單元集成的頻譜數(shù)據(jù)逆變換成時(shí)間域的音頻數(shù)據(jù);一個(gè)音頻數(shù)據(jù)輸出單元,用于基于時(shí)間順序輸出逆變換單元逆變換的音頻數(shù)據(jù)。
在根據(jù)本發(fā)明的解碼設(shè)備中,抽取單元從輸入的編碼數(shù)據(jù)中抽取低頻帶編碼數(shù)據(jù)和高頻帶編碼數(shù)據(jù),低頻帶解量化單元輸出頻率f1Hz或者更低的低頻帶的頻譜數(shù)據(jù)。子信息解碼單元解碼子信息,并且高頻帶解量化單元輸出基于子信息的高頻帶的頻譜數(shù)據(jù)。這樣,能夠利用與傳統(tǒng)方法幾乎相同數(shù)量的較少的數(shù)據(jù)來解碼遠(yuǎn)遠(yuǎn)大于傳統(tǒng)方法的數(shù)據(jù),同時(shí)音頻信號(hào)能夠被解碼從而再生高質(zhì)量的聲音。
應(yīng)當(dāng)注意,本發(fā)明當(dāng)然能夠作為一種包括上述的編碼設(shè)備和解碼設(shè)備的通信系統(tǒng)來實(shí)現(xiàn),也能夠作為包括在上述的編碼設(shè)備,解碼設(shè)備以及通信系統(tǒng)的特征單元中所執(zhí)行的步驟的一種編碼方法,一種解碼方法和通信方法來實(shí)現(xiàn),作為一種令CPU用作為上述的編碼設(shè)備,解碼設(shè)備和通信系統(tǒng)的特征單元或者其中的步驟的編碼程序和解碼程序來實(shí)現(xiàn),或者作為一種其上記錄著這些程序的計(jì)算機(jī)可讀記錄介質(zhì)來實(shí)現(xiàn)。
本發(fā)明的這些以及其它的目的,優(yōu)點(diǎn)和特點(diǎn)將從隨后與附圖共同說明中變得清楚,這些附圖表明了本發(fā)明的一個(gè)特定實(shí)施例。其中附圖1是一個(gè)表明根據(jù)傳統(tǒng)的AAC方法的編碼設(shè)備和解碼設(shè)備的功能結(jié)構(gòu)的方框圖。
附圖2是一個(gè)表明根據(jù)本發(fā)明的廣播系統(tǒng)的功能結(jié)構(gòu)的方框圖。
附圖3A和3B是表明在附圖2所示的編碼設(shè)備中所處理的音頻信號(hào)的狀態(tài)變化的示意圖。
附圖4是表明圖2所示的第一量化單元所執(zhí)行的比例因子確定處理中的一操作流程圖。
附圖5是表明圖2所示的第一量化單元所執(zhí)行的比例因子確定處理中的另一個(gè)操作流程圖。
附圖6是表明附圖2所示的第二量化單元所產(chǎn)生的子信息(比例因子)的具體實(shí)施例的頻譜波形圖。
附圖7是表明圖2所示的第二量化單元所執(zhí)行的子信息(比例因子)計(jì)算處理的操作流程圖。
附圖8A~8C是表明圖2所示的流輸出單元存儲(chǔ)的子信息的比特流區(qū)域的圖。
附圖9A和9B表明圖2所示的流輸出單元存儲(chǔ)的子信息的比特流區(qū)域的其它實(shí)施例的圖。
附圖10A和10B表明圖2所示的編碼設(shè)備與現(xiàn)有技術(shù)1的編碼設(shè)備的處理過程的比較。
附圖11A和11B表明圖2所示的編碼設(shè)備與現(xiàn)有技術(shù)2的編碼設(shè)備的處理過程的比較。
附圖12表明圖2所示的編碼設(shè)備與現(xiàn)有技術(shù)1和2的編碼設(shè)備的頻譜數(shù)據(jù)和特性的比較。
附圖13是表明圖2所示的第二解量化單元將低頻率帶寬內(nèi)的1024個(gè)頻譜數(shù)據(jù)以前向方向復(fù)制到高頻帶的處理過程流程圖。
附圖14是表明圖2所示的第二解量化單元將低頻率帶寬內(nèi)的1024個(gè)頻譜數(shù)據(jù)以與頻率軸相反的方向復(fù)制到高頻帶的處理過程流程圖。
附圖15是表明圖2所示的第二量化單元產(chǎn)生的另一個(gè)子信息(量化值)的實(shí)施例的頻譜波形圖。
附圖16是表明圖2所示的第二量化單元所執(zhí)行的另一個(gè)子信息(量化值)計(jì)算處理的操作流程圖。
附圖17是表明圖2所示的第二量化單元所產(chǎn)生的另一個(gè)子信息(位置信息)的實(shí)施例的頻譜波形圖。
附圖18是表明圖2所示的第二量化單元所執(zhí)行的另一個(gè)子信息(位置信息)計(jì)算處理的操作流程圖。
附圖19是表明圖2所示的第二量化單元所產(chǎn)生的另一個(gè)子信息(符號(hào)信息)的實(shí)施例的頻譜波形圖。
附圖20是表明圖2所示的第二量化單元所執(zhí)行的另一個(gè)子信息(符號(hào)信息)計(jì)算處理的操作流程圖。
附圖21A和21B是表明如何產(chǎn)生圖2所示的第二量化單元所產(chǎn)生的另一個(gè)子信息(復(fù)制信息)的實(shí)施例的頻譜波形圖。
附圖22是表明圖2所示的第二量化單元所執(zhí)行的另一個(gè)子信息(復(fù)制信息)計(jì)算處理的操作流程圖。
附圖23是表明如何產(chǎn)生圖2所示的第二量化單元所產(chǎn)生的另一個(gè)子信息(復(fù)制信息)的實(shí)施例的頻譜波形圖。
附圖24是表明圖2所示的第二量化單元所執(zhí)行的另一個(gè)子信息(復(fù)制信息)計(jì)算處理的操作流程圖。
具體實(shí)施例方式
下面將參照附圖描述本發(fā)明被應(yīng)用于作為音頻數(shù)據(jù)分配系統(tǒng)的一種廣播系統(tǒng)的實(shí)施例的情況。
附圖2是表明根據(jù)本發(fā)明的廣播系統(tǒng)的功能結(jié)構(gòu)的方框圖。
根據(jù)本實(shí)施例的廣播系統(tǒng)1,如圖2所示,被放置在一個(gè)廣播站中,該系統(tǒng)包括一個(gè)編碼輸入音頻信號(hào)的編碼設(shè)備300,以及一個(gè)解碼編碼設(shè)備300編碼的音頻信號(hào)比特流的解碼設(shè)備400。
(編碼設(shè)備300)編碼設(shè)備300當(dāng)接收一個(gè)音頻信號(hào)的時(shí)候,編碼該音頻信號(hào),該編碼設(shè)備300包括一個(gè)A/D轉(zhuǎn)換器305,一個(gè)音頻數(shù)據(jù)輸入單元310,一個(gè)變換單元320,一個(gè)數(shù)據(jù)劃分單元330,一個(gè)第一和第二量化單元340,345,一個(gè)第一和第二編碼單元350,355,以及一個(gè)流輸出單元390。
A/D轉(zhuǎn)換器305以44.1kHz的采樣頻率(該頻率是現(xiàn)有技術(shù)1的采樣頻率的兩倍)對(duì)輸入音頻信號(hào)進(jìn)行采樣,將模擬音頻信號(hào)轉(zhuǎn)換成數(shù)字音頻信號(hào)(例如16比特),并且產(chǎn)生了時(shí)間域中的音頻數(shù)據(jù)串。
音頻數(shù)據(jù)輸入單元310,以接收A/D轉(zhuǎn)換器305所產(chǎn)生的2048個(gè)取樣的音頻數(shù)據(jù)串(2幀)的采樣頻率(大約45.4msec),就是通常的低采樣頻率的兩倍,分離音頻數(shù)據(jù)串,將其分為具有連續(xù)的2048個(gè)取樣的每個(gè)音頻數(shù)據(jù)串,具有被覆蓋的1024個(gè)取樣前后所獲得的兩組1024個(gè)取樣,就是,通常的取樣數(shù)目的兩倍(4096個(gè)取樣)。音頻數(shù)據(jù)輸入單元310包括一個(gè)計(jì)數(shù)器311,用于檢測(cè)每接收2048個(gè)取樣的分離定時(shí),以及一個(gè)FIF0緩存器,用于暫時(shí)存儲(chǔ)4096個(gè)取樣的音頻數(shù)據(jù)串。
變換單元320將音頻數(shù)據(jù)輸入單元310所分離的時(shí)間域的兩幀4096個(gè)取樣的音頻采樣數(shù)據(jù)變換成頻率域的頻譜數(shù)據(jù)。變換單元320包括一個(gè)MDCT321,用于將時(shí)間域的4096個(gè)取樣的音頻數(shù)據(jù)變換成頻率域的4096個(gè)取樣的頻譜數(shù)據(jù),以及一個(gè)分組單元322,用于分組用于每一個(gè)比例因子頻帶的頻譜數(shù)據(jù)。
詳細(xì)的說,MDCT321將時(shí)間域中的4096個(gè)取樣組成的采樣數(shù)據(jù)變換成包括4096個(gè)取樣的頻譜數(shù)據(jù)(16比特)。該頻譜數(shù)據(jù)的這些取樣被對(duì)稱的排列,因此它們當(dāng)中只有一半的取樣(即,2048個(gè)取樣)被編碼,而另外的一半被忽略。
如上所述,如果將編碼設(shè)備300中的A/D轉(zhuǎn)換器305,音頻數(shù)據(jù)輸入單元310以及變換單元320的結(jié)構(gòu)與現(xiàn)有技術(shù)1的編碼設(shè)備1000中的相應(yīng)單元進(jìn)行比較,本實(shí)施例與現(xiàn)有技術(shù)1的本質(zhì)區(qū)別在于A/D轉(zhuǎn)換器305中的采樣頻率是加倍的(44.1kHz),音頻數(shù)據(jù)輸入單元310的分離長度是加倍的(4096個(gè)取樣),以及變換單元320的MDCT321中的編碼單元是加倍的(4096個(gè)取樣)。
而且,如果本實(shí)施例與現(xiàn)有技術(shù)2相比較,前者與后者的本質(zhì)區(qū)別在于在音頻數(shù)據(jù)輸入單元310中的分離長度是加倍的(4096個(gè)取樣)以及變換單元320中的MDCT321中的編碼單元是加倍的(4096個(gè)取樣),盡管A/D轉(zhuǎn)換器中的采樣頻率是相同的。
結(jié)果是,變換單元320輸出屬于11.025kHz或者更小的低頻帶內(nèi)的頻譜數(shù)據(jù)的1024個(gè)取樣(以后被稱為“低頻帶的頻譜數(shù)據(jù)”),以及屬于高于11.025kHz的高頻帶內(nèi)的頻譜數(shù)據(jù)的1024個(gè)取樣(以后被稱為“高頻帶內(nèi)的頻譜數(shù)據(jù)”),就是總共2048個(gè)頻譜數(shù)據(jù)取樣。
變換單元320的分組單元322將待被編碼的頻譜數(shù)據(jù)的2048個(gè)取樣分組為多個(gè)比例因子頻帶,每一個(gè)都包括至少由一個(gè)取樣構(gòu)成的頻譜數(shù)據(jù)(或者,實(shí)際的說,取樣的總共的數(shù)目是4的倍數(shù))。
根據(jù)AAC,包含在每個(gè)比例因子頻帶內(nèi)的頻譜數(shù)據(jù)的取樣的數(shù)目根據(jù)其頻率而被定義。低頻帶的比例因子頻帶通過較少的頻譜數(shù)據(jù)被確定得較窄,高頻帶的比例因子頻帶通過較多的頻譜數(shù)據(jù)被確定得較寬。在AAC中,與一幀的頻譜數(shù)據(jù)相應(yīng)的比例因子頻帶的數(shù)目也可以根據(jù)采樣頻率來定義。例如當(dāng)采樣頻率為例如44.1kHz的時(shí)候,每一幀包括49個(gè)比例因子頻帶,并且49個(gè)比例因子頻帶包括1024個(gè)取樣的頻譜數(shù)據(jù)。另一方面,其沒有在AAC中被具體定義,比例因子頻帶將在這些比例因子頻帶中被傳送,而起根據(jù)傳輸信道的傳輸速率選擇的最期望的比例因子頻帶將被傳送。當(dāng)傳輸速率例如為96kbps的時(shí)候,在一幀中的低頻帶內(nèi)僅有40個(gè)比例因子頻帶(640個(gè)取樣)將被有選擇的傳送。
另一方面,在本實(shí)施例中,在兩幀中的頻譜數(shù)據(jù)(分別在低頻帶和高頻帶內(nèi)的1024個(gè)頻譜數(shù)據(jù))以兩倍于傳統(tǒng)方法中的采樣頻率(大約45.4msec)從MDCT321中輸出。這樣,當(dāng)傳輸信道的傳輸速率為96kbps的時(shí)候,即使如果在兩幀之中的低頻帶內(nèi)的所有比例因子頻帶(1024個(gè)取樣)都被傳送,在傳輸信道內(nèi)仍然存在著剩余的足夠的容量,這是與相應(yīng)于傳統(tǒng)的AAC的兩幀(640×2=1280取樣)的傳輸相比較而言。因此,本實(shí)施例將假定分組單元332將變換的頻譜數(shù)據(jù)分組為其確定和數(shù)目是被唯一確定的比例因子頻帶而進(jìn)行解釋。
數(shù)據(jù)劃分單元330將變換單元320輸出的2048個(gè)頻譜數(shù)據(jù)取樣分為低頻帶內(nèi)的1024個(gè)頻譜數(shù)據(jù)以及高頻帶內(nèi)的1024個(gè)頻譜數(shù)據(jù)。數(shù)據(jù)劃分單元330分別將低頻帶內(nèi)劃分的1024個(gè)頻譜數(shù)據(jù)輸出到第一量化單元340,將高頻帶內(nèi)的1024個(gè)頻譜數(shù)據(jù)輸出到第二量化單元345。
第一量化單元340為低頻帶內(nèi)的每一個(gè)比例因子頻帶確定一個(gè)用于自數(shù)據(jù)劃分單元330所傳送的頻譜數(shù)據(jù)的比例因子,利用該確定的比例因子量化該比例因子頻帶內(nèi)的頻譜,并將作為量化結(jié)果的量化值,確定的第一比例因子,以及第一和每個(gè)接下來的比例因子之間的差輸出給第一編碼單元350。第一量化單元340包括一個(gè)比例因子計(jì)算單元341。比例因子計(jì)算單元341計(jì)算一個(gè)標(biāo)準(zhǔn)化因子(比例因子,8比特)從而使得在每一個(gè)比例因子內(nèi)的頻譜數(shù)據(jù)都在一個(gè)預(yù)定數(shù)目的比特以內(nèi),利用該計(jì)算的比例因子量化比例因子頻帶內(nèi)的每一個(gè)頻譜,然后計(jì)算該比例因子與第一個(gè)比例因子之間的差。
第一編碼單元350將第一個(gè)量化單元340所量化的數(shù)據(jù),用于每一個(gè)比例因子頻帶的比例因子等,編碼成一個(gè)預(yù)定的流格式,并且包括一個(gè)用于進(jìn)一步壓縮每一個(gè)量化數(shù)據(jù),每一個(gè)比例因子等的霍夫曼編碼表351。尤其是,第一編碼單元350利用霍夫曼表351編碼每一個(gè)量化的數(shù)據(jù),每一個(gè)比例因子等,從而能夠以低比特率而被傳輸。
第二量化單元345在沒有被第一量化單元340量化的帶寬內(nèi),就是高于11.025kHz的高頻帶內(nèi),根據(jù)數(shù)據(jù)劃分單元330輸出的頻譜數(shù)據(jù)計(jì)算子信息,并將其輸出。第二量化單元345包括一個(gè)子信息產(chǎn)生單元346,用于產(chǎn)生子信息。
子信息是一個(gè)根據(jù)高頻帶內(nèi)的頻譜數(shù)據(jù)計(jì)算的簡化信息,并且簡明的表明了具有較少數(shù)量信息的高頻帶內(nèi)的頻譜數(shù)據(jù)的特性。換句話說,它是表明高頻帶的頻譜數(shù)據(jù)特性的信息,其中這些特性是通過變換在一個(gè)特定的時(shí)間長度內(nèi)接收的音頻數(shù)據(jù)而獲得的。特別是,子信息是用于獲得絕對(duì)值最大的頻譜數(shù)據(jù)(絕對(duì)值為最大的頻譜數(shù)據(jù))的量化值“1”的高頻帶內(nèi)的每一個(gè)比例因子頻帶的比例因子,以及其量化值。
第二編碼單元355將第二量化單元345輸出的子信息編碼為預(yù)定的流格式,并且輸出編碼的信息作為第二編碼信息。第二編碼單元355包括一個(gè)用于編碼子信息的霍夫曼編碼表356。
流輸出單元390在上述的第一編碼單元350輸出的第一編碼信號(hào)中加入報(bào)頭(header)信息和其他必要的子信息,并將其變換成一個(gè)MPEG-2 ACC比特流。流輸出單元390也將第二編碼單元355所輸出的第二編碼信號(hào)記錄在上述的被傳統(tǒng)的解碼設(shè)備所忽略的或者其操作沒有被定義的比特流的區(qū)域。特別是,流輸出單元390將第二編碼單元355輸出的編碼信號(hào)存儲(chǔ)在MPEG-2 ACC編碼比特流的填充部分(FillElement),數(shù)據(jù)流部分(Data Stream Element,等)。
對(duì)于存儲(chǔ)在報(bào)頭信息中的表明比特流的采樣頻率的信息,音頻數(shù)據(jù)的采樣頻率的一半的值被存儲(chǔ)。換句話說,當(dāng)音頻數(shù)據(jù)的采樣頻率為44.1kHz的時(shí)候,22.05kHz的信息,即實(shí)際值的一半被存儲(chǔ)。并且表明44.1kHz的實(shí)際采樣頻率的信息被存儲(chǔ)在上述的子信息被存儲(chǔ)的區(qū)域或者類似的區(qū)域。
編碼設(shè)備300輸出的比特流通過傳輸介質(zhì)利用無線電波,光纜,閃光,金屬線等,諸如互聯(lián)網(wǎng)被傳送到解碼設(shè)備400。
如上所述,當(dāng)在頻率域量化和編碼由變換單元320所獲得的頻譜數(shù)據(jù)的時(shí)候,編碼設(shè)備300將其劃分成低頻帶內(nèi)的頻譜數(shù)據(jù)(1024個(gè)取樣)和高頻帶內(nèi)的頻譜數(shù)據(jù)(1024個(gè)取樣),以傳統(tǒng)的方法量化和編碼低頻帶內(nèi)的頻譜數(shù)據(jù),利用不同的方法量化和編碼高頻帶內(nèi)的頻譜數(shù)據(jù)(產(chǎn)生子信息并編碼子信息),將高頻帶內(nèi)的編碼比特流合成到低頻帶內(nèi),并將其輸出。編碼設(shè)備300與傳統(tǒng)的編碼設(shè)備1000的本質(zhì)區(qū)別在于編碼設(shè)備1000整體上采樣同樣的方法量化和編碼頻譜數(shù)據(jù)。
結(jié)果是,音頻數(shù)據(jù)能夠被編碼從而再生高質(zhì)量的聲音,同時(shí)不會(huì)增加信息總量。
而且,由于表明22.05kHz的采樣頻率的信息被存儲(chǔ)在報(bào)頭當(dāng)中,產(chǎn)生的效果是本實(shí)施例中的編碼設(shè)備300所產(chǎn)生的比特流也能夠利用傳統(tǒng)的解碼設(shè)備2000來解碼。
(解碼設(shè)備400)本實(shí)施例中的解碼設(shè)備400是一種能夠通過以與編碼設(shè)備300近似相反的方式對(duì)編碼單元300所輸出的比特流執(zhí)行處理從而能夠在時(shí)間域再生音頻信號(hào)的設(shè)備(再生頻率為22.05kHz或者更小)。解碼設(shè)備400包括一個(gè)流輸入單元410,第一和第二解碼單元420,425,第一和第二解量化單元430,435,一個(gè)解量化數(shù)據(jù)集成單元440,一個(gè)逆變換單元480,一個(gè)音頻數(shù)據(jù)輸出單元490,以及一個(gè)D/A轉(zhuǎn)換器495。
當(dāng)通過傳輸介質(zhì)接收到編碼設(shè)備300編碼的比特流的時(shí)候,流輸入單元410選擇一個(gè)存儲(chǔ)在由傳統(tǒng)的解碼設(shè)備所使用的區(qū)域中的第一編碼信號(hào)和一個(gè)存儲(chǔ)在被傳統(tǒng)的解碼設(shè)備所忽略或者其操作沒有被定義的區(qū)域中的第二編碼信號(hào),并分別將其輸出給第一解碼單元420和第二解碼單元425。
第一解碼單元420接收流輸入單元410輸出的第一編碼信號(hào),然后將其解碼從而再生為量化數(shù)據(jù),該單元還包括一個(gè)霍夫曼解碼表421。
第一解量化單元430解量化第一解碼單元420解碼的量化數(shù)據(jù)并輸出頻譜數(shù)據(jù),該單元還包括一個(gè)處理單元431,用于根據(jù)公式對(duì)量化的數(shù)據(jù)進(jìn)行解量化。這里,第一解量化單元430所輸出的頻譜數(shù)據(jù)的取樣數(shù)目是1024個(gè),它們表示11.025kHz或者更小的再生帶寬。
第二解碼單元425接收流輸入單元410所輸出的第二編碼信號(hào)并且解碼子信息,該單元還包括一個(gè)霍夫曼解碼表426。
第二解量化單元435在高頻帶內(nèi)產(chǎn)生頻譜數(shù)據(jù),該單元還包括一個(gè)頻譜數(shù)據(jù)產(chǎn)生單元436。這里,第二解量化單元435所輸出的頻譜數(shù)據(jù)的取樣數(shù)目是1024個(gè),它們表示高于11.025kHz的再生帶寬。
頻譜數(shù)據(jù)產(chǎn)生單元436根據(jù)預(yù)定的處理程序,基于第一解量化單元430所輸出的頻譜數(shù)據(jù)產(chǎn)生噪聲,根據(jù)第二解碼單元425所輸出的子信息對(duì)噪聲進(jìn)行定形,并且輸出高頻帶內(nèi)的頻譜數(shù)據(jù)。這一噪聲包括白噪聲,粉噪聲(pink noise)以及低頻帶內(nèi)的部分或者全部頻譜數(shù)據(jù)的復(fù)制。
特別是,頻譜數(shù)據(jù)產(chǎn)生單元436預(yù)先復(fù)制第一解量化單元430所輸出的低頻帶內(nèi)的頻譜數(shù)據(jù),將其復(fù)制到高頻帶內(nèi),然后通過將該比例因子頻帶內(nèi)的每個(gè)頻譜數(shù)據(jù)乘以作為一個(gè)系數(shù)的比值而在高頻帶內(nèi)重建頻譜數(shù)據(jù),這個(gè)比值是在高頻帶內(nèi)的每個(gè)帶內(nèi)復(fù)制的頻譜數(shù)據(jù)的絕對(duì)最大值與對(duì)利用與子信息中描述的帶相應(yīng)的比例因子值來對(duì)量化的值“1”進(jìn)行解量化所得到的值之間的比。
解量化數(shù)據(jù)集成單元440將第一解量化單元430所輸出的頻譜數(shù)據(jù)與第二解量化單元435所輸出的頻譜數(shù)據(jù)進(jìn)行集成。這里,解量化數(shù)據(jù)集成單元440所輸出的頻譜數(shù)據(jù)的取樣數(shù)目是2048個(gè),它們表示0~22.05kHz的再生帶寬。
如上所述,解碼設(shè)備400將編碼設(shè)備300所編碼的比特流分成分別存儲(chǔ)在傳統(tǒng)的解碼設(shè)備所使用的區(qū)域內(nèi)的第一編碼信號(hào)(在低頻帶內(nèi))以及存儲(chǔ)在被傳統(tǒng)的解碼設(shè)備所忽略或者其操作沒有被定義的區(qū)域內(nèi)的第二編碼信號(hào)(在高頻帶內(nèi)),利用與傳統(tǒng)方法同樣的方法僅對(duì)第一編碼信號(hào)(低頻帶內(nèi))解碼和解量化,利用與傳統(tǒng)的方法不同的方法對(duì)第二編碼信號(hào)(高頻帶內(nèi))解碼和解量化,集成在高頻帶和低頻帶內(nèi)的頻譜數(shù)據(jù),并且輸出集成的數(shù)據(jù)。在這一點(diǎn)上,解碼設(shè)備400與現(xiàn)有技術(shù)1,2中的解碼設(shè)備2000的本質(zhì)區(qū)別在于解碼設(shè)備2000以同樣的方法對(duì)全部帶寬內(nèi)的比特流進(jìn)行解碼和解量化。
結(jié)果是,用與傳統(tǒng)的方法近似相同的較少數(shù)量的信息能夠解碼遠(yuǎn)遠(yuǎn)大于傳統(tǒng)方法的信息量,這樣音頻信號(hào)能夠被解碼從而再生高質(zhì)量的聲音。
逆變換單元480對(duì)解量化數(shù)據(jù)集成單元440所輸出的頻率域的頻譜數(shù)據(jù)執(zhí)行IMDCT,將其變換成時(shí)間域內(nèi)的2048個(gè)取樣(2幀)的音頻數(shù)據(jù)。
音頻數(shù)據(jù)輸出單元490將逆變換單元480獲得的時(shí)間域的若干組2048個(gè)取樣的音頻數(shù)據(jù)相互合并,并以時(shí)間順序?qū)⑵渲饌€(gè)輸出。
D/A轉(zhuǎn)換器495利用44.1kHz的采樣頻率將數(shù)字音頻數(shù)據(jù)轉(zhuǎn)換成模擬音頻信號(hào)。
如上所述,解碼設(shè)備400與現(xiàn)有技術(shù)1中的解碼設(shè)備2000的本質(zhì)區(qū)別在于在逆變換單元480中的逆變換單元是加倍的(2048個(gè)取樣),音頻數(shù)據(jù)輸出單元490中的幀長度是加倍的(2048個(gè)取樣)以及D/A轉(zhuǎn)換器495中的采樣頻率是加倍的(44.1kHz)。
結(jié)果是,根據(jù)11.024kHz或者更低的低頻帶內(nèi)的頻譜數(shù)據(jù)(1024個(gè)取樣)以及高頻帶內(nèi)的頻譜數(shù)據(jù)(1024個(gè)取樣),音頻信號(hào)被輸出從而在高頻帶內(nèi)(0~22.05kHz)再生高質(zhì)量的聲音。
如上所述,根據(jù)本發(fā)明的功能結(jié)構(gòu),音頻數(shù)據(jù)能夠被解碼從而再生高質(zhì)量的聲音,這是基于與傳統(tǒng)的方法幾乎相同的信息數(shù)量,通過以傳統(tǒng)的方法解碼低頻帶內(nèi)的數(shù)據(jù)以及利用非常少的信息量解碼高頻帶的頻譜數(shù)據(jù)來實(shí)現(xiàn)的。
而且,在本實(shí)施例的編碼設(shè)備300和解碼設(shè)備400中,數(shù)據(jù)劃分單元330,第二量化單元345以及第二編碼單元355是被加到傳統(tǒng)的編碼設(shè)備1000中的,第二解碼單元425,第二解量化單元435以及解量化數(shù)據(jù)集成單元440被加到了傳統(tǒng)的解碼設(shè)備2000。這樣就產(chǎn)生了一個(gè)效果就是本實(shí)施例中的編碼設(shè)備300和解碼設(shè)備400能夠在完全不改變傳統(tǒng)的編碼設(shè)備1000和解碼設(shè)備2000的情況下而實(shí)現(xiàn)。
也存在了另一個(gè)效果就是本實(shí)施例中的編碼設(shè)備300所產(chǎn)生的比特流能夠由傳統(tǒng)的解碼設(shè)備2000來解碼。
接下來,將詳細(xì)的描述廣播系統(tǒng)1中的編碼設(shè)備300中的每一個(gè)單元所執(zhí)行的編碼處理。
附圖3A和附圖3B是表明圖2所示的編碼設(shè)備300的音頻數(shù)據(jù)輸入單元310和變換單元320所處理的音頻信號(hào)的狀態(tài)變化的圖。尤其是,附圖3A表明圖2所示的音頻數(shù)據(jù)輸入單元310所分離的時(shí)間域的2048個(gè)取樣數(shù)據(jù)的波形,附圖3B表明在時(shí)間域的取樣數(shù)據(jù)被圖2所示的變換單元320中的MDCT321變換以后在頻率域所產(chǎn)生的頻譜數(shù)據(jù)的波形。應(yīng)當(dāng)注意在附圖3A和3B中繪出的取樣數(shù)據(jù)和頻譜數(shù)據(jù)都圖示為模擬的波形,盡管實(shí)際上它們都是數(shù)字信號(hào)。在接來的表明波形的圖中它們是真實(shí)的。
音頻數(shù)據(jù)輸入單元310接收在44.1kHz的采樣頻率采樣的音頻數(shù)據(jù)。根據(jù)該數(shù)字音頻信號(hào),音頻數(shù)據(jù)輸入單元310將音頻數(shù)據(jù)分離成具有在2048個(gè)取樣被覆蓋前后獲得的兩組1024個(gè)取樣的每個(gè)連續(xù)的2048個(gè)取樣,然后這些取樣被輸出到變換單元320。
變換單元320對(duì)總共4096個(gè)取樣數(shù)據(jù)執(zhí)行MDCT。根據(jù)MDCT所產(chǎn)生的頻譜數(shù)據(jù)的波形被對(duì)稱排列,因此僅有與2048個(gè)取樣相對(duì)應(yīng)的一半的頻譜數(shù)據(jù)被輸出,如圖3B所示。
在附圖3B中,垂直軸表示頻率頻譜數(shù)據(jù)的值,就是在相應(yīng)于取樣數(shù)目的2048個(gè)點(diǎn),在附圖3A中所示的表示2048個(gè)取樣的電壓值表示的音頻數(shù)據(jù)的頻率分量的數(shù)量(大小)。由于輸入到編碼設(shè)備300的音頻信號(hào)是以44.1kHz的采樣頻率進(jìn)行A/D轉(zhuǎn)換的,因此頻譜數(shù)據(jù)的再生帶寬是22.05kHz。而且,由于MDCT321所產(chǎn)生的頻譜具有如圖3B所示的負(fù)值,當(dāng)編碼頻譜的時(shí)候,MDCT321所產(chǎn)生的頻譜的正負(fù)符號(hào)也需要被編碼。在下面的解釋當(dāng)中,表示頻譜數(shù)據(jù)的正負(fù)符號(hào)的信息被稱為“符號(hào)信息”。
變換單元320所輸出的頻譜數(shù)據(jù)和符號(hào)信息被數(shù)據(jù)劃分單元330劃分成0~11.025kHz的低頻帶的數(shù)據(jù)和信息以及高于11.025kHz的高頻帶內(nèi)的數(shù)據(jù)和信息,低頻帶內(nèi)的頻譜數(shù)據(jù)和符號(hào)信息被輸出到第一量化單元340,高頻帶內(nèi)的數(shù)據(jù)和信息被輸出到第二量化單元345。
附圖4是表明圖2所示的第一量化單元340所執(zhí)行的比例因子確定處理的操作流程圖。
第一量化單元340首先確定一個(gè)對(duì)每一個(gè)比例因子而言是共同的比例因子作為比例因子的初始值(S91),利用預(yù)定的比例因子量化低頻帶內(nèi)的將作為一幀音頻數(shù)據(jù)(1024個(gè)取樣)而被傳送的所有頻譜數(shù)據(jù),計(jì)算在計(jì)算的比例因子之前和之后的比例因子之間的差,對(duì)差、第一比例因子和頻譜數(shù)據(jù)的量化值進(jìn)行霍夫曼編碼(S92)。應(yīng)當(dāng)注意這里的量化和編碼僅是為了計(jì)數(shù)比特?cái)?shù)目而被執(zhí)行的。因此,僅有數(shù)據(jù)被量化和編碼,為了簡化處理諸如報(bào)頭的信息沒有被加入。
接下來,第一量化單元340判斷霍夫曼編碼數(shù)據(jù)的比特?cái)?shù)目是否超過了一個(gè)預(yù)定的比特?cái)?shù)目(S93),如果超出了,減小比例因子的初始值(S101)。然后,第一量化單元340利用減小的比例因子值再次量化和霍夫曼編碼低頻帶內(nèi)的同樣的頻譜數(shù)據(jù)(S92),判斷低頻帶內(nèi)的用于一幀的霍夫曼編碼的數(shù)據(jù)的比特?cái)?shù)目是否超出了預(yù)定的比特?cái)?shù)目(S93),并且重復(fù)這一過程直至其成為預(yù)定數(shù)目的比特或者更少。
當(dāng)?shù)皖l帶內(nèi)的編碼數(shù)據(jù)的比特?cái)?shù)目沒有超出預(yù)定的值,第一量化單元340對(duì)每一個(gè)比例因子頻帶重復(fù)下述的處理過程,并確定了每個(gè)比例因子頻帶的比例因子(S94)。首先,對(duì)比例因子頻帶內(nèi)的每一個(gè)量化的值解量化(S95),計(jì)算解量化的值與相應(yīng)的原始頻譜數(shù)據(jù)值之間的絕對(duì)值的差,并將其相加(S96)。接下來,判斷計(jì)算的差的總和是否在可以接受的限度以內(nèi)(S97),如果其在可接受的限度以內(nèi),在下一比例因子頻帶重復(fù)上述的處理過程(S94~S98)。
另一方面,它超出了可接收的限度,第一量化單元340增加比例因子值,量化該比例因子頻帶內(nèi)的頻譜數(shù)據(jù)(S100),接下來解量化量化的值(S95)并將解量化的值的絕對(duì)值和相應(yīng)的頻譜數(shù)據(jù)值之間的差相加(S96)。接下來,第一量化單元340判斷差的總和是否在可接收的限度以內(nèi)(S97),如果它超出了限度(S100),就增加比例因子值直至它成為一個(gè)位于限度內(nèi)的值(S100),并重復(fù)上述的處理過程(S95~S97和S100)。
當(dāng)?shù)谝涣炕瘑卧?40判斷對(duì)于所有的比例因子頻帶,在以比例因子對(duì)量化的數(shù)據(jù)進(jìn)行解量化得到的數(shù)據(jù)值和相應(yīng)的原始頻譜數(shù)據(jù)值之間的絕對(duì)值的差的總和在可接受的限度以內(nèi)(S98),它使用確定的比例因子再次對(duì)一幀的在低頻帶內(nèi)的頻譜數(shù)據(jù)進(jìn)行量化,對(duì)每一個(gè)比例因子的差,第一個(gè)比例因子及該頻譜數(shù)據(jù)的量化值進(jìn)行霍夫曼編碼,并且判斷低頻帶內(nèi)的編碼數(shù)據(jù)的比特?cái)?shù)目是否超出了一個(gè)預(yù)定的比特?cái)?shù)(S99)。如果低頻帶內(nèi)的編碼數(shù)據(jù)的比特?cái)?shù)超出了預(yù)定的值,第一量化單元340減小比例因子的初始值,直至它變成預(yù)定的數(shù)目或者更小(S101),然后在每一個(gè)比例因子頻帶內(nèi)重復(fù)確定比例因子的處理過程(S94~S98)。如果低頻帶內(nèi)的編碼數(shù)據(jù)的比特?cái)?shù)沒有超出預(yù)定的值(S99),那么就確定當(dāng)時(shí)的每一個(gè)比例因子的值為用于每個(gè)比例因子頻帶的比例因子。
第一量化單元340利用上面確定的比例因子量化低頻帶內(nèi)的頻譜數(shù)據(jù),并將量化的值,第一比例因子,確定的第一比例因子和接下來的比例因子之間的差,以及數(shù)據(jù)劃分單元330所接收的符號(hào)信息輸出給第一編碼單元350。
應(yīng)當(dāng)注意在比例因子頻帶內(nèi)對(duì)量化的數(shù)據(jù)進(jìn)行解量化得到的數(shù)據(jù)值和相應(yīng)的原始頻譜數(shù)據(jù)值之間的絕對(duì)值的差的總和是否在可接受的限度以內(nèi)是根據(jù)心里聲學(xué)模式等的數(shù)據(jù)進(jìn)行被判斷的。
而且,在上述的情況中,一個(gè)相對(duì)較大的值被設(shè)定作為比例因子的初始值,當(dāng)?shù)皖l帶內(nèi)的霍夫曼編碼的比特?cái)?shù)目超出一個(gè)預(yù)定的比特?cái)?shù)目的時(shí)候,比例因子的初始值就被減小從而來確定比例因子,但是比例因子并不是經(jīng)常需要以這種方式被確定的。例如,一個(gè)較低的值可以被預(yù)先設(shè)定為比例因子的初始值,并且初始值能夠逐漸的增加。并且每一個(gè)比例因子頻帶內(nèi)的比例因子可以利用比例因子的初始值被確定,該比例因子初始值是在低頻帶內(nèi)的編碼數(shù)據(jù)的總共比特?cái)?shù)首次超出一個(gè)預(yù)定的比特?cái)?shù)目之前被設(shè)定的。
而且,在本實(shí)施例中,每一個(gè)比例因子頻帶的比例因子都被確定使得低頻帶內(nèi)的一幀的編碼數(shù)據(jù)的總共的比特?cái)?shù)不超過預(yù)定的數(shù)目,但是比例因子并不是總是需要以這種方式被確定。例如,比例因子能夠被確定從而使得在每一個(gè)比例因子頻帶內(nèi),在比例因子頻帶內(nèi)的每一個(gè)量化的值都不超出預(yù)定的比特?cái)?shù)目。下面將參照附圖5解釋在這一處理過程中第一量化單元340的操作過程。
附圖5是表明圖2所示的第一量化單元340的另一個(gè)比例因子確定處理的操作流程圖。
第一量化單元340對(duì)于所有的比例因子頻帶,計(jì)算將要根據(jù)下面的處理過程而被編碼的低頻帶內(nèi)的比例因子(S1)。而且,第一量化單元340根據(jù)下面的處理過程計(jì)算用于每一個(gè)比例因子頻帶內(nèi)的所有的頻譜數(shù)據(jù)的比例因子(S2)。
首先,第一量化單元340根據(jù)公式利用一個(gè)預(yù)定的比例因子值量化頻譜數(shù)據(jù)(S3),并且判斷量化的值是否超過用于表明量化值的給定的預(yù)定比特?cái)?shù)目,例如4比特(S4)。
當(dāng)量化的值超出4比特作為判斷結(jié)果的時(shí)候,第一量化單元340就調(diào)整比例因子的值(S8),并且利用調(diào)整的比例因子值量化同樣的頻譜數(shù)據(jù)(S3)。第一量化單元340判斷獲得的量化值是否超出4比特(S4),并且重復(fù)比例因子的調(diào)整(S8)以及調(diào)整的比例因子的量化(S3)直至頻譜數(shù)據(jù)的量化值為4比特或者更少。
當(dāng)量化的值是4比特或者更少作為判斷結(jié)果的時(shí)候,它將利用預(yù)定的比例因子值量化下一個(gè)頻譜數(shù)據(jù)。
當(dāng)一個(gè)比例因子頻帶內(nèi)的所有頻譜數(shù)據(jù)的量化的值為4比特或者更少的時(shí)候(S5),第一量化單元340就確定當(dāng)時(shí)的比例因子為用于比例因子頻帶的比例因子(S6)。
當(dāng)確定了所有比例因子頻帶的比例因子以后(S7),第一量化單元340就結(jié)束該處理。
根據(jù)上面的處理,對(duì)于所有的將被編碼的低頻帶內(nèi)的比例因子頻帶,每個(gè)比例因子都被確定。第一量化單元340利用以上述的方式確定的比例因子來量化低頻帶內(nèi)的頻譜數(shù)據(jù),并且將作為量化結(jié)果的4比特的量化值,8比特的第一比例因子,第一比例因子和后面的比例因子之間的差,還有從數(shù)據(jù)劃分單元330接收的符號(hào)信息輸出到第一編碼單元132。
量化的值,比例因子和第一編碼單元350輸出的其它值是霍夫曼編碼的,并且如在向下取樣的情況中,作為第一編碼信號(hào)被輸出到流輸出單元390。
另一方面,第二量化單元345根據(jù)高頻帶中的頻譜數(shù)據(jù)等產(chǎn)生子信息。
附圖6是表明附圖2所示的第二量化單元345所產(chǎn)生的子信息(比例因子)的實(shí)施例的頻譜波形圖。附圖7是表明圖2所示的第二量化單元345所執(zhí)行的子信息(比例因子)計(jì)算處理的操作流程圖。
在圖6中,在低頻帶的頻率軸上標(biāo)出的界符(delimiter)表明在本實(shí)施例中確定的比例因子頻帶的比例因子。而且,在高頻帶內(nèi)的頻率軸上用虛線標(biāo)出的界符表明在本實(shí)施例中確定的高頻帶內(nèi)的比例因子頻帶的比例因子。在接下來的波形圖中這些是真實(shí)的。
在變換單元320輸出的頻譜數(shù)據(jù)中,11.025kHz或者更小的低頻帶內(nèi)的再生帶寬,在附圖6中以實(shí)線波形表示,被輸出到第一量化單元340,并如通常一樣對(duì)其進(jìn)行量化。另一方面,在高于11.025kHz~22.05kHz的高頻帶內(nèi)的再生帶寬,在圖6中用虛線表示,由第二量化單元345所計(jì)算的子信息(比例因子)所代表。
下面將參照附圖7的流程圖,利用附圖6所示的實(shí)施例來解釋第二量化單元345中的子信息(比例因子)計(jì)算過程。
根據(jù)下面的處理(S11),第二量化單元345計(jì)算用于在具有再生帶寬大于11.025kHz直到22.05kHz的高頻帶內(nèi)的每一個(gè)比例因子頻帶的每一個(gè)比例因子頻帶內(nèi)導(dǎo)出絕對(duì)值最大的頻譜數(shù)據(jù)的量化值“1”的最佳比例因子。
第二量化單元345指定在具有大于11.025kHz的再生帶寬的高頻帶內(nèi)的第一比例因子頻帶的絕對(duì)最大頻譜數(shù)據(jù)(峰值)(S12)。在圖6所示的實(shí)施例中,①表示在第一比例因子頻帶內(nèi)指定的峰值,峰值的值為“256”。
根據(jù)與圖5中所示的流程圖相同的處理過程,第二量化單元345計(jì)算用于導(dǎo)出通過在公式中賦予峰值“256”和比例因子的初始值而得到的量化值“1”的比例因子值“sf”(S13)。在這種情況下,例如,計(jì)算出的“sf”=24(“sf”是用于導(dǎo)出峰值“256”的量化值“1”的比例因子)。
當(dāng)為第一比例因子頻帶計(jì)算出用于導(dǎo)出量化的峰值“1”的比例因子“sf”=24的時(shí)候(S14),第二量化單元345指定下一個(gè)比例因子頻帶內(nèi)的頻譜數(shù)據(jù)的峰值(S12),如果指定的峰值位置是②并且值為“312”,就計(jì)算用于導(dǎo)出峰值“312”的量化值“1”的比例因子的值,例如,“sf”=32(S13)。
以同樣的方式,第二量化單元345分別計(jì)算高頻帶內(nèi)的用于導(dǎo)出峰值③“288”的量化值為“1”的第三比例因子頻帶的比例因子值,“sf”=26,以及用于導(dǎo)出峰值④”203”的量化值為“1”的第四比例因子頻帶的比例因子值,例如“sf”=18。
當(dāng)以這種方式計(jì)算出了高頻帶內(nèi)的每一個(gè)比例因子頻帶的用于導(dǎo)出峰值的量化值為“1”的比例因子的時(shí)候(S14),第二量化單元345將計(jì)算所得的每一個(gè)比例因子頻帶的比例因子輸出給第二量化單元355作為高頻帶內(nèi)的子信息,然后結(jié)束處理。
子信息(比例因子)是通過第二量化單元345產(chǎn)生的,如上所述。如果對(duì)于在高頻帶內(nèi)的每一比例因子頻帶(在這種情況下,為4個(gè)頻帶),以頻譜數(shù)據(jù)的1024個(gè)取樣表示的子信息(比例因子)是以0到256的數(shù)字值表示的,那么它能夠用8比特來表示。而且,如果對(duì)應(yīng)比例因子的差是霍夫曼編碼的,很可能數(shù)據(jù)量會(huì)進(jìn)一步降低。另一方面,如果高頻帶內(nèi)的頻譜數(shù)據(jù)的1024個(gè)取樣被以傳統(tǒng)的低頻帶內(nèi)的處理方式被量化和霍夫曼編碼,預(yù)測(cè)的數(shù)據(jù)量至少為300比特。因此,該子信息僅是表示了高頻帶內(nèi)的各比例因子頻帶的一個(gè)比例因子,很明顯,與傳統(tǒng)方法中高頻帶的量化相比較,數(shù)據(jù)量明顯的減少了。
而且,比例因子表示了每一個(gè)比例因子頻帶內(nèi)的與峰值(絕對(duì)值)近似成比例的值,因此可以說高頻帶內(nèi)為固定值的1024個(gè)取樣的頻譜數(shù)據(jù)或者通過將低頻帶內(nèi)的部分或者全部頻譜數(shù)據(jù)的拷貝與比例因子相乘所獲得的頻譜數(shù)據(jù)大致的重建了根據(jù)輸入音頻信號(hào)所獲得的頻譜數(shù)據(jù)。而且,對(duì)于每一個(gè)比例因子頻帶,頻譜數(shù)據(jù)能夠通過將頻帶內(nèi)的每一個(gè)頻譜數(shù)據(jù)乘以作為一個(gè)系數(shù)的比值來更為精確的重建,該比值是帶該頻帶復(fù)制的頻譜數(shù)據(jù)的絕對(duì)最大值與利用與該頻帶相對(duì)應(yīng)的比例因子值對(duì)量化值“1”進(jìn)行解量化所得到的值之比。而且,高頻帶內(nèi)的波形的差異沒有低頻帶內(nèi)的差異明顯,因此上述獲得的子信息足夠用作表示高頻帶內(nèi)的波形的信息。
在本實(shí)施例中,比例因子被計(jì)算從而使得高頻帶內(nèi)的每一個(gè)比例因子頻帶內(nèi)的頻譜數(shù)據(jù)的量化值為“1”,但是它并不需要總為“1”,可以為其它的值。
第二量化單元345產(chǎn)生的子信息被第二編碼單元355霍夫曼編碼,并被流輸出單元390作為第二編碼信號(hào)存儲(chǔ)在傳統(tǒng)的解碼設(shè)備所忽略的或者其操作沒有被定義的比特流的區(qū)域中。
附圖8A~8C是表明圖2所示的流輸出單元390存儲(chǔ)的子信息的比特流的區(qū)域的圖。在這些圖中,表示高頻帶內(nèi)的頻譜的子信息被編碼,然后作為第二編碼信號(hào)被存儲(chǔ)在比特流中沒有被識(shí)別為第二音頻編碼信號(hào)的區(qū)域。
在附圖8A中,陰影部分是被稱為填充部分(fill element)的一區(qū)域,它被填入”0”從而一致化比特流的數(shù)據(jù)長度。即使表示高頻帶內(nèi)的頻譜的子信息,就是第二編碼信號(hào),被存儲(chǔ)在該區(qū)域,在傳統(tǒng)的解碼設(shè)備2000中,它不會(huì)被識(shí)別為將被解碼的編碼信號(hào)而被忽略。
在附圖8B中,例如陰影部分是被稱為數(shù)據(jù)流部分(DSE)的區(qū)域。該區(qū)域在MPEG-2 AAC的未來擴(kuò)展的預(yù)期中被提供,并且只有其物理結(jié)構(gòu)在MPEG-2 AAC中被定義。如在填充部分中,即使表示高頻帶內(nèi)的頻譜的子信息被存儲(chǔ)在該區(qū)域,傳統(tǒng)的解碼設(shè)備2000將其忽略,或者由于應(yīng)由傳統(tǒng)的解碼設(shè)備2000執(zhí)行的操作沒有被定義,其不會(huì)響應(yīng)于讀取信息而執(zhí)行任何操作。
在上面的描述中,包含在MPEG-2 AAC比特流中的第二編碼信號(hào)被存儲(chǔ)在一個(gè)被傳統(tǒng)的解碼設(shè)備2000所忽略的區(qū)域中。但是,第二編碼信號(hào)可以被集成到報(bào)頭信息的一個(gè)預(yù)定的區(qū)域內(nèi),或者第一編碼信號(hào)的預(yù)定區(qū)域內(nèi),或者報(bào)頭和第一編碼信號(hào)二者的區(qū)域中。為了在比特流中存儲(chǔ)第二編碼信號(hào)不需要保證報(bào)頭信息和第一編碼信號(hào)的連續(xù)區(qū)域。例如,第二編碼信號(hào)可以直接集成到報(bào)頭信息和第一編碼信息之間,如圖8C所示。
附圖9A和9B表明圖2所示的流輸出單元390存儲(chǔ)的子信息的比特流的區(qū)域的其它實(shí)施例的圖。附圖9A表明一個(gè)流1,在該流中,在每一幀內(nèi)僅有第一編碼信號(hào)被連續(xù)存儲(chǔ)。附圖9B表明一個(gè)流2,在該流中在每一幀中僅有第二編碼信號(hào),就是編碼的子信息被連續(xù)存儲(chǔ)與流1相對(duì)應(yīng)。
流輸出單元390可以存儲(chǔ)流2中的第二編碼信號(hào),流2與其中存儲(chǔ)著第一編碼信號(hào)的流1完全不同。例如,流1和流2是通過不同的信道傳送的比特流。
如上所述,由于表示輸入音頻信號(hào)的基本信息的低頻帶通過在完全不同的比特流中傳送第一和第二編碼信號(hào)而被預(yù)先傳送或者存儲(chǔ),就產(chǎn)生了一個(gè)效果,如果必須的話,可以在后面加上高頻帶的信息。
在附圖8A和8B以及附圖9A和9B所示的格式中,表明是實(shí)際采樣頻率一半的22.05kHz的信息被存儲(chǔ)在表明將被存儲(chǔ)在報(bào)頭中的比特流的采樣頻率的信息當(dāng)中。因此,即使現(xiàn)有技術(shù)1中的解碼設(shè)備2000在向下采樣的情況下也能夠解碼頻率在0~11.025kHz的頻帶內(nèi)的比特流并能夠?qū)⑵湓偕?br>
本實(shí)施例的編碼設(shè)備300的方法和現(xiàn)有技術(shù)1的編碼設(shè)備1000的方法的區(qū)別將參照附圖10A和10B進(jìn)行解釋。附圖10A和10B示出了本實(shí)施例與現(xiàn)有技術(shù)1的方法之間的比較。特別是,附圖10A表明了本實(shí)施例中的方法,附圖10B表明了現(xiàn)有技術(shù)1中的方法。
根據(jù)本實(shí)施例的方法,在44.1kHz的采樣頻率每隔22.7μ秒獲得一串音頻數(shù)據(jù)串,總共4096個(gè)取樣數(shù)據(jù),就是,包含在將被編碼的一幀中的2048個(gè)取樣和該幀前后的兩組1024個(gè)取樣,這些數(shù)據(jù)被分離并被執(zhí)行MDCT,然后就獲得了頻譜數(shù)據(jù)的2048個(gè)取樣。該頻譜數(shù)據(jù)的再生帶寬表示22.05kHz。頻譜數(shù)據(jù)的這些2048個(gè)取樣以11.025kHz為界限被劃分成低頻帶內(nèi)的頻譜數(shù)據(jù)(1024個(gè)取樣)和高頻帶內(nèi)的頻譜數(shù)據(jù)(1024個(gè)取樣)。低頻帶內(nèi)的頻譜數(shù)據(jù)(1024個(gè)取樣)以通常的方式被量化和編碼,這樣就獲得了如向下取樣的具有較高質(zhì)量的以及低比特率的第一編碼信號(hào)。并且高頻帶的1024個(gè)取樣的頻譜數(shù)據(jù)也被得到。如果這些數(shù)據(jù)被以通常的方式量化和編碼,就無法實(shí)現(xiàn)低比特率。因此,在本實(shí)施例的方法中,根據(jù)高頻帶內(nèi)的頻譜數(shù)據(jù)的1024個(gè)取樣產(chǎn)生一個(gè)子信息,通過僅對(duì)該子信息進(jìn)行編碼獲得了第二編碼信號(hào)。因此一個(gè)音頻信號(hào)能夠被編碼從而再生高質(zhì)量的聲音,同時(shí)基本上不會(huì)增加信息總量。
另一方面,在現(xiàn)有技術(shù)1的向下采樣的方法中,在22.05kHz的采樣頻率每隔45μ秒獲得一串音頻數(shù)據(jù)串,總共2048個(gè)取樣數(shù)據(jù),就是包含在將被編碼的一幀中的1024個(gè)取樣以及在該幀前后的兩組512個(gè)取樣,這些數(shù)據(jù)被分離并被執(zhí)行MDCT,然后就獲得了頻譜數(shù)據(jù)的1024個(gè)取樣。該頻譜數(shù)據(jù)的再生帶寬表示11.025kHz。頻譜數(shù)據(jù)的1024個(gè)取樣以通常的方式被量化和編碼。這樣,就能夠獲得在11.025kHz或者更小的帶寬內(nèi)的高質(zhì)量的編碼信號(hào),但是無法獲得高于11.025kHz的高頻帶內(nèi)的編碼信號(hào),因?yàn)樵诟哳l帶內(nèi)沒有頻譜數(shù)據(jù)。
接下來,將參照附圖11A和11B描述本實(shí)施例的編碼設(shè)備300的方法和現(xiàn)有技術(shù)2的編碼設(shè)備的方法之間的區(qū)別。
附圖11A和11B表明了本實(shí)施利與現(xiàn)有技術(shù)2的方法之間的比較。特別是,附圖11A表明本實(shí)施例中的方法,附圖11B表明現(xiàn)有技術(shù)2的方法。由于本實(shí)施例中的方法已經(jīng)在上面解釋過了,這里將省略有關(guān)的描述。
在現(xiàn)有技術(shù)2的采樣方法中,以在44.1kHz的采樣頻率每隔22.7μ秒獲得一串音頻數(shù)據(jù)串,總共2048個(gè)取樣數(shù)據(jù),就是包含在將被編碼的一幀中的1024個(gè)取樣以及在該幀前后的兩組512個(gè)取樣,這些數(shù)據(jù)被分離并被執(zhí)行MDCT,然后就獲得了頻譜數(shù)據(jù)的1024個(gè)取樣。該頻譜數(shù)據(jù)的再生帶寬表示22.05kHz。頻譜數(shù)據(jù)的1024個(gè)取樣以通常的方式被量化和編碼。換句話說,每隔本實(shí)施例中的時(shí)間長度(22.7msec)的一半的時(shí)間獲得了頻譜數(shù)據(jù)的1024個(gè)取樣(11.025kHz或者更低的低頻帶內(nèi)的512個(gè)取樣和高于11.025kHz的高頻帶內(nèi)的512個(gè)取樣)。
這里,假設(shè)在現(xiàn)有技術(shù)2的編碼設(shè)備1000中,如同本發(fā)明的實(shí)施例中的情況一樣,自高于11.025到22.05kHz的高頻帶內(nèi)的頻譜數(shù)據(jù)產(chǎn)生子信息。在這種情況下,當(dāng)能夠在每隔22.7msec進(jìn)行的量化中使用的比特?cái)?shù)目是“n”并且能夠被用作子信息的比特?cái)?shù)目為“m1”的時(shí)候,低頻帶(0-11.025kHz)內(nèi)的512個(gè)取樣需要利用(n-m1)個(gè)比特來量化。另一方面,在本實(shí)施例中,當(dāng)能夠在每隔45.4msec進(jìn)行的量化中使用的比特?cái)?shù)目是“2xn”并且能夠被用作子信息的比特?cái)?shù)目是“m2”的時(shí)候,低頻帶(0~11.025kHz)內(nèi)的1024個(gè)取樣可用(2xn-m2)個(gè)比特來量化。
順便提一下,如眾所周知的,根據(jù)AAC,如果不能獲得一定數(shù)目或者更多的取樣,就無法實(shí)現(xiàn)高的編碼效率?,F(xiàn)有技術(shù)2中的512個(gè)取樣沒有達(dá)到門限值,而本實(shí)施例中的1024個(gè)取樣卻大大的超出了該門限值。
因此,根據(jù)本實(shí)施例,如果1024個(gè)取樣被利用(2xn-m2)個(gè)比特來量化,而不是像現(xiàn)有技術(shù)2那樣利用(n-m1)個(gè)取樣對(duì)512個(gè)取樣進(jìn)行量化,就能夠?qū)崿F(xiàn)更高的編碼效率。而且,由于在本實(shí)施例中實(shí)現(xiàn)了更高的編碼效率,“m2”可以更大(m2>2×x1),因此高頻帶內(nèi)的聲音質(zhì)量能夠被改善。
附圖12表明了本實(shí)施例與現(xiàn)有技術(shù)1和2的編碼方法中的頻譜數(shù)據(jù)和特性的比較。
在本實(shí)施例中,采樣頻率是44.1kHz,幀長度為2048個(gè)取樣。因此,就能夠獲得在0~11.025kHz的低頻帶內(nèi)的頻譜數(shù)據(jù)的1024個(gè)取樣以及基于高頻帶內(nèi)的1024個(gè)頻譜數(shù)據(jù)的子信息。結(jié)果是,帶寬與現(xiàn)有技術(shù)2中的帶寬近乎相同,但是比現(xiàn)有技術(shù)1的帶寬寬。而且,在0~11.025kHz的低頻帶內(nèi)的聲音質(zhì)量與現(xiàn)有技術(shù)1的相同,但是就整體而言在高于11.025kHz的高頻帶內(nèi)的聲音質(zhì)量更高,因?yàn)樵诒緦?shí)施例中具有子信息。此外,由于具有子信息,本實(shí)施例在高于11.025kHz到22.05kHz的高頻帶內(nèi)的聲音質(zhì)量與現(xiàn)有技術(shù)2的相同,但是在0~11.025kHz的低頻帶內(nèi)的聲音質(zhì)量更高,因?yàn)轭l譜數(shù)據(jù)的數(shù)目被加倍。這樣,整體而言,本實(shí)施例中的聲音質(zhì)量較高。
另一方面,在現(xiàn)有技術(shù)1中,采樣頻率為22.05kHz,幀長度為1024個(gè)取樣。頻譜數(shù)據(jù)的1024個(gè)取樣在0~11.025kHz的低頻帶內(nèi)獲得。結(jié)果是,現(xiàn)有技術(shù)1的帶寬較窄僅為本實(shí)施例的一半。因此,0~11.025kHz的低頻帶內(nèi)的聲音質(zhì)量與本實(shí)施例中的相同,但是在高于11.025kHz到22.05kHz的高頻帶內(nèi)的聲音質(zhì)量低于本實(shí)施例,因?yàn)楝F(xiàn)有技術(shù)1中在高頻帶內(nèi)沒有頻譜數(shù)據(jù)。因此,就整體而言,現(xiàn)有技術(shù)1的聲音質(zhì)量較低。
而且,在現(xiàn)有技術(shù)2中,采樣頻率為44.1kHz,幀長度為1024個(gè)取樣。頻譜數(shù)據(jù)的1024個(gè)取樣是在0~22.05kHz的整個(gè)頻帶內(nèi)獲得的。結(jié)果是,現(xiàn)有技術(shù)2的帶寬與本實(shí)施例相同,但是因?yàn)轭l譜數(shù)據(jù)的數(shù)目被減少為一半,在0~11.025kHz的低頻帶內(nèi)的聲音質(zhì)量被劣化,低于本實(shí)施例。盡管由于頻譜數(shù)據(jù)被編碼,其在高于11.025kHz到22.05kHz的高頻帶內(nèi)高于本實(shí)施例。但是,就整體而言,現(xiàn)有技術(shù)2的聲音質(zhì)量較低。
因此,根據(jù)本實(shí)施例,通過以通常的方式編碼低頻帶內(nèi)的數(shù)據(jù)并且利用非常少量的信息編碼高頻帶內(nèi)的數(shù)據(jù),一個(gè)音頻信號(hào)就能夠被編碼從而再生高質(zhì)量的聲音,而不會(huì)增加信息的總量。
接下來,將詳細(xì)的描述在廣播系統(tǒng)1中的解碼設(shè)備400的每一個(gè)單元的解碼處理。
從流輸入單元410輸出的第一編碼信號(hào)被第一解碼單元420解碼成量化數(shù)據(jù)等,并被第一解量化單元430編碼成低頻帶內(nèi)的頻譜數(shù)據(jù)。另一方面,流輸入單元410輸出的第二解碼信號(hào)被第二解碼單元425解碼成子信息。第二解量化單元435根據(jù)該子信息產(chǎn)生高頻帶內(nèi)的頻譜數(shù)據(jù)。接下來將詳細(xì)描述第二解量化單元435的處理過程。
附圖13是一個(gè)表明附圖2中所示的第二解量化單元435將低頻帶內(nèi)的1024個(gè)取樣的頻譜沿前向方向(forward direction)上被復(fù)制到高頻帶的處理過程的流程圖。當(dāng)高頻帶內(nèi)的頻譜數(shù)據(jù)產(chǎn)生的時(shí)候,低頻帶內(nèi)的頻譜數(shù)據(jù)被復(fù)制。
在附圖13中,inv_spec1[i]表示從第一解量化單元430輸出的數(shù)據(jù)中的第i個(gè)頻譜的值,inv_spec2[j]表示從第二解量化單元435輸入的數(shù)據(jù)中的第j個(gè)頻譜的值。
首先,第二解量化單元435設(shè)定計(jì)數(shù)器i和計(jì)數(shù)器j的初始值為“0”,而計(jì)數(shù)器計(jì)數(shù)頻譜數(shù)據(jù)的數(shù)目,從而在同一方向上輸入從0到第1023個(gè)頻譜數(shù)據(jù)(S71)。接下來,第二解量化單元435檢查計(jì)數(shù)器i的值是否小于“1024”(S72)。當(dāng)計(jì)數(shù)器i的值小于“1024”的時(shí)候,第二解量化單元435輸入第一解量化單元430的低頻帶內(nèi)的第i個(gè)(在這種情況下為第0個(gè))頻譜數(shù)據(jù)的值作為第二解量化單元435的高頻帶內(nèi)的第j個(gè)(在這種情況下為第0個(gè))頻譜數(shù)據(jù)的值(S73)。然后,第二解量化單元435分別將計(jì)算器i和計(jì)數(shù)器j的值加1(S74),并檢查計(jì)算器i的值是否小于“1024”(S72)。
當(dāng)計(jì)算器i的值小于“1024”的時(shí)候,第二解量化單元435重復(fù)上述的過程,當(dāng)其值成為“1024”或者更大的時(shí)候,該處理過程結(jié)束。
結(jié)果是,作為第一解量化單元430的解量化結(jié)果的低頻帶內(nèi)的所有的第0~1023個(gè)頻譜數(shù)據(jù)被復(fù)制成第二解量化單元435的高頻帶內(nèi)的頻譜數(shù)據(jù)。
根據(jù)第二解碼單元425解碼的子信息復(fù)制的頻譜數(shù)據(jù)的幅度,就是,用于推導(dǎo)出峰值“1”的比例因子的值,被調(diào)整,并且被調(diào)整的頻譜數(shù)據(jù)被輸出作為高頻帶的頻譜數(shù)據(jù)。幅度是通過將頻帶內(nèi)的每一個(gè)頻譜數(shù)據(jù)乘以一個(gè)比值來調(diào)整的,該比值是該頻帶內(nèi)的復(fù)制頻譜數(shù)據(jù)的絕對(duì)最大值與通過使用與該頻帶相應(yīng)的比例因子的值對(duì)量化值“1”進(jìn)行解量化而獲得的值之間的比,該比值作為每一個(gè)比例因子頻帶的一個(gè)系數(shù)。這里,第二解量化單元435輸出的頻譜數(shù)據(jù)的取樣數(shù)據(jù)的最大數(shù)目是1024,它們表示高于11.025kHz的再生帶寬。
用于將低帶頻帶內(nèi)的1024個(gè)頻譜數(shù)據(jù)沿頻率軸的前向方向復(fù)制到高頻帶內(nèi)的處理過程在圖13中示出,但是它們也可以在相反的方向上被復(fù)制,如圖14所示。
附圖14是一個(gè)表示附圖2中所示的第二解量化單元435將低頻帶內(nèi)的1024個(gè)頻譜沿頻率軸的相反方向復(fù)制到高頻帶內(nèi)的處理過程的流程圖。在附圖14中,如同附圖13中的情況,inv_spec1[i]表示從第一解量化單元430輸出的數(shù)據(jù)中的第i個(gè)頻譜數(shù)據(jù)的值,inv_spec2[j]表示從第二解量化單元435輸入的數(shù)據(jù)中的第j個(gè)頻譜數(shù)據(jù)的值。
首先,第二解量化單元435設(shè)定計(jì)算器i的初始值為“0”,計(jì)數(shù)器j的初始值為“1023”,其計(jì)數(shù)頻譜數(shù)據(jù)的數(shù)目,從而在相反方向上輸入從0到第1023個(gè)頻譜數(shù)據(jù)(S81)。接下來,第二解量化單元435檢查計(jì)數(shù)器i的值是否小于“1024”(S82)。當(dāng)計(jì)數(shù)器i的值小于“1024”的時(shí)候,第二解量化單元435輸入第一解量化單元430的低頻帶內(nèi)的第i個(gè)(在這種情況下為第0個(gè))頻譜數(shù)據(jù)的值作為第二解量化單元435的高頻帶內(nèi)的第j個(gè)(在這種情況下為第0個(gè))頻譜數(shù)據(jù)的值(S83)。然后,第二解量化單元435將計(jì)算器i的值加“1”,計(jì)數(shù)器j的值減1(S84),并檢查計(jì)算器i的值是否小于“1024”(S82)。
當(dāng)計(jì)算器i的值小于“1024”的時(shí)候,第二解量化單元435重復(fù)上述的過程,當(dāng)其值成為“1024”或者更大的時(shí)候,該處理過程結(jié)束。
結(jié)果是,作為第一解量化單元430的解量化結(jié)果的低頻帶內(nèi)的所有的第0~1023個(gè)頻譜數(shù)據(jù)在相反方向上被復(fù)制成第二解量化單元435的高頻帶內(nèi)的第0~1023個(gè)頻譜數(shù)據(jù)。
與前面相同,根據(jù)第二解碼單元425解碼的子信息復(fù)制的頻譜數(shù)據(jù)的幅度,就是,用于推導(dǎo)出峰值“1”的比例因子的值,被調(diào)整,并且被調(diào)整的頻譜數(shù)據(jù)被輸出作為高頻帶的數(shù)據(jù)。幅度是通過對(duì)于每一個(gè)比例因子頻帶內(nèi)將頻帶的每一個(gè)頻譜數(shù)據(jù)乘以一個(gè)作為系數(shù)的比值來調(diào)整的,該比值是頻帶內(nèi)復(fù)制的頻譜數(shù)據(jù)的絕對(duì)最大值與通過使用與該頻帶相應(yīng)的比例因子的值對(duì)量化值“1”進(jìn)行解量化而獲得的值之間的比。這里,第二解量化單元435輸出的頻譜數(shù)據(jù)的取樣數(shù)據(jù)的最大數(shù)目是1024,它們表示高于11.025kHz的再生帶寬。
在本實(shí)施例中,第二解量化單元435將低頻帶內(nèi)的所有頻譜數(shù)據(jù)復(fù)制到高頻帶內(nèi),但是它也可以僅復(fù)制其中的一部分。
已經(jīng)參照附圖13和14描述了一次全部復(fù)制高頻帶和低頻帶的處理過程的例子。但是,它們中的一部分可以根據(jù)圖13所示的過程復(fù)制,另一部分根據(jù)圖14所示的過程復(fù)制。
而且,它們中的部分或者全部可以通過將它們的正負(fù)符號(hào)倒轉(zhuǎn)而被復(fù)制。
這些復(fù)制過程可以是預(yù)定的,或者可以根據(jù)低頻帶內(nèi)的數(shù)據(jù)而改變,或者作為子信息而被傳送。
在本實(shí)施例中,低頻帶內(nèi)的頻譜數(shù)據(jù)被復(fù)制作為高頻帶內(nèi)的數(shù)據(jù),但是本發(fā)明并不局限于此,并且高頻帶內(nèi)的頻譜數(shù)據(jù)可以僅根據(jù)第二編碼信息而產(chǎn)生。
在本實(shí)施例中,對(duì)于在第二解量化單元435中的噪聲的產(chǎn)生,描述了主要由第一解量化單元430獲得的頻譜數(shù)據(jù)被復(fù)制的情況。但是,本發(fā)明并不局限于此,頻譜數(shù)據(jù),白噪聲,粉紅噪聲等在高頻帶內(nèi)的每一個(gè)比例因子頻帶內(nèi)具有特定值的數(shù)據(jù)都可以以其自己的方式在第二解量化單元435中被產(chǎn)生,或者根據(jù)子信息而產(chǎn)生。
從第二解量化單元435輸出的頻譜數(shù)據(jù)的1024個(gè)取樣與解量化數(shù)據(jù)集成單元440中的第一解量化單元430輸出的1024個(gè)頻譜數(shù)據(jù)集成,并被執(zhí)行MDCT,將其變換成時(shí)間域的音頻數(shù)據(jù),然后以44.1kHz的采樣頻率進(jìn)行D/A轉(zhuǎn)換,接下來具有0~22.05kHz的再生帶寬的音頻信號(hào)就被再生。
如上所述,根據(jù)本發(fā)明,2048個(gè)取樣的頻譜數(shù)據(jù)中的第一個(gè)1024個(gè)取樣以通常的方式使用MDCT和IMDC被編碼,具有傳統(tǒng)方式兩倍的變換長度,后面的一半1024個(gè)取樣被用比傳統(tǒng)方式少量的信息編碼,兩個(gè)頻譜數(shù)據(jù)都被集成從而用于解碼。
由于用于編碼后面的一半1024個(gè)取樣的頻譜數(shù)據(jù)所需的信息量可被降低,用于編碼前面的一半的1024個(gè)取樣的頻譜數(shù)據(jù)所需的信息量能夠被增加,因此,高于寬帶寬的頻譜數(shù)據(jù)能夠被編碼,同時(shí)低頻帶內(nèi)的原始信號(hào)的再生精度能夠被提高。
而且,本實(shí)施例中的編碼設(shè)備所產(chǎn)生的比特流能夠被傳統(tǒng)的解碼設(shè)備所解碼。
接下來,將解釋子信息和其解碼的各種變型。
附圖15示出了表明圖2所示的第二量化單元345所產(chǎn)生的其它子信息(量化值)的實(shí)施例的頻譜波形。附圖16是一個(gè)表明在圖2中所示的第二量化單元345所執(zhí)行的其它子信息(量化值)的計(jì)算處理的操作流程圖。
第二量化單元345預(yù)先設(shè)定了一個(gè)比例因子的值,例如“18”,該比例因子對(duì)于具有高于11.025kHz到22.05kHz的再生帶寬的高頻帶內(nèi)的所有比例因子頻帶是共同的,使用該比例因子值“18”在每一個(gè)比例因子頻帶內(nèi)計(jì)算絕對(duì)最大的頻譜數(shù)據(jù)(峰值)的量化值(S21)。
第二量化單元345指定具有高于11.025kHz的再生帶寬的高頻帶內(nèi)的第一比例因子頻帶內(nèi)的絕對(duì)最大頻譜數(shù)據(jù)(峰值)(S22)。在附圖15所示的實(shí)施例中,①表示在第一個(gè)比例因子頻帶內(nèi)指定的峰值,在那時(shí)的峰值為“256”。
第二量化單元345通過將預(yù)定的共同的比例因子值“18”和峰值“256”代入到用于計(jì)算量化值的公式中來計(jì)算量化的值(S23)。例如,如果峰值“256”利用比例因子值“18”來量化,計(jì)算的量化值為“6”。
當(dāng)為第一比例因子帶寬計(jì)算出峰值“256”的量化值“6”的時(shí)候(S24),第二量化單元345就指定下一個(gè)比例因子頻帶內(nèi)的頻譜數(shù)據(jù)的峰值(S22)。如果指定的峰值位置是②,并且峰值為“312”,例如,那么利用比例因子值“18”計(jì)算峰值“312”的量化值“10”(S23)。
以同樣的方式,第二量化單元345利用比例因子值“18”計(jì)算高頻帶的第三個(gè)比例因子頻帶的峰值③“288”的量化值“9”,并且利用比例因子值“18”計(jì)算第四比例因子頻帶的峰值④“203”的量化值“5”。
當(dāng)利用固定的比例因子值“18”計(jì)算了高頻帶內(nèi)的所有比例因子頻帶的峰值的量化值的時(shí)候(S24),第二量化單元345將計(jì)算所得的每一個(gè)比例因子頻帶的量化值輸出給第二編碼單元355作為高頻帶的子信息,然后結(jié)束了該處理。
如上所述,第二量化單元345產(chǎn)生了子信息(量化值)。該子信息分別以4比特的量化值表示以頻譜數(shù)據(jù)的1024個(gè)取樣表示的高頻帶內(nèi)的4個(gè)比例因子頻帶,而上述的子信息(比例因子)分別以8比特的頻譜數(shù)據(jù)表示高頻帶內(nèi)的4個(gè)比例因子頻帶。因此,在量化值的情況下,高頻帶內(nèi)的數(shù)據(jù)量極大的減少。而且,該量化的值大致的表示了每一個(gè)比例因子頻帶的峰值的幅度(絕對(duì)值),也可以說取固定值的高頻帶內(nèi)的頻譜數(shù)據(jù)的1024個(gè)取樣或者僅僅通過將低頻帶內(nèi)的部分或全部頻譜數(shù)據(jù)的拷貝乘以量化值所獲得的頻譜數(shù)據(jù)大致的重建了根據(jù)輸入音頻信號(hào)所獲得的頻譜數(shù)據(jù)。而且,對(duì)于每一個(gè)比例因子頻帶,頻譜數(shù)據(jù)能夠通過將頻帶內(nèi)的每一個(gè)頻譜數(shù)據(jù)乘以一個(gè)作為系數(shù)的比值來更加精確的重建,該比值是頻帶內(nèi)復(fù)制的頻譜數(shù)據(jù)的絕對(duì)最大值與解量化與該頻帶相對(duì)應(yīng)的量化值所獲得的值之間的比。
在本實(shí)施例中,與將被作為第二編碼信息傳送的量化值相對(duì)應(yīng)的比例因子值被預(yù)先設(shè)定,但是最佳的比例因子值可以被計(jì)算并被加入到第二編碼信息中被傳送。例如,如果用于得到量化值的最大值“7”的比例因子被選定,表示量化值的比特?cái)?shù)目僅為“3”,因此用于傳送量化值所需的信息數(shù)量就會(huì)極大的降低。
附圖17表明了表示圖2所示的第二量化單元345所產(chǎn)生的另一個(gè)子信息(位置信息)的例子的頻譜波形。附圖18是一個(gè)流程圖,表明了圖2所示的第二量化單元345所執(zhí)行的另一個(gè)子信息(位置信息)的計(jì)算處理的操作過程。
第二量化單元345根據(jù)接下來的處理過程在具有高于11.025kHz到22.05kHz的再生帶寬的高頻帶內(nèi)的每一個(gè)比例因子頻帶內(nèi)指定絕對(duì)值最大的頻譜數(shù)據(jù)的位置(S31)。
第二量化單元345在具有高于11.025kHz的再生帶寬的高頻帶內(nèi)的第一個(gè)比例因子頻帶內(nèi)指定的絕對(duì)值最大的頻譜數(shù)據(jù)(峰值)(S32)。在附圖17所示的實(shí)施例中,①表示在第一個(gè)比例因子頻帶內(nèi)指定的峰值和從該比例因子頻帶的第一個(gè)數(shù)據(jù)開始的第22個(gè)頻譜數(shù)據(jù)。第二量化單元345保持該指定的峰值位置“從該比例因子頻帶的第一個(gè)開始的第22個(gè)頻譜數(shù)據(jù)”(S33)。
當(dāng)對(duì)于第一個(gè)比例因子頻帶的峰值位置被指定并被保持的時(shí)候(S34),第二量化單元345就指定下一個(gè)比例因子頻帶內(nèi)的頻譜數(shù)據(jù)的峰值(S32)。例如,指定的峰值被定位在②并且在該頻帶內(nèi)從第一個(gè)開始的第60個(gè)頻譜數(shù)據(jù)(S32)。第二量化單元345保持該指定的峰值位置“從該比例因子頻帶的第一個(gè)開始的第60個(gè)頻譜數(shù)據(jù)”(S33)。
以同樣的方式,第二量化單元345指定并保持高頻帶的第三個(gè)比例因子頻帶內(nèi)的峰值位置③“該比例因子頻帶的第一個(gè)頻譜數(shù)據(jù)”以及指定并保持第四個(gè)比例因子頻帶內(nèi)的峰值位置④“從該比例因子頻帶內(nèi)的第一個(gè)開始的第25個(gè)頻譜數(shù)據(jù)”。
當(dāng)高頻帶內(nèi)的所有比例因子頻帶的峰值位置都被指定并保持的時(shí)候(S34),第二量化單元345將保持的比例因子頻帶的峰值位置輸出到第二編碼單元355作為高頻帶的子信息,然后該處理過程結(jié)束。
如上所述,第二量化單元345產(chǎn)生了子信息(位置信息)。該子信息(位置信息)分別以6個(gè)比特的位置信息表示以頻譜數(shù)據(jù)的1024個(gè)取樣表示的高頻帶中的4個(gè)比例因子頻帶。
在這種情況下,根據(jù)從第二解碼單元425輸入的子信息(位置信息),解碼設(shè)備400中的第二解量化單元435復(fù)制低頻帶內(nèi)的頻譜數(shù)據(jù)的部分或者所有1024個(gè)取樣,將其作為高頻帶內(nèi)的取樣數(shù)據(jù)的1024個(gè)取樣。低頻帶的頻譜數(shù)據(jù)可以通過在一個(gè)或多個(gè)比例因子頻帶內(nèi)根據(jù)頻譜數(shù)據(jù)的峰值信息從第一解量化單元430輸出的頻譜數(shù)據(jù)中抽取相似的數(shù)據(jù),然后將其部分或者全部復(fù)制的方法而被復(fù)制。而且,如果需要的話,第二解量化單元435調(diào)整復(fù)制的頻譜數(shù)據(jù)的幅度。幅度可以通過將每一個(gè)頻譜數(shù)據(jù)乘以一個(gè)預(yù)定的系數(shù),例如“0.5”來調(diào)整。該系數(shù)可以是一個(gè)固定的值,或者隨每一個(gè)帶寬或比例因子頻帶而改變,或者隨第一解量化單元430所輸出的頻譜數(shù)據(jù)而變化。
在本實(shí)施例中,使用了一個(gè)預(yù)定的系數(shù),但是該系數(shù)值可以被加到第二編碼信息中作為子信息?;蛘弑壤蜃又悼梢员患拥降诙幋a信息中作為一個(gè)系數(shù),或者比例因子頻帶內(nèi)的峰值的量化值可以被加到第二編碼信息中作為一個(gè)系數(shù)。幅度調(diào)整方法并不局限于上述的方法,也可以使用其它的方法。
在本實(shí)施例中,只有位置信息或者只有位置信息和系數(shù)信息被編碼,但是本發(fā)明并不局限于此。一個(gè)比例因子,一個(gè)量化值,頻譜的符號(hào)信息,噪聲產(chǎn)生方法等都可以被編碼?;蛘咚鼈冎械膬蓚€(gè)或多個(gè)的組合也可以被編碼。
此外,在本實(shí)施例中,低頻帶內(nèi)的頻譜數(shù)據(jù)被復(fù)制作為高頻帶內(nèi)的頻譜數(shù)據(jù)。但是,本發(fā)明并不局限于此,高頻帶內(nèi)的頻譜數(shù)據(jù)也可以僅從第二編碼信息來產(chǎn)生。
附圖19表明了圖2所示的第二量化單元345所產(chǎn)生的其它的子信息(符號(hào)信息)的例子的頻譜波形。附圖20是一個(gè)流程圖,表明圖2所示的第二量化單元345所執(zhí)行的其它的子信息(符號(hào)信息)計(jì)算處理的操作過程。
第二量化單元345根據(jù)下面的處理過程,指定在具有高于11.025kHz到22.05kHz的再生帶寬的高頻帶的每一個(gè)比例因子頻帶的預(yù)定位置,例如在中央的頻譜數(shù)據(jù)的符號(hào)信息(S41)。
第二量化單元345檢查具有高于11.025kHz的再生頻帶的高頻帶內(nèi)的第一個(gè)比例因子頻帶內(nèi)的中央位置的頻譜數(shù)據(jù)的符號(hào)信息(S42),并保持該值。例如,第一個(gè)比例因子頻帶內(nèi)的中央位置的頻譜數(shù)據(jù)的符號(hào)為“+”。第二量化單元345以一個(gè)比特“1”的值表示該符號(hào)“+”并保持它。當(dāng)符號(hào)為“-”的時(shí)候,第二量化單元345用“0”表示并保持。
當(dāng)?shù)谝粋€(gè)比例因子頻帶內(nèi)的中央位置的頻譜數(shù)據(jù)的符號(hào)信息被保持的時(shí)候(S43),第二量化單元345檢查下一個(gè)比例因子頻帶內(nèi)的中央位置的頻譜數(shù)據(jù)的符號(hào)(S42)。例如,符號(hào)為“+”,第二量化單元345保持“1”并將其作為第二比例因子頻帶內(nèi)的中央位置的頻譜數(shù)據(jù)的符號(hào)信息。
以相同的方式,第二量化單元345檢查高頻帶內(nèi)的第三個(gè)比例因子頻帶的中央位置的頻譜數(shù)據(jù)的符號(hào)“+”,并保持符號(hào)信息“1”。第二量化單元345進(jìn)一步檢查第四個(gè)比例因子頻帶內(nèi)的中央位置的頻譜數(shù)據(jù)的符號(hào)“+”,并保持符號(hào)信息為“1”。
當(dāng)高頻帶內(nèi)的所有比例因子頻帶的中央位置的頻譜數(shù)據(jù)的符號(hào)信息都被保持的時(shí)候(S43),第二量化單元345將保持的比例因子頻帶的符號(hào)信息輸出給第二編碼單元355作為高頻帶的子信息,然后該處理過程結(jié)束。
如上所述,第二量化單元345產(chǎn)生了子信息(符號(hào)信息)。該子信息(符號(hào)信息)分別以一個(gè)比特的符號(hào)信息表示以頻譜數(shù)據(jù)的1024個(gè)取樣表示的高頻帶內(nèi)的4個(gè)比例因子頻帶,這樣,高頻帶的頻譜就能夠利用非常短的數(shù)據(jù)長度來表示。
在這種情況下,解碼設(shè)備400的第二解量化單元435復(fù)制低頻帶內(nèi)的1024個(gè)取樣的頻譜數(shù)據(jù)部分或者全部數(shù)據(jù),作為高頻帶的頻譜,然后根據(jù)第二解碼單元425輸入的符號(hào)信息,確定在一個(gè)預(yù)定的位置的頻譜數(shù)據(jù)的符號(hào)。
表示高頻帶內(nèi)的每一個(gè)比例因子頻帶的中央位置的符號(hào)的符號(hào)信息被用作子信息(符號(hào)信息)。但是,本發(fā)明并不局限于比例因子頻帶的中央位置,每一個(gè)峰值位置,每一個(gè)比例因子頻帶的第一個(gè)頻譜數(shù)據(jù)或者其它的預(yù)定位置都可以被使用。
在本實(shí)施例中,與將被傳送的符號(hào)(符號(hào)信息)相應(yīng)的頻譜數(shù)據(jù)的位置被預(yù)定,但是它也可以根據(jù)第一解量化單元430的輸出而變化,或者表明每一個(gè)比例因子頻帶的符號(hào)信息的位置的位置信息也可以被加入到第二編碼信息并被傳送。
而且,如果需要的話,第二解量化單元435調(diào)整復(fù)制的頻譜數(shù)據(jù)的幅度。幅度是通過將每一個(gè)頻譜數(shù)據(jù)乘以一個(gè)預(yù)定的系數(shù),例如“0.5”來調(diào)整的。
該系數(shù)可以是一個(gè)固定值,或者可以隨每一個(gè)帶寬或者比例因子頻帶而變化,或者根據(jù)第一解量化單元430輸出的頻譜數(shù)據(jù)而變化。幅度調(diào)整的方法并不局限于此,其它的方法也可以被使用。
在本實(shí)施例中,使用了一個(gè)預(yù)定的系數(shù),但是該系數(shù)值可以被加入到第二編碼信息中作為子信息?;蛘弑壤蜃又悼梢员患尤氲降诙幋a信息中作為一個(gè)系數(shù),或者一個(gè)量化的值被加入到第二編碼信息中作為一個(gè)系數(shù)。
在本實(shí)施例中,僅有符號(hào)信息,僅有符號(hào)信息和系數(shù)信息,或者僅有符號(hào)信息和位置信息被編碼,但是本發(fā)明并不局限于此。一個(gè)量化的值,一個(gè)比例因子,一個(gè)特性頻譜的位置信息,一個(gè)噪聲產(chǎn)生方法等都可以被編碼?;蛘咚鼈冎械膬蓚€(gè)或多個(gè)組合都可以被編碼。
此外,在本實(shí)施例中,低頻帶的頻譜數(shù)據(jù)被復(fù)制為高頻帶的頻譜數(shù)據(jù)。但是,本發(fā)明并不局限于此,高頻帶的頻譜數(shù)據(jù)也可以僅自第二編碼信息產(chǎn)生。
在本實(shí)施例中,符號(hào)“+”以1比特的值“1”表示,符號(hào)“-”以“0”表示。但是,本發(fā)明并不局限于子信息中(符號(hào)信息)的符號(hào)的這種表示,也可以使用其它的值。/附圖21A和21B表明了表示如何產(chǎn)生圖2所示的第二量化單元345所產(chǎn)生的其它子信息(復(fù)制信息)的例子的頻譜波形圖。附圖21A表明了高頻帶內(nèi)的第一個(gè)比例因子頻帶的頻譜波形。附圖21B表明了被指定的具有子信息(復(fù)制信息)的低頻帶的頻譜波形的例子。附圖22是一個(gè)流程圖,表明圖2所示的第二量化單元345所執(zhí)行的其它子信息(復(fù)制信息)的計(jì)算處理操作過程。
對(duì)于具有高于11.025kHz到22.05kHz的再生帶寬的高頻帶內(nèi)的每一個(gè)比例因子頻帶,第二量化單元345根據(jù)下面的處理過程指定低頻帶內(nèi)的比例因子頻帶的數(shù)目N(S51)。低頻帶內(nèi)的第N個(gè)比例因子頻帶被指定,因?yàn)樵擃l帶的峰值位置的值最接近高頻帶的比例因子頻帶的峰值位置“n”(從比例因子頻帶的第一個(gè)開始的第“n”個(gè)數(shù)據(jù))。
第二量化單元345在具有高于11.025kHz的再生帶寬的高頻帶的第一個(gè)比例因子頻帶內(nèi)指定絕對(duì)最大頻譜數(shù)據(jù)(峰值)的位置“n”(S52)。如圖21A所示,①表示指定的峰值“n”并且在該位置的頻譜數(shù)據(jù)值是n=22。
第二量化單元345指定具有11.025kHz或者更小的再生帶寬的低頻帶中的所有頻譜(包括正值和負(fù)值的頻譜)的峰值位置(S53)。
接下來,對(duì)于低頻帶內(nèi)指定的每個(gè)峰值,第二量化單元345搜索自第一個(gè)比例因子頻帶其峰值位置最靠近“n”的比例因子頻帶,并指定該比例因子頻帶的數(shù)目N,搜索的方向以及峰值的符號(hào)信息(S54)。
特別是,對(duì)于低頻帶內(nèi)的每一個(gè)指定的峰值(包括正負(fù)值),第二量化單元345從低頻帶一側(cè)順序搜索峰值位置最靠近“n”的第一個(gè)比例因子頻帶。有兩個(gè)搜索的方向(1)從低頻率方向的峰值搜索以及(2)從高頻率方向的峰值搜索。此外,對(duì)于低頻帶的峰值,其正負(fù)符號(hào)是從高頻帶反轉(zhuǎn)來的,也存在著兩種搜索方向,(3)從低頻率方向的峰值搜索,以及(4)從高頻率方向的峰值搜索。
在搜索方向?yàn)?2)和(4)的情況下,當(dāng)?shù)皖l帶的頻譜波形根據(jù)峰值信息被復(fù)制的時(shí)候,高頻帶的峰值位置和低頻帶的峰值位置從一端到另一端被反轉(zhuǎn)(沿頻率軸的方向),如圖21B所示。因此,需要附加表示搜索方向的信息(前向和反向),例如,(1)和(3)為前向搜索方向,(2)和(4)為反向搜索方向。而且,在搜索方向?yàn)?3)和(4)的情況下,高頻帶的峰值位置和低頻帶的峰值位置被向上和向下反轉(zhuǎn)(沿垂直軸方向),如圖21B所示。因此,需要附加表示高頻帶和低頻帶的峰值的正負(fù)符號(hào)是否被反轉(zhuǎn)的信息。
第二量化單元345在四個(gè)方向上進(jìn)行搜索,就是,如果在低頻帶內(nèi)指定的峰值為正的,搜索方向?yàn)?1)和(2),如果峰值為負(fù)的,搜索方向?yàn)?3)和(4),然后指定搜索結(jié)果中峰值位置最接近“n”的比例因子頻帶的數(shù)目。在這種情況下,一個(gè)特定的值,例如“5”被預(yù)定為“n”和實(shí)際峰值位置間的容限,第二量化單元345在四種搜索結(jié)果中選擇峰值位置最接近“n”的比例因子頻帶,并指定該比例因子頻帶的數(shù)目N。此外,還指定了表明高頻帶和低頻帶中的峰值的符號(hào)是否被反轉(zhuǎn)的信息以及表明搜索方向(前向或者反向)的信息。
例如,沿搜索方向(1),為低頻帶的頻譜指定與峰值位置的容限為“1”的數(shù)目N=3的比例因子頻帶,如圖21B(1)所示。相似的,在搜索方向(2),(3),(4),為低頻帶內(nèi)的頻譜指定與峰值位置的容限分別為“5”,“4”和“2”的數(shù)目N=18,N=12,N=10的比例因子頻帶。第二量化單元345在這些指定的四個(gè)數(shù)目的比例因子頻帶中選擇與峰值位置的容限為“1”且峰值位置最接近“n”的比例因子頻帶的數(shù)目N=3。此外,產(chǎn)生了表明低頻帶內(nèi)的峰值的符號(hào)“+”的符號(hào)信息“1”以及表明在低頻帶內(nèi)搜索的搜索方向信息“1”。在這種情況下,如果峰值的符號(hào)為“-”,符號(hào)信息是“0”,以及如果搜索是在高頻方向進(jìn)行的,搜索方向信息為“0”。
當(dāng)比例因子頻帶數(shù)目N=3的時(shí)候,為高頻帶內(nèi)的第一個(gè)比例因子頻帶內(nèi)指定符號(hào)信息“1”和搜索方向信息“1”(S55),第二量化單元345以與上述相同的方式指定下一個(gè)比例因子頻帶的數(shù)目N,符號(hào)信息和搜索方向信息。
以這種方式,低頻帶內(nèi)每一個(gè)比例因子頻帶的數(shù)目N,符號(hào)信息和搜索方向信息被指定,其距離第一個(gè)頻帶的峰值位置最靠近高頻帶內(nèi)從該比例因子頻帶的第一個(gè)開始的峰值位置“n”(S55)。然后,第二量化單元345將與高頻帶的每一個(gè)比例因子頻帶相對(duì)應(yīng)的低頻帶內(nèi)的比例因子頻帶的指定的數(shù)目N,符號(hào)信息和搜索方向信息輸出給第二編碼單元355作為高頻帶的子信息(復(fù)制信息),然后處理結(jié)束。
在這種情況下,如果第一編碼信號(hào)根據(jù)傳統(tǒng)的程序在解碼設(shè)備400中被解碼,低頻帶側(cè)的1024個(gè)取樣的頻譜數(shù)據(jù)就能夠獲得。第二解量化單元435復(fù)制與第二解碼單元425輸出的比例因子頻帶數(shù)目相應(yīng)的部分或者所有頻譜數(shù)據(jù)作為高頻帶內(nèi)的頻譜數(shù)據(jù)。如果需要的話,第二解量化單元435調(diào)整復(fù)制的頻譜數(shù)據(jù)的幅度。幅度是通過將每一個(gè)頻譜乘以一個(gè)預(yù)定的系數(shù),例如“0.5”來調(diào)整的。
系數(shù)可以是一個(gè)固定值,或者對(duì)于每一個(gè)比例因子頻帶可被改變,或者隨著第一解量化單元430輸出的頻譜數(shù)據(jù)可被改變。
在本實(shí)施例中,使用了一個(gè)預(yù)定的系數(shù),但是該系數(shù)值可以被加入到第二編碼信息作為子信息?;蛘弑壤蜃又悼梢员患尤氲降诙幋a信息中作為一個(gè)系數(shù),或者量化值可以被加入到第二編碼信息中作為一個(gè)系數(shù)。而且,幅度調(diào)整方法并不局限于上述的方法,任何其它的方法也可以被使用。
在本實(shí)施例中,符號(hào)信息和搜索方向信息,以及比例因子頻帶的數(shù)目N被抽取作為高頻帶的子信息(復(fù)制信息)。但是,根據(jù)高頻帶內(nèi)可傳送的信息數(shù)量,符號(hào)信息和搜索方向信息可以被忽略。而且,當(dāng)?shù)皖l帶的峰值符號(hào)為“+”的時(shí)候,符號(hào)信息用“1”來表示,以及當(dāng)符號(hào)為“-”的時(shí)候,用“0”表示。當(dāng)搜索是從低頻率方向的峰值進(jìn)行的時(shí)候,搜索方向信息用“1”表示,當(dāng)搜索是從高頻帶方向的峰值進(jìn)行的時(shí)候,其用“0”表示。但是,在符號(hào)信息中的低頻帶內(nèi)的峰值的符號(hào)以及在搜索方向信息中的搜索方向并不局限于此,它們可以以其它的值表示。
而且,在本實(shí)施例中,低頻帶內(nèi)的從第一個(gè)開始的指定的峰值位置最接近“n”的第一個(gè)比例因子頻帶被搜索。但是,本發(fā)明并不局限于此,從低頻帶內(nèi)的比例因子頻帶的第一個(gè)頻帶開始的峰值位置最接近“n”的峰值也可被搜索。
附圖23示出了一個(gè)表明如何建立圖2中所示的第二量化單元345所產(chǎn)生的其它子信息(復(fù)制信息)的第二個(gè)例子的頻譜波形圖。附圖24是一個(gè)流程圖,表明了圖2所示的第二量化單元345所執(zhí)行的其他子信息(復(fù)制信息)的第二種計(jì)算處理的操作過程。
對(duì)于具有高于11.025kHz到22.05kHz的再生帶寬的高頻帶內(nèi)的每一個(gè)比例因子頻帶,第二量化單元345根據(jù)下面的處理過程,指定低頻帶內(nèi)的比例因子頻帶的數(shù)目N,其為與高頻帶內(nèi)的比例因子頻帶的每一個(gè)頻譜的差(能量差)為最小的頻帶(S61)。在這種情況下,低頻帶內(nèi)的頻譜數(shù)據(jù)的數(shù)目等于高頻帶內(nèi)的頻譜數(shù)據(jù)的數(shù)目,并且指定的比例因子頻帶的數(shù)目N表示該比例因子頻帶的第一個(gè)的數(shù)目。
對(duì)于低頻帶內(nèi)的所有比例因子頻帶(S62),第二量化單元345在包括與高頻帶內(nèi)的比例因子頻帶相同數(shù)目的頻譜數(shù)據(jù)的頻率帶寬內(nèi),從低頻帶的比例因子頻帶內(nèi)的第一個(gè)數(shù)據(jù)開始,計(jì)算高頻帶的頻譜與低頻帶的頻譜的差(S63)。例如,在如圖23所示的波形中,如果高頻帶的第一個(gè)比例因子頻帶包括頻譜數(shù)據(jù)的48個(gè)取樣,第二量化單元345從低頻帶內(nèi)的數(shù)目N=1的比例因子頻帶的第一個(gè)數(shù)據(jù)開始,順序計(jì)算高頻帶和低頻帶之間的48個(gè)頻譜數(shù)據(jù)的差。
當(dāng)?shù)诙炕瘑卧?45計(jì)算出了高頻帶和低頻帶的頻譜數(shù)據(jù)的差的時(shí)候,(S65),它保持該值,然后在包括與高頻帶內(nèi)的比例因子頻帶相同數(shù)目的頻譜數(shù)據(jù)的頻率帶寬內(nèi),從低頻帶的下一個(gè)比例因子頻帶的第一個(gè)數(shù)據(jù)開始,為下一個(gè)比例因子頻帶計(jì)算高頻帶和低頻帶之間的頻譜的差(S64)。例如,當(dāng)在頻譜數(shù)據(jù)的48個(gè)取樣的寬度內(nèi),從低頻帶的數(shù)目N=1的比例因子頻帶的第一個(gè)數(shù)據(jù)開始計(jì)算出頻譜的差的時(shí)候,第二量化單元345保持該計(jì)算出的差的值,然后進(jìn)一步在頻譜數(shù)據(jù)的48個(gè)取樣的寬度內(nèi)從低頻帶內(nèi)的數(shù)目N=2的比例因子頻帶的第一個(gè)數(shù)據(jù)開始計(jì)算頻譜的差。以同樣的方式,對(duì)從數(shù)目N=3,4,...28(低頻帶內(nèi)的最后一個(gè)比例因子頻帶)的低頻帶內(nèi)的所有比例因子頻帶,第二量化單元345通過順序地將高頻帶與低頻帶之間的48個(gè)頻譜數(shù)據(jù)的差求和來計(jì)算頻譜的差。
對(duì)于低頻帶內(nèi)的所有比例因子頻帶,第二量化單元345在與高頻帶相同數(shù)目的頻譜數(shù)據(jù)的寬度內(nèi),從低頻帶內(nèi)的比例因子頻帶的第一個(gè)數(shù)據(jù)開始,計(jì)算高頻帶與低頻帶之間的頻譜的差(S64)。然后,第二量化單元345指定計(jì)算出的差為最小的比例因子頻帶的數(shù)目N(S65)。例如,在圖23所示的頻譜波形中,低頻帶內(nèi)的數(shù)目N=8的比例因子頻帶就被指定。在該圖中,已經(jīng)表明陰影部分的低頻帶內(nèi)的頻譜數(shù)據(jù)與陰影部分的高頻帶內(nèi)的頻譜數(shù)據(jù)的差為最小,并且頻譜之間的能量差也為最小。換句話說,如果從數(shù)目N=8的比例因子頻帶的第一個(gè)數(shù)據(jù)開始的頻譜數(shù)據(jù)的48個(gè)取樣被復(fù)制到高于11.025kHz的高頻帶內(nèi)的第一個(gè)比例因子頻帶,它們就變成了在附圖23中所示的在高頻帶內(nèi)以交替的長短虛線表示的波形,因此,在高頻帶內(nèi)的相應(yīng)的比例因子頻帶內(nèi)的能量能夠近似地表示至原始的頻譜。
當(dāng)?shù)诙炕瘑卧?45指定了低頻帶內(nèi)的數(shù)目為N的比例因子頻帶,其與高頻帶內(nèi)的比例因子頻帶的頻譜的差為最小的時(shí)候,其保持指定的數(shù)目為N的比例因子頻帶,然后指定了與高頻帶內(nèi)的下一個(gè)比例因子頻帶相應(yīng)的低頻帶內(nèi)的比例因子頻帶的數(shù)目N(S66)。第二量化單元345依序重復(fù)該處理過程,并且當(dāng)指定了低頻帶內(nèi)的所有數(shù)目N的比例因子頻帶,其與高頻帶的頻譜的差為最小的時(shí)候,將所保持的低頻帶內(nèi)的比例因子頻帶的數(shù)目N輸出到第二編碼單元355作為用于高頻帶的子信息(復(fù)制信息),然后該過程結(jié)束。
在本實(shí)施例中,在解碼設(shè)備400中復(fù)制低頻帶內(nèi)的頻譜數(shù)據(jù)的方法以及調(diào)整其幅度的方法與參照附圖21和22所述的子信息(復(fù)制信息)的情況相同。
在附圖24的流程圖中,高頻帶與低頻帶之間的頻譜數(shù)據(jù)的相同符號(hào)的能量差在頻率軸的相同方向上被計(jì)算。但是,本發(fā)明的編碼設(shè)備并不局限于此,它們可以使用下述的三個(gè)方法之一被計(jì)算,如參照附圖21和22所述①對(duì)于高頻帶內(nèi)具有相同符號(hào)并在從低頻帶到高頻帶的方向上被順序選擇的頻譜數(shù)據(jù),低頻帶內(nèi)相同數(shù)目的頻譜數(shù)據(jù)被順序地選擇,選擇是從低頻帶內(nèi)的比例因子頻帶的第一個(gè)數(shù)據(jù)開始,沿著從高頻帶到低頻帶的方向(頻率軸上的相反方向)進(jìn)行的,并且頻譜的差被計(jì)算,②低頻帶內(nèi)的頻譜的符號(hào)被反轉(zhuǎn)(乘以負(fù)值)并且在頻率軸上的相同方向上被計(jì)算,③低頻帶內(nèi)的頻譜的符號(hào)被反轉(zhuǎn)(乘以負(fù)值),并且在頻率軸的相反方向上被計(jì)算。或者,當(dāng)根據(jù)所有的四種方法計(jì)算了能量的差之后,低頻帶內(nèi)包括能量差為最小的頻譜的數(shù)目N的比例因子頻帶可以是子信息。在那種情況下,為了將低頻帶內(nèi)能量差為最小的頻譜精確的復(fù)制到高頻帶,對(duì)于每一個(gè)比例因子頻帶,表示高低頻帶的頻譜的符號(hào)之間關(guān)系的信息以及表示在頻率軸上的復(fù)制方向的信息被插入到子信息當(dāng)中。表示高低頻帶的頻譜的符號(hào)之間關(guān)系的信息以一個(gè)比特表示,例如,“1”表示具有相同符號(hào)的頻譜的差,“0”表示具有相反符號(hào)的頻譜的差。而且,表示將低頻帶內(nèi)的頻譜數(shù)據(jù)復(fù)制到高頻帶的在頻率軸上的方向的信息用一個(gè)比特來表示,例如,“1”表示前向復(fù)制方向,就是,在高低頻帶內(nèi)選擇頻譜數(shù)據(jù)的前向方向,“0”表示反向復(fù)制方向,就是在高低頻帶內(nèi)選擇頻譜數(shù)據(jù)的反向方向。
如上所述,根據(jù)本實(shí)施例的音頻數(shù)據(jù)分配系統(tǒng)被應(yīng)用于廣播系統(tǒng)的情況已經(jīng)被描述。但是,其也可以被應(yīng)用于通過諸如互聯(lián)網(wǎng)的傳輸介質(zhì),以比特流的形式,將音頻數(shù)據(jù)從用戶服務(wù)器分配到終端的音頻數(shù)據(jù)分配系統(tǒng)中?;蛘?,其也可以被應(yīng)用于這樣的音頻數(shù)據(jù)分配系統(tǒng)中,該音頻數(shù)據(jù)分配系統(tǒng)一旦將編碼設(shè)備300輸出的比特流記錄在一種諸如包括CD和DVD的光盤,半導(dǎo)體,或者一個(gè)硬盤的記錄介質(zhì)上,就通過該記錄介質(zhì)在解碼設(shè)備400中將其再生。
在本實(shí)施例中,處理是利用一個(gè)LONG塊被執(zhí)行的,但是其也可以使用一個(gè)SHORT塊來執(zhí)行。使用一個(gè)SHORT塊可以執(zhí)行與LONG塊同樣的處理。
在編碼處理中,諸如增益控制,TNS(瞬時(shí)噪聲成型),心里聲學(xué)模塊,M/S立體聲,強(qiáng)度立體聲和預(yù)測(cè),模塊尺寸的變化,比特儲(chǔ)備等工具都可以被使用。
在本實(shí)施例中,子信息是根據(jù)高頻帶內(nèi)被數(shù)據(jù)劃分單元330所劃分的頻譜數(shù)據(jù)而產(chǎn)生的。但是,子信息也可以根據(jù)對(duì)第一量化單元340的輸出進(jìn)行解量化所得到的值來產(chǎn)生,作為高頻帶內(nèi)的頻譜數(shù)據(jù)。
在本實(shí)施例中,用于得到在高頻帶內(nèi)的每一個(gè)比例因子內(nèi)的頻譜數(shù)據(jù)的量化值“1”的比例因子,量化的值,特征頻譜的位置信息,表明頻譜的正負(fù)符號(hào)的符號(hào)信息等都被用作子信息。但是,它們中的兩個(gè)或者多個(gè)的組合也可以作為子信息。在這種情況下,如果是比例因子和表示增益,絕對(duì)值最大的頻譜數(shù)據(jù)的位置等的系數(shù)的組合在子信息中被編碼,那么其是非常有效的。而且,在本實(shí)施例中,對(duì)于每一個(gè)比例因子頻帶,一個(gè)子信息可以被編碼作為第二編碼信號(hào),但是一個(gè)子信息也可以被編碼用于兩個(gè)或者多個(gè)比例因子頻帶,或者兩個(gè)或者多個(gè)子信息被編碼用于一個(gè)比例因子頻帶。此外,在本實(shí)施中,可以為每一個(gè)信道編碼編碼子信息,或者一個(gè)子信息被編碼用于兩個(gè)或者多個(gè)信道。
在本實(shí)施例中,編碼設(shè)備300包括兩個(gè)量化單元和兩個(gè)編碼單元。但是,本發(fā)明并不局限于此,它也可以分別包括三個(gè)或者多個(gè)量化單元和編碼單元。
在本實(shí)施例中,解碼設(shè)備400包括兩個(gè)解碼單元和兩個(gè)解量化單元。但是,本發(fā)明并不局限于此,它也可以分別包括三個(gè)或者多個(gè)解碼單元和解量化單元。
上面描述的處理過程除了用硬件實(shí)現(xiàn)以外還可以用軟件來實(shí)現(xiàn),本發(fā)明可以被配置成一部分處理利用硬件實(shí)現(xiàn),其它的處理利用軟件來實(shí)現(xiàn)。
在本實(shí)施例中,使用的采樣頻率是44.1kHz,但是其它的采樣頻率,例如32kHz或者48kHz都可以被使用。作為數(shù)據(jù)劃分單元330,劃分頻譜數(shù)據(jù)的界限的頻率可以變成除了11.025kHz以外的其它任何頻率。
而且,在本實(shí)施例中,處理是依據(jù)MPEG-2 AAC被執(zhí)行的。但是,同樣的處理也可以依據(jù)其它方法(例如MP3,AC3等)在一個(gè)編碼設(shè)備,一個(gè)解碼設(shè)備,以及其它設(shè)備中被執(zhí)行。
而且,根據(jù)本發(fā)明的編碼設(shè)備也可以采用如下的結(jié)構(gòu)。
根據(jù)本發(fā)明的編碼設(shè)備是一個(gè)編碼音頻數(shù)據(jù)的編碼設(shè)備,包括一個(gè)分離單元用于將一個(gè)音頻數(shù)據(jù)串分離成m2個(gè)取樣,多于所需數(shù)目的m1個(gè)取樣,從產(chǎn)生的音頻數(shù)據(jù)串分離連續(xù)的音頻數(shù)據(jù);一個(gè)變換單元,用于將分離單元分離的音頻數(shù)據(jù)變換成頻率域的頻譜數(shù)據(jù);一個(gè)劃分單元,用于將變換得到的頻譜數(shù)據(jù)的m2取樣劃分成低頻帶內(nèi)的頻譜數(shù)據(jù)的m1個(gè)取樣和高頻帶內(nèi)的頻譜數(shù)據(jù)的(m2-m1)個(gè)取樣;一個(gè)低頻帶編碼單元,用于量化在低頻帶內(nèi)劃分的頻譜數(shù)據(jù)并編碼該量化的數(shù)據(jù);一個(gè)子信息產(chǎn)生單元, 用于量化高頻帶內(nèi)的劃分的頻譜數(shù)據(jù)產(chǎn)生表明高頻帶內(nèi)的頻譜特性的子信息;一個(gè)高頻帶編碼單元,用于編碼產(chǎn)生的子信息;以及一個(gè)輸出單元,用于將低頻帶編碼單元獲得的碼與高頻帶編碼單元所獲得的碼集成,并輸出該集成的符號(hào)。
在這種情況下,子信息產(chǎn)生單元可以這樣配置從而能夠計(jì)算一個(gè)用于獲得一個(gè)固定值的標(biāo)準(zhǔn)化因子,并產(chǎn)生計(jì)算的標(biāo)準(zhǔn)化因子作為子信息,前述的固定值是一個(gè)通過量化用于頻率數(shù)據(jù)高頻帶內(nèi)的每一個(gè)組中的峰值頻譜數(shù)據(jù)而獲得的值,其中頻譜數(shù)據(jù)被分成了多個(gè)組。
而且,子信息產(chǎn)生單元可以這樣配置從而能夠使用對(duì)每一個(gè)組都共同的標(biāo)準(zhǔn)化因子來量化高頻帶內(nèi)的每一個(gè)組內(nèi)的峰值頻譜數(shù)據(jù)并產(chǎn)生量化的值作為子信息,其中頻譜數(shù)據(jù)被分成了多個(gè)組。
而且,子信息產(chǎn)生單元可以這樣配置從而在高頻帶內(nèi)的每一組中產(chǎn)生峰值頻譜數(shù)據(jù)的頻率位置作為子信息,其中頻譜數(shù)據(jù)被分成了多個(gè)組。
而且,頻譜數(shù)據(jù)是一個(gè)MDCT系數(shù),子信息產(chǎn)生單元可以這樣配置從而產(chǎn)生一個(gè)表示在高頻帶內(nèi)的一個(gè)預(yù)定的頻率位置的頻譜數(shù)據(jù)的正負(fù)值的符號(hào)作為子信息,其中頻譜數(shù)據(jù)被分成了多個(gè)組。
更進(jìn)一步,子信息產(chǎn)生單元可以這樣配置從而產(chǎn)生一個(gè)指定最接近高頻帶內(nèi)的每個(gè)組的頻譜的低頻帶內(nèi)的頻譜的信息作為子信息,其中頻譜數(shù)據(jù)被分成了多個(gè)組。在這種情況下,子信息產(chǎn)生單元可以這樣配置從而指定一個(gè)低頻帶內(nèi)的頻譜,其中在頻率軸上從高頻帶內(nèi)的組的定界符到該組中的頻譜峰值的距離與頻率軸上從低頻帶內(nèi)的組的定界符到該組中的頻譜的峰值的距離為最小。而且,子信息產(chǎn)生單元可以這樣配置從而指定低頻帶中的一個(gè)頻譜,其與高頻帶內(nèi)該組中的頻譜具有相同的頻率寬度所獲得的能量差值為最小。而且,指定低頻帶內(nèi)的頻譜的信息是一個(gè)指定低頻帶內(nèi)的指定的頻譜的組的數(shù)字。
而且,子信息產(chǎn)生單元可以被配置從而能夠產(chǎn)生表示高頻帶內(nèi)的頻譜幅度增益的一個(gè)預(yù)定的系數(shù)作為子信息.
而且,輸出單元可以進(jìn)一步包括一個(gè)流輸出單元,用于將低頻帶編碼單元編碼的數(shù)據(jù)變換成一個(gè)以預(yù)定的格式定義的編碼音頻流,然后將高頻帶編碼單元編碼的數(shù)據(jù)存儲(chǔ)在其使用不受編碼協(xié)議限制的編碼音頻流的區(qū)域中,最后輸出該存儲(chǔ)的數(shù)據(jù)。在這種情況下,流輸出單元可以被配置從而能夠?qū)懭氡硎緁1Hz的信息作為采樣頻率。
更進(jìn)一步,輸出單元可以進(jìn)一步包括一個(gè)第二流輸出單元,用于將低頻帶編碼單元編碼的數(shù)據(jù)變換成一個(gè)以預(yù)定的格式定義的編碼音頻流,然后將高頻帶編碼單元編碼的數(shù)據(jù)存儲(chǔ)在與編碼音頻流不同的流中,然后輸出該存儲(chǔ)的數(shù)據(jù)。
應(yīng)當(dāng)注意,本發(fā)明當(dāng)然能夠以一種包括上述變型的編碼設(shè)備和解碼設(shè)備的通信系統(tǒng)來實(shí)現(xiàn),也能夠以包括在上述的編碼設(shè)備和通信系統(tǒng)的特征單元中所執(zhí)行的步驟的一種編碼方法和通信方法來實(shí)現(xiàn),以一種令一個(gè)CPU執(zhí)行上述的編碼設(shè)備的特征單元或者步驟的編碼程序來實(shí)現(xiàn),或者以一種其上記錄著這些程序的計(jì)算機(jī)可讀記錄介質(zhì)來實(shí)現(xiàn)。
工業(yè)應(yīng)用根據(jù)本發(fā)明的編碼設(shè)備適于用作一種分配系統(tǒng)用于分配在數(shù)據(jù)流中或者記錄介質(zhì)中的諸如音樂等內(nèi)容。
權(quán)利要求
1.一種用于編碼音頻數(shù)據(jù)的編碼設(shè)備,包括一個(gè)分離單元,用于將音頻數(shù)據(jù)串分離成一個(gè)固定數(shù)目的連續(xù)音頻數(shù)據(jù);一個(gè)變換單元,用于將分離的音頻數(shù)據(jù)變換成頻率域的頻譜數(shù)據(jù);一個(gè)劃分單元,用于將變換單元獲得的頻譜數(shù)據(jù)劃分成在頻率f1Hz或者更低的低頻帶內(nèi)的頻譜數(shù)據(jù)以及在高于f1Hz的高頻帶內(nèi)的頻譜數(shù)據(jù);一個(gè)低頻帶編碼單元,用于量化低頻帶內(nèi)的劃分的頻譜數(shù)據(jù)并且編碼該量化數(shù)據(jù);一個(gè)子信息產(chǎn)生單元,用于產(chǎn)生表明來自于高頻帶內(nèi)的劃分的頻譜數(shù)據(jù)的高頻帶的頻譜特性的子信息;一個(gè)高頻帶編碼單元,用于編碼產(chǎn)生的子信息;以及一個(gè)輸出單元,用于集成由低頻帶編碼單元獲得的碼以及由高頻帶編碼單元獲得的碼,并且輸出集成碼,其中f1是采樣頻率f2的一半或者更小,在頻率f2處產(chǎn)生音頻數(shù)據(jù)串。
2.如權(quán)利要求1所述的編碼設(shè)備,其中f1是f2/4,變換單元將音頻數(shù)據(jù)變換成0~2×f1Hz的頻譜數(shù)據(jù),以及劃分單元將0~2×f1Hz的頻譜數(shù)據(jù)劃分成在頻率f1Hz或者更低的低頻帶內(nèi)的頻譜數(shù)據(jù)以及在f1Hz以上直至2×f1Hz的高頻帶內(nèi)的頻譜數(shù)據(jù)。
3.如權(quán)利要求2所述的編碼設(shè)備,其中在頻率f1Hz或者更低的低頻帶內(nèi)的頻譜數(shù)據(jù)包括n個(gè)頻譜數(shù)據(jù)取樣,分離單元能夠?qū)⒁纛l數(shù)據(jù)串分離成產(chǎn)生2×n個(gè)頻譜數(shù)據(jù)取樣所需數(shù)目的音頻數(shù)據(jù),變換單元將分離的音頻數(shù)據(jù)變換成2×n個(gè)頻譜數(shù)據(jù)取樣,劃分單元將2×n個(gè)頻譜數(shù)據(jù)取樣劃分成低頻帶內(nèi)的n個(gè)頻譜數(shù)據(jù)取樣以及高頻帶內(nèi)的n個(gè)頻譜數(shù)據(jù)取樣。
4.如權(quán)利要求3所述的編碼設(shè)備,其中分離單元將音頻數(shù)據(jù)串分離成2×n個(gè)頻譜數(shù)據(jù)取樣,這些頻譜數(shù)據(jù)取樣包括與作為一個(gè)編碼單元的一幀相對(duì)應(yīng)的n個(gè)音頻數(shù)據(jù)取樣以及在該幀之前和之后的鄰近的兩幀內(nèi)的兩組n/2個(gè)音頻數(shù)據(jù)取樣,變換單元對(duì)分離的2×n個(gè)音頻數(shù)據(jù)取樣執(zhí)行MDCT,將其變換成包括2×n個(gè)頻譜數(shù)據(jù)取樣的0~2×f1Hz的頻譜。
5.如權(quán)利要求1所述的編碼設(shè)備,其中子信息產(chǎn)生單元計(jì)算一個(gè)用于導(dǎo)出通過量化在高頻帶內(nèi)的每一組中的峰值頻譜數(shù)據(jù)而獲得的一個(gè)固定值的標(biāo)準(zhǔn)化因子,并產(chǎn)生了一個(gè)計(jì)算所得的標(biāo)準(zhǔn)化因子,作為子信息,其中頻譜數(shù)據(jù)被分成了多個(gè)組。
6.如權(quán)利要求1所述的編碼設(shè)備,其中子信息產(chǎn)生單元利用對(duì)所述每一組而言是共同的標(biāo)準(zhǔn)化因子,量化在高頻帶內(nèi)的每一組中的峰值頻譜數(shù)據(jù),并產(chǎn)生量化值作為子信息,其中頻譜數(shù)據(jù)被分成了多個(gè)組。
7.如權(quán)利要求1所述的編碼設(shè)備,其中子信息產(chǎn)生單元產(chǎn)生了在高頻帶內(nèi)的每一組內(nèi)的峰值頻譜數(shù)據(jù)的頻率位置作為子信息,頻譜數(shù)據(jù)被分成了多個(gè)組。
8.如權(quán)利要求1所述的編碼設(shè)備,其中頻譜數(shù)據(jù)是一個(gè)MDCT系數(shù),子信息產(chǎn)生單元在高頻帶內(nèi)的一個(gè)預(yù)定的頻率位置產(chǎn)生一個(gè)表示頻譜數(shù)據(jù)的正負(fù)值的符號(hào)作為子信息,頻譜數(shù)據(jù)被分成了多個(gè)組。
9.如權(quán)利要求1所述的編碼設(shè)備,其中子信息產(chǎn)生單元產(chǎn)生了一個(gè)指定最接近高頻帶內(nèi)的每一組中的頻譜的低頻帶內(nèi)的頻譜的信息作為子信息,頻譜數(shù)據(jù)被分成了多個(gè)組。
10.如權(quán)利要求9所述的編碼設(shè)備,其中子信息產(chǎn)生單元指定低頻譜帶內(nèi)的頻譜,其中(1)在頻率域中高頻帶內(nèi)的每一組的界符到該組中的頻譜峰值的距離與(2)頻率域內(nèi)低頻帶中的每一組的界符到該組中的頻譜峰值的距離之間的差為最小。
11.如權(quán)利要求9所述的編碼設(shè)備,其中子信息產(chǎn)生單元指定低頻帶內(nèi)的頻譜,其中在與高頻帶內(nèi)該組中的頻譜相同的頻率帶寬內(nèi)獲得的能量值的差為最小。
12.如權(quán)利要求9所述的編碼設(shè)備,其中指定低頻帶內(nèi)的頻譜的信息是一個(gè)指定在低頻帶內(nèi)的指定頻率的組的數(shù)字。
13.如權(quán)利要求1所述的編碼設(shè)備,其中子信息產(chǎn)生單元產(chǎn)生了一個(gè)預(yù)定的系數(shù)作為子信息,表明高頻帶內(nèi)的頻譜的幅度增益。
14.如權(quán)利要求1所述的編碼設(shè)備,其中輸出單元進(jìn)一步包括一個(gè)流輸出單元,用于將低頻帶編碼單元編碼的數(shù)據(jù)變換為以預(yù)定的格式定義的編碼音頻流,將高頻帶編碼單元編碼的數(shù)據(jù)存儲(chǔ)在其使用在預(yù)定格式下不受限制的編碼音頻流中的一區(qū)域,然后將存儲(chǔ)的數(shù)據(jù)輸出。
15.如權(quán)利要求14所述的編碼設(shè)備,其中流輸出單元寫入表示f/2Hz的信息作為采樣頻率。
16.如權(quán)利要求1所述的編碼設(shè)備,其中輸出單元還進(jìn)一步包括一個(gè)第二流輸出單元,用于將低頻帶編碼單元編碼的數(shù)據(jù)變換為以預(yù)定的格式定義的編碼音頻流,將高頻帶編碼單元編碼的數(shù)據(jù)存儲(chǔ)在與編碼音頻流不同的數(shù)據(jù)流中,然后將存儲(chǔ)的數(shù)據(jù)輸出。
17.一種解碼通過一個(gè)記錄介質(zhì)或者傳輸介質(zhì)輸入的編碼數(shù)據(jù)的解碼設(shè)備,包括一個(gè)抽取單元,用于抽取包含在編碼數(shù)據(jù)中的低頻帶的編碼數(shù)據(jù)以及高頻帶的編碼數(shù)據(jù);一個(gè)低頻帶解量化單元,用于解碼和解量化由抽取單元抽取的低頻帶的編碼數(shù)據(jù),從而輸出在頻率f1Hz或者更低的低頻帶的頻譜數(shù)據(jù);一個(gè)子信息解碼單元,用于解碼抽取單元抽取的高頻帶的編碼數(shù)據(jù),從而產(chǎn)生表明高頻帶中的頻譜數(shù)據(jù)特性的子信息;一個(gè)高頻帶解量化單元,用于根據(jù)子信息解碼單元產(chǎn)生的子信息,輸出高頻帶內(nèi)的頻譜數(shù)據(jù);一個(gè)集成單元,用于集成由低頻帶解量化單元輸出的低頻帶中的頻譜數(shù)據(jù)和由高頻帶解量化單元輸出的高頻帶中的頻譜數(shù)據(jù);一個(gè)逆變換單元,用于將由集成單元集成的頻譜數(shù)據(jù)逆變換成時(shí)間域的音頻數(shù)據(jù);一個(gè)音頻數(shù)據(jù)輸出單元,用于基于時(shí)間順序輸出由逆變換單元逆變換的音頻數(shù)據(jù)。
18.如權(quán)利要求17所述的解碼設(shè)備,其中子信息是一個(gè)計(jì)算的標(biāo)準(zhǔn)化因子,以使量化在高頻帶內(nèi)的每一組中的峰值頻譜數(shù)據(jù)所獲得的值都是固定值,頻譜數(shù)據(jù)被分成了多個(gè)組,并且,高頻帶解量化單元利用產(chǎn)生的子信息中的標(biāo)準(zhǔn)化因子解量化一個(gè)量化值,該量化值是對(duì)于高頻帶內(nèi)的所述的每一組是共同的并且與所述的每一組中的預(yù)定頻率的頻譜數(shù)據(jù)相對(duì)應(yīng)的一個(gè)固定值,然后在高頻帶內(nèi)產(chǎn)生頻譜數(shù)據(jù),其峰值是所述的每一組中的解量化的頻譜數(shù)據(jù)。
19.如權(quán)利要求17所述的解碼設(shè)備,其中子信息是利用對(duì)所述的每一組是共同的標(biāo)準(zhǔn)化因子,量化在高頻帶內(nèi)的每一組中的峰值頻譜數(shù)據(jù)所獲得的一個(gè)量化值,頻譜數(shù)據(jù)被分成了多個(gè)組,并且,高頻帶解量化單元利用對(duì)所述的每一組是共同的標(biāo)準(zhǔn)化因子,解量化在產(chǎn)生的子信息中的量化值,并產(chǎn)生高頻帶內(nèi)的頻譜數(shù)據(jù),其峰值是在所述的每一組中的解量化的頻譜數(shù)據(jù)。
20.如權(quán)利要求17所述的編碼設(shè)備,其中子信息是高頻帶內(nèi)的每一組中的峰值頻譜數(shù)據(jù)的頻率位置,頻譜數(shù)據(jù)被分成了多個(gè)組,并且高頻帶解量化單元在高頻帶內(nèi)產(chǎn)生頻譜數(shù)據(jù),其峰值位于所述的每一組中所產(chǎn)生的子信息的頻率位置。
21.如權(quán)利要求17所述的解碼設(shè)備,其中子信息是指示在高頻帶內(nèi)的預(yù)定的頻率位置的頻譜數(shù)據(jù)的正負(fù)值的符號(hào),頻譜數(shù)據(jù)被分成了多個(gè)組,并且高頻帶解量化單元產(chǎn)生在高頻帶內(nèi)的預(yù)定頻率位置的頻譜數(shù)據(jù),其具有在產(chǎn)生的子信息中的符號(hào)。
22.如權(quán)利要求17所述的解碼設(shè)備,其中子信息是指定最為接近高頻帶的每一組的頻譜的低頻帶內(nèi)的頻譜的信息,頻譜數(shù)據(jù)被分成了多個(gè)組,并且,高頻帶解量化單元根據(jù)子信息在高頻帶的所述的每一組中產(chǎn)生一個(gè)預(yù)定的噪聲,還通過將產(chǎn)生的噪聲加入到所述的頻譜數(shù)據(jù)來產(chǎn)生高頻帶內(nèi)的頻譜數(shù)據(jù)。
23.一種通過記錄介質(zhì)或者傳輸介質(zhì)分配以低比特率被壓縮和編碼成一個(gè)比特流的音頻數(shù)據(jù)的音頻數(shù)據(jù)分配系統(tǒng),該系統(tǒng)包括一個(gè)編碼設(shè)備和一個(gè)解碼設(shè)備其中編碼設(shè)備編碼音頻數(shù)據(jù),并包括一個(gè)分離單元,用于將音頻數(shù)據(jù)串分離成一個(gè)固定數(shù)目的連續(xù)音頻數(shù)據(jù);一個(gè)變換單元,用于將分離的音頻數(shù)據(jù)變換成頻率域的頻譜數(shù)據(jù);一個(gè)劃分單元,用于將變換單元獲得的頻譜數(shù)據(jù)劃分成在頻率f1Hz或者更低的低頻帶內(nèi)的頻譜數(shù)據(jù)以及在高于f1Hz的高頻帶寬內(nèi)的頻譜數(shù)據(jù);一個(gè)低頻帶編碼單元,用于量化低頻帶內(nèi)的劃分的頻譜數(shù)據(jù)并且編碼該量化數(shù)據(jù);一個(gè)子信息產(chǎn)生單元,用于產(chǎn)生表明來自于高頻帶內(nèi)的劃分的頻譜數(shù)據(jù)的高頻帶的頻譜特性的子信息;一個(gè)高頻帶編碼單元,用于編碼產(chǎn)生的子信息;一個(gè)輸出單元,用于集成由低頻帶編碼單元獲得的碼以及由高頻帶編碼單元獲得的碼,并且輸出集成碼,其中f1是采樣頻率f2的一半或者更小,在頻率f2處產(chǎn)生音頻數(shù)據(jù)串,以及解碼設(shè)備解碼通過記錄介質(zhì)或者傳輸介質(zhì)輸入的編碼數(shù)據(jù),并包括一個(gè)抽取單元,用于抽取包含在編碼數(shù)據(jù)中的低頻帶的編碼數(shù)據(jù)以及高頻帶的編碼數(shù)據(jù);一個(gè)低頻帶解量化單元,用于解碼和解量化由抽取單元抽取的低頻帶編碼數(shù)據(jù),從而輸出在頻率f1Hz或者更低的低頻帶的頻譜數(shù)據(jù);一個(gè)子信息解碼單元,用于解碼由抽取單元抽取的高頻帶編碼數(shù)據(jù),從而產(chǎn)生表明高頻帶的頻譜數(shù)據(jù)特性的子信息;一個(gè)高頻帶解量化單元,用于根據(jù)由子信息解碼單元產(chǎn)生的子信息,輸出高頻帶內(nèi)的頻譜數(shù)據(jù);一個(gè)集成單元,用于集成由低頻帶解量化單元輸出的低頻帶中的頻譜數(shù)據(jù)和由高頻帶解量化單元輸出的高頻帶內(nèi)的頻譜數(shù)據(jù);一個(gè)逆變換單元,用于將由集成單元集成的頻譜數(shù)據(jù)逆變換成時(shí)間域的音頻數(shù)據(jù);一個(gè)音頻數(shù)據(jù)輸出單元,用于基于時(shí)間順序輸出逆變換單元逆變換的音頻數(shù)據(jù)。
24.一種用于編碼音頻數(shù)據(jù)的編碼設(shè)備的程序,該程序令計(jì)算機(jī)實(shí)現(xiàn)以下的作用一個(gè)分離單元,用于將音頻數(shù)據(jù)流分離成一個(gè)固定數(shù)目的連續(xù)音頻數(shù)據(jù);一個(gè)變換單元,用于將分離的音頻數(shù)據(jù)變換成頻率域的頻譜數(shù)據(jù);一個(gè)劃分單元,用于將變換單元獲得的頻譜數(shù)據(jù)劃分成在頻率f1Hz或者更低的低頻帶的頻譜數(shù)據(jù)以及在高于f1Hz的高頻帶寬內(nèi)的頻譜數(shù)據(jù);一個(gè)低頻帶編碼單元,用于量化低頻帶內(nèi)的劃分的頻譜數(shù)據(jù)并且編碼該量化數(shù)據(jù);一個(gè)子信息產(chǎn)生單元,用于產(chǎn)生表明來自于高頻帶內(nèi)的劃分的頻譜數(shù)據(jù)的高頻帶的頻譜特性的子信息;一個(gè)高頻帶編碼單元,用于編碼產(chǎn)生的子信息;以及一個(gè)輸出單元,用于集成由低頻帶編碼單元獲得的碼和由高頻帶編碼單元獲得的碼,然后輸出該集成碼。
25.一種用于解碼通過記錄介質(zhì)或者傳輸介質(zhì)輸入的編碼數(shù)據(jù)的解碼設(shè)備中的程序,該程序令計(jì)算機(jī)實(shí)現(xiàn)如下的作用一個(gè)抽取單元,用于抽取包含在編碼數(shù)據(jù)中的低頻帶的編碼數(shù)據(jù)以及高頻帶的編碼數(shù)據(jù);一個(gè)低頻帶解量化單元,用于解碼和解量化由抽取單元抽取的低頻帶的編碼數(shù)據(jù),從而輸出在頻率f1Hz或者更低的低頻帶的頻譜數(shù)據(jù);一個(gè)子信息解碼單元,用于解碼抽取單元抽取的高頻帶的編碼數(shù)據(jù),從而產(chǎn)生表明高頻帶的頻譜數(shù)據(jù)特性的子信息;一個(gè)高頻帶解量化單元,用于根據(jù)子信息解碼單元產(chǎn)生的子信息,輸出高頻帶內(nèi)的頻譜數(shù)據(jù);一個(gè)集成單元,用于集成低頻帶解量化單元輸出的低頻帶的頻譜數(shù)據(jù)和高頻帶解量化單元輸出的高頻帶頻譜數(shù)據(jù);一個(gè)逆變換單元,用于將集成單元集成的頻譜數(shù)據(jù)逆變換成時(shí)間域的音頻數(shù)據(jù);一個(gè)音頻數(shù)據(jù)輸出單元,用于基于時(shí)間順序輸出逆變換單元逆變換的音頻數(shù)據(jù)。
26.一種其上記錄著程序的計(jì)算機(jī)可讀記錄媒體,其中程序用于編碼音頻數(shù)據(jù)的編碼設(shè)備,該程序令計(jì)算機(jī)實(shí)現(xiàn)如下的作用一個(gè)分離單元,用于將音頻數(shù)據(jù)流分離成一個(gè)固定數(shù)目的連續(xù)音頻數(shù)據(jù);一個(gè)變換單元,用于將分離的音頻數(shù)據(jù)變換成頻率域的頻譜數(shù)據(jù);一個(gè)劃分單元,用于將變換單元獲得的頻譜數(shù)據(jù)劃分成在頻率f1Hz或者更低的低頻帶內(nèi)的頻譜數(shù)據(jù)以及在高于f1Hz的高頻帶寬內(nèi)的頻譜數(shù)據(jù);一個(gè)低頻帶編碼單元,用于量化低頻帶內(nèi)的劃分的頻譜數(shù)據(jù)并且編碼該量化數(shù)據(jù);一個(gè)子信息產(chǎn)生單元,用于產(chǎn)生表明來自于高頻帶內(nèi)的劃分的頻譜數(shù)據(jù)的高頻帶的頻譜特性的子信息;一個(gè)高頻帶編碼單元,用于編碼產(chǎn)生的子信息;以及一個(gè)輸出單元,用于集成低頻帶編碼單元獲得的碼和高頻帶編碼單元獲得的碼,然后輸出該集成碼。
27.一種其上記錄著程序的計(jì)算機(jī)可讀媒體,其中程序用于解碼通過記錄介質(zhì)或者傳輸介質(zhì)輸入的編碼數(shù)據(jù)的解碼設(shè)備,該程序令計(jì)算機(jī)實(shí)現(xiàn)如下的作用一個(gè)抽取單元,用于抽取包含在編碼數(shù)據(jù)中的低頻帶的編碼數(shù)據(jù)以及高頻帶的編碼數(shù)據(jù);一個(gè)低頻帶解量化單元,用于解碼和解量化由抽取單元抽取的低頻帶編碼數(shù)據(jù),從而輸出在頻率f1Hz或者更低的低頻帶內(nèi)的頻譜數(shù)據(jù);一個(gè)子信息解碼單元,用于解碼由抽取單元抽取的高頻帶編碼數(shù)據(jù),從而產(chǎn)生表明高頻帶的頻譜數(shù)據(jù)特性的子信息;一個(gè)高頻帶解量化單元,用于根據(jù)子信息解碼單元產(chǎn)生的子信息,輸出高頻帶內(nèi)的頻譜數(shù)據(jù);一個(gè)集成單元,用于集成由低頻帶解量化單元輸出的低頻帶的頻譜數(shù)據(jù)和由高頻帶解量化單元輸出的高頻帶頻譜數(shù)據(jù);一個(gè)逆變換單元,用于將集成單元集成的頻譜數(shù)據(jù)逆變換成時(shí)間域的音頻數(shù)據(jù);一個(gè)音頻數(shù)據(jù)輸出單元,用于基于時(shí)間順序輸出由逆變換單元逆變換的音頻數(shù)據(jù)。
全文摘要
一種編碼設(shè)備(300)的音頻數(shù)據(jù)輸入單元(310)將一個(gè)音頻數(shù)據(jù)串分離成連續(xù)的音頻數(shù)據(jù)的4096個(gè)取樣,一個(gè)變換單元(320)將分離的音頻數(shù)據(jù)變換成頻率域的頻譜數(shù)據(jù)。一個(gè)數(shù)據(jù)劃分單元(330)將頻譜數(shù)據(jù)以11.025kHz為邊界分成低頻帶和高頻帶。低頻帶內(nèi)的頻譜數(shù)據(jù)按照通常的方式被第一量化單元(340)和編碼單元(350)量化和編碼。第二量化單元(345)產(chǎn)生表示高頻帶的頻譜數(shù)據(jù)特性的子信息,并且第二編碼單元(355)對(duì)該子信息進(jìn)行編碼。一個(gè)流輸出單元(390)集成第一和第二編碼單元(350),(355)獲得的碼,并將集成的編碼輸出。這里,f1是產(chǎn)生音頻數(shù)據(jù)串的采樣頻率f2的一半或者更小。
文檔編號(hào)G10L21/038GK1484756SQ02803421
公開日2004年3月24日 申請(qǐng)日期2002年10月30日 優(yōu)先權(quán)日2001年11月2日
發(fā)明者西尾孝 , 西尾孝祐, 則松武志, 志, 津島峰生, 生, 也, 田中直也 申請(qǐng)人:松下電器產(chǎn)業(yè)株式會(huì)社