專利名稱:音樂信息編碼設(shè)備及方法和音樂信息解碼設(shè)備及方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種音頻信息編碼設(shè)備和一種音頻信息編碼方法,都用于對含有白噪聲分量的音頻信息進(jìn)行編碼、一種存儲由音頻信息編碼設(shè)備和方法產(chǎn)生的代碼序列的記錄介質(zhì)、一種音頻信息解碼設(shè)備和一種音頻信息解碼方法,都用于對由音頻信息編碼設(shè)備和方法產(chǎn)生的代碼序列進(jìn)行解碼、一種使計(jì)算機(jī)執(zhí)行所述音頻信息的編碼或解碼處理的程序。
本申請要求于2002年11月13日提交的申請?zhí)枮?002-330024的日本專利申請的優(yōu)先權(quán),在此引入該申請公開的全部內(nèi)容以作參考。
背景技術(shù):
為了編碼輸入的音頻信號,迄今將音頻信號在時(shí)間軸分割成每個(gè)有預(yù)定時(shí)間段(幀)的塊。對幀逐個(gè)地進(jìn)行修改的離散余弦變換(modified discretecosine transformation,MDCT)。因此時(shí)間序列信號變換為在頻率軸的譜信號。(進(jìn)行所謂的“譜變換”)。從而編碼音頻信號。
為了編碼譜信號,分配比特給每一個(gè)通過對與一個(gè)幀相對應(yīng)的時(shí)間序列信號執(zhí)行譜變換得來的譜信號。也就是執(zhí)行了指定的比特分配或者適應(yīng)的比特分配。比如,為了編碼MDCT處理產(chǎn)生的系數(shù)數(shù)據(jù)可以執(zhí)行比特分配。在這種情況下,將適當(dāng)數(shù)量的比特分配給通過對每一個(gè)塊的時(shí)間軸信號執(zhí)行MDCT處理而獲得的MDCT系數(shù)數(shù)據(jù)。
關(guān)于比特分配的詳細(xì)描述有,比如R.Zelinski和P.Noll的“AdaptiveTransform Coding of Speech Signals(語言信號的適應(yīng)性變換編碼)”,IEEE(Institute of Electrical and Electronics Engineers,電氣與電子工程師協(xié)會)Transaction of Accoustics,Speech and Signal Processing,Vol.ASSP-25,1977年8月,和麻省理工學(xué)院M.A.Kransner的“The Critical Band Coder DigitalEncoding of the Perceptual Requirements of the Audiotory System(聲音系統(tǒng)的感性要求的關(guān)鍵頻帶編碼器數(shù)字編碼)”,ICASSP 1980。
任何輸入到編碼設(shè)備里的音頻信號都包括諸如樂器和人的話音的聲音的各種分量。即使麥克風(fēng)只記錄話音和鋼琴聲音,結(jié)果的信號也不會只表現(xiàn)為話音或鋼琴聲音。所述信號常常包含背景噪聲,即,在使用記錄設(shè)備時(shí)產(chǎn)生的聲音,以及記錄設(shè)備產(chǎn)生的電子噪聲。
與話音和鋼琴聲音一樣,對于編碼設(shè)備這些噪聲不過是線性波形信息。上述設(shè)備同樣會對噪聲分量執(zhí)行頻率編碼。從波形再現(xiàn)性的角度來說這是正確的方法。但是從人的聽覺特征角度來說這不能稱為是有效的編碼方法。
因此可以執(zhí)行基于心理聽覺模型的比特分配。這就是,對比人聽不見任何東西的最低可聽到水平更小的,或者比編碼設(shè)備中任意設(shè)置的最小編碼閾值更小的任何頻率分量不進(jìn)行比特分配。
圖1示出了執(zhí)行如上所述的這樣的比特分配的傳統(tǒng)編碼設(shè)備的構(gòu)造。在編碼設(shè)備100中,如圖1所示時(shí)間到頻率變換單元101將輸入音頻信號Si(t)變換為譜信號F(f)。該譜信號提供給比特分配頻帶決定單元102。比特分配頻帶決定單元102分析譜信號F(f)。之后它將所述譜信號分成頻率分量F(f0)和頻率分量F(f1)。頻率分量F(f0)處在相等或高于最低可聽到水平的水平,或者在相等或高于最小編碼閾值的水平,而且會經(jīng)歷比特分配。頻率分量F(f1)不會經(jīng)歷比特分配。只有頻率分量F(f0)被提供給規(guī)格化/量化(normalization/quantization)單元103。由此頻率分量F(f1)被丟棄。
規(guī)格化/量化單元103對頻率分量F(f0)進(jìn)行規(guī)格化和量化,產(chǎn)生量化值Fq。該值Fq提供給編碼單元104。編碼單元104對量化值Fq編碼而產(chǎn)生碼序列C。記錄/傳輸單元105將碼序列C記錄在記錄介質(zhì)(未示出)或者將碼序列作為比特流BS來傳輸。
編碼設(shè)備100產(chǎn)生的碼序列C可以有如圖2所示的這種格式。如圖2所示,碼序列C包含頭部H、規(guī)格化信息SF、量化精度信息WL、和頻率信息SP。
圖3示出可以與編碼設(shè)備100組和使用的解碼設(shè)備的構(gòu)造。如圖3所示,在解碼設(shè)備120中,接收/讀取單元122將從編碼設(shè)備100或記錄介質(zhì)(未示出)接收的比特流BS恢復(fù)成碼序列C。碼序列C提供給解碼單元122。解碼單元122將碼序列C解碼,生成量化值Fq。反規(guī)格化/反量化單元123對量化值Fq執(zhí)行反規(guī)格化和反量化,從而產(chǎn)生頻率分量F(f0)。頻率到時(shí)間變換單元124將頻率分量F(f0)變換為輸出音頻信號So(t)。輸出音頻信號So(t)從解碼設(shè)備120輸出。
圖4示出對在所有幀里任何比最低可聽到水平A更低水平的頻率分量都不進(jìn)行比特分配的情況。如圖4所示,只有0.60f或更低的頻率分量在第(n-1)幀編碼,所有上至1.00f的頻率分量在第n幀編碼,并且只有0.55f或更低的頻率分量在第(n+1)幀編碼。結(jié)果特定頻率的分量包含在某幀里,并且在其他中沒有。但是對所有幀,碼序列等同于包含所有頻率分量,因?yàn)闆]有包含在碼序列中的頻率分量對人是完全聽不見的。這樣從碼序列再現(xiàn)的音樂不會使聽眾感覺到任何心理上的聽覺奇異。
當(dāng)對所有等于或高于最低可聽到水平的水平的頻率分量進(jìn)行編碼時(shí),也編碼了那些并不重要的分量或不應(yīng)當(dāng)聽到的白噪聲。因此編碼并不有效。假設(shè)頻率分量以固定比特率編碼,那么同樣數(shù)量的比特分配給每一幀。因此如果比特率太低,某些幀可能不能具有某些比特,并且所述某些幀不能大到足夠再現(xiàn)具有滿意的質(zhì)量的聲音。
圖5示出對任何具有比為每一幀設(shè)置的最低編碼閾值a更小值的頻率分量都不進(jìn)行比特分配的情況。如圖5所示,編碼設(shè)備為第(n-1)幀設(shè)置最小編碼閾值a(n-1)。該值a(n-1)視作對聲音質(zhì)量沒有影響,即使它沒有記錄在第(n-1)幀中也如此。這是因?yàn)槿魏尉哂斜冗@個(gè)值更低的頻率的分量對聲音質(zhì)量并不重要。結(jié)果只有0.60f或更低的頻率分量在第(n-1)幀中被編碼。
如果在所有幀中沒有編碼的頻率分量有相同的值,認(rèn)為所有編碼的頻率分量等同于在經(jīng)過低通濾波器之后編碼的分量。從而可以認(rèn)為在某些情況下頻帶變窄了。但是在考慮原來的頻率分布和人的聽覺特性時(shí),這種變窄的頻帶的景象并不會有問題。
但是下面的幀,即第n幀,相對于第(n-1)幀具有小的能量和更多的頻率分量沒有編碼。在具有大的能量的第(n+1)幀中,編碼所有頻率分量因?yàn)榫幋a設(shè)備確定對于聽覺感覺它們非常重要。
如果對于各個(gè)幀,包含在碼序列中的頻率分量非常不同,當(dāng)它們再現(xiàn)的時(shí)候他們會破壞幀的連續(xù)性??梢酝ㄟ^明顯的噪聲來感覺他們。這種噪聲與FM(調(diào)頻)廣播的、由于無線電波變化的情況而隨時(shí)間變化的背景噪聲類似。結(jié)果聽眾感覺到音樂包含特定的噪聲,不可避免地感覺心理的聽覺奇異。
在此,本申請人提交的日本專利申請公開第8-166799號介紹了一種防止噪音產(chǎn)生的技術(shù)。在這種技術(shù)中,記錄和存儲了已經(jīng)對在前幀進(jìn)行比特分配的帶寬。決定了將對現(xiàn)在幀進(jìn)行比特分配的帶寬,并沒有與那個(gè)帶寬非常不同。這控制了再現(xiàn)頻帶的變化并且最終防止了噪聲的產(chǎn)生。
在日本專利申請公開第8-166799號中披露的技術(shù)確實(shí)有助于穩(wěn)定再現(xiàn)頻帶。但是,它不能夠完全地解決聽覺問題,因?yàn)樗试S再現(xiàn)頻帶的波動。
為了穩(wěn)定再現(xiàn)頻帶,可以記錄固有地落入頻帶內(nèi)的不必要的頻率分量,或者可以不記錄固有地落入頻帶內(nèi)的必要的頻率分量。從編碼效率的角度來說,兩者都不是想要的。
對于幾個(gè)幀或者幾十個(gè)幀,可以分析所有頻率,并且應(yīng)該進(jìn)行比特分配的相同頻率可以應(yīng)用到所有的幀。但是從實(shí)時(shí)處理要求和合并在公共使用硬件中的存儲器和處理器的成本的角度看,這種方法并不實(shí)用。而且這種方法似乎不增加編碼效率。
發(fā)明內(nèi)容
根據(jù)上述觀點(diǎn)作出本發(fā)明。本發(fā)明的一個(gè)目的是提供一種音頻信息編碼設(shè)備和一種音頻信息編碼方法,兩者有效地編碼包含白噪聲分量的音頻信息并且能防止噪聲的產(chǎn)生,即使再現(xiàn)頻帶從幀到幀變化,也如此。本發(fā)明的另一目的是提供一種存儲由音頻信息編碼設(shè)備和方法產(chǎn)生的代碼序列的記錄介質(zhì)。本發(fā)明的再一目的是提供一種音頻信息解碼設(shè)備和一種音頻信息解碼方法,兩者解碼由音頻信息編碼設(shè)備和方法產(chǎn)生的代碼序列。本發(fā)明的再一目的是提供使計(jì)算機(jī)執(zhí)行所述音頻信息的編碼或解碼處理的程序。
為了達(dá)到上述的第一個(gè)目的,根據(jù)本發(fā)明,音頻信息編碼設(shè)備和音頻信息編碼方法將音頻信號在時(shí)間軸分割成每個(gè)有預(yù)定時(shí)間段的塊,對每一個(gè)塊進(jìn)行頻率變換和編碼,從而編碼音頻信號。為了編碼音頻信號,分析包含于音頻信號中的白噪聲分量,并且編碼指示分析的白噪聲分量的能量水平的指數(shù)。
可以根據(jù)塊的高頻帶部分的能量分布,或者根據(jù)整個(gè)塊的能量分布分析白噪聲分量。
進(jìn)一步,可以編碼用于在解碼端產(chǎn)生白噪聲分量的隨機(jī)數(shù)表的指數(shù)。
為了達(dá)到上述的第二個(gè)目的,根據(jù)本發(fā)明的記錄介質(zhì)存儲代碼序列。通過將音頻信號在時(shí)間軸分割成每個(gè)有預(yù)定時(shí)間段的塊、并且對每一個(gè)塊進(jìn)行頻率變換和編碼,從而編碼音頻信號、以及通過分析包含于音頻信號中的白噪聲、并且通過編碼指示白噪聲分量的能量水平的指數(shù),而產(chǎn)生代碼序列。
為了達(dá)到上述的第三個(gè)目的,根據(jù)本發(fā)明,音頻信息解碼設(shè)備和音頻信息解碼方法解碼所編碼的頻率信號并且對所述信號進(jìn)行反頻率變換,從而產(chǎn)生時(shí)間軸的音頻信號。在產(chǎn)生音頻信號的過程中,根據(jù)指示編碼的白噪聲分量的能量水平的指數(shù)而產(chǎn)生在時(shí)間軸的白噪聲分量,并且將通過反頻率變換方式在時(shí)間軸產(chǎn)生的音頻信號加入到時(shí)間軸的白噪聲分量中。
根據(jù)隨機(jī)數(shù)表的編碼的指數(shù)可以產(chǎn)生白噪聲分量?;蛘撸鶕?jù)包含在代碼序列中的特定值可以產(chǎn)生白噪聲分量。
在音頻信息編碼設(shè)備和方法以及音頻信息解碼設(shè)備和方法中,當(dāng)編碼了包含白噪聲分量的音頻信號時(shí),在編碼端白噪聲分量的能量水平指數(shù)加入到代碼序列中,在解碼端產(chǎn)生與白噪聲分量同樣水平的白噪聲,并且上述白噪聲加入到時(shí)間軸的解碼的音頻信號中。
根據(jù)本發(fā)明的程序使計(jì)算機(jī)執(zhí)行上述的音頻信息編碼處理或上述的音頻信息解碼處理。
本發(fā)明的其他目的以及本發(fā)明帶來的優(yōu)點(diǎn)通過下面的實(shí)施例具體地進(jìn)行說明。
圖1示出了傳統(tǒng)編碼設(shè)備的構(gòu)造簡圖;圖2示出了編碼設(shè)備產(chǎn)生的代碼序列示例;圖3示出了傳統(tǒng)解碼設(shè)備的構(gòu)造簡圖;圖4示出了編碼設(shè)備對任何處于比最低可聽到水平更低的水平的頻率分量不執(zhí)行比特分配的情況;圖5示出了編碼設(shè)備對任何具有比最小編碼閾值更小的值的頻率分量不執(zhí)行比特分配的情況;圖6示出了在編碼端每一幀的最小編碼閾值和白噪聲水平;圖7示出了在解碼端產(chǎn)生的白噪聲的示例;圖8示出了根據(jù)本發(fā)明實(shí)施例的音頻信息編碼設(shè)備的構(gòu)造圖;圖9示出了用于產(chǎn)生指數(shù)iL的白噪聲水平表的示例;圖10示出了用于產(chǎn)生指數(shù)iR的隨機(jī)指數(shù)表的示例;圖11示出了音頻信息編碼設(shè)備產(chǎn)生的代碼序列的示例;圖12示出了根據(jù)本發(fā)明實(shí)施例的音頻信息解碼設(shè)備的構(gòu)造圖。
具體實(shí)施例方式
以下,參照附圖來詳細(xì)說明本發(fā)明的實(shí)施例。所述實(shí)施例包括音頻信息編碼設(shè)備和音頻信息編碼方法,兩者有效地對包含白噪聲分量的音頻信息進(jìn)行編碼并且防止因?yàn)殡S時(shí)間的再現(xiàn)頻帶的波動而產(chǎn)生的噪聲;以及音頻信息解碼設(shè)備和音頻信息解碼方法,兩者將音頻信息編碼設(shè)備和方法產(chǎn)生的代碼序列解碼。首先,介紹音頻信息編碼方法以及音頻信息解碼方法的原理。之后,介紹音頻信息編碼設(shè)備以及音頻信息解碼設(shè)備的構(gòu)造。
在根據(jù)本發(fā)明實(shí)施例的音頻信息編碼方法中,音頻信號輸入在時(shí)間軸分割成每個(gè)有預(yù)定時(shí)間段(幀)的塊。幀逐個(gè)地經(jīng)歷修改的離散余弦變換(MDCT)。因此時(shí)間軸的時(shí)間序列信號變換為在頻率軸的譜信號。(進(jìn)行所謂的“譜變換”)。為了有效地編碼信號,考慮到人的聽覺特性,對小于最小編碼閾值a的任何頻率分量不進(jìn)行比特分配,所述最小編碼閾值a能夠通過基于心理的聽覺模型的比特分配而對每一幀設(shè)置。
如圖6所述,為第(n-1)幀設(shè)置最小編碼閾值a(n-1)。如果最小編碼閾值a(n-1)不在第(n-1)幀中記錄,則認(rèn)為它不影響聲音質(zhì)量。這是因?yàn)槿魏魏斜冗@個(gè)值更低的頻率的分量對于聲音質(zhì)量并不重要。結(jié)果只對在第(n-1)幀中0.60f或更低的頻率分量進(jìn)行比特分配。
在下面幀中,即,第n幀,將最小編碼閾值a設(shè)置在a(n)水平上,并且只對0.50f或更低的頻率分量進(jìn)行比特分配。
在第(n+1)幀中,將最小編碼閾值a設(shè)置在a(n+1)水平上,并且只對所有上至0.10f的頻率分量進(jìn)行比特分配。
可以不丟棄并且不在代碼序列中包含任何具有比最小編碼閾值a更小的值的頻率分量。在這種情況下,當(dāng)再現(xiàn)頻率分量時(shí),再現(xiàn)頻帶隨著幀而變化。結(jié)果不再保持幀的連續(xù)性。這讓聽眾感覺到心理的聽覺奇異。
為了防止這種情況發(fā)生,在本實(shí)施例中分析任何具有比最小編碼閾值a更小的高頻帶頻率分量中的白噪聲分量。從而,在代碼序列中包含通過量化區(qū)域的平均能量水平獲得的滿足下列條件的指數(shù)(a)其能量分布足夠小并且平坦;(b)其頻率分量含有噪聲。
區(qū)域頻率分布可以平坦,并且在區(qū)域中,最高頻率fmax相對于平均頻率fave之比(fmax/fave)可以等于或小于3.0。在這種情況下,在這個(gè)區(qū)域的頻率分量沒有周期性并且包含噪聲,正如試驗(yàn)證明的。
在圖6所示的情況中,對第(n-1)幀、第n幀和第(n+1)幀,分別進(jìn)行在高頻帶上都匹配平坦頻率能量水平的每一個(gè)白噪聲水平b(n-1)、b(n)和b(n+1)的檢測。白噪聲水平變成指數(shù)并且添加到代碼序列中。
在根據(jù)本發(fā)明實(shí)施例的音頻信息解碼方法中,代碼序列中的頻率分量經(jīng)歷反譜變換而被解碼。另外,產(chǎn)生具有由指數(shù)指示的能量水平的白噪聲。
結(jié)果,如圖7所示,在代碼序列中包含的再現(xiàn)的頻率分量的頻帶隨著幀而變化。不用說,由于根據(jù)白噪聲產(chǎn)生了偽高頻分量,所以能有效地降低心理上的聽覺怪異。
在不應(yīng)該加入到編碼端的代碼序列中的任何頻率分量的能量水平以及在解碼端產(chǎn)生的白噪聲的能量水平之間存在距離。該距離不會不利地影響聽眾部分的聽覺感知,因?yàn)槁犛X奇異主要從某頻帶完全停止存在的事實(shí)來產(chǎn)生。
圖8示出根據(jù)本實(shí)施例的執(zhí)行上述處理的音頻信息編碼設(shè)備的構(gòu)造。在圖8所示的音頻信息編碼設(shè)備10中,時(shí)間到頻率轉(zhuǎn)換單元11將輸入音頻信號Si(t)轉(zhuǎn)換成譜信號F(f)。譜信號F(f)提供給比特分配頻帶決定單元12。
比特分配頻帶決定單元12分析譜信號F(f)。之后它將所述譜信號分成頻率分量F(f0)和頻率分量F(f1)。頻率分量F(f0)具有等于或大于最小編碼閾值a的值,并且經(jīng)歷比特分配。頻率分量F(f1)不進(jìn)行比特分配。只有頻率分量F(F0)提供給規(guī)格化/量化單元13。頻率分量F(f1)提供給白噪聲水平?jīng)Q定單元14。
規(guī)格化/量化單元13對頻率分量F(f0)進(jìn)行規(guī)格化和量化,產(chǎn)生量化的值Fq。值Fq提供給編碼單元15。
白噪聲水平?jīng)Q定單元14分析從頻率分量F(f1)提取的白噪聲分量,產(chǎn)生指數(shù)iL。通過量化白噪聲水平獲得的指數(shù)iL指示區(qū)域的平均能量水平,其滿足上述條件。如果使用3比特代表指數(shù)iL,用于產(chǎn)生指數(shù)iL的白噪聲水平表是圖9中示出的類型的。在這個(gè)示例中,如果白噪聲水平大約是8db,那么指數(shù)iL為3。
白噪聲水平?jīng)Q定單元14也產(chǎn)生指數(shù)iR。指數(shù)iR指定必須用于在解碼端產(chǎn)生白噪聲的隨機(jī)數(shù)表的起始指數(shù)iRT。指數(shù)iR可以用三比特表示。在這種情況下,用于產(chǎn)生指數(shù)iR的隨機(jī)數(shù)指數(shù)表是在圖10中示出的類型的。
編碼單元15將從規(guī)格化/量化單元13來的量化的值Fq以及從白噪聲水平?jīng)Q定單元14來的指數(shù)iL和iR編碼。單元15產(chǎn)生代碼序列C。記錄/傳輸單元16在記錄介質(zhì)(未示出)上記錄代碼序列C或者將代碼序列作為比特流BS傳輸。
編碼設(shè)備10產(chǎn)生的代碼序列C具有入圖11所示的格式。如圖11所示,代碼序列C不僅包括頭部H、規(guī)格化信息SF、量化精度信息WL和頻率信息SP,還包括白噪聲標(biāo)記FL和白噪聲信息WN。白噪聲信息WN包括指數(shù)iL和iR。如果白噪聲標(biāo)記FL為“1”,那么代碼序列C包含白噪聲信息WN。如果白噪聲標(biāo)記FL為“0”,那么代碼序列C不包含白噪聲信息WN。在這種情況下,溢出比特用于編碼頻率分量F(f0)中。
可以不設(shè)置白噪聲標(biāo)記FL,在幀中的所有頻率可以有等于或大于最小編碼閾值a的值。在這種情況下,代碼序列C可以包含前面幀的指數(shù)iL和iR。
圖12示出可以與編碼設(shè)備10組合使用的解碼設(shè)備的構(gòu)造。如圖12所示的,在解碼設(shè)備20中,接收/讀取單元12將從編碼設(shè)備10或者從記錄介質(zhì)(未示出)接收的比特流BS恢復(fù)成代碼序列C。代碼序列C提供給解碼單元22。
解碼單元22將代碼序列C解碼,產(chǎn)生量化的值Fq、指數(shù)iL和指數(shù)iR。量化的值Fq提供給反量化/反規(guī)格化單元23,指數(shù)iL和iR提供給白噪聲產(chǎn)生單元25。
反量化/反規(guī)格化單元23對量化的值Fq進(jìn)行反量化和反規(guī)格化,產(chǎn)生頻率分量F(f0)。頻率分量F(f0)提供給頻率到時(shí)間變換單元24。
頻率到時(shí)間變換單元24將頻率分量F(f0)變換成時(shí)間軸的音頻信號Sf(t)。音頻信號Sf(t)提供給加法器26。
白噪聲產(chǎn)生單元25根據(jù)下面等式從指數(shù)iL和iR產(chǎn)生白噪聲信號Sw(t)。白噪聲信號Sw(t)是對應(yīng)于頻率分量F(f1)的時(shí)間系列信號。信號Sw(t)提供給加法器26。
Sw(t)=LEV(iL)*RND(iRT+t) ……(1)其中LEV(iL)是使用iL為參數(shù)的白噪聲水平表LEV()的值。RND(iRT+t)是隨機(jī)數(shù)表RND()的值,其使用通過將頻率分量數(shù)t與指數(shù)iR在隨機(jī)數(shù)表中指定的起始指數(shù)iRT相加而獲得的值作為參數(shù)。將隨機(jī)數(shù)表RND()的值規(guī)格化于,比如-1.0到1.0。
如此,從包含在代碼序列C中的指數(shù)iR產(chǎn)生隨機(jī)數(shù)表的開始指數(shù)iRT。從而能防止每次產(chǎn)生不同的白噪聲。
在隨機(jī)數(shù)表RND()中,iRT+t的值可以超過陣列元素的數(shù)量,Nrnd。如果是這種情況,通過從iRT+t的值中減去數(shù)量Nrnd獲得的值被用作隨機(jī)數(shù)表RND()的參數(shù)。就是說,iRT+t應(yīng)該是0到Nrnd。
在這個(gè)實(shí)施例中,從包含在代碼序列C中的指數(shù)iR產(chǎn)生隨機(jī)數(shù)表的起始指數(shù)iRT。作為替代的,可以不在編碼端產(chǎn)生指數(shù)iR,并且可以從通過在代碼序列中加入特定的值而獲得的值來產(chǎn)生起始指數(shù)iRT,比如對于一個(gè)幀,所有的規(guī)格化信息SF和所有的量化精度信息WL。在這種情況下,防止每次產(chǎn)生不同的白噪聲也是可能的。
在每次允許產(chǎn)生不同的白噪聲的情況下,在解碼端可以產(chǎn)生隨機(jī)數(shù),從而產(chǎn)生起始指數(shù)iRT。
加法器26將從頻率到時(shí)間變換單元24來的音頻信號Sf(t)和從白噪聲產(chǎn)生單元25來的白噪聲信號Sw(t)在時(shí)間軸相加并且作為輸出音頻信號So(t)輸出。
對應(yīng)于白噪聲信號Sw(t)的頻率分量Fw和頻率分量F(f0)可以在頻率軸相加,并且所得分量可以經(jīng)歷時(shí)間到頻率變換,從而產(chǎn)生輸出音頻信號So(t)。但是在與防止預(yù)回聲(pre-echo)的增益控制/補(bǔ)償處理組合使用時(shí),或者象在比如日本專利申請公開第7-221648號中、日本專利申請公開第7-221649號中所述的情況或類似的情況下,這種方法會出現(xiàn)問題。雖然對應(yīng)于白噪聲信號Sw(t)的噪聲分量Fw在頻率軸被相加,其后在增益補(bǔ)償電路里在時(shí)間軸的增益發(fā)生變化。結(jié)果沒有產(chǎn)生白噪聲信號。這就是在時(shí)間軸產(chǎn)生白噪聲信號的原因。
如上所述,根據(jù)本實(shí)施例,在音頻信息編碼設(shè)備10和音頻信息解碼設(shè)備20中,為了編碼包含白噪聲分量的輸入音頻信息,兩者都在編碼端對所有的白噪聲頻率分量不進(jìn)行編碼。而是把白噪聲水平的指數(shù)iL和隨機(jī)數(shù)指數(shù)表中的指數(shù)iR包含在代碼序列C中。這樣在解碼端,可產(chǎn)生與輸入音頻信號的白噪聲有相同水平的白噪聲,從而進(jìn)行有效地編碼。此外,即使再現(xiàn)頻帶隨著幀而波動,還是能防止噪聲產(chǎn)生。
本發(fā)明不僅限于參考于附圖所描述的上述實(shí)施例。對于本專業(yè)的任何技術(shù)人員,在不脫離本發(fā)明的范圍和精髓的情況下,明顯地可以進(jìn)行各種變形、替換或等價(jià)改動。
比如,上述每一個(gè)實(shí)施例都是硬件構(gòu)成。但是,可以使用中央處理單元(CPU)執(zhí)行計(jì)算機(jī)程序來進(jìn)行任何的處理。在這種情況下,可以提供儲存在記錄介質(zhì)上的,或者通過比如互聯(lián)網(wǎng)的傳輸介質(zhì)傳輸而來的計(jì)算機(jī)程序。
在上述實(shí)施例中,每一幀的音頻信號包含白噪聲。但是,本發(fā)明可以用于幀只由白噪聲組成的情況。在這種情況下,分析每一幀的頻率分量,并且通過量化滿足下面條件的幀的平均能量水平獲得的指數(shù)iL、或者隨機(jī)數(shù)指數(shù)表中的指數(shù)iR包含在代碼序列C中。
(c)在整個(gè)頻帶的能量分布足夠小(±6dB,更多或更少);(d)頻率分量在整個(gè)頻帶包含噪聲。
白噪聲能夠表示為“頻率分量”和“白噪聲水平的指數(shù)iL和隨機(jī)數(shù)指數(shù)表的指數(shù)iR”的和。這樣,頻率分量順序經(jīng)歷比特分配,第一個(gè)是最大能量的分量,然后是第二大能量的分量,等等。從而,可以保證要求的最低波形再現(xiàn)性,并且小能量的任何頻率分量可以通過白噪聲水平指數(shù)iL和隨機(jī)數(shù)指數(shù)表指數(shù)iR進(jìn)行替換。這不僅能夠增強(qiáng)波形再現(xiàn)性,而且能夠增強(qiáng)編碼效率。如果比特速率足夠高并且要求高波形再現(xiàn)性,許多比特可以分配給“頻率分量”。如果比特速率非常低,“白噪聲水平的指數(shù)iL和隨機(jī)數(shù)指數(shù)表的指數(shù)iR”用于完成低速率編碼。
產(chǎn)業(yè)上的可利用性如上所述,即使再現(xiàn)頻帶隨塊而波動,本發(fā)明也可以有效地對包含白噪聲分量的音頻信號進(jìn)行編碼,并且防止噪音產(chǎn)生。這是因?yàn)榘自肼暦至康哪芰克街笖?shù)在編碼端被加在代碼序列中,在解碼端產(chǎn)生與上述白噪聲相同水平的白噪聲,并且所述產(chǎn)生的白噪聲在時(shí)間軸加入到解碼的音頻信號中。
權(quán)利要求
1.一種音頻信息編碼設(shè)備,所述音頻信息編碼設(shè)備將音頻信號在時(shí)間軸分割成每個(gè)有預(yù)定時(shí)間段的塊,并且頻率變換和編碼每一個(gè)塊,所述設(shè)備包括白噪聲分析裝置,所述白噪聲分析裝置用于分析包含在音頻信號中的白噪聲分量;白噪聲編碼裝置,所述白噪聲編碼裝置對指示由所述白噪聲分析裝置分析的白噪聲分量的能量水平的指數(shù)進(jìn)行編碼。
2.根據(jù)權(quán)利要求1所述的音頻信息編碼設(shè)備,其中所述白噪聲分析裝置根據(jù)所述塊的高頻帶部分的能量分布分析白噪聲分量。
3.根據(jù)權(quán)利要求1所述的音頻信息編碼設(shè)備,其中所述白噪聲分析裝置根據(jù)整個(gè)塊的能量分布分析白噪聲分量。
4.根據(jù)權(quán)利要求1所述的音頻信息編碼設(shè)備,其中白噪聲編碼裝置進(jìn)一步對用于在解碼端產(chǎn)生白噪聲分量的隨機(jī)數(shù)表的指數(shù)進(jìn)行編碼。
5.根據(jù)權(quán)利要求1所述的音頻信息編碼設(shè)備,進(jìn)一步包括控制在時(shí)間軸的音頻信號增益的增益控制裝置。
6.一種音頻信息編碼方法,所述音頻信息編碼方法將音頻信號在時(shí)間軸分割成每個(gè)有預(yù)定時(shí)間段的塊,并且頻率變換和編碼每一個(gè)塊,所述方法包括白噪聲分析步驟,所述白噪聲分析步驟用于分析包含在音頻信號中的白噪聲分量;白噪聲編碼步驟,所述白噪聲編碼步驟對指示由所述白噪聲分析步驟分析的白噪聲分量的能量水平的指數(shù)進(jìn)行編碼。
7.根據(jù)權(quán)利要求6所述的音頻信息編碼方法,其中在所述白噪聲編碼步驟中進(jìn)一步對用于在解碼端產(chǎn)生白噪聲分量的隨機(jī)數(shù)表的指數(shù)進(jìn)行編碼。
8.一種使計(jì)算機(jī)執(zhí)行音頻信息編碼處理的程序,將音頻信號在時(shí)間軸分割成每個(gè)有預(yù)定時(shí)間段的塊,并且頻率變換和編碼每一個(gè)塊,該程序有白噪聲分析步驟,所述白噪聲分析步驟用于分析包含在音頻信號中的白噪聲分量;白噪聲編碼步驟,所述白噪聲編碼步驟對指示由所述白噪聲分析步驟分析的白噪聲分量的能量水平的指數(shù)進(jìn)行編碼。
9.根據(jù)權(quán)利要求8所述的程序,其中在白噪聲編碼步驟中進(jìn)一步編碼用于在解碼端產(chǎn)生白噪聲分量的隨機(jī)數(shù)表的指數(shù)。
10.一種記錄介質(zhì),所述記錄介質(zhì)存儲通過將音頻信號在時(shí)間軸分割成每個(gè)有預(yù)定時(shí)間段的塊、并且頻率變換和編碼每一個(gè)塊、和通過分析包含在音頻信號中的白噪聲分量、和通過將指示白噪聲分量的能量水平的指數(shù)進(jìn)行編碼而產(chǎn)生的代碼序列。
11.根據(jù)權(quán)利要求10所述的記錄介質(zhì),其中所述代碼序列包括用于在解碼端產(chǎn)生白噪聲分量的隨機(jī)數(shù)表的被編碼的指數(shù)。
12.一種音頻信息解碼設(shè)備,所述音頻信息解碼設(shè)備用于解碼所編碼的頻率信號、反頻率變換所述解碼的頻率信號,從而在時(shí)間軸產(chǎn)生音頻信號,所述設(shè)備包括白噪聲產(chǎn)生裝置,所述白噪聲產(chǎn)生裝置根據(jù)指示白噪聲分量的能量水平的編碼的指數(shù)在時(shí)間軸產(chǎn)生白噪聲分量;相加裝置,所述相加裝置將通過反頻率變換在時(shí)間軸產(chǎn)生的音頻信號與時(shí)間軸的白噪聲分量相加。
13.根據(jù)權(quán)利要求12所述的音頻信息解碼設(shè)備,其中所述白噪聲產(chǎn)生裝置根據(jù)隨機(jī)數(shù)表的編碼的指數(shù)產(chǎn)生所述白噪聲分量。
14.根據(jù)權(quán)利要求12所述的音頻信息解碼設(shè)備,其中所述白噪聲產(chǎn)生裝置根據(jù)包含在代碼序列中的特定值產(chǎn)生所述白噪聲分量。
15.根據(jù)權(quán)利要求14所述的音頻信息解碼設(shè)備,其中特定值是規(guī)格化信息或者量化精度信息。
16.根據(jù)權(quán)利要求12所述的音頻信息解碼設(shè)備,所述音頻信息解碼設(shè)備進(jìn)一步包括用于補(bǔ)償通過反頻率變換在時(shí)間軸獲得的音頻信號的增益的增益補(bǔ)償裝置,其中所述相加裝置把時(shí)間軸上的、補(bǔ)償了增益的音頻信號和時(shí)間軸上的白噪聲分量相加。
17.一種音頻信息解碼方法,所述音頻信息解碼方法用于解碼所編碼的頻率信號、反頻率變換所述的解碼的頻率信號,從而在時(shí)間軸產(chǎn)生音頻信號,所述方法包括白噪聲產(chǎn)生步驟,所述白噪聲產(chǎn)生步驟根據(jù)指示白噪聲分量能量水平的編碼的指數(shù)在時(shí)間軸產(chǎn)生白噪聲分量;和相加步驟,所述相加步驟將通過反頻率變換在時(shí)間軸產(chǎn)生的音頻信號與時(shí)間軸的白噪聲分量相加。
18.一種使計(jì)算機(jī)執(zhí)行音頻信息解碼處理的程序,將編碼的頻率信號解碼、反頻率變換所述的解碼的頻率信號,從而在時(shí)間軸產(chǎn)生音頻信號,所述程序包括白噪聲產(chǎn)生步驟,所述白噪聲產(chǎn)生步驟根據(jù)指示白噪聲分量的能量水平的編碼的指數(shù)在時(shí)間軸產(chǎn)生白噪聲分量;和相加步驟,所述相加步驟將通過反頻率變換在時(shí)間軸產(chǎn)生的音頻信號與時(shí)間軸的白噪聲分量相加。
全文摘要
在音樂信息編碼設(shè)備中,當(dāng)對包含白噪聲分量的音頻信號進(jìn)行編碼時(shí),代碼序列包含指示白噪聲分量的能量水平的指數(shù)iL和指定隨機(jī)數(shù)表的起始指數(shù)的指數(shù)iR。在音樂信息解碼設(shè)備(20)中,白噪聲產(chǎn)生單元(25)使用在代碼序列C中包含的指數(shù)iL和iR,在時(shí)間軸產(chǎn)生與上述白噪聲相同水平的白噪聲信號Sw(t),并且加法器(26)將在時(shí)間軸的解碼的聲音信號Sf(t)相加,并將輸出音樂信號So(t)輸出。
文檔編號G10L19/02GK1711588SQ20038010296
公開日2005年12月21日 申請日期2003年10月10日 優(yōu)先權(quán)日2002年11月13日
發(fā)明者鈴木志朗, 辻實(shí), 東山惠佑 申請人:索尼株式會社