專利名稱:編碼設(shè)備、編碼方法和包括該方法的計算機(jī)程序產(chǎn)品的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及編碼設(shè)備、編碼方法和包括編碼方法的程序產(chǎn)品。
背景技術(shù):
傳統(tǒng)上,已對用于壓縮/解壓縮作為語音、音樂等的聲音源的音頻信 號的音頻編碼技術(shù)進(jìn)行了各種研究。例如,針對用于通過轉(zhuǎn)換為頻域來 編碼音頻信號的方案進(jìn)行了各種研究。
例如,這些音頻編碼技術(shù)將在高級音頻編碼(ACC)方法、高效高 級音頻編碼(HE-ACC)方法中出現(xiàn)。ACC和HE-ACC方法是ISO/IEC MPEG-2/4音頻標(biāo)準(zhǔn)中的方法,并且廣泛用于數(shù)字廣播(例如數(shù)字地面、 BS數(shù)字和通信衛(wèi)星,以及日本的一段式廣播)中。
在這些音頻編碼技術(shù)中,用于實現(xiàn)音頻編碼技術(shù)的常規(guī)編碼設(shè)備通 過修正離散余弦變換(MDCT)轉(zhuǎn)換將音頻信號轉(zhuǎn)換為頻譜,對頻譜進(jìn) 行量化,然后執(zhí)行編碼。
常規(guī)編碼設(shè)備利用聽覺遮蔽屬性(auditory masking property)來對頻 譜進(jìn)行量化。具體地說,常規(guī)編碼設(shè)備僅對可由人類聽覺感受所聽到的 聲音進(jìn)行量化。在量化中,使用作為閾值的遮蔽閾值,即,用于是否可 聽到聲音的閾值,來確定在聽覺上不能被聽到的聲音分量。
例如,常規(guī)編碼設(shè)備執(zhí)行音質(zhì)分析,這是用于針對音頻信號(要編 碼的聲音源)分析是否可在聽覺上聽到聲音的方案。然后對于每個頻率 確定遮蔽閾值。其后,對于具有預(yù)定頻率寬度的每個頻帶,常規(guī)編碼設(shè) 備確定誤差界限。誤差界限是基于確定的遮蔽閾值而在量化期間所允許 的容許誤差功率。然后,使用該容許誤差功率,常規(guī)編碼設(shè)備僅對作為 在聽覺上可聽到的聲音源的頻譜進(jìn)行量化。
日本特開第2006-18023號的第5到11頁和圖1公開了用于調(diào)整遮蔽閾值的方案,日本特開第2001-7704號的第5到9頁和圖1公開了用于 改進(jìn)編碼期間的效率以減少編碼期間使用的比特使用量的方案。另外, 日本特開第7-202823號的第3到5頁和圖1以及日本特開第7-295594號 的第2到3頁和圖1公開了用于指定比特分布量的方案。
同時,上述常規(guī)技術(shù)具有在編碼音調(diào)高的音頻信號期間聲音質(zhì)量劣 化的問題。
更詳細(xì)地說,因為常規(guī)編碼設(shè)備在編碼音調(diào)音頻信號期間不能可靠 地對與峰值相鄰的頻譜進(jìn)行量化,所以該設(shè)備不能令人滿意地執(zhí)行編碼 同時維持足夠的聲音質(zhì)量。
上述的日本特開未公開用于可靠地量化與峰值相鄰的頻譜的方案并 且不能在編碼音調(diào)音頻信號期間充分地改善聲音質(zhì)量。
發(fā)明內(nèi)容
本發(fā)明的一個目的是提供能夠以令人滿意的狀態(tài)操作的編碼設(shè)備。 根據(jù)本發(fā)明的一個方面,提供了現(xiàn)在的編碼設(shè)備,其用于將音頻信 號轉(zhuǎn)換為頻譜并且對該頻譜進(jìn)行量化和編碼,該編碼設(shè)備包括功率校正 單元和量化單元,該功率校正單元用于當(dāng)從頻譜檢測到音調(diào)頻譜(tonal fr叫uency spectrum)時校正根據(jù)音頻信號確定的容許誤差功率,該量化 單元用于對具有比由功率校正單元校正的容許誤差功率大的功率的每個 頻譜進(jìn)行量化。
根據(jù)本發(fā)明的另一方面,提供了一種用于對音頻信號進(jìn)行編碼的編 碼設(shè)備,其包括用于將音頻信號轉(zhuǎn)換為頻譜的頻率轉(zhuǎn)換單元、用于根據(jù) 音頻信號確定容許誤差功率的功率確定單元、用于從由頻率轉(zhuǎn)換單元轉(zhuǎn) 換的頻譜中檢測音調(diào)頻譜的檢測單元、用于利用檢測單元執(zhí)行的檢測的 結(jié)果和功率確定單元確定的容許誤差功率來校正容許誤差功率的功率校 正單元,以及用于對具有比由功率校正單元校正的容許誤差功率大的功 率的每個頻譜進(jìn)行量化的量化單元。
圖1例示了示出根據(jù)第一實施方式的編碼設(shè)備的基礎(chǔ)技術(shù)的圖2例示了示出根據(jù)第一實施方式的編碼設(shè)備的基礎(chǔ)技術(shù)的圖3A到3C例示了示出根據(jù)第一實施方式的編碼設(shè)備的基礎(chǔ)技術(shù)的
圖4例示了示出根據(jù)第一實施方式的編碼設(shè)備的基礎(chǔ)技術(shù)的圖; 圖5例示了示出根據(jù)第一實施方式的編碼設(shè)備的概況和結(jié)構(gòu)的圖; 圖6例示了示出根據(jù)第一實施方式的編碼設(shè)備的結(jié)構(gòu)的框圖; 圖7A到7D例示了示出根據(jù)第一實施方式的編碼設(shè)備的音調(diào)檢測單 元的圖8A和8B例示了示出根據(jù)第一實施方式的編碼設(shè)備中的音質(zhì)分析 單元的圖9例示了示出根據(jù)第一實施方式的編碼設(shè)備中的容許誤差功率校 正單元的圖IOA到IOD例示了示出根據(jù)第一實施方式的編碼單元中的容許誤 差功率校正單元的圖11A和11B例示了示出根據(jù)第一實施方式的編碼單元中的縮放因 子校正單元的圖12例示了示出根據(jù)第一實施方式的編碼設(shè)備的處理流程的流程
圖13例示了示出根據(jù)第一實施方式的編碼設(shè)備的縮放因子校正單 元執(zhí)行的處理流程的流程圖14A例示了音頻信號的波形,圖14B例示了經(jīng)編碼的信號,并且 圖14C例示了經(jīng)編碼的信號的頻率特性;
圖15例示了與音調(diào)頻譜相鄰的頻譜;
圖16A例示了原始聲音,圖16B例示了在使用已知方案進(jìn)行量化期 間生成的異常聲音的生成,并且圖16C例示了異常聲音的減少; 圖17例示了示出根據(jù)第二實施方式的編碼設(shè)備的圖; 圖18A到18C例示了示出根據(jù)第二實施方式的編碼設(shè)備的圖; 圖19例示了根據(jù)第二實施方式的編碼設(shè)備中的縮放因子校正處理的流程圖20例示了示出根據(jù)第三實施方式的編碼設(shè)備的圖; 圖21例示了示出根據(jù)第三實施方式的編碼設(shè)備的圖; 圖22例示了用于根據(jù)第一實施方式的編碼設(shè)備的程序的圖;以及
圖23A到23C例示了對于基礎(chǔ)技術(shù)的考慮。
具體實施方式
[對于基礎(chǔ)技術(shù)的考慮]
參考圖23A到23B,描述了對編碼音頻信號的常規(guī)技術(shù)的考慮,以 弄清在對與音調(diào)音頻信號的峰值相鄰的頻譜進(jìn)行量化時造成的缺點。當(dāng) 編碼音調(diào)音頻信號,例如正弦波、掃描波等時,以dB為單位的強(qiáng)度或功 率集中在相比于其它頻帶展示出相對大的峰值的特定頻帶中。即,特定 頻帶具有如圖23A中所示具有高強(qiáng)度的頻譜,圖23A例示了通過對音調(diào) 音頻信號執(zhí)行MDCT轉(zhuǎn)換而獲得的頻譜。
而且,如圖23B中所示,在常規(guī)編碼設(shè)備中,針對與包括峰值的頻 帶相鄰的頻帶而確定的容許誤差功率也增大了。具體地說,因為包括峰 值的頻帶中的頻譜在功率上大于其它頻譜,所以常規(guī)編碼設(shè)備也具有為 相鄰頻帶和包括峰值的頻帶確定的較大遮蔽閾值。結(jié)果,容許誤差功率 也增大了。傳統(tǒng)上,如圖23C中所示,與峰值相鄰的頻帶中的頻譜為小 于或等于容許誤差功率的頻譜。因為相鄰頻帶中的頻譜被認(rèn)為是不要量
化的頻譜,所以不量化該頻譜。
當(dāng)通過MDCT轉(zhuǎn)換音頻信號時,合成頻譜由都包含音頻信號的振幅 和相位信息的各個MDCT系數(shù)組成,雖然圖23A、 23B和23C中的每一 個僅僅示出了單獨(dú)的振幅。例如,當(dāng)與峰值相鄰的頻譜未被量化時,頻 譜中包含的信息丟失了。因此,相位和振幅的減少影響了聲音源中與峰 值關(guān)聯(lián)的分量,并且造成聲音質(zhì)量劣化,例如抖音的感覺。特別是,對 于音調(diào)音頻信號,相比于低音調(diào)音頻信號,在具有峰值的頻帶中與特定 頻率相鄰的聲音源有效地貢獻(xiàn)于主聲音源,并且由于與峰值相鄰的頻譜 中包含的信息的丟失而造成的影響對于經(jīng)編碼的聲音源的聲音質(zhì)量有強(qiáng)烈的影響。
下面將參考附圖詳細(xì)描述編碼設(shè)備、編碼方法和包括該方法的程序 產(chǎn)品的實施方式。在下面,按順序描述根據(jù)第一實施方式的編碼設(shè)備的 基礎(chǔ)技術(shù)、概況、特征以及處理流程,然后描述其它實施方式。
首先,利用圖1到4來描述用于描述根據(jù)第一實施方式的編碼設(shè)備 的基礎(chǔ)技術(shù)。
術(shù)語"頻譜"對應(yīng)于系數(shù),例如,通過例如由MDCT將音頻信號(聲 音源)轉(zhuǎn)換為頻域而獲得的每個頻率的MDCT系數(shù)。術(shù)語"頻譜功率" 對應(yīng)于頻譜的平方的值。術(shù)語"音調(diào)頻譜"是當(dāng)頻譜功率的峰值集中于 頻譜的一個頻率處時該頻率的系數(shù)。例如,具有比所有頻譜功率的平均 值大的功率的頻譜對應(yīng)于音調(diào)頻譜。對應(yīng)于"音調(diào)頻譜"的轉(zhuǎn)換源的音 頻信號稱為"音調(diào)聲音源"。
另外,術(shù)語"量化"是用于對小數(shù)點后的數(shù)值向下舍入取整的處理 (例如,將"1.8"和"2.1"分別改變?yōu)槔?1"和"2"的整數(shù))。術(shù) 語"量化值"表示通過量化頻譜而獲得的值。
術(shù)語"量化誤差"是通過量化頻譜而在每個頻譜中造成的誤差。具 體地說,如圖1中所示,量化前的頻譜和逆量化后的頻譜之間的差異對 應(yīng)于量化誤差,其中將逆量化后的頻譜稱為"逆量化頻譜"。
這里,術(shù)語"逆量化頻譜"是根據(jù)量化值獲得的頻譜。下面描述頻 譜、量化值和逆量化頻譜的關(guān)系。通過下面描述的處理序列,編碼設(shè)備 量化頻譜以獲得量化值,然后根據(jù)所述量化值獲得逆量化頻譜。因為頻 譜的動態(tài)范圍通常較大,所以編碼設(shè)備首先使用預(yù)定的"縮放因子"執(zhí) 行縮放以減小范圍,如圖1中的(1)所示。其后,如圖1中的(2)所 示,編碼設(shè)備執(zhí)行量化以獲得量化值。然后,如圖1中的(3)所示,編 碼設(shè)備利用所述預(yù)定的縮放因子來再縮放(執(zhí)行圖1中的(1)處執(zhí)行的 縮放的逆處理)所獲得的量化值,以獲得逆量化頻譜。
在該情況下,由圖2中所示的公式1中所示的表達(dá)式給出逆量化頻譜,并且由圖2中所示的公式2給出量化值。這些公式根據(jù)表達(dá)式1導(dǎo)
出,表達(dá)式l是表示頻譜、量化值和縮放因子之間的關(guān)系的表達(dá)式。"2a (縮放因子)"表示"2的縮放因子次冪"。 表達(dá)式h頻譜=量化值乂2^ (縮放因子)
分析音頻信號的頻譜的頻率范圍分為多個作為頻帶的具有預(yù)定頻率 寬度的更小頻率范圍。對于每個頻帶,給出單獨(dú)的"縮放因子"。例如, 在圖1中所示的示例中,將一個縮放因子設(shè)置給圖1中所示的包含頻譜 (4)和(5)的頻帶"b"。由編碼設(shè)備確定縮放因子使得量化誤差功率 小于容許誤差功率。
術(shù)語頻譜的"頻帶功率"指頻帶中包含的頻譜的功率總和。
術(shù)語頻譜的"量化誤差功率"指量化誤差的平方的值。而且,在一 個頻帶中的量化誤差功率指根據(jù)在對頻帶中包含的頻譜進(jìn)行量化期間生 成的量化誤差而確定的量化誤差功率的總和。具體地說, 一個頻帶中的 量化誤差功率和量化誤差之間的關(guān)系由表達(dá)式2給出,其中A2表示平方。
表達(dá)式2: —個頻帶中的量化誤差功率=2{(頻帶中包含的頻譜中的 量化誤差)A2〉。
而且,術(shù)語"容許誤差功率"是在量化期間所允許的最大量化誤差 功率。容許誤差功率是在量化經(jīng)縮放的頻譜期間造成的量化誤差功率中 的容許最大量化誤差功率。更詳細(xì)地說,對于每個頻帶根據(jù)對應(yīng)于該頻 帶的遮蔽閾值的變換而導(dǎo)出容許誤差功率,其中遮蔽閾值表示是否可在 聽覺上聽到它。例如,作為用于根據(jù)遮蔽閾值確定容許誤差功率的方案, 可以使用ISO/正C 13818-7中描述的方案,或者可以使用其它方案。
具體地說,容許誤差功率是"容許量化誤差功率的界限"。例如,一 個頻帶中的容許誤差功率是針對該頻帶確定的量化誤差功率,并且展示 了作為在量化該頻帶中的頻譜期間生成的誤差所允許的最大值。換言之, 根據(jù)第一實施方式的編碼設(shè)備對頻譜進(jìn)行量化,使得一個頻帶中的量化 前頻譜的功率和逆量化頻譜的功率之間的差異功率小于容許誤差功率。
而且,用于每個頻帶的容許誤差功率根據(jù)單獨(dú)的遮蔽閾值導(dǎo)出。還 將導(dǎo)出的容許誤差功率與單獨(dú)的功率頻譜進(jìn)行比較,以選擇要對哪個頻帶中的頻譜進(jìn)行量化。在確定要量化的頻譜期間與容許誤差功率比較的 是頻帶功率。
而且,術(shù)語"編碼"是用于通過例如使用霍夫曼編碼將量化值和/或 縮放因子轉(zhuǎn)換為其它值(編碼)的處理。
下面簡要描述縮放因子和量化誤差功率之間的關(guān)系。如上所述,將 每個縮放因子分配給各個相應(yīng)頻帶,并且使用所分配的縮放因子來量化 一個頻帶中包含的每個頻譜。
當(dāng)關(guān)注頻帶中的一個頻譜時,如圖3A所示給出量化值和縮放因子之 間的關(guān)系,并且下面的表達(dá)式3和表達(dá)式4所示的關(guān)系成立。 表達(dá)式3:較大縮放因子O較小量化值
表達(dá)式4:較小縮放引子O較大量化值
現(xiàn)在關(guān)注頻帶中包含的頻譜。如圖3B中所示,當(dāng)縮放因子設(shè)置為較 大時,量化值根據(jù)頻帶中的小功率頻譜變?yōu)?0",因而量化誤差增大。
艮口,如圖3C所示,對于縮放因子和量化誤差功率,下面的表達(dá)式5 和表達(dá)式6中的關(guān)系成立。
表達(dá)式5:較大縮放因子<=>較小量化值4量化誤差增大
表達(dá)式6:較小縮放引子G較大量化值—量化誤差減小
當(dāng)用量化值"0"量化頻帶中包含的所有頻譜時(即,不量化),量 化誤差功率具有最大值并且下面的表達(dá)式7中的關(guān)系成立。
表達(dá)式7:量化誤差功率=頻帶功率
另外,現(xiàn)在將簡要描述縮放因子、量化誤差功率和容許誤差功率的 關(guān)系。首先,當(dāng)頻帶功率大于容許誤差功率時,編碼設(shè)備將該頻帶視為
要量化的頻帶。而且,如圖4中所示,編碼設(shè)備使用使量化誤差功率小 于容許誤差功率的縮放因子來量化頻譜。因而,如圖4中所示,編碼設(shè) 備使用滿足"容許誤差功率>量化誤差功率"的縮放因子來執(zhí)行量化。 現(xiàn)在,再次總結(jié)量化誤差功率、容許誤差功率和頻帶功率的關(guān)系。
即,關(guān)系為
(1) 量化誤差功率的最大值是頻帶功率(表達(dá)式7),
(2) 當(dāng)用量化值"0"量化所有頻譜(即,未量化)時給出表達(dá)式7中的關(guān)系,并且
(3)使用滿足容許誤差功率>量化誤差功率的情況的縮放因子執(zhí)行 量化值(這稱為"表達(dá)式A")?,F(xiàn)在,當(dāng)表達(dá)式7中的關(guān)系成立時,表 達(dá)式A由下面的表達(dá)式B給出。
表達(dá)式B:容許誤差功率〉量化誤差功率,其中量化誤差功率=頻帶 功率。
頻帶功率等于量化誤差功率的情況對應(yīng)于頻譜的量化值為"0"的情 況(即,頻譜未被量化)。換言之,容許誤差功率用作為用于確定是否要 量化頻帶中的所有頻譜的閾值。
接下來將使用例示出根據(jù)第一實施方式的編碼設(shè)備的概況和特征的 圖5,來描述根據(jù)該實施方式的編碼設(shè)備的概況和特征。
圖5例示了設(shè)置有多個主單元的編碼設(shè)備,并且示出為在每個單元 中處理信號以對音頻信號進(jìn)行編碼。當(dāng)要編碼的聲音源(音頻信號)輸 入到編碼設(shè)備中時,該設(shè)備如圖5所示對音頻信號進(jìn)行編碼。該編碼設(shè) 備的主要特征在于,它可以改善音調(diào)音頻信號的編碼聲音質(zhì)量,如下所 述。
艮P,頻率轉(zhuǎn)換單元將輸入的音頻信號轉(zhuǎn)換為頻譜,如圖5中的(1) 所示。頻率轉(zhuǎn)換單元為具有預(yù)定頻率寬度的各頻帶確定頻譜功率,如圖5 中的(2)所示。例如,頻率轉(zhuǎn)換單元確定與頻帶中包含的每個頻譜的單 獨(dú)功率的總和對應(yīng)的總功率(頻帶功率)。在圖5中的(2)所示的示例 中,各無陰影的條表示各頻帶中的頻譜。
如圖5中的(3)所示,功率確定單元根據(jù)音頻信號確定各個頻帶的 容許誤差功率(參考上述的[基礎(chǔ)技術(shù)])。在圖5中的(3)所示的示例中, 各陰影條表示各頻帶中的(基于頻帶的)容許誤差功率。
如圖5中的(4)所示,檢測單元從頻率轉(zhuǎn)換單元轉(zhuǎn)換的頻譜中檢測 音調(diào)頻譜,并且也檢測包含該音調(diào)頻譜的頻帶。例如,檢測單元將圖5 中的(4)中的頻帶"5"檢測為包含音調(diào)頻譜的頻帶。
然后,功率校正單元使用檢測單元所檢測到的結(jié)果和功率確定單元所確定的容許誤差功率兩者來校正容許誤差功率。具體地說,功率校正 單元對與包含音調(diào)頻譜的頻帶相鄰的頻帶的容許誤差功率中的每一個容 許誤差功率進(jìn)行單獨(dú)校正,使得該容許誤差功率小于頻帶中的頻譜功率 的總和。
如圖5中的(5)所示,功率校正單元校正與頻帶"5"相鄰的頻帶 "4"和"6"的頻譜的功率,使得頻帶"4"和"6"中的每一個頻帶的 容許誤差功率小于頻帶"4"和"6"的頻譜功率中的每一個。為了闡明 校正,圖5中的(6)中的頻帶"4"和"6"中的條中的陰影部分示出了 針對各頻帶的經(jīng)校正的容許誤差功率。即,在圖5中的(6)中,頻帶"4" 和"6"中的各無陰影部分例示了由功率校正單元校正的量。
然后,在編碼設(shè)備中,如圖5中的(7)所示,量化單元對具有比功 率校正單元所校正的容許誤差功率大的功率的頻譜進(jìn)行量化。例如,量 化單元對包含音調(diào)頻譜的頻帶"5"中包含的頻譜和具有經(jīng)功率校正單元 所校正的容許誤差功率的頻帶"4"和"6"中包含的頻譜進(jìn)行量化,如 圖5中(7)中所示。
具體地說,因為校正了容許誤差功率,使得與峰值功率相鄰的頻譜 被量化,所以能夠可靠地對與峰值功率相鄰的頻譜進(jìn)行量化,并且能夠 改善音調(diào)音頻信號的編碼聲音質(zhì)量。
〖編碼設(shè)備的結(jié)構(gòu)]
接下來將使用圖6到11來描述圖5中示出的編碼設(shè)備的結(jié)構(gòu)。這里, 圖6是示出根據(jù)第一實施方式的編碼設(shè)備的結(jié)構(gòu)的框圖。圖7是用于描 述第一實施方式中的音調(diào)檢測單元的圖。圖8是用于描述第一實施方式 中的音質(zhì)分析單元的圖。圖9是用于描述第一實施方式中的容許誤差功 率校正單元的圖。圖IO是用于描述第一實施方式中的容許誤差功率校正 單元的圖。圖11是用于描述第一實施方式中的縮放因子校正單元的圖。
如圖6中所示,編碼設(shè)備包括輸入單元101、修正離散余弦變換 (MDCT)單元102、音調(diào)檢測單元103、音質(zhì)分析單元104、容許誤差 功率校正單元105、量化頻帶檢測單元106、縮放因子確定單元107、縮 放因子校正單元108、量化單元109、編碼單元IIO、以及輸出單元lll。MDCT單元102、音質(zhì)分析單元104、以及音調(diào)檢測單元103可分別 對應(yīng)于"頻率轉(zhuǎn)換單元"、"功率確定單元"、以及"檢測單元"。此外, 容許誤差功率校正單元105和量化單元109可分別對應(yīng)于"功率校正單 元"和"量化單元"??s放因子確定單元107可對應(yīng)于"第一縮放因子確 定單元"和"第二縮放因子確定單元"??s放因子校正單元108可對應(yīng)于 "第三縮放因子確定單元"。
作為要編碼的聲音源的音頻信號由輸入單元101接收,然后被饋送 到下面描述的MDCT單元102和音質(zhì)分析單元104兩者。
MDCT單元102將從輸入單元101發(fā)送的音頻信號轉(zhuǎn)換為頻譜。具 體地說,通過MDCT轉(zhuǎn)換,MDCT單元102執(zhí)行用于將從輸入單元101 發(fā)送的音頻信號轉(zhuǎn)換為頻譜的時間頻率轉(zhuǎn)換。例如,這里的時間頻率轉(zhuǎn) 換是指將作為時間變量的函數(shù)的音頻信號轉(zhuǎn)換為頻率變量的頻譜。
MDCT單元102為通過按照預(yù)定頻率帶寬劃分頻譜的整個預(yù)定寬度 而獲得的每個頻帶確定頻譜功率。例如,在圖7A所示的示例中,寬度W 內(nèi)的頻譜被劃分為表示為頻帶"0"到"6"的七個子頻帶,并且每個頻 帶中包含的頻譜的功率總和被確定為頻帶功率,例如Eo到E6。
而且,MDCT單元102將轉(zhuǎn)換后的頻譜和頻帶功率的數(shù)據(jù)發(fā)送到下 述的音調(diào)檢測單元103和量化頻帶檢測單元106兩者。
在從MDCT單元102接收到頻譜的數(shù)據(jù)的情況下,音調(diào)檢測單元103 針對該頻譜分析音調(diào),檢測音調(diào)頻譜,并且檢測包含該音調(diào)頻譜的頻帶。
而且,例如,如圖7B所示,音調(diào)檢測單元103根據(jù)所確定的各個頻 帶中的功率來確定所有頻帶中的功率的平均值(換言之,所有頻譜的功 率的平均值)。具體地說,當(dāng)用"band"表示(例如,"band"在圖7B所 示的示例中是7個)頻帶號(劃分的頻帶的數(shù)量)并且用"Eband"表示每 個頻帶功率時,音調(diào)檢測單元103根據(jù)圖7C所示的表達(dá)式確定所有頻帶 中的頻譜的平均功率"Eave"。
而且,如圖7D所示,當(dāng)頻帶具有在它的頻帶寬度上平均的功率并且 該平均的功率大于閾值時,音調(diào)檢測單元103確定該頻帶是音調(diào)頻帶, 其中,所述閾值是在要計算的整個范圍上平均的功率。具體地說,對于圖7B所示的示例,音調(diào)檢測單元103將頻帶3檢測為包含音調(diào)頻譜的頻
帶,因為頻帶3是具有大于所確定的平均功率Eave的平均頻譜功率的頻 帶。
而且,音調(diào)檢測單元103將檢測到的包含音調(diào)頻譜的頻帶的數(shù)據(jù)發(fā) 送到下述的容許誤差功率校正單元105和縮放因子校正單元108兩者。 此外,音調(diào)檢測單元103發(fā)送標(biāo)志信息和用于標(biāo)識所檢測到的頻帶的信 息,它們分別表示為tone—flag和tone_band。表示為tone—flag的標(biāo)志指 示檢測了音調(diào),而表示為tone—band的信息指示在圖7B所示的示例中頻 帶3具有頻帶功率E3。 tone_flag和tone—band這兩條信息都被發(fā)送到下述 的容許誤差功率校正單元105和縮放因子校正單元108。當(dāng)音調(diào)檢測單元 103未檢測到包含音調(diào)頻譜的頻帶時,單元103不發(fā)送tone—flag和 tone—band信息。
音調(diào)檢測單元103也將從MDCT單元102接收的頻譜和頻帶功率的 數(shù)據(jù)發(fā)送到下述的容許誤差功率校正單元105。
在從輸入單元101接收到音頻信號的情況下,音質(zhì)分析單元104根 據(jù)該音頻信號確定容許誤差功率(參考基礎(chǔ)技術(shù))。音質(zhì)分析單元104將 該音頻信號中包括的頻率的預(yù)定帶寬劃分為更小的預(yù)定寬度的頻帶,并 且針對各個劃分的頻帶確定容許誤差功率,而優(yōu)選的是使用MDCT單元 102確定的頻帶。
如圖8A中所示,音質(zhì)分析單元104為從輸入單元101發(fā)送的音頻信 號確定遮蔽閾值。而且,如圖8B中所示,單元104轉(zhuǎn)換所確定的遮蔽閾 值以確定容許誤差功率。
這里提及的術(shù)語"頻帶"對應(yīng)于MDCT單元102使用的頻帶。換言 之,音質(zhì)分析單元104優(yōu)選地使用MDCT單元102確定的頻帶和各個頻 帶功率來為每個頻帶確定容許誤差功率。為了易于理解,圖8A和8B中 的每一個都結(jié)合頻譜例示了遮蔽閾值或容許誤差功率。
音質(zhì)分析單元104還將所確定的容許誤差功率的數(shù)據(jù)發(fā)送到下述的 容許誤差功率校正單元105。
容許誤差功率校正單元105具有頻帶數(shù)存儲單元(圖6中未示出),該頻帶數(shù)存儲單元用于存儲預(yù)定頻帶數(shù)。如圖9所示,容許誤差功率校
正單元105從音調(diào)檢測單元103接收"tone—band"禾B "tone—flag"的檢 測結(jié)果,從音質(zhì)分析單元104接收容許誤差功率的數(shù)據(jù),并且還從音調(diào) 檢測單元103接收頻帶功率的數(shù)據(jù)。"tone—band"和"tone—flag"在圖9 中所示的示例中示出為"檢測結(jié)果"。使用檢測結(jié)果和頻帶功率的數(shù)據(jù), 容許誤差功率校正單元105校正了容許誤差功率的數(shù)據(jù)。所述頻帶數(shù)存 儲單元可對應(yīng)于"頻帶數(shù)存儲單元"。
具體地說,它在容許誤差功率校正單元105中執(zhí)行,使得音質(zhì)分析 單元104針對與音調(diào)檢測單元103所檢測的頻帶相鄰的頻帶而確定的容 許誤差功率小于針對該相鄰頻帶的頻帶功率。
例如,容許誤差功率校正單元105將位于由頻帶數(shù)存儲單元所存儲 的預(yù)定頻帶數(shù)的范圍中且以包含音調(diào)檢測單元103檢測到的音調(diào)頻譜的 頻帶作為其中心的頻帶,檢測為相鄰頻帶。
下面通過舉例具體描述音調(diào)檢測單元103檢測第"b"個頻帶并且頻 帶數(shù)存儲單元中存儲的預(yù)定頻帶寬度是校正帶寬"B"的情況的示例。如 圖10A中所示,容許誤差功率校正單元105將與頻帶"b"相鄰的"B" 個頻帶檢測為要校正的相鄰頻帶,其中第"b"個頻帶為這些頻帶的中心。 換言之,容許誤差功率校正單元105將第"b-B"到第"b+B"個頻帶檢 測為要校正的相鄰頻帶。例如,在圖IOA中所示的示例中,對于"b=16" 和"B=4",容許誤差功率校正單元105將頻帶"12"到"20"檢測為要 校正的相鄰頻帶。
而且,如圖10B中所示,容許誤差功率校正單元105針對所檢測的 相鄰頻帶校正容許誤差功率。如圖10B中所示,作為所檢測的相鄰頻帶 的頻帶"12"到"20"(不包括頻帶"16")中的校正前容許誤差功率大 于所檢測的相鄰頻帶中的頻帶功率。因此,容許誤差功率校正單元105 通過均等地衰減頻帶"12"到"20"(不包括頻帶"16")的容許誤差功 率以使得這些容許誤差功率小于頻譜的功率來執(zhí)行校正。 一種衰減方法 確定"M,b-l-gXMw"(衰減量"g"〈1.0),如圖IOC中所示,其中"MV, 表示第"b-l"個頻帶的校正后容許誤差功率,并且"Mw"表示第"b-1"個頻帶的校正前容許誤差功率。
容許誤差功率校正單元105還向量化頻帶檢測單元106發(fā)送由音 質(zhì)分析單元104確定的容許誤差功率的數(shù)據(jù);和校正后的容許誤差的數(shù)
據(jù)。當(dāng)容許誤差功率校正單元105未從音調(diào)檢測單元103接收到標(biāo)志 (tone—flag)和用于標(biāo)識所檢測的頻帶的信息時,校正單元105不執(zhí)行用 于校正容許誤差功率的處理,并且將音質(zhì)分析單元104確定的容許誤差 功率發(fā)送到下述的量化頻帶檢測單元106。
量化頻帶檢測單元106在接收到頻譜和容許誤差功率時,從頻譜的 頻帶中檢測要量化的頻帶。該頻譜來自于MDCT單元102,并且容許誤 差功率(包括由容許誤差功率校正單元105校正的容許誤差功率)來自 于容許誤差功率校正單元105。
具體地說,量化頻帶檢測單元106逐頻帶地比較從MDCT單元102 發(fā)送的頻帶功率和從容許誤差功率校正單元105發(fā)送的容許誤差功率。 由此確定要量化的頻帶。更具體地說,針對具有經(jīng)容許誤差功率校正單 元105校正后的容許誤差功率的頻帶,量化頻帶檢測單元106比較校正 后的容許誤差功率和頻帶的頻帶功率。而且,針對不具有單元105校正 的容許誤差功率的頻帶,單元106比較音質(zhì)分析單元104確定的容許誤 差功率和頻帶的頻帶功率。單元106還檢測頻帶功率比容許誤差功率大 的每個頻帶,作為要量化的頻帶。單元106還檢測用于標(biāo)識所檢測的頻 帶的信息。
量化頻帶檢測單元106還向縮放因子確定單元107發(fā)送用于標(biāo)識要 量化的檢測頻帶的信息、從容許誤差功率校正單元105發(fā)送的容許誤差 功率的數(shù)據(jù)、以及從MDCT單元102發(fā)送的頻譜的數(shù)據(jù)。
在從量化頻帶檢測單元106發(fā)送了用于標(biāo)識要量化的頻帶的信息、 容許誤差功率以及頻譜的情況下,縮放因子確定單元107對于各個頻帶 確定使量化誤差功率小于容許誤差功率的縮放因子。
當(dāng)容許誤差功率校正單元105針對與包含音調(diào)檢測單元103所檢測 的音調(diào)頻譜的頻帶相鄰的頻帶校正了容許誤差功率時,縮放因子確定單 元107確定使量化誤差功率小于針對該相鄰頻帶的校正后的容許誤差功率的縮放因子。
縮放因子確定單元107還向下述的縮放因子校正單元108發(fā)送用于 標(biāo)識要量化的頻帶的信息、以及為各個頻帶確定的容許誤差功率、頻譜 和縮放因子的數(shù)據(jù)集合。
如圖11A中所示,縮放因子校正單元108從音調(diào)檢測單元103接收 音調(diào)檢測結(jié)果的數(shù)據(jù),從縮放因子確定單元107接收用于標(biāo)識要量化的 頻帶的信息,以及各個頻帶的容許誤差功率(圖11中未示出所述信息和 容許誤差功率)、頻譜和縮放因子的各數(shù)據(jù)集合。在接收到這些數(shù)據(jù)時, 縮放因子校正單元108校正包含音調(diào)頻譜的頻帶的縮放因子。如上所述, 音調(diào)檢測結(jié)果包括包含音調(diào)頻譜的頻帶和音調(diào)檢測信號的數(shù)據(jù)。具體地 說,縮放因子校正單元108把包含音調(diào)頻譜的頻帶的縮放因子校正為使 得從構(gòu)成頻帶的頻譜中最大的一個獲得的量化值成為量化值中的最大值 的縮放因子。
現(xiàn)在,將具體描述其中包含音調(diào)頻譜的頻帶是頻帶"b"并且縮放因 子確定單元107針對頻帶"b"確定的縮放因子是"Sb"的情況的示例。 縮放因子校正單元108搜索頻帶"b"中包含的最大頻譜(在圖11A中所 示的示例中,對應(yīng)于"最大頻譜搜索")。最大頻譜稱為"maX_pow—spec", 并且這里提及的術(shù)語"最大頻譜"是指頻譜中的構(gòu)成包含音調(diào)頻譜的頻 帶的最大功率的頻譜。
而且,例如,在檢測到最大頻譜時,縮放因子校正單元108確定使 得通過量化最大頻譜而獲得的量化值成為"MAX—QUANT"的縮放因子 "S,b"。 "MAX一QUANT"指量化值中的最大值。在圖11A中所示的示 例中,在"校正縮放值確定"中確定縮放因子"S'b",并且將其設(shè)置為 包含音調(diào)檢測單元103所檢測的音調(diào)頻譜的頻帶的縮放因子。例如,根 據(jù)圖11B中所示的表達(dá)式,縮放因子校正單元108用縮放因子"S'b"代 替"Sb",即,將縮放因子"Sb"校正為縮放因子"S,b"。量化值的最大 值是由編碼技術(shù)標(biāo)準(zhǔn)定義的值,并且在先進(jìn)音頻編碼(AAC)的標(biāo)準(zhǔn)中 定義了 MAX—QUANT=8191。
縮放因子校正單元108還向量化單元109發(fā)送用于標(biāo)識要量化的頻帶的信息、以及各個頻帶的容許誤差功率、頻譜和縮放因子的各集合。 縮放因子的數(shù)據(jù)包括由縮放因子校正單元108為包含音調(diào)頻譜的頻帶所 檢測的縮放因子。
在接收到用于標(biāo)識要量化的頻帶的信息、以及各個頻帶的容許誤差
功率、頻譜和縮放因子的各個數(shù)據(jù)集合時,量化單元109對具有比容許 誤差功率大的功率的每個頻譜進(jìn)行量化。具體地說,針對量化頻帶檢測 單元106所檢測的每個頻帶,量化單元109將頻譜的動態(tài)范圍減小到縮 放因子唯一指定的動態(tài)范圍,并且對構(gòu)成減小后的動態(tài)范圍中的每個頻 帶的各個頻譜進(jìn)行量化。在該過程中,量化頻帶檢測單元106所檢測的 頻帶中的每一個由用于標(biāo)識要量化的頻帶的信息所標(biāo)識。
更具體地說,通過使用縮放因子校正單元108確定的縮放因子,量 化單元109對縮放因子校正單元108確定了其縮放因子的頻帶中包含的 每個頻譜進(jìn)行量化。此外,通過使用縮放因子確定單元107確定的縮放 因子,量化單元109對縮放因子校正單元108未確定其縮放因子的頻帶 中包含的每個頻譜進(jìn)行量化。
在該情況下,量化單元109使用縮放因子確定單元107和縮放因子 校正單元108所確定的縮放因子,來逐頻帶地(對于每個頻帶)改變動 態(tài)范圍。其后,在執(zhí)行量化期間,量化單元109對于構(gòu)成每個頻帶的頻 譜逐個地(對于每個頻譜)執(zhí)行量化,而不是逐頻帶地執(zhí)行量化。艮P, 量化單元109獲得各個頻譜的量化值。
量化單元109還將量化獲得的量化值的數(shù)據(jù)和縮放因子發(fā)送到下述 的編碼單元110。
在從量化單元109接收到量化值和縮放因子時,編碼單元110對量 化值和縮放因子進(jìn)行編碼。例如,編碼單元110使用霍夫曼編碼來對量 化值和縮放因子進(jìn)行單獨(dú)編碼。編碼單元110將經(jīng)編碼的信息發(fā)送到下 述的輸出單元lll。
在從編碼單元110接收到經(jīng)編碼的信息時,輸出單元111輸出從編 碼單元110接收的信息,作為輸入單元101輸入的音頻信號的編碼信息。
編碼設(shè)備還可通過將上述的MDCT單元102、音調(diào)檢測單元103、音質(zhì)分析單元104、容許誤差功率校正單元105、量化頻帶檢測單元106、 縮放因子確定單元107、縮放因子校正單元108、以及量化單元109的功 能合并到信息處理設(shè)備如已知的個人計算機(jī)、工作站、便攜式電話、PHS 終端、移動通信終端、或PDA中來實現(xiàn)。 [編碼設(shè)備執(zhí)行的處理]
接下來將使用圖12和13來描述編碼設(shè)備執(zhí)行的處理。這里,首先 使用圖12來描述編碼設(shè)備執(zhí)行的整個處理的流程,然后,使用圖13來 描述由縮放因子校正單元108執(zhí)行的處理的流程。圖12是示出根據(jù)第一 實施方式的編碼設(shè)備的整個處理的流程的流程圖,而圖13是示出根據(jù)第 一實施方式的縮放因子校正單元執(zhí)行的處理的流程的流程圖。
如圖12中所示,在公開的編碼設(shè)備中,當(dāng)存在音頻信號時(步驟 S101:"是"),即當(dāng)輸入單元101接收到音頻信號時,MDCT單元102執(zhí) 行MDCT轉(zhuǎn)換(步驟S102)。即,MDCT單元102將從輸入單元101發(fā) 送的音頻信號轉(zhuǎn)換為頻譜。MDCT單元102然后劃分頻帶(步驟S103) 并且確定頻帶功率(步驟S104)。 g卩,MDCT單元102確定頻譜功率, 并且還確定通過按照預(yù)定寬度進(jìn)行劃分而獲得的各頻帶中的頻譜功率的 總和。
音調(diào)檢測單元103然后檢測包含音調(diào)頻譜的頻帶(步驟S105)。艮P, 當(dāng)存在具有比閾值(該閾值是所有頻帶的頻譜的平均功率)大的頻譜功 率的頻帶時,音調(diào)檢測單元103將該頻帶檢測為具有高音調(diào)的頻帶。
音調(diào)分析單元104然后確定容許誤差功率(步驟S106)。目卩,在從 輸入單元101發(fā)送了音頻信號時,音質(zhì)分析單元104根據(jù)該音頻信號確 定容許誤差功率。
在該情況下,當(dāng)存在音調(diào)時(步驟S107:"是"),換言之,當(dāng)音調(diào) 檢測單元103在上述的步驟S105中檢測到音調(diào)頻帶時,容許誤差功率校 正單元105校正容許誤差功率(步驟S108)。即,在從音調(diào)檢測單元103 發(fā)送了檢測結(jié)果時,容許誤差功率校正單元105校正針對相鄰頻帶的容 許誤差功率。例如,容許誤差功率校正單元105將針對相鄰頻帶的容許誤差功率校正為小于針對該相鄰頻帶的頻帶功率的容許誤差功率。
因此,容許誤差功率校正單元105校正容許誤差功率(步驟S108)。 另外,當(dāng)不存在音調(diào)時(步驟S107:"否"),量化頻帶檢測單元106檢測 要量化的頻帶(步驟S109)。即,在從MDCT單元102發(fā)送了頻譜并從 容許誤差功率校正單元105發(fā)送了容許誤差功率時,量化頻帶檢測單元 106從頻譜的頻帶中檢測要量化的頻帶。
縮放因子確定單元107然后確定縮放因子(步驟SllO)。即,在從 量化頻帶檢測單元106發(fā)送了用于標(biāo)識要量化的頻帶的信息、容許誤差 功率和頻譜時,縮放因子確定單元107對于每個頻帶確定使得量化誤差 功率小于或等于容許誤差功率的縮放因子。
在該情況下,當(dāng)存在音調(diào)時(步驟S111:"是"),縮放因子校正單元 108校正縮放因子(步驟S112)。即,當(dāng)從音調(diào)檢測單元103發(fā)送了包含 音調(diào)頻譜的頻帶,并從縮放因子確定單元107發(fā)送了用于標(biāo)識要量化的 頻帶的信息、以及各個頻帶的容許誤差功率、頻譜和縮放因子時,縮放 因子校正單元108校正包含音調(diào)頻譜的頻帶的縮放因子。
縮放因子校正單元108然后校正縮放因子(步驟S112)。另外,當(dāng) 不存在音調(diào)時(步驟S111:"否"),量化單元109對頻譜進(jìn)行量化(步驟 S113)。即,在從縮放因子校正單元108發(fā)送了用于標(biāo)識要量化的頻帶的 信息、以及各個頻帶的容許誤差功率、頻譜和縮放因子時,量化單元109 對由量化頻帶檢測單元106所檢測的每個頻帶中的每個頻譜進(jìn)行量化。
然后,編碼單元110執(zhí)行編碼(步驟S114)。即,在從量化單元109 發(fā)送了由量化獲得的量化值時,編碼單元IIO對這些量化值進(jìn)行編碼。
如圖13中所示,在所公開的編碼設(shè)備,當(dāng)校正了縮放因子時(步驟 S201:"是"),即當(dāng)從音調(diào)檢測單元103發(fā)送了包含音調(diào)頻譜的頻帶,且 從縮放因子確定單元107發(fā)送了用于標(biāo)識要量化的頻帶的信息、以及各 個頻帶的容許誤差功率、頻譜和縮放因子時,縮放因子校正單元108檢 測最大頻譜(步驟S202)。
然后,例如,縮放因子校正單元108對于量化值最大的情況確定縮放因子(步驟S203)。即,縮放因子校正單元108確定這樣的縮放因子, 該縮放因子使得根據(jù)頻譜中構(gòu)成包含由音調(diào)檢測單元103所檢測的音調(diào) 頻譜的頻帶的最大一個而獲得的量化值為最大值。
縮放因子校正單元108然后校正縮放因子(步驟S204)。即,縮放 因子校正單元108把縮放因子確定單元107所確定的縮放因子校正為針 對從中檢測到音調(diào)頻譜的頻帶確定的縮放因子。
如上所述,根據(jù)第一實施方式,公開的編碼設(shè)備將音頻信號轉(zhuǎn)換為 頻譜,對于通過按照預(yù)定寬度劃分該音頻信號的頻譜而獲得的各個頻帶 確定容許誤差功率。編碼設(shè)備還從該頻譜中檢測音調(diào)頻譜,并且檢測包 含該音調(diào)頻譜的頻帶。使用該檢測結(jié)果和容許誤差功率,編碼設(shè)備執(zhí)行 校正,使得針對與檢測單元所檢測的頻帶相鄰的頻帶而確定的容許誤差 功率小于針對該相鄰頻帶的頻譜的功率。此外,編碼設(shè)備對具有比校正 后的容許誤差功率大的功率的每個頻譜進(jìn)行量化。因此,可以改善音調(diào) 音頻信號的編碼聲音質(zhì)量。
具體地說,因為按校正與峰值功率相鄰的每個頻譜的方式來校正容 許誤差功率,所以能夠可靠地對與峰值功率相鄰的每個頻譜進(jìn)行量化。 此外,能夠改善音調(diào)音頻信號的編碼聲音質(zhì)量。
艮口,當(dāng)要以已知方案對音調(diào)音頻信號進(jìn)行編碼時,不能可靠地對與 音調(diào)頻譜相鄰的頻譜進(jìn)行量化,從而丟失了相鄰的頻譜。因此,在如圖 14A所示的原始聲音中,編碼聲音的相位特性如圖14B所示失真了,這 會導(dǎo)致振幅波動并且導(dǎo)致聲音振動或抖音。
而且,例如,在已知方案中,振幅波動得溢出(例如,超過PCM的 最大值(16比特)),這導(dǎo)致生成削波。因此,如圖14C中所示,生成了 異常的聲音,例如chi,ri,chi'ri的聲音(例如,削波噪聲)。而且,如圖 14B所示,振幅的變化導(dǎo)致聲音的感受振動。
相比于這些常規(guī)方案,根據(jù)所公開的編碼設(shè)備,能夠可靠地對與音 調(diào)頻譜相鄰的頻譜進(jìn)行量化,如圖15所示。因此,在對圖16A中所示的 原始聲音進(jìn)行編碼期間,在如圖16B所示使用已知方案進(jìn)行量化期間生 成的感受振動的聲音和異常聲音chi'ri'chi'ri的生成減少了,如圖16C所示,并且可以改善音調(diào)音頻信號的編碼聲音質(zhì)量。
而且,根據(jù)第一實施方式,在所公開的編碼設(shè)備中,針對與包含檢 測到的音調(diào)頻譜的頻帶相鄰的頻帶,縮放因子校正單元108按使得根據(jù) 作為在對該相鄰頻帶中包含的頻譜進(jìn)行量化期間生成的誤差的量化誤差
而確定的量化誤差功率小于容許誤差功率校正單元105針對該相鄰頻帶
而確定的容許誤差功率的方式,確定針對該相鄰頻帶的縮放因子,作為
用于該相鄰頻帶的縮放因子,并且量化單元109通過使用縮放因子校正 單元108確定的縮放因子,對由縮放因子校正單元108確定了其縮放因 子的頻帶中包含的每個頻譜進(jìn)行量化。因此,即使校正了容許誤差功率 時,也能夠使用合適的縮放因子來執(zhí)行量化。
而且,根據(jù)第一實施方式,在所公開的編碼設(shè)備中,音調(diào)檢測單元 103檢測包含音調(diào)頻譜的頻帶。其后,確定該頻帶的縮放因子,以使得根 據(jù)頻譜中構(gòu)成包括該音調(diào)頻譜的頻帶的最大一個而獲得的量化值為最大 值。因此,能夠最小化量化誤差。具體地說,因為根據(jù)具有音調(diào)的峰值 而獲得的量化值取基于標(biāo)準(zhǔn)設(shè)置的最大值,所以能夠最小化量化誤差。
而且,根據(jù)第一實施方式,所公開的編碼設(shè)備存儲預(yù)定頻帶數(shù),并 且確定在所存儲的預(yù)定頻帶數(shù)的范圍內(nèi)且以包含所檢測到的音調(diào)頻譜的 頻帶為中心的相鄰頻帶。其后,編碼設(shè)備校正該相鄰頻帶的容許誤差功 率。因此,能夠容易地檢測到要校正容許誤差功率的頻帶。
根據(jù)第一實施方式的編碼設(shè)備采用這樣的方案,其中縮放因子校正 單元108校正用于音調(diào)檢測單元103所檢測的頻帶的縮放因子,以使得 通過對頻帶的頻譜中的最大一個進(jìn)行量化的值成為基于標(biāo)準(zhǔn)的最大值。 然而本發(fā)明不限于該方案。例如,根據(jù)第二實施方式的編碼設(shè)備可以是 這樣的,即,該編碼設(shè)備搜索使所生成的量化誤差功率較小的縮放因子, 并且使用通過搜索而獲得的縮放因子。
根據(jù)第二實施方式的編碼設(shè)備將由縮放因子確定單元107確定的縮 放因子和從將縮放因子改變預(yù)定值而獲得的改變縮放因子中選擇的縮放 因子確定為縮放因子。然后,編碼設(shè)備使用兩個縮放因子中的減小量化期間生成的量化誤差(或者量化誤差功率)的一個。下面,簡要地給出 或者省略與第一實施方式中的編碼設(shè)備相同之處的描述。
在根據(jù)第二實施方式的編碼設(shè)備中,對應(yīng)于"誤差確定單元"的縮 放因子校正單元108通過使用縮放因子確定單元107針對頻帶確定的縮 放因子,來確定在對該頻帶中包含的頻譜進(jìn)行量化期間生成的量化誤差
功率。此外,縮放因子校正單元108使用通過改變縮放因子確定單元107 確定的縮放因子而獲得的改變縮放因子,來確定量化誤差功率。
因此,如圖17中所示,根據(jù)第二實施方式的縮放因子校正單元108 不同于根據(jù)第一實施方式的圖11B所示的縮放因子校正單元。即,在縮 放校正值搜索中,根據(jù)第二實施方式的縮放因子校正單元108使用容許 誤差功率(在第二實施方式中,由容許誤差功率校正單元105校正的容 許誤差功率和校正前容許誤差功率)。
具體地說,在根據(jù)第二實施方式的編碼設(shè)備中,針對音調(diào)檢測單元 103所檢測的頻帶,縮放因子校正單元108通過使用縮放因子確定單元 107確定的縮放因子,對構(gòu)成頻帶的頻譜中的每一個進(jìn)行量化。然后,編 碼設(shè)備確定量化期間生成的量化誤差功率(參考對于基礎(chǔ)技術(shù)的考慮)。
具體地說,以下說明了這樣的情況音調(diào)檢測單元103檢測出頻帶 "b",縮放因子確定單元107確定用于頻帶"b"的縮放因子"Sb",并 且構(gòu)成頻帶"b"的頻譜數(shù)量是"Nb"。
首先,在根據(jù)第二實施方式的編碼設(shè)備中,縮放因子校正單元108 通過使用縮放因子"Sb",來對構(gòu)成頻帶"b"的每個頻譜進(jìn)行量化以確 定量化值。然后,單元108通過使用所確定的量化值和縮放因子"Sb" 來執(zhí)行逆量化以確定逆量化頻譜。例如,在AAC編碼方法中,縮放因子 校正單元108根據(jù)圖18A和18B中所示的表達(dá)式,確定從頻帶"b"中 包含的第i個頻譜"speci"獲得的量化值"quanti"和逆量化頻譜"ispeci"。
然后,在編碼設(shè)備中,縮放因子校正單元108根據(jù)量化前頻譜和逆 量化頻譜確定頻帶的量化誤差功率。例如,縮放因子校正單元108根據(jù) 圖18C中所示的表達(dá)式確定頻帶"b"中的量化誤差功率"error—eb"。圖 18C中所示的表達(dá)式中的"Nb"表示頻帶"b"中包含的頻譜數(shù)量。而且,具體地說,縮放因子校正單元108將縮放因子確定單元107 確定的縮放因子改變了預(yù)定值。然后單元108使用改變后的縮放因子(改 變縮放因子)來確定在針對音調(diào)檢測單元103所檢測的頻帶的量化期間 生成的量化誤差功率。
例如,縮放因子校正單元108將縮放因子"Sb"改變了預(yù)定值"A", 并且使用所產(chǎn)生的改變縮放因子"S,b (例如"S,b" = "Sb" + "A")", 來確定在對頻帶"b"的量化期間生成的量化誤差功率。
而且,具體地說,在根據(jù)第二實施方式的編碼設(shè)備中,縮放因子校 正單元108比較兩個量化誤差功率(一個稱為"第一"量化誤差功率, 另一個稱為"第二"量化誤差功率),來確定"第二"量化誤差功率是否 更小。第一量化誤差功率通過使用縮放因子確定單元107所確定的縮放 因子而生成,而第二量化誤差功率通過使用改變縮放因子而生成。在該 情況下,當(dāng)"第二"量化誤差功率小于"第一"量化誤差功率時,縮放 因子校正單元108將用于音調(diào)檢測單元103所檢測出的頻帶的縮放因子 (例如"Sb")校正為改變縮放因子(例如"S'b")。另一方面,當(dāng)"第 二"量化誤差功率不小于"第一"量化誤差功率時,縮放因子校正單元 108不校正縮放因子。
而且,縮放因子校正單元108通過使用各種"A"來針對多個縮放因 子確定量化誤差功率,并且將縮放因子校正為使得生成最小量化誤差功 率的縮放因子。它作為示例示出,其中縮放因子校正單元108分別使用 "Sbl"和"Sb2"作為第一量化期間和第二量化期間的改變縮放因子。 當(dāng)單元108針對第一操作使用改變縮放因子"Sbl"來校正單元107確定 的縮放因子"Sb"時,單元108然后比較使用"Sbl"生成的量化誤差功 率和使用"Sb2"生成的量化誤差功率。
而且,例如,縮放因子校正單元108確定是否針對所有預(yù)定的改變 縮放因子(例如,根據(jù)預(yù)定的"A "確定的縮放因子(改變縮放因子候選)) 執(zhí)行了比較。然后,縮放因子校正單元108繼續(xù)縮放因子校正處理,直 到針對所有改變縮放因子執(zhí)行了比較。
盡管已對根據(jù)第二實施方式的編碼設(shè)備描述了縮放因子校正單元108逐個地比較量化誤差功率的方案,但本發(fā)明不限于此。可以設(shè)置為, 分別針對多個縮放因子確定量化誤差功率,同時對所確定的多個(例如 三個或更多個)量化誤差功率執(zhí)行比較,并且使用使所生成的量化誤差 功率最小的一個縮放因子。
"A"的值是任意的,并且"A"不僅采用大于"0"的值,而且"A" 也可采用小于"0"的值。而且,縮放因子校正單元108可以預(yù)先存儲關(guān) 于用作為改變縮放因子的值的數(shù)量(用于確定和比較量化誤差功率的次 數(shù))的設(shè)置,并且可以基于該設(shè)置執(zhí)行縮放因子校正處理。
本發(fā)明不限于使用各種"A"(使用多個改變縮放因子)的方案。例 如,可將由縮放因子確定單元107確定的縮放因子與僅一個改變縮放因 子比較。例如,可以預(yù)先選擇被估計會減小量化誤差的一個值,并且將 其用作為改變縮放因子。這使得可以快速地執(zhí)行縮放因子校正處理。
現(xiàn)在不描述根據(jù)第二實施方式的編碼設(shè)備中的縮放因子校正單元 108執(zhí)行的詳細(xì)處理的流程的一個示例,而在后面進(jìn)行描述。
在根據(jù)第二實施方式的編碼設(shè)備中,量化單元109通過使用縮放因 子(或者改變縮放因子)對頻帶中包含的每個頻譜進(jìn)行量化??s放因子 (或者改變縮放因子)是使縮放因子校正單元108確定的量化誤差功率 最小的縮放因子。例如,縮放因子校正單元108確定針對縮放因子確定 單元107確定的縮放因子"Sb"和通過將縮放因子改變了 "A"而獲得 的值"S,b"的量化誤差功率。然后,當(dāng)使用"S,b"而生成的量化誤差功 率最小時,使用縮放因子"S'b"對構(gòu)成由音調(diào)檢測單元103檢測的頻帶 的每個頻譜進(jìn)行量化。
接下來將使用圖19來描述第二實施方式中縮放因子校正單元執(zhí)行 的處理。圖19是示出根據(jù)第二實施方式的編碼設(shè)備執(zhí)行的縮放因子校正 處理的流程的流程圖。
作為示例,使用這樣的情況給出下面的描述,其中,除非另有特別 說明,否則音調(diào)檢測單元103檢測出頻帶"b",縮放因子確定單元107 確定用于頻帶"b"的縮放因子"Sb",并且構(gòu)成頻帶"b"的頻譜數(shù)量是"Nb"。
如圖19中所示,在所公開的編碼設(shè)備中,當(dāng)縮放因子校正單元108 要校正縮放因子時(步驟S301:"是"),它確定量化誤差功率(步驟S302)。 即,縮放因子校正單元108通過使用縮放因子確定單元107確定的縮放 因子"Sb"來執(zhí)行量化,并且確定在對頻帶"b"的量化期間生成的量化 誤差功率。
然后,縮放因子校正單元108改變該縮放因子(步驟S303)。艮P, 例如,縮放因子校正單元108將縮放因子"Sb"改變了預(yù)定值"A"。縮 放因子校正單元108然后通過使用改變后的縮放因子來確定量化誤差功 率(步驟S304)。即,例如,縮放因子校正單元108通過使用所獲得的改 變縮放因子"S,b"來確定在對頻帶"b"的量化期間生成的量化誤差功 率。
然后,縮放因子校正單元108比較量化誤差功率(步驟S305)。艮P, 例如,針對在對頻帶"b"的量化期間生成的量化誤差功率,縮放因子校 正單元108比較"第一"量化誤差功率和"第二"量化誤差功率。"第一" 量化誤差功率是在使用縮放因子確定單元107確定的縮放因子"Sb"時 生成的。"第二"量化誤差功率是在使用改變縮放因子"S,b"時生成的。
然后,縮放因子校正單元108比較通過使用縮放因子確定單元107 確定的縮放因子和通過使用改變縮放因子導(dǎo)出的兩個量化誤差功率,來 確定當(dāng)使用改變縮放因子時量化誤差功率是否更小(步驟S306)。 g卩,例 如,縮放因子校正單元108確定"第二"量化誤差功率是否小于"第一" 量化誤差功率。在該情況下,當(dāng)"第二"量化誤差功率小于"第一"量 化誤差功率時(步驟S306:"是"),縮放因子校正單元108校正縮放因子 (步驟S307)。 g卩,例如,縮放因子校正單元108將縮放因子"Sb"校正 為改變縮放因子"S'b"。
然后,當(dāng)縮放因子校正單元108校正縮放因子時(步驟S307),或 者當(dāng)"第二"量化誤差功率不小于"第一"量化誤差功率時(步驟S306: "否"),縮放因子校正單元108確定是否已針對所有改變縮放因子候選 執(zhí)行了比較(步驟S308)。在該情況下,當(dāng)已針對所有縮放因子候選執(zhí)行了比較時(步驟S308:"是"),處理結(jié)束。另一方面,當(dāng)尚未針對所有改
變縮放因子候選執(zhí)行了比較時(步驟S308:"否"),重復(fù)上述從步驟S303 到S307的處理,直到已針對所有改變縮放因子候選執(zhí)行了比較。
如上所述,根據(jù)第二實施方式,在公開的編碼設(shè)備中,縮放因子校 正單元108通過使用縮放因子確定單元107確定的縮放因子并且還使用 改變縮放因子來確定量化誤差功率。然后,編碼設(shè)備通過使用當(dāng)確定了 所確定的量化誤差功率中最小的一個時使用的縮放因子(或改變縮放因 子)來執(zhí)行量化。
盡管上面已描述了第一和第二實施方式,本發(fā)明還可以按不同于上 述第一和第二實施方式的各種其它形式來實現(xiàn)。因此,下面將描述其它 實施方式。
己在上述的第一和第二實施方式中描述了縮放因子校正單元108校 正僅針對由音調(diào)檢測單元103檢測的頻帶的縮放因子的方案。本發(fā)明不 限于此,而可以針對所有頻帶校正縮放因子。這允許根據(jù)第三實施方式 的編碼設(shè)備減小針對其它頻帶的量化誤差。
而且,例如,量化單元109可以通過使用縮放因子校正單元108確
定的縮放因子來對所有頻帶中包含的每個頻譜進(jìn)行量化。具體來說,縮 放因子校正單元108確定僅針對由音調(diào)檢測單元103檢測的頻帶的縮放 因子,并且校正該縮放因子。此外,單元108將針對其它頻帶的縮放因 子校正為針對音調(diào)檢測單元103檢測的頻帶而確定的縮放因子。量化單 元109然后通過使用音調(diào)檢測單元103針對音調(diào)檢測單元103所檢測的 頻帶而確定的縮放因子,來對所有頻帶中的每個頻譜進(jìn)行量化。
這允許根據(jù)第三實施方式的編碼設(shè)備減少在對縮放因子進(jìn)行編碼期 間使用的比特數(shù)量。具體地說,在編碼期間,通過與相鄰縮放因子的差 來表示一縮放因子。在該情況下,相比于為各個頻帶設(shè)置不同縮放因子 的方案,將所有的縮放因子設(shè)為相同的縮放因子使得可以減少在對用于 單獨(dú)頻帶的縮放因子集合進(jìn)行解碼期間所需的比特數(shù)量。[相鄰頻帶]
盡管在上述第一實施方式中已描述了以預(yù)定頻帶寬度存在且以音調(diào) 檢測單元103所檢測的頻帶作為其中心的頻帶用作為相鄰頻帶的方案, 但本發(fā)明不限于此,而可以使用以相對于峰值功率的預(yù)定功率寬度存在 的頻帶。
換言之,如圖20中所示,首先,基于頻帶功率和音調(diào)檢測單元103 的檢測結(jié)果,使用預(yù)置功率寬度來確定要校正容許誤差功率的頻帶寬度, 然后校正容許誤差功率。
具體地說,在根據(jù)第三實施方式的編碼設(shè)備中,容許誤差功率校正 單元105具有功率寬度存儲單元。該功率寬度存儲單元中存儲有預(yù)定功 率寬度。例如,容許誤差功率校正單元105在功率寬度存儲單元中存儲 "G"。
然后,在編碼設(shè)備中,音調(diào)檢測單元103檢測包含音調(diào)頻譜的頻帶。 此外,容許誤差功率校正單元105關(guān)注具有以下功率值且包括該包含音 調(diào)頻譜的頻帶的相鄰頻帶。所述功率值大于或等于從音調(diào)檢測單元103 檢測的頻帶的功率值衰減了功率寬度存儲單元中存儲的預(yù)定功率寬度后 的功率值。容許誤差功率校正單元105校正相鄰頻帶的容許誤差功率, 如圖21中所示。
例如,使用圖21中所示的示例具體地給出描述。在該情況下,假設(shè) 音調(diào)頻帶中的頻譜功率是"Epeak",功率寬度存儲單元存儲"G",并且存 在七個頻帶,來進(jìn)行描述。在根據(jù)第三實施方式的編碼設(shè)備中,容許誤 差功率校正單元105確定作為通過從"Epeak"衰減了 "G"而獲得的功率 的"Eth/',并且使用"Eth/'作為用于確定要校正容許誤差功率的頻帶的 功率閾值。
例如,在根據(jù)第三實施方式的編碼設(shè)備中,容許誤差功率校正單元 105在與音調(diào)頻帶相鄰的頻帶中檢査功率比功率閾值大的頻帶。例如,在 圖21中所示的示例中,因為頻帶"2"和"4"展示了比功率閾值大的功 率,所以容許誤差功率校正單元105確定要校正容許誤差功率的頻帶寬 度是"B1 (相比于與音調(diào)頻帶相鄰的頻帶在更低頻率側(cè)的頻帶數(shù)量)=1"和"B2 (相比于與音調(diào)頻帶相鄰的頻帶在更高頻率側(cè)的頻帶數(shù)量)=1"。 以該方式,根據(jù)第三實施方式的編碼設(shè)備可以容易地檢測要校正容許誤差功率的頻帶。 [系統(tǒng)結(jié)構(gòu)]在本實施方式中描述的處理中,作為自動執(zhí)行描述的處理的整體或 一部分可以手動執(zhí)行,或者作為手動執(zhí)行描述的處理的整體或一部分可 由已知方法自動執(zhí)行。另外,除非另有特別說明,否則說明書和附圖(例如,圖5到13和圖17到21)中例示的處理過程、控制過程、特定名稱 和包括各種類型數(shù)據(jù)和參數(shù)的信息,可被任意修改。 [實施方式的組合]而且,例如,已對于上述第一實施方式中的描述給出這樣的情況, 其中,在校正容許誤差功率期間一起實現(xiàn)了 (1)用于校正縮放因子的方 案,(2)使用使量化值成為最大值的縮放因子的方案,和(3)在檢測相 鄰頻帶期間使用預(yù)定帶寬的方案。然而,本發(fā)明不限于該情況,并且在 校正容許誤差功率期間,(1)到(3)不必一起實現(xiàn),而也可僅實現(xiàn)(1) 到(3)中的一個或某些。而且,類似地,針對上述第二實施方式和第三實施方式中描述的方 案,本發(fā)明不限于實現(xiàn)方案之一的情況,而也可一起實現(xiàn)多個方案。[程序]同時,盡管已在上述第一實施方式中描述了通過硬件邏輯實現(xiàn)各種 類型處理的情況,但本發(fā)明不限于此,而也可通過使計算機(jī)執(zhí)行準(zhǔn)備好 的程序來實現(xiàn)處理。因此,下面將使用圖22來描述用于執(zhí)行具有與上述 第一實施方式中例示的編碼設(shè)備相同的功能的編碼程序的計算機(jī)的一個 示例。圖22是描述用于根據(jù)第一實施方式的編碼設(shè)備的程序的圖。如圖中所示,第一實施方式中的編碼設(shè)備3000具有這樣的結(jié)構(gòu),其 中,操作單元3001、麥克風(fēng)3002、揚(yáng)聲器3003、顯示器3005、通信單 元3006、 CPU 3010、 ROM 3011、 HDD 3012、以及RAM 3013通過總線 3009等連接起來。ROM 3011預(yù)先存儲控制程序,例如輸入程序3011a、 MDCT程序301 lb、音調(diào)檢測程序3011c、音質(zhì)分析程序3011d、容許誤差功率校正程 序3011e、量化頻帶檢測程序3011f、縮放因子確定程序3011g、縮放因 子校正程序3011h、量化程序3011i、編碼程序3011j、以及輸出程序3011k。 每個預(yù)先存儲的控制程序分別提供與上述第一實施方式中例示的輸入單 元101、 MDCT單元102、音調(diào)檢測單元103、音質(zhì)分析單元104、容許 誤差功率校正單元105、量化頻帶檢測單元106、縮放因子確定單元107、 縮放因子校正單元108、量化單元109、編碼單元110、以及輸出單元111 相同的功能。這些程序3011a到3011k可以根據(jù)需要而集成在一起或者分 散開,類似于圖6中示出的構(gòu)成編碼設(shè)備的部件。CPU 3010從ROM 3011讀取這些程序301 la到301 lk并且執(zhí)行它們, 由此使得程序3011a到3011k用作輸入處理3010a、 MDCT處理3010b、 音調(diào)檢測處理3010c、音質(zhì)分析處理3010d、容許誤差功率校正處理3010e、 量化頻帶檢測處理3010f、縮放因子確定處理3010g、縮放因子校正處理 3010h、量化處理3010i、編碼處理3010j、以及輸出處理3010k,如圖22 中所示。處理3010a到3010k分別對應(yīng)于圖6中示出的輸入單元101、 MDCT單元102、音調(diào)檢測單元103、音質(zhì)分析單元104、容許誤差功率 校正單元105、量化頻帶檢測單元106、縮放因子確定單元107、縮放因 子校正單元108、量化單元109、編碼單元IIO、以及輸出單元lll。[其它]本實施方式中描述的編碼設(shè)備可以通過使計算機(jī)例如個人計算機(jī)或 工作站執(zhí)行準(zhǔn)備好的程序來實現(xiàn)。該程序可分布于網(wǎng)絡(luò)例如因特網(wǎng)上。 該程序也可記錄到計算機(jī)可讀存儲介質(zhì),例如硬盤、軟盤(FD)、CD-ROM、 MO、以及DVD,并且還可以通過使計算機(jī)從記錄介質(zhì)讀取程序而被執(zhí) 行。針對包括上述實施方式的例示性實施方式進(jìn)一步公開了以下附錄。 本申請基于并且要求2008年2月19日提交的在先日本專利申請第2008-037991號的優(yōu)先權(quán),通過引用將該日本專利申請的全部內(nèi)容合并于此。
權(quán)利要求
1、一種編碼設(shè)備,其用于將音頻信號轉(zhuǎn)換為多個頻譜并且用于對每個頻譜進(jìn)行量化和編碼,該編碼設(shè)備包括功率校正單元,其用于當(dāng)從所述頻譜中檢測到音調(diào)頻譜時多次校正根據(jù)所述音頻信號確定的容許誤差功率,各容許誤差功率對應(yīng)于各相應(yīng)頻譜的量化誤差;和量化單元,其用于對具有比由所述功率校正單元校正的容許誤差功率大的功率的每個頻譜進(jìn)行量化。
2、 一種編碼設(shè)備,其用于對音頻信號進(jìn)行編碼,該編碼設(shè)備包括 頻率轉(zhuǎn)換單元,其用于將所述音頻信號轉(zhuǎn)換為頻譜; 功率確定單元,其用于根據(jù)所述音頻信號確定多個容許誤差功率,各容許誤差功率表示對各相應(yīng)頻譜的量化;檢測單元,其用于根據(jù)由所述頻率轉(zhuǎn)換單元轉(zhuǎn)換的頻譜來檢測音調(diào)頻譜;功率校正單元,其用于利用所述檢測單元執(zhí)行的檢測的結(jié)果和所述功率確定單元確定的容許誤差功率來校正容許誤差功率;以及量化單元,其用于對具有比由所述功率校正單元校正的容許誤差功 率大的功率的每個頻譜進(jìn)行量化。
3、 根據(jù)權(quán)利要求2所述的編碼設(shè)備,其中,所述功率確定單元針對 通過按照預(yù)定寬度劃分所述音頻信號的頻譜而獲得的各個頻帶確定多個 容許誤差功率,所述檢測單元檢測所述音調(diào)頻譜,并且還檢測包含該音 調(diào)頻譜的頻帶,并且所述功率校正單元執(zhí)行校正,以使得所述功率確定 單元針對與所述檢測單元檢測到的頻帶相鄰的頻帶而確定的所述多個容 許誤差功率小于針對所述相鄰的頻帶的頻譜的功率。
4、 根據(jù)權(quán)利要求2所述的編碼設(shè)備,其中,所述量化單元將所述頻 譜的動態(tài)范圍減小為由縮放因子唯一指定的動態(tài)范圍,并且對減小后的 動態(tài)范圍中的每個頻譜進(jìn)行量化,其中,所述編碼設(shè)備還包括第一縮放因子確定單元,其用于針對各個頻帶確定這樣的縮放因子, 即,該縮放因子使得根據(jù)作為在對該頻帶中包含的頻譜進(jìn)行量化期間生 成的誤差的量化誤差而確定的量化誤差功率小于所述功率確定單元針對 該頻帶確定的容許誤差功率,和第二縮放因子確定單元,其用于針對與包含所述檢測單元檢測出的 音調(diào)頻譜的頻帶相鄰的頻帶確定以下針對該相鄰的頻帶的縮放因子,艮口, 該縮放因子使得根據(jù)作為在對該相鄰的頻帶中包含的頻譜進(jìn)行量化期間 生成的誤差的量化誤差而確定的量化誤差功率小于所述功率校正單元針對該相鄰的頻帶確定的容許誤差功率;并且其中,所述量化單元利用所述第二縮放因子確定單元確定的縮放因 子,對由所述第二縮放因子確定單元確定了其縮放因子的頻帶中包含的 每個頻譜進(jìn)行量化,而利用所述第一縮放因子確定單元確定的縮放因子, 對未由所述第二縮放因子確定單元確定其縮放因子的頻帶中包含的每個 頻譜進(jìn)行量化。
5、 根據(jù)權(quán)利要求2所述的編碼設(shè)備,其中,所述量化單元通過對頻 譜進(jìn)行量化而獲得值,設(shè)置能作為所述值而獲得的最大值;其中,所述編碼設(shè)備還包括第一縮放因子確定單元,其用于針對各個頻帶確定這樣的縮放因子, 即,該縮放因子使得根據(jù)作為在對該頻帶中包含的頻譜進(jìn)行量化期間生 成的誤差的量化誤差而確定的量化誤差功率小于所述功率確定單元針對 該頻帶確定的容許誤差功率,和第三縮放因子確定單元,其用于確定使得根據(jù)構(gòu)成包含所述檢測單 元檢測出的音調(diào)頻譜的頻帶的頻譜中最大的一個而獲得的值成為最大值 的縮放因子,作為針對該頻帶的縮放因子;并且其中,所述量化單元利用所述第三縮放因子確定單元確定的縮放因子, 對由所述第三縮放因子確定單元確定了其縮放因子的頻帶中包含的每個頻 譜進(jìn)行量化,而利用所述第一縮放因子確定單元確定的縮放因子,對未由 第三縮放因子確定單元確定其縮放因子的頻帶中包含的每個頻譜進(jìn)行量化。
6、 根據(jù)權(quán)利要求2所述的編碼設(shè)備,該編碼設(shè)備還包括第一縮放因子確定單元,其用于針對各個頻帶確定這樣的縮放因子, 即,該縮放因子使得根據(jù)作為在對該頻帶中包含的頻譜進(jìn)行量化期間生 成的誤差的量化誤差而確定的量化誤差功率小于所述功率確定單元針對該頻帶確定的容許誤差功率;和誤差確定單元,其用于利用所述第一縮放因子確定單元針對該頻帶 確定的縮放因子并且利用作為通過將所述第一縮放因子確定單元確定的 縮放因子改變了預(yù)定值而獲得的縮放因子的改變縮放因子,來確定在對該頻帶中包含的頻譜進(jìn)行量化期間生成的量化誤差功率;并且其中,所述量化單元利用所述縮放因子或者當(dāng)所述誤差確定單元確 定了量化誤差功率中的最小的一個時的改變縮放因子,來對該頻帶中包 含的每個頻譜進(jìn)行量化。
7、 根據(jù)權(quán)利要求5所述的編碼設(shè)備,其中,所述量化單元利用所述 第三縮放因子確定單元確定的縮放因子來對所有頻帶中包含的每個頻譜 進(jìn)行量化。
8、 根據(jù)權(quán)利要求2所述的編碼設(shè)備,該編碼設(shè)備還包括用于存儲預(yù) 定頻帶數(shù)的頻帶數(shù)存儲單元,其中,所述功率校正單元將位于所述頻帶數(shù)存儲單元所存儲的預(yù)定 頻帶數(shù)的范圍中且以包含所述檢測單元檢測出的音調(diào)頻譜的頻帶作為其 中心的頻帶視為相鄰頻帶,并且校正容許誤差功率。
9、 根據(jù)權(quán)利要求2所述的編碼設(shè)備,該編碼設(shè)備還包括用于存儲預(yù) 定功率寬度的功率寬度存儲單元,其中,所述功率校正單元將包括所述包含所述檢測單元檢測的音調(diào) 頻譜的頻帶,且具有大于或等于從所述檢測單元檢測出的頻帶的功率值 衰減了所述功率寬度存儲單元中存儲的預(yù)定功率寬度后的功率值的一個 或多個連續(xù)頻帶視為相鄰頻帶,并且校正容許誤差功率。
10、 一種編碼方法,其用于將音頻信號轉(zhuǎn)換為頻譜并且對所述頻譜 進(jìn)行編碼,該編碼方法包括以下步驟根據(jù)所述頻譜檢測音調(diào)頻譜,并且根據(jù)所述音頻信號校正容許誤差 功率;和利用經(jīng)校正的容許誤差功率來對所述頻譜進(jìn)行量化。
全文摘要
本發(fā)明公開了編碼設(shè)備、編碼方法和包括該方法的計算機(jī)程序產(chǎn)品。該編碼設(shè)備將音頻信號轉(zhuǎn)換為頻譜,確定針對按照預(yù)定寬度劃分音頻信號的頻譜而獲得的頻帶的容許誤差功率,從頻譜中檢測音調(diào)頻譜,并且檢測包含該音調(diào)頻譜的頻帶。使用該檢測結(jié)果和容許誤差功率,編碼設(shè)備執(zhí)行校正,使得功率確定單元針對與檢測單元檢測出的頻帶相鄰的頻帶而確定的容許誤差功率小于針對該相鄰的頻帶的頻譜的功率,并且對功率大于經(jīng)校正的容許誤差功率的每個頻譜進(jìn)行量化。
文檔編號G10L19/00GK101515458SQ20091000803
公開日2009年8月26日 申請日期2009年2月19日 優(yōu)先權(quán)日2008年2月19日
發(fā)明者土永義照, 白川美由紀(jì), 鈴木政直 申請人:富士通株式會社