專利名稱:Lpc系數(shù)量化方法和裝置及多編碼核音頻編碼方法和設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及數(shù)字音頻編碼技術(shù),更具體地說(shuō),涉及一種用于音頻信號(hào)編碼的LPC系數(shù)量化方法和裝置以及一種多編碼核音頻編碼方法和設(shè)備。
背景技術(shù):
在數(shù)字音頻編碼中,由于音頻信號(hào)非常復(fù)雜,一般包括音樂(lè)類信號(hào)、語(yǔ)音類信號(hào)和混合類信號(hào)等,一些音頻編碼算法如MPEG-1、MPEG-2、MPEG-4、Dolby AC-3和DTS等主要工作在高碼率高質(zhì)量,當(dāng)在低碼率下對(duì)于語(yǔ)音類信號(hào)的編碼效率較低;而另外一些ITU G系列標(biāo)準(zhǔn)編碼算法主要針對(duì)低碼率語(yǔ)音信號(hào),對(duì)于寬帶信號(hào)則編碼效率下降。為了對(duì)所有類型的音頻信號(hào)能一致獲得較高的編碼效率,一般需要采用具有多種編碼內(nèi)核的混合編碼結(jié)構(gòu),如3GPP的AMR-WB+ (參見(jiàn)3GPP TS26.290: "Audio codecprocessing functions;Extended AMR Wideband codec;Transcoding functions")以及 MPEG-D USAC (參見(jiàn) IS0/IEC DIS23003-3-1nformation technology—MPEG audiotechnologies—Part3:Unified speech and audio coding")等。在這些混合編碼算法中,對(duì)每個(gè)音頻信號(hào)類型都有不同的壓縮算法處理,期望綜合編碼性能得以改善。在AMR-WB+中,針對(duì)語(yǔ)音信號(hào)米用 ACELP (Algebraic Code Excited LinearPrediction,代數(shù)碼本激勵(lì)線性預(yù)測(cè))編碼核,針對(duì)混合類和音樂(lè)類信號(hào)一般采用TCX(Transform Coded Excitation,變化碼激勵(lì))編碼核,兩種編碼核都應(yīng)用LPC (LinearPredictive Coding,線性預(yù)測(cè)編碼))技術(shù)來(lái)描述語(yǔ)音的短時(shí)譜包絡(luò),因而對(duì)LPC系數(shù)的高效量化是語(yǔ)音編碼中的一個(gè)關(guān)鍵性問(wèn)題。由于LPC系數(shù)的動(dòng)態(tài)范圍比較大,出于合成濾波器穩(wěn)定性和量化效率的考慮,LPC系數(shù)通常被轉(zhuǎn)換為在數(shù)學(xué)上完全等價(jià)的其它形式的參數(shù)后再量化,通常的表示形式為ISF (Immittance Spectral Frequency,導(dǎo)抗譜頻率系數(shù))或LSFCLine Spectral Frequency,線譜頻率參數(shù))。LSF作為L(zhǎng)PC系數(shù)的一種頻域參數(shù),由于其具有更好的量化和插值特性,語(yǔ)音編碼端常將LPC系數(shù)轉(zhuǎn)換為L(zhǎng)SF參數(shù),然后再將LSF參數(shù)進(jìn)行量化(一般采用矢量量化技術(shù)),語(yǔ)音解碼端進(jìn)行逆量化得到量化后的LSF參數(shù),并將LSF參數(shù)再轉(zhuǎn)換為L(zhǎng)PC系數(shù),因此LSF在基于LPC語(yǔ)音編碼中得到了廣泛的應(yīng)用。在MPEG-D USAC(Unified Speech and Audio Coding,統(tǒng)一的語(yǔ)音 / 音頻編碼)編碼中,對(duì)于音樂(lè)類信號(hào),采用高效的AAC(AdvancedAudio coding,高級(jí)音頻編碼)編碼;對(duì)于語(yǔ)音信號(hào),一般采用ACELP類編碼核;對(duì)于混合類信號(hào),一般采用TCX類編碼核。像AMR-WB+一樣,在MPEG-D USAC混合編碼結(jié)構(gòu)中,ACELP和TCX編碼核會(huì)共用LPC編碼技術(shù)。AMR-WB+和MPEG-D USAC等多編碼核音頻編碼算法盡管開(kāi)始有對(duì)輸入音頻信號(hào)的類型進(jìn)行分析,針對(duì)不同類型,采用不同的編碼核,來(lái)獲取綜合最佳編碼效率。AMR-WB+中,語(yǔ)音信號(hào)類采用ACELP編碼核,音樂(lè)類及混合類信號(hào)采用TCX編碼核;在MPEG-D USAC中,語(yǔ)音類信號(hào)采用ACELP編碼核,混合類采用TCX編碼核,音樂(lè)類采用AAC編碼核。AMR-WB+和MPEG-D USAC這兩種多編碼核音頻編碼算法中都采用了 ACELP和TCX,而這兩個(gè)編碼核會(huì)共用一個(gè)線性預(yù)測(cè)LPC技術(shù),并且一般都是對(duì)LPC系數(shù)轉(zhuǎn)換為L(zhǎng)SF譜參數(shù)后,再進(jìn)行矢量量化編碼,且可采用的矢量量化方法有很多種,例如,申請(qǐng)日為2012年7月17日,申請(qǐng)?zhí)枮?01210246780.9,名稱為“用于對(duì)語(yǔ)音信號(hào)LPC系數(shù)進(jìn)行多級(jí)矢量量化的方法和系統(tǒng)”的中國(guó)專利申請(qǐng)便公開(kāi)了一種多級(jí)矢量量化方法,但是這些矢量量化方法所生成的碼書(shū)不依賴于輸入的數(shù)字音頻信號(hào)的類型,即對(duì)所有音頻信號(hào),都只生成一套矢量量化碼書(shū),因而LPC系數(shù)的量化精度仍不是很理想,從而影響整體數(shù)字音頻編碼算法的編碼效率以及編碼器的主觀聲音質(zhì)量。
發(fā)明內(nèi)容
本發(fā)明要解決的第一個(gè)技術(shù)問(wèn)題在于,針對(duì)現(xiàn)有技術(shù)的上述缺陷,提供一種能夠進(jìn)一步改進(jìn)量化精度的用于音頻信號(hào)編碼的LPC系數(shù)量化方法和裝置。本發(fā)明要解決的第二個(gè)技術(shù)問(wèn)題在于,針對(duì)現(xiàn)有技術(shù)的上述缺陷,提供一種能夠提高內(nèi)部預(yù)測(cè)參數(shù)的量化精度進(jìn)而改進(jìn)整體數(shù)字音頻編碼算法的效率以及主觀聲音質(zhì)量的多編碼核音頻編碼方法和編碼設(shè)備。本發(fā)明解決其第一個(gè)技術(shù)問(wèn)題所采用的技術(shù)方案是:提出一種用于音頻信號(hào)編碼的LPC系數(shù)量化方法,包括如下步驟:S1、基于預(yù)定的規(guī)則確定輸入音頻信號(hào)的類型;S2、對(duì)輸入音頻信號(hào)執(zhí)行線性預(yù)測(cè)處理,計(jì)算LPC系數(shù);S3、針對(duì)不同的音頻信號(hào)類型,應(yīng)用與該音頻信號(hào)類型相匹配的矢量量化碼書(shū)對(duì)所述LPC系數(shù)進(jìn)行矢量量化。本發(fā)明上述用于音頻信號(hào)編碼的LPC系數(shù)量化方法中,所述步驟S2進(jìn)一步包括:將所述LPC系數(shù)轉(zhuǎn)換為等效的LSF參數(shù);所述步驟S3進(jìn)一步包括:針對(duì)不同的音頻信號(hào)類型,應(yīng)用與該音頻信號(hào)類型相匹配的矢量量化碼書(shū)對(duì)所述LSF參數(shù)進(jìn)行矢量量化。本發(fā)明上述用于音頻信號(hào)編碼的LPC系數(shù)量化方法中,所述步驟S3中矢量量化采用多級(jí)矢量量化方法。本發(fā)明上述用于音頻信號(hào)編碼的LPC系數(shù)量化方法中,所述方法在步驟SI之前還包括:將針對(duì)不同音頻信號(hào)類型的信號(hào)模型構(gòu)建的編碼所需的矢量量化碼書(shū)存儲(chǔ)于本地。本發(fā)明上述用于音頻信號(hào)編碼的LPC系數(shù)量化方法進(jìn)一步包括:S4、將矢量量化的編碼參數(shù)傳送給復(fù)用器復(fù)用到總的音頻編碼幀中。本發(fā)明為解決其第一個(gè)技術(shù)問(wèn)題還提出一種用于音頻信號(hào)編碼的LPC系數(shù)量化裝置,包括:音頻類型確定模塊,用于基于預(yù)定的規(guī)則確定輸入音頻信號(hào)的類型;線性預(yù)測(cè)處理模塊,用于對(duì)輸入音頻信號(hào)執(zhí)行線性預(yù)測(cè)處理,計(jì)算LPC系數(shù);譜參數(shù)量化模塊,用于針對(duì)不同的音頻信號(hào)類型,應(yīng)用與該音頻信號(hào)類型相匹配的矢量量化碼書(shū)對(duì)所述LPC系數(shù)進(jìn)行矢量量化。
本發(fā)明上述用于音頻信號(hào)編碼的LPC系數(shù)量化裝置中,所述線性預(yù)測(cè)處理模塊進(jìn)一步包括:LPC系數(shù)計(jì)算模塊,用于輸入音頻信號(hào)執(zhí)行線性預(yù)測(cè)處理,計(jì)算出LPC系數(shù);等效轉(zhuǎn)換模塊,用于將所述LPC系數(shù)轉(zhuǎn)換為等效的LSF參數(shù)。本發(fā)明上述用于音頻信號(hào)編碼的LPC系數(shù)量化裝置中,所述譜參數(shù)量化模塊進(jìn)一步用于針對(duì)不同的音頻信號(hào)類型,應(yīng)用與該音頻信號(hào)類型相匹配的矢量量化碼書(shū)對(duì)所述LSF參數(shù)進(jìn)行矢量量化。本發(fā)明上述用于音頻信號(hào)編碼的LPC系數(shù)量化裝置還包括:存儲(chǔ)模塊,用于存儲(chǔ)針對(duì)不同音頻信號(hào)類型的信號(hào)模型構(gòu)建的編碼所需的矢量量化碼書(shū)。本發(fā)明上述用于音頻信號(hào)編碼的LPC系數(shù)量化裝置還將矢量量化的編碼參數(shù)傳送給復(fù)用器復(fù)用到總的音頻編碼幀中。本發(fā)明解決其第二個(gè)技術(shù)問(wèn)題所采用的技術(shù)方案是:提出一種多編碼核音頻編碼方法,包括如下步驟:a、對(duì)輸入音頻信號(hào)的類型進(jìn)行分析;b、針對(duì)多個(gè)音頻信號(hào)類型,采用相應(yīng)的多個(gè)編碼核進(jìn)行編碼,其中,至少一個(gè)編碼核對(duì)至少兩個(gè)音頻信號(hào)類型的音頻信號(hào)執(zhí)行線性預(yù)測(cè)編碼;其中,所述線性預(yù)測(cè)編碼通過(guò)上述的用于音頻信號(hào)編碼的LPC系數(shù)量化方法來(lái)對(duì)LPC系數(shù)進(jìn)行量化。本發(fā)明為解決其第二個(gè)技術(shù)問(wèn)題還提出一種多編碼核音頻編碼設(shè)備,包括:音頻信號(hào)分類處理模塊,用于對(duì)輸入音頻信號(hào)的類型進(jìn)行分析;多個(gè)編碼核,用于基于音頻信號(hào)類型對(duì)相應(yīng)的音頻信號(hào)進(jìn)行編碼,其中,至少一個(gè)編碼核對(duì)至少兩個(gè)音頻信號(hào)類型的音頻信號(hào)進(jìn)行線性預(yù)測(cè)編碼;其中,所述線性預(yù)測(cè)編碼通過(guò)上述的用于音頻信號(hào)編碼的LPC系數(shù)量化裝置來(lái)對(duì)LPC系數(shù)進(jìn)行量化。通過(guò)本發(fā)明用于音頻信號(hào)編碼的LPC系數(shù)量化方法和裝置,在編碼算法中的LPC參數(shù)量化編碼時(shí),為不同音頻信號(hào)類型分別提供各自最匹配的矢量量化碼書(shū),在不需要額外音頻信號(hào)類型指示比特開(kāi)銷(xiāo)的情況下,可進(jìn)一步對(duì)LPC譜參數(shù)改進(jìn)量化精度。進(jìn)而,本發(fā)明的采用該LPC系數(shù)量化方法和裝置的多編碼核音頻編碼方法和設(shè)備能夠提高整體編碼算法的編碼效率,或者同樣質(zhì)量下減少編碼比特率,改進(jìn)編碼器的主觀聲音質(zhì)量。
下面將結(jié)合附圖及實(shí)施例對(duì)本發(fā)明作進(jìn)一步說(shuō)明,附圖中:圖1是MPEG-D USAC編碼算法的編碼過(guò)程不意框圖;圖2是本發(fā)明一個(gè)實(shí)施例的用于音頻信號(hào)編碼的LPC系數(shù)量化方法的流程圖;圖3是本發(fā)明另一實(shí)施例的用于音頻信號(hào)編碼的LPC系數(shù)量化方法的流程圖;圖4是本發(fā)明一個(gè)實(shí)施例的用于音頻信號(hào)編碼的LPC系數(shù)量化裝置的邏輯框圖。
具體實(shí)施方式
為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖及實(shí)施例,對(duì)本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說(shuō)明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。音頻信號(hào)的信號(hào)類型可以分為2類、3類或者更多類型。當(dāng)分成2類時(shí)可以是語(yǔ)音信號(hào)、非語(yǔ)音信號(hào);分為3類時(shí)可以是語(yǔ)音信號(hào)、音樂(lè)信號(hào)、語(yǔ)音與音樂(lè)混合類信號(hào)。本發(fā)明的用于音頻信號(hào)編碼的LPC系數(shù)量化方法和裝置便基于音頻信號(hào)分類分別采用不同的匹配矢量量化碼書(shū)來(lái)對(duì)LPC頻譜系數(shù)進(jìn)行矢量量化,從而能夠進(jìn)一步改進(jìn)譜參數(shù)的量化精度,或者說(shuō)同等精度下能夠減少譜參數(shù)編碼所需要的比特?cái)?shù)。例如,AMR-WB+多編碼核混合編碼算法將音頻信號(hào)分類成語(yǔ)音類信號(hào)、音樂(lè)類信號(hào)和語(yǔ)音音樂(lè)混合類信號(hào)。本發(fā)明應(yīng)用于AMR-WB+時(shí),對(duì)于語(yǔ)音類信號(hào),使用與該信號(hào)模型相關(guān)的一組矢量量化碼書(shū)進(jìn)行矢量量化,然后再進(jìn)行ACELP編碼;而對(duì)于音樂(lè)類和語(yǔ)音音樂(lè)混合類信號(hào),分別各自使用不同的兩組矢量量化碼書(shū)來(lái)進(jìn)行量化,然后完成TCX處理。又例如,MPEG-D USAC多編碼核混合編碼算法也將音頻信號(hào)分類成語(yǔ)音類信號(hào)、音樂(lè)類信號(hào)和語(yǔ)音音樂(lè)混合類信號(hào)。本發(fā)明應(yīng)用于MPEG-D USAC時(shí),由于僅僅語(yǔ)音類和音樂(lè)語(yǔ)音混合類兩種類型的信號(hào)需要LPC處理,因此針對(duì)這兩類信號(hào)分別提供匹配的矢量量化碼書(shū)進(jìn)行量化,然后再對(duì)應(yīng)進(jìn)行ACELP編碼或者TCX編碼。以下將以MPEG-D USAC編碼算法為例來(lái)詳細(xì)介紹本發(fā)明。圖1示出了 MPEG-D USAC編碼算法的編碼過(guò)程。如圖1所示,MPEG-DUSAC編碼算法主要包括三個(gè)階段。預(yù)處理階段:在步驟110中對(duì)輸入PCM(Pulse Code Modulation,脈沖編碼調(diào)制)音頻信號(hào)進(jìn)行重采樣,其目的是在輸入采樣率和編碼采樣率不同時(shí),調(diào)整輸入采樣率到適合編碼處理的最佳采樣率;在步驟130中對(duì)輸入PCM音頻信號(hào)進(jìn)行信號(hào)類型分析,以便針對(duì)不同類型信號(hào)進(jìn)行不同編碼處理;在步驟120中對(duì)經(jīng)過(guò)重采樣的音頻信號(hào)進(jìn)行環(huán)繞 MPEG 編碼(MPEG Surround)和增強(qiáng)的 SBR(Spectral band replication,頻段復(fù)制)處理?;谝纛l信號(hào)的不同類型,經(jīng)過(guò)預(yù)處理的音頻信號(hào)被送入兩個(gè)編碼核,即第一編碼分支(頻域編碼核)140和第二編碼分支(時(shí)域編碼核)150。如前所介紹,在MPEG-D USAC中,語(yǔ)音類信號(hào)采用ACELP編碼核,混合類信號(hào)采用TCX編碼核,音樂(lè)類信號(hào)采用AAC編碼核。也即,經(jīng)過(guò)預(yù)處理的音樂(lè)類信號(hào)進(jìn)入第一編碼分支140,經(jīng)過(guò)音調(diào)估計(jì)、塊切換控制、心理聲學(xué)模型控制、濾波、TNS (Temporal Noise Shaping,時(shí)域噪音整形)、M/S編碼等處理;經(jīng)過(guò)預(yù)處理的語(yǔ)音類信號(hào)進(jìn)入第二編碼分支150,進(jìn)行LPC譜參數(shù)量化處理151后再進(jìn)行ACELP編碼;經(jīng)過(guò)預(yù)處理的混合類信號(hào)進(jìn)入第二編碼分支150,進(jìn)行LPC譜參數(shù)量化處理151后再進(jìn)行TCX編碼。兩個(gè)分支出來(lái)的信號(hào)經(jīng)過(guò)后處理160后,經(jīng)過(guò)復(fù)用器將所有編碼參數(shù)復(fù)用170,輸出總的音頻編碼幀。本發(fā)明的技術(shù)方案主要體現(xiàn)在對(duì)LPC譜參數(shù)量化處理151的改進(jìn),提出一種基于音頻信號(hào)分類的LPC系數(shù)量化方法和裝置,以下將詳細(xì)給出說(shuō)明。有關(guān)圖1所示的MPEG-DUSAC編碼算法的其它功能模塊和步驟,為本領(lǐng)域技術(shù)人員所熟知的現(xiàn)有技術(shù),故在此不再贅述。圖2是根據(jù)本發(fā)明一個(gè)實(shí)施例的用于音頻信號(hào)編碼的LPC系數(shù)量化方法200的流程圖。如圖2所示,該方法200包括如下步驟:步驟210中,基于預(yù)定的規(guī)則確定輸入音頻信號(hào)的類型。如前所述,MPEG-D USAC等多編碼核音頻編碼算法會(huì)基于不同的信號(hào)類型采用不同的編碼核,必然會(huì)首先對(duì)輸入的PCM音頻信號(hào)進(jìn)行信號(hào)類型分析,并將分類類型參數(shù)編碼到壓縮碼流中(參見(jiàn)圖1中標(biāo)號(hào)130所不)。例如,在MPEG-USAC中,分為語(yǔ)音類信號(hào)、音樂(lè)類信號(hào)、音樂(lè)語(yǔ)音混合類信號(hào)三種類型。因而,本發(fā)明的LPC系數(shù)量化方法不需要再額外增加信號(hào)類型處理模塊和信號(hào)類型指示信息,可基于預(yù)定的規(guī)則從壓縮碼流中解析出輸入音頻信號(hào)的類型。因此,本發(fā)明的LPC系數(shù)量化方法應(yīng)用于多編碼核音頻編碼算法時(shí),不需要在編碼幀中增加任何額外開(kāi)銷(xiāo)。隨后步驟220中,對(duì)輸入音頻信號(hào)執(zhí)行線性預(yù)測(cè)處理(LPC),計(jì)算LPC系數(shù)。對(duì)輸入PCM信號(hào),本發(fā)明通過(guò)合理分段(如ACELP編碼一般256樣點(diǎn)計(jì)算一次,而TCX編碼可能256,512或1024樣點(diǎn)計(jì)算一次)計(jì)算出LPC系數(shù)。隨后步驟230中,針對(duì)不同的音頻信號(hào)類型,應(yīng)用與該音頻信號(hào)類型相匹配的矢量量化碼書(shū)對(duì)LPC系數(shù)進(jìn)行矢量量化。本發(fā)明可預(yù)先針對(duì)不同音頻信號(hào)類型的信號(hào)模型分別進(jìn)行編碼所需的矢量量化碼書(shū)的設(shè)計(jì),構(gòu)建出與各音頻信號(hào)類型最匹配的一個(gè)矢量量化碼書(shū),并存儲(chǔ)于本地。由于不同音頻信號(hào)類型對(duì)應(yīng)一個(gè)匹配的矢量量化碼書(shū),因此應(yīng)用本發(fā)明進(jìn)行音頻信號(hào)編碼需要在編碼端和解碼端都有存儲(chǔ)這些矢量量化碼書(shū),會(huì)增加一定的存儲(chǔ)空間需求。步驟230中對(duì)LPC系數(shù)進(jìn)行矢量量化,可采用本領(lǐng)域已知和可行的各種矢量量化方法,例如,申請(qǐng)日為2012年7月17日,申請(qǐng)?zhí)枮?01210246780.9,名稱為“用于對(duì)語(yǔ)音信號(hào)LPC系數(shù)進(jìn)行多級(jí)矢量量化的方法和系統(tǒng)”的中國(guó)專利申請(qǐng)公開(kāi)的多級(jí)矢量量化方法。圖3是根據(jù)本發(fā)明另一具體實(shí)施例的用于音頻信號(hào)編碼的LPC系數(shù)量化方法300的流程圖。如圖3所示,該方法300包括如下步驟:步驟310中,基于預(yù)定的規(guī)則確定輸入音頻信號(hào)的類型。隨后步驟320中,對(duì)輸入音頻信號(hào)執(zhí)行線性預(yù)測(cè)處理,計(jì)算LPC系數(shù)。隨后步驟330中,將LPC系數(shù)轉(zhuǎn)換為等效的LSF參數(shù)。隨后步驟340中,針對(duì)不同的音頻信號(hào)類型,應(yīng)用本地存儲(chǔ)的與該音頻信號(hào)類型相匹配的矢量量化碼書(shū)對(duì)LSF參數(shù)進(jìn)行矢量量化。如前所述,本發(fā)明可預(yù)先針對(duì)不同音頻信號(hào)類型的LSF參數(shù)分別進(jìn)行矢量量化碼書(shū)的設(shè)計(jì),構(gòu)建出編碼需要的最匹配的矢量量化碼書(shū)并存儲(chǔ)于本地。隨后步驟350中,將矢量量化的編碼參數(shù)傳送給復(fù)用器復(fù)用到總的音頻編碼幀中,以便傳送給接收端(解碼器)。通過(guò)本發(fā)明用于音頻信號(hào)編碼的LPC系數(shù)量化方法,在編碼算法中的LPC參數(shù)量化編碼時(shí),為不同音頻信號(hào)類型分別提供各自最匹配的矢量量化碼書(shū),在不需要額外音頻信號(hào)類型指示比特開(kāi)銷(xiāo)的情況下,可進(jìn)一步對(duì)LPC譜參數(shù)改進(jìn)量化精度,從而提高整體編碼算法的編碼效率,或者同樣質(zhì)量下減少編碼比特率。圖4是根據(jù)本發(fā)明一個(gè)實(shí)施例的用于音頻信號(hào)編碼的LPC系數(shù)量化裝置400的邏輯框圖。用于音頻信號(hào)編碼的LPC系數(shù)量化裝置400包括音頻類型確定模塊410、線性預(yù)測(cè)處理模塊420、譜參數(shù)量化模塊430和存儲(chǔ)模塊440。其中,音頻類型確定模塊410用于基于預(yù)定的規(guī)則確定輸入音頻信號(hào)的類型。如前所述,MPEG-D USAC等多編碼核音頻編碼算法會(huì)基于不同的信號(hào)類型采用不同的編碼核,必然設(shè)有音頻信號(hào)分類處理模塊首先對(duì)輸入的PCM音頻信號(hào)進(jìn)行信號(hào)類型分析,并將分類類型參數(shù)編碼到壓縮碼流中(參見(jiàn)圖1中標(biāo)號(hào)130所示)。因而,音頻類型確定模塊410可基于預(yù)定的規(guī)則從壓縮碼流中解析出輸入音頻信號(hào)的類型,不需要額外增加音頻信號(hào)類型分析處理和指示信息,因此不需要在編碼幀中增加任何額外開(kāi)銷(xiāo)。線性預(yù)測(cè)處理模塊420用于對(duì)輸入音頻信號(hào)執(zhí)行線性預(yù)測(cè)處理,計(jì)算LPC系數(shù)。存儲(chǔ)模塊440用于在本地存儲(chǔ)針對(duì)不同音頻信號(hào)類型的信號(hào)模型所構(gòu)建的編碼所需的矢量量化碼書(shū)。譜參數(shù)量化模塊430用于針對(duì)不同的音頻信號(hào)類型,應(yīng)用本地存儲(chǔ)的與該音頻信號(hào)類型相匹配的矢量量化碼書(shū)對(duì)線性預(yù)測(cè)處理模塊420計(jì)算出的LPC系數(shù)進(jìn)行矢量量化。具體實(shí)施例中,如圖4所示,線性預(yù)測(cè)處理模塊420進(jìn)一步包括LPC系數(shù)計(jì)算模塊421和等效轉(zhuǎn)換模塊422。LCP系數(shù)計(jì)算模塊421對(duì)輸入音頻信號(hào)通過(guò)合理分段計(jì)算出LPC系數(shù)。等效轉(zhuǎn)換模塊422將LCP系數(shù)轉(zhuǎn)換成等效的LSF參數(shù)。進(jìn)一步,普參數(shù)量化模塊430針對(duì)不同的音頻信號(hào)類型,應(yīng)用本地存儲(chǔ)的與該音頻信號(hào)類型相匹配的矢量量化碼書(shū)對(duì)LSF參數(shù)進(jìn)行矢量量化。最后,矢量量化的編碼參數(shù)被傳送給復(fù)用器復(fù)用到總的音頻編碼幀中。本發(fā)明基于音頻信號(hào)分類的LPC系數(shù)量化方法和裝置,應(yīng)用于有至少一個(gè)編碼核使用線性預(yù)測(cè)LPC對(duì)至少兩個(gè)類型的音頻信號(hào)進(jìn)行編碼處理的多編碼核編碼算法,可進(jìn)一步提高內(nèi)部線性預(yù)測(cè)編碼模塊的預(yù)測(cè)參數(shù)的量化精度,從而改進(jìn)整體數(shù)字音頻編碼算法的效率以及編碼器的主觀聲音質(zhì)量。以AMR-WB+多核編碼算法為例,應(yīng)用本發(fā)明的基于音頻分類的多矢量量化碼書(shū),對(duì)其中LPC系數(shù)(或者轉(zhuǎn)換的LSF參數(shù))進(jìn)行矢量量化,其中`具體的矢量量化方案采用申請(qǐng)日為2012年7月17日,申請(qǐng)?zhí)枮?01210246780.9,名稱為“用于對(duì)語(yǔ)音信號(hào)LPC系數(shù)進(jìn)行多級(jí)矢量量化的方法和系統(tǒng)”的中國(guó)專利申請(qǐng)公開(kāi)的多級(jí)矢量量化方法。下面比較分類和非分類情況的特性:(a)復(fù)雜度由于在AMR-WB+中已經(jīng)存在對(duì)音頻信號(hào)分類的處理,分別進(jìn)行ACELP (語(yǔ)音類信號(hào))和TCX (混合類信號(hào))編碼,因此本發(fā)明主要會(huì)增加I倍的存儲(chǔ)空間(大約98k字節(jié)),其他復(fù)雜度相當(dāng)。(b)性能采用201210246780.9 “用于對(duì)語(yǔ)音信號(hào)LPC系數(shù)進(jìn)行多級(jí)矢量量化的方法和系統(tǒng)”中的多級(jí)矢量量化方法,比較分類情況的多個(gè)矢量量化碼書(shū)和非分類情況的單一矢量量化碼書(shū),分別對(duì)12個(gè)MPEG典型測(cè)試序列進(jìn)行LPC參數(shù)矢量量化后的精度比較結(jié)果,如表I到表12所示。從12個(gè)表中,觀察代表LPC參數(shù)量化精度的平均譜失真,可以認(rèn)為:分類算法一致好于非分類算法,這也標(biāo)志著基于音頻分類的多矢量量化碼書(shū)算法能夠進(jìn)一步提高編碼效率。表I算法性能(測(cè)試序列:es01)
I平均譜失真(dB) |2 4dB比例(%) |> 4dB比例(%)
不分類算法0.6976000.0000000.000000
權(quán)利要求
1.一種用于音頻信號(hào)編碼的LPC系數(shù)量化方法,其特征在于,包括如下步驟: 51、基于預(yù)定的規(guī)則確定輸入音頻信號(hào)的類型; 52、對(duì)輸入音頻信號(hào)執(zhí)行線性預(yù)測(cè)處理,計(jì)算LPC系數(shù); 53、針對(duì)不同的音頻信號(hào)類型,應(yīng)用與該音頻信號(hào)類型相匹配的矢量量化碼書(shū)對(duì)所述LPC系數(shù)進(jìn)行矢量量化。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于, 所述步驟S2進(jìn)一步包括: 將所述LPC系數(shù)轉(zhuǎn)換為等效的LSF參數(shù); 所述步驟S3進(jìn)一步包括: 針對(duì)不同的音頻信號(hào)類型,應(yīng)用與該音頻信號(hào)類型相匹配的矢量量化碼書(shū)對(duì)所述LSF參數(shù)進(jìn)行矢量量化。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述步驟S3中矢量量化采用多級(jí)矢量量化方法。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法在步驟SI之前還包括: 將針對(duì)不同音頻信號(hào)類型的信號(hào)模型構(gòu)建的編碼所需的矢量量化碼書(shū)存儲(chǔ)于本地。
5.根 據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法進(jìn)一步包括: 54、將矢量量化的編碼參數(shù)傳送給復(fù)用器復(fù)用到總的音頻編碼幀中。
6.一種用于音頻信號(hào)編碼的LPC系數(shù)量化裝置,其特征在于,包括: 音頻類型確定模塊,用于基于預(yù)定的規(guī)則確定輸入音頻信號(hào)的類型; 線性預(yù)測(cè)處理模塊,用于對(duì)輸入音頻信號(hào)執(zhí)行線性預(yù)測(cè)處理,計(jì)算LPC系數(shù); 譜參數(shù)量化模塊,用于針對(duì)不同的音頻信號(hào)類型,應(yīng)用與該音頻信號(hào)類型相匹配的矢量量化碼書(shū)對(duì)所述LPC系數(shù)進(jìn)行矢量量化。
7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述線性預(yù)測(cè)處理模塊進(jìn)一步包括: LPC系數(shù)計(jì)算模塊,用于輸入音頻信號(hào)執(zhí)行線性預(yù)測(cè)處理,計(jì)算出LPC系數(shù); 等效轉(zhuǎn)換模塊,用于將所述LPC系數(shù)轉(zhuǎn)換為等效的LSF參數(shù)。
8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述譜參數(shù)量化模塊進(jìn)一步用于針對(duì)不同的音頻信號(hào)類型,應(yīng)用與該音頻信號(hào)類型相匹配的矢量量化碼書(shū)對(duì)所述LSF參數(shù)進(jìn)行矢量量化。
9.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述裝置還包括: 存儲(chǔ)模塊,用于存儲(chǔ)針對(duì)不同音頻信號(hào)類型的信號(hào)模型構(gòu)建的編碼所需的矢量量化碼書(shū)。
10.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述裝置將矢量量化的編碼參數(shù)傳送給復(fù)用器復(fù)用到總的音頻編碼幀中。
11.一種多編碼核音頻編碼方法,其特征在于,包括如下步驟: a、對(duì)輸入音頻信號(hào)的類型進(jìn)行分析; b、針對(duì)多個(gè)音頻信號(hào)類型,采用相應(yīng)的多個(gè)編碼核進(jìn)行編碼,其中,至少一個(gè)編碼核對(duì)至少兩個(gè)音頻信號(hào)類型的音頻信號(hào)執(zhí)行線性預(yù)測(cè)編碼; 其特征在于, 所述線性預(yù)測(cè)編碼通過(guò)根據(jù)權(quán)利要求1-5中任一項(xiàng)所述的方法來(lái)對(duì)LPC系數(shù)進(jìn)行量化。
12.—種多編碼核音頻編碼設(shè)備,其特征在于,包括: 音頻信號(hào)分類處理模塊,用于對(duì)輸入音頻信號(hào)的類型進(jìn)行分析; 多個(gè)編碼核,用于基于音頻信號(hào)類型對(duì)相應(yīng)的音頻信號(hào)進(jìn)行編碼,其中,至少一個(gè)編碼核對(duì)至少兩個(gè)音頻信號(hào)類型的音頻信號(hào)進(jìn)行線性預(yù)測(cè)編碼; 其特征在于, 所述線性預(yù)測(cè)編碼通過(guò)根據(jù)權(quán)利要求6-10中任一項(xiàng)所述的裝置來(lái)對(duì)LPC系數(shù)進(jìn)行量化。
全文摘要
本發(fā)明涉及一種用于音頻信號(hào)編碼的LPC系數(shù)量化方法和裝置。所述方法包括如下步驟S1、基于預(yù)定的規(guī)則確定輸入音頻信號(hào)的類型;S2、對(duì)輸入音頻信號(hào)執(zhí)行線性預(yù)測(cè)處理,計(jì)算LPC系數(shù);S3、針對(duì)不同的音頻信號(hào)類型,應(yīng)用與該音頻信號(hào)類型相匹配的矢量量化碼書(shū)對(duì)所述LPC系數(shù)進(jìn)行矢量量化。本發(fā)明還涉及采用該LPC系數(shù)量化方法和裝置的多編碼核音頻編碼方法和設(shè)備。本發(fā)明基于音頻信號(hào)分類對(duì)LPC系數(shù)進(jìn)行量化,應(yīng)用于有至少一個(gè)編碼核使用線性預(yù)測(cè)LPC對(duì)至少兩個(gè)類型的音信信號(hào)進(jìn)行編碼處理的多編碼核編碼算法,可進(jìn)一步提高內(nèi)部線性預(yù)測(cè)編碼模塊的預(yù)測(cè)參數(shù)的量化精度,從而改進(jìn)整體數(shù)字音頻編碼算法的效率以及編碼器的主觀聲音質(zhì)量。
文檔編號(hào)G10L19/135GK103137135SQ20131002723
公開(kāi)日2013年6月5日 申請(qǐng)日期2013年1月22日 優(yōu)先權(quán)日2013年1月22日
發(fā)明者閆建新, 張勇 申請(qǐng)人:深圳廣晟信源技術(shù)有限公司