專利名稱:語音編碼/解碼方法及裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及語音編碼和解碼,尤其涉及語音編碼/解碼方法及其裝置,利用其可以將語音編碼/解碼應(yīng)用于便攜式終端以及各種語音存儲(chǔ)/轉(zhuǎn)換裝置。
背景技術(shù):
語音編碼技術(shù)可主要?dú)w類于聲音編碼(vocoding)和波形編碼。而語音編碼技術(shù)進(jìn)一步還可分為轉(zhuǎn)換編碼,和對(duì)脈沖編碼調(diào)制(此后縮寫為PCM)應(yīng)用壓縮的編碼。
聲音編碼利用了聲音通過離散時(shí)間模型的特性。已有相應(yīng)于聲音合成的技術(shù),例如RELP(隨機(jī)激勵(lì)線性預(yù)測(cè))編碼、CELP(碼激勵(lì)線性預(yù)測(cè))編碼、MELP(混合激勵(lì)線性預(yù)測(cè))編碼、LPC(線性預(yù)測(cè)編碼)、VSELP(矢量和激勵(lì)線性預(yù)測(cè))編碼、共振峰聲碼器、以及對(duì)數(shù)倒頻譜聲碼器(Cepstral Vocoder)。
其間,波形編碼的主要用途是減小無損耗編碼或SNR(信噪比)。而波形編碼的目的是維持波形的相似性。
已有相應(yīng)于波形編碼的技術(shù),例如PCM(脈沖編碼調(diào)制)、DCM(數(shù)據(jù)脈沖編碼調(diào)制)、DM(數(shù)據(jù)調(diào)制)、ADM(自適應(yīng)增量調(diào)制)、APC(自適應(yīng)預(yù)測(cè)編碼)、ADPCM(自適應(yīng)增量式預(yù)測(cè)編碼調(diào)制)、以及波形內(nèi)插法編碼。
以這樣一種方式執(zhí)行向PCM應(yīng)用壓縮的編碼技術(shù),該方式為完成PCM后進(jìn)行壓縮。并且,已有將壓縮施加給PCM的編碼技術(shù),例如Huffman編碼以及采用LZW(Lempel-Ziv-Welch)算法的編碼。
CELP編碼作為一項(xiàng)聲音編碼技術(shù)是有代表性的AbS(綜合分析)方法。
在AbS的CELP編碼中,通過長(zhǎng)期預(yù)測(cè)和短期預(yù)測(cè)合成包含在碼本中的數(shù)據(jù)(碼字),從而將相應(yīng)于合成結(jié)果、即合成聲音和原始聲音之間的差值(誤差)減為最小。
根據(jù)相關(guān)技術(shù)采用CELP編碼的發(fā)射機(jī)將參數(shù)傳輸至計(jì)數(shù)器一側(cè),而不是傳輸原始語音,該參數(shù)是當(dāng)相應(yīng)的合成結(jié)果(合成聲音)與原始聲音之間的差值(誤差)變?yōu)樽钚≈禃r(shí)計(jì)算出來的。即,在聲道建模過程中計(jì)算出的參數(shù),例如碼本索引、碼本增益、音調(diào)周期、反饋增益、線性預(yù)測(cè)(此后縮寫為L(zhǎng)P)系數(shù)等被傳輸至接收側(cè)。
采用CELP編碼的發(fā)射機(jī)對(duì)各個(gè)參數(shù)進(jìn)行量化和/或采樣,以傳輸相應(yīng)的預(yù)定比特的比特流。
然而,盡管有更多的空間用于壓縮在CELP編碼中計(jì)算出的各個(gè)參數(shù),相關(guān)技術(shù)仍然對(duì)該參數(shù)進(jìn)行量化和/或采樣,從而以預(yù)定比特率傳輸。
發(fā)明概述因此,本發(fā)明涉及一種語音編碼/解碼方法及其裝置,其基本上消除了由于相關(guān)技術(shù)的限制及缺陷帶來的一個(gè)或多個(gè)問題。
本發(fā)明提供一種語音編碼/解碼方法及其裝置,利用其在語音編碼中計(jì)算出的各種參數(shù)可適當(dāng)?shù)倪M(jìn)行壓縮以用于傳輸。
本發(fā)明的另一目的是提供一種語音編碼/解碼方法及其裝置,利用其能進(jìn)行高壓縮性的CELP編碼以及相應(yīng)于CELP編碼的解碼,而不降低語音品質(zhì)及延遲傳輸。
本發(fā)明的其它優(yōu)勢(shì)、目的,及特征部分將在隨后的說明書中闡明,部分對(duì)于隨后審查的本領(lǐng)域的普通技術(shù)人員來說是明顯的,或者可以從本發(fā)明的實(shí)踐中了解到。通過在本發(fā)明中所記載的說明書、權(quán)利要求書和附圖中特別指出的結(jié)構(gòu),來認(rèn)識(shí)到并獲得本發(fā)明的目標(biāo)及其它優(yōu)勢(shì)。
為了獲得這些目的及其它優(yōu)勢(shì),并依照本發(fā)明的用途,如這里體現(xiàn)并廣泛描述的,語音編碼/解碼方法包括執(zhí)行語音編碼、通過語音編碼計(jì)算至少一個(gè)特征參數(shù)值、傳輸壓縮數(shù)據(jù)、解壓縮傳輸數(shù)據(jù)、以及利用由解壓縮重建的參數(shù)值執(zhí)行解碼。
本發(fā)明的另一方面,語音編碼裝置包括執(zhí)行語音編碼的語音編碼器、至少一個(gè)壓縮區(qū),用于在預(yù)定周期內(nèi)壓縮至少一個(gè)由語音編碼器b計(jì)算出的特征參數(shù)值、以及比特流傳輸區(qū),產(chǎn)生至少一個(gè)壓縮區(qū)輸出具有預(yù)定長(zhǎng)度的比特流,進(jìn)而輸出。
應(yīng)理解,本發(fā)明在前的總的描述以及隨后的詳細(xì)描述為示范性的和解釋性的,并意于提供更多的如要求的本發(fā)明的解釋。
附圖簡(jiǎn)述附圖,其被包括進(jìn)來為發(fā)明提供更多解釋,而且并入并構(gòu)成本申請(qǐng)的一部分,該附圖解釋了本發(fā)明的實(shí)施例,并結(jié)合描述用于解釋本發(fā)明的原理。在附圖中
圖1是根據(jù)本發(fā)明一實(shí)施例的語音編碼裝置的框圖;圖2是根據(jù)一實(shí)施例的聲音編碼比特流的傳輸形式的簡(jiǎn)圖;圖3是根據(jù)本發(fā)明另一實(shí)施例的語音編碼裝置的框圖;以及圖4是根據(jù)本發(fā)明一實(shí)施例的語音解碼裝置框圖;優(yōu)選實(shí)施例詳述現(xiàn)詳細(xì)參考本發(fā)明優(yōu)選實(shí)施例,在附圖中解釋其舉例。在可能的情況下,所有圖中使用的相同的附圖標(biāo)記是指相同或相似的組成部分。
參照?qǐng)D1,根據(jù)本發(fā)明,語音編碼裝置包括語音編碼器10、第一緩沖器20、第二緩沖器21、第一壓縮區(qū)30、第二壓縮區(qū)31,以及比特流傳輸區(qū)40。
語音編碼器10計(jì)算語音的特征參數(shù)值。與此同時(shí),在聲道建模過程中計(jì)算的參數(shù)值作為語音建模的一種。具體的是,當(dāng)經(jīng)聲道建模的合成結(jié)果(合成聲音)與原始聲音之間的差值(誤差)具有最小值時(shí),語音編碼器10輸出參數(shù)值。即,當(dāng)原始與合成聲音之間的感知誤差具有最小值時(shí),語音編碼器10輸出參數(shù)值。
在一實(shí)施例中,為便于解釋,在語音編碼器10中計(jì)算出的參數(shù)被區(qū)別為第一類型參數(shù)(例如類型1)和第二類型參數(shù)(例如類型2)。
根據(jù)參數(shù)的更新周期和/或傳輸周期區(qū)分參數(shù)。舉例來說,例如,第一類型參數(shù)在10ms周期中被分別更新,第二類型參數(shù)在30ms周期中被分別更新。在另一示范性實(shí)施例中,第一類型參數(shù)分別在7.5ms周期內(nèi)被更新,第二類參數(shù)在30ms周期內(nèi)分別被分別更新。
還是在另一實(shí)施例中,第一類型參數(shù)在10ms周期內(nèi)分別被傳輸,而第二類型參數(shù)在30ms周期內(nèi)分別被傳輸。在一實(shí)施例中,第一類型參數(shù)在7.5ms周期內(nèi)分別被傳輸,第二類參數(shù)在30ms周期內(nèi)分別被傳輸。
特定參數(shù)的更新周期與特定參數(shù)的傳輸周期相匹配。即,如果特定參數(shù)具有7.5ms的更新周期,其傳輸周期也設(shè)為7.5ms。并且,如果特定參數(shù)具有10ms的更新周期,那么其傳輸周期也設(shè)為10ms。
根據(jù)一實(shí)施例,語音編碼裝置包括第一和第二緩沖器20和21,分別對(duì)不同類型參數(shù)的存儲(chǔ)值進(jìn)行歸類。
在一實(shí)施例中,第一類型參數(shù)為碼本索引、碼本增益、音調(diào)周期,以及反饋增益,其在語音編碼器10中計(jì)算。而第二類型參數(shù)為在語音編碼器10中計(jì)算的LP(線性預(yù)測(cè))系數(shù)。
因此,碼本索引、碼本增益、音調(diào)周期,以及反饋增益存儲(chǔ)在第一緩沖器20中,而LP系數(shù)存儲(chǔ)在第二緩沖器21中。
在一實(shí)施例中,第一類型參數(shù)的更新周期和/或傳輸周期短于第二類型參數(shù)的更新周期和/或傳輸周期。因此,存儲(chǔ)在第一緩沖器20中的第一類型參數(shù)的更新周期和/或傳輸周期的總和設(shè)為與存儲(chǔ)在第二緩沖器21中的第二類型參數(shù)的更新周期和/或傳輸周期的總和相等。
例如,當(dāng)存在四種第一類型參數(shù)并存在一種第二類型參數(shù)時(shí),如果更新周期和/或傳輸周期分別設(shè)為7.5ms,作為第一類型參數(shù)的LP系數(shù)的更新周期或傳輸周期例如分別設(shè)為30ms。另一方面,如果作為第二類型參數(shù)的LP系數(shù)的更新周期或傳輸周期例如設(shè)為30ms,那么更新周期或傳輸周期分別設(shè)為(30ms/4=7.5ms),其中‘4’為參數(shù)個(gè)數(shù)。
圖2中示出了比特流,該比特流是從具有語音編碼器10的便攜式終端或具有語音編碼器10的發(fā)射機(jī)中傳輸?shù)模绺鞣N語音存儲(chǔ)/傳遞裝置。例如在30ms周期內(nèi)進(jìn)行圖1中的傳輸開關(guān)操作。從而比特流在60ms周期內(nèi)傳輸。
以上所述的更新和傳輸周期相應(yīng)于在第一或第二壓縮區(qū)30或31內(nèi)執(zhí)行壓縮的操作周期。
第一壓縮區(qū)30壓縮存儲(chǔ)在第一緩沖區(qū)20中的參數(shù)值,第二壓縮區(qū)31壓縮存儲(chǔ)在第二緩沖區(qū)21中的參數(shù)值。與此同時(shí),優(yōu)選采用無損耗壓縮技術(shù)作為壓縮區(qū)30或31中的壓縮方案。
在一實(shí)施例中,產(chǎn)生如圖2所示的、具有預(yù)定長(zhǎng)度比特流的比特流傳輸區(qū)40,還連接到本發(fā)明裝置的開關(guān)的后部,以確保數(shù)據(jù)的預(yù)定傳輸率,如圖1所示。
以這種方式確保比特流傳輸區(qū)的預(yù)定傳輸率,即從壓縮區(qū)30和31輸出的每個(gè)數(shù)據(jù)長(zhǎng)度彼此隨機(jī)相同。即,如果壓縮數(shù)據(jù)的比特長(zhǎng)度超過預(yù)定閾值,那么比特流傳輸區(qū)40除去額外的比特,以傳輸具有相應(yīng)于閾值標(biāo)準(zhǔn)的比特流長(zhǎng)度的壓縮數(shù)據(jù)。另一方面,如果壓縮數(shù)據(jù)的比特長(zhǎng)度沒有超過預(yù)定閾值,那么比特流傳輸區(qū)40則添加無意義的比特值‘0’,其總和為構(gòu)成壓縮數(shù)據(jù)的所需長(zhǎng)度,以傳輸具有相應(yīng)于閾值標(biāo)準(zhǔn)長(zhǎng)度的比特長(zhǎng)度的壓縮數(shù)據(jù)。
提取特征參數(shù),當(dāng)原始與合成聲音之間的差值為最小值時(shí)該特征參數(shù)表示誤差信息,對(duì)提取的參數(shù)值執(zhí)行無損耗的壓縮,并將-預(yù)定長(zhǎng)度的壓縮值傳輸給接收側(cè)。
具有語音編碼裝置的便攜式終端或具有語音編碼裝置的發(fā)射器,例如各種語音存儲(chǔ)/轉(zhuǎn)換儀器,對(duì)壓縮參數(shù)值進(jìn)行量化或采樣,該終端或發(fā)射器產(chǎn)生一比特流,而后將產(chǎn)生的一比特流傳輸至接收側(cè)。
隨后,具有語音解碼裝置的便攜式終端或具有語音解碼裝置的接收器,例如各種語音存儲(chǔ)/轉(zhuǎn)換儀器,以預(yù)定速率對(duì)比特流進(jìn)行解壓縮,并且利用相應(yīng)于解碼中解壓縮的參數(shù)值存儲(chǔ)原始聲音。
參照?qǐng)D3,根據(jù)本發(fā)明一實(shí)施例的語音編碼裝置包括CELP編碼器100、緩沖器200、第一壓縮區(qū)300、第二壓縮區(qū)310、以及傳輸比特調(diào)整區(qū)400。
CELP編碼器100計(jì)算與輸入語音極其相似的特征參數(shù)值。CELP編碼器100通過聲道建模計(jì)算該特征參數(shù)值。
CELP編碼器100包括碼本110、長(zhǎng)期預(yù)報(bào)器120、短期預(yù)報(bào)器130、感知加權(quán)濾波器140、均方誤差(此后縮寫為MSE)計(jì)算區(qū)150、以及感知誤差濾波器160。
CELP編碼器100進(jìn)行計(jì)算,以輸出碼本索引、碼本增益、音調(diào)周期、反饋增益,以及LP系數(shù)至少其中之一,作為輸入語音的特征參數(shù)。
CELP編碼器100優(yōu)選計(jì)算/輸出相應(yīng)于該情形的參數(shù)值,該情形下通過CELP聲道建模合成的結(jié)果(合成聲音)與為CELP編碼而輸入的原始聲音之間的差值為最小。即,當(dāng)原始與合成聲音之間的感知誤差為最小值時(shí),CELP編碼器100輸出參數(shù)值。例如在圖3中,‘x[n]’與‘{^}atop{x[n]}’分別為原始聲音與合成聲音。
CELP編碼器100優(yōu)選采用高斯碼本作為碼本110。碼本110包括具有互不相同索引的碼字。
CELP編碼器100的長(zhǎng)期預(yù)測(cè)器120為執(zhí)行長(zhǎng)期預(yù)測(cè)的數(shù)字濾波器,而連接至長(zhǎng)期預(yù)測(cè)器120輸出端的短期預(yù)測(cè)器130為另一執(zhí)行短期預(yù)測(cè)的數(shù)字濾波器。
長(zhǎng)期預(yù)測(cè)器120采用音調(diào)周期,而短期預(yù)測(cè)器130采用LP系數(shù)。
因此,CELP編碼器100的長(zhǎng)期預(yù)測(cè)器120輸出相應(yīng)于該情形的音調(diào)周期,該情形下,通過CELP聲道建模合成的結(jié)果(合成聲音)與為CELP編碼而輸入的原始聲音之間的差值為最小。CELP編碼器100的短期預(yù)測(cè)器130輸出相應(yīng)于該情形的LP系數(shù),該情形下,通過CELP聲道建模合成的結(jié)果(合成聲音)與為CELP編碼而輸入的原始聲音之間的差值為最小。
通過一對(duì)預(yù)測(cè)器120和130合成相應(yīng)于碼本100的各個(gè)索引的碼字。CELP編碼器100采用感知加權(quán)濾波器140減小合成聲音和輸入原始聲音之間的誤差。
在一實(shí)施例中,CELP編碼器100具有一條反饋路徑,以查找與輸入原始聲音的誤差減為最小的合成聲音。因此,CELP編碼器100利用反饋路徑改變碼本110的索引,以重復(fù)搜索碼本110。CELP編碼器100通過碼本搜索取消合成和原始聲音之間的感知誤差,確定與原始聲音最貼近的合成聲音。
在CELP編碼器100中,當(dāng)合成和原始聲音之間的感知誤差最小化時(shí),本發(fā)明計(jì)算碼本110的索引,其用于產(chǎn)生相應(yīng)的合成聲音作為一個(gè)參數(shù)(碼本索引),而產(chǎn)生相應(yīng)的碼本增益作為另一參數(shù)。
在CELP編碼器100中,當(dāng)合成與原始聲音之間的感知誤差被最小化時(shí),本發(fā)明計(jì)算作為參數(shù)的用于長(zhǎng)期預(yù)測(cè)器120的音調(diào)周期、和用于短期預(yù)測(cè)器130的LP系數(shù)。
此外,在CELP編碼器100中,當(dāng)合成與原始聲音之間的感知誤差被最小化時(shí),本發(fā)明計(jì)算反饋路徑中的增益作為另一參數(shù)(反饋增益)。
簡(jiǎn)單的說,當(dāng)合成與原始聲音之間的感知誤差被最小化時(shí),CELP編碼器100計(jì)算并輸出碼本索引、碼本增益、音調(diào)周期、反饋增益,以及LP系數(shù),作為輸入語音的特征參數(shù)。
當(dāng)連續(xù)輸入語音時(shí),以上所解釋的特征參數(shù)以預(yù)定周期被更新。第一和第二壓縮區(qū)300和310并相應(yīng)的操作,以跟上參數(shù)的更新周期。理所當(dāng)然的是,所決定的壓縮數(shù)據(jù)的傳輸周期必定能應(yīng)付壓縮區(qū)300和310的操作周期(壓縮周期)。
在一實(shí)施例中,碼本索引、碼本增益、音調(diào)周期、或反饋增益的更新周期優(yōu)選設(shè)為小于LP系數(shù)的更新周期。例如,碼本索引的更新周期設(shè)為約10ms,而LP系數(shù)的更新周期設(shè)為約30ms。其余的碼本增益、音調(diào)周期、反饋增益的周期設(shè)為例如約10ms。
一個(gè)實(shí)施例進(jìn)一步包括緩沖器200,其中預(yù)先存儲(chǔ)其具有更快更新周期的參數(shù)(碼本索引、碼本增益、音調(diào)周期、反饋增益)。具有更快更新周期的參數(shù)與具有更慢更新周期的參數(shù)(LP系數(shù),等)之間的壓縮時(shí)間是相匹配的。碼本索引、碼本增益、音調(diào)周期、以及反饋增益的更新周期的總和設(shè)為與LP系數(shù)的更新周期的值相等。即,如果一個(gè)參數(shù)的一個(gè)更新周期設(shè)為,例如7.5ms,要花30ms在緩沖器200中存儲(chǔ)碼本索引、碼本增益、音調(diào)周期、以及反饋增益。在一實(shí)施例中,LP系數(shù)的更新周期設(shè)為約30ms。
為了壓縮參數(shù),該參數(shù)在不同區(qū)中是根據(jù)相應(yīng)的更新周期而彼此區(qū)分的,按照一實(shí)施例提供第一和第二壓縮區(qū)300和310。第一壓縮區(qū)300壓縮臨時(shí)存儲(chǔ)在緩沖器200中的參數(shù)(碼本索引、碼本增益、音調(diào)周期、反饋增益)。第二壓縮區(qū)310壓縮由CELP編碼器100的短期預(yù)測(cè)器130計(jì)算/輸出的LP系數(shù)。在這種情況下,壓縮區(qū)300和310均采用無損耗壓縮技術(shù)。
以下提供了根據(jù)示范性實(shí)施例的參數(shù)的更新周期以及相應(yīng)的系統(tǒng)結(jié)構(gòu)。
在優(yōu)選實(shí)施例中,各個(gè)參數(shù)(碼本索引、碼本增益、音調(diào)周期、反饋增益、LP系數(shù))的更新周期設(shè)為互不相同,并且利用多個(gè)緩沖器壓縮各個(gè)參數(shù)的時(shí)間是相匹配的。提供分別壓縮參數(shù)的區(qū)。
從CELP編碼器100中輸出的各個(gè)參數(shù)的更新周期(碼本索引、碼本增益、音調(diào)周期、反饋增益、LP系數(shù))設(shè)為彼此相同??梢圆捎靡粋€(gè)或更多個(gè)緩沖器。提供一個(gè)區(qū),其用于壓縮臨時(shí)存儲(chǔ)在緩沖器中的參數(shù)。
在另一實(shí)施例中,在第一和第二壓縮區(qū)300和310的后部之間提供一個(gè)開關(guān)(在圖中未示出),用于控制壓縮區(qū)300和310的輸出路徑。
因?yàn)榇鎯?chǔ)在緩沖器200中每個(gè)碼本索引、碼本增益、音調(diào)周期、以及反饋增益具有例如7.5ms的更新周期,第一壓縮區(qū)300在約30ms周期內(nèi)執(zhí)行壓縮操作。例如,當(dāng)LP系數(shù)具有30ms的更新周期時(shí),第二壓縮區(qū)310在約30ms內(nèi)執(zhí)行壓縮操作。因此,在一示范性實(shí)施例中,開關(guān)在約30ms內(nèi)對(duì)第一和第二壓縮區(qū)300和310執(zhí)行開關(guān)操作。
傳輸比特調(diào)整區(qū)400將第一和第二壓縮區(qū)300和310的輸出合并入一個(gè)比特流輸出。傳輸比特調(diào)整區(qū)400,其為確保壓縮數(shù)據(jù)的常數(shù)輸出率的區(qū),使壓縮區(qū)300和310輸出的數(shù)據(jù)長(zhǎng)度相同,并傳輸該數(shù)據(jù)。
為了以相同長(zhǎng)度傳輸壓縮數(shù)據(jù),傳輸比特調(diào)整區(qū)400對(duì)比特長(zhǎng)度設(shè)定一個(gè)隨機(jī)閾值。例如,如果100%傳輸長(zhǎng)度為100比特,將從傳輸比特調(diào)整區(qū)400傳輸?shù)谋忍亓鞯膫鬏旈L(zhǎng)度就設(shè)為其99%。如果一壓縮數(shù)據(jù)長(zhǎng)度例如為101比特,傳輸比特調(diào)整區(qū)400向接收側(cè)傳輸總和為99比特長(zhǎng)度的壓縮數(shù)據(jù)。
例如,如果一壓縮數(shù)據(jù)長(zhǎng)度為96比特,傳輸比特調(diào)整區(qū)400在壓縮數(shù)據(jù)長(zhǎng)度中插入無意義的3比特虛擬數(shù)據(jù),以提供99比特長(zhǎng)度并向接收側(cè)傳輸。在這種情況下,虛擬插入以這樣一種方式執(zhí)行,例如,‘0’填充入壓縮數(shù)據(jù)的一部分。
在另一實(shí)施例中,本發(fā)明還可包括一個(gè)位于第二壓縮區(qū)310輸入端的緩沖器(圖中未示出),臨時(shí)存儲(chǔ)LP系數(shù)。在以下的描述中,臨時(shí)存儲(chǔ)LP系數(shù)的緩沖器命名為第二緩沖器,并且前述的緩沖器200表示為第一緩沖器200。
在一實(shí)施例中,如在先前的描述中提到的,碼本索引、碼本增益、音調(diào)周期、或反饋增益的更新周期設(shè)為小于LP系數(shù)的更新周期。因此,在第一緩沖器中存儲(chǔ)碼本索引、碼本增益、音調(diào)周期、或反饋增益的周期設(shè)為小于在第二緩沖器中存儲(chǔ)LP系數(shù)的周期。
例如,在第一緩沖器中存儲(chǔ)碼本索引、碼本增益、音調(diào)周期、或反饋增益的周期設(shè)為約10ms,而在第二緩沖器中存儲(chǔ)LP系數(shù)的周期設(shè)為約30ms。
在另一實(shí)施例中,在第一緩沖器中各參數(shù)的存儲(chǔ)周期設(shè)為約7.5ms,而在第二緩沖器中參數(shù)(LP系數(shù))的存儲(chǔ)周期設(shè)為約30ms。
參照?qǐng)D4,解釋了一種便攜式終端,其具有語音解碼裝置,或具有語音解碼裝置的接收器,例如各種語音存儲(chǔ)/轉(zhuǎn)換儀器,其以預(yù)定速率解壓縮接收的比特流,并利用相應(yīng)于解碼中解壓縮的參數(shù)值存儲(chǔ)原始聲音。
圖4為根據(jù)本發(fā)明一實(shí)施例的語音解碼裝置框圖,其為圖3中語音編碼裝置的情況作準(zhǔn)備。
參照?qǐng)D4,根據(jù)本發(fā)明,語音解碼裝置包括解壓縮接收比特流的第一和第二解壓縮區(qū)500和510、以及CELP解碼器600。并且根據(jù)本發(fā)明,語音解碼裝置包括一個(gè)開關(guān)(圖中未示出),用于向相應(yīng)的解壓縮區(qū)500或510傳遞接收的比特流。
開關(guān)(圖中未示出)執(zhí)行開關(guān)操作,以向第一解壓縮區(qū)500傳遞相應(yīng)于碼本索引、碼本增益、音調(diào)周期、或反饋增益的比特,或向第二解壓縮區(qū)510傳遞相應(yīng)于LP系數(shù)的比特。
第一或第二解壓縮區(qū)500或510解壓縮輸入的數(shù)據(jù),并向CELP解碼器600輸出。從圖3所描述的CELP編碼器的編碼操作可理解CELP解碼器600的操作。
另一實(shí)施例包括一控制區(qū)(圖中未示出),其控制開關(guān)的開關(guān)操作。例如,如果按圖2的格式定義傳輸?shù)谋忍亓?,控制區(qū)則將接收的比特流劃分為第一類型和第二類型。并且控制區(qū)以這樣一種方式控制開關(guān)操作,即將相應(yīng)于第一類型參數(shù)(碼本索引、碼本增益、音調(diào)周期、反饋增益)的比特傳遞至第一解壓縮區(qū)500,而將第二類型參數(shù)(LP系數(shù))傳遞至第二解壓縮區(qū)510。
本發(fā)明允許不同種類的語音編碼,例如MELP(混合激勵(lì)線性預(yù)測(cè))編碼以及RELP(隨機(jī)激勵(lì)線性預(yù)測(cè))編碼,還有CELP編碼。
因此,本發(fā)明為語音編碼和與其相應(yīng)的語音解碼提供可靠的高壓縮性,而沒有降低語音品質(zhì)以及延遲傳輸。
由CELP編碼計(jì)算出的各參數(shù)利用無損耗壓縮技術(shù)進(jìn)行壓縮,并傳輸,其中本發(fā)明為CELP編碼提供的更高的可壓縮性。
有利的是將本發(fā)明施加至便攜式終端以及帶有各種語音存儲(chǔ)/轉(zhuǎn)換儀器的發(fā)射機(jī),例如語言機(jī)(language player)、數(shù)字記錄器、VoIP(互聯(lián)網(wǎng)協(xié)議的語音)終端等。
對(duì)于本領(lǐng)域技術(shù)人員顯而易見的是,可對(duì)本發(fā)明進(jìn)行各種修改和改變。因此,本發(fā)明意于覆蓋從屬權(quán)利要求和其等價(jià)物范圍內(nèi)的本發(fā)明的修改和變化。
權(quán)利要求
1.一種語音編碼/解碼方法,包括執(zhí)行語音編碼;通過該語音編碼計(jì)算至少一個(gè)特征參數(shù)值;壓縮所計(jì)算的該至少一個(gè)特征參數(shù)的值;以及傳輸壓縮值;其中,解壓縮該壓縮值,以恢復(fù)用于對(duì)編碼語音進(jìn)行解碼的參數(shù)值。
2.根據(jù)權(quán)利要求1的方法,其中語音編碼包括聲音編碼(vocoding)。
3.根據(jù)權(quán)利要求1的方法,其中語音編碼為碼激勵(lì)線性預(yù)測(cè)(CELP)編碼。
4.根據(jù)權(quán)利要求1的方法,其中至少一個(gè)特征參數(shù)的計(jì)算值為這樣的一個(gè)值,其表由語音編碼合成的聲音與輸入至語音編碼的語音之間的誤差小于第一閾值。
5.根據(jù)權(quán)利要求4的方法,其中至少一個(gè)特征參數(shù)包括碼本索引、碼本增益、音調(diào)周期、反饋增益,以及線性預(yù)測(cè)系數(shù)的至少其中之一。
6.根據(jù)權(quán)利要求5的方法,其中音調(diào)周期用于長(zhǎng)期預(yù)測(cè)。
7.根據(jù)權(quán)利要求5的方法,其中線性預(yù)測(cè)系數(shù)用于短期預(yù)測(cè)。
8.根據(jù)權(quán)利要求5的方法,其中在壓縮步驟之前還包括臨時(shí)存儲(chǔ)碼本索引、碼本增益、音調(diào)周期、反饋增益,以及線性預(yù)測(cè)系數(shù)。
9.根據(jù)權(quán)利要求5的方法,其中碼本索引、碼本增益、音調(diào)周期、以及反饋增益的更新周期均設(shè)為短于線性預(yù)測(cè)系數(shù)的周期。
10.根據(jù)權(quán)利要求9的方法,其中碼本索引、碼本增益、音調(diào)周期、以及反饋增益的更新周期的總和設(shè)為與線性預(yù)測(cè)系數(shù)的更新周期相等。
11.根據(jù)權(quán)利要求1的方法,其中利用無損耗壓縮技術(shù)執(zhí)行壓縮步驟。
12.根據(jù)權(quán)利要求1的方法,其中以預(yù)定比特單元傳輸所壓縮的數(shù)據(jù)。
13.一種語音編碼裝置,包括執(zhí)行語音編碼的語音編碼器;至少一個(gè)壓縮單元,在預(yù)定周期內(nèi)壓縮至少一個(gè)由語音編碼器計(jì)算出的特征參數(shù)值;以及比特流傳輸單元,使得壓縮單元輸出具有預(yù)定長(zhǎng)度的比特流。
14.根據(jù)權(quán)利要求13的裝置,其中語音編碼器為碼激勵(lì)線性預(yù)測(cè)(CELP)編碼器。
15.根據(jù)權(quán)利要求13的裝置,其中壓縮單元壓縮特征參數(shù)值,當(dāng)由語音編碼器合成的聲音與輸入至語音編碼器的語音之間的誤差小于第一閾值時(shí),計(jì)算其中的特征參數(shù)值。
16.根據(jù)權(quán)利要求13的裝置,其中壓縮區(qū)執(zhí)行無損耗壓縮。
17.根據(jù)權(quán)利要求13的裝置,其中特征參數(shù)包括碼本索引、碼本增益、音調(diào)周期、反饋增益,以及線性預(yù)測(cè)系數(shù)至少其中之一。
18.根據(jù)權(quán)利要求17的裝置,還包括至少一個(gè)緩沖器,在壓縮之前臨時(shí)存儲(chǔ)碼本索引、碼本增益、音調(diào)周期、反饋增益,以及線性預(yù)測(cè)系數(shù)至少其中之
19.根據(jù)權(quán)利要求18的裝置,還包括第一緩沖器,臨時(shí)存儲(chǔ)碼本索引、碼本增益、音調(diào)周期、以及反饋增益的至少其中之一;以及第二緩沖器,臨時(shí)存儲(chǔ)線性預(yù)測(cè)系數(shù)。
20.根據(jù)權(quán)利要求19的裝置,其中碼本索引、碼本增益、音調(diào)周期、以及反饋增益的更新周期均設(shè)為短于線性預(yù)測(cè)系數(shù)的周期。。
21.根據(jù)權(quán)利要求20的裝置,其中碼本索引、碼本增益、音調(diào)周期、以及反饋增益的更新周期的總和設(shè)為與線性預(yù)測(cè)系數(shù)的更新周期相等。
22.根據(jù)權(quán)利要求19的裝置,還包括第一壓縮單元,壓縮存儲(chǔ)在第一緩沖器中的參數(shù)值;以及第二壓縮單元,壓縮存儲(chǔ)在第二緩沖器中的參數(shù)值。
全文摘要
本發(fā)明提供一種語音編碼/解碼的方法。語音編碼過程中計(jì)算出的各個(gè)參數(shù)經(jīng)壓縮后傳輸。執(zhí)行高壓縮性的CELP編碼以及相應(yīng)于CELP編碼的解碼,而沒有降低聲音品質(zhì)以及延遲傳輸。本發(fā)明的一種典型方法包括執(zhí)行語音編碼、通過語音編碼計(jì)算至少一個(gè)特征參數(shù)值、壓縮至少一個(gè)特征參數(shù)值,以及傳輸壓縮數(shù)據(jù)。
文檔編號(hào)H03M7/30GK1728236SQ20051009239
公開日2006年2月1日 申請(qǐng)日期2005年7月15日 優(yōu)先權(quán)日2004年7月16日
發(fā)明者金燦佑 申請(qǐng)人:Lg電子株式會(huì)社