管理抖動緩存器的方法和使用其的抖動緩存器的制造方法
【專利摘要】本發(fā)明涉及管理抖動緩存器的方法和使用其的抖動緩存器。管理抖動緩存器的方法包括步驟:接收音頻信息幀;和基于接收的音頻信息幀調(diào)整抖動緩存器,其中調(diào)整抖動緩存器的步驟包括音頻信號的補(bǔ)償,并且音頻信號的補(bǔ)償可以對于音頻信息幀的每個子幀執(zhí)行。
【專利說明】管理抖動緩存器的方法和使用其的抖動緩存器
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及處理音頻信號的技術(shù),尤其是,涉及管理/控制用于解碼的接收端的抖動緩存器的方法,和使用該方法的抖動緩存器。
【背景技術(shù)】
[0002]通常,音頻信號包括各種頻帶的信號。人類可聽得到的頻率是在20Hz至20kHz的范圍之內(nèi),而通常的人類語音是在等于或者小于大約4kHz的頻帶中。
[0003]可能存在輸入音頻信號包括其中人類語音很難存在的大于或等于7kHz的高頻帶分量,以及人類語音存在的帶的情形。
[0004]因而,如果適用于窄帶(例如,?4kHz)的編譯方案被應(yīng)用于寬帶(大約?8kHz)或者超寬帶(大約?16kHz)信號,由于沒有編碼的帶導(dǎo)致存在聲音質(zhì)量劣化的問題。
[0005]近來,隨著對視頻電話、電視會議等等需求的增加,存在對通過其將音頻信號,SP話音信號,恢復(fù)為接近于真實的語音的編碼/解碼技術(shù)增長的興趣。更具體地說,存在有關(guān)通過其編碼帶被擴(kuò)展的編碼/解碼技術(shù)的增長的興趣,并且此外,在用于發(fā)送語音信息的網(wǎng)絡(luò)中,感興趣區(qū)域從電路交換網(wǎng)方案轉(zhuǎn)移到分組交換網(wǎng)絡(luò)方案。
[0006]在這種情況下,在發(fā)送通過使用編碼而分組化的音頻信號的過程中,由于有關(guān)網(wǎng)絡(luò)的問題,可能發(fā)生延遲。在傳輸過程中出現(xiàn)的延遲導(dǎo)致在輸出端的輸出延遲或者聲音質(zhì)量劣化。
[0007]因此,需要考慮一種在接收端中使用以解決音頻信號延遲或者在傳輸過程中出現(xiàn)的損失問題的方法。
【發(fā)明內(nèi)容】
[0008]技術(shù)問題
[0009]本發(fā)明提供用于通過在需要抖動緩存控制的時間基于語音分組的重要性賦予權(quán)重來執(zhí)行抖動緩存控制的方法和裝置。
[0010]本發(fā)明還提供在語音信息調(diào)整中基于語音分組的重要性為要處理的目標(biāo)分配優(yōu)先級的方法和裝置。
[0011]本發(fā)明還提供通過利用分配給靜默持續(xù)時間的優(yōu)先級而丟棄或者恢復(fù)語音分組,經(jīng)由抖動緩存器控制避免聲音質(zhì)量劣化以及有助于回放的方法和裝置。
[0012]本發(fā)明還提供了考慮到與當(dāng)靜默持續(xù)時間被處理時處理靜默持續(xù)時間的情形相比施加在聲音質(zhì)量上的影響顯然更小的事實,通過壓縮音頻信號,在靜默持續(xù)時間優(yōu)先地丟棄/恢復(fù)語音分組,或者執(zhí)行抖動緩存管理的方法和裝置。
[0013]本發(fā)明還提供了方法和裝置,其中,當(dāng)基于重要性確定時,如果具有較高優(yōu)先級的語音分組(例如,具有低重要性的語音分組)不存在,則抖動緩存控制請求被存儲在事件堆棧中,并且基于時間戳的序列號以重排順序被發(fā)送給回放端。
[0014]技術(shù)解決方案[0015]根據(jù)本發(fā)明的一個方面,提供了一種管理抖動緩存器的方法。該方法包括:接收語音信息幀;和基于接收的語音信息幀執(zhí)行抖動緩存器調(diào)整,其中抖動緩存器調(diào)整包括補(bǔ)償音頻信號。
[0016]此外,對于音頻信號的補(bǔ)償可以以語音信息幀的子幀為單位執(zhí)行。
[0017]此外,對于音頻信號的補(bǔ)償可以在音頻信號的解碼參數(shù)級別上執(zhí)行。
[0018]此外,對于音頻信號的補(bǔ)償可以基于音頻信號幀的重要性執(zhí)行。在此處,音頻信號可以以重要性的升序變?yōu)橐纛l信號補(bǔ)償?shù)哪繕?biāo),并且音頻信號幀可以在連續(xù)的靜默持續(xù)時間中具有最低的重要性。
[0019]此外,如果執(zhí)行幀抽取作為對于音頻信號補(bǔ)償,則子幀的新的解碼參數(shù)可以通過對用于構(gòu)成音頻信號幀的兩個子幀的解碼參數(shù)內(nèi)插來產(chǎn)生。
[0020]此外,如果執(zhí)行幀抽取作為對于音頻信號補(bǔ)償,則新的子幀的解碼參數(shù)可以通過對用于構(gòu)成音頻信號幀的兩個子幀的解碼參數(shù)內(nèi)插來產(chǎn)生。
[0021]此外,如果執(zhí)行幀抽取作為對于音頻信號補(bǔ)償,可以執(zhí)行子幀內(nèi)插,并且子幀內(nèi)插可以包括:在構(gòu)成音頻信號幀的兩個子幀之間產(chǎn)生新的子幀,和通過對用于兩個子幀的解碼參數(shù)內(nèi)插產(chǎn)生新的子幀的解碼參數(shù)。
[0022]根據(jù)本發(fā)明的另一個方面,提供了一種抖動緩存器,包括:用于接收語音信息幀的接收機(jī);用于存儲和管理語音信息幀的緩存器;和用于輸出語音信息幀的輸出單元,其中緩存器以接收的語音信息幀的子幀為單位補(bǔ)償語音信息。
[0023]此外,該緩存器可以在解碼參數(shù)級別上補(bǔ)償語音信息。
[0024]此外,該緩存器可以通過堆兩個不同的子幀的解碼參數(shù)內(nèi)插產(chǎn)生新的解碼參數(shù)。
[0025]有益效果
[0026]根據(jù)本發(fā)明,在需要抖動緩存控制時,通過基于語音分組的重要性賦予權(quán)重可以改善性能。例如,用于要處理的目標(biāo)的優(yōu)先級可以基于在語音信息調(diào)整中的重要性來確定。
[0027]根據(jù)本發(fā)明,在抖動緩存器管理中施加在聲音質(zhì)量上的影響可以通過基于特定準(zhǔn)則的重要性執(zhí)行抖動緩存管理而減小。
[0028]根據(jù)本發(fā)明,通過利用分配給靜默持續(xù)時間的優(yōu)先級丟棄或者恢復(fù)語音分組,經(jīng)由抖動緩存管理,聲音質(zhì)量劣化可以減小,并且此外,可以有助于回放。
[0029]根據(jù)本發(fā)明,考慮到與當(dāng)處理靜默持續(xù)時間的時候處理靜默持續(xù)時間的情形相比施加在聲音質(zhì)量上的影響顯著更小的事實,抖動緩存管理可以通過優(yōu)先地丟棄/恢復(fù)靜默持續(xù)時間的語音分組而變得更加有效。
[0030]根據(jù)本發(fā)明,可以通過基于在抖動緩存器中分組的重要性對分組的丟棄/恢復(fù)和/或音頻信號的壓縮/擴(kuò)展賦予優(yōu)先級,提供更少受到抖動緩存管理影響的高質(zhì)量語音服務(wù)。
[0031]根據(jù)本發(fā)明,當(dāng)基于重要性確定的時候,如果具有較高優(yōu)先級的語音分組(例如,具有低重要性的語音分組)不存在,則抖動緩存控制請求可以被存儲在事件堆棧中,并且可以基于時間戳的序列號以重排順序被發(fā)送給回放端。
【專利附圖】
【附圖說明】
[0032]圖1是示出典型的音頻編碼器的示例性結(jié)構(gòu)的方框圖。[0033]圖2是示出典型的音頻解碼器的示例性結(jié)構(gòu)的方框圖。
[0034]圖3是示出抖動緩存器的示例性結(jié)構(gòu)的方框圖。
[0035]圖4是示出典型抖動緩存器的示例性實施例的示意圖。
[0036]圖5是示出不使用抖動緩存器的示例的示意圖。
[0037]圖6是示出抖動緩存器管理的示例的示意圖。
[0038]圖7是示出需要抖動緩存控制的示例的示意圖。
[0039]圖8是示出當(dāng)在抖動緩存器中補(bǔ)償語音信息的時候,在抖動緩存器中確定語音幀重要性的示例性方法的示意圖。
[0040]圖9是示出包括語音幀補(bǔ)償?shù)氖纠远秳泳彺嫫鞴芾矸椒ǖ牧鞒虉D。
[0041]圖10是示出示例性抖動緩存器調(diào)整方法的流程圖。
[0042]圖11是示出在分組接收的情況下示例性抖動緩存器調(diào)整方法的流程圖。
[0043]圖12是示出在回放請求的情況下示例性抖動緩存器調(diào)整方法的流程圖。
[0044]圖13是示出在比特流級別上執(zhí)行抖動緩存器管理示例的示意圖。
[0045]圖14是示出在音頻信號級別上執(zhí)行抖動緩存器管理示例的示意圖。
[0046]圖15是示出以語音幀的子幀為單位補(bǔ)償語音信息示例的示意圖。
[0047]圖16至圖22是示出用于在解碼參數(shù)級別上以子幀為單位補(bǔ)償語音信息的示例性方法的示意圖。
【具體實施方式】
[0048]在下文中將參考伴隨的附圖詳細(xì)描述本發(fā)明示例性實施例。在本發(fā)明示例性實施例的以下的描述中,公知的功能或者結(jié)構(gòu)不詳細(xì)描述,因為它們將使本發(fā)明在不必要的細(xì)節(jié)方面難以理解。
[0049]當(dāng)?shù)谝粯?gòu)成元件如提及“連接”到或者“接入”第二構(gòu)成元件的時候,這可以指的是其直接連接到或者接入第二構(gòu)成元件,或者應(yīng)該理解,其借助于第三構(gòu)成元件連接到或者接入第二構(gòu)成元件。
[0050]術(shù)語“第一”、“第二”等等可用于區(qū)別一種技術(shù)結(jié)構(gòu)與另一種技術(shù)結(jié)構(gòu)。例如,在本發(fā)明的技術(shù)特征的范圍內(nèi)稱作第一構(gòu)成元件的構(gòu)成元件也可以稱作執(zhí)行相同功能的第二構(gòu)成元件。
[0051]圖1是示出典型的音頻編碼器的示例性結(jié)構(gòu)的方框圖。
[0052]參考圖1,音頻編碼器100可以包括帶寬確認(rèn)單元105、采樣轉(zhuǎn)換單元125、預(yù)處理單元130、帶分解單元110、線性預(yù)測分析單元115和135、線性預(yù)測量化單元140、150和175、變換單元145、反變換單元155和180、基音(pitch)檢測單元160、自適應(yīng)碼本搜索單元165、固定碼本搜索單元170、模式選擇單元185、帶預(yù)測單元190,和補(bǔ)償增益預(yù)測單元195。
[0053]該帶寬確認(rèn)單元105可以確定輸入音頻信號的帶寬信息。音頻信號可以根據(jù)帶寬分類,諸如具有大約4kHz帶寬并且主要地在公共電話交換網(wǎng)(PSTN)中使用的窄帶信號,具有大約7kHz帶寬并且主要地在AM無線電或者比窄帶音頻信號更加自然的高質(zhì)量語音中使用的寬帶信號,主要地在聲音質(zhì)量是重要的諸如數(shù)字廣播的扇區(qū)中使用的超寬帶信號。帶寬確認(rèn)單元105可以將輸入音頻信號改變?yōu)轭l率域信號以確定是否當(dāng)前的音頻信號的帶寬對應(yīng)于窄帶信號或者寬帶信號或者超寬帶信號。帶寬確認(rèn)單元105可以將輸入音頻信號轉(zhuǎn)換為頻率域信號以確定是否譜的上帶二進(jìn)制數(shù)(upper-band bins)存在,和/或可以檢查和確定其分量。根據(jù)實施例,當(dāng)輸入音頻信號的帶寬是固定的時候,帶寬確認(rèn)單元105可以不被單獨(dú)提供。
[0054]根據(jù)輸入音頻信號的帶寬,帶寬確認(rèn)單元105可以將超寬帶信號發(fā)送給帶分解單元110,并且可以將窄帶信號或者寬帶信號發(fā)送給采樣轉(zhuǎn)換單元125。
[0055]帶分解單元110可以轉(zhuǎn)換輸入信號的采樣速率,并且可以將其分解為上帶和下帶。例如,32kHz的音頻信號可以被轉(zhuǎn)換為25.6kHz的采樣頻率,并且可以通過12.8kHz轉(zhuǎn)換為上帶和下帶。在分解帶之中,帶分解單元110將下帶信號發(fā)送給預(yù)處理單元130,并且將上帶信號發(fā)送給線性預(yù)測分析單元115。
[0056]采樣轉(zhuǎn)換單元125可以接收輸入窄帶信號或者寬帶信號,并且可以改變特定的采樣速率。例如,如果輸入窄帶音頻信號的采樣速率是8kHz,則上帶信號可以通過執(zhí)行上采樣至12.SkHz而產(chǎn)生,并且如果輸入寬帶音頻信號是16kHz,則下帶信號可以通過執(zhí)行下采樣到12.SkHz而生成。采樣轉(zhuǎn)換單元125輸出采樣轉(zhuǎn)換的下帶信號。內(nèi)部采樣頻率可以具有除12.8kHz以外的另一個采樣頻率。
[0057]預(yù)處理單元130對從采樣轉(zhuǎn)換單元125和帶分解單元110輸出的下帶信號執(zhí)行預(yù)處理。預(yù)處理單元130對輸入信號執(zhí)行濾波,以便有效地提取音頻參數(shù)。截止頻率可以根據(jù)語音帶寬不同地設(shè)置,并且可以對非常低的頻率執(zhí)行高通濾波,非常低的頻率是在其中采集相對次要的信息的頻帶,從而能夠集中在當(dāng)提取參數(shù)的時候需要的重要帶上。對于另一個示例,預(yù)加重濾波器可用于提升輸入信號的高頻帶,以便低頻區(qū)域和高頻區(qū)域的能量可以被縮放。因此,當(dāng)分析線性預(yù)測的時候,可以提高分辨率。
[0058]線性預(yù)測分析單元115和135可以計算線性預(yù)測系數(shù)(LPC)。線性預(yù)測分析單元115和135可以對共振峰執(zhí)行建模,共振峰表示音頻信號的頻譜的整個形狀。線性預(yù)測分析單元115和135可以計算LPC值以具有表示通過使用原始音頻信號與由線性預(yù)測分析單元115和135計算的LPC產(chǎn)生的預(yù)測音頻信號的差值的誤差值的最小的均方差(MSE)。LPC可以通過使用各種方法,諸如自動校正方法、協(xié)方差方法等等計算。
[0059]與用于下帶信號的線性預(yù)測分析單元135不同,線性預(yù)測分析單元115可以提取低階的LPC。
[0060]線性預(yù)測量化單元120和140可以轉(zhuǎn)換提取的LPC以產(chǎn)生頻率域的變換系數(shù),諸如線性譜對(LSP)或者線性譜頻率(LSF),并且可以量化產(chǎn)生的頻率域的變換值。由于LPC具有大的動態(tài)范圍,所以當(dāng)LPC被直接發(fā)送的時候需要許多比特。因此,LPC信息可以通過轉(zhuǎn)換為頻率域并且通過量化變換系數(shù)來以少量比特(即,壓縮量)發(fā)送。
[0061]線性預(yù)測量化單元120和140可以去量化該量化的LPC,并且通過使用轉(zhuǎn)換為時間域的LPC產(chǎn)生線性預(yù)測殘留信號。線性預(yù)測殘留信號是從音頻信號中除去預(yù)測共振峰分量的信號,并且可以包括基音信息和隨機(jī)信號。
[0062]線性預(yù)測量化單元120可以使用量化的LPC來通過關(guān)于原始上帶信號濾波而產(chǎn)生先前的預(yù)測殘留信號。產(chǎn)生的線性預(yù)測殘留信號被發(fā)送給補(bǔ)償增益預(yù)測單元195以獲得關(guān)于上帶預(yù)測激勵信號的補(bǔ)償增益。
[0063]線性預(yù)測量化單元140使用量化的LPC來通過關(guān)于原始下帶信號濾波而產(chǎn)生線性預(yù)測殘留信號。產(chǎn)生的線性預(yù)測殘留信號被輸入給變換單元145和基音檢測單元160。
[0064]在圖1中,變換單元145、量化單元150和反變換單元155可以操作為執(zhí)行TCX模式的變換碼激勵(TCX)模式執(zhí)行單元。此外,基音檢測單元160、自適應(yīng)碼本搜索單元165和固定碼本搜索單元170可以操作為執(zhí)行CELP模式的碼激勵線性預(yù)測(CELP)模式執(zhí)行單
J Li ο
[0065]變換單元145可以基于變換函數(shù),諸如離散傅里葉變換(DFT)或者快速傅里葉變換(FFT),將輸入線性預(yù)測殘留信號轉(zhuǎn)換到頻率域。該變換單元145可以將變換系數(shù)信息發(fā)送給量化單元150。
[0066]量化單元150可以對由變換單元145產(chǎn)生的變換系數(shù)執(zhí)行量化。量化單元150可以通過使用各種方法執(zhí)行量化。量化單元150可以根據(jù)頻帶有選擇地執(zhí)行量化,并且可以通過使用綜合分析(AbS)計算最佳頻率組合。
[0067]反變換單元155可以基于量化的信息執(zhí)行反變換,并且可以在時間域中產(chǎn)生線性預(yù)測殘留信號的恢復(fù)的激勵信號。
[0068]在量化之后反轉(zhuǎn)換的線性預(yù)測殘留信號,也就是說,恢復(fù)的激勵信號,經(jīng)由線性預(yù)測被恢復(fù)為音頻信號?;謴?fù)的音頻信號被發(fā)送給模式選擇單元185。這樣,以TCX模式恢復(fù)的音頻信號可以與以CELP模式量化并恢復(fù)的音頻信號相比較,如下所述。
[0069]同時,在CELP模式中,基音檢測單元160可以通過使用開環(huán)方案,諸如自相關(guān)方法,計算用于線性預(yù)測殘留信號的基音。例如,基音檢測單元160可以通過比較合成的音頻信號和實際的音頻信號計算基音周期、峰值等等。在這種情況下,可以使用AbS等方法等
坐寸O
[0070]自適應(yīng)碼本搜索單元165基于從基音檢測單元計算的基音信息提取自適應(yīng)碼本索引和增益。自適應(yīng)碼本搜索單元165可以通過使用AbS等基于自適應(yīng)碼本索引和增益信息從線性預(yù)測殘留信號中計算基音結(jié)構(gòu)。自適應(yīng)碼本搜索單元165將其中除去了自適應(yīng)碼本的貢獻(xiàn)部分,例如,有關(guān)基音結(jié)構(gòu)的信息的線性預(yù)測殘留信號發(fā)送給固定碼本搜索單元170。
[0071]固定碼本搜索單元170可以基于從自適應(yīng)碼本搜索單元165接收的線性預(yù)測殘留信號提取和編碼固定碼本索引和增益。在這種情況下,用于從固定碼本搜索單元170中提取固定碼本索引和增益的線性預(yù)測殘留信號可以是從其中除去有關(guān)基音結(jié)構(gòu)的信息的線性預(yù)測殘留信號。
[0072]量化單元175量化參數(shù),諸如從基音檢測單元160輸出的基音信息,從自適應(yīng)碼本搜索單元165輸出的自適應(yīng)碼本索引和增益,和從固定碼本搜索單元170輸出的固定碼本索引和增益等等。
[0073]反變換單元180可以通過使用由量化單元175量化的信息產(chǎn)生激勵信號,其是線性預(yù)測殘留信號。基于該激勵信號,通過使用線性預(yù)測的反過程可以恢復(fù)音頻信號。
[0074]反變換單元180可以將以CELP模式恢復(fù)的音頻信號發(fā)送給模式選擇單元185。
[0075]模式選擇單元185可以比較經(jīng)由TCX模式恢復(fù)的TCX激勵信號,和經(jīng)由CELP模式恢復(fù)的CELP激勵信號,并且可以選擇更加類似于原始線性預(yù)測殘留信號的信號。模式選擇單元185也可以編碼表示經(jīng)由其恢復(fù)選擇的激勵信號的特定模式的信息。模式選擇單元185可以將激勵信號和關(guān)于恢復(fù)的音頻信號的選擇的選擇信息發(fā)送給帶預(yù)測單元190。[0076]帶預(yù)測單元190可以通過使用恢復(fù)的激勵信號和從模式選擇單元185發(fā)送的選擇信息產(chǎn)生上帶預(yù)測激勵信號。
[0077]補(bǔ)償增益預(yù)測單元195可以比較從帶預(yù)測單元190發(fā)送的上帶預(yù)測激勵信號和從線性預(yù)測量化單元120發(fā)送的上帶預(yù)測殘留信號,以補(bǔ)償有關(guān)譜的增益。
[0078]同時,在圖1的示例中,每個構(gòu)成元件可以操作為單獨(dú)模塊,或者多個構(gòu)成元件可以通過形成一個模塊來操作。例如,量化單元120、140、150和175可以作為一個模塊執(zhí)行相應(yīng)的操作,并且量化單元120、140、150和175的每個可以作為額外的模塊提供在處理器所需要的位置。
[0079]圖2是示出典型的音頻解碼器的示例性結(jié)構(gòu)的方框圖。
[0080]參考圖2,音頻解碼器200可以包括去量化單元205和210、帶預(yù)測單元220、增益補(bǔ)償單元225、反變換單元215、線性預(yù)測合成單元230和235、采樣轉(zhuǎn)換單元240、帶合成單元250和后處理濾波單元245和255。
[0081]去量化單元205和210從音頻編碼器接收量化的參數(shù)信息,并且將其去量化。
[0082]反變換單元215可以通過對以TCX模式或者CELP模式編碼的語音信息執(zhí)行反變換恢復(fù)激勵信號。反變換單元215可以基于從編碼器接收的參數(shù)產(chǎn)生恢復(fù)的激勵信號。在這種情況下,反變換單元215可以僅僅對從音頻編碼器中選擇出來的某些帶執(zhí)行反變換。反變換單元215可以將恢復(fù)的激勵信號發(fā)送給線性預(yù)測合成單元235和帶預(yù)測單元220。
[0083]該線性預(yù)測合成單元235可以通過使用從反變換單元215發(fā)送的激勵信號和從音頻編碼器發(fā)送的線性預(yù)測系數(shù)恢復(fù)下帶信號。線性預(yù)測合成單元235可以將恢復(fù)的下帶信號發(fā)送給采樣轉(zhuǎn)換單元240和帶合成單元250。
[0084]帶預(yù)測單元220可以基于從反變換單元215接收的恢復(fù)的激勵信號值產(chǎn)生上帶預(yù)測激勵信號。
[0085]增益補(bǔ)償單元225可以基于從帶預(yù)測單元220接收的上帶預(yù)測激勵信號和從編碼器發(fā)送的補(bǔ)償增益值,關(guān)于超寬帶音頻信號補(bǔ)償有關(guān)譜的增益。
[0086]線性預(yù)測合成單元230從增益補(bǔ)償單元225接收補(bǔ)償?shù)纳蠋ьA(yù)測激勵信號值,并且可以基于從音頻編碼器接收的線性預(yù)測系數(shù)值和補(bǔ)償?shù)纳蠋ьA(yù)測激勵信號值來恢復(fù)上帶信號。
[0087]帶合成單元250可以從線性預(yù)測合成單元235接收恢復(fù)的下帶信號,并且可以從帶線性預(yù)測合成單元435接收恢復(fù)的上帶信號,從而能夠執(zhí)行對于接收的上帶信號和下帶信號的帶合成。
[0088]采樣轉(zhuǎn)換單元240可以將內(nèi)部采樣頻率值轉(zhuǎn)換回到原始采樣頻率值。
[0089]后處理濾波單元245和255可以執(zhí)行信號恢復(fù)所需的后處理。例如,后處理濾波單元245和255可以包括能夠?qū)υ陬A(yù)處理單元中的預(yù)加重濾波器執(zhí)行反濾波的去加重濾波器。后處理濾波單元245和255可以不僅執(zhí)行濾波,而且可以執(zhí)行若干后處理操作,例如,將量化誤差減到最小,或者消除波谷,同時保持頻譜的諧波峰。后處理濾波單元245可以輸出恢復(fù)的窄帶或者寬帶信號,并且后處理濾波單元255可以輸出恢復(fù)的超寬帶信號。
[0090]如上所述,在圖1和圖2中圖示的音頻編碼器是在本發(fā)明中使用的一個示例,并且可以在本發(fā)明的技術(shù)特征的范圍內(nèi)不同地應(yīng)用。
[0091]如上所述,編碼器從輸入音頻信號中提取參數(shù),量化該參數(shù),并且作為分組發(fā)送該參數(shù)。解碼器接收從編碼器發(fā)送的分組,并且基于接收的分組執(zhí)行用于恢復(fù)音頻信號的解碼。在這種情況下,從音頻信號中提取/發(fā)送并且然后接收/解碼的參數(shù)包括激勵信號、基音周期和LPC系數(shù)。由于很難量化LPC系數(shù),所以可以通過以1:1方式轉(zhuǎn)換為對應(yīng)于LPC系數(shù)的導(dǎo)抗譜對(ISP)系數(shù)來發(fā)送。
[0092]音頻信號的共振峰分量可以通過使用線性預(yù)測(LP)進(jìn)行建模。此外,殘留信號部分可以通過使用基音搜索進(jìn)行建模。在基音搜索之后剩余的殘留部分可以基于碼本通過使用激勵信號補(bǔ)償。
[0093]在給定的時間點,音頻信號可以通過先前的音頻信號的線性組合,也就是說,通過線性預(yù)測,來接近,并且在由線性預(yù)測產(chǎn)生的信號和原始信號之間的誤差可以通過使用激勵信號補(bǔ)償。
[0094]在這種情況下,在線性預(yù)測中應(yīng)用于先前的音頻采樣的增益或者系數(shù)被稱作線性預(yù)測(LP)或者線性預(yù)測編譯(LPC)系數(shù)。如上所述,對于量化,LPC系數(shù)可以被轉(zhuǎn)換為ISP系數(shù)。通過轉(zhuǎn)換LPC參數(shù)(即,LPC系數(shù))獲得ISP。例如,ISP系數(shù)可以是通過分離具有奇對稱的傳遞函數(shù)和具有偶對稱的傳遞函數(shù)而獲得的多項式的根。
[0095]除了 ISP系數(shù)之外,從LPC系數(shù)轉(zhuǎn)換的其它的系數(shù)可以在音頻信號編碼/解碼中使用。例如,除了 ISP系數(shù)之外,可以使用線性譜對(LSP)系數(shù)、導(dǎo)抗譜頻率(ISF)系數(shù)、線性譜頻率(LSF)系數(shù)等等。
[0096]類似于ISP系數(shù),LSP系數(shù)可以是通過基于LPC系數(shù)利用反向濾波功能構(gòu)成加法多項式和減法多項式創(chuàng)建的奇對稱傳遞函數(shù)和偶對稱傳遞函數(shù)的根。
[0097]LSP和ISP可以考慮到要獲得的根的數(shù)目,根據(jù)以上構(gòu)成的多項式的項的數(shù)目來區(qū)別。例如,當(dāng)10階LPC系數(shù)被轉(zhuǎn)換的時候可以使用LSP,并且當(dāng)16階LPC系數(shù)被轉(zhuǎn)換的時候可以使用ISP。
[0098]ISF系數(shù)和LSF系數(shù)是通過將ISP和LSP映射為余弦域而獲得的值。
[0099]此外,先前的音頻信號可以選擇用于每個基音周期?;綦[含例如在時間軸中周期地出現(xiàn)的峰值頻率,并且具有與音頻信號的基本頻率相同的頻率?;糁芷诳梢曰谕ㄟ^使用用于將誤差減到最小的循環(huán)搜索(即,AbS)發(fā)現(xiàn)的滯后來確定。
[0100]激勵信號可以被認(rèn)為是用于補(bǔ)償在原始音頻信號和由線性預(yù)測產(chǎn)生的音頻信號之間誤差的殘留信號。激勵信號可以通過使用碼本指定。
[0101]編碼器可以通過對其執(zhí)行量化和編碼來發(fā)送關(guān)于每個幀的LPC系數(shù)的信息(例如,用于推導(dǎo)LPC系數(shù)的ISP系數(shù)),關(guān)于基音周期的信息(例如,用于推導(dǎo)基音周期的基音滯后),關(guān)于激勵信號的信息(例如,用于推導(dǎo)激勵信號的碼本索引和碼本增益)。
[0102]解碼器可以基于從ISP系數(shù)推導(dǎo)出的LPC系數(shù)和激勵信號以及基音信息恢復(fù)音頻信號。解碼器可以基于在從編碼器接收的信息之中的碼本索引和增益產(chǎn)生激勵信號,并且可以基于基音滯后和增益產(chǎn)生基音周期。解碼器可以通過從碼本獲得基音信息、增益以及位置和符號信息產(chǎn)生激勵信號。
[0103]作為用于推導(dǎo)基音周期和激勵信號的碼本,可以使用代數(shù)碼本或者自適應(yīng)/固定碼本。自適應(yīng)碼本包括適用于每個子幀的激勵信號信息(即,激勵信號矢量),并且用于基音周期的滯后值可以從自適應(yīng)碼本的索引導(dǎo)出。固定碼本包括用于語音合成濾波的激勵矢量,并且包括在其中的內(nèi)容可以具有固定的值。[0104]解碼器也可以通過轉(zhuǎn)換ISP系數(shù)產(chǎn)生LPC系數(shù)??梢酝ㄟ^反向地應(yīng)用前面提到的用于轉(zhuǎn)換ISP的過程推導(dǎo)出LPC系數(shù)。
[0105]解碼器可以通過合成恢復(fù)的信號(例如,LPC系數(shù)、基音周期、激勵信號等等)恢
復(fù)音頻信號。
[0106]在下文中,解碼音頻信號需要的參數(shù)(例如,LPC系數(shù)或者ISP系數(shù)、基音周期、激勵信號等等)在本發(fā)明中被稱作解碼參數(shù)。
[0107]如下所述,音頻信號可以在從解碼器解碼之后經(jīng)由抖動緩存器輸出給輸出/回放設(shè)備。此外,音頻信號可以經(jīng)由抖動緩存器在從解碼器解碼之后輸出給音頻輸出/回放設(shè)備。此外,音頻信號可以在抖動緩存器和解碼器中被并行處理。當(dāng)音頻信號被并行處理的時候,該音頻信號可以在抖動緩存器中存儲/管理,并且可以在解碼器中解碼,同時抖動緩存器的存儲/管理所需要的信息,和解碼器的解碼所需要的信息可以在抖動緩存器和解碼器之間發(fā)送/接收。
[0108]圖3是示出抖動緩存器的示例性結(jié)構(gòu)的方框圖。參考圖3,抖動緩存器300可以包括接收器310、緩存器320和輸出單元330。
[0109]接收器310可以接收音頻信號。接收的音頻信號可以是語音分組或者語音幀。接收器310可以從編碼器接收音頻信號,并且可以經(jīng)由解碼器接收音頻信號。
[0110]緩存器320可以存儲和管理音頻信號。要存儲和管理的音頻信號可以是語音分組或者語音中貞。
[0111]輸出單元330可以根據(jù)回放時間輸出音頻信號。要輸出的音頻信號可以是語音分組或者語音幀。輸出單元330可以將緩存在抖動緩存器中的音頻信號輸出給解碼器,并且可以將音頻信號輸出給回放設(shè)備(即,輸出設(shè)備)。
[0112]雖然在此處為了解釋方便起見,其描述該抖動緩存器300包括三個部件,但是本發(fā)明不受限于此。因此,抖動緩存器本身可以接收、管理/處理和輸出音頻信號。
[0113]抖動緩存器是用于處置與在網(wǎng)絡(luò)上發(fā)生的數(shù)據(jù)抖動相關(guān)問題的緩存器。
[0114]抖動暗指可變的網(wǎng)絡(luò)延遲,這在當(dāng)通過編碼語音信息分組化的語音分組抵達(dá)目的地(例如,解碼器)的時候發(fā)生,并且可以在其上發(fā)送分組的網(wǎng)絡(luò)上產(chǎn)生。例如,抖動可能由于幾個原因發(fā)生,諸如在用于確定分組優(yōu)先級的路由器中排隊,和/或在LAN之間的沖突。因此,語音分組可能不以特定的間隔抵達(dá),并且抖動緩存器用于解決在這種情況下可能發(fā)生的問題。
[0115]換句話說,可以說使用抖動緩存器的一個目的是調(diào)整要輸入的數(shù)據(jù)的不規(guī)律性。
[0116]圖4是示出典型抖動緩存器的示例性實施例的示意圖。抖動緩存器的緩存器具有能夠排隊5個語音分組大小的情形在圖4中示范。
[0117]抖動緩存器可以對在緩存器(或者隊列)中的語音分組執(zhí)行排隊,并且通過使用語音分組的實時傳輸協(xié)議(RTP)頭部信息解釋用于產(chǎn)生語音分組的順序和間隔,并且可以基于該解釋在緩存器中順序地重新排序語音分組。
[0118]參考圖4,在抖動緩存器中接收的語音分組以序列100的分組(S卩,時間戳(TS) 8000)、序列101的分組(即,TS8160)、序列102的分組(即,TS8320),和序列104的分組(即,TS8640)的順序安排在緩存器(或者隊列)中的情形下,如果序列103的分組410(即,TS8480)被輸入,則抖動緩存器通過考慮分組的產(chǎn)生順序重新排序序列103的分組和序列104的分組的順序。
[0119]在抖動緩存器中的語音分組被以順序地方式從具有最高優(yōu)先級的分組420輸出。
[0120]抖動緩存器抽取或者產(chǎn)生音頻信號,并且因此可以解決由延遲接收或者丟失等等所引起的問題。此外,抖動緩存器可以通過考慮待用的音頻信號的長度減小或者增大抖動緩存器的大小。
[0121]當(dāng)不使用抖動緩存器的時候,存在很難恒定地保持音頻信號的回放時間的問題。
[0122]圖5是示出不使用抖動緩存器的示例的示意圖。參考圖5,五個語音分組PKTl至PKT5被以順序地方式在語音分組的發(fā)送側(cè)發(fā)送。
[0123]用于在發(fā)送端中發(fā)送語音分組的傳輸時間表不在傳輸時間軸510上。例如,語音分組PKTl至PKT5在相應(yīng)的傳輸時間Tsl至Ts5以時間間隔Tpkt發(fā)送。在這種情況下,時間間隔Tpkt可以是每個語音分組的回放時間。
[0124]用于在接收端中接收語音分組的接收時間表示在接收時間軸520上。例如,語音分組PKTl至PKT5在相應(yīng)的接收時間Iri至Tri上被接收。如圖示的,接收的語音分組可能受到在傳輸過程中各種延遲因素的影響,并且可能不以特定的時間間隔接收。
[0125]用于在回放端回放每個語音分組的回放時間表示在回放時間軸530上。例如,語音分組PKTl至PKT5必須在回放時間Tpl至Tp5以回放時間間隔Tpkt輸出。但是,語音分組可能不以特定的時間間隔接收。因此,如圖示的,語音分組PKT3和語音分組PKT4可能以大于回放時間Tpkt的時間間隔接收。
[0126]考慮圖5的示例,由于分組PKT4在用于在回放端回放分組PKT4的時間Tp4未接收,所以分組PKT4不能在回放端中回放,這可能導(dǎo)致聲音質(zhì)量劣化。
[0127]換句話說,在沒有使用抖動緩存器的情形下,第X個語音分組的接收時間Trii可能比回放時間Tpx更遲,這可能導(dǎo)致聲音質(zhì)量劣化。
[0128]為了解決在接收時間和回放時間之間倒置或者回放延遲/無法使用的問題,抖動緩存器排隊足夠的語音分組,并且在回放端中為定期的分組請求作準(zhǔn)備。在抖動緩存器中首先接收的語音分組,諸如圖4的分組420,可以響應(yīng)于回放請求被最先輸出。
[0129]抖動緩存器可以基于語音分組的RTP頭部信息,根據(jù)用于產(chǎn)生每個語音分組的間隔/時間來補(bǔ)償語音分組。例如,具有相同的產(chǎn)生間隔的語音分組可以被產(chǎn)生,并且在相同的時間域中語音分組的至少一個可以被抽取。因此,抖動緩存器可以將由要回放的語音分組所引起的聲音質(zhì)量劣化減到最小。
[0130]圖6是示出抖動緩存器管理的示例的示意圖。發(fā)送/接收/管理/回放五個語音分組的情形在圖6中示范。
[0131]參考圖6,用于在發(fā)送端中發(fā)送語音分組的傳輸時間表不在時間軸610上。例如,語音分組PKTl至PKT5在相應(yīng)的傳輸時間Tsl至Ts5以時間間隔Tpkt發(fā)送。在這種情況下,時間間隔Tpkt可以是每個語音分組的回放時間。
[0132]用于在接收端中接收語音分組的接收時間表示在時間軸620上。例如,語音分組PKTl至PKT5在相應(yīng)的接收時間Iri至Tri上被接收。如圖示的,接收的語音分組可能受到在傳輸過程中各種延遲因素的影響,并且可能不以特定的時間間隔接收。
[0133]與在圖5的情況下不同,語音分組被傳送給抖動緩存器。語音分組輸入給抖動緩存器的時間表示在抖動緩存器時間軸630上。例如,語音分組PKTl至PKT5在抖動緩存輸入時間L至T#被輸入給抖動緩存器。抖動緩存器可以在特定的時間期間存儲對應(yīng)的語音分組,并且此后,可以根據(jù)用于每個語音分組的回放時間將語音分組傳送給回放端。
[0134]語音分組在回放端回放的回放時間表示在回放時間軸640上。例如,語音分組PKTl至PKT5在回放時間Tpl至Tp5以回放時間Tpkt的間隔輸入。與圖5的情形相比較,在從圖5的回放時間Tpx開始經(jīng)過緩存時間L之后,第X個語音分組在回放端被回放。
[0135]參考圖6,類似于圖5,第四個語音分組TPK4在比抖動緩存輸入預(yù)測時間Tj4更遲的Irt被接收,但是在緩存時間Tj內(nèi)被接收,以便分組TPK4可以在回放時間Tp4平滑地回放。
[0136]當(dāng)在抖動緩存器中提供的緩存時間Tj很大的時候,由傳輸延遲所引起的聲音質(zhì)量劣化可以被減小,但是額外的延遲可能在抖動緩存器中出現(xiàn)。因此,聲音質(zhì)量劣化和延遲具有與值L成比例的折衷關(guān)系。
[0137]抖動緩存器需要被控制/管理以優(yōu)化在聲音質(zhì)量劣化和延遲之間的關(guān)系,并且改善回放性能。在抖動緩存器中的語音分組(或者語音幀)可以由包括在RTP頭部中的時間戳字段和序列號字段指定,并且可以在其基礎(chǔ)上處理。
[0138]時間戳字段表示語音分組被回放的時間。序列號字段將對于每個語音分組增加的編號提供給抖動緩存器(或者用于控制抖動緩存器的設(shè)備),以便語音分組被以順序地方式安排在抖動緩存器中。
[0139]經(jīng)歷排隊的語音分組被根據(jù)相應(yīng)的回放時間順序地回放。在這方面,抖動緩存器需要在兩個情形下管理,例如,抖動緩存器充滿語音分組的情形,和在抖動緩存器中的語音分組的數(shù)目小于可以由最小大小的緩存器容納的語音分組的數(shù)目的情形。
[0140]當(dāng)語音分組以減小的長時間傳輸延遲抵達(dá)的時候,或者當(dāng)在發(fā)送側(cè)的記錄單元中存在振蕩誤差(例如,如果其比給定的采樣速率更快)的時候,或者當(dāng)在接收側(cè)的回放單元中存在振蕩誤差(例如,如果其比給定的采樣速率更慢)的時候,可能發(fā)生抖動緩存器充滿語音分組,并且因此無法在緩存器中再容納語音分組的情形。在這種情況下,為了解決這個問題,抖動緩存器可以丟棄在抖動緩存器中的語音分組,或者在回放過程中壓縮音頻信號。
[0141]當(dāng)語音分組的傳輸延遲增加持續(xù)長的時間段和/或語音分組被丟失的時候,或者當(dāng)在發(fā)送側(cè)的記錄單元中存在振蕩誤差(例如,如果其比給定的采樣速率更小)的時候,或者當(dāng)在接收側(cè)的回放單元中存在振蕩誤差(例如,如果其比給定的采樣速率更快)的時候,可能發(fā)生在抖動緩存器中語音分組的數(shù)目不夠,并且因此語音分組不能平滑地回放的情形。在這種情況下,該問題可以通過產(chǎn)生語音分組或者通過擴(kuò)展音頻信號的長度解決。
[0142]圖7是示出需要抖動緩存控制的示例的示意圖。參考圖7,在發(fā)送端發(fā)送語音分組的傳輸時間表示在傳輸時間軸710上,并且在接收端接收語音分組的接收時間表示在接收時間軸720上。
[0143]語音分組被輸入給抖動緩存器的時間表示在抖動緩存器時間軸730上。此外,在回放端回放語音分組的回放時間表示在回放時間軸740上。
[0144]在圖7的示例中,分組PKT3、PKT4和ΡΚΤ5的抖動緩存輸入時間由于傳輸延遲被集中在Tj5。因此,在分組PTK3和PKT4的回放時間Tp3和Tp4,要回放的語音分組在抖動緩存器中不存在。
[0145]因此,當(dāng)根據(jù)回放時間考慮抖動緩存器的管理的時候,如上所述,存在在回放時間Tp3和Tp4在抖動緩存器中語音分組不足的問題,并且如上所述存在在回放時間Tp5由于語音分組導(dǎo)致抖動緩存器被突然充滿的問題。
[0146]在抖動緩存器或者回放端中,在抖動緩存器中最上面分組的時間戳和序列號被確認(rèn)以回放存儲在抖動緩存器中的語音分組。例如,如果序列號增加了期待的增量,則對應(yīng)的語音分組可以被回放。另一方面,如果其不是順序地增加期待的增量的序列號(例如,如果序列號沒有比先前地回放的語音分組大I),則可以認(rèn)為存在分組丟失,并且因此,可以執(zhí)行對此的補(bǔ)償?shù)倪^程。
[0147]如果確定在語音分組中存在丟失,則可以考慮產(chǎn)生用于補(bǔ)償丟失分組(或者幀)的替選信息(例如,替選語音幀或者替選語音分組)和回放產(chǎn)生的替選信息的方法。如果在抖動緩存器中沒有存儲的語音分組,則根據(jù)使用白噪聲幀的回放方法和擴(kuò)展信號長度的回放方法,可以使用對于特定的時間周期補(bǔ)償丟失分組的方法。
[0148]同時,如上所述,如果抖動緩存器的大小太小,則對于抖動緩存器來說難以充分地處理語音分組的抖動。此外,由于抖動緩存器容易充滿,變得難以輸入新的語音分組。
[0149]另一方面,如果抖動緩存器的大小太大,則抖動緩存器可能導(dǎo)致過大的回放延遲。
[0150]因此,為了實現(xiàn)沒有延遲的音頻回放,同時不劣化音頻信號的信號質(zhì)量,需要有效地調(diào)整抖動緩存器的大小或者補(bǔ)償語音信息方法。
[0151]在這種情況下,不是僅僅考慮在回放端中請求的最上面的語音分組,而是通過考慮語音分組的類型,例如基于關(guān)于在抖動緩存器中語音分組的重要性可以補(bǔ)償語音信息。
[0152]音頻信號可以由非靜默持續(xù)時間和靜默持續(xù)時間組成。語音分組是對應(yīng)于非靜默語音還是對應(yīng)于靜默語音可以通過使用編碼的語音分組的幀類型(FT)指標(biāo)表示。此外,語音分組是對應(yīng)于非靜默語音還是靜默語音可以在語音分組被解碼之后,通過使用額外的分類塊,例如,語音活動檢測(VAD)等等來表示。
[0153]通常,與非靜默持續(xù)時間的信號編輯相比,靜默持續(xù)時間的信號編輯對聲音質(zhì)量具有更少的影響。因此,在抖動緩存器中的語音分組的重要性可以通過使用這樣的特征確定。
[0154]抖動緩存器可以基于確定的語音分組的重要性執(zhí)行抖動緩沖控制。通過基于語音分組的重要性管理/控制抖動緩存器,由抖動緩存控制所引起的語音失真的頻率可以被減小,并且聲音質(zhì)量可以改善。
[0155]更具體地說,變?yōu)槎秳泳彺嫫鞴芾?控制目標(biāo)的語音分組的重要性可以通過以下的順序確定。例如,變?yōu)槎秳泳彺婀芾砟繕?biāo)的語音分組的順序可以以這樣的方式確定,即,首先變?yōu)槎秳泳彺婀芾砟繕?biāo)的語音分組被確定,然后其次變?yōu)槎秳泳彺婀芾砟繕?biāo)的語音分組被確定。
[0156]可以變?yōu)榫哂械谝粌?yōu)先級的抖動緩存控制目標(biāo)的語音分組可以是位于連續(xù)的靜默持續(xù)時間中間的語音分組。例如,在自適應(yīng)多速率寬帶(AMR-WB)的情況下,在連續(xù)的靜默持續(xù)時間中間的分組可以被確定為不連續(xù)傳輸(DTX)分組。
[0157]可以變?yōu)榫哂械诙?yōu)先級的抖動緩存控制目標(biāo)的語音分組可以是位于單靜默持續(xù)時間中的語音分組。例如,在AMR-WB的情況下,在單靜默持續(xù)時間中的分組可以被確定為SID分組。
[0158]可以變?yōu)榫哂械谌齼?yōu)先級的抖動緩存控制目標(biāo)的語音分組可以是在抖動緩存器中位于最前面位置中的語音分組。[0159]語音分組的重要性可以是要處理的目標(biāo)的相反順序。因此,具有最低的重要性的語音分組是位于連續(xù)的靜默持續(xù)時間中間的語音分組,具有第二最低的重要性的語音分組是位于單個靜默持續(xù)時間中的語音分組,并且具有第三最低的重要性的語音分組是在緩存器中位于最前面位置的語音分組。
[0160]當(dāng)控制在緩存器中的語音分組的時候,抖動緩存器可以根據(jù)分組的優(yōu)先級選擇控制目標(biāo)語音分組,即,根據(jù)以下的順序:位于連續(xù)的靜默持續(xù)時間中間的語音分組一位于單靜默持續(xù)時間中的語音分組一在抖動緩存器中位于最前面位置的語音分組。
[0161]圖8是示出當(dāng)在抖動緩存器中補(bǔ)償語音信息的時候,在抖動緩存器中確定語音幀重要性的示例性方法的示意圖。
[0162]在圖8的示例中,抖動緩存器的當(dāng)前大小810被以這樣的方式設(shè)置,S卩,直至9個語音分組可以存儲在緩存器中。參考圖8,語音分組PdpP2和P7是非靜默信號,并且語音分組P3、P4、P5、P6和P8是靜默信號。
[0163]當(dāng)抖動緩存控制的目標(biāo)根據(jù)前面提到的確定語音分組重要性方法被確定的時候,具有第一優(yōu)先級的控制目標(biāo)對應(yīng)于位于連續(xù)的靜默持續(xù)時間P3至P6中間的語音分組P4和P5O在圖8的示例中,具有第二優(yōu)先級的控制目標(biāo)對應(yīng)于單靜默分組830,即,語音分組P3、P6和匕。在圖8的示例中,具有第三優(yōu)先級的控制目標(biāo)對應(yīng)于在緩存器中位于最前面位置的分組Pq840。
[0164]在本發(fā)明中,如上所述,抖動緩存器被基于語音分組的重要性來管理。抖動緩存器可以確定在緩存器中語音分組的重要性,并且如果語音信息需要被補(bǔ)償,則從基于該重要性選擇的語音分組開始的語音分組可以被處置為抖動緩存管理的目標(biāo)。
[0165]圖9是示出包括語音幀補(bǔ)償?shù)氖纠远秳泳彺嫫鞴芾矸椒ǖ牧鞒虉D。抖動緩存管理可以包括緩沖區(qū)大小的調(diào)整和在緩存器中語音信息的補(bǔ)償,并且可以表示為抖動緩存控制。
[0166]參考圖9,抖動緩存器接收語音分組(即,語音幀)(步驟S910)??梢詮慕獯a器發(fā)送語音分組,或者可以通過使用比特流直接從編碼器發(fā)送。
[0167]抖動緩存器可以基于接收的語音分組執(zhí)行抖動緩存調(diào)整(步驟S920)。
[0168]抖動緩存調(diào)整(或者抖動緩存管理)包括緩沖區(qū)大小的調(diào)整和在緩存器中語音信息的補(bǔ)償。
[0169]緩沖區(qū)大小調(diào)整可以以這樣的方式執(zhí)行,S卩,緩沖區(qū)大小在緩存器的最大大小和最小大小之間減小或者增大。
[0170]對于語音信息的補(bǔ)償包括語音信息抽取和語音信息產(chǎn)生。語音信息可以是語音分組或者語音幀。語音幀或者語音分組的抽取也可以被認(rèn)為是對于音頻信號的補(bǔ)償。語音幀的產(chǎn)生或者語音分組的產(chǎn)生可以被認(rèn)為是音頻信號的擴(kuò)展。
[0171]通常,當(dāng)執(zhí)行語音信息補(bǔ)償?shù)臅r候,語音信息可以以語音分組為單位或者以語音幀為單位抽取或者產(chǎn)生。此外,語音信息在比特流級別或者完成恢復(fù)的音頻信號的級別被抽取/壓縮或者產(chǎn)生/擴(kuò)展。
[0172]在這方面,如果以語音分組為單位或者以語音幀為單位對于語音信息執(zhí)行補(bǔ)償,則在一個時間丟失或者產(chǎn)生的信息等于或者大于幀長度,這可能由于連續(xù)的語音信息的丟失導(dǎo)致聲音質(zhì)量劣化。因此,可以考慮以語音幀的子幀為單位對于語音信息執(zhí)行補(bǔ)償?shù)姆椒ā?br>
[0173]此外,當(dāng)在比特流級別,或者在完成恢復(fù)的音頻信號級別執(zhí)行補(bǔ)償?shù)臅r候,基本信號可能丟失,或者計算量可能增加。因此,可以考慮在解碼參數(shù)級別對于語音信息執(zhí)行補(bǔ)償?shù)姆椒?,解碼參數(shù)級別可以被認(rèn)為是在比特流級別和恢復(fù)的音頻信號的信息之間的中間區(qū)域。
[0174]在本發(fā)明中,解碼參數(shù)是在比特流被解碼然后被合成/恢復(fù)為音頻信號之前使用的信息,并且包括LPC系數(shù)或者用于推導(dǎo)LPC系數(shù)的ISP系數(shù)、基音周期、激勵信號分量、用于推導(dǎo)激勵信號分量的碼本索引等等。
[0175]圖10是示出示例性抖動緩存器調(diào)整方法的流程圖。
[0176]參考圖10,一旦接收到語音分組,抖動緩存器可以執(zhí)行抖動緩存器調(diào)整(步驟S1010)。這被稱作在語音信息接收的情況下的抖動緩存器調(diào)整或者抖動緩存器管理。
[0177]一旦接收到該語音分組,抖動緩存器可以基于當(dāng)前緩存器的狀態(tài)調(diào)整緩沖區(qū)大小。例如,如果當(dāng)前緩存器充滿,并且因此,不能容納新的語音分組,則抖動緩存器可以調(diào)整抖動緩沖區(qū)大小以確保用于容納新的語音分組的空間。
[0178]此外,抖動緩存器可以補(bǔ)償在緩存器中的語音信息。
[0179]如果存在回放請求,則抖動緩存器可以執(zhí)行抖動緩存器調(diào)整(步驟S1020)。這被稱作在回放請求的情況下的抖動緩存器調(diào)整或者抖動緩存器管理。
[0180]在回放請求的情況下,抖動緩存器可以基于當(dāng)前緩存器的狀態(tài)調(diào)整緩存器的大小。例如,如果當(dāng)前緩存器是空的,并且因此,沒有要回放的語音幀,或者如果在當(dāng)前緩存器中的語音幀的數(shù)目很少,并且因此存在回放被延遲的擔(dān)心,則抖動緩存器可以通過調(diào)整緩沖區(qū)大小減小緩存時間。
[0181 ] 此外,抖動緩存器可以補(bǔ)償在緩存器中的語音信息。
[0182]如果如圖10所示由于網(wǎng)絡(luò)問題,振蕩誤差等等產(chǎn)生抖動,則抖動緩存器可以補(bǔ)償語音信息,或者可以調(diào)整緩沖區(qū)大小,以便平滑地實現(xiàn)回放。
[0183]如上所述,在本發(fā)明中,通過利用抖動緩存管理對于語音信息的補(bǔ)償可以以子幀為單位在解碼參數(shù)級別執(zhí)行。經(jīng)由比特流發(fā)送的語音分組可以包括至少一個語音幀。
[0184]語音幀和與之相關(guān)的參數(shù)可以通過使用解析從語音分組中提取。
[0185]因此,就語音分組被分析為具有參數(shù)的語音幀或者被解碼的位置而論,基于本發(fā)明的抖動緩存器結(jié)構(gòu)可以是如下當(dāng)參考圖3的時候所述的5種結(jié)構(gòu)的任何一個。
[0186](i) 一種結(jié)構(gòu),其中基于解碼參數(shù)以這樣的方式執(zhí)行抖動緩存器管理,S卩,比特流直接從接收器310接收,抖動緩存器300或者抖動緩存器300的緩存器320解碼語音分組,并且具有解碼參數(shù)級別的信息的語音幀被存儲在緩存器320中。
[0187](ii) 一種結(jié)構(gòu),其中抖動緩存器管理基于解碼參數(shù)以這樣的方式執(zhí)行,S卩,具有解碼參數(shù)級別的信息的語音幀由接收器310從解碼器接收,并且存儲在緩存器320中。
[0188](iii) 一種結(jié)構(gòu),其中比特流(即,語音分組)直接由接收器310接收,并且存儲在緩存器320中,并且必要時,解碼器或者解碼器的某些模塊被調(diào)用以獲得具有解碼參數(shù)級別的信息的語音幀,并且執(zhí)行抖動緩存器管理。
[0189](iv) 一種結(jié)構(gòu),其中比特流(即,語音分組)直接由接收器310接收,并且存儲在緩存器320中,并且必要時,抖動緩存器300或者抖動緩存器300的緩存器從語音分組獲得具有解碼參數(shù)級別的信息的語音幀以執(zhí)行抖動緩存器管理。
[0190](V) —種結(jié)構(gòu),其中抖動緩存器300被作為解碼器的某些構(gòu)成元件包括在解碼器中,并且從語音分組獲得的語音幀在緩存器320中存儲和管理,并且根據(jù)解碼過程被輸出。
[0191]因此,在結(jié)構(gòu)⑴和(iv)中,語音信息可以以抖動緩存器一解碼器的順序傳送,并且在結(jié)構(gòu)(ii)中,語音信息可以以解碼器一抖動緩存器的順序傳送。此外,在結(jié)構(gòu)(iii)中,抖動緩存器和解碼器需要執(zhí)行并行數(shù)據(jù)處理,并且如果其在抖動緩存器和解碼器之間需要,則語音信息可以被發(fā)送和接收。
[0192]在結(jié)構(gòu)(i)和(ii)中,抖動緩存器可以存儲具有解碼參數(shù)級別的信息的語音幀,并且抖動緩存器管理可以以子幀為單位執(zhí)行。在結(jié)構(gòu)(iii)和(iv)中,抖動緩存器可以存儲語音分組,并且必要時,可以獲得具有解碼參數(shù)級別的信息的語音幀,并且以子幀為單位補(bǔ)償語首?目息。 [0193]在這方面,如果對語音幀執(zhí)行抖動緩存器管理,則確定語音分組的重要性的方法也可以應(yīng)用于語音幀。在抖動緩存器存儲和管理語音幀的情形下,可以是具有第一優(yōu)先級的抖動緩存器管理目標(biāo)的語音幀是連續(xù)的靜默語音幀,可以是具有第二優(yōu)先級的抖動緩存器管理目標(biāo)的語音幀是不連續(xù)的靜默語音幀,并且可以是具有第三優(yōu)先級的抖動緩存器管理目標(biāo)的語音幀是在抖動緩存器中位于最前面位置的語音幀。
[0194]與抖動緩存器相關(guān)的語音信息可以經(jīng)由解碼器發(fā)送給回放設(shè)備(即,輸出設(shè)備),并且可以不經(jīng)由解碼器傳送給回放設(shè)備的輸出緩存器。例如,如果抖動緩存器在緩存器中存儲需要被解碼的語音信息作為解碼參數(shù)級別的信息,則該信息可以在解碼器中解碼,并且此后,可以輸出給回放設(shè)備。
[0195]在下文中,對于單獨(dú)的情形描述抖動緩存器管理,即,在分組接收的情況下抖動緩存器調(diào)整,和在回放請求的情況下抖動緩存器調(diào)整。
[0196]在分組接收的情況下抖動緩存器調(diào)整
[0197]圖11是示出在分組接收的情況下示例性抖動緩存器調(diào)整方法的流程圖。在圖11中,對于前面提到的結(jié)構(gòu)(iii)或者(iv)描述抖動緩存器在緩存器中存儲語音分組,并且執(zhí)行抖動緩存器管理的情形。因此,為了如上所述以子幀為單位補(bǔ)償解碼參數(shù)級別的語音信息,抖動緩存器可以從解碼器獲得必需的信息,或者抖動緩存器可以從語音分組中提取該信息。
[0198]參考圖11,抖動緩存器接收語音分組(步驟S1100)。
[0199]抖動緩存器確定是否當(dāng)前緩存器充滿語音分組(步驟S1110)。
[0200]如果緩存器充滿語音分組,則抖動緩存器可以確定在緩存器中關(guān)于語音分組的重要性(步驟S1120)。如上所述,位于連續(xù)的靜默持續(xù)時間中間的語音分組具有最低的重要性,位于單靜默持續(xù)時間中的語音分組具有第二最低的重要性,并且在緩存器中位于最前面位置的語音分組具有最低的重要性。
[0201]抖動緩存器處理在當(dāng)前緩存器中的語音分組之中具有最低的重要性的分組(步驟S1130)。抖動緩存器可以抽取具有最低的重要性的語音分組。當(dāng)抽取語音分組的時候,可以設(shè)置表示這些的抽取信息(例如,表示該分組被抽取的標(biāo)記Del_flag)。該抽取信息可以在回放請求時引用,并且可以報告給抖動緩存器、解碼器或者回放設(shè)備等等對應(yīng)的語音信息不存在。[0202]如果具有低重要性的語音分組的處理是分組的抽取,則抖動緩存器可以獲得用于語音幀和子幀的解碼參數(shù),以屬于語音幀的子幀為單位在解碼參數(shù)級別執(zhí)行抽取語音信息的補(bǔ)償。用于語音幀和子幀的解碼參數(shù)可以如上所述從解碼器獲得,或者可以由抖動緩存器通過執(zhí)行解碼自主地獲得。
[0203]在處理具有低重要性的語音分組之后,抖動緩存器可以比較當(dāng)前抖動緩存器的緩存器大小和抖動緩存器的最大緩存器大小(步驟SI 140)。
[0204]如果當(dāng)前緩存器大小小于最大緩存器大小,則抖動緩存器可以提高當(dāng)前緩存器大小(步驟S1150)。如果由于緩存器充滿語音分組而需要確保在緩存器中空間,并且由于當(dāng)前緩存器大小小于最大緩存器大小,所以存在用于提高緩存器大小的空間,則抖動緩存器可以提高當(dāng)前抖動緩存器的緩存器大小。
[0205]更具體地說,抖動緩存器的緩存器大小可以根據(jù)可以存儲在緩存器中的語音分組的數(shù)目確定。抖動緩存器大小Tjit可以具有在最小抖動緩存器大小Tjmin和最大抖動緩存器大小Tjmax范圍內(nèi)的值。
[0206]抖動緩存器大小Tjit可以以作為每個語音分組的回放時間的Tpkt為單位調(diào)整。在這種情況下,通過考慮網(wǎng)絡(luò)情形等等,Tjmin和Tjmax可以以Tpkt為單位可變地設(shè)置。
[0207]例如,如果在呼叫期間的端到端延遲被設(shè)置為小于或等于Td,則最大抖動緩存器大小Tjmax滿足公式I的關(guān)系。
[0208]< 公式 1> [0209]Tjmax ^ Td - Tpkt - Tetcl
[0210]公式I中,Tetcl表示由在網(wǎng)絡(luò)上產(chǎn)生的額外的延遲因素所引起的延遲時間。例如,額外的延遲因素可以包括固定的延遲因素,諸如,后處理濾波、網(wǎng)絡(luò)中繼問題、發(fā)送端記錄單元和接收端回放單元的振蕩誤差等等,并且端到端延遲Td可以被設(shè)置為典型使用的端到端延遲,即150ms等等。
[0211]為了滿足公式I的關(guān)系而新設(shè)置的抖動緩存器的緩存器大小,即,Tjit可以由公式2表示。
[0212]〈公式2>
[0213]Tjit = Tjit+Tpkt, Tjit ^ Tjmax
[0214]在抖動緩存器的緩存器沒有充滿的情形下,抖動緩存器可以將接收的語音分組添加到緩存器(步驟S1160)。抖動緩存器的緩存器沒有充滿的情形可以是在步驟SlllO中抖動緩存器的緩存器沒有充滿的情形,在步驟S1140中抖動緩存器的當(dāng)前緩存器大小是最大大小的情形,和在步驟S1150中抖動緩存器的緩存器大小被提高的情形的任何一個。
[0215]抖動緩存器可以比較在緩存器中語音分組的序列號和時間戳編號(步驟S1170)。時間戳編號表示語音分組開始回放的時間,并且通過對抖動緩存器提供對于每個語音分組增加的編號,序列號用于在抖動緩存器中以順序地方式安排語音分組。
[0216]抖動緩存器可以在緩存器中重新排序語音分組(步驟S1180)。例如,抖動緩存器可以根據(jù)每個分組的序列號在緩存器中以順序地方式重新排序語音分組。
[0217]抖動緩存器可以基于當(dāng)前時間戳的值丟棄語音分組(步驟S1190)。例如,抖動緩存器可以確認(rèn)在抖動緩存器的緩存器中的語音分組的時間戳,并且如果存在具有當(dāng)前回放時間的先前的時間戳(例如,具有小于對應(yīng)于當(dāng)前回放時間的時間戳值的時間戳)的語音分組,則可以丟棄對應(yīng)的語音分組。
[0218]雖然在語音分組接收的情況下可以執(zhí)行的抖動緩存器調(diào)整的內(nèi)容在圖11中充分地描述,但是抖動緩存器可以充分地執(zhí)行前面提到的抖動緩存器調(diào)整,或者可以有選擇地僅僅執(zhí)行關(guān)于抖動緩存器調(diào)整的必要的操作。
[0219]此外,雖然抖動緩存器具有前面提到的結(jié)構(gòu)(iii)或者(iv)的情形在圖11中示例,但是本發(fā)明不受限于此,并且因此,也可以同樣地應(yīng)用于抖動緩存器具有結(jié)構(gòu)(i)或者
(ii)的情形。
[0220]在抖動緩存器具有結(jié)構(gòu)(i)和(ii)的情形下,抖動緩存器可以執(zhí)行不用于語音分組而是用于語音幀的步驟SllOO至S1190。在這種情況下,在步驟SllOO中,抖動緩存器接收或者獲得不是語音分組,而是具有解碼參數(shù)級別的信息的語音幀,并且將其在緩存器中存儲和管理。
[0221]在回放請求的情況下抖動緩存器調(diào)整
[0222]圖12是示出在回放請求的情況下示例性抖動緩存器調(diào)整方法的流程圖。為了解釋方便起見,抖動緩存器具有前面提到的結(jié)構(gòu)(iii)或者(iv)的情形在圖12的描述中采用為示例。因此,為了如上所述以子幀為單位補(bǔ)償解碼參數(shù)級別的語音信息,抖動緩存器可以從解碼器獲得必需的信息,或者抖動緩存器可以從語音分組中提取該信息。
[0223]參考圖12,如果存在來自回放端(即,回放設(shè)備)的回放請求,則抖動緩存器可以確定是否當(dāng)前緩存器是空的(步驟S1200)。例如,在回放請求時,抖動緩存器可以確定在緩存器中是否存在用于回放所 需要的足夠的語音分組。
[0224]如果確定緩存器是空的,則抖動緩存器可以確定當(dāng)前緩存器的大小(即,抖動緩存器的大小)是否大于最小抖動緩存器大小(步驟S1210)。
[0225]如果抖動緩存器的當(dāng)前緩存器大小大于最小抖動緩存器大小,則抖動緩存器可以減小抖動緩存器的緩存器大小(步驟S1220)。如果在緩存器中沒有語音分組,或者語音分組的數(shù)目太少,并且因此,用于在緩存器中停留的時間需要減小,則抖動緩存器可以減小當(dāng)前抖動緩存器的緩存器大小。
[0226]更具體地說,抖動緩存器大小Tjit可以具有在最小抖動緩存器大小Tjmin和最大抖動緩存器大小Tjmax范圍內(nèi)的值,并且可以以作為每個語音分組的回放時間的Tpkt為單位調(diào)整。在這種情況下,通過考慮網(wǎng)絡(luò)情形等等,Tjmin和Tjmax可以以Tpkt為單位可變地設(shè)置。
[0227]例如,由于最大抖動緩存器大小Tjmin可以被設(shè)置為大于至少作為每個語音分組的回放時間的Tpkt,所以公式3的關(guān)系滿足。
[0228]< 公式 3>
[0229]Tjmin ^ Tpkt+Tetc2
[0230]在公式3中,Tetc2表示由其它的延遲因素所引起的延遲時間。其它的延遲因素包括由于在回放端中振蕩元件的誤差產(chǎn)生的回放頻率誤差等等。
[0231]為了滿足公式3的關(guān)系而新設(shè)置的抖動緩存器的緩存器大小,即,Tjit可以由公式4表不。
[0232]< 公式 4>
[0233]Tjit = Tjit-Tpkt, Tjit ^ Tjmin[0234]同時,如果在回放請求時抖動緩存器不是空的(即,如果存在用于回放所需要的足夠的語音分組),則抖動緩存器可以確定是否在緩存器中語音分組的序列號根據(jù)語音分組被安排的順序而順序地增加,或者是否設(shè)置抽取標(biāo)記(即,Del-flag)(步驟S1230)。
[0235]通過確定是否在緩存器中的語音分組的序列號被順序地增加,或者是否Del-flag被設(shè)置,抖動緩存器可以確定是否需要補(bǔ)償語音信息。
[0236]例如,由于抖動緩存器確定是否在緩存器中的語音分組的序列號被順序地增加,所以可以通過對語音信息補(bǔ)償來確定是否需要產(chǎn)生新的語音分組。在這種情況下,如果抽取信息(即,del_flag)被設(shè)置,則抖動緩存器可以確定其中設(shè)置抽取信息的語音分組被抽取。
[0237]在序列號沒有順序地增加,或者抽取信息(即,del_flag)被設(shè)置的情形下,或者在抖動緩存器的當(dāng)前緩存器大小等于最小抖動緩存器大小,或者抖動緩存器的緩存器大小被減小的情形下,當(dāng)需要的時候,該抖動緩存器可以補(bǔ)償語音信息(步驟S1240)。
[0238]抖動緩存器可以基于語音分組的重要性產(chǎn)生語音信息。在這種情況下,為了在解碼參數(shù)級別以屬于語音幀的子幀為單位產(chǎn)生語音信息,抖動緩存器可以獲得用于語音幀和子幀的解碼參數(shù)。用于語音幀和子幀的解碼參數(shù)可以如上所述從解碼器獲得,或者可以由抖動緩存器通過執(zhí)行解碼自主地獲得。
[0239]如果序列號被順序地增加,并且抽取信息(即,del_flag)沒有被設(shè)置,則語音分組可以無需對語音信息補(bǔ)償來被解碼(步驟S1250)。語音分組可以在解碼器中被解碼。如果序列號被順序地增加,并且del_flag沒有被設(shè)置,則抖動緩存器可以將語音分組發(fā)送給解碼器。解碼器可以解碼接收的語音分組以產(chǎn)生(一個或多個)語音幀。
[0240]語音幀可以被添加到輸出設(shè)備(S卩,回放設(shè)備)的輸出緩存器(步驟S1260)。
[0241]輸出設(shè)備可以更新回放序列號,以便語音幀被順序地回放(步驟S1270)。
[0242]語音幀可以被順序地傳送給用戶(步驟S1280)。語音幀通過順序地從輸出設(shè)備傳送給用戶而被回放。
[0243]雖然在語音分組接收的情況下可以執(zhí)行的抖動緩存器調(diào)整的內(nèi)容在圖11中充分地描述,但是抖動緩存器可以完全執(zhí)行前面提到的抖動緩存器調(diào)整,或者可以有選擇地僅僅執(zhí)行關(guān)于抖動緩存器調(diào)整的必要的操作。
[0244]此外,雖然抖動緩存器具有前面提到的結(jié)構(gòu)(iii)或者(iv)的情形在圖12中示例,但是本發(fā)明不受限于此,并且因此,也可以同樣地應(yīng)用于抖動緩存器具有結(jié)構(gòu)(i)或者
(ii)的情形。
[0245]在抖動緩存器具有結(jié)構(gòu)(i)和(ii)的情形下,抖動緩存器可以執(zhí)行不用于語音分組而是用于語音幀的步驟S1200至S1280。在這種情況下,由于抖動緩存器存儲和管理在緩存器中的語音幀,所以抖動緩存器管理可以通過使用屬于語音幀的子幀和在其上的解碼參數(shù)來執(zhí)行。例如,在解碼步驟中,用于以語音幀為單位恢復(fù)音頻信號的解碼可以通過使用解碼參數(shù)來執(zhí)行。
[0246]在下文中,詳細(xì)描述可應(yīng)用于語音分組接收的情況下的抖動緩存器調(diào)整和回放請求的情況下的抖動緩存器調(diào)整的語音信息補(bǔ)償方法。
[0247]如上所述,對于語音信息的補(bǔ)償包括語音信息抽取和語音信息產(chǎn)生。參考圖11和圖12,語音信息的抽取可以應(yīng)用于在語音分組接收的情況下的抖動緩存器調(diào)整(例如,步驟S1130),并且語音信息的產(chǎn)生可以應(yīng)用于在回放請求的情況下的抖動緩存器調(diào)整(例如,步驟S1240)。
[0248]作為管理抖動緩存器的方法,除了解碼參數(shù)級別之外,語音信息的處理還可以在比特流級別以常規(guī)的方式執(zhí)行,并且也可以在音頻信號級別執(zhí)行。
[0249]圖13是示出在比特流級別執(zhí)行抖動緩存器管理示例的示意圖。在圖13的示例中,抖動緩存器管理以抽取語音幀這樣的方式執(zhí)行。
[0250]如果緩存器充滿,則抖動緩存器可以確定要從比特流抽取的幀,并且可以抽取選擇的幀。參考圖13,如果抽取第η個語音幀,則抖動緩存器管理通過從比特流桶中抽取第η個幀來執(zhí)行。
[0251]在圖13的情況下,由于抖動緩存器以語音幀為單位處理信息,所以其可以位于解碼器的輸出端,并且因此,可以接收由解碼器解碼的語音信息,并且存儲/管理該信息。
[0252]圖14是示出在音頻信號級別執(zhí)行抖動緩存器管理示例的示意圖。在圖14的示例中,抖動緩存器管理通過降低音頻信號的長度來執(zhí)行。
[0253]如果緩存器充滿,則抖動緩存器可以將比特流恢復(fù)為音頻信號,并且可以通過應(yīng)用時間縮放修改(TSM)技術(shù)減小音頻信號的長度。參考圖14,在抖動緩存器管理之后,第(η-1)個語音幀、第η個語音幀,和第(η+1)個語音幀的總長度減小了語音幀長度,同時保持音頻信號的總體樣式。
[0254]在圖14的情況下,由于抖動緩存器處理音頻信號,其可以位于解碼器的輸出端,并且因此,可以接收由解碼器解碼的語音信息,并且存儲/管理該信息。
[0255]同時,當(dāng)抖動緩存器管理如圖13的示例所示通過在比特流級別以幀為單位抽取語音信息執(zhí)行的時候,雖然抖動緩存器可以通過使用簡單算術(shù)操作來調(diào)整,但是由于對應(yīng)于一個語音巾貞的語音信息(或者音頻信號)在某時被抽取,所以聲音質(zhì)量顯著地劣化。
[0256]此外,當(dāng)抖動緩存器管理如圖14的示例所示在音頻信號級別執(zhí)行的時候,由于存在提高音頻回放速度的效果,雖然與在比特流級別執(zhí)行抖動緩存器管理的情形相比,可能丟失更少的音頻信息,但是編碼器/解碼器的復(fù)雜度增加。
[0257]因此,根據(jù)本發(fā)明,如上所述抖動緩存器管理在解碼參數(shù)級別以語音幀的子幀為單位執(zhí)行,從而能夠避免聲音質(zhì)量劣化,并且降低處理的復(fù)雜度。
[0258]當(dāng)根據(jù)本發(fā)明抖動緩存器被在解碼參數(shù)級別以屬于語音幀的子幀為單位管理的時候,與抖動緩存器位于解碼器的輸出端中的圖13和圖14的示例不同,抖動緩存器可以將信息輸出給解碼器,或者如上所述可以在結(jié)構(gòu)(i)至(V)中從解碼器接收信息。
[0259]圖15是示出以語音幀的子幀為單位補(bǔ)償語音信息示例的示意圖。
[0260]如上所述,如果在執(zhí)行抖動緩存器管理的過程中音頻信號被以語音幀為單位抽取,則由于在某時丟失的音頻信號與語音幀的長度相同,所以聲音質(zhì)量劣化變得顯著。
[0261]在圖15的示例中,音頻信號被以子幀為單位抽取,以降低連續(xù)丟失的音頻信號的分量。
[0262]參考圖15,與圖13和圖14的情形相比較,要抽取的音頻信號與一個幀是相同的。但是,在圖15的示例中,音頻信號可以以相鄰幀的子幀以要抽取的語音幀的子幀替換這樣的方式抽取。
[0263]在本發(fā)明中,用于表示幀或者分組的η-1、η和η+1是用于表示連續(xù)的語音幀或者連續(xù)的語音分組的索引。第η個的幀是在整個幀序列中作為抽取目標(biāo)幀的任何的第η個的幀,并且第(η-1)個幀和第(η+1)個幀是位于抽取目標(biāo)(或者刪除的)幀前和后的相鄰幀。
[0264]在圖15的示例中,第η個幀的第一子幀SI替換第(η_1)個幀的第三子幀S3,第η個幀的第二子幀S2替換第(η-1)個幀的第四子幀S4,第η個幀的第三子幀S3替換第(η+1)個幀的第一子幀SI,且第η個幀的第四子幀S4替換第(η+1)個幀的第二子幀S3。
[0265]因此,第η個語音幀被抽取,并且第(η-1)個語音幀的第三子幀S3’和第四子幀S4’以及第(η+1)個語音幀的第一子幀SI’和第二子幀S2’被新產(chǎn)生。
[0266]當(dāng)音頻信號被以子幀為單位抽取的時候,如圖示的,由于某些子幀被從目標(biāo)語音幀的相鄰語音幀抽取,所以集中在一個幀上丟失的音頻信號的效果可以由相鄰幀分擔(dān)。因此,連續(xù)地丟失的音頻信號的分量可以被降低,并且同時,能夠避免在抖動緩存器管理中伴隨的額外的計算(即,在復(fù)雜度方面增加)的發(fā)生。
[0267]雖然語音幀由四個子幀組成的情形被描述為在圖15中的示例,但是本發(fā)明不受限于此。例如,如果語音幀由L個子幀組成,則抽取目標(biāo)幀(S卩,第η個幀)的先前幀(即,第(η-1)個幀)的后L/2個子幀可以以抽取目標(biāo)幀(即,第η個幀)的前L/2個子幀替換,并且抽取目標(biāo)幀(即,第η個幀)的下一個幀(即,第(η+1)個幀)的前L/2個子幀可以以抽取目標(biāo)幀(即,第η個幀)的后L/2個子幀替換。
[0268]同時,當(dāng)語音信息在比特流級別被補(bǔ)償?shù)臅r候,即使語音信息被以子幀為單位抽取,對應(yīng)的子幀的分量直接消失,這可能導(dǎo)致特定的級別的聲音質(zhì)量劣化。如果語音信息在音頻信號級別補(bǔ)償以避免這些,則計算量可能顯著地提高。
[0269]因此,雖然以子幀為單位對于語音信息補(bǔ)償,但是可以允許語音信息在解碼參數(shù)級別被補(bǔ)償,解碼參數(shù)級別可以被認(rèn)為是比特流級別信息和恢復(fù)的音頻信號的中間級別。在此處,解碼參數(shù)隱含在比特流被解碼然后被合成為音頻信號之前使用的信息。
[0270]解碼參數(shù)的示例包括LPC系數(shù)或者用于推導(dǎo)LPC系數(shù)的ISP系數(shù)、、基音周期、激勵信號分量、用于推導(dǎo)激勵信號分量的碼本索引等等。
[0271]抖動緩存器可以通過使用相鄰幀或者相鄰幀的解碼參數(shù)來補(bǔ)償語音信息,而不是簡單地抽取目標(biāo)幀或者目標(biāo)子幀及其解碼參數(shù)。在這種情況下,抽取目標(biāo)子幀的解碼參數(shù)可用于補(bǔ)償語音信息。
[0272]當(dāng)接收到語音分組的時候,抖動緩存器可以根據(jù)前面提到的分組重要性(S卩,幀重要性)確定抽取目標(biāo)幀,并且可以執(zhí)行關(guān)于語音信息抽取的以下的三個語音信息補(bǔ)償操作的任何一個。
[0273](I)抖動緩存器抽取抽取目標(biāo)幀,同時通過使用抽取目標(biāo)幀的解碼參數(shù),修改屬于位于抽取目標(biāo)幀前和后的幀的子幀的解碼參數(shù)。
[0274](2)抽取目標(biāo)幀被抽取,同時通過使用抽取目標(biāo)幀的解碼參數(shù),修改屬于位于抽取目標(biāo)幀之前的幀的子幀的解碼參數(shù)。
[0275](3)抽取目標(biāo)幀被抽取,同時通過使用抽取目標(biāo)幀的解碼參數(shù),修改屬于位于抽取目標(biāo)幀之后的幀的子幀的解碼參數(shù)。
[0276]圖16是示出在解碼參數(shù)級別以子幀為單位補(bǔ)償語音信息的示例性方法的示意圖。
[0277]在圖16的示例中,描述前面提到的操作(I)的語音信息補(bǔ)償方法。因此,通過使用兩個相鄰子幀的解碼參數(shù)修改用于在要抽取的幀(即,第η個幀)之前/之后的幀中的某些子幀的解碼參數(shù)。
[0278]參考圖16,如果第η個語音幀被抽取,則作為相鄰語音幀的第(η_1)個語音幀和第(η+1)個語音幀的幀分量(即,解碼參數(shù))被修改。
[0279]通過補(bǔ)償語音信息,第η個幀被抽取,第(η-1)個幀的子幀S3’的解碼參數(shù)通過使用在語音信息補(bǔ)償之前第(η-1)個幀的子幀S3和S4的解碼參數(shù)來修改,第(η-1)個幀的子幀S4’的解碼參數(shù)通過使用在被抽取之前第η個幀的子幀SI和S2的解碼參數(shù)來修改,第(η+1)個幀的子幀SI’的解碼參數(shù)通過使用在被抽取之前第η個幀的子幀S3和S4的解碼參數(shù)來修改,以及第(η+1)個幀的子幀S2’的解碼參數(shù)通過使用在語音信息補(bǔ)償之前第(η+1)個幀的子幀SI和S2的解碼參數(shù)來修改。
[0280]在這種情況下,解碼參數(shù)可以被修改為通過內(nèi)插兩個子幀的解碼參數(shù)而產(chǎn)生的值。
[0281]公式5示出根據(jù)圖16的示例通過補(bǔ)償語音信息(或者通過抽取語音信息),將在解碼參數(shù)之中的ISP系數(shù)修改為通過內(nèi)插兩個子幀的ISP系數(shù)而產(chǎn)生的值的方法。
[0282]< 公式 5>
[0283]ISPrTlni3 = 0.5x ISPrTl3+0.5x ISPrTl4
[0284]ISPrTlni4 = 0.5x ISPn^0.5x ISPn2
[0285]ISPn+Iml = 0.5x ISPn3+0.5x ISPn4
[0286]ISPn+Im2 = 0.5x ISPn+I^0.5x ISPn+I2
[0287]在本發(fā)明中,ISPNl表示屬于第N個幀的第L個子幀的ISP系數(shù),并且ISPNni表示屬于第N個幀的第L個子幀的修改的ISP系數(shù)。
[0288]ISP系數(shù)可以如上所述通過從LPC系數(shù)轉(zhuǎn)換推導(dǎo)出,并且LPC系數(shù)可以通過從ISP系數(shù)轉(zhuǎn)換推導(dǎo)出。
[0289]公式6示出根據(jù)圖16的示例通過補(bǔ)償語音信息(或者通過抽取聲音信息),將在解碼參數(shù)之中的基音周期修改為通過內(nèi)插兩個子幀的基音周期而產(chǎn)生的值的方法。
[0290]< 公式 6>
[0291]Prflm3 = 0.5x Prfl3+0.5x PrTl4
[0292]Prflm4 = 0.5x Pnj0.5x Pn2
[0293]Pn+Iml = 0.5x Pn3+0.5x Pn4
[0294]Pn+Im2 = 0.5x Pn+1^+0.5x Pn+I2
[0295]在本發(fā)明中,PNl表不屬于第N個幀的第L個子幀的基音周期,并且ΡΝΛ表不屬于第N個幀的第L個子幀的修改的基音周期。
[0296]基音周期可以通過解碼長期預(yù)測(LTP)濾波、基音延遲(滯后)、碼本增益等等獲得。
[0297] 公式7示出根據(jù)圖16的示例通過補(bǔ)償語音信息(或者通過抽取語音信息),將在解碼參數(shù)之中的激勵信號分量(即,F(xiàn)CB)修改為通過內(nèi)插兩個子幀的激勵信號分量而產(chǎn)生的值的方法。
[0298]< 公式 7>
[0299]FCBrTlm3 (k) = 0.5x FCBrf I3 (k)+0.5x FCBrTl4 (k)[0300]FCBrTlni4 (k) = 0.5x FCBn1 (k) +0.5x FCBn2 (k)
[0301]FCBn+Iml (k) = 0.5x FCBn3 (k) +0.5x FCBn4 (k)
[0302]FCBn+Im2 (k) = 0.5x FCBn+I1 (k) +0.5x FCBn+I2 (k)
[0303]在本發(fā)明中,F(xiàn)CB^⑷表示在屬于第N個幀的第L個子幀的激勵信號中的第K個分量,并且FCBNni(K)表示屬于第N個幀的第L個子幀的激勵信號的修改的第K個分量。
[0304]激勵信號可以通過解碼固定碼本和碼本增益獲得。
[0305]同時,在激勵信號的情況下,代替通過使用內(nèi)插被修改,能夠應(yīng)用在要修改的子幀的激勵信號分量之中的前半分量和后半分量分別地替換為修改之前的子幀的激勵信號分量的方法。
[0306]公式8示出根據(jù)圖16的示例通過補(bǔ)償語音信息(或者通過抽取語音信息),將激勵信號分量修改為通過部分地替換兩個子幀的激勵信號分量而產(chǎn)生的值的方法。
[0307]< 公式 8>
[0308]FCBrTlm3 (k) =FCBrf I3 (k) (k = O ~子幀/2) [0309]=FCBrf I4 (k) (k =子幀/2 ~子中貞)
[0310]FCBrTlm4 (k) = FCBn1 (k) (k = O ~子中貞 /2)
[0311]= FCBn2 (k) (k =子幀/2~子中貞)
[0312]FCBn+Iml (k) = FCBn3 (k) (k = O ~子中貞 /2)
[0313]= FCBn4 (k) (k =子幀/2~子中貞)
[0314]FCBn+Im2 (k) = FCBn+I1 (k) (k = O ~子幀 /2)
[0315]= FCBn+I2 (k) (k =子幀/2 ~子中貞)
[0316]根據(jù)公式8,通過補(bǔ)償語音信息抽取第η個幀,但是,其前一半以屬于第(η-1)個幀的第三子幀S3的第K個激動信號分量替換,并且其后一半以屬于第(η-1)個幀的第四子幀S4的第K個激動信號分量替換,從而產(chǎn)生具有修改的解碼參數(shù)的第(η-1)個幀的第三子幀S3,。
[0317]以同樣的方式,如公式8所示,可以獲得具有修改的解碼參數(shù)的第(η-1)個幀的第四子幀S4’、具有修改的解碼參數(shù)的第(η+1)個幀的第一子幀SI’,和具有修改的解碼參數(shù)的第(η+1)個幀的第二子幀S2’。
[0318]此外,在解碼參數(shù)之中,在激勵信號分量的情況下,可以應(yīng)用要修改的子幀的激勵信號分量以用于產(chǎn)生激勵信號的軌跡為單位替換的方法。
[0319]公式9示出根據(jù)圖16的示例通過補(bǔ)償語音信息(或者通過抽取語音信息),將激勵信號分量修改為通過以用于產(chǎn)生激勵信號分量的軌跡為單位替換而產(chǎn)生的值的方法。
[0320]< 公式 9>
[0321 ] FCBrTlni3 (k) = FCBrTl3 (k)(軌跡 1&3) +FCBrTl4 (k)(軌跡 2&4)
[0322]FCBrTlni4 (k) = FCBn1 (k)(軌跡 1&3) +FCBn2 (k)(軌跡 2&4)
[0323]FCBn+Iml (k) = FCBn3 (k)(軌跡 1&3) +FCBn4 (k)(軌跡 2&4)
[0324]FCBn+Im2 (k) = FCBn+I1 (k)(軌跡 1&3) +FCBn+I2 (k)(軌跡 2&4)
[0325]要修改的子幀的激勵信號分量由在修改(即,補(bǔ)償語音信息)之前的兩個子幀的激勵信號分量的部分和組成。在這種情況下,對于波數(shù)k所屬于的每個軌跡,要修改的子幀的激勵信號分量選擇在對應(yīng)的軌跡上的激勵信號值。[0326]雖然語音幀由四個子幀組成的情形在圖16中示例,但是本發(fā)明不受限于此。例如,如果語音幀由L個子幀組成,則抽取目標(biāo)幀(B卩,第η個幀)的先前幀(即,第(η-1)個幀)的后L/2個子幀,和抽取目標(biāo)幀(即,第η個幀)的下一個幀(即,第(η+1)個幀)的前L/2個子幀如上所述通過使用抽取目標(biāo)幀(即,第η個幀)的子幀,和抽取目標(biāo)幀(即,第η個)的先前幀(即,第(η-1)個幀)的后L/2個子幀,以及抽取目標(biāo)幀(即,第η個幀)的下一個幀(即,第(η+1)個幀)的前L/2個子幀修改,然后可以抽取該目標(biāo)幀(即,第η個幀)。
[0327]在這種情況下,參考公式5至7描述的內(nèi)插也可以通過使用P個子幀(即,子幀的解碼參數(shù))(這里2 < P < L)來執(zhí)行。在這種情況下,內(nèi)插的濾波系數(shù)(即,平滑比)可以根據(jù)在內(nèi)插中使用的子幀的數(shù)目(即,子幀的解碼參數(shù))來確定,而不是確定為對于應(yīng)用兩個子幀的情形使用的0.5。例如,如果使用P個子幀,平滑比可以確定為1/ρ。
[0328]圖17是示出在解碼參數(shù)級別以子幀為單位補(bǔ)償語音信息的另一個示例性方法的示意圖。
[0329]操作(2)的語音信息補(bǔ)償方法的情形在圖17中示例。因此,用于在要抽取的幀(即,第η個幀)的下一個幀中的子幀的解碼參數(shù)可以通過使用在屬于要抽取的幀的下一個幀的子幀之中的兩個相鄰子幀的解碼參數(shù)修改。
[0330]解碼參數(shù)可以被修改為通過內(nèi)插兩個子幀的解碼參數(shù)而產(chǎn)生的值。
[0331]公式10示出根據(jù)圖17的示例通過補(bǔ)償語音信息(或者通過抽取語音信息),內(nèi)插和修改在解碼參數(shù)之中的ISP系數(shù)的方法。
[0332]< 公式 10>
[0333]ISPn+Iml = 0.5x ISPn^0.5x ISPn2
[0334]ISPn+Im2 = 0.5x ISPn3+0.5x ISPn4
[0335]ISPn+Im3 = 0.5x ISPn+I^0.5x ISPn+I2
[0336]ISPn+Im4 = 0.5x ISPn+l3+0.5x ISPn+I4
[0337]與公式5 —樣應(yīng)用公式10,并且差別僅僅是要修改的解碼參數(shù)所屬于的子幀和要使用的解碼參數(shù)所屬于的子幀不同于公式5的子幀。
[0338]公式11示出根據(jù)圖17的示例通過補(bǔ)償語音信息(或者通過抽取語音信息),經(jīng)由內(nèi)插修改在解碼參數(shù)之中的基音周期的方法。
[0339]〈公式11>
[0340]Pn+Iml = 0.5x Pnj0.5x Pn2
[0341]Pn+Im2 = 0.5x Pn3+0.5x Pn4
[0342]Pn+Im3 = 0.5x Pn+Ij0.5x Pn+I2
[0343]Pn+Im4 = 0.5x Pn+l3+0.5x Pn+I4
[0344]與公式6 —樣應(yīng)用公式11,并且差別僅僅是要修改的解碼參數(shù)所屬于的子幀和要使用的解碼參數(shù)所屬于的子幀不同于公式6的子幀。
[0345]公式12示出根據(jù)圖17的示例通過補(bǔ)償語音信息(或者通過抽取語音信息),經(jīng)由內(nèi)插修改在解碼參數(shù)之中的激勵信號分量(即,F(xiàn)CB)的方法。 [0346]< 公式 12>
[0347]FCBn+Iml = 0.5x FCBn^0.5x FCBn2[0348]FCBn+Im2 = 0.5x FCBn3+0.5x FCBn4
[0349]FCBn+Im3 = 0.5x FCBn+I J0.5x FCBn+I2
[0350]FCBn+Im4 = 0.5x FCBn+l3+0.5x FCBn+I4
[0351]與公式7 —樣應(yīng)用公式12,并且差別僅僅是要修改的解碼參數(shù)所屬于的子幀和要使用的解碼參數(shù)所屬于的子幀不同于公式7的子幀。
[0352]如圖16的示例所示,在激勵信號的情況下,能夠應(yīng)用在要修改的子幀的激勵信號分量之中的前一半分量和后一半分量分別地以修改之前的子幀的激勵信號分量替換的方法。
[0353]公式13示出根據(jù)圖17的示例通過補(bǔ)償語音信息(或者通過抽取語音信息),將激勵信號分量修改為通過部分地替換兩個子幀的激勵信號分量而產(chǎn)生的值的方法。
[0354]< 公式 13>
[0355]FCBn+Iml (k) = FCBn1 (k) (k = O ?子幀 /2)
[0356]= FCBn2 (k) (k =子巾貞/2?子中貞)
[0357]FCBn+Im2 (k) = FCBn3 (k) (k = O ?子巾貞 /2)
[0358]= FCBn4 (k) (k =子巾貞/2?子中貞)
[0359]FCBn+Im3 (k) = FCBn+I1 (k) (k = O ?子巾貞/2)
[0360]= FCBn+I2 (k) (k =子中貞/2 ?子中貞)
[0361]FCBn+Im4 (k) = FCBn+I3 (k) (k = O ?子中貞/2)
[0362]= FCBn+I4 (k) (k =子巾貞/2 ?子中貞)
[0363]與公式8 一樣應(yīng)用公式13,并且差別僅僅是要修改的解碼參數(shù)所屬于的子幀和要使用的解碼參數(shù)所屬于的子幀不同于公式8的子幀。
[0364]此外,在解碼參數(shù)之中,在激勵信號分量的情況下,可以應(yīng)用要修改的子幀的激勵信號分量以用于產(chǎn)生激勵信號的軌跡為單位替換的方法。
[0365]公式14示出根據(jù)圖17的示例通過補(bǔ)償語音信息(或者通過抽取語音信息),將激勵信號分量修改為通過以用于產(chǎn)生激勵信號分量的軌跡為單位替換而產(chǎn)生的值的方法。
[0366]< 公式 14>
[0367]FCBn+Iml (k) = FCBn1 (k)(軌跡 1&3) +FCBn2 (k)(軌跡 2&4)
[0368]FCBn+Im2 (k) = FCBn3 (k)(軌跡 1&3) +FCBn4 (k)(軌跡 2&4)
[0369]FCBn+Im3 (k) = FCBn+I1 (k)(軌跡 1&3) +FCBn+I2 (k)(軌跡 2&4)
[0370]FCBn+Im4 (k) = FCBn+I3 ⑵(軌跡 1&3) +FCBn+I4 (k)(軌跡 2&4)
[0371]與公式9 一樣應(yīng)用公式14,并且差別僅僅是要修改的解碼參數(shù)所屬于的子幀和要使用的解碼參數(shù)所屬于的子幀不同于公式9的子幀。
[0372]雖然語音幀由四個子幀組成的情形被描述為在圖17中的示例,但是本發(fā)明不受限于此。例如,如果語音幀由L個子幀組成,則抽取目標(biāo)幀(即,第η個幀)的下一個幀(即,第(η+1)個幀)的子幀如上所述通過使用抽取目標(biāo)幀(即,第η個幀)的子幀,和抽取目標(biāo)幀(即,第η個幀)的下一個幀(即,第(η+1)個幀)的子幀修改,然后可以抽取該目標(biāo)幀(即,第η個幀)ο
[0373]在這種情況下,參考公式10至12描述的內(nèi)插也可以通過使用P個子幀(即,子幀的解碼參數(shù))(這里2 < P < L)來執(zhí)行。在這種情況下,內(nèi)插的濾波系數(shù)(即,平滑比)可以根據(jù)在內(nèi)插中使用的子幀的數(shù)目(即,子幀的解碼參數(shù))確定,而不是確定為對于應(yīng)用兩個子幀的情形使用的0.5。例如,如果使用P個子幀,則平滑比可以確定為1/ρ。
[0374]圖18是示出在解碼參數(shù)級別以子幀為單位補(bǔ)償語音信息的另一個示例性方法的示意圖。
[0375] 操作(3)的抖動緩存器調(diào)整方法的情形在圖18中示例。因此,用于屬于要抽取的幀(即,第η個幀)的先前幀的子幀的解碼參數(shù)可以通過使用在屬于要抽取的幀和先前幀的子幀之中的兩個相鄰子幀的解碼參數(shù)被修改。
[0376]解碼參數(shù)可以被修改為通過內(nèi)插兩個子幀的解碼參數(shù)而產(chǎn)生的值。
[0377]公式15示出根據(jù)圖18的示例通過補(bǔ)償語音信息(或者通過抽取語音信息),內(nèi)插和修改在解碼參數(shù)之中的ISP系數(shù)的方法。
[0378]< 公式 15>
[0379]ISPrTlnil = 0.5x ISPrTlj0.5x ISPrTl2
[0380]ISPrTlni2 = 0.5x ISPrTl3+0.5x ISPrTl4
[0381]ISPrTlni3 = 0.5x ISPn^0.5x ISPn2
[0382]ISPrTlni4 = 0.5x ISPn3+0.5x ISPn4
[0383]與公式5 —樣應(yīng)用公式15,并且差別僅僅是要修改的解碼參數(shù)所屬于的子幀和要使用的解碼參數(shù)所屬于的子幀不同于公式5的子幀。
[0384]公式16示出根據(jù)圖18的示例通過補(bǔ)償語音信息(或者通過抽取語音信息),經(jīng)由內(nèi)插修改在解碼參數(shù)之中的基音周期的方法。
[0385]< 公式 16>
[0386]Prflml = 0.5x PrTlj0.5x Prfl2
[0387]Prflm2 = 0.5x Prfl3+0.5x PrTl4
[0388]Prflm3 = 0.5x Pnj0.5x Pn2
[0389]Prflm4 = 0.5x Pn3+0.5x Pn4
[0390]與公式6 —樣應(yīng)用公式16,并且差別僅僅是要修改的解碼參數(shù)所屬于的子幀和要使用的解碼參數(shù)所屬于的子幀不同于公式6的子幀。
[0391]公式17示出根據(jù)圖17的示例通過補(bǔ)償語音信息(或者通過抽取語音信息),經(jīng)由內(nèi)插修改在解碼參數(shù)之中的激勵信號分量(即,F(xiàn)CB)的方法。
[0392]< 公式 17>
[0393]FCBrTlnil = 0.5x FCBrTl!+0.5x FCBrTl2
[0394]FCBrTlni2 = 0.5x FCBrTl3+0.5x FCBrTl4
[0395]FCBrTlm3 = 0.5x FCBr^+0.5x FCBn2
[0396]FCBrTlm4 = 0.5x FCBn3+0.5x FCBn4
[0397]與公式7 —樣應(yīng)用公式17,并且差別僅僅是要修改的解碼參數(shù)所屬于的子幀和要使用的解碼參數(shù)所屬于的子幀不同于公式7的子幀。
[0398]如圖16的示例所示,在激勵信號的情況下,能夠應(yīng)用在要修改的子幀的激勵信號分量之中的前一半分量和后一半分量分別地以修改之前的子幀的激勵信號分量替換的方法。
[0399]公式18示出根據(jù)圖18的示例通過補(bǔ)償語音信息(或者通過抽取語音信息),將激勵信號分量修改為通過部分地替換兩個子幀的激勵信號分量而產(chǎn)生的值的方法。
[0400]< 公式 18>
[0401]FCBrTlnil (k) = FCBrTl1 (k) (k = O ?子幀 /2)
[0402]=FCBrf I2 (k) (k =子巾貞/2 ?子中貞)
[0403]FCBrTIm2 (k) =FCBrf I3 (k) (k = O ?子中貞/2)
[0404]=FCBrf I4 (k) (k =子巾貞/2 ?子中貞)
[0405]FCBrTlni3 (k) = FCBn1 (k) (k = O ?子幀 /2)
[0406]= FCBn2 (k) (k =子巾貞/2?子中貞)
[0407]FCBrTlni4 (k) = FCBn3 (k) (k = O ?子幀 /2)
[0408]= FCBn4 (k) (k =子巾貞/2?子中貞)
[0409]與公式8 一樣應(yīng)用公式18,并且差別僅僅是要修改的解碼參數(shù)所屬于的子幀和要使用的解碼參數(shù)所屬于的子幀不同于公式8的子幀。
[0410]此外,在解碼參數(shù)之中,在激勵信號分量的情況下,可以應(yīng)用要修改的子幀的激勵信號分量以用于產(chǎn)生激勵信號的軌跡為單位替換的方法。
[0411]公式19示出根據(jù)圖18的示例通過補(bǔ)償語音信息(或者通過抽取語音信息),將激勵信號分量修改為通過以用于產(chǎn)生激勵信號分量的軌跡為單位替換而產(chǎn)生的值的方法。
[0412]〈公式19>
[0413]FCBrTlnil (k) = FCBrTl1 (k)(軌跡 1&3) +FCBrTl2 (k)(軌跡 2&4)
[0414]FCBrTlni2 (k) = FCBrTl3 (k)(軌跡 1&3) +FCBrTl4 (k)(軌跡 2&4)
[0415]FCBnm3 (k) = FCBn1 (k)(軌跡 1&3) +FCBn2 (k)(軌跡 2&4)
[0416]FCBnm4 (k) = FCBn3 (k)(軌跡 1&3) +FCBn4 (k)(軌跡 2&4)
[0417]與公式9 一樣應(yīng)用公式19,并且差別僅僅是要修改的解碼參數(shù)所屬于的子幀和要使用的解碼參數(shù)所屬于的子幀不同于公式9的子幀。
[0418]雖然語音幀由四個子幀組成的情形被描述為在圖18中的示例,但是本發(fā)明不受限于此。例如,如果語音幀由L個子幀組成,則抽取目標(biāo)幀(S卩,第η個幀)的先前幀(即,第(η-1)個幀)的子幀如上所述通過使用抽取目標(biāo)幀(即,第η個幀)的子幀,和抽取目標(biāo)幀(即,第η個幀)的下一個幀(S卩,第(η-1)個幀)的子幀修改,然后可以抽取該目標(biāo)幀(即,第η個幀)。
[0419]在這種情況下,參考公式15至17描述的內(nèi)插也可以通過使用P個子幀(即,子幀的解碼參數(shù))(這里2 < P < L)來執(zhí)行。在這種情況下,內(nèi)插的濾波系數(shù)(即,平滑比)可以根據(jù)在內(nèi)插中使用的子幀的數(shù)目(即,子幀的解碼參數(shù))確定,而不是確定為對于應(yīng)用兩個子幀的情形使用的0.5。例如,如果使用P個子幀,則平滑比可以確定為1/ρ。
[0420]同時,當(dāng)接收到回放請求的時候,抖動緩存器可以執(zhí)行關(guān)于語音信息產(chǎn)生的以下四個語音信息補(bǔ)償操作的任何一個。
[0421](A)子幀被以幀為單位產(chǎn)生以擴(kuò)展音頻信號,同時通過使用屬于兩個相鄰幀之中后一幀的子幀的解碼參數(shù),和屬于其前一幀的某些子幀的解碼參數(shù),產(chǎn)生新的子幀的解碼參數(shù)。
[0422](B)子幀被以幀為單位產(chǎn)生以擴(kuò)展音頻信號,同時通過使用屬于兩個相鄰幀之中前一幀的子幀的解碼參數(shù),和屬于其后一幀的某些子幀的解碼參數(shù),產(chǎn)生新的子幀的解碼參數(shù)。
[0423](C)子幀被以幀為單位產(chǎn)生以擴(kuò)展音頻信號,同時通過使用屬于兩個相鄰幀之中前一幀的某些子幀的解碼參數(shù),和屬于其后一幀的某些子幀的解碼參數(shù),產(chǎn)生新的子幀的解碼參數(shù)。
[0424](D)子幀被以幀為單位產(chǎn)生以擴(kuò)展音頻信號,同時通過使用屬于兩個相鄰幀之中前一幀的子幀的解碼參數(shù),和屬于其后一幀的子幀的解碼參數(shù),產(chǎn)生新的子幀的解碼參數(shù)。
[0425]在以上操作(A)至(D)的語音信息補(bǔ)償中,新的子幀在抖動緩存器調(diào)整之前在兩個相鄰子幀之間產(chǎn)生。新的子幀的解碼參數(shù)可以通過使用兩個相鄰子幀的解碼參數(shù)產(chǎn)生。
[0426]圖19是示出在解碼參數(shù)級別以子幀為單位補(bǔ)償語音信息的另一個示例性方法的示意圖。
[0427]應(yīng)用操作㈧的語音信息補(bǔ)償?shù)那樾卧趫D19中示例。因此,通過使用屬于要產(chǎn)生的幀(即,第η個幀)的先前幀(即,第(η-1)個幀)的某些子幀的解碼參數(shù),和屬于下一個幀(即,第(η+1)個幀)的子幀的解碼參數(shù),可以推導(dǎo)出要產(chǎn)生的子幀的解碼參數(shù)。
[0428]更具體地說,新的子幀在先前幀的最后的子幀S4和下一個幀的第一子幀SI之間產(chǎn)生,新的子幀在下一個幀的第一子幀SI和下一個幀的第二子幀S2之間產(chǎn)生,新的子幀在下一個幀的第二子幀S2和下一個幀的第三子幀S3之間產(chǎn)生,并且新的子幀在下一個幀的第三子幀S3和下一個幀的最后的子幀S4之間產(chǎn)生。要產(chǎn)生的子幀的解碼參數(shù)從在產(chǎn)生中使用的子幀的解碼參數(shù)中導(dǎo)出。 [0429]抖動緩存器可以通過以幀為單位聚合產(chǎn)生的子幀來配置新的幀。例如,如果新的子幀在舊的子幀之間產(chǎn)生,則可以配置由舊的子幀和新的子幀組成的幀。
[0430]公式20示出根據(jù)圖19的示例通過補(bǔ)償語音信息(或者通過產(chǎn)生語音信息),內(nèi)插和產(chǎn)生在解碼參數(shù)之中的ISP系數(shù)的方法。
[0431]〈公式20>
[0432]ISPnml = 0.5x ISPrTl4+0.5x ISPn+I1
[0433]ISPnm3 = 0.5x ISPn+I^0.5x ISPn+I2
[0434]ISPn+Iml = 0.5x ISPn+l2+0.5x ISPn+I3
[0435]ISPn+Im3 = 0.5x ISPn+l3+0.5x ISPn+I4
[0436]ISP系數(shù)可以如上所述通過從LPC系數(shù)轉(zhuǎn)換推導(dǎo)出,并且LPC系數(shù)可以通過從ISP系數(shù)轉(zhuǎn)換推導(dǎo)出。
[0437]公式21示出根據(jù)圖19的示例通過補(bǔ)償語音信息(或者通過產(chǎn)生語音信息),內(nèi)插和產(chǎn)生在解碼參數(shù)之中的基音周期的方法。
[0438]< 公式 21>
[0439]Pnml = 0.5x Prfl4+0.5x Pn+I1
[0440]Pnm3 = 0.5x Pn+1^+0.5x Pn+I2
[0441]Pn+Iml = 0.5x Pn+l2+0.5x Pn+I3
[0442]Pn+Im3 = 0.5x Pn+l3+0.5x Pn+I4
[0443]基音周期可以通過解碼長期預(yù)測(LTP)濾波、基音延遲(滯后)、碼本增益等等獲得。
[0444]公式22示出根據(jù)圖19的示例通過補(bǔ)償語音信息(或者通過產(chǎn)生語音信息),內(nèi)插和產(chǎn)生在解碼參數(shù)之中的激勵信號分量的方法。
[0445]< 公式 22>
[0446]FCBnml = 0.5x FCBrTl4+0.5x FCBn+I1
[0447]FCBnm3 = 0.5x FCBn+V0.5x FCBn+I2
[0448]FCBn+Iml = 0.5x FCBn+l2+0.5x FCBn+I3
[0449]FCBn+Im3 = 0.5x FCBn+l3+0.5x FCBn+I4
[0450]激勵信號可以通過解碼固定碼本和碼本增益獲得。
[0451]同時,在激勵信號的情況下,代替通過使用內(nèi)插產(chǎn)生,能夠應(yīng)用將在產(chǎn)生中使用的子幀的激勵信號分量作為用于要產(chǎn)生的子幀的激勵信號分量的前一半分量和后一半分量來使用的方法。
[0452]公式23示出根據(jù)圖19的示例,通過補(bǔ)償語音信息(或者通過產(chǎn)生語音信息),將在產(chǎn)生中使用的子幀的激勵信號分量作為用于要產(chǎn)生的子幀的激勵信號分量的前一半分量和后一半分量使用的方法。
[0453]< 公式 23>
[0454]FCBnml (k) = FCBrTl4 (k) (k = O ?子幀 /2)
[0455]= FCBn+I1 (k) (k =子巾貞 /2 ?子中貞)
[0456]FCBnm3 (k) = FCBn+I1 (k) (k = O ?子巾貞 /2)
[0457]= FCBn+I2 (k) (k =子中貞/2 ?子中貞)
[0458]FCBn+Iml (k) = FCBn+I2 (k) (k = O ?子幀 /2)
[0459]= FCBn+I3 (k) (k =子巾貞/2 ?子中貞)
[0460]FCBn+Im3 (k) = FCBn+I3 (k) (k = O ?子中貞/2)
[0461]= FCBn+I4 (k) (k =子巾貞/2 ?子中貞)
[0462]此外,在解碼參數(shù)之中的激勵信號分量的情況下,可以通過以軌跡為單位應(yīng)用使用在產(chǎn)生中使用的子幀的激勵信號分量的方法產(chǎn)生激勵信號分量。
[0463]公式24示出根據(jù)圖19的示例,通過補(bǔ)償語音信息(或者通過產(chǎn)生語音信息),通過以軌跡為單位使用現(xiàn)有的子幀的激勵信號分量產(chǎn)生激勵信號分量的方法。
[0464]< 公式 24>
[0465]FCBnml (k) = FCBrTl4 (k)(軌跡 1&3) +FCBn+I1 (k)(軌跡 2&4)
[0466]FCBnm3 (k) = FCBn+I1 (k)(軌跡 1&3) +FCBn+I2 (k)(軌跡 2&4)
[0467]FCBn+Iml (k) = FCBn+I2 (k)(軌跡 1&3) +FCBn+I3 (k)(軌跡 2&4)
[0468]FCBn+Im3 (k) = FCBn+I3 ⑵(軌跡 1&3) +FCBn+I4 (k)(軌跡 2&4)
[0469]要產(chǎn)生的子幀的激勵信號分量由現(xiàn)有的兩個子幀的激勵信號分量的部分和組成。在這種情況下,對于波數(shù)k所屬于的每個軌跡,要產(chǎn)生的子幀的激勵信號分量在對應(yīng)的軌跡上選擇激勵信號值。
[0470]雖然語音幀由四個子幀組成的情形在圖19中示例,但是本發(fā)明不受限于此。例如,如果語音幀由L個子幀組成,則幀(即,第η個幀)可以如上所述通過使用在先前幀(SP,第(η-1)個幀)中的一個子幀,和通過使用在下一個幀(即,第(η+1)個幀)中的L個
子中貞產(chǎn)生。
[0471]在這種情況下,參考公式20至22描述的內(nèi)插也可以通過使用P個子幀(即,子幀的解碼參數(shù))(這里2 < P < L)來執(zhí)行。在這種情況下,內(nèi)插的濾波系數(shù)(即,平滑比)可以根據(jù)在內(nèi)插中使用的子幀的數(shù)目(即,子幀的解碼參數(shù))確定,而不是確定為對于應(yīng)用兩個子幀的情形使用的0.5。例如,如果使用P個子幀,則平滑比可以確定為1/ρ。
[0472]圖20是示出在解碼參數(shù)級別以子幀為單位補(bǔ)償語音信息的另一個示例性方法的示意圖。
[0473]應(yīng)用操作(B)的語音信息補(bǔ)償?shù)那樾卧趫D20中示例。因此,通過使用屬于要產(chǎn)生的幀(即,第η個幀)的下一個幀(即,第(η+1)個幀)的某些子幀的解碼參數(shù),和屬于先前幀(即,第(η-1)個幀)的子幀的解碼參數(shù),可以推導(dǎo)出要產(chǎn)生的子幀的解碼參數(shù)。
[0474]圖20的示例基本上使用與圖19的示例相同的方法,但是,子幀和解碼參數(shù)通過使用不同于在圖19的示例中使用的子幀和解碼參數(shù)來產(chǎn)生。
[0475]更具體地說,新的子幀在先前幀的第一子幀SI和先前幀的第二子幀S2之間產(chǎn)生,新的子幀在先前幀的第二子幀S2和先前幀的第三子幀S3之間產(chǎn)生,新的子幀在先前幀的第三子幀和先前幀的最后的子幀S4之間產(chǎn)生,并且新的子幀在先前幀的最后的子幀S4和下一個幀的第一子幀SI之間產(chǎn)生。要產(chǎn)生的子幀的解碼參數(shù)從在產(chǎn)生中使用的子幀的解碼參數(shù)中導(dǎo)出。
[0476]新的幀可以通過以幀為單位聚合產(chǎn)生的子幀來配置。例如,如果新的子幀在舊的子幀之間產(chǎn)生,則可以配置由舊的子幀和新的子幀組成的幀。
[0477]公式25示出根據(jù)圖20的示例通過補(bǔ)償語音信息(或者通過產(chǎn)生語音信息),內(nèi)插和產(chǎn)生在解碼參數(shù)之中的 ISP系數(shù)的方法。
[0478]< 公式 25>
[0479]ISPrTlm2 = 0.5x ISPrflj0.5x ISPrTl2
[0480]ISPrTlm4 = 0.5x ISPrfl2+0.5x ISPrTl3
[0481]ISPnm2 = 0.5x ISPrTl3+0.5x ISPrTl4
[0482]ISPnm4 = 0.5x ISPrTl4+0.5x ISPn+I1
[0483]可以與等式20 —樣應(yīng)用公式25,并且差別僅僅是要修改的解碼參數(shù)所屬于的子幀和要使用的解碼參數(shù)所屬于的子幀不同于公式20的子幀。
[0484]公式26示出根據(jù)圖20的示例通過補(bǔ)償語音信息(或者通過產(chǎn)生語音信息),內(nèi)插和產(chǎn)生在解碼參數(shù)之中的基音周期的方法。
[0485]< 公式 26>
[0486]Prflm2 = 0.5χ Ρη'+Ο.5x Prfl2
[0487]Prflm4 = 0.5x Prfl2+0.5x Prfl3
[0488]Pnm2 = 0.5x Prf l3+0.5x PrTl4
[0489]Pnm4 = 0.5x Prfl4+0.5x Pn+I1
[0490]可以與公式21 —樣應(yīng)用公式26,并且差別僅僅是要修改的解碼參數(shù)所屬于的子幀和要使用的解碼參數(shù)所屬于的子幀不同于公式21的子幀。
[0491]公式27示出根據(jù)圖20的示例通過補(bǔ)償語音信息(或者通過產(chǎn)生語音信息),內(nèi)插和產(chǎn)生在解碼參數(shù)之中的激勵信號分量的方法。
[0492]< 公式 27>
[0493]FCBrTlni2 = 0.5x FCBrTl!+0.5x FCBrTl2[0494]FCBrTlni4 = 0.5x FCBrTl2+0.5x FCBrTl3
[0495]FCBnm2 = 0.5x FCBrTl3+0.5x FCBrTl4
[0496]FCBnm4 = 0.5x FCBrTl4+0.5x FCBn+I1
[0497]可以與公式22 —樣應(yīng)用公式27,并且差別僅僅是要修改的解碼參數(shù)所屬于的子幀和要使用的解碼參數(shù)所屬于的子幀不同于公式22的子幀。
[0498]公式28示出根據(jù)圖20的示例,通過補(bǔ)償語音信息(或者通過產(chǎn)生語音信息)的方法,其中在激勵信號不是通過使用內(nèi)插產(chǎn)生的情況下,在產(chǎn)生中使用的子幀的激勵信號分量用作用于要產(chǎn)生的子幀的激勵信號分量的前一半分量和后一半分量。
[0499]< 公式 28>
[0500]FCBrTlm2 (k) =FCBrfl1(Ii) (k = O ?子巾貞/2)
[0501]= FCBn-12 (k) (k =子巾貞/2 ?子中貞)
[0502]FCBrTlm4 (k) = FCBrTI2 (k) (k = O ?子中貞/2)
[0503]= FCBn-13 (k) (k =子巾貞/2 ?子中貞)
[0504]FCBnm2 (k) = FCBrTl3 (k) (k = O ?子幀 /2)
[0505]=FCBrf I4 (k) (k =子巾貞/2 ?子中貞)
[0506]FCBnm4 (k) = FCBrTl4 (k) (k = O ?子巾貞 /2)
[0507]= FCBn+I1 (k) (k =子巾貞 /2 ?子中貞)
[0508]可以與公式23 —樣應(yīng)用公式28,并且差別僅僅是要修改的解碼參數(shù)所屬于的子幀和要使用的解碼參數(shù)所屬于的子幀不同于公式23的子幀。
[0509]公式29示出根據(jù)圖20的示例,通過補(bǔ)償語音信息(或者通過產(chǎn)生語音信息),通過以軌跡為單位使用現(xiàn)有的子幀的激勵信號分量產(chǎn)生激勵信號分量的方法。
[0510]〈公式29>
[0511 ] FCBrTlni2 (k) = FCBrTl1 (k)(軌跡 1&3) +FCBrTl2 (k)(軌跡 2&4)
[0512]FCBrTlni4 (k) = FCBrTl2 (k)(軌跡 1&3) +FCBrTl3 (k)(軌跡 2&4)
[0513]FCBnm2 (k) = FCBrTl3 (k)(軌跡 1&3) +FCBrTl4 (k)(軌跡 2&4)
[0514]FCBnm4 (k) = FCBrTl4 (k)(軌跡 1&3) +FCBn+I1 (k)(軌跡 2&4)
[0515]可以與公式24 —樣應(yīng)用公式29,并且差別僅僅是要修改的解碼參數(shù)所屬于的子幀和要使用的解碼參數(shù)所屬于的子幀不同于公式24的子幀。
[0516]雖然語音幀由四個子幀組成的情形在圖20中示例,但是本發(fā)明不受限于此。例如,如果語音幀由L個子幀組成,則幀(即,第η個幀)可以如上所述通過使用在下一個幀(SP,第(η+1)個幀)中的一個子幀,和通過使用在先前幀(即,第(η-1)個幀)中的L個子
中貞產(chǎn)生。
[0517]在這種情況下,參考公式25至27描述的內(nèi)插也可以通過使用P個子幀(即,子幀的解碼參數(shù))(這里2 < P < L)執(zhí)行。在這種情況下,內(nèi)插的濾波系數(shù)(即,平滑比)可以根據(jù)在內(nèi)插中使用的子幀的數(shù)目(即,子幀的解碼參數(shù))確定,而不是確定為對于應(yīng)用兩個子幀的情形使用的0.5。例如,如果使用P個子幀,則平滑比可以確定為1/ρ。
[0518]圖21是示出在解碼參數(shù)級別以子幀為單位補(bǔ)償語音信息的另一個示例性方法的示意圖。
[0519]適用操作(C)的語音信息補(bǔ)償?shù)那樾卧趫D21中示例。因此,通過使用屬于要產(chǎn)生的幀(即,第η個幀)的先前幀(即,第(η+1)個幀)的某些子幀的解碼參數(shù),和屬于下一個幀(即,第(η-1)個幀)的某些子幀的解碼參數(shù),可以推導(dǎo)出要產(chǎn)生的子幀的解碼參數(shù)。
[0520]圖21的示例基本上使用與圖19和圖20的示例相同的方法,但是,子幀和解碼參數(shù)通過使用不同于在圖19和圖20的示例中使用的子幀和解碼參數(shù)來產(chǎn)生。
[0521]更具體地說,新的子幀在先前幀的第二子幀S2和先前幀的第三子幀S3之間產(chǎn)生,新的子幀在先前幀的第三子幀S3和先前幀的第四子幀S4之間產(chǎn)生,新的子幀在下一個幀的第一子幀SI和下一個幀的第二子幀S2之間產(chǎn)生,并且新的子幀在下一個幀的第二子幀S3和下一個幀的第三子幀S4之間產(chǎn)生。要產(chǎn)生的子幀的解碼參數(shù)從在產(chǎn)生中使用的子幀的解碼參數(shù)中導(dǎo)出。
[0522]抖動緩存器可以通過以幀為單位聚合產(chǎn)生的子幀來配置新的幀。例如,如果新的子幀在舊的子幀之間產(chǎn)生,則可以配置由舊的子幀和新的子幀組成的幀。
[0523]公式30示出根據(jù)圖21的示例通過補(bǔ)償語音信息(或者通過產(chǎn)生語音信息),內(nèi)插和產(chǎn)生在解碼參數(shù)之中的ISP系數(shù)的方法。
[0524]< 公式 30>
[0525]ISPrTlm3 = 0.5x ISPrfl2+0.5x ISPrTl3
[0526]ISPnml = 0.5x ISPrfl3+0.5x ISPrTl4
[0527]ISPnm4 = 0.5x ISPn+I^0.5x ISPn+I2 [0528]ISPn+Im2 = 0.5x ISPn+l2+0.5x ISPn+I3
[0529]可以與公式20 —樣應(yīng)用公式30,并且差別僅僅是要修改的解碼參數(shù)所屬于的子幀和要使用的解碼參數(shù)所屬于的子幀不同于公式20的子幀。
[0530]公式31示出根據(jù)圖21的示例通過補(bǔ)償語音信息(或者通過產(chǎn)生語音信息),內(nèi)插和產(chǎn)生在解碼參數(shù)之中的基音周期的方法。
[0531]〈公式31>
[0532]Prflm3 = 0.5x Prfl2+0.5x Prfl3
[0533]Pnml = 0.5x Prf 13+0.5x PrTl4
[0534]Pnm4 = 0.5x Pn+1^+0.5x Pn+I2
[0535]Pn+Im2 = 0.5x Pn+l2+0.5x Pn+I3
[0536]可以與公式21 —樣應(yīng)用公式31,并且差別僅僅是要修改的解碼參數(shù)所屬于的子幀和要使用的解碼參數(shù)所屬于的子幀不同于公式21的子幀。
[0537]公式32示出根據(jù)圖21的示例通過補(bǔ)償語音信息(或者通過產(chǎn)生語音信息),內(nèi)插和產(chǎn)生在解碼參數(shù)之中的激勵信號分量的方法。
[0538]< 公式 32>
[0539]FCBrTlm3 = 0.5x FCBrf 12+0.5x FCBrTl3
[0540]FCBnml = 0.5x FCBn_l3+0.5x FCBrTl4
[0541]FCBnm4 = 0.5x FCBn+I^0.5x FCBn+I2
[0542]FCBn+Im2 = 0.5x FCBn+l2+0.5x FCBn+I3
[0543]可以與公式22 —樣應(yīng)用公式32,并且差別僅僅是要修改的解碼參數(shù)所屬于的子幀和要使用的解碼參數(shù)所屬于的子幀不同于公式22的子幀。
[0544]公式33示出根據(jù)圖21的示例,通過補(bǔ)償語音信息(或者通過產(chǎn)生語音信息)的方法,其中在激勵信號不是通過使用內(nèi)插產(chǎn)生的情況下,在產(chǎn)生中使用的子幀的激勵信號分量用作用于要產(chǎn)生的子幀的激勵信號分量的前一半分量和后一半分量。
[0545]< 公式 33>
[0546]FCBrTlm3 (k) = FCBrTI2 (k) (k = O ?子中貞/2)
[0547]= FCBn_l3(k) (k =子幀 /2 ?子幀)
[0548]FCBnml (k) = FCBrTl3 (k) (k = O ?子幀 /2)
[0549]=FCBrf I4 (k) (k =子巾貞/2 ?子中貞)
[0550]FCBnm4 (k) = FCBn+I1 (k) (k = O ?子幀 /2)
[0551]= FCBn+I2 (k) (k =子巾貞/2 ?子中貞)
[0552]FCBn+Im2 (k) = FCBn+I2 (k) (k = O ?子中貞/2)
[0553]= FCBn+I3 (k) (k =子巾貞/2 ?子中貞)
[0554]可以與公式23 —樣應(yīng)用公式33,并且差別僅僅是要修改的解碼參數(shù)所屬于的子幀和要使用的解碼參數(shù)所屬于的子幀不同于公式23的子幀。
[0555]公式34示出根據(jù)圖21的示例,通過補(bǔ)償語音信息(或者通過產(chǎn)生語音信息),通過以軌跡為單位使用現(xiàn)有的子幀的激勵信號分量產(chǎn)生激勵信號分量的方法。
[0556]< 公式 34>
[0557]FCBrTlni3 (k) = FCBrTl2 (k)(軌跡 1&3) +FCBrTl3 (k)(軌跡 2&4)
[0558]FCBnml (k) = FCBrTl3 (k)(軌跡 1&3) +FCBrTl4 (k)(軌跡 2&4)
[0559]FCBnm4 (k) = FCBn+I1 (k)(軌跡 1&3) +FCBn+I2 (k)(軌跡 2&4)
[0560]FCBn+Im2 (k) = FCBn+I2 (k)(軌跡 1&3) +FCBn+I3 (k)(軌跡 2&4)
[0561]可以與公式24 —樣應(yīng)用公式34,并且差別僅僅是要修改的解碼參數(shù)所屬于的子幀和要使用的解碼參數(shù)所屬于的子幀不同于公式24的子幀。
[0562]雖然語音幀由四個子幀組成的情形被描述為在圖21中的示例,但是本發(fā)明不受限于此。例如,幀(即,第η個幀)可以如上所述通過使用下一個幀(即,第(η+1)個幀)和先前幀(即,第(η-1)個幀)的子幀產(chǎn)生。
[0563]在這種情況下,參考公式30至32描述的內(nèi)插也可以通過使用P個子幀(即,子幀的解碼參數(shù))(這里2 < P < L)來執(zhí)行。在這種情況下,內(nèi)插的濾波系數(shù)(即,平滑比)可以根據(jù)在內(nèi)插中使用的子幀的數(shù)目(即,子幀的解碼參數(shù))確定,而不是確定為對于應(yīng)用兩個子幀的情形使用的0.5。例如,如果使用P個子幀,則平滑比可以確定為1/ρ。
[0564]圖22是示出在解碼參數(shù)級別以子幀為單位補(bǔ)償語音信息的另一個示例性方法的示意圖。
[0565]適用操作(D)的語音信息補(bǔ)償?shù)那樾卧趫D22中示例。因此,通過使用屬于要產(chǎn)生的幀(即,第η個幀)的先前幀(即,第(η+1)個幀)的子幀的解碼參數(shù),和屬于下一個幀(即,第(η-1)個幀)的子幀的解碼參數(shù),可以推導(dǎo)出要產(chǎn)生的子幀的解碼參數(shù)。
[0566]圖22的示例基本上使用與圖19至圖21的示例相同的方法,但是,子幀和解碼參數(shù)通過使用不同于在圖19至圖21的示例中使用的子幀和解碼參數(shù)產(chǎn)生。
[0567]更具體地說,新的子幀在先前幀的第一子幀SI和先前幀的第二子幀S2之間產(chǎn)生,新的子幀在先前幀的第三子幀S3和先前幀的第四子幀S4之間產(chǎn)生,新的子幀在下一個幀的第一子幀SI和下一個幀的第二子幀S2之間產(chǎn)生,并且新的子幀在下一個幀的第三子幀S3和下一個幀的最后的子幀S4之間產(chǎn)生。要產(chǎn)生的子幀的解碼參數(shù)從在產(chǎn)生中使用的子幀的解碼參數(shù)中導(dǎo)出。
[0568]抖動緩存器可以通過以幀為單位聚合產(chǎn)生的子幀來配置新的幀。例如,如果新的子幀在舊的子幀之間產(chǎn)生,則可以配置由舊的子幀和新的子幀組成的幀。
[0569]公式35示出根據(jù)圖22的示例通過補(bǔ)償語音信息(或者通過產(chǎn)生語音信息),內(nèi)插和產(chǎn)生在解碼參數(shù)之中的ISP系數(shù)的方法。
[0570]< 公式 35>
[0571]ISPrTlm2 = 0.5x ISPrTL+0.5x ISPrTl2
[0572]ISPnml = 0.5x ISPrfl3+0.5x ISPrTl4
[0573]ISPnm4 = 0.5x ISPn+I^0.5x ISPn+I2
[0574]ISPn+Im3 = 0.5x ISPn+l3+0.5x ISPn+I4
[0575]可以與公式20 —樣應(yīng)用公式35,并且差別僅僅是要修改的解碼參數(shù)所屬于的子幀和要使用的解碼參數(shù)所屬于的子幀不同于公式22的子幀。
[0576]公式36 示出根據(jù)圖22的示例通過補(bǔ)償語音信息(或者通過產(chǎn)生語音信息),內(nèi)插和產(chǎn)生在解碼參數(shù)之中的基音周期的方法。
[0577]< 公式 36>
[0578]Prflm2 = 0.5χ Ρη'+Ο.5x Prfl2
[0579]Pnml = 0.5x Prf 13+0.5x PrTl4
[0580]Pnm4 = 0.5x Pn+1^+0.5x Pn+I2
[0581]Pn+Im3 = 0.5x Pn+l3+0.5x Pn+I4
[0582]可以與公式21 —樣應(yīng)用公式36,并且差別僅僅是要修改的解碼參數(shù)所屬于的子幀和要使用的解碼參數(shù)所屬于的子幀不同于公式21的子幀。
[0583]公式37示出根據(jù)圖22的示例通過補(bǔ)償語音信息(或者通過產(chǎn)生語音信息),內(nèi)插和產(chǎn)生在解碼參數(shù)之中的激勵信號分量的方法。
[0584]< 公式 37>
[0585]FCBrTlm2 = 0.5x FCBrflj0.5x FCBrTl2
[0586]FCBnml = 0.5x FCBrT 13+0.5χ FCBrTl4
[0587]FCBnm4 = 0.5χ FCBn+I^0.5χ FCBn+I2
[0588]FCBn+Im3 = 0.5χ FCBn+l3+0.5χ FCBn+I4
[0589]可以與公式22 —樣應(yīng)用公式37,并且差別僅僅是要修改的解碼參數(shù)所屬于的子幀和要使用的解碼參數(shù)所屬于的子幀不同于公式22的子幀。
[0590]公式38示出根據(jù)圖22的示例,通過補(bǔ)償語音信息(或者通過產(chǎn)生語音信息)的方法,其中在激勵信號不是通過使用內(nèi)插產(chǎn)生的情況下,在產(chǎn)生中使用的子幀的激勵信號分量用作用于要產(chǎn)生的子幀的激勵信號分量的前一半分量和后一半分量。
[0591]〈公式38>
[0592]FCBrTlni2 (k) = FCBrTl1 (k) (k = O ~子幀 /2)
[0593]=FCBrf I2 (k) (k =子幀/2 ~子中貞)
[0594]FCBnml (k) = FCBrTl3 (k) (k = O ~子幀 /2)
[0595]=FCBrf I4 (k) (k =子幀/2 ~子中貞)[0596]FCBnm4 (k) = FCBn+I1 (k) (k = O ?子巾貞 /2)
[0597]= FCBn+I2 (k) (k =子幀 /2 ?子幀)
[0598]FCBn+Im3 (k) = FCBn+I3 (k) (k = O ?子巾貞/2)
[0599]= FCBn+I4 (k) (k =子幀 /2 ?子幀)
[0600]可以與公式23 —樣應(yīng)用公式38,并且差別僅僅是要修改的解碼參數(shù)所屬于的子幀和要使用的解碼參數(shù)所屬于的子幀不同于公式24的子幀。
[0601]公式39示出根據(jù)圖22的示例,通過補(bǔ)償語音信息(或者通過產(chǎn)生語音信息),通過以軌跡為單位使用現(xiàn)有的子幀的激勵信號分量產(chǎn)生激勵信號分量的方法。
[0602]< 公式 39>
[0603]FCBrTlni2 (k) = FCBrTl1 (k)(軌跡 1&3) +FCBrTl2 (k)(軌跡 2&4)
[0604]FCBnml (k) = FCBrTl3 (k)(軌跡 1&3) +FCBrTl4 (k)(軌跡 2&4)
[0605]FCBnm4 (k) = FCBn+I1 (k)(軌跡 1&3) +FCBn+I2 (k)(軌跡 2&4)
[0606]FCBn+Im3 (k) = FCBn+I3 ⑵(軌跡 1&3) +FCBn+I4 (k)(軌跡 2&4)
[0607]可以與公式24 —樣應(yīng)用公式39,并且差別僅僅是要修改的解碼參數(shù)所屬于的子幀和要使用的解碼參數(shù)所屬于的子幀不同于公式24的子幀。
[0608]雖然語音幀由四個子幀組成的情形被描述為在圖22中的示例,但是本發(fā)明不受限于此。例如,幀(即,第η個幀)可以如上所述通過使用下一個幀(即,第(η+1)個幀)的解碼參數(shù)和子幀,和先前幀(即,第(η-1)個幀)的解碼參數(shù)和子幀產(chǎn)生。
[0609]在這種情況下,參考公式35至37描述的內(nèi)插也可以通過使用P個子幀(即,子幀的解碼參數(shù))(這里2 < P < L)來執(zhí)行。在這種情況下,內(nèi)插的濾波系數(shù)(即,平滑比)可以根據(jù)在內(nèi)插中使用的子幀的數(shù)目(即,子幀的解碼參數(shù))確定,而不是確定為對于應(yīng)用兩個子幀的情形使用的0.5。例如,如果使用P個子幀,則平滑比可以確定為1/ρ。
[0610]同時,雖然例如在前面提到的說明書中描述了 ISP系數(shù)用作與LPC系數(shù)相關(guān)的解碼參數(shù)的情形,但是本發(fā)明不受限于此。例如,用于ISP系數(shù)的內(nèi)插方法同樣可以與前面提到的ISP系數(shù)一起應(yīng)用于LSP系數(shù),并且也可以通過考慮變換為頻率域應(yīng)用于ISF系數(shù)和LSF系數(shù)。
[0611]雖然前面提到的示例性實施例的方法已經(jīng)基于在其中步驟或者模塊依次列出的流程圖描述,但是本發(fā)明的步驟不局限于某個順序。因此,某個步驟可以相對于上面的描述在不同的步驟中,或者以不同的順序或者同時地執(zhí)行。此外,前面提到的示例性實施例包括各種方面的示例。例如,前面提到的實施例可以以組合方式執(zhí)行,并且這些也包括在本發(fā)明的實施例中。所有替換、修改和變化將落在本發(fā)明的權(quán)利要求書的精神和范圍內(nèi)。
【權(quán)利要求】
1.一種管理抖動緩存器的方法,所述方法包括: 接收語首?目息幀;和 基于接收的語音信息幀執(zhí)行抖動緩存器調(diào)整, 其中,所述抖動緩存器調(diào)整包括對音頻信號的補(bǔ)償,以及 其中,對所述音頻信號的所述補(bǔ)償以所述語音信息幀的子幀為單位執(zhí)行。
2.根據(jù)權(quán)利要求1的方法,其中,對所述音頻信號的所述補(bǔ)償在所述音頻信號的解碼參數(shù)級別執(zhí)行。
3.根據(jù)權(quán)利要求1的方法,其中,對所述音頻信號的所述補(bǔ)償基于所述音頻信號幀的重要性執(zhí)行。
4.根據(jù)權(quán)利要求3的方法, 其中,所述音頻信號以重要性的升序變?yōu)橐纛l信號補(bǔ)償?shù)哪繕?biāo),以及 其中,所述音頻信號幀在連續(xù)的靜默持續(xù)時間中具有最低的重要性。
5.根據(jù)權(quán)利要求 1的方法,其中,如果執(zhí)行幀抽取作為對所述音頻信號的所述補(bǔ)償,則關(guān)于抽取目標(biāo)幀、所述抽取目標(biāo)幀的先前幀和所述抽取目標(biāo)幀的下一個幀,用于所述抽取目標(biāo)幀的前一半子幀的解碼參數(shù)被以用于所述先前幀的后一半子幀的解碼參數(shù)替換,并且用于所述抽取目標(biāo)幀的后一半子幀的解碼參數(shù)被以用于所述下一個幀的前一半子幀的解碼參數(shù)替換,由此抽取所述抽取目標(biāo)幀。
6.根據(jù)權(quán)利要求1的方法,其中,如果執(zhí)行幀抽取作為對所述音頻信號的所述補(bǔ)償,則子幀的新的解碼參數(shù)通過內(nèi)插用于構(gòu)成音頻信號幀的兩個子幀的解碼參數(shù)來產(chǎn)生。
7.根據(jù)權(quán)利要求1的方法,其中,如果執(zhí)行幀抽取作為對所述音頻信號的所述補(bǔ)償,則關(guān)于抽取目標(biāo)幀、作為所述抽取目標(biāo)幀的先前幀的第一相鄰幀和作為所述抽取目標(biāo)幀的下一個幀的第二相鄰幀,執(zhí)行對于所述音頻信號的所述補(bǔ)償以產(chǎn)生補(bǔ)償?shù)牡谝幌噜弾脱a(bǔ)償?shù)牡诙噜弾?,用于所述補(bǔ)償?shù)牡谝幌噜弾暮笠话氲谝蛔訋慕獯a參數(shù)通過內(nèi)插用于所述第一相鄰幀的后一半子幀的解碼參數(shù)產(chǎn)生,用于所述補(bǔ)償?shù)牡谝幌噜弾暮笠话氲诙訋慕獯a參數(shù)通過內(nèi)插用于所述抽取目標(biāo)幀的前一半子幀的解碼參數(shù)產(chǎn)生,用于所述補(bǔ)償?shù)牡诙噜弾那耙话胱訋慕獯a參數(shù)通過內(nèi)插用于所述抽取目標(biāo)幀的后一半子幀的解碼參數(shù)產(chǎn)生,以及用于所述補(bǔ)償?shù)牡诙噜弾那耙话氲诙訋慕獯a參數(shù)通過內(nèi)插用于所述第二相鄰幀的前一半子幀的解碼參數(shù)產(chǎn)生。
8.根據(jù)權(quán)利要求1的方法,其中,如果執(zhí)行幀抽取作為對所述音頻信號的所述補(bǔ)償,則關(guān)于抽取目標(biāo)幀和所述抽取目標(biāo)幀的先前幀,執(zhí)行對于所述音頻信號的所述補(bǔ)償以產(chǎn)生補(bǔ)償?shù)南惹皫鲅a(bǔ)償?shù)南惹皫牡谝蛔訋ㄟ^內(nèi)插用于所述先前幀的前一半子幀的解碼參數(shù)產(chǎn)生,所述補(bǔ)償?shù)南惹皫牡诙訋ㄟ^內(nèi)插用于所述先前幀的后一半子幀的解碼參數(shù)產(chǎn)生,所述補(bǔ)償?shù)南惹皫牡谌訋ㄟ^內(nèi)插用于所述抽取目標(biāo)幀的前一半子幀的解碼參數(shù)產(chǎn)生,以及所述補(bǔ)償?shù)南惹皫牡谒淖訋ㄟ^內(nèi)插所述抽取目標(biāo)幀的后一半子幀的解碼參數(shù)產(chǎn)生。
9.根據(jù)權(quán)利要求1的方法,其中,如果執(zhí)行幀抽取作為對所述音頻信號的所述補(bǔ)償,則關(guān)于抽取目標(biāo)幀和所述抽取目標(biāo)幀的下一個幀,補(bǔ)償?shù)南乱粋€幀通過對音頻信號的補(bǔ)償而產(chǎn)生,所述補(bǔ)償?shù)南乱粋€幀的第一子幀通過內(nèi)插用于所述抽取目標(biāo)幀的前一半子幀的解碼參數(shù)產(chǎn)生,所述補(bǔ)償?shù)南乱粋€幀的第二子幀通過內(nèi)插用于所述抽取目標(biāo)幀的后一半子幀的解碼參數(shù)產(chǎn)生,所述補(bǔ)償?shù)南乱粋€幀的第三子幀通過內(nèi)插用于所述下一個幀的前一半子幀的解碼參數(shù)產(chǎn)生,以及所述補(bǔ)償?shù)南乱粋€幀的第四子幀通過內(nèi)插用于所述下一個幀的后一半子幀的解碼參數(shù)產(chǎn)生。
10.根據(jù)權(quán)利要求1的方法,其中,如果執(zhí)行幀抽取作為對所述音頻信號的所述補(bǔ)償,則新的子幀的解碼參數(shù)通過內(nèi)插用于構(gòu)成音頻信號幀的兩個子幀的解碼參數(shù)來產(chǎn)生。
11.根據(jù)權(quán)利要求1的方法, 其中,如果執(zhí)行幀抽取作為對所述音頻信號的所述補(bǔ)償,則執(zhí)行子幀內(nèi)插,并且 其中所述子幀內(nèi)插包括: 在構(gòu)成音頻信號幀的兩個子幀之間產(chǎn)生新的子幀,以及 通過內(nèi)插用于所述兩個子幀的解碼參數(shù)產(chǎn)生所述新的子幀的解碼參數(shù)。
12.根據(jù)權(quán)利要求11的方法,其中,對于由在第一幀的四個子幀和第二子幀的第一子幀之中的相鄰子幀組成的四個子幀對執(zhí)行所述子幀內(nèi)插。
13.根據(jù)權(quán)利要求11的方法,其中,對于由在第一幀的四個幀和第二幀的四個子幀之中的相鄰子幀組成的四個幀對執(zhí)行所述子幀內(nèi)插。
14.根據(jù)權(quán)利要求11的方法,其中,對于第一幀的第二和第三子幀,第一幀的第三和第四子幀,第二幀的第一和第二子幀,以及第二幀的第二和第三子幀執(zhí)行所述子幀內(nèi)插。
15.根據(jù)權(quán)利要求11的方法,其中,對于第一幀的第一和第二子幀,第一幀的第三和第四子幀,第二幀的第一和第二子幀,以及第二幀的第三和第四子幀執(zhí)行所述子幀內(nèi)插。
16.—種抖動緩存器,包括: 用于接收語音信息幀的接收機(jī); 用于存儲和管理所述語音信息幀的緩存器;和 用于輸出所述語音信息幀的輸出單兀, 其中,所述緩存器以接收的語音信息幀的子幀為單位補(bǔ)償語音信息。
17.根據(jù)權(quán)利要求16的抖動緩存器,其中,所述緩存器在解碼參數(shù)級別補(bǔ)償所述語音信息。
18.根據(jù)權(quán)利 要求16的抖動緩存器,其中,所述緩存器通過內(nèi)插兩個不同的子幀的解碼參數(shù)產(chǎn)生新的解碼參數(shù)。
【文檔編號】H04L7/00GK103988255SQ201280061772
【公開日】2014年8月13日 申請日期:2012年10月22日 優(yōu)先權(quán)日:2011年10月20日
【發(fā)明者】姜仁圭, 李英漢, 鄭奎赫, 田惠晶, 金洛榕 申請人:Lg電子株式會社