專利名稱:用于低位速率應(yīng)用的對過渡語音幀的譯碼的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及語音信號的處理。
背景技術(shù):
通過數(shù)字技術(shù)來傳輸音頻信號(例如,話音和音樂)特別在長途電話、例如IP話 音(還稱為VoIP,其中IP表示因特網(wǎng)協(xié)議)的包交換電話,和例如蜂窩式電話的數(shù)字無線 電電話中已變得普遍。此激增已產(chǎn)生對減小用以經(jīng)由傳輸信道傳送話音通信的信息量同時(shí) 維持經(jīng)重建語音的感知質(zhì)量的興趣。舉例來說,需要最佳地利用可用無線系統(tǒng)帶寬。有效 使用系統(tǒng)帶寬的一種方式為使用信號壓縮技術(shù)。對于載運(yùn)語音信號的無線系統(tǒng)來說,出于 此目的通常使用語音壓縮(或“語音譯碼”)技術(shù)。經(jīng)配置以通過提取與人類語音產(chǎn)生模型有關(guān)的參數(shù)來壓縮語音的裝置通常稱為 聲碼器、“音頻譯碼器”或“語音譯碼器”。(本文中互換地使用這三個(gè)術(shù)語。)語音譯碼器通 常包括編碼器和解碼器。編碼器通常將傳入的語音信號(表示音頻信息的數(shù)字信號)劃分 成稱為“幀”的時(shí)間區(qū)段,分析每一幀以提取某些相關(guān)參數(shù),且將所述參數(shù)量化成經(jīng)編碼幀。 經(jīng)編碼幀經(jīng)由傳輸信道(即,有線或無線網(wǎng)絡(luò)連接)傳輸?shù)桨ń獯a器的接收器。解碼器 接收并處理經(jīng)編碼幀、將其解量化以產(chǎn)生參數(shù),且使用經(jīng)解量化的參數(shù)來重新創(chuàng)建語音幀。在典型通話中,每一說話者在約百分之六十的時(shí)間中不發(fā)聲。語音編碼器通常經(jīng) 配置以區(qū)別語音信號的含有語音的幀(“有效幀”)與語音信號的僅含有靜默或背景噪聲 的幀(“無效幀”)。此編碼器可經(jīng)配置以使用不同譯碼模式和/或速率來編碼有效與無效 幀。舉例來說,語音編碼器通常經(jīng)配置以與編碼有效幀相比使用較少位來編碼無效幀。語 音譯碼器可對于無效幀使用較低位速率以支持在少許或甚至無察覺到的質(zhì)量損失的情況 下以較低平均位速率來傳送語音信號。用以編碼有效幀的位速率的實(shí)例包括每幀171個(gè)位、每幀80個(gè)位和每幀40個(gè)位。 用以編碼無效幀的位速率的實(shí)例包括每幀16個(gè)位。在蜂窩式電話系統(tǒng)(尤其為依照如由 電信工業(yè)協(xié)會(Arlington,VA)發(fā)布的臨時(shí)標(biāo)準(zhǔn)(IS)-95或類似工業(yè)標(biāo)準(zhǔn)的系統(tǒng))的情形 下,這四個(gè)位速率還分別稱作“全速率”、“半速率”、“四分之一速率”和“八分之一速率”。
發(fā)明內(nèi)容
一種根據(jù)一個(gè)配置的編碼語音信號的幀的方法包括編碼語音信號的第一幀以作 為第一經(jīng)編碼幀,和編碼語音信號的第二幀以作為第二經(jīng)編碼幀。在此方法中,編碼第一 幀包括基于來自第一幀的至少一個(gè)音調(diào)脈沖的信息而選擇多個(gè)時(shí)域音調(diào)脈沖形狀中的一 者;計(jì)算第一幀的終端音調(diào)脈沖的位置;以及估計(jì)第一幀的音調(diào)周期。在此方法中,編碼第 二幀包括計(jì)算在第二幀的音調(diào)脈沖形狀與第一幀的音調(diào)脈沖形狀之間的音調(diào)脈沖形狀差 別;以及計(jì)算在第二幀的音調(diào)周期與第一幀的音調(diào)周期之間的音調(diào)周期差別。在此方法中, 第一經(jīng)編碼幀包括選定的時(shí)域音調(diào)脈沖形狀、所計(jì)算位置和所估計(jì)音調(diào)周期中的每一者的 表示。在此方法中,第二經(jīng)編碼幀包括音調(diào)脈沖形狀差別和音調(diào)周期差別中的每一者的表示,且在語音信號中第二幀在所述第一幀之后。根據(jù)一個(gè)配置的解碼語音信號的激勵(lì)信號的方法包括解碼第一經(jīng)編碼幀的一部 分以獲得第一激勵(lì)信號;以及解碼第二經(jīng)編碼幀的一部分以獲得第二激勵(lì)信號。在此方法 中,第一經(jīng)編碼幀的所述部分包括時(shí)域音調(diào)脈沖形狀、音調(diào)峰值位置和音調(diào)周期中的每一 者的表示。在此方法中,第二經(jīng)編碼幀的所述部分包括音調(diào)脈沖形狀差別和音調(diào)周期差別 中的每一者的表示。在此方法中,解碼第一經(jīng)編碼幀的一部分包括根據(jù)所述音調(diào)峰值位置 將所述時(shí)域音調(diào)脈沖形狀的第一副本布置于所述第一激勵(lì)信號內(nèi);以及根據(jù)所述音調(diào)峰值 位置和所述音調(diào)周期將所述時(shí)域音調(diào)脈沖形狀的第二副本布置于所述第一激勵(lì)信號內(nèi)。在 此方法中,解碼第二經(jīng)編碼幀的一部分包括基于所述時(shí)域音調(diào)脈沖形狀和所述音調(diào)脈沖 形狀差別而計(jì)算第二音調(diào)脈沖形狀;基于所述音調(diào)周期和所述音調(diào)周期差別而計(jì)算第二音 調(diào)周期;以及根據(jù)所述音調(diào)峰值位置和所述第二音調(diào)周期將所述第二音調(diào)脈沖形狀的多個(gè) 副本布置于所述第二激勵(lì)信號內(nèi)。一種根據(jù)一個(gè)配置的檢測語音信號的幀的音調(diào)峰值的方法包括檢測所述幀的第 一音調(diào)峰值;從所述幀的第一搜索窗內(nèi)的多個(gè)樣本中選擇候選樣本;從多個(gè)距離中選擇候 選距離,所述多個(gè)距離中的每一者對應(yīng)于所述幀的第二搜索窗內(nèi)的不同樣本。此方法包括 選擇(A)所述候選樣本和(B)對應(yīng)于所述候選距離的所述樣本中的一者作為所述幀的第二 音調(diào)峰值。在此方法中,所述多個(gè)距離中的每一者是A)對應(yīng)樣本與B)第一音調(diào)峰值之間 的距離。本文中還明確預(yù)期并揭示經(jīng)配置以執(zhí)行這些方法的設(shè)備和其它裝置以及具有在 通過處理器執(zhí)行時(shí)致使處理器執(zhí)行此些方法的要素的指令的計(jì)算機(jī)可讀媒體。
圖1展示語音信號的有聲區(qū)段的實(shí)例。圖2A展示語音區(qū)段的隨時(shí)間流逝的振幅的實(shí)例。圖2B展示LPC殘差的隨時(shí)間流逝的振幅的實(shí)例。圖3A展示根據(jù)一般配置的語音編碼方法MlOO的流程圖。圖;3B展示編碼任務(wù)ElOO的實(shí)施方案E102的流程圖。圖4展示幀中的特征的示意性表示。圖5A展示編碼任務(wù)E200的實(shí)施方案E202的圖表。圖5B展示方法MlOO的實(shí)施方案MllO的流程圖。圖5C展示方法MlOO的實(shí)施方案M120的流程圖。圖6A展示根據(jù)一般配置的設(shè)備MF100的框圖。圖6B展示裝置FE100的實(shí)施方案FE102的框圖。圖7A展示根據(jù)一般配置的解碼語音信號的激勵(lì)信號的方法M200的流程圖。圖7B展示解碼任務(wù)DlOO的實(shí)施方案D102的流程圖。圖8A展示根據(jù)一般配置的設(shè)備MF200的框圖。圖8B展示用于解碼的裝置FD100的實(shí)施方案FD102的流程圖。圖9A展示語音編碼器AElO和對應(yīng)的語音解碼器ADlO。圖9B展示語音編碼器AElO的例子AE10a、AE10b和語音解碼器ADlO的例子ADIOa、ADlOb0圖IOA展示根據(jù)一般配置的用于編碼語音信號的幀的設(shè)備AlOO的框圖。圖IOB展示編碼器100的實(shí)施方案102的框圖。圖IlA展示根據(jù)一般配置的用于解碼語音信號的激勵(lì)信號的設(shè)備A200的框圖。圖IlB展示第一幀解碼器300的實(shí)施方案302的框圖。圖12A展示語音編碼器AElO的多模式實(shí)施方案AE20的框圖。圖12B展示語音解碼器ADlO的多模式實(shí)施方案AD20的框圖。圖13展示殘差產(chǎn)生器RlO的框圖。圖14展示用于衛(wèi)星通信的系統(tǒng)的示意圖。圖15A展示根據(jù)一般配置的方法M300的流程圖。圖15B展示任務(wù)LlOO的實(shí)施方案L102的框圖。圖15C展示任務(wù)L200的實(shí)施方案L202的流程圖。圖16A展示通過任務(wù)L120進(jìn)行的搜索的實(shí)例。圖16B展示通過任務(wù)L130進(jìn)行的搜索的實(shí)例。圖17A展示任務(wù)L210的實(shí)施方案L210a的流程圖。圖17B展示任務(wù)L220的實(shí)施方案L220a的流程圖。圖17C展示任務(wù)L230的實(shí)施方案L230a的流程圖。圖18A到圖18F說明任務(wù)L212的迭代的搜索操作。圖19A展示任務(wù)L214的測試條件的表。圖19B和圖19C說明任務(wù)L222的迭代的搜索操作。圖20A說明任務(wù)L232的搜索操作。圖20B說明任務(wù)L234的搜索操作。圖20C說明任務(wù)L232的迭代的搜索操作。圖21展示任務(wù)L300的實(shí)施方案L302的流程圖。圖22A說明任務(wù)L320的搜索操作。圖22B和圖22C說明任務(wù)L320的替代搜索操作。圖23展示任務(wù)L330的實(shí)施方案L332的流程圖。圖24A展示可由任務(wù)L334的實(shí)施使用的測試條件的四個(gè)不同集合。圖24B展示任務(wù)L338的實(shí)施方案L338a的流程圖。圖25展示任務(wù)L300的實(shí)施方案L304的流程圖。圖沈展示語音編碼器AElO的實(shí)施方案的各種譯碼方案的位分配表。圖27A展示根據(jù)一般配置的設(shè)備MF300的框圖。圖27B展示根據(jù)一般配置的設(shè)備A300的框圖。圖27C展示根據(jù)一般配置的設(shè)備MF350的框圖。圖27D展示根據(jù)一般配置的設(shè)備A350的框圖。圖觀展示根據(jù)一般配置的方法M500的流程圖。圖29A到圖29D展示160位幀的各個(gè)區(qū)。圖30展示根據(jù)一般配置的方法M600的流程圖。圖31A展示將滯后范圍均勻劃分為若干頻段的實(shí)例。
圖31B展示將滯后范圍非均勻劃分為若干頻段的實(shí)例。圖32展示在幀分類方案中使用的特征的列表。圖33展示用于計(jì)算基于音調(diào)的規(guī)格化自相關(guān)函數(shù)的程序的流程圖。圖34為說明幀分類方案的高級流程圖。圖35為說明在幀分類方案中的狀態(tài)之間的可能過渡的狀態(tài)圖。圖36到圖37、圖38到圖40以及圖41到圖44展示幀分類方案的三個(gè)不同程序的 代碼列表。圖45到圖52B展示幀重新分類的條件。圖53展示語音編碼器AE20的實(shí)施方案AE30的框圖。圖54A展示語音編碼器AElO的實(shí)施方案AE40的框圖。圖54B展示周期性幀編碼器E70的實(shí)施方案E72的框圖。圖55展示周期性幀編碼器E72的實(shí)施方案E74的框圖。圖56A到圖56D展示使用過渡幀譯碼模式可能為合意的一些典型幀序列。圖57展示代碼列表。圖58展示用于取消使用過渡幀譯碼的決策的四個(gè)不同條件。圖59展示根據(jù)一般配置的方法M700的圖。參考標(biāo)記可出現(xiàn)于一個(gè)或一個(gè)以上圖中以指示同一結(jié)構(gòu)。
具體實(shí)施例方式如本文中所描述的系統(tǒng)、方法和設(shè)備(例如,方法M100、M200、M300、M500、M600和 /或M700)可用以支持處于低恒定位速率或處于低最大位速率(例如,每秒二千位)的語音 譯碼。此受約束位速率語音譯碼的應(yīng)用包括經(jīng)由衛(wèi)星鏈路的話音電話的傳輸(還稱為“衛(wèi) 星話音”),其可用以支持缺少蜂窩式或有線電話的通信基礎(chǔ)架構(gòu)的偏遠(yuǎn)地區(qū)的電話服務(wù)。 衛(wèi)星電話還可用以支持用于例如車隊(duì)的移動接收器的連續(xù)廣域覆蓋,從而實(shí)現(xiàn)例如即按即 說的服務(wù)。更一般來說,此受約束位速率語音譯碼的應(yīng)用并不限于涉及衛(wèi)星的應(yīng)用,且可延 伸到任何功率受限信道。除非其上下文明確地限制,否則術(shù)語“信號”在本文中用以指示其普通意義中的任 一者,包括如在導(dǎo)線、總線或其它傳輸媒體上表達(dá)的存儲器位置(或存儲器位置的集合)的 狀態(tài)。除非其上下文明確地限制,否則術(shù)語“產(chǎn)生”在本文中用以指示其普通意義中的任一 者,例如,計(jì)算或以其它方式產(chǎn)生。除非其上下文明確地限制,否則術(shù)語“計(jì)算”在本文中用 以指示其普通意義中的任一者,例如,計(jì)算、評估、產(chǎn)生和/或從一組值中進(jìn)行選擇。除非其 上下文明確地限制,否則術(shù)語“獲得”用以指示其普通意義中的任一者,例如計(jì)算、導(dǎo)出、接 收(例如,從外部裝置)和/或檢索(例如,從存儲元件的陣列)。除非其上下文明確地限 制,否則術(shù)語“估計(jì)”用以指示其普通意義中的任一者,例如,計(jì)算和/或評估。在本描述和 權(quán)利要求書中使用術(shù)語“包含”的地方,其并不排除其它元件或操作。術(shù)語“基于”(如在 “A是基于B”中)用以指示其普通意義中的任一者,其包括以下情況(i) “至少基于”(例 如,“A至少基于B”)和(在特定情形下適當(dāng)?shù)?(ii) “等于”(例如,“Α等于B”)。任何以 引用方式對文獻(xiàn)的一部分的并入還應(yīng)理解為并入在所述部分內(nèi)引用的術(shù)語或變量的定義 (其中這些定義出現(xiàn)于所述文獻(xiàn)的其它地方)。
除非另外指示,否則具有特定特征的語音編碼器的任何揭示內(nèi)容還明確地意欲揭 示具有類似特征的語音編碼方法(且反之亦然),且根據(jù)特定配置的語音編碼器的任何揭 示內(nèi)容還明確地意欲揭示根據(jù)類似配置的語音編碼方法(且反之亦然)。除非另外指示,否 則用于對語音信號的幀執(zhí)行操作的設(shè)備的任何揭示內(nèi)容還明確地意欲揭示用于對語音信 號的幀執(zhí)行操作的對應(yīng)方法(且反之亦然)。除非另外指示,否則具有特定特征的語音解碼 器的任何揭示內(nèi)容還明確地意欲揭示具有類似特征的語音解碼方法(且反之亦然),且根 據(jù)特定配置的語音解碼器的任何揭示內(nèi)容還明確地意欲揭示根據(jù)類似配置的語音解碼方 法(且反之亦然)?;Q地使用術(shù)語“譯碼器”、“編解碼器”和“譯碼系統(tǒng)”以表示一系統(tǒng), 所述系統(tǒng)包括經(jīng)配置以接收語音信號的幀(可能在例如感知加權(quán)和/或其它濾波操作的一 個(gè)或一個(gè)以上預(yù)處理操作之后)的至少一個(gè)編碼器和經(jīng)配置以產(chǎn)生幀的經(jīng)解碼表示的對 應(yīng)解碼器。出于語音譯碼的目的,語音信號通常經(jīng)數(shù)字化(或經(jīng)量化)以獲得樣本流??筛?據(jù)此項(xiàng)技術(shù)中已知的包括(例如)脈碼調(diào)制(PCM)、壓擴(kuò)μ定律PCM和壓擴(kuò)A定律PCM的 各種方法中的任一者執(zhí)行數(shù)字化過程。窄帶語音編碼器通常使用8kHz的取樣速率,而寬帶 語音編碼器通常使用更高的取樣速率(例如,12或16kHz)。語音編碼器經(jīng)配置以將數(shù)字化的語音信號處理為一系列幀。盡管處理幀或幀的區(qū) 段(還稱為子幀)的操作還可包括其輸入中的一個(gè)或一個(gè)以上鄰近幀的區(qū)段,但此系列通 常實(shí)施為非重疊系列。語音信號的幀通常足夠短,使得可預(yù)期信號的頻譜包絡(luò)在整個(gè)幀期 間保持相對固定。幀通常對應(yīng)于5與35毫秒之間的語音信號(或約40到200個(gè)樣本),其 中10、20和30毫秒為常見幀大小。經(jīng)編碼幀的實(shí)際大小可隨譯碼位速率而在幀間改變。20毫秒的幀長度在7千赫茲(kHz)的取樣速率下對應(yīng)于140個(gè)樣本,在8kHz的取 樣速率下對應(yīng)于160個(gè)樣本,且在16kHz的取樣速率下對應(yīng)于320個(gè)樣本,但可使用據(jù)認(rèn)為 適合于特定應(yīng)用的任何取樣速率??捎糜谡Z音譯碼的取樣速率的另一實(shí)例為12. 8kHz,且其 它實(shí)例包括在從12. 8kHz到38. 4kHz的范圍內(nèi)的其它速率。通常,所有幀具有相同的長度,且在本文中描述的特定實(shí)例中假定均勻幀長度。然 而,還明確預(yù)期且在此揭示可使用非均勻的幀長度。舉例來說,本文中所描述的各種設(shè)備和 方法的實(shí)施方案還可用于對于有效幀和無效幀和/或?qū)τ谟新晭蜔o聲幀使用不同幀長 度的應(yīng)用中。如上所提及,可能需要配置語音編碼器以使用不同譯碼模式和/或速率來編碼有 效幀和無效幀。為了區(qū)分有效幀與無效幀,語音編碼器通常包括語音活動性檢測器(通常 稱為話音活動性檢測器或VAD),或以其它方式執(zhí)行檢測語音活動性的方法。此檢測器或方 法可經(jīng)配置以基于一個(gè)或一個(gè)以上因素(例如,幀能量、信噪比、周期性和過零率)將幀分 類為有效或無效的。此分類可包括將此因素的值或量值與閾值比較,和/或?qū)⒋艘蛩氐母?變的量值與閾值比較。檢測語音活動性的語音活動性檢測器或方法還可經(jīng)配置以將有效幀分類為兩個(gè) 或兩個(gè)以上不同類型中的一者,例如,有聲(例如,表示元音聲)、無聲(例如,表示摩擦音 聲),或過渡(例如,表示字的開頭或結(jié)尾)。此分類可基于以下因素例如,語音和/或殘 差的自相關(guān)、過零率、第一反射系數(shù)和/或如(例如,關(guān)于譯碼方案選擇器C200和/或幀重 新分類器RC10)在本文中更詳細(xì)描述的其它特征。對于語音編碼器來說,可能需要使用不同譯碼模式和/或位速率來編碼不同類型的有效幀。有聲語音的幀傾向于具有為長期的(即,持續(xù)一個(gè)以上幀周期)且涉及音調(diào)的周 期性結(jié)構(gòu)。使用編碼此長期頻譜特征的描述的譯碼模式來編碼有聲幀(或有聲幀的序列) 通常為更有效。此譯碼模式的實(shí)例包括碼激勵(lì)線性預(yù)測(CELP)和例如原型波形內(nèi)插(PWI) 的波形內(nèi)插技術(shù)。PWI譯碼模式的一個(gè)實(shí)例稱為原型音調(diào)周期(PPP)。另一方面,無聲幀和 無效幀通常缺少任何顯著長期頻譜特征,且語音編碼器可經(jīng)配置以使用不試圖描述此特征 的譯碼模式來編碼這些幀。噪聲激勵(lì)線性預(yù)測(NELP)為此譯碼模式的一個(gè)實(shí)例。語音編碼器或語音編碼的方法可經(jīng)配置以在位速率和譯碼模式(還稱為“譯碼方 案”)的不同組合中作出選擇。舉例來說,語音編碼器可經(jīng)配置以針對含有有聲語音的幀和 過渡幀使用全速率CELP方案,針對含有無聲語音的幀使用半速率NELP方案,且針對無效幀 使用八分之一速率NELP方案。此語音編碼器的其它實(shí)例支持用于一個(gè)或一個(gè)以上譯碼方 案的多個(gè)譯碼速率,例如,全速率CELP方案和半速率CELP方案,和/或全速率PPP方案和 四分之一速率PPP方案。如通過語音編碼器或語音編碼方法產(chǎn)生的經(jīng)編碼幀通常含有可借以重建語音信 號的對應(yīng)幀的值。舉例來說,經(jīng)編碼幀可包括幀內(nèi)的能量在頻譜上的分布的描述。此能量 分布還稱為幀的“頻率包絡(luò)”或“頻譜包絡(luò)”。經(jīng)編碼幀通常包括描述幀的頻譜包絡(luò)的有序 值序列。在一些情況下,有序序列的每一值指示在對應(yīng)頻率處或在對應(yīng)頻譜區(qū)上的信號振 幅或量值。此描述的一個(gè)實(shí)例為有序傅立葉(Rnirier)變換系數(shù)序列。在其它情況下,有序序列包括譯碼模型的參數(shù)值。此有序序列的一個(gè)典型實(shí)例為 線性預(yù)測譯碼(LPC)分析的系數(shù)值集合。這些LPC系數(shù)值編碼經(jīng)編碼語音的共振(還被稱 為“共振峰”),且可配置為濾波器系數(shù)或反射系數(shù)。多數(shù)現(xiàn)代語音譯碼器的編碼部分包括提 取每一幀的LPC系數(shù)值集合的分析濾波器。集合(其通常經(jīng)布置為一個(gè)或一個(gè)以上向量) 中的系數(shù)值的數(shù)目還稱為LPC分析的“階數(shù)”。如由通信裝置(例如,蜂窩式電話)的語音 編碼器所執(zhí)行的LPC分析的典型階數(shù)的實(shí)例包括4、6、8、10、12、16、20、24、觀和32。語音譯碼器通常經(jīng)配置成以量化形式越過傳輸信道傳輸頻譜包絡(luò)的描述(例如, 作為進(jìn)入對應(yīng)查找表或“碼簿”中的一個(gè)或一個(gè)以上索引)。因此,對于語音編碼器,可能需 要以可經(jīng)有效量化的形式計(jì)算LPC系數(shù)值的集合,例如線頻譜對(LSP)、線頻譜頻率(LSF)、 導(dǎo)抗頻譜對(ISP)、導(dǎo)抗頻譜頻率(ISF)、倒頻譜系數(shù)或?qū)?shù)面積比的值的集合。語音編碼 器還可經(jīng)配置以在轉(zhuǎn)換和/或量化之前對有序值序列執(zhí)行其它操作(例如,感知加權(quán))。在一些情況下,幀的頻譜包絡(luò)的描述還包括幀的時(shí)間信息的描述(例如,如在傅 立葉變換系數(shù)的有序序列中)。在其它情況下,經(jīng)編碼幀的語音參數(shù)集合還可包括幀的時(shí)間 信息的描述。時(shí)間信息的描述的形式可視用以編碼幀的特定譯碼模式而定。對于一些譯碼 模式來說(例如,對于CELP譯碼模式來說),時(shí)間信息的描述包括對LPC分析的殘差的描述 (還稱為激勵(lì)信號的描述)。對應(yīng)的語音解碼器使用激勵(lì)信號來激勵(lì)(例如,如由頻譜包絡(luò) 的描述所界定的)LPC模型。激勵(lì)信號的描述通常以量化形式(例如,作為進(jìn)入對應(yīng)碼簿中 的一個(gè)或一個(gè)以上索引)出現(xiàn)于經(jīng)編碼幀中。時(shí)間信息的描述還可包括與激勵(lì)信號的音調(diào)分量有關(guān)的信息。對于PPP譯碼模式 來說,例如,經(jīng)編碼的時(shí)間信息可包括待通過語音解碼器使用的原型的描述以再現(xiàn)激勵(lì)信 號的音調(diào)分量。與音調(diào)分量有關(guān)的信息的描述通常以量化形式(例如,作為進(jìn)入對應(yīng)碼簿中的一個(gè)或一個(gè)以上索引)出現(xiàn)于經(jīng)編碼幀中。對于其它譯碼模式來說(例如,對于NELP 譯碼模式來說),時(shí)間信息的描述可包括對幀的時(shí)間包絡(luò)(還稱為幀的“能量包絡(luò)”或“增 益包絡(luò)”)的描述。圖1展示隨時(shí)間變化的有聲語音區(qū)段(例如,元音)的振幅的一個(gè)實(shí)例。對于有 聲幀來說,激勵(lì)信號通常類似以音調(diào)頻率為周期性的一系列脈沖,而對于無聲幀來說,激勵(lì) 信號通常類似于白高斯(Gaussian)噪聲。CELP或PWI編碼器可采用為有聲語音區(qū)段的特 性的較高周期性以實(shí)現(xiàn)較好譯碼效率。圖2A展示隨時(shí)間變化的從背景噪聲過渡到有聲語 音的語音區(qū)段的振幅的實(shí)例,且圖2B展示隨時(shí)間變化的從背景噪聲過渡到有聲語音的語 音區(qū)段的LPC殘差的振幅的實(shí)例。由于LPC殘差的譯碼占用大量經(jīng)編碼信號流,所以已開 發(fā)各種方案以減小譯碼殘差所需要的位速率。這些方案包括CELP、NELP、PWI和PPP??赡苄枰蕴峁╅L途電話質(zhì)量解碼信號的方式以低位速率(例如,每秒2千位) 執(zhí)行語音信號的受約束位速率編碼。長途電話質(zhì)量通常經(jīng)特征化為具有大約200到3200Hz 的帶寬和大于30dB的信噪比(SNI )。在一些情況下,長途電話質(zhì)量還經(jīng)特征化為具有小于 2%或3%的諧波失真。遺憾的是,以接近每秒2千位的位速率編碼語音的現(xiàn)有技術(shù)通常產(chǎn) 生聽起來為人工(例如,機(jī)器人)、有噪音和/或過度諧波(例如,嗡嗡聲)的合成語音。可通常使用噪聲激勵(lì)線性預(yù)測(NELP)譯碼模式以低位速率來執(zhí)行例如靜默和無 聲幀的非話音幀的高質(zhì)量編碼。然而,可能更難以以低位速率來執(zhí)行有聲幀的高質(zhì)量編碼。 已通過針對例如包括從無聲語音到有聲語音的過渡的幀(還稱為開始幀或向上瞬變幀)的 困難幀使用較高位速率且針對后續(xù)有聲幀使用較低位速率以實(shí)現(xiàn)低平均位速率而獲得良 好結(jié)果。然而,對于受約束位速率聲碼器,針對困難幀使用較高位速率的選項(xiàng)可能不可行。例如增強(qiáng)型可變速率編解碼器(EVRC)的現(xiàn)有可變速率聲碼器通常使用例如CELP 的波形譯碼模式以較高位速率來編碼此些困難幀??捎糜谝缘臀凰俾蚀鎯騻鬏斢新曊Z音 區(qū)段的其它譯碼方案包括例如PPP譯碼方案的PWI譯碼方案。此些PWI譯碼方案在殘差信 號中周期性地定位具有一個(gè)音調(diào)周期的長度的原型波形。在解碼器處,在原型之間的音調(diào) 周期內(nèi)內(nèi)插所述殘差信號以獲得原始高度周期性殘差信號的近似。PPP譯碼的一些應(yīng)用使 用混合位速率,使得經(jīng)高位速率編碼的幀為一個(gè)或一個(gè)以上后續(xù)經(jīng)低位速率編碼的幀提供 參考。在此情況下,低位速率幀中的信息的至少一些可被有差別地編碼??赡苄枰詾樾蛄兄械暮罄m(xù)幀的差別PWI (例如,PPP)編碼提供良好原型(即,良 好音調(diào)脈沖形狀參考)和/或音調(diào)脈沖相位參考的無差別方式來編碼過渡幀(例如,開始 幀)??赡苄枰谖凰俾适芗s束的譯碼系統(tǒng)中提供用于開始幀和/或其它過渡幀的譯 碼模式。舉例來說,可能需要在受約束而具有低恒定位速率或低最大位速率的譯碼系統(tǒng)中 提供此譯碼模式。此譯碼系統(tǒng)的應(yīng)用的典型實(shí)例為(例如,如本文中參看圖14所描述的) 衛(wèi)星通信鏈路。如上所論述,語音信號的幀可經(jīng)分類為有聲、無聲或靜默。有聲幀通常為高度周期 性的,而無聲和靜默幀通常為非周期性的。其它可能幀分類包括開始幀、瞬變幀和向下瞬變 幀。開始幀(還稱為向上瞬變幀)通常出現(xiàn)于字的開始處。如在圖2B中的400與600樣 本之間的區(qū)中,開始幀在幀開始時(shí)可為非周期性的(例如,無聲),且在幀結(jié)束時(shí)變?yōu)橹芷?性的(例如,有聲)。瞬變類別包括有聲但具有較不周期性語音的幀。瞬變幀展現(xiàn)音調(diào)的改變和/或減小的周期性,且通常在有聲區(qū)段的中間或結(jié)束處(例如,在語音信號的音調(diào)正在 改變的地方)出現(xiàn)。典型向下瞬變幀具有低能量有聲語音且在字的結(jié)束處出現(xiàn)。開始幀、 瞬變幀和向下瞬變幀也可稱為“過渡”幀。對于語音編碼器來說,可能需要以無差別方式編碼脈沖的位置、振幅和形狀。舉例 來說,可能需要編碼開始幀或一系列有聲幀中的第一幀,使得經(jīng)編碼幀為后續(xù)經(jīng)編碼幀的 激勵(lì)信號提供良好參考原型。此編碼器可經(jīng)配置以定位幀的最終音調(diào)脈沖,定位鄰近于最 終音調(diào)脈沖的音調(diào)脈沖,根據(jù)所述音調(diào)脈沖的峰值之間的距離估計(jì)滯后值,以及產(chǎn)生指示 最終音調(diào)脈沖的位置和所估計(jì)滯后值的經(jīng)編碼幀。此信息在解碼已于無相位信息情況下經(jīng) 編碼的后續(xù)幀中可用作相位參考。編碼器還可經(jīng)配置以產(chǎn)生經(jīng)編碼幀以包括音調(diào)脈沖的形 狀的指示,其在解碼已被有差別地編碼(例如,使用QPPP譯碼方案)的后續(xù)幀中可用作參 考。在譯碼過渡幀(例如,開始幀)中,向后續(xù)幀提供良好的參考比實(shí)現(xiàn)幀的準(zhǔn)確再現(xiàn) 可能更重要。此經(jīng)編碼幀可用以向使用PPP或其它編碼方案編碼的后續(xù)有聲幀提供良好參 考。舉例來說,可能需要經(jīng)編碼幀包括音調(diào)脈沖的形狀的描述(例如,以提供良好的形狀 參考)、音調(diào)滯后的指示(例如,以提供良好的滯后參考)和幀的最終音調(diào)脈沖的位置的指 示(例如,以提供良好的相位參考),同時(shí)可使用較少位來編碼或甚至忽略開始幀的其它特 征。圖3A展示根據(jù)一配置的包括編碼任務(wù)ElOO和E200的語音編碼方法MlOO的流程 圖。任務(wù)ElOO編碼語音信號的第一幀,且任務(wù)E200編碼語音信號的第二幀,其中第二幀在 第一幀之后。任務(wù)ElOO可實(shí)施為無差別地編碼第一幀的參考譯碼模式,且任務(wù)E200可實(shí) 施為相對于第一幀編碼第二幀的相對譯碼模式(例如,差別譯碼模式)。在一個(gè)實(shí)例中,第 一幀為開始幀,且第二幀為緊跟在開始幀之后的有聲幀。第二幀還可為緊跟在開始幀之后 的一系列連續(xù)有聲幀中的第一者。編碼任務(wù)ElOO產(chǎn)生包括激勵(lì)信號的描述的第一經(jīng)編碼幀。此描述包括指示音調(diào) 脈沖在時(shí)域中的形狀(即,音調(diào)原型)和音調(diào)脈沖所重復(fù)的位置的一組值。通過編碼滯后 值連同例如幀的終端音調(diào)脈沖的位置的參考點(diǎn)來指示音調(diào)脈沖位置。在此描述中,使用音 調(diào)脈沖峰值的位置來指示音調(diào)脈沖的位置,盡管本發(fā)明的范圍明確地包括音調(diào)脈沖的位置 等效地通過脈沖的另一特征(例如,其第一或最后樣本)的位置來指示的情形。第一經(jīng)編 碼幀還可包括其它信息的表示,例如,幀的頻譜包絡(luò)(例如,一個(gè)或一個(gè)以上LSP索引)的 描述。任務(wù)ElOO包括基于來自第一幀的至少一個(gè)音調(diào)脈沖的信息而選擇一組時(shí)域音調(diào) 脈沖形狀中的一者的子任務(wù)E110。任務(wù)EllO可經(jīng)配置以選擇與幀中的具有最高峰值的音 調(diào)脈沖最緊密匹配(例如,在最小平方意義上)的形狀?;蛘?,任務(wù)EllO可經(jīng)配置以選擇與 幀中的具有最高能量(例如,經(jīng)平方樣本值的最高和)的音調(diào)脈沖最緊密匹配的形狀?;?者,任務(wù)EllO可經(jīng)配置以選擇與幀的兩個(gè)或兩個(gè)以上音調(diào)脈沖(例如,具有最高峰值和/ 或能量的脈沖)的平均值最緊密匹配的形狀。任務(wù)EllO可經(jīng)實(shí)施以包括穿過音調(diào)脈沖形 狀(還稱為“形狀向量”)的碼簿(即,量化表)的搜索。編碼任務(wù)TlOO還包括計(jì)算幀的終端音調(diào)脈沖位置(例如,幀的初始音調(diào)峰值或幀 的最終音調(diào)峰值的位置)的子任務(wù)E120??上鄬τ趲拈_始、相對于幀的結(jié)束或相對于幀內(nèi)的另一參考位置來指示終端音調(diào)脈沖的位置。任務(wù)E120可經(jīng)配置以通過(例如,基于樣 本的振幅或能量與幀平均值之間的關(guān)系,其中能量通常被計(jì)算為樣本值的平方)選擇接近 幀邊界的樣本并在接近此樣本的區(qū)域內(nèi)搜索具有最大值的樣本而找到終端音調(diào)脈沖峰值。 舉例來說,可根據(jù)以下描述的終端音調(diào)峰值定位任務(wù)LlOO的配置中的任一者來實(shí)施任務(wù) E120。編碼任務(wù)ElOO還包括估計(jì)幀的音調(diào)周期的子任務(wù)E130。音調(diào)周期(還稱為“音 調(diào)滯后值”、“滯后值”、“音調(diào)滯后”或簡稱為“滯后”)指示音調(diào)脈沖之間的距離(即,鄰近音 調(diào)脈沖的峰值之間的距離)。典型音調(diào)頻率范圍為約70到100Hz (對于男性說話者)到約 150到200Hz (對于女性說話者)。對于為SkHz的取樣速率來說,這些音調(diào)頻率范圍對應(yīng)于 約40到50個(gè)樣本的滯后范圍(對于典型女性說話者)和約90到100個(gè)樣本的滯后范圍 (對于典型男性說話者)。為了適應(yīng)具有在這些范圍外的音調(diào)頻率的說話者,可能需要支持 約50到60Hz到約300到400Hz的音調(diào)頻率范圍。對于8kHz的取樣速率,此頻率范圍對應(yīng) 于約20到25個(gè)樣本到約130到160個(gè)樣本的滯后范圍。音調(diào)周期估計(jì)任務(wù)E130可經(jīng)實(shí)施以使用任何合適的音調(diào)估計(jì)程序(例如,作為如 以下描述的滯后估計(jì)任務(wù)L200的實(shí)施方案的例子)來估計(jì)音調(diào)周期。此程序通常包括找 到鄰近于終端音調(diào)峰值的音調(diào)峰值(或以其它方式找到至少兩個(gè)鄰近的音調(diào)峰值)并將滯 后計(jì)算為峰值之間的距離。任務(wù)E130可經(jīng)配置以基于樣本的能量的測量(例如,樣本能量 與幀平均能量之間的比率)和/或樣本的鄰域與所確認(rèn)音調(diào)峰值的類似鄰域(例如,終端 音調(diào)峰值)相關(guān)的程度的測量而將樣本識別為音調(diào)峰值。編碼任務(wù)ElOO產(chǎn)生包括用于第一幀的激勵(lì)信號的特征的表示(例如,由任務(wù)EllO 選擇的時(shí)域音調(diào)脈沖形狀、由任務(wù)E120計(jì)算的終端音調(diào)脈沖位置和由任務(wù)E130估計(jì)的滯 后值)的第一經(jīng)編碼幀。通常,任務(wù)ElOO將經(jīng)配置以在音調(diào)周期估計(jì)任務(wù)E130之前執(zhí)行 音調(diào)脈沖位置計(jì)算任務(wù)E120,且在音調(diào)脈沖形狀選擇任務(wù)EllO之前執(zhí)行音調(diào)周期估計(jì)任 務(wù)E130。第一經(jīng)編碼幀可包括直接指示所估計(jì)滯后值的值?;蛘?,可能需要經(jīng)編碼幀將滯 后值指示為相對于最小值的偏移。對于二十個(gè)樣本的最小滯后值來說,例如,七位數(shù)字可用 以指示在20到147(即,20+0到20+127)個(gè)樣本的范圍中的任何可能整數(shù)滯后值。對于25 個(gè)樣本的最小滯后值來說,7位數(shù)字可用以指示在25到152 (即,25+0到25+127)個(gè)樣本的 范圍中的任何可能整數(shù)滯后值。以此方式,將滯后值編碼為相對于最小值的偏移可用以最 大化所預(yù)期滯后值的范圍的覆蓋同時(shí)最小化編碼值的所述范圍所要求的位的數(shù)目。其它實(shí) 例可經(jīng)配置以支持非整數(shù)滯后值的編碼。第一經(jīng)編碼幀還可能包括與音調(diào)滯后相關(guān)的一個(gè) 以上值,例如第二滯后值或以其它方式指示滯后值從幀的一側(cè)(例如,幀的開始或結(jié)束)到 另一側(cè)的改變的值。很可能幀的音調(diào)脈沖的振幅將彼此不同。在開始幀中,例如,能量可隨時(shí)間增加, 使得接近幀的結(jié)束的音調(diào)脈沖與接近幀的開始的音調(diào)脈沖相比較將具有較大振幅。至少在 此情況下,對于第一經(jīng)編碼幀來說,可能需要包括幀的平均能量隨時(shí)間的變化(還稱為“增 益輪廓”)的描述,例如,音調(diào)脈沖的相對振幅的描述。圖:3B展示編碼任務(wù)ElOO的包括子任務(wù)E140的實(shí)施方案E102的流程圖。任務(wù) E140計(jì)算幀的增益輪廓作為對應(yīng)于第一幀的不同音調(diào)脈沖的一組增益值。舉例來說,增益值中的每一者可對應(yīng)于幀的不同音調(diào)脈沖。任務(wù)E140可包括穿過增益輪廓的碼簿(例如, 量化表)的搜索,以及對與幀的增益輪廓最緊密地匹配(例如,在最小平方意義上)的碼簿 條目的選擇。編碼任務(wù)E102產(chǎn)生包括以下各項(xiàng)的表示的第一經(jīng)編碼幀由任務(wù)EllO選擇 的時(shí)域音調(diào)脈沖形狀、由任務(wù)E120計(jì)算的終端音調(diào)脈沖位置、由任務(wù)E130估計(jì)的滯后值和 由任務(wù)E140計(jì)算的所述組增益值。圖4展示幀中的這些特征的示意性表示,其中標(biāo)記“1” 指示終端音調(diào)脈沖位置,標(biāo)記“2”指示所估計(jì)滯后值,標(biāo)記“3”指示選定的時(shí)域音調(diào)脈沖形 狀,且標(biāo)記“4”指示在增益輪廓中經(jīng)編碼的值(例如,音調(diào)脈沖的相對振幅)。通常,任務(wù) E102將經(jīng)配置以在增益值計(jì)算任務(wù)E140之前執(zhí)行音調(diào)周期估計(jì)任務(wù)E130,增益值計(jì)算任 務(wù)E140可與音調(diào)脈沖形狀選擇任務(wù)EllO串行或并行地執(zhí)行。在一個(gè)實(shí)例中(如圖沈的 表中所示),編碼任務(wù)E102以四分之一速率操作以產(chǎn)生四十位的經(jīng)編碼幀,其包括指示參 考脈沖位置的七個(gè)位、指示參考脈沖形狀的七個(gè)位、指示參考滯后值的七個(gè)位、指示增益輪 廓的四個(gè)位、載運(yùn)一個(gè)或一個(gè)以上LSP索引的十三個(gè)位,和指示幀的譯碼模式的兩個(gè)位(例 如,指示例如NELP的無聲譯碼模式的“00”,指示例如QPPP的相對譯碼模式的“01”,和指示 參考譯碼模式E102的“10”)。第一經(jīng)編碼幀可包括幀中的音調(diào)脈沖(或音調(diào)峰值)的數(shù)目的顯性指示?;蛘撸瑤?中的音調(diào)脈沖或音調(diào)峰值的數(shù)目可經(jīng)隱式編碼。舉例來說,第一經(jīng)編碼幀可僅使用音調(diào)滯 后和終端音調(diào)脈沖的位置(例如,終端音調(diào)峰值的位置)來指示幀中的所有音調(diào)脈沖的位 置。對應(yīng)的解碼器可經(jīng)配置以從滯后值和終端音調(diào)脈沖的位置計(jì)算音調(diào)脈沖的潛在位置并 從增益輪廓獲得每一潛在脈沖位置的振幅。對于幀含有少于潛在脈沖位置的脈沖的情況, 增益輪廓可針對潛在脈沖位置中的一者或一者以上指示為零(或其它極小值)的增益值。如本文中所提及,開始幀可以無聲開始并以有聲結(jié)束。對于對應(yīng)的經(jīng)編碼幀來說, 與支持整個(gè)開始幀的準(zhǔn)確再現(xiàn)相比可能更需要為后續(xù)幀提供良好參考,且可實(shí)施方法MlOO 以僅提供對編碼此開始幀的初始無聲部分的有限支持。舉例來說,任務(wù)E140可經(jīng)配置以選 擇指示無聲部分內(nèi)的任何音調(diào)脈沖周期的為零(或接近零)的增益值的增益輪廓?;蛘?, 任務(wù)E140可經(jīng)配置以選擇指示無聲部分內(nèi)的音調(diào)周期的非零增益值的增益輪廓。在一個(gè) 此類實(shí)例中,任務(wù)E140選擇以零或接近零開始,并單調(diào)地上升到幀的有聲部分的第一音調(diào) 脈沖的增益水平的一般增益輪廓。任務(wù)E140可經(jīng)配置以計(jì)算所述組增益值作為對一組增益向量量化(VQ)表中的一 者的索引,其中不同的增益VQ表用于不同數(shù)目個(gè)脈沖。所述組表可經(jīng)配置以使得每一增益 VQ表含有相同數(shù)目個(gè)條目,且不同增益VQ表含有不同長度的向量。在此編碼系統(tǒng)中,任務(wù) E140基于終端音調(diào)脈沖的位置和音調(diào)滯后來計(jì)算音調(diào)脈沖的所估計(jì)數(shù)目,且此所估計(jì)數(shù)目 被用以選擇所述組增益VQ表中的一者。在此情況下,還可通過解碼經(jīng)編碼幀的對應(yīng)方法來 執(zhí)行類似操作。如果音調(diào)脈沖的所估計(jì)數(shù)目大于幀中的音調(diào)脈沖的實(shí)際數(shù)目,則任務(wù)E140 還可通過如上所描述將幀中的每一額外音調(diào)脈沖周期的增益設(shè)定為較小值或零而傳達(dá)此 fn息ο編碼任務(wù)E200編碼語音信號的在第一幀之后的第二幀。任務(wù)E200可實(shí)施為相對 于第一幀的對應(yīng)特征編碼第二幀的特征的相對譯碼模式(例如,差別譯碼模式)。任務(wù)E200 包括計(jì)算當(dāng)前幀的音調(diào)脈沖形狀與先前幀的音調(diào)脈沖形狀之間的音調(diào)脈沖形狀差別的子 任務(wù)E210。舉例來說,任務(wù)E210可經(jīng)配置以從第二幀提取音調(diào)原型,并將音調(diào)脈沖形狀差別計(jì)算為所提取原型與第一幀的音調(diào)原型(即,選定的音調(diào)脈沖形狀)之間的差??捎扇?務(wù)E210執(zhí)行的原型提取操作的實(shí)例包括在2004年6月22日發(fā)布的第6,7M,630號美國 專利(Das等人)和2006年11月14日發(fā)布的第7,136,812號美國專利(Manjunath等人) 中描述的原型提取操作??赡苄枰渲萌蝿?wù)E210以將音調(diào)脈沖形狀差別計(jì)算為在頻域中兩個(gè)原型之間的 差。圖5A展示包括音調(diào)脈沖形狀差別計(jì)算任務(wù)E210的實(shí)施方案E212的編碼任務(wù)E200的 實(shí)施方案E202的圖。任務(wù)E212包括計(jì)算當(dāng)前幀的頻域音調(diào)原型的子任務(wù)E214。舉例來 說,任務(wù)E214可經(jīng)配置以對經(jīng)提取的原型執(zhí)行快速傅立葉變換運(yùn)算,或以其它方式將所提 取的原型轉(zhuǎn)換到頻域。任務(wù)E212的此實(shí)施方案還可經(jīng)配置以通過以下操作而計(jì)算音調(diào)脈 沖形狀差別將頻域原型劃分為多個(gè)頻段(例如,一組非重疊頻段),計(jì)算其要素為每一頻 段中的平均量值的對應(yīng)頻率量值向量,以及將音調(diào)脈沖形狀差別計(jì)算為原型的頻率量值向 量與先前幀的原型的頻率量值向量之間的向量差。在此情況下,任務(wù)E212還可經(jīng)配置以向 量量化音調(diào)脈沖形狀差別,使得對應(yīng)的經(jīng)編碼幀包括經(jīng)量化的差別。編碼任務(wù)E200還包括計(jì)算當(dāng)前幀的音調(diào)周期與先前幀的音調(diào)周期之間的音調(diào)周 期差別的子任務(wù)E220。舉例來說,任務(wù)E220可經(jīng)配置以估計(jì)當(dāng)前幀的音調(diào)滯后并減去先前 幀的音調(diào)滯后值以獲得音調(diào)周期差別。在一個(gè)此類實(shí)例中,任務(wù)E220經(jīng)配置以將音調(diào)周期 差別計(jì)算為(當(dāng)前滯后估計(jì)-先前滯后估計(jì)+7)。為了估計(jì)音調(diào)滯后,任務(wù)E220可經(jīng)配置以 使用任何合適的音調(diào)估計(jì)技術(shù),例如,以上描述的音調(diào)周期估計(jì)任務(wù)E130的例子、以下描 述的滯后估計(jì)任務(wù)L200的例子,或如在以上參考的EVRC文獻(xiàn)C. S0014-C的章節(jié)4. 6. 3 (第 4-44到4-49頁)中描述的程序,所述章節(jié)在此作為一實(shí)例以引用方式并入。對于先前幀的 未經(jīng)量化的音調(diào)滯后值不同于先前幀的經(jīng)解量化的音調(diào)滯后值的情況來說,可能需要任務(wù) E220通過從當(dāng)前滯后估計(jì)減去經(jīng)解量化值來計(jì)算音調(diào)周期差別??墒褂美缢姆种凰俾蔖PP(QPPP)的具有受限時(shí)間同步性的譯碼方案來實(shí)施 編碼任務(wù)E200。QPPP的實(shí)施方案在2007年1月的標(biāo)題為“用于寬帶擴(kuò)頻數(shù)字系統(tǒng)的增強(qiáng) 型可變速率編解碼器、語音服務(wù)選項(xiàng)3、68和70 (Enhanced Variable Rate Codec, Speech Service Options 3,68, and 70 for Wideband Spread Spectrum Digital Systems),,白勺 第三代合作伙伴計(jì)劃2 (3GPP2)的文獻(xiàn)C. S0014-C版本1. 0 (在誦.3gpp. org可在線獲得) 的章節(jié)4. 2.4(第4-10到4-17頁)和4. 12. 28 (第4-132到4-138頁)中描述,所述章節(jié) 在此作為一實(shí)例以引用的方式并入。此譯碼方案使用帶寬隨頻率增加的二十一個(gè)頻段的非 均勻集合來計(jì)算原型的頻率量值向量。使用QPPP產(chǎn)生的經(jīng)編碼幀的四十個(gè)位包括載運(yùn)一 個(gè)或一個(gè)以上LSP索引的十六個(gè)位、載運(yùn)增量滯后值的四個(gè)位、載運(yùn)幀的振幅信息的十八 個(gè)位、指示模式的一個(gè)位和一個(gè)保留位(如圖沈的表中所示)。相對的譯碼方案的此實(shí)例 不包括用于脈沖形狀的位和用于相位信息的位。如上所提及,任務(wù)E100中經(jīng)編碼的幀可為開始幀,且任務(wù)E200中經(jīng)編碼的幀可為 緊跟在開始幀之后一系列連續(xù)有聲幀中的第一者。圖5B展示方法M100的包括子任務(wù)E300 的實(shí)施方案MllO的流程圖。任務(wù)E300編碼在第二幀之后的第三幀。舉例來說,第三幀可 為緊跟在開始幀之后的一系列連續(xù)有聲幀中的第二者。編碼任務(wù)E300可實(shí)施為如本文中 所描述的任務(wù)E200的實(shí)施的例子(例如,實(shí)施為QPPP編碼的例子)。在一個(gè)此類實(shí)例中, 任務(wù)E300包括任務(wù)E210的(例如,任務(wù)E212的)例子,其經(jīng)配置以計(jì)算第三幀的音調(diào)原型與第二幀的音調(diào)原型之間的音調(diào)脈沖形狀差別;以及任務(wù)E220的例子,其經(jīng)配置以計(jì)算 第三幀的音調(diào)周期與第二幀的音調(diào)周期之間的音調(diào)周期差別。在另一個(gè)此類實(shí)例中,任務(wù) E300包括任務(wù)E210的(例如,任務(wù)E212的)例子,其經(jīng)配置以計(jì)算第三幀的音調(diào)原型與 第一幀的選定的音調(diào)脈沖形狀之間的音調(diào)脈沖形狀差別;以及任務(wù)E220的例子,其經(jīng)配置 以計(jì)算第三幀的音調(diào)周期與第一幀的音調(diào)周期之間的音調(diào)周期差別。圖5C展示方法MlOO的包括子任務(wù)TlOO的實(shí)施方案M120的流程圖。任務(wù)TlOO 檢測包括從無聲語音到有聲語音的過渡的幀(還稱為向上瞬變幀或開始幀)。任務(wù)TlOO可 經(jīng)配置以根據(jù)以下描述(例如,參看譯碼方案選擇器C200)的EVRC分類方案執(zhí)行幀分類, 且還可經(jīng)配置以(例如,如以下參看幀重新分類器RClO所描述)對幀進(jìn)行重新分類。圖6A展示經(jīng)配置以編碼語音信號的幀的設(shè)備MF100的框圖。設(shè)備MF100包括用 于編碼語音信號的第一幀的裝置FE100和用于編碼語音信號的第二幀的裝置FE200,其中 第二幀在第一幀之后。裝置FE100包括用于(例如,如上文參看任務(wù)EllO的各種實(shí)施方案 所描述)基于來自第一幀的至少一個(gè)音調(diào)脈沖的信息而選擇一組時(shí)域音調(diào)脈沖形狀中的 一者的裝置FE110。裝置FE100還包括用于(例如,如上文參看任務(wù)E120的各種實(shí)施方案 所描述)計(jì)算第一幀的終端音調(diào)脈沖的位置的裝置FE120。裝置FE100還包括用于(例如, 如上文參看任務(wù)E130的各種實(shí)施方案所描述)估計(jì)第一幀的音調(diào)周期的裝置FE130。圖 6B展示裝置FE100的實(shí)施方案FE102的框圖,所述實(shí)施方案FE102還包括用于(例如,如上 文參看任務(wù)E140的各種實(shí)施方案所描述)計(jì)算對應(yīng)于第一幀的不同音調(diào)脈沖的一組增益 值的裝置FE140。裝置FE200包括用于(例如,如上文參看任務(wù)E210的各種實(shí)施方案所描述)計(jì) 算在第二幀的音調(diào)脈沖形狀與第一幀的音調(diào)脈沖形狀之間的音調(diào)脈沖形狀差別的裝置 FE210。裝置FE200還包括用于(例如,如上文參看任務(wù)E220的各種實(shí)施方案所描述)計(jì) 算在第二幀的音調(diào)周期與第一幀的音調(diào)周期之間的音調(diào)周期差別的裝置FE220。圖7A展示根據(jù)一般配置的解碼語音信號的激勵(lì)信號的方法M200的流程圖。方法 M200包括解碼第一經(jīng)編碼幀的一部分以獲得第一激勵(lì)信號的任務(wù)D100,其中所述部分包 括時(shí)域音調(diào)脈沖形狀、音調(diào)脈沖位置和音調(diào)周期的表示。任務(wù)DlOO包括根據(jù)音調(diào)脈沖位置 將時(shí)域音調(diào)脈沖形狀的第一副本布置于第一激勵(lì)信號內(nèi)的子任務(wù)D110。任務(wù)DlOO還包括 根據(jù)音調(diào)脈沖位置和音調(diào)周期將時(shí)域音調(diào)脈沖形狀的第二副本布置于第一激勵(lì)信號內(nèi)的 子任務(wù)D120。在一個(gè)實(shí)例中,任務(wù)Dl 10和D120(例如,根據(jù)來自第一經(jīng)編碼幀的表示形狀 的索引)從碼簿獲得時(shí)域音調(diào)脈沖形狀,并將其復(fù)制到激勵(lì)信號緩沖器。任務(wù)DlOO和/或 方法M200還可經(jīng)實(shí)施以包括進(jìn)行以下操作的任務(wù)(例如,通過解量化來自第一經(jīng)編碼幀 的一個(gè)或一個(gè)以上經(jīng)量化LSP向量并對結(jié)果進(jìn)行逆變換)從第一經(jīng)編碼幀獲得一組LPC系 數(shù)值,根據(jù)所述組LPC系數(shù)值配置合成濾波器,以及向經(jīng)配置的合成濾波器施加第一激勵(lì) 信號以獲得第一經(jīng)解碼幀。圖7B展示解碼任務(wù)DlOO的實(shí)施方案D102的流程圖。在此情況下,第一經(jīng)編碼幀 的部分還包括一組增益值的表示。任務(wù)D102包括向時(shí)域音調(diào)脈沖形狀的第一副本應(yīng)用所 述組增益值中的一者的子任務(wù)D130。任務(wù)D102還包括向時(shí)域音調(diào)脈沖形狀的第二副本應(yīng) 用所述組增益值中的一不同者的子任務(wù)D140。在一個(gè)實(shí)例中,任務(wù)D130在任務(wù)DllO期間 將其增益值應(yīng)用到形狀,且任務(wù)D140在任務(wù)D120期間將其增益值應(yīng)用到形狀。在另一實(shí)例中,任務(wù)D130在已執(zhí)行任務(wù)DllO之后將其增益值應(yīng)用到激勵(lì)信號緩沖器的對應(yīng)部分,且 任務(wù)D140在已執(zhí)行任務(wù)D120之后將其增益值應(yīng)用到激勵(lì)信號緩沖器的對應(yīng)部分。方法 M200的包括任務(wù)D102的實(shí)施方案可經(jīng)配置以包括向經(jīng)配置的合成濾波器施加所得的經(jīng)增 益調(diào)整的激勵(lì)信號以獲得第一經(jīng)解碼幀的任務(wù)。方法M200還包括解碼第二經(jīng)編碼幀的部分以獲得第二激勵(lì)信號的任務(wù)D200,其 中所述部分包括音調(diào)脈沖形狀差別和音調(diào)周期差別的表示。任務(wù)D200包括基于時(shí)域音調(diào) 脈沖形狀和音調(diào)脈沖形狀差別而計(jì)算第二音調(diào)脈沖形狀的子任務(wù)D210。任務(wù)D200還包括 基于音調(diào)周期和音調(diào)周期差別而計(jì)算第二音調(diào)周期的子任務(wù)D220。任務(wù)D200還包括根據(jù) 音調(diào)脈沖位置和第二音調(diào)周期將第二音調(diào)脈沖形狀的兩個(gè)或兩個(gè)以上副本布置于第二激 勵(lì)信號內(nèi)的子任務(wù)D230。任務(wù)D230可包括將第二激勵(lì)信號內(nèi)的副本中的每一者的位置計(jì) 算為從音調(diào)脈沖位置的對應(yīng)偏移,其中每一偏移為第二音調(diào)周期的整數(shù)倍數(shù)。任務(wù)D200和 /或方法M200還可經(jīng)實(shí)施以包括進(jìn)行以下操作的任務(wù)(例如,通過解量化來自第二經(jīng)編碼 幀的一個(gè)或一個(gè)以上經(jīng)量化LSP向量并對結(jié)果進(jìn)行逆變換)從第二經(jīng)編碼幀獲得一組LPC 系數(shù)值,根據(jù)所述組LPC系數(shù)值配置合成濾波器,以及向經(jīng)配置的合成濾波器施加第二激 勵(lì)信號以獲得第二經(jīng)解碼幀。圖8A展示用于解碼語音信號的激勵(lì)信號的設(shè)備MF200的框圖。設(shè)備MF200包括 用于解碼第一經(jīng)編碼幀的一部分以獲得第一激勵(lì)信號的裝置FD100,其中所述部分包括時(shí) 域音調(diào)脈沖形狀、音調(diào)脈沖位置和音調(diào)周期的表示。裝置FD100包括用于根據(jù)音調(diào)脈沖位 置將時(shí)域音調(diào)脈沖形狀的第一副本布置于第一激勵(lì)信號內(nèi)的裝置FD110。裝置FD100還包 括用于根據(jù)音調(diào)脈沖位置和音調(diào)周期將時(shí)域音調(diào)脈沖形狀的第二副本布置于第一激勵(lì)信 號內(nèi)的裝置FD120。在一個(gè)實(shí)例中,裝置FDllO和FD120經(jīng)配置以(例如,根據(jù)來自第一經(jīng) 編碼幀的表示形狀的索引)從碼簿獲得時(shí)域音調(diào)脈沖形狀,并將其復(fù)制到激勵(lì)信號緩沖器 中。裝置FD200和/或設(shè)備MF200還可經(jīng)實(shí)施以包括(例如,通過解量化來自第一經(jīng)編碼 幀的一個(gè)或一個(gè)以上經(jīng)量化LSP向量并對結(jié)果進(jìn)行逆變換)從第一經(jīng)編碼幀獲得一組LPC 系數(shù)值的裝置,用于根據(jù)所述組LPC系數(shù)值配置合成濾波器的裝置,以及用于向經(jīng)配置的 合成濾波器施加第一激勵(lì)信號以獲得第一經(jīng)解碼幀的裝置。圖8B展示用于解碼的裝置FD100的實(shí)施方案FD102的流程圖。在此情況下,第 一經(jīng)編碼幀的所述部分還包括一組增益值的表示。裝置FD102包括用于向所述時(shí)域音調(diào) 脈沖形狀的第一副本應(yīng)用所述組增益值中的一者的裝置FD130。裝置FD102還包括用于向 時(shí)域音調(diào)脈沖形狀的第二副本應(yīng)用所述組增益值中的一不同者的裝置FD140。在一個(gè)實(shí)例 中,裝置FD130將其增益值應(yīng)用到裝置FDl 10內(nèi)的形狀,且裝置FD140將其增益值應(yīng)用到裝 置FD120內(nèi)的形狀。在另一實(shí)例中,裝置FD130將其增益值應(yīng)用到激勵(lì)信號緩沖器的裝置 FDllO已布置第一副本的一部分,且裝置FD140將其增益值應(yīng)用到激勵(lì)信號緩沖器的裝置 FD120已布置第二副本的一部分。設(shè)備MF200的包括裝置FD102的實(shí)施方案可經(jīng)配置以包 括用于向經(jīng)配置的合成濾波器施加所得經(jīng)增益調(diào)整的激勵(lì)信號以獲得第一經(jīng)解碼幀的裝 置。設(shè)備MF200還包括用于解碼第二經(jīng)編碼幀的一部分以獲得第二激勵(lì)信號的裝置 FD200,其中所述部分包括音調(diào)脈沖形狀差別和音調(diào)周期差別的表示。裝置FD200包括用于 基于時(shí)域音調(diào)脈沖形狀和音調(diào)脈沖形狀差別而計(jì)算第二音調(diào)脈沖形狀的裝置FD210。裝置FD200還包括用于基于音調(diào)周期和音調(diào)周期差別而計(jì)算第二音調(diào)周期的裝置FD220。裝置 FD200還包括用于根據(jù)音調(diào)脈沖位置和第二音調(diào)周期將第二音調(diào)脈沖形狀的兩個(gè)或兩個(gè)以 上副本布置于第二激勵(lì)信號內(nèi)的裝置FD230。裝置FD230可經(jīng)配置以將第二激勵(lì)信號內(nèi)的 副本中的每一者的位置計(jì)算為從音調(diào)脈沖位置的對應(yīng)偏移,其中每一偏移為第二音調(diào)周期 的整數(shù)倍數(shù)。裝置FD200和/或設(shè)備MF200還可經(jīng)實(shí)施以包括(例如,通過解量化來自第 二經(jīng)編碼幀的一個(gè)或一個(gè)以上經(jīng)量化LSP向量并對結(jié)果進(jìn)行逆變換)從第二經(jīng)編碼幀獲得 一組LPC系數(shù)值的裝置,用于根據(jù)所述組LPC系數(shù)值配置合成濾波器的裝置,以及用于向經(jīng) 配置的合成濾波器施加第二激勵(lì)信號以獲得第二經(jīng)解碼幀的裝置。圖9A展示語音編碼器AE10,其經(jīng)布置以接收數(shù)字化的語音信號SlOO (例如,作為 一系列幀)并產(chǎn)生對應(yīng)的經(jīng)編碼信號S200(例如,作為一系列對應(yīng)的經(jīng)編碼幀)以供在通 信信道ClOO (例如,有線、光學(xué)和/或無線通信鏈路)上傳輸?shù)秸Z音解碼器AD10。語音解碼 器ADlO經(jīng)布置以解碼經(jīng)編碼的語音信號S200的所接收版本S300并合成對應(yīng)的輸出語音 信號S400。語音編碼器AElO可經(jīng)實(shí)施以包括設(shè)備MF100的例子和/或執(zhí)行方法MlOO的實(shí) 施方案。語音解碼器ADlO可經(jīng)實(shí)施以包括設(shè)備MF200的例子和/或執(zhí)行方法M200的實(shí)施 方案。如上文所描述,語音信號SlOO表示已根據(jù)在此項(xiàng)技術(shù)中已知的各種方法中的任 一者(例如脈碼調(diào)制(PCM)、壓擴(kuò)μ定律或A定律)而數(shù)字化和量化的模擬信號(例如,如 由麥克風(fēng)所俘獲)。所述信號還可能已在模擬和/或數(shù)字域中經(jīng)受其它預(yù)處理操作,例如噪 聲抑制、感知加權(quán)和/或其它濾波操作。另外或替代地,可在語音編碼器AElO內(nèi)執(zhí)行此些 操作。語音信號SlOO的例子還可表示已經(jīng)數(shù)字化和量化的模擬信號(例如,如由麥克風(fēng)的 陣列所俘獲)的組合。圖9Β展示語音編碼器AElO的第一例子AElOa,其經(jīng)布置以接收經(jīng)數(shù)字化的語音信 號SlOO的第一例子SllO并產(chǎn)生經(jīng)編碼信號S200的對應(yīng)例子S210以供在通信信道ClOO 的第一例子CllO上傳輸?shù)秸Z音解碼器ADlO的第一例子ADIOa。語音解碼器ADlOa經(jīng)布置 以解碼經(jīng)編碼的語音信號S210的所接收版本S310并合成輸出語音信號S400的對應(yīng)例子 S410。圖9B還展示語音編碼器AElO的第二例子AElOb,其經(jīng)布置以接收經(jīng)數(shù)字化的語音 信號SlOO的第二例子S120并產(chǎn)生經(jīng)編碼信號S200的對應(yīng)例子S220以供在通信信道ClOO 的第二例子C120上傳輸?shù)秸Z音解碼器ADlO的第二例子ADIOb。語音解碼器ADlOb經(jīng)布置 以解碼經(jīng)編碼的語音信號S220的所接收版本S320并合成輸出語音信號S400的對應(yīng)例子 S420。語音編碼器AElOa和語音解碼器ADlOb (類似地,語音編碼器AElOb和語音解碼器 ADlOa)可在用于傳輸并接收語音信號的包括(例如)以下參看圖14所描述的用戶終端、地 面站或網(wǎng)關(guān)的任何通信裝置中一起使用。如本文中所描述,語音編碼器AElO可以許多不同 方式來實(shí)施,且語音編碼器AElOa和AElOb可為語音編碼器AElO的不同實(shí)施方案的例子。 同樣,語音解碼器ADlO可以許多不同方式來實(shí)施,且語音解碼器ADlOa和ADlOb可為語音 解碼器ADlO的不同實(shí)施方案的例子。圖IOA展示根據(jù)一般配置的用于編碼語音信號的幀的設(shè)備的框圖,所述設(shè)備包 括第一幀編碼器100,其經(jīng)配置以編碼語音信號的第一幀以作為第一經(jīng)編碼幀;以及第二幀編碼器200,其經(jīng)配置以編碼語音信號的第二幀以作為第二經(jīng)編碼幀,其中第二幀在第一 幀之后。語音編碼器AElO可經(jīng)實(shí)施以包括設(shè)備AlOO的例子。第一幀編碼器100包括音調(diào) 脈沖形狀選擇器110,其經(jīng)配置以(例如,如上文參看任務(wù)EllO的各種實(shí)施方案所描述) 基于來自第一幀的至少一個(gè)音調(diào)脈沖的信息來選擇一組時(shí)域音調(diào)脈沖形狀中的一者。編碼 器100還包括音調(diào)脈沖位置計(jì)算器120,其經(jīng)配置以(例如,如上文參看任務(wù)E120的各種 實(shí)施方案所描述)計(jì)算第一幀的終端音調(diào)脈沖的位置。編碼器100還包括音調(diào)周期估計(jì)器 130,其經(jīng)配置以(例如,如上文參看任務(wù)E130的各種實(shí)施方案所描述)估計(jì)第一幀的音調(diào) 周期。圖IOB展示編碼器100的還包括增益值計(jì)算器140的實(shí)施方案102的框圖,所述增 益值計(jì)算器140經(jīng)配置以(例如,如上文參看任務(wù)E140的各種實(shí)施方案所描述)計(jì)算對應(yīng) 于第一幀的不同音調(diào)脈沖的一組增益值。第二幀編碼器200包括音調(diào)脈沖形狀差別計(jì)算器210,其經(jīng)配置以(例如,如上文 參看任務(wù)E210的各種實(shí)施方案所描述)計(jì)算第二幀的音調(diào)脈沖形狀與第一幀的音調(diào)脈沖 形狀之間的音調(diào)脈沖形狀差別。編碼器200還包括音調(diào)脈沖差別計(jì)算器220,其經(jīng)配置以 (例如,如上文參看任務(wù)E220的各種實(shí)施方案所描述)計(jì)算第二幀的音調(diào)周期與第一幀的 音調(diào)周期之間的音調(diào)周期差別。圖IlA展示根據(jù)一般配置的用于解碼語音信號的激勵(lì)信號的包括第一幀解碼器 300和第二幀解碼器400的設(shè)備A200的框圖。解碼器300經(jīng)配置以解碼第一經(jīng)編碼幀的一 部分以獲得第一激勵(lì)信號,其中所述部分包括時(shí)域音調(diào)脈沖形狀、音調(diào)脈沖位置和音調(diào)周 期的表示。解碼器300包括第一激勵(lì)信號產(chǎn)生器310,其經(jīng)配置以根據(jù)音調(diào)脈沖位置將時(shí)域 音調(diào)脈沖形狀的第一副本布置于第一激勵(lì)信號內(nèi)。激勵(lì)產(chǎn)生器310還經(jīng)配置以根據(jù)音調(diào)脈 沖位置和音調(diào)周期將時(shí)域音調(diào)脈沖形狀的第二副本布置于第一激勵(lì)信號內(nèi)。舉例來說,產(chǎn) 生器310可經(jīng)配置以執(zhí)行如本文中所描述的任務(wù)DllO和D120的實(shí)施方案。在此實(shí)例中, 解碼器300還包括合成濾波器320,合成濾波器320根據(jù)由解碼器300從第一經(jīng)編碼幀(例 如,通過解量化來自第一經(jīng)編碼幀的一個(gè)或一個(gè)以上經(jīng)量化的LSP向量并對結(jié)果進(jìn)行逆變 換)獲得的一組LPC系數(shù)值而經(jīng)配置,且經(jīng)布置以對激勵(lì)信號進(jìn)行濾波而獲得第一經(jīng)解碼 幀。圖IlB展示第一激勵(lì)信號產(chǎn)生器310的實(shí)施方案312的框圖,其針對第一經(jīng)編碼 幀的部分還包括一組增益值的表示的情況而包括第一乘法器330和第二乘法器340。第一 乘法器330經(jīng)配置以向時(shí)域音調(diào)脈沖形狀的第一副本應(yīng)用所述組增益值中的一者。舉例來 說,第一乘法器330可經(jīng)配置以執(zhí)行如本文中所描述的任務(wù)D130的實(shí)施方案。第二乘法器 340經(jīng)配置以向時(shí)域音調(diào)脈沖形狀的第二副本應(yīng)用所述組增益值中的一不同者。舉例來說, 第二乘法器340可經(jīng)配置以執(zhí)行如本文中所描述的任務(wù)D140的實(shí)施方案。在解碼器300 的包括產(chǎn)生器312的實(shí)施方案中,合成濾波器320可經(jīng)布置以對所得經(jīng)增益調(diào)整的激勵(lì)信 號進(jìn)行濾波從而獲得第一經(jīng)解碼幀。第一乘法器330和第二乘法器340在不同時(shí)間可使用 不同結(jié)構(gòu)或使用同一結(jié)構(gòu)來實(shí)施。第二幀解碼器400經(jīng)配置以解碼第二經(jīng)編碼幀的部分以獲得第二激勵(lì)信號,其中 所述部分包括音調(diào)脈沖形狀差別和音調(diào)周期差別的表示。解碼器400包括第二激勵(lì)信號產(chǎn) 生器440,所述第二激勵(lì)信號產(chǎn)生器440包括音調(diào)脈沖形狀計(jì)算器410和音調(diào)周期計(jì)算器 420。音調(diào)脈沖形狀計(jì)算器410經(jīng)配置以基于時(shí)域音調(diào)脈沖形狀和音調(diào)脈沖形狀差別而計(jì)算第二音調(diào)脈沖形狀。舉例來說,音調(diào)脈沖形狀計(jì)算器410可經(jīng)配置以執(zhí)行如本文中所描 述的任務(wù)D210的實(shí)施方案。音調(diào)周期計(jì)算器420經(jīng)配置以基于音調(diào)周期和音調(diào)周期差別而 計(jì)算第二音調(diào)周期。舉例來說,音調(diào)周期計(jì)算器420可經(jīng)配置以執(zhí)行如本文中所描述的任 務(wù)D220的實(shí)施方案。激勵(lì)產(chǎn)生器440經(jīng)配置以根據(jù)音調(diào)脈沖位置和第二音調(diào)周期將第二 音調(diào)脈沖形狀的兩個(gè)或兩個(gè)以上副本布置于第二激勵(lì)信號內(nèi)。舉例來說,產(chǎn)生器440可經(jīng) 配置以執(zhí)行如本文中所描述的任務(wù)D230的實(shí)施方案。在此實(shí)例中,解碼器400還包括合成 濾波器430,合成濾波器430根據(jù)由解碼器400從第一經(jīng)編碼幀(例如,通過解量化來自第 一經(jīng)編碼幀的一個(gè)或一個(gè)以上經(jīng)量化LSP向量并對結(jié)果進(jìn)行逆變換)獲得的一組LPC系數(shù) 值而經(jīng)配置,且經(jīng)布置以對第二激勵(lì)信號進(jìn)行濾波而獲得第二經(jīng)解碼幀。合成濾波器320、 合成濾波器430在不同時(shí)間可使用不同結(jié)構(gòu)或使用同一結(jié)構(gòu)來實(shí)施。語音解碼器ADlO可 經(jīng)實(shí)施以包括設(shè)備A200的例子。圖12A展示語音編碼器AElO的多模式實(shí)施方案AE20的框圖。編碼器AE20包括 第一幀編碼器100的實(shí)施方案(例如,編碼器10 、第二幀編碼器200的實(shí)施方案、無聲幀 編碼器UElO (例如,QNELP編碼器)和譯碼方案選擇器C200。譯碼方案選擇器C200經(jīng)配置 以(例如,根據(jù)如以下描述的經(jīng)修改EVRC幀分類方案)分析語音信號SlOO的傳入幀的特 性,以經(jīng)由選擇器50a、50b來選擇用于每一幀的編碼器100、200和UElO中的適當(dāng)一者。可 能需要實(shí)施第二幀編碼器200以應(yīng)用四分之一速率PPP (QPPP)譯碼方案且實(shí)施無聲幀編碼 器UElO以應(yīng)用四分之一速率NELP (QNELP)譯碼方案。圖12B展示語音編碼器ADlO的包括 以下各項(xiàng)的類似多模式實(shí)施方案AD20的框圖第一幀解碼器300的實(shí)施方案(例如,解碼 器30 、第二幀編碼器400的實(shí)施方案、無聲幀解碼器UDlO (例如,QNELP解碼器)和譯碼 方案檢測器C300。譯碼方案檢測器C300經(jīng)配置以(例如,根據(jù)經(jīng)編碼幀的一個(gè)或一個(gè)以 上模式位,例如第一位和/或最后位)確定接收到的經(jīng)編碼語音信號S300的經(jīng)編碼幀的格 式,以經(jīng)由選擇器90a、90b選擇用于每一經(jīng)編碼幀的解碼器300、400和UDlO中的適當(dāng)對應(yīng) “"者 ο圖13展示可包括于語音編碼器AElO的實(shí)施方案內(nèi)的殘差產(chǎn)生器RlO的框圖。產(chǎn) 生器RlO包括LPC分析模塊R110,LPC分析模塊RllO經(jīng)配置以基于語音信號SlOO的當(dāng)前 幀計(jì)算一組LPC系數(shù)值。變換塊R120經(jīng)配置以將所述組LPC系數(shù)值轉(zhuǎn)換為一組LSF,且量 化器R130經(jīng)配置以量化LSF (例如,作為一個(gè)或一個(gè)以上碼簿索引)以產(chǎn)生LPC參數(shù)SL10。 逆量化器R140經(jīng)配置以從經(jīng)量化的LPC參數(shù)SLlO獲得一組經(jīng)解碼的LSF,且逆變換塊R150 經(jīng)配置以從所述組經(jīng)解碼的LSF獲得一組經(jīng)解碼的LPC系數(shù)值。根據(jù)所述組經(jīng)解碼的LPC 系數(shù)值配置的白化濾波器R160 (還稱為分析濾波器)處理語音信號SlOO以產(chǎn)生LPC殘差 SR10。殘差產(chǎn)生器RlO還可經(jīng)實(shí)施以根據(jù)據(jù)認(rèn)為適合于特定應(yīng)用的任何其它設(shè)計(jì)而產(chǎn)生 LPC殘差。殘差產(chǎn)生器RlO的例子可實(shí)施于幀編碼器104、204和UElO內(nèi),和/或在幀編碼 器104、204和UElO中的任何一者或一者以上中共享。圖14展示包括衛(wèi)星10、地面站20a、20b和用戶終端30a、30b的衛(wèi)星通信系統(tǒng)的示 意圖。衛(wèi)星10可經(jīng)配置以可能經(jīng)由一個(gè)或一個(gè)以上其它衛(wèi)星在地面站20a與20b之間、用 戶終端30a與30b之間或地面站與用戶終端之間的半雙工信道或全雙工信道上中繼話音通 信。用戶終端30a、30b中的每一者可為用于無線衛(wèi)星通信的便攜式裝置,例如,移動電話或 裝備有無線調(diào)制解調(diào)器的便攜式計(jì)算機(jī)、安裝于陸地車輛或航天器內(nèi)的通信單元或用于衛(wèi)星話音通信的另一裝置。地面站20a、20b中的每一者經(jīng)配置以將話音通信信道路由到相應(yīng) 網(wǎng)絡(luò)40a、40b,所述網(wǎng)絡(luò)40a、40b可為模擬或脈碼調(diào)制(PCM)網(wǎng)絡(luò)(例如,公共交換電話網(wǎng) 絡(luò)或PSTN)和/或數(shù)據(jù)網(wǎng)絡(luò)(例如,因特網(wǎng)、局域網(wǎng)(LAN)、校域網(wǎng)(CAN)、城域網(wǎng)(MAN)、廣 域網(wǎng)(WAN)、環(huán)形網(wǎng)絡(luò)、星形網(wǎng)絡(luò)和/或權(quán)標(biāo)環(huán)形網(wǎng)絡(luò))。地面站20a、20b中的一者或兩者 還可包括網(wǎng)關(guān),網(wǎng)關(guān)經(jīng)配置以將話音通信信號代碼轉(zhuǎn)換到另一形式(例如,模擬、PCM、較高 位速率譯碼方案等)和/或從另一形式(例如,模擬、PCM、較高位速率譯碼方案等)代碼轉(zhuǎn) 換話音通信信號。在PWI編碼期間提取的原型的長度通常等于音調(diào)滯后的當(dāng)前值,其在幀間可改 變。量化原型以傳輸?shù)浇獯a器因此提出了量化其尺寸為可變的向量的問題。在常規(guī)的PWI 和PPP譯碼方案中,可變尺寸原型向量的量化通常通過將時(shí)域向量轉(zhuǎn)換為復(fù)合值頻域向量 (例如,使用離散時(shí)間傅立葉變換(DTFT)操作)來執(zhí)行。上文參看音調(diào)脈沖形狀差別計(jì)算 任務(wù)E210來描述此操作。接著對此復(fù)合值可變尺寸向量的振幅進(jìn)行取樣以獲得固定尺寸 的向量。振幅向量的取樣可能為非均勻的。舉例來說,可能需要在低頻率下以較高分辨率 對向量進(jìn)行取樣(與高頻率相比)??赡苄枰獔?zhí)行對在開始幀之后的有聲幀的差別PWI編碼。在全速率PPP譯碼模式 中,頻域向量的相位以類似于振幅的方式經(jīng)取樣以獲得固定尺寸的向量。然而在QPPP譯碼 模式中,無位可用于將此相位信息載運(yùn)到解碼器。在此情況下,音調(diào)滯后經(jīng)差別編碼(例 如,相對于先前幀的音調(diào)滯后),且必須還基于來自一個(gè)或一個(gè)以上先前幀的信息來估計(jì)相 位信息。舉例來說,當(dāng)將過渡幀譯碼模式(例如,任務(wù)E100)用以編碼開始幀時(shí),可從音調(diào) 滯后和脈沖位置信息導(dǎo)出后續(xù)幀的相位信息。對于編碼開始幀來說,可能需要執(zhí)行可預(yù)期檢測幀內(nèi)的所有音調(diào)脈沖的程序。舉 例來說,可預(yù)期使用穩(wěn)健的音調(diào)峰值檢測操作以提供后續(xù)幀的較好滯后估計(jì)和/或相位參 考??煽繀⒖贾祵τ诤罄m(xù)幀是使用例如差別譯碼方案的相對譯碼方案(例如,任務(wù)E200) 而經(jīng)編碼的情況可尤其重要,這是由于此些方案對于誤差傳播通常為敏感的。如上所提及, 在此描述中,音調(diào)脈沖的位置通過其峰值的位置來指示,但在另一情形下,音調(diào)脈沖的位置 可等效地通過脈沖的另一特征(例如,其第一樣本或最后樣本)的位置來指示。圖15A展示根據(jù)一般配置的包括任務(wù)L100、L200和L300的方法M300的流程圖。 任務(wù)LlOO定位幀的終端音調(diào)峰值。在特定實(shí)施中,任務(wù)LlOO經(jīng)配置以根據(jù)(A)基于樣本 振幅的量與(B)幀的所述量的平均值之間的關(guān)系而選擇一樣本作為終端音調(diào)峰值。在一個(gè) 此類實(shí)例中,所述量為樣本量值(即,絕對值),且在此情況下幀平均值可計(jì)算如下
γμ,ι1 等式 1 N其中s表示樣本值(即,振幅),Ν表示幀中的樣本的數(shù)目,且i為樣本索引。在另 一個(gè)此類實(shí)例中,所述量為樣本能量(即,經(jīng)平方的振幅),且在此情況下,幀平均值可計(jì)算 如下T^ 等式 2
N其中s表示樣本值(S卩,振幅),Ν表示幀中的樣本的數(shù)目,且i為樣本索引。在以下描述中,使用能量。任務(wù)LlOO可經(jīng)配置以定位終端音調(diào)峰值作為幀的初始音調(diào)峰值或作為幀的最終 音調(diào)峰值。為了定位初始音調(diào)峰值,任務(wù)LlOO可經(jīng)配置以在幀的第一樣本開始且按時(shí)間順 序操作。為了定位最終的音調(diào)峰值,任務(wù)LlOO可經(jīng)配置以在幀的最后樣本開始且按時(shí)間反 向操作。在以下描述的特定實(shí)例中,任務(wù)LlOO經(jīng)配置以定位終端音調(diào)峰值作為幀的最終音 調(diào)峰值。圖15B展示任務(wù)LlOO的包括子任務(wù)L110、L120和L130的實(shí)施方案L102的框圖。 任務(wù)Ll 10定位幀中的有資格成為終端音調(diào)峰值的最后樣本。在此實(shí)例中,任務(wù)Ll 10定位相 對于幀平均值的能量超出(或者,不小于)對應(yīng)閾值THl的最后樣本。在一個(gè)實(shí)例中,THl 的值為六。如果在幀中未發(fā)現(xiàn)此樣本,則方法M300終止且另一譯碼模式(例如,QPPP)用 于幀。否則,任務(wù)L120(如圖16A中所示)在此樣本之前的窗內(nèi)進(jìn)行搜索以找到具有最大 振幅的樣本,且選擇此樣本作為臨時(shí)峰值候選者。對于任務(wù)L120中的搜索窗來說,可能需 要具有等于最小容許滯后值的寬度WLl。在一個(gè)實(shí)例中,WLl的值為二十個(gè)樣本。對于搜索 窗中的一個(gè)以上樣本具有最大振幅的情況來說,任務(wù)L120可經(jīng)不同地配置以選擇第一此 類樣本、最后此類樣本或任何其它此類樣本。任務(wù)L130(如圖16B中所示)通過在臨時(shí)峰值候選者之前的窗內(nèi)找到具有最大振 幅的樣本而檢驗(yàn)最終音調(diào)峰值選擇。對于任務(wù)L130中的搜索窗來說,可能需要具有在初始 滯后估計(jì)的50%與100%之間或50%與75%之間的寬度WL2。初始滯后估計(jì)通常等于最新 滯后估計(jì)(即,來自先前幀的滯后估計(jì))。在一個(gè)實(shí)例中,WL2的值等于初始滯后估計(jì)的八分 之五。如果新樣本的振幅大于臨時(shí)峰值候選者的振幅,則任務(wù)L130替代地選擇新樣本作為 最終音調(diào)峰值。在另一實(shí)施方案中,如果新樣本的振幅大于臨時(shí)峰值候選者的振幅,則任務(wù) L130選擇新樣本作為新的臨時(shí)峰值候選者,并重復(fù)在新的臨時(shí)峰值候選者之前的具有寬度 WL2的窗內(nèi)的搜索,直到找不到樣本為止。任務(wù)L200計(jì)算幀的所估計(jì)滯后值。任務(wù)L200通常經(jīng)配置以定位鄰近于終端音調(diào) 峰值的音調(diào)脈沖的峰值并將滯后估計(jì)計(jì)算為這兩個(gè)峰值之間的距離??赡苄枰渲萌蝿?wù) L200以僅在幀邊界內(nèi)進(jìn)行搜索和/或要求終端音調(diào)峰值與鄰近音調(diào)峰值之間的距離大于 (或者,不小于)最小容許滯后值(例如,二十個(gè)樣本)。可能需要配置任務(wù)L200以使用初始滯后估計(jì)來找到相鄰峰值。然而,首先,對于 任務(wù)L200來說,可能需要檢查音調(diào)加倍誤差(其可包括音調(diào)三倍和/或音調(diào)四倍誤差)的 初始滯后估計(jì)。通常,將已使用基于相關(guān)的方法確定初始滯后估計(jì)。音調(diào)加倍誤差對于音 調(diào)估計(jì)的基于相關(guān)的方法為常見的,且通常為相當(dāng)可聽的。圖15C展示任務(wù)L200的實(shí)施方 案L202的流程圖。任務(wù)L202包括檢查音調(diào)加倍誤差的初始滯后估計(jì)的可選但推薦的子任 務(wù)L210。任務(wù)L210經(jīng)配置以在距終端音調(diào)峰值(例如)1/2、1/3和1/4滯后的距離的窄窗 內(nèi)搜索音調(diào)峰值,且可如下所描述進(jìn)行迭代。圖17A展示任務(wù)L210的包括子任務(wù)L212、L214和L216的實(shí)施方案L210a的流程 圖。對于待檢查的最小音調(diào)分?jǐn)?shù)(例如,滯后/4),任務(wù)L212在其中心從終端音調(diào)峰值偏移 實(shí)質(zhì)上等于音調(diào)分?jǐn)?shù)(例如,在截?cái)嗷蛏崛胝`差內(nèi))的距離的小窗(例如,五個(gè)樣本)內(nèi)進(jìn) 行搜索,以找到具有(例如,在振幅、量值或能量方面的)最大值的樣本。圖18A說明此操作。
任務(wù)T214評估最大值樣本(即,“候選者”)的一個(gè)或一個(gè)以上特征,且比較這些 值與相應(yīng)閾值。經(jīng)評估的特征可包括候選者的樣本能量、候選者能量與平均幀能量(例如, 峰值對RMS能量)的比率和/或候選者能量與終端峰值能量的比率。任務(wù)L214可經(jīng)配置 而以任何次序執(zhí)行這些評估,且評估可串行和/或彼此并行地執(zhí)行。對于任務(wù)L214來說,還可能需要使候選者的鄰域與終端音調(diào)峰值的類似鄰域相 關(guān)。對于此特征評估來說,任務(wù)L214通常經(jīng)配置以使以候選者為中心的長度為m個(gè)樣本 的區(qū)段與以終端音調(diào)峰值為中心的具有相等長度的區(qū)段相關(guān)。在一個(gè)實(shí)例中,m的值等于 十七個(gè)樣本。可能需要配置任務(wù)L214以執(zhí)行規(guī)格化的相關(guān)(例如,具有在從零到一的范圍 內(nèi)的結(jié)果)??赡苄枰渲萌蝿?wù)L214以重復(fù)以(例如)候選者之前和之后的一個(gè)樣本為 中心的長度為m的區(qū)段的相關(guān)(例如,以解決時(shí)序偏移和/或取樣誤差),和選擇最大相 關(guān)結(jié)果。對于相關(guān)窗將延伸超出幀邊界的情況,可能需要移位或截?cái)嘞嚓P(guān)窗。(對于相關(guān) 窗經(jīng)截?cái)嗟那闆r,可能需要規(guī)格化相關(guān)結(jié)果,除非所述相關(guān)結(jié)果已經(jīng)規(guī)格化。)在一個(gè)實(shí)例 中,如果滿足展示為圖19A中的各欄的三組條件中的任一者,則接受候選者作為鄰近音調(diào) 峰值,其中閾值T可等于六。如果任務(wù)T214找到鄰近音調(diào)峰值,則任務(wù)L216計(jì)算當(dāng)前滯后估計(jì)作為終端音調(diào) 峰值與鄰近音調(diào)峰值之間的距離。否則,任務(wù)L210a在終端峰值的另一側(cè)上迭代(如圖18B 中所示),接著對于待檢查的其它音調(diào)分?jǐn)?shù)在終端峰值的兩側(cè)之間從最小到最大進(jìn)行交替, 直到找到鄰近的音調(diào)峰值為止(如圖18C到圖18F中所示)。如果在終端音調(diào)峰值與最接 近的幀邊界之間找到鄰近音調(diào)峰值,則終端音調(diào)峰值被重新標(biāo)記為鄰近的音調(diào)峰值,且新 峰值被標(biāo)記為終端音調(diào)峰值。在替代實(shí)施方案中,任務(wù)L210經(jīng)配置以在前導(dǎo)側(cè)之前在終端 音調(diào)峰值的結(jié)尾側(cè)(即,在任務(wù)LlOO中已經(jīng)搜索的側(cè))上進(jìn)行搜索。如果分?jǐn)?shù)滯后測試任務(wù)L210并不定位音調(diào)峰值,則任務(wù)L220根據(jù)初始滯后估計(jì) (例如,在從終端峰值位置偏移初始滯后估計(jì)的窗內(nèi))搜索鄰近于終端音調(diào)峰值的音調(diào)峰 值。圖17B展示任務(wù)L220的包括子任務(wù)L222、L224、L226和的實(shí)施方案L220a的流 程圖。任務(wù)L222在具有寬度WL3的以到最終峰值的左側(cè)一個(gè)滯后的距離為中心的窗內(nèi)找 到候選者(例如,具有在振幅或量值方面的最大值的樣本)(如圖19B中所示,其中經(jīng)填充 的圓指示終端音調(diào)峰值)。在一個(gè)實(shí)例中,WL3的值等于0.55倍初始滯后估計(jì)。任務(wù)L2M 評估候選樣本的能量。舉例來說,任務(wù)L2M可經(jīng)配置以確定候選者的能量的測量(例如, 樣本能量與幀平均能量的比率,例如峰值對RMS能量)是否大于(或者不小于)對應(yīng)閾值 TH3。TH3的實(shí)例值包括1、1.5、3和6。任務(wù)使候選者的鄰域與終端音調(diào)峰值的類似鄰域相關(guān)。任務(wù)通常經(jīng)配 置以使以候選者為中心的長度為N2個(gè)樣本的區(qū)段與以終端音調(diào)峰值為中心的具有相等長 度的區(qū)段相關(guān)。N2的值的實(shí)例包括十、十一和十七個(gè)樣本??赡苄枰渲萌蝿?wù)以執(zhí)行 規(guī)格化相關(guān)??赡苄枰渲萌蝿?wù)以重復(fù)以(例如)候選者之前和之后的一個(gè)樣本為 中心的區(qū)段的相關(guān)(例如,以解決時(shí)序偏移和/或取樣誤差),以及選擇最大相關(guān)結(jié)果。對 于相關(guān)窗將延伸超出幀邊界的情況,可能需要移位或截?cái)嘞嚓P(guān)窗。(對于相關(guān)窗經(jīng)截?cái)嗟?情況,可能需要規(guī)格化相關(guān)結(jié)果,除非所述相關(guān)結(jié)果已經(jīng)規(guī)格化。)任務(wù)還確定相關(guān) 結(jié)果是否大于(或者不小于)對應(yīng)閾值TH4。TH4的實(shí)例值包括0. 75,0. 65和0. 45??筛?據(jù)不同組的TH3和TH4值來組合任務(wù)L2M和的測試。在一個(gè)此類實(shí)例中,如果以下組值中的任一者產(chǎn)生正結(jié)果,則L2M和的結(jié)果為正TH3 = 1且TH4 = 0. 75 ;TH3 = 1. 5且TH4 = 0. 65 ;TH3 = 3且TH4 = 0. 45 ;TH3 = 6 (在此情況下,任務(wù)的結(jié)果被認(rèn) 為是正)。如果任務(wù)L2M和的結(jié)果為正,則接受候選者作為鄰近音調(diào)峰值,且任務(wù) 計(jì)算當(dāng)前滯后估計(jì)作為此樣本與終端音調(diào)峰值之間的距離。任務(wù)L2M和可依序和/ 或彼此并行地執(zhí)行。任務(wù)L220還可經(jīng)實(shí)施以僅包括任務(wù)L2M和中的一者。如果任務(wù) L220在未找到鄰近音調(diào)峰值的情況下結(jié)束,則可能需要在終端音調(diào)峰值的結(jié)尾側(cè)上迭代任 務(wù)L220(如圖19C中所示,其中經(jīng)填充的圓指示終端音調(diào)峰值)。如果任務(wù)L210和L220中的任一者均不定位音調(diào)峰值,則任務(wù)L230在終端音調(diào)峰 值的前導(dǎo)側(cè)上執(zhí)行對音調(diào)峰值的開放窗搜索。圖17C展示任務(wù)L230的包括子任務(wù)L232、 L234、L236和L238的實(shí)施方案L230a的流程圖。開始于距終端音調(diào)峰值某一距離Dl的樣 本,任務(wù)L232找到相對于平均幀能量的能量超出(或者不小于)閾值(例如,THl)的樣 本。圖20A說明此操作。在一個(gè)實(shí)例中,Dl的值為例如二十個(gè)樣本的最小容許滯后值。任 務(wù)L234在此樣本的具有寬度WL4的窗內(nèi)找到候選者(例如,具有在振幅或量值方面的最大 值的樣本)(如圖20B中所示)。在一個(gè)實(shí)例中,WL4的值等于二十個(gè)樣本。任務(wù)L236使候選者的鄰域與終端音調(diào)峰值的類似鄰域相關(guān)。任務(wù)L236通常經(jīng)配 置以使以候選者為中心的長度為N3個(gè)樣本的區(qū)段與以終端音調(diào)峰值為中心的具有相等長 度的區(qū)段相關(guān)。在一個(gè)實(shí)例中,N3的值等于十一個(gè)樣本??赡苄枰渲萌蝿?wù)以執(zhí)行 規(guī)格化相關(guān)??赡苄枰渲萌蝿?wù)以重復(fù)以(例如)候選者之前和之后的一個(gè)樣本為 中心的區(qū)段的相關(guān)(例如,以解決時(shí)序偏移和/或取樣誤差),以及選擇最大相關(guān)結(jié)果。對 于相關(guān)窗將延伸超出幀邊界的情況,可能需要移位或截?cái)嘞嚓P(guān)窗。(對于相關(guān)窗經(jīng)截?cái)嗟那?況,可能需要規(guī)格化相關(guān)結(jié)果,除非所述相關(guān)結(jié)果已經(jīng)規(guī)格化。)任務(wù)確定相關(guān)結(jié)果是 否超出(或者,不小于)閾值ΤΗ5。在一個(gè)實(shí)例中,ΤΗ5的值等于0.45。如果任務(wù)L236的 結(jié)果為正,則接受候選者作為鄰近音調(diào)峰值,且任務(wù)Τ238計(jì)算當(dāng)前滯后估計(jì)作為此樣本與 終端音調(diào)峰值之間的距離。否則,任務(wù)L230a跨越幀進(jìn)行迭代(例如,如圖20C中所示,開 始于先前搜索窗的左側(cè)),直到找到音調(diào)峰值或搜索完為止。當(dāng)滯后估計(jì)任務(wù)L200已結(jié)束時(shí),任務(wù)L300執(zhí)行以定位幀中的任何其它音調(diào)脈沖。 任務(wù)L300可經(jīng)實(shí)施以使用相關(guān)和當(dāng)前滯后估計(jì)來定位更多脈沖。舉例來說,任務(wù)L300可 經(jīng)配置以使用例如相關(guān)和樣本對RMS能量值的準(zhǔn)則來測試圍繞滯后估計(jì)的窄窗內(nèi)的最大 值樣本。與滯后估計(jì)任務(wù)L200相比,任務(wù)L300可經(jīng)配置以使用較小搜索窗和/或?qū)捤傻?準(zhǔn)則(例如,較低閾值),尤其在已找到鄰近于終端音調(diào)峰值的峰值情況下。舉例來說,在開 始或其它過渡幀中,脈沖形狀可改變,使得幀內(nèi)的一些脈沖可能并非強(qiáng)烈相關(guān),且可能需要 第二脈沖之后的脈沖寬松或甚至忽略相關(guān)準(zhǔn)則,只要脈沖的振幅足夠高且位置(例如,根 據(jù)當(dāng)前滯后值)是正確的便可??赡苄枰钚』z漏有效脈沖的概率,且尤其對于大滯后 值來說,幀的有聲部分可能并非非常有峰。在一個(gè)實(shí)例中,方法M300允許每幀最大八個(gè)音 調(diào)脈沖。任務(wù)L300可經(jīng)實(shí)施以計(jì)算下一音調(diào)峰值的兩個(gè)或兩個(gè)以上不同候選者并根據(jù)這 些候選者中的一者選擇音調(diào)峰值。舉例來說,任務(wù)L300可經(jīng)配置以基于樣本值選擇候選 樣本;且基于相關(guān)結(jié)果來計(jì)算候選距離。圖21展示任務(wù)L300的包括子任務(wù)L310、L320、L330、L340和L350的實(shí)施方案L302的流程圖。任務(wù)L310初始化候選者搜索的錨定位置。 舉例來說,任務(wù)L310可經(jīng)配置以使用最新近接受的音調(diào)峰值的位置作為初始錨定位置。在 任務(wù)L302的第一迭代中,例如,錨定位置可為鄰近于終端音調(diào)峰值的音調(diào)峰值的位置(如 果此峰值由任務(wù)L200來定位)或否則為終端音調(diào)峰值的位置。對于任務(wù)L310來說,還可 能需要初始化滯后乘數(shù)m (例如,為值1)。任務(wù)L320選擇候選樣本并計(jì)算候選距離。任務(wù)L320可經(jīng)配置以如圖22k中所示 搜索窗內(nèi)的這些候選者,其中大的有界水平線指示當(dāng)前幀,左側(cè)大垂直線指示幀開始,右側(cè) 大垂直線指示幀結(jié)束,點(diǎn)指示錨定位置,且陰影框指示搜索窗。在此實(shí)例中,窗以其距錨定 位置的距離為當(dāng)前滯后估計(jì)與滯后乘數(shù)m的乘積的樣本為中心,且所述窗向左延伸WS個(gè)樣 本(即,在時(shí)間上向后)且向右延伸(WS-I)個(gè)樣本(即,在時(shí)間上向前)。任務(wù)L320可經(jīng)配置以將窗大小參數(shù)WS初始化為當(dāng)前滯后估計(jì)的五分之一的值。 對于窗大小參數(shù)WS來說,可能需要至少具有例如十二個(gè)樣本的最小值?;蛘?,如果尚未找 到鄰近于終端音調(diào)峰值的音調(diào)峰值,則對于任務(wù)L320來說可能需要將窗大小參數(shù)WS初始 化為例如當(dāng)前滯后估計(jì)的一半的可能較大值。為了找到候選樣本,任務(wù)L320搜索窗以找到具有最大值的樣本并記錄此樣本的 位置和值。任務(wù)L320可經(jīng)配置以在搜索窗內(nèi)選擇其值具有最高振幅的樣本。或者,任務(wù) L320可經(jīng)配置以在搜索窗內(nèi)選擇其值具有最高量值或最高能量的樣本。候選距離對應(yīng)于搜索窗內(nèi)的與錨定位置的相關(guān)為最高的樣本。為了找到此樣本, 任務(wù)L320使窗內(nèi)的每一樣本的鄰域與錨定位置的類似鄰域相關(guān),且記錄最大相關(guān)結(jié)果和 對應(yīng)距離。任務(wù)L320通常經(jīng)配置以使以每一測試樣本為中心的長度為N4個(gè)樣本的區(qū)段與 以錨定位置為中心的具有相等長度的區(qū)段相關(guān)。在一個(gè)實(shí)例中,N4的值為十一個(gè)樣本。對 于任務(wù)L320來說,可能需要執(zhí)行規(guī)格化相關(guān)。如上所陳述,任務(wù)T320可經(jīng)配置以使用同一搜索窗來找到候選樣本和候選距離。 然而,任務(wù)T320還可經(jīng)配置以將不同搜索窗用于這兩個(gè)操作。圖22B展示其中任務(wù)L320 在具有大小參數(shù)WSl的窗上執(zhí)行對候選樣本的搜索的實(shí)例,且圖22C展示任務(wù)L320的同一 例子在具有為不同值的大小參數(shù)WS2的窗上執(zhí)行對候選距離的搜索的實(shí)例。任務(wù)L302包括在候選樣本和對應(yīng)于候選距離的樣本中選擇一者作為音調(diào)峰值的 子任務(wù)L330。圖23展示任務(wù)L330的包括子任務(wù)L334、L336和L338的實(shí)施方案L332的 流程圖。任務(wù)L334測試候選距離。任務(wù)L334通常經(jīng)配置以比較相關(guān)結(jié)果與閾值。對于任 務(wù)L334來說還可能需要比較基于對應(yīng)樣本的能量的測量(例如,樣本能量與幀平均能量的 比率)與閾值。對于已識別僅一個(gè)音調(diào)脈沖的情況來說,任務(wù)L334可經(jīng)配置以檢驗(yàn)候選距 離至少等于最小值(例如,例如二十個(gè)樣本的最小容許滯后值)。圖24A的表的各欄展示基 于此些參數(shù)的值的四組不同測試條件,所述參數(shù)值可由任務(wù)L334的實(shí)施方案使用以確定 是否接受對應(yīng)于候選距離的樣本作為音調(diào)峰值。對于任務(wù)L334接受對應(yīng)于候選距離的樣本作為音調(diào)峰值的情況來說,如果那個(gè) 樣本具有較高振幅(或者,較高量值),則可能需要向左或向右調(diào)整峰值位置(例如,一個(gè)樣 本)。替代地或另外,對于任務(wù)L334來說,在此情況下可能需要針對任務(wù)L300的其它迭代 將窗大小參數(shù)WS的值設(shè)定為較小值(例如,十個(gè)樣本)(或?qū)?shù)WSl和WS2中的一者或兩者設(shè)定為此值)。如果新音調(diào)峰值僅為對于幀所確認(rèn)的第二者,則對于任務(wù)L334來說,還 可能需要將當(dāng)前滯后估計(jì)計(jì)算為錨定位置與峰值位置之間的距離。任務(wù)L302包括測試候選樣本的子任務(wù)L336。任務(wù)L336可經(jīng)配置以確定樣本能量 的測量(例如,樣本能量與幀平均能量的比率)是否超出(或者,不小于)閾值??赡苄枰?視對于幀已確認(rèn)多少個(gè)音調(diào)峰值而改變閾值。舉例來說,對于任務(wù)L336來說,可能需要使 用較低閾值(例如,T-3)(如果對于幀已確認(rèn)僅一個(gè)音調(diào)峰值)且使用較高閾值(例如,T) (如果對于幀已確認(rèn)一個(gè)以上音調(diào)峰值)。對于任務(wù)L336選擇候選樣本作為第二所確認(rèn)音調(diào)峰值的情況下,對于任務(wù)L336 來說還可能需要基于與終端音調(diào)峰值的相關(guān)的結(jié)果而向左或向右調(diào)整峰值位置(例如,一 個(gè)樣本)。在此情況下,任務(wù)L336可經(jīng)配置以使以每一此樣本為中心的長度為N5個(gè)樣本的 區(qū)段與以終端音調(diào)峰值為中心的具有相等長度的區(qū)段相關(guān)(在一個(gè)實(shí)例中,N5的值為十一 個(gè)樣本)。替代地或另外,對于任務(wù)L336來說,在此情況下可能需要針對任務(wù)L300的其它 迭代將窗大小參數(shù)WS的值設(shè)定為較小值(例如,十個(gè)樣本)(或?qū)?shù)WSl和WS2中的一 者或兩者設(shè)定為此值)。對于測試任務(wù)L334和L336中的兩者已失敗且對于幀已確認(rèn)僅一個(gè)音調(diào)峰值的情 況來說,任務(wù)L302可經(jīng)配置以(經(jīng)由任務(wù)L350)使滯后估計(jì)乘數(shù)m的值加一,以m的新值 迭代任務(wù)L320而選擇新候選樣本和新候選距離,且對于新候選者重復(fù)任務(wù)L332。如圖23中所示,任務(wù)L336可經(jīng)布置以在候選距離測試任務(wù)L334失敗之后執(zhí)行。 在任務(wù)T332的另一實(shí)施中,候選樣本測試任務(wù)L336可經(jīng)布置以首先執(zhí)行,使得候選距離測 試任務(wù)L334僅在任務(wù)L336失敗后執(zhí)行。任務(wù)L332還包括子任務(wù)L338。對于其中測試任務(wù)L334和L336中的兩者已失敗 且對于幀已確認(rèn)一個(gè)以上音調(diào)峰值的情況下,任務(wù)L338測試候選者中的一者或兩者與當(dāng) 前滯后估計(jì)的一致性。圖24B展示任務(wù)L338的實(shí)施方案L338a的流程圖。任務(wù)L338a包括測試候選距 離的子任務(wù)L362。如果候選距離與當(dāng)前滯后估計(jì)之間的絕對差小于(或者,不大于)閾值, 則任務(wù)L362接受候選距離。在一個(gè)實(shí)例中,閾值為三個(gè)樣本。對于任務(wù)L362來說,還可能 需要檢驗(yàn)相關(guān)結(jié)果和/或?qū)?yīng)樣本的能量是否為可接受地高。在一個(gè)此類實(shí)例中,如果相 關(guān)結(jié)果不小于0. 35且樣本能量與幀平均能量的比率不小于0. 5,則任務(wù)L362接受小于(或 者,不大于)閾值的候選距離。對于其中任務(wù)L362接受候選距離的情況來說,如果那個(gè)樣 本具有較高振幅(或者,較高量值),則對于任務(wù)L362來說還可能需要向左或向右調(diào)整峰值 位置(例如,一個(gè)樣本)。任務(wù)L338a還包括測試候選樣本的滯后一致性的子任務(wù)L364。如果(A)候選樣 本與最接近音調(diào)峰值之間的距離與(B)當(dāng)前滯后估計(jì)之間的絕對差小于(或者,不大于) 閾值,則任務(wù)L364接受候選樣本。在一個(gè)實(shí)例中,閾值為例如兩個(gè)樣本的低值。對于任務(wù) L364來說,還可能需要檢驗(yàn)候選樣本的能量為可接受地高。在一個(gè)此類實(shí)例中,如果候選樣 本通過滯后一致性測試且如果樣本能量與幀平均能量的比率不小于(T-5),則任務(wù)L364接 受所述候選樣本。展示于圖MB中的任務(wù)L338a的實(shí)施方案還包括另一子任務(wù)L366,其對照比任務(wù) L364的低閾值松散的界限而測試候選樣本的滯后一致性。如果(A)候選樣本與最接近所確認(rèn)峰值之間的距離與(B)當(dāng)前滯后估計(jì)之間的絕對差小于(或者,不大于)閾值,則任務(wù) L366接受候選樣本。在一個(gè)實(shí)例中,閾值為(0. 175*滯后)。對于任務(wù)L366來說,還可能 需要檢驗(yàn)候選樣本的能量為可接受地高。在一個(gè)此類實(shí)例中,如果樣本能量與幀平均能量 的比率不小于(T-3),則任務(wù)L366接受候選樣本。如果候選樣本和候選距離兩者均未通過所有測試,則任務(wù)T302 (經(jīng)由任務(wù)T350) 使滯后估計(jì)乘數(shù)m加一,以m的新值迭代任務(wù)L320從而選擇新候選樣本和新候選距離,并 針對新候選者重復(fù)任務(wù)L330直到到達(dá)幀邊界為止。一旦已確認(rèn)新音調(diào)峰值,就可能需要在 同一方向上搜索另一峰值直到到達(dá)幀邊界為止。在此情況下,任務(wù)L340將錨定位置移動到 新音調(diào)峰值,并將滯后估計(jì)乘數(shù)m的值復(fù)位為一。當(dāng)?shù)竭_(dá)幀邊界時(shí),可能需要將錨定位置初 始化到終端音調(diào)峰值位置并在相反方向上重復(fù)任務(wù)L300。滯后估計(jì)從一幀到下一幀的較大減小可指示音調(diào)溢出錯(cuò)誤。此錯(cuò)誤由音調(diào)頻率的 下降引起,使得當(dāng)前幀的滯后值超出最大容許滯后值。對于方法M300來說,可能需要將先 前滯后估計(jì)與當(dāng)前滯后估計(jì)之間的絕對或相對差與閾值(例如,在計(jì)算新滯后估計(jì)時(shí)或在 方法結(jié)束時(shí))進(jìn)行比較,并在檢測到錯(cuò)誤的情況下僅保持幀的最大音調(diào)峰值。在一個(gè)實(shí)例 中,閾值等于先前滯后估計(jì)的50 %。對于具有兩個(gè)具大量值平方比的脈沖的經(jīng)分類為瞬變的幀(例如,通??拷值?末尾的具有大音調(diào)改變的幀)來說,可能需要在接受較小峰值作為音調(diào)峰值之前在整個(gè)當(dāng) 前滯后估計(jì)上而非僅在較小窗上進(jìn)行相關(guān)。此情況可在男性話音中出現(xiàn),所述男性話音通 常具有在小窗上可與主要峰值良好相關(guān)的次要峰值。任務(wù)L200和L300中的一者可經(jīng)實(shí)施 以包括此操作。應(yīng)明確地注意到,方法M300的滯后估計(jì)任務(wù)L200可為與方法MlOO的滯后估計(jì)任 務(wù)E130相同的任務(wù)。應(yīng)明確地注意到,方法M300的終端音調(diào)峰值位置任務(wù)LlOO可為與方 法MlOO的終端音調(diào)峰值位置計(jì)算任務(wù)E120相同的任務(wù)。對于執(zhí)行方法MlOO和M300兩者 的應(yīng)用來說,可能需要布置音調(diào)脈沖形狀選擇任務(wù)EllO以在結(jié)束方法M300后即刻執(zhí)行。圖27A展示經(jīng)配置以檢測語音信號的幀的音調(diào)峰值的設(shè)備MF300的框圖。設(shè)備 MF300包括用于(例如,如上文參看任務(wù)LlOO的各種實(shí)施方案所描述)定位幀的終端音調(diào) 峰值的裝置ML100。設(shè)備MF300包括用于(例如,如上文參看任務(wù)L200的各種實(shí)施方案所 描述)估計(jì)幀的音調(diào)滯后的裝置ML200。設(shè)備MF300包括用于(例如,如上文參看任務(wù)L300 的各種實(shí)施方案所描述)定位幀的額外音調(diào)峰值的裝置ML300。圖27B展示經(jīng)配置以檢測語音信號的幀的音調(diào)峰值的設(shè)備A300的框圖。設(shè)備A300 包括終端音調(diào)峰值定位器A310,其經(jīng)配置以(例如,如上文參看任務(wù)LlOO的各種實(shí)施方案 所描述)定位幀的終端音調(diào)峰值。設(shè)備A300包括音調(diào)滯后估計(jì)器A320,音調(diào)滯后估計(jì)器 A320經(jīng)配置以(例如,如上文參看任務(wù)L200的各種實(shí)施方案所描述)估計(jì)幀的音調(diào)滯后。 設(shè)備A300包括額外的音調(diào)峰值定位器A330,其經(jīng)配置以(例如,如上文參看任務(wù)L300的各 種實(shí)施方案所描述)定位幀的額外的音調(diào)峰值。圖27C展示經(jīng)配置以檢測語音信號的幀的音調(diào)峰值的設(shè)備MF350的框圖。設(shè)備 MF350包括用于(例如,如上文參看任務(wù)LlOO的各種實(shí)施方案所描述)檢測幀的音調(diào)峰值 的裝置ML150。設(shè)備MF350包括用于(例如,如上文參看任務(wù)L320和L320b的各種實(shí)施方 案所描述)選擇候選樣本的裝置ML250。設(shè)備MF350包括用于(例如,如上文參看任務(wù)L320和L320a的各種實(shí)施方案所描述)選擇候選距離的裝置MU60。設(shè)備MF350包括用于(例 如,如上文參看任務(wù)L330的各種實(shí)施方案所描述)選擇候選樣本和對應(yīng)于候選距離的樣本 中的一者作為幀的音調(diào)峰值的裝置ML350。圖27D展示經(jīng)配置以檢測語音信號的幀的音調(diào)峰值的設(shè)備A350的框圖。設(shè)備A350 包括峰值檢測器150,其經(jīng)配置以(例如,如上文參看任務(wù)LlOO的各種實(shí)施方案所描述)檢 測幀的音調(diào)峰值。設(shè)備A350包括樣本選擇器250,其經(jīng)配置以(例如,如上文參看任務(wù)L320 和L320b的各種實(shí)施方案所描述)選擇候選樣本。設(shè)備A350包括距離選擇器沈0,其經(jīng)配 置以(例如,如上文參看任務(wù)L320和L320a的各種實(shí)施方案所描述)選擇候選距離。設(shè)備 A350包括峰值選擇器350,其經(jīng)配置以(例如,如上文參看任務(wù)L330的各種實(shí)施方案所描 述)選擇候選樣本和對應(yīng)于候選距離的樣本中的一者作為幀的音調(diào)峰值。可能需要實(shí)施任務(wù)E100、第一幀編碼器100和/或裝置FE100來產(chǎn)生唯一地指示 幀的終端音調(diào)脈沖的位置的經(jīng)編碼幀。與滯后值組合的終端音調(diào)脈沖的位置提供用于隨后 幀的重要相位信息,隨后幀可能缺少此時(shí)間同步性信息(例如,QPPP)。還可能需要最小化 傳達(dá)此信息所需要的位的數(shù)目。雖然將通常需要八個(gè)位(「/og2iV"|個(gè)位)來表示160位(N 位)幀中的唯一位置,但如本文中所描述的方法可用以在僅七個(gè)位([/<^2#」個(gè)位)中編碼 終端音調(diào)脈沖的位置。此方法保留七位值中的一者(在此實(shí)例中,127( 2L ^」-1))以用 作模式值。對于相對于最后樣本給定終端音調(diào)脈沖的位置的情形來說,幀將與以下三種情況 中的一種情況匹配情況1 終端音調(diào)脈沖相對于幀的最后樣本的位置小于(義。^」-1)(例如,如圖 ^A中所示,對于160位幀小于127),且?guī)幸粋€(gè)以上音調(diào)脈沖。在此情況下,將終端音 調(diào)脈沖的位置編碼到Llog2 V」個(gè)位(七個(gè)位)中,且音調(diào)滯后也(例如,在七個(gè)位中)被傳情況2 終端音調(diào)脈沖相對于幀的最后樣本的位置小于(2Llog^J-l )(例如,如圖 29A中所示,對于160位幀小于127),且?guī)瑑H含有一個(gè)音調(diào)脈沖。在此情況下,將終端音調(diào)脈 沖的位置編碼到Llog2 W」個(gè)位(例如,七個(gè)位)中,且音調(diào)滯后被設(shè)定為模式值(例如,127)。情況3 如果終端音調(diào)脈沖相對于幀的最后樣本的位置大于((例如, 如圖^B中所示,對于160位幀大于1 ),則幀含有一個(gè)以上音調(diào)脈沖是不大可能的。對 于160位幀和8kHz的取樣速率來說,此將暗示在幀的約前20%中至少250Hz的音調(diào)處的 活動性,在幀的殘差部分中無音調(diào)脈沖。此幀將不大可能被分類為開始幀。在此情況下, 傳輸數(shù)字(2L/og2JvJ-D (例如,127)來取代實(shí)際脈沖位置,且將滯后位用以載運(yùn)終端音調(diào)脈 沖相對于幀的第一樣本的位置。對應(yīng)解碼器可經(jīng)配置以測試經(jīng)編碼幀的位置位是否指示 (2L/%〃」_I)的脈沖位置。如果如此,則解碼器可接著替代地從滯后位獲得終端音調(diào)脈沖相 對于幀的第一樣本的位置。在如應(yīng)用到160位幀的情況3下,三十三個(gè)此些位置是可能的(即,零到3 。通過 將位置中的一者舍入到另一者(例如,通過將位置159舍入到位置158,或通過將位置127 舍入到位置1 ),可僅在五個(gè)位中傳輸實(shí)際位置,從而留下七個(gè)滯后位中的兩者為空閑的 以載運(yùn)其它信息。
圖觀展示根據(jù)以上三種情況操作的根據(jù)一般配置的方法M500的流程圖。方法 M500經(jīng)配置以使用r個(gè)位在q位幀中編碼終端音調(diào)脈沖的位置,其中r小于1呢2(1。在如上 所論述的一個(gè)實(shí)例中,q等于160且r等于七。可通過第一幀編碼器100的實(shí)施方案(例如, 通過音調(diào)脈沖位置計(jì)算器120)和/或通過裝置FE100的實(shí)施方案(例如,通過裝置FE120) 在任務(wù)ElOO的實(shí)施方案內(nèi)(例如,在任務(wù)E120內(nèi))執(zhí)行方法M500。方法M500包括任務(wù)T510、T520和Τ530。任務(wù)Τ510確定終端音調(diào)脈沖位置(相對 于幀的結(jié)束)是否大于Qt2)(例如,大于126)。如果結(jié)果為真,則幀與以上情況三匹配。 在此情況下,任務(wù)Τ520將終端音調(diào)脈沖位置位設(shè)定為Olr-I)(例如,設(shè)定為127)且將滯后 位設(shè)定為等于終端音調(diào)脈沖相對于幀的開始的位置。如果任務(wù)Τ510的結(jié)果為假,則任務(wù)Τ530確定幀是否僅含有一個(gè)音調(diào)脈沖。如果任 務(wù)Τ530的結(jié)果為真,則幀與以上情況二匹配,且不需要傳輸滯后值。在此情況下,任務(wù)Τ540 將滯后位設(shè)定為模式值Olr-I)。如果任務(wù)Τ530的結(jié)果為假,則幀含有一個(gè)以上音調(diào)脈沖且終端音調(diào)脈沖相對于 幀的結(jié)束的位置不大于0匸2)(例如,不大于126)。此幀與以上情況一匹配,且任務(wù)Τ550 在r個(gè)位中編碼所述位置且將滯后值編碼到滯后位中。對于相對于第一樣本給定終端音調(diào)脈沖的位置的情形來說,幀將與以下三種情況 中的一種情況匹配情況1 終端音調(diào)脈沖相對于幀的第一樣本的位置大于(N-2[%^」)(例如,如圖 29C中所示,對于160位幀大于3 ,且?guī)幸粋€(gè)以上音調(diào)脈沖。在此情況下,終端音調(diào)脈 沖的位置減去(N-^h,」)被編碼到Lfog2 #」個(gè)位(例如,七個(gè)位)中,且音調(diào)滯后也被傳輸 (例如,在七個(gè)位中)。情況2 終端音調(diào)脈沖相對于幀的第一樣本的位置大于(N-2L/°g2iV」)(例如,如圖 29C中所示,對于160位幀大于3 ,且?guī)瑑H含有一音調(diào)脈沖。在此情況下,終端音調(diào)脈沖的 位置減去(N-^foAW)被編碼到[Zog2A^I個(gè)位(例如,七個(gè)位)中,且將音調(diào)滯后設(shè)定為模式 值()(例如,127)。情況3 如果終端音調(diào)脈沖的位置不大于(N-^LfoA 〃」)(例如,如圖29D中所示,對 于160位幀不大于3 ,則幀含有一個(gè)以上音調(diào)脈沖是不大可能的。對于160位幀和SkHz 的取樣速率來說,此將暗示在幀的約前20%中至少250Hz的音調(diào)處的活動性,在幀的殘差 部分中無音調(diào)脈沖。此幀將不大可能被分類為開始幀。在此情況下,傳輸數(shù)字(2^^-1) (例如,127)來取代實(shí)際脈沖位置,且將滯后位用以傳輸終端音調(diào)脈沖相對于幀的第一樣 本的位置。對應(yīng)解碼器可經(jīng)配置以測試經(jīng)編碼幀的位置位是否指示(2L/°g2〃」_l)的脈沖位 置。如果如此,則解碼器可接著替代地從滯后位獲得終端音調(diào)脈沖相對于幀的第一樣本的 位置。在如應(yīng)用到160位幀的情況3下,三十三個(gè)此些位置為可能的(零到3 。通過將 位置中的一者舍入到另一者(例如,通過將位置0舍入到位置1,或通過將位置32舍入到位 置31),可在僅五個(gè)位中傳輸實(shí)際位置,從而留下七個(gè)滯后位中的兩者為空閑的以載運(yùn)其它 信息。所屬領(lǐng)域的技術(shù)人員將認(rèn)識到,方法M500可經(jīng)修改以用于相對于第一樣本給定終端 音調(diào)脈沖的位置的情形。
四分之一速率允許每幀四十個(gè)位。在如由編碼任務(wù)ElOO的實(shí)施方案、編碼器100 或裝置FE100應(yīng)用的過渡幀譯碼格式的一個(gè)實(shí)例中,將十七個(gè)位的區(qū)用以指示LSP和編碼 模式,七個(gè)位的區(qū)用以指示終端音調(diào)脈沖的位置,七個(gè)位的區(qū)用以指示滯后,七個(gè)位的區(qū)用 以指示脈沖形狀,且兩個(gè)位的區(qū)用以指示增益輪廓。其它實(shí)例包括用于LSP的區(qū)為較小的 且用于增益輪廓的區(qū)對應(yīng)地為較大的格式。對應(yīng)解碼器(例如,解碼器300或裝置FD100的實(shí)施方案,或執(zhí)行解碼任務(wù)DlOO 的實(shí)施方案的裝置)可經(jīng)配置以通過將所指示脈沖復(fù)制到由終端音調(diào)脈沖位置和滯后值 指示的位置中的每一者并根據(jù)增益VQ表輸出縮放所得信號而從脈沖形狀VQ表輸出來建構(gòu) 激勵(lì)信號。對于所指示的脈沖長于滯后值的情況下,可通過以下操作來處置鄰近脈沖之間 的任何重疊對每一對重疊的值進(jìn)行平均,選擇每一對中的一個(gè)值(例如,最高或最低值, 或?qū)儆谧髠?cè)或右側(cè)上的脈沖的值)或簡單地丟棄超出滯后值的樣本。激勵(lì)信號的音調(diào)脈沖并非簡單地為脈沖或尖峰。而是,音調(diào)脈沖通常具有說話者 相依的隨時(shí)間變化的振幅輪廓或形狀,且保持此形狀對于說話者辨識可為重要的??赡苄?要編碼脈沖形狀的良好表示以充當(dāng)后續(xù)有聲幀的參考(例如,原型)。音調(diào)脈沖的形狀提供在感知上對于說話者識別和辨識為重要的信息。為了向解 碼器提供此信息,過渡幀譯碼模式(例如,如由任務(wù)ElOO的實(shí)施方案、編碼器100或裝置 FE100執(zhí)行)可經(jīng)配置以在經(jīng)編碼幀中包括脈沖形狀信息。編碼脈沖形狀可呈現(xiàn)量化其尺 寸為可變的向量的問題。舉例來說,殘差中的音調(diào)周期的長度且因此音調(diào)脈沖的長度可在 廣泛范圍上改變。在一個(gè)實(shí)例中,可容許的音調(diào)滯后值范圍為20到146個(gè)樣本??赡苄枰诓粚⒚}沖轉(zhuǎn)換到頻域的情況下編碼音調(diào)脈沖的形狀。圖30展示根據(jù) 一般配置的方法M600的流程圖,可通過第一幀編碼器100的實(shí)施方案(例如,通過音調(diào)脈 沖形狀選擇器110)和/或通過裝置FE100的實(shí)施方案(例如,通過裝置FEl 10)在任務(wù)ElOO 的實(shí)施方案內(nèi)(例如,在任務(wù)EllO內(nèi))執(zhí)行所述方法M600。方法M600包括任務(wù)T610、T620、 Τ630、Τ640和Τ650。任務(wù)Τ610依據(jù)幀是具有單一音調(diào)脈沖還是多個(gè)音調(diào)脈沖而選擇兩個(gè) 處理路徑中的一者。對于單一脈沖幀來說,任務(wù)Τ620根據(jù)幀內(nèi)的音調(diào)脈沖的位置而選擇一組不同單 一脈沖向量量化(VQ)表中的一者。這些表中的每一者具有等于幀的長度(例如,160個(gè)樣 本)的向量尺寸。在一個(gè)實(shí)例中,所述組單一脈沖VQ表包括三個(gè)表。任務(wù)Τ630接著通過 在選定的VQ表內(nèi)找到最佳匹配而量化脈沖形狀。在一個(gè)特定實(shí)例中,此編碼系統(tǒng)包括用于單一脈沖幀的三個(gè)脈沖形狀VQ表。每一 表具有1 個(gè)條目,所述條目各自具有長度160,使得脈沖形狀經(jīng)編碼為七位索引。對應(yīng)解碼器(例如,解碼器300或裝置FD100的實(shí)施方案或執(zhí)行解碼任務(wù)DlOO的 實(shí)施方案的裝置)可經(jīng)配置以在脈沖位置值等于模式值(例如,127)的情況下將幀識別為 單一脈沖。替代地或另外,此解碼器可經(jīng)配置以在滯后值等于模式值(例如,127)的情況下 將幀識別為單一脈沖。對于多個(gè)脈沖的幀來說,任務(wù)T640可經(jīng)配置以提取具有最大增益(例如,最高峰 值)的音調(diào)脈沖。在提取脈沖時(shí),可能需要需要確保峰值并非為所提取脈沖的第一或最后 樣本,其將導(dǎo)致一個(gè)或一個(gè)以上重要樣本的間斷和/或忽略。在一些情況下,峰值之后的信 息與峰值之前的信息相比對于語音質(zhì)量可能更重要,因此可能需要提取脈沖以使得峰值接近開始處。在一個(gè)實(shí)例中,任務(wù)T640從音調(diào)周期提取在音調(diào)峰值之前兩個(gè)樣本處開始的形 狀。此方法允許俘獲在峰值之后出現(xiàn)且可能含有重要形狀信息的樣本。在另一實(shí)例中,可 能需要俘獲峰值之前的更多樣本,所述樣本也可能含有重要信息。在其它實(shí)例中,任務(wù)T640 經(jīng)配置以提取以峰值為中心的音調(diào)周期??赡苄枰獜囊粠崛∫粋€(gè)以上音調(diào)脈沖并計(jì)算來 自具有最高增益的兩個(gè)或兩個(gè)以上音調(diào)脈沖的平均形狀??赡苄枰趫?zhí)行形狀選擇之前規(guī) 格化脈沖振幅。對于多個(gè)脈沖的幀來說,任務(wù)T650基于滯后值(或所提取原型的長度)來選擇脈 沖形狀VQ表且接著從選定的表選擇最佳匹配??赡苄枰峁┚艂€(gè)或十個(gè)脈沖形狀VQ表來 編碼多個(gè)脈沖的幀。每一表具有不同向量尺寸,且與不同滯后范圍或“頻段”相關(guān)聯(lián)。因?yàn)?脈沖的長度可能并非與表?xiàng)l目的長度準(zhǔn)確地匹配,所以任務(wù)T650可經(jīng)配置以在從表選擇 最佳匹配之前向形狀向量墊零(zero-pad)(例如,在結(jié)束處)以與對應(yīng)的表向量大小匹配。 替代地或另外,任務(wù)T650可經(jīng)配置以在從表選擇最佳匹配之前截?cái)嘈螤钕蛄繌亩c對應(yīng) 的表向量大小匹配。在一個(gè)實(shí)例中,多脈沖脈沖形狀VQ表中的每一者具有1 個(gè)條目,使 得脈沖形狀經(jīng)編碼為七位索引。對應(yīng)解碼器(例如,解碼器300或裝置FD100的實(shí)施方案或執(zhí)行解碼任務(wù)DlOO的 實(shí)施方案的裝置)可經(jīng)配置以從經(jīng)編碼幀獲得滯后值和脈沖形狀索引值,使用滯后值來 選擇適當(dāng)?shù)拿}沖形狀VQ表,以及使用脈沖形狀索引值來從選定的脈沖形狀VQ表選擇所要 脈沖形狀。可以均勻方式或非均勻方式將可能(容許)的滯后值的范圍劃分為頻段。在如圖 31A中所說明的均勻劃分的一個(gè)實(shí)例中,20到146個(gè)樣本的滯后范圍被劃分為以下九個(gè)頻 段20 到 33,34 到 47,48 到 61,62 到 75,76 到 89,90 到 103、104 到 117、118 到 131 和 132 到146。在此實(shí)例中,除最后頻段外的所有頻段具有十四個(gè)樣本的寬度,所述最后頻段具有 十五個(gè)樣本的寬度。如上所闡述的均勻劃分與低音調(diào)頻率處的質(zhì)量相比可導(dǎo)致高音調(diào)頻率處的降低 的質(zhì)量。在以上實(shí)例中,具有二十個(gè)樣本的長度的音調(diào)脈沖在匹配之前將延伸(例如,墊 零)65%,而具有132個(gè)樣本的長度的音調(diào)脈沖將延伸(例如,墊零)僅11%。使用非均勻 劃分的一個(gè)潛在優(yōu)點(diǎn)為等化不同滯后頻段間的最大相對延伸。在如圖31B中所說明的非均 勻劃分的一個(gè)實(shí)例中,20到146個(gè)樣本的滯后范圍被劃分為以下九個(gè)頻段20到23、24到 29,30到37,38到47,48到60,61到76,77到96,97到120和121到146。在此情況下,具 有二十個(gè)樣本的長度的音調(diào)脈沖在匹配之前將延伸(例如,墊零)15%,具有121個(gè)樣本的 長度的音調(diào)脈沖將延伸(例如,墊零)21 %,且在20到146個(gè)樣本的范圍內(nèi)的任何音調(diào)脈沖 的最大延伸為25%。根據(jù)一配置(例如,根據(jù)語音編碼器AE20的實(shí)施方案)的語音編碼器使用三或 四種譯碼方案來編碼不同類別幀四分之一速率NELP(QNELP)譯碼方案、四分之一速率 PPP(QPPP)譯碼方案和如上所描述的過渡幀譯碼方案。QNELP譯碼方案用以編碼無聲幀和 向下瞬變幀。QNELP譯碼方案或八分之一速率NELP譯碼方案可用以編碼靜默幀(例如,背 景噪聲)。QPPP譯碼方案用以編碼有聲幀。過渡幀譯碼方案可用以編碼向上瞬變(即,開 始)幀和瞬變幀。圖沈的表展示這四種譯碼方案中的每一者的位分配的實(shí)例?,F(xiàn)代聲碼器通常執(zhí)行語音幀的分類。舉例來說,此聲碼器可根據(jù)將幀分類為以上所論述的六個(gè)不同類別(靜默、無聲、有聲、瞬變、向下瞬變和向上瞬變)中的一者的方 案來操作。此些方案的實(shí)例在第2002/0111798號美國公開專利申請案(Huang)中進(jìn)行描 述。此分類方案的一個(gè)實(shí)例還在3GPP2(第三代合作伙伴計(jì)劃幻文獻(xiàn)“用于寬帶擴(kuò)頻數(shù) 字系統(tǒng)的增強(qiáng)型可變速率編解碼器、語音服務(wù)選項(xiàng)3、68和70 (Enhanced Variable Rate Codec, Speech Service Options 3,68, and 70for Wideband Spread Spectrum Digital Systems) ”(在 www. 3gpp2. org 可在線獲得的 2007 年 1 月的 3GPP2 C. S0014-C)章節(jié) 4. 8 (第 4-57到4-71頁)中進(jìn)行描述。此方案使用在圖32的表中列出的特征來對幀進(jìn)行分類,且 此章節(jié)作為本文中所描述的“EVRC分類方案”的實(shí)例以引用的方式并入。
出現(xiàn)于圖32的表中的參數(shù)E、EL和EH可計(jì)算如下(對于160位幀來說)
權(quán)利要求
1.一種編碼語音信號的幀的方法,所述方法包含 編碼所述語音信號的第一幀以作為第一經(jīng)編碼幀;以及 編碼所述語音信號的第二幀以作為第二經(jīng)編碼幀, 其中所述編碼第一幀包括基于來自所述第一幀的至少一個(gè)音調(diào)脈沖的信息而選擇多個(gè)時(shí)域音調(diào)脈沖形狀中的一者;計(jì)算所述第一幀的終端音調(diào)脈沖的位置;以及 估計(jì)所述第一幀的音調(diào)周期,且 其中所述編碼第二幀包括計(jì)算所述第二幀的音調(diào)脈沖形狀與所述第一幀的音調(diào)脈沖形狀之間的音調(diào)脈沖形狀 差別;以及計(jì)算所述第二幀的音調(diào)周期與所述第一幀的音調(diào)周期之間的音調(diào)周期差別,且 其中所述第一經(jīng)編碼幀包括所述選定的時(shí)域音調(diào)脈沖形狀、所述所計(jì)算位置,和所述 所估計(jì)音調(diào)周期中的每一者的表示,且其中所述第二經(jīng)編碼幀包括所述音調(diào)脈沖形狀差別和所述音調(diào)周期差別中的每一者 的表示,且其中在所述語音信號中所述第二幀在所述第一幀之后。
2.根據(jù)權(quán)利要求1所述的編碼幀的方法,其中在所述語音信號中所述第二幀緊跟在所 述第一幀之后。
3.根據(jù)權(quán)利要求1所述的編碼幀的方法,其中所述方法包含檢測所述第一幀為開始幀。
4.根據(jù)權(quán)利要求1所述的編碼幀的方法,其中所述編碼第二幀包括基于來自所述第二 幀的至少一個(gè)音調(diào)脈沖的信息而計(jì)算頻域音調(diào)原型,且其中所述音調(diào)脈沖形狀差別是基于(A)所述所計(jì)算頻域音調(diào)原型與(B)所述選定的時(shí) 域音調(diào)脈沖形狀的頻域表示之間的差。
5.根據(jù)權(quán)利要求1所述的編碼幀的方法,其中所述編碼第一幀包括計(jì)算多個(gè)增益值, 所述多個(gè)增益值中的每一者對應(yīng)于所述第一幀的多個(gè)音調(diào)脈沖中的一不同者,且其中所述第一經(jīng)編碼幀包括所述多個(gè)增益值的表示。
6.根據(jù)權(quán)利要求1所述的編碼幀的方法,其中所述方法包括編碼所述語音信號的第三 幀以作為第三經(jīng)編碼幀,其中在所述語音信號中所述第二幀在所述第一幀之后,且 其中在所述語音信號中所述第三幀在所述第二幀之后,且 其中所述編碼第三幀包括計(jì)算所述第三幀的音調(diào)脈沖形狀與所述第二幀的音調(diào)脈沖形狀之間的第二音調(diào)脈沖 形狀差別;以及計(jì)算所述第三幀的音調(diào)周期與所述第二幀的音調(diào)周期之間的第二音調(diào)周期差別,且 其中所述第三經(jīng)編碼幀包括所述第二音調(diào)脈沖形狀差別和所述第二音調(diào)周期差別的表不。
7.一種用于編碼語音信號的幀的設(shè)備,所述設(shè)備包含用于編碼所述語音信號的第一幀以作為第一經(jīng)編碼幀的裝置;以及 用于編碼所述語音信號的第二幀以作為第二經(jīng)編碼幀的裝置, 其中所述用于編碼第一幀的裝置包括用于基于來自所述第一幀的至少一個(gè)音調(diào)脈沖的信息而選擇多個(gè)時(shí)域音調(diào)脈沖形狀 中的一者的裝置;用于計(jì)算所述第一幀的終端音調(diào)脈沖的位置的裝置;以及 用于估計(jì)所述第一幀的音調(diào)周期的裝置,且 其中所述用于編碼第二幀的裝置包括用于計(jì)算所述第二幀的音調(diào)脈沖形狀與所述第一幀的音調(diào)脈沖形狀之間的音調(diào)脈沖 形狀差別的裝置;以及用于計(jì)算所述第二幀的音調(diào)周期與所述第一幀的音調(diào)周期之間的音調(diào)周期差別的裝 置,且其中所述第一經(jīng)編碼幀包括所述選定的時(shí)域音調(diào)脈沖形狀、所述所計(jì)算位置,和所述 所估計(jì)音調(diào)周期的表示,且其中所述第二經(jīng)編碼幀包括所述音調(diào)脈沖形狀差別和所述音調(diào)周期差別的表示,且 其中在所述語音信號中所述第二幀在所述第一幀之后。
8.根據(jù)權(quán)利要求7所述的用于編碼幀的設(shè)備,其中所述設(shè)備包括用于檢測所述第一幀 為開始幀的裝置。
9.根據(jù)權(quán)利要求7所述的用于編碼幀的設(shè)備,其中所述用于編碼第二幀的裝置包括用 于基于來自所述第二幀的至少一個(gè)音調(diào)脈沖的信息而計(jì)算頻域音調(diào)原型的裝置,且其中所述音調(diào)脈沖形狀差別是基于(A)所述所計(jì)算頻域音調(diào)原型與(B)所述選定的時(shí) 域音調(diào)脈沖形狀的頻域表示之間的差。
10.根據(jù)權(quán)利要求7所述的用于編碼幀的設(shè)備,其中所述用于編碼第一幀的裝置包括 用于計(jì)算多個(gè)增益值的裝置,所述多個(gè)增益值中的每一者對應(yīng)于所述第一幀的多個(gè)音調(diào)脈 沖中的一不同者,且其中所述第一經(jīng)編碼幀包括所述多個(gè)增益值的表示。
11.根據(jù)權(quán)利要求7所述的用于編碼幀的設(shè)備,其中所述設(shè)備包括用于編碼所述語音 信號的第三幀以作為第三經(jīng)編碼幀的裝置,其中在所述語音信號中所述第二幀在所述第一幀之后,且 其中在所述語音信號中所述第三幀在所述第二幀之后,且 其中所述用于編碼第三幀的裝置包括用于計(jì)算所述第三幀的音調(diào)脈沖形狀與所述第二幀的音調(diào)脈沖形狀之間的第二音調(diào) 脈沖形狀差別的裝置;以及用于計(jì)算所述第三幀的音調(diào)周期與所述第二幀的音調(diào)周期之間的第二音調(diào)周期差別 的裝置,且其中所述第三經(jīng)編碼幀包括所述第二音調(diào)脈沖形狀差別和所述第二音調(diào)周期差別的表示。
12.一種用于編碼語音信號的幀的設(shè)備,所述設(shè)備包含第一幀編碼器,其經(jīng)配置以編碼所述語音信號的第一幀以作為第一經(jīng)編碼幀;以及第二幀編碼器,其經(jīng)配置以編碼所述語音信號的第二幀以作為第二經(jīng)編碼幀, 其中所述第一幀編碼器包括音調(diào)脈沖形狀選擇器,其經(jīng)配置以基于來自所述第一幀的至少一個(gè)音調(diào)脈沖的信息而 選擇多個(gè)時(shí)域音調(diào)脈沖形狀中的一者;音調(diào)峰值位置計(jì)算器,其經(jīng)配置以計(jì)算所述第一幀的終端音調(diào)脈沖的位置;以及 音調(diào)周期估計(jì)器,其經(jīng)配置以估計(jì)所述第一幀的音調(diào)周期,且 其中所述第二幀編碼器包括音調(diào)脈沖形狀差別計(jì)算器,其經(jīng)配置以計(jì)算所述第二幀的音調(diào)脈沖形狀與所述第一幀 的音調(diào)脈沖形狀之間的音調(diào)脈沖形狀差別;以及音調(diào)周期差別計(jì)算器,其經(jīng)配置以計(jì)算所述第二幀的音調(diào)周期與所述第一幀的音調(diào)周 期之間的音調(diào)周期差別,且其中所述第一經(jīng)編碼幀包括所述選定的時(shí)域音調(diào)脈沖形狀、所述所計(jì)算位置,和所述 所估計(jì)音調(diào)周期的表示,且其中所述第二經(jīng)編碼幀包括所述音調(diào)脈沖形狀差別和所述音調(diào)周期差別的表示,且 其中在所述語音信號中所述第二幀在所述第一幀之后。
13.根據(jù)權(quán)利要求12所述的用于編碼幀的設(shè)備,其中所述設(shè)備包括經(jīng)配置以檢測所述 第一幀為開始幀的幀分類器。
14.根據(jù)權(quán)利要求12所述的用于編碼幀的設(shè)備,其中所述第二幀編碼器包括音調(diào)原 型計(jì)算器,其經(jīng)配置以基于來自所述第二幀的至少一個(gè)音調(diào)脈沖的信息而計(jì)算頻域音調(diào)原 型,且其中所述音調(diào)脈沖形狀差別是基于(A)所述所計(jì)算頻域音調(diào)原型與(B)所述選定的時(shí) 域音調(diào)脈沖形狀的頻域表示之間的差。
15.根據(jù)權(quán)利要求12所述的用于編碼幀的設(shè)備,其中所述第一幀編碼器包括經(jīng)配置以 計(jì)算多個(gè)增益值的增益值計(jì)算器,所述多個(gè)增益值中的每一者對應(yīng)于所述第一幀的多個(gè)音 調(diào)脈沖中的一不同者,且其中所述第一經(jīng)編碼幀包括所述多個(gè)增益值的表示。
16.根據(jù)權(quán)利要求12所述的用于編碼幀的設(shè)備,其中所述第二幀編碼器經(jīng)配置以編碼 所述語音信號的第三幀以作為第三經(jīng)編碼幀,其中在所述語音信號中所述第二幀在所述第一幀之后,且 其中在所述語音信號中所述第三幀在所述第二幀之后,且其中所述音調(diào)脈沖形狀差別計(jì)算器經(jīng)配置以計(jì)算所述第三幀的音調(diào)脈沖形狀與所述 第二幀的音調(diào)脈沖形狀之間的第二音調(diào)脈沖形狀差別,且其中所述音調(diào)周期差別計(jì)算器經(jīng)配置以計(jì)算所述第三幀的音調(diào)周期與所述第二幀的 音調(diào)周期之間的第二音調(diào)周期差別,且其中所述第三經(jīng)編碼幀包括所述第二音調(diào)脈沖形狀差別和所述第二音調(diào)周期差別的 表不。
17.一種包含指令的計(jì)算機(jī)可讀媒體,所述指令在由處理器執(zhí)行時(shí)致使所述處理器 編碼所述語音信號的第一幀以作為第一經(jīng)編碼幀;以及編碼所述語音信號的第二幀以作為第二經(jīng)編碼幀,其中所述致使所述處理器編碼第一幀的指令包括致使所述處理器基于來自所述第一幀的至少一個(gè)音調(diào)脈沖的信息而選擇多個(gè)時(shí)域音 調(diào)脈沖形狀中的一者的指令;致使所述處理器計(jì)算所述第一幀的終端音調(diào)峰值的位置的指令;以及 致使所述處理器估計(jì)所述第一幀的音調(diào)周期的指令,且 其中所述致使所述處理器編碼第二幀的指令包括致使所述處理器計(jì)算所述第二幀的音調(diào)脈沖形狀與所述第一幀的音調(diào)脈沖形狀之間 的音調(diào)脈沖形狀差別的指令;以及致使所述處理器計(jì)算所述第二幀的音調(diào)周期與所述第一幀的音調(diào)周期之間的音調(diào)周 期差別的指令,且其中所述第一經(jīng)編碼幀包括所述選定的時(shí)域音調(diào)脈沖形狀、所述所計(jì)算位置和所述所 估計(jì)音調(diào)周期的表示,且其中所述第二經(jīng)編碼幀包括所述音調(diào)脈沖形狀差別和所述音調(diào)周期差別的表示,且 其中在所述語音信號中所述第二幀在所述第一幀之后。
18.根據(jù)權(quán)利要求17所述的計(jì)算機(jī)可讀媒體,其中所述媒體包括在由處理器執(zhí)行時(shí)致 使所述處理器檢測所述第一幀為開始幀的指令。
19.根據(jù)權(quán)利要求17所述的計(jì)算機(jī)可讀媒體,其中所述致使所述處理器編碼第二幀的 指令包括致使所述處理器基于來自所述第二幀的至少一個(gè)音調(diào)脈沖的信息而計(jì)算頻域音 調(diào)原型的指令,且其中所述音調(diào)脈沖形狀差別是基于(A)所述所計(jì)算頻域音調(diào)原型與(B)所述選定的時(shí) 域音調(diào)脈沖形狀的頻域表示之間的差。
20.根據(jù)權(quán)利要求17所述的計(jì)算機(jī)可讀媒體,其中所述致使所述處理器編碼第一幀的 指令包括致使所述處理器計(jì)算多個(gè)增益值的指令,所述多個(gè)增益值中的每一者對應(yīng)于所述 第一幀的多個(gè)音調(diào)脈沖中的一不同者,且其中所述第一經(jīng)編碼幀包括所述多個(gè)增益值的表示。
21.根據(jù)權(quán)利要求17所述的計(jì)算機(jī)可讀媒體,其中所述媒體包括在由處理器執(zhí)行時(shí)致 使所述處理器編碼所述語音信號的第三幀以作為第三經(jīng)編碼幀的指令,其中在所述語音信號中所述第二幀在所述第一幀之后,且 其中在所述語音信號中所述第三幀在所述第二幀之后,且 其中所述致使所述處理器編碼第三幀的指令包括致使所述處理器計(jì)算所述第三幀的音調(diào)脈沖形狀與所述第二幀的音調(diào)脈沖形狀之間 的第二音調(diào)脈沖形狀差別的指令;以及致使所述處理器計(jì)算所述第三幀的音調(diào)周期與所述第二幀的音調(diào)周期之間的第二音 調(diào)周期差別的指令,且其中所述第三經(jīng)編碼幀包括所述第二音調(diào)脈沖形狀差別和所述第二音調(diào)周期差別的 表不。
22.—種解碼語音信號的激勵(lì)信號的方法,所述方法包含 解碼第一經(jīng)編碼幀的一部分以獲得第一激勵(lì)信號;以及 解碼第二經(jīng)編碼幀的一部分以獲得第二激勵(lì)信號,其中所述第一經(jīng)編碼幀的所述部分包括時(shí)域音調(diào)脈沖形狀、音調(diào)峰值位置和音調(diào)周期 中的每一者的表示,且其中所述第二經(jīng)編碼幀的所述部分包括音調(diào)脈沖形狀差別和音調(diào)周期差別中的每一 者的表示,且其中所述解碼第一經(jīng)編碼幀的一部分包括根據(jù)所述音調(diào)峰值位置將所述時(shí)域音調(diào)脈沖形狀的第一副本布置于所述第一激勵(lì)信 號內(nèi);以及根據(jù)所述音調(diào)峰值位置和所述音調(diào)周期將所述時(shí)域音調(diào)脈沖形狀的第二副本布置于 所述第一激勵(lì)信號內(nèi),且其中所述解碼第二經(jīng)編碼幀的一部分包括基于所述時(shí)域音調(diào)脈沖形狀和所述音調(diào)脈沖形狀差別而計(jì)算第二音調(diào)脈沖形狀; 基于所述音調(diào)周期和所述音調(diào)周期差別而計(jì)算第二音調(diào)周期;以及 根據(jù)所述音調(diào)峰值位置和所述第二音調(diào)周期將所述第二音調(diào)脈沖形狀的多個(gè)副本布 置于所述第二激勵(lì)信號內(nèi)。
23.根據(jù)權(quán)利要求22所述的解碼激勵(lì)信號的方法,其中所述第一經(jīng)編碼幀的所述部分 包括多個(gè)增益值的表示,且其中所述解碼第一經(jīng)編碼幀的一部分包括向所述時(shí)域音調(diào)脈沖形狀的所述第一副本應(yīng)用所述多個(gè)增益值中的一者;以及 向所述時(shí)域音調(diào)脈沖形狀的所述第二副本應(yīng)用所述多個(gè)增益值中的一不同者。
24.一種檢測語音信號的幀的音調(diào)峰值的方法,所述方法包含 檢測所述幀的第一音調(diào)峰值;從所述幀的第一搜索窗內(nèi)的多個(gè)樣本中選擇候選樣本;從多個(gè)距離中選擇候選距離,所述多個(gè)距離中的每一者對應(yīng)于所述幀的第二搜索窗內(nèi) 的不同樣本;以及將(A)所述候選樣本和(B)對應(yīng)于所述候選距離的所述樣本中的一者選擇為所述幀的第二音調(diào)峰值,其中所述多個(gè)距離中的每一者是A)所述對應(yīng)樣本與B)所述第一音調(diào)峰值之間的距1 。
25.根據(jù)權(quán)利要求M所述的檢測音調(diào)峰值的方法,其中對應(yīng)于所述候選距離的所述樣 本不同于所述候選樣本。
26.根據(jù)權(quán)利要求M所述的檢測音調(diào)峰值的方法,其中所述選擇候選樣本包括以下操 作中的至少一者(A)將所述第一搜索窗內(nèi)的所述樣本中的具有最大振幅的所述樣本選擇 為所述候選樣本,(B)將所述第一搜索窗內(nèi)的所述樣本中的具有最大量值的所述樣本選擇 為所述候選樣本,和(C)將所述第一搜索窗內(nèi)的所述樣本中的具有最大能量的所述樣本選 擇為所述候選樣本。
27.根據(jù)權(quán)利要求M所述的檢測音調(diào)峰值的方法,其中所述選擇候選樣本包括將所述 第一搜索窗內(nèi)的所述樣本中的具有所述最大振幅的所述樣本選擇為所述候選樣本。
28.根據(jù)權(quán)利要求M所述的檢測音調(diào)峰值的方法,其中所述方法包含針對所述多個(gè)距 離中的每一者計(jì)算所述對應(yīng)樣本的鄰域與所述第一音調(diào)峰值的鄰域之間的相關(guān)的值,且其中所述選擇候選距離包括將對應(yīng)于所述所計(jì)算相關(guān)值中的最大值的所述距離選擇 為所述候選距離。
29.根據(jù)權(quán)利要求觀所述的檢測音調(diào)峰值的方法,其中所述選擇所述候選樣本與對應(yīng) 于所述候選距離的所述樣本中的一者是基于以下各項(xiàng)中的至少一者(A)基于所述候選樣 本的能量的值與第一閾值之間的關(guān)系,和(B)對應(yīng)于所述候選距離的所述所計(jì)算相關(guān)值與 第二閾值之間的關(guān)系。
30.根據(jù)權(quán)利要求M所述的檢測音調(diào)峰值的方法,其中所述第一音調(diào)峰值為所述幀的 終端音調(diào)峰值。
31.根據(jù)權(quán)利要求M所述的檢測音調(diào)峰值的方法,其中所述方法包含在所述檢測所述 幀的第一音調(diào)峰值之前檢測所述幀的第三音調(diào)峰值,其中所述第三音調(diào)峰值為所述幀的終 端音調(diào)峰值。
32.根據(jù)權(quán)利要求31所述的檢測音調(diào)峰值的方法,其中所述檢測所述幀的第一音調(diào)峰 值是基于(A)所述幀內(nèi)的所述第三音調(diào)峰值的位置,(B)音調(diào)周期估計(jì),和(C)第一能量閾 值與基于所述第一音調(diào)峰值的能量的值之間的關(guān)系。
33.根據(jù)權(quán)利要求32所述的檢測音調(diào)峰值的方法,其中所述選擇所述候選樣本與對應(yīng) 于所述候選距離的所述樣本中的一者是基于以下各項(xiàng)中的至少一者(A)基于所述候選樣 本的能量的值與第二閾值之間的關(guān)系,和(B)基于對應(yīng)于所述候選距離的所述樣本的能量 的值與所述第二閾值之間的關(guān)系,其中所述第二閾值小于所述第一閾值。
34.一種用于檢測語音信號的幀的音調(diào)峰值的設(shè)備,所述設(shè)備包含用于檢測所述幀的第一音調(diào)峰值的裝置;用于從所述幀的第一搜索窗內(nèi)的多個(gè)樣本中選擇候選樣本的裝置;用于從多個(gè)距離中選擇候選距離的裝置,所述多個(gè)距離中的每一者對應(yīng)于所述幀的第 二搜索窗內(nèi)的不同樣本;以及用于將(A)所述候選樣本和(B)對應(yīng)于所述候選距離的所述樣本中的一者選擇為所述 幀的第二音調(diào)峰值的裝置,其中所述多個(gè)距離中的每一者是A)所述對應(yīng)樣本與B)所述第一音調(diào)峰值之間的距離。
35.根據(jù)權(quán)利要求34所述的用于檢測音調(diào)峰值的設(shè)備,其中所述用于選擇候選樣本的 裝置經(jīng)配置以將所述第一搜索窗內(nèi)的所述樣本中的具有最大振幅的所述樣本選擇為所述 候選樣本。
36.根據(jù)權(quán)利要求34所述的用于檢測音調(diào)峰值的設(shè)備,其中所述設(shè)備包含用于針對所 述多個(gè)距離中的每一者計(jì)算所述對應(yīng)樣本的鄰域與所述第一音調(diào)峰值的鄰域之間的相關(guān) 的值的裝置,且其中所述用于選擇候選距離的裝置經(jīng)配置以將對應(yīng)于所述所計(jì)算相關(guān)值中的最大值 的所述距離選擇為所述候選距離。
37.根據(jù)權(quán)利要求36所述的用于檢測音調(diào)峰值的設(shè)備,其中所述用于選擇所述候選樣 本與對應(yīng)于所述候選距離的所述樣本中的一者的裝置經(jīng)配置以基于以下各項(xiàng)中的至少一 者來選擇所述候選樣本與對應(yīng)于所述候選距離的所述樣本中的所述一者(A)基于所述候選樣本的能量的值與第一閾值之間的關(guān)系,和(B)對應(yīng)于所述候選距離的所述所計(jì)算相關(guān) 值與第二閾值之間的關(guān)系。
38.根據(jù)權(quán)利要求34所述的用于檢測音調(diào)峰值的設(shè)備,其中所述設(shè)備包含用于檢測所 述幀的第三音調(diào)峰值的裝置,其中所述第三音調(diào)峰值為所述幀的終端音調(diào)峰值,且其中所述用于檢測所述幀的第一音調(diào)峰值的裝置經(jīng)配置以基于以下各項(xiàng)來檢測所述 第一音調(diào)峰值(A)所述幀內(nèi)的所述第三音調(diào)峰值的位置,(B)音調(diào)周期估計(jì),和(C)第一能 量閾值與基于所述第一音調(diào)峰值的能量的值之間的關(guān)系。
39.根據(jù)權(quán)利要求38所述的用于檢測音調(diào)峰值的設(shè)備,其中所述用于選擇所述候選樣 本與對應(yīng)于所述候選距離的所述樣本中的一者的裝置經(jīng)配置以基于以下各項(xiàng)中的至少一 者來選擇所述候選樣本與對應(yīng)于所述候選距離的所述樣本中的所述一者(A)基于所述候 選樣本的能量的值與第二閾值之間的關(guān)系,和(B)基于對應(yīng)于所述候選距離的所述樣本的 能量的值與所述第二閾值之間的關(guān)系,其中所述第二閾值小于所述第一閾值。
40.一種用于檢測語音信號的幀的音調(diào)峰值的設(shè)備,所述設(shè)備包含峰值檢測器,其經(jīng)配置以檢測所述幀的第一音調(diào)峰值;樣本選擇器,其經(jīng)配置以從所述幀的第一搜索窗內(nèi)的多個(gè)樣本中選擇候選樣本;距離選擇器,其經(jīng)配置以從多個(gè)距離中選擇候選距離,所述多個(gè)距離中的每一者對應(yīng) 于所述幀的第二搜索窗內(nèi)的不同樣本;以及峰值選擇器,其經(jīng)配置以將(A)所述候選樣本和(B)對應(yīng)于所述候選距離的所述樣本 中的一者選擇為所述幀的第二音調(diào)峰值,其中所述多個(gè)距離中的每一者是A)所述對應(yīng)樣本與B)所述第一音調(diào)峰值之間的距1 O
41.根據(jù)權(quán)利要求40所述的用于檢測音調(diào)峰值的設(shè)備,其中所述樣本選擇器經(jīng)配置以 將所述第一搜索窗內(nèi)的所述樣本中的具有最大振幅的所述樣本選擇為所述候選樣本。
42.根據(jù)權(quán)利要求40所述的用于檢測音調(diào)峰值的設(shè)備,其中所述設(shè)備包含相關(guān)器,所 述相關(guān)器經(jīng)配置以針對所述多個(gè)距離中的每一者計(jì)算所述對應(yīng)樣本的鄰域與所述第一音 調(diào)峰值的鄰域之間的相關(guān)的值,且其中所述距離選擇器經(jīng)配置以將對應(yīng)于所述所計(jì)算相關(guān)值中的最大值的所述距離選 擇為所述候選距離。
43.根據(jù)權(quán)利要求42所述的用于檢測音調(diào)峰值的設(shè)備,其中所述峰值選擇器經(jīng)配置以 基于以下各項(xiàng)中的至少一者來選擇所述候選樣本與對應(yīng)于所述候選距離的所述樣本中的 一者(A)基于所述候選樣本的能量的值與第一閾值之間的關(guān)系,和(B)對應(yīng)于所述候選距 離的所述所計(jì)算相關(guān)值與第二閾值之間的關(guān)系。
44.根據(jù)權(quán)利要求40所述的用于檢測音調(diào)峰值的設(shè)備,其中所述設(shè)備包含終端峰值檢 測器,所述終端峰值檢測器經(jīng)配置以檢測所述幀的第三音調(diào)峰值,其中所述第三音調(diào)峰值 為所述幀的終端音調(diào)峰值,且其中所述峰值檢測器經(jīng)配置以基于以下各項(xiàng)來檢測所述第一音調(diào)峰值(A)所述幀內(nèi) 的所述第三音調(diào)峰值的位置,(B)音調(diào)周期估計(jì),和(C)第一能量閾值與基于所述第一音調(diào) 峰值的能量的值之間的關(guān)系。
45.根據(jù)權(quán)利要求44所述的用于檢測音調(diào)峰值的設(shè)備,其中所述峰值選擇器經(jīng)配置以 基于以下各項(xiàng)中的至少一者來選擇所述候選樣本與對應(yīng)于所述候選距離的所述樣本中的 一者(A)基于所述候選樣本的能量的值與第二閾值之間的關(guān)系,和(B)基于對應(yīng)于所述候 選距離的所述樣本的能量的值與所述第二閾值之間的關(guān)系,其中所述第二閾值小于所述第一閾值。
46.一種包含指令的計(jì)算機(jī)可讀媒體,所述指令在由處理器執(zhí)行時(shí)致使所述處理器檢測所述幀的第一音調(diào)峰值;從所述幀的第一搜索窗內(nèi)的多個(gè)樣本中選擇候選樣本;從多個(gè)距離中選擇候選距離,所述多個(gè)距離中的每一者對應(yīng)于所述幀的第二搜索窗內(nèi) 的不同樣本;以及將(A)所述候選樣本和(B)對應(yīng)于所述候選距離的所述樣本中的一者選擇為所述幀的第二音調(diào)峰值,其中所述多個(gè)距離中的每一者是A)所述對應(yīng)樣本與B)所述第一音調(diào)峰值之間的距1 O
47.根據(jù)權(quán)利要求46所述的計(jì)算機(jī)可讀媒體,其中所述致使所述處理器選擇候選樣本 的指令包括致使所述處理器將所述第一搜索窗內(nèi)的所述樣本中的具有最大振幅的樣本選 擇為所述候選樣本的指令。
48.根據(jù)權(quán)利要求46所述的計(jì)算機(jī)可讀媒體,其中所述媒體包含在由處理器執(zhí)行時(shí)致 使所述處理器針對所述多個(gè)距離中的每一者計(jì)算所述對應(yīng)樣本的鄰域與所述第一音調(diào)峰 值的鄰域之間的相關(guān)的值的指令,且其中所述致使所述處理器選擇候選距離的指令包括致使所述處理器將對應(yīng)于所述所 計(jì)算相關(guān)值中的最大值的所述距離選擇為所述候選距離的指令。
49.根據(jù)權(quán)利要求48所述的計(jì)算機(jī)可讀媒體,其中所述致使所述處理器選擇所述候選 樣本與對應(yīng)于所述候選距離的所述樣本中的一者的指令包括致使所述處理器基于以下各 項(xiàng)中的至少一者來選擇所述候選樣本與對應(yīng)于所述候選距離的所述樣本中的所述一者的 指令(A)基于所述候選樣本的能量的值與第一閾值之間的關(guān)系,和(B)對應(yīng)于所述候選距 離的所述所計(jì)算相關(guān)值與第二閾值之間的關(guān)系。
50.根據(jù)權(quán)利要求46所述的計(jì)算機(jī)可讀媒體,其中所述媒體包含在由處理器執(zhí)行時(shí)致 使所述處理器檢測所述幀的第三音調(diào)峰值的指令,其中所述第三音調(diào)峰值為所述幀的終端 音調(diào)峰值,且其中所述致使所述處理器檢測所述幀的第一音調(diào)峰值的指令包括致使所述處理器基 于以下各項(xiàng)來檢測所述第一音調(diào)峰值的指令(A)所述幀內(nèi)的所述第三音調(diào)峰值的位置, (B)音調(diào)周期估計(jì),和(C)第一能量閾值與基于所述第一音調(diào)峰值的能量的值之間的關(guān)系。
51.根據(jù)權(quán)利要求50所述的計(jì)算機(jī)可讀媒體,其中所述致使所述處理器選擇所述候選 樣本與對應(yīng)于所述候選距離的所述樣本中的一者的指令包括致使所述處理器基于以下各 項(xiàng)中的至少一者來選擇所述候選樣本與對應(yīng)于所述候選距離的所述樣本中的所述一者的 指令(A)基于所述候選樣本的能量的值與第二閾值之間的關(guān)系,和(B)基于對應(yīng)于所述候 選距離的所述樣本的能量的值與所述第二閾值之間的關(guān)系,其中所述第二閾值小于所述第一閾值。
全文摘要
本發(fā)明揭示用于過渡語音幀的低位速率譯碼的系統(tǒng)、方法和設(shè)備。
文檔編號G10L11/04GK102067212SQ200980123138
公開日2011年5月18日 申請日期2009年6月19日 優(yōu)先權(quán)日2008年6月20日
發(fā)明者沙拉什·曼朱納什, 阿南塔帕德馬納卜漢·坎達(dá)達(dá)伊, 阿洛科·K·古普塔 申請人:高通股份有限公司