用于關(guān)鍵性閾值控制的系統(tǒng)、方法、設(shè)備和計算機可讀媒體的制作方法
【專利摘要】可實施如本文中揭示的系統(tǒng)、方法和設(shè)備以基于信道條件調(diào)整話音幀的關(guān)鍵性閾值。此閾值可用以響應(yīng)于信道狀態(tài)的改變而控制重傳頻率。
【專利說明】用于關(guān)鍵性閾值控制的系統(tǒng)、方法、設(shè)備和計算機可讀媒體
[0001]根據(jù)35U.S.C.§ 119豐張優(yōu)先權(quán)
[0002]本專利申請案主張2012年I月12日申請且已轉(zhuǎn)讓給本受讓人的題為“用于冗余傳輸?shù)奈环峙涞南到y(tǒng)、方法、設(shè)備和計算機可讀媒體(SYSTEMS,METHODS, APPARATUS,AND COMPUTER-READABLE MEDIA FOR BIT ALLOCAT1N FOR REDUNDANT TRANSMISS1N) ” 的第61/586,007號臨時申請案的優(yōu)先權(quán)。本專利申請案還主張2012年I月17日申請且已轉(zhuǎn)讓給本受讓人的題為“用于關(guān)鍵性閾值控制的系統(tǒng)、方法、設(shè)備和計算機可讀媒體(SYSTEMS, METHODS, APPARATUS, AND COMPUTER-READABLE MEDIA FOR CRITICALITY THRESHOLDCONTROL) ”的臨時申請案第61/587,507號的優(yōu)先權(quán)。本專利申請案還主張2012年5月I日申請且已轉(zhuǎn)讓給本受讓人的題為“用于冗余傳輸?shù)奈环峙涞南到y(tǒng)、方法、設(shè)備和計算機可讀媒體(SYSTEMS,METHODS, APPARATUS, AND COMPUTER-READABLE MEDIA FOR BIT ALLOCAT1NFOR REDUNDANT TRANSMISS1N) ” 的臨時申請案第 61/641,093 號的優(yōu)先權(quán)。
【技術(shù)領(lǐng)域】
[0003]本發(fā)明涉及音頻通信。
【背景技術(shù)】
[0004]已在電路交換式網(wǎng)絡(luò)上執(zhí)行數(shù)字音頻電信。電路交換式網(wǎng)絡(luò)為在通話的持續(xù)時間中在兩個終端之 間建立物理路徑的網(wǎng)絡(luò)。在電路父換式應(yīng)用中,發(fā)射終端在物理路徑上將一連串含有音頻(例如,語音)信息的包發(fā)送到接收終端。接收終端使用包中含有的音頻信息(例如,語音信息)合成對應(yīng)的音頻信號(例如,話音信號)。
[0005]已開始在包交換式網(wǎng)絡(luò)上執(zhí)行數(shù)字音頻電信。包交換式網(wǎng)絡(luò)為基于目的地地址而經(jīng)由網(wǎng)絡(luò)路由包的網(wǎng)絡(luò)。在包交換式通信的情況下,路由器個別地確定用于每一包的路徑,將包沿著任一可利用的路徑發(fā)送以到達其目的地。結(jié)果,包可能不能同時或按相同次序到達接收終端。去抖動緩沖器可在接收終端中用以使包按次序排列,且按連續(xù)依序方式播放。
[0006]有時,在從發(fā)射終端轉(zhuǎn)運到接收終端時,包被丟失。丟失的包可使合成的音頻信號的質(zhì)量降級。因而,可通過提供用以解決幀內(nèi)(例如,話音幀內(nèi))的信息丟失的系統(tǒng)和方法來實現(xiàn)益處。
【發(fā)明內(nèi)容】
[0007]—種根據(jù)一般配置的音頻信號處理的方法包括計算音頻信號的第二幀對在所述音頻信號中在所述第二幀之前的第一幀的譯碼相依性的估計。此方法還包括基于與發(fā)射信道的狀態(tài)有關(guān)的信息計算閾值。此方法還包括將所述計算出的估計與所述計算出的閾值進行比較;及基于所述比較的結(jié)果,決定發(fā)射所述第一幀的冗余副本。還揭示具有有形特征的計算機可讀存儲媒體(例如,非暫時性媒體),所述有形特征使讀取所述特征的機器執(zhí)行此方法。
[0008]一種用于根據(jù)一般配置的音頻信號處理的設(shè)備包括用于計算音頻信號的第二幀對在所述音頻信號中在所述第二幀之前的第一幀的譯碼相依性的估計的裝置。此設(shè)備還包括用于基于與發(fā)射信道的狀態(tài)有關(guān)的信息計算閾值的裝置;用于將所述計算出的估計與所述計算出的閾值進行比較的裝置;及用于基于所述比較的結(jié)果決定發(fā)射所述第一幀的冗余副本的裝置。
[0009]一種用于根據(jù)另一一般配置的音頻信號處理的設(shè)備包括第一計算器,其經(jīng)配置以計算音頻信號的第二幀對在所述音頻信號中在所述第二幀之前的第一幀的譯碼相依性的估計。此設(shè)備還包括第二計算器,其經(jīng)配置以基于與發(fā)射信道的狀態(tài)有關(guān)的信息計算閾值。此設(shè)備還包括模式選擇器,其經(jīng)配置以(A)將所述計算出的估計與所述計算出的閾值進行比較,及⑶基于所述比較的結(jié)果決定發(fā)射所述第一幀的冗余副本。
【專利附圖】
【附圖說明】
[0010]圖1為說明經(jīng)由網(wǎng)絡(luò)NWlO通信的發(fā)射終端102和接收終端104的實例的方框圖。
[0011]圖2A展示具有各種終端設(shè)備的網(wǎng)絡(luò)NWlO的實施方案NW20的方框圖。
[0012]圖2B展示音頻編碼器AElO的實施方案AE20的方框圖。
[0013]圖3為幀編碼器FElO的實施方案FE20的方框圖。
[0014]圖4A展示根據(jù)一般配置的方法MlOO的流程圖。
[0015]圖4B展示方法MlOO的實施方案MllO的流程圖。
[0016]圖5A和圖5B展示如本文中描述的信道狀態(tài)信息與其它系統(tǒng)參數(shù)之間的關(guān)系的實例。
[0017]圖5C展不音頻信號的一連串巾貞的實例。
[0018]圖6A展示方法MlOO的實施方案M120的流程圖。
[0019]圖6B展示任務(wù)T200的實施方案T210的流程圖。
[0020]圖7A展示方法MlOO的實施方案M200的流程圖。
[0021]圖7B展示方法M200的實施方案M210的流程圖。
[0022]圖8展示方法M110、M120和M210的實施方案M300的流程圖。
[0023]圖9A為IPv4包的圖。
[0024]圖9B為IPv6包的圖。
[0025]圖9C展示通信裝置DlO的方框圖。
[0026]圖10展示RTP包的有效負載的實例。
[0027]圖11為音頻解碼器ADlO的實施方案AD20的方框圖。
[0028]圖12A展示根據(jù)一般配置的設(shè)備MF100的方框圖。
[0029]圖12B展示設(shè)備MF100的實施方案MFllO的方框圖。
[0030]圖13A展示設(shè)備MF100的實施方案MF120的方框圖。
[0031]圖13B展示設(shè)備MF100的實施方案MF200的方框圖。
[0032]圖14A展示裝置F200的實施方案F210的方框圖。
[0033]圖14B展示設(shè)備MF100的實施方案MF210的方框圖。
[0034]圖15展示設(shè)備MF110、MF120和MF210的實施方案MF300的方框圖。
[0035]圖16A展示根據(jù)一般配置的設(shè)備AP100的方框圖。
[0036]圖16B展示設(shè)備AP100的實施方案APllO的方框圖。[0037]圖16C展示第二計算器A200的實施A210的方框圖。
[0038]圖16D展示設(shè)備AP100的實施方案AP120的方框圖。
[0039]圖16E展示第二計算器A200的實施方案的實例A220的方框圖。
[0040]圖17A展示設(shè)備AP100的實施方案AP200的方框圖。
[0041]圖17B展示設(shè)備AP100的實施方案AP210的方框圖。
[0042]圖17C展示設(shè)備AP210的實施方案AP220的方框圖。
[0043]圖18A展示設(shè)備AP110、AP120和AP210的實施方案AP300的方框圖。
[0044]圖18B展示無線裝置1102的方框圖。
[0045]圖19展示設(shè)備AP300的實施方案AP400的方框圖。
[0046]圖20展示手持機HlOO的前視圖、后視圖和側(cè)視圖。
【具體實施方式】
[0047]如本文中揭示的系統(tǒng)、方法和設(shè)備可經(jīng)實施以針對使用閾值控制話音幀的重傳頻率的話音譯碼應(yīng)用,基于信道條件調(diào)整一或多個關(guān)鍵性閾值。
[0048]除非明確地受到其上下文限制,否則術(shù)語“信號”在本文中用以指示其普通意義中的任一者,包括如在電線、總線或其它傳輸媒體上表達的存儲器位置(或存儲器位置的集合)的狀態(tài)。除非明確地受到其上下文限制,否則術(shù)語“產(chǎn)生”在本文中用以指示其普通意義中的任一者,例如,計算或以其它方式產(chǎn)生。除非明確地受到其上下文限制,否則術(shù)語“計算”在本文中用以指示其普通意義中的任一者,例如,計算、評估、平滑化和/或從多個值選擇。除非明確地受到其上下文限制,否則術(shù)語“獲得”用以指示其普通意義中的任一者,例如,計算、導(dǎo)出、接收(例如,從外部裝置)和/或檢索(例如,從存儲元件陣列)。除非明確地受到其上下文限制,否則術(shù)語“選擇”用以指示其普通意義中的任一者,例如,識別、指示、應(yīng)用和/或使用兩者或兩者以上的集合中的至少一者和少于全部者。在術(shù)語“包含”用于本發(fā)明描述和權(quán)利要求書中時,其并不排除其它元件或操作。術(shù)語“基于”(如在“A是基于B”中)用以指示其普通意義中的任一者,包括以下情況:(i) “從……導(dǎo)出”(例如,“B為A的前驅(qū)體”),(ii) “基于至少”(例如,“A是基于至少B”),及如果在特定上下文中適當,
(iii)“等于”(例如,“A等于B”)。類似地,術(shù)語“響應(yīng)于”用以指示其普通意義中的任一者,包括“響應(yīng)于至少”。除非另有指示,否則術(shù)語“A、B和C中的至少一者”和“A、B和C中的一或多者”指示“A和/或B和/或C”。 [0049]除非另有指示,否則術(shù)語“系列”用以指示一連串的兩個或兩個以上項。術(shù)語“對數(shù)”用以指示基數(shù)為十的對數(shù),但將此運算擴展到其它基數(shù)在本發(fā)明的范圍內(nèi)。術(shù)語“頻率分量”用以指示信號的一組頻率或頻帶中的一者,例如,信號的頻域表示的樣本(例如,如由快速傅立葉變換或MDCT產(chǎn)生)或信號的子頻帶(例如,巴克尺度(Bark scale)或梅爾尺度(meI scale)子頻帶)。
[0050]除非另有指示,否則對具有特定特征的設(shè)備的操作的任何揭示還明確地意欲揭示具有相似特征的方法(且反之亦然),且對根據(jù)特定配置的設(shè)備的操作的任何揭示還明確地意欲揭示根據(jù)相似配置的方法(且反之亦然)??申P(guān)于如由其特定上下文指示的方法、設(shè)備和/或系統(tǒng)來使用術(shù)語“配置”。按一般意義且可互換地使用術(shù)語“方法”、“過程”、“程序”和“技術(shù)”,除非特定上下文另有指示。具有多個子任務(wù)的“任務(wù)”還為方法。還按一般意義且可互換地使用術(shù)語“設(shè)備”和“裝置”,除非特定上下文另有指示。術(shù)語“元件”和“模塊”通常用以指示較大配置的一部分。除非受其上下文明確地限制,否則術(shù)語“系統(tǒng)”在本文中用以指示其普通意義中的任一者,包括“相互作用以服務(wù)于共同目的的元件群組”。術(shù)語“多個”意謂“兩個或兩個以上”。通過引用文獻的一部分的任何并入還應(yīng)理解為并入在所述部分內(nèi)引用的項或變量的定義,其中這些定義在文獻中的別處出現(xiàn),以及在所并入的部分中引用的任何圖。
[0051]除非另有指示,否則術(shù)語“編解碼器”、“聲碼器”、“音頻譯碼器”和“話音譯碼器”指音頻編碼器與對應(yīng)的音頻解碼器的組合。除非另有指示,否則術(shù)語“譯碼”指示經(jīng)由編解碼器轉(zhuǎn)變音頻信號,包括編碼和隨后的解碼。除非另有指示,否則術(shù)語“發(fā)射”指示傳播(例如,信號)到發(fā)射信道內(nèi)。
[0052]如本文中描述的譯碼方案可適用于譯碼任何音頻信號(例如,包括非話音音頻)?;蛘?,可能需要將此譯碼方案僅用于話音。在此情況下,譯碼方案可與分類方案一起使用以確定音頻信號的每一幀的內(nèi)容的類型且選擇合適的譯碼方案。
[0053]如本文中使用的譯碼方案可用作主要編解碼器,或用作多層或多級編解碼器中的一層或一級。在一個此實例中,此譯碼方案用以譯碼音頻信號的頻率內(nèi)容的一部分(例如,低頻帶或高頻帶),且另一譯碼方案用以譯碼信號的頻率內(nèi)容的另一部分。在另一此實例中,此譯碼方案用以譯碼為另一譯碼層的殘差(即,原始信號與經(jīng)編碼信號之間的誤差)(例如,線性預(yù)測譯碼(LPC)分析運算的殘差)的音頻信號。
[0054]如本文中描述的方法、系統(tǒng)和設(shè)備可經(jīng)配置以將音頻信號作為一系列區(qū)段處理。典型的區(qū)段長度范圍從約五毫秒或十毫秒到約四十毫秒或五十毫秒,且區(qū)段可重疊(例如,其中鄰近區(qū)段重疊25%或50%)或不重疊。在一特定實例中,將音頻信號分割成一系列不重疊區(qū)段或“幀”,每一者具有十毫秒的長度。在另一特定實例中,每一幀具有二十毫秒的長度。音頻信號的取樣速率的實例包括(但不限于)8千赫、12千赫、16千赫、32千赫、
44.1千赫、48千赫和192千赫。
[0055]音頻電信應(yīng)用可實施于包交換式網(wǎng)絡(luò)中。舉例來說,音頻電信應(yīng)用可實施于因特網(wǎng)協(xié)議語音(VoIP)網(wǎng)絡(luò)中。包可包括經(jīng)編碼的音頻信號的一或多個幀,且具有音頻(例如,語音)信息的包可在網(wǎng)絡(luò)上從第一裝置發(fā)射到第二裝置。然而,在包的發(fā)射期間,所述包中的一些可能丟失。舉例來說,多個包的丟失(有時被稱作突發(fā)包丟失)可能為在接收裝置處感知的話音質(zhì)量的降級的原因。
[0056]為了緩解由VoIP網(wǎng)絡(luò)中的包丟失造成的感知的話音質(zhì)量的降級,存在兩個類型的解決方案。第一解決方案為基于接收器的包丟失隱藏(PLC)方法??墒褂肞LC方法遮蔽VoIP通信中的包丟失的效應(yīng)。舉例來說,PLC方法可經(jīng)實施以建立取代包,代替在發(fā)射期間丟失的包。此PLC方法可試圖建立與丟失的包盡可能類似的包?;诮邮掌鞯腜LC方法可能不需要來自發(fā)送者的任何額外資源或幫助以便建立取代包。然而,當丟失了重要的話音幀時,PLC方法在遮蔽包丟失的效應(yīng)方面可能無效。
[0057]第二解決方案為基于發(fā)送者的包丟失復(fù)原方法。此方法包括前向錯誤校正(FEC)方法,其可包括與每一包一起發(fā)送一些額外數(shù)據(jù)??墒褂妙~外數(shù)據(jù)恢復(fù)由在發(fā)射期間的數(shù)據(jù)丟失造成的錯誤。舉例來說,F(xiàn)EC方案可發(fā)射冗余音頻幀。換句話說,由發(fā)送者發(fā)射音頻幀的一個以上副本(典型地,兩個)。這些兩個幀可被稱作主要副本和冗余副本。[0058]雖然基于發(fā)送者的包丟失復(fù)原方案可改進經(jīng)解碼的話音的感知質(zhì)量,但這些方案還可增加在話音的發(fā)射期間使用的帶寬。傳統(tǒng)的FEC方案還可增加端對端延遲,此對于實時對話而言可能不能容忍。舉例來說,常規(guī)基于發(fā)送者的方案在兩個不同時段發(fā)送同一話音幀兩次。此方法可至少使數(shù)據(jù)速率加倍。一些常規(guī)方案可將低位速率編解碼器用于冗余副本,以便減小數(shù)據(jù)速率。然而,低位速率編解碼器的使用可增加編碼器處的復(fù)雜性。此外,一些常規(guī)方案可將同一低位速率編解碼器用于幀的主要副本和幀的冗余副本兩者。雖然此方法可減少編碼器處的復(fù)雜性以及減小數(shù)據(jù)速率,但基線話音質(zhì)量(即,當無幀丟失時的話音質(zhì)量)可能大大地降低。另外,常規(guī)基于發(fā)送者的方案通常在假定有至少一個幀時間間隔的額外延遲的情況下操作。
[0059]如本文中描述的系統(tǒng)、方法和設(shè)備可經(jīng)實施以提供源控制和信道控制的FEC方案,以便獲得話音質(zhì)量、延遲與數(shù)據(jù)速率之間的最佳取舍。FEC方案可經(jīng)配置以使得不引入額外延遲??稍谶m度數(shù)據(jù)速率增加的情況下實現(xiàn)話音質(zhì)量的高質(zhì)量改進。如本文中描述的FEC方案還可在任一目標數(shù)據(jù)速率下操作。在一個實例中,可基于發(fā)射信道的條件以及外部控制自適應(yīng)地調(diào)整FEC方案和目標數(shù)據(jù)速率。所提議的FEC方案還可經(jīng)實施以與舊式通信裝置(例如,舊式手持機)相容。
[0060]對于用于音頻(例如,語音)通信的一些編解碼器,用以編碼每一幀的位的總數(shù)為預(yù)定常數(shù)。這些編解碼器的實例包括自適應(yīng)多速率(AMR)話音編解碼器(例如,如在可從歐洲電信標準學會(ETSI)www-dot-ets1-dot-org(法國 Sophia Antipolis)獲得的 3GPP技術(shù)規(guī)范(TS) 26.071版本11.0.0(2012年9月)中所描述)和AMR寬頻帶話音編解碼器(例如,如在ITU-T推薦G.722.2 (2003年7月,國際電信聯(lián)合會www-dot-1tu-dot-1nt)和/或可從ETSI獲得的3GPP技術(shù)規(guī)范26.190vll.0.0 (2012年9月)中所描述),其中位的數(shù)目由被選擇用于幀的譯碼模式確定。在這些情況下,發(fā)射過去幀的冗余副本可能要求可用于在當前幀中譯碼信號信息的位數(shù)目的對應(yīng)減少。此減少可對經(jīng)解碼話音的感知質(zhì)量具有負面影響。
[0061]可能需要實施僅針對關(guān)鍵幀發(fā)射冗余副本的靈活方法?!瓣P(guān)鍵幀”為預(yù)期其丟失會對經(jīng)解碼信號的感知質(zhì)量具有顯著影響的幀。此外,僅在預(yù)期背負冗余副本對目前幀的影響最小的情況下,才可能需要發(fā)射此冗余副本。對于固定位速率系統(tǒng),可能需要確定待用于譯碼當前幀的位的數(shù)目,使得用于譯碼當前幀的位的數(shù)目與用于譯碼過去幀的冗余副本(例如,部分副本)的位的數(shù)目的總數(shù)符合目標固定位速率T。
[0062]圖1為說明經(jīng)由發(fā)射信道TClO和RClO在網(wǎng)絡(luò)NWlO上通信的發(fā)射終端102和接收終端104的一實例的方框圖。終端102和104中的每一者可經(jīng)實施以執(zhí)行如本文中描述的方法和/或包括如本文中描述的設(shè)備。發(fā)射終端102和接收終端104可為能夠支持語音通信的任何裝置,包括電話(例如,智能手持機)、計算機、音頻廣播和接收設(shè)備、視頻會議設(shè)備或類似者???例如)通過例如碼分多址(CDMA)能力的無線多址技術(shù)實施發(fā)射終端102和接收終端104。CDMA為基于展頻通信的調(diào)制和多址方案。
[0063]發(fā)射終端102包括音頻編碼器AE10,且接收終端104包括音頻解碼器AD10。音頻編碼器AElO可用以通過根據(jù)人類話音產(chǎn)生的模型提取參數(shù)的值而壓縮來自第一用戶接口UllO (例如,麥克風和音頻前端)的音頻信息(例如,話音)。信道編碼器CElO將參數(shù)值裝配到包內(nèi),且發(fā)射器TXlO經(jīng)由發(fā)射信道TClO在網(wǎng)絡(luò)NWlO (其可包括基于包的網(wǎng)絡(luò),例如,因特網(wǎng)或內(nèi)聯(lián)網(wǎng))上發(fā)射包括這些參數(shù)值的包。發(fā)射信道TClO可為有線和/或無線發(fā)射信道,且視確定信道質(zhì)量的方式和地方而定,發(fā)射信道TClO可被視為延伸到網(wǎng)絡(luò)NWlO的入口點(例如,基站控制器)、到網(wǎng)絡(luò)NWio內(nèi)的另一實體(例如,信道質(zhì)量分析器)和/或到接收終端104的接收器RXlO。
[0064]接收終端104的接收器RXlO用以經(jīng)由發(fā)射信道從網(wǎng)絡(luò)NWlO接收包。信道解碼器CDlO解碼包以獲得參數(shù)值,且音頻解碼器ADlO使用來自包的參數(shù)值合成音頻信息。將合成的音頻(例如,話音)提供到在接收終端104上的第二用戶接口 U120(例如,音頻輸出級和揚聲器)。雖未展示,但各種信號處理功能可在信道編碼器CElO和信道解碼器CDlO中執(zhí)行(例如,卷積譯碼,包括循環(huán)冗余檢查(CRC)功能、交錯)和在發(fā)射器TXlO和接收器RXlO中執(zhí)行(例如,數(shù)字調(diào)制和對應(yīng)的解調(diào)、展頻處理、模擬/數(shù)字和數(shù)字/模擬轉(zhuǎn)換)。
[0065]通信的每一方可發(fā)射以及接收,且每一終端可包括音頻編碼器AElO和解碼器ADlO的實例。音頻編碼器與解碼器可為分開的裝置或集成到被稱作“語音譯碼器”或“聲碼器”的單一裝置內(nèi)。如圖1中所示,描述終端102、104在網(wǎng)絡(luò)NWlO的終端處具有音頻編碼器AElO且在另一終端處具有音頻解碼器AD10。
[0066]在發(fā)射終端102的至少一個配置中,可在幀中將音頻信號(例如,話音)從第一用戶接口 UllO輸入到音頻編碼器AE10,其中每一幀被進一步分割成子幀。在執(zhí)行某一塊處理的情況下,可使用這些任意幀邊界。然而,如果實施連續(xù)處理而非塊處理,則可省略音頻樣本到幀(和子幀)的此分割。在描述的實例中,視特定應(yīng)用和總體設(shè)計約束而定,在網(wǎng)絡(luò)NWlO上發(fā)射的每一包可包括一或多個幀。
[0067]音頻編碼器AElO可為可變速率或單一固定速率編碼器。視音頻內(nèi)容而定(例如,視是否存在話音和/或存在何類型的話音而定),可變速率編碼器可在不同幀間在多個編碼器模式(例如,不同固定速率)間動態(tài)切換。音頻解碼器ADlO還可按對應(yīng)的方式在不同幀間在對應(yīng)的解碼器模式之間動態(tài)切換??舍槍γ恳粠x擇一特定模式,以在接收終端104處維持可接受的信號再現(xiàn)質(zhì)量的同時實現(xiàn)可利用的最低位速率。
[0068]接收終端104還可將信道狀態(tài)信息120反饋到發(fā)射終端102。在一個此實例中,接收終端104經(jīng)配置以收集與載運來自發(fā)射終端102的包的發(fā)射信道的質(zhì)量有關(guān)的信息。接收終端104可使用收集的信息估計信道的質(zhì)量。接著可將收集的信息和/或信道質(zhì)量估計反饋到發(fā)射終端102作為信道狀態(tài)信息120。舉例來說,如在圖1中所示,信道編碼器CElO的一實例CEll可將收集的信息和/或質(zhì)量估計(例如,來自音頻解碼器AD10)裝配到包內(nèi),以用于經(jīng)由發(fā)射器TXlO的實例TXll和發(fā)射信道RClO發(fā)射回到發(fā)射終端102,在發(fā)射終端102處,包由接收器RXlO的實例RXll接收且由信道解碼器⑶10的實例⑶11解裝配,且將信息和/或估計提供到音頻編碼器AE10。發(fā)射終端102(例如,音頻編碼器AE10)可使用信道狀態(tài)信息120來調(diào)適與如本文中描述的基于發(fā)送者的包丟失復(fù)原方案相關(guān)聯(lián)的一或多個功能(例如,關(guān)鍵性閾值)。
[0069]圖2A展示包括基站收發(fā)器BTS1-BTS3的網(wǎng)絡(luò)NWlO的實施方案NW20的一實例,基站收發(fā)器BTS1-BTS3與移動臺在無線電上行鏈路和下行鏈路發(fā)射信道上通信。網(wǎng)絡(luò)NW20還包括核心網(wǎng)絡(luò)CNWl (其連接到公眾交換電話網(wǎng)絡(luò)PSTN和因特網(wǎng)INT)和核心網(wǎng)絡(luò)CNW2 (其還連接到因特網(wǎng)INT)。網(wǎng)絡(luò)NW20還包括使收發(fā)器站與核心網(wǎng)絡(luò)接口連接的基站控制器BSC1-BSC3。網(wǎng)絡(luò)NW20可經(jīng)實施以提供終端裝置之間的包交換式通信。核心網(wǎng)絡(luò)CNWl還可經(jīng)由基站收發(fā)器BTS1、BTS2提供終端裝置MSl與MS2之間的電路交換式通信,和/或提供此終端裝置與在PSTN上的終端裝置之間的電路交換式通信。
[0070]圖2A還展示可經(jīng)由網(wǎng)絡(luò)NW20相互通信(例如,在包交換式通信鏈路上)的不同終端裝置的實例:移動臺MS1-MS3 ;因特網(wǎng)協(xié)議語音(VoIP)電話VP ;及計算機CP,其經(jīng)配置以執(zhí)行電信程序(例如,來自Microsoft Skype Divis1n, LU的Skype軟件)。終端裝置MS1-MS3、VP和CP中的任一者可經(jīng)實施以包括發(fā)射終端102的一實例和接收終端104的一實例。移動裝置MS1-MS3經(jīng)由無線無線電上行鏈路和下行鏈路發(fā)射信道與網(wǎng)絡(luò)通信。終端VP和CP經(jīng)由有線發(fā)射信道(例如,以太網(wǎng)纜線)和/或無線發(fā)射信道(例如,IEEE802.11或“WiFi”鏈路)與網(wǎng)絡(luò)通信。網(wǎng)絡(luò)NW20還可包括中間實體,例如,網(wǎng)關(guān)和/或TRAU(代碼轉(zhuǎn)換器和速率適配器單元)。
[0071]音頻編碼器AElO通常按時間或“幀”將輸入信號作為一系列不重疊區(qū)段進行處理,其中針對每一幀計算新的編碼幀。幀周期通常為可預(yù)期信號局部穩(wěn)定的周期;普通實例包括二十毫秒(等效于按16kHz的取樣速率320個樣本、按12.8kHz的取樣速率256個樣本或按SkHz的取樣速率160個樣本)和十毫秒。還可能實施音頻編碼器AElO而將輸入信號作為一系列重疊巾貞進行處理。
[0072]圖2B展示包括幀編碼器FElO的音頻編碼器AElO的一實施方案AE20的方框圖。幀編碼器FElO經(jīng)配置以編碼輸入信號的一連串幀CF( “核心音頻幀”)中的每一者以產(chǎn)生一連串經(jīng)編碼音頻幀EF中的對應(yīng)者。音頻編碼器AElO還可經(jīng)實施以執(zhí)行額外任務(wù),例如,將輸入信號分成幀且選擇用于幀編碼器FElO的譯碼模式(例如,選擇初始位分配的重新分配,如本文中參考任務(wù)T400描述)。選擇譯碼模式(例如,速率控制)可包括執(zhí)行語音活動檢測(VAD)和/或另外分類幀的音頻內(nèi)容。在此實例中,音頻編碼器AE20還包括語音活動檢測器VAD10,其經(jīng)配置以處理核心音頻幀CF以產(chǎn)生語音活動檢測信號VS (例如,如在可在ETSI 獲得的 3GPPTS26.194ν11.0.0 (2012 年 9 月)中所描述)。
[0073]通常根據(jù)源濾波器模型來實施幀編碼器FE10,所述源濾波器模型將輸入音頻信號的每一幀編碼為:(A)描述濾波器的一組參數(shù),和(B)將在解碼器處用以驅(qū)動所描述的濾波器以產(chǎn)生音頻幀的經(jīng)合成再現(xiàn)的激勵信號。話音信號的頻譜包絡(luò)通常由表示聲道(例如,咽喉和嘴)的共振且稱為共振峰的峰值表征。多數(shù)話音譯碼器至少將此粗略頻譜結(jié)構(gòu)編碼為例如濾波器系數(shù)的一組參數(shù)。剩余殘差信號可模型化為驅(qū)動濾波器以產(chǎn)生話音信號且通常由其強度和音調(diào)表征的源(例如,如由聲帶產(chǎn)生)。
[0074]幀編碼器FElO通常經(jīng)實施以執(zhí)行基于碼簿的方案(例如,碼簿激勵線性預(yù)測或CELP)和/或原型波形內(nèi)插(PWI)方案(例如,原型音調(diào)周期或PPP),但幀編碼器FElO還可經(jīng)實施以執(zhí)行其它方案(例如,正弦話音譯碼和/或基于變換的譯碼)??捎蓭幋a器FElO用以產(chǎn)生經(jīng)編碼幀EF的編碼方案的特定實例包括(但不限于)G.726、G.728、G.729Α、AMR、AMR-ffB, AMR-WB+(例如,如在 2012 年 9 月的 3GPP TS26.290vll.0.0 (可從ETSI獲得)中所描述)、VMR-WB (例如,如在2005年4月的第三代合作伙伴計劃2 (3GPP2)文獻C.S0052-A vl.0 (可在線上于www-dot-3gpp2-dot-org處獲得)中所描述)、增強型可變速率編解碼器(EVRC,如在2011年12月的3GPP2文獻C.S0014-E vl.0 (可在線上于www-dot-3gpp2-dot-org處獲得)中所描述)、可選擇模式聲碼器話音編解碼器(如在 2004 年 I 月的 3GPP2 文獻 C.S0030-0,ν3.0 (可在線上于 www-dot-3gpp2-dot_org 處獲得)中所描述)和增強型語音服務(wù)編解碼器(EVS,例如,如在可從ETSI獲得的3GPPTR22.813vl0.0.0 (2010 年 3 月)中所描述)。
[0075]圖3展示幀編碼器FElO的基本實施方案FE20的方框圖,其包括預(yù)處理模塊PP10、線性預(yù)測譯碼(LPC)分析模塊LA10、開放環(huán)路音調(diào)搜索模塊0L10、自適應(yīng)碼簿(ACB)搜索模塊AS10、固定碼簿(FCB)搜索模塊FSlO和增益向量量化(VQ)模塊GV10。可實施預(yù)處理模塊PP10,例如,如在3GPPTS26.190vll.0.0的第5.1章中所描述。在一個此實例中,預(yù)處理模塊PPlO經(jīng)實施以執(zhí)行核心音頻幀的減少取樣(例如,從16kHz到12.8kHz)、減少取樣的幀的高通濾波(例如,通過50Hz的截止頻率)和經(jīng)濾波的幀的預(yù)強調(diào)(例如,使用一階高通濾波器)。
[0076]線性預(yù)測譯碼(LPC)分析模塊LAlO將每一核心音頻幀的頻譜包絡(luò)編碼為一組線性預(yù)測(LP)系數(shù)(例如,全極濾波器的系數(shù)1/A(Z))。在一個實例中,LPC分析模塊LAlO經(jīng)配置以計算十六個LP濾波器系數(shù)的一集合以表征每一 20毫秒幀的共振峰結(jié)構(gòu)??蓪嵤┓治瞿KLA10,例如,如在3GPP TS26.190vll.0.0的第5.2章中所描述。
[0077]分析模塊LAlO可經(jīng)配置以直接分析每一幀的樣本,或可首先根據(jù)開窗函數(shù)(例如,漢明(Hamming)窗)將所述樣本加權(quán)。還可在大于巾貞的窗(例如,30msec窗)上執(zhí)行分析。此窗可對稱(例如,5-20-5,使得其包括緊接在20毫秒幀前和后的5毫秒)或不對稱(例如,10-20,使得其包括先前幀的最后10毫秒)。LPC分析模塊通常經(jīng)配置以使用Levinson-Durbin遞歸或Leroux-Gueguen算法來計算LP濾波器系數(shù)。雖然LPC編碼非常適合于話音,但其還可用以編碼一般的音頻信號(例如,包括非話音,例如,音樂)。在另一實施方案中,分析模塊可經(jīng)配置以計算每一幀的一組倒頻譜系數(shù),而非一組LP濾波器系數(shù)。
[0078]線性預(yù)測濾波器系數(shù)通常難以有效率地量化,且通常映射成用于量化和/或熵編碼的另一表示,例如,線頻譜對(LSP)或線譜頻率(LSF),或?qū)Э诡l譜對(ISP)或?qū)Э棺V頻率(ISF)。在一個實例中,分析模塊LAlO將所述組LP濾波器系數(shù)變換成一組對應(yīng)的ISF。LP濾波器系數(shù)的其它一對一表示包括部分自相關(guān)系數(shù)和對數(shù)面積比值。通常,一組LP濾波器系數(shù)與一組對應(yīng)的LSF、LSP、ISF或ISP之間的變換為可逆的,但實施例還包括變換在無錯誤時不可逆的分析模塊LAlO的實施方案。
[0079]分析模塊LAlO經(jīng)配置以量化所述組ISF (或LSF或其它系數(shù)表示),且?guī)幋a器FE20經(jīng)配置以將此量化的結(jié)果作為LPC索引XL輸出。此量化器通常包括向量量化器,其將輸入向量編碼為到表或碼簿中的對應(yīng)的向量條目的索引。
[0080]幀編碼器FE20還包括任選的開放環(huán)路音調(diào)搜索模塊0L10,其可用以簡化音調(diào)分析并減小自適應(yīng)碼簿搜索模塊ASlO中的閉合環(huán)路音調(diào)搜索的范圍。模塊OLlO可經(jīng)實施以經(jīng)由基于未量化的LP濾波器系數(shù)的加權(quán)濾波器濾波輸入信號、二中選一地抽取經(jīng)加權(quán)的信號且每幀產(chǎn)生音調(diào)估計一次或兩次(視當前速率而定)。可實施模塊0L10,例如,如在3GPP TS26.190vll.0.0 的第 5.4 章中所描述。
[0081]自適應(yīng)碼簿(ACB)搜索模塊ASlO經(jīng)配置以搜索自適應(yīng)碼簿(基于過去激勵且還稱作“音調(diào)碼簿”)以產(chǎn)生音調(diào)濾波器的延遲和增益。模塊ASlO可經(jīng)實施以對目標信號(如(例如)通過經(jīng)由基于經(jīng)量化和未量化的LP濾波器系數(shù)的加權(quán)的合成濾波器濾波LP殘差來獲得)基于子幀而圍繞開放環(huán)路音調(diào)估計執(zhí)行閉合環(huán)路音調(diào)搜索,且接著通過在指示的分數(shù)音調(diào)滯后處內(nèi)插過去激勵來計算自適應(yīng)碼向量且計算ACB增益。模塊ASlO還可經(jīng)實施以使用LP殘差來擴展過去激勵緩沖器以簡化閉合環(huán)路音調(diào)搜索(尤其對于少于64個樣本的子幀大小的延遲)。模塊ASlO可經(jīng)實施以產(chǎn)生ACB增益(例如,對于每一子幀)和經(jīng)量化的索引,所述經(jīng)量化的索引指示第一子幀的音調(diào)延遲(或第一和第三子幀的音調(diào)延遲,視當前速率而定)和其它子幀的相對音調(diào)延遲??蓪嵤┠KAS10,例如,如在3GPPTS26.190vll.0.0的第5.7章中所描述。
[0082]固定碼簿(FCB)搜索模塊FSlO經(jīng)配置以產(chǎn)生指示固定碼簿(還稱作“創(chuàng)新碼簿”、“創(chuàng)新性碼簿”、“隨機碼簿”或“代數(shù)碼簿”)的向量的索引,所述向量表示激勵的未由自適應(yīng)碼向量模型化的部分。模塊FSlO可經(jīng)實施以產(chǎn)生碼簿索引以作為含有再現(xiàn)FCB向量所需要的所有信息的碼字(例如,表示脈沖位置和正負號),使得不需要碼簿??蓪嵤┠KFS10,例如,如在3GPP TS26.190vll.0.0的第5.8章中所描述。
[0083]增益向量量化模塊GVlO經(jīng)配置以量化FCB和ACB增益,其可包括每一子幀的增益??蓪嵤┠KGV10,例如,如在3GPPTS26.190vll.0.0的第5.9章中所描述。
[0084]作為對基于碼簿的方法的替代,可使用基于變換的方法來編碼LPC殘差信號。舉例來說,可使用修改的離散余弦變換(MDCT)來將殘差編碼成包括一組MDCT系數(shù)的參數(shù),如在Call1pe超寬頻編解碼器(加利福尼亞州圣地亞哥市高通公司(QUALCOMM Inc.,SanDiego,CA))和AMR-WB+編解碼器的TCX選項中。在另一實例中,使用基于變換的方法來編碼音頻信號,而不執(zhí)行LPC分析。
[0085]可能需要在一或多個包交換式網(wǎng)絡(luò)上執(zhí)行終端A(例如,發(fā)射用戶設(shè)備或UE,例如,終端102)與終端B (例如,接收UE,例如,終端104)之間的實時語音通信。例如AMR和AMR-WB的先前解決方案通過減小位速率而適宜于不良信道條件(還稱作“速率調(diào)適”)。對于用于在VoIP(因特網(wǎng)協(xié)議語音)中使用的下一代編解碼器,位速率的減小可能不會幫助顯著減少網(wǎng)絡(luò)中的堵 塞(例如,歸因于RTP額外開銷,其中RTP為實時輸送協(xié)議,如在(例如)1^^3550,標準64(2003年7月),因特網(wǎng)工程任務(wù)組(IETF)中所描述)。如本文中揭示的方法可對聲碼器賦予較大穩(wěn)健性和/或解決歸因于信道缺陷的編解碼器性能問題。
[0086]從發(fā)射終端A到接收終端B的發(fā)射信道的質(zhì)量可由網(wǎng)絡(luò)中的一或多個實體(例如,由在上行鏈路無線電信道的網(wǎng)絡(luò)端處的基站收發(fā)器、由核心網(wǎng)絡(luò)中的業(yè)務(wù)分析器等)估計和/或由接收終端B估計(例如,通過分析包丟失率)。可能需要使接收終端B和/或一或多個這些實體使用帶內(nèi)消息接發(fā)經(jīng)由控制信號(例如,使用RTP控制協(xié)議(RTCP)的控制包,如在(例如)RFC1889(1996年I月,IETF)中所描述)和/或經(jīng)由另一服務(wù)質(zhì)量(QoS)反饋機制將此信道狀態(tài)信息120傳遞回到發(fā)射UE。可實施發(fā)射終端A以通過切換到對于在有缺陷信道下實現(xiàn)良好性能最佳化的操作模式(即,“信道感知”模式)來應(yīng)用此信息。而且,發(fā)射UE可經(jīng)配置以在可預(yù)期不良信道條件(例如,難管理的網(wǎng)絡(luò))的情況下在呼叫設(shè)置時間選擇信道感知操作模式。
[0087]可實施聲碼器以響應(yīng)于不良信道條件的指示(例如,包錯誤、高抖動等)而切換到“信道缺陷穩(wěn)健模式”。在“信道缺陷穩(wěn)健模式”下,話音編解碼器可選擇部分或全部地重傳輸入信號的某些關(guān)鍵幀。舉例來說,在“信道缺陷穩(wěn)健模式”下操作的話音譯碼器可經(jīng)配置以在幀的關(guān)鍵性超過某一預(yù)定閾值的情況下發(fā)射幀的冗余副本??梢罁?jù)特定幀的丟失對經(jīng)解碼的話音的感知影響(如在編碼器處估計)來確定彼幀的關(guān)鍵性。信道感知編解碼器可經(jīng)配置以響應(yīng)于信道狀態(tài)的指示而在信道缺陷穩(wěn)健模式與正常操作模式(即,其中不發(fā)送冗余副本)之間切換。
[0088]如本文中揭示的系統(tǒng)、方法和設(shè)備可經(jīng)實施以依據(jù)信道質(zhì)量估計而設(shè)定用于重傳決策的閾值。此閾值可用以(例如)確定一幀對于音頻信號的后續(xù)幀的譯碼而言是否關(guān)鍵。對于非常好的信道,可將閾值設(shè)定得非常高。隨著信道質(zhì)量降級,可降低閾值,使得將更多的中貞視為關(guān)鍵的。
[0089]圖4A展示根據(jù)一般配置的處理音頻信號的方法MlOO的流程圖,其包括任務(wù)T100、T200、T300和Τ350。任務(wù)TlOO計算音頻信號的第二幀(“相依”幀)對在音頻信號中在第二幀之前的第一幀(“模型”幀,可能為“關(guān)鍵”幀)的譯碼相依性的估計。任務(wù)Τ200基于與發(fā)射信道的狀態(tài)有關(guān)的信息計算閾值。任務(wù)Τ300將計算出的估計與計算出的閾值進行比較。基于任務(wù)Τ300中的比較的結(jié)果,任務(wù)Τ350決定發(fā)射第一巾貞的冗余副本。決定發(fā)射冗余副本可包括指示第一幀為關(guān)鍵幀。在一些情況下,方法MlOO可經(jīng)實施以使得不需要額外編碼延遲來確定是否要重傳一幀。
[0090]可能需要減少相依幀也將為關(guān)鍵幀(即,對在其后的另一幀而言關(guān)鍵)的可能性。通常,此可能性對于緊接在模型幀后的幀最高,且接著針對后續(xù)幀迅速降低。對于有聲話音,典型地,話音突峰中的開始幀為關(guān)鍵的,且緊接在其后的幀也為關(guān)鍵的(例如,為了涵蓋開始幀丟失時的情況)。然而,話音突峰中的另一幀也可能為關(guān)鍵的(例如,對于音調(diào)滯后發(fā)生漂移的情況)。
[0091]幀偏移k可用以指示模型幀與相依幀之間的距離。在一個此實例中,幀偏移k的值為模型幀η與相依幀(n+k)之間的幀號的差(例如,比介入幀的數(shù)目多I)。圖5C展示典型實例,其中k的值為三。在另一實例中,k的值為四。其它可能值包括一、二、三、五和大于五的整數(shù)。
[0092]方法MlOO可經(jīng)實施以使得偏移k固定(例如,在系統(tǒng)實施期間或在呼叫設(shè)置期間)??筛鶕?jù)原始時域信號中的幀的長度(例如,單位:毫秒)和最大容許延遲來選擇k的值。舉例來說,k的值可受到最大容許值約束(例如,以限制幀延遲)。可能需要最大容許延遲具有八十或一百毫秒的值。在此情況下,對于使用二十毫秒幀的方案,k可具有四或五的最大值,或?qū)τ谑褂檬撩霂姆桨?,可具有八、九或十的最大值?br>
[0093]還可根據(jù)信道條件(例如,如由來自接收器的反饋指示)在呼叫期間選擇和/或更新偏移k的值。舉例來說,在正引起連續(xù)幀的頻繁丟失(例如,歸因于長的衰落)的環(huán)境下,可能需要使用較高k值。
[0094]任務(wù)TlOO可經(jīng)實施以基于范圍從模型和/或相依幀的一般表征到特定丟失影響評價的一或多個準則來計算相依幀對模型幀的譯碼相依性的估計(還稱作“關(guān)鍵性測量”)。此估計可基于模型和/或相依幀內(nèi)的信息,且還可基于來自輸入信號中的鄰近模型中貞的一或多個巾貞的信息。
[0095]關(guān)鍵幀可為當丟失時可造成顯著的質(zhì)量降級的幀。不同模型幀可具有不同級別的關(guān)鍵性。舉例來說,對于兩個模型幀nl和n2,如果非常容易從幀nl預(yù)測幀(nl+1)(即,幀nl旁的幀)而幀(n2+l) (B卩,幀n2旁的幀)并不非常依賴于幀n2,則幀nl可比幀n2關(guān)鍵,這是因為丟失幀nl可造成一個以上幀中的質(zhì)量降級。
[0096]任務(wù)TlOO可經(jīng)實施以基于模型幀和(可能地)相依幀和/或鄰近模型幀的一或多個幀中的每一者的譯碼類型(即,待用以編碼幀的譯碼過程)的指示來計算譯碼相依性的估計。此譯碼類型的實例可包括碼激勵線性預(yù)測(CELP)、噪聲激勵線性預(yù)測(NELP)、原型波形內(nèi)插(PWI)或原型音調(diào)周期(PPP)等。舉例來說,依據(jù)此準則,可將CELP模型幀視為比NELP模型幀關(guān)鍵。
[0097]額外或替代性地,任務(wù)TlOO可經(jīng)實施以基于模型幀和(可能地)相依幀和/或鄰近模型幀的一或多個幀中的每一者的話音模式(即,幀的話音內(nèi)容的分類)來計算譯碼相依性的估計。話音模式的實例可包括有聲、無聲、靜默和瞬態(tài)?!坝新暋钡姆诸惪蛇M一步分成開始和穩(wěn)定。瞬態(tài)的分類可進一步分成在瞬態(tài)中和不在瞬態(tài)中。舉例來說,依據(jù)此準則,語音開始幀(話音突峰中的初始幀)可比穩(wěn)定有聲幀關(guān)鍵,這是因為話音突峰中的后續(xù)幀的編碼可大量依賴于開始幀中的信息。在一個實例中,任務(wù)TlOO經(jīng)實施以響應(yīng)于模型幀為話音開始幀且相依幀為穩(wěn)定有聲幀的指示來計算譯碼相依性的估計以指示高的相依性程度。
[0098]額外或替代性地,任務(wù)TlOO可經(jīng)配置以基于模型幀(和可能地相依幀和/或鄰近模型幀的一或多個幀中的每一者)的一或多個其它性質(zhì)來計算譯碼相依性的估計。舉例來說,如果模型幀的一些重要參數(shù)的值與先前幀的對應(yīng)值顯著不同(例如,大于某一預(yù)定閾值),則模型幀可為關(guān)鍵幀,這是由于可能不易于從在模型幀前面的幀預(yù)測所述模型幀,且模型幀的丟失可不利地影響更類似于模型幀而非先前幀的后續(xù)幀。
[0099]此類性質(zhì)的一個實例為自適應(yīng)碼簿(ACB)增益。模型幀的低ACB增益值可指示所述幀與在其前面的幀顯著不同,而相依幀的高ACB增益值可指示所述幀非常依賴于模型幀。圖4B展示包括任務(wù)T50和T60的方法MlOO的一實施方案MllO的流程圖。任務(wù)T50使用來自模型幀的信息(例如,激勵信號)產(chǎn)生用于相依幀的自適應(yīng)碼向量,且任務(wù)T60計算相依幀的經(jīng)編碼版本的ACB增益值。在此實例中,任務(wù)TlOO經(jīng)實施以至少基于計算出的ACB增益值來計算譯碼相依性的估計。
[0100]此類性質(zhì)的另一實例為感知加權(quán)SNR(信噪比),在此情況下其可表達為
【權(quán)利要求】
1.一種音頻信號處理的方法,所述方法包含: 計算音頻信號的第二幀對在所述音頻信號中在所述第二幀之前的第一幀的譯碼相依性的估計; 基于與發(fā)射信道的狀態(tài)有關(guān)的信息計算閾值; 將所述計算出的估計與所述計算出的閾值進行比較;及 基于所述比較的結(jié)果,決定發(fā)射所述第一幀的冗余副本。
2.根據(jù)權(quán)利要求1所述的方法,其中所述計算出的估計是基于來自所述第一幀的信肩、O
3.根據(jù)權(quán)利要求2所述的方法,其中所述方法包括使用來自所述第一幀的所述信息產(chǎn)生自適應(yīng)碼向量,且 其中所述計算出的估計是基于來自所述自適應(yīng)碼向量的信息。
4.根據(jù)權(quán)利要求1到3中任一權(quán)利要求所述的方法,其中所述計算出的估計是基于來自所述第二幀的經(jīng)編碼版本的信息。
5.根據(jù)權(quán)利要求1到3中任一權(quán)利要求所述的方法,其中所述計算出的估計是基于所述第二幀的經(jīng)編碼版本的自適應(yīng)碼簿增益值。
6.根據(jù)權(quán)利要求1所述的方法,其中所述計算出的估計是基于來自所述第二幀的第一經(jīng)編碼版本的信息且基于來自所述第二幀的第二經(jīng)編碼版本的信息, 其中所述第一經(jīng)編碼版本是使用來自所述第一幀的經(jīng)編碼版本的信息而編碼,且其中所述第二經(jīng)編碼版本是不使用來自所述第一幀的所述經(jīng)編碼版本的所述信息而編碼。
7.根據(jù)權(quán)利要求1到6中任一權(quán)利要求所述的方法,其中與所述發(fā)射信道的所述狀態(tài)有關(guān)的所述信息包括丟失的包的數(shù)目,且 其中所述計算出的閾值是基于丟失的包的所述數(shù)目。
8.根據(jù)權(quán)利要求1到7中任一權(quán)利要求所述的方法,其中與所述發(fā)射信道的所述狀態(tài)有關(guān)的所述信息包括基于接收的包的轉(zhuǎn)運次數(shù)的抖動值,且 其中所述計算出的閾值是基于所述抖動值。
9.根據(jù)權(quán)利要求1到8中任一權(quán)利要求所述的方法,其中所述方法包括經(jīng)由無線發(fā)射信道接收與所述發(fā)射信道的所述狀態(tài)有關(guān)的所述信息。
10.根據(jù)權(quán)利要求1到9中任一權(quán)利要求所述的方法,其中所述計算所述閾值包含強制所述計算出的閾值具有最小值。
11.根據(jù)權(quán)利要求1到9中任一權(quán)利要求所述的方法,其中所述計算所述閾值包含: 將基于與所述發(fā)射信道的所述狀態(tài)有關(guān)的所述信息的計算出的值與邊界值進行比較;及 響應(yīng)于與所述邊界值的所述比較的結(jié)果,選擇所述邊界值作為所述計算出的閾值。
12.根據(jù)權(quán)利要求1到11中任一權(quán)利要求所述的方法,其中所述方法包含: 編碼所述第一幀以產(chǎn)生所述第一幀的主要副本; 產(chǎn)生所述第一幀的所述冗余副本;及 產(chǎn)生包括所述主要副本和所述冗余副本的經(jīng)編碼信號。
13.根據(jù)權(quán)利要求12所述的方法,其中所述第一幀的所述主要副本包括第一碼字,所述第一碼字指示長度為L的第一代數(shù)碼向量的總數(shù)Pl個單位脈沖中的每一者的位置,且其中所述第一幀的所述冗余副本包括第二碼字,所述第二碼字指示長度為L的第二代數(shù)碼向量的總數(shù)P2個單位脈沖中的每一者的位置,且其中Pl大于P2。
14.根據(jù)權(quán)利要求12和13中任一權(quán)利要求所述的方法,其中所述產(chǎn)生所述經(jīng)編碼信號包含: 產(chǎn)生包括所述第一幀的所述主要副本的第一包;及 響應(yīng)于所述決定,產(chǎn)生包括所述第一幀的所述冗余副本和所述第二幀的副本的第二包,且 其中所述經(jīng)編碼信號包括所述第一包和所述第二包。
15.根據(jù)權(quán)利要求12到14中任一權(quán)利要求所述的方法,其中所述方法包括將所述經(jīng)編碼信號發(fā)射到所述發(fā)射信道內(nèi)。
16.根據(jù)權(quán)利要求1到15中任一權(quán)利要求所述的方法,其中所述方法包括確定偏移的值,所述值指示在所述第一幀與所述第二幀之間的所述音頻信號的幀的總數(shù)。
17.根據(jù)權(quán)利要求1到16中任一權(quán)利要求所述的方法,其中所述計算所述閾值包含: 基于與所述發(fā)射信道的所述狀態(tài)有關(guān)的所述信息,計算第一閾值和第二閾值;及 基于來自所述第一幀和在所述音頻信號中鄰近所述第一幀的幀中的至少一者的信息,從所述第一閾值和所述第二閾值中選擇所述計算出的閾值。
18.一種用于音頻信號處理的設(shè)備,所述設(shè)備包含: 用于計算音頻信號的第二幀對在所述音頻信號中在所述第二幀之前的第一幀的譯碼相依性的估計的裝置; 用于基于與發(fā)射信道的狀態(tài)有關(guān)的信息計算閾值的裝置; 用于將所述計算出的估計與所述計算出的閾值進行比較的裝置;及 用于基于所述比較的結(jié)果決定發(fā)射所述第一幀的冗余副本的裝置。
19.根據(jù)權(quán)利要求18所述的設(shè)備,其中所述計算出的估計是基于來自所述第一幀的信息。
20.根據(jù)權(quán)利要求19所述的設(shè)備,其中所述設(shè)備包括用于使用來自所述第一幀的所述信息產(chǎn)生自適應(yīng)碼向量的裝置,且 其中所述計算出的估計是基于來自所述自適應(yīng)碼向量的信息。
21.根據(jù)權(quán)利要求18到20中任一權(quán)利要求所述的設(shè)備,其中所述計算出的估計是基于來自所述第二幀的經(jīng)編碼版本的信息。
22.根據(jù)權(quán)利要求18到20中任一權(quán)利要求所述的設(shè)備,其中所述計算出的估計是基于所述第二幀的經(jīng)編碼版本的自適應(yīng)碼簿增益值。
23.根據(jù)權(quán)利要求18所述的設(shè)備,其中所述計算出的估計是基于來自所述第二幀的第一經(jīng)編碼版本的信息且基于來自所述第二幀的第二經(jīng)編碼版本的信息, 其中所述第一經(jīng)編碼版本是使用來自所述第一幀的經(jīng)編碼版本的信息而編碼,且其中所述第二經(jīng)編碼版本是不使用來自所述第一幀的所述經(jīng)編碼版本的所述信息而編碼。
24.根據(jù)權(quán)利要求18到23中任一權(quán)利要求所述的設(shè)備,其中與所述發(fā)射信道的所述狀態(tài)有關(guān)的所述信息包括丟失的包的數(shù)目,且 其中所述計算出的閾值是基于丟失的包的所述數(shù)目。
25.根據(jù)權(quán)利要求18到24中任一權(quán)利要求所述的設(shè)備,其中與所述發(fā)射信道的所述狀態(tài)有關(guān)的所述信息包括基于接收的包的轉(zhuǎn)運次數(shù)的抖動值,且 其中所述計算出的閾值是基于所述抖動值。
26.根據(jù)權(quán)利要求18到25中任一權(quán)利要求所述的設(shè)備,其中所述設(shè)備包括用于經(jīng)由無線發(fā)射信道接收與所述發(fā)射信道的所述狀態(tài)有關(guān)的所述信息的裝置。
27.根據(jù)權(quán)利要求18到26中任一權(quán)利要求所述的設(shè)備,其中所述用于計算所述閾值的裝置經(jīng)配置以強制所述計算出的閾值具有最小值。
28.根據(jù)權(quán)利要求18到26中任一權(quán)利要求所述的設(shè)備,其中所述用于計算所述閾值的裝置包含: 用于將基于與所述發(fā)射信道的所述狀態(tài)有關(guān)的所述信息的計算出的值與邊界值進行比較的裝置 '及 用于響應(yīng)于與所述邊界值的所述比較的結(jié)果選擇所述邊界值作為所述計算出的閾值的裝置。
29.根據(jù)權(quán)利要求18到28中任一權(quán)利要求所述的設(shè)備,其中所述設(shè)備包含: 用于編碼所述第一幀以產(chǎn)生所述第一幀的主要副本的裝置; 用于產(chǎn)生所述第一幀的所述冗余副本的裝置;及 用于產(chǎn)生包括所述主要副本和所述冗余副本的經(jīng)編碼信號的裝置。
30.根據(jù)權(quán)利要求29所述的設(shè)備,其中所述第一幀的所述主要副本包括第一碼字,所述第一碼字指示長度為L的第一代數(shù)碼向量的總數(shù)Pl個單位脈沖中的每一者的位置,且 其中所述第一幀的所述冗余副本包括第二碼字,所述第二碼字指示長度為L的第二代數(shù)碼向量的總數(shù)P2個單位脈沖中的每一者的位置,且 其中Pl大于P2。
31.根據(jù)權(quán)利要求29和30中任一權(quán)利要求所述的設(shè)備,其中所述用于產(chǎn)生所述經(jīng)編碼信號的裝置包含: 用于產(chǎn)生包括所述第一幀的所述主要副本的第一包的裝置;及 用于響應(yīng)于所述決定而產(chǎn)生包括所述第一幀的所述冗余副本和所述第二幀的副本的第二包的裝置,且 其中所述經(jīng)編碼信號包括所述第一包和所述第二包。
32.根據(jù)權(quán)利要求29到31中任一權(quán)利要求所述的設(shè)備,其中所述設(shè)備包括用于將所述經(jīng)編碼信號發(fā)射到所述發(fā)射信道內(nèi)的裝置。
33.根據(jù)權(quán)利要求18到32中任一權(quán)利要求所述的設(shè)備,其中所述設(shè)備包括用于確定偏移的值的裝置,所述值指示在所述第一幀與所述第二幀之間的所述音頻信號的幀的總數(shù)。
34.根據(jù)權(quán)利要求18到33中任一權(quán)利要求所述的設(shè)備,其中所述用于計算所述閾值的裝置包含: 用于基于與所述發(fā)射信道的所述狀態(tài)有關(guān)的所述信息計算第一閾值和第二閾值的裝置;及 用于基于來自所述第一幀和在所述音頻信號中鄰近所述第一幀的幀中的至少一者的信息從所述第一閾值和所述第二閾值中選擇所述計算出的閾值的裝置。
35.一種用于音頻信號處理的設(shè)備,所述設(shè)備包含: 第一計算器,其經(jīng)配置以計算音頻信號的第二幀對在所述音頻信號中在所述第二幀之前的第一幀的譯碼相依性的估計; 第二計算器,其經(jīng)配置以基于與發(fā)射信道的狀態(tài)有關(guān)的信息計算閾值;及模式選擇器,其經(jīng)配置以(A)將所述計算出的估計與所述計算出的閾值進行比較,及(B)基于所述比較的結(jié)果決定發(fā)射所述第一幀的冗余副本。
36.根據(jù)權(quán)利要求35所述的設(shè)備,其中所述計算出的估計是基于來自所述第一幀的信肩、O
37.根據(jù)權(quán)利要求36所述的設(shè)備,其中來自所述第一幀的所述信息包括激勵信號,且 其中所述設(shè)備包括向量產(chǎn)生器,其經(jīng)配置以使用來自所述激勵信號的信息產(chǎn)生自適應(yīng)碼向量,且 其中所述計算出的估計是基于所述自適應(yīng)碼向量。
38.根據(jù)權(quán)利要求35到37中任一權(quán)利要求所述的設(shè)備,其中所述計算出的估計是基于來自所述第二幀的經(jīng)編碼版本的信息。
39.根據(jù)權(quán)利要求3 5到37中任一權(quán)利要求所述的設(shè)備,其中所述計算出的估計是基于所述第二幀的經(jīng)編碼版本的自適應(yīng)碼簿增益值。
40.根據(jù)權(quán)利要求35所述的設(shè)備,其中所述計算出的估計是基于來自所述第二幀的第一經(jīng)編碼版本的信息且基于來自所述第二幀的第二經(jīng)編碼版本的信息, 其中所述第一經(jīng)編碼版本是使用來自所述第一幀的經(jīng)編碼版本的信息而編碼,且其中所述第二經(jīng)編碼版本是不使用來自所述第一幀的所述經(jīng)編碼版本的所述信息而編碼。
41.根據(jù)權(quán)利要求35到40中任一權(quán)利要求所述的設(shè)備,其中與所述發(fā)射信道的所述狀態(tài)有關(guān)的所述信息包括丟失的包的數(shù)目,且 其中所述計算出的閾值是基于丟失的包的所述數(shù)目。
42.根據(jù)權(quán)利要求35到41中任一權(quán)利要求所述的設(shè)備,其中與所述發(fā)射信道的所述狀態(tài)有關(guān)的所述信息包括基于接收的包的轉(zhuǎn)運次數(shù)的抖動值,且 其中所述計算出的閾值是基于所述抖動值。
43.根據(jù)權(quán)利要求35到42中任一權(quán)利要求所述的設(shè)備,其中所述設(shè)備包括信道解碼器,其經(jīng)配置以經(jīng)由無線發(fā)射信道接收與所述發(fā)射信道的所述狀態(tài)有關(guān)的所述信息。
44.根據(jù)權(quán)利要求35到43中任一權(quán)利要求所述的設(shè)備,其中所述第二計算器經(jīng)配置以強制所述計算出的閾值具有最小值。
45.根據(jù)權(quán)利要求35到43中任一權(quán)利要求所述的設(shè)備,其中所述第二計算器包含: 比較器,其經(jīng)配置以將基于與所述發(fā)射信道的所述狀態(tài)有關(guān)的所述信息的計算出的值與邊界值進行比較;及 選擇器,其經(jīng)配置以響應(yīng)于與所述邊界值的所述比較的結(jié)果選擇所述邊界值作為所述計算出的閾值。
46.根據(jù)權(quán)利要求35到45中任一權(quán)利要求所述的設(shè)備,其中所述設(shè)備包含: 幀編碼器,其經(jīng)配置以編碼所述第一幀以產(chǎn)生(A)所述第一幀的主要副本和(B)所述第一幀的所述冗余副本?’及 信道編碼器,其經(jīng)配置以產(chǎn)生包括所述主要副本和所述冗余副本的經(jīng)編碼信號。
47.根據(jù)權(quán)利要求46所述的設(shè)備,其中所述第一幀的所述主要副本包括第一碼字,所述第一碼字指示長度為L的第一代數(shù)碼向量的總數(shù)Pl個單位脈沖中的每一者的位置,且 其中所述第一幀的所述冗余副本包括第二碼字,所述第二碼字指示長度為L的第二代數(shù)碼向量的總數(shù)P2個單位脈沖中的每一者的位置,且其中Pl大于P2。
48.根據(jù)權(quán)利要求46和47中任一權(quán)利要求所述的設(shè)備,其中所述信道編碼器包含包裝配器,所述包裝配器經(jīng)配置以產(chǎn)生(A)包括所述第一幀的所述主要副本的第一包,及(B)包括所述第一幀的所述冗余副本和所述第二幀的副本的第二包,且 其中所述經(jīng)編碼信號包括所述第一包和所述第二包。
49.根據(jù)權(quán)利要求46到48中任一權(quán)利要求所述的設(shè)備,其中所述設(shè)備包括無線電發(fā)射器,其經(jīng)配置以將所述經(jīng)編碼信號發(fā)射到所述發(fā)射信道內(nèi)。
50.根據(jù)權(quán)利要求35到49中任一權(quán)利要求所述的設(shè)備,其中所述設(shè)備包括偏移計算器,其經(jīng)配置以確定偏移的值,所述值指示在所述第一幀與所述第二幀之間的所述音頻信號的幀的總數(shù)。
51.根據(jù)權(quán)利要求35到50中任一權(quán)利要求所述的設(shè)備,其中所述第二計算器包含: 閾值計算器,其經(jīng)配置以基于與所述發(fā)射信道的所述狀態(tài)有關(guān)的所述信息計算第一閾值和第二閾值;及 閾值選擇器,其經(jīng)配置以基于來自所述第一幀和在所述音頻信號中鄰近所述第一幀的幀中的至少一者的信息從所述第一閾值和所述第二閾值中選擇所述計算出的閾值。
52.一種具有有形特征的非暫時性計算機可讀數(shù)據(jù)存儲媒體,所述有形特征致使讀取所述特征的機器執(zhí)行根據(jù)權(quán)利要求1到17中任一權(quán)利要求所述的方法。
【文檔編號】H04L1/08GK104040622SQ201280066721
【公開日】2014年9月10日 申請日期:2012年12月19日 優(yōu)先權(quán)日:2012年1月12日
【發(fā)明者】文卡特什·克里希南, 丹尼爾·J·辛德爾, 維韋克·拉金德朗 申請人:高通股份有限公司