可變幀偏移編碼的制作方法

文檔序號(hào)：2837012閱讀：261來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：可變幀偏移編碼的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及對(duì)基于幀的編解碼器(codec)的改進(jìn)，尤其涉及編碼/ 解碼方法、編碼器/解碼器(編解碼器)以及無線電通信設(shè)備。雖然幀的開始相對(duì)于先前幀的結(jié)束有時(shí)間偏移(time offset)，但是在改進(jìn)的基于幀的編解碼器的輸出處提供的信號(hào)包括規(guī)則(regular)持續(xù)時(shí)間的幀。所述時(shí)間偏移逐幀變化。來自改進(jìn)的編解碼器的輸出信號(hào)不具有固定的成幀網(wǎng)才各(framing grid)。
背景技術(shù)：
對(duì)于無線VoIP業(yè)務(wù)，降低無線鏈路上的比特率將日益重要。與單個(gè)會(huì)話相關(guān)聯(lián)的比特率越低，給定帶寬的無線電信道能夠傳輸?shù)臅?huì)話就越多。
一種降低比特率的手段是采用可變速率編碼。然而，即使比特流很低，無論如何也必須利用額外的開銷將所傳送的語音參數(shù)封裝在 IP/UDP/RTP分組中。然而，使用諸如ROHC (魯棒首部壓縮)之類的首部壓縮技術(shù)能夠?qū)⑦@種開銷減少至3或4字節(jié)。IP棧的較低層(例如數(shù)據(jù)鏈路層和物理層)產(chǎn)生其他的封包(packetization)開銷。
H. Sanneck, N. Le, M. Haardt和W.Mohr于2001年9月在丹麥奧爾堡的Fourth International Symposium on Wireless Personal Multimedia Communication發(fā)表的i侖文"Selective Packet Prioritization for Wireless VoIP"'公開了一種對(duì)可能"通過使用ECU (誤差掩蔽單元(error concealment unit))而利用誤差掩蔽覆蓋(cover)的"幀進(jìn)行標(biāo)記的方法。能夠被ECU覆蓋的幀被指定以較低優(yōu)先級(jí)，以使得如果在網(wǎng)絡(luò)中出現(xiàn)擁塞，則首先丟棄較低優(yōu)先級(jí)的分組。
在LARA-BARRON; LOCKHART的論文"Missing packet recovery of low-bit-rate coded speech using a novel packet-based embedded coder" (PROC. OF THE EUROPEAN SIGNAL PROCESSING CONFERENCE, SGNAL PROCESSING THEORIES AND APPLICATIONS巻2,第5期， 1990年9月18日-1990年9月21日，巴塞羅那，第1115-1118頁)測
試了類似的方法，但是該方法用于嵌入式DPCM (差分脈沖編碼調(diào)制)編碼。
用于非常低速率的語音編碼的分段聲碼器(segement vocoder)應(yīng)用這樣的技術(shù)，其中將語音劃分成長度變化的單元(分段)，繼而依次對(duì) 這些單元進(jìn)行編碼和傳送?？勺儙俾氏到y(tǒng)使用類似的技術(shù)，其將編解碼器的幀長度調(diào)節(jié)到一定持續(xù)時(shí)間，對(duì)于該持續(xù)時(shí)間能夠認(rèn)為描述語音信號(hào)的參數(shù)是不變的。
現(xiàn)有方案的問題
利用額外的封包開:肖來傳送所產(chǎn)生的參數(shù)。'這種開;肖與待傳送的有效載
荷的大小無關(guān)。因此，VoIP應(yīng)用中的VR編解碼器(可變速率編解碼器) 通常有以下問題它們能夠提供的源比特率降低不會(huì)轉(zhuǎn)化成相應(yīng)的總傳輸速率的節(jié)約。
對(duì)AMR編解碼器(自適應(yīng)多速率編解碼器)的可變速率擴(kuò)展所存在的特定問題是這樣的擴(kuò)展局限于現(xiàn)有的AMR模式。然而，更為高效的可變速率操作將要求存在非常低速率的模式，例如2kbps (千比特每秒)。然而，由于未解決的封包開銷問題，新的(例如2kbps)的AMR 模式的實(shí)際好處對(duì)于VoIP應(yīng)用而言實(shí)際上同樣是非常有限的。
Sanneck的方法的問題在于編碼器不知道幀已經(jīng)#1丟棄的事實(shí)。這導(dǎo)致編碼器和解碼器之間的狀態(tài)不匹配。因此，為了不至于使得所提供的語音質(zhì)量降低太多，對(duì)于使用在網(wǎng)絡(luò)中丟棄的幀必須謹(jǐn)慎。
Lara-Barrons方法的問題在于不節(jié)約帶寬并且僅能夠d、幅降低分組速率。
分段聲碼器以及可變幀速率系統(tǒng)對(duì)固定幀網(wǎng)才各起作用，對(duì)于其執(zhí)行一次(primary)幀方式(frame-wise)聲碼器參數(shù)計(jì)算。在下一個(gè)步驟中，它們旨在將若干連續(xù)幀合并成可變長度單元，其中針對(duì)所述可變長度單元得到單個(gè)參數(shù)表示。雖然這樣的系統(tǒng)運(yùn)行于非常低的比特率，但是其主要問題在于它們局限于相對(duì)低質(zhì)量的完全參數(shù)化的語音表示。它們并不適合于高質(zhì)量編碼，例如根據(jù)旨在近似語音波形的綜合分析范例 (analysis-by-synthesis paradigm )。
許多要用于VoIP的基于幀的編解碼器最初被設(shè)計(jì)用于CS (電路切換)應(yīng)用。因此，它們將語音分為例如20 ms (毫秒)的分段，這些是針對(duì)利用20ms的固定成幀網(wǎng)格的分段的編碼分段。所述編碼的結(jié)果是語音參數(shù)的集合。若干語音參數(shù)組塊(每個(gè)組塊對(duì)應(yīng)于20ms的語音) ;故嵌入要傳輸至目的地的RTP分組中。由此，所述RTP分組中的信息將對(duì)應(yīng)于多個(gè)20 ms的語音分段，但是當(dāng)經(jīng)由某一傳輸介質(zhì)進(jìn)行傳送時(shí)，所述RTP分組的持續(xù)時(shí)間可能更短，甚至短于20ms。

發(fā)明內(nèi)容
本發(fā)明涉及使用基于幀的編解碼器對(duì)信號(hào)(即，原始語音信號(hào))進(jìn) 行編碼的方法和裝置，其中第一幀的處理開始相對(duì)于所述第一幀之前的幀的處理結(jié)束有時(shí)間偏移。
本發(fā)明還涉及對(duì)數(shù)字信號(hào)進(jìn)行解碼的方法，包括使第一幀的解碼開始相對(duì)于所述第一幀之前的幀的處理結(jié)束發(fā)生偏移的步驟。
通過相對(duì)于先前幀的結(jié)束延遲幀(為了清楚起見，這里稱為第一幀) 處理的開始，以使得所述第一幀相對(duì)于先前幀的結(jié)束具有正時(shí)間偏移，所述正時(shí)間偏移將在先前幀的結(jié)束和第一幀之間產(chǎn)生時(shí)間間隙(time gap)。
所述時(shí)間間隙逐幀變化并且可能在其中插入信號(hào)(為了清楚起見，在以下為稱作替代(substitution)信號(hào))。所述替代信號(hào)可以是先前幀中的信號(hào)的外推(extrapolation)、先前幀和第一幀中的信號(hào)的內(nèi)插 (interpolation)或者是直接編碼的信號(hào)?？梢允褂门c用于先前幀和第一幀的媒體流不同的媒體流來傳送替代信號(hào)。示例性的替代信號(hào)是音視頻信號(hào)，并且第一幀和先前幀中的信號(hào)是音頻或語音信號(hào)。應(yīng)當(dāng)注意到，還可以是相反的情況，即，替代信號(hào)是音頻信號(hào)或語音信號(hào)，而第一幀和先前幀中的信號(hào)是音視頻信號(hào)。
本發(fā)明提供了用于控制時(shí)間偏移量的電路?？梢允箷r(shí)間偏移依賴于編碼信號(hào)的質(zhì)量并且考慮原始信號(hào)及其編碼版本之間的偏差 (deviation)?？梢詫?duì)時(shí)間偏移進(jìn)行額外的細(xì)化(refinement),例如在控制時(shí)間偏移時(shí)考慮編碼失真以及笫一幀的編碼。
通過使第一幀的處理開始相對(duì)于先前幀的結(jié)束在時(shí)間上提前 (forward),以使得第一幀具有負(fù)時(shí)間偏移并且與先前幀部分重疊，該
重疊部分中的信號(hào)將被編碼兩次。這增強(qiáng)了該信號(hào)部分的編碼。使用負(fù)
時(shí)間偏移可以捕捉到不同的信號(hào)變換(signal transition)。
本發(fā)明非常適于連同使用RTP協(xié)議的語音和音頻分組交換(PS) 傳輸一起使用，原因在于RTP提供了在任意時(shí)刻發(fā)信號(hào)通知在每個(gè)分組中所密封的一個(gè)或多個(gè)編解碼器幀的時(shí)間位置的功能，從而使得VoIP 可以使用靈活的幀網(wǎng)格而不是傳統(tǒng)的固定網(wǎng)格(例如，20ms)。

圖1是圖示本發(fā)明的基本方面的信號(hào)圖；圖2是語音信號(hào)的信號(hào)圖；圖3是根據(jù)本發(fā)明的語音信號(hào)的信號(hào)圖；圖4是圖1和圖3中的兩個(gè)信號(hào)之間的偏差的信號(hào)圖；圖5是根據(jù)本發(fā)明的時(shí)間偏移生成裝置的第一實(shí)施例的框圖；圖6是圖示利用第一實(shí)施例和相關(guān)聯(lián)的閾值所獲得的偏差度量 (metric)函數(shù)的示圖7是根據(jù)本發(fā)明的時(shí)間偏移生成裝置的第二實(shí)施例的框圖；圖8是圖示利用笫二實(shí)施例和相關(guān)聯(lián)的閾值所獲得的偏差度量函數(shù) 的示圖9是根據(jù)本發(fā)明的時(shí)間偏移生成裝置的第三實(shí)施例的框圖；圖IO是圖示根據(jù)本發(fā)明的基本思想的變化的信號(hào)圖；圖11是圖示用于為多個(gè)語音幀同時(shí)計(jì)算最優(yōu)時(shí)間偏移的方法的信號(hào)圖；和
圖12是使用分層可伸縮(scalable )編碼器進(jìn)行編碼的示意性圖示。
具體實(shí)施例方式
以下將結(jié)合圖1-11中的語音編碼以及圖12中的視頻和音頻信號(hào)的分層編碼對(duì)本發(fā)明進(jìn)行描述。
參考圖1,經(jīng)采樣的數(shù)字語音輸入信號(hào)1被施加在編解碼器的輸入。基于幀的編解碼器將所輸入的信號(hào)劃分成20ms的幀，一個(gè)幀依次跟隨另一個(gè)幀而沒有中斷。在編解碼器中對(duì)輸入的語音信號(hào)進(jìn)行編碼。在編解碼器的輸出處，給出與編碼分段相對(duì)應(yīng)的重構(gòu)(reconstructed)語音信號(hào)。
圖1所示的基本思想是以這樣的方式來操作基于幀的編解碼器以使得編碼的語音信號(hào)幀(由線段2所示，并且在以下被稱作第一幀或新幀) 無需緊跟在先前幀(由線段3所示)中的編碼的語音信號(hào)之后，而是以
相對(duì)于先前幀3的結(jié)束的可變時(shí)間偏移(由圖4所示，并且以下有時(shí)祐二稱作間隙)作為開始。本發(fā)明思想的直接好處是降低了編解碼器的實(shí)際幀速率，盡管編解碼器幀長度是恒定的。因?yàn)楸忍芈逝c每個(gè)所傳送的幀相關(guān)聯(lián)，所以平均比特率被降低。由此，即使幀速率恒定且比特率可能恒定，所述編解碼器也可作為可變速率編解碼器進(jìn)行操作。然而，與具備該特性的傳統(tǒng)的可變速率編解碼器相比，封包開銷減少。
根據(jù)本發(fā)明的一個(gè)實(shí)施例，所述編解碼器必須具有通過替代信號(hào)對(duì) 幀之間的間隙進(jìn)行橋接(bridge)的裝置。先前幀中信號(hào)的外推、先前幀和第一幀中信號(hào)的內(nèi)插可以被用作時(shí)間間隔中的替代。一種自然的解決方案是使用誤差掩蔽，其本質(zhì)上根據(jù)先前幀的語音編碼器參數(shù)集生成重構(gòu)語音信號(hào)。
以下將描述先前幀中的信號(hào)的外推。參考圖2,在先前幀的結(jié)束之處沒有使用輸入語音信號(hào)1的部分5，即沒有使用編解碼器(比較圖2) 直接進(jìn)行編碼，而是被先前幀中的語音信號(hào)的外推6替代。參見圖3，持續(xù)時(shí)間的外推對(duì)應(yīng)于時(shí)間偏移。當(dāng)然，所述外推將損害(impair)原始語音信號(hào)的質(zhì)量重構(gòu)?？梢圆粚⑺鐾馔乞?qū)使到重構(gòu)語音信號(hào)的質(zhì)量變差或變得明顯可感知的(distinctly perceptible)程度。輕微變壞是可容忍的。為了控制質(zhì)量并使得本發(fā)明思想具有實(shí)用性，編碼器必須具有自適應(yīng)地選擇待編碼的每個(gè)幀的開始樣本的裝置，這是計(jì)算時(shí)間偏移的裝置。這種計(jì)算以某一基于質(zhì)量的標(biāo)準(zhǔn)為基礎(chǔ)，并且產(chǎn)生逐幀變化的時(shí) 間偏移。以下將描述用于控制單獨(dú)時(shí)間偏移的不同方法。
以下參考圖4和5來描述第一種基本方法。在圖4中示出通過將原始語音信號(hào)與外推進(jìn)行比較而得到的誤差信號(hào)。如所示，時(shí)間偏移越長 (相對(duì)于先前幀的結(jié)束而言，該結(jié)束在時(shí)間軸上在7處區(qū)分)，所述外推與原始的偏差越大，并且誤差就會(huì)越大。當(dāng)誤差信號(hào)超過閾值8時(shí)，外推中止(abort),原因在于如果被進(jìn)一步驅(qū)使，所產(chǎn)生的重構(gòu)語音信號(hào)的質(zhì)量將會(huì)不能接受。因此很清楚的是，從先前幀的結(jié)束到誤差信號(hào) 達(dá)到閾值的時(shí)刻的時(shí)間將給出與第一幀相關(guān)聯(lián)的時(shí)間偏移。
本發(fā)明能夠被應(yīng)用于現(xiàn)有的使用IP/UDP/RTP傳輸?shù)娜魏握Z音編解
碼器。本發(fā)明需要編解碼器中的附加功能，但是并不需要對(duì)所述編解碼器的RTP傳輸格式進(jìn)行任何改變或?qū)幗獯a器的比特流格式進(jìn)行改變。因此，原則上，本發(fā)明對(duì)現(xiàn)有解碼器起作用。
本發(fā)明需要接收器能夠適當(dāng)?shù)靥幚沓霈F(xiàn)在不規(guī)則時(shí)刻的幀的情況，這是不同于解碼器方面的實(shí)施方式。
參考圖5描述了本發(fā)明的一個(gè)基本實(shí)施例。具有編碼器IO并且包括解碼器11的基于幀的綜合分析編解碼器9將其狀態(tài)轉(zhuǎn)移到外推器 (extrapolator) 13。所述外推器具有與時(shí)間偏移控制裝置14的第一輸入相連接的輸出，所述時(shí)間偏移控制裝置14包括第一偏差度量計(jì)算器 15和閾值電路(threshold circuit) 16。在所述閾值電路的輸出獲得所述偏移的值。該值被返回到編解碼器。所述外推器包括未示出的算法并且具有輸入，在該輸入處可獲得解碼器的解碼器狀態(tài)。原始語音連接至第二輸入。時(shí)間偏移控制裝置的兩個(gè)輸入被連接到第一偏差度量計(jì)算器的相應(yīng)輸入。
所述編解碼器是傳統(tǒng)的基于幀的綜合分析語音編碼器，例如AMR (自適應(yīng)多速率)編解碼器，其具有在本地生成解碼器重構(gòu)信號(hào)及其狀態(tài)的特性。根據(jù)本發(fā)明，在一幀的傳統(tǒng)編碼和本地解碼之后，用于外推的算法開始。幀外推算法根據(jù)(本地)解碼器狀態(tài)生成外推語音信號(hào)，而不是如傳統(tǒng)編碼器那樣立即對(duì)下一幀進(jìn)行編碼。典型地，幀外推算法可以是解碼器的ECU (誤差掩蔽單元)的本地版本。外推信號(hào)和輸入語音信號(hào)被饋入第一偏差度量計(jì)算器，所述第一偏差度量計(jì)算器測量所述外推信號(hào)與所述語音信號(hào)的偏差度量。特別地，參見圖6,偏差度量被作為外推信號(hào)的持續(xù)時(shí)間的函數(shù)來計(jì)算。能夠假設(shè)，持續(xù)時(shí)間越短，外推越好，由此偏差度量越小。所述度量能夠是(加權(quán))SNR、譜偏差或根據(jù)更為先進(jìn)的感知標(biāo)準(zhǔn)的類型。所述度量函數(shù)然后被饋入第一閾值電路，所述第一閾值電路將所述度量與閾值18進(jìn)行比較并且返回第一偏差度量函數(shù)與所述閾值相交的時(shí)刻作為時(shí)間偏移。參考圖6,這是圖示出偏差度量計(jì)算器的輸出處的第一偏差度量函數(shù)和第一閾值18的示圖。選擇所述閾值以確保足夠的外推信號(hào)質(zhì)量。
對(duì)閾值調(diào)節(jié)是適當(dāng)?shù)?例如根據(jù)針對(duì)先前編碼的幀而計(jì)算的編碼失真)，而不是使用恒定閾值。此后，將取閾值(thresholding)之后所獲得的偏移用作第一幀的開始時(shí)刻。這樣的對(duì)第一閾值的調(diào)節(jié)在圖6中由
雙端箭頭19示意性地示出。
實(shí)現(xiàn)這一點(diǎn)所用的裝置在圖5中用虛線示出，并且所述裝置包括第二偏差度量計(jì)算器20,其具有用于原始語音信號(hào)的一個(gè)輸入以及與解碼器輸出相連接的另一個(gè)輸入。通過將先前幀中的解碼信號(hào)與相同幀中的原始信號(hào)進(jìn)行比較而得到編碼失真的值。所述第二偏差度量計(jì)算器的輸出被連接到閾值電路的輸入，并且將由此針對(duì)所述編碼失真來對(duì)第一閾值進(jìn)行調(diào)節(jié)。
所述基本實(shí)施例的問題在于，偏移計(jì)算沒有考慮利用傳統(tǒng)的基于幀的編碼應(yīng)獲得的編碼失真。換句話說，所希望的是替代信號(hào)的質(zhì)量大約與利用傳統(tǒng)編解碼器針對(duì)第一幀所獲得的信號(hào)質(zhì)量相同。在圖5中，編碼失真與在先前幀中所獲得的信號(hào)質(zhì)量相關(guān)。假設(shè)零偏移，現(xiàn)在我們希
望其是針對(duì)第一幀所獲得的信號(hào)質(zhì)量。由此確保了實(shí)際的語音質(zhì)量將會(huì) 與利用傳統(tǒng)編解碼器所獲得的信號(hào)質(zhì)量一樣好。
一種實(shí)現(xiàn)這一點(diǎn)的方法是利用零偏移執(zhí)行對(duì)第一幀的編碼，如傳統(tǒng) 編解碼器將會(huì)另外進(jìn)行的那樣。接著，針對(duì)本地解碼的信號(hào)來計(jì)算另外
的度量函數(shù)。接著通過使用編碼的第一幀的該度量函數(shù)作為參考 (reference)來得到時(shí)間偏移?，F(xiàn)在，這樣做的過程中所獲得的閾值基于該度量函數(shù)。
這是利用圖7所示的改進(jìn)的實(shí)施方式來實(shí)現(xiàn)的，其中與圖4中的那些部分相對(duì)應(yīng)的部分具有相同的附圖標(biāo)記。如所示，除了編解碼器9、外推器13和第一偏差度量計(jì)算器15之外，還連接有第三偏差度量計(jì)算器21和第二閾值電路22。
如在零偏移下傳統(tǒng)編解碼器將會(huì)做的那樣，所述編解碼器對(duì)第一幀
2中的語音進(jìn)行編碼。笫二輸出處的原始語音信號(hào)1被輸入到第三偏差度量計(jì)算器。在所述第三計(jì)算器的輸出，出現(xiàn)用于本地編碼的信號(hào)的第三偏差度量函數(shù)19 (比較圖8),該偏差度量函數(shù)表示第一幀的編碼失真。接著在第二閾值電路22中，通過使用編碼的第一幀的第三偏差度量函數(shù)作為參考而得到時(shí)間偏移。利用第一偏差度量計(jì)算器所獲得的第一偏差度量函數(shù)17超過笫三偏差度量函數(shù)23的時(shí)刻被用作第二閾值。
優(yōu)選地，所述第二閾值加上某一余量(margin) 24^皮用作笫一幀的偏移。所述偏移將逐幀變化。與圖5中的實(shí)施方式相比，利用圖7中的實(shí)施方式所獲得的結(jié)果是接收器端的重構(gòu)語音信號(hào)的得以改進(jìn)的信號(hào)
質(zhì)量。
圖9中示出了更為準(zhǔn)確的閉環(huán)方法，該方法在計(jì)算偏移時(shí)除了考慮外推時(shí)間間隔期間的編碼失真之外，還考慮了開始于外推信號(hào)結(jié)束的解碼語音信號(hào)幀3?？紤]到編解碼器在外推之后可能需要一定恢復(fù)時(shí)間的事實(shí)，這是特別有用的。
除了外推器13之外，圖9所示的閉環(huán)實(shí)施方式包括幀編解碼器25、組合器26、第四偏差度量計(jì)算器27、積分器28和包括存儲(chǔ)器30的優(yōu) 化器29。閉環(huán)方法被描述如下按照以上的開環(huán)方法生成緊隨先前幀3 之后的外推信號(hào)。此外，幀編解碼器25對(duì)第一幀2中的語音信號(hào)進(jìn)行編碼和解碼，該第一幀具有在多個(gè)候選時(shí)間偏移之中選擇的候選時(shí)間偏移。所述幀編解碼器使用外推(或外推器狀態(tài))6作為輸入，以便針對(duì) 所選擇的候選時(shí)間偏移適當(dāng)?shù)卦O(shè)置編解碼器狀態(tài)。所述組合器將外推信號(hào)與第一幀中的信號(hào)進(jìn)行組合。被稱作組合或復(fù)合信號(hào)的組合信號(hào)包括第一和第二部分。所述第一部分是所選擇的候選時(shí)間偏移期間的外推信號(hào)，而所述第二部分是第一幀中的信號(hào)。如圖9所示，所述組合可以是兩個(gè)信號(hào)的簡單串聯(lián)(concatenation),或者是通過使用某一重疊相加操作使得一個(gè)信號(hào)平滑變換成另一個(gè)信號(hào)，從而逐步停止(phase out) 外推信號(hào)而逐步引入(phase in)解碼的第一幀信號(hào)。位于所述組合器的輸出的組合信號(hào)被施加在第四偏差度量計(jì)算器27的一個(gè)輸入，在所述第四偏差度量計(jì)算器27中將所述組合信號(hào)與施加在所述計(jì)算器27的第二輸入的原始語音信號(hào)進(jìn)行比較。如在所述第四偏差度量計(jì)算器的輸出所出現(xiàn)的，所計(jì)算的偏差在所選擇的候選時(shí)間偏移期間有所增加。正如所料，此后所述偏差有所下降。在積分器中，估算出第三度量達(dá)到預(yù)定時(shí)刻T，從而產(chǎn)生從先前幀結(jié)束一直到時(shí)刻T的時(shí)間的偏差度量。所積分的(integrated)度量是所測定的候選時(shí)間偏移多好或多差的量度。該積分度量接著被饋入優(yōu)化器，此處它被存儲(chǔ)在存儲(chǔ)器中。在存儲(chǔ)了該積分度量之后，選擇另一個(gè)候選時(shí)間偏移，并且在所述存儲(chǔ)器中存儲(chǔ)相應(yīng) 的積分度量。重復(fù)該過程直至所有的候選時(shí)間偏移值都已經(jīng)被選擇。最后，所述優(yōu)化器從所存儲(chǔ)的積分度量中選擇具有最小誤差的一個(gè)積分度量，這就是最小積分度量。最終選擇相關(guān)聯(lián)的候選時(shí)間偏移作為第一幀的時(shí)間偏移。
圖'5和7中所描述的開環(huán)方法的特征在于其簡單性和低復(fù)雜性，而
閉環(huán)方法更為準(zhǔn)確，但是以更為復(fù)雜并需要更多計(jì)算資源為代價(jià)。
根據(jù)本發(fā)明的可變幀偏移編碼產(chǎn)生幀偏移的某一概率分布。也就是說，對(duì)于某些幀而言，零偏移是必需的，而對(duì)于其他幀而言，大于零的偏移是可能的。長期而言，存在大于零的有效的幀偏移。這樣的幀偏移
的典型值可以為2ms。可利用示例來說明本發(fā)明在節(jié)約比特率方面的好處。假設(shè)編解碼器具有20 ms的編碼幀長度，并且比特率為每幀200比特。在編解碼器的傳統(tǒng)操作中，幀速率為每秒50幀且由此比特率為10 kbps。利用本發(fā)明，每20ms加上2ms的平均偏移持續(xù)時(shí)間，傳送平均 200比特。由此，所產(chǎn)生的比特率為200比特每22ms,等于9.09kbps。比特率因此減少了幾乎10%。
速率約束(rate constrained)方法
即使利用恒定比特?cái)?shù)對(duì)每個(gè)幀進(jìn)行編碼，根據(jù)本發(fā)明的具有可變幀偏移的編解碼器也作為可變速率的編解碼器進(jìn)行操作。假設(shè)編解碼器具有幀長度/ 并使用每幀A比特，則對(duì)于第n幀編碼的時(shí)間偏移"本地比特率為
尸(")=
其中比特率隨時(shí)間偏移的增加而降低。由此，作為結(jié)果，所有W個(gè)編碼幀的平均比特率為
在速率約束編碼方法中，目標(biāo)是在給定目標(biāo)平均比特率的約束下使編碼失真最小化。上述用于得到幀偏移的方法能夠很容易被擴(kuò)展到這種速率約束方法。所需要的是對(duì)以上方法中使用的偏差度量進(jìn)行修改。這些度量現(xiàn)在還包括本地使用的以某一適當(dāng)因數(shù)人加權(quán)的比特率的項(xiàng)，以
換句話說，可以說成本函數(shù)(cost function)與比特率相關(guān)聯(lián)。如果出于一個(gè)或另一個(gè)原因，例如由于本地需求，希望使用某一比特率，則這能夠通過如以上部分所述的時(shí)間偏移的相應(yīng)變化來實(shí)現(xiàn)。例如，如果需要較低的比特率，則使偏移更長。
利用負(fù)偏移進(jìn)行編碼
如上所述，適當(dāng)?shù)耐馔扑惴ū挥糜谶M(jìn)行誤差掩蔽，其在解碼器ECU 中可用。然而，這不僅僅是一種可能性。相反，在外推信號(hào)的編碼表示被傳送和使用的情況下，以比特率為代價(jià)，可以使用任何可用的編解碼器才莫式。這還能夠被說明并更容易地地解釋為對(duì)下一幀使用負(fù)的幀偏移。
例如，考慮利用AMR編解碼器的實(shí)施例。如圖IO所示，假設(shè)先前幀延伸至語音開端(onset) 31或其中信號(hào)具有明顯變換的信號(hào)部分中。如果用于先前幀的比特率低(例如由于DTX操作中的"舒適噪聲 (comfort noise)"的傳輸)，則存在無法充分表示所述開端的風(fēng)險(xiǎn)。這意味著編碼沒有捕捉到跟隨在開端之后的語音。為了解決這一問題，本發(fā)明提出了使用負(fù)偏移。與負(fù)偏移相關(guān)聯(lián)的新的/第一幀在先前幀結(jié)束之前開始，并且這些幀將出現(xiàn)重疊，從而對(duì)所述開端進(jìn)行適當(dāng)?shù)夭蹲胶?編碼。這是因?yàn)樵谛盘?hào)重疊之處存在兩重編碼。兩個(gè)幀被同時(shí)傳送。在解碼之后它們被加在一起?？商鎿Q地，使用滾裝(roll-on-roll-off)函數(shù)，第一幀中的信號(hào)被逐漸引入先前幀的信號(hào)中?？梢岳帽认惹皫叩?比特率對(duì)第一幀進(jìn)行編碼。在這種情況下，允許兩個(gè)幀中的信號(hào)之間的
變換難以進(jìn)行(hard)。丟棄先前幀中的信號(hào)并且使用第一/下一幀中的信號(hào)。
"舒適噪聲"具有非常低的比特率的編碼，其被用在DTX(不連續(xù) 傳輸)操作中。
在語音編碼中，假設(shè)所述語音在每幀中是固定的。但是如果在信號(hào) 中存在明顯變換，則不能如此假設(shè)。在這樣的情況下，最好相對(duì)于信號(hào) 來移動(dòng)幀位置，以便在幀內(nèi)獲得更為固定的行為。
使用負(fù)偏移的另一個(gè)示例是利用低比特率進(jìn)行編碼并且突然要求更高編碼質(zhì)量的情況，例如當(dāng)信號(hào)從語音信號(hào)變到音樂時(shí)。以下將給出這才羊的示例。
預(yù)測和延遲判決編碼(look ahead and delayed decision coding)
參見圖11,其圖示了具有多個(gè)幀的情形。對(duì)一個(gè)幀的編碼影響對(duì)連續(xù)幀的編碼。在本發(fā)明的該實(shí)施例中，希望同時(shí)對(duì)多個(gè)幀的偏移進(jìn)行優(yōu)
化。
增加的編碼延遲提供使用延遲判決編碼作為改進(jìn)的可能性。一個(gè)實(shí) 施例是優(yōu)化多個(gè)幀的偏移并為這些幀選擇編碼模式以使得給定比特率下的整體失真最小化。
在利用負(fù)偏移進(jìn)行編碼而產(chǎn)生重疊的編解碼器幀的情況下，可以僅向一個(gè)幀的某些部分的編碼誤差分配特定權(quán)重。例如，在圖11所示的
情況下，考慮到最好利用圖10所示的新的/第一幀捕捉開端，利用幀的
非重疊部分上的特定權(quán)重對(duì)先前幀進(jìn)行編碼是有益的。
內(nèi)插
能夠使用間隙內(nèi)插來代替使用時(shí)間間隙中的外推信號(hào)。根據(jù)先前幀和第一幀這二者，或者根據(jù)比先前幀和第一幀更早的幀來生成用于所傳送幀之間的間隙的替代信號(hào)。從而可以以額外的延遲為代價(jià)做出此類改進(jìn)。
具有部分采樣分辨率(sample resolution )的幀偏移在允許甚至具有部分采樣分辨率的幀偏移時(shí)，可以獲得額外的編碼
增益。在使用IP/UDP/RTP的VoIP背景下，這種解決方案需要對(duì)多個(gè)信
號(hào)采樣頻率設(shè)置時(shí)間戳?xí)r鐘。
可伸縮性
參見圖12,其中在可伸縮的分層編解碼器中對(duì)兩個(gè)媒體流進(jìn)行編碼。諸如核心層33的第一層提供一種比特率的編碼和相應(yīng)質(zhì)量，而例如更高層34的第二層提供利用更高比特率的改進(jìn)編碼和相應(yīng)的更高質(zhì) 量。在核心層，來自于一個(gè)媒體流的編碼信號(hào)出現(xiàn)在幀35中，所述幀 35被與關(guān)聯(lián)于各自幀的間隙隔開。在音頻幀之間的間隙中插入替代信號(hào)。所述替代信號(hào)取自更高級(jí)別的另一媒體流。例如，位于核心層的媒體流是只有音頻的流，而位于更高層的媒體流為音一見頻流。
還可以將本發(fā)明應(yīng)用于更高層，而所述替代信號(hào)取自核心層(或某
一更低層)。這使得將替代信號(hào)或增強(qiáng)幀僅置于需要改進(jìn)的信號(hào)部分成為可能，而較低層能夠被用于獲取適當(dāng)?shù)奶娲盘?hào)。還可以從單獨(dú)的編解碼器獲得替代信號(hào)。
IP傳輸考慮
在利用降低的IP分組速率的IP通信系統(tǒng)中使用本發(fā)明通常是有利的。不同于利用恒定幀速率的傳統(tǒng)可變速率方法，本發(fā)明能夠凈皮用于降
本發(fā)明還能夠應(yīng)用于其中每個(gè)分組傳輸多個(gè)幀的幀集合(frame aggregation)情形中。然而，在這種情況下，需要注意的是，RTP首部中的時(shí)間戳字段僅指示在分組中傳輸?shù)牡?一幀的第一采樣。跟隨先前幀的第一幀之后的其他幀沒有任何可指明的(specifiable)偏移。因此，為了直接應(yīng)用本發(fā)明的原則，屬于分組的所有幀都必須被看作針對(duì)其來得到最適合的偏移的超級(jí)幀(super-frame)單元。盡管如此，還可以使
集合的^況下也可能夠^全適用。' ,'—、' '
在使用RoHC的情況下，直接應(yīng)用本發(fā)明會(huì)引起IP開銷的增加，原因在于時(shí)間戳字段的不規(guī)則演變會(huì)要求更頻繁的IP分組首部更新。在這種情況下，必須在利用本發(fā)明所獲得的收益與IP開銷的增加之間進(jìn)行權(quán)
衡。解決這一問題的一種方法是將所允許的幀偏移限制在有限集合(例如，僅子幀偏移)，還能夠通過RoHC對(duì)其處理而不使開銷增加。特別應(yīng)用于速率約束方法中的第二種可能是在修改的度量中考慮包括RoHC 效率損失的IP開銷，比較"速率約束方法"部分。
雖然已經(jīng)示出了一些特定實(shí)施例，但是可以在權(quán)利要求的范圍之內(nèi) 以多種方式對(duì)本發(fā)明進(jìn)行修改。
權(quán)利要求
1.一種使用基于幀的編解碼器對(duì)數(shù)字信號(hào)進(jìn)行編碼的方法，其特征在于第一幀的處理開始相對(duì)于所述第一幀之前的幀的處理結(jié)束有時(shí)間偏移。
2. 如權(quán)利要求1所述的方法，其特征在于所述時(shí)間偏移隨一個(gè)處理幀到下一個(gè)而變化。
3. 如權(quán)利要求2所述的方法，其特征在于相對(duì)于先前幀的結(jié)束延遲第一幀的處理開始，以使得第一幀相對(duì)于先前幀的結(jié)束具有正時(shí)間偏移，所述正時(shí)間偏移在先前幀的結(jié)束和第一幀的處理開始之間產(chǎn)生時(shí)間間隙。
4. 如權(quán)利要求2所述的方法，其特征在于在時(shí)間上使第一幀的處理開始相對(duì)于先前幀的結(jié)束提前，以使得第一幀具有負(fù)時(shí)間偏移并且與先前幀部分重疊。
5. 如權(quán)利要求3所述的方法，其特征在于使時(shí)間偏移依賴于數(shù)字信號(hào)的替代。
6. 如權(quán)利要求5所述的方法，其特征在于在所述時(shí)間間隙中插入替代信號(hào)。
7. 如權(quán)利要求6所述的方法，其特征在于所述替代信號(hào)是所述編解碼器所處理的數(shù)字信號(hào)的外推。
8. 如權(quán)利要求6所述的方法，其特征在于所述替代信號(hào)是直接編碼的信號(hào)。
9. 如權(quán)利要求6所述的方法，其中所述編解碼器是分層可伸縮編解碼器，其特征在于所述替代信號(hào)取自所述編解碼器的第一層，而相對(duì) 于第一幀之前的幀的處理結(jié)束有時(shí)間偏移的幀取自第二層。
10. 如權(quán)利要求9所述的方法，其中在第一層中編碼的信號(hào)是音視頻信號(hào)，而第二層中的信號(hào)是音頻信號(hào)，其特征在于將編碼的音一見頻信號(hào)作為替代信號(hào)插入所述第一幀與后續(xù)幀之間的時(shí)間間隙中。
11. 如權(quán)利要求10所述的方法，其特征在于使分層的編碼信號(hào)依賴于編碼信號(hào)在其上傳送的信道的特征。
12. 如權(quán)利要求6所述的方法，其特征在于所述替代信號(hào)是先前幀和第一幀中的編碼數(shù)字信號(hào)之間的內(nèi)插。
13. 如權(quán)利要求6所述的方法，其特征在于使偏移依賴于本地所需的比特率。
14. 如權(quán)利要求2所述的方法，其特征在于使時(shí)間偏移依賴于所述編解碼器在先前幀中處理的信號(hào)的質(zhì)量量度。
15. 如權(quán)利要求4所述的方法，其特征在于當(dāng)存在著在先前幀中處理的信號(hào)的突變時(shí)第一幀開始。
16. 如權(quán)利要求14所述的方法，其特征在于根據(jù)所述信號(hào)與在先前幀中處理的信號(hào)的比較來計(jì)算偏移。
17. 如權(quán)利要求2、 14或16所述的方法，其特征在于將所述數(shù)字信號(hào)與所述替代信號(hào)進(jìn)行比較并且作為結(jié)果返回第一偏差度量，所述第一偏差度量是替代的持續(xù)時(shí)間的函數(shù)。
18. 如權(quán)利要求17所述的方法，其特征在于將所述笫一偏差度量與預(yù)定義的第一閾值進(jìn)行比較并且作為結(jié)果返回時(shí)間偏移。
19. 如權(quán)利要求18所述的方法，其特征在于根據(jù)針對(duì)先前幀所計(jì) 算的編碼失真對(duì)第一閾值進(jìn)行調(diào)節(jié)。
20. 如權(quán)利要求19所述的方法，其特征在于通過將數(shù)字信號(hào)與在先前幀中編碼的信號(hào)進(jìn)行比較來計(jì)算編碼失真，并且作為結(jié)果返回第二偏差度量，所述第二偏差度量被用于調(diào)節(jié)第一閾值。
21. 如權(quán)利要求17所述的方法，其特征在于使用替代信號(hào)和所述編解碼器在偏移為零的第一幀中處理的信號(hào)來計(jì)算時(shí)間偏移。
22. 如權(quán)利要求21所述的方法，其特征在于將作為原始語音信號(hào) 的數(shù)字信號(hào)與所述編解碼器在偏移為零的第一幀中編碼的信號(hào)進(jìn)行比較，并且作為結(jié)果返回第三偏差度量，所述第三偏差度量是所述第一幀的編碼失真的函數(shù)。
23. 如權(quán)利要求22所述的方法，其特征在于從所述第三偏差度量得到第二閾值函數(shù)，將第一度量與第二閾值函數(shù)進(jìn)行比較，并且作為結(jié) 果返回時(shí)間偏移。
24. 如權(quán)利要求23所述的方法，其特征在于保持替代信號(hào)直至所述替代信號(hào)的偏差度量超過第三閾值函數(shù)。
25. 如權(quán)利要求2所述的方法，其特征在于通過得到第一幀的編碼失真的量度來獲得偏移。
26. 如權(quán)利要求25所述的方法，其特征在于 a)在多個(gè)時(shí)間偏移候選之中選擇候選時(shí)間偏移，b)利用所選擇的候選時(shí)間偏移來處理第一幀， C)生成替代信號(hào)或使用預(yù)先計(jì)算的替代信號(hào)，d) 將替代信號(hào)與編碼的第一幀信號(hào)進(jìn)行組合，并且作為結(jié)果返回包括第一和第二部分的復(fù)合信號(hào)，所述第一部分包含替代信號(hào)的部分和大體上與所選擇的候選偏移相對(duì)應(yīng)的持續(xù)時(shí)間的部分，所述第二部分包含編碼的第一幀，e) 將作為原始語音信號(hào)的數(shù)字信號(hào)與所述復(fù)合信號(hào)進(jìn)行比較并獲得第四偏差度量，f) 在預(yù)定義的時(shí)間間隔(0-T)中估算針對(duì)所選擇的候選時(shí)間偏移而獲得的第四偏差度量，并且獲得積分偏差度量，以及g) 存儲(chǔ)針對(duì)所選擇的候選時(shí)間偏移而獲得的積分偏差度量，h) 對(duì)于每個(gè)候選時(shí)間偏移重復(fù)步驟b)至g),并選擇給出最小積分偏差度量的候選作為時(shí)間偏移。
27. 如權(quán)利要求26所述的方法，其特征在于提供所述復(fù)合信號(hào)的第一部分到其第二部分的平滑變換，所述變換是在確定時(shí)間間隔上進(jìn)行的。
28. 如權(quán)利要求26所述的方法，其特征在于所述預(yù)定義的時(shí)間間隔開始于先前幀的結(jié)束。
29. 如權(quán)利要求2-13中任意一項(xiàng)所述的方法，其特征在于同時(shí)得到多個(gè)連續(xù)幀的時(shí)間偏移。
30. 如權(quán)利要求17、 20、 22和26中任意一項(xiàng)所述的方法，其特征在于以信噪比(SNR)、譜偏差、感知標(biāo)準(zhǔn)、所使用比特率的成本函數(shù) 或其組合來表示第一、第二、第三或第四度量。
31. —種對(duì)數(shù)字信號(hào)進(jìn)行解碼的方法，其特征在于使笫一幀的解碼開始相對(duì)于所述第一幀之前的幀的處理結(jié)束發(fā)生偏移。
32. 如權(quán)利要求31所述的對(duì)數(shù)字信號(hào)進(jìn)行解碼的方法，其特征在于時(shí)間偏移隨一個(gè)解碼幀到下一個(gè)而變化。
33. 如權(quán)利要求32所述的對(duì)數(shù)字信號(hào)進(jìn)行解碼的方法，其特征在于相對(duì)于先前幀的結(jié)束延遲第一幀的解碼開始，以使得第一幀相對(duì)于先前幀的結(jié)束具有正時(shí)間偏移，所述正時(shí)間偏移在先前幀的結(jié)束和所述第一幀的處理開始之間產(chǎn)生時(shí)間間隙。
34. 如權(quán)利要求33所述的對(duì)數(shù)字信號(hào)進(jìn)行解碼的方法，其特征在于在所述時(shí)間間隙中插入替代信號(hào)。
35. 如權(quán)利要求34所述的對(duì)數(shù)字信號(hào)進(jìn)行解碼的方法，其特征在于所述替代信號(hào)是在先前幀中解碼的數(shù)字信號(hào)的外推。
36. 如權(quán)利要求34所述的對(duì)數(shù)字信號(hào)進(jìn)行解碼的方法，其特征在于所述替代信號(hào)是直接編碼的信號(hào)。
37. 如權(quán)利要求34所述的對(duì)數(shù)字信號(hào)進(jìn)行解碼的方法，使用分層可伸縮編解碼器，其特征在于使用取自所述編解碼器的第一層的信號(hào)作為替代信號(hào)，而從第二層取得時(shí)間偏移幀。
38. 如權(quán)利要求37所述的對(duì)數(shù)字信號(hào)進(jìn)行解碼的方法，其中在第一層中解碼的信號(hào)是音視頻信號(hào)，而第二層中的信號(hào)是音頻信號(hào)，其特征在于將解碼的音視頻信號(hào)作為替代信號(hào)插入第一幀與后續(xù)幀之間的時(shí)間間隙中。
39. 如權(quán)利要求34所述的對(duì)數(shù)字信號(hào)進(jìn)行解碼的方法，其特征在于將先前幀和第一幀中的數(shù)字信號(hào)之間的內(nèi)插用作替代信號(hào)。
40. 如權(quán)利要求6所述的方法，其特征在于使用誤差掩蔽單元(ECU) 算法產(chǎn)生替代信號(hào)。
41. 如權(quán)利要求35所述的對(duì)數(shù)字信號(hào)進(jìn)行解碼的方法，其特征在于使用誤差掩蔽單元(ECU)算法作為幀外推算法。
42. 如權(quán)利要求34或36所述的對(duì)數(shù)字信號(hào)進(jìn)行解碼的方法，其特證在于使用具有比用于編碼的編碼速率更低的編碼速率的編碼解碼器模式作為幀外推算法。
43. 如權(quán)利要求32所述的對(duì)數(shù)字信號(hào)進(jìn)行解碼的方法，其特征在于生成開始于解碼的先前幀的結(jié)束之前的解碼的第一幀，由此提供重疊的信號(hào)部分。
44. 如權(quán)利要求43所述的對(duì)數(shù)字信號(hào)進(jìn)行解碼的方法，其特征在于對(duì)重疊的信號(hào)部分進(jìn)行相加。
45. 如權(quán)利要求43所述的對(duì)數(shù)字信號(hào)進(jìn)行解碼的方法，其特征在于推遲解碼的先前幀的重疊部分。
46. —種用于提供編碼數(shù)字信號(hào)的基于幀的編解碼器，其特征在于用于使第一幀的處理開始相對(duì)于所述第一幀之前的幀的處理結(jié)束發(fā)生時(shí)間偏移的時(shí)間偏移裝置。
47. 如權(quán)利要求46所述的基于幀的編解碼器，其特征在于所述時(shí) 間偏移裝置適于使時(shí)間偏移隨一個(gè)處理幀到下一個(gè)而變化。
48. 如權(quán)利要求47所述的基于幀的編解碼器，其特征在于所述時(shí) 間偏移裝置適于相對(duì)于先前幀的結(jié)束延遲第一幀的處理開始，以使得第一幀相對(duì)于先前幀的結(jié)束具有正時(shí)間偏移，所述正時(shí)間偏移在先前幀的結(jié)束和第一幀的處理開始之間產(chǎn)生時(shí)間間隙。
49. 如權(quán)利要求47所述的基于幀的編解碼器，其特征在于所述時(shí) 間偏移裝置適于在時(shí)間上使第一幀的處理開始相對(duì)于先前幀的結(jié)束提前，以使得所述第一幀具有負(fù)時(shí)間偏移并且與先前幀部分重疊。
50. 如權(quán)利要求48所述的基于幀的編解碼器，其特征在于具有用于提供替代信號(hào)的信號(hào)替代裝置。
51. 如權(quán)利要求50所述的基于幀的編解碼器，其特征在于具有用于在所述時(shí)間間隙中插入替代信號(hào)的替代信號(hào)插入裝置。
52. 如權(quán)利要求51所述的用于提供編碼信號(hào)的基于幀的編解碼器，其特征在于所述信號(hào)替代裝置包括用于生成先前幀中的數(shù)字信號(hào)的外推的外推裝置。
53. 如權(quán)利要求51所述的基于幀的編解碼器，其特征在于所述信號(hào)替代裝置包括內(nèi)插裝置，所述內(nèi)插裝置適于提供替代信號(hào)，所述替代信號(hào)為先前幀中的編碼數(shù)字信號(hào)和第一幀中的編碼數(shù)字信號(hào)之間的內(nèi)插。
54. 如權(quán)利要求51所述的用于提供編碼信號(hào)的基于幀的編解碼器，其特征在于所述信號(hào)替代裝置包括分離編碼器。
55. 如權(quán)利要求51所述的用于提供編碼信號(hào)的基于幀的編解碼器，其特征在于所述分離編碼器是分層可伸縮編碼器，替代信號(hào)取自編碼器的第一層，而編碼信號(hào)幀取自第二層。
56. 如權(quán)利要求51所述的用于提供編碼信號(hào)的基于幀的編解碼器，其特征在于所述替代信號(hào)是音視頻信號(hào)，而編碼信號(hào)是音頻或語音信號(hào)。
57. 如權(quán)利要求51所述的用于提供編碼信號(hào)的基于幀的編解碼器，其特征在于所述時(shí)間偏移裝置適于使時(shí)間偏移依賴于本地所需的比特率。
58. 如權(quán)利要求51所述的用于提供編碼信號(hào)的基于幀的編解碼器，其特征在于所述信號(hào)替代裝置具有用于外推的誤差掩蔽單元(ECU)。
59. 如權(quán)利要求51所述的用于提供編碼信號(hào)的基于幀的編解碼器，其特征在于所述時(shí)間偏移裝置包括用于計(jì)算作為時(shí)間的函數(shù)的第一偏差度量信號(hào)的第一偏差度量計(jì)算器，所述第一偏差度量計(jì)算器具有用于作為原始語音信號(hào)的數(shù)字信號(hào)的輸入、用于替代信號(hào)的輸入以及用于提供來自輸入信號(hào)的笫一偏差度量函數(shù)的輸出，所述第一偏差度量表示所述替代信號(hào)與作為原始數(shù)字信號(hào)的數(shù)字信號(hào)的偏差。
60. 如權(quán)利要求59所述的用于提供編碼信號(hào)的基于幀的編解碼器，其特征在于所述時(shí)間偏移裝置還包括用于為所述第一偏差度量函數(shù)設(shè) 置第一闊值的第一閾值裝置，所述第一閾值裝置具有與第一偏差度量計(jì) 算器的輸出相連接的輸入，以及用于提供時(shí)間偏移的輸出。
61. 如權(quán)利要求60所述的基于幀的綜合分析語音編解碼器，其特征在于所生成的偏移作為笫一偏差度量函數(shù)超過所設(shè)置的第一閾值時(shí)的相對(duì)時(shí)刻。
62. 如權(quán)利要求61所述的用于提供編碼信號(hào)的基于幀的編解碼器，其特征在于用于計(jì)算第二偏差信號(hào)的第二偏差度量計(jì)算器，所述第二偏差度量計(jì)算器具有用于作為原始語音信號(hào)的數(shù)字信號(hào)的輸入，用于在先前幀中編碼的信號(hào)的輸入，以及用于提供考慮了編碼失真的第二偏差度量的輸出。
63. 如權(quán)利要求62所述的用于提供編碼信號(hào)的基于幀的編解碼器，其特征在于所述第二偏差計(jì)算器的輸出與所述第一閾值裝置的輸入相連接，以便利用針對(duì)先前幀中的信號(hào)所獲得的編碼失真對(duì)第一閾值進(jìn)行調(diào)節(jié)。
64. 如權(quán)利要求59所述的用于提供編碼信號(hào)的基于幀的編解碼器，其特征在于用于計(jì)算第三偏差信號(hào)的第三偏差度量計(jì)算器，所述第三偏差度量計(jì)算器具有用于作為原始語音信號(hào)的數(shù)字信號(hào)的輸入，用于在偏移為零的第一幀中編碼的信號(hào)的輸入，以及用于提供考慮了所述第一幀中的編碼失真的第三偏差度量的輸出。
65. 如權(quán)利要求64所述的用于提供編碼信號(hào)的基于幀的編解碼器，其特征在于所述時(shí)間偏移裝置還包括用于為所述第一偏差度量函數(shù)設(shè) 置笫二閾值的第二閾值裝置，所述第二閾值裝置具有與所述第一偏差度
66.如權(quán)利要求46-65中任意一項(xiàng);述、的基于幀的編解碼器，其特征在于所述編解碼器是綜合分析語音編解碼器。
67. 如權(quán)利要求66所述的用于提供編碼信號(hào)的基于幀的編解碼器，其特征在于所述第三偏差計(jì)算器的輸出連接到所述第二閾值裝置的輸入，以便利用針對(duì)偏移為零的第一幀中的信號(hào)所獲得的編碼失真對(duì)所述第二閾值進(jìn)行調(diào)節(jié)。
68. 如權(quán)利要求67所述的用于提供編碼信號(hào)的基于幀的編解碼器，其特征在于所述時(shí)間偏移裝置適于生成作為第一偏差度量超過第三偏差度量時(shí)的相對(duì)時(shí)刻的時(shí)間偏移信號(hào)。
69. 如權(quán)利要求68所述的用于提供編碼信號(hào)的基于幀的編解碼器，其特征在于所述時(shí)間偏移裝置適于在第一偏差度量超過第三偏差度量一定余量時(shí)生成時(shí)間偏移信號(hào)。
70. 如權(quán)利要求59所述的用于提供編碼信號(hào)的基于幀的編解碼器，其特征在于所述時(shí)間偏移生成裝置包括時(shí)間偏移選擇器，適于在多個(gè)時(shí)間偏移候選之中選擇候選時(shí)間偏移，用于生成替代信號(hào)的裝置，組合器，用于將所述替代信號(hào)與編碼的第一幀信號(hào)進(jìn)行組合以在其輸出處獲得復(fù)合信號(hào)，所述復(fù)合信號(hào)包括第一部分和第二部分，所述第一部分包含所述替代信號(hào)的部分和與所選擇的時(shí)間偏移相對(duì)應(yīng)的持續(xù) 時(shí)間的部分，所述第二部分包括第一幀之后的編碼幀，偏差度量計(jì)算器，用于計(jì)算第四偏差度量信號(hào)，所述第四偏差度量信號(hào)與原始信號(hào)和所述組合器的輸出上的復(fù)合信號(hào)之間的偏差相關(guān)，積分器，用于在預(yù)定義的時(shí)間段上對(duì)所述第四偏差度量信號(hào)進(jìn)行積分以獲得第四度量信號(hào)的值，和存儲(chǔ)器，用于存儲(chǔ)利用所選擇的時(shí)間偏移候選而獲得的第四度量信號(hào)值。
71. 如權(quán)利要求70所述的用于提供編碼信號(hào)的基于幀的編解碼器，其特征在于所述存儲(chǔ)器適于存儲(chǔ)利用每個(gè)偏移候選而獲得的第四偏差度量信號(hào)，所述時(shí)間偏移裝置還包括優(yōu)化器，所述優(yōu)化器適于選擇產(chǎn)生最小的積分偏差度量信號(hào)的候選偏移作為偏移。
72. 如權(quán)利要求71所述的用于提供編碼信號(hào)的基于幀的編解碼器，其特征在于所述預(yù)定義的時(shí)間段從先前幀的結(jié)束延伸至預(yù)定義的時(shí)刻。
73. ' —種用于傳輸和接收被劃分成恒定持續(xù)時(shí)間的幀的數(shù)字信號(hào)的無線電通信設(shè)備，所述設(shè)備包括基于幀的編解碼器，其特征在于所述編解碼器配備有時(shí)間偏移裝置，所述時(shí)間偏移裝置用于使第一幀的傳輸相對(duì)于第一幀之前的幀的結(jié)束發(fā)生一定的時(shí)間偏移。
74. 如權(quán)利要求73所述的無線電通信設(shè)備，其特征在于所述時(shí)間偏移裝置適于使時(shí)間偏移逐幀變化。
75. 如權(quán)利要求74所述的無線電通信設(shè)備，其特征在于所述時(shí)間偏移裝置適于相對(duì)于先前幀的結(jié)束延遲第一幀的處理開始，以使得第一幀相對(duì)于先前幀的結(jié)束具有正時(shí)間偏移，所述正時(shí)間偏移在先前幀的結(jié) 束和第一間隙之間產(chǎn)生時(shí)間間隙。
76. 如權(quán)利要求74所述的無線電通信設(shè)備，其特征在于所述時(shí)間偏移裝置適于在時(shí)間上使第一幀的處理開始相對(duì)于先前幀的結(jié)束提前，以使得第一幀具有負(fù)時(shí)間偏移并且與先前幀部分重疊。
77. 如權(quán)利要求75所述的無線電通信設(shè)備，其特征在于用于提供替代信號(hào)的信號(hào)替代裝置。
78. 如權(quán)利要求77所述的無線電通信設(shè)備，其特征在于用于在所述時(shí)間間隙中插入替代信號(hào)的替代信號(hào)插入裝置。
79. 如權(quán)利要求9所述的方法，其中在第一層中編碼的信號(hào)是音頻信號(hào)，并且第二層中的信號(hào)是音視頻信號(hào)，其特征在于將編碼的音頻信號(hào)作為替代信號(hào)插入第一幀與后續(xù)幀之間的時(shí)間間隙中。
80. 如權(quán)利要求37所述的對(duì)信號(hào)進(jìn)行解碼的方法，其中在第一層中解碼的信號(hào)是音頻信號(hào)，而第二層中的信號(hào)是音視頻信號(hào)，其特征在于將解碼的音頻信號(hào)作為替代信號(hào)插入第一幀與后續(xù)幀之間的時(shí)間間隙中。
81. 如權(quán)利要求51所述的用于提供編碼信號(hào)的基于幀的編解碼器，其特征在于所述替代信號(hào)是先前幀和第一幀中的編碼數(shù)字信號(hào)之間的內(nèi)插。
82. 如權(quán)利要求51所述的用于提供編碼信號(hào)的基于幀的編解碼器，其特征在于所述替代信號(hào)是音頻或語音信號(hào)，并且編碼信號(hào)是音^L頻信號(hào)。
83. 如權(quán)利要求33所述的對(duì)數(shù)字信號(hào)進(jìn)行解碼的方法，其特征在于在所述時(shí)間間隙期間處理替代信號(hào)。
84.如權(quán)利要求34所述的對(duì)數(shù)字信號(hào)進(jìn)行解碼的方法，使用分層可伸縮編解碼器，其特征在于所述替代信號(hào)是屬于所述編解碼器的第一層的信號(hào)，而時(shí)間偏移幀屬于第二層。
全文摘要
本發(fā)明涉及對(duì)基于幀的編解碼器的改進(jìn)，尤其涉及編碼/解碼方法、編碼器/解碼器(編解碼器)以及無線電通信設(shè)備。雖然幀的開始相對(duì)于先前幀的結(jié)束有時(shí)間偏移，但是在改進(jìn)的基于幀的編解碼器的輸出處提供的信號(hào)包括規(guī)則持續(xù)時(shí)間的幀。所述時(shí)間偏移逐幀變化。來自改進(jìn)的編解碼器的輸出信號(hào)不具有固定的成幀網(wǎng)格。時(shí)間偏移可以為正，在這種情況下，利用間隙隔開兩個(gè)連續(xù)的幀，在所述間隙中插入替代信號(hào)；或者時(shí)間偏移可以為負(fù)，在這種情況下，兩個(gè)連續(xù)的幀出現(xiàn)重疊?？梢允褂孟惹皫械男盘?hào)的外推、來自先前幀和后續(xù)幀的信號(hào)的內(nèi)插、或者直接編碼的信號(hào)作為替代信號(hào)。負(fù)偏移使得捕捉待編碼的信號(hào)中的瞬變成為可能。本發(fā)明涉及對(duì)基于幀的編解碼器的改進(jìn)，尤其涉及編碼/解碼方法、編碼器/解碼器(編解碼器)以及無線電通信設(shè)備。雖然幀的開始相對(duì)于先前幀的結(jié)束有時(shí)間偏移，但是在改進(jìn)的基于幀的編解碼器的輸出處提供的信號(hào)包括規(guī)則持續(xù)時(shí)間的幀。所述時(shí)間偏移逐幀變化。來自改進(jìn)的編解碼器的輸出信號(hào)不具有固定的成幀網(wǎng)格。時(shí)間偏移可以為正，在這種情況下，利用間隙隔開兩個(gè)連續(xù)的幀，在所述間隙中插入替代信號(hào)；或者時(shí)間偏移可以為負(fù)，在這種情況下，兩個(gè)連續(xù)的幀出現(xiàn)重疊?？梢允褂孟惹皫械男盘?hào)的外推、來自先前幀和后續(xù)幀的信號(hào)的內(nèi)插、或者直接編碼的信號(hào)作為替代信號(hào)。負(fù)偏移使得捕捉待編碼的信號(hào)中的瞬變成為可能。
文檔編號(hào)G10L19/022GK101366082SQ200680052459
公開日2009年2月11日申請(qǐng)日期2006年2月6日優(yōu)先權(quán)日2006年2月6日
發(fā)明者S·布魯恩申請(qǐng)人:艾利森電話股份有限公司

完整全部詳細(xì)技術(shù)資料下載