專利名稱:一種使用正弦模型進(jìn)行音頻錯(cuò)誤隱藏處理的方法
技術(shù)領(lǐng)域:
本發(fā)明屬于網(wǎng)絡(luò)及通信領(lǐng)域,特別涉及到一種使用正弦模型進(jìn)行 音頻錯(cuò)誤隱藏處理的方法。
背景技術(shù):
隨著有線和無(wú)線網(wǎng)絡(luò)的迅速發(fā)展,用戶通過(guò)因特網(wǎng)對(duì)音頻服務(wù)的 需求越來(lái)越廣泛,包括視頻會(huì)議、在線音樂點(diǎn)播、IP電話等。然而雖 然有信道編解碼來(lái)實(shí)現(xiàn)糾錯(cuò)和檢錯(cuò),但是還是不能保證因特網(wǎng)音頻通信提供有質(zhì)量的服務(wù)(QoS),在網(wǎng)絡(luò)通信,尤其是無(wú)線網(wǎng)絡(luò)通信中, 由于多徑衰落、噪聲干擾及網(wǎng)絡(luò)擁塞等原因,經(jīng)常造成數(shù)字音頻壓縮 數(shù)據(jù)包丟失或壓縮數(shù)據(jù)的錯(cuò)誤。由于壓縮音頻數(shù)據(jù)對(duì)突發(fā)錯(cuò)誤,特別 是壓縮數(shù)據(jù)的幀頭信息錯(cuò)誤或丟失,非常敏感,會(huì)造成壓縮數(shù)據(jù)的解 碼失敗,從而在沒有引入音頻錯(cuò)誤隱藏模塊時(shí)導(dǎo)致接收端音頻質(zhì)量惡 化。關(guān)于音頻錯(cuò)誤隱藏,音頻錯(cuò)誤隱藏的定義有廣義和狹義兩種,狹 義的錯(cuò)誤隱藏實(shí)際上就是針對(duì)解碼器進(jìn)行的,針對(duì)解碼中出現(xiàn)的錯(cuò)誤 對(duì)音頻序列進(jìn)行重建再生,而廣義的音頻錯(cuò)誤隱藏還包括在編碼端就 加入一定的冗余信息,以利于解碼端的重建。 一般所說(shuō)的錯(cuò)誤隱藏就 是狹義的錯(cuò)誤隱藏,可以看出跟傳統(tǒng)的前向糾錯(cuò)和自動(dòng)反饋重發(fā)等糾 錯(cuò)算法不同,狹義的錯(cuò)誤隱藏不占用額外帶寬,只利用接收端接收到 的信號(hào)提供的殘留信息,有更高的信道帶寬利用率。信道前向糾錯(cuò)編碼是一種針對(duì)信道傳輸中可能出現(xiàn)的錯(cuò)誤的處 理,不用關(guān)心信源的內(nèi)容,只是在信源傳輸時(shí),加上信道的冗余信息 以便解碼端進(jìn)行檢錯(cuò)或者糾錯(cuò)。與信道前向糾錯(cuò)編碼不同,針對(duì)信源 處理的音頻信號(hào)重建一般是基于時(shí)域的音頻解碼器輸出出現(xiàn)的問題, 如click、高頻噪聲等時(shí)域干擾,使用一種錯(cuò)誤消除方案去除它們。 而音頻的錯(cuò)誤隱藏則包括范圍更廣,可以是時(shí)域的處理,可以是在解 碼器解碼過(guò)程中,利用頻域、變換域的信息進(jìn)行錯(cuò)誤重建,還可以利用發(fā)端的附加數(shù)據(jù)作為指導(dǎo)對(duì)信號(hào)進(jìn)行重建。而且錯(cuò)誤隱藏一般是針 對(duì)網(wǎng)絡(luò)應(yīng)用中可能出現(xiàn)的丟包情況,即出現(xiàn)整個(gè)音頻幀丟失,重建丟 失幀的替代,讓人耳的主觀聽覺效果更好,降低音質(zhì)損壞程度。音頻 錯(cuò)誤隱藏與糾錯(cuò)編碼和信號(hào)重建的關(guān)系在音頻通信系統(tǒng)中如圖1所 示。對(duì)于錄音媒體,如光盤等,因損傷等原因,往往對(duì)波形文件產(chǎn)生 一定的局部干擾,如咔嚓噪聲click的存在,這樣在播放時(shí),沒有任 何處理的話,就能聽到如蜂鳴、尖刺等失真,影響人的聽音質(zhì)量。因 而迫切需要一些針對(duì)音頻數(shù)據(jù)的錯(cuò)誤進(jìn)行有效處理和方法。基于變換的編解碼系統(tǒng),為了解決變換塊間經(jīng)過(guò)編解碼系統(tǒng)產(chǎn)生 的塊效應(yīng), 一般都采用相鄰的編碼幀存在重疊相加,這種思路讓現(xiàn)在 的基于變換的編解碼系統(tǒng)采用一種重疊相加的時(shí)頻變換方法,比較有代表性的是MPEG的音頻編解碼系統(tǒng)中采用的修正余弦變換(即 Modified Discrete Cosine Transform,縮寫MDCT)和ITU G.722.1 中采用的重疊調(diào)制變換(即Modulated Lapped Transform,縮寫MLT)。基于變換的編解碼系統(tǒng)使用的重疊相加策略使得一幀的編碼序列 的產(chǎn)生或者解碼序列的重建都是通過(guò)前后兩幀的編碼序列或者界面 序列得到的。以MPEG感知音頻編解碼算法中常用的50%重疊相加 的MDCT時(shí)頻變換為例,根據(jù)MDCT的特性,若將等長(zhǎng)的2個(gè)序 列^Wxj順序疊加得到[^Wx^]后進(jìn)行MDCT變換,然后再對(duì)變換結(jié)果進(jìn)行IMDCT變換,那么輸出的結(jié)果是 /M)Cr(M"CT([化},化}])) = - x,}, {x2 +《}] 其中x,'表示序列x的逆序排列,如果兩次進(jìn)行MDCT變換的數(shù) 據(jù)有50 %的重疊,那么最終重疊的A被恢復(fù)出來(lái)了。這種重疊相加的特性讓一幀序列的編碼碼流在前后兩個(gè)編碼幀中, 一幀序列的完全 解碼也需要前后兩個(gè)編碼幀的解碼結(jié)果做重疊相加,同時(shí)如果發(fā)生一 幀序列的丟失情況下,也會(huì)導(dǎo)致連續(xù)兩幀序列的丟失,其錯(cuò)誤模型如 圖2所示。正弓玄分析禾口綜合(Sinusoidal analysis and synthesis,縮寫的SAS)首先對(duì)信號(hào)加窗,然后對(duì)固定的片斷的信號(hào)進(jìn)行分析,把信號(hào) 表示為一組正弦信號(hào)的疊加,這些正弦信號(hào)的參數(shù)就是幅度、頻率和 相位。如果把分析得到的正弦模型的所有的幅度、頻率和相位都用于綜合模型,則重建的音質(zhì)可以達(dá)到接近透明音質(zhì)。隨著Internet網(wǎng)絡(luò)和第三代、超三代移動(dòng)通信的不斷完善與發(fā)展, 通信帶寬不斷拓展,影音多媒體服務(wù)越來(lái)越豐富,交互式在線服務(wù)對(duì) 數(shù)據(jù)傳輸實(shí)時(shí)性要求高,傳統(tǒng)的糾錯(cuò)模式占據(jù)了大量帶寬并造成了較 大的時(shí)延,難以滿足高度實(shí)時(shí)性要求,服務(wù)的高質(zhì)量高實(shí)時(shí)性要求在 盡可能少地占據(jù)帶寬、盡可能少地增加時(shí)延條件下實(shí)現(xiàn)高品質(zhì)的影音 通信,能夠同時(shí)滿足這些要求的錯(cuò)誤隱藏技術(shù)成為人們關(guān)注的熱點(diǎn)。 音頻錯(cuò)誤隱藏具有廣泛的應(yīng)用范圍,網(wǎng)絡(luò)會(huì)議、IP電話、移動(dòng)通信、 在線點(diǎn)播、數(shù)字廣播及唱盤的糾錯(cuò)。視頻會(huì)議和遠(yuǎn)程教學(xué)等網(wǎng)絡(luò)流媒體服務(wù)要求確保音、視頻媒體流 的實(shí)時(shí)傳輸,目前網(wǎng)絡(luò)上傳輸音、視頻數(shù)據(jù)普遍采用的是基于UDP (用戶數(shù)據(jù)報(bào)協(xié)議)的RTP (實(shí)時(shí)傳輸協(xié)議)。UDP協(xié)議可以更充分地 利用帶寬傳輸數(shù)據(jù),獲得更好的使用效果,但是該協(xié)議本身沒有重傳 機(jī)制,會(huì)因?yàn)榫W(wǎng)絡(luò)的阻塞或傳輸?shù)难舆t導(dǎo)致接收端數(shù)據(jù)包丟失,影響 音、視頻質(zhì)量,因此需要采用錯(cuò)誤隱藏技術(shù)來(lái)掩飾丟失造成的錯(cuò)誤, 提高媒體輸出質(zhì)量。20世紀(jì)90年代,錯(cuò)誤隱藏方法作為GSM系統(tǒng)的非強(qiáng)制的建議 在ETSI中被提出,用于改善蜂窩移動(dòng)通信系統(tǒng)的語(yǔ)音質(zhì)量,并且在 第三代移動(dòng)通信的寬帶語(yǔ)音編碼AMR-WB +中又采用了相應(yīng)的錯(cuò)誤 隱藏方案來(lái)隱藏誤碼或丟失對(duì)語(yǔ)音質(zhì)量造成的影響。發(fā)明內(nèi)容本發(fā)明需要解決的技術(shù)問題是,由于隨著網(wǎng)絡(luò)及通信的快速發(fā) 展,傳統(tǒng)的糾錯(cuò)模式因其占據(jù)大量帶寬,造成較大的延時(shí)已經(jīng)不能滿 足高度實(shí)時(shí)性要求,為了克服現(xiàn)有技術(shù)中的這些不足,實(shí)現(xiàn)高品質(zhì)的 影、音通信,就要?jiǎng)?chuàng)新的提出一種新的處理方法,本發(fā)明的目的是一 種使用正弦模型進(jìn)行音頻錯(cuò)誤隱藏處理的方法,該方法利用了基于重 疊相加的編解碼系統(tǒng)的特性,首先對(duì)既定的模型進(jìn)行分析,然后提取 分析模型的參數(shù)做適當(dāng)處理,最后綜合得到一個(gè)音頻重建幀,提取該 重建幀的適當(dāng)部分和殘留部分相加,就可以得到重建的序列。完成本發(fā)明的目的采用的具體技術(shù)方案如下 一種使用正弦模型 進(jìn)行音頻錯(cuò)誤隱藏處理的方法,其特征在于,按如下步驟進(jìn)行操作(一) 首先,把整個(gè)系統(tǒng)的重建按照前一幀和當(dāng)前幀的錯(cuò)誤分為并列的4種情況,A.前幀和當(dāng)前幀都沒有錯(cuò)誤,正確解碼返回;B.前幀無(wú)誤, 當(dāng)前幀錯(cuò)誤,則對(duì)時(shí)域模型進(jìn)行分析綜合,得到綜合幀,把綜合幀的 奇對(duì)稱部分和殘留的偶對(duì)稱部分相加作為重建幀;C.前幀錯(cuò)誤,當(dāng)前 幀無(wú)誤,則把模型分析得到的綜合幀的偶對(duì)稱部分和殘留奇對(duì)稱部分 相加作為重建幀;D.前幀和當(dāng)前幀都錯(cuò)誤,則簡(jiǎn)單策略處理當(dāng)前幀;(二) .然后,輸出上面得到的正確解碼結(jié)果或者錯(cuò)誤隱藏的時(shí)域重 建。本發(fā)明所述的按照前一幀和當(dāng)前幀的錯(cuò)誤分為并列的4種情況詳細(xì)地闡述如下(A) 、前幀和當(dāng)前幀都沒有錯(cuò)誤這種情況下,兩幀都正確解碼,此時(shí)沒有錯(cuò)誤,直接輸出解碼結(jié) 果即可。(B) 前一幀無(wú)誤、當(dāng)前幀錯(cuò)誤該幀的重建過(guò)程分為兩部分,即首先通過(guò)對(duì)時(shí)域模型分析,通過(guò) 對(duì)頻譜的峰值計(jì)算、頻譜峰點(diǎn)相鄰補(bǔ)償、相位補(bǔ)償以及能量補(bǔ)償?shù)炔?驟得到頻域的重建,經(jīng)過(guò)IFFT,即可以得到重建的時(shí)域信號(hào),然后 為了相鄰幀間的時(shí)域連續(xù)性,取重建的信號(hào)的奇對(duì)稱部分和殘留的偶 對(duì)稱部分重疊相加。重建幀的過(guò)程就是包含頻譜峰值檢測(cè),相鄰峰值 點(diǎn)的幅度補(bǔ)償(按照正弦信號(hào)的特性),然后對(duì)分析模板的原始相位 做補(bǔ)償,然后對(duì)由于頻譜峰值檢測(cè)造成重建幀的能量減少做能量補(bǔ) 償,即得到頻域形式的重建幀,然后由IFFT來(lái)實(shí)現(xiàn)頻域到時(shí)域的轉(zhuǎn) 換。(C) 、前一幀錯(cuò)誤、當(dāng)前幀無(wú)誤 該幀的重建過(guò)程與上面的情況類似,也是首先對(duì)分析模型進(jìn)行頻域分析,提取頻譜峰值,然后進(jìn)行頻譜峰點(diǎn)相鄰補(bǔ)償、相位補(bǔ)償以及 能量補(bǔ)償?shù)炔襟E得到頻域的重建,經(jīng)過(guò)IFFT,即可以得到重建的時(shí) 域信號(hào),把時(shí)域的重建信號(hào)的偶對(duì)稱部分和殘留的奇對(duì)稱部分重疊相 加作為最終重建。如果考慮系統(tǒng)實(shí)現(xiàn)的復(fù)雜度,因?yàn)楫?dāng)前幀無(wú)誤,所 以需要對(duì)其進(jìn)行解碼,如果再加上上面的SAS過(guò)程,可能造成的附加算法復(fù)雜度較高,所以在當(dāng)前幀沒有錯(cuò)誤發(fā)生的情況下,為減少錯(cuò)誤隱藏的復(fù)雜度,可以考慮用前一幀丟失重建幀作為當(dāng)前幀的重建幀,然后將重建的信號(hào)經(jīng)過(guò)一定的衰減再做重疊相加,如圖5所示。(D)前幀和當(dāng)前幀都發(fā)生錯(cuò)誤此時(shí),發(fā)生連續(xù)幀丟失,錯(cuò)誤較為嚴(yán)重,可以直接用簡(jiǎn)單的錯(cuò)誤隱藏策略,如把前幀的重建結(jié)果直接使用帶衰減的幀復(fù)制策略或者靜 音策略等等。本發(fā)明的有益效果是,該方法適合于各種丟幀率下的處理,對(duì)于 中低丟幀率,連續(xù)幀丟失的概率較小,如果發(fā)生單一幀丟失,使用上面的策略(B)和(C)進(jìn)行錯(cuò)誤隱藏,將極大的改進(jìn)重建后質(zhì)量,人耳基 本聽不出失真。而對(duì)于中高丟幀率,使用簡(jiǎn)單的丟幀策略,不會(huì)造成 更大的聽覺失真。分狀態(tài)處理的策略讓該方法適合各種信道條件造成 丟幀的情況。該方法實(shí)現(xiàn)可以不增加編解碼系統(tǒng)的延時(shí),在中低丟幀 率下重建音質(zhì)較高,高丟幀率下也不會(huì)引入較大的聽覺失真,音質(zhì)人 耳可以忍受,同時(shí)方法實(shí)現(xiàn)的復(fù)雜度適中,適合應(yīng)用在移動(dòng)、無(wú)線等 對(duì)復(fù)雜度要求較高的領(lǐng)域。本發(fā)明的優(yōu)點(diǎn)還在于對(duì)于每種SAS處理系統(tǒng),正弦模型的分析 模板可以在丟失幀前任意選取。如當(dāng)前幀發(fā)生錯(cuò)誤,而前一幀并沒有 錯(cuò)誤,此時(shí)用于分析的時(shí)域信號(hào)可以直接采用前一幀的時(shí)域信號(hào),也 可以選擇前一幀的一部分和殘留信號(hào)的一部分作為分析幀的模板。本發(fā)明的優(yōu)點(diǎn)還在于對(duì)峰值檢測(cè)策略的改進(jìn)。因?yàn)殄e(cuò)誤隱藏是一 種模糊重建的方法,所以并不需要非常精確的估計(jì),所以使用簡(jiǎn)單的 峰值檢測(cè)策略,即判斷當(dāng)前樣點(diǎn)值大于前后樣點(diǎn)。另外對(duì)于峰點(diǎn)相鄰 的補(bǔ)償,即對(duì)相鄰峰值點(diǎn)的插值,由于DFT (Discrete Fourier Transforai 即離散傅里葉變換)的運(yùn)算精度是有限的,其頻率分辨率僅是F"AK其 中《是采樣率,N是變換點(diǎn)數(shù)),所以并不能保證每個(gè)峰值點(diǎn)都是完全意義的正弦分量,而可能是正弦分量的一個(gè)近似。如果這時(shí)直接用 DFT的峰值點(diǎn)來(lái)表示正弦分量,由于其有限的精度,可能導(dǎo)致估計(jì)不 準(zhǔn)確,僅用峰值點(diǎn)會(huì)造成相鄰峰值點(diǎn)的變化不連續(xù),相當(dāng)于用一個(gè)矩 形窗對(duì)峰值點(diǎn)進(jìn)行加權(quán),這樣會(huì)造成時(shí)域的泄漏,所以考慮用一個(gè)更 加平滑的窗函數(shù),所以考慮在相鄰峰值點(diǎn)進(jìn)行插值,即除了保留峰值點(diǎn)之外,還保留峰值點(diǎn)附近的若干個(gè)樣點(diǎn)以保持頻譜的平滑,同時(shí)對(duì) 于峰值點(diǎn)附近的樣點(diǎn)做一定的幅值衰減。本發(fā)明的優(yōu)點(diǎn)還在于在進(jìn)行頻譜峰值檢測(cè)之后對(duì)分析模板的頻 域相位進(jìn)行補(bǔ)償。相位的補(bǔ)償可以根據(jù)殘留幀的殘留相位來(lái)進(jìn)行,也 可以直接對(duì)分析模板相位進(jìn)行補(bǔ)償。 一種有效的相位補(bǔ)償策略是考慮 離散傅立葉變換(DFT)的線性相位特性,可以根據(jù)分析模板序列和 重建序列之間的偏移來(lái)做線性相位調(diào)整。本發(fā)明的優(yōu)點(diǎn)還在于對(duì)正弦模型的幅度、相位補(bǔ)償?shù)幕A(chǔ)上附加 的能量補(bǔ)償。該補(bǔ)償針對(duì)峰值檢測(cè)后的能量,既要保證重建幀的能量 不能太小,又不讓重建幀的能量過(guò)大,產(chǎn)生人耳可聞的噪聲。本發(fā)明的優(yōu)點(diǎn)還在于提供了一個(gè)減少錯(cuò)誤隱藏附加復(fù)雜度的方法。即如果當(dāng)前幀沒有錯(cuò)誤,而前一幀錯(cuò)誤,如果也按照?qǐng)D5用正弦模型進(jìn)行分析綜合,勢(shì)必造成解碼復(fù)雜度增加。因此本方法允許用前 面已經(jīng)綜合出來(lái)的重建幀經(jīng)過(guò)一定的衰減作為當(dāng)前幀的綜合幀,這樣 就降低了因?yàn)橐脲e(cuò)誤隱藏模塊而造成的復(fù)雜度增加。本發(fā)明的優(yōu)點(diǎn)還在于提供了適合各種延時(shí)條件的錯(cuò)誤隱藏方案, 分析模板選擇的任意使得錯(cuò)誤隱藏方法可以不增加原有的編解碼系 統(tǒng)的延時(shí),也可以為了追求更高的重建音質(zhì)而增加系統(tǒng)的延時(shí)。這種 算法重建音質(zhì)、算法延時(shí)與算法實(shí)現(xiàn)復(fù)雜度的可定制使得本算法適用 于各類網(wǎng)絡(luò)條件。
圖1為音頻通信系統(tǒng)的方框連接示意圖;圖2為基于重疊相加變換的編解碼系統(tǒng)的丟幀錯(cuò)誤模式示意圖;圖3為基于變換編碼系統(tǒng)中使用正弦模型進(jìn)行音頻錯(cuò)誤隱藏方案 示意圖;圖4為只有當(dāng)前幀錯(cuò)誤的SAS處理框圖; 圖5為只有前一幀錯(cuò)誤的SAS處理框圖; 圖6為正弦模型的分析窗位置示意圖;圖7為能量補(bǔ)償流程圖。
具體實(shí)施方式
參照?qǐng)Dl,表示音頻通信系統(tǒng)的方框連接關(guān)系示意圖,圖中表示 出音頻錯(cuò)誤隱藏與糾錯(cuò)編碼以及信號(hào)重建的區(qū)別和聯(lián)系。參照2表示,基于重疊相加時(shí)頻變換的編解碼系統(tǒng)的丟幀錯(cuò)誤模式,圖中表示,如果發(fā)生一幀序列的丟失情況下,也會(huì)導(dǎo)致連續(xù)兩序 列的丟失,參照?qǐng)D2可以看出,如果當(dāng)前的包含[&WxJ]編碼信息的幀數(shù)據(jù)丟失,則當(dāng)前幀只剩下實(shí)際時(shí)間序列的偶對(duì)稱部分^+x;},而下一幀只剩下奇對(duì)稱部分^-<}。即當(dāng)前一幀數(shù)據(jù)的丟失會(huì)導(dǎo)致連續(xù)的兩幀錯(cuò)誤。在這種錯(cuò)誤模式下的處理方式,是把整個(gè)系統(tǒng)的重建按照前一幀和當(dāng)前幀的是否錯(cuò)誤分為四種情況(A)前幀和當(dāng)前幀都沒有錯(cuò)誤,(B)前一幀無(wú)誤、當(dāng)前幀錯(cuò)誤,(C)前一幀錯(cuò)誤、當(dāng) 前幀無(wú)誤,(D)前幀和當(dāng)前幀都發(fā)生錯(cuò)誤。參照?qǐng)D3及圖4,表示基于變換編碼系統(tǒng)中使用正弦模型進(jìn)行錯(cuò) 誤隱藏方案示意圖及只有當(dāng)前幀錯(cuò)誤的SAS處理框圖。參照?qǐng)D5表示只有前幀錯(cuò)誤SAS處理框圖,用正弦模型進(jìn)行分 析綜合,表示可以用于簡(jiǎn)化算法的實(shí)現(xiàn)方式,即直接用前面己經(jīng)綜合 出來(lái)的重建幀經(jīng)過(guò)一定的衰減作為當(dāng)前幀的綜合幀,減少了錯(cuò)誤隱藏 算法實(shí)現(xiàn)的附加復(fù)雜度。參照?qǐng)D6為正弦模型的分析窗位置示意圖,設(shè)當(dāng)前幀為i幀,首先 把殘留的當(dāng)前幀信息與前一幀的正確界面得到的時(shí)域信息連接,然后 分析窗可以選擇在該段時(shí)域數(shù)據(jù)的任意位置(如圖6所示),如把分 析窗的中心放在第i幀殘留信息的起始。對(duì)于只有前一幀發(fā)生錯(cuò)誤的 情況也類似,該部分的重建正弦模型的分析模板可以選擇在圖6中所 列出的4幀時(shí)域序列的任意位置。另外對(duì)于窗函數(shù),可以根據(jù)具體的 編解碼系統(tǒng)來(lái)選擇,如AAC中使用正弦窗對(duì)分析模板加窗。參照?qǐng)D7為能量補(bǔ)償流程圖,由于峰值檢測(cè), 一些非峰值點(diǎn)直接 歸零,導(dǎo)致信號(hào)能量下降,所以利用峰值檢測(cè)前后的信號(hào)能量求得一個(gè)補(bǔ)償因子,然后把該因子經(jīng)過(guò)一定的衰減,如衰減到原來(lái)的0.8, 然后做一個(gè)限幅,以防止重建幀的能量過(guò)大。限幅值和衰減因子都可 以調(diào)整。
權(quán)利要求
1.一種使用正弦模型進(jìn)行音頻錯(cuò)誤隱藏處理的方法,其特征在于,按如下步驟進(jìn)行操作(一)首先,把整個(gè)系統(tǒng)的重建按照前一幀和當(dāng)前幀的錯(cuò)誤分為并列的4種情況,A.前幀和當(dāng)前幀都沒有錯(cuò)誤,正確解碼返回;B.前幀無(wú)誤,當(dāng)前幀錯(cuò)誤,則用正弦模型對(duì)時(shí)域信號(hào)進(jìn)行分析綜合,得到綜合幀,把綜合幀的奇對(duì)稱部分和殘留的偶對(duì)稱部分相加作為重建幀;C.前幀錯(cuò)誤,當(dāng)前幀無(wú)誤,則可以用正弦模型對(duì)時(shí)域信號(hào)進(jìn)行分析綜合,再綜合幀的偶對(duì)稱部分和殘留奇對(duì)稱部分相加作為重建幀;D.前幀和當(dāng)前幀都錯(cuò)誤,則簡(jiǎn)單策略處理當(dāng)前幀;(二).然后,輸出上面得到的正確解碼結(jié)果或者錯(cuò)誤隱藏的時(shí)域重建。
2. 根據(jù)權(quán)利要求1所述的使用正弦模型進(jìn)行音頻錯(cuò)誤隱藏處理的 方法,其特征在于,所述進(jìn)行分析綜合,是以輸入的時(shí)域信號(hào)為分析 模板,通過(guò)對(duì)正弦模型的幅度、頻率、相位三個(gè)分量的調(diào)整綜合出重 建時(shí)域信號(hào),具體包括-通過(guò)相鄰峰值點(diǎn)的插值增強(qiáng)頻率分量的提取精度; 根據(jù)時(shí)頻變換特性,對(duì)分析模板的相位做線性相位調(diào)整; 進(jìn)行峰值檢測(cè),根據(jù)檢測(cè)前后信號(hào)的能量對(duì)正弦分量的幅度做調(diào) 整;進(jìn)行峰值檢測(cè)后的能量補(bǔ)償。
3. 根據(jù)權(quán)利要求1或2所述的使用正弦模型進(jìn)行音頻錯(cuò)誤隱藏處 理的方法,其特征在于,所述峰值檢測(cè),是在相鄰峰值點(diǎn)間進(jìn)行插值, 保留峰值點(diǎn)附近的若干個(gè)樣點(diǎn)以保持頻譜的平滑。
4. 根據(jù)權(quán)利要求1或2所述的使用正弦模型進(jìn)行音頻錯(cuò)誤隱藏處 理的方法,其特征在于,所述線性相位調(diào)整,是根據(jù)分析模板和進(jìn)行 錯(cuò)誤隱藏的丟失幀間的時(shí)間偏移做線性相位補(bǔ)償。
5. 根據(jù)權(quán)利要求1或2所述的使用正弦模型進(jìn)行音頻錯(cuò)誤隱藏處 理的方法,其特征在于,所述能量補(bǔ)償,是根據(jù)峰值檢測(cè)后的能量變 化計(jì)算補(bǔ)償因子,并經(jīng)過(guò)衰減和限幅,保證音頻幀間能量的連續(xù)性。
全文摘要
一種使用正弦模型進(jìn)行音頻錯(cuò)誤隱藏處理的方法,屬于網(wǎng)絡(luò)及通信領(lǐng)域。按如下步驟進(jìn)行操作一,整個(gè)系統(tǒng)的重建按照前一幀和當(dāng)前幀的錯(cuò)誤分為并列的4種情況,A.前幀和當(dāng)前幀都沒錯(cuò),正確解碼返回;B.前幀無(wú)誤當(dāng)前幀錯(cuò)誤,對(duì)時(shí)域模型進(jìn)行分析綜合,把綜合幀的奇對(duì)稱部分和殘留的偶對(duì)稱部分相加作重建幀;C.前幀錯(cuò)誤當(dāng)前幀無(wú)誤,把模型分析得到的綜合幀的偶對(duì)稱部分和殘留奇對(duì)稱部分相加作重建幀;D.前幀和當(dāng)前幀都錯(cuò),簡(jiǎn)單策略處理當(dāng)前幀;二,輸出上面得到的解碼結(jié)果或錯(cuò)誤隱藏的時(shí)域重建。該方法適合于各種丟幀率下的處理,對(duì)于中低丟幀率,連續(xù)幀丟失的概率較小,而對(duì)于中高丟幀率,使用簡(jiǎn)單的丟幀策略,不會(huì)造成更大的聽覺失真。
文檔編號(hào)G10L19/00GK101261833SQ200810056759
公開日2008年9月10日 申請(qǐng)日期2008年1月24日 優(yōu)先權(quán)日2008年1月24日
發(fā)明者歡 侯, 竇維蓓 申請(qǐng)人:清華大學(xué)