一種使用正弦模型進(jìn)行音頻錯(cuò)誤隱藏處理的方法

文檔序號(hào)：2830766閱讀：553來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：一種使用正弦模型進(jìn)行音頻錯(cuò)誤隱藏處理的方法
技術(shù)領(lǐng)域：
本發(fā)明屬于網(wǎng)絡(luò)及通信領(lǐng)域，特別涉及到一種使用正弦模型進(jìn)行音頻錯(cuò)誤隱藏處理的方法。
背景技術(shù)：
隨著有線和無(wú)線網(wǎng)絡(luò)的迅速發(fā)展，用戶通過(guò)因特網(wǎng)對(duì)音頻服務(wù)的需求越來(lái)越廣泛，包括視頻會(huì)議、在線音樂點(diǎn)播、IP電話等。然而雖然有信道編解碼來(lái)實(shí)現(xiàn)糾錯(cuò)和檢錯(cuò)，但是還是不能保證因特網(wǎng)音頻通信提供有質(zhì)量的服務(wù)(QoS)，在網(wǎng)絡(luò)通信，尤其是無(wú)線網(wǎng)絡(luò)通信中，由于多徑衰落、噪聲干擾及網(wǎng)絡(luò)擁塞等原因，經(jīng)常造成數(shù)字音頻壓縮數(shù)據(jù)包丟失或壓縮數(shù)據(jù)的錯(cuò)誤。由于壓縮音頻數(shù)據(jù)對(duì)突發(fā)錯(cuò)誤，特別是壓縮數(shù)據(jù)的幀頭信息錯(cuò)誤或丟失，非常敏感，會(huì)造成壓縮數(shù)據(jù)的解碼失敗，從而在沒有引入音頻錯(cuò)誤隱藏模塊時(shí)導(dǎo)致接收端音頻質(zhì)量惡化。關(guān)于音頻錯(cuò)誤隱藏，音頻錯(cuò)誤隱藏的定義有廣義和狹義兩種，狹義的錯(cuò)誤隱藏實(shí)際上就是針對(duì)解碼器進(jìn)行的，針對(duì)解碼中出現(xiàn)的錯(cuò)誤對(duì)音頻序列進(jìn)行重建再生，而廣義的音頻錯(cuò)誤隱藏還包括在編碼端就加入一定的冗余信息，以利于解碼端的重建。一般所說(shuō)的錯(cuò)誤隱藏就是狹義的錯(cuò)誤隱藏，可以看出跟傳統(tǒng)的前向糾錯(cuò)和自動(dòng)反饋重發(fā)等糾錯(cuò)算法不同，狹義的錯(cuò)誤隱藏不占用額外帶寬，只利用接收端接收到的信號(hào)提供的殘留信息，有更高的信道帶寬利用率。信道前向糾錯(cuò)編碼是一種針對(duì)信道傳輸中可能出現(xiàn)的錯(cuò)誤的處理，不用關(guān)心信源的內(nèi)容，只是在信源傳輸時(shí)，加上信道的冗余信息以便解碼端進(jìn)行檢錯(cuò)或者糾錯(cuò)。與信道前向糾錯(cuò)編碼不同，針對(duì)信源處理的音頻信號(hào)重建一般是基于時(shí)域的音頻解碼器輸出出現(xiàn)的問題，如click、高頻噪聲等時(shí)域干擾，使用一種錯(cuò)誤消除方案去除它們。而音頻的錯(cuò)誤隱藏則包括范圍更廣，可以是時(shí)域的處理，可以是在解碼器解碼過(guò)程中，利用頻域、變換域的信息進(jìn)行錯(cuò)誤重建，還可以利用發(fā)端的附加數(shù)據(jù)作為指導(dǎo)對(duì)信號(hào)進(jìn)行重建。而且錯(cuò)誤隱藏一般是針對(duì)網(wǎng)絡(luò)應(yīng)用中可能出現(xiàn)的丟包情況，即出現(xiàn)整個(gè)音頻幀丟失，重建丟失幀的替代，讓人耳的主觀聽覺效果更好，降低音質(zhì)損壞程度。音頻錯(cuò)誤隱藏與糾錯(cuò)編碼和信號(hào)重建的關(guān)系在音頻通信系統(tǒng)中如圖1所示。對(duì)于錄音媒體，如光盤等，因損傷等原因，往往對(duì)波形文件產(chǎn)生一定的局部干擾，如咔嚓噪聲click的存在，這樣在播放時(shí)，沒有任何處理的話，就能聽到如蜂鳴、尖刺等失真，影響人的聽音質(zhì)量。因而迫切需要一些針對(duì)音頻數(shù)據(jù)的錯(cuò)誤進(jìn)行有效處理和方法。基于變換的編解碼系統(tǒng)，為了解決變換塊間經(jīng)過(guò)編解碼系統(tǒng)產(chǎn)生的塊效應(yīng)，一般都采用相鄰的編碼幀存在重疊相加，這種思路讓現(xiàn)在的基于變換的編解碼系統(tǒng)采用一種重疊相加的時(shí)頻變換方法，比較有代表性的是MPEG的音頻編解碼系統(tǒng)中采用的修正余弦變換(即 Modified Discrete Cosine Transform,縮寫MDCT)和ITU G.722.1 中采用的重疊調(diào)制變換(即Modulated Lapped Transform,縮寫MLT)。基于變換的編解碼系統(tǒng)使用的重疊相加策略使得一幀的編碼序列的產(chǎn)生或者解碼序列的重建都是通過(guò)前后兩幀的編碼序列或者界面序列得到的。以MPEG感知音頻編解碼算法中常用的50%重疊相加的MDCT時(shí)頻變換為例，根據(jù)MDCT的特性，若將等長(zhǎng)的2個(gè)序列^Wxj順序疊加得到[^Wx^]后進(jìn)行MDCT變換，然后再對(duì)變換結(jié)果進(jìn)行IMDCT變換，那么輸出的結(jié)果是 /M)Cr(M"CT([化},化}])) = - x,}, {x2 +《}] 其中x,'表示序列x的逆序排列，如果兩次進(jìn)行MDCT變換的數(shù) 據(jù)有50 %的重疊，那么最終重疊的A被恢復(fù)出來(lái)了。這種重疊相加的特性讓一幀序列的編碼碼流在前后兩個(gè)編碼幀中，一幀序列的完全解碼也需要前后兩個(gè)編碼幀的解碼結(jié)果做重疊相加，同時(shí)如果發(fā)生一幀序列的丟失情況下，也會(huì)導(dǎo)致連續(xù)兩幀序列的丟失，其錯(cuò)誤模型如圖2所示。正弓玄分析禾口綜合(Sinusoidal analysis and synthesis,縮寫的SAS)首先對(duì)信號(hào)加窗，然后對(duì)固定的片斷的信號(hào)進(jìn)行分析，把信號(hào) 表示為一組正弦信號(hào)的疊加，這些正弦信號(hào)的參數(shù)就是幅度、頻率和相位。如果把分析得到的正弦模型的所有的幅度、頻率和相位都用于綜合模型，則重建的音質(zhì)可以達(dá)到接近透明音質(zhì)。隨著Internet網(wǎng)絡(luò)和第三代、超三代移動(dòng)通信的不斷完善與發(fā)展，通信帶寬不斷拓展，影音多媒體服務(wù)越來(lái)越豐富，交互式在線服務(wù)對(duì) 數(shù)據(jù)傳輸實(shí)時(shí)性要求高，傳統(tǒng)的糾錯(cuò)模式占據(jù)了大量帶寬并造成了較大的時(shí)延，難以滿足高度實(shí)時(shí)性要求，服務(wù)的高質(zhì)量高實(shí)時(shí)性要求在盡可能少地占據(jù)帶寬、盡可能少地增加時(shí)延條件下實(shí)現(xiàn)高品質(zhì)的影音通信，能夠同時(shí)滿足這些要求的錯(cuò)誤隱藏技術(shù)成為人們關(guān)注的熱點(diǎn)。音頻錯(cuò)誤隱藏具有廣泛的應(yīng)用范圍，網(wǎng)絡(luò)會(huì)議、IP電話、移動(dòng)通信、在線點(diǎn)播、數(shù)字廣播及唱盤的糾錯(cuò)。視頻會(huì)議和遠(yuǎn)程教學(xué)等網(wǎng)絡(luò)流媒體服務(wù)要求確保音、視頻媒體流的實(shí)時(shí)傳輸，目前網(wǎng)絡(luò)上傳輸音、視頻數(shù)據(jù)普遍采用的是基于UDP (用戶數(shù)據(jù)報(bào)協(xié)議)的RTP (實(shí)時(shí)傳輸協(xié)議)。UDP協(xié)議可以更充分地利用帶寬傳輸數(shù)據(jù)，獲得更好的使用效果，但是該協(xié)議本身沒有重傳機(jī)制，會(huì)因?yàn)榫W(wǎng)絡(luò)的阻塞或傳輸?shù)难舆t導(dǎo)致接收端數(shù)據(jù)包丟失，影響音、視頻質(zhì)量，因此需要采用錯(cuò)誤隱藏技術(shù)來(lái)掩飾丟失造成的錯(cuò)誤，提高媒體輸出質(zhì)量。20世紀(jì)90年代，錯(cuò)誤隱藏方法作為GSM系統(tǒng)的非強(qiáng)制的建議在ETSI中被提出，用于改善蜂窩移動(dòng)通信系統(tǒng)的語(yǔ)音質(zhì)量，并且在第三代移動(dòng)通信的寬帶語(yǔ)音編碼AMR-WB +中又采用了相應(yīng)的錯(cuò)誤隱藏方案來(lái)隱藏誤碼或丟失對(duì)語(yǔ)音質(zhì)量造成的影響。發(fā)明內(nèi)容本發(fā)明需要解決的技術(shù)問題是，由于隨著網(wǎng)絡(luò)及通信的快速發(fā) 展，傳統(tǒng)的糾錯(cuò)模式因其占據(jù)大量帶寬，造成較大的延時(shí)已經(jīng)不能滿足高度實(shí)時(shí)性要求，為了克服現(xiàn)有技術(shù)中的這些不足，實(shí)現(xiàn)高品質(zhì)的影、音通信，就要?jiǎng)?chuàng)新的提出一種新的處理方法，本發(fā)明的目的是一種使用正弦模型進(jìn)行音頻錯(cuò)誤隱藏處理的方法，該方法利用了基于重疊相加的編解碼系統(tǒng)的特性，首先對(duì)既定的模型進(jìn)行分析，然后提取分析模型的參數(shù)做適當(dāng)處理，最后綜合得到一個(gè)音頻重建幀，提取該重建幀的適當(dāng)部分和殘留部分相加，就可以得到重建的序列。完成本發(fā)明的目的采用的具體技術(shù)方案如下一種使用正弦模型進(jìn)行音頻錯(cuò)誤隱藏處理的方法，其特征在于，按如下步驟進(jìn)行操作(一) 首先，把整個(gè)系統(tǒng)的重建按照前一幀和當(dāng)前幀的錯(cuò)誤分為并列的4種情況，A.前幀和當(dāng)前幀都沒有錯(cuò)誤，正確解碼返回;B.前幀無(wú)誤，當(dāng)前幀錯(cuò)誤，則對(duì)時(shí)域模型進(jìn)行分析綜合，得到綜合幀，把綜合幀的奇對(duì)稱部分和殘留的偶對(duì)稱部分相加作為重建幀;C.前幀錯(cuò)誤，當(dāng)前幀無(wú)誤，則把模型分析得到的綜合幀的偶對(duì)稱部分和殘留奇對(duì)稱部分相加作為重建幀;D.前幀和當(dāng)前幀都錯(cuò)誤，則簡(jiǎn)單策略處理當(dāng)前幀;(二) .然后，輸出上面得到的正確解碼結(jié)果或者錯(cuò)誤隱藏的時(shí)域重建。本發(fā)明所述的按照前一幀和當(dāng)前幀的錯(cuò)誤分為并列的4種情況詳細(xì)地闡述如下(A) 、前幀和當(dāng)前幀都沒有錯(cuò)誤這種情況下，兩幀都正確解碼，此時(shí)沒有錯(cuò)誤，直接輸出解碼結(jié) 果即可。(B) 前一幀無(wú)誤、當(dāng)前幀錯(cuò)誤該幀的重建過(guò)程分為兩部分，即首先通過(guò)對(duì)時(shí)域模型分析，通過(guò) 對(duì)頻譜的峰值計(jì)算、頻譜峰點(diǎn)相鄰補(bǔ)償、相位補(bǔ)償以及能量補(bǔ)償?shù)炔?驟得到頻域的重建，經(jīng)過(guò)IFFT，即可以得到重建的時(shí)域信號(hào)，然后為了相鄰幀間的時(shí)域連續(xù)性，取重建的信號(hào)的奇對(duì)稱部分和殘留的偶對(duì)稱部分重疊相加。重建幀的過(guò)程就是包含頻譜峰值檢測(cè)，相鄰峰值點(diǎn)的幅度補(bǔ)償(按照正弦信號(hào)的特性)，然后對(duì)分析模板的原始相位做補(bǔ)償，然后對(duì)由于頻譜峰值檢測(cè)造成重建幀的能量減少做能量補(bǔ) 償，即得到頻域形式的重建幀，然后由IFFT來(lái)實(shí)現(xiàn)頻域到時(shí)域的轉(zhuǎn) 換。(C) 、前一幀錯(cuò)誤、當(dāng)前幀無(wú)誤該幀的重建過(guò)程與上面的情況類似，也是首先對(duì)分析模型進(jìn)行頻域分析，提取頻譜峰值，然后進(jìn)行頻譜峰點(diǎn)相鄰補(bǔ)償、相位補(bǔ)償以及能量補(bǔ)償?shù)炔襟E得到頻域的重建，經(jīng)過(guò)IFFT，即可以得到重建的時(shí) 域信號(hào)，把時(shí)域的重建信號(hào)的偶對(duì)稱部分和殘留的奇對(duì)稱部分重疊相加作為最終重建。如果考慮系統(tǒng)實(shí)現(xiàn)的復(fù)雜度，因?yàn)楫?dāng)前幀無(wú)誤，所以需要對(duì)其進(jìn)行解碼，如果再加上上面的SAS過(guò)程，可能造成的附加算法復(fù)雜度較高，所以在當(dāng)前幀沒有錯(cuò)誤發(fā)生的情況下，為減少錯(cuò)誤隱藏的復(fù)雜度，可以考慮用前一幀丟失重建幀作為當(dāng)前幀的重建幀，然后將重建的信號(hào)經(jīng)過(guò)一定的衰減再做重疊相加，如圖5所示。(D)前幀和當(dāng)前幀都發(fā)生錯(cuò)誤此時(shí)，發(fā)生連續(xù)幀丟失，錯(cuò)誤較為嚴(yán)重，可以直接用簡(jiǎn)單的錯(cuò)誤隱藏策略，如把前幀的重建結(jié)果直接使用帶衰減的幀復(fù)制策略或者靜音策略等等。本發(fā)明的有益效果是，該方法適合于各種丟幀率下的處理，對(duì)于中低丟幀率，連續(xù)幀丟失的概率較小，如果發(fā)生單一幀丟失，使用上面的策略(B)和(C)進(jìn)行錯(cuò)誤隱藏，將極大的改進(jìn)重建后質(zhì)量，人耳基本聽不出失真。而對(duì)于中高丟幀率，使用簡(jiǎn)單的丟幀策略，不會(huì)造成更大的聽覺失真。分狀態(tài)處理的策略讓該方法適合各種信道條件造成丟幀的情況。該方法實(shí)現(xiàn)可以不增加編解碼系統(tǒng)的延時(shí)，在中低丟幀率下重建音質(zhì)較高，高丟幀率下也不會(huì)引入較大的聽覺失真，音質(zhì)人耳可以忍受，同時(shí)方法實(shí)現(xiàn)的復(fù)雜度適中，適合應(yīng)用在移動(dòng)、無(wú)線等對(duì)復(fù)雜度要求較高的領(lǐng)域。本發(fā)明的優(yōu)點(diǎn)還在于對(duì)于每種SAS處理系統(tǒng)，正弦模型的分析模板可以在丟失幀前任意選取。如當(dāng)前幀發(fā)生錯(cuò)誤，而前一幀并沒有錯(cuò)誤，此時(shí)用于分析的時(shí)域信號(hào)可以直接采用前一幀的時(shí)域信號(hào)，也可以選擇前一幀的一部分和殘留信號(hào)的一部分作為分析幀的模板。本發(fā)明的優(yōu)點(diǎn)還在于對(duì)峰值檢測(cè)策略的改進(jìn)。因?yàn)殄e(cuò)誤隱藏是一種模糊重建的方法，所以并不需要非常精確的估計(jì)，所以使用簡(jiǎn)單的峰值檢測(cè)策略，即判斷當(dāng)前樣點(diǎn)值大于前后樣點(diǎn)。另外對(duì)于峰點(diǎn)相鄰的補(bǔ)償，即對(duì)相鄰峰值點(diǎn)的插值，由于DFT (Discrete Fourier Transforai 即離散傅里葉變換)的運(yùn)算精度是有限的，其頻率分辨率僅是F"AK其中《是采樣率，N是變換點(diǎn)數(shù))，所以并不能保證每個(gè)峰值點(diǎn)都是完全意義的正弦分量，而可能是正弦分量的一個(gè)近似。如果這時(shí)直接用 DFT的峰值點(diǎn)來(lái)表示正弦分量，由于其有限的精度，可能導(dǎo)致估計(jì)不準(zhǔn)確，僅用峰值點(diǎn)會(huì)造成相鄰峰值點(diǎn)的變化不連續(xù)，相當(dāng)于用一個(gè)矩形窗對(duì)峰值點(diǎn)進(jìn)行加權(quán)，這樣會(huì)造成時(shí)域的泄漏，所以考慮用一個(gè)更加平滑的窗函數(shù)，所以考慮在相鄰峰值點(diǎn)進(jìn)行插值，即除了保留峰值點(diǎn)之外，還保留峰值點(diǎn)附近的若干個(gè)樣點(diǎn)以保持頻譜的平滑，同時(shí)對(duì) 于峰值點(diǎn)附近的樣點(diǎn)做一定的幅值衰減。本發(fā)明的優(yōu)點(diǎn)還在于在進(jìn)行頻譜峰值檢測(cè)之后對(duì)分析模板的頻域相位進(jìn)行補(bǔ)償。相位的補(bǔ)償可以根據(jù)殘留幀的殘留相位來(lái)進(jìn)行，也可以直接對(duì)分析模板相位進(jìn)行補(bǔ)償。一種有效的相位補(bǔ)償策略是考慮離散傅立葉變換(DFT)的線性相位特性，可以根據(jù)分析模板序列和重建序列之間的偏移來(lái)做線性相位調(diào)整。本發(fā)明的優(yōu)點(diǎn)還在于對(duì)正弦模型的幅度、相位補(bǔ)償?shù)幕A(chǔ)上附加的能量補(bǔ)償。該補(bǔ)償針對(duì)峰值檢測(cè)后的能量，既要保證重建幀的能量不能太小，又不讓重建幀的能量過(guò)大，產(chǎn)生人耳可聞的噪聲。本發(fā)明的優(yōu)點(diǎn)還在于提供了一個(gè)減少錯(cuò)誤隱藏附加復(fù)雜度的方法。即如果當(dāng)前幀沒有錯(cuò)誤，而前一幀錯(cuò)誤，如果也按照?qǐng)D5用正弦模型進(jìn)行分析綜合，勢(shì)必造成解碼復(fù)雜度增加。因此本方法允許用前面已經(jīng)綜合出來(lái)的重建幀經(jīng)過(guò)一定的衰減作為當(dāng)前幀的綜合幀，這樣就降低了因?yàn)橐脲e(cuò)誤隱藏模塊而造成的復(fù)雜度增加。本發(fā)明的優(yōu)點(diǎn)還在于提供了適合各種延時(shí)條件的錯(cuò)誤隱藏方案，分析模板選擇的任意使得錯(cuò)誤隱藏方法可以不增加原有的編解碼系統(tǒng)的延時(shí)，也可以為了追求更高的重建音質(zhì)而增加系統(tǒng)的延時(shí)。這種算法重建音質(zhì)、算法延時(shí)與算法實(shí)現(xiàn)復(fù)雜度的可定制使得本算法適用于各類網(wǎng)絡(luò)條件。

圖1為音頻通信系統(tǒng)的方框連接示意圖；圖2為基于重疊相加變換的編解碼系統(tǒng)的丟幀錯(cuò)誤模式示意圖；圖3為基于變換編碼系統(tǒng)中使用正弦模型進(jìn)行音頻錯(cuò)誤隱藏方案示意圖；圖4為只有當(dāng)前幀錯(cuò)誤的SAS處理框圖；圖5為只有前一幀錯(cuò)誤的SAS處理框圖；圖6為正弦模型的分析窗位置示意圖；圖7為能量補(bǔ)償流程圖。
具體實(shí)施方式
參照?qǐng)Dl，表示音頻通信系統(tǒng)的方框連接關(guān)系示意圖，圖中表示出音頻錯(cuò)誤隱藏與糾錯(cuò)編碼以及信號(hào)重建的區(qū)別和聯(lián)系。參照2表示，基于重疊相加時(shí)頻變換的編解碼系統(tǒng)的丟幀錯(cuò)誤模式，圖中表示，如果發(fā)生一幀序列的丟失情況下，也會(huì)導(dǎo)致連續(xù)兩序列的丟失，參照?qǐng)D2可以看出，如果當(dāng)前的包含[&WxJ]編碼信息的幀數(shù)據(jù)丟失，則當(dāng)前幀只剩下實(shí)際時(shí)間序列的偶對(duì)稱部分^+x;}，而下一幀只剩下奇對(duì)稱部分^-<}。即當(dāng)前一幀數(shù)據(jù)的丟失會(huì)導(dǎo)致連續(xù)的兩幀錯(cuò)誤。在這種錯(cuò)誤模式下的處理方式，是把整個(gè)系統(tǒng)的重建按照前一幀和當(dāng)前幀的是否錯(cuò)誤分為四種情況(A)前幀和當(dāng)前幀都沒有錯(cuò)誤，(B)前一幀無(wú)誤、當(dāng)前幀錯(cuò)誤，(C)前一幀錯(cuò)誤、當(dāng) 前幀無(wú)誤，(D)前幀和當(dāng)前幀都發(fā)生錯(cuò)誤。參照?qǐng)D3及圖4，表示基于變換編碼系統(tǒng)中使用正弦模型進(jìn)行錯(cuò) 誤隱藏方案示意圖及只有當(dāng)前幀錯(cuò)誤的SAS處理框圖。參照?qǐng)D5表示只有前幀錯(cuò)誤SAS處理框圖，用正弦模型進(jìn)行分析綜合，表示可以用于簡(jiǎn)化算法的實(shí)現(xiàn)方式，即直接用前面己經(jīng)綜合出來(lái)的重建幀經(jīng)過(guò)一定的衰減作為當(dāng)前幀的綜合幀，減少了錯(cuò)誤隱藏算法實(shí)現(xiàn)的附加復(fù)雜度。參照?qǐng)D6為正弦模型的分析窗位置示意圖，設(shè)當(dāng)前幀為i幀，首先把殘留的當(dāng)前幀信息與前一幀的正確界面得到的時(shí)域信息連接，然后分析窗可以選擇在該段時(shí)域數(shù)據(jù)的任意位置(如圖6所示)，如把分析窗的中心放在第i幀殘留信息的起始。對(duì)于只有前一幀發(fā)生錯(cuò)誤的情況也類似，該部分的重建正弦模型的分析模板可以選擇在圖6中所列出的4幀時(shí)域序列的任意位置。另外對(duì)于窗函數(shù)，可以根據(jù)具體的編解碼系統(tǒng)來(lái)選擇，如AAC中使用正弦窗對(duì)分析模板加窗。參照?qǐng)D7為能量補(bǔ)償流程圖,由于峰值檢測(cè)，一些非峰值點(diǎn)直接歸零，導(dǎo)致信號(hào)能量下降，所以利用峰值檢測(cè)前后的信號(hào)能量求得一個(gè)補(bǔ)償因子，然后把該因子經(jīng)過(guò)一定的衰減，如衰減到原來(lái)的0.8，然后做一個(gè)限幅，以防止重建幀的能量過(guò)大。限幅值和衰減因子都可以調(diào)整。
權(quán)利要求
1.一種使用正弦模型進(jìn)行音頻錯(cuò)誤隱藏處理的方法，其特征在于，按如下步驟進(jìn)行操作(一)首先，把整個(gè)系統(tǒng)的重建按照前一幀和當(dāng)前幀的錯(cuò)誤分為并列的4種情況，A.前幀和當(dāng)前幀都沒有錯(cuò)誤，正確解碼返回；B.前幀無(wú)誤，當(dāng)前幀錯(cuò)誤，則用正弦模型對(duì)時(shí)域信號(hào)進(jìn)行分析綜合，得到綜合幀，把綜合幀的奇對(duì)稱部分和殘留的偶對(duì)稱部分相加作為重建幀；C.前幀錯(cuò)誤，當(dāng)前幀無(wú)誤，則可以用正弦模型對(duì)時(shí)域信號(hào)進(jìn)行分析綜合，再綜合幀的偶對(duì)稱部分和殘留奇對(duì)稱部分相加作為重建幀；D.前幀和當(dāng)前幀都錯(cuò)誤，則簡(jiǎn)單策略處理當(dāng)前幀；(二).然后，輸出上面得到的正確解碼結(jié)果或者錯(cuò)誤隱藏的時(shí)域重建。
2. 根據(jù)權(quán)利要求1所述的使用正弦模型進(jìn)行音頻錯(cuò)誤隱藏處理的方法，其特征在于，所述進(jìn)行分析綜合，是以輸入的時(shí)域信號(hào)為分析模板，通過(guò)對(duì)正弦模型的幅度、頻率、相位三個(gè)分量的調(diào)整綜合出重建時(shí)域信號(hào)，具體包括-通過(guò)相鄰峰值點(diǎn)的插值增強(qiáng)頻率分量的提取精度；根據(jù)時(shí)頻變換特性，對(duì)分析模板的相位做線性相位調(diào)整；進(jìn)行峰值檢測(cè)，根據(jù)檢測(cè)前后信號(hào)的能量對(duì)正弦分量的幅度做調(diào) 整；進(jìn)行峰值檢測(cè)后的能量補(bǔ)償。
3. 根據(jù)權(quán)利要求1或2所述的使用正弦模型進(jìn)行音頻錯(cuò)誤隱藏處理的方法，其特征在于，所述峰值檢測(cè)，是在相鄰峰值點(diǎn)間進(jìn)行插值，保留峰值點(diǎn)附近的若干個(gè)樣點(diǎn)以保持頻譜的平滑。
4. 根據(jù)權(quán)利要求1或2所述的使用正弦模型進(jìn)行音頻錯(cuò)誤隱藏處理的方法，其特征在于，所述線性相位調(diào)整，是根據(jù)分析模板和進(jìn)行錯(cuò)誤隱藏的丟失幀間的時(shí)間偏移做線性相位補(bǔ)償。
5. 根據(jù)權(quán)利要求1或2所述的使用正弦模型進(jìn)行音頻錯(cuò)誤隱藏處理的方法，其特征在于，所述能量補(bǔ)償，是根據(jù)峰值檢測(cè)后的能量變化計(jì)算補(bǔ)償因子，并經(jīng)過(guò)衰減和限幅，保證音頻幀間能量的連續(xù)性。
全文摘要
一種使用正弦模型進(jìn)行音頻錯(cuò)誤隱藏處理的方法，屬于網(wǎng)絡(luò)及通信領(lǐng)域。按如下步驟進(jìn)行操作一，整個(gè)系統(tǒng)的重建按照前一幀和當(dāng)前幀的錯(cuò)誤分為并列的4種情況，A.前幀和當(dāng)前幀都沒錯(cuò)，正確解碼返回；B.前幀無(wú)誤當(dāng)前幀錯(cuò)誤，對(duì)時(shí)域模型進(jìn)行分析綜合，把綜合幀的奇對(duì)稱部分和殘留的偶對(duì)稱部分相加作重建幀；C.前幀錯(cuò)誤當(dāng)前幀無(wú)誤，把模型分析得到的綜合幀的偶對(duì)稱部分和殘留奇對(duì)稱部分相加作重建幀；D.前幀和當(dāng)前幀都錯(cuò)，簡(jiǎn)單策略處理當(dāng)前幀；二，輸出上面得到的解碼結(jié)果或錯(cuò)誤隱藏的時(shí)域重建。該方法適合于各種丟幀率下的處理，對(duì)于中低丟幀率，連續(xù)幀丟失的概率較小，而對(duì)于中高丟幀率，使用簡(jiǎn)單的丟幀策略，不會(huì)造成更大的聽覺失真。
文檔編號(hào)G10L19/00GK101261833SQ200810056759
公開日2008年9月10日申請(qǐng)日期2008年1月24日優(yōu)先權(quán)日2008年1月24日
發(fā)明者歡侯, 竇維蓓申請(qǐng)人:清華大學(xué)

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：侯歡;竇維蓓
技術(shù)所有人：清華大學(xué)
我是此專利的發(fā)明人

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

1khz正弦波音頻下載相關(guān)技術(shù)

正弦波音頻文件相關(guān)技術(shù)

正弦波音頻相關(guān)技術(shù)

1khz正弦波音頻相關(guān)技術(shù)

正弦音頻相關(guān)技術(shù)

正弦波音頻信號(hào)發(fā)生器相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種使用正弦模型進(jìn)行音頻錯(cuò)誤隱藏處理的方法