專利名稱:使用線性預測濾波的前向時域混疊消除的制作方法
技術領域:
本公開涉及編碼和解碼音頻信號領域。更具體地,本公開涉及在編碼音頻信號中的時域混疊消除。
背景技術:
音頻編碼技術發(fā)展水平為了數(shù)據(jù)簡化,以一種有意義的方式,使用時頻分解來表示信號。更具體地,音頻編碼器使用變換以執(zhí)行將時域樣本到頻域系數(shù)的映射。用于這種時間-頻率映射的離散時間變換通常基于正弦函數(shù)內核,諸如離散傅里葉變換(DFT)和離散余弦變換(DCT)??梢燥@示的是,這樣的變換實現(xiàn)音頻信號的能量緊致(compaction)。能量緊致意味著,在變換(或頻率)域內,相比于在時域樣本中,能量分布被局部化在更少的重要(significant)頻域系數(shù)中。接著可以通過將自適應比特分配(adaptive bit allocation)以及適當?shù)牧炕┘佑陬l域系數(shù),而實現(xiàn)編碼增益。在接收端,表示量化和編碼的參數(shù)(包 括頻域系數(shù))的比特用以恢復量化的頻域系數(shù)(或其它量化數(shù)據(jù),諸如增益),并且逆變換產(chǎn)生時域音頻信號。這種編碼方案通常被稱為變換編碼。通過定義,變換編碼在輸入音頻信號樣本的連續(xù)塊(通常稱為“幀”)上操作。由于量化在每個音頻信號的合成塊中引入某些失真,使用非重疊塊可能在塊邊界處引入中斷,其可能降低音頻信號的質量。因此,在變換編碼中,為了避免中斷,在應用變換之前將音頻信號的編碼塊重疊,并且在重疊片段中適當開窗以允許從樣本的一個解碼塊平滑轉換(transition)到下一個。很遺憾,使用諸如DFT(或其快速等價的快速傅里葉變換(FFT))或DCT的變換并將其應用到樣本的重疊塊導致所謂的“非臨界(non-critical)采樣”。例如,采取典型的50%重疊的情況,編碼N個連續(xù)時域樣本的塊實際上要求對2N個連續(xù)樣本進行變換,2N個連續(xù)樣本包括N個來自當前塊的樣本和N個來自前一個塊和下一個塊的重疊部分的樣本。因此,對于每N個時域樣本的塊,編碼2N個頻域系數(shù)。頻域中的臨界(critical)采樣意味著N個輸入時域樣本僅產(chǎn)生N個頻域系數(shù)以進行量化和編碼。已經(jīng)設計了專門的變換以允許使用重疊窗口并且在變換域中仍然保持臨界采樣。用這種專門的變換,變換輸入的2N個時域樣本導致變換輸出的N個頻域系數(shù)。為了實現(xiàn)這點,首先通過特殊的時間反演(time inversion)、在窗口的一端為2N個樣本長加窗(windowed)信號的特定部分進行求和、以及在窗口的另一端2N個樣本長加窗信號的特定部分彼此相減,將2N個時域樣本的塊減少為N個時域樣本的塊。這些特殊的時間反演、求和和減法引入所謂的“時域混疊(time-domain aliasing, TDA)”。一旦將TDA引入音頻信號樣本的塊中,將不能僅使用該塊將其移除。是作為大小為N (而不是2N)的變換的輸入的這個時域混疊的信號產(chǎn)生N個變換的頻域系數(shù)。為了恢復N個時域樣本,在稱為“時域混疊消除(TDAC)”的過程中,逆變換使用來自兩個連續(xù)并重疊的幀或塊的變換系數(shù),以抵消TDA。被廣泛使用于音頻編碼中的這樣的應用TDAC的變換的示例是改進的離散余弦變換(MDCT)。實際上,MDCT引入TDA而沒有時域中的顯式(explicit)折疊。實際上,當考慮樣本的單個塊的直接(direct)MDCT和逆MDCT (MDCT)這二者時,會引入時域混疊。這來自于MDCT的數(shù)學構造并且為本領域普通技術人員眾所周知。然而還已知的是,該隱式(implicit)時域混疊可視為等同于時域樣本的第一個反向部分并且將這個反向部分加上(或減去)信號的其它部分。這稱為“折疊”。當音頻編碼器在一個使用TDAC而另一個不使用TDAC的兩種編碼模式之間切換時,會產(chǎn)生問題。例如,假設編解碼器(codec)從TDAC編碼模式切換到非TDAC編碼模式。使用TDAC編碼模式編碼的樣本塊的一側(其對不使用TDAC編碼的塊是公用的)包含TDA,其不能用使用非TDAC編碼模式編碼的樣本塊抵消。第一種解決方案是丟棄包含不能被抵消的混疊的樣本。該第一種解決方案導致傳輸帶寬的低效使用,這是因為TDA不能被抵消的樣本塊被編碼兩次,一次是由基于TDAC的編解碼器編碼,第二次是由基于非TDAC的編解碼器編碼。第二種解決方案是使用特殊設計的窗口,當應用時間反演和求和/減法過程時, 在窗口的至少一個部分中不引入TDA。圖I是在其左側引入TDA而沒有在其右側引入TDA的2N個樣本窗口的不例的不意圖。圖I的窗口 100對于從基于TDAC的編解碼器轉換到基于非TDAC的編解碼器是有用的。窗口 100的前半部分被成形(shape),從而它引入TDA 110,如果前一個窗口也使用具有重疊的TDA,則TDA 110可以被消除。然而,圖I中的窗口 100右側,在3N/2位置上的折疊點之后具有零值區(qū)域120。因此當在3N/2位置上的折疊點周圍執(zhí)行時間反演和求和/減法(或折疊)過程時,窗口 100的這個區(qū)域120不引入任何TDA。如圖I所示,窗口 100包含平坦區(qū)域130,之前為左側錐形區(qū)域140。錐形區(qū)域140的目的是當計算變換時提供良好的光譜分辨率以及在相鄰塊之間的重疊和相加操作期間平滑轉換。增加窗口 100的平坦區(qū)域130的持續(xù)時間會減少信息的開銷。然而,由于區(qū)域120中僅傳達零值樣本信息,所以區(qū)域120會降低窗口 100光譜性能。因此,例如在多模動態(tài)圖象專家組(Moving Pictures Expert Group, MPEG)聯(lián)合語音音頻編解碼器(Unified Speech and Audio Codec, USAC)中,需要有用的改善的TDAC技術,以管理在使用矩形非重疊窗口的幀和使用非矩形重疊的窗口的幀之間的轉換,同時確保適當?shù)墓庾V分辨率、數(shù)據(jù)開銷減少并且在這些不同的幀類型之間的轉換的平滑。
發(fā)明內容
因此,需要用于支持編碼模式之間的切換的混疊消除技術,其中所述技術在這些模式之間的切換點上補償混疊效應。因此,根據(jù)第一個方面,提供了一種用于產(chǎn)生前向混疊消除(forward aliasingcancellation, FAC)參數(shù)的方法,所述FAC參數(shù)用于消除由在具有重疊窗口的使用第一編碼模式的第一變換編碼幀和具有非重疊窗口的使用第二編碼模式的第二幀之間的轉換對在所述第一變換編碼幀中的編碼音頻信號造成的時域混疊,包括計算表示編碼前的第一幀的音頻信號和第一變換編碼幀的編碼音頻信號的合成之間的差的FAC目標;以及加權所述FAC目標以產(chǎn)生所述FAC參數(shù)。根據(jù)第二個方面,提供了一種用于前向消除時域混疊的方法,所述時域混疊是由在具有重疊窗口的使用第一編碼模式的第一變換編碼幀和具有非重疊窗口的使用第二編碼模式的第二幀之間的轉換對在所述第一變換編碼幀中的編碼音頻信號造成的時域混疊,所述方法包括接收加權的前向混疊消除(FAC)參數(shù);逆加權所述加權的FAC參數(shù),以產(chǎn)生FAC合成;以及基于所述第一幀中的編碼音頻信號的合成,使用所述FAC合成從所述音頻信號合成中消除所述時域混疊。根據(jù)第三個方面,提供了用于產(chǎn)生前向混疊消除(FAC)參數(shù)的設備,用于消除由在具有重疊窗口的使用第一編碼模式的第一變換編碼幀和具有非重疊窗口的使用第二編碼模式的第二幀之間的轉換對在所述第一變換編碼幀中的編碼音頻信號造成的時域混疊,包括FAC目標計算器,該FAC目標表示編碼前的第一幀的音頻信號和第一變換編碼幀的編碼音頻信號的合成之間的差;以及加權濾波器,提供有所述FAC目標,以產(chǎn)生所述FAC參數(shù)。根據(jù)第四個方面,提供了一種音頻信號編碼器,包括使用具有重疊窗口的幀以第一變換編碼模式對所述音頻信號編碼的第一編碼器;使用具有非重疊窗口的幀以第二編碼模式對所述音頻信號編碼的編碼器;以及如上文所述的用于產(chǎn)生FAC參數(shù)的設備,所述FAC 參數(shù)用于消除由在具有重疊窗口的使用第一編碼模式的第一幀和具有非重疊窗口的使用第二編碼模式的第二巾貞之間的轉換對在所述具有重疊窗口的第一巾貞中以第一編碼模式編碼的音頻信號造成的時域混疊。根據(jù)第五個方面,提供了一種用于前向消除時域混疊的設備,所述時域混疊是由在具有重疊窗口的使用第一編碼模式的第一變換編碼幀和具有非重疊窗口的使用第二編碼模式的第二幀之間的轉換對在所述第一變換編碼幀中的編碼音頻信號造成的時域混疊,所述設備包括用于接收加權的前向混疊消除(FAC)參數(shù)的輸入器;逆加權濾波器,提供有所述加權的FAC參數(shù),以產(chǎn)生FAC合成;以及響應于所述FAC合成對所述編碼音頻信號解碼以產(chǎn)生第一幀中消除了時域混疊的音頻信號合成的解碼器。根據(jù)第六個方面,提供了一種音頻信號解碼器,包括對使用具有重疊窗口的幀以第一變換編碼模式編碼的音頻信號解碼的第一解碼器;對使用具有非重疊窗口的幀以第二編碼模式編碼的音頻信號解碼的第二解碼器;以及如上文所述的設備,用于前向消除由在具有重疊窗口的使用第一編碼模式的第一幀和具有非重疊窗口的使用第二編碼模式的第二幀之間的轉換對在所述具有重疊窗口的幀中以第一編碼模式編碼的音頻信號造成的時域混疊。前述的和其它特性將在閱讀以下為了僅參考附圖的示例而給出的用于前向取消時域混疊的設備和方法的說明實施例的非限定性描述時,將會更加顯而易見。
在附圖中圖I是在其左側而不在其右側引入TDA的窗口的示例的示意圖;圖2是從使用非重疊矩形窗口的幀轉換到使用重疊窗口的幀的示例的示意圖;圖3是示出折疊和應用于圖2的圖的TDA的示意圖;圖4是計算FAC目標(target)的示例性方法的操作順序的示意圖;圖5是示出圖4的FAC目標的量化的示意框圖;圖6是使用代表圖4的FAC目標的FAC參數(shù)、計算音頻信號的合成的說明性方法的操作順序的示意圖;圖7是用于前向消除在比特流中接收的編碼音頻信號中的時域混疊的設備的非限制性示例的示意框圖;以及圖8是用于在傳輸?shù)浇獯a器的編碼音頻信號中的前向時域混疊消除的設備的非限制性示例的框圖。
具體實施例方式以下公開針對當在連續(xù)幀中使用重疊和非重疊窗口二者編碼音頻信號時,消除時域混疊和非矩形開窗效應的問題。使用此處所述的技術,可以避免特殊的非最優(yōu)窗口的使用,同時仍然允許對使用矩形非重疊窗口和非矩形重疊窗口這二者的編碼模式之間的幀轉換的適當管理。線性預測(LinearPredictive, LP)編碼(例如,ACELP (Algebraic Code-ExcitedLinear Predication,代數(shù)碼本激勵線性預測)編碼)是其中使用矩形、非重疊開窗(windowing)來對幀編碼的編碼模式的示例。另外,使用非矩形、重疊開窗的編碼模式的示例是在MPEG聯(lián)合語音音頻編解碼器(USAC)中應用的變換碼激勵(Transform Coded excitation, TCX)編碼。使用非矩形、重疊開窗的編碼模式的另一個示例是USAC的FD模式中的感知變換編碼,其中也使用MDCT作為變換并且感知模式用以將比特動態(tài)分配到變換系數(shù)。在USAC中,TCX巾貞使用重疊窗口和改進的離散余弦變換(Modified Discrete CosineTransform, MDCT),這引入時域混疊(TDA)。USAC也是連續(xù)幀可以使用矩形、非重疊窗口(諸如在ACELP幀中)或者非矩形、重疊窗口(諸如在TCX幀中)進行編碼的典型示例。不失一般性,本公開因而考慮USAC的特定示例以示出前向消除時域混疊的設備和方法的益處。本公開針對兩種不同情況。第一種情況與從使用矩形非重疊窗口的幀轉換到使用非矩形重疊窗口的幀有關。第二種情況與從使用非矩形重疊窗口的幀轉換到使用矩形非重疊窗口的幀有關。為了說明而非限制的目的,使用矩形非重疊窗口的幀可以使用ACELP編碼模式編碼,并且使用非矩形重疊窗口的幀可以使用TCX編碼模式編碼。此外,可以將特定持續(xù)時間用于某些幀,例如,對于TCX幀為20毫秒,記為TCX20。然而,應該記住的是,這些示例僅用于說明的目的,并且可以設想其它幀長度和除ACELP和TCX以外的編碼模式。現(xiàn)在將采取結合圖2的以下詳細描述,陳述從具有矩形非重疊窗口的幀轉換到具有非矩形重疊窗口的幀的情況,圖2是從使用非重疊矩形窗口的幀轉換到使用重疊窗口的中貞的示例的示意圖。更具體地,圖2示出使用矩形非重疊窗口 202的ACELP幀201的示例和使用非矩形重疊窗口 204的TCX20幀203的示例。TCX20是指USAC中的短TCX幀,其額定(nominally)具有20ms持續(xù)時間,如許多應用中的ACELP幀一樣。圖2顯示在每幀中使用哪些樣本,以及在編碼器處如何對它們開窗。在解碼器應用同樣的窗口 204,使得解碼器處見到的組合效果是圖2中所示的窗口形狀的平方(square)。當然,這種雙開窗(doule windowing),—次在編碼器處以及第二次在解碼器處在變換編碼中很典型。選擇圖2中示出的用于TCX20幀203的非矩形窗口 204,使得如果前一巾貞和下一巾貞也使用重疊非矩形的窗口,那么窗口 204的重疊部分204a和204d在解碼器處的第二次開窗之后是互補的,并且允許恢復在窗口的重疊區(qū)域中的“非開窗”信號。為了以高效方式編碼圖2的TCX20幀203,典型地,對于這個TCX20幀203的開窗的樣本應用時域混疊(TDA)。更具體地,窗口 204的左部204a和右部204d被折疊并組合。圖3是示出折疊并應用到圖2的圖的TDA的示意圖。在圖3中,示出圖2的非矩形窗口 204被四等分。以虛線示出第一和第四個1/4,即窗口 204的204a和204d,因為它們與以實線示出的第二和第三個1/4 204b、204c相組合。第一和第四個1/4 204a、204d與第二和第三個l/4204b、204c的組合如下使用與在MDCT編碼中使用的處理類似的處理。將第一個1/4204a時間反轉,接著將它與窗口的第二個1/4 204b 一個樣本一個樣本地對齊,并且最終從窗口 203的第二個1/4 204b中減去時間反轉和移動的第一個1/4 204e。類似地,將窗口的第四個1/4 204d時間反轉并移動,以形成與窗口 204的第三個1/4 204c對齊的時間反轉和移動的1/4 204f,并且最終與窗口的第三個1/4 204c相加。如果圖2中示出的TCX20窗口 204具有2N個樣本,那么在該處理結束時獲得從圖3的TCX20幀206的開始到結束精確延伸的N個樣本。接著這N個樣本形成適當變換的輸入,以供變換域中的高效編碼。使用圖3中描繪的特定時域混疊,MDCT可以是用于這個目的的變換。在圖3中所述的窗口的時間反轉和移動的部分的組合之后,不再有可能恢復TCX20幀中的原始時域樣本,因為它們與TCX20幀外部的樣本的時間反轉的版本混合了。在基于MDCT的音頻編碼器諸如MPEG AAC中,其中所有幀都使用同樣的變換和重疊窗口編碼,、能夠消除該時域混疊,并且通過使用兩個連續(xù)重疊的幀能夠恢復音頻樣本。然而,當連續(xù)幀沒有使用相同的開窗和重疊處理時,如圖2中的TCX20幀(非矩形重疊窗口)之前是ACELP幀(矩形非重疊窗口),非矩形窗口效應和時域混疊不能僅使用來自前一 ACELP幀和下一 TCX20幀的信息而消除。上文中介紹了管理這種類型的轉換的技術。本公開提出管理這些轉換的替代方法。該方法沒有使用其中使用基于MDCT的變換域編碼的幀中的非最優(yōu)、非對稱窗口。代替地,此處引入的設備和方法允許使用居中位于編碼幀的中央的對稱窗口,諸如例如圖3的TCX20幀,并且有50%與也使用非矩形窗口的MDCT編碼的幀重疊。此處引入的設備和方法因此提出從編碼器到解碼器發(fā)送校正信息,作為比特流中的附加信息,該校正信息用于消除當從以矩形非重疊窗口編碼的幀切換到以非矩形重疊窗口編碼的幀時的開窗效應和時域混疊,反之亦然。在圖2中,為ACELP幀顯示矩形非重疊開窗,而為TCX20幀顯示非矩形重疊開窗。使用圖3中引入的TDA,首先接收來自ACELP幀的比特的解碼器具有充足的信息來完全解碼該ACELP幀直至其最后一個樣本。然而接著,接收來自TCX20幀的比特,適當?shù)亟獯aTCX20幀的所有樣本被由前面的ACELP幀的存在導致的時間混疊效應損害。如果下一個幀也使用重疊窗口,那么在所示TCX20幀的后半部分中,能夠消除在編碼器處引入的非矩形開窗和TDA,并且樣本可以被合適地解碼。因而情況是在圖3的TCX20幀的前半部分中,在該前半部分中從第二個1/4 204b中減去時間反轉和移動的第一個1/4 204e,由于前一ACELP幀使用矩形非重疊窗口,所以在編碼器引入的非矩形窗口效應和TDA不能被消除。此處引入的設備和方法提出發(fā)送前向混疊消除(Forward AliasingCancellation, FAC)參數(shù)形式的附加信息,用于消除這些效應以及用于合適地恢復TCX幀。一個特別感興趣的實施例使用頻域噪聲整形(Frequency-Domain NoiseShaping, FDNS)以對在諸如TCX幀的變換編碼的幀中的量化噪聲進行整形,該頻域噪聲整形(FDNS)例如如在題為“用于TDAC變換的同時時域和頻域噪聲整形(SIMULTANEOUSTIME-DOMAIN AND FREQUENCY-DOMAIN NOISE SHAPING FOR TDAC TRANSFORMS)” 的 2010 年10月15日提交的PCT申請NO.PCT/CA2010/001649中所介紹的。在該實施例中,可以在原始信號域諸如未對其應用加權的音頻信號中直接應用FAC校正。在多模式切換編解碼器諸如USAC中,這意味著在涉及變換的所有編碼模式中,例如使用MDCT,在變換域中執(zhí)行量化噪聲整形。具體地,在TCX幀中使用FDNS,(如在感知變換編碼模式中)直接對原始信號而不是對加權余量(weighted residual)應用變換(MDCT)加權余量。FDNS以在TCX幀中獲得噪聲整形的方式操作,,這基本等價于使用時域感知加權濾波器,但僅在變換(MDCT)系數(shù)上操作。接著可以利用下文描述的過程應用FAC校正。此處使用USAC音頻編解碼器作為編解碼器的非限制性示例。對于USAC編解碼器提出如下三種編碼模式編碼模式I :原始音頻信號的感知變換編碼;編碼模式2 =LPC濾波器的加權余量的變換編碼;編碼模式3 =ACELP編碼。 在編碼模式I中,通過應用從感知(perceptual)模型導出的比例因子(scalefactor),在變換域中已經(jīng)完成量化噪聲整形,如音頻編碼領域的技術人員所熟知的。然而,在編碼模式2中,通常使用從為當前幀計算的線性預測編碼(LPC)濾波器導出的感知(或加權)濾波器W(Z)在時域中應用量化噪聲整形。在這個時域濾波之后應用變換,例如DTC變換,以獲得要被量化并編碼為FAC目標的FAC參數(shù)。這禁止直接使用MDCT MDCT的時域混疊消除(TDAC)特性連接(join)以模式I和2編碼的連續(xù)幀,因為對于編碼模式I和2,不在同一個域中應用MDCT。所以,在用于前向取消時域混疊的設備和方法的實施例中,通過使用PCT申請No. PCT/CA2010/001649的FDNS處理的頻域濾波而不是時域濾波,進行用于編碼模式2的量化噪聲整形。因此,對原始音頻信號,而不是該音頻信號在濾波器W(Z)輸出的加權版本應用變換,該變換例如在USAC的情況下是MDCT。這確保了編碼模式I和編碼模式2之間的一致性,并允許使用MDCT的TDAC特性連接模式I和2編碼的連續(xù)幀。然而,當處理從ACELP模式的轉換和到ACELP模式的轉換時,在編碼模式2的變換域中應用量化噪聲整形使用特殊處理。圖4是計算FAC目標的示例性方法的操作順序的示意圖。示出編碼器處的處理,此時以模式2編碼的幀402之前是以模式3編碼的幀404并且之后是以模式3編碼的幀406,其中僅為說明的目的而將ACELP用作模式3的示例。圖4示出時域標記(marker)諸如408和幀邊界。具體地,特別以垂直虛線標記LPCl和LPC2標識的幀邊界顯示幀402的開始和結束,其中幀402以模式2編碼。標記LPCl和LPC2還指示分析窗口的中心以計算兩個LPC濾波器在幀402開始處(其也對應于窗口的左折疊點)計算的第一 LPC濾波器和在同一個幀402結束處(其也對應于窗口的右折疊點)計算的第二 LPC濾波器。圖4中有四條線。每條線表示在編碼器的處理中的操作。如圖所示,圖4的線1-4是彼此時間對齊的。圖4的線I表示原始音頻信號410,按由標記LPCl和LPC2界定的幀而被分段。因此,在標記LPCl左邊,以模式3編碼原始音頻信號。在標記LPCl和LPC2之間,以模式2編碼原始音頻信號,其中使用例如如PCT申請No. PCT/CA2010/001649中的FDNS處理直接在變換域中而不是在時域中應用量化噪聲整形。在標記LPC2右邊,再次以編碼模式3編碼原始音頻信號。選擇這個涉及模式3中的ACELP、接著模式2中的TCX、接著再次模式3中的ACELP的編碼模式順序,以示出關于從模式3到模式2的轉換和從模式2到模式3的轉換二者的處理。在多模編解碼器中,當然也有可能使用其它模式順序。顯然,本公開不限定于圖4的示例中選擇的特定模式順序。圖4的線2對應于每幀中解碼的合成信號412、414、416。在標記LPCl左邊是以模式3編碼的幀404的合成信號414。因此,合成信號414被標識為ACELP合成信號。ACELP合成信號414和幀404中的原始信號原則上有高相似性,這是因為ACELP編碼模式試圖盡可能準確地編碼并合成音頻信號。接著,在圖4的線2上的標記LPCl和LPC2之間的幀402表示作為對對應幀應用逆MDCT (IMDCT)的輸出而獲得的合成信號412。圖4描述了其中在變換域中完成變換編碼(TC)幀402中的量化噪聲整形的實施例。這可以例如通過使用來自如上文中所說明的在幀邊界或標記LPCl和LPC2處計算的上述第一和第二 LPC濾波器的光譜信息來濾波MDCT系數(shù)而實現(xiàn)。并且,合成信號412在幀402的開始和結束處包含開窗效應和時域混疊或折疊效應。該折疊效應由分別來自幀404和406的開窗、折疊的ACELP合 成部分418和420形成。開窗、折疊的ACELP合成部分418和420形成變換編碼誤差信號的兩個部分。合成信號412的從幀402的開始到結束延伸的上面曲線顯示合成信號412中的開窗效應,其在幀402的中間(而不是在開始和結束部分)是相對平坦的。折疊效應由分別在幀402的開始和結束處的下面的開窗、折疊的ACELP合成部分418和420而示出。與在幀402開始處的開窗、折疊的ACELP合成部分418相關聯(lián)的符號指示從合成信號412減去該開窗、折疊的ACELP合成部分418,而與在幀402結束處的開窗、折疊的ACELP合成部分420相關聯(lián)的“ + ”符號(sign)指示向合成信號412加上開窗、折疊的ACELP合成部分420。這個開窗效應和時域混疊或折疊效應是MDCT固有的。如在上文中所說明的,當使用MDCT編碼連續(xù)幀時,可以消除該變換編碼誤差信號。然而,在MDCT編碼的幀之前和/或之后不是另一個MDCT編碼的幀的情況下,這個開窗效應和時域混疊或折疊效應不會被消除并且在MDCT之后保留在時域信號中。那么可以使用FAC來校正這些效應。最終,圖4中標記LPC2之后的幀406也使用例如ACELP,以模式3編碼。為了獲得在這個幀406中的合成信號416,以下文中所述的方式,設置幀406的開始處的長期和短期預測器(predictor)的存儲器中的濾波器狀態(tài),濾波器狀態(tài)意味著在標記LPCl和LPC2之間的前一幀402結束處的開窗和時域混疊或折疊效應通過FAC的應用而消除了??偨Y起來,圖4中的線2包含來自連續(xù)幀404、402、406的合成信號414、412、416,包括標記LPCl和LPC2之間的幀402中的MDCT輸出處的由窗口和時域混疊所造成的變換編碼誤差信號部分418、420。接著,可以使用示例性ACELP編碼的細節(jié)來至少部分緩解在合成信號412的開始處包括的變換編碼誤差信號。在圖4的線3上顯示用于減少變換編碼誤差信號的能量中使用的預測。該預測基于最終ACELP合成輸出的估算,假設在幀402開始處使用了 ACELP的話。該預測基于緊接在LPCl標記之前和之后的原始音頻信號410的預期的自相似性,并且可以如下獲得在線3的標記LPCl和LPC2之間的幀402的開始處,可以放置來自緊接在標記LPCl的左邊的ACELP合成濾波器狀態(tài)的兩個影響成分(contribution)。第一個影響成分422包含幀404的最后(Iast)ACELP合成樣本的開窗、時間反轉或折疊的版本。這個時間反轉的信號422的窗口長度和形狀與線2上解碼的變換編碼(Transform Coding, TC)幀402左側的開窗、折疊的ACELP合成部分418相同。這個組分422給出在線2的TC幀中存在的時域混疊的良好近似。第二個影響成分424包括緊接在標記LPCl的左側的ACELP合成濾波器的開窗的零輸入響應(zero-input response, ZIR),該ACELP合成濾波器的初始狀態(tài)取在ACELP合成幀404的結束處的該濾波器的最終狀態(tài)。該第二影響成分424的窗口長度和形狀取為在變換編碼的幀(在USAC的示例性情況下為MDCT)中使用的變換窗口的平方(square)的補充。接著,在可選地將這兩個預測影響成分(開窗、折疊的ACELP合成422以及開窗的ACELP ZIR 424)放置在線3上之后,通過使用加法器426和427從線I中減去線2和線3而獲得線4。應該指出的是,在這個操作期間計算的差在標記LPC2處。在線4上顯示變換編碼誤差信號的預期的時域包絡線(envelope)的近似視圖。預期ACELP幀404中的ACELP編碼誤差430的時域包絡線在幅度上是近似平坦的,假若在這段期間內編碼的信號是靜止的話。接著,預期標記LPCl和LPC2之間的TC幀402中的變換編碼誤差的時域包絡線展現(xiàn)出線4上的這個幀中所示的一般形狀。變換編碼誤差的時域包絡線的這個期望的形狀僅為說明的目的而在此示出,并且可以根據(jù)在標記LPCl和LPC2之間的TC幀中編碼的信號而變 化。變換編碼誤差的時域包絡線的這個圖解說明預期變換編碼誤差在標記LPCl和LPC2之間的TC幀402的開始和結束附近是相對較大的。在幀402的開始處,其中示出第一 FAC目標部分432,使用線3上所示的兩個ACELP預測影響成分422、424減小變換編碼誤差。這個減小并未出現(xiàn)在TC幀402的結束處,其中顯示第二個FAC目標部分434。在第二個FAC目標部分434中,窗口和時域混疊效應不能使用來自在標記LPC2之后開始的下一個幀的合成減小,這是因為TC幀402需要在下一個幀能夠被解碼之前而被解碼。當解碼器僅使用線2的合成信號414、412、416以產(chǎn)生解碼的音頻信號時,量化噪聲可以典型地如圖4的線4上所示的誤差信號的預期包絡線。這個誤差源于為MDCT/MDCT對(pair)固有的開窗和時域混疊效應。通過加上來自前一 ACELP幀404的前述兩個影響成分而在TC幀402的開始處減小了開窗和時域混疊效應,但是當TC用作唯一編碼模式時,不能像在MDCT的實際TDAC操作中一樣完全消除開窗和時域混疊效應。此外,在圖4的線4上的TC幀右邊,就在標記LPC2之前,來自MDCT/MDCT對的所有窗口和時域混疊效應都保留。在TC幀402的開始和結束處的、線4的編碼誤差信號的高幅度部分432和434構成FAC目標的兩部分,其為FAC校正的對象。因此理解到用于FAC糾正的參數(shù)將會被發(fā)送到解碼器以補償這個編碼誤差信號,其影響TC幀402的開始和結束。以下述方式消除開窗和混疊效應,該方式經(jīng)量化噪聲維持在與ACELP幀的水平類似的適當水平上,,并且避免在TC幀402和諸如404和406的以其它模式編碼的幀之間的邊界處的中斷??梢栽陬l域中使用FAC而消除這些開窗和混疊效應。這將通過使用在LPCl和LPC2邊界處計算的第一和第二個LPC濾波器導出的信息來濾波MDCT系數(shù)而實現(xiàn),盡管也可以使用其它頻域噪聲整形(FDNS)。為了有效補償在圖4的線4上的TC幀402的開始和結束處的開窗和時域混疊效應,在圖4中所述的處理之后應用FAC。圖5是顯示圖4的FAC目標的量化的框圖。在例如在PCT申請No. PCT/CA2010/001649中的FDNS處理的情況下,如圖5中所示的量化特別令人感興趣。FAC使用在幀邊界處的LPC在加權域中量化變換編碼誤差。由量化導致的潛在不連續(xù)性通過逆濾波而隱藏(mask)。為標記LPCl周圍的TC幀402的左部和標記LPC2周圍的TC幀402的右部描述該處理。如上文中所述,圖4的TC幀402之前是在標記LPCl邊界處的ACELP幀404,并且之后是在標記LPC2邊界處的ACELP幀406。為了補償標記LPCl周圍的開窗和時域混疊效應,處理可以是如圖5頂部所描述的處理。首先,在FDNS的情況下,可以從在幀邊界LPCl處計算的第一LPC濾波器、或者從使用在幀邊界LPCl處計算的第一 LPC濾波器和在幀邊界LPC2處計算的第二 LPC濾波器二者的插值(interpolated)LPC濾波器,而計算加權濾波器W1 (z) 501。通過加權濾波器W1 (z) 501濾波來自圖4的線4上的TC幀402的開始處的第一 FAC目標部分432。加權濾波器W1 (z) 501已經(jīng)具有由圖4的線4上所示的ACELP誤差430構成的初始狀態(tài)或濾波器存儲器。接著,圖5的濾波器W1 (z)的輸出形成變換(例如DCT 502)的輸入。來自DCT 502的變換系數(shù)接著在量化器Q 503中被量化,并且還可以在量化器Q 503中被編碼。接著將這些編碼的系數(shù)作為FAC參數(shù)發(fā)送到解碼器。FAC參數(shù)包括量化的DCT系數(shù),該DCT系數(shù)接著在解碼器處變成逆變換(例如IDCT 504)的輸入,用以形成時域信號。接著可以通過具有零初始狀態(tài)的逆濾波器1/^(2)505濾波這個時域信號。通過逆濾波器1/^(2)505的濾波使用對于在第一個FAC目標部分之后延伸的樣本的零輸入而經(jīng)過第一個FAC目標部分432的長度而延 伸。逆濾波器Ι/Wjz)的輸出是第一 FAC合成部分506,其為現(xiàn)在可以在TC幀402的開始處應用的校正信號,以補償窗口和時域混疊效應?,F(xiàn)在,轉向對于在標記LPC2之前的TC幀402結束處的開窗和時域混疊校正的處理,考慮圖5的底部部分。在圖4的線4上的TC幀402結束處的第二個FAC目標部分434可以通過從在幀邊界LPC2處計算的第二個LPC濾波器、或者使用在幀邊界LPCl處計算的第一個LPC濾波器和在幀邊界LPC2處計算的第二個LPC濾波器二者的插值LPC濾波器而計算的加權濾波器W2 (z) 501來濾波。在幀邊界LPC2處計算的第二個LPC濾波器具有由圖4的線4上的TC幀中的變換編碼誤差形成的初始狀態(tài)或濾波器存儲器。接著,除了使用加權濾波器W2 (z)而不是加權濾波器W1 (z)之外,所有進一步的處理操作與關于在TC幀402的開始處的FAC目標的處理的圖5的頂部所示相同(見DCT 508、量化器Q 509、IDCT 510、以及逆加權濾波器1/W2(z)511),從而提供了第二 FAC合成部分512。當在編碼器處應用時,執(zhí)行圖5的整個處理,從而獲得本地FAC合成。在解碼器處,僅在從編碼器的量化器Q 503或509接收的FAC參數(shù)作為IDCT中的輸入的點起才應用圖5的處理。圖6是使用代表圖4的FAC目標的FAC參數(shù),計算原始音頻信號的合成的示例型方法的操作順序的示意圖。使用FAC在原始域中進行合成的計算。LPC的使用允許在FDNS的情境下使用FAC,F(xiàn)DNS是如例如在題為“用于TDAC變換的同時時域和頻域噪聲整形(SMULTANEOUS TIME-DOMAIN AND FREQUENCY-DOMAIN NOISE SHAPING FOR TDACTRANSFORMS)”的 2010 年 10 月 15 日提交的 PCT 申請 No. PCT/CA2010/001649 中所述的。通過逆濾波隱藏可能的中斷,如使用LPC在TCX的情境中所做的。圖6顯示如何通過使用圖5中所示的FAC合成以及應用圖4的操作的逆而獲得完整的合成信號604、602、606。在圖6中,直到標記LPC1,已經(jīng)合成了在標記LPCl左邊的ACELP幀404,顯示為線B上的ACELP合成604。標記LPC2之后的幀406也是ACELP幀。接著,為了產(chǎn)生在標記LPCl和LPC2之間的TC幀402中的合成信號602,執(zhí)行以下步驟接收的MDCT編碼的TC幀402通過MDCT被解碼,產(chǎn)生標記LPCl和LPC2之間的作為結果的時域信號608,如圖6的線B上所示。這個解碼的TC幀402包含開窗和時域混疊效應610、612。如圖5中的FAC合成信號506、512位于TC幀402的開始和結束處。更具體地,接收的FAC參數(shù)被解碼,如果適用,則例如使用IDCT (504、510)進行逆變換,并使用濾波器I/W1(Z)SOS對其濾波以產(chǎn)生第一部分506、以及使用濾波器1/W2(z)511對其濾波以產(chǎn)生第二部分512。這產(chǎn)生圖5中示出的兩個FAC合成部分506、512。第一 FAC合成部分506位于線A上的TC幀402的開始處,而第二 FAC 合成部分512位于線A上的TC幀402的結束處。來自TC幀402之前的ACELP幀404的開窗、折疊(時間反轉)的ACELP合成618和ACELP合成濾波器的ZIR 620位于TC幀402的開始處。這在線C上示出。通過加法器622和624將線A、B和C相加,以形成線D上的原始域中的TC幀的合成信號602。這個處理已經(jīng)在TC幀402中產(chǎn)生合成信號602,其中時域混疊和窗口效應已經(jīng)在幀402的開始和結束處被消除,并且標記LPCl周圍的幀邊界處的潛在中斷通過圖5的濾波器IVW1 (Z) 505和1/W2(z)511已經(jīng)進一步平滑和感知地(perceptually)隱藏了。當然,從線A到C的信號相加可以以任何順序執(zhí)行,而不改變所述處理的結果。也可以將FAC直接應用于在解碼器處的沒有任何窗口的TC幀的合成輸出。在這種情況下,考慮解碼的TC幀402的不同開窗(或沒有開窗)而調整FAC的形狀??梢栽诰幋a期間改變FAC幀的長度。例如,取決于信號的性質,示例性幀長度可以是64或128個樣本。例如,在無聲信號的情況下,可以使用較短的FAC幀??梢允褂美鏘比特指示器或標志(flag),將關于FAC幀長度的信息發(fā)信號到解碼器,以指示64或128個樣本的幀。包括將FAC長度發(fā)信號的傳輸順序的示例包括下列套件(suite)-具有重疊的TC(256比特)-FAC+將FAC長度發(fā)信號(128比特)-ACELP-FAC+將FAC長度發(fā)信號(64比特)-具有重疊的TC(128比特)此外可以發(fā)送發(fā)信號的信息,以指示將由解碼器執(zhí)行的某些處理功能。一個示例是特定于ACELP幀的后處理的激活的信號發(fā)送。后處理可以在由幾個連續(xù)ACELP幀組成的某個時段打開或關閉。在從TC到ACELP的轉換中,I比特標志可以被包含于FAC信息中,以對后處理的激活發(fā)信號。在實施例中,僅在幾個ACELP幀的序列中的第一個幀中發(fā)送該標志。這樣,可以將該標志添加到也在第一 ACELP巾貞發(fā)送的FAC信息。圖7是用于前向消除在比特流中接收的編碼音頻信號中的時域混疊的設備的非限定性示例的框圖。參考圖5和圖6的FAC目標,用于說明的目的,使用來自ACELP模式的信息而給出設備700。本領域技術人員將意識到,可以與每個本公開中給出的編碼模式和FAC校正的其它示例有關地實施對應的設備700。設備700包括用于接收代表編碼音頻信號的比特流701的接收器,該編碼音頻信號包括代表FAC目標的FAC參數(shù)。將來自比特流701的用于ACELP幀的參數(shù)(prm)從接收器710提供到包括ACELP合成濾波器的ACELP解碼器711。ACELP解碼器711產(chǎn)生ACELP合成濾波器的零輸入響應(ZIR)704。而且,ACELP合成解碼器711產(chǎn)生ACELP合成信號702。將ACELP合成信號702和ZIR 704相接(concatenate)以形成ACELP合成信號其后跟著ZIR。接著將具有與圖6中線C應用的開窗相匹配的特性的FAC窗口 703應用到相接的信號707和704。將ACELP合成信號707開窗并折疊,以產(chǎn)生圖6的線C的ACELP合成618,同時將ZIR 704開窗以產(chǎn)生圖6的ACELP ZIR 620。將二者在處理器705中相加,并接著應用于加法器720的正輸入,以產(chǎn)生TCX巾貞中的音頻信號的第一(可選)部分。將來自比特流701的用于TCX 20幀的參數(shù)(prm)提供給TCX解碼器706,隨后是MDCT變換713和用于MDCT的窗口 714,以產(chǎn)生TCX 20合成信號702 (見圖6的線B的608、610和612),將其應用于加法器716的正輸入,以產(chǎn)生TCX 20幀中的音頻信號的第二部分。然而,當在編碼模式之間轉換(例如從ACELP幀到TCX 20幀)時,不使用FAC處理器715將無法正確解碼部分音頻信號。在圖7的示例中,F(xiàn)AC處理器715包括用于從接收的比特流701解碼FAC參數(shù)(圖5的DCT 502和508的輸出)的FAC解碼器717,該FAC參數(shù)對應于濾波(見圖5的濾波器501和507)以及DCT變換(見圖5的DCT 502和508)之后, 如圖5的量化器Q (503、509)所產(chǎn)生的的FAC目標。IDCT 718 (對應于圖5的IDCT 504和505)對來自解碼器717的解碼的FAC參數(shù)應用逆DCT,并且將IDMCT 718的輸出提供給加法器720的正輸入。將加法器720的輸出提供給濾波器719,其將逆加權濾波器l/Wjz)(圖5的505)的特性應用于FAC目標的第一部分(對應于圖5的432),并將逆加權濾波器I/W2(Z)(圖5的511)的特性應用于FAC目標的第二部分(對應于圖5的434)。將濾波器719的輸出提供給加法器716的正輸入。加法器716的全局輸出表示用于跟隨在ACELP幀之后的TCX幀的消除了 FAC的合成信號(圖6的602)。圖8是用于傳輸?shù)浇獯a器的編碼信號中的前向時域混疊消除的設備800的非限定性示例的框圖。為了說明性的目的,參考圖4和5的FAC目標,使用來自ACELP模式的信息而給出設備800。本領域技術人員將意識到,可以與每個本公開中給出的編碼模式和FAC校正的其它示例有關地實施對應的設備800。將要編碼的音頻信號801應用于設備800。一個邏輯(未不出)將音頻信號801的ACELP幀應用于ACELP編碼器810。將ACELP編碼器810的輸出,即ACELP編碼的參數(shù)802,應用于多路復用器(MUX)Sll的第一輸入,以傳輸?shù)浇邮掌?未示出)。ACELP編碼器的另一個輸出是ACELP合成信號860,其后跟隨形成ACELP編碼器810的一部分的ACELP合成濾波器的零輸入響應(ZIR) 861。通過FAC窗口處理器805,將具有與圖4的線3上應用的開窗相匹配的特性的FAC窗口 805應用到信號860和861的相接。將FAC窗口處理器805的輸出(對應于圖4的線3)應用于加法器851的負輸入(對應于圖4的加法器427)。該邏輯(未示出)還將音頻信號801的TCX 20幀(見圖4的幀402)應用于MDCT編碼模式812,以產(chǎn)生TCX 20編碼的參數(shù)803,將其應用于多路復用器811的第二輸入,以傳輸?shù)浇邮掌?未示出)。MDCT編碼模塊812包括MDCT窗口 831、MDCT變換832、以及量化器833。將音頻信號801通過MDCT窗口 831開窗,并且從MDCT窗口 831將MDCT開窗信號提供到加法器850 (對應于圖4的加法器426)的正輸入。還將來自MDCT窗口 831的MDCT開窗信號提供給MDCT,以產(chǎn)生MDCT系數(shù),將其提供給量化器833,以產(chǎn)生TCX參數(shù)803和量化MDCT系數(shù)804,并將量化MDCT系數(shù)804應用到逆MDCT (IMDCT) 833。IMDCT 833的輸出是合成信號(對應于圖4的合成信號412),將其提供給加法器850 (對應于圖4的加法器426)的負輸入。加法器850的輸出形成TCX量化誤差,其在處理器836中開窗。將處理器836的輸出提供給加法器851的正輸入。當在編碼模式之間轉換時(例如從ACELP幀到TCX 20幀),通過MDCT模塊812編碼的某些音頻幀可能無法在沒有附加信息的情況下被正確解碼。計算器813提供該附加信息,更具體地,編碼和量化的FAC目標。計算器813的所有組件可以視為FAC參數(shù)806的產(chǎn)生器。加法器851的輸出是FAC目標(對應于圖4的線4)。將FAC目標輸入到濾波器808,濾波器808將加權濾波器W1 (z) 501 (圖5)的特性應用于FAC目標的第一部分432并且將加權濾波器W2 (z) 507 (圖5)的特性應用于FAC目標的第二部分434。接著將濾波器804的輸出應用于DCT 834 (對應于圖5的DCT 502和508),接著是在量化器837 (對應于圖5的量化器503和509)中量化DCT 834的輸出,以產(chǎn)生FAC參數(shù)806,將FAC參數(shù)806應用于多路復用器811的輸入,以傳輸?shù)浇邮掌?未示出)。多路復用器811的輸出處的信號代表要在編碼的比特流857中通過發(fā)送器856而 發(fā)送到接收器(未示出)的編碼音頻信號855。本領域普通技術人員將認識到,用于前向消除在編碼信號中的時域混疊的設備和方法的描述僅為說明而不意圖以任何方式限制。本領域普通技術人員將從本公開中受益而容易地領悟到其它實施例。此外,可以定制公開的設備和方法,以為消除編碼信號中的時域混疊的現(xiàn)有需要和問題提供有價值的解決方案。本領域普通技術人員也將意識到,終端或其它裝置的多種類型可以在同一個設備中實施用于編碼音頻傳輸?shù)木幋a的方面、以及跟隨編碼音頻的接收而進行解碼的方面這二者。為了清晰起見,并未顯示和描述編碼信號中的時域混疊的前向消除的實施方式的所有常規(guī)特征。當然,將會意識到,在音頻編碼的任何這樣的實施方式的開發(fā)中,為了實現(xiàn)開發(fā)者的特定目標(諸如遵守應用、系統(tǒng)、網(wǎng)絡和商務相關的約束),以及這些特定目標將會根據(jù)實施方式不同以及根據(jù)開發(fā)者不同而變化,必須做出大量實施方式特定的決定。此外,將會意識到,開發(fā)計劃可以是復雜并耗時的,但無論如何,具有本公開的優(yōu)點的音頻編碼系統(tǒng)將會是本領域普通技術人員的設計的常規(guī)工作。依據(jù)本公開,可以使用各種類型的操作系統(tǒng)、計算平臺、網(wǎng)絡設備、計算機程序、和/或通用機來實施此處所述的組件、處理步驟、和/或數(shù)據(jù)結構。此外,本領域普通技術人員將認識到,也可以使用較少通用性的設備,諸如硬連線設備、現(xiàn)場可編程門陣列(FPGA)、專用集成電路(ASIC)、等等。通過計算機或機器實施包括一系列過程步驟的方法,并且這些過程步驟可以作為一系列機器可讀指令而存儲,其可以存儲于有形介質上。此處所述的系統(tǒng)和模塊可以包括軟件、固件、硬件,或適合于此處所述目的的軟件、固件或硬件的任何組合。軟件和其它模塊可以位于服務器、工作站、個人電腦、平板電腦、PDA、以及適合于此處所述目的的其它設備上。軟件和其它模塊可以經(jīng)由本地存儲器、經(jīng)由網(wǎng)絡、經(jīng)由瀏覽器或ASP環(huán)境中的其它應用、或者經(jīng)由適合于此處所述目的的其它手段而訪問。此處所述的數(shù)據(jù)結構可以包括計算機文件、變量、編程陣列、編程結構,或者任何電子信息存儲方案或方法,或其適合于此處所述目的的任何組合。盡管在上文中通過其非限制性說明性實施例的方式而對本公開進行了描述,但在不脫離本公開的精神和特性的情況下,這些實施例可以在附加權利要求的范圍之內進行修 改。
權利要求
1.一種用于產(chǎn)生前向混疊消除(FAC)參數(shù)的方法,所述FAC參數(shù)用于消除由在具有重疊窗口的使用第一編碼模式的第一變換編碼幀和具有非重疊窗口的使用第二編碼模式的第二幀之間的轉換對在所述第一變換編碼幀中的編碼音頻信號造成的時域混疊,包括 計算表示編碼前的第一幀的音頻信號和第一變換編碼幀的編碼音頻信號的合成之間的差的FAC目標;以及 加權所述FAC目標以產(chǎn)生所述FAC參數(shù)。
2.如權利要求I所述的方法,包括通過對所述加權的FAC目標應用編碼變換而變換所述加權的FAC目標。
3.如權利要求I或2所述的方法,其中所述FAC目標包括鄰近所述第二幀的FAC目標部分,并且其中加權所述FAC目標包括通過加權濾波器處理第一 FAC目標部分。
4.如權利要求3中所述的方法,包括從用于對所述第一變換編碼幀中的編碼噪聲進行整形的LPC濾波器導出所述加權濾波器。
5.如權利要求I至4中任意一項所述的方法,其中所述第二幀在所述第一幀之前,并且其中所述方法進一步包括從編碼前的第一幀的音頻信號和第一變換編碼幀的編碼音頻信號的合成之間的差中,減去下述影響成分,該影響成分包括所述第二幀的上一合成樣本的開窗和時間反轉的版本以及在所述第二幀中使用的合成濾波器的開窗的零輸入響應。
6.如權利要求I至5中任意一項所述的方法,其中所述第一幀是基于MDCT的變換編碼幀,并且所述第二幀是ACELP幀。
7.如權利要求6中所述的方法,其中所述加權濾波器是從LPC濾波器導出的。
8.如權利要求6中所述的方法,其中對所述基于MDCT的變換編碼幀應用頻域噪聲整形(FDNS)0
9.如權利要求I至8中任意一項所述的方法,其中變換所述加權的FAC目標包括對所述加權的FAC目標應用DCT變換。
10.一種用于前向消除時域混疊的方法,所述時域混疊是由在具有重疊窗口的使用第一編碼模式的第一變換編碼巾貞和具有非重疊窗口的使用第二編碼模式的第二巾貞之間的轉換對在所述第一變換編碼幀中的編碼音頻信號造成的時域混疊,所述方法包括 接收加權的前向混疊消除(FAC)參數(shù); 逆加權所述加權的FAC參數(shù),以產(chǎn)生FAC合成;以及 基于所述第一幀中的編碼音頻信號的合成,使用所述FAC合成從所述音頻信號合成中消除所述時域混疊。
11.如權利要求10中所述的方法,其中所述接收的FAC參數(shù)是變換的加權的FAC參數(shù),并且其中所述方法包括通過對所述變換加權的FAC參數(shù)應用逆編碼變換來逆變換所述變換的加權的FAC參數(shù),以產(chǎn)生逆變換的加權的FAC參數(shù)。
12.如權利要求10或11中所述的方法,其中所述FAC合成包括鄰近所述第二幀的FAC合成部分,并且其中逆加權所述加權的FAC參數(shù)包括通過逆加權濾波器處理所述加權的FAC參數(shù)。
13.如權利要求12中所述的方法,包括從用于對所述第一變換編碼幀中的編碼噪聲進行整形的LPC濾波器導出所述逆加權濾波器。
14.如權利要求10至13中任意一項所述的方法,其中消除所述時域混疊包括將所述FAC合成和所述第一變換編碼幀的編碼音頻信號的合成相加。
15.如權利要求14中所述的方法,其中所述第二幀在所述第一幀之前,并且其中所述方法進一步包括向所述FAC合成和所述第一變換編碼幀的編碼音頻信號的合成的相加加上下述影響成分,該影響成分包括所述第二幀的上一合成樣本的開窗和時間反轉的版本以及在所述第二幀中使用的合成濾波器的開窗的零輸入響應。
16.如權利要求10至15中任意一項所述的方法,其中所述第一幀是基于MDCT的變換編碼幀,并且所述第二幀是ACELP幀。
17.如權利要求16中所述的方法,其中所述逆加權濾波器是從LPC濾波器導出的。
18.如權利要求16中所述的方法,其中對所述基于MDCT的變換編碼幀應用頻域噪聲整形(FDNS)。
19.如權利要求11中所述的方法,其中逆變換所述變換的加權的FAC參數(shù)包括對所述變換的加權的FAC參數(shù)應用逆DCT變換,旨在產(chǎn)生逆變換的加權的FAC參數(shù)。
20.一種用于產(chǎn)生前向混疊消除(FAC)參數(shù)的設備,所述FAC參數(shù)用于消除由在具有重疊窗口的使用第一編碼模式的第一變換編碼幀和具有非重疊窗口的使用第二編碼模式的第二幀之間的轉換對在所述第一變換編碼幀中的編碼音頻信號造成的時域混疊,包括 FAC目標計算器,該FAC目標表示編碼前的第一幀的音頻信號和第一變換編碼幀的編碼音頻信號的合成之間的差;以及 加權濾波器,提供有所述FAC目標,以產(chǎn)生所述FAC參數(shù)。
21.如權利要求20所述的設備,包括應用于所述加權的FAC目標的編碼變換。
22.如權利要求20或21所述的設備,其中所述FAC目標包括鄰近所述第二幀的FAC目標部分,并且其中所述加權濾波器從用于對所述第一變換編碼幀中的編碼噪聲進行整形的LPC濾波器導出。
23.如權利要求20至22中任意一項所述的設備,其中所述第二幀在所述第一幀之前,并且其中所述設備進一步包括加法器,用于從編碼前的第一幀的音頻信號和第一變換編碼幀的編碼音頻信號的合成之間的差中,減去下述影響成分,該影響成分包括所述第二幀的上一合成樣本的開窗和時間反轉的版本以及在所述第二幀中使用的合成濾波器的開窗的零輸入響應。
24.如權利要求20至23中任意一項所述的設備,其中所述第一幀是基于MDCT的變換編碼幀,并且所述第二幀是ACELP幀。
25.如權利要求24所述的設備,其中所述加權濾波器是從LPC濾波器導出的。
26.如權利要求24所述的設備,其中對所述基于MDCT的變換編碼幀應用頻域噪聲整形(FDNS)0
27.如權利要求20至26任意一項所述的設備,其中所述編碼變換是DCT變換。
28.一種音頻信號編碼器,包括 使用具有重疊窗口的幀以第一變換編碼模式對所述音頻信號編碼的第一編碼器; 使用具有非重疊窗口的幀以第二編碼模式對所述音頻信號編碼的第二編碼器;以及 如權利要求20至27中任意一項所述的用于產(chǎn)生FAC參數(shù)的設備,所述FAC參數(shù)用于消除由在具有重疊窗口的使用第一編碼模式的第一幀和具有非重疊窗口的使用第二編碼模式的第二巾貞之間的轉換對在所述具有重疊窗口的第一巾貞中以第一編碼模式編碼的音頻信號造成的時域混疊。
29.一種用于前向消除時域混疊的設備,所述時域混疊是由在具有重疊窗口的使用第一編碼模式的第一變換編碼巾貞和具有非重疊窗口的使用第二編碼模式的第二巾貞之間的轉換對在所述第一變換編碼幀中的編碼音頻信號造成的時域混疊,所述設備包括 用于接收加權的前向混疊消除(FAC)參數(shù)的輸入器; 逆加權濾波器,提供有所述加權的FAC參數(shù),以產(chǎn)生FAC合成;以及 響應于所述FAC合成對所述編碼音頻信號解碼以產(chǎn)生第一幀中消除了時域混疊的音頻信號合成的解碼器。
30.如權利要求29所述的設備,其中所述接收的FAC參數(shù)是變換的加權的FAC參數(shù),并且其中所述設備包括應用于所述變換的加權的FAC參數(shù)以產(chǎn)生逆變換的加權的FAC參數(shù)的逆變換。
31.如權利要求29或30中所述的設備,其中所述FAC合成包括鄰近所述第二幀的FAC合成部分,并且其中所述逆加權濾波器是從用于對所述第一變換編碼幀中的編碼噪聲進行整形的LPC濾波器導出的。
32.如權利要求29至31中任意一項所述的設備,其中所述解碼器包括為了消除時域混疊將所述FAC合成和所述第一變換編碼幀的編碼音頻信號的合成相加的加法器。
33.如權利要求32中所述的設備,其中所述第二幀在所述第一幀之前,并且其中所述設備進一步包括加法器,用于向所述FAC合成和所述第一變換編碼幀的編碼音頻信號的合成的相加加上下述影響成分,該影響成分包括所述第二幀的上一合成樣本的開窗和時間反轉的版本以及在所述第二幀中使用的合成濾波器的開窗的零輸入響應。
34.如權利要求29至33中任意一項所述的設備,其中所述第一幀是基于MDCT的變換編碼幀,并且所述第二幀是ACELP幀。
35.如權利要求34中所述的設備,其中所述逆加權濾波器是從LPC濾波器導出的。
36.如權利要求34中所述的設備,其中對所述基于MDCT的變換編碼幀應用頻域噪聲整形(FDNS)。
37.如權利要求30中所述的設備,其中所述逆變換是逆DCT變換。
38.一種音頻信號解碼器,包括 對使用具有重疊窗口的幀以第一變換編碼模式編碼的音頻信號解碼的第一解碼器; 對使用具有非重疊窗口的幀以第二編碼模式編碼的音頻信號解碼的第二解碼器;以及 如權利要求29至37中任意一項所述的設備,用于前向消除由在具有重疊窗口的使用第一編碼模式的第一巾貞和具有非重疊窗口的使用第二編碼模式的第二巾貞之間的轉換對在所述具有重疊窗口的幀中以第一編碼模式編碼的音頻信號造成的時域混疊。
全文摘要
在編碼器中,用于產(chǎn)生前向混疊消除(FAC)參數(shù)的方法,所述FAC參數(shù)用于消除由在具有重疊窗口的使用第一編碼模式的第一變換編碼幀和具有非重疊窗口的使用第二編碼模式的第二幀之間的轉換對在所述第一變換編碼幀中的編碼音頻信號造成的時域混疊,包括計算表示編碼前的第一幀的音頻信號和第一變換編碼幀的編碼音頻信號的合成之間的差的FAC目標;以及加權所述FAC目標以產(chǎn)生所述FAC參數(shù)。在解碼器中,加權的前向混疊消除(FAC)參數(shù)被接收并逆加權,以產(chǎn)生FAC合成?;谒龅谝粠械木幋a音頻信號的合成,使用所述FAC合成從所述音頻信號合成中消除所述時域混疊。
文檔編號G10L19/12GK102770912SQ201180006073
公開日2012年11月7日 申請日期2011年1月13日 優(yōu)先權日2010年1月13日
發(fā)明者B.貝塞特 申請人:沃伊斯亞吉公司