專利名稱:確定給定變換函數(shù)的變換元素的過程和設(shè)備,數(shù)字信號(hào)變換方法和設(shè)備及計(jì)算機(jī)可讀介質(zhì)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及用于確定給定變換函數(shù)的變換元素的過程和設(shè)備,用于將數(shù)字信號(hào)從時(shí)域變換到頻域以及從頻域變換到時(shí)域的方法和設(shè)備,以及計(jì)算機(jī)可讀介質(zhì)。
背景技術(shù):
域變換,例如離散余弦變換(DCT),被廣泛地應(yīng)用于當(dāng)今信號(hào)處理工業(yè)。近年來,因?yàn)槠湓跓o損編碼應(yīng)用中的重要角色,稱為整數(shù)DCT的DCT的變形已經(jīng)吸引了許多研究興趣。術(shù)語“無損”意味著解碼器可以根據(jù)已編碼的比特流產(chǎn)生源信號(hào)的確切復(fù)制。
所述DCT是實(shí)值塊變換。即使所述輸入塊僅僅包括整數(shù),所述DCT的輸出塊可以包括非整數(shù)分量。為了簡便,所述輸入塊被稱為輸入向量,而輸出塊被稱為輸出向量。如果向量僅僅包括整數(shù)分量,則該向量被稱為整數(shù)向量。對(duì)照于DCT,所述整數(shù)DCT根據(jù)整數(shù)輸入向量產(chǎn)生整數(shù)輸出向量。對(duì)于同一整數(shù)輸入向量,整數(shù)DCT的整數(shù)輸出向量很近似于DCT的實(shí)輸出向量。因此,整數(shù)DCT在頻譜分析時(shí)保持所述DCT的所有良好的特性。
所述整數(shù)DCT的重要特性是可逆性??赡嫘砸馕吨嬖谡麛?shù)離散余弦反變換(IDCT),使得如果所述整數(shù)DCT根據(jù)輸入向量x產(chǎn)生輸出向量y,則所述整數(shù)IDCT可以根據(jù)向量y恢復(fù)出向量x。有時(shí)整數(shù)DCT也被稱為正向變換,整數(shù)IDCT被稱為反向變換或反變換。
稱為整數(shù)改進(jìn)離散余弦變換(IntMDCT)的變換近年被提出且被用于ISO/IEC MPEG-4音頻壓縮中。所述IntMDCT源于其原型-改進(jìn)離散余弦變換(MDCT)。在[1]中,Malvar給出了通過將DCT-IV塊級(jí)聯(lián)多個(gè)Givens旋轉(zhuǎn)來有效地實(shí)現(xiàn)MDCT的方法。已經(jīng)熟知的是,Givens旋轉(zhuǎn)可以被分解為三個(gè)提升步驟,用于將整數(shù)映射為整數(shù),參見例子[2]。
因此,IntMDCT的實(shí)現(xiàn)依賴于整數(shù)DCT-IV的有效實(shí)施。
通過利用三個(gè)提升步驟替換每個(gè)Givens旋轉(zhuǎn),可以從整數(shù)變換的原型直接轉(zhuǎn)換為整數(shù)變換。由于在每個(gè)提升步驟中存在一個(gè)四舍五入操作,整數(shù)變換的總四舍五入次數(shù)是原型變換的Givens旋轉(zhuǎn)次數(shù)的3倍。對(duì)于離散三角變換(例如離散傅立葉變換(DFT)或離散余弦變換(DCT)),所涉及的Givens旋轉(zhuǎn)的次數(shù)通常為Nlog2N量級(jí),其中N是所述塊的大小,即所述數(shù)字信號(hào)被劃分的每個(gè)塊中包括的數(shù)據(jù)符號(hào)的量。因此,對(duì)于直接轉(zhuǎn)換的整數(shù)變換的同族變換,所述總四舍五入總次數(shù)也為Nlog2N量級(jí)。由于所述四舍五入,整數(shù)變換僅僅近似其浮點(diǎn)原型。所述近似誤差隨著四舍五入的次數(shù)的增加而增加。
發(fā)明內(nèi)容
本發(fā)明解決下述問題,即確定給定變換函數(shù)的變換元素,該變換函數(shù)包括變換矩陣且對(duì)應(yīng)于數(shù)字信號(hào)從時(shí)域到頻域或從頻域到時(shí)域的變換,使得由所述變換元素包括的四舍五入的次數(shù)顯著地減少。本發(fā)明還提供一種方法,用于根據(jù)所述確定的變換元素,將數(shù)字信號(hào)從時(shí)域變換到頻域或從頻域變換到時(shí)域。
利用符合獨(dú)立權(quán)利要求的特征,通過用于確定給定變換函數(shù)的變換元素的過程和設(shè)備,用于將數(shù)字信號(hào)從時(shí)域變換到頻域以及從頻域變換到時(shí)域的方法和設(shè)備,以及計(jì)算機(jī)可讀介質(zhì)來解決所述問題。
根據(jù)本發(fā)明,提供一個(gè)用于確定給定變換函數(shù)的變換元素的過程,該變換函數(shù)包括變換矩陣且對(duì)應(yīng)于數(shù)字信號(hào)從時(shí)域到頻域或從頻域到時(shí)域的變換,其中所述變換矩陣被分解為旋轉(zhuǎn)矩陣和輔助矩陣,當(dāng)該輔助矩陣與自身相乘時(shí),等于置換矩陣與整數(shù)對(duì)角矩陣相乘,所述旋轉(zhuǎn)矩陣和所述輔助矩陣的每個(gè)都被分解為多個(gè)提升矩陣;并且所述變換元素被確定為包括與所述提升矩陣對(duì)應(yīng)的多個(gè)提升級(jí)。
此外,根據(jù)本發(fā)明,提供一種適用于執(zhí)行上述過程的設(shè)備。
此外,根據(jù)本發(fā)明,提供一種用于使用變換元素將數(shù)字信號(hào)從時(shí)域變換到頻域或從頻域變換到時(shí)域的方法,其中所述變換元素對(duì)應(yīng)于給定變換函數(shù),該變換函數(shù)包括變換矩陣,其中所述變換元素是由一個(gè)過程確定的,該過程包括將所述變換矩陣分解為旋轉(zhuǎn)矩陣和輔助矩陣,當(dāng)該輔助矩陣與自身相乘時(shí),等于置換矩陣與整數(shù)對(duì)角矩陣相乘;將所述旋轉(zhuǎn)矩陣和所述輔助矩陣的每個(gè)分解為多個(gè)提升矩陣;以及確定所述變換元素包括與所述提升矩陣對(duì)應(yīng)的多個(gè)提升級(jí);其中每個(gè)提升級(jí)包括利用輔助變換和四舍五入單元對(duì)所述數(shù)字信號(hào)的子塊進(jìn)行的處理。
此外,根據(jù)本發(fā)明,提供一種適合于執(zhí)行上述方法的設(shè)備。
此外,根據(jù)本發(fā)明,提供一種計(jì)算機(jī)可讀介質(zhì),該計(jì)算機(jī)可讀介質(zhì)具有記錄于其上的程序,其中所述程序適合于使計(jì)算機(jī)執(zhí)行用于確定給定變換函數(shù)的變換元素的過程,該變換函數(shù)包括變換矩陣且對(duì)應(yīng)于數(shù)字信號(hào)從時(shí)域到頻域或從頻域到時(shí)域的變換,其中所述變換矩陣被分解為旋轉(zhuǎn)矩陣和輔助矩陣,當(dāng)該輔助矩陣與自身相乘時(shí),等于置換矩陣與整數(shù)對(duì)角矩陣相乘;所述旋轉(zhuǎn)矩陣和所述輔助矩陣的每個(gè)都被分解為多個(gè)提升矩陣;并且所述變換元素被確定為包括與所述提升矩陣對(duì)應(yīng)的多個(gè)提升級(jí)。
此外,根據(jù)本發(fā)明,提供一種算機(jī)可讀介質(zhì),該計(jì)算機(jī)可讀介質(zhì)具有記錄于其上的程序,其中所述程序適合于使計(jì)算機(jī)執(zhí)行用于使用變換元素將數(shù)字信號(hào)從時(shí)域變換到頻域或從頻域變換到時(shí)域的方法,其中所述變換元素對(duì)應(yīng)于給定變換函數(shù),該變換函數(shù)包括變換矩陣,其中所述變換元素是由一個(gè)過程確定的,該過程包括將所述變換矩陣分解為旋轉(zhuǎn)矩陣和輔助矩陣,當(dāng)該輔助矩陣與自身相乘時(shí),等于置換矩陣與整數(shù)對(duì)角矩陣相乘,將所述旋轉(zhuǎn)矩陣和所述輔助矩陣的每個(gè)分解為多個(gè)提升矩陣;以及確定所述變換元素包括與所述提升矩陣對(duì)應(yīng)的多個(gè)提升級(jí);其中每個(gè)提升級(jí)包括利用輔助變換和四舍五入單元對(duì)所述數(shù)字信號(hào)的子塊進(jìn)行處理。
在一個(gè)優(yōu)選實(shí)施例中,本發(fā)明提供了一種用于實(shí)現(xiàn)整數(shù)IV型DCT變換的過程和方法。與現(xiàn)有技術(shù)的方法相比,根據(jù)本發(fā)明的方法需要的四舍五入操作的次數(shù)顯著減少。結(jié)果是,所述近似誤差被顯著減少,在DCT-IV的情況下,其從通常的Nlog2N量級(jí)減少到如2.5N一樣低,其中N表示數(shù)字信號(hào)的塊大小。根據(jù)本發(fā)明的方法在計(jì)算復(fù)雜度上低且在結(jié)構(gòu)上是模塊化的。
根據(jù)本發(fā)明的方法和設(shè)備可以用于任何類型的數(shù)字信號(hào),比如音頻、圖像或視頻信號(hào)。作為被數(shù)字化的信號(hào)的數(shù)字信號(hào)對(duì)應(yīng)于可物理測量的信號(hào),其可以通過掃描相應(yīng)模擬信號(hào)的至少一個(gè)特有特征(例如,視頻信號(hào)的亮度值和色度值,來自傳感器的模擬聲音信號(hào)的幅度,或模擬感測信號(hào)的幅度)而產(chǎn)生。所述數(shù)字信號(hào)包括多個(gè)數(shù)據(jù)符號(hào)。所述數(shù)字信號(hào)的數(shù)據(jù)符號(hào)被分組為多個(gè)塊,其中每個(gè)塊基于所述相應(yīng)模擬信號(hào)的采樣速率,具有相同的預(yù)定數(shù)目的數(shù)據(jù)符號(hào)。
根據(jù)本發(fā)明的方法可用于將是整數(shù)值的輸入數(shù)字信號(hào)變換為也是整數(shù)值的輸出信號(hào)。根據(jù)本發(fā)明的變換方法是可逆的??梢酝ㄟ^執(zhí)行根據(jù)本發(fā)明的變換方法將所述輸出信號(hào)變換回原始輸入信號(hào)。根據(jù)本發(fā)明的方法的變換的此種可逆性可以用于其中輸出信號(hào)應(yīng)該與原始輸入信號(hào)等同的無損編碼中。
根據(jù)本發(fā)明的信號(hào)的此種整數(shù)變換可以用于許多應(yīng)用和系統(tǒng)中,比如MPEG音頻、圖像和視頻壓縮、JPEG2000或譜分析(用于分析紅外、紫外或核磁輻射信號(hào))。它可以在不考慮比如在實(shí)值信號(hào)變換的情況下的上溢的因素的情況下,以比如固定點(diǎn)數(shù)字信號(hào)處理器(DSP)的硬件系統(tǒng)來容易地實(shí)現(xiàn)。
根據(jù)本發(fā)明的方法,利用變換元素將所述數(shù)字信號(hào)變換到頻域,該變換元素是根據(jù)本發(fā)明的過程為給定變換函數(shù)確定的。
優(yōu)選地,所述變換元素包括多個(gè)提升級(jí)。
所述變換元素可以基于提升階梯的模型來進(jìn)行例示。所述提升階梯模型具有兩個(gè)側(cè)面部件(piece),每個(gè)部件用于接收兩組數(shù)據(jù)符號(hào)中的一組。在所述兩個(gè)側(cè)面部件之間設(shè)置兩個(gè)或多個(gè)級(jí)聯(lián)提升級(jí)。每個(gè)提升級(jí)在一端(輸入端)接收信號(hào),并且經(jīng)由相加單元在另一端(輸出端)輸出信號(hào)。四舍五入單元被安排在輸出端。以交替的方式將所述提升級(jí)安排在所述側(cè)面部件之間,使得相鄰提升級(jí)的輸出(或輸入)端連接到不同的側(cè)面部件。
應(yīng)該注意的是,雖然以提升階梯模型的形式來描述變換元素,但是僅僅例示所述變換元素的變換路徑。然而,本發(fā)明并不應(yīng)該限于所述階梯模型。
所述變換元素的提升級(jí)的數(shù)目是由提升矩陣的數(shù)目定義的,該提升矩陣的數(shù)目是由根據(jù)本發(fā)明的過程來確定的。
離散余弦變換、離散正弦變換、離散傅立葉變換或離散W變換是可用作根據(jù)本發(fā)明的變換函數(shù)的變換函數(shù)的實(shí)例。取決于用于確定各個(gè)變換函數(shù)的變換元素的根據(jù)本發(fā)明的過程的結(jié)果,所述變換元素的提升級(jí)的數(shù)目可以不同。
下面參照附圖來說明本發(fā)明的例示性實(shí)施例,其中圖1示出了根據(jù)本發(fā)明的實(shí)施例的音頻編碼器的體系結(jié)構(gòu);圖2示出了根據(jù)本發(fā)明的實(shí)施例的音頻解碼器的體系結(jié)構(gòu),其對(duì)應(yīng)于圖1中示出的音頻編碼器;圖3例示了根據(jù)本發(fā)明的過程的實(shí)施例,其中所述變換函數(shù)是DCT-IV變換函數(shù);圖4示出了根據(jù)本發(fā)明的方法的實(shí)施例的流程圖;圖5例示了使用DCT-IV作為變換函數(shù)的根據(jù)本發(fā)明的方法的實(shí)施例;圖6例示了用于根據(jù)圖5中例示的本發(fā)明的方法的實(shí)施例的反變換的算法;圖7示出了根據(jù)本發(fā)明的實(shí)施例的圖像歸檔系統(tǒng)的體系結(jié)構(gòu);圖8例示了使用DWT-IV作為變換函數(shù)的根據(jù)本發(fā)明的方法的實(shí)施例;圖9例示了用于根據(jù)圖8中例示的本發(fā)明的方法的實(shí)施例的反變換的算法。
具體實(shí)施例方式
圖1示出了根據(jù)本發(fā)明的實(shí)施例的音頻編碼器100的結(jié)構(gòu)。
所述音頻編碼器100包括基于改進(jìn)離散余弦變換(MDCT)的常規(guī)感知基本層編碼器和基于整數(shù)改進(jìn)離散余弦變換(IntMDCT)的無損增強(qiáng)編碼器。
例如,將由麥克風(fēng)110提供且由模/數(shù)轉(zhuǎn)換器111進(jìn)行數(shù)字化的音頻信號(hào)109提供給音頻編碼器100。所述音頻信號(hào)109包括多個(gè)數(shù)據(jù)符號(hào)。所述音頻信號(hào)109被分為多個(gè)塊,其中每個(gè)塊包括數(shù)字信號(hào)的多個(gè)數(shù)據(jù)符號(hào),并且由改進(jìn)離散余弦變換(MDCT)設(shè)備101對(duì)每個(gè)塊進(jìn)行變換。由MDCT設(shè)備101提供的所述MDCT系數(shù)由量化器103借助于感知模型102來進(jìn)行量化。所述感知模型按照這樣一種方式控制所述量化器103,使得由量化誤差產(chǎn)生的聲音失真低。隨后由比特流編碼器104對(duì)量化器103的輸出進(jìn)行編碼,該比特流編碼器104產(chǎn)生有損的感知編碼的輸出比特流112。所述比特流編碼器104利用諸如Huffman編碼或游程(Run-Length)編碼的標(biāo)準(zhǔn)方法無損地壓縮其輸入以產(chǎn)生一輸出,該輸出的平均比特率要低于的其輸入的平均比特率。所述輸入音頻信號(hào)109也被輸送到產(chǎn)生IntMDCT系數(shù)的IntMDCT設(shè)備105中。作為量化器103的輸出的已量化MDCT系數(shù)被用于預(yù)測所述IntMDCT系數(shù)。所述已量化MDCT系數(shù)被輸送到逆-量化器106,并且逆-量化器106所述輸出被輸送到四舍五入單元107,所述四舍五入單元將所述逆-量化器106所述輸出四舍五入為整數(shù)值,并且殘余IntMDCT系數(shù)由熵編碼器108對(duì)殘余的IntMDCT系數(shù)進(jìn)行熵編碼,所述殘余的IntMDCT系數(shù)是四舍五入單元107的輸出和IntMDCT系數(shù)之差。所述熵編碼器(類似于比特流編碼器104)108無損地減少其輸入的平均比特率,并且產(chǎn)生無損增強(qiáng)比特流113。所述無損增強(qiáng)比特流113和感知編碼比特流112一起承載精確重構(gòu)輸入音頻信號(hào)109必需的信息。
圖2示出了包括本發(fā)明的實(shí)施例的音頻解碼器200的體系結(jié)構(gòu),其對(duì)應(yīng)于圖1中示出的音頻編碼器100。
所述感知編碼比特流207由比特流解碼器201解碼,該比特流解碼器201執(zhí)行圖1的比特流編碼器104的操作的逆操作。所述已解碼的比特流被提供給逆-量化器202。在其輸出端,通過改進(jìn)離散余弦反變換設(shè)備(反MDCT)203施加反MDCT。因此,獲得重構(gòu)的感知編碼音頻信號(hào)209。所述無損增強(qiáng)比特流208由熵解碼器204解碼,該熵解碼器204執(zhí)行圖1中的熵編碼器108的操作的逆操作,產(chǎn)生相應(yīng)的殘余IntMDCT系數(shù)。由四舍五入設(shè)備205對(duì)逆-量化器202的輸出進(jìn)行四舍五入,然后加到所述殘余IntMDCT系數(shù),由此產(chǎn)生所述IntMDCT系數(shù)。最后,由所述整數(shù)改進(jìn)的離散余弦反變換設(shè)備206對(duì)所述IntMDCT系數(shù)進(jìn)行所述整數(shù)改進(jìn)離散余弦反變換,以產(chǎn)生所述重構(gòu)的無損編碼音頻信號(hào)210。
如上所述,在[2]中示出了IntMDCT的核心是整數(shù)DCT-IV,該核心在無損音頻編碼中扮演重要角色,并且用于圖1和2中例示的本發(fā)明的實(shí)施例中。
圖3例示了根據(jù)本發(fā)明的過程的實(shí)施例的流程圖,其中所述變換函數(shù)是DCT-IV變換函數(shù)。
在下面,說明了用于確定DCT-IV變換函數(shù)的變換元素的本發(fā)明的過程的實(shí)施例。所述確定的變換元素用于圖1中示出的編碼器來實(shí)施IntMDCT,而相應(yīng)的反變換元素用于圖2中示出的解碼器中以實(shí)施反IntMDCT。對(duì)于如何利用DCT-IV實(shí)施IntMDCT和反IntMDCT的描述,參見[2]。
具有N點(diǎn)實(shí)輸入序列x(n)的DCT-IV變換函數(shù)被如下定義(參見[2])y(m)=2NΣn=0N-1x(n)cos((m+1/2)(n+1/2)πN)m,n=0,1,···,N-1---(1)]]>假設(shè) 是DCT-IV的變換矩陣,即,CNIV‾=2N[cos((m+1/2)(n+1/2)πN)]m,n=0,1,,N-1---(2)]]>根據(jù)本發(fā)明的過程的實(shí)施例,變換矩陣 被分解為旋轉(zhuǎn)矩陣和另一矩陣,當(dāng)該矩陣與自身相乘時(shí),等于置換矩陣與整數(shù)對(duì)角矩陣相乘。
為了清楚起見,N被假設(shè)為偶數(shù)。
所述過程開始于步驟300。
在步驟301中,變換函數(shù)的偶數(shù)索引項(xiàng)與奇數(shù)索引項(xiàng)分開
y(m)=2NΣn=0N-1x(n)cos((m+12)(n+12)πN)]]> =2NΣn=0N2-1x(2n)cos((m+12)(2n+12)πN)+2NΣn=0N2-1x(2n+1)cos((m+12)(2n+1+12)πN)]]>=2NΣn=0N2-1x1(n)cos((m+12)(n+14)π(N2))+2NΣn=0N2-1x2(n)cos((m+12)(n+34)π(N2))]]>因此,y(m)=2NΣn=0N2-1x1(n)cos((m+12)(n+12)π(N2)-14(m+12)π(N2))---(3)]]>+2NΣn=0N2-1x2(n)cos((m+12)(n+12)π(N2)+14(m+12)π(N2))]]>其中具有分量x1(n)=x(2n),n=0,1,...,N2-1]]>的x1是包括所有具有偶數(shù)索引的x(n)的向量,而具有分量x2(n)=x(2n+1),n=0,1,...,N2-1]]>的x2是包括所有具有奇數(shù)索引的x(n)的向量。
使用下述兩個(gè)簡略式αm,n=(m+12)(n+12)π(N2),m,n=0,...,N-1---(4)]]>βm=14(m+12)π(N2)=(m+12)π2N,m=0,...,N-1---(5)]]>利用等式(4)和(5),等式(3)可以寫成y(m)=2NΣn=0N2-1x1(n)cos(αm,n-βm)+2NΣn=0N2-1x2(n)cos(αm,n+βm)---(6)]]>在步驟302中,應(yīng)用下述兩個(gè)余弦的加法定理
cos(αm,n-βm)=cosαm,n·cosβm+sinαm,n·sinβm(7)cos(αm,n+βm)=cosαm,n·cosβm-sinαm,n·sinβm(8)利用等式(7)和(8),等式(6)可以寫成y(m)=2N{Σn=0N2-1x1(n)cosαm,ncosβm+Σn=0N2-1x1(n)sinαm,nsinβm+Σn=0N2-1x2(n)cosαm,ncosβm-Σn=0N2-1x2(n)sinαm,nsinβm}]]>=2N{Σn=0N2-1[x1(n)cosβm+x2(n)cosβm]cosαm,n+Σn=0N2-1[x1(n)sinβm-x2(n)sinβm]sinαm,n}]]>=2(N2){Σn=0N2-1cosβm2[x1(n)+x2(n)]cosαm,n+Σn=0N2-1sinβm2[x1(n)-x2(n)]sinαm,n}---(9)]]>對(duì)于簡略式,兩個(gè)N/2大小的向量x1′和x2′被定義為包括下述分量x1′(n)=12[x1(n)+x2(n)],n=0,...,N2-1,---(10)]]>x2′(n)=12[x1(n)-x2(n)],n=0,...,N2-1---(11)]]>利用(10)和(11),等式(9)被簡化為y(m)=2(N2){Σn=0N2-1cosβmx1′(n)cosαm,n+Σn=0N2-1sinβmx2′(n)sinαm,n}---(12)]]>在步驟303中,向量y‾=y(0)y(1)···y(N)]]>被劃分為兩個(gè)部分y0和y1,其中
y0‾=y(0)y(1)···y(N2-1)---(13)]]>y1‾=y(N-1)y(N-2)···y(N2)---(14)]]>向量y1包括按照逆序?qū)?yīng)于從 到N-1的索引的y的分量。
向量y1的分量y1(m)滿足下述等式在m=0,...,N2-1]]>的情況下,y1(m)=y(tǒng)(N-1-m)=2(N2){Σn=0N2-1cosβN-1-mx1′(n)cosαN-1-m,n+Σn=0N2-1sinβN-1-m,mx2(n)sinαN-1-m,n}---(15)]]>注意對(duì)于m=0,...,N2-1]]>y(m+N2)=2(N2){Σn=0N2-1cosβm+N2x1′(n)cosαm+N2,n+Σn=0N2-1sinβm+N2x2′(n)sinαm+N2,n}---(16)]]>在步驟304,y0和y1中的每個(gè)由DCT-IV矩陣 和DST-IV矩陣 表示,每個(gè)的大小為 這是按照下述方式來實(shí)現(xiàn)的對(duì)于βm=(m+12)π2N,]]>下述等式成立
βm+N2=(m+12+N2)π2N=(m+12)π2N+N2·π2N=βm+π4---(17)]]>βN-1-m=(N-1-m+12)π2N=N·π2N-(m+12)·π2N=π2-βm---(18)]]>此外,cosβN-1-m=cos(π2-βm)=sinβm---(19)]]>sinβN-1-m=sin(π2-βm)=cosβm---(20)]]>對(duì)于αm,n=(m+12)(n+12)π(N2),]]>下述等式成立αN-1-m,n=(N-1-m+12)(n+12)π(N2)=(N-m-12)(n+12)π(N2)]]>=N(n+12)π(N2)-(m+12)(n+12)π(N2)=2π(n+12)-αm,n=2πn+π-αm,n---(21)]]>此外,cosαN-1-m,n=cos(2πn+π-αm,n)=cos(π-αm,n)=-cosαm,n(22)sinαN-1-m,n=sin(2πn+π-αm,n)=sin(π-αm,n)=sinαm,n(23)利用等式(19)、(20)、(22)和(23),等式(15)可以被寫為
y(N-1-m)=2(N2){ΣnN2-1cosβN-1-mx1′(n)cosαN-1-m,n+ΣnN2-1sinβN-1-mx2′(n)sinαN-1-m,n}]]>=2(N2){ΣnN2-1sinβmx1′(n)(-cosαm,n)+ΣnN2-1cosβmx2′(n)sinαm,n}]]>=-2(N2)ΣnN2-1sinβmx1′(n)cosαm,n+2(N2)ΣnN2-1cosβmx2′(n)sinαm,n]]>=-sinβm[2(N2)ΣnN2-1x1′(n)cosαm,n]+cosβm[2(N2)ΣnN2-1x2′(n)sinαm,n]]]>m=0,...,N2-1---(24)]]>由于另一等式(12)得出y(m)=2(N2){ΣnN2-1cosβmx1′(n)cosαm,n+ΣnN2-1sinβmx2′(n)sinαm,n}]]>=cosβm[2(N2)ΣnN2-1x1′(n)cosαm,n]+sinβm[2(N2)ΣnN2-1x2′(n)sinαm,n]---(25)]]>根據(jù)(24)和(25)可以形成y0和y1的表達(dá)式y(tǒng)‾0=diag[cosβm]‾·CN2IV‾·x1′‾+diag[sinβm]‾·SN2IV‾·x2′‾,m=0,...,N2-1---(26)]]>y‾0=diag[-sinβm]‾·CN2IV‾·x1′‾+diag[cosβm]‾·SN2IV‾·x2′‾,m=0,...,N2-1---(27)]]>其中diag[am]表示N/2×N/2的對(duì)角矩陣,該矩陣的第m行為am, 是DCT-IV變換的變換矩陣,而 是IV型離散正弦變換(DST-IV)的變換矩陣。
按照下述方式兩個(gè)等式(26)和(27)可以表示為單個(gè)等式 在下面,使用 矩陣 和 可以看出y(0)y(2)···y(N-1)=IN2‾JN2‾y0(0)···y0(N2-1)y1(0)···y1(N2-1)---(31)]]>
其可被簡略為y‾=IN2‾JN2‾y0‾y1‾---(32)]]>還可以看出,采用N×N矩陣,Rpr可定義為Rpr‾=12IN/2‾IN/2‾IN/2‾-IN/2‾---(33)]]>下述等式成立x1′(0)···x1′(N2-1)x2′(0)···x2′(N2-1)=Rpr‾x1(0)···x1(N2-1)x2(0)···x2(N2-1)---(34)]]>等式(34)可被簡略為x1′‾x2′‾=Rpr‾x1‾x2‾---(35)]]>此外,假設(shè)Peo是偶奇矩陣,即,置換矩陣,其通過將對(duì)應(yīng)于偶索引的分量與對(duì)應(yīng)于奇索引的分量分開來重新排序所述向量x的分量,其中x‾=x(0)···x(N-1)]]>使得下式成立x1(0)···x1(N2-1)x2(0)···x2(N2-1)=Peo‾x(0)···x(N-1)---(36)]]>
或簡寫為x1‾x2‾=Peo‾x‾---(37)]]>通過將等式(28)和等式(31)、(34)和(36)合并,可以得出 利用上述簡略式和下面的簡略式 和 等式(38)可以被簡寫為y‾=IN2‾JN2‾C‾S‾-S‾C‾CN2IV‾SN2IV‾Rpr‾Peo‾x‾---(41)]]>在步驟305,利用 來表示 這是利用下述等式來完成的。
SN2IV‾=JN2‾·CN2IV‾·DN2‾---(42)]]>其中 是如下給出的N/2階的對(duì)角矩陣
利用等式(42),等式(41)可以寫成y‾=IN2‾JN2‾C‾S‾-S‾C‾IN2‾JN2‾CN2IV‾CN2IVDN2‾Rpr‾Peo‾x‾---(44)]]>在步驟306,計(jì)算N×N旋轉(zhuǎn)矩陣Rpo,該旋轉(zhuǎn)矩陣包括等式(44)中的開始三個(gè)矩陣Rpo‾=IN2‾JN2‾C‾S‾-S‾C‾IN2‾JN2‾---(45)]]>進(jìn)行等式(45)中的三個(gè)矩陣的乘法,得到 在步驟307中,計(jì)算輔助矩陣,當(dāng)所述輔助矩陣與自身相乘時(shí),等于置換矩陣與整數(shù)對(duì)角矩陣相乘。
所述輔助矩陣包括等式(44)的第四和第五矩陣T‾=CN/2IV‾CN/2IVDN/2‾Rpr‾=12CN/2IV‾CN/2VI‾CN/2IVDN/2‾-CN/2IVDN/2‾---(47)]]>注意 即T與自身相乘等于置換矩陣與整數(shù)對(duì)角矩陣相乘。
利用等式(46)和(47),等式(44)可簡化為CNIV‾=Rpo‾T‾Peo‾---(49)]]>因此,所述變換矩陣 被分解為旋轉(zhuǎn)矩陣Rpo、輔助矩陣T以及偶奇矩陣Peo,其中當(dāng)輔助矩陣T與自身相乘時(shí),等于置換矩陣乘以整數(shù)對(duì)角矩陣。
在步驟308中,Rpo和T的每個(gè)都被因式分解為提升矩陣的乘積。按照下述對(duì)T進(jìn)行因式分解T‾=T1T2T2‾=IN/2‾K1‾IN/2‾·-DN/2‾K2‾IN/2‾·IN/2‾K3‾IN/2‾---(50)]]>其中K1‾=-(CN/2IVDN/2‾+2IN/2‾)CN/2IV‾---(51)]]>K2‾=CN/2IV2---(52)]]>K3‾=2CN/2IVDN/2‾+IN/2‾---(53)]]>以及根據(jù)下述等式來因式分解RpoRpo‾=R1R2R3‾=IN/2‾H1‾IN/2‾·IN/2‾H2‾IN/2‾·IN/2‾H3‾IN/2‾---(54)]]>其中 和 等式(49)可以被進(jìn)一步寫為CNIV‾=R1R2R3T1T2T3Peo‾---(57)]]>在步驟309,盡可能地將提升矩陣歸并在一起。矩陣S被定義為R3和T1的乘積,即
S‾=R3T1‾=IN/2‾H3‾+K1‾IN/2‾---(58)]]>由于S也是提升矩陣,所以這種歸并是可能的。
根據(jù)(57)和(58),獲得的DCT-IV矩陣的最后的因式分解的公式為CNIV‾=R1R2‾S‾T2T3Peo‾---(59)]]>等式(59)表示根據(jù)本發(fā)明的整數(shù)DCT-IV變換的變換元素包括五個(gè)提升級(jí)。
由于最后的因式分解公式被確定,所以在步驟S310,所述過程停止。
圖4示出了根據(jù)本發(fā)明的方法的實(shí)施例的流程圖400,該方法使用五個(gè)提升級(jí),第一提升級(jí)401、第二提升級(jí)402、第三提升級(jí)403、第四提升級(jí)404以及第五提升級(jí)405。這種方法優(yōu)選用于圖1的IntMDCT設(shè)備105和圖2的反InrMDCT設(shè)備206中,以分別實(shí)現(xiàn)IntMDCT和反IntMDCT。在圖4中,x1和x2分別是數(shù)字信號(hào)的第一和第二塊,z1、z2和z3是中間信號(hào),y1和y2分別是與所述數(shù)字信號(hào)的第一和第二塊對(duì)應(yīng)的輸出信號(hào)。
圖5示出了根據(jù)本發(fā)明的方法的實(shí)施例的流程圖,其中所述變換函數(shù)是DCT-IV變換函數(shù)。在這個(gè)實(shí)施例中使用的變換元素對(duì)應(yīng)于等式(59),即,其是由圖3中例示的過程的實(shí)施例確定的變換元素。
所述變換元素包括五個(gè)提升級(jí),該五個(gè)提升級(jí)對(duì)應(yīng)于等式(59)的五個(gè)提升矩陣。
此外,所述變換元素包括與所述置換矩陣Peo對(duì)應(yīng)的數(shù)據(jù)重組(shuffling)級(jí)。
在圖5中,第一提升級(jí)的輸入是數(shù)字信號(hào)的兩個(gè)塊x1和x2,z1、z2和z3是中間信號(hào),y1和y2分別是與所述數(shù)字信號(hào)的第一和第二塊對(duì)應(yīng)的輸出信號(hào)。
所述變換元素的輸入x和所述變換元素的第一提升級(jí)的兩個(gè)輸入塊x1和x2滿足等式x1‾x2‾=Peo‾x‾---(60)]]>
(與等式(37)一致)。
在下面,解釋第一提升級(jí)501,其是與提升矩陣T3對(duì)應(yīng)的提升級(jí)。假設(shè)v1‾v2‾]]>是在沒有四舍五入到整數(shù)值時(shí)的第一提升級(jí)的輸出向量,即v1‾v2‾=T3‾x1‾x2‾---(61)]]>使用由等式(50)提供的T3的定義,等式(61)可以被改寫為v1‾v2‾=IN2K3‾IN2‾x1‾x2‾---(62)]]>由于在提供了用于整數(shù)DCT-IV的可逆算法的這個(gè)實(shí)施例中,包括到整數(shù)值的四舍五入。因此,根據(jù)等式(62),在第一提升級(jí)501的第一步506中,x1與K3相乘。在步驟507中,這個(gè)乘法的結(jié)果被四舍五入為整數(shù)值。在步驟508,經(jīng)過四舍五入后的值隨后被加到x2。因此,中間信號(hào)z1滿足等式z1=_K3·x1_+x2其中,_*_表示四舍五入操作。
由于圖5中例示的變換元素的分別對(duì)應(yīng)于矩陣T2、S、R2和R1的其余四個(gè)提升級(jí)502、503、504和505,具有與第一提升級(jí)501相同的結(jié)構(gòu),所以省略其描述。僅僅應(yīng)該注意的是,在第二提升級(jí)502的相加步驟509中,根據(jù)T2的定義,x1與-DN/2相乘。
在下面,參照?qǐng)D6描述反變換的變換元素的提升級(jí)。
圖6例示了圖5中例示的變換的反變換的變換元素的提升級(jí)。
在圖6中,第一提升級(jí)的輸入是數(shù)字信號(hào)的兩個(gè)塊y1和y2,z1、z2和z3是中間信號(hào),x1和x2分別是與所述數(shù)字信號(hào)的第一和第二塊對(duì)應(yīng)的輸出信號(hào)。
圖6中例示的最后提升級(jí)605與圖5中例示的第一提升級(jí)501相逆。因此,在最后提升級(jí)605的第一步606中,x1與K3相乘。在步驟607中,這個(gè)乘法的結(jié)果被四舍五入為整數(shù)值。隨后在步驟608,從z1中減去經(jīng)過四舍五入后的值。因此,信號(hào)x2滿足等式x2=z1-_K3·x1_(64)其中,_*_表示四舍五入操作。
由于圖6中例示的變換元素的其余四個(gè)分別是提升級(jí)505、504、503和502的逆的提升級(jí)601、602、603和604,具有與最后提升級(jí)605相同的結(jié)構(gòu),所以省略其描述。僅僅應(yīng)該注意的是,在第四提升級(jí)604的相加步驟609后,相加步驟609的結(jié)果與-DN/2相乘以產(chǎn)生x1。
可以看出,圖6中的提升級(jí)605、604、603、602和601分別是圖5中的提升級(jí)501到505的逆。由于與矩陣Peo對(duì)應(yīng)的輸入信號(hào)的置換也可逆且所述反變換元素包括相應(yīng)的數(shù)據(jù)重組級(jí),所以所提供的方法是可逆的。因此,如果在圖1和圖2中例示的音頻編碼器100和音頻解碼器200中使用,就得到了用于無損音頻編碼的方法和裝置。
在本發(fā)明的說明書的結(jié)尾給出在這個(gè)實(shí)施例中使用的四舍五入的次數(shù)的分析。
圖7示出了根據(jù)本發(fā)明的實(shí)施例的圖像歸檔系統(tǒng)的體系結(jié)構(gòu)。
在圖7中,圖像源701,例如照相機(jī),提供模擬圖像信號(hào)。由模/數(shù)轉(zhuǎn)換器702來對(duì)該圖像信號(hào)進(jìn)行處理,以提供相應(yīng)的數(shù)字圖像信號(hào)。由無損圖像編碼器703對(duì)該數(shù)字圖像信號(hào)進(jìn)行無損編碼,其包括從時(shí)域到頻域的變換。在這個(gè)實(shí)施例中,時(shí)域?qū)?yīng)于所述圖像的坐標(biāo)空間。所述無損編碼后的圖像信號(hào)被存儲(chǔ)在存儲(chǔ)設(shè)備704中,例如硬盤或DVD。當(dāng)需要所述圖像時(shí),從所述存儲(chǔ)設(shè)備704中取出所述無損編碼后的圖像信號(hào),并且將其提供給無損圖像解碼器705,該無損圖像解碼器705對(duì)無損編碼后的圖像信號(hào)進(jìn)行解碼,并且重構(gòu)所述原始圖像信號(hào)而不會(huì)出現(xiàn)數(shù)據(jù)丟失。
例如,在所述圖像是半導(dǎo)體晶片的誤差圖且必須被存儲(chǔ)以用于以后分析的情況下,圖像信號(hào)的此種無損歸檔是重要的。
在下面,對(duì)根據(jù)本發(fā)明的用于將數(shù)字信號(hào)從時(shí)域變換到頻域和從頻域變換到時(shí)域的方法的又一實(shí)施例進(jìn)行說明。這個(gè)實(shí)施例優(yōu)選在圖7中例示的圖像歸檔系統(tǒng)的無損圖像編碼器703和無損圖像解碼器705中使用。
圖8例示了根據(jù)本發(fā)明的方法的實(shí)施例,其使用DWT-IV作為變換函數(shù)。
N點(diǎn)實(shí)輸入序列x(n)的DWT-IV如下定義y(m)=2NΣn=0N-1x(n)sin(π4+(m-1/2)(n+1/2)2πN)m,n=0,1,···,N-1---(65)]]>DWT-IV的變換矩陣 如下給出WNIV‾=2N[sin(π4+(m+1/2)(n+1/2)2πN)]m,n=0,1,,N-1---(66)]]>根據(jù)本發(fā)明的過程,所述DWT-IV矩陣被因式分解為下述形式WNIV‾=RN‾T‾PN‾---(67)]]>RN是如下定義的N×N的旋轉(zhuǎn)矩陣RN‾=12IN/2‾JN/2‾-JN/2‾IN/2‾---(68)]]>IN/2是N/2階的單位矩陣(與等式(29)一致)。JN/2是N/2階的反單位矩陣(與等式(30)一致)。
PN是N×N的置換矩陣PN‾=IN/2‾JN/2‾---(69)]]>T是如下定義的N×N的矩陣T‾=12CN/2IV‾-CN/2IV‾CN/2IVDN/2‾CN/2IVDN/2‾---(70)]]>其中 是N/2階的DCT-IV矩陣,CN/2IV‾=2(N/2)[cos((m+1/2)(n+1/2)π(N/2))]m,n=0,1,,N/2-1---(71)]]>DN/2是如下給出的N/2階的對(duì)角矩陣
根據(jù)本發(fā)明的過程,RN和T可以被進(jìn)一步被因式分解為提升矩陣的積T‾=T1T2T3‾=IN/2‾K1‾IN/2‾·DN/2‾K2‾IN/2‾IN/2‾K3‾IN/2‾---(73)]]>其中,K1‾=(2IN/2‾-CN/2IV‾DN/2‾)CN/2IV‾,K2‾=-CN/2IV‾2,K3‾=2CN/2IV‾DN/2‾-IN/2‾]]>和RN‾=R1‾R2‾R3‾=IN/2‾H1‾IN/2‾·IN/2‾H2‾IN/2‾·IN/2‾H3‾IN/2‾---(74)]]>其中 和 因此,等式(67)可以被寫為如下形式WNIV‾=R1‾R2‾R3‾T1‾T2‾T3‾PN‾---(77)]]>根據(jù)本發(fā)明的過程,盡可能地歸并提升步驟。
在這個(gè)實(shí)施例中,提升矩陣R3和T1可以被歸并為提升矩陣SS‾=R3‾T1‾=IN/2‾H3‾+K1‾IN/2‾---(78)]]>
根據(jù)(77)和(78),可以得到DWT-IV矩陣的下述因式分解公式WNIV‾=R1R2‾S‾T2T3‾PN‾---(79)]]>等式(79)表示根據(jù)本發(fā)明的整數(shù)DWT-IV變換的變換元素包括五個(gè)提升級(jí)。
此外,所述變換元素包括與所述置換矩陣PN對(duì)應(yīng)的數(shù)據(jù)重組級(jí)。所述數(shù)據(jù)重組級(jí)重新安排每個(gè)輸入數(shù)據(jù)塊中的分量次序。根據(jù)PN,按照下述方式來重新安排輸入數(shù)據(jù)向量向量的第一半部分保持不變,而向量的第二半部分上下顛倒,即PN‾x‾=PN‾x1x2···xN/2xN/2+1···xN-1xN=x1x2···xN/2xNxN-1···xN/2+1---(80)]]>在圖8中,第一提升級(jí)的輸入是數(shù)字信號(hào)的兩個(gè)塊x1和x2,z1、z2和z3是中間信號(hào),y1和y2分別是與所述數(shù)字信號(hào)的第一和第二塊對(duì)應(yīng)的輸出信號(hào)。
所述變換元素的輸入x和所述變換元素的第一提升級(jí)的兩個(gè)輸入塊x1和x2滿足等式x1‾x2‾=PN‾x‾---(81)]]>在下面,解釋第一提升級(jí)801,其是與提升矩陣T3對(duì)應(yīng)的提升級(jí)。假設(shè)v1‾v2‾]]>是在沒有四舍五入到整數(shù)值時(shí)的第一提升級(jí)的輸出向量,即v1‾v2‾=T3‾x1‾x2‾---(82)]]>使用有等式(73)提供的T3的定義,等式(82)可以被改寫為
v1‾v2‾=IN2K3‾IN2‾x1‾x2‾---(83)]]>由于在這個(gè)實(shí)施例中提供的用于整數(shù)DCT-IV的可逆算法中,包括到整數(shù)值的四舍五入。因此,根據(jù)等式(83),在第一提升級(jí)801的第一步806中,x1與K3相乘。在步驟807中,這個(gè)乘法的結(jié)果被四舍五入為整數(shù)值。在步驟808,經(jīng)過四舍五入后的值隨后被加到x2。因此,中間信號(hào)z1滿足等式z1=_K3·x1_+x2(84)其中,_*_表示四舍五入操作。
由于圖8中例示的變換元素的其余四個(gè)提升級(jí)802、803、804和805分別對(duì)應(yīng)于矩陣T2、S、R2和R1,其具有與第一提升級(jí)801相同的結(jié)構(gòu),所以省略其描述。僅僅應(yīng)該注意的是,在第二提升級(jí)802的相加步驟809中,根據(jù)T2的定義,x1與DN/2相乘。
在下面,參照?qǐng)D9描述反變換的變換元素的提升級(jí)。
圖9例示了圖8中例示的變換的反變換的變換元素的提升級(jí)。
在圖9中,第一提升級(jí)的輸入是數(shù)字信號(hào)的兩個(gè)塊y1和y2,z1、z2和z3是中間信號(hào),x1和x2分別是與所述數(shù)字信號(hào)的第一和第二塊對(duì)應(yīng)的輸出信號(hào)。
圖9中例示的最后提升級(jí)905與圖8中例示的第一提升級(jí)801相逆。因此,在最后提升級(jí)905的第一步906中,x1與K3相乘。在步驟907中,這個(gè)乘法的結(jié)果被四舍五入為整數(shù)值。隨后在步驟908,從z1中減去經(jīng)過四舍五入后的值。因此,信號(hào)x2滿足等式x2=z1-_K3·x1_ (85)其中,_*_表示四舍五入操作。
由于圖9中例示的變換元素的其余四個(gè)分別是提升級(jí)805、804、803和802的逆的提升級(jí)901、902、903和904,具有與最后提升級(jí)905相同的結(jié)構(gòu),所以省略其描述。僅僅應(yīng)該注意的是,在第四提升級(jí)904的相加步驟909后,相加步驟909的結(jié)果與DN/2相乘以產(chǎn)生x1。
可以看出,圖9中的提升級(jí)905、904、903、902和901分別是圖8中的提升級(jí)801到805的逆。由于與矩陣PN對(duì)應(yīng)的輸入信號(hào)的置換也可逆且所述反變換元素包括相應(yīng)的數(shù)據(jù)重組級(jí),所以所提供的方法是可逆的。因此,如果在圖7中例示的無損圖像編碼器703和無損圖像解碼器705中使用,那么就得到了用于無損圖像編碼的方法和裝置。
雖然在所述說明的實(shí)施例中,根據(jù)本發(fā)明的DCT-IV的方法被用于音頻編碼,而根據(jù)本發(fā)明的DWT-IV的方法被用于圖像編碼,但是根據(jù)本發(fā)明的DCT-IV的方法同樣可以用于圖像編碼,而根據(jù)本發(fā)明的DWT-IV的方法同樣可用于音頻編碼,并且這兩種方法都可以用于其他數(shù)字信號(hào)的編碼,比如視頻信號(hào)。
考慮等式(63)和(64),可以看出,在每個(gè)提升級(jí)中存在N/2次四舍五入。因此,考慮等式(59),可以看出,根據(jù)本發(fā)明的DCT-IV算法的變換元素的總四舍五入次數(shù)為N/2的五倍,也就是2.5N,其顯著低于根據(jù)現(xiàn)有技術(shù)的Nlog2N。
再次考慮等式(59),可以看出,當(dāng)N是大值時(shí),例如N=1024,主要的計(jì)算量用在對(duì)應(yīng)于與 的乘法的四個(gè)N/2點(diǎn)DCT-IV子程序上。因?yàn)榭梢愿鶕?jù)等式(47)和(49),使用兩個(gè)半長度DCT-IV加上前旋轉(zhuǎn)和后旋轉(zhuǎn)來計(jì)算浮點(diǎn)DCT-IV,所以所述提出的整數(shù)DCT-IV的算法復(fù)雜度可以被粗略地估計(jì)為浮點(diǎn)DCT-IV的算法復(fù)雜度的兩倍。
可以為整數(shù)DWT-IV變換函數(shù)得到類似的結(jié)論。
在下面,對(duì)使用離散傅立葉變換的又一實(shí)施例進(jìn)行說明。
作為N階歸一化FFT的變換矩陣的變換矩陣FN如下給出F‾N=1N[exp(-j2πmnN)]---(86)]]>m,n=0,1,…,N-1其中變換大小N是偶數(shù)。
遵循基-2(radix-2)時(shí)間抽取FFT算法,可以按照下述方式來分解FNF‾N=I‾N/2/2I‾N/2/2I‾N/2/2-I‾N/2/2I‾N/2W‾F‾N/2F‾N/2P‾eo---(87)]]>其中,如上所述,Peo是偶奇矩陣,即,置換矩陣,其通過將對(duì)應(yīng)于偶索引的分量與對(duì)應(yīng)于奇索引的分量分開來重新排序向量x的分量,其中x‾=x(0)···x(N-1)]]>使得x(0)x(2)···x(N-2)x(1)x(3)···x(N-1)=Peo‾x(0)···x(N-1)---(88)]]>假設(shè)FN/2是階數(shù)為N/2的歸一化FFT的變換矩陣。
假設(shè)W是如下給出的對(duì)角矩陣 其中WN=e-j2π/N。
如上,IN/2表示階數(shù)N/2的單位矩陣。
在等式(87)中,左邊第一個(gè)矩陣是偶奇矩陣Peo,其僅僅重新排序輸入向量中的分量。
在等式(87)中,左邊第二個(gè)矩陣可被按照下述方式因式分解為三個(gè)提升矩陣F‾N/2F‾N/2=I‾N/2-Q‾F‾N/2I‾N/2-Q‾F‾N/2I‾N/2I‾N/2F‾N/2I‾N/2---(89)]]>
其中Q是如下給出的階數(shù)為N/2的置換矩陣Q‾=100J‾N/2-1]]>以及JN/2-l是N/2-1階的反索引矩陣。
在等式(87)中,左邊第三個(gè)矩陣是反對(duì)角矩陣,其僅僅將輸入向量中的一半分量與在單位圓上的復(fù)數(shù)相乘。
這被解釋為復(fù)平面上的旋轉(zhuǎn)。
假設(shè)x=xr+jxr為輸入向量中的這樣一個(gè)分量。
另外,假設(shè)W‾kN=e-j2π/N=cos(2kπ/N)-jsin(2kπ/N)=ck-jsk]]>是復(fù)數(shù),即W的分量,在輸入向量已經(jīng)與等式(87)中的右邊第一矩陣和第二矩陣相乘后,當(dāng)所述輸入向量與W相乘時(shí),WNk與x相乘。
結(jié)果是y=yr+jyi=WNkx=(ckxi+skxi)+j(ckxi-skxi),]]>這等于x在復(fù)平面上反時(shí)針旋轉(zhuǎn)2kπ/N弧度。此種旋轉(zhuǎn)可以被如下因式分解為三個(gè)提升步驟yryi=cksk-skckxrxi=10c-1s11s0110c-1s0xixi---(90)]]>在等式(87)中,右邊第四個(gè)矩陣被按照下述方式因式分解為三個(gè)提升矩陣I‾N/2/2I‾N/2/2I‾N/2/2-I‾N/2/2=---(91)]]>(2-1)I‾N/2I‾N/2I‾N/2I‾N/2-1/2I‾N/2I‾N/2I‾N/2(2-1)I‾N/2I‾N/2]]>基-2頻率抽取FFT算法僅僅是等式(87)中的基-2時(shí)間抽取FFT算法的轉(zhuǎn)置。
因此,上述過程也可以應(yīng)用來因式分解按頻率抽取方式的FFT矩陣FN。
在提升矩陣中使用等式(87)中的右手側(cè)的因式分解,通過產(chǎn)生對(duì)應(yīng)于每個(gè)提升矩陣的提升級(jí),確定變換元素。
由于在上面已經(jīng)對(duì)如何根據(jù)提升矩陣產(chǎn)生提升級(jí)進(jìn)行了詳細(xì)描述,并且在這個(gè)實(shí)施例中,這方面的內(nèi)容與上述內(nèi)容相似。因此,在這里省略了說明。
在本說明書中通過參考在這里引入下述文獻(xiàn)H.S.Malvar,“Signal Processing With Lapped Transforms”ArtechHouse,1992;R.Geiger,T.Sporer,J.Koller,K.Brandenburg,“Audio Coding basedon Integer Transforms”AES 111thConvention,New York,USA,Sept.2001.
權(quán)利要求
1.一個(gè)用于確定給定變換函數(shù)的變換元素的過程,該變換函數(shù)包括變換矩陣且對(duì)應(yīng)于數(shù)字信號(hào)從時(shí)域到頻域或從頻域到時(shí)域的變換,其中-所述變換矩陣被分解為旋轉(zhuǎn)矩陣和輔助矩陣,當(dāng)該輔助矩陣與自身相乘時(shí),等于置換矩陣與整數(shù)對(duì)角矩陣相乘;-所述旋轉(zhuǎn)矩陣和所述輔助矩陣的每個(gè)都被分解為多個(gè)提升矩陣;-所述變換元素被確定為包括與所述提升矩陣對(duì)應(yīng)的多個(gè)提升級(jí)。
2.如權(quán)利要求1所述的過程,其中,所述變換函數(shù)是DCT-I變換函數(shù)、DCT-IV變換函數(shù)、DST-I變換函數(shù)、DST-IV變換函數(shù)、DFT-I變換函數(shù)、DFT-IV變換函數(shù)、DWT-I變換函數(shù)或DWT-IV變換函數(shù)。
3.如權(quán)利要求1或2所述的過程,其中,所述提升矩陣中的每個(gè)是在一個(gè)對(duì)角上具有兩個(gè)可逆整數(shù)矩陣的塊三角矩陣。
4.如權(quán)利要求3所述的過程,其中,每個(gè)提升矩陣中的所述可逆整數(shù)矩陣是單位矩陣或負(fù)單位矩陣。
5.如權(quán)利要求1到4中任何一個(gè)權(quán)利要求所述的過程,其中,所述變換元素包括五個(gè)提升級(jí)。
6.如權(quán)利要求1到5中任何一個(gè)權(quán)利要求所述的過程,其中,音頻信號(hào)或視頻信號(hào)被用作所述數(shù)字信號(hào)。
7.一個(gè)用于確定給定變換函數(shù)的變換元素的設(shè)備,該變換函數(shù)包括變換矩陣且對(duì)應(yīng)于數(shù)字信號(hào)從時(shí)域到頻域或從頻域到時(shí)域的變換,所述設(shè)備包括-第一分解單元,用于將所述變換矩陣分解為旋轉(zhuǎn)矩陣和輔助矩陣,當(dāng)該輔助矩陣與自身相乘時(shí),等于置換矩陣與整數(shù)對(duì)角矩陣相乘;-第二分解單元,用于將所述旋轉(zhuǎn)矩陣和所述輔助矩陣的每個(gè)分解為多個(gè)提升矩陣;-確定單元,用于將所述變換元素確定為包括與所述提升矩陣對(duì)應(yīng)的多個(gè)提升級(jí)。
8.一種用于使用變換元素將數(shù)字信號(hào)從時(shí)域變換到頻域或從頻域變換到時(shí)域的方法,其中所述變換元素對(duì)應(yīng)于給定變換函數(shù),該變換函數(shù)包括變換矩陣,其中所述變換元素是由一個(gè)過程確定的,該過程包括-將所述變換矩陣分解為旋轉(zhuǎn)矩陣和輔助矩陣,當(dāng)該輔助矩陣與自身相乘時(shí),等于置換矩陣與整數(shù)對(duì)角矩陣相乘;-將所述旋轉(zhuǎn)矩陣和所述輔助矩陣的每個(gè)分解為多個(gè)提升矩陣;-確定所述變換元素包括與所述提升矩陣對(duì)應(yīng)的多個(gè)提升級(jí);-每個(gè)提升級(jí)包括利用輔助變換和四舍五入單元對(duì)所述數(shù)字信號(hào)的子塊進(jìn)行處理。
9.一種用于將數(shù)字信號(hào)從時(shí)域變換到頻域或從頻域變換到時(shí)域的設(shè)備,包括變換單元,該變換單元利用變換元素來變換所述數(shù)字信號(hào),其中-所述變換元素對(duì)應(yīng)于給定變換函數(shù),該變換函數(shù)包括變換矩陣,其中所述變換元素是由一個(gè)過程確定的,該過程包括-將所述變換矩陣分解為旋轉(zhuǎn)矩陣和輔助矩陣,當(dāng)該輔助矩陣與自身相乘時(shí),等于置換矩陣與整數(shù)對(duì)角矩陣相乘,-將所述旋轉(zhuǎn)矩陣和所述輔助矩陣的每個(gè)分解為多個(gè)提升矩陣;-確定所述變換元素包括與所述提升矩陣對(duì)應(yīng)的多個(gè)提升級(jí);-對(duì)于每個(gè)提升級(jí)該設(shè)備包括對(duì)所述數(shù)字信號(hào)的子塊進(jìn)行處理的輔助變換單元,和對(duì)所述數(shù)字信號(hào)的子塊進(jìn)行處理的四舍五入單元。
10.一種計(jì)算機(jī)可讀介質(zhì),該計(jì)算機(jī)可讀介質(zhì)具有記錄于其上的程序,其中所述程序適合于使計(jì)算機(jī)執(zhí)行用于確定給定變換函數(shù)的變換元素的過程,該變換函數(shù)包括變換矩陣且對(duì)應(yīng)于數(shù)字信號(hào)從時(shí)域到頻域或從頻域到時(shí)域的變換,其中-所述變換矩陣被分解為旋轉(zhuǎn)矩陣和輔助矩陣,當(dāng)該輔助矩陣與自身相乘時(shí),等于置換矩陣與整數(shù)對(duì)角矩陣相乘;-所述旋轉(zhuǎn)矩陣和所述輔助矩陣的每個(gè)都被分解為多個(gè)提升矩陣;-所述變換元素被確定為包括與所述提升矩陣對(duì)應(yīng)的多個(gè)提升級(jí)。
11.一種算機(jī)可讀介質(zhì),該計(jì)算機(jī)可讀介質(zhì)具有記錄于其上的程序,其中所述程序適合于使計(jì)算機(jī)執(zhí)行用于使用變換元素將數(shù)字信號(hào)從時(shí)域變換到頻域或從頻域變換到時(shí)域的方法,其中-所述變換元素對(duì)應(yīng)于給定變換函數(shù),該變換函數(shù)包括變換矩陣,其中所述變換元素是由一個(gè)過程確定的,該過程包括-將所述變換矩陣分解為旋轉(zhuǎn)矩陣和輔助矩陣,當(dāng)該輔助矩陣與自身相乘時(shí),等于置換矩陣與整數(shù)對(duì)角矩陣相乘,-將所述旋轉(zhuǎn)矩陣和所述輔助矩陣的每個(gè)分解為多個(gè)提升矩陣;-確定所述變換元素包括與所述提升矩陣對(duì)應(yīng)的多個(gè)提升級(jí);-每個(gè)提升級(jí)包括利用輔助變換和四舍五入單元對(duì)所述數(shù)字信號(hào)的子塊進(jìn)行處理。
全文摘要
根據(jù)用于確定給定變換函數(shù)的變換元素的過程,該變換函數(shù)包括變換矩陣且對(duì)應(yīng)于數(shù)字信號(hào)從時(shí)域到頻域或從頻域到時(shí)域的變換,所述變換矩陣被分解為旋轉(zhuǎn)矩陣(306)和輔助矩陣(307),當(dāng)該輔助矩陣與自身相乘時(shí),等于置換矩陣與整數(shù)對(duì)角矩陣相乘。此外,所述旋轉(zhuǎn)矩陣(306)和所述輔助矩陣(307)的每個(gè)都被分解為多個(gè)提升矩陣(308)。另外,所述變換元素被確定為包括與所述提升矩陣(308)對(duì)應(yīng)的多個(gè)提升級(jí)(309)。本發(fā)明還提供一種方法,用于根據(jù)由上述過程確定的變換元素,將數(shù)字信號(hào)從時(shí)域變換到頻域。
文檔編號(hào)G06F17/14GK1882938SQ200480034076
公開日2006年12月20日 申請(qǐng)日期2004年5月6日 優(yōu)先權(quán)日2003年9月29日
發(fā)明者黃海濱, 林曉, 王逸平, 俞容山 申請(qǐng)人:新加坡科技研究局