專(zhuān)利名稱(chēng):音頻編碼方法
技術(shù)領(lǐng)域:
本發(fā)明涉及編碼音頻信號(hào)的方法。而且,本發(fā)明還涉及根據(jù)該方法操作的編碼器,以及一種通過(guò)這樣的編碼器生成的編碼數(shù)據(jù)的方案。此外,本發(fā)明還涉及可操作來(lái)對(duì)這樣的編碼器生成的數(shù)據(jù)進(jìn)行解碼的解碼器。另外,本發(fā)明還涉及一種應(yīng)用該編碼方法的編碼-解碼系統(tǒng)。
背景技術(shù):
音頻編碼器是大家所熟知。這些編碼器可操作來(lái)接收一個(gè)或多個(gè)輸入音頻信號(hào)并且處理它們以生成對(duì)應(yīng)的編碼輸出數(shù)據(jù)比特流。在音頻編碼器內(nèi)執(zhí)行的此類(lèi)處理涉及把一個(gè)或多個(gè)輸入信號(hào)分割成為分段,然后處理每個(gè)分段以便生成其對(duì)應(yīng)的包括在編碼輸出數(shù)據(jù)中的數(shù)據(jù)部分。
創(chuàng)建這類(lèi)比特流的傳統(tǒng)方法采用固定的統(tǒng)一時(shí)間分段。有利地,這些分段至少部分地重疊。用這樣的方式執(zhí)行的編碼器示例是PhilipsElectronicsN.V.所專(zhuān)有的SSC編解碼器,其操作模式現(xiàn)在被包括在已知的國(guó)際標(biāo)準(zhǔn)MPEG 4擴(kuò)展2中,即ISO/IEC 14496-32002/PDAM2涉及“高質(zhì)量音頻的參數(shù)編碼”的文本。
對(duì)音頻信號(hào)進(jìn)行編碼的其它方法已經(jīng)被建議。例如,在公開(kāi)的國(guó)際PCT申請(qǐng)PCT/SE00/01887(WO 01/26095)中,描述了采用自適應(yīng)的窗口切換的現(xiàn)代音頻編碼器,即音頻編碼器根據(jù)輸入信號(hào)的統(tǒng)計(jì)量來(lái)切換時(shí)間分段長(zhǎng)度。在一個(gè)實(shí)施中,通過(guò)把子頻帶抽樣從固定尺寸濾波組自適應(yīng)地歸組為頻帶和時(shí)間分段來(lái)實(shí)現(xiàn)輸入信號(hào)的譜包絡(luò)的不統(tǒng)一時(shí)間及頻率抽樣,其中每個(gè)頻帶和時(shí)間分段生成一個(gè)包絡(luò)抽樣。這允許在濾波器組的限制范圍內(nèi)的任意時(shí)間和頻率分辨率的瞬時(shí)選擇。這類(lèi)編碼器優(yōu)選地默認(rèn)相對(duì)長(zhǎng)的時(shí)間分段和精細(xì)的頻率分辨率。在信號(hào)瞬變的時(shí)域附近,使用相對(duì)較短的時(shí)間分段,從而可以使用較大的頻率階躍以便保持?jǐn)?shù)據(jù)尺寸在限制內(nèi)。而且,為了提高這類(lèi)不統(tǒng)一瞬時(shí)取樣的益處,使用可變長(zhǎng)度的比特流幀。
發(fā)明內(nèi)容
本發(fā)明人已經(jīng)理解當(dāng)編碼音頻信號(hào)時(shí),例如如上所述,根據(jù)比特率和/或感覺(jué)失真來(lái)使用可變的分段將是有益的。例如,對(duì)于穩(wěn)定音調(diào)使用較長(zhǎng)的分段、對(duì)于快速變化的音調(diào)使用較短的分段以便在瞬變之前立即開(kāi)始分段等等在技術(shù)上是有利的。特別地,本發(fā)明人已經(jīng)設(shè)想對(duì)于同一編碼器的不同子編碼方法采用不同時(shí)間分段模式是更有益的。
本發(fā)明的一個(gè)目的是提供一種應(yīng)用動(dòng)態(tài)可變信號(hào)分段的增強(qiáng)型信號(hào)編碼方法。
根據(jù)本發(fā)明的第一方面,提供一種對(duì)一個(gè)或多個(gè)輸入信號(hào)進(jìn)行編碼來(lái)生成一個(gè)或多個(gè)對(duì)應(yīng)的編碼輸出信號(hào)的方法,該方法包括下列步驟(a)接收一個(gè)或多個(gè)輸入信號(hào)并且把它們適當(dāng)?shù)胤职l(fā)給一個(gè)編碼器的子編碼器;(b)關(guān)于一個(gè)或多個(gè)已分發(fā)輸入信號(hào)的一個(gè)或多個(gè)信號(hào)特性來(lái)處理分發(fā)給子編碼器的一個(gè)或多個(gè)輸入信號(hào)以便從子編碼器生成對(duì)應(yīng)的代表性參數(shù);(c)合并子編碼器的參數(shù)輸出以便生成一個(gè)或多個(gè)已編碼輸出信號(hào),其中在子編碼器中一個(gè)或多個(gè)已分發(fā)輸入信號(hào)的處理涉及把一個(gè)或多個(gè)已分發(fā)輸入信號(hào)分割成為分段以便分析,所述分段具有相關(guān)聯(lián)的時(shí)域持續(xù)時(shí)間,該相關(guān)聯(lián)的時(shí)域持續(xù)時(shí)間至少部分地響應(yīng)于一個(gè)或多個(gè)已分發(fā)輸入信號(hào)中存在的信息內(nèi)容而動(dòng)態(tài)變化。
本發(fā)明的優(yōu)勢(shì)在于該編碼方法能夠提供如下優(yōu)點(diǎn)中的一個(gè)或多個(gè)感覺(jué)更好的編碼質(zhì)量,加強(qiáng)了的數(shù)據(jù)壓縮。
優(yōu)選地,在該方法中,一個(gè)或多個(gè)已分發(fā)輸入信號(hào)的分段在子編碼器中被相互異步地處理。這種異步操作能夠使每個(gè)子編碼器能在該方法中執(zhí)行的相應(yīng)的信號(hào)處理方面最佳地起作用。
優(yōu)選地,在該方法中,關(guān)于每個(gè)子編碼器的一個(gè)或多個(gè)已分發(fā)輸入信號(hào)的分段至少部分地時(shí)域地重疊。這類(lèi)重疊益處在于它減少了從一個(gè)分段到另一個(gè)時(shí)域地相鄰分段時(shí)信號(hào)特性中的突變。
優(yōu)選地,在該方法中,子編碼器被安排來(lái)關(guān)于下列中的至少一個(gè)來(lái)處理一個(gè)或多個(gè)已分發(fā)輸入信號(hào)正弦輸入信號(hào)信息內(nèi)容,輸入信號(hào)波形信息內(nèi)容,輸入信號(hào)噪聲信息內(nèi)容。
優(yōu)選地,在該方法中,一個(gè)或多個(gè)已分發(fā)輸入信號(hào)的分段處理涉及下列至少一個(gè)
(a)生成相對(duì)較長(zhǎng)的分段以用于一個(gè)或多個(gè)已分發(fā)輸入信號(hào)中存在的穩(wěn)定音調(diào);(b)生成相對(duì)較短的分段以用于一個(gè)或多個(gè)已分發(fā)輸入信號(hào)中存在的快速變化的音調(diào);和(c)安排分段在一個(gè)或多個(gè)已分發(fā)輸入信號(hào)中發(fā)生的瞬變之前立即基本上結(jié)束。
根據(jù)輸入信號(hào)內(nèi)容的這種分段適配有利于改善該方法所提供的編碼的感覺(jué)質(zhì)量。
優(yōu)選地,在該方法中,已編碼輸出信號(hào)被再細(xì)分成幀,其中每個(gè)幀包括與子編碼器提供的在與該幀相關(guān)聯(lián)的時(shí)域持續(xù)時(shí)間內(nèi)開(kāi)始的分段有關(guān)的信息。幀的這種定義致使它更易于在使用該方法生成的編碼數(shù)據(jù)序列內(nèi)提供隨機(jī)接入。因此,更優(yōu)選地,在該方法中,每個(gè)幀包括的分段依時(shí)間次序來(lái)排列。更優(yōu)選地,在該方法中,每個(gè)幀又包括描述幀的時(shí)域開(kāi)始和幀的開(kāi)始之后開(kāi)始的第一分段之間的時(shí)域持續(xù)時(shí)間的參數(shù)數(shù)據(jù)。
優(yōu)選地,在該方法中,包括在每個(gè)幀內(nèi)的大量分段取決于存在于一個(gè)或多個(gè)已分發(fā)輸入信號(hào)中的信息內(nèi)容而是動(dòng)態(tài)變化的。
根據(jù)本發(fā)明的第二方面,這里提供一種可操作來(lái)處理一個(gè)或多個(gè)輸入信號(hào)并生成對(duì)應(yīng)的一個(gè)或多個(gè)已編碼輸出信號(hào)的編碼器,該編碼器被安排來(lái)實(shí)現(xiàn)根據(jù)本發(fā)明第一方面的方法。
根據(jù)本發(fā)明的第三方面,這里提供一種可操作來(lái)接收一個(gè)或多個(gè)已編碼輸出信號(hào)并把它們解碼以便生成一個(gè)或多個(gè)對(duì)應(yīng)的解碼信號(hào)的解碼器,該解碼器被安排來(lái)能夠處理根據(jù)本發(fā)明第一方面的方法生成的一個(gè)或多個(gè)已編碼輸出信號(hào)。
根據(jù)本發(fā)明的第四方面,這里提供一種信號(hào)處理系統(tǒng),它被安排來(lái)包括根據(jù)本發(fā)明第二方面的編碼器和根據(jù)本發(fā)明第三方面的解碼器。
根據(jù)本發(fā)明的第六方面,這里提供通過(guò)采用根據(jù)本發(fā)明第一方面的方法所生成的已編碼輸出信號(hào)數(shù)據(jù),所述數(shù)據(jù)經(jīng)由一種數(shù)據(jù)載體而被傳送。更優(yōu)選地,數(shù)據(jù)載體包括通信網(wǎng)絡(luò)和數(shù)據(jù)存儲(chǔ)媒體中的至少一個(gè)。
根據(jù)本發(fā)明的第七方面,這里提供可在計(jì)算機(jī)硬件上執(zhí)行用于實(shí)現(xiàn)根據(jù)本發(fā)明第一方面的方法的軟件。
應(yīng)當(dāng)理解本發(fā)明的那些特征可以任何組合方式被合并而沒(méi)有背離本發(fā)明的范圍。
本發(fā)明的實(shí)施例現(xiàn)在將參考下列附圖并只是通過(guò)舉例的方法被描述,其中圖1是一個(gè)編碼器的示意圖,它可操作來(lái)接收一個(gè)音頻輸入信號(hào)并且處理該音頻輸入信號(hào),從而以編碼輸出比特流的形式生成一個(gè)對(duì)應(yīng)的已編碼輸出信號(hào);圖2是一個(gè)時(shí)域圖表,它說(shuō)明了使用本技術(shù)領(lǐng)域中所知的固定分段在圖1的編碼器內(nèi)發(fā)生的處理;圖3是一個(gè)時(shí)域圖表,它說(shuō)明了使用根據(jù)本發(fā)明的可變分段在圖1的編碼器內(nèi)發(fā)生的處理;圖4是一個(gè)根據(jù)本發(fā)明的編碼器的示意圖,該編碼器具有以并行方式配置的其相關(guān)聯(lián)的子編碼器;圖5是一個(gè)根據(jù)本發(fā)明的編碼器的示意圖,該編碼器具有以級(jí)聯(lián)方式配置的其相關(guān)聯(lián)的子編碼器;和圖6是一個(gè)根據(jù)發(fā)明的解碼器的示意圖,它可操作來(lái)解碼由根據(jù)本發(fā)明的編碼器生成的編碼數(shù)據(jù)。
具體實(shí)施例方式
在圖1中示出了一個(gè)已知編碼器10,它可操作來(lái)接收輸入信號(hào)20(即Si);并且編碼信號(hào)20來(lái)生成對(duì)應(yīng)的編碼輸出數(shù)據(jù)30(即BSO)。輸出數(shù)據(jù)30是比特流的形式。
編碼器10的同時(shí)實(shí)施依靠能夠把輸入信號(hào)20劃分成如圖2中所示的等長(zhǎng)分段;為了簡(jiǎn)化描述,圖2中的拱形指出分段間隔,盡管其中不存在相互重疊,但是實(shí)際上,某些重疊被優(yōu)選地利用。編碼器10中采用的重疊被選擇性地安排為可變的,例如響應(yīng)于輸入信號(hào)20中的信息內(nèi)容而使之可變;有利地,對(duì)于輸入信號(hào)20中存在的瞬變,不采用和采用相對(duì)少的重疊以免出現(xiàn)前回聲(pre-echo)效應(yīng)。在消逝時(shí)間(T)用橫坐標(biāo)軸50來(lái)表示的圖2中示出一個(gè)時(shí)域圖表。信號(hào)20被劃分成互相具有類(lèi)似持續(xù)時(shí)間的幀,例如幀F(xiàn)1、F2、F3。在編碼器10中,信號(hào)20被分析并且描述信號(hào)20的不同類(lèi)型的參數(shù)被確定;優(yōu)選地,這些參數(shù)涉及(a)由100表示的瞬變信號(hào)信息內(nèi)容;(b)由110表示的正弦信號(hào)信息內(nèi)容;和
(c)由120表示的噪聲相關(guān)的信號(hào)信息內(nèi)容。
F1到F3中的每個(gè)幀關(guān)于一種所述參數(shù)被進(jìn)一步細(xì)分成分段,例如幀F(xiàn)1到F3包括與瞬變信息內(nèi)容有關(guān)的分段t1到t12、與正弦信息內(nèi)容有關(guān)的分段s1到s12、以及與噪聲信息內(nèi)容有關(guān)的分段n1到n12。每個(gè)分段都生成一個(gè)或多個(gè)描述生成該分段的信號(hào)20的一部分的參數(shù),這些一個(gè)或多個(gè)參數(shù)被包括在輸出30中。
編碼器10的一個(gè)示例是一個(gè)專(zhuān)有的Philips SSC編解碼器,其采用基本上16ms持續(xù)時(shí)間的分段,其中,分段被至少部分地重疊。而且,編解碼器采用三個(gè)不同的子編碼方法并且可操作來(lái)在輸出30逐個(gè)分段地把與所述分段相關(guān)聯(lián)的參數(shù)輸出到比特流中,在適當(dāng)?shù)那闆r下用時(shí)間來(lái)區(qū)別。
在編碼器10中,來(lái)自幾個(gè)連續(xù)分段的參數(shù)形成一個(gè)對(duì)應(yīng)幀例如,幀F(xiàn)1包括分段T1到T4、s1到s4以及n1到n4。由于這些分段等長(zhǎng),所以幀F(xiàn)1到F3也以統(tǒng)一速率來(lái)更新。而且,幀F(xiàn)1到F3中的每個(gè)幀幾乎是自足的,其使得比特流輸出30適于在例如互聯(lián)網(wǎng)的通信網(wǎng)絡(luò)上進(jìn)行流式傳輸,或者適于存儲(chǔ)到一個(gè)提供用于向其中串聯(lián)寫(xiě)入并從中串聯(lián)讀出的數(shù)據(jù)載體上,例如一個(gè)音頻CD。在圖2的圖表中,盡管只有三個(gè)幀F(xiàn)1到F3被示出以說(shuō)明固定時(shí)間持續(xù)時(shí)間分段,然而應(yīng)當(dāng)理解,根據(jù)信號(hào)20中的傳送的節(jié)目?jī)?nèi)容持續(xù)時(shí)間,信號(hào)20由輸出信號(hào)30中超過(guò)三個(gè)的固定持續(xù)時(shí)間幀來(lái)表示。
在輸出30傳輸期間有分組損失的情況下,例如在諸如互聯(lián)網(wǎng)或無(wú)線網(wǎng)之類(lèi)的通信網(wǎng)絡(luò)上,固定持續(xù)時(shí)間的幀以及分段的差錯(cuò)傳播將被限制,從而潛在地允許誤差掩蔽。而且,這類(lèi)固定的持續(xù)時(shí)間還允許在幾乎任何給定時(shí)間重放開(kāi)始,并且因此基本上相當(dāng)于隨機(jī)接入。
盡管使用傳統(tǒng)的固定持續(xù)時(shí)間分段以及相關(guān)聯(lián)的幀具有許多有益的特性,然而本發(fā)明人已經(jīng)理解所述優(yōu)點(diǎn)可以通過(guò)實(shí)現(xiàn)編碼器10來(lái)采用具有可變持續(xù)時(shí)間的分段而被導(dǎo)出。而且,在數(shù)據(jù)壓縮以及更好的主觀重放質(zhì)量方面的進(jìn)一步利益可以通過(guò)對(duì)于每個(gè)參數(shù)類(lèi)型采用不同分段而被導(dǎo)出。換言之,響應(yīng)于輸入信號(hào)內(nèi)容的可變分段持續(xù)時(shí)間提供了與比特率和感覺(jué)失真有關(guān)的利益。
特別地,本發(fā)明人已經(jīng)發(fā)現(xiàn)如下措施是優(yōu)選的(a)對(duì)于基本上穩(wěn)定的音調(diào)采用相對(duì)較長(zhǎng)的分段;(b)對(duì)于迅速變化的音調(diào)采用相對(duì)較短的分段;并且(c)安排分段先于輸入信號(hào)20中的瞬變立即開(kāi)始,即在時(shí)間上靠前。
從而,對(duì)于不同的子編碼方法采用互相不同的時(shí)間分段模式是有益的,即生成不同參數(shù)類(lèi)型,這將隨后參考圖3被描述。
在圖3中,當(dāng)用根據(jù)本發(fā)明的方法被實(shí)現(xiàn)時(shí),來(lái)自編碼器20的參數(shù)輸出的時(shí)域圖表被示出。該時(shí)域圖表包括上述的表示時(shí)間(T)的橫坐標(biāo)軸50以及三個(gè)類(lèi)型的參數(shù)輸出,即(a)對(duì)應(yīng)于描述輸入信號(hào)20中存在的正弦信息的參數(shù)的分段s1到s12,這些分段由群200來(lái)表示;(b)分段w1到w12對(duì)應(yīng)于描述輸入信號(hào)10中存在的波形特性的參數(shù),這些分段由群210來(lái)表示;和(c)分段n1到n12對(duì)應(yīng)于描述輸入信號(hào)20中存在的噪聲信息的參數(shù),這些分段由群220來(lái)表示。
對(duì)應(yīng)于群200、210、220的參數(shù)被合并來(lái)生成輸出30。應(yīng)當(dāng)理解,如圖4中所示,群200、210、220優(yōu)選地對(duì)應(yīng)于編碼器20內(nèi)包括的三個(gè)子編碼器,然而應(yīng)當(dāng)理解,其它許多子編碼器也可以依照本發(fā)明被采用。
在圖4中,可操作來(lái)輸出圖3所示數(shù)據(jù)的編碼器10如圖所示地被實(shí)現(xiàn),其中,子編碼器300、310、320被并聯(lián)耦合來(lái)接收經(jīng)由分路器380從輸入信號(hào)20分別導(dǎo)出的輸入信號(hào)350、360、370并且生成對(duì)應(yīng)的分別對(duì)應(yīng)于參數(shù)群200、210、220的參數(shù)輸出??蛇x地,分離器380被安排來(lái)向子編碼器300、310、320提供互相類(lèi)似的輸入信號(hào)350、360、370。可替換地,這些輸入信號(hào)350、360、370的一個(gè)或多個(gè)可以被安排成相互不同以便協(xié)助在編碼器10內(nèi)執(zhí)行的處理。來(lái)自子編碼器300、310、320的參數(shù)輸出被連接到一個(gè)生成輸出30的多路復(fù)用器400。
幾個(gè)方面將在圖3中被標(biāo)識(shí),其使之區(qū)別于圖2,即(a)與采用了瞬變描述參數(shù)、正弦參數(shù)和噪聲描述參數(shù)圖2相比,輸入信號(hào)20由正弦描述參數(shù)、波形描述參數(shù)以及噪聲描述參數(shù)來(lái)表示;(b)盡管幀F(xiàn)1到F3的標(biāo)稱(chēng)位置在圖3中被示出,但是不同于示出同步性的圖2,不是所有的分段都在幀F(xiàn)1到F3的邊界結(jié)束;(c)不同群200、210、220中的分段具有互相不同的持續(xù)時(shí)間;和(d)每個(gè)群200、210內(nèi)的分段具有互相不同的持續(xù)時(shí)間,然而編碼器10能夠支持更規(guī)則的恒定時(shí)間間隔分段,例如對(duì)于群220而言,其中,輸入信號(hào)20中存在的關(guān)于噪聲內(nèi)容的信息指示恒定持續(xù)時(shí)間分段編碼是有益的;換言之,根據(jù)輸入信號(hào)20的特性,根據(jù)本發(fā)明操作的編碼器10優(yōu)選地能夠在固定分段持續(xù)時(shí)間和可變分段持續(xù)時(shí)間之間切換。
如果需要,根據(jù)本發(fā)明操作的編碼器10可以安排它的參數(shù)群在輸出30被多路復(fù)用以便同時(shí)終止,從而形成相對(duì)較大的幀;優(yōu)選地,來(lái)自根據(jù)本發(fā)明操作的編碼器10的輸出30被細(xì)分成100ms長(zhǎng)度的統(tǒng)一幀。優(yōu)選地,幀持續(xù)時(shí)間基于一個(gè)傳遞給編碼器10的目標(biāo)和峰值比特率約束條件被確定。這些約束條件優(yōu)選地由編碼器10與之耦合的一個(gè)通信網(wǎng)絡(luò)來(lái)定義。
在根據(jù)本發(fā)明生成的輸出數(shù)據(jù)30中,通過(guò)每個(gè)分組攜帶與所有在給定幀中開(kāi)始的分段有關(guān)的信息的方式,與分段相關(guān)聯(lián)的參數(shù)被歸組為數(shù)據(jù)分組。這樣的一個(gè)數(shù)據(jù)方案在圖3中被說(shuō)明。
基于用于在圖3中說(shuō)明的三個(gè)幀的分段模式,輸出數(shù)據(jù)30包括表格1所示的一個(gè)數(shù)據(jù)序列表1
優(yōu)選地,輸出30還包括用于每個(gè)子編碼器的傳送與給定幀和其第一后續(xù)分段之間距離的相關(guān)的信息的附加參數(shù)。這些附加參數(shù)優(yōu)選地表示輸出數(shù)據(jù)的一個(gè)小比例,例如小于5%。而且,本發(fā)明人已經(jīng)發(fā)現(xiàn)分段內(nèi)編碼潛在地與時(shí)間差分編碼一樣有效,例如,分段內(nèi)編碼允許在任何給定幀中的第一分段開(kāi)始重放而不會(huì)遭受編碼信號(hào)衰退,例如解碼音頻質(zhì)量衰退。例如,一個(gè)由表格1表示的編碼方案還能夠提供隨機(jī)接入和誤差掩蔽。
應(yīng)當(dāng)理解,例如圖4中說(shuō)明的根據(jù)本發(fā)明的編碼器可以用一個(gè)或多個(gè)在軟件控制下操作的計(jì)算裝置來(lái)實(shí)現(xiàn)。替換和另外地,編碼器以專(zhuān)用集成電路(ASIC)的形式來(lái)實(shí)現(xiàn)。
圖4中說(shuō)明的編碼器10被這樣配置,它的子編碼器300、310、320以并行方式來(lái)安排。應(yīng)當(dāng)理解,用于編碼器10的其它配置也是可能的。例如在圖5中示出了編碼器10,其子編碼器300、310、320通過(guò)包括兩個(gè)減法單元450、460而以級(jí)聯(lián)方式被耦合。然而,圖5中的第一子編碼器300接收向那里分發(fā)的輸入信號(hào)20,隨著輸入信號(hào)20的特征被編碼到輸出30中,第二和第三子編碼器逐步接收殘留信號(hào)。圖5中存在的編碼器10的級(jí)聯(lián)配置有益于編碼差錯(cuò),即在子編碼器操作中出現(xiàn)的不精確性至少可以部分地被隨后的子編碼器310、320校正,從而潛在地使得編碼質(zhì)量與圖4的編碼器10相比感覺(jué)地更好。
為了補(bǔ)充根據(jù)本發(fā)明的編碼器,對(duì)應(yīng)的解碼器可操作來(lái)接收輸出30并且重建輸入信號(hào)S1的表示;例如,這類(lèi)解碼器如圖6所示并且通常表示為500。優(yōu)選地,解碼器500用多個(gè)子解碼器來(lái)實(shí)現(xiàn),例如能夠互相異步地操作來(lái)處理比特流輸出30的子解碼器510、520、530。而且,解碼器500被優(yōu)選地實(shí)現(xiàn)為一個(gè)或多個(gè)ASIC和/或在計(jì)算硬件上操作的軟件。盡管解碼器500被示出具有其以并聯(lián)配置耦合的子編碼器510、520、530,然而應(yīng)當(dāng)理解,解碼器500還可以用類(lèi)似于圖5中所示的編碼器10的級(jí)聯(lián)方式來(lái)實(shí)現(xiàn)。
應(yīng)當(dāng)理解,上文中描述的本發(fā)明實(shí)施例可以在不脫離由附加權(quán)利要求定義的本發(fā)明范圍的前提下被更改。
在所附的權(quán)利要求中,括弧/圓括號(hào)內(nèi)的數(shù)字和其它符號(hào)被包括來(lái)幫助理解權(quán)利要求,而不是意在以任何方式來(lái)限制權(quán)利要求的范圍。
當(dāng)解釋說(shuō)明書(shū)及其相關(guān)聯(lián)的權(quán)利要求時(shí),諸如“包括了”、“包括”、“合并了”、“包含”、“是”和“具有”之類(lèi)的表示將以一個(gè)非排除的方式來(lái)解釋?zhuān)幢唤忉尦蛇€允許其它沒(méi)有明確定義的項(xiàng)和元件存在。對(duì)單數(shù)的參考也將被解釋成對(duì)復(fù)數(shù)的參考,反之亦然。
權(quán)利要求
1.一種對(duì)一個(gè)或多個(gè)輸入信號(hào)(20)進(jìn)行編碼來(lái)生成一個(gè)或多個(gè)對(duì)應(yīng)的編碼輸出信號(hào)(30)的方法,該方法包括下列步驟(a)接收一個(gè)或多個(gè)輸入信號(hào)(20)并把它們適當(dāng)?shù)胤职l(fā)給編碼器(10)的子編碼器(300、310、320);(b)關(guān)于一個(gè)或多個(gè)已分發(fā)輸入信號(hào)(20)的一個(gè)或多個(gè)信號(hào)特性(200、210、220)來(lái)處理被分給子編碼器(300、310、320)的一個(gè)或多個(gè)輸入信號(hào)(20),以便從子編碼器生成對(duì)應(yīng)的代表性參數(shù)輸出(200、210、220);(c)合并子編碼器(300、310、320)的參數(shù)輸出(200、210、220)以便生成一個(gè)或多個(gè)已編碼輸出信號(hào)(30),其中,在子編碼器(300、310、320)中一個(gè)或多個(gè)已分發(fā)輸入信號(hào)(20)的處理涉及把一個(gè)或多個(gè)已分發(fā)輸入信號(hào)(20)分割成分段以便分析,所述分段具有相關(guān)聯(lián)的時(shí)域持續(xù)時(shí)間,該相關(guān)聯(lián)的時(shí)域持續(xù)時(shí)間至少可部分地響應(yīng)于一個(gè)或多個(gè)已分發(fā)輸入信號(hào)(20)中存在的信息內(nèi)容而動(dòng)態(tài)變化。
2.根據(jù)權(quán)利要求1的方法,包括一個(gè)用于安排子編碼器的步驟,該子編碼器將用一種級(jí)聯(lián)的方式來(lái)配置以用于容納從子編碼器生成的編碼殘留。
3.根據(jù)權(quán)利要求1的編碼方法,其中,一個(gè)或多個(gè)已分發(fā)輸入信號(hào)(20)的分段在子編碼器(300、310 320)中被相互異步地處理。
4.根據(jù)權(quán)利要求1的方法,其中,關(guān)于每個(gè)子編碼器(300、310、320)的一個(gè)或多個(gè)已分發(fā)輸入信號(hào)(20)的分段至少部分地時(shí)域重疊。
5.根據(jù)權(quán)利要求1的方法,其中,子編碼器(300、310、320)被安排來(lái)關(guān)于下列中的至少一個(gè)來(lái)處理一個(gè)或多個(gè)已分發(fā)輸入信號(hào)(20)正弦輸入信號(hào)信息內(nèi)容(200)、輸入信號(hào)波形信息內(nèi)容(210)、輸入信號(hào)噪聲信息內(nèi)容(220)。
6.根據(jù)權(quán)利要求1的方法,其中,一個(gè)或多個(gè)已分發(fā)輸入信號(hào)(20)的分段處理涉及下列至少一個(gè)(a)生成相對(duì)較長(zhǎng)的分段以用于一個(gè)或多個(gè)已分發(fā)輸入信號(hào)中存在的穩(wěn)定音調(diào);(b)生成相對(duì)較短的分段以用于一個(gè)或多個(gè)已分發(fā)輸入信號(hào)中存在的迅速變化音調(diào);和(c)安排分段在一個(gè)或多個(gè)已分發(fā)輸入信號(hào)中發(fā)生的瞬變之前基本上立即結(jié)束。
7.根據(jù)權(quán)利要求1的方法,其中,已編碼輸出信號(hào)被細(xì)分成幀(F1、F2、F3),其中,每個(gè)幀包括與從子編碼器(300、310、320)提供的在與該幀(F1、F2、F3;表1)相關(guān)聯(lián)的時(shí)域持續(xù)時(shí)間內(nèi)開(kāi)始的分段有關(guān)的信息。
8.根據(jù)權(quán)利要求7的方法,其中,每個(gè)幀內(nèi)包括的分段依時(shí)間次序來(lái)排列。
9.根據(jù)權(quán)利要求8的方法,其中,每個(gè)幀另外還包括描述幀的時(shí)域開(kāi)始和該幀的開(kāi)始之后開(kāi)始的第一分段之間的時(shí)域持續(xù)時(shí)間的參數(shù)數(shù)據(jù)。
10.根據(jù)權(quán)利要求7的方法,其中,每個(gè)幀內(nèi)包括的大量分段可根據(jù)一個(gè)或多個(gè)已分發(fā)輸入信號(hào)(20)中存在的信息內(nèi)容而動(dòng)態(tài)變化。
11.一種可操作來(lái)處理一個(gè)或多個(gè)輸入信號(hào)(20)并且生成對(duì)應(yīng)的一個(gè)或多個(gè)已編碼輸出信號(hào)(30)的編碼器(10),該編碼器包括(a)用于接收一個(gè)或多個(gè)輸入信號(hào)(20)并且把它們適當(dāng)?shù)胤职l(fā)給編碼器(10)的子編碼器(300、310、320)的裝置;(b)用于關(guān)于一個(gè)或多個(gè)已分發(fā)輸入信號(hào)(20)的一個(gè)或多個(gè)信號(hào)特性(200、210、220)來(lái)處理被分給子編碼器(300、310、320)的一個(gè)或多個(gè)輸入信號(hào)(20),以便從子編碼器生成對(duì)應(yīng)的代表性參數(shù)輸出(200、210、220)的裝置;(c)用于合并子編碼器(300、310、320)的參數(shù)輸出(200、210、220)以便生成一個(gè)或多個(gè)編碼輸出信號(hào)(30)的裝置,其中,在子編碼器(300、310、320)中處理一個(gè)或多個(gè)已分發(fā)輸入信號(hào)(20)涉及把一個(gè)或多個(gè)已分發(fā)輸入信號(hào)(20)分割成分段以便分析,所述分段具有相關(guān)聯(lián)的時(shí)域持續(xù)時(shí)間,該相關(guān)聯(lián)的時(shí)域持續(xù)時(shí)間可至少部分響應(yīng)于一個(gè)或多個(gè)已分發(fā)輸入信號(hào)(20)中存在的信息內(nèi)容動(dòng)態(tài)變化。
12.一種可操作來(lái)接收一個(gè)或多個(gè)已編碼輸出信號(hào)(30)并且把它們解碼以便生成一個(gè)或多個(gè)對(duì)應(yīng)的解碼信號(hào)的解碼器(500),該解碼器(500)被安排為能夠處理通過(guò)根據(jù)權(quán)利要求1的方法生成的一個(gè)或多個(gè)已編碼輸出信號(hào)(30)。
13.一種信號(hào)處理系統(tǒng),被安排來(lái)包括根據(jù)權(quán)利要求11的編碼器(10)和根據(jù)權(quán)利要求12的解碼器(500)。
14.通過(guò)采用根據(jù)權(quán)利要求1的方法而生成的編碼輸出信號(hào)數(shù)據(jù)(30),所述數(shù)據(jù)經(jīng)由一個(gè)數(shù)據(jù)載體來(lái)傳送。
15.根據(jù)權(quán)利要求14的編碼數(shù)據(jù)(30),其中,數(shù)據(jù)載體包括通信網(wǎng)絡(luò)和數(shù)據(jù)存儲(chǔ)媒體中的至少一個(gè)。
16.可在計(jì)算機(jī)硬件上執(zhí)行來(lái)實(shí)現(xiàn)根據(jù)權(quán)利要求1的方法的軟件。
全文摘要
這里描述了一種對(duì)輸入信號(hào)(20)進(jìn)行編碼來(lái)生成一個(gè)對(duì)應(yīng)的已編碼輸出信號(hào)(30)的方法以及被安排來(lái)實(shí)現(xiàn)該方法的編碼器(10)。該方法包括如下步驟(a)把輸入信號(hào)分發(fā)給編碼器(10)的子編碼器(300,310,320);(b)在子編碼器(300,310,320)那里處理已分發(fā)輸入信號(hào)(20)以便從子編碼器(300,310,320)生成對(duì)應(yīng)的代表性參數(shù)輸出(200,210,220);和(c)合并子編碼器(300,310,320)的參數(shù)輸出(200,210,220)以便生成已編碼輸出信號(hào)(30)。子編碼器(300,310,320)中的輸入信號(hào)(20)的處理涉及把輸入信號(hào)(20)分段以便分析,這樣的分段具有相關(guān)聯(lián)的時(shí)域持續(xù)時(shí)間,相關(guān)聯(lián)的時(shí)域持續(xù)時(shí)間響應(yīng)于輸入信號(hào)(20)中存在的信息內(nèi)容至少部分地動(dòng)態(tài)變化。這樣變化的分段持續(xù)時(shí)間能夠改善感覺(jué)編碼質(zhì)量并且增強(qiáng)可達(dá)到的數(shù)據(jù)壓縮。
文檔編號(hào)G10L19/02GK1973321SQ200580020424
公開(kāi)日2007年5月30日 申請(qǐng)日期2005年6月14日 優(yōu)先權(quán)日2004年6月21日
發(fā)明者V·S·柯特 申請(qǐng)人:皇家飛利浦電子股份有限公司