音頻信號(hào)編碼器的制造方法
【專利摘要】一種設(shè)備,包括:編碼率確定器,其被配置為確定對(duì)于至少一個(gè)第一幀音頻信號(hào)多通道參數(shù)的第一編碼比特率以及對(duì)于至少一個(gè)第二幀音頻信號(hào)多通道參數(shù)的第二編碼比特率,其中,組合的第一與第二編碼比特率小于比特率限值;通道分析器,其被配置為對(duì)于第一幀確定所述至少一個(gè)第一幀音頻信號(hào)多通道參數(shù),并被配置為對(duì)于第二幀確定所述至少一個(gè)第二幀音頻信號(hào)多通道參數(shù);多通道參數(shù)確定器,其被配置為由所述至少一個(gè)第一幀音頻信號(hào)多通道參數(shù),在第一編碼比特率范圍內(nèi)產(chǎn)生編碼后的第一幀音頻信號(hào)多通道參數(shù),并被配置為由所述至少一個(gè)第二幀音頻信號(hào)多通道參數(shù)在第二編碼比特率范圍內(nèi)產(chǎn)生編碼后的至少一個(gè)第二幀音頻信號(hào)多通道參數(shù);以及,多工器,其被配置為組合編碼后的至少一個(gè)第一幀音頻信號(hào)多通道參數(shù)和編碼后的至少一個(gè)第二幀音頻信號(hào)多通道參數(shù)。
【專利說明】音頻信號(hào)編碼器
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種多通道或立體聲音頻信號(hào)編碼器,特別、但不僅僅涉及一種用于便攜式設(shè)備中使用的多通道或立體聲音頻信號(hào)編碼器。
【背景技術(shù)】
[0002]例如,對(duì)像語(yǔ)音或音樂這樣的音頻信號(hào)進(jìn)行編碼,以便使得音頻信號(hào)的高效傳輸或存儲(chǔ)成為可能。
[0003]音頻編碼器和解碼器(也稱為編碼譯碼器)用于表現(xiàn)基于音頻的信號(hào),例如音樂和環(huán)境聲音(用語(yǔ)音編碼特有的術(shù)語(yǔ)來說,其可稱為背景噪音)。這些類型的編碼器典型地不對(duì)編碼過程使用語(yǔ)音模型,相反,它們使用表現(xiàn)包括語(yǔ)音在內(nèi)所有類型的語(yǔ)音信號(hào)的過程。語(yǔ)音編碼器和解碼器(編碼譯碼器)可看作對(duì)于語(yǔ)音信號(hào)最優(yōu)化的音頻編碼譯碼器,并能以固定或可變比特率運(yùn)行。
[0004]音頻編碼譯碼器也可被配置為以變化的比特率運(yùn)行。在較低比特率下,這樣的音頻編碼譯碼器可被優(yōu)化為以相當(dāng)于純語(yǔ)音編碼譯碼器的編碼速率對(duì)于語(yǔ)音信號(hào)運(yùn)行。在較高比特率下,音頻編碼譯碼器可以以較高的品質(zhì)和性能對(duì)包括音樂、背景噪音和語(yǔ)音的任何信號(hào)進(jìn)行編碼??勺兯俾室纛l編碼譯碼器也可實(shí)現(xiàn)嵌入式可伸縮編碼結(jié)構(gòu)和比特流,其中,附加的位(特定量的位常常稱為層)在較低速率下改進(jìn)編碼,且其中,較高速率的比特流可被截?cái)啵垣@得較低速率編碼的比特流。這種音頻編碼譯碼器可將純粹為語(yǔ)音信號(hào)設(shè)計(jì)的編碼譯碼器用作內(nèi)核層或最低比特率編碼。
[0005]音頻編碼譯碼器被設(shè)計(jì)為保持高(感知)品質(zhì),同時(shí),提升壓縮比。因此,代替波形匹配編碼,常常使用多種參數(shù)方案來降低比特率。對(duì)于例如立體聲信號(hào)的多通道音頻,常常在單聲道表達(dá)上使用較大量的可用比特率,并用使用相對(duì)較少位的參數(shù)化方法對(duì)立體聲或多通道信息進(jìn)行編碼。
【發(fā)明內(nèi)容】
[0006]根據(jù)第一方面,提供了一種方法,其包括:確定對(duì)于至少一個(gè)第一幀音頻信號(hào)多通道參數(shù)的第一編碼比特率以及對(duì)于至少一個(gè)第二幀音頻信號(hào)多通道參數(shù)的第二編碼比特率,其中,組合的第一與第二編碼比特率小于比特率限值;對(duì)于第一幀,確定所述至少一個(gè)第一幀音頻信號(hào)多通道參數(shù);從所述至少一個(gè)第一幀音頻信號(hào)多通道參數(shù),在第一編碼比特率范圍內(nèi)產(chǎn)生編碼后的第一幀音頻信號(hào)多通道參數(shù);對(duì)于第二幀,確定所述至少一個(gè)第二幀音頻信號(hào)多通道參數(shù);從所述至少一個(gè)第二幀音頻信號(hào)多通道參數(shù),在第二編碼比特率范圍內(nèi)產(chǎn)生編碼后的至少一個(gè)第二幀音頻信號(hào)多通道參數(shù);以及,組合編碼后的至少一個(gè)第一幀音頻信號(hào)多通道參數(shù)和編碼后的至少一個(gè)第二幀音頻信號(hào)多通道參數(shù)。
[0007]第一幀可以為下列中的至少一種:與第二幀相鄰;以及,在第二幀之前。
[0008]對(duì)于第一幀確定所述至少一個(gè)第一幀音頻信號(hào)多通道參數(shù)或?qū)τ诘诙_定所述至少一個(gè)第二幀音頻信號(hào)多通道參數(shù)可包括確定下列中的至少一個(gè):至少一個(gè)耳間時(shí)間差;以及,至少一個(gè)耳間電平差。
[0009]從所述至少一個(gè)第一幀音頻信號(hào)多通道參數(shù)在第一編碼比特率范圍內(nèi)產(chǎn)生編碼后的第一幀音頻信號(hào)多通道參數(shù)或從所述至少一個(gè)第二幀音頻信號(hào)多通道參數(shù)在第二編碼比特率范圍內(nèi)產(chǎn)生編碼后的第二幀音頻信號(hào)多通道參數(shù)可包括:使用分立的矢量量化碼本,產(chǎn)生分別用于所述至少一個(gè)第一幀音頻信號(hào)多通道參數(shù)或所述至少一個(gè)第二幀音頻信號(hào)多通道參數(shù)的組的碼本索引;從分立的量化碼本,產(chǎn)生組合矢量量化碼本;從對(duì)于組的碼本索引,對(duì)于組合的矢量量化碼本,產(chǎn)生組合矢量量化索引,其中,用于識(shí)別組合矢量量化索引的位的個(gè)數(shù)少于用于分立組的碼本索引所使用的組合位數(shù)。
[0010]從分立的量化碼本產(chǎn)生組合矢量量化碼本可包括:從分立的矢量量化碼本選擇至少一個(gè)編碼矢量;并對(duì)來自分立的矢量量化碼本的所述至少一個(gè)編碼矢量進(jìn)行組合。
[0011]從分立的矢量量化碼本選擇至少一個(gè)編碼矢量可包括:確定將從分立的矢量量化碼本選擇的第一數(shù)量的編碼矢量;以及,增大第一數(shù)量,一直到達(dá)到第一或第二相應(yīng)的編碼比特率。
[0012]從所述至少一個(gè)第一幀音頻信號(hào)多通道參數(shù)在第一編碼比特率的范圍內(nèi)產(chǎn)生編碼后的第一幀音頻信號(hào)多通道參數(shù)可包括:依賴于所述至少一個(gè)第一幀音頻信號(hào)多通道參數(shù)的映射實(shí)例的頻率分布,對(duì)于所述至少一個(gè)第一幀音頻信號(hào)多通道參數(shù),產(chǎn)生具有所關(guān)聯(lián)的索引的第一編碼映射;以及,依賴于所關(guān)聯(lián)的索引,對(duì)第一編碼映射進(jìn)行編碼。
[0013]依賴于所關(guān)聯(lián)的索引對(duì)第一編碼映射進(jìn)行編碼可包括,依賴于所關(guān)聯(lián)的索引,將Golomb-Rice編碼應(yīng)用到第一編碼映射。
[0014]從所述至少一個(gè)第二幀音頻信號(hào)多通道參數(shù)在第二編碼比特率的范圍內(nèi)產(chǎn)生編碼后的第二幀音頻信號(hào)多通道參數(shù)可包括:依賴于所述至少一個(gè)第二幀音頻信號(hào)多通道參數(shù)的映射實(shí)例的頻率分布,對(duì)于所述至少一個(gè)第二幀音頻信號(hào)多通道參數(shù),產(chǎn)生具有所關(guān)聯(lián)的索引的第二編碼映射;以及,依賴于所關(guān)聯(lián)的索引,對(duì)第二編碼映射進(jìn)行編碼。
[0015]依賴于所關(guān)聯(lián)的索引對(duì)第二編碼映射進(jìn)行編碼可包括,依賴于所關(guān)聯(lián)的索引,將Golomb-Rice編碼應(yīng)用到第二編碼映射。
[0016]該方法還可包括:接收兩個(gè)或多于兩個(gè)語(yǔ)音信號(hào)通道;從所述兩個(gè)或多于兩個(gè)音頻信號(hào)通道以及所述至少一個(gè)第一幀音頻信號(hào)多通道參數(shù),確定較少數(shù)量通道音頻信號(hào);在包比特率限值范圍內(nèi),產(chǎn)生包括所述較少數(shù)量通道的編碼后的音頻信號(hào);組合編碼后的音頻信號(hào)、編碼后的至少一個(gè)第一幀音頻信號(hào)多通道參數(shù)和編碼后的至少一個(gè)第二幀音頻信號(hào)多通道參數(shù)。
[0017]第二編碼比特率可小于第一編碼比特率。
[0018]根據(jù)第二方面,提供了一種方法,其包括:在第一時(shí)間段內(nèi)接收包括至少一個(gè)第一幀音頻信號(hào)、至少一個(gè)第一幀音頻信號(hào)多通道參數(shù)以及至少一個(gè)另一幀音頻信號(hào)多通道參數(shù)的已編碼音頻信號(hào),并在另一時(shí)間段內(nèi)接收包括至少一個(gè)另一幀音頻信號(hào)的另一已編碼音頻信號(hào);判斷另一編碼音頻信號(hào)是否包括至少一個(gè)另一幀音頻信號(hào)多通道參數(shù)和/或所述至少一個(gè)另一幀音頻信號(hào)多通道參數(shù)是否損壞;以及,當(dāng)所述另一編碼音頻信號(hào)不包括至少一個(gè)另一幀音頻信號(hào)多通道參數(shù)或所述至少一個(gè)另一幀音頻信號(hào)多通道參數(shù)損壞時(shí),對(duì)于所述另一幀,從所述至少一個(gè)第一幀音頻信號(hào)或所述至少一個(gè)另一幀音頻信號(hào)兩者中的任一個(gè)產(chǎn)生至少兩通道音頻信號(hào),并為已編碼音頻信號(hào)產(chǎn)生至少一個(gè)另一幀音頻信號(hào)多通道參數(shù)。
[0019]該方法還可包括,當(dāng)所述另一編碼音頻信號(hào)包括所述至少一個(gè)另一幀音頻信號(hào)多通道參數(shù)且所述至少一個(gè)另一幀音頻信號(hào)多通道參數(shù)未損壞時(shí),對(duì)于所述另一幀,從所述至少一個(gè)另一幀音頻信號(hào)產(chǎn)生至少兩個(gè)通道音頻信號(hào),以及對(duì)于另一已編碼音頻信號(hào),產(chǎn)生至少一個(gè)另一幀音頻信號(hào)多通道參數(shù)。
[0020]根據(jù)第三方面,提供了一種設(shè)備,該設(shè)備包括:至少一個(gè)處理器;以及,至少一個(gè)存儲(chǔ)器,其包括用于一個(gè)以上程序的計(jì)算機(jī)程序代碼,所述至少一個(gè)存儲(chǔ)器以及計(jì)算機(jī)程序代碼被配置為,用所述至少一個(gè)處理器,使得設(shè)備至少:確定對(duì)于至少一個(gè)第一幀音頻信號(hào)多通道參數(shù)的第一編碼比特率以及對(duì)于至少一個(gè)第二幀音頻信號(hào)多通道參數(shù)的第二編碼比特率,其中,組合的第一與第二編碼比特率小于比特率限值;對(duì)于第一幀,確定所述至少一個(gè)第一幀音頻信號(hào)多通道參數(shù);從所述至少一個(gè)第一幀音頻信號(hào)多通道參數(shù),在第一編碼比特率范圍內(nèi)產(chǎn)生編碼后的第一幀音頻信號(hào)多通道參數(shù);對(duì)于第二幀,確定所述至少一個(gè)第二幀音頻信號(hào)多通道參數(shù);從所述至少一個(gè)第二幀音頻信號(hào)多通道參數(shù),在第二編碼比特率范圍內(nèi)產(chǎn)生編碼后的至少一個(gè)第二幀音頻信號(hào)多通道參數(shù);以及,組合編碼后的至少一個(gè)第一幀音頻信號(hào)多通道參數(shù)和編碼后的至少一個(gè)第二幀音頻信號(hào)多通道參數(shù)。
[0021]第一幀可以為下列中的至少一種:與第二幀相鄰;以及,在第二幀之前。
[0022]對(duì)于第一幀確定所述至少一個(gè)第一幀音頻信號(hào)多通道參數(shù)或?qū)τ诘诙_定所述至少一個(gè)第二幀音頻信號(hào)多通道參數(shù)可使得設(shè)備確定下列中的至少一個(gè):至少一個(gè)耳間時(shí)間差;以及,至少一個(gè)耳間電平差。
[0023]從所述至少一個(gè)第一幀音頻信號(hào)多通道參數(shù)在第一編碼比特率范圍內(nèi)產(chǎn)生編碼后的第一幀音頻信號(hào)多通道參數(shù)或從所述至少一個(gè)第二幀音頻信號(hào)多通道參數(shù)在第二編碼比特率范圍內(nèi)產(chǎn)生編碼后的第二幀音頻信號(hào)多通道參數(shù)可使得設(shè)備:使用分立的矢量量化碼本,產(chǎn)生分別用于所述至少一個(gè)第一幀音頻信號(hào)多通道參數(shù)或所述至少一個(gè)第二幀音頻信號(hào)多通道參數(shù)的組的碼本索引;從分立的量化碼本,產(chǎn)生組合矢量量化碼本;從對(duì)于組的碼本索引,對(duì)于組合的矢量量化碼本,產(chǎn)生組合矢量量化索引,其中,用于識(shí)別組合矢量量化索引的位的個(gè)數(shù)少于用于分立組的碼本索引所使用的組合位數(shù)。
[0024]從分立的量化碼本產(chǎn)生組合矢量量化碼本可使得設(shè)備:從分立的矢量量化碼本選擇至少一個(gè)編碼矢量;并對(duì)來自分立的矢量量化碼本的所述至少一個(gè)編碼矢量進(jìn)行組合。
[0025]從分立的矢量量化碼本選擇至少一個(gè)編碼矢量可使得設(shè)備:確定將從分立的矢量量化碼本選擇的第一數(shù)量的編碼矢量;以及,增大第一數(shù)量,一直到達(dá)到第一或第二相應(yīng)的編碼比特率。
[0026]從所述至少一個(gè)第一幀音頻信號(hào)多通道參數(shù)在第一編碼比特率的范圍內(nèi)產(chǎn)生編碼后的第一幀音頻信號(hào)多通道參數(shù)可使得設(shè)備:依賴于所述至少一個(gè)第一幀音頻信號(hào)多通道參數(shù)的映射實(shí)例的頻率分布,對(duì)于所述至少一個(gè)第一幀音頻信號(hào)多通道參數(shù),產(chǎn)生具有所關(guān)聯(lián)的索引的第一編碼映射;以及,依賴于所關(guān)聯(lián)的索引,對(duì)第一編碼映射進(jìn)行編碼。
[0027]依賴于所關(guān)聯(lián)的索引對(duì)第一編碼映射進(jìn)行編碼可使得設(shè)備:依賴于所關(guān)聯(lián)的索弓丨,將Golomb-Rice編碼應(yīng)用到第一編碼映射。
[0028]從所述至少一個(gè)第二幀音頻信號(hào)多通道參數(shù)在第二編碼比特率的范圍內(nèi)產(chǎn)生編碼后的第二幀音頻信號(hào)多通道參數(shù)可使得設(shè)備:依賴于所述至少一個(gè)第二幀音頻信號(hào)多通道參數(shù)的映射實(shí)例的頻率分布,對(duì)于所述至少一個(gè)第二幀音頻信號(hào)多通道參數(shù),產(chǎn)生具有所關(guān)聯(lián)的索引的第二編碼映射;以及,依賴于所關(guān)聯(lián)的索引,對(duì)第二編碼映射進(jìn)行編碼。
[0029]依賴于所關(guān)聯(lián)的索引對(duì)第二編碼映射進(jìn)行編碼可使得設(shè)備:依賴于所關(guān)聯(lián)的索弓丨,將Golomb-Rice編碼應(yīng)用到第二編碼映射。
[0030]還可使得設(shè)備:接收兩個(gè)或多于兩個(gè)語(yǔ)音信號(hào)通道;從所述兩個(gè)或多于兩個(gè)音頻信號(hào)通道以及所述至少一個(gè)第一幀音頻信號(hào)多通道參數(shù),確定較少數(shù)量通道音頻信號(hào);在包比特率限值范圍內(nèi),產(chǎn)生編碼后的音頻信號(hào);組合編碼后的音頻信號(hào)、編碼后的至少一個(gè)第一幀音頻信號(hào)多通道參數(shù)和編碼后的至少一個(gè)第二幀音頻信號(hào)多通道參數(shù)。
[0031]根據(jù)第四方面,提供了一種設(shè)備,該設(shè)備包括:至少一個(gè)處理器;以及,至少一個(gè)存儲(chǔ)器,其包括用于一個(gè)以上程序的計(jì)算機(jī)程序代碼,所述至少一個(gè)存儲(chǔ)器以及計(jì)算機(jī)程序代碼被配置為,用所述至少一個(gè)處理器,使得設(shè)備至少:在第一時(shí)間段內(nèi)接收包括至少一個(gè)第一幀音頻信號(hào)、至少一個(gè)第一幀音頻信號(hào)多通道參數(shù)以及至少一個(gè)另一幀音頻信號(hào)多通道參數(shù)的已編碼音頻信號(hào),并在另一時(shí)間段內(nèi)接收包括至少一個(gè)另一幀音頻信號(hào)的另一已編碼音頻信號(hào);判斷另一編碼音頻信號(hào)是否包括至少一個(gè)另一幀音頻信號(hào)多通道參數(shù)和/或所述至少一個(gè)另一幀音頻信號(hào)多通道參數(shù)是否損壞;以及,當(dāng)所述另一編碼音頻信號(hào)不包括至少一個(gè)另一幀音頻信號(hào)多通道參數(shù)或所述至少一個(gè)另一幀音頻信號(hào)多通道參數(shù)損壞時(shí),對(duì)于所述另一幀,從所述至少一個(gè)第一幀音頻信號(hào)或所述至少一個(gè)另一幀音頻信號(hào)兩者中的任一個(gè)產(chǎn)生至少兩個(gè)通道音頻信號(hào),并且對(duì)于已編碼音頻信號(hào)產(chǎn)生至少一個(gè)另一幀音頻信號(hào)多通道參數(shù)。
[0032]還可使得該設(shè)備:當(dāng)所述另一編碼音頻信號(hào)包括所述至少一個(gè)另一幀音頻信號(hào)多通道參數(shù)且所述至少一個(gè)另一幀音頻信號(hào)多通道參數(shù)未損壞時(shí),對(duì)于所述另一幀,從所述至少一個(gè)另一幀音頻信號(hào)產(chǎn)生至少兩個(gè)通道音頻信號(hào),并且對(duì)于所述另一已編碼音頻信號(hào)產(chǎn)生至少一個(gè)另一幀音頻信號(hào)多通道參數(shù)。
[0033]根據(jù)第五方面,提供了一種設(shè)備,該設(shè)備包括:用于確定對(duì)于至少一個(gè)第一巾貞音頻信號(hào)多通道參數(shù)的第一編碼比特率以及對(duì)于至少一個(gè)第二幀音頻信號(hào)多通道參數(shù)的第二編碼比特率的裝置,其中,組合的第一與第二編碼比特率小于比特率限值;用于對(duì)于第一幀確定所述至少一個(gè)第一幀音頻信號(hào)多通道參數(shù)的裝置;用于從所述至少一個(gè)第一幀音頻信號(hào)多通道參數(shù),在第一編碼比特率范圍內(nèi)產(chǎn)生編碼后的第一幀音頻信號(hào)多通道參數(shù)的裝置;用于對(duì)于第二幀確定所述至少一個(gè)第二幀音頻信號(hào)多通道參數(shù)的裝置;用于從所述至少一個(gè)第二幀音頻信號(hào)多通道參數(shù)在第二編碼比特率范圍內(nèi)產(chǎn)生編碼后的至少一個(gè)第二幀音頻信號(hào)多通道參數(shù)的裝置;以及,用于組合編碼后的至少一個(gè)第一幀音頻信號(hào)多通道參數(shù)和編碼后的至少一個(gè)第二幀音頻信號(hào)多通道參數(shù)的裝置。
[0034]第一幀可以為下列中的至少一種:與第二幀相鄰;以及,在第二幀之前。
[0035]用于對(duì)于第一幀確定所述至少一個(gè)第一幀音頻信號(hào)多通道參數(shù)的裝置或用于對(duì)于第二幀確定所述至少一個(gè)第二幀音頻信號(hào)多通道參數(shù)的裝置可包括確定下列中的至少一個(gè)的裝置:至少一個(gè)耳間時(shí)間差;以及,至少一個(gè)耳間電平差。
[0036]用于從所述至少一個(gè)第一幀音頻信號(hào)多通道參數(shù)在第一編碼比特率范圍內(nèi)產(chǎn)生編碼后的第一幀音頻信號(hào)多通道參數(shù)的裝置或用于從所述至少一個(gè)第二幀音頻信號(hào)多通道參數(shù)在第二編碼比特率范圍內(nèi)產(chǎn)生編碼后的第二幀音頻信號(hào)多通道參數(shù)的裝置可包括:用于使用分立的矢量量化碼本產(chǎn)生分別用于所述至少一個(gè)第一幀音頻信號(hào)多通道參數(shù)或所述至少一個(gè)第二幀音頻信號(hào)多通道參數(shù)的組的碼本索引的裝置;用于從分立的量化碼本產(chǎn)生組合矢量量化碼本的裝置;以及,用于從對(duì)于組的碼本索引對(duì)于組合的矢量量化碼本產(chǎn)生組合矢量量化索引的裝置,其中,用于識(shí)別組合矢量量化索引的位的個(gè)數(shù)少于用于分立組的碼本索引所使用的組合位數(shù)。
[0037]用于從分立的量化碼本產(chǎn)生組合矢量量化碼本的裝置可包括:用于由分立的矢量量化碼本選擇至少一個(gè)編碼矢量的裝置;以及,用于對(duì)來自分立的矢量量化碼本的所述至少一個(gè)編碼矢量進(jìn)行組合的裝置
[0038]用于從分立的矢量量化碼本選擇至少一個(gè)編碼矢量的裝置可包括:用于確定將從分立的矢量量化碼本選擇的第一數(shù)量的編碼矢量的裝置;以及,用于增大第一數(shù)量、一直到達(dá)到第一或第二相應(yīng)的編碼比特率的裝置。
[0039]用于從所述至少一個(gè)第一幀音頻信號(hào)多通道參數(shù)在第一編碼比特率的范圍內(nèi)產(chǎn)生編碼后的第一幀音頻信號(hào)多通道參數(shù)的裝置可包括:用于依賴于所述至少一個(gè)第一幀音頻信號(hào)多通道參數(shù)的映射實(shí)例的頻率分布,對(duì)于所述至少一個(gè)第一幀音頻信號(hào)多通道參數(shù),產(chǎn)生具有所關(guān)聯(lián)的索引的第一編碼映射的裝置;以及,用于依賴于所關(guān)聯(lián)的索引,對(duì)第一編碼映射進(jìn)行編碼的裝置。
[0040]用于依賴于所關(guān)聯(lián)的索引對(duì)第一編碼映射進(jìn)行編碼的裝置可包括:用于依賴于所關(guān)聯(lián)的索引,將Golomb-Rice編碼應(yīng)用到第一編碼映射的裝置。
[0041]用于從所述至少一個(gè)第二幀音頻信號(hào)多通道參數(shù)在第二編碼比特率的范圍內(nèi)產(chǎn)生編碼后的第二幀音頻信號(hào)多通道參數(shù)的裝置可包括:用于依賴于所述至少一個(gè)第二幀音頻信號(hào)多通道參數(shù)的映射實(shí)例的頻率分布,對(duì)于所述至少一個(gè)第二幀音頻信號(hào)多通道參數(shù),產(chǎn)生具有所關(guān)聯(lián)的索引的第二編碼映射的裝置;以及,用于依賴于所關(guān)聯(lián)的索引,對(duì)第二編碼映射進(jìn)行編碼的裝置。
[0042]用于依賴于所關(guān)聯(lián)的索引對(duì)第二編碼映射進(jìn)行編碼的裝置可包括:用于依賴于所關(guān)聯(lián)的索引,將Golomb-Rice編碼應(yīng)用到第二編碼映射的裝置。
[0043]該設(shè)備還可包括:用于接收至少兩個(gè)語(yǔ)音信號(hào)通道的裝置;用于從所述至少兩個(gè)音頻信號(hào)通道以及所述至少一個(gè)第一幀音頻信號(hào)多通道參數(shù)確定較少數(shù)量通道音頻信號(hào)的裝置;用于在包比特率限值范圍內(nèi)產(chǎn)生編碼后的音頻信號(hào)的裝置;以及,用于組合編碼后的音頻信號(hào)、編碼后的至少一個(gè)第一幀音頻信號(hào)多通道參數(shù)和編碼后的至少一個(gè)第二幀音頻信號(hào)多通道參數(shù)的裝置。
[0044]根據(jù)第六方面,提供了一種設(shè)備,其包括:用于在第一時(shí)間段內(nèi)接收包括至少一個(gè)第一幀音頻信號(hào)、至少一個(gè)第一幀音頻信號(hào)多通道參數(shù)以及至少一個(gè)另一幀音頻信號(hào)多通道參數(shù)的已編碼音頻信號(hào)并用于在另一時(shí)間段內(nèi)接收包括至少一個(gè)另一幀音頻信號(hào)的另一已編碼音頻信號(hào)的裝置;用于判斷另一編碼音頻信號(hào)是否包括至少一個(gè)另一幀音頻信號(hào)多通道參數(shù)和/或所述至少一個(gè)另一幀音頻信號(hào)多通道參數(shù)是否損壞的裝置;以及,用于當(dāng)所述另一編碼音頻信號(hào)不包括至少一個(gè)另一幀音頻信號(hào)多通道參數(shù)或所述至少一個(gè)另一幀音頻信號(hào)多通道參數(shù)損壞時(shí),對(duì)于所述另一幀,從所述至少一個(gè)第一幀音頻信號(hào)或所述至少一個(gè)另一幀音頻信號(hào)兩者中的任一個(gè)產(chǎn)生至少兩個(gè)通道音頻信號(hào)以及對(duì)于已編碼音頻信號(hào)產(chǎn)生至少一個(gè)另一幀音頻信號(hào)多通道參數(shù)的裝置。[0045]該設(shè)備還可包括,用于當(dāng)所述另一編碼音頻信號(hào)包括所述至少一個(gè)另一幀音頻信號(hào)多通道參數(shù)且所述至少一個(gè)另一幀音頻信號(hào)多通道參數(shù)未損壞時(shí),對(duì)于所述另一幀從所述至少一個(gè)另一幀音頻信號(hào)產(chǎn)生至少兩個(gè)通道音頻信號(hào)并且對(duì)于所述另一已編碼音頻信號(hào)產(chǎn)生至少一個(gè)另一幀音頻信號(hào)多通道參數(shù)的裝置。
[0046]根據(jù)第七方面,提供了一種設(shè)備,其包括:編碼率確定器,其被配置為確定對(duì)于至少一個(gè)第一幀音頻信號(hào)多通道參數(shù)的第一編碼比特率以及對(duì)于至少一個(gè)第二幀音頻信號(hào)多通道參數(shù)的第二編碼比特率,其中,組合的第一與第二編碼比特率小于比特率限值;通道分析器,其被配置為對(duì)于第一幀確定所述至少一個(gè)第一幀音頻信號(hào)多通道參數(shù),并被配置為對(duì)于第二幀確定所述至少一個(gè)第二幀音頻信號(hào)多通道參數(shù);多通道參數(shù)確定器,其被配置為從所述至少一個(gè)第一幀音頻信號(hào)多通道參數(shù),在第一編碼比特率范圍內(nèi)產(chǎn)生編碼后的第一幀音頻信號(hào)多通道參數(shù),并被配置為從所述至少一個(gè)第二幀音頻信號(hào)多通道參數(shù)在第二編碼比特率范圍內(nèi)產(chǎn)生編碼后的至少一個(gè)第二幀音頻信號(hào)多通道參數(shù);以及,多工器,其被配置為組合編碼后的至少一個(gè)第一幀音頻信號(hào)多通道參數(shù)和編碼后的至少一個(gè)第二幀音頻信號(hào)多通道參數(shù)。
[0047]第一幀可以為下列中的至少一種:與第二幀相鄰;以及,在第二幀之前。
[0048]通道分析器可被配置為確定下列中的至少一個(gè):至少一個(gè)耳間時(shí)間差;以及,至少一個(gè)耳間電平差。
[0049]多通道參數(shù)確定器可包括:碼本量化器編碼器,其被配置為使用分立的矢量量化碼本產(chǎn)生分別用于所述至少一個(gè)第一幀音頻信號(hào)多通道參數(shù)或所述至少一個(gè)第二幀音頻信號(hào)多通道參數(shù)的組的碼本索引;碼本組合器,其被配置為從分立的量化碼本產(chǎn)生組合矢量量化碼本;以及,索引映射器,其被配置為從對(duì)于組的碼本索引對(duì)于組合的矢量量化碼本產(chǎn)生組合矢量量化索引,其中,用于識(shí)別組合矢量量化索引的位的個(gè)數(shù)少于用于分立組的碼本索引所使用的組合位數(shù)。
[0050]碼本組合器可包括:編碼矢量選擇器,其被配置為從分立的矢量量化碼本選擇至少一個(gè)編碼矢量;以及,編碼矢量組合器,其被配置為對(duì)來自分立的矢量量化碼本的所述至少一個(gè)編碼矢量進(jìn)行組合。
[0051]編碼矢量組合器可包括:編碼矢量數(shù)量確定器,其被配置為確定將從分立的矢量量化碼本選擇的第一數(shù)量的編碼矢量;以及,編碼矢量選擇器優(yōu)化器,其被配置為增大第一數(shù)量、一直到達(dá)到第一或第二相應(yīng)的編碼比特率。
[0052]多通道參數(shù)確定器可包括:映射器,其被配置為依賴于所述至少一個(gè)第一幀音頻信號(hào)多通道參數(shù)的映射實(shí)例的頻率分布,對(duì)于所述至少一個(gè)第一幀音頻信號(hào)多通道參數(shù),產(chǎn)生具有所關(guān)聯(lián)的索引的第一編碼映射;以及,編碼器,其被配置為依賴于所關(guān)聯(lián)的索引,對(duì)第一編碼映射進(jìn)行編碼。
[0053]編碼器可包括Golomb-Rice編碼器。
[0054]該設(shè)備還可包括:輸入,其被配置為接收至少兩個(gè)語(yǔ)音信號(hào)通道;單聲道音頻信號(hào)產(chǎn)生器,其被配置為從所述至少兩個(gè)音頻信號(hào)通道以及所述至少一個(gè)第一幀音頻信號(hào)多通道參數(shù)確定較少數(shù)量的通道音頻信號(hào);音頻信號(hào)編碼器,其被配置為在包比特率限值范圍內(nèi)產(chǎn)生編碼后的音頻信號(hào);以及,音頻信號(hào)組合器,其被配置為組合編碼后的音頻信號(hào)、編碼后的至少一個(gè)第一幀音頻信號(hào)多通道參數(shù)和編碼后的至少一個(gè)第二幀音頻信號(hào)多通道參數(shù)。
[0055]根據(jù)第八方面,提供了一種設(shè)備,其包括:輸入,其被配置為在第一時(shí)間段內(nèi)接收包括至少一個(gè)第一幀音頻信號(hào)、至少一個(gè)第一幀音頻信號(hào)多通道參數(shù)以及至少一個(gè)另一幀音頻信號(hào)多通道參數(shù)的已編碼音頻信號(hào),并在另一時(shí)間段內(nèi)接收包括至少一個(gè)另一幀音頻信號(hào)的另一已編碼音頻信號(hào);包分析器,其被配置為判斷另一已編碼音頻信號(hào)是否包括至少一個(gè)另一幀音頻信號(hào)多通道參數(shù)和/或所述至少一個(gè)另一幀音頻信號(hào)多通道參數(shù)是否損壞;以及,立體聲通道產(chǎn)生器,其被配置為當(dāng)所述另一編碼音頻信號(hào)不包括至少一個(gè)另一幀音頻信號(hào)多通道參數(shù)或所述至少一個(gè)另一幀音頻信號(hào)多通道參數(shù)損壞時(shí),對(duì)于所述另一幀,從所述至少一個(gè)第一幀音頻信號(hào)或所述至少一個(gè)另一幀音頻信號(hào)兩者中的任一個(gè)產(chǎn)生至少兩個(gè)通道音頻信號(hào),并對(duì)于已編碼音頻信號(hào)產(chǎn)生至少一個(gè)另一幀音頻信號(hào)多通道參數(shù)。
[0056]立體聲通道產(chǎn)生器還可被配置為,當(dāng)所述另一編碼音頻信號(hào)包括所述至少一個(gè)另一幀音頻信號(hào)多通道參數(shù)且所述至少一個(gè)另一幀音頻信號(hào)多通道參數(shù)未損壞時(shí),對(duì)于所述另一幀從所述至少一個(gè)另一幀音頻信號(hào)產(chǎn)生至少兩個(gè)通道音頻信號(hào)并對(duì)于所述另一已編碼音頻信號(hào)產(chǎn)生至少一個(gè)另一幀音頻信號(hào)多通道參數(shù)。
[0057]第二編碼比特率可小于第一編碼比特率。
[0058]一種計(jì)算機(jī)程序產(chǎn)品可使得設(shè)備執(zhí)行這里介紹的方法。
[0059]一種電子裝置可包括這里介紹的設(shè)備。
[0060]一種芯片組可包括這里介紹的設(shè)備。
【專利附圖】
【附圖說明】
[0061]為了更好地理解本發(fā)明,現(xiàn)在將通過舉例的方式參照附圖,在附圖中:
[0062]圖1原理性地示出了使用某些實(shí)施例的電子裝置;
[0063]圖2原理性地示出了根據(jù)某些實(shí)施例的音頻編碼譯碼器系統(tǒng);
[0064]圖3原理性地示出了根據(jù)某些實(shí)施例的圖2所示的編碼器;
[0065]圖4原理性地示出了根據(jù)某些實(shí)施例在圖3中更為詳細(xì)地示出的通道分析器;
[0066]圖5原理性地示出了根據(jù)某些實(shí)施例在圖3中更為詳細(xì)地示出的立體聲參數(shù)編碼器;
[0067]圖6示出了一流程圖,其示出根據(jù)某些實(shí)施例在圖3中示出的編碼器的操作;
[0068]圖7示出了一流程圖,其示出根據(jù)某些實(shí)施例如圖4所示的通道分析器的操作;
[0069]圖8原理性地示出了根據(jù)某些實(shí)施例在圖5中更為詳細(xì)地示出的主立體聲參數(shù)編碼器;
[0070]圖9原理性地示出了根據(jù)某些實(shí)施例在圖5中更為詳細(xì)地示出的誤差隱藏立體聲參數(shù)編碼器;
[0071]圖10示出了一流程圖,其示出根據(jù)某些實(shí)施例如圖8和9所示的主以及誤差隱藏立體聲參數(shù)編碼器的操作;
[0072]圖11原理性地示出了根據(jù)某些實(shí)施例如圖2所示的解碼器;
[0073]圖12示出了一流程圖,其示出根據(jù)某些實(shí)施例如圖11所示的解碼器的操作;
[0074]圖13示出了根據(jù)某些實(shí)施例在來自不同次波段的電平值之間的示例性歸一化互相關(guān)性的圖解表不;
[0075]圖14示出了在某些實(shí)施例的示例性實(shí)施中來自6kbps總比特率的未使用的位的柱狀圖。
【具體實(shí)施方式】
[0076]下面更為詳細(xì)地介紹可能的立體聲和多通道語(yǔ)音與音頻編碼譯碼器,包括分層或可伸縮的可變速率語(yǔ)音與音頻編碼譯碼器。當(dāng)前的音頻編碼譯碼器方法可存在這樣的問題:為了通過編碼效率、帶寬以及通道數(shù)來提高編碼信號(hào)的品質(zhì),任何幀誤差可導(dǎo)致問題。特別地,這些問題為在基于包的網(wǎng)絡(luò)上傳輸編碼音頻信號(hào)的問題。
[0077]在多通道或立體聲參數(shù)(或者,一般地,與通道擴(kuò)展對(duì)應(yīng)的參數(shù))的情況下處理幀誤差尚未得到顯著研究,并且,目前,幀誤差或損壞導(dǎo)致有效的立體聲或雙聲道參數(shù)損失。減輕這種損失的方法是在實(shí)時(shí)協(xié)議(RTP)層面應(yīng)用、且因此應(yīng)用到所有內(nèi)容的幀交錯(cuò)以及前向誤差隱藏。否則,可導(dǎo)致解碼器插入零值或重復(fù)前一幀立體聲參數(shù)。
[0078]這里介紹的實(shí)施例的概念是試圖產(chǎn)生這樣的立體聲或多通道音頻編碼:其產(chǎn)生高效的高品質(zhì)且低比特率立體聲(或多通道)信號(hào)編碼,同時(shí),仍保持參數(shù)誤差隱藏或參數(shù)幀損壞隱藏。
[0079]因此,這里介紹的實(shí)施例的概念使用立體聲(或雙聲道或多通道)參數(shù)的可變比特率編碼,使得關(guān)于總可用固定比特率的任何剩余位可用于由相鄰幀——例如下一巾貞——對(duì)立體聲(或雙聲道或多通道)參數(shù)進(jìn)行解碼。
[0080]通過使用雙聲道擴(kuò)展和內(nèi)核編碼譯碼器之間的幀延遲差,確保相鄰幀(例如下一幀)的雙聲道參數(shù)的可用性。因此,在這里介紹的實(shí)施例中,由于雙聲道、立體聲或多通道參數(shù)的編碼是比特率可伸縮的,相同的過程或設(shè)備可用于對(duì)下一幀參數(shù)進(jìn)行編碼,但是用較低分辨率的表達(dá)。
[0081]在這一點(diǎn)上,首先參照?qǐng)D1,其中示出了示例性的電子裝置或設(shè)備10的原理性框圖,該裝置或設(shè)備可包含根據(jù)本申請(qǐng)一實(shí)施例的編碼譯碼器。
[0082]例如,設(shè)備10可為無線通信系統(tǒng)的移動(dòng)終端或用戶設(shè)備。在其他實(shí)施例中,設(shè)備10可為例如視頻攝像機(jī)的音頻-視頻裝置、電視(TV)接收器、例如mp3錄音機(jī)/播放器的音頻錄音機(jī)或音頻播放器、媒體錄影機(jī)(也稱為mp4錄影機(jī)/播放器)或適合對(duì)音頻信號(hào)進(jìn)行處理的任何計(jì)算機(jī)。
[0083]在某些實(shí)施例中,電子裝置或設(shè)備10包括麥克風(fēng)11,其經(jīng)由模數(shù)轉(zhuǎn)換器(ADC) 14連接到處理器21。處理器21進(jìn)一步經(jīng)由數(shù)模(DAC)轉(zhuǎn)換器32連接到揚(yáng)聲器33。處理器21進(jìn)一步連接到收發(fā)器(RX/TX) 13、用戶接口(UI) 15和存儲(chǔ)器22。
[0084]在某些實(shí)施例中,處理器21可被配置為執(zhí)行多種程序代碼。在某些實(shí)施例中,所實(shí)現(xiàn)的程序代碼包括這里介紹的多通道或立體聲編碼或解碼代碼。在某些實(shí)施例中,所實(shí)現(xiàn)的程序代碼23可被存儲(chǔ)在例如存儲(chǔ)器22中,以便在需要時(shí)由處理器21取回。存儲(chǔ)器22可進(jìn)一步提供用于存儲(chǔ)數(shù)據(jù)的部分24,該數(shù)據(jù)例如為已經(jīng)根據(jù)應(yīng)用編碼的數(shù)據(jù)。
[0085]實(shí)施例中的編碼與解碼代碼可以在硬件和/或固件中實(shí)現(xiàn)。
[0086]用戶接口 15使得用戶能夠例如經(jīng)由鍵盤向電子裝置10輸入命令,以及例如經(jīng)由顯示器從電子裝置10獲得信息。在某些實(shí)施例中,觸摸屏可為用戶接口提供輸入與輸出功能二者。在某些實(shí)施例中,設(shè)備10包括收發(fā)器13,其適合使得與其他設(shè)備的通信成為可能,例如經(jīng)由無線通信網(wǎng)絡(luò)。
[0087]還將明了,設(shè)備10的結(jié)構(gòu)可以以多種方式補(bǔ)充和變化。
[0088]例如,設(shè)備10的用戶可使用麥克風(fēng)來輸入將要傳輸?shù)侥承┢渌O(shè)備或?qū)⒁鎯?chǔ)在存儲(chǔ)器22的數(shù)據(jù)部分24中的語(yǔ)音或其他音頻信號(hào)。在某些實(shí)施例中,為此目的,對(duì)應(yīng)的應(yīng)用可經(jīng)由用戶接口 15被用戶致動(dòng)。這些實(shí)施例中的這種應(yīng)用可由處理器21執(zhí)行,使得處理器21執(zhí)行存儲(chǔ)在存儲(chǔ)器22中的編碼代碼。
[0089]在某些實(shí)施例中,模數(shù)轉(zhuǎn)換器(ADC) 14將輸入的模擬音頻信號(hào)轉(zhuǎn)換為數(shù)字音頻信號(hào),并將數(shù)字音頻信號(hào)提供給處理器21。在某些實(shí)施例中,麥克風(fēng)11可包括一體化的麥克風(fēng)與ADC功能,并將數(shù)字音頻信號(hào)直接提供給處理器以便進(jìn)行處理。
[0090]在這樣的實(shí)施例中,于是,處理器21以與參照?qǐng)D2所示系統(tǒng)、圖3到10所示編碼器以及圖11與12所示解碼器介紹的相同的方式對(duì)數(shù)字音頻信號(hào)進(jìn)行處理。
[0091]在某些實(shí)施例中,結(jié)果得到的位流可被提供給收發(fā)器13,以便傳輸給另一設(shè)備?;蛘?,在某些實(shí)施例中,編碼后的音頻數(shù)據(jù)可存儲(chǔ)在存儲(chǔ)器22的數(shù)據(jù)部分24中,例如,用于由同一設(shè)備10在后來進(jìn)行傳輸或在后來進(jìn)行呈現(xiàn)。
[0092]在某些實(shí)施例中,設(shè)備10還可經(jīng)由收發(fā)器13從另一設(shè)備接收具有對(duì)應(yīng)的編碼數(shù)據(jù)的位流。在這種實(shí)例中,處理器21可執(zhí)行存儲(chǔ)在存儲(chǔ)器22中的解碼程序代碼。這種實(shí)施例中的處理器21對(duì)接收到的數(shù)據(jù)進(jìn)行解碼,并將解碼數(shù)據(jù)提供給數(shù)模轉(zhuǎn)換器32。數(shù)模轉(zhuǎn)換器32將數(shù)字解碼數(shù)據(jù)轉(zhuǎn)換為模擬音頻數(shù)據(jù),并在某些實(shí)施例中可經(jīng)由揚(yáng)聲器33輸出模擬音頻。在某些實(shí)施例中,解碼程序代碼的執(zhí)行也可由用戶經(jīng)由用戶接口 15調(diào)用的應(yīng)用來觸發(fā)。
[0093]在某些實(shí)施例中,所接收的編碼數(shù)據(jù)也可在存儲(chǔ)器22的數(shù)據(jù)部分22中被存儲(chǔ)而不是經(jīng)由揚(yáng)聲器33立即呈現(xiàn),例如,用于后來的解碼和呈現(xiàn),或解碼并轉(zhuǎn)發(fā)給又一設(shè)備。
[0094]將會(huì)明了,圖3到5、8、9和11所示的原理性結(jié)構(gòu)以及圖6到7、10和12所示的方法步驟僅僅代表圖1所示設(shè)備中實(shí)現(xiàn)的示例性示出的立體聲編碼器/解碼器設(shè)備或方法的特定部分和音頻編碼譯碼器操作的一部分。
[0095]實(shí)施例所使用的音頻編碼譯碼器的一般操作如圖2所示。一般音頻編碼/解碼系統(tǒng)包括編碼器與解碼器二者,如圖2原理性地示出。然而,將會(huì)明了,某些實(shí)施例可實(shí)現(xiàn)編碼器或解碼器中的一種,或編碼器與解碼器二者。圖2所示為具有編碼器104且特別是立體聲編碼器151、存儲(chǔ)器或媒體通道106以及解碼器108的系統(tǒng)102。將會(huì)明了,如上面所介紹的,某些實(shí)施例可包括或?qū)崿F(xiàn)編碼器104或解碼器108或者編碼器104與解碼器108二者。
[0096]編碼器104對(duì)輸入音頻信號(hào)110進(jìn)行壓縮,產(chǎn)生位流112,其在某些實(shí)施例中可通過媒體通道106存儲(chǔ)或傳輸。編碼器104還可立體聲編碼器151,作為整體編碼操作的一部分。還將明了,立體聲編碼器可以為整體編碼器104的一部分,或?yàn)榉至⒌木幋a模塊。編碼器104也可包括多通道編碼器,其對(duì)多于兩個(gè)音頻信號(hào)進(jìn)行編碼。
[0097]位流112可在解碼器108中接收。解碼器108對(duì)位流112進(jìn)行解壓縮,并產(chǎn)生輸出音頻信號(hào)114。解碼器108可包括立體聲解碼器,作為整體解碼操作的一部分。將會(huì)明了,立體聲解碼器可以為整體解碼器108的一部分,或?yàn)榉至⒌慕獯a模塊。解碼器108還可包括多通道解碼器,其對(duì)多于兩個(gè)音頻信號(hào)進(jìn)行解碼。相對(duì)于輸入信號(hào)110的輸出音頻信號(hào)114的品質(zhì)和位流112的比特率為定義編碼系統(tǒng)102的性能的主要特征。
[0098]圖3原理性地示出了根據(jù)某些實(shí)施例的編碼器104。
[0099]圖6原理性地示出了根據(jù)某些實(shí)施例的編碼器104的操作的流程圖。
[0100]這里介紹的實(shí)施例的概念為,確定并應(yīng)用立體聲編碼模式,以產(chǎn)生具有誤差隱藏的高效、高品質(zhì)且低比特率的真實(shí)立體聲信號(hào)。對(duì)于關(guān)于圖3的方面,示出了根據(jù)某些實(shí)施例的示例性編碼器104。另外,關(guān)于圖6,進(jìn)一步詳細(xì)示出了編碼器104的操作。
[0101]在某些實(shí)施例中,編碼器104包括幀分段器/變換器201。幀分段器/變換器201被配置為接收左以及右(或者,更一般地,任何多通道音頻表達(dá))輸入音頻信號(hào),并產(chǎn)生將要分析和編碼的這些音頻信號(hào)的頻域表達(dá)。這些頻率表達(dá)可被傳送到通道參數(shù)確定器203。
[0102]在某些實(shí)施例中,幀分段器/變換器可被配置為將音頻信號(hào)數(shù)據(jù)分段或分割為適合頻域變換的段或幀。幀分段器/變換器201在某些實(shí)施例中還可被配置為根據(jù)任何適合的窗口函數(shù)對(duì)音頻信號(hào)數(shù)據(jù)的這些幀或段開窗口。例如,幀分段器/變換器201可被配置為產(chǎn)生以各自IOms重疊前一以及后一巾貞的20ms的中貞。
[0103]在某些實(shí)施例中,幀分段器/變換器可被配置為在音頻信號(hào)數(shù)據(jù)執(zhí)行任何合適的時(shí)到頻域變換。例如,時(shí)到頻域變換可以為離散傅立葉變換(DFT)、快速傅立葉變換(FFT)、改進(jìn)型離散余弦變換(MDCT)。在下面的實(shí)例中,使用快速傅立葉變換(FFT)。另外,時(shí)到頻域變換器的輸出可進(jìn)一步得到處理,以產(chǎn)生各個(gè)輸入通道音頻信號(hào)數(shù)據(jù)的分立頻段域表達(dá)(次頻段表達(dá))。這些頻段可以以任何適當(dāng)?shù)姆绞讲贾谩@纾@些頻段可線性間隔開,或者在感知上或心理聲學(xué)上分配。
[0104]產(chǎn)生音頻幀波段頻域表達(dá)的操作在圖6中通過步驟501示出。
[0105]在某些實(shí)施例中品與表達(dá)被傳送到通道分析器/單聲道編碼器204。
[0106]在某些實(shí)施例中,編碼器104可包括通道分析器/單聲道編碼器203。通道分析器/單聲道編碼器203可被配置為接收多通道或立體聲輸入的次頻帶濾波表達(dá)。通道分析器/單聲道編碼器203在某些實(shí)施例中可被另外配置為對(duì)頻域音頻信號(hào)進(jìn)行分析,并確定關(guān)于立體聲或多通道音頻信號(hào)差與各個(gè)次頻段相關(guān)聯(lián)的參數(shù)。另外,通道分析器/單聲道編碼器可使用這些參數(shù)并產(chǎn)生可根據(jù)任何合適的編碼進(jìn)行編碼的單聲道通道。
[0107]立體聲參數(shù)和單聲道編碼信號(hào)(或者,更一般地,多通道參數(shù)和減少通道編碼信號(hào))可被輸出到立體聲參數(shù)編碼器205。在這里介紹的實(shí)例中,多通道參數(shù)關(guān)于頻域參數(shù)定義,然而,在某些實(shí)施例中可產(chǎn)生時(shí)域或其他域參數(shù)。
[0108]確定立體聲參數(shù)和產(chǎn)生單聲道通道并對(duì)單聲道通道進(jìn)行編碼的操作在圖6中通過步驟503示出。
[0109]關(guān)于圖4,進(jìn)一步詳細(xì)介紹根據(jù)某些實(shí)施例的示例性通道分析器/單聲道編碼器203。另外,關(guān)于圖7,如圖4所示通道分析器/單聲道編碼器203的操作根據(jù)某些實(shí)施例示出。
[0110]在某些實(shí)施例中,通道分析器/單聲道編碼器203包括相關(guān)性/移調(diào)確定器(correlation/shift determiner) 301。相關(guān)性/移調(diào)確定器301被配置為確定兩個(gè)聲道(或多通道音頻信號(hào)的部分)之間的每一次頻段的相關(guān)性或移調(diào)(shift)。移調(diào)(或最佳相關(guān)性索引C0R_IND[j])可使用例如下面的代碼來確定。
【權(quán)利要求】
1.一種方法,其包括: 確定對(duì)于至少一個(gè)第一幀音頻信號(hào)多通道參數(shù)的第一編碼比特率以及對(duì)于至少一個(gè)第二幀音頻信號(hào)多通道參數(shù)的第二編碼比特率,其中,組合的第一與第二編碼比特率小于比特率限值; 對(duì)于第一幀,確定所述至少一個(gè)第一幀音頻信號(hào)多通道參數(shù); 從所述至少一個(gè)第一幀音頻信號(hào)多通道參數(shù),在第一編碼比特率范圍內(nèi)產(chǎn)生編碼后的第一幀音頻信號(hào)多通道參數(shù); 對(duì)于第二幀,確定所述至少一個(gè)第二幀音頻信號(hào)多通道參數(shù); 從所述至少一個(gè)第二幀音頻信號(hào)多通道參數(shù),在第二編碼比特率范圍內(nèi)產(chǎn)生編碼后的至少一個(gè)第二幀音頻信號(hào)多通道參數(shù);以及 組合編碼后的至少一個(gè)第一幀音頻信號(hào)多通道參數(shù)和編碼后的至少一個(gè)第二幀音頻信號(hào)多通道參數(shù)。
2.根據(jù)權(quán)利要求1的方法,其中,第一幀為下列中的至少一種: 與第二幀相鄰;以及 在第二幀之前。
3.根據(jù)權(quán)利要求1或2的方法,其中,對(duì)于第一幀確定所述至少一個(gè)第一幀音頻信號(hào)多通道參數(shù)或?qū)τ诘诙_定所述至少一個(gè)第二幀音頻信號(hào)多通道參數(shù)包括確定下列中的至少一個(gè): 至少一個(gè)耳間時(shí)間差;以及 至少一個(gè)耳間電平差。
4.根據(jù)權(quán)利要求1到3的方法,其中,從所述至少一個(gè)第一幀音頻信號(hào)多通道參數(shù)在第一編碼比特率范圍內(nèi)產(chǎn)生編碼后的第一幀音頻信號(hào)多通道參數(shù)或從所述至少一個(gè)第二幀音頻信號(hào)多通道參數(shù)在第二編碼比特率范圍內(nèi)產(chǎn)生編碼后的第二幀音頻信號(hào)多通道參數(shù)包括: 使用分立的矢量量化碼本,產(chǎn)生分別用于所述至少一個(gè)第一幀音頻信號(hào)多通道參數(shù)或所述至少一個(gè)第二幀音頻信號(hào)多通道參數(shù)的組的碼本索引; 從分立的量化碼本,產(chǎn)生組合矢量量化碼本;以及 從對(duì)于組的碼本索引,對(duì)于組合的矢量量化碼本,產(chǎn)生組合矢量量化索引,其中,用于識(shí)別組合矢量量化索引的位的個(gè)數(shù)少于用于分立組的碼本索引所使用的組合位數(shù)。
5.根據(jù)權(quán)利要求4的方法,其中,從分立的量化碼本產(chǎn)生組合矢量量化碼本包括: 從分立的矢量量化碼本選擇至少一個(gè)編碼矢量;以及 對(duì)來自分立的矢量量化碼本的所述至少一個(gè)編碼矢量進(jìn)行組合。
6.根據(jù)權(quán)利要求5的方法,其中,從分立的矢量量化碼本選擇至少一個(gè)編碼矢量包括: 確定將從分立的矢量量化碼本選擇的第一數(shù)量的編碼矢量;以及 增大第一數(shù)量,一直到達(dá)到第一或第二相應(yīng)的編碼比特率。
7.根據(jù)權(quán)利要求1到6的方法,其中,從所述至少一個(gè)第一幀音頻信號(hào)多通道參數(shù)在第一編碼比特率的范圍內(nèi)產(chǎn)生編碼后的第一幀音頻信號(hào)多通道參數(shù)包括: 依賴于所述至少一個(gè)第一幀音頻信號(hào)多通道參數(shù)的映射實(shí)例的頻率分布,對(duì)于所述至少一個(gè)第一幀音頻信號(hào)多通道參數(shù),產(chǎn)生具有所關(guān)聯(lián)的索引的第一編碼映射;以及依賴于所關(guān)聯(lián)的索引,對(duì)第一編碼映射進(jìn)行編碼。
8.根據(jù)權(quán)利要求7的方法,其中,依賴于所關(guān)聯(lián)的索引對(duì)第一編碼映射進(jìn)行編碼包括,依賴于所關(guān)聯(lián)的索引,將Golomb-Rice編碼應(yīng)用到第一編碼映射。
9.根據(jù)權(quán)利要求1到8的方法,其中,從所述至少一個(gè)第二幀音頻信號(hào)多通道參數(shù)在第二編碼比特率的范圍內(nèi)產(chǎn)生編碼后的第二幀音頻信號(hào)多通道參數(shù)包括: 依賴于所述至少一個(gè)第二幀音頻信號(hào)多通道參數(shù)的映射實(shí)例的頻率分布,對(duì)于所述至少一個(gè)第二幀音頻信號(hào)多通道參數(shù),產(chǎn)生具有所關(guān)聯(lián)的索引的第二編碼映射;以及依賴于所關(guān)聯(lián)的索引,對(duì)第二編碼映射進(jìn)行編碼。
10.根據(jù)權(quán)利要求9的方法,其中,依賴于所關(guān)聯(lián)的索引對(duì)第二編碼映射進(jìn)行編碼包括,依賴于所關(guān)聯(lián)的索引,將Golomb-Rice編碼應(yīng)用到第二編碼映射。
11.根據(jù)權(quán)利要求1到10的方法,其還包括: 接收兩個(gè)或多于兩個(gè)語(yǔ)音信號(hào)通道; 從所述至少兩個(gè)音頻信號(hào)通道以及所述至少一個(gè)第一幀音頻信號(hào)多通道參數(shù),確定較少數(shù)量通道音頻信號(hào); 在包單聲道比特率限值范圍內(nèi),產(chǎn)生包括所述較少數(shù)量通道的編碼后的音頻信號(hào); 組合編碼后的音頻信號(hào)、編碼后的至少一個(gè)第一幀音頻信號(hào)多通道參數(shù)和編碼后的至少一個(gè)第二幀音頻信號(hào)多通道參數(shù)。
12.—種方法,其包括: 在第一時(shí)間段內(nèi)接收包括至少一個(gè)第一幀音頻信號(hào)、至少一個(gè)第一幀音頻信號(hào)多通道參數(shù)以及至少一個(gè)另一幀音頻信號(hào)多通道參數(shù)的已編碼音頻信號(hào),并在另一時(shí)間段內(nèi)接收包括至少一個(gè)另一幀音頻信號(hào)的另一已編碼音頻信號(hào); 判斷所述另一已編碼音頻信號(hào)是否包括至少一個(gè)另一幀音頻信號(hào)多通道參數(shù)和/或所述至少一個(gè)另一幀音頻信號(hào)多通道參數(shù)是否損壞;以及 當(dāng)所述另一已編碼音頻信號(hào)不包括至少一個(gè)另一幀音頻信號(hào)多通道參數(shù)或所述至少一個(gè)另一幀音頻信號(hào)多通道參數(shù)損壞時(shí),對(duì)于所述另一幀,從所述至少一個(gè)第一幀音頻信號(hào)或所述至少一個(gè)另一幀音頻信號(hào)兩者中的任一個(gè)產(chǎn)生至少兩個(gè)通道音頻信號(hào),并且對(duì)于已編碼音頻信號(hào)產(chǎn)生至少一個(gè)另一幀音頻信號(hào)多通道參數(shù)。
13.根據(jù)權(quán)利要求12的方法,其還包括,當(dāng)所述另一已編碼音頻信號(hào)包括所述至少一個(gè)另一幀音頻信號(hào)多通道參數(shù)且所述至少一個(gè)另一幀音頻信號(hào)多通道參數(shù)未損壞時(shí),對(duì)于所述另一幀,從所述另一幀音頻信號(hào)產(chǎn)生至少兩個(gè)通道音頻信號(hào),并且對(duì)于所述另一已編碼音頻信號(hào)產(chǎn)生至少一個(gè)另一幀音頻信號(hào)多通道參數(shù)。
14.一種設(shè)備,其被配置為: 確定對(duì)于至少一個(gè)第一幀音頻信號(hào)多通道參數(shù)的第一編碼比特率以及對(duì)于至少一個(gè)第二幀音頻信號(hào)多通道參數(shù)的第二編碼比特率,其中,組合的第一與第二編碼比特率小于比特率限值; 對(duì)于第一幀,確定所述至少一個(gè)第一幀音頻信號(hào)多通道參數(shù); 從所述至少一個(gè)第一幀音頻信號(hào)多通道參數(shù),在第一編碼比特率范圍內(nèi)產(chǎn)生編碼后的第一幀音頻信號(hào)多通道參數(shù); 對(duì)于第二幀,確定所述至少一個(gè)第二幀音頻信號(hào)多通道參數(shù);從所述至少一個(gè)第二幀音頻信號(hào)多通道參數(shù),在第二編碼比特率范圍內(nèi)產(chǎn)生編碼后的至少一個(gè)第二幀音頻信號(hào)多通道參數(shù);以及 組合編碼后的至少一個(gè)第一幀音頻信號(hào)多通道參數(shù)和編碼后的至少一個(gè)第二幀音頻信號(hào)多通道參數(shù)。
15.根據(jù)權(quán)利要求14的設(shè)備,其中,第一幀為下列中的至少一種: 與第二幀相鄰;以及 在第二幀之前。
16.根據(jù)權(quán)利要求14和15的設(shè)備,其中,被配置為對(duì)于第一幀確定所述至少一個(gè)第一幀音頻信號(hào)多通道參數(shù)或?qū)τ诘诙_定所述至少一個(gè)第二幀音頻信號(hào)多通道參數(shù)的設(shè)備進(jìn)一步被配置為確定下列中的至少一個(gè): 至少一個(gè)耳間時(shí)間差;以及 至少一個(gè)耳間電平差。
17.根據(jù)權(quán)利要求14-16的設(shè)備,其中,被配置為從所述至少一個(gè)第一幀音頻信號(hào)多通道參數(shù)在第一編碼比特率范圍內(nèi)產(chǎn)生編碼后的第一幀音頻信號(hào)多通道參數(shù)或從所述至少一個(gè)第二幀音頻信號(hào)多通道參數(shù)在第二編碼比特率范圍內(nèi)產(chǎn)生編碼后的第二幀音頻信號(hào)多通道參數(shù)的設(shè)備進(jìn)一步被配置為: 使用分立的矢量量化碼本,產(chǎn)生分別用于所述至少一個(gè)第一幀音頻信號(hào)多通道參數(shù)或所述至少一個(gè)第二幀音頻信號(hào)多通道參數(shù)的組的碼本索引; 從分立的量化碼本,產(chǎn)生組合矢量量化碼本;以及 從對(duì)于組的碼本索引,對(duì)于組合的矢量量化碼本,產(chǎn)生組合矢量量化索引,其中,用于識(shí)別組合矢量量化索引的位的個(gè)數(shù)少于用于分立組的碼本索引所使用的組合位數(shù)。
18.根據(jù)權(quán)利要求17的設(shè)備,其中,被配置為從分立的量化碼本產(chǎn)生組合矢量量化碼本的設(shè)備進(jìn)一步被配置為: 從分立的矢量量化碼本選擇至少一個(gè)編碼矢量;以及 對(duì)來自分立的矢量量化碼本的所述至少一個(gè)編碼矢量進(jìn)行組合。
19.根據(jù)權(quán)利要求18的設(shè)備,其中,被配置為從分立的矢量量化碼本選擇至少一個(gè)編碼矢量的設(shè)備進(jìn)一步被配置為: 確定將從分立的矢量量化碼本選擇的第一數(shù)量的編碼矢量;以及 增大第一數(shù)量,一直到達(dá)到第一或第二相應(yīng)的編碼比特率。
20.根據(jù)權(quán)利要求14-19的設(shè)備,其中,被配置為從所述至少一個(gè)第一幀音頻信號(hào)多通道參數(shù)在第一編碼比特率的范圍內(nèi)產(chǎn)生編碼后的第一幀音頻信號(hào)多通道參數(shù)的設(shè)備進(jìn)一步被配置為: 依賴于所述至少一個(gè)第一幀音頻信號(hào)多通道參數(shù)的映射實(shí)例的頻率分布,對(duì)于所述至少一個(gè)第一幀音頻信號(hào)多通道參數(shù),產(chǎn)生具有所關(guān)聯(lián)的索引的第一編碼映射;以及依賴于所關(guān)聯(lián)的索引,對(duì)第一編碼映射進(jìn)行編碼。
21.根據(jù)權(quán)利要求20的設(shè)備,其中,被配置為依賴于所關(guān)聯(lián)的索引對(duì)第一編碼映射進(jìn)行編碼的設(shè)備進(jìn)一步被配置為:依賴于所關(guān)聯(lián)的索引,將Golomb-Rice編碼應(yīng)用到第一編碼映射。
22.根據(jù)權(quán)利要求14-21的設(shè)備,其中,被配置為從所述至少一個(gè)第二幀音頻信號(hào)多通道參數(shù)在第二編碼比特率的范圍內(nèi)產(chǎn)生編碼后的第二幀音頻信號(hào)多通道參數(shù)的設(shè)備進(jìn)一步被配置為: 依賴于所述至少一個(gè)第二幀音頻信號(hào)多通道參數(shù)的映射實(shí)例的頻率分布,對(duì)于所述至少一個(gè)第二幀音頻信號(hào)多通道參數(shù),產(chǎn)生具有所關(guān)聯(lián)的索引的第二編碼映射;以及 依賴于所關(guān)聯(lián)的索引,對(duì)第二編碼映射進(jìn)行編碼。
23.根據(jù)權(quán)利要求22的設(shè)備,其中,被配置為依賴于所關(guān)聯(lián)的索引對(duì)第二編碼映射進(jìn)行編碼的設(shè)備進(jìn)一步被配置為:依賴于所關(guān)聯(lián)的索引,將Golomb-Rice編碼應(yīng)用到第二編碼映射。
24.根據(jù)權(quán)利要求14-23的設(shè)備,其中,該設(shè)備進(jìn)一步被配置為: 接收兩個(gè)或多于兩個(gè)語(yǔ)音信號(hào)通道; 從所述兩個(gè)或多于兩個(gè)音頻信號(hào)通道以及所述至少一個(gè)第一幀音頻信號(hào)多通道參數(shù),確定較少數(shù)量通道音頻信號(hào); 在包比特率限值范圍內(nèi),產(chǎn)生編碼后的音頻信號(hào);組合編碼后的音頻信號(hào)、編碼后的至少一個(gè)第一幀音頻信號(hào)多通道參數(shù)和編碼后的至少一個(gè)第二幀音頻信號(hào)多通道參數(shù)。
25.—種設(shè)備, 其被配置為: 在第一時(shí)間段內(nèi)接收包括至少一個(gè)第一幀音頻信號(hào)、至少一個(gè)第一幀音頻信號(hào)多通道參數(shù)以及至少一個(gè)另一幀音頻信號(hào)多通道參數(shù)的已編碼音頻信號(hào),并在另一時(shí)間段內(nèi)接收包括至少一個(gè)另一幀音頻信號(hào)的另一已編碼音頻信號(hào); 判斷另一已編碼音頻信號(hào)是否包括至少一個(gè)另一幀音頻信號(hào)多通道參數(shù)和/或所述至少一個(gè)另一幀音頻信號(hào)多通道參數(shù)是否損壞;以及 當(dāng)所述另一編碼音頻信號(hào)不包括至少一個(gè)另一幀音頻信號(hào)多通道參數(shù)或所述至少一個(gè)另一幀音頻信號(hào)多通道參數(shù)損壞時(shí),對(duì)于所述另一幀,從所述至少一個(gè)第一幀音頻信號(hào)或所述至少一個(gè)另一幀音頻信號(hào)兩者中的任一個(gè)產(chǎn)生至少兩個(gè)通道音頻信號(hào),并且對(duì)已編碼音頻信號(hào)產(chǎn)生至少一個(gè)另一幀音頻信號(hào)多通道參數(shù)。
26.根據(jù)權(quán)利要求25的設(shè)備,其中,該設(shè)備進(jìn)一步被配置為:當(dāng)所述另一編碼音頻信號(hào)包括所述至少一個(gè)另一幀音頻信號(hào)多通道參數(shù)且所述至少一個(gè)另一幀音頻信號(hào)多通道參數(shù)未損壞時(shí),對(duì)于所述另一幀從所述至少一個(gè)另一幀音頻信號(hào)產(chǎn)生至少兩通道音頻信號(hào),并且對(duì)于所述另一編碼音頻信號(hào)產(chǎn)生至少一個(gè)另一幀音頻信號(hào)多通道參數(shù)。
【文檔編號(hào)】G10L19/008GK103915098SQ201410008366
【公開日】2014年7月9日 申請(qǐng)日期:2014年1月8日 優(yōu)先權(quán)日:2013年1月8日
【發(fā)明者】A·瓦西拉凱, L·J·拉克索寧, A·S·拉莫 申請(qǐng)人:諾基亞公司