專(zhuān)利名稱(chēng):用較少的計(jì)算量重構(gòu)高頻分量的聲頻解碼方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及聲頻編碼方法和裝置,特別涉及一通過(guò)用較少的計(jì)算量重構(gòu)聲頻信號(hào)的高頻分量而能夠獲得和輸出高質(zhì)量的聲頻信號(hào)的聲頻解碼方法和裝置。
背景技術(shù):
一般,在聲頻編碼中使用心理聲學(xué)模型高效地壓縮聲頻數(shù)據(jù),使得少量位分配到人耳不能收聽(tīng)的高頻分量中。此時(shí),增加了壓縮比,但是損失了高頻聲信號(hào)。由于損失高頻聲信號(hào),所以在再現(xiàn)聲頻數(shù)據(jù)時(shí),聲音的音調(diào)改變,可讀性降低,產(chǎn)生模糊的聲音。因此,需要后處理方法,重構(gòu)損失的高頻分量來(lái)加強(qiáng)聲音質(zhì)量,以便完全地再現(xiàn)原始聲音的音調(diào)和提高聲頻信號(hào)的可讀性。
結(jié)合圖1說(shuō)明加強(qiáng)聲頻信號(hào)的聲音質(zhì)量的后處理方法。參見(jiàn)圖1,如果輸入編碼的信號(hào),它們被分成左右聲道信號(hào),并通過(guò)解碼器110分別解碼被分開(kāi)的信號(hào)。然后,分別用第一和第二高頻分量發(fā)生器單元120和130重構(gòu)解碼的左右聲道信號(hào)的高頻分量。
但是,因?yàn)榇蠖鄶?shù)的聲頻信號(hào)的左右聲道的聲頻信號(hào)彼此基本相似和高度冗余,所以不對(duì)它們單獨(dú)編碼。因此,存在的問(wèn)題是,分開(kāi)地重構(gòu)左右聲道信號(hào)的現(xiàn)有技術(shù)的后處理方法不能夠有效地利用聲道信號(hào)之間地相似性,因而不必要地增加了計(jì)算時(shí)間。
發(fā)明內(nèi)容
本發(fā)明的一個(gè)目的是提供一種即使使用較少的計(jì)算也能加強(qiáng)聲頻信號(hào)的聲音質(zhì)量的聲音解碼方法和裝置。
為實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明的一個(gè)方面,提供了一種聲頻解碼方法,該方法包括步驟對(duì)每個(gè)聲道信號(hào)每隔一幀跳躍地產(chǎn)生幀的高頻分量;在左右聲道信號(hào)彼此相似時(shí),使用所產(chǎn)生的另一個(gè)聲道信號(hào)的相應(yīng)幀的高頻分量,產(chǎn)生任何一個(gè)聲道信號(hào)的跳躍的幀的高頻分量;和在左右聲道信號(hào)彼此不相似時(shí),用相關(guān)的聲道信號(hào)的前幀,產(chǎn)生每個(gè)聲道信號(hào)的跳躍幀的高頻分量。
根據(jù)本發(fā)明的另一方面,提供一種重構(gòu)高頻分量的聲頻解碼裝置,它包括聲頻解碼器,它接收編碼的聲頻數(shù)據(jù),解碼接收的數(shù)據(jù),和輸出第一和第二聲道的解碼的聲頻數(shù)據(jù);聲道相似性確定單元,它確定在第一和第二聲道信號(hào)之間的相似性;高頻分量發(fā)生單元,它基于第一和聲道信號(hào)之間的相似性,產(chǎn)生每個(gè)聲道的聲頻信號(hào)的高頻分量;和聲頻合成單元,它將解碼的聲頻信號(hào)與產(chǎn)生的高頻分量結(jié)合并輸出結(jié)合的聲頻信號(hào)。
通過(guò)結(jié)合以下優(yōu)選實(shí)施例的說(shuō)明將明了本發(fā)明的上述目的和其它特征。
圖1是應(yīng)用現(xiàn)有技術(shù)后處理算法的聲頻解碼裝置的方框圖;圖2是根據(jù)本發(fā)明的聲音解碼裝置的配置示意圖;圖3是MPEG(活動(dòng)圖像專(zhuān)家組)一1層3的格式示意圖;圖4是根據(jù)本發(fā)明的聲頻解碼方法的整個(gè)處理過(guò)程流程圖;圖5是根據(jù)本發(fā)明對(duì)每個(gè)聲道信號(hào)每隔一個(gè)幀跳躍地,產(chǎn)生高頻分量的處理圖;圖6是在聲道信號(hào)彼此不相似時(shí),產(chǎn)生左右聲道信號(hào)的高頻分量的方法示意圖;圖7是在聲道信號(hào)彼此相似時(shí),產(chǎn)生左右聲道信號(hào)的高頻分量的方法示意圖;和圖8的圖表,示出了與現(xiàn)有技術(shù)比較,本發(fā)明的聲頻解碼方法聲音質(zhì)量的加強(qiáng)。
具體實(shí)施例方式
下面參照附圖詳細(xì)說(shuō)明本發(fā)明的聲頻解碼裝置的配置和工作。
圖2示出聲頻解碼裝置200的配置示意圖。參見(jiàn)圖2,聲頻解碼裝置200包括解碼器210;聲道相似性確定單元220;高頻分量發(fā)生單元230;和聲頻合成單元240。裝置200被配置成解碼聲頻位流,然后重構(gòu)來(lái)自解碼的聲頻信號(hào)的各聲道信號(hào)的高頻分量。
解碼器210解碼輸入的聲頻位流并產(chǎn)生聲頻信號(hào)。即,從輸入的聲頻位流解碼聲頻數(shù)據(jù),然后將解碼的數(shù)據(jù)去量化(dequantize),以恢復(fù)在聲頻數(shù)據(jù)的編碼處理中以前進(jìn)行的量化操作,使得輸出原始聲頻信號(hào)。
這里,在解碼器210中采用的解碼方法可以根據(jù)壓縮聲頻信號(hào)使用的編碼類(lèi)型,例如比例因子編碼、AC一3、MEPG和霍夫曼(Huffman)編碼等變化。然而,因?yàn)樵诼曨l信號(hào)處理中使用的編碼器的配置和操作基本彼此相同,所以,在此省略其詳細(xì)說(shuō)明。
同時(shí),已知SBR(頻譜帶復(fù)制Spectral Band Replication),即,從聲頻信號(hào)的低頻范圍重構(gòu)高頻范圍的算法是迄今提出的聲音質(zhì)量強(qiáng)化的幾種后處理算法當(dāng)中的最有效的技術(shù)。但是,不能夠?qū)BR2應(yīng)用到各種聲頻編解碼器,因?yàn)樗且揽縈EPG-1層3的后處理算法。另外,與SBR2比較,SBRl能夠用于各種聲頻編解碼器,但是它將對(duì)每幀的左右聲道信號(hào)進(jìn)行后處理操作。因此,操作中不能夠有效地利用兩個(gè)聲道之間的相似性,結(jié)果,增加了計(jì)算時(shí)間。因此,存在著幾乎不能夠?qū)⑦@種算法用于相關(guān)的產(chǎn)品的限制。
因此,為了減少與能夠用于各種聲頻編解碼器的相應(yīng)于SBRl(下面簡(jiǎn)稱(chēng)為SBR)的問(wèn)題的大計(jì)算量,和具有優(yōu)良的重構(gòu)性能,將本發(fā)明成配置成這樣,通過(guò)聲道相似性確定單元220和高頻分量發(fā)生單元230,有效地利用聲道的相似性,即使使用小的計(jì)算量也能夠重構(gòu)高頻分量。
在輸入解碼的聲頻信號(hào)時(shí),聲道相似性確定單元220分析輸入的聲頻信號(hào)是否包括模式信息。然后,聲道相似性確定單元220根據(jù)該模式信息確定左右聲道信號(hào)之間的相似性。否則,基于從聲道信號(hào)之間的和及差信息獲得的SNR(信噪比),確定聲道信號(hào)之間的相似性。
這里,在聲頻信號(hào)不包括模式信息時(shí)使用SNR確定聲道信號(hào)之間相似性的原因是,基于從聲道信號(hào)之間的和及差獲得的SNR值,能夠容易地確定左右聲道之間的相似性,因?yàn)樵趬嚎s比高時(shí),在通常的聲頻編解碼器中頻繁編碼該和及差信息。
下面,為了更好理解本發(fā)明,通過(guò)MEPG-1層3聲頻信號(hào)的例子說(shuō)明確定左右聲道信號(hào)之間相似性的方法。
圖3示出了MEPG-1層3聲頻流的格式。
MEPG一1層3聲頻流由多個(gè)AAU(聲音訪(fǎng)問(wèn)單元)300構(gòu)成。每個(gè)AAU300是能夠單個(gè)解碼并含有預(yù)定的固定數(shù)目的壓縮數(shù)據(jù)的取樣的最小的單元。
每個(gè)AAU300包括標(biāo)題310,循環(huán)冗余校驗(yàn)(CRC)320,聲頻數(shù)據(jù)330,和輔助數(shù)據(jù)340。
標(biāo)題310含有關(guān)于同步字、ID、層、保護(hù)位的存在、位速率指數(shù)、取樣頻率、填充位的存在、專(zhuān)用使用位、模式、模式擴(kuò)展、版權(quán)、原始/復(fù)制和強(qiáng)調(diào)特征的信息。
CRC320是可任選的,16位長(zhǎng),并且標(biāo)題310定義在每個(gè)AAU300中是否包括CRC320。
聲頻數(shù)據(jù)330是含有壓縮聲音數(shù)據(jù)的部分。
輔助數(shù)據(jù)340是在每個(gè)聲頻數(shù)據(jù)330的尾端未達(dá)到相關(guān)AAU的尾端時(shí)的剩余的部分。在輔助數(shù)據(jù)340中能夠包括除了MPEG聲頻數(shù)據(jù)外的任何數(shù)據(jù)如圖3所示,MP3聲頻位流的標(biāo)題310含有模式信息,該模式信息表示所述流是否使用聲道信號(hào)之間的相似性被壓縮。因此,通過(guò)分析輸入的MP3聲頻位流的模式信息,能夠容易地確定在聲道信號(hào)之間的相似性。
因此,在包括上述模式信息的MEPG-1層3聲頻信號(hào)輸入時(shí),聲道相似性確定單元220分析在輸入信號(hào)中的模式信息,并根據(jù)模式信息是否是具有左右聲道信號(hào)之間很大相似性的共同立體聲(joint stereo)模式值,或是具有在聲道信號(hào)之間很小相似性的立體聲模式值,來(lái)確定在聲道信號(hào)之間的相似性。
在另一方面,在解碼的聲頻信號(hào)中不包括模式信息的情況,聲道相似性確定單元220基于從聲頻信號(hào)獲得的聲道信號(hào)之間的和及差信息,計(jì)算與代表聲道信號(hào)之間相似性的參數(shù)相對(duì)應(yīng)的SNR。然后,如果計(jì)算的SNR值小于聲道信號(hào)之間相似性的閾值,則確定這兩個(gè)聲道信號(hào)彼此相似。否則確定這兩個(gè)聲道信號(hào)不彼此相似。
即,將從關(guān)于聲道的信號(hào)之間的和及差的信息獲得的SNR值用作代表聲道之間相似性的參數(shù)?,F(xiàn)在詳細(xì)說(shuō)明基于關(guān)于兩個(gè)聲道信號(hào)之間的和及差的信息計(jì)算SNR值的方法。
首先,計(jì)算在這兩個(gè)聲道信號(hào)之間的和及差的能量值。然后,對(duì)通過(guò)用這兩個(gè)聲道信號(hào)之間的和及差的相加值除以聲道信號(hào)之間的差的能量值獲得的值取對(duì)數(shù)。然后,用10乘這個(gè)對(duì)數(shù)值。此時(shí),為了減小計(jì)算能量值需要的計(jì)算,最好是使用這個(gè)信號(hào)之間的和及差的數(shù)值。
這里,可對(duì)聲道信號(hào)之間相似性的閾值賦予試驗(yàn)值。在本發(fā)明中,20分貝的值確定為聲道信號(hào)之間相似性的閾值。
因此,聲道相似性確定單元220分析聲頻信號(hào)是否包括模式信息。如果是,則確定單元基于該模式信息確定左右聲道信號(hào)之間的相似性。否則,確定單元基于從這兩個(gè)聲道信號(hào)之間的和及差的信息獲得的SNR,確定相似性本領(lǐng)域的技術(shù)人員能夠作出確定左右聲道信號(hào)之間相似性的方法的各種修改和等同的變型。例如,如果不是MPEG-1層3,而是AC-3聲頻信號(hào)包括在左右聲道信號(hào)之間的差的信息中,也能夠確定左右聲道信號(hào)之間的相似性。另外,如果在聲頻位流中存在線(xiàn)性預(yù)測(cè)系數(shù),則通過(guò)解碼這個(gè)線(xiàn)性預(yù)測(cè)系數(shù)和建模譜包絡(luò)信號(hào)也能夠確定左右聲道信號(hào)之間的相似性。
另外,高頻分量發(fā)生單元230使用SBR算法,對(duì)每個(gè)聲道每隔一個(gè)幀跳躍地重構(gòu)左右聲道信號(hào)的高頻分量。然后,在左右聲道信號(hào)彼此相似時(shí),用在一個(gè)聲道中產(chǎn)生的高頻分量重構(gòu)另外一個(gè)聲道信號(hào)的跳躍的幀的高頻分量。在左右聲道信號(hào)彼此不相似時(shí),用每個(gè)聲道信號(hào)的前幀的高頻分量,重構(gòu)相關(guān)聲道信號(hào)的跳躍幀的高頻分量。稍后參照?qǐng)D5和7說(shuō)明其詳細(xì)情況。
在高頻發(fā)生單元230重構(gòu)每個(gè)聲道信號(hào)的高頻分量時(shí),聲頻合成單元240產(chǎn)生通過(guò)將發(fā)生的高頻分量加到解碼的視頻信號(hào)獲得的輸出。因此,依靠在聲道信號(hào)之間的相似性,合適地重構(gòu)高頻分量,從而能夠減少不必要的計(jì)算,并且也能夠加強(qiáng)聲音質(zhì)量。
下面參照附圖詳細(xì)說(shuō)明本發(fā)明的聲頻信號(hào)解碼方法。
圖4是根據(jù)本發(fā)明的聲頻信號(hào)解碼方法的整個(gè)處理過(guò)程流程圖。
首先,解碼器210解碼輸入的聲頻位流并輸出聲頻信號(hào)(S10)。這里,這個(gè)解碼方法能夠根據(jù)壓縮聲頻信號(hào)使用的如AC-3、MEPG和霍夫曼編碼等編碼類(lèi)型變化。
然后,高頻分量發(fā)生單元230使用SBR算法對(duì)每個(gè)聲道每隔一個(gè)幀跳躍地重構(gòu)左右聲道信號(hào)的高頻分量(S20)。下面參照?qǐng)D5對(duì)上述更具體說(shuō)明。
圖5是根據(jù)本發(fā)明對(duì)每個(gè)聲道信號(hào)每隔一個(gè)幀跳躍地產(chǎn)生高頻分量的處理過(guò)程示意圖。參見(jiàn)圖5,高頻發(fā)生單元230分別對(duì)左右聲道信號(hào)每隔一個(gè)幀跳躍地重構(gòu)高頻分量。
即,從時(shí)間t1的幀產(chǎn)生左聲道的高頻分量(Lt1),而在時(shí)間t2的幀產(chǎn)生右聲道(Rt2)的高頻分量。相似地,這個(gè)處理在時(shí)間t3、t4、t5等被重復(fù)地進(jìn)行。
然后,聲道相似性確定單元220確定左右聲道信號(hào)之間的相似性(S30)。下面簡(jiǎn)要說(shuō)明確定聲道信號(hào)之間相似性的方法。
首先,聲道相似性確定單元220分析解碼的聲頻信號(hào)是否包括模式信息。如果是,確定單元220基于模式信息確定聲道信號(hào)之間的相似性,即,根據(jù)模式信息是具有左右聲道信號(hào)之間大的相似性的共同立體聲模式值,或是具有聲道信號(hào)之間小的相似性的立體聲模式值,確定聲道信號(hào)之間的相似性另一方面,在解碼的聲頻信號(hào)中不包括模式信息時(shí),聲道相似性確定單元220基于從聲頻信號(hào)獲得的聲道信號(hào)之間的和及差的信息,計(jì)算相應(yīng)于表示聲道信號(hào)之間相似性的參數(shù)的SNR。然后,如果計(jì)算的SNR值小于聲道信號(hào)之間的相似性的閾值,則確定這兩個(gè)聲道信號(hào)是彼此相似的。否則,確定這兩個(gè)聲道信號(hào)彼此不相似。即,如果在解碼聲頻信號(hào)中不含有模式信息,則將從聲道信號(hào)的和及差信息獲得的SNR作為表示聲道信號(hào)之間相似性的參數(shù),然后與20分貝的閾值比較,確定聲道信號(hào)之間的相似性。
已就圖2和3說(shuō)明了依靠模式信息確定聲道信號(hào)之間相似性的方法,在此省略其詳細(xì)說(shuō)明。
另外,在聲道相似性確定單元220確定左右聲道信號(hào)彼此不相似時(shí),高頻分量發(fā)生單元230,使用每個(gè)聲道信號(hào)的前幀的高頻分量,重構(gòu)跳躍幀的高頻分量,從而產(chǎn)生各聲道信號(hào)的高頻分量(S40)。下面參照?qǐng)D6更詳細(xì)說(shuō)明這個(gè)處理。
圖6是在兩個(gè)聲道信號(hào)彼此不相似時(shí)的產(chǎn)生左右聲道信號(hào)的方法示意圖。參見(jiàn)圖6,在兩個(gè)聲道信號(hào)彼此不相似時(shí),高頻分量發(fā)生單元230用對(duì)每個(gè)聲道信號(hào)的前幀產(chǎn)生的高頻分量(在每隔一個(gè)幀跳躍時(shí)產(chǎn)生的高頻分量),重構(gòu)跳躍的幀的高頻分量。
也就是說(shuō),用在時(shí)間t1的左聲道信號(hào)信號(hào)的高頻分量Lt1代替跳躍的幀的高頻分量,即在時(shí)間t2的左聲道的高頻分量Lt2。相似地,在時(shí)間t2的右聲道信號(hào)的高頻分量Rt2代替在時(shí)間t3的高頻分量Rt3。
在另一方面,在聲道相似性確定單元220確定左右聲道信號(hào)彼此相似時(shí),高頻分量發(fā)生單元230利用從一個(gè)聲道信號(hào)產(chǎn)生的高頻分量,重構(gòu)另一聲道信號(hào)的高頻分量(S50)。下面參照?qǐng)D7詳細(xì)說(shuō)明這個(gè)處理。
圖7是在左右聲道信號(hào)彼此相似時(shí)的重構(gòu)每個(gè)聲道信號(hào)的高頻分量的方法示意圖。參見(jiàn)圖7,在確定左右聲道彼此相似時(shí),高頻分量發(fā)生單元230使得左聲道信號(hào)的高頻分量分別代替左右聲道信號(hào)的跳躍幀的高頻分量。此時(shí),從每個(gè)聲道信號(hào)產(chǎn)生的高頻分量能夠乘以預(yù)定的修改值(例如,特定的常數(shù))并用于產(chǎn)生另一聲道信號(hào)的高頻分量。
即,左聲道信號(hào)高頻分量(Lt1)代替在時(shí)間t1的右聲道信號(hào)相對(duì)應(yīng)的高頻分量Rt1,并且右聲道信號(hào)的高頻分量(Rt2)代替時(shí)間t2的左聲道的高頻分量(Lt2)。
此時(shí),因?yàn)樽笥衣暤佬盘?hào)通常彼此很相似,所以聲音質(zhì)量的降低變得最小。而且,對(duì)每個(gè)聲道信號(hào)每隔一幀跳躍地產(chǎn)生高頻分量,并且將它們有效地用于另一聲道信號(hào)的高頻分量。因此,與傳統(tǒng)的SBR算法相比較,計(jì)算量約能夠減少30%。
最后,產(chǎn)生的高頻分量與解碼的聲頻信號(hào)結(jié)合,然后輸出結(jié)合的信號(hào)(S60)。
總的來(lái)說(shuō),因?yàn)槎鄶?shù)聲頻信號(hào)的左右聲道信號(hào)彼此相似,所以根據(jù)本發(fā)明的解碼方法解碼聲頻信號(hào)位流,使得重構(gòu)高頻分量需要的計(jì)算,與現(xiàn)有技術(shù)相比,約減少30%。
圖8示出了與現(xiàn)有技術(shù)的SBR和MP3方法相比較,本發(fā)明加強(qiáng)聲音質(zhì)量的例子。為了評(píng)價(jià)在64kbps的比率壓縮的包括3首爵士音樂(lè)、9首流行音樂(lè)、7首搖滾音樂(lè)和6首古典音樂(lè)的各種歌曲的聲頻信號(hào)的聲音質(zhì)量,進(jìn)行了14次試驗(yàn)。使用用于測(cè)量壓縮數(shù)字聲響/聲頻信號(hào)的周知的系統(tǒng)的歌劇工具(opera tool),作為聲音質(zhì)量評(píng)價(jià)程序。按照由歌劇工具測(cè)量的值接近零,確定改進(jìn)重構(gòu)的聲音質(zhì)量。
如圖8所示,能夠理解,根據(jù)本發(fā)明重構(gòu)高頻分量的方法再現(xiàn)的聲頻信號(hào)的聲音質(zhì)量,幾乎與現(xiàn)有技術(shù)SBR和MP3方法再現(xiàn)的聲頻信號(hào)的聲音質(zhì)量相同或它們的差別可忽略。
因此,與傳統(tǒng)的SBR算法相比較,本發(fā)明使得即使在計(jì)算量減少約30%的情況下也能夠輸出高質(zhì)量的聲頻信號(hào),而現(xiàn)有技術(shù)的SBR算法,盡管也具有良好的加強(qiáng)聲音質(zhì)量的作用,但是由于過(guò)量的計(jì)算時(shí)間,實(shí)際應(yīng)用到相關(guān)產(chǎn)品是困難的。
而且,本發(fā)明的優(yōu)選實(shí)施例能夠以計(jì)算機(jī)可執(zhí)行的程序的形式實(shí)現(xiàn)。另外,通過(guò)計(jì)算機(jī)可讀記錄介質(zhì),所述程序能夠在數(shù)字計(jì)算機(jī)上運(yùn)行。
所述計(jì)算機(jī)可讀記錄介質(zhì)包括磁性記錄介質(zhì)(如ROM、軟盤(pán)、硬盤(pán)等),光學(xué)可讀介質(zhì)(如CD ROM、DVD等)和載波(如通過(guò)因特網(wǎng)傳輸)。
雖然現(xiàn)有技術(shù)能夠使得聲音質(zhì)量改善,但是由于過(guò)多的計(jì)算時(shí)間,現(xiàn)有技術(shù)應(yīng)用到相關(guān)產(chǎn)品是困難的,但是根據(jù)上述的本發(fā)明,能夠解決這個(gè)關(guān)鍵問(wèn)題。因此,優(yōu)點(diǎn)是重構(gòu)高頻分量需要的計(jì)算時(shí)間能夠約減少了30%。
雖然結(jié)合圖示的優(yōu)選實(shí)施例說(shuō)明了本發(fā)明,但是本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,在不偏離本發(fā)明的范圍和精神的情況下,能夠做出各種改變。因此,本發(fā)明的優(yōu)選實(shí)施例是示范說(shuō)明,而不是限定本發(fā)明。本發(fā)明由權(quán)利要求限定,各種修改方案應(yīng)包括在本發(fā)明內(nèi)。
權(quán)利要求
1.一種在解碼聲頻數(shù)據(jù)時(shí)產(chǎn)生高頻分量的方法,包括步驟利用第一和第二聲道信號(hào)之間的相似性,產(chǎn)生高頻分量。
2.如權(quán)利要求1所述的方法,其中基于第一和第二聲道信號(hào)之間的和及差的信息獲得的信噪比(SNR),確定聲道信號(hào)之間的相似性。
3.如權(quán)利要求1所述的方法,其中聲頻數(shù)據(jù)包括模式信息。
4.如權(quán)利要求3所述的方法,還包括步驟確定模式信息是否是表示在第一和第二聲道信號(hào)之間大的相似性的共同立體聲值,或是表示第一和第二聲道信號(hào)之間沒(méi)有相似性的立體聲模式值。
5.如權(quán)利要求1所述的方法,還包括步驟在第一和第二聲道信號(hào)彼此相似時(shí),產(chǎn)生每個(gè)聲道信號(hào)的僅一些幀的高頻分量;和使用另一聲道信號(hào)的某些幀的產(chǎn)生的高頻分量,產(chǎn)生每個(gè)聲道信號(hào)的其它一些幀的高頻分量。
6.如權(quán)利要求5所述的方法,其中通過(guò)適當(dāng)修改一些幀的高頻分量產(chǎn)生其它幀的高頻分量。
7.如權(quán)利要求1所述的方法,還包括步驟在第一和第二聲道信號(hào)彼此不相似時(shí),產(chǎn)生每個(gè)聲道信號(hào)的僅一些幀的高頻分量;和使用相關(guān)聲道信號(hào)的一些幀的產(chǎn)生的高頻分量,產(chǎn)生每個(gè)聲道信號(hào)的其它幀的高頻分量。
8.如權(quán)利要求7所述的方法,其中通過(guò)適當(dāng)修改一些幀的高頻分量產(chǎn)生其它幀的高頻分量。
9.一種重構(gòu)高頻分量的聲頻解碼方法,包括步驟(a)接收編碼的聲頻數(shù)據(jù),解碼接收的數(shù)據(jù),和輸出第一和第二聲道的解碼的聲頻信號(hào);(b)產(chǎn)生每個(gè)第一和第二聲道信號(hào)的僅一些幀的高頻分量;(c)確定在第一聲道和第二聲道信號(hào)之間的相似性;(d)在第一和第二聲道信號(hào)彼此相似時(shí),使用另一聲道信號(hào)的一些幀的產(chǎn)生的高頻分量,產(chǎn)生每個(gè)聲道信號(hào)的另一些幀的高頻分量;和(e)將產(chǎn)生的高頻分量與解碼的聲頻信號(hào)結(jié)合,并輸出結(jié)合的聲頻信號(hào)。
10.如權(quán)利要求9所述的方法,其中步驟(c)包括步驟基于從第一和第二聲道信號(hào)的和及差信息獲得的信噪比(SNR),確定聲道信號(hào)之間的相似性。
11.如權(quán)利要求9所述的方法,其中聲頻數(shù)據(jù)包括模式信息。
12.如權(quán)利要求9所述的方法,其中步驟(c)包括步驟確定模式信息是否是表示表在第一和第二聲道信號(hào)之間大的相似性的共同立體聲值,或是表示第一和第二聲道信號(hào)之間無(wú)相似性的立體聲模式值。
13.如權(quán)利要求9所述的方法,還包括步驟在確定第一和第二聲道信號(hào)彼此不相似時(shí),使用相關(guān)聲道信號(hào)的一些幀的產(chǎn)生的高頻分量,產(chǎn)生每個(gè)聲道信號(hào)的其它幀的高頻分量。
14.一種重構(gòu)高頻分量的聲頻解碼裝置,包括聲頻解碼器,接收編碼的聲頻數(shù)據(jù),解碼接收的數(shù)據(jù),和輸出第一和第二聲道的解碼的聲頻數(shù)據(jù);聲道相似性確定單元,確定第一和第二聲道信號(hào)之間的相似性;高頻分量發(fā)生單元,基于第一和第二聲道信號(hào)之間的相似性,產(chǎn)生每個(gè)聲道的聲頻信號(hào)的高頻分量;和聲頻合成單元,將解碼的聲頻信號(hào)與產(chǎn)生的高頻分量結(jié)合,并輸出結(jié)合的聲頻數(shù)據(jù)。
15.如權(quán)利要求14所述的裝置,其中高頻分量發(fā)生單元被配置成在第一和第二聲道信號(hào)彼此相似時(shí),產(chǎn)生每個(gè)第一和第二聲道信號(hào)的僅一些幀的高頻分量,然后使用另一聲道信號(hào)的一些幀的產(chǎn)生的高頻分量,產(chǎn)生每個(gè)聲道信號(hào)的其它幀的高頻分量。
16.如權(quán)利要求14所述的裝置,其中高頻分量發(fā)生單元被配置成在第一和第二聲道信號(hào)彼此不相似時(shí),產(chǎn)生每個(gè)聲道的僅一些幀的高頻分量,然后使用相關(guān)聲道信號(hào)的一些幀的產(chǎn)生的高頻分量,產(chǎn)生每個(gè)聲道信號(hào)其它幀的高頻分量。
17.一種計(jì)算機(jī)可讀記錄介質(zhì),其中記錄了在計(jì)算機(jī)中執(zhí)行權(quán)利要求1-13任何一項(xiàng)權(quán)利要求所述方法的程序。
全文摘要
提供一種以較小的計(jì)算量重構(gòu)高頻分量的聲頻信號(hào)解碼方法和裝置。所述解碼裝置包括解碼器;聲道相似性確定單元;高頻分量發(fā)生單元;和聲頻合成單元。所述方法對(duì)每個(gè)聲道信號(hào)每隔一幀跳躍地產(chǎn)生各幀的高頻分量;在左右聲道信號(hào)彼此相似時(shí),使用另一個(gè)聲道信號(hào)的相對(duì)應(yīng)的幀產(chǎn)生的高頻分量,產(chǎn)生任何一個(gè)聲道信號(hào)跳躍幀的高頻分量;在左右聲道信號(hào)彼此不相似時(shí),使用相關(guān)聲道信號(hào)的前幀,產(chǎn)生每個(gè)聲道信號(hào)的跳躍幀的高頻分量。
文檔編號(hào)G10L19/00GK1504993SQ20031010123
公開(kāi)日2004年6月16日 申請(qǐng)日期2003年10月13日 優(yōu)先權(quán)日2002年11月29日
發(fā)明者吳潤(rùn)學(xué), 馬修·馬努, 馬努 申請(qǐng)人:三星電子株式會(huì)社