專利名稱:用于立體聲編碼的方法、裝置和計算機程序產(chǎn)品的制作方法
技術(shù)領(lǐng)域:
本發(fā)明的示例性實施例總體上涉及音頻編碼系統(tǒng),并且特別地涉及用 于改進(jìn)立體聲信號的編碼條件的技術(shù)。
背景技術(shù):
在音頻編碼系統(tǒng)中,輸入的時域音頻信號被壓縮,以便顯著降低表示 該信號所需的比特率。理想地,編碼信號的比特率是這樣的,即,該比特 率符合傳輸信道的限制或最小化編碼文件的大小。前者通常用于實時通信 以及流式服務(wù)中,而當(dāng)在本地存儲音頻內(nèi)容或者通過高音頻質(zhì)量進(jìn)行下載 時,對后者的部署越來越廣泛。
通常音頻編碼器目的在于最小化在任何給定比特率下的感知失真
(perceptual distortion)。然而,比特率越低,對于編碼器來說,滿足目 標(biāo)比特率和零感知失真就越有挑戰(zhàn)性。另一編碼情形是在保持感知失真 聽不見的同時最小化編碼文件大小。
在兩種情況下,需要應(yīng)用高級編碼模型和技術(shù)來最大化終端用戶體驗。 通常,最終定義任何編碼系統(tǒng)的整體性能的是具有最壞情況信號(即,難 以編碼的信號)的(編碼)性能。定義任何編碼系統(tǒng)的整體性能的另一因 素是為了實現(xiàn)給定比特率或音頻質(zhì)量級別而需要的資源以及編碼速度。 對于商業(yè)應(yīng)用來說,并且尤其對于移動使用來說,編碼速度和存儲需求常 常扮演重要角色。
在嘗試實現(xiàn)更低比特率而不降低感知失真的情況下,應(yīng)當(dāng)開發(fā)并充分 利用新的音頻編碼方法。已經(jīng)在現(xiàn)有技術(shù)的音頻編碼中廣泛使用的這些方 法中的一種方法是立體聲信號的高效編碼。感知音頻編碼器在頻域?qū)斎?信號進(jìn)行編碼,因為在頻域中可以最好地描述人的聽覺特性。頻鐠樣本通?;陬l帶而被量化,并且量化器通過增加或降低相應(yīng)的量化器步長來使
量化噪聲成形,直到噪聲剛好低于聽覺掩蔽門限(auditory masking threshold )。
一方面,所引入的感知失真對人耳來說是聽不見的。另一方面,這限 制了最低可能的比特率。從文獻(xiàn)已知,可以借助于中側(cè)(M/S, Mid-Side) 和強度立體聲(IS)編碼來最好地描述和實現(xiàn)對立體聲信號的編碼。在 M/S立體聲編碼中,左和右(L/R)輸入聲道凈皮變換成和差信號(sum and difference signals )。(參見J. D. Johnston和A. J. Ferreira, "Sum-difference stereo transform coding" , /C4S5P-92 Co"/emice及m /^, 1992, pp. 569-572 (下文為),由此通過引用的方式將其內(nèi)容全部合并 于此)。特別地,中央聲道(mid channel)是左聲道和右聲道的平均,而 側(cè)聲道(sidechannel)是被二所除的兩個聲道之間的差。然后,選擇要求 最低數(shù)目的比特以達(dá)到零感知失真的聲道組合(即,L/R相對于M/S )。 對于最大編碼效率來說,該變換按照與頻率和時間有關(guān)的方式來完成。M/S 立體聲編碼對高質(zhì)量、高比特率立體聲編碼尤其有用。
對于嘗試達(dá)到較低的立體聲比特率,IS立體聲編碼通常已經(jīng)結(jié)合M/S 編碼來4吏用。在IS編碼中, 一部分頻語僅按照單聲道模式(mono mode) 來編碼,并且通過傳輸用于左聲道和右聲道的不同標(biāo)度因子(scaling factor)來重新構(gòu)造立體聲圖像(stereo image )。(參見1996年7月授予 美國飛利浦公司的才示題為 "Subband coded digital transmission system using some composite signal"的美國專利No. 5,539,829 (下文中為",829 專利,,),以及1997年2月授予美國飛利浦公司的標(biāo)題為"Subband coded digital transmission system using some composite signals"的美國專利No. 5,606,618 (下文中為",618專利,,),由此通過引用的方式將其各自的內(nèi) 容全部合并于此)。然而,眾所周知,IS立體聲在低頻處表現(xiàn)很差,因而 限制了可用的比特率范圍。
在低比特率(例如,低于1.5bps )處,對M/S立體聲編碼的使用由于 可用比特的缺乏而造成通常不能保持全部空間圖像。經(jīng)常發(fā)生從一個聲道到其它聲道的也被稱為串音(cross talk)的譜泄露。這種退化(degradation) 將對輸出質(zhì)量具有明顯影響。當(dāng)空間圖像在左聲道和右聲道之間沒有均勻 分布時,該退化尤其令人煩擾。
因此,需要改進(jìn)在一系列比特率之上的編碼。
發(fā)明內(nèi)容
整體而言,本發(fā)明的示例性實施例尤其通過提供用于在任何給定比特 率下實現(xiàn)高立體聲質(zhì)量的技術(shù),來提供對已知現(xiàn)有技術(shù)的改進(jìn)。特別地, 根據(jù)示例性實施例,在使用中側(cè)(M/S)立體聲編碼(即,將左和右(L/R) 輸入信號變換成中央和側(cè)信號(M/S),并且在兩個信號對之間進(jìn)行選擇) 時,當(dāng)在L/R和M/S信號之間進(jìn)行選擇之前,可以基于在左輸入信號與右輸 入信號之間的能量差,對在進(jìn)行該判定中所使用的掩蔽門限進(jìn)行修改。當(dāng)
在兩個輸入聲道的能量級別之間存在大差異時,這指示 一個輸入聲道在 感知上比另一個更重要。該聽覺特征應(yīng)當(dāng)被包括在編碼過程中,以便獲得 可能的最佳質(zhì)量。因此,才艮據(jù)示例性實施例,具有較少能量的左信號或右 信號的掩蔽門限將按比例向上調(diào)整,從而指示在不創(chuàng)建可聽人為因素 (audible artifacts)的情況下,更大量的噪聲是可允許的。更大量的可允 許噪聲還降低了對相應(yīng)的輸入聲道進(jìn)行編碼所需的比特量,因而增加了將 選擇L/R輸入信號而不是與其對應(yīng)的M/S信號的可能性。在一個輸入聲道在 感知上比另一個更為主導(dǎo)的情況下,優(yōu)選L/R輸入信號,以便限制聲道串 音的擴散(這通常同樣被感知為十分惱人的人為因素)。另外,在一個示 例性實施例中,當(dāng)在L/R相對于M/S信號的情況下進(jìn)行選擇之后,以及在量 化所選擇的信號之前,可以對最后的掩蔽門限進(jìn)行進(jìn)一步的修改,以便由 量化器在期望比特率與多個可用比特之間創(chuàng)建更好的匹配。這通過向另一 聲道分派更多可允許的噪聲而改進(jìn)了在感知上更為主導(dǎo)的輸入聲道的質(zhì) 量。在量化器開始用完比特的情況下,將針對在感知上較不重要的輸入聲 道發(fā)生粗略量化,留下更重要的比特用于主導(dǎo)聲道的編碼。依照一個方面,提供了一種立體聲編碼方法。在一個示例性實施例中,
該方法可以包括(1)接收左和右輸入信號;(2)導(dǎo)出與相應(yīng)的左和右 輸入信號相關(guān)聯(lián)的左和右掩蔽門限;以及(3)至少部分基于在與相應(yīng)的 左和右輸入信號相關(guān)聯(lián)的能量之間的關(guān)系,修改左或右掩蔽門限中的至少 一個。
在一個示例性實施例中,該方法可以進(jìn)一步包括確定與相應(yīng)的左和 右輸入信號相關(guān)聯(lián)的能量。與左或右輸入信號中的一個相關(guān)聯(lián)的能量將包 括最大能量,而與其它輸入信號相關(guān)聯(lián)的能量將包括最小能量。然后可以 至少部分基于最大能量與最小能量的比值來確定標(biāo)度值(sack value)。 該標(biāo)度值可以與預(yù)定門限進(jìn)行比較,并且在標(biāo)度值超過預(yù)定門限的情況 下,該方法可以進(jìn)一步包括修改與包括最小能量的輸入信號相關(guān)聯(lián)的掩 蔽門限。
根據(jù)該示例性實施例,修改掩蔽門限可以涉及將所導(dǎo)出的掩蔽門限 乘以門限標(biāo)度,所述門限標(biāo)度與預(yù)定值或所確定的標(biāo)度值中的較小值相 等。
在另一示例性實施例中,該方法可以進(jìn)一步包括至少部分基于左和 右輸入信號來確定中央和側(cè)信號。在一個示例性實施例中,這可以涉及 對左和右輸入信號進(jìn)行平均以便確定中央信號,以及取左和右輸入信號的 差并且將該差除以二,從而確定側(cè)信號。然后,該方法可以進(jìn)一步包括 至少部分基于左和右掩蔽門限,在左和右輸入信號與中央和側(cè)輸入信號之 間進(jìn)行選擇。在該示例性實施例中,修改左或右掩蔽門限的步驟可以當(dāng)在 兩個信號對之間進(jìn)行選擇之前實現(xiàn)。在兩個信號對之間進(jìn)行選擇可以涉 及至少部分基于左和右掩蔽門限來確定與左和右輸入信號相關(guān)聯(lián)的第一 組合感知熵(entropy);至少部分基于中央和側(cè)掩蔽門限來確定與中央和 側(cè)信號相關(guān)聯(lián)的第二組合感知熵;以及將第一和第二組合感知熵進(jìn)行比較 以確定哪個更低。
在又一示例性實施例中,該方法還可以包括在選擇了左和右輸入信 號的情況下,進(jìn)一步4務(wù)改左或右掩蔽門限中的至少一個,或者在選擇了中央和側(cè)信號的情況下,進(jìn)一步修改中央或側(cè)掩蔽門限中的至少一個。然后, 可以至少部分基于對應(yīng)的掩蔽門限來量化所選擇的信號。
依照另一方面,提供了用于立體聲編碼的裝置。在一個示例性實施例,
該裝置可以包括編碼器,所述編碼器被配置以便(1)接收左和右輸入 信號;(2)導(dǎo)出與相應(yīng)的左和右輸入信號相關(guān)聯(lián)的左和右掩蔽門限;以 及(3)至少部分基于在與相應(yīng)的左和右輸入信號相關(guān)聯(lián)的能量之間的關(guān) 系,l務(wù)改左或右掩蔽門限中的至少一個。
根據(jù)又一方面,提供了一種被配置以便實現(xiàn)立體聲編碼的設(shè)備。在一 個示例性實施例中,該設(shè)備可以包括(1)用于接收左和右輸入信號的裝 置;(2)用于導(dǎo)出與相應(yīng)的左和右輸入信號相關(guān)聯(lián)的左和右掩蔽門限的 裝置;以及(3)用于至少部分基于在與相應(yīng)的左和右輸入信號相關(guān)聯(lián)的 能量之間的關(guān)系來修改左或右掩蔽門限中的至少 一個的裝置。
依照又一方面,提供了一種用于立體聲編碼的計算積一呈序產(chǎn)品。該計 算機程序產(chǎn)品含有在其中存儲了計算機可讀程序代碼部分的至少一個計
算機可讀存儲介質(zhì)。 一個示例性實施例的計算機可讀程序代碼部分包括 (1)第一可執(zhí)行部分,用于接收左和右輸入信號;(2)第二可執(zhí)行部分, 用于導(dǎo)出與相應(yīng)的左和右輸入信號相關(guān)聯(lián)的左和右掩蔽門限;以及(3) 第三可執(zhí)行部分,用于至少部分基于在與相應(yīng)的左和右輸入信號相關(guān)聯(lián)的 能量之間的關(guān)系,^"改左或右掩蔽門限中的至少一個。
因而總體而言已經(jīng)描述了本發(fā)明的示例性實施例,現(xiàn)在將參照附圖,
附圖不一定按比例繪制,并且在附圖中
圖l是將從本發(fā)明的示例性實施例受益的編碼和解碼系統(tǒng)的框圖2是根據(jù)本發(fā)明的示例性實施例的編碼器的示意性才匡圖3是根據(jù)本發(fā)明的示例性實施例的能夠操作的移動臺的示意性框
圖;以及圖4是圖示了根據(jù)本發(fā)明的示例性實施例為了提供改進(jìn)的中側(cè)立體聲 編碼而可以采取的操作的流程圖。
具體實施例方式
現(xiàn)在將參照附圖在下文中更充分地描述本發(fā)明的示例性實施例,在附 圖中示出了一些而不是所有的本發(fā)明實施例。實際上,本發(fā)明的示例性實 施例可以以很多不同的形式來體現(xiàn),并且不應(yīng)當(dāng)被解釋為限于在此闡述的 實施例;相反,提供這些實施例以便本公開將滿足可應(yīng)用的法律要求。貫 穿全文相同的數(shù)字指的是相同的元件。
概述
整體而言,本發(fā)明的示例性實施例提供了一種改進(jìn)的技術(shù)用于實現(xiàn)中 側(cè)(M/S)立體聲編碼,其可以以所有比特率(包括低比特率)來遞送改 進(jìn)的立體聲質(zhì)量。根據(jù)示例性實施例,附加步驟被添加到編碼過程,由此 當(dāng)在信號對之間進(jìn)行選擇之前,修改了在對于何時將使用中央和側(cè)信號而 不是左和右輸入信號所進(jìn)行的確定中使用的參數(shù)。特別地,可以基于在兩 個輸入信號的能量之間的關(guān)系來修改與左或右輸入信號相關(guān)聯(lián)的掩蔽門 限。例如,在左和右輸入信號的最大能量與這兩個信號的最小能量的比值 超過預(yù)定門限的情況下,可以按比例調(diào)整與具有這兩個信號的最少能量 (即,最小能量)的輸入信號相關(guān)聯(lián)的掩蔽門限。該調(diào)整的結(jié)果是使得在 一個輸入聲it^感知上比另 一個更重要的情況下,選擇L/R信號而不是與 其對應(yīng)的M/S信號。這是有益的,因為在兩個輸入聲道之間的能量級別顯 示大差異的情況下,L/R輸入信號是優(yōu)選的。另外,根據(jù)一個示例性實施 例, 一旦已經(jīng)進(jìn)行了在信號對之間的選擇,就可以再次基于在左和右輸入 信號的能量之間的關(guān)系,進(jìn)一步修改所選擇的信號的掩蔽門限。該進(jìn)一步 的修改改進(jìn)了在用于量化的可用比特數(shù)與期望比特率之間的匹配。特別地, 該實施例通過向另 一聲道分派更多可允許的噪聲,改進(jìn)了在感知上更為主 導(dǎo)的輸入信道的質(zhì)量。在量化器開始用完比特的情況下,粗略量化將針對 在感知上較不重要的輸入信道而發(fā)生,留下更重要的比特用于主導(dǎo)聲道的
1編碼。
整體系統(tǒng)和通用M/S立體聲編碼器
現(xiàn)在參照圖1,圖1提供了根據(jù)本發(fā)明示例性實施例的整體音頻編碼 和解碼系統(tǒng)的基^f匡圖。如圖所示,整體系統(tǒng)可以包括編碼器102 (例如, 高級音頻編碼(AAC)編碼器,或者具有i普帶復(fù)制的增強型AAC編碼器 (eAAC+)),其凈皮配置以^更接收音頻信號101,按照例如以下所討論的 方式來對信號進(jìn)行編碼,以及通過通信信道103向解碼器104傳送所編碼 的音頻信號。
特別地,如圖2所示,圖2提供了才艮據(jù)一個示例性實施例的編碼器102 的較為詳細(xì)的圖示,編碼器102可以包括左和右時間-頻率映射器201L和 201R,左和右時間-頻率映射器201L和201R被配置以便分別在時域中接 收左和右音頻輸入信號,以及使用例如傅立葉變換將這些信號轉(zhuǎn)換到頻域 中。編碼器102可以進(jìn)一步包括用于生成左、右、中央和側(cè)掩蔽門限幼&、 溈Of、溈 和溈/^的裝置,諸如門限生成處理元件202。所生成的掩蔽門限 定義了所允許的噪聲,可以在不創(chuàng)建可聽人為因素的情況下將所允許的噪 聲引入每個譜帶,并且所允許的噪聲基于的是由編碼器102所接收到的左 和右音頻輸入信號以及心理聲學(xué)模型(psychoacoustical model )。所使用的 模型的細(xì)節(jié)和實施方式在本發(fā)明的示例性實施例的范圍之外,但是可以基 于例:fi口在E. Zwicker、 H. Fasti在"Psychoacoustics, Facts and Models" Springer畫Verlag, 19卯的第四章中或者ISO/IEC JTC1/SC29/WG11 (MPEG-2 AAC), Generic Coding of Moving Pictures and Associated Audio, Advanced Audio Coding, International Standard 13818-7, ISO/IEC, 1997中所描述的模型。
另外,編碼器102可以包括用于將左和右輸入信號變換成中央和側(cè)信 號以及用于選擇將要使用的信號組合的裝置,諸如變換和選擇處理元件 203。特別地,如上所述,中央信號可以通過將左和右輸入信號進(jìn)行平均來 生成,而側(cè)信號可以通過取這兩個信號之間的差并除以二來生成。 一旦已 經(jīng)生成了中央和側(cè)信號,便可以進(jìn)行關(guān)于哪些信號(即,L/R或M/S)需要最低比特率或產(chǎn)生最大編碼增益的確定。如下面較為詳細(xì)討論的,本發(fā)
明的示例性實施例基于在左和右輸入信號之間的能量差,通過修改由202 所生成的掩蔽門限中的一個而改進(jìn)了該判定進(jìn)行過程。通過修改掩蔽門限, 在兩個輸入聲道中的一個在感知上比另一個更為主導(dǎo)的情況下,將選擇 L/R信號而不是與其對應(yīng)的M/S信號。
編碼器102可以進(jìn)一步包括量化器204和比特流多路復(fù)用器205,量 化器204被配置以便量化所選擇的信號(即,L/R信號或M/S信號),從 而實現(xiàn)期望比特率,而比特流多路復(fù)用器205被配置以使基于量化器204 的輸出來創(chuàng)建比特流。如本領(lǐng)域的普通技術(shù)人員將認(rèn)識的,編碼器102的 任何以上元件均可以包括用于依照本發(fā)明的示例性實施例來實現(xiàn)一個或多 個上述功能的各種裝置,包括在此較為特別示出并描述的那些裝置。然而 應(yīng)當(dāng)理解, 一個或多個元件可以包括用于實現(xiàn)一個或多個類似功能的備選 裝置,而不背離本發(fā)明的精神和范圍。同樣,編碼器102的元件可以包括 全硬件組件、全軟件組件,或者硬件和軟件組件的任何組合。例如,門限
元件中體現(xiàn),諸如孩i處理器、專用集成電路(ASIC)等。
返回圖1,在收到所編碼的信號時,于是,解碼器104可以被配置以 便解碼所接收到的信號,從而輸出原始解碼的音頻信號101'。如本領(lǐng)域的 普通技術(shù)人員所已知的,任何數(shù)目的電子設(shè)備(例如,蜂窩電話、個人數(shù) 字助理(PDA)、膝上型計算機、個人計算機(PC)等)均可以包括上述 編碼器102和解碼器104。通過例子,現(xiàn)在參照圖3,圖3圖示了一種類型 的電子設(shè)備,其可以包括上述編碼器102或解碼器104。如圖所示,電子 設(shè)備可以是移動臺10,并且特別地,可以是蜂窩電話。然而,應(yīng)當(dāng)理解, 圖示和下文中所描述的移動臺僅是可以受益于本發(fā)明的一種類型的電子設(shè) 備的圖示,并且因此,不應(yīng)當(dāng)視為限制本發(fā)明的范圍。雖然移動臺10的若 干實施例被圖示并且出于舉例的目的將在下文中描述,但是諸如PDA、尋 呼機、膝上型計算機的其它類型的移動臺以及包括移動無線設(shè)備和固定有 線設(shè)備這二者在內(nèi)的其它類型的電子系統(tǒng)也可以易于釆用本發(fā)明的實施例。
移動臺包括用于依照本發(fā)明的示例性實施例實現(xiàn)一個或多個功能的各 種裝置,包括在此較為特別示出和描述的那些裝置。然而,應(yīng)當(dāng)理解,移 動臺可以包括用于實現(xiàn)一個或多個類似功能的備選裝置,而不背離本發(fā)明
的精神和范圍。更具體地,例如,如圖3所示,除了天線302之外,移動 臺10還包括發(fā)射機304、接收機306,以及分別向發(fā)射機304提WI"號和 從接收機306接收信號的諸如處理設(shè)備308的裝置,例如,處理器、控制 器等。這些信號包括依照可應(yīng)用的蜂窩系統(tǒng)的空中接口標(biāo)準(zhǔn)的信令信息, 以及用戶語音和/或用戶生成的數(shù)據(jù)。就此而言,移動臺能夠在一個或多個 空中接口標(biāo)準(zhǔn)、通信協(xié)議、調(diào)制類型和接入類型的情況下操作。更特別地, 移動臺能夠依照任何多個第二代(2G)、 2.5G和/或第三代(3G)通信協(xié) 議等來操作。此外,舉例來說,移動臺能夠依照任何多個不同無線組網(wǎng)技 術(shù)來操作,包括藍(lán)牙、IEEE 802.11 WLAN (或Wi-Fi )、 IEEE 802.16 WiMAX、超寬帶(UWB)等。
要理解,諸如處理器、控制器或其它計算設(shè)備的處理設(shè)備308包括用 于實現(xiàn)移動臺的視頻、音頻和邏輯功能所需的電路,并且能夠執(zhí)行用于實 現(xiàn)在此所討論的功能性的應(yīng)用程序。例如,處理設(shè)備可以包括各種裝置, 包括數(shù)字信號處理器設(shè)備、」敞處理器i殳備,以及各種模數(shù)轉(zhuǎn)換器、數(shù)模轉(zhuǎn) 換器和其它支持電路。移動設(shè)備的控制和信號處理功能根據(jù)設(shè)備相應(yīng)的能 力而在這些設(shè)備之間分配。因而,處理設(shè)備308還包括用于在調(diào)制和發(fā)射 之前巻積編碼以及交織消息和數(shù)據(jù)的功能性。此外,處理i殳備308可以包 括用于操作可存儲在存儲器中的一個或多個軟件應(yīng)用的功能性。例如,控 制器能夠操作連通性程序,諸如常規(guī)Web瀏覽器。然后,舉例來說,連通 性程序可以諸如根據(jù)HTTP和/或無線應(yīng)用協(xié)議(WAP)允許移動臺發(fā)射 和接收Web內(nèi)容。
在一個示例性實施例中(未示出),處理元件308可以包括以上參照圖 1和圖2所討論的編碼器102和/或解碼器104。可選地,編碼器102和/或 解碼器104可以是在通信上耦合于處理元件308的離散組件。移動臺還可以包括諸如用戶接口的裝置,例如包括常規(guī)耳機或揚聲器
310、擴音器314、顯示器316,所有這些都耦合到控制器308。允許移動 設(shè)備接收數(shù)據(jù)的用戶輸入接口可以包括允許移動臺接收數(shù)據(jù)的任何多個設(shè) 備,諸如鍵板318、觸摸顯示器(未示出)、擴音器314或其它輸入設(shè)備。 在包括,的實施例中,鍵板可以包括常規(guī)數(shù)字(0-9)和相關(guān)鍵(#、 *) 以及用于操作移動臺的其它鍵,并且可以包括一整套字母數(shù)字鍵或可被激 活來提供一整套字母數(shù)字鍵的鍵集。盡管未示出,然而移動臺可以包括電 池(諸如振動電池組),用于向操作移動臺所需的各種電路供電,以及視情 況提供機械振動作為可檢測的輸出。
移動臺還可以包括通常存儲與移動訂戶相關(guān)的信息元素的裝置,諸如 存儲器,包括例如訂戶身份模塊(SIM )320、可裝卸用戶身份模塊(R-UIM ) (未示出)等。除了 SIM之外,移動設(shè)備還可以包括其它存儲器。就此而 言,移動臺可以包括易失性存儲器322以及其它非易失性存儲器324,其 可以是嵌入式的和/或可以是可裝卸的。例如,其它非易失性存儲器可以是 嵌入式或可裝卸多媒體存儲卡(MMC )、安全數(shù)字(SD )存儲卡、存儲棒、 EEPROM、閃存、硬盤等。存儲器可以存儲由移動設(shè)備使用的任何多個信 息段或信息量和數(shù)據(jù),用于實現(xiàn)移動臺的功能。例如,存儲器可以存儲能 夠唯一地標(biāo)識移動i殳備的標(biāo)識符,諸如國際移動設(shè)備標(biāo)識(IMEI)代碼、 國際移動訂戶標(biāo)識(IMSI)代碼、移動設(shè)備綜合服務(wù)數(shù)字網(wǎng)(MSISDN) 代碼,等等。存儲器還可以存儲內(nèi)容。存儲器可以例如存儲用于應(yīng)用和其 它計算機程序的計算機程序代碼。例如,在本發(fā)明的一個實施例中,存儲
器可以存儲用于實現(xiàn)下面參照圖4所討論的改進(jìn)的中側(cè)立體聲編碼的步驟 的計算枳4呈序代碼。
主要結(jié)合移動通信應(yīng)用描述了本發(fā)明示例性實施例的方法、系統(tǒng)、裝 置和計算;fcO^呈序產(chǎn)品。然而,應(yīng)當(dāng)理解,可以結(jié)合移動通信行業(yè)中的以及
移動通信行業(yè)外的各種其它應(yīng)用來利用本發(fā)明實施例的方法、系統(tǒng)、裝置 和計算機程序產(chǎn)品。例如,可以結(jié)合有線和/或無線網(wǎng)絡(luò)(例如,因特網(wǎng))
應(yīng)用來利用本發(fā)明示例性實施例的方法、系統(tǒng)、裝置和計算機程序產(chǎn)品。中側(cè)立體聲編碼的方法
現(xiàn)在參照圖4,現(xiàn)將描述依照本發(fā)明的示例性實施例實現(xiàn)M/S立體聲 編碼的方法。如圖所示,過程開始于操作401,其中,左和右時域輸入信 號丄,和及,由編碼器102接收。在操作402中,所接收到的信號丄,和凡可 以(例如,通過左和右時間-頻率映射器201L和201R)才艮據(jù)等式1 ^f皮分別 轉(zhuǎn)換成頻域信號々和及/ :
々=f aj ;以及 等式1
其中f (^表示時間到頻率的變換。
接下來,在操作403,例如通過變換和選擇處理元件203,可以根據(jù)以 下等式生成中央和側(cè)頻域信號iW^和&:
Af,- 及yj/2;以及 等式2
根據(jù)一個示例性實施例,具有長度Af的s力k j!5^,表示為其實現(xiàn)了 M/S 立體聲編碼的頻帶的邊界。理想地,該長度也符合人類可聽系統(tǒng)的臨界帶 的邊界。
在操作404中,丄,及,3f,和&的掩蔽門限^r。 ^r及、幼,m和,/b^ 可以基于心理聲學(xué)模型(如由門限生成處理元件202所表示的)分別從頻 鐠輸入信號導(dǎo)出。如上所述,本領(lǐng)域技術(shù)人員已知該模型的細(xì)節(jié)和實施方 式。在一個示例性實施例中,可以為左、右、中央和/或側(cè)信號導(dǎo)出普通掩 蔽門限。可選地,掩蔽門限對每個信號或信號的任何組合可以不同。
根據(jù)常規(guī)M/S立體聲編碼系統(tǒng),下一步驟將是基于給定信號的感知熵 (即,基于當(dāng)前幀為了實現(xiàn)零感知失真所需的最小比特數(shù)的估計),在L/R 輸入信號與M/S輸入信號之間進(jìn)行選擇。然而,在低比特率,選擇和后續(xù) 量化由于用于對和(即,量化信號)進(jìn)行編碼的低數(shù)目的可用比特 而造成未能有效執(zhí)行。因而,根據(jù)本發(fā)明的示例性實施例,為了在所有比 特率處顯著改進(jìn)立體聲質(zhì)量,當(dāng)在L/R信號與M/S信號之間進(jìn)行選擇之前, 可以基于在左和右所接收到的輸入信號之間的能量差,例如通過變換和選擇處理元件203,對所導(dǎo)出的掩蔽門限進(jìn)行修改(操作405)。 特別地,令五i和&分別表示左和右輸入聲道的幀能量。
AM
A=2>/(y)2 等式3
乂=0 乂=0
其中乂表示標(biāo)度因子帶(scalefactorband)的索引。
然后,可以根據(jù)以下來修改輸入掩蔽門限中的一個
如果,scale >2,則等式6;
等式4
否則,什么也不禍
其中,
sc"/e = 0.7 /7rev^^/e+ (M^LY (五i, £^ ) /^f/iV (五o五及)).0.3 等式5 其中,/7m^cfl/e在啟動時被初始化為零,并JL^示先前幀的標(biāo)度值,并且 其中MM和AT/iV分別表示指定參數(shù)的最大值和最小值。 此外,
如果五i >五&則A; 等式6a 否則,B
其中,
爿.'幼r及(/)=幼,及(/) . //r/^oi/e, 等式6b
凡'=幼^(Z). ^rSca/e, 0 S / < M 其中/表示頻鐠槽(bin )的索引,M表示V&Q^"的長度或頻帶的邊界(如 以上所指示的),并且
^Wc"/e = M77V(20, sc"/e) 等式6c
換句話說,比較了左和右輸入聲道的能量。如果在兩個能量之間的比 值大于給定門限值,則按比例調(diào)整具有兩個能量中較小值的聲道的掩蔽門 限。特別地,如可以看到的,根據(jù)一個示例性實施例,三分貝能量差可以 觸發(fā)對掩蔽門限中的一個的修改,以便實現(xiàn)對于是否應(yīng)當(dāng)為i普帶激活M/S (即,是否應(yīng)當(dāng)使用M/S信號而不是L/R信號)的更好的判定。返回圖4,在操作406中,最后進(jìn)行了關(guān)于是否用M/S信號替換L/R 信號的確定。如以上簡述的,基于各種信號的感知熵(PE)來進(jìn)行該確定。 感知熵的計算使用所導(dǎo)出的掩蔽門限(其可能已經(jīng)在或可能并未在以上操 作404中被修改)。特別地,可以如下為每個頻i普槽計算所需的比特數(shù)的估 計(即,PE):
尸五(義,r,/,,A:卜log2
6.r,
等式7
"乂
其中,如上所述,/和y分別是頻i普槽和標(biāo)度因子帶的索引,T)表示帶7中 的掩蔽門限,A是帶y的寬度,并且《是帶/中的頻if^L。
然后選擇給出了最小比特計數(shù)的信號配置來用于量化(例如通過量化
器204)。該選擇是在譜帶的基礎(chǔ)上完成的,并且向每個譜帶分派一個信令
比特,其由接收端用來檢測是否發(fā)送了中央和側(cè)信號而不是左和右聲道信
號。然后,可以最務(wù)使用該信息,以便將M/S信號轉(zhuǎn)換回到L/R聲道信號。 該選擇可以如下進(jìn)行
MSF/一:H ,:'尸、:&", o^<M 等式8
其中
凡ew—1
尸五^ = Z i^(M/,^w,y,/,/Le")+ Z /^(&,^^,"^:e") 等式9
)=0 y=o
尸^ = S ^—,^^"',"^6")+ Z尸五(i ,,^^,力',凡e")
其中,/Le"表示第/個頻帶的長度,并且可以基于以下等式來計算
/Le" = ^/Z)0#e"/ +1) — sy&Q^"(z') 等式10
于是,將要量化的信號是
一丄,C^O,(0,…,^聯(lián)《+1)), MSH喂(O == '0'
2"=
M,0,,(a…,W爭W +1)),
其它
等式ll
2
/2
i , ( (/),…,^&O,"0' +1)), MSF一(O == '0'
.." +1)),
其它等式11對于0&、M是重復(fù)的。
換句話說,對于每個鐠帶,為左和右輸入信號以及中央和側(cè)信號的組 合計算感知熵。在中央和側(cè)信號的感知熵小于左和右信號的感知熵的情況 下(即,在為了實現(xiàn)零感知失真,中央和側(cè)信號的當(dāng)前幀所需要的最小比 特數(shù)少于左和右信號的當(dāng)前幀所需要的最小比特數(shù)的情況下),那么選擇中 央和側(cè)信號用于量化。這對于每個鐠帶是重復(fù)的。要注意,感知熵是關(guān)于 在操作404中導(dǎo)出的(并且在某些情況下,在操作405中被修改的)掩蔽 門限的函數(shù)。
在選擇了用于量化的信號之后,在操作407中,根據(jù)一個示例性實施 例,可以再次修改掩蔽門限,以便在用于量化器的可用比特數(shù)與期望比特 率之間創(chuàng)建更好的匹配。特別地,可以如下進(jìn)行該修改<formula>formula see original document page 21</formula>
換句話說,如果每樣本的比特數(shù)小于1.5,那么可以再次比較左和右輸 入信號的能量級別。在左信號的能量更大的情況下,那么可以基于標(biāo)度因 子來修改右或側(cè)信號的掩蔽門限(無論在以上的操作406中選擇了哪個)。 在右信號的能量更大的情況下,則可以修改左或中央信號的掩蔽門限。另 一方面,如果每樣本的比特數(shù)不小于1.5(即,等于或大于1.5),那么可以 不對掩蔽門限進(jìn)行修改。這對于輸入信號的每個鐠帶都是重復(fù)的。
最后,在操作408中,可以由量化器204來量化所選擇的信號,以便 滿足要求的比特率,并且在操作409中,所量化的信號由比特流多路復(fù)用 器205轉(zhuǎn)換成比特流。
結(jié)論基于以上描述,本發(fā)明的示例性實施例可以改進(jìn)在低比特率情況下的 立體聲圖像重構(gòu)。當(dāng)空間圖像在左和右輸入信號之間不均勻分布時,該改 進(jìn)尤其清楚。使用本發(fā)明的示例性實施例,可以減少在聲道之間的串音, 從而改進(jìn)整個空間圖像質(zhì)量。另外,根據(jù)示例性實施例,當(dāng)立體聲內(nèi)容在 左和右聲道之間均勻分布時,信號的質(zhì)量能夠被保持,使得相比于常規(guī)解 決方案來說不存在性能損失。
如上所述并且如本領(lǐng)域技術(shù)人員將理解的,本發(fā)明的實施例可以被配 置為方法、系統(tǒng)或裝置。因此,本發(fā)明的實施例可以由包括全硬件、全軟 件或者軟件和硬件的任何組合在內(nèi)的各種裝置組成。此外,本發(fā)明的實施 例可以采取在使得計算機可讀程序指令體現(xiàn)在存儲介質(zhì)中的計算機可讀存 儲介質(zhì)上的計算機程序產(chǎn)品的形式(例如,計算機軟件)??梢岳萌魏芜m
當(dāng)?shù)挠嬎銠C可讀存儲介質(zhì),包括硬盤、CD-ROM、光存^i殳備或磁存^i殳 備。
已經(jīng)參照方法、裝置(即,系統(tǒng))和計算機程序產(chǎn)品的框圖和流程圖 說明描述了本發(fā)明的示例性實施例??梢岳斫?,框圖和流程圖說明的每個 框以及在框圖和流程圖說明中的框塊的組合可以分別通過包括計算機程序 指令的各種裝置來實現(xiàn)。這些計算機程序指令可以被加載到通用計算機、 專用計算機或其它可編程數(shù)據(jù)處理裝置上以產(chǎn)生機器,從而使得在計算機 或其它可編程數(shù)據(jù)處理裝置上執(zhí)行的指令創(chuàng)建用于實現(xiàn)在一個或多個流程
框中所指定的功能的裝置。
這些計算機程序指令還可以存儲在計算機可讀存儲器中,該計算機可
讀存儲器可以引導(dǎo)計算機或其它可編程數(shù)據(jù)處理裝置以特定方式起作用, 從而使得存儲在計算機可讀存儲器中的指令產(chǎn)生包括用于實現(xiàn)在一個或多 個流程框所指定的功能的計算機可讀指令在內(nèi)的制品。計算機程序指令還 可以被加載到計算機或其它可編程數(shù)據(jù)處理裝置上,以便使一系列操作步 驟在計算機或其它可編程裝置上實現(xiàn)來產(chǎn)生計算機實現(xiàn)的過程,從而使得 在計算機或其它可編程裝置上執(zhí)行的指令提供用于實現(xiàn)在一個或多個流程 框中所指定的功能的步驟。因此,框圖和流程圖說明的框塊支持用于實現(xiàn)指定功能的裝置組合、 用于實現(xiàn)指定功能的步驟組合,以及用于實現(xiàn)指定功能的程序指令裝置。 還可以理解,框圖和流程圖說明中的每個框以及在框圖和流程圖說明中的 框塊的組合可以通過基于專用硬件的計算機系統(tǒng)(其實現(xiàn)指定功能或步驟) 或者專用硬件和計算機指令的組合來實現(xiàn)。
受益于在前述描述和相關(guān)附圖中所提供的教導(dǎo),本發(fā)明的這些示例性 實施例所屬領(lǐng)域的技術(shù)人員將想到在此闡述的本發(fā)明的很多修改和其它實 施例。因此,應(yīng)當(dāng)理解,本發(fā)明的實施例不限于所公開的具體實施例,并 且修改和其它實施例也將包括在所附權(quán)利要求的范圍之內(nèi)。盡管在此采用 了特定術(shù)語,然而它們僅是在一般性和描述性的意義上使用,而不用于限 制性目的。
權(quán)利要求
1. 一種立體聲編碼方法,所述方法包括接收左和右輸入信號;導(dǎo)出與相應(yīng)的左和右輸入信號相關(guān)聯(lián)的左和右掩蔽門限;以及至少部分基于在與相應(yīng)的左和右輸入信號相關(guān)聯(lián)的能量之間的關(guān)系,修改左或右掩蔽門限中的至少一個。
2. 根據(jù)權(quán)利要求l所述的方法,其進(jìn)一步包括確定與相應(yīng)的左和右輸入信號相關(guān)聯(lián)的能量,其中與左或右輸入信號 中的一個相關(guān)聯(lián)的能量包括最大能量,并且與左或右輸入信號中的另 一個 相關(guān)聯(lián)的能量包括最小能量;至少部分基于最大能量與最小能量的比值來確定標(biāo)度值;將所述標(biāo)度值與預(yù)定門限相比較;以及如果所述標(biāo)度值超過了所述預(yù)定門限,則修改與包括最小能量的輸入 信號相關(guān)聯(lián)的掩蔽門限。
3. 根據(jù)權(quán)利要求2所述的方法,其中修改所述掩蔽門限包括將所導(dǎo) 出的掩蔽門限乘以門限標(biāo)度,所述門限標(biāo)度與預(yù)定值或所確定的標(biāo)度值中 的較小值相等。
4. 根據(jù)權(quán)利要求l、 2或3所述的方法,其進(jìn)一步包括 至少部分基于左和右輸入信號來確定中央和側(cè)信號;以及 至少部分基于左和右掩蔽門限,在左和右輸入信號與中央和側(cè)信號之間進(jìn)行選擇。
5. 根據(jù)權(quán)利要求4所述的方法,其中當(dāng)在左和右輸入信號與中央和側(cè) 信號之間進(jìn)行選擇之前,修改所述左或右掩蔽門限。
6. 根據(jù)權(quán)利要求4或5所述的方法,其中在左和右輸入信號與中央和 側(cè)信號之間進(jìn)行選擇包括確定與所述左和右輸入信號相關(guān)聯(lián)的第 一組合感知熵,所述第 一組合 感知熵至少部分基于所述左和右掩蔽門限;確定與所述中央和側(cè)信號相關(guān)聯(lián)的第二組合感知熵,所述第二組合感知熵至少部分基于中央和側(cè)掩蔽門限;以及將第一和第二組合感知熵進(jìn)行比較以確定哪個更低。
7. 根據(jù)權(quán)利要求4、 5或6所述的方法,其中確定中央信號包括對 左和右輸入信號進(jìn)行平均,并且其中確定側(cè)信號包括取左和右輸入信號 之間的差并且將所述差除以二。
8. 根據(jù)權(quán)利要求4、 5、 6或7所述的方法,其進(jìn)一步包括 在選擇了左和右輸入信號的情況下,進(jìn)一步修改左或右掩蔽門限中的至少一個;在選擇了中央和側(cè)信號的情況下,進(jìn)一步修改中央或側(cè)掩蔽門限中的至少一個;以及至少部分基于對應(yīng)的掩蔽門限來量化所選擇的信號。
9. 一種用于立體聲編碼的裝置,所述裝置包括 編碼器,其被配置以便接收左和右輸入信號;導(dǎo)出與相應(yīng)的左和右輸入信號相關(guān)聯(lián)的左和右掩蔽門限;以及 至少部分基于在與相應(yīng)的左和右輸入信號相關(guān)聯(lián)的能量之間的關(guān) 系,修改左或右掩蔽門限中的至少一個。
10. 根據(jù)權(quán)利要求9所述的裝置,其中所述編碼器被進(jìn)一步配置以便 確定與相應(yīng)的左和右輸入信號相關(guān)聯(lián)的能量,其中與左或右輸入信號中的一個相關(guān)聯(lián)的能量包括最大能量,并且與左或右輸入信號中的另 一個 相關(guān)聯(lián)的能量包括最小能量;至少部分基于最大能量與最小能量的比值來確定標(biāo)度值;將所述標(biāo)度值與預(yù)定門PM目比較;以及如果所述標(biāo)度值超過了所述預(yù)定門限,則修改與包括最小能量的輸入 信號相關(guān)聯(lián)的掩蔽門限。
11. 根據(jù)權(quán)利要求10所述的裝置,其中為了修改所述掩蔽門限,所 述編碼器被進(jìn)一步配置以便將所導(dǎo)出的掩蔽門限乘以門限標(biāo)度,所述門限標(biāo)度與預(yù)定值或所確定的標(biāo)度值中的較小值相等。
12. 根據(jù)權(quán)利要求9、 10或11所述的裝置,其中所述編碼器進(jìn)一步 包括變換和選擇處理元件,所述變換和選擇處理元件,皮配置以寸更至少部分基于左和右輸入信號來確定中央和側(cè)信號;以及 至少部分基于左和右掩蔽門限,在左和右輸入信號與中央和側(cè)信號之 間進(jìn)行選擇。
13. 根據(jù)權(quán)利要求12所述的裝置,其中所述編碼器被進(jìn)一步配置以 便當(dāng)在左和右輸入信號與中央和側(cè)信號之間進(jìn)行選擇之前,修改所述左 或右掩蔽門限。
14. 根據(jù)權(quán)利要求12或13所述的裝置,其中所述編碼器被進(jìn)一步配 置以便在選擇了左和右輸入信號的情況下,進(jìn)一步修改左或右掩蔽門限中的 至少一個;以及在選擇了中央和側(cè)信號的情況下,進(jìn)一步修改中央或側(cè)掩蔽門限中的 至少一個。
15. 根據(jù)權(quán)利要求14所述的裝置,其中所述編碼器進(jìn)一步包括 量化器,所述量化器被配置以便至少部分基于對應(yīng)的掩蔽門限來量化所選擇的信號。
16. —種被配置以便實現(xiàn)立體聲編碼的設(shè)備,所述設(shè)備包括 用于接收左和右輸入信號的裝置;用于導(dǎo)出與相應(yīng)的左和右輸入信號相關(guān)聯(lián)的左和右掩蔽門限的裝置;以及用于至少部分基于在與相應(yīng)的左和右輸入信號相關(guān)聯(lián)的能量之間的關(guān) 系來修改左或右掩蔽門限中的至少一個的裝置。
17. 根據(jù)權(quán)利要求16所述的設(shè)備,其進(jìn)一步包括用于確定與相應(yīng)的左和右輸入信號相關(guān)聯(lián)的能量的裝置,其中與左或 右輸入信號中的一個相關(guān)聯(lián)的能量包括最大能量,并且與左或右輸入信號 中的另 一個相關(guān)聯(lián)的能量包括最小能量;用于至少部分基于最大能量與最小能量的比值來確定標(biāo)度值的裝置;用于將所述標(biāo)度值與預(yù)定門FM目比較的裝置;以及 用于如果所述標(biāo)度值超過了所述預(yù)定門限,則修改與包括最小能量的 輸入信號相關(guān)聯(lián)的掩蔽門限的裝置。
18. 根據(jù)權(quán)利要求17所述的設(shè)備,其中用于修改所述掩蔽門限的裝 置包括用于將所導(dǎo)出的掩蔽門限乘以門限標(biāo)度的裝置,所述門限標(biāo)度與 預(yù)定值或所確定的標(biāo)度值中的較小值相等。
19. 根據(jù)權(quán)利要求16、 17或18所述的設(shè)備,其進(jìn)一步包括 用于至少部分基于左和右輸入信號來確定中央和側(cè)信號的裝置;以及 用于至少部分基于左和右掩蔽門限來在左和右輸入信號與中央和側(cè)信號之間進(jìn)行選擇的裝置。
20. 根據(jù)權(quán)利要求19所述的設(shè)備,其中用于修改左或右掩蔽門限的 裝置包括用于當(dāng)在左和右輸入信號與中央和側(cè)信號之間進(jìn)行選擇之前修 改所述左或右掩蔽門限的裝置。
21. 根據(jù)權(quán)利要求19或20所述的設(shè)備,其中用于在左和右輸入信號 與中央和側(cè)信號之間進(jìn)行選擇的裝置進(jìn)一步包括用于確定與所述左和右輸入信號相關(guān)聯(lián)的第 一組合感知熵的裝置,所 述第一組合感知熵至少部分基于所述左和右掩蔽門限;用于確定與中央和側(cè)信號相關(guān)聯(lián)的第二組合感知熵的裝置,所述第二 組合感知熵至少部分基于中央和側(cè)掩蔽門限;以及用于將第一和第二組合感知熵進(jìn)行比較以確定哪個更低的裝置。
22. 根據(jù)權(quán)利要求19、 20或21所述的設(shè)備,其進(jìn)一步包括用于在選擇了左和右輸入信號的情況下,進(jìn)一步^"改左或右掩蔽門限 中的至少一個的裝置;用于在選擇了中央和側(cè)信號的情況下,進(jìn)一步修改中央或側(cè)掩蔽門限 中的至少一個的裝置;以及用于至少部分基于對應(yīng)的掩蔽門限來量化所選擇的信號的裝置。
23. —種用于立體聲編碼的計算機程序產(chǎn)品,其中所述計算機程序產(chǎn)品包括存儲了計算機可讀程序代碼部分的至少 一個計算機可讀存儲介質(zhì),所述計算機可讀程序代碼部分包括第一可執(zhí)行部分,用于接收左和右輸入信號;第二可執(zhí)行部分,用于導(dǎo)出與相應(yīng)的左和右輸入信號相關(guān)聯(lián)的左和右 掩蔽門限;以及第三可執(zhí)行部分,用于至少部分基于在與相應(yīng)的左和右輸入信號相關(guān) 聯(lián)的能量之間的關(guān)系,修改左或右掩蔽門限中的至少 一個。
24. 根據(jù)權(quán)利要求23所述的計算機程序產(chǎn)品,其進(jìn)一步包括 第四可執(zhí)行部分,用于確定與相應(yīng)的左和右輸入信號相關(guān)聯(lián)的能量,其中與左或右輸入信號中的一個相關(guān)聯(lián)的能量包括最大能量,并且與左或 右輸入信號中的另 一個相關(guān)聯(lián)的能量包括最小能量;第五可執(zhí)4于部分,用于至少部分基于最大能量與最小能量的比值來確 定標(biāo)度值;第六可執(zhí)行部分,用于將所述標(biāo)度值與預(yù)定門卩M目比較;以及 第七可執(zhí)行部分,用于如果所述標(biāo)度值超過了所述預(yù)定門限,則修改 與包括最小能量的輸入信號相關(guān)聯(lián)的掩蔽門限。
25. 根據(jù)權(quán)利要求24所述的計算機程序產(chǎn)品,其中所述第三可執(zhí)行 部分被配置以便將所導(dǎo)出的掩蔽門限乘以門限標(biāo)度,所述門限標(biāo)度與預(yù)定 值或所確定的標(biāo)度值中的較小值相等。
26. 根據(jù)權(quán)利要求23、 24或25所述的計算機程序產(chǎn)品,其進(jìn)一步包括第四可執(zhí)行部分,用于至少部分基于左和右輸入信號來確定中央和側(cè) 信號;以及第五可執(zhí)行部分,用于至少部分基于左和右掩蔽門限來在左和右輸入 信號與中央和側(cè)信號之間進(jìn)行選擇。
27. 根據(jù)權(quán)利要求26所述的計算機程序產(chǎn)品,其中所述第三可執(zhí)行 部分被配置以便當(dāng)所述第五可執(zhí)行部分在左和右輸入信號與中央和側(cè)信 號之間進(jìn)行選擇之前,修改所述左或右掩蔽門限。
28. 根據(jù)權(quán)利要求26或27所述的計算機程序產(chǎn)品,其中所述第五可 執(zhí)行部分^皮配置以便確定與所述左和右輸入信號相關(guān)聯(lián)的第 一組合感知熵,所述第 一組合 感知熵至少部分基于所述左和右掩蔽門限;確定與所述中夾和側(cè)信號相關(guān)聯(lián)的第二組合感知熵,所述第二組合感 知熵至少部分基于中央和側(cè)掩蔽門限;以及將第一和第二組合感知熵進(jìn)行比較以確定哪個更低。
29. 根據(jù)權(quán)利要求26、 27或28所述的計算機程序產(chǎn)品,其進(jìn)一步包括第六可執(zhí)行部分,用于在選擇了左和右輸入信號的情況下,進(jìn)一步修 改左或右掩蔽門限中的至少一個;第七可執(zhí)行部分,用于在選擇了中央和側(cè)信號的情況下,進(jìn)一步修改 中央或側(cè)掩蔽門限中的至少一個;以及第八可執(zhí)行部分,用于至少部分基于對應(yīng)的掩蔽門限來量化所選擇的 信號。
全文摘要
提供了一種方法、系統(tǒng)、裝置和計算機程序產(chǎn)品用于改進(jìn)的立體聲編碼。特別地,所述方法、系統(tǒng)、裝置和計算機程序產(chǎn)品提供了用于實現(xiàn)中側(cè)(M/S)立體聲編碼的技術(shù),其中附加步驟被添加到編碼過程,由此,當(dāng)在信號對之間進(jìn)行選擇之前,修改在對于何時將使用中央和側(cè)信號而不是左和右輸入信號所進(jìn)行的確定中使用的參數(shù)。特別地,與左或右輸入信號相關(guān)聯(lián)的掩蔽門限可以基于在這兩個輸入信號的能量之間的關(guān)系來修改。另外,一旦已經(jīng)進(jìn)行了在信號對之間的選擇,便可以再次基于在左和右輸入信號的能量之間的關(guān)系,進(jìn)一步修改所選擇的信號的掩蔽門限。
文檔編號G10L19/00GK101548315SQ200780043393
公開日2009年9月30日 申請日期2007年11月7日 優(yōu)先權(quán)日2006年11月30日
發(fā)明者J·奧揚佩雷 申請人:諾基亞公司