專利名稱:用于通信終端中三維立體聲再現(xiàn)的設(shè)備和方法
技術(shù)領(lǐng)域:
本發(fā)明涉及移動(dòng)通信終端。本發(fā)明尤其涉及一種能夠在移動(dòng)通信終端中再現(xiàn)具有三維立體聲效果的聲音數(shù)據(jù)的設(shè)備和方法。
背景技術(shù):
諸如蜂窩電話和PCS(個(gè)人通信服務(wù))電話之類的手持電話是一種典型的通信終端,它通過(guò)揚(yáng)聲器向外部傳送聲音或警示音,以便于用戶在使用手持電話時(shí)能夠識(shí)別呼入呼叫。隨著通信和聲音處理技術(shù)以及用戶需求的發(fā)展,人們正積極地進(jìn)行各種各樣的研究,以在小型通信終端中再現(xiàn)更豐富的聲音。另外,互聯(lián)網(wǎng)使用的快速普及使通過(guò)互聯(lián)網(wǎng)將各種各樣的原始樂(lè)曲聲音以及電影下載到通信終端成為可能,因此對(duì)于在通信終端中再現(xiàn)原始樂(lè)曲聲音的用戶需求變得越來(lái)越強(qiáng)烈。
現(xiàn)在,多數(shù)再現(xiàn)4和弦(poly)聲音或更多和弦聲音的通信終端采用雅馬哈聲音芯片來(lái)再現(xiàn)樂(lè)曲聲音數(shù)據(jù)。雅馬哈聲音芯片被分類為4和弦,16和弦,40和弦,和64和弦。術(shù)語(yǔ)“和弦”用來(lái)按照能夠再現(xiàn)的弦的數(shù)目來(lái)區(qū)別聲音芯片。一般來(lái)說(shuō),和相關(guān)的“和弦”數(shù)目一樣多的不同樂(lè)器的聲音能被同步表現(xiàn)。因此,隨著“和弦”的數(shù)目的增加,就越能表現(xiàn)更逼真的聲音。
近來(lái),除了再現(xiàn)簡(jiǎn)單的蜂鳴聲之外,人們已經(jīng)進(jìn)行各種各樣的嘗試、以通過(guò)在移動(dòng)終端配備兩個(gè)或更多個(gè)揚(yáng)聲器來(lái)提供三維立體聲效果。術(shù)語(yǔ)“立體聲”的意思是其中加入了空間信息的、使收聽(tīng)者在聽(tīng)到聲音后能夠感知聲音的方向和距離的聲音信號(hào)。近來(lái),三維立體聲音效果還被應(yīng)用到移動(dòng)通信領(lǐng)域,這導(dǎo)致了對(duì)聲音記錄和再現(xiàn)技術(shù)不斷增長(zhǎng)的需求以便提供更高的真實(shí)性,該真實(shí)性通過(guò)增加的空間信息和移動(dòng)信息來(lái)提供,因此真實(shí)再現(xiàn)三維立體聲成為了必需。
典型的立體聲再現(xiàn)在電影影片、電視、音響和家庭影院領(lǐng)域主要通過(guò)多信道,如5.1信道來(lái)提供。近來(lái),已經(jīng)在開(kāi)發(fā)可以提供三維立體聲效果的便攜電話或個(gè)人數(shù)字助理(PDA)電話方面做了各種各樣的嘗試。例如,一種建議的方法是預(yù)先在存儲(chǔ)器中存儲(chǔ)聲音數(shù)據(jù),該數(shù)據(jù)包含有關(guān)三維立體聲效果的信息;并且再現(xiàn)該存儲(chǔ)的三維立體聲效果和聲音數(shù)據(jù),這為使用配備有兩個(gè)或更多個(gè)揚(yáng)聲器的終端的用戶提供了三維立體聲效果。
圖1為描述典型移動(dòng)通信終端中聲音信號(hào)再現(xiàn)設(shè)備的方框圖。
控制器10執(zhí)行移動(dòng)通信終端的整個(gè)控制操作。射頻(RF)信號(hào)處理單元12下變換頻帶信號(hào),該信號(hào)通過(guò)預(yù)定頻帶的無(wú)線信道經(jīng)由天線從網(wǎng)絡(luò)中接收,并在控制器10的控制下,按照數(shù)據(jù)的類型傳送該接收信號(hào)到控制器10或語(yǔ)音編譯碼單元14。
從RF信號(hào)處理單元12傳送到控制器10的數(shù)據(jù)包括通過(guò)業(yè)務(wù)信道接收的數(shù)據(jù)、通過(guò)控制信道接收的尋呼信號(hào)、信令信號(hào)等等。從RF信號(hào)處理單元12傳送到語(yǔ)音編譯碼單元14的數(shù)據(jù)包括在語(yǔ)音呼叫已建立時(shí)接收到的語(yǔ)音數(shù)據(jù)。另外,RF信號(hào)處理單元12把從控制器10中接收到的數(shù)據(jù)和從語(yǔ)音編譯碼單元14中接收到的編碼語(yǔ)音數(shù)據(jù)上變換成預(yù)定頻帶的無(wú)線信號(hào),并將該無(wú)線信號(hào)通過(guò)天線傳送到網(wǎng)絡(luò)。
語(yǔ)音編譯碼單元14一般包括聲碼器(vocoder)并在控制器10的控制下進(jìn)行操作。語(yǔ)音編譯碼單元14對(duì)來(lái)自麥克風(fēng)16的電語(yǔ)音信號(hào)進(jìn)行編碼并將該編碼的語(yǔ)音信號(hào)傳送到RF信號(hào)處理單元12。另外,語(yǔ)音編譯碼單元14對(duì)從RF信號(hào)處理單元12中接收到的編碼語(yǔ)音數(shù)據(jù)解碼,以便將編碼語(yǔ)音數(shù)據(jù)轉(zhuǎn)換成電語(yǔ)音信號(hào),然后將該電語(yǔ)音信號(hào)輸出到揚(yáng)聲器20。揚(yáng)聲器20將該接收到的電語(yǔ)音信號(hào)轉(zhuǎn)換成可聽(tīng)聲音并將該可聽(tīng)聲音輸出。
顯示單元24包括采用字母或/和圖標(biāo)來(lái)顯示進(jìn)程狀態(tài)的顯示設(shè)備,例如液晶顯示器(LCD);振動(dòng)馬達(dá);和警示信號(hào)燈。顯示單元24的液晶顯示器顯示移動(dòng)通信終端的當(dāng)前狀態(tài)。另外,當(dāng)用戶執(zhí)行鍵輸入時(shí),液晶顯示器用于將輸入數(shù)據(jù)轉(zhuǎn)換成字母、圖標(biāo)或字符,并顯示這些字母、圖標(biāo)或字符。
鍵盤輸入單元26一般具有鍵矩陣結(jié)構(gòu)并包括用于撥號(hào)的數(shù)字鍵、用于執(zhí)行各種功能的功能鍵、選擇鍵、用于向上、下、左、右方向移動(dòng)的方向鍵。該鍵盤輸入單元26生成和用戶操作的鍵相關(guān)的鍵數(shù)據(jù),并將該生成的鍵數(shù)據(jù)輸出到控制器10。
存儲(chǔ)單元22可以包含ROM(只讀存儲(chǔ)器)和RAM(隨機(jī)存取存儲(chǔ)器),并被分成用于存儲(chǔ)控制控制器10所需的程序代碼的區(qū)域、用于存儲(chǔ)用戶輸入數(shù)據(jù)的區(qū)域、和用于臨時(shí)存儲(chǔ)在控制操作過(guò)程中產(chǎn)生的數(shù)據(jù)的區(qū)域。另外,存儲(chǔ)單元22包括能被用來(lái)通知用戶收到呼入呼叫或產(chǎn)生告警音的聲音數(shù)據(jù)。該聲音數(shù)據(jù)可以由廠商預(yù)先存儲(chǔ)或從供應(yīng)商服務(wù)器(運(yùn)營(yíng)商服務(wù)器)28下載,該服務(wù)器可以通過(guò)無(wú)線電、USB(通用串行總線)端口、IEEE 1394端口、紅外線端口等等和移動(dòng)通信終端相接。一般來(lái)說(shuō),聲音數(shù)據(jù)以合成音樂(lè)移動(dòng)應(yīng)用格式(‘SMAF’)存儲(chǔ),該格式在作為文件存儲(chǔ)時(shí)具有‘.mmf’的擴(kuò)展名,以由雅馬哈聲音芯片18處理。
雅馬哈聲音芯片18將控制器10從存儲(chǔ)單元22讀出的聲音數(shù)據(jù)轉(zhuǎn)換成電信號(hào),并輸出該轉(zhuǎn)換的電信號(hào)到揚(yáng)聲器20。揚(yáng)聲器20包括兩個(gè)或更多揚(yáng)聲器設(shè)備以便于支持三維立體聲效果。
如上所述,傳統(tǒng)的移動(dòng)通信終端采用雅馬哈聲音芯片18再現(xiàn)聲音數(shù)據(jù)如樂(lè)曲聲音等等。因此存儲(chǔ)單元22必須以SMAF的形式存儲(chǔ)三維立體聲數(shù)據(jù)。另外,供應(yīng)商服務(wù)器28不實(shí)時(shí)處理聲音數(shù)據(jù),而是將通過(guò)三維再現(xiàn)運(yùn)算法則得到的三維立體聲音效果轉(zhuǎn)換成SMAF,然后將該轉(zhuǎn)換的數(shù)據(jù)下載到存儲(chǔ)單元22。
然而,當(dāng)具有三維立體聲效果的聲音數(shù)據(jù)被轉(zhuǎn)換成SMAF時(shí),三維立體聲效果的相當(dāng)大的部分被刪除并且數(shù)據(jù)量會(huì)變得很大,因此很難真正地將三維立體聲效果應(yīng)用到移動(dòng)通信終端。
現(xiàn)在,當(dāng)通過(guò)采用一個(gè)揚(yáng)聲器輸出聲音信息的方案獲得的單聲道樂(lè)曲聲音,和通過(guò)采用兩個(gè)揚(yáng)聲器輸出二維聲音的方案獲得的立體聲樂(lè)曲聲音,都使用30K字節(jié)或更少的字節(jié)時(shí),具有三維立體聲效果的聲音數(shù)據(jù)在大小上比傳統(tǒng)的樂(lè)曲聲音數(shù)據(jù)大10倍。當(dāng)采用由雅馬哈聲音芯片提供的合成聲音表將具有上述巨大尺寸的三維立體聲音數(shù)據(jù)近似為SMAF時(shí),雖然聲音數(shù)據(jù)的大小稍微縮小,但是原始聲音數(shù)據(jù)的三維立體聲效果會(huì)明顯惡化。
也就是說(shuō),因?yàn)檠篷R哈聲音芯片不能完整支持三維立體聲效果,并且通過(guò)芯片所具有的合成聲音表和音調(diào)來(lái)近似地估算原始聲音數(shù)據(jù),所以產(chǎn)生了誤差,從而傳統(tǒng)的設(shè)備在準(zhǔn)確再現(xiàn)原始聲音數(shù)據(jù)方面具有局限性。另外,因?yàn)檠篷R哈聲音芯片在同步再現(xiàn)語(yǔ)音和音樂(lè)聲音時(shí)會(huì)導(dǎo)致特定聲音的失真,因此當(dāng)構(gòu)成樂(lè)曲聲音時(shí),僅包括語(yǔ)音的第一聲音數(shù)據(jù)和僅包括樂(lè)曲的第二聲音數(shù)據(jù)必須單獨(dú)存儲(chǔ),由此需要一個(gè)非常大的存儲(chǔ)容量。
發(fā)明內(nèi)容
相應(yīng)地,本發(fā)明用來(lái)解決上述發(fā)生在現(xiàn)有技術(shù)中的問(wèn)題以及提供其它的優(yōu)點(diǎn),本發(fā)明的一個(gè)目的是在移動(dòng)通信終端中提供一種用于再現(xiàn)具有三維立體聲效果的聲音的設(shè)備和方法。
本發(fā)明的另一個(gè)目的是在移動(dòng)通信終端中提供在具有最小尺寸的設(shè)備中存儲(chǔ)具有三維立體聲效果的聲音數(shù)據(jù)的設(shè)備和方法。
本發(fā)明的再一個(gè)目的是提供用于存儲(chǔ)具有MP3格式或AAC格式的三維立體聲效果的聲音數(shù)據(jù)以及再現(xiàn)所存儲(chǔ)的聲音數(shù)據(jù)的設(shè)備和方法。
為了實(shí)現(xiàn)這個(gè)目的,依照本發(fā)明的一方面,為移動(dòng)通信終端提供一種三維立體聲再現(xiàn)設(shè)備,該三維立體聲再現(xiàn)設(shè)備包括用于存儲(chǔ)具有三維立體聲效果的聲音數(shù)據(jù)的存儲(chǔ)器;用于當(dāng)生成呼入呼叫或用戶請(qǐng)求聲音數(shù)據(jù)的再現(xiàn)時(shí),從存儲(chǔ)器中讀出聲音數(shù)據(jù)以及用于解碼該聲音數(shù)據(jù)而不會(huì)造成三維立體聲效果的失真,由此以模擬信號(hào)的形式將該聲音數(shù)據(jù)輸出的聲音處理單元;以及用于放大該模擬信號(hào)和以可聽(tīng)聲音的形式輸出該放大的模擬信號(hào)的揚(yáng)聲器。
依照本發(fā)明的另一方面,提供了一種在移動(dòng)通信終端中用于再現(xiàn)具有三維立體聲效果的聲音數(shù)據(jù)的方法,該方法包括如下步驟在通信終端的存儲(chǔ)器中存儲(chǔ)具有三維立體聲效果的聲音數(shù)據(jù);當(dāng)生成呼入呼叫或用戶請(qǐng)求聲音數(shù)據(jù)的再現(xiàn)時(shí),從存儲(chǔ)器中讀出該聲音數(shù)據(jù)并對(duì)該聲音數(shù)據(jù)進(jìn)行解碼而不會(huì)造成三維立體聲效果的失真;和將該解碼的數(shù)據(jù)轉(zhuǎn)換成模擬信號(hào)并以可聽(tīng)聲音的形式將該模擬信號(hào)輸出。
下面結(jié)合附圖對(duì)本發(fā)明進(jìn)行詳細(xì)描述,這使得本發(fā)明的上述和其它目的、特點(diǎn)和優(yōu)點(diǎn)將變得更加明顯,其中圖1為描述典型移動(dòng)通信終端中聲音信號(hào)再現(xiàn)設(shè)備的方框圖;圖2為描述按照本發(fā)明優(yōu)選實(shí)施例的移動(dòng)通信終端的聲音信號(hào)再現(xiàn)設(shè)備的方框圖;圖3為描述按照本發(fā)明的實(shí)施例在移動(dòng)通信終端中聲音信號(hào)再現(xiàn)操作的流程圖。
具體實(shí)施例方式
在下文中,將參考附圖對(duì)按照本發(fā)明用于通信終端中再現(xiàn)三維立體聲的設(shè)備和方法的優(yōu)選實(shí)施例進(jìn)行描述。在下面對(duì)本發(fā)明的描述中,與此相關(guān)的已知功能和結(jié)構(gòu)將不再進(jìn)行詳細(xì)的描述,以免混淆本發(fā)明的主題。
提出本發(fā)明以在移動(dòng)通信終端中存儲(chǔ)和再現(xiàn)聲音數(shù)據(jù),該聲音數(shù)據(jù)具有采用運(yùn)動(dòng)圖象專家組-1音頻層3MPEG-1層3(MP3)或MPEG-2高級(jí)音頻編碼(MPEG-2 AAC,在下文中稱為‘ACC’)的三維立體聲效果。
即,依照本發(fā)明的設(shè)備和方法,在其中包括MP3解碼器或AAC解碼器的通信終端,例如手持機(jī)或PDA手機(jī),生成MP3格式或AAC格式的聲音數(shù)據(jù),并在通信終端中存儲(chǔ)所生成的聲音數(shù)據(jù),并利用MP3解碼器或AAC解碼器來(lái)再現(xiàn)該存儲(chǔ)的聲音數(shù)據(jù),以此來(lái)提高當(dāng)再現(xiàn)三維立體聲時(shí)的通信終端性能和存儲(chǔ)效率。
圖2為描述依照本發(fā)明優(yōu)選實(shí)施例的移動(dòng)通信終端的聲音信號(hào)再現(xiàn)設(shè)備的方框圖。
控制器30包括用于執(zhí)行移動(dòng)通信終端整個(gè)控制進(jìn)程的調(diào)制解調(diào)器芯片。RF(射頻)信號(hào)處理單元32下變換從網(wǎng)絡(luò)通過(guò)預(yù)定頻帶的無(wú)線信道經(jīng)由天線接收的頻帶,并按照數(shù)據(jù)類型,在控制器30的控制下,將該接收到的信號(hào)傳送到控制器30或語(yǔ)音編譯碼單元34。
從RF信號(hào)處理單元32傳送到控制器30的數(shù)據(jù)包括通過(guò)業(yè)務(wù)信道接收到的數(shù)據(jù),通過(guò)控制信道接收的尋呼信號(hào),信令信號(hào)等等。從RF信號(hào)處理單元32傳送到語(yǔ)音編譯碼單元34的數(shù)據(jù)包括當(dāng)語(yǔ)音呼叫已建立時(shí)接收到的語(yǔ)音數(shù)據(jù)。另外,RF信號(hào)處理單元32還將從控制器30中接收到的數(shù)據(jù)和從語(yǔ)音編譯碼單元34中接收到的編碼語(yǔ)音數(shù)據(jù)上變換成預(yù)定頻帶的無(wú)線信號(hào),并通過(guò)天線發(fā)送該無(wú)線信號(hào)到網(wǎng)絡(luò)。
語(yǔ)音編譯碼單元34一般包括聲碼器并按照控制器30的控制來(lái)運(yùn)作。語(yǔ)音編譯碼單元34對(duì)來(lái)自麥克風(fēng)36的電語(yǔ)音信號(hào)進(jìn)行編碼并把該編碼的語(yǔ)音信號(hào)傳送到RF信號(hào)處理單元32。另外,語(yǔ)音編譯碼單元34還對(duì)通過(guò)控制器30接收的來(lái)自RF信號(hào)處理單元32的、編碼的語(yǔ)音數(shù)據(jù)進(jìn)行解碼,以便將該編碼的語(yǔ)音信號(hào)轉(zhuǎn)換成電語(yǔ)音信號(hào),然后將該電語(yǔ)音信號(hào)輸出到揚(yáng)聲器48。揚(yáng)聲器48將接收到的電語(yǔ)音信號(hào)轉(zhuǎn)換成可聽(tīng)聲音并將其輸出。
顯示單元58包括顯示器,如液晶顯示器(LCD),用于采用字母和/或圖標(biāo)來(lái)顯示進(jìn)程狀態(tài),以及振動(dòng)馬達(dá),和警示信號(hào)燈。顯示單元58的液晶顯示器顯示移動(dòng)通信終端的當(dāng)前狀態(tài)。液晶顯示器還用于將輸入數(shù)據(jù)轉(zhuǎn)換成字母、圖標(biāo)或字符,并顯示該字母、圖標(biāo)或字符。
鍵盤輸入單元60一般具有鍵矩陣結(jié)構(gòu)并包括用于撥號(hào)的數(shù)字鍵、用于輸入文本的鍵、用于執(zhí)行各種功能的功能鍵、選擇鍵、和用于向上、下、左、右方向移動(dòng)的方向鍵。鍵盤輸入單元60生成和用戶操作的鍵相應(yīng)的鍵數(shù)據(jù),并將該生成的鍵數(shù)據(jù)輸出到控制器30。
存儲(chǔ)單元50可以包含ROM(只讀存儲(chǔ)器)和RAM(隨機(jī)存取存儲(chǔ)器),并被分成用于存儲(chǔ)控制控制器30所需的程序代碼的區(qū)域、用于存儲(chǔ)用戶輸入的數(shù)據(jù)的區(qū)域、和用于臨時(shí)存儲(chǔ)在控制操作過(guò)程中產(chǎn)生的數(shù)據(jù)的區(qū)域。另外,存儲(chǔ)單元50還包括聲音數(shù)據(jù)52,54,和56,其可以被用來(lái)通知用戶接收呼入呼叫或產(chǎn)生告警(警報(bào))音。
聲音數(shù)據(jù)52,54和56可以由廠商預(yù)先存儲(chǔ)或從供應(yīng)商服務(wù)器(運(yùn)營(yíng)商服務(wù)器)62下載,該服務(wù)器可以通過(guò)無(wú)線電、通用串行總線(USB)端口、IEEE 1394端口、紅外線端口等等和移動(dòng)通信終端相接。用戶還可以通過(guò)無(wú)線電、USB端口、IEEE 1394端口或紅外線端口將移動(dòng)通信終端連接到個(gè)人計(jì)算機(jī),并使用所連接的個(gè)人計(jì)算機(jī)將聲音數(shù)據(jù)52,54和56下載和存儲(chǔ)到存儲(chǔ)單元50中。
聲音數(shù)據(jù)包括三維立體聲效果以便于由聲音處理單元38處理并壓縮成MP3格式或AAC格式。
聲音處理單元38將被控制器30從存儲(chǔ)單元50中讀出的聲音數(shù)據(jù)52,54和56轉(zhuǎn)換成電信號(hào),并將該電信號(hào)輸出到揚(yáng)聲器48。揚(yáng)聲器48包括兩個(gè)或更多個(gè)揚(yáng)聲器裝置以便于支持三維立體聲效果。揚(yáng)聲器48為立體聲揚(yáng)聲器,其放大通過(guò)立體聲數(shù)模轉(zhuǎn)換器46輸出的模擬立體聲信號(hào),并將該模擬立體聲信號(hào)作為可聽(tīng)聲音輸出。
現(xiàn)在將對(duì)聲音處理單元38的操作做更加詳細(xì)的描述。
聲音處理單元38包括立體聲數(shù)模轉(zhuǎn)換器46以及MP3解碼器42和AAC解碼器44中的至少一個(gè)。圖2示出了MP3解碼器42和AAC解碼器44同時(shí)存在的一種結(jié)構(gòu),并且由開(kāi)關(guān)40來(lái)選擇兩個(gè)解碼器中的一個(gè)。
也就是說(shuō),存儲(chǔ)單元50存儲(chǔ)二維樂(lè)曲聲音數(shù)據(jù)52,MP3格式的三維聲音數(shù)據(jù)54,和AAC格式的三維聲音數(shù)據(jù)56。當(dāng)用戶需要再現(xiàn)、生成呼入呼叫、或生成諸如告警信號(hào)之類的請(qǐng)求時(shí),控制器30從存儲(chǔ)單元50中將有關(guān)聲音數(shù)據(jù)讀出并將該讀出的數(shù)據(jù)提供給聲音處理單元38。
當(dāng)MP3格式的三維聲音數(shù)據(jù)54被控制器30讀出時(shí),開(kāi)關(guān)40在控制器30的控制下切換,以將MP3格式的三維聲音數(shù)據(jù)54發(fā)送給MP3解碼器42。三維聲音數(shù)據(jù)54按照MP3方案被MP3解碼器42解碼,并被立體聲數(shù)模轉(zhuǎn)換器46轉(zhuǎn)換成電信號(hào),然后通過(guò)揚(yáng)聲器48輸出。當(dāng)AAC格式的三維聲音數(shù)據(jù)56被控制器30讀出時(shí),開(kāi)關(guān)40在控制器30的控制下切換,以將AAC格式的三維聲音數(shù)據(jù)56發(fā)送到AAC解碼器44。三維聲音數(shù)據(jù)56按照AAC方案被AAC解碼器44解碼,并被立體聲數(shù)模轉(zhuǎn)換器46轉(zhuǎn)換成電信號(hào),然后通過(guò)揚(yáng)聲器48輸出。樂(lè)曲聲音數(shù)據(jù)52可以被MP3解碼器42和AAC解碼器44中的任何一個(gè)再現(xiàn)。
在下文中,將對(duì)按照本發(fā)明實(shí)施例應(yīng)用的壓縮方案進(jìn)行描述。
一般地,為了采用電設(shè)備再現(xiàn)自然界產(chǎn)生的各種各樣的聲音,語(yǔ)音或聲音信號(hào)被轉(zhuǎn)換成脈沖并以波形存儲(chǔ)。然而,為了存儲(chǔ)接近原始聲音質(zhì)量的聲音,存儲(chǔ)一分鐘的聲音信號(hào)需要高達(dá)大約10M字節(jié)的極大容量。人們已經(jīng)研究了壓縮和存儲(chǔ)聲音數(shù)據(jù)的方案,以解決上述大容量的問(wèn)題,由此產(chǎn)生了MP3聲音壓縮編譯碼器(MP3)。MP3以MPEG-1為基礎(chǔ)構(gòu)成,MPEG-1為視頻數(shù)據(jù)的一種壓縮格式并已發(fā)展成聲音數(shù)據(jù)標(biāo)準(zhǔn)。
MP3能將數(shù)字音頻數(shù)據(jù)壓縮成比在一般音頻密致盤(CD)中存儲(chǔ)的數(shù)字音頻數(shù)據(jù)大約小十二倍的大小,同時(shí)保持?jǐn)?shù)字音頻聲音的質(zhì)量。比一般數(shù)字音頻數(shù)據(jù)小十倍的MP3聲音數(shù)據(jù)能夠確保聲音質(zhì)量和CD中的一樣好(16位和44.1KHz)。
和MP3不同,AAC壓縮方案不是起源于MPEG-1而起源于MPEG-2,被稱為‘MP4’,其表示比MP3還要先進(jìn)的技術(shù)。用于數(shù)字多用途盤(DVD)視頻的MPEG-2具有比MPEG-1更優(yōu)良的聲音質(zhì)量以及更高的壓縮比,由此具有包括比MPEG-1好四倍的屏幕質(zhì)量在內(nèi)的卓越性能并支持多種語(yǔ)言。來(lái)源于該MPEG-2的AAC能夠?qū)⑵胀〝?shù)字音頻數(shù)據(jù)壓縮到1/20,并且是一種能夠防止數(shù)據(jù)被非法復(fù)制的數(shù)字文件壓縮方法。
MP3的數(shù)據(jù)結(jié)構(gòu)是固定的而AAC的數(shù)據(jù)結(jié)構(gòu)是可變的。即,MP3按照幀在頭部之后存儲(chǔ)數(shù)據(jù),該頭部包含有關(guān)于整個(gè)曲調(diào)的信息。因?yàn)閹哂泄潭ǖ拇笮?,因此即使在具有高壓縮比的部分,幀也可能包含不必要的空閑容量。相反的,因?yàn)锳AC的幀具有可變的結(jié)構(gòu),可以按照壓縮比改變幀的大小,所以整個(gè)數(shù)據(jù)的容量明顯的縮小了。實(shí)際上,與MP3相比,AAC最大可以將其數(shù)據(jù)容量縮小30%。
AAC的第二個(gè)優(yōu)點(diǎn)是聲音的高質(zhì)量。和MP3不同,AAC通過(guò)兩種技術(shù)來(lái)保持原始聲音的質(zhì)量,即,時(shí)間噪聲整形(TNS)和預(yù)測(cè)。TNS為一種量化補(bǔ)償技術(shù),其減少噪聲,并通過(guò)感知地減少當(dāng)連續(xù)模擬音樂(lè)信號(hào)被轉(zhuǎn)換成數(shù)字信號(hào)‘1’和‘0’時(shí)產(chǎn)生的誤差而生成接近原始聲音的聲音。預(yù)測(cè)包括存儲(chǔ)由TNS補(bǔ)償?shù)闹怠<?,預(yù)測(cè)用于存儲(chǔ)有關(guān)在先前部分中補(bǔ)償?shù)闹档男畔?,并?dāng)在隨后部分生成相同的數(shù)據(jù)時(shí)利用該存儲(chǔ)的信息。如果兩個(gè)相同的聲音在量化步驟中被補(bǔ)償成不同的值,這兩個(gè)相同的聲音就會(huì)以兩個(gè)不同的聲音被輸出。因此,執(zhí)行預(yù)測(cè)以便于相同的聲音被補(bǔ)償成相同的值并作為相同的聲音再現(xiàn)。
如上所述,MP3和AAC不將原始聲音數(shù)據(jù)改變?yōu)榻浦?,而是通過(guò)感知編碼方法將原始聲音數(shù)據(jù)壓縮到一定級(jí)別,在該級(jí)別上音頻信號(hào)的特性不能被感知地識(shí)別,由此防止了包含在原始聲音數(shù)據(jù)中的三維立體聲效果的失真。另外,從為三維立體聲數(shù)據(jù)54和56提供服務(wù)的供應(yīng)商服務(wù)器62和移動(dòng)通信終端的觀點(diǎn)來(lái)看,存在以下優(yōu)點(diǎn)和傳統(tǒng)的SMAF相比,下載時(shí)間縮短,并且存儲(chǔ)器的利用率是其兩倍。
圖3為描述按照本發(fā)明的實(shí)施例在移動(dòng)通信終端中聲音信號(hào)再現(xiàn)操作的流程圖。
在步驟70中,通過(guò)無(wú)線電、USB端口、IEEE 1394端口或紅外線端口,將來(lái)自廠商、移動(dòng)通信終端用戶或供應(yīng)商服務(wù)器的MP3格式或AAC格式的三維聲音數(shù)據(jù)存儲(chǔ)在移動(dòng)通信終端的存儲(chǔ)單元50中。在步驟72中,用戶選擇并確定與作為呼入樂(lè)曲聲音的三維聲音數(shù)據(jù)相應(yīng)的三維樂(lè)曲聲音。
在步驟74,當(dāng)呼入呼叫或用戶要求再現(xiàn)樂(lè)曲聲音時(shí),控制器30從存儲(chǔ)器中讀出被確定作為呼入樂(lè)曲聲音的三維樂(lè)曲聲音或用戶所要求的相應(yīng)的三維聲音數(shù)據(jù),并控制開(kāi)關(guān)40切換到與讀出的三維聲音數(shù)據(jù)相應(yīng)的解碼器42或44(步驟76)。
在步驟78,與開(kāi)關(guān)40相接的解碼器42或44通過(guò)開(kāi)關(guān)40接收讀出的三維聲音數(shù)據(jù),并分別按照MP3方案或AAC方案對(duì)該接收到的數(shù)據(jù)進(jìn)行解碼。在步驟80中,該解碼信號(hào)被立體聲數(shù)模轉(zhuǎn)換器46轉(zhuǎn)換成模擬音頻信號(hào),并通過(guò)揚(yáng)聲器48輸出。
現(xiàn)在,將對(duì)在上面詳細(xì)描述的根據(jù)本發(fā)明的實(shí)施例所得到的效果進(jìn)行簡(jiǎn)要的描述。
當(dāng)離線處理的三維立體聲數(shù)據(jù)被再現(xiàn)時(shí),通過(guò)采用由AAC格式或MP3格式構(gòu)成的數(shù)據(jù),三維立體聲數(shù)據(jù)能被再現(xiàn)并且原始聲音的質(zhì)量保持令人滿意的水平,因此在再現(xiàn)原始聲音的過(guò)程中使獲得優(yōu)質(zhì)的三維立體聲效果和卓越的性能成為可能。
另外,因?yàn)椴捎昧薃AC格式或MP3格式,聲音數(shù)據(jù)的大小減小了一半,存儲(chǔ)數(shù)據(jù)的存儲(chǔ)器的容量和制造成本也會(huì)大大減少,而聲音的卓越感知質(zhì)量確保不會(huì)失真。再有,因?yàn)橄螺d聲音數(shù)據(jù)所需的時(shí)間周期減半,用戶的下載費(fèi)用也會(huì)降低。
雖然已參考其中的某些優(yōu)選實(shí)施例對(duì)本發(fā)明作了說(shuō)明和描述,但本領(lǐng)域的技術(shù)人員應(yīng)該理解,在不偏離所附權(quán)利要求限定的本發(fā)明的精神和范圍的情況下,可以在形式上和細(xì)節(jié)上對(duì)本發(fā)明作任何的改變。相應(yīng)的,本發(fā)明的范圍并不局限于上述的實(shí)施例,而是限于權(quán)利要求和其等效物。
權(quán)利要求
1.用于移動(dòng)通信終端的三維立體聲再現(xiàn)設(shè)備,該三維立體聲再現(xiàn)設(shè)備包括存儲(chǔ)器,用于存儲(chǔ)具有三維立體聲效果的聲音數(shù)據(jù);聲音處理單元,當(dāng)生成呼入呼叫時(shí)或當(dāng)用戶請(qǐng)求聲音數(shù)據(jù)的再現(xiàn)時(shí),用于從存儲(chǔ)器中讀出聲音數(shù)據(jù),并對(duì)該聲音數(shù)據(jù)進(jìn)行解碼而不會(huì)使三維立體聲效果失真,由此以模擬信號(hào)的形式輸出該聲音數(shù)據(jù);和揚(yáng)聲器,用于放大該模擬信號(hào)并將該放大的模擬信號(hào)以可聽(tīng)聲音的形式輸出。
2.如權(quán)利要求1所述的三維立體聲再現(xiàn)設(shè)備,其中,聲音數(shù)據(jù)以MPEG-1層3(MP3)格式和MPEG-2高級(jí)音頻編碼(AAC)格式中的一種格式存儲(chǔ)。
3.如權(quán)利要求1所述的三維立體聲再現(xiàn)設(shè)備,其中聲音處理單元包括MP3解碼器和AAC解碼器中的至少一個(gè)解碼器,用于按照聲音數(shù)據(jù)的格式來(lái)解碼聲音數(shù)據(jù),MP3解碼器對(duì)按照MP3解碼方案的聲音數(shù)據(jù)進(jìn)行解碼,AAC解碼器對(duì)按照AAC解碼方案的聲音數(shù)據(jù)進(jìn)行解碼;和立體聲數(shù)模轉(zhuǎn)換器,用于將該解碼的數(shù)據(jù)轉(zhuǎn)換成立體聲模擬信號(hào)。
4.如權(quán)利要求1所述的三維立體聲再現(xiàn)設(shè)備,其中聲音處理單元進(jìn)一步包括開(kāi)關(guān),用于執(zhí)行切換操作,以按照聲音解碼器的格式將聲音數(shù)據(jù)傳送到MP3解碼器或AAC解碼器。
5.如權(quán)利要求1所述的三維立體聲再現(xiàn)設(shè)備,其中揚(yáng)聲器包括至少兩個(gè)揚(yáng)聲器裝置以再現(xiàn)立體聲。
6.如權(quán)利要求1所述的三維立體聲再現(xiàn)設(shè)備,其中聲音數(shù)據(jù)或由廠商預(yù)先存儲(chǔ)在存儲(chǔ)器中,或通過(guò)無(wú)線接口或有線接口從服務(wù)供應(yīng)商的服務(wù)器或用戶的個(gè)人計(jì)算機(jī)下載到存儲(chǔ)器中。
7.一種用于在通信終端中再現(xiàn)具有三維立體聲效果的聲音數(shù)據(jù)的方法,該方法包括以下步驟將具有三維立體聲效果的聲音數(shù)據(jù)存儲(chǔ)到通信終端的存儲(chǔ)器中;當(dāng)生成呼入呼叫時(shí)或當(dāng)用戶請(qǐng)求聲音數(shù)據(jù)的再現(xiàn)時(shí),從存儲(chǔ)器中讀出該聲音數(shù)據(jù),并對(duì)該聲音數(shù)據(jù)進(jìn)行解碼而不會(huì)使三維立體聲效果失真;和將該解碼的數(shù)據(jù)轉(zhuǎn)換成模擬信號(hào)并以可聽(tīng)聲音的形式輸出該模擬信號(hào)。
8.如權(quán)利要求7所述的方法,其中聲音數(shù)據(jù)以MPEG-1層3(MP3)格式和AAC格式中的一種格式存儲(chǔ)。
9.如權(quán)利要求7所述的方法,其中解碼步驟包括以下步驟檢測(cè)該聲音數(shù)據(jù)具有MPEG-1層3(MP3)格式還是MPEG-2高級(jí)音頻編碼(AAC)格式;當(dāng)聲音數(shù)據(jù)具有MP3格式時(shí)由MP3解碼器解碼該聲音數(shù)據(jù);和當(dāng)聲音數(shù)據(jù)具有AAC格式時(shí)由AAC解碼器解碼該聲音數(shù)據(jù)。
10.如權(quán)利要求7所述的方法,其中,在輸出步驟中,解碼的數(shù)據(jù)被轉(zhuǎn)換成立體聲模擬信號(hào),被放大,然后被輸出。
11.如權(quán)利要求7所述的方法,其中,在輸出步驟中,模擬信號(hào)通過(guò)包括至少兩個(gè)揚(yáng)聲器裝置的揚(yáng)聲器輸出,以再現(xiàn)立體聲。
12.如權(quán)利要求7所述的方法,其中聲音數(shù)據(jù)或由廠商預(yù)先存儲(chǔ)在存儲(chǔ)器中,或通過(guò)無(wú)線接口或有線接口從服務(wù)供應(yīng)商的服務(wù)器或用戶的個(gè)人計(jì)算機(jī)下載到存儲(chǔ)器中。
全文摘要
公開(kāi)了一種在移動(dòng)通信終端中使具有三維立體聲效果的聲音數(shù)據(jù)能夠被再現(xiàn)的設(shè)備和方法。該移動(dòng)通信終端的三維立體聲再現(xiàn)設(shè)備包括用于存儲(chǔ)具有三維立體聲效果的聲音數(shù)據(jù)的存儲(chǔ)器;當(dāng)生成呼入呼叫時(shí)或當(dāng)用戶請(qǐng)求再現(xiàn)聲音數(shù)據(jù)時(shí),用于從存儲(chǔ)器中讀出該聲音數(shù)據(jù)并解碼該聲音數(shù)據(jù)而不會(huì)使三維立體聲效果失真,由此以模擬信號(hào)的形式輸出該聲音數(shù)據(jù)的聲音處理單元;和用于放大該模擬信號(hào)并輸出該放大的模擬信號(hào)的揚(yáng)聲器。因此,在再現(xiàn)原始聲音過(guò)程中有可能獲得優(yōu)質(zhì)的三維立體聲效果和卓越的性能。
文檔編號(hào)H04M1/72GK1625185SQ20041010382
公開(kāi)日2005年6月8日 申請(qǐng)日期2004年11月17日 優(yōu)先權(quán)日2003年11月17日
發(fā)明者姜相機(jī), 金在賢, 金容皙 申請(qǐng)人:三星電子株式會(huì)社