亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

數(shù)字內(nèi)容回放裝置的制作方法

文檔序號:2823500閱讀:244來源:國知局
專利名稱:數(shù)字內(nèi)容回放裝置的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種編輯音頻數(shù)據(jù)的方法以及采用相同方法的記錄介質(zhì)和數(shù)字音頻播放器,特別涉及一種根據(jù)用戶所需尺度編輯音頻數(shù)據(jù)的方法和采用這種編輯方法的記錄介質(zhì)和數(shù)字音頻播放器。
背景技術(shù)
對于能提供音頻信號的加大壓縮率和最近似于原音的聲音的音頻信號編碼方法,已提出很多提議。
MPEG/音頻標準或AC-2/AC-3方法通過降低傳統(tǒng)數(shù)字編碼器位率的六分之一或八分之一位率,即通常到64Kbps到384Kbps,提供與由光盤產(chǎn)生的音最近似的音質(zhì)。
同時,對于以更低位率提供與原音一致的音質(zhì)的方法,也一直在進行研究。該研究的一個重要結(jié)果可以是選作國際標準之一的MPEG2高級音頻編碼(Advanced Audio Coding,AAC)。MPEG2AAC還由專家組推薦為能以64Kbps位率提供與原音一致的音質(zhì)的方法。
根據(jù)采用傳統(tǒng)編碼方法的通用編碼器,音頻數(shù)據(jù)用按照固定位率進行設(shè)置的編碼方法進行編碼。
同時,便攜式數(shù)字音頻播放器構(gòu)造為通過從計算機或用于音頻文件供應(yīng)的售貨機下載文件播放采用傳統(tǒng)編碼方法生成的音頻文件。
然而,由于便攜式數(shù)字音頻播放器設(shè)計為具有受限大小以方便攜帶,因此要將記錄介質(zhì)的存儲器容量擴展到預定額度之外在實際上是不可能的。換句話說,便攜式數(shù)字音頻播放器具有受限存儲器容量。
一般,便攜式數(shù)字音頻播放器具有受限容量的存儲器,如16、32或64M字節(jié),當將采用傳統(tǒng)編碼方法生成的音頻文件存儲在便攜式數(shù)字音頻播放器中時,這將有時限制音頻文件的大小或數(shù)量。
因此,為了將采用傳統(tǒng)編碼方法生成的音頻文件下載到便攜式數(shù)字音頻播放器中,用戶不得不在數(shù)字音頻播放器的存儲器限制之內(nèi)選擇數(shù)字音頻文件。例如,如果29M字節(jié)的文件已經(jīng)存儲在具有32M字節(jié)存儲器容量的數(shù)字音頻播放器的記錄介質(zhì)中,用戶僅允許額外下載剩余空閑字節(jié)內(nèi),即3M字節(jié)內(nèi)的音頻文件。在用戶=s所需音頻文件為4M字節(jié)的情況下,用戶不能下載該音頻文件,這就意味著空閑字節(jié)沒有得到有效利用。
4M字節(jié)的音頻文件可以通過刪除多于1M字節(jié)的文件進行下載,但是,這將導致用戶操作上的不方便,并且所刪除的文件不再可用。
如上所述,傳統(tǒng)數(shù)字音頻播放器或傳統(tǒng)編碼方法的音頻文件生成器不能滿足想要降低數(shù)字音頻文件的大小以使用另一以固定位率編碼的數(shù)字音頻文件,甚至那意味著音質(zhì)會出現(xiàn)輕微受損,的用戶的需要。換句話說,用戶經(jīng)常發(fā)現(xiàn)傳統(tǒng)數(shù)字音頻播放器或根據(jù)傳統(tǒng)編碼方法生成音頻文件的音頻文件生成器不方便,因為用戶不允許根據(jù)他們的需要調(diào)節(jié)數(shù)據(jù)的大小或位率。

發(fā)明內(nèi)容
本發(fā)明是用來克服相關(guān)技術(shù)的上述問題的,因此本發(fā)明的一個目的是提供一種將數(shù)字音頻文件編輯為用戶所需大小的方法從而提高數(shù)字音頻播放器的存儲器使用效率,以及采用該編輯方法的記錄介質(zhì)和數(shù)字音頻播放器。
上述目的通過一種數(shù)字內(nèi)容回放裝置來實現(xiàn),根據(jù)本發(fā)明,該裝置包含接收器,被配置來接收已編碼的數(shù)字內(nèi)容;位片運算編碼(BSAC)解碼器,用來對所接收的數(shù)字內(nèi)容進行解碼;逆量化器,用來對已解碼的數(shù)字內(nèi)容進行逆量化;頻率/時間映射器,用于將已逆量化的數(shù)字內(nèi)容從頻域轉(zhuǎn)換到時域。
上述目的還通過一種數(shù)字內(nèi)容回放裝置來完成,根據(jù)本發(fā)明的另一方面,該裝置包含接收器,被配置來接收已編碼的數(shù)字內(nèi)容;解碼器,用來通過選擇性地對表示已編碼數(shù)字內(nèi)容的位進行解碼而對數(shù)字內(nèi)容進行解碼,其中所述位按照重要性的順序重新排列,并且格式化為多個層,按照每個所述層生成的順序以及按照每一位的重要性的順序選擇性地對所述位進行解碼;逆量化器,用來對已解碼的數(shù)字內(nèi)容進行逆量化;頻率/時間映射器,用于將已逆量化的數(shù)字內(nèi)容從頻域轉(zhuǎn)換到時域。
上述目的進一步通過一種數(shù)字內(nèi)容回放裝置來完成,根據(jù)本發(fā)明的另一方面,該裝置包含接收器,被配置來接收數(shù)字內(nèi)容;編碼器,用來通過將表示所接收的數(shù)字內(nèi)容的位按照重要性的順序重新排列并且根據(jù)每一位的重要性的順序?qū)⑦@些位格式化為多個層而對數(shù)字內(nèi)容進行編碼;以及存儲器,用來存儲已編碼的數(shù)字內(nèi)容。
上述目的進一步通過一種數(shù)字內(nèi)容回放裝置來完成,根據(jù)本發(fā)明的另一方面,該裝置包含接收器,被配置來接收已編碼的數(shù)字內(nèi)容,其中該數(shù)字內(nèi)容以不同于BSAC的格式編碼;BSAC編解碼器,包含BSAC編碼器與BSAC解碼器,其中BSAC編碼器將所接收的數(shù)字內(nèi)容轉(zhuǎn)換為BSAC格式,BSAC解碼器對BSAC格式的數(shù)字內(nèi)容進行解碼;逆量化器,用來對已解碼的數(shù)字內(nèi)容進行逆量化;頻率/時間映射器,用于將已逆量化的數(shù)字內(nèi)容從頻域轉(zhuǎn)換到時域。
上述目的進一步通過一種數(shù)字內(nèi)容回放裝置來完成,根據(jù)本發(fā)明的另一方面,該裝置包含接收器,被配置來接收已編碼的數(shù)字內(nèi)容;解碼器,用來通過選擇性地對表示已編碼數(shù)字內(nèi)容的位進行解碼而對數(shù)字內(nèi)容進行解碼,其中所述位按照重要性的順序重新排列,并且格式化為多個層,其中每個層都包含一組重要性順序相同的位,根據(jù)所選擇的位率以及根據(jù)在每個層中包含的位的重要性順序,至少一個層被選擇用來解碼,解碼器按照所述多個層生成的順序?qū)λx擇的層進行解碼;逆量化器,用來對已解碼的數(shù)字內(nèi)容進行逆量化;頻率/時間映射器,用于將已逆量化的數(shù)字內(nèi)容從頻域轉(zhuǎn)換到時域。


通過結(jié)合附圖參照下面詳細描述,對本發(fā)明更為全面的理解及其很多其他優(yōu)點將變得更加清楚,附圖中相同的參考號表示同一或類似部件,其中圖1是按照本發(fā)明具有音頻編輯器的計算機方框圖;圖2是示出由圖1所示的音頻編輯器的菜單提供部分提供的菜單屏幕的示例圖;圖3A~3D是示出當選擇圖2的編輯菜單項時相繼提供的,包括提取率選擇菜單的編輯菜單的示例圖;圖4是說明根據(jù)本發(fā)明的一個優(yōu)選實施例在計算機上提取數(shù)據(jù)的過程的流程圖;圖5A是示出本發(fā)明的一個優(yōu)選實施例的數(shù)字音頻播放器的方框圖;圖5B是示出當選擇圖5A所示的數(shù)字音頻播放器中的編輯功能時相繼提供的,包括提取率選擇菜單的編輯菜單的示例圖;圖6是說明在圖5A所示的數(shù)字音頻播放器中提取數(shù)據(jù)的一個示例的流程圖;圖7是示出在本發(fā)明中采用的位片編碼解碼器的位片編碼器的組成部分的方框圖;圖8是說明由圖7所示的位片編碼器執(zhí)行的位片編碼過程的圖;圖9是由位片編碼過程生成的分層位流的結(jié)構(gòu)圖;圖10是示出在本發(fā)明中采用的位片編碼解碼器的位片解碼器的組成部分的方框圖。
具體實施例方式
現(xiàn)在將參照附圖對本發(fā)明優(yōu)選實施例的一種編輯音頻數(shù)據(jù)的方法以及采用相同方法的記錄介質(zhì)和數(shù)字音頻播放器進行更加詳細的描述。
圖1是按照本發(fā)明一個優(yōu)選實施例具有音頻編輯程序的計算機方框圖。
如圖1所示,計算機10包括CPU(central processing unit,中央處理器)11、ROM 12、RAM 13、顯示設(shè)備14、輸入設(shè)備15、存儲器設(shè)備16和通信設(shè)備19。
存儲器設(shè)備16包括操作系統(tǒng)(operating systems,OS)17如Windows 98、Windows 2000等和安裝其中的音頻編輯器18。
音頻編輯器18在OS 17的支持下提供用于編輯音頻文件的菜單,并且執(zhí)行與用戶所作選擇對應(yīng)的過程。音頻編輯器18包括菜單提供部分18a和編輯部分18b。當音頻編輯器18在計算機10上執(zhí)行時,菜單提供部分18a提供顯示音頻編輯的各個菜單的屏幕。菜單提供部分18a的菜單屏幕的一個示例如圖2所示。
編輯部分18b根據(jù)從由菜單提供部分18a提供的菜單所作的選擇執(zhí)行處理。編輯部分18b包括執(zhí)行數(shù)字音頻數(shù)據(jù)的分層位片編碼的位片編碼解碼程序,即BSAC(Bit Sliced Arithmetic Coding,位片運算編碼)。
最好,音頻編輯器18構(gòu)造為它支持對存儲在計算機10的存儲器設(shè)備16和連接到預定通信端口如并行口或串行口的外部設(shè)備中的文件的查看和選擇。
例如,菜單提供部分18a提供從中可以選擇計算機10的通信端口的環(huán)境設(shè)置菜單,并且編輯部分18b處理在同一屏幕上顯示存儲在連接到預定通信端口的外部設(shè)備中的文件列表和存儲在計算機10中的文件列表,以作比較。
而且,最好,音頻編輯器18構(gòu)造為在計算機10上播放編輯完成的音頻文件。也就是,音頻編輯器18的位片編碼解碼程序最好進一步包括用于對用BSAC方法生成的文件進行解碼的解碼器。
如圖2所示,在通過執(zhí)行音頻編輯器18顯示的,計算機設(shè)備14的屏幕14a上,存儲在計算機10的存儲器設(shè)備16中的文件列表顯示在屏幕的左半部分,而存儲在連接到預定通信端口的外部設(shè)備中的文件列表顯示在屏幕的右半部分。例如,當連接到預定通信端口的外部設(shè)備是便攜式數(shù)字音頻播放器時,存儲在便攜式數(shù)字音頻播放器的存儲器部分中的文件列表與計算機10的文件列表一起進行顯示。
菜單項>文件=是一個支持如文件選擇、文件下載、文件上載、文件打開、文件保存和環(huán)境設(shè)置等命令項的代表符號。
菜單項>編輯=是一個支持選擇所選文件的編輯選項的代表符號。
參考號25、26和27分別表示下載選擇鍵、上載選擇鍵和播放鍵,它們以圖象(圖標)形式而不是字符(文本)形式進行表示。
下面將參照圖1-4對通過使用音頻編輯器18根據(jù)用戶=s所需尺度編輯音頻文件的過程進行描述。
首先,當執(zhí)行音頻編輯器18時,顯示一個初始屏幕(參見圖2)(步驟100)。在初始屏幕上,由菜單提供部分18a顯示菜單項,并且顯示計算機10的存儲器設(shè)備16的文件列表和連接到計算機10的預定通信端口的外部設(shè)備(即,便攜式數(shù)字音頻播放器)存儲器部分的文件列表。同時,外部設(shè)備的存儲器部分的總存儲器大小和剩余空閑存儲器空間量也進行顯示以在編輯過程中用作用戶參考。如果沒有連接到計算機10的外部設(shè)備,那么僅顯示計算機10的文件列表。
當用戶從存儲在計算機10的存儲器設(shè)備16中的文件列表選擇一個文件時,例如,當用戶通過操作輸入設(shè)備15如鼠標或鍵盤選擇<a.pcm>音頻文件(虛線所框)時,編輯部分18b在圖2所示的顯示屏幕的下方顯示所選文件的大小,例如4M字節(jié)。在此需要說明的是,可以選擇多個文件進行編輯,并且在這種情況下,BSAC方法應(yīng)用于所有所選文件。
下一步,確定是否從菜單作出菜單項的選擇(步驟110)。如果沒有,確定是否用戶作出關(guān)閉初始屏幕以有效結(jié)束音頻編輯工作的選擇,例如(在顯示屏幕的右上角)(步驟115)。
當在步驟110從菜單作出菜單項的選擇,確定是否選擇了編輯菜單(步驟120)。如果沒有,那么執(zhí)行所選菜單項對應(yīng)的過程(步驟125)。
當在步驟120確定用戶通過操作輸入設(shè)備15選擇了編輯菜單時,顯示數(shù)據(jù)提取率選擇菜單(參見圖3A~3D)。最好,菜單提供部分18a提供用于選擇位率或/或目標數(shù)據(jù)大小的菜單,直到完成編輯過程。在此,位率選擇菜單是為了用戶=s的方便起見,考慮音頻文件類型選擇音頻文件的數(shù)據(jù)大小和音質(zhì)。更高位率導致更好的音質(zhì)和更大的數(shù)據(jù)大小,而更低的位率導致更差的音質(zhì)和更小的數(shù)據(jù)大小是要考慮的事實。
同時,直到完成編輯過程的目標數(shù)據(jù)大小選擇菜單是為了用戶=s的方便起見,將音頻文件編輯到一個經(jīng)過調(diào)節(jié)的尺度,該尺度適合于他/她打算將編輯完成的音頻文件存儲在其中的記錄介質(zhì)的空閑容量。例如,當用戶想要在空閑容量為3M字節(jié)的便攜式數(shù)字音頻播放器中調(diào)節(jié)并存儲大于3M字節(jié)的音頻文件時,他/她就可以方便地使用該菜單。
如圖3A所示,數(shù)據(jù)提取率選擇菜單窗口14b顯示選擇要進行編輯的文件<a.pcm>、位率選擇窗口、目標數(shù)據(jù)大小選擇窗口和編輯后處理選擇窗口。在第二實施例中,如圖3B所示,在數(shù)據(jù)提取率選擇菜單窗口14c中還提供有一個預覽鍵,以允許用戶在編輯和下載之前對根據(jù)所選位率或目標大小的音頻文件的音質(zhì)進行取樣或預覽。在第三實施例中,如圖3C和3D所示,數(shù)據(jù)提取率選擇菜單窗口14d顯示選擇要進行編輯的文件<a.pcm>、位率選擇窗口、目標數(shù)據(jù)大小選擇窗口、位率選擇窗口中的粗略和精細調(diào)節(jié)工具和編輯后處理選擇窗口。需要清楚的是第三實施例也可以包括如圖3B所示的預覽鍵。
當在步驟130確定通過選擇一個位率或目標大小(下面將作更詳細的描述)選擇了數(shù)據(jù)提取率時,編輯部分18b根據(jù)由用戶通過圖3A~3D的提取率選擇菜單窗口設(shè)置的位率或目標大小用分層位片運算編碼(Bit SlicedArithmetic Coding,BSAC)方法編輯音頻文件(步驟140)。
在完成編輯之后,當確定設(shè)置了下載(步驟S150和S160)時,所編輯的音頻文件就下載到連接到計算機10的數(shù)字音頻播放器(步驟170)。但是,對于圖3B,如果用戶希望試聽編輯結(jié)果,用戶在選擇一個位率或目標大小后選擇預覽鍵,那么音頻文件的一部分將用BSAC方法進行編輯(編碼),并且存儲在例如臨時文件中。所編碼的音頻部分然后將自動進行解碼并播放。如果用戶接受所編輯音頻的音質(zhì),那么用戶可以設(shè)置下載功能,并且在選擇回車5鍵后整個文件將用BSAC方法進行編輯并且下載(步驟140到170)。
同時,當在步驟160沒有選擇下載時,將顯示一個新屏幕(沒有示出)來請求用戶為所編輯的數(shù)據(jù)文件命名,然后將該文件存儲在預定位置(步驟180)。
再次參照圖3A~3D,位率最好以1Kbps的間隔進行選擇,而目標數(shù)據(jù)大小以1K字節(jié)的間隔進行選擇。但是,在編輯部分18b的位片編碼解碼程序的支持下,位率也可以采用多于或少于1Kbps,例如8Kbps的間隔進行選擇,并且目標數(shù)據(jù)大小可以采用多于或少于1K字節(jié),例如500K字節(jié)的間隔進行選擇。
在提取率選擇菜單中,當用戶想要僅選擇音頻文件的一個位率時,他/她操作位率選擇窗口的滾動條(向上和向下箭頭)到他/她所需的位率。當用戶在位率選擇窗口中看到他/她所需的位率時,他/她停止操作滾動條,并且單擊位率選擇窗口左邊的選擇確認框,以在其中標上選中標記(V)。當用戶在選擇確認框中看到選中標記(V)時,他/她選擇是否下載,并且作相應(yīng)的單擊。
當用戶操作用于位率的滾動條時,目標數(shù)據(jù)大小的顯示可以改變,以顯示與所顯示位率對應(yīng)的值。因此,雖然當使用與目標數(shù)據(jù)大小對應(yīng)的滾動條時,目標數(shù)據(jù)大小顯示受限于僅顯示缺省間隔例如500K字節(jié),即0、500、1000...6000KB,但是通過使用與位率對應(yīng)的滾動條,所顯示的目標數(shù)據(jù)大小將改變到與所顯示位率對應(yīng)的值,并且因此不受限于500K字節(jié)的間隔。
另外,當用戶操作與目標數(shù)據(jù)大小對應(yīng)的滾動條時,那么與位率值對應(yīng)的顯示可以進行改變,以顯示與所顯示目標數(shù)據(jù)大小對應(yīng)的位率,而該位率可以在缺省位率間隔之外。
在第三實施例中,位率最好采用1Kbps的間隔進行選擇以作精細調(diào)節(jié),并且位率最好采用8Kbps的間隔進行選擇以作粗略調(diào)節(jié)。因此,當如圖3C所示選擇粗略調(diào)節(jié)時,操作位率滾動條將以8Kbps間隔,即8、16、24、32、40、48、56、64...n Kbps顯示位率。當如圖3D所示選擇精細調(diào)節(jié)時,操作位率滾動條將以1Kbps間隔,即1、2、3、...62、63、64...n Kbps顯示位率。并且,如上所述,當用于位率的滾動條由用戶進行操作時,目標數(shù)據(jù)大小的顯示可以改變,以顯示與所顯示位率對應(yīng)的值。
下面將要描述,所編碼的音頻數(shù)據(jù)將包括含有位率信息的數(shù)據(jù)頭。因此,所選位提取率,例如每層8Kbps和最高層的值,例如64Kbps將包括在所編碼音頻信號的數(shù)據(jù)頭中。
當用于下載的所選音頻文件已經(jīng)用分層BSAC方法進行生成時,從與所選位率對應(yīng)的層執(zhí)行提取操作。
當用戶想要播放編輯完成的文件時,他/她選擇他/她的所需文件,并且單擊由菜單提供部分18a提供的播放鍵27。因此,音頻編輯器18對所選音頻文件進行解碼,并且將該文件輸出到音頻輸出設(shè)備(沒有顯示),如連接到計算機10的揚聲器。
如上所述,本發(fā)明的音頻編輯器18可以記錄在記錄介質(zhì)中,以作使用。另外,當音頻編輯器18安裝在計算機10中時,用戶可以在計算機10上將音頻文件編輯到他/她所需的尺度。在按照他/她所需用分層BSAC方法編輯音頻文件之后,用戶可以通過將編輯完成的文件下載到具有能夠?qū)σ纛l文件進行解碼和播放的設(shè)備的便攜式數(shù)字音頻播放器的存儲器。
同時,根據(jù)本發(fā)明的另一方面,數(shù)字音頻播放器可以自己編輯音頻文件。圖5A是示出本發(fā)明的一個優(yōu)選實施例的數(shù)字音頻播放器的方框圖。如圖5A所示,數(shù)字音頻播放器30通過通信接口50連接到計算機60。參考號70表示連接到計算機60的因特網(wǎng)。因此,對于計算機60,沒有必要包括圖1的編輯部分18b。
數(shù)字音頻播放器30包括鍵輸入部分31、控制器32、顯示部分33、存儲器35、位片編碼解碼器部分37和A/D轉(zhuǎn)換器39、D/A轉(zhuǎn)換器41、和接口49。參考號43表示內(nèi)部麥克風(MIC),45表示模擬音頻信號輸入終端,而47表示模擬音頻信號輸出終端。
最好,接口49構(gòu)造為通過計算機60的并行端口如用于打印機的并行端口或串行端口如USB并且通過電纜50與計算機60執(zhí)行雙向通信。
作為替換,接口49構(gòu)造為通過無線通信方法與計算機60或外部設(shè)備執(zhí)行雙向通信。
鍵輸入部分31包括多個用于設(shè)置各種支持功能的鍵。鍵輸入部分31還包括用于以所需提取率處理并存儲所接收音頻信號的鍵31a。鍵31a可以設(shè)計為用于在顯示部分33上顯示多個菜單選項,其中一個所顯示選項可以是導致顯示部分33顯示類似于如圖5B所示的屏幕,的選項鍵。另外,鍵31a可以設(shè)計為導致顯示部分33立即顯示類似于如圖5B所示的屏幕的編輯鍵。顯示部分33顯示從控制器32接收的信息。控制器32處理通過鍵輸入部分31輸入的信號,并且因此控制各個部件。
而且,鍵輸入部分31最好包括附圖中沒有顯示的保存、播放、停止和錄音鍵。這些鍵可以單獨形成,或者一個鍵可以具有多個功能,而這些功能可通過其預定操作分別不同。
A/D轉(zhuǎn)換器39將通過輸入終端45或通過麥克風(MIC)43輸入的模擬信號轉(zhuǎn)換為數(shù)字信號。
D/A轉(zhuǎn)換器41將從控制器32輸出的數(shù)字信號轉(zhuǎn)換為模擬信號,并且通過輸出終端47輸出該模擬信號??梢杂卸鄠€用來連接耳機、外部設(shè)備等的輸出終端47。
位片編碼解碼器37包括用于用分層BSAC方法執(zhí)行編碼過程的編碼器和用于用分層BSAC方法執(zhí)行解碼過程的解碼器。
當輸入編輯信號時,控制器32提供一個屏幕,用于在顯示部分33上顯示存儲器35剩余空閑存儲器容量與位率和/或目標數(shù)據(jù)大小選擇菜單。但是,注意控制器32可以在任何時候,即在激活鍵31b之前,提供有關(guān)存儲器35可用剩余空閑存儲器容量的信息。
考慮到數(shù)字音頻播放器30的顯示部分33的相對更小的顯示容量,位率選擇菜單和/或目標數(shù)據(jù)大小選擇菜單的屏幕可以根據(jù)鍵輸入部分31的屏幕移動操作進行順序顯示。位率和目標數(shù)據(jù)大小選擇的間隔如上對圖1-4所述進行應(yīng)用。
當數(shù)據(jù)提取率通過鍵輸入部分31進行選擇時,控制器32根據(jù)分層位片運算編碼方法提取通過輸入部分的多個路徑,即麥克風43、輸入終端45和接口49中的一個輸入的音頻數(shù)據(jù),并且將所提取數(shù)據(jù)存儲在存儲器部分中,即存儲器35中。
例如,當用分層BSAC方法生成的位流音頻數(shù)據(jù)通過接口49從計算機60輸入時,控制器32將數(shù)據(jù)存儲在存儲器35中,直到該層的位率達到所選位率,或者數(shù)據(jù)字節(jié)達到所選目標數(shù)據(jù)大小。在達到所選位率或字節(jié)之后,數(shù)據(jù)將不進行存儲,這將從下面圖8和9的討論中得到更好的理解。
同時,當通過接口49輸入的數(shù)據(jù)確定是用不同于分層BSAC方法的音頻數(shù)據(jù)格式如脈沖編碼調(diào)制(PCM)產(chǎn)生的時,控制器32加載位片編碼解碼器部分37根據(jù)分層BSAC方法將數(shù)據(jù)編碼到預定的提取率。然后,控制器32將數(shù)據(jù)存儲在存儲器35中。音頻數(shù)據(jù)的類型可以從首標信息進行確定,即位率信息包含在首標中。因此,所選位提取率,例如每層8Kbps和最高層的值,例如64Kbps將包括在所編碼音頻信號的首標中。因此,展示再現(xiàn)所編碼音頻數(shù)據(jù)最佳效果的方法可以通過訪問存儲在數(shù)據(jù)頭中的信息來獲得。例如,當音頻數(shù)據(jù)由編碼器以96Kbps位率進行編碼時,例如,最佳音質(zhì)可以由與具有96Kbps位率的編碼器對應(yīng)的解碼器進行恢復。
當數(shù)據(jù)是通過麥克風43或輸入終端45輸入的模擬信號時,該數(shù)據(jù)由A/D轉(zhuǎn)換器39轉(zhuǎn)換為以預定采樣率進行采樣的數(shù)字信號。然后,數(shù)據(jù)由位片編碼解碼器部分37根據(jù)所選提取率進行編碼,并且存儲在存儲器35中。
下面將參照圖6對數(shù)字音頻播放器的數(shù)據(jù)編輯過程進行描述。在此,需要理解的是,用戶最好通過使用例如圖5B的數(shù)據(jù)提取率選擇菜單窗口14e選擇位率或目標數(shù)據(jù)大小已經(jīng)選擇所需數(shù)據(jù)提取率。還需要理解的是,雖然圖5A和5B是面向便攜式數(shù)字音頻播放器的,數(shù)字音頻播放器也可以是計算機生成的,并且在計算機的屏幕上進行顯示,它具有選項鍵31a,并且激活選項鍵將導致如圖2所示的顯示,并且激活菜單欄上的編輯鍵將導致如圖5B或圖3A~3D中的任意一個的顯示。
首先,確定存儲選擇信號是否是外部音頻信號的輸入(步驟200)。在此,外部信號是通過輸入部分,即通過接口49、麥克風43或輸入終端45輸入的信號。另外,存儲選擇信號包括通過操作例如鍵輸入部分31的存儲或錄音鍵生成的信號,和表示開始從外部下載的控制信號。
當輸入存儲選擇信號時,確定是否選擇了數(shù)據(jù)提取率(步驟220)。當確定選擇了數(shù)據(jù)提取率時,所接收的音頻信號根據(jù)所選提取率用分層BSAC方法進行編碼(步驟240)。所編碼的音頻信號然后存儲在存儲器35中(步驟250)。
同時,當所接收的音頻信號已經(jīng)用分層BSAC方法進行位流編碼時,對數(shù)據(jù)進行存儲,直到所接收信號的位率層達到與所選位率或所選目標數(shù)據(jù)大小對應(yīng)的所選提取率,這意味著步驟240將在這種情況下進行忽略。
當在步驟220確定沒有選擇提取率時,所接收的音頻信號直接存儲在存儲器35中(步驟260)。作為替換,在步驟260,音頻信號可以根據(jù)預定缺省位率用位片運算編碼方法進行編碼,然后存儲在存儲器35中。
下面將對本發(fā)明的根據(jù)預定提取率通過位片編碼解碼器37或音頻編輯器18用分層位片運算編碼方法對音頻數(shù)據(jù)進行編碼的過程進行更加詳細的描述。同時,注意本發(fā)明中采用的分層BSAC編碼和解碼方法類似地公布于Sung-hee Park的、標題為可伸縮音頻編碼/解碼方法和裝置(Scalable AudioCoding/Decoding Method And Apparatus)的美國專利第6,122,618和6,148,288號,在這里加入作為參考。另外,加入作為參考的還有Sung-hee Park等的、標題為可伸縮立體聲音頻編碼/解碼方法和裝置(Scalable Stereo AudioEncoding/Decoding Method and Apparatus)、1998年6月29日提交的美國專利申請第09/106,016號和Sung-hee Park等的、標題為可伸縮音頻編碼/解碼方法和裝置(Scalable Audio Encoding/Decoding Method and Apparatus)、1998年5月28日提交的美國專利申請第09/084,893號。
首先,對分層位片編碼和解碼方法進行概要的描述。
參照示出位片編碼解碼器部分37的位片編碼器的圖7,分層位片編碼器包括時間/頻率映射部分37a、心理聲學部分37b、量化部分37c和位壓縮部分37d。
時間/頻率映射部分37a將時域音頻信號轉(zhuǎn)換為頻域信號。頻域中的信號從可由人感知的信號到不可感知的信號根據(jù)人類心理聲學模型(例如,ISO/IEC 11172-3)相互之間大不相同。因此,通過區(qū)分在各個頻率帶寬中分配的位,壓縮效率可以得到提高。
心理聲學部分37b通過時間/頻率映射部分37a的預定子頻帶的信號耦合所轉(zhuǎn)換的信號,并且使用通過與各個信號交互生成的遮蔽現(xiàn)象計算在每個子頻帶的遮蔽閥值。使用該遮蔽閥值,可以獲得最小電平的,具有聲音但由于輸入信號的大小和各個信號的交互而不為人感知的信號。
量化部分37c量化每個預定編碼頻帶的信號,從而每個頻帶的量化噪音變得比遮蔽閥值更小。換句話說,每個頻帶的頻率信號應(yīng)用于標量(scala)量化,從而每個頻帶的量化噪音的數(shù)量級小于遮蔽閥值,從而不可感知。執(zhí)行量化,從而噪音/遮蔽比率(NMR)值(由心理聲學部分37b計算的遮蔽閥值與在每個頻帶生成的噪音的比率)小于或等于0dB。NMR值小于或等于0dB表示遮蔽閥值高于量化噪音。換句話說,聽不到量化噪音。
為了完成可伸縮音頻編碼解碼,位壓縮部分37d根據(jù)各層的位率組合由量化部分37c量化的頻率數(shù)據(jù)和有關(guān)音頻數(shù)據(jù)的各個子頻帶和量化信息的邊信息。
圖8示出一個量化到5位的值以二進制進行表示的示例。因此,根據(jù)分層方法,最高有效位被耦合并首先編碼。例如,當以4位為單位編碼時,二機制數(shù)0100(虛線所框)(對應(yīng)MSV(the Most Significant Vector,最高有效向量))首先進行編碼。然后編碼逐個向量地進行到最低有效的位。在這種情況下,通過使用合適的概率分布和算法編碼方法,位將有效地壓縮到編碼中。由上述方法生成的位流結(jié)構(gòu)如圖9所示。
也就是,編碼器將音頻信號編碼為包括0基層和多個增強層的分層位流結(jié)構(gòu)。每層包括一個首標區(qū)域、邊信息寫入?yún)^(qū)域和數(shù)據(jù)區(qū)域。
基層具有最低位率,并且下一增強層的位率比基層高預定間隔的位率。采用這種方式,增強層具有增加特定間隔的位率。
只有MSB在基層的前部進行表示,從而只有所有頻率成分的輪廓進行編碼。用更低的位表示更多的位,就可以表達更詳細的信息。由于詳細信息數(shù)據(jù)值根據(jù)增加的位率,即層的增強進行編碼,音質(zhì)可以得到提高。
下一步,對使用如上所表達的數(shù)據(jù)構(gòu)造可伸縮位流的方法進行描述。首先,在要用于基層的邊信息中,對每個量化頻帶的量化位信息進行編碼。量化值信息從MSB到LSB,并且從最低頻率成分到最高頻率成分進行順序編碼。如果特定頻帶的量化位小于當前正在編碼頻帶的量化位,那么不執(zhí)行編碼。當頻帶的量化位等于當前正在編碼頻帶的量化位時,執(zhí)行編碼。在此,如果在對各層的信號進行編碼中沒有頻帶限制,會產(chǎn)生對耳朵有害的聲音。這是因為在不管頻帶從MSB到LSB執(zhí)行編碼的情況下,當恢復具有低位率的層的信號時信號是斷續(xù)的。因此,根據(jù)位率適當限制頻帶是明智的。
在對基層進行編碼之后,對下一增強層的音頻數(shù)據(jù)的邊信息和量化值進行編碼。采用這種方式,對與所選位率對應(yīng)的所有層的數(shù)據(jù)進行編碼。如此編碼的信息收集在一起,形成位流。
如圖9所示,由編碼器產(chǎn)生的位流具有分層結(jié)構(gòu),其中,最低層位流包含在更高層位流中。
采用這種分層結(jié)構(gòu)的音頻信號從更重要的信號成分到更不重要的信號成分進行編碼。使用如此形成的位流,具有低位率的位流可以根據(jù)用戶=s的請求通過簡單地重新安排包含在具有最高位流的位流中的低位率位流來形成。換句話說,由編碼器實時形成的位流,或存儲在介質(zhì)中的位流可以進行重新安排,以適合根據(jù)用戶=s的請求所需的位流,然后進行發(fā)送。另外,如果甚至用適當?shù)奈涣鳎脩簦絪的硬件性能都太差或用戶想要降低解碼器的復雜度,僅有一些位流可以進行恢復,從而控制復雜度。
例如,當位率選擇為64Kbps時,位流從預定基層開始構(gòu)成,到頂層為64Kbps。因此,在形成可伸縮位流時,基層的位率為16Kbps,頂層的位率為64Kbps,并且各個增強層的位率間隔為8Kbps,也就是,位流具有7層,分別為16、24、32、40、48、56和64Kbps。由于由編碼器形成的位流具有分層結(jié)構(gòu),64Kbps的頂層位流包含各層的位流(16、24、32、40、48、56和64Kbps)。如果用戶請求頂層的數(shù)據(jù),頂層的位流進行發(fā)送,而不作對其的任何處理。另外,如果另一用戶請求基層的數(shù)據(jù)(對應(yīng)于16Kbps),僅有最前的位流進行簡單的發(fā)送。
各層根據(jù)位率具有受限帶寬,并且結(jié)束量化頻帶不同。當輸入數(shù)據(jù)是以48KHz采樣的PCM數(shù)據(jù),并且一幀的數(shù)量級為1024時,位率為64Kbps的可用于一幀的位數(shù)平均為1365.3333(=64,000位/秒*(1024/48000))。類似地,可用于一幀的位數(shù)可以根據(jù)各個位率進行計算。
當選擇提取率時,所選提取率的頂層位率得到確定,并且因此,位流根據(jù)分層BSAC方法由編碼過程以所選位率間隔從基層到目標層位率進行生成。
同時,如圖10所示,解碼器包括位流分析部分37e、逆量化部分37f和頻率/時間映射部分37g。
位流分析部分37e以生成各層的次序執(zhí)行解碼過程。另外,位流分析部分37e以各個位流的位的重要度的次序執(zhí)行各層的解碼過程。
逆量化部分37f將由位流分析部分37e解碼的數(shù)據(jù)恢復為原始數(shù)量級的信號。
頻率/時間映射部分37g將頻域中的逆量化的音頻信號轉(zhuǎn)換為時域中的信號。
解碼信號通過D/A轉(zhuǎn)換器轉(zhuǎn)換為模擬信號,并且在播放過程中通過輸出終端47輸出。
如上所述,根據(jù)本發(fā)明的音頻編輯方法以及采用該編輯方法的記錄介質(zhì),和數(shù)字音頻播放器,由于音頻數(shù)據(jù)文件能以任意尺度進行有效編輯,數(shù)字音頻設(shè)備的存儲器容量可以得到更有效的利用。
權(quán)利要求
1.一種數(shù)字內(nèi)容回放裝置,該裝置包含接收器,被配置來接收已編碼的數(shù)字內(nèi)容;位片運算編碼(BSAC)解碼器,用來對所接收的數(shù)字內(nèi)容進行解碼;逆量化器,用來對已解碼的數(shù)字內(nèi)容進行逆量化;頻率/時間映射器,用于將已逆量化的數(shù)字內(nèi)容從頻域轉(zhuǎn)換到時域。
2.如權(quán)利要求1所述的裝置,其中所述已編碼的數(shù)字內(nèi)容為BSAC格式。
3.如權(quán)利要求1所述的裝置,其中所述已編碼的數(shù)字內(nèi)容為不同于BSAC的格式。
4.如權(quán)利要求3所述的裝置,其中所述回放裝置還包含BSAC編碼器,其中該BSAC編碼器將已編碼的數(shù)字內(nèi)容轉(zhuǎn)換為BSAC格式;BSAC解碼器,用來對所述BSAC格式的數(shù)字內(nèi)容進行解碼。
5.如權(quán)利要求1所述的裝置,其中所述BSAC編碼器(或編解碼器)被配置來將所接收的數(shù)字內(nèi)容截斷為BSAC格式的數(shù)字數(shù)據(jù)。
6.如權(quán)利要求1所述的裝置,其中該裝置是便攜式數(shù)字內(nèi)容回放裝置。
7.一種數(shù)字內(nèi)容回放裝置,該裝置包含接收器,被配置來接收已編碼的數(shù)字內(nèi)容;解碼器,用來通過選擇性地對表示已編碼數(shù)字內(nèi)容的位進行解碼而對數(shù)字內(nèi)容進行解碼,其中所述位按照重要性的順序重新排列,并且格式化為多個層,按照每個所述層生成的順序以及按照每一位的重要性的順序選擇性地對所述位進行解碼;逆量化器,用來對已解碼的數(shù)字內(nèi)容進行逆量化;頻率/時間映射器,用于將已逆量化的數(shù)字內(nèi)容從頻域轉(zhuǎn)換到時域。
8.如權(quán)利要求7所述的裝置,其中所述已編碼的數(shù)字內(nèi)容為BSAC格式。
9.如權(quán)利要求7所述的裝置,其中所述已編碼的數(shù)字內(nèi)容為不同于BSAC的格式。
10.如權(quán)利要求9所述的裝置,其中所述回放裝置還包含BSAC編碼器,其中該BSAC編碼器將已編碼的數(shù)字內(nèi)容轉(zhuǎn)換為BSAC格式;BSAC解碼器,用來對所述BSAC格式的數(shù)字內(nèi)容進行解碼。
11.如權(quán)利要求7所述的裝置,其中所述BSAC編碼器(或編解碼器)被配置來將所接收的數(shù)字內(nèi)容截斷為BSAC格式的數(shù)字數(shù)據(jù)。
12.如權(quán)利要求7所述的裝置,其中該裝置是便攜式數(shù)字內(nèi)容回放裝置。
13.一種數(shù)字內(nèi)容回放裝置,該裝置包含接收器,被配置來接收數(shù)字內(nèi)容;編碼器,用來通過將表示所接收的數(shù)字內(nèi)容的位按照重要性的順序重新排列并且根據(jù)每一位的重要性的順序?qū)⑦@些位格式化為多個層而對數(shù)字內(nèi)容進行編碼;以及存儲器,用來存儲已編碼的數(shù)字內(nèi)容。
14.如權(quán)利要求13所述的裝置,其中所述已編碼的數(shù)字內(nèi)容為BSAC格式。
15.如權(quán)利要求13所述的裝置,其中所述已編碼的數(shù)字內(nèi)容為不同于BSAC的格式。
16.如權(quán)利要求15所述的裝置,其中所述回放裝置還包含BSAC編碼器,其中該BSAC編碼器將已編碼的數(shù)字內(nèi)容轉(zhuǎn)換為BSAC格式;BSAC解碼器,用來對所述BSAC格式的數(shù)字內(nèi)容進行解碼。
17.如權(quán)利要求13所述的裝置,其中所述BSAC編碼器(或編解碼器)被配置來將所接收的數(shù)字內(nèi)容截斷為BSAC格式的數(shù)字數(shù)據(jù)。
18.如權(quán)利要求13所述的裝置,其中該裝置是便攜式數(shù)字內(nèi)容回放裝置。
19.一種數(shù)字內(nèi)容回放裝置,該裝置包含接收器,被配置來接收已編碼的數(shù)字內(nèi)容,其中該數(shù)字內(nèi)容以不同于BSAC的格式編碼;BSAC編解碼器,包含BSAC編碼器與BSAC解碼器,其中BSAC編碼器將所接收的數(shù)字內(nèi)容轉(zhuǎn)換為BSAC格式,BSAC解碼器對BSAC格式的數(shù)字內(nèi)容進行解碼;逆量化器,用來對已解碼的數(shù)字內(nèi)容進行逆量化;頻率/時間映射器,用于將已逆量化的數(shù)字內(nèi)容從頻域轉(zhuǎn)換到時域。
20.如權(quán)利要求19所述的裝置,其中所述已編碼的數(shù)字內(nèi)容為BSAC格式。
21.如權(quán)利要求19所述的裝置,其中所述已編碼的數(shù)字內(nèi)容為不同于BSAC的格式。
22.如權(quán)利要求21所述的裝置,其中所述回放裝置還包含BSAC編碼器,其中該BSAC編碼器將已編碼的數(shù)字內(nèi)容轉(zhuǎn)換為BSAC格式;BSAC解碼器,用來對所述BSAC格式的數(shù)字內(nèi)容進行解碼。
23.如權(quán)利要求19所述的裝置,其中所述BSAC編碼器(或編解碼器)被配置來將所接收的數(shù)字內(nèi)容截斷為BSAC格式的數(shù)字數(shù)據(jù)。
24.如權(quán)利要求19所述的裝置,其中該裝置是便攜式數(shù)字內(nèi)容回放裝置。
25.一種數(shù)字內(nèi)容回放裝置,該裝置包含接收器,被配置來接收已編碼的數(shù)字內(nèi)容;解碼器,用來通過選擇性地對表示已編碼數(shù)字內(nèi)容的位進行解碼而對數(shù)字內(nèi)容進行解碼,其中所述位按照重要性的順序重新排列,并且格式化為多個層,其中每個層都包含一組重要性順序相同的位,根據(jù)所選擇的位率以及根據(jù)在每個層中包含的位的重要性順序,至少一個層被選擇用來解碼,解碼器按照所述多個層生成的順序?qū)λx擇的層進行解碼;逆量化器,用來對已解碼的數(shù)字內(nèi)容進行逆量化;頻率/時間映射器,用于將已逆量化的數(shù)字內(nèi)容從頻域轉(zhuǎn)換到時域。
全文摘要
一種數(shù)字內(nèi)容回放裝置,包含接收器,被配置來接收已編碼的數(shù)字內(nèi)容;位片運算編碼(BSAC)解碼器,用來對所接收的數(shù)字內(nèi)容進行解碼;逆量化器,用來對已解碼的數(shù)字內(nèi)容進行逆量化;頻率/時間映射器,用于將已逆量化的數(shù)字內(nèi)容從頻域轉(zhuǎn)換到時域。
文檔編號G10L19/00GK1783299SQ20051010844
公開日2006年6月7日 申請日期2001年11月6日 優(yōu)先權(quán)日2001年3月2日
發(fā)明者金弘基, 崔盛必 申請人:布陸泰科株式會社
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1