專利名稱:對音頻信號進行編碼、解碼和傳輸?shù)姆椒ㄒ约皞鬏斚到y(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及信號傳輸,具體涉及音頻信號的編碼、解碼和傳輸方 法及系統(tǒng)。
背景技術(shù):
一個信號傳輸系統(tǒng)一般包括一個發(fā)送器和一個接收器。對于一個
具有固定采樣率Fs的數(shù)字信號,例如, 一個數(shù)字音頻信號,在傳輸 時被分成連續(xù)的幀,每個幀包含一些信息包,'每個信息包有N (N〉l)bits,每個幀至少要包含同步信息。發(fā)送器將這些連續(xù)的被分 成幀的數(shù)字信號,編碼成一定的格式,然后通過一個傳輸媒介發(fā)送到 接收器,接收器接收到信號后經(jīng)過解碼生成相應(yīng)的數(shù)字信號。
上面描述的傳輸系統(tǒng)可以從"The Critical Band Coder-Digital Encoding of Speech signals based on the Perceptual requirements of the Auditory System" by M. E. Krasner in Proc. IEEE ICASSP 80, Vol.1, pp 327-331, Apr. 9-11, 1980.得到更 詳細的描述。這篇文章描述了一個傳輸系統(tǒng),傳輸系統(tǒng)包括一個發(fā)送 器和一個接收器,發(fā)送器有一個子帶編碼系統(tǒng),接收器有一個相應(yīng)的 子帶解碼系統(tǒng)。
上面所描述的傳輸系統(tǒng)中,音頻信號被分成一些子段,這些子段 的寬度和人耳聽覺的關(guān)鍵頻段近似上一致。這樣劃分是因為根據(jù)心理 聲學(xué)試驗,如果允許利用人耳的噪聲屏蔽曲線,這樣劃分的子段量化 噪聲可以更好的被信號屏蔽。
然后,這些子帶信號被加窗,加了窗的時域數(shù)字信號被變換到相
應(yīng)的頻域,經(jīng)過變換后的信號被量化編碼成某種格式的信號,通過某
種媒介(例如廣播,衛(wèi)星,存儲設(shè)備等等)進行傳輸。接收端接收到信
號后經(jīng)過反變換、解碼和反量化,得到相應(yīng)的數(shù)字信號。
現(xiàn)有的傳輸信號的方法,對于所有類型的信號,其基本的編碼、 傳輸和解碼的過程基本上都是相同的,例如相同的比特率的信號釆用
的屏蔽閾值都是相同的,在某些環(huán)節(jié),可能存在一些選擇,例如,在 多聲道編碼中利用信號的某些特征來選擇各聲道單獨編碼還是立體 聲編碼,但是這個信號特征僅僅用于某一個環(huán)節(jié),不能使用它來優(yōu)化 其他的環(huán)節(jié)?,F(xiàn)有技術(shù)中也有的使用了根據(jù)信號的變化來區(qū)分信號是 平緩的還是劇烈變化的,然后根據(jù)此來優(yōu)化編解碼,此種技術(shù)雖然能 根據(jù)具體的信號特征來優(yōu)化編解碼,但是信號類型劃分過于單一,不 能充分進行優(yōu)化,能優(yōu)化的環(huán)節(jié)也不多,僅局限于一兩個環(huán)節(jié)。
現(xiàn)有的技術(shù)不能才艮據(jù)不同的信號來調(diào)整編碼解碼,或者能調(diào)整的 步驟有限,僅僅局限于一個階段,或者調(diào)整的根據(jù)過于粗糙,例如編 解碼不能才艮據(jù)信號的特點來調(diào)整屏蔽閾值,造成了編碼中仍然含有冗 余信息。這種對所有類型的信號都相同的編解碼方法不可能對一個特 定的信號做到盡可能的編解碼優(yōu)化,因為它沒有利用信號的特點來進 一步的減少冗余信息,提高音頻質(zhì)量,所以這樣的編解碼是可以進一 步優(yōu)化的。還有一些技術(shù)雖然能根據(jù)信號特征來優(yōu)化編解碼,但信號 特征劃分過于粗糙,對信號特征的利用也不夠充分。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問題是,針對現(xiàn)有技術(shù)的缺陷,提出一種能 根據(jù)不同的具體的信號來調(diào)整編碼、解碼的方法,以及在此基本上提 出 一種根據(jù)不同的具體的信號來調(diào)整編碼解碼的信號傳輸方法和傳 輸系統(tǒng),能進一步優(yōu)化編解碼。
本發(fā)明中的對音頻信號進行編碼的方法,是在將音頻信號進行模 數(shù)轉(zhuǎn)換后通過分形分析器計算預(yù)定時間段的數(shù)字信號的分形指數(shù),然 后根據(jù)分形指數(shù)確定信號類型以及生成控制信號,對編碼處理過程進 行控制。
所述編碼處理過程包括變換、量化和編碼,在編碼時將控制信號
編入位流;對多聲道信號,根據(jù)各聲道的分形指數(shù)差值確定對信號編 碼的類型。
所述編碼過程還可以包括對才莫數(shù)轉(zhuǎn)換后的信號進行加窗處理;所 述加窗處理的窗的形狀由信號的分形指數(shù)決定。
所述編碼過程還可以包括對信號進行心理聲學(xué)處理,即根據(jù)設(shè)定 的屏蔽閾值對與聽覺無關(guān)的信號進行刪除或衰減,其屏蔽闊值是根據(jù) 信號的分形指數(shù)進行選擇的。
進一步可以將一段時間內(nèi)信號的分形指數(shù)分成若干個數(shù)值段,對 分形指數(shù)不同數(shù)值段的信號分別選用不同的屏蔽閾值。
本發(fā)明中的 一種傳輸音頻信號的方法,在現(xiàn)有技術(shù)的在將音頻信 號進行模數(shù)轉(zhuǎn)換后通過編碼器進行編碼處理,然后通過媒介傳送到接 收端,再在接收端通過解碼器進行解碼處理后進行數(shù)模轉(zhuǎn)換的基礎(chǔ) 上,在發(fā)送端將信號模數(shù)轉(zhuǎn)換后,通過分形分析器計算預(yù)定時間段的 數(shù)字信號的分形指數(shù),然后根據(jù)分形指數(shù)確定信號類型以及生成控制 信號,對編碼器的編碼處理過程進行控制。
本發(fā)明的技術(shù)方案,對多聲道信號,通過分形分析器計算預(yù)定的 相同時間段的每一聲道信號的分形指數(shù),并根據(jù)這些各聲道的分形指 數(shù)確定信號類型以及生成控制信號。
本發(fā)明的技術(shù)方案中,所述編碼器的編碼處理過程包括變換、量 化和編碼,在編碼時將控制信號編入位流;所述解碼器的解碼處理過
程包括解碼、反量化和反變換,解碼時同時解出控制信號;根據(jù)信號 類型生成控制信號控制量化的步長;對多聲道信號,根據(jù)各聲道的分 形指數(shù)確定對信號編碼的類型。
所述編碼器的編碼過程還可以包括對模數(shù)轉(zhuǎn)換后的信號進行加 窗處理,在解碼處理過程中還包括綜合窗處理;加窗處理的窗的形狀 由信號的分形指數(shù)決定。
所述編碼器的編碼過程還可以包括對信號進行心理聲學(xué)處理,即 根據(jù)設(shè)定的屏蔽闞值對與聽覺無關(guān)的信號進行刪除或衰減,其屏蔽閾 值是根據(jù)信號的分形指數(shù)進行選擇的。
進一步地,可以將一段時間內(nèi)信號的分形指數(shù)分成若干個數(shù)值 段,對分形指數(shù)不同數(shù)值段的信號分別選用不同的屏蔽闊值。
本發(fā)明的技術(shù)方案中,所述解碼器的解碼處理過程還包括均衡處 理,所述均衡處理的均衡模式根據(jù)信號的分形指數(shù)確定。
進一步地,可以將一段時間內(nèi)信號的分形指數(shù)分成若干個數(shù)值 段,對分形指數(shù)不同數(shù)值段的信號分別采用不同的均衡模式進行均衡 處理。
本發(fā)明中的對音頻信號進行解碼的方法,包括解碼、反量化和反 變換步驟,其特征在于,在解碼時同時解出接收的信號中在編碼過程 中編入的才艮據(jù)信號分形指數(shù)生成的控制信號。
上述解碼方法中還可以包括均衡處理,所述均衡處理的均衡模式 根據(jù)信號的分形指數(shù)確定。進一步將一段時間內(nèi)信號的分形指數(shù)分成 若干個數(shù)值段,對分形指數(shù)不同數(shù)值段的信號分別采用不同的均衡模 式進行均衡處理。
本發(fā)明中的一種對音頻信號進行傳輸?shù)南到y(tǒng),包括發(fā)送端和接收
端,所述接收端包括數(shù)轉(zhuǎn)換器和編碼器;所述發(fā)送端包括解碼器和數(shù) 模轉(zhuǎn)換器,其特征在于,還包括分形分析器;音頻信號在在發(fā)送端的 模數(shù)轉(zhuǎn)換器進行模數(shù)轉(zhuǎn)換后通過編碼器進行編碼處理,然后通過媒介 傳送到接收端,再在接收端通過解碼器進行解碼處理后進行數(shù)模轉(zhuǎn) 換;在發(fā)送端將信號模數(shù)轉(zhuǎn)換后,還通過分形分析器計算預(yù)定時間段 的數(shù)字信號的分形指數(shù),然后根據(jù)分形指數(shù)確定信號類型以及生成控 制信號,對編碼器的編碼處理過程進行控制。
利用本發(fā)明的方法和系統(tǒng),通過計算一個時間段的分形指數(shù),根 據(jù)分形指數(shù)來確定信號類型以及生成一些控制信號,并利用這些控制 信號來控制編解碼的多個環(huán)節(jié),可以對編碼更優(yōu)化。
圖l是本發(fā)明傳輸系統(tǒng)及傳輸流程圖2是對多聲道信號計算分形指數(shù)、確定信號類型和生成控制信 號示意圖3是本發(fā)明的一個實施例的具體流程圖4是一個具體實施例對雙聲道信號確定編碼類型的示意圖。
具體實施例方式
本發(fā)明的核心內(nèi)容是計算一段時間的信號的分形指數(shù),如果是多 聲道的信號,則分別計算各聲道在某個時間段內(nèi)的分形指數(shù),根據(jù)分 形指數(shù)確定各聲道信號的類型以及生成控制信號進行優(yōu)化編解碼。
先介紹一下序列的分形指數(shù)的計算方法,對于序列厶,設(shè)它的小 波變換為~/ , ~/ 滿足不等式
&2"(。+》J = yV_l,W-2,..JV-M,yUZ,其中不等式成立時最
大的"即為序列/ 的分形指數(shù)。N和M可以根據(jù)人耳的聽覺范圍來確 定,人耳能聽的音頻頻率一般來說在20Hz一20KHz之間,設(shè)使用的小 波函數(shù)為p,設(shè)Ap為小波函數(shù)p傅利葉變換的半徑,則N和M所決定 的頻率范圍是(2屈Ap,2'v"A》,選取合適的N和M,就可使小波變換的
頻率范圍為20Hz—20KHz。因為《 =(『")[4,4],設(shè)/ = " + %,所以
、2 2 〉
上述不等式等價于K^c2-",_/ = iV-l,iV-2".JV-M,yteZ ,取《=111—《'| 并對兩邊取對數(shù),則上述不等式又變?yōu)?br>
log2《Slog2c-yA_/ = W —2,…W-M ,設(shè)6; =log2《,6 = log2c,不等式 又變成J" +《= 1,7V —2".JV —M , i殳
巧=6_^_6^ = ^-1,^-2,..JV-M,最后問題變成求6和》,使得
!>J=I>-《)最小,求出6和〃,〃-j^即為y;的分形指數(shù)。
對音頻信號而言,設(shè)一個音頻序列為厶,先選取所用的小波函數(shù), 例如選用墨西哥帽小波函數(shù),設(shè)墨西哥帽小波函數(shù)的的傅利葉變換半
徑為A^,則M和N需要滿足下列條件
M < log2 (20/AM)-l;7V〉log2(20000/A^)-1。選取滿足上面條件的最大的 整數(shù)M和最小的整數(shù)N,則j的取值范圍為M—N。設(shè)音頻序列的采樣
點為L個,取k=L;對所有的j,k計算《=(『")[一,^| ,取《=max|《|
并對兩邊取對數(shù),則小波變換滿足的不等式變成
log2《S log2 c-_// ,_/ = 2,…W-M ,經(jīng)過上面所列的一系列變換,
最后轉(zhuǎn)變?yōu)橐粋€最小二乘問題,求出-, / -乂即為X的分形指數(shù)。
圖l是本發(fā)明的傳輸系統(tǒng)及傳輸流程圖。如圖所示,現(xiàn)有技術(shù)中 音頻信號的傳輸方法為, 一個音頻信號首先在模數(shù)轉(zhuǎn)換器12中被轉(zhuǎn) 換成數(shù)字信號,然后在編碼器13中進行編碼處理,編碼后的數(shù)據(jù)然
后通過媒介14(如廣播,電纜,光纜,存儲器件等)被傳輸?shù)浇邮?端,接收端接收到數(shù)據(jù)后,先在解碼器15中進行解碼處理,解碼出 來的信號最后在數(shù)^^莫轉(zhuǎn)換器16中經(jīng)過數(shù);f莫轉(zhuǎn)換還原為和輸入音頻近 似的信號。本發(fā)明是在現(xiàn)有技術(shù)的基礎(chǔ)上,在音頻信號進行模數(shù)轉(zhuǎn)換 后,通埤分形分析器18中計算某個時間段內(nèi)的數(shù)字信號的分形指數(shù), 然后根據(jù)分形指數(shù)確定信號類型以及生成控制信號,用控制信號來優(yōu) 化編解碼。在編碼時把控制信號同樣編入位流,解碼時解出信號類型, 根據(jù)信號類型進行解碼。
對多聲道的信號,如圖2所示,各分形指數(shù)計算單元21/23/24 計算各個聲道的分形指數(shù),控制信號生成單元22根據(jù)各聲道的分形 指數(shù)確定信號類型??刂菩盘柹蓡卧?5可以根據(jù)確定的信號類型 生成一些控制信號。
圖3是本發(fā)明的實施例的具體流程圖。圖3中的窗分析、變換、 心理聲學(xué)處理、量化、編碼等過程都是圖1中的編碼器編碼處理過程 的步驟。圖3中的解碼(解碼時把控制信號也解出來)、反量化、反 變換、綜合窗處理等過程,都是圖1中的解碼器解碼處理過程的步驟。
例一對于錄制并播放一個雙聲道的音樂信號,如圖3所示,首 先音樂信號在模數(shù)轉(zhuǎn)換器31中被轉(zhuǎn)換成數(shù)字信號,數(shù)字信號在分析 窗32中經(jīng)過加窗重組,同時數(shù)字信號被送入分形分析器314中,分 形分析器計算某段時間內(nèi)的信號的分形指數(shù)并根據(jù)分形指數(shù)生成一 些控制信號控制如立體聲編碼的類型,量化的方式等等。下面具體介 紹一下如何生成這些控制信號。先介紹一下如何通過分形指數(shù)確定立 體聲編碼的類型。如圖4所示,對于雙聲道的信號,在兩個分形指數(shù) 計算單元41和43中分別計算兩個聲道的分形指數(shù),然后在立體聲編 碼選擇控制器42中根據(jù)兩個聲道的分形指數(shù)的差別決定立體聲的編 碼類型,如果兩個聲道的分形指數(shù)相差較小,小于一個事先給定的值, 則采用MS立體聲編碼;如果兩個聲道的分形指數(shù)相差比較大,大于
一個事先給定的值,則采用雙聲道編碼的方法。這樣做是因為MS立
體聲在各聲道信號相近的情況下編碼效率較高,在各聲道信號相差較 大的情況下編碼效率不高,而分形指數(shù)表示的是信號的類型,類型相 近,則分形指數(shù)差別較小,類型差別大,則分形指數(shù)差別較大,所以 分形指數(shù)相近可以表示各聲道的信號相近,分形指數(shù)相差大可以表示 各聲道的信號差距較大,因此可以根據(jù)分形指數(shù)的差別來決定立體聲 編碼的類型。
數(shù)字信號被加窗后在變換單元33中進行變換,得到頻域的信號,
然后在心理聲學(xué)處理單元34中根據(jù)心理聲學(xué)模型和屏蔽閾值進行裁
減,刪除或衰減與聽覺無關(guān)的信號。下面介紹如何根據(jù)分形指數(shù)選擇
不同的屏蔽閾值進行心理聲學(xué)處理,即根據(jù)設(shè)定的屏蔽閾值對與聽覺
無關(guān)的信號進行刪除或衰減。如圖2所示,根據(jù)分形指數(shù)得到信號類
型,根據(jù)信號類型生成一些控制信號,包括屏蔽閾值選擇控制信號。
不同的音頻信號,其屏蔽閾值也不相同,現(xiàn)有的屏蔽闊值一般是根據(jù) 采樣頻率和比特率進行選擇的,對于相同的采樣率和比特率的信號采
用的屏蔽閾值都是相同的,沒有根據(jù)信號的不同來進一步進行優(yōu)化。 而本發(fā)明可以根據(jù)信號的分形指數(shù)來確定信號的類型,譬如把某個時 間段的信號的分形指數(shù)的取值范圍劃分成幾個數(shù)值段,根據(jù)一個時間 段的分形指數(shù)位于哪個段中來確定這個時間段的信號的類型,再根據(jù) 信號類型選用對應(yīng)的屏蔽閾值,給出屏蔽閾值控制信號。舉個例子來 說,設(shè)分形指數(shù)的取值范圍是(a, b),其中0〈a〈b,把(a, b)分 成4個段,a-al, al-a2, a2-a3, a3-b,這四個段對應(yīng)的信號類型分 別是j,k, l和m,也可以給j, k等取個名字,譬如藍調(diào),布魯斯等 等,當(dāng)然也可以采用其它的信號類型劃分。分形指數(shù)在a-al的信號 認為是一個相同的類型,采用相同的經(jīng)過優(yōu)化的屏蔽閾值,在其他范 圍亦是如此,采用經(jīng)過根據(jù)信號類型專門優(yōu)化的屏蔽閾值,可以進一 步減少和人耳聽覺效果無關(guān)的信息量,從而在不影響聽覺質(zhì)量的情況 下進一步提高壓縮效率。如果某個時間段的信號的分形指數(shù)是d,而 且al〈d〈a2,那么這個時間段的信號對應(yīng)的信號類型則是k,則選用 信號類型k對應(yīng)的屏蔽閾值,給出屏蔽闊值選擇控制信號。
經(jīng)過裁減處理過的信號在量化器35中進行量化,量化使用指數(shù)量 化,根據(jù)某個時間段內(nèi)的信號的最大值決定量化步長,量化后的信號 在編碼單元36中被編碼,某個時間段內(nèi)根據(jù)分形指數(shù)得到的控制信
號也被編入碼流編碼數(shù)據(jù)在傳輸媒介中被儲存在存儲設(shè)備上。
在播;故時,首先在解碼單元38中進行解碼,解碼時需要先解出控 制信號,解碼4艮據(jù)立體聲控制信號進行解碼,解碼的結(jié)果在反量化單 元39中進行反量化,然后在反變換單元310中進行反變換,反變換 后在綜合窗311中被綜合窗重組,在隨后的均衡中根據(jù)均衡控制信號 自動選捧合適的均衡模式,在均衡器312中利用選擇的均衡模式進行 均衡處理,均衡控制信號同樣是由圖3中的分形分析器314給出的。 如圖2所示,均衡控制信號同樣是根據(jù)分形指數(shù)生成的,如同選擇屏 蔽閾值一樣,把某個時間段的信號的分形指數(shù)的取值范圍劃分成幾個 數(shù)值段,'再根據(jù)分形指數(shù)在哪個范圍確定信號的類型,然后根據(jù)類型 來選擇相應(yīng)的均衡模式,以達到更加悅耳的聽覺效果,比如信號類型 是搖滾,.那就選用搖滾的均衡模式,如果信號類型是鄉(xiāng)村音樂,就選 擇鄉(xiāng)村音樂得均衡模式,此處的信號類型可能不同于選擇屏蔽閾值時 的劃分。最后在數(shù)模轉(zhuǎn)換器313中通過DA就可以還原音樂信號。
例二對于一個數(shù)字廣播系統(tǒng)。首先廣播電臺的音頻信號通過模 數(shù)轉(zhuǎn)換器31轉(zhuǎn)換成為數(shù)字信號,數(shù)字信號被送入分形分析器314中, 分形分析器可以計算某段時間內(nèi)的信號的分形指數(shù)并且確定立體聲 編碼的類型,如圖4所示,對于雙聲道的信號,在兩個分形指數(shù)計算 單元41和43中分別計算兩個聲道的分形指數(shù),然后在立體聲編碼選 擇控制器42中根據(jù)兩個聲道的分形指數(shù)的差別決定立體聲的編碼類 型,如果兩個聲道的分形指數(shù)相差較小,則采用MS立體聲編碼;如 果兩個聲道得分形指數(shù)相差比較大,則采用雙聲道編碼的方法。因為 MS立體聲在各聲道信號相近的情況下編碼效率較高,在各聲道信號 相差較大的情況下編碼效率不高,而分形指數(shù)表示的信號的類型,類 型相近,則分形指數(shù)差別較小,類型差別大,則分形指數(shù)差別較大, 所以可以才艮據(jù)分形指數(shù)的差別來決定立體聲編碼的類型。同時,分形 分析器314給出加窗控制信號,根據(jù)加窗控制信號來選擇所加的窗的 形狀,譬如長窗還是短窗。信號所加的長窗具有較好的頻選特性,但 是量化造成的誤差會延伸到窗口外部,而短窗的頻選特性則比較糟 糕,但是短窗可以把誤差限制在窗口之內(nèi),有些類型的信號對頻選要 求比較嚴格,譬如頻率劇烈變化的,而有些類型的信號,對誤差比較 敏感,對于某一類型的信號,可以事先統(tǒng)計出人耳對每種類型的信號 是對頻率敏感還是對誤差敏感,計算出使用不同窗可能造成的頻率變
化和誤差,看人耳更不能忍受哪種偏差,如果人耳對頻率變化的忍受 能力超過對誤差的忍受能力,這表明人耳對誤差敏感,反之則表明人 耳對頻率敏感。因此可以根據(jù)信號類型來選擇所加窗口的類型,對頻 率敏感的使用長窗,對誤差敏感的使用短窗,這樣可以改善編碼效果。 加窗控制信號通過以下方法給出,在圖2中,首先才艮據(jù)分形指數(shù)在
控制信號生成單元22確定信號的類型,然后在控制信號生成單元25 生成控制信號后,對于對頻選要求比較嚴格的信號類型(此處的信號 類型可能不同于立體聲編碼方式控制信號出的劃分),選用長窗,對 誤差要求比較嚴格的,選用短窗,然后給出相應(yīng)的加窗控制信號。此 外,分形分析器314還生成量化控制信號,對于不同的信號,其頻譜 是不相同的,有的信號高頻含量較多,有的信號高頻含量比較少,因 為高頻信號的幅值通常都比較小,為了更好的還原音頻信號,量化時 的誤差不能過大,否則這些高頻信息可能丟失,對于含有高頻信息較 少的信號,則能允許較大的量化誤差。首先計算出某個時間段的各聲 道的分形指數(shù),同樣把這個時間段的信號的分形指數(shù)的取值范圍劃分 成幾個數(shù)值段,根據(jù)分形指數(shù)落在哪個段內(nèi)確定信號的類型,事先統(tǒng) 計出每種類型的信號是否含有較多的高頻信號,這種統(tǒng)計以高頻分量 所占的能量百分比為標準,譬如以5KHz以上的頻i普作為高頻分量, 計算某種類型的高頻分量的能量在整個信號中所占的百分比的期望 值。含有高頻信號較多的,需要采用精細的量化方式,例如使用較小 的量化步長,對于含有高頻信號較少的音頻信號,則采用較大的量化 步長。然后根據(jù)信號類型和事先統(tǒng)計出的百分比的期望值來確定是否 采用較精細的量化方法,具體為,設(shè)置一個百分比的閾值,對于高于 此閾值的信號類型釆用精細的量化方式,對于低于此閾值的信號類型 釆用較粗糙的量化方式,給出量化方式的控制信號。同時數(shù)字信號也 進入32,根據(jù)314所得的加窗控制信號進行相應(yīng)的加窗處理,信號 被加窗后在變換單元33中進行變換,得到頻域的信號,根據(jù)各聲道 分形指數(shù)確定的信號類型優(yōu)化心理聲學(xué)模型,選用優(yōu)化過的屏蔽閾 值,頻域信號在心理聲學(xué)處理單元34中根據(jù)優(yōu)化過的心理聲學(xué)模型 和屏蔽閾值進行裁減,刪除或衰減與聽覺無關(guān)的信號。經(jīng)過裁減處理 過的信號在量化器35中進行量化,量化使用根據(jù)量化控制信號來決 定量化步長,量化后的信號在編碼單元36中被編碼,編碼根據(jù)立體 聲編碼控制信號進行相應(yīng)的立體聲編碼,同時,某個時間段內(nèi)根據(jù)分
形指數(shù)得到的控制信號也被編入碼流,編碼數(shù)據(jù)在傳輸媒介37 (例
如電纜)中進行傳輸。在播;改時,首先在解碼單元38中進行解碼, 解碼時需要先解出 一系列的控制信號,然后根據(jù)立體聲編碼方式進行
解碼,解碼的結(jié)果在反量化單元39中進行反量化,反量化的步長通 過已經(jīng)解碼出來的量化控制信號確定,然后在反變換單元310中進行 反變換,反變換后在綜合窗311中被綜合窗重組,使用的窗函數(shù)根據(jù) 加窗控制信號確定,可以不進行均衡處理而直接iiX數(shù)模轉(zhuǎn)換器313 中,最后通過DA就可以還原音樂信號。
需要指出的是,以上介紹的實施例不構(gòu)成對本發(fā)明保護范圍的限
不需要創(chuàng)造性勞動的改進,以及用等同替換的方式進行的改進,都在 本發(fā)明的保護范圍之內(nèi)。
權(quán)利要求
1、一種對音頻信號進行編碼的方法,其特征在于,將音頻信號進行模數(shù)轉(zhuǎn)換后通過分形分析器計算預(yù)定時間段的數(shù)字信號的分形指數(shù),然后根據(jù)分形指數(shù)確定信號類型以及生成控制信號,對編碼處理過程進行控制。
2、 權(quán)利要求1所述的對音頻信號進行編碼的方法,其特征在于,所述編碼處理過程包括變換、量化和編碼,在編碼時將控制信號編入位流;對多聲道信號,根據(jù)各聲道的分形指數(shù)差值確定對信號編碼的 類型。
3、 權(quán)利要求1或2所述的對音頻信號進行編碼的方法,其特征 在于,所述編碼過程還包括對模數(shù)轉(zhuǎn)換后的信號進行加窗處理;所述 加窗處理的窗的形狀由信號的分形指數(shù)決定。
4、 權(quán)利要求1或2所述的對音頻信號進行編碼的方法,其特征 在于,所述編碼過程還包括對信號進行心理聲學(xué)處理,即根據(jù)設(shè)定的 屏蔽闊值對與聽覺無關(guān)的信號進行刪除或衰減,其屏蔽闊值是根據(jù)信 號的分形指數(shù)進行選擇的。
5、 權(quán)利要求4所述的對音頻信號進行編碼的方法,其特征在于, 進一步將一段時間內(nèi)信號的分形指數(shù)分成若干個數(shù)值段,對分形指數(shù) 不同數(shù)值段的信號分別選用不同的屏蔽闊值。
6、 一種對音頻信號進行解碼的方法,包括解碼、反量化和反變 換步驟,其特征在于,在解碼時同時解出接收的信號中在編碼過程中 編入的才艮據(jù)信號分形指數(shù)生成的控制信號。
7、 權(quán)利要求6所述的對音頻信號進行解碼的方法,其特征在于, 還包括均衡處理,所述均衡處理的均衡模式根據(jù)信號的分形指數(shù)確 定。
8、 權(quán)利要求7所述的對音頻信號進行解碼的方法,其特征在于,進一步將一段時間內(nèi)信號的分形指數(shù)分成若干個數(shù)值段,對分形指數(shù) 不同數(shù)值段的信號分別采用不同的均衡模式進行均衡處理。
9、 一種傳輸音頻信號的方法,在將音頻信號進行纟莫數(shù)轉(zhuǎn)換后通 過編碼器進行編碼處理,然后通過媒介傳送到接收端,再在接收端通過解碼器進行解碼處理后進行數(shù)一莫轉(zhuǎn)換,其特征在于在發(fā)送端將信 號模數(shù)轉(zhuǎn)換后,通過分形分析器計算預(yù)定時間段的數(shù)字信號的分形指 數(shù),然后才艮據(jù)分形指數(shù)確定信號類型以及生成控制信號,對編碼器的 編碼處理過程進行控制。
10、 權(quán)利要求9所述的傳輸音頻信號的方法,其特征在于,對多 聲道信號,通過分形分析器計算預(yù)定的相同時間段的每一聲道信號的 分形指數(shù),并根據(jù)各聲道的分形指數(shù)確定信號類型以及生成控制信 號。
11、 權(quán)利要求9或10所述的傳輸音頻信號的方法,其特征在于, 所述編碼器的編碼處理過程包括變換、量化和編碼,在編碼時將控制 信號編入位流;所述解碼器的解碼處理過程包括解碼、反量化和反變 換,解碼時同時解出控制信號;才艮據(jù)信號類型生成控制信號控制量化 的步長;對多聲道信號,才艮據(jù)各聲道的分形指數(shù)確定對信號編碼的類 型。
12、 權(quán)利要求11所述的傳輸音頻信號的方法,其特征在于,所 述編碼器的編碼過程還包括對模數(shù)轉(zhuǎn)換后的信號進行加窗處理,在解 碼處理過程中還包括綜合窗處理;加窗處理的窗的形狀由信號的分形 指數(shù)決定。
13、 權(quán)利要求11所述的傳輸音頻信號的方法,其特征在于,所 述編碼器的編碼過程還包括對信號進行心理聲學(xué)處理,即根據(jù)設(shè)定的 屏蔽閾值對與聽覺無關(guān)的信號進行刪除或衰減,其屏蔽閾值是根據(jù)信 號的分形指數(shù)進行選擇的。
14、 權(quán)利要求13所述的傳輸音頻信號的方法,其特征在于,進一步將一段時間內(nèi)信號的分形指數(shù)分成若干個數(shù)值段,對分形指數(shù)不 同數(shù)值段的信號分別選用不同的屏蔽閾值。
15、 權(quán)利要求11所述的傳輸音頻信號的方法,其特征在于,所 述解碼器的解碼處理過程還包括均衡處理,所述均衡處理的均衡模式 才艮據(jù)信號的分形指數(shù)確定。
16、 權(quán)利要求15所述的傳輸音頻信號的方法,其特征在于,進 一步將一段時間內(nèi)信號的分形指數(shù)分成若干個數(shù)值段,對分形指數(shù)不 同數(shù)值段的信號分別采用不同的均衡模式進行均衡處理。
17、 一種對音頻信號進行傳輸?shù)南到y(tǒng),包括發(fā)送端和接收端,所 述接收端包括數(shù)轉(zhuǎn)換器和編碼器;所述發(fā)送端包括解碼器和數(shù)模轉(zhuǎn)換 器,其特征在于,還包括分形分析器;音頻信號在在發(fā)送端的模數(shù)轉(zhuǎn)換器進行模數(shù)轉(zhuǎn)換后通過編碼器 進行編碼處理,然后通過媒介傳送到接收端,再在接收端通過解碼器 進行解碼處理后進行數(shù)模轉(zhuǎn)換;在發(fā)送端將信號模數(shù)轉(zhuǎn)換后,還通過 分形分析器計算預(yù)定時間段的數(shù)字信號的分形指數(shù),然后根據(jù)分形指 數(shù)確定信號類型以及生成控制信號,對編碼器的編碼處理過程進行控 制。
全文摘要
本發(fā)明公開了一種對音頻信號進行編碼、解碼和傳輸?shù)姆椒ㄒ约皞鬏斚到y(tǒng)。編碼方法是在將音頻信號進行模數(shù)轉(zhuǎn)換后通過分形分析器計算預(yù)定時間段的數(shù)字信號的分形指數(shù),然后根據(jù)分形指數(shù)確定信號類型以及生成控制信號,對編碼處理過程進行控制。解碼的同時解出控制信號并利用控制信號控制解碼過程。傳輸方法為將編碼處理過的信號通過媒介傳送到接收端,進行解碼處理后進行數(shù)模轉(zhuǎn)換。傳輸系統(tǒng)包括模數(shù)轉(zhuǎn)換器、編碼器、解碼器、數(shù)模轉(zhuǎn)換器和分形分析器。本發(fā)明通過計算一個時間段的分形指數(shù),根據(jù)分形指數(shù)來確定信號類型以及生成控制信號,并利用這些控制信號來控制編解碼的多個環(huán)節(jié),可以對編解碼更優(yōu)化。
文檔編號G10L19/00GK101174411SQ20071012440
公開日2008年5月7日 申請日期2007年11月2日 優(yōu)先權(quán)日2007年11月2日
發(fā)明者孫大鵬 申請人:炬力集成電路設(shè)計有限公司