亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

在速率可變的聲碼器中選擇編碼速率的方法和裝置的制作方法

文檔序號(hào):2821496閱讀:223來(lái)源:國(guó)知局
專利名稱:在速率可變的聲碼器中選擇編碼速率的方法和裝置的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種聲碼器。本發(fā)明尤其涉及在速率可變的聲碼器中確定話音編碼速率的新穎的和經(jīng)改進(jìn)的方法。
背景技術(shù)
速率可變?cè)捯魤嚎s系統(tǒng)一般在開(kāi)始進(jìn)行編碼之前使用一些速率確定算法。這種速率確定算法把較高的比特率編碼方法賦予了有話音出現(xiàn)的音頻信號(hào)段,把較低的比特率編碼方法賦予無(wú)聲段。在這種方法中,可以實(shí)現(xiàn)較低的平均比特率,而重新構(gòu)成的話音仍保持較高質(zhì)量。因此,為了有效地進(jìn)行工作,速率可變的話音聲碼器需要一種健全的速率確定算法,以能在各種背景噪聲環(huán)境中區(qū)別話音和無(wú)聲。
在1991年6月11日申請(qǐng)的,名稱為“速率可變的聲碼器”的待批美國(guó)專利申請(qǐng)No.07/713/661中揭示了這樣一種速率可變的話音壓縮系統(tǒng)或速率可變的聲碼器,該專利申請(qǐng)已轉(zhuǎn)讓給本發(fā)明的受讓人,援引在此,以作參考。在這種速率可變的聲碼器的特定的實(shí)現(xiàn)方法中,用碼激勵(lì)線性預(yù)測(cè)編碼技術(shù)(CELP)以根據(jù)話音活動(dòng)性的程度確定的幾種速率中的一種速率對(duì)輸入話音進(jìn)行編碼。話音的活動(dòng)性程度根據(jù)除了有聲話音之外還可以包含背景噪聲的輸入音頻樣值內(nèi)的能量來(lái)確定。為了使聲碼器在各種背景噪聲下都提供高質(zhì)量的聲音編碼,需要一種合適的調(diào)整閾值的技術(shù)來(lái)補(bǔ)償背景噪聲對(duì)速率判定算法的影響。
聲碼器一般用在諸如蜂窩電話等通信設(shè)備或個(gè)人通信設(shè)備中,以對(duì)轉(zhuǎn)換成數(shù)字形式進(jìn)行傳輸?shù)哪M音頻信號(hào)進(jìn)行數(shù)字信號(hào)壓縮。在可以使用蜂窩電話或個(gè)人通信設(shè)備的移動(dòng)的環(huán)境中,高的背景噪聲能量使得用基于信號(hào)能量的速率確定算法難以把低能量的非嗓音聲音從低背景噪聲中區(qū)分開(kāi)來(lái)。因此,經(jīng)常對(duì)非嗓音聲音以較低的比特率進(jìn)行編碼,聲音質(zhì)量下降,諸如“s”、“x”、“ch”、“sh”、“t”等輔音在重新構(gòu)成的話音中被丟失。
根據(jù)僅把背景噪聲能量作為依據(jù)的速率判定的聲碼器在設(shè)定閾值時(shí)沒(méi)有考慮信號(hào)相對(duì)于背景噪聲的強(qiáng)度。當(dāng)背景噪聲提高時(shí),根據(jù)僅把背景噪聲作為依據(jù)的聲碼器必然會(huì)一起壓縮閾值。如果信號(hào)電平仍然維持不變,但設(shè)置閾值電平的校正方法是把信號(hào)電平與背景噪聲電平一起提升,那么,壓縮閾值電平不是最佳的解決方法。在速率可變的聲碼器內(nèi)需要另一種考慮了信號(hào)強(qiáng)度的設(shè)置閾值電平的方法。
剩余的決定性的問(wèn)題是在通過(guò)基于背景噪聲能量的速率判定聲碼器來(lái)播放音樂(lè)時(shí)產(chǎn)生的。當(dāng)人在說(shuō)話時(shí),他們必須暫停以便呼吸,這可以把閾值重新設(shè)置到適當(dāng)?shù)谋尘霸肼曤娖缴?。然而,在通過(guò)聲碼器傳輸時(shí),在音樂(lè)持續(xù)的情況下,沒(méi)有暫停發(fā)生,并且閾值將持續(xù)提高,一直到開(kāi)始對(duì)音樂(lè)以小于全速率的速率進(jìn)行編碼。在這種情況下,速率可變的編碼器把音樂(lè)與背景噪聲混為一談。

發(fā)明內(nèi)容
本發(fā)明是一種新穎的和經(jīng)改進(jìn)的在速率可變的聲碼器內(nèi)確定編碼速率的方法和裝置。本發(fā)明的第一個(gè)目的是提供一種方法,用這種方法可降低把低能量的非嗓音話音作為背景噪聲進(jìn)行編碼的概率。在本發(fā)明中,把輸入信號(hào)濾波成高頻分量和低頻分量。然后單獨(dú)地對(duì)輸入信號(hào)的濾波信號(hào)進(jìn)行分析,以檢測(cè)是否有話音的存在。因?yàn)榉巧ひ粼捯粲懈哳l分量,所以相對(duì)于高頻帶來(lái)說(shuō)其強(qiáng)度與背景噪聲相比的區(qū)別比在整個(gè)頻帶上與背景噪聲相比的區(qū)別來(lái)得更大。
本發(fā)明的第二個(gè)目的是提供一種裝置,這種裝置在設(shè)置閾值時(shí)考慮了信號(hào)能量以及背景噪聲能量。在本發(fā)明中,根據(jù)輸入信號(hào)的信噪比(SNR)的估計(jì)值來(lái)設(shè)定聲音檢測(cè)閾值。在一個(gè)典型的實(shí)施例中,把在存在話音期間的信號(hào)能量估計(jì)為最大信號(hào)能量,把在無(wú)聲期間的背景噪聲能量估計(jì)為最小信號(hào)能量。
本發(fā)明的第三個(gè)目的是提供一種通過(guò)速率可變的聲碼器對(duì)音樂(lè)進(jìn)行編碼的方法。在一個(gè)典型的實(shí)施例中,速率選擇裝置檢測(cè)閾值電平上升的連續(xù)幀的數(shù)量,并檢查幀數(shù)的周期。如果輸入信號(hào)是有周期性的,這表示存在音樂(lè)。如果檢測(cè)到有音樂(lè)存在,那么把閾值設(shè)置到以全速率對(duì)信號(hào)進(jìn)行編碼的電平上。
本發(fā)明提供一種為輸入信號(hào)選擇編碼速率的裝置,包括聲音信號(hào)檢測(cè)部件,用于判斷在所述輸入信號(hào)的各頻率副帶中是否存在聲音信號(hào);以及編碼速率選擇部件,用于根據(jù)對(duì)所述輸入信號(hào)的各頻率副帶中是否存在聲音信號(hào)的判斷來(lái)為所述輸入信號(hào)選擇編碼速率。
本發(fā)明還提供一種為輸入信號(hào)選擇編碼速率的方法,包括以下步驟接收所述輸入信號(hào);判斷在所述輸入信號(hào)的各頻率副帶中是否存在聲音信號(hào);以及根據(jù)對(duì)所述輸入信號(hào)的各頻率副帶中是否存在聲音信號(hào)的判斷來(lái)為所述輸入信號(hào)選擇所述編碼速率。


圖1是本發(fā)明的方框圖。
具體實(shí)施例方式
參見(jiàn)圖1,把輸入信號(hào)S(n)提供給副帶能量計(jì)算部件4和副帶能量計(jì)算部件6。輸入信號(hào)S(n)包含音頻信號(hào)和背景噪聲。音頻信號(hào)一般為話音,但也可以是音樂(lè)。在一個(gè)典型的實(shí)施例中,以每二十毫秒幀160樣值的形式提供S(n)。在一個(gè)典型的實(shí)施例中,輸入信號(hào)S(n)的頻率分量從0kHz到4kHz,大約與人的話音信號(hào)的帶寬相似。
在一個(gè)典型的實(shí)施例中,把4kHz的輸入信號(hào)S(n)濾波成兩個(gè)分立的副帶。這個(gè)分立的副帶分別在0到2kHz和2kHz到4kHz之間。在一個(gè)典型的實(shí)施例中,可以用副帶濾波器把輸入信號(hào)分成副帶,這種設(shè)計(jì)在已有技術(shù)中屬于熟知的技術(shù),并且在1994年2月1日提交的,名稱為“頻率選擇自適應(yīng)濾波”的美國(guó)專利申請(qǐng)No.08/189,819中有詳細(xì)的描述,該申請(qǐng)已轉(zhuǎn)讓給本發(fā)明的受讓人,援引在此以作參考。
對(duì)于低通濾波器,副帶濾波器的脈沖響應(yīng)表示為hL(n),對(duì)于高通濾波器,副帶濾波器的脈沖響應(yīng)表示為hH(n)??梢匀绗F(xiàn)有技術(shù)中所熟知的那樣,簡(jiǎn)單地取副帶濾波器輸出的樣值平方之和計(jì)算得到的信號(hào)的所產(chǎn)生的副帶分量的能量,給出RL(0)和RH(0)值。
在一個(gè)較佳實(shí)施例中,當(dāng)把輸入信號(hào)S(n)提供給副帶能量計(jì)算部件4時(shí),如下計(jì)算輸入幀的低頻分量的能量值RL(0)RL(0)=Rs(0)·RhL(0)+2·Σi=1L-1Rs(i)·RhL(i)---(1)]]>其中,L為具有脈沖響應(yīng)hL(n)的低通濾波器內(nèi)的抽頭數(shù),RS(i)為輸入信號(hào)S(n)的自相關(guān)函數(shù),它由下式給出RS(i)=Σn=1NS(n)·S(n-i),]]>對(duì)i∈
(2)其中,N為幀內(nèi)的樣值數(shù),RhL是低通濾波器hL(n)的自相關(guān)函數(shù),由下式給出RhL(i)=Σn=0L-1hL(n)·hL(n-i),]]>對(duì)i∈
(3)=0]]>其它在副帶能量計(jì)算部件6內(nèi)用相似的方式計(jì)算高頻能量RH(0)。
可以在減小計(jì)算負(fù)荷之前計(jì)算副帶濾波器的自相關(guān)函數(shù)的值。另外,把計(jì)算得到的一些RS(i)值在對(duì)輸入信號(hào)S(n)進(jìn)行編碼時(shí)的另一些計(jì)算中使用,這進(jìn)一步減輕了本發(fā)明的編碼速率選擇的方法的純計(jì)算負(fù)荷。例如,運(yùn)算LPC濾波器抽頭值需要計(jì)算一組輸入信號(hào)自相關(guān)系數(shù)。
對(duì)LPC濾波器抽頭值的計(jì)算在現(xiàn)有技術(shù)中是眾所周知的,并且在上面提到美國(guó)專利申請(qǐng)08/004,484中有詳細(xì)的描述。如果一種是用需要十個(gè)抽頭的LPC濾波器對(duì)話音進(jìn)行編碼,除了在對(duì)信號(hào)進(jìn)行編碼所用的之外,僅需要計(jì)算i值從11到L-1的RS(i)值,因?yàn)?,i值從0到10的RS(i)在計(jì)算LPC濾波器抽頭值時(shí)已經(jīng)使用了。在一個(gè)典型的實(shí)施例中,副帶濾波器具有17個(gè)抽頭,L=17。
副帶能量計(jì)算部件4向副帶速率判定部件12提供計(jì)算得到的RL(0)值,副帶能量計(jì)算部件6向副帶速率判定部件14提供計(jì)算得到的RH(0)值。速率判定部件12把RL(0)值與兩個(gè)預(yù)定的閾值TL1/2和TLfull作比較,把根據(jù)比較結(jié)果選定建議的編碼速率RATEL。速率的選定方式如下RATE=八分之一速率RL(0)≤TL1/2(4)
RATEL=半速率 TL1/2<RL(0)≤TLfull (5)RATEL=全速率 RL(0)>TLfull (6)副帶速率判定部件14以相似的方式工作,并根據(jù)高頻能量值RH(0)和一組不同的閾值TH1/2和THfull來(lái)選擇一建議的編碼速率。副帶速率判定部件12把其建議的編碼速率RATEL提供給編碼速率選擇部件16,副帶速率判定部件14把其建議的編碼速率RATEH提供給編碼速率選擇部件16。在一個(gè)典型的實(shí)施例中,編碼速率選擇部件16選擇兩個(gè)建議的速率中較高的一個(gè)速率,并把較高的速率作為選出的編碼速率(ENCODING RATE)提供。
副帶能量計(jì)算部件4還把低頻能量值RL(0)提供給閾值修正部件8,計(jì)算下一輸入幀的閾值TL1/2和TLfull。相似地,副帶能量計(jì)算部件6把高頻能量值RH(0)提供給閾值修正部件10,計(jì)算下一輸入幀的閾值TL1/2和Tlfull。
閾值修正部件8接收低頻能量值RL(0),并確定S(n)是否含有背景噪聲或音頻信號(hào)。在一個(gè)典型的實(shí)現(xiàn)方法中,閾值修正部件8確定是否有音頻信號(hào)存在的方法是檢查歸一化自相關(guān)函數(shù)NACF,它由下式給出NACF=maxTΣn=0N-1e(n)·e(n-T)12[Σn=0N-1e2(n)+Σn=0N-1e2(n-T)]---(7)]]>其中,e(n)為話音質(zhì)量的特性分量殘留信號(hào),它由LPC濾波器濾波輸入信號(hào)S(n)引起。
由LPC濾波器對(duì)信號(hào)濾波的設(shè)計(jì)在現(xiàn)有技術(shù)中是眾所周知的,并且在上面提及的美國(guó)專利申請(qǐng)08/004,484中有詳細(xì)的描述。LPC濾波器對(duì)輸入信號(hào)S(n)進(jìn)行濾波,除去話音質(zhì)量特性分量的相互影響。把NACF與閾值比較,確定是否出現(xiàn)了音頻信號(hào)。如果NACF大于預(yù)定的閾值,它指示輸入幀具有表示諸如話音或音樂(lè)的音頻信號(hào)存在的周期性特征。請(qǐng)注意,當(dāng)一部分話音和音樂(lè)不是周期性時(shí),表現(xiàn)出NACF的值較小,背景噪聲一般決不會(huì)顯示出周期性,因此NACF幾乎總是表現(xiàn)出較小的值。
如果確定S(n)包含背景噪聲,NACF值小于閾值TH1,那末把值RL(0)用于更新當(dāng)前背景噪聲估計(jì)值BGNL的值。在一個(gè)典型的實(shí)施例中,TH1為0.35。把RL(0)與當(dāng)前的背景噪聲估計(jì)值BGNL比較。如果RL(0)小于BGNL,那末不管NACF的值如何,總把背景噪聲估計(jì)值BGNL設(shè)置成等于RL(0)值。
背景噪聲估計(jì)值只有在NACF小于閾值TH1時(shí)才增加。如果RL(0)大于BGNL,并且NACF小于TH1,那么把背景噪聲能量BGNL設(shè)置成α1*BGL,其中,α1為大于1的數(shù)字。在一個(gè)典型的實(shí)施例中,α1等于1.03。只要NACF小于閾值TH1,并且RL(0)大于BGNL的當(dāng)前值,那末BGNL就繼續(xù)增加,直到BGNL到達(dá)預(yù)定的最大值BGNmax,在該點(diǎn)上,背景估計(jì)值BGNL被設(shè)置到BGNmax。
如果NACF值超過(guò)第二預(yù)定值TH2表示檢測(cè)到音頻信號(hào),則更新信號(hào)能量估計(jì)值SL。在一個(gè)典型的實(shí)施例中,TH2被設(shè)置成0.5。把RL(0)的值與當(dāng)前低通信號(hào)能量估計(jì)值SL比較。如果RL(0)大于當(dāng)前SL值,則把SL設(shè)置成等于RL(0)。如果RL(0)小于當(dāng)前SL值,而且僅在NACF大于TH2時(shí),把SL設(shè)置成等于α2*SL。在一個(gè)典型的實(shí)施例中,α2被設(shè)置為0.96。
然后,閾值修正部件8根據(jù)下面的等式8計(jì)算信噪比估計(jì)值SNRL=10·log[SLBGNL]---(8)]]>然后,閾值修正部件8根據(jù)下面的等式9-12確定量化了的信噪比ISNRL的指數(shù)ISNRL=nint[SNRL-205],]]>對(duì)20<SNRL<55 (9)=0,]]>對(duì)SNRL≤20,=7,]]>對(duì)SNRL≥55。
(10)其中nint是把小數(shù)值四舍五入到最近的整數(shù)的函數(shù)。
然后閾值修正部件8根據(jù)信噪比指數(shù)ISNRL選擇或計(jì)算兩個(gè)換算系數(shù)kL1/2/和kLfull。下面的表1提供了一個(gè)典型的換算值查找表表1ISNRLKL1/2 Klfull07.09.017.012.628.017.038.618.548.919.4
59.4 20.9611.025.5715.839.8這兩個(gè)值用于根據(jù)下面式子計(jì)算選擇速率的閾值TL1/2=KL1/2*BGNL(11)和TLfull=KLfull*BGNL(12)其中,TL1/2為低頻半速率閾值,TLfull為低頻全速率閾值。
閾值修正部件8向速率判定部件12提供修正后的閾值TL1/2和TLfull。閾值修正部件10以相似的方式工作,并向副帶速率判定部件14提供閾值TH1/2和THfull。
音頻信號(hào)能量估計(jì)值S的初始值(S可以是SL或SH)如下進(jìn)行設(shè)置。把初始信號(hào)能量估計(jì)值SINIT設(shè)置到-18.0dBm0,其中3.17dBm0表示全正弦波的信號(hào)強(qiáng)度,在一個(gè)典型的實(shí)施例中,它是一個(gè)幅度范圍從-8031到8031的數(shù)字正弦波。SINIT一直被使用,直到確定出現(xiàn)了有聲信號(hào)。
開(kāi)始檢測(cè)有聲信號(hào)的方法是把NACF值與一閾值比較,當(dāng)NACF在預(yù)定的連續(xù)數(shù)幀超過(guò)該閾值時(shí),則確定出現(xiàn)了有聲信號(hào)。在一個(gè)典型的實(shí)施例中,NACF必須連續(xù)10幀超過(guò)閾值。在這個(gè)條件得到滿足后,在前10幀把信號(hào)能量估計(jì)值S設(shè)置到最大信號(hào)能量。
最初把背景噪聲估計(jì)值BGNL的初始值設(shè)置成BGNmax。只要接收到的副帶幀能量小于BGNmax,就把背景噪聲估計(jì)值復(fù)位到接收到的副帶能量電平值上,并如上所述產(chǎn)生背景噪聲BGNL估計(jì)值。
在一個(gè)較佳實(shí)施例中,當(dāng)跟了一串全速率話音幀時(shí)產(chǎn)生釋放延遲情況,則檢測(cè)低速率幀。在一個(gè)典型的實(shí)施例中,當(dāng)在對(duì)四個(gè)連續(xù)的話音幀以全速率進(jìn)行編碼后跟一幅把編碼速率設(shè)置到小于全速率的速率,并且計(jì)算得到的信噪比小于預(yù)定最小的SNR的幀時(shí),把該幀的編碼速率設(shè)置到全速率。在一個(gè)典型的實(shí)施例中,如在公式8中定義的那樣,預(yù)定最小SNR為27.5dB。
在一較佳實(shí)施例中,釋放延遲的幀數(shù)是信噪比的函數(shù)。在一個(gè)典型的實(shí)施例中,釋放延遲的幀數(shù)如下確定
釋放延遲幀數(shù)=122.5<SNR<27.5 (13)釋放延遲幀數(shù)=2SNR≤22.5(14)釋放延遲幀數(shù)=0SNR≥27.5(15)本發(fā)明還提供一種檢測(cè)是否有音樂(lè)存在的方法,如上所述音樂(lè)缺少可以測(cè)量背景噪聲以進(jìn)行復(fù)位的暫停。該檢測(cè)音樂(lè)是否存在的方法假設(shè)在通話開(kāi)始時(shí)沒(méi)有出現(xiàn)音樂(lè)。這可以使本發(fā)明的編碼速率選擇裝置適當(dāng)?shù)毓烙?jì)初始背景噪聲能量BGNinit。因?yàn)橐魳?lè)不象背景噪聲具有周期性的特征,本發(fā)明檢查NACF的值來(lái)區(qū)別音樂(lè)和背景噪聲。本發(fā)明的音樂(lè)檢測(cè)方法根據(jù)下式計(jì)算平均NACFNACFAVE=1TΣi=1TNACF(i)---(16)]]>其中NACF由公式7定義,T為連續(xù)幀數(shù),在這些幀中估計(jì)的背景噪聲值從初始背景噪聲估計(jì)值BGNINIT已經(jīng)并正在增加。
如果背景噪聲BGN對(duì)預(yù)定的幀數(shù)T已經(jīng)增加,并且NACFAVE超過(guò)了預(yù)定閾值,那么檢測(cè)到了音樂(lè),把背景噪聲BGN復(fù)位到BGNinit。應(yīng)注意,為了使該方法可行,必須把值T設(shè)置得足夠小,以使編碼速率不低于全速率。因此,T值應(yīng)當(dāng)設(shè)置成有聲信號(hào)和BGNinit的函數(shù)。
提供了上面對(duì)較佳實(shí)施例的描述能使本技術(shù)領(lǐng)域的熟練人員實(shí)現(xiàn)或使用本發(fā)明。對(duì)于本技術(shù)領(lǐng)域的熟練人員來(lái)說(shuō)對(duì)這些實(shí)施例的各種變化是容易的,此處限定的一般原理可以應(yīng)用于其它實(shí)施例而無(wú)需創(chuàng)造性技能。因此,本發(fā)明并不限于此處所示的實(shí)施例,它被賦予與由此處的原理和新穎的特征相一致的最寬的范圍。
權(quán)利要求
1.一種為輸入信號(hào)(S(n))選擇編碼速率的裝置,其特征在于,包括聲音信號(hào)檢測(cè)部件,用于判斷在所述輸入信號(hào)(S(n))的各頻率副帶中是否存在聲音信號(hào);以及編碼速率選擇部件,用于根據(jù)對(duì)所述輸入信號(hào)(S(n))的各頻率副帶中是否存在聲音信號(hào)的判斷來(lái)為所述輸入信號(hào)(S(n))選擇編碼速率。
2.如權(quán)利要求1所述的裝置,其特征在于,所述聲音信號(hào)檢測(cè)部件包括多個(gè)副帶能量計(jì)算部件(4,6),用于確定所述輸入信號(hào)(S(n))的各頻率副帶的信號(hào)能量;以及多個(gè)閾值修正部件,各閾值修正部件耦合至所述多個(gè)副帶能量計(jì)算部件中的相應(yīng)的一個(gè),其中各閾值修正部件用于使用所指定的一個(gè)頻率副帶的信號(hào)能量來(lái)判斷在該指定的頻率副帶中是否存在聲音信號(hào)。
3.如權(quán)利要求2所述的裝置,其特征在于,所述編碼速率選擇部件配置成根據(jù)由所述多個(gè)閾值修正部件的每一個(gè)所作出的判斷來(lái)選擇所輸入信號(hào)(S(n))的編碼速率。
4.如權(quán)利要求3所述的裝置,其特征在于,所述多個(gè)閾值修正部件中的每一個(gè)根據(jù)所指定的頻率副帶的信號(hào)能量和背景噪聲估計(jì)值來(lái)確定一個(gè)閾值,該閾值用于判斷在該指定的頻率副帶中是否存在聲音信號(hào)。
5.如權(quán)利要求2所述的裝置,其特征在于,各閾值修正部件通過(guò)檢查歸一化的自相關(guān)函數(shù)來(lái)判斷聲音信號(hào)的存在,所述自相關(guān)函數(shù)由下式給出NACF=maxTΣn=0N-1e(n)·e(n-T)12[Σn=0N-1e2(n)+Σn=0N-1e2(n-T)]---(7)]]>其中,e(n)為輸入信號(hào)(S(n))被LPC濾波器濾波后得到的特性分量殘留信號(hào)。
6.如權(quán)利要求1所述的裝置,其特征在于,所述聲音信號(hào)檢測(cè)部件包括副帶濾波器子系統(tǒng)(4,6),用于確定所述輸入信號(hào)(S(n))的各頻率副帶的信號(hào)能量;所述編碼速率選擇部件包括速率選擇子系統(tǒng),用于根據(jù)所述輸入信號(hào)(S(n))的各頻率副帶的信號(hào)能量來(lái)選擇所述輸入信號(hào)(S(n))的編碼速率。
7.如權(quán)利要求1所述的裝置,其特征在于,所述編碼速率是為一可變速率聲碼器確定的,其中所述聲音信號(hào)檢測(cè)部件包括副帶能量計(jì)算裝置(4,6),用于接收所述輸入信號(hào)(S(n))并根據(jù)預(yù)定的副帶能量計(jì)算公式來(lái)確定多個(gè)副帶能量值(RL(0),RH(0))。
8.如權(quán)利要求7所述的裝置,其特征在于,所述編碼速率選擇部件包括副帶速率確定部件(12,14),用于接收所述多個(gè)副帶能量值(RL(0),RH(0)),并確定多個(gè)建議的副帶編碼速率。
9.如權(quán)利要求8所述的裝置,其特征在于,所述編碼速率選擇部件包括編碼速率選擇單元(16),用于接收所述多個(gè)建議的副帶編碼速率并根據(jù)所述多個(gè)建議的副帶編碼速率來(lái)確定所述編碼速率。
10.如權(quán)利要求7所述的裝置,其特征在于,所述多個(gè)副帶能量計(jì)算部件(4,6)根據(jù)下面的公式確定所述多個(gè)副帶能量值(RL(0),RH(0))中的每個(gè)副帶能量值 其中L為帶通濾波器hbp(n)內(nèi)的抽頭數(shù),RS(i)為輸入信號(hào)S(n)的自相關(guān)函數(shù),Rhbp為帶通濾波器hbp(n)的自相關(guān)函數(shù)。
11.如權(quán)利要求1所述的裝置,其特征在于,所述編碼速率是為一可變速率聲碼器確定的,其中所述裝置還包括信噪比部件(8,10),用于接收輸入信號(hào)(S(n))并根據(jù)所述輸入信號(hào)(S(n))來(lái)確定信噪比值。
12.如權(quán)利要求8所述的裝置,其特征在于,還包括置于所述副帶能量計(jì)算部件(4,6)和所述副帶速率確定部件之間的閾值計(jì)算部件,用于接收所述副帶能量值(RL(0),RH(0))并根據(jù)所述多個(gè)副帶能量值(RL(0),RH(0))來(lái)確定一組編碼速率閾值。
13.如權(quán)利要求11或12中任一項(xiàng)所述的裝置,其特征在于,所述閾值計(jì)算部件(8,10)根據(jù)所述多個(gè)副帶能量值(RL(0),RH(0))來(lái)確定所述信噪比值。
14.如權(quán)利要求13所述的裝置,其特征在于,所述閾值計(jì)算部件(8,10)根據(jù)所述信噪比值來(lái)確定一個(gè)換算值。
15.如權(quán)利要求14所述的裝置,其特征在于,所述閾值計(jì)算部件(8,10)通過(guò)將背景噪聲估計(jì)值乘以所述換算值來(lái)確定至少一個(gè)閾值。
16.如權(quán)利要求15所述的裝置,其特征在于,所述編碼速率選擇部件將至少一個(gè)所述多個(gè)副帶能量值(RL(0),RH(0))與所述至少一個(gè)閾值相比較,來(lái)確定所述編碼速率。
17.如權(quán)利要求7所述的裝置,其特征在于,所述編碼速率選擇部件確定多個(gè)建議的編碼速率,其中各建議的編碼速率對(duì)應(yīng)于所述多個(gè)副帶能量值(RL(0),RH(0))中相應(yīng)的一個(gè)副帶能量值,所述編碼速率選擇部件根據(jù)所述多個(gè)建議的編碼速率來(lái)確定所述編碼速率。
18.一種為輸入信號(hào)(S(n))選擇編碼速率的方法,其特征在于,包括以下步驟接收所述輸入信號(hào)(S(n));判斷在所述輸入信號(hào)的各頻率副帶中是否存在聲音信號(hào);以及根據(jù)對(duì)所述輸入信號(hào)(S(n))的各頻率副帶中是否存在聲音信號(hào)的判斷來(lái)為所述輸入信號(hào)(S(n))選擇所述編碼速率。
19.如權(quán)利要求18所述的方法,其特征在于,所述判斷在所述輸入信號(hào)的各頻率副帶中是否存在聲音信號(hào)的步驟還包括確定所述輸入信號(hào)(S(n))的各頻率副帶的信號(hào)能量;以及使用多個(gè)閾值修正部件中相應(yīng)的一個(gè)閾值修正部件所對(duì)應(yīng)的指定的頻率副帶的信號(hào)能量來(lái)判斷在該指定的頻率副帶中是否存在聲音信號(hào)。
20.如權(quán)利要求19所述的方法,其特征在于,所述選擇編碼速率的步驟包括根據(jù)由所述多個(gè)閾值修正部件的每一個(gè)所作出的判斷來(lái)選擇所輸入信號(hào)(S(n))的編碼速率。
21.如權(quán)利要求19或20中任一項(xiàng)所述的方法,其特征在于,使用信號(hào)能量的步驟包括在各所述多個(gè)閾值修正部件中根據(jù)所指定的頻率副帶的信號(hào)能量和背景噪聲估計(jì)值來(lái)確定一個(gè)閾值;使用該閾值用于判斷在該指定的頻率副帶中是否存在聲音信號(hào)。
22.如權(quán)利要求21所述的方法,其特征在于,使用閾值的步驟包括在各閾值修正部件中通過(guò)檢查歸一化的自相關(guān)函數(shù)來(lái)判斷聲音信號(hào)的存在,所述自相關(guān)函數(shù)由下式給出NACF=maxTΣn=0N-1e(n)·e(n-T)12[Σn=0N-1e2(n)+Σn=0N-1e2(n-T)]----(7)]]>其中,e(n)為輸入信號(hào)(S(n))被LPC濾波器濾波后得到的特性分量殘留信號(hào)。
23.如權(quán)利要求18所述的方法,其特征在于,所述判斷聲音信號(hào)是否存在的步驟包括使用副帶濾波器子系統(tǒng)(4,6)來(lái)確定所述輸入信號(hào)(S(n))的各頻率副帶的信號(hào)能量;所述選擇編碼速率的步驟包括在速率選擇子系統(tǒng)中根據(jù)所述輸入信號(hào)(S(n))的各頻率副帶的信號(hào)能量來(lái)選擇所述輸入信號(hào)(S(n))的編碼速率。
24.如權(quán)利要求18所述的方法,其特征在于,所述判斷聲音信號(hào)是否存在的步驟包括在副帶能量計(jì)算裝置(4,6)中接收所述輸入信號(hào)(S(n));以及根據(jù)預(yù)定的副帶能量計(jì)算公式來(lái)確定多個(gè)副帶能量值(RL(0),RH(0)),其中所述為所述輸入信號(hào)(S(n))選擇所述編碼速率的步驟包括根據(jù)所述多個(gè)副帶能量值來(lái)確定所述編碼速率的步驟。
25.如權(quán)利要求24所述的方法,其特征在于,所述選擇編碼速率的步驟還包括在副帶速率確定部件(12,14)中接收所述多個(gè)副帶能量值(RL(0),RH(0));以及確定多個(gè)建議的副帶編碼速率。
26.如權(quán)利要求25所述的方法,其特征在于,所述選擇編碼速率的步驟還包括在編碼速率選擇單元(16)中接收所述多個(gè)建議的副帶編碼速率;以及根據(jù)所述多個(gè)建議的副帶編碼速率來(lái)確定所述編碼速率。
27.如權(quán)利要求24所述的方法,其特征在于,所述確定多個(gè)副帶能量值的步驟根據(jù)下面的公式確定所述多個(gè)副帶能量值(RL(0),RH(0))中的每個(gè)副帶能量值 其中L為帶通濾波器hbp(n)內(nèi)的抽頭數(shù),RS(i)為輸入信號(hào)S(n)的自相關(guān)函數(shù),Rhbp為帶通濾波器hbp(n)的自相關(guān)函數(shù)。
28.如權(quán)利要求24所述的方法,其特征在于,還包括根據(jù)所述多個(gè)副帶能量值來(lái)確定一組編碼速率閾值。
29.如權(quán)利要求28所述的方法,其特征在于,所述確定一組編碼速率閾值的步驟根據(jù)所述多個(gè)副帶能量值來(lái)確定信噪比值。
30.如權(quán)利要求29所述的方法,其特征在于,所述確定一組編碼速率閾值的步驟根據(jù)所述信噪比值來(lái)確定一個(gè)換算值。
31.如權(quán)利要求30所述的方法,其特征在于,所述確定一組編碼速率閾值的步驟通過(guò)將背景噪聲估計(jì)值乘以所述換算值來(lái)確定所述速率閾值。
32.如權(quán)利要求24所述的方法,其特征在于,所述確定所述編碼速率的步驟將至少一個(gè)所述多個(gè)副帶能量值與至少一個(gè)閾值相比較,來(lái)確定所述編碼速率。
33.如權(quán)利要求31所述的方法,其特征在于,所述確定所述編碼速率的步驟將至少一個(gè)所述多個(gè)副帶能量值與所述至少一個(gè)閾值相比較,來(lái)確定所述編碼速率。
34.如權(quán)利要求24所述的方法,其特征在于,還包括根據(jù)所述多個(gè)副帶能量值中的每一個(gè)生成建議的編碼速率的步驟,并且所述確定編碼速率的步驟選擇所述建議的編碼速率中的一個(gè)。
35.如權(quán)利要求18所述的方法,其特征在于,還包括在信噪比部件(8,10)中接收所述輸入信號(hào)(S(n)),并根據(jù)所述輸入信號(hào)(S(n))來(lái)確定信噪比值;所述為所述輸入信號(hào)(S(n))選擇所述編碼速率的步驟包括在速率確定裝置中接收所述信噪比值的步驟,以及根據(jù)所述信噪比值來(lái)確定所述編碼速率的步驟。
全文摘要
本發(fā)明提供一種降低把低能量非嗓音話音作為背景噪聲進(jìn)行編碼的概率的方法。用數(shù)字副帶濾波器(4)和(6)把輸入信號(hào)分成副帶,在副帶速率判定部件(12)和(14)中把這些副帶中的能量與一組閾值比較,然后在編碼速率選擇器(16)內(nèi)檢查這些比較結(jié)果,通過(guò)這些步驟來(lái)確定編碼速率。用這種方法,可以把非嗓音話音與背景噪聲區(qū)別開(kāi)。本發(fā)明還提供一種用輸入信號(hào)的信噪比設(shè)置閾值電平的裝置,本發(fā)明還提供一種用速率可變的聲碼器對(duì)音樂(lè)進(jìn)行編碼的方法,它通過(guò)檢查輸入信號(hào)的周期性以把音樂(lè)與背景噪聲區(qū)別開(kāi)來(lái)。
文檔編號(hào)G10L19/14GK1512489SQ20041000166
公開(kāi)日2004年7月14日 申請(qǐng)日期1995年8月1日 優(yōu)先權(quán)日1994年8月10日
發(fā)明者安德魯·P·德雅克, 威廉·R·加德納, R 加德納, 安德魯 P 德雅克 申請(qǐng)人:夸爾柯姆股份有限公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1