用參數(shù)噪聲模型統(tǒng)計(jì)量產(chǎn)生舒適噪聲的方法及裝置的制作方法

文檔序號(hào)：2828953閱讀：286來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專(zhuān)利>樂(lè)器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專(zhuān)利名稱(chēng)：用參數(shù)噪聲模型統(tǒng)計(jì)量產(chǎn)生舒適噪聲的方法及裝置的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及通信系統(tǒng)，具體涉及通信系統(tǒng)中舒適噪聲的產(chǎn)生。
背景技術(shù)：
在數(shù)字無(wú)線通信系統(tǒng)(例如，蜂窩電話、陸上移動(dòng)無(wú)線電、衛(wèi)星電話、空中電話等系統(tǒng))中，接收無(wú)線電裝置有時(shí)需要產(chǎn)生低音量音頻噪聲。例如在數(shù)字無(wú)線電呼叫時(shí)，接收無(wú)線電裝置可能在一些期間暫時(shí)無(wú)法接收發(fā)射無(wú)線電裝置發(fā)來(lái)的有效語(yǔ)音信息。在這些期間需要接收無(wú)線電產(chǎn)生聽(tīng)得見(jiàn)的噪聲，這樣接收無(wú)線電裝置的用戶就不會(huì)誤認(rèn)為呼叫傳輸已經(jīng)中止。這樣的噪聲在本專(zhuān)業(yè)領(lǐng)域及下文中稱(chēng)之為舒適噪聲。
舒適噪聲的產(chǎn)生至少在兩個(gè)主要方面特別有利。首先，當(dāng)一個(gè)通信鏈路的狀態(tài)變得非常惡劣但仍可運(yùn)行時(shí)，有時(shí)最好將接收無(wú)線電裝置上的語(yǔ)音通路靜音，以防嚴(yán)重失真的語(yǔ)音傳給接收無(wú)線電裝置的用戶。但是由于接收機(jī)揚(yáng)聲器的完全靜音可導(dǎo)致接收用戶錯(cuò)誤的認(rèn)為鏈路已完全不能工作并且不可能恢復(fù)，因此接收無(wú)線電可產(chǎn)生和發(fā)出舒適噪聲來(lái)取代靜音。這樣做就可以告訴接收用戶接收機(jī)仍可運(yùn)行，同時(shí)可使他免受一般伴隨混濁語(yǔ)音出現(xiàn)的劈啪聲及人為噪聲的影響。
舒適噪聲在不連續(xù)傳輸(或稱(chēng)DTX)通信系統(tǒng)方面也相當(dāng)有用。在一些DTX系統(tǒng)中，發(fā)射機(jī)檢測(cè)呼出信號(hào)是否包含話音，當(dāng)它不包含話音時(shí)就中止或減少呼出信號(hào)的發(fā)送速度。在這樣的DTX期間，需要接收機(jī)發(fā)出某種舒適噪聲，這樣接收用戶就能察覺(jué)到發(fā)射機(jī)和接收機(jī)之間的通信通道仍開(kāi)通著可供使用。
不管在上述哪一方面，一般都要求接收機(jī)中產(chǎn)生的舒適噪聲與發(fā)射機(jī)中存在的背景噪聲盡可能接近地匹配。換句話說(shuō)，舒適噪聲的產(chǎn)生過(guò)程對(duì)接收用戶而言應(yīng)該是透明的。為此目的，可對(duì)存在于發(fā)射機(jī)中的背景噪聲進(jìn)行抽樣，并且可周期地將描述抽樣噪聲特征的一個(gè)或多個(gè)參數(shù)發(fā)送給接收機(jī)，用以產(chǎn)生匹配的舒適噪聲。但是，為此采用的傳統(tǒng)方法仍然會(huì)導(dǎo)致人工產(chǎn)生的舒適噪聲與自然發(fā)生的背景噪聲之間存在可察覺(jué)的差異。因此，有必要改進(jìn)在通信系統(tǒng)中產(chǎn)生噪聲的方法和裝置。
在一示范性實(shí)施例中，DTX發(fā)射機(jī)周期地估計(jì)多個(gè)背景噪聲頻譜幅度的平均值并隨后將其發(fā)送給DTX接收機(jī)，同時(shí)該DTX發(fā)射機(jī)還估計(jì)出單個(gè)的標(biāo)準(zhǔn)差值一起發(fā)送給DTX接收機(jī)。DTX接收機(jī)對(duì)周期收到的平均頻譜幅度在多個(gè)DTX幀上進(jìn)行平滑處理，并用收到的標(biāo)準(zhǔn)差對(duì)平滑處理后所得的值進(jìn)行抖動(dòng)處理。經(jīng)抖動(dòng)處理的平均值然后被用來(lái)在DTX接收機(jī)上產(chǎn)生舒適噪聲。
通過(guò)傳送平均頻譜幅度而不是頻譜幅度的瞬間值，該示范性實(shí)施例可防止將發(fā)射機(jī)中頻譜的隨機(jī)性引入接收機(jī)而造成尖峰頻譜偏差。此外，在接收機(jī)上對(duì)收到的多個(gè)幀的平均值進(jìn)行平滑處理，可以減小尖銳的、往往可察覺(jué)的頻譜過(guò)渡(這種現(xiàn)象在舒適噪聲更新頻度相對(duì)較低時(shí)發(fā)生)。另外用估計(jì)標(biāo)準(zhǔn)差對(duì)經(jīng)平滑處理的平均值進(jìn)行抖動(dòng)處理可逐幀地細(xì)微改變舒適噪聲的特征，結(jié)果越是隨機(jī)的頻譜因此會(huì)有聽(tīng)起來(lái)越自然的舒適噪聲。
一個(gè)依據(jù)本發(fā)明的作為示例的無(wú)線電發(fā)射機(jī)包括一個(gè)編碼器，用以對(duì)輸入的噪聲信號(hào)抽樣并提供被抽樣噪聲信號(hào)的參數(shù)模型作為輸出，該參數(shù)模型中包括描述被抽樣噪聲信號(hào)的至少一個(gè)模型化參數(shù)。該編碼器也提供一個(gè)與所述的至少一個(gè)模型化參數(shù)有關(guān)的統(tǒng)計(jì)量作為輸出，該統(tǒng)計(jì)量的階數(shù)高于每個(gè)模型化參數(shù)的階數(shù)。例如，該編碼器可以是多頻帶激勵(lì)編碼器、同態(tài)編碼器或者是正弦變換編碼器。此外參數(shù)模型可含有多個(gè)估計(jì)平均頻譜幅度，該統(tǒng)計(jì)量可以是估計(jì)平均頻譜幅度的估計(jì)標(biāo)準(zhǔn)差。為了增強(qiáng)信號(hào)的重構(gòu)，該編碼器可周期地對(duì)至少一個(gè)模型化參數(shù)和所述統(tǒng)計(jì)量進(jìn)行更新和濾波。
依據(jù)本發(fā)明的作為示例的無(wú)線電接收機(jī)包括一個(gè)舒適噪聲發(fā)生器，用于接收描述噪聲信號(hào)的至少一個(gè)噪聲模型化參數(shù)以及與所述至少一個(gè)噪聲模型化參數(shù)相關(guān)的統(tǒng)計(jì)量。統(tǒng)計(jì)量的階數(shù)高于每個(gè)噪聲模型化參數(shù)的階數(shù)，舒適噪聲發(fā)生器對(duì)所述的至少一個(gè)噪聲模型化參數(shù)和統(tǒng)計(jì)量進(jìn)行解碼以便向該無(wú)線電接收機(jī)的用戶提供舒適噪聲。例如，每個(gè)噪聲模型化參數(shù)可以是一個(gè)估計(jì)平均頻譜幅度，而統(tǒng)計(jì)量可以是所述的至少一個(gè)估計(jì)平均頻譜幅度的估計(jì)標(biāo)準(zhǔn)差。此外，舒適噪聲發(fā)生器可周期地接收并濾波所述至少一個(gè)噪聲模型化參數(shù)和統(tǒng)計(jì)量的更新值。舒適噪聲發(fā)生器還可以按照統(tǒng)計(jì)量對(duì)經(jīng)濾波的所述至少一個(gè)噪聲模型化參數(shù)的更新值進(jìn)行處理，以提供舒適噪聲。例如，舒適噪聲發(fā)生器可用一個(gè)估計(jì)標(biāo)準(zhǔn)差，對(duì)收到的經(jīng)濾波的平均頻譜幅度的更新值進(jìn)行抖動(dòng)處理。
下面對(duì)照附圖所示實(shí)例詳述本發(fā)明的上述與其它的特征與優(yōu)越性。本領(lǐng)域的技術(shù)人員將會(huì)完全了解，在這里描述的實(shí)施例旨在幫助說(shuō)明與理解，從中可以構(gòu)思出大量與上述實(shí)施例相當(dāng)?shù)膶?shí)施例。
附圖的簡(jiǎn)單說(shuō)明

圖1是DTX發(fā)射機(jī)示例的框圖，在該發(fā)射機(jī)中可實(shí)現(xiàn)本發(fā)明的背景噪聲模型化方法。
圖2是DTX發(fā)射機(jī)示例的框圖，在該發(fā)射機(jī)中可實(shí)現(xiàn)依據(jù)本發(fā)明的舒適噪聲生成方法。
圖3是關(guān)于示例語(yǔ)音信號(hào)以及DTX通信系統(tǒng)的DTX幀示例的相應(yīng)的定時(shí)的示圖，在該系統(tǒng)中本發(fā)明的方法可得以實(shí)現(xiàn)。
圖4是描述依據(jù)本發(fā)明的舒適噪聲產(chǎn)生方法示例中各步驟的流程圖。
圖5是依據(jù)本發(fā)明的舒適噪聲幀發(fā)生器示例的框圖。
圖6是描述DTX發(fā)射機(jī)中典型背景噪聲的多個(gè)頻譜幅度的時(shí)序圖。
圖7是描述DTX接收機(jī)中產(chǎn)生的舒適噪聲的多個(gè)頻譜幅度的時(shí)序圖。其中的頻譜幅度基于圖6中的頻譜幅度用先有技術(shù)的方法生成。
圖8是描述DTX發(fā)射機(jī)中背景噪聲的多個(gè)估計(jì)平均頻譜幅度的時(shí)序圖，該估計(jì)平均頻譜幅度依據(jù)本發(fā)明對(duì)圖6的頻譜幅度進(jìn)行濾波或平滑處理后得到。
圖9是描述DTX發(fā)射機(jī)中背景噪聲的多個(gè)頻譜幅度的時(shí)序圖，該頻譜幅度是在DTX接收機(jī)上收到的圖8的頻譜幅度，之后依據(jù)本發(fā)明對(duì)收到的頻譜幅度進(jìn)行濾波后得到。
圖10是描述DTX接收機(jī)中產(chǎn)生的舒適噪聲的多個(gè)頻譜幅度的時(shí)序圖，該頻譜幅度是依據(jù)本發(fā)明對(duì)圖9的頻譜幅度經(jīng)隨機(jī)化或抖動(dòng)處理之后得到。
圖11是描述DTX接收機(jī)中產(chǎn)生的改進(jìn)后的舒適噪聲的多個(gè)頻譜幅度的時(shí)序圖，該頻譜幅度是依據(jù)本發(fā)明圖10的頻譜幅度作濾波或平滑處理后得到。
本發(fā)明的詳細(xì)說(shuō)明下面所敘述的本發(fā)明的示范性實(shí)施例關(guān)系到不連續(xù)傳輸(DTX)通信系統(tǒng)。DTX被應(yīng)用于眾所周知的太平洋數(shù)字蜂窩式系統(tǒng)(PDC)、數(shù)字先進(jìn)移動(dòng)電話系統(tǒng)(D-AMPS，包括IS641A)、全球移動(dòng)通信系統(tǒng)(GSM)以及亞洲蜂窩式衛(wèi)星(ACeS)等標(biāo)準(zhǔn)中。公眾可獲得的上述每個(gè)標(biāo)準(zhǔn)的說(shuō)明資料中提供了詳細(xì)的針對(duì)各標(biāo)準(zhǔn)的DTX使用說(shuō)明。
在DTX范圍內(nèi)，后面對(duì)本發(fā)明的示范性實(shí)施例的描述還參照了最初由麻省理工學(xué)院開(kāi)發(fā)的著名的多頻帶激勵(lì)(MBETM)語(yǔ)音編碼算法。MBE算法(以及更新近的著名的后續(xù)算法IMBETM和AMBETM)在需要低比特速率(即4.8kbps以下)的數(shù)字通信系統(tǒng)中非常流行。例如，在衛(wèi)星電話通信領(lǐng)域中，一些形式的MBE被應(yīng)用在著名的Iridium(銥星系統(tǒng))、INMARSAT M、INMARSAT Mini-M、ICO(INMARSAT-P)、Optus和AceS等系統(tǒng)中?；贛BE的算法也已在陸上移動(dòng)無(wú)線電(例如APC0-25)和空中電話等應(yīng)用系統(tǒng)中。關(guān)于MBE算法的詳細(xì)說(shuō)明可見(jiàn)B.S.Atal等人所著的“語(yǔ)音編碼的進(jìn)展”(Advances in Speech Coding，Kluwer Academic Publishers，1991)；A.M.Kondoz所著的“數(shù)字語(yǔ)音低比特率系統(tǒng)中的編碼”(DigitalSpeechCoding for Low Bit Rate Systems，Wiley & Sons，1994)；以及“諧波振幅量化的方法及裝置”(WIPO Publication WO9412972，06/1994，Methed and Apparatus for Quantization of HarmonicAmplitudes)。
雖然示范性實(shí)施例在DTX和MBE領(lǐng)域明顯有用，本領(lǐng)域的技術(shù)人員完全了解，本發(fā)明的某些方面同樣適用于其他的通信和數(shù)字信號(hào)處理的應(yīng)用中。例如所公開(kāi)的對(duì)信號(hào)特征的描述或模型化的方法以及之后用模型化參數(shù)來(lái)產(chǎn)生或模擬信號(hào)的方法，不僅可用于在DTX系統(tǒng)中提供舒適噪聲，也能用來(lái)記錄和/或回放人們所感興趣的任何信號(hào)。此外，所公開(kāi)的參數(shù)的和統(tǒng)計(jì)的信號(hào)模型化方法不僅能容易地應(yīng)用于頻域的MBE語(yǔ)音編碼算法，也能應(yīng)用于任何信號(hào)編碼算法。例如，所公開(kāi)的方法可直接用于其他頻域的算法(如用在同態(tài)聲碼器和正弦變換編碼器中的算法)以及時(shí)域算法(如著名的碼激勵(lì)線性預(yù)測(cè)(CELP)算法及矢量和激勵(lì)線性預(yù)測(cè)(VSELP)算法)。
現(xiàn)在回到本發(fā)明的示范性實(shí)施例中來(lái)，圖1和圖2分別描述DTX發(fā)射機(jī)100和兼容的DTX接收機(jī)200。如圖1所示，作為示例的DTX發(fā)射機(jī)100包括話音活動(dòng)檢測(cè)器(VAD)110、語(yǔ)音編碼器120、靜寂描述(SID)編碼器130、信道編碼器140以及第一與第二發(fā)射開(kāi)關(guān)150、155。圖2中，作為示例的DTX接收機(jī)200包括信道解碼器210、幀確證處理器220、語(yǔ)音幀緩沖器230、舒適噪聲幀緩沖器240、語(yǔ)音解碼器250和接收開(kāi)關(guān)260。本領(lǐng)域的技術(shù)人員會(huì)完全了解下面說(shuō)明的圖1和圖2中一些部件的功能可用各種硬件配置來(lái)實(shí)現(xiàn)，其中可包括如通用數(shù)字計(jì)算機(jī)、標(biāo)準(zhǔn)數(shù)字信號(hào)處理部件以及一個(gè)或多個(gè)專(zhuān)用的集成電路等器件。
在工作時(shí)，將一個(gè)音頻幀(例如，一串連續(xù)的脈沖編碼調(diào)制的用戶語(yǔ)音信號(hào)的抽樣值)提供給DTX發(fā)射機(jī)100的話音活動(dòng)檢測(cè)器110、語(yǔ)音編碼器120和SID編碼器130。話音活動(dòng)檢測(cè)器110對(duì)音頻幀進(jìn)行分析并確定該幀是否含有話音信息。如果有，則使第一發(fā)射開(kāi)關(guān)150設(shè)置到將語(yǔ)音編碼器120的輸出端連接到信道編碼器140的輸入端，并指示語(yǔ)音編碼器120對(duì)語(yǔ)音幀進(jìn)行編碼(所用方法在下面說(shuō)明)以作為信道編碼器140的輸入。反之，使發(fā)射開(kāi)關(guān)150設(shè)置到將SID編碼器130的輸出端連接到信道編碼器140的輸入端，并指示SID編碼器130對(duì)SID幀進(jìn)行編碼(所用方法也在下面說(shuō)明)以作為信道編碼器140的輸入。實(shí)際上，語(yǔ)音編碼器120和SID編碼器130的功能可結(jié)合在一個(gè)編碼裝置中。
從語(yǔ)音編碼器120接收了語(yǔ)音幀或從SID編碼器130接收了SID幀之后，信道編碼器140用已知的信道編碼方法編制要跨越通信信道(例如空中接口(air interface))傳輸?shù)膸?。在語(yǔ)音信號(hào)含有話音的期間，第二發(fā)射開(kāi)關(guān)155保持閉合，語(yǔ)音幀被連續(xù)地編碼并發(fā)送。但是當(dāng)話音活動(dòng)檢測(cè)器110確定話音活動(dòng)剛剛停止后，只對(duì)有限的(一般為一至二個(gè))SID幀進(jìn)行編碼和發(fā)送。其后，SID更新幀被周期地(例如每隔250ms至1.0sec)編碼和發(fā)送，直到話音活動(dòng)檢測(cè)器110指示話音活動(dòng)已經(jīng)重新開(kāi)始為止。這時(shí)候，語(yǔ)音編碼器120恢復(fù)產(chǎn)生語(yǔ)音幀用于傳輸，直到話音再次中止。
在接收機(jī)200中，信道解碼器210對(duì)進(jìn)入的幀進(jìn)行接收與解碼(即信道解碼器210執(zhí)行與信道編碼器140實(shí)現(xiàn)編碼處理時(shí)相反的動(dòng)作)，并向確證處理器220、語(yǔ)音幀緩沖器230與舒適噪聲幀緩沖器240提供經(jīng)解碼的幀。在DTX期間大部分接收到的幀都是無(wú)效的，因此充滿了RF(射頻)干擾產(chǎn)生的隨機(jī)數(shù)據(jù)和接收機(jī)噪聲。但是在DTX期間偶然會(huì)發(fā)射一個(gè)有效的SID更新幀，并且有效的語(yǔ)音幀的傳輸可能隨時(shí)恢復(fù)。
為了處理這個(gè)不確定性，確證處理器220對(duì)每個(gè)收到的幀的內(nèi)容進(jìn)行分析。如果收到的幀是無(wú)效的，就將接收開(kāi)關(guān)260置于使舒適噪聲幀緩沖器240與語(yǔ)音解碼器250的輸入端相連，同時(shí)指示舒適噪聲幀緩沖器240向語(yǔ)音解碼器250提供噪聲幀，以產(chǎn)生舒適噪聲。如果收到的幀是一個(gè)有效的SID更新值，那么當(dāng)噪聲幀被提供給語(yǔ)音解碼器250產(chǎn)生舒適噪聲的之前，就用收到的幀來(lái)更新舒適噪聲幀緩沖器240中的內(nèi)容。最后，如果收到的幀是有效的話音幀，就將接收開(kāi)關(guān)260置于使語(yǔ)音幀緩沖器230與語(yǔ)音解碼器相連，同時(shí)將收到的幀送到語(yǔ)音解碼器250，以經(jīng)合成后提供接收機(jī)用戶。
圖3是說(shuō)明上述DTX工作的定時(shí)圖。圖中一個(gè)語(yǔ)音信號(hào)包括中間隔有一段靜音周期的第一與第二語(yǔ)音突發(fā)310、320。在第一語(yǔ)音突發(fā)310期間，有效語(yǔ)音幀315被連續(xù)發(fā)送。但是，第一語(yǔ)音突發(fā)310剛一結(jié)束，有效SID幀330就在兩個(gè)語(yǔ)音突發(fā)之間的整個(gè)靜音期間被周期地發(fā)送，而不再發(fā)送語(yǔ)音幀。然后在第二個(gè)語(yǔ)音突發(fā)320開(kāi)始時(shí)，又一次連續(xù)發(fā)送有效語(yǔ)音幀325。
這種DTX工作方式比傳統(tǒng)的連續(xù)發(fā)送具有一些顯著的優(yōu)點(diǎn)，因此DTX成為當(dāng)今數(shù)字無(wú)線系統(tǒng)的一個(gè)共同特征。例如，DTX可使用于發(fā)射的無(wú)線電裝置節(jié)省功率，因?yàn)樗恍枰?jīng)常發(fā)射。更準(zhǔn)確的說(shuō)，由于發(fā)射機(jī)功率放大器(PA)特一般要耗用大部分的發(fā)射機(jī)功率，由于在DTX狀態(tài)時(shí)功率放大器被斷開(kāi)，便可顯著節(jié)省功率。此外，DTX方式可使較少的RF能量被發(fā)射而成為空中接口頻譜(air interfacespectrum)。因此，在多路接入系統(tǒng)中的其他用戶所見(jiàn)的平均RF干擾就減少了，并且那些用戶所見(jiàn)的載波-干擾比(C/I)相應(yīng)的增強(qiáng)了。增強(qiáng)的C/I改善了無(wú)線電終端的性能，反過(guò)來(lái)說(shuō)，也就是增加了系統(tǒng)的容量(即給定的頻率分配所支持的用戶數(shù)增加了)。
正如上面對(duì)圖1與圖2所述，在DTX系統(tǒng)中的語(yǔ)音信號(hào)被抽樣并編碼(如用語(yǔ)音編碼器120)，之后對(duì)編碼的值進(jìn)行解碼(如用語(yǔ)音解碼器250)用于合成或重構(gòu)語(yǔ)音信號(hào)。本技術(shù)領(lǐng)域中，通常將編碼器和解碼器的組合稱(chēng)作編解碼器或者聲碼器，可用任何一種熟知的方法在聲碼器中實(shí)現(xiàn)語(yǔ)音的編碼和解碼。
這類(lèi)方法可一般地分為兩種類(lèi)型，即波形編碼法和參數(shù)編碼法。波形聲碼器試圖對(duì)語(yǔ)音信號(hào)本身量化并編碼，而參數(shù)聲碼器則采用一種語(yǔ)音信號(hào)的模型，該模型由多個(gè)參數(shù)組成。一般，參數(shù)聲碼器接收語(yǔ)音信號(hào)的樣值，將樣值編組形成一些幀，使樣值組成的幀適合于該模型，然后對(duì)該模型參數(shù)的值進(jìn)行量化與編碼。用這種方法，參數(shù)聲碼器能以比波形聲碼器低的信息速率(即比特率)產(chǎn)生所要求的語(yǔ)音質(zhì)量。
一種耐用且流行的參數(shù)聲碼器就是上文提及的MBE聲碼器。像許多語(yǔ)音編碼器一樣，MBE聲碼器將抽樣獲得的語(yǔ)音信號(hào)分成20-ms大小的幀，并為每個(gè)話音幀算出一組MBE模型參數(shù)。這些模型參數(shù)(如包括基本音調(diào)頻率和一些發(fā)聲判定(voicing decisions))描述所述幀的可感知內(nèi)容，用以此后產(chǎn)生感覺(jué)上類(lèi)似原語(yǔ)音信號(hào)的合成語(yǔ)音信號(hào)。對(duì)于那些不包括話音的幀(例如在DTX發(fā)射機(jī)中抽樣的只含背景噪聲的幀)，該MBE模型可產(chǎn)生一組可用來(lái)重建幀的頻譜幅度(例如，用來(lái)在DTX接收機(jī)中合成舒適噪聲)。
在傳統(tǒng)的DTX系統(tǒng)中，在DTX期間直接并重復(fù)使用最新的SID更新值來(lái)產(chǎn)生舒適噪聲。換句話說(shuō)，最新的SID幀(例如包括頻譜幅度的MBE幀)被一次又一次地發(fā)送到語(yǔ)音解碼器250進(jìn)行合成。結(jié)果，每收到一個(gè)SID更新時(shí)，DTX接收機(jī)迫使接收機(jī)上的舒適噪聲特征與跟發(fā)射機(jī)的背景噪聲特性相匹配。此外，舒適噪聲頻譜在兩次SID更新期間保持靜態(tài)。這種處理方式至少有兩個(gè)不利的方面。
首先來(lái)看這種情況在發(fā)射機(jī)中背景噪聲保持穩(wěn)定不變。據(jù)定義，平均噪聲頻譜值在一段時(shí)間內(nèi)為常數(shù)。但是，這就意味著沒(méi)有頻譜的變化。在大多數(shù)現(xiàn)實(shí)的噪聲環(huán)境中，瞬時(shí)頻譜值是連續(xù)變化的并圍繞著平均值形成一個(gè)隨機(jī)分布。聽(tīng)者既能感覺(jué)到頻譜的均值又能感覺(jué)到頻譜的變化。然而頻譜的均值代表背景噪聲的音量，頻譜的變化象征著噪聲的生動(dòng)性。由于傳統(tǒng)的舒適噪聲產(chǎn)生方法僅僅顧及平均頻譜(如通過(guò)在舒適噪聲的更新之間固定MBE頻譜幅度)，這樣的方法經(jīng)常導(dǎo)致這樣的結(jié)果，可使人感覺(jué)到在DTX期間產(chǎn)生的舒適噪聲與連續(xù)語(yǔ)音傳輸期間編碼的背景噪聲之間的不相匹配。
另一種情況是在舒適噪聲更新之間發(fā)射機(jī)中的背景噪聲不平穩(wěn)。這種場(chǎng)合，當(dāng)接收舒適噪聲更新值時(shí)可能會(huì)發(fā)生陡峭過(guò)渡(例如，當(dāng)占主導(dǎo)的的一組MBE頻譜幅度為經(jīng)更新的一組頻譜幅度所替換時(shí))。在DTX發(fā)射機(jī)上，背景噪聲的音量和/或頻譜特征的改變一般發(fā)生在一個(gè)包括數(shù)個(gè)幀的期間。但是由于DTX接收機(jī)得到相對(duì)較少的SID更新，這種變化在接收機(jī)會(huì)顯得非常突然，因此使得DTX在功能上不夠透明，從而使接收的用戶聽(tīng)覺(jué)上不舒服。
其優(yōu)點(diǎn)是，本發(fā)明為既捕獲發(fā)射機(jī)背景噪聲的響度又捕獲其生動(dòng)性提供了方法和裝置。更一般地說(shuō)，本發(fā)明為捕獲所關(guān)心的任何信號(hào)的可覺(jué)察特性提供了技術(shù)。為此，給信號(hào)的參數(shù)模型(例如代表發(fā)射機(jī)背景噪聲的一組MBE頻譜幅度)增加了與該參數(shù)模型有關(guān)的一個(gè)或多個(gè)高階統(tǒng)計(jì)量。例如在DTX傳輸?shù)那闆r下，可對(duì)SID幀的MBE頻譜幅度(該幀可認(rèn)為是平均噪聲頻譜的粗略估計(jì))增加一個(gè)對(duì)背景噪聲頻譜的方差估計(jì)。用一個(gè)或多個(gè)高階統(tǒng)計(jì)量(例如方差估計(jì))與模型參數(shù)(例如頻譜幅度)一起來(lái)重構(gòu)原始信號(hào)(例如生成舒適噪聲)，結(jié)果便可獲得一種更為精確、感覺(jué)上更舒服的噪聲。此外，根據(jù)本發(fā)明公開(kāi)的內(nèi)容，模型參數(shù)可作平滑、平均或者其他的濾波處理，以進(jìn)一步增強(qiáng)重構(gòu)的信號(hào)。當(dāng)模型參數(shù)生成時(shí)(例如在DTX發(fā)送前或在記錄于存儲(chǔ)介質(zhì)之前)和/或當(dāng)這些參數(shù)被用于信號(hào)重構(gòu)時(shí)(如在剛完成DTX接收時(shí)或者剛從存儲(chǔ)介質(zhì)中重放時(shí))可以實(shí)施這樣的濾波。下文描述了本發(fā)明在應(yīng)用上述MBE語(yǔ)音編碼模型在DTX通信系統(tǒng)中產(chǎn)生舒適噪聲方面所具有的各種特征與優(yōu)越性，這樣的描述不失其普遍性。
如上文所提及，一個(gè)DTX SID幀中的MBE頻譜幅度可看作是平均噪聲頻譜的估計(jì)值。但是依據(jù)本發(fā)明，對(duì)連續(xù)的頻譜幅度幀進(jìn)行濾波可獲得極佳的平均頻譜估計(jì)值。例如每個(gè)話音不活動(dòng)期開(kāi)始時(shí)，DTX話音活動(dòng)檢測(cè)器(例如圖1中的檢測(cè)器110)在宣布話音不活動(dòng)前一般要等待一段時(shí)間。在本技術(shù)領(lǐng)域?qū)⑦@段等待時(shí)間(一般持續(xù)約4至6幀)稱(chēng)為釋放延遲期，這個(gè)期間為對(duì)若干連續(xù)幀的平均計(jì)算提供了機(jī)會(huì)。換句話說(shuō)，在釋放延遲期內(nèi)可用如下公式對(duì)MBE頻譜幅度進(jìn)行平均來(lái)算出一組頻譜平均值式中Mi(k)代表第i個(gè)聲碼器幀的瞬時(shí)頻譜幅度，P是每幀中的頻譜幅度的數(shù)量，N是在釋放延遲期中的幀數(shù)。這樣，在話音非活動(dòng)期開(kāi)始時(shí)可將頻譜平均值作為SID幀更新發(fā)送出去。
實(shí)際上，瞬間的頻譜幅度Mi可用對(duì)數(shù)表示，并且涉及瞬間頻譜幅度的所有計(jì)算都可以用所得到的對(duì)數(shù)值來(lái)完成。因?yàn)轭l譜幅度的量化對(duì)理解本發(fā)明并不關(guān)鍵，所以為了簡(jiǎn)便起見(jiàn)在這里省略了這些量化的詳細(xì)說(shuō)明。如想詳細(xì)了解MBE模型參數(shù)的量化，請(qǐng)參閱前文引用的“International Publication No.WO 9412972”。
依據(jù)本發(fā)明，在DTX期間還使平均估計(jì)值更加精細(xì)，以使每個(gè)SID幀的更新值精確地反映占主導(dǎo)的發(fā)射機(jī)背景噪聲的特征。例如對(duì)平均頻譜幅度的連續(xù)平均可做如下計(jì)算Mi(k)＝αMi(k)+(1-α)Mi-1(k)，對(duì)于k＝0至P-1。
本領(lǐng)域技術(shù)人員不難看出這是對(duì)每個(gè)頻譜幅度實(shí)施一階自回歸(AR)濾波器處理，式中α是濾波器平均化系數(shù)即存儲(chǔ)值(memory)。對(duì)頻譜幅度實(shí)施AR濾波器處理，就可獲得平均值的連續(xù)更新的估計(jì)值。AR處理過(guò)程具有只需少量存儲(chǔ)資源就可提供優(yōu)質(zhì)濾波的優(yōu)點(diǎn)。另外AR濾波器的輸出給當(dāng)前幀的加權(quán)大于前面的幀，以不引入過(guò)度的延遲。實(shí)驗(yàn)研究表明，濾波器存儲(chǔ)值α＝1/16時(shí)可產(chǎn)生好的結(jié)果。
發(fā)生于兩次SID更新之間的所有頻譜幅度也可以如上述相對(duì)初始釋放延遲期進(jìn)行平均。但這樣做會(huì)使計(jì)算更復(fù)雜，而且其存儲(chǔ)需要量明顯大于上述AR濾波器方式。此外，如此連續(xù)的平均計(jì)算往往會(huì)引入比一階AR方法更顯著的延遲。
依據(jù)本發(fā)明，MBE頻譜幅度不僅可經(jīng)由濾波來(lái)提供極佳的頻譜平均估計(jì)值，也用噪聲頻譜的方差估計(jì)對(duì)MBE頻譜幅度加以補(bǔ)充。方差定量描述了在頻譜平均值附近瞬間頻譜幅度的分布情況，這樣就提供了關(guān)于經(jīng)模型化噪聲的生動(dòng)性指示。數(shù)學(xué)上，一個(gè)隨機(jī)變量χ的方差按如下公式計(jì)算σχ2＝E{(χ-μx)2}，其中E{ }是期望值算子，μx＝E{χ}是χ的平均值。χ的標(biāo)準(zhǔn)差定義為方差的平方根，與方差一樣，它提供關(guān)于χ的生動(dòng)性信息。
在一些示范性實(shí)施例中，對(duì)一個(gè)SID幀內(nèi)的所有頻譜幅度只計(jì)算一個(gè)標(biāo)準(zhǔn)差參數(shù)來(lái)描述其特征。例如對(duì)于一個(gè)特定的SID幀i的瞬時(shí)標(biāo)準(zhǔn)差可估計(jì)為σi=1PΣk=0P-1{Mi(k)-M_i(k)}2,]]>式中P是每幀中的頻譜幅度數(shù)，Mi(k)是瞬時(shí)頻譜幅度，Mi(k)是經(jīng)濾波的或上述的估計(jì)平均頻譜幅度。
其優(yōu)點(diǎn)是，瞬時(shí)標(biāo)準(zhǔn)差估計(jì)值可與經(jīng)濾波的MBE頻譜幅度一起在SID幀中發(fā)送，之后由接收機(jī)用來(lái)產(chǎn)生高質(zhì)量的舒適噪聲(如下面所述)?？梢杂羞x擇的對(duì)連續(xù)的瞬時(shí)標(biāo)準(zhǔn)差估計(jì)值進(jìn)行濾波或平滑，經(jīng)濾波的標(biāo)準(zhǔn)差估計(jì)值可以與經(jīng)濾波的頻譜幅度一起發(fā)送。例如，瞬時(shí)標(biāo)準(zhǔn)差估計(jì)值可用一階AR進(jìn)行平滑處理，如σi＝αiσi+(1-αi)σi-1，式中αi是每幀更新系數(shù)或?yàn)V波器存儲(chǔ)值。對(duì)瞬時(shí)標(biāo)準(zhǔn)差值的濾波就減少了不正常的或游離的(outlier)頻譜幅度樣本的影響。
在每個(gè)DTX周期開(kāi)始時(shí)，第一標(biāo)準(zhǔn)差估計(jì)值可等于瞬時(shí)標(biāo)準(zhǔn)差值，也可以等于上個(gè)DTX周期的最后一個(gè)經(jīng)濾波的估計(jì)值。此外，上一個(gè)估計(jì)值和當(dāng)前瞬時(shí)值的加權(quán)結(jié)合可用來(lái)提供第一估計(jì)值。
依據(jù)示范性實(shí)施例，更新系數(shù)αi不是固定的，而是為適應(yīng)每個(gè)幀而經(jīng)修改的值。這是由于在某些場(chǎng)合固定的更新系數(shù)只能提供不良的方差估計(jì)值。例如，假設(shè)在所關(guān)心的大多數(shù)或全部頻率范圍內(nèi)，發(fā)射機(jī)背景噪聲的音量在增加；換言之，假設(shè)該噪聲是非穩(wěn)定的。由于平均頻譜幅度估計(jì)值是通過(guò)對(duì)實(shí)際頻譜幅度的濾波得到的，所以實(shí)際頻譜幅度中的變化經(jīng)過(guò)一段延遲后在估計(jì)平均頻譜幅度中表現(xiàn)出來(lái)。例如，實(shí)際頻譜幅度中一個(gè)音量的增加一般要等一些幀過(guò)去之后才在平均頻譜幅度中出現(xiàn)。
在這個(gè)延遲期內(nèi)，實(shí)際頻譜幅度和估計(jì)平均頻譜幅度之間的差別可能相當(dāng)大。然而，這種差別是由平均估值器(estimator)而不是由真實(shí)頻譜中的隨機(jī)性引起的。由于這些差值被相加并輸入到方差估值器中，當(dāng)使用一個(gè)固定的更新系數(shù)時(shí)方差估計(jì)值就會(huì)被人為地加大。因此，依據(jù)本發(fā)明，上述的更新系數(shù)被動(dòng)態(tài)地逐幀修正。為此，可為每個(gè)幀i算出一個(gè)品質(zhì)變量qi，如下qi=1-|1PΣi=0P-1sign{Mi(k)-M_i(k)}|]]>上面定義的品質(zhì)變量用來(lái)表征頻譜的穩(wěn)定性。每當(dāng)有普遍的音量改變時(shí)，所有的頻譜幅度的差別都趨向同樣的符號(hào)(sign)，這就使得和數(shù)增大，從而使變量qi的值減小。但是當(dāng)頻譜相當(dāng)穩(wěn)定時(shí)，一般正方向的幅度差值與負(fù)方向的幅度差值一樣多，這樣就使得和數(shù)變小而qi值增大。
因此，當(dāng)品質(zhì)因數(shù)qI大時(shí)，就可對(duì)瞬時(shí)方差估計(jì)值有把握，有理由在對(duì)經(jīng)平滑處理的標(biāo)準(zhǔn)差估計(jì)值的更新中使用該瞬時(shí)估計(jì)值。但是當(dāng)品質(zhì)因數(shù)低時(shí)，瞬時(shí)方差值估計(jì)就值會(huì)不可靠，最好不用該瞬時(shí)估計(jì)值來(lái)更新經(jīng)平滑的估計(jì)值。這個(gè)想法可用一個(gè)自適應(yīng)的更新系數(shù)αi來(lái)加以定量，其中αi按下式由品質(zhì)因數(shù)qi控制αi＝qiα式中α是一個(gè)代表最大的可能更新系數(shù)(因?yàn)閝i被定義在0到1的范圍內(nèi))的常數(shù)。實(shí)驗(yàn)研究表明，α＝1/32的最大值可提供高質(zhì)量的結(jié)果。
如上提到的，經(jīng)平滑的標(biāo)準(zhǔn)差估計(jì)值在SID幀內(nèi)隨平均頻譜幅度一起發(fā)送，用于在DTX接收機(jī)中產(chǎn)生舒適噪聲。當(dāng)然也可以不對(duì)標(biāo)準(zhǔn)差估計(jì)值，而對(duì)方差估計(jì)值作平滑處理并加以發(fā)送。采用方差還是標(biāo)準(zhǔn)差估計(jì)值，只是一個(gè)設(shè)計(jì)選擇問(wèn)題。
注意，可以為每個(gè)頻譜幅度算出一個(gè)單獨(dú)的標(biāo)準(zhǔn)差(或方差)估計(jì)值。但是這樣會(huì)導(dǎo)致許多附加參數(shù)的傳送。此外，實(shí)驗(yàn)表明，人們所關(guān)心的大多數(shù)噪聲源其頻譜的方差往往類(lèi)同。因此，單獨(dú)一項(xiàng)就足以適用大多數(shù)情況。
在DTX接收機(jī)中，SID幀(依據(jù)示范性實(shí)施例，SID幀每48個(gè)MBE幀或每960ms被發(fā)送)構(gòu)成所要產(chǎn)生的舒適噪聲頻譜的基礎(chǔ)。如上所述，每個(gè)SID幀包括一組估計(jì)平均頻譜幅度并且只有單個(gè)估計(jì)標(biāo)準(zhǔn)差或方差。依據(jù)本發(fā)明，根據(jù)標(biāo)準(zhǔn)差值對(duì)平均頻譜幅度進(jìn)行處理，提供用以輸入語(yǔ)音解碼器(如圖2的解碼器250)的經(jīng)增強(qiáng)的頻譜幅度。其優(yōu)點(diǎn)是，用所述經(jīng)增強(qiáng)的頻譜幅度會(huì)產(chǎn)生的合成舒適噪聲跟發(fā)射機(jī)中的背景噪聲很匹配。
首先，通過(guò)一個(gè)更新接一個(gè)更新地對(duì)平均頻譜幅度進(jìn)行濾波，可避免SID更新時(shí)頻譜的突然改變。例如，假設(shè)Mold(k)(如上，對(duì)于k＝1至P)代表先前收到的SID幀的平均頻譜幅度，Mnew(k)表示剛剛收到的SID幀的平均頻譜幅度。頻譜幅度不是立即從Mold(k)過(guò)渡到Mnew(k)，而是經(jīng)過(guò)N個(gè)幀之后才完成過(guò)渡。例如，有可能采用包含多項(xiàng)式或指數(shù)的線性斜坡函數(shù)或其它變換函數(shù)。下面給出一個(gè)示范性線性斜坡函數(shù) Mi(k)＝Mnew(k)，對(duì)于i≥N斜坡處理后，經(jīng)更新的平均頻譜幅度Mnew(k)就被使用，直到收到下一個(gè)SID幀的更新值為止。實(shí)驗(yàn)研究表明N＝16幀的斜坡處理或過(guò)渡周期可提供較好的結(jié)果。
為了使舒適噪聲特性的靜態(tài)程度較低，將基于標(biāo)準(zhǔn)差估計(jì)值的一個(gè)隨機(jī)因數(shù)加到每個(gè)經(jīng)斜坡處理的(ramped)頻譜幅度上。依據(jù)示范性實(shí)施例，所增加的隨機(jī)數(shù)用具有正態(tài)分布輸出的偽隨機(jī)數(shù)字發(fā)生器來(lái)產(chǎn)生。偽隨機(jī)數(shù)依據(jù)標(biāo)準(zhǔn)差估計(jì)值按比例確定，給定幀的隨機(jī)化(ramdomized)頻譜幅度由下式給出Mrandomized(k)＝Mramped(k)+σχ(k)式中χ(k)是具有var(χ)＝1的正態(tài)分布偽隨機(jī)數(shù)字發(fā)生器的輸出，σ是發(fā)射機(jī)中計(jì)算出的并在SID幀中發(fā)送的標(biāo)準(zhǔn)差估計(jì)值。
注意，標(biāo)準(zhǔn)差σ可在接收機(jī)中固定下來(lái)，因此不一定必須在發(fā)射機(jī)中計(jì)算標(biāo)準(zhǔn)差估計(jì)值再發(fā)送給接收機(jī)。但是這樣做會(huì)使產(chǎn)生的舒適噪聲中生動(dòng)性的量值被固定下來(lái)，就不能跟蹤在發(fā)射機(jī)中存在的背景噪聲的生動(dòng)性。不過(guò)，這樣的實(shí)施方式還是比當(dāng)前完全不包括隨機(jī)因數(shù)的方法效果好。
其優(yōu)點(diǎn)是，隨機(jī)化頻譜幅度可被送至語(yǔ)音解碼器，用于產(chǎn)生優(yōu)質(zhì)的舒適噪聲。但是依據(jù)本發(fā)明，可通過(guò)橫跨各幀對(duì)隨機(jī)化頻譜幅度進(jìn)行濾波來(lái)進(jìn)一步改善舒適噪聲的特性。注意，上面提到的將隨機(jī)噪聲加到經(jīng)斜坡處理的頻譜幅度，其條件是假設(shè)發(fā)射機(jī)中的背景噪聲處理是獨(dú)立的或幀與幀之間不相關(guān)的。而實(shí)際上，使頻譜幅度在其平均值上下抖動(dòng)的隨機(jī)性在幀與幀之間有一些相關(guān)。這是相當(dāng)于時(shí)域中色噪聲的頻譜。本發(fā)明通過(guò)對(duì)隨機(jī)化頻譜幅度的從幀到幀的平滑處理來(lái)說(shuō)明這種現(xiàn)象，該處理如下式所示Mifinal(k)=βMirandomized(k)+(1-β)Mi-1final(k)]]>本領(lǐng)域的技術(shù)人員會(huì)發(fā)現(xiàn)這是作用到每個(gè)隨機(jī)化頻譜幅度的一階AR濾波器，其中β是濾波器更新系數(shù)即存儲(chǔ)值。實(shí)驗(yàn)研究表明，β＝0.5的更新系數(shù)可提供好的結(jié)果。注意也可實(shí)現(xiàn)另外一些平滑方法(例如高階AR濾波器或移動(dòng)平均濾波器等)。
圖4是描述上述舒適噪聲產(chǎn)生方法步驟的流程圖400。例如，圖4的步驟可在圖2所示的DTX接收機(jī)200中實(shí)現(xiàn)。步驟410，判斷是否收到有效的MBE幀。如果收到的幀無(wú)效，則步驟420(部分地基于先前收到的SID更新值)計(jì)算舒適噪聲幀(即增強(qiáng)的頻譜幅度幀)，且所得到的舒適噪聲幀在步驟430被用于合成。如果收到的幀是有效的，則在步驟440判斷收到的幀是否是語(yǔ)音幀。如果是，則該語(yǔ)音幀在步驟430被用于合成。否則，所收到的幀就被認(rèn)為是一個(gè)有效的SID更新，在步驟450將其原樣存儲(chǔ)。此外，在步驟430中SID更新值被用于合成。
圖5是依據(jù)本發(fā)明的舒適噪聲幀發(fā)生器500的示例。該發(fā)生器可用于實(shí)現(xiàn)圖4中的舒適噪聲幀生成步驟420。如圖5所示，發(fā)生器500包括舊舒適噪聲幀緩沖器510、新舒適噪聲幀緩沖器520、偽隨機(jī)數(shù)字發(fā)生器5 30、延時(shí)緩沖器540、第一至第五乘法器550、552、554、556、558，以及第一與第二加法器560、562。本領(lǐng)域的技術(shù)人員將完全了解圖5所示部件的功能可以用各種硬件配置加以實(shí)現(xiàn)，例如采用包括通用數(shù)字計(jì)算機(jī)、標(biāo)準(zhǔn)數(shù)字信號(hào)處理元件以及一個(gè)或多個(gè)專(zhuān)用集成電路(ASIC)的配置。
工作時(shí)，通過(guò)第一、第二和第三乘法器550、552、554分別將舊舒適噪聲幀緩沖器510、新舒適噪聲幀緩沖器520和偽隨機(jī)數(shù)字發(fā)生器530的輸出加權(quán)，經(jīng)加權(quán)的輸出幀通過(guò)第一加法器560相加。這樣，第一加法器輸出的各幀就作了如上的斜坡與隨機(jī)化處理。經(jīng)斜坡與隨機(jī)化處理的各幀然后經(jīng)由第四與第五乘法器556與558、第二加法器562以及延時(shí)緩沖器540的濾波后，提供增強(qiáng)的舒適噪聲幀。如圖所示，增強(qiáng)的舒適噪聲幀(每幀都包含一組增強(qiáng)的頻譜幅度)可以輸入到語(yǔ)音解碼器250用于合成。
圖6至11顯示了本發(fā)明與先有技術(shù)的舒適噪聲產(chǎn)生技術(shù)相比的優(yōu)越性。特別是，圖6給出了一個(gè)在DTX發(fā)射機(jī)中與典型背景噪聲有關(guān)的頻譜幅度的時(shí)間序列(即連續(xù)的各幀)的示例。接著，圖7給出了用傳統(tǒng)技術(shù)處理圖6的頻譜幅度后產(chǎn)生的舒適噪聲幀的時(shí)間序列；圖8至圖11給出了用本發(fā)明的上述實(shí)施例處理相同的頻譜幅度后產(chǎn)生的幀的時(shí)間序列。特別是，圖8表現(xiàn)了對(duì)圖6頻譜幅度的平滑處理(例如在DTX發(fā)射機(jī)中)，圖9表現(xiàn)了對(duì)圖8中經(jīng)平滑處理的頻譜幅度所作的斜坡處理(例如剛被DTX接收機(jī)接收后)。圖10給出了對(duì)圖9中經(jīng)斜坡處理的頻譜幅度所作的隨機(jī)化處理。圖11描述了對(duì)圖10所示的經(jīng)隨機(jī)化處理的頻譜幅度所作的最終濾波或增強(qiáng)處理。其優(yōu)點(diǎn)是，圖11的頻譜特征顯然比圖7更接近圖6。
一般，本發(fā)明提供了用以特征化噪聲或其他信號(hào)及隨后利用這種特征化的結(jié)果來(lái)重構(gòu)信號(hào)的方法和裝置。依據(jù)本發(fā)明，對(duì)信號(hào)的參數(shù)模型增補(bǔ)了至少一個(gè)與該模型參數(shù)有關(guān)的高階統(tǒng)計(jì)量。在DTX通信方面，發(fā)射機(jī)背景噪聲由包含估計(jì)平均頻譜幅度的許多連續(xù)的幀特征化，每個(gè)幀都伴隨一個(gè)獨(dú)立的估計(jì)標(biāo)準(zhǔn)差值。信號(hào)一經(jīng)重構(gòu)后，估計(jì)標(biāo)準(zhǔn)差值就被用來(lái)隨機(jī)化估計(jì)平均頻譜幅度，由此改善重構(gòu)噪聲的音質(zhì)。通過(guò)在傳輸前和/或接收后對(duì)頻譜幅度的平均、平滑或其他的濾波處理，重構(gòu)噪聲的質(zhì)量得到進(jìn)一步增強(qiáng)。其優(yōu)點(diǎn)是，重構(gòu)噪聲的頻譜特征非常接近地類(lèi)似于原噪聲。
本領(lǐng)域的技術(shù)人員將完全了解本發(fā)明并不限于文中為了說(shuō)明而描述的特定示范性實(shí)施例，還有大量經(jīng)深思熟慮的可替換實(shí)施方案。為此，本發(fā)明的范圍由所附的權(quán)利要求書(shū)加以規(guī)定，而不決定于前面的說(shuō)明，且發(fā)明人有意將所有其含義與各項(xiàng)權(quán)利要求一致的等價(jià)方案納入所述權(quán)利要求書(shū)的范圍。
權(quán)利要求
1.一種無(wú)線電發(fā)射機(jī)，包括一個(gè)用以對(duì)輸入噪聲信號(hào)抽樣并提供被抽樣噪聲信號(hào)的參數(shù)模型作為輸出的編碼器，所述參數(shù)模型包含至少一個(gè)代表所述被抽樣噪聲信號(hào)的模型化參數(shù)；其中所述編碼器還提供與所述至少一個(gè)模型化參數(shù)有關(guān)的統(tǒng)計(jì)量作為輸出，所述統(tǒng)計(jì)量的階數(shù)高于各模型化參數(shù)的階數(shù)。
2.如權(quán)利要求1所述的無(wú)線電發(fā)射機(jī)，其特征在于所述編碼器是多頻帶激勵(lì)編碼器、同態(tài)編碼器和正弦變換編碼器之一。
3.如權(quán)利要求1所述的無(wú)線電發(fā)射機(jī)，其特征在于所述參數(shù)模型包括多個(gè)估計(jì)平均頻譜幅度。
4.如權(quán)利要求3所述的無(wú)線電發(fā)射機(jī)，其特征在于所述統(tǒng)計(jì)量是所述頻譜幅度的估計(jì)標(biāo)準(zhǔn)差。
5.如權(quán)利要求1所述的無(wú)線電發(fā)射機(jī)，其特征在于所述編碼器周期地更新至少一個(gè)模型化參數(shù)和所述統(tǒng)計(jì)量。
6.如權(quán)利要求5所述的無(wú)線電發(fā)射機(jī)，其特征在于所述編碼器對(duì)所述至少一個(gè)模型化參數(shù)的連續(xù)更新值進(jìn)行濾波。
7.如權(quán)利要求6所述的無(wú)線電發(fā)射機(jī)，其特征在于每個(gè)模型化參數(shù)的更新值是一個(gè)估計(jì)平均頻譜幅度。
8.如權(quán)利要求5所述的無(wú)線電發(fā)射機(jī)，其特征在于所述編碼器對(duì)所述統(tǒng)計(jì)量的連續(xù)更新值進(jìn)行濾波。
9.如權(quán)利要求5所述的無(wú)線電發(fā)射機(jī)，其特征在于所述編碼器對(duì)所述至少一個(gè)模型化參數(shù)和所述統(tǒng)計(jì)量的連續(xù)更新值進(jìn)行濾波，且所述發(fā)射機(jī)將經(jīng)濾波的更新值發(fā)送給無(wú)線電接收機(jī)。
10.如權(quán)利要求9所述的無(wú)線電發(fā)射機(jī)，其特征在于所述無(wú)線電發(fā)射機(jī)是不連續(xù)傳輸(DTX)裝置，且所述經(jīng)濾波的更新值在靜寂描述(SID)幀內(nèi)被發(fā)往所述無(wú)線電接收機(jī)。
11.一種無(wú)線電接收機(jī)，包括一個(gè)用以接收代表噪聲信號(hào)的至少一個(gè)模型化參數(shù)以及一個(gè)與所述至少一個(gè)噪聲模型化參數(shù)有關(guān)的統(tǒng)計(jì)量的舒適噪聲發(fā)生器，所述統(tǒng)計(jì)量的階數(shù)高于各噪聲模型化參數(shù)的階數(shù)；其中所述舒適噪聲發(fā)生器對(duì)所述至少一個(gè)噪聲模型化參數(shù)和所述統(tǒng)計(jì)量解碼，以向所述無(wú)線電接收機(jī)的用戶提供舒適噪聲。
12.如權(quán)利要求11所述的無(wú)線電接收機(jī)，其特征于每個(gè)噪聲模型化參數(shù)都是一個(gè)估計(jì)平均頻譜幅度。
13.如權(quán)利要求12所述的無(wú)線電接收機(jī)，其特征在于所述統(tǒng)計(jì)量是所述至少一個(gè)頻譜幅度的估計(jì)標(biāo)準(zhǔn)差。
14.如權(quán)利要求11所述的無(wú)線電接收機(jī)，其特征在于所述舒適噪聲發(fā)生器周期地接收所述至少一個(gè)噪聲模型化參數(shù)和所述統(tǒng)計(jì)量的更新值。
15.如權(quán)利要求14所述的無(wú)線電接收機(jī)，其特征在于所述舒適噪聲發(fā)生器對(duì)所述至少一個(gè)噪聲模型化參數(shù)的連續(xù)更新值進(jìn)行濾波。
16.如權(quán)利要求15所述的無(wú)線電接收機(jī)，其特征在于在對(duì)所述至少一個(gè)噪聲模型化參數(shù)的連續(xù)更新值的濾波中，所述舒適噪聲發(fā)生器使用一個(gè)斜坡函數(shù)。
17.如權(quán)利要求15所述的無(wú)線電接收機(jī)，其特征在于所述舒適噪聲發(fā)生器依據(jù)所述統(tǒng)計(jì)量對(duì)所述至少一個(gè)噪聲模型化參數(shù)的經(jīng)濾波的更新值進(jìn)行處理，以提供所述舒適噪聲。
18.如權(quán)利要求17所述的無(wú)線電接收機(jī)，其特征在于各噪聲模型化參數(shù)是一個(gè)估計(jì)平均頻譜幅度，所述統(tǒng)計(jì)量是所述至少一個(gè)估計(jì)平均頻譜幅度的估計(jì)標(biāo)準(zhǔn)差，以及所述舒適噪聲發(fā)生器依據(jù)所述估計(jì)標(biāo)準(zhǔn)差對(duì)所述至少一個(gè)估計(jì)平均頻譜幅度的經(jīng)濾波的更新值進(jìn)行抖動(dòng)處理。
19.如權(quán)利要求15所述的無(wú)線電接收機(jī)，其特征在于所述舒適噪聲發(fā)生器對(duì)經(jīng)抖動(dòng)處理的所述至少一個(gè)頻譜幅度的所述更新值進(jìn)行濾波處理，以提供連續(xù)的經(jīng)抖動(dòng)更新值之間的相關(guān)性。
20.如權(quán)利要求14所述的無(wú)線電接收機(jī)，其特征在于所述舒適噪聲發(fā)生器接收來(lái)自無(wú)線電發(fā)射機(jī)的所述至少一個(gè)噪聲模型化參數(shù)和所述統(tǒng)計(jì)量的周期性更新值。
21.如權(quán)利要求20所述的無(wú)線電接收機(jī)，其特征在于所述無(wú)線電接收機(jī)是不連續(xù)傳輸(DTX)裝置，且所述舒適噪聲發(fā)生器接收所述發(fā)射機(jī)發(fā)送的靜寂描述(SID)幀內(nèi)包含的所述至少一個(gè)噪聲模型化參數(shù)及所述統(tǒng)計(jì)量。
全文摘要
在特征化一個(gè)噪聲或信息信號(hào)以及之后使用該特征化重構(gòu)信號(hào)的方法和裝置中,一個(gè)信號(hào)的參數(shù)模型用至少一個(gè)與該模型參數(shù)有關(guān)的高階統(tǒng)計(jì)量加以補(bǔ)充。例如,在DTX通信方面,發(fā)射機(jī)的背景噪聲以估計(jì)平均頻譜幅度的連續(xù)幀被特征化,每個(gè)幀伴隨一個(gè)對(duì)該頻譜幅度的估計(jì)標(biāo)準(zhǔn)差。信號(hào)重構(gòu)一經(jīng)完成,該估計(jì)標(biāo)準(zhǔn)差被用來(lái)隨機(jī)化頻譜幅度并以此改善重構(gòu)噪聲的音質(zhì)。在臨發(fā)射前和/或剛接收后,通過(guò)對(duì)平均頻譜幅度的平均、平滑或其他濾波處理進(jìn)一步增強(qiáng)重構(gòu)噪聲的質(zhì)量。
文檔編號(hào)G10L19/012GK1367918SQ00811226
公開(kāi)日2002年9月4日申請(qǐng)日期2000年5月19日優(yōu)先權(quán)日1999年6月7日
發(fā)明者P·M·約翰森, L·S·布萊鮑姆申請(qǐng)人:艾利森公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專(zhuān)利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：P.M.約翰森;L.S.布萊鮑姆
技術(shù)所有人：艾利森公司
我是此專(zhuān)利的發(fā)明人

上一篇：陶瓷制品的制造方法及陶瓷制品的制作方法
上一篇：音樂(lè)播放設(shè)備

相關(guān)技術(shù)

網(wǎng)友詢(xún)問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

噪聲模型相關(guān)技術(shù)

噪聲信道模型相關(guān)技術(shù)

圖像噪聲模型相關(guān)技術(shù)

高斯噪聲模型相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

用參數(shù)噪聲模型統(tǒng)計(jì)量產(chǎn)生舒適噪聲的方法及裝置的制作方法