一種發(fā)送和接收背景噪聲的方法和裝置及靜音壓縮系統(tǒng)的制作方法

文檔序號：2829513閱讀：201來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：一種發(fā)送和接收背景噪聲的方法和裝置及靜音壓縮系統(tǒng)的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及通信技術(shù)，特別是涉及一種發(fā)送和接收背景噪聲的方法和裝置及靜音壓縮系統(tǒng)。
背景技術(shù)：
在各種語音通信中，語音信號的傳輸并不是連續(xù)的，比如，人發(fā)聲并不是連續(xù)的，因此所傳輸?shù)恼Z音信號可以分為有聲信號和無聲信號。有聲信號指說話、發(fā)聲等各種音頻信號，無聲信號指在發(fā)聲間隙產(chǎn)生的信號，包括各種背景噪聲，比如白噪聲、背景嘈雜聲和靜音等。
對通信雙方來說，有聲信號為有用信號，是通信內(nèi)容的載體，而無聲信號即背景噪聲為無用信號，不包含通信的主要信息。在通信時，人們關(guān)注的只是有用的有聲信號，考慮到帶寬的壓力，因此不希望傳送無用的背景噪聲，這樣就可以有效的降低傳輸帶寬。但如果只傳有聲信號不傳背景噪聲，就會導(dǎo)致背景噪聲的不連續(xù)，會使收聽的人感覺非常不舒服，在背景噪聲較強(qiáng)的情況下這種感覺會更明顯，有時會令語音難以理解。因此，目前，通常的處理方式為在編解碼器中采用靜音壓縮技術(shù)，對背景噪聲進(jìn)行壓縮后傳輸，從而在節(jié)省傳輸帶寬的同時，較好地保證編碼質(zhì)量。
圖1是現(xiàn)有技術(shù)實(shí)現(xiàn)靜音壓縮的系統(tǒng)結(jié)構(gòu)示意圖。圖2是現(xiàn)有技術(shù)發(fā)送和接收語音信號的流程圖。參見圖1和圖2，現(xiàn)有技術(shù)在發(fā)送和接收語音信號時，采用靜音壓縮技術(shù)傳輸背景噪聲的過程包括以下步驟步驟201在發(fā)送端，對于任意一幀的信號，語音檢測器(VAD)對該信號進(jìn)行分析和檢測，檢測該信號為有聲信號還是背景噪聲，如果是有聲信號，則執(zhí)行步驟202，如果是背景噪聲，則執(zhí)行步驟203。
步驟202將當(dāng)前的信號作為語音幀，由語音編碼器對該語音幀進(jìn)行編碼后，發(fā)送給接收端，執(zhí)行步驟204。
步驟203將當(dāng)前的信號作為非語音幀，由非語音編碼器(DTX)對該非語音幀進(jìn)行編碼，產(chǎn)生描述背景噪聲的靜音描述(SID)幀，將所產(chǎn)生的SID幀發(fā)送給接收端。
步驟204在接收端，由語音解碼器對接收到的語音幀進(jìn)行解碼，得到有聲信號即語音信號，并由非語音解碼器(CNG)根據(jù)接收到的SID幀中攜帶的特征參數(shù)進(jìn)行解碼，合成背景噪聲。
此后，在接收端，則可利用解碼后的語音信號以及背景噪聲重構(gòu)語音信號。
目前，在接收端對非語音幀進(jìn)行解碼時，舒適背景噪聲的合成原理與語音合成原理相同。語音的合成原理是語音s(n)可以看成是一個激勵信號e(n)激勵一個合成濾波器v(n)所產(chǎn)生的輸出，即s(n)＝e(n)*v(n)，這樣，合成背景噪聲時也可以用這個模型。所以SID幀中所傳輸?shù)拿枋霰尘霸肼暤奶卣鲄?shù)與語音編碼幀基本相同，包括信號合成時的合成濾波器參數(shù)和激勵參數(shù)。由于SID幀描述的是背景噪聲特性，背景噪聲的激勵信號可以認(rèn)為是簡單的噪聲隨機(jī)序列，而這些序列在編解碼端均可以簡單的用隨機(jī)噪聲產(chǎn)生模塊產(chǎn)生，然后用能量參數(shù)控制這些序列的幅度，就可產(chǎn)生最終的激勵信號，因此在合成舒適背景噪聲時，其中的激勵參數(shù)可以簡單的用能量參數(shù)來表示，而不需要用其它的一些特征參數(shù)來進(jìn)一步描述。
根據(jù)上述接收端對非語音幀進(jìn)行解碼時，舒適背景噪聲的合成原理，在上述的步驟203中，在對非語音幀進(jìn)行編碼產(chǎn)生SID幀時，該SID幀中攜帶的特征參數(shù)包括合成濾波器參數(shù)和激勵參數(shù)，其中，激勵參數(shù)為當(dāng)前背景噪聲幀的能量參數(shù)，SID幀中的合成濾波器參數(shù)與語音信號相同，為線譜頻率LSF量化參數(shù)。比如，以G.729B語音編碼器為例，其SID幀中的比特分配如表1所示。

表1 G.729B中的SID幀比特分配但是，參見圖1和圖2，在現(xiàn)有技術(shù)中，比如語音編碼器G.729B，在傳輸背景噪聲時，采用的是單一SID幀描述方式。也就是說，在語音通信系統(tǒng)中，無論當(dāng)前背景噪聲是什么特性，每個編碼器只采用一種描述和量化方法來表示當(dāng)前背景噪聲的特性，這樣，無論背景噪聲的特性是否平穩(wěn)，描述該背景噪聲的SID幀的結(jié)構(gòu)都是固定不變的，在SID幀中的特征參數(shù)及對其量化的比特數(shù)完全相同。
然而，在實(shí)際的語音通信中，編碼器面對的是各種各樣的場合，每種場合的背景噪聲特性均不一樣。在一些較為安靜的場合，比如在辦公室，背景噪聲就較為簡單，一般為簡單的白噪聲和靜音，其噪聲特性較為平穩(wěn)；而在一些比較嘈雜的場合，比如在街頭，背景噪聲就較為復(fù)雜，如車聲和人聲等嘈雜聲，其噪聲特性很不平穩(wěn)。因此，現(xiàn)有技術(shù)在編碼時不區(qū)分背景噪聲的特性，對所有背景噪聲的特性均采用一種SID幀來描述的方式，則缺乏針對性，無法準(zhǔn)確地表達(dá)出各種背景噪聲的特性。相應(yīng)的，在解碼端合成舒適背景噪聲時，所合成的舒適背景噪聲就不能與編碼端的背景噪聲特性很好的匹配，因此會造成所合成的語音質(zhì)量較差，導(dǎo)致人耳的感覺很不舒服，從而大大降低了語音通信的業(yè)務(wù)服務(wù)質(zhì)量。
另外，在現(xiàn)有技術(shù)中，在發(fā)送端描述背景噪聲的特性時，只考慮了合成濾波器參數(shù)和激勵參數(shù)，也就是說，SID幀中所攜帶的特征參數(shù)只有線譜頻率LSF的各種量化參數(shù)和能量參數(shù)，而沒有其他的特征參數(shù)。然而，對于一些較為復(fù)雜的背景噪聲，其噪聲特性較為復(fù)雜，存在很多特定的噪聲特性，僅僅在SID幀中使用線譜頻率LSF的各種量化參數(shù)和能量參數(shù)，往往無法完全表達(dá)背景噪聲的所有特性，相應(yīng)的，在解碼端合成舒適背景噪聲時，所合成的舒適背景噪聲也就不能與編碼端的背景噪聲特性完全匹配，因此會進(jìn)一步造成所合成的語音質(zhì)量差，導(dǎo)致人耳的感覺很不舒服，從而進(jìn)一步降低了音頻通信的業(yè)務(wù)服務(wù)質(zhì)量。

發(fā)明內(nèi)容
有鑒于此，本發(fā)明的第一目的在于提供一種發(fā)送背景噪聲的方法，本發(fā)明的第二目的在于提供一種接收背景噪聲的方法，本發(fā)明的第三目的在于提供一種發(fā)送背景噪聲的裝置，本發(fā)明的第四目的在于提供一種接收背景噪聲的裝置，本發(fā)明的第五目的在于提供一種發(fā)送和接收背景噪聲的系統(tǒng)，本發(fā)明的第六目的在于提供一種靜音壓縮系統(tǒng)，以便通過不同SID幀準(zhǔn)確地表達(dá)出不同背景噪聲的特性。
為了達(dá)到上述目的，本發(fā)明的技術(shù)方案是這樣實(shí)現(xiàn)的一種發(fā)送背景噪聲的方法，根據(jù)各背景噪聲的噪聲特性，將各背景噪聲劃分為不同的類別，建立噪聲特性與背景噪聲類別的對應(yīng)關(guān)系，以及設(shè)置不同的背景噪聲類別對應(yīng)不同的SID幀結(jié)構(gòu)，該方法還包括A、發(fā)送端接收到當(dāng)前背景噪聲，根據(jù)當(dāng)前背景噪聲的噪聲特性以及所建立的噪聲特性與背景噪聲類別的對應(yīng)關(guān)系，確定當(dāng)前背景噪聲所屬的背景噪聲類別；B、發(fā)送端根據(jù)所確定背景噪聲類別對應(yīng)的SID幀結(jié)構(gòu)，構(gòu)造SID幀，并發(fā)送所構(gòu)造出的SID幀。
所述噪聲特性為背景噪聲信號間的相關(guān)性大??；或，背景噪聲有無周期性特性。
所述不同的SID幀結(jié)構(gòu)包括不同SID幀之間，具有完全相同的特征參數(shù)，且一個或多個特征參數(shù)的量化精度不同；或，不同SID幀之間，具有完全不同的特征參數(shù)；
或，不同SID幀之間，具有相同的特征參數(shù)和不同的特征參數(shù)。
當(dāng)所述不同的SID幀結(jié)構(gòu)為不同SID幀之間具有相同的特征參數(shù)和不同的特征參數(shù)時，所述不同的SID幀結(jié)構(gòu)進(jìn)一步包括一個或多個相同特征參數(shù)的量化精度相同；或，一個或多個相同特征參數(shù)的量化精度不同。
當(dāng)所述不同的SID幀結(jié)構(gòu)中包括不同SID幀之間具有不同的特征參數(shù)時，所述不同的SID幀結(jié)構(gòu)進(jìn)一步包括不同的特征參數(shù)中包括新設(shè)置的特征參數(shù)。
在步驟B中，所述構(gòu)造SID幀的步驟包括發(fā)送端根據(jù)所確定背景噪聲類別對應(yīng)的SID幀結(jié)構(gòu)，從當(dāng)前背景噪聲中提取對應(yīng)的特征參數(shù)，并根據(jù)所確定背景噪聲類別對應(yīng)的SID幀結(jié)構(gòu)中各特征參數(shù)的量化精度，對所提取的特征參數(shù)進(jìn)行量化，然后利用量化后的比特數(shù)構(gòu)造SID幀。
該方法進(jìn)一步包括發(fā)送端采用等間隔方式或不等間隔方式發(fā)送多個具有不同幀結(jié)構(gòu)的SID幀。
該方法進(jìn)一步包括設(shè)置不同背景噪聲類別對應(yīng)不同的噪聲產(chǎn)生規(guī)則；當(dāng)接收端接收到SID幀后，確定該SID幀對應(yīng)的背景噪聲類別，并根據(jù)所確定背景噪聲類別對應(yīng)的噪聲產(chǎn)生規(guī)則，產(chǎn)生當(dāng)前背景噪聲。
一種接收背景噪聲的方法，該方法包括根據(jù)各背景噪聲的噪聲特性，將各背景噪聲劃分為不同的類別，并設(shè)置不同背景噪聲類別對應(yīng)不同的噪聲產(chǎn)生規(guī)則；當(dāng)接收端接收到SID幀后，確定該SID幀對應(yīng)的背景噪聲類別，并根據(jù)所確定的背景噪聲類別對應(yīng)的噪聲產(chǎn)生規(guī)則，產(chǎn)生當(dāng)前背景噪聲。
一種發(fā)送背景噪聲的裝置，該裝置包括噪聲分類單元和多個噪聲編碼單元，其中，不同噪聲編碼單元中保存不同類別的背景噪聲所對應(yīng)的不同SID幀結(jié)構(gòu)，并且，噪聲分類單元，用于接收當(dāng)前背景噪聲，并根據(jù)當(dāng)前背景噪聲的噪聲特性以及所保存的噪聲特性與背景噪聲類別的對應(yīng)關(guān)系，確定當(dāng)前背景噪聲所屬的背景噪聲類別，根據(jù)所確定的當(dāng)前背景噪聲所屬的背景噪聲類別以及所保存的背景噪聲類別與噪聲編碼單元的對應(yīng)關(guān)系，將當(dāng)前背景噪聲發(fā)送至對應(yīng)的噪聲編碼單元；任意一個噪聲編碼單元，用于在接收到當(dāng)前背景噪聲時，根據(jù)所保存的SID幀結(jié)構(gòu)，構(gòu)造描述當(dāng)前背景噪聲的SID幀，并發(fā)送所構(gòu)造的SID幀。
一種接收背景噪聲的裝置，該裝置包括多個噪聲解碼單元，其中，不同噪聲解碼單元中保存不同背景噪聲類別對應(yīng)的不同噪聲產(chǎn)生規(guī)則，任意一個噪聲解碼單元，用于在接收到SID幀時，根據(jù)所保存的噪聲產(chǎn)生規(guī)則以及所接收到的SID幀，產(chǎn)生當(dāng)前背景噪聲。
一種發(fā)送和接收背景噪聲的系統(tǒng)，該系統(tǒng)包括噪聲分類單元、多個噪聲編碼單元和多個噪聲解碼單元，其中，不同噪聲編碼單元中保存不同類別的背景噪聲所對應(yīng)的不同SID幀結(jié)構(gòu)，不同噪聲解碼單元中保存不同背景噪聲類別對應(yīng)的不同噪聲產(chǎn)生規(guī)則，并且，噪聲分類單元，用于接收當(dāng)前背景噪聲，并根據(jù)當(dāng)前背景噪聲的噪聲特性以及所保存的噪聲特性與背景噪聲類別的對應(yīng)關(guān)系，確定當(dāng)前背景噪聲所屬的背景噪聲類別，根據(jù)所確定的背景噪聲類別及所保存的背景噪聲類別與噪聲編碼單元的對應(yīng)關(guān)系，將當(dāng)前背景噪聲發(fā)送至對應(yīng)的噪聲編碼單元；任意一個噪聲編碼單元，用于在接收到當(dāng)前背景噪聲時，根據(jù)所保存的SID幀結(jié)構(gòu)，構(gòu)造描述當(dāng)前背景噪聲的SID幀，并發(fā)送所構(gòu)造的SID幀；任意一個噪聲解碼單元，用于在接收到SID幀時，根據(jù)所保存的噪聲產(chǎn)生規(guī)則以及所接收到的SID幀，產(chǎn)生當(dāng)前背景噪聲。
一種靜音壓縮系統(tǒng)，該系統(tǒng)包括發(fā)送端和接收端，其中，發(fā)送端包括，語音檢測器、語音編碼器和非語音編碼器，非語音編碼器中包括噪聲分類單元和多個噪聲編碼單元，并且，語音檢測器，在接收到信號幀時檢測該信號幀為語音幀還是背景噪聲，在檢測出為語音幀后，將該語音幀發(fā)送至語音編碼器進(jìn)行編碼，由語音編碼器發(fā)送編碼后的語音幀，在檢測出為背景噪聲時，將當(dāng)前的背景噪聲發(fā)送至非語音編碼器中的噪聲分類單元；噪聲分類單元根據(jù)當(dāng)前背景噪聲的噪聲特性以及所保存的噪聲特性與背景噪聲類別的對應(yīng)關(guān)系，確定當(dāng)前背景噪聲所屬的背景噪聲類別，根據(jù)所確定的背景噪聲類別及所保存的背景噪聲類別與噪聲編碼單元的對應(yīng)關(guān)系，將當(dāng)前背景噪聲發(fā)送至對應(yīng)的噪聲編碼單元；噪聲編碼單元在接收到當(dāng)前背景噪聲時，根據(jù)所保存的SID幀結(jié)構(gòu)，構(gòu)造描述當(dāng)前背景噪聲的SID幀，并發(fā)送所構(gòu)造的SID幀；接收端包括，語音解碼器以及非語音解碼器，非語音解碼器中包括多個噪聲解碼單元，并且，語音解碼器，用于接收語音幀，對該語音幀進(jìn)行解碼；任意一個噪聲解碼單元，用于在接收到SID幀時，根據(jù)所保存的噪聲產(chǎn)生規(guī)則以及所接收到的SID幀，產(chǎn)生當(dāng)前背景噪聲。
由此可見，在本發(fā)明中，區(qū)分了背景噪聲的特性，即在發(fā)送端根據(jù)不同背景噪聲的不同噪聲特性，采用不同結(jié)構(gòu)的SID幀來分別描述，因此，能夠準(zhǔn)確地表達(dá)出各種背景噪聲的特性。相應(yīng)的，在解碼端合成舒適背景噪聲時，所合成的舒適背景噪聲就能夠與編碼端的背景噪聲特性很好的匹配，使得所合成的語音質(zhì)量較高，人耳的感覺也很舒服，從而大大提高了語音通信的業(yè)務(wù)服務(wù)質(zhì)量。
另外，在本發(fā)明中，不僅在SID幀中使用線譜頻率LSF的各種量化參數(shù)和能量參數(shù)，而且還可以針對一些背景噪聲特定的噪聲特性，設(shè)置了新的特征參數(shù)來表示這些特定的噪聲特性，因此，能夠完全表達(dá)背景噪聲的所有特性，相應(yīng)的，在解碼端合成舒適背景噪聲時，所合成的舒適背景噪聲則能與編碼端的背景噪聲特性完全匹配，因此進(jìn)一步提高了所合成的語音質(zhì)量，從而進(jìn)一步提高了音頻通信的業(yè)務(wù)服務(wù)質(zhì)量。

圖1是現(xiàn)有技術(shù)實(shí)現(xiàn)靜音壓縮的系統(tǒng)結(jié)構(gòu)示意圖。
圖2是現(xiàn)有技術(shù)發(fā)送和接收語音信號的流程圖。
圖3是在本發(fā)明中靜音壓縮系統(tǒng)的結(jié)構(gòu)示意圖。
圖4是在本發(fā)明實(shí)施例中發(fā)送和接收背景噪聲的流程圖。
具體實(shí)施例方式
為了使SID幀準(zhǔn)確的描述出背景噪聲的特性，從而使合成的音頻質(zhì)量較好，則必須突破現(xiàn)有技術(shù)中發(fā)送端的編碼器對于所有的非語音幀即各種背景噪聲，均采用一種SID幀的限制。也就是說，在一個編碼器內(nèi)，在對背景噪聲特性進(jìn)行描述時，可以根據(jù)背景噪聲的不同特性，比如是簡單的白噪聲或靜音，還是較為復(fù)雜的街頭嘈雜聲等，而采用多種結(jié)構(gòu)的SID幀對這些具有不同特性的背景噪聲分別進(jìn)行描述。
因此，本發(fā)明提出了一種發(fā)送背景噪聲的方法，其核心思想是預(yù)先根據(jù)各背景噪聲的噪聲特性，將各背景噪聲劃分為不同的類別，并設(shè)置不同類別的背景噪聲對應(yīng)不同的SID幀結(jié)構(gòu)；發(fā)送端在檢測出當(dāng)前的信號幀為背景噪聲時，確定當(dāng)前背景噪聲所屬的類別；發(fā)送端根據(jù)當(dāng)前背景噪聲所屬類別對應(yīng)的SID幀結(jié)構(gòu)，構(gòu)造SID幀，并發(fā)送所構(gòu)造出的SID幀。
對應(yīng)的，本發(fā)明還提出了一種接收背景噪聲的方法，其核心思想是根據(jù)各背景噪聲的噪聲特性，將各背景噪聲劃分為不同的類別，并設(shè)置不同背景噪聲類別對應(yīng)不同的噪聲產(chǎn)生規(guī)則；當(dāng)接收端接收到SID幀后，確定該SID幀對應(yīng)的背景噪聲類別，并根據(jù)所確定的背景噪聲類別對應(yīng)的噪聲產(chǎn)生規(guī)則，產(chǎn)生當(dāng)前背景噪聲。
對應(yīng)的，本發(fā)明還提出了一種靜音壓縮系統(tǒng)。圖3是在本發(fā)明中靜音壓縮系統(tǒng)的結(jié)構(gòu)示意圖。參見圖3，本發(fā)明所提出的靜音壓縮系統(tǒng)包括發(fā)送端和接收端。其中，發(fā)送端包括，語音檢測器(VAD)、語音編碼器和非語音編碼器(DTX)；接收端包括，語音解碼器以及非語音解碼器(CNG)。其中，發(fā)送端的非語音編碼器(DTX)，即為本發(fā)明中實(shí)現(xiàn)發(fā)送背景噪聲的裝置，其內(nèi)部包括噪聲分類單元和多個噪聲編碼單元；并且，在接收端的非語音解碼器(CNG)，即為本發(fā)明中實(shí)現(xiàn)接收背景噪聲的裝置，其內(nèi)部包括多個噪聲解碼單元。
參見圖3，在本發(fā)明的靜音壓縮系統(tǒng)中，語音檢測器分別與語音編碼器和非語音編碼器中的噪聲分類單元相連，非語音編碼器中的噪聲分類單元分別與各個噪聲編碼單元相連；并且，語音編碼器通過通信信道與語音解碼器相連，對應(yīng)相同背景噪聲類別的噪聲編碼單元與噪聲解碼單元相連。
為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚，下面結(jié)合附圖及具體實(shí)施例對本發(fā)明作進(jìn)一步地詳細(xì)描述。
圖4是在本發(fā)明實(shí)施例中發(fā)送和接收背景噪聲的流程圖。參見圖3和圖4，在本發(fā)明中，實(shí)現(xiàn)發(fā)送和接收背景噪聲的過程包括以下步驟步驟401預(yù)先根據(jù)各背景噪聲的噪聲特性，將各背景噪聲劃分為不同的類別，并建立各噪聲特性與背景噪聲類別的對應(yīng)關(guān)系，將所建立的對應(yīng)關(guān)系保存在噪聲分類單元中。
這里，在劃分背景噪聲類別時，所根據(jù)的各背景噪聲的噪聲特性可以是各背景噪聲信號間相關(guān)性的大小，各背景噪聲信號間相關(guān)性的大小可以利用相關(guān)函數(shù)來得到。比如，將信號間相關(guān)性大于0.5的所有背景噪聲劃分為第一類，將信號間相關(guān)性小于0.5的所有背景噪聲劃分為第二類。這樣，所建立的對應(yīng)關(guān)系可以為，噪聲特性中相關(guān)性大于0.5的對應(yīng)第一類背景噪聲，相關(guān)性小于0.5的對應(yīng)第二類背景噪聲。
或者，在劃分背景噪聲類別時，所根據(jù)的各背景噪聲的噪聲特性還可以是各背景噪聲中有無周期性特性。比如，將信號中有周期性特性的所有背景噪聲劃分為第一類，將信號中沒有周期性特性的所有背景噪聲間劃分為第二類。這樣，所建立的對應(yīng)關(guān)系可以為，噪聲特性中信號有周期性特性的對應(yīng)第一類背景噪聲，噪聲特性中信號沒有周期性特性的對應(yīng)第二類背景噪聲。
在本步驟中，所劃分的背景噪聲的類別可以包括兩類或更多類。
步驟402預(yù)先根據(jù)各類背景噪聲的噪聲特性，設(shè)置不同的背景噪聲類別對應(yīng)不同的SID幀結(jié)構(gòu)，將所設(shè)置的不同SID幀結(jié)構(gòu)分別保存在不同的噪聲編碼單元中。
這里，所述不同的SID幀結(jié)構(gòu)可以為以下的多種方式方式A、不同SID幀之間，具有完全相同的特征參數(shù)，但一個或多個特征參數(shù)的量化精度不同。
這里，在每一類別背景噪聲所對應(yīng)的SID幀中，雖然采用相同的背景噪聲特征參數(shù)，但這些相同背景噪聲特征參數(shù)中一個或多個的量化精度不同，因此，SID幀結(jié)構(gòu)不同。
方式B、不同SID幀之間，具有完全不同的特征參數(shù)，因此，SID幀結(jié)構(gòu)不同。
方式C、不同SID幀之間，具有相同的特征參數(shù)和不同的特征參數(shù)，因此，SID幀結(jié)構(gòu)不同。
在方式C中，在不同SID幀之間，一個或多個相同特征參數(shù)的量化精度可以相同或不同。
在本發(fā)明中，為了完整地表達(dá)出背景噪聲的特性，也可以為背景噪聲的一些特定的噪聲特性設(shè)置新的特征參數(shù)，因此，在上述方式B和方式C中，不同SID幀之間所具有的不同特征參數(shù)，不僅可以是已有的不同特征參數(shù)，也可以是一個SID幀中包括其他SID幀中所沒有的、新設(shè)置的特征參數(shù)。
步驟403預(yù)先設(shè)置不同背景噪聲類別對應(yīng)不同的噪聲產(chǎn)生規(guī)則，將所設(shè)置的不同噪聲產(chǎn)生規(guī)則分別保存在不同的噪聲解碼單元中。
這里，因?yàn)樵谏鲜霾襟E402中，針對不同的背景噪聲類別設(shè)置了不同的SID幀結(jié)構(gòu)，因此，在本步驟中，設(shè)置不同背景噪聲類別對應(yīng)不同的噪聲產(chǎn)生規(guī)則，從而使得在后續(xù)過程中，能夠針對不同背景噪聲的SID幀結(jié)構(gòu)，準(zhǔn)確地解碼出背景噪聲。
步驟404當(dāng)需要發(fā)送語音信號時，在發(fā)送端，對于任意一幀的信號，語音檢測器(VAD)對該信號進(jìn)行分析和檢測，檢測該信號為有聲信號還是背景噪聲，如果是有聲信號，則執(zhí)行步驟405，如果是背景噪聲，則執(zhí)行步驟408。
步驟405語音檢測器將當(dāng)前的信號作為語音幀，傳輸給語音編碼器。
步驟406語音編碼器對接收到的語音幀進(jìn)行編碼，并通過通信信道將編碼后的語音幀發(fā)送給接收端的語音解碼器。
步驟407在接收端，語音解碼器對接收到的語音幀進(jìn)行解碼，獲取原始的有聲信號，結(jié)束當(dāng)前流程。
步驟408語音檢測器將當(dāng)前的信號作為非語音幀，即背景噪聲，傳輸給非語音編碼器。
步驟409非語音編碼器中的噪聲分類單元接收當(dāng)前背景噪聲，根據(jù)當(dāng)前背景噪聲的噪聲特性以及所保存的各噪聲特性與背景噪聲類別的對應(yīng)關(guān)系，確定當(dāng)前背景噪聲所屬的背景噪聲類別。
這里，比如，在步驟401中，所根據(jù)的噪聲特性為信號間的相關(guān)性大小，那么，在本步驟中，噪聲分類單元所根據(jù)的噪聲特性是當(dāng)前背景噪聲的信號間相關(guān)性大小。其中，噪聲分類單元可以利用相關(guān)函數(shù)來得到當(dāng)前背景噪聲的信號間相關(guān)性大小。
步驟410噪聲分類單元根據(jù)所確定的背景噪聲類別以及預(yù)先保存的背景噪聲類別與噪聲編碼單元之間的對應(yīng)關(guān)系，將當(dāng)前背景噪聲發(fā)送至對應(yīng)的噪聲編碼單元。
這里，比如，所確定的當(dāng)前背景噪聲所屬的類別為1類，而噪聲編碼單元1與1類背景噪聲存在對應(yīng)關(guān)系，即應(yīng)該由噪聲編碼單元1負(fù)責(zé)對1類背景噪聲進(jìn)行編碼，則在本步驟中，將當(dāng)前背景噪聲發(fā)送至噪聲編碼單元1。
步驟411該對應(yīng)的噪聲編碼單元接收到當(dāng)前背景噪聲，根據(jù)預(yù)先保存的SID幀結(jié)構(gòu)，構(gòu)造描述當(dāng)前背景噪聲的SID幀。
這里，所述構(gòu)造描述當(dāng)前背景噪聲的SID幀的過程包括該對應(yīng)的噪聲編碼單元根據(jù)當(dāng)前背景噪聲所屬類別對應(yīng)的SID幀結(jié)構(gòu)，即自身中保存的SID幀結(jié)構(gòu)，從當(dāng)前背景噪聲中提取對應(yīng)的特征參數(shù)，并根據(jù)當(dāng)前背景噪聲所屬類別對應(yīng)的SID幀結(jié)構(gòu)中，即自身保存的SID幀結(jié)構(gòu)中，各特征參數(shù)的量化精度，對所提取的特征參數(shù)進(jìn)行量化，然后利用量化后的比特數(shù)構(gòu)造SID幀。
步驟412該對應(yīng)的噪聲編碼單元通過通信信道，將所構(gòu)造出的、描述當(dāng)前背景噪聲的SID幀發(fā)送至接收端的對應(yīng)噪聲解碼單元。
這里，所述的對應(yīng)噪聲解碼單元為負(fù)責(zé)對當(dāng)前背景噪聲所屬類別對應(yīng)的SID幀進(jìn)行解碼的噪聲解碼單元。
步驟413在接收端，該對應(yīng)噪聲解碼單元根據(jù)所保存的噪聲產(chǎn)生規(guī)則對所接收到的SID幀進(jìn)行解碼，產(chǎn)生當(dāng)前背景噪聲。
此后，在接收端，則可利用解碼后的語音信號以及背景噪聲重構(gòu)語音信號。
需要說明的是，在本發(fā)明中，所述的語音信號不僅包括人通話時的話音信號，而且還包括其他各種形式的音頻信號。也就是說，本發(fā)明傳輸背景噪聲的技術(shù)方案，不僅可以在人通話時傳輸話音信號時應(yīng)用，而且還可以在傳輸其他音頻信號時應(yīng)用。
總之，以上所述僅為本發(fā)明的較佳實(shí)施例而已，并非用于限定本發(fā)明的保護(hù)范圍。凡在本發(fā)明的精神和原則之內(nèi)，所作的任何修改、等同替換、改進(jìn)等，均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
權(quán)利要求
1.一種發(fā)送背景噪聲的方法，其特征在于，根據(jù)各背景噪聲的噪聲特性，將各背景噪聲劃分為不同的類別，建立噪聲特性與背景噪聲類別的對應(yīng)關(guān)系，并設(shè)置不同的背景噪聲類別對應(yīng)不同的靜音描述SID幀結(jié)構(gòu)，該方法還包括A、發(fā)送端接收到當(dāng)前背景噪聲，根據(jù)當(dāng)前背景噪聲的噪聲特性以及所建立的噪聲特性與背景噪聲類別的對應(yīng)關(guān)系，確定當(dāng)前背景噪聲所屬的背景噪聲類別；B、發(fā)送端根據(jù)所確定背景噪聲類別對應(yīng)的SID幀結(jié)構(gòu)，構(gòu)造SID幀，并發(fā)送所構(gòu)造出的SID幀。
2.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述噪聲特性為背景噪聲信號間的相關(guān)性大小；或，背景噪聲有無周期性特性。
3.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述不同的SID幀結(jié)構(gòu)包括不同SID幀之間，具有完全相同的特征參數(shù)，且一個或多個特征參數(shù)的量化精度不同；或，不同SID幀之間，具有完全不同的特征參數(shù)；或，不同SID幀之間，具有相同的特征參數(shù)和不同的特征參數(shù)。
4.根據(jù)權(quán)利要求3所述的方法，其特征在于，當(dāng)所述不同的SID幀結(jié)構(gòu)為不同SID幀之間具有相同的特征參數(shù)和不同的特征參數(shù)時，所述不同的SID幀結(jié)構(gòu)進(jìn)一步包括一個或多個相同特征參數(shù)的量化精度相同；或，一個或多個相同特征參數(shù)的量化精度不同。
5.根據(jù)權(quán)利要求3或4所述的方法，其特征在于，當(dāng)所述不同的SID幀結(jié)構(gòu)中包括不同SID幀之間具有不同的特征參數(shù)時，所述不同的SID幀結(jié)構(gòu)進(jìn)一步包括不同的特征參數(shù)中包括新設(shè)置的特征參數(shù)。
6.根據(jù)權(quán)利要求1所述的方法，其特征在于，在步驟B中，所述構(gòu)造SID幀的步驟包括發(fā)送端根據(jù)所確定背景噪聲類別對應(yīng)的SID幀結(jié)構(gòu)，從當(dāng)前背景噪聲中提取對應(yīng)的特征參數(shù)，并根據(jù)所確定背景噪聲類別對應(yīng)的SID幀結(jié)構(gòu)中各特征參數(shù)的量化精度，對所提取的特征參數(shù)進(jìn)行量化，然后利用量化后的比特數(shù)構(gòu)造SID幀。
7.根據(jù)權(quán)利要求1所述的方法，其特征在于，該方法進(jìn)一步包括發(fā)送端采用等間隔方式或不等間隔方式發(fā)送多個具有不同幀結(jié)構(gòu)的SID幀。
8.根據(jù)權(quán)利要求1所述的方法，其特征在于，該方法進(jìn)一步包括設(shè)置不同背景噪聲類別對應(yīng)不同的噪聲產(chǎn)生規(guī)則；當(dāng)接收端接收到SID幀后，確定該SID幀對應(yīng)的背景噪聲類別，并根據(jù)所確定背景噪聲類別對應(yīng)的噪聲產(chǎn)生規(guī)則，產(chǎn)生當(dāng)前背景噪聲。
9.一種接收背景噪聲的方法，其特征在于，該方法包括根據(jù)各背景噪聲的噪聲特性，將各背景噪聲劃分為不同的類別，并設(shè)置不同背景噪聲類別對應(yīng)不同的噪聲產(chǎn)生規(guī)則；當(dāng)接收端接收到SID幀后，確定該SID幀對應(yīng)的背景噪聲類別，并根據(jù)所確定的背景噪聲類別對應(yīng)的噪聲產(chǎn)生規(guī)則，產(chǎn)生當(dāng)前背景噪聲。
10.一種發(fā)送背景噪聲的裝置，其特征在于，該裝置包括噪聲分類單元和多個噪聲編碼單元，其中，不同噪聲編碼單元中保存不同類別的背景噪聲所對應(yīng)的不同SID幀結(jié)構(gòu)，并且，噪聲分類單元，用于接收當(dāng)前背景噪聲，并根據(jù)當(dāng)前背景噪聲的噪聲特性以及所保存的噪聲特性與背景噪聲類別的對應(yīng)關(guān)系，確定當(dāng)前背景噪聲所屬的背景噪聲類別，根據(jù)所確定的當(dāng)前背景噪聲所屬的背景噪聲類別以及所保存的背景噪聲類別與噪聲編碼單元的對應(yīng)關(guān)系，將當(dāng)前背景噪聲發(fā)送至對應(yīng)的噪聲編碼單元；任意一個噪聲編碼單元，用于在接收到當(dāng)前背景噪聲時，根據(jù)所保存的SID幀結(jié)構(gòu)，構(gòu)造描述當(dāng)前背景噪聲的SID幀，并發(fā)送所構(gòu)造的SID幀。
11.一種接收背景噪聲的裝置，其特征在于，該裝置包括多個噪聲解碼單元，其中，不同噪聲解碼單元中保存不同背景噪聲類別對應(yīng)的不同噪聲產(chǎn)生規(guī)則，任意一個噪聲解碼單元，用于在接收到SID幀時，根據(jù)所保存的噪聲產(chǎn)生規(guī)則以及所接收到的SID幀，產(chǎn)生當(dāng)前背景噪聲。
12.一種發(fā)送和接收背景噪聲的系統(tǒng)，其特征在于，該系統(tǒng)包括噪聲分類單元、多個噪聲編碼單元和多個噪聲解碼單元，其中，不同噪聲編碼單元中保存不同類別的背景噪聲所對應(yīng)的不同SID幀結(jié)構(gòu)，不同噪聲解碼單元中保存不同背景噪聲類別對應(yīng)的不同噪聲產(chǎn)生規(guī)則，并且，噪聲分類單元，用于接收當(dāng)前背景噪聲，并根據(jù)當(dāng)前背景噪聲的噪聲特性以及所保存的噪聲特性與背景噪聲類別的對應(yīng)關(guān)系，確定當(dāng)前背景噪聲所屬的背景噪聲類別，根據(jù)所確定的背景噪聲類別及所保存的背景噪聲類別與噪聲編碼單元的對應(yīng)關(guān)系，將當(dāng)前背景噪聲發(fā)送至對應(yīng)的噪聲編碼單元；任意一個噪聲編碼單元，用于在接收到當(dāng)前背景噪聲時，根據(jù)所保存的SID幀結(jié)構(gòu)，構(gòu)造描述當(dāng)前背景噪聲的SID幀，并發(fā)送所構(gòu)造的SID幀；任意一個噪聲解碼單元，用于在接收到SID幀時，根據(jù)所保存的噪聲產(chǎn)生規(guī)則以及所接收到的SID幀，產(chǎn)生當(dāng)前背景噪聲。
13.一種靜音壓縮系統(tǒng)，其特征在于，該系統(tǒng)包括發(fā)送端和接收端，其中，發(fā)送端包括，語音檢測器、語音編碼器和非語音編碼器，非語音編碼器中包括噪聲分類單元和多個噪聲編碼單元，并且，語音檢測器，在接收到信號幀時檢測該信號幀為語音幀還是背景噪聲，在檢測出為語音幀后，將該語音幀發(fā)送至語音編碼器進(jìn)行編碼，由語音編碼器發(fā)送編碼后的語音幀，在檢測出為背景噪聲時，將當(dāng)前的背景噪聲發(fā)送至非語音編碼器中的噪聲分類單元；噪聲分類單元根據(jù)當(dāng)前背景噪聲的噪聲特性以及所保存的噪聲特性與背景噪聲類別的對應(yīng)關(guān)系，確定當(dāng)前背景噪聲所屬的背景噪聲類別，根據(jù)所確定的背景噪聲類別及所保存的背景噪聲類別與噪聲編碼單元的對應(yīng)關(guān)系，將當(dāng)前背景噪聲發(fā)送至對應(yīng)的噪聲編碼單元；噪聲編碼單元在接收到當(dāng)前背景噪聲時，根據(jù)所保存的SID幀結(jié)構(gòu)，構(gòu)造描述當(dāng)前背景噪聲的SID幀，并發(fā)送所構(gòu)造的SID幀；接收端包括，語音解碼器以及非語音解碼器，非語音解碼器中包括多個噪聲解碼單元，并且，語音解碼器，用于接收語音幀，對該語音幀進(jìn)行解碼；任意一個噪聲解碼單元，用于在接收到SID幀時，根據(jù)所保存的噪聲產(chǎn)生規(guī)則以及所接收到的SID幀，產(chǎn)生當(dāng)前背景噪聲。
全文摘要
本發(fā)明公開了一種發(fā)送和接收背景噪聲的方法和裝置及靜音壓縮系統(tǒng)。根據(jù)各背景噪聲的噪聲特性，將各背景噪聲劃分為不同的類別，建立噪聲特性與背景噪聲類別的對應(yīng)關(guān)系，設(shè)置不同的背景噪聲類別對應(yīng)不同的靜音描述(SID)幀結(jié)構(gòu)；發(fā)送端根據(jù)當(dāng)前背景噪聲的噪聲特性以及所建立的噪聲特性與背景噪聲類別的對應(yīng)關(guān)系，確定當(dāng)前背景噪聲所屬的類別；發(fā)送端根據(jù)當(dāng)前背景噪聲所屬類別對應(yīng)的SID幀結(jié)構(gòu)，構(gòu)造SID幀，并發(fā)送所構(gòu)造出的SID幀。本發(fā)明采用不同結(jié)構(gòu)的SID幀來描述不同噪聲特性的背景噪聲，因此，能夠準(zhǔn)確地表達(dá)出各種背景噪聲的特性，使得解碼端所合成的舒適背景噪聲能夠與編碼端的背景噪聲特性很好的匹配，提高了合成的語音質(zhì)量。
文檔編號G10L19/012GK101087319SQ20061008353
公開日2007年12月12日申請日期2006年6月5日優(yōu)先權(quán)日2006年6月5日
發(fā)明者張立斌, 張軍, 靳彤申請人:華為技術(shù)有限公司

完整全部詳細(xì)技術(shù)資料下載