用于經(jīng)由非線性衰減/增益函數(shù)來消除音樂噪聲的方法和裝置與流程

文檔序號：12513572閱讀：497來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

用于經(jīng)由非線性衰減/增益函數(shù)來消除音樂噪聲的方法和裝置與流程

本申請要求于2015年8月18日遞交的第14/829,052號美國發(fā)明專利申請的優(yōu)先權(quán)，并且還要求于2014年9月3日遞交的第62/045,367號美國臨時申請的權(quán)益。上述申請的全部公開內(nèi)容通過引用并入本文。

技術(shù)領(lǐng)域

本公開涉及音頻信號中的噪聲的衰減和/或去除。

背景技術(shù)：

在語音增強(qiáng)系統(tǒng)中，數(shù)字信號處理器(DSP)接收包括模擬音頻信號的樣本的輸入信號。模擬音頻信號可以是語音信號。輸入信號包括噪聲，因而被稱為具有有噪語音樣本的“有噪語音”信號。DSP信號對有噪語音信號進(jìn)行處理，以衰減噪聲并輸出與輸入信號相比具有減少的噪聲量的“凈化的(cleaned)”語音信號。噪聲的衰減是具有挑戰(zhàn)性的問題，因為在定義語音和/或噪聲的輸入信號中不包括邊信息(side information)。唯一可用的信息是所接收的有噪語音樣本。

存在用于對有噪語音信號中的噪聲進(jìn)行衰減的傳統(tǒng)方法。然而，這些方法引入和/或?qū)е隆耙魳吩肼暋钡妮敵?。音樂噪聲不一定是指音樂信號的噪聲，而是指在窄頻帶內(nèi)的“類似音樂”的有聲噪聲。音樂噪聲被包括在作為執(zhí)行這些傳統(tǒng)方法的結(jié)果而輸出的凈化的語音信號中。音樂噪聲可以被聽者聽到并且可能令聽者不快。

作為示例，輸入信號的樣本可以被劃分為重疊的幀，并且可以確定先驗信噪比(SNR)ξ(k,l)和后驗SNRγ(k,l)，其中：ξ(k,l)是輸入信號的先驗SNR；γ(k,l)是輸入信號的后驗(或瞬時)SNR；l是用以標(biāo)識幀中的特定一個幀的幀索引；并且k是標(biāo)識輸入信號的短時傅里葉變換(STFT)的頻率范圍的頻段(frequency bin)(或范圍)索引。先驗SNRξ(k,l)是干凈語音信號的功率電平(或語音的頻率幅度)與噪聲的功率電平(或噪聲的頻率幅度)的比。后驗SNRγ(k,l)是觀察到的有噪語音信號的平方幅度與噪聲的功率電平的比?？梢葬槍斎胄盘柕拿總€頻段計算先驗SNRξ(k,l)和后驗SNRγ(k,l)兩者。先驗SNRξ(k,l)可以使用等式1來確定，其中λ_X(k,l)是輸入信號的STFT的語音幅度的先驗估計方差，并且λ_N(k,l)是輸入信號的STFT的估計的噪聲先驗方差。

后驗SNRγ(k,l)可以使用等式2來確定，其中R(k,l)是輸入信號的STFT的有噪語音的幅度。

對于每個k和l，增益G被計算為ξ(k，l)和γ(k,l)的函數(shù)。增益G被乘以R(k,l)以提供干凈語音的幅度的估計每個增益值可以大于或等于0并且小于或等于1。增益G的值基于ξ(k，l)和γ(k,l)來計算，使得語音的頻帶(或頻段)被保持并且噪聲的頻帶(或頻段)被衰減。執(zhí)行干凈語音的幅度的快速傅里葉逆變換(IFFT)以提供凈化的語音的時域樣本。凈化的語音是指被凈化的輸入信號(即噪聲已被衰減)的STFT的有噪語音部分。

例如，當(dāng)ξ(k，l)高時，對應(yīng)頻率的語音的幅度高，并且存在很少的噪聲(即噪聲的幅度低)。對于這種情況，將增益G設(shè)置為接近1(或0dB)以保持語音的幅度。因此，干凈語音的幅度被設(shè)置為近似等于R(k，l)。作為另一示例，當(dāng)ξ(k，l)低時，對應(yīng)頻率的語音的幅度低，并且存在強(qiáng)噪聲(即噪聲的幅度高)。對于這種情況，增益G設(shè)置為接近0，以使噪聲衰減。因此，干凈語音的幅度被設(shè)置為接近0。

先驗信噪比(SNR)ξ(k,l)可以使用等式3來估計，其中α是在0和1之間的常數(shù)，并且P(k,l)是算符，其可以由等式4表示。

圖1示出了有噪語音信號10和干凈語音信號12。有噪語音信號10包括語音(或語音樣本)和噪聲。干凈語音信號12是沒有噪聲的語音。有噪語音信號10的示例性幀在方框14內(nèi)。由方框14指定的幀具有很少的語音(即語音的幅度接近零)和大量噪聲(即，對于此幀，與語音相比，噪聲的幅度高和/或SNR低)。

圖2A和2B示出了說明如何產(chǎn)生音樂噪聲的曲線圖。圖2A示出了真實語音的幅度、有噪語音的幅度R(k,l)、和估計的語音幅度的示例。圖2B的值對應(yīng)于圖2A的值。圖2B示出了等式4中的變量的值的示例。

如圖2B所示，R(k,l)²和λ_N(k,l)均是隨機(jī)“之字形”并且處于大約相同的平均水平(即具有相似的幅度)。在某些頻段，R(k,l)²<λ_N(k,l)，因而根據(jù)等式4，P(k,l)的值為零。在其他頻段中，R(k,l)²>λ_N(k,l)，因而根據(jù)等式4，P(k,l)的值是非零值。由于R(k,l)²和λ_N(k,l)在某些頻段處是隨機(jī)的之字形，所以對應(yīng)P(k,l)的值是非零的，但是在與具有非零P(k,l)值的頻段相鄰的頻段處，P(k,l)的值為零。因此，P(k,l)在某些頻段處示出孤立的峰，并且根據(jù)等式3，對于相同頻段，先驗SNRξ(k，l)也具有孤立的峰。取決于常數(shù)α，先驗SNRξ(k，l)的孤立峰的幅度可以小于P(k,l)的幅度。

低的先驗SNRξ(k，l)的值可以導(dǎo)致遠(yuǎn)小于1(例如，接近0并且大于或等于0)的增益。高的先驗SNRξ(k，l)的值導(dǎo)致接近1且小于或等于1的增益。因此，估計的語音幅度是增益乘以有噪語音的幅度R(k,l)，其在P(k,l)具有孤立的峰的頻段處具有孤立的峰。這在圖2A中示出。估計的語音幅度的孤立的峰是音樂噪聲。

對于上述由方框14指定的幀，R(k,l)²和λ_N(k,l)處于類似的平均水平。這是因為由方框14指定的幀的內(nèi)容大部分是噪聲。因此，R(k,l)²是瞬時噪聲電平。λ_N(k,l)是估計的平滑噪聲電平或如上所述的估計的噪聲先驗方差。R(k,l)²具有與λ_N(k,l)相似的平均電平的這一事實指示λ_N(k,l)被正確地估計。

技術(shù)實現(xiàn)要素：

提供了一種系統(tǒng)，包括第一增益模塊、算符模塊、先驗?zāi)K、后驗?zāi)K和第二增益模塊。第一增益模塊被配置為：應(yīng)用非線性函數(shù)以基于(i)第一語音信號的幅度和(ii)估計的噪聲先驗方差來生成增益信號，噪聲被包括在第一語音信號中。算符模塊被配置為：基于(i)增益信號和(ii)估計的噪聲先驗方差來生成算符。先驗?zāi)K被配置為基于該算符來確定先驗信噪比。后驗?zāi)K被配置為基于(i)第一語音信號的幅度和(ii)估計的噪聲先驗方差來確定后驗信噪比。第二增益模塊被配置為：基于(i)先驗信噪比和(ii)后驗信噪比來確定增益值，以及基于(i)第一語音信號的幅度和(ii)增益值來生成與語音信號的幅度的估計相對應(yīng)的第二語音信號，其中第二語音信號基本上沒有音樂噪聲。

在其它特征中，提供了一種方法，并且包括：應(yīng)用非線性函數(shù)以基于(i)第一語音信號的幅度和(ii)估計的噪聲先驗方差來生成增益信號，噪聲被包括在第一語音信號中；基于(i)增益信號和(ii)估計的噪聲先驗方差來生成算符；基于該算符來確定先驗信噪比；以及基于(i)所述第一語音信號的幅度和(ii)估計的噪聲先驗方差來確定后驗信噪比。該方法還包括：基于(i)先驗信噪比和(ii)后驗信噪比來確定增益值；以及基于(i)所述第一語音信號的幅度和(ii)增益值，生成與第一語音信號的幅度的估計相對應(yīng)的第二語音信號，其中第二語音信號基本上沒有音樂噪音。

根據(jù)詳細(xì)的描述、權(quán)利要求和附圖，本公開的其它適用領(lǐng)域?qū)⒆兊妹黠@。詳細(xì)的描述和具體示例僅旨在用于說明的目的，并且不旨在限制本公開的范圍。

附圖說明

圖1是有噪語音信號和干凈語音信號的曲線圖。

圖2A是與圖1的有噪語音信號和干凈語音信號相對應(yīng)的真實語音的幅度、有噪語音的幅度R(k,l)和估計的語音幅度的曲線圖。

圖2B是用于估計圖1的語音幅度的R(k,l)²、估計的噪聲先驗方差λ_N(k,l)和算符P(k,l)的曲線圖。

圖3是有噪語音信號和干凈語音信號的另一曲線圖。

圖4A是與圖3的有噪語音信號和干凈語音信號相對應(yīng)的真實語音的幅度、有噪語音的幅度R(k,l)和估計的語音幅度的曲線圖。

圖4B是用于估計圖3的語音幅度的R(k,l)²、估計的噪聲先驗方差λ_N(k,l)和算符P(k,l)的曲線圖。

圖5是根據(jù)本公開的一個方面的包含具有語音估計模塊的網(wǎng)絡(luò)設(shè)備的音頻網(wǎng)絡(luò)的功能性框圖。

圖6是根據(jù)本公開的一個方面的包含語音估計模塊的控制模塊的功能性框圖。

圖7示出了根據(jù)本公開的一個方面的語音估計方法。

圖8是根據(jù)本公開的一個方面的非線性衰減/增益函數(shù)的曲線圖。

圖9A是根據(jù)本公開的一個方面的使用用于有噪語音信號的非線性衰減/增益函數(shù)而提供的真實語音的幅度、有噪語音的幅度R(k,l)和估計的語音幅度的曲線圖。

圖9B是在應(yīng)用圖9A的非線性衰減/增益函數(shù)之前和之后的估計的噪聲先驗方差λ_N(k,l)、算符P(k,l)、和R(k,l)²的曲線圖。

圖10A是根據(jù)本公開的一個方面的使用用于另一有噪語音信號的非線性衰減/增益函數(shù)而提供的真實語音的幅度、有噪語音的幅度R(k,l)和估計的語音幅度的曲線圖。

圖10B是在應(yīng)用圖10A的非線性衰減/增益函數(shù)之前和之后的估計的噪聲先驗方差λ_N(k,l)、算符P(k,l)、和R(k,l)²的曲線圖。

在附圖中，附圖標(biāo)記可以重新用于標(biāo)識類似和/或完全相同的元件。

具體實施方式

參考圖2A和2B，可以考慮估計的噪聲先驗方差λ_N(k,l)的縮放，以消除在比較R(k,l)²和λ_N(k,l)時產(chǎn)生的孤立的峰。去除峰導(dǎo)致音樂噪聲的消除。例如，可以修改以上給出的等式4以提供等式5，其中s是大于1的值。

s的值越大，P(k,l)中孤立的峰越少。然而，只要P(k,l)中存在孤立的峰，就會產(chǎn)生音樂噪聲。在具有較少的孤立的峰的情況下，音樂噪聲被更窄地帶化，并且因此可能對聽者而言更加不快。為了完全消除孤立的峰值，s必須增加到大的值，使得對于所有的k值，均有R(k,l)²<s·λ_N(k,l)。這需要大的s值，因為R(k，l)是瞬時的(沒有被平滑)?，F(xiàn)在參考圖1的示例性有噪語音信號12，為了完全消除P(k,l)的孤立的峰，s將必須大到5。大的s值導(dǎo)致對應(yīng)語音信號中的失真。

作為另一個例子，圖3示出了有噪語音信號30和干凈語音信號32的曲線圖。有噪語音信號30包括語音(或語音樣本)和噪聲。干凈語音信號32是沒有噪聲的語音。有噪語音信號30的示例性幀在方框34內(nèi)。由于語音的平均幅度遠(yuǎn)大于噪聲的平均幅度，所以由方框34指定的幀包含有效語音。

圖4A示出了真實語音的幅度、有噪語音(或有噪語音信號)的幅度R(k,l)和估計的語音幅度的示例。圖4B示出在s等于5的情況下等式5中變量的值的示例。圖4B的值對應(yīng)于圖4A的值。從圖4B可以看出，R(k,l)²的第一峰40和第四峰42以及真實語音的第一峰43和第四峰45在幅度上小于s·λ_N(k,l)的峰或與s·λ_N(k,l)的峰相當(dāng)。因此，使用等式5基本上忽略了第一峰40和第四峰42。如圖4A所示，與峰40、42、43、45相對應(yīng)的估計的語音幅度的點(diǎn)被顯著減小，其中第一峰(由點(diǎn)44指示)被消除，并且第四峰(由點(diǎn)46指定)的幅度減小。與真實語音信號的第四峰45相比，第四峰46的幅度減小。因此，使用上述等式5的降噪處理不消除音樂噪聲和/或?qū)е抡Z音失真。使用等式5的降噪處理不消除音樂噪聲(例如，少量孤立的峰保留在P(k,l)中)或者在語音信號中產(chǎn)生失真。以下公開了具有最小語音失真的消除音樂噪聲的示例。

圖5示出了包含網(wǎng)絡(luò)設(shè)備52、54、56的音頻網(wǎng)絡(luò)50。網(wǎng)絡(luò)設(shè)備52、54、56直接地或經(jīng)由網(wǎng)絡(luò)60(例如，互聯(lián)網(wǎng))彼此通信。通信可以是無線的或經(jīng)由有線的。諸如語音信號的音頻信號可以在網(wǎng)絡(luò)設(shè)備52、54、56之間傳輸。網(wǎng)絡(luò)設(shè)備52示出為具有音頻系統(tǒng)58，音頻系統(tǒng)58具有多個模塊和設(shè)備。網(wǎng)絡(luò)設(shè)備54、56可以包括與網(wǎng)絡(luò)設(shè)備52類似的模塊和/或設(shè)備。網(wǎng)絡(luò)設(shè)備54、56中的每一個可以是例如移動設(shè)備、蜂窩電話、計算機(jī)、平板電腦、電器設(shè)備(appliance)、服務(wù)器、外圍設(shè)備和/或其他網(wǎng)絡(luò)設(shè)備。

網(wǎng)絡(luò)設(shè)備52可以包括：具有語音估計模塊72的控制模塊70；物理層(PHY)模塊74、介質(zhì)訪問控制(MAC)模塊76、麥克風(fēng)78、揚(yáng)聲器80和存儲器82。語音估計模塊72接收有噪語音信號，對有噪語音信號中的噪聲進(jìn)行衰減，并且消除和/或防止具有最小語音失真或沒有語音失真的音樂噪聲的生成。有噪語音信號可以由網(wǎng)絡(luò)設(shè)備52經(jīng)由網(wǎng)絡(luò)60從網(wǎng)絡(luò)設(shè)備54接收，或者由網(wǎng)絡(luò)設(shè)備52直接從網(wǎng)絡(luò)設(shè)備56接收。有噪語音信號可以經(jīng)由天線84在PHY模塊74處接收并且經(jīng)由MAC模塊76轉(zhuǎn)發(fā)到控制模塊70。作為替選，有噪語音信號可以基于由麥克風(fēng)78檢測到的模擬音頻信號來生成。有噪語音信號可以由麥克風(fēng)78生成，并且從麥克風(fēng)78提供給控制模塊70。

語音估計模塊72基于有噪語音信號來提供估計的語音幅度信號(有時稱為估計的干凈語音信號)。語音估計模塊72可以對估計的語音幅度信號執(zhí)行快速傅里葉逆變換(IFFT)和數(shù)模(D/A)轉(zhuǎn)換，以提供輸出信號。輸出信號可以被提供給揚(yáng)聲器80用于播出，或者可以經(jīng)由模塊74、76和天線84被傳送回網(wǎng)絡(luò)設(shè)備54、56之一。

音頻(或有噪語音)信號可以經(jīng)由麥克風(fēng)78在網(wǎng)絡(luò)設(shè)備52處發(fā)起和/或從存儲器82訪問并且傳遞通過語音估計模塊72。由語音估計模塊72生成的與音頻信號相對應(yīng)的所得信號可以在揚(yáng)聲器80上播出和/或經(jīng)由模塊74、76和天線84發(fā)送到網(wǎng)絡(luò)設(shè)備54、56。

現(xiàn)在還參考圖6，圖6示出了根據(jù)一個實施例的控制模塊70?？刂颇K70可以包括模數(shù)(A/D)轉(zhuǎn)換器100、語音估計模塊72和D/A轉(zhuǎn)換器102。A/D轉(zhuǎn)換器100從諸如以下的音頻源接收模擬有噪語音信號104：經(jīng)由模塊74、76和天線84的網(wǎng)絡(luò)設(shè)備54、56之一；麥克風(fēng)78；存儲器82；和/或其他音頻源。A/D轉(zhuǎn)換器100將模擬有噪語音信號轉(zhuǎn)換為數(shù)字有噪語音信號。語音估計模塊72在衰減數(shù)字有噪語音信號中的噪聲以提供估計的語音幅度信號的同時，從數(shù)字有噪語音信號中消除音樂噪聲和/或防止音樂噪聲的生成。語音估計模塊72可以直接從音頻源104接收數(shù)字有噪語音信號。D/A轉(zhuǎn)換器102可以在播出和/或到網(wǎng)絡(luò)設(shè)備54、56之一的傳輸之前，將從語音估計模塊72接收的估計的語音幅度信號轉(zhuǎn)換為模擬信號。

語音估計模塊72可以包括快速傅里葉變換(FFT)模塊110、幅度模塊112、噪聲模塊114、衰減/增益模塊116、平方模塊117、除法器模塊118、先驗SNR模塊120、，后驗(或瞬時)SNR模塊122、第二增益模塊124和IFFT模塊126。模塊116、117、118可以包括在單個非線性功能模塊中和/或?qū)崿F(xiàn)為單個非線性功能模塊。模塊117和118可以包括在單個算符模塊中和/或?qū)崿F(xiàn)為單個算符模塊。參考圖7的方法描述模塊110、112、114、116、117、118、120、122、124和126的操作。

本文公開的系統(tǒng)可以使用多種方法來操作，示例性方法在圖7中示出。在圖7中，示出了語音估計方法。盡管主要關(guān)于圖5-6和圖8-10的實施方式描述了以下任務(wù)，但是可以容易地對任務(wù)進(jìn)行修改以應(yīng)用于本公開的其他實施方式。任務(wù)可以迭代地執(zhí)行。

該方法可以在150處開始。在152，F(xiàn)FT模塊110可以對接收和/或訪問的音頻(或有噪語音)信號y(t)執(zhí)行快速傅立葉變換，以提供數(shù)字有噪語音信號Y_k，其中t是時間，并且k是頻段索引。在154處，幅度模塊112可以確定數(shù)字有噪語音信號Y_k的幅度，并且生成有噪語音幅度信號R(k,l)。有噪語音幅度信號R(k,l)可以被生成為復(fù)數(shù)數(shù)字有噪語音信號Y_k的幅度。在156，噪聲模塊114基于數(shù)字有噪語音信號Y_k來確定估計的噪聲先驗方差λ_N(k,l)。

任務(wù)158和160可以根據(jù)等式6來執(zhí)行，其中g(shù)[]是具有輸入R(k,l)和λ_N(k,l)的非線性衰減/增益函數(shù)。

在158，衰減/增益(或第一函數(shù))模塊116基于有噪語音幅度信號R(k,l)和估計的噪聲先驗方差λ_N(k,l)來生成衰減/增益信號ag(k,l)。衰減/增益信號ag(k,l)是非線性衰減/增益函數(shù)g[]的結(jié)果，并且可以根據(jù)以下規(guī)則生成：

1.如果R(k,l)²>>λ_N(k,l)，則非線性衰減/增益函數(shù)g[]的輸出或ag(k,l)等于R(k,l)。符號“>>”意指基本上大于并且可以指代大于λ_N(k,l)的預(yù)定量。這由圖8的曲線圖的第一部分I表示。第一部分I可以是線性的。圖8示出了表示非線性衰減/增益函數(shù)的示例性曲線圖。該曲線圖包括三個部分I、II、III，并且是非線性衰減/增益函數(shù)g[]的輸出相對于估計的噪聲先驗方差λ_N(k,l)。

2.如果R(k,l)²基本上不大于λ_N(k,l)，則非線性衰減/增益函數(shù)g[]的輸出或ag(k,l)可以是R(k,l)的衰減版本，或者增益的量可以減少到0。衰減量或增益的量可以是預(yù)定的、固定的和/或變量。衰減量可以隨著R(k,l)減小而增加，如圖8的曲線圖的部分II和III所示。部分III的R(k,l)的衰減的量大于部分II的R(k,l)的衰減的量。部分II可以是非線性的，并且隨著減少的R(k,l)從減少量的增益轉(zhuǎn)變?yōu)樵黾恿康乃p。部分III可以是線性的并且隨著減小的R(k,l)而提供增加量的衰減。點(diǎn)159和161是部分I、II和III之間的點(diǎn)，在此處圖8的總曲線的斜率從部分I、II、III中的第一部分的第一斜率改變?yōu)椴糠諭、II、III中的第二部分的第二斜率。盡管圖8所示的非線性衰減/增益函數(shù)具有某些線性和/或非線性的三個部分，但是非線性衰減/增益函數(shù)可以具有任意數(shù)量的具有相應(yīng)線性和/或非線性的部分。部分I、II、III具有相應(yīng)的衰減和/或增益的量。

3.由衰減/增益模塊116執(zhí)行的從R(k,l)到輸出ag(k,l)的映射是連續(xù)且單調(diào)的。由于R(k,l)大于或等于0，輸出ag(k,l)在R(k,l)是0時為0，并且為非負(fù)數(shù)。

在160，平方(或第二函數(shù))模塊117對輸出ag(k,l)求平方以提供ag(k,l)²。在162，除法器(或第三函數(shù))模塊118將ag(k,l)²除以λ_N(k,l)，以提供等式6的P(k,l)。

通過使用上述規(guī)則和等式6，通過避免產(chǎn)生孤立的峰來消除音樂噪聲。注意，等式6不包括等式4和/或等式5中的減法。由于語音能量大于噪聲能量，如果R(k,l)²>>λ_N(k,l)，則對應(yīng)的信號能量很可能是語音能量而不是噪聲能量。為此，信號不被修改。換句話說，輸出ag(k,l)等于R(k,l)。否則，信號能量為語音的可能性降低，并且信號能量為噪聲的可能性隨著減小的R(k,l)而增加。為此，生成減小的增益量和/或衰減的P(k,l)，導(dǎo)致降低的噪聲量。當(dāng)R(k,l)²與λ_N(k,l)差不多相同(例如，在其預(yù)定量內(nèi))或小于λ_N(k,l)時，則R(k,l)很可能是噪聲并且被嚴(yán)重衰減。這減小了噪聲并且還有助于防止孤立的峰的形成。

孤立的峰是由于與例如等式4相關(guān)聯(lián)的不連續(xù)性而形成。這是因為在一個特定頻段處，當(dāng)R(k,l)²<λ_N(k,l)時等式4導(dǎo)致P(k,l)等于0，而在下一頻段處，當(dāng)R(k+1,l)²>λ_N(k+1,l)時等式4為提供非零的、大的值。在所提出的算法中，由于與等式6相關(guān)聯(lián)的上述規(guī)則的特征3，所以P(k,l)>0。此外，由于上述規(guī)則的特征2，P(k+1,l)可以是嚴(yán)重衰減的值。由于這些原因，不會產(chǎn)生將導(dǎo)致音樂噪聲的孤立的峰。

存在可用于g[]的若干可能的非線性衰減/增益函數(shù)。圖8和上述規(guī)則提供了一個示例。作為另一個例子，如果R(k,l)大于第一預(yù)定量(例如3)與λ_N(k,l)的乘積，則ag(k,l)被設(shè)置為等于R(k,l)。否則，如果R(k,l)小于或等于第一預(yù)定量與λ_N(k,l)的乘積和/或則ag(k,l)被設(shè)置為等于R(k,l)的衰減版本，諸如第二預(yù)定量(例如0.1)與R(k,l)的乘積。

在164處，先驗SNR模塊(或第一SNR模塊)120基于P(k,l)和λ_N(k,l)和先前幅度來確定先驗SNRξ(k,l)。增益模塊124可以為所接收到的和/或訪問得到的語音信號的先前幀生成先前幅度在166處，后驗SNR模塊(或第二SNR模塊)122可以基于R(k,l)和λ_N(k,l)來確定后驗SNRγ(k,l)。

在168，增益(或第二增益)模塊124可以根據(jù)ξ(k,l)和/或γ(k,l)生成估計的語音幅度信號作為示例，等式7到等式10可以用于生成估計的語音幅度信號其中v是由等式7定義的參數(shù)并且G是應(yīng)用于R(k,l)的增益。

估計的語音幅度信號可以從增益模塊124提供給IFFT模塊126。增益G的值可以大于或等于0并且小于或等于1。增益G的值被設(shè)置為衰減噪聲，并且保持語音的幅度。在170，IFFT模塊126執(zhí)行估計的語音幅度信號的IFFT以提供輸出信號，該輸出信號可以被提供給D/A轉(zhuǎn)換器102。該方法可以在172處結(jié)束。

上述任務(wù)意在是說明性的示例；任務(wù)可以根據(jù)應(yīng)用來順序地、同步地、同時地、連續(xù)地、在重疊時間段期間或以不同的順序而執(zhí)行。此外，取決于實現(xiàn)和/或事件的順序，任何任務(wù)可以不被執(zhí)行或跳過。例如，可以跳過任務(wù)152和/或任務(wù)170。

通過應(yīng)用上述非線性衰減/增益函數(shù)以提供算符P(k,l)，先驗SNRξ(k,l)的隨后確定和估計的干凈語音信號的生成不引入音樂噪聲。例如，通過應(yīng)用圖8的非線性衰減/增益函數(shù)，對于圖1的有噪語音信號10的由方框14指定的幀，提供圖9A的估計的語音幅度在被“凈化”之前(即，在應(yīng)用非線性衰減/增益函數(shù)并且增益模塊124將增益函數(shù)G應(yīng)用于有噪語音的幅度R(k,l)之前)，由方框14指定的幀具有大部分噪聲。圖9A示出了以下項的曲線圖：真實語音的幅度；有噪語音的幅度R(k,l)；以及使用非線性衰減/增益函數(shù)針對有噪語音信號提供的估計的語音幅度圖9B示出了以下項的曲線圖：在應(yīng)用非線性衰減/增益函數(shù)之前和之后的R(k,l)²；估計的噪聲先驗方差λ_N(k,l)；和用于估計圖9A的語音幅度的算符P(k,l)。

通過應(yīng)用圖8的非線性衰減/增益函數(shù)，對于圖3的有噪語音信號30的由方框34指定的幀，提供圖10A的估計的語音幅度在被凈化之前，由方框34指定的幀具有大量的語音。圖10A示出了以下項的曲線圖：真實語音的幅度；有噪語音的幅度R(k,l)；和使用非線性衰減/增益函數(shù)提供的估計的語音幅度圖10B示出了以下項的曲線圖：在應(yīng)用非線性衰減/增益函數(shù)之前和之后的R(k,l)²；估計的噪聲先驗方差λ_N(k,l)；和用于估計圖10A的語音幅度的算符P(k,l)。

從圖9A中可以看出，沒有尖銳的孤立的峰并且沒有音樂噪聲。盡管該實施例示出沒有音樂噪聲，但是在本公開的其他實施例中，音樂噪聲基本上被消除，但是沒有完全被消除。對于音樂噪聲基本上被消除的實施例，基本上消除是指估計的語音幅度不具有尖銳的孤立的峰，并且音樂噪聲的幅度小于真實語音和/或有噪語音信號的幅度的預(yù)定分?jǐn)?shù)。在一個實施例中，預(yù)定分?jǐn)?shù)為1/5、1/10或1/100。音樂噪聲可以在預(yù)定分?jǐn)?shù)的預(yù)定范圍(例如，0.1)內(nèi)。取代音樂噪聲，存在具有低幅度的寬帶噪聲。寬帶噪聲可能聽不到和/或不會令聽者不快。從圖10A可以看出，與圖4A的估計的語音幅度的第一峰44和第四峰46不同，圖10A的估計的語音幅度的第一峰200和第四峰202沒有被衰減或最小程度地被衰減，并且未被扭曲。因此，與對應(yīng)的真實語音和/或有噪語音信號R(k,l)的峰相比，語音的峰被保留。

本公開中描述的無線通信可以完全或部分地符合IEEE標(biāo)準(zhǔn)802.11-2012、IEEE標(biāo)準(zhǔn)802.16-2009、IEEE標(biāo)準(zhǔn)802.20-2008和/或藍(lán)牙核心規(guī)范v4.0來進(jìn)行。在各種實現(xiàn)中，可以通過藍(lán)牙核心規(guī)范附錄2、3或4中的一個或多個來修改藍(lán)牙核心規(guī)范v4.0。在各種實現(xiàn)中，IEEE 802.11-2012可以由草案IEEE標(biāo)準(zhǔn)802.11ac、草案IEEE標(biāo)準(zhǔn)802.11ad、和/或草案IEEE標(biāo)準(zhǔn)802.11ah來補(bǔ)充。

上述描述本質(zhì)上僅是說明性的，并且決不旨在限制本公開、其應(yīng)用或使用。本公開的廣泛教導(dǎo)可以以各種形式實現(xiàn)。因此，盡管本公開包括特定示例，但是本公開的真實范圍不應(yīng)當(dāng)如此被限制，因為在研究附圖、說明書和所附權(quán)利要求時，其他修改將變得明顯。應(yīng)當(dāng)理解，在不改變本公開的原理的情況下，方法中的一個或多個步驟可以以不同的順序(或同時地)執(zhí)行。此外，盡管每個實施例在上面被描述為具有某些特征，但是關(guān)于本公開的任一實施例描述的那些特征中的任何一個或多個可以在其他實施例中任意一個的特征中實現(xiàn)和/或與其他實施例中任意一個的特征的組合來實現(xiàn)，即使該組合沒有被明確地描述。換句話說，所描述的實施例不是相互排斥的，并且一個或多個實施例彼此的置換保持在本公開的范圍內(nèi)。

元件之間(例如，在模塊、電路元件、半導(dǎo)體層等之間)的空間關(guān)系和功能關(guān)系使用包括“連接”、“接合”、“耦合”、“鄰近”、“靠近”、“在...之上”、“在...上面”、“在...下面”和“設(shè)置”的各種術(shù)語來描述。當(dāng)在上述公開中描述了第一元件和第二元件之間的關(guān)系時，除非明確描述為“直接的”，該關(guān)系可以是其中在第一元件和第二元件之間不存在其它中間元件的直接關(guān)系，但是也可以是其中在第一元件和第二元件之間存在(在空間上或功能上)一個或多個中間元件的間接關(guān)系。如本文所使用的短語A、B和C中的至少一個應(yīng)當(dāng)被解釋為意味著使用非排他性邏輯OR的邏輯(A OR B OR C)，并且不應(yīng)被解釋為表示“A中的至少一個、B中的至少一個、和C中的至少一個”。

在本申請中，包括以下定義，術(shù)語“模塊”或術(shù)語“控制器”可以用術(shù)語“電路”替換。術(shù)語“模塊”可以指代作為以下各項的一部分或包括以下各項：專用集成電路(ASIC)；數(shù)字、模擬或混合的模擬/數(shù)字離散電路；數(shù)字、模擬或混合的模擬/數(shù)字集成電路；組合邏輯電路；現(xiàn)場可編程門陣列(FPGA)；執(zhí)行代碼的處理器電路(共享的、專用的或組)；存儲由處理器電路執(zhí)行的代碼的存儲器電路(共享的、專用的或組)、提供所描述的功能的其它合適的硬件組件；或上述的一些或全部的組合，諸如在片上系統(tǒng)中。

模塊可以包括一個或多個接口電路。在一些示例中，接口電路可以包括連接到局域網(wǎng)(LAN)、互聯(lián)網(wǎng)、廣域網(wǎng)(WAN)或其組合的有線或無線接口。本公開的任何給定模塊的功能可以分布在經(jīng)由接口電路連接的多個模塊中。例如，多個模塊可以允許負(fù)載均衡。在另一示例中，服務(wù)器(也稱為遠(yuǎn)程或云)模塊可以代表客戶端模塊來完成一些功能。

如上所使用的術(shù)語代碼可以包括軟件、固件和/或微代碼，并且可以指程序、例程、函數(shù)、類、數(shù)據(jù)結(jié)構(gòu)和/或?qū)ο?。術(shù)語共享處理器電路涵蓋執(zhí)行來自多個模塊中的一些或全部代碼的單個處理器電路。術(shù)語組處理器電路涵蓋處理器電路與附加處理器電路組合來執(zhí)行來自一個或多個模塊的一些或所有代碼。對多個處理器電路的引用涵蓋分立管芯上的多個處理器電路、單個管芯上的多個處理器電路、單個處理器電路的多個核、單個處理器電路的多個線程或以上的組合。術(shù)語共享存儲器電路涵蓋存儲來自多個模塊的一些或所有代碼的單個存儲器電路。術(shù)語組存儲器電路涵蓋與附加存儲器組合來存儲來自一個或多個模塊中的一些或所有代碼的存儲器電路。

術(shù)語存儲器電路是術(shù)語計算機(jī)可讀介質(zhì)的子集。如本文所使用的術(shù)語計算機(jī)可讀介質(zhì)不涵蓋通過介質(zhì)(諸如在載波上)傳播的暫態(tài)的電信號或電磁信號；術(shù)語計算機(jī)可讀介質(zhì)因此可以被認(rèn)為是有形的和非暫態(tài)的。非暫態(tài)有形計算機(jī)可讀介質(zhì)的非限制性示例是非易失性存儲器電路(諸如閃存電路、可擦除可編程只讀存儲器電路、或掩模只讀存儲器電路)、易失性存儲器電路(諸如靜態(tài)隨機(jī)存取存儲器電路或動態(tài)隨機(jī)存取存儲器電路)、磁存儲介質(zhì)(諸如模擬或數(shù)字磁帶或硬盤驅(qū)動器)、和光存儲介質(zhì)(諸如CD、DVD或藍(lán)光光盤)。

本申請中所描述的裝置和方法可以部分地或完全地由通過配置通用計算機(jī)來執(zhí)行在計算機(jī)程序中實施的一個或多個特定功能而創(chuàng)建的專用計算機(jī)來實現(xiàn)。上述功能塊、流程圖組件和其他元件用作軟件規(guī)范，其可以通過熟練的技術(shù)人員或程序員的例行工作轉(zhuǎn)換成計算機(jī)程序。

計算機(jī)程序包括存儲在至少一個非瞬時性有形計算機(jī)可讀介質(zhì)上的處理器可執(zhí)行指令。計算機(jī)程序還可以包括或依賴于所存儲的數(shù)據(jù)。計算機(jī)程序可以涵蓋與專用計算機(jī)的硬件交互的基本輸入/輸出系統(tǒng)(BIOS)、與專用計算機(jī)的特定設(shè)備交互的設(shè)備驅(qū)動程序、一個或多個操作系統(tǒng)、用戶應(yīng)用程序、后臺服務(wù)、后臺應(yīng)用程序等

計算機(jī)程序可以包括：(i)要解析的描述性文本，諸如HTML(超文本標(biāo)記語言)或XML(可擴(kuò)展標(biāo)記語言)，(ii)匯編代碼，(iii)由編譯器從源代碼生成的目標(biāo)代碼，(iv)用于由解釋器執(zhí)行的源代碼，(v)用于由即時編譯器編譯和執(zhí)行的源代碼等。僅作為示例，源代碼可以使用來自包括C、C++、C#、Objective C、Haskell、Go、SQL、R、Lisp、Fortran、Perl、Pascal、Curl、OCaml、HTML5、Ada、ASP(動態(tài)服務(wù)器頁面)、PHP、Scala、Eiffel、Smalltalk、Erlang、Ruby、VisualLua和的語言的語法來編寫。

在權(quán)利要求中記載的元件都不旨在是35U.S.C.§112(f)的含義內(nèi)的部件加功能(means-plus-function)元件，除非元件使用短語“用于......的部件”明確地記載或在使用短語“操作用于”或“用于...的步驟”的方法權(quán)利要求的情況下。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2 3

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：謝晉;K·賈因
技術(shù)所有人：馬維爾國際貿(mào)易有限公司
我是此專利的發(fā)明人

上一篇：潛油電纜的制作方法與工藝
上一篇：一種砌墻機(jī)器人液壓切磚器的制作方法與工藝

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

增益衰減相關(guān)技術(shù)

指數(shù)衰減函數(shù)相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

用于經(jīng)由非線性衰減/增益函數(shù)來消除音樂噪聲的方法和裝置與流程