亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

用于語音實(shí)時(shí)降噪的方法和設(shè)備的制作方法

文檔序號:2825916閱讀:439來源:國知局
用于語音實(shí)時(shí)降噪的方法和設(shè)備的制作方法
【專利摘要】本發(fā)明的各實(shí)施方式涉及一種用于語音實(shí)時(shí)降噪的方法和設(shè)備。具體地,所述方法例如可以包括:對實(shí)時(shí)語音數(shù)據(jù)進(jìn)行分幀處理;設(shè)置動(dòng)態(tài)能量閾值;基于所述動(dòng)態(tài)能量閾值來獲取平穩(wěn)的噪聲譜;基于譜減法生成經(jīng)降噪的語音數(shù)據(jù);以及消除所述經(jīng)降噪的語音數(shù)據(jù)中殘留的隨機(jī)噪聲。并且,提供了與所述方法相對應(yīng)的設(shè)備。通過使用本發(fā)明的各實(shí)施方式提供的方法和設(shè)備能夠?qū)?shí)時(shí)語音降噪同時(shí)不損傷語音的音質(zhì),從而獲得良好的用戶體驗(yàn)。
【專利說明】用于語音實(shí)時(shí)降噪的方法和設(shè)備
【技術(shù)領(lǐng)域】
[0001]本發(fā)明的各實(shí)施方式總體上涉及語音處理領(lǐng)域,并且更具體地,本發(fā)明的各實(shí)施方式涉及一種用于語音實(shí)時(shí)降噪的方法和設(shè)備。
【背景技術(shù)】
[0002]隨著語音通信的普及,語音作為重要的交流媒體受到了廣泛重視。目前,在語音通信系統(tǒng)中,普遍使用譜減法來對語音進(jìn)行降噪。然而,傳統(tǒng)的譜減法在提高語音質(zhì)量的同時(shí)損傷了語音的音質(zhì),并且產(chǎn)生了令人討厭的“音樂噪聲”。雖然,譜減法可以成功地消除語音中的噪聲,但由于“音樂噪聲”的引入使得語音的整體質(zhì)量有所下降,收聽者經(jīng)常能夠發(fā)現(xiàn)譜減法處理后語音中的“音樂噪聲”比原始語音信號中的噪聲更為清晰,因此嚴(yán)重限制了譜減法的應(yīng)用。
[0003]因此,期望提供一種能夠在應(yīng)用譜減法對語音降噪的同時(shí)不引入“音樂噪聲”并且減少譜減法對語音音質(zhì)損傷的方法和設(shè)備。

【發(fā)明內(nèi)容】

[0004]為了解決上述問題,在本上下文中,本發(fā)明各實(shí)施方式的目的之一在于提供一種用于語音實(shí)時(shí)降噪的方法和設(shè)備。
[0005]根據(jù)本發(fā)明一個(gè)方面的某些實(shí)施方式,提供了一種用于語音實(shí)時(shí)降噪的方法,例如可以包括:對實(shí)時(shí)語音數(shù)據(jù)進(jìn)行分幀處理;設(shè)置動(dòng)態(tài)能量閾值;基于所述動(dòng)態(tài)能量閾值來獲取平穩(wěn)的噪聲譜;基于譜減法生成經(jīng)降噪的語音數(shù)據(jù);以及消除所述經(jīng)降噪的語音數(shù)據(jù)中殘留的隨機(jī)噪聲。
[0006]根據(jù)本發(fā)明一個(gè)方面的某些實(shí)施方式,提供了一種用于語音實(shí)時(shí)降噪的方法,其中對實(shí)時(shí)語音數(shù)據(jù)進(jìn)行分幀處理可以包括將所述實(shí)時(shí)語音數(shù)據(jù)分成語音幀并且將所述語音幀延遲預(yù)定時(shí)間間隔。
[0007]根據(jù)本發(fā)明一個(gè)方面的某些實(shí)施方式,提供了一種用于語音實(shí)時(shí)降噪的方法,其中設(shè)置動(dòng)態(tài)能量閾值可以包括將人最小的說話聲能量動(dòng)態(tài)地設(shè)置為最大能量閾值,并且將環(huán)境的平穩(wěn)噪聲能量動(dòng)態(tài)地設(shè)置為最小能量閾值。
[0008]根據(jù)本發(fā)明一個(gè)方面的某些實(shí)施方式,提供了一種用于語音實(shí)時(shí)降噪的方法,其中基于所述動(dòng)態(tài)能量閾值來獲取平穩(wěn)的噪聲譜可以包括在所延遲的預(yù)定時(shí)間間隔中獲取在所述動(dòng)態(tài)能量閾值范圍內(nèi)的平穩(wěn)的噪聲譜。
[0009]根據(jù)本發(fā)明一個(gè)方面的某些實(shí)施方式,提供了一種用于語音實(shí)時(shí)降噪的方法,其中基于譜減法生成經(jīng)降噪的語音數(shù)據(jù)可以包括從所述實(shí)時(shí)語音數(shù)據(jù)中減去所述平穩(wěn)的噪聲譜。
[0010]根據(jù)本發(fā)明一個(gè)方面的某些實(shí)施方式,提供了一種用于語音實(shí)時(shí)降噪的方法,其中消除所述經(jīng)降噪的語音數(shù)據(jù)中殘留的隨機(jī)噪聲可以進(jìn)一步包括:針對每個(gè)語音數(shù)據(jù)幀,計(jì)算其和前一個(gè)語音數(shù)據(jù)幀的乘積與其和后一個(gè)語音數(shù)據(jù)幀的乘積相加再除以2的結(jié)果;如果所述結(jié)果小于預(yù)定閾值,則判定所述語音數(shù)據(jù)幀為隨機(jī)噪聲,否則判定所述語音數(shù)據(jù)幀為語音數(shù)據(jù);以及將被判定為隨機(jī)噪聲的語音數(shù)據(jù)幀靜音。
[0011]根據(jù)本發(fā)明另一方面的某些實(shí)施方式,提供了一種用于語音實(shí)時(shí)降噪的設(shè)備,例如可以包括:分幀處理裝置,被配置為對實(shí)時(shí)語音數(shù)據(jù)進(jìn)行分幀處理;設(shè)置裝置,被配置為設(shè)置動(dòng)態(tài)能量閾值;獲取裝置,被配置為基于所述動(dòng)態(tài)能量閾值來獲取平穩(wěn)的噪聲譜;生成裝置,被配置為基于譜減法生成經(jīng)降噪的語音數(shù)據(jù);以及消除裝置,被配置為消除所述經(jīng)降噪的語音數(shù)據(jù)中殘留的隨機(jī)噪聲。
[0012]根據(jù)本發(fā)明另一方面的某些實(shí)施方式,提供了一種用于語音實(shí)時(shí)降噪的設(shè)備,其中對實(shí)時(shí)語音數(shù)據(jù)進(jìn)行分幀處理可以包括將所述實(shí)時(shí)語音數(shù)據(jù)分成語音幀并且將所述語音幀延遲預(yù)定時(shí)間間隔。
[0013]根據(jù)本發(fā)明另一方面的某些實(shí)施方式,提供了一種用于語音實(shí)時(shí)降噪的設(shè)備,其中設(shè)置動(dòng)態(tài)能量閾值可以包括將人最小的說話聲能量動(dòng)態(tài)地設(shè)置為最大能量閾值,并且將環(huán)境的平穩(wěn)噪聲能量動(dòng)態(tài)地設(shè)置為最小能量閾值。
[0014]根據(jù)本發(fā)明另一方面的某些實(shí)施方式,提供了一種用于語音實(shí)時(shí)降噪的設(shè)備,其中基于所述動(dòng)態(tài)能量閾值來獲取平穩(wěn)的噪聲譜可以包括在所延遲的預(yù)定時(shí)間間隔中獲取在所述動(dòng)態(tài)能量閾值范圍內(nèi)的平穩(wěn)的噪聲譜。
[0015]根據(jù)本發(fā)明另一方面的某些實(shí)施方式,提供了一種用于語音實(shí)時(shí)降噪的設(shè)備,其中基于譜減法生成經(jīng)降噪的語音數(shù)據(jù)可以包括從所述實(shí)時(shí)語音數(shù)據(jù)中減去所述平穩(wěn)的噪聲譜。
[0016]根據(jù)本發(fā)明另一方面的某些實(shí)施方式,提供了一種用于語音實(shí)時(shí)降噪的設(shè)備,其中所述消除裝置可以進(jìn)一步包括:計(jì)算裝置,被配置為針對每個(gè)語音數(shù)據(jù)幀,計(jì)算其和前一個(gè)語音數(shù)據(jù)幀的乘積與其和后一個(gè)語音數(shù)據(jù)幀的乘積相加再除以2的結(jié)果;判定裝置,被配置為如果所述結(jié)果小于預(yù)定閾值,則判定所述語音數(shù)據(jù)幀為隨機(jī)噪聲,否則判定所述語音數(shù)據(jù)幀為語音數(shù)據(jù);以及靜音裝置,被配置為經(jīng)被判定為隨機(jī)噪聲的語音數(shù)據(jù)幀靜音。
[0017]本發(fā)明示例性實(shí)施方式提供的示例性解決方案至少可以帶來如下顯著的技術(shù)效果:通過獲取平穩(wěn)的噪聲譜并且消除殘留的隨機(jī)噪聲,減少了譜減法對語音音質(zhì)的損傷以及引入的“音樂噪聲”,從而可以獲得良好的語音實(shí)時(shí)降噪處理效果。
【專利附圖】

【附圖說明】
[0018]通過參考附圖閱讀下文的詳細(xì)描述,本發(fā)明示例性實(shí)施方式的上述以及其他目的、特征和優(yōu)點(diǎn)將變得易于理解。在附圖中,以示例性而非限制性的方式示出了本發(fā)明的若干實(shí)施方式,其中:
[0019]圖1是示意性示出了根據(jù)本發(fā)明示例性實(shí)施方式的、用于語音實(shí)時(shí)降噪的方法流程圖;
[0020]圖2進(jìn)一步詳細(xì)示出了圖1中的步驟S105 ;
[0021]圖3示意性示出了根據(jù)本發(fā)明示例性實(shí)施方式的、用于語音實(shí)時(shí)降噪的設(shè)備框圖;
[0022]圖4進(jìn)一步詳細(xì)示出了圖3中的消除裝置305 ;
[0023]圖5A示意性示出了未經(jīng)處理的原聲頻譜;[0024]圖5B示意性示出了使用一般譜減法處理后的頻譜;
[0025]圖5C示意性示出了根據(jù)本發(fā)明各實(shí)施方式處理后的頻譜;
[0026]圖示意性示出了使用平穩(wěn)噪聲譜處理后的頻譜;以及
[0027]圖6示意性示出了將從本發(fā)明示例性實(shí)施方式中受益并且可以是本發(fā)明示例性實(shí)施方式示例裝置的移動(dòng)終端的框圖。
[0028]在附圖中,相同或?qū)?yīng)的標(biāo)號表不相同或?qū)?yīng)的部分。
【具體實(shí)施方式】
[0029]附圖中的流程圖和框圖,圖示了按照本發(fā)明各種實(shí)施例的裝置、方法和計(jì)算機(jī)程序產(chǎn)品的可能實(shí)現(xiàn)的體系架構(gòu)、功能和操作。在這點(diǎn)上,流程圖或框圖中的每個(gè)方框可以代表一個(gè)模塊、程序段、或代碼的一部分,所述模塊、程序段、或代碼的一部分包含一個(gè)或多個(gè)用于實(shí)現(xiàn)規(guī)定的邏輯功能的可執(zhí)行指令。也應(yīng)當(dāng)注意,在有些作為替換的實(shí)現(xiàn)中,方框中所標(biāo)注的功能也可以以不同于附圖中所標(biāo)注的順序發(fā)生。例如,兩個(gè)接連地表示的方框?qū)嶋H上可以基本并行地執(zhí)行,它們有時(shí)也可以按相反的順序執(zhí)行,這依所涉及的功能而定。也要注意的是,框圖和/或流程圖中的每個(gè)方框、以及框圖和/或流程圖中的方框的組合,可以用執(zhí)行規(guī)定的功能或操作的專用的基于硬件的系統(tǒng)來實(shí)現(xiàn),或者可以用專用硬件與計(jì)算機(jī)指令的組合來實(shí)現(xiàn)。
[0030]現(xiàn)在將僅通過示例性方式來詳細(xì)地描述本發(fā)明的各種實(shí)施方式。
[0031]首先參考圖1,其中圖1是示意性示出了根據(jù)本發(fā)明示例性實(shí)施方式的、用于語音實(shí)時(shí)降噪的方法流程圖。如圖1所示,根據(jù)本發(fā)明的各示例性實(shí)施方式,方法100例如可以包括對實(shí)時(shí)語音數(shù)據(jù)進(jìn)行分幀處理(SlOl)。
[0032]在一個(gè)示例性實(shí)施方式中,其中對實(shí)時(shí)語音數(shù)據(jù)進(jìn)行分幀處理可以包括將所述實(shí)時(shí)語音數(shù)據(jù)分成語音幀并且將所述語音幀延遲預(yù)定時(shí)間間隔。在一般的語音中,為了檢測純凈的噪聲譜,通常采用一般的語音活動(dòng)檢測(vad)算法,但該算法的運(yùn)算量比較大。這是因?yàn)関ad算法將所有的不為語音的聲音均作為噪聲譜,從而導(dǎo)致噪聲譜中殘留了大量的非平穩(wěn)噪聲的頻譜。這對于基于噪聲為平穩(wěn)的假設(shè)的譜減法而言會(huì)出現(xiàn)問題。為了能夠獲得平穩(wěn)的噪聲譜,可以將實(shí)時(shí)語音數(shù)據(jù)分成一幀一幀的,并且可以將語音幀延遲預(yù)定時(shí)間間隔(例如,15暈秒)。
[0033]進(jìn)一步地,方法100例如可以包括設(shè)置動(dòng)態(tài)能量閾值(S102)。
[0034]在一個(gè)示例性實(shí)施方式中,其中設(shè)置動(dòng)態(tài)能量閾值可以包括將人最小的說話聲能量動(dòng)態(tài)地設(shè)置為最大能量閾值,并且將環(huán)境的平穩(wěn)噪聲能量動(dòng)態(tài)地設(shè)置為最小能量閾值。這是因?yàn)樵趯?shí)時(shí)語音處理過程中,語音的噪聲譜是不斷需要檢測和更新的,通過采用對過去的噪聲譜賦予更大比重的方式,可以保證語音之前的隨機(jī)噪聲的消除。而對于平穩(wěn)噪聲閾值的設(shè)定,以平穩(wěn)人聲的最小能量值為上限,從而保證了最小平穩(wěn)說話聲不被消除;以及以一般室內(nèi)環(huán)境的平穩(wěn)噪聲為最低值,從而保證了降噪效果能夠達(dá)到。針對閾值的實(shí)際大小,可以動(dòng)態(tài)地根據(jù)所得到的語音中噪聲的情況,進(jìn)行自適應(yīng)調(diào)整。其中,調(diào)整方式是對閾值的大小進(jìn)行快增慢減。
[0035]進(jìn)一步地,方法100例如可以包括基于所述動(dòng)態(tài)能量閾值來獲取平穩(wěn)的噪聲譜(S103)。[0036]在一個(gè)示例性實(shí)施方式中,其中基于所述動(dòng)態(tài)能量閾值來獲取平穩(wěn)的噪聲譜可以包括在所延遲的預(yù)定時(shí)間間隔中獲取在所述動(dòng)態(tài)能量閾值范圍內(nèi)的平穩(wěn)的噪聲譜。具體地,為了獲取平穩(wěn)的噪聲譜,必須保證前面的15毫秒中,沒有能量大于動(dòng)態(tài)能量閾值上限的隨機(jī)噪聲。通過這種方式,可以消除上文所述的隨機(jī)噪聲譜的干擾。
[0037]進(jìn)一步地,方法100例如可以包括基于譜減法生成經(jīng)降噪的語音數(shù)據(jù)(S104)。
[0038]在一個(gè)示例性實(shí)施方式中,其中基于譜減法生成經(jīng)降噪的語音數(shù)據(jù)可以包括從所述實(shí)時(shí)語音數(shù)據(jù)中減去所述平穩(wěn)的噪聲譜。具體地,從實(shí)時(shí)語音數(shù)據(jù)中減去平穩(wěn)的噪聲譜可以及時(shí)地去掉較大的平穩(wěn)噪聲,同時(shí)由于聽覺的原因,語音后面可以有一段極短柔和噪聲,同時(shí)還可以保證小噪聲很快被消除。
[0039]進(jìn)一步地,方法100例如可以包括消除所述經(jīng)降噪的語音數(shù)據(jù)中殘留的隨機(jī)噪聲(S105)。
[0040]對于已經(jīng)保證了音質(zhì)效果但仍然殘留有大量音樂噪聲的語音,為了改進(jìn)譜減法一直不能消除的音樂噪聲問題,下面結(jié)合圖2給出能夠適合手機(jī)實(shí)時(shí)處理的降噪方法。參考圖2,其中圖2進(jìn)一步詳細(xì)示出了圖1中的步驟S105。如圖2所示,消除所述經(jīng)降噪的語音數(shù)據(jù)中殘留的隨機(jī)噪聲可以進(jìn)一步包括:針對每個(gè)語音數(shù)據(jù)幀,計(jì)算其和前一個(gè)語音數(shù)據(jù)幀的乘積與其和后一個(gè)語音數(shù)據(jù)幀的乘積相加再除以2的結(jié)果(S201);如果所述結(jié)果小于預(yù)定閾值,則判定所述語音數(shù)據(jù)幀為隨機(jī)噪聲,否則判定所述語音數(shù)據(jù)幀為語音數(shù)據(jù)(S202);以及將被判定為隨機(jī)噪聲的語音數(shù)據(jù)幀靜音(S203)。具體地,利用人們說話聲音的特性,即,人們說話的聲音不可能持續(xù)時(shí)間太短(例如,比自然界中隨機(jī)的噪聲還短)。對于每一幀語音數(shù)據(jù),將其和前一個(gè)語音數(shù)據(jù)幀的乘積與其和后一個(gè)語音數(shù)據(jù)幀的乘積相加再除以2,這樣就得到了類似于自相關(guān)函數(shù)的能量結(jié)果。但是注意,這與利用自相關(guān)函數(shù)獲取基頻不同。通過預(yù)先設(shè)定一個(gè)閾值,如果該能量結(jié)果小于該閾值,則認(rèn)為這是一段隨機(jī)噪聲,否則為語音。這是由于語音的始末位置,通過左右相乘,至少有一端是語音,所以計(jì)算的能量結(jié)果仍然較大,這樣就最大限度地保留了語音的細(xì)節(jié)。然而,對于隨機(jī)噪聲,多數(shù)是左右兩端都被譜減法置為很小的數(shù),因此計(jì)算得到的能量結(jié)果很小。通過上述操作就去除了殘留的隨機(jī)噪聲。如果存在持續(xù)時(shí)間較長的隨機(jī)噪聲,則可以適當(dāng)?shù)卦黾友舆t(例如,100毫秒),從而將噪聲完全消除。
[0041]下面參考圖3,其示出了根據(jù)本發(fā)明示例性實(shí)施方式的、用于語音實(shí)時(shí)降噪的設(shè)備300的示意性框圖。設(shè)備300例如可以包括:分幀處理裝置301,被配置為對實(shí)時(shí)語音數(shù)據(jù)進(jìn)行分幀處理;設(shè)置裝置302,被配置為設(shè)置動(dòng)態(tài)能量閾值;獲取裝置303,被配置為基于所述動(dòng)態(tài)能量閾值來獲取平穩(wěn)的噪聲譜;生成裝置304,被配置為基于譜減法生成經(jīng)降噪的語音數(shù)據(jù);以及消除裝置305,被配置為消除所述經(jīng)降噪的語音數(shù)據(jù)中殘留的隨機(jī)噪聲。
[0042]在一個(gè)示例性實(shí)施方式中,其中對實(shí)時(shí)語音數(shù)據(jù)進(jìn)行分幀處理可以包括將所述實(shí)時(shí)語音數(shù)據(jù)分成語音幀并且將所述語音幀延遲預(yù)定時(shí)間間隔。
[0043]在一個(gè)示例性實(shí)施方式中,其中設(shè)置動(dòng)態(tài)能量閾值可以包括將人最小的說話聲能量動(dòng)態(tài)地設(shè)置為最大能量閾值,并且將環(huán)境的平穩(wěn)噪聲能量動(dòng)態(tài)地設(shè)置為最小能量閾值。
[0044]在一個(gè)示例性實(shí)施方式中,其中基于所述動(dòng)態(tài)能量閾值來獲取平穩(wěn)的噪聲譜可以包括在所延遲的預(yù)定時(shí)間間隔中獲取在所述動(dòng)態(tài)能量閾值范圍內(nèi)的平穩(wěn)的噪聲譜。
[0045]在一個(gè)示例性實(shí)施方式中,其中基于譜減法生成經(jīng)降噪的語音數(shù)據(jù)可以包括從所述實(shí)時(shí)語音數(shù)據(jù)中減去所述平穩(wěn)的噪聲譜。
[0046]圖4進(jìn)一步詳細(xì)示出了圖3中的消除裝置305。所述消除裝置305可以進(jìn)一步包括:計(jì)算裝置401,被配置為針對每個(gè)語音數(shù)據(jù)幀,計(jì)算其和前一個(gè)語音數(shù)據(jù)幀的乘積與其和后一個(gè)語音數(shù)據(jù)幀的乘積相加再除以2的結(jié)果;判定裝置402,被配置為如果所述結(jié)果小于預(yù)定閾值,則判定所述語音數(shù)據(jù)幀為隨機(jī)噪聲,否則判定所述語音數(shù)據(jù)幀為語音數(shù)據(jù);以及靜音裝置403,被配置為經(jīng)被判定為隨機(jī)噪聲的語音數(shù)據(jù)幀靜音。
[0047]為清晰起見,在圖3和圖4中并未示出各個(gè)裝置所包含的子裝置。然而,應(yīng)當(dāng)理解,設(shè)備300中記載的裝置與分別參考圖1描述的方法100中的步驟相對應(yīng),以及消除裝置305中記載的裝置與分別參考圖2描述的步驟S105中的步驟相對應(yīng)。由此,上文針對圖1的方法200和圖2的步驟S105描述的操作和特征同樣適用于設(shè)備300和消除裝置305及其中包含的裝置和子裝置,在此不再贅述。
[0048]應(yīng)當(dāng)理解,設(shè)備300可以利用各種方式來實(shí)現(xiàn)。例如,在某些實(shí)施方式中,設(shè)備300可以利用軟件和/或固件模塊來實(shí)現(xiàn)。此外,設(shè)備300也可以利用硬件模塊來實(shí)現(xiàn)。例如,設(shè)備300可以實(shí)現(xiàn)為集成電路(IC)芯片或?qū)S眉呻娐?ASIC)。設(shè)備300也可以實(shí)現(xiàn)為片上系統(tǒng)(SOC)。此外,設(shè)備300也可以利用硬件模塊和軟件和/或固件模塊的組合來實(shí)現(xiàn)?,F(xiàn)在已知或者將來開發(fā)的其他方式也是可行的,本發(fā)明的范圍在此方面不受限制。
[0049]圖5A至圖圖示了實(shí)時(shí)語音頻譜。其中,圖5A示意性示出了未經(jīng)處理的原聲頻譜;圖5B示意性示出了使用一般譜減法處理后的頻譜;圖5C示意性示出了根據(jù)本發(fā)明各實(shí)施方式處理后的頻譜;以及圖示意性示出了使用平穩(wěn)噪聲譜處理后的頻譜。如圖5A所示,在原實(shí)時(shí)語音中存在大量噪聲,例如,可以包括路燈的平穩(wěn)噪聲和大量敲擊鍵盤等發(fā)出的隨機(jī)噪聲。雖然通過使用一般譜減法處理后(如圖5B所示)消除了大部分噪聲,但原聲的音質(zhì)受到了損傷(例如,與圖相比)。根據(jù)本發(fā)明的各實(shí)施方式,首先取得平穩(wěn)的噪聲譜,從而可以得到如圖所示的頻譜(即,幾乎沒有損傷原聲的音質(zhì)),繼而通過對語音幀的計(jì)算可以進(jìn)一步消除其中的噪聲,最終得到如圖5C所示的頻譜。如圖5C所示,其中消除了原音中存在的噪聲并且沒有引入新的噪聲,同時(shí)還沒有損傷原音的音質(zhì)。
[0050]下面參考圖6,其示出了適于用來實(shí)現(xiàn)本發(fā)明各實(shí)施方式的移動(dòng)終端600的示意性框圖。在圖6所示的示例中,移動(dòng)終端600是一個(gè)具有無線通信能力的移動(dòng)設(shè)備。然而,可以理解,這僅僅是示例性而非限制性的。其他類型的移動(dòng)終端也可以容易地采用本發(fā)明的實(shí)施方式,諸如便攜式數(shù)字助理(PDA)、尋呼機(jī)、移動(dòng)計(jì)算機(jī)、移動(dòng)電視、游戲設(shè)備、膝上型計(jì)算機(jī)、照相機(jī)、錄像機(jī)、GPS設(shè)備以及其他類型的語音和文本通信系統(tǒng)。固定式移動(dòng)終端同樣可以容易地使用本發(fā)明的實(shí)施方式。
[0051]移動(dòng)終端600包括一個(gè)或天線618,其可操作地與發(fā)射機(jī)614和接收機(jī)616進(jìn)行通信。移動(dòng)終端600還包括處理器612或者其他處理元件,其分別提供去往發(fā)射機(jī)614的信號和接收來自接收機(jī)616的信號。信號包括按照適當(dāng)蜂窩系統(tǒng)的空中接口標(biāo)準(zhǔn)的信令信息,并且還包括用戶語音、接收的數(shù)據(jù)和/或用戶生成的數(shù)據(jù)。在此方面,移動(dòng)終端600能夠利用一個(gè)或多個(gè)空中接口標(biāo)準(zhǔn)、通信協(xié)議、調(diào)制類型以及接入類型來進(jìn)行操作。作為示范,移動(dòng)終端600能夠根據(jù)多個(gè)第一代、第二代、第三代和/或第四代通信協(xié)議等中的任何協(xié)議來進(jìn)行操作。例如,移動(dòng)終端600可以能夠按照第二代(G)無線通信協(xié)議IS-136 (TDMA)、GSM和IS-95 (CDMA)來進(jìn)行操作,或者按照諸如UMTS、CDMA2000, WCDMA和TD-SCDMA的第三代(G)無線通信協(xié)議來進(jìn)行操作,或者按照第四代(4G)無線通信協(xié)議和/或類似協(xié)議進(jìn)行操作。
[0052]可以理解,處理器612包括實(shí)現(xiàn)移動(dòng)終端600的功能所需的電路。例如,處理器612可以包括數(shù)字信號處理器設(shè)備、微處理器設(shè)備、各種模數(shù)轉(zhuǎn)換器、數(shù)模轉(zhuǎn)換器和其他支持電路。移動(dòng)終端600的控制和信號處理功能按照這些設(shè)備各自的能力在其間分配。處理器612由此還可以包括在調(diào)制和傳輸之前對消息和數(shù)據(jù)進(jìn)行卷積編碼和交織的功能。處理器612還可以另外包括內(nèi)部語音編碼器,并且可以包括內(nèi)部數(shù)據(jù)調(diào)制解調(diào)器。此外,處理器612可以包括對可以存儲(chǔ)在存儲(chǔ)器中的一個(gè)或多個(gè)軟件程序進(jìn)行操作的功能。例如,處理器612可以能夠操作連接程序,諸如傳統(tǒng)的Web瀏覽器。連接程序繼而可以允許移動(dòng)終端600例如按照無線應(yīng)用協(xié)議(WAP)、超文本傳輸協(xié)議(HTTP)等來發(fā)射和接收Web內(nèi)容(諸如基于位置的內(nèi)容和/或其他web頁面內(nèi)容)。
[0053]移動(dòng)終端600還可以包括用戶接口,其例如可以包括耳機(jī)或者揚(yáng)聲器624、振鈴器622、麥克風(fēng)626、顯示屏628以及輸入接口 631,所有這些設(shè)備都耦合至處理器612。移動(dòng)終端600可以包括小鍵盤630。小鍵盤630可以包括傳統(tǒng)的數(shù)字鍵(0_9)和相關(guān)鍵(#、*),以及用于操作移動(dòng)終端600的其他鍵。備選地,小鍵盤630可以包括傳統(tǒng)的QWERTY小鍵盤布置。小鍵盤630還可以包括與功能相關(guān)聯(lián)的各種軟鍵。移動(dòng)終端600還可以包括相機(jī)模塊636,用于捕獲靜態(tài)和/或動(dòng)態(tài)圖像。
[0054]特別地,顯示屏628可以包括觸摸式屏幕和/或鄰近式屏幕,用戶可以通過直接操作屏幕而操作移動(dòng)終端600。此時(shí),顯示屏628同時(shí)充當(dāng)輸入設(shè)備和輸出設(shè)備二者。在這樣的實(shí)施方式中,輸入接口 631可以配置用于接收用戶通過例如普通的筆、專用觸筆和/或手指在顯示屏628上提供的輸入,包括指點(diǎn)輸入和手勢輸入。處理器612可配置用于檢測此類輸入,并且識別出用戶的手勢。
[0055]此外,移動(dòng)終端600可以包括諸如操縱桿的接口設(shè)備或者其他用于輸入接口。移動(dòng)終端600還包括電池634,諸如振動(dòng)電池組,用于為操作移動(dòng)終端600所需的各種電路供電,以及可選地提供機(jī)械振動(dòng)作為可檢測輸出。
[0056]移動(dòng)終端600可以進(jìn)一步包括用戶標(biāo)識模塊(UM)638。ΠΜ638通常是具有內(nèi)置處理器的存儲(chǔ)器設(shè)備。ΠΜ638例如可以包括訂戶標(biāo)識模塊(SM)、通用集成電路卡(UICC)、通用訂戶標(biāo)識模塊(USM)、可移動(dòng)用戶標(biāo)識模塊(R-UM)等。ΠΜ638通常存儲(chǔ)與移動(dòng)訂戶相關(guān)的信元。
[0057]移動(dòng)終端600還可以具有存儲(chǔ)器。例如,移動(dòng)終端600可以包括易失性存儲(chǔ)器640,例如包括用于數(shù)據(jù)臨時(shí)存儲(chǔ)的高速緩存區(qū)域的易失性隨機(jī)存取存儲(chǔ)器(RAM)。移動(dòng)終端600還可以包括其他非易失性存儲(chǔ)器642,其可以是嵌入式的和/或可移動(dòng)的。非易失性存儲(chǔ)器642可以附加地或者可選地包括例如EEPROM和閃存等。存儲(chǔ)器可以存儲(chǔ)移動(dòng)終端600所使用的多個(gè)信息片段和數(shù)據(jù)中的任意項(xiàng),以實(shí)現(xiàn)移動(dòng)終端600的功能。
[0058]所述移動(dòng)終端600可以配置用于實(shí)現(xiàn)上文結(jié)合圖2和圖3描述的方法以及作為結(jié)合圖4和圖5描述的裝置。
[0059]應(yīng)當(dāng)理解,圖6所述的結(jié)構(gòu)框圖僅僅為了示例的目的而示出的,而不是對本發(fā)明范圍的限制。在某些情況下,可以根據(jù)具體情況而增加或者減少某些設(shè)備。
[0060]已經(jīng)出于示出和描述的目的給出了本發(fā)明的說明書,但是其并不意在是窮舉的或者限制于所公開形式的發(fā)明。本領(lǐng)域技術(shù)人員可以想到很多修改和變體。本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,本發(fā)明實(shí)施方式中的方法和裝置可以以軟件、硬件、固件或其組合實(shí)現(xiàn)。
[0061]因此,實(shí)施方式是為了更好地說明本發(fā)明的原理、實(shí)際應(yīng)用以及使本領(lǐng)域技術(shù)人員中的其他人員能夠理解以下內(nèi)容而選擇和描述的,即,在不脫離本發(fā)明精神的前提下,做出的所有修改和替換都將落入所附權(quán)利要求定義的本發(fā)明保護(hù)范圍內(nèi)。
【權(quán)利要求】
1.一種用于語音實(shí)時(shí)降噪的方法,包括: 對實(shí)時(shí)語音數(shù)據(jù)進(jìn)行分幀處理; 設(shè)置動(dòng)態(tài)能量閾值; 基于所述動(dòng)態(tài)能量閾值來獲取平穩(wěn)的噪聲譜; 基于譜減法生成經(jīng)降噪的語音數(shù)據(jù);以及 消除所述經(jīng)降噪的語音數(shù)據(jù)中殘留的隨機(jī)噪聲。
2.根據(jù)權(quán)利要求1所述的方法,其中對實(shí)時(shí)語音數(shù)據(jù)進(jìn)行分幀處理包括將所述實(shí)時(shí)語音數(shù)據(jù)分成語音幀并且將所述語音幀延遲預(yù)定時(shí)間間隔。
3.根據(jù)權(quán)利要求1所述的方法,其中設(shè)置動(dòng)態(tài)能量閾值包括將人最小的說話聲能量動(dòng)態(tài)地設(shè)置為最大能量閾值,并且將環(huán)境的平穩(wěn)噪聲能量動(dòng)態(tài)地設(shè)置為最小能量閾值。
4.根據(jù)權(quán)利要求1至3所述的方法,其中基于所述動(dòng)態(tài)能量閾值來獲取平穩(wěn)的噪聲譜包括在所延遲的預(yù)定時(shí)間間隔中獲取在所述動(dòng)態(tài)能量閾值范圍內(nèi)的平穩(wěn)的噪聲譜。
5.根據(jù)權(quán)利要求1所述的方法,其中基于譜減法生成經(jīng)降噪的語音數(shù)據(jù)包括從所述實(shí)時(shí)語音數(shù)據(jù)中減去所述平穩(wěn)的噪聲譜。
6.根據(jù)權(quán)利要求1所述的方法,其中消除所述經(jīng)降噪的語音數(shù)據(jù)中殘留的隨機(jī)噪聲進(jìn)一步包括: 針對每個(gè)語音數(shù)據(jù)幀,計(jì)算其和前一個(gè)語音數(shù)據(jù)幀的乘積與其和后一個(gè)語音數(shù)據(jù)幀的乘積相加再除以2的結(jié)果; 如果所述結(jié)果小于預(yù)定閾值,則判定所述語音數(shù)據(jù)幀為隨機(jī)噪聲,否則判定所述語音數(shù)據(jù)幀為語音數(shù)據(jù);以及 將被判定為隨機(jī)噪聲的語音數(shù)據(jù)幀靜音。
7.一種用于語音實(shí)時(shí)降噪的設(shè)備,包括: 分幀處理裝置,被配置為對實(shí)時(shí)語音數(shù)據(jù)進(jìn)行分幀處理; 設(shè)置裝置,被配置為設(shè)置動(dòng)態(tài)能量閾值; 獲取裝置,被配置為基于所述動(dòng)態(tài)能量閾值來獲取平穩(wěn)的噪聲譜; 生成裝置,被配置為基于譜減法生成經(jīng)降噪的語音數(shù)據(jù);以及 消除裝置,被配置為消除所述經(jīng)降噪的語音數(shù)據(jù)中殘留的隨機(jī)噪聲。
8.根據(jù)權(quán)利要求7所述的設(shè)備,其中對實(shí)時(shí)語音數(shù)據(jù)進(jìn)行分幀處理包括將所述實(shí)時(shí)語音數(shù)據(jù)分成語音幀并且將所述語音幀延遲預(yù)定時(shí)間間隔。
9.根據(jù)權(quán)利要求7所述的設(shè)備,其中設(shè)置動(dòng)態(tài)能量閾值包括將人最小的說話聲能量動(dòng)態(tài)地設(shè)置為最大能量閾值,并且將環(huán)境的平穩(wěn)噪聲能量動(dòng)態(tài)地設(shè)置為最小能量閾值。
10.根據(jù)權(quán)利要求7至9所述的設(shè)備,其中基于所述動(dòng)態(tài)能量閾值來獲取平穩(wěn)的噪聲譜包括在所延遲的預(yù)定時(shí)間間隔中獲取在所述動(dòng)態(tài)能量閾值范圍內(nèi)的平穩(wěn)的噪聲譜。
11.根據(jù)權(quán)利要求7所述的設(shè)備,其中基于譜減法生成經(jīng)降噪的語音數(shù)據(jù)包括從所述實(shí)時(shí)語音數(shù)據(jù)中減去所述平穩(wěn)的噪聲譜。
12.根據(jù)權(quán)利要求7所述的設(shè)備,其中所述消除裝置進(jìn)一步包括: 計(jì)算裝置,被配置為針對每個(gè)語音數(shù)據(jù)幀,計(jì)算其和前一個(gè)語音數(shù)據(jù)幀的乘積與其和后一個(gè)語音數(shù)據(jù)幀的乘積相加再除以2的結(jié)果; 判定裝置,被配置為如果所述結(jié)果小于預(yù)定閾值,則判定所述語音數(shù)據(jù)幀為隨機(jī)噪聲,否則判定所述語音數(shù)據(jù)幀為語音數(shù)據(jù);以及靜音裝置,被配 置為經(jīng)被判定為隨機(jī)噪聲的語 音數(shù)據(jù)幀靜音。
【文檔編號】G10L21/0272GK103971698SQ201310033310
【公開日】2014年8月6日 申請日期:2013年1月25日 優(yōu)先權(quán)日:2013年1月25日
【發(fā)明者】朱寶 申請人:北京千橡網(wǎng)景科技發(fā)展有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
1