專(zhuān)利名稱(chēng):從記錄設(shè)備消除噪聲的裝置和方法
技術(shù)領(lǐng)域:
本發(fā)明總體構(gòu)思涉及一種記錄裝置,更具體地講,涉及一種當(dāng)包括噪聲內(nèi)容和實(shí)際音頻內(nèi)容的信號(hào)被輸入到記錄設(shè)備中時(shí)消除噪聲內(nèi)容的噪聲消除設(shè)備和方法。
背景技術(shù):
傳統(tǒng)地,當(dāng)使用攝像機(jī)記錄運(yùn)動(dòng)圖像時(shí),由變焦距電動(dòng)機(jī)或音鼓電動(dòng)機(jī)的旋轉(zhuǎn)產(chǎn)生噪聲。由于噪聲通過(guò)麥克風(fēng)被記錄在音頻信號(hào)中,所以當(dāng)音頻信號(hào)被再現(xiàn)時(shí)聲音質(zhì)量降低。
因此,用于消除噪聲的噪聲消除技術(shù)已經(jīng)變得必要。通常,噪聲消除設(shè)備使用傳統(tǒng)譜減(spectral subtraction)方法來(lái)消除背景噪聲。
現(xiàn)在將描述傳統(tǒng)譜減方法。
通過(guò)麥克風(fēng)輸入的模擬信號(hào)被轉(zhuǎn)換為數(shù)字信號(hào)。數(shù)字信號(hào)在時(shí)間軸域被分為多個(gè)幀(即時(shí)間窗口)以減少幀之間的信息不連續(xù)以及信號(hào)的失真。從其獲得幀的數(shù)字信號(hào)使用快速傅立葉變換(FFT)運(yùn)算被轉(zhuǎn)換為頻譜信號(hào)。
譜信號(hào)包括幅度譜信息和相位譜信息。幅度譜信息被用于譜減,相位譜信息被用于逆FFT(IFFT)運(yùn)算。
譜減是從包括實(shí)際音頻內(nèi)容和噪聲內(nèi)容的幅度譜中減去估計(jì)的噪聲譜的運(yùn)算。這里,一般通過(guò)將噪聲區(qū)域的幅度譜平均來(lái)計(jì)算音頻區(qū)域的噪聲譜。
當(dāng)噪聲特性正常時(shí),估計(jì)的噪聲譜與實(shí)際噪聲譜相似。因此,通過(guò)譜減獲得的幅度譜是僅實(shí)際音頻內(nèi)容的幅度譜。
通過(guò)譜減獲得的幅度譜和相位譜被混合,并且幅度譜被恢復(fù)以通過(guò)IFFT在時(shí)域上再現(xiàn)原始信號(hào)。
在傳統(tǒng)譜減方法中,噪聲內(nèi)容的頻率模式被提前估計(jì),并且當(dāng)在其中噪聲內(nèi)容和實(shí)際音頻內(nèi)容被混合的信號(hào)被輸入時(shí),僅噪聲內(nèi)容被消除。然而,如果噪聲內(nèi)容的頻率模式被不準(zhǔn)確估計(jì),即如果實(shí)際音頻內(nèi)容的頻率分量被確定為部分的噪聲內(nèi)容,則一部分的實(shí)際音頻內(nèi)容可與噪聲內(nèi)容被錯(cuò)誤地減去。另外,如果噪聲內(nèi)容被不準(zhǔn)確地估計(jì),則僅部分的噪聲內(nèi)容可被減去。其結(jié)果是,傳統(tǒng)減方法不能合適地消除噪聲內(nèi)容。
發(fā)明內(nèi)容
本發(fā)明總體構(gòu)思提供一種通過(guò)在噪聲譜在其中根據(jù)音頻信號(hào)被更新的區(qū)域中獨(dú)立地設(shè)置閾值來(lái)從包括噪聲內(nèi)容的音頻信號(hào)消除噪聲內(nèi)容的方法。
本發(fā)明總體構(gòu)思還提供一種噪聲消除設(shè)備和一種使用噪聲消除方法的記錄裝置。
將在接下來(lái)的描述中部分闡述本發(fā)明總體構(gòu)思的另外的方面和優(yōu)點(diǎn),還有一部分通過(guò)描述將是清楚的,或者可以經(jīng)過(guò)本發(fā)明的實(shí)施而得知。
通過(guò)提供一種從被分為多個(gè)幀的音頻信號(hào)中消除噪聲的方法可實(shí)現(xiàn)本發(fā)明總體構(gòu)思的上述和/或其他方面和優(yōu)點(diǎn),該方法包括在根據(jù)輸入音頻信號(hào)的音頻譜估計(jì)的噪聲譜在其中被更新的區(qū)域中通過(guò)可變獨(dú)立地設(shè)置一個(gè)或多個(gè)閾值來(lái)確定噪聲幀是否存在;如果當(dāng)前幀被確定為噪聲幀,則根據(jù)先前幀的噪聲譜和當(dāng)前幀的噪聲譜來(lái)更新估計(jì)的噪聲譜;和從輸入當(dāng)前幀的音頻譜中減去更新的噪聲譜。
通過(guò)提供一種用于記錄裝置的噪聲消除設(shè)備也可實(shí)現(xiàn)本發(fā)明總體構(gòu)思的上述和/或其他方面和優(yōu)點(diǎn),該設(shè)備包括FFT單元,通過(guò)對(duì)被分為多個(gè)幀的音頻信號(hào)執(zhí)行快速傅立葉變換運(yùn)算來(lái)計(jì)算頻譜信息;噪聲幀檢測(cè)器,在根據(jù)由FFT單元計(jì)算的頻譜估計(jì)的噪聲譜在其中被更新的區(qū)域中,通過(guò)獨(dú)立可變地設(shè)置閾值來(lái)確定噪聲幀;噪聲譜更新單元,如果由噪聲幀檢測(cè)器確定當(dāng)前幀為在其中僅噪聲存在的幀,則使用當(dāng)前幀的噪聲譜和先前幀的噪聲譜來(lái)更新估計(jì)的噪聲譜;譜減法器,從音頻信號(hào)的譜減去由噪聲譜更新單元更新的估計(jì)的噪聲譜;加法器,將從譜減法器輸出的音頻譜與從FFT單元輸出的相位譜信息相加;和IFFT單元,通過(guò)逆快速傅立葉變換運(yùn)算將從加法器輸出的音頻譜恢復(fù)為時(shí)域上的原始信號(hào)。
通過(guò)結(jié)合附圖對(duì)實(shí)施例進(jìn)行的以下描述,本發(fā)明總體構(gòu)思的這些和/或其他方面和優(yōu)點(diǎn)將會(huì)變得更加清楚和更容易理解,其中圖1是示出根據(jù)本發(fā)明總體構(gòu)思的實(shí)施例的記錄裝置的噪聲消除設(shè)備的方框圖;圖2是示出在圖1的噪聲幀檢測(cè)器中檢測(cè)噪聲幀的方法的流程圖;圖3A至3C是示出更新噪聲譜的處理的波形圖;和圖4A和4B是示出在根據(jù)本發(fā)明總體構(gòu)思的實(shí)施例的噪聲減方法被應(yīng)用之前和之后的音頻信號(hào)的波形圖。
具體實(shí)施例方式
現(xiàn)在,詳細(xì)描述本發(fā)明總體構(gòu)思的實(shí)施例,其示例在附圖中表示,其中,相同的標(biāo)號(hào)始終表示相同的部件。以下通過(guò)參考附圖描述實(shí)施例以解釋本發(fā)明總體構(gòu)思。
圖1是示出根據(jù)本發(fā)明總體構(gòu)思的實(shí)施例的記錄裝置的噪聲消除設(shè)備的方框圖。
參照?qǐng)D1,噪聲消除設(shè)備包括預(yù)處理器110、快速傅立葉變換(FFT)單元120、噪聲幀檢測(cè)器130、噪聲譜更新單元140、譜減法器150、加法器160和逆快速傅立葉變換(IFFT)單元170。
通過(guò)麥克風(fēng)輸入的模擬信號(hào)被轉(zhuǎn)換為數(shù)字信號(hào)。模擬信號(hào)包括音頻信號(hào)并且包括混合在一起的噪聲內(nèi)容和實(shí)際音頻內(nèi)容。
預(yù)處理器110將在其中噪聲內(nèi)容和實(shí)際音頻內(nèi)容被混合的音頻信號(hào)分為多個(gè)幀,并且根據(jù)幀對(duì)音頻信號(hào)分窗口。漢明窗口(Hamming windows)或哈寧窗口(Hanning windows)可被用于將視頻信號(hào)分窗口為幀。窗口在幀的端點(diǎn)減輕不連續(xù)性的影響。
FFT單元120使用FFT運(yùn)算將被預(yù)處理器110分為幀的音頻信號(hào)轉(zhuǎn)換為頻譜信息。頻譜信息包括關(guān)于音頻信號(hào)的幅度譜信息和相位譜信息。幅度譜信息被用于頻減,相位譜信息被用于IFFT運(yùn)算。
噪聲幀檢測(cè)器130根據(jù)當(dāng)前幀三個(gè)閾值的比較來(lái)確定由FFT單元120處理的當(dāng)前幀F(xiàn)FT是否僅包括噪聲內(nèi)容(即,為“僅噪聲”幀)或者當(dāng)前幀是否包括噪聲內(nèi)容和實(shí)際音頻內(nèi)容。如果確定當(dāng)前幀僅包括噪聲內(nèi)容,則噪聲幀檢測(cè)器130向噪聲譜更新單元140輸出當(dāng)前幀{X_n[w]+N_n[w]}。即,當(dāng)當(dāng)前幀同時(shí)滿(mǎn)足三個(gè)條件時(shí),噪聲幀檢測(cè)器130確定當(dāng)前幀為僅噪聲幀,這三個(gè)條件包括與當(dāng)前幀的能量比較的第一閾值、與當(dāng)前幀的譜的能量和估計(jì)的噪聲譜的能量之間的差比較的第二閾值、與當(dāng)前幀的譜和估計(jì)的噪聲譜之間的差比較的第三閾值。第一、第二和第三閾值根據(jù)在其中估計(jì)的噪聲譜被更新的區(qū)域被獨(dú)立地設(shè)置。估計(jì)的噪聲譜根據(jù)當(dāng)前幀的噪聲譜和先前幀的噪聲譜被更新。
當(dāng)確定當(dāng)前幀僅包括噪聲內(nèi)容時(shí),噪聲譜更新單元140使用當(dāng)前幀的譜{X_n[w]+N_n[w]}(包括實(shí)際音頻內(nèi)容X_n[w]和噪聲內(nèi)容N_n[w])和先前估計(jì)的噪聲譜來(lái)更新當(dāng)前估計(jì)的噪聲譜。即,由噪聲譜更新單元140更新的噪聲譜通過(guò)以下被給定N_n[w]=N_n-1[w]*(1-α)+{X_n[w]+N_n[w]}*α。
這里,N_n-1[w]是先前幀的噪聲譜,X_n[w]是當(dāng)前幀的實(shí)際音頻譜,N_n[w]是當(dāng)前幀的噪聲譜,并且α是噪聲譜更新系數(shù)。當(dāng)前幀的實(shí)際音頻譜X_n[w]可等于0,并且噪聲譜更新系數(shù)α可等于0.2。
譜減法器150從相應(yīng)于幅度譜信息的當(dāng)前幀的譜減去由噪聲譜更新單元140更新的估計(jì)的噪聲譜,以獲得當(dāng)前幀的實(shí)際音頻譜。
加法器160將從譜減法器150輸出的當(dāng)前幀的實(shí)際音頻譜與從FFT單元120輸出的相位譜信息相加。
IFFT單元170通過(guò)IFFT將從加法器160輸出的實(shí)際音頻信號(hào)的幅度譜信息和相位譜信息恢復(fù)為時(shí)域上的音頻信號(hào)。
圖2是示出在圖1的噪聲幀檢測(cè)器130中檢測(cè)噪聲幀的方法的流程圖。
參照?qǐng)D2,在操作210,音頻信號(hào)被轉(zhuǎn)換為幀的頻譜。
音頻信號(hào)的能量被監(jiān)控。在操作220,音頻信號(hào)的當(dāng)前幀的能量與第一能量閾值E_th比較。由于僅包括噪聲內(nèi)容的幀的能量小于包括噪聲內(nèi)容和實(shí)際音頻內(nèi)容的幀的能量,所以如果當(dāng)前幀是僅噪聲幀則當(dāng)前幀的能量必須小于第一能量閾值E_th。如果當(dāng)前幀的能量大于第一能量閾值E_th,則在操作290,更新計(jì)數(shù)UpdateCNT被初始化為0。
如果當(dāng)前幀的能量小于第一能量閾值E_th,則音頻信號(hào)的幀的能量的變化被監(jiān)控。在操作230,當(dāng)前幀的能量和在先前幀中更新的噪聲譜的能量之間的差ENERGYDIFF被與第二能量差閾值E_th比較。由于僅噪聲幀的能量變化小于包括噪聲內(nèi)容和音頻內(nèi)容的幀的能量變化,所以如果當(dāng)前幀是僅噪聲幀則當(dāng)前幀和在先前幀中更新的噪聲譜之間的能量差必須小于第二閾值能量差ED_th。如果該能量差大于第二閾值ED_th,則在操作290,UpdateCNT被初始化為0。
如果當(dāng)前幀的能量和在先前幀中更新的噪聲譜的能量之間的差小于第二能量差閾值ED_th,則音頻信號(hào)的譜的變化被監(jiān)控。在操作240,當(dāng)前幀的譜和在先前幀中更新的噪聲譜之間的差SPECTEDIFF與第三譜差閾值SD_th比較。由于僅噪聲幀的譜變化小于包括噪聲內(nèi)容和音頻內(nèi)容的幀的譜變化,所以如果當(dāng)前幀是僅噪聲幀則當(dāng)前幀和在先前幀中更新的噪聲譜之間的譜差必須小于第三譜差閾值SD_th。如果譜差大于第三譜差閾值SD_th,則在操作290,UpdateCNT被初始化為0。
如果當(dāng)前幀的譜和在先前幀中更新的噪聲譜之間的差小于第三譜差SD_th,則確定當(dāng)前幀為僅噪聲幀,并且僅包括噪聲內(nèi)容,并且在操作250執(zhí)行噪聲譜更新。
當(dāng)能量、能量差和譜差分別小于第一能量、第二能量差和第三譜差閾值時(shí),在操作260,UpdateCNT加1(即UpdateCNT++)。UpdateCNT是跟蹤連續(xù)僅噪聲的數(shù)目的變量。
在步驟270如果UpdateCNT大于閾值UC_th,則在操作280,根據(jù)當(dāng)前幀的噪聲譜,ED_th和SD_th被更新。圖2所示的方法將當(dāng)前幀的能量和當(dāng)前幀的譜與在先前幀中更新的噪聲譜比較以確定當(dāng)前幀是否為僅噪聲幀。如果當(dāng)前幀被確定為僅噪聲幀,則噪聲譜更新單元140將在先前幀中更新的噪聲譜更新為新更新的噪聲譜以與隨后的音頻信號(hào)的幀的譜比較。因此,一旦噪聲譜被更新,隨后幀的譜與新更新的噪聲譜比較直到在隨后幀中另一僅噪聲幀被檢測(cè),在那時(shí)刻新更新的噪聲譜被再次更新。第一能量、第二能量差和第三譜差閾值被設(shè)置,從而噪聲幀檢測(cè)器130檢測(cè)當(dāng)前幀是否為僅噪聲幀。當(dāng)連續(xù)僅噪聲幀的確定值(即UC_th)被檢測(cè)到時(shí),閾值被更新。
圖3A至3C是示出更新噪聲譜的處理的波形圖。
經(jīng)驗(yàn)確定的初始噪聲譜的特征可與當(dāng)前輸入噪聲譜的特征不同。在這種情況下,初始噪聲譜必須根據(jù)當(dāng)前輸入噪聲譜被更新?,F(xiàn)在將參照?qǐng)D3A至3C所示的第一能量、第二能量差和第三譜差閾值的改變來(lái)描述更新初始噪聲譜的處理。圖3A示出通過(guò)左和右信道輸入的當(dāng)前幀的能量和第一能量閾值E_th(虛線(xiàn))。圖3B示出當(dāng)前幀的能量和在先前幀中更新的噪聲譜的能量之間的差以及第二閾值ED_th(虛線(xiàn))。這里,圖3B的上邊波形表示輸入音頻信號(hào),圖3B的下邊波形表示代表能量差的輪廓。圖3C示出當(dāng)前幀的譜和在先前幀中更新的噪聲譜之間的差以及第三閾值SD_th(虛線(xiàn))。這里,圖3C的上邊波形表示輸入音頻信號(hào),圖3C的下邊波形表示代表譜差的輪廓。
參照?qǐng)D3A至3C,在第一個(gè)10個(gè)噪聲譜更新周期期間,通過(guò)將第一、第二和第三閾值設(shè)置為大值,初始噪聲譜被允許與輸入噪聲譜近似。然后,通過(guò)在下一個(gè)10個(gè)噪聲譜更新周期期間減小第二和第三閾值ED_th和SD_th,通過(guò)準(zhǔn)確地檢測(cè)包括噪聲內(nèi)容和音頻內(nèi)容的幀,噪聲譜被更新。最終,在下一噪聲譜更新周期期間嚴(yán)格地設(shè)置第二和第三閾值ED_th和SD_th,通過(guò)準(zhǔn)確地檢測(cè)僅噪聲幀,噪聲譜被更新。
圖4A和4B是顯示在根據(jù)本發(fā)明總體構(gòu)思的實(shí)施例的噪聲減(noisesubtraction)方法被應(yīng)用之前和之后左和右信道音頻信號(hào)的波形圖。盡管圖3A、4A和4B示出左和右信道音頻信號(hào),但是其他類(lèi)型的音頻信道信號(hào)可被用于本發(fā)明總體構(gòu)思。
參照?qǐng)D4A和4B,通過(guò)采用根據(jù)本發(fā)明總體構(gòu)思的實(shí)施例的噪聲消除方法,僅噪聲內(nèi)容被消除,并且輸出音頻信號(hào)接近無(wú)噪聲內(nèi)容。
如上所述,根據(jù)本發(fā)明總體構(gòu)思的實(shí)施例,在通過(guò)根據(jù)在其中輸入信號(hào)的噪聲譜被更新的區(qū)域設(shè)置變化的閾值,在不影響實(shí)際音頻信號(hào)的同時(shí)僅消除噪聲,記錄在如攝像機(jī)的音頻記錄設(shè)備中的音頻信號(hào)的聲音質(zhì)量可被大大提高。當(dāng)攝像機(jī)包括記錄單元或機(jī)芯,相應(yīng)于噪聲譜的噪聲從記錄單元或機(jī)芯產(chǎn)生。因此,實(shí)際音頻信號(hào)由輸入單元的麥克風(fēng)接收,包括攝像機(jī)外面產(chǎn)生的音頻,也可不包括由記錄單元或機(jī)芯產(chǎn)生的噪聲。
盡管已經(jīng)顯示和描述了本發(fā)明總體構(gòu)思的一些實(shí)施例,但是本領(lǐng)域的技術(shù)人員應(yīng)該理解,在不脫離由所附權(quán)利要求及其等同物限定其范圍的本發(fā)明總體構(gòu)思的原理和精神的情況下,可對(duì)這些實(shí)施例進(jìn)行改變。
權(quán)利要求
1.一種從被分為多個(gè)幀的音頻信號(hào)中消除噪聲的方法,該方法包括在根據(jù)輸入音頻信號(hào)的音頻譜估計(jì)的噪聲譜在其中被更新的區(qū)域中通過(guò)可變獨(dú)立地設(shè)置一個(gè)或多個(gè)閾值來(lái)確定噪聲幀是否存在;如果當(dāng)前幀被確定為噪聲幀,則根據(jù)先前幀的噪聲譜和當(dāng)前幀的噪聲譜來(lái)更新估計(jì)的噪聲譜;和從輸入當(dāng)前幀的音頻譜中減去更新的噪聲譜。
2.如權(quán)利要求1所述的方法,其中,噪聲幀是否存在的確定包括將一個(gè)或多個(gè)閾值分別于當(dāng)前幀的能量、輸入當(dāng)前幀的音頻譜的能量和估計(jì)的噪聲譜的能量之間的差、以及輸入當(dāng)前幀的音頻譜和估計(jì)的噪聲譜之間的差比較。
3.如權(quán)利要求1所述的方法,其中,噪聲幀是否存在的確定包括使用音頻信號(hào)的初始噪聲譜近似輸入噪聲譜。
4.如權(quán)利要求1所述的方法,其中,一個(gè)或多個(gè)閾值包括第一、第二和第三閾值,并且噪聲幀是否存在的確定包括如果當(dāng)前幀的能量小于第一閾值、當(dāng)前幀的能量和在先前幀中更新的估計(jì)的噪聲譜的能量之間的差小于第二閾值、并且輸入當(dāng)前幀的音頻譜和在先前幀中更新的估計(jì)的噪聲譜之間的差小于第三閾值,則確定當(dāng)前幀是噪聲幀。
5.如權(quán)利要求4所述的方法,還包括根據(jù)在其中估計(jì)的噪聲譜被更新的區(qū)域獨(dú)立地設(shè)置第一、第二和第三閾值,其中,當(dāng)前幀滿(mǎn)足第一、第二和第三閾值的條件時(shí),噪聲譜被更新。
6.一種從被分為多個(gè)幀的音頻信號(hào)中消除噪聲的方法,該方法包括將被分為多個(gè)幀的信號(hào)的頻率特征與估計(jì)的噪聲譜比較;根據(jù)比較的結(jié)果,確定估計(jì)的噪聲譜是否準(zhǔn)確地近似實(shí)際噪聲譜;和當(dāng)確定估計(jì)的噪聲譜不與實(shí)際噪聲譜準(zhǔn)確近似時(shí),更新估計(jì)的噪聲譜。
7.如權(quán)利要求6所述的方法,還包括從信號(hào)的當(dāng)前幀減去估計(jì)的噪聲譜;和輸出無(wú)噪聲內(nèi)容的信號(hào)。
8.如權(quán)利要求6所述的方法,其中,估計(jì)的噪聲譜的更新包括將估計(jì)的噪聲譜改變?yōu)楫?dāng)前幀的噪聲譜。
9.如權(quán)利要求8所述的方法,其中,每當(dāng)當(dāng)前幀僅包含噪聲內(nèi)容時(shí),估計(jì)的噪聲譜被更新。
10.如權(quán)利要求6所述的方法,其中,估計(jì)的噪聲譜是否準(zhǔn)確地近似實(shí)際噪聲譜的確定包括通過(guò)將當(dāng)前幀的能量與第一閾值比較、將當(dāng)前幀和估計(jì)的噪聲譜之間的能量差與第二閾值比較、并且將當(dāng)前幀的譜和估計(jì)的噪聲譜之間的差與第三閾值比較來(lái)確定當(dāng)前幀是否僅包含噪聲內(nèi)容。
11.如權(quán)利要求10所述的方法,其中,當(dāng)當(dāng)前幀的能量小于第一閾值、當(dāng)前幀和估計(jì)的噪聲譜之間的能量差小于第二閾值、并且當(dāng)前幀的譜和估計(jì)的噪聲譜之間的差小于第三閾值時(shí),當(dāng)前幀被確定僅包含噪聲內(nèi)容。
12.如權(quán)利要求11所述的方法,其中,第一、第二和第三閾值被設(shè)置為分別大于僅包含噪聲內(nèi)容的幀的預(yù)計(jì)能量、僅包含噪聲內(nèi)容的幀和估計(jì)的噪聲譜之間的預(yù)計(jì)能量差、以及僅包含噪聲內(nèi)容的幀和估計(jì)的噪聲譜之間的預(yù)計(jì)譜差。
13.如權(quán)利要求11所述的方法,其中,在預(yù)定數(shù)目的僅包含噪聲內(nèi)容連續(xù)幀被確定之后更新第一、第二和第三閾值。
14.如權(quán)利要求11所述的方法,其中,當(dāng)估計(jì)的噪聲譜不準(zhǔn)確地近似實(shí)際噪聲譜時(shí)估計(jì)的噪聲譜的更新包括在第一數(shù)量的噪聲譜更新周期期間,將第一、第二和第三閾值設(shè)置為相對(duì)大的值;在第二數(shù)量的噪聲譜更新期間,在減小第一、第二和第三閾值的同時(shí),更新估計(jì)的噪聲譜;和在第三數(shù)量的噪聲譜更新期間,根據(jù)當(dāng)前幀和估計(jì)的噪聲譜的比較來(lái)更新估計(jì)的噪聲譜。
15.如權(quán)利要求6所述的方法,其中,估計(jì)的噪聲譜根據(jù)以下被更新N_n[w]=N_n-1[w]*(1-α)+{X_n[w]+N_n[w]}*α其中,N_n[w]是更新的噪聲譜,N_n-1[w]是在先前幀中更新的估計(jì)的噪聲譜,α是噪聲譜更新系數(shù),并且{X_n[w]+N_n[w]}是當(dāng)前幀的譜。
16.一種噪聲消除設(shè)備,包括FFT單元,通過(guò)對(duì)被分為多個(gè)幀的音頻信號(hào)執(zhí)行快速傅立葉變換運(yùn)算來(lái)產(chǎn)生頻譜信息;噪聲幀檢測(cè)器,在根據(jù)由FFT單元產(chǎn)生的頻譜信息估計(jì)的噪聲譜在其中被更新的區(qū)域中通過(guò)可變獨(dú)立地設(shè)置閾值來(lái)確定噪聲幀;噪聲譜更新單元,如果由噪聲檢測(cè)器確定當(dāng)前幀為在其中僅噪聲存在的幀,則使用當(dāng)前幀的噪聲譜和先前幀的噪聲譜來(lái)更新估計(jì)的噪聲譜;和譜減法器,從音頻信號(hào)的譜中減去由噪聲譜更新單元更新的估計(jì)噪聲以產(chǎn)生實(shí)際音頻譜。
17.如權(quán)利要求16所述的設(shè)備,其中,噪聲幀檢測(cè)器包括一個(gè)或多個(gè)比較器,將當(dāng)前幀的能量和第一閾值比較,將當(dāng)前幀的能量和在先前幀中更新的噪聲譜的能量之間的能量差與第二閾值比較,和將當(dāng)前幀的譜和在先前幀中更新的噪聲譜之間的譜差與第三閾值比較;和確定單元,如果當(dāng)前幀的能量、能量差和譜差分別小于第一、第二和第三閾值,則確定當(dāng)前幀為噪聲幀。
18.如權(quán)利要求17所述的設(shè)備,其中,噪聲幀檢測(cè)器設(shè)置第一、第二和第三閾值以指示估計(jì)的噪聲譜是否準(zhǔn)確地近似當(dāng)前幀的實(shí)際噪聲譜,并且當(dāng)當(dāng)前幀滿(mǎn)足第一、第二和第三閾值的條件時(shí),估計(jì)的噪聲譜被更新。
19.如權(quán)利要求16所述的設(shè)備,還包括相加單元,將實(shí)際音頻譜和從FFT單元產(chǎn)生的相位譜信息相加。
20.一種記錄裝置中的噪聲消除設(shè)備,該設(shè)備包括FFT單元,通過(guò)對(duì)被分為多個(gè)幀的音頻信號(hào)執(zhí)行快速傅立葉變換運(yùn)算來(lái)計(jì)算頻譜信息;噪聲幀檢測(cè)器,在根據(jù)由FFT單元計(jì)算的頻譜,估計(jì)的噪聲譜在其中被更新的區(qū)域中,通過(guò)獨(dú)立可變地設(shè)置閾值來(lái)確定噪聲幀;噪聲譜更新單元,如果由噪聲幀檢測(cè)器確定當(dāng)前幀為在其中僅噪聲存在的幀,則使用當(dāng)前幀的噪聲譜和先前幀的噪聲譜來(lái)更新估計(jì)的噪聲譜;譜減法器,從音頻信號(hào)的譜中減去由噪聲譜更新單元更新的估計(jì)的噪聲譜;加法器,將從譜減法器輸出的音頻譜與從FFT單元輸出的相位譜相加;和IFFT單元,通過(guò)逆快速傅立葉變換運(yùn)算將從加法器輸出的音頻譜恢復(fù)為時(shí)域上的原始信號(hào)。
21.一種記錄裝置,包括記錄單元,具有產(chǎn)生噪聲信號(hào)的記錄機(jī)芯;輸入單元,接收實(shí)際音頻信號(hào);和噪聲消除設(shè)備,接收包括噪聲信號(hào)和實(shí)際音頻信號(hào)的音頻信號(hào),將音頻信號(hào)分為多個(gè)幀,根據(jù)在根據(jù)輸入音頻信號(hào)的音頻譜在其中噪聲譜被更新的區(qū)域中被獨(dú)立設(shè)置的一個(gè)或多個(gè)閾值來(lái)確定噪聲幀是否存在,并且從多個(gè)幀的輸入當(dāng)前幀的音頻譜減去噪聲譜。
22.一種記錄裝置,包括噪聲消除設(shè)備,通過(guò)在估計(jì)的噪聲譜在其中根據(jù)輸入音頻信號(hào)的音頻譜被更新的區(qū)域中獨(dú)立可變地設(shè)置一個(gè)或多個(gè)閾值來(lái)確定噪聲幀是否存在,如果當(dāng)前幀被確定為噪聲幀,則根據(jù)先前幀的噪聲譜和當(dāng)前幀的噪聲譜來(lái)更新估計(jì)的噪聲譜,并且從輸入當(dāng)前幀的音頻譜中減去更新的噪聲譜。
23.如權(quán)利要求22所述的記錄裝置,其中,記錄裝置包括攝像機(jī)。
24.如權(quán)利要求22所述的記錄裝置,還包括記錄單元,具有產(chǎn)生噪聲譜的記錄機(jī)芯。
25.如權(quán)利要求22所述的記錄裝置,還包括輸入單元,具有接收實(shí)際音頻譜的麥克風(fēng)。
全文摘要
一種從輸入到如攝像機(jī)的記錄裝置的包括噪聲內(nèi)容和音頻內(nèi)容的信號(hào)消除噪聲內(nèi)容的噪聲消除設(shè)備和方法。該方法包括在根據(jù)輸入音頻信號(hào)的音頻譜估計(jì)的噪聲譜在其中被更新的區(qū)域中通過(guò)可變獨(dú)立地設(shè)置一個(gè)或多個(gè)閾值來(lái)確定噪聲幀是否存在;如果當(dāng)前幀被確定為噪聲幀,則根據(jù)先前幀的噪聲譜和當(dāng)前幀的噪聲譜來(lái)更新估計(jì)的噪聲譜;和從輸入當(dāng)前幀的音頻譜中減去更新的噪聲譜。
文檔編號(hào)G10L15/20GK1728237SQ20051007993
公開(kāi)日2006年2月1日 申請(qǐng)日期2005年6月27日 優(yōu)先權(quán)日2004年7月27日
發(fā)明者吳潤(rùn)學(xué) 申請(qǐng)人:三星電子株式會(huì)社