專利名稱:音頻信號(hào)處理裝置、音頻信號(hào)處理方法和程序的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及音頻信號(hào)處理裝置、音頻信號(hào)處理方法和程序。
背景技術(shù):
如IC記錄器和攝像機(jī)的音頻記錄裝置通過(guò)其內(nèi)置的小麥克風(fēng)記錄環(huán)境音頻。在通過(guò)音頻記錄裝置的音頻記錄中,用戶通過(guò)使用例如操作按鈕操作該音頻記錄裝置時(shí)產(chǎn)生的操作音作為噪音與記錄音頻混合。因此,已經(jīng)提出了用于檢測(cè)并降低作為音頻記錄裝置中的音頻記錄的噪聲而混合的操作音的技術(shù)(例如,參見(jiàn)日本專利公開(kāi) No. 2005-303681 (以下,稱為專利文獻(xiàn)1))。
發(fā)明內(nèi)容
在類似專利文獻(xiàn)1中描述的現(xiàn)有技術(shù)的噪聲檢測(cè)方法中,主要檢測(cè)對(duì)象是安裝在音頻記錄裝置自身上的操作按鈕的操作音。該操作音通常表現(xiàn)為通過(guò)音頻記錄獲得的音頻信號(hào)上的脈沖狀的噪聲信號(hào)。因此,可以通過(guò)將該脈沖狀的噪聲信號(hào)的幅度值(信號(hào)電平) 與閾值比較來(lái)容易地檢測(cè)由于操作音而導(dǎo)致的噪聲。然而,在與音頻記錄裝置分離的位置產(chǎn)生的特定突發(fā)噪聲表現(xiàn)為具有長(zhǎng)持續(xù)時(shí)間的不穩(wěn)定的噪聲信號(hào),并且難以檢測(cè)。例如,當(dāng)通過(guò)放置在辦公桌上的IC記錄器記錄會(huì)議的音頻時(shí),由會(huì)議參與者使用的筆記本個(gè)人計(jì)算機(jī)(以下,稱為筆記本PC)的鍵盤的操作音 (以下,稱為鍵盤音)經(jīng)常被與筆記本PC分離的位置的IC記錄器記錄,并且作為噪聲與記錄音頻混合。類似該鍵盤音,由與音頻記錄裝置分離的噪聲產(chǎn)生源產(chǎn)生的特定突發(fā)噪聲通過(guò)多個(gè)復(fù)雜路徑傳播到音頻記錄裝置。具體地,例如,該噪聲在空間中反射到音頻記錄裝置,并且作為在辦公桌中傳遞的振動(dòng)而傳播。結(jié)果,如果記錄鍵盤音等,則與上述簡(jiǎn)單的脈沖狀噪聲相比,其噪聲信號(hào)具有較長(zhǎng)持續(xù)時(shí)間并且非單調(diào)衰減。因此,在其中僅將音頻信號(hào)的幅度值與閾值比較的現(xiàn)有技術(shù)的噪聲檢測(cè)方法中,難以適當(dāng)?shù)貦z測(cè)如鍵盤音的特定突發(fā)噪聲。因此,需要使得能夠適當(dāng)?shù)貦z測(cè)具有相對(duì)長(zhǎng)持續(xù)時(shí)間并且非單調(diào)衰減的特定突發(fā)噪聲(如上述鍵盤音)的技術(shù)。根據(jù)本公開(kāi)實(shí)施例,提供了一種音頻信號(hào)處理裝置,包括幅度檢測(cè)器,配置為通過(guò)將包括噪聲信號(hào)的音頻信號(hào)的幅度值與閾值比較,檢測(cè)所述音頻信號(hào)的噪聲開(kāi)始點(diǎn);頻率特征計(jì)算器,配置為計(jì)算至少表示所述噪聲開(kāi)始點(diǎn)之后的音頻信號(hào)的頻率特性的頻率特征;以及噪聲確定器,配置為基于所述頻率特征,確定在所述噪聲開(kāi)始點(diǎn)之后的音頻信號(hào)中連續(xù)包括等于或高于參考頻率的高頻分量的段,作為噪聲段。根據(jù)本公開(kāi)另一實(shí)施例,提供了一種音頻信號(hào)處理方法,包括通過(guò)將包括噪聲信號(hào)的音頻信號(hào)的幅度值與閾值比較,檢測(cè)所述音頻信號(hào)的噪聲開(kāi)始點(diǎn);計(jì)算至少表示所述噪聲開(kāi)始點(diǎn)之后的音頻信號(hào)的頻率特性的頻率特征;以及基于所述頻率特征,確定在所述噪聲開(kāi)始點(diǎn)之后的音頻信號(hào)中連續(xù)包括等于或高于參考頻率的高頻分量的段,作為噪聲
4段。根據(jù)本公開(kāi)另一實(shí)施例,提供了一種用于使得計(jì)算機(jī)執(zhí)行以下步驟的程序通過(guò)將包括噪聲信號(hào)的音頻信號(hào)的幅度值與閾值比較,檢測(cè)所述音頻信號(hào)的噪聲開(kāi)始點(diǎn);計(jì)算至少表示所述噪聲開(kāi)始點(diǎn)之后的音頻信號(hào)的頻率特性的頻率特征;以及基于所述頻率特征,確定在所述噪聲開(kāi)始點(diǎn)之后的音頻信號(hào)中連續(xù)包括等于或高于參考頻率的高頻分量的段,作為噪聲段。根據(jù)上述配置,將包括噪聲信號(hào)的音頻信號(hào)的幅度值與閾值比較,從而檢測(cè)音頻信號(hào)的噪聲開(kāi)始點(diǎn)。此外,計(jì)算至少表示所述噪聲開(kāi)始點(diǎn)之后的音頻信號(hào)的頻率特性的頻率特征。基于所述頻率特征,確定在所述噪聲開(kāi)始點(diǎn)之后的音頻信號(hào)中連續(xù)包括等于或高于參考頻率的高頻分量的段,作為噪聲段。由于該技術(shù),可以將連續(xù)包括鍵盤音等的特定噪聲信號(hào)中包括的高頻分量的段確定為音頻信號(hào)中的噪聲段。如上所述,根據(jù)本公開(kāi)實(shí)施例,可以適當(dāng)?shù)貦z測(cè)具有相對(duì)長(zhǎng)持續(xù)時(shí)間并且非單調(diào)衰減的特定突發(fā)噪聲,如鍵盤音。
圖1是應(yīng)用根據(jù)本公開(kāi)第一實(shí)施例的音頻信號(hào)處理裝置和方法的音頻記錄情況的示例的示意圖;圖2是示出如根據(jù)第一實(shí)施例的音頻記錄裝置的操作音的脈沖狀噪聲的噪聲信號(hào)的波形圖;圖3是示出如根據(jù)第一實(shí)施例的筆記本PC的鍵盤音的特定噪聲的噪聲信號(hào)的波形圖;圖4是示意性示出根據(jù)第一實(shí)施例的、用于檢測(cè)噪聲信號(hào)的三個(gè)確定因素的波形圖;圖5是示出作為根據(jù)第一實(shí)施例的音頻信號(hào)處理裝置的PC的硬件配置的框圖;圖6是示出根據(jù)第一實(shí)施例的音頻信號(hào)處理裝置的功能配置的框圖;圖7是示出根據(jù)第一實(shí)施例的幅度檢測(cè)器的配置的框圖;圖8是示出根據(jù)第一實(shí)施例的幅度檢測(cè)器的基本操作的流程圖;圖9是示出根據(jù)第一實(shí)施例的音頻信號(hào)的閾值A(chǔ)th的波形圖;圖10是示出根據(jù)第一實(shí)施例的音頻信號(hào)中的噪聲開(kāi)始點(diǎn)P附近的信號(hào)能量E的計(jì)算范圍的波形圖;圖11是示出根據(jù)第一實(shí)施例的幅度檢測(cè)器的詳細(xì)操作的流程圖;圖12是示出根據(jù)第一實(shí)施例的頻率特征計(jì)算器的配置的框圖;圖13是示出根據(jù)第一實(shí)施例的頻率特征計(jì)算器的基本操作的流程圖;圖14A到14C是用于說(shuō)明根據(jù)第一實(shí)施例的、計(jì)算頻率特征的處理的波形圖;圖15是用于說(shuō)明過(guò)零點(diǎn)Z的波形圖;圖16A和16B是用于說(shuō)明高頻分量的能量比的波形圖;圖17是示出鍵盤音的頻率特性的波形圖;圖18是示出根據(jù)第一實(shí)施例的、計(jì)算頻率特征Rf (過(guò)零點(diǎn)Z的數(shù)目cnt)的操作的流程圖19是示出根據(jù)第一實(shí)施例的的、計(jì)算頻率特征Rf (高頻分量的能量比H)的操作的流程圖;圖20是示出根據(jù)第一實(shí)施例的、通過(guò)使用過(guò)零點(diǎn)Z的數(shù)目cnt獲得的頻率特征Rf 和音頻信號(hào)的曲線圖;圖21是示出根據(jù)第一實(shí)施例的、通過(guò)使用高頻分量的能量比H獲得的頻率特征Rf 和音頻信號(hào)的曲線圖;圖22是示出根據(jù)第一實(shí)施例的衰減特征計(jì)算器的配置的框圖;圖23是示出根據(jù)第一實(shí)施例的衰減特征計(jì)算器的基本操作的流程圖;圖24是用于說(shuō)明根據(jù)第一實(shí)施例的、計(jì)算衰減特征的處理的波形圖;圖25是示出根據(jù)第一實(shí)施例的衰減特征計(jì)算器的詳細(xì)操作的流程圖;圖26A和26B是示出根據(jù)第一實(shí)施例的衰減特征Ra和音頻信號(hào)的曲線圖;圖27是示出根據(jù)第一實(shí)施例的噪聲確定器的配置的框圖;圖28是示出根據(jù)第一實(shí)施例的噪聲確定器的基本操作的流程圖;圖29是示出根據(jù)第一實(shí)施例的噪聲確定器的詳細(xì)操作的流程圖;圖30是示出根據(jù)本公開(kāi)的第二實(shí)施例的音頻信號(hào)處理裝置10的功能配置的框圖;以及圖31是示出根據(jù)第二實(shí)施例的噪聲確定器的詳細(xì)操作的流程圖。
具體實(shí)施例方式以下,將參照附圖詳細(xì)描述本發(fā)明的優(yōu)選實(shí)施例。在本說(shuō)明書和附圖中,對(duì)具有基本相同功能配置的結(jié)構(gòu)元件給出相同的標(biāo)號(hào),從而省略重復(fù)描述。描述的順序如下。1.第一實(shí)施例(使用頻率特征和衰減特征的示例)1. 1.噪聲檢測(cè)方法的概述1. 2.音頻信號(hào)處理裝置的整體配置1. 2. 1.音頻信號(hào)處理裝置的硬件配置1. 2. 2.音頻信號(hào)處理裝置的功能配置1. 3.幅度檢測(cè)器的細(xì)節(jié)1. 3. 1.幅度檢測(cè)器的配置1.3. 2.幅度檢測(cè)器的操作1. 4.頻率特征計(jì)算器的細(xì)節(jié)1. 4. 1.頻率特征計(jì)算器的配置1. 4. 2.頻率特征計(jì)算器的基本操作1. 4. 3.頻率特征計(jì)算器的具體示例1. 4. 4.鍵盤音的頻率特性1. 4. 5.頻率特征計(jì)算器的詳細(xì)操作1. 5.衰減特征計(jì)算器的細(xì)節(jié)1. 5. 1.衰減特征計(jì)算器的配置1. 5. 2.衰減特征計(jì)算器的操作
1.6.噪聲確定器的細(xì)節(jié)1. 6. 1.噪聲確定器的配置1. 6. 2.噪聲確定器的操作2.第二實(shí)施例(使用頻率特征的示例)2. 1.音頻信號(hào)處理裝置的功能配置2. 2.音頻信號(hào)處理裝置的操作3.總結(jié)<1.第一實(shí)施例>[1. 1.噪聲檢測(cè)方法的概述]首先,下面將描述根據(jù)本公開(kāi)第一實(shí)施例的、用于檢測(cè)特定突發(fā)噪聲的音頻信號(hào)處理方法的概述。根據(jù)本實(shí)施例的音頻信號(hào)處理裝置和方法涉及用于檢測(cè)和降低當(dāng)通過(guò)如IC記錄器的音頻記錄裝置記錄環(huán)境音頻時(shí),通過(guò)音頻收集獲得的音頻信號(hào)中混合的突發(fā)的、不穩(wěn)定的噪聲的技術(shù)。具體地,在根據(jù)本實(shí)施例的音頻信號(hào)處理裝置和方法中,檢測(cè)對(duì)象是從在與音頻記錄裝置分離的位置的噪聲產(chǎn)生源(例如,筆記本PC)產(chǎn)生的特定突發(fā)噪聲(例如, 鍵盤音)。作為用于檢測(cè)和降低記錄的音頻中的噪聲的通常的方法,存在用于檢測(cè)和降低由于當(dāng)操作安裝在音頻記錄裝置上的操作按鈕、開(kāi)關(guān)等時(shí)產(chǎn)生的操作音而導(dǎo)致的噪聲的技術(shù)。然而,關(guān)注檢測(cè)特定突發(fā)噪聲(如上述鍵盤音)的技術(shù)不是已知的。本實(shí)施例用于適當(dāng)?shù)貦z測(cè)如上述鍵盤音的特定突發(fā)噪聲。這可以降低在記錄的音頻再現(xiàn)中的噪聲,并且使得用戶能夠更容易地收聽(tīng)記錄的音頻。圖1是示出應(yīng)用根據(jù)本實(shí)施例的音頻信號(hào)處理裝置和方法的音頻記錄情況的示例的示意圖。在圖1所示的該假設(shè)的情況中,多個(gè)會(huì)議參與者圍繞辦公桌3并且在會(huì)議中, 并且通過(guò)使用放置在辦公桌3上的音頻記錄裝置1來(lái)記錄會(huì)議的音頻。在此會(huì)議中,當(dāng)進(jìn)行會(huì)議記錄的人通過(guò)使用筆記本PC 2記錄會(huì)議的內(nèi)容的筆記時(shí),通過(guò)按下筆記本PC 2的鍵盤,突發(fā)地并且間歇地產(chǎn)生咔噠的鍵盤音。因此,音頻記錄裝置1不僅記錄作為記錄對(duì)象的會(huì)議的內(nèi)容(會(huì)議參與者的語(yǔ)音),而且記錄作為噪聲的從筆記本PC 2傳播的鍵盤音。 此外,例如,當(dāng)參與者敲擊辦公桌3時(shí)和當(dāng)書面材料等掉到辦公桌3上時(shí)產(chǎn)生的撞擊音也由音頻記錄裝置1記錄為噪聲。如上所述,當(dāng)音頻記錄裝置1和筆記本PC 2放置得分離預(yù)定距離(例如,50cm)或更長(zhǎng)時(shí),如上述鍵盤音和撞擊音的特定突發(fā)噪聲經(jīng)常作為噪聲混合到記錄的音頻中。當(dāng)再現(xiàn)和收聽(tīng)該記錄的音頻時(shí),如鍵盤音的噪聲使得收聽(tīng)者不舒服,并且干擾記錄的音頻的收聽(tīng)。因此,優(yōu)選地,不僅適當(dāng)?shù)貦z測(cè)和降低當(dāng)直接操作音頻記錄裝置1的操作按鈕時(shí)產(chǎn)生的操作音,而且適當(dāng)?shù)貦z測(cè)和降低在與音頻記錄裝置1分離的位置產(chǎn)生的如上述鍵盤音的特定突發(fā)噪聲。下面將參照?qǐng)D2和圖3描述音頻記錄裝置1的操作音和筆記本PC 2的鍵盤音之間的特性的差別。圖2是示出如音頻記錄裝置1的操作音的脈沖狀噪聲的噪聲信號(hào)的波形圖。圖3是示出如筆記本PC 2的鍵盤音的特定噪聲的噪聲信號(hào)的波形圖。如圖2所示,當(dāng)向下按下音頻記錄裝置1中提供的操作按鈕時(shí)產(chǎn)生的操作音形成瞬時(shí)地并且單調(diào)地衰減的突發(fā)噪聲。即,該操作音的噪聲信號(hào)是脈沖狀信號(hào)。其持續(xù)時(shí)間是相對(duì)短的(例如,0.01秒或更短),并且其衰減急劇并單調(diào)。因此,僅通過(guò)將該操作音的噪聲信號(hào)與閾值相比,可以相對(duì)容易地檢測(cè)該噪聲信號(hào)。相反,如圖3所示,鍵盤音是在與音頻記錄裝置1分離預(yù)定距離(例如,50cm)或更長(zhǎng)的位置處產(chǎn)生的特定突發(fā)噪聲,并且該特定突發(fā)噪聲的噪聲信號(hào)具有與上述操作音的特性不同的特性。具體地,如圖1所示,在從噪聲產(chǎn)生源(例如,筆記本PC 2)向音頻記錄裝置1的傳輸中,特定突發(fā)噪聲不僅在空氣中作為直接聲音6傳播,而且通過(guò)多個(gè)路徑傳播到達(dá)音頻記錄裝置1。例如,該噪聲作為從通過(guò)墻壁、天花板等的空間反射導(dǎo)致的反射音7傳播,并且作為在辦公桌3中傳遞的振動(dòng)8傳播。因此,如圖3所示,通過(guò)記錄特定突發(fā)噪聲 (如鍵盤音)而獲得的噪聲信號(hào)是與上述脈沖狀噪聲信號(hào)相比具有更長(zhǎng)持續(xù)時(shí)間(0.02秒或更長(zhǎng))并且非單調(diào)衰減的信號(hào)。因此,難以將該信號(hào)檢測(cè)為脈沖信號(hào)。例如,當(dāng)在圖1的示例中會(huì)議參與者操作筆記本PC 2的鍵盤時(shí),從手指接觸鍵盤的按鈕的開(kāi)始直到該按鈕的完全按下,花費(fèi)一定時(shí)間量。因此,一次按下按鈕產(chǎn)生具有一定時(shí)間量的間隔的兩次聲音。因此,鍵盤音的噪聲信號(hào)是不規(guī)則并且非單調(diào)衰減的信號(hào)。此外,伴隨鍵盤操作的振動(dòng)8通過(guò)辦公桌3從筆記本PC 2傳播到音頻記錄裝置1。該振動(dòng)8 比在空氣中傳播的鍵盤音6和7更晚地傳遞。如上所述,在鍵盤音等的特定噪聲信號(hào)中,非單調(diào)信號(hào)衰減持續(xù)長(zhǎng)時(shí)間,并且與作為稍后到達(dá)音頻記錄裝置1的另一聲音的振動(dòng)8同時(shí)被觀察到。因此,難以通過(guò)其中僅將信號(hào)電平與閾值比較的現(xiàn)有技術(shù)的簡(jiǎn)單檢測(cè)方法來(lái)檢測(cè)上述鍵盤音等的特定突發(fā)噪聲。因此,在根據(jù)本實(shí)施例的音頻信號(hào)處理方法中,不僅關(guān)注音頻信號(hào)的信號(hào)電平,而且關(guān)注其他因素。具體地,使用下面三個(gè)確定因素(1)音頻信號(hào)的信號(hào)電平(幅度值); (2)音頻信號(hào)的高頻分量的持續(xù)時(shí)間;以及(3)音頻信號(hào)的衰減狀態(tài)。通過(guò)利用這些因素, 捕獲上述特定突發(fā)噪聲的噪聲信號(hào)的梯形特性,從而檢測(cè)音頻信號(hào)中包括的特定噪聲信號(hào)。圖4是示意性示出通過(guò)根據(jù)本實(shí)施例的音頻信號(hào)處理方法檢測(cè)噪聲信號(hào)的三個(gè)確定因素的波形圖。如圖4所示,可通過(guò)使用(1)音頻信號(hào)的信號(hào)電平來(lái)檢測(cè)音頻信號(hào)中包括的噪聲信號(hào)的上升沿(即,噪聲開(kāi)始點(diǎn)P)。此外,上述鍵盤音等的特定噪聲信號(hào)包括其頻率在預(yù)定時(shí)間Tth或更長(zhǎng)上連續(xù)地高于普通音頻的頻率、并且等于或高于參考頻率(例如, 4kHz)的高頻分量。因此,可通過(guò)檢測(cè)(2)音頻信號(hào)的高頻分量的持續(xù)時(shí)間是否等于或長(zhǎng)于預(yù)定時(shí)間Tth來(lái)檢測(cè)特定噪聲信號(hào)是否包括在音頻信號(hào)中。此外,與上述脈沖狀噪聲信號(hào)不同,上述鍵盤音等的特定噪聲信號(hào)不是單調(diào)衰減的,而是非單調(diào)地衰減相對(duì)長(zhǎng)的時(shí)間。因此,可通過(guò)檢測(cè)(3)音頻信號(hào)的衰減狀態(tài)來(lái)檢測(cè)特定噪聲信號(hào)是否包括在音頻信號(hào)中。如上所述,在根據(jù)本實(shí)施例的音頻信號(hào)處理方法中,通過(guò)使用三個(gè)確定因素(1) 到(3)來(lái)捕獲鍵盤音等的特定噪聲信號(hào)的波形的梯形特性(見(jiàn)圖4),從而適當(dāng)?shù)貦z測(cè)音頻信號(hào)中包括的特定噪聲信號(hào)。下面將詳細(xì)描述根據(jù)本實(shí)施例的音頻信號(hào)處理方法和用于執(zhí)行該方法的音頻信號(hào)處理裝置。[1. 2.音頻信號(hào)處理裝置的整體配置]下面將描述根據(jù)本實(shí)施例的音頻信號(hào)處理裝置的配置。對(duì)于本實(shí)施例,將通過(guò)以再現(xiàn)通過(guò)音頻記錄裝置1音頻記錄而獲得的音頻信號(hào)的再現(xiàn)設(shè)備作為音頻信號(hào)處理裝置的一個(gè)示例來(lái)進(jìn)行描述。再現(xiàn)設(shè)備可以是任何設(shè)備,只要其是通過(guò)使用軟件或硬件具有音頻再現(xiàn)功能的設(shè)備。下面的描述將個(gè)人計(jì)算機(jī)(以下,稱為PC)當(dāng)作再現(xiàn)設(shè)備的示例。例如,通過(guò)音頻記錄裝置1記錄的音頻的數(shù)據(jù)(以下稱為記錄音頻)經(jīng)由記錄介質(zhì)或網(wǎng)絡(luò)提供給如PC的音頻信號(hào)處理裝置。從而,音頻信號(hào)處理裝置再現(xiàn)記錄的音頻的數(shù)據(jù),并從如揚(yáng)聲器的音頻輸出設(shè)備輸出音頻。在該記錄的音頻的再現(xiàn)中,音頻信號(hào)處理裝置檢測(cè)音頻信號(hào)中的噪聲信號(hào),并降低該噪聲信號(hào)。下面將描述該音頻信號(hào)處理裝置的配置示例。[1. 2. 1.音頻信號(hào)處理裝置的硬件配置]首先,參照?qǐng)D5,下面將描述音頻信號(hào)處理裝置10的硬件配置示例。圖5是示出作為根據(jù)本實(shí)施例的音頻信號(hào)處理裝置10的PC的硬件配置的框圖。如圖5所示,音頻信號(hào)處理裝置10包括例如CPU(中央處理單元)101、R0M(只讀存儲(chǔ)器)102、RAM(隨機(jī)存取存儲(chǔ)器)103、主機(jī)總線104、橋105、外部總線106、接口 107、輸入設(shè)備108、輸出設(shè)備109、存儲(chǔ)設(shè)備110、驅(qū)動(dòng)器111、連接端口 112和通信設(shè)備113。以此方式,音頻信號(hào)處理裝置10可以通過(guò)使用例如通用計(jì)算機(jī)裝置來(lái)配置。CPU 101用作算術(shù)處理設(shè)備和控制設(shè)備,并且根據(jù)各種程序操作以控制音頻信號(hào)處理裝置10中的各個(gè)單元。該CPU 101根據(jù)ROM 102中存儲(chǔ)的程序或從存儲(chǔ)設(shè)備110加載到RAM 103中的程序來(lái)執(zhí)行各種處理。ROM 102存儲(chǔ)由CPU 101使用的程序、算術(shù)參數(shù)等,并且還用作用于減少?gòu)腃PU 101對(duì)存儲(chǔ)設(shè)備110的存取的緩沖器。RAM 103暫時(shí)存儲(chǔ)在CPU 101的執(zhí)行中使用的程序、執(zhí)行中相應(yīng)改變的參數(shù)等。這些單元通過(guò)由例如CPU總線形成的主機(jī)總線104彼此連接。主機(jī)總線104經(jīng)由橋105連接到如外圍組件互連/接口 (PCI)總線的外部總線106。在與CPU 101關(guān)聯(lián)提供的存儲(chǔ)器端口(例如,ROM 102和閃存(未示出))等中, 存儲(chǔ)用于使得CPU 101執(zhí)行各種控制處理的程序?;谠摮绦颍珻PU 101執(zhí)行用于各個(gè)單元的控制處理的必須的算術(shù)處理。根據(jù)本實(shí)施例的程序是用于使得CPU 101執(zhí)行CPU 101的上述各種控制的程序。 該程序可預(yù)先存儲(chǔ)在合并到音頻信號(hào)處理裝置10中的存儲(chǔ)器設(shè)備(存儲(chǔ)設(shè)備110、ROM 102、閃存等)中。替代地,該程序可存儲(chǔ)在光盤(如⑶(致密盤)、DVD(數(shù)字多功能盤)、 藍(lán)光盤)或可移除記錄介質(zhì)(如存儲(chǔ)卡)中,并提供給音頻信號(hào)處理裝置10。更替代地,程序可經(jīng)由如LAN(局域網(wǎng))或因特網(wǎng)的網(wǎng)絡(luò)5下載到音頻信號(hào)處理裝置10。輸入設(shè)備108由例如如鼠標(biāo)、鍵盤、觸摸板、按鈕、開(kāi)關(guān)和操縱桿的操作組件和產(chǎn)生輸入信號(hào)并將其輸出到CPU 101的輸入控制電路組成。輸出設(shè)備109由例如顯示設(shè)備 (如液晶顯示器(IXD)設(shè)備、陰極射線管(CRT)顯示設(shè)備或有機(jī)EL顯示設(shè)備)和如揚(yáng)聲器的音頻輸出設(shè)備組成。存儲(chǔ)設(shè)備110是用于存儲(chǔ)各種數(shù)據(jù)并且用例如如硬盤驅(qū)動(dòng)器(HDD)的外置或內(nèi)置盤驅(qū)動(dòng)器配置的存儲(chǔ)設(shè)備。該存儲(chǔ)設(shè)備110驅(qū)動(dòng)作為存儲(chǔ)介質(zhì)的硬盤,并且存儲(chǔ)通過(guò)CPU 101執(zhí)行的程序和各種數(shù)據(jù)。驅(qū)動(dòng)器111是用于存儲(chǔ)介質(zhì)的讀取器/寫入器,并且提供為音頻信號(hào)處理裝置10的內(nèi)置或外部組件。該驅(qū)動(dòng)器111從可移除存儲(chǔ)介質(zhì)(如磁盤、光盤、 磁光盤或半導(dǎo)體存儲(chǔ)器)讀取音頻信號(hào)處理裝置10中加載的各種數(shù)據(jù)/將各種數(shù)據(jù)寫入所述可移除存儲(chǔ)介質(zhì)。
9
連接端口 112是用于連接外設(shè)裝置的端口,并具有例如USB或IEEE 1394的連接端子。連接端口 112經(jīng)由接口 107、外部總線106、橋105、主機(jī)總線104等連接到CPU 101 等。通信設(shè)備113是用例如用于連接到網(wǎng)絡(luò)5的通信設(shè)備配置的通信接口。該通信設(shè)備 113經(jīng)由網(wǎng)絡(luò)將各種數(shù)據(jù)傳輸?shù)酵獠吭O(shè)備/從外部設(shè)備接收各種數(shù)據(jù)。[1. 2. 2.音頻信號(hào)處理裝置的功能配置]下面將參照?qǐng)D6描述根據(jù)本實(shí)施例的音頻信號(hào)處理裝置10的功能配置示例。圖 6是示出根據(jù)本實(shí)施例的音頻信號(hào)處理裝置10的功能配置的框圖。如圖6所示,音頻信號(hào)處理裝置10包括噪聲檢測(cè)單元20、數(shù)據(jù)存儲(chǔ)單元30、控制單元32、噪聲降低單元34和音頻輸出單元36。這些噪聲檢測(cè)單元20、控制單元32和噪聲降低單元34可通過(guò)專用硬件配置或可通過(guò)軟件配置。在使用軟件的情況下,音頻信號(hào)處理裝置10的CPU 101執(zhí)行用于實(shí)現(xiàn)下述各個(gè)功能單元的功能的程序。在圖6中,實(shí)線箭頭表示音頻信號(hào)的數(shù)據(jù)線。點(diǎn)劃線箭頭表示特征線。虛線箭頭表示控制線。數(shù)據(jù)存儲(chǔ)單元30由例如如硬盤或閃存的存儲(chǔ)設(shè)備形成,并且存儲(chǔ)通過(guò)音頻記錄裝置1的音頻記錄獲得的音頻數(shù)據(jù)。例如,通過(guò)音頻記錄裝置1的音頻記錄獲得的音頻信號(hào)經(jīng)由可移除存儲(chǔ)介質(zhì)或網(wǎng)絡(luò)5提供給音頻信號(hào)處理裝置10,并作為音頻數(shù)據(jù)存儲(chǔ)在數(shù)據(jù)存儲(chǔ)單元30中。此外,如果音頻信號(hào)處理裝置10包括如麥克風(fēng)的音頻收集設(shè)備(未示出) 并且具有音頻記錄功能,則音頻信號(hào)處理裝置10的控制單元32將從該音頻收集設(shè)備輸入的音頻信號(hào)記錄在數(shù)據(jù)存儲(chǔ)單元30中作為音頻數(shù)據(jù)。在記錄的音頻的再現(xiàn)中,從數(shù)據(jù)存儲(chǔ)單元30讀出音頻數(shù)據(jù),并且執(zhí)行如解碼的再現(xiàn)處理。在該再現(xiàn)處理中,從數(shù)據(jù)存儲(chǔ)單元30 讀出的音頻數(shù)據(jù)輸出到噪聲檢測(cè)單元20和噪聲降低單元34,作為具有例如如圖2或圖3所示的波形的音頻信號(hào)??刂茊卧?2由例如CPU 101形成,并且控制音頻信號(hào)處理裝置10中的各個(gè)單元。 例如,控制單元32控制噪聲降低單元34的操作,使得可降低通過(guò)噪聲檢測(cè)單元20檢測(cè)的
噪聲信號(hào)。噪聲檢測(cè)單元20檢測(cè)從數(shù)據(jù)存儲(chǔ)單元30輸入的音頻信號(hào)中包括的噪聲信號(hào),并且例如在記錄的音頻的再現(xiàn)中,將檢測(cè)結(jié)果輸出到控制單元32。通過(guò)該噪聲檢測(cè)單元20的噪聲檢測(cè)處理是根據(jù)本實(shí)施例的特性,因此下面將描述其細(xì)節(jié)。噪聲降低單元34基于來(lái)自控制單元32的指令,從自數(shù)據(jù)存儲(chǔ)單元30輸入的音頻信號(hào)中降低由噪聲檢測(cè)單元20檢測(cè)的噪聲信號(hào)。對(duì)于通過(guò)該噪聲降低單元34的噪聲降低處理,可采用任何公知技術(shù)。例如,噪聲降低單元34將音頻信號(hào)中包括的噪聲信號(hào)的信號(hào)電平(幅度值)設(shè)置為幾乎為零,或?qū)⑿盘?hào)電平抑制到預(yù)定電平或更低,從而降低音頻信號(hào)中包括的噪聲信號(hào)。音頻輸出單元36由例如揚(yáng)聲器形成。從通過(guò)噪聲降低單元34降低噪聲信號(hào)得到的音頻信號(hào)輸入到音頻輸出單元36,并且音頻輸出單元36輸出由該音頻信號(hào)表示的音頻。 用戶收聽(tīng)從該音頻輸出單元36輸出的音頻,從而可以理解記錄的音頻的內(nèi)容。接下來(lái),將在下面描述噪聲檢測(cè)單元20的配置的細(xì)節(jié)。如圖6所示,噪聲檢測(cè)單元20包括幅度檢測(cè)器22、頻率特征計(jì)算器24、衰減特征計(jì)算器26和噪聲確定器28。幅度檢測(cè)器22檢測(cè)包括噪聲信號(hào)的音頻信號(hào)的幅度值A(chǔ),并且將該幅度值A(chǔ)(信號(hào)電平)與預(yù)定閾值A(chǔ)th比較,以基于比較結(jié)果檢測(cè)音頻信號(hào)的噪聲開(kāi)始點(diǎn)P。噪聲開(kāi)始點(diǎn)P意味著音頻信號(hào)中包括的上述鍵盤音等的特定噪聲信號(hào)的開(kāi)始位置(噪聲信號(hào)的上升沿位置)。在本實(shí)施例中,該噪聲開(kāi)始點(diǎn)P和下面要描述的噪聲結(jié)束點(diǎn)Q基于例如記錄音頻信號(hào)時(shí)的時(shí)間來(lái)指定。然而,如何指定這些點(diǎn)不限于該示例。例如,噪聲開(kāi)始點(diǎn)P和噪聲結(jié)束點(diǎn)Q可通過(guò)使用音頻信號(hào)中表示時(shí)間軸上的位置的任何參數(shù)來(lái)指定,如時(shí)間碼、從音頻信號(hào)的開(kāi)始起的時(shí)間、幀數(shù)或比特?cái)?shù)。幅度檢測(cè)器22向噪聲確定器觀、頻率特征計(jì)算器M和衰減特征計(jì)算器沈通知表示檢測(cè)的噪聲開(kāi)始點(diǎn)P的信息。此外,幅度檢測(cè)器22計(jì)算音頻信號(hào)的噪聲開(kāi)始點(diǎn)P附近的信號(hào)能量,并且將該信號(hào)能量輸出到噪聲確定器觀作為幅度特征E。頻率特征計(jì)算器M分析音頻信號(hào)中的、從噪聲開(kāi)始點(diǎn)P的附近到經(jīng)過(guò)預(yù)定時(shí)間 Tth之后的定時(shí)的段的頻率特性,并且計(jì)算表示該段的頻率特性的頻率特征Rf。頻率特征Rf是例如表示音頻信號(hào)的過(guò)零點(diǎn)的數(shù)目的參數(shù)或表示音頻信號(hào)的等于或高于參考頻率 (例如,4kHz)的高頻分量與全部頻率分量的比率的參數(shù)。因?yàn)殒I盤音等的特定噪聲信號(hào)包括如上所述的等于或高于參考頻率的許多高頻分量,所以可通過(guò)分析音頻信號(hào)的頻率特性確定是否存在特定噪聲信號(hào)以及該特定噪聲信號(hào)的持續(xù)時(shí)間。頻率特征計(jì)算器M將計(jì)算的頻率特征Rf輸出到噪聲確定器觀。頻率特征計(jì)算器M可將噪聲開(kāi)始點(diǎn)P之后的音頻信號(hào)劃分為多個(gè)段(幀),并計(jì)算每段的頻率特征Rf。這允許對(duì)通過(guò)噪聲開(kāi)始點(diǎn)P之后的音頻信號(hào)的分段獲得的多個(gè)段的每個(gè)計(jì)算頻率特征Rf,因此可以提高關(guān)于是否存在噪聲信號(hào)以及噪聲信號(hào)的持續(xù)時(shí)間的檢測(cè)的精度。衰減特征計(jì)算器沈分析音頻信號(hào)的信號(hào)能量,從而計(jì)算表示音頻信號(hào)中包括的噪聲信號(hào)的衰減的衰減特征Ra。衰減特征Ra是例如表示噪聲開(kāi)始點(diǎn)P附近的音頻信號(hào)的能量El和在從噪聲開(kāi)始點(diǎn)P起經(jīng)過(guò)預(yù)定時(shí)間Td之后的定時(shí)附近的音頻信號(hào)的能量E2之間的比率的參數(shù)。因?yàn)槿缟纤鲦I盤音等的特定噪聲信號(hào)在保持高信號(hào)電平至少超過(guò)預(yù)定時(shí)間Tth之后非單調(diào)衰減,所以可通過(guò)分析音頻信號(hào)的信號(hào)能量的時(shí)間流逝來(lái)確定特定噪聲信號(hào)的衰減狀態(tài)。衰減特征計(jì)算器26將計(jì)算的衰減特征Ra輸出到噪聲確定器觀。衰減特征計(jì)算器沈可將噪聲開(kāi)始點(diǎn)P之后的音頻信號(hào)劃分為多個(gè)段(幀),并計(jì)算每段的衰減特征Ra。這允許對(duì)通過(guò)噪聲開(kāi)始點(diǎn)P之后的音頻信號(hào)的分段而獲得的多個(gè)段的每個(gè)計(jì)算衰減特征Ra,因此可以提高噪聲信號(hào)的衰減狀態(tài)的檢測(cè)的精度。噪聲確定器觀分別從幅度檢測(cè)器22、頻率特征計(jì)算器M和衰減特征計(jì)算器沈獲取幅度特征E、頻率特征Rf和衰減特征Ra。此外,噪聲確定器觀基于幅度特征E、頻率特征 Rf和衰減特征Ra,確定是否存在噪聲信號(hào),并將音頻信號(hào)中連續(xù)包括等于或高于參考頻率的高頻分量的段確定為噪聲段。噪聲段是在音頻信號(hào)中的、包括如上述鍵盤音的特定突發(fā)噪聲的噪聲信號(hào)的段。例如,噪聲確定器觀將頻率特征Rf與預(yù)定閾值Rf_th比較,并且獲得其中頻率特征Rf等于或大于該預(yù)定閾值Rf_th的段。此外,噪聲確定器觀將衰減特征Ra與預(yù)定閾值 Rf_th比較,并確定衰減特征Ra變得等于或小于該預(yù)定閾值Rf_th的位置,作為噪聲信號(hào)衰減到預(yù)定基準(zhǔn)或更小的噪聲結(jié)束點(diǎn)Q。此外,噪聲確定器觀將音頻信號(hào)中連續(xù)包括等于或高于參考頻率的高頻分量的段中的、從噪聲開(kāi)始點(diǎn)P到噪聲結(jié)束點(diǎn)Q的段確定為噪聲段。噪聲確定器28將表示檢測(cè)的噪聲段的信息輸出到控制單元32。從而,控制單元32控制噪聲降低單元34降低音頻信號(hào)的噪聲段中包括的噪聲信號(hào)。上面已經(jīng)描述了根據(jù)本實(shí)施例的音頻信號(hào)處理裝置10中的噪聲檢測(cè)單元20的示意配置。根據(jù)本實(shí)施例的噪聲檢測(cè)單元20不僅通過(guò)使用音頻信號(hào)的幅度值A(chǔ)來(lái)檢測(cè)噪聲信號(hào)的上升沿,而且建模音頻信號(hào)的持續(xù)時(shí)間和信號(hào)能量的衰減度。這允許對(duì)記錄的音頻中包括的鍵盤音等的特定噪聲信號(hào)是否存在以及噪聲信號(hào)的段進(jìn)行適當(dāng)?shù)拇_定。[1.3.幅度檢測(cè)器的細(xì)節(jié)]下面將描述根據(jù)本實(shí)施例的音頻信號(hào)處理裝置10中的幅度檢測(cè)器22的配置和操作。[1.3. 1.幅度檢測(cè)器的配置]首先,將描述根據(jù)本實(shí)施例的幅度檢測(cè)器22的配置。圖7是示出根據(jù)本實(shí)施例的幅度檢測(cè)器22的配置的框圖。如圖7所示,幅度檢測(cè)器22包括存儲(chǔ)部分222、比較器224、算術(shù)部分2 和通知部分228。將再現(xiàn)音頻信號(hào)從外部輸入到比較器2M和算術(shù)部分226。存儲(chǔ)部分222存儲(chǔ)用作噪聲信號(hào)的上升沿的確定的標(biāo)準(zhǔn)的幅度值的閾值A(chǔ)th。比較器2M從存儲(chǔ)部分222讀出閾值A(chǔ)th,并將輸入音頻信號(hào)的幅度值A(chǔ)與閾值A(chǔ)th比較,以基于比較結(jié)果檢測(cè)噪聲開(kāi)始點(diǎn)P。結(jié)果,當(dāng)音頻信號(hào)的信號(hào)電平突然上升、并且到此前已經(jīng)小于閾值A(chǔ)th的音頻信號(hào)的幅度值A(chǔ)變得大于閾值A(chǔ)th時(shí),比較器2M將表示噪聲開(kāi)始點(diǎn) P的基準(zhǔn)時(shí)間Ttl傳輸?shù)剿阈g(shù)部分2 和通知部分228。在檢測(cè)到噪聲開(kāi)始點(diǎn)P時(shí),算術(shù)部分2 檢測(cè)輸入音頻信號(hào),并計(jì)算該音頻信號(hào)的噪聲開(kāi)始點(diǎn)P附近的信號(hào)能量E,以向通知部分2 通知該信號(hào)能量E作為幅度特征。此外,在檢測(cè)到噪聲開(kāi)始點(diǎn)P時(shí),通知部分228向頻率特征計(jì)算器M和衰減特征計(jì)算器沈通知表示噪聲開(kāi)始點(diǎn)P的基準(zhǔn)時(shí)間I。[1.3. 2.幅度檢測(cè)器的操作]下面將參照?qǐng)D8到圖10描述根據(jù)本實(shí)施例的幅度檢測(cè)器22的基本操作。圖8是示出根據(jù)本實(shí)施例的幅度檢測(cè)器22的基本操作的流程圖。圖9是示出根據(jù)本實(shí)施例的音頻信號(hào)的閾值A(chǔ)th的波形圖。圖10是示出根據(jù)本實(shí)施例的音頻信號(hào)中的噪聲開(kāi)始點(diǎn)P附近的信號(hào)能量E的計(jì)算范圍的波形圖。如圖8所示,首先,幅度檢測(cè)器22從外部(例如,數(shù)據(jù)存儲(chǔ)單元30或麥克風(fēng))獲取通過(guò)音頻記錄獲得的音頻信號(hào)(步驟S10)。該音頻信號(hào)連續(xù)輸入到幅度檢測(cè)器22。接下來(lái),幅度檢測(cè)器22確定輸入音頻信號(hào)的幅度值A(chǔ) (信號(hào)電平)的絕對(duì)值是否變得大于閾值A(chǔ)th,并且檢測(cè)當(dāng)幅度值A(chǔ)變得大于閾值A(chǔ)th時(shí)的音頻信號(hào)中的位置,作為噪聲開(kāi)始點(diǎn)P (步驟S12)。如圖9所示,當(dāng)音頻信號(hào)的幅度值A(chǔ)變得大于閾值A(chǔ)th時(shí),噪聲信號(hào)的上升沿上升,并且該上升沿的位置確定為音頻信號(hào)中包括的噪聲信號(hào)的噪聲開(kāi)始點(diǎn)P。 可基于例如參考幅度值Bth設(shè)置閾值A(chǔ)th,利用該參考幅度值Bth,使得能夠進(jìn)行音頻信號(hào)的自動(dòng)增益控制(AGC)功能。例如,AGC功能的參考幅度值Bth的90%的值可設(shè)置為閾值 Ath。這允許對(duì)噪聲信號(hào)的上升沿進(jìn)行有利的檢測(cè)。以此方式,當(dāng)音頻信號(hào)的幅度值A(chǔ)的絕對(duì)值超過(guò)閾值A(chǔ)th時(shí),啟用通過(guò)噪聲檢測(cè)單元20的噪聲檢測(cè)功能,使得執(zhí)行通過(guò)頻率特征計(jì)算器M和衰減特征計(jì)算器沈的特征計(jì)算處理和通過(guò)噪聲確定器28的噪聲確定處理。
12
隨后,幅度檢測(cè)器22將對(duì)應(yīng)于檢測(cè)的噪聲開(kāi)始點(diǎn)P的基準(zhǔn)時(shí)間Ttl保持在存儲(chǔ)部分 222中,并且向頻率特征計(jì)算器M和衰減特征計(jì)算器沈通知該基準(zhǔn)時(shí)間Ttl (步驟S14)。此外,幅度檢測(cè)器22檢測(cè)輸入音頻信號(hào),從而計(jì)算音頻信號(hào)的噪聲開(kāi)始點(diǎn)P附近的信號(hào)能量E,并將該信號(hào)能量E輸出到衰減特征計(jì)算器乍為幅度值(步驟S16)。例如, 如圖10所示,幅度特征可以是從噪聲開(kāi)始點(diǎn)P起的預(yù)定范圍N內(nèi)的音頻信號(hào)的能量。接下來(lái),將參照?qǐng)D11在下面描述根據(jù)本實(shí)施例的幅度檢測(cè)器22的詳細(xì)操作。圖 11是示出根據(jù)本實(shí)施例的幅度檢測(cè)器22的詳細(xì)操作的流程圖。在圖11中,η表示音頻信號(hào)的采樣號(hào),χ (η)表示在采樣號(hào)η的音頻信號(hào)的幅度值A(chǔ)。N表示音頻信號(hào)的一幀中的采樣數(shù)。如圖11所示,首先,幅度檢測(cè)器22獲取數(shù)據(jù)存儲(chǔ)單元30中存儲(chǔ)的音頻信號(hào)(步驟 S100)。隨后,幅度檢測(cè)器22確定采樣號(hào)η處的音頻信號(hào)的幅度值A(chǔ)的絕對(duì)值(即,x(n)的絕對(duì)值)是否大于閾值A(chǔ)th (步驟S102)。如果x(n)的絕對(duì)值等于或小于Ath,則設(shè)置η = η+1,即,將采樣號(hào)遞增1 (步驟S104)。通過(guò)重復(fù)該處理,當(dāng)χ(η)的絕對(duì)值已經(jīng)變得大于Ath 時(shí),幅度檢測(cè)器22在存儲(chǔ)器中保持該定時(shí)的采樣號(hào)η,作為表示基準(zhǔn)時(shí)間Ttl的參數(shù)(即, 噪聲開(kāi)始點(diǎn)P),并且向頻率特征計(jì)算器M和衰減特征計(jì)算器26通知該基準(zhǔn)時(shí)間Ttl(步驟 S106)。隨后,幅度檢測(cè)器22根據(jù)下面的公式(1)計(jì)算緊接在噪聲開(kāi)始點(diǎn)P之后的信號(hào)能量E (步驟S108)。如圖10所示,噪聲開(kāi)始點(diǎn)P附近的信號(hào)能量E是從噪聲開(kāi)始點(diǎn)P (基準(zhǔn)時(shí)間Ttl)到預(yù)定采樣數(shù)N的范圍內(nèi)的音頻信號(hào)的信號(hào)能量。例如,如果音頻信號(hào)的采樣頻率為44. 1kHz,則可以設(shè)置N= 128。這可以計(jì)算噪聲信號(hào)的上升沿附近的信號(hào)能量E。[表達(dá)式1]
權(quán)利要求
1.一種音頻信號(hào)處理裝置,包括幅度檢測(cè)器,配置為通過(guò)將包括噪聲信號(hào)的音頻信號(hào)的幅度值與閾值比較,檢測(cè)所述音頻信號(hào)的噪聲開(kāi)始點(diǎn);頻率特征計(jì)算器,配置為計(jì)算至少表示所述噪聲開(kāi)始點(diǎn)之后的音頻信號(hào)的頻率特性的頻率特征;以及噪聲確定器,配置為基于所述頻率特征,確定在所述噪聲開(kāi)始點(diǎn)之后的音頻信號(hào)中連續(xù)包括等于或高于參考頻率的高頻分量的段,作為噪聲段。
2.如權(quán)利要求1所述的音頻信號(hào)處理裝置,還包括衰減特征計(jì)算器,配置為計(jì)算表示音頻信號(hào)中包括的噪聲信號(hào)的衰減的衰減特征,其中,所述噪聲確定器基于所述頻率特征和所述衰減特征,確定在所述噪聲開(kāi)始點(diǎn)之后的音頻信號(hào)中連續(xù)包括等于或高于參考頻率的高頻分量、并且范圍是從所述噪聲開(kāi)始點(diǎn)到噪聲結(jié)束點(diǎn)的段,作為噪聲段,在所述噪聲結(jié)束點(diǎn),噪聲信號(hào)衰減到預(yù)定基準(zhǔn)或更小。
3.如權(quán)利要求2所述的音頻信號(hào)處理裝置,其中所述衰減特征計(jì)算器計(jì)算表示噪聲開(kāi)始點(diǎn)附近的音頻信號(hào)的能量和從噪聲開(kāi)始點(diǎn)起經(jīng)過(guò)預(yù)定時(shí)間之后的定時(shí)附近的音頻信號(hào)的能量之間的比率的參數(shù),作為所述衰減特征。
4.如權(quán)利要求2所述的音頻信號(hào)處理裝置,其中所述衰減特征計(jì)算器通過(guò)使用通過(guò)從音頻信號(hào)移除等于或低于預(yù)定頻率的低頻分量而獲得的信號(hào),計(jì)算所述衰減特征。
5.如權(quán)利要求1所述的音頻信號(hào)處理裝置,其中所述頻率特征計(jì)算器將噪聲開(kāi)始點(diǎn)之后的音頻信號(hào)劃分為多個(gè)段,并且計(jì)算每個(gè)段的頻率特征;以及所述噪聲確定器確定每個(gè)段的頻率特征是否等于或大于閾值,并且將其頻率特征大于或等于閾值的至少一個(gè)段確定為噪聲段。
6.如權(quán)利要求1所述的音頻信號(hào)處理裝置,其中所述頻率特征計(jì)算器計(jì)算表示音頻信號(hào)的過(guò)零點(diǎn)的數(shù)目的參數(shù),作為所述頻率特征。
7.如權(quán)利要求1所述的音頻信號(hào)處理裝置,其中所述頻率特征計(jì)算器計(jì)算表示音頻信號(hào)的所有頻率分量與等于或高于參考頻率的高頻分量之間的比率的參數(shù),作為所述頻率特征。
8.如權(quán)利要求1所述的音頻信號(hào)處理裝置,其中所述幅度檢測(cè)器計(jì)算表示噪聲開(kāi)始點(diǎn)附近的音頻信號(hào)的信號(hào)能量的幅度特征;以及所述噪聲確定器確定所述幅度特征是否等于或大于閾值,并且如果所述幅度特征等于或大于閾值,則基于所述頻率特征確定噪聲段。
9.如權(quán)利要求1所述的音頻信號(hào)處理裝置,其中所述噪聲信號(hào)表示從在與用于記錄音頻信號(hào)的音頻記錄設(shè)備分離預(yù)定距離或更長(zhǎng)的位置處的噪聲產(chǎn)生源產(chǎn)生的噪聲。
10.如權(quán)利要求1所述的音頻信號(hào)處理裝置,其中所述噪聲信號(hào)是連續(xù)包括等于或高于參考頻率的高頻分量并且非單調(diào)衰減的信號(hào)。
11.如權(quán)利要求1所述的音頻信號(hào)處理裝置,還包括噪聲降低單元,配置為通過(guò)降低音頻信號(hào)中的噪聲段的信號(hào)電平,降低音頻信號(hào)中包括的噪聲信號(hào)。
12.—種音頻信號(hào)處理方法,包括通過(guò)將包括噪聲信號(hào)的音頻信號(hào)的幅度值與閾值比較,檢測(cè)所述音頻信號(hào)的噪聲開(kāi)始點(diǎn)。計(jì)算至少表示所述噪聲開(kāi)始點(diǎn)之后的音頻信號(hào)的頻率特性的頻率特征;以及基于所述頻率特征,確定在所述噪聲開(kāi)始點(diǎn)之后的音頻信號(hào)中連續(xù)包括等于或高于參考頻率的高頻分量的段,作為噪聲段。
13.一種用于使得計(jì)算機(jī)執(zhí)行以下步驟的程序通過(guò)將包括噪聲信號(hào)的音頻信號(hào)的幅度值與閾值比較,檢測(cè)所述音頻信號(hào)的噪聲開(kāi)始點(diǎn)。計(jì)算至少表示所述噪聲開(kāi)始點(diǎn)之后的音頻信號(hào)的頻率特性的頻率特征;以及基于所述頻率特征,確定在所述噪聲開(kāi)始點(diǎn)之后的音頻信號(hào)中連續(xù)包括等于或高于參考頻率的高頻分量的段,作為噪聲段。
全文摘要
本發(fā)明提供了一種音頻信號(hào)處理裝置,包括幅度檢測(cè)器,配置為通過(guò)將包括噪聲信號(hào)的音頻信號(hào)的幅度值與閾值比較,檢測(cè)所述音頻信號(hào)的噪聲開(kāi)始點(diǎn);頻率特征計(jì)算器,配置為計(jì)算至少表示所述噪聲開(kāi)始點(diǎn)之后的音頻信號(hào)的頻率特性的頻率特征;以及噪聲確定器,配置為基于所述頻率特征,確定在所述噪聲開(kāi)始點(diǎn)之后的音頻信號(hào)中連續(xù)包括等于或高于參考頻率的高頻分量的段,作為噪聲段。
文檔編號(hào)H04R3/00GK102348150SQ201110206440
公開(kāi)日2012年2月8日 申請(qǐng)日期2011年7月22日 優(yōu)先權(quán)日2010年7月22日
發(fā)明者關(guān)矢俊之 申請(qǐng)人:索尼公司