專利名稱:基于對有用聲音靜音的心形波束的聲學(xué)裝置、系統(tǒng)和方法
技術(shù)領(lǐng)域:
本發(fā)明涉及聲學(xué)和信號處理的技術(shù)領(lǐng)域。更具體地說,本發(fā)明涉及在噪音環(huán)境中檢測和/或分辨有用聲音的聲學(xué)裝置、系統(tǒng)和方法,此環(huán)境噪音在統(tǒng)計(jì)學(xué)上與有用聲音不相關(guān),并且位于與有用聲音的方向不同的各個(gè)方向上。
背景技術(shù):
背景噪音的干擾是先進(jìn)的聲學(xué)應(yīng)用或者系統(tǒng)的主要障礙,不論所述聲學(xué)應(yīng)用或者系統(tǒng)是通信或自動語音識別(ASR)用的聲音獲取的拾音器系統(tǒng)、水聽器系統(tǒng)、聲納系統(tǒng)或者類似的其它聲學(xué)系統(tǒng)。已經(jīng)發(fā)現(xiàn),當(dāng)在混響環(huán)境中有多重背景噪音源,信號是非穩(wěn)態(tài)的、寬帶的、突發(fā)的和間歇發(fā)生的時(shí)候,解決這個(gè)問題尤其困難。
例如,在自動語音識別系統(tǒng)的情況下,把自動語音識別技術(shù)引入到大量的移動通信裝置中的需求日益增加,譬如用于因近來在移動通信和相關(guān)技術(shù)的迅速進(jìn)步的結(jié)果而應(yīng)用的蜂窩移動電話、汽車電話,和手持電腦等等中。然而,這些裝置多數(shù)常常工作在相對高噪音的聲學(xué)環(huán)境里,譬如在街道上、在汽車、客車、地鐵、火車或者飛機(jī)中,或者在高噪音的商場、工廠或者辦公室內(nèi)。這些混響環(huán)境中的背景噪音常常顯示出上面所述的非穩(wěn)態(tài)的、寬帶的、突發(fā)和間歇發(fā)生的特性。結(jié)果,利用語音識別界面的新應(yīng)用,不論是用于聽寫還是指令和控制面,都還是鳳毛麟爪。
為了克服這類的噪音問題,其他人借助于使用抵近嘴的手持送話器、頭戴式送受話器或者耳麥裝置??墒牵@些方法給使用者帶來諸多不便。這些附加的頭戴式送受話器/耳麥裝置的導(dǎo)線常常與其它的物體糾纏。無繩方式雖然較方便于使用者,但是它們本身又存在其它的局限和不便,例如,較高的成本。多麥克風(fēng)陣列可以避免一些限制,然而現(xiàn)有技術(shù)的多麥克風(fēng)陣列往往體積較大,對于多數(shù)應(yīng)用來說并不適合。
因此,需要有更加有效的技術(shù)解決方案,尤其是較緊湊的、不用手持、無頭戴式送受話器的,最重要的是無噪音的,可以實(shí)現(xiàn)較自然的人-機(jī)對話界面的技術(shù)解決方案,用于某些聲學(xué)應(yīng)用,譬如自動語音識別。此外,優(yōu)選地是,降噪和/或消噪不僅能提高有用聲音的清晰度和可懂度,而且降噪和/或消噪甚至還可能降低數(shù)字通信網(wǎng)絡(luò)的負(fù)載,從而得到較有效地使用其容量。
其它的應(yīng)用包括抗強(qiáng)噪音頭戴式送受話器、電話會議系統(tǒng)、數(shù)字語音錄音機(jī)和助聽器,等等。
發(fā)明內(nèi)容
簡言之,本發(fā)明包括聲學(xué)裝置、系統(tǒng)和方法。
根據(jù)一個(gè)方面,聲學(xué)裝置由第一組和第二組的一個(gè)或多個(gè)聲學(xué)元件形成。把所述第一組的一個(gè)或多個(gè)聲學(xué)元件設(shè)計(jì)和安排得促進(jìn)產(chǎn)生主要包括無用聲音的第一信號,基本上沒有有用聲音。把所述第二組的一個(gè)或多個(gè)聲學(xué)元件設(shè)計(jì)和安排得促進(jìn)產(chǎn)生既包括有用聲音也包括無用聲音的第二信號。
在一個(gè)實(shí)施例中,第一組一個(gè)或多個(gè)元件,響應(yīng)于聲音的出現(xiàn),不論是有用聲音還是無用聲音,產(chǎn)生在有用聲音的發(fā)源方向上具有靜音位的心形聲波束。所述第二組一個(gè)或多個(gè)元件以數(shù)個(gè)相輔方式之一生聲波束,以包含或者最大化有用聲音。
根據(jù)另一個(gè)方面,設(shè)有信號處理子系統(tǒng),用于使用兩個(gè)信號提取有用聲音。
在各種實(shí)施例中,信號處理子系統(tǒng)可以通過對第二信號引入一定的延遲,實(shí)踐各種類似于回波消除的信號提取技術(shù),或者實(shí)踐盲信號分離技術(shù)。
在各種類似于回波消除的信號提取實(shí)施例中,可以設(shè)預(yù)白化和去白化部件,以對信號進(jìn)行整形和復(fù)形。
在一個(gè)實(shí)施例中,有用聲音是語音,尤其是要在高噪音混響環(huán)境中有待識別的語音,此噪音是隨機(jī)的并且與有用的語音不相關(guān),譬如在汽車中或者在辦公室中。
下面將通過附圖中所示的示例性,但并非限制性的實(shí)施例說明本發(fā)明,在附圖中相同的標(biāo)號說明類似的元件,附圖中圖1示出本發(fā)明一個(gè)實(shí)施例的概況;圖2a-2g根據(jù)不同的實(shí)施例,較詳細(xì)地示出圖1所示聲學(xué)裝置形成的波束;圖3示出根據(jù)一個(gè)實(shí)施例的補(bǔ)充邏輯,它適用于與圖1所示聲學(xué)裝置結(jié)合,以產(chǎn)生圖2g所示的波束方向圖;圖4a以極坐標(biāo)靈敏度圖的形式示出由圖2a-2c,和圖2g(在用圖3的電路補(bǔ)充時(shí))的各種聲學(xué)裝置產(chǎn)生的聲波束;圖4b以極坐標(biāo)靈敏度圖的形式示出圖2d-2f所示的聲波束;圖4c-4d以極坐標(biāo)靈敏度圖的形式示出其它可能的主信號波束;圖5根據(jù)一個(gè)實(shí)施例,較詳細(xì)地示出圖1所示信號處理子系統(tǒng);圖6a-6b根據(jù)一個(gè)實(shí)施例,較詳細(xì)地示出圖5所示采樣部件;圖7a-7b根據(jù)一個(gè)實(shí)施例,示出適于用作供選擇的圖5所示信號調(diào)節(jié)和重新調(diào)節(jié)部件的預(yù)白化和去白化部件,用于某些聲學(xué)應(yīng)用;圖8根據(jù)一個(gè)實(shí)施例,較詳細(xì)地示出圖5所示信號提取部件;圖9根據(jù)一個(gè)實(shí)施例,較詳細(xì)地示出圖8所示平均幅值計(jì)算部件;圖10a-10b根據(jù)二個(gè)實(shí)施例,較詳細(xì)地示出圖8所示檢測器部件;圖11a-11e根據(jù)不同的實(shí)施例,示出圖8中類似于回波消除算法的邏輯;圖12根據(jù)一個(gè)實(shí)施例,示出圖8所示抑制器部件的工作邏輯;圖13根據(jù)另一個(gè)實(shí)施例,較詳細(xì)地示出圖5所示的另一種信號提取邏輯。
具體實(shí)施例方式
在下面的說明中,將闡述本發(fā)明的各種實(shí)施例,尤其是用于自動語音識別的實(shí)施例。然而,從以下的闡述中,本領(lǐng)域內(nèi)普通技術(shù)人員會理解本發(fā)明不是僅限制于自動語音識別。本發(fā)明可以在其它聲學(xué)應(yīng)用中實(shí)施,包括但是不限于通信裝置、錄音裝置、助聽器以及水聽器和聲納。
為了闡述的目的,提供了特定的數(shù)字、材料和構(gòu)造,以便提供對本發(fā)明的全面理解。然而,本領(lǐng)域內(nèi)普通技術(shù)人員會理解本發(fā)明可以只用某些細(xì)節(jié),和/或用其它的元件實(shí)施。在某些時(shí)候又忽略或者簡述公知的特征。
術(shù)語部分說明將按聲學(xué)和信號處理的術(shù)語表達(dá),譬如聲波束、脈沖響應(yīng)、采樣、信號整形、信號提取等等,與本領(lǐng)域內(nèi)普通技術(shù)人員向領(lǐng)域內(nèi)其它普通技術(shù)人員交流其工作對象時(shí)常用的方式一致。如像本領(lǐng)域內(nèi)普通技術(shù)人員所充分地理解的那樣,即使在本發(fā)明的某些方面的軟件實(shí)現(xiàn)中,這些量也取能夠被存儲、傳送、結(jié)合以及以其它方式經(jīng)電和/或光處理器部件及其子系統(tǒng)操作的電、磁或者光信號的形式。
部分說明將采用各種縮略語,包括但是不限于
段落標(biāo)題、說明的順序和實(shí)施例段落標(biāo)題,只用于提高可讀性,它們不被解釋為限制或者窄化本發(fā)明。
以最有助于理解本發(fā)明的形式,將以多個(gè)分開的步驟依次說明各種操作,然而說明的次序不應(yīng)當(dāng)理解為必須依照此次序應(yīng)用這些操作。具體地說,這些操作不需要按本表述的次序進(jìn)行。
短語“在一個(gè)實(shí)施例中”反復(fù)地使用。然而這些短語盡管有可能,但是一般并不指同一個(gè)實(shí)施例。術(shù)語“含有”、“具有”、“包括”和其它類型結(jié)構(gòu),是同義語,除非上下文另有所指。
概述我們現(xiàn)在參閱圖1,其中方框圖根據(jù)一個(gè)實(shí)施例示出本發(fā)明的聲學(xué)系統(tǒng)的概況。如圖所示,對于該實(shí)施例,聲學(xué)系統(tǒng)100包括聲學(xué)裝置102和信號處理子系統(tǒng)104,兩者均納入本發(fā)明的學(xué)說中。兩個(gè)元件如圖所示互相連接。
根據(jù)本發(fā)明,聲學(xué)裝置102設(shè)計(jì)得用于響應(yīng)聲音的出現(xiàn),不論是有用的還是無用的(即噪音),輸出兩個(gè)聲音波束103a和103b,其中聲音波束103a主要有無用聲音,很大程度沒有有用聲音,而聲音波束103b既有有用聲音也有無用聲音。
兩個(gè)聲音波束(下文中,簡稱波束)由信號處理子系統(tǒng)104采樣,以產(chǎn)生兩個(gè)相應(yīng)的聲音信號(下文中,簡稱信號),這兩個(gè)聲音信號又被信號處理子系統(tǒng)104用于提取有用聲音,通過從與第二波束相應(yīng)的第二信號中去除與第一波束相應(yīng)的第一信號。
如本領(lǐng)域內(nèi)普通技術(shù)人員將會基于以下說明理解,聲學(xué)裝置102可以使用少到兩個(gè)聲學(xué)元件的緊湊地形成,且每個(gè)聲學(xué)元件各用于相應(yīng)的兩個(gè)波束之一的響應(yīng)性產(chǎn)生。結(jié)果,本發(fā)明能夠提供更緊湊并便于使用者的、不得不訴諸于從復(fù)雜的噪音環(huán)境中恢復(fù)有用聲音的聲學(xué)應(yīng)用的人-機(jī)界面,譬如是許多ASR應(yīng)用。
而且在本發(fā)明的情況下,聲音波束103a可以通過具有心形波束方向圖的元件產(chǎn)生,所述的元件在空間中除了有用聲音方向以外的所有方向上有顯著的靈敏度。結(jié)果,與帶有某些不完全噪聲消除的“盲點(diǎn)”方向的現(xiàn)有技術(shù)不同,本發(fā)明實(shí)際上可以消除從數(shù)個(gè)方向上任何一個(gè)方向來的噪音。
聲學(xué)裝置如前文所述,可以用少至兩個(gè)聲學(xué)元件形成緊湊的聲學(xué)裝置102。圖2a-2g從形成的聲音波束的角度上,示出幾個(gè)這樣的實(shí)施例。但是本發(fā)明不受這些實(shí)施例的限制。在變通的實(shí)施例中,可以代之以用兩個(gè)或者兩個(gè)以上的聲學(xué)元件響應(yīng)性地產(chǎn)生波束103a和103b。為了易于理解,在本文中主要采用各種兩個(gè)聲學(xué)元件的實(shí)施例進(jìn)行說明。而且,簡單地把聲學(xué)裝置102稱為“麥克風(fēng)”。
圖2a-2c示出三個(gè)兩個(gè)元件的實(shí)施例,在此一個(gè)元件202響應(yīng)聲音的出現(xiàn)而產(chǎn)生心形波束咪頭,而另一個(gè)元件204響應(yīng)聲音的出現(xiàn)而產(chǎn)生一個(gè)全指向形波束咪頭。在這些實(shí)施例中的每一個(gè),產(chǎn)生心形波束咪頭的聲學(xué)元件(下文中,簡稱為“麥克”)202安排得把心形咪頭麥克的靜音面對預(yù)期的有用聲音的起源方向。
對于圖2a的實(shí)施例,產(chǎn)生全指向形波束咪頭的麥克204安排得面對預(yù)期的有用聲音的起源方向,平行于產(chǎn)生心形波束咪頭的麥克202。對于圖2b-2c所示的每個(gè)實(shí)施例,全指向形波束咪頭產(chǎn)生麥克204安排得面對預(yù)期的有用聲音的起源方向,與產(chǎn)生心形波束咪頭的麥克202成串列。對于圖2b所示的實(shí)施例,全指向形波束咪頭產(chǎn)生麥克204安排得置于產(chǎn)生心形波束咪頭的麥克202的“后面”。對于圖2c所示的實(shí)施例,全指向形波束咪頭產(chǎn)生麥克204安排得置于產(chǎn)生心形波束咪頭的麥克202的“前面”(兩者都從預(yù)期的有用聲音的起源方向的角度觀察)。
圖4a(以“極坐標(biāo)靈敏度”圖的形式)示出由圖2a-2c的安排的元件202和204響應(yīng)性地產(chǎn)生的聲波束103a和103b。如前文所述,聲波束103a含有面對有用聲音的起源方向的靜音。對于這些實(shí)施例,聲波束103b沿所有方向“輻射”,并且不含有任何靜音。
心形波束咪頭產(chǎn)生元件202的靜音力圖消除有用聲音漏進(jìn)聲波束103a。實(shí)際上,靜音往往可以得到相對于相反方向的靈敏度高達(dá)-20dB的衰減。然而,經(jīng)驗(yàn)表明本發(fā)明還較現(xiàn)有技術(shù)表現(xiàn)出一致全面的改善結(jié)果。
典型的情況是,這兩個(gè)聲學(xué)元件放置得大致彼此鄰接,以能夠(對于某些應(yīng)用)形成有用的緊湊的人-機(jī)界面。對于這些應(yīng)用,兩個(gè)分立的麥克元件之間分開的距離可以在小到0.2cm至1cm的范圍。對于半導(dǎo)體聲學(xué)器件,分開的距離可以在微米甚至于亞微米的范圍。盡管應(yīng)當(dāng)小心地減少元件之間的交叉干擾,如圖2a-2c所示,其相對布置,即是并列地還是串列地面對預(yù)期的有用聲音的起源方向,并不像其各自的波束方向圖那么重要。
圖2d-2f示出三個(gè)變通的兩個(gè)元件的實(shí)施例,這里兩個(gè)元件都是產(chǎn)生心形波束咪頭的麥克202a-202b。在這些實(shí)施例中的每一個(gè),兩個(gè)產(chǎn)生心形波束咪頭的麥克之一202a安排得以其靜音面對預(yù)期的有用聲音的起源方向,而另一個(gè)產(chǎn)生心形波束咪頭的麥克202b安排得以其靜音面對背離預(yù)期的有用聲音的起源方向。
對于圖2d的實(shí)施例,所述另一個(gè)心形波束咪頭產(chǎn)生麥克202b安排得以其靜音面對背離預(yù)期的有用聲音的起源方向,與第一心形波束咪頭產(chǎn)生麥克202a并列。同樣,對于圖2e-2f的實(shí)施例中的每一個(gè),所述另一個(gè)心形波束咪頭產(chǎn)生麥克202b也是安排得以其靜音面對背離預(yù)期的有用聲音的起源方向,只是與第一心形波束咪頭產(chǎn)生麥克202a串列。
對于圖2e所示的實(shí)施例,所述另一個(gè)心形波束咪頭產(chǎn)生麥克202b安排得置于第一心形波束咪頭產(chǎn)生麥克202a的“后面”,而對于圖2f所示的實(shí)施例,所述另一個(gè)心形波束咪頭產(chǎn)生麥克202b安排得置于第一心形波束咪頭產(chǎn)生麥克202a的“前面”(兩者都從預(yù)期的有用聲音的起源方向的角度觀察)。
圖4b(也以“極坐標(biāo)靈敏度”圖的形式)示出由圖2d-2f的安排的元件202a和202b響應(yīng)性地產(chǎn)生的聲波束103a和103b。如前文所述,波束103a含有面對有用聲音的起源方向的靜音。對于這些實(shí)施例,波束103b含有面對背離有用聲音的起源方向的靜音。
圖2g示出了又一個(gè)變通的兩個(gè)元件的聲學(xué)裝置102的實(shí)施例。對于這個(gè)實(shí)施例,用兩個(gè)全指向形的波束咪頭產(chǎn)生麥克204a和204b取代。這兩個(gè)元件204a和204b安排得成串列地面對預(yù)期的有用聲音的起源方向。這種安排需利用圖3所示的電路輔助,所述的電路含有延遲線312、放大器314和加法器316,實(shí)施一種“延遲相加”的波束成形方法。
如前所述,第二全指向形波束咪頭產(chǎn)生麥克204b的響應(yīng)性輸出提供波束103b。然而,波束103a則是通過對第一全指向形波束咪頭產(chǎn)生麥克204a的響應(yīng)性輸出加延遲,使用延遲線312、使用放大器314放大,然后從波束103b中減去而形成的。
所述延遲應(yīng)當(dāng)選擇得使帶寬中的所有頻率形式的心形的靜音足夠深。所述的兩個(gè)聲學(xué)元件可以通過調(diào)節(jié)放大器314的增益平衡,以避免失配和降低靜音。
圖3的電路可以集成在作為聲學(xué)裝置102的一部分,或者它也可以集成在作為信號處理子系統(tǒng)104的一部分。在又一個(gè)實(shí)施例中,兩個(gè)全指向形波束咪頭產(chǎn)生麥克204a和204b的扮演角色可以反過來。
另外,除了圖4a和4b的“無靜音”和“單個(gè)背離靜音”形狀之外,波束103b可以含有兩個(gè)或者兩個(gè)以上的靜音,只要沒有一個(gè)靜音面對有用聲音的起源方向即可。
例如,圖4c示出一種變通的“丁香葉”波束形狀(以“極坐標(biāo)靈敏度”圖的形式),因?yàn)椴ㄊ?03b有兩個(gè)“葉子”,形成兩個(gè)靜音,以兩個(gè)靜音面對基本上與有用聲音的起源方向正交的兩個(gè)方向406a和406b。圖4d示出又一種變通的“丁香葉”波束形狀(以“極坐標(biāo)靈敏度”圖的形式),因?yàn)椴ㄊ?03b有兩個(gè)“葉子”,形成兩個(gè)靜音,以兩個(gè)靜音面對各與有用聲音的起源方向成一鈍角的兩個(gè)方向406c和406d。
總之,聲學(xué)裝置102含有兩個(gè)或者兩個(gè)以上的以便于產(chǎn)生兩個(gè)信號的方式設(shè)計(jì)和安排的聲學(xué)元件,以一個(gè)信號主要含有無用聲音,基本上沒有有用聲音,而另一個(gè)信號既含有有用的也含有無用聲音。這兩個(gè)或者兩個(gè)以上的聲學(xué)元件可以,例如響應(yīng)聲音的出現(xiàn),不論有用聲音還是無用聲音,輸出具有面對有用聲音的起源方向的靜音的心形波束咪頭,而另一個(gè)波束具有數(shù)個(gè)互補(bǔ)的波束形狀之一(只要它不含有面對有用聲音的起源方向的靜音)。
信號處理子系統(tǒng)圖5根據(jù)一個(gè)實(shí)施例,較詳細(xì)地示出圖1所示信號處理子系統(tǒng)。如圖中所示,對于該實(shí)施例,信號處理子系統(tǒng)104含有兩個(gè)輸入聲頻道(標(biāo)示為“參照”和“主”)、采樣部件502、可供選擇的提取前信號整形部件504、信號提取部件506,和可供選擇的提取后信號整形部件508。這些部件如圖所示地相互連接。
參照聲頻道用于接收波束103a,而主聲頻道用于接收波束103b。
采樣部件504用于數(shù)字化波束103a和103b。典型的情況,它們兩個(gè)都以相同的采樣頻率被同步地?cái)?shù)字化,所述的采樣頻率取決于應(yīng)用,并且按照系統(tǒng)帶寬要求選擇。在ASR應(yīng)用的情況下,采樣頻率,例如可以是8kHz、11kHz、12kHz或者16kHz。
典型的情況,可供選擇的提取前和提取后信號整形部件504和508都取決于應(yīng)用和/或提取技術(shù)。例如,在ASR應(yīng)用,和某種信號提取技術(shù),譬如類似于NLMS處理的回波消除的情況下,提取前和提取后信號整形部件504和508可以是預(yù)白化和去白化濾波器。預(yù)白化和去白化濾波器用于平整,和恢復(fù)兩個(gè)信號的頻譜密度。對于不平坦的信號頻率分布,平整兩個(gè)聲頻道的頻譜密度提高了NLMS的收斂速度。其它的單聲頻道噪音消除技術(shù),譬如頻譜相減,可以加入作為另外一級可供選擇的提取后信號整形部件。
采樣部件圖6a-6b根據(jù)二個(gè)實(shí)施例,較詳細(xì)地示出圖5所示的采樣部件。對于圖6a的實(shí)施例,采樣部件502含有兩個(gè)A/D轉(zhuǎn)換器606,各用于兩個(gè)波束103a和103b之一。另外,采樣部件502還含有前置放大器602和反混疊濾波器604。這些部件如圖所示地相互連接在一起。
從各個(gè)聲學(xué)元件發(fā)出的信號由相應(yīng)的前置放大器602放大,然后在以采樣頻率Fs用相應(yīng)的A/D轉(zhuǎn)換器數(shù)字化以前,通過相應(yīng)的反混疊濾波器604來限制帶寬。
圖6b示出另一個(gè)實(shí)施例,在此只使用一個(gè)A/D轉(zhuǎn)換器606。然而采樣部件502還包括采樣和保持部件608以及切換器610。這些部件如圖所示地相互連接在一起。
各個(gè)信號經(jīng)過如圖6a所示的相同的處理,直到(使用反混疊濾波器604)進(jìn)行了反混疊濾波之后,再用采樣-保持(S/H)單元608采樣,以產(chǎn)生分立的信號。然后把輸出(用切換器610)與另一聲頻道發(fā)出的分立的信號切換。最后,把切換的信號用A/D轉(zhuǎn)換器606以兩倍采樣頻率(2×Fs)數(shù)字化成數(shù)字信號。
預(yù)白化和去白化如前文所述,對于某些聲學(xué)應(yīng)用,譬如傾向有較強(qiáng)的低頻成分而不是高頻成分的ASR應(yīng)用中,進(jìn)行信號的提取前整形可能是值得追求的,譬如通過預(yù)白化濾波的頻譜密度平整,以及提取后反向整形,譬如通過去白化濾波恢復(fù)頻譜密度。
對于這些應(yīng)用,在主輸入和參照輸入被輸送到信號提取部件506之前,預(yù)白化濾波器(也稱為消色濾波器)施加在主輸入和參照輸入上,尤其是,如果部件506進(jìn)行NMLS噪音消除處理時(shí),為了減輕可能由(高度自相關(guān)的)窄帶的輸入信號引起的慢收斂速率問題。
在圖7a和7b中,各示出一個(gè)預(yù)白化濾波器,和一個(gè)去白化濾波器實(shí)施例。
對于圖7a的實(shí)施例,預(yù)白化濾波器504是具有以下公式特性的預(yù)加重濾波器Yn=Xn-α*Xn-1對于所述的實(shí)施,預(yù)白化濾波器504包括存儲元件702和704,用于存儲前一個(gè)輸入值Xn-1和常數(shù)α,還包括切換器706和加法器708。這些元件如圖所示地相互連接,并且協(xié)同工作以執(zhí)行處理以按上述的公式計(jì)算輸出Yn。
在另一個(gè)實(shí)施例中,預(yù)白化濾波器504還可以用軟件實(shí)施。
圖7b示出互補(bǔ)性的去白化濾波器采取去加重濾波的形式,由以下公式指出其特性
Yn=Xn+α*Yn-1對于所述的實(shí)施例,去白化濾波器508包括存儲元件724和722,用于存儲以前輸出的值Yn-1和常數(shù)α,還包括切換器726和加法器728。這些元件如圖所示地相互連接,并且協(xié)同工作以執(zhí)行處理以按上述的公式計(jì)算輸出Yn。
同樣,在另一個(gè)實(shí)施例中,去白化濾波器508也可以用軟件實(shí)施。
信號提取部件圖8根據(jù)一個(gè)實(shí)施例,較詳細(xì)地示出圖5所示的信號提取部件。該實(shí)施例執(zhí)行類似于回波取除的技術(shù),以便通過從主聲頻道中去掉參照信號而恢復(fù)有用聲音。該技術(shù)稱為“回波消除”類是因?yàn)轭愃朴诔R?guī)的“回波消除”,一個(gè)信號從另一個(gè)信號中減去。但是,在經(jīng)典的“回波消除”中,產(chǎn)生“回波”的原信號是可知的;并且該原信號不混有有用聲音。而在本發(fā)明中,得不到原噪音信號。盡管在本發(fā)明中,參照信號是“基本上沒有有用聲音的”,可它還是含有某些有用聲音。故應(yīng)當(dāng)采取額外的步驟,譬如抑制,以避免消除有用的信號。在經(jīng)典的“回波消除”中,是“回波”信號被從有用信號和回波信號的復(fù)合信號中減去,而且更重要的是,“回波”信號對產(chǎn)生回波的原聲音有著天然明確的時(shí)延關(guān)系。與此相反,在本發(fā)明中,是經(jīng)過濾的參照信號,基本上沒有有用聲音,從既有有用信號也有無用信號的主信號中被減去,實(shí)際上,響應(yīng)于有用信號和無用信號的存在的參照信號和主信號是同時(shí)獲取的。
因此,除了類似于回波消除邏輯810以外,信號提取部件506尤其還包括延遲元件802,以便于人工地對在波束103b的基礎(chǔ)上形成的信號(即在主聲頻道上的信號)引出明確的延遲。該人工引入的延遲使得此結(jié)構(gòu)能夠模擬聲學(xué)裝置102的聲學(xué)元件之間的混響。而且,它還使得用在類似于回波消除信號處理技術(shù)中的自適應(yīng)式FIR濾波器得以近似一個(gè)非因果性濾波器。
人工引入以模擬混響的延遲量取決于應(yīng)用。一般來說,這個(gè)量大約是此環(huán)境的脈沖響應(yīng)的持續(xù)時(shí)間的數(shù)量級。在各種應(yīng)用中,對于汽車的環(huán)境,該量大約30ms-60ms,對于辦公室的環(huán)境,是100ms-200ms。
對于該實(shí)施例,回波消除類提取有用聲音實(shí)際上是有條件地工作的,只有當(dāng)兩路信號都激活有效時(shí)才行。因此,對于該實(shí)施例,除了信號提取邏輯810和延遲元件802之外,信號提取部件506還包括平均幅值估算部件804、聲頻道信號檢測器806和抑制邏輯808。聲頻道信號檢測器806還籠統(tǒng)地稱為“比較器”部件,并且在一個(gè)實(shí)施例中,尤其包括兩個(gè)聲頻道啟動檢測器,參照聲頻道和主聲頻道各有一個(gè),信號提取部件還包括一個(gè)有用聲音檢測器。這些元件相互連接,并且連接到前文所列的元件。
平均幅值估算部件804用來判斷/估算兩聲頻道信號的能量或幅值,用于聲頻道信號檢測器806,也就是聲頻道啟動檢測器和有用聲音檢測器,以及用于類似于回波消除的信號提取處理。
在一個(gè)實(shí)施例中,采用的類似于回波消除的信號提取處理是用一個(gè)NLMS FIR濾波器(圖11a)的自適應(yīng)噪音消除處理。在另一個(gè)實(shí)施例中,采用的類似于回波消除的信號提取處理是用數(shù)個(gè)頻域LMS濾波器(圖11b-11c)的自適應(yīng)噪音消除處理。在又一個(gè)實(shí)施例中,采用的類似于回波消除的信號提取處理是用數(shù)個(gè)子頻帶LMS濾波器(圖11d-11e)的自適應(yīng)噪音消除處理。
這些元件在下文依次進(jìn)一步說明。
平均幅值估算器圖9根據(jù)一個(gè)實(shí)施例,較詳細(xì)地示出圖8所示的平均幅值計(jì)算部件。對于該實(shí)施例,平均幅值估算器804計(jì)算進(jìn)行如下公式指出特征的輸入絕對值的加權(quán)運(yùn)行均值
Yn=(1-α)*Yn-1+α*|Xn|加權(quán)系數(shù)決定運(yùn)行窗口的長度。
該實(shí)施例包括各種分別用于存儲|Xn|、Yn-1、α和(1-α)數(shù)值的存儲元件902-908,還包括進(jìn)行該運(yùn)算的切換器910和加法器912。
如同前文所述的預(yù)白化和去白化元件一樣,平均幅值估算部件804也可以用軟件實(shí)施。
檢測器圖10a-10b根據(jù)一個(gè)實(shí)施例,較詳細(xì)地示出圖8所示的比較器部件,即檢測器。更具體地說,圖10a示出有用聲音檢測器806a的邏輯,而圖10b示出聲頻道啟動檢測器806b的邏輯。
對于所示的實(shí)施例,有用聲音檢測器806a包括存儲元件1002,用于存儲聲音閾值偏置。另外,有用聲音檢測器806a還包括比例計(jì)算器1004、長期運(yùn)行平均幅值比值計(jì)算器1006、加法器1008和比較器1010。這些元件如圖所示地相互連接。該實(shí)施例是基于能量的檢測器。
比例計(jì)算器1004用于計(jì)算主信號和參照信號平均幅值之比。運(yùn)行平均幅值比值計(jì)算器1006用于計(jì)算所述比例的長期運(yùn)行平均值,這為有用聲音提供基礎(chǔ)或者說是基底。加法器1008和比較器1010用于比較當(dāng)前的比例,以判斷它是否比長期運(yùn)行比例大至少閾值的偏置。如果它至少在閾值偏置以上,就認(rèn)為是檢測到了有用聲音,不然就認(rèn)為沒有有用聲音。
該實(shí)施例設(shè)計(jì)用于傾向于表現(xiàn)突發(fā)特性的聲音,譬如語音。對于其它的應(yīng)用,可以代之以采用適當(dāng)?shù)匦薷牧说膶?shí)施例。
在變通的實(shí)施例中,可以代之以采用其它有用聲音檢測器,例如基于相關(guān)性的有用信號的檢測器。圖10b根據(jù)一個(gè)實(shí)施例,較詳細(xì)地示出聲頻道啟動檢測器。該實(shí)施例是基于能量的比較器。如圖所示,聲頻道啟動檢測器806b含有用于存儲閾值的存儲元件1024、用于把聲頻道的平均幅值與存儲的閾值進(jìn)行比較的比較器1026。如果它在存儲的閾值以上,就認(rèn)為該聲頻道是啟動的,否則就認(rèn)為是沒有啟動的。
此外,如同前文所述的預(yù)白化和去白化元件,以及平均幅值估算元件一樣,檢測器804a和804b也可以用軟件實(shí)施。
抑制圖12根據(jù)一個(gè)實(shí)施例,較詳細(xì)地示出圖8所示抑制部件的工作邏輯。如圖所示,對于該實(shí)施例,設(shè)計(jì)用于時(shí)域?qū)嵤┑囊种撇考?08,使用由檢測器806提供的輸入,首先判斷是否主聲頻道和參照聲頻道兩者都被激活了,見圖12中的方框1202-1204。如果或主聲頻道或參照聲頻道有一個(gè)被判斷為是沒有啟動的,就把抑制信號設(shè)定為“正”,導(dǎo)致信號提取組件基本上不工作(例如為保留計(jì)算能力),也就是說,不進(jìn)行信號提取(濾波)或?qū)μ崛〉恼{(diào)節(jié)(適應(yīng))。對于該實(shí)施例,在此條件下,輸出原有主聲頻道上的信號,見圖12中的方框1210。
然而,如果兩個(gè)聲頻道都是啟動的,抑制邏輯808進(jìn)一步判斷是否有有用聲音出現(xiàn),或者是否還沒有達(dá)到停止閾值(也稱為殘留時(shí)間),見圖12中的方框1206-1208。停止閾值(殘留時(shí)間)取決于應(yīng)用。例如在ASR的情況下,停止閾值可以是幾分之一秒。
如果檢測出有用聲音,或者沒有超過停止閾值,就把抑制信號設(shè)定為“正的且濾波器自適應(yīng)停止”,即濾波系數(shù)固定不變,見圖12中的方框1212。參照信號通過固定濾波器從主聲頻道中減去,以產(chǎn)生有用聲音。
如果沒有檢測出有用聲音,并且超過停止時(shí)間(但是聲頻道是啟動的),就把抑制信號設(shè)定為“負(fù)的且濾波器自適應(yīng)啟動”,見圖12中的方框1214。在這種條件下,所用濾波器的濾波系數(shù)將通過自適應(yīng)調(diào)節(jié)。
注意,上述實(shí)施例有利地在主信號(具有有用聲音)延遲前采用檢測器和抑制,從而降低了有用聲音干擾影響濾波器自適應(yīng)工作的可能性。
如前文所提及,在下文中還要詳細(xì)地說明,濾波也可以在頻域和子頻帶域內(nèi)進(jìn)行。對于這些實(shí)施例,上述的抑制實(shí)施也可以在各頻率上分別進(jìn)行,或者在各子頻帶上分別進(jìn)行。
類似于回波消除的信號提取部件圖11a-11e根據(jù)不同的實(shí)施例,較詳細(xì)地示出圖8所示的類似于回波消除的提取部件。更具體地說,圖11a示出采用適應(yīng)NLMS的方法,而圖11b-11c示出兩個(gè)采用適應(yīng)頻域LMS的方法。圖11d-11e示出兩個(gè)采用適應(yīng)子頻帶LMS的方法。
如圖11a所示,NLMS自適應(yīng)實(shí)施例的類似于回波消除的信號提取部件810含有自適應(yīng)FIR濾波器1102和加法器1104。這些部件如圖所示地相互連接。
參照聲頻道(整形過的)信號由自適應(yīng)FIR濾波器1102濾波,并且使用加法器1104從延遲了的主聲頻道信號中減去。將所得結(jié)果輸出為有用聲音。
提取邏輯工作為在逐個(gè)采樣點(diǎn)基礎(chǔ)上運(yùn)行的循環(huán)。參照信號由自適應(yīng)FIR濾波器1102濾波。主要是,把頻響函數(shù)用于參照聲頻道,以模擬從心形元件到其它元件的聲學(xué)通路,從而濾波過的參照信號緊密地匹配主聲頻道中的信號的噪音分量。再把濾波過的參照信號從延遲后的主信號中減掉。所留下的就是有用聲音。
NLMS的輸出也稱為NLMS誤差;它用于調(diào)節(jié)自適應(yīng)FIR濾波器系數(shù),從而在沒有有用聲音時(shí)將會把NLMS誤差最小化。
如圖11b所示,第一種頻域LMS實(shí)施例的類似于回波消除的信號提取部件810含有FFT部件1112、數(shù)個(gè)自適應(yīng)濾波器(示出兩個(gè))1114、數(shù)個(gè)加法器(示出兩個(gè))1116和IFFT部件1118。這些部件如圖所示地相互連接。
參照聲頻道(整形過的)信號和延遲后的主聲頻道信號首先由相應(yīng)的FFT部件1112“分解”成數(shù)個(gè)頻率分量(示出兩個(gè))。參照信號的每個(gè)頻率分量由相應(yīng)的自適應(yīng)濾波器1114濾波,并且用相應(yīng)的加法器1116從延遲后的主聲頻道信號的相應(yīng)的頻率分量中減去。再用IFFT部件1118“重新復(fù)合”結(jié)果得出的頻率分量,并且把重新復(fù)合的信號輸出為有用聲音。
如圖11c所示,第二種頻域LMS實(shí)施例的類似于回波消除的信號提取部件810含有FFT部件1122a-1122b、數(shù)個(gè)自適應(yīng)濾波器(示出兩個(gè))1124、加法器1128和IFFT部件1126。這些部件如圖所示地相互連接。
參照聲頻道(整形過的)信號首先由FFT部件1122a“分解”成數(shù)個(gè)頻率分量(示出兩個(gè))。參照信號的每個(gè)頻率分量由相應(yīng)的自適應(yīng)濾波器1124濾波。用IFFT部件1126把過濾過的頻率分量“重新復(fù)合”成濾波過的參照信號,然后用加法器1128從延遲后的主聲頻道的信號中減去,以產(chǎn)生有用聲音。
誤差信號(含有有用聲音),也是利用FFT部件1122b“分解”成數(shù)個(gè)頻率分量,并且“分解”出來的頻率分量用于調(diào)節(jié)自適應(yīng)濾波器1124。
如圖11d所示,第一種子頻帶LMS實(shí)施例的類似于回波消除信號的提取部件810含有分解濾波器組1132a-1132b、數(shù)個(gè)下向采樣單元(示出兩套)1134a-1134b、數(shù)個(gè)自適應(yīng)濾波器(示出兩個(gè))1136、數(shù)個(gè)加法器(示出兩個(gè))1138、數(shù)個(gè)上向采樣單元(示出兩個(gè))1140和一個(gè)合成濾波器組1142。這些部件如圖所示地相互連接。
參照聲頻道(整形過的)信號和延遲后的主聲頻道信號首先由相應(yīng)的分解濾波器組1132a/1132b“分解”成數(shù)個(gè)子頻帶分量(示出兩個(gè))。參照信號的每個(gè)子頻帶分量使用相應(yīng)下向采樣單元1134,按預(yù)定的因數(shù)下向采樣,然后由相應(yīng)的自適應(yīng)濾波器1136濾波。接著用相應(yīng)的加法器1138從延遲后的主聲頻道的信號的相應(yīng)子頻帶分量中減去各個(gè)濾波過的子頻帶分量。得出的子頻帶分量使用相應(yīng)上向采樣單元1140按相同的因數(shù)上向采樣,然后,用合成濾波器組1142“重新復(fù)合”。把重新復(fù)合了的信號輸出成有用聲音。
如圖11e所示,第二種子頻帶LMS實(shí)施例的類似于回波消除信號的提取部件810含有分解濾波器組1152a-1152b、數(shù)個(gè)下向采樣單元(示出兩個(gè))1154a-1154b、數(shù)個(gè)自適應(yīng)濾波器(示出兩個(gè))1156、數(shù)個(gè)上向采樣單元(示出兩個(gè))1158、合成濾波器組1160和加法器1162。這些部件如圖所示地相互連接。
參照聲頻道(整形過的)信號首先用分解濾波器組1152a“分解”成數(shù)個(gè)子頻帶分量(示出兩個(gè))。參照信號的每個(gè)子頻帶分量使用相應(yīng)下向采樣單元1154a按預(yù)定的因數(shù)下向采樣,然后由相應(yīng)的自適應(yīng)濾波器1156濾波。濾波后的子頻帶分量使用相應(yīng)上向采樣單元1158上向采樣,然后,用合成濾波器組1160重新復(fù)合成濾波過的參照信號,再把所述濾波過的參照信號用加法器1162從延遲后的主聲頻道的信號中減去,以產(chǎn)生有用聲音。
誤差信號(含有有用聲音),也用分解濾波器組1152b和下向采樣單元1154b“分解”成數(shù)個(gè)子頻帶分量。并且把“分解”出的子頻帶分量用于調(diào)節(jié)自適應(yīng)濾波器1156。
這些信號提取部件的實(shí)施例的每一個(gè)也都可以用軟件實(shí)施。
盲信號分離圖13根據(jù)一個(gè)實(shí)施例,較詳細(xì)地示出圖5所示的信號提取部件506。與上述的類似于回波消除的信號提取實(shí)施例不同,圖13所示出的信號提取部件506實(shí)施盲信號分離技術(shù),以便從主聲頻道的信號中去除參照聲頻道的信號,提取有用聲音。
如圖所示,信號提取部件810含有數(shù)個(gè)自適應(yīng)FIR濾波器1302、加法器1306和成本函數(shù)運(yùn)算器1304。這些部件如圖所示地相互連接。
不論是參照聲頻道還是主聲頻道都用自適應(yīng)FIR濾波器1302濾波。得到的結(jié)果用相應(yīng)加法器1306分別與彼此原信號求差。以參照信號被從主信號中減掉,就是有用聲音,輸出所得到的信號。
再把輸出信號反饋到成本函數(shù)運(yùn)算器,它以兩個(gè)輸出信號為輸入,對自適應(yīng)FIR濾波器1302作各自分別的自適應(yīng)調(diào)節(jié)。具體的成本函數(shù)則依據(jù)各BSS方法有所不同。
小結(jié)和后記這樣,從以上的說明可以看到,已經(jīng)闡述了各種新穎的聲學(xué)裝置、系統(tǒng)和方法。
盡管就上述實(shí)施例說明了本發(fā)明,本領(lǐng)域內(nèi)普通技術(shù)人員將認(rèn)識到,本發(fā)明不限制于所述的實(shí)施例。本發(fā)明可以在所附權(quán)利要求書的精神和范圍內(nèi)通過修改和變通來實(shí)現(xiàn)。因而本說明書應(yīng)當(dāng)視為解說本發(fā)明,而不是限制本發(fā)明。
權(quán)利要求
1.聲學(xué)裝置,含有第一種一個(gè)或多個(gè)聲學(xué)元件,用第一方式設(shè)計(jì)和安排,以促進(jìn)產(chǎn)生主要包括無用聲音的第一信號,基本上沒有有用聲音;以及第二種一個(gè)或多個(gè)聲學(xué)元件,用第二互補(bǔ)的方式設(shè)計(jì)和安排,以促進(jìn)產(chǎn)生既包括有用聲音也包括無用聲音的第二信號。
2.如權(quán)利要求1所述的裝置,其中,所述的聲學(xué)裝置是拾音器、水聽器和聲納中選擇的一種。
3.如權(quán)利要求1所述的裝置,其中,第一種一個(gè)或多個(gè)聲學(xué)元件響應(yīng)于有用聲音和無用聲音,輸出具有心形波束咪頭的靜音面對有用聲音的發(fā)源方向上的心臟形狀的聲波束。
4.如權(quán)利要求1所述的裝置,其中,所述第二種一個(gè)或多個(gè)聲學(xué)元件響應(yīng)于有用聲音和無用聲音,輸出全指向形的聲波束。
5.如權(quán)利要求1所述的裝置,其中,第二種一個(gè)或多個(gè)聲學(xué)元件響應(yīng)于有用聲音和無用聲音,輸出具有心形波束咪頭的靜音面對有用聲音的發(fā)源方向的反向上的心臟形狀的聲波束。
6.如權(quán)利要求1所述的裝置,其中,第二種一個(gè)或多個(gè)聲學(xué)元件響應(yīng)于有用聲音和無用聲音,輸出具有雙葉丁香葉形狀的波束的第一和第二靜音面對基本上正交于有用聲音的發(fā)源方向的第一和第二方向的丁香葉形狀的波束。
7.如權(quán)利要求1所述的裝置,其中,第二種一個(gè)或多個(gè)聲學(xué)元件響應(yīng)于有用聲音和無用聲音,輸出具有雙葉丁香葉形狀的波束的第一和第二靜音面對與有用聲音的發(fā)源方向成鈍角的第一和第二方向的丁香葉形狀的波束。
8.如權(quán)利要求1所述的裝置,其中,第一種一個(gè)或多個(gè)元件包括第一聲學(xué)元件;而第二種一個(gè)或多個(gè)元件包括最接近地放置得鄰接于所述的第一聲學(xué)元件的第二聲學(xué)元件。
9.如權(quán)利要求8所述的裝置,其中,第一和第二聲學(xué)元件之間以0.2cm至1cm的分離間距最接近地放置得互相鄰接。
10.如權(quán)利要求8所述的裝置,其中,第一和第二聲學(xué)元件兩者都安排得并列地面對有用聲音的發(fā)源方向。
11.如權(quán)利要求8所述的裝置,其中,第一和第二聲學(xué)元件兩者都安排得面對有用聲音的發(fā)源方向,且第一和第二聲學(xué)元件中選取之一放置在另一個(gè)的后面。
12.如權(quán)利要求1所述的裝置,其中,有用聲音是語音,并且無用聲音隨機(jī)地起源于一個(gè)或多個(gè)方向。
13.系統(tǒng),含有聲學(xué)裝置,所述聲學(xué)裝置具有多個(gè)聲學(xué)元件,設(shè)計(jì)和安排得促進(jìn)產(chǎn)生第一信號和第二信號,第一信號主要包括無用聲音,基本上沒有有用聲音,第二信號既包括有用聲音也包括無用聲音;以及信號處理子系統(tǒng),連接在所述聲學(xué)裝置上,以使用第一和第二信號提取有用聲音。
14.如權(quán)利要求13所述的系統(tǒng),其中,所述的聲學(xué)裝置是拾音器、水聽器和聲納中選擇一種。
15.如權(quán)利要求13所述的系統(tǒng),其中,所述多個(gè)聲學(xué)元件含有第一種一個(gè)或多個(gè)聲學(xué)元件,用第一方式設(shè)計(jì)和安排,以促進(jìn)產(chǎn)生第一信號;和第二種一個(gè)或多個(gè)聲學(xué)元件,用第二互補(bǔ)的方式設(shè)計(jì)和安排,以促進(jìn)產(chǎn)生第二信號。
16.如權(quán)利要求15所述的系統(tǒng),其中,第一種一個(gè)或多個(gè)聲學(xué)元件響應(yīng)于有用聲音和無用聲音,輸出具有心形波束咪頭的靜音面對有用聲音的發(fā)源方向上的心臟形狀的聲波束。
17.如權(quán)利要求15所述的系統(tǒng),其中,第二種一個(gè)或多個(gè)聲學(xué)元件響應(yīng)于有用聲音和無用聲音,輸出全指向形的聲波束。
18.如權(quán)利要求15所述的系統(tǒng),其中,第二種一個(gè)或多個(gè)聲學(xué)元件響應(yīng)于有用聲音和無用聲音,輸出具有心形波束咪頭的靜音面對有用聲音的發(fā)源方向的反向上的心臟形狀的聲波束。
19.如權(quán)利要求15所述的系統(tǒng),其中,第二種一個(gè)或多個(gè)聲學(xué)元件響應(yīng)于有用聲音和無用聲音,輸出具有雙葉丁香葉形狀的波束的第一和第二靜音,面對基本上正交于有用聲音的發(fā)源方向上的第一和第二方向的丁香葉形狀的波束。
20.如權(quán)利要求15所述的系統(tǒng),其中,第二種一個(gè)或多個(gè)聲學(xué)元件響應(yīng)于有用聲音和無用聲音,輸出具有雙葉丁香葉形狀的波束的第一和第二靜音,面對與有用聲音的發(fā)源方向成鈍角的第一和第二方向的丁香葉形狀的波束。
21.如權(quán)利要求15所述的系統(tǒng),其中,第一種一個(gè)或多個(gè)元件包括第一聲學(xué)元件;而第二種一個(gè)或多個(gè)元件包括最接近地放置得鄰接于所述的第一聲學(xué)元件的第二聲學(xué)元件。
22.如權(quán)利要求21所述的系統(tǒng),其中,第一和第二聲學(xué)元件之間以0.2cm至1cm的分離間距最接近地放置得互相鄰接。
23.如權(quán)利要求21所述的系統(tǒng),其中,第一和第二聲學(xué)元件兩者都安排得并列地面對有用聲音的發(fā)源方向。
24.如權(quán)利要求21所述的系統(tǒng),其中,第一和第二聲學(xué)元件兩者都安排得面對有用聲音的發(fā)源方向,且第一和第二聲學(xué)元件中選取之一放置在另一個(gè)的后面。
25.如權(quán)利要求13所述的系統(tǒng),其中,有用聲音是語音,并且無用聲音隨機(jī)地起源于一個(gè)或多個(gè)方向。
26.如權(quán)利要求13所述的系統(tǒng),其中,所述信號處理子系統(tǒng)含有裝備用于從第二信號減去第一信號的信號分離部件。
27.如權(quán)利要求26所述的系統(tǒng),其中,所述信號處理子系統(tǒng)還含有延遲部件,用于對第二信號引入明確的延遲;并且所述信號分離部件含有邏輯,用于實(shí)行類似于回波消除的技術(shù),從第二信號減去第一信號。
28.如權(quán)利要求27所述的系統(tǒng),其中,所述信號處理子系統(tǒng)還含有抑制部件,以抑制所述的信號分離部件,進(jìn)行至少一個(gè)信號濾波和自適應(yīng)濾波。
29.如權(quán)利要求28所述的系統(tǒng),其中,所述信號處理子系統(tǒng)還含有相互連接和連接到所述抑制部件的多個(gè)平均幅值估算器和比較器,用于向所述的抑制部件提供輸入,用于判定是否抑制所述信號分離部件,進(jìn)行至少一個(gè)信號濾波和自適應(yīng)濾波。
30.如權(quán)利要求27所述的系統(tǒng),其中,所述類似于回波消除的技術(shù)含有對第一和第二信號進(jìn)行歸一化的時(shí)域、頻域和子頻帶最小均方自適應(yīng)濾波處理操作中選擇的一種。
31.如權(quán)利要求27所述的系統(tǒng),其中,所述的有用聲音是有用的語音,所述的明確的延遲在30ms-200ms的范圍內(nèi)。
32.如權(quán)利要求27所述的系統(tǒng),其中,所述的有用聲音是有用的語音,并且所述信號處理子系統(tǒng)還含有分別連接到延遲部件和信號分離部件的第一和第二設(shè)預(yù)白化部件,和連接到所述信號分離部件的去白化部件,以便在從信號中提取有用聲音前對所述第一和第二信號進(jìn)行整形,并且復(fù)形提取的有用聲音。
33.如權(quán)利要求26所述的系統(tǒng),其中,所述信號處理子系統(tǒng)含有邏輯,使用盲信號分離技術(shù),從第二信號減去第一信號。
34.信號提取方法,含有產(chǎn)生主要包括無用聲音的第一信號,基本上沒有有用聲音,和既包括有用聲音也包括無用聲音的第二信號;并且使用第一和第二信號提取有用聲音。
35.如權(quán)利要求34所述的方法,其中,所述的提取包含從第二信號減去第一信號。
36.如權(quán)利要求35所述的方法,其中,所述的提取還包含向所述第二信號引入明確的延遲;并且所述的相減含有使用類似于回波消除的技術(shù),從第二信號減去第一信號。
37.如權(quán)利要求36所述的方法,其中,所述類似于回波消除的技術(shù)包含對第一和第二信號進(jìn)行歸一化的時(shí)域、頻域和子頻帶最小均方自適應(yīng)濾波處理操作中選擇的一種。
38.如權(quán)利要求37所述的方法,其中,所述的方法還包含有條件的抑制至少一個(gè)所述的濾波,和自適應(yīng)所述濾波。
39.如權(quán)利要求38所述的方法,其中,所述方法還包含計(jì)算信號的平均幅值估計(jì),比較估算的平均幅值,并且把比較的結(jié)果提供用于所述有條件的抑制。
40.如權(quán)利要求35所述的方法,其中,所述減法采用盲信號分離技術(shù)進(jìn)行。
全文摘要
提供一種聲學(xué)裝置,所述聲學(xué)裝置含有第一種和第二種一個(gè)或多個(gè)聲學(xué)元件,用于分別產(chǎn)生主要包括無用聲音的第一信號,很大程度上沒有有用聲音,和既包括有用聲音也包括無用聲音的第二信號。第一種一個(gè)或多個(gè)聲學(xué)元件設(shè)計(jì)和安排得產(chǎn)生對有用聲音的起源方向上靜音的心形波束咪頭。第二種一個(gè)或多個(gè)聲學(xué)元件設(shè)計(jì)和安排得產(chǎn)生包括有用聲音的互補(bǔ)波束。提供帶有合適的信號處理邏輯的系統(tǒng),使用第一和第二信號恢復(fù)有用聲音。所述信號處理邏輯可以實(shí)行類似于回波消除的技術(shù)或者盲信號分離技術(shù)。
文檔編號H04R25/00GK1535555SQ02809177
公開日2004年10月6日 申請日期2002年7月26日 優(yōu)先權(quán)日2001年8月1日
發(fā)明者樊大申 申請人:樊大申