亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

聲源定位方法和裝置的制作方法

文檔序號:5867615閱讀:183來源:國知局
專利名稱:聲源定位方法和裝置的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及多媒體通信領(lǐng)域的音頻處理技術(shù),特別涉及一種聲源定位方法。

背景技術(shù)
聲源定位技術(shù)指的是估計除聲源所在的位置。聲源定位技術(shù)有著廣泛的應(yīng)用,例如在視頻會議系統(tǒng)中,可采樣聲源定位技術(shù)估計出說話人所在的位置,然后控制攝像機(jī)鏡頭指向說話人所在的位置,實行聲控切換功能。聲源定位技術(shù)也可以應(yīng)用到監(jiān)控、語音增強(qiáng)等領(lǐng)域。
下面對現(xiàn)有的SRP(steered response power)以及SRP-PHAT(phasetrans form)聲源定位技術(shù)進(jìn)行介紹。
如圖3所示,lps對應(yīng)聲源,l1和l2對應(yīng)兩個麥克風(fēng),如麥克風(fēng)。從聲源lps到兩個麥克風(fēng)l1和l2的時延分別用TOF(lps,l1)和TOF(lps,l1)表示。兩個麥克風(fēng)之間收到的信號分別為x1(t)和x2(t),則x1(t+TOF(lps,l1))∝x2(t+TOF(lps,l2)),其中 fs是采樣頻率,c是聲速。
同時,對應(yīng)的兩個麥克風(fēng)信號之間的時延τ有如下的定義,當(dāng)τ=TOF(lps,l1)-TOF(lps,l2)時,x1(t)和x2(t)的時域互相關(guān)函數(shù)g(x1,x2)具有最大值,g(x1,x2)=∫Rx1(t)·x2(t+τ)dε。
對于任一麥克風(fēng)對q,它們的位置對應(yīng)(laq,lbq),聲源lps到達(dá)麥克風(fēng)對q的理論到達(dá)時延差(TDOA,Time-difference of arrival)為 SRP方法通過估計空間上的功率譜分布,找出功率最大的空間位置,該位置即為聲源的位置。SRP最基本的公式如下 其中,在l位置的聲源被各個麥克風(fēng)拾取后,在時間上對齊并累加的和信號為 由于受到不同聲源之間的信號幅度、以及不同頻率成分大小的影響,采用上面方法的效果并不好。因此現(xiàn)有公開文獻(xiàn)中對該基本方法進(jìn)行了改進(jìn),改進(jìn)的方法是將各個聲源采集的時域信號變換到頻域,然后將各個頻譜的幅度進(jìn)行歸一化,這樣可以消除各個頻譜幅度大小不一致的影響,該改進(jìn)的算法在現(xiàn)有文獻(xiàn)中稱之為SRP-PHAT法,下面對該方法進(jìn)行描述。
對采集到的t時刻開始的2NF個時域信號X(t)進(jìn)行FFT變換,得到 則公式(1)可以變換為 對公式(2)各個頻率成分的幅度進(jìn)行歸一化,則得到SRP-PHAT法的計算公式 上述SRP和SRP-PHAT法實際上都是在聲源陣列周圍的空間中放置多個預(yù)定點,然后計算各個預(yù)定點的功率值或修正的功率值,其最大值處所在位置即為聲源所在位置。
但是在實際應(yīng)用環(huán)境中,聲源定位的準(zhǔn)確性受到環(huán)境噪聲、干擾聲、混響等因素的影響較大,SRP和SRP-PHAT法均無法有效克服。


發(fā)明內(nèi)容
本發(fā)明的目的是提供一種更加穩(wěn)健的聲源定位方法和裝置,用以克服現(xiàn)有技術(shù)中的聲源定位的準(zhǔn)確性易受到環(huán)境噪聲等因素干擾的影響。
本發(fā)明一個實施例提供一種聲源定位方法,包括采集聲源時域信號;將所述時域信號轉(zhuǎn)換為頻域信號;根據(jù)所述頻域信號確定頻率的空間功率譜;根據(jù)所述空間功率譜確定頻率的空間功率概率;根據(jù)空間概率分布確定概率最大的空間位置,作為聲源位置。
本發(fā)明的另一個實施例提供一種生源定位裝置,包括采集單元,用于采集聲源時域信號;轉(zhuǎn)換單元,用于將所述時域信號轉(zhuǎn)換為頻域信號;功率確定單元,用于根據(jù)所述頻域信號確定頻率的空間功率譜;概率確定單元,用于根據(jù)所述空間功率譜確定頻率的空間功率概率分布;定位單元,用于根據(jù)空間概率分布確定概率最大的空間位置。
本發(fā)明的實施例運用空間功率概率分布確定聲源,可以提高聲源陣列在噪聲、混響等環(huán)境下的定位準(zhǔn)確性。



圖1是本發(fā)明的聲源定位方法的流程圖; 圖2是本發(fā)明的聲源定位裝置的結(jié)構(gòu)示意圖; 圖3是現(xiàn)有聲源定位方法的說明圖。

具體實施例方式 為使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清晰易懂,下面結(jié)合附圖,對本發(fā)明做進(jìn)一步詳細(xì)說明。在此,本發(fā)明的示意性實施例及其說明用于解釋本發(fā)明,但并不作為對本發(fā)明的限定。
實施例一 本實施例提供一種生源定位方法。如圖1所示,該方法包括 步驟101采集聲源時域信號; 在該步驟中,可以通過多個麥克風(fēng)采集聲源的時域信號x1,x2,…,xNm。
步驟102將所述時域信號轉(zhuǎn)換為頻域信號; 在該步驟中,將多個麥克風(fēng)采集的時域信號為x1,x2,…,XNm轉(zhuǎn)換為頻域信號為X1,X2,…,XNm。時域信號到頻域信號的變換方法通常傅里葉變換(FFT),也可以采用其他常用變換,例如余弦變換(DCT)。
步驟103根據(jù)所述頻域信號確定頻率的空間功率譜; 在該步驟中,根據(jù)下式確定頻率的空間功率譜, 步驟104根據(jù)所述空間功率譜確定頻率的空間功率概率分布; 在該步驟中,先確定單個頻率的空間功率概率分布,然后再確定多個頻率的空間功率概率分布。對于某個頻率來說,其功率在空間上呈一定的分布,不同的頻率分布差別較大,很顯然不同分布的頻率對定位的貢獻(xiàn)是不一樣??梢愿鶕?jù)下面的公式確定單個頻率的空間功率概率分布, 其中,

表示第k個頻率l位置上出現(xiàn)聲源的概率。
將各單個頻率的空間功率概率分布求和得到多個概率的空間功率分布?;蛘?,將各單個頻率的空間功率概率分布加權(quán)求和得到多個頻率的空間功率分布,各單個頻率的空間功率概率分布的權(quán)重隨頻率受噪音干擾影響的程度增大而減小。具體可以根據(jù)下面的公式計算多個頻率的空間功率概率分布, 其中,wk是各單個頻率的空間功率概率分布的權(quán)重,隨單個頻率的信號幅值增大而增大。
步驟105根據(jù)空間概率分布確定概率最大的空間位置。
在該步驟中,可以根據(jù)下面的公式按當(dāng)前幀確定概率最大的空間位置, 或者,根據(jù)下面的公式按多幀確定概率最大的空間位置, 其中,

是當(dāng)前幀的頻率的空間功率概率分布,

是前一幀的頻率的空間功率概率分布,

是前T幀的頻率的空間功率概率分布,α1為前一幀的衰減系數(shù),αT是前T幀的衰減系數(shù)。
本發(fā)明實施例依據(jù)某個頻率在某個空間位置呈現(xiàn)尖銳的概率分布,則在該位置出現(xiàn)音源的概率較大,反之則出現(xiàn)的概率較小的現(xiàn)象,對現(xiàn)有的聲源定位方法進(jìn)行改進(jìn),從而減小了環(huán)境噪聲、干擾聲、混響等因素對定位準(zhǔn)確性的影響,提高了定位的準(zhǔn)確性。
實施例二 本實施例提供一種聲源定位裝置。如圖2所示,該裝置200包括 采集單元201,用于采集聲源時域信號; 轉(zhuǎn)換單元202,用于將所述時域信號轉(zhuǎn)換為頻域信號; 功率確定單元203,用于根據(jù)所述頻域信號的確定頻率的空間功率譜; 概率確定單元204,用于根據(jù)所述空間功率譜確定頻率的空間功率概率分布; 定位單元205,用于根據(jù)空間概率分布確定概率最大的空間位置。
采集單元201,如多個麥克風(fēng),采集聲源的時域信號x1,x2,…,xNm。轉(zhuǎn)換單元202,如邏輯電路,將多個麥克風(fēng)采集的時域信號為x1,x2,…,xNm轉(zhuǎn)換為頻域信號為X1,X2,…,XNm。時域信號到頻域信號的變換方法通常傅里葉變換(FFT),也可以采用其他常用變換(請舉例)。功率確定單元203根據(jù)下面公式將頻域信號X1,X2,…,XNm確定頻率的空間功率譜概率確定單元204包括單頻率概率確定模塊214和多頻率概率確定模塊224,在根據(jù)所述空間功率譜確定頻率的空間功率概率分布市,先由單頻率概率確定模塊214確定單個頻率的空間功率概率分布,再由多頻率概率確定模塊224確定多個頻率的空間功率概率分布。單頻率概率確定模塊214根據(jù)下面的公式確定單個頻率的空間功率概率分布, 其中,

表示第k個頻率l位置上出現(xiàn)聲源的概率。
多頻率概率確定模塊224可以將各單個頻率的空間功率概率分布求和得到多個概率的空間功率分布?;蛘?,多頻率概率確定模塊224可以將各單個頻率的空間功率概率分布加權(quán)求和得到多個頻率的空間功率分布,各單個頻率的空間功率概率分布的權(quán)重隨頻率受噪音干擾影響的程度增大而減小。多頻率概率確定模塊224具體可以根據(jù)下面的公式計算多個頻率的空間功率概率分布, 其中,wk是各單個頻率的空間功率概率分布的權(quán)重,隨單個頻率的信號幅值增大而增大。
最后,定位單元205根據(jù)下面的公式按當(dāng)前幀確定概率最大的空間位置, 或者,定位單元205根據(jù)下面的公式按多幀確定概率最大的空間位置, 其中,

是當(dāng)前幀的頻率的空間功率概率分布,

是前一幀的頻率的空間功率概率分布,

是前T幀的頻率的空間功率概率分布,α1為前一幀的衰減系數(shù),αT是前T幀的衰減系數(shù)。
本發(fā)明實施例依據(jù)某個頻率在某個空間位置呈現(xiàn)尖銳的概率分布,則在該位置出現(xiàn)音源的概率較大,反之則出現(xiàn)的概率較小的現(xiàn)象,對現(xiàn)有的聲源定位方法進(jìn)行改進(jìn),從而減小了環(huán)境噪聲、干擾聲、混響等因素對定位準(zhǔn)確性的影響,提高了定位的準(zhǔn)確性。
以上所述的具體描述,對發(fā)明的目的、技術(shù)方案和有益效果進(jìn)行了進(jìn)一步詳細(xì)說明,所應(yīng)理解的是,以上所述僅為本發(fā)明的具體實施例而已,并不用于限定本發(fā)明的保護(hù)范圍,凡在本發(fā)明的精神和原則之內(nèi),所做的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
權(quán)利要求
1.一種聲源定位方法,其特征在于,該方法包括
采集聲源時域信號;
將所述時域信號轉(zhuǎn)換為頻域信號;
根據(jù)所述頻域信號確定頻率的空間功率譜;
根據(jù)所述空間功率譜確定頻率的空間功率概率分布;
根據(jù)空間概率分布確定概率最大的空間位置,以概率最大的空間位置作為聲源位置。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,根據(jù)所述空間功率譜確定頻率的空間功率概率分布的步驟包括
確定單個頻率的空間功率概率分布;
確定多個頻率的空間功率概率分布。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于根據(jù)下面的公式確定單個頻率的空間功率概率分布,
其中,
(k,l,X1t,...,XNmt)表示第k個頻率l位置上出現(xiàn)聲源的概率,表示k個頻率l位置上的空間功率譜。
4.根據(jù)權(quán)利要求2所述的方法,其特征在于將各單個頻率的空間功率概率分布求和得到多個概率的空間功率分布。
5.根據(jù)權(quán)利要求2所述的方法,其特征在于將各單個頻率的空間功率概率分布加權(quán)求和得到多個頻率的空間功率分布,各單個頻率的空間功率概率分布的權(quán)重隨頻率受噪音干擾影響的程度增大而減小。
6.根據(jù)權(quán)利要求2所述的方法,其特征在于根據(jù)下面的公式計算多個頻率的空間功率概率分布,
其中,wk是各單個頻率的空間功率概率分布的權(quán)重。
7.根據(jù)權(quán)利要求5或6所述的方法,其特征在于所述單個頻率的空間功率概率分布的權(quán)重隨單個頻率的信號幅值增大而增大。
8.根據(jù)權(quán)利要求1所述的方法,其特征在于根據(jù)下面的公式按當(dāng)前幀確定概率最大的空間位置,
9.根據(jù)權(quán)利要求1所述的方法,其特征在于根據(jù)下面的公式按多幀確定概率最大的空間位置,
其中,
(ALL,l,X1t,...,XNmt)是當(dāng)前幀的頻率的空間功率概率分布,
(ALL,l,X1t-Δt,...,XNmt-Δt)是前一幀的頻率的空間功率概率分布,
(ALL,l,X1t-Δt*T,...,XNmt-Δt*T)是前T幀的頻率的空間功率概率分布,α1為前一幀的衰減系數(shù),αT是前T幀的衰減系數(shù)。
10.一種聲源定位裝置,其特征在于,該裝置包括
采集單元,用于采集聲源時域信號;
轉(zhuǎn)換單元,用于將所述時域信號轉(zhuǎn)換為頻域信號;
功率確定單元,用于根據(jù)所述頻域信號確定頻率的空間功率譜;
概率確定單元,用于根據(jù)所述空間功率譜確定頻率的空間功率概率分布;
定位單元,用于根據(jù)空間概率分布確定概率最大的空間位置,以概率最大的空間位置作為聲源位置。
11.根據(jù)權(quán)利要求10所述的裝置,其特征在于,所述概率確定單元包括
單頻率概率確定模塊,用于確定單個頻率的空間功率概率分布;
多頻率概率確定模塊,用于確定多個頻率的空間功率概率分布。
全文摘要
本發(fā)明涉及一種聲源定位方法和裝置,方法包括采集聲源時域信號;將所述時域信號轉(zhuǎn)換為頻域信號;根據(jù)所述頻域信號確定頻率的空間功率譜;根據(jù)所述空間功率譜確定頻率的空間功率概率。裝置包括采集單元,用于采集聲源時域信號;轉(zhuǎn)換單元,用于將所述時域信號轉(zhuǎn)換為頻域信號;功率確定單元,用于根據(jù)所述頻域信號確定頻率的空間功率譜;概率確定單元,用于根據(jù)所述空間功率譜確定頻率的空間功率概率分布;定位單元,用于根據(jù)空間概率分布確定概率最大的空間位置。本發(fā)明運用空間功率概率分布確定聲源,可以提高聲源陣列在噪聲、混響等環(huán)境下的定位準(zhǔn)確性。
文檔編號G01S5/18GK101762806SQ201010105118
公開日2010年6月30日 申請日期2010年1月27日 優(yōu)先權(quán)日2010年1月27日
發(fā)明者詹五洲, 王東琦 申請人:華為終端有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1