ne濾波器組多頻率分解圖。人耳耳蝸基底膜是聽 覺中樞實(shí)現(xiàn)濾波的重要環(huán)節(jié):聲源信號(hào)由于頻率的不同,基底膜不同位置產(chǎn)生不同的振動(dòng), 從而起到分解聲源信號(hào)的作用。因此本文選擇具有人耳聽覺特性的Gammatone濾波器組對(duì) 語音信號(hào)進(jìn)行頻率分解。頻率的選擇范圍從20Hz-4KHz分別對(duì)左、右耳混疊信號(hào)按時(shí)間幀進(jìn) 行頻率分解。耳蝸基底膜模型將聲源信號(hào)分成多個(gè)(濾波器個(gè)數(shù))通道傳遞,從而便于語音 信號(hào)在系統(tǒng)模型中的分離。
[0042]如圖3所示,為本發(fā)明中的內(nèi)毛細(xì)胞模型。內(nèi)毛細(xì)胞模型主要由5個(gè)標(biāo)準(zhǔn)量構(gòu)成,其 分別是:再生庫中神經(jīng)遞質(zhì)的量、間隙中神經(jīng)遞質(zhì)的量、內(nèi)毛細(xì)胞中神經(jīng)遞質(zhì)的量、細(xì)胞膜 的滲透性以及神經(jīng)細(xì)胞脈沖輸出的概率。
[0043] 再生庫中神經(jīng)遞質(zhì)的量w(t)
[0044] w(t)隨時(shí)間t發(fā)生的變化:
[0046]其中,c(t)表示間隙中神經(jīng)遞質(zhì)的量,r為回收率,X為返回率。
[0047]間隙中神經(jīng)遞質(zhì)的數(shù)量c(t)
[0048] c(t)隨時(shí)間t發(fā)生的變化:
[0050] 其中,k(t)為細(xì)胞膜的滲透性,q(t)為內(nèi)毛細(xì)胞內(nèi)神經(jīng)遞質(zhì)的量,1為丟失率。k(t) q (t)表示的是從細(xì)胞內(nèi)部滲透到間隙中的神經(jīng)遞質(zhì)的量,-1 c (t)表示的是間隙泄漏的量,_ rc(t)表示的是間隙中重新滲透回到再生庫的量。
[0051] 內(nèi)毛細(xì)胞中的神經(jīng)遞質(zhì)的量q(t)
[0052] q(t)隨時(shí)間t發(fā)生的變化:
[0054] 其中,y為補(bǔ)充率。7(11(1:))表示的是制造廠重新制造的神經(jīng)遞質(zhì)的量,1¥(1:)表 示的是再生庫內(nèi)的神經(jīng)遞質(zhì)重新滲透回內(nèi)毛細(xì)胞內(nèi)部的量,_k(t)q(t)表示的是內(nèi)毛細(xì)胞 中滲透到間隙的神經(jīng)遞質(zhì)的量。
[0055] 細(xì)胞膜的滲透性k(t)
[0056] k(t)反映了神經(jīng)遞質(zhì)由內(nèi)毛細(xì)胞向間隙滲透的能力。細(xì)胞膜的滲透性可以表示:
[0058] 其中,A和B為細(xì)胞膜的滲透常量,g為釋放率,stim(t)是輸入語音信號(hào)瞬時(shí)的幅 度。從自由傳遞池到間隙的傳遞,這是一個(gè)動(dòng)態(tài)的過程。如果上式中的stim(t)省略,則代表 神經(jīng)細(xì)胞膜的自發(fā)式響應(yīng),即:
[0059] k(t)=A/(A+B)g
[0060] 該過程是一個(gè)非線性的響應(yīng)過程,同時(shí)也表明內(nèi)毛細(xì)胞的飽和特性和閾值特性。
[0061] 如圖4所示,為本發(fā)明中神經(jīng)發(fā)放模型電路圖。圖中x(t)表示內(nèi)毛細(xì)胞產(chǎn)生的電流 信號(hào),R表示聽覺神經(jīng)纖維的膜電阻,C表示聽覺神經(jīng)纖維的膜電容,U r表示聽覺神經(jīng)纖維實(shí) 現(xiàn)脈沖發(fā)放時(shí)的閾值。當(dāng)X (t)大于零時(shí),膜電容充電,電容電壓的瞬時(shí)值u (t)與閾值Ur進(jìn)行 對(duì)比,如果U(t)大于閾值Ur,則該電路就會(huì)產(chǎn)生一個(gè)脈沖信號(hào),并且電容通過RC回路放電, 電容的瞬時(shí)電壓降為零。LIF模型的可用式(3.12)表示:
[0063]其中,Tm為神經(jīng)元的膜時(shí)間常數(shù),Tm = RC,一般取值為1.6ms ; ts為脈沖發(fā)放時(shí)間的 標(biāo)志,U(ts)=Ur;S為閾值因子。在耳蝸內(nèi),內(nèi)毛細(xì)胞將機(jī)械振動(dòng)信號(hào)通過細(xì)胞膜膜電位的變 化轉(zhuǎn)變?yōu)樯镫娦盘?hào),內(nèi)毛細(xì)胞利用神經(jīng)遞質(zhì)滲透到細(xì)胞間隙,通過細(xì)胞間隙傳送到突觸 后神經(jīng)。從而引起聽覺神經(jīng)纖維產(chǎn)生電脈沖序列。聽覺神經(jīng)纖維發(fā)放的電脈沖序列是由間 隙內(nèi)的神經(jīng)遞質(zhì)濃度變化引起的。
[0064]如圖5所示,為本發(fā)明中聲源方位坐標(biāo)系,以插孔麥克風(fēng)輸入位置為原點(diǎn),建立三 維坐標(biāo)系。假設(shè)聲源和雙麥克風(fēng)在一個(gè)平面上,則:
[0066]式中:
[0067] di,d2一一聲源到麥克風(fēng)距離
[0068] Ei,E2一一麥克風(fēng)接收的語音信號(hào)的能量
[0069] 設(shè)(Xi,yi)為第i個(gè)麥克風(fēng)的位置坐標(biāo),聲源坐標(biāo)位置為(xs,ys)。則有:
[0070] Ei[ (xi-xs)2+(yi-ys)2] =E2[ (x2-xs)2+(y2-ys)2]
[0071] 再根據(jù)時(shí)間差I(lǐng)TD的值T12得出:
[0073] 根據(jù)以上兩式可以算出聲源在麥克風(fēng)同一平面的坐標(biāo),即得出聲源位置在環(huán)繞兩 麥克風(fēng)組成直線一周的位置上。
[0074] 由于目標(biāo)聲源坐標(biāo)通常在插孔麥克風(fēng)(即聲源方位坐標(biāo)系原點(diǎn))附近,則可以假設(shè) 目標(biāo)聲源在方圓一定范圍內(nèi),此處假設(shè)為到原點(diǎn)距離小于〇.〇5m。則將實(shí)際聲源通過坐標(biāo)轉(zhuǎn) 換可以粗略判斷出目標(biāo)聲源,從而得到目標(biāo)語音信號(hào)。
[0075] 以上這些實(shí)施例應(yīng)理解為僅用于說明本發(fā)明而不用于限制本發(fā)明的保護(hù)范圍。在 閱讀了本發(fā)明的記載的內(nèi)容之后,技術(shù)人員可以對(duì)本發(fā)明作各種改動(dòng)或修改,這些等效變 化和修飾同樣落入本發(fā)明權(quán)利要求所限定的范圍。
【主權(quán)項(xiàng)】
1. 一種基于聽覺仿生中耳蝸基底膜的聲源定位方法,其特征在于,包括W下步驟: 1) 采用雙麥克風(fēng)模擬人耳聽覺系統(tǒng)獲取含噪聲的語音信號(hào); 2) 對(duì)步驟1)得到的含噪聲的語音信號(hào),采用基于人耳聽覺中的耳蝸基底膜模型進(jìn)行頻 率分解、通過上橄攬核模型進(jìn)行語音信息提取、采用膜上的內(nèi)毛細(xì)胞模型進(jìn)行信號(hào)轉(zhuǎn)換W 及內(nèi)毛細(xì)胞上的神經(jīng)纖維模型進(jìn)行細(xì)胞重合,去除噪聲信號(hào); 3) 步驟2)去處噪聲信號(hào)的聲源信號(hào)通過能量的關(guān)系式求解出聲源位置,完成定位。2. 根據(jù)權(quán)利要求1所述的基于聽覺仿生中耳蝸基底膜的聲源定位方法,其特征在于,所 述步驟2)采用基于人耳聽覺中的耳蝸基底膜模型進(jìn)行頻率分解具體為;采用具有人耳聽覺 特性的Gammatone伽馬通濾波器組對(duì)語音信號(hào)進(jìn)行頻率分解。3. 根據(jù)權(quán)利要求2所述的基于聽覺仿生中耳蝸基底膜的聲源定位方法,其特征在于,所 述Gammatone伽馬通濾波器組頻率的選擇范圍從20化-4K化分別對(duì)左、右耳混疊信號(hào)按時(shí)間 帖進(jìn)行頻率分解;耳蝸基底膜模型將語音信號(hào)按照濾波器個(gè)數(shù)進(jìn)行傳遞。4. 根據(jù)權(quán)利要求1所述的基于聽覺仿生中耳蝸基底膜的聲源定位方法,其特征在于,所 述步驟2)通過上橄攬核模型進(jìn)行語音信息提取具體為; 耳蝸基底膜處理語音信號(hào)后分成多個(gè)通道傳遞給上橄攬復(fù)合體進(jìn)行語音信號(hào)的ITD雙 耳時(shí)間差和ILD雙耳水平差定位信息的提取,ITD的計(jì)算公式如下:式中: 一一左耳和右耳的語音信號(hào)的互相關(guān),可由下式計(jì)算:式中: (巧)一一左耳和右耳語音信號(hào)互功率譜 ILD的計(jì)算公式如下:式中: --左耳和右耳的ILD值;Qi--子帶i的頻率范圍αΚΗζ~4KHz)Wi( ω )--濾 波器權(quán)重;S( ω )--聲源功率譜。5. 根據(jù)權(quán)利要求4所述的基于聽覺仿生中耳蝸基底膜的聲源定位方法,其特征在于,當(dāng) 信號(hào)為20化到1000化低頻語音信號(hào)時(shí),重合神經(jīng)元模型只有來自上橄攬內(nèi)側(cè)的語音特征輸 入;1000化到他化語音信號(hào)時(shí),上橄攬外側(cè)和上橄攬內(nèi)側(cè)的語音特征都輸入重合神經(jīng)元;高 于4Ifflz語音信號(hào)時(shí),重合神經(jīng)元只有上橄攬外側(cè)語音特征的輸入。6. 根據(jù)權(quán)利要求1所述的基于聽覺仿生中耳蝸基底膜的聲源定位方法,其特征在于,所 述步驟2)采用膜上的內(nèi)毛細(xì)胞模型進(jìn)行信號(hào)轉(zhuǎn)換的步驟具體為;采用內(nèi)毛細(xì)胞模型對(duì)聲音 信號(hào)進(jìn)行半波整流,并且將基底膜上的機(jī)械振動(dòng)信號(hào)轉(zhuǎn)變?yōu)橄鄳?yīng)的生物電信號(hào),并將生物 電信號(hào)傳遞給聽覺神經(jīng)纖維。7.根據(jù)權(quán)利要求.4所述的基于聽覺仿生中耳蝸基底膜的聲源定位方法,其特征在于, 所述內(nèi)毛細(xì)胞模型主要由5個(gè)標(biāo)準(zhǔn)量構(gòu)成,其分別是:再生庫中神經(jīng)遞質(zhì)的量、間隙中神經(jīng) 遞質(zhì)的量、內(nèi)毛細(xì)胞中神經(jīng)遞質(zhì)的量、細(xì)胞膜的滲透性W及神經(jīng)細(xì)胞脈沖輸出的概率。
【專利摘要】本發(fā)明請(qǐng)求保護(hù)一種基于聽覺仿生中耳蝸基底膜的聲源定位方法,涉及語音識(shí)別領(lǐng)域,它采用人耳雞尾酒效應(yīng)的方法實(shí)現(xiàn)聲源定位,具有較強(qiáng)的擴(kuò)展性,在噪聲環(huán)境下,相比于傳統(tǒng)聲源定位方法,該方法具有更好的定位效果,該聲源定位系統(tǒng)具有更好的魯棒性。含噪聲的聲源信號(hào)經(jīng)過耳蝸基底膜模型進(jìn)行頻譜分析,在經(jīng)過耳蝸基底膜上的內(nèi)毛細(xì)胞模型進(jìn)行信號(hào)轉(zhuǎn)換以及內(nèi)毛細(xì)胞上的神經(jīng)纖維進(jìn)行細(xì)胞重合,再通過上橄欖核模型進(jìn)行語音信息提取,最終進(jìn)行聲源的定位。
【IPC分類】G10L15/02, G01S5/20
【公開號(hào)】CN105575387
【申請(qǐng)?zhí)枴緾N201510990824
【發(fā)明人】張毅, 徐曉東, 蕭紅, 羅久飛, 黃超, 蘇祖強(qiáng)
【申請(qǐng)人】重慶郵電大學(xué)
【公開日】2016年5月11日
【申請(qǐng)日】2015年12月25日