基于聽覺仿生中耳蝸基底膜的聲源定位方法_2

文檔序號(hào)：9811906閱讀：來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)>基于聽覺仿生中耳蝸基底膜的聲源定位方法

ne濾波器組多頻率分解圖。人耳耳蝸基底膜是聽覺中樞實(shí)現(xiàn)濾波的重要環(huán)節(jié):聲源信號(hào)由于頻率的不同，基底膜不同位置產(chǎn)生不同的振動(dòng)，從而起到分解聲源信號(hào)的作用。因此本文選擇具有人耳聽覺特性的Gammatone濾波器組對(duì) 語音信號(hào)進(jìn)行頻率分解。頻率的選擇范圍從20Hz-4KHz分別對(duì)左、右耳混疊信號(hào)按時(shí)間幀進(jìn) 行頻率分解。耳蝸基底膜模型將聲源信號(hào)分成多個(gè)(濾波器個(gè)數(shù))通道傳遞，從而便于語音信號(hào)在系統(tǒng)模型中的分離。
[0042]如圖3所示，為本發(fā)明中的內(nèi)毛細(xì)胞模型。內(nèi)毛細(xì)胞模型主要由5個(gè)標(biāo)準(zhǔn)量構(gòu)成，其分別是:再生庫中神經(jīng)遞質(zhì)的量、間隙中神經(jīng)遞質(zhì)的量、內(nèi)毛細(xì)胞中神經(jīng)遞質(zhì)的量、細(xì)胞膜的滲透性以及神經(jīng)細(xì)胞脈沖輸出的概率。
[0043] 再生庫中神經(jīng)遞質(zhì)的量w(t)
[0044] w(t)隨時(shí)間t發(fā)生的變化：
[0046]其中，c(t)表示間隙中神經(jīng)遞質(zhì)的量，r為回收率，X為返回率。
[0047]間隙中神經(jīng)遞質(zhì)的數(shù)量c(t)
[0048] c(t)隨時(shí)間t發(fā)生的變化：
[0050] 其中，k(t)為細(xì)胞膜的滲透性，q(t)為內(nèi)毛細(xì)胞內(nèi)神經(jīng)遞質(zhì)的量，1為丟失率。k(t) q (t)表示的是從細(xì)胞內(nèi)部滲透到間隙中的神經(jīng)遞質(zhì)的量，-1 c (t)表示的是間隙泄漏的量，_ rc(t)表示的是間隙中重新滲透回到再生庫的量。
[0051] 內(nèi)毛細(xì)胞中的神經(jīng)遞質(zhì)的量q(t)
[0052] q(t)隨時(shí)間t發(fā)生的變化：
[0054] 其中，y為補(bǔ)充率。7(11(1:))表示的是制造廠重新制造的神經(jīng)遞質(zhì)的量，1￥(1:)表示的是再生庫內(nèi)的神經(jīng)遞質(zhì)重新滲透回內(nèi)毛細(xì)胞內(nèi)部的量，_k(t)q(t)表示的是內(nèi)毛細(xì)胞中滲透到間隙的神經(jīng)遞質(zhì)的量。
[0055] 細(xì)胞膜的滲透性k(t)
[0056] k(t)反映了神經(jīng)遞質(zhì)由內(nèi)毛細(xì)胞向間隙滲透的能力。細(xì)胞膜的滲透性可以表示：
[0058] 其中，A和B為細(xì)胞膜的滲透常量，g為釋放率，stim(t)是輸入語音信號(hào)瞬時(shí)的幅度。從自由傳遞池到間隙的傳遞，這是一個(gè)動(dòng)態(tài)的過程。如果上式中的stim(t)省略，則代表神經(jīng)細(xì)胞膜的自發(fā)式響應(yīng)，即：
[0059] k(t)=A/(A+B)g
[0060] 該過程是一個(gè)非線性的響應(yīng)過程，同時(shí)也表明內(nèi)毛細(xì)胞的飽和特性和閾值特性。
[0061] 如圖4所示，為本發(fā)明中神經(jīng)發(fā)放模型電路圖。圖中x(t)表示內(nèi)毛細(xì)胞產(chǎn)生的電流信號(hào)，R表示聽覺神經(jīng)纖維的膜電阻，C表示聽覺神經(jīng)纖維的膜電容，U r表示聽覺神經(jīng)纖維實(shí) 現(xiàn)脈沖發(fā)放時(shí)的閾值。當(dāng)X (t)大于零時(shí)，膜電容充電，電容電壓的瞬時(shí)值u (t)與閾值Ur進(jìn)行對(duì)比，如果U(t)大于閾值Ur，則該電路就會(huì)產(chǎn)生一個(gè)脈沖信號(hào)，并且電容通過RC回路放電，電容的瞬時(shí)電壓降為零。LIF模型的可用式(3.12)表示：
[0063]其中，Tm為神經(jīng)元的膜時(shí)間常數(shù)，Tm = RC，一般取值為1.6ms ; ts為脈沖發(fā)放時(shí)間的標(biāo)志，U(ts)=Ur;S為閾值因子。在耳蝸內(nèi)，內(nèi)毛細(xì)胞將機(jī)械振動(dòng)信號(hào)通過細(xì)胞膜膜電位的變化轉(zhuǎn)變?yōu)樯镫娦盘?hào)，內(nèi)毛細(xì)胞利用神經(jīng)遞質(zhì)滲透到細(xì)胞間隙，通過細(xì)胞間隙傳送到突觸后神經(jīng)。從而引起聽覺神經(jīng)纖維產(chǎn)生電脈沖序列。聽覺神經(jīng)纖維發(fā)放的電脈沖序列是由間隙內(nèi)的神經(jīng)遞質(zhì)濃度變化引起的。
[0064]如圖5所示，為本發(fā)明中聲源方位坐標(biāo)系，以插孔麥克風(fēng)輸入位置為原點(diǎn)，建立三維坐標(biāo)系。假設(shè)聲源和雙麥克風(fēng)在一個(gè)平面上，則：
[0066]式中：
[0067] di,d2一一聲源到麥克風(fēng)距離
[0068] Ei,E2一一麥克風(fēng)接收的語音信號(hào)的能量
[0069] 設(shè)(Xi,yi)為第i個(gè)麥克風(fēng)的位置坐標(biāo)，聲源坐標(biāo)位置為(xs,ys)。則有：
[0070] Ei[ (xi-xs)2+(yi-ys)2] =E2[ (x2-xs)2+(y2-ys)2]
[0071] 再根據(jù)時(shí)間差I(lǐng)TD的值T12得出：
[0073] 根據(jù)以上兩式可以算出聲源在麥克風(fēng)同一平面的坐標(biāo)，即得出聲源位置在環(huán)繞兩麥克風(fēng)組成直線一周的位置上。
[0074] 由于目標(biāo)聲源坐標(biāo)通常在插孔麥克風(fēng)（即聲源方位坐標(biāo)系原點(diǎn)）附近，則可以假設(shè) 目標(biāo)聲源在方圓一定范圍內(nèi)，此處假設(shè)為到原點(diǎn)距離小于〇.〇5m。則將實(shí)際聲源通過坐標(biāo)轉(zhuǎn) 換可以粗略判斷出目標(biāo)聲源，從而得到目標(biāo)語音信號(hào)。
[0075] 以上這些實(shí)施例應(yīng)理解為僅用于說明本發(fā)明而不用于限制本發(fā)明的保護(hù)范圍。在閱讀了本發(fā)明的記載的內(nèi)容之后，技術(shù)人員可以對(duì)本發(fā)明作各種改動(dòng)或修改，這些等效變化和修飾同樣落入本發(fā)明權(quán)利要求所限定的范圍。
【主權(quán)項(xiàng)】
1. 一種基于聽覺仿生中耳蝸基底膜的聲源定位方法，其特征在于，包括W下步驟： 1) 采用雙麥克風(fēng)模擬人耳聽覺系統(tǒng)獲取含噪聲的語音信號(hào)； 2) 對(duì)步驟1)得到的含噪聲的語音信號(hào)，采用基于人耳聽覺中的耳蝸基底膜模型進(jìn)行頻率分解、通過上橄攬核模型進(jìn)行語音信息提取、采用膜上的內(nèi)毛細(xì)胞模型進(jìn)行信號(hào)轉(zhuǎn)換W 及內(nèi)毛細(xì)胞上的神經(jīng)纖維模型進(jìn)行細(xì)胞重合，去除噪聲信號(hào)； 3) 步驟2)去處噪聲信號(hào)的聲源信號(hào)通過能量的關(guān)系式求解出聲源位置，完成定位。2. 根據(jù)權(quán)利要求1所述的基于聽覺仿生中耳蝸基底膜的聲源定位方法，其特征在于，所述步驟2)采用基于人耳聽覺中的耳蝸基底膜模型進(jìn)行頻率分解具體為;采用具有人耳聽覺特性的Gammatone伽馬通濾波器組對(duì)語音信號(hào)進(jìn)行頻率分解。3. 根據(jù)權(quán)利要求2所述的基于聽覺仿生中耳蝸基底膜的聲源定位方法，其特征在于，所述Gammatone伽馬通濾波器組頻率的選擇范圍從20化-4K化分別對(duì)左、右耳混疊信號(hào)按時(shí)間帖進(jìn)行頻率分解;耳蝸基底膜模型將語音信號(hào)按照濾波器個(gè)數(shù)進(jìn)行傳遞。4. 根據(jù)權(quán)利要求1所述的基于聽覺仿生中耳蝸基底膜的聲源定位方法，其特征在于，所述步驟2)通過上橄攬核模型進(jìn)行語音信息提取具體為；耳蝸基底膜處理語音信號(hào)后分成多個(gè)通道傳遞給上橄攬復(fù)合體進(jìn)行語音信號(hào)的ITD雙耳時(shí)間差和ILD雙耳水平差定位信息的提取，ITD的計(jì)算公式如下：式中：一一左耳和右耳的語音信號(hào)的互相關(guān)，可由下式計(jì)算：式中： (巧)一一左耳和右耳語音信號(hào)互功率譜 ILD的計(jì)算公式如下：式中： --左耳和右耳的ILD值；Qi--子帶i的頻率范圍αΚΗζ~4KHz)Wi( ω )--濾波器權(quán)重;S( ω )--聲源功率譜。5. 根據(jù)權(quán)利要求4所述的基于聽覺仿生中耳蝸基底膜的聲源定位方法，其特征在于，當(dāng) 信號(hào)為20化到1000化低頻語音信號(hào)時(shí)，重合神經(jīng)元模型只有來自上橄攬內(nèi)側(cè)的語音特征輸入；1000化到他化語音信號(hào)時(shí)，上橄攬外側(cè)和上橄攬內(nèi)側(cè)的語音特征都輸入重合神經(jīng)元;高于4Ifflz語音信號(hào)時(shí)，重合神經(jīng)元只有上橄攬外側(cè)語音特征的輸入。6. 根據(jù)權(quán)利要求1所述的基于聽覺仿生中耳蝸基底膜的聲源定位方法，其特征在于，所述步驟2)采用膜上的內(nèi)毛細(xì)胞模型進(jìn)行信號(hào)轉(zhuǎn)換的步驟具體為;采用內(nèi)毛細(xì)胞模型對(duì)聲音信號(hào)進(jìn)行半波整流，并且將基底膜上的機(jī)械振動(dòng)信號(hào)轉(zhuǎn)變?yōu)橄鄳?yīng)的生物電信號(hào)，并將生物電信號(hào)傳遞給聽覺神經(jīng)纖維。7.根據(jù)權(quán)利要求.4所述的基于聽覺仿生中耳蝸基底膜的聲源定位方法，其特征在于，所述內(nèi)毛細(xì)胞模型主要由5個(gè)標(biāo)準(zhǔn)量構(gòu)成，其分別是:再生庫中神經(jīng)遞質(zhì)的量、間隙中神經(jīng) 遞質(zhì)的量、內(nèi)毛細(xì)胞中神經(jīng)遞質(zhì)的量、細(xì)胞膜的滲透性W及神經(jīng)細(xì)胞脈沖輸出的概率。
【專利摘要】本發(fā)明請(qǐng)求保護(hù)一種基于聽覺仿生中耳蝸基底膜的聲源定位方法，涉及語音識(shí)別領(lǐng)域，它采用人耳雞尾酒效應(yīng)的方法實(shí)現(xiàn)聲源定位，具有較強(qiáng)的擴(kuò)展性，在噪聲環(huán)境下，相比于傳統(tǒng)聲源定位方法，該方法具有更好的定位效果，該聲源定位系統(tǒng)具有更好的魯棒性。含噪聲的聲源信號(hào)經(jīng)過耳蝸基底膜模型進(jìn)行頻譜分析，在經(jīng)過耳蝸基底膜上的內(nèi)毛細(xì)胞模型進(jìn)行信號(hào)轉(zhuǎn)換以及內(nèi)毛細(xì)胞上的神經(jīng)纖維進(jìn)行細(xì)胞重合，再通過上橄欖核模型進(jìn)行語音信息提取，最終進(jìn)行聲源的定位。
【IPC分類】G10L15/02, G01S5/20
【公開號(hào)】CN105575387
【申請(qǐng)?zhí)枴緾N201510990824
【發(fā)明人】張毅, 徐曉東, 蕭紅, 羅久飛, 黃超, 蘇祖強(qiáng)
【申請(qǐng)人】重慶郵電大學(xué)
【公開日】2016年5月11日
【申請(qǐng)日】2015年12月25日

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第2頁1 2

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

耳蝸基底膜相關(guān)技術(shù)

領(lǐng)先仿生人工耳蝸相關(guān)技術(shù)

人工耳蝸相關(guān)技術(shù)

人工耳蝸baike相關(guān)技術(shù)

雙側(cè)人工耳蝸相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

基于聽覺仿生中耳蝸基底膜的聲源定位方法_2