專利名稱:一種電子耳蝸及其聲音信號處理方法
技術(shù)領(lǐng)域:
本發(fā)明涉及電子耳蝸領(lǐng)域和語音信號處理領(lǐng)域,特別涉及一種電子耳蝸及其聲音 信號處理方法。
背景技術(shù):
電子耳蝸技術(shù)是現(xiàn)在世界上最為成功的神經(jīng)假體,通過用電流直接刺激聽神經(jīng), 使聽力嚴重損失的人恢復聽覺,已幫助全球超過12萬電子耳蝸植入者不同程度的恢復了 聽力。由于電子耳蝸采用電極刺激的方式補償重度感音性聽力損失,包括信息傳輸電路、 電極電流供給電路和言語處理器電路等主要耗電部分,大部分集中在射頻電路發(fā)射能量部 分,電子耳蝸的電能消耗相對于助聽器要高出很多。通常耳背式助聽器需要一粒專用電池, 工作時長達1到2周,而耳背式電子耳蝸需要三粒專用電池,工作時長僅為1到3天。國內(nèi) 可以買到的電子耳蝸專用電池價格在每粒2 5元不等,故電子耳蝸工作一年可能約需要 730元 5475元不等,對于我國中低收入家庭來說負擔較大,且涉及環(huán)境污染。另外,頻繁 的更換電池或給電池充電也會給日常使用帶來不便。即便在用體佩機時,采用2節(jié)或3節(jié) 五號電池,工作時長一般也只在在1天左右。下面是兩款電子耳蝸的能耗情況實例Advanced Bionics公司某型號電子耳蝸,使用專用鋰離子充電電池,一節(jié)電池使 用時間大于14小時,配用AA電池倉,可使用三節(jié)5號電池,普通三節(jié)5號電池使用時間大 于18小時。澳大利亞Cochlear公司某型號電子耳蝸,使用一節(jié)或二節(jié)5號電池,實際使用情 況看,二節(jié)電池的音質(zhì)優(yōu)于一節(jié)。普通二節(jié)5號電池使用時間大于24小時。國內(nèi)外相關(guān)研究近況目前國內(nèi)還沒有正式走向市場的國產(chǎn)化電子耳蝸產(chǎn)品,有 幾家產(chǎn)品正處于臨床階段,沒有采用語音信號處理方法進行節(jié)能降耗相關(guān)的文獻資料報 道。國外電子耳蝸公司的產(chǎn)品,都有采用自動增益控制(AGC)的方法來調(diào)整增益以使人聽 起來舒服,美國麻省理工學院有關(guān)于AGC可以降低能耗的研究文獻,但是沒有看到各家公 司關(guān)于電子耳蝸采用語音信號處理方法降低能耗的報道。很多關(guān)于電子耳蝸節(jié)電的方法都 是從電路板級、集成電路級出發(fā)進行研究的。另外,在語音信號處理領(lǐng)域,語音端點檢測也被稱為語音活動檢測,研究問題包括 噪聲邊界檢測、單詞和孤立字檢測等,常被用于語音自動識別中的前期處理,也常被用于網(wǎng) 絡(luò)電話通信、語音增強、回聲抵消等應(yīng)用領(lǐng)域。具體的實現(xiàn)方法也是多種多樣,基本的方法 是利用短時能量、過零率、信息熵、倒譜、高階統(tǒng)計量、線性預測編碼等。當前應(yīng)用最廣泛的電子耳蝸言語編碼策略,如連續(xù)交替采用方案 CIS (continuous inter leaved sampling),高級混合編石馬方案 ACE (advanced confined encoding)都是通過植入電極產(chǎn)生速率恒定的電刺激脈沖,刺激耳蝸不同位置來模擬正常 耳蝸的部位編碼。植入的電極在鼓階由蝸底向蝸尖依次排列,刺激由高到低不同頻率敏感 的聽神經(jīng)。分頻帶處理是常規(guī)電子耳蝸言語編碼策略中常用的技術(shù)。植入電極的不同位置,對應(yīng)于信號處理策略中劃分的不同的頻段,電子耳蝸的主要耗電部分就是射頻(RF)發(fā)射, 即其后面的部分,能夠在無有效聲音信息的時候降低RF發(fā)射功率即可節(jié)省大部分的電能。
發(fā)明內(nèi)容
本發(fā)明的目的在于,解決電子耳蝸在正常工作時耗電量較大,需要電子耳蝸植入 者頻繁更換電池的問題,從而提供一種經(jīng)濟性、環(huán)保價值高及人性化的電子耳蝸及其語音 信號處理方法。為實現(xiàn)上述發(fā)明目的,本發(fā)明提出一種電子耳蝸及其聲音信號處理方法。一種電子耳蝸,該電子耳蝸利用預處理模塊對輸入的聲信號進行預處理,經(jīng)過電 子耳蝸言語處理中編碼策略前段的分頻帶處理后,輸入的每一幀信號變成N個子帶信號的 輸出,其特征在于,該電子耳蝸還包括多子帶信噪比統(tǒng)計分析模塊、參考噪聲的統(tǒng)計信息更新模塊 及射頻正常運行和低功耗運行的控制模塊;所述的多子帶信噪比統(tǒng)計分析模塊,用于將經(jīng)預處理模塊處理后的Ninit幀信 號作為初始化信號,計算出每一幀信號中的每一個子帶的噪聲統(tǒng)計特性和判決門限,然 后對每一幀信號是否為噪聲進行判決,判決為噪聲的信號送入所述的參考噪聲的統(tǒng)計信 息更新模塊;同時,檢測初始化信號的能量是否大于等于預先設(shè)定的噪聲預警門限,如果 是,則開啟智能節(jié)電功能失??;如果不是,則成功開啟智能節(jié)電功能;所述的Ninit幀信號 中的Ninit表示幀的個數(shù),取值范圍是25 SNinit ( 50 ;所述的N個子帶中的N表示電 子耳蝸使用言語編碼策略前段的分頻帶處理后將每一幀信號分成的子帶數(shù),取值范圍是 8彡N彡24 ;所述的參考噪聲的統(tǒng)計信息更新模塊,利用所述的多子帶信噪比統(tǒng)計分析模塊判 決為噪聲的幀信號對參考噪聲的對應(yīng)子帶平均能量進行更新,并對該子帶參考噪聲統(tǒng)計特 性和判決門限更新,然后,用于所述的多子帶信噪比統(tǒng)計分析模塊中幀信號是否為噪聲的 判決;所述的射頻正常運行和低功耗運行的控制模塊,利用所述的多子帶信噪比統(tǒng)計分 析模塊判決為噪聲的幀信號的個數(shù)和時間分布來判決開啟或停止言語編碼策略后段處理 及射頻正常運行或低功耗運行;如果低功耗開啟,系統(tǒng)回到初始化完成后的狀態(tài)。該系統(tǒng)還包括辨識非噪聲信號特性模塊;所述的辨識非噪聲信號特性模塊用于 檢測所述的多子帶信噪比統(tǒng)計分析模塊判決為非噪聲的幀信號是語音信號還是其他信號, 并且把其中的非語音信號輸送給所述的參考噪聲的統(tǒng)計信息更新模塊進行參考噪聲信息 更新,以此實現(xiàn)針對低方差緩變噪聲的自適應(yīng)調(diào)整。所述的辨識非噪聲信號特性模塊對所述的多子帶信噪比統(tǒng)計分析模塊判決為非 噪聲信號的第k幀信號進行基音周期檢測,然后,進行諧波搜索,最后,根據(jù)語音中濁音的 諧波特性,通過對非噪聲信號的基頻和諧波進行提取,判斷當前非噪聲信號是否為語音;另 外,根據(jù)預先設(shè)置的語音、電話鈴聲、音樂這三種聲音對不同的子帶進行不同的加權(quán),用于 對非噪聲特性判決的輔助。一種電子耳蝸的聲音信號處理方法,該方法包括步驟步驟1)該電子耳蝸利用預處理模塊對輸入的聲信號進行預處理,經(jīng)過電子耳蝸言語處理中編碼策略前段的分頻帶處理后,輸入的每一幀信號變成N個子帶信號的輸出;步驟2)通過多子帶信噪比統(tǒng)計分析模塊,把電子耳蝸經(jīng)預處理模塊處理后的 Mnit幀信號作為初始化信號,計算出每一幀信號中的每一個子帶的噪聲統(tǒng)計特性和判決 門限,然后對每一幀信號是否為噪聲進行判決,判決為噪聲的信號送入所述的參考噪聲的 統(tǒng)計信息更新模塊;同時,檢測初始化信號的能量是否大于等于預先設(shè)定的噪聲預警門限, 如果是,則開啟智能節(jié)電功能失??;如果不是,則成功開啟智能節(jié)電功能;步驟3)通過參考噪聲的統(tǒng)計信息更新模塊,利用所述的多子帶信噪比統(tǒng)計分析 模塊判決為噪聲的幀信號對參考噪聲的對應(yīng)子帶平均能量進行更新,并對該子帶參考噪聲 統(tǒng)計特性和判決門限更新,然后,用于所述的多子帶信噪比統(tǒng)計分析模塊中幀信號是否為 噪聲的判決;步驟4)最后,通過射頻正常運行或低功耗運行的控制模塊,利用所述的多子帶 信噪比統(tǒng)計分析模塊判決為噪聲的幀信號的個數(shù)和時間分布來判決開啟或停止言語編碼 策略后段處理及射頻正常運行或的低功耗運行;如果低功耗運行,系統(tǒng)回到初始化完成后 的狀態(tài)。所述的步驟2)中,如果分頻帶處理后的信號為時域表現(xiàn)形式,則按式(1)計算其能量;其中,第i個 頻帶的信號的時域表示為Xi (k,q),i表示第i個子帶,k表示第k幀信號,q表示第k幀信 號中第q個采樣點,0 < q< NF+1 ;
權(quán)利要求
一種電子耳蝸,該電子耳蝸利用預處理模塊對輸入的聲信號進行預處理,經(jīng)過電子耳蝸言語處理中編碼策略前段的分頻帶處理后,輸入的每一幀信號變成N個子帶信號的輸出,其特征在于,該電子耳蝸還包括多子帶信噪比統(tǒng)計分析模塊、參考噪聲的統(tǒng)計信息更新模塊及射頻正常運行和低功耗運行的控制模塊;所述的多子帶信噪比統(tǒng)計分析模塊,用于將經(jīng)預處理模塊處理后的Ninit幀信號作為初始化信號,計算出每一幀信號中的每一個子帶的噪聲統(tǒng)計特性和判決門限,然后對每一幀信號是否為噪聲進行判決,判決為噪聲的信號送入所述的參考噪聲的統(tǒng)計信息更新模塊;同時,檢測初始化信號的能量是否大于等于預先設(shè)定的噪聲預警門限,如果是,則開啟智能節(jié)電功能失??;如果不是,則成功開啟智能節(jié)電功能;所述的Ninit幀信號中的Ninit表示幀的個數(shù),取值范圍是25≤Ninit≤50;所述的N個子帶中的N表示電子耳蝸使用言語編碼策略前段的分頻帶處理后將每一幀信號分成的子帶數(shù),取值范圍是8≤N≤24;所述的參考噪聲的統(tǒng)計信息更新模塊,利用所述的多子帶信噪比統(tǒng)計分析模塊判決為噪聲的幀信號對參考噪聲的對應(yīng)子帶平均能量進行更新,并對該子帶參考噪聲統(tǒng)計特性和判決門限更新,然后,用于所述的多子帶信噪比統(tǒng)計分析模塊中幀信號是否為噪聲的判決;所述的射頻正常運行和低功耗運行的控制模塊,利用所述的多子帶信噪比統(tǒng)計分析模塊判決為噪聲的幀信號的個數(shù)和時間分布來判決開啟或停止言語編碼策略后段處理及射頻正常運行或低功耗運行;如果低功耗運行,系統(tǒng)回到初始化完成后的狀態(tài)。
2.根據(jù)權(quán)利要求1所述的電子耳蝸,其特征在于,該系統(tǒng)還包括辨識非噪聲信號特性 模塊;所述的辨識非噪聲信號特性模塊用于檢測所述的多子帶信噪比統(tǒng)計分析模塊判決為 非噪聲的幀信號是語音信號還是其他信號,并且把其中的非語音信號輸送給所述的參考噪 聲的統(tǒng)計信息更新模塊進行參考噪聲信息更新,以此實現(xiàn)針對低方差緩變噪聲的自適應(yīng)調(diào)iF. ο
3.根據(jù)權(quán)利要求1所述的電子耳蝸,其特征在于,所述的辨識非噪聲信號特性模塊對 所述的多子帶信噪比統(tǒng)計分析模塊判決為非噪聲信號的第k幀信號進行基音周期檢測,然 后,進行諧波搜索,最后,根據(jù)語音中濁音的諧波特性,通過對非噪聲信號的基頻和諧波進 行提取,判斷當前非噪聲信號是否為語音;另外,根據(jù)預先設(shè)置的語音、電話鈴聲、音樂這三 種聲音對不同的子帶進行不同的加權(quán),用于對非噪聲特性判決的輔助。
4.一種電子耳蝸的聲音信號處理方法,該方法包括步驟步驟1)該電子耳蝸利用預處理模塊對輸入的聲信號進行預處理,經(jīng)過電子耳蝸言語 處理中編碼策略前段的分頻帶處理后,輸入的每一幀信號變成N個子帶信號的輸出;步驟2)通過多子帶信噪比統(tǒng)計分析模塊,把電子耳蝸經(jīng)預處理模塊處理后的Ninit 幀信號作為初始化信號,計算出每一幀信號中的每一個子帶的噪聲統(tǒng)計特性和判決門限, 然后對每一幀信號是否為噪聲進行判決,判決為噪聲的信號送入所述的參考噪聲的統(tǒng)計信 息更新模塊;同時,檢測初始化信號的能量是否大于等于預先設(shè)定的噪聲預警門限,如果 是,則開啟智能節(jié)電功能失??;如果不是,則成功開啟智能節(jié)電功能;步驟3)通過參考噪聲的統(tǒng)計信息更新模塊,利用所述的多子帶信噪比統(tǒng)計分析模塊 判決為噪聲的幀信號對參考噪聲的對應(yīng)子帶平均能量進行更新,并對該子帶參考噪聲統(tǒng)計特性和判決門限更新,然后,用于所述的多子帶信噪比統(tǒng)計分析模塊中幀信號是否為噪聲 的判決;步驟4)最后,通過射頻正常運行和低功耗運行的控制模塊,利用所述的多子帶信噪 比統(tǒng)計分析模塊判決為噪聲的幀信號的個數(shù)和時間分布來判決開啟或停止言語編碼策略 后段處理及射頻正常運行或低功耗運行;如果低功耗運行,系統(tǒng)回到初始化完成后的狀態(tài)。
5.根據(jù)權(quán)利要求4所述的電子耳蝸的聲音信號處理方法,其特征在于,所述的步驟2)中,如果分頻帶處理后的信號為時域表現(xiàn)形式,則按式(1)計算其能量;其中,第i個頻帶 的信號的時域表示為Xi (k,q),i表示第i個子帶,k表示第k幀信號,q表示第k幀信號中 第q個采樣點,0<q<NF+l;NFEXj(k) = J^xf(k,q)....................................... (1)9=1如果分頻帶處理后的信號為頻域表現(xiàn)形式,則按式(2)計算其能量;其中,X(k,t)為第 k幀信號的頻域表示形式,t表示第i個子帶中每個頻點的坐標;Exi(Ji)= YjX2(k,t)................................. (2)t=Ni如果k > Ninit不成立,則按照式(3)滑動平均的方式計算第i個子帶的平均噪聲能 量 EniGO ;當 k > 1 時,Eni (k) = α Exi (k) + (1- α ) Eni (k_l)當 k = 1 時,EniGO = ExiGO (3)式(3)中,α = | ;k表示第k幀信號,在得到Eni (Mnit)后,設(shè)Thitl*預先根據(jù)特定電子耳蝸信號的增益情況設(shè)定的第i個 子帶的能量門限,判斷如果Eni (Ninit) > Thitl成立,則系統(tǒng)報警,告知電子耳蝸植入者此智 能節(jié)電功能初始化失敗,功能開啟失敗;如果Eni (Ninit) > Thitl不成立,則按照式(4)計算 前Ninit個幀信號的信噪比辦;(幻;Wi{k)= Ex'(k)1(4)Exi (Ninit)式(4)中,0 < k < Ninit+1 ;經(jīng)過初始化以后,始終會保存NinitXN個能量值。當0 < k < Ninit+1時,計算例,(幻的方差σ ni2(Niriit),合理假設(shè)例,從)服從均值 為0的高斯分布,然后按照式(5)利用0ni2(Ninit)計算第i個子帶的信噪比判決門限 Hi(Ninit);ηι(Ninit) = ^2ont2(Ninit) .erfc'1 (2PFA)(5)式(5)中,Pfa為虛警概率,此處設(shè)為5%,erfc—1為補余誤差函數(shù)的反函數(shù);如果k> Ninit成立,則計算幀信號Xi (k)的信噪比趴㈨,把它和最新更新的JliGO 做比較,然后進行判斷,如果辨,(幻 > ,則使第k幀第i個子帶非噪聲信號標志為Vfiagi (k) =1 ;否則,VflagiGO = O ;然后將判決結(jié)果進行下一步的子帶綜合分析;其中,Jli會在 兩種情況下進行自動更新;一是利用0ni2(Ninit)計算第i個子帶的信噪比判決門限 Jli(Ninit),另一是在所述的參考噪聲的統(tǒng)計信息更新模塊中實時更新判決門限Jli ;N個子帶都做完信噪比統(tǒng)計分析判決后進行對當前幀信號判決是噪聲信號還是非噪聲信號。
6.根據(jù)權(quán)利要求4所述的電子耳蝸的聲音信號處理方法,其特征在于,所述的步驟2) 中,對每一幀信號是否為噪聲進行判決的步驟包括所述的多子帶信噪比統(tǒng)計分析模塊要判決當前幀信號中的子帶是環(huán)境噪聲還是非環(huán) 境噪聲的判決準則是
7.根據(jù)權(quán)利要求4所述的電子耳蝸的聲音信號處理方法,其特征在于,所述的步驟2) 中,對每一幀信號是否為噪聲進行判決的步驟包括對當前幀信號進行總體判斷,那么按照式(7)對各個子帶的辦,(幻進行總體判斷
8.根據(jù)權(quán)利要求5所述的電子耳蝸的聲音信號處理方法,其特征在于,所述的步驟3)中,該系統(tǒng)初始化后實時保存NinitXN個子帶的能量值,所述的參考噪聲的統(tǒng)計信息更 新模塊利用每一幀被所述的多子帶信噪比統(tǒng)計分析模塊判為噪聲的結(jié)果對參考噪聲模型 進行更新,即刪除Ninit個幀中的第一個,然后整體前移,再把剛才判決為噪聲幀信號放在 第Ninit位上,每完成Ninit/2次更新后按照式(8)用滑動平均的方式計算每一幀中的每 一個子帶噪聲的平均能量;當 k > 1 時,Eni (k) = α Exi (k) + (1- α ) Eni (k_l) 當 k = 1 時,EniGO = ExiGO (8)式(8)中,α = +;表示第k幀第i個子帶的平均噪聲能量;k表示第k幀信號; 計算第i個子帶對應(yīng)的當前幀的信噪比辦,(幻,并計算第i個子帶噪聲的方差σ ni (k), 并由此計算判決門限HiGO ;最后,實時更新判決門限Jli用于所述的多子帶信噪比統(tǒng)計分 析模塊中。
全文摘要
本發(fā)明涉及一種電子耳蝸及其聲音信號處理方法。利用預處理模塊對輸入聲信號進行預處理,輸入的每一幀信號變成N個子帶信號的輸出;通過多子帶信噪比統(tǒng)計分析模塊,經(jīng)預處理模塊的Ninit幀信號作為初始化信號,計算出幀信號中的每個子帶的噪聲統(tǒng)計特性和判決門限,然后對幀信號是否為噪聲進行判決,判決為噪聲的信號送入?yún)⒖荚肼暯y(tǒng)計信息更新模塊對參考噪聲對應(yīng)子帶平均能量進行更新,并對該子帶參考噪聲統(tǒng)計特性和判決門限更新;同時,檢測初始化信號的能量是否大于等于預先設(shè)定的噪聲預警門限,如果不是,則成功開啟智能節(jié)電功能;通過射頻正常運行和低功耗運行控制模塊,利用判決為噪聲幀信號的個數(shù)和時間分布來判決控制射頻正常運行或低功耗運行。
文檔編號G10L19/02GK101953722SQ20101027910
公開日2011年1月26日 申請日期2010年9月10日 優(yōu)先權(quán)日2010年9月10日
發(fā)明者馮海泓, 原猛, 孟慶林, 平利川 申請人:中國科學院聲學研究所