在聽(tīng)覺(jué)儀器系統(tǒng)中從直混比評(píng)定自己語(yǔ)音活動(dòng)的制作方法

文檔序號(hào)：2837351閱讀：547來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂(lè)器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：在聽(tīng)覺(jué)儀器系統(tǒng)中從直混比評(píng)定自己語(yǔ)音活動(dòng)的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及一種包括自己語(yǔ)音檢測(cè)器的聽(tīng)覺(jué)儀器系統(tǒng)以及在聽(tīng) 覺(jué)儀器系統(tǒng)中識(shí)別用戶自己語(yǔ)音的方法。在這種背景下，聽(tīng)覺(jué)儀器可
以是助聽(tīng)器，例如，耳內(nèi)式(ITE)助聽(tīng)器、深耳道式(CIC)助聽(tīng)器或者耳后式(BTE)助聽(tīng)器、頭戴式耳機(jī)、聽(tīng)覺(jué)保護(hù)裝置、智能耳塞等。
背景技術(shù)：
特別是當(dāng)人們第一次開(kāi)始戴助聽(tīng)器時(shí)，對(duì)助聽(tīng)器的最普遍的抱怨是他們自己語(yǔ)音的聲音很大，或者聽(tīng)起來(lái)好象他們?cè)谙蛲爸姓f(shuō)話。因此，存在識(shí)別助聽(tīng)器用戶自己語(yǔ)音的需要，從而能夠以不同于處理源自其它聲音源的聲音的方式處理用戶自己的語(yǔ)音。
在現(xiàn)有技術(shù)文獻(xiàn)WO 2004/077090 Al中，說(shuō)明了用于區(qū)分來(lái)自用戶口中的聲音和來(lái)自其它源的聲音的不同方法。W0 2004/077090 Al 中說(shuō)明的方法的缺陷在于為了識(shí)別用戶自己的語(yǔ)音需要來(lái)自兩個(gè)或更多麥克風(fēng)的信號(hào)。
基于從單個(gè)麥克風(fēng)信號(hào)得到的量來(lái)識(shí)別助聽(tīng)器中用戶自己的語(yǔ) 音的其它已知方法是例如基于總的水平、聲調(diào)、頻譜形狀、預(yù)報(bào)器系數(shù)的自相關(guān)與自相關(guān)的譜比較、倒譜系數(shù)、節(jié)律特征或調(diào)制韻律。沒(méi) 有證實(shí)并且甚至理論上也沒(méi)有證明這些方法能執(zhí)行可靠的自己語(yǔ)音檢測(cè)。
用于識(shí)別用戶自己語(yǔ)音的另一已知方法是基于來(lái)自譜轉(zhuǎn)換器的輸入，其拾取由聲音行為引起的耳道中的振動(dòng)。盡管該自己語(yǔ)音檢測(cè) 方法被認(rèn)為是很可靠的，但是它需要特殊的轉(zhuǎn)換器，該轉(zhuǎn)換器被認(rèn)為是難以實(shí)現(xiàn)且昂貴的。
本發(fā)明的目的是提供一種在聽(tīng)覺(jué)儀器系統(tǒng)中識(shí)別用戶自己語(yǔ)音的方法以及提供一種包括自己語(yǔ)音檢測(cè)器的聽(tīng)覺(jué)儀器系統(tǒng)，該自己語(yǔ)音檢測(cè)器提供對(duì)用戶自己語(yǔ)音的可靠且簡(jiǎn)單的檢測(cè)。發(fā)明內(nèi)容由根據(jù)權(quán)利要求1的方法和根據(jù)權(quán)利要求8的聽(tīng)覺(jué)儀器系統(tǒng)來(lái)實(shí)現(xiàn)本發(fā)明的目的。在根據(jù)本發(fā)明的在聽(tīng)覺(jué)儀器系統(tǒng)中識(shí)別用戶自己語(yǔ)音的方法中，基于至少一部分所記錄的聲音的直達(dá)聲音部分的信號(hào)能量和混響聲音部分的信號(hào)能量之間的直混比(DtoR)來(lái)評(píng)定該聲音是源于用戶自己語(yǔ)音還是源于其它聲音源。該方法的優(yōu)點(diǎn)在于直混比(DtoR)允許對(duì) 用戶自己語(yǔ)音非?？煽康臋z測(cè)。根據(jù)本發(fā)明的優(yōu)選實(shí)施例，當(dāng)從信號(hào)能量的包絡(luò)確定了直混比 (DtoR)時(shí)，利用本方法可以基于來(lái)自一個(gè)麥克風(fēng)的信號(hào)識(shí)別用戶自己的語(yǔ)音。利用直混比(DtoR)，通過(guò)將直混比與自己語(yǔ)音閾值進(jìn)行比較來(lái)評(píng) 定聲音是源自近場(chǎng)聲音源(用戶自己語(yǔ)音)還是源自遠(yuǎn)場(chǎng)聲音源，其中所述自己語(yǔ)音閾值可以通過(guò)預(yù)先進(jìn)行試驗(yàn)，從而根據(jù)經(jīng)驗(yàn)來(lái)確定。通過(guò)單獨(dú)確定多個(gè)頻帶中的直混比并基于該多個(gè)頻帶的直混比評(píng)定聲音是否源自用戶自己語(yǔ)音可以實(shí)現(xiàn)在聽(tīng)覺(jué)儀器系統(tǒng)中檢測(cè)用戶自己語(yǔ)音的更可靠的方法。如果基于直混比(DtoR)與所記錄的聲音的其它特征的組合來(lái)評(píng) 定聲音是否源自用戶自己語(yǔ)音，則自己語(yǔ)音檢測(cè)與僅基于直混比進(jìn)行檢測(cè)的情況相比具有更準(zhǔn)確的優(yōu)點(diǎn)。

通過(guò)以下結(jié)合附圖對(duì)優(yōu)選實(shí)施例的說(shuō)明，本領(lǐng)域的技術(shù)人員將更容易理解本發(fā)明。在附圖中-圖l示出當(dāng)源和接收器間隔幾米時(shí)的混響聲學(xué)環(huán)境的反射圖的典型情況；圖2示出當(dāng)源和接收器靠在一起時(shí)的混響聲學(xué)環(huán)境的反射圖的典型情況；圖3是根據(jù)本發(fā)明的聽(tīng)覺(jué)儀器系統(tǒng)中識(shí)別用戶自己語(yǔ)音的方法的優(yōu)選實(shí)施例的流程圖；以及圖4是根據(jù)本發(fā)明的聽(tīng)覺(jué)儀器系統(tǒng)的優(yōu)選實(shí)施例的示意性框圖。
具體實(shí)施方式
在圖1中，示出了存在反射面的聲學(xué)環(huán)境的反射圖。該直達(dá)聲音 la的能量水平與包含早期反射2a和晚期混響3a的混響尾部的能量水平之間的所謂直混比(DtoR)對(duì)于聲音源和聲音接收器間隔幾米的情況是典型的。如果接收器是聽(tīng)覺(jué)儀器麥克風(fēng)而源是說(shuō)話對(duì)方的語(yǔ)音，則是這種情況。圖2示出聲音源是聽(tīng)覺(jué)儀器佩戴者自己語(yǔ)音的情況。附圖標(biāo)記lb 表示直達(dá)聲音，附圖標(biāo)記2b表示早期反射，附圖標(biāo)記3b表示晚期混響。顯然，直混比(DtoR)與聲音源和聲音接收器間隔幾米的情況中的直混比(DtoR)根本不同。圖2情況中的直混比(DtoR)比圖l情況中的直混比 (DtoR)高許多。在聽(tīng)覺(jué)儀器系統(tǒng)中識(shí)別用戶自己語(yǔ)音的方法是基于發(fā)現(xiàn)聲音信號(hào)的直混比(DtoR)在聲音源自近場(chǎng)源的情況，如用戶的自己語(yǔ)音，比聲音源自遠(yuǎn)場(chǎng)源的情況更高。圖3示出根據(jù)本發(fā)明優(yōu)選實(shí)施例的聽(tīng)覺(jué)儀器系統(tǒng)中識(shí)別用戶自己語(yǔ)音的方法的基本步驟。在第一步S1中，記錄聲音信號(hào)。在接下來(lái)的第二步S2中，將所記錄的聲音信號(hào)劃分成多個(gè)頻帶。在第三步S3中，確定每個(gè)頻帶中短時(shí) 間間隔例如20ms內(nèi)的信號(hào)能量，以獲得信號(hào)能量的包絡(luò)。在第四步S4 中，識(shí)別每個(gè)頻帶中的允許可靠估計(jì)直混比(DtoR)的有用聲音事件。這是通過(guò)在例如700ms的連續(xù)片斷中檢查所確定的包絡(luò)來(lái)實(shí)現(xiàn)的。由此檢查每個(gè)連續(xù)片斷是否包含足夠陡的開(kāi)始(對(duì)應(yīng)于直達(dá)聲音la，lb) 和足夠持續(xù)時(shí)間的近似指數(shù)衰減的尾部(對(duì)應(yīng)于混響聲音2a， 3a， 2b， 3b)。因此，所識(shí)別出的有用聲音事件包含直達(dá)聲音部分和混響聲音部分。在步驟S5中，將步驟S4中識(shí)別出的聲音事件按每個(gè)頻帶劃分成直達(dá)聲音部分和混響聲音部分。在步驟S6中，按每個(gè)頻帶計(jì)算直達(dá)聲音部分的信號(hào)能量(la; lb)和混響聲音部分的信號(hào)能量(2a， 3a; 2b， 3b)之間的直混比(DtoR)。然后，在接下來(lái)的步驟S7中，將所有不同頻帶的各直混比(DtoR)組合成單個(gè)最終的直混比(組合后的直混比)。在此，組合后的直混比可以例如是子頻帶直混比的平均。在步驟S8 中，將組合后的直混比與自己語(yǔ)音閾值進(jìn)行比較，其中，自己語(yǔ)音閾值是在試驗(yàn)中按經(jīng)驗(yàn)確定的。如果組合后的直混比超過(guò)自己語(yǔ)音閾值，則判定所記錄的聲音信號(hào)是用戶自己語(yǔ)音。否則，判定所記錄的聲音信號(hào)不是用戶自己語(yǔ)音。如果判定所記錄的聲音信號(hào)是用戶自己語(yǔ)音，則在將處理后的聲音輸出給用戶之前，在聽(tīng)覺(jué)儀器中啟動(dòng)單獨(dú)和專用信號(hào)處理。在修改的實(shí)施例中，識(shí)別用戶自己語(yǔ)音的方法可以結(jié)合其它自己語(yǔ)音檢測(cè)器以獲得更準(zhǔn)確的最終自己語(yǔ)音檢測(cè)器輸出。與其它自己語(yǔ) 音檢測(cè)器的結(jié)合可以這樣進(jìn)行對(duì)每個(gè)評(píng)定所記錄的聲音信號(hào)是用戶自己語(yǔ)音的自己語(yǔ)音檢測(cè)器設(shè)置標(biāo)志。在此情況下，如果設(shè)置了預(yù)定數(shù)量的標(biāo)志，則最終自己語(yǔ)音檢測(cè)器輸出確定所記錄的聲音信號(hào)是用戶自己語(yǔ)音。由于從信號(hào)能量的包絡(luò)確定直混比(DtoR)包含一秒量級(jí) 的延遲這一事實(shí)，因此優(yōu)選將本發(fā)明與現(xiàn)有技術(shù)中已知的其它更快的自己語(yǔ)音檢測(cè)器相結(jié)合。這樣，可以將基于直混比的自己語(yǔ)音檢測(cè)的可靠性與其它低可靠方法檢測(cè)的高速度相結(jié)合。下面，參照?qǐng)D4說(shuō)明用于執(zhí)行上述方法的聽(tīng)覺(jué)儀器系統(tǒng)。可以執(zhí)行上述方法的聽(tīng)覺(jué)儀器系統(tǒng)20包括麥克風(fēng)4、連接到麥克風(fēng)4的A/D轉(zhuǎn)換器5、輸入連接到A/D轉(zhuǎn)換器5的輸出的數(shù)字信號(hào)處理單元6、輸入連接到數(shù)字信號(hào)處理單元6的輸出的D/A轉(zhuǎn)換器7、以及連接到D/A轉(zhuǎn)換器7的輸出的揚(yáng)聲器8。數(shù)字信號(hào)處理單元6包括頻帶過(guò)濾器 9、隨機(jī)存取存儲(chǔ)器(RAM)IO、只讀存儲(chǔ)器(R0M)11以及中央處理單元 (CPU)12。麥克風(fēng)4是用于記錄聲音信號(hào)的裝置，頻帶過(guò)濾器9是用于將所記錄的聲音信號(hào)劃分為多個(gè)頻帶的裝置，CPU12、 RAM10以及R0M11是用于確定短時(shí)間間隔內(nèi)的信號(hào)能量的裝置、用于識(shí)別有用聲音事件的裝置、用于將聲音事件劃分為直達(dá)部分和混響部分(la， 2a， 3a; lb， 2b， 3b)的裝置、用于計(jì)算每個(gè)頻帶的直混比(DtoR)的裝置、用于將子頻帶直混比組合為最終組合后的直混比的裝置、以及用于比較組合后的直混比(組合后的DtoR)與自己語(yǔ)音閾值以確定所記錄的聲音是否源于用戶自己語(yǔ)音的裝置。聽(tīng)覺(jué)儀器系統(tǒng)可以是助聽(tīng)器，例如耳內(nèi)式(ITE)助聽(tīng)器、深耳道式(CIC)助聽(tīng)器、耳后式(BTE)助聽(tīng)器或者耳內(nèi)接收器(RITE)助聽(tīng)器?？梢詫?duì)本發(fā)明的上述優(yōu)選實(shí)施例進(jìn)行修改。例如，說(shuō)明了將所記錄的聲音信號(hào)劃分為多個(gè)頻帶并計(jì)算每個(gè)頻帶的直混比(DtoR)。然而，只在一個(gè)寬頻帶中也可以實(shí)現(xiàn)本發(fā)明的自己語(yǔ)音檢測(cè)。上述聽(tīng)覺(jué) 儀器系統(tǒng)使用數(shù)字信號(hào)處理。然而，也可以使用聲音信號(hào)的模擬處理。
權(quán)利要求
1. 一種用于在聽(tīng)覺(jué)儀器系統(tǒng)(20)中識(shí)別用戶自己語(yǔ)音的方法，其特征在于包括以下步驟確定至少一部分所記錄的聲音的直達(dá)聲音部分的信號(hào)能量和混響聲音部分的信號(hào)能量之間的直混比；以及基于所述直混比評(píng)定所述聲音是否源自用戶自己的語(yǔ)音。
2. 根據(jù)權(quán)利要求l所述的方法，其特征在于評(píng)定所述聲音是否源自所述用戶自己語(yǔ)音的步驟包括以下步驟比較所述直混比與自己語(yǔ)音閾值，以及如果所述直混比超過(guò)所述自己語(yǔ)音閾值，則評(píng)定所記錄的聲音源自所述用戶自己語(yǔ)音。
3. 根據(jù)權(quán)利要求l所述的方法，其特征在于所述方法進(jìn)一步包括將所記錄的聲音劃分為多個(gè)頻帶的步驟；確定所述多個(gè)頻帶中的每一個(gè)的所述直達(dá)聲音部分的信號(hào)能量和所述混響聲音部分的信號(hào)能量之間的直混比；以及基于所述多個(gè)頻帶的直混比來(lái)評(píng)定所記錄的聲音是否源自所述用戶自己的語(yǔ)音。
4. 根據(jù)權(quán)利要求3所述的方法，其特征在于評(píng)定所述聲音是否源自所述用戶自己語(yǔ)音的步驟包括以下步驟組合所確定的所述多個(gè)頻帶中的每一個(gè)的直混比，以獲得組合后的直混比；比較所述組合后的直混比和自己語(yǔ)音閾值；以及如果所述組合后的直混比超過(guò)自己語(yǔ)音閾值，則評(píng)定所記錄的聲音源自所述用戶自己語(yǔ)音。
5. 根據(jù)權(quán)利要求1 4任一所述的方法，其特征在于確定所述直混比包括以下步驟確定短時(shí)間間隔內(nèi)的聲音信號(hào)能量以獲得這些間隔的信號(hào)能量包絡(luò)；從這些間隔的信號(hào)能量的包絡(luò)計(jì)算所述直混比。
6. 根據(jù)權(quán)利要求5所述的方法，其特征在于評(píng)定所述聲音源于所述用戶自己語(yǔ)音是基于所述直混比與所記錄的聲音的其它特征的組合。
7. 根據(jù)權(quán)利要求6所述的方法，其特征在于所述方法進(jìn)一步包括在所記錄的聲音中識(shí)別允許可靠估計(jì)所述直混比的聲音事件的步驟。
8. —種包括自己語(yǔ)音檢測(cè)器的聽(tīng)覺(jué)儀器系統(tǒng)，其特征在于所述自己語(yǔ)音檢測(cè)器包括確定裝置，用于確定至少一部分所記錄的聲音的直達(dá)聲音部分的信號(hào)能量和混響聲音部分的信號(hào)能量之間的直混比；以及評(píng)定裝置，用于基于所述直混比來(lái)評(píng)定所記錄的聲音是否源自所述用戶自己語(yǔ)音。
9. 根據(jù)權(quán)利要求8所述的聽(tīng)覺(jué)儀器系統(tǒng)，其特征在于所述評(píng)定裝置被配置成比較所述直混比與自己語(yǔ)音閾值，如果所述直混比超過(guò) 所述自己語(yǔ)音閾值，則評(píng)定所記錄的聲音源自所述用戶自己語(yǔ)音。
10. 根據(jù)權(quán)利要求8所述的聽(tīng)覺(jué)儀器系統(tǒng)，其特征在于所述聽(tīng)覺(jué)儀器系統(tǒng)進(jìn)一步包括用于將所述聲音事件劃分為不同頻帶的劃分裝置；所述確定裝置確定每個(gè)頻帶的所述直混比；以及所述評(píng)定裝置基于每個(gè)頻帶的所述直混比來(lái)評(píng)定所記錄的聲音事件是否源自所述用戶自己語(yǔ)音。
11. 根據(jù)權(quán)利要求10所述的聽(tīng)覺(jué)儀器系統(tǒng)，其特征在于所述評(píng)定裝置被配置成用于組合所確定的所述多個(gè)頻帶中的每一個(gè)的直混比以獲得組合后的直混比，比較所述組合后的直混比和自己語(yǔ)音閾值；如果所述組合后的直混比超過(guò)自己語(yǔ)音閾值，則評(píng)定所記錄的聲音源自所述用戶自己語(yǔ)音。
12. 根據(jù)權(quán)利要求8 11中任一項(xiàng)所述的聽(tīng)覺(jué)儀器系統(tǒng)，其特征在于組合裝置將所述評(píng)定裝置的輸出與其它自己語(yǔ)音檢測(cè)器的輸出進(jìn)行組合以獲得關(guān)于所記錄的聲音是否源于所述用戶自己語(yǔ)音的更準(zhǔn)確的判斷。
13. 根據(jù)權(quán)利要求12所述的聽(tīng)覺(jué)儀器系統(tǒng)，其特征在于所述確定裝置被配置成用于確定短時(shí)間間隔內(nèi)的聲音信號(hào)能量以獲得這些間隔的信號(hào)能量的包絡(luò)并且用于從這些間隔的信號(hào)能量的包絡(luò)計(jì)算所述直混比。
14. 根據(jù)權(quán)利要求13所述的聽(tīng)覺(jué)儀器系統(tǒng)，其特征在于進(jìn)一步包括識(shí)別裝置，所述識(shí)別裝置用于在所記錄的聲音中識(shí)別允許可靠估計(jì)所述直混比的聲音事件。
全文摘要
本發(fā)明提供一種在聽(tīng)覺(jué)儀器系統(tǒng)中識(shí)別用戶自己語(yǔ)音的方法以及用于執(zhí)行該方法的聽(tīng)覺(jué)儀器系統(tǒng)，其中至少一部分所記錄的聲音的直達(dá)聲音部分的信號(hào)能量(1a；1b)和混響聲音部分的信號(hào)能量(2a，3a；2b，3b)之間的直混比(DtoR)被用于評(píng)定該聲音是否源于用戶自己語(yǔ)音。這允許在聽(tīng)覺(jué)儀器系統(tǒng)中非?？煽康貦z測(cè)用戶自己語(yǔ)音。此外，還提供一種包含用于執(zhí)行該方法的自己語(yǔ)音檢測(cè)器的聽(tīng)覺(jué)儀器系統(tǒng)。
文檔編號(hào)G10L21/02GK101242684SQ20071014014
公開(kāi)日2008年8月13日申請(qǐng)日期2007年8月6日優(yōu)先權(quán)日2007年2月6日
發(fā)明者瑟倫·勞格森申請(qǐng)人:奧迪康有限公司

完整全部詳細(xì)技術(shù)資料下載