專利名稱:在聽(tīng)覺(jué)儀器系統(tǒng)中從直混比評(píng)定自己語(yǔ)音活動(dòng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種包括自己語(yǔ)音檢測(cè)器的聽(tīng)覺(jué)儀器系統(tǒng)以及在聽(tīng) 覺(jué)儀器系統(tǒng)中識(shí)別用戶自己語(yǔ)音的方法。在這種背景下,聽(tīng)覺(jué)儀器可
以是助聽(tīng)器,例如,耳內(nèi)式(ITE)助聽(tīng)器、深耳道式(CIC)助聽(tīng)器或者 耳后式(BTE)助聽(tīng)器、頭戴式耳機(jī)、聽(tīng)覺(jué)保護(hù)裝置、智能耳塞等。
背景技術(shù):
特別是當(dāng)人們第一次開(kāi)始戴助聽(tīng)器時(shí),對(duì)助聽(tīng)器的最普遍的抱怨 是他們自己語(yǔ)音的聲音很大,或者聽(tīng)起來(lái)好象他們?cè)谙蛲爸姓f(shuō)話。因 此,存在識(shí)別助聽(tīng)器用戶自己語(yǔ)音的需要,從而能夠以不同于處理源 自其它聲音源的聲音的方式處理用戶自己的語(yǔ)音。
在現(xiàn)有技術(shù)文獻(xiàn)WO 2004/077090 Al中,說(shuō)明了用于區(qū)分來(lái)自用 戶口中的聲音和來(lái)自其它源的聲音的不同方法。W0 2004/077090 Al 中說(shuō)明的方法的缺陷在于為了識(shí)別用戶自己的語(yǔ)音需要來(lái)自兩個(gè)或 更多麥克風(fēng)的信號(hào)。
基于從單個(gè)麥克風(fēng)信號(hào)得到的量來(lái)識(shí)別助聽(tīng)器中用戶自己的語(yǔ) 音的其它已知方法是例如基于總的水平、聲調(diào)、頻譜形狀、預(yù)報(bào)器系 數(shù)的自相關(guān)與自相關(guān)的譜比較、倒譜系數(shù)、節(jié)律特征或調(diào)制韻律。沒(méi) 有證實(shí)并且甚至理論上也沒(méi)有證明這些方法能執(zhí)行可靠的自己語(yǔ)音 檢測(cè)。
用于識(shí)別用戶自己語(yǔ)音的另一已知方法是基于來(lái)自譜轉(zhuǎn)換器的 輸入,其拾取由聲音行為引起的耳道中的振動(dòng)。盡管該自己語(yǔ)音檢測(cè) 方法被認(rèn)為是很可靠的,但是它需要特殊的轉(zhuǎn)換器,該轉(zhuǎn)換器被認(rèn)為 是難以實(shí)現(xiàn)且昂貴的。
本發(fā)明的目的是提供一種在聽(tīng)覺(jué)儀器系統(tǒng)中識(shí)別用戶自己語(yǔ)音 的方法以及提供一種包括自己語(yǔ)音檢測(cè)器的聽(tīng)覺(jué)儀器系統(tǒng),該自己語(yǔ)音檢測(cè)器提供對(duì)用戶自己語(yǔ)音的可靠且簡(jiǎn)單的檢測(cè)。 發(fā)明內(nèi)容由根據(jù)權(quán)利要求1的方法和根據(jù)權(quán)利要求8的聽(tīng)覺(jué)儀器系統(tǒng)來(lái)實(shí)現(xiàn)本發(fā)明的目的。在根據(jù)本發(fā)明的在聽(tīng)覺(jué)儀器系統(tǒng)中識(shí)別用戶自己語(yǔ)音的方法中, 基于至少一部分所記錄的聲音的直達(dá)聲音部分的信號(hào)能量和混響聲音部分的信號(hào)能量之間的直混比(DtoR)來(lái)評(píng)定該聲音是源于用戶自 己語(yǔ)音還是源于其它聲音源。該方法的優(yōu)點(diǎn)在于直混比(DtoR)允許對(duì) 用戶自己語(yǔ)音非??煽康臋z測(cè)。根據(jù)本發(fā)明的優(yōu)選實(shí)施例,當(dāng)從信號(hào)能量的包絡(luò)確定了直混比 (DtoR)時(shí),利用本方法可以基于來(lái)自一個(gè)麥克風(fēng)的信號(hào)識(shí)別用戶自己 的語(yǔ)音。利用直混比(DtoR),通過(guò)將直混比與自己語(yǔ)音閾值進(jìn)行比較來(lái)評(píng) 定聲音是源自近場(chǎng)聲音源(用戶自己語(yǔ)音)還是源自遠(yuǎn)場(chǎng)聲音源,其 中所述自己語(yǔ)音閾值可以通過(guò)預(yù)先進(jìn)行試驗(yàn),從而根據(jù)經(jīng)驗(yàn)來(lái)確定。通過(guò)單獨(dú)確定多個(gè)頻帶中的直混比并基于該多個(gè)頻帶的直混比 評(píng)定聲音是否源自用戶自己語(yǔ)音可以實(shí)現(xiàn)在聽(tīng)覺(jué)儀器系統(tǒng)中檢測(cè)用 戶自己語(yǔ)音的更可靠的方法。如果基于直混比(DtoR)與所記錄的聲音的其它特征的組合來(lái)評(píng) 定聲音是否源自用戶自己語(yǔ)音,則自己語(yǔ)音檢測(cè)與僅基于直混比進(jìn)行 檢測(cè)的情況相比具有更準(zhǔn)確的優(yōu)點(diǎn)。
通過(guò)以下結(jié)合附圖對(duì)優(yōu)選實(shí)施例的說(shuō)明,本領(lǐng)域的技術(shù)人員將更 容易理解本發(fā)明。在附圖中-圖l示出當(dāng)源和接收器間隔幾米時(shí)的混響聲學(xué)環(huán)境的反射圖的典型情況;圖2示出當(dāng)源和接收器靠在一起時(shí)的混響聲學(xué)環(huán)境的反射圖的典型情況;圖3是根據(jù)本發(fā)明的聽(tīng)覺(jué)儀器系統(tǒng)中識(shí)別用戶自己語(yǔ)音的方法的 優(yōu)選實(shí)施例的流程圖;以及圖4是根據(jù)本發(fā)明的聽(tīng)覺(jué)儀器系統(tǒng)的優(yōu)選實(shí)施例的示意性框圖。
具體實(shí)施方式
在圖1中,示出了存在反射面的聲學(xué)環(huán)境的反射圖。該直達(dá)聲音 la的能量水平與包含早期反射2a和晚期混響3a的混響尾部的能量水 平之間的所謂直混比(DtoR)對(duì)于聲音源和聲音接收器間隔幾米的情 況是典型的。如果接收器是聽(tīng)覺(jué)儀器麥克風(fēng)而源是說(shuō)話對(duì)方的語(yǔ)音, 則是這種情況。圖2示出聲音源是聽(tīng)覺(jué)儀器佩戴者自己語(yǔ)音的情況。附圖標(biāo)記lb 表示直達(dá)聲音,附圖標(biāo)記2b表示早期反射,附圖標(biāo)記3b表示晚期混響。 顯然,直混比(DtoR)與聲音源和聲音接收器間隔幾米的情況中的直混 比(DtoR)根本不同。圖2情況中的直混比(DtoR)比圖l情況中的直混比 (DtoR)高許多。在聽(tīng)覺(jué)儀器系統(tǒng)中識(shí)別用戶自己語(yǔ)音的方法是基于發(fā)現(xiàn)聲音信 號(hào)的直混比(DtoR)在聲音源自近場(chǎng)源的情況,如用戶的自己語(yǔ)音,比聲音源自遠(yuǎn)場(chǎng)源的情況更高。圖3示出根據(jù)本發(fā)明優(yōu)選實(shí)施例的聽(tīng)覺(jué)儀器系統(tǒng)中識(shí)別用戶自己語(yǔ)音的方法的基本步驟。在第一步S1中,記錄聲音信號(hào)。在接下來(lái)的第二步S2中,將所記錄的聲音信號(hào)劃分成多個(gè)頻帶。在第三步S3中,確定每個(gè)頻帶中短時(shí) 間間隔例如20ms內(nèi)的信號(hào)能量,以獲得信號(hào)能量的包絡(luò)。在第四步S4 中,識(shí)別每個(gè)頻帶中的允許可靠估計(jì)直混比(DtoR)的有用聲音事件。 這是通過(guò)在例如700ms的連續(xù)片斷中檢查所確定的包絡(luò)來(lái)實(shí)現(xiàn)的。由 此檢查每個(gè)連續(xù)片斷是否包含足夠陡的開(kāi)始(對(duì)應(yīng)于直達(dá)聲音la,lb) 和足夠持續(xù)時(shí)間的近似指數(shù)衰減的尾部(對(duì)應(yīng)于混響聲音2a, 3a, 2b, 3b)。因此,所識(shí)別出的有用聲音事件包含直達(dá)聲音部分和混響聲音部分。在步驟S5中,將步驟S4中識(shí)別出的聲音事件按每個(gè)頻帶劃分成 直達(dá)聲音部分和混響聲音部分。在步驟S6中,按每個(gè)頻帶計(jì)算直達(dá)聲 音部分的信號(hào)能量(la; lb)和混響聲音部分的信號(hào)能量(2a, 3a; 2b, 3b)之間的直混比(DtoR)。然后,在接下來(lái)的步驟S7中,將所有不同 頻帶的各直混比(DtoR)組合成單個(gè)最終的直混比(組合后的直混比)。 在此,組合后的直混比可以例如是子頻帶直混比的平均。在步驟S8 中,將組合后的直混比與自己語(yǔ)音閾值進(jìn)行比較,其中,自己語(yǔ)音閾 值是在試驗(yàn)中按經(jīng)驗(yàn)確定的。如果組合后的直混比超過(guò)自己語(yǔ)音閾 值,則判定所記錄的聲音信號(hào)是用戶自己語(yǔ)音。否則,判定所記錄的 聲音信號(hào)不是用戶自己語(yǔ)音。如果判定所記錄的聲音信號(hào)是用戶自己語(yǔ)音,則在將處理后的聲 音輸出給用戶之前,在聽(tīng)覺(jué)儀器中啟動(dòng)單獨(dú)和專用信號(hào)處理。在修改的實(shí)施例中,識(shí)別用戶自己語(yǔ)音的方法可以結(jié)合其它自己 語(yǔ)音檢測(cè)器以獲得更準(zhǔn)確的最終自己語(yǔ)音檢測(cè)器輸出。與其它自己語(yǔ) 音檢測(cè)器的結(jié)合可以這樣進(jìn)行對(duì)每個(gè)評(píng)定所記錄的聲音信號(hào)是用戶 自己語(yǔ)音的自己語(yǔ)音檢測(cè)器設(shè)置標(biāo)志。在此情況下,如果設(shè)置了預(yù)定 數(shù)量的標(biāo)志,則最終自己語(yǔ)音檢測(cè)器輸出確定所記錄的聲音信號(hào)是用 戶自己語(yǔ)音。由于從信號(hào)能量的包絡(luò)確定直混比(DtoR)包含一秒量級(jí) 的延遲這一事實(shí),因此優(yōu)選將本發(fā)明與現(xiàn)有技術(shù)中已知的其它更快的自己語(yǔ)音檢測(cè)器相結(jié)合。這樣,可以將基于直混比的自己語(yǔ)音檢測(cè)的 可靠性與其它低可靠方法檢測(cè)的高速度相結(jié)合。下面,參照?qǐng)D4說(shuō)明用于執(zhí)行上述方法的聽(tīng)覺(jué)儀器系統(tǒng)。 可以執(zhí)行上述方法的聽(tīng)覺(jué)儀器系統(tǒng)20包括麥克風(fēng)4、連接到麥克 風(fēng)4的A/D轉(zhuǎn)換器5、輸入連接到A/D轉(zhuǎn)換器5的輸出的數(shù)字信號(hào)處理單 元6、輸入連接到數(shù)字信號(hào)處理單元6的輸出的D/A轉(zhuǎn)換器7、以及連接 到D/A轉(zhuǎn)換器7的輸出的揚(yáng)聲器8。數(shù)字信號(hào)處理單元6包括頻帶過(guò)濾器 9、隨機(jī)存取存儲(chǔ)器(RAM)IO、只讀存儲(chǔ)器(R0M)11以及中央處理單元 (CPU)12。麥克風(fēng)4是用于記錄聲音信號(hào)的裝置,頻帶過(guò)濾器9是用于將所記錄的聲音信號(hào)劃分為多個(gè)頻帶的裝置,CPU12、 RAM10以及R0M11是用 于確定短時(shí)間間隔內(nèi)的信號(hào)能量的裝置、用于識(shí)別有用聲音事件的裝 置、用于將聲音事件劃分為直達(dá)部分和混響部分(la, 2a, 3a; lb, 2b, 3b)的裝置、用于計(jì)算每個(gè)頻帶的直混比(DtoR)的裝置、用于將子頻 帶直混比組合為最終組合后的直混比的裝置、以及用于比較組合后的 直混比(組合后的DtoR)與自己語(yǔ)音閾值以確定所記錄的聲音是否源 于用戶自己語(yǔ)音的裝置。聽(tīng)覺(jué)儀器系統(tǒng)可以是助聽(tīng)器,例如耳內(nèi)式(ITE)助聽(tīng)器、深耳道 式(CIC)助聽(tīng)器、耳后式(BTE)助聽(tīng)器或者耳內(nèi)接收器(RITE)助聽(tīng)器??梢詫?duì)本發(fā)明的上述優(yōu)選實(shí)施例進(jìn)行修改。例如,說(shuō)明了將所記 錄的聲音信號(hào)劃分為多個(gè)頻帶并計(jì)算每個(gè)頻帶的直混比(DtoR)。然而,只在一個(gè)寬頻帶中也可以實(shí)現(xiàn)本發(fā)明的自己語(yǔ)音檢測(cè)。上述聽(tīng)覺(jué) 儀器系統(tǒng)使用數(shù)字信號(hào)處理。然而,也可以使用聲音信號(hào)的模擬處理。
權(quán)利要求
1. 一種用于在聽(tīng)覺(jué)儀器系統(tǒng)(20)中識(shí)別用戶自己語(yǔ)音的方法,其特征在于包括以下步驟確定至少一部分所記錄的聲音的直達(dá)聲音部分的信號(hào)能量和混響聲音部分的信號(hào)能量之間的直混比;以及基于所述直混比評(píng)定所述聲音是否源自用戶自己的語(yǔ)音。
2. 根據(jù)權(quán)利要求l所述的方法,其特征在于評(píng)定所述聲音是否 源自所述用戶自己語(yǔ)音的步驟包括以下步驟比較所述直混比與自己語(yǔ)音閾值,以及如果所述直混比超過(guò)所述自己語(yǔ)音閾值,則評(píng)定所記錄的聲音源 自所述用戶自己語(yǔ)音。
3. 根據(jù)權(quán)利要求l所述的方法,其特征在于 所述方法進(jìn)一步包括將所記錄的聲音劃分為多個(gè)頻帶的步驟; 確定所述多個(gè)頻帶中的每一個(gè)的所述直達(dá)聲音部分的信號(hào)能量和所述混響聲音部分的信號(hào)能量之間的直混比;以及基于所述多個(gè)頻帶的直混比來(lái)評(píng)定所記錄的聲音是否源自所述 用戶自己的語(yǔ)音。
4. 根據(jù)權(quán)利要求3所述的方法,其特征在于評(píng)定所述聲音是否 源自所述用戶自己語(yǔ)音的步驟包括以下步驟組合所確定的所述多個(gè)頻帶中的每一個(gè)的直混比,以獲得組合后 的直混比;比較所述組合后的直混比和自己語(yǔ)音閾值;以及 如果所述組合后的直混比超過(guò)自己語(yǔ)音閾值,則評(píng)定所記錄的聲 音源自所述用戶自己語(yǔ)音。
5. 根據(jù)權(quán)利要求1 4任一所述的方法,其特征在于確定所述 直混比包括以下步驟確定短時(shí)間間隔內(nèi)的聲音信號(hào)能量以獲得這些間隔的信號(hào)能量 包絡(luò);從這些間隔的信號(hào)能量的包絡(luò)計(jì)算所述直混比。
6. 根據(jù)權(quán)利要求5所述的方法,其特征在于評(píng)定所述聲音源于 所述用戶自己語(yǔ)音是基于所述直混比與所記錄的聲音的其它特征的 組合。
7. 根據(jù)權(quán)利要求6所述的方法,其特征在于所述方法進(jìn)一步包 括在所記錄的聲音中識(shí)別允許可靠估計(jì)所述直混比的聲音事件的步 驟。
8. —種包括自己語(yǔ)音檢測(cè)器的聽(tīng)覺(jué)儀器系統(tǒng),其特征在于所 述自己語(yǔ)音檢測(cè)器包括確定裝置,用于確定至少一部分所記錄的聲音的直達(dá)聲音部分的 信號(hào)能量和混響聲音部分的信號(hào)能量之間的直混比;以及評(píng)定裝置,用于基于所述直混比來(lái)評(píng)定所記錄的聲音是否源自所 述用戶自己語(yǔ)音。
9. 根據(jù)權(quán)利要求8所述的聽(tīng)覺(jué)儀器系統(tǒng),其特征在于所述評(píng)定裝置被配置成比較所述直混比與自己語(yǔ)音閾值,如果所述直混比超過(guò) 所述自己語(yǔ)音閾值,則評(píng)定所記錄的聲音源自所述用戶自己語(yǔ)音。
10. 根據(jù)權(quán)利要求8所述的聽(tīng)覺(jué)儀器系統(tǒng),其特征在于所述聽(tīng)覺(jué)儀器系統(tǒng)進(jìn)一步包括用于將所述聲音事件劃分為不同頻帶的劃分裝置;所述確定裝置確定每個(gè)頻帶的所述直混比;以及 所述評(píng)定裝置基于每個(gè)頻帶的所述直混比來(lái)評(píng)定所記錄的聲音事件是否源自所述用戶自己語(yǔ)音。
11. 根據(jù)權(quán)利要求10所述的聽(tīng)覺(jué)儀器系統(tǒng),其特征在于所述評(píng)定裝置被配置成用于組合所確定的所述多個(gè)頻帶中的每一個(gè)的直混 比以獲得組合后的直混比,比較所述組合后的直混比和自己語(yǔ)音閾值;如果所述組合后的直混比超過(guò)自己語(yǔ)音閾值,則評(píng)定所記錄的聲 音源自所述用戶自己語(yǔ)音。
12. 根據(jù)權(quán)利要求8 11中任一項(xiàng)所述的聽(tīng)覺(jué)儀器系統(tǒng),其特征在于組合裝置將所述評(píng)定裝置的輸出與其它自己語(yǔ)音檢測(cè)器的輸出進(jìn)行組合以獲得關(guān)于所記錄的聲音是否源于所述用戶自己語(yǔ)音的更準(zhǔn)確的判斷。
13. 根據(jù)權(quán)利要求12所述的聽(tīng)覺(jué)儀器系統(tǒng),其特征在于所述確 定裝置被配置成用于確定短時(shí)間間隔內(nèi)的聲音信號(hào)能量以獲得這些 間隔的信號(hào)能量的包絡(luò)并且用于從這些間隔的信號(hào)能量的包絡(luò)計(jì)算 所述直混比。
14. 根據(jù)權(quán)利要求13所述的聽(tīng)覺(jué)儀器系統(tǒng),其特征在于進(jìn)一步 包括識(shí)別裝置,所述識(shí)別裝置用于在所記錄的聲音中識(shí)別允許可靠估 計(jì)所述直混比的聲音事件。
全文摘要
本發(fā)明提供一種在聽(tīng)覺(jué)儀器系統(tǒng)中識(shí)別用戶自己語(yǔ)音的方法以及用于執(zhí)行該方法的聽(tīng)覺(jué)儀器系統(tǒng),其中至少一部分所記錄的聲音的直達(dá)聲音部分的信號(hào)能量(1a;1b)和混響聲音部分的信號(hào)能量(2a,3a;2b,3b)之間的直混比(DtoR)被用于評(píng)定該聲音是否源于用戶自己語(yǔ)音。這允許在聽(tīng)覺(jué)儀器系統(tǒng)中非??煽康貦z測(cè)用戶自己語(yǔ)音。此外,還提供一種包含用于執(zhí)行該方法的自己語(yǔ)音檢測(cè)器的聽(tīng)覺(jué)儀器系統(tǒng)。
文檔編號(hào)G10L21/02GK101242684SQ20071014014
公開(kāi)日2008年8月13日 申請(qǐng)日期2007年8月6日 優(yōu)先權(quán)日2007年2月6日
發(fā)明者瑟倫·勞格森 申請(qǐng)人:奧迪康有限公司