亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

單耳語(yǔ)音可懂度預(yù)測(cè)單元、助聽(tīng)器及雙耳聽(tīng)力系統(tǒng)的制作方法

文檔序號(hào):11549038閱讀:333來(lái)源:國(guó)知局
單耳語(yǔ)音可懂度預(yù)測(cè)單元、助聽(tīng)器及雙耳聽(tīng)力系統(tǒng)的制造方法與工藝

本申請(qǐng)涉及助聽(tīng)器領(lǐng)域。本發(fā)明具體涉及用于預(yù)測(cè)語(yǔ)音的可懂度的信號(hào)處理方法,其例如為與普通聽(tīng)者(一群具有類似聽(tīng)力曲線的聽(tīng)者)能夠從一些語(yǔ)音材料理解的話語(yǔ)的一部分高度相關(guān)的指數(shù)。



背景技術(shù):

對(duì)于例如因噪聲或回響而失真及可能已通過(guò)一些信號(hào)處理裝置如助聽(tīng)器的語(yǔ)音信號(hào),其可懂度降低。因此,需要預(yù)測(cè)這樣的語(yǔ)音信號(hào)的可懂度的解決方案以便采取相應(yīng)措施提高用戶的聽(tīng)音質(zhì)量。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明提供下述問(wèn)題的解決方案:

1、有噪聲/處理后的語(yǔ)音信號(hào)的單耳、非侵入可懂度預(yù)測(cè);

2、有噪聲/處理后的語(yǔ)音信號(hào)的雙耳、非侵入可懂度預(yù)測(cè);

3、有噪聲語(yǔ)音信號(hào)的單耳和雙耳可懂度增強(qiáng)。

單耳語(yǔ)音可懂度預(yù)測(cè)單元

在本申請(qǐng)的一方面,提供單耳語(yǔ)音可懂度預(yù)測(cè)單元,其適于接收包括目標(biāo)語(yǔ)音信號(hào)的純凈或有噪聲和/或處理后的版本的信息信號(hào)x。單耳語(yǔ)音可懂度預(yù)測(cè)單元配置成將該信息信號(hào)的語(yǔ)音可懂度預(yù)測(cè)值d提供為輸出。所述語(yǔ)音可懂度預(yù)測(cè)單元包括:

-輸入單元,用于提供信息信號(hào)x的時(shí)頻表示x(k,m),其中k為頻率窗口指數(shù),k=1,2,…,k,及m為時(shí)間指數(shù);

-包絡(luò)提取單元,用于提供信息信號(hào)x的時(shí)頻子頻帶表示xj(m),其表示所述信息信號(hào)的子頻帶信號(hào)xj(m)的時(shí)域包絡(luò)或其函數(shù),其中j為子頻帶指數(shù),j=1,2,…,j,及m為時(shí)間指數(shù);

-時(shí)頻段分開(kāi)單元,用于將信息信號(hào)x的時(shí)頻子頻帶表示xj(m)分為對(duì)應(yīng)于子頻帶信號(hào)的n個(gè)連續(xù)樣本的時(shí)頻段xm;

-段估計(jì)單元,用于分別在時(shí)頻段xm或者其規(guī)格化和/或變換版本之中估計(jì)實(shí)質(zhì)上無(wú)噪聲的時(shí)頻段sm或者其規(guī)格化和/或變換版本

-中間語(yǔ)音可懂度計(jì)算單元,適于提供估計(jì)所述時(shí)頻段xm的可懂度的中間語(yǔ)音可懂度系數(shù)dm,所述中間語(yǔ)音可懂度系數(shù)dm基于估計(jì)的實(shí)質(zhì)上無(wú)噪聲的時(shí)頻段sm或者其規(guī)格化和/或變換版本及基于時(shí)頻段xm或者其規(guī)格化和/或變換版本

-最終語(yǔ)音可懂度計(jì)算單元,用于計(jì)算估計(jì)信息信號(hào)x的可懂度的最終語(yǔ)音可懂度預(yù)測(cè)值d,其通過(guò)隨時(shí)間組合所述中間語(yǔ)音可懂度系數(shù)dm或其變換版本進(jìn)行,例如求平均或者應(yīng)用min或max函數(shù)。

在實(shí)施例中,輸入單元配置成將信息信號(hào)x接收為時(shí)變(時(shí)域/全帶)信號(hào)x(n),n為時(shí)間指數(shù)。在實(shí)施例中,輸入單元配置成從另一單元或裝置按時(shí)頻表示x(k,m)接收信息信號(hào)x,k和m分別為頻率指數(shù)和時(shí)間指數(shù)。在實(shí)施例中,輸入單元包括頻率分解單元,用于從信息信號(hào)的時(shí)域版本x(n)提供信息信號(hào)x的時(shí)頻表示x(k,m),n為時(shí)間指數(shù)。在實(shí)施例中,頻率分解單元包括帶通濾波器組(如γ單音濾波器組)或者適于實(shí)施傅里葉變換算法(如短時(shí)傅里葉變換(stft)算法)。在實(shí)施例中,輸入單元包括包絡(luò)提取單元,用于從信息信號(hào)x的所述時(shí)頻表示x(k,m)提取包括信息信號(hào)的j個(gè)子頻帶的時(shí)域包絡(luò)xj(m)(j=1,2,…,j)。在實(shí)施例中,包絡(luò)提取單元包括用于實(shí)施希爾伯特變換的算法或者用于對(duì)復(fù)值stft信號(hào)x(k,m)的量值進(jìn)行低通濾波的算法等。在實(shí)施例中,時(shí)頻段分開(kāi)單元配置成將時(shí)頻表示xj(m)分為對(duì)應(yīng)于所選如全部子頻帶信號(hào)xj(m),j=1,2,…,j的n個(gè)連續(xù)樣本的時(shí)頻段。例如,第m個(gè)時(shí)頻段xm由jxn矩陣定義:

在實(shí)施例中,單耳語(yǔ)音可懂度預(yù)測(cè)單元包括規(guī)格化和/或變換單元,適于提供所述時(shí)頻段xm的規(guī)格化和/或變換版本

在實(shí)施例中,規(guī)格化和/或變換單元配置成將一個(gè)或多個(gè)行和/或列規(guī)格化和/或變換算法應(yīng)用于時(shí)頻段sm和/或xm。在實(shí)施例中,規(guī)格化和/或變換單元配置成提供時(shí)頻段sm和/或xm的行和/或列的規(guī)格化和/或變換運(yùn)算。

在實(shí)施例中,單耳語(yǔ)音可懂度預(yù)測(cè)單元包括規(guī)格化和變換單元,其配置成提供時(shí)頻段sm和xm的行和列的規(guī)格化和/或變換,其中行的規(guī)格化和/或變換包括至少一下述運(yùn)算:r1)行的均值規(guī)格化;r2)行的單位范數(shù)規(guī)格化;r3)行的傅里葉變換;r4)提供行的傅里葉量值譜;及r5)提供恒等運(yùn)算;及其中列的規(guī)格化和/或變換包括至少一下述運(yùn)算:c1)列的均值規(guī)格化;及c2)列的單位范數(shù)規(guī)格化。

在實(shí)施例中,規(guī)格化和/或變換單元配置成將下述算法的一個(gè)或多個(gè)應(yīng)用于時(shí)頻段xm(或sm):

-r1)行規(guī)格化為零平均值:

其中為j×1向量,其第j'項(xiàng)為x的第j'行(因此中的上標(biāo)r)的平均值,其中1指一的n×1向量,及上標(biāo)t指矩陣轉(zhuǎn)置;

-r2)行規(guī)格化為單位范數(shù):

g2(x)=dr(x)x,

其中及其中x(j,:)指x的第j'行,使得dr(x)為j×j對(duì)角矩陣,在主對(duì)角線上的每一行具有反范數(shù)及在別處為零(上標(biāo)h指厄米變換)。自左乘以dr(x)使得所得矩陣的行規(guī)格化為單位范數(shù);

-r3)對(duì)每一行應(yīng)用傅里葉變換

g3(x)=xf,

其中f為n×n傅里葉矩陣;

-r4)對(duì)每一行應(yīng)用傅里葉變換,之后計(jì)算所得復(fù)值元素的量值

g4(x)=|xf|

其中|·|計(jì)算逐元素量值;

-r5)單位算子

g5(x)=x

-c1)列規(guī)格化為零平均值:

其中為n×1向量,其第i項(xiàng)為x的第i行的平均值,及其中1指一的j×1向量;

-c2)列規(guī)格化為單位范數(shù):

h2(x)=xdc(x),

其中及其中x(:,n)指x的第n行,使得dc(x)為n×n對(duì)角矩陣,在主對(duì)角線上的每一列具有反范數(shù)及在別處為零,自右乘以dc(x)使得所得矩陣的列規(guī)格化為單位范數(shù)。

在實(shí)施例中,單耳語(yǔ)音可懂度預(yù)測(cè)單元包括話音活動(dòng)檢測(cè)單元(vad),用于指明信息信號(hào)的特定時(shí)段是否或者何種程度地包括語(yǔ)音或估計(jì)包括語(yǔ)音,及提供指明該結(jié)果的話音活動(dòng)控制信號(hào)。在實(shí)施例中,話音活動(dòng)檢測(cè)單元配置成提供二元指示,其識(shí)別包括語(yǔ)音或不包括語(yǔ)音的段。在實(shí)施例中,話音活動(dòng)檢測(cè)單元配置成識(shí)別具有某一概率包括語(yǔ)音的段。在實(shí)施例中,話音活動(dòng)檢測(cè)單元適用于時(shí)域信號(hào)(或全帶信號(hào)x(n),n為時(shí)間指數(shù))。在實(shí)施例中,話音活動(dòng)檢測(cè)單元適用于信息信號(hào)的時(shí)頻表示(x(k,m)或xj(m),k和j為頻率指數(shù)(分別對(duì)應(yīng)于窗口和子頻帶),m為時(shí)間指數(shù))或源自其的信號(hào)。在實(shí)施例中,話音活動(dòng)檢測(cè)單元配置成基于時(shí)頻單元電平(或例如在子頻帶信號(hào)xj(m)中)識(shí)別包括語(yǔ)音的時(shí)頻段。在實(shí)施例中,單耳語(yǔ)音可懂度預(yù)測(cè)單元適于從另一單元或裝置接收話音活動(dòng)控制信號(hào)。在實(shí)施例中,單耳語(yǔ)音可懂度預(yù)測(cè)單元適于從另一裝置無(wú)線接收話音活動(dòng)控制信號(hào)。在實(shí)施例中,時(shí)頻段分開(kāi)單元和/或段估計(jì)單元配置成使時(shí)頻段xm或其規(guī)格化和/或變換版本的產(chǎn)生及實(shí)質(zhì)上無(wú)噪聲的時(shí)頻段sm或其規(guī)格化和/或變換版本的估計(jì)量的產(chǎn)生基于話音活動(dòng)控制信號(hào),例如根據(jù)話音活動(dòng)控制信號(hào)產(chǎn)生所述時(shí)頻段(例如在所涉及時(shí)頻段包含語(yǔ)音的概率大于預(yù)定值如0.5時(shí))。

在實(shí)施例中,單耳語(yǔ)音可懂度預(yù)測(cè)單元(如包絡(luò)提取單元)適于將時(shí)域包絡(luò)信號(hào)提取為

其中j=1,…,j和m=1,…,m,及k1(j)和k2(j)指對(duì)應(yīng)于第j個(gè)子頻帶的低和高截止頻率的dft窗口指數(shù),j為子頻帶的數(shù)量,及m為所涉及信號(hào)中的信號(hào)幀的數(shù)量,f(·)為函數(shù)。

在實(shí)施例中,函數(shù)f(·)=f(w),其中w表示該函數(shù)在下述函數(shù)之中選擇或其組合:

-f(w)=w表示恒等;

-f(w)=w2提供功率包絡(luò);

-f(w)=2·logw或f(w)=wβ,0<β<2,使能對(duì)健康耳蝸的壓縮非線性進(jìn)行建模。

在實(shí)施例中,函數(shù)f(·)=f(w),其中w表示該函數(shù)在下述函數(shù)之中選擇或其組合:

-f(w)=w2提供功率包絡(luò);

-f(w)=2·logw或f(w)=wβ,0<β<2,使能對(duì)健康耳蝸的壓縮非線性進(jìn)行建模。

在實(shí)施例中,段估計(jì)單元配置成基于統(tǒng)計(jì)方法從表示信息信號(hào)的時(shí)頻段估計(jì)實(shí)質(zhì)上無(wú)噪聲的時(shí)頻段

在實(shí)施例中,段估計(jì)單元配置成基于源自信息信號(hào)的時(shí)頻段xm或源自其規(guī)格化和/或變換的時(shí)頻段的超向量及基于將信息信號(hào)的超向量映射到表示實(shí)質(zhì)上無(wú)噪聲的(非必須地,規(guī)格化和/或變換的)時(shí)頻段的超向量的估計(jì)的估計(jì)量而估計(jì)實(shí)質(zhì)上無(wú)噪聲的時(shí)頻段sm或其規(guī)格化和/或變換版本在實(shí)施例中,超向量為通過(guò)分別堆放信息信號(hào)的(非必須地,規(guī)格化和/或變換的)時(shí)頻段及實(shí)質(zhì)上無(wú)噪聲的(非必須地,規(guī)格化和/或變換的)時(shí)頻段的列而產(chǎn)生的j·nx1超向量,即

其中j為子頻帶的數(shù)量,n為(非必須地,規(guī)格化和/或變換的)時(shí)頻段的連續(xù)樣本的數(shù)量,(:,n)t指所涉及矩陣的第n列,及t指轉(zhuǎn)置。

在實(shí)施例中,統(tǒng)計(jì)方法包括下述之一或多個(gè):

a)神經(jīng)網(wǎng)絡(luò),例如其中映射r(.)使用監(jiān)督學(xué)習(xí)技術(shù)離線估計(jì);

b)貝葉斯技術(shù),例如其中聯(lián)合概率密度函數(shù)(如)離線估計(jì)并用于提供的估計(jì)量,這些估計(jì)量在統(tǒng)計(jì)意義上最佳,例如在最小均方誤差(mmse)、最大后驗(yàn)(map)或最大概似意義上等;

c)子空間技術(shù)(具有計(jì)算簡(jiǎn)單的潛力)。

在實(shí)施例中,統(tǒng)計(jì)方法包括一類涉及映射r(.)的解決方案,這些映射在觀察數(shù)據(jù)中呈線性。其優(yōu)點(diǎn)在于其為特別(計(jì)算)簡(jiǎn)單的方法,因此很適合便攜(低功率容量)裝置如助聽(tīng)器。

在實(shí)施例中,段估計(jì)單元配置成基于線性估計(jì)量估計(jì)實(shí)質(zhì)上無(wú)噪聲的時(shí)頻段在實(shí)施例中,該線性估計(jì)量在離線程序中(在單耳語(yǔ)音可懂度預(yù)測(cè)單元正常使用之前使用無(wú)噪聲語(yǔ)音信號(hào)的(可能大的)訓(xùn)練集)確定。在實(shí)施例中,(即),其中j·nx1超向量的估計(jì)量,及g為在離線程序中使用無(wú)噪聲語(yǔ)音信號(hào)的訓(xùn)練集估計(jì)的j·nxj·n矩陣。(純凈的)實(shí)質(zhì)上無(wú)噪聲的時(shí)頻段sm的估計(jì)量例如可通過(guò)將超向量的估計(jì)量整形為時(shí)頻段矩陣而找到。

在實(shí)施例中,段估計(jì)單元配置成基于跨源自無(wú)噪聲語(yǔ)音信號(hào)zm的非必需規(guī)格化和/或變換的段的超向量的訓(xùn)練集預(yù)估計(jì)的j·n×j·n樣本相關(guān)矩陣估計(jì)實(shí)質(zhì)上無(wú)噪聲的(非必須地,規(guī)格化和/或變換的)時(shí)頻段

其中,為訓(xùn)練集中的項(xiàng)數(shù)。優(yōu)選地,為示例性純凈語(yǔ)音時(shí)間段的超向量(的一個(gè))。表示典型語(yǔ)音信號(hào)的(粗略)統(tǒng)計(jì)模型。該模型的置信度可通過(guò)增大訓(xùn)練集中的項(xiàng)數(shù)和/或增大訓(xùn)練集中的項(xiàng)的分集而提高。在實(shí)施例中,訓(xùn)練集針對(duì)所涉及應(yīng)用進(jìn)行定制(例如在項(xiàng)數(shù)和/或項(xiàng)的分集方面),例如聚焦于預(yù)期將出現(xiàn)的項(xiàng)。

在實(shí)施例中,中間語(yǔ)音可懂度計(jì)算單元適于例如根據(jù)兩個(gè)kx1向量中的元素的線性樣本相關(guān)系數(shù)d(a,b)確定中間語(yǔ)音可懂度系數(shù)dm:

其中

其中k為向量項(xiàng)的指數(shù),k為向量維數(shù)。

在實(shí)施例中,最終語(yǔ)音可懂度計(jì)算單元適于從中間語(yǔ)音可懂度系數(shù)dm將最終語(yǔ)音可懂度預(yù)測(cè)值d計(jì)算為信息信號(hào)x隨時(shí)間的平均(非必須地,通過(guò)函數(shù)u(dm)進(jìn)行變換):

其中m表示信息信號(hào)x的語(yǔ)音活躍部分的時(shí)間單元的持續(xù)時(shí)間。在實(shí)施例中,信息信號(hào)的語(yǔ)音活躍部分的持續(xù)時(shí)間定義為話音活動(dòng)控制信號(hào)指明信息信號(hào)包括語(yǔ)音的(可能累計(jì)的)時(shí)間段。

助聽(tīng)器

一方面,本發(fā)明提供適于位于用戶的左和右耳之處或之中或者適于完全或部分植入在用戶頭部中的助聽(tīng)器,該助聽(tīng)器包括上面描述的、具體實(shí)施方式中詳細(xì)描述的、圖中所示的及權(quán)利要求中限定的單耳語(yǔ)音可懂度預(yù)測(cè)單元。

在實(shí)施例中,該助聽(tīng)器包括:

-至少一輸入單元,如多個(gè)輸入單元iui,i=1,…,m,m等于或大于2,每一輸入單元配置成提供表示在第i個(gè)輸入單元處接收的聲音輸入的時(shí)變電輸入信號(hào)y’i,該電輸入信號(hào)y’i包括目標(biāo)信號(hào)分量和噪聲信號(hào)分量,目標(biāo)信號(hào)分量源自目標(biāo)信號(hào)源;

-可配置的信號(hào)處理單元,用于處理電輸入信號(hào)及提供處理后的信號(hào)u;

-輸出單元,用于基于電輸出產(chǎn)生配置成可由用戶感知為聲音的輸出刺激,所述電輸出為來(lái)自信號(hào)處理單元的處理后的信號(hào)u或者源自其的信號(hào)的形式;及

-聽(tīng)力損失模型單元,其連接到單耳語(yǔ)音可懂度預(yù)測(cè)單元并配置成應(yīng)用反映用戶的相應(yīng)左或右耳的聽(tīng)力受損的、電輸出信號(hào)的隨頻率而變的修改以向單耳語(yǔ)音可懂度預(yù)測(cè)單元提供信息信號(hào)x。

聽(tīng)力損失模型配置成使得單耳語(yǔ)音可懂度預(yù)測(cè)單元的輸入信號(hào)(如可配置的處理單元的輸出,例如參見(jiàn)圖8a)被修改以反映用戶的聽(tīng)力曲線與正常聽(tīng)力曲線的偏差,例如以反映用戶的聽(tīng)力受損。

在實(shí)施例中,可配置的信號(hào)處理單元適于基于單耳語(yǔ)音可懂度預(yù)測(cè)單元提供的最終語(yǔ)音可懂度預(yù)測(cè)值d控制或影響相應(yīng)電輸入信號(hào)的處理。在實(shí)施例中,可配置的信號(hào)處理單元適于在目標(biāo)信號(hào)分量包括語(yǔ)音時(shí)例如僅在目標(biāo)信號(hào)分量包括語(yǔ)音時(shí)(例如通過(guò)話音(語(yǔ)音)活動(dòng)檢測(cè)器確定)基于最終語(yǔ)音可懂度預(yù)測(cè)值d控制或影響相應(yīng)電輸入信號(hào)的處理。

在實(shí)施例中,助聽(tīng)器適于提供隨頻率而變的增益和/或隨電平而變的壓縮和/或一個(gè)或多個(gè)頻率范圍到一個(gè)或多個(gè)其它頻率范圍的移頻(具有或沒(méi)有頻率壓縮)以補(bǔ)償用戶的聽(tīng)力受損。

在實(shí)施例中,輸出單元包括耳蝸植入物的多個(gè)電極或者骨導(dǎo)助聽(tīng)器的振動(dòng)器。在實(shí)施例中,輸出單元包括輸出變換器。在實(shí)施例中,輸出變換器包括用于將刺激作為聲信號(hào)提供給用戶的接收器(揚(yáng)聲器)。在實(shí)施例中,輸出變換器包括用于將刺激作為顱骨的機(jī)械振動(dòng)提供給用戶的振動(dòng)器(例如在附著到骨頭的或骨錨式助聽(tīng)器中)。

在實(shí)施例中,輸入單元包括用于將輸入聲音轉(zhuǎn)換為電輸入信號(hào)的輸入變換器。在實(shí)施例中,輸入單元包括用于接收包括聲音的無(wú)線信號(hào)并提供表示所述聲音的電輸入信號(hào)的無(wú)線接收器。在實(shí)施例中,助聽(tīng)器包括定向傳聲器系統(tǒng),其適于增強(qiáng)佩戴助聽(tīng)器的用戶的局部環(huán)境中的多個(gè)聲源之中的目標(biāo)聲源。在實(shí)施例中,定向系統(tǒng)適于檢測(cè)(如自適應(yīng)檢測(cè))傳聲器信號(hào)的特定部分源自哪一方向。

在實(shí)施例中,助聽(tīng)器包括用于從另一裝置如通信裝置或另一助聽(tīng)器無(wú)線接收直接電輸入信號(hào)的天線和收發(fā)器電路??偟膩?lái)說(shuō),由助聽(tīng)器的天線和收發(fā)器電路建立的無(wú)線鏈路可以是任何類型。在實(shí)施例中,無(wú)線鏈路在功率受限制的條件下使用,例如因?yàn)橹?tīng)器包括便攜(通常電池驅(qū)動(dòng)的)裝置。

在實(shí)施例中,助聽(tīng)器包括輸入變換器(傳聲器系統(tǒng)和/或直接電輸入(如無(wú)線接收器))和輸出變換器之間的正向或信號(hào)通路。在實(shí)施例中,信號(hào)處理單元位于該正向通路中。在實(shí)施例中,信號(hào)處理單元適于根據(jù)用戶的特定需要提供隨頻率而變的增益。在實(shí)施例中,助聽(tīng)器包括具有用于分析輸入信號(hào)(如確定電平、調(diào)制、信號(hào)類型、聲反饋估計(jì)量等)的功能件的分析通路。在實(shí)施例中,分析通路和/或信號(hào)通路的部分或所有信號(hào)處理在頻域進(jìn)行。在實(shí)施例中,分析通路和/或信號(hào)通路的部分或所有信號(hào)處理在時(shí)域進(jìn)行。

在實(shí)施例中,助聽(tīng)器包括模數(shù)(ad)轉(zhuǎn)換器以按預(yù)定的采樣速率如20khz對(duì)模擬輸入進(jìn)行數(shù)字化。在實(shí)施例中,助聽(tīng)器包括數(shù)模(da)轉(zhuǎn)換器以將數(shù)字信號(hào)轉(zhuǎn)換為模擬輸出信號(hào),例如用于經(jīng)輸出變換器呈現(xiàn)給用戶。

在實(shí)施例中,助聽(tīng)器包括多個(gè)檢測(cè)器,其配置成提供與助聽(tīng)器的當(dāng)前網(wǎng)絡(luò)環(huán)境(如當(dāng)前聲環(huán)境)有關(guān)、和/或與佩戴助聽(tīng)器的用戶的當(dāng)前狀態(tài)有關(guān)、和/或與助聽(tīng)器的當(dāng)前狀態(tài)或運(yùn)行模式有關(guān)的狀態(tài)信號(hào)。作為備選或另外,一個(gè)或多個(gè)檢測(cè)器可形成與助聽(tīng)器(如無(wú)線)通信的外部裝置的一部分。外部裝置例如可包括另一助聽(tīng)器、遙控器、音頻傳輸裝置、電話(如智能電話)、外部傳感器等。在實(shí)施例中,多個(gè)檢測(cè)器中的一個(gè)或多個(gè)對(duì)全帶信號(hào)起作用(時(shí)域)。在實(shí)施例中,多個(gè)檢測(cè)器中的一個(gè)或多個(gè)對(duì)頻帶拆分的信號(hào)起作用((時(shí)-)頻域)。

在實(shí)施例中,助聽(tīng)器還包括用于所涉及應(yīng)用的其它適宜功能,如壓縮、降噪、反饋減少等。

單耳語(yǔ)音可懂度預(yù)測(cè)單元的應(yīng)用

此外,本發(fā)明提供上面描述的、“具體實(shí)施方式”中詳細(xì)描述的、圖中所示的及權(quán)利要求中限定的單耳語(yǔ)音可懂度預(yù)測(cè)單元在助聽(tīng)器中的應(yīng)用,其用于修改助聽(tīng)器中的信號(hào)處理以增強(qiáng)通過(guò)助聽(tīng)器呈現(xiàn)給用戶的語(yǔ)音信號(hào)的可懂度。

提供單耳語(yǔ)音可懂度預(yù)測(cè)器的方法

另一方面,提供一種提供單耳語(yǔ)音可懂度預(yù)測(cè)器的方法,所述預(yù)測(cè)器用于估計(jì)用戶理解包括目標(biāo)語(yǔ)音信號(hào)的純凈或有噪聲和/或處理后版本的信息信號(hào)x的能力。該方法包括:

-提供信息信號(hào)x的時(shí)頻表示x(k,m),其中k為頻率窗口指數(shù),k=1,2,…,k,及m為時(shí)間指數(shù);

-提取所述時(shí)頻表示x(k,m)的時(shí)域包絡(luò),從而提供信息信號(hào)x的表示時(shí)域包絡(luò)的時(shí)頻子頻帶表示xj(m)或其函數(shù),其為子頻帶信號(hào)xj(m)的形式,其中j為子頻帶指數(shù),j=1,2,…,j,及m為時(shí)間指數(shù);

-將信息信號(hào)x的時(shí)頻子頻帶表示xj(m)分為對(duì)應(yīng)于子頻帶信號(hào)的n個(gè)連續(xù)樣本的時(shí)頻段xm;

-分別在時(shí)頻段xm或者其規(guī)格化和/或變換版本之中估計(jì)實(shí)質(zhì)上無(wú)噪聲的時(shí)頻段sm或者其規(guī)格化和/或變換版本

-提供估計(jì)所述時(shí)頻段xm的可懂度的中間語(yǔ)音可懂度系數(shù)dm,所述中間語(yǔ)音可懂度系數(shù)dm基于估計(jì)的實(shí)質(zhì)上無(wú)噪聲的時(shí)頻段sm或者其規(guī)格化和/或變換版本及基于時(shí)頻段xm或者其規(guī)格化和/或變換版本

-計(jì)算估計(jì)信息信號(hào)x的可懂度的最終語(yǔ)音可懂度預(yù)測(cè)值d,其通過(guò)隨時(shí)間組合所述中間語(yǔ)音可懂度系數(shù)dm或其變換版本進(jìn)行,例如求平均,例如組合為單一標(biāo)量值。

當(dāng)由對(duì)應(yīng)的過(guò)程適當(dāng)代替時(shí),上面描述的、“具體實(shí)施方式”中詳細(xì)描述的或權(quán)利要求中限定的裝置的部分或所有結(jié)構(gòu)特征可與本發(fā)明方法的實(shí)施結(jié)合,反之亦然。方法的實(shí)施具有與對(duì)應(yīng)裝置一樣的優(yōu)點(diǎn)。

在實(shí)施例中,該方法包括識(shí)別信息信號(hào)的特定時(shí)段是否或者何種程度地包括語(yǔ)音或估計(jì)包括語(yǔ)音。在實(shí)施例中,該方法包括提供識(shí)別包括語(yǔ)音或不包括語(yǔ)音的段的二元指示。在實(shí)施例中,該方法識(shí)別具有某一概率包括語(yǔ)音的段。在實(shí)施例中,該方法基于時(shí)頻單元電平(例如在子頻帶信號(hào)xj(m)中)識(shí)別包括語(yǔ)音的時(shí)頻段。在實(shí)施例中,該方法包括從另一裝置無(wú)線接收話音活動(dòng)控制信號(hào)。

在實(shí)施例中,該方法包括使語(yǔ)音信號(hào)(包括語(yǔ)音的信號(hào))經(jīng)歷聽(tīng)力損失模型從而提供信息信號(hào)x,其中聽(tīng)力損失模型配置成對(duì)受損聽(tīng)覺(jué)系統(tǒng)的缺陷建模。通過(guò)使語(yǔ)音信號(hào)(如圖3a中的信號(hào)y)經(jīng)歷聽(tīng)力損失模型,所得的信息信號(hào)x可用作語(yǔ)音可懂度預(yù)測(cè)器的輸入,從而提供未受助聽(tīng)力受損人員的語(yǔ)音信號(hào)可懂度度量。在實(shí)施例中,聽(tīng)力損失模型為反映普通聽(tīng)力受損用戶的聽(tīng)力受損的廣義模型。在實(shí)施例中,聽(tīng)力損失模型可配置成反映特定用戶的聽(tīng)力受損,例如包括隨頻率而變的聽(tīng)力損失(聽(tīng)覺(jué)閾與正常聽(tīng)力人員的(平均)聽(tīng)覺(jué)閾之間的偏差)。通過(guò)使語(yǔ)音信號(hào)(如圖3d中的信號(hào)y)經(jīng)歷計(jì)劃補(bǔ)償用戶的聽(tīng)力受損的信號(hào)處理及經(jīng)歷聽(tīng)力損失模型,所得的信息信號(hào)x可用作語(yǔ)音可懂度預(yù)測(cè)器的輸入(例如參見(jiàn)圖3d),從而提供受助聽(tīng)力受損人員的語(yǔ)音信號(hào)可懂度度量。這樣的方案例如可用于評(píng)估不同處理算法(和/或處理算法的改進(jìn))對(duì)用戶對(duì)所得信息信號(hào)的(估計(jì)的)可懂度的影響或者用于在線優(yōu)化助聽(tīng)器中的信號(hào)處理(例如參見(jiàn)圖8a)。

在實(shí)施例中,該方法包括向目標(biāo)語(yǔ)音信號(hào)添加噪聲以提供信息信號(hào)x,其用作提供單耳語(yǔ)音可懂度預(yù)測(cè)值的方法的輸入。向信息信號(hào)添加預(yù)定(或變化)量的噪聲可用于以簡(jiǎn)單的方式評(píng)估用戶的聽(tīng)力損失(從而提供聽(tīng)力損失模型的效果)。在實(shí)施例中,目標(biāo)信號(hào)根據(jù)用戶的聽(tīng)力損失如聽(tīng)力圖進(jìn)行修改(例如衰減)。在實(shí)施例中,噪聲被添加到目標(biāo)信號(hào),及該目標(biāo)信號(hào)被衰減以反映用戶的聽(tīng)力損失。

在實(shí)施例中,該方法包括將時(shí)頻表示xj(m)分為對(duì)應(yīng)于所有子頻帶信號(hào)xj(m),j=1,2,…,j的n個(gè)連續(xù)樣本的時(shí)頻段xm。例如,第m個(gè)時(shí)頻段xm由jxn矩陣定義:

在實(shí)施例中,該方法包括提供時(shí)頻段xm的規(guī)格化和/或變換,從而提供規(guī)格化和/或變換的時(shí)頻段在實(shí)施例中,規(guī)格化和/或變換單元配置成將一個(gè)或多個(gè)行和/或列規(guī)格化和/或變換算法應(yīng)用于時(shí)頻段xm。

在實(shí)施例中,該方法包括使得來(lái)自表示信息信號(hào)的時(shí)頻段的、實(shí)質(zhì)上無(wú)噪聲的時(shí)頻段基于統(tǒng)計(jì)方法進(jìn)行估計(jì)。

在實(shí)施例中,該方法包括時(shí)頻段xm或其規(guī)格化和/或變換版本的產(chǎn)生及實(shí)質(zhì)上無(wú)噪聲的時(shí)頻段sm或其規(guī)格化和/或變換版本的估計(jì)量的產(chǎn)生根據(jù)信息信號(hào)的給定時(shí)間段是否或者何種程度地包括語(yǔ)音或估計(jì)包括語(yǔ)音而產(chǎn)生(例如僅在所涉及時(shí)頻段包含語(yǔ)音的概率大于預(yù)定值如0.5時(shí)產(chǎn)生)。

在實(shí)施例中,該方法包括基于由信息信號(hào)的時(shí)頻段xm或其規(guī)格化和/或變換的時(shí)頻段定義的超向量及基于將信息信號(hào)的超向量映射到表示實(shí)質(zhì)上無(wú)噪聲的(非必須地,規(guī)格化和/或變換的)時(shí)頻段的超向量的估計(jì)的估計(jì)量而估計(jì)實(shí)質(zhì)上無(wú)噪聲的時(shí)頻段sm或其規(guī)格化和/或變換版本在實(shí)施例中,超向量為通過(guò)分別堆放信息信號(hào)的(非必須地,規(guī)格化和/或變換的)時(shí)頻段及實(shí)質(zhì)上無(wú)噪聲的(非必須地,規(guī)格化和/或變換的)時(shí)頻段的列而產(chǎn)生的j·nx1超向量,即

其中j為子頻帶的數(shù)量,n為(非必須地,規(guī)格化和/或變換的)時(shí)頻段的連續(xù)樣本的數(shù)量,(:,n)t指所涉及矩陣的第n列,及t指轉(zhuǎn)置。

在實(shí)施例中,該方法包括使得實(shí)質(zhì)上無(wú)噪聲的時(shí)頻段基于線性估計(jì)量進(jìn)行估計(jì)。

在實(shí)施例中,該方法包括提供超向量的估計(jì)量其中j·nx1超向量為表示實(shí)質(zhì)上無(wú)噪聲的(非必須地,規(guī)格化和/或變換的)時(shí)頻段的超向量的估計(jì)量,及其中線性估計(jì)量g為在離線程序中使用無(wú)噪聲語(yǔ)音信號(hào)z(n)(n為時(shí)間指數(shù))的訓(xùn)練集或超向量zm估計(jì)的j·nxj·n矩陣。

在實(shí)施例中,該方法包括使得基于跨無(wú)噪聲語(yǔ)音信號(hào)zm的超向量的訓(xùn)練集預(yù)估計(jì)的j·n×j·n樣本相關(guān)矩陣估計(jì)實(shí)質(zhì)上無(wú)噪聲的(非必須地,規(guī)格化和/或變換的)時(shí)頻段

其中,為訓(xùn)練集中的項(xiàng)數(shù)。相關(guān)矩陣表示典型語(yǔ)音信號(hào)的統(tǒng)計(jì)模型。

在實(shí)施例中,該方法包括計(jì)算j·n×j·n樣本相關(guān)矩陣的本征值分解:

其中為具有降序?qū)嵵当菊髦档膶?duì)角線j·n×j·n矩陣,及其中j·n×j·n矩陣的列為對(duì)應(yīng)的特征向量。

在實(shí)施例中,該方法包括將特征向量矩陣分為兩個(gè)子矩陣:

其中,為具有對(duì)應(yīng)于l<j·n主本征值的特征向量的j·n×l矩陣,及具有其余特征向量作為列。作為例子,l/(j·n)可小于50%,如小于33%,如小于20%。在實(shí)施例中,j·n約為500,及l(fā)約為100(導(dǎo)致為500x100矩陣(主子空間),及為500x400矩陣(次子空間))。

在實(shí)施例中,該方法包括將(j·nxj·n)矩陣g計(jì)算為:

該例子的矩陣g可被認(rèn)為正交投影算子。在該情形下,形成估計(jì)量簡(jiǎn)單地將有噪聲/處理后的超向量正交地投影在由中的列跨越的線性子空間上。作為備選及更一般地,矩陣可由d形式的矩陣代替,其中d為對(duì)角線加權(quán)矩陣。對(duì)角線加權(quán)矩陣d配置成根據(jù)的列的(如估計(jì)的)重要性對(duì)這些列進(jìn)行縮放。

在實(shí)施例中,該方法包括通過(guò)將超向量的估計(jì)量整形為時(shí)頻段矩陣而估計(jì)(純凈的)實(shí)質(zhì)上無(wú)噪聲的時(shí)頻段sm的估計(jì)量

在實(shí)施例中,該方法包括根據(jù)兩個(gè)kx1向量中的元素的樣本相關(guān)系數(shù)d(a,b)確定中間語(yǔ)音可懂度系數(shù)dm:

其中

其中k為向量項(xiàng)的指數(shù),k為向量維數(shù)。

在實(shí)施例中,該方法包括從中間語(yǔ)音可懂度系數(shù)dm將最終語(yǔ)音可懂度預(yù)測(cè)值d計(jì)算為信息信號(hào)x隨時(shí)間的平均(非必須地,通過(guò)函數(shù)u(dm)進(jìn)行變換):

其中m表示信息信號(hào)x的語(yǔ)音活躍部分的時(shí)間單元的持續(xù)時(shí)間。在實(shí)施例中,信息信號(hào)的語(yǔ)音活躍部分的持續(xù)時(shí)間定義為已確定信息信號(hào)的給定時(shí)頻段包括語(yǔ)音的(可能累計(jì)的)時(shí)間段。

(第一)雙耳聽(tīng)力系統(tǒng)

一方面,本發(fā)明還提供包括左和右上面描述的、“具體實(shí)施方式”中詳細(xì)描述的、圖中所示的及權(quán)利要求中限定的助聽(tīng)器的(第一)雙耳聽(tīng)力系統(tǒng)。

在實(shí)施例中,左和右助聽(tīng)器中的每一個(gè)包括用于使能在左和右助聽(tīng)器之間建立通信鏈路并交換信息的天線和收發(fā)器電路。

在實(shí)施例中,該雙耳聽(tīng)力系統(tǒng)還包括雙耳語(yǔ)音可懂度預(yù)測(cè)單元,用于在用戶暴露于聲音輸入時(shí),基于相應(yīng)的左和右助聽(tīng)器的單耳語(yǔ)音可懂度預(yù)測(cè)值dleft,dright,提供預(yù)測(cè)的用戶語(yǔ)音可懂度的最終雙耳語(yǔ)音可懂度度量dbinaural。

在實(shí)施例中,最終雙耳語(yǔ)音可懂度度量dbinaural確定為相應(yīng)的左和右助聽(tīng)器的語(yǔ)音可懂度預(yù)測(cè)值dleft,dright中的最大值:dbinaural=max(dleft,dright)。從而,提供相當(dāng)簡(jiǎn)單的系統(tǒng),從而實(shí)施更好的耳朵方法。在實(shí)施例中,雙耳聽(tīng)力系統(tǒng)適于在用戶檢測(cè)到或選擇非對(duì)稱聽(tīng)音情形時(shí)啟動(dòng)前述方法,例如在講話者主要位于佩戴雙耳聽(tīng)力系統(tǒng)的用戶一側(cè)的情形下,例如當(dāng)坐在車中時(shí)。

在實(shí)施例中,左和右助聽(tīng)器的相應(yīng)的可配置信號(hào)處理單元適于基于所述最終雙耳語(yǔ)音可懂度度量dbinaural控制或影響相應(yīng)的電輸入信號(hào)的處理。在實(shí)施例中,左和右助聽(tīng)器的相應(yīng)的可配置信號(hào)處理單元適于控制或影響相應(yīng)的電輸入信號(hào)的處理以使所述最終雙耳語(yǔ)音可懂度度量dbinaural最大化。

提供雙耳語(yǔ)音可懂度預(yù)測(cè)值的(第一)方法

另一方面,提供一種提供雙耳語(yǔ)音可懂度預(yù)測(cè)值dbinaural的方法,當(dāng)信息在用戶的兩只耳朵處接收時(shí),所述預(yù)測(cè)值用于估計(jì)用戶理解包括目標(biāo)語(yǔ)音信號(hào)的純凈或有噪聲和/或處理后版本的信息信號(hào)x的能力。該方法包括在用戶的左和右耳的每只耳朵處:

-提供信息信號(hào)x的時(shí)頻表示x(k,m),其中k為頻率窗口指數(shù),k=1,2,…,k,及m為時(shí)間指數(shù);

-提取所述時(shí)頻表示x(k,m)的時(shí)域包絡(luò),從而提供信息信號(hào)x的表示時(shí)域包絡(luò)的時(shí)頻子頻帶表示xj(m)或其函數(shù),其為子頻帶信號(hào)xj(m)的形式,其中j為子頻帶指數(shù),j=1,2,…,j,及m為時(shí)間指數(shù);

-將信息信號(hào)x的時(shí)頻子頻帶表示xj(m)分為對(duì)應(yīng)于子頻帶信號(hào)的n個(gè)連續(xù)樣本的時(shí)頻段xm;

-分別在時(shí)頻段xm或者其規(guī)格化和/或變換版本之中估計(jì)實(shí)質(zhì)上無(wú)噪聲的時(shí)頻段sm或者其規(guī)格化和/或變換版本

-提供估計(jì)所述時(shí)頻段xm的可懂度的中間語(yǔ)音可懂度系數(shù)dm,所述中間語(yǔ)音可懂度系數(shù)dm基于估計(jì)的實(shí)質(zhì)上無(wú)噪聲的時(shí)頻段sm或者其規(guī)格化和/或變換版本及基于時(shí)頻段xm或者其規(guī)格化和/或變換版本

-計(jì)算估計(jì)信息信號(hào)x的可懂度的最終語(yǔ)音可懂度預(yù)測(cè)值d,其通過(guò)隨時(shí)間組合所述中間語(yǔ)音可懂度系數(shù)dm或其變換版本進(jìn)行,例如求平均。

藉此,提供相應(yīng)的左和右耳處的相應(yīng)最終單耳語(yǔ)音可懂度預(yù)測(cè)值dleft,dright。該方法還包括:

-基于相應(yīng)的左和右耳處的最終單耳語(yǔ)音可懂度預(yù)測(cè)值dleft,dright計(jì)算最終雙耳語(yǔ)音可懂度度量dbinaural。

在實(shí)施例中,該方法使得最終雙耳語(yǔ)音可懂度度量dbinaural確定為相應(yīng)的左和右耳的語(yǔ)音可懂度預(yù)測(cè)值dleft,dright中的最大值:dbinaural=max(dleft,dright)。

提供雙耳語(yǔ)音可懂度預(yù)測(cè)值的(第二)方法

另一方面,提供一種提供雙耳語(yǔ)音可懂度預(yù)測(cè)值dbinaural的方法,當(dāng)信息在用戶的左和右耳處接收時(shí),所述預(yù)測(cè)值用于估計(jì)用戶理解包括目標(biāo)語(yǔ)音信號(hào)的純凈或有噪聲和/或處理后版本的信息信號(hào)x的能力。該方法包括:

a)提供左耳處接收的信息信號(hào)x的時(shí)頻表示xleft,(k,m),其中k為頻率窗口指數(shù),k=1,2,…,k,及m為時(shí)間指數(shù);

b)提供右耳處接收的信息信號(hào)x的時(shí)頻表示xright,(k,m),其中k為頻率窗口指數(shù),k=1,2,…,k,及m為時(shí)間指數(shù);

c)在每一頻帶(k)中分別提供時(shí)間位移和振幅調(diào)節(jié)的左和右時(shí)頻信號(hào)xleft’(k,m)和xright’(k,m);

d)確定所述左和右時(shí)頻信號(hào)xleft’(k,m)和xright’(k,m)的、使雙耳語(yǔ)音可懂度預(yù)測(cè)值dbinaural最大化的時(shí)間位移和振幅調(diào)節(jié)。

在實(shí)施例中,步驟c)和d)包括:

c)在每一頻帶(k)中分別提供有系統(tǒng)地時(shí)間位移和振幅調(diào)節(jié)的左和右時(shí)頻信號(hào)xleft’(k,m)和xright’(k,m);

d1)使時(shí)間位移和振幅調(diào)節(jié)的左和右時(shí)頻信號(hào)xleft’(k,m)和xright’(k,m)彼此相減以提供所得的差時(shí)頻信號(hào)xec(k,m);

d2)提取所得的差時(shí)頻信號(hào)xec(k,m)的時(shí)域包絡(luò),從而提供所得的差時(shí)頻信號(hào)的時(shí)頻子頻帶表示xec,j(m),j為子頻帶指數(shù),j=1,2,…,j,及m為時(shí)間指數(shù);

d3)將所得的差時(shí)頻信號(hào)的時(shí)頻子頻帶表示xec,j(m)分為對(duì)應(yīng)于子頻帶信號(hào)的n個(gè)連續(xù)樣本的時(shí)頻段xm;

d4)分別在時(shí)頻段xm或者其規(guī)格化和/或變換版本之中估計(jì)實(shí)質(zhì)上無(wú)噪聲的時(shí)頻段sm或者其規(guī)格化和/或變換版本

d5)提供估計(jì)所述時(shí)頻段xm的可懂度的中間語(yǔ)音可懂度系數(shù)dm,所述中間語(yǔ)音可懂度系數(shù)dm基于估計(jì)的實(shí)質(zhì)上無(wú)噪聲的時(shí)頻段sm或者其規(guī)格化和/或變換版本及基于時(shí)頻段xm或者其規(guī)格化和/或變換版本

d6)計(jì)算估計(jì)信息信號(hào)x的可懂度的雙耳語(yǔ)音可懂度預(yù)測(cè)值dbinaural,其通過(guò)隨時(shí)間組合所述中間語(yǔ)音可懂度系數(shù)dm或其變換版本進(jìn)行,例如求平均;

d7)重復(fù)步驟c)-d6)以找到使雙耳語(yǔ)音可懂度預(yù)測(cè)值dbinaural最大化的時(shí)間位移和振幅調(diào)節(jié)。

在實(shí)施例中,該方法包括在步驟d)中,最大化的雙耳語(yǔ)音可懂度預(yù)測(cè)值dbinaural通過(guò)分析或用數(shù)字確定,或者經(jīng)統(tǒng)計(jì)方法確定。

在實(shí)施例中,該方法包括識(shí)別在用戶的左和右耳處接收的信息信號(hào)x的給定時(shí)段是否或者何種程度地包括或者估計(jì)包括語(yǔ)音。識(shí)別在用戶的左和右耳處接收的信息信號(hào)x的給定時(shí)段是否或者何種程度地包括或者估計(jì)包括語(yǔ)音的步驟可在該方法的步驟a)和b)(頻率分解)之前在時(shí)域進(jìn)行。作為備選,其可在頻率分解之后進(jìn)行。優(yōu)選地,提供雙耳語(yǔ)音可懂度預(yù)測(cè)值dbinaural的方法僅在信息信號(hào)的已確定包括語(yǔ)音(例如具有高于某一閾值的概率)的時(shí)間段執(zhí)行。

提供雙耳語(yǔ)音可懂度增強(qiáng)的方法

另一方面,本發(fā)明還提供在雙耳助聽(tīng)器系統(tǒng)中提供雙耳語(yǔ)音可懂度增強(qiáng)的方法,所述雙耳助聽(tīng)器系統(tǒng)包括位于用戶的左和右耳之處或之中或者完全或部分植入在用戶頭部中的左和右助聽(tīng)器。該方法包括:

a)提供l個(gè)(多個(gè))時(shí)變電輸入信號(hào)y’i,i=1,…,l,表示在雙耳助聽(tīng)器系統(tǒng)的第i個(gè)輸入單元處接收的聲音輸入,所述電輸入信號(hào)y’i包括目標(biāo)信號(hào)分量和噪聲信號(hào)分量,所述目標(biāo)信號(hào)分量源自目標(biāo)信號(hào)源,l個(gè)時(shí)變電輸入信號(hào)y’i中的至少一個(gè)在用戶左耳處接收,及l(fā)個(gè)時(shí)變電輸入信號(hào)y’i中的至少另一個(gè)在用戶右耳處接收;

b)處理所述l個(gè)時(shí)變電輸入信號(hào)y’i并提供處理后的左和右信號(hào)uleft,uright;

c)將隨頻率而變的聽(tīng)力損失模型應(yīng)用于處理后的左和右信號(hào)uleft,uright以反映用戶的左和右耳的聽(tīng)力曲線與正常聽(tīng)力曲線之間的偏差從而提供左和右信息信號(hào)xleft,xright;

d)根據(jù)提供雙耳語(yǔ)音可懂度預(yù)測(cè)值dbinaural的(第二)方法,基于所述左和右信息信號(hào)xleft,xright計(jì)算估計(jì)所述聲音輸入的可懂度的雙耳語(yǔ)音可懂度預(yù)測(cè)值dbinaural;

e)調(diào)整步驟b中的處理以使雙耳語(yǔ)音可懂度預(yù)測(cè)值dbinaural最大化。

在實(shí)施例中,該方法包括分別基于處理后的左和右信號(hào)uleft,uright或者源自其的信號(hào)產(chǎn)生輸出刺激,所述輸出刺激配置成可由用戶在左和右耳處感知為聲音。

(第二)雙耳聽(tīng)力系統(tǒng)

一方面,本發(fā)明還提供包括左和右助聽(tīng)器的(第二)雙耳聽(tīng)力系統(tǒng),其配置成執(zhí)行上面描述的、“具體實(shí)施方式”中詳細(xì)描述的、圖中所示的及權(quán)利要求中限定的提供雙耳語(yǔ)音可懂度增強(qiáng)的方法。

計(jì)算機(jī)可讀介質(zhì)

本發(fā)明進(jìn)一步提供保存包括程序代碼的計(jì)算機(jī)程序的有形計(jì)算機(jī)可讀介質(zhì),當(dāng)計(jì)算機(jī)程序在數(shù)據(jù)處理系統(tǒng)上運(yùn)行時(shí),使得數(shù)據(jù)處理系統(tǒng)執(zhí)行上面描述的、“具體實(shí)施方式”中詳細(xì)描述的及權(quán)利要求中限定的任一方法的至少部分(如大部分或所有)步驟。

作為例子但非限制,前述有形計(jì)算機(jī)可讀介質(zhì)可包括ram、rom、eeprom、cd-rom或其他光盤存儲(chǔ)器、磁盤存儲(chǔ)器或其他磁性存儲(chǔ)裝置,或者可用于執(zhí)行或保存指令或數(shù)據(jù)結(jié)構(gòu)形式的所需程序代碼并可由計(jì)算機(jī)訪問(wèn)的任何其他介質(zhì)。如在此使用的,盤包括壓縮磁盤(cd)、激光盤、光盤、數(shù)字多用途盤(dvd)、軟盤及藍(lán)光盤,其中這些盤通常磁性地復(fù)制數(shù)據(jù),同時(shí)這些盤可用激光光學(xué)地復(fù)制數(shù)據(jù)。上述盤的組合也應(yīng)包括在計(jì)算機(jī)可讀介質(zhì)的范圍內(nèi)。除保存在有形介質(zhì)上之外,計(jì)算機(jī)程序也可經(jīng)傳輸介質(zhì)如有線或無(wú)線鏈路或網(wǎng)絡(luò)如因特網(wǎng)進(jìn)行傳輸并載入數(shù)據(jù)處理系統(tǒng)從而在不同于有形介質(zhì)的位置處運(yùn)行。

計(jì)算機(jī)程序

本申請(qǐng)還提供包括指令的計(jì)算機(jī)程序(產(chǎn)品),當(dāng)所述程序由計(jì)算機(jī)運(yùn)行時(shí),使得計(jì)算機(jī)執(zhí)行上面描述的、“具體實(shí)施方式”中詳細(xì)描述的及權(quán)利要求中限定的方法(的步驟)。

數(shù)據(jù)處理系統(tǒng)

一方面,本發(fā)明進(jìn)一步提供數(shù)據(jù)處理系統(tǒng),包括處理器和程序代碼,程序代碼使得處理器執(zhí)行上面描述的、“具體實(shí)施方式”中詳細(xì)描述的及權(quán)利要求中限定的任一方法的至少部分(如大部分或所有)步驟。

聽(tīng)力系統(tǒng)

另一方面,本發(fā)明提供包括上面描述的、“具體實(shí)施方式”中詳細(xì)描述的及權(quán)利要求中限定的助聽(tīng)器及包括輔助裝置的聽(tīng)力系統(tǒng)。

在實(shí)施例中,該聽(tīng)力系統(tǒng)適于在助聽(tīng)器和輔助裝置之間建立通信鏈路以使信息(如控制和狀態(tài)信號(hào),可能音頻信號(hào))能在其間進(jìn)行交換或從一裝置轉(zhuǎn)發(fā)給另一裝置。

在實(shí)施例中,輔助裝置是或包括遙控器,用于控制助聽(tīng)器的功能和運(yùn)行。在實(shí)施例中,遙控器的功能實(shí)施在智能電話中,該智能電話可能運(yùn)行使能經(jīng)智能電話控制音頻處理裝置的功能的app(助聽(tīng)器包括到智能電話的適當(dāng)無(wú)線接口,例如基于藍(lán)牙或一些其它標(biāo)準(zhǔn)化或?qū)S蟹桨?。

app

另一方面,本發(fā)明還提供稱為app的非短暫應(yīng)用。app包括可執(zhí)行指令,其配置成在輔助裝置上運(yùn)行以實(shí)施用于上面描述的、“具體實(shí)施方式”中詳細(xì)描述的及權(quán)利要求中限定的助聽(tīng)器或聽(tīng)力(助聽(tīng)器)系統(tǒng)的用戶接口。在實(shí)施例中,該app配置成在移動(dòng)電話如智能電話或另一使能與所述助聽(tīng)器或聽(tīng)力系統(tǒng)通信的便攜裝置上運(yùn)行。

定義

在本說(shuō)明書(shū)中,“助聽(tīng)器”指適于改善、增強(qiáng)和/或保護(hù)用戶的聽(tīng)覺(jué)能力的裝置如聽(tīng)力儀器或有源耳朵保護(hù)裝置或其它音頻處理裝置,其通過(guò)從用戶環(huán)境接收聲信號(hào)、產(chǎn)生對(duì)應(yīng)的音頻信號(hào)、可能修改該音頻信號(hào)、及將可能已修改的音頻信號(hào)作為可聽(tīng)見(jiàn)的信號(hào)提供給用戶的至少一只耳朵而實(shí)現(xiàn)。“助聽(tīng)器”還指適于以電子方式接收音頻信號(hào)、可能修改該音頻信號(hào)、及將可能已修改的音頻信號(hào)作為聽(tīng)得見(jiàn)的信號(hào)提供給用戶的至少一只耳朵的裝置如頭戴式耳機(jī)或耳麥。聽(tīng)得見(jiàn)的信號(hào)例如可以下述形式提供:輻射到用戶外耳內(nèi)的聲信號(hào)、作為機(jī)械振動(dòng)通過(guò)用戶頭部的骨結(jié)構(gòu)和/或通過(guò)中耳的部分傳到用戶內(nèi)耳的聲信號(hào)、及直接或間接傳到用戶耳蝸神經(jīng)的電信號(hào)。

助聽(tīng)器可構(gòu)造成以任何已知的方式進(jìn)行佩戴,如作為佩戴在耳后的單元(具有將輻射的聲信號(hào)導(dǎo)入耳道內(nèi)的管或者具有安排成靠近耳道或位于耳道中的揚(yáng)聲器)、作為整個(gè)或部分安排在耳廓和/或耳道中的單元、作為連到植入在顱骨內(nèi)的固定結(jié)構(gòu)的單元、或作為整個(gè)或部分植入的單元等。助聽(tīng)器可包括單一單元或幾個(gè)彼此電子通信的單元。

更一般地,助聽(tīng)器包括用于從用戶環(huán)境接收聲信號(hào)并提供對(duì)應(yīng)的輸入音頻信號(hào)的輸入變換器和/或以電子方式(即有線或無(wú)線)接收輸入音頻信號(hào)的接收器、用于處理輸入音頻信號(hào)的(通??膳渲玫?信號(hào)處理電路、及用于根據(jù)處理后的音頻信號(hào)將聽(tīng)得見(jiàn)的信號(hào)提供給用戶的輸出裝置。在一些助聽(tīng)器中,放大器可構(gòu)成信號(hào)處理電路。信號(hào)處理電路通常包括一個(gè)或多個(gè)(集成或單獨(dú)的)存儲(chǔ)元件,用于執(zhí)行程序和/或用于保存在處理中使用(或可能使用)的參數(shù)和/或用于保存適合助聽(tīng)器功能的信息和/或用于保存例如結(jié)合到用戶的接口和/或到編程裝置的接口使用的信息(如處理后的信息,例如由信號(hào)處理電路提供)。在一些助聽(tīng)器中,輸出裝置可包括輸出變換器,例如用于提供空傳聲信號(hào)的揚(yáng)聲器或用于提供結(jié)構(gòu)或液體傳播的聲信號(hào)的振動(dòng)器。在一些助聽(tīng)器中,輸出裝置可包括一個(gè)或多個(gè)用于提供電信號(hào)的輸出電極。

在一些助聽(tīng)器中,振動(dòng)器可適于經(jīng)皮或由皮將結(jié)構(gòu)傳播的聲信號(hào)傳給顱骨。在一些助聽(tīng)器中,振動(dòng)器可植入在中耳和/或內(nèi)耳中。在一些助聽(tīng)器中,振動(dòng)器可適于將結(jié)構(gòu)傳播的聲信號(hào)提供給中耳骨和/或耳蝸。在一些助聽(tīng)器中,振動(dòng)器可適于例如通過(guò)卵圓窗將液體傳播的聲信號(hào)提供到耳蝸液體。在一些助聽(tīng)器中,輸出電極可植入在耳蝸中或植入在顱骨內(nèi)側(cè)上,并可適于將電信號(hào)提供給耳蝸的毛細(xì)胞、一個(gè)或多個(gè)聽(tīng)覺(jué)神經(jīng)、聽(tīng)覺(jué)皮層和/或大腦皮層的其它部分。

“聽(tīng)力系統(tǒng)”指包括一個(gè)或兩個(gè)助聽(tīng)器的系統(tǒng)?!半p耳聽(tīng)力系統(tǒng)”指包括兩個(gè)助聽(tīng)器并適于協(xié)同地向用戶的兩只耳朵提供聽(tīng)得見(jiàn)的信號(hào)的系統(tǒng)。聽(tīng)力系統(tǒng)或雙耳聽(tīng)力系統(tǒng)還可包括一個(gè)或多個(gè)“輔助裝置”,其與助聽(tīng)器通信并影響和/或受益于助聽(tīng)器的功能。輔助裝置例如可以是遙控器、音頻網(wǎng)關(guān)設(shè)備、移動(dòng)電話(如智能電話)、廣播系統(tǒng)、汽車音頻系統(tǒng)或音樂(lè)播放器。助聽(tīng)器、聽(tīng)力系統(tǒng)或雙耳聽(tīng)力系統(tǒng)例如可用于補(bǔ)償聽(tīng)力受損人員的聽(tīng)覺(jué)能力損失、增強(qiáng)或保護(hù)正常聽(tīng)力人員的聽(tīng)覺(jué)能力和/或?qū)㈦娮右纛l信號(hào)傳給人。

附圖說(shuō)明

本發(fā)明的各個(gè)方面將從下面結(jié)合附圖進(jìn)行的詳細(xì)描述得以最佳地理解。為清晰起見(jiàn),這些附圖均為示意性及簡(jiǎn)化的圖,它們只給出了對(duì)于理解本發(fā)明所必要的細(xì)節(jié),而省略其他細(xì)節(jié)。在整個(gè)說(shuō)明書(shū)中,同樣的附圖標(biāo)記用于同樣或?qū)?yīng)的部分。每一方面的各個(gè)特征可與其他方面的任何或所有特征組合。這些及其他方面、特征和/或技術(shù)效果將從下面的圖示明顯看出并結(jié)合其闡明,其中:

圖1a示意性地示出了樣本中的時(shí)變模擬信號(hào)(振幅-時(shí)間)及其數(shù)字化,這些樣本安排在多個(gè)時(shí)間幀中,每一時(shí)間幀包括ns個(gè)樣本。

圖1b示出了圖1a的時(shí)變電信號(hào)的時(shí)頻圖表示。

圖2a象征性地示出了基于信息信號(hào)x的時(shí)頻表示xj(m)提供單耳語(yǔ)音可懂度預(yù)測(cè)值d的單耳語(yǔ)音可懂度預(yù)測(cè)單元。

圖2b示出了單耳語(yǔ)音可懂度預(yù)測(cè)單元的實(shí)施例。

圖3a示出了單耳語(yǔ)音可懂度預(yù)測(cè)單元與聽(tīng)力損失模型和評(píng)估單元的結(jié)合。

圖3b示出了單耳語(yǔ)音可懂度預(yù)測(cè)單元與信號(hào)處理單元和評(píng)估單元的結(jié)合。

圖3c示出了單耳語(yǔ)音可懂度預(yù)測(cè)單元與聽(tīng)力損失模型、信號(hào)處理單元和評(píng)估單元的第一組合。

圖3d示出了單耳語(yǔ)音可懂度預(yù)測(cè)單元與聽(tīng)力損失模型、信號(hào)處理單元和評(píng)估單元的第二組合。

圖4示出了根據(jù)本發(fā)明的單耳語(yǔ)音可懂度預(yù)測(cè)器的實(shí)施例。

圖5a象征性地示出了雙耳語(yǔ)音可懂度預(yù)測(cè)器與聽(tīng)力損失模型結(jié)合。

圖5b示出了根據(jù)本發(fā)明的基于兩個(gè)單耳語(yǔ)音可懂度預(yù)測(cè)器的組合的雙耳語(yǔ)音可懂度預(yù)測(cè)器與聽(tīng)力損失模型結(jié)合的實(shí)施例。

圖6示意性地示出了根據(jù)本發(fā)明的提供非侵入雙耳語(yǔ)音可懂度預(yù)測(cè)值的方法的處理步驟。

圖7示意性地示出了提供侵入雙耳語(yǔ)音可懂度預(yù)測(cè)值dbinaural的方法,其用于調(diào)整雙耳助聽(tīng)器系統(tǒng)的處理以使輸出語(yǔ)音信號(hào)的可懂度最大化。

圖8a示出了根據(jù)本發(fā)明的助聽(tīng)器的實(shí)施例,包括用于估計(jì)輸出信號(hào)的可懂度的單耳語(yǔ)音可懂度預(yù)測(cè)器及使用該預(yù)測(cè)器調(diào)整輸入語(yǔ)音信號(hào)的信號(hào)處理以使單耳語(yǔ)音可懂度預(yù)測(cè)值最大化。

圖8b示出了根據(jù)本發(fā)明的雙耳助聽(tīng)器系統(tǒng)的第一實(shí)施例,包括用于估計(jì)雙耳助聽(tīng)器系統(tǒng)的相應(yīng)左和右輸出信號(hào)的可懂度的雙耳語(yǔ)音可懂度預(yù)測(cè)器及使用該預(yù)測(cè)器調(diào)整包括語(yǔ)音的多個(gè)輸入信號(hào)的雙耳信號(hào)處理以使雙耳語(yǔ)音可懂度預(yù)測(cè)值最大化。

圖8c示出了根據(jù)本發(fā)明的雙耳助聽(tīng)器系統(tǒng)的第二實(shí)施例,包括左和右助聽(tīng)器及用于估計(jì)相應(yīng)的左和右助聽(tīng)器的輸出信號(hào)的可懂度的雙耳語(yǔ)音可懂度預(yù)測(cè)器及使用該預(yù)測(cè)器調(diào)整左和右助聽(tīng)器中的每一個(gè)的包括語(yǔ)音的多個(gè)輸入信號(hào)的信號(hào)處理以使雙耳語(yǔ)音可懂度預(yù)測(cè)值最大化。

圖9示出了形成為耳內(nèi)接收器式(rite)助聽(tīng)器的示例性助聽(tīng)器,包括適于位于耳廓后面的部分及適于位于用戶耳道中的包括輸出變換器(如揚(yáng)聲器/接收器)的部分。

圖10a示出了根據(jù)本發(fā)明的雙耳助聽(tīng)器系統(tǒng),包括第一和第二助聽(tīng)器及輔助裝置。

圖10b示出了包括用戶接口的輔助裝置,用戶接口為用于控制和顯示與語(yǔ)音可懂度預(yù)測(cè)值有關(guān)的數(shù)據(jù)的app的形式。

通過(guò)下面給出的詳細(xì)描述,本發(fā)明進(jìn)一步的適用范圍將顯而易見(jiàn)。然而,應(yīng)當(dāng)理解,在詳細(xì)描述和具體例子表明本發(fā)明優(yōu)選實(shí)施例的同時(shí),它們僅為說(shuō)明目的給出。對(duì)于本領(lǐng)域技術(shù)人員來(lái)說(shuō),基于下面的詳細(xì)描述,本發(fā)明的其它實(shí)施方式將顯而易見(jiàn)。

具體實(shí)施方式

下面結(jié)合附圖提出的具體描述用作多種不同配置的描述。具體描述包括用于提供多個(gè)不同概念的徹底理解的具體細(xì)節(jié)。然而,對(duì)本領(lǐng)域技術(shù)人員顯而易見(jiàn)的是,這些概念可在沒(méi)有這些具體細(xì)節(jié)的情形下實(shí)施。裝置和方法的幾個(gè)方面通過(guò)多個(gè)不同的塊、功能單元、模塊、元件、電路、步驟、處理、算法等(統(tǒng)稱為“元素”)進(jìn)行描述。根據(jù)特定應(yīng)用、設(shè)計(jì)限制或其他原因,這些元素可使用電子硬件、計(jì)算機(jī)程序或其任何組合實(shí)施。

電子硬件可包括微處理器、微控制器、數(shù)字信號(hào)處理器(dsp)、現(xiàn)場(chǎng)可編程門陣列(fpga)、可編程邏輯器件(pld)、選通邏輯、分立硬件電路、及配置成執(zhí)行本說(shuō)明書(shū)中描述的多個(gè)不同功能的其它適當(dāng)硬件。計(jì)算機(jī)程序應(yīng)廣義地解釋為指令、指令集、代碼、代碼段、程序代碼、程序、子程序、軟件模塊、應(yīng)用、軟件應(yīng)用、軟件包、例程、子例程、對(duì)象、可執(zhí)行、執(zhí)行線程、程序、函數(shù)等,無(wú)論是稱為軟件、固件、中間件、微碼、硬件描述語(yǔ)言還是其他名稱。

在本發(fā)明中,可懂度預(yù)測(cè)僅基于有噪聲/處理后的信號(hào),在文獻(xiàn)中,這樣的方法稱為非侵入可懂度預(yù)測(cè)器,例如[1]。非侵入類方法尤其是本發(fā)明的方法與許多其它類的方法相反,其它類的方法還需要無(wú)噪聲和未處理的參考語(yǔ)音信號(hào),因此該類方法稱為侵入方法。

本發(fā)明的核心在于單耳非侵入可懂度預(yù)測(cè)方法,換言之,假定由單一傳聲器拾取的可能通過(guò)助聽(tīng)器系統(tǒng)的一些信號(hào)處理級(jí)的有噪聲語(yǔ)音信號(hào),我們希望估計(jì)其可懂度。在下面文本的第一部分,我們將提供解決該問(wèn)題的新的、一般類的方法的延伸描述。

下面,我們將本發(fā)明延伸到解決雙耳、非侵入可懂度問(wèn)題。進(jìn)行該延伸的原因在于使用兩只耳朵聽(tīng)聲學(xué)場(chǎng)景(即雙耳)在某些情形下相較僅使用一只耳朵(或?qū)⑼瑯拥男盘?hào)呈現(xiàn)給兩只耳朵)可能戲劇性地增大可懂度[5]。

最后,我們將本發(fā)明進(jìn)一步延伸到用于單耳或雙耳語(yǔ)音可懂度增強(qiáng)。在此解決的問(wèn)題為下面的問(wèn)題:假定如由助聽(tīng)器系統(tǒng)的傳聲器拾取的有噪聲/混響的語(yǔ)音信號(hào),處理它們使得它們的可懂度在雙耳地呈現(xiàn)給用戶時(shí)得以提高甚至最大化。

總之,本發(fā)明提出下述問(wèn)題的解決方案:

1、有噪聲/處理后的語(yǔ)音信號(hào)的單耳、非侵入可懂度預(yù)測(cè);

2、有噪聲/處理后的語(yǔ)音信號(hào)的雙耳、非侵入可懂度預(yù)測(cè);

3、有噪聲語(yǔ)音信號(hào)的單耳和雙耳可懂度增強(qiáng)。

本發(fā)明的很多信號(hào)處理在時(shí)頻域進(jìn)行,其中時(shí)域信號(hào)通過(guò)適當(dāng)?shù)臄?shù)學(xué)算法(如傅里葉變換算法)或?yàn)V波器(如濾波器組)變換到(時(shí)-)頻域。

圖1a示意性地示出了樣本中的時(shí)變模擬信號(hào)(振幅-時(shí)間)及其數(shù)字化,這些樣本安排在多個(gè)時(shí)間幀中,每一時(shí)間幀包括ns個(gè)樣本。圖1a示出了模擬電信號(hào)(實(shí)線曲線),例如表示來(lái)自傳聲器的聲輸入信號(hào),其在模數(shù)(ad)轉(zhuǎn)換過(guò)程中轉(zhuǎn)換為數(shù)字音頻信號(hào),在模數(shù)轉(zhuǎn)換過(guò)程中,模擬信號(hào)以預(yù)定采樣頻率或速率fs進(jìn)行采樣,fs例如在從8khz到40khz的范圍中(適應(yīng)應(yīng)用的特定需要),以在離散時(shí)間點(diǎn)n提供數(shù)字樣本x(n),如從時(shí)間軸延伸的在其與所述曲線重合的端點(diǎn)處具有實(shí)心點(diǎn)的垂直線所示,表示在對(duì)應(yīng)的不同時(shí)間點(diǎn)n的數(shù)字樣本值。每一(音頻)樣本x(n)表示通過(guò)預(yù)定數(shù)量(nb)的比特表示聲信號(hào)在n的值,nb例如在從1到16比特的范圍中。數(shù)字樣本x(n)具有1/fs的時(shí)間長(zhǎng)度,例如對(duì)于fs=20khz,該時(shí)間長(zhǎng)度為50μs。多個(gè)(音頻)樣本ns安排在時(shí)間幀中,如圖1a下部示意性圖示的,其中各個(gè)(在此均勻間隔的)樣本按時(shí)間幀分組(1,2,…,ns)。同樣如圖1a的下部圖示的,時(shí)間幀可連續(xù)地安排成非重疊(時(shí)間幀1,2,…,m,…,m)或重疊(在此為50%,時(shí)間幀1,2,…,m,…,m’),其中m為時(shí)間幀指數(shù)。在實(shí)施例中,一時(shí)間幀包括64個(gè)音頻數(shù)據(jù)樣本。根據(jù)實(shí)際應(yīng)用,也可使用其它幀長(zhǎng)度。

圖1b示意性地示出了圖1a的(數(shù)字化)時(shí)變電信號(hào)x(n)的時(shí)頻表示。該時(shí)頻表示包括信號(hào)的對(duì)應(yīng)復(fù)值或?qū)嵵翟谔囟〞r(shí)間和頻率范圍的陣列或映射。該時(shí)頻表示例如可以是將時(shí)變輸入信號(hào)x(n)轉(zhuǎn)換為時(shí)頻域的(時(shí)變)信號(hào)x(k,m)的傅里葉變換的結(jié)果。在實(shí)施例中,傅里葉變換包括離散傅里葉變換算法(dft)。典型聽(tīng)力裝置(如助聽(tīng)器)考慮的從最小頻率fmin到最大頻率fmax的頻率范圍包括從20hz到20khz的典型人聽(tīng)頻范圍的一部分,如從20hz到12khz的范圍的一部分。在圖1b中,信號(hào)x(n)的時(shí)頻表示x(k,m)包括信號(hào)的量值和/或相位在指數(shù)(k,m)確定的多個(gè)dft窗口中的復(fù)值,其中k=1,….,k表示k個(gè)頻率值(參見(jiàn)圖1b中的縱向k軸),及m=1,….,m(m’)表示m(m’)個(gè)時(shí)間幀(參見(jiàn)圖1b中的水平m軸)。時(shí)間幀由特定時(shí)間指數(shù)m和對(duì)應(yīng)的k個(gè)dft窗口確定(參見(jiàn)圖1b中的時(shí)間幀m的指示)。時(shí)間幀m表示信號(hào)x在時(shí)間m的頻譜。包括所涉及信號(hào)的(實(shí)或)復(fù)值x(k,m)的dft窗口(k,m)在圖1b中通過(guò)時(shí)頻圖中對(duì)應(yīng)場(chǎng)的陰影圖示。頻率指數(shù)k的每一值對(duì)應(yīng)于頻率范圍δfk,如圖1b中通過(guò)縱向頻率軸f指明。時(shí)間指數(shù)m的每一值表示時(shí)間幀。連續(xù)時(shí)間指數(shù)跨越的時(shí)間δtm取決于時(shí)間幀的長(zhǎng)度(如25ms)及相鄰時(shí)間幀之間的重疊程度(參見(jiàn)圖1b中的水平t軸)。

在本申請(qǐng)中,定義具有子頻帶指數(shù)j=1,2,…,j的j個(gè)(非均勻)子頻帶,每一子頻帶包括一個(gè)或多個(gè)dft窗口(參見(jiàn)圖1b中的縱向子頻帶j軸)。第j個(gè)子頻帶(由圖1b的右部的子頻帶j(xj(m))指明)包括分別具有低和高指數(shù)k1(j)和k2(j)的dft窗口,其分別定義第j個(gè)子頻帶的低和高截止頻率。特定時(shí)頻單元(j,m)由特定時(shí)間指數(shù)m和dft窗口指數(shù)k1(j)-k2(j)定義,如圖1b中通過(guò)對(duì)應(yīng)dft窗口周圍的粗框架指明。特定時(shí)頻單元(j,m)包含第j個(gè)子頻帶信號(hào)xj(m)在時(shí)間m的復(fù)值或?qū)嵵怠?/p>

圖2a象征性地示出了基于包括語(yǔ)音的信息信號(hào)x的時(shí)域版x(n)(n為時(shí)間(樣本)指數(shù))、時(shí)頻帶表示x(k,m)(k為頻率指數(shù),m為時(shí)間(幀)指數(shù))或子頻帶表示xj(m)(j為子頻帶指數(shù))提供單耳語(yǔ)音可懂度預(yù)測(cè)值d的單耳語(yǔ)音可懂度預(yù)測(cè)單元(msip)。

圖2b示出了單耳語(yǔ)音可懂度預(yù)測(cè)單元msip的實(shí)施例,其適于接收包括目標(biāo)語(yǔ)音信號(hào)的純凈或有噪聲和/或處理后的版本的信息信號(hào)x(n),該單耳語(yǔ)音可懂度預(yù)測(cè)單元配置成將信息信號(hào)的語(yǔ)音可懂度預(yù)測(cè)值d提供為輸出。所述語(yǔ)音可懂度預(yù)測(cè)單元msip包括:

-輸入單元iu,用于提供信息信號(hào)x的時(shí)頻表示x(k,m),其中k為頻率窗口指數(shù),k=1,2,…,k,及m為時(shí)間(幀)指數(shù);

-包絡(luò)提取單元aeu,用于從信息信號(hào)x的時(shí)頻表示x(k,m)提供所述信息信號(hào)x的時(shí)頻子頻帶表示xj(m),其表示時(shí)域包絡(luò)或其函數(shù),其中j為子頻帶指數(shù),j=1,2,…,j,及m為時(shí)間指數(shù);

-時(shí)頻段分開(kāi)單元sdu,用于將信息信號(hào)x的時(shí)頻子頻帶表示xj(m)分為對(duì)應(yīng)于子頻帶信號(hào)的n個(gè)連續(xù)樣本的時(shí)頻段xm;

-非必需的(通過(guò)虛線框指明)規(guī)格化和/或變換單元n/tu,適于提供時(shí)頻段xm的規(guī)格化和/或變換版本

-段估計(jì)單元seu,用于分別在時(shí)頻段xm或者其規(guī)格化和/或變換版本之中估計(jì)實(shí)質(zhì)上無(wú)噪聲的時(shí)頻段sm或者其規(guī)格化和/或變換版本

-中間語(yǔ)音可懂度計(jì)算單元isiu,適于提供估計(jì)所述時(shí)頻段xm的可懂度的中間語(yǔ)音可懂度系數(shù)dm,所述中間語(yǔ)音可懂度系數(shù)dm基于估計(jì)的實(shí)質(zhì)上無(wú)噪聲的時(shí)頻段sm或者其規(guī)格化和/或變換版本及基于時(shí)頻段xm或者其規(guī)格化和/或變換版本

-最終語(yǔ)音可懂度計(jì)算單元fsiu,用于計(jì)算估計(jì)信息信號(hào)x的可懂度的最終語(yǔ)音可懂度預(yù)測(cè)值d,其通過(guò)隨時(shí)間組合所述中間語(yǔ)音可懂度系數(shù)dm或其變換版本進(jìn)行,例如求平均或者應(yīng)用min或max函數(shù)。

圖3a示出了單耳語(yǔ)音可懂度預(yù)測(cè)單元msip與聽(tīng)力損失模型hlm和(非必需的)評(píng)估單元eval的結(jié)合。單耳語(yǔ)音可懂度預(yù)測(cè)單元msip估計(jì)可懂度指數(shù)d,其反映有噪聲及可能處理后的語(yǔ)音信號(hào)的可懂度。有噪聲/混響的語(yǔ)音信號(hào)y,其可能已通過(guò)一些信號(hào)處理裝置如助聽(tīng)器(例如參見(jiàn)圖3b、3c、3d中的信號(hào)處理單元spu),被單耳語(yǔ)音可懂度預(yù)測(cè)單元msip考慮進(jìn)行分析。本發(fā)明提出一種算法,其可預(yù)測(cè)有噪聲/處理后的信號(hào)的、由具有類似聽(tīng)力曲線的一組聽(tīng)者如正常聽(tīng)力或聽(tīng)力受損聽(tīng)者感知的可懂度。在圖3a的實(shí)施例中,研究的信號(hào)被通過(guò)聽(tīng)力損失模型hlm以對(duì)受損聽(tīng)覺(jué)系統(tǒng)的缺陷建模從而提供信息信號(hào)x。這樣做是為了模擬因聽(tīng)力損失引起的可懂度潛在降低。存在幾種模擬聽(tīng)力損失的方法(例如參見(jiàn)[6])?;蛟S最簡(jiǎn)單的方法包括向輸入信號(hào)添加統(tǒng)計(jì)上獨(dú)立的噪聲信號(hào),其根據(jù)聽(tīng)者的聽(tīng)力圖進(jìn)行譜整形(例如參見(jiàn)[7])。在圖3a(和3b、3c、3d)的實(shí)施例中,包括評(píng)估單元eval以評(píng)估所得的語(yǔ)音可懂度預(yù)測(cè)值d。評(píng)估單元eval例如還可處理語(yǔ)音可懂度預(yù)測(cè)值d,例如以通過(guò)圖形和/或用數(shù)字顯示當(dāng)前值和/或最近的歷史值、演變趨勢(shì)等。作為備選或另外,評(píng)估單元可向用戶(或通信伙伴或護(hù)理人員)建議行動(dòng),如添加方向性、移動(dòng)到更靠近、講得更大聲、啟動(dòng)si增強(qiáng)模式等。評(píng)估單元例如可實(shí)施在單獨(dú)的裝置中,例如用作到語(yǔ)音可懂度遠(yuǎn)程單元msip和/或到包括前述單元的助聽(tīng)器的用戶接口,例如實(shí)施為遙控裝置,例如實(shí)施為智能電話的app(參見(jiàn)圖10a、10b)。

圖3b示出了單耳語(yǔ)音可懂度預(yù)測(cè)單元msip與信號(hào)處理單元spu和(非必需的)評(píng)估單元eval的結(jié)合。有噪聲/回響的語(yǔ)音信號(hào)y被通過(guò)信號(hào)處理單元spu,其處理后的輸出信號(hào)x用作單耳語(yǔ)音可懂度預(yù)測(cè)單元msip的輸入從而提供所得的語(yǔ)音可懂度預(yù)測(cè)值d,其饋給評(píng)估單元eval進(jìn)行進(jìn)一步的處理、分析和/或顯示。

圖3c示出了單耳語(yǔ)音可懂度預(yù)測(cè)單元msip與聽(tīng)力損失模型hlm、信號(hào)處理單元spu和(非必需的)評(píng)估單元eval的第一組合。包括語(yǔ)音的有噪聲信號(hào)y被通過(guò)聽(tīng)力損失模型hlm以對(duì)受損聽(tīng)覺(jué)系統(tǒng)的缺陷建模,從而提供有噪聲的聽(tīng)力損失成形信號(hào)x,其通過(guò)信號(hào)處理單元spu,其處理后的輸出信號(hào)x用作單耳語(yǔ)音可懂度預(yù)測(cè)單元msip的輸入。msip單元提供所得的語(yǔ)音可懂度預(yù)測(cè)值d,其饋給評(píng)估單元eval進(jìn)行進(jìn)一步的處理、分析和/或顯示。

圖3d示出了單耳語(yǔ)音可懂度預(yù)測(cè)單元msip與聽(tīng)力損失模型hlm、信號(hào)處理單元spu和(非必需的)評(píng)估單元eval的第二組合。圖3d的實(shí)施例與圖3c的實(shí)施例類似,但兩個(gè)單元hlm和spu的順序顛倒。圖3d的實(shí)施例可反映助聽(tīng)器中用于評(píng)估來(lái)自信號(hào)處理單元spu的處理后的信號(hào)u(例如計(jì)劃呈現(xiàn)給用戶)的可懂度的設(shè)置。包括語(yǔ)音的有噪聲信號(hào)y被通過(guò)信號(hào)處理單元spu,其處理后的輸出信號(hào)u通過(guò)聽(tīng)力損失模型hlm以對(duì)受損聽(tīng)覺(jué)系統(tǒng)的缺陷建模,從而提供有噪聲的聽(tīng)力損失成形信號(hào)x,其由單耳語(yǔ)音可懂度預(yù)測(cè)單元msip用于確定所得的語(yǔ)音可懂度預(yù)測(cè)值d,該值饋給評(píng)估單元eval進(jìn)行進(jìn)一步的處理、分析和/或顯示。

圖4示出了根據(jù)本發(fā)明的單耳語(yǔ)音可懂度預(yù)測(cè)單元msip的實(shí)施例。圖4中所示的單耳語(yǔ)音可懂度預(yù)測(cè)器實(shí)施例分解為多個(gè)子單元(例如表示對(duì)應(yīng)方法的分開(kāi)的任務(wù))。每一子單元(處理步驟)在下面更詳細(xì)地進(jìn)行描述。用虛線輪廓進(jìn)行符號(hào)表示的子單元(處理步驟)并非必不可少。

話音活動(dòng)檢測(cè)

語(yǔ)音可懂度(si)與輸入信號(hào)的具有語(yǔ)音活動(dòng)的區(qū)域有關(guān),無(wú)聲區(qū)域?qū)i沒(méi)有作用。因此,在本發(fā)明的一些實(shí)現(xiàn)中,第一步驟是檢測(cè)輸入信號(hào)中的話音活動(dòng)區(qū)域(在其它實(shí)現(xiàn)中,話音活動(dòng)檢測(cè)在算法隨后的級(jí)暗中進(jìn)行)。明確的話音活動(dòng)檢測(cè)可以一系列現(xiàn)有算法中的任何算法進(jìn)行,例如[8,9]或其中引用的文獻(xiàn)。我們將具有語(yǔ)音活動(dòng)的輸入信號(hào)記為x'(n),其中n為離散時(shí)間指數(shù)。

頻率分解和包絡(luò)提取

第一步驟是進(jìn)行信號(hào)的頻率分解。這可以許多方式實(shí)現(xiàn),例如使用短時(shí)傅里葉變換(stft)、帶通濾波器組(例如γ單音濾波器組)等。隨后,提取每一子頻帶信號(hào)的時(shí)域包絡(luò)。這例如可使用希爾伯特變換或通過(guò)對(duì)復(fù)值stft信號(hào)的量值進(jìn)行低通濾波等實(shí)現(xiàn)。

作為例子,下面我們描述頻率分解和包絡(luò)提取可怎樣使用stft實(shí)現(xiàn)。假定采樣頻率為10000hz。首先,時(shí)頻表示通過(guò)將x'(n)分段為(如50%)重疊窗口幀獲得;通常,使用一些錐形窗口如漢寧(hanning)窗口。當(dāng)樣本速率為10000hz時(shí),窗口長(zhǎng)度例如可以是256個(gè)樣本。之后,每一幀使用快速傅里葉變換(fft)(可能在適當(dāng)?shù)难a(bǔ)零之后)進(jìn)行傅里葉變換。所得的dft窗口(bin)可按感知有關(guān)的子頻帶分組。例如,可使用三分之一倍頻帶(例如,如[4]中所述),但顯而易見(jiàn)的是,可使用任何其它子頻帶劃分(例如,分組可均勻,即與感知無(wú)關(guān))。在三分之一倍頻帶和10000hz的采樣速率情形下,有15個(gè)頻帶,其覆蓋150-5000hz的頻率范圍(例如參見(jiàn)[4])。也可使用其它數(shù)量的頻帶及另一頻率范圍。我們將這些幀和子頻帶定義的時(shí)頻瓦(tile)稱為時(shí)頻(tf)單元(或stft系數(shù))。將其應(yīng)用于有噪聲/處理后的輸入信號(hào)x(n)導(dǎo)致(通常復(fù)值的)stft系數(shù)x(k,m),其中k和m分別指頻率和幀(時(shí)間)指數(shù)。之后,時(shí)域包絡(luò)信號(hào)可提取為

j=1,...j,及m=1,...m,

其中k1(j)和k2(j)指對(duì)應(yīng)于第j個(gè)子頻帶的低和高截止頻率的dft窗口指數(shù),j為子頻帶的數(shù)量,及m為所涉及信號(hào)中的信號(hào)幀的數(shù)量,及其中為了通用性包括函數(shù)f(·)=f(w)(w表示)。在實(shí)施例中,xj(m)為實(shí)數(shù)(即f(·)表示實(shí)數(shù)(非復(fù)數(shù))函數(shù))。例如,對(duì)于f(w)=w,我們用f(w)=w2得到[4]中使用的時(shí)域包絡(luò),我們提取功率包絡(luò),及用f(w)=2·logw或f(w)=wβ,0<β<2,我們可對(duì)健康耳蝸的壓縮非線性進(jìn)行建模(例如參見(jiàn)[10,11])。顯然,f(w)存在其它合理的選擇。

如所提及的,可實(shí)施其它包絡(luò)表示,例如使用γ單音濾波器組,其后為希爾伯特包絡(luò)提取器等,及函數(shù)f(w)可以與上面結(jié)合基于stft的包絡(luò)描述的方式類似的方式應(yīng)用于這些包絡(luò)。在任何情形下,該程序的結(jié)果從子頻帶時(shí)域包絡(luò)方面來(lái)說(shuō)為時(shí)頻表示xj(m),其中j為子頻帶指數(shù),m為時(shí)間指數(shù)(例如參見(jiàn)圖1b)。

時(shí)頻段

接下來(lái),我們將時(shí)頻表示xj(m)分為對(duì)應(yīng)于所有子頻帶信號(hào)的n個(gè)連續(xù)樣本的段即聲譜圖。例如,第m個(gè)段由j×n矩陣定義:

應(yīng)當(dāng)理解,可使用其它版本的時(shí)段,例如時(shí)間已位移從而對(duì)幀指數(shù)m-n/2+1到m+n/2產(chǎn)生作用的段,其以幀指數(shù)m的當(dāng)前值為中心。

時(shí)頻段的規(guī)格化和變換

每一段xm的行和列可以多種不同的方式進(jìn)行規(guī)格化/變換。

具體地,我們考慮下面的行規(guī)格化/變換:

-行規(guī)格化為零平均值:

其中為j×1向量,其第j'項(xiàng)為x的第j'行(因此中的上標(biāo)r)的平均值,其中1指一的n×1向量,及上標(biāo)t指矩陣轉(zhuǎn)置;

-行規(guī)格化為單位范數(shù):

g2(x)=dr(x)x,

其中在此,x(j,:)指x的第j'行,使得dr(x)為j×j對(duì)角線矩陣,在主對(duì)角線上每一行具有反范數(shù)及在別處為零(上標(biāo)h指厄米變換)。自左乘以dr(x)使得所得矩陣的行規(guī)格化為單位范數(shù);

-對(duì)每一行應(yīng)用傅里葉變換

g3(x)=xf,

其中f為n×n傅里葉矩陣;

-對(duì)每一行應(yīng)用傅里葉變換,之后計(jì)算所得復(fù)值元素的量值

g4(x)=|xf|

其中|·|計(jì)算逐元素量值;

-單位算子

g5(x)=x

我們還考慮下面的列規(guī)格化:

-列規(guī)格化為零平均值:

其中為n×1向量,其第i項(xiàng)為x的第i行的平均值,及其中1指一的j×1向量;

-列規(guī)格化為單位范數(shù):

h2(x)=xdc(x),

其中在此,x(:,n)指x的第n行,使得dc(x)為n×n對(duì)角線矩陣,在主對(duì)角線上的每一列具有反范數(shù)及在別處為零,自右乘以dc(x)使得所得矩陣的列規(guī)格化為單位范數(shù)。

上面列出的行和列規(guī)格化/變換可以不同的方式組合。

特別感興趣的一種組合是,首先,行規(guī)格化為零平均值和單位范數(shù),其后進(jìn)行列的類似平均值和范數(shù)規(guī)格化。該特定組合可寫(xiě)為:

其中,為所得的行和列正規(guī)化矩陣。

另一感興趣的變換為對(duì)矩陣xm的每一行應(yīng)用傅里葉變換。使用引入的記法,這可簡(jiǎn)單地寫(xiě)為:

其中,為所得的(復(fù)值)j×n矩陣。

這些規(guī)格化/變換的其它組合也可能感興趣,例如(列的平均值和范數(shù)標(biāo)準(zhǔn)化,其后為行的平均值和范數(shù)標(biāo)準(zhǔn)化),(傅里葉變換后的行的平均值和范數(shù)標(biāo)準(zhǔn)化),其完全避開(kāi)規(guī)格化級(jí)等。

另一組合是提供所述時(shí)頻段sm和xm的行的至少一規(guī)格化和/或變換操作及列的至少一規(guī)格化和/或變換操作。

無(wú)噪聲時(shí)頻段的估計(jì)

下一步驟涉及潛在無(wú)噪聲規(guī)格化/變換的時(shí)頻段的估計(jì)。顯然,在實(shí)踐中不能觀察該矩陣,因?yàn)橹挥芯仃?imgfile="bda0001222388560000329.gif"wi="81"he="77"img-content="drawing"img-format="gif"orientation="portrait"inline="no"/>中的有噪聲/處理后的規(guī)格化/變換的時(shí)頻段可得到。這樣,我們基于估計(jì)

為此,我們通過(guò)堆放矩陣的列定義j·n×1超向量

類似地,我們將對(duì)應(yīng)的無(wú)噪聲/未處理的超向量定義為

現(xiàn)在的目標(biāo)在于基于推導(dǎo)的估計(jì)量

其中r(.)為將j·n×1有噪聲超向量映射到無(wú)噪聲j·n×1超向量的估計(jì)量的估計(jì)器。

基于有關(guān)但失真的觀察估計(jì)不可觀察的目標(biāo)向量的問(wèn)題是許多工程學(xué)環(huán)境中眾所周知的問(wèn)題,及有許多方法可用于解決該問(wèn)題。這些方法包括(但不限于)基于神經(jīng)網(wǎng)絡(luò)的方法,例如其中映射r(.)被預(yù)先離線估計(jì),例如使用監(jiān)督學(xué)習(xí)技術(shù);貝葉斯技術(shù),例如其中的聯(lián)合概率密度函數(shù)離線估計(jì)并用于提供的估計(jì)量,這些估計(jì)量在一些統(tǒng)計(jì)意義上最佳,例如在最小均方誤差(mmse)、最大后驗(yàn)(map)或最大概似(ml)意義上等;

特別簡(jiǎn)單的一類解決方案涉及在觀察數(shù)據(jù)中呈線性的映射r(.)。在該類解決方案中,我們從中的項(xiàng)的線性組合形成對(duì)應(yīng)的無(wú)噪聲j·n×1超向量的線性估計(jì)量

其中g(shù)為預(yù)先估計(jì)的j·n×j·n矩陣(例如參見(jiàn)下面可怎樣找到g的例子)。最后,通過(guò)簡(jiǎn)單地將超向量估計(jì)量整形為時(shí)頻段矩陣,估計(jì)量被發(fā)現(xiàn)屬于純凈的規(guī)格化/變換的段,

其中,指由向量的具有指數(shù)r-q的項(xiàng)組成的向量。

中間可懂度系數(shù)的估計(jì)

估計(jì)的規(guī)格化/變換的時(shí)頻段現(xiàn)在可與對(duì)應(yīng)的有噪聲/處理后的段一起用于計(jì)算中間可懂度指數(shù)dm,其反映信號(hào)段的可懂度。為實(shí)現(xiàn)此,我們首先定義兩個(gè)k×1向量a和b中的元素的樣本相關(guān)系數(shù)d(a,b):

其中

對(duì)于計(jì)算中間可懂度指數(shù)dm,存在幾個(gè)選擇。具體地,dm可定義為

1)中的列的平均樣本相關(guān)系數(shù),即

或者

2)中的行的平均樣本相關(guān)系數(shù),即

或者

3)中的所有元素的樣本相關(guān)系數(shù),即

作為備選,有噪聲/處理后的段及潛在純凈段的對(duì)應(yīng)估計(jì)量可用于產(chǎn)生無(wú)噪聲、未處理的語(yǔ)音信號(hào)的估計(jì)量,其可與有噪聲、處理后的信號(hào)一起用作任何現(xiàn)有侵入可懂度預(yù)測(cè)方案的輸入,例如stoi算法(例如參見(jiàn)[4])。

最終可懂度系數(shù)的估計(jì)

最終可懂度系數(shù)d(其反映有噪聲/處理后的輸入信號(hào)x(n)的可懂度)定義為跨的語(yǔ)音活躍部分x(n)的持續(xù)時(shí)間的中間可懂度系數(shù)的平均值,可能經(jīng)函數(shù)u(dm)變換,即

函數(shù)u(dm)例如可以是以將中間可懂度系數(shù)與信息度量聯(lián)系起來(lái)(例如參見(jiàn)[14]),但顯然存在其它選擇。

如stoi算法中已經(jīng)那樣做的,也可使用“無(wú)為”函數(shù)u(dm)=dm(參見(jiàn)[4])。

線性映射的預(yù)計(jì)算

如上面概述的,存在許多方法基于有噪聲/處理后的(非必須地,規(guī)格化/變換的)超向量估計(jì)無(wú)噪聲(可能規(guī)格化/變換的)超向量在該部分,為證明本發(fā)明的特別簡(jiǎn)單的實(shí)現(xiàn),我們將注意力限制到線性估計(jì)器,即的估計(jì)量被發(fā)現(xiàn)為中的項(xiàng)的適當(dāng)線性組合。任何這樣的線性組合可簡(jiǎn)潔地寫(xiě)為

其中g(shù)為預(yù)估計(jì)的j·n×j·n矩陣??偟膩?lái)說(shuō),j和n可根據(jù)所涉及的應(yīng)用進(jìn)行選擇。n優(yōu)選可為了人發(fā)音系統(tǒng)的特性進(jìn)行選擇。在實(shí)施例中,選擇n,使得n個(gè)(可能重疊的)時(shí)間幀跨越的時(shí)間在從50ms或100ms到1s的范圍中,例如在300ms和600ms之間。在實(shí)施例中,選擇n以表示所涉及語(yǔ)言的基本語(yǔ)音元素的(平均或最大)持續(xù)時(shí)間。在實(shí)施例中,選擇n以表示所涉及語(yǔ)言的音節(jié)(或詞)的(平均或最大)持續(xù)時(shí)間。在實(shí)施例中,j=15。在實(shí)施例中,n=30。在實(shí)施例中,j·n=450。在實(shí)施例中,時(shí)間幀具有10ms或更大的持續(xù)時(shí)間,例如25ms或更大,例如40ms或更大(例如取決于重疊程度)。在實(shí)施例中,時(shí)間幀具有在10ms和40ms之間的范圍中的持續(xù)時(shí)間。

如下面更詳細(xì)描述的,矩陣g使用無(wú)噪聲語(yǔ)音信號(hào)的訓(xùn)練集預(yù)先估計(jì)(即,離線,在應(yīng)用所提出的方法或裝置之前)。我們可將g認(rèn)為是將語(yǔ)音信號(hào)的統(tǒng)計(jì)結(jié)構(gòu)的先驗(yàn)知識(shí)置入估計(jì)過(guò)程中的方式。該方法存在許多變體。在下面,描述其中之一。這種方法具有計(jì)算相當(dāng)簡(jiǎn)單的優(yōu)點(diǎn),因此很適合其中功耗是重要設(shè)計(jì)參數(shù)(限制)的應(yīng)用(如便攜式電子裝置,例如助聽(tīng)器)。

為了方便,假定所有無(wú)噪聲訓(xùn)練語(yǔ)音信號(hào)級(jí)聯(lián)為(可能非常長(zhǎng)的)訓(xùn)練語(yǔ)音信號(hào)z(n)。假定上述找到有噪聲超向量的步驟應(yīng)用于該訓(xùn)練語(yǔ)音信號(hào)z(n)。換言之,z(n)經(jīng)歷話音活動(dòng)檢測(cè),樣本收集到時(shí)頻段矩陣內(nèi),將gi(x)、hi(x)形式的適宜規(guī)格化/變換應(yīng)用于該矩陣,及將所得矩陣的列堆放為超向量其中指整個(gè)無(wú)噪聲語(yǔ)音訓(xùn)練集中的段的總數(shù)。

我們將跨訓(xùn)練集的j·n×j·n樣本相關(guān)矩陣計(jì)算為

及計(jì)算該矩陣的本征值分解,

其中為具有降序?qū)嵵当菊髦档膶?duì)角線j·n×j·n矩陣,及其中j·n×j·n矩陣的列為對(duì)應(yīng)的特征向量。

最后,將特征向量矩陣分為兩個(gè)子矩陣:

其中,為具有對(duì)應(yīng)于l<j·n主本征值的特征向量的j·n×l矩陣,及具有其余特征向量作為列。作為例子,l/(j·n)可小于80%,如小于50%,如小于33%,如小于20%,或小于10%。在上面的j·n=450例子中,l例如可以為100(導(dǎo)致為450x100矩陣(主子空間),及為450x350矩陣(次子空間))。

之后,(j·nxj·n)矩陣g可計(jì)算為:

該例子的矩陣g可被認(rèn)為正交投影算子(例如參見(jiàn)[12])。在該情形下,形成估計(jì)量簡(jiǎn)單地將有噪聲/處理后的超向量正交地投影在由中的列跨越的線性子空間上。

雙耳非侵入可懂度預(yù)測(cè)

原則上,當(dāng)聽(tīng)者用一只耳朵聽(tīng)時(shí),上面提出的單耳非侵入可懂度預(yù)測(cè)器類方法能夠預(yù)測(cè)語(yǔ)音信號(hào)的可懂度。當(dāng)用兩只耳朵聽(tīng)時(shí),在這已經(jīng)能給出可實(shí)現(xiàn)的可懂度的良好指示的同時(shí),存在雙耳聽(tīng)比用一只耳朵聽(tīng)有利得多的聲學(xué)情形(例如參見(jiàn)[5])。為考慮該效果,提出第一雙耳非侵入語(yǔ)音可懂度預(yù)測(cè)值dbinaural(例如取-1和1之間的值)。上面描述的單耳可懂度預(yù)測(cè)值用作所提出的第一雙耳可懂度預(yù)測(cè)值的基礎(chǔ)。

圖5a示出了所提出的雙耳可懂度預(yù)測(cè)器的一般框圖。圖5a示出了第一雙耳語(yǔ)音可懂度預(yù)測(cè)器與聽(tīng)力損失模型結(jié)合。雙耳語(yǔ)音可懂度預(yù)測(cè)器bsip估計(jì)可懂度指數(shù)dbinaural,其反映聽(tīng)兩個(gè)有噪聲及可能處理后的包括語(yǔ)音xleft和xright(分別呈現(xiàn)給聽(tīng)者的左和右耳)的信息信號(hào)的聽(tīng)者的可懂度。非必須地,包括語(yǔ)音的(有噪聲和/或處理后的)雙耳信號(hào)yleft和yright首先通過(guò)雙耳聽(tīng)力損失模型bhlm以對(duì)受損聽(tīng)覺(jué)系統(tǒng)的缺陷進(jìn)行建模,從而提供有噪聲和/或處理后的聽(tīng)力損失成形信號(hào)xleft和xright供雙耳語(yǔ)音可懂度預(yù)測(cè)器bsip使用。

對(duì)于單耳情形,可能的聽(tīng)力損失可通過(guò)簡(jiǎn)單地向輸入信號(hào)添加獨(dú)立的噪聲、根據(jù)聽(tīng)者的聽(tīng)力圖譜整形而進(jìn)行建模,該方法例如在[7]中使用。

好耳非侵入雙耳可懂度預(yù)測(cè)

雙耳語(yǔ)音可懂度預(yù)測(cè)的簡(jiǎn)單方法是將上面描述的單耳模型獨(dú)立地應(yīng)用于左和右耳輸入信號(hào)xleft和xright,分別導(dǎo)致可懂度指數(shù)dleft和dright。假定聽(tīng)者能夠精神上適應(yīng)具有最好可懂度的耳朵,所得的好耳可懂度預(yù)測(cè)值dbinaural由下式給出:

dbinaural=max(dleft,dright)。

該方法的框圖在圖5b中給出。

圖5b示出了基于兩個(gè)單耳語(yǔ)音可懂度預(yù)測(cè)器的組合的雙耳語(yǔ)音可懂度預(yù)測(cè)器與聽(tīng)力損失模型結(jié)合的實(shí)施例。圖5b示出了用于確定好耳非侵入雙耳可懂度預(yù)測(cè)值dbinaural的處理步驟。連同圖5a的線路,圖5b示出了包括語(yǔ)音的有噪聲和/或處理后的雙耳信號(hào)yleft和yright(在左和右單耳語(yǔ)音可懂度預(yù)測(cè)器的每一個(gè)中),其通過(guò)左和右耳的相應(yīng)聽(tīng)力損失模型hlm,從而提供有噪聲和/或處理后的聽(tīng)力損失成形信號(hào)xleft和xright。左和右耳的聽(tīng)力損失模型hlm一起可構(gòu)成或形成圖5a的雙耳聽(tīng)力損失模型bhlm的一部分。左和右信息信號(hào)xleft和xright分別由左和右耳的單耳語(yǔ)音可懂度預(yù)測(cè)器msip使用,以提供左和右(單耳)語(yǔ)音可懂度預(yù)測(cè)值dleft和dright。左和右語(yǔ)音可懂度預(yù)測(cè)值dleft和dright的最大值由計(jì)算單元max確定并用作雙耳可懂度預(yù)測(cè)值dbinaural。左和右耳的單耳語(yǔ)音可懂度預(yù)測(cè)器msip及計(jì)算單元max一起可構(gòu)成或形成圖5a的雙耳語(yǔ)音可懂度預(yù)測(cè)器bsip的一部分。

一般的非侵入雙耳可懂度預(yù)測(cè)

在上面描述的好耳可懂度預(yù)測(cè)方法將在寬范圍的聲學(xué)情形很好地工作的同時(shí)(例如參見(jiàn)[5]針對(duì)雙耳可懂度的討論),有太簡(jiǎn)單的聲學(xué)情形。為此,我們提出將上面概述的單耳侵入可懂度預(yù)測(cè)器的步驟與來(lái)自[13]中描述的雙耳侵入可懂度預(yù)測(cè)器的想法結(jié)合以得到一般的、新的非侵入雙耳可懂度預(yù)測(cè)器。

所提出的非侵入雙耳可懂度預(yù)測(cè)器的處理步驟在圖6中圖示。圖6中的各個(gè)處理模塊與上面提出的單耳非侵入語(yǔ)音可懂度預(yù)測(cè)器中使用的模塊(圖4)一樣,除均衡-抵消級(jí)ec(如圖6中用粗線框指明)之外。另一方面,該級(jí)在[13]中完整地描述。在下面,簡(jiǎn)要概述ec級(jí)。對(duì)于其詳細(xì)情況,參見(jiàn)[13]及其中的引用文獻(xiàn)。

ec級(jí)獨(dú)立地作用于不同的子頻帶(因此,頻率分解級(jí)在ec級(jí)的前面)。在每一子頻帶(指數(shù)j)中,ec級(jí)對(duì)(來(lái)自左和右耳的)輸入信號(hào)進(jìn)行時(shí)間位移并調(diào)節(jié)其振幅以找到導(dǎo)致最大預(yù)測(cè)可懂度(在圖5中,dbinaural,因此,從模型的輸出引回到ec級(jí)的粗虛線箭頭)的時(shí)間位移和振幅調(diào)節(jié)。在實(shí)施例中,dbinaural在每一頻帶中最大化,藉此可提供所得的雙耳語(yǔ)音可懂度預(yù)測(cè)值,例如提供為單一標(biāo)量值??偟膩?lái)說(shuō),對(duì)于最佳的時(shí)間位移/振幅調(diào)節(jié),存在非封閉形式的解決方案,但最佳的參數(shù)對(duì)可至少通過(guò)跨適當(dāng)范圍的參數(shù)值強(qiáng)力搜索而找到(對(duì)于前述窮舉搜索方法的細(xì)節(jié),參見(jiàn)[13])。

使用可懂度預(yù)測(cè)器的單耳和雙耳可懂度增強(qiáng)

上面部分提出的非侵入單耳和雙耳語(yǔ)音可懂度預(yù)測(cè)方法可用于助聽(tīng)器系統(tǒng)(或另一通信裝置)中發(fā)生的信號(hào)處理的在線調(diào)整,以使其輸出的語(yǔ)音可懂度最大化。該一般的想法在圖7中針對(duì)雙耳設(shè)置示出:有噪聲/回響信號(hào)y1(n),...,yl(n)由總共l個(gè)傳聲器拾取。

圖7示出了提供侵入雙耳語(yǔ)音可懂度預(yù)測(cè)值dbinaural的方法,其用于調(diào)整雙耳助聽(tīng)器系統(tǒng)的處理以使輸出語(yǔ)音信號(hào)的可懂度最大化。

在雙耳設(shè)置情形下,l個(gè)傳聲器信號(hào)y’1,y’2,…,y’l在雙耳信號(hào)處理單元bspu中進(jìn)行處理以產(chǎn)生左和右耳信號(hào)uleft和uright,例如呈現(xiàn)給用戶。在圖7中,助聽(tīng)器系統(tǒng)的所有l(wèi)個(gè)傳聲器一起,一個(gè)或多個(gè)傳聲器通??煞謩e從左和右耳助聽(tīng)器得到,但傳聲器信號(hào)也可從外部裝置例如桌上傳聲器、位于目標(biāo)講話者身上的傳聲器等得到。來(lái)自空間上分開(kāi)的位置的傳聲器信號(hào)假定無(wú)線(或有線)傳輸以在助聽(tīng)器系統(tǒng)中處理。當(dāng)雙耳聽(tīng)左和右耳信號(hào)uleft和uright時(shí),為估計(jì)用戶體驗(yàn)的可懂度,這些信號(hào)被通過(guò)上面提出的雙耳可懂度模型bsip,其中雙耳聽(tīng)力損失模型bhlm(參見(jiàn)上面的一些細(xì)節(jié))并非必不可少。所得的估計(jì)的可懂度指數(shù)dbinaural返回給助聽(tīng)器系統(tǒng)的處理單元bspu,其調(diào)整相應(yīng)信號(hào)處理算法的參數(shù)以使dbinaural最大化。

處理的調(diào)整可按下述發(fā)生。我們假定,助聽(tīng)器系統(tǒng)具有供其使用的多個(gè)處理方案,這些方案適合特定聲學(xué)情形。例如,在有噪聲語(yǔ)音情形下,助聽(tīng)器系統(tǒng)可能配備三個(gè)不同的降噪方案:溫和、中等和激進(jìn)。在該情形下,助聽(tīng)器系統(tǒng)(例如相繼)將每一降噪方案應(yīng)用于輸入信號(hào)并選擇導(dǎo)致最大(估計(jì)的)可懂度的降噪方案。助聽(tīng)器用戶不需要遭受助聽(tīng)器系統(tǒng)“試用”處理方案的感知煩惱。具體地,助聽(tīng)器系統(tǒng)可“內(nèi)部地”試用處理方案,即不會(huì)通過(guò)揚(yáng)聲器呈現(xiàn)每一試用的處理方案的結(jié)果,只有具有最大(估計(jì)的)可懂度的輸出信號(hào)需要呈現(xiàn)給用戶。

顯然,該過(guò)程也可更詳細(xì)程度地應(yīng)用。具體地,甚至助聽(tīng)器系統(tǒng)中單一參數(shù)的值如降噪系統(tǒng)在特定頻帶的最大衰減可通過(guò)試驗(yàn)多個(gè)候選值并選擇導(dǎo)致最大(估計(jì)的)可懂度的值而關(guān)于可懂度進(jìn)行優(yōu)化。

使用非侵入語(yǔ)音可懂度預(yù)測(cè)器用于語(yǔ)音可懂度增強(qiáng)的想法已在一般雙耳模型上下文中描述。顯然,針對(duì)上面描述的好耳非侵入可懂度模型,或者針對(duì)使用單耳非侵入可懂度模型的單耳聽(tīng)音情形,可執(zhí)行完全一樣的想法。這些方面在下面進(jìn)一步結(jié)合圖8a、8b和8c進(jìn)行描述。

圖8a示出了根據(jù)本發(fā)明的助聽(tīng)器hd的實(shí)施例,其包括用于估計(jì)輸出信號(hào)u的可懂度的單耳語(yǔ)音可懂度預(yù)測(cè)單元msip及使用該預(yù)測(cè)單元調(diào)整輸入語(yǔ)音信號(hào)y’的信號(hào)處理以使單耳語(yǔ)音可懂度預(yù)測(cè)值d最大化。助聽(tīng)器hd包括至少一輸入單元(在此為傳聲器,例如兩個(gè)以上)。傳聲器提供表示在其處接收的聲音輸入y的時(shí)變電輸入信號(hào)y’。該電輸入信號(hào)y’假定包括目標(biāo)信號(hào)分量和噪聲信號(hào)分量(至少在部分時(shí)段)。目標(biāo)信號(hào)分量源自目標(biāo)信號(hào)源,例如人講話。助聽(tīng)器還包括可配置的信號(hào)處理單元spu,用于處理電輸入信號(hào)y’并提供處理后的信號(hào)u。助聽(tīng)器還包括輸出單元,用于基于來(lái)自信號(hào)處理單元的處理后的信號(hào)u或源自其的信號(hào)形式的電輸出產(chǎn)生配置成可由用戶感知為聲音的輸出刺激。在圖8a的實(shí)施例中,揚(yáng)聲器直接連接到信號(hào)處理單元spu的輸出,因而接收輸出信號(hào)u。助聽(tīng)器還包括聽(tīng)力損失模型單元hlm,其連接到單耳語(yǔ)音可懂度預(yù)測(cè)單元msip和信號(hào)處理單元的輸出,并配置成修改電輸出信號(hào)u從而反映用戶的相應(yīng)耳朵的聽(tīng)力受損以向單耳語(yǔ)音可懂度預(yù)測(cè)單元msip提供信息信號(hào)x。單耳語(yǔ)音可懂度預(yù)測(cè)單元msip提供用戶對(duì)輸出信號(hào)的可懂度的估計(jì)量,其為(最終)語(yǔ)音可懂度預(yù)測(cè)值d的形式,其饋給可配置的信號(hào)處理單元的控制單元以修改信號(hào)處理從而優(yōu)化d。

圖8b示出了根據(jù)本發(fā)明的雙耳助聽(tīng)器系統(tǒng)的第一實(shí)施例,包括用于估計(jì)用戶在被呈現(xiàn)雙耳助聽(tīng)器系統(tǒng)的相應(yīng)左和右輸出信號(hào)uleft和uright時(shí)其感知的可懂度的雙耳語(yǔ)音可懂度預(yù)測(cè)單元bsip,及使用預(yù)測(cè)值dbinaural調(diào)整包括語(yǔ)音的輸入信號(hào)y’left和y’right的雙耳信號(hào)處理單元bspu以使雙耳語(yǔ)音可懂度預(yù)測(cè)值dbinaural最大化。這通過(guò)將輸出信號(hào)uleft和uright經(jīng)相應(yīng)輸出單元(在此為揚(yáng)聲器)呈現(xiàn)給用戶進(jìn)行。

雙耳聽(tīng)力損失模型對(duì)用戶的(受損)聽(tīng)覺(jué)系統(tǒng)建模,將所得的左和右信號(hào)xleft和xright呈現(xiàn)給雙耳語(yǔ)音可懂度預(yù)測(cè)單元bsip。可配置的雙耳信號(hào)處理單元適于基于最終雙耳語(yǔ)音可懂度度量dbinaural控制相應(yīng)電輸入信號(hào)y’left和y’right的處理以優(yōu)化所述度量,從而使用戶對(duì)輸入聲音信號(hào)yleft和yright的可懂度最大化。

圖8b的雙耳助聽(tīng)器系統(tǒng)的更詳細(xì)的實(shí)施例如圖8c中所示。圖8c示出了根據(jù)本發(fā)明的包括左和右助聽(tīng)器hdleft,hdright的雙耳聽(tīng)力系統(tǒng)的實(shí)施例。左和右助聽(tīng)器hdleft,hdright適于位于用戶的左和右耳之處或之中。左和右助聽(tīng)器中的每一個(gè)的信號(hào)處理由助聽(tīng)器用戶體驗(yàn)的語(yǔ)音可懂度的估計(jì)量(雙耳語(yǔ)音可懂度預(yù)測(cè)值dbinaural)(參見(jiàn)從雙耳語(yǔ)音可懂度預(yù)測(cè)器bsip到左和右助聽(tīng)器的相應(yīng)信號(hào)處理單元spu的控制信號(hào)dbinaural)引導(dǎo)。雙耳語(yǔ)音可懂度預(yù)測(cè)單元bsip配置成將左和右助聽(tīng)器的由用戶的相應(yīng)左和右耳的聽(tīng)力損失模型(在圖8c中分別為hlmleft,hlmright)修改(以對(duì)用戶的受損聽(tīng)覺(jué)系統(tǒng)的缺陷建模)的輸出信號(hào)uleft,uright取為輸入。在該例子中,語(yǔ)音可懂度估計(jì)/預(yù)測(cè)在左耳助聽(tīng)器(左耳:hdleft)中發(fā)生。右耳助聽(tīng)器(右耳:hdright)的輸出信號(hào)uright經(jīng)通信鏈路傳給左耳助聽(tīng)器。通信鏈路可基于有線或無(wú)線連接。助聽(tīng)器優(yōu)選無(wú)線連接。

助聽(tīng)器hdleft,hdright中的每一個(gè)包括兩個(gè)傳聲器、信號(hào)處理模塊spu和揚(yáng)聲器。另外,一個(gè)或兩個(gè)助聽(tīng)器包括雙耳語(yǔ)音可懂度單元bsip。左和右助聽(tīng)器hdleft,hdright的每一個(gè)的兩個(gè)傳聲器中的每一個(gè)拾取可能有噪聲的(時(shí)變)信號(hào)y(t)(參見(jiàn)圖8c中的y1,left,y2,left和y1,right,y2,right),其通常由目標(biāo)信號(hào)分量s(t)(參見(jiàn)圖8c中的s1,left,s2,left和s1,right,s2,right)和不想要的信號(hào)分量v(t)(參見(jiàn)圖8c中的v1,left,v2,left和v1,right,v2,right)組成。在圖8c中,下標(biāo)1、2分別指第一和第二(如前和后)傳聲器,而下標(biāo)left、right指其是左耳還是右耳助聽(tīng)器(分別為hdleft,hdright)。

基于雙耳語(yǔ)音可懂度預(yù)測(cè)值dbinaural,每一助聽(tīng)器的信號(hào)處理單元spu可(個(gè)別地)進(jìn)行調(diào)整(參見(jiàn)控制信號(hào)dbinaural)。由于雙耳語(yǔ)音可懂度預(yù)測(cè)值在左耳助聽(tīng)器hdleft中確定,右耳助聽(tīng)器hdright中的處理的調(diào)整需要將經(jīng)通信鏈路從左耳助聽(tīng)器傳到右耳助聽(tīng)器的控制信號(hào)dbinaural。

在圖8c中,左和右助聽(tīng)器中的每一個(gè)包括兩個(gè)傳聲器。在其它實(shí)施例中,每一助聽(tīng)器(或者助聽(tīng)器之一)可包括三個(gè)以上傳聲器。同樣,在圖8c中,雙耳語(yǔ)音可懂度預(yù)測(cè)器bsip位于左助聽(tīng)器hdleft中。作為備選,雙耳語(yǔ)音可懂度預(yù)測(cè)器bsip可位于右助聽(tīng)器hdright中,或者作為備選,位于兩個(gè)助聽(tīng)器中,優(yōu)選在每一助聽(tīng)器中執(zhí)行一樣的功能。后一實(shí)施方式消耗更多的功率并需要輸出音頻信號(hào)uleft,uright的雙向交換,而可省略處理控制信號(hào)(圖8c中的dbinaural)的交換。在又一實(shí)施例中,雙耳語(yǔ)音可懂度預(yù)測(cè)單元bsip位于單獨(dú)的輔助裝置如遙控器(例如體現(xiàn)在智能電話中)中,要求控制助聽(tīng)器和輔助裝置之間建立音頻鏈路以從相應(yīng)助聽(tīng)器接收輸出信號(hào)uleft,uright及將處理控制信號(hào)dbinaural傳給相應(yīng)助聽(tīng)器hdleft,hdright。

原則上,信號(hào)處理單元spu中進(jìn)行的并受來(lái)自雙耳語(yǔ)音可懂度預(yù)測(cè)器bsip的相應(yīng)左和右助聽(tīng)器hdleft,hdright的控制信號(hào)dbinaural控制或影響的處理可包括影響語(yǔ)音可懂度的任何處理算法,例如空間濾波(波束形成)和降噪、壓縮、反饋抵消等。助聽(tīng)器的信號(hào)處理的基于估計(jì)的雙耳語(yǔ)音可懂度預(yù)測(cè)值的調(diào)整包括(但不限于):

1、調(diào)整聽(tīng)力系統(tǒng)的波束形成器的進(jìn)攻性。具體地,對(duì)于雙耳波束形成器,眾所周知,波束形成器配置涉及降噪和噪聲線索的空間正確性之間的平衡。在一極端設(shè)置中,噪聲被最大程度地減小,但所有噪聲信號(hào)聽(tīng)起來(lái)就像源自目標(biāo)信號(hào)源的方向似的。導(dǎo)致最大si的平衡通常時(shí)變且通常未知。然而,使用所提出的方法,可能調(diào)整給定助聽(tīng)器的波束形成器級(jí)以始終產(chǎn)生最大si。

2、調(diào)整(單通道(sc))降噪系統(tǒng)的進(jìn)攻性。通常,波束形成器級(jí)之后為sc降噪級(jí)(例如參見(jiàn)圖6)。sc降噪濾波器的進(jìn)攻性可調(diào)整(例如通過(guò)改變sc降噪濾波器允許的最大衰減)。所提出的方法使能選擇si最佳平衡,即抑制適當(dāng)量的噪聲但不在目標(biāo)語(yǔ)音信號(hào)中引入si干擾人為現(xiàn)象的系統(tǒng)。

3、對(duì)于具有可調(diào)整的分析/合成濾波器組的系統(tǒng),可選擇導(dǎo)致最大si的分析/合成濾波器組。這意味著改變時(shí)頻分塊,即各個(gè)子頻帶中使用的帶寬和/或采樣速率,以根據(jù)目標(biāo)信號(hào)和聲學(xué)情形(如噪聲類型、電平、空間分布等)傳送最大si。

4、如果雙耳語(yǔ)音可懂度預(yù)測(cè)單元估計(jì)雙耳聽(tīng)力系統(tǒng)的最大si太低從而對(duì)用戶沒(méi)用,則向用戶給出ha系統(tǒng)在給定聲學(xué)條件下不能起作用的指示(如經(jīng)聲音信號(hào))。之后,可調(diào)整其處理,例如以至少不引起聲音質(zhì)量降級(jí),或者進(jìn)入“節(jié)能”模式,其中信號(hào)處理被限制以節(jié)能。

圖9示出了形成為耳內(nèi)接收器式(rite)助聽(tīng)器的示例性助聽(tīng)器hd,包括適于位于耳廓后面的部分bte及適于位于用戶耳道中的包括輸出變換器ot(如揚(yáng)聲器/接收器)的部分ite。bte部分和ite部分通過(guò)連接元件ic進(jìn)行連接(如電連接)。在圖9的助聽(tīng)器實(shí)施例中,bte部分包括輸入單元,其包括兩個(gè)(可個(gè)別選擇的)輸入變換器(如傳聲器)mic1,mic2,每一輸入變換器提供表示輸入聲音信號(hào)的電輸入音頻信號(hào)。輸入單元還包括兩個(gè)(可個(gè)別選擇的)無(wú)線接收器wlr1,wlr2,用于提供相應(yīng)的直接接收的輔助音頻和/或信息信號(hào)。助聽(tīng)器ha還包括其上安裝多個(gè)電子元件的襯底sub,包括上面結(jié)合圖8a所述的可配置的信號(hào)處理單元spu、單耳語(yǔ)音可懂度預(yù)測(cè)單元msip及聽(tīng)力損失模型單元(經(jīng)電導(dǎo)體wx彼此連接及連接到輸入和輸出單元)。可配置的信號(hào)處理單元spu提供增強(qiáng)的音頻信號(hào)(例如參見(jiàn)圖8a中的信號(hào)u),其計(jì)劃呈現(xiàn)給用戶。在圖9的助聽(tīng)器裝置實(shí)施例中,ite部分包括揚(yáng)聲器(接收器)形式的輸出單元ot,用于將電信號(hào)(如圖8a中的u)轉(zhuǎn)換為聲信號(hào)。ite部分還包括引導(dǎo)元件如圓頂do,用于引導(dǎo)并將ite部分定位在用戶耳道中。

圖9中例示的助聽(tīng)器hd為便攜裝置,及還包括用于對(duì)bte部分和ite部分的電子元件供電的電池bat。

助聽(tīng)器裝置包括用于提供表示聲音的電輸入信號(hào)的輸入單元。該輸入單元包括一個(gè)或多個(gè)用于將輸入聲音轉(zhuǎn)換為電輸入信號(hào)的輸入變換器(如傳聲器)mic1,mic2。該輸入單元包括一個(gè)或多個(gè)無(wú)線接收器wlr1,wlr2,用于接收(可能及傳輸)包括聲音的無(wú)線信號(hào)并提供對(duì)應(yīng)的直接接收的輔助音頻輸入信號(hào)。在實(shí)施例中,助聽(tīng)器裝置包括定向傳聲器系統(tǒng)(波束形成器),其適于增強(qiáng)佩戴助聽(tīng)器裝置的用戶的局部環(huán)境中的多個(gè)聲源之中的目標(biāo)聲源。在實(shí)施例中,所述定向系統(tǒng)適于檢測(cè)(如自適應(yīng)檢測(cè))傳聲器信號(hào)的特定部分源自哪一方向。

圖9的助聽(tīng)器可形成根據(jù)本發(fā)明的助聽(tīng)器和/或雙耳助聽(tīng)器系統(tǒng)的一部分。

圖10a示出了雙耳聽(tīng)力系統(tǒng)的實(shí)施例,包括左和右助聽(tīng)器hdleft,hdright與用作雙耳助聽(tīng)器系統(tǒng)的用戶接口ui(參見(jiàn)圖10b)的便攜(手持)輔助裝置ad通信。在實(shí)施例中,雙耳聽(tīng)力系統(tǒng)包括輔助裝置aux(及用戶接口ui)。在圖10a的實(shí)施例中,指明了記為ia-wl(如左和右助聽(tīng)器之間的感應(yīng)鏈路)和wl-rf(如分別在輔助裝置aux和左助聽(tīng)器hdleft之間及輔助裝置aux和右助聽(tīng)器hdright之間的rf鏈路(如藍(lán)牙))的無(wú)線鏈路(通過(guò)對(duì)應(yīng)的天線和收發(fā)器電路實(shí)施在裝置中,在圖10a中在左和右助聽(tīng)器中分別指示為rf-ia-rx/tx-l和rf-ia-rx/tx-r)。

圖10b示出了包括用戶接口ui的輔助裝置aux,用戶接口為用于控制和顯示與語(yǔ)音可懂度預(yù)測(cè)器有關(guān)的數(shù)據(jù)的app的形式。用戶接口ui包括顯示器(如觸敏顯示器),顯示用于控制助聽(tīng)器系統(tǒng)的語(yǔ)音可懂度si-app的屏幕及關(guān)于雙耳(或單耳)聽(tīng)力系統(tǒng)的功能的多個(gè)預(yù)定行動(dòng)。在例示app(的一部分)中,用戶u具有經(jīng)將si預(yù)測(cè)模式選擇為單耳sip或雙耳sip模式而影響運(yùn)行模式的選擇。在圖10b所示的屏幕中,選擇無(wú)光度的按鈕,即雙耳sip。此外,顯現(xiàn)si估計(jì)量已被啟動(dòng),導(dǎo)致雙耳語(yǔ)音可懂度預(yù)測(cè)值的當(dāng)前預(yù)測(cè)值dbinaural=85%被顯示??蛇x擇灰度按鈕“單耳sip”代替雙耳sip。此外,可選擇si增強(qiáng)模式以啟動(dòng)輸入信號(hào)的、優(yōu)化(單耳或雙耳)語(yǔ)音可懂度預(yù)測(cè)值的處理。

當(dāng)由對(duì)應(yīng)的過(guò)程適當(dāng)代替時(shí),上面描述的、“具體實(shí)施方式”中詳細(xì)描述的及權(quán)利要求中限定的裝置的結(jié)構(gòu)特征可與本發(fā)明方法的步驟結(jié)合。

除非明確指出,在此所用的單數(shù)形式“一”、“該”的含義均包括復(fù)數(shù)形式(即具有“至少一”的意思)。應(yīng)當(dāng)進(jìn)一步理解,說(shuō)明書(shū)中使用的術(shù)語(yǔ)“具有”、“包括”和/或“包含”表明存在所述的特征、整數(shù)、步驟、操作、元件和/或部件,但不排除存在或增加一個(gè)或多個(gè)其他特征、整數(shù)、步驟、操作、元件、部件和/或其組合。應(yīng)當(dāng)理解,除非明確指出,當(dāng)元件被稱為“連接”或“耦合”到另一元件時(shí),可以是直接連接或耦合到其他元件,也可以存在中間插入元件。如在此所用的術(shù)語(yǔ)“和/或”包括一個(gè)或多個(gè)列舉的相關(guān)項(xiàng)目的任何及所有組合。除非明確指出,在此公開(kāi)的任何方法的步驟不必須精確按所公開(kāi)的順序執(zhí)行。

應(yīng)意識(shí)到,本說(shuō)明書(shū)中提及“一實(shí)施例”或“實(shí)施例”或“方面”或者“可”包括的特征意為結(jié)合該實(shí)施例描述的特定特征、結(jié)構(gòu)或特性包括在本發(fā)明的至少一實(shí)施方式中。此外,特定特征、結(jié)構(gòu)或特性可在本發(fā)明的一個(gè)或多個(gè)實(shí)施方式中適當(dāng)組合。提供前面的描述是為了使本領(lǐng)域技術(shù)人員能夠?qū)嵤┰诖嗣枋龅母鱾€(gè)方面。各種修改對(duì)本領(lǐng)域技術(shù)人員將顯而易見(jiàn),及在此定義的一般原理可應(yīng)用于其他方面。

權(quán)利要求不限于在此所示的各個(gè)方面,而是包含與權(quán)利要求語(yǔ)言一致的全部范圍,其中除非明確指出,以單數(shù)形式提及的元件不意指“一個(gè)及只有一個(gè)”,而是指“一個(gè)或多個(gè)”。除非明確指出,術(shù)語(yǔ)“一些”指一個(gè)或多個(gè)。

因而,本發(fā)明的范圍應(yīng)依據(jù)權(quán)利要求進(jìn)行判斷。

參考文獻(xiàn)

[1]t.h.falk,v.parsa,j.f.santos,k.arehart,o.hazrati,r.huber,j.m.kates,ands.scollie,“objectivequalityandintelligibilitypredictionforusersofassistivelisteningdevices,”ieeesignalprocessingmagazine,vol.32,no.2,pp.114-124,march2015.

[2]americannationalstandardsinstitute,“ansis3.5,methodsforthecalculationofthespeechintelligibilityindex,”newyork1995.

[3]k.s.rhebergenandn.j.versfeld,“aspeechintelligibilityindexbasedapproachtopredictthespeechreceptionthresholdforsentencesinfluctuatingnoisefornormal-hearinglisteners,”j.acoust.soc.am.,vol.117,no.4,pp.2181-2192,2005.

[4]c.h.taal,r.c.hendriks,r.heusdens,andj.jensen,“analgorithmforintelligibilitypredictionoftime-frequencyweightednoisyspeech,”ieeetrans.audio,speech,lang.process.,vol.19,no.7,pp.2125-2136,sept.2011.

[5]a.w.bronkhorst,“thecocktailpartyphenomenon:areviewonspeechintelligibilityinmultiple-talkerconditions,”actaacusticaunitedwithacustica,vol.86,no.1,pp.117-128,jan2000.

[6]b.c.j.moore,“cochlearhearingloss,”physiological,psychologicalandtechnicalissues,“wiley,2007.

[7]r.beutelmannandt.brand,“predictionofintelligibilityinspatialnoiseandreverberationfornormal-hearingandhearing-impairedlisteners,”j.acoust.soc.am.,vol.120,no.1,pp.331-342,april2006.

[8]j.r.deller,j.g.proakis,andj.h.l.hansen,“discrete-timeprocessingofspeechsignals,”ieeepress,2000.

[9]p.c.loizou,“speechenhancement–theoryandpractice,”crcpress,2007.

[10]t.dau,dpüschel,anda.kohlraush,“aquantitativemodelofthe“effective”signalprocessingintheauditorysystem.i.modelstructure,”j.acoust.soc.am.,vol.99,no.6,pp.3615—3622,1996.

[11]j.jensenandz.-h.tan,“minimummean-squareerrorestimationofmel-frequencycepstralfeatures-atheoreticallyconsistentapproach,”ieeetrans.audio,speech,languageprocess.,vol.23,no.1,pp.186-197,2015.

[12]y.ephraimandh.l.vantrees,“asignalsubspaceapproachforspeechenhancement,”ieeetrans.speech,audioproc.,vol.3,no.4,pp.251-266,1995.

[13]a.h.andersen,j.m.dehaan,z.-h.tan,andj.jensen,”amethodforpredictingtheintelligibilityofnoisyandnon-linearlyenhancedbinauralspeech,”proc.int.conf.acoust.,speech,signalprocessing(icassp),pp.4995-4999,march2016.

[14]j.jensenandc.h.taal,“speechintelligibilitypredictionbasedonmutualinformation,”ieeetrans.audio,speech,andlanguageprocessing,vol.22,no.2,feb.2014,pp.430-440.

當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1