亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

包括集成語(yǔ)音分析的麥克風(fēng)單元的制作方法

文檔序號(hào):11335617閱讀:213來(lái)源:國(guó)知局
包括集成語(yǔ)音分析的麥克風(fēng)單元的制造方法與工藝

本公開內(nèi)容涉及降低數(shù)字麥克風(fēng)的接口上的數(shù)據(jù)比特率,例如以使永遠(yuǎn)開啟(always-on)話音模式下的功率消耗最小化,但是仍然傳遞足夠的信息以允許下游的關(guān)鍵字檢測(cè)或語(yǔ)音識(shí)別功能。



背景技術(shù):

音頻功能在便攜式設(shè)備中正變得越來(lái)越普遍。這樣的功能不僅存在于諸如依賴音頻技術(shù)的電話的設(shè)備中,而且存在于可以由話音控制的其他可穿戴裝備或設(shè)備(例如,話音響應(yīng)玩具,諸如聽-說(shuō)泰迪熊)中。這樣的設(shè)備,包括電話,將幾乎不占用它們實(shí)際傳輸語(yǔ)音的時(shí)間,但是一個(gè)或可能地多個(gè)麥克風(fēng)可能被持久地啟用,以接聽某個(gè)話音命令。甚至一個(gè)可穿戴附件可以是連續(xù)開啟的,等待話音命令,并且將具有很小的用于電池的空間,或可能依賴于一些太陽(yáng)能采集或機(jī)械能采集,因此在連續(xù)待機(jī)模式下以及在低占空比操作模式下具有苛刻的功率消耗要求。

麥克風(fēng)換能器和放大器技術(shù)已經(jīng)改進(jìn),但是通常麥克風(fēng)封裝件需要將其輸出信號(hào)驅(qū)動(dòng)一些距離。數(shù)字傳輸提供了包括噪聲抗擾的優(yōu)點(diǎn),但是用于從麥克風(fēng)傳輸數(shù)字?jǐn)?shù)據(jù)的常規(guī)格式在一些方面不是特別有效率,所述一些方面為信號(hào)線路活動(dòng)和隨之而來(lái)的在每一邏輯電平轉(zhuǎn)變時(shí)通過(guò)供電電壓對(duì)寄生電容充電時(shí)所消耗的功率。

在包含一個(gè)或多個(gè)數(shù)字麥克風(fēng)的便攜式設(shè)備(諸如,電話或平板電腦)中,數(shù)字麥克風(fēng)信號(hào)沿著帶狀線纜或電線(flex)或甚至橫跨密集填入的印刷電路板、從麥克風(fēng)到集中化智能編解碼器芯片等具有一些距離。更糟糕的這樣的應(yīng)用是,其中麥克風(fēng)可以在頭戴式受話器或耳塞內(nèi)或在用戶的衣服上某個(gè)聲學(xué)期望的位置中,遠(yuǎn)離分布式設(shè)備的手持設(shè)備或主模塊。

然而,即使當(dāng)原本在很大程度上不活動(dòng)時(shí),也可能存在復(fù)雜的信號(hào)處理要被執(zhí)行,例如在話音觸發(fā)的喚醒期間的說(shuō)話人識(shí)別,所以諸如極大地降低其中的adc的分辨率這樣的解決方案可能導(dǎo)致不可接受的下游處理結(jié)果。

因此,要求降低橫跨有線數(shù)字傳輸鏈路來(lái)發(fā)送數(shù)字麥克風(fēng)數(shù)據(jù)時(shí)所消耗的功率,同時(shí)仍然在所傳輸?shù)男盘?hào)中傳達(dá)足夠的有用信息,以允許下游的功能(諸如,語(yǔ)音識(shí)別)。

圖1例示了與主機(jī)設(shè)備20(例如,電話)中的智能編解碼器22通信的常規(guī)數(shù)字麥克風(fēng)10,且圖2例示了常規(guī)數(shù)字麥克風(fēng)接口中的操作波形。主機(jī)設(shè)備20通常以諸如3mhz的頻率將時(shí)鐘clk傳輸?shù)禁溈孙L(fēng)10,該麥克風(fēng)10使用此時(shí)鐘對(duì)adc12計(jì)時(shí),且從數(shù)字緩沖器接口dout14時(shí)鐘輸出1-比特過(guò)采樣δ-σ流dat,所述1-比特過(guò)采樣δ-σ流dat表示麥克風(fēng)換能器16的聲學(xué)信號(hào)輸入px,提供adc輸入。在該系統(tǒng)中,主機(jī)20傳輸此時(shí)鐘信號(hào)clk消耗功率,特別是麥克風(fēng)以平均1.5mhz的轉(zhuǎn)變速率發(fā)送數(shù)據(jù)流dat消耗功率。

可以通過(guò)以較低的時(shí)鐘速率(例如,768khz)操作來(lái)降低功率,但是這大大增加了帶內(nèi)量化噪聲,且相反地限制了特定噪聲水平的可用帶寬。即使這樣,僅僅將功率降低到了1/4,所以功率消耗仍然是顯著的,特別是在較大形狀因素(formfactor)設(shè)備中或長(zhǎng)線纜走線時(shí)。

相比于傳輸串行多比特脈碼調(diào)制流,傳輸δ-σ流在數(shù)據(jù)比特率和轉(zhuǎn)變速率方面顯著更低效,但是串行多比特脈碼調(diào)制流通常要求一個(gè)附加的時(shí)鐘線來(lái)傳輸時(shí)鐘,以標(biāo)記每個(gè)多比特字的開始。

其次,我們注意到,降低δ-σ采樣時(shí)鐘速率的令人遺憾的副作用會(huì)是將可用帶寬在背景量化噪聲方面限制到例如8khz而非例如20khz。這會(huì)增加用于話音關(guān)鍵字檢測(cè)(vkd)的字差錯(cuò)率(wer)。這轉(zhuǎn)而會(huì)導(dǎo)致誤報(bào)(falsepositive)的發(fā)生率較高,并且系統(tǒng)可能在其喚醒模式下花費(fèi)更多的時(shí)間,從而顯著影響了平均完整系統(tǒng)功率消耗。

此外,還存在對(duì)需要甚至更精確的輸入音頻數(shù)據(jù)流的功能(諸如,說(shuō)話人辨識(shí))作為話音觸發(fā)喚醒功能的一部分的普遍要求。已知的是,使用較寬帶寬用于說(shuō)話人辨識(shí)會(huì)捕獲較多語(yǔ)音信號(hào)分量,從而放寬對(duì)高信噪比(snr)的需求(例如,放寬對(duì)低聲學(xué)背景噪聲的需求,或認(rèn)真優(yōu)化麥克風(fēng)位置的需求),從而得到足夠高的精確度用于生物識(shí)別目的。即使在高snr環(huán)境中,相對(duì)寬的信號(hào)帶寬可以提高說(shuō)話人的驗(yàn)證精確度。這與降低數(shù)字麥克風(fēng)時(shí)鐘的頻率以降低功率消耗的概念不一致。



技術(shù)實(shí)現(xiàn)要素:

根據(jù)本發(fā)明的第一方面,提供了一個(gè)麥克風(fēng)單元,包括:

一個(gè)換能器,用于由所接收到的聲學(xué)信號(hào)生成電氣音頻信號(hào);

一個(gè)語(yǔ)音編碼器,用于從所述音頻信號(hào)獲得壓縮語(yǔ)音數(shù)據(jù);以及

一個(gè)數(shù)字輸出,用于供應(yīng)表示所述壓縮語(yǔ)音數(shù)據(jù)的數(shù)字信號(hào)。

在本發(fā)明的一個(gè)實(shí)施方案中,所述麥克風(fēng)單元包括一個(gè)經(jīng)封裝的麥克風(fēng),例如mems麥克風(fēng),具有片上或共同封裝的集成語(yǔ)音編碼器電路系統(tǒng)。此電路系統(tǒng)經(jīng)由pcb跡線或可能地經(jīng)由頭戴式受話器線纜將數(shù)據(jù)傳輸離開此封裝件,且傳輸至下游的可以執(zhí)行更復(fù)雜的功能(諸如,語(yǔ)音識(shí)別)的電路系統(tǒng),所傳輸?shù)臄?shù)據(jù)表示以低比特率且以語(yǔ)音壓縮格式所編碼的語(yǔ)音信息,以降低物理傳輸數(shù)據(jù)時(shí)所消耗的功率。

在此公開內(nèi)容中,未壓縮數(shù)據(jù)可以被視為均勻采樣系統(tǒng)中樣本的數(shù)值表示,其中帶內(nèi)信號(hào)是音頻輸入波形在音頻帶內(nèi)的近似,而壓縮數(shù)據(jù)通常由未壓縮數(shù)據(jù)導(dǎo)出以使得數(shù)字流不再直接表示未壓縮數(shù)據(jù),且具有較低的比特率。

語(yǔ)音編碼是包含語(yǔ)音的數(shù)字音頻信號(hào)的數(shù)據(jù)壓縮的應(yīng)用。語(yǔ)音編碼使用語(yǔ)音專用參數(shù)估計(jì)來(lái)將語(yǔ)音信號(hào)建模,且可以與通用數(shù)據(jù)壓縮算法結(jié)合來(lái)表示緊湊比特流中的所得到的建模參數(shù),所述語(yǔ)音專用參數(shù)使用音頻信號(hào)處理技術(shù)。

因此,壓縮語(yǔ)音數(shù)據(jù)可以是表示音頻信號(hào)的數(shù)據(jù)(通常是數(shù)字?jǐn)?shù)據(jù)),該音頻信號(hào)的語(yǔ)音專用參數(shù)從該信號(hào)計(jì)算。例如,這可以是一組非均勻間隔的頻率區(qū)段(frequencybin)中的信號(hào)能量,或可以經(jīng)由例如每個(gè)子帶的adpcm來(lái)使用子帶編碼。數(shù)據(jù)壓縮技術(shù)之后可以被應(yīng)用至這些時(shí)變參數(shù),例如根據(jù)某個(gè)碼本(codebook)重新編碼標(biāo)量或向量。

作為示例,本發(fā)明的實(shí)施方案可以使用任何語(yǔ)音壓縮標(biāo)準(zhǔn),例如使用mdct、mdct-混合子帶、celp、acelp、兩級(jí)噪聲反饋編碼(tsnfc)、vselp、rpe-ltp、lpc、變換編碼或mlt的語(yǔ)音壓縮標(biāo)準(zhǔn),其中合適的實(shí)施例是aac、ac-3、alac、als、ambe、amr、amr-wb、amr-wb+、apt-x、atrac、broadvoice、celt、codec2、enhancedac-3、flac、g.7xx標(biāo)準(zhǔn)組中的任何一個(gè)標(biāo)準(zhǔn)、gsm-fr、ilbc、isac、monkey’saudio、mp2、mp3、musepack、nellymoserasao、opus、shorten、silk、siren7、speex、svopc、tta、twinvq、vorbis、wavpack或windowsmediaaudio。

附圖說(shuō)明

圖1例示了一個(gè)音頻處理系統(tǒng)。

圖2例示了圖1的音頻處理系統(tǒng)中的信號(hào)。

圖3例示了一個(gè)包括主機(jī)設(shè)備和附件的系統(tǒng)。

圖4例示了一個(gè)音頻處理系統(tǒng)。

圖5例示了一個(gè)麥克風(fēng)單元的一個(gè)部分。

圖6例示了一個(gè)麥克風(fēng)單元的一個(gè)部分。

圖7例示了一個(gè)麥克風(fēng)單元的一個(gè)部分。

圖8例示了一個(gè)壓縮語(yǔ)音編碼器。

圖9例示了一個(gè)音頻處理系統(tǒng)。

圖10例示了一個(gè)音頻處理系統(tǒng)。

圖11例示了圖10的音頻處理系統(tǒng)中的麥克風(fēng)單元的一個(gè)部分。

具體實(shí)施方式

圖3示出了一個(gè)音頻系統(tǒng),僅作為使用本文所描述的方法的系統(tǒng)的一個(gè)實(shí)施例。

具體地,圖3示出了設(shè)備30,該設(shè)備30在此實(shí)施例中采取智能電話或平板計(jì)算機(jī)的形式。本文所描述的方法可以與任何設(shè)備一起使用,但是本文參考該設(shè)備是便攜式通信設(shè)備的一個(gè)具體實(shí)施例來(lái)描述所述方法。因此,在此實(shí)施例中,主機(jī)設(shè)備30具有音頻處理能力。

圖3示出了音頻輸入32,在該音頻輸入32附近定位有一個(gè)麥克風(fēng),該麥克風(fēng)在設(shè)備30的主體內(nèi),因此在圖3中是不可見的。在其他設(shè)備中,可以存在多個(gè)麥克風(fēng)。圖3還示出了附件設(shè)備34,該附件設(shè)備34在此實(shí)施例中采取一對(duì)耳機(jī)的形式,但是該附件設(shè)備34可以是任何設(shè)備,特別是任何音頻附件設(shè)備。在此實(shí)施例中,該對(duì)耳機(jī)具有兩個(gè)聽筒36、38,所述聽筒中的每個(gè)包括一個(gè)揚(yáng)聲器,所述揚(yáng)聲器用于響應(yīng)于從主機(jī)設(shè)備30所傳送的音頻信號(hào)而重現(xiàn)聲音。聽筒36、38中的每個(gè)還包括至少一個(gè)麥克風(fēng),例如用于檢測(cè)穿戴者附近的環(huán)境噪聲。

表示環(huán)境聲音的信號(hào)之后從耳機(jī)被傳送到主機(jī)設(shè)備30。該主機(jī)設(shè)備之后執(zhí)行多種功能。例如,該主機(jī)設(shè)備可以使用算法來(lái)執(zhí)行噪聲消除功能,且生成抗噪聲信號(hào),該主機(jī)設(shè)備將該抗噪聲信號(hào)傳送到耳機(jī)用于回放?;胤趴乖肼曅盘?hào)的效果是降低由穿戴者聽到的環(huán)境噪聲的水平,因此也使從主機(jī)30所傳送的所想要的聲音(音樂(lè)、語(yǔ)音等)更可聽。

附件設(shè)備34在此實(shí)施例中還包括麥克風(fēng)40,當(dāng)用戶戴著耳機(jī)時(shí),所述麥克風(fēng)40位于用戶的嘴附近。麥克風(fēng)40適合于檢測(cè)用戶的語(yǔ)音。附件設(shè)備34可以通過(guò)線纜42連接到主機(jī)設(shè)備30。線纜42從便攜式通信設(shè)備和音頻附件中的至少一個(gè)是可拆卸的。在一些實(shí)施方案中,線纜42被持久地附接到附件設(shè)備34,并且可以被設(shè)置有插頭44,以允許經(jīng)由設(shè)置在主機(jī)設(shè)備上的插座46而機(jī)械連接和電氣連接到主機(jī)設(shè)備或從主機(jī)設(shè)備斷開。線纜可以是以任何合適的形式。

主機(jī)設(shè)備30包括用于從設(shè)備30的主體內(nèi)的一個(gè)或多個(gè)麥克風(fēng)和/或從聽筒36、38內(nèi)的麥克風(fēng)和/或麥克風(fēng)40接收信號(hào)的電路系統(tǒng)。該電路系統(tǒng)例如可以包括編解碼器52、音頻dsp或其他處理電路系統(tǒng),它們轉(zhuǎn)而可以被連接到主機(jī)設(shè)備30內(nèi)的電路系統(tǒng)(諸如,應(yīng)用處理器),和/或可以被連接到遠(yuǎn)程處理器。

例如,處理電路系統(tǒng)能夠執(zhí)行語(yǔ)音處理功能,諸如識(shí)別由麥克風(fēng)中的一個(gè)或多個(gè)所接收的語(yǔ)音輸入中的觸發(fā)短語(yǔ)的存在、辨識(shí)語(yǔ)音輸入的說(shuō)話人和/或識(shí)別口語(yǔ)命令的內(nèi)容,從而能夠基于用戶的口語(yǔ)命令來(lái)控制主機(jī)設(shè)備或另一所連接的設(shè)備。

圖4示出了一個(gè)實(shí)施方案,其中麥克風(fēng)單元50具有數(shù)字傳輸格式和方法,用于與下游的智能編解碼器52、音頻dsp或其他處理電路系統(tǒng)通信。

麥克風(fēng)單元50包括換能器54、模擬-信息轉(zhuǎn)換器(aic)56和數(shù)字輸出驅(qū)動(dòng)器58。

模擬-信息轉(zhuǎn)換器56或語(yǔ)音編碼器或特征提取塊可以采取多種形式。公知的是,音頻信號(hào)的蠻力數(shù)字化在所傳達(dá)的或通常需要的有用信息方面極其低效,所述有用信息被例如人耳和腦或某一機(jī)器等同物解讀?;纠砟钍翘崛∫纛l信號(hào)中、對(duì)于下游解讀會(huì)特別有用的特征,如圖4中由數(shù)據(jù)流fx例示的。數(shù)字接口58之后將攜帶此編碼的語(yǔ)音信號(hào)的數(shù)據(jù)流fdat傳輸?shù)骄幗獯a器52。在一個(gè)實(shí)施方案中,編解碼器52中的時(shí)鐘識(shí)別塊60從輸入數(shù)據(jù)恢復(fù)某個(gè)時(shí)鐘,之后,特征處理塊62對(duì)所接收的特征信息操作,以執(zhí)行如下功能,諸如話音活動(dòng)檢測(cè)或說(shuō)話人識(shí)別、遞送適當(dāng)?shù)臉?biāo)記vdet至下游的處理電路系統(tǒng),或控制或配置其自身的某個(gè)進(jìn)一步處理或后續(xù)處理。編解碼器52可以包括時(shí)鐘生成電路66,或可以從主機(jī)設(shè)備內(nèi)的其他地方接收系統(tǒng)時(shí)鐘。

優(yōu)選地,aic56在操作中是異步的或自定時(shí)的,因此不需要時(shí)鐘,并且數(shù)據(jù)傳輸之后也可以是異步的,這可能是在對(duì)由編解碼器所接收的特征數(shù)據(jù)進(jìn)行處理的至少早期階段。它可以包括異步adc,例如異步δ-σ調(diào)制器(adsm),之后是用于數(shù)字信號(hào)處理的其他模擬異步電路系統(tǒng)或自定時(shí)邏輯電路系統(tǒng)。

然而,如果所選定的aic電路結(jié)構(gòu)或fdat數(shù)據(jù)格式需要,則麥克風(fēng)可以生成其自身的時(shí)鐘。

在一些實(shí)施方案中,麥克風(fēng)單元可以從編解碼器或其他地方接收至少一個(gè)低頻時(shí)鐘,諸如系統(tǒng)實(shí)時(shí)時(shí)鐘,以通過(guò)使用例如鎖定環(huán)路技術(shù)來(lái)同步或調(diào)節(jié)其內(nèi)部時(shí)鐘發(fā)生器。然而,如下面將討論的,待被傳輸?shù)奶卣鲾?shù)據(jù)通??梢允且粠?,該幀以標(biāo)稱如30hz或10hz產(chǎn)生,并且任何語(yǔ)音處理功能(例如,語(yǔ)音識(shí)別)的設(shè)計(jì)可能需要適應(yīng)寬范圍的音調(diào)和口語(yǔ)詞速率。因此,與音樂(lè)需要以精確的音調(diào)記錄且任何抖動(dòng)可能導(dǎo)致非音樂(lè)相互調(diào)制的使用實(shí)例相比,時(shí)鐘在話音識(shí)別模式下不需要精確的或低抖動(dòng)的采樣時(shí)鐘,所以片上未校準(zhǔn)的低功率時(shí)鐘64可能足以勝任。

在一些實(shí)施方案中,數(shù)據(jù)可以作為數(shù)據(jù)幀或數(shù)據(jù)向量以某個(gè)相對(duì)高的比特率傳輸,使得在每個(gè)下一幀之前無(wú)轉(zhuǎn)變間隔(transitionlessinterval)。

本文描述的所有實(shí)施方案中,麥克風(fēng)單元包括一個(gè)換能器和一個(gè)特征提取塊,該換能器可以包括一個(gè)mems麥克風(fēng),其中該mems麥克風(fēng)和該特征提取塊被設(shè)置在單個(gè)集成電路中。

該麥克風(fēng)單元可以包括一個(gè)經(jīng)封裝的麥克風(fēng),例如mems麥克風(fēng),所述經(jīng)封裝的麥克風(fēng)具有片上的或共同封裝的集成語(yǔ)音編碼器電路系統(tǒng)或特征提取塊。

此語(yǔ)音編碼器電路系統(tǒng)或特征提取塊可以在pcb跡線或可能地線纜(諸如,頭戴式受話器線纜)將數(shù)據(jù)傳輸離開封裝件,且傳輸至下游的電路系統(tǒng),所述下游的電路系統(tǒng)可以執(zhí)行更復(fù)雜的功能(諸如,語(yǔ)音識(shí)別),所傳輸?shù)臄?shù)據(jù)表示以低比特率且以語(yǔ)音壓縮格式進(jìn)行編碼的語(yǔ)音信息,以降低物理傳輸數(shù)據(jù)時(shí)所消耗的功率。

圖5例示了aic56的一個(gè)實(shí)施方案,其中模擬輸入信號(hào)被呈遞給adc70(例如,1-比特δ-σadc),所述adc70由標(biāo)稱768khz的采樣時(shí)鐘ckm計(jì)時(shí)。δ-σ數(shù)據(jù)流dx之后被傳遞到抽取器、加窗塊(windowblock)和成幀器72,以抽取數(shù)據(jù)值例如16ks/s的采樣速率、合適地加窗且之后成幀,從而呈遞給fft塊74,以導(dǎo)出一組傅立葉系數(shù),該組傅立葉系數(shù)表示一組等間隔的頻率區(qū)段的每個(gè)頻率區(qū)段中的信號(hào)的功率(或幅度)。之后,此頻譜信息被傳遞通過(guò)梅爾頻率濾波器組76,以提供對(duì)一組非等間隔的頻帶的每個(gè)頻帶中的信號(hào)能量的估計(jì)。

此組能量估計(jì)自身可以被用于輸出。替代地,這些能量估計(jì)中的每個(gè)能量估計(jì)被傳遞通過(guò)對(duì)數(shù)塊78以壓縮擴(kuò)展該估計(jì),之后被傳遞通過(guò)離散余弦變換塊80來(lái)提供倒譜系數(shù),該倒譜系數(shù)被稱為梅爾頻率倒譜分量(mfcc)。

在一個(gè)實(shí)施例中,輸出倒譜系數(shù)在30ms的幀周期包括12-比特字的15個(gè)信道,從而將數(shù)據(jù)速率從原始的3mbs/s或786kb/s的1-比特δ-σ速率降低到6kb/s。

圖6例示了aic56的另一實(shí)施方案,與圖5相比,圖6在信號(hào)路徑中具有一些額外的功能塊。在一些其他實(shí)施方案中,并非所有的這些塊都可以存在。

來(lái)自換能器元件90的模擬輸入信號(hào)被呈遞給adc92(例如,1-比特δ-σadc),所述adc92由通過(guò)本地時(shí)鐘發(fā)生器94所生成的標(biāo)稱768khz的采樣時(shí)鐘ckm計(jì)時(shí),該采樣時(shí)鐘ckm例如可以與系統(tǒng)32khz的實(shí)時(shí)時(shí)鐘同步,或該采樣時(shí)鐘ckm可以是獨(dú)立的。

δ-σ數(shù)據(jù)流dx之后在抽取器96中被抽取至例如16ks/s的采樣速率。

它之后可以被傳遞到預(yù)加重塊98,以使以低頻分量為主的語(yǔ)音信號(hào)在頻譜上均衡,該預(yù)加重塊98包括高通濾波器。此步驟在降低低頻背景噪聲(例如,風(fēng)噪聲或機(jī)械聲學(xué)背景噪音)的效果中也會(huì)是有利的。就此點(diǎn)而言,如下面討論的,還可以存在頻率相關(guān)的降噪塊,以降低頻帶中最明顯的噪聲。

該信號(hào)之后可以被傳遞到加窗塊100,該加窗塊100可以應(yīng)用例如漢明窗或可能地某一其他窗功能,以提取短持續(xù)時(shí)間幀,例如持續(xù)時(shí)間為10ms到50ms的幀,在所述短持續(xù)時(shí)間幀的每個(gè)幀中,語(yǔ)音可被認(rèn)為是固定的。通過(guò)使?jié)h明窗沿著語(yǔ)音信號(hào)滑動(dòng)例如幀長(zhǎng)度的一半或例如使25ms的窗滑動(dòng)10ms,加窗塊提取短持續(xù)時(shí)間幀的流,從而以每秒100幀的幀率提供加窗數(shù)據(jù)幀。

fft塊102之后對(duì)每幀的一組加窗樣本執(zhí)行快速傅立葉變換(fft),以提供一組傅立葉系數(shù),該組傅立葉系數(shù)表示一組等間隔的頻率區(qū)段的每個(gè)頻率區(qū)段中的信號(hào)的功率(或幅度)。

這些逐幀的多組信號(hào)頻譜分量中的每組信號(hào)譜分量之后通過(guò)梅爾濾波器組104處理,該梅爾濾波器組104映射且組合這些線性間隔的譜分量至如下頻率區(qū)段上,其中所述頻率區(qū)段被分布成更密切對(duì)應(yīng)于人耳的非線性頻率靈敏度,其中在低頻處比在高頻處具有更大的區(qū)段密度。例如,可能存在23個(gè)這樣的區(qū)段,每個(gè)區(qū)段具有一個(gè)三角形帶通響應(yīng),其中最低的頻率信道以125hz為中心并且橫跨125khz,而最高的頻率信道以3657hz為中心并且橫跨656hz。在一些實(shí)施方案中,可以采用其他數(shù)目的信道或其他非線性頻率標(biāo)度,諸如bark標(biāo)度。

對(duì)數(shù)塊106之后對(duì)從每一梅爾頻率區(qū)段所報(bào)告的能量應(yīng)用對(duì)數(shù)縮放。這有助于降低對(duì)非常響亮的聲音或非常安靜的聲音的靈敏度,以類似于人類聽覺(jué)的非線性振幅靈敏度的方式。

對(duì)數(shù)壓縮的區(qū)段能量之后作為一組樣本被傳遞到離散余弦變換塊dct108,該離散余弦變換塊dct108對(duì)每組對(duì)數(shù)壓縮的區(qū)段能量應(yīng)用離散余弦變換。這用于將緩慢變化的頻譜包絡(luò)(或聲道)信息與較快變化的語(yǔ)音激勵(lì)分開。緩慢變化的頻譜包絡(luò)在語(yǔ)音識(shí)別中更有用,所以可以丟棄較高的系數(shù)。然而,在一些實(shí)施方案中,這些較高的系數(shù)可以被保留,或可能地通過(guò)加權(quán)相加來(lái)組合,以針對(duì)較高頻率提供能量的至少某一度量,從而幫助區(qū)分齒擦音(sibilant)或?yàn)檎f(shuō)話人辨識(shí)提供更多線索。在一些實(shí)施方案中,高階(3)系數(shù)可以與低階系數(shù)并行地生成。

dct塊108還可以提供另一輸出數(shù)據(jù)。例如,一個(gè)分量輸出可以是來(lái)自每一信道的所有對(duì)數(shù)能量的總和,但這也可以通過(guò)從未預(yù)加重的數(shù)據(jù)所供給的并行總能量估計(jì)器est110導(dǎo)出。

還可以存在一個(gè)動(dòng)態(tài)系數(shù)發(fā)生器,該動(dòng)態(tài)系數(shù)發(fā)生器可以基于系數(shù)的一階或二階幀間差來(lái)生成其他系數(shù)。

均衡器(eq)塊112可以相對(duì)于平譜,適應(yīng)性地使多個(gè)分量均衡,例如使用lms算法。

在傳輸之前,數(shù)據(jù)速率可以通過(guò)數(shù)據(jù)壓縮器(dc)塊114而被進(jìn)一步降低,可能地是利用由于語(yǔ)音信號(hào)的性質(zhì)所期望的系數(shù)之間的冗余或相關(guān)性。例如,分裂向量量化壓縮mfcc向量。在一個(gè)實(shí)施例中,維數(shù)14的特征向量例如可以被分裂成成對(duì)的子向量,以10ms的幀周期、例如用相應(yīng)的碼本將每個(gè)子向量量化成5或6比特。這可將數(shù)據(jù)速率降低到4.4kb/s或更低,例如如果使用30ms的幀周期,則可以將數(shù)據(jù)速率降低到1.5kb/s。

附加地或替代地,數(shù)據(jù)壓縮器可以采用其他的標(biāo)準(zhǔn)數(shù)據(jù)壓縮技術(shù)。

因此,通過(guò)采用至少部分地依賴于已知的語(yǔ)音波形的一般特性以及人類語(yǔ)音感知的一般特性的壓縮技術(shù)(例如,在使用非線性間隔的濾波器組和對(duì)數(shù)壓縮,或使用上文提及的使聲道信息從激勵(lì)信息分開時(shí)),攜帶關(guān)于聲學(xué)輸入信號(hào)的語(yǔ)音內(nèi)容的有用信息所必需的數(shù)據(jù)速率已經(jīng)被降低到實(shí)際波形的簡(jiǎn)單多比特或過(guò)采樣時(shí)域表示所必需的數(shù)據(jù)速率以下。輸出的數(shù)據(jù)流可以被認(rèn)為是壓縮的語(yǔ)音數(shù)據(jù),因?yàn)橐呀?jīng)以特別適合于語(yǔ)音且適合于語(yǔ)音波形傳達(dá)信息的參數(shù)的通信的方式從輸入信號(hào)壓縮了輸出數(shù)據(jù),而非以適合于信號(hào)數(shù)字化通用技術(shù)和壓縮任意數(shù)據(jù)流通用技術(shù)的方式。

已經(jīng)生成了壓縮的語(yǔ)音數(shù)據(jù),此數(shù)據(jù)現(xiàn)在需要被物理地傳輸?shù)骄幗獯a器或其他下游的電路系統(tǒng)。在附件通過(guò)線纜連接到主機(jī)設(shè)備的情況下(諸如,包含多個(gè)麥克風(fēng)的頭戴式受話器34被連接到音頻設(shè)備30,如圖1中示出的),可以簡(jiǎn)單地使用兩根導(dǎo)線傳輸輸出數(shù)據(jù),一根導(dǎo)線攜帶數(shù)據(jù)(例如,每30ms180比特,在圖5的實(shí)施例中),并且第二根導(dǎo)線攜帶每30ms一個(gè)同步脈沖或邊沿。與數(shù)據(jù)線的已經(jīng)很低的功率消耗相比,此低時(shí)鐘速率時(shí)鐘線的額外功率是可忽略的。類似地,雙導(dǎo)線鏈路可以被用在設(shè)備(諸如,移動(dòng)電話)主體內(nèi)的麥克風(fēng)和編解碼器之間,或類似地被用在電話的內(nèi)部的電路板上。

可以使用標(biāo)準(zhǔn)數(shù)據(jù)格式諸如soundwiretm或slimbustm,或標(biāo)準(zhǔn)三導(dǎo)線接口諸如i2s。

替代地,可以采用單導(dǎo)線串聯(lián)接口,以循環(huán)的預(yù)定幀序列傳輸數(shù)據(jù),在該循環(huán)的預(yù)定幀序列中,一個(gè)獨(dú)特的同步模式可以在字的每一幀的開始被發(fā)送,且該獨(dú)特的同步模式可以通過(guò)簡(jiǎn)單且低功率的數(shù)據(jù)和目標(biāo)設(shè)備中的時(shí)鐘恢復(fù)電路系統(tǒng)來(lái)恢復(fù)。該時(shí)鐘優(yōu)選地是麥克風(fēng)內(nèi)部的低功率時(shí)鐘,該時(shí)鐘的準(zhǔn)確頻率和抖動(dòng)是不重要的,因?yàn)樘卣鲾?shù)據(jù)遠(yuǎn)不及全分辨率pcm那樣時(shí)鐘嚴(yán)格。

可以使用諸如公布的美國(guó)專利申請(qǐng)(us2013/0197920(a1))中所公開的脈沖長(zhǎng)度調(diào)制(plm)的單導(dǎo)線或雙導(dǎo)線格式發(fā)送數(shù)據(jù)的半字節(jié)。可以用具有固定前沿的脈沖序列發(fā)送數(shù)據(jù),其中每個(gè)脈沖的長(zhǎng)度指示二進(jìn)制數(shù)。固定前沿使時(shí)鐘恢復(fù)變得簡(jiǎn)單。

輸出數(shù)據(jù)流結(jié)構(gòu)(plm或非plm)中的一些時(shí)隙(slot)可以被保留,以用于辨識(shí)功能或控制功能。在此應(yīng)用中,對(duì)于連續(xù)的數(shù)據(jù)流,偶然的數(shù)據(jù)比特誤差可能不具有嚴(yán)重影響。然而,在一些應(yīng)用中,期望的是通過(guò)一些誤差檢測(cè)和/或校正方案來(lái)至少保護(hù)控制數(shù)據(jù),例如基于嵌入在該流中的循環(huán)冗余校驗(yàn)位。

因此,用以降低數(shù)據(jù)速率從而降低物理總線上的平均轉(zhuǎn)變速率的語(yǔ)音編碼可以大大降低系統(tǒng)的功率消耗。此功率節(jié)省可能一定程度上被語(yǔ)音編碼自身所消耗的功率抵消,但是此處理可能必須以其他方式在系統(tǒng)中的某些地方執(zhí)行,以在任何情況下提供關(guān)鍵字檢測(cè)或說(shuō)話人識(shí)別或更一般的語(yǔ)音識(shí)別功能。此外,隨著晶體管尺寸的減小,執(zhí)行給定數(shù)字計(jì)算任務(wù)所需的功率隨時(shí)間而迅速下降。

已知的是,在存在加性噪聲時(shí),梅爾頻率倒譜分量(mfcc)值并不是非常魯棒的。這會(huì)導(dǎo)致來(lái)自下游的話音關(guān)鍵字檢測(cè)器的誤報(bào),可能導(dǎo)致此塊頻繁地觸發(fā)后面的電路系統(tǒng)的無(wú)效上電,對(duì)平均系統(tǒng)功率消耗具有顯著作用。

在一些實(shí)施方案中,可以修改生成方法,例如通過(guò)將對(duì)數(shù)梅爾振幅(由圖5中所示出的實(shí)施方案中的塊78,或由圖6中所示出的實(shí)施方案中的塊106生成)升高到合適的功率(在2或3左右),之后進(jìn)行dct(在圖5中所示出的實(shí)施方案中的塊80,或在圖6中所示出的實(shí)施方案中的塊108中),這降低了低能量分量的影響。

在一些實(shí)施方案中,可以根據(jù)所檢測(cè)或所估計(jì)的信噪比或其他與輸入信號(hào)相關(guān)聯(lián)的信號(hào)相關(guān)參數(shù)或噪聲相關(guān)參數(shù)來(lái)修改特征提取的參數(shù)。例如,可以修改倒譜頻率區(qū)段的數(shù)目和中心頻率,在所述倒譜頻率區(qū)段中提取梅爾頻率能量。

在一些實(shí)施方案中,倒譜編碼塊可以包括降噪塊或在其之前是降噪塊,所述降噪塊例如直接在提取塊72或96之后,或在可能已經(jīng)去除了一些低頻噪聲的預(yù)加重塊98之后,或?qū)τ蓧K100所產(chǎn)生的加窗幀數(shù)據(jù)進(jìn)行操作。在必要時(shí),可以通過(guò)噪聲檢測(cè)塊啟用此降噪塊。該噪聲檢測(cè)塊可以是模擬的,并且監(jiān)控輸入信號(hào)ax,或該噪聲檢測(cè)塊可以是數(shù)字的,并且對(duì)adc輸出dx進(jìn)行操作。該噪聲檢測(cè)塊可以在如下情況下進(jìn)行標(biāo)記:當(dāng)所接收的信號(hào)的水平或頻譜或其他特性表明高噪聲水平時(shí),或當(dāng)峰值信號(hào)或平均信號(hào)與噪聲的比率下降到一閾值以下時(shí)。

降噪電路系統(tǒng)可以起作用,以對(duì)信號(hào)濾波從而抑制這樣的頻率區(qū)段:在該頻率區(qū)段中,在存在信號(hào)的時(shí)間,噪聲(如由話音活動(dòng)檢測(cè)器所監(jiān)控的,在似乎不存在話音的時(shí)間周期中所監(jiān)控到的噪聲)可能超過(guò)該信號(hào)。例如,維納濾波器設(shè)置可以被用來(lái)在逐幀的基礎(chǔ)上抑制噪聲。維納濾波器系數(shù)可以在逐幀的基礎(chǔ)上更新,并且在應(yīng)用到實(shí)際信號(hào)之前,經(jīng)由梅爾頻率濾波器組進(jìn)行系數(shù)平滑,之后經(jīng)過(guò)逆離散余弦變換。在一些實(shí)施方案中,維納降噪可以包括兩個(gè)階段。每個(gè)階段可以納入某個(gè)動(dòng)態(tài)噪聲增強(qiáng)特征,其中所執(zhí)行的降噪水平取決于所估計(jì)的信噪比或信號(hào)的另外的信號(hào)相關(guān)的參數(shù)或特征或噪聲相關(guān)的參數(shù)或特征。

多種信號(hào)編碼技術(shù),特別是使用mfcc編碼的倒譜特征提取,與許多已知的下游話音識(shí)別或說(shuō)話人識(shí)別算法兼容,在所述多種信號(hào)編碼技術(shù)中,從與每個(gè)濾波器組相關(guān)聯(lián)的信號(hào)能量中導(dǎo)出所傳輸?shù)妮敵鰯?shù)據(jù),其中所述濾波器組具有非均勻間隔的中心頻率。在一些情況下,mfcc數(shù)據(jù)實(shí)際上可以從編解碼器轉(zhuǎn)發(fā)(例如,以etsi-標(biāo)準(zhǔn)mfcc形式),用于在主機(jī)設(shè)備中進(jìn)行信號(hào)處理,或被傳輸?shù)竭h(yuǎn)程服務(wù)器,用于“在云中”處理。后者可以降低傳輸所需的數(shù)據(jù)帶寬,并且可以用來(lái)在較差的傳輸條件下保留語(yǔ)音質(zhì)量。

然而,在一些實(shí)施方案中,可能需要麥克風(fēng)來(lái)遞送更常規(guī)的輸出信號(hào),所述常規(guī)的輸出信號(hào)以例如16ks/s或48ks/s以例如16-比特格式對(duì)瞬時(shí)輸入音頻信號(hào)進(jìn)行數(shù)字化。

還可能存在需要某種其他格式的信號(hào)的其他應(yīng)用。常規(guī)地,對(duì)信號(hào)的此處理和重新格式化可以發(fā)生在電話應(yīng)用處理器或具有dsp能力的智能編解碼器內(nèi)。然而,考慮到麥克風(fēng)單元中存在dsp電路系統(tǒng),必需降低待機(jī)模式或“永遠(yuǎn)開啟”模式下的數(shù)字傳輸功率,此dsp電路系統(tǒng)可以用來(lái)在其他使用實(shí)例中執(zhí)行其他語(yǔ)音編碼方法。因?yàn)榘雽?dǎo)體制造工藝隨著不斷減小的特征尺寸而發(fā)展,且因?yàn)檫@些工藝中的每個(gè)工藝的成本隨時(shí)間且隨成熟度而降低,所以在麥克風(fēng)單元自身中實(shí)際集成此功能變得更可行,讓系統(tǒng)中其他地方中任何更強(qiáng)大的處理能力更自由,從而執(zhí)行高水平的任務(wù)?;蛘?,實(shí)際上在一些最終應(yīng)用中,可以去除對(duì)其他信號(hào)處理dsp的要求,以允許使用某個(gè)或許更簡(jiǎn)單的非dsp控制器處理器。

圖7例示了麥克風(fēng)單元130,該麥克風(fēng)單元130可以在多種模式下操作,具有信號(hào)編碼或壓縮的多種程度和方法。因此,圖7示出了若干不同的功能塊。在一些其他實(shí)施方案中,僅存在這些塊的一個(gè)子集。

來(lái)自換能器元件132的模擬輸入信號(hào)被呈遞給adc134(例如,1-比特δ-σadc),且所得到的δ-σ數(shù)據(jù)流dx之后被傳遞到一個(gè)或多個(gè)功能塊,如下面所描述的。

該adc可以由采樣時(shí)鐘ckm計(jì)時(shí),該采樣時(shí)鐘ckm可以由本地時(shí)鐘發(fā)生器136生成,或可以根據(jù)操作模式而在時(shí)鐘輸入138上被接收。

該麥克風(fēng)單元可以第一低功率模式和第二較高功率模式操作,在第一低功率模式中,該麥克風(fēng)單元使用內(nèi)部生成的時(shí)鐘且提供壓縮的語(yǔ)音數(shù)據(jù),在第二較高功率模式中,該麥克風(fēng)單元接收外部時(shí)鐘且提供未壓縮的數(shù)據(jù)。

操作模式可以經(jīng)由控制輸入終端140上所接收的信號(hào)、通過(guò)下游的控制處理器來(lái)控制。這些輸入可以單獨(dú)的,或可以通過(guò)使數(shù)字輸出線雙向來(lái)提供。在一些實(shí)施方案中,操作模式可以由該麥克風(fēng)單元中的電路系統(tǒng)來(lái)自動(dòng)確定。控制塊142接收控制輸入,且確定哪些功能塊被激活。

因此,圖7示出的是,數(shù)據(jù)流dx可以被傳遞到pdm格式化塊144,該pdm格式化塊144允許麥克風(fēng)的數(shù)字化時(shí)域輸出被直接輸出作為pdm流。pdm格式化塊144的輸出被傳遞到多路復(fù)用器146,所述多路復(fù)用器146在控制塊142的控制下操作,且多路復(fù)用器輸出被傳遞到驅(qū)動(dòng)器148,以生成數(shù)字輸出dat。

圖7還示出了被傳遞到特征提取塊150的數(shù)據(jù)流dx,以例如用于獲得基于使用非線性間隔的頻率區(qū)段的值(例如,mfcc值)。

圖7還示出了被傳遞到壓縮采樣塊152數(shù)據(jù)流dx,以例如用于導(dǎo)出輸入信號(hào)的稀疏表示。

圖7還示出了被傳遞到有損壓縮塊154數(shù)據(jù)流dx,以例如用于執(zhí)行自適應(yīng)差分脈碼調(diào)制(adpcm)或類似形式編碼。

圖7還示出了被傳遞到抽取器156的數(shù)據(jù)流dx。

在一些實(shí)施方案中,數(shù)據(jù)流dx還被傳遞到無(wú)損編碼塊,以提供合適的輸出數(shù)據(jù)流。

圖7示出了壓縮采樣塊152、有損壓縮塊154和抽取器156的輸出被連接到相應(yīng)的數(shù)據(jù)緩沖存儲(chǔ)器塊158、160、162。這些數(shù)據(jù)緩沖存儲(chǔ)器塊允許存儲(chǔ)由這些塊所生成的較高質(zhì)量的數(shù)據(jù)。因此,如果對(duì)較低功率數(shù)據(jù)流的分析表明,如果需要,功率可以被耗費(fèi)在傳輸較高質(zhì)量的數(shù)據(jù),以用于需要這樣的較高質(zhì)量的數(shù)據(jù)的某個(gè)進(jìn)一步處理或檢查。

例如,對(duì)較低功率數(shù)據(jù)流的分析可能表明,音頻信號(hào)包含在特定時(shí)間周期中由設(shè)備所識(shí)別出的用戶說(shuō)出的觸發(fā)短語(yǔ)。在該情況下,可以從緩沖存儲(chǔ)器塊中的一個(gè)讀出與相同時(shí)間周期有關(guān)的較高質(zhì)量的數(shù)據(jù),且對(duì)那個(gè)數(shù)據(jù)執(zhí)行進(jìn)一步分析,例如以確認(rèn)是否實(shí)際上說(shuō)出該觸發(fā)短語(yǔ),或該觸發(fā)短語(yǔ)是否由所識(shí)別到的用戶說(shuō)出,或在喚醒下游系統(tǒng)的更大部分之前執(zhí)行更詳細(xì)的關(guān)鍵字檢測(cè)。因此,較高質(zhì)量的數(shù)據(jù)可被用于需要更好數(shù)據(jù)的下游操作,例如下游的語(yǔ)音識(shí)別。

圖7還示出了特征提取塊150、壓縮音頻處理塊152和有損壓縮塊154的輸出經(jīng)由相應(yīng)的脈沖長(zhǎng)度調(diào)制(plm)編碼塊164、166、168且經(jīng)由多路復(fù)用器146和驅(qū)動(dòng)器148而被輸出,所述多路復(fù)用器146在控制塊142的控制下操作。圖7還示出了抽取器156的輸出經(jīng)由脈碼調(diào)制(pcm)編碼塊170且經(jīng)由多路復(fù)用器146和驅(qū)動(dòng)器148而被輸出,所述多路復(fù)用器146在控制塊142的控制下操作。

根據(jù)所選擇的操作模式,所傳輸?shù)妮敵龅奈锢硇问娇梢圆煌?。例如可以使用低壓差分信令?lái)傳輸高數(shù)據(jù)速率模式,以用于噪聲抗擾,且數(shù)據(jù)可以被擾亂以降低發(fā)射。在另一方面,在低數(shù)據(jù)速率模式下,信號(hào)可以是低帶寬的,并且不那么易于受噪聲和傳輸線反射等的影響,優(yōu)選地,信號(hào)是無(wú)端接的,以節(jié)省與驅(qū)動(dòng)終端電阻相關(guān)聯(lián)的功率消耗。在較低功率模式下,可以減小信號(hào)擺動(dòng),即數(shù)字驅(qū)動(dòng)器供電電壓。

電路的其他操作參數(shù)也可以根據(jù)信號(hào)模式而更改。例如,在低數(shù)據(jù)速率模式中,dsp操作的速度要求可以是適度的,因此,與結(jié)合較高速率編碼執(zhí)行更復(fù)雜的操作時(shí)相比,可以使電路系統(tǒng)在較低的邏輯供電電壓或主時(shí)鐘分頻頻率下操作。

盡管基于以上方案的aic或特征提取可以提供編碼和傳輸音頻信號(hào)中的重要信息的特別有效率的方法,但是可能要求麥克風(fēng)單元也能夠操作,從而提供更常規(guī)的數(shù)據(jù)格式,例如用于通過(guò)本地電路系統(tǒng)處理或向前傳輸以用于在云中處理,其中這樣的處理可能不會(huì)理解更復(fù)雜的信號(hào)表示,或其中例如當(dāng)前的使用情況是用于以高質(zhì)量記錄音樂(lè)。

在此情況下,有利的是,adc中的初始轉(zhuǎn)換是高質(zhì)量的,要求高質(zhì)量低抖動(dòng)時(shí)鐘,且優(yōu)選地與編解碼器dsp主時(shí)鐘同步,以避免采樣速率轉(zhuǎn)換與編解碼器主時(shí)鐘同步和/或與標(biāo)準(zhǔn)輸出數(shù)字pcm格式的參考采樣速率同步的問(wèn)題。因此,麥克風(fēng)單元可以第一模式和第二模式操作,在第一模式中執(zhí)行特征提取和/或數(shù)據(jù)壓縮,在第二模式中(例如)從編解碼器供應(yīng)一個(gè)時(shí)鐘,并且該單元以與圖1中示出的方式類似的方式操作。

因此,數(shù)字麥克風(fēng)單元能夠以至少兩種模式操作,所述至少兩種模式為adc(模擬-數(shù)字轉(zhuǎn)換)或aic(模擬-信息轉(zhuǎn)換)。在adc模式中,傳輸來(lái)自adc的pcm數(shù)據(jù),在aic模式中,從adc輸出所提取的數(shù)據(jù)被編碼,特別是對(duì)于語(yǔ)音。

在其他實(shí)施方案中,麥克風(fēng)單元可以一種模式操作,以執(zhí)行有損低比特率pcm編碼。例如,該單元可以包括一個(gè)有損編解碼器,諸如adpcm編碼器,具有在一些實(shí)施方案中可選擇的采樣速率,例如在8ks/s-24ks/s之間。

在一些實(shí)施方案中,麥克風(fēng)單元具有編碼塊,用于執(zhí)行μ律編碼和/或a律編碼,或編碼至某個(gè)其他電話標(biāo)準(zhǔn)。例如,在一些實(shí)施方案中,麥克風(fēng)單元具有用于mdct、mdct-混合子帶、celp、acelp、兩級(jí)噪聲反饋編碼(tsnfc)、vselp、rpe-ltp、lpc、變換編碼或mlt編碼的編碼塊。

在其他實(shí)施方案中,麥克風(fēng)單元可以一種它輸出壓縮采樣pcm數(shù)據(jù)模式操作,或以利用信號(hào)稀疏性的任何方案操作。

圖8例示了壓縮語(yǔ)音編碼器的一個(gè)實(shí)施方案,所述壓縮語(yǔ)音編碼器可以在本文所描述的或例示的實(shí)施方案中的任一個(gè)中使用。adc190的輸出被傳遞通過(guò)抽取器192,以以16ks/s或48ks/s提供(例如)12比特?cái)?shù)據(jù)。以例如僅48hz或1khz的平均采樣速率對(duì)此數(shù)據(jù)進(jìn)行采樣,但是其中采樣時(shí)間由合適的隨機(jī)數(shù)發(fā)生器或隨機(jī)脈沖發(fā)生器194隨機(jī)化。

因此,采樣電路以小于輸入信號(hào)帶寬的采樣速率對(duì)輸入信號(hào)采樣,導(dǎo)致采樣時(shí)刻在時(shí)間上隨機(jī)分布。

圖9示出了使用這樣的壓縮語(yǔ)音編碼器的系統(tǒng)。因此,包括壓縮adc202的麥克風(fēng)單元200被連接,以將非常低數(shù)據(jù)速率的數(shù)據(jù)供應(yīng)到編解碼器204。在信號(hào)統(tǒng)計(jì)的現(xiàn)有知識(shí)的幫助下,下游的電路系統(tǒng)206可以執(zhí)行局部重構(gòu)(在計(jì)算上便宜),以在低功率模式中進(jìn)行稀疏特征提取,或執(zhí)行完整重構(gòu)(計(jì)算上花費(fèi)較大),以得到乃奎斯特類型的話音,用于向前傳輸。注意,存在已知的后續(xù)處理算法塊,諸如塊208,用于執(zhí)行與這樣的壓縮采樣格式兼容的“稀疏識(shí)別”。在這樣的算法中,信號(hào)的稀疏表示與來(lái)自預(yù)定字典的幾個(gè)原子的線性組合相匹配,所述原子可以通過(guò)使用機(jī)器學(xué)習(xí)技術(shù)來(lái)學(xué)習(xí)直接來(lái)自數(shù)據(jù)的主要信號(hào)(原子)的超完備字典來(lái)先驗(yàn)地獲得,以使得信號(hào)的最相關(guān)的屬性可以被有效地捕獲。

在存在噪聲時(shí),稀疏提取在執(zhí)行特征提取方面具有一些益處。噪聲不被識(shí)別為包括任何原子分量,所以不出現(xiàn)在編碼數(shù)據(jù)中。這樣的對(duì)輸入噪聲的忽略從而可以避免下游的電路系統(tǒng)的非必需激活,且避免相對(duì)于安靜的環(huán)境在嘈雜的環(huán)境中增加的功率消耗。

圖10例示了一個(gè)實(shí)施方案,在該實(shí)施方案中,麥克風(fēng)單元210被連接以將非常低數(shù)據(jù)速率的數(shù)據(jù)供應(yīng)到編解碼器212,并且在該實(shí)施方案中,為了進(jìn)一步降低功率消耗,使用模擬信號(hào)處理(asp)執(zhí)行特征提取中的一些(如果不是全部)。在麥克風(fēng)單元210中,此來(lái)自麥克風(fēng)換能器的信號(hào)被傳遞到模擬信號(hào)處理器214,之后傳遞到一個(gè)或多個(gè)模擬-數(shù)字轉(zhuǎn)換器216,之后傳遞到可選的數(shù)字信號(hào)處理器218。之后,在編解碼器212中執(zhí)行特征識(shí)別220。

圖11更詳細(xì)地示出了麥克風(fēng)單元210的一個(gè)實(shí)施方案內(nèi)部的處理,在該實(shí)施方案中,通過(guò)模擬電路系統(tǒng)而非數(shù)字電路系統(tǒng)執(zhí)行信號(hào)處理的很大一部分。因此,輸入信號(hào)被傳遞通過(guò)多個(gè)帶通濾波器(僅僅通過(guò)例示的方式在圖11中示出了三個(gè))240、242、246。帶通濾波器是常量q,并且在梅爾頻率中等間隔。輸出被傳遞到對(duì)數(shù)函數(shù)塊248、250、252,這可以使用標(biāo)準(zhǔn)模擬設(shè)計(jì)技術(shù)來(lái)實(shí)現(xiàn),所述標(biāo)準(zhǔn)模擬設(shè)計(jì)技術(shù)例如基于經(jīng)由電壓-電流轉(zhuǎn)換信號(hào)而將輸入信號(hào)應(yīng)用到具有對(duì)數(shù)電流-電壓轉(zhuǎn)變的i-v雙端口電路(諸如,半導(dǎo)體二極管)。輸出被傳遞到多個(gè)并行adc252、254、256。adc可以包括壓控振蕩器,該壓控振蕩器的頻率被用作它們相應(yīng)的輸入信號(hào)的表示。這些adc是簡(jiǎn)單的并且低功率的,并且它們的線性度在此應(yīng)用中不重要。與主adc相比,這些簡(jiǎn)單的adc可以具有顯著甚至完全降低的功率和面積。在例如在人工耳蝸領(lǐng)域中,類似的電路塊的現(xiàn)有技術(shù)水平在20微瓦以下。

本文描述的所有實(shí)施方案中,麥克風(fēng)、adc和語(yǔ)音編碼電路系統(tǒng)可以有利地被定位成緊靠在一起,以在數(shù)據(jù)速率降低之前降低數(shù)字?jǐn)?shù)據(jù)的高數(shù)據(jù)速率信號(hào)路徑。所有三個(gè)部件可以被封裝在一起。這三個(gè)部件中的至少兩個(gè)可以被共同集成在一個(gè)集成電路上。

麥克風(fēng)可以是mems換能器,該mems換能器可以是電容式的、壓電式的或壓阻式的,并且至少與adc共同集成。

本領(lǐng)域技術(shù)人員將認(rèn)識(shí)到,上文所描述的裝置和方法的多個(gè)實(shí)施方案可以(至少部分地)使用可編程部件而非專用硬件部件來(lái)實(shí)施。因此,所述裝置和方法的實(shí)施方案可以至少部分地體現(xiàn)為處理器控制代碼,例如在非易失性載體介質(zhì)(諸如,磁盤、cd-rom或dvd-rom、程序化存儲(chǔ)器,諸如只讀存儲(chǔ)器(固件))上或在數(shù)據(jù)載體(諸如,光學(xué)信號(hào)載體或電信號(hào)載體)上。在一些應(yīng)用中,本發(fā)明的實(shí)施方案可以至少部分地通過(guò)dsp(數(shù)字信號(hào)處理器)、asic(專用集成電路)或fpga(現(xiàn)場(chǎng)可編程門陣列)來(lái)實(shí)施。因此,代碼可以包括常規(guī)程序代碼或微代碼,或例如用于設(shè)立或控制asic或fpga的代碼。代碼還可以包括用于動(dòng)態(tài)地配置可重新配置的裝置(諸如,可重新編程邏輯門陣列)的代碼。類似地,代碼可以包括硬件描述語(yǔ)言(諸如,verilogtm或vhdl(超高速集成電路硬件描述語(yǔ)言))的代碼。如本領(lǐng)域技術(shù)人員將理解,代碼可以被分布在彼此通信的多個(gè)耦合的部件之間。在適當(dāng)?shù)那闆r下,還可以使用在現(xiàn)場(chǎng)可(重新)編程模擬陣列或類似的設(shè)備上運(yùn)行以配置模擬硬件的代碼來(lái)實(shí)施所述實(shí)施方案。

應(yīng)理解,尤其是得益于此公開內(nèi)容的本領(lǐng)域普通技術(shù)人員應(yīng)理解,本文描述的多種操作,特別是參考附圖描述的多種操作,可以通過(guò)其他電路系統(tǒng)或其他硬件部件來(lái)實(shí)施。給定方法的每一操作執(zhí)行的順序可以被改變,且本文中例示的系統(tǒng)的多個(gè)元件可以被添加、被重排順序、被組合、被省略、被修改等。此公開內(nèi)容意在包含所有這樣的修改和改變,因此,上文的描述應(yīng)被認(rèn)為具有例示性意義而非限制性意義。

類似地,盡管此公開內(nèi)容參考具體實(shí)施方案,但是在不背離此公開內(nèi)容的覆蓋范圍的前提下,可以對(duì)這些實(shí)施方案進(jìn)行修改和改變。此外,本文關(guān)于具體實(shí)施方案所描述的任何益處、優(yōu)點(diǎn)或問(wèn)題的解決方案不意在被理解為關(guān)鍵的、必需的或基本的特征和要素。

受益于此公開內(nèi)容,本領(lǐng)域普通技術(shù)人員同樣將明了另一些實(shí)施方案,并且這樣的實(shí)施方案應(yīng)被視為包含在本文中。

當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1