包括集成語(yǔ)音分析的麥克風(fēng)單元的制作方法

文檔序號(hào)：11335617閱讀：213來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

本公開內(nèi)容涉及降低數(shù)字麥克風(fēng)的接口上的數(shù)據(jù)比特率，例如以使永遠(yuǎn)開啟(always-on)話音模式下的功率消耗最小化，但是仍然傳遞足夠的信息以允許下游的關(guān)鍵字檢測(cè)或語(yǔ)音識(shí)別功能。

背景技術(shù)：

音頻功能在便攜式設(shè)備中正變得越來(lái)越普遍。這樣的功能不僅存在于諸如依賴音頻技術(shù)的電話的設(shè)備中，而且存在于可以由話音控制的其他可穿戴裝備或設(shè)備(例如，話音響應(yīng)玩具，諸如聽-說(shuō)泰迪熊)中。這樣的設(shè)備，包括電話，將幾乎不占用它們實(shí)際傳輸語(yǔ)音的時(shí)間，但是一個(gè)或可能地多個(gè)麥克風(fēng)可能被持久地啟用，以接聽某個(gè)話音命令。甚至一個(gè)可穿戴附件可以是連續(xù)開啟的，等待話音命令，并且將具有很小的用于電池的空間，或可能依賴于一些太陽(yáng)能采集或機(jī)械能采集，因此在連續(xù)待機(jī)模式下以及在低占空比操作模式下具有苛刻的功率消耗要求。

麥克風(fēng)換能器和放大器技術(shù)已經(jīng)改進(jìn)，但是通常麥克風(fēng)封裝件需要將其輸出信號(hào)驅(qū)動(dòng)一些距離。數(shù)字傳輸提供了包括噪聲抗擾的優(yōu)點(diǎn)，但是用于從麥克風(fēng)傳輸數(shù)字?jǐn)?shù)據(jù)的常規(guī)格式在一些方面不是特別有效率，所述一些方面為信號(hào)線路活動(dòng)和隨之而來(lái)的在每一邏輯電平轉(zhuǎn)變時(shí)通過(guò)供電電壓對(duì)寄生電容充電時(shí)所消耗的功率。

在包含一個(gè)或多個(gè)數(shù)字麥克風(fēng)的便攜式設(shè)備(諸如，電話或平板電腦)中，數(shù)字麥克風(fēng)信號(hào)沿著帶狀線纜或電線(flex)或甚至橫跨密集填入的印刷電路板、從麥克風(fēng)到集中化智能編解碼器芯片等具有一些距離。更糟糕的這樣的應(yīng)用是，其中麥克風(fēng)可以在頭戴式受話器或耳塞內(nèi)或在用戶的衣服上某個(gè)聲學(xué)期望的位置中，遠(yuǎn)離分布式設(shè)備的手持設(shè)備或主模塊。

然而，即使當(dāng)原本在很大程度上不活動(dòng)時(shí)，也可能存在復(fù)雜的信號(hào)處理要被執(zhí)行，例如在話音觸發(fā)的喚醒期間的說(shuō)話人識(shí)別，所以諸如極大地降低其中的adc的分辨率這樣的解決方案可能導(dǎo)致不可接受的下游處理結(jié)果。

因此，要求降低橫跨有線數(shù)字傳輸鏈路來(lái)發(fā)送數(shù)字麥克風(fēng)數(shù)據(jù)時(shí)所消耗的功率，同時(shí)仍然在所傳輸?shù)男盘?hào)中傳達(dá)足夠的有用信息，以允許下游的功能(諸如，語(yǔ)音識(shí)別)。

圖1例示了與主機(jī)設(shè)備20(例如，電話)中的智能編解碼器22通信的常規(guī)數(shù)字麥克風(fēng)10，且圖2例示了常規(guī)數(shù)字麥克風(fēng)接口中的操作波形。主機(jī)設(shè)備20通常以諸如3mhz的頻率將時(shí)鐘clk傳輸?shù)禁溈孙L(fēng)10，該麥克風(fēng)10使用此時(shí)鐘對(duì)adc12計(jì)時(shí)，且從數(shù)字緩沖器接口dout14時(shí)鐘輸出1-比特過(guò)采樣δ-σ流dat，所述1-比特過(guò)采樣δ-σ流dat表示麥克風(fēng)換能器16的聲學(xué)信號(hào)輸入px，提供adc輸入。在該系統(tǒng)中，主機(jī)20傳輸此時(shí)鐘信號(hào)clk消耗功率，特別是麥克風(fēng)以平均1.5mhz的轉(zhuǎn)變速率發(fā)送數(shù)據(jù)流dat消耗功率。

可以通過(guò)以較低的時(shí)鐘速率(例如，768khz)操作來(lái)降低功率，但是這大大增加了帶內(nèi)量化噪聲，且相反地限制了特定噪聲水平的可用帶寬。即使這樣，僅僅將功率降低到了1/4，所以功率消耗仍然是顯著的，特別是在較大形狀因素(formfactor)設(shè)備中或長(zhǎng)線纜走線時(shí)。

相比于傳輸串行多比特脈碼調(diào)制流，傳輸δ-σ流在數(shù)據(jù)比特率和轉(zhuǎn)變速率方面顯著更低效，但是串行多比特脈碼調(diào)制流通常要求一個(gè)附加的時(shí)鐘線來(lái)傳輸時(shí)鐘，以標(biāo)記每個(gè)多比特字的開始。

其次，我們注意到，降低δ-σ采樣時(shí)鐘速率的令人遺憾的副作用會(huì)是將可用帶寬在背景量化噪聲方面限制到例如8khz而非例如20khz。這會(huì)增加用于話音關(guān)鍵字檢測(cè)(vkd)的字差錯(cuò)率(wer)。這轉(zhuǎn)而會(huì)導(dǎo)致誤報(bào)(falsepositive)的發(fā)生率較高，并且系統(tǒng)可能在其喚醒模式下花費(fèi)更多的時(shí)間，從而顯著影響了平均完整系統(tǒng)功率消耗。

此外，還存在對(duì)需要甚至更精確的輸入音頻數(shù)據(jù)流的功能(諸如，說(shuō)話人辨識(shí))作為話音觸發(fā)喚醒功能的一部分的普遍要求。已知的是，使用較寬帶寬用于說(shuō)話人辨識(shí)會(huì)捕獲較多語(yǔ)音信號(hào)分量，從而放寬對(duì)高信噪比(snr)的需求(例如，放寬對(duì)低聲學(xué)背景噪聲的需求，或認(rèn)真優(yōu)化麥克風(fēng)位置的需求)，從而得到足夠高的精確度用于生物識(shí)別目的。即使在高snr環(huán)境中，相對(duì)寬的信號(hào)帶寬可以提高說(shuō)話人的驗(yàn)證精確度。這與降低數(shù)字麥克風(fēng)時(shí)鐘的頻率以降低功率消耗的概念不一致。

技術(shù)實(shí)現(xiàn)要素：

根據(jù)本發(fā)明的第一方面，提供了一個(gè)麥克風(fēng)單元，包括：

一個(gè)換能器，用于由所接收到的聲學(xué)信號(hào)生成電氣音頻信號(hào)；

一個(gè)語(yǔ)音編碼器，用于從所述音頻信號(hào)獲得壓縮語(yǔ)音數(shù)據(jù)；以及

一個(gè)數(shù)字輸出，用于供應(yīng)表示所述壓縮語(yǔ)音數(shù)據(jù)的數(shù)字信號(hào)。

在本發(fā)明的一個(gè)實(shí)施方案中，所述麥克風(fēng)單元包括一個(gè)經(jīng)封裝的麥克風(fēng)，例如mems麥克風(fēng)，具有片上或共同封裝的集成語(yǔ)音編碼器電路系統(tǒng)。此電路系統(tǒng)經(jīng)由pcb跡線或可能地經(jīng)由頭戴式受話器線纜將數(shù)據(jù)傳輸離開此封裝件，且傳輸至下游的可以執(zhí)行更復(fù)雜的功能(諸如，語(yǔ)音識(shí)別)的電路系統(tǒng)，所傳輸?shù)臄?shù)據(jù)表示以低比特率且以語(yǔ)音壓縮格式所編碼的語(yǔ)音信息，以降低物理傳輸數(shù)據(jù)時(shí)所消耗的功率。

在此公開內(nèi)容中，未壓縮數(shù)據(jù)可以被視為均勻采樣系統(tǒng)中樣本的數(shù)值表示，其中帶內(nèi)信號(hào)是音頻輸入波形在音頻帶內(nèi)的近似，而壓縮數(shù)據(jù)通常由未壓縮數(shù)據(jù)導(dǎo)出以使得數(shù)字流不再直接表示未壓縮數(shù)據(jù)，且具有較低的比特率。

語(yǔ)音編碼是包含語(yǔ)音的數(shù)字音頻信號(hào)的數(shù)據(jù)壓縮的應(yīng)用。語(yǔ)音編碼使用語(yǔ)音專用參數(shù)估計(jì)來(lái)將語(yǔ)音信號(hào)建模，且可以與通用數(shù)據(jù)壓縮算法結(jié)合來(lái)表示緊湊比特流中的所得到的建模參數(shù)，所述語(yǔ)音專用參數(shù)使用音頻信號(hào)處理技術(shù)。

因此，壓縮語(yǔ)音數(shù)據(jù)可以是表示音頻信號(hào)的數(shù)據(jù)(通常是數(shù)字?jǐn)?shù)據(jù))，該音頻信號(hào)的語(yǔ)音專用參數(shù)從該信號(hào)計(jì)算。例如，這可以是一組非均勻間隔的頻率區(qū)段(frequencybin)中的信號(hào)能量，或可以經(jīng)由例如每個(gè)子帶的adpcm來(lái)使用子帶編碼。數(shù)據(jù)壓縮技術(shù)之后可以被應(yīng)用至這些時(shí)變參數(shù)，例如根據(jù)某個(gè)碼本(codebook)重新編碼標(biāo)量或向量。

作為示例，本發(fā)明的實(shí)施方案可以使用任何語(yǔ)音壓縮標(biāo)準(zhǔn)，例如使用mdct、mdct-混合子帶、celp、acelp、兩級(jí)噪聲反饋編碼(tsnfc)、vselp、rpe-ltp、lpc、變換編碼或mlt的語(yǔ)音壓縮標(biāo)準(zhǔn)，其中合適的實(shí)施例是aac、ac-3、alac、als、ambe、amr、amr-wb、amr-wb+、apt-x、atrac、broadvoice、celt、codec2、enhancedac-3、flac、g.7xx標(biāo)準(zhǔn)組中的任何一個(gè)標(biāo)準(zhǔn)、gsm-fr、ilbc、isac、monkey’saudio、mp2、mp3、musepack、nellymoserasao、opus、shorten、silk、siren7、speex、svopc、tta、twinvq、vorbis、wavpack或windowsmediaaudio。

附圖說(shuō)明

圖1例示了一個(gè)音頻處理系統(tǒng)。

圖2例示了圖1的音頻處理系統(tǒng)中的信號(hào)。

圖3例示了一個(gè)包括主機(jī)設(shè)備和附件的系統(tǒng)。

圖4例示了一個(gè)音頻處理系統(tǒng)。

圖5例示了一個(gè)麥克風(fēng)單元的一個(gè)部分。

圖6例示了一個(gè)麥克風(fēng)單元的一個(gè)部分。

圖7例示了一個(gè)麥克風(fēng)單元的一個(gè)部分。

圖8例示了一個(gè)壓縮語(yǔ)音編碼器。

圖9例示了一個(gè)音頻處理系統(tǒng)。

圖10例示了一個(gè)音頻處理系統(tǒng)。

圖11例示了圖10的音頻處理系統(tǒng)中的麥克風(fēng)單元的一個(gè)部分。

具體實(shí)施方式

圖3示出了一個(gè)音頻系統(tǒng)，僅作為使用本文所描述的方法的系統(tǒng)的一個(gè)實(shí)施例。

具體地，圖3示出了設(shè)備30，該設(shè)備30在此實(shí)施例中采取智能電話或平板計(jì)算機(jī)的形式。本文所描述的方法可以與任何設(shè)備一起使用，但是本文參考該設(shè)備是便攜式通信設(shè)備的一個(gè)具體實(shí)施例來(lái)描述所述方法。因此，在此實(shí)施例中，主機(jī)設(shè)備30具有音頻處理能力。

圖3示出了音頻輸入32，在該音頻輸入32附近定位有一個(gè)麥克風(fēng)，該麥克風(fēng)在設(shè)備30的主體內(nèi)，因此在圖3中是不可見的。在其他設(shè)備中，可以存在多個(gè)麥克風(fēng)。圖3還示出了附件設(shè)備34，該附件設(shè)備34在此實(shí)施例中采取一對(duì)耳機(jī)的形式，但是該附件設(shè)備34可以是任何設(shè)備，特別是任何音頻附件設(shè)備。在此實(shí)施例中，該對(duì)耳機(jī)具有兩個(gè)聽筒36、38，所述聽筒中的每個(gè)包括一個(gè)揚(yáng)聲器，所述揚(yáng)聲器用于響應(yīng)于從主機(jī)設(shè)備30所傳送的音頻信號(hào)而重現(xiàn)聲音。聽筒36、38中的每個(gè)還包括至少一個(gè)麥克風(fēng)，例如用于檢測(cè)穿戴者附近的環(huán)境噪聲。

表示環(huán)境聲音的信號(hào)之后從耳機(jī)被傳送到主機(jī)設(shè)備30。該主機(jī)設(shè)備之后執(zhí)行多種功能。例如，該主機(jī)設(shè)備可以使用算法來(lái)執(zhí)行噪聲消除功能，且生成抗噪聲信號(hào)，該主機(jī)設(shè)備將該抗噪聲信號(hào)傳送到耳機(jī)用于回放?；胤趴乖肼曅盘?hào)的效果是降低由穿戴者聽到的環(huán)境噪聲的水平，因此也使從主機(jī)30所傳送的所想要的聲音(音樂(lè)、語(yǔ)音等)更可聽。

附件設(shè)備34在此實(shí)施例中還包括麥克風(fēng)40，當(dāng)用戶戴著耳機(jī)時(shí)，所述麥克風(fēng)40位于用戶的嘴附近。麥克風(fēng)40適合于檢測(cè)用戶的語(yǔ)音。附件設(shè)備34可以通過(guò)線纜42連接到主機(jī)設(shè)備30。線纜42從便攜式通信設(shè)備和音頻附件中的至少一個(gè)是可拆卸的。在一些實(shí)施方案中，線纜42被持久地附接到附件設(shè)備34，并且可以被設(shè)置有插頭44，以允許經(jīng)由設(shè)置在主機(jī)設(shè)備上的插座46而機(jī)械連接和電氣連接到主機(jī)設(shè)備或從主機(jī)設(shè)備斷開。線纜可以是以任何合適的形式。

主機(jī)設(shè)備30包括用于從設(shè)備30的主體內(nèi)的一個(gè)或多個(gè)麥克風(fēng)和/或從聽筒36、38內(nèi)的麥克風(fēng)和/或麥克風(fēng)40接收信號(hào)的電路系統(tǒng)。該電路系統(tǒng)例如可以包括編解碼器52、音頻dsp或其他處理電路系統(tǒng)，它們轉(zhuǎn)而可以被連接到主機(jī)設(shè)備30內(nèi)的電路系統(tǒng)(諸如，應(yīng)用處理器)，和/或可以被連接到遠(yuǎn)程處理器。

例如，處理電路系統(tǒng)能夠執(zhí)行語(yǔ)音處理功能，諸如識(shí)別由麥克風(fēng)中的一個(gè)或多個(gè)所接收的語(yǔ)音輸入中的觸發(fā)短語(yǔ)的存在、辨識(shí)語(yǔ)音輸入的說(shuō)話人和/或識(shí)別口語(yǔ)命令的內(nèi)容，從而能夠基于用戶的口語(yǔ)命令來(lái)控制主機(jī)設(shè)備或另一所連接的設(shè)備。

圖4示出了一個(gè)實(shí)施方案，其中麥克風(fēng)單元50具有數(shù)字傳輸格式和方法，用于與下游的智能編解碼器52、音頻dsp或其他處理電路系統(tǒng)通信。

麥克風(fēng)單元50包括換能器54、模擬-信息轉(zhuǎn)換器(aic)56和數(shù)字輸出驅(qū)動(dòng)器58。

模擬-信息轉(zhuǎn)換器56或語(yǔ)音編碼器或特征提取塊可以采取多種形式。公知的是，音頻信號(hào)的蠻力數(shù)字化在所傳達(dá)的或通常需要的有用信息方面極其低效，所述有用信息被例如人耳和腦或某一機(jī)器等同物解讀?；纠砟钍翘崛∫纛l信號(hào)中、對(duì)于下游解讀會(huì)特別有用的特征，如圖4中由數(shù)據(jù)流fx例示的。數(shù)字接口58之后將攜帶此編碼的語(yǔ)音信號(hào)的數(shù)據(jù)流fdat傳輸?shù)骄幗獯a器52。在一個(gè)實(shí)施方案中，編解碼器52中的時(shí)鐘識(shí)別塊60從輸入數(shù)據(jù)恢復(fù)某個(gè)時(shí)鐘，之后，特征處理塊62對(duì)所接收的特征信息操作，以執(zhí)行如下功能，諸如話音活動(dòng)檢測(cè)或說(shuō)話人識(shí)別、遞送適當(dāng)?shù)臉?biāo)記vdet至下游的處理電路系統(tǒng)，或控制或配置其自身的某個(gè)進(jìn)一步處理或后續(xù)處理。編解碼器52可以包括時(shí)鐘生成電路66，或可以從主機(jī)設(shè)備內(nèi)的其他地方接收系統(tǒng)時(shí)鐘。

優(yōu)選地，aic56在操作中是異步的或自定時(shí)的，因此不需要時(shí)鐘，并且數(shù)據(jù)傳輸之后也可以是異步的，這可能是在對(duì)由編解碼器所接收的特征數(shù)據(jù)進(jìn)行處理的至少早期階段。它可以包括異步adc，例如異步δ-σ調(diào)制器(adsm)，之后是用于數(shù)字信號(hào)處理的其他模擬異步電路系統(tǒng)或自定時(shí)邏輯電路系統(tǒng)。

然而，如果所選定的aic電路結(jié)構(gòu)或fdat數(shù)據(jù)格式需要，則麥克風(fēng)可以生成其自身的時(shí)鐘。

在一些實(shí)施方案中，麥克風(fēng)單元可以從編解碼器或其他地方接收至少一個(gè)低頻時(shí)鐘，諸如系統(tǒng)實(shí)時(shí)時(shí)鐘，以通過(guò)使用例如鎖定環(huán)路技術(shù)來(lái)同步或調(diào)節(jié)其內(nèi)部時(shí)鐘發(fā)生器。然而，如下面將討論的，待被傳輸?shù)奶卣鲾?shù)據(jù)通?？梢允且粠?，該幀以標(biāo)稱如30hz或10hz產(chǎn)生，并且任何語(yǔ)音處理功能(例如，語(yǔ)音識(shí)別)的設(shè)計(jì)可能需要適應(yīng)寬范圍的音調(diào)和口語(yǔ)詞速率。因此，與音樂(lè)需要以精確的音調(diào)記錄且任何抖動(dòng)可能導(dǎo)致非音樂(lè)相互調(diào)制的使用實(shí)例相比，時(shí)鐘在話音識(shí)別模式下不需要精確的或低抖動(dòng)的采樣時(shí)鐘，所以片上未校準(zhǔn)的低功率時(shí)鐘64可能足以勝任。

在一些實(shí)施方案中，數(shù)據(jù)可以作為數(shù)據(jù)幀或數(shù)據(jù)向量以某個(gè)相對(duì)高的比特率傳輸，使得在每個(gè)下一幀之前無(wú)轉(zhuǎn)變間隔(transitionlessinterval)。

本文描述的所有實(shí)施方案中，麥克風(fēng)單元包括一個(gè)換能器和一個(gè)特征提取塊，該換能器可以包括一個(gè)mems麥克風(fēng)，其中該mems麥克風(fēng)和該特征提取塊被設(shè)置在單個(gè)集成電路中。

該麥克風(fēng)單元可以包括一個(gè)經(jīng)封裝的麥克風(fēng)，例如mems麥克風(fēng)，所述經(jīng)封裝的麥克風(fēng)具有片上的或共同封裝的集成語(yǔ)音編碼器電路系統(tǒng)或特征提取塊。

此語(yǔ)音編碼器電路系統(tǒng)或特征提取塊可以在pcb跡線或可能地線纜(諸如，頭戴式受話器線纜)將數(shù)據(jù)傳輸離開封裝件，且傳輸至下游的電路系統(tǒng)，所述下游的電路系統(tǒng)可以執(zhí)行更復(fù)雜的功能(諸如，語(yǔ)音識(shí)別)，所傳輸?shù)臄?shù)據(jù)表示以低比特率且以語(yǔ)音壓縮格式進(jìn)行編碼的語(yǔ)音信息，以降低物理傳輸數(shù)據(jù)時(shí)所消耗的功率。

圖5例示了aic56的一個(gè)實(shí)施方案，其中模擬輸入信號(hào)被呈遞給adc70(例如，1-比特δ-σadc)，所述adc70由標(biāo)稱768khz的采樣時(shí)鐘ckm計(jì)時(shí)。δ-σ數(shù)據(jù)流dx之后被傳遞到抽取器、加窗塊(windowblock)和成幀器72，以抽取數(shù)據(jù)值例如16ks/s的采樣速率、合適地加窗且之后成幀，從而呈遞給fft塊74，以導(dǎo)出一組傅立葉系數(shù)，該組傅立葉系數(shù)表示一組等間隔的頻率區(qū)段的每個(gè)頻率區(qū)段中的信號(hào)的功率(或幅度)。之后，此頻譜信息被傳遞通過(guò)梅爾頻率濾波器組76，以提供對(duì)一組非等間隔的頻帶的每個(gè)頻帶中的信號(hào)能量的估計(jì)。

此組能量估計(jì)自身可以被用于輸出。替代地，這些能量估計(jì)中的每個(gè)能量估計(jì)被傳遞通過(guò)對(duì)數(shù)塊78以壓縮擴(kuò)展該估計(jì)，之后被傳遞通過(guò)離散余弦變換塊80來(lái)提供倒譜系數(shù)，該倒譜系數(shù)被稱為梅爾頻率倒譜分量(mfcc)。

在一個(gè)實(shí)施例中，輸出倒譜系數(shù)在30ms的幀周期包括12-比特字的15個(gè)信道，從而將數(shù)據(jù)速率從原始的3mbs/s或786kb/s的1-比特δ-σ速率降低到6kb/s。

圖6例示了aic56的另一實(shí)施方案，與圖5相比，圖6在信號(hào)路徑中具有一些額外的功能塊。在一些其他實(shí)施方案中，并非所有的這些塊都可以存在。

來(lái)自換能器元件90的模擬輸入信號(hào)被呈遞給adc92(例如，1-比特δ-σadc)，所述adc92由通過(guò)本地時(shí)鐘發(fā)生器94所生成的標(biāo)稱768khz的采樣時(shí)鐘ckm計(jì)時(shí)，該采樣時(shí)鐘ckm例如可以與系統(tǒng)32khz的實(shí)時(shí)時(shí)鐘同步，或該采樣時(shí)鐘ckm可以是獨(dú)立的。

δ-σ數(shù)據(jù)流dx之后在抽取器96中被抽取至例如16ks/s的采樣速率。

它之后可以被傳遞到預(yù)加重塊98，以使以低頻分量為主的語(yǔ)音信號(hào)在頻譜上均衡，該預(yù)加重塊98包括高通濾波器。此步驟在降低低頻背景噪聲(例如，風(fēng)噪聲或機(jī)械聲學(xué)背景噪音)的效果中也會(huì)是有利的。就此點(diǎn)而言，如下面討論的，還可以存在頻率相關(guān)的降噪塊，以降低頻帶中最明顯的噪聲。

該信號(hào)之后可以被傳遞到加窗塊100，該加窗塊100可以應(yīng)用例如漢明窗或可能地某一其他窗功能，以提取短持續(xù)時(shí)間幀，例如持續(xù)時(shí)間為10ms到50ms的幀，在所述短持續(xù)時(shí)間幀的每個(gè)幀中，語(yǔ)音可被認(rèn)為是固定的。通過(guò)使?jié)h明窗沿著語(yǔ)音信號(hào)滑動(dòng)例如幀長(zhǎng)度的一半或例如使25ms的窗滑動(dòng)10ms，加窗塊提取短持續(xù)時(shí)間幀的流，從而以每秒100幀的幀率提供加窗數(shù)據(jù)幀。

fft塊102之后對(duì)每幀的一組加窗樣本執(zhí)行快速傅立葉變換(fft)，以提供一組傅立葉系數(shù)，該組傅立葉系數(shù)表示一組等間隔的頻率區(qū)段的每個(gè)頻率區(qū)段中的信號(hào)的功率(或幅度)。

這些逐幀的多組信號(hào)頻譜分量中的每組信號(hào)譜分量之后通過(guò)梅爾濾波器組104處理，該梅爾濾波器組104映射且組合這些線性間隔的譜分量至如下頻率區(qū)段上，其中所述頻率區(qū)段被分布成更密切對(duì)應(yīng)于人耳的非線性頻率靈敏度，其中在低頻處比在高頻處具有更大的區(qū)段密度。例如，可能存在23個(gè)這樣的區(qū)段，每個(gè)區(qū)段具有一個(gè)三角形帶通響應(yīng)，其中最低的頻率信道以125hz為中心并且橫跨125khz，而最高的頻率信道以3657hz為中心并且橫跨656hz。在一些實(shí)施方案中，可以采用其他數(shù)目的信道或其他非線性頻率標(biāo)度，諸如bark標(biāo)度。

對(duì)數(shù)塊106之后對(duì)從每一梅爾頻率區(qū)段所報(bào)告的能量應(yīng)用對(duì)數(shù)縮放。這有助于降低對(duì)非常響亮的聲音或非常安靜的聲音的靈敏度，以類似于人類聽覺(jué)的非線性振幅靈敏度的方式。

對(duì)數(shù)壓縮的區(qū)段能量之后作為一組樣本被傳遞到離散余弦變換塊dct108，該離散余弦變換塊dct108對(duì)每組對(duì)數(shù)壓縮的區(qū)段能量應(yīng)用離散余弦變換。這用于將緩慢變化的頻譜包絡(luò)(或聲道)信息與較快變化的語(yǔ)音激勵(lì)分開。緩慢變化的頻譜包絡(luò)在語(yǔ)音識(shí)別中更有用，所以可以丟棄較高的系數(shù)。然而，在一些實(shí)施方案中，這些較高的系數(shù)可以被保留，或可能地通過(guò)加權(quán)相加來(lái)組合，以針對(duì)較高頻率提供能量的至少某一度量，從而幫助區(qū)分齒擦音(sibilant)或?yàn)檎f(shuō)話人辨識(shí)提供更多線索。在一些實(shí)施方案中，高階(3)系數(shù)可以與低階系數(shù)并行地生成。

dct塊108還可以提供另一輸出數(shù)據(jù)。例如，一個(gè)分量輸出可以是來(lái)自每一信道的所有對(duì)數(shù)能量的總和，但這也可以通過(guò)從未預(yù)加重的數(shù)據(jù)所供給的并行總能量估計(jì)器est110導(dǎo)出。

還可以存在一個(gè)動(dòng)態(tài)系數(shù)發(fā)生器，該動(dòng)態(tài)系數(shù)發(fā)生器可以基于系數(shù)的一階或二階幀間差來(lái)生成其他系數(shù)。

均衡器(eq)塊112可以相對(duì)于平譜，適應(yīng)性地使多個(gè)分量均衡，例如使用lms算法。

在傳輸之前，數(shù)據(jù)速率可以通過(guò)數(shù)據(jù)壓縮器(dc)塊114而被進(jìn)一步降低，可能地是利用由于語(yǔ)音信號(hào)的性質(zhì)所期望的系數(shù)之間的冗余或相關(guān)性。例如，分裂向量量化壓縮mfcc向量。在一個(gè)實(shí)施例中，維數(shù)14的特征向量例如可以被分裂成成對(duì)的子向量，以10ms的幀周期、例如用相應(yīng)的碼本將每個(gè)子向量量化成5或6比特。這可將數(shù)據(jù)速率降低到4.4kb/s或更低，例如如果使用30ms的幀周期，則可以將數(shù)據(jù)速率降低到1.5kb/s。

附加地或替代地，數(shù)據(jù)壓縮器可以采用其他的標(biāo)準(zhǔn)數(shù)據(jù)壓縮技術(shù)。

因此，通過(guò)采用至少部分地依賴于已知的語(yǔ)音波形的一般特性以及人類語(yǔ)音感知的一般特性的壓縮技術(shù)(例如，在使用非線性間隔的濾波器組和對(duì)數(shù)壓縮，或使用上文提及的使聲道信息從激勵(lì)信息分開時(shí))，攜帶關(guān)于聲學(xué)輸入信號(hào)的語(yǔ)音內(nèi)容的有用信息所必需的數(shù)據(jù)速率已經(jīng)被降低到實(shí)際波形的簡(jiǎn)單多比特或過(guò)采樣時(shí)域表示所必需的數(shù)據(jù)速率以下。輸出的數(shù)據(jù)流可以被認(rèn)為是壓縮的語(yǔ)音數(shù)據(jù)，因?yàn)橐呀?jīng)以特別適合于語(yǔ)音且適合于語(yǔ)音波形傳達(dá)信息的參數(shù)的通信的方式從輸入信號(hào)壓縮了輸出數(shù)據(jù)，而非以適合于信號(hào)數(shù)字化通用技術(shù)和壓縮任意數(shù)據(jù)流通用技術(shù)的方式。

已經(jīng)生成了壓縮的語(yǔ)音數(shù)據(jù)，此數(shù)據(jù)現(xiàn)在需要被物理地傳輸?shù)骄幗獯a器或其他下游的電路系統(tǒng)。在附件通過(guò)線纜連接到主機(jī)設(shè)備的情況下(諸如，包含多個(gè)麥克風(fēng)的頭戴式受話器34被連接到音頻設(shè)備30，如圖1中示出的)，可以簡(jiǎn)單地使用兩根導(dǎo)線傳輸輸出數(shù)據(jù)，一根導(dǎo)線攜帶數(shù)據(jù)(例如，每30ms180比特，在圖5的實(shí)施例中)，并且第二根導(dǎo)線攜帶每30ms一個(gè)同步脈沖或邊沿。與數(shù)據(jù)線的已經(jīng)很低的功率消耗相比，此低時(shí)鐘速率時(shí)鐘線的額外功率是可忽略的。類似地，雙導(dǎo)線鏈路可以被用在設(shè)備(諸如，移動(dòng)電話)主體內(nèi)的麥克風(fēng)和編解碼器之間，或類似地被用在電話的內(nèi)部的電路板上。

可以使用標(biāo)準(zhǔn)數(shù)據(jù)格式諸如soundwiretm或slimbustm，或標(biāo)準(zhǔn)三導(dǎo)線接口諸如i2s。

替代地，可以采用單導(dǎo)線串聯(lián)接口，以循環(huán)的預(yù)定幀序列傳輸數(shù)據(jù)，在該循環(huán)的預(yù)定幀序列中，一個(gè)獨(dú)特的同步模式可以在字的每一幀的開始被發(fā)送，且該獨(dú)特的同步模式可以通過(guò)簡(jiǎn)單且低功率的數(shù)據(jù)和目標(biāo)設(shè)備中的時(shí)鐘恢復(fù)電路系統(tǒng)來(lái)恢復(fù)。該時(shí)鐘優(yōu)選地是麥克風(fēng)內(nèi)部的低功率時(shí)鐘，該時(shí)鐘的準(zhǔn)確頻率和抖動(dòng)是不重要的，因?yàn)樘卣鲾?shù)據(jù)遠(yuǎn)不及全分辨率pcm那樣時(shí)鐘嚴(yán)格。

可以使用諸如公布的美國(guó)專利申請(qǐng)(us2013/0197920(a1))中所公開的脈沖長(zhǎng)度調(diào)制(plm)的單導(dǎo)線或雙導(dǎo)線格式發(fā)送數(shù)據(jù)的半字節(jié)。可以用具有固定前沿的脈沖序列發(fā)送數(shù)據(jù)，其中每個(gè)脈沖的長(zhǎng)度指示二進(jìn)制數(shù)。固定前沿使時(shí)鐘恢復(fù)變得簡(jiǎn)單。

輸出數(shù)據(jù)流結(jié)構(gòu)(plm或非plm)中的一些時(shí)隙(slot)可以被保留，以用于辨識(shí)功能或控制功能。在此應(yīng)用中，對(duì)于連續(xù)的數(shù)據(jù)流，偶然的數(shù)據(jù)比特誤差可能不具有嚴(yán)重影響。然而，在一些應(yīng)用中，期望的是通過(guò)一些誤差檢測(cè)和/或校正方案來(lái)至少保護(hù)控制數(shù)據(jù)，例如基于嵌入在該流中的循環(huán)冗余校驗(yàn)位。

因此，用以降低數(shù)據(jù)速率從而降低物理總線上的平均轉(zhuǎn)變速率的語(yǔ)音編碼可以大大降低系統(tǒng)的功率消耗。此功率節(jié)省可能一定程度上被語(yǔ)音編碼自身所消耗的功率抵消，但是此處理可能必須以其他方式在系統(tǒng)中的某些地方執(zhí)行，以在任何情況下提供關(guān)鍵字檢測(cè)或說(shuō)話人識(shí)別或更一般的語(yǔ)音識(shí)別功能。此外，隨著晶體管尺寸的減小，執(zhí)行給定數(shù)字計(jì)算任務(wù)所需的功率隨時(shí)間而迅速下降。

已知的是，在存在加性噪聲時(shí)，梅爾頻率倒譜分量(mfcc)值并不是非常魯棒的。這會(huì)導(dǎo)致來(lái)自下游的話音關(guān)鍵字檢測(cè)器的誤報(bào)，可能導(dǎo)致此塊頻繁地觸發(fā)后面的電路系統(tǒng)的無(wú)效上電，對(duì)平均系統(tǒng)功率消耗具有顯著作用。

在一些實(shí)施方案中，可以修改生成方法，例如通過(guò)將對(duì)數(shù)梅爾振幅(由圖5中所示出的實(shí)施方案中的塊78，或由圖6中所示出的實(shí)施方案中的塊106生成)升高到合適的功率(在2或3左右)，之后進(jìn)行dct(在圖5中所示出的實(shí)施方案中的塊80，或在圖6中所示出的實(shí)施方案中的塊108中)，這降低了低能量分量的影響。

在一些實(shí)施方案中，可以根據(jù)所檢測(cè)或所估計(jì)的信噪比或其他與輸入信號(hào)相關(guān)聯(lián)的信號(hào)相關(guān)參數(shù)或噪聲相關(guān)參數(shù)來(lái)修改特征提取的參數(shù)。例如，可以修改倒譜頻率區(qū)段的數(shù)目和中心頻率，在所述倒譜頻率區(qū)段中提取梅爾頻率能量。

在一些實(shí)施方案中，倒譜編碼塊可以包括降噪塊或在其之前是降噪塊，所述降噪塊例如直接在提取塊72或96之后，或在可能已經(jīng)去除了一些低頻噪聲的預(yù)加重塊98之后，或?qū)τ蓧K100所產(chǎn)生的加窗幀數(shù)據(jù)進(jìn)行操作。在必要時(shí)，可以通過(guò)噪聲檢測(cè)塊啟用此降噪塊。該噪聲檢測(cè)塊可以是模擬的，并且監(jiān)控輸入信號(hào)ax，或該噪聲檢測(cè)塊可以是數(shù)字的，并且對(duì)adc輸出dx進(jìn)行操作。該噪聲檢測(cè)塊可以在如下情況下進(jìn)行標(biāo)記：當(dāng)所接收的信號(hào)的水平或頻譜或其他特性表明高噪聲水平時(shí)，或當(dāng)峰值信號(hào)或平均信號(hào)與噪聲的比率下降到一閾值以下時(shí)。

降噪電路系統(tǒng)可以起作用，以對(duì)信號(hào)濾波從而抑制這樣的頻率區(qū)段：在該頻率區(qū)段中，在存在信號(hào)的時(shí)間，噪聲(如由話音活動(dòng)檢測(cè)器所監(jiān)控的，在似乎不存在話音的時(shí)間周期中所監(jiān)控到的噪聲)可能超過(guò)該信號(hào)。例如，維納濾波器設(shè)置可以被用來(lái)在逐幀的基礎(chǔ)上抑制噪聲。維納濾波器系數(shù)可以在逐幀的基礎(chǔ)上更新，并且在應(yīng)用到實(shí)際信號(hào)之前，經(jīng)由梅爾頻率濾波器組進(jìn)行系數(shù)平滑，之后經(jīng)過(guò)逆離散余弦變換。在一些實(shí)施方案中，維納降噪可以包括兩個(gè)階段。每個(gè)階段可以納入某個(gè)動(dòng)態(tài)噪聲增強(qiáng)特征，其中所執(zhí)行的降噪水平取決于所估計(jì)的信噪比或信號(hào)的另外的信號(hào)相關(guān)的參數(shù)或特征或噪聲相關(guān)的參數(shù)或特征。

多種信號(hào)編碼技術(shù)，特別是使用mfcc編碼的倒譜特征提取，與許多已知的下游話音識(shí)別或說(shuō)話人識(shí)別算法兼容，在所述多種信號(hào)編碼技術(shù)中，從與每個(gè)濾波器組相關(guān)聯(lián)的信號(hào)能量中導(dǎo)出所傳輸?shù)妮敵鰯?shù)據(jù)，其中所述濾波器組具有非均勻間隔的中心頻率。在一些情況下，mfcc數(shù)據(jù)實(shí)際上可以從編解碼器轉(zhuǎn)發(fā)(例如，以etsi-標(biāo)準(zhǔn)mfcc形式)，用于在主機(jī)設(shè)備中進(jìn)行信號(hào)處理，或被傳輸?shù)竭h(yuǎn)程服務(wù)器，用于“在云中”處理。后者可以降低傳輸所需的數(shù)據(jù)帶寬，并且可以用來(lái)在較差的傳輸條件下保留語(yǔ)音質(zhì)量。

然而，在一些實(shí)施方案中，可能需要麥克風(fēng)來(lái)遞送更常規(guī)的輸出信號(hào)，所述常規(guī)的輸出信號(hào)以例如16ks/s或48ks/s以例如16-比特格式對(duì)瞬時(shí)輸入音頻信號(hào)進(jìn)行數(shù)字化。

還可能存在需要某種其他格式的信號(hào)的其他應(yīng)用。常規(guī)地，對(duì)信號(hào)的此處理和重新格式化可以發(fā)生在電話應(yīng)用處理器或具有dsp能力的智能編解碼器內(nèi)。然而，考慮到麥克風(fēng)單元中存在dsp電路系統(tǒng)，必需降低待機(jī)模式或“永遠(yuǎn)開啟”模式下的數(shù)字傳輸功率，此dsp電路系統(tǒng)可以用來(lái)在其他使用實(shí)例中執(zhí)行其他語(yǔ)音編碼方法。因?yàn)榘雽?dǎo)體制造工藝隨著不斷減小的特征尺寸而發(fā)展，且因?yàn)檫@些工藝中的每個(gè)工藝的成本隨時(shí)間且隨成熟度而降低，所以在麥克風(fēng)單元自身中實(shí)際集成此功能變得更可行，讓系統(tǒng)中其他地方中任何更強(qiáng)大的處理能力更自由，從而執(zhí)行高水平的任務(wù)?；蛘?，實(shí)際上在一些最終應(yīng)用中，可以去除對(duì)其他信號(hào)處理dsp的要求，以允許使用某個(gè)或許更簡(jiǎn)單的非dsp控制器處理器。

圖7例示了麥克風(fēng)單元130，該麥克風(fēng)單元130可以在多種模式下操作，具有信號(hào)編碼或壓縮的多種程度和方法。因此，圖7示出了若干不同的功能塊。在一些其他實(shí)施方案中，僅存在這些塊的一個(gè)子集。

來(lái)自換能器元件132的模擬輸入信號(hào)被呈遞給adc134(例如，1-比特δ-σadc)，且所得到的δ-σ數(shù)據(jù)流dx之后被傳遞到一個(gè)或多個(gè)功能塊，如下面所描述的。

該adc可以由采樣時(shí)鐘ckm計(jì)時(shí)，該采樣時(shí)鐘ckm可以由本地時(shí)鐘發(fā)生器136生成，或可以根據(jù)操作模式而在時(shí)鐘輸入138上被接收。

該麥克風(fēng)單元可以第一低功率模式和第二較高功率模式操作，在第一低功率模式中，該麥克風(fēng)單元使用內(nèi)部生成的時(shí)鐘且提供壓縮的語(yǔ)音數(shù)據(jù)，在第二較高功率模式中，該麥克風(fēng)單元接收外部時(shí)鐘且提供未壓縮的數(shù)據(jù)。

操作模式可以經(jīng)由控制輸入終端140上所接收的信號(hào)、通過(guò)下游的控制處理器來(lái)控制。這些輸入可以單獨(dú)的，或可以通過(guò)使數(shù)字輸出線雙向來(lái)提供。在一些實(shí)施方案中，操作模式可以由該麥克風(fēng)單元中的電路系統(tǒng)來(lái)自動(dòng)確定。控制塊142接收控制輸入，且確定哪些功能塊被激活。

因此，圖7示出的是，數(shù)據(jù)流dx可以被傳遞到pdm格式化塊144，該pdm格式化塊144允許麥克風(fēng)的數(shù)字化時(shí)域輸出被直接輸出作為pdm流。pdm格式化塊144的輸出被傳遞到多路復(fù)用器146，所述多路復(fù)用器146在控制塊142的控制下操作，且多路復(fù)用器輸出被傳遞到驅(qū)動(dòng)器148，以生成數(shù)字輸出dat。

圖7還示出了被傳遞到特征提取塊150的數(shù)據(jù)流dx，以例如用于獲得基于使用非線性間隔的頻率區(qū)段的值(例如，mfcc值)。

圖7還示出了被傳遞到壓縮采樣塊152數(shù)據(jù)流dx，以例如用于導(dǎo)出輸入信號(hào)的稀疏表示。

圖7還示出了被傳遞到有損壓縮塊154數(shù)據(jù)流dx，以例如用于執(zhí)行自適應(yīng)差分脈碼調(diào)制(adpcm)或類似形式編碼。

圖7還示出了被傳遞到抽取器156的數(shù)據(jù)流dx。

在一些實(shí)施方案中，數(shù)據(jù)流dx還被傳遞到無(wú)損編碼塊，以提供合適的輸出數(shù)據(jù)流。

圖7示出了壓縮采樣塊152、有損壓縮塊154和抽取器156的輸出被連接到相應(yīng)的數(shù)據(jù)緩沖存儲(chǔ)器塊158、160、162。這些數(shù)據(jù)緩沖存儲(chǔ)器塊允許存儲(chǔ)由這些塊所生成的較高質(zhì)量的數(shù)據(jù)。因此，如果對(duì)較低功率數(shù)據(jù)流的分析表明，如果需要，功率可以被耗費(fèi)在傳輸較高質(zhì)量的數(shù)據(jù)，以用于需要這樣的較高質(zhì)量的數(shù)據(jù)的某個(gè)進(jìn)一步處理或檢查。

例如，對(duì)較低功率數(shù)據(jù)流的分析可能表明，音頻信號(hào)包含在特定時(shí)間周期中由設(shè)備所識(shí)別出的用戶說(shuō)出的觸發(fā)短語(yǔ)。在該情況下，可以從緩沖存儲(chǔ)器塊中的一個(gè)讀出與相同時(shí)間周期有關(guān)的較高質(zhì)量的數(shù)據(jù)，且對(duì)那個(gè)數(shù)據(jù)執(zhí)行進(jìn)一步分析，例如以確認(rèn)是否實(shí)際上說(shuō)出該觸發(fā)短語(yǔ)，或該觸發(fā)短語(yǔ)是否由所識(shí)別到的用戶說(shuō)出，或在喚醒下游系統(tǒng)的更大部分之前執(zhí)行更詳細(xì)的關(guān)鍵字檢測(cè)。因此，較高質(zhì)量的數(shù)據(jù)可被用于需要更好數(shù)據(jù)的下游操作，例如下游的語(yǔ)音識(shí)別。

圖7還示出了特征提取塊150、壓縮音頻處理塊152和有損壓縮塊154的輸出經(jīng)由相應(yīng)的脈沖長(zhǎng)度調(diào)制(plm)編碼塊164、166、168且經(jīng)由多路復(fù)用器146和驅(qū)動(dòng)器148而被輸出，所述多路復(fù)用器146在控制塊142的控制下操作。圖7還示出了抽取器156的輸出經(jīng)由脈碼調(diào)制(pcm)編碼塊170且經(jīng)由多路復(fù)用器146和驅(qū)動(dòng)器148而被輸出，所述多路復(fù)用器146在控制塊142的控制下操作。

根據(jù)所選擇的操作模式，所傳輸?shù)妮敵龅奈锢硇问娇梢圆煌?。例如可以使用低壓差分信令?lái)傳輸高數(shù)據(jù)速率模式，以用于噪聲抗擾，且數(shù)據(jù)可以被擾亂以降低發(fā)射。在另一方面，在低數(shù)據(jù)速率模式下，信號(hào)可以是低帶寬的，并且不那么易于受噪聲和傳輸線反射等的影響，優(yōu)選地，信號(hào)是無(wú)端接的，以節(jié)省與驅(qū)動(dòng)終端電阻相關(guān)聯(lián)的功率消耗。在較低功率模式下，可以減小信號(hào)擺動(dòng)，即數(shù)字驅(qū)動(dòng)器供電電壓。

電路的其他操作參數(shù)也可以根據(jù)信號(hào)模式而更改。例如，在低數(shù)據(jù)速率模式中，dsp操作的速度要求可以是適度的，因此，與結(jié)合較高速率編碼執(zhí)行更復(fù)雜的操作時(shí)相比，可以使電路系統(tǒng)在較低的邏輯供電電壓或主時(shí)鐘分頻頻率下操作。

盡管基于以上方案的aic或特征提取可以提供編碼和傳輸音頻信號(hào)中的重要信息的特別有效率的方法，但是可能要求麥克風(fēng)單元也能夠操作，從而提供更常規(guī)的數(shù)據(jù)格式，例如用于通過(guò)本地電路系統(tǒng)處理或向前傳輸以用于在云中處理，其中這樣的處理可能不會(huì)理解更復(fù)雜的信號(hào)表示，或其中例如當(dāng)前的使用情況是用于以高質(zhì)量記錄音樂(lè)。

在此情況下，有利的是，adc中的初始轉(zhuǎn)換是高質(zhì)量的，要求高質(zhì)量低抖動(dòng)時(shí)鐘，且優(yōu)選地與編解碼器dsp主時(shí)鐘同步，以避免采樣速率轉(zhuǎn)換與編解碼器主時(shí)鐘同步和/或與標(biāo)準(zhǔn)輸出數(shù)字pcm格式的參考采樣速率同步的問(wèn)題。因此，麥克風(fēng)單元可以第一模式和第二模式操作，在第一模式中執(zhí)行特征提取和/或數(shù)據(jù)壓縮，在第二模式中(例如)從編解碼器供應(yīng)一個(gè)時(shí)鐘，并且該單元以與圖1中示出的方式類似的方式操作。

因此，數(shù)字麥克風(fēng)單元能夠以至少兩種模式操作，所述至少兩種模式為adc(模擬-數(shù)字轉(zhuǎn)換)或aic(模擬-信息轉(zhuǎn)換)。在adc模式中，傳輸來(lái)自adc的pcm數(shù)據(jù)，在aic模式中，從adc輸出所提取的數(shù)據(jù)被編碼，特別是對(duì)于語(yǔ)音。

在其他實(shí)施方案中，麥克風(fēng)單元可以一種模式操作，以執(zhí)行有損低比特率pcm編碼。例如，該單元可以包括一個(gè)有損編解碼器，諸如adpcm編碼器，具有在一些實(shí)施方案中可選擇的采樣速率，例如在8ks/s-24ks/s之間。

在一些實(shí)施方案中，麥克風(fēng)單元具有編碼塊，用于執(zhí)行μ律編碼和/或a律編碼，或編碼至某個(gè)其他電話標(biāo)準(zhǔn)。例如，在一些實(shí)施方案中，麥克風(fēng)單元具有用于mdct、mdct-混合子帶、celp、acelp、兩級(jí)噪聲反饋編碼(tsnfc)、vselp、rpe-ltp、lpc、變換編碼或mlt編碼的編碼塊。

在其他實(shí)施方案中，麥克風(fēng)單元可以一種它輸出壓縮采樣pcm數(shù)據(jù)模式操作，或以利用信號(hào)稀疏性的任何方案操作。

圖8例示了壓縮語(yǔ)音編碼器的一個(gè)實(shí)施方案，所述壓縮語(yǔ)音編碼器可以在本文所描述的或例示的實(shí)施方案中的任一個(gè)中使用。adc190的輸出被傳遞通過(guò)抽取器192，以以16ks/s或48ks/s提供(例如)12比特?cái)?shù)據(jù)。以例如僅48hz或1khz的平均采樣速率對(duì)此數(shù)據(jù)進(jìn)行采樣，但是其中采樣時(shí)間由合適的隨機(jī)數(shù)發(fā)生器或隨機(jī)脈沖發(fā)生器194隨機(jī)化。

因此，采樣電路以小于輸入信號(hào)帶寬的采樣速率對(duì)輸入信號(hào)采樣，導(dǎo)致采樣時(shí)刻在時(shí)間上隨機(jī)分布。

圖9示出了使用這樣的壓縮語(yǔ)音編碼器的系統(tǒng)。因此，包括壓縮adc202的麥克風(fēng)單元200被連接，以將非常低數(shù)據(jù)速率的數(shù)據(jù)供應(yīng)到編解碼器204。在信號(hào)統(tǒng)計(jì)的現(xiàn)有知識(shí)的幫助下，下游的電路系統(tǒng)206可以執(zhí)行局部重構(gòu)(在計(jì)算上便宜)，以在低功率模式中進(jìn)行稀疏特征提取，或執(zhí)行完整重構(gòu)(計(jì)算上花費(fèi)較大)，以得到乃奎斯特類型的話音，用于向前傳輸。注意，存在已知的后續(xù)處理算法塊，諸如塊208，用于執(zhí)行與這樣的壓縮采樣格式兼容的“稀疏識(shí)別”。在這樣的算法中，信號(hào)的稀疏表示與來(lái)自預(yù)定字典的幾個(gè)原子的線性組合相匹配，所述原子可以通過(guò)使用機(jī)器學(xué)習(xí)技術(shù)來(lái)學(xué)習(xí)直接來(lái)自數(shù)據(jù)的主要信號(hào)(原子)的超完備字典來(lái)先驗(yàn)地獲得，以使得信號(hào)的最相關(guān)的屬性可以被有效地捕獲。

在存在噪聲時(shí)，稀疏提取在執(zhí)行特征提取方面具有一些益處。噪聲不被識(shí)別為包括任何原子分量，所以不出現(xiàn)在編碼數(shù)據(jù)中。這樣的對(duì)輸入噪聲的忽略從而可以避免下游的電路系統(tǒng)的非必需激活，且避免相對(duì)于安靜的環(huán)境在嘈雜的環(huán)境中增加的功率消耗。

圖10例示了一個(gè)實(shí)施方案，在該實(shí)施方案中，麥克風(fēng)單元210被連接以將非常低數(shù)據(jù)速率的數(shù)據(jù)供應(yīng)到編解碼器212，并且在該實(shí)施方案中，為了進(jìn)一步降低功率消耗，使用模擬信號(hào)處理(asp)執(zhí)行特征提取中的一些(如果不是全部)。在麥克風(fēng)單元210中，此來(lái)自麥克風(fēng)換能器的信號(hào)被傳遞到模擬信號(hào)處理器214，之后傳遞到一個(gè)或多個(gè)模擬-數(shù)字轉(zhuǎn)換器216，之后傳遞到可選的數(shù)字信號(hào)處理器218。之后，在編解碼器212中執(zhí)行特征識(shí)別220。

圖11更詳細(xì)地示出了麥克風(fēng)單元210的一個(gè)實(shí)施方案內(nèi)部的處理，在該實(shí)施方案中，通過(guò)模擬電路系統(tǒng)而非數(shù)字電路系統(tǒng)執(zhí)行信號(hào)處理的很大一部分。因此，輸入信號(hào)被傳遞通過(guò)多個(gè)帶通濾波器(僅僅通過(guò)例示的方式在圖11中示出了三個(gè))240、242、246。帶通濾波器是常量q，并且在梅爾頻率中等間隔。輸出被傳遞到對(duì)數(shù)函數(shù)塊248、250、252，這可以使用標(biāo)準(zhǔn)模擬設(shè)計(jì)技術(shù)來(lái)實(shí)現(xiàn)，所述標(biāo)準(zhǔn)模擬設(shè)計(jì)技術(shù)例如基于經(jīng)由電壓-電流轉(zhuǎn)換信號(hào)而將輸入信號(hào)應(yīng)用到具有對(duì)數(shù)電流-電壓轉(zhuǎn)變的i-v雙端口電路(諸如，半導(dǎo)體二極管)。輸出被傳遞到多個(gè)并行adc252、254、256。adc可以包括壓控振蕩器，該壓控振蕩器的頻率被用作它們相應(yīng)的輸入信號(hào)的表示。這些adc是簡(jiǎn)單的并且低功率的，并且它們的線性度在此應(yīng)用中不重要。與主adc相比，這些簡(jiǎn)單的adc可以具有顯著甚至完全降低的功率和面積。在例如在人工耳蝸領(lǐng)域中，類似的電路塊的現(xiàn)有技術(shù)水平在20微瓦以下。

本文描述的所有實(shí)施方案中，麥克風(fēng)、adc和語(yǔ)音編碼電路系統(tǒng)可以有利地被定位成緊靠在一起，以在數(shù)據(jù)速率降低之前降低數(shù)字?jǐn)?shù)據(jù)的高數(shù)據(jù)速率信號(hào)路徑。所有三個(gè)部件可以被封裝在一起。這三個(gè)部件中的至少兩個(gè)可以被共同集成在一個(gè)集成電路上。

麥克風(fēng)可以是mems換能器，該mems換能器可以是電容式的、壓電式的或壓阻式的，并且至少與adc共同集成。

本領(lǐng)域技術(shù)人員將認(rèn)識(shí)到，上文所描述的裝置和方法的多個(gè)實(shí)施方案可以(至少部分地)使用可編程部件而非專用硬件部件來(lái)實(shí)施。因此，所述裝置和方法的實(shí)施方案可以至少部分地體現(xiàn)為處理器控制代碼，例如在非易失性載體介質(zhì)(諸如，磁盤、cd-rom或dvd-rom、程序化存儲(chǔ)器，諸如只讀存儲(chǔ)器(固件))上或在數(shù)據(jù)載體(諸如，光學(xué)信號(hào)載體或電信號(hào)載體)上。在一些應(yīng)用中，本發(fā)明的實(shí)施方案可以至少部分地通過(guò)dsp(數(shù)字信號(hào)處理器)、asic(專用集成電路)或fpga(現(xiàn)場(chǎng)可編程門陣列)來(lái)實(shí)施。因此，代碼可以包括常規(guī)程序代碼或微代碼，或例如用于設(shè)立或控制asic或fpga的代碼。代碼還可以包括用于動(dòng)態(tài)地配置可重新配置的裝置(諸如，可重新編程邏輯門陣列)的代碼。類似地，代碼可以包括硬件描述語(yǔ)言(諸如，verilogtm或vhdl(超高速集成電路硬件描述語(yǔ)言))的代碼。如本領(lǐng)域技術(shù)人員將理解，代碼可以被分布在彼此通信的多個(gè)耦合的部件之間。在適當(dāng)?shù)那闆r下，還可以使用在現(xiàn)場(chǎng)可(重新)編程模擬陣列或類似的設(shè)備上運(yùn)行以配置模擬硬件的代碼來(lái)實(shí)施所述實(shí)施方案。

應(yīng)理解，尤其是得益于此公開內(nèi)容的本領(lǐng)域普通技術(shù)人員應(yīng)理解，本文描述的多種操作，特別是參考附圖描述的多種操作，可以通過(guò)其他電路系統(tǒng)或其他硬件部件來(lái)實(shí)施。給定方法的每一操作執(zhí)行的順序可以被改變，且本文中例示的系統(tǒng)的多個(gè)元件可以被添加、被重排順序、被組合、被省略、被修改等。此公開內(nèi)容意在包含所有這樣的修改和改變，因此，上文的描述應(yīng)被認(rèn)為具有例示性意義而非限制性意義。

類似地，盡管此公開內(nèi)容參考具體實(shí)施方案，但是在不背離此公開內(nèi)容的覆蓋范圍的前提下，可以對(duì)這些實(shí)施方案進(jìn)行修改和改變。此外，本文關(guān)于具體實(shí)施方案所描述的任何益處、優(yōu)點(diǎn)或問(wèn)題的解決方案不意在被理解為關(guān)鍵的、必需的或基本的特征和要素。

受益于此公開內(nèi)容，本領(lǐng)域普通技術(shù)人員同樣將明了另一些實(shí)施方案，并且這樣的實(shí)施方案應(yīng)被視為包含在本文中。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁(yè)1 2

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：J·P·萊索;J·L·梅蘭森
技術(shù)所有人：思睿邏輯國(guó)際半導(dǎo)體有限公司
我是此專利的發(fā)明人

上一篇：自動(dòng)識(shí)別正負(fù)極充電器電路的制造方法與工藝
上一篇：一種集成控制器的控制電路的制造方法與工藝

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、王老師：1.數(shù)字信號(hào)處理 2.傳感器技術(shù)及應(yīng)用 3.機(jī)電一體化產(chǎn)品開發(fā) 4.機(jī)械工程測(cè)試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機(jī)器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動(dòng)信號(hào)時(shí)頻分析理論與測(cè)試系統(tǒng)設(shè)計(jì) 2.汽車檢測(cè)系統(tǒng)設(shè)計(jì) 3.汽車電子控制系統(tǒng)設(shè)計(jì)
4、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
5、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

qq語(yǔ)音麥克風(fēng)調(diào)節(jié)相關(guān)技術(shù)

qq語(yǔ)音麥克風(fēng)增強(qiáng)相關(guān)技術(shù)

qq語(yǔ)音麥克風(fēng)聲音小相關(guān)技術(shù)

qq語(yǔ)音麥克風(fēng)沒(méi)有聲音相關(guān)技術(shù)

qq語(yǔ)音未檢測(cè)到麥克風(fēng)相關(guān)技術(shù)

yy語(yǔ)音麥克風(fēng)沒(méi)有聲音相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

包括集成語(yǔ)音分析的麥克風(fēng)單元的制作方法