用于基于傳感器數(shù)據(jù)進(jìn)行處理器喚醒的系統(tǒng)和方法
【專(zhuān)利摘要】一種用于基于傳感器數(shù)據(jù)進(jìn)行處理器喚醒的系統(tǒng)包括音頻緩沖區(qū)、包絡(luò)緩沖區(qū)和處理器。所述音頻緩沖區(qū)被配置以存儲(chǔ)來(lái)自傳感器的第一數(shù)據(jù)。所述第一數(shù)據(jù)根據(jù)第一采樣率生成。所述包絡(luò)緩沖區(qū)被配置以存儲(chǔ)第二數(shù)據(jù),所述第二數(shù)據(jù)根據(jù)第二采樣率從所述第一數(shù)據(jù)導(dǎo)出,所述第二采樣率小于所述第一采樣率。所述處理器被配置以從空閑狀態(tài)周期性地喚醒并從所述包絡(luò)緩沖區(qū)讀取所述第二數(shù)據(jù)。如果所述第二數(shù)據(jù)指示活動(dòng),那么所述處理器被配置以從所述音頻緩沖區(qū)讀取所述第一數(shù)據(jù)。如果所述第二數(shù)據(jù)不指示活動(dòng),那么所述處理器被配置以返回到所述空閑狀態(tài)。
【專(zhuān)利說(shuō)明】用于基于傳感器數(shù)據(jù)進(jìn)行處理器喚醒的系統(tǒng)和方法
【技術(shù)領(lǐng)域】
[0001]本公開(kāi)一般涉及電子設(shè)備領(lǐng)域,且更具體涉及一種用于基于傳感器數(shù)據(jù)進(jìn)行處理器喚醒的系統(tǒng)和方法。
【背景技術(shù)】
[0002]語(yǔ)音命令設(shè)備(V⑶)是用人聲控制的設(shè)備。通過(guò)摒棄按鈕、旋鈕和開(kāi)關(guān),消費(fèi)者可在他們的手不得空或進(jìn)行其它任務(wù)時(shí)容易地操作電器。例如,消費(fèi)者可用語(yǔ)音激活命令操作他們的電視或手機(jī)。VCD可與說(shuō)話者無(wú)關(guān)、響應(yīng)于多種聲音,而不受口音或方言的影響。VCD可用于各種應(yīng)用,包括計(jì)算機(jī)操作系統(tǒng)、用于計(jì)算機(jī)、手機(jī)、汽車(chē)、呼叫中心和互聯(lián)網(wǎng)搜索引擎的商業(yè)軟件。
【發(fā)明內(nèi)容】
[0003]一種用于基于傳感器數(shù)據(jù)進(jìn)行處理器喚醒的系統(tǒng)包括音頻緩沖區(qū)、包絡(luò)緩沖區(qū)和處理器。音頻緩沖區(qū)被配置以存儲(chǔ)來(lái)自傳感器的第一數(shù)據(jù)。第一數(shù)據(jù)根據(jù)第一采樣率生成。包絡(luò)緩沖區(qū)被配置以存儲(chǔ)第二數(shù)據(jù),所述第二數(shù)據(jù)根據(jù)第二采樣率從第一數(shù)據(jù)導(dǎo)出,所述第二采樣率小于第一采樣率。處理器被配置以從空閑狀態(tài)周期性地喚醒并從包絡(luò)緩沖區(qū)讀取第二數(shù)據(jù)。如果第二數(shù)據(jù)指示活動(dòng),那么處理器被配置以從音頻緩沖區(qū)讀取第一數(shù)據(jù)。如果第二數(shù)據(jù)不指示活動(dòng),那么處理器被配置以返回到空閑狀態(tài)。包絡(luò)緩沖區(qū)可能比音頻緩沖區(qū)短。
[0004]在具體實(shí)施方案中,系統(tǒng)還包括模擬數(shù)字轉(zhuǎn)換器,其被配置以根據(jù)第一采樣率從模擬信號(hào)生成數(shù)字格式的第一數(shù)據(jù)。在一些實(shí)施方案中,系統(tǒng)還包括促進(jìn)讀取音頻緩沖區(qū)和包絡(luò)緩沖區(qū)的直接存儲(chǔ)器存取(DMA)控制器。在具體實(shí)施方案中,也可包括計(jì)時(shí)器,其被配置以周期性地發(fā)送中斷到處理器。在特定實(shí)施方案中,系統(tǒng)還包括被配置以檢測(cè)第一數(shù)據(jù)的包絡(luò)的包絡(luò)檢測(cè)器,和被配置以降采樣包絡(luò)以根據(jù)第二采樣率生成第二數(shù)據(jù)的抽取器。系統(tǒng)還可包括帶通濾波器,其被配置以過(guò)濾第一數(shù)據(jù)并把過(guò)濾的數(shù)據(jù)饋送到包絡(luò)檢測(cè)器。
[0005]在一些實(shí)施方案中,第一數(shù)據(jù)可從音頻信號(hào)生成。在此類(lèi)實(shí)施方案中,系統(tǒng)被配置以執(zhí)行以下各項(xiàng)的操作:過(guò)濾掉第一數(shù)據(jù)中在正常人聲范圍之外的頻率以生成第一數(shù)據(jù)的子集;檢測(cè)子集的包絡(luò);確定包絡(luò)和負(fù)峰值之間的差;和如果差超過(guò)預(yù)定閾值就檢測(cè)活動(dòng)。另外的操作可包括:歸一化子集的包絡(luò);比較歸一化的包絡(luò)與第二負(fù)峰值;如果在預(yù)定數(shù)量的時(shí)鐘周期期間歸一化的包絡(luò)不小于第二負(fù)峰值,就把第二負(fù)峰值遞增固定量以獲得負(fù)峰值;和如果歸一化的包絡(luò)小于第二負(fù)峰值,就把負(fù)峰值設(shè)置為第二負(fù)峰值。
【專(zhuān)利附圖】
【附圖說(shuō)明】
[0006]為了提供對(duì)本公開(kāi)及其特征和優(yōu)勢(shì)的更完整的理解,可參考結(jié)合附圖進(jìn)行的以下描述,其中相同的參考數(shù)字表示相同的部件,在附圖中:[0007]圖1是根據(jù)一個(gè)實(shí)施方案用于基于傳感器數(shù)據(jù)進(jìn)行處理器喚醒的系統(tǒng)的簡(jiǎn)化電路圖;
[0008]圖2是根據(jù)一個(gè)實(shí)施方案的系統(tǒng)的示范性細(xì)節(jié)的簡(jiǎn)化框圖;
[0009]圖3是示出可與系統(tǒng)的示范性實(shí)施方案相關(guān)的示范性操作的簡(jiǎn)化流程圖;
[0010]圖4是示出可與系統(tǒng)的示范性實(shí)施方案相關(guān)的其它示范性操作的簡(jiǎn)化流程圖;和
[0011]圖5是示出可與系統(tǒng)的示范性實(shí)施方案相關(guān)的另外的示范性操作的簡(jiǎn)化流程圖。
【具體實(shí)施方式】
[0012]本公開(kāi)提供一種系統(tǒng),其中傳感器(諸如麥克風(fēng))可基于傳感器的輸出中一個(gè)或多個(gè)檢測(cè)到的變化來(lái)喚醒另一系統(tǒng)(諸如微處理器)。通常,VCD (諸如手機(jī))提供對(duì)外部聲場(chǎng)的不間斷監(jiān)控,使得VCD可根據(jù)語(yǔ)音命令擺脫"待機(jī)"模式。所述監(jiān)控可使用超低功耗不間斷觸發(fā)檢測(cè)器電路來(lái)實(shí)施,所述超低功耗不間斷觸發(fā)檢測(cè)器電路檢測(cè)傳感器輸出中的變化并然后喚醒微處理器。然而,方案需要很多算法(諸如語(yǔ)音識(shí)別算法),所述算法需要預(yù)觸發(fā)數(shù)據(jù)來(lái)有效地操作。
[0013]為了克服這個(gè)缺點(diǎn),一些系統(tǒng)使用不間斷循環(huán)存儲(chǔ)器緩沖區(qū)來(lái)連續(xù)存儲(chǔ)數(shù)據(jù),使得當(dāng)?shù)凸膫鞲衅鳈z測(cè)電路檢測(cè)到活動(dòng)時(shí),處理器可訪問(wèn)存儲(chǔ)在循環(huán)存儲(chǔ)器緩沖區(qū)中的預(yù)觸發(fā)數(shù)據(jù)。如本文所使用,術(shù)語(yǔ)“活動(dòng)"可代表傳感器接收到的天然信號(hào)(例如,音頻信號(hào))的幅度(或其它參數(shù))中的變化。其它系統(tǒng)可消除不間斷低功耗觸發(fā)檢測(cè)器,并使用不間斷循環(huán)緩沖區(qū)(例如,使用單個(gè)、固定大小的緩沖區(qū)似乎它被端到端連接的數(shù)據(jù)結(jié)構(gòu))。循環(huán)緩沖區(qū)開(kāi)始是空的且通常具有預(yù)定長(zhǎng)度。當(dāng)需要時(shí),最早的記錄首先從循環(huán)緩沖區(qū)除去。當(dāng)循環(huán)緩沖區(qū)已滿(mǎn)并對(duì)循環(huán)緩沖區(qū)執(zhí)行后續(xù)寫(xiě)入時(shí),最早的數(shù)據(jù)被覆蓋。有時(shí),基于使用循環(huán)緩沖區(qū)的緩沖例程或應(yīng)用的語(yǔ)義,并不是覆蓋,而是可能出現(xiàn)異?;蝈e(cuò)誤。
[0014]處理器可被設(shè)置以從空閑狀態(tài)周期性地喚醒(例如,其中處理器使用低功耗且不執(zhí)行任何應(yīng)用的處理器狀態(tài);也可稱(chēng)為待機(jī)模式、低功耗模式或睡眠模式)并檢查循環(huán)緩沖區(qū)以確定是否已發(fā)生任何活動(dòng)。在空閑狀態(tài),可關(guān)閉各種電路和處理器的部分。關(guān)閉的電路的數(shù)量越多,功耗越低且喚醒時(shí)間越長(zhǎng)。如果沒(méi)有活動(dòng),那么處理器可回到空閑狀態(tài)。如果處理器活動(dòng)的工作周期小,那么處理器消耗的平均功率也會(huì)小。在此類(lèi)情況下,循環(huán)緩沖區(qū)的大小比起處理器喚醒間隔必需足夠大,使得有足夠的余量來(lái)恢復(fù)各種語(yǔ)音識(shí)別和其它算法所需的預(yù)觸發(fā)數(shù)據(jù)。例如,為了以16KHz的采樣率來(lái)存儲(chǔ)200ms的音頻數(shù)據(jù),可能需要3K字的循環(huán)緩沖區(qū)長(zhǎng)度。處理器可能因此需要花費(fèi)更長(zhǎng)的時(shí)間來(lái)讀取循環(huán)緩沖區(qū)并尋找指示活動(dòng)的觸發(fā),由于較長(zhǎng)蘇醒期,這可能導(dǎo)致處理器的大功耗。
[0015]參考圖1,圖1是基于傳感器數(shù)據(jù)進(jìn)行處理器喚醒的系統(tǒng)10的簡(jiǎn)化框圖。系統(tǒng)10包括傳感器12 (例如,麥克風(fēng)或mic),傳感器12捕獲天然信號(hào)(例如,聽(tīng)覺(jué)信號(hào)、光信號(hào)等)并把它們轉(zhuǎn)換成模擬信號(hào)(例如,電壓信號(hào)、電流信號(hào))。傳感器12可耦接到模擬數(shù)字轉(zhuǎn)換器(ADC) 14。來(lái)自傳感器12的模擬信號(hào)可被ADC14根據(jù)第一米樣率轉(zhuǎn)換成第一數(shù)據(jù),包括數(shù)字信號(hào)。如本文所使用,"采樣率"包括每單位時(shí)間從連續(xù)模擬信號(hào)取的形成離散數(shù)字信號(hào)的樣本的數(shù)量。直接存儲(chǔ)器存取(DMA)控制器16可促進(jìn)把第一數(shù)據(jù)存儲(chǔ)到存儲(chǔ)器元件20的音頻緩沖區(qū)18中。如本文所使用,術(shù)語(yǔ)“音頻緩沖區(qū)"包括被配置以存儲(chǔ)來(lái)自傳感器12的第一數(shù)據(jù)的緩沖區(qū)(例如,循環(huán)緩沖區(qū))。如本說(shuō)明書(shū)中本文所使用,"數(shù)據(jù)"代表定量項(xiàng)目的值,例如來(lái)自ADC14的數(shù)字信號(hào)。
[0016]根據(jù)各種實(shí)施方案,帶通濾波器(〃帶通〃)22也可處理來(lái)自ADC14的第一數(shù)據(jù)。帶通22可除去第一數(shù)據(jù)中在預(yù)定〃正?!ㄈ寺暦秶?例如,300Hz到3400Hz)之外的頻率。來(lái)自帶通22的輸出信號(hào)可形成第一數(shù)據(jù)的子集、可通過(guò)包絡(luò)檢測(cè)器24傳遞,包絡(luò)檢測(cè)器24可確定子集的包絡(luò)。如本文所使用,術(shù)語(yǔ)數(shù)據(jù)的“包絡(luò)〃包括概述數(shù)據(jù)幅度極值的輪廓的曲線。包絡(luò)可由包絡(luò)檢測(cè)器24基于與第一數(shù)據(jù)的子集相關(guān)的任何合適的參數(shù)來(lái)生成。例如,包絡(luò)可基于第一數(shù)據(jù)的子集的適當(dāng)?shù)膮?shù)進(jìn)行檢測(cè),例如均方根(RMS)、平均值、峰值和準(zhǔn)峰值。
[0017]在包絡(luò)檢測(cè)基于峰值的實(shí)施方案中,包絡(luò)檢測(cè)器24包括整流器后面是低通濾波器以提取由來(lái)自帶通22的信號(hào)的慢(相對(duì)于ADC采樣率)時(shí)變幅度組成的基帶信號(hào)。在包絡(luò)檢測(cè)基于準(zhǔn)峰值的實(shí)施方案中,包絡(luò)檢測(cè)器24包括具有快速上升時(shí)間和較長(zhǎng)下降時(shí)間的額外有耗積分器。在包絡(luò)檢測(cè)基于RMS的實(shí)施方案中,來(lái)自包絡(luò)檢測(cè)器24的包絡(luò)輸出是與來(lái)自帶通22的信號(hào)的包絡(luò)成比例的電壓,獨(dú)立于來(lái)自帶通22的信號(hào)的峰值對(duì)平均值比。在包絡(luò)檢測(cè)基于平均值的實(shí)施方案中,包絡(luò)檢測(cè)器24除了 RMS包絡(luò)檢測(cè)器還可包括平均值檢測(cè)器。包絡(luò)檢測(cè)器24也可例如基于不同的已知算法中的許多任何一個(gè)或多個(gè)而使用軟件來(lái)實(shí)施,所述已知算法包括均方根(RMS)、平均值、峰值、準(zhǔn)峰值或其它類(lèi)型的能量檢測(cè)算法。
[0018]在各種實(shí)施方案中,包絡(luò)檢測(cè)器24可形成語(yǔ)音活動(dòng)檢測(cè)器(VAD)的一部分。在一些實(shí)施方案中,VAD可部分用硬件(例如,包絡(luò)檢測(cè)器24)實(shí)施且部分用軟件實(shí)施,所述軟件可嵌入包絡(luò)檢測(cè)器24,和/或與包絡(luò)檢測(cè)器24分開(kāi)實(shí)施。包絡(luò)檢測(cè)器24的輸出信號(hào)比起來(lái)自帶通濾波器22的輸入信號(hào)可能變化較緩慢,且輸出信號(hào)可被抽取器26抽取(例如,降采樣、二次采樣)為第二 (較低)采樣率以生成第二數(shù)據(jù)。第二采樣率因此小于第一采樣率。
[0019]來(lái)自抽取器26的降采樣的第二數(shù)據(jù)可存儲(chǔ)在存儲(chǔ)器元件20的包絡(luò)緩沖區(qū)28中。如本文所使用,術(shù)語(yǔ)“包絡(luò)緩沖區(qū)"包括被配置以存儲(chǔ)來(lái)自傳感器12的第二數(shù)據(jù)的緩沖區(qū)(例如,循環(huán)緩沖區(qū))。音頻緩沖區(qū)18可記錄與包絡(luò)緩沖區(qū)28相同的絕對(duì)時(shí)間長(zhǎng)度,但是因?yàn)榘j(luò)緩沖區(qū)28的輸入被抽取為較低第二采樣率,所以包絡(luò)緩沖區(qū)28的緩沖區(qū)大小可相應(yīng)地比音頻緩沖區(qū)18的緩沖區(qū)大小要小。因此,包絡(luò)緩沖區(qū)28可比音頻緩沖區(qū)18短。在一些實(shí)施方案中,包絡(luò)檢測(cè)器24的輸出在被抽取并寫(xiě)入包絡(luò)緩沖區(qū)28作為第二數(shù)據(jù)之前可能可選地轉(zhuǎn)換成對(duì)數(shù)刻度。在一些實(shí)施方案中,由于包絡(luò)緩沖區(qū)28的大小較小,可減小VAD執(zhí)行的存儲(chǔ)器訪問(wèn)和計(jì)算的量。
[0020]處理器30可通過(guò)DMA控制器16與存儲(chǔ)器元件20通信。例如,處理器30可使用DMA控制器16來(lái)啟動(dòng)讀取操作,從而開(kāi)始存儲(chǔ)器訪問(wèn)過(guò)程。DMA控制器16可生成地址并啟動(dòng)存儲(chǔ)器讀取或?qū)懭胫芷凇MA控制器16可包含可由處理器30讀取或?qū)懭氲娜舾杉拇嫫?。寄存器包括存?chǔ)器地址寄存器、字節(jié)計(jì)數(shù)寄存器和一個(gè)或多個(gè)控制寄存器??刂萍拇嫫髦付ㄊ褂玫妮斎?輸出(I/O)端口、傳輸?shù)姆较?例如,從I/O設(shè)備讀取或?qū)懭隝/O設(shè)備)、傳輸單位(例如,每次以字節(jié)或每次以字為傳輸單位)和在一個(gè)數(shù)據(jù)串中要傳輸?shù)淖止?jié)的數(shù)量。
[0021]為了執(zhí)行輸入、輸出或存儲(chǔ)器到存儲(chǔ)器操作,處理器30可用要傳輸?shù)淖謹(jǐn)?shù)的計(jì)數(shù)和要使用的存儲(chǔ)器地址(例如,包絡(luò)緩沖區(qū)28的存儲(chǔ)器地址)來(lái)初始化DMA控制器16。DMA控制器16可提供地址和讀取/寫(xiě)入控制線到存儲(chǔ)器元件20。每次準(zhǔn)備在處理器30和存儲(chǔ)器之間傳輸數(shù)據(jù)字時(shí),DMA控制器16可遞增其內(nèi)部地址寄存器,直到傳輸了整個(gè)數(shù)據(jù)塊為止。存儲(chǔ)器訪問(wèn)的各種其它模式可在實(shí)施方案的廣泛范圍中實(shí)施。在一些實(shí)施方案中,DMA控制器16可包括處理器30的一部分(或位于處理器30中)。
[0022]處理器30可執(zhí)行與數(shù)據(jù)相關(guān)的任何類(lèi)型的指令以實(shí)現(xiàn)本說(shuō)明書(shū)中本文詳述的操作。在一個(gè)實(shí)例中,處理器30可把元件或制品(例如,數(shù)據(jù))從一個(gè)狀態(tài)或事物轉(zhuǎn)換成另一狀態(tài)或事物。在另一實(shí)例中,本文概述的活動(dòng)可用固定邏輯或可編程邏輯(例如,處理器執(zhí)行的軟件/計(jì)算機(jī)指令)來(lái)實(shí)施,且本文指定的元件可為某種類(lèi)型的可編程處理器、可編程數(shù)字邏輯(例如,現(xiàn)場(chǎng)可編程門(mén)陣列(FPGA)、可擦除可編程只讀存儲(chǔ)器(EPR0M)、電可擦除可編程只讀存儲(chǔ)器(EEPROM))或包括數(shù)字邏輯、軟件、代碼、電子指令、快閃存儲(chǔ)器、光盤(pán)、CD-ROM、DVD ROM、磁卡或光卡、適于存儲(chǔ)電子指令的其它類(lèi)型的機(jī)器可讀介質(zhì)或它們?nèi)魏魏线m組合的專(zhuān)用集成電路(ASIC)。任何潛在的處理元件、模塊、微處理器、數(shù)字信號(hào)處理器(DSP)和本說(shuō)明書(shū)中描述的其它設(shè)備應(yīng)理解為包括在廣義的術(shù)語(yǔ)“處理器〃中。例如,處理器30可包括DSP和微控制器中至少一個(gè)。
[0023]計(jì)時(shí)器32可周期性地中斷處理器30并使處理器30喚醒、讀取包絡(luò)緩沖區(qū)28并對(duì)存儲(chǔ)在包絡(luò)緩沖區(qū)28中的數(shù)據(jù)執(zhí)行語(yǔ)音活動(dòng)檢測(cè)算法。在一些實(shí)施方案中,計(jì)時(shí)器32可為外部集成電路,且在其它實(shí)施方案中,計(jì)時(shí)器32可包括在與處理器30的相同硅芯片上作為外圍組件。計(jì)時(shí)器32的各種其它實(shí)施可用于實(shí)施方案的廣泛范圍中。根據(jù)一些實(shí)施方案,存儲(chǔ)在包絡(luò)緩沖區(qū)28中的第二數(shù)據(jù)可應(yīng)用到對(duì)數(shù)塊,所述對(duì)數(shù)塊輸出以dB計(jì)的包絡(luò)信號(hào)。對(duì)數(shù)塊可進(jìn)行語(yǔ)音檢測(cè),獨(dú)立于絕對(duì)信號(hào)電平。或者,分配器(例如,硬件或等效軟件實(shí)施中的功率分配器)可用以取第一數(shù)據(jù)代表的能量的比率。對(duì)數(shù)輸出可應(yīng)用于具有保持功能的負(fù)峰值檢測(cè)器。如果負(fù)峰值檢測(cè)器的輸入小于先前存儲(chǔ)的負(fù)峰值,那么負(fù)峰值可設(shè)置為等于輸入。
[0024]如果輸入大于存儲(chǔ)的負(fù)峰值,且達(dá)到某一固定預(yù)定數(shù)量的時(shí)鐘周期等于保持的計(jì)數(shù)參數(shù)的條件(可通常設(shè)為從0.5s到4s范圍中的時(shí)間段),那么存儲(chǔ)的負(fù)峰值可遞增固定量。包絡(luò)和負(fù)峰值檢測(cè)器的輸出之間的差可應(yīng)用于閾值。如果差超過(guò)閾值,那么輸出可能指示活動(dòng)(例如,語(yǔ)音信號(hào)的開(kāi)端)。在一些實(shí)施方案中,對(duì)數(shù)塊或分配器和負(fù)峰值檢測(cè)器可實(shí)施為嵌入包絡(luò)檢測(cè)器24或與之分開(kāi)的軟件模塊。
[0025]基于VAD算法結(jié)果,處理器30可確定已檢測(cè)到活動(dòng)。處理器30然后可執(zhí)行其它合適的任務(wù),例如警示系統(tǒng)10是其中一個(gè)部分的較大系統(tǒng)的其它組件,或執(zhí)行關(guān)鍵字匹配算法以解釋語(yǔ)音信號(hào)(如果檢測(cè)到的活動(dòng)是語(yǔ)音信號(hào)的開(kāi)端)。處理器30可從音頻緩沖區(qū)18讀取第一數(shù)據(jù)以確定與來(lái)自存儲(chǔ)的潛在關(guān)鍵字集合(例如,〃開(kāi)始"、〃打開(kāi)〃等)的一個(gè)或多個(gè)關(guān)鍵字相匹配。如果檢測(cè)到關(guān)鍵字,那么處理器30可發(fā)信號(hào)給系統(tǒng)10中的其它組件以采取一些行動(dòng),或處理器30可執(zhí)行合適的某一其它任務(wù)來(lái)控制系統(tǒng)10。如果沒(méi)有發(fā)現(xiàn)關(guān)鍵字,那么處理器30可返回到空閑狀態(tài)并等待另一 VAD事件(例如,聽(tīng)覺(jué)信號(hào)的開(kāi)端)。任何合適的關(guān)鍵字檢測(cè)算法可用于系統(tǒng)10的實(shí)施方案的廣泛范圍中。
[0026]轉(zhuǎn)向圖2,圖2是示出系統(tǒng)10的實(shí)施方案的示范性細(xì)節(jié)的簡(jiǎn)圖。傳感器12檢測(cè)的語(yǔ)音信號(hào)40可用數(shù)字形式存儲(chǔ)在音頻緩沖區(qū)18中。語(yǔ)音信號(hào)40可導(dǎo)致包絡(luò)檢測(cè)器24的輸出42。計(jì)時(shí)器輸出44指示計(jì)時(shí)器32可輸出信號(hào)到處理器30的時(shí)刻。在計(jì)時(shí)器32的每個(gè)“標(biāo)記”(例如,計(jì)時(shí)器輸出44 (1),44 (2),44 (3)等)上,處理器30可喚醒并執(zhí)行各種活動(dòng)46。例如,處理器30可在計(jì)時(shí)器輸出44 (I)執(zhí)行活動(dòng)48?;顒?dòng)48可包括讀取包絡(luò)緩沖區(qū)28并對(duì)存儲(chǔ)在包絡(luò)緩沖區(qū)28中的數(shù)據(jù)執(zhí)行VAD算法。
[0027]假設(shè),只為了說(shuō)明而不是作為限制,前兩個(gè)計(jì)時(shí)器輸出44 (I)和44 (2)沒(méi)有檢測(cè)到語(yǔ)音活動(dòng)。處理器30可在計(jì)時(shí)器輸出44 (I)執(zhí)行活動(dòng)48,且在計(jì)時(shí)器輸出44 (2)執(zhí)行另一相同的活動(dòng)50。假設(shè)語(yǔ)音活動(dòng)始于在計(jì)時(shí)器輸出44 (I)和44 (2)之間的某個(gè)時(shí)間的語(yǔ)音52的開(kāi)端。語(yǔ)音52的開(kāi)端可產(chǎn)生包絡(luò)緩沖區(qū)28中數(shù)據(jù)的變化,如包絡(luò)檢測(cè)器42的輸出所證明。在計(jì)時(shí)器輸出44 (3),處理器30可執(zhí)行活動(dòng)54,包括讀取包絡(luò)緩沖區(qū)28并對(duì)存儲(chǔ)在包絡(luò)緩沖區(qū)28中的數(shù)據(jù)執(zhí)行VAD算法。VAD算法將指示已檢測(cè)到VAD事件。
[0028]處理器30可執(zhí)行活動(dòng)56,活動(dòng)56可包括讀取音頻緩沖區(qū)18和執(zhí)行語(yǔ)音觸發(fā)匹配算法(例如,關(guān)鍵字匹配算法)。任何合適的語(yǔ)音活動(dòng)檢測(cè)算法可用作觸發(fā)來(lái)激活(例如,移動(dòng)設(shè)備或系統(tǒng)10是其中一部分的其它較大系統(tǒng)的)自動(dòng)語(yǔ)音識(shí)別模塊。如果輸入語(yǔ)音信號(hào)可被識(shí)別為來(lái)自合法用戶(hù)的預(yù)定關(guān)鍵字,那么它可用作觸發(fā)。處理器30可最初始于音頻緩沖區(qū)18的開(kāi)始,且可趕上實(shí)時(shí)數(shù)據(jù)流,在這種情況下,當(dāng)輸入數(shù)據(jù)樣本進(jìn)入音頻緩沖區(qū)18時(shí),處理器30可處理所述輸入數(shù)據(jù)樣本。當(dāng)檢測(cè)到關(guān)鍵字時(shí),或當(dāng)軟件VAD操作(可并行運(yùn)行)顯示語(yǔ)音活動(dòng)已停止時(shí),處理器30可停止處理數(shù)據(jù)。
[0029]轉(zhuǎn)向圖3,圖3是示出可與系統(tǒng)10的實(shí)施方案相關(guān)的示范性操作100的簡(jiǎn)化流程圖。在102,可激活音頻緩沖區(qū)18以監(jiān)控音頻,并存儲(chǔ)來(lái)自傳感器12的數(shù)據(jù)。在104,可激活包絡(luò)緩沖區(qū)28以監(jiān)控來(lái)自傳感器12的數(shù)據(jù)的包絡(luò)。在106,處理器30可進(jìn)入睡眠(例如,待機(jī)模式)。在108,可確定是否已在處理器30接收到計(jì)時(shí)器中斷。如果沒(méi)有,那么操作可回到106。如果已在處理器30接收到計(jì)時(shí)器中斷,那么在110,處理器30可喚醒。在112,處理器30可檢查包絡(luò)緩沖區(qū)28。在114,可確定是否檢測(cè)到任何語(yǔ)音(或其它)活動(dòng)。如果沒(méi)有檢測(cè)到活動(dòng),那么操作可回到106。如果檢測(cè)到活動(dòng),那么在116,處理器30可讀取音頻緩沖區(qū)18。
[0030]轉(zhuǎn)向圖4,圖4是示出根據(jù)系統(tǒng)10的實(shí)施方案的可與語(yǔ)音檢測(cè)相關(guān)的示范性操作的簡(jiǎn)化流程圖。在122,例如可用帶通22除去來(lái)自傳感器12的在正常人聲范圍之外的音頻輸入中的頻率。在124,包絡(luò)檢測(cè)器24可檢測(cè)音頻輸入的包絡(luò)。在126,包絡(luò)可被歸一化(例如,通過(guò)分配器或?qū)?shù)塊)。如本文所使用,術(shù)語(yǔ)“歸一化〃意指把值從不同刻度調(diào)整到共同刻度。歸一化可包括例如使用值的比來(lái)重新縮放,和使用對(duì)數(shù)刻度轉(zhuǎn)換每個(gè)值的對(duì)數(shù)歸一化。在128,歸一化的包絡(luò)可應(yīng)用到負(fù)峰值檢測(cè)器。根據(jù)一些實(shí)施方案,負(fù)峰值檢測(cè)器可為被配置以檢測(cè)波形中負(fù)峰值的數(shù)據(jù)分析軟件模塊。根據(jù)其它實(shí)施方案,負(fù)峰值檢測(cè)器可為例如結(jié)合包絡(luò)檢測(cè)器24實(shí)施的硬件模塊。在130,可確定歸一化的包絡(luò)是否小于存儲(chǔ)在系統(tǒng)10中的負(fù)峰值。如果歸一化的包絡(luò)小于負(fù)峰值,那么在132,存儲(chǔ)在系統(tǒng)10中的值可用歸一化的包絡(luò)值覆蓋。
[0031]否則,如果歸一化的包絡(luò)不小于負(fù)峰值,那么在134,可確定在130的條件是否達(dá)到預(yù)定數(shù)量的時(shí)鐘周期。如果沒(méi)有,過(guò)程可結(jié)束。如果在130的條件達(dá)到預(yù)定數(shù)量的時(shí)鐘周期,那么在136,存儲(chǔ)的負(fù)峰值可遞增固定量。在138,包絡(luò)信號(hào)和負(fù)峰值檢測(cè)器的輸出之間的差可與閾值作比較。在140,可確定是否超過(guò)閾值。如果沒(méi)有,過(guò)程可結(jié)束。如果已達(dá)到或超過(guò)閾值,那么在142,可得出這樣的結(jié)論:已檢測(cè)到語(yǔ)音信號(hào)的開(kāi)端。
[0032]轉(zhuǎn)向圖5,圖5是示出可與系統(tǒng)10的實(shí)施方案相關(guān)的示范性操作150的簡(jiǎn)化流程圖。在152,可確定語(yǔ)音開(kāi)端發(fā)生在處理器30的兩個(gè)連續(xù)喚醒時(shí)間之間。在154,處理器30可對(duì)音頻緩沖區(qū)18中的數(shù)據(jù)樣本執(zhí)行關(guān)鍵字匹配算法。在156,可確定是否檢測(cè)到關(guān)鍵字。如果檢測(cè)到關(guān)鍵字,那么處理器30可停止進(jìn)一步采樣數(shù)據(jù)并進(jìn)行激活系統(tǒng)10可為其中一部分的較大系統(tǒng)(例如,移動(dòng)設(shè)備、遠(yuǎn)程控制、計(jì)算機(jī)等)的其它組件。如果在156沒(méi)有檢測(cè)到關(guān)鍵字,那么處理器30可在158確定語(yǔ)音活動(dòng)是否已經(jīng)停止。如果是,那么過(guò)程可結(jié)束;如果沒(méi)有,那么過(guò)程可循環(huán)回到154,且處理器30可繼續(xù)根據(jù)關(guān)鍵字匹配算法來(lái)采樣音頻緩沖區(qū)18中的數(shù)據(jù)。
[0033]注意,在這個(gè)說(shuō)明書(shū)中,包括在“一個(gè)實(shí)施方案”、“示范性實(shí)施方案”、“實(shí)施方案”、“另一實(shí)施方案”、“一些實(shí)施方案”、“各種實(shí)施方案”、“其它實(shí)施方案”、“替代性實(shí)施方案”等中的各種特征(例如,元件、結(jié)構(gòu)、模塊、組件、步驟、操作、特點(diǎn)等)的引用旨在意指任何此類(lèi)特征包括在本公開(kāi)的一個(gè)或多個(gè)實(shí)施方案中,但是可能或可能不必在相同的實(shí)施方案中組
口 ο
[0034]在一個(gè)示范性實(shí)施方案中,附圖的系統(tǒng)10可耦接到相關(guān)電子設(shè)備的母板。母板可為可保持電子設(shè)備的內(nèi)部電子系統(tǒng)的各種組件并進(jìn)一步為其它外圍設(shè)備提供連接器的一般的電路板。更具體說(shuō)來(lái),母板可提供系統(tǒng)的其它組件可用以通信的電氣連接。任何合適的處理器(包括數(shù)字信號(hào)處理器、微處理器、配套芯片組等)、存儲(chǔ)器元件等可基于特定配置需求、處理需求、計(jì)算機(jī)設(shè)計(jì)等適當(dāng)?shù)伛罱拥侥赴濉F渌M件(諸如外部存儲(chǔ)、用于視頻顯示器、聲音的控制器和外圍設(shè)備)可連接到母板作為插卡、通過(guò)電纜連接或集成到母板本身。
[0035]在另一示范性實(shí)施方案中,附圖的系統(tǒng)10可嵌入獨(dú)立模塊(例如,具有被配置以執(zhí)行特定應(yīng)用或功能的相關(guān)組件和電路的設(shè)備)或作為插件模塊集成到電子設(shè)備的專(zhuān)用硬件。注意,本公開(kāi)的特定實(shí)施方案可容易地包括在片上系統(tǒng)(SOC)封裝中。SOC代表把計(jì)算機(jī)或其它電子系統(tǒng)的組件集成到單芯片的1C。它可包含數(shù)字、模擬、混合信號(hào)和常見(jiàn)的射頻功能:所有這些都可提供在單芯片基板上。其它實(shí)施方案可包括多芯片模塊(MCM),其中多個(gè)單獨(dú)的IC位于單電子封裝中且被配置以通過(guò)電子封裝彼此密切互動(dòng)。在各種其它實(shí)施方案中,電路功能可在專(zhuān)用集成電路(ASIC)、現(xiàn)場(chǎng)可編程門(mén)陣列(FPGA)和其它半導(dǎo)體芯片中的一個(gè)或多個(gè)硅芯中實(shí)施。
[0036]也應(yīng)注意,本文概述的所有規(guī)格、尺寸和關(guān)系(例如,處理器和存儲(chǔ)器元件、邏輯運(yùn)算等的數(shù)量)僅為舉例和教導(dǎo)的目的而提供。所述信息可在不脫離本公開(kāi)的精神或所附權(quán)利要求書(shū)的范圍的情況下大不相同。說(shuō)明書(shū)只適用于一個(gè)非限制性的實(shí)例,因此它們應(yīng)這樣理解。在上文的描述中,示范性實(shí)施方案已參閱特定處理器和/或組件布置進(jìn)行了描述。在不脫離所附權(quán)利要求書(shū)的范圍的情況下可對(duì)此類(lèi)實(shí)施方案進(jìn)行各種修改和變化。因此,說(shuō)明書(shū)和附圖應(yīng)理解為說(shuō)明性而不是限制性的。
[0037]注意,在本文提供的若干實(shí)例中,交互可就兩個(gè)、三個(gè)、四個(gè)或更多個(gè)電子組件進(jìn)行描述。然而,這只是為了清晰和舉例的目的而進(jìn)行。應(yīng)理解,系統(tǒng)可用任何適當(dāng)?shù)姆绞絹?lái)合并。沿著類(lèi)似的設(shè)計(jì)方案,附圖中示出的組件、模塊和元件中的任一可用各種可能的配置來(lái)組合,所有這些都明顯在本說(shuō)明書(shū)的廣泛范圍內(nèi)。在某些情況下,通過(guò)僅參照有限數(shù)量的電子元件可能易于描述給定流程集合的功能中的一個(gè)或多個(gè)。應(yīng)理解,附圖的系統(tǒng)10和它的教導(dǎo)容易縮放且可容納更大數(shù)量的組件以及更復(fù)雜/精密的布置和配置。因此,所提供的實(shí)例不應(yīng)限制潛在地適用于無(wú)數(shù)其它結(jié)構(gòu)的系統(tǒng)10的范圍或抑制系統(tǒng)10的廣泛教導(dǎo)。[0038]本領(lǐng)域技術(shù)人員可確定許多其它的變化、替換、變型、改變和修改,且意圖是,本公開(kāi)包括落入所附權(quán)利要求書(shū)的范圍內(nèi)的所有此類(lèi)變化、替換、變型、改變和修改。為了協(xié)助美國(guó)專(zhuān)利和商標(biāo)局(USPTO)以及另外協(xié)助本申請(qǐng)發(fā)布的任何專(zhuān)利的任何讀者解釋所附權(quán)利要求, 申請(qǐng)人:希望注意的是, 申請(qǐng)人::(a)不打算任何所附的權(quán)利要求書(shū)存在于其申請(qǐng)日時(shí)援引35U.S.C.第112條第六(6)段,除非用語(yǔ)“用于……的手段”或“用于……的步驟”明確地在特定的權(quán)利要求中使用;且(13)不打算通過(guò)本說(shuō)明書(shū)中的任何陳述來(lái)用未在所附權(quán)利要求中體現(xiàn)的任何方式 限制本公開(kāi)。
【權(quán)利要求】
1.一種系統(tǒng),其包括: 音頻緩沖區(qū),其被配置以存儲(chǔ)來(lái)自傳感器的第一數(shù)據(jù),其中所述第一數(shù)據(jù)根據(jù)第一采樣率生成; 包絡(luò)緩沖區(qū),其被配置以存儲(chǔ)第二數(shù)據(jù),其中所述第二數(shù)據(jù)根據(jù)第二采樣率從所述第一數(shù)據(jù)導(dǎo)出,且其中第二米樣率小于所述第一米樣率;以及 處理器,其被配置以從空閑狀態(tài)周期性地喚醒并從所述包絡(luò)緩沖區(qū)讀取所述第二數(shù)據(jù),其中如果所述第二數(shù)據(jù)指示活動(dòng),那么所述處理器被配置以從所述音頻緩沖區(qū)讀取所述第一數(shù)據(jù)。
2.如權(quán)利要求1所述的系統(tǒng),其中如果所述第二數(shù)據(jù)不指示活動(dòng),那么所述處理器被配置以返回到所述空閑狀態(tài)。
3.如權(quán)利要求1所述的系統(tǒng),其中通過(guò)比較所述第二數(shù)據(jù)的函數(shù)與預(yù)定閾值來(lái)指示所述活動(dòng)。
4.如權(quán)利要求1所述的系統(tǒng),其還包括模擬數(shù)字轉(zhuǎn)換器,所述模擬數(shù)字轉(zhuǎn)換器被配置以根據(jù)所述第一采樣率從模擬信號(hào)生成數(shù)字格式的所述第一數(shù)據(jù)。
5.如權(quán)利要求1所述的系統(tǒng),其還包括促進(jìn)讀取所述音頻緩沖區(qū)和所述包絡(luò)緩沖區(qū)的直接存儲(chǔ)器存取(DMA)控制器。
6.如權(quán)利要求1 所述的系統(tǒng),其中所述包絡(luò)緩沖區(qū)比所述音頻緩沖區(qū)短。
7.如權(quán)利要求1所述的系統(tǒng),其還包括計(jì)時(shí)器,所述計(jì)時(shí)器被配置以周期性地發(fā)送中斷到所述處理器,其中所述處理器被配置以在接收到所述中斷時(shí)喚醒。
8.如權(quán)利要求1所述的系統(tǒng),其還包括: 包絡(luò)檢測(cè)器,其被配置以檢測(cè)所述第一數(shù)據(jù)的包絡(luò);以及 抽取器,其被配置以降采樣所述包絡(luò)以根據(jù)所述第二采樣率生成所述第二數(shù)據(jù)。
9.如權(quán)利要求8所述的系統(tǒng),其還包括帶通濾波器,所述帶通濾波器被配置以過(guò)濾所述第一數(shù)據(jù)并把所述過(guò)濾的數(shù)據(jù)饋送到所述包絡(luò)檢測(cè)器。
10.如權(quán)利要求9所述的系統(tǒng),其中所述第一數(shù)據(jù)從音頻信號(hào)生成。
11.如權(quán)利要求10所述的系統(tǒng),其中所述活動(dòng)包括語(yǔ)音信號(hào)的開(kāi)端。
12.如權(quán)利要求10所述的系統(tǒng),其中所述帶通濾波器被配置以過(guò)濾掉所述第一數(shù)據(jù)中在正常人聲范圍之外的頻率以生成所述第一數(shù)據(jù)的子集。
13.如權(quán)利要求10所述的系統(tǒng),其中所述系統(tǒng)被配置以執(zhí)行包括以下各項(xiàng)的操作: 檢測(cè)所述子集的所述包絡(luò); 確定所述包絡(luò)和負(fù)峰值之間的差;以及 如果所述差超過(guò)預(yù)定閾值就檢測(cè)活動(dòng)。
14.如權(quán)利要求10所述的系統(tǒng),其中所述檢測(cè)所述包絡(luò)基于選自由以下各項(xiàng)組成的群組的所述子集的參數(shù):均方根(RMS)、平均值、峰值和準(zhǔn)峰值。
15.如權(quán)利要求10所述的系統(tǒng),其中所述系統(tǒng)被配置以執(zhí)行包括以下各項(xiàng)的另外的操作: 歸一化所述子集的所述包絡(luò); 比較所述歸一化的包絡(luò)與第二負(fù)峰值; 如果在預(yù)定數(shù)量的時(shí)鐘周期期間所述歸一化的包絡(luò)不小于所述第二負(fù)峰值,就把所述第二負(fù)峰值遞增固定量以獲得所述負(fù)峰值;以及 如果所述歸一化的包絡(luò)小于所述第二負(fù)峰值,就把所述負(fù)峰值設(shè)置為所述第二負(fù)峰值。
16.如權(quán)利要求16所述的系統(tǒng),其中所述歸一化所述包絡(luò)包括對(duì)數(shù)歸一化所述包絡(luò)。
17.如權(quán)利要求16所述的系統(tǒng),其中所述歸一化所述包絡(luò)包括取所述第一數(shù)據(jù)代表的能量的比。
18.如權(quán)利要求10所述的系統(tǒng),其中所述包絡(luò)檢測(cè)器包括語(yǔ)音活動(dòng)檢測(cè)器的一部分。
19.如權(quán)利要求1所述的系統(tǒng),其中所述系統(tǒng)被配置以執(zhí)行包括以下各項(xiàng)的操作: 確定所述活動(dòng)發(fā)生在兩個(gè)連續(xù)喚醒時(shí)間之間; 對(duì)所述音頻緩沖區(qū)中的所述第一數(shù)據(jù)執(zhí)行關(guān)鍵字匹配算法;以及 如果發(fā)現(xiàn)匹配的關(guān)鍵字,就基于所述匹配的關(guān)鍵字來(lái)執(zhí)行另一任務(wù)。
20.如權(quán)利要求1所述的系統(tǒng),其中所述處理器包括數(shù)字信號(hào)處理器和微控制器中至少一 個(gè)。
【文檔編號(hào)】G10L15/26GK104035743SQ201410082056
【公開(kāi)日】2014年9月10日 申請(qǐng)日期:2014年3月7日 優(yōu)先權(quán)日:2013年3月7日
【發(fā)明者】R·阿達(dá)姆斯, M·莫騰森 申請(qǐng)人:亞德諾半導(dǎo)體技術(shù)公司