管是模擬的還是數(shù)字的。麥克風(fēng)或麥克風(fēng)陣列可實(shí)施為定向麥克風(fēng)或麥克風(fēng)定向陣列。在一些實(shí)施例中,音頻輸入模塊208接收音頻并且將音頻提供到功率管理子系統(tǒng)100進(jìn)行處理,大體上如上文相對(duì)于圖1所論述。音頻輸入模塊208還可接收來自功率管理子系統(tǒng)100的指令,以設(shè)置用于獲得音頻的采樣率(無論是幀速率還是位速率)。音頻輸入模塊208也可(或改為)包括一個(gè)或多個(gè)壓電元件和/或微機(jī)電系統(tǒng)(MEMS),其可將聲能轉(zhuǎn)換成電信號(hào),以便由功率管理子系統(tǒng)100處理。音頻輸入模塊208還可配有放大器、整流器以及所需的其他音頻處理部件。
[0043]用戶計(jì)算裝置200可配有一個(gè)或多個(gè)另外的輸入裝置,諸如光傳感器、位置傳感器、圖像捕獲裝置等。圖2中并未示出此類另外的輸入裝置,以免模糊本公開的原理。在一些實(shí)施例中,另外的輸入裝置可檢測(cè)條件的發(fā)生或不發(fā)生。關(guān)于此類條件的信息可被提供到功率管理子系統(tǒng)100,以確定用戶計(jì)算裝置200或功率管理子系統(tǒng)100的一個(gè)或多個(gè)部件應(yīng)被啟用還是停用。在一個(gè)實(shí)施例中,另外的輸入裝置包括配置來檢測(cè)光水平的光傳感器。在光傳感器檢測(cè)到的光水平不滿足閾值時(shí),功率管理模塊120才可充當(dāng)網(wǎng)絡(luò)接口模塊206、才可被啟用。在另一實(shí)施例中,另外的輸入裝置包括配置有面部識(shí)別能力的圖像捕獲裝置。在此實(shí)施例中,只有在圖像捕獲裝置識(shí)別與用戶計(jì)算裝置200相關(guān)聯(lián)的用戶的面部時(shí),網(wǎng)絡(luò)接口模塊206才可被啟用。關(guān)于用輸入裝置控制語音識(shí)別能力的更多信息可見2002年I月30日提交的標(biāo)題為“自動(dòng)語音識(shí)別系統(tǒng)和方法(AUTOMATIC SPEECH RECOGNIT1N SYSTEMAND METHOD)”的美國專利申請(qǐng)?zhí)?0/058,730,該申請(qǐng)?jiān)?003年7月31日被公開為美國專利公開號(hào)2003/0144844,其公開內(nèi)容以全文引用的方式并入本文中。關(guān)于控制語音識(shí)別能力的進(jìn)一步信息可見2012年12月4日頒布的標(biāo)題為“使用物理現(xiàn)象檢測(cè)器來控制語音識(shí)別引擎的操作(USING A PHYSICAL PHENOMENON DETECTOR TO CONTROL OPERAT1N OF ASPEECH RECOGNIT1N ENGINE) ”的美國專利號(hào)8,326,636。該專利的公開內(nèi)容以全文引用的方式并入本文中。
[0044]可提供另外的輸入裝置,其可包含用戶輸入裝置,諸如,鼠標(biāo)、鍵盤、觸摸屏、小鍵盤等。同樣,可提供輸出裝置,諸如,顯示器、揚(yáng)聲器、耳機(jī)等。在一個(gè)特定實(shí)例中,用戶計(jì)算裝置200可包括一個(gè)或多個(gè)輸出裝置,其配置來采用音頻形式(例如,通過文本到語音)或視覺形式(例如,通過顯示器)呈現(xiàn)語音識(shí)別結(jié)果。此類輸入和輸出裝置已為本領(lǐng)域所熟知,并且無需在本文中進(jìn)一步詳細(xì)論述,且未在圖2中示出,以避免模糊本發(fā)明的原理。
[0045]電源218可向用戶計(jì)算裝置200的各個(gè)部件提供電力。電源218可包括無線或便攜式電源,諸如,一次性或可充電電池或電池組;或者可包括有線電源,諸如,配置來插入插座中的交流(AC)電源。在一些實(shí)施例中,電源218將其可供應(yīng)的功率水平傳送到功率管理子系統(tǒng)100(例如,剩余電池壽命的百分?jǐn)?shù)、電源218是否插入插座等)。在一些實(shí)施例中,至少部分基于電源所指示的功率水平,功率管理子系統(tǒng)100選擇性地啟用或停用一個(gè)或多個(gè)模塊。例如,如果用戶計(jì)算裝置200插入插座中,那么功率管理子系統(tǒng)100可啟用網(wǎng)絡(luò)接口模塊206并讓其處于啟用狀態(tài)。如果用戶計(jì)算裝置200使用電池電力,那么功率管理子系統(tǒng)100可選擇性地啟用和停用網(wǎng)絡(luò)接口模塊206,如上所述。
[0046]現(xiàn)在轉(zhuǎn)到圖3,示出了說明性例行程序300,其中功率管理子系統(tǒng)100的模塊可被選擇性地啟用以處理音頻輸入。當(dāng)說明性例行程序300中隨后啟用的模塊可相對(duì)大量地處理需求和/或功率消耗時(shí),說明性例行程序300代表處理和/或功率消耗的升級(jí)。
[0047]說明性例行程序300可在框302處開始,此時(shí),音頻輸入模塊208監(jiān)測(cè)音頻輸入。在框304處,音頻輸入模塊208可接收音頻輸入。在框306處,接收的音頻輸入可被記錄到存儲(chǔ)器緩沖模塊104。在框308處,音頻檢測(cè)模塊106可確定音頻輸入的能量水平是否滿足能量水平閾值(以及任選地,音頻輸入的能量水平至少是否在閾值持續(xù)時(shí)間內(nèi)滿足能量水平閾值)。如果音頻輸入的能量水平并不滿足能量水平閾值,那么在框310中,音頻輸入模塊208可繼續(xù)監(jiān)測(cè)音頻輸入,直至接收到另一音頻輸入為止。
[0048]返回到框308,如果音頻檢測(cè)模塊106確定音頻輸入的能量水平滿足閾值,那么在框312處,功率管理模塊120可啟用語音檢測(cè)模塊108 (或者,音頻檢測(cè)模塊106可直接啟用語音檢測(cè)模塊108,并且在接下來的框中,功率管理模塊120也可省去)。在框314處,語音檢測(cè)模塊108可確定語音是否存在于所獲得的音頻輸入中,大體如上文相對(duì)于圖1所論述。如果語音檢測(cè)模塊108確定語音不存在于(或不可能存在于)音頻輸入中,那么在框316處,功率管理模塊120可停用語音檢測(cè)模塊108。在框310中,音頻輸入模塊208隨后可繼續(xù)監(jiān)測(cè)音頻輸入,直至接收到另一音頻輸入為止。
[0049]返回到框314,如果語音檢測(cè)模塊108確定音頻輸入包含語音,那么在框318處,功率管理模塊120可啟用語音處理模塊110。如上所述,在框320處,語音處理模塊110可確定喚醒字是否存在于語音中。如果語音處理模塊110確定喚醒字不存在于語音中(或不可能存在于語音中),那么在框322處,語音處理模塊110可被停用。語音檢測(cè)模塊108也可在框316處被停用。在框310中,音頻輸入裝置208隨后可繼續(xù)監(jiān)測(cè)音頻輸入,直至接收到另一音頻輸入為止。
[0050]返回到框320,如果在一些實(shí)施例中,語音處理模塊110確定喚醒字存在于語音中,那么用戶401,在框324中,語音處理模塊110任選地確定語音是否與特定用戶相關(guān)聯(lián)(例如,用戶是否說出喚醒字),大體如上文相對(duì)于圖1所論述。如果語音并不與特定用戶相關(guān)聯(lián),那么在框322處,語音處理模塊110可被停用。語音檢測(cè)模塊108也可在框316處被停用。在框310中,音頻輸入裝置208隨后可繼續(xù)監(jiān)測(cè)音頻輸入,直至接收到另一音頻輸入為止。如果語音與特定用戶相關(guān)聯(lián),那么說明性例行程序300可進(jìn)行到框326。在其他實(shí)施例中,框324可被省去,并且響應(yīng)于語音處理模塊110確定喚醒字存在于語音中,說明性例行程序300可直接從框320進(jìn)行到框326。
[0051]在框326處,功率管理模塊120可啟用應(yīng)用處理模塊112,所述應(yīng)用處理模塊可實(shí)施圖2所示的語音識(shí)別應(yīng)用模塊216。在框328處,功率管理模塊120也可啟用網(wǎng)絡(luò)接口模塊206。網(wǎng)絡(luò)接口模塊206被啟用之后,記錄到存儲(chǔ)器緩沖模塊104的音頻輸入可經(jīng)由網(wǎng)絡(luò)接口模塊206通過網(wǎng)絡(luò)進(jìn)行傳輸。在一些實(shí)施例中,當(dāng)網(wǎng)絡(luò)接口模塊206活動(dòng)時(shí),隨后獲得的音頻輸入從音頻輸入模塊208直接提供到應(yīng)用處理模塊112和/或網(wǎng)絡(luò)接口模塊206,以用于傳輸?shù)竭h(yuǎn)程計(jì)算裝置。然而,在其他實(shí)施例中,在將音頻輸入提供到網(wǎng)絡(luò)接口模塊206以便通過網(wǎng)絡(luò)410傳輸?shù)竭h(yuǎn)程計(jì)算裝置之前,語音檢測(cè)模塊108、語音處理模塊110以及應(yīng)用處理模塊112中的任一個(gè)或全部均對(duì)所述音頻輸入進(jìn)行處理。
[0052]在未示出的一些實(shí)施例中,功率管理子系統(tǒng)100等待,直到遠(yuǎn)程計(jì)算裝置返回喚醒字存在于第一音頻輸入中的確認(rèn),以便傳輸隨后的音頻輸入用于識(shí)別。如果遠(yuǎn)程計(jì)算裝置沒有提供喚醒字的確認(rèn),或者如果經(jīng)由網(wǎng)絡(luò)接口模塊206接收到停用指令,那么網(wǎng)絡(luò)接口模塊206以及功率管理子系統(tǒng)100的一個(gè)或多個(gè)模塊可被停用。
[0053]由于功率管理子系統(tǒng)100的許多操作可生成概率確定而非準(zhǔn)確確定,因此,在說明性例行程序300期間可能出現(xiàn)誤差。在一些情況下,功率管理子系統(tǒng)100的特定模塊可提供“誤報(bào)”,從而導(dǎo)致一個(gè)或多個(gè)模塊被錯(cuò)誤地啟用。例如,在框314處,語音檢測(cè)模塊108可錯(cuò)誤地確定存在語音,或者在框320處,語音處理模塊110可錯(cuò)誤地確定語音包含喚醒字,或在框324處,錯(cuò)誤地確定語音屬于用戶。功率管理子系統(tǒng)100的模塊之間的自適應(yīng)閾值和交叉驗(yàn)證可有利地用來減少誤報(bào)。本文中論述了自適應(yīng)閾值的兩個(gè)實(shí)例,但其他類型的自適應(yīng)閾值是可能的。如上所述,在框314處,語音檢測(cè)模塊可確定語音存在于音頻輸入中。然而,語音處理模塊110由于其較好的處理能力而可比語音檢測(cè)模塊108更準(zhǔn)確地識(shí)別語音,它可確定實(shí)際上音頻輸入中沒有語音。因此,語音處理模塊110可指導(dǎo)語音檢測(cè)模塊108提高用于確定語音存在于音頻輸入中的分?jǐn)?shù)閾值,以便減少將來的誤報(bào)。同樣地,如果遠(yuǎn)程計(jì)算裝置(諸如語音識(shí)別服務(wù)器420)包含語音識(shí)別能力,那么遠(yuǎn)程計(jì)算裝置可將語音中不存在喚醒字的指示傳輸?shù)接脩粲?jì)算裝置200,即使語音處理模塊110可能已經(jīng)指示存在喚醒字。因此,用于確定喚醒字存在于語音中的語音處理模塊110的分?jǐn)?shù)閾值可以提高,以便減少將來的誤報(bào)。此外,可提供用戶接口,從而使得用戶可提高一個(gè)或多個(gè)分?jǐn)?shù)閾值來減少誤報(bào),如下文相對(duì)于圖5進(jìn)一步描述。
[0054]在其他情況下,特定部件可提供“漏報(bào)”,從而功率管理子系統(tǒng)100的部件不被啟用和/或網(wǎng)絡(luò)接口模塊206不被啟用,即使用戶已經(jīng)說出喚醒字也是如此。例如,在框314處,語音檢測(cè)模塊108可錯(cuò)誤地確定不存在語音,或者在框320處,語音處理模塊110可錯(cuò)誤地確定語音不包含喚醒字,或在框324處,錯(cuò)誤地確定語音不屬于用戶。為了降低漏報(bào)的可能性,功率管理子系統(tǒng)100可定期降低閾值分?jǐn)?shù),例如,在框314、320和/或324中,降低滿足閾值所需的分?jǐn)?shù)。閾值可繼續(xù)降低,直至獲得一個(gè)或多個(gè)誤報(bào)為止,如上所述。一旦獲得一個(gè)或多個(gè)誤報(bào),閾值可不再進(jìn)一步降低,或者可稍微提高。此外,可相應(yīng)地提供用戶接口,從而使得用戶可降低一個(gè)或多個(gè)分?jǐn)?shù)閾值來減少漏報(bào),如下文相對(duì)于圖5進(jìn)一步描述。
[0055]在一些實(shí)施例中,如果在框314、320或324中的任一框處獲得否定結(jié)果,那么并非所有啟用的部件均被停用。例如,如果喚醒字在框320處未被識(shí)別出,那么語音處理模塊110可在框322處被停用,但語音檢測(cè)模塊108可保持啟用。此外,在一些實(shí)施方案中,可跳過某些框。在一些實(shí)施例中,在框314或320處滿足閾值的分?jǐn)?shù)會(huì)促使一個(gè)或多個(gè)隨后的框被跳過。例如,如果在框320處,語音處理模塊110非??隙ǖ卮_定喚醒字存在于語音中,那么說明性例行程序300可直接跳到框326
[0056]此外,在一些實(shí)施例中,用戶計(jì)算裝置200可包括被配置成由處理單元202執(zhí)行的自動(dòng)語音識(shí)別引擎。由于此類裝置上的語音識(shí)別的功率消耗可能尤其高,因此,響應(yīng)于語音處理模塊110確定用戶已經(jīng)說出喚醒字,處理單元202可只實(shí)施自動(dòng)語音識(shí)別引擎來識(shí)別語音。
[0057]現(xiàn)在參考圖4A、圖4B和圖4C,說明性環(huán)境400中示出了分布式語音識(shí)別服務(wù)的示例性操作。環(huán)境400可包括用戶401 ;如上所述的用戶計(jì)算裝置200 ;網(wǎng)絡(luò)410 ;語音識(shí)別服務(wù)器420;以及數(shù)據(jù)暫存器430。
[0058]網(wǎng)絡(luò)410可以是任何有線網(wǎng)絡(luò)、無線