亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

多個(gè)設(shè)備上的熱詞檢測(cè)的制作方法

文檔序號(hào):10598385閱讀:260來(lái)源:國(guó)知局
多個(gè)設(shè)備上的熱詞檢測(cè)的制作方法
【專(zhuān)利摘要】公開(kāi)了用于多個(gè)設(shè)備上的熱詞檢測(cè)的方法、系統(tǒng)、和裝置,包括在計(jì)算機(jī)存儲(chǔ)介質(zhì)上編碼的計(jì)算機(jī)程序。在一個(gè)方面,一種方法包括由計(jì)算設(shè)備接收對(duì)應(yīng)于話語(yǔ)的音頻數(shù)據(jù)的動(dòng)作。該動(dòng)作進(jìn)一步包括確定該話語(yǔ)包括熱詞的可能性。該動(dòng)作進(jìn)一步包括確定該音頻數(shù)據(jù)的響度分值。該動(dòng)作進(jìn)一步包括基于該響度分值來(lái)確定延遲時(shí)間量。該動(dòng)作進(jìn)一步包括在已經(jīng)流逝該延遲時(shí)間量之后傳送指示該計(jì)算設(shè)備將發(fā)起對(duì)該音頻數(shù)據(jù)的語(yǔ)音識(shí)別處理的信號(hào)。
【專(zhuān)利說(shuō)明】
多個(gè)設(shè)備上的熱詞檢測(cè)
技術(shù)領(lǐng)域
[0001]本說(shuō)明書(shū)總體上涉及用于識(shí)別人正在說(shuō)的詞語(yǔ)的系統(tǒng)和技術(shù),其還被稱(chēng)為語(yǔ)音識(shí)別。
【背景技術(shù)】
[0002]支持語(yǔ)音的住所或其它環(huán)境一也就是用戶在其中僅需要出聲地講出查詢或命令并且基于計(jì)算機(jī)的系統(tǒng)將處理并應(yīng)答該查詢和/或致使命令得以執(zhí)行的住所或其他環(huán)境一的現(xiàn)實(shí)正在到來(lái)。支持語(yǔ)音的環(huán)境(例如住所、工作場(chǎng)所、學(xué)校等)能夠使用分布在該環(huán)境的各個(gè)房間或區(qū)域各處的被連接的麥克風(fēng)設(shè)備的網(wǎng)絡(luò)來(lái)實(shí)現(xiàn)。通過(guò)這樣的麥克風(fēng)的網(wǎng)絡(luò),用戶有能力從基本上該環(huán)境中的任何地方口頭查詢系統(tǒng)而無(wú)需在他/她的前方或者甚至在其附近具有計(jì)算機(jī)或其它設(shè)備。例如,當(dāng)在廚房中烹飪時(shí),用戶可以詢問(wèn)系統(tǒng)“三杯是多少毫升?”,并且作為響應(yīng)而從系統(tǒng)接收到回答,例如以合成語(yǔ)音輸出的形式的回答。替選地,用戶可以詢問(wèn)系統(tǒng)諸如“離我最近的加油站什么時(shí)候關(guān)門(mén)”或者在準(zhǔn)備離開(kāi)房子時(shí)詢問(wèn)“我今天應(yīng)當(dāng)穿外套嗎?”。
[0003]此外,用戶可以詢問(wèn)系統(tǒng)的查詢和/或發(fā)出命令,所述查詢或命令涉及用戶的個(gè)人信息。例如,用戶可以詢問(wèn)系統(tǒng)“我與John何時(shí)會(huì)面? ”或者命令系統(tǒng)“當(dāng)我回家時(shí)提醒我給John打電話。”

【發(fā)明內(nèi)容】

[0004]對(duì)于支持語(yǔ)音的系統(tǒng),用戶與系統(tǒng)交互的方式被設(shè)計(jì)為主要一如果不是專(zhuān)門(mén)地一憑借語(yǔ)音輸入來(lái)進(jìn)行。因此,可能拾取周?chē)h(huán)境中所發(fā)出的包括并非指向系統(tǒng)的那些話語(yǔ)在內(nèi)的所有話語(yǔ)的系統(tǒng)必須以某些方式來(lái)辨別任何給定的話語(yǔ)何時(shí)是指向該系統(tǒng)而不是例如指向出現(xiàn)在該環(huán)境中的個(gè)人。一種實(shí)現(xiàn)該目的的方式是使用熱詞,該熱詞通過(guò)環(huán)境中的用戶間的協(xié)定被預(yù)留作為預(yù)定詞語(yǔ),其被講出以喚起系統(tǒng)的注意。在示例環(huán)境中,用來(lái)喚起系統(tǒng)的注意的熱詞是詞語(yǔ)“OK computer(0K計(jì)算機(jī))”。因此,每次詞語(yǔ)“OK computer”被講出時(shí),其就被麥克風(fēng)所拾取,傳達(dá)至系統(tǒng),該系統(tǒng)執(zhí)行語(yǔ)音識(shí)別技術(shù)來(lái)確定熱詞是否被講出,并且如果是,則等待隨后的命令或查詢。因此,指向系統(tǒng)的話語(yǔ)采用[熱詞][查詢]的一般形式,其中本示例中的“熱詞”是“OK computer'并且“查詢”能夠是任何問(wèn)題、命令、聲明、或者能夠由系統(tǒng)單獨(dú)或者經(jīng)由網(wǎng)絡(luò)與服務(wù)器結(jié)合來(lái)進(jìn)行語(yǔ)音識(shí)別、解析、以及按照其實(shí)施動(dòng)作的其它請(qǐng)求。
[0005]根據(jù)本說(shuō)明書(shū)中所描述的主題的一個(gè)創(chuàng)新方面,一種計(jì)算設(shè)備接收用戶所講出的話語(yǔ)。該計(jì)算設(shè)備確定該話語(yǔ)包括熱詞的可能性并且計(jì)算該話語(yǔ)的響度分值。在鄰近處的其它計(jì)算設(shè)備也接收到該話語(yǔ),確定該話語(yǔ)包括熱詞的可能性,并且計(jì)算該話語(yǔ)的響度分值。每個(gè)計(jì)算設(shè)備還基于該響度分值來(lái)計(jì)算延遲,使得該延遲的長(zhǎng)度與該響度分值成反比。由于距話語(yǔ)的源最近的計(jì)算設(shè)備通常將具有最高的響度分值,所以該最近的設(shè)備應(yīng)當(dāng)具有最短的延遲。在已經(jīng)流逝與給定計(jì)算設(shè)備相關(guān)聯(lián)的延遲之后,除非相應(yīng)的計(jì)算設(shè)備在該延遲時(shí)期期間接收到通知信號(hào),否則該計(jì)算設(shè)備將向其它計(jì)算設(shè)備傳送通知信號(hào)。因此,具有最小延遲(并且因此最可能距用戶最近)的計(jì)算設(shè)備向其它計(jì)算設(shè)備傳送信號(hào)以指示該計(jì)算設(shè)備將對(duì)該熱詞之后的附加音頻進(jìn)行處理。在該實(shí)例中,進(jìn)行傳送的計(jì)算設(shè)備對(duì)該熱詞之后的附加音頻進(jìn)行處理。如果該計(jì)算設(shè)備在延遲期間接收到來(lái)自其它計(jì)算設(shè)備中的一個(gè)計(jì)算設(shè)備的指示另一個(gè)設(shè)備將對(duì)該熱詞之后的附加音頻進(jìn)行處理的信號(hào),則該計(jì)算設(shè)備停止處理音頻。
[0006]總體上,本說(shuō)明書(shū)中所描述的主題的另一個(gè)創(chuàng)新方面可以被包含在一種方法中,所述方法包括以下動(dòng)作:由計(jì)算設(shè)備接收對(duì)應(yīng)于話語(yǔ)的音頻數(shù)據(jù);確定該話語(yǔ)包括熱詞的可能性;確定該音頻數(shù)據(jù)的響度分值;基于該響度分值,確定延遲時(shí)間量;在已經(jīng)流逝該延遲時(shí)間量之后,傳送指示該計(jì)算設(shè)備將發(fā)起對(duì)該音頻數(shù)據(jù)的語(yǔ)音識(shí)別處理的信號(hào)。
[0007]這些和其它實(shí)施例均能夠可選地包括以下特征中的一個(gè)或多個(gè)特征。該動(dòng)作進(jìn)一步包括:由該計(jì)算設(shè)備接收對(duì)應(yīng)于附加話語(yǔ)的附加音頻數(shù)據(jù);確定該附加話語(yǔ)包括熱詞的第二可能性;確定該附加音頻數(shù)據(jù)的第二響度分值;基于該第二響度分值,確定第二延遲時(shí)間量;以及在已經(jīng)流逝該延遲時(shí)間量之前,接收第二信號(hào),該第二信號(hào)指示:(i)第二計(jì)算設(shè)備將發(fā)起對(duì)該附加音頻數(shù)據(jù)的語(yǔ)音識(shí)別處理,以及(ii)該計(jì)算設(shè)備不應(yīng)當(dāng)發(fā)起對(duì)該附加音頻數(shù)據(jù)的語(yǔ)音識(shí)別處理。該動(dòng)作進(jìn)一步包括:基于接收到該第二信號(hào),確定該計(jì)算設(shè)備的激活狀態(tài)為非活躍狀態(tài)。
[0008]該動(dòng)作進(jìn)一步包括:基于傳送該信號(hào),確定該計(jì)算設(shè)備的激活狀態(tài)為活躍狀態(tài)。該信號(hào)包括超聲信號(hào)或短距離無(wú)線電信號(hào)。該信號(hào)被另一個(gè)計(jì)算設(shè)備所接收并且向其它計(jì)算設(shè)備指示不發(fā)起對(duì)該音頻數(shù)據(jù)的語(yǔ)音識(shí)別處理。該動(dòng)作進(jìn)一步包括:基于確定該話語(yǔ)包括熱詞的可能性,準(zhǔn)備接收指示另一個(gè)計(jì)算設(shè)備將發(fā)起對(duì)該音頻數(shù)據(jù)的語(yǔ)音識(shí)別處理的信號(hào)。該響度分值與該延遲時(shí)間量成比例。在該響度分值滿足閾值時(shí)該延遲時(shí)間為零。確定該音頻數(shù)據(jù)的響度分值的動(dòng)作進(jìn)一步包括:確定該話語(yǔ)包括該熱詞的所述可能性包括可能性閾值。
[0009]該方面的其它實(shí)施例包括對(duì)應(yīng)的系統(tǒng)、裝置、以及記錄在計(jì)算機(jī)存儲(chǔ)設(shè)備上的計(jì)算機(jī)程序,它們均被配置為執(zhí)行該方法的操作。
[0010]本說(shuō)明書(shū)中所描述的主題的特定實(shí)施例能夠被實(shí)現(xiàn)以便實(shí)現(xiàn)以下優(yōu)勢(shì)中的一種或多種。多個(gè)設(shè)備能夠檢測(cè)熱詞并且僅一個(gè)設(shè)備將對(duì)熱詞作出響應(yīng)。
[0011]在附圖和以下的描述中闡述了本說(shuō)明書(shū)中所描述主題的一個(gè)或多個(gè)實(shí)施例的細(xì)節(jié)。該主題的其它特征、方面、和優(yōu)勢(shì)從說(shuō)明書(shū)、附圖、和權(quán)利要求書(shū)將變得顯而易見(jiàn)的。
【附圖說(shuō)明】
[0012]圖1是用于熱詞檢測(cè)的示例系統(tǒng)的示圖。
[0013]圖2是用于熱詞檢測(cè)的示例過(guò)程的示圖。
[0014]圖3示出了計(jì)算設(shè)備和移動(dòng)計(jì)算設(shè)備的示例。
[0015]各圖中相似的附圖標(biāo)記和名稱(chēng)指示相似的要素。
【具體實(shí)施方式】
[0016]本說(shuō)明書(shū)描述了基于響度的協(xié)議,其允許監(jiān)聽(tīng)熱詞的多個(gè)計(jì)算設(shè)備來(lái)確定哪個(gè)設(shè)備應(yīng)當(dāng)作出響應(yīng)。有利的是,該協(xié)議能夠基于本地交互來(lái)實(shí)現(xiàn),例如使用音頻信號(hào)或短距離無(wú)線電信號(hào)來(lái)實(shí)施,并且不需要任何服務(wù)器側(cè)的通信。這可以是有益的,因?yàn)槭褂帽镜亟换ツ軌蛟试S對(duì)響應(yīng)進(jìn)行協(xié)商而不會(huì)引發(fā)與服務(wù)器的通信延時(shí)。
[0017]圖1是用于熱詞檢測(cè)的示例系統(tǒng)100的示圖??傮w上,系統(tǒng)100圖示了講出話語(yǔ)104的用戶,該話語(yǔ)104被計(jì)算設(shè)備106、108、和110的麥克風(fēng)檢測(cè)到。計(jì)算設(shè)備106、108、和110對(duì)話語(yǔ)104進(jìn)行處理以確定話語(yǔ)104包括熱詞的可能性,以及確定該話語(yǔ)的響度分值。計(jì)算設(shè)備106、108、和110計(jì)算與該響度分值成比例的延遲時(shí)間。一旦已經(jīng)流逝計(jì)算設(shè)備的延遲時(shí)間之一,該計(jì)算設(shè)備就向其它計(jì)算設(shè)備傳送信號(hào)。該信號(hào)向其它計(jì)算設(shè)備指示進(jìn)行傳送的計(jì)算設(shè)備將對(duì)與該話語(yǔ)相對(duì)應(yīng)的音頻數(shù)據(jù)執(zhí)行語(yǔ)音識(shí)別。
[0018]更為詳細(xì)地,用戶102講出話語(yǔ)104“OK computer”,并且計(jì)算設(shè)備106、108、和110通過(guò)相應(yīng)的諸如麥克風(fēng)的音頻輸入設(shè)備來(lái)接收該話語(yǔ)104。計(jì)算設(shè)備106是用戶102拿在該用戶手中的電話。計(jì)算設(shè)備108是位于桌上的平板計(jì)算機(jī)。計(jì)算設(shè)備110則是位于墻壁上的恒溫器。計(jì)算設(shè)備106最靠近用戶,接下來(lái)計(jì)算設(shè)備108是下一個(gè)最靠近的,并且最后計(jì)算設(shè)備110距離用戶最遠(yuǎn)。計(jì)算設(shè)備106、108、和110每個(gè)都包括麥克風(fēng)114、116、或118。每個(gè)麥克風(fēng)向相應(yīng)的音頻子系統(tǒng)提供音頻數(shù)據(jù)。該音頻子系統(tǒng)對(duì)從麥克風(fēng)所接收的音頻數(shù)據(jù)進(jìn)行緩沖、濾波、和數(shù)字化。在一些實(shí)施方式中,每個(gè)計(jì)算設(shè)備可以對(duì)音頻數(shù)據(jù)執(zhí)行端點(diǎn)指示(endpointing)和說(shuō)話者識(shí)別。在一些實(shí)施方式中,計(jì)算設(shè)備106、108、和110可以是能夠接收并處理音頻數(shù)據(jù)的任何設(shè)備,諸如在以下關(guān)于圖3所描述的設(shè)備。
[0019]每個(gè)音頻子系統(tǒng)將經(jīng)處理的音頻數(shù)據(jù)提供至熱詞器,諸如熱詞器120、122、或124。各熱詞器對(duì)經(jīng)處理的音頻數(shù)據(jù)執(zhí)行分類(lèi)處理,所述音頻數(shù)據(jù)能夠使用已知的熱詞的話語(yǔ)進(jìn)行了解或訓(xùn)練。各熱詞器計(jì)算話語(yǔ)104包括熱詞的可能性。各熱詞器可以從經(jīng)處理的音頻數(shù)據(jù)中提取音頻特征,諸如濾波器組能量或Mel頻率倒譜系數(shù)。各熱詞器可以使用分類(lèi)窗口來(lái)處理這些音頻特征,諸如通過(guò)使用支持向量機(jī)或神經(jīng)網(wǎng)絡(luò)來(lái)進(jìn)行處理。基于對(duì)音頻特征的處理,各熱詞器計(jì)算話語(yǔ)104包括熱詞的可能性。在一些實(shí)施方式中,該可能性可以由置信度分值來(lái)反映。置信度分值可以被標(biāo)準(zhǔn)化到I至100的范圍,其中越高的數(shù)字指示話語(yǔ)104包括熱詞的置信度越大。
[0020]在一些實(shí)施方式中,各熱詞器將置信度分值與閾值進(jìn)行比較。如果置信度分值滿足閾值,則計(jì)算設(shè)備繼續(xù)處理音頻數(shù)據(jù)。如果置信度分值不滿足閾值,則計(jì)算設(shè)備停止處理音頻數(shù)據(jù)。例如,如果置信度分值為0.8而閾值為0.7,則計(jì)算設(shè)備將繼續(xù)處理音頻數(shù)據(jù)。在音頻數(shù)據(jù)對(duì)應(yīng)于“OK,computer”時(shí),置信度分值可能為0.8。如果置信度分值為0.5而閾值為0.7,則計(jì)算設(shè)備將停止處理音頻數(shù)據(jù)。在音頻數(shù)據(jù)對(duì)應(yīng)于“dinner time”時(shí),置信度分值可能為0.5。
[0021]熱詞器將音頻數(shù)據(jù)提供至響度評(píng)分器。響度評(píng)分器計(jì)算該音頻數(shù)據(jù)的響度分值。通常,響度分值將反映用戶與每個(gè)計(jì)算設(shè)備的距離。例如,計(jì)算設(shè)備106的響度評(píng)分器126所計(jì)算的響度分值可以為0.9。計(jì)算設(shè)備108的響度評(píng)分器128所計(jì)算的響度分值可以為0.6。計(jì)算設(shè)備110的響度評(píng)分器130所計(jì)算的響度分值可以為0.5。在一些實(shí)施方式中,音頻子系統(tǒng)將該音頻數(shù)據(jù)提供至響度評(píng)分器。在這種實(shí)例下,熱詞器可以與響度評(píng)分器計(jì)算響度分值并行地計(jì)算話語(yǔ)104包括熱詞的可能性。
[0022]響度評(píng)分器可以使用生成與響度成比例的值的任何合適的技術(shù)來(lái)計(jì)算音頻數(shù)據(jù)的響度,例如以下技術(shù)的組合或其中的一種技術(shù)。一種技術(shù)可以是在用戶講出話語(yǔ)時(shí)計(jì)算由麥克風(fēng)所接收到的最大或平均聲壓或聲壓級(jí)。聲壓或聲壓級(jí)越高,響度就越大。第二種技術(shù)是計(jì)算音頻數(shù)據(jù)的均方根。音頻數(shù)據(jù)的均方根值越高,響度就越高。第三種技術(shù)是計(jì)算音頻數(shù)據(jù)的聲強(qiáng)。音頻數(shù)據(jù)的聲強(qiáng)越高,響度就越高。第四種技術(shù)是計(jì)算音頻數(shù)據(jù)的聲功率。聲功率越高,響度就越高。
[0023]響度評(píng)分器將響度分值提供至延遲計(jì)算模塊?;谠擁懚确种?,該模塊計(jì)算出計(jì)算設(shè)備在進(jìn)一步處理音頻數(shù)據(jù)并且通知其它計(jì)算設(shè)備該計(jì)算設(shè)備將處理音頻數(shù)據(jù)之前所應(yīng)當(dāng)?shù)却难舆t時(shí)間。例如,響度評(píng)分器126將響度分值0.9提供至延遲計(jì)算模塊132,并且模塊132計(jì)算出50毫秒的延遲時(shí)間。響度評(píng)分器128將響度分值0.6提供至延遲計(jì)算模塊134,并且延遲計(jì)算模塊134計(jì)算出延遲時(shí)間為200毫秒。響度評(píng)分器130將響度分值0.5提供至延遲計(jì)算模塊136,并且延遲計(jì)算模塊136計(jì)算出延遲時(shí)間為200毫秒。
[0024]之后,計(jì)時(shí)器對(duì)該延遲時(shí)間進(jìn)行倒計(jì)時(shí),并且一旦已經(jīng)流逝延遲時(shí)間,則該計(jì)時(shí)器致使計(jì)算設(shè)備箱向計(jì)算設(shè)備的揚(yáng)聲器傳送信號(hào)以供該揚(yáng)聲器發(fā)射通知信號(hào)。該計(jì)時(shí)器可以被包括在延遲計(jì)算模塊中,或者該計(jì)時(shí)器可以從延遲計(jì)算模塊分離。例如,該通知信號(hào)可以是超聲或可聽(tīng)的音頻信號(hào),或者是諸如藍(lán)牙的短距離無(wú)線電信號(hào)。該通知信號(hào)被其它計(jì)算設(shè)備所接收并且向該其它計(jì)算設(shè)備指示發(fā)射該通知信號(hào)的計(jì)算設(shè)備將負(fù)責(zé)對(duì)該音頻數(shù)據(jù)進(jìn)行處理。例如,延遲計(jì)算模塊132在指令揚(yáng)聲器138發(fā)射通知信號(hào)之前等待50毫秒。由于計(jì)算設(shè)備108和110在它們的計(jì)時(shí)器完成其相應(yīng)延遲時(shí)間的倒計(jì)時(shí)之前接收到該通知信號(hào),所以計(jì)算設(shè)備108和110停止該音頻數(shù)據(jù)的處理并且揚(yáng)聲器140和142不發(fā)射通知信號(hào)。在一些實(shí)施方式中,該通知信號(hào)可以包括特定的頻率和/或模式。例如,通知信號(hào)可以為20千赫以指示計(jì)算設(shè)備將對(duì)音頻數(shù)據(jù)執(zhí)行語(yǔ)音識(shí)別。
[0025]在一些實(shí)施方式中,在發(fā)射通知信號(hào)后,計(jì)算設(shè)備106還可以設(shè)置其設(shè)備狀態(tài)138。由于計(jì)算設(shè)備106是對(duì)音頻數(shù)據(jù)進(jìn)行處理的設(shè)備,所以設(shè)備狀態(tài)138被設(shè)置為活躍或“喚醒”。計(jì)算設(shè)備108和110的設(shè)備狀態(tài)140和142被設(shè)置為非活躍或“睡眠”,因?yàn)檫@兩個(gè)設(shè)備中的任何一個(gè)都不進(jìn)一步處理該音頻數(shù)據(jù)。
[0026]在一些實(shí)施方式中,計(jì)算設(shè)備的設(shè)備狀態(tài)可以不受影響。測(cè)量最響的音頻數(shù)據(jù)并且進(jìn)而最快發(fā)射通知信號(hào)的計(jì)算設(shè)備可以開(kāi)始進(jìn)一步處理音頻數(shù)據(jù),而其它計(jì)算設(shè)備保持喚醒或者進(jìn)入喚醒狀態(tài)。例如,用戶102可能在計(jì)算設(shè)備108上觀看電影并且在該用戶的手中有計(jì)算設(shè)備106。當(dāng)用戶102講出“OK,computer”時(shí),計(jì)算設(shè)備106檢測(cè)到該音頻數(shù)據(jù),并且在50毫秒后,計(jì)算設(shè)備106發(fā)射通知信號(hào)以指示計(jì)算設(shè)備106將進(jìn)一步處理該音頻數(shù)據(jù)。計(jì)算設(shè)備108接收到該通知信號(hào)并且繼續(xù)播放電影。
[0027]在一些實(shí)施方式中,計(jì)算設(shè)備可以在發(fā)射或接收到通知信號(hào)之前對(duì)音頻數(shù)據(jù)執(zhí)行語(yǔ)音識(shí)別。在發(fā)射或接收到通知信號(hào)之前執(zhí)行識(shí)別允許計(jì)算設(shè)備快速完成話語(yǔ)的語(yǔ)音識(shí)另1J。例如,如果話語(yǔ)是“OK, computer, cal I Alice(0K,計(jì)算機(jī),給Al ice打電話)”,則計(jì)算設(shè)備能夠開(kāi)始識(shí)別出用戶講出了 “call Alice”,使得如果該計(jì)算設(shè)備保持活躍狀態(tài)則該計(jì)算設(shè)備能夠更快地作出響應(yīng)。如果計(jì)算設(shè)備的設(shè)備狀態(tài)是非活躍的,則該計(jì)算設(shè)備可以不顯示其對(duì)“call Alice”執(zhí)行了語(yǔ)音識(shí)別的指示。在圖1中,使用該技術(shù)將致使計(jì)算設(shè)備106、108、和110對(duì)音頻數(shù)據(jù)以及在該音頻數(shù)據(jù)之后的任何音頻數(shù)據(jù)執(zhí)行語(yǔ)音識(shí)別。當(dāng)揚(yáng)聲器138傳送通知信號(hào)時(shí),則計(jì)算設(shè)備106將繼續(xù)執(zhí)行語(yǔ)音識(shí)別并且顯示結(jié)果。當(dāng)揚(yáng)聲器116和118接收到該通知信號(hào)時(shí),則計(jì)算設(shè)備106和108將停止執(zhí)行語(yǔ)音識(shí)別且不顯示結(jié)果。計(jì)算設(shè)備106和108向用戶102顯現(xiàn)為保持在非活躍狀態(tài)。
[0028]圖2是用于熱詞檢測(cè)的示例過(guò)程200的示圖。過(guò)程200可以由諸如來(lái)自圖1的計(jì)算設(shè)備108的計(jì)算設(shè)備來(lái)執(zhí)行。過(guò)程200計(jì)算:(i)話語(yǔ)包括熱詞的可能性;以及(ii)與話語(yǔ)相對(duì)應(yīng)的音頻數(shù)據(jù)的響度分值。過(guò)程200計(jì)算出計(jì)算設(shè)備在向其它計(jì)算設(shè)備通知該計(jì)算設(shè)備正在對(duì)音頻數(shù)據(jù)進(jìn)行處理之前等待的延遲時(shí)間。
[0029]計(jì)算設(shè)備接收對(duì)應(yīng)于話語(yǔ)的音頻數(shù)據(jù)(210)。用戶講出話語(yǔ)并且計(jì)算設(shè)備的麥克風(fēng)接收該話語(yǔ)的音頻數(shù)據(jù)。計(jì)算設(shè)備通過(guò)對(duì)該音頻數(shù)據(jù)進(jìn)行緩沖、濾波、端點(diǎn)指示、和數(shù)字化來(lái)對(duì)該音頻數(shù)據(jù)進(jìn)行處理。作為示例,用戶可以說(shuō)出“(《,computer”并且該計(jì)算設(shè)備的麥克風(fēng)將接收到對(duì)應(yīng)于“0K,Computer”的音頻數(shù)據(jù)。計(jì)算設(shè)備的音頻子系統(tǒng)將對(duì)該音頻數(shù)據(jù)進(jìn)行采樣、緩沖、濾波、和端點(diǎn)指示以用于由該計(jì)算設(shè)備進(jìn)一步進(jìn)行處理。
[0030]該計(jì)算設(shè)備確定該話語(yǔ)包括熱詞的可能性(220)。該計(jì)算設(shè)備通過(guò)將話語(yǔ)的音頻數(shù)據(jù)與包括熱詞的音頻樣本群組進(jìn)行比較和/或通過(guò)對(duì)話語(yǔ)的音頻數(shù)據(jù)的音頻特性進(jìn)行分析來(lái)確定該話語(yǔ)包括熱詞的可能性。在一些實(shí)施方式中,話語(yǔ)包括熱詞的可能性可以由置信度分值來(lái)表示。置信度分值可以被標(biāo)準(zhǔn)化到I至100的范圍,其中100指示話語(yǔ)包括熱詞的最高可能性。該計(jì)算設(shè)備可以將置信度分值與閾值進(jìn)行比較。如果置信度分值滿足閾值,則該計(jì)算設(shè)備將繼續(xù)處理該音頻數(shù)據(jù)。如果置信度分值并不滿足閾值,則該計(jì)算設(shè)備將停止處理音頻數(shù)據(jù)。在一些實(shí)施方式中,為了計(jì)算設(shè)備繼續(xù)進(jìn)行處理,該置信度分值應(yīng)當(dāng)高于閾值。例如,如果置信度分值為0.9而閾值為0.7,則計(jì)算設(shè)備將繼續(xù)處理該音頻數(shù)據(jù)。
[0031]在一些實(shí)施方式中,計(jì)算設(shè)備準(zhǔn)備接收指示另一個(gè)計(jì)算設(shè)備將發(fā)起對(duì)音頻數(shù)據(jù)的語(yǔ)音識(shí)別處理的信號(hào)。為了接收該信號(hào),計(jì)算設(shè)備可以確保該計(jì)算設(shè)備的麥克風(fēng)保持活躍,確保短距離無(wú)線電接收器為活躍,或者確保諸如局域無(wú)線無(wú)線電的另一個(gè)無(wú)線電為活躍。計(jì)算設(shè)備可能有必要準(zhǔn)備接收該信號(hào)以使得該計(jì)算設(shè)備在另一個(gè)計(jì)算設(shè)備顯示音頻數(shù)據(jù)的語(yǔ)音識(shí)別的結(jié)果時(shí)不顯示該結(jié)果。
[0032]計(jì)算設(shè)備確定音頻數(shù)據(jù)的響度分值(230)。計(jì)算設(shè)備可以使用以下技術(shù)的組合或其中的一種技術(shù)來(lái)計(jì)算音頻數(shù)據(jù)的響度分值。一種技術(shù)可以是計(jì)算在用戶正在講出話語(yǔ)時(shí)由麥克風(fēng)接收到的聲壓或聲壓級(jí)。聲壓或聲壓級(jí)越高,響度就越大。第二種技術(shù)是計(jì)算音頻數(shù)據(jù)的均方根。音頻數(shù)據(jù)的均方根值越高,響度就越高。第三種技術(shù)是計(jì)算音頻數(shù)據(jù)的聲強(qiáng)。音頻數(shù)據(jù)的聲強(qiáng)越高,響度就越高。第四種技術(shù)是計(jì)算音頻數(shù)據(jù)的聲功率。聲功率越高,響度就越高。計(jì)算設(shè)備所接收到的音頻數(shù)據(jù)的響度可以反映出計(jì)算設(shè)備與音頻源之間的距離。對(duì)于直接路徑信號(hào)傳播而言,響度大致與源和接收器之間的距離的平方成反比。在一些實(shí)施方式中,計(jì)算設(shè)備僅在話語(yǔ)包括熱詞的可能性滿足閾值的情況下才計(jì)算響度分值。如果話語(yǔ)不太可能包括熱詞,則計(jì)算設(shè)備不計(jì)算響度分值。
[0033]計(jì)算設(shè)備基于響度分值來(lái)確定延遲時(shí)間量(240)。在一些實(shí)施方式中,該延遲時(shí)間與響度分值成反比。例如,響度分值90可以對(duì)應(yīng)于50毫秒的延遲時(shí)間,并且響度分值0.6可以對(duì)應(yīng)于200毫秒的延遲時(shí)間。在一些實(shí)施方式中,如果響度分值不滿足閾值,則沒(méi)有延遲時(shí)間,即計(jì)算設(shè)備停止處理音頻信號(hào)并且在任何時(shí)間都不傳送通知。在一些實(shí)施方式中,如果響度超過(guò)閾值,則延遲時(shí)間將為0,這意味著對(duì)應(yīng)的計(jì)算設(shè)備繼續(xù)處理音頻信號(hào)并且立即向其它設(shè)備發(fā)出通知信號(hào)??梢允褂萌魏魏线m的方法來(lái)確定這些閾值,諸如通過(guò)實(shí)驗(yàn)來(lái)經(jīng)驗(yàn)地確定。
[0034]計(jì)算設(shè)備在已經(jīng)流逝延遲時(shí)間量之后傳送指示該計(jì)算設(shè)備將發(fā)起對(duì)音頻數(shù)據(jù)的語(yǔ)音識(shí)別處理的通知信號(hào)(250)。一旦計(jì)算設(shè)備計(jì)算出延遲時(shí)間,則該計(jì)算設(shè)備的計(jì)時(shí)器對(duì)該延遲時(shí)間進(jìn)行倒計(jì)時(shí)。當(dāng)已經(jīng)流逝延遲時(shí)間時(shí),該計(jì)算設(shè)備向附近的其它計(jì)算設(shè)備傳送諸如超聲、短距離無(wú)線電信號(hào)、或局域無(wú)線信號(hào)的信號(hào),以指示該計(jì)算設(shè)備正在發(fā)起對(duì)音頻數(shù)據(jù)的語(yǔ)音識(shí)別處理。例如,該計(jì)算設(shè)備在接收到音頻數(shù)據(jù)之后處于活躍或“喚醒”狀態(tài)并且其它計(jì)算設(shè)備在接收到該信號(hào)之后處于非活躍或“睡眠”狀態(tài)。
[0035]在一些實(shí)施方式中,該計(jì)算設(shè)備從另一個(gè)計(jì)算設(shè)備接收其它計(jì)算設(shè)備將發(fā)起對(duì)音頻數(shù)據(jù)的語(yǔ)音識(shí)別處理的信號(hào)。在這種實(shí)例下,該計(jì)算設(shè)備在計(jì)時(shí)器對(duì)延遲時(shí)間進(jìn)行倒計(jì)時(shí)的同時(shí)接收到該信號(hào)。當(dāng)計(jì)算設(shè)備接收到該信號(hào)時(shí),該計(jì)算設(shè)備將不執(zhí)行或不繼續(xù)執(zhí)行該音頻數(shù)據(jù)的語(yǔ)音識(shí)別。例如,如果計(jì)算設(shè)備計(jì)算出延遲時(shí)間為200毫秒,并且在該計(jì)算設(shè)備的計(jì)時(shí)器正在進(jìn)行200毫秒倒計(jì)時(shí)的同時(shí),該計(jì)算設(shè)備接收到來(lái)自另一個(gè)計(jì)算設(shè)備的通知信號(hào),則該計(jì)算設(shè)備將不對(duì)音頻數(shù)據(jù)執(zhí)行語(yǔ)音識(shí)別。在接收到該信號(hào)之后該計(jì)算設(shè)備現(xiàn)在可以處于非活躍或“睡眠”狀態(tài)。
[0036]在一些實(shí)施方式中,計(jì)算設(shè)備檢測(cè)處于附近并且能夠?qū)嵩~作出響應(yīng)的其它計(jì)算設(shè)備。該計(jì)算設(shè)備可以定期傳送請(qǐng)求響應(yīng)的超聲或無(wú)線電信號(hào)。例如,該計(jì)算設(shè)備可以在搜索識(shí)別熱詞的鄰近計(jì)算設(shè)備時(shí)傳送20.5千赫的超聲。作為響應(yīng),接收到該20.5千赫超聲的計(jì)算設(shè)備可以利用21千赫超聲作出響應(yīng)。當(dāng)計(jì)算設(shè)備沒(méi)有檢測(cè)到識(shí)別熱詞的鄰近計(jì)算設(shè)備時(shí),該計(jì)算設(shè)備在對(duì)音頻數(shù)據(jù)執(zhí)行語(yǔ)音識(shí)別之前可以不計(jì)算響度分值和延遲時(shí)間。
[0037]在一些實(shí)施方式中,該計(jì)算設(shè)備可以識(shí)別屬于相同用戶的其它計(jì)算設(shè)備。在設(shè)置新的計(jì)算設(shè)備時(shí),該設(shè)置流程的一部分可以是識(shí)別屬于相同用戶的其它計(jì)算設(shè)備。這可以通過(guò)檢測(cè)該用戶所登錄的其它設(shè)備來(lái)完成。一旦計(jì)算設(shè)備識(shí)別出另一個(gè)計(jì)算設(shè)備,則該計(jì)算設(shè)備可以交換標(biāo)明該計(jì)算設(shè)備在識(shí)別熱詞時(shí)能夠進(jìn)行交換的超聲頻率模式或比特流的數(shù)據(jù)。該超聲頻率模式可以通過(guò)揚(yáng)聲器進(jìn)行傳送并且該比特流可以通過(guò)無(wú)線電進(jìn)行傳送。例如,用戶可以設(shè)置恒溫器并且該設(shè)置過(guò)程的一部分是搜索處于附近并且對(duì)熱詞作出響應(yīng)的其他計(jì)算設(shè)備。該恒溫器可以識(shí)別該用戶所登錄的電話和平板計(jì)算機(jī)。作為示例,該恒溫器、電話、和平板電腦可以使用以20.5千赫下I毫秒、21千赫下I毫秒、以及21.5千赫下I毫秒的斜坡頻率模式來(lái)交換數(shù)據(jù)。該模式允許發(fā)起對(duì)音頻數(shù)據(jù)的語(yǔ)音識(shí)別處理的計(jì)算設(shè)備向?qū)儆谟脩舻钠渌?jì)算設(shè)備進(jìn)行通知且不抑制可能屬于另一個(gè)用戶的其它設(shè)備上的語(yǔ)音識(shí)別。
[0038]圖3示出了能夠被用來(lái)實(shí)現(xiàn)這里所描述的技術(shù)的計(jì)算設(shè)備300和移動(dòng)計(jì)算設(shè)備350。計(jì)算設(shè)備300意圖表示各種形式的數(shù)字計(jì)算機(jī),諸如膝上計(jì)算機(jī)、桌面計(jì)算機(jī)、工作站、個(gè)人數(shù)字助理、服務(wù)器、刀片服務(wù)器、大型主機(jī)、或其它適當(dāng)?shù)挠?jì)算機(jī)。移動(dòng)計(jì)算設(shè)備350意圖表示各種形式的移動(dòng)設(shè)備,諸如個(gè)人數(shù)字助理、蜂窩電話、智能電話、和其它類(lèi)似計(jì)算設(shè)備。這里所示的組件、其連接和關(guān)系、以及其功能僅意圖作為示例,而并不意味著作為限制。
[0039]計(jì)算設(shè)備300包括處理器302、存儲(chǔ)器304、存儲(chǔ)設(shè)備306、連接到存儲(chǔ)器304和高速擴(kuò)展端口 310的高速接口 308、以及連接到低速擴(kuò)展端口 314和存儲(chǔ)設(shè)備306的低速接口 312。處理器302、存儲(chǔ)器304、存儲(chǔ)設(shè)備306、高速接口 308、高速擴(kuò)展端口 310、和低速接口 312中的每一個(gè)都使用各種總線互連,并且可以安裝在公用主板上或者以其它適當(dāng)方式進(jìn)行安裝。處理器302能夠?qū)τ糜谠谟?jì)算設(shè)備300內(nèi)執(zhí)行的指令進(jìn)行處理,所述指令包括存儲(chǔ)在存儲(chǔ)器304中或存儲(chǔ)設(shè)備306上以顯示用于外部輸入/輸出設(shè)備上的GUI的圖形信息的指令,所述外部輸入/輸出設(shè)備諸如耦合到高速接口 308的顯示器316。在其它實(shí)施方式中,可以視情況使用多個(gè)處理器和/或多個(gè)總線,連同多個(gè)存儲(chǔ)器以及多種類(lèi)型的存儲(chǔ)器。而且,可以連接多個(gè)計(jì)算設(shè)備,其中每個(gè)設(shè)備提供必要操作的一部分(例如作為服務(wù)器組、刀片服務(wù)器群、或者多處理器系統(tǒng))。
[0040]存儲(chǔ)器304存儲(chǔ)計(jì)算設(shè)備300內(nèi)的信息。在一些實(shí)施方式中,存儲(chǔ)器304是一個(gè)或多個(gè)易失性存儲(chǔ)單元。在一些實(shí)施方式中,存儲(chǔ)器304是一個(gè)或多個(gè)非易失性存儲(chǔ)單元。存儲(chǔ)器304還可以是另一形式的計(jì)算機(jī)可讀介質(zhì),諸如磁盤(pán)或光盤(pán)。
[0041 ]存儲(chǔ)設(shè)備306能夠提供用于計(jì)算設(shè)備300的大型存儲(chǔ)。在一些實(shí)施方式中,存儲(chǔ)設(shè)備306可以是計(jì)算機(jī)可讀介質(zhì)或包含計(jì)算機(jī)可讀介質(zhì),諸如軟盤(pán)設(shè)備、硬盤(pán)設(shè)備、光盤(pán)設(shè)備、或磁帶設(shè)備、閃存或其它類(lèi)似的固態(tài)存儲(chǔ)器設(shè)備、或者設(shè)備陣列,包括在存儲(chǔ)區(qū)域網(wǎng)絡(luò)或其它配置中的設(shè)備。指令能夠被存儲(chǔ)在信息載體中。該指令當(dāng)被一個(gè)或多個(gè)處理設(shè)備(例如處理器302)執(zhí)行時(shí)執(zhí)行諸如以上所描述的那些的一種或多種方法。該指令還能夠由諸如計(jì)算機(jī)或機(jī)器可讀介質(zhì)的一個(gè)或多個(gè)存儲(chǔ)設(shè)備(例如存儲(chǔ)器304、存儲(chǔ)設(shè)備306、或者處理器302上的存儲(chǔ)器)來(lái)存儲(chǔ)。
[0042]高速接口 308對(duì)計(jì)算設(shè)備300的帶寬密集型操作進(jìn)行管理,而低速控制器312對(duì)較低帶寬密集型操作進(jìn)行管理。這樣的功能分配僅是示例性的。在一些實(shí)施方式中,高速接口308耦合到存儲(chǔ)器304、顯示器316(例如通過(guò)圖形處理器或加速器來(lái)耦合),并且耦合到可以接受各種擴(kuò)展卡(未示出)的高速擴(kuò)展端口 310。在所述實(shí)施方式中,低速接口 312耦合到存儲(chǔ)設(shè)備306和低速擴(kuò)展端口 314。可以包括各種通信端口(例如USB、藍(lán)牙、以太網(wǎng)、無(wú)線以太網(wǎng))的低速擴(kuò)展端口 314可以耦合到諸如鍵盤(pán)、指示設(shè)備、掃描儀的一個(gè)或多個(gè)輸入/輸出設(shè)備,或者例如通過(guò)網(wǎng)絡(luò)適配器耦合到諸如交換機(jī)或路由器的聯(lián)網(wǎng)設(shè)備。
[0043]如圖所示,可以以多種不同形式來(lái)實(shí)現(xiàn)計(jì)算設(shè)備300。例如,計(jì)算設(shè)備300可以被實(shí)現(xiàn)為標(biāo)準(zhǔn)服務(wù)器320,或者多次被實(shí)現(xiàn)在這樣的服務(wù)器的群組中。此外,計(jì)算設(shè)備300可以在諸如膝上型計(jì)算機(jī)322的個(gè)人計(jì)算機(jī)中實(shí)現(xiàn)。計(jì)算設(shè)備300也可以被實(shí)現(xiàn)為機(jī)架式服務(wù)器系統(tǒng)324的一部分。替選地,來(lái)自計(jì)算設(shè)備300的組件可以與諸如移動(dòng)計(jì)算設(shè)備350的移動(dòng)設(shè)備(未示出)中的其它組件進(jìn)行組合。這樣的設(shè)備中的每一個(gè)可以包含計(jì)算設(shè)備300和移動(dòng)計(jì)算設(shè)備350中的一個(gè)或多個(gè),并且整個(gè)系統(tǒng)可以由相互通信的多個(gè)計(jì)算設(shè)備組成。
[0044]除其它組件之外,移動(dòng)計(jì)算設(shè)備350包括處理器352、存儲(chǔ)器364、諸如顯示器354的輸入/輸出設(shè)備、通信接口 366、以及收發(fā)器368。設(shè)備350還可以提供有諸如微型驅(qū)動(dòng)器或其它設(shè)備的存儲(chǔ)設(shè)備以提供額外的存儲(chǔ)。處理器352、存儲(chǔ)器364、顯示器354、通信接口 366、和收發(fā)器368中的每一個(gè)使用各種總線互連,并且組件中的若干可以被安裝在公用主板上或者以其它適當(dāng)方式安裝。
[0045]處理器352能夠執(zhí)行計(jì)算設(shè)備350內(nèi)的指令,包括存儲(chǔ)在存儲(chǔ)器364中的指令。處理器可以被實(shí)現(xiàn)為包括單獨(dú)的和多個(gè)模擬和數(shù)字處理器的芯片的芯片組。例如,處理器352可以提供對(duì)設(shè)備350的其它組件的協(xié)調(diào),諸如對(duì)用戶接口、移動(dòng)計(jì)算設(shè)備350所運(yùn)行的應(yīng)用、以及移動(dòng)計(jì)算設(shè)備350所進(jìn)行的無(wú)線通信的控制。
[0046]處理器352可以通過(guò)耦合到顯示器354的控制接口 358和顯示接口 356與用戶進(jìn)行通信。例如,顯示器354可以是TFT(薄膜晶體管液晶顯示器)顯示器或0LED(有機(jī)發(fā)光二極管)顯示器或者其它適當(dāng)?shù)娘@示技術(shù)。顯示接口 356可以包括用于驅(qū)動(dòng)顯示器354以向用戶呈現(xiàn)圖形和其它信息的適當(dāng)電路??刂平涌?58可以接收來(lái)自用戶的命令并且對(duì)該命令進(jìn)行轉(zhuǎn)換以用于向處理器352提交。此外,可以提供與處理器352通信的外部接口 362,以便使得設(shè)備350能夠與其它設(shè)備進(jìn)行近區(qū)域通信。例如,以太接口 363在一些實(shí)施方式中可以提供有線通信,或者在其它實(shí)施方式中提供無(wú)線通信,并且還可以使用多個(gè)接口。
[0047]存儲(chǔ)器364存儲(chǔ)移動(dòng)計(jì)算設(shè)備350內(nèi)的信息。存儲(chǔ)器364可以被實(shí)現(xiàn)為一個(gè)或多個(gè)計(jì)算機(jī)可讀介質(zhì)或媒體、一個(gè)或多個(gè)易失性存儲(chǔ)單元、或者一個(gè)或多個(gè)非易失性存儲(chǔ)單元。也可以提供擴(kuò)展存儲(chǔ)器374并通過(guò)擴(kuò)展接口 372連接至設(shè)備350,例如所述擴(kuò)展接口可以包括SHM(單列直插內(nèi)存模塊)卡接口。擴(kuò)展存儲(chǔ)器374可以為移動(dòng)計(jì)算設(shè)備350提供額外的存儲(chǔ)空間,或者還可以存儲(chǔ)用于移動(dòng)計(jì)算設(shè)備350的應(yīng)用和其它信息。具體地,擴(kuò)展存儲(chǔ)器374可以包括指令以執(zhí)行或補(bǔ)充以上所描述的過(guò)程,并且還可包括安全信息。因此,例如,擴(kuò)展存儲(chǔ)器374可以作為移動(dòng)計(jì)算設(shè)備350的安全模塊來(lái)提供,并且可以被編程有許可對(duì)移動(dòng)計(jì)算設(shè)備350進(jìn)行安全使用的指令。此外,安全應(yīng)用連同附加信息可以經(jīng)由SMM卡來(lái)被提供,諸如以不可非法侵入的方式在SIMM卡上設(shè)置標(biāo)識(shí)信息。
[0048]如以下所討論的,例如,存儲(chǔ)器可以包括閃存和/或NVRAM存儲(chǔ)器(非易失性隨機(jī)存取存儲(chǔ)器)。在一些實(shí)施方式中,指令被存儲(chǔ)在信息載體中。該指令當(dāng)被一個(gè)或多個(gè)處理設(shè)備(例如處理器352)執(zhí)行時(shí),執(zhí)行諸如以上所描述的那些方法中的一種或多種方法。該指令還能夠被諸如一個(gè)或多個(gè)計(jì)算機(jī)可讀或機(jī)器可讀介質(zhì)的一個(gè)或多個(gè)存儲(chǔ)設(shè)備(例如存儲(chǔ)器364、擴(kuò)展存儲(chǔ)器374、或者處理器352上的存儲(chǔ)器)所存儲(chǔ)。在一些實(shí)施方式中,例如,該指令能夠通過(guò)收發(fā)器368或外部接口 362來(lái)以傳播信號(hào)的方式被接收。
[0049]在必要的情況下,移動(dòng)計(jì)算設(shè)備350可以通過(guò)通信接口 366來(lái)無(wú)線地通信,所述通信接口 366可以包括數(shù)字信號(hào)處理電路。通信接口 366可以提供在各種模式或協(xié)議下的通信,除其它之外,諸如GSM語(yǔ)音通話(全球移動(dòng)通信系統(tǒng))、SMS(短消息服務(wù))、EMS(增強(qiáng)型消息服務(wù))、或麗S(多媒體消息服務(wù))消息發(fā)送、CDMA(碼分多址)、TDMA(時(shí)分多址)、PDC(個(gè)人數(shù)字蜂窩)、WCDMA(寬帶碼分多址)、CDMA2000、或GPRS(通用分組無(wú)線電服務(wù))。例如,這樣的通信可以通過(guò)收發(fā)器368使用射頻來(lái)發(fā)生。此外,諸如使用藍(lán)牙、WiF1、或其它這樣的收發(fā)器(未示出)可以發(fā)生短距離通信。此外,GPS(全球定位系統(tǒng))接收器模塊370可以向移動(dòng)計(jì)算設(shè)備350提供附加的導(dǎo)航相關(guān)和位置相關(guān)的無(wú)線數(shù)據(jù),所述無(wú)線數(shù)據(jù)可由在移動(dòng)計(jì)算設(shè)備350上運(yùn)行的應(yīng)用程序視情況使用。
[0050]移動(dòng)計(jì)算設(shè)備350還可以使用音頻編解碼器360可聽(tīng)地通信,所述音頻編解碼器360可以接收來(lái)自用戶的語(yǔ)音信息并將其轉(zhuǎn)換為可使用的數(shù)字信息。同樣,音頻編解碼器360可以諸如通過(guò)例如移動(dòng)計(jì)算設(shè)備350的送受話器中的揚(yáng)聲器為用戶生成可聽(tīng)的聲音。這樣的聲音可以包括來(lái)自語(yǔ)音電話呼叫的聲音,可以包括已記錄的聲音(例如語(yǔ)音消息、音樂(lè)文件等),并且還可以包括在移動(dòng)計(jì)算設(shè)備350上操作的應(yīng)用所生成的聲音。
[0051]如圖所示,可以以多種不同形式來(lái)實(shí)現(xiàn)移動(dòng)計(jì)算設(shè)備350。例如,移動(dòng)計(jì)算設(shè)備350可以被實(shí)現(xiàn)為蜂窩電話380。移動(dòng)計(jì)算設(shè)備350還可以被實(shí)現(xiàn)為智能電話382、個(gè)人數(shù)字助理、或其它類(lèi)似移動(dòng)設(shè)備的一部分
[0052]這里所描述的系統(tǒng)和技術(shù)的各種實(shí)施方式可以以數(shù)字電子電路、集成電路、專(zhuān)門(mén)設(shè)計(jì)的ASICX專(zhuān)用集成電路)、計(jì)算機(jī)硬件、固件、軟件、和/或以上的組合來(lái)實(shí)現(xiàn)。這些各種實(shí)施方式可以包括一個(gè)或多個(gè)計(jì)算機(jī)程序中的實(shí)施方式,所述計(jì)算機(jī)程序可以在包括至少一個(gè)可編程處理器、至少一個(gè)輸入設(shè)備和至少一個(gè)輸出設(shè)備的可編程系統(tǒng)上執(zhí)行和/或解釋?zhuān)隹删幊烫幚砥魇菍?zhuān)用或通用的,被耦合以從存儲(chǔ)系統(tǒng)接收數(shù)據(jù)和指令并且向所述存儲(chǔ)系統(tǒng)傳送數(shù)據(jù)和指令。
[0053]這些計(jì)算機(jī)程序(也被稱(chēng)作程序、軟件、軟件應(yīng)用程序、或代碼)包括用于可編程處理器的機(jī)器指令,并且可以以高級(jí)程序語(yǔ)言和/或面向?qū)ο蟮木幊陶Z(yǔ)言、和/或匯編/機(jī)器語(yǔ)言來(lái)實(shí)現(xiàn)。如本文所使用的,術(shù)語(yǔ)機(jī)器可讀介質(zhì)和計(jì)算機(jī)可讀介質(zhì)是指被用來(lái)向可編程處理器提供機(jī)器指令和/或數(shù)據(jù)的任何計(jì)算機(jī)程序產(chǎn)品、裝置和/或設(shè)備(例如,磁盤(pán)、光盤(pán)、存儲(chǔ)器、可編程邏輯設(shè)備(PLD)),包括接收作為機(jī)器可讀信號(hào)的機(jī)器指令的機(jī)器可讀介質(zhì)。術(shù)語(yǔ)機(jī)器可讀信號(hào)是指用于向可編程處理器提供機(jī)器指令和/或數(shù)據(jù)的任何信號(hào)。
[0054]為了提供與用戶的交互,這里所描述的系統(tǒng)和技術(shù)可在具有下述的計(jì)算機(jī)上實(shí)現(xiàn):用于向用戶顯示信息的顯示設(shè)備(例如,CRT(陰極射線管)或LCD(液晶顯示器)監(jiān)視器),以及用戶通過(guò)其可以向計(jì)算機(jī)提供輸入的鍵盤(pán)和指示設(shè)備(例如,鼠標(biāo)或軌跡球)。還可使用其它類(lèi)型的設(shè)備來(lái)提供與用戶的交互;例如,提供給用戶的反饋可以為任何形式的感官反饋(例如,視覺(jué)反饋、聽(tīng)覺(jué)反饋、或觸覺(jué)反饋);并且可以以任何形式來(lái)接收來(lái)自用戶的輸入,所述形式包括以聲音、語(yǔ)音、或觸覺(jué)輸入。
[0055]這里所描述的系統(tǒng)和技術(shù)可以以計(jì)算系統(tǒng)來(lái)實(shí)現(xiàn),所述計(jì)算系統(tǒng)包括:后端組件(例如作為數(shù)據(jù)服務(wù)器),或者包括中間組件(例如應(yīng)用服務(wù)器),或者包括前端組件(例如,具有用戶通過(guò)其可以與這里所描述的系統(tǒng)和技術(shù)的實(shí)施方式進(jìn)行交互的圖形用戶界面或Web瀏覽器的客戶端計(jì)算機(jī)),或者這樣的后端、中間件、或前端組件的組合。所述系統(tǒng)的組件能夠通過(guò)任何形式或介質(zhì)的數(shù)字?jǐn)?shù)據(jù)通信(例如,通信網(wǎng)絡(luò))互連。通信網(wǎng)絡(luò)的示例包括局域網(wǎng)(LAN)、廣域網(wǎng)(WAN)、和互聯(lián)網(wǎng)ο
[0056]計(jì)算系統(tǒng)能夠包括客戶端和服務(wù)器??蛻舳撕头?wù)器通常彼此遠(yuǎn)離并且典型地通過(guò)通信網(wǎng)絡(luò)進(jìn)行交互??蛻舳撕头?wù)器的關(guān)系依靠在各自計(jì)算機(jī)上運(yùn)行并且彼此具有客戶端一服務(wù)器關(guān)系的計(jì)算機(jī)程序產(chǎn)生。
[0057]雖然上文中已經(jīng)詳細(xì)描述了一些實(shí)施方式,但是其它修改也是可能的。例如,雖然客戶端應(yīng)用被描述為訪問(wèn)(一個(gè)或多個(gè))委托,但是在其它實(shí)施方式中,(一個(gè)或多個(gè))委托可以被一個(gè)或多個(gè)處理器所實(shí)現(xiàn)的其它應(yīng)用所采用,所述其他應(yīng)用諸如在一個(gè)或多個(gè)服務(wù)器上執(zhí)行的應(yīng)用。此外,在圖中所描繪的邏輯流不需要所示出的特定順序或連續(xù)順序來(lái)實(shí)現(xiàn)所期望的結(jié)果。此外,可以提供其它動(dòng)作,或者可以從所描述的流中消除動(dòng)作,并且可以向所描述的系統(tǒng)添加其他組件或者從其去除其他組件。因此,其它實(shí)施方式在以下的權(quán)利要求書(shū)的范圍之內(nèi)。
【主權(quán)項(xiàng)】
1.一種計(jì)算機(jī)實(shí)現(xiàn)的方法,包括: 由計(jì)算設(shè)備接收對(duì)應(yīng)于話語(yǔ)的音頻數(shù)據(jù); 確定所述話語(yǔ)包括熱詞的可能性; 確定所述音頻數(shù)據(jù)的響度分值; 基于所述響度分值來(lái)確定延遲時(shí)間量; 在已經(jīng)流逝所述延遲時(shí)間量之后,傳送指示所述計(jì)算設(shè)備將發(fā)起對(duì)所述音頻數(shù)據(jù)的語(yǔ)音識(shí)別處理的信號(hào)。2.根據(jù)權(quán)利要求1所述的方法,包括: 由所述計(jì)算設(shè)備接收對(duì)應(yīng)于附加話語(yǔ)的附加音頻數(shù)據(jù); 確定所述附加話語(yǔ)包括熱詞的第二可能性; 確定所述附加音頻數(shù)據(jù)的第二響度分值; 基于所述第二響度分值來(lái)確定第二延遲時(shí)間量;以及 在已經(jīng)流逝所述延遲時(shí)間量之前,接收第二信號(hào),所述第二信號(hào)指示:(i)第二計(jì)算設(shè)備將發(fā)起對(duì)所述附加音頻數(shù)據(jù)的語(yǔ)音識(shí)別處理,以及(ii)所述計(jì)算設(shè)備不應(yīng)當(dāng)發(fā)起對(duì)所述附加音頻數(shù)據(jù)的語(yǔ)音識(shí)別處理。3.根據(jù)權(quán)利要求2所述的方法,包括: 基于接收到所述第二信號(hào),確定所述計(jì)算設(shè)備的激活狀態(tài)為非活躍狀態(tài)。4.根據(jù)權(quán)利要求1所述的方法,包括: 基于傳送所述信號(hào),確定所述計(jì)算設(shè)備的激活狀態(tài)為活躍狀態(tài)。5.根據(jù)權(quán)利要求1所述的方法,其中,所述信號(hào)包括超聲信號(hào)或短距離無(wú)線電信號(hào)。6.根據(jù)權(quán)利要求1所述的方法,其中,所述信號(hào)被另一個(gè)計(jì)算設(shè)備所接收以及向其它計(jì)算設(shè)備指示不發(fā)起對(duì)所述音頻數(shù)據(jù)的語(yǔ)音識(shí)別處理。7.根據(jù)權(quán)利要求1所述的方法,包括: 基于確定所述話語(yǔ)包括熱詞的可能性,準(zhǔn)備接收指示另一個(gè)計(jì)算設(shè)備將發(fā)起對(duì)所述音頻數(shù)據(jù)的語(yǔ)音識(shí)別處理的信號(hào)。8.根據(jù)權(quán)利要求1所述的方法,其中,所述響度分值與所述延遲時(shí)間量成比例。9.根據(jù)權(quán)利要求1所述的方法,其中,在所述響度分值滿足閾值時(shí)所述延遲時(shí)間為零。10.根據(jù)權(quán)利要求1所述的方法,其中,確定所述音頻數(shù)據(jù)的響度分值包括: 確定所述話語(yǔ)包括所述熱詞的所述可能性包括可能性閾值。11.一種系統(tǒng),包括: 一個(gè)或多個(gè)計(jì)算機(jī)和存儲(chǔ)指令的一個(gè)或多個(gè)存儲(chǔ)設(shè)備,所述指令在被所述一個(gè)或多個(gè)計(jì)算機(jī)所執(zhí)行時(shí)可操作為使所述一個(gè)或多個(gè)計(jì)算機(jī)執(zhí)行操作,所述操作包括: 由計(jì)算設(shè)備接收對(duì)應(yīng)于話語(yǔ)的音頻數(shù)據(jù); 確定所述話語(yǔ)包括熱詞的可能性; 確定所述音頻數(shù)據(jù)的響度分值; 基于所述響度分值來(lái)確定延遲時(shí)間量; 在已經(jīng)流逝所述延遲時(shí)間量之后,傳送指示所述計(jì)算設(shè)備將發(fā)起對(duì)所述音頻數(shù)據(jù)的語(yǔ)音識(shí)別處理的信號(hào)。12.根據(jù)權(quán)利要求11所述的系統(tǒng),其中,所述操作進(jìn)一步包括: 由所述計(jì)算設(shè)備接收對(duì)應(yīng)于附加話語(yǔ)的附加音頻數(shù)據(jù); 確定所述附加話語(yǔ)包括熱詞的第二可能性; 確定所述附加音頻數(shù)據(jù)的第二響度分值; 基于所述第二響度分值來(lái)確定第二延遲時(shí)間量;以及 在已經(jīng)流逝所述延遲時(shí)間量之前,接收第二信號(hào),所述第二信號(hào)指示:(i)第二計(jì)算設(shè)備將發(fā)起對(duì)所述附加音頻數(shù)據(jù)的語(yǔ)音識(shí)別處理,以及(ii)所述計(jì)算設(shè)備不應(yīng)當(dāng)發(fā)起對(duì)所述附加音頻數(shù)據(jù)的語(yǔ)音識(shí)別處理。13.根據(jù)權(quán)利要求11所述的系統(tǒng),其中,所述操作進(jìn)一步包括: 基于傳送所述信號(hào),確定所述計(jì)算設(shè)備的激活狀態(tài)為活躍狀態(tài)。14.根據(jù)權(quán)利要求11所述的系統(tǒng),其中,所述信號(hào)包括超聲信號(hào)或短距離無(wú)線電信號(hào)。15.根據(jù)權(quán)利要求11所述的系統(tǒng),其中,所述信號(hào)被另一個(gè)計(jì)算設(shè)備所接收以及向其它計(jì)算設(shè)備指示不發(fā)起對(duì)所述音頻數(shù)據(jù)的語(yǔ)音識(shí)別處理。16.根據(jù)權(quán)利要求11所述的系統(tǒng),其中,所述操作進(jìn)一步包括: 基于確定所述話語(yǔ)包括熱詞的可能性,準(zhǔn)備接收指示另一個(gè)計(jì)算設(shè)備將發(fā)起對(duì)所述音頻數(shù)據(jù)的語(yǔ)音識(shí)別處理的信號(hào)。17.根據(jù)權(quán)利要求11所述的系統(tǒng),其中,所述響度分值與所述延遲時(shí)間量成比例。18.根據(jù)權(quán)利要求11所述的系統(tǒng),其中,在所述響度分值滿足閾值時(shí)所述延遲時(shí)間為零。19.根據(jù)權(quán)利要求11所述的系統(tǒng),其中,確定所述音頻數(shù)據(jù)的響度分值包括: 確定所述話語(yǔ)包括所述熱詞的所述可能性滿足可能性閾值。20.—種存儲(chǔ)軟件的非暫時(shí)性計(jì)算機(jī)可讀介質(zhì),所述軟件包括能夠由一個(gè)或多個(gè)計(jì)算機(jī)執(zhí)行的指令,所述指令在這樣的執(zhí)行時(shí)使所述一個(gè)或多個(gè)計(jì)算機(jī)執(zhí)行操作,包括: 由計(jì)算設(shè)備接收對(duì)應(yīng)于話語(yǔ)的音頻數(shù)據(jù); 確定所述話語(yǔ)包括熱詞的可能性; 確定所述音頻數(shù)據(jù)的響度分值; 基于所述響度分值來(lái)確定延遲時(shí)間量; 在已經(jīng)流逝所述延遲時(shí)間量之后,傳送指示所述計(jì)算設(shè)備將發(fā)起對(duì)所述音頻數(shù)據(jù)的語(yǔ)音識(shí)別處理的信號(hào)。
【文檔編號(hào)】G10L15/22GK105960673SQ201580006769
【公開(kāi)日】2016年9月21日
【申請(qǐng)日】2015年9月29日
【發(fā)明人】雅各布·尼古勞斯·弗爾斯特, 亞歷山大·H·格倫斯坦
【申請(qǐng)人】谷歌公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1