亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

用于在電子裝置中執(zhí)行語(yǔ)音命令的方法和設(shè)備與流程

文檔序號(hào):12368769閱讀:236來(lái)源:國(guó)知局
用于在電子裝置中執(zhí)行語(yǔ)音命令的方法和設(shè)備與流程

技術(shù)領(lǐng)域

本公開(kāi)總體涉及一種電子裝置。更具體地講,本公開(kāi)涉及一種用于在電子裝置中執(zhí)行語(yǔ)音命令的設(shè)備和方法。



背景技術(shù):

近來(lái),隨著多媒體技術(shù)已發(fā)展,具有多功能的電子裝置已激增。這樣的多功能裝置的示例包括便攜式終端(例如,智能電話、平板PC、智能相機(jī))以及固定的基于家庭的裝置(例如,與家用廚房電器集成的電子裝置)。電子裝置大多包括組合多個(gè)功能的匯聚功能。

便攜式終端設(shè)計(jì)者努力實(shí)現(xiàn)先進(jìn)的性能以及匯聚功能,以及裝置的纖薄和審美設(shè)計(jì)作為一體。終端制造者競(jìng)爭(zhēng)來(lái)呈現(xiàn)大致相同或先進(jìn)的性能,并設(shè)計(jì)比先前的設(shè)計(jì)更小和更薄的新的模型。

在可用的各種功能中,最近商業(yè)化的裝置提供相對(duì)高的精確度的語(yǔ)音識(shí)別功能。這樣的語(yǔ)音識(shí)別功能精確地識(shí)別用戶的語(yǔ)音以在沒(méi)有按壓分離的按鈕或觸摸鍵或觸摸屏的情況下容易地執(zhí)行裝置的相應(yīng)功能。

例如,語(yǔ)音識(shí)別功能允許用戶在便攜式終端(例如,智能電話)中無(wú)需單獨(dú)的操縱而做出呼叫或編寫(xiě)文本消息,以發(fā)送產(chǎn)生的消息,并容易地設(shè)置各種功能(例如,路線規(guī)劃、互聯(lián)網(wǎng)搜索和鬧鈴)。

為了執(zhí)行語(yǔ)音識(shí)別功能,現(xiàn)有技術(shù)驅(qū)動(dòng)相應(yīng)的語(yǔ)音識(shí)別應(yīng)用,激活語(yǔ)音識(shí)別功能,隨后執(zhí)行相應(yīng)的功能。

然而,為了執(zhí)行語(yǔ)音識(shí)別,響應(yīng)于分離的鍵或觸摸屏上的觸摸輸入命令,語(yǔ)音識(shí)別應(yīng)用被初始啟動(dòng)。此操作違背用于促進(jìn)數(shù)據(jù)輸入(而沒(méi)有觸摸)的語(yǔ)音識(shí)別的獨(dú)特功能。另外,開(kāi)始語(yǔ)音識(shí)別應(yīng)用需要在包括各種應(yīng)用對(duì)象的顯示屏上找出語(yǔ)音識(shí)別應(yīng)用,這在特定情況下可能會(huì)困難并且費(fèi)時(shí)。



技術(shù)實(shí)現(xiàn)要素:

公開(kāi)了一種用于在一種電子裝置中執(zhí)行語(yǔ)音命令的設(shè)備和方法的實(shí)施例。在示例性實(shí)施例中,檢測(cè)語(yǔ)音信號(hào)并識(shí)別語(yǔ)音信號(hào)的言語(yǔ)。當(dāng)識(shí)別的言語(yǔ)包含喚醒命令時(shí),激活語(yǔ)音命令模式,并且至少包含檢測(cè)到的語(yǔ)音信號(hào)的一部分的信號(hào)被發(fā)送到服務(wù)器。服務(wù)器產(chǎn)生與語(yǔ)音命令相應(yīng)的控制信號(hào)或結(jié)果信號(hào),并將所述與語(yǔ)音命令相應(yīng)的控制信號(hào)或結(jié)果信號(hào)發(fā)送回電子裝置。電子裝置接收并處理控制信號(hào)或結(jié)果信號(hào),并被喚醒。從而,在不需要用戶物理地觸摸電子裝置的情況下執(zhí)行語(yǔ)音命令。

在各種實(shí)施例中:

語(yǔ)音信號(hào)可包括喚醒命令,其中,喚醒命令緊接著語(yǔ)音命令。

喚醒命令還可包括語(yǔ)音命令。

可在在喚醒命令和語(yǔ)音命令之間確定沉默持續(xù)時(shí)間。

處理控制信號(hào)或結(jié)果信號(hào)的步驟可包括執(zhí)行電子裝置的特定應(yīng)用。

處理控制信號(hào)或結(jié)果信號(hào)的步驟可包括顯示與所述結(jié)果信號(hào)相應(yīng)的數(shù)據(jù)。

一旦激活語(yǔ)音命令模式,就可在指示語(yǔ)音命令模式被激活的顯示器上激活對(duì)象。

當(dāng)在言語(yǔ)中的喚醒命令被識(shí)別之前屏幕被鎖定時(shí),可響應(yīng)于識(shí)別的喚醒命令對(duì)屏幕進(jìn)行解鎖。

只要語(yǔ)音信號(hào)的預(yù)定說(shuō)話者被識(shí)別,言語(yǔ)可被識(shí)別為包含預(yù)定喚醒命令。當(dāng)預(yù)定說(shuō)話者的語(yǔ)音被識(shí)別時(shí),可自動(dòng)檢測(cè)喚醒命令。

可選擇地,當(dāng)識(shí)別預(yù)定說(shuō)話者的語(yǔ)音并且在預(yù)定說(shuō)話者的言語(yǔ)之內(nèi)識(shí)別預(yù)定喚醒命令時(shí),可檢測(cè)到喚醒命令。在另一實(shí)施例中,一種用于在電子裝置中執(zhí)行語(yǔ)音命令的方法,包括:檢測(cè)包含喚醒命令和語(yǔ)音命令中的至少一個(gè)的語(yǔ)音信號(hào);將所述語(yǔ)音信號(hào)發(fā)送到服務(wù)器;在接收指示服務(wù)器檢測(cè)到語(yǔ)音信號(hào)中的喚醒命令的結(jié)果信號(hào)時(shí),喚醒電子裝置;從服務(wù)器接收與語(yǔ)音命令相應(yīng)的控制信號(hào)或結(jié)果信號(hào);處理所述與語(yǔ)音命令相應(yīng)的控制信號(hào)或結(jié)果信號(hào)。

在實(shí)施例中,一種可在用于支持電子裝置的語(yǔ)音命令的服務(wù)器中進(jìn)行操作的方法,包括:從電子裝置接收至少包含語(yǔ)音命令的發(fā)送的語(yǔ)音信號(hào);

通過(guò)識(shí)別和分析所述語(yǔ)音命令來(lái)產(chǎn)生與所述語(yǔ)音命令相應(yīng)的控制信號(hào)或結(jié)果信號(hào);將與第一語(yǔ)音命令相應(yīng)的控制信號(hào)或結(jié)果信號(hào)發(fā)送到電子裝置。

在實(shí)施例中,一種電子裝置包括:一個(gè)或多個(gè)處理器;存儲(chǔ)器;存儲(chǔ)在存儲(chǔ)器中并被配置為被一個(gè)或多個(gè)處理器執(zhí)行的一個(gè)或多個(gè)程序,其中,所述程序包括用于檢測(cè)語(yǔ)音信號(hào)并識(shí)別語(yǔ)音信號(hào)的言語(yǔ)的指令;當(dāng)所述言語(yǔ)被識(shí)別為包含喚醒命令時(shí),激活語(yǔ)音命令模式并將至少包含檢測(cè)到的語(yǔ)音信號(hào)的部分的發(fā)送信號(hào)發(fā)送到服務(wù)器;響應(yīng)于由服務(wù)器識(shí)別的發(fā)送信號(hào)之內(nèi)的語(yǔ)音命令,接收并處理由服務(wù)器產(chǎn)生和發(fā)送的控制信號(hào)或結(jié)果信號(hào)。

根據(jù)本發(fā)明的另一方面,通過(guò)下面結(jié)合附圖公開(kāi)本發(fā)明的示例性實(shí)施例的詳細(xì)描述,本發(fā)明的其他方面、優(yōu)點(diǎn)和突出特點(diǎn)對(duì)本領(lǐng)域的技術(shù)人員會(huì)變得清楚。

附圖說(shuō)明

從以下結(jié)合附圖進(jìn)行的描述,本發(fā)明的特定示例性實(shí)施例的上述和其它方面、特點(diǎn)和優(yōu)點(diǎn)將會(huì)變得更加清楚,其中:

圖1A是根據(jù)本發(fā)明的示例性實(shí)施例的用于執(zhí)行語(yǔ)音命令的電子裝置的框圖;

圖1B是根據(jù)實(shí)施例的用于執(zhí)行語(yǔ)音命令的系統(tǒng)的示圖;

圖2是根據(jù)本發(fā)明的一個(gè)示例性實(shí)施例的用于在電子裝置中執(zhí)行喚醒命令和語(yǔ)音命令的方法的流程圖;

圖3是根據(jù)本發(fā)明的一個(gè)示例性實(shí)施例的可在服務(wù)器中進(jìn)行操作的方法的流程圖;

圖4是根據(jù)本發(fā)明的另一示例性實(shí)施例的用于在電子裝置中執(zhí)行語(yǔ)音命令的方法的流程圖;

圖5是根據(jù)本發(fā)明的另一示例性實(shí)施例的可在服務(wù)器中進(jìn)行操作的另一方法的流程圖;

圖6是根據(jù)本發(fā)明的另一示例性實(shí)施例的用于在電子裝置中執(zhí)行語(yǔ)音命令的方法的流程圖;

圖7示出根據(jù)本發(fā)明的實(shí)施例的包括可檢測(cè)到和識(shí)別的喚醒命令和語(yǔ)音命令的語(yǔ)音信號(hào);

圖8A、圖8B和圖8C示出根據(jù)本發(fā)明的示例性實(shí)施例的基于包括喚醒命令和語(yǔ)音命令的語(yǔ)音信號(hào)的撥號(hào);

圖9A和圖9B描繪根據(jù)本發(fā)明的示例性實(shí)施例的用于示出通過(guò)喚醒命令檢測(cè)解鎖的屏幕的屏幕截圖。

貫穿附圖,相同的標(biāo)號(hào)將被理解為指示相同的部件、組件和結(jié)構(gòu)。

具體實(shí)施方式

提供以下參照附圖進(jìn)行的描述以幫助全面理解由權(quán)利要求及其等同物限定的本發(fā)明的示例性實(shí)施例。所述描述包括各種特定細(xì)節(jié)來(lái)幫助理解,但是這些細(xì)節(jié)將被認(rèn)為僅僅是示例性的。因此,本領(lǐng)域的普通技術(shù)人員將認(rèn)識(shí)到,在不脫離本發(fā)明的范圍和精神的情況下,可對(duì)在此描述的實(shí)施例進(jìn)行各種改變和修改。另外,為了清楚和簡(jiǎn)明,可省略對(duì)公知功能和構(gòu)造的描述。

以下描述和權(quán)利要求中使用的術(shù)語(yǔ)和詞語(yǔ)不限于書(shū)面含義,而是僅被發(fā)明人使用以使得能夠清楚和一致地理解本發(fā)明。因此,本領(lǐng)域的技術(shù)人員應(yīng)清楚,提供下面對(duì)本發(fā)明的示例性實(shí)施例的描述僅是為了說(shuō)明目的,而不是為了限制由所附權(quán)利要求及其等同物限定的本發(fā)明的目的。

應(yīng)該理解,除非上下文清楚地另有指示,否則單數(shù)形式包括復(fù)數(shù)指示物。因此,例如,提到“組件表面”包括提到一個(gè)或多個(gè)這樣的表面。

對(duì)于術(shù)語(yǔ)“大體上”,它意味著敘述的特征、參數(shù)或值不需要精確達(dá)到,而是,包括例如公差、測(cè)量誤差、測(cè)量精度限制和對(duì)本領(lǐng)域技術(shù)人員已知的其他因素的偏差或變化可以以不妨礙所述特征意圖提供的效果的量而發(fā)生。

本發(fā)明的示例性實(shí)施例提供一種用于在電子裝置和服務(wù)器中執(zhí)行語(yǔ)音命令的設(shè)備和方法。

圖1A描繪根據(jù)本發(fā)明的示例性實(shí)施例的用于執(zhí)行語(yǔ)音命令的電子裝置100。電子裝置100可以是各種固定或便攜式裝置中的任意一個(gè)。便攜式裝置可以是便攜式終端、移動(dòng)終端、移動(dòng)平板電腦、移動(dòng)播放器、平板計(jì)算機(jī)、智能電話、筆記本/臺(tái)式計(jì)算機(jī)、個(gè)人數(shù)字助理(PDA)、智能相機(jī)等。電子裝置可以是組合這些裝置的兩個(gè)或多個(gè)功能的便攜式電子裝置。固定電子裝置的示例是連接到家用電器(例如,廚房電器)的電子顯示裝置。

電子裝置100可包括控制器110、揚(yáng)聲器/麥克風(fēng)112、相機(jī)120、全球定位系統(tǒng)(GPS)接收器130、射頻(RF)單元140、傳感器模塊150、觸摸屏160、觸摸屏控制器165和外部存儲(chǔ)器170。

簡(jiǎn)單地說(shuō),根據(jù)本發(fā)明的實(shí)施例,裝置100檢測(cè)語(yǔ)音信號(hào)并識(shí)別言語(yǔ)。當(dāng)所述言語(yǔ)被識(shí)別為包含喚醒命令時(shí),裝置100激活語(yǔ)音命令模式。在語(yǔ)音命令模式下,裝置100能夠響應(yīng)于隨后的語(yǔ)音命令。因此,如果裝置處于鎖屏狀態(tài)或空閑狀態(tài)(或條件允許的情況下處于這兩種狀態(tài)),則裝置100可通過(guò)喚醒命令識(shí)別被喚醒,而不需要用戶物理地觸摸裝置100上的鍵或觸摸屏。一旦檢測(cè)到喚醒命令,就執(zhí)行言語(yǔ)識(shí)別處理以辨別是否已發(fā)出語(yǔ)音命令。如果識(shí)別出語(yǔ)音命令,則裝置100可隨后執(zhí)行與所述命令相關(guān)的操作。

在一個(gè)實(shí)施例中,在裝置100中執(zhí)行喚醒命令檢測(cè)和語(yǔ)音命令檢測(cè)兩者。在另一個(gè)實(shí)施例中,在裝置100中執(zhí)行喚醒命令檢測(cè),并在服務(wù)器中執(zhí)行語(yǔ)音命令識(shí)別,接著將來(lái)自裝置100的語(yǔ)音信號(hào)的一部分發(fā)送到服務(wù)器。在另一個(gè)實(shí)施例中,在服務(wù)器中執(zhí)行喚醒命令檢測(cè)和語(yǔ)音命令識(shí)別兩者。

控制器100可包括接口101、一個(gè)或多個(gè)處理器102和103以及內(nèi)部存儲(chǔ)器104。在一些情況下,整個(gè)控制器110可被稱為處理器。接口101、應(yīng)用處理器102、通信處理器103和內(nèi)部存儲(chǔ)器104可以是單獨(dú)的組件或被集成在一個(gè)或多個(gè)集成電路上。

應(yīng)用處理器102通過(guò)運(yùn)行各種軟件程序來(lái)執(zhí)行用于電子裝置的各種功能,通信處理器103處理并控制語(yǔ)音通信和數(shù)據(jù)通信。除這些典型的功能之外,處理器102和103還執(zhí)行存儲(chǔ)在外部存儲(chǔ)器170或內(nèi)部存儲(chǔ)器104中的特定的軟件模塊(指令集),并進(jìn)行與所述模塊相應(yīng)的特定功能。即,處理器102和103執(zhí)行與存儲(chǔ)在外部存儲(chǔ)器170或內(nèi)部存儲(chǔ)器104中的軟件模塊相關(guān)的本發(fā)明的方法。

根據(jù)本發(fā)明的一個(gè)示例性實(shí)施例(與圖2的方法相應(yīng)),應(yīng)用處理器102通過(guò)麥克風(fēng)110從用戶接收包括喚醒命令和隨后的語(yǔ)音命令的語(yǔ)音信號(hào),并對(duì)所述語(yǔ)音信號(hào)執(zhí)行言語(yǔ)識(shí)別,以檢測(cè)喚醒命令的存在。當(dāng)檢測(cè)到喚醒命令時(shí),應(yīng)用處理器102可檢測(cè)在語(yǔ)音信號(hào)中的喚醒命令和隨后的語(yǔ)音命令之間的沉默持續(xù)時(shí)間。因此,應(yīng)用處理器102確定與語(yǔ)音命令相應(yīng)的語(yǔ)音信號(hào)的一部分是否開(kāi)始,當(dāng)確定與語(yǔ)音命令相應(yīng)的語(yǔ)音信號(hào)的一部分開(kāi)始時(shí),應(yīng)用處理器102將所述語(yǔ)音信號(hào)的一部分發(fā)送到服務(wù)器。接下來(lái),應(yīng)用處理器102從服務(wù)器接收與所述語(yǔ)音命令相應(yīng)的語(yǔ)音識(shí)別結(jié)果,并基于此結(jié)果執(zhí)行相應(yīng)的操作。

根據(jù)本發(fā)明的另一示例性實(shí)施例(與圖4的方法相應(yīng)),應(yīng)用處理器102將包括喚醒命令部分和語(yǔ)音命令部分的所有語(yǔ)音信號(hào)發(fā)送到服務(wù)器,并從服務(wù)器接收與喚醒命令相應(yīng)的說(shuō)話者驗(yàn)證結(jié)果。當(dāng)所述結(jié)果指示檢測(cè)到喚醒命令時(shí),應(yīng)用處理器102激活系統(tǒng)。接下來(lái),應(yīng)用處理器102接收與語(yǔ)音命令相應(yīng)的語(yǔ)音識(shí)別結(jié)果,并基于所述語(yǔ)音識(shí)別結(jié)果執(zhí)行操作。

根據(jù)本發(fā)明的另一示例性實(shí)施例(與圖6的方法相應(yīng)),應(yīng)用處理器102通過(guò)麥克風(fēng)110從用戶接收包括喚醒命令和語(yǔ)音命令的語(yǔ)音信號(hào),并使用言語(yǔ)識(shí)別執(zhí)行喚醒命令檢測(cè)。當(dāng)檢測(cè)到喚醒命令時(shí),應(yīng)用處理器102使用語(yǔ)音識(shí)別算法識(shí)別語(yǔ)音信號(hào)的隨后的部分中的語(yǔ)音命令,并基于識(shí)別的語(yǔ)音命令執(zhí)行相應(yīng)的操作。

一個(gè)或多個(gè)語(yǔ)音識(shí)別處理器和說(shuō)話者驗(yàn)證處理器可以是應(yīng)用處理器102的一部分,或可被提供為單獨(dú)的處理器。語(yǔ)音識(shí)別處理器和說(shuō)話者驗(yàn)證處理器可被統(tǒng)一,并包括根據(jù)其實(shí)施方式用于不同的功能的多個(gè)處理器。接口101將電子裝置100的觸摸屏控制器165與外部存儲(chǔ)器170或內(nèi)部存儲(chǔ)器104相互連接。

傳感器模塊150被連接到接口101以允許各種功能。例如,運(yùn)動(dòng)傳感器和光學(xué)傳感器可被連接到接口101以檢測(cè)電子裝置的運(yùn)動(dòng)或檢測(cè)來(lái)自外部的光。除了這些之外,其它傳感器(例如,位置確定系統(tǒng)、溫度傳感器或生物識(shí)別傳感器)可被連接到接口101以進(jìn)行相關(guān)的功能。

相機(jī)120通過(guò)接口101被連接到傳感器150以執(zhí)行相機(jī)功能(例如,拍攝和視頻剪輯錄制)。

可包括至少一個(gè)處理器的RF單元140執(zhí)行通信功能。例如,在通信處理器103的控制下,RF單元140將RF信號(hào)轉(zhuǎn)換為基帶信號(hào),并將基帶信號(hào)提供給通信處理器103,或者將從通信處理器103輸出的基帶信號(hào)轉(zhuǎn)換為RF信號(hào),并通過(guò)天線ANT發(fā)送RF信號(hào)。這里,通信處理器103根據(jù)各種通信方案處理基帶信號(hào)。例如,通信方案可包括但不限于:全球移動(dòng)通信系統(tǒng)(GSM)通信方案、增強(qiáng)型數(shù)據(jù)GSM環(huán)境(EDGE)通信方案、碼分多址(CDMA)通信方案、W-CDMA通信方案、長(zhǎng)期演進(jìn)(LTE)通信方案、正交頻分多址(OFDMA)通信方案、無(wú)線保真(Wi-Fi)通信方案、WiMax通信方案和/或藍(lán)牙通信方案。

揚(yáng)聲器/麥克風(fēng)110可輸入和輸出用于諸如語(yǔ)音識(shí)別(在訓(xùn)練處理期間使用以訓(xùn)練裝置100識(shí)別特定說(shuō)話者和/或喚醒命令和/或語(yǔ)音命令)、語(yǔ)音再現(xiàn)、數(shù)字記錄和電話功能之一的語(yǔ)音信號(hào)。即,揚(yáng)聲器/麥克風(fēng)110將語(yǔ)音信號(hào)轉(zhuǎn)換為電子信號(hào)或者將電子信號(hào)轉(zhuǎn)換為語(yǔ)音信號(hào)。可連接的和可拆卸的耳機(jī)、頭戴受話器或頭戴式耳機(jī)(未示出)可通過(guò)外部端口連接到電子裝置。

觸摸屏控制器165可被連接到觸摸屏160。觸摸屏160和觸摸屏控制器165可使用但不限于用于確定與觸摸屏160的一個(gè)或多個(gè)觸摸點(diǎn)的電容式、電阻式、紅外線和表面聲波技術(shù)和包括各種接近傳感器陣列或其它元素的多點(diǎn)觸摸檢測(cè)技術(shù),來(lái)檢測(cè)觸摸和運(yùn)動(dòng)或觸摸和運(yùn)動(dòng)的停止。

觸摸屏160提供電子裝置和用戶之間的輸入/輸出接口。即,觸摸屏160將用戶的觸摸輸入轉(zhuǎn)發(fā)到電子裝置100。觸摸屏160還將裝置100的輸出呈現(xiàn)給用戶。即,觸摸屏160將視覺(jué)輸出呈現(xiàn)給用戶。即,視覺(jué)輸出可被表示為文本、圖像、視頻以及它們的組合。

觸摸屏160可采用各種顯示器,所述各種顯示器的示例包括但不限于:液晶顯示器(LCD)、發(fā)光二極管(LED)、發(fā)光聚合物顯示器(LPD)、有機(jī)LED(OLED)、有源矩陣OLED(AMOLED)或柔性LED(FLED)。

GPS接收器130將從“人造”衛(wèi)星接收的信號(hào)轉(zhuǎn)換為諸如位置、速度或時(shí)間的信息。例如,衛(wèi)星和GPS接收器130之間的距離可通過(guò)將光的速度乘以信號(hào)到達(dá)時(shí)間來(lái)計(jì)算,并通過(guò)獲取三個(gè)衛(wèi)星的準(zhǔn)確位置和距離使用公知的三角測(cè)量法來(lái)測(cè)量電子裝置的位置。

外部存儲(chǔ)器170或內(nèi)部存儲(chǔ)器104可包括快速隨機(jī)存取存儲(chǔ)器(例如,一個(gè)或多個(gè)磁盤(pán)存儲(chǔ)裝置)和/或非易失性存儲(chǔ)器、一個(gè)或多個(gè)光學(xué)存儲(chǔ)裝置、和/或閃速存儲(chǔ)器(例如,NAND和NOR)。

外部存儲(chǔ)器170或內(nèi)部存儲(chǔ)器104存儲(chǔ)軟件。軟件組件包括操作系統(tǒng)軟件模塊、通信軟件模塊、圖形軟件模塊、用戶界面軟件模塊、MPEG模塊、相機(jī)軟件模塊以及一個(gè)或多個(gè)應(yīng)用軟件模塊。用于作為軟件組件的模塊可以是一組指令,因此所述模塊可被稱為指令組。所述模塊可被稱為程序。

操作系統(tǒng)軟件包括用于控制一般系統(tǒng)操作的各種軟件組件。一般系統(tǒng)操作的控制包括:例如,存儲(chǔ)器管理和控制、存儲(chǔ)器硬件(裝置)控制和管理以及電力控制和管理。操作系統(tǒng)軟件可對(duì)各種硬件裝置和軟件組件(模塊)之間的正常通信進(jìn)行處理。

通信軟件模塊允許通過(guò)RF單元140與其它電子裝置(例如,計(jì)算機(jī)、服務(wù)器、和/或便攜式終端)進(jìn)行通信。以相應(yīng)的通信方案的協(xié)議構(gòu)架配置通信軟件模塊。

圖形軟件模塊包括用于在觸摸屏160上提供和顯示圖形的各種軟件組件。術(shù)語(yǔ)“圖形”包含文本、網(wǎng)頁(yè)、圖標(biāo)、數(shù)字圖像、視頻、動(dòng)畫(huà)等。

用戶界面軟件模塊包括與用戶界面相關(guān)的各種軟件組件。用戶界面軟件模塊涉及用戶界面的狀態(tài)改變和用戶界面狀態(tài)改變的條件。

相機(jī)軟件模塊包括允許相機(jī)相關(guān)處理和功能的相機(jī)相關(guān)軟件組件。應(yīng)用模塊包括:瀏覽器、電子郵件、即時(shí)消息、詞語(yǔ)處理、鍵盤(pán)仿真、地址簿、觸摸列表、窗口小部件、數(shù)字版權(quán)管理(DRM)、語(yǔ)音識(shí)別、語(yǔ)音再現(xiàn)、位置確定功能、基于位置的服務(wù)等。除上述的模塊之外,存儲(chǔ)器170和104可包括附加的模塊(指令)??蛇x擇地,如果需要,則可不使用一些模塊(指令)。

在此,應(yīng)用模塊包括用于執(zhí)行說(shuō)話者識(shí)別功能或言語(yǔ)識(shí)別功能和語(yǔ)音命令執(zhí)行功能的指令。根據(jù)本發(fā)明的示例性實(shí)施例的指令與用于執(zhí)行圖2、圖4和圖6中所示的操作的指令相應(yīng)。

以上提及和將被解釋的電子裝置100的各種功能可在包括一個(gè)或多個(gè)信號(hào)處理和/或?qū)S眉呻娐?ASIC)的硬件和/或軟件和/或他們的組合中被執(zhí)行。

圖1B中示出根據(jù)本發(fā)明的實(shí)施例的用于執(zhí)行語(yǔ)音命令的系統(tǒng)195。系統(tǒng)195包括通過(guò)網(wǎng)絡(luò)180與服務(wù)器190進(jìn)行通信的便攜式終端100。服務(wù)器190可以是例如家庭網(wǎng)絡(luò)服務(wù)器或通過(guò)大型網(wǎng)絡(luò)(例如,互聯(lián)網(wǎng))訪問(wèn)的遠(yuǎn)程服務(wù)器??蛇x擇地,服務(wù)器190可以是能夠?qū)Πl(fā)送到服務(wù)器190的語(yǔ)音信號(hào)執(zhí)行言語(yǔ)/語(yǔ)言/說(shuō)話者識(shí)別和分析功能的第三方便攜式電子裝置。服務(wù)器190最少包括至少一個(gè)處理器192和存儲(chǔ)器194,以執(zhí)行操作的主機(jī)。下文中將結(jié)合電子裝置100描述服務(wù)器190的示例性操作。

圖2是根據(jù)本發(fā)明的一個(gè)示例性實(shí)施例的用于在電子裝置100中執(zhí)行喚醒命令和語(yǔ)音命令的方法200的流程圖。

在步驟201,電子裝置100通過(guò)麥克風(fēng)110從用戶檢測(cè)可包含喚醒命令和語(yǔ)音命令的語(yǔ)音信號(hào)。喚醒命令激活系統(tǒng)的語(yǔ)音命令模式,其中,為了接收和分析語(yǔ)音命令,不需要與觸摸屏或鍵的觸摸接觸。在接收此語(yǔ)音信號(hào)之前,裝置100可處于空閑模式或鎖屏模式。在一些實(shí)施例中,在接收語(yǔ)音信號(hào)之前,裝置100可處于這樣的應(yīng)用執(zhí)行模式,其中,沒(méi)有執(zhí)行用于語(yǔ)音命令的收聽(tīng)或響應(yīng)于語(yǔ)音命令的操作。

在以下描述中,將假設(shè)喚醒命令一般獨(dú)立于臨時(shí)跟隨在喚醒命令之后的語(yǔ)音命令。然而,在下面另外討論的一些“說(shuō)話者依賴”實(shí)施例中,由預(yù)定的說(shuō)話者說(shuō)出的被檢測(cè)的語(yǔ)音信號(hào)可用作喚醒命令。在一些其它實(shí)施例中(說(shuō)話者依賴或說(shuō)話者獨(dú)立),喚醒命令還包含固有的語(yǔ)音命令。在后者的情況下,喚醒命令激活語(yǔ)音命令模式并且是裝置100執(zhí)行附加的預(yù)定任務(wù)(例如,運(yùn)行由用戶設(shè)置的預(yù)定義應(yīng)用)的催化劑。

例如,喚醒命令可命令切換到用于輸入語(yǔ)音命令的模式(“語(yǔ)音命令模式”)和/或?qū)ζ聊贿M(jìn)行解鎖。語(yǔ)音命令執(zhí)行由電子裝置100提供的各種功能。例如,語(yǔ)音命令執(zhí)行撥號(hào)、拍攝、MP3播放等。在各種實(shí)施方式中,語(yǔ)音命令可請(qǐng)求服務(wù)器190搜索地圖并計(jì)劃路線。

在步驟202,電子裝置100對(duì)語(yǔ)音信號(hào)執(zhí)行言語(yǔ)識(shí)別,以辨別語(yǔ)音信號(hào)是否包含預(yù)定的喚醒命令。此言語(yǔ)識(shí)別可包括在一個(gè)實(shí)施例中的說(shuō)話者依賴識(shí)別方案或在另一實(shí)施例中的說(shuō)話者獨(dú)立識(shí)別方案。另外的方案是可行的,其中,多個(gè)不同的喚醒命令被預(yù)定,其中,一個(gè)或多個(gè)預(yù)定命令是說(shuō)話者依賴喚醒命令,一個(gè)或多個(gè)其他命令是說(shuō)話者獨(dú)立命令。

根據(jù)說(shuō)話者依賴識(shí)別方案,特定說(shuō)話者或用戶需要提前以他/她自己的語(yǔ)音訓(xùn)練識(shí)別器。在此情況下,言語(yǔ)識(shí)別器可僅識(shí)別訓(xùn)練的語(yǔ)音的言語(yǔ)。說(shuō)話者獨(dú)立識(shí)別方案可識(shí)別任意說(shuō)話者語(yǔ)音的言語(yǔ)。說(shuō)話者獨(dú)立識(shí)別方案提前提取關(guān)于成百上千的語(yǔ)音的信息并將所述信息存入數(shù)據(jù)庫(kù),因此,任何用戶可使用所述信息,而無(wú)需單獨(dú)的訓(xùn)練處理。

在一些實(shí)施例中,使用說(shuō)話者依賴識(shí)別,說(shuō)話者可使用語(yǔ)音信號(hào)(可包括整個(gè)語(yǔ)音信號(hào))中的語(yǔ)音命令部分被驗(yàn)證。因此,不存在輸入單獨(dú)的喚醒命令的需要。例如,當(dāng)使用用戶的唯一語(yǔ)音特征來(lái)驗(yàn)證說(shuō)話者時(shí),不存在輸入單獨(dú)的喚醒命令的需要。因此,在這些實(shí)施例中,語(yǔ)音命令還可操作為喚醒命令。因此在步驟202和204,識(shí)別特定用戶的特定語(yǔ)音,并通過(guò)此言語(yǔ)識(shí)別來(lái)自動(dòng)檢測(cè)喚醒命令。

可選擇地,使用以預(yù)定義文本和用戶的唯一語(yǔ)音特征的說(shuō)話者依賴識(shí)別,用戶可通過(guò)輸入與預(yù)定義文本相應(yīng)的他的語(yǔ)音來(lái)訓(xùn)練裝置100以驗(yàn)證說(shuō)話者(和特定的喚醒命令)。這樣做,需要輸入喚醒命令。在此,預(yù)定義文本可被用戶直接輸入或通過(guò)若干次輸入語(yǔ)音被轉(zhuǎn)換。電子裝置100或服務(wù)器190可將語(yǔ)音轉(zhuǎn)換為文本。

當(dāng)在步驟204檢測(cè)到喚醒命令時(shí),所述方法進(jìn)行到步驟206。否則,所述方法返回到201。

盡管未示出在圖2中,當(dāng)成功檢測(cè)到喚醒命令時(shí),在鎖屏模式下“用于識(shí)別語(yǔ)音命令的對(duì)象”在顯示器上被激活(見(jiàn)圖8A)??梢允翘摂M麥克風(fēng)的此對(duì)象指示語(yǔ)音命令模式的激活(即,裝置正積極收聽(tīng)語(yǔ)音命令)。此時(shí),如果一個(gè)褪了色的版本先前可見(jiàn),則該對(duì)象可在鎖屏中被首先顯示,或者,以被強(qiáng)調(diào)的方式被顯示。此時(shí),與言語(yǔ)/語(yǔ)音識(shí)別相關(guān)的圖形用戶界面(GUI)也可被顯示??蛇x擇地,當(dāng)檢測(cè)到喚醒命令時(shí),顯示的對(duì)象可被激活并且與語(yǔ)音識(shí)別相關(guān)的GUI可立即被顯示在鎖屏中。

在實(shí)施例變化中,當(dāng)在空閑模式下檢測(cè)到喚醒命令并且屏幕被鎖定時(shí),用于識(shí)別語(yǔ)音命令的對(duì)象和與語(yǔ)音識(shí)別相關(guān)的GUI被一起顯示。當(dāng)屏幕沒(méi)有被鎖定時(shí),用于識(shí)別語(yǔ)音命令的對(duì)象和與語(yǔ)音識(shí)別相關(guān)的GUI也可被一起顯示。

在步驟206,電子裝置100檢測(cè)在與喚醒命令相應(yīng)的檢測(cè)到的語(yǔ)音信號(hào)的第一部分(在下文中,“第一語(yǔ)音信號(hào)”)和與語(yǔ)音命令相應(yīng)的檢測(cè)到的語(yǔ)音信號(hào)的第二部分(在下文中,“第二語(yǔ)音信號(hào)”)之間的沉默持續(xù)時(shí)間(如果存在)。當(dāng)然,這假設(shè)語(yǔ)音命令是與喚醒命令分離的實(shí)體(如上所述,在喚醒命令也是語(yǔ)音命令的情況下實(shí)施例是可行的)。例如,假設(shè)喚醒命令是“你好Galaxy”,并且語(yǔ)音命令是“呼叫Hong Gil-dong”,當(dāng)用戶連續(xù)發(fā)音“你好Galaxy”和“呼叫Hong Gil-dong”時(shí),沉默持續(xù)時(shí)間存在于“你好Galaxy”和“呼叫Hong Gil-dong”之間。

在檢測(cè)到的言語(yǔ)中的兩個(gè)詞語(yǔ)之間的短暫的停頓可被用于檢測(cè)語(yǔ)音命令的開(kāi)始。在實(shí)施例中,緊跟著喚醒命令的檢測(cè)到的語(yǔ)音信號(hào)的無(wú)關(guān)的部分可被阻止與隨后的語(yǔ)音命令一起被發(fā)送到服務(wù)器。這樣做,可使用語(yǔ)音活動(dòng)檢測(cè)(VAD)技術(shù)。例如,語(yǔ)音信號(hào)通常具有比包括“沉默”時(shí)間段的背景噪聲信號(hào)具有更多的能量。然而,當(dāng)背景噪聲低時(shí),可附加地識(shí)別人的聲音的獨(dú)特的特征。通常,通過(guò)觀察貫穿各種頻率的能量分布來(lái)識(shí)別人的聲音的獨(dú)特的特征。人的聲音包括特征標(biāo)志(characteristics signature)而不包括噪聲。因此,VAD技術(shù)可區(qū)分言語(yǔ)和包括背景噪聲的沉默時(shí)間段。因此,在實(shí)施例中,裝置100等待直到檢測(cè)到言語(yǔ),此后,僅發(fā)送跟隨喚醒命令的已檢測(cè)到的言語(yǔ)開(kāi)始的聲音信號(hào),而不將包括喚醒命令之后檢測(cè)到的所有聲音的音頻信號(hào)發(fā)送到服務(wù)器。即,方法200避免發(fā)送只是包含喚醒命令檢測(cè)之后的沉默時(shí)間段的噪聲的信號(hào)。

在步驟208,裝置100確定與語(yǔ)音命令相應(yīng)的第二語(yǔ)音信號(hào)是否開(kāi)始。例如,裝置100檢查與“呼叫Hong Gil-dong”相應(yīng)的語(yǔ)音信號(hào)的開(kāi)始點(diǎn)。當(dāng)?shù)诙Z(yǔ)音信號(hào)開(kāi)始時(shí),在步驟210,裝置100將與所述語(yǔ)音命令(例如,“呼叫Hong Gil-dong”)相應(yīng)的語(yǔ)音信號(hào)發(fā)送到服務(wù)器。(發(fā)送到服務(wù)器的語(yǔ)音信號(hào)的部分在此不同地被稱為“發(fā)送信號(hào)”)。(當(dāng)與語(yǔ)音命令相應(yīng)的語(yǔ)音信號(hào)在208沒(méi)有開(kāi)始時(shí),所述流程返回到206)。有利地,通過(guò)將語(yǔ)音命令發(fā)送到服務(wù)器,裝置100使得處理器免受識(shí)別語(yǔ)音命令的言語(yǔ)的增強(qiáng)任務(wù)。

在步驟212,裝置100從服務(wù)器接收與語(yǔ)音命令相應(yīng)的語(yǔ)音識(shí)別結(jié)果。例如,服務(wù)器分析語(yǔ)音命令“呼叫Hong Gil-dong”,并將與“呼叫Hong Gil-dong”相應(yīng)的控制信號(hào)發(fā)送到裝置100或發(fā)送路線規(guī)劃請(qǐng)求或地圖搜索請(qǐng)求的搜索結(jié)果。

在步驟214,裝置100基于與語(yǔ)音命令相應(yīng)的語(yǔ)音識(shí)別結(jié)果執(zhí)行相應(yīng)的操作,或顯示與語(yǔ)音識(shí)別相應(yīng)的結(jié)果。例如,當(dāng)從服務(wù)器接收到與“呼叫Hong Gil-dong”相應(yīng)的控制信號(hào)時(shí),裝置100在電話簿搜索Hong Gil-dong的電話號(hào)碼并嘗試以搜索的電話號(hào)碼連接呼叫。在地圖/路線請(qǐng)求的情況下,裝置100顯示路線規(guī)劃請(qǐng)求或地圖搜索請(qǐng)求的搜索結(jié)果。此后,所述處理結(jié)束。

圖3是示出根據(jù)本發(fā)明的一個(gè)示例性實(shí)施例的由服務(wù)器190執(zhí)行的方法300的流程圖。此方法可補(bǔ)足在裝置100中進(jìn)行操作的上述方法200的操作。在此實(shí)施例中,在步驟301,服務(wù)器從電子裝置接收發(fā)送信號(hào)(例如,在圖2的步驟210發(fā)送的)(即,與語(yǔ)音命令(例如,“呼叫Hong Gil-dong”))相應(yīng)的語(yǔ)音信號(hào)。

接下來(lái),在步驟302,服務(wù)器使用語(yǔ)音識(shí)別算法(相當(dāng)于“言語(yǔ)識(shí)別”算法)分析與語(yǔ)音命令相應(yīng)的語(yǔ)音信號(hào)。即,服務(wù)器分析語(yǔ)音信號(hào)以識(shí)別言語(yǔ)并從識(shí)別的言語(yǔ)辨別語(yǔ)音命令。在步驟304,服務(wù)器隨后確定與語(yǔ)音識(shí)別相應(yīng)的結(jié)果是否是控制信號(hào)。如果是,則在步驟306,服務(wù)器將與語(yǔ)音識(shí)別相應(yīng)的控制信號(hào)發(fā)送到裝置100。例如,在識(shí)別“呼叫Hong Gil-dong”之后,服務(wù)器將相應(yīng)的控制信號(hào)提供給裝置100,以指示裝置100以從裝置100的電話簿存儲(chǔ)器提取的相關(guān)的電話號(hào)碼呼叫Hong Gil-dong。

當(dāng)與語(yǔ)音識(shí)別相應(yīng)的結(jié)果不是控制信號(hào)時(shí),在步驟308,服務(wù)器將與語(yǔ)音識(shí)別相應(yīng)的結(jié)果提供給電子裝置??蛇x擇地,服務(wù)器發(fā)送包含路線規(guī)劃請(qǐng)求或地圖搜索請(qǐng)求的搜索結(jié)果的圖像內(nèi)容,裝置100藉此顯示所述內(nèi)容。

可選擇地,在方法200和300的示例性實(shí)施例中,電子裝置來(lái)實(shí)現(xiàn)喚醒命令檢測(cè),并且服務(wù)器實(shí)現(xiàn)語(yǔ)音命令的語(yǔ)音識(shí)別。根據(jù)本發(fā)明的另一示例性實(shí)施例,服務(wù)器執(zhí)行喚醒命令檢測(cè)和語(yǔ)音命令的語(yǔ)音識(shí)別。

圖4是根據(jù)本發(fā)明的另一示例性實(shí)施例的在裝置100中執(zhí)行的另一示例方法的流程圖。這里,在步驟401,在空閑模式和/或鎖屏模式下,裝置100通過(guò)麥克風(fēng)110從用戶接收包括喚醒命令的語(yǔ)音信號(hào),其中,在喚醒命令不久之后(或連續(xù)之后)緊接著語(yǔ)音命令。如前所述,當(dāng)識(shí)別到喚醒命令時(shí),激活系統(tǒng)。例如,喚醒命令可指示切換到用于輸入語(yǔ)音命令的模式和/或?qū)ζ聊贿M(jìn)行解鎖。語(yǔ)音命令指示執(zhí)行由電子裝置100提供的各種功能。例如,語(yǔ)音命令執(zhí)行撥號(hào)、拍攝、MP3播放等。

在步驟402,裝置100將包括喚醒命令和語(yǔ)音命令的整個(gè)語(yǔ)音信號(hào)發(fā)送到服務(wù)器作為發(fā)送信號(hào)。接下來(lái),從服務(wù)器接收到與喚醒命令相應(yīng)的語(yǔ)音驗(yàn)證結(jié)果(步驟404)。即,當(dāng)服務(wù)器檢測(cè)到發(fā)送信號(hào)包含喚醒命令時(shí),服務(wù)器發(fā)送在步驟404接收的語(yǔ)音識(shí)別結(jié)果;否則,服務(wù)器可不將任何識(shí)別信號(hào)發(fā)送回裝置100。例如,當(dāng)裝置在步驟404接收到識(shí)別結(jié)果時(shí),這指示檢測(cè)到喚醒命令,并且在步驟406,裝置100激活系統(tǒng)。系統(tǒng)激活對(duì)屏幕進(jìn)行解鎖或從空閑模式切換到激活模式或語(yǔ)音命令模式。(隨著系統(tǒng)激活并且處于語(yǔ)音命令模式,裝置100隨后可如步驟401檢測(cè)包含語(yǔ)音命令的新的語(yǔ)音信號(hào),并相應(yīng)地重復(fù)步驟402至404和隨后的步驟。)

接下來(lái),在步驟408,裝置100接收與語(yǔ)音命令相應(yīng)的語(yǔ)音識(shí)別結(jié)果,并在步驟410,基于語(yǔ)音識(shí)別結(jié)果執(zhí)行操作或顯示與語(yǔ)音識(shí)別相應(yīng)的結(jié)果。例如,當(dāng)從服務(wù)器接收到與“呼叫Hong Gil-dong”相應(yīng)的控制信號(hào)時(shí),裝置100在電話簿搜索Hong Gil-dong的電話號(hào)碼并嘗試以搜索的電話號(hào)碼連接呼叫。在地圖/路線示例中,裝置100顯示路線規(guī)劃請(qǐng)求或地圖搜索請(qǐng)求的搜索結(jié)果。此后,所述處理結(jié)束,裝置100可在步驟401接收新的語(yǔ)音信號(hào),并且將這些新的語(yǔ)音信號(hào)轉(zhuǎn)發(fā)到服務(wù)器以進(jìn)行處理,服務(wù)器藉此可繼續(xù)通過(guò)發(fā)送控制信號(hào)和/或與隨后的語(yǔ)音命令相應(yīng)的結(jié)果來(lái)進(jìn)行響應(yīng)。即,由于裝置100已經(jīng)被喚醒,因此可以以僅用于語(yǔ)音命令的(而當(dāng)然不是用于喚醒命令)相關(guān)操作重復(fù)步驟401至410。

圖5是根據(jù)本發(fā)明的另一示例性實(shí)施例的由服務(wù)器190執(zhí)行的示例性方法500的流程圖。此方法可完成在裝置100中進(jìn)行操作的上述方法400的操作。

在步驟501,服務(wù)器從電子裝置501接收包括喚醒命令和語(yǔ)音命令的語(yǔ)音信號(hào)(即,在步驟402發(fā)送的發(fā)送信號(hào))。在步驟502,服務(wù)器語(yǔ)音識(shí)別驗(yàn)證算法分析與喚醒命令相應(yīng)的語(yǔ)音信號(hào)。即,服務(wù)器分析與喚醒命令相應(yīng)的語(yǔ)音信號(hào),因此確定是否檢測(cè)喚醒命令。此操作可與在實(shí)施例中由裝置100執(zhí)行的圖2中的步驟202和204相同。注意,如圖2的實(shí)施例中,可執(zhí)行說(shuō)話者依賴和/或說(shuō)話者獨(dú)立算法操作(在考慮多個(gè)預(yù)定的喚醒命令的情況下,可采用兩種類(lèi)型的識(shí)別方案)。

在步驟504,服務(wù)器將言語(yǔ)驗(yàn)證結(jié)果提供給電子裝置。注意,在其他實(shí)施方式中可省略步驟504。

當(dāng)在步驟506檢測(cè)到喚醒命令作為言語(yǔ)識(shí)別處理的結(jié)果時(shí),在步驟508,服務(wù)器隨后使用語(yǔ)音識(shí)別算法分析與語(yǔ)音命令相應(yīng)的語(yǔ)音信號(hào)。即,服務(wù)器識(shí)別與語(yǔ)音命令相應(yīng)的言語(yǔ),并產(chǎn)生與將由裝置100執(zhí)行的動(dòng)作相應(yīng)的響應(yīng)信號(hào),用于特定辨別的語(yǔ)音命令。相反地,當(dāng)在語(yǔ)音信號(hào)中未檢測(cè)到喚醒命令時(shí),流程返回到步驟501。為此,服務(wù)器可發(fā)送通知裝置100未檢測(cè)到喚醒命令的信號(hào),在步驟501,裝置100藉此可繼續(xù)將新檢測(cè)到的語(yǔ)音信號(hào)發(fā)送到服務(wù)器。在各種實(shí)施方式中,當(dāng)與先前的語(yǔ)音命令相應(yīng)的語(yǔ)音信號(hào)是正常時(shí),服務(wù)器可請(qǐng)求和接收僅與喚醒命令相應(yīng)的第一語(yǔ)音信號(hào)。

盡管未示出,服務(wù)器可檢測(cè)與喚醒命令相應(yīng)的語(yǔ)音信號(hào)和與語(yǔ)音命令相應(yīng)的語(yǔ)音信號(hào)之間的沉默持續(xù)時(shí)間,因此區(qū)分喚醒命令和語(yǔ)音命令。

在步驟510,服務(wù)器向電子裝置通知喚醒命令結(jié)果和語(yǔ)音識(shí)別結(jié)果(響應(yīng)信號(hào))。例如,服務(wù)器通過(guò)分析言語(yǔ)是否包含短語(yǔ)“你好Galaxy”來(lái)確定是否檢測(cè)到喚醒命令,分析語(yǔ)音命令“呼叫Hong Gil-dong”,因此將與“呼叫Hong Gil-dong”相應(yīng)的控制信號(hào)發(fā)送給電子裝置100。

接下來(lái),服務(wù)器結(jié)束此處理,并可被配置為收聽(tīng)如在步驟501來(lái)自裝置100的隨后的語(yǔ)音信號(hào)發(fā)送。為此,在裝置100和服務(wù)器190之間的適當(dāng)?shù)男帕羁杀辉O(shè)計(jì)為向服務(wù)器190通知裝置100是否已返回到空閑模式或鎖屏模式。如果是,服務(wù)器將把隨后接收的語(yǔ)言信號(hào)視作可包含喚醒命令的語(yǔ)音信號(hào)。如果不是,服務(wù)器將指示自然地收聽(tīng)新的語(yǔ)音命令。

圖6是描繪根據(jù)本發(fā)明的另一示例性實(shí)施例的由電子裝置執(zhí)行的示例性方法600的操作的流程圖。在此實(shí)施例中,電子裝置執(zhí)行用于語(yǔ)音命令的喚醒命令檢測(cè)和語(yǔ)音識(shí)別兩者。

步驟601、602、604、606和608可分別與圖2的201、202、204、206和208相同。以下對(duì)步驟601至608的描述重述結(jié)合步驟201至208描述的一些概念。

在步驟601,在空閑模式或鎖屏模式下,電子裝置100通過(guò)麥克風(fēng)110從用戶接收包括喚醒命令和語(yǔ)音命令的語(yǔ)音信號(hào)。所述喚醒命令激活系統(tǒng)。例如,喚醒命令可指示切換到用于輸入語(yǔ)音命令的模式或?qū)ζ聊贿M(jìn)行解鎖。語(yǔ)音命令執(zhí)行由電子裝置100提供的各種功能。例如,語(yǔ)音命令執(zhí)行撥號(hào)、拍攝、MP3播放等。

在步驟602,裝置100使用言語(yǔ)識(shí)別驗(yàn)證算法分析語(yǔ)音信號(hào),以確定語(yǔ)音信號(hào)是否包含喚醒命令。如前所述,如果采用了說(shuō)話者依賴識(shí)別,此操作可涉及僅檢測(cè)語(yǔ)音與預(yù)定語(yǔ)音匹配,或者預(yù)定語(yǔ)音還包含與預(yù)定喚醒命令匹配的特定言語(yǔ)??蛇x擇地,可使用說(shuō)話者獨(dú)立識(shí)別方案。當(dāng)在步驟604識(shí)別喚醒命令時(shí),流程進(jìn)行到步驟606;否則,流程返回到步驟600。

在步驟606,裝置100檢測(cè)與喚醒命令相應(yīng)的語(yǔ)音信號(hào)部分和與語(yǔ)音命令相應(yīng)的語(yǔ)音信號(hào)部分之間的沉默持續(xù)時(shí)間。例如,假設(shè)喚醒命令是“你好Galaxy”并且語(yǔ)音命令是“呼叫Hong Gil-dong”,當(dāng)用戶連續(xù)發(fā)音“你好Galaxy”和“呼叫Hong Gil-dong”時(shí),沉默持續(xù)時(shí)間介于“你好Galaxy”和“呼叫Hong Gil-dong”之間。

在步驟608,電子裝置100確定與語(yǔ)音命令相應(yīng)的語(yǔ)音信號(hào)是否開(kāi)始。例如,在步驟608,電子裝置100檢查與“呼叫Hong Gil-dong”相應(yīng)的語(yǔ)音信號(hào)的開(kāi)始點(diǎn)。

當(dāng)在步驟608,與語(yǔ)音命令相應(yīng)的語(yǔ)音信號(hào)開(kāi)始時(shí),在步驟610,電子裝置100使用語(yǔ)音識(shí)別算法分析所述與語(yǔ)音命令相應(yīng)的語(yǔ)音信號(hào)。

在步驟612,電子裝置100基于識(shí)別的語(yǔ)音命令執(zhí)行相應(yīng)的操作。例如,當(dāng)識(shí)別的語(yǔ)音命令是“呼叫Hong Gil-dong”時(shí),電子裝置100在電話簿搜索Hong Gil-dong的電話號(hào)碼,并嘗試以搜索的電話號(hào)碼連接呼叫。此后,所述處理結(jié)束。

圖7描繪可在上述的實(shí)施例中被分析的包括喚醒命令和語(yǔ)音命令的示例語(yǔ)音信號(hào)。輸入到電子裝置100的示意性語(yǔ)音信號(hào)可連續(xù)包含喚醒命令和語(yǔ)音命令。即,語(yǔ)音信號(hào)可具有與喚醒命令相應(yīng)的部分700和與語(yǔ)音命令相應(yīng)的部分720,其中,所述部分700和720連續(xù)輸入到電子裝置。沉默持續(xù)時(shí)間部分710介于喚醒命令部分700和語(yǔ)音命令部分720之間。

圖8A、圖8B和圖8C是描繪根據(jù)本發(fā)明的示例性實(shí)施例的使用包含喚醒命令和語(yǔ)音命令的語(yǔ)音信號(hào)進(jìn)行撥號(hào)操作的屏幕截圖。如圖8A中所示,用于識(shí)別語(yǔ)音命令的圖標(biāo)對(duì)象800根據(jù)與喚醒命令相應(yīng)的語(yǔ)音信號(hào)部分700被激活。如圖8B中所示,與語(yǔ)音信號(hào)的語(yǔ)音命令部分720相應(yīng)的語(yǔ)音命令(“呼叫Hong Gil-dong”)被識(shí)別,隨后所述操作根據(jù)所述語(yǔ)音命令被執(zhí)行。例如,Hong Gil-dong的電話號(hào)碼在電話簿中被搜索,并且如圖8C中所示,使用搜索的電話號(hào)碼自動(dòng)開(kāi)始呼叫連接。

圖9A和圖9B描繪根據(jù)本發(fā)明的示例性實(shí)施例的通過(guò)言語(yǔ)識(shí)別和控制操作解鎖的屏幕的屏幕截面。圖9A描繪示例鎖定屏幕;圖9B示出示例解鎖屏幕。可以以圖2、圖4和圖6的上述方法(例如,步驟214、406、410或612)中的任意方法執(zhí)行用于產(chǎn)生如圖9A和圖9B中所示的解鎖屏幕的對(duì)鎖屏進(jìn)行解鎖的處理。

響應(yīng)于檢測(cè)到與預(yù)定喚醒命令匹配或與特定用戶的語(yǔ)音匹配的語(yǔ)音信號(hào)的喚醒命令部分700,圖9A的鎖定屏幕被切換到圖9B的解鎖屏幕。盡管未示出,在屏幕被解鎖之后,可通過(guò)識(shí)別與喚醒命令相應(yīng)的語(yǔ)音信號(hào)700之后的與語(yǔ)音命令(“呼叫Hong Gil-dong”)相應(yīng)的語(yǔ)音命令部分720來(lái)執(zhí)行相應(yīng)的操作。

在上述的本發(fā)明的示例性實(shí)施例中,喚醒命令和語(yǔ)音命令是分離的??蛇x擇地,與語(yǔ)音命令相應(yīng)的語(yǔ)音信號(hào)可被用于說(shuō)話者驗(yàn)證和語(yǔ)音命令。即,使用與語(yǔ)音命令相應(yīng)的語(yǔ)音信號(hào)來(lái)驗(yàn)證說(shuō)話者。當(dāng)說(shuō)話者驗(yàn)證成功時(shí),可根據(jù)語(yǔ)音命令控制或執(zhí)行電子裝置的相應(yīng)的功能。

根據(jù)本公開(kāi)的上述方法可單獨(dú)在硬件或軟件中被實(shí)施,或在硬件和軟件的組合中被實(shí)施。

對(duì)于軟件,可提供包含一個(gè)或多個(gè)程序(軟件模塊)的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。存儲(chǔ)到計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)的一個(gè)或多個(gè)程序被配置用于執(zhí)行電子裝置和/或服務(wù)器的一個(gè)或多個(gè)處理器。一個(gè)或多個(gè)程序包括使電子裝置和/或服務(wù)器執(zhí)行根據(jù)如在本公開(kāi)的權(quán)利要求和/或說(shuō)明書(shū)中所述的實(shí)施例的方法的指令。

這樣的程序(軟件模塊,軟件)可被存儲(chǔ)到隨機(jī)存取存儲(chǔ)器、包括閃速存儲(chǔ)器、只讀存儲(chǔ)器(ROM)、電可擦可編程ROM(EEPROM)、磁盤(pán)存儲(chǔ)裝置、緊湊盤(pán)ROM(CD-ROM)、數(shù)字通用磁盤(pán)(DVD)或其它光學(xué)存儲(chǔ)裝置的非易失存儲(chǔ)器和磁帶??蛇x擇地,所述程序可被存儲(chǔ)到將這些存儲(chǔ)介質(zhì)進(jìn)行部分組合或全部組合的存儲(chǔ)器??膳鋫涠鄠€(gè)存儲(chǔ)器。

所述程序可被存儲(chǔ)到通過(guò)通信網(wǎng)絡(luò)(例如,互聯(lián)網(wǎng)、局域網(wǎng)(LAN)、廣LAN(WLAN)或存儲(chǔ)區(qū)域網(wǎng)(SAN)或通過(guò)組合這些網(wǎng)絡(luò)的通信網(wǎng)絡(luò))可訪問(wèn)的電子裝置和/或服務(wù)器的可連接的存儲(chǔ)裝置。存儲(chǔ)裝置可通過(guò)外部端口訪問(wèn)電子裝置和/或服務(wù)器。

通信網(wǎng)絡(luò)中分離的存儲(chǔ)裝置可訪問(wèn)便攜式電子裝置/服務(wù)器。

如上所述,由于包括喚醒命令部分和語(yǔ)音命令部分的檢測(cè)到的語(yǔ)音信號(hào)被處理,因此用戶可容易地執(zhí)行所述語(yǔ)音命令。

另外,由于在執(zhí)行語(yǔ)音命令之前完成喚醒命令檢測(cè),因此可基于安全/個(gè)人信息保護(hù)來(lái)執(zhí)行語(yǔ)音命令。

盡管已經(jīng)參照本發(fā)明的特定示例性實(shí)施例示出和描述了本發(fā)明,但是本領(lǐng)域的技術(shù)人員將理解,在不脫離權(quán)利要求及其等同物所限定的本發(fā)明的精神和范圍的情況下,可以對(duì)其進(jìn)行形式和細(xì)節(jié)上的各種改變。

當(dāng)前第1頁(yè)1 2 3 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1