本公開(kāi)總體上涉及語(yǔ)音識(shí)別的電子設(shè)備和方法,且更具體地,涉及改進(jìn)的語(yǔ)音識(shí)別方法和利用該方法的電子設(shè)備。
背景技術(shù):
由于硬件和通信技術(shù)的發(fā)展,電子設(shè)備用于廣泛的領(lǐng)域,并提供用戶需要的各種功能。通常,在包括語(yǔ)音輸入設(shè)備(例如,麥克風(fēng))在內(nèi)的各種電子設(shè)備中實(shí)現(xiàn)語(yǔ)音識(shí)別技術(shù)。利用語(yǔ)音識(shí)別技術(shù)的輸入正在逐漸取代物理輸入,并被推廣為提供對(duì)電子設(shè)備的語(yǔ)音控制。
技術(shù)實(shí)現(xiàn)要素:
[技術(shù)問(wèn)題]
在語(yǔ)音識(shí)別技術(shù)中,已經(jīng)提出了一種方案,即無(wú)縫語(yǔ)音識(shí)別方案,以基于用戶語(yǔ)音輸入來(lái)激活電子設(shè)備并執(zhí)行無(wú)縫語(yǔ)音命令。由于電子設(shè)備必須始終準(zhǔn)備好記錄用戶的語(yǔ)音以用于語(yǔ)音識(shí)別,所以無(wú)縫語(yǔ)音識(shí)別方案在處于待機(jī)狀態(tài)時(shí)必須持續(xù)地維持語(yǔ)音識(shí)別系統(tǒng)。需要將系統(tǒng)持續(xù)地維持在待機(jī)狀態(tài)以執(zhí)行無(wú)縫語(yǔ)音識(shí)別導(dǎo)致了以下問(wèn)題。如果使用低功率芯片來(lái)實(shí)現(xiàn)語(yǔ)音識(shí)別系統(tǒng)以減少電流消耗,則由于有限的存儲(chǔ)器和系統(tǒng)組件之間的性能差異,語(yǔ)音識(shí)別錯(cuò)誤率增加。如果使用高性能芯片來(lái)改善語(yǔ)音識(shí)別錯(cuò)誤率,則高性能芯片必須始終保持在活動(dòng)狀態(tài),從而增加電流消耗損失。
[問(wèn)題的解決方案]
根據(jù)本公開(kāi)的一個(gè)方面,提供了一種電子設(shè)備,該電子設(shè)備包括:第一處理器,被配置為接收音頻信號(hào),對(duì)所述音頻信號(hào)執(zhí)行第一語(yǔ)音識(shí)別,以及基于所述第一語(yǔ)音識(shí)別的結(jié)果向第二處理器傳輸驅(qū)動(dòng)信號(hào);以及所述第二處理器,被配置為響應(yīng)于所述驅(qū)動(dòng)信號(hào),基于所述第一語(yǔ)音識(shí)別的語(yǔ)音信號(hào)和所述音頻信號(hào)中的至少一項(xiàng)來(lái)執(zhí)行第二語(yǔ)音識(shí)別。
根據(jù)本公開(kāi)的另一方面,提供了一種由電子設(shè)備執(zhí)行語(yǔ)音識(shí)別的方法,所述方法包括:接收音頻信號(hào);由第一處理器對(duì)所述音頻信號(hào)執(zhí)行第一語(yǔ)音識(shí)別;由所述第一處理器基于所述第一語(yǔ)音識(shí)別的結(jié)果向第二處理器傳輸驅(qū)動(dòng)信號(hào);以及由所述第二處理器響應(yīng)于所述驅(qū)動(dòng)信號(hào),基于所述第一語(yǔ)音識(shí)別的語(yǔ)音信號(hào)和所述音頻信號(hào)中的至少一項(xiàng)來(lái)執(zhí)行第二語(yǔ)音識(shí)別。
[發(fā)明的有益效果]
做出本公開(kāi)以處理上述問(wèn)題和缺點(diǎn),并至少提供下述優(yōu)點(diǎn)。因此,本公開(kāi)的一個(gè)方面提供操作語(yǔ)音識(shí)別功能的電子設(shè)備和方法,其使電子設(shè)備中的語(yǔ)音識(shí)別功能的錯(cuò)誤最小化,增加識(shí)別率,并且降低電流消耗,同時(shí)提高語(yǔ)音識(shí)別性能的效率。
附圖說(shuō)明
根據(jù)結(jié)合附圖給出的以下詳細(xì)描述,將更清楚本公開(kāi)的上述和其他方面、特征和優(yōu)點(diǎn),在附圖中:
圖1是根據(jù)本公開(kāi)實(shí)施例的電子設(shè)備的框圖;
圖2是根據(jù)本公開(kāi)實(shí)施例的電子設(shè)備的框圖;
圖3是根據(jù)本公開(kāi)實(shí)施例的電子設(shè)備的框圖;
圖4是示出了根據(jù)本公開(kāi)實(shí)施例的用于電子設(shè)備中的音頻輸入模塊的語(yǔ)音識(shí)別的方法的流程圖;
圖5是示出了根據(jù)本公開(kāi)實(shí)施例的用于電子設(shè)備中的音頻處理模塊的語(yǔ)音識(shí)別的方法的流程圖;
圖6是示出了根據(jù)本公開(kāi)實(shí)施例的用于電子設(shè)備中的語(yǔ)音識(shí)別模塊的語(yǔ)音識(shí)別的方法的流程圖;
圖7是示出了根據(jù)本公開(kāi)實(shí)施例的用于電子設(shè)備中的主處理器的語(yǔ)音識(shí)別的方法的流程圖;
圖8是示出了根據(jù)本公開(kāi)實(shí)施例的用于電子設(shè)備中的主處理器的語(yǔ)音識(shí)別的方法的流程圖;
圖9是示出了根據(jù)本公開(kāi)實(shí)施例的電子設(shè)備的組件之間的語(yǔ)音識(shí)別的流程圖;
圖10是示出了根據(jù)本公開(kāi)實(shí)施例的電子設(shè)備的組件之間的語(yǔ)音識(shí)別的流程圖;
圖11是示出了根據(jù)本公開(kāi)實(shí)施例的電子設(shè)備的組件之間的語(yǔ)音識(shí)別的流程圖;
圖12a提供了根據(jù)本公開(kāi)實(shí)施例的電子設(shè)備的語(yǔ)音識(shí)別操作屏幕的示例;
圖12b提供了根據(jù)本公開(kāi)實(shí)施例的電子設(shè)備的語(yǔ)音識(shí)別操作屏幕的示例;
圖13a提供了根據(jù)本公開(kāi)實(shí)施例的電子設(shè)備的語(yǔ)音識(shí)別操作屏幕的示例;以及
圖13b提供了根據(jù)本公開(kāi)實(shí)施例的電子設(shè)備的語(yǔ)音識(shí)別操作屏幕的示例。
具體實(shí)施方式
下文中,參考附圖詳細(xì)地描述了本公開(kāi)的實(shí)施例。
在各種實(shí)施例中,“音頻信號(hào)”包括通過(guò)聲音信息從音頻輸入模塊輸入的信號(hào),并且“語(yǔ)音信號(hào)”包括基于語(yǔ)音識(shí)別從音頻信號(hào)中提取的語(yǔ)音信號(hào)。
在各種實(shí)施例中,語(yǔ)音識(shí)別包括提取并僅識(shí)別要識(shí)別的字的關(guān)鍵字識(shí)別、識(shí)別說(shuō)話人的語(yǔ)音作為執(zhí)行命令的命令識(shí)別、以及識(shí)別注冊(cè)特定說(shuō)話人的語(yǔ)音的說(shuō)話人識(shí)別中的至少一項(xiàng)。語(yǔ)音識(shí)別可以分開(kāi)識(shí)別用于觸發(fā)語(yǔ)音功能的語(yǔ)音觸發(fā)(即觸發(fā)語(yǔ)音)和輸入的用于在識(shí)別出語(yǔ)音觸發(fā)之后基于語(yǔ)音來(lái)執(zhí)行功能的語(yǔ)音命令(即命令語(yǔ)音)。
例如,關(guān)鍵字識(shí)別和命令識(shí)別可以是識(shí)別許多未指定語(yǔ)音的說(shuō)話人無(wú)關(guān)識(shí)別方案,并且說(shuō)話人識(shí)別可以是識(shí)別特定說(shuō)話人語(yǔ)音的說(shuō)話人相關(guān)識(shí)別方案。關(guān)鍵字識(shí)別可以通過(guò)分析語(yǔ)音序列以識(shí)別連續(xù)聲音的模式來(lái)工作,并且確定在語(yǔ)音模式的連續(xù)聲音中說(shuō)出了與關(guān)鍵字相對(duì)應(yīng)的字。如果存在先前存儲(chǔ)的關(guān)鍵字,則針對(duì)關(guān)鍵字的識(shí)別可能會(huì)是成功的,而如果沒(méi)有關(guān)鍵字,則識(shí)別可能會(huì)失敗。說(shuō)話人識(shí)別可以是確定關(guān)于注冊(cè)說(shuō)話人的語(yǔ)音信息和語(yǔ)音信號(hào)之間的相似度的說(shuō)話人驗(yàn)證功能。當(dāng)語(yǔ)音輸入對(duì)應(yīng)于注冊(cè)說(shuō)話人的語(yǔ)音輸入時(shí),說(shuō)話人識(shí)別成功,而當(dāng)語(yǔ)音輸入不是注冊(cè)說(shuō)話人的語(yǔ)音信號(hào)時(shí),說(shuō)話人識(shí)別失敗。對(duì)于說(shuō)話人識(shí)別,電子設(shè)備可以接收注冊(cè)說(shuō)話人的語(yǔ)音,提取說(shuō)話人的語(yǔ)音的特征,對(duì)特征進(jìn)行建模,并存儲(chǔ)特征以供以后比較。
圖1是根據(jù)本公開(kāi)實(shí)施例的電子設(shè)備的框圖。
參考圖1,根據(jù)各種實(shí)施例的電子設(shè)備101包括音頻輸入模塊110、音頻處理模塊130、存儲(chǔ)模塊140、顯示模塊150和主處理器170。
音頻輸入模塊110接收聲音信息作為音頻信號(hào)。例如,音頻輸入模塊110可以是麥克風(fēng)(mic)。
音頻輸入模塊110保持在開(kāi)啟狀態(tài),而不管主處理器170的睡眠模式或操作模式。音頻輸入模塊110以每個(gè)預(yù)定時(shí)間間隔將音頻信號(hào)存儲(chǔ)在音頻輸入模塊110的緩沖器111中。音頻輸入模塊110所接收的聲音信息可以包括噪聲(例如,來(lái)自電子設(shè)備周圍環(huán)境的聲音)以及待輸入的語(yǔ)音和特定聲音。
音頻輸入模塊110可以實(shí)現(xiàn)為專用集成電路(asic)的形式以支持聲音識(shí)別功能。例如,音頻輸入模塊110可以確定由輸入聲音生成的音頻信號(hào)是否是要求驅(qū)動(dòng)語(yǔ)音識(shí)別系統(tǒng)的聲音,并且當(dāng)音頻信號(hào)是要求驅(qū)動(dòng)語(yǔ)音識(shí)別系統(tǒng)的聲音時(shí),喚醒音頻處理模塊130。例如,當(dāng)音頻信號(hào)的大小(例如,db水平等)大于或等于預(yù)設(shè)閾值時(shí),音頻輸入模塊110將音頻信號(hào)識(shí)別為要求驅(qū)動(dòng)語(yǔ)音識(shí)別系統(tǒng)的聲音。關(guān)于對(duì)聲音是否要求驅(qū)動(dòng)語(yǔ)音識(shí)別系統(tǒng)的確定的參考可以是音頻信號(hào)的大小、頻帶等,并且可以根據(jù)設(shè)計(jì)者的意圖來(lái)設(shè)置。音頻輸入模塊110可以向音頻處理模塊130(或語(yǔ)音識(shí)別模塊)傳輸驅(qū)動(dòng)信號(hào),例如喚醒信號(hào)、識(shí)別請(qǐng)求信號(hào)、中斷信號(hào)等,并且向音頻處理模塊130的緩沖器131傳輸存儲(chǔ)在緩沖器111中的音頻信號(hào)。
音頻處理模塊130可以連接到音頻輸入模塊110以處理向/從音頻輸入模塊110和主處理器170發(fā)送/接收的音頻信號(hào),并執(zhí)行處理音頻信號(hào)的功能。例如,音頻處理模塊130可以執(zhí)行將模擬信號(hào)轉(zhuǎn)換為數(shù)字信號(hào)或?qū)?shù)字信號(hào)轉(zhuǎn)換為模擬信號(hào)的功能、音頻輸入/輸出預(yù)處理/后處理功能、和語(yǔ)音識(shí)別功能。
音頻處理模塊130可以包括數(shù)字信號(hào)處理器(dsp)。音頻處理模塊130可以獨(dú)立于主處理器操作或依賴于主處理器操作,并且在睡眠模式或操作模式下操作。音頻處理模塊130可以根據(jù)處理音頻信號(hào)(例如,再現(xiàn)聲音、轉(zhuǎn)換信號(hào)等)的功能來(lái)控制音頻處理模塊130的操作時(shí)鐘。音頻處理模塊130處理音頻信號(hào)并以預(yù)定時(shí)間間隔將音頻信號(hào)存儲(chǔ)在緩沖器131中。
當(dāng)在睡眠模式下從音頻輸入模塊110傳輸驅(qū)動(dòng)信號(hào)時(shí),音頻處理模塊130可以將睡眠模式切換到操作模式。音頻處理模塊130可以響應(yīng)于驅(qū)動(dòng)信號(hào)而被激活以分析從音頻輸入模塊110傳輸?shù)囊纛l信號(hào)并對(duì)音頻信號(hào)執(zhí)行語(yǔ)音識(shí)別。音頻處理模塊130可以通過(guò)執(zhí)行關(guān)鍵字識(shí)別和說(shuō)話人識(shí)別中的至少一項(xiàng)來(lái)識(shí)別由說(shuō)話人(或注冊(cè)說(shuō)話人)輸入的語(yǔ)音觸發(fā)。當(dāng)語(yǔ)音識(shí)別成功時(shí),音頻處理模塊130在緩沖器131中連續(xù)地緩沖從音頻輸入模塊110輸入的音頻信號(hào)一段時(shí)間(在該段時(shí)間期間主處理器170被激活),并且在主處理器170被激活的時(shí)間點(diǎn)傳輸所緩沖的音頻信號(hào)和/或語(yǔ)音信號(hào)。相對(duì)地,音頻處理模塊130可以在語(yǔ)音識(shí)別失敗時(shí)將操作模式切換到睡眠模式。
例如,音頻處理模塊130可以并行或順序地執(zhí)行關(guān)鍵字識(shí)別和說(shuō)話人識(shí)別。當(dāng)關(guān)鍵字識(shí)別和說(shuō)話人識(shí)別都成功時(shí),音頻處理模塊130向主處理器170傳輸驅(qū)動(dòng)信號(hào)。當(dāng)關(guān)鍵字識(shí)別和說(shuō)話人識(shí)別之一失敗時(shí),音頻處理模塊130切換到睡眠模式。
在另一示例中,音頻處理模塊130執(zhí)行關(guān)鍵字識(shí)別和說(shuō)話人識(shí)別之一,并且當(dāng)識(shí)別成功時(shí)激活主處理器170或者當(dāng)在識(shí)別失敗時(shí)切換到睡眠模式。
當(dāng)語(yǔ)音識(shí)別(例如,關(guān)鍵字識(shí)別和說(shuō)話人識(shí)別中的至少一項(xiàng))成功時(shí),音頻處理模塊130連續(xù)地向主處理器傳輸從音頻輸入模塊輸入的音頻信號(hào),并且當(dāng)從主處理器170接收到識(shí)別失敗結(jié)果時(shí),將操作模式切換到睡眠模式。存儲(chǔ)模塊140存儲(chǔ)從主處理器或其它元件(例如,音頻處理模塊等)接收的或由其它元件生成的命令或數(shù)據(jù)。例如,存儲(chǔ)模塊140存儲(chǔ)用于引導(dǎo)電子設(shè)備101并操作前述元件的操作系統(tǒng)(os)、至少一個(gè)應(yīng)用程序、根據(jù)功能執(zhí)行的數(shù)據(jù)等。
存儲(chǔ)模塊140可以包括編程模塊,例如內(nèi)核、中間件、應(yīng)用編程接口(api)、應(yīng)用等。上述編程模塊的每一個(gè)可以具有軟件、固件、硬件或者其中至少兩個(gè)的組合的形式。存儲(chǔ)模塊140可以存儲(chǔ)用于語(yǔ)音識(shí)別功能的至少一個(gè)語(yǔ)音識(shí)別算法和關(guān)于注冊(cè)說(shuō)話人的建模信息。
顯示模塊150執(zhí)行向用戶顯示圖像或數(shù)據(jù)的功能。顯示模塊150可以包括顯示面板。顯示面板可以采用例如液晶顯示器(lcd)或有源矩陣有機(jī)發(fā)光二極管(am-oled)。顯示模塊150還可以包括控制顯示面板的控制器。顯示面板可以實(shí)現(xiàn)為例如柔性的、透明的和/或可穿戴的。同時(shí),顯示模塊150可以被配置為與觸摸面板耦接的模塊(例如,觸摸屏類型)。顯示模塊150可以根據(jù)電子設(shè)備101的應(yīng)用/功能執(zhí)行而顯示各種屏幕,例如呼叫應(yīng)用/功能執(zhí)行屏幕、相機(jī)執(zhí)行應(yīng)用屏幕、語(yǔ)音識(shí)別功能執(zhí)行屏幕等。
主處理器170從電子設(shè)備101的元件(例如,音頻處理模塊130等)接收命令,分析接收到的命令,并根據(jù)所分析的命令執(zhí)行計(jì)算和數(shù)據(jù)處理。例如,當(dāng)供電時(shí),主處理器170控制電子設(shè)備101的引導(dǎo)過(guò)程,并執(zhí)行存儲(chǔ)在程序區(qū)域中的各種應(yīng)用程序以根據(jù)用戶的設(shè)置執(zhí)行功能。主處理器可以包括一個(gè)或多個(gè)應(yīng)用處理器(ap)、或一個(gè)或多個(gè)通信處理器(cp)。
主處理器170可以在睡眠模式下或操作模式下操作。當(dāng)從音頻處理模塊130傳輸了用于語(yǔ)音識(shí)別的驅(qū)動(dòng)信號(hào)時(shí),主處理器170將睡眠模式切換到操作模式,并執(zhí)行語(yǔ)音識(shí)別,例如關(guān)鍵字識(shí)別、命令識(shí)別和說(shuō)話人識(shí)別中的至少一項(xiàng)。當(dāng)主處理器170包括多個(gè)計(jì)算設(shè)備時(shí),主處理器170可以激活用于語(yǔ)音識(shí)別功能的一個(gè)計(jì)算設(shè)備,以響應(yīng)于音頻處理模塊130的驅(qū)動(dòng)信號(hào)而執(zhí)行語(yǔ)音識(shí)別。
主處理器170分析音頻信號(hào)和/或語(yǔ)音信號(hào),并且并行地或順序地執(zhí)行關(guān)鍵字識(shí)別、說(shuō)話人識(shí)別、和命令識(shí)別。
當(dāng)音頻處理模塊130執(zhí)行關(guān)鍵字識(shí)別和說(shuō)話人識(shí)別之一時(shí),主處理器170執(zhí)行另一個(gè)語(yǔ)音識(shí)別,即,未由音頻處理模塊130執(zhí)行的語(yǔ)音識(shí)別。此外,處理器170可以執(zhí)行命令識(shí)別。
當(dāng)關(guān)鍵字識(shí)別和說(shuō)話人識(shí)別中的至少一項(xiàng)失敗時(shí),主處理器170向音頻處理模塊130傳輸識(shí)別失敗結(jié)果,并將操作模式切換到睡眠模式。
主處理器170可區(qū)分地識(shí)別語(yǔ)音觸發(fā)和語(yǔ)音命令,并且當(dāng)語(yǔ)音識(shí)別成功時(shí),根據(jù)所識(shí)別的語(yǔ)音命令執(zhí)行電子設(shè)備的功能。例如,當(dāng)注冊(cè)在電子設(shè)備中的用戶在睡眠模式下輸入語(yǔ)音“higalaxy,相機(jī)執(zhí)行”時(shí),電子設(shè)備通過(guò)音頻輸入模塊110、音頻處理模塊130和主處理器170順序地處理語(yǔ)音輸入,并且主處理器170識(shí)別用于電子設(shè)備操作的語(yǔ)音輸入“higalaxy,相機(jī)執(zhí)行”,以例如關(guān)閉屏幕并執(zhí)行相機(jī)功能。這里,“higalaxy”對(duì)應(yīng)于用于激活基于語(yǔ)音的功能的語(yǔ)音觸發(fā),而“相機(jī)執(zhí)行”對(duì)應(yīng)于用于響應(yīng)于語(yǔ)音輸入而執(zhí)行相應(yīng)功能的語(yǔ)音命令。更具體地,語(yǔ)音識(shí)別可被劃分為用于自動(dòng)執(zhí)行語(yǔ)音識(shí)別應(yīng)用的語(yǔ)音觸發(fā)和在識(shí)別語(yǔ)音觸發(fā)之后輸入的語(yǔ)音命令。例如,當(dāng)對(duì)來(lái)自音頻信號(hào)的對(duì)應(yīng)于語(yǔ)音觸發(fā)的“higalaxy”的識(shí)別成功時(shí),音頻處理模塊130向主處理器傳輸驅(qū)動(dòng)信號(hào)。當(dāng)對(duì)應(yīng)于語(yǔ)音觸發(fā)的“higalaxy”的識(shí)別成功時(shí),并且如果對(duì)應(yīng)于語(yǔ)音命令的“相機(jī)執(zhí)行”的識(shí)別成功,則主處理器操作電子設(shè)備并執(zhí)行相機(jī)功能。
主處理器170的語(yǔ)音識(shí)別可以由語(yǔ)音識(shí)別系統(tǒng)實(shí)現(xiàn),該語(yǔ)音識(shí)別系統(tǒng)比在音頻處理模塊130中實(shí)現(xiàn)的簡(jiǎn)單語(yǔ)音識(shí)別系統(tǒng)復(fù)雜。該復(fù)雜的語(yǔ)音識(shí)別系統(tǒng)可以使用相對(duì)更多的資源(例如內(nèi)存、計(jì)算量和相似度測(cè)量)來(lái)確定語(yǔ)音識(shí)別,并且與簡(jiǎn)單語(yǔ)音識(shí)別系統(tǒng)相比具有更高的識(shí)別率。
例如,由主處理器170執(zhí)行的關(guān)鍵字識(shí)別可以由基于維特比(viterbi)解碼僅提取要識(shí)別的單個(gè)字的識(shí)別算法來(lái)實(shí)現(xiàn),并且與音頻處理模塊130相比,主處理器170可以具有關(guān)鍵字識(shí)別的相對(duì)較小的誤識(shí)別率。主處理器170的說(shuō)話人識(shí)別可以由以下一項(xiàng)或多項(xiàng)的組合來(lái)實(shí)現(xiàn):基于深度神經(jīng)網(wǎng)絡(luò)的識(shí)別算法、基于多神經(jīng)網(wǎng)絡(luò)的識(shí)別算法、以及基于通用背景模型-高斯混合模型(ubm-gmm)的識(shí)別算法?;诙嗌窠?jīng)網(wǎng)絡(luò)的識(shí)別算法可以通過(guò)存在隱藏層的神經(jīng)網(wǎng)絡(luò)在考慮諸如關(guān)鍵字識(shí)別結(jié)果、信噪比(snr)和背景噪聲去除等多個(gè)因素的情況下確定認(rèn)證成功/失敗。ubm-gmm算法可以通過(guò)比較基于gmm的背景模型得分和說(shuō)話人模型得分的二進(jìn)制確定方法,以幀為單位比較ubm值和說(shuō)話人模型值來(lái)確定認(rèn)證成功/失敗。
主處理器170可以在執(zhí)行語(yǔ)音識(shí)別的同時(shí)控制顯示模塊150。
例如,主處理器170在操作模式下執(zhí)行語(yǔ)音識(shí)別的同時(shí)維持顯示模塊150的關(guān)閉狀態(tài)。然后,如果主處理器的語(yǔ)音識(shí)別成功,則主處理器170打開(kāi)顯示模塊以顯示與語(yǔ)音命令相對(duì)應(yīng)的電子設(shè)備的功能執(zhí)行屏幕,或者如果語(yǔ)音識(shí)別失敗,則維持顯示模塊的關(guān)閉狀態(tài)。
在另一示例中,主處理器170在操作模式下執(zhí)行語(yǔ)音識(shí)別的同時(shí)控制對(duì)通知語(yǔ)音識(shí)別狀態(tài)的屏幕的輸出。主處理器170響應(yīng)于語(yǔ)音識(shí)別成功而顯示電子設(shè)備的功能執(zhí)行屏幕,或者當(dāng)語(yǔ)音識(shí)別失敗時(shí)關(guān)閉顯示模塊。
圖2是根據(jù)本公開(kāi)實(shí)施例的電子設(shè)備的框圖。
參考圖2,根據(jù)各種實(shí)施例的電子設(shè)備201包括音頻輸入模塊210、語(yǔ)音識(shí)別模塊220、音頻處理模塊230、存儲(chǔ)模塊240、通信模塊260、顯示模塊250、和主處理器270。
音頻輸入模塊210連續(xù)操作,即不改變操作狀態(tài),而不管主處理器270的睡眠模式或操作模式。音頻輸入模塊210可以像圖1所述的音頻輸入模塊110一樣實(shí)現(xiàn)為asic類型以支持聲音識(shí)別功能。
在圖2的實(shí)施例中,音頻輸入模塊210確定存儲(chǔ)在緩沖器211中的音頻信號(hào)是否是要求驅(qū)動(dòng)語(yǔ)音識(shí)別系統(tǒng)的聲音,并且當(dāng)音頻信號(hào)是要求驅(qū)動(dòng)語(yǔ)音識(shí)別系統(tǒng)的聲音時(shí),喚醒語(yǔ)音識(shí)別模塊220。當(dāng)輸入音頻信號(hào)被確定為要求驅(qū)動(dòng)語(yǔ)音識(shí)別系統(tǒng)的聲音時(shí),音頻輸入模塊210向語(yǔ)音識(shí)別模塊220傳輸驅(qū)動(dòng)信號(hào)(例如,喚醒信號(hào)、語(yǔ)音識(shí)別請(qǐng)求信號(hào)、中斷信號(hào)等),并向語(yǔ)音識(shí)別模塊220的緩沖器221傳輸存儲(chǔ)在緩沖器211中的音頻信號(hào)。語(yǔ)音識(shí)別模塊220連接到音頻輸入模塊210和主處理器270,并支持語(yǔ)音識(shí)別(例如,關(guān)鍵字識(shí)別和說(shuō)話人識(shí)別中的至少一項(xiàng))功能。語(yǔ)音識(shí)別模塊220可以包括僅操作用于語(yǔ)音識(shí)別功能的低功率處理器。語(yǔ)音識(shí)別模塊220可以獨(dú)立于主處理器270操作或依賴于主處理器270操作,并且可以在睡眠模式或操作模式下獨(dú)立地操作。例如,語(yǔ)音識(shí)別模塊220可以維持睡眠模式,而不管主處理器270的操作狀態(tài)。當(dāng)從音頻輸入模塊210接收到驅(qū)動(dòng)信號(hào)時(shí),語(yǔ)音識(shí)別模塊220變換到操作模式以基于從音頻輸入模塊210傳輸?shù)囊纛l信號(hào)來(lái)執(zhí)行語(yǔ)音識(shí)別。當(dāng)語(yǔ)音識(shí)別成功時(shí),語(yǔ)音識(shí)別模塊220驅(qū)動(dòng)主處理器270并向主處理器270傳輸存儲(chǔ)在緩沖器221中的音頻信號(hào)。語(yǔ)音識(shí)別模塊220在語(yǔ)音觸發(fā)識(shí)別成功時(shí)驅(qū)動(dòng)主處理器。
語(yǔ)音識(shí)別模塊220可以在語(yǔ)音識(shí)別(例如,關(guān)鍵字識(shí)別和說(shuō)話人識(shí)別中的至少一項(xiàng))失敗時(shí)切換到睡眠模式,或者可以在從主處理器270接收到語(yǔ)音識(shí)別失敗信息時(shí)將操作模式切換到睡眠模式。
語(yǔ)音識(shí)別模塊220可被包括在圖1的音頻處理模塊130中。
同時(shí),在圖2的實(shí)施例中,與圖1的實(shí)施例不同的是,電子設(shè)備201還包括音頻處理模塊230,其處理音頻數(shù)據(jù),諸如音頻信號(hào)預(yù)處理/后處理、信號(hào)轉(zhuǎn)換功能、噪聲去除功能等,而不涉及語(yǔ)音識(shí)別功能。
存儲(chǔ)模塊240和顯示模塊250與圖1所述的存儲(chǔ)模塊140和顯示模塊150相似,且省略其詳細(xì)描述以避免冗余。
根據(jù)圖2的實(shí)施例的主處理器270執(zhí)行與圖1中所述的主處理器170的基本操作相似的操作,并省略其重復(fù)描述。
與圖1的實(shí)施例不同的是,圖2的主處理器270從語(yǔ)音識(shí)別模塊220接收驅(qū)動(dòng)信號(hào),以響應(yīng)于來(lái)自語(yǔ)音識(shí)別模塊220的驅(qū)動(dòng)信號(hào)而將睡眠模式切換到操作模式,并執(zhí)行語(yǔ)音識(shí)別。主處理器270可以由與在圖1的主處理器中實(shí)現(xiàn)的語(yǔ)音識(shí)別相同的語(yǔ)音識(shí)別系統(tǒng)實(shí)現(xiàn)。當(dāng)語(yǔ)音識(shí)別成功時(shí),主處理器270根據(jù)與語(yǔ)音輸入相對(duì)應(yīng)的命令執(zhí)行電子設(shè)備的功能。當(dāng)語(yǔ)音識(shí)別失敗時(shí),主處理器270向語(yǔ)音識(shí)別模塊220傳輸識(shí)別失敗結(jié)果,并將操作模式切換到睡眠模式。
圖2的實(shí)施例中的電子設(shè)備201還包括通信模塊260。
通信模塊260的示例包括收發(fā)器,以通過(guò)有線/無(wú)線通信與網(wǎng)絡(luò)進(jìn)行通信,以與外部設(shè)備(例如,服務(wù)器)進(jìn)行語(yǔ)音、視頻或數(shù)據(jù)通信,且通信模塊260由主處理器270控制。無(wú)線通信可以包括例如wi-fi、藍(lán)牙(bt)、近場(chǎng)通信(nfc)、全球定位系統(tǒng)(gps)和蜂窩通信(例如,長(zhǎng)期演進(jìn)(lte)、高級(jí)長(zhǎng)期演進(jìn)(lte-a)、碼分多址(cdma)、寬帶cdma(wcdma)、通用移動(dòng)電信系統(tǒng)(umts)、無(wú)線寬帶(wibro)或全球移動(dòng)通信系統(tǒng)(gsm))中的至少一種。有線通信可以包括例如通用串行總線(usb)、高清多媒體接口(hdmi)、推薦標(biāo)準(zhǔn)232(rs-232)和普通老式電話服務(wù)(pots)中的至少一種。
通信模塊260與服務(wù)器通信以附加地支持語(yǔ)音識(shí)別功能。例如,當(dāng)語(yǔ)音識(shí)別模塊220第一次成功地進(jìn)行語(yǔ)音識(shí)別并且主處理器270第二次成功地進(jìn)行語(yǔ)音識(shí)別時(shí),可以通過(guò)通信模塊260向語(yǔ)音識(shí)別服務(wù)器發(fā)送音頻信號(hào)和/或語(yǔ)音信號(hào),該語(yǔ)音識(shí)別服務(wù)器與電子設(shè)備相比使用附加的資源。
根據(jù)另一實(shí)施例,主處理器區(qū)分語(yǔ)音觸發(fā)和在識(shí)別語(yǔ)音觸發(fā)之后輸入的語(yǔ)音命令,并向服務(wù)器傳輸經(jīng)區(qū)分的語(yǔ)音。主處理器傳輸與在識(shí)別語(yǔ)音觸發(fā)之后輸入的語(yǔ)音命令相對(duì)應(yīng)的語(yǔ)音信號(hào),或者傳輸標(biāo)識(shí)語(yǔ)音觸發(fā)和語(yǔ)音命令分離的時(shí)間點(diǎn)的信息。然后,當(dāng)從主處理器270傳輸了未被區(qū)分的音頻信號(hào)或語(yǔ)音信號(hào)時(shí),服務(wù)器可以區(qū)分語(yǔ)音觸發(fā)和語(yǔ)音命令,并執(zhí)行語(yǔ)音識(shí)別。
服務(wù)器可以對(duì)從電子設(shè)備201傳輸?shù)囊纛l信號(hào)(或/和語(yǔ)音信號(hào))執(zhí)行語(yǔ)音識(shí)別,以識(shí)別語(yǔ)音命令并向電子設(shè)備提供語(yǔ)音命令的識(shí)別結(jié)果。當(dāng)語(yǔ)音識(shí)別成功時(shí),服務(wù)器可以將語(yǔ)音命令轉(zhuǎn)換為文本,并向電子設(shè)備201傳輸關(guān)于所轉(zhuǎn)換文本的信息。當(dāng)語(yǔ)音識(shí)別失敗時(shí),服務(wù)器可以向電子設(shè)備201提供失敗信息。
電子設(shè)備201的主處理器270可以識(shí)別有限的語(yǔ)音命令,而與主處理器270相比,服務(wù)器可以識(shí)別附加語(yǔ)音命令。例如,主處理器270可以識(shí)別簡(jiǎn)單的或預(yù)配置在電子設(shè)備中的語(yǔ)音命令,例如“相機(jī)執(zhí)行”或“電話呼叫執(zhí)行”,并且基于所識(shí)別的語(yǔ)音命令來(lái)執(zhí)行電子設(shè)備201的功能。相對(duì)地,電子設(shè)備201可以請(qǐng)求服務(wù)器識(shí)別復(fù)雜的或各種語(yǔ)音命令,從服務(wù)器接收語(yǔ)音識(shí)別結(jié)果,并執(zhí)行與語(yǔ)音識(shí)別相對(duì)應(yīng)的功能。
通信模塊260可以從服務(wù)器接收關(guān)于服務(wù)器所執(zhí)行的語(yǔ)音識(shí)別的結(jié)果的信息。當(dāng)語(yǔ)音識(shí)別成功并且從服務(wù)器接收到文本信息時(shí),主處理器270執(zhí)行與接收到的文本信息相對(duì)應(yīng)的功能。當(dāng)從服務(wù)器接收到語(yǔ)音識(shí)別失敗信息時(shí),主處理器270將操作模式切換到睡眠模式。
圖3是根據(jù)本公開(kāi)實(shí)施例的電子設(shè)備的框圖。
參考圖3,電子設(shè)備301包括音頻輸入模塊310、語(yǔ)音識(shí)別模塊320、音頻處理模塊330、存儲(chǔ)模塊340、顯示模塊350、通信模塊360和主處理器370。
由于音頻輸入模塊310、存儲(chǔ)模塊340、顯示模塊350和通信模塊360與上述圖2的音頻輸入模塊210、存儲(chǔ)模塊240、顯示模塊250和通信模塊260相同,省略對(duì)其的詳細(xì)描述以避免冗余。
根據(jù)圖3的實(shí)施例的語(yǔ)音識(shí)別模塊320接收音頻輸入模塊310的緩沖器311中存儲(chǔ)的音頻信號(hào),并基于音頻信號(hào)第一次執(zhí)行語(yǔ)音識(shí)別。當(dāng)語(yǔ)音識(shí)別成功時(shí),語(yǔ)音識(shí)別模塊320喚醒音頻處理模塊330并向音頻處理模塊330傳輸語(yǔ)音識(shí)別模塊320的緩沖器321中存儲(chǔ)的音頻信號(hào)。
音頻處理模塊330基于語(yǔ)音識(shí)別模塊320的激活信號(hào)將睡眠模式切換到操作模式,接收語(yǔ)音識(shí)別模塊320的緩沖器321中存儲(chǔ)的音頻信號(hào),并基于音頻信號(hào)第二次執(zhí)行語(yǔ)音識(shí)別。當(dāng)語(yǔ)音識(shí)別成功時(shí),音頻處理模塊330通過(guò)向主處理器370傳輸驅(qū)動(dòng)信號(hào)并傳輸緩沖器331中存儲(chǔ)的音頻信號(hào)來(lái)激活主處理器370。
由于根據(jù)圖3的實(shí)施例的主處理器370執(zhí)行與圖2中所述的主處理器270的語(yǔ)音識(shí)別操作相同的操作,因此省略對(duì)其的重復(fù)描述以避免冗余。
主處理器370從音頻處理模塊330接收驅(qū)動(dòng)信號(hào),基于驅(qū)動(dòng)信號(hào)將睡眠模式切換到操作模式,并對(duì)從音頻處理模塊330傳輸?shù)囊纛l信號(hào)第三次執(zhí)行語(yǔ)音識(shí)別。
語(yǔ)音識(shí)別模塊320和音頻處理模塊330執(zhí)行關(guān)鍵字識(shí)別和說(shuō)話人識(shí)別中的至少一項(xiàng),且主處理器370執(zhí)行關(guān)鍵字識(shí)別、說(shuō)話人識(shí)別和命令識(shí)別中的至少一項(xiàng)。當(dāng)語(yǔ)音識(shí)別成功時(shí),主處理器370根據(jù)與語(yǔ)音輸入相對(duì)應(yīng)的命令來(lái)執(zhí)行電子設(shè)備的功能。如果語(yǔ)音識(shí)別失敗,則主處理器370向語(yǔ)音識(shí)別模塊320和音頻處理模塊330傳輸識(shí)別失敗結(jié)果,并將操作模式切換到睡眠模式。
如果語(yǔ)音識(shí)別成功,則主處理器370通過(guò)通信模塊360向支持語(yǔ)音識(shí)別的服務(wù)器發(fā)送音頻信號(hào)和/或語(yǔ)音信號(hào),并從服務(wù)器接收關(guān)于語(yǔ)音識(shí)別的識(shí)別結(jié)果信息。由于服務(wù)器的操作與圖2中所述的服務(wù)器的操作相同,因此省略對(duì)其的詳細(xì)描述以避免冗余。
如果語(yǔ)音識(shí)別成功并且從服務(wù)器接收到文本信息,則主處理器370執(zhí)行與接收到的文本信息相對(duì)應(yīng)的功能。如果接收到語(yǔ)音識(shí)別失敗信息,則主處理器370將操作模式切換到睡眠模式。
下文中,描述操作用于電子設(shè)備的各種組件的語(yǔ)音識(shí)別功能的方法。
圖4是示出了根據(jù)本公開(kāi)實(shí)施例的用于電子設(shè)備中的音頻輸入模塊的語(yǔ)音識(shí)別的方法的流程圖。
參考圖4,在步驟410中,電子設(shè)備的音頻輸入模塊在操作模式下操作。例如,音頻輸入模塊繼續(xù)操作而不管電子設(shè)備的操作狀態(tài)或睡眠(或待機(jī))狀態(tài),例如,主處理器在睡眠模式下操作,顯示模塊處于關(guān)閉狀態(tài),并獲取由聲音生成的音頻信號(hào)。
在步驟420中,音頻輸入模塊獲取由聲音生成的音頻信號(hào),并在步驟430中將音頻信號(hào)存儲(chǔ)在緩沖器中。音頻輸入模塊內(nèi)所包括的緩沖器可以實(shí)現(xiàn)為循環(huán)緩沖器,并且可以按照音頻信號(hào)存儲(chǔ)在循環(huán)緩沖器中的順序向音頻處理模塊(或音頻識(shí)別模塊)傳輸音頻信號(hào)。
在步驟440中,音頻輸入模塊確定音頻信號(hào)是否是要求驅(qū)動(dòng)語(yǔ)音識(shí)別系統(tǒng)的聲音。例如,當(dāng)緩沖器中的由聲音生成的音頻信號(hào)的大小是大于或等于預(yù)設(shè)閾值的音頻信號(hào)或特定頻帶內(nèi)的音頻信號(hào)時(shí),音頻輸入模塊將音頻信號(hào)識(shí)別為要求驅(qū)動(dòng)語(yǔ)音識(shí)別系統(tǒng)的聲音。
如果音頻信號(hào)被識(shí)別為要求驅(qū)動(dòng)語(yǔ)音識(shí)別系統(tǒng)的聲音,則在步驟450中,音頻輸入模塊向音頻處理模塊或語(yǔ)音識(shí)別模塊傳輸用于激活請(qǐng)求的驅(qū)動(dòng)信號(hào)。在步驟460中,音頻輸入模塊向所激活的音頻處理模塊(或語(yǔ)音識(shí)別模塊)傳輸緩沖器中存儲(chǔ)的音頻信號(hào)。
例如,音頻輸入模塊首先在音頻處理模塊或語(yǔ)音識(shí)別模塊被激活的時(shí)間內(nèi)向音頻處理模塊或語(yǔ)音識(shí)別模塊內(nèi)的緩沖器傳輸音頻信號(hào),然后向音頻處理模塊或語(yǔ)音識(shí)別模塊順序傳輸實(shí)時(shí)獲取的音頻信號(hào)。
同時(shí),如果在步驟440中音頻信號(hào)未被識(shí)別為要求驅(qū)動(dòng)語(yǔ)音識(shí)別系統(tǒng)的聲音,則音頻輸入模塊返回到步驟420并重復(fù)獲取音頻信號(hào)的操作。如上所述,音頻輸入模塊可以保持操作狀態(tài),以不斷地識(shí)別聲音,并且如果聲音被識(shí)別,則激活音頻處理模塊或語(yǔ)音識(shí)別模塊以處理音頻信號(hào)并發(fā)送音頻信號(hào)。
圖5是示出了根據(jù)本公開(kāi)實(shí)施例的用于電子設(shè)備中的音頻處理模塊的語(yǔ)音識(shí)別的方法的流程圖。
參考圖5,在步驟510中,電子設(shè)備的音頻處理模塊初始在睡眠模式下操作。例如,當(dāng)電子設(shè)備處于睡眠(或待機(jī))狀態(tài)時(shí)(例如,主處理器在睡眠模式下操作且顯示模塊處于關(guān)閉狀態(tài)),音頻處理模塊在睡眠模式下操作。
在步驟520中,音頻處理模塊從音頻輸入模塊接收驅(qū)動(dòng)信號(hào)。當(dāng)接收到驅(qū)動(dòng)信號(hào)時(shí),在步驟530中,音頻處理模塊將睡眠模式切換到操作模式。在步驟540中,音頻處理模塊對(duì)從音頻輸入模塊輸入的音頻信號(hào)執(zhí)行語(yǔ)音識(shí)別。語(yǔ)音識(shí)別可以包括關(guān)鍵字識(shí)別和說(shuō)話人識(shí)別。音頻處理模塊在音頻信號(hào)中識(shí)別與語(yǔ)音觸發(fā)相對(duì)應(yīng)的關(guān)鍵字。
音頻處理模塊的關(guān)鍵字識(shí)別可以使用基于維特比解碼僅提取要識(shí)別的字的識(shí)別算法來(lái)執(zhí)行,而說(shuō)話人識(shí)別可以使用簡(jiǎn)單的基于神經(jīng)網(wǎng)絡(luò)的識(shí)別算法來(lái)執(zhí)行。
在步驟550中,音頻處理模塊確定語(yǔ)音識(shí)別是否成功,并在步驟560中傳輸驅(qū)動(dòng)信號(hào)以請(qǐng)求激活主處理器。
音頻處理模塊基于從音頻輸入模塊傳輸?shù)囊纛l信號(hào)并行地或順序地執(zhí)行關(guān)鍵字識(shí)別和說(shuō)話人識(shí)別,或者執(zhí)行關(guān)鍵字識(shí)別和說(shuō)話人識(shí)別之一。例如,音頻處理模塊識(shí)別用于自動(dòng)驅(qū)動(dòng)語(yǔ)音識(shí)別系統(tǒng)或應(yīng)用的語(yǔ)音觸發(fā)。
在步驟570中,音頻處理模塊向主處理器傳輸音頻信號(hào)(例如,語(yǔ)音信號(hào))。音頻處理模塊對(duì)從音頻輸入模塊傳輸?shù)囊纛l信號(hào)實(shí)時(shí)執(zhí)行語(yǔ)音識(shí)別,并且當(dāng)語(yǔ)音識(shí)別成功時(shí),在主處理器被激活的時(shí)間期間緩沖音頻信號(hào)。當(dāng)主處理器被激活時(shí),音頻處理模塊向主處理器實(shí)時(shí)傳輸音頻信號(hào)。
同時(shí),如果在步驟550中確定語(yǔ)音識(shí)別失敗,則音頻處理模塊在步驟590中將操作模式切換到睡眠模式。
在操作模式下,在步驟580中,音頻處理模塊從主處理器接收根據(jù)主處理器的語(yǔ)音識(shí)別失敗的失敗信息。當(dāng)從主處理器接收到語(yǔ)音識(shí)別失敗信息時(shí),在步驟590中,音頻處理模塊將操作模式切換到睡眠模式。
圖6是示出了根據(jù)本公開(kāi)實(shí)施例的用于電子設(shè)備中的語(yǔ)音識(shí)別模塊的語(yǔ)音識(shí)別的方法的流程圖。
參考圖6,電子設(shè)備包括語(yǔ)音識(shí)別模塊,且在步驟610中,語(yǔ)音識(shí)別模塊初始在睡眠模式下操作。語(yǔ)音識(shí)別模塊實(shí)現(xiàn)低功率芯片以減少電流消耗并且可以限制性地操作,即僅對(duì)語(yǔ)音識(shí)別功能進(jìn)行操作。語(yǔ)音識(shí)別模塊可被包括在音頻處理模塊中或者作為與音頻處理模塊分離的元件實(shí)現(xiàn)在電子設(shè)備中。
在步驟620中,音頻識(shí)別模塊從音頻輸入模塊接收驅(qū)動(dòng)信號(hào)。當(dāng)接收到驅(qū)動(dòng)信號(hào)時(shí),在步驟630中,語(yǔ)音識(shí)別模塊將睡眠模式切換到操作模式。在步驟640中,語(yǔ)音識(shí)別模塊對(duì)從音頻輸入模塊傳輸?shù)囊纛l信號(hào)執(zhí)行語(yǔ)音識(shí)別。
語(yǔ)音識(shí)別可以包括關(guān)鍵字識(shí)別和說(shuō)話人識(shí)別中的至少一項(xiàng)。此外,語(yǔ)音識(shí)別模塊可以識(shí)別用于自動(dòng)驅(qū)動(dòng)語(yǔ)音識(shí)別應(yīng)用的語(yǔ)音觸發(fā)。在步驟650中,語(yǔ)音識(shí)別模塊確定語(yǔ)音識(shí)別是否成功,并且如果語(yǔ)音識(shí)別成功,則在步驟660中向主處理器或音頻處理模塊傳輸驅(qū)動(dòng)信號(hào)以請(qǐng)求激活。
例如,當(dāng)在語(yǔ)音識(shí)別功能中未涉及電子設(shè)備的音頻處理模塊時(shí),在語(yǔ)音識(shí)別成功的情況下,語(yǔ)音識(shí)別模塊激活主處理器。當(dāng)語(yǔ)音識(shí)別模塊和音頻處理模塊在電子設(shè)備中分開(kāi)實(shí)現(xiàn)并且在語(yǔ)音識(shí)別功能中未涉及音頻處理模塊時(shí),語(yǔ)音識(shí)別模塊激活音頻處理模塊。
在步驟670中,語(yǔ)音識(shí)別模塊向主處理器或音頻處理模塊傳輸音頻信號(hào)(例如,語(yǔ)音信號(hào))。同時(shí),如果在步驟650中確定語(yǔ)音識(shí)別失敗,則在步驟690中,語(yǔ)音識(shí)別模塊將操作模式切換到睡眠模式。
當(dāng)在操作模式下在步驟680中語(yǔ)音識(shí)別模塊從主處理器或音頻處理模塊接收到根據(jù)語(yǔ)音識(shí)別失敗的失敗信息時(shí),在步驟690中,語(yǔ)音識(shí)別模塊將操作模式切換到睡眠模式。
圖7是示出了根據(jù)本公開(kāi)實(shí)施例的用于電子設(shè)備中的主處理器的語(yǔ)音識(shí)別的方法的流程圖。
參考圖7,在步驟710中,電子設(shè)備的主處理器在睡眠模式下操作。主處理器的睡眠模式是指未使用電子設(shè)備的狀態(tài),即,應(yīng)用處理器的非活動(dòng)狀態(tài)。睡眠模式的主處理器阻止對(duì)與主處理器相連的某些功能塊的供電。
如果主處理器在睡眠模式下操作,則音頻輸入模塊保持在活動(dòng)狀態(tài),且即使便攜式終端未被使用,也檢測(cè)聲音信息,獲取音頻信號(hào),并將音頻信號(hào)存儲(chǔ)在緩沖器中。
在步驟720中,主處理器接收請(qǐng)求激活的驅(qū)動(dòng)信號(hào)。例如,主處理器在睡眠模式下從音頻處理模塊或語(yǔ)音識(shí)別模塊接收驅(qū)動(dòng)信號(hào)。
在步驟730中,主處理器響應(yīng)于驅(qū)動(dòng)信號(hào)而將睡眠模式切換到操作模式。在步驟740中,主處理器從音頻處理模塊或語(yǔ)音識(shí)別模塊接收音頻信號(hào)(或/和語(yǔ)音信號(hào)),并在步驟750中對(duì)音頻信號(hào)(或/和語(yǔ)音信號(hào))執(zhí)行語(yǔ)音識(shí)別。例如,主處理器基于從音頻處理模塊輸入的音頻信號(hào)或由音頻處理模塊或語(yǔ)音識(shí)別模塊第一次識(shí)別的語(yǔ)音信號(hào)來(lái)執(zhí)行語(yǔ)音識(shí)別。
主處理器由復(fù)雜的語(yǔ)音識(shí)別系統(tǒng)實(shí)現(xiàn),該復(fù)雜的語(yǔ)音識(shí)別系統(tǒng)與在音頻處理模塊或語(yǔ)音識(shí)別模塊中實(shí)現(xiàn)的簡(jiǎn)單語(yǔ)音識(shí)別系統(tǒng)相比使用相對(duì)更多的資源。例如,主處理器的關(guān)鍵字識(shí)別由基于維特比解碼僅提取要識(shí)別的字的識(shí)別算法來(lái)實(shí)現(xiàn)。主處理器的說(shuō)話人識(shí)別可以由以下一項(xiàng)或多項(xiàng)的組合來(lái)實(shí)現(xiàn):基于深度神經(jīng)網(wǎng)絡(luò)的識(shí)別算法、基于多神經(jīng)網(wǎng)絡(luò)的識(shí)別算法、以及基于ubm-gmm的識(shí)別算法。
主處理器通過(guò)區(qū)分用于自動(dòng)執(zhí)行語(yǔ)音識(shí)別應(yīng)用的語(yǔ)音觸發(fā)和在識(shí)別語(yǔ)音觸發(fā)之后輸入的語(yǔ)音命令來(lái)執(zhí)行語(yǔ)音識(shí)別。備選地,主處理器在活動(dòng)狀態(tài)下對(duì)從音頻處理模塊或語(yǔ)音識(shí)別模塊傳輸?shù)囊纛l信號(hào)執(zhí)行語(yǔ)音識(shí)別。
在步驟760中,主處理器確定語(yǔ)音識(shí)別是否成功。如果語(yǔ)音識(shí)別成功,則在步驟770中,主處理器識(shí)別與語(yǔ)音識(shí)別相對(duì)應(yīng)的命令,并基于語(yǔ)音命令執(zhí)行電子設(shè)備的功能。
如果在步驟760中語(yǔ)音識(shí)別失敗,則在步驟780中,主處理器傳輸向音頻處理模塊或語(yǔ)音識(shí)別模塊通知語(yǔ)音識(shí)別失敗的失敗信息,并在步驟790中將操作模式切換到睡眠模式。
主處理器在執(zhí)行語(yǔ)音識(shí)別的同時(shí)控制顯示模塊的開(kāi)啟/關(guān)閉操作。在圖12a、圖12b、圖13a和圖13b中描述與主處理器的語(yǔ)音識(shí)別有關(guān)的顯示模塊的開(kāi)啟/關(guān)閉操作的示例。
圖8是示出了根據(jù)本公開(kāi)實(shí)施例的用于電子設(shè)備中的主處理器的語(yǔ)音識(shí)別的方法的流程圖。
參考圖8,在步驟810中,電子設(shè)備的主處理器在睡眠模式下操作。在步驟820中,主處理器接收請(qǐng)求激活的驅(qū)動(dòng)信號(hào)。例如,在睡眠模式下,主處理器從音頻處理模塊或語(yǔ)音識(shí)別模塊接收驅(qū)動(dòng)信號(hào)。
在步驟825中,主處理器響應(yīng)于驅(qū)動(dòng)信號(hào)而將睡眠模式切換到操作模式。在步驟830中,主處理器從音頻處理模塊或語(yǔ)音識(shí)別模塊獲取音頻信號(hào)(或/和語(yǔ)音信號(hào)),并在步驟840中對(duì)音頻信號(hào)執(zhí)行語(yǔ)音識(shí)別。
在步驟845中,主處理器確定語(yǔ)音識(shí)別是否成功,并且當(dāng)語(yǔ)音識(shí)別成功時(shí),在步驟850中通過(guò)通信模塊向支持語(yǔ)音識(shí)別的服務(wù)器發(fā)送語(yǔ)音識(shí)別請(qǐng)求和音頻信號(hào)(和/或語(yǔ)音信號(hào))。主處理器向服務(wù)器傳輸以下至少一項(xiàng):從音頻輸入模塊輸入的基于外部聲音的音頻信號(hào)和基于語(yǔ)音識(shí)別來(lái)提取的語(yǔ)音信號(hào)。主處理器由復(fù)雜的語(yǔ)音識(shí)別系統(tǒng)實(shí)現(xiàn),該復(fù)雜的語(yǔ)音識(shí)別系統(tǒng)與在音頻處理模塊或語(yǔ)音識(shí)別模塊中實(shí)現(xiàn)的簡(jiǎn)單語(yǔ)音識(shí)別系統(tǒng)相比使用更多的資源。主處理器通過(guò)區(qū)分用于自動(dòng)執(zhí)行語(yǔ)音識(shí)別應(yīng)用的語(yǔ)音觸發(fā)和在識(shí)別語(yǔ)音觸發(fā)之后輸入的語(yǔ)音命令來(lái)執(zhí)行語(yǔ)音識(shí)別。主處理器傳輸與在識(shí)別語(yǔ)音觸發(fā)之后輸入的語(yǔ)音命令相對(duì)應(yīng)的語(yǔ)音信號(hào),或者傳輸標(biāo)識(shí)語(yǔ)音觸發(fā)和語(yǔ)音命令分離的時(shí)間點(diǎn)的信息。然后,服務(wù)器基于從電子設(shè)備傳輸?shù)囊纛l信號(hào)(或/和語(yǔ)音信號(hào))執(zhí)行語(yǔ)音識(shí)別。由服務(wù)器執(zhí)行的語(yǔ)音識(shí)別可以是關(guān)鍵字識(shí)別、說(shuō)話人識(shí)別、和命令識(shí)別中的至少一項(xiàng)。如上所述,與主處理器相比,服務(wù)器可以識(shí)別更多語(yǔ)音命令。服務(wù)器可以通過(guò)基于深度神經(jīng)網(wǎng)絡(luò)(dnn)的ubm-gmm算法來(lái)執(zhí)行語(yǔ)音識(shí)別,并向電子設(shè)備發(fā)送關(guān)于語(yǔ)音識(shí)別的結(jié)果信息。例如,當(dāng)語(yǔ)音識(shí)別成功時(shí),服務(wù)器可以將所識(shí)別的語(yǔ)音命令轉(zhuǎn)換為文本信息,并向電子設(shè)備發(fā)送該文本信息。當(dāng)語(yǔ)音識(shí)別失敗時(shí),服務(wù)器可以向電子設(shè)備發(fā)送向電子設(shè)備通知語(yǔ)音識(shí)別失敗的失敗信息。
在步驟855中,主處理器從服務(wù)器接收語(yǔ)音識(shí)別結(jié)果。當(dāng)在步驟860中主處理器基于語(yǔ)音識(shí)別的結(jié)果接收到關(guān)于語(yǔ)音識(shí)別的成功信息時(shí),在步驟865中,主處理器識(shí)別與語(yǔ)音識(shí)別相對(duì)應(yīng)的命令,并基于語(yǔ)音命令執(zhí)行電子設(shè)備的功能。
當(dāng)語(yǔ)音識(shí)別失敗時(shí),在步驟870中,主處理器傳輸向音頻處理模塊或語(yǔ)音識(shí)別模塊通知語(yǔ)音識(shí)別失敗的失敗信息,并在步驟880中將操作模式切換到睡眠模式。
圖9是示出了根據(jù)本公開(kāi)實(shí)施例的用于電子設(shè)備的組件之間的語(yǔ)音識(shí)別的方法的流程圖。
參考圖9,在步驟910中,電子設(shè)備通過(guò)音頻輸入模塊識(shí)別聲音。當(dāng)音頻輸入模塊識(shí)別出聲音時(shí),在步驟920中,電子設(shè)備向音頻處理模塊傳輸驅(qū)動(dòng)信號(hào)以請(qǐng)求激活。在步驟911中,音頻處理模塊在睡眠模式下操作,并且當(dāng)從音頻輸入模塊接收到驅(qū)動(dòng)信號(hào)時(shí),在步驟930中,音頻處理模塊被喚醒并切換到操作模式。在步驟935中,電子設(shè)備可以通過(guò)音頻處理模塊基于從音頻輸入模塊獲取的音頻信號(hào)(例如,語(yǔ)音信號(hào))執(zhí)行語(yǔ)音識(shí)別。當(dāng)音頻處理模塊成功進(jìn)行了語(yǔ)音識(shí)別時(shí),在步驟940中,音頻處理模塊向主處理器傳輸驅(qū)動(dòng)信號(hào)以請(qǐng)求激活。同時(shí),當(dāng)基于語(yǔ)音識(shí)別的結(jié)果,音頻處理模塊進(jìn)行語(yǔ)音識(shí)別失敗時(shí),電子設(shè)備將音頻處理模塊切換到睡眠模式并使主處理器保持在睡眠模式下。
在步驟912中,主處理器在睡眠模式下操作,并且當(dāng)從音頻處理模塊接收到驅(qū)動(dòng)信號(hào)時(shí),在步驟950中,主處理器被喚醒并切換到操作模式。在步驟955中,主處理器對(duì)基于由音頻處理模塊第一次執(zhí)行的語(yǔ)音識(shí)別所提取的語(yǔ)音信號(hào)和從音頻輸入模塊輸入的音頻信號(hào)第二次執(zhí)行語(yǔ)音識(shí)別。
當(dāng)基于語(yǔ)音識(shí)別的結(jié)果,主處理器成功進(jìn)行了語(yǔ)音識(shí)別時(shí),在步驟960中,電子設(shè)備基于所識(shí)別的語(yǔ)音命令執(zhí)行其功能。同時(shí),當(dāng)基于語(yǔ)音識(shí)別的結(jié)果,主處理器進(jìn)行語(yǔ)音識(shí)別失敗時(shí),在步驟975中,電子設(shè)備向音頻處理模塊傳輸語(yǔ)音識(shí)別失敗信息,并將音頻處理模塊和主處理器切換到睡眠模式。
圖10是示出了根據(jù)本公開(kāi)實(shí)施例的電子設(shè)備的組件之間的語(yǔ)音識(shí)別的流程圖。
參考圖10,在步驟1010中,電子設(shè)備通過(guò)音頻輸入模塊識(shí)別聲音。當(dāng)音頻輸入模塊識(shí)別出聲音時(shí),在步驟1020中,電子設(shè)備的音頻輸入模塊向音頻處理模塊(或語(yǔ)音識(shí)別模塊)傳輸驅(qū)動(dòng)信號(hào)以請(qǐng)求激活。在步驟1011中,音頻處理模塊(或語(yǔ)音識(shí)別模塊)在睡眠模式下操作,并且當(dāng)從音頻輸入模塊接收到驅(qū)動(dòng)信號(hào)時(shí),在步驟1030中,音頻處理模塊(或語(yǔ)音識(shí)別模塊)被喚醒并切換到操作模式。然后,在步驟1035中,電子設(shè)備通過(guò)音頻處理模塊(或語(yǔ)音識(shí)別模塊)對(duì)從音頻輸入模塊獲取的音頻信號(hào)執(zhí)行語(yǔ)音識(shí)別。當(dāng)音頻處理模塊(或語(yǔ)音識(shí)別模塊)成功進(jìn)行了語(yǔ)音識(shí)別時(shí),在步驟1040中,電子設(shè)備向主處理器傳輸驅(qū)動(dòng)信號(hào)以請(qǐng)求激活。音頻處理模塊(或語(yǔ)音識(shí)別模塊)可以通過(guò)關(guān)鍵字識(shí)別和說(shuō)話人識(shí)別來(lái)識(shí)別語(yǔ)音觸發(fā)。
當(dāng)電子設(shè)備的主處理器在睡眠模式下從音頻處理模塊接收到驅(qū)動(dòng)信號(hào)時(shí),在步驟1050中,主處理器被喚醒并切換到操作模式。當(dāng)在步驟1055中電子設(shè)備的主處理器成功進(jìn)行了語(yǔ)音識(shí)別時(shí),在步驟1060中,主處理器向服務(wù)器發(fā)送音頻信號(hào)和/或語(yǔ)音信號(hào)。
主處理器通過(guò)關(guān)鍵字識(shí)別和說(shuō)話人識(shí)別來(lái)識(shí)別語(yǔ)音觸發(fā),并且區(qū)分語(yǔ)音觸發(fā)和在語(yǔ)音觸發(fā)之后輸入的語(yǔ)音命令。主處理器可以傳輸與在識(shí)別語(yǔ)音觸發(fā)之后輸入的語(yǔ)音命令相對(duì)應(yīng)的語(yǔ)音信號(hào),或者傳輸與語(yǔ)音觸發(fā)和語(yǔ)音命令分離的時(shí)間點(diǎn)有關(guān)的信息。主處理器可以向服務(wù)器傳輸以下至少一項(xiàng):從音頻輸入模塊輸入的基于外部聲音的音頻信號(hào)和基于語(yǔ)音識(shí)別提取的語(yǔ)音信號(hào)。然后,在步驟1065中,服務(wù)器基于從電子設(shè)備傳輸?shù)囊纛l信號(hào)和/或語(yǔ)音信號(hào)執(zhí)行語(yǔ)音識(shí)別,并在步驟1070中傳輸關(guān)于語(yǔ)音識(shí)別的結(jié)果信息。
當(dāng)基于來(lái)自服務(wù)器的關(guān)于語(yǔ)音識(shí)別的結(jié)果信息,語(yǔ)音識(shí)別成功,并且接收到語(yǔ)音命令信息時(shí),在步驟1080中,電子設(shè)備基于語(yǔ)音命令執(zhí)行電子設(shè)備的功能。
同時(shí),當(dāng)基于語(yǔ)音識(shí)別的結(jié)果,音頻處理模塊(或語(yǔ)音識(shí)別模塊)進(jìn)行語(yǔ)音識(shí)別失敗時(shí),在步驟1090中,電子設(shè)備將音頻處理模塊(或語(yǔ)音識(shí)別模塊)切換到睡眠模式,并使主處理器保持在睡眠模式下。同時(shí),當(dāng)基于來(lái)自服務(wù)器的語(yǔ)音識(shí)別結(jié)果,電子設(shè)備接收到通知語(yǔ)音識(shí)別失敗的失敗信息時(shí),在步驟1090中,電子設(shè)備向音頻處理模塊(或語(yǔ)音識(shí)別模塊)傳輸語(yǔ)音識(shí)別失敗信息,并將音頻處理模塊(或語(yǔ)音識(shí)別模塊)和主處理器切換到睡眠模式。
圖11是示出了根據(jù)本公開(kāi)實(shí)施例的電子設(shè)備的組件之間的語(yǔ)音識(shí)別的流程圖。
參考圖11,在步驟1110中,電子設(shè)備通過(guò)音頻輸入模塊識(shí)別聲音。當(dāng)電子設(shè)備的音頻輸入模塊識(shí)別出聲音時(shí),在步驟1120中,音頻輸入模塊向語(yǔ)音識(shí)別模塊傳輸驅(qū)動(dòng)信號(hào)以請(qǐng)求激活。在步驟1111中,語(yǔ)音識(shí)別模塊在睡眠模式下操作,并且當(dāng)從音頻輸入模塊接收到驅(qū)動(dòng)信號(hào)時(shí),在步驟1125中,語(yǔ)音識(shí)別模塊被喚醒并切換到操作模式。然后,在步驟1130中,電子設(shè)備的語(yǔ)音識(shí)別模塊對(duì)從音頻輸入模塊獲取的音頻信號(hào)執(zhí)行語(yǔ)音識(shí)別。當(dāng)語(yǔ)音識(shí)別模塊成功進(jìn)行了語(yǔ)音識(shí)別時(shí),在步驟1135中,語(yǔ)音識(shí)別模塊向音頻處理模塊傳輸驅(qū)動(dòng)信號(hào)以請(qǐng)求激活。在步驟1112中,音頻處理模塊在睡眠模式下操作,并且當(dāng)從語(yǔ)音識(shí)別模塊接收到驅(qū)動(dòng)信號(hào)時(shí),在步驟1140中,音頻處理模塊被喚醒并切換到操作模式。然后,在步驟1145中,電子設(shè)備的音頻處理模塊執(zhí)行語(yǔ)音識(shí)別。當(dāng)音頻處理模塊成功進(jìn)行了語(yǔ)音識(shí)別時(shí),在步驟1150中,音頻處理模塊向主處理器傳輸驅(qū)動(dòng)信號(hào)以請(qǐng)求激活。音頻處理模塊(或語(yǔ)音識(shí)別模塊)通過(guò)關(guān)鍵字識(shí)別和說(shuō)話人識(shí)別來(lái)識(shí)別由注冊(cè)說(shuō)話人輸入的語(yǔ)音觸發(fā)。
在步驟1113中,電子設(shè)備的主處理器在睡眠模式下操作,并且當(dāng)從音頻處理模塊接收到驅(qū)動(dòng)信號(hào)時(shí),在步驟1155中,主處理器被喚醒并切換到操作模式。當(dāng)在步驟1160中電子設(shè)備的主處理器執(zhí)行語(yǔ)音識(shí)別并且語(yǔ)音識(shí)別成功時(shí),在步驟1165中,主處理器向服務(wù)器傳輸音頻信號(hào)和/或語(yǔ)音信號(hào)。主處理器通過(guò)關(guān)鍵字識(shí)別和說(shuō)話人識(shí)別來(lái)識(shí)別由注冊(cè)說(shuō)話人輸入的語(yǔ)音觸發(fā),并且區(qū)分語(yǔ)音觸發(fā)和在語(yǔ)音觸發(fā)之后輸入的語(yǔ)音命令。主處理器傳輸與在識(shí)別語(yǔ)音觸發(fā)之后輸入的語(yǔ)音命令相對(duì)應(yīng)的語(yǔ)音信號(hào),或者傳輸與語(yǔ)音觸發(fā)和語(yǔ)音命令分離的時(shí)間點(diǎn)有關(guān)的信息以及連續(xù)語(yǔ)音信號(hào)。此外,主處理器向服務(wù)器傳輸以下至少一項(xiàng):從音頻輸入模塊輸入的基于外部聲音的音頻信號(hào)和基于語(yǔ)音識(shí)別提取的語(yǔ)音信號(hào)。
然后,在步驟1175中,服務(wù)器基于從電子設(shè)備傳輸?shù)囊纛l信號(hào)和/或語(yǔ)音信號(hào)執(zhí)行語(yǔ)音識(shí)別,并在步驟1180中傳輸關(guān)于語(yǔ)音識(shí)別的結(jié)果信息。在步驟1085中,電子設(shè)備基于從服務(wù)器接收的語(yǔ)音命令執(zhí)行功能。當(dāng)從主處理器傳輸了連續(xù)音頻信號(hào)或語(yǔ)音信號(hào)時(shí),服務(wù)器區(qū)分語(yǔ)音觸發(fā)和語(yǔ)音命令,并執(zhí)行語(yǔ)音識(shí)別。當(dāng)從主處理器傳輸了語(yǔ)音命令的信號(hào)時(shí),服務(wù)器執(zhí)行語(yǔ)音命令識(shí)別。
由服務(wù)器執(zhí)行的語(yǔ)音命令識(shí)別可以是關(guān)鍵字識(shí)別、說(shuō)話人識(shí)別、和命令識(shí)別中的至少一項(xiàng)。如上所述,電子設(shè)備可以識(shí)別有限的語(yǔ)音命令,而與主處理器相比,服務(wù)器可以識(shí)別更多語(yǔ)音命令。
同時(shí),當(dāng)基于來(lái)自服務(wù)器的語(yǔ)音識(shí)別結(jié)果,電子設(shè)備接收到通知語(yǔ)音識(shí)別失敗的失敗信息時(shí),在步驟1190中,電子設(shè)備向音頻處理模塊或語(yǔ)音識(shí)別模塊傳輸語(yǔ)音識(shí)別失敗信息,并在圖9的步驟975、圖10的步驟1095以及圖11的步驟1192和1191中將音頻處理模塊或語(yǔ)音識(shí)別模塊和主處理器切換到睡眠模式。
電子設(shè)備的語(yǔ)音識(shí)別模塊第一次執(zhí)行語(yǔ)音識(shí)別。當(dāng)語(yǔ)音識(shí)別模塊的語(yǔ)音識(shí)別成功時(shí),音頻處理模塊第二次執(zhí)行語(yǔ)音識(shí)別。當(dāng)音頻處理模塊的語(yǔ)音識(shí)別成功時(shí),主處理器第三次執(zhí)行語(yǔ)音識(shí)別。此外,當(dāng)電子設(shè)備的主處理器成功進(jìn)行語(yǔ)音識(shí)別時(shí),主處理器請(qǐng)求服務(wù)器第四次執(zhí)行語(yǔ)音識(shí)別。
下文中,將描述電子設(shè)備的語(yǔ)音識(shí)別操作中的用戶界面(ui)屏幕的實(shí)施例。
圖12a提供了根據(jù)本公開(kāi)實(shí)施例的電子設(shè)備的語(yǔ)音識(shí)別操作屏幕的示例。圖12b提供了根據(jù)本公開(kāi)實(shí)施例的電子設(shè)備的語(yǔ)音識(shí)別操作屏幕的示例。
參考圖12a和圖12b,當(dāng)主處理器從睡眠模式切換到操作模式并執(zhí)行語(yǔ)音識(shí)別時(shí),電子設(shè)備控制顯示模塊的開(kāi)啟/關(guān)閉操作。
如附圖標(biāo)記1201(圖12a)所示,在音頻輸入模塊獲取音頻信號(hào)并且音頻處理模塊(或語(yǔ)音識(shí)別模塊)執(zhí)行語(yǔ)音識(shí)別時(shí),電子設(shè)備的主處理器在睡眠模式下操作并且顯示模塊處于關(guān)閉狀態(tài)。在主處理器由來(lái)自音頻處理模塊(或語(yǔ)音識(shí)別模塊)的驅(qū)動(dòng)信號(hào)激活并執(zhí)行語(yǔ)音識(shí)別時(shí),主處理器控制顯示模塊保持關(guān)閉狀態(tài)。
當(dāng)電子設(shè)備的主處理器成功進(jìn)行了語(yǔ)音識(shí)別時(shí),主處理器打開(kāi)顯示模塊并顯示語(yǔ)音識(shí)別操作屏幕,例如由附圖標(biāo)記1203(圖12a)所示的語(yǔ)音識(shí)別應(yīng)用屏幕,然后,順序執(zhí)行與語(yǔ)音命令相對(duì)應(yīng)的功能,并控制如附圖標(biāo)記1204(圖12a)所示的功能執(zhí)行屏幕的輸出。
例如,當(dāng)基于語(yǔ)音識(shí)別的結(jié)果,電子設(shè)備的主處理器成功識(shí)別了注冊(cè)說(shuō)話人的語(yǔ)音觸發(fā)(例如,“higalaxy”)并且成功識(shí)別了在語(yǔ)音觸發(fā)之后輸入的語(yǔ)音命令(例如,“打開(kāi)相機(jī)”)時(shí),主處理器控制顯示模塊輸出語(yǔ)音識(shí)別應(yīng)用屏幕1203以及隨后輸出功能執(zhí)行屏幕1204(圖12a)。
備選地,當(dāng)基于語(yǔ)音識(shí)別的結(jié)果,電子設(shè)備的主處理器成功進(jìn)行了語(yǔ)音識(shí)別時(shí),主處理器打開(kāi)顯示模塊,以執(zhí)行與語(yǔ)音命令相對(duì)應(yīng)的功能,并且直接顯示功能執(zhí)行屏幕。
在執(zhí)行語(yǔ)音識(shí)別時(shí),電子設(shè)備的主處理器控制顯示模塊保持關(guān)閉狀態(tài),如附圖標(biāo)記1205(圖12b)所示。當(dāng)基于語(yǔ)音識(shí)別的結(jié)果,語(yǔ)音識(shí)別失敗時(shí),主處理器可以從操作模式切換到睡眠模式并保持關(guān)閉狀態(tài),如附圖標(biāo)記1206(圖12b)所示。
圖13a提供了根據(jù)本公開(kāi)實(shí)施例的電子設(shè)備的語(yǔ)音識(shí)別操作屏幕的示例。圖13b提供了根據(jù)本公開(kāi)實(shí)施例的電子設(shè)備的語(yǔ)音識(shí)別操作屏幕的示例。
參考圖13a和圖13b,電子設(shè)備從音頻輸入模塊獲取音頻信號(hào)。在音頻處理模塊(或語(yǔ)音識(shí)別模塊)執(zhí)行語(yǔ)音識(shí)別時(shí),主處理器在睡眠模式下操作,使得顯示模塊可以處于關(guān)閉狀態(tài),如附圖標(biāo)記1301(圖13a)所示。當(dāng)主處理器由來(lái)自音頻處理模塊(或語(yǔ)音識(shí)別模塊)的驅(qū)動(dòng)信號(hào)激活時(shí),主處理器打開(kāi)顯示模塊并顯示指示正在執(zhí)行語(yǔ)音識(shí)別的語(yǔ)音識(shí)別操作屏幕,如附圖標(biāo)記1302(圖13a)所示。
當(dāng)語(yǔ)音識(shí)別成功時(shí),主處理器執(zhí)行與語(yǔ)音命令相對(duì)應(yīng)的功能,將語(yǔ)音識(shí)別操作屏幕切換到功能執(zhí)行屏幕,并顯示所切換的功能執(zhí)行屏幕,如附圖標(biāo)記1303(圖13a)所示。
如圖13b所示,在電子設(shè)備的音頻處理模塊(或語(yǔ)音識(shí)別模塊)執(zhí)行語(yǔ)音識(shí)別時(shí),顯示模塊保持在關(guān)閉狀態(tài),如附圖標(biāo)記1304所示。
當(dāng)電子設(shè)備的主處理器因語(yǔ)音識(shí)別功能而被激活時(shí),主處理器可以打開(kāi)顯示模塊,并且在執(zhí)行語(yǔ)音識(shí)別時(shí),顯示指示正在執(zhí)行語(yǔ)音識(shí)別的語(yǔ)音識(shí)別操作屏幕,如附圖標(biāo)記1305所示。當(dāng)在語(yǔ)音識(shí)別期間顯示語(yǔ)音識(shí)別操作屏幕時(shí)基于語(yǔ)音識(shí)別的結(jié)果,語(yǔ)音識(shí)別失敗時(shí),主處理器關(guān)閉顯示模塊,并從操作模式切換到睡眠模式,如附圖標(biāo)記1306所示。
還可以提供其中存儲(chǔ)有命令的存儲(chǔ)介質(zhì)。所述命令被配置為當(dāng)由一個(gè)或多個(gè)處理器執(zhí)行時(shí)允許所述一個(gè)或多個(gè)處理器執(zhí)行一個(gè)或多個(gè)操作。所述一個(gè)或多個(gè)操作包括:由音頻輸入模塊識(shí)別聲音并請(qǐng)求激活語(yǔ)音識(shí)別模塊;當(dāng)語(yǔ)音識(shí)別模塊響應(yīng)于來(lái)自音頻輸入模塊的激活請(qǐng)求而被激活時(shí),對(duì)從音頻輸入模塊傳輸?shù)囊纛l信號(hào)執(zhí)行第一語(yǔ)音識(shí)別;當(dāng)由語(yǔ)音識(shí)別模塊執(zhí)行的第一語(yǔ)音識(shí)別成功時(shí),向處理器請(qǐng)求語(yǔ)音識(shí)別;以及由處理器對(duì)從語(yǔ)音識(shí)別模塊傳輸?shù)囊纛l信號(hào)執(zhí)行第二語(yǔ)音識(shí)別。
根據(jù)本公開(kāi),當(dāng)語(yǔ)音識(shí)別第一次通過(guò)具有小電流消耗的低性能模塊執(zhí)行并且第一次語(yǔ)音識(shí)別成功時(shí),通過(guò)具有相對(duì)較高識(shí)別率的高性能模塊第二次執(zhí)行語(yǔ)音識(shí)別,使得通過(guò)電子設(shè)備的組件的分階段激活可以提高語(yǔ)音識(shí)別的識(shí)別率并且還可以改善電流消耗。
盡管已經(jīng)參考本公開(kāi)的特定實(shí)施例示出并描述了本公開(kāi),但是本領(lǐng)域技術(shù)人員將理解,在不脫離由所附權(quán)利要求及其等同物限定的本發(fā)明的精神和范圍的前提下,可以在其中進(jìn)行形式和細(xì)節(jié)上的各種改變。