一種語音輸入方法及裝置的制造方法
【專利摘要】本發(fā)明提供一種語音輸入方法及裝置。方法包括:當接收到輸入法應(yīng)用發(fā)送的語音輸入指令時,獲取語音輸入設(shè)備的操作權(quán);基于所述操作權(quán),采用所述語音輸入設(shè)備采集當前環(huán)境語音;對采集到的當前環(huán)境語音進行語音識別,并將識別出的文字信息返回給所述輸入法應(yīng)用。本發(fā)明解決了現(xiàn)有技術(shù)在用戶不方便手動輸入文字信息的應(yīng)用場景下,在終端上輸入文字信息的便利性和效率較差的問題。
【專利說明】
一種語音輸入方法及裝置
技術(shù)領(lǐng)域
[0001]本發(fā)明實施例涉及計算機技術(shù)領(lǐng)域,尤其涉及一種語音輸入方法及裝置。
【背景技術(shù)】
[0002]目前,用戶要在終端上輸入文字信息時,一般基于終端上的輸入法應(yīng)用,通過點擊終端上的鍵盤按鍵輸入文字信息,或者,在終端上的手寫板上手寫輸入文字信息,其中,所述終端包括但不限于:車載臺、手機、平板電腦,等等。
[0003]但是,在某些應(yīng)用場景下,用戶的雙手可能需要做其他操作,從而不方便手動在終端上輸入文字信息。例如,當用戶正在開車時,可能想要在車載臺上的導航應(yīng)用中搜索地名,或者,想要在手機上回復短信息,等等,但由于用戶的雙手正在操作方向盤,因此,不方便手動在終端上輸入文字信息。
[0004]在上述的應(yīng)用場景下,在終端上輸入文字信息的便利性較差。
【發(fā)明內(nèi)容】
[0005]本發(fā)明實施例提供一種語音輸入方法及裝置,用以解決現(xiàn)有技術(shù)在用戶不方便手動輸入文字信息的應(yīng)用場景下,在終端上輸入文字信息的便利性和效率較差的問題。
[0006]本發(fā)明實施例提供一種語音輸入方法,包括:
[0007]當接收到輸入法應(yīng)用發(fā)送的語音輸入指令時,獲取語音輸入設(shè)備的操作權(quán);
[0008]基于所述操作權(quán),采用所述語音輸入設(shè)備采集當前環(huán)境語音;
[0009]對采集到的當前環(huán)境語音進行語音識別,并將識別出的文字信息返回給所述輸入法應(yīng)用。
[0010]本發(fā)明實施例還提供一種語音輸入裝置,包括:
[0011]接收模塊,用于當接收到輸入法應(yīng)用發(fā)送的語音輸入指令時,獲取語音輸入設(shè)備的操作權(quán);
[0012]采集模塊,用于基于所述操作權(quán),采用所述語音輸入設(shè)備采集當前環(huán)境語音;
[0013]識別模塊,用于對采集到的當前環(huán)境語音進行語音識別,并將識別出的文字信息返回給所述輸入法應(yīng)用。
[0014]本發(fā)明實施例提供的語音輸入方法及裝置,即使用戶不方便手動在終端上輸入文字信息,也可以通過語音輸入文字信息,因此,提高了在終端上輸入文字信息的便利性。解決了現(xiàn)有技術(shù)在用戶不方便手動輸入文字信息的應(yīng)用場景下,在終端上輸入文字信息的便利性和效率較差的問題。
【附圖說明】
[0015]為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0016]圖1為本發(fā)明實施例提供的語音輸入過程;
[0017]圖2為本發(fā)明實施例提供的,采用廣播機制獲取語音輸入設(shè)備的操作權(quán)的過程;
[0018]圖3為本發(fā)明實施例提供的,在安卓(Android)操作系統(tǒng)上,一種生成語音輸入可視化界面的過程;
[0019]圖4為本發(fā)明實施例提供的,一種輸入法應(yīng)用的可視化界面;
[0020]圖5為本發(fā)明實施例提供的,一種在采集當前環(huán)境語音過程中的語音輸入可視化界面;
[0021]圖6為本發(fā)明實施例提供的,一種在對采集到的當前環(huán)境語音進行語音識別過程中的語音輸入可視化界面;
[0022]圖7為本發(fā)明實施例提供的,語音輸入完成后切換回的輸入法應(yīng)用的可視化界面;
[0023]圖8為本發(fā)明實施例提供的語音輸入裝置結(jié)構(gòu)示意圖。
【具體實施方式】
[0024]為使本發(fā)明實施例的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
[0025]圖1為本發(fā)明實施例提供的語音輸入過程,具體包括以下步驟:
[0026]SlOl:當接收到輸入法應(yīng)用發(fā)送的語音輸入指令時,獲取語音輸入設(shè)備的操作權(quán)。
[0027]本發(fā)明實施例提供的語音輸入方法的執(zhí)行主體可以是:終端、服務(wù)器、終端或服務(wù)器上的應(yīng)用、內(nèi)嵌于應(yīng)用中的引擎(例如,內(nèi)嵌于所述輸入法應(yīng)用中的語音輸入引擎)等等。所述終端包括但不限于:車載臺、手機、平板電腦、智能手表、個人計算機,等等;所述服務(wù)器包括但不限于:作為服務(wù)器的大中型計算機、計算機集群,等等。所述的執(zhí)行主體并不構(gòu)成對本申請的限定。為了便于描述,本發(fā)明實施例均以內(nèi)嵌于所述輸入法應(yīng)用中的語音輸入引擎作為執(zhí)行主體。
[0028]所述的輸入法應(yīng)用可以是操作系統(tǒng)自帶的輸入法應(yīng)用,也可以是用戶在操作系統(tǒng)上安裝的第三方輸入法應(yīng)用。
[0029]—般的,當用戶需要在文本框中輸入文字或其他字符信息時,可以通過點擊文本框激活輸入法應(yīng)用,輸入法應(yīng)用則可以展示自己的可視化界面,并為用戶提供鍵盤輸入或者手寫板方式的輸入方式。在本發(fā)明實施例中,可以基于語音輸入指令,將所述鍵盤輸入或者手寫板方式切換至語音輸入方式,具體的,用戶可以通過對預(yù)設(shè)控件進行操作,從而觸發(fā)輸入法應(yīng)用向語音輸入引擎發(fā)送語音輸入指令以切換至語音輸入方式。其中,所述預(yù)設(shè)控件包括但不限于實體按鍵、虛擬按鍵,等等。
[0030]語音輸入引擎在接收到所述語音輸入指令后,可以采用語音輸入設(shè)備采集當前環(huán)境語音,但是由于可能會有其他應(yīng)用占用了語音輸入設(shè)備的操作權(quán),因此,語音輸入引擎可以等待語音輸入設(shè)備的操作權(quán)被釋放后,獲取語音輸入設(shè)備的操作權(quán),或者,也可以主動地向其他應(yīng)用請求獲取語音輸入設(shè)備的操作權(quán)。其中,所述語音輸入設(shè)備包括但不限于麥克風(Microphone,MIC),以及支持MIC功能的相關(guān)組件。
[0031]S102:基于所述操作權(quán),采用所述語音輸入設(shè)備采集當前環(huán)境語音。
[0032]S103:對采集到的當前環(huán)境語音進行語音識別,并將識別出的文字信息返回給所述輸入法應(yīng)用。
[0033]本發(fā)明實施例對在語音識別過程中所使用的識別算法并不做限定。可以使用現(xiàn)有的語音識別算法,例如,隱馬爾可夫模型(Hidden Markov Model, HMM)語音識別算法、動態(tài)時間歸整(Dynamic Time Warping,DTff)語音識別算法,等等,從采集到的當前環(huán)境語音中,識別出文字信息。輸入法應(yīng)用在接收到所述識別出的文字信息后,可以在文本框中展示,從而完成對所述識別出的文字信息的語音輸入過程。
[0034]通過上述方法,用戶可以不手動地在終端上輸入文字信息,而是可以通過簡單的操作(例如,點擊一下預(yù)設(shè)控件),使用本申請?zhí)峁┑恼Z音輸入方式輸入文字信息,解放了用戶的雙手,使用戶在輸入文字信息的同時,還可以用雙手做其他操作,如開車、抓扶手,等等,也提高了在終端上輸入文字信息的便利性。
[0035]在本發(fā)明實施例中,對于上述步驟S101,可以采用廣播機制,獲取語音輸入設(shè)備的操作權(quán),實現(xiàn)成本很小。圖2示出了采用廣播機制獲取語音輸入設(shè)備的操作權(quán)的過程,具體包括以下步驟:
[0036]S201:判斷語音輸入設(shè)備的操作權(quán)是否被其他應(yīng)用占用,若是,則執(zhí)行步驟S202,否則,執(zhí)行步驟S203。
[0037]S202:廣播請求消息,以請求所述其他應(yīng)用釋放所述語音輸入設(shè)備的操作權(quán),當監(jiān)聽到所述其他應(yīng)用在釋放所述語音輸入設(shè)備的操作權(quán)后廣播的通知消息時,獲取對所述語音輸入設(shè)備的操作權(quán)。
[0038]S203:獲取對所述語音輸入設(shè)備的操作權(quán)。
[0039]除了采用廣播機制,還可以采用其他方法獲取語音輸入設(shè)備的操作權(quán)。例如,可以不向所述其他應(yīng)用廣播請求消息,而是定時查詢語音輸入設(shè)備的操作權(quán)是否被其他應(yīng)用占用,直到確定語音輸入設(shè)備的操作權(quán)未被其他應(yīng)用占用時,再獲取語音輸入設(shè)備的操作權(quán)。
[0040]在本發(fā)明實施例中,為了進一步地提高在終端上語音輸入文字信息的便利性,還可以提供為用戶提供語音輸入可視化界面,在語音輸入時對用戶進行相應(yīng)提示,以及展示實時狀態(tài)。
[0041]具體的,對于上述步驟S102,在基于所述操作權(quán),采用所述語音輸入設(shè)備采集當前環(huán)境語音之前,可以生成語音輸入可視化界面,其中,所述語音輸入可視化界面用于展示對當前環(huán)境語音進行采集和/或識別的狀態(tài)。
[0042]進一步的,在不同的操作系統(tǒng)下,可以采用不同的方法生成語音輸入可視化界面,例如,在Android操作系統(tǒng)下,可以基于彈出框生成語音輸入可視化界面。具體的,可以獲取所述輸入法應(yīng)用的可視化界面的尺寸信息,根據(jù)所述尺寸信息,生成彈出框,或者,也可以根據(jù)預(yù)設(shè)尺寸信息,生成彈出框,生成的彈出框即為所述語音輸入可視化界面,其中,所述輸入法應(yīng)用的可視化界面可以是采用鍵盤輸入或者手寫板輸入方式進行文字信息輸入時,所使用的界面;進一步的,在生成的彈出框內(nèi)還可以添加有用于展示對當前環(huán)境語音進行采集和/或識別的狀態(tài)的控件。所述控件可以采用各種方式展示對當前環(huán)境語音進行采集和/或識別的狀態(tài),以幫助用戶進行語音輸入。例如,在語音輸入引擎獲取語音輸入設(shè)備的操作權(quán)后,所述控件可以提示用戶“開始說話”,并根據(jù)采集的當前環(huán)境語音的音量大小,展示相應(yīng)的動畫效果(例如,水波紋、頻譜儀等動畫效果),讓用戶感知到語音輸入引擎正在采集當前環(huán)境語音,而采集完畢后進行識別時,所述控件可以提示用戶“正在識別”,等等。
[0043]在本發(fā)明實施例中,為了使用戶更好地感知到已切換至語音輸入方式,可以將生成的語音輸入可視化界面覆蓋在輸入法應(yīng)用的可視化界面之上。具體的,可以對所述彈出框進行設(shè)置,使所述語音輸入可視化界面將所述輸入法應(yīng)用的可視化界面重疊覆蓋,并位于當前顯示屏幕的最上層。例如,在Android操作系統(tǒng)中,可以根據(jù)輸入法應(yīng)用的可視化界面的位置,確定所述彈出的位置,使二者位置重合,進一步的,將所述彈出框的類型設(shè)置為類型系統(tǒng)告警(類型系統(tǒng)告警)系統(tǒng)級,再將設(shè)置類型后的彈出框添加至窗口管理器(窗口管理器)中,這樣的話,可以使所述彈出框始終位于當前顯示屏幕的最上層,提高了語音輸入可視化界面的易用性。
[0044]在本發(fā)明實施例中,所述彈出框可以是POP UP框,或者其他的與POP UP框功能類似的控件,所述類型系統(tǒng)告警系統(tǒng)級可以是TYPE_SYSTEM_ALERT系統(tǒng)級,所述窗口管理器可以是 WindowManager。
[0045]在本發(fā)明實施例中,當確定語音輸入完成后,可以將所述語音輸入可視化界面隱藏或者銷毀,重新顯示輸入法應(yīng)用的可視化界面,相應(yīng)的,輸入方式也從語音輸入切換回鍵盤輸入或者手寫板輸入。本申請對確定語音輸入完成的具體方法并不做限定,在此,僅列舉兩種可行的確定方法:第一,當在設(shè)定時間內(nèi)檢測到當前環(huán)境語音的音量分貝數(shù)均未超過預(yù)設(shè)閾值時,確定語音輸入完成;第二,當接收到用戶通過預(yù)設(shè)控件發(fā)送的語音輸入完成的指令后,確定語首輸入完成。
[0046]根據(jù)上述說明,在圖3中示出了根據(jù)本申請?zhí)峁┑恼Z音輸入方法,在Android操作系統(tǒng)上,一種生成語音輸入可視化界面的過程,具體包括以下步驟:
[0047]S301:獲取所述輸入法應(yīng)用的可視化界面的尺寸信息。
[0048]S302:根據(jù)所述尺寸信息,生成POP UP框,并在所述POP UP框內(nèi)繪制用于展示對當前環(huán)境語音進行采集和/或識別的狀態(tài)的控件。
[0049]S303:將所述POP UP框的類型設(shè)置為TYPE_SYSTEM_ALERT系統(tǒng)級,再將設(shè)置類型后的POP UP框添加至WindowManager中,使其位于當前顯示屏幕的最上層。
[0050]S304:將經(jīng)過上述處理的POP UP框作為生成的語音輸入可視化界面,并使所述語音輸入可視化界面將所述輸入法應(yīng)用的可視化界面重疊覆蓋。
[0051]進一步的,在圖4、圖5、圖6、圖7中示出了,在實際應(yīng)用中,一種適用于車載臺的輸入法應(yīng)用的可視化界面,以及語音輸入可視化界面。
[0052]圖4示出了輸入法應(yīng)用的可視化界面,當選中圖4中的文本框后,可以采用鍵盤輸入、手寫板輸入、語音輸入等方式輸入文字或字符信息,在輸入法應(yīng)用的可視化界面的左上角設(shè)置有用于切換至語音輸入方式的預(yù)設(shè)控件,當用戶點擊該預(yù)設(shè)控件時,語音輸入引擎可以接收到輸入法應(yīng)用發(fā)送的語音輸入指令,從而切換至語音輸入方式。
[0053]圖5示出了在采集當前環(huán)境語音過程中的語音輸入可視化界面,圖5中的控件可以通過文字“開始說話”,提示用戶可以進行語音輸入了,并且在語音輸入引擎采集當前環(huán)境語音的過程中,該控件可以用水波紋跳動表示正在采集當前環(huán)境語音,以及表示當前環(huán)境語音的音量大小。
[0054]圖6示出了在對采集到的當前環(huán)境語音進行語音識別過程中的語音輸入可視化界面,圖6中的控件可以通過文字“正在識別”,向用戶提示正在對采集到的當前環(huán)境語音進行語音識別。
[0055]圖7示出了語音輸入完成后切換回的輸入法應(yīng)用的可視化界面,可以看到,在圖7的文本框中已經(jīng)語音輸入了文字信息“西單大悅城”。
[0056]另外,在實際應(yīng)用中,也可以額外為語音輸入引擎配置一套語音輸入設(shè)備,這樣的話,語音輸入引擎無需等待其他應(yīng)用釋放語音輸入設(shè)備的操作權(quán),從而可以加快語音輸入方式的切換速度。
[0057]以上為本發(fā)明實施例提供的語音輸入方法,基于同樣的思路,本發(fā)明實施例還提供相應(yīng)的語音輸入裝置,如圖8所示。
[0058]圖8為本發(fā)明實施例提供的語音輸入裝置結(jié)構(gòu)示意圖,具體包括:
[0059]接收模塊801,用于當接收到輸入法應(yīng)用發(fā)送的語音輸入指令時,獲取語音輸入設(shè)備的操作權(quán);
[0060]采集模塊802,用于基于所述操作權(quán),采用所述語音輸入設(shè)備采集當前環(huán)境語音;[0061 ] 識別模塊803,用于對采集到的當前環(huán)境語音進行語音識別,并將識別出的文字信息返回給所述輸入法應(yīng)用。
[0062]所述接收模塊801具體用于,判斷語音輸入設(shè)備的操作權(quán)是否被其他應(yīng)用占用,若是,則廣播請求消息,以請求所述其他應(yīng)用釋放所述語音輸入設(shè)備的操作權(quán),當監(jiān)聽到所述其他應(yīng)用在釋放所述語音輸入設(shè)備的操作權(quán)后廣播的通知消息時,獲取對所述語音輸入設(shè)備的操作權(quán),否則,獲取對所述語音輸入設(shè)備的操作權(quán)。
[0063]所述裝置還包括:
[0064]生成模塊804,用于在所述采集模塊802基于所述操作權(quán),采用所述語音輸入設(shè)備采集當前環(huán)境語音之前,生成語音輸入可視化界面,其中,所述語音輸入可視化界面用于展示對當前環(huán)境語音進行采集和/或識別的狀態(tài)。
[0065]所述生成模塊804具體用于,獲取所述輸入法應(yīng)用的可視化界面的尺寸信息,根據(jù)所述尺寸信息,生成作為語音輸入可視化界面彈出框,其中,所述彈出框內(nèi)添加有用于展示對當前環(huán)境語音進行采集和/或識別的狀態(tài)的控件。
[0066]所述裝置還包括:
[0067]設(shè)置模塊805,用于對所述彈出框進行設(shè)置,使所述語音輸入可視化界面將所述輸入法應(yīng)用的可視化界面重疊覆蓋,并位于當前顯示屏幕的最上層。
[0068]所述設(shè)置模塊805具體用于,將所述彈出框的類型設(shè)置為類型系統(tǒng)告警系統(tǒng)級,再將設(shè)置類型后的彈出框添加至窗口管理器中。
[0069]具體的上述如圖8所示的裝置可以位于終端、服務(wù)器上,或者位于終端或服務(wù)器上的應(yīng)用內(nèi)。
[0070]本發(fā)明實施例中可以通過硬件處理器(hardware processor)來實現(xiàn)上述相關(guān)功能豐吳塊。
[0071]通過本發(fā)明實施例提供的語音輸入方法及裝置,即使用戶不方便手動在終端上輸入文字信息,也可以通過語音輸入文字信息,因此,提高了在終端上輸入文字信息的便利性。解決了現(xiàn)有技術(shù)在用戶不方便手動輸入文字信息的應(yīng)用場景下,在終端上輸入文字信息的便利性和效率較差的問題。
[0072]以上所描述的裝置實施例僅僅是示意性的,其中所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網(wǎng)絡(luò)單元上??梢愿鶕?jù)實際的需要選擇其中的部分或者全部模塊來實現(xiàn)本實施例方案的目的。本領(lǐng)域普通技術(shù)人員在不付出創(chuàng)造性的勞動的情況下,即可以理解并實施。
[0073]通過以上的實施方式的描述,本領(lǐng)域的技術(shù)人員可以清楚地了解到各實施方式可借助軟件加必需的通用硬件平臺的方式來實現(xiàn),當然也可以通過硬件?;谶@樣的理解,上述技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機軟件產(chǎn)品可以存儲在計算機可讀存儲介質(zhì)中,如R0M/RAM、磁碟、光盤等,包括若干指令用以使得一臺計算機設(shè)備(可以是個人計算機,服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行各個實施例或者實施例的某些部分所述的方法。
[0074]最后應(yīng)說明的是:以上實施例僅用以說明本發(fā)明的技術(shù)方案,而非對其限制;盡管參照前述實施例對本發(fā)明進行了詳細的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當理解:其依然可以對前述各實施例所記載的技術(shù)方案進行修改,或者對其中部分技術(shù)特征進行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實施例技術(shù)方案的精神和范圍。
【主權(quán)項】
1.一種語音輸入方法,其特征在于,包括: 當接收到輸入法應(yīng)用發(fā)送的語音輸入指令時,獲取語音輸入設(shè)備的操作權(quán); 基于所述操作權(quán),采用所述語音輸入設(shè)備采集當前環(huán)境語音; 對采集到的當前環(huán)境語音進行語音識別,并將識別出的文字信息返回給所述輸入法應(yīng)用。2.根據(jù)權(quán)利要求1所述的方法,其特征在于,獲取對語音輸入設(shè)備的操作權(quán),具體包括: 判斷語音輸入設(shè)備的操作權(quán)是否被其他應(yīng)用占用; 若是,則廣播請求消息,以請求所述其他應(yīng)用釋放所述語音輸入設(shè)備的操作權(quán),當監(jiān)聽到所述其他應(yīng)用在釋放所述語音輸入設(shè)備的操作權(quán)后廣播的通知消息時,獲取對所述語音輸入設(shè)備的操作權(quán); 否則,獲取對所述語音輸入設(shè)備的操作權(quán)。3.根據(jù)權(quán)利要求1所述的方法,其特征在于,基于所述操作權(quán),采用所述語音輸入設(shè)備采集當前環(huán)境語音之前,所述方法還包括: 生成語音輸入可視化界面,其中,所述語音輸入可視化界面用于展示對當前環(huán)境語音進行米集和/或識別的狀態(tài)。4.根據(jù)權(quán)利要求3所述的方法,其特征在于,生成語音輸入可視化界面,具體包括: 獲取所述輸入法應(yīng)用的可視化界面的尺寸信息; 根據(jù)所述尺寸信息,生成作為語音輸入可視化界面的彈出框,其中,所述彈出框內(nèi)添加有用于展示對當前環(huán)境語音進行采集和/或識別的狀態(tài)的控件。5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述方法還包括: 對所述彈出框進行設(shè)置,使所述語音輸入可視化界面將所述輸入法應(yīng)用的可視化界面重疊覆蓋,并位于當前顯示屏幕的最上層。6.根據(jù)權(quán)利要求5所述的方法,其特征在于,對所述彈出框進行設(shè)置,具體包括: 將所述彈出框的類型設(shè)置為類型系統(tǒng)告警系統(tǒng)級,再將設(shè)置類型后的彈出框添加至窗口管理器中。7.一種語音輸入裝置,其特征在于,包括: 接收模塊,用于當接收到輸入法應(yīng)用發(fā)送的語音輸入指令時,獲取語音輸入設(shè)備的操作權(quán); 采集模塊,用于基于所述操作權(quán),采用所述語音輸入設(shè)備采集當前環(huán)境語音; 識別模塊,用于對采集到的當前環(huán)境語音進行語音識別,并將識別出的文字信息返回給所述輸入法應(yīng)用。8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述接收模塊具體用于,判斷語音輸入設(shè)備的操作權(quán)是否被其他應(yīng)用占用,若是,則廣播請求消息,以請求所述其他應(yīng)用釋放所述語音輸入設(shè)備的操作權(quán),當監(jiān)聽到所述其他應(yīng)用在釋放所述語音輸入設(shè)備的操作權(quán)后廣播的通知消息時,獲取對所述語音輸入設(shè)備的操作權(quán),否則,獲取對所述語音輸入設(shè)備的操作權(quán)。9.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述裝置還包括: 生成模塊,用于在所述采集模塊基于所述操作權(quán),采用所述語音輸入設(shè)備采集當前環(huán)境語音之前,生成語音輸入可視化界面,其中,所述語音輸入可視化界面用于展示對當前環(huán)境語音進行采集和/或識別的狀態(tài)。10.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述生成模塊具體用于,獲取所述輸入法應(yīng)用的可視化界面的尺寸信息,根據(jù)所述尺寸信息,生成作為語音輸入可視化界面的彈出框,其中,所述彈出框內(nèi)添加有用于展示對當前環(huán)境語音進行采集和/或識別的狀態(tài)的控件。11.根據(jù)權(quán)利要求10所述的裝置,其特征在于,所述裝置還包括: 設(shè)置模塊,用于對所述彈出框進行設(shè)置,使所述語音輸入可視化界面將所述輸入法應(yīng)用的可視化界面重疊覆蓋,并位于當前顯示屏幕的最上層。12.根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述設(shè)置模塊具體用于,將所述彈出框的類型設(shè)置為類型系統(tǒng)告警系統(tǒng)級,再將設(shè)置類型后的彈出框添加至窗口管理器中。
【文檔編號】G06F3/01GK105988581SQ201510333129
【公開日】2016年10月5日
【申請日】2015年6月16日
【發(fā)明人】姜洋, 李鐵瑛, 趙飛
【申請人】樂卡汽車智能科技(北京)有限公司