亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種語音控制計算機的方法和智能語音助手系統(tǒng)與流程

文檔序號:12736569閱讀:360來源:國知局
一種語音控制計算機的方法和智能語音助手系統(tǒng)與流程

本發(fā)明涉及計算機技術(shù)領(lǐng)域,尤其涉及一種語音控制計算機的方法和智能語音助手系統(tǒng)。



背景技術(shù):

微軟的windows7系統(tǒng)自帶語音識別功能,可以讓計算機"聆聽",通過語音識別,用聲音進行文本的聽寫,創(chuàng)建文檔,根據(jù)語音命令進行程序的啟動,窗口之間的切換,通過顯示編號加確定焦點的方式進行菜單的操作,使用語音識別比使用鍵盤更方便,相比過去有很明顯的進步。

但現(xiàn)有的window7語音識別功能存在以下問題:語音識別有限,通常沒有限定場景,上下文,明顯邏輯時,語音識別錯誤頻發(fā),語音命令由windows的幫助功能中的“顯示語音參考卡”中內(nèi)容設(shè)定,所以功能有限,遠沒有達到方便實用的目的。而且,window7的語音識別功能,不能通過連續(xù)的語音命令,來實現(xiàn)復(fù)雜的計算機自動操作。



技術(shù)實現(xiàn)要素:

本發(fā)明所要解決的技術(shù)問題是針對現(xiàn)有技術(shù)的不足,提供一種語音控制計算機的方法和智能語音助手系統(tǒng)。

本發(fā)明解決上述技術(shù)問題的技術(shù)方案如下:一種智能語音助手系統(tǒng),其特征在于,包括:

顯示界面,用于接收用戶輸入的第一操作指令,所述第一操作指令用于開啟所述智能語音助手系統(tǒng);

存儲器,用于存儲語音配置文件和鼠標鍵盤配置文件;

語音采集器,用于采集所述用戶輸入的語音命令,并將所述語音命令傳輸至處理器;

所述處理器,用于將所述語音命令轉(zhuǎn)化為對應(yīng)的語音命令詞條,并調(diào)用所述存儲器中的所述語音配置文件,將所述語音命令詞條與所述語音配置文件中的詞條進行匹配,若匹配,則調(diào)用所述存儲器中的所述鼠標鍵盤配置文件中與所述語音命令詞條對應(yīng)的程序操作序列控制程序運行;

所述顯示界面還用于顯示執(zhí)行結(jié)果為成功。

本發(fā)明的有益效果是:在開啟智能語音助手系統(tǒng)后,通過將接收的用戶輸入的語音命令轉(zhuǎn)化為對應(yīng)的語音命令詞條,并將語音命令詞條與智能語音助手系統(tǒng)中存儲的語音配置文件中的詞條進行匹配,若匹配,則調(diào)用智能語音助手系統(tǒng)中存儲的鼠標鍵盤配置文件中與語音命令詞條對應(yīng)的程序操作序列控制程序運行,并在智能語音助手系統(tǒng)的顯示界面上顯示執(zhí)行結(jié)果為成功,從而能提高語音識別效率,實現(xiàn)語音控制計算機,使得計算機操作自動化,智能化,使計算機使用更簡潔、方便、快捷、省時。方便了老人,殘疾人,使語音控制達到日常應(yīng)用程度,實現(xiàn)了語音識別準確,提高了語音識別率,將日常人工操作的鍵盤,鼠標動作規(guī)范程序化,實現(xiàn)了個人機語音控制自動化完成各種各樣任務(wù),省略人工手工鍵盤鼠標一步步操作,且語音控制計算機執(zhí)行速度比手工操作快。

在上述技術(shù)方案的基礎(chǔ)上,本發(fā)明還可以做如下改進。

進一步地,所述顯示界面還用于,接收所述用戶輸入的第二操作指令,并將所述第二操作指令傳輸至所述處理器,所述第二操作指令用于指示所述處理器對所述語音命令詞條進行語音識別測試;

所述處理器還用于,根據(jù)所述第二操作指令對所述語音命令詞條進行語音識別測試,若通過語音識別測試,則將所述語音命令詞條傳輸至存儲器;若未通過語音識別測試,則刪除所述語音命令詞條;

所述存儲器還用于,將所述語音命令詞條存儲至所述語音配置文件中。

進一步地,所述顯示界面還用于在其第一區(qū)域顯示所述語音命令,并當(dāng)通過語音識別測試,在其第二區(qū)域顯示所述語音命令詞條。

進一步地,當(dāng)所述語音命令詞條與所述語音配置文件中的詞條不匹配時,所述顯示界面還用于顯示執(zhí)行結(jié)果為失敗。

進一步地,所述語音配置文件包括語音命令詞條庫,所述語音命令詞條庫根據(jù)所述用戶的需求建立,所述鼠標鍵盤配置文件包括:網(wǎng)頁地址、程序路徑和程序名,以及執(zhí)行所述程序時鼠標操作的具體動作、鼠標操作的位置信息、鼠標操作的等待時間,其中,所述鼠標操作的具體動作包括:移動、雙擊、左擊和右擊,所述鍵盤操作的具體動作包括:輸入、回車和ESC。

用戶可以用文本編輯功能對語音配置文件和鼠標鍵盤配置文件進行編輯、增減、修改和保存。

進一步地,當(dāng)程序運行出現(xiàn)錯誤時,所述顯示界面還用于顯示出錯信息,且所述智能語音助手系統(tǒng)停止運行。

進一步地,所述處理器還用于判斷當(dāng)前運行的程序所對應(yīng)的窗口是否處于打開狀態(tài),若是,則判斷所述窗口的窗口名稱是否為所述鼠標鍵盤配置文件中設(shè)定的窗口名稱,若不是,則確定程序運行出現(xiàn)錯誤。

進一步地,還包括:鼠標坐標定位系統(tǒng),所述鼠標坐標定位系統(tǒng)包括顯示界面,所述顯示界面用于接收所述用戶輸入的對鍵盤的操作指令,并將所述操作指令傳輸至處理器;

所述處理器還用于根據(jù)所述操作指令獲取所述鼠標操作的位置信息。

進一步地,當(dāng)所述鼠標坐標定位系統(tǒng)的顯示界面接收到所述用戶輸入的對鍵盤“F1”的操作指令時,在所述鼠標坐標定位系統(tǒng)的顯示界面的第一區(qū)域顯示鼠標的當(dāng)前位置信息(X、Y);

或者,當(dāng)所述鼠標坐標定位系統(tǒng)的顯示界面接收到所述用戶輸入的對鍵盤“F2”的操作指令時,強制退出所述鼠標坐標定位系統(tǒng);

或者,當(dāng)所述鼠標坐標定位系統(tǒng)接收到所述用戶輸入的對鍵盤“F3”的操作指令時,在所述鼠標坐標定位系統(tǒng)的顯示界面的第二區(qū)域顯示當(dāng)前窗口的名稱。

本發(fā)明解決上述技術(shù)問題的另一種技術(shù)方案如下:一種語音控制計算機的方法,其特征在于,包括以下步驟:

步驟1、根據(jù)用戶輸入的第一操作指令開啟智能語音助手系統(tǒng),所述智能語音助手系統(tǒng)中已存儲語音配置文件和鼠標鍵盤配置文件;

步驟2、接收所述用戶輸入的語音命令,并將所述語音命令轉(zhuǎn)化為對應(yīng)的語音命令詞條;

步驟3、將所述語音命令詞條與所述語音配置文件中的詞條進行匹配,若匹配,則調(diào)用所述鼠標鍵盤配置文件中與所述語音命令詞條對應(yīng)的程序操作序列控制程序運行,并在所述智能語音助手系統(tǒng)的顯示界面上顯示執(zhí)行結(jié)果為成功。

本發(fā)明的有益效果是:在開啟智能語音助手系統(tǒng)后,通過將接收的用戶輸入的語音命令轉(zhuǎn)化為對應(yīng)的語音命令詞條,并將語音命令詞條與智能語音助手系統(tǒng)中存儲的語音配置文件中的詞條進行匹配,若匹配,則調(diào)用智能語音助手系統(tǒng)中存儲的鼠標鍵盤配置文件中與語音命令詞條對應(yīng)的程序操作序列控制程序運行,并在智能語音助手系統(tǒng)的顯示界面上顯示執(zhí)行結(jié)果為成功,從而能提高語音識別效率,實現(xiàn)語音控制計算機,使得計算機操作自動化,智能化,使計算機使用更簡潔、方便、快捷、省時。方便了老人,殘疾人,使語音控制達到日常應(yīng)用程度,實現(xiàn)了語音識別準確,提高了語音識別率,將日常人工操作的鍵盤,鼠標動作規(guī)范程序化,實現(xiàn)了個人機語音控制自動化完成各種各樣任務(wù),省略人工手工鍵盤鼠標一步步操作,且語音控制計算機執(zhí)行速度比手工操作快。

在上述技術(shù)方案的基礎(chǔ)上,本發(fā)明還可以做如下改進。

進一步地,在步驟2和步驟3之間,還包括:

步驟23、根據(jù)所述用戶輸入的第二操作指令對所述語音命令詞條進行語音識別測試,若通過語音識別測試,則將所述語音命令詞條存儲至所述語音配置文件中;若未通過語音識別測試,則刪除所述語音命令詞條。

進一步地,在步驟2中,還包括:將所述語音命令顯示在所述智能語音助手系統(tǒng)的顯示界面的第一區(qū)域;在步驟23中,還包括:若通過語音識別測試,則將所述語音命令詞條顯示在所述智能語音助手系統(tǒng)的顯示界面的第二區(qū)域。

進一步地,在步驟3中還包括:若不匹配,則在所述智能語音助手系統(tǒng)的顯示界面上顯示執(zhí)行結(jié)果為失敗。

進一步地,所述語音配置文件包括語音命令詞條庫,所述語音命令詞條庫根據(jù)所述用戶的需求建立,所述鼠標鍵盤配置文件包括:網(wǎng)頁地址、程序路徑和程序名,以及執(zhí)行所述程序時鼠標/鍵盤操作的具體動作、鼠標操作的位置信息、鼠標/鍵盤操作的等待時間,其中,所述鼠標操作的具體動作包括:移動、雙擊、左擊和右擊,所述鍵盤操作的具體動作包括:輸入、回車和ESC。

進一步地,還包括:步驟4、當(dāng)程序運行出現(xiàn)錯誤時,在所述智能語音助手系統(tǒng)的顯示界面上顯示出錯信息,且所述智能語音助手系統(tǒng)停止運行。

進一步地,在步驟4中,還包括:判斷當(dāng)前運行的程序所對應(yīng)的窗口是否處于打開狀態(tài),若是,則判斷所述窗口的窗口名稱是否為所述鼠標鍵盤配置文件中設(shè)定的窗口名稱,若不是,則確定程序運行出現(xiàn)錯誤。

進一步地,所述鼠標操作的位置信息通過所述智能語音助手系統(tǒng)中的鼠標坐標定位系統(tǒng)獲取。

進一步地,當(dāng)所述鼠標坐標定位系統(tǒng)接收到所述用戶輸入的對鍵盤“F1”的操作指令時,在所述鼠標坐標定位系統(tǒng)的顯示界面的第一區(qū)域顯示鼠標的當(dāng)前位置信息(X、Y);

或者,當(dāng)所述鼠標坐標定位系統(tǒng)接收到所述用戶輸入的對鍵盤“F2”的操作指令時,則強制退出所述鼠標坐標定位系統(tǒng);

或者,當(dāng)所述鼠標坐標定位系統(tǒng)接收到所述用戶輸入的對鍵盤“F3”的操作指令時,在所述鼠標坐標定位系統(tǒng)的顯示界面的第二區(qū)域顯示當(dāng)前窗口的名稱。

本發(fā)明附加的方面的優(yōu)點將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本發(fā)明實踐了解到。

附圖說明

為了更清楚地說明本發(fā)明實施例的技術(shù)方案,下面將對本發(fā)明實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面所描述的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。

圖1為本發(fā)明實施例提供的一種智能語音助手系統(tǒng)的示意性結(jié)構(gòu)框圖;

圖2為圖1中所示的顯示界面110的示意圖;

圖3為本發(fā)明另一實施例提供的一種智能語音助手系統(tǒng)的示意性結(jié)構(gòu)框圖;

圖4為圖3中所示的鼠標坐標定位系統(tǒng)150包括的顯示界面的示意圖;

圖5為本發(fā)明實施例提供的一種語音控制計算機的方法的示意性流程圖;

圖6為本發(fā)明另一實施例提供的一種語音控制計算機的方法的示意性流程圖;

圖7為本發(fā)明另一實施例提供的一種語音控制計算機的方法的示意性流程圖。

具體實施方式

下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例是本發(fā)明的一部分實施例,而不是全部實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動的前提下所獲得的所有其他實施例,都應(yīng)屬于本發(fā)明保護的范圍。

圖1給出了本發(fā)明實施例提供的一種智能語音助手系統(tǒng)100的示意性結(jié)構(gòu)框圖。如圖1所示的智能語音助手系統(tǒng)100包括:顯示界面110、存儲器120、語音采集器130和處理器140。其中,

顯示界面110用于接收用戶輸入的第一操作指令。其中,第一操作指令用于開啟該智能語音助手系統(tǒng)100。存儲器120用于存儲語音配置文件和鼠標鍵盤配置文件。語音采集器130用于采集用戶輸入的語音命令,并將該語音命令傳輸至處理器140。

處理器140用于將語音命令轉(zhuǎn)化為對應(yīng)的語音命令詞條,并調(diào)用存儲器130中的語音配置文件,將語音命令詞條與語音配置文件中的詞條進行匹配。若匹配,則調(diào)用存儲器130中的鼠標鍵盤配置文件中與語音命令詞條對應(yīng)的程序操作序列控制程序運行。顯示界面110還用于顯示執(zhí)行結(jié)果為成功。通過一條語音命令控制計算機執(zhí)行序列“連續(xù)”的多步驟工作。

上述實施例中提供的一種智能語音助手系統(tǒng),在開啟智能語音助手系統(tǒng)后,通過將接收的用戶輸入的語音命令轉(zhuǎn)化為對應(yīng)的語音命令詞條,并將語音命令詞條與智能語音助手系統(tǒng)中存儲的語音配置文件中的詞條進行匹配,若匹配,則調(diào)用智能語音助手系統(tǒng)中存儲的鼠標鍵盤配置文件中與語音命令詞條對應(yīng)的程序操作序列控制程序運行,并在智能語音助手系統(tǒng)的顯示界面上顯示執(zhí)行結(jié)果為成功,從而能提高語音識別效率,實現(xiàn)語音控制計算機,使得計算機操作自動化,智能化,使計算機使用更簡潔、方便、快捷、省時。方便了老人,殘疾人,使語音控制達到日常應(yīng)用程度,實現(xiàn)了語音識別準確,提高了語音識別率,將日常人工操作的鍵盤,鼠標動作規(guī)范程序化,實現(xiàn)了個人機語音控制自動化完成各種各樣任務(wù),省略人工手工鍵盤鼠標一步步操作,且語音控制計算機執(zhí)行速度比手工操作快。

同時,由于微軟是用顯示編號來確定焦點表示菜單的,所以在一打開菜單中往往無法打開下一層菜單。而本發(fā)明提供的一種智能語音助手系統(tǒng)可以實現(xiàn)即時打開下一層菜單,即在新打開窗口下打開下一層菜單,從而能通過用戶測試過的不同語音命令,實現(xiàn)復(fù)雜的計算機自動操作,省時,省力、可靠。

具體的,在該實施例中,語音配置文件可以包括語音命令詞條庫,語音命令詞條庫根據(jù)用戶的需求建立,另外,用戶還可以根據(jù)自身發(fā)音和具體需求確定可識別的語音命令。本發(fā)明實施例中采用語義相同,但語音識別率高的語音命令詞條存入語音命令詞條詞庫,使得語音命令識別成功率明顯提高,且更新方便靈活,可靠性好。

例如,用戶經(jīng)常使用的語音命令詞條可以包括“你好、yes、no、確定、取消、界面、雙擊、計算機、測試、打開文本文件、word文檔、哈爾濱到新鄉(xiāng)地圖、哈爾濱到河南陳堡村地圖、中央氣象臺衛(wèi)星云圖、高空圖、云圖、高德地圖、我的信箱、163、700、哈爾濱到南京地圖、文檔、百度、地面圖、紅外衛(wèi)星云圖、高空圖700、高空圖500、高空圖850、計算機C盤、恢復(fù)、窗口最小化、關(guān)閉、存盤、不保存、否、不是、是、向上翻、向下翻、greet、啟動Micaps、打開Micaps、打開網(wǎng)易、網(wǎng)易新聞1、網(wǎng)易新聞2、網(wǎng)易新聞3、網(wǎng)易新聞4、網(wǎng)易新聞5”等等,則語音配置文件中的語音命令詞條庫至少要包括上述語音命令詞條。

應(yīng)理解,這里僅僅是以一個用戶的使用習(xí)慣和語音命令的使用頻率來列舉的語音命令詞條,只是舉例來說明本發(fā)明實施例的技術(shù)方案,并不對本發(fā)明實施例構(gòu)成任何限定。

鼠標鍵盤配置文件可以包括:網(wǎng)頁地址、程序路徑和程序名,以及執(zhí)行程序時鼠標/鍵盤操作的具體動作、鼠標操作的位置信息、鼠標/鍵盤操作的等待時間。其中,鼠標操作的具體動作包括:移動、雙擊、左擊和右擊。鍵盤操作的具體動作包括:輸入、回車和ESC。

例如,語音命令為“百度”則,鼠標鍵盤配置文件可以包括“打開www.baidu.com、等待第一時間、判斷活動窗口是否為百度一下,你就知道-2345加速瀏覽器8.2、等待第二時間進行判斷,若在第二時間內(nèi)找不到www.baidu.com的窗口名稱,則程序自動退出;若在第二時間內(nèi)找到www.baidu.com的窗口名稱,則窗口最大化,即將當(dāng)前窗口最大化,等待第三時間、左擊百度搜索wenbenkuang、等待第四時間、輸入“南京”、等待第五時間、左擊百度搜索、移動鼠標到(X、Y)。

應(yīng)理解,這里僅僅是以語音命令為“百度”為例來說明本發(fā)明實施例的技術(shù)方案,并不對本發(fā)明實施例構(gòu)成任何限定。另外,上述各個等待時間均為毫秒兩級。

還應(yīng)理解,在該實施例中,語音配置文件和鼠標鍵盤配置文件均可以為“.txt”格式的文本文件,通過記事本打開,方便用戶隨時查看,修改、編輯和保存。

需要說明的是,在該實施例中,語音采集器140采用教師和/或?qū)в嗡玫谋銛y式擴音器所帶耳機式麥克風(fēng)與桌面麥克結(jié)合使用,使得聲卡的音頻輸入功效提高,因此在使用智能語音助手系統(tǒng)時,使用日常說話音量即可,不用非大聲說或喊不可,從而解決了由于沒有功放麥克音量偏小影響語音識別的問題。

可選地,在一個實施例中,顯示界面110還用于接收用戶輸入的第二操作指令,并將第二操作指令傳輸至處理器140。其中,該第二操作指令用于指示處理器140對語音命令詞條進行語音識別測試。處理器140還用于根據(jù)第二操作指令對語音命令詞條進行語音識別測試,若通過語音識別測試,則將語音命令詞條傳輸至存儲器130。若未通過語音識別測試,則刪除語音命令詞條。存儲器130還用于將語音命令詞條存儲至語音配置文件中。

具體的,在該實施例中,顯示界面110還用于其第一區(qū)域顯示語音命令且當(dāng)通過語音識別測試時,在其第二區(qū)域顯示語音命令詞條。應(yīng)理解,在該實施例中,第一區(qū)域和第二區(qū)域是不同的區(qū)域,且兩個區(qū)域不重合。例如,顯示界面110的各個顯示區(qū)域可以如圖2所示。

從圖2中可以看出,語音命令可以顯示在“1”所標示的區(qū)域;語音命令詞條可以顯示在“2”所標示的區(qū)域;執(zhí)行結(jié)果則可以顯示在“3”所標示的區(qū)域?!?”標示的區(qū)域為指示語音音量大小的音量條。

如圖2所示的顯示界面110上設(shè)置的“打開語音助手”和“開始詞條測試”兩個功能按鍵的功能是互斥的,也就是說,各自獨立開始或結(jié)束詞條測試,打開或關(guān)閉語音助手。

另外,顯示界面110上還可以顯示智能語音助手系統(tǒng)與用戶之間的互動交流信息,這樣可以提供用戶體驗。例如:語音命令為“您好”,則在“1”所標示的區(qū)域顯示“您好”,且在“3”所標示的區(qū)域顯示“您好,智能語音助手祝您健康”。再如:語音命令為“智能語音助手”,則在“1”所標示的區(qū)域顯示“智能語音助手”,且在“3”所標示的區(qū)域顯示“智能語音助手,祝您工作愉快”。再如:語音命令為“節(jié)日快樂”,則在“1”所標示的區(qū)域顯示“節(jié)日快樂”,且在“3”所標示的區(qū)域顯示“智能語音助手,祝您節(jié)日快樂”。應(yīng)理解,這里圖2所示的顯示界面的布局僅僅是舉例說明本發(fā)明實施例的技術(shù)方案,并不對本發(fā)明實施例構(gòu)成任何限定。

需要說明的是,在該實施例中,若未通過語音識別測試,則顯示界面110的第二區(qū)域內(nèi)沒有顯示該語音命令詞條,則用戶可以將語音配置文件中的相關(guān)內(nèi)容進行刪除。

可選地,在一個實施例中,當(dāng)語音命令詞條與語音配置文件中的詞條不匹配時,顯示界面還用于顯示執(zhí)行結(jié)果為失敗??蛇x地,在一個實施例中,當(dāng)程序運行出現(xiàn)錯誤時,顯示界面110還用于顯示出錯信息,且智能語音助手系統(tǒng)停止運行。這樣可以避免在程序運行出現(xiàn)錯誤后,接著執(zhí)行不必要的操作。

可選地,在一個實施例中,處理器140還用于判斷當(dāng)前運行的程序所對應(yīng)的窗口是否處于打開狀態(tài),若是,則判斷該窗口的窗口名稱是否為鼠標鍵盤配置文件中設(shè)定的窗口名稱,若不是,則確定程序運行出現(xiàn)錯誤。

上述實施例提供的智能語音助手系統(tǒng),可以使得每個最新打開窗口都最大化,這樣最新打開的窗口中鼠標的操作位置坐標每次啟動程序,鼠標坐標都相同,確保了鼠標操作的可靠性。

可選地,在一個實施例中,如圖3所示,智能語音助手系統(tǒng)100還包括:鼠標坐標定位系統(tǒng)150。鼠標坐標定位系統(tǒng)150包括顯示界面151。顯示界面151用于接收用戶輸入的對鍵盤的操作指令,并將操作指令傳輸至處理器140。處理器140還用于根據(jù)操作指令獲取鼠標操作的位置信息。

具體的,在該實施例中,當(dāng)鼠標坐標定位系統(tǒng)150的顯示界面151接收到用戶輸入的對鍵盤“F1”的操作指令時,在鼠標坐標定位系統(tǒng)150的顯示界面151的第一區(qū)域顯示鼠標的當(dāng)前位置信息(X、Y)。當(dāng)鼠標坐標定位系統(tǒng)150的顯示界面151接收到用戶輸入的對鍵盤“F2”的操作指令時,強制退出鼠標坐標定位系統(tǒng)150。這是為了避免獲取鼠標位置坐標時,產(chǎn)生鼠標被死鎖的問題。當(dāng)鼠標坐標定位系統(tǒng)150接收到用戶輸入的對鍵盤“F3”的操作指令時,在鼠標坐標定位系統(tǒng)150的顯示界面151的第二區(qū)域顯示當(dāng)前窗口的名稱。

應(yīng)理解,在該實施例中,顯示界面151的第一區(qū)域和第二區(qū)域是不同的區(qū)域,且兩個區(qū)域不重合。例如,顯示界面151的各個顯示區(qū)域可以如圖4所示。從圖4中可以看出,鼠標的當(dāng)前位置信息(X、Y)可以顯示在“1”所標示的區(qū)域;當(dāng)前窗口的名稱可以顯示在“2”所標示的區(qū)域。

上文結(jié)合圖1至圖4對本發(fā)明實施例提供的一種智能語音助手系統(tǒng)進行了詳細的描述,下面結(jié)合圖5至圖7,對本發(fā)明實施例提供的一種語音控制計算機的方法的技術(shù)方案進行詳細的描述。

應(yīng)理解,本發(fā)明實施例中的計算機安裝了上文各實施例中描述的智能語音助手系統(tǒng)100。

圖5給出了本發(fā)明實施例提供的一種語音控制計算機的方法200的示意性流程圖。如圖5所示的語音控制計算機的方法200包括:

210、根據(jù)用戶輸入的第一操作指令開啟智能語音助手系統(tǒng),智能語音助手系統(tǒng)中已存儲語音配置文件和鼠標鍵盤配置文件。

220、接收用戶輸入的語音命令,并將語音命令轉(zhuǎn)化為對應(yīng)的語音命令詞條。

230、將語音命令詞條與語音配置文件中的詞條進行匹配,若匹配,則調(diào)用鼠標鍵盤配置文件中與語音命令詞條對應(yīng)的程序操作序列控制程序運行,并在智能語音助手系統(tǒng)的顯示界面上顯示執(zhí)行結(jié)果為成功。

上述實施例中提供的一種語音控制計算機的方法,在開啟智能語音助手系統(tǒng)后,通過將接收的用戶輸入的語音命令轉(zhuǎn)化為對應(yīng)的語音命令詞條,并將語音命令詞條與智能語音助手系統(tǒng)中存儲的語音配置文件中的詞條進行匹配,若匹配,則調(diào)用智能語音助手系統(tǒng)中存儲的鼠標鍵盤配置文件中與語音命令詞條對應(yīng)的程序操作序列控制程序運行,并在智能語音助手系統(tǒng)的顯示界面上顯示執(zhí)行結(jié)果為成功,從而能提高語音識別效率,實現(xiàn)語音控制計算機,使得計算機操作自動化,智能化,使計算機使用更簡潔、方便、快捷、省時。方便了老人,殘疾人,使語音控制達到日常應(yīng)用程度,實現(xiàn)了語音識別準確,提高了語音識別率,將日常人工操作的鍵盤,鼠標動作規(guī)范程序化,實現(xiàn)了個人機語音控制自動化完成各種各樣任務(wù),省略人工手工鍵盤鼠標一步步操作,且語音控制計算機執(zhí)行速度比手工操作快。

同時,由于微軟是用顯示編號來確定焦點表示菜單的,所以在一打開菜單中往往無法打開下一層菜單。而本發(fā)明提供的一種智能語音助手系統(tǒng)可以實現(xiàn)即時打開下一層菜單,即在新打開窗口下打開下一層菜單,從而能通過用戶測試過的不同語音命令,實現(xiàn)復(fù)雜的計算機自動操作,省時,省力、可靠。

具體的,在該實施例中,在步驟210中,語音配置文件可以包括語音命令詞條庫,語音命令詞條庫根據(jù)用戶的需求建立。本發(fā)明實施例中采用語義相同,但語音識別率高的語音命令詞條存入語音命令詞條詞庫,使得語音命令識別成功率明顯提高,且更新方便靈活,可靠性好。

鼠標鍵盤配置文件可以包括:網(wǎng)頁地址、程序路徑和程序名,以及執(zhí)行程序時鼠標/鍵盤操作的具體動作、鼠標操作的位置信息、鼠標/鍵盤操作的等待時間。其中,鼠標操作的具體動作包括:移動、雙擊、左擊和右擊。鍵盤操作的具體動作包括:輸入、回車和ESC。

在步驟220中,還可以將語音命令顯示在智能語音助手系統(tǒng)的顯示界面的第一區(qū)域。在步驟230中,若不匹配,則在智能語音助手系統(tǒng)的顯示界面上顯示執(zhí)行結(jié)果為失敗。

可選地,在一個實施例中,如圖6所示,在步驟220和步驟230之間,方法200還包括:

225、根據(jù)用戶輸入的第二操作指令對語音命令詞條進行語音識別測試,若通過語音識別測試,則將語音命令詞條存儲至語音配置文件中。若未通過語音識別測試,則刪除語音命令詞條。

具體的,在該實施例中,若通過語音識別測試,則將語音命令詞條顯示在智能語音助手系統(tǒng)的顯示界面的第二區(qū)域。

可選地,在一個實施例中,如圖7所示,方法200還包括:

240、當(dāng)程序運行出現(xiàn)錯誤時,在智能語音助手系統(tǒng)的顯示界面上顯示出錯信息,且智能語音助手系統(tǒng)停止運行。

具體的,在該實施例中,判斷當(dāng)前運行的程序所對應(yīng)的窗口是否處于打開狀態(tài),若是,則判斷該窗口的窗口名稱是否為鼠標鍵盤配置文件中設(shè)定的窗口名稱,若不是,則確定程序運行出現(xiàn)錯誤。

應(yīng)理解,在另一個實施例中,可以同時包括步驟210、步驟220、步驟225、步驟230和步驟240,這里僅僅是為了描述的簡潔,不再贅述各個步驟的具體內(nèi)容。

可選地,在一個實施例中,鼠標操作的位置信息通過智能語音助手系統(tǒng)中的鼠標坐標定位系統(tǒng)獲取。

具體的,在該實施例中,當(dāng)鼠標坐標定位系統(tǒng)接收到用戶輸入的對鍵盤“F1”的操作指令時,在鼠標坐標定位系統(tǒng)的顯示界面的第一區(qū)域顯示鼠標的當(dāng)前位置信息(X、Y)。當(dāng)鼠標坐標定位系統(tǒng)接收到用戶輸入的對鍵盤“F2”的操作指令時,則強制退出鼠標坐標定位系統(tǒng)。當(dāng)鼠標坐標定位系統(tǒng)接收到用戶輸入的對鍵盤“F3”的操作指令時,在鼠標坐標定位系統(tǒng)的顯示界面的第二區(qū)域顯示當(dāng)前窗口的名稱。

應(yīng)理解,在本發(fā)明各實施例中,上述各過程的序號的大小并不意味著執(zhí)行順序的先后,各過程的執(zhí)行順序應(yīng)以其功能和內(nèi)在邏輯確定,而不應(yīng)對本發(fā)明實施例的實施過程構(gòu)成任何限定。

還應(yīng)理解,在本發(fā)明實施例中,根據(jù)本發(fā)明實施例的語音控制計算機的方法200的執(zhí)行可對應(yīng)于根據(jù)本發(fā)明實施例的智能語音助手系統(tǒng)100,并且該智能語音助手系統(tǒng)100中的各個模塊的上述和其它操作和/或功能分別為了實現(xiàn)圖5至圖7中的各個方法的相應(yīng)流程,為了簡潔,在此不再贅述。

另外,本文中術(shù)語“和/或”,僅僅是一種描述關(guān)聯(lián)對象的關(guān)聯(lián)關(guān)系,表示可以存在三種關(guān)系,例如,A和/或B,可以表示:單獨存在A,同時存在A和B,單獨存在B這三種情況。另外,本文中字符“/”,一般表示前后關(guān)聯(lián)對象是一種“或”的關(guān)系。

本領(lǐng)域普通技術(shù)人員可以意識到,結(jié)合本文中所公開的實施例描述的各示例的單元及算法步驟,能夠以電子硬件、計算機軟件或者二者的結(jié)合來實現(xiàn),為了清楚地說明硬件和軟件的可互換性,在上述說明中已經(jīng)按照功能一般性地描述了各示例的組成及步驟。這些功能究竟以硬件還是軟件方式來執(zhí)行,取決于技術(shù)方案的特定應(yīng)用和設(shè)計約束條件。專業(yè)技術(shù)人員可以對每個特定的應(yīng)用來使用不同方法來實現(xiàn)所描述的功能,但是這種實現(xiàn)不應(yīng)認為超出本發(fā)明的范圍。

所屬領(lǐng)域的技術(shù)人員可以清楚地了解到,為了描述的方便和簡潔,上述描述的系統(tǒng)、裝置和單元的具體工作過程,可以參考前述方法實施例中的對應(yīng)過程,在此不再贅述。

在本申請所提供的幾個實施例中,應(yīng)該理解到,所揭露的系統(tǒng)、裝置和方法,可以通過其它的方式實現(xiàn)。例如,以上所描述的裝置實施例僅僅是示意性的,例如,單元的劃分,僅僅為一種邏輯功能劃分,實際實現(xiàn)時可以有另外的劃分方式,例如多個單元或組件可以結(jié)合或者可以集成到另一個系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另外,所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口、裝置或單元的間接耦合或通信連接,也可以是電的,機械的或其它的形式連接。

作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網(wǎng)絡(luò)單元上??梢愿鶕?jù)實際的需要選擇其中的部分或者全部單元來實現(xiàn)本發(fā)明實施例方案的目的。

另外,在本發(fā)明各個實施例中的各功能單元可以集成在一個處理單元中,也可以是各個單元單獨物理存在,也可以是兩個或兩個以上單元集成在一個單元中。上述集成的單元既可以采用硬件的形式實現(xiàn),也可以采用軟件功能單元的形式實現(xiàn)。

集成的單元如果以軟件功能單元的形式實現(xiàn)并作為獨立的產(chǎn)品銷售或使用時,可以存儲在一個計算機可讀取存儲介質(zhì)中?;谶@樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻的部分,或者該技術(shù)方案的全部或部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機軟件產(chǎn)品存儲在一個存儲介質(zhì)中,包括若干指令用以使得一臺計算機設(shè)備(可以是個人計算機,服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個實施例方法的全部或部分步驟。而前述的存儲介質(zhì)包括:U盤、移動硬盤、只讀存儲器(ROM,Read-Only Memory)、隨機存取存儲器(RAM,Random Access Memory)、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。

以上,僅為本發(fā)明的具體實施方式,但本發(fā)明的保護范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到各種等效的修改或替換,這些修改或替換都應(yīng)涵蓋在本發(fā)明的保護范圍之內(nèi)。因此,本發(fā)明的保護范圍應(yīng)以權(quán)利要求的保護范圍為準。

當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1