專利名稱:語音鼠標裝置的制作方法
技術領域:
本發(fā)明涉及信息處理技術領域,尤其涉及一種語音鼠標裝置。
背景技術:
目前,在計算機操作中,常用的鼠標鍵盤人機交互模式是計算機用戶通過雙手敲擊鍵盤,移動和點擊鼠標來達到人機交互的目的?,F有技術中鼠標按其工作原理的不同可以分為兩種,一種是機械鼠標,另一種是光電鼠標。機械鼠標包括一個可四向滾動的膠質小球。這個小球在滾動時會帶動一對轉軸轉動,在轉軸的末端都有一個圓形的譯碼輪,譯碼輪上附有金屬導電片與電刷直接接觸。當轉軸轉動時,這些金屬導電片與電刷就會依次接觸,出現“接通”或“斷開”兩種形態(tài),前者對應二進制數“ I ”,后者對應二進制數“ O ”。這些二進制信號被送交鼠標內部的專用芯片作解析處理并產生對應的坐標變化信號。只要鼠標在平面上移動,小球就會帶動轉軸轉動,進而使譯碼輪的通斷情況發(fā)生變化,產生一組組不同的坐標偏移量,反應到屏幕上,就是光標可隨著鼠標的移動而移動。光電鼠標是在內部有一個發(fā)光二極管,通過該發(fā)光二極管發(fā)出的光線照亮光電鼠標底部表面,然后將光電鼠標底部表面反射回的一部分光線,經過一組光學透鏡,傳輸到微成像器內成像。這樣,當光電鼠標移動時,其移動軌跡便會被記錄為一組高速拍攝的連貫圖像。最后利用光電鼠標內部的數字微處理器對移動軌跡上攝取的一系列圖像進行分析處理,通過對這些圖像上特征點位置的變化進行分析,來判斷鼠標的移動方向和移動距離,從而完成光標的定位。但是,這兩種物理鼠標都要求計算機用戶用手進行操作。一方面,對于手部傷殘人士、老年人等人群無法靈活地操作或不方便操作普通的鼠標;另一方面,對于健康人士,存在一些場合不方便操作鼠標但又必須使用電腦的情況,或者長時間使用鼠標會帶來肩肘腕等身體部位的疲勞感,不利于身體健康。類似地,在使用手機、電視遙控器等嵌入式設備時,也存在上述缺陷。此外,某些嵌入式設備(如:車載設備)不具備使用鼠標的條件。
發(fā)明內容
本發(fā)明解決的問題是提供一種語音鼠標裝置,以提高用戶的體驗效果。為解決上述問題,本發(fā)明提供了一種語音控制裝置,包括:語音輸入模塊,用于接收語音信息;語音引擎模塊,連接語音輸入模塊,用于對接收的語音信息進行識別處理,得到對應的語音特征信息;鼠標啟動模塊,連接語音引擎模塊,在所述語音特征信息中包含與鼠標啟動指令對應的語音特征信息時,啟動鼠標執(zhí)行模塊;鼠標執(zhí)行模塊,連接鼠標啟動模塊和語音弓I擎模塊,啟動后,在所述語音特征信息中包含與鼠標操作指令對應的語音特征信息時,執(zhí)行所述鼠標操作指令??蛇x地,所述語音鼠標裝置還包括:顯示屏,連接鼠標執(zhí)行模塊,用于接收和顯示執(zhí)行后的所述鼠標操作指令;所述鼠標執(zhí)行模塊啟動后自動執(zhí)行分屏編號指令,所述分屏編號指令用于將顯示屏分為多個子屏,且對每個子屏進行編號??蛇x地,所述語音輸入模塊為麥克風??蛇x地,所述語音輸入模塊通過USB接口或藍牙設備將接收的語音信息發(fā)送給所述語音引擎模塊??蛇x地,所述語音引擎模塊包括:語音識別模塊,連接語音輸入模塊,用于對接收的語音信息進行識別處理,得到接收的語音特征信息;語音特征庫,用于存儲多個語音特征信息;搜索模塊,連接語音特征庫、語音識別模塊、鼠標啟動模塊和鼠標執(zhí)行模塊,提取接收的語音特征信息和存儲的語音特征信息,從存儲的語音特征信息中搜索與接收的語音特征信息對應的語音特征信息,并將搜索到的語音特征信息發(fā)送給所述鼠標啟動模塊和鼠標執(zhí)行模塊。可選地,所述語音識別模塊包括:采集單元,連接語音輸入模塊,用于采集語音信息;過濾單元,連接采集單元,用于對采集的信息進行過濾處理,得到濾除噪聲后的語音信息;頻譜分析單元,連接過濾單元和搜索模塊,用于對濾除噪聲后的語音信息進行頻率分析,得到接收的語音特征信息,且將接收的語音特征信息發(fā)送給搜索模塊??蛇x地,所述鼠標啟動模塊包括:鼠標啟動指令集,用于存儲一個或多個鼠標啟動指令;啟動執(zhí)行模塊,連接鼠標啟動指令集、語音引擎模塊和鼠標執(zhí)行模塊,從語音引擎模塊提取語音特征信息,從鼠標啟動指令集中搜索出與所述語音特征信息對應的鼠標啟動指令時,啟動鼠標執(zhí)行模塊??蛇x地,所述鼠標執(zhí)行模塊包括:鼠標操作指令集,用于存儲多個鼠標操作指令;調用模塊,連接鼠標操作指令集、鼠標啟動模塊和語音引擎模塊,從語音引擎模塊提取語音特征信息,從鼠標操作指令集中搜索出與所述語音特征信息對應的鼠標操作指令時,調用和執(zhí)行所述鼠標操作指令。可選地,所述語音鼠標裝置還包括:編輯模塊,連接鼠標操作指令集,用于對所述鼠標操作指令進行修改、添加或刪除處理??蛇x地,所述語音鼠標裝置還包括:確認模塊,連接所述調用模塊,用于詢問用戶是否確認,并基于用戶的回復信息控制調用模塊進行相應的操作??蛇x地,所述語音鼠標裝置還包括:語音播報裝置,連接所述確認模塊,用于將所述詢問用戶是否確認的信息轉換為語音信息,并播報所述語音信息。可選地,所述語音鼠標裝置還包括:顯示屏,連接所述確認模塊,用于將所述詢問用戶是否確認的信息轉換為文本信息,并顯示所述文本信息??蛇x地,所述鼠標操作指令包括:通用操作指令和自定義操作指令;所述自定義操作指令包括分屏編號指令??蛇x地,所述語音鼠標裝置還包括:計時模塊,用于計時;控制模塊,連接鼠標啟動模塊、鼠標執(zhí)行模塊和計時模塊,當鼠標啟動模塊啟動鼠標執(zhí)行模塊時,關閉鼠標啟動模塊;并控制計時模塊記錄鼠標執(zhí)行模塊未執(zhí)行鼠標操作指令的持續(xù)時間,當所述持續(xù)時間大于閾值時間時,關閉鼠標執(zhí)行模塊,并開啟鼠標啟動模塊。
可選地,所述語音鼠標裝置為電視、電腦、車載設備或手機。與現有技術相比,本發(fā)明具有以下優(yōu)點:通過語音替代基于鼠標的人機交互模式,從而提供了一種更便捷的控制模式。一方面,克服了手部傷殘人士、老年人等人群無法靈活地操作或不方便操作普通的鼠標的問題,對其使用嵌入式設備有很大幫助。另一方面,對于正常人可以是原來僅能用于操作鼠標的手進行其他活動,還可以緩解用手進行鼠標操作帶來的肩肘腕等身體部位的疲勞,從而提高計算機操作的效率,增加簡便性,且利于使用者的身體健康。此外,還克服了車載設備等不具備使用鼠標條件的缺陷。
圖1是本發(fā)明實施例一中語音鼠標裝置的結構示意圖;圖2是圖1中語音引擎模塊的結構示意圖;圖3是圖2中語音識別模塊的結構示意圖;圖4是圖1中鼠標啟動模塊的結構示意圖;圖5是圖1中鼠標執(zhí)行模塊的結構示意圖;圖6是本發(fā)明實施例二中語音鼠標裝置的結構示意圖;圖7是本發(fā)明實施例三中語音鼠標裝置的結構示意圖。
具體實施例方式為使本發(fā)明的上述目的、特征和優(yōu)點能夠更加明顯易懂,下面結合附圖對本發(fā)明的具體實施方式
做詳細的說明。在下面的描述中闡述了很多具體細節(jié)以便于充分理解本發(fā)明,但是本發(fā)明還可以采用其他不同于在此描述的其它方式來實施,因此本發(fā)明不受下面公開的具體實施例的限制。正如背景技術部分所述,現有的物理鼠標不能解放用戶的手,不能為病殘人士所用。針對上述缺陷,本發(fā)明提供了一種語音鼠標裝置,通過語音替代基于鼠標的人機交互模式,從而提供了一種更便捷的控制模式。一方面,克服了手部傷殘人士、老年人等人群無法靈活地操作或不方便操作普通的鼠標的問題,對其使用嵌入式設備有很大幫助。另一方面,對于正常人可以是原來僅能用于操作鼠標的手進行其他活動,還可以緩解用手進行鼠標操作帶來的肩肘腕等身體部位的疲勞,從而提高計算機操作的效率,增加簡便性,且利于使用者的身體健康。下面結合附圖進行詳細說明。實施例一參考圖1所示,本實施例提供了一種語音鼠標裝置,包括:語音輸入模塊100,用于接收語音信息;語音引擎模塊200,連接語音輸入模塊100,用于對接收的語音信息進行識別處理,得到對應的語音特征信息;鼠標啟動模塊300,連接語音引擎模塊200,在所述語音特征信息中包含與鼠標啟動指令對應的語音特征信息時,啟動鼠標執(zhí)行模塊400 ;
鼠標執(zhí)行模塊400,連接鼠標啟動模塊300和語音引擎模塊200,啟動后,在所述語音特征信息中包含與鼠標操作指令對應的語音特征信息時,執(zhí)行所述鼠標操作指令。其中,所述語音鼠標裝置可以為包括:電視、電腦、車載設備、手機等需要輸入用戶控制指令的電子設備。為簡單起見,以下均以車載設備為例進行說明。鼠標操作需要獲取操作的位置信息,為了準確進行定位,本實施例中語音鼠標裝置還可以包括:顯示屏900,連接鼠標執(zhí)行模塊400,用于接收和顯示執(zhí)行后的所述鼠標操作指令;所述鼠標執(zhí)行模塊400啟動后自動執(zhí)行分屏編號指令,所述分屏編號指令用于將顯示屏900分為多個子屏,且對每個子屏進行編號。所述顯示模塊900可以為任意的顯示屏,如:液晶觸摸顯示屏。具體地,所述鼠標執(zhí)行模塊400啟動后,可以通過兩條相互垂直的直線將顯示屏900分為四個子屏,且對每個子屏進行編號,如:1、2、3和4;且將編號和直線以高透明的形式覆蓋于顯示屏900上。需要說明的是,在本發(fā)明的其他實施例中,還可以將顯示屏分為2個、3個、5個或5個以上的子屏,其不限制本發(fā)明的保護范圍。所述語音輸入模塊100可以為麥克風,用于接收車載用戶發(fā)送的語音信息,且將接收的語音信息發(fā)送給語音引擎模塊200。具體地,所述語音輸入模塊100可以設置在車載設備內部(如:內置麥克風);也可以設置在車載設備外部(如:外置麥克風),此時,所述語音輸入模塊100可以通過USB接口等有線通信方式將接收的語音信息發(fā)送給語音引擎模塊200,也可以通過藍牙設備等無線通信方法將接收的語音信息發(fā)送給所述語音引擎模塊200。此外,所述語音輸入模塊100可以包括開關,所述開關用于控制語音輸入模塊100的開啟和關閉。參考圖2所示,所述語音引擎模塊200可以包括:語音識別模塊210,連接語音輸入模塊100,用于對接收的語音信息進行識別處理,得到接收的語音特征信息;語音特征庫230,用于存儲多個語音特征信息;搜索模塊250,連接語音特征庫230、語音識別模塊210、鼠標啟動模塊300和鼠標執(zhí)行模塊400,提取語音識別模塊210接收的語音特征信息和語音特征庫230存儲的語音特征信息,從存儲的語音特征信息中搜索與接收的語音特征信息對應的語音特征信息,并將搜索到的語音特征信息發(fā)送給所述鼠標啟動模塊300和鼠標執(zhí)行模塊400。其中,所述語音識別模塊210采集語音輸入模塊100發(fā)送的語音信息,且采用現有技術任一種過濾技術對該語音信息進行過濾,然后過濾后的語音信息進行頻譜分析,得到該語音對應的語音特征信息,并將該語音特征信息發(fā)送給搜索模塊250。具體地,參考圖3所示,所述語音識別模塊210可以包括:采集單元211,連接語音輸入模塊100,用于采集語音信息;過濾單元213,連接采集單元211,用于對采集的信息進行過濾處理,得到濾除噪聲后的語音信息;頻譜分析單元215,連接過濾單元213和搜索模塊250,用于對濾除噪聲后的語音信息進行頻率分析,得到接收的語音特征信息,且將接收的語音特征信息發(fā)送給搜索模塊250。其中,所述語音特征庫230中存儲多個語音特征信息,如:各漢字的語音特征信息、各數字的語音特征信息、各英文字母的語音特征信息等。所述語音特征庫230中存儲的語音特征信息越多,語音引擎模塊200對語音信息識別的準確率越高。優(yōu)選地,所述語音特征庫230可以為自適應語音特征庫,這樣可以為車載設備的用戶建立自己的語音特征庫,提高識別率。所述自適應語音特征庫的建立過程對于本領域的技術人員是熟知的,在此不再贅述。參考圖4所示,所述鼠標啟動模塊300可以包括:鼠標啟動指令集310,用于存儲一個或多個鼠標啟動指令;啟動執(zhí)行模塊330,連接鼠標啟動指令集310、語音引擎模塊200和鼠標執(zhí)行模塊400,從語音引擎模塊200提取語音特征信息,從鼠標啟動指令集310中搜索出與所述語音特征信息對應的鼠標啟動指令時,啟動鼠標執(zhí)行模塊400。其中,所述鼠標啟動指令可以為一個,也可以為多個,其具體可以由用戶進行設置。如:“鼠標”、“啟動鼠標”、“打開鼠標”、“我的鼠標”、“語音鼠標”等都可以作為鼠標啟動指令。本實施例中當啟動執(zhí)行模塊330搜索發(fā)現語音引擎模塊200得到的語音特征信息與一個鼠標啟動指令對應時,便會向鼠標執(zhí)行模塊400發(fā)送啟動信息,以啟動鼠標執(zhí)行模塊400開始工作。當啟動鼠標執(zhí)行模塊400之后,便會在顯示屏900上出現一個指針,其可以與現有的物理鼠標顯示相同,其第一次可以設置在顯示屏900的中央,也可以設置在顯示屏900的左上、左下、右上或右下,其不限制本發(fā)明的保護范圍。參考圖5所示,所述鼠標執(zhí)行模塊400可以包括:鼠標操作指令集410,用于存儲多個鼠標操作指令;調用模塊430,連接鼠標操作指令集410、鼠標啟動模塊300和語音引擎模塊200,從語音引擎模塊200提取語音特征信息,從鼠標操作指令集410中搜索出與所述語音特征信息對應的鼠標操作指令時,調用和執(zhí)行所述鼠標操作指令。本實施例中所述啟動執(zhí)行模塊330可以連接所述調用模塊430,從而從鼠標啟動指令集310中搜索出與所述語音特征信息對應的鼠標啟動指令時,啟動執(zhí)行模塊330啟動調用模塊430。具體地,所述鼠標操作指令可以包括:通用操作指令和自定義操作指令。其中,所述通用操作指令指的是現有的物理鼠標中各個鼠標操作指令,如:左單擊、右單擊、左雙擊、向上滾動、向下滾動、停止?jié)L動、拖動等。所述自定義操作指令可以是針對不同的嵌入式設備設定的功能操作,如:“打開Word”表示打開word軟件,“打開TXT”表示打開txt編輯器,“打開導航”表示打開車載設備的導航儀,“移動到I”表示將鼠標移動到編號為I的子屏左下正中。需要說明的是,為了保證定位的準確性,所述自定義操作指令包括分屏編號指令,如:“分屏I”表示將編號為I的子屏進一步分為多個小子屏,且對每個小子屏進行編號,如:將子屏I分為四個小子屏,四個小子屏的編號可以為11、12、13和14。此時,分屏編號信息仍以高透明形式覆蓋于屏幕上。本實施例在選中某一子屏后,可以對該子屏進行放大處理,對其他子屏進行縮小處理。如:接收到“分屏I”之后,則將編號為I的子屏放大一倍,而將其他幾個子屏縮??;甚至,接收到“分屏I”之后,則使編號為I的子屏占據整個顯示屏900,這樣更利于用戶進行后續(xù)的操作。當用戶需要選中其他區(qū)域時,則可以通過“退出I”的語音指令返回四個子屏占據顯示屏900的界面。優(yōu)選地,所述語音鼠標裝置還可以包括:編輯模塊(圖中未示出),連接鼠標操作指令集410,用于對所述鼠標操作指令進行修改、添加或刪除處理,從而可以根據用戶的需求進行不同的設置。作為一個具體例子,車載設備上新安裝了一個游戲“憤怒的小鳥”,則可以通過編輯模塊對鼠標操作指令集410進行添加處理,如:將“打開小鳥”對應的語言特征信息與打開憤怒的小鳥游戲的操作指令相對應,從而在識別到用戶的“打開小鳥”的語音特征信息時,則鼠標執(zhí)行模塊400自動打開憤怒的小鳥游戲。此外,再次參考圖1所示,所述語音鼠標裝置還可以包括:計時模塊500,用于計時;控制模塊600,連接鼠標啟動模塊300、鼠標執(zhí)行模塊400和計時模塊500,當鼠標啟動模塊300啟動鼠標執(zhí)行模塊400時,關閉鼠標啟動模塊300 ;并控制計時模塊500記錄鼠標執(zhí)行模塊400未執(zhí)行鼠標操作指令的持續(xù)時間,當所述持續(xù)時間大于閾值時間時,關閉鼠標執(zhí)7Txt旲塊400,并開啟鼠標啟動t旲塊300。本實施例中控制模塊600可以連接啟動執(zhí)行模塊330和調用模塊430,當控制模塊600得到啟動執(zhí)行模塊330啟動調用模塊430時,控制模塊600關閉啟動執(zhí)行模塊330 ;當計時模塊500獲取的鼠標執(zhí)行模塊400未執(zhí)行任何操作指令的連續(xù)持續(xù)時間大于閾值時間時,控制模塊600關閉調用模塊430,且重新開啟啟動執(zhí)行模塊330。其中,所述閾值時間可以是設置的任意時間,如:5分鐘、10分鐘等。通過設置計時豐旲塊500和控制|旲塊600可以減少鼠標執(zhí)行|旲塊400和鼠標啟動|旲塊300的功耗,且提聞語音操作的準確性。本實施例中語音鼠標裝置的具體工作過程如下:I)用戶通過語音輸入模塊100輸入語音控制信息,如:“鼠標”;2)語音引擎模塊200對“鼠標”進行識別處理,得到對應的語音特征信息,并將對應的語音特征信息發(fā)送給鼠標啟動模塊300和鼠標執(zhí)行模塊400 ;3)鼠標啟動模塊300中包括的鼠標啟動指令與所述語音特征信息相對應,則啟動鼠標執(zhí)行模塊400 ;同時,控制模塊600關閉鼠標啟動模塊300 ;此時,語音引擎模塊200得到的語音特征信息只發(fā)送給鼠標執(zhí)行模塊400 ;鼠標執(zhí)行模塊400啟動后,將顯示屏900自動分為四個子屏,且對每個子屏進行編號;4)用戶繼續(xù)通過語音輸入模塊100輸入語音控制信息,如:“分屏3” ;5)語音引擎模塊200對“分屏3”進行識別處理,得到對應的語音特征信息,并將對應的語音特征信息發(fā)送給鼠標執(zhí)行模塊400 ;6)鼠標執(zhí)行模塊400根據接收到的語音特征信息,調用對應的鼠標操作指令,將子屏3分為四個小子屏,且對每個小子屏進行編號,如:31、32、33和34 ;7)用戶繼續(xù)通過語音輸入模塊100輸入語音控制信息,如:“移動到33” ;8)語音引擎模塊200對“移動到33”進行識別處理,得到對應的語音特征信息,并將對應的語音特征信息發(fā)送給鼠標執(zhí)行模塊400 ;9)鼠標執(zhí)行模塊400根據接收到的語音特征信息,調用對應的鼠標操作指令,將鼠標移動到編號為33的小子屏中央;10)用戶繼續(xù)通過語音輸入模塊100輸入語音控制信息,如:“單擊”;11)語音引擎模塊200對“單擊”進行識別處理,得到對應的語音特征信息,并將對應的語音特征信息發(fā)送給鼠標執(zhí)行模塊400 ;12)鼠標執(zhí)行模塊400根據接收到的語音特征信息,調用對應的鼠標操作指令,在編號為33的小子屏中央進行單擊操作;13)重復執(zhí)行4) 12 ;14)控制模塊600同時控制計時模塊500記錄鼠標執(zhí)行模塊400未執(zhí)行任何鼠標操作指令的連續(xù)持續(xù)時間,當該連續(xù)持續(xù)時間大于閾值時間時,則說明用戶在一定時間內未發(fā)出控制語音,由于外界噪聲的存在,且為了節(jié)省電源,控制模塊600可以關閉鼠標執(zhí)行模塊400,打開鼠標啟動模塊300,直至用戶再次發(fā)出語音啟動鼠標指令以打開鼠標執(zhí)行模塊 400。本實施例通過分屏的方式實現鼠標的定位,從而提高了控制的準確率。當待選擇的目標位于多個子屏時,則對任意一個子屏進行操作都可以。本實施例通過語音替代基于鼠標的人機交互模式,從而提供了一種更便捷的控制模式。一方面,克服了手部傷殘人士、老年人等人群無法靈活地操作或不方便操作普通的鼠標的問題,對其使用嵌入式設備有很大幫助。另一方面,對于正常人可以是原來僅能用于操作鼠標的手進行其他活動,還可以緩解用手進行鼠標操作帶來的肩肘腕等身體部位的疲勞,從而提高計算機操作的效率,增加簡便性,且利于使用者的身體健康。此外,本實施例尤其克服了車載設備的駕駛者不方便設置和操作鼠標的情況,在提高用戶體驗效果的同時,提高了駕駛的安全性。實施例二參考圖6所示,與實施例一相比,本實施例中語音鼠標裝置還可以包括:確認模塊700,連接所述調用模塊430和顯示屏900,用于詢問用戶是否確認,并基于用戶的回復信息控制調用模塊430進行相應的操作;所述顯示屏900用于將所述詢問用戶是否確認的信息轉換為文本信息,并顯示所述文本信息。本實施例中當用戶輸入“單擊”語音鼠標命令時,確認模塊700可以控制顯示屏900向用戶顯示“確定單擊嗎”,進而根據用戶的回復信息控制調用模塊430進行相應的操作,從而可以降低誤操作的概率。實施例三參考圖7所示,與實施例一相比,本實施例中語音鼠標裝置還可以包括:確認模塊700,連接所述調用模塊430,用于詢問用戶是否確認,并基于用戶的回復信息控制調用模塊430進行相應的操作;語音播報裝置800,連接所述確認模塊700,用于將所述詢問用戶是否確認的信息轉換為語音信息,并播報所述語音信息。其中,所述語音播報裝置800可以為任意的揚聲器。所述語音播報裝置800可以是外置式的,即可以通過有線方式(如:USB接口)與確認模塊700相連,也可以通過無線方式(如:藍牙)與確認模塊700相連;所述語音播報裝置800也可以是內置式的。優(yōu)選地,所述語音播報裝置800可以與語音輸入模塊100集成在一起,從而通過USB接口使語音輸入模塊100與語音引擎模塊200相連、語音播報裝置800與確認模塊700相連。本實施例中當用戶輸入“單擊”語音鼠標命令時,確認模塊700可以控制語音播報裝置800向用戶播報“確定單擊嗎”,進而根據用戶的回復信息控制調用模塊430進行相應的操作,從而可以降低誤操作的概率。本實施例同樣可以降低用戶誤操作的概率。
雖然本發(fā)明已以較佳實施例披露如上,但本發(fā)明并非限定于此。任何本領域技術人員,在不脫離本發(fā)明的精神和范圍內,均可作各種更動與修改,因此本發(fā)明的保護范圍應當以權利要求所限定的范圍為準。
權利要求
1.一種語音鼠標裝置,其特征在于,包括: 語音輸入模塊,用于接收語音信息; 語音引擎模塊,連接語音輸入模塊,用于對接收的語音信息進行識別處理,得到對應的語音特征信息; 鼠標啟動模塊,連接語音引擎模塊,在所述語音特征信息中包含與鼠標啟動指令對應的語音特征信息時,啟動鼠標執(zhí)行模塊; 鼠標執(zhí)行模塊,連接鼠標啟動模塊和語音引擎模塊,啟動后,在所述語音特征信息中包含與鼠標操作指令對應的語音特征信息時,執(zhí)行所述鼠標操作指令。
2.如權利要求1所述的語音鼠標裝置,其特征在于,還包括:顯示屏,連接鼠標執(zhí)行模塊,用于接收和顯示執(zhí)行后的所述鼠標操作指令;所述鼠標執(zhí)行模塊啟動后自動執(zhí)行分屏編號指令,所述分屏編號指令用于將顯示屏分為多個子屏,且對每個子屏進行編號。
3.如權利要求1所述的語音鼠標裝置,其特征在于,所述語音輸入模塊為麥克風。
4.如權利要求3所述的語言鼠標裝置,其特征在于,所述語音輸入模塊通過USB接口或藍牙設備將接收的語音信息發(fā)送給所述語音引擎模塊。
5.如權利要求1所述的語音鼠標裝置,其特征在于,所述語音引擎模塊包括: 語音識別模塊,連接語音輸入模塊,用于對接收的語音信息進行識別處理,得到接收的語音特征信息; 語音特征庫,用于存儲多個語音特征信息; 搜索模塊,連接語音特征庫、語音識別模塊、鼠標啟動模塊和鼠標執(zhí)行模塊,提取接收的語音特征信息和存儲的語音特征信息,從存儲的語音特征信息中搜索與接收的語音特征信息對應的語音特征信息,并將搜索到的語音特征信息發(fā)送給所述鼠標啟動模塊和鼠標執(zhí)is豐旲塊。
6.如權利要求5所述的語音鼠標裝置,其特征在于,所述語音識別模塊包括: 采集單元,連接語音輸入模塊,用于采集語音信息; 過濾單元,連接采集單元,用于對采集的信息進行過濾處理,得到濾除噪聲后的語音信 頻譜分析單元,連接過濾單元和搜索模塊,用于對濾除噪聲后的語音信息進行頻率分析,得到接收的語音特征信息,且將接收的語音特征信息發(fā)送給搜索模塊。
7.如權利要求1所述的語音鼠標裝置,其特征在于,所述鼠標啟動模塊包括: 鼠標啟動指令集,用于存儲一個或多個鼠標啟動指令; 啟動執(zhí)行模塊,連接鼠標啟動指令集、語音引擎模塊和鼠標執(zhí)行模塊,從語音引擎模塊提取語音特征信息,從鼠標啟動指令集中搜索出與所述語音特征信息對應的鼠標啟動指令時,啟動鼠標執(zhí)行模塊。
8.如權利要求1所述的語音鼠標裝置,其特征在于,所述鼠標執(zhí)行模塊包括: 鼠標操作指令集,用于存儲多個鼠標操作指令; 調用模塊,連接鼠標操作指令集、鼠標啟動模塊和語音引擎模塊,從語音引擎模塊提取語音特征信息,從鼠標操作指令集中搜索出與所述語音特征信息對應的鼠標操作指令時,調用和執(zhí)行所述鼠標操作指令。
9.如權利要求8所述的語音鼠標裝置,其特征在于,還包括:編輯模塊,連接鼠標操作指令集,用于對所述鼠標操作指令進行修改、添加或刪除處理。
10.如權利要求8所述的語音鼠標裝置,其特征在于,還包括:確認模塊,連接所述調用模塊,用于詢問用戶是否確認,并基于用戶的回復信息控制調用模塊進行相應的操作。
11.如權利要求10所述的語音鼠標裝置,其特征在于,還包括:語音播報裝置,連接所述確認模塊,用于將所述詢問用戶是否確認的信息轉換為語音信息,并播報所述語音信息。
12.如權利要求10所述的語音鼠標裝置,其特征在于,還包括:顯示屏,連接所述確認模塊,用于將所述詢問用戶是否確認的信息轉換為文本信息,并顯示所述文本信息。
13.如權利要求1所述的語音鼠標裝置,其特征在于,所述鼠標操作指令包括:通用操作指令和自定義操作指令;所述自定義操作指令包括分屏編號指令。
14.如權利要求1所述的語音鼠標裝置,其特征在于,還包括: 計時模塊,用于計時; 控制模塊,連接鼠標啟動模塊、鼠標執(zhí)行模塊和計時模塊,當鼠標啟動模塊啟動鼠標執(zhí)行模塊時,關閉鼠標啟動模塊;并控制計時模塊記錄鼠標執(zhí)行模塊未執(zhí)行鼠標操作指令的持續(xù)時間,當所述持續(xù)時間大于閾值時間時,關閉鼠標執(zhí)行模塊,并開啟鼠標啟動模塊。
15.如權利要求1所述的語音鼠標裝置,其特征在于,所述語音鼠標裝置為電視、電腦、車載設備或手 機。
全文摘要
一種語音鼠標裝置,包括語音輸入模塊,用于接收語音信息;語音引擎模塊,連接語音輸入模塊,用于對接收的語音信息進行識別處理,得到對應的語音特征信息;鼠標啟動模塊,連接語音引擎模塊,在所述語音特征信息中包含與鼠標啟動指令對應的語音特征信息時,啟動鼠標執(zhí)行模塊;鼠標執(zhí)行模塊,連接鼠標啟動模塊,啟動后,在所述語音特征信息中包含與鼠標操作指令對應的語音特征信息時,執(zhí)行所述鼠標操作指令。本發(fā)明通過語音替代基于鼠標的人機交互模式,從而提供了一種更便捷的控制模式,提高了用戶的體驗效果。
文檔編號G10L15/08GK103186231SQ20111045739
公開日2013年7月3日 申請日期2011年12月30日 優(yōu)先權日2011年12月30日
發(fā)明者陶勇剛 申請人:上海博泰悅臻電子設備制造有限公司