專利名稱:游戲聲控操控裝置及其實(shí)現(xiàn)方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種游戲操控裝置,尤其涉及一種游戲聲控操控裝置;此外,本發(fā)明還涉及該游戲聲控操控裝置的實(shí)現(xiàn)方法。
背景技術(shù):
理想的語音控制設(shè)備應(yīng)當(dāng)和人耳相似,只要聽到相應(yīng)的聲音,就能進(jìn)行識(shí)別并進(jìn)行相應(yīng)的操作,但目前的技術(shù)還無法做到理想狀態(tài)。這其中,語音端點(diǎn)檢測(cè)是一個(gè)關(guān)鍵難點(diǎn)。首先,目前采用的語音端點(diǎn)檢測(cè)辦法,精確度不高,存在一定的錯(cuò)檢、漏檢現(xiàn)象,這些錯(cuò)誤容易被理解成語音識(shí)別的錯(cuò)誤,造成用戶對(duì)識(shí)別的性能有不好的體驗(yàn),影響了識(shí)別應(yīng)用推廣;其次,實(shí)時(shí)進(jìn)行的語音端點(diǎn)檢測(cè)方法,由于需要留出一段緩沖時(shí)間來檢測(cè)語音是否已經(jīng)結(jié)束,會(huì)有比較明顯的延時(shí),這在一些對(duì)實(shí)時(shí)性要求非常高的娛樂中(如網(wǎng)絡(luò)動(dòng)作游戲),是不可接受的。目前的語音識(shí)別應(yīng)用中,用戶利用控制按鍵來決定是否啟動(dòng)聲音檢測(cè)及識(shí)別,是比較普遍的做法。常用的手段有兩種一是push-hold裝置,用戶按鍵則開始錄音并識(shí)別, 用戶放開鍵則停止錄音并給出識(shí)別結(jié)果;二是push-start裝置,用戶按鍵即開始在一段固定時(shí)間內(nèi)進(jìn)行錄音及識(shí)別(用戶在說出聲控命令時(shí),一般只需要一、二秒鐘,留出幾秒鐘時(shí)間就足夠了),不再檢測(cè)用戶是否已松開按鈕。這種做法的缺點(diǎn)也是比較明顯的,即“不自然”,在互動(dòng)性比較強(qiáng)的娛樂項(xiàng)目中,不自然的操作方式是一個(gè)很大的缺點(diǎn)。任天堂的Wii裝置提供了一種用戶非常喜愛的游戲操控方式,分析表明,用戶更喜歡能給他們帶來身臨其境感受的操作方式,而不是死板的在控制面板上按下幾個(gè)特定的按鈕來進(jìn)行操作。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問題是提供一種游戲聲控操控裝置,其克服了傳統(tǒng)的用按鍵等方式啟動(dòng)帶來的使用方式不自然,以及用語音端點(diǎn)自動(dòng)檢測(cè)技術(shù)啟動(dòng)帶來的誤報(bào)率高及延時(shí)較長(zhǎng)的問題,能給游戲用戶帶來更方便、更接近虛擬現(xiàn)實(shí)的感受。此外,本發(fā)明還提供該游戲聲控操控裝置的實(shí)現(xiàn)方法。為解決上述技術(shù)問題,本發(fā)明提供一種游戲聲控操控裝置,包括語音輸入裝置、 游戲操縱桿和語音識(shí)別控制芯片;該語音輸入裝置用于接收來自語音識(shí)別控制芯片的控制信號(hào)后對(duì)用戶的語音命令進(jìn)行錄音,將獲取的語音命令傳送到語音識(shí)別控制芯片;該游戲操縱桿帶有加速度傳感器,其用于在檢測(cè)到用戶揮動(dòng)游戲操縱桿的動(dòng)作時(shí),向語音識(shí)別控制芯片發(fā)送開始錄音的信號(hào);該語音識(shí)別控制芯片安裝在游戲主機(jī)上,其包括信號(hào)傳輸及控制模塊和語音識(shí)別模塊,信號(hào)傳輸及控制模塊在檢測(cè)到游戲操縱桿發(fā)出的信號(hào)后,對(duì)語音輸入裝置發(fā)出開始錄音的信號(hào),并在獲得來自語音輸入裝置的語音命令后啟動(dòng)語音識(shí)別模塊識(shí)別出該語音命
4令,對(duì)游戲主機(jī)發(fā)出相應(yīng)的消息或中斷信號(hào)。所述語音輸入裝置采用無線耳機(jī)、有線耳機(jī)或麥克風(fēng)。所述語音輸入裝置采用無線耳機(jī)時(shí),所述語音識(shí)別控制芯片上的信號(hào)傳輸及控制模塊為無線傳輸及信號(hào)控制模塊。所述語音識(shí)別控制芯片具備部分可編程功能,以使游戲廠商編輯命令字列表,具有強(qiáng)大的可擴(kuò)展性。所述語音識(shí)別控制芯片上的信號(hào)傳輸及控制模塊的數(shù)目與語音輸入裝置、游戲操縱桿的數(shù)目一致。此外,本發(fā)明還提供一種游戲聲控操控裝置的實(shí)現(xiàn)方法,包括如下步驟(1)啟動(dòng)游戲主機(jī)和語音識(shí)別控制芯片,語音輸入裝置和游戲操縱桿與游戲主機(jī)自動(dòng)連接;(2)游戲操縱桿的加速度傳感器檢測(cè)出用戶揮動(dòng)游戲操縱桿的動(dòng)作時(shí),向語音識(shí)別控制芯片發(fā)送開始錄音的信號(hào);(3)語音識(shí)別控制芯片的信號(hào)傳輸及控制模塊檢測(cè)到游戲操縱桿發(fā)出的信號(hào)后, 對(duì)語音輸入裝置發(fā)出開始錄音的信號(hào);(4)語音輸入裝置接收信號(hào)后記錄用戶的語音命令并傳輸?shù)秸Z音識(shí)別控制芯片;(5)語音識(shí)別控制芯片接收到該語音命令后,啟動(dòng)語音識(shí)別模塊識(shí)別出該語音命令,對(duì)游戲主機(jī)發(fā)出相應(yīng)的消息或中斷信號(hào)。步驟(5)中,語音識(shí)別模塊的具體工作步驟為A.語音識(shí)別模塊判斷是否接收到語音識(shí)別的啟動(dòng)信號(hào),如是則啟動(dòng)語音識(shí)別功能;同時(shí),語音識(shí)別模塊判斷是否有命令字更新,如是則啟動(dòng)相應(yīng)命令字列表讀取功能從外部讀取新的命令字列表;B.如語音識(shí)別模塊接收到語音識(shí)別的啟動(dòng)信號(hào),則識(shí)別用戶說了哪個(gè)命令字;C.語音識(shí)別模塊將識(shí)別后的命令發(fā)送給游戲主機(jī)。所述語音識(shí)別的啟動(dòng)信號(hào)是來自語音輸入裝置的語音命令。步驟A中,語音識(shí)別模塊具有命令字定義功能,語音識(shí)別模塊運(yùn)行時(shí)會(huì)不斷輪詢是否接收到命令字更新信號(hào),如果收到該信號(hào),將啟動(dòng)相應(yīng)命令字列表讀取功能從外部讀取新的命令字列表。步驟B中,語音識(shí)別模塊通過語音識(shí)別控制芯片上固化的可實(shí)現(xiàn)命令字識(shí)別功能的語音識(shí)別軟件來識(shí)別用戶說了哪個(gè)命令字。本發(fā)明的有益效果在于本發(fā)明綜合利用語音識(shí)別技術(shù)、無線傳輸技術(shù)及加速度傳感器技術(shù),在游戲操縱桿上加裝加速度傳感器,用加速度傳感器檢測(cè)操縱桿的“揮動(dòng)”動(dòng)作,以此作為語音識(shí)別啟動(dòng)的信號(hào),克服了傳統(tǒng)的用按鍵等方式啟動(dòng)帶來的使用方式不自然,以及用語音端點(diǎn)自動(dòng)檢測(cè)技術(shù)啟動(dòng)帶來的誤報(bào)率高及延時(shí)較長(zhǎng)的問題,能給游戲用戶帶來更方便,更接近虛擬現(xiàn)實(shí)的感受。傳統(tǒng)的語音識(shí)別技術(shù)要么致力于在信號(hào)處理領(lǐng)域解決實(shí)際中碰到的大多數(shù)問題,事倍而功半;要么總是想要通過其他傳統(tǒng)輸入方式如鍵盤、按鍵等進(jìn)行輔助,仍然不能脫離傳統(tǒng)輸入設(shè)備的桎梏,其應(yīng)用價(jià)值就必然要大打折扣,給用戶帶來用語音識(shí)別輸入信息仍然不能脫離鍵盤等傳統(tǒng)方式的印象。語音識(shí)別是一種人機(jī)交互技術(shù),但使用人群相當(dāng)有限,在中國(guó)市場(chǎng)上就更是如此。 多項(xiàng)研究報(bào)告表明,其原因主要有兩點(diǎn)一是只能在有限的應(yīng)用場(chǎng)合中給用戶帶來更方便的感覺,二是用戶的使用習(xí)慣尚未培養(yǎng)起來。本發(fā)明對(duì)于語音技術(shù)的推廣具有非常重要的價(jià)值,游戲玩家是一個(gè)非常廣大的用戶群體,如果能吸引這部分用戶,則既可以使人們體會(huì)到語音識(shí)別的價(jià)值,也可以為游戲行業(yè)帶來一種非常有價(jià)值的交互方式,在商業(yè)上獲得成功。
圖1是本發(fā)明系統(tǒng)的模塊結(jié)構(gòu)示意圖;圖2是本發(fā)明的語音識(shí)別模塊的工作流程圖。
具體實(shí)施例方式本發(fā)明提供了一種結(jié)合加速度傳感器的游戲聲控操控裝置,主要由無線耳機(jī)、帶有加速度傳感器的操縱桿及游戲主機(jī)上的語音識(shí)別控制芯片組成,前兩者均可由控制芯片進(jìn)行無線控制。用戶在使用時(shí)戴上無線耳機(jī),在揮動(dòng)操縱桿的數(shù)秒鐘內(nèi)說出語音命令,整套設(shè)備將完成以下動(dòng)作加速度傳感器檢測(cè)出用戶動(dòng)作并通知主機(jī)上的控制模塊;控制芯片通知無線耳機(jī)進(jìn)行錄音;無線耳機(jī)接收指令后記錄用戶的聲音命令并傳輸?shù)娇刂菩酒?;控制芯片啟?dòng)語音識(shí)別功能,識(shí)別出該聲音命令,對(duì)主機(jī)游戲程序發(fā)出相應(yīng)的消息或中斷信號(hào)。而在用戶方面,他對(duì)該控制系統(tǒng)的直接感受將是揮動(dòng)一根“魔棒”,只要在幾秒鐘內(nèi)說出“咒語”,在游戲里控制的相應(yīng)角色就會(huì)施放魔法。這將帶來一種非常新穎神奇的用戶感受。語音識(shí)別技術(shù)就是讓機(jī)器通過識(shí)別和理解過程把語音信號(hào)轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的技術(shù)。語音識(shí)別是一門交叉學(xué)科,所涉及的領(lǐng)域包括信號(hào)處理、模式識(shí)別、概率論和信息論、發(fā)聲機(jī)理和聽覺機(jī)理、人工智能等等。近二十年來,語音識(shí)別技術(shù)取得顯著進(jìn)步,開始從實(shí)驗(yàn)室走向市場(chǎng),已經(jīng)進(jìn)入工業(yè)、家電、通信、汽車電子、醫(yī)療、家庭服務(wù)、消費(fèi)電子產(chǎn)品等諸多領(lǐng)域。如圖1所示,本發(fā)明的游戲聲控操控裝置主要由以下三部分組成第一部分,語音輸入裝置,例如無線耳機(jī)、有線耳機(jī)或放置得比較近的靈敏度較高的麥克風(fēng)(圖1中以無線耳機(jī)為例),它可以接收來自語音識(shí)別模塊的控制信號(hào),并在接受信號(hào)后的幾秒鐘內(nèi)進(jìn)行錄音,將獲取的語音信號(hào)(即用戶的語音命令)傳送到語音識(shí)別控制芯片。第二部分是游戲操縱桿,帶有加速度傳感器(或通過某種機(jī)械方式來觸動(dòng)無線信號(hào)),其功能是在檢測(cè)到用戶揮動(dòng)操縱桿的動(dòng)作時(shí),向語音識(shí)別模塊發(fā)送開始錄音的信號(hào)。第三部分是語音識(shí)別控制芯片(帶無線傳輸功能),它是一塊可以安裝在電子設(shè)備(游戲主機(jī))上的芯片,帶有無線傳輸及信號(hào)控制模塊,包括信號(hào)傳輸天線及相應(yīng)的信號(hào)處理功能。它將在檢測(cè)到游戲操縱桿發(fā)出的信號(hào)后,對(duì)無線耳機(jī)發(fā)出開始錄音的信號(hào),無線耳機(jī)接收信號(hào)后記錄用戶的語音命令(即錄音)并傳輸?shù)秸Z音識(shí)別控制芯片,并在獲得來自無線耳機(jī)的語音命令后啟動(dòng)語音識(shí)別功能,語音識(shí)別模塊識(shí)別出該語音命令,對(duì)游戲主機(jī)發(fā)出相應(yīng)的消息或中斷信號(hào)。該芯片還具備部分可編程功能,可以讓游戲廠商通過某種方式編輯命令字列表,具有非常強(qiáng)大的可擴(kuò)展性。
該裝置將語音識(shí)別與加速度傳感器相結(jié)合,一方面使用戶感覺不到其他輸入方式的存在,充分體會(huì)到語音輸入的快速便捷;另一方面,給用戶帶來揮動(dòng)“魔棒”,然后說出“咒語”,就能實(shí)現(xiàn)成功“釋放魔法”的體驗(yàn),帶來猶如置身現(xiàn)實(shí)的游戲感受。本發(fā)明所描述的游戲聲控操控裝置,由于需要芯片開發(fā),僅適用于家用游戲主機(jī); 對(duì)于PC機(jī)用戶,需要另行設(shè)計(jì)安裝周邊軟件、硬件,以形成可用的標(biāo)準(zhǔn)外設(shè)。該裝置可支持的用戶數(shù)由語音識(shí)別模塊芯片上安裝的無線傳輸及信號(hào)控制模塊數(shù)目確定,不同的無線傳輸及信號(hào)控制模塊與不同的無線耳機(jī)及游戲操縱桿進(jìn)行交互,在連接后即進(jìn)行鎖定。該裝置提供對(duì)外開發(fā)接口,游戲廠商可根據(jù)具體的需求進(jìn)行開發(fā)。該游戲聲控操控裝置對(duì)實(shí)際的游戲機(jī)或游戲軟件是完全透明的。游戲設(shè)計(jì)者完全不需要考慮如何控制語音識(shí)別啟動(dòng)、 語音傳輸、語音識(shí)別如何進(jìn)行這些問題,只需要利用開發(fā)接口將需要識(shí)別的命令字列表傳給芯片,然后啟動(dòng)端口監(jiān)聽來檢測(cè)芯片是否識(shí)別到了列表中的命令。本發(fā)明還提供一種結(jié)合加速度傳感器的游戲聲控操控裝置的實(shí)現(xiàn)方法,包括如下步驟(1)啟動(dòng)游戲主機(jī)和語音識(shí)別控制芯片,語音輸入裝置和游戲操縱桿與游戲主機(jī)自動(dòng)連接;(2)游戲操縱桿的加速度傳感器檢測(cè)出用戶揮動(dòng)游戲操縱桿的動(dòng)作時(shí),向語音識(shí)別控制芯片發(fā)送開始錄音的信號(hào);(3)語音識(shí)別控制芯片的信號(hào)傳輸及控制模塊檢測(cè)到游戲操縱桿發(fā)出的信號(hào)后, 對(duì)語音輸入裝置發(fā)出開始錄音的信號(hào);(4)語音輸入裝置接收信號(hào)后記錄用戶的語音命令并傳輸?shù)秸Z音識(shí)別控制芯片;(5)語音識(shí)別控制芯片接收到該語音命令后,啟動(dòng)語音識(shí)別模塊識(shí)別出該語音命令,對(duì)游戲主機(jī)發(fā)出相應(yīng)的消息或中斷信號(hào)。如圖2所示,本發(fā)明的語音識(shí)別控制芯片上語音識(shí)別模塊的具體工作流程為(1)啟動(dòng)游戲主機(jī)的電源,語音識(shí)別控制芯片上電啟動(dòng),語音識(shí)別模塊開始運(yùn)行;(2)語音輸入裝置(耳機(jī))和游戲操縱桿與游戲主機(jī)自動(dòng)連接;(3)語音識(shí)別模塊判斷是否接收到語音識(shí)別的啟動(dòng)信號(hào)(即是否接收到來自語音輸入裝置的語音命令),如是則啟動(dòng)語音識(shí)別功能;同時(shí)判斷是否有命令字更新(語音識(shí)別模塊開放了命令字定義功能,運(yùn)行時(shí)會(huì)不斷輪詢是否接受到了命令字更新信號(hào),如果收到該信號(hào),將啟動(dòng)相應(yīng)命令字列表讀取功能從外部讀取新的命令字列表);(4)如語音識(shí)別模塊接收到語音識(shí)別的啟動(dòng)信號(hào),則識(shí)別用戶說了哪個(gè)命令字 (語音識(shí)別控制芯片上固化了可實(shí)現(xiàn)命令字識(shí)別功能的語音識(shí)別軟件,可在接收到語音輸入裝置獲取的語音命令后,識(shí)別用戶說了哪個(gè)命令字);(5)語音識(shí)別模塊將識(shí)別后的命令發(fā)送給游戲主機(jī)。
權(quán)利要求
1.一種游戲聲控操控裝置,其特征在于,包括語音輸入裝置、游戲操縱桿和語音識(shí)別控制芯片;該語音輸入裝置用于接收來自語音識(shí)別控制芯片的控制信號(hào)后對(duì)用戶的語音命令進(jìn)行錄音,將獲取的語音命令傳送到語音識(shí)別控制芯片;該游戲操縱桿帶有加速度傳感器,其用于在檢測(cè)到用戶揮動(dòng)游戲操縱桿的動(dòng)作時(shí),向語音識(shí)別控制芯片發(fā)送開始錄音的信號(hào);該語音識(shí)別控制芯片安裝在游戲主機(jī)上,其包括信號(hào)傳輸及控制模塊和語音識(shí)別模塊,信號(hào)傳輸及控制模塊在檢測(cè)到游戲操縱桿發(fā)出的信號(hào)后,對(duì)語音輸入裝置發(fā)出開始錄音的信號(hào),并在獲得來自語音輸入裝置的語音命令后啟動(dòng)語音識(shí)別模塊識(shí)別出該語音命令,對(duì)游戲主機(jī)發(fā)出相應(yīng)的消息或中斷信號(hào)。
2.如權(quán)利要求1所述的游戲聲控操控裝置,其特征在于,所述語音輸入裝置采用無線耳機(jī)、有線耳機(jī)或麥克風(fēng)。
3.如權(quán)利要求2所述的游戲聲控操控裝置,其特征在于,所述語音輸入裝置采用無線耳機(jī)時(shí),所述語音識(shí)別控制芯片上的信號(hào)傳輸及控制模塊為無線傳輸及信號(hào)控制模塊。
4.如權(quán)利要求1所述的游戲聲控操控裝置,其特征在于,所述語音識(shí)別控制芯片具備部分可編程功能,以使游戲廠商編輯命令字列表,具有強(qiáng)大的可擴(kuò)展性。
5.如權(quán)利要求1所述的游戲聲控操控裝置,其特征在于,所述語音識(shí)別控制芯片上的信號(hào)傳輸及控制模塊的數(shù)目與語音輸入裝置、游戲操縱桿的數(shù)目一致。
6.一種如權(quán)利要求1-5任一項(xiàng)所述的游戲聲控操控裝置的實(shí)現(xiàn)方法,其特征在于,包括如下步驟(1)啟動(dòng)游戲主機(jī)和語音識(shí)別控制芯片,語音輸入裝置和游戲操縱桿與游戲主機(jī)自動(dòng)連接;(2)游戲操縱桿的加速度傳感器檢測(cè)出用戶揮動(dòng)游戲操縱桿的動(dòng)作時(shí),向語音識(shí)別控制芯片發(fā)送開始錄音的信號(hào);(3)語音識(shí)別控制芯片的信號(hào)傳輸及控制模塊檢測(cè)到游戲操縱桿發(fā)出的信號(hào)后,對(duì)語音輸入裝置發(fā)出開始錄音的信號(hào);(4)語音輸入裝置接收信號(hào)后記錄用戶的語音命令并傳輸?shù)秸Z音識(shí)別控制芯片;(5)語音識(shí)別控制芯片接收到該語音命令后,啟動(dòng)語音識(shí)別模塊識(shí)別出該語音命令,對(duì)游戲主機(jī)發(fā)出相應(yīng)的消息或中斷信號(hào)。
7.如權(quán)利要求6所述的游戲聲控操控裝置的實(shí)現(xiàn)方法,其特征在于,步驟(5)中,語音識(shí)別模塊的具體工作步驟為A.語音識(shí)別模塊判斷是否接收到語音識(shí)別的啟動(dòng)信號(hào),如是則啟動(dòng)語音識(shí)別功能;同時(shí),語音識(shí)別模塊判斷是否有命令字更新,如是則啟動(dòng)相應(yīng)命令字列表讀取功能從外部讀取新的命令字列表;B.如語音識(shí)別模塊接收到語音識(shí)別的啟動(dòng)信號(hào),則識(shí)別用戶說了哪個(gè)命令字;C.語音識(shí)別模塊將識(shí)別后的命令發(fā)送給游戲主機(jī)。
8.如權(quán)利要求7所述的游戲聲控操控裝置的實(shí)現(xiàn)方法,其特征在于,所述語音識(shí)別的啟動(dòng)信號(hào)是來自語音輸入裝置的語音命令。
9.如權(quán)利要求7所述的游戲聲控操控裝置的實(shí)現(xiàn)方法,其特征在于,步驟A中,語音識(shí)別模塊具有命令字定義功能,語音識(shí)別模塊運(yùn)行時(shí)會(huì)不斷輪詢是否接收到命令字更新信號(hào),如果收到該信號(hào),將啟動(dòng)相應(yīng)命令字列表讀取功能從外部讀取新的命令字列表。
10.如權(quán)利要求7所述的游戲聲控操控裝置的實(shí)現(xiàn)方法,其特征在于,步驟B中,語音識(shí)別模塊通過語音識(shí)別控制芯片上固化的可實(shí)現(xiàn)命令字識(shí)別功能的語音識(shí)別軟件來識(shí)別用戶說了哪個(gè)命令字。
全文摘要
本發(fā)明公開了一種游戲聲控操控裝置,包括語音輸入裝置,用于接收來自語音識(shí)別控制芯片的控制信號(hào)后對(duì)用戶的語音命令進(jìn)行錄音,將獲取的語音命令傳送到語音識(shí)別控制芯片;游戲操縱桿,帶有加速度傳感器,用于在檢測(cè)到用戶揮動(dòng)游戲操縱桿時(shí),向語音識(shí)別控制芯片發(fā)送開始錄音的信號(hào);語音識(shí)別控制芯片,安裝在游戲主機(jī)上,包括信號(hào)傳輸及控制模塊和語音識(shí)別模塊,信號(hào)傳輸及控制模塊在檢測(cè)到游戲操縱桿發(fā)出的信號(hào)后,對(duì)語音輸入裝置發(fā)出開始錄音的信號(hào),并在獲得語音命令后啟動(dòng)語音識(shí)別模塊識(shí)別出該語音命令,對(duì)游戲主機(jī)發(fā)出相應(yīng)的消息或中斷信號(hào)。此外,本發(fā)明還公開了該裝置的實(shí)現(xiàn)方法。本發(fā)明能給游戲用戶帶來更方便、更接近虛擬現(xiàn)實(shí)的感受。
文檔編號(hào)A63F13/02GK102451557SQ20101052326
公開日2012年5月16日 申請(qǐng)日期2010年10月28日 優(yōu)先權(quán)日2010年10月28日
發(fā)明者蔡洪濱, 黃偉 申請(qǐng)人:盛樂信息技術(shù)(上海)有限公司