本發(fā)明涉及語音控制技術(shù)領(lǐng)域,尤其涉及一種聲控麥克風(fēng)。
背景技術(shù):
生活中常用的終端設(shè)備,例如個人計算機或智能手機等,需要通過以鼠標(biāo)鍵盤為載體的圖形交互或多點觸控技術(shù)來完成人機交互。而對于殘障人士,尤其是無臂人士來說,想要操作個人計算機或移動終端設(shè)備,是一種奢望。
語音控制技術(shù)的發(fā)展,使人們利用語音控制機器的愿景成為現(xiàn)實,同時也解決了無臂人士操作機器的難題。語音控制技術(shù)的實現(xiàn),需要在被控制的機器里安裝語音識別系統(tǒng),用以識別用戶語音,進而執(zhí)行用戶語音指令。而對于生活中常用的個人計算機或智能手機等終端設(shè)備,由于沒有安裝語音識別系統(tǒng),還不能利用語音對其進行控制。
技術(shù)實現(xiàn)要素:
為了解決上述現(xiàn)有技術(shù)中的缺陷和不足,本發(fā)明提出一種聲控麥克風(fēng),可以通過語音實現(xiàn)對個人計算機或智能手機等沒有語音識別系統(tǒng)的終端設(shè)備的控制。
一種聲控麥克風(fēng),包括:
音頻采集器、語音識別器、音頻處理器及信號發(fā)送裝置;
其中,所述音頻采集器與所述語音識別器連接,用于采集語音數(shù)據(jù)并發(fā)送給所述語音識別器;
所述語音識別器與所述音頻采集器及所述音頻處理器連接,用于將所述音頻采集器采集的語音數(shù)據(jù)轉(zhuǎn)換成所述音頻處理器能夠識別的控制指令,并將所述控制指令發(fā)送給所述音頻處理器;
所述音頻處理器與所述語音識別器、所述信號發(fā)送裝置連接,用于:
將所述控制指令轉(zhuǎn)換成符合人機交互接口協(xié)議的控制指令,并發(fā)送給所述信號發(fā)送裝置;
所述信號發(fā)送裝置與所述音頻處理器連接,用于接收所述音頻處理器發(fā)送的控制指令并發(fā)送給具有人機交互接口主機功能的終端設(shè)備。
優(yōu)選地,所述音頻采集器采集語音數(shù)據(jù)并發(fā)送給所述語音識別器時,具體用于:
接收語音數(shù)據(jù)信息并轉(zhuǎn)換成電信號;
將所述電信號發(fā)送給所述語音識別器。
優(yōu)選地,所述語音識別器將所述音頻采集器采集的語音數(shù)據(jù)轉(zhuǎn)換成所述音頻處理器能夠識別的控制指令時,具體用于:
所述語音識別器調(diào)用程序?qū)⑺鲆纛l采集器采集的語音數(shù)據(jù)轉(zhuǎn)換成所述音頻處理器能夠識別的控制指令。
優(yōu)選地,所述音頻處理器將所述控制指令轉(zhuǎn)換成符合人機交互接口協(xié)議的控制指令時,具體用于:
調(diào)用與所述控制指令相對應(yīng)的轉(zhuǎn)換程序,將所述控制指令轉(zhuǎn)換成符合人機交互接口協(xié)議的控制指令。
優(yōu)選地,所述信號發(fā)送裝置接收所述音頻處理器發(fā)送的控制指令并發(fā)送給具有人機交互接口主機功能的終端設(shè)備時,具體用于:
接收所述音頻處理器發(fā)送的控制指令;
將所述控制指令轉(zhuǎn)換成無線信號;
將所述無線信號發(fā)送給具有人機交互接口主機功能的終端設(shè)備。
優(yōu)選地,所述音頻處理器能夠識別的控制指令,包括:點擊和移動。
優(yōu)選地,所述信號發(fā)送裝置,包括:藍牙裝置。
本發(fā)明提出的聲控麥克風(fēng),由音頻采集器采集語音數(shù)據(jù)并發(fā)送給語音識別器;所述語音識別器將所述音頻采集器采集的語音數(shù)據(jù)轉(zhuǎn)換成所述音頻處理器能夠識別的控制指令;所述音頻處理器將所述控制指令轉(zhuǎn)換成符合人機交互接口協(xié)議的控制指令,并發(fā)送給信號發(fā)送裝置;所述信號發(fā)送裝置接收所述音頻處理器發(fā)送的控制指令并發(fā)送給具有人機交互接口主機功能的終端設(shè)備,實現(xiàn)了對個人計算機或智能手機等沒有語音識別系統(tǒng)的終端設(shè)備的控制。
附圖說明
為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)提供的附圖獲得其他的附圖。
圖1是本發(fā)明實施例提出的一種聲控麥克風(fēng)的結(jié)構(gòu)示意圖。
具體實施方式
下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
本發(fā)明實施例公開了一種聲控麥克風(fēng),參見圖1所示,包括:
音頻采集器101、語音識別器102、音頻處理器103及信號發(fā)送裝置104;
其中,所述音頻采集器101與所述語音識別器102連接,用于采集語音數(shù)據(jù)并發(fā)送給所述語音識別器102;
具體的,所述音頻采集器101可以為麥克風(fēng),或其他任何具有聲音采集功能的裝置。音頻采集器101采集到的語音數(shù)據(jù)為用戶發(fā)出的語音指令。
所述語音識別器102與所述音頻采集器101及所述音頻處理器103連接,用于將所述音頻采集器101采集的語音數(shù)據(jù)轉(zhuǎn)換成所述音頻處理器103能夠識別的控制指令,并將所述控制指令發(fā)送給所述音頻處理器103;
具體的,音頻處理器103能夠處理的指令是特定的指令,而音頻采集器101采集的語音數(shù)據(jù)是用戶的口語信息,不符合音頻處理器103能夠識別的形式。因此,需要語音識別器102識別所述音頻采集器102采集的語音數(shù)據(jù),將語音數(shù)據(jù)轉(zhuǎn)換成音頻處理器103能夠處理的指令形式。如果語音識別器102不能識別所述音頻采集器101采集的語音數(shù)據(jù),則不對所述語音數(shù)據(jù)進行處理。
需要說明的是,本發(fā)明實施例中使用的語音識別器102應(yīng)用的是現(xiàn)有技術(shù)中很成熟的單片機語音識別方法,本發(fā)明實施例并未對語音識別器102進行改進。只要是能夠達到識別語音數(shù)據(jù)的目的的語音識別器,都可以被采用。
所述音頻處理器103與所述語音識別器102、所述信號發(fā)送裝置104連接,用于:
將所述控制指令轉(zhuǎn)換成符合人機交互接口協(xié)議的控制指令,并發(fā)送給所述信號發(fā)送裝置104;
具體的,本發(fā)明實施例提出的聲控麥克風(fēng)應(yīng)用于能夠處理人機交互接口協(xié)議指令的終端設(shè)備。即是說,只有符合人機交互接口協(xié)議的控制指令,才能被終端設(shè)備識別,進而實現(xiàn)對終端設(shè)備的控制。音頻處理器103將所述控制指令裝換成符合人機交互接口協(xié)議的控制指令,是實現(xiàn)對終端設(shè)備控制的關(guān)鍵步驟。
所述信號發(fā)送裝置104與所述音頻處理器102連接,用于接收所述音頻處理器102發(fā)送的控制指令并發(fā)送給具有人機交互接口主機功能的終端設(shè)備。
具體的,具有人機交互接口主機功能的終端設(shè)備都能處理符合人機交互接口協(xié)議的控制指令。信號發(fā)送裝置104通過無線信號的形式,將控制指令發(fā)送給具有人機交互接口主機功能的終端設(shè)備,終端設(shè)備能夠自動識別并執(zhí)行控制指令。
本發(fā)明提出的聲控麥克風(fēng),由音頻采集器101采集語音數(shù)據(jù)并發(fā)送給語音識別器102;所述語音識別器102將所述音頻采集器101采集的語音數(shù)據(jù)轉(zhuǎn)換成所述音頻處理器103能夠識別的控制指令;所述音頻處理器103將所述控制指令轉(zhuǎn)換成符合人機交互接口協(xié)議的控制指令,并發(fā)送給信號發(fā)送裝置104;所述信號發(fā)送裝置104接收所述音頻處理器103發(fā)送的控制指令并發(fā)送給具有人機交互接口主機功能的終端設(shè)備,實現(xiàn)了對個人計算機或智能手機等沒有語音識別系統(tǒng)的終端設(shè)備的控制。
可選的,在本發(fā)明的另一個實施例中,所述音頻采集器101采集語音數(shù)據(jù)并發(fā)送給所述語音識別器102時,具體用于:
接收語音數(shù)據(jù)信息并轉(zhuǎn)換成電信號;
將所述電信號發(fā)送給所述語言識別器。
具體的,音頻采集器101的作用是將模擬的聲音信號轉(zhuǎn)換成數(shù)字信號,以便于對其進行分析。任意的能夠?qū)⒛M的聲音信號轉(zhuǎn)換成相應(yīng)的數(shù)字信號的裝置都可以用來作為音頻采集器。
可選的,在本發(fā)明的另一個實施例中,所述語音識別器102將所述音頻采集器101采集的語音數(shù)據(jù)轉(zhuǎn)換成所述音頻處理器103能夠識別的控制指令時,具體用于:
所述語音識別器102調(diào)用程序?qū)⑺鲆纛l采集器101采集的語音數(shù)據(jù)轉(zhuǎn)換成所述音頻處理器103能夠識別的控制指令。
具體的,本發(fā)明實施例中所述的語音識別器102利用單片機實現(xiàn)語音識別。在現(xiàn)有技術(shù)中,通常是利用軟件程序,對語音數(shù)據(jù)進行處理,例如對語音數(shù)據(jù)進行傅里葉變換等,達到語音識別的目的。在本發(fā)明實施例中,不對所述語音識別器102做規(guī)定,也沒有對現(xiàn)有技術(shù)中的語音識別裝置進行改進,只要是能夠?qū)崿F(xiàn)語音識別目的的語音識別裝置,都可以被采用。當(dāng)所述語音識別器102需要識別語音數(shù)據(jù)時,只需要調(diào)用程序,就可以按照設(shè)計好的程序,將所述語音數(shù)據(jù)轉(zhuǎn)換成音頻處理器103能夠識別的控制指令,完成對語音數(shù)據(jù)的識別。
可選的,在本發(fā)明的另一個實施例中,所述音頻處理器103將所述控制指令轉(zhuǎn)換成符合人機交互接口協(xié)議的控制指令時,具體用于:
調(diào)用與所述控制指令相對應(yīng)的轉(zhuǎn)換程序,將所述控制指令轉(zhuǎn)換成符合人機交互接口協(xié)議的控制指令。
具體的,在音頻處理器103中,保存有預(yù)先設(shè)置好的分別對應(yīng)音頻處理器103能夠識別的控制指令的的轉(zhuǎn)換程序。當(dāng)音頻處理器103識別到某一條控制指令時,調(diào)用與所述控制指令相對應(yīng)的轉(zhuǎn)化程序,即可完成控制指令的轉(zhuǎn)換。
可選的,在本發(fā)明的另一個實施例中,所述信號發(fā)送裝置接收所述音頻處理器發(fā)送的控制指令并發(fā)送給具有人機交互接口主機功能的終端設(shè)備時,具體用于:
接收所述音頻處理器發(fā)送的控制指令;
將所述控制指令轉(zhuǎn)換成無線信號;
將所述無線信號發(fā)送給具有人機交互接口主機功能的終端設(shè)備。
具體的,所述無線信號可以為藍牙信號、紅外信號等任意可傳輸信號的無線信號形式。
需要說明的是,當(dāng)本發(fā)明實施例的麥克風(fēng)應(yīng)用于非無線裝置時,例如應(yīng)用于頭戴式耳機與麥克風(fēng)一體設(shè)備或有線麥克風(fēng)等,本發(fā)明實施例的麥克風(fēng)也可以將控制指令轉(zhuǎn)換成適合在有線介質(zhì)中傳送的電信號進行發(fā)送。
可選的,在本發(fā)明的另一個實施例中,所述音頻處理器103能夠識別的控制指令,包括:點擊和移動。
具體的,所述點擊包括:單擊和雙擊。
所述移動包括:
向左1、向左2、向左5、向左10、向左20、向左50、向左100;
向右1、向右2、向右5、向右10、向右20、向右50、向右100;
向上1、向上2、向上5、向上10、向上20、向上50、向上100;
向下1、向下2、向下5、向下10、向下20、向下50、向下100;
上述單擊、雙擊和移動,是鼠標(biāo)動作中的基本動作,通過組合執(zhí)行這些動作,可以使鼠標(biāo)完成更多的動作。
可選的,在本發(fā)明的另一個實施例中,所述信號發(fā)送裝置,包括:藍牙裝置。
具體的,一般的筆記本電腦和智能手機都具有藍牙功能,具有藍牙功能的終端設(shè)備都能接收本發(fā)明實施例提出的麥克風(fēng)發(fā)送的藍牙無線信號。而對于沒有藍牙功能的電腦,只要給電腦安裝一個藍牙適配器,就具有了接收藍牙信號并進行處理的能力。
需要說明的是,任何信號發(fā)送裝置都可以被本發(fā)明實施例采用,例如紅外信號發(fā)送裝置等,只要人機交互接口主機端能夠接收所述信號發(fā)送裝置發(fā)送的信號即可。
對所公開的實施例的上述說明,使本領(lǐng)域?qū)I(yè)技術(shù)人員能夠?qū)崿F(xiàn)或使用本發(fā)明。對這些實施例的多種修改對本領(lǐng)域的專業(yè)技術(shù)人員來說將是顯而易見的,本文中所定義的一般原理可以在不脫離本發(fā)明的精神或范圍的情況下,在其它實施例中實現(xiàn)。因此,本發(fā)明將不會被限制于本文所示的這些實施例,而是要符合與本文所公開的原理和新穎特點相一致的最寬的范圍。