專利名稱:一種基于語音的控制方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種控制方法及系統(tǒng),尤其是涉及一種基于語音的控制方法及系統(tǒng)。
背景技術(shù):
在利用操作指令控制設(shè)備運行的應(yīng)用場合,常常是通過輸入操作指令的方式來啟 動設(shè)備的運行。一旦非法人員獲取了操作指令,便可以合法身份來操作設(shè)備,安全性較差。 例如,密碼門禁系統(tǒng),當(dāng)操作人員輸入正確的密碼后,門便會開啟,即只認密碼不認人。顯 然,這種門禁系統(tǒng)的安全性無法得到保障。如果采用語音來控制設(shè)備的運行,不但無需輸入操作指令,而且兼具身份識別的 能力,無疑能夠提高系統(tǒng)的安全性?,F(xiàn)有的語音識別系統(tǒng)能夠識別出語音的語義內(nèi)容,但識 別過程較為復(fù)雜,識別效率也相對較低,不適合在此應(yīng)該場合下使用。而且,操作指令大都 相對簡單,沒有必要采用現(xiàn)有的較為復(fù)雜的語音識別系統(tǒng)。
發(fā)明內(nèi)容
針對現(xiàn)有技術(shù)中存在的缺陷,本發(fā)明所要解決的技術(shù)問題是提供一種操作方便、 安全性好的基于語音的控制方法及系統(tǒng)。為解決上述技術(shù)問題,本發(fā)明采用的技術(shù)方案如下一種基于語音的控制方法,包括以下步驟(1)預(yù)存儲語音命令、語音命令的波形特征以及操作指令三者之間的映射關(guān)系;(2)操作人員發(fā)出語音命令;(3)將操作人員的語音命令的波形特征與預(yù)存儲的語音命令的波形特征進行匹 配;如果存在相匹配的語音命令,則根據(jù)所述映射關(guān)系獲取相匹配的語音命令對應(yīng)的操作 指令后執(zhí)行該操作指令;否則,語音命令無效。如上所述的基于語音的控制方法,其中,波形特征包括音調(diào)和波表。如上所述的基于語音的控制方法,步驟(3)中所述將操作人員的語音命令的波形 特征與預(yù)存儲的語音命令的波形特征進行匹配的方法如下(a)采集操作人員發(fā)出的語音命令;(b)提取所述語音命令的音調(diào);(c)與預(yù)存儲的語音命令的音調(diào)進行匹配,如果存在相匹配的音調(diào),則進入下一 步,否則,匹配失敗;(d)提取語音命令的波表;(e)與音調(diào)匹配的語音命令的波表進行匹配;如果相匹配,則匹配成功;否則,匹 配失敗。如上所述的基于語音的控制方法,其中,在采集操作人員發(fā)出的語音命令后,提取 語音命令的音調(diào)之前,還包括對采集的語音命令進行去噪處理的步驟。如上所述的基于語音的控制方法,步驟⑴中,將所述語音命令分成若干節(jié),存儲
3每一節(jié)語音命令的波形特征。步驟(3)中,如果每一節(jié)語音命令的波形特征均與預(yù)存儲的 相對應(yīng)節(jié)的語音命令的波形特征相匹配,則獲取該語音命令對應(yīng)的操作指令。一種基于語音的控制系統(tǒng),包括用于預(yù)存儲語音命令、語音命令的波形特征以及 操作指令三者之間映射關(guān)系的預(yù)存儲裝置;用于匹配操作人員發(fā)出的語音命令的波形特征與預(yù)存儲的語音命令的波形特征 的匹配裝置;用于獲取相匹配的語音命令對應(yīng)的操作指令的獲取裝置;以及用于執(zhí)行獲取的操作指令的執(zhí)行裝置。如上所述的基于語音的控制系統(tǒng),其中,匹配裝置包括用于采集操作人員發(fā)出的 語音命令的采集單元;用于提取語音命令音調(diào)的音調(diào)提取單元;用于匹配提取的音調(diào)與預(yù)存儲的音調(diào)的音調(diào)匹配單元;用于提取語音命令波表的波表提取單元;用于匹配提取的波表與預(yù)存儲的波表的波表匹配單元。如上所述的基于語音的控制系統(tǒng),其中,匹配裝置還包括用于對采集的語音命令 進行去噪處理的去噪單元。本發(fā)明所述方法及系統(tǒng),無需手動輸入操作指令,通過語音便可控制設(shè)備的啟動 或運行,操作方便。而且,通過語音可以判斷出當(dāng)前操作人員是否是合法的操作人員,避免 了非法操作人員的非法操作,提高了安全性。
圖1是具體實施方式
中基于語音的控制系統(tǒng)的結(jié)構(gòu)框圖;圖2是具體實施方式
中基于語音的控制方法的流程圖;圖3是具體實施方式
中語音的波形特征匹配方法的流程圖。
具體實施例方式下面結(jié)合具體實施方式
和附圖對本發(fā)明進行詳細描述。如圖1所示,本實施方式中基于語音的控制系統(tǒng)包括預(yù)存儲裝置11,與預(yù)存儲裝 置連接的匹配裝置12,與預(yù)存儲裝置11和匹配裝置12連接的獲取裝置13,以及與獲取裝 置13連接的執(zhí)行裝置14。其中,匹配裝置12包括采集單元121、去噪單元122、音調(diào)提取單 元123、音調(diào)匹配單元124、波表提取單元125和波表匹配單元126。預(yù)存儲裝置11用于預(yù)存儲語音命令、語音命令的波形特征以及操作指令三者之 間的映射關(guān)系。匹配裝置12用于匹配操作人員發(fā)出的語音命令的波形特征與預(yù)存儲的語音命令 的波形特征,所述波形特征包括音調(diào)和波表。其中,采集單元121用于采集操作人員發(fā)出的 語音命令。去噪單元122用于對采集的語音命令進行去噪處理。音調(diào)提取單元123用于提 取語音命令的音調(diào)。音調(diào)匹配單元124匹配提取的音調(diào)與預(yù)存儲的音調(diào)。波表提取單元 125提取語音命令的波表。波表匹配單元1 用于匹配提取的波表與預(yù)存儲的波表。獲取裝置13用于獲取相匹配的語音命令對應(yīng)的操作指令。
執(zhí)行裝置14用于執(zhí)行獲取的操作指令。如圖2所示,基于圖1所示系統(tǒng)的控制方法包括以下步驟(1)預(yù)存儲裝置11預(yù)存儲語音命令、語音命令的波形特征以及操作指令三者之間 的映射關(guān)系。所述語音命令的波形特征包括音調(diào)和波表,可以將語音命令、語音命令的音調(diào)和 波表及相對應(yīng)的操作指令預(yù)存儲在如下表頭結(jié)構(gòu)的映射表中。
權(quán)利要求
1.一種基于語音的控制方法,包括以下步驟(1)預(yù)存儲語音命令、語音命令的波形特征以及操作指令三者之間的映射關(guān)系;(2)操作人員發(fā)出語音命令;(3)將操作人員的語音命令的波形特征與預(yù)存儲的語音命令的波形特征進行匹配;如 果存在相匹配的語音命令,則根據(jù)所述映射關(guān)系獲取相匹配的語音命令對應(yīng)的操作指令后 執(zhí)行該操作指令;否則,語音命令無效。
2.如權(quán)利要求1所述的基于語音的控制方法,其特征在于所述波形特征包括音調(diào)和 波表。
3.如權(quán)利要求2所述的基于語音的控制方法,其特征在于步驟(3)中所述將操作人 員的語音命令的波形特征與預(yù)存儲的語音命令的波形特征進行匹配的方法如下(a)采集操作人員發(fā)出的語音命令;(b)提取所述語音命令的音調(diào);(c)與預(yù)存儲的語音命令的音調(diào)進行匹配,如果存在相匹配的音調(diào),則進入下一步,否 則,匹配失敗;(d)提取語音命令的波表;(e)與音調(diào)匹配的語音命令的波表進行匹配;如果相匹配,則匹配成功;否則,匹配失敗。
4.如權(quán)利要求3所述的基于語音的控制方法,其特征在于在采集操作人員發(fā)出的語 音命令后,提取語音命令的音調(diào)之前,還包括對采集的語音命令進行去噪處理的步驟。
5.如權(quán)利要求1 4中任一項所述的基于語音的控制方法,其特征在于步驟(1)中, 將所述語音命令分成若干節(jié),存儲每一節(jié)語音命令的波形特征。
6.如權(quán)利要求5所述的基于語音的控制方法,其特征在于步驟(3)中,如果每一節(jié)語 音命令的波形特征均與預(yù)存儲的相對應(yīng)節(jié)的語音命令的波形特征相匹配,則獲取該語音命 令對應(yīng)的操作指令。
7.一種基于語音的控制系統(tǒng),包括用于預(yù)存儲語音命令、語音命令的波形特征以及操 作指令三者之間映射關(guān)系的預(yù)存儲裝置(11);用于匹配操作人員發(fā)出的語音命令的波形特征與預(yù)存儲的語音命令的波形特征的匹 配裝置(12);用于獲取相匹配的語音命令對應(yīng)的操作指令的獲取裝置(13);以及用于執(zhí)行獲取的操作指令的執(zhí)行裝置(14)。
8.如權(quán)利要求7所述的基于語音的控制系統(tǒng),其特征在于所述匹配裝置(12)包括用 于采集操作人員發(fā)出的語音命令的采集單元(121);用于提取語音命令音調(diào)的音調(diào)提取單元(123);用于匹配提取的音調(diào)與預(yù)存儲的音調(diào)的音調(diào)匹配單元(124);用于提取語音命令波表的波表提取單元(125);用于匹配提取的波表與預(yù)存儲的波表的波表匹配單元(126)。
9.如權(quán)利要求8所述的基于語音的控制系統(tǒng),其特征在于所述匹配裝置(12)還包括 用于對采集的語音命令進行去噪處理的去噪單元(122)。
全文摘要
本發(fā)明涉及一種控制方法及系統(tǒng),尤其是涉及一種基于語音的控制方法及系統(tǒng)。本發(fā)明預(yù)存儲語音命令、語音命令的波形特征以及操作指令三者之間的映射關(guān)系;操作人員發(fā)出語音命令;將操作人員的語音命令的波形特征與預(yù)存儲的語音命令的波形特征進行匹配;如果存在相匹配的語音命令,則根據(jù)所述映射關(guān)系獲取相匹配的語音命令對應(yīng)的操作指令后執(zhí)行該操作指令;否則,語音命令無效。本發(fā)明無需手動輸入操作指令,通過語音便可控制設(shè)備的啟動或運行,操作方便。
文檔編號G10L15/00GK102103858SQ201010609729
公開日2011年6月22日 申請日期2010年12月15日 優(yōu)先權(quán)日2010年12月15日
發(fā)明者龔健 申請人:方正國際軟件有限公司