本發(fā)明是有關(guān)于一種語音控制的電子裝置,更具體地描述是一種用以協(xié)助一用戶透過自身穿戴的一語音接收模塊,或是利用內(nèi)建于所述電子裝置上的所述語音接收模塊,利用一語音頻號指令的方式觸發(fā)所述電子裝置的功能。使所述用戶運用所述電子裝置進行操作時,能以所述語音頻號指令的方式進行控制,不須再經(jīng)由點擊功能鍵,又或是以其它電子控制開關(guān)裝置的方式。
背景技術(shù):
就現(xiàn)有技術(shù)而言,用戶操作電子裝置時往往是利用點擊觸控屏幕操作,上述操作情境用戶皆須用手進行操作,然而在特定的應(yīng)用狀況下用戶不方便用手來進行操控,強迫用戶用手操控的狀況下,用戶體驗不佳,,如此一來既不實用又降低用戶體驗,使得產(chǎn)品的實用性不高,進而降低產(chǎn)品競爭力。目前的解決方案,語音指令的輸入是最方便的。若能以語音指令的輸入取代繁瑣的觸控點選屏幕,并配合語音問答導(dǎo)引的操作方式,相信對不習(xí)慣使用手機輸入界面的人會是一大福音。
目前語音識別技術(shù)已經(jīng)非常成熟,商品化產(chǎn)品已陸續(xù)出現(xiàn),可以應(yīng)用在讀寫機、語音查詢、聲控家電...等等。也有應(yīng)用在人與機器溝通的界面上。手機上也有類似的語音人機界面應(yīng)用程序,但實際啟動語音指令功能時,因其設(shè)定的辨識條件是聲音的強度與持續(xù)長度到達(dá)一個門坎就啟動辨識功能。如此一來,往往會因背景的語音雜音(如電視、收音機或旁人說話聲...等)而產(chǎn)生誤動作,從而令使用者感到困擾,因而放棄使用。
技術(shù)實現(xiàn)要素:
針對現(xiàn)有技術(shù)中存在的上述弊端,本發(fā)明即是為解決此一問題,本發(fā)明于系統(tǒng)在接收到語音訊號時,先啟動聲紋辨識程序,聲紋符合用戶所預(yù)存的才啟動語音指令辨識。這樣可以達(dá)到減少誤動作的機會。
本發(fā)明的目的及解決其技術(shù)問題是采用以下技術(shù)方案來實現(xiàn)的。
依據(jù)本發(fā)明提出的語音指令管理的方法,其特征在于,包括如下步驟:通過一語音接收模塊接收一語音指令,通過一語音特征相似度判斷模塊,比對所述語音指令與一預(yù)輸入語音樣本的一特征參數(shù)是否相符;當(dāng)判定所述語音指令與所述預(yù)輸入語音樣本的一特征參數(shù)相符時,則通過一語音辨識模塊,比對所述語音指令與一預(yù)輸入指令樣本,判斷出對應(yīng)所述語音指令的一目標(biāo)指令;以及通過一指令執(zhí)行模塊執(zhí)行對應(yīng)所述語音指令的所述目標(biāo)指令。
在本發(fā)明的一實施例中,所述語音指令管理的方法,其特征在于,更包括:通過所述語音特征相似度判斷模塊,比對所述音指令與所述預(yù)輸入語音樣本的所述特征參數(shù),發(fā)現(xiàn)結(jié)果為不相符;以及通過一提示模塊,提示所述語音指令與所述預(yù)輸入語音樣本的所述特征參數(shù)不相符。
在本發(fā)明的一實施例中,所述語音指令管理的方法,其特征在于,更包括:通過所述語音辨識模塊,比對所述語音指令與所述預(yù)輸入指令樣本,無法判斷出對應(yīng)所述語音指令的所述指令時;以及通過一語音助理模塊,進行問答引導(dǎo)。
在本發(fā)明的一實施例中,所述語音指令管理的方法,其特征在于,更包括:通過無線傳輸?shù)姆绞竭B接所述語音接收模塊與所述語音特征相似度判斷模塊。
在本發(fā)明的一實施例中,所述語音指令管理的方法,其特征在于,更包括:利用一藍(lán)牙耳麥、一智能型手表、一智能眼鏡或一具有語音接收功能的穿戴型裝置作為所述語音接收模塊。
本發(fā)明的目的及解決其技術(shù)問題還可采用以下技術(shù)措施進一步實現(xiàn)。
依據(jù)本發(fā)明提出的語音指令管理的系統(tǒng),其特征在于,一語音接收模塊,用以接收一語音指令,一語音特征相似度判斷模塊,比對所述語音指令與一預(yù)輸入語音樣本的一特征參數(shù)是否相符,一語音辨識模塊,比對所述語音指令與一預(yù)輸入指令樣本,判斷出對應(yīng)所述語音指令的一目標(biāo)指令;以及一指令執(zhí)行模塊,執(zhí)行對應(yīng)所述語音指令的所述目標(biāo)指令。
在本發(fā)明的一實施例中,所述語音指令管理的系統(tǒng),其特征在于,所述語音特征相似度判斷模塊,比對所述音指令與所述預(yù)輸入語音樣本的所述特征參數(shù),并發(fā)現(xiàn)結(jié)果為不相符時,通過一提示模塊,提示所述語音指令與所述預(yù)輸入語音樣本的所述特征參數(shù)不相符。
在本發(fā)明的一實施例中,所述語音指令管理的系統(tǒng),其特征在于,所述語音辨識模塊,比對所述語音指令與所述預(yù)輸入指令樣本,無法判斷出對應(yīng)所述語音指令的所述指令時,通過一語音助理模塊,進行問答引導(dǎo)。
在本發(fā)明的一實施例中,所述語音指令管理的系統(tǒng),其特征在于,所述語音接收模塊利用無線傳輸?shù)姆绞脚c所述語音特征相似度判斷模塊連接。
在本發(fā)明的一實施例中,所述語音指令管理的系統(tǒng),其特征在于,所述語音接收模塊為一藍(lán)牙耳麥、一智能型手表、一智能眼鏡或一具有語音接收功能的穿戴型裝置。
本發(fā)明在于系統(tǒng)在接收語音指令的同時,先行啟動聲紋辨識程序,以確認(rèn)接收到之語音為用戶本人的聲紋,若是才續(xù)行語音指令辨識功能,并于辨識后執(zhí)行命令,以達(dá)到減少誤動作的機會,進一步提高語音指令辨識成功率。
附圖說明
圖1是本發(fā)明語音指令管理的系統(tǒng)架構(gòu)示意圖。
圖2是本發(fā)明語音指令管理的方法流程示意圖。
圖3至7是本發(fā)明一實施例的語音指令管理的系統(tǒng)流程示意圖。
具體實施方式
為更進一步闡述本發(fā)明為達(dá)成預(yù)定發(fā)明目的所采取的技術(shù)手段及功效,以下結(jié)合附圖及較佳實施例,對依據(jù)本發(fā)明提出的語音指令管理的控制方法及設(shè)備其具體實施方式、結(jié)構(gòu)、特征及其功效,詳細(xì)說明如后。
下面結(jié)合附圖詳細(xì)說明本發(fā)明的具體實施例。
請參照圖1,是本發(fā)明的語音指令管理的系統(tǒng)架構(gòu)示意圖,在圖1中,所述語音指令管理的系統(tǒng)1包括:
一語音接收模塊110,用以接收一語音指令;
一語音特征相似度判斷模塊120,比對所述語音指令與一預(yù)輸入語音樣本的一特征參數(shù)是否相符;
一語音辨識模塊130,比對所述語音指令與一預(yù)輸入指令樣本,判斷出對應(yīng)所述語音指令的一指令;以及
一指令執(zhí)行模塊140,執(zhí)行對應(yīng)所述語音指令的所述目標(biāo)指令。
在本實施例中,更包括:所述語音特征相似度判斷模塊120,比對所述音指令與所述預(yù)輸入語音樣本的所述特征參數(shù),并發(fā)現(xiàn)結(jié)果為不相符時,通過一提示模塊,提示所述語音指令與所述預(yù)輸入語音樣本的所述特征參數(shù)不相符。
在本實施例中,更包括:所述語音辨識模塊130,比對所述語音指令與所述預(yù)輸入指令樣本,無法判斷出對應(yīng)所述語音指令的所述指令時,通過一語音助理模塊,進行問答引導(dǎo)。
在本實施例中,更包括:所述語音接收模塊110,利用無線傳輸?shù)姆绞脚c所述語音特征相似度判斷模塊120連接。
在本實施例中,更包括:所述語音接收模塊110為一藍(lán)牙耳麥、一智能型手表、一智能眼鏡或一具有語音接收功能的穿戴型裝置。
請參照圖2,是本發(fā)明的語音指令管理的方法流程示意圖。
步驟S210:通過一語音接收模塊接收一語音指令。
步驟S220:通過一語音特征相似度判斷模塊,比對所述語音指令與一預(yù)輸入語音樣本的一特征參數(shù)是否相符。
步驟S230:當(dāng)判定所述語音指令與所述預(yù)輸入語音樣本的一特征參數(shù)相符時,則通過一語音辨識模塊,比對所述語音指令與一預(yù)輸入指令樣本,判斷出對應(yīng)所述語音指令的一目標(biāo)指令。
在本實施例中所述語音辨識模塊利用一語音識別達(dá)成判斷出對應(yīng)所述語音指令的一指令的功效
在本實施例中所述語音識別最主要的目的是計算機聽懂人類說話的聲音,進而命令計算機執(zhí)行相對應(yīng)的工作。當(dāng)聲音藉由模擬到數(shù)字的轉(zhuǎn)換裝置輸入計算機內(nèi)部,并以數(shù)值方式儲存后,語音識別程序便開始已事先儲存好的聲音樣本與輸入的測試聲音樣本進行比對工作。比對完成后,就可以知道用戶剛剛發(fā)出的聲音代表何意,進而命令計算機做事。
在本實施例中采用的語音識別可有以下幾種方式:
一、按照辨識字匯的多寡:少量字匯(數(shù)百字)、中量字匯(數(shù)千字)、大量字匯(數(shù)萬字)。
二、按照使用對象:特定對象(Speaker Dependent)、不特定對象(Speaker Independent)。
三、按照使用方式:不連續(xù)語音識別、連續(xù)語音識別。
在本實施例中所述應(yīng)用程序更包含大詞匯量語音識別系統(tǒng),所述大詞匯量語音識別系統(tǒng)采用統(tǒng)計模式識別技術(shù)。
典型的基于統(tǒng)計模式識別方法的語音識別系統(tǒng)由以下幾個基本模塊所構(gòu)成:
一、信號處理及特征提取模塊
二、聲學(xué)模型
三、發(fā)音詞典
四、語言模型
五、譯碼器
所述信號處理及特征提取模塊的主要任務(wù)是從輸入信號中提取特征,供聲學(xué)模型處理。同時,它一般也包括了一些信號處理技術(shù),以盡可能降低環(huán)境噪聲、說話人等因素對特征造成的影響。
所述聲學(xué)模型采用基于一階隱馬爾科夫模型進行建模。
所述發(fā)音詞典包含系統(tǒng)所能處理的詞匯集及其發(fā)音。
所述發(fā)音詞典實際提供了聲學(xué)模型建模單元與語言模型建模單元間的映像。
所述語言模型對系統(tǒng)所針對的語言進行建模。理論上,包括正則語言,上下文無關(guān)文法在內(nèi)的各種語言模型都可以作為語言模型,本發(fā)明利用是基于統(tǒng)計的N元文法及其變體。
所述譯碼器是語音識別系統(tǒng)的核心之一,其任務(wù)是對輸入的信號,根據(jù)聲學(xué)、語言模型及詞典,尋找能夠以最大機率輸出該信號的詞串。
步驟S240:通過一指令執(zhí)行模塊執(zhí)行對應(yīng)所述語音指令的所述目標(biāo)指令。
圖3至7是本發(fā)明一實施例的語音指令管理流程示意圖。
在圖3中,一用戶發(fā)出『撥電話給爸爸』的語音指令301至手機302。
在圖4中,所要表現(xiàn)的是,手機通過一語音接收模塊接收一語音指令,通過一語音特征相似度判斷模塊,比對所述語音指令與一預(yù)輸入語音樣本的一特征參數(shù)是否相符;當(dāng)判定所述語音指令301為本人發(fā)出時,則通過一語音辨識模塊,比對所述語音指令與一預(yù)輸入指令樣本,判斷出對應(yīng)所述語音指令的一目標(biāo)指令,通過一指令執(zhí)行模塊執(zhí)行對應(yīng)所述語音指令的所述目標(biāo)指令,撥電話給爸爸。
在圖5中,一用戶發(fā)出『現(xiàn)在打電話回家』的語音指令501至手機502。
在圖6中,手機通過一語音接收模塊接收一語音指令;通過一語音特征相似度判斷模塊,比對所述語音指令與一預(yù)輸入語音樣本的一特征參數(shù)是否相符;當(dāng)判定所述語音指令02為本人發(fā)出時,則通過一語音辨識模塊,比對所述語音指令與一預(yù)輸入指令樣本,無法判斷出對應(yīng)所述語音指令的一指令,并顯示無法完全辨識語音指令的訊息。
在圖7中,利用語音指令中的關(guān)鍵詞『打電話』與『家』作為組合,詢問用戶是否要打電話回家。
以上所述,僅是本發(fā)明的較佳實施例而已,并非對本發(fā)明作任何形式上的限制,雖然本發(fā)明已以較佳實施例揭露如上,然而并非用以限定本發(fā)明,任何熟悉本專業(yè)的技術(shù)人員,在不脫離本發(fā)明技術(shù)方案范圍內(nèi),當(dāng)可利用上述揭示的技術(shù)內(nèi)容作出些許更動或修飾為等同變化的等效實施例,但凡是未脫離本發(fā)明技術(shù)方案的內(nèi)容,依據(jù)本發(fā)明的技術(shù)實質(zhì)對以上實施例所作的任何簡單修改、等同變化與修飾,均仍屬于本發(fā)明技術(shù)方案的范圍內(nèi)。