語音解鎖系統(tǒng)及其方法
【專利摘要】一種語音解鎖系統(tǒng)及其方法,通過接收錄制語音并解析錄制語音以產生錄制特征,接著比對錄制特征與語音特征并在比對符合時解析錄制語音以得到解鎖指令,以及執(zhí)行此解鎖指令對應的解鎖操作,用以達成提高解鎖操作的安全性與便利性的技術效果。
【專利說明】語音解鎖系統(tǒng)及其方法
【技術領域】
[0001]本發(fā)明涉及一種語音解鎖系統(tǒng)及其方法,尤其涉及一種應用比對語音對設備進行解鎖操作的語音解鎖系統(tǒng)及其方法。
【背景技術】
[0002]近年來,隨著行動裝置的普及與蓬勃發(fā)展,與行動裝置相關的應用猶如雨后春筍般的出現(xiàn),其中又以解鎖功能最受矚目。
[0003]一般而言,傳統(tǒng)是以按鍵或手指滑動方式實現(xiàn)解鎖操作,例如:同時按壓兩個按鍵或在觸控屏幕上以手指滑動的方式對鎖定的屏幕、文檔或應用程序進行解鎖。然而,因為無法確認操作者的身份,因此具有安全性的顧慮,換而言之,上述方式皆具有無法驗證操作者身份的問題。
[0004]有鑒于此,便有廠商提出以人臉識別作為解鎖的方式,例如:通過攝影裝置擷取人臉以進行身份驗證,并且在驗證通過后進行屏幕解鎖。如此一來,即可提高解鎖操作的安全性。不過,以此方式無法避免他人以照片欺騙驗證機制,進而使得解鎖操作的安全性受到質疑,而且人臉拍攝角度也會影響驗證的正確性,所以在操作上仍然不夠便利。另外,亦有人提出以輸入密碼的方式進行解鎖,不過此方式無法避免密碼泄露的情況,并且將大幅降低使用者在解鎖過程的操作效率,故上述方式仍然無法有效解決解鎖操作的安全性與便利性不佳的問題。
[0005]綜上所述,可知現(xiàn)有技術中長期以來一直存在解鎖操作的安全性與便利性不佳的問題,因此實有必要提出改進的技術手段,來解決這一問題。
【發(fā)明內容】
[0006]有鑒于現(xiàn)有技術存在的問題,本發(fā)明遂揭露一種語音解鎖系統(tǒng)及其方法。
[0007]本發(fā)明所揭露的語音解鎖系統(tǒng),應用于具有顯示裝置的設備,此系統(tǒng)包含:儲存模塊、接收模塊、處理模塊、驗證模塊及解鎖模塊。其中,儲存模塊預先儲存使用者的語音特征;接收模塊用以收錄使用者的語音以生成錄制語音;處理模塊用以解析錄制語音以生成錄制特征;驗證模塊用以將錄制特征與語音特征進行比對,并在比對符合時解析錄制語音得到解鎖指令;解鎖模塊用以執(zhí)行解鎖指令對應的解鎖操作。
[0008]至于本發(fā)明的語音解鎖方法,應用于具有顯示裝置的設備,其步驟包括:在設備中預先存儲使用者的語音特征;設備通過收音進行收錄使用者的語音以生成錄制語音;解析錄制語音以生成錄制特征;將錄制特征與語音特征進行比對,在比對符合時解析錄制語音得到解鎖指令,并且執(zhí)行此解鎖指令對應的解鎖操作。
[0009]本發(fā)明所揭露的系統(tǒng)與方法如上,與現(xiàn)有技術之間的差異在于本發(fā)明是通過接收錄制語音并解析錄制語音以產生錄制特征,接著比對錄制特征與語音特征并在比對符合時解析錄制語音以得到解鎖指令,以及執(zhí)行此解鎖指令對應的解鎖操作。
[0010]通過上述的技術手段,本發(fā)明可以達成提高解鎖操作的安全性與便利性的技術效果O
【專利附圖】
【附圖說明】
[0011]圖1為本發(fā)明語音解鎖系統(tǒng)的系統(tǒng)方塊圖。
[0012]圖2為本發(fā)明語音解鎖方法的方法流程圖。
[0013]圖3為應用本發(fā)明的顯示裝置為鎖定狀態(tài)的示意圖。
[0014]圖4為應用本發(fā)明的語音特征及錄制特征的示意圖。
[0015]圖5為應用本發(fā)明再次收音以作為錄制語音的示意圖。
[0016]圖6為應用本發(fā)明產生的輸入區(qū)塊的示意圖。
[0017]主要部件附圖標記:
[0018]101 顯示裝置
[0019]110 儲存模塊
[0020]120 接收模塊
[0021]130 處理模塊
[0022]140 驗證模塊
[0023]150 解鎖模塊
[0024]410 語音特征
[0025]420 錄制特征
[0026]510 提示信息
[0027]511 錄制按鍵
[0028]610 輸入區(qū)塊
[0029]611 輸入元件
[0030]步驟210在該設備中預先存儲至少一個使用者的語音特征
[0031]步驟220該設備進行收錄使用者的語音以生成錄制語音
[0032]步驟230解析該錄制語音以生成錄制特征
[0033]步驟240將該錄制特征與所述語音特征進行比對,在比對符合時解析該錄制語音得到解鎖指令,并且執(zhí)行該解鎖指令對應的解鎖操作
[0034]步驟241在執(zhí)行所述解鎖指令對應的解鎖操作之前,比對所述解鎖指令和多個預先儲存的預置指令,在符合時執(zhí)行所述解鎖指令對應的解鎖操作,在不符合時產生并顯示指令提示信息
[0035]步驟242當該解鎖指令包含的解鎖對象為鎖定狀態(tài)的該顯示裝置,該解鎖指令對應的解鎖操作為將該設備顯示裝置的鎖定狀態(tài)切換為未鎖定狀態(tài)
[0036]步驟243當該解鎖指令包含的解鎖對象記錄有文檔或應用程序的名稱或路徑時,該解鎖指令對應的解鎖操作為將該文檔或應用程序的鎖定狀態(tài)切換為開啟狀態(tài)
[0037]步驟250預設驗證碼,并且在該錄制特征與所有語音特征比對不符的次數(shù)大于預設次數(shù)時,產生輸入區(qū)塊以接收鍵入碼,以及將該鍵入碼與該驗證碼進行比對,當比對不符時播放警示語音
【具體實施方式】[0038]以下將結合附圖及實施例來詳細說明本發(fā)明的實施方式,由此對本發(fā)明如何應用技術手段來解決技術問題并達成技術效果的實現(xiàn)過程能充分理解并據以實施。
[0039]在說明本發(fā)明所揭露的語音解鎖系統(tǒng)及其方法之前,先對本發(fā)明所自行定義的名詞作說明,本發(fā)明所述的語音特征及錄制特征是指將聲音信號進行解析后所擷取出的特征,如:音量、音高、音色……等等,其中語音特征預先儲存在設備中,且亦可儲存不同使用者的語音特征;錄制特征則是通過解析錄制語音后所產生,其特征的產生方式與語音特征的產生方式相同,通過比對語音特征及錄制特征能夠識別使用者的身份。在實際實施上,亦可利用梅爾頻率倒譜系數(shù)(Mel-frequency cepstrum coefficient, MFCC)作為特征以進行語音比對的判斷,由于解析聲音信號產生特征的方式為現(xiàn)有技術,故在此不再多作贅述。
[0040]以下結合附圖對本發(fā)明語音解鎖系統(tǒng)及其方法作進一步說明,請參照圖1,圖1為本發(fā)明語音解鎖系統(tǒng)的系統(tǒng)方塊圖,應用在具有顯示裝置101的設備,此系統(tǒng)包含:儲存模塊110、接收模塊120、處理模塊130、驗證模塊140及解鎖模塊150。其中,儲存模塊110用以預先儲存使用者的語音特征,在實際實施上,可在同一設備中儲存不同使用者的語音特征,以便根據不同使用者的身份執(zhí)行相應的解鎖指令來進行對應解鎖操作。由于語音特征在前面自行定義的名詞中已經作詳細說明,故在此不再多作贅述。在實際實施上,解鎖指令可包含解鎖對象,此解鎖對象可為鎖定狀態(tài)的顯示裝置101,或是記錄有文檔或應用程序的名稱或路徑,以便通過名稱或路徑執(zhí)行解鎖指令。舉例來說,假設執(zhí)行的解鎖指令所包含的解鎖對象為鎖定狀態(tài)的顯示裝置101,則此解鎖指令所對應的解鎖操作會將顯示裝置101的鎖定狀態(tài)切換為未鎖定狀態(tài);假設執(zhí)行的解鎖指令所包含的解鎖對象記錄為“c:\dd.txt”時,其對應的解鎖操作是將此路徑的文檔“dd.txt”的鎖定狀態(tài)切換為開啟狀態(tài);假設解鎖對象記錄為“c:\lock.exe”,則代表將此路徑的應用程序“l(fā)ock, exe”由鎖定狀態(tài)切換為開啟狀態(tài)。至于所謂的由鎖定狀態(tài)切換為開啟狀態(tài),也就是允許使用者繼續(xù)對文檔或應用程序進行讀取或執(zhí)行,由于將文檔或應用程序從鎖定狀態(tài)切換為開啟狀態(tài)為現(xiàn)有技術,故在此將不再多作贅述。
[0041]接收模塊120用以通過收音裝置,如:麥克風,收錄使用者的語音以生成錄制語音。在實際實施上,接收模塊120可在顯示裝置101、文檔或應用程序為鎖定狀態(tài)時才收錄使用者的語音,所述顯示裝置101為鎖定狀態(tài)是指僅允許使用者進行將鎖定狀態(tài)切換為未鎖定狀態(tài)的操作,而不回應此操作以外的其他操作。
[0042]處理模塊130用以解析接收模塊120所生成的錄制語音并生成錄制特征,此錄制特征如同儲存模塊110中的語音特征可記錄有音量、音高、音色……等等參數(shù),或是為梅爾頻率倒譜系數(shù)。在實際實施上,處理模塊130還可包含對錄制語音進行數(shù)位化、去噪、……等音頻處理以便生成錄制特征。由于解析錄制語音以生成錄制特征的技術為現(xiàn)有技術,故在此不再多作贅述。
[0043]驗證模塊140用以將錄制特征與儲存模塊110的語音特征進行比對,也就是識別使用者的身份是否為合法使用者,并且在比對符合時,解析錄制語音以得到解鎖指令,此處所指的解析錄制語音是對錄制語音進行語音辨識處理,以便得到能夠被設備執(zhí)行的解鎖指令而進行對應的解鎖操作,例如:當錄制語音為中文語音“解鎖”時,經過語音辨識后即產生設備能夠執(zhí)行的解鎖指令“Unlock”來進行相應的解鎖操作,如:將顯示裝置101的鎖定狀態(tài)切換為未鎖定狀態(tài),或是將文檔或應用程序的鎖定狀態(tài)切換為開啟狀態(tài)。另外,如果比對后所有錄制特征皆不符合時,可產生提示信息并顯示在顯示裝置101上。在實際實施上,驗證模塊140還可以預先設置一個驗證碼,并且在錄制特征與所有語音特征比對不符的次數(shù)大于預設次數(shù)時,產生輸入區(qū)塊以接收使用者輸入的字串作為鍵入碼,接著,將鍵入碼與驗證碼進行比對后,在比對不符時通過揚聲器播放警示語音。另外,驗證模塊140也可在錄制特征與所有語音特征比對不符的次數(shù)大于預設次數(shù)時,關閉此具有顯示裝置101的設備(即切斷電源)。
[0044]解鎖模塊150用以執(zhí)行解鎖指令對應的解鎖操作,例如:將顯示裝置101的鎖定狀態(tài)切換為未鎖定狀態(tài);將文檔或應用程序的鎖定狀態(tài)切換為開啟狀態(tài)。至此即完成顯示裝置101、文檔或應用程序的解鎖操作。然而,假設驗證模塊140在比對時無法找到符合的語音特征時,可產生提示信息供使用者瀏覽,并且由解鎖模塊150觸發(fā)接收模塊120再次收錄使用者的語音以作為錄制語音,此錄制語音同樣亦會經由處理模塊130解析生成錄制特征,以及經由驗證模塊140進行比對。
[0045]特別要說明的是,設備中的儲存模塊101可預先存儲有多個預置指令,在解鎖模塊150執(zhí)行所述解鎖指令對應的解鎖操作之前,先比對所述解鎖指令和所述預置指令是否符合,并且在符合時執(zhí)行所述解鎖指令對應的解鎖操作,在不符合時產生指令提示信息以顯示在顯示裝置101。舉例來說,假設預先儲存有三個預置指令分別為及“C”,當驗證模塊140解析錄制語音所得到的解鎖指令為“C”時,則執(zhí)行解鎖指令“C”對應的解鎖操作;當驗證模塊140解析錄制語音所得到的解鎖指令為“D”時,由于與所有預置指令不相符,所以產生指令提示信息,如:“查無該指令”,并且將此指令提示信息顯示在顯示裝置101。
[0046]接著,請參照圖2,圖2為本發(fā)明語音解鎖方法的方法流程圖,其步驟包括:在設備中預先存儲使用者的語音特征(步驟210);設備通過收音進行收錄使用者的語音以生成錄制語音(步驟220);解析錄制語音以生成錄制特征(步驟230);將錄制特征與語音特征進行比對,在比對符合時解析錄制語音得到解鎖指令,并且執(zhí)行此解鎖指令對應的解鎖操作(步驟240)。通過上述步驟,即可通過接收錄制語音并解析錄制語音以產生錄制特征,接著比對錄制特征與語音特征并在比對符合時解析錄制語音以得到解鎖指令,以及執(zhí)行此解鎖指令對應的解鎖操作。
[0047]在實際實施上,進行步驟240時,還可在執(zhí)行所述解鎖指令對應的解鎖操作之前,比對所述解鎖指令和多個預先儲存的預置指令,在符合時執(zhí)行所述解鎖指令對應的解鎖操作,在不符合時產生并顯示指令提示信息(步驟241);當解鎖指令包含的解鎖對象為鎖定狀態(tài)的顯示裝置101時,此解鎖指令對應的解鎖操作為將設備的顯示裝置101的鎖定狀態(tài)切換為未鎖定狀態(tài)(步驟242);以及當解鎖指令包含的解鎖對象記錄有文檔或應用程序的名稱或路徑時,此解鎖指令對應的解鎖操作為將文檔或應用程序的鎖定狀態(tài)切換為開啟狀態(tài)(步驟243)。另外,在步驟240之后,還可在錄制特征與所有語音特征比對不符的次數(shù)大于預設次數(shù)時,產生輸入區(qū)塊以接收鍵入碼,以及將此鍵入碼與預設的驗證碼進行比對,當比對不符時播放警示語音(步驟250)。所述預設的驗證碼及預設次數(shù)可由使用者自行預先設定,而警示語音則可通過揚聲器或喇叭進行播放。
[0048]以下結合圖3至圖6以實施例的方式進行如下說明,請先參照圖3,圖3為應用本發(fā)明的顯示裝置為鎖定狀態(tài)的示意圖。當顯示裝置101為鎖定狀態(tài)時,可顯示文字,如:“屏幕已鎖定,錄制語音中……”。此時,接收模塊120持續(xù)通過收音裝置(圖中未示出)進行收音,并且可根據音量變化感測到使用者發(fā)出語音時再進行錄制以生成錄制語音,以及在收音時過濾背景聲音。接著,處理模塊130解析此錄制語音的音量、音高、音色……等參數(shù)并進行記錄以生成錄制特征,稍后將結合【專利附圖】
【附圖說明】語音特征及錄制特征的生成方式。
[0049]接下來,驗證模塊140在錄制特征生成后,會將此錄制特征與儲存模塊110中的所有語音特征進行比對,并且在比對符合時,解析錄制語音以得到解鎖指令,然后由解鎖模塊150執(zhí)行此解鎖指令對應的解鎖操作,以便將顯示裝置101的鎖定狀態(tài)切換為未鎖定狀態(tài)。至此即完成顯示裝置101的解鎖操作。
[0050]如圖4所示意,圖4為應用本發(fā)明的語音特征及錄制特征的示意圖。前面提到,儲存模塊110儲存有語音特征;處理模塊130能夠生成錄制特征。在實際實施上,可如圖4所示意以頻譜的方式記錄語音特征410及錄制特征420,不過,雖然是以頻譜的方式記錄但實際儲存的方式仍然是二進制的數(shù)位文檔。在比對錄制特征與語音特征后,倘若比對符合則代表使用者為合法身份,可以使用此設備進行解鎖操作,因此,將解析錄制語音以得到解鎖指令,如:“Unlock”,以便解鎖模塊150執(zhí)行此解鎖指令將顯示裝置101的鎖定狀態(tài)切換為未鎖定狀態(tài),或是將文檔或應用程序的鎖定狀態(tài)切換為開啟狀態(tài)。至于驗證模塊140比對錄制特征及語音特征的方式則可根據現(xiàn)有的頻譜分析及頻率倒譜(cepstrum)分析的方式進行語音比對的處理,在此不再多作贅述。
[0051]請參照圖5,圖5為應用本發(fā)明再次收音以作為錄制語音的示意圖。前面提到,驗證模塊140在比對過程中找不到符合的語音特征時,可產生提示信息并顯示于顯示裝置101,如圖5所示意的提示信息510。在實際實施上,此提示信息510可包含錄制按鍵511,允許使用者通過點選此錄制按鍵511控制收音裝置(圖中未示出)的開啟與關閉。當使用者點選錄制按鍵511后,收音裝置開始收音并且進行錄制直到使用者再次點選錄制按鍵511時停止收音及錄制,并且將開始收音至停止收音期間所錄制的內容作為錄制語音。另外,在實際實施上,驗證模塊140亦可直接在提示信息510產生的次數(shù)(也就是錄制特征與所有語音特征比對不符的次數(shù))大于預設次數(shù)時,關閉此具有顯示裝置101的設備的電源。
[0052]如圖6所示意,圖6為應用本發(fā)明產生的輸入區(qū)塊的示意圖。前面提到,當提示信息510產生的次數(shù)大于預設次數(shù)時,驗證模塊140可如圖6所不意產生輸入區(qū)塊610,此輸入區(qū)塊610提供輸入元件611供使用者鍵入字串,并且在使用者完成鍵入后輸入區(qū)塊610接收此字串作為鍵入碼。此時,驗證模塊140會將鍵入碼與預設的驗證碼進行比對,當比對不符時通過揚聲器或喇叭(圖中未示出)播放警示語音以進行示警。
[0053]綜上所述,可知本發(fā)明與現(xiàn)有技術之間的差異在于通過接收錄制語音并解析錄制語音以產生錄制特征,接著比對錄制特征與語音特征并在比對符合時解析錄制語音以得到解鎖指令,以及執(zhí)行此解鎖指令對應的解鎖操作,通過這一技術手段可以解決現(xiàn)有技術所存在的問題,進而達成提高解鎖操作的安全性與便利性的技術效果。
[0054]雖然本發(fā)明以前述的實施例揭露如上,然其并非用以限定本發(fā)明,任何本領域技術人員,在不脫離本發(fā)明的精神和范圍內,當可作一些更動與潤飾,因此本發(fā)明的專利保護范圍須視本說明書所附的權利要求書所限定的內容為準。
【權利要求】
1.一種語音解鎖系統(tǒng),其特征在于,應用于具有顯示裝置的設備,該系統(tǒng)包含: 儲存模塊,用以預先儲存至少一個使用者的語音特征; 接收模塊,用以收錄使用者的語音以生成錄制語音; 處理模塊,用以解析該錄制語音以生成錄制特征; 驗證模塊,用以將該錄制特征與所述語音特征進行比對,并在比對符合時解析該錄制語音得到解鎖指令 '及 解鎖模塊,用以執(zhí)行該解鎖指令對應的解鎖操作。
2.如權利要求1所述的語音解鎖系統(tǒng),其特征在于,該解鎖指令包含解鎖對象,該解鎖對象為鎖定狀態(tài)的該顯示裝置,該解鎖指令對應的解鎖操作為將該設備的顯示裝置的鎖定狀態(tài)切換為未鎖定狀態(tài)。
3.如權利要求1所述的語音解鎖系統(tǒng),其特征在于,該解鎖指令包含至少一個解鎖對象,該解鎖對象記錄有文檔或應用程序的名稱或路徑,該解鎖指令對應的解鎖操作為將該文檔或應用程序的鎖定狀態(tài)切換為開啟狀態(tài)。
4.如權利要求1所述的語音解鎖系統(tǒng),其特征在于,該儲存模塊預先儲存有多個預置指令,在執(zhí)行所述解鎖指令對應的解鎖操作之前,比對所述解鎖指令和所述預置指令,在符合時執(zhí)行所述解鎖指令對應的解鎖操作,在不符合時產生并顯示指令提示信息。
5.如權利要求1所述的語音解鎖系統(tǒng),其特征在于,該驗證模塊還包含預設驗證碼,并且在該錄制特征與所有語音特征比對不符的次數(shù)大于預設次數(shù)時,產生輸入區(qū)塊以接收鍵入碼,以及將該鍵入碼與該驗證碼進行比對,當比對不符時播放警示語音。
6.一種語音解鎖方法,其特征在于,應用于具有顯示裝置的設備,其步驟包括: 在該設備中預先存儲至少一個使用者的語音特征; 該設備進行收錄使用者的語音以生成錄制語音; 解析該錄制語音以生成錄制特征;及 將該錄制特征與所述語音特征進行比對,在比對符合時解析該錄制語音得到解鎖指令,并且執(zhí)行該解鎖指令對應的解鎖操作。
7.如權利要求6所述的語音解鎖方法,其特征在于,該解鎖指令包含解鎖對象,該解鎖對象為鎖定狀態(tài)的該顯示裝置,該解鎖指令對應的解鎖操作為將該設備顯示裝置的鎖定狀態(tài)切換為未鎖定狀態(tài)。
8.如權利要求6所述的語音解鎖方法,其特征在于,該解鎖指令包含至少一個解鎖對象,該解鎖對象記錄有文檔或應用程序的名稱或路徑,該解鎖指令對應的解鎖操作為將該文檔或應用程序的鎖定狀態(tài)切換為開啟狀態(tài)。
9.如權利要求6所述的語音解鎖方法,其特征在于,設備中預先存儲有多個預置指令,在執(zhí)行所述解鎖指令對應的解鎖操作之前,比對所述解鎖指令和所述預置指令,在符合時執(zhí)行所述解鎖指令對應的解鎖操作,在不符合時產生并顯示指令提示信息。
10.如權利要求6所述的語音解鎖方法,其特征在于,該方法還包含預設驗證碼,并且在該錄制特征與所有語音特征比對不符的次數(shù)大于預設次數(shù)時,產生輸入區(qū)塊以接收鍵入碼,以及將該鍵入碼與該驗證碼進行比對,當比對不符時播放警示語音的步驟。
【文檔編號】G10L15/02GK103680504SQ201210349570
【公開日】2014年3月26日 申請日期:2012年9月18日 優(yōu)先權日:2012年9月18日
【發(fā)明者】謝天 申請人:英業(yè)達科技有限公司, 英業(yè)達股份有限公司