專利名稱:一種云模式的語音鑒權系統(tǒng)的制作方法
技術領域:
本發(fā)明涉及系統(tǒng)軟件及語音識別等技術領域,特別是指一種云模式的語音鑒權系統(tǒng)。
背景技術:
隨著互聯(lián)網技術,特別是互聯(lián)網技術和軟件技術的發(fā)展,為基于語音的聲紋識別的鑒權系統(tǒng)提供了可行性。目前傳統(tǒng)的鑒權模式通過用戶名密碼方式進行驗證,用戶名與密碼方式存在一定的安全風險,存在信息泄露的可能性,隨著生物識別技術的發(fā)展,尤其是語音識別與聲紋識別技術的發(fā)展,為基于生物識別方式的鑒權認證提供了可行性,同時,云計算技術的發(fā)展,為各種遠程功能的獲取提供了條件,結合云計算技術和生物識別技術進行鑒權認證,進一步提高了鑒權認證的安全性。有鑒于此,本發(fā)明的目的在于提出一種結合云計算技術的語音識別以及聲紋識別的一種云模式的語音鑒權系統(tǒng)。
發(fā)明內容
從上面所述可以看出,本發(fā)明提供的一種云模式的語音鑒權系統(tǒng),通過隨機抽取語音驗證問題和答案,注冊用戶通過理解語音問題并進行回答后系統(tǒng)進行回答內容的判斷和語音特征即聲紋的識別確認用戶身份和驗證問題的回答,實現(xiàn)一種安全性更高的一種云模式的語音鑒權系統(tǒng)。
具體來說具有以下優(yōu)點:
生物特征識別:
基于語音特征的聲紋識別,具備與指紋類似的生物識別的唯一性識別功能,可以替代一般應用場景下的密碼,安全可靠。使用方便:
用戶簡單的回答系統(tǒng)隨機抽取的簡單問題即可進行識別和鑒權,使用方式簡單快捷。云模式應用:
基于云服務模式的應用,將語音識別和聲紋識別功能嵌入和耦合到各種應用系統(tǒng)中,擴展性強,應用方式靈活。隨機防偽:
系統(tǒng)隨機抽取問題并要求用戶進行語音回答,系統(tǒng)進行語音內容的識別,以防止錄音播放方式的攻擊,有效地提高了系統(tǒng)應用的安全性。
此處所說明的附圖用來提供對本發(fā)明的進一步理解,構成本申請的一部分,本發(fā)明的示意性實施例及其說明用于解釋本發(fā)明,并不構成對本發(fā)明的不當限定。在附圖中:
圖1為本發(fā)明系統(tǒng)模塊結構的示意圖。圖2為本發(fā)明業(yè)務流程示意圖。
具體實施例方式下面參照附圖對本發(fā)明進行更全面的描述,其中說明本發(fā)明的示例性實施例。為實現(xiàn)上述目的,提出了一種云模式的語音鑒權系統(tǒng)。以下通過結合附圖,對本發(fā)明的實施方式進行描述。
實現(xiàn)一種云模式的語音鑒權系統(tǒng)的關鍵點如下:
聲紋識別:
通過提取語音波形中反映說話人生理和行為特征的語音參數作為聲音生物特征,基于聲音的生物特征進行識別,具備與指紋識別類似的功能,自動識別說話人身份。語音識別:
為了防止機器播放錄音,系統(tǒng)進行隨機問題的抽取并要求用戶回答簡單的問題,并基于用戶回答語音進行內容的識別驗證。云服務:
系統(tǒng)將聲紋識別和語音識別以云服務方式進行封裝,通過服務接口和網絡開放給系統(tǒng)進行使用,系統(tǒng)與服務之間進行輕量級耦合,擴展了系統(tǒng)的延展性。用戶驗證:
系統(tǒng)隨機性抽取數據庫保存的各種問題,要求用戶進行語音的回答,系統(tǒng)獲取用戶語音并進行內容的識別后驗證用戶聲紋與回答內容的準確性,一致則認為驗證通過,以此防止錄音播放攻擊。
主要功能模塊
如圖1所不,一種云模式的語音鑒權系統(tǒng)的系統(tǒng)結構主要包括:
用戶側:
語音設備100:
用戶端語音接入設備,包含電話,移動終端,帶有語音功能的電腦等設備,可以接入到系統(tǒng)語音平臺。語音接入101:
用于接入到系統(tǒng)語音系統(tǒng)的接入模塊,將用戶的語音設備通過傳輸通道接入到系統(tǒng)語音平臺。傳輸通道102:
提供語音接入和傳輸的通道,包含電話網,寬帶數據網等物理通道,為用戶的語音接入和語音數據的傳輸提供了通道。
系統(tǒng)側:
管理配置模塊103
系統(tǒng)管理功能模塊,包含用戶管理,邏輯管理、參數配置等各種管理功能,對系統(tǒng)進行各種管理和配置。語音接口模塊104:
提供用戶訪問系統(tǒng)語音接口,將用戶語音通過接口接入到系統(tǒng)的各個功能業(yè)務模塊并提供基于業(yè)務邏輯的語音流程的跳轉。驗證數據庫105:
提供各種驗證問題及答案的數據管理容器,并提供各種數據庫的基礎功能。聲紋數據庫106:
提供各種用戶注冊的語音生物特征即聲紋數據的數據管理容器,并提供各種數據庫的基礎功能。驗證數據抽取107:
負責從驗證數據庫隨機抽取驗證問題和答案,提供給鑒權功能模塊進行問題驗證。驗證答案驗證108:
根據鑒權功能模塊的業(yè)務邏輯與根據用戶提供的語音回答數據識別的內容進行答案的驗證,并將驗證的結果提供給鑒權邏輯模塊。
語音數據采集109:
負責采集用戶接入的語音數據,并將采集的語音數據提供給其他相關的功能模塊,如語音識別模塊等。鑒權邏輯處理模塊110
負責鑒權的業(yè)務邏輯流程的執(zhí)行與邏輯控制,根據不同的業(yè)務參數控制業(yè)務邏輯流程,包含鑒權業(yè)務,語音播放流程控制等,判斷用戶鑒權的結果并將鑒權結果提供給響應的系統(tǒng)模塊。語音合成模塊111:
將提取的驗證問題數據通過語音合成模塊進行播放,提供文本到語音的轉換功能,用戶通過語音方式獲取到系統(tǒng)播放的驗證問題。語音識別模塊111:
負責將語音采集模塊獲取的用戶語音數據進行語音內容的識別,提供語音到文本的轉換功能,并將識別的結果提供給驗證答案驗證模塊進行用戶回答內容的驗證比較。聲紋識別模塊112:
負責用戶的聲紋數據進行注冊和對語音采集模塊獲取的用戶語音數據進行用戶語音聲紋的識別,并與聲紋數據庫進行數據比對以鑒別用戶身份。系統(tǒng)門戶113:
系統(tǒng)用戶登入門戶的系統(tǒng)的門戶,提供用戶使用系統(tǒng)的界面和各種業(yè)務流程的承載。
下面舉一個例子來說明本發(fā)明基于云模式的語音的識別鑒權工作流程,該實施例中,業(yè)務包括以下步驟:
預置條件:用戶在系統(tǒng)注冊,系統(tǒng)注冊了用戶的語音特征作為聲紋數據。
步驟1:用戶通過網絡或電話等具備語音傳輸功能的方式訪問系統(tǒng),訪問系統(tǒng)登錄頁面;
步驟2:系統(tǒng)隨機抽取驗證問題,語音方式播放給用戶,提示用戶進行驗證問題的回
答;
步驟3:用戶聽到系統(tǒng)的問題后,進行語音方式的回答;
步驟4.系統(tǒng)獲取和記錄用戶語音內容,進行聲紋和語音內容的識別;
步驟5.系統(tǒng)比對用戶聲紋數據,進行用戶身份的確認;
步驟6.系統(tǒng)識別用戶語音內容進行問題答案的確認;
步驟7.根據聲紋識別身份和用戶回答問題的比對結果,系統(tǒng)判定本次用戶登錄是否正確。步驟8.根據系統(tǒng)判斷結果,用戶進入到系統(tǒng)或提示用戶登錄錯誤信息,提示用戶再次進行登錄操作。
本發(fā)明的描述是為了示例和說明起見而給出的,而并不是無遺漏的或者將本發(fā)明限于所公開的形式。很多修改和變化對于本領域的普通技術人員而言是顯然的。選擇和描述實施例是為了更好說明本發(fā)明的原理和實際應用,并且使本領域的普通技術人員能夠理解本發(fā)明從而設計適于特定用途的帶有各種修改的各種實施例。
權利要求
1.一種云模式的語音鑒權系統(tǒng),其特征在于,用戶在系統(tǒng)注冊用戶信息和提供聲音樣本數據,系統(tǒng)進行分析和處理提取聲音的特征作為聲紋數據,并將聲紋識別功能封裝成遠程服務提供給系統(tǒng)使用,鑒權時系統(tǒng)通過隨機抽取系統(tǒng)驗證問題并要求用戶回答,用戶客戶端獲取用戶聲音數據后通過云模式聲紋識別和語音內容識別并依據識別結果進行鑒權。
2.如權利要求1所述,用戶需注冊用戶信息和聲音信息,其特征在于,用戶注冊用戶信息,包含用戶名,密碼等信息,并提供聲音數據樣本,系統(tǒng)進行聲音的分析和處理,提取聲音的特征數據保存到數據庫并與用戶身份進行關聯(lián)。
3.如權利要求1所述,系統(tǒng)將聲紋識別功能進行封裝后以服務方式進行調用,其特征在于,系統(tǒng)將用戶注冊提供的聲音數據提取特征值后作為聲紋數據,并將識別用戶聲音功能作為服務方式進行開放,系統(tǒng)通過本地或遠程云服務調用模式請求系統(tǒng)調用。
4.如權利要求3所述,系統(tǒng)通過請求聲紋識別云服務進行用戶的鑒權和識別,其特征在于,用戶端嵌入聲音采集模塊和服務請求模塊,如麥克風與聲音采集模塊,用戶在進行鑒權時,系統(tǒng)下發(fā)驗證問題并通過用戶終端系統(tǒng)采集用戶語音數據,將該數據作為分析樣本發(fā)起對系統(tǒng)云聲紋識別服務的請求,系統(tǒng)進行處理和識別后將結果返回到第三方系統(tǒng)。
5.如權利要求4所述,系統(tǒng)抽取隨機問題要求用戶回答,其特征在于,為防止錄音方式的欺騙,系統(tǒng)隨機抽取系統(tǒng)驗證庫驗證問題數據,要求用戶按照問題要求進行回答,通過隨機性問題和回答,保證用戶端非機器操作,同時,系統(tǒng)語音識別功能識別用戶回答的語音內容并與驗證問題答案進行比對,比對聲紋與語音內容正確才可認為本次鑒權成功。
全文摘要
本發(fā)明公開了一種云模式的語音鑒權系統(tǒng),包含聲音采集模塊,聲紋注冊模塊,業(yè)務邏輯模塊,聲紋驗證服務模塊等。本發(fā)明通過用戶在系統(tǒng)進行注冊用戶信息和聲音信息,系統(tǒng)采集用戶聲音樣本特征作為聲紋數據保存,同時,系統(tǒng)將聲紋比對功能封裝成網絡服務提供給系統(tǒng)進行使用,鑒權功能模塊通過采集用戶聲音數據后,提供聲音樣本數據請求系統(tǒng)聲紋識別服務進行語音和聲紋的識別,通過識別結果判斷用戶身份進行鑒權。通過基于聲音與聲紋采集和識別,實現(xiàn)了類似指紋方式的鑒權功能,提供了一種使用簡單快捷遠程鑒權識別服務。
文檔編號H04L29/06GK103078828SQ20111032762
公開日2013年5月1日 申請日期2011年10月25日 優(yōu)先權日2011年10月25日
發(fā)明者顧健 申請人:上海博路信息技術有限公司