基于聲紋特征的遠(yuǎn)程認(rèn)證支付的系統(tǒng)與方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種基于聲紋特征的遠(yuǎn)程認(rèn)證支付的系統(tǒng)與方法,尤其涉及一種文本依存型的支付用語音認(rèn)證系統(tǒng)。
【背景技術(shù)】
[0002]到目前為止,語音是作為系統(tǒng)使用者的身份確認(rèn)的一個(gè)方法。近年來,在移動(dòng)環(huán)境中的電子商務(wù)交易等的個(gè)人認(rèn)證中,使用作為生物測定學(xué)認(rèn)證之一的指紋認(rèn)證的情況很多。但是,指紋認(rèn)證另外需要特別的傳感器,而在利用語音來進(jìn)行個(gè)人認(rèn)證時(shí),由于作為傳感器的麥克風(fēng)等往往已經(jīng)嵌入在當(dāng)前設(shè)備之中,因此便攜終端更加適合于移動(dòng)環(huán)境下的語音認(rèn)證。
[0003]同時(shí),在當(dāng)前時(shí)代,隨著金錢交流范圍與速度的擴(kuò)大,對(duì)于支付手段的便捷與安全提出了更高的要求。
[0004]而在現(xiàn)有支付手段中,比如網(wǎng)絡(luò)銀行等,往往需要特定地點(diǎn)下的特定終端進(jìn)行操作,對(duì)于支付手段限制較多。
[0005]而諸如銀行卡ATM機(jī)直接支付等方法,一方面需要大量的ATM終端支持,另一方面也因?yàn)槠浒踩缘拖露鴱V受詬病。
[0006]語音認(rèn)證大致分為文本依存型和文本獨(dú)立型兩種。
[0007]文本依存型是這樣一種方式,即:預(yù)先讓使用者朗讀關(guān)鍵詞(密碼)或句子,來登錄該語音,在認(rèn)證時(shí),使使用者說出與登錄時(shí)相同的關(guān)鍵詞或句子,來進(jìn)行認(rèn)證,文本獨(dú)立型是與說話內(nèi)容無關(guān)而僅通過音質(zhì)來進(jìn)行認(rèn)證的方式。
[0008]因此,在文本獨(dú)立型的情況下,不需要決定關(guān)鍵詞等,使用者可通過任意的發(fā)生內(nèi)容來進(jìn)行登錄及認(rèn)證。本發(fā)明設(shè)計(jì)前一種的文本依存型的語音認(rèn)證。
【發(fā)明內(nèi)容】
[0009]鑒于上述問題,本發(fā)明的目的是提供一種在文本依存型語音認(rèn)證系統(tǒng)中,通過防止關(guān)鍵詞的泄漏和錄音詐騙,使用關(guān)鍵詞及驗(yàn)證語句來維持高認(rèn)證精度,保護(hù)交易內(nèi)容和實(shí)現(xiàn)身份認(rèn)證的語音認(rèn)證系統(tǒng)。
[0010]為了實(shí)現(xiàn)上述目的,本發(fā)明的基于聲紋特征的認(rèn)證系統(tǒng),對(duì)關(guān)鍵詞及驗(yàn)證語句進(jìn)行語音輸入而進(jìn)行認(rèn)證的文本依存型語音認(rèn)證系統(tǒng),其特征在于,具有:業(yè)務(wù)處理模塊,按用戶的業(yè)務(wù)請(qǐng)求進(jìn)行相應(yīng)的處理;硬件加密機(jī),在其中存儲(chǔ)有主密鑰,用于完成數(shù)據(jù)加解密運(yùn)算;語音接入模塊,它通過支付終端設(shè)備與業(yè)務(wù)平臺(tái)連接,接收從所述支付終端送來的語音請(qǐng)求包,下發(fā)服務(wù)菜單及控制終端的操作界面,指導(dǎo)用戶完成操作,并將用戶輸入的數(shù)據(jù)送交所述業(yè)務(wù)處理模塊;以及支付服務(wù)提供商接入模塊,它與所述支付服務(wù)提供商連接,接收從業(yè)務(wù)處理模塊來的請(qǐng)求包,轉(zhuǎn)換成支付服務(wù)提供商內(nèi)部協(xié)議,并發(fā)往所述支付服務(wù)提供商。
[0011]根據(jù)該結(jié)構(gòu),用戶在從事支付行為之前,需要預(yù)先設(shè)置好一些用于認(rèn)證時(shí)候驗(yàn)證使用的關(guān)鍵詞。
[0012]在從事支付行為時(shí),用戶應(yīng)當(dāng)在可以接受的地點(diǎn),進(jìn)行與關(guān)鍵詞相同的語音輸入供系統(tǒng)驗(yàn)證;之后系統(tǒng)會(huì)隨機(jī)提供5到10字的語音,用戶需要語音輸入與系統(tǒng)提示相同的語音。
[0013]這里的關(guān)鍵詞應(yīng)當(dāng)與支付行為有關(guān),從而保證整個(gè)系統(tǒng)的使用效率。
[0014]凡有任一項(xiàng)語音輸入有誤,則退出系統(tǒng),直到驗(yàn)證通過。因?yàn)椴扇×伺c支付行為相關(guān)但卻嚴(yán)格的行為流程,可以最大限度上保證整個(gè)支付行為的效率以及安全。
[0015]同時(shí),在該結(jié)構(gòu)中具有對(duì)于關(guān)鍵詞進(jìn)行驗(yàn)證輸入的模塊,其中包括:輸入模塊,將輸入的語音以可發(fā)聲的單位為最小單位而分割為多個(gè)部分的關(guān)鍵詞,對(duì)每個(gè)所述部分隔開時(shí)間間隔經(jīng)多次接收;聲紋模型存儲(chǔ)模塊,其預(yù)先存儲(chǔ)用戶的認(rèn)證關(guān)鍵詞,并將該登錄關(guān)鍵詞作為聲紋對(duì)比模型;類似度計(jì)算模塊,根據(jù)在所述輸入模塊中提取的語音的特征量求出與所述用戶聲紋模型之間的類似度;語音內(nèi)容判斷模塊,其根據(jù)所述類似度計(jì)算模塊所求出的類似度,通過所述多次語音輸入來判斷與發(fā)聲內(nèi)容有關(guān)的信息;關(guān)鍵詞確認(rèn)模塊,其根據(jù)所述發(fā)聲內(nèi)容判斷模塊所判斷的與發(fā)聲內(nèi)容有關(guān)的信息,判斷利用所述多次語音輸入的發(fā)聲內(nèi)容能否構(gòu)成認(rèn)證關(guān)鍵詞;支付認(rèn)證模塊,其根據(jù)所述關(guān)鍵詞確認(rèn)部的判斷結(jié)果和所述類似度計(jì)算部所求出的類似度,判斷接受還是拒絕支付。
[0016]在這個(gè)結(jié)構(gòu)中,將關(guān)鍵詞通過以可發(fā)生的單位作為最小單位而分割為多個(gè)部分來進(jìn)行語音輸入,在周圍有他人的環(huán)境中進(jìn)行認(rèn)證時(shí),可以防止整個(gè)關(guān)鍵詞的泄漏。
[0017]另外,由于不一次連續(xù)發(fā)出整個(gè)關(guān)鍵詞,所以可以防止整個(gè)關(guān)鍵詞被錄音,同時(shí)隨機(jī)驗(yàn)證語句也可抑制錄音詐騙。
[0018]并且,在關(guān)鍵詞確認(rèn)部中,判斷通過多次的語音輸入,構(gòu)成的路關(guān)鍵詞的所有的音韻的語音輸入是否完成,并根據(jù)該判斷結(jié)果和類似度計(jì)算部所求出的類似度,來判斷接受還是拒絕認(rèn)證,從而可以提供高精度的文本依存型語音認(rèn)證系統(tǒng)。
[0019]為了實(shí)現(xiàn)上述目的,本發(fā)明的計(jì)算機(jī)程序,是實(shí)現(xiàn)對(duì)關(guān)鍵詞進(jìn)行語音輸入而進(jìn)行認(rèn)證的文本依存型語音認(rèn)證系統(tǒng),其特征在于,使計(jì)算機(jī)執(zhí)行如下處理:輸入處理,將以可發(fā)生的單位為最小單位而分割為多個(gè)部分的關(guān)鍵詞的語音輸入,對(duì)每個(gè)所屬部分隔開時(shí)間間隔經(jīng)多次來接受;地點(diǎn)處理,對(duì)于每次語音輸入的地點(diǎn)進(jìn)行讀取,并對(duì)一次支付行為中多次讀取的地點(diǎn)位置進(jìn)行比較;外部接口處理,將核實(shí)后確認(rèn)的支付信息與外部金融機(jī)構(gòu)用戶接口對(duì)接進(jìn)行業(yè)務(wù)交接。
[0020]記錄了上述計(jì)算機(jī)程序的記錄媒體也是本發(fā)明的一個(gè)方面。
【附圖說明】
[0021 ] 圖1是表示本發(fā)明的概略結(jié)構(gòu)的框圖。
[0022]圖2是表示本發(fā)明的語音認(rèn)證子系統(tǒng)的概略結(jié)構(gòu)的框圖。
[0023]圖3是表示本發(fā)明的基于聲紋特征的認(rèn)證系統(tǒng)的概略結(jié)構(gòu)的框圖。
[0024]圖4是表示本發(fā)明的支付行為流程的一個(gè)具體實(shí)施例。
【具體實(shí)施方式】
[0025]圖1是表示本系統(tǒng)的概略結(jié)構(gòu)的框圖。
[0026]首先將本系統(tǒng)的使用者的聲紋信息統(tǒng)一采集進(jìn)入數(shù)據(jù)庫101,采集步驟一般應(yīng)當(dāng)為以使用者本人語音錄取的方式在系統(tǒng)維護(hù)人員的指導(dǎo)下進(jìn)行。
[0027]本采集方式并不需要使用者輸入所有的語音字符,而僅僅以足夠多的輸入以保證得到其特殊的聲紋信息為止。
[0028]其次由本系統(tǒng)的使用者個(gè)人指定使用本系統(tǒng)時(shí)需要系統(tǒng)提供的語音關(guān)鍵詞102,一般應(yīng)當(dāng)分為提問和答案兩個(gè)部分,并應(yīng)當(dāng)提供兩套及兩套以上的組合以保證安全性。
[0029]提問和答案兩個(gè)部分的內(nèi)容均由使用者個(gè)人指定,包括系統(tǒng)維護(hù)人員在內(nèi)的其他人員在沒有得到使用者本人允許的情況下無法獲得該內(nèi)容。
[0030]然后在使用本系統(tǒng)的時(shí)候,通過使用者指定好的關(guān)鍵詞以及系統(tǒng)隨機(jī)給出的驗(yàn)證語句對(duì)使用者的身份進(jìn)行語音支付認(rèn)證103,該認(rèn)證方法應(yīng)當(dāng)盡可能的私密以及隨機(jī)以保證系統(tǒng)使用過程中的安全。
[0031]最后在以上步驟完成后由系統(tǒng)給出認(rèn)證成功的提示并由使用者進(jìn)行支付交易操作 104。
[0032]本系統(tǒng)中除了語音輸入以及語音驗(yàn)證之外的安全問題不在本系統(tǒng)的考慮范圍之內(nèi)。
[0033]圖2是表示本發(fā)明的語音認(rèn)證子系統(tǒng)的概略結(jié)構(gòu)的框圖。
[0034]本子系統(tǒng)屬于本發(fā)明所述系統(tǒng)中的一部分,其作用是獲取用戶輸入的語音信息、提取其聲紋及內(nèi)容信息,并將這些信息與數(shù)據(jù)庫中已存在信息進(jìn)行比較以給出結(jié)果。
[0035]本子系統(tǒng)中含有一個(gè)輸入模塊201,負(fù)責(zé)接收從硬件中傳來的使用者的語音信息。
[0036]本子系統(tǒng)中含有一個(gè)聲紋模型存儲(chǔ)模塊202,負(fù)責(zé)將使用者輸入的語音信息的聲紋進(jìn)行存儲(chǔ)以便后面操作使用。
[0037]該存儲(chǔ)模塊內(nèi)信息的有效期與本發(fā)明系統(tǒng)的使用周期同長。
[0038]本子系統(tǒng)中含有一個(gè)用戶語音模型數(shù)據(jù)庫203,其中包含有所有已經(jīng)錄取好的用戶的聲紋以及關(guān)鍵詞信息。
[0039]本子系統(tǒng)中含有一個(gè)類似度計(jì)算模塊204,負(fù)責(zé)計(jì)算使用者語音輸入的語音聲紋信息與用戶音階模型數(shù)據(jù)庫203中所含的用戶聲紋信息的類似度。
[0040]本子系統(tǒng)中含有一個(gè)內(nèi)容判斷模塊205,負(fù)責(zé)在類似度計(jì)算模塊204計(jì)算出來的類似度的基礎(chǔ)上判斷并給出使用者語音輸入的信息的內(nèi)容。
[0041]本子系統(tǒng)中含有一個(gè)關(guān)鍵詞確認(rèn)模塊206,負(fù)責(zé)判斷用戶輸入的語音信息的內(nèi)容是否與用戶音階模型數(shù)據(jù)庫203中的關(guān)鍵詞相符。
[0042]本子系統(tǒng)中含有一個(gè)支付認(rèn)證模塊207,負(fù)責(zé)確認(rèn)以上所有認(rèn)證的結(jié)果并決定是否允許進(jìn)行支付操作。
[0043]使用者在使用本子系統(tǒng)時(shí),首先通過輸入模塊201進(jìn)行語音輸入,輸入后的語音信息通過聲紋模型存儲(chǔ)模塊202