專利名稱:電子商務(wù)交易方法
技術(shù)領(lǐng)域:
本發(fā)明關(guān)于一種電子商務(wù)交易方法,其特別有關(guān)于進行電子商務(wù)交易的聲紋驗證外,另結(jié)合高斯分布機率、動態(tài)時間校準(zhǔn)算法及隱藏式馬可夫模式,并利來維特比(Viterbi)算法獲得最相似路徑,以便計算模型參數(shù)的聲紋驗證系統(tǒng)。
背景技術(shù):
現(xiàn)有的電子商務(wù)交易方法,如中國臺灣專利公告第385416號“電子商務(wù)系統(tǒng)”的發(fā)明專利,其揭示一種在網(wǎng)絡(luò)上的交易記錄(transaction log)提供存盤安全(archiving safety)的電子商務(wù)系統(tǒng)(commerce system),其包括一對話密鑰產(chǎn)生器(session key creator)用以產(chǎn)生一對話密鑰以加密該交易記錄;交易記錄加密器(encryptor)用以加密使用該對話密鑰的該交易記錄;及交易記錄發(fā)送器用以將該已加密交易記錄發(fā)送至該網(wǎng)絡(luò)上的存盤服務(wù)器(server)。然而,該385416號僅將交易記錄加密以便進行數(shù)據(jù)傳輸及儲存,未針對使用者加以辨識身份。
另一個現(xiàn)有的電子商務(wù)交易方法,如中國臺灣專利公告第550477號“網(wǎng)站帳戶的方法、系統(tǒng)及計算機可讀取媒體及自中央位置的電子商務(wù)管理”的發(fā)明專利,其揭示一種用以管理一使用者在目的地電子商務(wù)網(wǎng)站上進行線上(中央網(wǎng)站)金融交易的方法,其包括登入使用者至目的地電子商務(wù)網(wǎng)站;產(chǎn)生該使用者于該中央網(wǎng)站中的唯一使用者名稱及密碼;利用該唯一使用使用者名稱及密碼在或多個目的地網(wǎng)站上進行注冊;傳輸一啟用指令至處理金融交易的金融機構(gòu)用以啟動該使用者的信用卡或簽帳卡帳戶;當(dāng)該信用卡或簽帳卡帳戶為啟用狀態(tài)時,經(jīng)由該目的地電子商務(wù)網(wǎng)站發(fā)送該信用卡或簽帳卡帳戶的付費請求至該金融機構(gòu);及傳輸一撤銷指令至該金融機構(gòu)以撤銷該信用卡或簽帳卡帳戶;其中當(dāng)該信用卡或簽帳卡帳戶為啟用狀態(tài)時,該金融機構(gòu)只接受及處理從該電子商務(wù)網(wǎng)站所接收的付費請求;及其中當(dāng)該信用卡或簽帳卡帳戶為撤銷狀態(tài)時,該金融機構(gòu)拒絕付費請求。然而,該第550477號僅利用使用者的唯一名稱及密碼加以辨識身份,因此其具有密碼泄漏的疑慮。
簡言之,該第385416號及第550477號的電子商務(wù)交易。需要進步加以改進,以便能準(zhǔn)確辨識使用者的身份。
至于現(xiàn)有的聲紋驗證方法,如中國臺灣專利公告第490655號“利用聲譜信息辯識使用者的方法與其裝置”的發(fā)明專利,其利用不同使用者特有的聲譜信息辨識使用者的身份,以決定使用者是否經(jīng)過授權(quán)。該方法包含步驟(1)、使用者發(fā)出語音后,偵測語音的終點;(2)、自該語音的聲譜中取出語音特征;(3)、決定是否需要訓(xùn)練,若是,則將該語音特征作為參考樣本,同時設(shè)定界限,若否,則進行下步驟;(4)、將該語音特征與參考樣本進行圖樣比較;(5)、依該比較結(jié)果計算兩者之間的距離;(6)、將該計算結(jié)果與設(shè)定界限比較;(7)、依該比較結(jié)果決定該使用者是否為授權(quán)使用者。該方法使用于行動電話,其利用聲譜分析方法將語音的獨特信息取出,由此進行辨識使用者的方法。該第490655號主要利用每一時框(frame)的主要值與使用者設(shè)定的界限進行比較,決定語音的始點與終點后,再利用Princen-Bradley濾波器轉(zhuǎn)換已偵測的語音信號,以便取得其對應(yīng)聲譜圖案。該聲譜圖案與預(yù)先儲存的參考聲譜樣本進行比較,以辨識使用者的聲紋。
簡言之,該第490655號需要進行圖案的匹配及距離的運算,若該運算距離未超過界限時,使用者即可通過聲紋辨識。然而,該第490655號在進行圖案的匹配及距離的運算時,必須計算在參考樣本及測試樣本之間的距離。事實上,該參考樣本所占用數(shù)據(jù)庫的空間相當(dāng)大,因此其不但需要較大的數(shù)據(jù)庫空間且需要更長的檔案傳輸時間。若將該聲紋驗證技術(shù)能應(yīng)用在電子商務(wù)交易時,具有延長交易時間的缺點。
因此,該第490655號仍有必要進步改良其參考樣本的占用空間的問題,如此能節(jié)省儲存參考樣本的數(shù)據(jù)庫空間,以避免使用者數(shù)量的限制。利用減少該參考樣本的位的方法,更能加速聲紋驗證所需時間,且更能提升辨識率,以便將聲紋驗證技術(shù)能應(yīng)用在電子商務(wù)交易時,能縮短交易的時間。
有鑒于此,本發(fā)明改進上述的缺點,其在進行電子商務(wù)交易時,除了利用聲紋驗證系統(tǒng)進行辨識使用者的身份外,且該聲紋驗證系統(tǒng)另結(jié)合高斯分布機率、動態(tài)時間校準(zhǔn)算法及隱藏式馬可夫模式,并利用維特比算法獲得最相似路徑,以便計算模型參數(shù)。
發(fā)明內(nèi)容
本發(fā)明主要目的是提供一種電子商務(wù)交易方法,該方法在進行電子商務(wù)交易時,利用聲紋驗證系統(tǒng)進行辨識使用者的身份,使本發(fā)明具有提升辨識率的功效。
本發(fā)明次要目的是提供一種電子商務(wù)交易的聲紋驗證系統(tǒng),其除了進行電子商務(wù)交易的聲紋驗證外,其另結(jié)合高斯分布機率、動態(tài)時間校準(zhǔn)算法及隱藏式馬可夫模式,并利用維特比算法獲得最相似路徑,以便計算模型參數(shù),使本發(fā)明具有簡化訓(xùn)練及測試作業(yè)的功效。
根據(jù)本發(fā)明的電子商務(wù)交易方法,該方法包含步驟客戶帳號由一連接裝置進行登錄;利用一可辨識裝置確認(rèn)客戶基本資料;該可辨識裝置進行核對是否已申請聲紋比較;利用一聲紋驗證系統(tǒng)選擇進行聲紋辨識或注冊聲紋辨識;及該可辨識裝置決定允許或拒絕進行電子商務(wù)交易。
本發(fā)明的聲紋驗證系統(tǒng)包含前端處理部、特征擷取部、一訓(xùn)練系統(tǒng)及一測試系統(tǒng),以便對原始輸入語音資料進行訓(xùn)練或測試作業(yè)。在訓(xùn)練語音上,該訓(xùn)練系統(tǒng)利用該前端處理部自該原始輸入語音資料擷取有效訓(xùn)練語音信息;再利用該特征擷取部進行擷取該有效訓(xùn)練語音特征;再進行運算該有效訓(xùn)練語音信息以獲得最相似路徑,以便作為模型參數(shù)。同樣在測試語音上,該測試系統(tǒng)利用該前端處理部自該原始輸入語音資料擷取有效測試語音信息;再利用該特征擷取部進行擷取該有效測試語音特征;再進行運算該測試語音特征與模型參數(shù)之間相似機率以便輸出一辨識結(jié)果。
圖1為本發(fā)明較佳實施例電子商務(wù)交易的聲紋驗證系統(tǒng)的流程圖。
圖2為本發(fā)明較佳實施例的聲紋驗證系統(tǒng)的流程方塊圖。
圖3為本發(fā)明較佳實施例的聲紋驗證系統(tǒng)的狀態(tài)及音框的關(guān)系示意圖。
圖4為本發(fā)明較佳實施例的聲紋驗證系統(tǒng)的音框與狀態(tài)的初始分配模式示意圖。
圖5為本發(fā)明較佳實施例的聲紋驗證系統(tǒng)的狀態(tài)轉(zhuǎn)換示意圖。
圖6為本發(fā)明較佳實施例的聲紋驗證系統(tǒng)的最相似路徑示意圖。
圖7為本發(fā)明較佳實施例的聲紋驗證系統(tǒng)的均分音框示意圖。
圖8為本發(fā)明較佳實施例的聲紋驗證系統(tǒng)的第一次重新分配音框示意圖。
圖9為本發(fā)明較佳實施例的聲紋驗證系統(tǒng)的第二次重新分配音框示意圖。
圖10為本發(fā)明較佳實施例的聲紋驗證系統(tǒng)的最佳分配音框示意圖。
圖號說明1聲紋驗證系統(tǒng)10訓(xùn)練系統(tǒng)20測試系統(tǒng)具體實施方式
圖1揭示本發(fā)明較佳實施例電子商務(wù)交易的聲紋驗證系統(tǒng)的流程圖。
請參照圖1所示,本發(fā)明較佳實施例電子商務(wù)交易的聲紋驗證系統(tǒng)在開始進行交易時,首先將客戶帳號由連接裝置進行登錄。該連接裝置包含個人計算機(personal computer)、一自動存提款機(automated Teller Machine)、一特約商店刷卡機(credit card Verifier)等,即可連接進行一般商務(wù)交易。
請再參照圖1所示,接著,將客戶基本資料傳送至聲紋驗證中心,該聲紋驗證中心可選擇設(shè)置在特約商店、金融機構(gòu)或特定管理機構(gòu)。聲紋驗證中心利用可辨識裝置確認(rèn)客戶基本資料,該可辨識裝置包含可程序辨識邏輯電路等。此外,該聲紋驗證中心具有一聲紋驗證系統(tǒng)。
請再參照圖1所示,接著,該可辨識裝置進行核對該客戶是否已申請聲紋比較,即產(chǎn)生該客戶是否需要進行聲紋比較的結(jié)果。該聲紋驗證中心將該結(jié)果傳回該連接裝置,以便進行后續(xù)電子商務(wù)交易程序。
圖2揭示本發(fā)明較佳實施例的聲紋驗證系統(tǒng)的流程方塊圖。
請參照圖2所示,本發(fā)明較佳實施例的聲紋驗證系統(tǒng)1包含訓(xùn)練系統(tǒng)10及測試系統(tǒng)20,以便對原始輸入語音資料進行訓(xùn)練或測試作業(yè)。該聲紋驗證系統(tǒng)1另包含一前端處理部、一特征擷取部、一儲存部及一運算部。該前端處理部及特征擷取部供該訓(xùn)練系統(tǒng)10及測試系統(tǒng)20進行前端處理及特征擷取,該儲存部供語音特征加以儲存,該運算部則將該儲存語音特征及輸入語音特征加以運算。
當(dāng)客戶帳號輸入本發(fā)明的聲紋驗證系統(tǒng)1時,即可進行確認(rèn)身份。接著,該系統(tǒng)依輸入帳號查詢數(shù)據(jù)庫,是否該輸入帳號屬于已建立。若該輸入帳號未建立時,要求是否進入該訓(xùn)練系統(tǒng)10進行語音訓(xùn)練作業(yè),以便建立及儲存該輸入帳號的語音資料。若該輸入帳號已建立時,進入該測試系統(tǒng)20進行語音測試作業(yè),以便辨識該輸入帳號的語音特征是否符合已儲存該輸入帳號的語音資料。
讓再參照圖1及圖2所示,接著,當(dāng)客戶未申請聲紋比較時,則進入要求客戶輸入個人密碼。若客戶輸入不正確個人密碼后,即進入拒絕交易階段。隨客戶輸入正確個人密碼后,要求是否申請聲紋辨識注冊。當(dāng)選擇不申請聲紋辨識注冊時,即進入允許交易階段。反之,當(dāng)選擇申請聲紋辨識注冊時,即進入該聲紋驗證系統(tǒng)1的訓(xùn)練系統(tǒng)10。
本發(fā)明的聲紋辨識注冊操作該訓(xùn)練系統(tǒng)10的詳述如下在擷取語音特征的前,利用該前端處理部將有效語音信息自原始輸入語音資料擷取,以濾除無效語音信息。本發(fā)明偵測包含短時距能量(Short-Energy)及過零率(zero-Crossing Rate)。本發(fā)明采用結(jié)合高斯機率分布的計算方法,其方程式如下bi(X)→=1(2π)D/2|∑i|1/2exp{-12(x→-u→i)1∑i-1((x→-u→i)}---(1)]]>其中 為原始信號將其分為多個D維的音框、 i=1,...,M為所屬機率, 為背景噪聲的期望值、∑i為背景噪聲的變異數(shù)。在此,因為 中的D=256為一個定值,故將其省略不予計算,將方程式簡化如下bi(x→)=1|∑i|1/2exp{-12(x→-u→i)1∑i-1(x→-u→i)}---(2)]]>上式中的指數(shù)運算,在運算數(shù)據(jù)上有可能過大,故將其取對數(shù)后,將方程式(2)簡化如下bi(x→)=ln(1|∑i|1/2exp{-12(x→-u→i)1∑i-1(x→-u→i)})]]>=ln1|∑i|1/2-12(x→-u→i)1∑i-1(x→-u→i)]]>bi(x→)=(-12)ln|∑i|--12(x→-u→i)1∑i-1(x→-u→i)---(3)]]>擷取原輸入語音資料前端256點,計算短時距能量及過零率的期望值及變異數(shù),接著將該兩個數(shù)及原輸入語音資料代入該方程式(3)進行運算。利用短時距能量與過零率的分布機率區(qū)分有效語音信息及無效語音信息,將無效語音信息加以濾除,不但減少資料量,亦能正確擷取有效語音信息。
在該特征擷取部進行擷取特征上,本發(fā)明采用兩個語音識別特別特征參數(shù),其包含線性預(yù)測倒頻譜系數(shù)(Linear Prediction Cepstrum Coefficient,LPCC)及梅爾頻標(biāo)倒頻譜參數(shù)(Mel Frequency Censtrum Coefficient,MFCC)兩者各12個倒頻譜參數(shù)(cepstral coefficients)及12個倒頻譜參數(shù)(delta-censtral coefficients)。將倒頻譜參數(shù)cn對時間做偏微分Δcn(t)=∂cn(t)∂(t)=∑k=-kkkcn(t+k)∑k=-kkk2---(4)]]>k為考慮音框數(shù)。
因為一階倒頻譜參數(shù)的公式(4)過于復(fù)雜,故將其加以簡化,下列各式為僅考慮前后各兩個時框時,方程式簡化如下Δcn0=[2*c(2,n)+c(1,n)]/5---(5)]]>Δcn1=[2*c(3,n)+c(2,n)-c(0,n)]/6---(6)]]>Δcni=[2*c(i+2,n)+c(i+1,n)-c(i-1,n)-2*c(i-2,n)]/10---(7)]]>ΔcnL-2=[c(L-1,n)-c(L-3,n)-2*c(L-4,n)]/6---(8)]]>ΔcnL-1=[-c(L-2,n)-2*c(L-3,n)]/5---(9)]]>方程式(5)至(9)中,Cn為n階特征值,L為信號中時框總數(shù),i為時框編號。
圖3揭示本發(fā)明較佳實施例的聲紋驗證系統(tǒng)的狀態(tài)及音框的關(guān)系示意圖。
在訓(xùn)練語音上,語音具有所謂“狀態(tài)”的觀念,狀態(tài)是發(fā)音時嘴型以及聲道的變化。一般而言,每次說話嘴型一定有變化,故每個狀態(tài)都是一個語音變化的特征表現(xiàn)。有時一個單音卻有可能含有多個狀態(tài)。一個狀態(tài)并不像音框一樣具有固定尺寸,通常一個狀態(tài)包含多個或數(shù)十個音框。
請參照圖3所示,第一狀態(tài)包含三個音框、第二狀態(tài)包含六個音框及第三狀態(tài)包含四個音框。
圖4揭示本發(fā)明較佳實施例的聲紋驗證系統(tǒng)的音框與狀態(tài)的初始分配模式示意圖。該初始分配模式舉例三個樣本語音進行均分動作。
在初始模式將語音作均分動作,在均分后可能無法整除,多余音框則將其平分在第一個及最后一個狀態(tài)。請再參照圖3所示,在分配模式中,樣本語音均分必須考慮三點1、第個音框一定屬于第一個狀態(tài);2、最后一個音框一定屬于最后一個狀態(tài);3、音框的狀態(tài)變化,只有不變或變化至下一個。采用高斯分配機率計算每個音框?qū)儆诿總€狀態(tài)的機率,并且利用維特比算法獲得最相似路徑。
圖5揭示本發(fā)明較佳實施例的聲紋驗證系統(tǒng)的狀態(tài)轉(zhuǎn)換示意圖。
請參照圖5所示,在三個狀態(tài)時,L個音框可能狀態(tài)轉(zhuǎn)換的方向。將打叉音框視為不可能屬于的狀態(tài),箭頭的方向視為可能狀態(tài)變化路徑。
圖6揭示本發(fā)明較佳實施例的聲紋驗證系統(tǒng)的最相似路徑示意圖。
請參照圖6所示,擷取特征的最相似路徑具有第一狀態(tài)包含第1至3音框、第二狀態(tài)包含第4至5音框及第三狀態(tài)包含第7至10音框。
圖7揭示本發(fā)明較佳實施例的聲紋驗證系統(tǒng)的均分音框示意圖。
參照圖7所示,三個樣本語音在三個狀態(tài)的初始模式,其采均分后的分布。第一樣本語音的每個樣本語音均分三個音框后,剩余兩個音框分別分配置第一狀態(tài)及第二伏態(tài)。第二樣本語音的每個樣本語音均分四個音框。第三樣本語音的每個樣本語音均分三個音框后,剩余一個音框分別配置第一狀態(tài)。在計算后,其最大相似機率為2157。
圖8揭示本發(fā)明較佳實施例的聲紋驗證系統(tǒng)的第一次重新分配音框示意圖。
請參照圖8所示,在第一次重新分配音框后,其最大相似機率上升至3171。
圖9揭示本發(fā)明較佳實施例的聲紋驗證系統(tǒng)的第二次重新分配音框示意圖。
請參照圖9所示,在第二次重新分配音框后,其最大相似機率上升至3571。
圖10揭示本發(fā)明較佳實施例的聲紋驗證系統(tǒng)的最佳分配音框示意圖。
請參照圖10所示,在多次重新分配音框后,其最大相似機率3571不再上升,因此其視為最佳分配音框。計算各狀態(tài)的期望值及變異數(shù)作為模型參數(shù),該模型參數(shù)可供儲存在數(shù)據(jù)庫。
請再參照圖2所示,在進入該訓(xùn)練系統(tǒng)10進行語音訓(xùn)練作業(yè)時,運算方程式(1)至(9)獲得有效訓(xùn)練語音特征。接著利用維特比算法獲得最相似路徑。接著計算各狀態(tài)的期望值及變異數(shù)作為模型參數(shù),即完成語音訓(xùn)練作業(yè)。在語音訓(xùn)練上,其最大相似機率小于預(yù)定參考值時,無法驗過語音訓(xùn)練且結(jié)束訓(xùn)練作業(yè),因而必須重新操作該聲紋公證系統(tǒng)1;反之,其最大相似機率大于該預(yù)定參考值時,通過語音訓(xùn)練,因而將模型參數(shù)儲存在該聲紋驗證系統(tǒng)1。
請再參照圖1所示,當(dāng)完成申請聲紋辨識注冊時,即進入允許交易階段。
請再參照圖1及圖2所示,該輸入帳號已建立時,進入該測試系統(tǒng)20進行語音測試作業(yè)。本發(fā)明的聲紋辨識測試操作該測試系統(tǒng)20的詳述如下同樣的在進入該測試系統(tǒng)20進行語音測試作業(yè)時,運算方程式(1)至(9)獲得有效測試語音特征。
請再參照圖2所示,接著,進行運算該測試語音特征與模型參數(shù)之間相似機率以便輸出辨識結(jié)果。在語音辨識上,其最小相似機率大于預(yù)定參考值時,通過語音辨識,因而可離開該聲紋驗證系統(tǒng)1,且進入后續(xù)電子商務(wù)交易程序;反之,其最小相似機率小于該預(yù)定參考值時,無法通過語音辨識且結(jié)束測試作業(yè),因而必須離開該聲紋驗證系統(tǒng)1,且拒絕進行后續(xù)電子商務(wù)交易程序。
請再參照圖1及圖2所示,最后,該可辨識裝置依該聲紋驗證系統(tǒng)1的測試系統(tǒng)20測試結(jié)果決定允許或拒絕進行電子商務(wù)交易。
權(quán)利要求
1.一種電子商務(wù)交易方法,其特征在于,包含步驟客戶帳號由一連接裝置進行登錄;利用一可辨識裝置確認(rèn)客戶基本資料;該可辨識裝置進行核對是否已申請聲紋比較;利用聲紋驗證系統(tǒng)進行聲紋辨識;及該可辨識裝置決定允許、拒絕進行電子商務(wù)交易。
2.根據(jù)權(quán)利要求1所述的電子商務(wù)交易方法,其特征在于,該聲紋驗證系統(tǒng)包含一前端處理部,其用以進行前端處理該聲紋驗證系統(tǒng)的原始輸入語音資料,因而完成區(qū)分有效語音信息及無效語音信息,再擷取有效語音信息;一特征擷取部,其用以進行擷取該有效語音信息的語音特征;一儲存部,其將該語音特征加以儲存;及一運算部,其將該儲存語音特征及輸入語音特征加以運算。
3.如權(quán)利要求2所述的電子商務(wù)交易方法,其特征在于,該聲紋驗證系統(tǒng)另包含一訓(xùn)練系統(tǒng)使用該前端處理部及特征擷取部,以獲得原始輸入語音資料的模型參數(shù)。
4.如權(quán)利要求3所述的電子商務(wù)交易方法,其特征在于,該可聲紋驗證系統(tǒng)的訓(xùn)練系統(tǒng)另利用維特比算法獲得最相似路徑,以便計算模型參數(shù)供儲存。
5.如權(quán)利要求1所述的電子商務(wù)交易方法,其特征在于,該聲紋驗證系統(tǒng)另包含一測試系統(tǒng)使用該前端處理部及特征擷取部,以獲得原始輸入語音資料的語音特征。
6.如權(quán)利要求1所述的電子商務(wù)交易方法,其特征在于,當(dāng)未申請聲紋比較時,該聲紋驗證系統(tǒng)進入輸入個人密碼。
7.如權(quán)利要求6所述的電子商務(wù)交易方法,其特征在于,當(dāng)輸入正確個人密碼時,進入是否申請注冊聲紋辨識階段。
全文摘要
本發(fā)明為一種電子商務(wù)交易方法包含步驟客戶帳號由一連接裝置進行登錄;利用可辨識裝置確認(rèn)客戶基本資料;該可辨識裝置進行核對是否已申請聲紋比較;利用聲紋驗證系統(tǒng)選擇進行聲紋辨識或注冊聲紋辨識;及該可辨識裝置決定允許或拒絕進行電子商務(wù)交易。
文檔編號G10L17/00GK1848165SQ20051006318
公開日2006年10月18日 申請日期2005年4月5日 優(yōu)先權(quán)日2005年4月5日
發(fā)明者余坤郎, 鄭超群, 歐陽彥杰 申請人:積體數(shù)位股份有限公司