本技術(shù)涉及簽名驗簽領(lǐng)域,具體涉及一種基于深度學習的長文本筆跡識別方法、裝置及介質(zhì)。
背景技術(shù):
1、隨著科技的發(fā)展,電子文檔處理技術(shù)已經(jīng)越來越廣泛地應用于我們的日常生活中,其中,電子簽名識別技術(shù)作為一種重要的電子文檔處理技術(shù),被廣泛應用于銀行、政府、電子商務(wù)等領(lǐng)域。當前的電子簽名識別技術(shù)大多只能支持漢族姓名,字數(shù)大多數(shù)在4字及以內(nèi)。然而,隨著業(yè)務(wù)的發(fā)展,只支持漢族姓名的電子簽名識別算法已不足以支持更廣泛的業(yè)務(wù)場景,其中最有代表性的場景是少數(shù)民族同胞的5字以上的漢字姓名識別。我國是一個多民族的國家,各個民族都有自己的語言和文化,這就導致了不同民族間姓名的差異。因此,少數(shù)民族的漢字姓名識別就是一項重要的任務(wù)。本發(fā)明提出的基于深度學習的長文本筆跡識別方法,可應用于電子手寫簽名領(lǐng)域,可以應用在少數(shù)民族5字以上漢字姓名的識別場景中,有效提高少數(shù)民族的5字以上漢字姓名的電子簽名比對的準確率,也能應用在其他5字以上手寫電子長文本筆跡的場景中,具有很大的市場需求和應用前景。
2、現(xiàn)有的電子簽名識別解決方案主要是通過采用dtw(dynamic?time?warping,動態(tài)時間規(guī)整)算法來實現(xiàn)電子簽名的比對,通常地,對留樣簽名和待驗證簽名,使用dtw算法來對二者進行采樣點之間的對齊,并獲得對齊路徑,然后計算該對齊路徑上所有采樣點對的累積距離,并將其作為兩個電子簽名之間的距離來進行驗證樣本的識別。然而,現(xiàn)有的技術(shù)在手寫電子長文本筆跡識別的應用中還存在一些問題。
3、首先,手寫電子長文本由于更長,因此包含更多的筆跡特征,也擁有更高的復雜度。若繼續(xù)使用現(xiàn)有的電子簽名筆跡識別方法(采用dtw算法對齊,并計算對齊路徑上的累積距離)來進行手寫電子長文本的筆跡識別,會導致準確率的下降。準確率下降的原因在于,手寫電子長文本擁有更長的長度,因此相比4字或以下的普通簽名,手寫電子長文本具有2倍或以上的更長的對齊路徑;而現(xiàn)有電子簽名識別方法需要基于此對齊路徑計算累積距離;對齊路徑越長,則計算累積距離的累積誤差也更大;誤差越大,準確率越低。同時,對于長序列,深度學習模型更關(guān)注全局信息,而忽視了局部信息。因此,現(xiàn)有的電子簽名識別算法并不能直接應用在手寫電子長文本筆跡的識別中。
4、因此,如何在手寫電子文本的長度較長時,提高手寫電子長文本筆跡識別的準確率,是當前技術(shù)面臨的重要問題。
5、專利cn114333076a提供了一種改進的dtw算法進行在線簽名比對,對留樣簽名和待驗證簽名,使用dtw算法來對二者進行采樣點之間的對齊,并獲得對齊路徑,然后計算該對齊路徑上所有采樣點對的累計距離,并將其作為兩個電子簽名之間的距離來進行驗證樣本的識別,然而手寫電子長文本擁有更長的長度,因此相比4字或以下的普通簽名,手寫電子長文本具有2倍或以上的更長的對齊路徑;而該電子簽名識別方法需要基于此對齊路徑計算累積距離;對齊路徑越長,則計算累積距離的累積誤差也更大;誤差越大,準確率越低。因此該方法不適用于手寫長文本的筆跡識別。
6、專利cn117437700a公開了一種基于運動學的在線筆跡確定方法,該方法使用速度等運動特征對簽名軌跡進行分段,并提取軌跡分段的特征,為筆跡鑒別、筆跡壓縮、筆跡顯示等提供精確的基礎(chǔ)數(shù)據(jù)信息。與該方法不同,本方法中的分段是對兩個手寫長文本的dtw對齊路徑進行分段,而不是直接對筆跡進行分段。
技術(shù)實現(xiàn)思路
1、本發(fā)明針對的技術(shù)問題是:針對較長文本的手寫電子簽名通過dtw算法的得到對齊路徑越長,則計算累積距離的累積誤差也更大,誤差越大,準確率越低。同時,對于長文本序列,深度學習模型更關(guān)注全局信息,而忽視了局部信息,導致筆跡識別的準確率進一步降低。
2、本技術(shù)針對現(xiàn)有技術(shù)存在的問題,本技術(shù)在第一方面,提供一種基于深度學習的長文本筆跡識別方法,包括:
3、利用動態(tài)時間規(guī)整dtw算法對留樣樣本x和待驗證樣本y的點特征序列進行對齊,獲取對齊路徑pathdtw(x,y);
4、將所述對齊路徑pathdtw(x,y)分段為為多個長度相等的子序列,對留樣樣本x和待驗證樣本y進行重新排列;
5、利用深度學習模型對重排子序列進行比對,分別計算重排子序列中留樣樣本x和待驗證樣本y的相似度得分si;
6、將各重排子序列的相似度得分si進行融合,獲得最終的筆跡識別結(jié)果。
7、優(yōu)選的,在所述獲取對齊路徑之前,還包括使用光學字符識別ocr技術(shù)對長文本進行內(nèi)容識別。
8、優(yōu)選的,所述留樣樣本x和待驗證樣本y的點特征序列和所述對齊路徑為:
9、x=[x1,x2,...,xi,...,xn]
10、y=[y1,y2,...,yj,...,ym]
11、pathdtw(x,y)=[(i1,j1),...,(it,jt),...,(ik,jk)],
12、其中,n和m為留樣樣本x和待驗證樣本y的長度,且通常n≠m,xi和yj分別表示留樣樣本x和驗證樣本y第i點和第j點手寫電子筆跡采樣點的點特征;k為對齊路徑的長度,(it,jt)表示在對齊路徑的第t個時刻,留樣樣本x的第it個點與驗證樣本的第jt個點對齊。
13、優(yōu)選的,it,jt分別是對齊后的留樣樣本x和待驗證樣本y在t時刻的索引,即t時刻時留樣樣本x的采樣點是驗證樣本y的采樣點是且滿足:
14、1≤it-1≤it≤it+1≤n
15、1≤jt-1≤jt≤jt+1≤m,
16、所述對齊路徑的長度k滿足動態(tài)時間規(guī)整dtw算法的邊界條件,即
17、max(n,m)≤k≤n+m-1。
18、優(yōu)選的,所述子序列的長度k根據(jù)實際運算需要進行設(shè)定,包括根據(jù)深度學習模型的特性和需求進行設(shè)置;子序列的分段數(shù)計算公式為:
19、
20、其中,nk為對所述長度為k的對齊路徑pathdtw(x,y)以子序列長度k進行分段的向下取整;若不能整除,對所述對齊路徑剩余的部分進行舍棄或者補0。
21、優(yōu)選的,所述將所述對齊路徑pathdtw(x,y)分段為為多個長度相等的子序列,對留樣樣本x和待驗證樣本y進行重新排列,包括,分段后的序列為:
22、seg1=[(i1,j1),...,(ik,jk)]
23、seg2=[(ik+1,jk+1),...,(i2k,j2k)]
24、...
25、
26、針對seg1,重排后的子序列為:
27、x1=x(seg1)=[x(i1),...,x(ik)]
28、y1=y(tǒng)(seg1)=[y(j1),...,y(jk)]
29、獲得留樣樣本序列的重排子序列集合以及待驗證樣本序列的重排子序列集合
30、優(yōu)選的,所述深度學習模型用于處理序列數(shù)據(jù),包括循環(huán)神經(jīng)網(wǎng)絡(luò)rnn模型、卷積神經(jīng)網(wǎng)絡(luò)cnn模型和長短時記憶網(wǎng)絡(luò)lstm模型。
31、優(yōu)選的,所述融合采用平均融合或加權(quán)融合,將各分段的相似度得分si進行融合,得到最終的筆跡識別相似度結(jié)果s。確定所述筆跡識別相似度結(jié)果s是否大于預設(shè)閾值,若大于,則筆跡識別判定為相似,否則,判定不相似。
32、優(yōu)選的,若留樣樣本數(shù)量多于1,則分別計算待驗證樣本與每個留樣樣本的相似度結(jié)果,將所有相似度結(jié)果求平均值或加權(quán)平均值,獲得多留樣場景的筆跡識別結(jié)果。
33、本技術(shù)在第二方面,還提供一種基于深度學習的長文本筆跡識別裝置,包括:
34、對齊單元,用于利用動態(tài)時間規(guī)整dtw算法對留樣樣本x和待驗證樣本y的點特征序列進行對齊,獲取對齊路徑pathdtw(x,y);
35、分段單元,用于將所述對齊路徑pathdtw(x,y)分段為為多個長度相等的子序列,對留樣樣本x和待驗證樣本y進行重新排列;
36、深度學習單元,用于利用深度學習模型對重排子序列進行比對,分別計算重排子序列中留樣樣本x和待驗證樣本y的相似度得分si;
37、融合比較單元,用于將各重排子序列的相似度得分si進行融合,獲得最終的筆跡識別結(jié)果。
38、本技術(shù)在第三方面,還提供一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,其特征在于:所述計算機程序被處理器執(zhí)行時實現(xiàn)如第一方面所述基于深度學習的長文本筆跡識別方法的步驟。
39、本技術(shù)至少具有如下有益效果:
40、支持長文本識別:該技術(shù)方案有效解決了當前電子簽名識別技術(shù)大多僅支持漢族4字以內(nèi)姓名的問題,能夠支持長文本例如少數(shù)民族5字以上的漢字姓名識別,還可以應用于其他5字以上手寫電子長文本筆跡的識別場景,滿足了更廣泛的業(yè)務(wù)需求和應用場景。
41、提高識別準確率:通過采用深度學習和dtw(動態(tài)時間規(guī)整)算法結(jié)合的方法,對手寫電子長文本進行對齊、分段、深度學習比對和融合,避免了長文本筆跡識別中累積誤差增大的問題,同時解決了深度學習模型在處理不等長簽名序列時的困難,使得處理流程更加優(yōu)化和高效,顯著提高了手寫電子長文本筆跡識別的準確率。
42、提高系統(tǒng)靈活性:在分段和融合階段,可以通過調(diào)整分段長度和融合權(quán)值、預設(shè)閾值等參數(shù),根據(jù)具體業(yè)務(wù)場景和需求進行靈活配置,以滿足不同情況下的識別要求。