1.一種證件版式分析的方法,其特征在于,包括:
獲取證件圖像;
提取所述證件圖像中版式特征;
采用證件識別模型識別每個所述版式特征,獲取對應版式特征的相關度等級,其中所述證件識別模型是通過對訓練樣本集進行訓練后得到的;
篩選所有版式特征對應的相關度等級最高的為所述證件圖像的正確版式。
2.根據(jù)權利要求1所述的證件版式分析的方法,其特征在于,所述證件識別模型是通過對訓練樣本集進行訓練后得到的步驟,包括:
采集同類證件中不同版式的證件圖像;
提取每張證件圖像中所有的版式以及每個版式所對應的版式特征,
按相關度等級標定每張證件圖像所有的版式特征,其中,每張證件圖像只對應唯一的相關度等級最高的版式為正確版式;
采用LambdaMART Rank算法訓練所有證件圖像以及標定的版式特征,得到證件識別模型。
3.根據(jù)權利要求1所述的證件版式分析的方法,其特征在于,所述提取所述證件圖像中版式特征的步驟,包括:
對所述證件圖像進行二值分割,得到對應的文字行;
依次選取不同文字行進行組合,生成多個版式,其中每種組合為一個版式;
提取每個版式對應的版式特征,以向量方式進行表達,其中所述版式特征包含文字梯度方向直方圖特征、行間分布特征與行內(nèi)字符間特征。
4.根據(jù)權利要求1所述的證件版式分析的方法,其特征在于,所述識別每個所述版式特征,獲取對應版式特征的相關度等級的步驟,包括:
加載證件識別模型,以待分析的證件圖像為輸入,根據(jù)所述證件圖像將輸出的所有版式特征按相關度等級進行排序。
5.根據(jù)權利要求1所述的證件版式分析的方法,其特征在于,所述篩選所有版式特征對應的相關度等級最高的為所述證件圖像的正確版式的步驟,包括:
篩選相關度等級最高的版式特征為證件圖像的證件版式。
6.一種證件版式分析的裝置,其特征在于,包括:
獲取模塊,用于獲取證件圖像;
提取模塊,用于提取所述證件圖像中版式特征;
識別模塊,用于采用證件識別模型識別每個所述版式特征,獲取對應版式特征的相關度等級,其中所述證件識別模型是通過對訓練樣本集進行訓練后得到的;
篩選模塊,用于篩選所有版式特征對應的相關度等級最高的為所述證件圖像的正確版式。
7.根據(jù)權利要求1所述的證件版式分析的裝置,其特征在于,還包括證件識別模型,其包括:
采集單元,用于采集同類證件中不同版式的證件圖像;
第一提取單元,用于提取每張證件圖像中所有的版式以及每個版式所對應的版式特征;
標定單元,用于按相關度等級標定每張證件圖像所有的版式特征,其中,每張證件圖像只對應唯一的相關度等級最高的版式為正確版式;
訓練單元,用于采用LambdaMART Rank算法訓練所有證件圖像以及標定的版式特征,得到證件識別模型。
8.根據(jù)權利要求1所述的證件版式分析的裝置,其特征在于,所述提取模塊包括:
分割單元,用于對所述證件圖像進行二值分割,得到對應的文字行;
組合單元,用于依次選取不同文字行進行組合,生成多個版式,其中每種組合為一個版式;
第二提取單元,用于提取每個版式對應的版式特征,以向量方式進行表達,其中所述版式特征包含文字梯度方向直方圖特征、行間分布特征與行內(nèi)字符間特征。
9.根據(jù)權利要求1所述的證件版式分析的裝置,其特征在于,所述識別模塊包含識別單元,其用于加載證件識別模型,以待分析的證件圖像為輸入,根據(jù)所述證件圖像將輸出的所有版式特征按相關度等級進行排序。
10.根據(jù)權利要求1所述的證件版式分析的裝置,其特征在于,所述篩選模塊包含篩選單元,其用于篩選相關度等級最高的版式特征為證件圖像的證件版式。