1.一種針對(duì)全框線表格的表格區(qū)域識(shí)別提取方法,其特征在于,包括如下步驟:
2.根據(jù)權(quán)利要求1所述的一種針對(duì)全框線表格的表格區(qū)域識(shí)別提取方法,其特征在于,所述生成表格文檔圖像數(shù)據(jù)集包括:
3.根據(jù)權(quán)利要求1所述的一種針對(duì)全框線表格的表格區(qū)域識(shí)別提取方法,其特征在于,所述tdem端到端深度學(xué)習(xí)模型中,圖像共享編碼層具體為:
4.根據(jù)權(quán)利要求3所述的一種針對(duì)全框線表格的表格區(qū)域識(shí)別提取方法,其特征在于,所述列區(qū)域識(shí)別解碼層包括:卷積層conv7?column和1x1卷積conv8?column層,在1x1卷積conv8?column層之后帶有relu激活函數(shù)和與圖像共享編碼層相同丟棄概率的丟棄層,使用分?jǐn)?shù)步幅卷積對(duì)特征圖進(jìn)行上采樣;上采樣的特征圖與圖像共享編碼層第四池化層相結(jié)合,然后再與相同維度的圖像共享編碼層第三池化層相結(jié)合,然后將特征圖放大到原始圖像尺寸。
5.根據(jù)權(quán)利要求3所述的一種針對(duì)全框線表格的表格區(qū)域識(shí)別提取方法,其特征在于,所述表格總區(qū)域識(shí)別解碼層使用了額外的1x1卷積層conv7?table,onv7?table層的輸出使用分?jǐn)?shù)步幅卷積進(jìn)行放大,并與相同維度的圖像共享編碼層第四池化層相結(jié)合,組合特征圖再次被放大,然后與圖像共享編碼層第三池化層相結(jié)合,然后將特征圖放大到原始圖像尺寸。
6.根據(jù)權(quán)利要求1所述的一種針對(duì)全框線表格的表格區(qū)域識(shí)別提取方法,其特征在于,所述通過(guò)像素水平累加值確定每條行分隔線的縱坐標(biāo)具體為:
7.根據(jù)權(quán)利要求1所述的一種針對(duì)全框線表格的表格區(qū)域識(shí)別提取方法,其特征在于,所述模型訓(xùn)練過(guò)程中,圖像共享編碼層從列區(qū)域識(shí)別解碼層和表格區(qū)域識(shí)別解碼層接收到的梯度反復(fù)訓(xùn)練,而列區(qū)域識(shí)別解碼層和表格區(qū)域識(shí)別解碼層則獨(dú)立訓(xùn)練。
8.一種用于實(shí)現(xiàn)權(quán)利要求1-7任一項(xiàng)所述方法的針對(duì)全框線表格的表格區(qū)域識(shí)別提取系統(tǒng),其特征在于,該系統(tǒng)包括:數(shù)據(jù)集生成模塊,表格列與總區(qū)域識(shí)別模塊、表格行區(qū)域識(shí)別模塊,訓(xùn)練模塊和光學(xué)字符識(shí)別模塊;
9.一種針對(duì)全框線表格的表格區(qū)域識(shí)別提取裝置,包括存儲(chǔ)器和一個(gè)或多個(gè)處理器,所述存儲(chǔ)器中存儲(chǔ)有可執(zhí)行代碼,其特征在于,所述處理器執(zhí)行所述可執(zhí)行代碼時(shí),實(shí)現(xiàn)如權(quán)利要求1-7中任一項(xiàng)所述的一種針對(duì)全框線表格的表格區(qū)域識(shí)別提取方法。
10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有程序,其特征在于,所述程序被處理器執(zhí)行時(shí),實(shí)現(xiàn)如權(quán)利要求1-7中任一項(xiàng)所述的一種針對(duì)全框線表格的表格區(qū)域識(shí)別提取方法。