亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種針對(duì)全框線表格的表格區(qū)域識(shí)別提取方法及系統(tǒng)

文檔序號(hào):40398623發(fā)布日期:2024-12-20 12:22閱讀:來(lái)源:國(guó)知局

技術(shù)特征:

1.一種針對(duì)全框線表格的表格區(qū)域識(shí)別提取方法,其特征在于,包括如下步驟:

2.根據(jù)權(quán)利要求1所述的一種針對(duì)全框線表格的表格區(qū)域識(shí)別提取方法,其特征在于,所述生成表格文檔圖像數(shù)據(jù)集包括:

3.根據(jù)權(quán)利要求1所述的一種針對(duì)全框線表格的表格區(qū)域識(shí)別提取方法,其特征在于,所述tdem端到端深度學(xué)習(xí)模型中,圖像共享編碼層具體為:

4.根據(jù)權(quán)利要求3所述的一種針對(duì)全框線表格的表格區(qū)域識(shí)別提取方法,其特征在于,所述列區(qū)域識(shí)別解碼層包括:卷積層conv7?column和1x1卷積conv8?column層,在1x1卷積conv8?column層之后帶有relu激活函數(shù)和與圖像共享編碼層相同丟棄概率的丟棄層,使用分?jǐn)?shù)步幅卷積對(duì)特征圖進(jìn)行上采樣;上采樣的特征圖與圖像共享編碼層第四池化層相結(jié)合,然后再與相同維度的圖像共享編碼層第三池化層相結(jié)合,然后將特征圖放大到原始圖像尺寸。

5.根據(jù)權(quán)利要求3所述的一種針對(duì)全框線表格的表格區(qū)域識(shí)別提取方法,其特征在于,所述表格總區(qū)域識(shí)別解碼層使用了額外的1x1卷積層conv7?table,onv7?table層的輸出使用分?jǐn)?shù)步幅卷積進(jìn)行放大,并與相同維度的圖像共享編碼層第四池化層相結(jié)合,組合特征圖再次被放大,然后與圖像共享編碼層第三池化層相結(jié)合,然后將特征圖放大到原始圖像尺寸。

6.根據(jù)權(quán)利要求1所述的一種針對(duì)全框線表格的表格區(qū)域識(shí)別提取方法,其特征在于,所述通過(guò)像素水平累加值確定每條行分隔線的縱坐標(biāo)具體為:

7.根據(jù)權(quán)利要求1所述的一種針對(duì)全框線表格的表格區(qū)域識(shí)別提取方法,其特征在于,所述模型訓(xùn)練過(guò)程中,圖像共享編碼層從列區(qū)域識(shí)別解碼層和表格區(qū)域識(shí)別解碼層接收到的梯度反復(fù)訓(xùn)練,而列區(qū)域識(shí)別解碼層和表格區(qū)域識(shí)別解碼層則獨(dú)立訓(xùn)練。

8.一種用于實(shí)現(xiàn)權(quán)利要求1-7任一項(xiàng)所述方法的針對(duì)全框線表格的表格區(qū)域識(shí)別提取系統(tǒng),其特征在于,該系統(tǒng)包括:數(shù)據(jù)集生成模塊,表格列與總區(qū)域識(shí)別模塊、表格行區(qū)域識(shí)別模塊,訓(xùn)練模塊和光學(xué)字符識(shí)別模塊;

9.一種針對(duì)全框線表格的表格區(qū)域識(shí)別提取裝置,包括存儲(chǔ)器和一個(gè)或多個(gè)處理器,所述存儲(chǔ)器中存儲(chǔ)有可執(zhí)行代碼,其特征在于,所述處理器執(zhí)行所述可執(zhí)行代碼時(shí),實(shí)現(xiàn)如權(quán)利要求1-7中任一項(xiàng)所述的一種針對(duì)全框線表格的表格區(qū)域識(shí)別提取方法。

10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有程序,其特征在于,所述程序被處理器執(zhí)行時(shí),實(shí)現(xiàn)如權(quán)利要求1-7中任一項(xiàng)所述的一種針對(duì)全框線表格的表格區(qū)域識(shí)別提取方法。


技術(shù)總結(jié)
本發(fā)明公開(kāi)了一種針對(duì)全框線表格的表格區(qū)域識(shí)別提取方法及系統(tǒng),包括:生成表格文檔圖像數(shù)據(jù)集,構(gòu)建深度學(xué)習(xí)模型,包括圖像共享編碼層、列區(qū)域識(shí)別解碼層和表格總區(qū)域識(shí)別解碼層,圖片通過(guò)圖像共享編碼層后分別輸入列區(qū)域識(shí)別解碼層和表格區(qū)域識(shí)別解碼層兩個(gè)分支,得到表格和列區(qū)域的掩膜;通過(guò)表格文檔圖像像素水平累加值確定每條行分隔線的縱坐標(biāo);進(jìn)行模型訓(xùn)練,將表格圖像輸入到訓(xùn)練好的模型中,使用光學(xué)字符識(shí)別進(jìn)行文檔圖像中表格區(qū)域文本內(nèi)容的識(shí)別提取并使用Excel的格式展示。本發(fā)明解決了對(duì)圖像及其他非結(jié)構(gòu)性文檔中表格區(qū)域文本內(nèi)容識(shí)別提取困難的問(wèn)題和表格結(jié)構(gòu)識(shí)別準(zhǔn)確率低造成表格所含文本內(nèi)容識(shí)別提取效果不佳的問(wèn)題。

技術(shù)研發(fā)人員:王哲,陸哲明,羅浩,鄭陽(yáng)明
受保護(hù)的技術(shù)使用者:浙江大學(xué)
技術(shù)研發(fā)日:
技術(shù)公布日:2024/12/19
當(dāng)前第2頁(yè)1 2 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1