1.本發(fā)明提供一種詞典圖片分割方法,其特征是包括如下步驟:
獲取待處理的詞典圖片,放在同一目錄下;
以段落為單元進(jìn)行識(shí)別,同時(shí)進(jìn)行詞典圖片的分割和標(biāo)記;
判斷噪聲并過(guò)濾噪聲;
生成預(yù)覽圖 ;
生成分割結(jié)果圖;
通過(guò)圖片批量重命名,將圖片合并到生成結(jié)果圖目錄中,按照原圖的欄-段落對(duì)應(yīng)生成圖片文件名的命名規(guī)則來(lái)保證生成圖與原圖的唯一對(duì)應(yīng)關(guān)系。
2.根據(jù)權(quán)利要求1所述的一種詞典圖片分割方法,其特征是所述以段落為單元進(jìn)行識(shí)別,包括段落識(shí)別步驟,所述段落識(shí)別步驟為通過(guò)設(shè)置段落識(shí)別參數(shù)來(lái)進(jìn)行段落識(shí)別,所述段落識(shí)別參數(shù)包括行首空白的像素、垂直間距空白的像素、不分段。
3.根據(jù)權(quán)利要求2所述的一種詞典圖片分割方法,其特征是所述以段落為單元進(jìn)行識(shí)別,還包括在段落識(shí)別步驟之前進(jìn)行欄識(shí)別步驟,所述欄識(shí)別步驟為通過(guò)設(shè)置欄識(shí)別參數(shù)進(jìn)行欄識(shí)別,欄識(shí)別參數(shù)包括兩欄之間的水平間距或者指定為單欄模式來(lái)確定欄數(shù)量。
4.根據(jù)權(quán)利要求1所述的一種詞典圖片分割方法,其特征是所述噪聲包括第一類噪聲,是掃描過(guò)程中產(chǎn)生的或紙張本身存在的污點(diǎn),通過(guò)設(shè)置將小于指定寬度或者高度的像素區(qū)域判斷為噪聲。
5.根據(jù)權(quán)利要求1所述的一種詞典圖片分割方法,其特征是所述噪聲還包括第二類噪聲,是掃描過(guò)程中背面部分文字映射到正面造成的像素干擾,通過(guò)設(shè)置灰度值判斷為噪聲。
6.一種詞典圖片分割裝置,其特征是:包括圖片預(yù)處理模塊,圖片欄識(shí)別模塊,圖片段落識(shí)別模塊,圖片噪聲過(guò)濾模塊,圖片預(yù)覽模塊,分割圖片生成模塊,圖片批量重命名模塊,
所述圖片預(yù)處理模塊,用于獲取待處理的詞典圖片,放在同一目錄下;
所述圖片欄識(shí)別模塊, 用于通過(guò)設(shè)置欄識(shí)別參數(shù)進(jìn)行欄識(shí)別
所述圖片段落識(shí)別模塊,用于通過(guò)設(shè)置段落識(shí)別參數(shù)來(lái)進(jìn)行段落識(shí)別
所述圖片噪聲過(guò)濾模塊,用于判斷噪聲和過(guò)濾噪聲;
所述圖片預(yù)覽模塊,用于生成預(yù)覽圖;
所述分割圖片生成模塊,用于分割圖片并生成分割效果圖;
所述圖片批量重命名模塊,用于通過(guò)圖片批量重命名,將圖片合并到生成結(jié)果圖目錄中,按照原圖的欄-段落對(duì)應(yīng)生成圖片文件名的命名規(guī)則來(lái)保證生成圖與原圖的唯一對(duì)應(yīng)關(guān)系。
7.根據(jù)權(quán)利要求6所述的一種詞典圖片分割裝置,其特征是所述噪聲包括第一類噪聲,是掃描過(guò)程中產(chǎn)生的或紙張本身存在的污點(diǎn),通過(guò)設(shè)置將小于指定寬度或者高度的像素區(qū)域判斷為噪聲 。
8.根據(jù)權(quán)利要求6所述的一種詞典圖片分割裝置,其特征是所述噪聲還包括第二類噪聲,是掃描過(guò)程中背面部分文字映射到正面造成的像素干擾,通過(guò)設(shè)置灰度值判斷為噪聲。