本發(fā)明屬于圖像處理方法技術(shù)領(lǐng)域,具體涉及一種基于小波平滑的書法字最小包圍盒提取方法。
背景技術(shù):
近年來,隨著計算機技術(shù)的快速發(fā)展和普及,在傳統(tǒng)的書法領(lǐng)域也開始較多地使用計算機技術(shù)。在對掃描后的碑帖圖像進行處理的過程中,需要對碑帖圖像提取出單個漢字字符,求取該字符的最小包圍盒。
所謂最小包圍盒是指包圍一個字四周的最小矩形框,是通過橫縱向積分方法來實現(xiàn)的,橫縱向積分方法的實現(xiàn)步驟為:先用列積分劃分出一列字,再按行積分劃分出每個字的上下邊沿,最后再做一次列積分劃分出每個字的左右邊沿,在該方法中如何準確簡單的實現(xiàn)行列切割是難點,傳統(tǒng)的行列積分法只進行列積分,實際上行積分有兩個步驟,在實際操作中存在以下缺點:(1)由于存在碑帖圖像污損等噪聲,使行積分波形存在毛刺從而難以判斷字符起始和結(jié)尾,導致上述方法上下邊沿的切割不夠精確,并不是字精確的最小包圍盒;(2)一些漢字可能被切成兩半等等。由此可見,行積分法有待進行進一步的改善。
技術(shù)實現(xiàn)要素:
本發(fā)明的目的在于提供一種基于小波平滑的書法字最小包圍盒提取方法,能實現(xiàn)對碑帖圖像橫成行豎成列情況下的切割,且能有效處理噪聲情況。
本發(fā)明所采用的技術(shù)方案是,基于小波平滑的書法字最小包圍盒提取方法,具體按照以下步驟實施:
步驟1、先輸入碑帖圖像,經(jīng)預處理后得到二值化的書法圖像;
步驟2、對經(jīng)步驟1獲得的二值化的書法圖像進行列積分,分割出各列的起始和結(jié)束位置;
步驟3、經(jīng)步驟2后,對各列進行行積分,引入小波平滑,用來對行積分信號進行小波平滑,具體為采用coif2小波基,分解三級并使用第三級概貌信號進行重構(gòu),得到平滑的波形,在平滑的波形上分割出行;
步驟4、待步驟3完成后,對斷裂字符進行合并;
步驟5、待步驟4完成后,先對每一個字再進行一次列積分,切出精確的左右邊沿;之后記錄每個字的上、下、左、右邊沿;最后保存切割好的單個字符圖像。
本發(fā)明的特點還在于:
步驟1具體按照以下方法實施:
采用針對彩色格式存儲的碑帖圖像,進行R,G,B三通道顏色值總和大于預設(shè)值的方法進行,具體按照如下算法實施:
式中:c(x,y)是輸入的原始彩色圖像,b(x,y)為獲得的二值化圖像;選取閾值200進行二值化。
步驟4具體按照以下步驟實施:
步驟a、先尋找大于0的區(qū)間,之后計算出該區(qū)間的高度;
步驟b、經(jīng)步驟a后,若該區(qū)間高度小于一個字的30%且距前一區(qū)間或后一區(qū)間的距離小于一個字的10%,則默認該區(qū)間是前一區(qū)間或后一區(qū)間的一部分;
步驟c、經(jīng)步驟b后,從上至下遍歷上述區(qū)間,進行斷裂區(qū)間合并,得到完整的字符上下邊沿。
本發(fā)明有益效果在于:
(1)本發(fā)明基于小波平滑的書法字最小包圍盒提取方法,有效解決了碑帖圖像自動精確切割問題,能實現(xiàn)對碑帖圖像橫成行豎成列情況下的切割,還能有效處理噪聲情況。
(2)本發(fā)明基于小波平滑的書法字最小包圍盒提取方法克服了現(xiàn)有技術(shù)中的不足,具有三大改進點:①先使用列積分、行積分,再列積分的三步法,即在行積分切出每列單字的上下邊沿后再對每個字使用一次列積分,能精確切出左右邊沿;②尤其在行積分時,針對行積分波形存在的毛刺現(xiàn)象,使用小波變換進行平滑,這樣有效去除了字符起始和結(jié)尾處的毛刺,提高判斷的精度;③針對某些漢字可能被分裂的情況,如“思”、“三”等水平積分存在空白的情況,根據(jù)字符平均高度和字符平均間距進行判斷;當切割所得字符數(shù)大于每列字符數(shù)時啟動該判斷,若某字符高度遠小于字符平均高度且與上下相鄰字符間距小于預設(shè)值的時候,進行字符合并,能消除字符被分裂的情況。
附圖說明
圖1是本發(fā)明基于小波平滑的書法字最小包圍盒提取方法的流程圖;
圖2是本發(fā)明基于小波平滑的書法字最小包圍盒提取方法中涉及的行積分波形圖;
圖3是本發(fā)明基于小波平滑的書法字最小包圍盒提取方法中涉及的小波平滑后的行積分波形圖;
圖4是本發(fā)明基于小波平滑的書法字最小包圍盒提取方法中涉及的列積分圖像;
圖5是本發(fā)明基于小波平滑的書法字最小包圍盒提取方法中涉及的區(qū)間合并前的列積分圖像;
圖6是本發(fā)明基于小波平滑的書法字最小包圍盒提取方法中涉及的區(qū)間合并后的列積分圖像。
具體實施方式
下面結(jié)合附圖和具體實施方式對本發(fā)明進行詳細說明。
本發(fā)明基于小波平滑的書法字最小包圍盒提取方法,其流程如圖1所示,先輸入碑帖圖像,經(jīng)預處理后得到二值化的書法圖像;接著通過列積分,分割出各列的起始和結(jié)束位置;然后各列計算行積分,考慮碑帖污損存在的噪聲,導致行積分波形存在毛刺,加大切分難度,影響切分精度,引入小波平滑,在平滑后的波形上進行行切割;之后合并可能被分裂的字符;最終記錄最小包圍盒的坐標并保存切割字符圖像。
本發(fā)明基于小波平滑的書法字最小包圍盒提取方法,具體按照以下步驟實施:
步驟1、先輸入碑帖圖像,經(jīng)預處理后得到二值化的書法圖像,具體按照以下方法實施:
碑帖圖像的二值化方法較多,要根據(jù)碑帖的特點進行;
這里采用針對彩色格式存儲的碑帖圖像,進行R,G,B三通道顏色值總和大于預設(shè)值的方法進行,具體按照如下算法實施:
在上式中:c(x,y)是輸入的原始彩色圖像,b(x,y)為獲得的二值化圖像;這里選取閾值200進行二值化;
對于有些從網(wǎng)上下載的碑帖,可能還有在頁面四周存在白邊,通過積分法能找出白邊的位置,從而截取白邊內(nèi)的圖像為有效二值化圖像。
步驟2、對經(jīng)步驟1獲得的二值化的書法圖像進行列積分,分割出各列的起始和結(jié)束位置。
步驟3、經(jīng)步驟2后,對各列進行行積分,其中考慮到碑帖污損存在的噪聲,導致行積分波形存在毛刺,加大切分難度,影響切分精度,要引入小波平滑,用來對行積分信號進行小波平滑,具體為采用coif2小波基,分解三級并使用第三級概貌信號進行重構(gòu),得到平滑的波形;在平滑的波形上分割出行;
其中,行積分波形圖如圖2所示,小波平滑后的行積分波形圖如圖3所示,可以看出:經(jīng)小波平滑后,顯著改善了波形上的毛刺現(xiàn)象,避免了字分割時上下邊沿無法定位的缺陷。
步驟4、待步驟3完成后,對斷裂字符進行合并,具體按照以下方法實施:
為了避免個別字被分裂,要進行如下處理:
步驟a、先尋找大于0的區(qū)間,之后計算出該區(qū)間的高度;
步驟b、經(jīng)步驟a后,若該區(qū)間高度小于一個字的30%且距前一區(qū)間或后一區(qū)間的距離小于一個字的10%,則默認該區(qū)間是前一區(qū)間或后一區(qū)間的一部分;
步驟c、經(jīng)步驟b后,從上至下遍歷上述區(qū)間,進行斷裂區(qū)間合并,得到完整的字符上下邊沿;
如圖4、圖5及圖6所示,第8個字符被切割分裂成兩個字符,經(jīng)算法處理后合并為一個完整字符。
步驟5、待步驟4完成后,先對每一個字再進行一次列積分,切出精確的左右邊沿;之后記錄每個字的上、下、左、右邊沿;最后保存切割好的單個字符圖像。
本發(fā)明基于小波平滑的書法字最小包圍盒提取方法,有效解決了碑帖圖像自動精確切割問題,能實現(xiàn)對碑帖圖像橫成行豎成列情況下的切割,還能有效處理噪聲情況。