專利名稱:一種利用字符邊緣特征進(jìn)行打印機(jī)類型取證的方法
技術(shù)領(lǐng)域:
本發(fā)明屬于信號與信息處理技術(shù)領(lǐng)域,涉及到打印機(jī)類型的取證方法。
背景技術(shù):
目前日常辦公中使用的打印機(jī)類型主要是激光打印機(jī)和噴墨打印機(jī)。在文書鑒定過程中,需要判斷打印文檔的打印機(jī)來源,在確定打印機(jī)的品牌及型號之前若能區(qū)分打印機(jī)類型,可以提高檢測效率,縮小偵查范圍。
由于激光打印機(jī)和噴墨打印機(jī)的機(jī)械構(gòu)造、打印原理、墨的性狀均不相同,導(dǎo)致打印效果和質(zhì)量不同。因此可從多個(gè)角度考慮兩種打印機(jī)類型的鑒別問題。劉寧在《噴墨打印機(jī)種鑒別方法及流程》中提出利用打印文件的墨跡特征、機(jī)械壓痕特征、墨水成分三方面對噴墨打印機(jī)打印的文檔進(jìn)行分析,并使用綜合壓痕顯現(xiàn)法、墨水成分分析法及顯微鏡檢驗(yàn)法對噴墨打印機(jī)進(jìn)行鑒別。該方法需要專業(yè)的人員和設(shè)備進(jìn)行檢測。Jack Tchan在〈〈Classifying Digital Prints According to Their ProductionProcess Using Image Analysis and Artificial Neural Networks》中利用專門打印的方形黑色區(qū)塊進(jìn)行打印機(jī)的類型鑒別,提取黑色區(qū)塊的邊緣特征,并使用神經(jīng)網(wǎng)絡(luò)進(jìn)行鑒別。該方法鑒別打印機(jī)類型必須使用預(yù)先的打印圖像,不能應(yīng)用于字符或普通圖像的檢測。Christian Schulze 等在((Using DCT Features for Printing Technique andCopy Detection))中針對整幅文檔利用DCT變換,分析DCT系數(shù)的分布特征,能夠?qū)す獯蛴C(jī)、噴墨打印機(jī)及復(fù)印機(jī)產(chǎn)生的文檔進(jìn)行有效區(qū)分。該方法只能針對整幅掃描的文檔圖像進(jìn)行檢測,不能檢測單個(gè)字母或漢字。
發(fā)明內(nèi)容
本發(fā)明的目的是在打印文檔中,如何判斷每個(gè)打印字符的打印機(jī)類型,其中打印機(jī)類型包括激光打印機(jī)和噴墨打印機(jī)。由打印原理不同導(dǎo)致打印字符的效果和質(zhì)量不同,研究如何利用每個(gè)字符的邊緣特征進(jìn)行打印機(jī)類型的鑒別。本發(fā)明解決了自動(dòng)檢測打印機(jī)類型問題,以幫助文件檢驗(yàn)工作人員更準(zhǔn)確的檢驗(yàn)文檔的來源及其真實(shí)性,這將為文件檢驗(yàn)工作提供一種新的方法。本發(fā)明的技術(shù)方案如下I.利用字符邊緣特征進(jìn)行打印機(jī)類型取證的方法框圖本方法的框圖如圖I所示,首先對掃描圖像進(jìn)行預(yù)處理,然后提取字符邊緣區(qū)域平均梯度和邊緣離散測度兩維特征。提取邊緣區(qū)域平均梯度特征時(shí),首先要進(jìn)行傾斜校正和字符分割的預(yù)處理操作,然后針對每個(gè)字符圖像提取邊緣區(qū)域并計(jì)算平均梯度;提取邊緣離散測度特征時(shí),首先要進(jìn)行傾斜校正、字符分割和二值化的預(yù)處理操作,然后針對每個(gè)字符圖像進(jìn)行輪廓提取、單位法向量計(jì)算、旋轉(zhuǎn)變換,最后計(jì)算邊緣離散測度;最后進(jìn)行綜合判決,將每個(gè)字符的兩維特征表示在二維直角坐標(biāo)系中,利用決策線區(qū)分不同類型打印機(jī)的打印字符。2.文檔圖像預(yù)處理
使用平板掃描儀對打印文檔進(jìn)行掃描,利用Hough變換估計(jì)文檔圖像的傾斜角度,然后將圖像旋轉(zhuǎn)進(jìn)行傾斜校正以便于字符分割,在Hough變換中選擇角度范圍為Θ e [-30。,30。] ο使用投影方法對傾斜校正后的圖像進(jìn)行字符分割,先進(jìn)行行向投影,獲取單行字符圖像,再對單行字符圖像進(jìn)行列向投影獲得單個(gè)字符圖像。字符分割之后對每個(gè)字符圖像進(jìn)行二值化,由于字符圖像為灰度圖像且直方圖會(huì)出現(xiàn)明顯的兩個(gè)峰值,因此選取兩峰值所對應(yīng)像素值的均值作為二值化的閾值,小于該閾值的像素值為0,大于或等于該閾值的像素值為I。3.字符邊緣區(qū)域平均梯度特征提取(I)邊緣區(qū)域選擇在計(jì)算字符邊緣的平均梯度之前,要確定邊緣區(qū)域的位置,利用直方圖的閾值分割確定字符邊緣位置,圖2為打印字符“O”的直方圖。在上述將圖像二值化過程中,取直方圖的兩峰值點(diǎn)對應(yīng)像素值的均值Th,以Th為中心向兩邊擴(kuò)展一定寬度以獲得打印字符的邊緣區(qū)域,本發(fā)明選取的邊緣區(qū)域像素值范圍為O. SXTh I. 2XTh,即將像素值在此范圍內(nèi)的點(diǎn)作為計(jì)算平均梯度的邊緣區(qū)域集合,設(shè)為集合為M。集合M在字符圖像中的位置如圖3所示,字符邊緣的純白區(qū)域的像素為邊緣集合M。(2)梯度圖像計(jì)算假設(shè)圖像I的尺寸為mXn,0jP On表示長度為m和η元素值為O的列向量,計(jì)算圖像四個(gè)方向的差分分量,分別為水平差分分量H,垂直差分分量V,主對角差分分量D1,次對角差分分量D2。為方便計(jì)算,計(jì)算時(shí)去掉圖像相應(yīng)的行或列并補(bǔ)0,計(jì)算方法如式(I) - (4)所示H= I [I (I m,2 n)0m]-
(I)
「/(2:w,l: )~|「 Or ]V=T-(2)a = [,(2D』U0 C1 j(3)
L 0 — 0」L0HA = [”-卜 1{2mtn~l)\(4)利用這四個(gè)方向的差分分量,最終得到圖像I的梯度圖像為I0mdwnt =抑+ (D1 +D2)/2f+(V+ (D1 -D2)!!)2(5)平均梯度用Gwage表示,如式(6)所示^Average _ ι , r i^Gradient (,+ ,·/)(6)
I M I (iJ)eM其中|M|表示集合M中元素的個(gè)數(shù)。4.字符邊緣離散測度特征提取
(I)字符外層邊緣提取為獲得字符圖像邊緣像素的坐標(biāo)以及相互位置關(guān)系,本發(fā)明提出一種邊緣像素搜索方法,按照先行后列的方式搜索初始邊緣點(diǎn),記錄該點(diǎn)坐標(biāo)后按照固定搜索方向逐個(gè)像素搜索,直到返回初始邊緣像素點(diǎn),這樣便得到一個(gè)連通區(qū)域的邊緣像素集合。在搜索過程中記錄邊緣點(diǎn)坐標(biāo),得到完整的連通區(qū)域之后將該連通區(qū)域內(nèi)所有像素進(jìn)行標(biāo)記,再按照上述方式對下一個(gè)連通區(qū)域的邊緣像素進(jìn)行搜索,直到標(biāo)記除圖像塊中所有的連通區(qū)域?yàn)橹?。這樣便得到了整個(gè)字符的輪廓坐標(biāo)集合。在確定初始邊緣點(diǎn)之后,假設(shè)像素初始移動(dòng)方向?yàn)榇怪毕蛳?,如圖4(a)所示,初始搜索方向?yàn)檠刂袼爻跏家苿?dòng)方向右側(cè)垂直方向(位置“I”),如果位置“I”不是邊緣點(diǎn),則在與點(diǎn)D相鄰的像素中按照逆時(shí)針方向進(jìn)行搜索(搜索方向?yàn)? — 2 — 3 —…一7),直到搜索到下一個(gè)邊緣點(diǎn)為止,然后以下一個(gè)邊緣點(diǎn)為中心,記錄中心點(diǎn)D移動(dòng)方向,按照上 述規(guī)則,沿著中心點(diǎn)移動(dòng)方向右側(cè)垂直方向搜索邊緣點(diǎn),以此類推,直到中心點(diǎn)回到初始邊緣點(diǎn),此時(shí)該連通區(qū)域的邊緣點(diǎn)提取完畢,圖4(b) (c)為兩種邊緣像素不同移動(dòng)方向初始搜索方向的選取示意圖。對漢字“人”的邊緣像素搜索結(jié)果如圖5所示。(2)單位法向量計(jì)算本發(fā)明提出一種基于邊緣搜索的方法計(jì)算單位法向量。在求取漢字圖像邊緣坐標(biāo)過程中,已按照順序記錄了邊緣像素的坐標(biāo)值,利用邊緣搜索方法尋找計(jì)算單位法向量的邊緣點(diǎn)坐標(biāo),使用兩個(gè)邊緣點(diǎn)坐標(biāo)即確定該兩點(diǎn)之間邊緣的單位法向量,并繼續(xù)搜索下一個(gè)邊緣點(diǎn),以此類推求出字符各個(gè)邊緣區(qū)域的單位法向量。字符邊緣的法向量方向是任意方向,如圖6所示,箭頭方向表示字符邊緣的法向量方向。使用邊緣搜索方法搜索計(jì)算單位法向量的邊緣點(diǎn)并求出單位法向量,初始條件為設(shè)定初始搜索步進(jìn)L長度為1/5字符圖像高度,對于每個(gè)連通域,初始點(diǎn)設(shè)為0,搜索起止點(diǎn)為A和B,且j y!6|=L,A, B兩點(diǎn)間任意一點(diǎn)為C(如圖7(a)所示)。區(qū)域法相向量的計(jì)算步驟如下I).計(jì)算A,B兩點(diǎn)間每個(gè)邊緣點(diǎn)到直線AB的距離d,若max(d) >5,則轉(zhuǎn)入4);2).計(jì)算由AC順時(shí)針旋轉(zhuǎn)至與AB同向時(shí)的角度α,若α > 180°,則轉(zhuǎn)入4);3).計(jì)算AC與BC夾角3,若1^11(3) >90°,轉(zhuǎn)入(5),否則轉(zhuǎn)入4);4).L = L-I ;5)計(jì)算沿AB方向右側(cè)與AB垂直的單位向量尤,尤為AB區(qū)域內(nèi)邊緣像素的單位法向量,記錄尤和Α, B點(diǎn)的坐標(biāo),若B為初始搜索點(diǎn),轉(zhuǎn)入7);6).搜索下一個(gè)與B點(diǎn)距離為L的像素點(diǎn)并定義為B,將原始B的位置定義為Α,查看AB區(qū)間內(nèi)是否有初始搜索點(diǎn)0,如果有將初始搜索點(diǎn)定義為B,返回I);7)算法結(jié)束。步驟I)中計(jì)算邊緣點(diǎn)到直線AB的距離,目的是防止AB兩點(diǎn)間跨度過大,兩點(diǎn)間有筆畫交匯或較大弧度如圖7(a)所示,步驟2)中計(jì)算AC順時(shí)針旋轉(zhuǎn)至AB的角度,防止由于步進(jìn)過大而導(dǎo)致的邊緣點(diǎn)分屬AB的兩側(cè),如圖7(b)所示,步驟3)計(jì)算AC與BC的夾角,為防止AB間邊緣點(diǎn)有筆畫相交使單位法向量計(jì)算錯(cuò)誤,如圖7(c)所示。(3)旋轉(zhuǎn)變換
計(jì)算單位法向量時(shí),每個(gè)區(qū)間的邊緣點(diǎn)都對應(yīng)一個(gè)單位法向量I,利用旋轉(zhuǎn)變換將所有單位法向量旋轉(zhuǎn)至相同方向,與單位法向量對應(yīng)的邊緣點(diǎn)也隨之旋轉(zhuǎn),這樣能使字符邊緣的二維圖像投影成一維曲線。設(shè)旋轉(zhuǎn)變換后的單位法向量為<2=
。為了將字符邊緣旋轉(zhuǎn)并投影到另一個(gè)坐標(biāo)系,需要計(jì)算向量I逆時(shí)針旋轉(zhuǎn)到<2時(shí)的角度
Θ。首先計(jì)算兩向量間的夾角α,計(jì)算公式為
權(quán)利要求
1.一種利用字符邊緣特征進(jìn)行打印機(jī)類型取證的方法,其特征是對單個(gè)字符圖像提取字符邊緣區(qū)域平均梯度特征和邊緣離散測度特征,通過字符邊緣區(qū)域提取和字符梯度圖像計(jì)算來提取平均梯度特征,通過對字符圖像的輪廓圖像提取、單位法向量計(jì)算、旋轉(zhuǎn)變換來獲取離散測度特征;綜合判決時(shí),將每個(gè)字符的兩維特征表示在二維直角坐標(biāo)系中,利用決策線區(qū)分不同類型打印機(jī)的打印字符。
2.根據(jù)權(quán)利要求I所述的一種利用字符邊緣特征進(jìn)行打印機(jī)類型取證的方法,其特征是提取字符邊緣區(qū)域,利用字符直方圖會(huì)出現(xiàn)兩個(gè)峰值的特點(diǎn),取兩峰值點(diǎn)像素值的均值Th,設(shè)定在O. 8 X Th I. 2 X Th范圍內(nèi)的像素值為邊緣像素。
3.根據(jù)權(quán)利要求I所述的一種利用字符邊緣特征進(jìn)行打印機(jī)類型取證的方法,其特征是對字符圖像邊緣提取單位法向量,根據(jù)已經(jīng)記錄的邊緣像素坐標(biāo)值,利用邊緣搜索方法尋找計(jì)算單位法向量的邊緣點(diǎn)坐標(biāo),兩個(gè)邊緣點(diǎn)即確定該兩點(diǎn)之間邊緣的單位法向量。
4.根據(jù)權(quán)利要求I所述的一種利用字符邊緣特征進(jìn)行打印機(jī)類型取證的方法,其特征是利用旋轉(zhuǎn)變換將所有邊緣區(qū)域的單位法向量旋轉(zhuǎn)至相同方向,與法向量對應(yīng)的邊緣點(diǎn)也 隨之旋轉(zhuǎn),使字符邊緣的二維圖像投影成一維曲線。
全文摘要
一種利用字符邊緣特征進(jìn)行打印機(jī)類型取證的方法,屬于信號與信息處理技術(shù)領(lǐng)域。其特征是利用打印字符邊緣特征判斷打印機(jī)的類型,包括激光打印機(jī)和噴墨打印機(jī)兩種。對文檔的掃描圖像進(jìn)行預(yù)處理獲得單個(gè)字符圖像,針對每個(gè)字符圖像提取字符邊緣區(qū)域平均梯度特征和字符邊緣離散測度特征。將此二維特征表示在二維直角坐標(biāo)系中,利用決策線對打印字符進(jìn)行區(qū)分,能夠?qū)γ總€(gè)字符的打印機(jī)類型進(jìn)行判斷。本發(fā)明的效果益處主要針對文檔來源鑒定過程中,自動(dòng)檢測出每個(gè)打印字符的打印機(jī)類型來源。本發(fā)明適用于信息安全領(lǐng)域,可以有效地幫助文件檢驗(yàn)人員檢驗(yàn)文檔的打印機(jī)類型。
文檔編號G06K9/46GK102646194SQ20121004105
公開日2012年8月22日 申請日期2012年2月22日 優(yōu)先權(quán)日2012年2月22日
發(fā)明者孔祥維, 尚士澤 申請人:大連理工大學(xué)