本發(fā)明一般地涉及圖像處理領(lǐng)域。具體而言,本發(fā)明涉及一種能夠?qū)ΠL(zhǎng)阿拉伯?dāng)?shù)字串的文檔圖像進(jìn)行透視校正的方法和設(shè)備。
背景技術(shù):
在現(xiàn)代社會(huì)中,存在有各種各樣的證件、卡片、文檔等,例如身份證,名片,銀行卡,戶口本,駕駛證,護(hù)照、派出所的戶籍管理文檔等。某些單位或者個(gè)人需要頻繁的收集或存檔這些信息,需要將這些證件、卡片、文檔等留存電子件。除了一些特殊的讀取工具以外,通常的電子化方法就是拍照,然后存儲(chǔ)圖像或者對(duì)圖像進(jìn)行識(shí)別后存儲(chǔ)所識(shí)別的信息。
在拍照留存的過程中,往往需要解決透視變換的問題。這是因?yàn)椋河捎诃h(huán)境或設(shè)備的限制,對(duì)這些證件、卡片、文檔等進(jìn)行拍攝時(shí),有可能不是正對(duì)著拍攝對(duì)象的表面拍攝,而是與拍攝對(duì)象的表面的法線方向之間存在一定的角度,造成拍照結(jié)果受到傾斜的影響,這種傾斜通常被稱為透視變換。為了下一步的識(shí)別和存儲(chǔ),必須對(duì)圖像進(jìn)行透視校正,然后才能進(jìn)行版面分析、識(shí)別等后續(xù)處理。
傳統(tǒng)的方法是分析拍攝的圖像,找出其邊緣和角點(diǎn),或者直接識(shí)別圖像的內(nèi)容,根據(jù)上述信息與標(biāo)準(zhǔn)模板進(jìn)行比對(duì),根據(jù)透視變換模型建立變換公式,進(jìn)行透視投影變換。因此,傳統(tǒng)的方法在每次校正之前,都需要建立特定于證件、卡片、文檔等的標(biāo)準(zhǔn)模板,根據(jù)拍攝圖像和標(biāo)準(zhǔn)模板圖像之間的匹配進(jìn)行校正。建立標(biāo)準(zhǔn)模板通常是非常繁瑣的事情,需要用尺子測(cè)量所有要用到的角點(diǎn)之間的相對(duì)距離。如果需要電子化的證件、卡片、文檔等的種類比較多,或者同一種電子化對(duì)象的信息位置不固定,那么這些方法就不太 適用。另外,如果用戶手持身份證進(jìn)行拍攝的話,手容易擋住身份證的四個(gè)角點(diǎn),無(wú)法基于角點(diǎn)進(jìn)行處理。
也就是說,傳統(tǒng)的進(jìn)行透視校正的方法和設(shè)備嚴(yán)重依賴于標(biāo)準(zhǔn)模板,準(zhǔn)備標(biāo)準(zhǔn)模板的工作量大,標(biāo)準(zhǔn)模板的適應(yīng)性不廣,靈活性低,透視校正效果不穩(wěn)定。
技術(shù)實(shí)現(xiàn)要素:
在下文中給出了關(guān)于本發(fā)明的簡(jiǎn)要概述,以便提供關(guān)于本發(fā)明的某些方面的基本理解。應(yīng)當(dāng)理解,這個(gè)概述并不是關(guān)于本發(fā)明的窮舉性概述。它并不是意圖確定本發(fā)明的關(guān)鍵或重要部分,也不是意圖限定本發(fā)明的范圍。其目的僅僅是以簡(jiǎn)化的形式給出某些概念,以此作為稍后論述的更詳細(xì)描述的前序。
本發(fā)明的目的是提出一種不依賴于預(yù)先準(zhǔn)備的標(biāo)準(zhǔn)模板、能夠靈活地對(duì)包含長(zhǎng)阿拉伯?dāng)?shù)字串的文檔圖像進(jìn)行透視校正的方法和設(shè)備。
為了實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明的一個(gè)方面,提供了一種對(duì)包含長(zhǎng)阿拉伯?dāng)?shù)字串的文檔圖像進(jìn)行透視校正的方法,該方法包括:確定所述文檔圖像中所述長(zhǎng)阿拉伯?dāng)?shù)字串所在的部分以及所述長(zhǎng)阿拉伯?dāng)?shù)字串的內(nèi)容;根據(jù)所述長(zhǎng)阿拉伯?dāng)?shù)字串的內(nèi)容,創(chuàng)建參考圖像;根據(jù)所述長(zhǎng)阿拉伯?dāng)?shù)字串所在的部分與所述參考圖像,計(jì)算校正函數(shù);以及根據(jù)所述校正函數(shù),對(duì)所述文檔圖像進(jìn)行透視校正。
根據(jù)本發(fā)明的另一個(gè)方面,提供了一種對(duì)包含長(zhǎng)阿拉伯?dāng)?shù)字串的文檔圖像進(jìn)行透視校正的設(shè)備,該設(shè)備包括:數(shù)字串確定裝置,被配置為:確定所述文檔圖像中所述長(zhǎng)阿拉伯?dāng)?shù)字串所在的部分以及所述長(zhǎng)阿拉伯?dāng)?shù)字串的內(nèi)容;參考圖像創(chuàng)建裝置,被配置為:根據(jù)所述長(zhǎng)阿拉伯?dāng)?shù)字串的內(nèi)容,創(chuàng)建參考圖像;校正函數(shù)計(jì)算裝置,被配置為:根據(jù)所述長(zhǎng)阿拉伯?dāng)?shù)字串所在的部分與所述參考圖像,計(jì)算校正函數(shù);以及透視校正裝置,被配置為:根據(jù)所述校正函數(shù),對(duì)所述文檔圖像進(jìn)行透視校正。
另外,根據(jù)本發(fā)明的另一方面,還提供了一種存儲(chǔ)介質(zhì)。所述存儲(chǔ)介質(zhì)包括機(jī)器可讀的程序代碼,當(dāng)在信息處理設(shè)備上執(zhí)行所述程序代碼時(shí),所述程序代碼使得所述信息處理設(shè)備執(zhí)行根據(jù)本發(fā)明的上述方法。
此外,根據(jù)本發(fā)明的再一方面,還提供了一種程序產(chǎn)品。所述程序產(chǎn)品包括機(jī)器可執(zhí)行的指令,當(dāng)在信息處理設(shè)備上執(zhí)行所述指令時(shí),所述指令使得所述信息處理設(shè)備執(zhí)行根據(jù)本發(fā)明的上述方法。
附圖說明
參照下面結(jié)合附圖對(duì)本發(fā)明的實(shí)施例的說明,會(huì)更加容易地理解本發(fā)明的以上和其它目的、特點(diǎn)和優(yōu)點(diǎn)。附圖中的部件只是為了示出本發(fā)明的原理。在附圖中,相同的或類似的技術(shù)特征或部件將采用相同或類似的附圖標(biāo)記來表示。附圖中:
圖1示出了根據(jù)本發(fā)明的實(shí)施例的對(duì)包含長(zhǎng)阿拉伯?dāng)?shù)字串的文檔圖像進(jìn)行透視校正的方法的流程圖;
圖2示出了確定所述文檔圖像中所述長(zhǎng)阿拉伯?dāng)?shù)字串所在的部分的流程圖;
圖3示出了輸入文檔圖像和經(jīng)過步驟S1處理后得到的中間結(jié)果;
圖4示出了長(zhǎng)阿拉伯?dāng)?shù)字串所在的部分的示例;
圖5示出了特征點(diǎn)提取的示例;
圖6(a)和圖6(b)分別示出了透視校正前的輸入文檔圖像和透視校正后的變換結(jié)果;
圖6(c)示出了識(shí)別結(jié)果;
圖7示出了根據(jù)本發(fā)明的實(shí)施例的對(duì)包含長(zhǎng)阿拉伯?dāng)?shù)字串的文檔圖像進(jìn)行透視校正的設(shè)備的結(jié)構(gòu)方框圖;以及
圖8示出了可用于實(shí)施根據(jù)本發(fā)明的實(shí)施例的方法和設(shè)備的計(jì)算機(jī)的示意性框圖。
具體實(shí)施方式
在下文中將結(jié)合附圖對(duì)本發(fā)明的示范性實(shí)施例進(jìn)行詳細(xì)描述。為了清楚和簡(jiǎn)明起見,在說明書中并未描述實(shí)際實(shí)施方式的所有特征。然而,應(yīng)該了解,在開發(fā)任何這種實(shí)際實(shí)施方式的過程中必須做出很多特定于實(shí)施方式的決定,以便實(shí)現(xiàn)開發(fā)人員的具體目標(biāo),例如,符合與系統(tǒng)及業(yè)務(wù)相關(guān)的那些限制條件,并且這些限制條件可能會(huì)隨著實(shí)施方式的不同而有所改變。此外,還應(yīng)該了解,雖然開發(fā)工作有可能是非常復(fù)雜和費(fèi)時(shí)的,但對(duì)得益于本公開內(nèi)容的本領(lǐng)域技術(shù)人員來說,這種開發(fā)工作僅僅是例行的任務(wù)。
在此,還需要說明的一點(diǎn)是,為了避免因不必要的細(xì)節(jié)而模糊了本發(fā)明,在附圖中僅僅示出了與根據(jù)本發(fā)明的方案密切相關(guān)的裝置結(jié)構(gòu)和/或處理步驟,而省略了與本發(fā)明關(guān)系不大的其他細(xì)節(jié)。另外,還需要指出的是,在本發(fā)明的一個(gè)附圖或一種實(shí)施方式中描述的元素和特征可以與一個(gè)或更多個(gè)其它附圖或?qū)嵤┓绞街惺境龅脑睾吞卣飨嘟Y(jié)合。
下面將參照?qǐng)D1描述根據(jù)本發(fā)明的實(shí)施例的對(duì)包含長(zhǎng)阿拉伯?dāng)?shù)字串的文檔圖像進(jìn)行透視校正的方法的流程。
圖1示出了根據(jù)本發(fā)明的實(shí)施例的對(duì)包含長(zhǎng)阿拉伯?dāng)?shù)字串的文檔圖像進(jìn)行透視校正的方法的流程圖。如圖1所示,根據(jù)本發(fā)明的實(shí)施例的對(duì)包含長(zhǎng)阿拉伯?dāng)?shù)字串的文檔圖像進(jìn)行透視校正的方法包括如下步驟:確定所述文檔圖像中所述長(zhǎng)阿拉伯?dāng)?shù)字串所在的部分以及所述長(zhǎng)阿拉伯?dāng)?shù)字串的內(nèi)容(步驟S1);根據(jù)所述長(zhǎng)阿拉伯?dāng)?shù)字串的內(nèi)容,創(chuàng)建參考圖像(步驟S2);根據(jù)所述長(zhǎng)阿拉伯?dāng)?shù)字串所在的部分與所述參考圖像,計(jì)算校正函數(shù)(步驟S3);以及根據(jù)所述校正函數(shù),對(duì)所述文檔圖像進(jìn)行透視校正(步驟S4)。
如上所述,文檔圖像包括各種證件、卡片、文檔等的圖像,包括身份證,名片,銀行卡,戶口本,駕駛證,護(hù)照、派出所的戶籍管理文檔等的圖像。
這些文檔圖像的共同特點(diǎn)是包含長(zhǎng)阿拉伯?dāng)?shù)字串,例如身份證號(hào)、卡號(hào)等。由于有些身份證號(hào)的尾號(hào)是X,而不是數(shù)字,所以在下文中,為了處理 方便,只取身份證號(hào)的純數(shù)字部分作為長(zhǎng)阿拉伯?dāng)?shù)字串的示例。
由于長(zhǎng)阿拉伯?dāng)?shù)字串與文檔圖像的其它部分具有顯著區(qū)別,所以可以相對(duì)容易和準(zhǔn)確地定位和分析長(zhǎng)阿拉伯?dāng)?shù)字串所在的部分,從而確定用于透視校正的校正函數(shù)。
因此,根據(jù)本發(fā)明,首先在步驟S1中,確定所述文檔圖像中所述長(zhǎng)阿拉伯?dāng)?shù)字串所在的部分以及所述長(zhǎng)阿拉伯?dāng)?shù)字串的內(nèi)容。
具體地,參見圖2,確定所述文檔圖像中所述長(zhǎng)阿拉伯?dāng)?shù)字串所在的部分包括:對(duì)所述文檔圖像進(jìn)行二值化處理,以得到二值化圖像(步驟S11);提取所述二值化圖像中的所有連通域(步驟S12);利用數(shù)字OCR引擎,對(duì)所提取的連通域進(jìn)行OCR識(shí)別(步驟S13);在OCR結(jié)果中,搜索置信度高、彼此接近、形成一個(gè)最長(zhǎng)串的一組連通域(步驟S14);將所述一組連通域的外接矩形所包圍的區(qū)域,確定為所述文檔圖像中所述長(zhǎng)阿拉伯?dāng)?shù)字串所在的部分(步驟S15)。
在步驟S11中,對(duì)所述文檔圖像進(jìn)行二值化處理,以得到二值化圖像。
在文檔圖像本身為灰度圖像的情況下,可以直接利用二值化閾值,對(duì)灰度文檔圖像進(jìn)行二值化,以得到二值化圖像。
在文檔圖像本身為彩色圖像的情況下,可以先將彩色文檔圖像轉(zhuǎn)換為灰度圖像,再利用二值化閾值,對(duì)灰度文檔圖像進(jìn)行二值化,以得到二值化圖像。
關(guān)于將彩色文檔圖像轉(zhuǎn)換為灰度圖像的方法,此處給出兩個(gè)優(yōu)選的實(shí)施方式。本發(fā)明不限于此,只要能夠?qū)崿F(xiàn)彩色文檔圖像到灰度圖像的轉(zhuǎn)換即可。
將彩色文檔圖像轉(zhuǎn)換為灰度圖像的方法的第一優(yōu)選實(shí)施方式是針對(duì)所述文檔圖像中的每個(gè)像素,將該像素的R、G、B中的最大值作為灰度圖像中對(duì)應(yīng)位置的像素值,以得到灰度圖像。
將彩色文檔圖像轉(zhuǎn)換為灰度圖像的方法的第二優(yōu)選實(shí)施方式是針對(duì)所述文檔圖像中的每個(gè)像素,取該像素的R、G、B中的最大值與大于1的預(yù)定常數(shù)之積、以及255中的較小者,作為灰度圖像中對(duì)應(yīng)位置的像素值,以 得到灰度圖像。
即,如下公式。
g=min(255,max(r,g,b)*1.25)
其中,g為灰度值,min()表示取最小值,max表示取最大值,r、g、b表示像素的彩色三通道值,大于1的預(yù)定常數(shù)在上述公式中的示例是1.25,可以根據(jù)經(jīng)驗(yàn)指定,不限于此。
采用上述兩種方式,尤其是第二實(shí)施方式進(jìn)行灰度化,會(huì)使得非黑色的彩色像素點(diǎn)更加偏白色。以身份證為例,部分文字是彩色的,而身份證號(hào)都是黑色的,所以有利于初步篩選像素(去掉具有非黑色的顏色的文字部分),提高二值化效果。
另外,為了進(jìn)一步提高處理效果,還可以針對(duì)灰度圖像,在進(jìn)行二值化之前,進(jìn)行黑色像素增強(qiáng)處理。
具體地,針對(duì)灰度圖像中的每個(gè)灰度值pi,利用如下公式更新灰度值。
新灰度值
其中,pi表示灰度值,α、β為預(yù)定正整數(shù),α取接近127.5的值,β例如取5,但不限于此,主要起放大作用。
α取值在0到255的中間位置,使得當(dāng)pi遠(yuǎn)大于α?xí)r,更新后的pi更接近255,即白色像素更白,pi遠(yuǎn)小于α?xí)r,更新后的pi更接近0,即黑色像素更黑,pi與α越接近時(shí),更新后的pi約接近127.5,更新前后變化不大。
通過黑色像素增強(qiáng)處理,可以有效地增強(qiáng)黑色像素,減弱灰色像素。
在步驟S12中,提取所述二值化圖像中的所有連通域。
連通域提取是本領(lǐng)域公知的技術(shù),在此不再贅述。
在步驟S13中,利用數(shù)字OCR引擎,對(duì)所提取的連通域進(jìn)行OCR識(shí)別。OCR識(shí)別是本領(lǐng)域公知的技術(shù),在此不再贅述。
應(yīng)注意的是此處采用的是數(shù)字OCR引擎。因?yàn)椴襟ES1的目的是定位文檔圖像中所述長(zhǎng)阿拉伯?dāng)?shù)字串所在的部分以及識(shí)別所述長(zhǎng)阿拉伯?dāng)?shù)字串的內(nèi)容,所以采用數(shù)字OCR引擎可以實(shí)現(xiàn)。同時(shí),二值化圖像中的黑色像素還包括文字。文字對(duì)于數(shù)字OCR引擎來說,屬于噪聲,所以相應(yīng)的識(shí)別置信度低,有利于定位長(zhǎng)阿拉伯?dāng)?shù)字串所在的部分。
在步驟S14中,在OCR結(jié)果中,搜索置信度高、彼此接近、形成一個(gè)最長(zhǎng)串的一組連通域。
具體地,通過置信度,去掉例如文字、噪聲等對(duì)應(yīng)的連通域,然后在剩下的連通域中計(jì)算兩兩連通域之間的連接關(guān)系,如果兩個(gè)連通域左右相鄰,則標(biāo)記兩者連接,從而獲得最長(zhǎng)的一條連通域構(gòu)成的串,因?yàn)樯矸葑C號(hào)是處理對(duì)象中連續(xù)的數(shù)字部分中最長(zhǎng)的。將所述OCR結(jié)果中與所述長(zhǎng)阿拉伯?dāng)?shù)字串所在的部分對(duì)應(yīng)的識(shí)別結(jié)果中置信度最高的一組識(shí)別結(jié)果,確定為所述長(zhǎng)阿拉伯?dāng)?shù)字串的內(nèi)容。標(biāo)記該串的每個(gè)連通域?yàn)閏c0…ccn,并獲得對(duì)應(yīng)的識(shí)別結(jié)果a0…an,其中假設(shè)該串由n個(gè)連通域構(gòu)成。
在步驟S15中,將所述一組連通域的外接矩形所包圍的區(qū)域,確定為所述文檔圖像中所述長(zhǎng)阿拉伯?dāng)?shù)字串所在的部分。
圖3示出了輸入文檔圖像和經(jīng)過步驟S1處理后得到的中間結(jié)果。其中,身份證上通常以彩色文字出現(xiàn)的姓名、性別、民族、出生、年、月、日、地址、公民身份證號(hào)碼等字樣以及方塊和圓形的噪聲均已去除。身份證號(hào)123456789987654321的位置和內(nèi)容得到了確認(rèn)。
在步驟S2中,根據(jù)所述長(zhǎng)阿拉伯?dāng)?shù)字串的內(nèi)容,創(chuàng)建參考圖像。
由于在步驟S1中已確定長(zhǎng)阿拉伯?dāng)?shù)字串的內(nèi)容,因此可以基于內(nèi)容來創(chuàng)建標(biāo)準(zhǔn)的沒有透視變換問題的參考圖像,作為計(jì)算校正函數(shù)的基礎(chǔ)。
具體地,根據(jù)所述長(zhǎng)阿拉伯?dāng)?shù)字串的內(nèi)容,利用預(yù)定字體,形成對(duì)應(yīng)的參考圖像。預(yù)定字體即為處理對(duì)象中數(shù)字部分的規(guī)定字體。相比于傳統(tǒng)技術(shù),本發(fā)明僅需要得知字體信息,而無(wú)需標(biāo)準(zhǔn)模板。
在步驟S3中,根據(jù)所述長(zhǎng)阿拉伯?dāng)?shù)字串所在的部分與所述參考圖像, 計(jì)算校正函數(shù)。
校正函數(shù)例如是透視變換方程。
透視變換方程如下所示。
其中,a11、a12、a13、a21、a22、a23、a31、a32、a33為透視變換參數(shù),X、Y分別為變換前的像素點(diǎn)的橫坐標(biāo)、縱坐標(biāo),U、V分別為變換后的像素點(diǎn)的橫坐標(biāo)、縱坐標(biāo)。因此,只要針對(duì)將長(zhǎng)阿拉伯?dāng)?shù)字串所在的部分的特征點(diǎn)pi(X,Y)和參考圖像的特征點(diǎn)Pi'(U,V)代入方程,即可求解透視變換參數(shù)。a33在實(shí)際計(jì)算中默認(rèn)取值為1。透視變換方程有2個(gè),共具有八個(gè)未知參數(shù),代入四組坐標(biāo)八個(gè)值可以求解。
步驟S3例如可通過如下步驟實(shí)現(xiàn):獲取所述長(zhǎng)阿拉伯?dāng)?shù)字串所在的部分的四個(gè)特征點(diǎn)(步驟S31);獲取所述參考圖像的四個(gè)特征點(diǎn)(步驟S32);根據(jù)所獲取的八個(gè)特征點(diǎn),計(jì)算校正函數(shù)(步驟S33)。
下面介紹特征點(diǎn)的選取方法。
在步驟S31中,提取所述長(zhǎng)阿拉伯?dāng)?shù)字串所在的部分靠左側(cè)的左連通域的外接矩形的上邊的中心點(diǎn)作為第一點(diǎn)和下邊的中心點(diǎn)作為第二點(diǎn);提取所述長(zhǎng)阿拉伯?dāng)?shù)字串所在的部分靠右側(cè)的右連通域的外接矩形的上邊的中心點(diǎn)作為第三點(diǎn)和下邊的中心點(diǎn)作為第四點(diǎn);將連接所述第一點(diǎn)和所述第三點(diǎn)的第一直線整體下移若干像素后與所述左連通域的交點(diǎn)的平均像素位置確定為第一特征點(diǎn);將連接所述第二點(diǎn)和所述第四點(diǎn)的第二直線整體上移若干像素后與所述左連通域的交點(diǎn)的平均像素位置確定為第二特征點(diǎn);將所述第一直線整體下移若干像素后與所述右連通域的交點(diǎn)的平均像素位置確定為第三特征點(diǎn);將所述第二直線整體上移若干像素后與所述右連通域的交點(diǎn)的平均像素位置確定為第四特征點(diǎn)。
在圖4中,以靠左側(cè)的連通域?yàn)樽钭髠?cè)的連通域(對(duì)應(yīng)數(shù)字1),靠右側(cè)的連通域是最右側(cè)的連通域(對(duì)應(yīng)數(shù)字2)為例。如圖4所示,第一直線整 體下移若干像素后和第二直線整體上移后如圖4中的兩條橫線所示。
提取的第一至第四特征點(diǎn)如圖5上方所示。
靠左側(cè)連通域和靠右側(cè)連通域也可以都向中間靠攏,而不是把邊的連通域,但是靠左側(cè)連通域和靠右側(cè)連通域之間的間隔要相對(duì)較大。
之所以將第一直線整體下移若干像素和將第二直線整體上移是為了去除最高點(diǎn)和最低點(diǎn)附近噪聲的影響,防止誤判。
可以采取類似的方法提取參考圖像的特征點(diǎn)。
當(dāng)然,由于參考圖像是標(biāo)準(zhǔn)圖像,沒有噪聲干擾,所以直接選兩端的四個(gè)點(diǎn)即可。
也即,在步驟S32中,對(duì)所述參考圖像進(jìn)行二值化處理并提取連通域;提取所述參考圖像靠左側(cè)的連通域的外接矩形的上邊的中心點(diǎn)作為第五特征點(diǎn)和下邊的中心點(diǎn)作為第六特征點(diǎn);提取所述參考圖像靠右側(cè)的連通域的外接矩形的上邊的中心點(diǎn)作為第七特征點(diǎn)和下邊的中心點(diǎn)作為第八特征點(diǎn)。
同樣,靠左側(cè)的連通域可以是最左側(cè)的連通域(對(duì)應(yīng)數(shù)字1),靠右側(cè)的連通域可以是最右側(cè)的連通域(對(duì)應(yīng)數(shù)字2),靠左側(cè)連通域和靠右側(cè)連通域也可以都向中間靠攏,而不是把邊的連通域,但是靠左側(cè)連通域和靠右側(cè)連通域之間的間隔要相對(duì)較大。
提取的第五至第八特征點(diǎn)如圖5下方所示。
當(dāng)然,也可采用其它幾何方法或者圖像處理方法在數(shù)字串圖像和參考圖像上獲取足夠多的對(duì)應(yīng)點(diǎn)作為特征點(diǎn)。
在步驟S33中,根據(jù)所獲取的八個(gè)特征點(diǎn),計(jì)算校正函數(shù)。
如上所述,計(jì)算校正函數(shù),只需要四組特征點(diǎn)的坐標(biāo)。
得到了校正函數(shù),就可以在步驟S4中,根據(jù)所述校正函數(shù),對(duì)所述文檔圖像進(jìn)行透視校正。
具體地,利用透視變換方程將原圖即輸入文檔圖像中的每個(gè)像素點(diǎn)的坐標(biāo)代入透視變換方程,求得每個(gè)像素點(diǎn)在透視校正后的像素位置,將該像素 點(diǎn)的像素值賦予在透視校正后的像素位置。
圖6(a)和圖6(b)分別示出了透視校正前的輸入文檔圖像和透視校正后的變換結(jié)果。
經(jīng)過透視校正的文檔圖像可以進(jìn)行后續(xù)處理。
例如,可以根據(jù)所述文檔圖像中所述長(zhǎng)阿拉伯?dāng)?shù)字串所在的部分的位置,確定所述文檔圖像中感興趣內(nèi)容所在的部分。這是因?yàn)槲臋n圖像中各個(gè)感興趣內(nèi)容的相對(duì)位置關(guān)系是固定的。然后,對(duì)所述文檔圖像中感興趣內(nèi)容所在的部分進(jìn)行文本行提取和混合文本OCR識(shí)別,從而獲得感興趣內(nèi)容。注意,由于此時(shí)進(jìn)行的OCR的識(shí)別對(duì)象包括文字和數(shù)字,所以采用混合文本OCR引擎進(jìn)行識(shí)別,而非之前使用的數(shù)字OCR引擎。圖6(c)示出了識(shí)別結(jié)果。
下面,將參照?qǐng)D7描述根據(jù)本發(fā)明的實(shí)施例的對(duì)包含長(zhǎng)阿拉伯?dāng)?shù)字串的文檔圖像進(jìn)行透視校正的設(shè)備。
圖7示出了根據(jù)本發(fā)明的實(shí)施例的對(duì)包含長(zhǎng)阿拉伯?dāng)?shù)字串的文檔圖像進(jìn)行透視校正的設(shè)備的結(jié)構(gòu)方框圖。如圖7所示,根據(jù)本發(fā)明的對(duì)包含長(zhǎng)阿拉伯?dāng)?shù)字串的文檔圖像進(jìn)行透視校正的透視校正設(shè)備700包括:數(shù)字串確定裝置71,被配置為:確定所述文檔圖像中所述長(zhǎng)阿拉伯?dāng)?shù)字串所在的部分以及所述長(zhǎng)阿拉伯?dāng)?shù)字串的內(nèi)容;參考圖像創(chuàng)建裝置72,被配置為:根據(jù)所述長(zhǎng)阿拉伯?dāng)?shù)字串的內(nèi)容,創(chuàng)建參考圖像;校正函數(shù)計(jì)算裝置73,被配置為:根據(jù)所述長(zhǎng)阿拉伯?dāng)?shù)字串所在的部分與所述參考圖像,計(jì)算校正函數(shù);以及透視校正裝置74,被配置為:根據(jù)所述校正函數(shù),對(duì)所述文檔圖像進(jìn)行透視校正。
在一個(gè)實(shí)施例中,數(shù)字串確定裝置71包括:區(qū)域確定單元,其包括:二值化處理子單元,被配置為:對(duì)所述文檔圖像進(jìn)行二值化處理,以得到二值化圖像;連通域提取子單元,被配置為:提取所述二值化圖像中的所有連通域;數(shù)字OCR引擎,被配置為:對(duì)所提取的連通域進(jìn)行OCR識(shí)別;搜索子單元,被配置為:在OCR結(jié)果中,搜索置信度高、彼此接近、形成一個(gè) 最長(zhǎng)串的一組連通域;確定子單元,被配置為:將所述一組連通域的外接矩形所包圍的區(qū)域,確定為所述文檔圖像中所述長(zhǎng)阿拉伯?dāng)?shù)字串所在的部分。
在一個(gè)實(shí)施例中,數(shù)字串確定裝置71還包括:內(nèi)容確定單元,被配置為:將所述OCR結(jié)果中與所述長(zhǎng)阿拉伯?dāng)?shù)字串所在的部分對(duì)應(yīng)的識(shí)別結(jié)果中置信度最高的一組識(shí)別結(jié)果,確定為所述長(zhǎng)阿拉伯?dāng)?shù)字串的內(nèi)容。
在一個(gè)實(shí)施例中,二值化處理子單元被進(jìn)一步配置為:針對(duì)所述文檔圖像中的每個(gè)像素,將該像素的R、G、B中的最大值作為灰度圖像中對(duì)應(yīng)位置的像素值,以得到灰度圖像;利用二值化閾值,對(duì)所述灰度圖像進(jìn)行二值化,以得到二值化圖像。
在一個(gè)實(shí)施例中,二值化處理子單元被進(jìn)一步配置為:針對(duì)所述文檔圖像中的每個(gè)像素,取該像素的R、G、B中的最大值與大于1的預(yù)定常數(shù)之積、以及255中的較小者,作為灰度圖像中對(duì)應(yīng)位置的像素值,以得到灰度圖像;利用二值化閾值,對(duì)所述灰度圖像進(jìn)行二值化,以得到二值化圖像。
在一個(gè)實(shí)施例中,二值化處理子單元被進(jìn)一步配置為:在進(jìn)行二值化之前,還對(duì)灰度圖像中的每個(gè)灰度值pi,進(jìn)行如下公式所示的黑色像素增強(qiáng)處理:
其中,pi表示灰度值,α、β為預(yù)定正整數(shù),α接近127.5。
在一個(gè)實(shí)施例中,參考圖像創(chuàng)建裝置72被進(jìn)一步配置為:根據(jù)所述長(zhǎng)阿拉伯?dāng)?shù)字串的內(nèi)容,利用預(yù)定字體,形成對(duì)應(yīng)的參考圖像。
在一個(gè)實(shí)施例中,校正函數(shù)計(jì)算裝置73包括:第一特征點(diǎn)獲取單元,被配置為:獲取所述長(zhǎng)阿拉伯?dāng)?shù)字串所在的部分的四個(gè)特征點(diǎn);第二特征點(diǎn)獲取單元,被配置為:獲取所述參考圖像的四個(gè)特征點(diǎn);校正函數(shù)計(jì)算單元,被配置為:根據(jù)所獲取的八個(gè)特征點(diǎn),計(jì)算校正函數(shù)。
在一個(gè)實(shí)施例中,第一特征點(diǎn)獲取單元被進(jìn)一步配置為:提取所述長(zhǎng)阿 拉伯?dāng)?shù)字串所在的部分靠左側(cè)的左連通域的外接矩形的上邊的中心點(diǎn)作為第一點(diǎn)和下邊的中心點(diǎn)作為第二點(diǎn);提取所述長(zhǎng)阿拉伯?dāng)?shù)字串所在的部分靠右側(cè)的右連通域的外接矩形的上邊的中心點(diǎn)作為第三點(diǎn)和下邊的中心點(diǎn)作為第四點(diǎn);將連接所述第一點(diǎn)和所述第三點(diǎn)的第一直線整體下移若干像素后與所述左連通域的交點(diǎn)的平均像素位置確定為第一特征點(diǎn);將連接所述第二點(diǎn)和所述第四點(diǎn)的第二直線整體上移若干像素后與所述左連通域的交點(diǎn)的平均像素位置確定為第二特征點(diǎn);將所述第一直線整體下移若干像素后與所述右連通域的交點(diǎn)的平均像素位置確定為第三特征點(diǎn);將所述第二直線整體上移若干像素后與所述右連通域的交點(diǎn)的平均像素位置確定為第四特征點(diǎn)。
在一個(gè)實(shí)施例中,第二特征點(diǎn)獲取單元被進(jìn)一步配置為:對(duì)所述參考圖像進(jìn)行二值化處理并提取連通域;提取所述參考圖像靠左側(cè)的連通域的外接矩形的上邊的中心點(diǎn)作為第五特征點(diǎn)和下邊的中心點(diǎn)作為第六特征點(diǎn);提取所述參考圖像靠右側(cè)的連通域的外接矩形的上邊的中心點(diǎn)作為第七特征點(diǎn)和下邊的中心點(diǎn)作為第八特征點(diǎn)。
在一個(gè)實(shí)施例中,所述靠左側(cè)的連通域?yàn)樽钭髠?cè)的連通域,所述靠右側(cè)的連通域是最右側(cè)的連通域。
在一個(gè)實(shí)施例中,透視校正設(shè)備700還包括:感興趣內(nèi)容獲取裝置,被配置為:根據(jù)所述文檔圖像中所述長(zhǎng)阿拉伯?dāng)?shù)字串所在的部分的位置,確定所述文檔圖像中感興趣內(nèi)容所在的部分;對(duì)所述文檔圖像中感興趣內(nèi)容所在的部分進(jìn)行文本行提取和混合文本OCR識(shí)別,從而獲得感興趣內(nèi)容。
在一個(gè)實(shí)施例中,所述文檔圖像包括:身份證、戶口本的圖像;所述長(zhǎng)阿拉伯?dāng)?shù)字串包括身份證號(hào)。
由于在根據(jù)本發(fā)明的透視校正設(shè)備700中所包括的各個(gè)裝置和單元中的處理分別與上面描述的透視校正方法中所包括的各個(gè)步驟中的處理類似,因此為了簡(jiǎn)潔起見,在此省略這些裝置和單元的詳細(xì)描述。
此外,這里尚需指出的是,上述設(shè)備中各個(gè)組成裝置、單元可以通過軟件、固件、硬件或其組合的方式進(jìn)行配置。配置可使用的具體手段或方式為 本領(lǐng)域技術(shù)人員所熟知,在此不再贅述。在通過軟件或固件實(shí)現(xiàn)的情況下,從存儲(chǔ)介質(zhì)或網(wǎng)絡(luò)向具有專用硬件結(jié)構(gòu)的計(jì)算機(jī)(例如圖8所示的通用計(jì)算機(jī)800)安裝構(gòu)成該軟件的程序,該計(jì)算機(jī)在安裝有各種程序時(shí),能夠執(zhí)行各種功能等。
圖8示出了可用于實(shí)施根據(jù)本發(fā)明的實(shí)施例的方法和設(shè)備的計(jì)算機(jī)的示意性框圖。
在圖8中,中央處理單元(CPU)801根據(jù)只讀存儲(chǔ)器(ROM)802中存儲(chǔ)的程序或從存儲(chǔ)部分808加載到隨機(jī)存取存儲(chǔ)器(RAM)803的程序執(zhí)行各種處理。在RAM 803中,還根據(jù)需要存儲(chǔ)當(dāng)CPU 801執(zhí)行各種處理等等時(shí)所需的數(shù)據(jù)。CPU 801、ROM 802和RAM 803經(jīng)由總線804彼此連接。輸入/輸出接口805也連接到總線804。
下述部件連接到輸入/輸出接口805:輸入部分806(包括鍵盤、鼠標(biāo)等等)、輸出部分807(包括顯示器,比如陰極射線管(CRT)、液晶顯示器(LCD)等,和揚(yáng)聲器等)、存儲(chǔ)部分808(包括硬盤等)、通信部分809(包括網(wǎng)絡(luò)接口卡比如LAN卡、調(diào)制解調(diào)器等)。通信部分809經(jīng)由網(wǎng)絡(luò)比如因特網(wǎng)執(zhí)行通信處理。根據(jù)需要,驅(qū)動(dòng)器810也可連接到輸入/輸出接口805??刹鹦督橘|(zhì)811比如磁盤、光盤、磁光盤、半導(dǎo)體存儲(chǔ)器等等可以根據(jù)需要被安裝在驅(qū)動(dòng)器810上,使得從中讀出的計(jì)算機(jī)程序根據(jù)需要被安裝到存儲(chǔ)部分808中。
在通過軟件實(shí)現(xiàn)上述系列處理的情況下,從網(wǎng)絡(luò)比如因特網(wǎng)或存儲(chǔ)介質(zhì)比如可拆卸介質(zhì)811安裝構(gòu)成軟件的程序。
本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,這種存儲(chǔ)介質(zhì)不局限于圖8所示的其中存儲(chǔ)有程序、與設(shè)備相分離地分發(fā)以向用戶提供程序的可拆卸介質(zhì)811??刹鹦督橘|(zhì)811的例子包含磁盤(包含軟盤(注冊(cè)商標(biāo)))、光盤(包含光盤只讀存儲(chǔ)器(CD-ROM)和數(shù)字通用盤(DVD))、磁光盤(包含迷你盤(MD)(注冊(cè)商標(biāo)))和半導(dǎo)體存儲(chǔ)器?;蛘?,存儲(chǔ)介質(zhì)可以是ROM 802、存儲(chǔ)部分808中包含的硬盤等等,其中存有程序,并且與包含它們的設(shè)備一起被分發(fā)給用戶。
本發(fā)明還提出一種存儲(chǔ)有機(jī)器可讀取的指令代碼的程序產(chǎn)品。所述指令 代碼由機(jī)器讀取并執(zhí)行時(shí),可執(zhí)行上述根據(jù)本發(fā)明的實(shí)施例的方法。
相應(yīng)地,用于承載上述存儲(chǔ)有機(jī)器可讀取的指令代碼的程序產(chǎn)品的存儲(chǔ)介質(zhì)也包括在本發(fā)明的公開中。所述存儲(chǔ)介質(zhì)包括但不限于軟盤、光盤、磁光盤、存儲(chǔ)卡、存儲(chǔ)棒等等。
在上面對(duì)本發(fā)明具體實(shí)施例的描述中,針對(duì)一種實(shí)施方式描述和/或示出的特征可以以相同或類似的方式在一個(gè)或更多個(gè)其它實(shí)施方式中使用,與其它實(shí)施方式中的特征相組合,或替代其它實(shí)施方式中的特征。
應(yīng)該強(qiáng)調(diào),術(shù)語(yǔ)“包括/包含”在本文使用時(shí)指特征、要素、步驟或組件的存在,但并不排除一個(gè)或更多個(gè)其它特征、要素、步驟或組件的存在或附加。
此外,本發(fā)明的方法不限于按照說明書中描述的時(shí)間順序來執(zhí)行,也可以按照其他的時(shí)間順序地、并行地或獨(dú)立地執(zhí)行。因此,本說明書中描述的方法的執(zhí)行順序不對(duì)本發(fā)明的技術(shù)范圍構(gòu)成限制。
盡管上面已經(jīng)通過對(duì)本發(fā)明的具體實(shí)施例的描述對(duì)本發(fā)明進(jìn)行了披露,但是,應(yīng)該理解,上述的所有實(shí)施例和示例均是示例性的,而非限制性的。本領(lǐng)域的技術(shù)人員可在所附權(quán)利要求的精神和范圍內(nèi)設(shè)計(jì)對(duì)本發(fā)明的各種修改、改進(jìn)或者等同物。這些修改、改進(jìn)或者等同物也應(yīng)當(dāng)被認(rèn)為包括在本發(fā)明的保護(hù)范圍內(nèi)。
附記
1.一種對(duì)包含長(zhǎng)阿拉伯?dāng)?shù)字串的文檔圖像進(jìn)行透視校正的方法,包括:
確定所述文檔圖像中所述長(zhǎng)阿拉伯?dāng)?shù)字串所在的部分以及所述長(zhǎng)阿拉伯?dāng)?shù)字串的內(nèi)容;
根據(jù)所述長(zhǎng)阿拉伯?dāng)?shù)字串的內(nèi)容,創(chuàng)建參考圖像;
根據(jù)所述長(zhǎng)阿拉伯?dāng)?shù)字串所在的部分與所述參考圖像,計(jì)算校正函數(shù);以及
根據(jù)所述校正函數(shù),對(duì)所述文檔圖像進(jìn)行透視校正。
2.如附記1所述的方法,其中,確定所述文檔圖像中所述長(zhǎng)阿拉伯?dāng)?shù)字串所在的部分以及所述長(zhǎng)阿拉伯?dāng)?shù)字串的內(nèi)容包括:
對(duì)所述文檔圖像進(jìn)行二值化處理,以得到二值化圖像;
提取所述二值化圖像中的所有連通域;
利用數(shù)字OCR引擎,對(duì)所提取的連通域進(jìn)行OCR識(shí)別;
在OCR結(jié)果中,搜索置信度高、彼此接近、形成一個(gè)最長(zhǎng)串的一組連通域;
將所述一組連通域的外接矩形所包圍的區(qū)域,確定為所述文檔圖像中所述長(zhǎng)阿拉伯?dāng)?shù)字串所在的部分。
3.如附記2所述的方法,其中,確定所述文檔圖像中所述長(zhǎng)阿拉伯?dāng)?shù)字串所在的部分以及所述長(zhǎng)阿拉伯?dāng)?shù)字串的內(nèi)容還包括:
將所述OCR結(jié)果中與所述長(zhǎng)阿拉伯?dāng)?shù)字串所在的部分對(duì)應(yīng)的識(shí)別結(jié)果中置信度最高的一組識(shí)別結(jié)果,確定為所述長(zhǎng)阿拉伯?dāng)?shù)字串的內(nèi)容。
4.如附記2所述的方法,其中,對(duì)所述文檔圖像進(jìn)行二值化處理,以得到二值化圖像包括:
針對(duì)所述文檔圖像中的每個(gè)像素,將該像素的R、G、B中的最大值作為灰度圖像中對(duì)應(yīng)位置的像素值,以得到灰度圖像;
利用二值化閾值,對(duì)所述灰度圖像進(jìn)行二值化,以得到二值化圖像。
5.如附記2所述的方法,其中,對(duì)所述文檔圖像進(jìn)行二值化處理,以得到二值化圖像包括:
針對(duì)所述文檔圖像中的每個(gè)像素,取該像素的R、G、B中的最大值與大于1的預(yù)定常數(shù)之積、以及255中的較小者,作為灰度圖像中對(duì)應(yīng)位置的像素值,以得到灰度圖像;
利用二值化閾值,對(duì)所述灰度圖像進(jìn)行二值化,以得到二值化圖像。
6.如附記4或5所述的方法,其中,在進(jìn)行二值化之前,還對(duì)灰度圖像中的每個(gè)灰度值pi,進(jìn)行如下公式所示的黑色像素增強(qiáng)處理:
其中,pi表示灰度值,α、β為預(yù)定正整數(shù),α接近127.5。
7.如附記1所述的方法,其中,根據(jù)所述長(zhǎng)阿拉伯?dāng)?shù)字串的內(nèi)容,創(chuàng)建參考圖像包括:
根據(jù)所述長(zhǎng)阿拉伯?dāng)?shù)字串的內(nèi)容,利用預(yù)定字體,形成對(duì)應(yīng)的參考圖像。
8.如附記1所述的方法,其中,根據(jù)所述長(zhǎng)阿拉伯?dāng)?shù)字串所在的部分與所述參考圖像,計(jì)算校正函數(shù)包括:
獲取所述長(zhǎng)阿拉伯?dāng)?shù)字串所在的部分的四個(gè)特征點(diǎn);
獲取所述參考圖像的四個(gè)特征點(diǎn);
根據(jù)所獲取的八個(gè)特征點(diǎn),計(jì)算校正函數(shù)。
9.如附記8所述的方法,其中,獲取所述長(zhǎng)阿拉伯?dāng)?shù)字串所在的部分的四個(gè)特征點(diǎn)包括:
提取所述長(zhǎng)阿拉伯?dāng)?shù)字串所在的部分靠左側(cè)的左連通域的外接矩形的上邊的中心點(diǎn)作為第一點(diǎn)和下邊的中心點(diǎn)作為第二點(diǎn);
提取所述長(zhǎng)阿拉伯?dāng)?shù)字串所在的部分靠右側(cè)的右連通域的外接矩形的上邊的中心點(diǎn)作為第三點(diǎn)和下邊的中心點(diǎn)作為第四點(diǎn);
將連接所述第一點(diǎn)和所述第三點(diǎn)的第一直線整體下移若干像素后與所述左連通域的交點(diǎn)的平均像素位置確定為第一特征點(diǎn);
將連接所述第二點(diǎn)和所述第四點(diǎn)的第二直線整體上移若干像素后與所述左連通域的交點(diǎn)的平均像素位置確定為第二特征點(diǎn);
將所述第一直線整體下移若干像素后與所述右連通域的交點(diǎn)的平均像素位置確定為第三特征點(diǎn);
將所述第二直線整體上移若干像素后與所述右連通域的交點(diǎn)的平均像素位置確定為第四特征點(diǎn)。
10.如附記8所述的方法,其中,獲取所述參考圖像的四個(gè)特征點(diǎn)包括:
對(duì)所述參考圖像進(jìn)行二值化處理并提取連通域;
提取所述參考圖像靠左側(cè)的連通域的外接矩形的上邊的中心點(diǎn)作為第五特征點(diǎn)和下邊的中心點(diǎn)作為第六特征點(diǎn);
提取所述參考圖像靠右側(cè)的連通域的外接矩形的上邊的中心點(diǎn)作為第七特征點(diǎn)和下邊的中心點(diǎn)作為第八特征點(diǎn)。
11.一種對(duì)包含長(zhǎng)阿拉伯?dāng)?shù)字串的文檔圖像進(jìn)行透視校正的設(shè)備,包括:
數(shù)字串確定裝置,被配置為:確定所述文檔圖像中所述長(zhǎng)阿拉伯?dāng)?shù)字串所在的部分以及所述長(zhǎng)阿拉伯?dāng)?shù)字串的內(nèi)容;
參考圖像創(chuàng)建裝置,被配置為:根據(jù)所述長(zhǎng)阿拉伯?dāng)?shù)字串的內(nèi)容,創(chuàng)建參考圖像;
校正函數(shù)計(jì)算裝置,被配置為:根據(jù)所述長(zhǎng)阿拉伯?dāng)?shù)字串所在的部分與所述參考圖像,計(jì)算校正函數(shù);以及
透視校正裝置,被配置為:根據(jù)所述校正函數(shù),對(duì)所述文檔圖像進(jìn)行透視校正。
12.如附記11所述的設(shè)備,其中,數(shù)字串確定裝置包括:區(qū)域確定單元,其包括:
二值化處理子單元,被配置為:對(duì)所述文檔圖像進(jìn)行二值化處理,以得到二值化圖像;
連通域提取子單元,被配置為:提取所述二值化圖像中的所有連通域;
數(shù)字OCR引擎,被配置為:對(duì)所提取的連通域進(jìn)行OCR識(shí)別;
搜索子單元,被配置為:在OCR結(jié)果中,搜索置信度高、彼此接近、形成一個(gè)最長(zhǎng)串的一組連通域;
確定子單元,被配置為:將所述一組連通域的外接矩形所包圍的區(qū)域,確定為所述文檔圖像中所述長(zhǎng)阿拉伯?dāng)?shù)字串所在的部分。
13.如附記12所述的設(shè)備,其中,數(shù)字串確定裝置還包括:內(nèi)容確定單元,被配置為:
將所述OCR結(jié)果中與所述長(zhǎng)阿拉伯?dāng)?shù)字串所在的部分對(duì)應(yīng)的識(shí)別結(jié)果中置信度最高的一組識(shí)別結(jié)果,確定為所述長(zhǎng)阿拉伯?dāng)?shù)字串的內(nèi)容。
14.如附記12所述的設(shè)備,其中,二值化處理子單元被進(jìn)一步配置 為:
針對(duì)所述文檔圖像中的每個(gè)像素,將該像素的R、G、B中的最大值作為灰度圖像中對(duì)應(yīng)位置的像素值,以得到灰度圖像;
利用二值化閾值,對(duì)所述灰度圖像進(jìn)行二值化,以得到二值化圖像。
15.如附記12所述的設(shè)備,其中,二值化處理子單元被進(jìn)一步配置為:
針對(duì)所述文檔圖像中的每個(gè)像素,取該像素的R、G、B中的最大值與大于1的預(yù)定常數(shù)之積、以及255中的較小者,作為灰度圖像中對(duì)應(yīng)位置的像素值,以得到灰度圖像;
利用二值化閾值,對(duì)所述灰度圖像進(jìn)行二值化,以得到二值化圖像。
16.如附記14或15所述的設(shè)備,其中,二值化處理子單元被進(jìn)一步配置為:在進(jìn)行二值化之前,還對(duì)灰度圖像中的每個(gè)灰度值pi,進(jìn)行如下公式所示的黑色像素增強(qiáng)處理:
其中,pi表示灰度值,α、β為預(yù)定正整數(shù),α接近127.5。
17.如附記11所述的設(shè)備,其中,參考圖像創(chuàng)建裝置被進(jìn)一步配置為:
根據(jù)所述長(zhǎng)阿拉伯?dāng)?shù)字串的內(nèi)容,利用預(yù)定字體,形成對(duì)應(yīng)的參考圖像。
18.如附記11所述的設(shè)備,其中,校正函數(shù)計(jì)算裝置包括:
第一特征點(diǎn)獲取單元,被配置為:獲取所述長(zhǎng)阿拉伯?dāng)?shù)字串所在的部分的四個(gè)特征點(diǎn);
第二特征點(diǎn)獲取單元,被配置為:獲取所述參考圖像的四個(gè)特征點(diǎn);
校正函數(shù)計(jì)算單元,被配置為:根據(jù)所獲取的八個(gè)特征點(diǎn),計(jì)算校正函數(shù)。
19.如附記18所述的設(shè)備,其中,第一特征點(diǎn)獲取單元被進(jìn)一步配置為:
提取所述長(zhǎng)阿拉伯?dāng)?shù)字串所在的部分靠左側(cè)的左連通域的外接矩形的上邊的中心點(diǎn)作為第一點(diǎn)和下邊的中心點(diǎn)作為第二點(diǎn);
提取所述長(zhǎng)阿拉伯?dāng)?shù)字串所在的部分靠右側(cè)的右連通域的外接矩形的上邊的中心點(diǎn)作為第三點(diǎn)和下邊的中心點(diǎn)作為第四點(diǎn);
將連接所述第一點(diǎn)和所述第三點(diǎn)的第一直線整體下移若干像素后與所述左連通域的交點(diǎn)的平均像素位置確定為第一特征點(diǎn);
將連接所述第二點(diǎn)和所述第四點(diǎn)的第二直線整體上移若干像素后與所述左連通域的交點(diǎn)的平均像素位置確定為第二特征點(diǎn);
將所述第一直線整體下移若干像素后與所述右連通域的交點(diǎn)的平均像素位置確定為第三特征點(diǎn);
將所述第二直線整體上移若干像素后與所述右連通域的交點(diǎn)的平均像素位置確定為第四特征點(diǎn)。
20.如附記18所述的設(shè)備,其中,第二特征點(diǎn)獲取單元被進(jìn)一步配置為:
對(duì)所述參考圖像進(jìn)行二值化處理并提取連通域;
提取所述參考圖像靠左側(cè)的連通域的外接矩形的上邊的中心點(diǎn)作為第五特征點(diǎn)和下邊的中心點(diǎn)作為第六特征點(diǎn);
提取所述參考圖像靠右側(cè)的連通域的外接矩形的上邊的中心點(diǎn)作為第七特征點(diǎn)和下邊的中心點(diǎn)作為第八特征點(diǎn)。