專利名稱:一種字符切分的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及圖像識(shí)別及處理技術(shù)領(lǐng)域,尤其涉及一種字符切分的方法和裝置。
背景技術(shù):
一般情況下,針對(duì)某種類型的字符,例如文檔影像中的中文字符、字母和數(shù)字,都會(huì)通過專門的獨(dú)立算法進(jìn)行專門的切分,因?yàn)檫@樣的切分準(zhǔn)確度最高。例如專門通過算法A來實(shí)現(xiàn)對(duì)漢字的切分,通過算法B對(duì)字母和數(shù)字切分,當(dāng)出現(xiàn)數(shù)字、字母和中文字符混排的情況時(shí),再寫一個(gè)算法C專門處理這種情況。這樣處理存在兩個(gè)問題,第一是沒有辦法做到通用切分,不能使用一種方法來保 證各種字符切分的準(zhǔn)確度;第二是在實(shí)際使用各種切分方法時(shí),有時(shí)候并不能預(yù)先確定一行字符的具體類型,一行字符可能有時(shí)候是全漢字類型,有時(shí)候是混排類型,當(dāng)不能確定字符的具體類型時(shí),就不能選用對(duì)應(yīng)的具體算法來進(jìn)行切分。也有研究人員曾提出一種基于識(shí)別反饋的粘連字符切分的方法,主要是針對(duì)粘連字符的切分處理,該方法具體實(shí)現(xiàn)的流程圖如圖I所示,主要通過搜索可能的切分位置,也就是找到可能的粘連字符,把粘連字符提取出來,然后進(jìn)行切分和辨認(rèn),通過調(diào)用識(shí)別模塊對(duì)粘連字符進(jìn)行識(shí)別,根據(jù)反饋結(jié)果找出可靠度最大的切分點(diǎn)。這種方法主要有以下缺點(diǎn)一是僅針對(duì)粘連字符來進(jìn)行切分,不具有通用性;二是該方法并不支持多個(gè)識(shí)別引擎的反饋,很多時(shí)候一個(gè)識(shí)別引擎的識(shí)別結(jié)果可能不是最優(yōu)的,在不同的情況下,不同的識(shí)別引擎表現(xiàn)不同;三是該方法只是對(duì)給定的一個(gè)粘連字符進(jìn)行切分,沒有考慮到粘連字符本身可能并不是由兩個(gè)獨(dú)立的字符粘連到一起,他們可能是其他字符的組成部分,即使這些字符被切分開了,由于沒有合并,那么這些字符也不能正確定位;四是粘連字符切分過程中要確定是漢字粘連還是字母數(shù)字粘連,一種粘連切分失敗后,在去判斷另外一種類型的粘連,并且把切分正確與否的決定權(quán)完全交給了識(shí)別模塊,這對(duì)識(shí)別模塊提出了很高的要求。實(shí)際上我們使用識(shí)別模塊的時(shí)候識(shí)別率并不是100%的;五是由于該方法只是考慮了單個(gè)粘連字符的處理,因此在實(shí)際應(yīng)用中只能作為字符切分方法的一部分,并不是一個(gè)完整的技術(shù)方案。
發(fā)明內(nèi)容
本發(fā)明的目的是提出的一種字符切分的方法和裝置,能夠解決圖像中一行字符的通用切分問題,適用的字符類型包括中文字符、數(shù)字和字母。本發(fā)明通過充分利用單字字符本身的特征、字符之間間距的特征、單字識(shí)別核心庫的特征以及整體合并拆分策略來實(shí)現(xiàn)用通用的處理方式對(duì)漢字、數(shù)字和英文字母的任意組合進(jìn)行識(shí)別切分。本發(fā)明的思想在于,對(duì)圖像中的一行字符進(jìn)行預(yù)處理及初步切分,對(duì)初步切分過的每一個(gè)字符計(jì)算匹配分?jǐn)?shù),建立行內(nèi)所有字符的字符匹配表,每一個(gè)字符或者字符組合得到的識(shí)別結(jié)果都允許由多個(gè)識(shí)別器來確定,這樣增強(qiáng)了準(zhǔn)確性。最終的切分點(diǎn)以字符匹配表為基礎(chǔ),以一行內(nèi)所有字符的匹配分?jǐn)?shù)最高為原則來確定。
為達(dá)此目的,本發(fā)明采用以下技術(shù)方案本發(fā)明的一個(gè)方面,提供了一種字符切分的方法,包括步驟A、輸入待處理的圖像,將所述圖像轉(zhuǎn)換成二值或灰度圖像;B、利用提取連通域或投影方法對(duì)圖像中的一行字符進(jìn)行第一次切分;C、對(duì)于第一次切分后得到的字符按照預(yù)定規(guī)則進(jìn)行拆分和/或合并;D、對(duì)于經(jīng)過步驟C處理后得到的每個(gè)字符計(jì)算匹配分?jǐn)?shù),建立一個(gè)二維的字符匹配表。E、按照一行內(nèi)所有字符加起來匹配分?jǐn)?shù)最高的規(guī)則確定每個(gè)字符的切分點(diǎn),進(jìn)行第二次切分,得到最終切分結(jié)果。
上述技術(shù)方案中,優(yōu)選地,還包括步驟F、對(duì)步驟E得到的最終切分結(jié)果進(jìn)行聚類處理,去掉干擾字符。上述技術(shù)方案中,優(yōu)選地,所述步驟A還包括去黑邊和去噪處理。上述技術(shù)方案中,優(yōu)選地,所述步驟C中的預(yù)定規(guī)則具體為當(dāng)一個(gè)字符的最大寬度超過了第一預(yù)設(shè)值時(shí),對(duì)這個(gè)字符進(jìn)行拆分處理;當(dāng)兩個(gè)相鄰字符的重合度大于第二預(yù)設(shè)值時(shí),對(duì)這兩個(gè)相鄰字符進(jìn)行合并處理。上述技術(shù)方案中,優(yōu)選地,所述步驟D中計(jì)算字符的匹配分?jǐn)?shù)具體包括以下步驟步驟一首先,將第i個(gè)字符到第j個(gè)字符進(jìn)行合并,并設(shè)置Aij的初始值A(chǔ)ij =0 ;步驟二 如果合并后的字符寬度大于所述第一預(yù)設(shè)值時(shí)轉(zhuǎn)至步驟八,否則繼續(xù)執(zhí)行步驟三;步驟三根據(jù)合并后的字符的外部信息及所有的識(shí)別引擎的信息確定合并后的字符類型A ;步驟四用一個(gè)還未參與過本次合并字符識(shí)別的識(shí)別引擎對(duì)所述合并后的字符進(jìn)行識(shí)別,得到識(shí)別結(jié)果,確定合并后的字符類型B ;如果所有識(shí)別引擎都參與了識(shí)別,轉(zhuǎn)步驟八;步驟五如果A和B相同,則根據(jù)本次識(shí)別結(jié)果的置信度信息和合并字符的外部信息得到合并后的字符的本次匹配分?jǐn)?shù)Bij ;如果A和B不同轉(zhuǎn)步驟四;步驟六取Aij和Bij中較大值作為第i個(gè)字符的匹配分?jǐn)?shù);步驟七重復(fù)步驟四-步驟六;步驟八Aij計(jì)算完成。上述技術(shù)方案中,優(yōu)選地,還包括步驟用其他的識(shí)別引擎,分別重復(fù)識(shí)別步驟并計(jì)算匹配分?jǐn)?shù),比較得到的各個(gè)匹配分?jǐn)?shù),取最大的匹配分?jǐn)?shù)作為第i個(gè)字符的匹配分?jǐn)?shù);其中,當(dāng)識(shí)別引擎的置信度信息表示不統(tǒng)一時(shí),預(yù)先對(duì)置信度信息進(jìn)行歸一化處理。根據(jù)本發(fā)明的另一個(gè)方面,還提供了一種字符切分的裝置,包括圖像預(yù)處理單元、字符第一次切分單元、字符拆分合并單元、匹配分?jǐn)?shù)計(jì)算單元和字符第二次切分單元,上述單各元依次連接,其中所述圖像預(yù)處理單元,用于輸入待處理的圖像,將所述圖像轉(zhuǎn)換成二值或灰度圖像;所述字符第一次切分單元,用于利用提取連通域或投影方法對(duì)圖像中的字符進(jìn)行第一次切分;所述字符拆分合并單元,用于對(duì)于第一次切分后得到的不少于一個(gè)的字符按照預(yù)定規(guī)則進(jìn)行拆分和/或合并;所述匹配分?jǐn)?shù)計(jì)算單元,用于對(duì)于經(jīng)過第一次切分后得到的字符,建立一個(gè)二維的字符匹配表并計(jì)算每一個(gè)字符的匹配分?jǐn)?shù); 所述字符第二次切分單元,用于按照一行內(nèi)所有字符加起來匹配分?jǐn)?shù)最高的規(guī)則確定所述剩余的字符的切分點(diǎn),進(jìn)行第二次切分,得到最終切分結(jié)果。上述技術(shù)方案中,優(yōu)選地,還包括聚類單元,用于對(duì)步驟E得到的最終切分結(jié)果進(jìn)行聚類處理,去掉干擾字符。上述技術(shù)方案中,優(yōu)選地,所述圖像預(yù)處理單元還用于去黑邊和去噪處理。上述技術(shù)方案中,優(yōu)選地,所述第一次切分單元進(jìn)一步用于當(dāng)一個(gè)字符的最大寬度超過了第一預(yù)設(shè)值時(shí),對(duì)這個(gè)字符進(jìn)行拆分處理;當(dāng)兩個(gè)相鄰字符的重合度大于第二預(yù)設(shè)值時(shí),對(duì)這兩個(gè)相鄰字符進(jìn)行合并處理。采用了本發(fā)明的技術(shù)方案,能夠?qū)崿F(xiàn)對(duì)圖像中中文字符、英文字符和數(shù)字字符三種字符任意排列情況下的切分,使得在實(shí)際應(yīng)用中不用根據(jù)字符類型去選擇切分算法,對(duì)于模板化的系統(tǒng)帶來了便利。同時(shí)本發(fā)明具有很強(qiáng)的擴(kuò)展性,如果需要對(duì)其他類型的字符進(jìn)行切分,只需要描述準(zhǔn)確該類型字符的特征,如寬高比,字符間距等,并且有相應(yīng)的識(shí)別引擎作支持即可。
圖I是本發(fā)明現(xiàn)有技術(shù)的流程圖。圖2是本發(fā)明中具體實(shí)施方式
中一種字符切分方法的流程圖。圖3是本發(fā)明中具體實(shí)施方式
中匹配分?jǐn)?shù)計(jì)算的流程圖。圖4是本發(fā)明中具體實(shí)施方式
中一種字符切分裝置的結(jié)構(gòu)示意圖。
具體實(shí)施例方式以下結(jié)合附圖對(duì)本發(fā)明的優(yōu)選實(shí)施例進(jìn)行說明,應(yīng)當(dāng)理解,此處所描述的優(yōu)選實(shí)施例僅用于說明和解釋本發(fā)明,并不用于限定本發(fā)明。圖2是本發(fā)明具體實(shí)施方式
中一種字符切分的方法的流程圖。如圖2所示,該字符切分方法包括以下步驟步驟201 :輸入待處理的圖像,將所述圖像轉(zhuǎn)換成二值或灰度圖像。圖像預(yù)處理的目的是將給定圖像處理成初步的字符切分時(shí)需要的二值或者灰度圖像類型,同時(shí)可能包括去黑邊,去噪等操作。步驟202 :在給定圖像進(jìn)行預(yù)處理之后,利用提取連通域或者投影的算法或者其他方法來對(duì)字符進(jìn)行初步切分。字符初步切分后,可能的情況是,一些字符切分成了單個(gè)字符;一些字符可能發(fā)生了粘連,例如兩個(gè)或者多個(gè)字符被切分成了一個(gè)字符;一個(gè)字符被切分成了多個(gè)字符,如一個(gè)漢字可能被切分成了兩個(gè)或者多個(gè)字符。步驟203 :對(duì)于初始切分后的字符即步驟202完成后的結(jié)果,進(jìn)行初步的拆分和合并。本步驟里,拆分規(guī)則是根據(jù)已知條件中給定的每個(gè)字符最大的高度和寬度來進(jìn)行的,當(dāng)一個(gè)字符的最大寬度超多了要求的最大寬度那么這個(gè)字符一定要進(jìn)行拆分。合并的規(guī)則是根據(jù)字符的重合度來進(jìn)行的,當(dāng)兩個(gè)字符的重合度大于50%,那么這兩個(gè)字符必須進(jìn)行合并。步驟204 :經(jīng)過步驟203的處理后,所剩下的字符就是不能確定是保留,還是進(jìn)行拆分或者合并操作,這個(gè)時(shí)候我們就建立一個(gè)二維的字符匹配表來計(jì)算每一個(gè)字符與其它字符的匹配情況。
假設(shè)經(jīng)過步驟203的處理后,一共有5個(gè)字符,那么我們需要計(jì)算以下表格中所列的數(shù)據(jù)
All A12 A13 A14 A15 A21 A22 A23 A2A A25~
A31 A32 A33 A34 A35~
A41 A42 A43 A44 A45~
A51 A52 A53 A54 A55~下面對(duì)上表進(jìn)行說明l)Aij的意義是指合并第i個(gè)字符到第j個(gè)字符包括i和j之間的所有字符的匹配分?jǐn)?shù);2)根據(jù)Aij的意義描述可知紅色部分的數(shù)據(jù)是不需要計(jì)算的,只需要計(jì)算紅色區(qū)域以外的數(shù)據(jù),因?yàn)锳ij = Aji ;3) Aij的取值范圍為0-100 ;4) Aij的計(jì)算方式(含i = j的情況)如下a)如果合并第i個(gè)字符至第j個(gè)字符后超出了我們要求的字符的參數(shù)范圍,例如合并寬度超過了我們要求的最大字符寬度則Aij = 0 ;b)通過合并字符本身的特征(寬、高、字符間距等)以及識(shí)別引擎識(shí)別結(jié)果的置信度來確定一個(gè)最優(yōu)結(jié)果,所述識(shí)別引擎識(shí)別結(jié)果的置信度就是對(duì)于識(shí)別成功的每個(gè)字符,識(shí)別引擎給出的一個(gè)置信度的值,用來描述識(shí)別結(jié)果的可靠性。Aij的計(jì)算是本發(fā)明的核心,下面對(duì)Aij如何計(jì)算具體說明,如圖3所示步驟一首先,將第i個(gè)字符到第j個(gè)字符進(jìn)行合并,并設(shè)置Aij的初始值A(chǔ)ij =0 ;步驟二 302 :如果合并后的字符寬度大于所述第一預(yù)設(shè)值時(shí)轉(zhuǎn)步驟八308。否則繼續(xù)執(zhí)行步驟三303 ;步驟三303 :根據(jù)合并后的字符的外部信息及所有的識(shí)別引擎的信息確定合并后的字符類型A;步驟四304 :用一個(gè)還未參與過本次合并字符識(shí)別的識(shí)別引擎對(duì)所述合并后的字符進(jìn)行識(shí)別,得到識(shí)別結(jié)果,確定合并后的字符類型B ;如果所有識(shí)別引擎都參與了識(shí)別,轉(zhuǎn)步驟八308 ;步驟五305 :如果A和B相同,則根據(jù)本次識(shí)別結(jié)果的置信度信息和合并字符的外部信息得到合并后的字符的本次匹配分?jǐn)?shù)Bij ;如果A和B不同轉(zhuǎn)步驟四304。;步驟六306 :取Aij和Bij中較大值作為第i個(gè)字符的匹配分?jǐn)?shù);步驟七307 :重復(fù)步驟四304-至步驟六306 ;步驟八308 =Aij計(jì)算完成。 在上述計(jì)算Aij過程中,每一個(gè)識(shí)別引擎里都要描述可以識(shí)別的字符類型,以及該字符類型的外部信息。當(dāng)使用多個(gè)識(shí)別引擎時(shí),如果識(shí)別結(jié)果的置信度表示不統(tǒng)一,需要先對(duì)識(shí)別結(jié)果的置信度表示進(jìn)行歸一化。步驟205 :按照一行內(nèi)所有字符加起來匹配分?jǐn)?shù)最高的規(guī)則確定一行內(nèi)所有字符的切分點(diǎn),進(jìn)行第二次切分,得到最終切分結(jié)果。建立了字符匹配表之后就要根據(jù)字符匹配表來確定切分點(diǎn)。確定切分點(diǎn)的原則是保證全局最優(yōu)。就是說我們確定的切分結(jié)果必須保證一行內(nèi)所有字符加起來的匹配分?jǐn)?shù)最高。這里需要注意的是一般來講一個(gè)字符不會(huì)被切分超過5部分,因此在確定一行字符切分點(diǎn)的時(shí)候最多只要判斷到5個(gè)字符合并的情況就可以了。在另一個(gè)優(yōu)選的具體實(shí)施方式
中,還可以在步驟205之后增加一個(gè)步驟206,用于去除切分結(jié)果中的干擾字符。步驟206 :步驟205完成后,字符的切分結(jié)果已經(jīng)出來了,但是可能存在一些并非真正的字符,而是干擾,因此在本步驟對(duì)所有字符進(jìn)行聚類,去掉干擾字符,并輸出最終字符切分結(jié)果。對(duì)字符進(jìn)行聚類是指我們可以根據(jù)外部條件來對(duì)已經(jīng)切分好的字符進(jìn)行分類,t匕如我們可以將寬高比為I : I的字符分為一類,不滿足這個(gè)條件的分為另一類。通過聚類操作,我們可以最終只選用我們需要的那一類字符。另外,關(guān)于字符匹配表的計(jì)算方式,可以考慮不使用識(shí)別核心的反饋結(jié)果,因?yàn)槭褂米R(shí)別核心進(jìn)行識(shí)別,會(huì)有一個(gè)識(shí)別置信度的結(jié)果,在計(jì)算Aij時(shí)要考慮這個(gè)置信度,如果不用識(shí)別核心的反饋,那么計(jì)算Ai j時(shí)就可以只考慮其他的因素了。本發(fā)明的另一個(gè)方面,還提供了一種字符切分的裝置,包括圖像預(yù)處理單元401、字符第一次切分單元402、字符拆分合并單元403、匹配分?jǐn)?shù)計(jì)算單元404和字符第二次切分單元405,上述單各元依次連接,其中所述圖像預(yù)處理單元401,用于輸入待處理的圖像,將所述圖像轉(zhuǎn)換成二值或灰度圖像,優(yōu)選地,該單元還用于去黑邊和去噪處理。所述字符第一次切分單元402,用于利用提取連通域或投影方法對(duì)圖像中的字符進(jìn)行第一次切分;本具體實(shí)施方式
中切分規(guī)則具體為,當(dāng)一個(gè)字符的最大寬度超過了第一預(yù)設(shè)值時(shí),對(duì)這個(gè)字符進(jìn)行拆分處理;當(dāng)兩個(gè)相鄰字符的重合度大于第二預(yù)設(shè)值時(shí),對(duì)這兩個(gè)相鄰字符進(jìn)行合并處理。
所述字符拆分合并單元403,用于對(duì)于第一次切分后得到的不少于一個(gè)的字符按照預(yù)定規(guī)則進(jìn)行拆分和/或合并;所述匹配分?jǐn)?shù)計(jì)算單元404,用于對(duì)于經(jīng)過第一次切分后得到的字符,建立一個(gè)二維的字符匹配表并計(jì)算每一個(gè)字符的匹配分?jǐn)?shù);所述字符第二次切分單元405,用于按照一行內(nèi)所有字符加起來匹配分?jǐn)?shù)最高的規(guī)則確定所述剩余的字符的切分點(diǎn),進(jìn)行第二次切分,得到最終切分結(jié)果。上述技術(shù)方案中,另一種優(yōu)選方式中,還包括聚類單元406,用于對(duì)得到的最終切分結(jié)果進(jìn)行聚類處理,去掉干擾字符。 在對(duì)單一類型的字符進(jìn)行切分的時(shí)候,不使用識(shí)別核心的反饋可以提高字符切分速度,但是有識(shí)別核心的反饋結(jié)果無疑會(huì)提高切分的準(zhǔn)確率。在實(shí)際使用本發(fā)明的時(shí)候可以根據(jù)速度和性能的要求情況作一個(gè)平衡。本發(fā)明能夠提高字符切分的準(zhǔn)確性,并且由于其通用性,替代了之前單獨(dú)字符類型的字符切分算法使得識(shí)別系統(tǒng)的模板化更加容易。在證件識(shí)別系統(tǒng)中本算法對(duì)字符切分的測試結(jié)果如下
權(quán)利要求
1.一種字符切分的方法,其特征在于,包括步驟 A、輸入待處理的圖像,將所述圖像轉(zhuǎn)換成二值或灰度圖像; B、利用提取連通域或投影方法對(duì)圖像中的一行字符進(jìn)行第一次切分; C、對(duì)于第一次切分后得到的字符按照預(yù)定規(guī)則進(jìn)行拆分和/或合并; D、對(duì)于經(jīng)過步驟C處理后得到的每個(gè)字符計(jì)算匹配分?jǐn)?shù),建立一個(gè)二維的字符匹配表。
E、按照一行內(nèi)所有字符加起來匹配分?jǐn)?shù)最高的規(guī)則確定每個(gè)字符的切分點(diǎn),進(jìn)行第二次切分,得到最終切分結(jié)果。
2.根據(jù)權(quán)利要求I所述的字符切分的方法,其特征在于,還包括步驟 F、對(duì)步驟E得到的最終切分結(jié)果進(jìn)行聚類處理,去掉干擾字符。
3.根據(jù)權(quán)利要求I或2所述的字符切分的方法,其特征在于,所述步驟A還包括去黑邊和去噪處理。
4.根據(jù)權(quán)利要求I或2所述的字符切分的方法,其特征在于,所述步驟C中的預(yù)定規(guī)則具體為 當(dāng)一個(gè)字符的最大寬度超過了第一預(yù)設(shè)值時(shí),對(duì)這個(gè)字符進(jìn)行拆分處理; 當(dāng)兩個(gè)相鄰字符的重合度大于第二預(yù)設(shè)值時(shí),對(duì)這兩個(gè)相鄰字符進(jìn)行合并處理。
5.根據(jù)權(quán)利要求4所述的字符切分的方法,其特征在于,所述步驟D中計(jì)算字符的匹配分?jǐn)?shù)具體包括以下步驟 步驟一首先,將第i個(gè)字符到第j個(gè)字符進(jìn)行合并,并設(shè)置Aij的初始值A(chǔ)ij = O ;步驟二 如果合并后的字符寬度大于所述第一預(yù)設(shè)值時(shí)轉(zhuǎn)至步驟八,否則繼續(xù)執(zhí)行步驟三; 步驟三根據(jù)合并后的字符的外部信息及所有的識(shí)別引擎的信息確定合并后的字符類型A ; 步驟四用一個(gè)還未參與過本次合并字符識(shí)別的識(shí)別引擎對(duì)所述合并后的字符進(jìn)行識(shí)另IJ,得到識(shí)別結(jié)果,確定合并后的字符類型B ;如果所有識(shí)別引擎都參與了識(shí)別,轉(zhuǎn)步驟八;步驟五如果A和B相同,則根據(jù)本次識(shí)別結(jié)果的置信度信息和合并字符的外部信息得到合并后的字符的本次匹配分?jǐn)?shù)Bij ;如果A和B不同轉(zhuǎn)步驟四; 步驟六取Aij和Bij中較大值作為第i個(gè)字符的匹配分?jǐn)?shù); 步驟七重復(fù)步驟四-步驟六; 步驟八:Aij計(jì)算完成。
6.根據(jù)權(quán)利要求5所述的字符切分的方法,其特征在于,還包括步驟 用其他的識(shí)別引擎,分別重復(fù)識(shí)別步驟并計(jì)算匹配分?jǐn)?shù),比較得到的各個(gè)匹配分?jǐn)?shù),取最大的匹配分?jǐn)?shù)作為第i個(gè)字符的匹配分?jǐn)?shù); 其中,當(dāng)識(shí)別引擎的置信度信息表示不統(tǒng)一時(shí),預(yù)先對(duì)置信度信息進(jìn)行歸一化處理。
7.一種字符切分的裝置,其特征在于,包括圖像預(yù)處理單元、字符第一次切分單元、字符拆分合并單元、匹配分?jǐn)?shù)計(jì)算單元和字符第二次切分單元,上述單各元依次連接,其中 所述圖像預(yù)處理單元,用于輸入待處理的圖像,將所述圖像轉(zhuǎn)換成二值或灰度圖像;所述字符第一次切分單元,用于利用提取連通域或投影方法對(duì)圖像中的字符進(jìn)行第一次切分;所述字符拆分合并單元,用于對(duì)于第一次切分后得到的不少于一個(gè)的字符按照預(yù)定規(guī)則進(jìn)行拆分和/或合并; 所述匹配分?jǐn)?shù)計(jì)算單元,用于對(duì)于經(jīng)過第一次切分后得到的字符,建立一個(gè)二維的字符匹配表并計(jì)算每一個(gè)字符的匹配分?jǐn)?shù); 所述字符第二次切分單元,用于按照一行內(nèi)所有字符加起來匹配分?jǐn)?shù)最高的規(guī)則確定所述剩余的字符的切分點(diǎn),進(jìn)行第二次切分,得到最終切分結(jié)果。
8.根據(jù)權(quán)利要求7所述的字符切分的裝置,其特征在于,還包括聚類單元,用于對(duì)步驟E得到的最終切分結(jié)果進(jìn)行聚類處理,去掉干擾字符。
9.根據(jù)權(quán)利要求7或8所述的字符切分的裝置,其特征在于,所述圖像預(yù)處理單元還用于去黑邊和去噪處理。
10.根據(jù)權(quán)利要求7或8所述的字符切分的裝置,其特征在于,所述第一次切分單元進(jìn)一步用于 當(dāng)一個(gè)字符的最大寬度超過了第一預(yù)設(shè)值時(shí),對(duì)這個(gè)字符進(jìn)行拆分處理; 當(dāng)兩個(gè)相鄰字符的重合度大于第二預(yù)設(shè)值時(shí),對(duì)這兩個(gè)相鄰字符進(jìn)行合并處理。
全文摘要
本發(fā)明公開了一種字符切分的方法,首先,輸入待處理的圖像,將所述圖像轉(zhuǎn)換成二值或灰度圖像;利用提取連通域或投影方法對(duì)圖像中的一行字符進(jìn)行第一次切分;對(duì)于第一次切分后得到的字符按照預(yù)定規(guī)則進(jìn)行拆分和/或合并;對(duì)于經(jīng)過以上步驟處理后得到的每個(gè)字符計(jì)算匹配分?jǐn)?shù),根據(jù)這些分?jǐn)?shù)建立一個(gè)二維的字符匹配表;按照一行內(nèi)所有字符加起來匹配分?jǐn)?shù)最高的規(guī)則確定一行內(nèi)所有字符的切分點(diǎn),進(jìn)行第二次切分得到最終切分結(jié)果。采用了本發(fā)明的技術(shù)方案,能夠解決圖像中一行字符的通用切分問題,對(duì)漢字、數(shù)字和英文字母的任意組合進(jìn)行切分。
文檔編號(hào)G06K9/00GK102750534SQ20121021050
公開日2012年10月24日 申請(qǐng)日期2012年6月26日 優(yōu)先權(quán)日2012年6月26日
發(fā)明者張雪玲 申請(qǐng)人:北京文通科技有限公司