切分方法的流程圖。如圖1所示,該字符切分方法可應(yīng)用于切分圖像上的字符,例如各類證件的字符切分,像身份證、護(hù)照、駕駛證等,這些證件識(shí)別前都需要進(jìn)行切分,該方法可以提高字符切分的精確度。當(dāng)然,本方法并不限定用于各類證件的字符切分,還可以用于其他包括字符的圖像的字符切分。該方法例如可以包括以下步驟:
[0061]在步驟SlOl中,對(duì)包含字符的圖像進(jìn)行預(yù)處理,得到二值化圖像。
[0062]這里包含字符的圖像可以是掃描圖像,也可以是拍照得到的圖像,在此不作限制。先對(duì)圖像進(jìn)行二值化處理,可以得到二值化圖像。二值化圖像中只包括黑白兩種顏色,一般地,有字的部分為白色,空白部分為黑色,當(dāng)然也可以反過(guò)來(lái)。
[0063]在步驟S102中,在上述二值化圖像上獲取待切分行圖像。
[0064]上述二值化圖像上可以有多行字符,切分時(shí)可以逐行進(jìn)行切分,先獲取某個(gè)待切分行的圖像。
[0065]在步驟S103中,根據(jù)上述待切分行圖像的投影圖中各像素點(diǎn)的像素值,獲取待切分行圖像對(duì)應(yīng)的直方圖。
[0066]待切分行圖像的投影圖中可以包括每個(gè)像素點(diǎn)的像素值,根據(jù)這些像素值可以得到待切分行圖像對(duì)應(yīng)的直方圖,即通過(guò)直方圖來(lái)表現(xiàn)不同字符像素值的大小。
[0067]在步驟S104中,根據(jù)上述直方圖的分布,切分獲取上述待切分行圖像中的各字符。
[0068]由于二值化圖像中只有黑白兩種顏色,對(duì)應(yīng)的像素值可以是白色255,黑色為0,這樣直方圖中字符部分和空白部分的像素值會(huì)有很大的差異,根據(jù)這個(gè)差異就可以很容易切分出字符。
[0069]本實(shí)施例中,對(duì)包含字符的圖像進(jìn)行預(yù)處理,得到二值化圖像,在上述二值化圖像上獲取待切分行圖像,進(jìn)而根據(jù)上述待切分行圖像的投影圖中各像素點(diǎn)的像素值,獲取待切分行圖像對(duì)應(yīng)的直方圖,根據(jù)上述直方圖的分布,切分獲取上述待切分行圖像中的各字符,這種方式中二值化圖像中只有黑白兩種顏色,且這兩種顏色對(duì)應(yīng)的像素值差別大,形成的直方圖中界線明顯,容易清晰準(zhǔn)確的切分出圖像上的字符。
[0070]進(jìn)一步地,上述待切分行圖像的投影圖中包括m行Xn列像素點(diǎn),即待切分行圖像由多行多列像素點(diǎn)組成。相應(yīng)地,步驟S103可以為:將待切分行圖像的投影圖中每列m行像素點(diǎn)的值進(jìn)行疊加,獲取η個(gè)疊加后的像素值。進(jìn)而根據(jù)η個(gè)疊加后的像素值,形成上述待切分行圖像對(duì)應(yīng)的直方圖。其中m、n均為正整數(shù)。
[0071]圖2是根據(jù)一示例性實(shí)施例示出的一種字符切分方法中待切分圖像示意圖,如圖2所示,在該示例中,上圖為待切分行圖像,其中,m = 9,n = 20,待切分行中包含“北京”兩個(gè)字符,實(shí)際二值化圖像中“北京”為白色,其它空白部分為黑色。
[0072]每一列中9行像素點(diǎn)的像素點(diǎn)疊加,得到20列像素值和,對(duì)應(yīng)的直方圖可以如圖2中下圖所示。
[0073]圖3為根據(jù)另一示例性實(shí)施例示出的一種字符切分方法的流程圖,如圖3所示,在上述實(shí)施例的基礎(chǔ)上,上述切分獲取待切分行圖像中的各字符,可以包括:
[0074]在步驟S301中,確定上述直方圖中第一字符的起始點(diǎn)。
[0075]參照?qǐng)D2,第一字符的起始點(diǎn)即直方圖上的01點(diǎn)。
[0076]在步驟S302中,在上述直方圖的第一方向上確定距離該第一字符的起始點(diǎn)預(yù)設(shè)步長(zhǎng)的第二點(diǎn)。第一方向可以是由左到右的方向,即第一字符的起始點(diǎn)指向第二字符的方向。
[0077]參照?qǐng)D2,第二點(diǎn)即直方圖上的02點(diǎn),01點(diǎn)和02點(diǎn)之間相距預(yù)設(shè)步長(zhǎng)(step)。
[0078]在步驟S303中,以上述第二點(diǎn)為起點(diǎn),沿上述第一方向、第二方向的至少一者搜索上述直方圖中的第一字符的終止點(diǎn),該終止點(diǎn)對(duì)應(yīng)的像素值不為0,且該終止點(diǎn)向第一方向的相鄰點(diǎn)的像素值為O。
[0079]上述第一方向和第二方向是相反方向,第二方向可以由第二字符指向第一字符的方向。參照?qǐng)D2,第一字符的終止點(diǎn)可以是圖2直方圖中的03點(diǎn),03點(diǎn)為非O點(diǎn),但是03點(diǎn)右側(cè)相鄰點(diǎn)為O。
[0080]在步驟S304中,將上述第一字符的起始點(diǎn)到第一字符的終止點(diǎn)之間的直方圖對(duì)應(yīng)的圖像切分為第一字符圖像。
[0081]如圖2中01點(diǎn)到03點(diǎn)對(duì)應(yīng)的就是第一字符“北”,根據(jù)包含字符的圖像與直方圖的對(duì)應(yīng)關(guān)系,可以準(zhǔn)確的切分出第一字符的圖像。
[0082]—方面,確定上述直方圖中第一字符的起始點(diǎn),可以包括:當(dāng)上述第一字符為待切分行圖像中的第一個(gè)字符時(shí),從直方圖的邊界開始搜索,確定查到的第一個(gè)像素值不為O的點(diǎn)為該第一字符的起始點(diǎn)。這里邊界可以是左側(cè)邊界,也可以是右側(cè)邊界,在此不作限制。
[0083]另一方面,確定上述直方圖中第一字符的起始點(diǎn),可以包括:當(dāng)上述第一字符不為待切分行圖像中的第一個(gè)字符時(shí),從上一字符的終止點(diǎn)向第一方向搜索,確定查找到的第一個(gè)像素值不為O的點(diǎn)為第一字符的起始點(diǎn)。
[0084]例如上述第一字符切分完成后,可以從第一字符的終止點(diǎn)03點(diǎn)開始沿第一方向搜索第二字符的起始點(diǎn)04點(diǎn),04點(diǎn)對(duì)應(yīng)的像素值不為O,但是04點(diǎn)向第二方向的相鄰點(diǎn)的像素值為0.,找到起始點(diǎn)后,采用與第一字符同樣的方法找到第二個(gè)字符的終止點(diǎn)并進(jìn)行切分。依次循環(huán),直到將待切分行中所有的字符切分出來(lái)。這樣可以快速準(zhǔn)確的找到每個(gè)字符對(duì)應(yīng)的位置并進(jìn)行切分。
[0085]可選地,上述預(yù)設(shè)步長(zhǎng)為待切分行圖像的高度值。由于一般字符接近于正方形,按照待切分行圖像的高度值為步長(zhǎng),便于快速找到字符的終點(diǎn)。
[0086]可選地,待切分行圖像的投影圖中,有字符的像素點(diǎn)對(duì)應(yīng)的像素值為非0,無(wú)字符的像素點(diǎn)對(duì)應(yīng)的像素值為O。這樣可以使得得到的直方圖中字符之間界限明顯,以清晰準(zhǔn)確的切分出各個(gè)字符。
[0087]下述為本公開裝置實(shí)施例,可以用于執(zhí)行本公開方法實(shí)施例。對(duì)于本公開裝置實(shí)施例中未披露的細(xì)節(jié),請(qǐng)參照本公開方法實(shí)施例。
[0088]圖4是根據(jù)一示例性實(shí)施例示出的一種字符切分裝置實(shí)施例一的框圖,該字符切分裝置可以通過(guò)軟件、硬件或者兩者的結(jié)合實(shí)現(xiàn)成為處理設(shè)備的部分或全部,該處理設(shè)備可以是服務(wù)器、終端等,例如計(jì)算機(jī)、筆記本等,在此不作限制。如圖4所示,該裝置包括:預(yù)處理模塊401、獲取模塊402、轉(zhuǎn)換模塊403和切分模塊404,其中:
[0089]預(yù)處理模塊401,被配置為對(duì)包含字符的圖像進(jìn)行預(yù)處理,得到二值化圖像。
[0090]獲取模塊402,被配置為在所述二值化圖像上獲取待切分行圖像。
[0091]轉(zhuǎn)換模塊403,被配置為根據(jù)所述待切分行圖像的投影圖中各像素點(diǎn)的像素值,獲取所述待切分行圖像對(duì)應(yīng)的直方圖。
[0092]切分模塊404,被配置為根據(jù)所述直方圖的分布,切分獲取所述待切分行圖像中的各字符。
[0093]本實(shí)施例中,對(duì)包含字符的圖像進(jìn)行預(yù)處理,得到二值化圖像,在上述二值化圖像上獲取待切分行圖像,進(jìn)而根據(jù)上述待切分行圖像的投影圖中各像素點(diǎn)的像素值,獲取待切分行圖像對(duì)應(yīng)的直方圖,根據(jù)上述直方圖的分布,切分獲取上述待切分行圖像中的各字符,這種方式中二值化圖像中只有黑白兩種顏色,且這兩種顏色對(duì)應(yīng)的像素值差別大,形成的直方圖中界線明顯,容易清晰準(zhǔn)確的切分出圖像上的字符。
[0094]在上述圖4所示的實(shí)施例的基礎(chǔ)上,圖5是根據(jù)一示例性實(shí)施例示出的一種字符切分裝置實(shí)施例二的框圖,如圖5所示,上述轉(zhuǎn)換模塊403可以包括:疊加單元501和轉(zhuǎn)換單元502,其中:
[0095]疊加單元501,被配置為將所述待切分行圖像的投影圖中每列m行像素點(diǎn)的值進(jìn)行疊加,獲取η個(gè)疊加后的像素值。
[0096]轉(zhuǎn)換單元502,被配置為根據(jù)所述η個(gè)疊加后的像素值,形成所述待切分行圖像對(duì)應(yīng)的直方圖。
[0097]在上述圖4所示的實(shí)施例的基礎(chǔ)上,圖6是根據(jù)一示例性實(shí)施例示出的一種字符切分裝置實(shí)施例三的框圖,如圖6所示,上述切分模塊404,可以包括:第一確定單元601、第二確定單元602、搜索單元603和切分單元604,其中,
[0098]第一確定單元601,被配置為確定所述直方圖中的第一字符的起始點(diǎn)。
[0099]第二確定單元602,被配置為在所述直