1.一種文本圖像的分割方法,其特征在于,所述方法包括:
對文本圖像進(jìn)行二值化處理獲取二值化圖像,其中,所述文本圖像包括多個(gè)文本行;
獲取所述二值化圖像中滿足預(yù)設(shè)的閾值條件的連通區(qū)域;
獲取所述連通區(qū)域的字符節(jié)點(diǎn)構(gòu)建有向圖;
對所述有向圖進(jìn)行最短路徑搜索得到所述文本圖像中屬于每一個(gè)所述文本行的字符節(jié)點(diǎn)序列;
根據(jù)所得到的字符節(jié)點(diǎn)序列對所述文本圖像進(jìn)行分割。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取所述連通區(qū)域的字符節(jié)點(diǎn)構(gòu)建有向圖的步驟,包括:
獲取所述連通區(qū)域的字符節(jié)點(diǎn);
根據(jù)所述二值化圖像的像素點(diǎn)獲取多個(gè)引導(dǎo)節(jié)點(diǎn)和一個(gè)終止節(jié)點(diǎn);
根據(jù)所述連通區(qū)域的字符節(jié)點(diǎn)、所述多個(gè)引導(dǎo)節(jié)點(diǎn)及所述終止節(jié)點(diǎn)構(gòu)建節(jié)點(diǎn)集;
獲取所述節(jié)點(diǎn)集中每個(gè)點(diǎn)與所述節(jié)點(diǎn)集中所有點(diǎn)之間的權(quán)值;
根據(jù)所述節(jié)點(diǎn)集及所述節(jié)點(diǎn)集中每個(gè)點(diǎn)與所述節(jié)點(diǎn)集中所有點(diǎn)之間的權(quán)值構(gòu)建有向圖。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述多個(gè)引導(dǎo)節(jié)點(diǎn)為增設(shè)在所述二值化圖像的第一列像素點(diǎn)之前的一列像素點(diǎn),所述終止節(jié)點(diǎn)為增設(shè)在所述二值化圖像的最后一列像素點(diǎn)之后的一列像素點(diǎn)中的其中一個(gè)像素點(diǎn)。
4.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述獲取所述節(jié)點(diǎn)集中每個(gè)點(diǎn)與所述節(jié)點(diǎn)集中所有點(diǎn)之間的權(quán)值的步驟,包括:
獲取所述節(jié)點(diǎn)集的每個(gè)所述字符節(jié)點(diǎn)與所述節(jié)點(diǎn)集中所有點(diǎn)之間的權(quán)值;
獲取所述節(jié)點(diǎn)集中的每個(gè)所述引導(dǎo)節(jié)點(diǎn)與所述節(jié)點(diǎn)集中所有點(diǎn)之間的權(quán)值;
獲取所述節(jié)點(diǎn)集中的所述終止節(jié)點(diǎn)與所述節(jié)點(diǎn)集中所有點(diǎn)之間的權(quán)值。
5.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述對所述有向圖進(jìn)行最短路徑搜索得到所述文本圖像中屬于每一個(gè)所述文本行的字符節(jié)點(diǎn)序列的步驟,包括:
獲取所述有向圖的起始節(jié)點(diǎn),其中,所述起始節(jié)點(diǎn)為所述多個(gè)引導(dǎo)節(jié)點(diǎn)中的一個(gè);
查找所述有向圖中所述起始節(jié)點(diǎn)到所述終止節(jié)點(diǎn)之間的最短路徑;
根據(jù)所述最短路徑得到所述節(jié)點(diǎn)集中屬于當(dāng)前文本行的字符節(jié)點(diǎn)序列;
將所述字符節(jié)點(diǎn)序列中的所有字符節(jié)點(diǎn)從所述節(jié)點(diǎn)集中刪除;
判斷所述節(jié)點(diǎn)集中是否存在字符節(jié)點(diǎn),當(dāng)所述節(jié)點(diǎn)集中存在字符節(jié)點(diǎn)時(shí),更新所述有向圖;再次執(zhí)行查找所述有向圖中所述起始節(jié)點(diǎn)到所述終止節(jié)點(diǎn)之間的最短路徑,根據(jù)所述最短路徑得到所述節(jié)點(diǎn)集中屬于下一文本行的字符節(jié)點(diǎn)序列,將所述字符節(jié)點(diǎn)序列中的所有字符節(jié)點(diǎn)從所述節(jié)點(diǎn)集中刪除,直至所述節(jié)點(diǎn)集中沒有字符節(jié)點(diǎn)存在。
6.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述獲取所述節(jié)點(diǎn)集的每個(gè)所述字符節(jié)點(diǎn)與所述節(jié)點(diǎn)集中所有點(diǎn)之間的權(quán)值的步驟,包括:
在所述節(jié)點(diǎn)集中查找與當(dāng)前字符節(jié)點(diǎn)的縱向距離小于預(yù)設(shè)距離閾值的所有字符節(jié)點(diǎn);
在所述所有字符節(jié)點(diǎn)中查找與所述當(dāng)前字符節(jié)點(diǎn)距離最近的字符節(jié)點(diǎn);
將所述當(dāng)前字符節(jié)點(diǎn)與所述最近的字符節(jié)點(diǎn)之間的距離作為所述當(dāng)前字符節(jié)點(diǎn)與所述最近的字符節(jié)點(diǎn)之間的權(quán)值;
將所述當(dāng)前字符節(jié)點(diǎn)與所述終止節(jié)點(diǎn)之間的距離作為所述當(dāng)前字符節(jié)點(diǎn)與所述終止節(jié)點(diǎn)之間的權(quán)值;
將所述當(dāng)前字符節(jié)點(diǎn)與所述節(jié)點(diǎn)集中其它字符節(jié)點(diǎn)及所有引導(dǎo)節(jié)點(diǎn)之間的權(quán)值設(shè)置為第一預(yù)設(shè)權(quán)值。
7.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述獲取所述節(jié)點(diǎn)集中的每個(gè)所述引導(dǎo)節(jié)點(diǎn)與所述節(jié)點(diǎn)集中所有點(diǎn)之間的權(quán)值的步驟,包括:
在所述節(jié)點(diǎn)集中查找與每個(gè)引導(dǎo)節(jié)點(diǎn)距離最近的字符節(jié)點(diǎn);
獲取當(dāng)前引導(dǎo)節(jié)點(diǎn)與所述最近的字符節(jié)點(diǎn)之間的距離作為所述當(dāng)前引導(dǎo)節(jié)點(diǎn)與所述最近的字符節(jié)點(diǎn)之間的權(quán)值;
將所述當(dāng)前引導(dǎo)節(jié)點(diǎn)與所述節(jié)點(diǎn)集中除所述最近的字符節(jié)點(diǎn)之外的其它字符節(jié)點(diǎn)之間的權(quán)值及所述當(dāng)前引導(dǎo)節(jié)點(diǎn)與所述終止節(jié)點(diǎn)之間的權(quán)值均設(shè)置為第一預(yù)設(shè)權(quán)值;
將所述當(dāng)前引導(dǎo)節(jié)點(diǎn)與所述節(jié)點(diǎn)集中的其它引導(dǎo)節(jié)點(diǎn)之間的權(quán)值設(shè)置為第二預(yù)設(shè)權(quán)值,其中,所述第一預(yù)設(shè)權(quán)值遠(yuǎn)大于所述第二預(yù)設(shè)權(quán)值。
8.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取所述二值化圖像中滿足預(yù)設(shè)的閾值條件的連通區(qū)域的步驟之前,還包括:利用線性結(jié)構(gòu)元素對所述二值化圖像進(jìn)行閉運(yùn)算操作。
9.一種文本圖像的分割裝置,其特征在于,所述裝置包括:
二值化圖像獲取模塊,用于對文本圖像進(jìn)行二值化處理獲取二值化圖像,其中,所述文本圖像包括多個(gè)文本行;
連通區(qū)域獲取模塊,用于獲取所述二值化圖像中滿足預(yù)設(shè)的閾值條件的連通區(qū)域;
有向圖構(gòu)建模塊,用于獲取所述連通區(qū)域的字符節(jié)點(diǎn)構(gòu)建有向圖;
字符節(jié)點(diǎn)序列獲取模塊,用于對所述有向圖進(jìn)行最短路徑搜索得到所述文本圖像中屬于每一個(gè)所述文本行的字符節(jié)點(diǎn)序列;
分割模塊,用于根據(jù)所得到的字符節(jié)點(diǎn)序列對所述文本圖像進(jìn)行分割。
10.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述有向圖構(gòu)建模塊包括:
第一獲取子模塊,用于獲取所述連通區(qū)域的字符節(jié)點(diǎn);
第二獲取子模塊,用于根據(jù)所述二值化圖像的像素點(diǎn)獲取多個(gè)引導(dǎo)節(jié)點(diǎn)和一個(gè)終止節(jié)點(diǎn);
第一構(gòu)建子模塊,用于根據(jù)所述連通區(qū)域的字符節(jié)點(diǎn)、所述多個(gè)引導(dǎo)節(jié)點(diǎn)及所述終止節(jié)點(diǎn)構(gòu)建節(jié)點(diǎn)集;
權(quán)值獲取子模塊,用于獲取所述節(jié)點(diǎn)集中每個(gè)點(diǎn)與所述節(jié)點(diǎn)集中所有點(diǎn)之間的權(quán)值;
第二構(gòu)建子模塊,用于根據(jù)所述節(jié)點(diǎn)集及所述節(jié)點(diǎn)集中每個(gè)點(diǎn)與所述節(jié)點(diǎn)集中所有點(diǎn)之間的權(quán)值構(gòu)建有向圖。