本發(fā)明涉及圖像識(shí)別領(lǐng)域,尤其涉及用于識(shí)別圖像中手寫(xiě)文字的方法、系統(tǒng)及其設(shè)備。
背景技術(shù):
隨著電子商務(wù)的發(fā)展,人們已經(jīng)習(xí)慣于在網(wǎng)上購(gòu)物。人們可以通過(guò)網(wǎng)絡(luò)搜索商品、瀏覽商品以及付款購(gòu)買(mǎi)商品。但是實(shí)體商品由賣(mài)方到買(mǎi)方的過(guò)程卻無(wú)法通過(guò)網(wǎng)絡(luò)實(shí)現(xiàn),需要通過(guò)快遞郵寄給買(mǎi)方。在商品郵寄的過(guò)程中,無(wú)法避免的需要填寫(xiě)運(yùn)單,在物流分揀過(guò)程中,運(yùn)單地址需要錄單員手工錄入,大量的運(yùn)單需要許多錄單員完成錄入工作,需要耗費(fèi)大量的人力和財(cái)力。人工錄入運(yùn)單地址的工作比較枯燥乏味,錄單員錄入的準(zhǔn)確率很容易受到外部因素的影響而造成錄入信息出錯(cuò)。
技術(shù)實(shí)現(xiàn)要素:
為了解決上述技術(shù)問(wèn)題,本發(fā)明提出用于識(shí)別圖像中手寫(xiě)文字的方法、系統(tǒng)及其設(shè)備,用于自動(dòng)識(shí)別手寫(xiě)文字,旨在提高圖像中手寫(xiě)文字的識(shí)別精準(zhǔn)度與工作效率,節(jié)省人力物力。
為了實(shí)現(xiàn)上述目的,本發(fā)明的技術(shù)方案為:
用于識(shí)別圖像中手寫(xiě)文字的方法,包括步驟:
s1,獲取目標(biāo)圖像;
s2,對(duì)所述目標(biāo)圖像進(jìn)行預(yù)處理;
s3,從預(yù)處理后的目標(biāo)圖像中識(shí)別出手寫(xiě)文字區(qū)域;
s4,對(duì)步驟s3中所述的手寫(xiě)文字區(qū)域進(jìn)行行切分,獲取若干個(gè)文字行圖片;
s5,將步驟s4中所述的文字行圖片進(jìn)行單個(gè)文字切分,直至歷遍全部的步驟s4中所述的文字行圖片。
步驟s1中所述的目標(biāo)圖像為快遞運(yùn)單。
步驟s3中所述的手寫(xiě)文字區(qū)域?yàn)榈刂穮^(qū)域。
步驟s2中所述的預(yù)處理包括步驟:
s21,利用中值濾波方法對(duì)所述目標(biāo)圖像進(jìn)行去噪處理;
s22,將去噪處理后的目標(biāo)圖像進(jìn)行二值化。
所述步驟s3包括步驟:
s31,獲取所述目標(biāo)圖像的背景圖像,所述背景圖像是目標(biāo)圖像去除手寫(xiě)文字區(qū)域后的圖像;
s32,將所述背景圖像與所述目標(biāo)圖像進(jìn)行匹配,利用背景圖像識(shí)別出目標(biāo)圖像中的手寫(xiě)文字區(qū)域;
s33,對(duì)所述目標(biāo)圖像中的手寫(xiě)文字區(qū)域進(jìn)行復(fù)制并保存。
所述步驟s4包括步驟:
s41,對(duì)步驟s3中所述的手寫(xiě)文字區(qū)域的圖像進(jìn)行橫向投影;
s42,根據(jù)所述橫向投影的投影值,對(duì)手寫(xiě)文字區(qū)域的圖像進(jìn)行橫向切分,獲得文字行圖片,并保存所述文字行圖片。
所述步驟s5包括步驟:
s51,對(duì)步驟s4中所述的文字行圖片進(jìn)行縱向投影;
s52,根據(jù)所述縱向投影的投影值,對(duì)文字行圖片進(jìn)行縱向切分,獲得單個(gè)文字,并保存所述的單個(gè)文字。
步驟s42中所述的橫向切分包括步驟:
s421,選擇所述橫向投影連續(xù)5個(gè)投影值都小于15的位置對(duì)手寫(xiě)文字區(qū)域的圖像進(jìn)行橫向切分。
步驟s52中所述的縱向切分包括步驟:
s521,選擇所述縱向投影連續(xù)3個(gè)投影值都小于5的位置對(duì)手寫(xiě)文字區(qū)域的圖像進(jìn)行縱向切分。
用于識(shí)別圖像中手寫(xiě)文字的系統(tǒng),包括:
圖像采集模塊,用于獲取目標(biāo)圖像;
圖像處理模塊,用于對(duì)所述目標(biāo)圖像進(jìn)行預(yù)處理;
手寫(xiě)文字區(qū)域識(shí)別模塊,用于從預(yù)處理后的目標(biāo)圖像中識(shí)別出手寫(xiě)文字區(qū)域;
橫向投影與切分模塊,用于對(duì)所述的手寫(xiě)文字區(qū)域進(jìn)行行切分,獲取若干個(gè)文字行圖片;
縱向投影與切分模塊,用于對(duì)所述的文字行圖片進(jìn)行單個(gè)文字切分,直至歷遍全部的所述的文字行圖片。
用于識(shí)別圖像中手寫(xiě)文字的設(shè)備,包括存儲(chǔ)有計(jì)算機(jī)程序的計(jì)算機(jī)可讀介質(zhì),所述程序被運(yùn)行用于執(zhí)行:
s1,獲取目標(biāo)圖像;
s2,對(duì)所述目標(biāo)圖像進(jìn)行預(yù)處理;
s3,從預(yù)處理后的目標(biāo)圖像中識(shí)別出手寫(xiě)文字區(qū)域;
s4,對(duì)步驟s3中所述的手寫(xiě)文字區(qū)域進(jìn)行行切分,獲取若干個(gè)文字行圖片;
s5,將步驟s4中所述的文字行圖片進(jìn)行單個(gè)文字切分,直至歷遍全部的步驟s4中所述的文字行圖片。
本發(fā)明的有益效果是:
1、將背景圖像與所述目標(biāo)圖像進(jìn)行匹配,利用背景圖像中空白區(qū)域的特征識(shí)別出目標(biāo)圖像中的文字區(qū)域;對(duì)文字區(qū)域的圖片進(jìn)行橫向投影與橫向切分,從而實(shí)現(xiàn)對(duì)文字區(qū)域的行切分得到文字行圖片,再對(duì)文字行圖片進(jìn)行縱向投影與縱向切分,從而實(shí)現(xiàn)由文字行到單個(gè)文字的切分得到單個(gè)文字。
2、將文字區(qū)域進(jìn)行切分至單個(gè)文字,能夠準(zhǔn)確的獲取運(yùn)單信息,提高了識(shí)別的效率。
附圖說(shuō)明
圖1示出了根據(jù)本申請(qǐng)的實(shí)施例的流程圖。
具體實(shí)施方式
為了更好的了解本發(fā)明的技術(shù)方案,下面結(jié)合附圖1對(duì)本發(fā)明作進(jìn)一步說(shuō)明。
如圖1所示,用于識(shí)別圖像中手寫(xiě)文字的方法,包括步驟:
s1,獲取目標(biāo)圖像。
本實(shí)施例中的目標(biāo)圖像為快遞運(yùn)單。掃描完整的快遞運(yùn)單,獲取完整的快遞運(yùn)單圖像。
s2,對(duì)所述目標(biāo)圖像進(jìn)行預(yù)處理。
利用中值濾波方法對(duì)所述目標(biāo)圖像進(jìn)行去噪處理;
將去噪處理后的目標(biāo)圖像進(jìn)行二值化。
s3,從預(yù)處理后的目標(biāo)圖像中識(shí)別出文字區(qū)域。文字區(qū)域?yàn)槭謱?xiě)文字區(qū)域。快遞運(yùn)單中的文字區(qū)域?yàn)槟康牡刂穮^(qū)域。
獲取所述目標(biāo)圖像的背景圖像,所述背景圖像是目標(biāo)圖像去除文字區(qū)域后的圖像;即空白快遞運(yùn)單圖像。
將所述背景圖像與所述目標(biāo)圖像進(jìn)行匹配,利用背景圖像識(shí)別出目標(biāo)圖像中的手寫(xiě)文字區(qū)域。將背景圖像中用于鎖定目標(biāo)圖像中手寫(xiě)文字區(qū)域的區(qū)域定義為空白區(qū)域(即空白運(yùn)單中的目的地址區(qū)域),利用背景圖像中空白區(qū)域的特征識(shí)別出目標(biāo)圖像中的手寫(xiě)文字區(qū)域。即根據(jù)空白運(yùn)單圖片中目的地址區(qū)域的特點(diǎn),用目的地址區(qū)域上、下、左、右邊緣的特點(diǎn)與待識(shí)別的運(yùn)單圖片中匹配,從而鎖定運(yùn)單中的目的地址區(qū)域。
對(duì)所述目標(biāo)圖像中的手寫(xiě)文字區(qū)域(即目的地址區(qū)域)進(jìn)行復(fù)制并保存。從而,獲取手寫(xiě)文字區(qū)域的圖像。
s4,對(duì)步驟s3中所述的手寫(xiě)文字區(qū)域進(jìn)行行切分,獲取若干個(gè)文字行圖片。
對(duì)步驟s3中所述的手寫(xiě)文字區(qū)域的圖像進(jìn)行橫向投影;
根據(jù)所述橫向投影的投影值,選擇所述橫向投影連續(xù)5個(gè)投影值都小于15的位置對(duì)手寫(xiě)文字區(qū)域的圖像進(jìn)行橫向切分。從而實(shí)現(xiàn)手寫(xiě)文字區(qū)域(即目的地址區(qū)域)的按行切分,獲得文字行圖片(即地址行圖片),并保存所述文字行圖片(即地址行圖片)。
所述投影值為,圖像投影在該處的像素值為255的像素點(diǎn)的個(gè)數(shù)累積求和。例如,一條曲線,其橫坐標(biāo)軸為x軸,縱坐標(biāo)軸為y軸,那么y=a(或x=a)時(shí)的該曲線在y(或x)軸上的投影值就是當(dāng)y(或x)固定為a時(shí),該曲線上有多少個(gè)像素點(diǎn)(其像素值為255)。連續(xù)n個(gè)投影值,指代的是,在y(或x)以一定差值為間隔連續(xù)取n個(gè)數(shù)值時(shí)候的投影值。例如,y(或x)以1作為差值,則連續(xù)5個(gè)為,y(或x)=2,3,4,5,6。
s5,將步驟s4中所述的文字行圖片進(jìn)行單個(gè)文字切分,直至歷遍全部的步驟s4中所述的文字行圖片。
對(duì)步驟s4中所述的文字行圖片(即地址行圖片)進(jìn)行縱向投影;
根據(jù)所述縱向投影的投影值,選擇所述縱向投影連續(xù)3個(gè)投影值都小于5的位置對(duì)手寫(xiě)文字區(qū)域的圖像進(jìn)行縱向切分。獲得單個(gè)文字,并保存所述的單個(gè)文字。
即根據(jù)所述縱向投影的投影值,選擇所述縱向投影連續(xù)3個(gè)投影值都小于5的位置對(duì)手寫(xiě)文字區(qū)域的圖像進(jìn)行縱向切分,從而實(shí)現(xiàn)由地址行到單個(gè)漢字的切分,并把切分得到單個(gè)漢字進(jìn)行保存。
用于識(shí)別圖像中手寫(xiě)文字的系統(tǒng),包括:
圖像采集模塊,用于獲取目標(biāo)圖像(即快遞運(yùn)單);
圖像處理模塊,用于對(duì)所述目標(biāo)圖像(即快遞運(yùn)單)進(jìn)行預(yù)處理;
手寫(xiě)文字區(qū)域識(shí)別模塊,用于從預(yù)處理后的目標(biāo)圖像(即快遞運(yùn)單)中識(shí)別出手寫(xiě)文字區(qū)域(即地址區(qū)域);
橫向投影與切分模塊,用于對(duì)所述的手寫(xiě)文字區(qū)域進(jìn)行行切分,獲取若干個(gè)文字行圖片(即地址行圖片);
縱向投影與切分模塊,用于對(duì)所述的文字行圖片(即地址行圖片)進(jìn)行單個(gè)文字切分,直至歷遍全部的所述的文字行圖片(即地址行圖片)。
用于識(shí)別圖像中手寫(xiě)文字的方法的設(shè)備,包括存儲(chǔ)有計(jì)算機(jī)程序的計(jì)算機(jī)可讀介質(zhì),所述程序被運(yùn)行用于執(zhí)行:
s1,獲取目標(biāo)圖像(即快遞運(yùn)單);
s2,對(duì)所述目標(biāo)圖像(即快遞運(yùn)單)進(jìn)行預(yù)處理;
s3,從預(yù)處理后的目標(biāo)圖像(即快遞運(yùn)單)中識(shí)別出手寫(xiě)文字區(qū)域;
s4,對(duì)步驟s3中所述的手寫(xiě)文字區(qū)域進(jìn)行行切分,獲取若干個(gè)文字行圖片(即地址行圖片);
s5,將步驟s4中所述的文字行圖片進(jìn)行單個(gè)文字切分,直至歷遍全部的步驟s4中所述的文字行圖片(即地址行圖片)。
以上描述僅為本申請(qǐng)的較佳實(shí)施例以及對(duì)所運(yùn)用技術(shù)原理的說(shuō)明。本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,本申請(qǐng)中所涉及的發(fā)明范圍,并不限于上述技術(shù)特征的特定組合而成的技術(shù)方案,同時(shí)也應(yīng)涵蓋在不脫離所述發(fā)明構(gòu)思的情況下,由上述技術(shù)特征或其等同特征進(jìn)行任意組合而形成的其它技術(shù)方案。例如上述特征與本申請(qǐng)中公開(kāi)的(但不限于)具有類(lèi)似功能的技術(shù)特征進(jìn)行互相替換而形成的技術(shù)方案。