候選框的固定橫向邊界;
B、以圖像中心作為候選框中心,以單字長(zhǎng)為框長(zhǎng),作為候選框的初始狀態(tài);
C、以單字長(zhǎng)作為候選框長(zhǎng)的變化步長(zhǎng)。
[0018]本實(shí)例中,文本的縱向切割和橫向切割采用已有的字符分割方法——投影法,具體過程包括:
A、利用文字行與行間隙的特點(diǎn),對(duì)二值化的圖像文本進(jìn)行橫向投影;
B、由橫向投影中行間隙導(dǎo)致的投影峰谷變化,確定文本字長(zhǎng),以及文本的上下沿,即候選框的邊界;
C、利用中文文字與字間空隙的特點(diǎn),對(duì)二值化的圖像文本進(jìn)行縱向投影;
D、由縱向投影首先確定候選框的固定寬度;
E、考慮到文本中英文字符及數(shù)學(xué)字符的影響,對(duì)縱向投影中若峰谷變化不規(guī)律的情況,將文本字長(zhǎng)的值代替文本字寬。
[0019]所述分別計(jì)算每個(gè)候選框內(nèi)外的邊緣分布密度,具體包括:
A、采用Canny或Sobel等邊緣片子提取候選框內(nèi)外的邊緣特征,得到二值化的邊緣圖像;
B、以統(tǒng)計(jì)邊緣密度的單位區(qū)域?yàn)閴K,分別以半個(gè)字寬和字長(zhǎng)作為塊的滑動(dòng)重疊區(qū)域;
C、對(duì)塊內(nèi)像素值進(jìn)行統(tǒng)計(jì),將塊內(nèi)的非零像素個(gè)數(shù)除以塊的面積,得到每個(gè)塊的邊緣概率密度;
D、對(duì)每個(gè)像素點(diǎn),以像素點(diǎn)對(duì)應(yīng)的位置上所有重疊區(qū)域?qū)?yīng)塊的邊緣概率密度的平均值作為該像素點(diǎn)的邊緣概率密度;
E、將邊緣概率密度圖分割成候選框內(nèi)及候選框外區(qū)域。
[0020]所述根據(jù)兩者的邊緣分布密度特點(diǎn)得到每個(gè)候選區(qū)域的置信值,實(shí)現(xiàn)對(duì)未知文本的自動(dòng)相關(guān)內(nèi)容框選,具體包括:
A、分別統(tǒng)計(jì)滑動(dòng)候選框框內(nèi)及對(duì)應(yīng)框外像素的平均邊緣概率密度;
B、將框內(nèi)平均邊緣概率密度比框外平均邊緣概率密度的值作為該候選框的置信值,并記錄下來(lái);
C、輪詢完所有候選框后,選出所有置信值中的最大值,所對(duì)應(yīng)的候選框作為未知文本的相關(guān)內(nèi)容框選區(qū)域。
[0021]本發(fā)明將拍攝的圖片進(jìn)行相關(guān)文本處理,用于教育移動(dòng)終端或者教學(xué)類軟件中的拍照上傳課本內(nèi)容或者拍照搜索答案的功能當(dāng)中,使用者拍攝完照片后無(wú)需手動(dòng)調(diào)整待上傳框,該方法智能完成未知文本的框選。
[0022]以上僅為本發(fā)明的具體實(shí)施例,并不以此限定本發(fā)明的保護(hù)范圍;在不違反本發(fā)明構(gòu)思的基礎(chǔ)上所作的任何替換與改進(jìn),均屬于本發(fā)明的保護(hù)范圍。
【主權(quán)項(xiàng)】
1.一種圖片中相關(guān)文本的自動(dòng)框選方法,其特征在于,包括如下步驟: 對(duì)拍攝的圖片進(jìn)行文本預(yù)處理,將文本與背景分離,對(duì)提取的文本分別進(jìn)行橫向切割和縱向切割,利用橫向切割和縱向切割結(jié)果作為滑動(dòng)候選框的選取依據(jù),并且得到框外對(duì)比區(qū)域的寬度,分別計(jì)算每個(gè)候選框內(nèi)外的邊緣分布密度,根據(jù)候選框內(nèi)外的邊緣分布密度特點(diǎn)得到每個(gè)候選區(qū)域的置信值,實(shí)現(xiàn)對(duì)未知文本的自動(dòng)相關(guān)內(nèi)容框選。2.根據(jù)權(quán)利要求1所述的一種圖片中相關(guān)文本的自動(dòng)框選方法,其特征在于,所述利用提取的文本的橫向切割和縱向切割結(jié)果作為滑動(dòng)候選框的選取依據(jù),具體包括: A、通過文本的縱向切割得到所有候選框的橫向邊界,以及文本的字寬; B、通過文本的橫向切割得到文本的字長(zhǎng),將文本的字長(zhǎng)作為候選框的擴(kuò)張滑動(dòng)步長(zhǎng),滑動(dòng)候選框?qū)D像自中心向外擴(kuò)張式分割成所有可能的候選區(qū)域; C、根據(jù)文本的字長(zhǎng)得到候選框框外寬度,框外寬度等于文本的字長(zhǎng); D、根據(jù)文本的字寬和字長(zhǎng)得到統(tǒng)計(jì)邊緣密度的單位區(qū)域大小。3.根據(jù)權(quán)利要求2所述的一種圖片中相關(guān)文本的自動(dòng)框選方法,其特征在于,所述分別計(jì)算每個(gè)候選框內(nèi)外的邊緣分布密度,具體包括: A、提取候選框內(nèi)外的邊緣特征,得到二值化的邊緣圖像; B、以統(tǒng)計(jì)邊緣密度的單位區(qū)域?yàn)閴K,分別以半個(gè)字寬和字長(zhǎng)作為塊的重疊區(qū)域; C、對(duì)塊內(nèi)像素值進(jìn)行統(tǒng)計(jì),得到每個(gè)塊邊緣概率密度; D、以所有重疊區(qū)域?qū)?yīng)塊的邊緣概率密度的平均值作為像素點(diǎn)的邊緣概率密度; E、將邊緣概率密度圖分割成候選框內(nèi)及候選框外區(qū)域。4.根據(jù)權(quán)利要求1所述的一種圖片中相關(guān)文本的自動(dòng)框選方法,其特征在于,所述根據(jù)候選框內(nèi)外的邊緣分布密度特點(diǎn)得到每個(gè)候選區(qū)域的置信值,實(shí)現(xiàn)對(duì)未知文本的自動(dòng)相關(guān)內(nèi)容框選,具體包括: A、分別統(tǒng)計(jì)滑動(dòng)候選框框內(nèi)及對(duì)應(yīng)框外像素的平均邊緣概率密度; B、將框內(nèi)平均邊緣概率密度比框外平均邊緣概率密度的值作為該候選框的置信值,并記錄下來(lái); C、輪詢完所有候選框后,選出所有置信值中的最大值,所對(duì)應(yīng)的候選框作為未知文本的相關(guān)內(nèi)容框選區(qū)域。5.根據(jù)權(quán)利要求2所述的一種圖片中相關(guān)文本的自動(dòng)框選方法,其特征在于,對(duì)候選框初取狀態(tài)及后面變化步長(zhǎng)的選取,具體包括: A、由文本的縱向切割得到所有候選框的固定橫向邊界; B、以圖像中心作為候選框中心,以單字長(zhǎng)為框長(zhǎng),作為候選框的初始狀態(tài); C、以單字長(zhǎng)作為候選框長(zhǎng)的變化步長(zhǎng)。6.根據(jù)權(quán)利要求1所述的一種圖片中相關(guān)文本的自動(dòng)框選方法,其特征在于,將拍攝的圖片進(jìn)行相關(guān)文本的自動(dòng)框選,用于教育移動(dòng)終端或者教學(xué)類軟件中的拍照上傳課本內(nèi)容或者拍照搜索答案的功能當(dāng)中。
【專利摘要】本發(fā)明公開一種圖片中相關(guān)文本的自動(dòng)框選方法。該方法包括步驟:對(duì)拍攝的圖片進(jìn)行文本預(yù)處理,將文本與背景分離,對(duì)提取的文本分別進(jìn)行橫向切割和縱向切割,作為滑動(dòng)候選框的選取依據(jù),并且得到框外對(duì)比區(qū)域的寬度,分別計(jì)算每個(gè)候選框內(nèi)外的邊緣分布密度,根據(jù)兩者的邊緣分布密度得到每個(gè)候選區(qū)域的置信值,實(shí)現(xiàn)對(duì)未知文本的自動(dòng)相關(guān)內(nèi)容框選。本發(fā)明能將拍攝的照片進(jìn)行相關(guān)文本的自動(dòng)框選,簡(jiǎn)化使用者的操作,提高相關(guān)教育產(chǎn)品的智能化。
【IPC分類】G06T7/00, G06K9/34
【公開號(hào)】CN105095899
【申請(qǐng)?zhí)枴緾N201510517947
【發(fā)明人】徐向民, 羅雅愉
【申請(qǐng)人】華南理工大學(xué)
【公開日】2015年11月25日
【申請(qǐng)日】2015年8月23日