一種局部色調(diào)差異的自然場(chǎng)景文字定位方法
【專(zhuān)利摘要】本發(fā)明提供一種局部色調(diào)差異的自然場(chǎng)景文字定位方法。本發(fā)明不僅利用了文字的紋理特征,而且利用了文字區(qū)域與周?chē)鷧^(qū)域色調(diào)不同的特點(diǎn),有效地對(duì)場(chǎng)景中的文字進(jìn)行定位。通過(guò)取邊緣像素點(diǎn)附近的平均色調(diào)差,利用該平均色調(diào)差與閾值相比較來(lái)判斷該區(qū)域是否含有文字,這樣做可以加入?yún)^(qū)域文字的局部顏色信息,利用文字的顏色一致性與背景的不同來(lái)定位文字。且本發(fā)明利用自適應(yīng)的閾值處理方法來(lái)得到閾值,該閾值是由所有候選框的上下左右區(qū)域的主色調(diào)差的平均值得到的,這樣做的目的是利用整幅圖的顏色信息來(lái)為局部顏色信息做貢獻(xiàn),得到的閾值可以表征場(chǎng)景圖的文字區(qū)域與背景的色調(diào)差。本發(fā)明能較快地對(duì)自然場(chǎng)景中文字進(jìn)行準(zhǔn)確定位。
【專(zhuān)利說(shuō)明】一種局部色調(diào)差異的自然場(chǎng)景文字定位方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于圖像處理和計(jì)算機(jī)視覺(jué)【技術(shù)領(lǐng)域】,特別涉及一種自然場(chǎng)景文字定位方法。
【背景技術(shù)】
[0002]將場(chǎng)景圖片中文字進(jìn)行自動(dòng)的檢測(cè),分割,識(shí)別出來(lái),將對(duì)人們的信息獲取提供非常大的幫助,也對(duì)圖像的語(yǔ)義信息的自動(dòng)理解以及檢索有著非常重要的意義。在車(chē)載導(dǎo)航系統(tǒng)中,如果能自動(dòng)的對(duì)前方的路標(biāo)、商鋪名稱(chēng)、交通標(biāo)志等進(jìn)行定位,識(shí)別,那么將為人們的出行提供安全保障,可以提醒駕駛員減速,以及正確的行車(chē)路線(xiàn)。多媒體以及計(jì)算機(jī)的高速發(fā)展中,圖片以其形象深刻的特殊形式成為傳輸?shù)闹匾橘|(zhì),基于關(guān)鍵詞的檢索已經(jīng)不能滿(mǎn)足人們的需求,而基于圖片內(nèi)容的檢索,已經(jīng)成為發(fā)展的趨勢(shì),檢索中,文字的定位,識(shí)別成為關(guān)鍵的技術(shù),引來(lái)越來(lái)越多學(xué)者的關(guān)注,同時(shí)文字定位可以為盲人的閱讀提供輔助幫助。
[0003]在對(duì)場(chǎng)景中文字定位的現(xiàn)有方法的綜合學(xué)習(xí)中,文字定位的方法大致可以分為兩種方法:1、基于紋理的文字定位方法;2、基于區(qū)域的文字定位方法?;诩y理的文字定位方法,就是利用紋理特征來(lái)區(qū)分開(kāi)文字和非文字,將一個(gè)或一塊區(qū)域中是文字的聚類(lèi)到一起,這種方法的魯棒性好,但是也造成了算法的復(fù)雜度較高?;趨^(qū)域的文本定位方法,就是依據(jù)一塊區(qū)域的像素符合某種相似性來(lái)區(qū)分開(kāi)文字與非文字,比如,可以根據(jù)區(qū)域內(nèi)顏色的一致性作為特征,來(lái)分開(kāi)文本以及背景區(qū)域,這種方法簡(jiǎn)單,但是一種特征往往不能滿(mǎn)足所有的分類(lèi),魯棒性不足,在處理復(fù)雜背景的場(chǎng)景圖片表現(xiàn)中不好的效果。
【發(fā)明內(nèi)容】
[0004]本發(fā)明所要解決的技術(shù)問(wèn)題是,提供一種能有效對(duì)自然場(chǎng)景中文字進(jìn)行定位,同時(shí)速度較快,實(shí)用性較強(qiáng)的文字定位方法。
[0005]本發(fā)明為解決上述技術(shù)問(wèn)題所采樣的技術(shù)方案是,一種局部色調(diào)差異的自然場(chǎng)景文字定位方法,包括以下步驟:
[0006]I)通過(guò)分類(lèi)器對(duì)場(chǎng)景圖片進(jìn)行掃描,以得到候選文字區(qū)域?qū)?yīng)的候選框;
[0007]2)將場(chǎng)景圖片轉(zhuǎn)化為HSI顏色模型,提取色調(diào)H分量,計(jì)算所有候選框box(i)與相鄰區(qū)域的主色調(diào)差異hue_aver:
【權(quán)利要求】
1.一種局部色調(diào)差異的自然場(chǎng)景文字定位方法,其特征在于,包括以下步驟: 1)通過(guò)分類(lèi)器對(duì)場(chǎng)景圖片進(jìn)行掃描,以得到候選文字區(qū)域?qū)?yīng)的候選框; 2)將場(chǎng)景圖片轉(zhuǎn)化為HSI顏色模型,提取色調(diào)H分量,計(jì)算所有候選框box(i)與相鄰區(qū)域的主色調(diào)差異hue_aver:
2.如權(quán)利要求1所述一種局部色調(diào)差異的自然場(chǎng)景文字定位方法,其特征在于,候選框的相鄰區(qū)域的提取方法為: 當(dāng)候選框box(i)未有一邊位于場(chǎng)景圖片的邊界,則在候選框box(i)的上下左右各提取一個(gè)框,當(dāng)候選框box(i)有一邊位于場(chǎng)景圖片的邊界,則不在該邊界方向取框;對(duì)候選框box(i)提取了相鄰框后,將這些框合成一個(gè)區(qū)域作為該候選框的相鄰區(qū)域box_neighbour (i)。
3.如權(quán)利要求1所述一種局部色調(diào)差異的自然場(chǎng)景文字定位方法,其特征在于,各候選框中所有邊緣像素點(diǎn)與鄰居像素點(diǎn)間的平均色調(diào)差local_hue(i)的計(jì)算方法為:
4.如權(quán)利要求1所述一種局部色調(diào)差異的自然場(chǎng)景文字定位方法,其特征在于,步驟3)中通過(guò)Canny算子求取的邊緣圖得到邊緣像素點(diǎn)。
5.如權(quán)利要求1所述一種局部色調(diào)差異的自然場(chǎng)景文字定位方法,其特征在于,所述主色調(diào)為H分量直方圖中的最大色調(diào)值。
【文檔編號(hào)】G06K9/32GK103440487SQ201310377443
【公開(kāi)日】2013年12月11日 申請(qǐng)日期:2013年8月27日 優(yōu)先權(quán)日:2013年8月27日
【發(fā)明者】李宏亮, 黃自力, 姚源, 許靜, 孟凡滿(mǎn), 吳慶波, 黃超 申請(qǐng)人:電子科技大學(xué)