亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于圖像的燃?xì)庵笖?shù)自動(dòng)識(shí)別方法與流程

文檔序號(hào):11808473閱讀:680來源:國知局
一種基于圖像的燃?xì)庵笖?shù)自動(dòng)識(shí)別方法與流程

本發(fā)明屬于圖像識(shí)別技術(shù)領(lǐng)域,涉及一種基于圖像的燃?xì)庵笖?shù)自動(dòng)識(shí)別方法。



背景技術(shù):

目前,在現(xiàn)有的與燃?xì)獗碜x數(shù)提取方法相關(guān)的技術(shù)方案中,多基于定位、分割、特征提取與識(shí)別這樣的方法流程來設(shè)計(jì)。首先使用形態(tài)學(xué)濾波的方法對(duì)圖像進(jìn)行預(yù)處理,通過水平和垂直的灰度投影法實(shí)現(xiàn)燃?xì)獗韴D像的粗定位,利用邊緣檢測(cè)與形態(tài)學(xué)處理相結(jié)合的方法對(duì)粗定位表盤進(jìn)行再次定位,使用垂直投影法分割字符子圖像。這些方法的不同之處體現(xiàn)在特征的提取與識(shí)別方面,其中論文“燃?xì)獗碜x數(shù)的數(shù)字圖像識(shí)別研究”使用了基于BP神經(jīng)網(wǎng)絡(luò)的方法實(shí)現(xiàn)讀數(shù)的識(shí)別,雖然能夠有效的提取燃?xì)獗淼淖x數(shù),但BP神經(jīng)網(wǎng)絡(luò)的讀數(shù)識(shí)別算法在識(shí)別過程中耗時(shí)較長(zhǎng),難以集成到實(shí)時(shí)性要求高的識(shí)別系統(tǒng)中。論文“煤氣表數(shù)字圖像識(shí)別算法研究”根據(jù)不同位置煤氣表數(shù)字的不同特點(diǎn),設(shè)計(jì)了獨(dú)立的識(shí)別網(wǎng)絡(luò)獲取字符內(nèi)容,但其方法僅針對(duì)于煤氣表個(gè)位、十位與百位讀數(shù)的識(shí)別,其固定形式的設(shè)計(jì)不適用于燃?xì)獗碇笖?shù)的提取。論文“基于HALCON的燃?xì)獗肀肀P字符識(shí)別方法研究”在HALCON軟件的ORC系統(tǒng)之上實(shí)現(xiàn)了燃?xì)庵笖?shù)的識(shí)別過程,雖然能夠準(zhǔn)確地提取燃?xì)獗碇笖?shù),但識(shí)別方法過于依賴第三方工具。



技術(shù)實(shí)現(xiàn)要素:

有鑒于此,本發(fā)明的目的在于提供一種基于圖像的燃?xì)庵笖?shù)自動(dòng)識(shí)別方法,該方法簡(jiǎn)化了特征提取與識(shí)別的過程,提升了方法的效率;同時(shí),優(yōu)化了表盤提取與字符分割過程,能夠更快速、更準(zhǔn)確地提取字符子圖像區(qū)域;并且該方法不依賴任何第三方軟件,可應(yīng)用于任何需要的平臺(tái)。

為達(dá)到上述目的,本發(fā)明提供如下技術(shù)方案:

一種基于圖像的燃?xì)庵笖?shù)自動(dòng)識(shí)別方法,該方法包括以下步驟:

S1:用戶啟動(dòng)智能手機(jī)客戶端,通過智能手機(jī)攝像頭實(shí)時(shí)拍攝燃?xì)獗韴D像;

S2:智能手機(jī)客戶端對(duì)拍攝的燃?xì)獗韴D像進(jìn)行識(shí)別,檢測(cè)用氣指數(shù),檢測(cè)成功后自動(dòng)將其顯示出來,詢問用戶是否識(shí)別正確,如果得到用戶確認(rèn),則將燃?xì)獾闹笖?shù)數(shù)據(jù)和燃?xì)獗韴D像上傳至燃?xì)夤竞笈_(tái)服務(wù)器;

S3:燃?xì)夤镜臄?shù)據(jù)管理員通過服務(wù)器查看報(bào)表與修正異常數(shù)據(jù);如果用戶沒能按時(shí)上傳數(shù)據(jù),則向用戶發(fā)送提醒信息,通知用戶及時(shí)上傳。

進(jìn)一步,在步驟S1中,手機(jī)客戶端將自動(dòng)打開手機(jī)的后置攝像頭,其拍攝的燃?xì)獗韴D像數(shù)據(jù)將顯示在用戶的手機(jī)頁面中;為引導(dǎo)用戶將掃描區(qū)域?qū)?zhǔn)表盤,客戶端對(duì)拍攝的燃?xì)獗韴D像中的掃描區(qū)域做高亮處理,通過對(duì)字符的定位來幫助用戶調(diào)整攝像頭的距離與角度。

進(jìn)一步,在步驟S2中,燃?xì)庵笖?shù)數(shù)字的識(shí)別方法采用特征匹配法,在掃描過程前,客戶端加載燃?xì)庵笖?shù)特征庫;在自動(dòng)掃描期間,系統(tǒng)對(duì)視頻拍攝的每一幀都做掃描處理,通過圖像預(yù)處理改善圖像質(zhì)量;使用投影法定位表盤、分割不同字符,實(shí)現(xiàn)字符分割;最后使用骨骼化字符圖像的方法細(xì)化圖像,獲取其結(jié)構(gòu)特征,經(jīng)過特征匹配后得到最終的識(shí)別結(jié)果。

進(jìn)一步,在所述的特征匹配過程中,首先計(jì)算當(dāng)前字符特征與0~9所有模板特征的歐式距離,取距離最小的3個(gè)模板特征,若3個(gè)特征中有2個(gè)或以上的模板屬于同一個(gè)字符,同時(shí)歐式距離小于給定閾值時(shí),判斷當(dāng)前字符屬于對(duì)應(yīng)的模板字符,識(shí)別成功,否則,識(shí)別失??;僅當(dāng)表盤的前5個(gè)字符都識(shí)別成功,且連續(xù)兩幀圖像識(shí)別結(jié)果完全相同的情況下,客戶端才跳轉(zhuǎn)到燃?xì)庵笖?shù)上傳頁面。自動(dòng)掃描燃?xì)庵笖?shù)成功后,系統(tǒng)將自動(dòng)跳轉(zhuǎn)至燃?xì)庵笖?shù)上傳頁面,在當(dāng)前頁面,包括識(shí)別結(jié)果數(shù)字(燃?xì)獗肀肀P前5位數(shù)字)、識(shí)別成功時(shí)攝像頭拍攝的視頻截圖,其中,視頻截圖作為上傳數(shù)據(jù)的佐證,無法人工修改。

進(jìn)一步,所述圖像預(yù)處理具體包括以下步驟:

1)對(duì)圖像進(jìn)行灰度化;

2)對(duì)燃?xì)獗砘叶葓D像做水平方向的灰度值累加和投影,表盤區(qū)域行方向的定位通過水平投影的方式找到,即寬度最大的一對(duì)過均值索引所標(biāo)記的行信息;

3)對(duì)燃?xì)獗砘叶葓D像做垂直方向的灰度值累加和投影,完成從垂直方向?qū)Ρ肀P進(jìn)行提取,從而實(shí)現(xiàn)整個(gè)表盤的提取任務(wù)。

進(jìn)一步,所述字符分割是將表盤內(nèi)的字符分為單獨(dú)的字符圖像,以便特征的提取和識(shí)別過程,通過投影直方圖的方法實(shí)現(xiàn)對(duì)表盤圖像的字符分割:

首先,使用頂帽操作解決整幅圖像的像素值分布不均勻的問題;其次,將直方圖繪制的曲線描繪為一組包含波峰波谷的波形,那么波峰處對(duì)應(yīng)的圖形即為每個(gè)字符圖像,而波谷對(duì)應(yīng)的區(qū)域即作為不同字符子圖像的分割點(diǎn),對(duì)于直方圖向量P,其對(duì)應(yīng)的波峰波谷索引定義為:遍歷直方圖向量P,若在第i個(gè)索引處滿足P(i)≥P(i-1)且P(i)≥P(i+1),則i屬于波峰索引,加入結(jié)合Ppeak,若P(i)≤P(i-1)且P(i)≤P(i+1),則i屬于波谷索引,存入集合Pvalley;最后,提取前5個(gè)波峰索引對(duì)應(yīng)的子區(qū)域作為字符子圖像,提取的算法如下:1)按照索引的升序方向提取前5個(gè)波峰索引Ppeak(1)~Ppeak(5),并找到與之距離最近的5個(gè)波谷索引,計(jì)算與對(duì)應(yīng)波峰的距離D(1)~D(5);2)對(duì)每個(gè)波峰i,提取以波峰Ppeak(i)索引為中心,Ppeak(i)-D(i),Ppeak(i)+D(i)為起始與終止索引用于分割字符子圖像。

進(jìn)一步,所述特征匹配法包括特征提取與特征識(shí)別,特征提取是通過相應(yīng)的方法提取表征圖像特征的信息,特征識(shí)別是根據(jù)給定的圖像信息,決定其是否屬于某種圖像類別的過程;

所述特征提取包括:在字符分割的環(huán)節(jié),已經(jīng)能夠得到僅包含一個(gè)字符的子圖像,從0~9這10個(gè)字符的形狀結(jié)構(gòu)特征比較明顯,將其作為區(qū)分不同字符的特征;為了獲取圖像的結(jié)構(gòu)特征首先對(duì)圖像進(jìn)行細(xì)化,在細(xì)化前,為了突出字符內(nèi)容,對(duì)字符子圖像做二值化處理,突出圖像中的字符部分,并通過開運(yùn)算消除二值化過程中產(chǎn)生的噪點(diǎn);經(jīng)過二值化的子圖像消除了背景與其他影響特征提取的因素,僅包含字符部分,為了統(tǒng)一表征圖像的信息,在圖像細(xì)化之前對(duì)字符進(jìn)行歸一化,統(tǒng)一為32×32大小的子圖像,接下來對(duì)圖像做細(xì)化操作,即可獲取到圖像的結(jié)構(gòu)特征;

所述特征識(shí)別包括:首先通過采集多種燃?xì)獗?、多個(gè)數(shù)字的結(jié)構(gòu)特征建立了一個(gè)供字符圖像匹配的特征庫,利用待識(shí)別字符的特征向量與特征庫中特征向量之間的歐式距離作為匹配程度;采用3-近鄰法進(jìn)行字符識(shí)別的過程,在特征匹配開始后,利用歐式距離的度量方式,使用當(dāng)前字符的特征向量與樣本庫中的特征向量逐一計(jì)算相應(yīng)的匹配程度;通過排序獲取前3個(gè)距離最小即匹配程度最好的樣本字符,對(duì)這3個(gè)距離做閾值判斷,距離大于閾值說明當(dāng)前字符與樣本字符的差別較大,將結(jié)束識(shí)別過程,度量距離小于閾值時(shí),識(shí)別過程可繼續(xù)進(jìn)行;若其中有超過2個(gè)樣本字符屬于相同字符類別,判斷當(dāng)前字符所代表的數(shù)字與該樣本字符代表的類別相同,字符匹配成功,當(dāng)5個(gè)字符圖像都匹配成功時(shí)即為表盤指數(shù)識(shí)別成功,否則識(shí)別失敗。

本發(fā)明的有益效果在于:與現(xiàn)有技術(shù)相比,本方法在表盤定位與字符識(shí)別過程中對(duì)傳統(tǒng)的方案做了改進(jìn),提升了對(duì)燃?xì)獗韴D像噪聲的魯棒性,能夠更準(zhǔn)確的、不包含其他雜質(zhì)的字符子圖像;同時(shí),該方法使用圖像的結(jié)構(gòu)信息描述不同字符圖像的特征,分類器使用基于3-近鄰的方法構(gòu)造,由于提取的0~9之間10個(gè)字符特征信息可分性很好,所以無需復(fù)雜的識(shí)別過程即可實(shí)現(xiàn)準(zhǔn)確提取燃?xì)庵笖?shù)的目標(biāo),因而在效率方面要遠(yuǎn)優(yōu)于現(xiàn)有的燃?xì)庵笖?shù)識(shí)別方法,從圖像采集到特征識(shí)別成功整個(gè)過程不超過0.08s,因此能夠集成到具有實(shí)時(shí)要求的燃?xì)庵笖?shù)識(shí)別系統(tǒng)中;此外,本方法不依賴于任何第三方軟件,可以移植到任何有需要的平臺(tái)中,如PC平臺(tái)或智能手機(jī)客戶端等。

附圖說明

為了使本發(fā)明的目的、技術(shù)方案和有益效果更加清楚,本發(fā)明提供如下附圖進(jìn)行說明:

圖1為本發(fā)明的系統(tǒng)概要圖;

圖2為實(shí)施例中灰度化后的燃?xì)獗韴D像;

圖3為水平方向的灰度值累積直方圖;

圖4為標(biāo)記有過均值索引的直方圖;

圖5為水平提取燃?xì)獗韴D像的垂直方向灰度累加和投影;

圖6為對(duì)垂直投影直方圖做1階差分取絕對(duì)值的效果圖;

圖7為標(biāo)記有過均值索引的直方圖;

圖8為表盤圖像的垂直灰度投影直方圖;

圖9為描繪了波峰波谷索引的直方圖;

圖10為匹配算法流程圖。

具體實(shí)施方式

下面將結(jié)合附圖,對(duì)本發(fā)明的優(yōu)選實(shí)施例進(jìn)行詳細(xì)的描述。

圖1為本發(fā)明的系統(tǒng)概要圖,本發(fā)明提供的基于圖像的燃?xì)庵笖?shù)自動(dòng)識(shí)別方法包括以下步驟:S1:用戶啟動(dòng)智能手機(jī)客戶端,通過智能手機(jī)攝像頭實(shí)時(shí)拍攝燃?xì)獗韴D像;S2:智能手機(jī)客戶端對(duì)拍攝的燃?xì)獗韴D像進(jìn)行識(shí)別,檢測(cè)用氣指數(shù),檢測(cè)成功后自動(dòng)將其顯示出來,詢問用戶是否識(shí)別正確,如果得到用戶確認(rèn),則將燃?xì)獾闹笖?shù)數(shù)據(jù)和燃?xì)獗韴D像上傳至燃?xì)夤竞笈_(tái)服務(wù)器;S3:燃?xì)夤镜臄?shù)據(jù)管理員通過服務(wù)器查看報(bào)表與修正異常數(shù)據(jù);如果用戶沒能按時(shí)上傳數(shù)據(jù),則向用戶發(fā)送提醒信息,通知用戶及時(shí)上傳。

本發(fā)明所提供的方法的目標(biāo)是從燃?xì)獗韴D像中提取表盤的前5位數(shù)字(不記小數(shù)位)作為用戶使用的用氣指數(shù)數(shù)據(jù),供燃?xì)夤窘y(tǒng)計(jì)。該方法主要分為圖像預(yù)處理、字符分割、特征提取與識(shí)別3個(gè)階段。

燃?xì)獗韴D像預(yù)處理:

預(yù)處理步驟的主要任務(wù)是對(duì)表盤區(qū)域?qū)崿F(xiàn)定位,即從原表盤圖像中找到表盤位置,以便進(jìn)行下一步字符分割的過程。為了減少數(shù)據(jù)量,提升算法效率,首先需要對(duì)圖像進(jìn)行灰度化,由于從圖像的整體和局部色彩以及亮度等級(jí)的分布特征來看,灰度圖像的描述與彩色圖像的描述是一致的,所以灰度化處理并不影響接下來的處理過程。圖2為實(shí)施例中灰度化后的燃?xì)獗韴D像。

與燃?xì)獗淼钠渌麉^(qū)域相比,表盤區(qū)域整體的灰度值偏低,若對(duì)燃?xì)獗砘叶葓D像做水平方向的灰度值累加和投影,那么表盤區(qū)域所對(duì)應(yīng)灰度值的行累加和將會(huì)遠(yuǎn)低于其他區(qū)域?qū)?yīng)行的灰度值累加和。對(duì)于給定的灰度圖像I,第r行水平方向的灰度值累加和Phorizontal(r)可以定義為以下形式:

<mrow> <msub> <mi>P</mi> <mrow> <mi>h</mi> <mi>o</mi> <mi>r</mi> <mi>i</mi> <mi>z</mi> <mi>o</mi> <mi>n</mi> <mi>t</mi> <mi>a</mi> <mi>l</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>r</mi> <mo>)</mo> </mrow> <mo>=</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>c</mi> <mo>=</mo> <mn>1</mn> </mrow> <mrow> <mi>c</mi> <mi>o</mi> <mi>l</mi> <mi>s</mi> </mrow> </munderover> <mi>I</mi> <mrow> <mo>(</mo> <mi>r</mi> <mo>,</mo> <mi>c</mi> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow>

其中,I(r,c)表示圖像第r行第c列的灰度值,cols為圖像的總列數(shù)。經(jīng)過累加和的計(jì)算,得到與圖像行數(shù)相同數(shù)量的灰度投影向量:

Phorizontal=[Phorizontal(1),Phorizontal(2),...,Phorizontal(rows)] (2)

rows表示圖像的總行數(shù),對(duì)經(jīng)過灰度處理后的圖像做水平方向的投影得到直方圖,如圖3所示。

從直方圖(圖3)中可以看到3個(gè)比較明顯的“溝壑”區(qū)域,即直方圖下降幅度較大,并在低谷處維持平穩(wěn)后上升的區(qū)域,直觀看起來就像是“溝壑”的形狀。通過觀察這三個(gè)“溝壑”出現(xiàn)的行索引的信息,發(fā)現(xiàn)從左向右分別是圖1和2的條形碼區(qū)域、表盤區(qū)域、文字區(qū)域。由于表盤區(qū)域低像素區(qū)域過多、密度較大,其對(duì)應(yīng)的“溝壑”寬度、深度都為最大。若以直方圖的均值作為閾值,列出其過均值的索引,即可通過累計(jì)直方圖的信息定位表盤區(qū)域的位置。

對(duì)給定的一個(gè)直方圖向量P,其過均值索引由以下流程計(jì)算得到:

1)計(jì)算直方圖向量的均值Pmeans,并初始化兩個(gè)集合:上升方向索引集合S1與下降方向索引集合S2;

2)對(duì)直方圖的索引從小到大進(jìn)行掃描,若在第i個(gè)索引處,有P(i-1)<Pmeans并且P(i+1)>Pmeans,則視i為上升方向索引,將i加入集合S1;若P(i-1)>Pmeans且P(i+1)<Pmeans,視i為下降方向索引,加入集合S2;

對(duì)圖3做過均值點(diǎn)檢測(cè)的結(jié)果如圖4所示,其中,綠色圓圈標(biāo)明是向下方向的過均值索引,紅色反之,綠色圓圈與紅色圓圈構(gòu)成了一對(duì)溝壑的左右邊界,而其中長(zhǎng)度最長(zhǎng)的一對(duì)邊界點(diǎn)放在原圖像中就是表盤的上下邊界。由此,可以得出一個(gè)結(jié)論:在含有表盤區(qū)域的燃?xì)獗韴D像中,表盤區(qū)域行方向的定位可通過水平投影的方式找到,即寬度最大的一對(duì)過均值索引所標(biāo)記的行信息。

找到最大“溝壑”的算法定義如下:

1)遍歷下降索引集合S2,若進(jìn)行到第i個(gè)索引,從上升索引集合S1中選取一個(gè)上升索引j與其匹配,選擇條件為:S1(i)<S2(j)且S1(i)與S2(j)之間的距離最短;

2)對(duì)于第i個(gè)索引,得到合適的j后,計(jì)算D(i)=S2(j)-S1(i)作為“溝壑”的寬度,并記錄與寬度對(duì)應(yīng)的“溝壑”起始索引:S1(i)與S2(j);

3)遍歷下降索引集合結(jié)束后,選擇寬度最大的一對(duì)索引S1(i)與S2(j)分別作為“溝壑”的起始與終止位置,算法結(jié)束。

經(jīng)過水平方向的表盤提取后,由于在圖像采集過程中無法精確的保持水平拍攝,會(huì)產(chǎn)生一定程度的傾斜,而傾斜的圖像將會(huì)對(duì)后續(xù)的預(yù)處理過程造成錯(cuò)誤影響。為了矯正傾斜,在表盤的上下兩側(cè)有兩條與表盤區(qū)域平行的線框,若表盤的數(shù)字發(fā)生傾斜,則線框也會(huì)發(fā)生同樣角度的傾斜,所以可以利用線框的角度測(cè)量來確定表盤的傾斜情況,為了突出線框位置,將水平提取的表盤圖像做了擴(kuò)展。得到包含表盤水平線框的圖像后,使用直線檢測(cè)的方式對(duì)線框進(jìn)行提取,直線檢測(cè)方法使用Hough變換。通過Hough變換可以檢測(cè)出多條直線,但水平線框的直線長(zhǎng)度是其中最長(zhǎng)的,根據(jù)這樣的特點(diǎn),提取圖中最長(zhǎng)的一條直線。通過對(duì)線框直線的提取,發(fā)現(xiàn)線框的傾斜角度與表盤區(qū)域的傾斜角度是一致的,所以首先計(jì)算直線的傾斜角度,并根據(jù)角度做反向旋轉(zhuǎn),即可完成表盤的傾斜校正任務(wù)。

經(jīng)過水平提取燃?xì)獗肀肀P區(qū)域后,下一步需要從垂直方向來對(duì)表盤進(jìn)行提取,從而實(shí)現(xiàn)整個(gè)表盤的提取任務(wù)。為了引出接下來的結(jié)論,首先來看垂直方向的灰度像素累加和的直方圖,如圖5所示。與上述水平方向的直方圖相同,對(duì)于圖像I第c列垂直方向的灰度值的累加和,做如下定義:

<mrow> <msub> <mi>P</mi> <mrow> <mi>v</mi> <mi>e</mi> <mi>r</mi> <mi>t</mi> <mi>i</mi> <mi>c</mi> <mi>a</mi> <mi>l</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>c</mi> <mo>)</mo> </mrow> <mo>=</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>r</mi> <mo>=</mo> <mn>1</mn> </mrow> <mrow> <mi>r</mi> <mi>o</mi> <mi>w</mi> <mi>s</mi> </mrow> </munderover> <mi>I</mi> <mrow> <mo>(</mo> <mi>r</mi> <mo>,</mo> <mi>c</mi> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>3</mn> <mo>)</mo> </mrow> </mrow>

Pvertical=[Pvertical(1),Pvertical(2),...,Pvertical(cols)] (4)

其中,Pvertical(c)代表第c列垂直方向灰度值的累加和,從而構(gòu)成灰度投影向量Pvertical,rows與cols分別表示圖像的總行數(shù)與總列數(shù)。

通過垂直投影直方圖與原圖像的對(duì)照觀察,發(fā)現(xiàn)在表盤左右兩側(cè)的邊界處,其對(duì)應(yīng)的直方圖區(qū)域投影值存在巨大跳變,即列對(duì)應(yīng)索引100~200區(qū)間、800~900區(qū)間內(nèi)的直方圖曲線。但在直方圖的后半段索引區(qū)域,由于表盤小數(shù)位灰度值低的區(qū)域較少,導(dǎo)致其對(duì)應(yīng)的直方圖區(qū)域較整數(shù)位偏高,無法使用水平提取時(shí)通過“溝壑”判斷完整的表盤區(qū)域。為了消除直方圖局部不均勻,同時(shí)又保留跳變信息,對(duì)直方圖做了1階差分取絕對(duì)值的處理,設(shè)向量dPvertical=|diff(Pvertical)|為Pvertical的差分絕對(duì)值,其對(duì)應(yīng)的直方圖如圖6所示。

通過1階差分取絕對(duì)值的處理,發(fā)現(xiàn)左右邊界的跳變更加明顯,同時(shí)淡化了局部升高對(duì)區(qū)域判斷的影響,此時(shí)再使用“溝壑”判斷的方法來提取表盤將會(huì)得到較好的效果。圖7為標(biāo)記有過均值索引的直方圖。

經(jīng)過水平、垂直兩個(gè)方向提取的表盤圖像除表盤之外再無其他的區(qū)域信息,此時(shí)圖像的預(yù)處理結(jié)束,可以進(jìn)行字符分割處理了。

字符分割:

字符分割的目的是將表盤內(nèi)的字符分為單獨(dú)的字符圖像,以便特征的提取和識(shí)別過程。該階段仍然通過投影直方圖的方法實(shí)現(xiàn)對(duì)表盤圖像的字符分割,但由于燃?xì)獗硇?shù)位背景區(qū)域的灰度值偏高,導(dǎo)致整幅圖像的像素值分布不均勻,所以在進(jìn)行投影之前,需要消除分布不均勻的問題,本發(fā)明中使用頂帽操作解決不均勻的問題。

經(jīng)過頂帽變換的表盤圖像中,影響像素值分布不均勻的背景已經(jīng)消失,此時(shí)對(duì)圖像做垂直方向的灰度投影可得到直方圖如圖8所示。

若將直方圖繪制的曲線描繪為一組包含波峰波谷的波形,那么波峰處對(duì)應(yīng)的圖形即為每個(gè)字符圖像,而波谷對(duì)應(yīng)的區(qū)域即可作為不同字符子圖像的分割點(diǎn),對(duì)于直方圖向量P,其對(duì)應(yīng)的波峰波谷索引定義為:遍歷直方圖向量P,若在第i個(gè)索引處滿足P(i)≥P(i-1)且P(i)≥P(i+1),則i屬于波峰索引,加入結(jié)合Ppeak,若P(i)≤P(i-1)且P(i)≤P(i+1),則i屬于波谷索引,存入集合Pvalley。根據(jù)如上定義,描繪出了圖8對(duì)應(yīng)直方圖的波峰點(diǎn)與波谷索引,如圖9所示。

如圖所示,紅色圓圈標(biāo)記為波峰,綠色圓圈標(biāo)記為波谷,由于最終的識(shí)別目標(biāo)是表盤的整數(shù)位即前五位數(shù)字,所以算法只提取前5個(gè)波峰索引對(duì)應(yīng)的子區(qū)域作為字符子圖像。提取的算法如下:

1)按照索引的升序方向提取前5個(gè)波峰索引Ppeak(1)~Ppeak(5),并找到與之距離最近的5個(gè)波谷索引,計(jì)算與對(duì)應(yīng)波峰的距離D(1)~D(5);

2)對(duì)每個(gè)波峰i,提取以波峰Ppeak(i)索引為中心,Ppeak(i)-D(i),Ppeak(i)+D(i)為起始與終止索引用于分割字符子圖像。

從分割效果來看,該方法能夠?qū)⒈肀P圖像通過直方圖投影的方法切分為多個(gè)子圖像,且分割后每個(gè)字符子圖像僅包含一個(gè)字符。

字符特征提取與識(shí)別:

本階段包含兩部分內(nèi)容:特征提取與特征識(shí)別,其中特征提取主要指的是通過相應(yīng)的方法提取表征圖像特征的信息,特征識(shí)別指的是根據(jù)給定的圖像信息,決定其是否屬于某種圖像類別的過程。

對(duì)于特征提取,在字符分割的環(huán)節(jié),已經(jīng)能夠得到僅包含一個(gè)字符的子圖像,通過對(duì)字符圖像的觀察,發(fā)現(xiàn)從0~9這10個(gè)字符的形狀結(jié)構(gòu)特征比較明顯,可以作為區(qū)分不同字符的特征。為了獲取到圖像的結(jié)構(gòu)特征需要對(duì)圖像進(jìn)行細(xì)化,在細(xì)化前,為了突出字符內(nèi)容,對(duì)字符子圖像做二值化處理,突出圖像中的字符部分,并通過開運(yùn)算消除二值化過程中產(chǎn)生的噪點(diǎn)。經(jīng)過二值化的子圖像消除了背景與其他影響特征提取的因素,僅包含字符部分。為了統(tǒng)一表征圖像的信息,在圖像細(xì)化之前需要對(duì)字符進(jìn)行歸一化,統(tǒng)一為32×32大小的子圖像;接下來對(duì)圖像做細(xì)化操作,即可獲取到圖像的結(jié)構(gòu)特征。

但在細(xì)化過程中,由于字符圖像的結(jié)構(gòu)邊緣會(huì)產(chǎn)生類似毛刺的效果,若此時(shí)統(tǒng)計(jì)字符特征將計(jì)入很多不屬于字符本身的結(jié)構(gòu),需要消除這些毛刺信息。消除毛刺后,得到了結(jié)構(gòu)清晰、不包含其他雜質(zhì)的字符圖像,可進(jìn)行下一步的特征提取過程。

字符圖像經(jīng)過數(shù)字化后,通常被描述為黑白像素的矩陣。若直接使用矩陣數(shù)據(jù)作為字符圖像的描述參數(shù),那么當(dāng)矩陣規(guī)模很大的情況下,將會(huì)增加特征的存儲(chǔ)空間,同時(shí)也會(huì)降低算法的效率。為此需要進(jìn)行合適的特征抽取過程,用于描述最能反應(yīng)目標(biāo)本質(zhì)的因素,同時(shí)減少存儲(chǔ)量和計(jì)算量。

在本發(fā)明中,通過ET1特征和DT12特征描述文字結(jié)構(gòu),ET1特征和DT12特征能夠較好的用于文字的特征表述與識(shí)別過程。

ET1和DT12的描述如下:

ET1特征:從邊緣起始的像素點(diǎn)位置向終止方向進(jìn)行掃描,在遇到第一個(gè)白色像素點(diǎn)后停止,統(tǒng)計(jì)其中經(jīng)過的黑色像素點(diǎn)的數(shù)量即為ET1特征;

DT12特征:從邊緣起始的像素點(diǎn)位置向終止方向進(jìn)行掃描,遇到第一個(gè)白色像素點(diǎn)后繼續(xù)掃描,直到再次掃描到白色像素點(diǎn)為止,統(tǒng)計(jì)兩個(gè)白色像素點(diǎn)中間經(jīng)過的黑色像素點(diǎn)的數(shù)量即為DT12特征。

在實(shí)際的掃描過程中,由于特征圖像是經(jīng)過骨骼化處理的單像素寬度的結(jié)構(gòu)圖像,所以適用于ET1與DT12特征的采集。為了減少掃描過程出現(xiàn)的誤差,使用多個(gè)相鄰掃描結(jié)果的均值作為1個(gè)掃描特征值。

在本實(shí)施例中,由于字符子圖像是32×32的二值化的骨骼圖像,所以對(duì)一幅圖像的4個(gè)邊界,每個(gè)邊界均分為8等分,每部分提取4個(gè)特征的均值作為這部分的特征,最后使用圖像的尺寸對(duì)特征進(jìn)行歸一化處理,使特征值位于0~1之間。則ET1特征可提取32個(gè),DT12也可以提取32個(gè)。共64個(gè)特征。其中,特征的組合方式為:

F=[ET1Left,DT12Left,ET1Right,DT12Right,ET1Top,DT12Top,ET1Bottom,DT12Bottom]

其中,ET1Left,DT12Left表示從左邊界開始掃描的ET1特征與DT12特征,ET1Right,DT12Right表示從右邊界開始掃描的ET1特征與DT12特征,ET1Top,DT12Top表示從頂部邊界開始掃描的ET1特征與DT12特征,ET1Bottom,DT12Bottom表示從底部邊界開始掃描的ET1特征與DT12特征。

通過特征直方圖的方式來觀察不同數(shù)字字符的特征向量以及他們的區(qū)別,結(jié)果表明,相同字符之間的特征向量相似度很大,不同字符特征向量之間的差別較大容易分辨。

在特征識(shí)別的環(huán)節(jié),首先通過采集多種燃?xì)獗怼⒍鄠€(gè)數(shù)字的結(jié)構(gòu)特征建立了一個(gè)供字符圖像匹配的特征庫,利用待識(shí)別字符的特征向量與特征庫中特征向量之間的歐式距離作為匹配程度。距離的特征識(shí)別流程如圖10所示。

算法采用3-近鄰法進(jìn)行字符識(shí)別的過程,在特征匹配開始后,利用歐式距離的度量方式,使用當(dāng)前字符的特征向量與樣本庫中的特征向量逐一計(jì)算相應(yīng)的匹配程度。通過排序獲取前3個(gè)距離最小即匹配程度最好的樣本字符,對(duì)這3個(gè)距離做閾值判斷,距離大于閾值說明當(dāng)前字符與樣本字符的差別較大,將結(jié)束識(shí)別過程,度量距離小于閾值時(shí),識(shí)別過程可繼續(xù)進(jìn)行。若其中有超過2個(gè)樣本字符屬于相同字符類別,判斷當(dāng)前字符所代表的數(shù)字與該樣本字符代表的類別相同,字符匹配成功,當(dāng)5個(gè)字符圖像都匹配成功時(shí)即為表盤指數(shù)識(shí)別成功,否則識(shí)別失敗。

最后說明的是,以上優(yōu)選實(shí)施例僅用以說明本發(fā)明的技術(shù)方案而非限制,盡管通過上述優(yōu)選實(shí)施例已經(jīng)對(duì)本發(fā)明進(jìn)行了詳細(xì)的描述,但本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,可以在形式上和細(xì)節(jié)上對(duì)其作出各種各樣的改變,而不偏離本發(fā)明權(quán)利要求書所限定的范圍。

當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1