專利名稱:電力電能表圖像自動(dòng)識(shí)別方法
技術(shù)領(lǐng)域:
本發(fā)明涉及電力電能表自動(dòng)識(shí)別技術(shù)領(lǐng)域,特別是涉及電力電能表圖像自動(dòng)識(shí)別方法。
背景技術(shù):
電力電能表從新購(gòu)入,檢定合格、使用現(xiàn)場(chǎng)撤回、檢測(cè)記錄和入庫(kù)是電力營(yíng)銷系統(tǒng)電能表生命周期管理的核心步驟,工作內(nèi)容包括驗(yàn)證電能表身份(條碼識(shí)別)、自動(dòng)識(shí)別電能的最終示值。電能表檢測(cè)記錄的準(zhǔn)確性和正確性,決定能否檢測(cè)出電能表在工作期間內(nèi)是否被正確地使用以及電能表計(jì)數(shù)是否被正確地記錄,能夠?yàn)殡娏ζ髽I(yè)挽回大量的電力損失。所以改進(jìn)和提高自動(dòng)識(shí)別電能表?xiàng)l碼和示值的方法,是電力營(yíng)銷系統(tǒng)急需解決的重中之重的問題。目前,電力撤回電能表的檢測(cè)記錄是采用人工肉眼識(shí)別、手工錄入的方式進(jìn)行,這樣做存在的問題和漏洞是1、肉眼識(shí)別和手工錄入兩個(gè)操作環(huán)節(jié)會(huì)因?yàn)楦鞣N客觀因數(shù)和人為因數(shù)產(chǎn)生失誤或差錯(cuò),使最終錄入的表數(shù)與電能表中計(jì)數(shù)不一致,造成結(jié)余電量不準(zhǔn)確;2、電能表入庫(kù)過程中,肉眼識(shí)別只能即時(shí)檢查電能表外觀和識(shí)別電能表示數(shù),不能保存電能表具外觀和電能表示數(shù)照片,造成電能表外觀完整狀況以及電能表示數(shù)的準(zhǔn)確性無(wú)法進(jìn)行審計(jì)核實(shí);3、由于采用人工方式,所以,一些電力公司對(duì)電能表不做任何檢測(cè)和記錄,直接入庫(kù)保存,直至銷毀。上述撤回電能表入庫(kù)流程暴露出的問題無(wú)法通過原有方式解決,無(wú)法滿足電力營(yíng)銷現(xiàn)代化的發(fā)展需求。因此電能表的自動(dòng)識(shí)別技術(shù)已經(jīng)成為自動(dòng)抄表技術(shù)的研究熱點(diǎn)之一,作為自動(dòng)識(shí)別技術(shù)之一的圖像識(shí)別技術(shù)也被廣泛的應(yīng)用到電能表的自動(dòng)識(shí)別中。基于圖像的數(shù)字識(shí)別技術(shù)目前已經(jīng)比較成熟。但對(duì)于電能表圖像的自動(dòng)識(shí)別系統(tǒng)來說,在研究過程中存在以下關(guān)鍵問題1、在獲取的電能表圖像中,由于光照原因和反射會(huì)造成亮度分布不均。此時(shí),定位率和識(shí)別率會(huì)顯著下降,這對(duì)于整個(gè)圖像處理與模式識(shí)別過程來說,都是一個(gè)難題。2、示值的精確定位方面,由于電能表種類繁多,各類表的示值區(qū)域特征不同,采用傳統(tǒng)的積分投影法很難準(zhǔn)確定位出字符,因此提高示值的定位準(zhǔn)確率也是一個(gè)需要解決的關(guān)鍵問題。3、示值識(shí)別方面,由于電能表種類繁多,示值的字符類型不一致,而且機(jī)械式電能表的示值會(huì)出現(xiàn)半字符的現(xiàn)象。一般的模板匹配法、統(tǒng)計(jì)特征法和結(jié)構(gòu)特征法都很難取得理想的識(shí)別效果,所以這對(duì)圖像的識(shí)別提出了更為苛刻的要求。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問題,是提供一種工作效率高,抄表收費(fèi)成本低,能實(shí)現(xiàn)一定范圍內(nèi)表計(jì)圖像數(shù)據(jù)的自動(dòng)采集,并將相關(guān)數(shù)據(jù)實(shí)時(shí)傳送到管理控制中心,在該管理控制中心服務(wù)器上進(jìn)行集中處理并自動(dòng)識(shí)別的流量計(jì)費(fèi)表數(shù)字遠(yuǎn)傳圖像自動(dòng)識(shí)別方法。電力電能表圖像自動(dòng)識(shí)別方法,包括以下步驟步驟一圖像預(yù)處理,圖像預(yù)處理首先采用基于分段線性灰度拉伸方法對(duì)圖像進(jìn)行對(duì)比化增強(qiáng)處理;然后由于條碼和示值區(qū)域的垂直紋理相對(duì)水平紋理較豐富,本發(fā)明采用 Sobel算子檢測(cè)表盤圖像的垂直紋理,并且采用投影法初步去除背景區(qū)域;再采用膨脹算法提取垂直紋理豐富的區(qū)域;最后采用基于積分投影法的自適應(yīng)閾值分割方法對(duì)圖像進(jìn)行二值化處理。步驟二示值與條碼的精確定位1、示值的精確定位,由于電能表種類繁多,各類表的示值區(qū)域特征不同,采用傳統(tǒng)的積分投影法很難準(zhǔn)確定位出字符,因此本發(fā)明的示值的精確定位方法在基于Sobel算子的垂直邊緣檢測(cè)及形態(tài)學(xué)處理等預(yù)處理的基礎(chǔ)上,結(jié)合了復(fù)雜圖像背景下基于示值間距和數(shù)字字符的長(zhǎng)寬比特征的智能判斷方法,適應(yīng)不同類型電能表的示值精確定位。同時(shí),突破傳統(tǒng)單個(gè)完整字符定位方法,當(dāng)示值處于半字符狀態(tài)時(shí)能夠判斷該位置是否為上下兩個(gè)不完整字符情況,并且根據(jù)上下半字符的比例關(guān)系選取特征信息較多的字符讀數(shù)作為該位置的讀數(shù)。2、條碼的精確定位根據(jù)條碼區(qū)域垂直紋理較多的特征在傳統(tǒng)的投影定位方法基礎(chǔ)上融合了條碼區(qū)域的邊緣特征,對(duì)可能是條碼的區(qū)域進(jìn)行水平掃描,提取滿足條碼特征的區(qū)域,并且根據(jù)電能表?xiàng)l碼的編碼方法判斷出條碼類型。步驟三條碼識(shí)別,條碼識(shí)別首先采用逐行掃描的方法計(jì)算出一個(gè)條碼字符連續(xù)條空的寬度,然后采用歸一化理論,針對(duì)不同類型的條碼用相似邊距離歸一化的方法對(duì)字符條碼進(jìn)行識(shí)別。步驟四示值識(shí)別,由于電能表種類繁多,示值的字符類型不一致,而且機(jī)械式電能表的示值會(huì)出現(xiàn)半字符的現(xiàn)象。一般的模板匹配法、統(tǒng)計(jì)特征法和結(jié)構(gòu)特征法都很難取得理想的識(shí)別效果。因此示值識(shí)別采用基于PCA的數(shù)字識(shí)別方法,使用PCA方法可以很容易的提取出示值的內(nèi)在結(jié)構(gòu)的主元,即可大致描述示值的結(jié)構(gòu)信息。如果有新的圖像需要與原有圖像比較,就可以在變換后的主元維度上進(jìn)行比較,則可根據(jù)新圖與原有數(shù)據(jù)集的相似度識(shí)別示值的讀數(shù)。本發(fā)明采用機(jī)器視覺技術(shù)取代人眼視覺讀取表計(jì)計(jì)量數(shù)據(jù),是現(xiàn)有表計(jì)計(jì)量數(shù)據(jù)遠(yuǎn)傳方法無(wú)法比擬的,也是本發(fā)明的主要特色,主要表現(xiàn)在以下幾個(gè)方面(1)、本發(fā)明的示值精確定位方法充分利用了各類電表的示值字符的通用先驗(yàn)特征,能夠提取不同類型電能表的示值區(qū)域。(2)、在示值識(shí)別方面,本發(fā)明采用基于PCA的字符識(shí)別方法能夠準(zhǔn)確識(shí)別各種字符類型的示值讀數(shù),包括半字符識(shí)別。
具體實(shí)施例方式電力電能表圖像自動(dòng)識(shí)別方法,包括以下步驟步驟一圖像預(yù)處理,包括圖像對(duì)比度增強(qiáng)、圖像垂直紋理提取、示值和條碼區(qū)域初步篩選以及基于積分投影法的自適應(yīng)二值化處理。
其中,圖像對(duì)比度增強(qiáng)主要采用分段線性灰度對(duì)比度拉伸法,改善自然光拍攝條件下圖像對(duì)比度角度的現(xiàn)象。圖像垂直紋理提取采用Sobel垂直邊緣檢測(cè)算子提取表盤圖像的垂直紋理。示值和條碼區(qū)域初步篩選采用形態(tài)學(xué)處理中的膨脹算法連接垂直紋理相對(duì)豐富的區(qū)域,從而排除大部分背景區(qū)域?;诜e分投影法的自適應(yīng)二值化處理方法對(duì)篩選后的區(qū)域進(jìn)行積分投影,再提取各個(gè)邊緣部分的灰度均值,在進(jìn)行篩選提取可能是示值邊緣的灰度均值,并以此灰度均值為閾值進(jìn)行二值化處理。步驟二示值與條碼的精確定位,包括基于示值間距和數(shù)字字符的長(zhǎng)寬比特征的智能示值定位和基于邊緣掃描的條碼定位。1、示值的精確定位的具體步驟如下(1)、采用水平垂直掃描法結(jié)合數(shù)字字符的寬度與長(zhǎng)度的比一般在0. 15 1. 25之間的特征去除所有目標(biāo)區(qū)域中寬度大于區(qū)域高度3/4或小于2個(gè)像素寬或?qū)挾扰c長(zhǎng)度的比一般小于0. 15或大于1. 25的偽目標(biāo);(2)、采用像素統(tǒng)計(jì)法去除小面積的噪聲點(diǎn)和面積很大的干擾背景;(3)、根據(jù)示值間等間距的特征進(jìn)一步精確提取示值區(qū)域,具體如下①求出區(qū)域中相鄰、相隔目標(biāo)的間距D1、D2,合并D1、D2并對(duì)其排序得到D,由于電能表示值一般為5位或6位,取D中連續(xù)4個(gè)以上間距之差小于5的間距,并求其均值得到 Dmean0②在Dl、D2 中分別取滿足 Dl [i]-Dmean <8 或 D2[i]-Dmean < 5 的坐標(biāo) i, 并且映射到目標(biāo)區(qū)域坐標(biāo),即記錄坐標(biāo)i和i+Ι為有效目標(biāo)坐標(biāo)。③統(tǒng)計(jì)有效目標(biāo)的高度均值Hmean,如果Hmean < 10,此區(qū)域?yàn)榉鞘局祬^(qū)域,返回下一個(gè)區(qū)域。④統(tǒng)計(jì)有效目標(biāo)個(gè)數(shù),如果大于7個(gè)目標(biāo)需要采用基于中心坐標(biāo)特征進(jìn)一步排除干擾目標(biāo)。首先求出有效目標(biāo)的中心坐標(biāo)的橫坐標(biāo)均值(去掉最大值和最小值)Cxmeanjn 果有效目標(biāo)的中心坐標(biāo)的橫坐標(biāo)Cx-Cxmean > 15,認(rèn)為該目標(biāo)位偽目標(biāo)。⑤判斷示值狀態(tài)。分別求出示值高度的最大值Hmax和最小值Hmin,如果 Hmax-Hmin > 8,認(rèn)為該示值中存在半字符,且認(rèn)為Hmax與示值高度H的差大于8的示值為半字符,然后分別去該示值字符的上下邊界(R_top、R.bottom)與高度最大示值字符的上下邊界(Hmax_top、Hmax_bottom)做差,如果Hmax_top-R_top > 8該示值字符為上半字符, 如果R_bottom-Hmax_bottom > 8該示值字符為下半字符。2、條碼的精確定位根據(jù)條碼區(qū)域垂直紋理較多的特征在傳統(tǒng)的投影定位方法基礎(chǔ)上融合了條碼區(qū)域的邊緣特征,對(duì)可能是條碼的區(qū)域進(jìn)行逐行掃描,統(tǒng)計(jì)區(qū)域內(nèi)邊界個(gè)數(shù)k和邊界點(diǎn)的橫坐標(biāo)構(gòu)成矩陣A,當(dāng)k滿足44 < k < 60認(rèn)為該條碼為8碼條碼,否則當(dāng) k彡60認(rèn)為該條碼為13碼條碼,如果k < 44重新掃描下一行。步驟三條碼識(shí)別,包括基于歸一化理論的條碼識(shí)別。(1)、根據(jù)條碼行的坐標(biāo)矩陣A求條碼連續(xù)條空寬度,得到矩陣C。O)、采用歸一化理論,用一種相似距離歸一化的方法對(duì)條碼進(jìn)行判別。步驟四示值識(shí)別,包括基于PCA的示值識(shí)別。
PCA是Principal component analysis的縮寫,中文翻譯為主元分析。它是一種對(duì)數(shù)據(jù)進(jìn)行分析的技術(shù),最重要的應(yīng)用是對(duì)原有數(shù)據(jù)進(jìn)行簡(jiǎn)化。正如它的名字主元分析, 這種方法可以有效的找出數(shù)據(jù)中最“主要”的元素和結(jié)構(gòu),去除噪音和冗余,將原有的復(fù)雜數(shù)據(jù)降維,揭示隱藏在復(fù)雜數(shù)據(jù)背后的簡(jiǎn)單結(jié)構(gòu)。它的優(yōu)點(diǎn)是簡(jiǎn)單,而且無(wú)參數(shù)限制,可以方便的應(yīng)用與各個(gè)場(chǎng)合,因此應(yīng)用極其廣泛。本發(fā)明中的示值識(shí)別部分采用基于PCA的數(shù)字識(shí)別方法?;赑CA的數(shù)字識(shí)別方法包括字符圖像訓(xùn)練和識(shí)別兩部分。字符圖像訓(xùn)練首先搜集了 10類數(shù)字字符圖庫(kù),每類包含70幅各種類型的數(shù)字字符二值圖像,圖像尺寸歸一化為20X36 ;另外分別從上向下和從下向上截取整字符高度 2/3到8/9部分的字符區(qū)域組成上下半字符圖庫(kù),半字符圖像歸一化尺寸為20XM。然后采用PCA算法訓(xùn)練特征數(shù)據(jù),以整字符訓(xùn)練為例,設(shè)待測(cè)試圖像為X,M = 36,N = 20,m = 10X70 = 700,η = MXN = 720,訓(xùn)練過程具體步驟如下1、計(jì)算平均圖像 Mu = Sum(Xi)Ai ;i = 1,. . .,m ;2, Xi- = Mu ;3、計(jì)算協(xié)方差矩陣 SIGMA = Sum(XiXT(Xi))Ai ;i = 1,· ··,m。SIGMA 是一個(gè) nXn 實(shí)對(duì)稱矩陣,T(Xi)表示矩陣\轉(zhuǎn)置;4、計(jì)算 Sigma 的特征值 lambda_k 和特征向量 Wk,k = 1,· · ·,n,lambda_l > = lambda_2 > = . . . > = lambda_n ;5、構(gòu)造 nXm'大小的子空間變換矩陣 W = [W1, . . .,Wm ’];m' <=m,m' << η, m'的大小根據(jù)需要選擇,使之滿足[sum(lambda_k, k = 1, . . . m' )/sum(lambda_k, k = 1, . . . , η)] > 0. 906、計(jì)算圖像&的投影坐標(biāo)=Ai = T(W)X (Xi-Mu) ;T(W)表示矩陣W轉(zhuǎn)置,Ai是 m' Xl的列向量,投影坐標(biāo)就是圖像特征。7、保存矩陣A、T作為特征數(shù)據(jù)。示值識(shí)別部分具體步驟如下1、將定位得到的二值字符圖像做待識(shí)別字符歸一化處理,即整字符歸一化為 20X36的圖像,半字符歸一化為20X24的圖像;2、根據(jù)字符狀態(tài)調(diào)入訓(xùn)練好的特征數(shù)據(jù)A、T ;3、對(duì)于NXM大小的待識(shí)別圖像Y,計(jì)算Y的投影坐標(biāo)坐標(biāo)B = T(W) XY ;T(W)表示矩陣W轉(zhuǎn)置;4、計(jì)算待識(shí)別圖像Y與庫(kù)中圖像Xi間距離d (Xi,Y) = sqrt (sum ((B [k] -Ai [k]) X (B [k] -Ai [k])))其中,k=1,...,m'。理論上,如果 Cl(XpY) =min{d (Xi, Y)},則 Y 與 Xj 為基本同類的字符。但是在實(shí)際應(yīng)用中直接取最小距離對(duì)應(yīng)的類最為Y的讀數(shù)往往識(shí)別率不高, 因此本發(fā)明對(duì)識(shí)別部分算法進(jìn)行了改進(jìn)(1)將距離d分為10類,每一類中包含70個(gè)距離;(2)對(duì)每一類距離進(jìn)行升序排序,得到dsort ;(3)取 dsort 中前 10 個(gè)距離的均值記做 d_min,如果 d_min (i) = min {d_min)},則 Y屬于第i類字符,i = 1,...,10。
權(quán)利要求
1.電力電能表圖像自動(dòng)識(shí)別方法,其特征在于包括以下步驟步驟一圖像預(yù)處理,采用sobel算子檢測(cè)表盤圖像的垂直紋理,并且采用投影法初步去除背景區(qū)域;再采用膨脹算法提取垂直紋理豐富的區(qū)域;最后采用基于積分投影法的自適應(yīng)閾值分割方法對(duì)圖像進(jìn)行二值化處理;步驟二示值與條碼的精確定位(1)、示值的精確定位,基于sobel算子的垂直邊緣檢測(cè)及形態(tài)學(xué)處理的基礎(chǔ)上,結(jié)合了復(fù)雜圖像背景下基于示值間距和數(shù)字字符的長(zhǎng)寬比特征的智能判斷方法,適應(yīng)不同類型電能表的示值精確定位,同時(shí),突破傳統(tǒng)單個(gè)完整字符定位方法,當(dāng)示值處于半字符狀態(tài)時(shí)能夠判斷該位置是否為上下兩個(gè)不完整字符情況,并且根據(jù)上下半字符的比例關(guān)系選取特征信息較多的字符讀數(shù)作為該位置的讀數(shù);0)、條碼精確定位,根據(jù)條碼區(qū)域垂直紋理較多的特征在傳統(tǒng)投影定位方法基礎(chǔ)上融合了條碼區(qū)域的邊緣特征,對(duì)可能是條碼的區(qū)域進(jìn)行水平掃描,提取滿足條碼特征的區(qū)域, 并且根據(jù)電能表?xiàng)l碼的編碼方法判斷出條碼類型;步驟三條碼識(shí)別,首先采用逐行掃描的方法計(jì)算出一個(gè)條碼字符連續(xù)條空的寬度,然后采用歸一化理論,針對(duì)不同類型的條碼用相似邊距離歸一化方法對(duì)字符條碼進(jìn)行識(shí)別;步驟四示值識(shí)別,由于電能表種類繁多,示值的字符類型不一致,而且機(jī)械式電能表的示值會(huì)出現(xiàn)半字符的現(xiàn)象,一般的模板匹配法、統(tǒng)計(jì)特征法和結(jié)構(gòu)特征法都是很難取得理想的識(shí)別效果,因此示值識(shí)別采用基于PCA的數(shù)字識(shí)別方法,使用PCA方法可以很容易的提取出示值的內(nèi)在結(jié)構(gòu)的主元,即可初步描述示值的結(jié)構(gòu)信息,若有新的圖像需要與原有圖像比較,就可以在變換的主元維度上進(jìn)行比較,則可根據(jù)新圖與原有數(shù)據(jù)集的相似度識(shí)別示值的讀數(shù)。
2.根據(jù)權(quán)利要求1所述的電力電能表圖像自動(dòng)識(shí)別方法,其特征在于示值的精確定位的具體步驟如下(1)、采用水平垂直掃描法結(jié)合數(shù)字字符的寬度與長(zhǎng)度的比一般在0.15 1.25之間的特征去除所有目標(biāo)區(qū)域中寬度大于區(qū)域高度3/4或小于2個(gè)像素寬或?qū)挾扰c長(zhǎng)度的比一般小于0. 15或大于1. 25的偽目標(biāo);(2)、采用像素統(tǒng)計(jì)法去除小面積的噪聲點(diǎn)和面積很大的干擾背景;(3)、根據(jù)示值間等間距的特征進(jìn)一步精確提取示值區(qū)域,具體如下①求出區(qū)域中相鄰、相隔目標(biāo)的間距D1、D2,合并D1、D2并對(duì)其排序得到D,由于電能表示值一般為5位或6位,取D中連續(xù)4個(gè)以上間距之差小于5的間距,并求其均值得到 Dmean ;②在Dl、D2中分別取滿足IDl [i]-Dmean I <8或| D2 [i]-Dmean | < 5的坐標(biāo)i,并且映射到目標(biāo)區(qū)域坐標(biāo),即記錄坐標(biāo)i和i+Ι為有效目標(biāo)坐標(biāo);③統(tǒng)計(jì)有效目標(biāo)的高度均值Hmean,如果Hmean< 10,此區(qū)域?yàn)榉鞘局祬^(qū)域,返回下一個(gè)區(qū)域;④統(tǒng)計(jì)有效目標(biāo)個(gè)數(shù),如果大于7個(gè)目標(biāo)需要采用基于中心坐標(biāo)特征進(jìn)一步排除干擾目標(biāo);首先求出有效目標(biāo)的中心坐標(biāo)的橫坐標(biāo)均值Cxmean,如果有效目標(biāo)的中心坐標(biāo)的橫坐標(biāo)Cx-Cxmean >15,認(rèn)為該目標(biāo)位偽目標(biāo);⑤判斷示值狀態(tài),分別求出示值高度的最大值Hmax和最小值Hmin,如果Hmax-Hmin>8,認(rèn)為該示值中存在半字符,且認(rèn)為Hmax與示值高度H的差大于8的示值為半字符, 然后分別去該示值字符的上下邊界R_top、R_bottom與高度最大示值字符的上下邊界 Hmax_top、Hmax_bottom做差,如果Hmax_top-R_top > 8該示值字符為上半字符,如果R_ bottom-Hmax_bottom > 8該示值字符為下半字符。
3.根據(jù)權(quán)利要求2所述的其特征在于條碼的精確定位根據(jù)條碼區(qū)域垂直紋理較多的特征在傳統(tǒng)的投影定位方法基礎(chǔ)上融合了條碼區(qū)域的邊緣特征,對(duì)可能是條碼的區(qū)域進(jìn)行逐行掃描,統(tǒng)計(jì)區(qū)域內(nèi)邊界個(gè)數(shù)k和邊界點(diǎn)的橫坐標(biāo)構(gòu)成矩陣A,當(dāng)k滿足44 < k < 60認(rèn)為該條碼為8碼條碼,否則當(dāng)k彡60認(rèn)為該條碼為13碼條碼,如果k < 44重新掃描下一行;步驟三條碼識(shí)別,包括基于歸一化理論的條碼識(shí)別(1)、根據(jù)條碼行的坐標(biāo)矩陣A求條碼連續(xù)條空寬度,得到矩陣C;(2)、采用歸一化理論,用一種相似距離歸一化的方法對(duì)條碼進(jìn)行判別;步驟四示值識(shí)別,包括基于PCA的示值識(shí)別;PCA是!Principal component analysis的縮寫,中文翻譯為主元分析;它是一種對(duì)數(shù)據(jù)進(jìn)行分析的技術(shù),最重要的應(yīng)用是對(duì)原有數(shù)據(jù)進(jìn)行簡(jiǎn)化;正如它的名字主元分析,這種方法可以有效的找出數(shù)據(jù)中最“主要”的元素和結(jié)構(gòu),去除噪音和冗余,將原有的復(fù)雜數(shù)據(jù)降維,揭示隱藏在復(fù)雜數(shù)據(jù)背后的簡(jiǎn)單結(jié)構(gòu);它的優(yōu)點(diǎn)是簡(jiǎn)單,而且無(wú)參數(shù)限制,可以方便的應(yīng)用與各個(gè)場(chǎng)合,因此應(yīng)用極其廣泛;本發(fā)明中的示值識(shí)別部分采用基于PCA的數(shù)字識(shí)別方法,基于PCA的數(shù)字識(shí)別方法包括字符圖像訓(xùn)練和識(shí)別兩部分;字符圖像訓(xùn)練首先搜集了 10類數(shù)字字符圖庫(kù),每類包含70幅各種類型的數(shù)字字符二值圖像,圖像尺寸歸一化為20X36 ;另外分別從上向下和從下向上截取整字符高度2/3到 8/9部分的字符區(qū)域組成上下半字符圖庫(kù),半字符圖像歸一化尺寸為20XM;然后采用PCA 算法訓(xùn)練特征數(shù)據(jù),以整字符訓(xùn)練為例,設(shè)待測(cè)試圖像為X,M = 36,N = 20, m= 10X70 = 700,η = MXN = 720,訓(xùn)練過程具體步驟如下.1、計(jì)算平均圖像Mu= Sum(Xi)A^i = 1,...,m;.2、Xi- = Mu.3、計(jì)算協(xié)方差矩陣SIGMA = Sum(XiXT(Xi))A^i = 1,. . .,m。SIGMA 是一個(gè) nXn 實(shí)對(duì)稱矩陣,T(Xi)表示矩陣\轉(zhuǎn)置;.4、計(jì)算Sigma 的特征值 lambda_k和特征向量Wk,k= 1,. . .,n,lambda_l > = lambda_2>=...> =lambda_n ;.5、構(gòu)造nXm'大小的子空間變換矩陣W= [W1,. . .,Wm,] ;m' <= m,m' << n,m'的大小根據(jù)需要選擇,使之滿足[sum(lambda_k, k = 1,…m' ) /sum(lambda_k, k = 1,…,η) ] > 0. 90.6、計(jì)算圖像&的投影坐標(biāo)Ai= T(W) X (Xi-Mu) ;T (W)表示矩陣W轉(zhuǎn)置,Ai是!11' Xl 的列向量,投影坐標(biāo)就是圖像特征;.7、保存矩陣A、T作為特征數(shù)據(jù);示值識(shí)別部分具體步驟如下(1)、將定位得到的二值字符圖像做待識(shí)別字符歸一化處理,即整字符歸一化為20X36的圖像,半字符歸一化為20XM的圖像;(2)、根據(jù)字符狀態(tài)調(diào)入訓(xùn)練好的特征數(shù)據(jù)A、T;(3)、對(duì)于NXM大小的待識(shí)別圖像Y,計(jì)算Y的投影坐標(biāo),坐標(biāo)B= T (W) X Y ;T (W)表示矩陣W轉(zhuǎn)置;(4)、計(jì)算待識(shí)別圖像Y與庫(kù)中圖像\間距離d (Xi,Y) = sqrt (sum ((B [k] -Ai [k]) X (B [k] -Ai [k])))其中,k = 1,...,m';理論上,如果d(X」,Y) =HiinicKXi, Y)},則Y與Xj為基本同類的字符,但是在實(shí)際應(yīng)用中直接取最小距離對(duì)應(yīng)的類最為Y的讀數(shù)往往識(shí)別率不高,因此本發(fā)明對(duì)識(shí)別部分算法進(jìn)行了改進(jìn)①將距離d分為10類,每一類中包含70個(gè)距離;②對(duì)每一類距離進(jìn)行升序排序,得到dsort;③取dsort中前10個(gè)距離的均值記做d_min,如果d_min(i) = min {d_min)},貝丨J Y屬于第i類字符,i = 1,...,10。
全文摘要
電力電能表圖像自動(dòng)識(shí)別方法,包括下列步驟步驟一圖像預(yù)處理,采用sobel算子檢測(cè)表盤圖像的垂直紋理,并采用投影法初步去除背景區(qū)域;再采用膨脹法提取垂直紋理豐富區(qū)域;最后采用基于積分投影法的自適應(yīng)閾值分割方法對(duì)圖像進(jìn)行二值化處理。步驟二示值與條碼的精確定位,基于sobel算子的垂直邊緣檢測(cè)及形態(tài)學(xué)處理的基礎(chǔ)上,結(jié)合復(fù)雜圖像背景下基于示值間距和數(shù)字字符的長(zhǎng)寬比特征的智能判斷方法,適應(yīng)不同類型電能表的示值精確定位。對(duì)條碼區(qū)域進(jìn)行水平掃描,提取條碼特征區(qū)域、步驟三條碼識(shí)別,針對(duì)不同條碼用相似邊距離歸一化方法對(duì)字符條碼進(jìn)行識(shí)別。步驟四示值識(shí)別,使用PCA方法提取示值。本發(fā)明采用PCA字符識(shí)別方法能夠準(zhǔn)確識(shí)別各種字符示值讀數(shù),包括半字符識(shí)別。
文檔編號(hào)G06K9/20GK102236788SQ20101015083
公開日2011年11月9日 申請(qǐng)日期2010年4月20日 優(yōu)先權(quán)日2010年4月20日
發(fā)明者付永全 申請(qǐng)人:榮科科技股份有限公司