一種基于梯度圖像和相似度加權的數(shù)字識別方法
【技術領域】
[0001] 本發(fā)明涉及一種數(shù)字識別方法。
【背景技術】
[0002] 機器視覺的特點是自動化、客觀性、非接觸和高精度。與一般意義下的圖像處理系 統(tǒng)相比,機器視覺系統(tǒng)強調的是精度、速度以及工業(yè)現(xiàn)場環(huán)境下的可靠性。由于機器視覺 系統(tǒng)可以快速獲取大量信息,易于自動處理,也易于與設計信息以及加工控制信息集成,因 此,在現(xiàn)代自動化生產(chǎn)過程中,機器視覺系統(tǒng)廣泛地用于狀況監(jiān)視、成品檢驗和質量控制等 領域。機器視覺系統(tǒng)可以提高生產(chǎn)的柔性和自動化程度,在一些不適合人工作業(yè)的危險工 作環(huán)境或人工視覺難以滿足要求的場合,可用機器視覺來替代人工視覺;同時在大批量工 業(yè)生產(chǎn)過程中,用人工視覺檢查產(chǎn)品質量不僅效率低且精度不高,而用機器視覺檢測方法 可以大大提高生產(chǎn)效率和生產(chǎn)的自動化程度。
[0003] 鋼鐵行業(yè)生產(chǎn)有著生產(chǎn)環(huán)境苛刻、生產(chǎn)過程復雜、生產(chǎn)處理過程由少到多、自動化 程度高、連續(xù)性強等突出特點,因此國內(nèi)外一些先進的鋼鐵企業(yè)都采用了以制作執(zhí)行系統(tǒng) (Manufacturing Execution System,簡稱MES)為核心的整體信息化方案。為給MES系統(tǒng) 提供有效的信息支持,需要在煉鋼廠的固定位置架設攝像機采集煉鋼各關鍵環(huán)節(jié)的圖像, 完成圖像的智能處理。煉鋼廠是一個完全開放式的環(huán)境,同時我們所監(jiān)測的對象是不停運 動的,我們采取的方案是將攝像頭架設在固定的建筑物上,然后上下左右移動攝像頭以獲 得最佳角度下的圖像。盡管系統(tǒng)裝備了較高配置的攝像頭,但各種不確定因素仍然導致成 像質量不穩(wěn)定。主要包括光照的變化、灰塵的污染、油漆的脫落、機器的震動、成像對象的移 動等,數(shù)字質量不統(tǒng)一和遮擋等。煉鋼廠并不是一個封閉的環(huán)境,因此白天和晚上成像的光 照條件是不同的,而白天的光照又容易受到天氣變化的影響,同時四個季節(jié)中的日照也有 所不同,晚上主要是利用日光燈照明,但由于工人輪班休息的原因,日光燈提供的光照也是 不穩(wěn)定的。自然光照、環(huán)境光照對圖像都有影響,除了自然光照條件的影響,工序操作所產(chǎn) 生的光照變化也會影響到當前攝像頭的成像,如轉爐在煉鋼過程中就存在爐門暗、爐門被 燒為紅色、爐門被燒為白色和爐門打開鋼花四濺等情況。
[0004] 為了能夠監(jiān)測每個鋼包所經(jīng)過的工序,在每個鋼包的側面刷上數(shù)字,然后通過圖 像來識別鋼包上的數(shù)字,以告訴MES系統(tǒng)鋼包的實時狀況。由于現(xiàn)實條件的限制,鋼包上的 數(shù)字是由工人通過油漆粉刷上去的,每個人的筆跡特征不盡相同,是典型的手寫體,沒有統(tǒng) 一的標準。每個數(shù)字的位置不固定,多位數(shù)字的字間間矩不一樣,而組成多位數(shù)字的單個數(shù) 字的字體、大小、顏色均存在較大差別,這都給數(shù)字識別帶來了一定的難度。
[0005] 另外,煉鋼廠是一個高溫環(huán)境,最高溫度可達上千度,因此選擇的油漆必須具備耐 高溫和不易脫落的特點,同時為了便于識別,底色和數(shù)字的顏色應該對比明顯。但在實際情 況中油漆的脫落問題比較嚴重,這使得成像后的數(shù)字形狀隨著時間會發(fā)生緩慢的變化。同 時煉鋼廠里的灰塵污染是無處不在的,鐵肩尤其嚴重,這些灰塵的影響使得圖像噪聲較大, 增加了圖像處理的難度。煉鋼廠存在著許多大型機械裝置,它們的的運行不可避免的帶來 巨大的噪音和震動,此時攝像頭會作上下方向的移動,捕捉到的圖像會出現(xiàn)些許模糊現(xiàn)象。
[0006] 還有,成像對象鋼包、方坯和板坯并不是固定不動的,它們或者在自己的運行方向 上作水平運動(如吹氬、精煉和轉爐處的鋼包),或者原地轉動(如連鑄平臺的鋼包)。成 像對象與攝像頭之間的距離是不確定的,而各個攝像頭對準成像對象的角度也是不同的, 因此不同任務的成像過程遵循的變換方式也各不相同。架設攝像頭的地方必須與被監(jiān)測對 象保持適當?shù)木嚯x同時又要保證攝像頭在高溫條件下正常工作,但由于煉鋼廠中客觀物體 的遮擋可能造成一些攝像頭無法得到監(jiān)測對象的詳細成像,從而無法識別目標,人為遮擋 在成像過程中出現(xiàn)的并不是很普遍,如果工人在作業(yè)過程中恰好與攝像頭和被攝對象處于 同一直線上,則可能會妨礙被攝物體的成像,但由于大部分目標是運動的,因此這種遮擋一 般不會影響到最終的目標識別結果。
[0007] 總之,現(xiàn)場復雜的成像環(huán)境使得傳統(tǒng)的利用形狀識別數(shù)字的方法無法取得滿意的 結果
【發(fā)明內(nèi)容】
[0008] 本發(fā)明要解決的技術問題在于:提供一種基于梯度圖像和相似度加權的模板匹配 方法來識別數(shù)字。
[0009] 本發(fā)明解決其技術問題所采用的技術方案是:
[0010] -種基于梯度圖像和相似度加權的數(shù)字識別方法,其特征在于:包括如下步驟: 步驟一:輸入需要識別的圖像;步驟二:根據(jù)先驗知識確定候選區(qū)域;步驟三:對候選區(qū)域 進行圖像增強和分割;圖像增強的目的主要是為了降低光照變化和噪聲的影響,數(shù)字在圖 像上表現(xiàn)出來的一般是高亮區(qū)域,同時數(shù)字與其周圍背景的對比度較高,因此在分割的時 候是結合灰度和梯度信息進行分割的,將灰度和梯度大于指定閾值的區(qū)域置1,圖像的其他 區(qū)域置〇 ;分割的結果可以為下面的區(qū)域編組做準備,同時可根據(jù)分割的結果來判斷圖像 中是否存在數(shù)字;步驟四:預判圖像中是否存在數(shù)字;具體為,根據(jù)分割的結果,若圖像中 為1的像素的比例超過總像素的15%并且小于75%,則認為所述圖像中存在數(shù)字;否則則 判定不存在數(shù)字,返回步驟一輸入下一個要識別的圖像;步驟五:區(qū)域編組;具體為,對步 驟三中分割后的區(qū)域進行編組,將長寬比在1. 5:1和4 :1之間的區(qū)域定為數(shù)字的候選區(qū)域; 個位數(shù)字編組后的區(qū)域一般表現(xiàn)為細長型,兩位數(shù)字編組后的區(qū)域一般表現(xiàn)為兩個相鄰較 近的細長型區(qū)域;步驟六:在原始圖像上基于梯度圖像和相似度加權進行模板匹配;具體 為,將步驟五得到的區(qū)域的原始圖像與數(shù)字標準庫和數(shù)字漏判庫中的模板進行匹配,其中 數(shù)字標準庫中存放的是正確識別出的數(shù)字模板圖像,數(shù)字漏判庫存放的是圖像上有數(shù)字卻 沒有被正確識別出的數(shù)字模板圖像;標準庫和漏判庫最初通過人工手動采集的方式建立, 然后根據(jù)識別結果不斷進行更新,以適應成像環(huán)境和監(jiān)測對象的變化;模板采用的是原始 圖像數(shù)據(jù)或者典型的圖形,相似度量的基礎是對應像元的差別,可以相關系數(shù)的平方作為 模板匹配的相似度量度,再分別乘以加權系數(shù),得到數(shù)字識別結果;如識別出來就將識別結 果傳送給MES系統(tǒng)和數(shù)字標準庫,如識別不出來,則將圖像傳送給數(shù)字漏判庫;步驟七:模 板庫更新;具體為,數(shù)字標準庫中的模板數(shù)維持270~360之間,若模板數(shù)量超過360,則剔 除時間較早的36張模板圖;數(shù)字漏判庫中的模板數(shù)維持在80~100,若模板數(shù)量超過100, 則剔除時間較早的10張模板圖。
[0011] 作為本發(fā)明的改進,為了進一步提高匹配效率,所述步驟六具體包括:步驟6. I : 計算數(shù)字所在區(qū)域的原始圖像的Soble梯度圖;步驟6. 2 :計算數(shù)字所在區(qū)域的Soble梯度 圖與數(shù)字標準庫的Soble梯度之間的相關系數(shù)的平方得到相關數(shù)A,以及數(shù)字所在區(qū)域的 Soble梯度圖與數(shù)字漏判庫的Soble梯度之間的相關系數(shù)的平方得到相關數(shù)B ;步驟6. 3 : 將步驟6. 2中相關數(shù)A和相關數(shù)B分別進行0. 85和0. 15的加權,得到最終的相關系數(shù),如 果該相關系數(shù)的值大于〇. 8,則認為圖像中的數(shù)字被識別出,將被識別的數(shù)字補充到數(shù)字標 準庫;如果該相關系數(shù)的值小于0. 8,則認為數(shù)字被漏減,將未被識別的數(shù)字補充到數(shù)字漏 判庫。
[0012] 作為本發(fā)明的進一步改進,其中步驟一所述的每個像素的顏色值可以是RGB值, 也可以是灰度值。
[0013] 作為本發(fā)明的更進一步改進,其中在步驟6. 2的計算過程中可利用整數(shù)圖像法提 高效率。
[0014] 與現(xiàn)有技術相比,本發(fā)明根據(jù)先驗知識確定候選區(qū)域提高了算法的效率和降低誤 判的可能性,通過采用預判步驟,可以將本方法的平均識別效率提高近10%,通過對兩個相 關系數(shù)分別進行加權得到最終的相關系數(shù)并進行判斷識別,可以將平均識別正確率提高1 到 2個百分點。
【附圖說明】
[0015] 為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術中的技術方案,下面將對實施例或現(xiàn) 有技術描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā) 明的一些實施例,對于本領域普通技術人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以 根據(jù)這些附圖獲得其他的附圖。
[0016] 圖1是本方法的流程圖;
【具體實施方式】
[0017] 為使本發(fā)明實施例的目的、技術方案和優(yōu)點更加清楚,下面將結合本發(fā)明實施例 中的附圖,對本發(fā)明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例是 本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領域普通技術人員 在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
[0018] -種基于梯度圖像和相似度加權的數(shù)字識別方法,其特征在于:包括如下步驟:
[0019] 步驟一:輸入需要識別的圖像;此處需要輸入的是圖像中每個像素的顏色值;每 個像素的
[0020] 顏色值,可以是RGB值,也可以是灰度值。
[0021] 步驟二:根據(jù)先驗知識確定候選區(qū)域;由于客觀條件的限制,攝像頭一般架設在 離監(jiān)測對象較遠的位置上,這樣監(jiān)測對象出現(xiàn)的可能位置只占據(jù)圖像的一小部分,因此可 以根據(jù)相機與目標的相對位置等先驗知識將這部分區(qū)域定為候選區(qū)域,以提高算法的效率 和降低誤判的可能性。
[0022] 步驟三:對候選區(qū)域進行圖像增強和分割;圖像增強的目的主要是為了降低光照 的變化和噪聲的影響;通常采用的圖像增強方式有圖像直方圖均衡化、灰度線性變換、圖 像銳化處理和高斯平滑等,根據(jù)圖像被污染的程度做不同的處理。數(shù)字在圖像上表現(xiàn)出來 的一般是高亮區(qū)域,同時數(shù)字與其周圍背景的對比度較高,因此在分割的時候是結合灰度 和梯度信息進行分割的,將灰度和梯度大于指定閾值的區(qū)域置1,圖像的其他區(qū)域置O ;分 割的結果可以為下面的區(qū)域編組做準備,同時可根據(jù)分割的結果來判斷圖像中是否存在數(shù) 字;
[0023] 步驟四:預判圖像中是否存在數(shù)字;具體為,根據(jù)分割的結果,若圖像中為1的像 素的比例超過總像素的15%并且小于75%,則認為所述圖像中存在數(shù)字;否則則判定不存 在