專利名稱:一種手持式的復(fù)雜背景下的激光噴碼字符識別儀的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種手持式的復(fù)雜背景下的激光噴碼字符識別儀,它能夠識別復(fù)雜背 景下的激光噴碼字符,其中,涉及到圖像采集、圖像處理、模式識別和基于GPRS(通用無線 分組業(yè)務(wù))的無線通信技術(shù),屬于模式識別檢測類裝置技術(shù)領(lǐng)域。
(二)
背景技術(shù):
現(xiàn)今,隨著信息社會的發(fā)展,圖像處理和模式識別技術(shù)在各行各業(yè)的應(yīng)用越來越 廣泛。字符識別技術(shù)發(fā)展迅速,在個人信息管理、辦公自動化、電子出版物、網(wǎng)絡(luò)資源、各種 大型文獻(xiàn)資料管理數(shù)據(jù)庫、數(shù)字化圖書館、車牌識別、票據(jù)識別、身份證鑒別等方面有著重 要的實(shí)用價值,提高了工作效率,降低了人工成本。 對圖像中的字符識別,目前的研究對象絕大部分是對于簡單背景下的字符而言 的,或者是雖然整個圖像背景復(fù)雜,但字符區(qū)域的背景簡單。在實(shí)際應(yīng)用中,文本圖像的情 況復(fù)雜多變紋理背景、變化背景、噪聲干擾、字體模糊、字符融入背景之中等等。例如,許多 激光噴碼字符直接噴在產(chǎn)品的外包裝表面,而產(chǎn)品外包裝本身具有不可預(yù)知的復(fù)雜圖案, 使得字符處于復(fù)雜的背景圖案中。面對這些復(fù)雜的情況,傳統(tǒng)的簡單背景字符識別技術(shù)就 有很大的局限性。 目前,字符的識別方法主要有基于模板匹配方法,基于字符結(jié)構(gòu)的方法和基于神 經(jīng)網(wǎng)絡(luò)的方法,這些現(xiàn)有的圖像識別方法都或多或少的帶有一定的局限性,在一種環(huán)境下 效果很好的方法換一種環(huán)境識別效果可能很不理想。 一些有一定通用性,識別效果好的方 法,往往計算量很大,難以實(shí)時應(yīng)用。 GPRS是通用無線分組業(yè)務(wù)(General Packet Radio Service)的簡稱,是一種基于 GSM系統(tǒng)的無線分組交換技術(shù),提供端到端的、廣域的無線IP連接,是一項(xiàng)高速數(shù)據(jù)處理的 技術(shù),以分組的形式傳送資料,在很多方面具有顯著的優(yōu)勢。
(三)
發(fā)明內(nèi)容
1、目的本發(fā)明的目的是提供一種手持式的復(fù)雜背景下的激光噴碼字符識別儀, 它采用嵌入式設(shè)計將圖像采集功能、數(shù)字圖像識別功能、基于GPRS的數(shù)據(jù)發(fā)送功能集成于 一體,可以現(xiàn)場對目標(biāo)進(jìn)行圖像采集和快速自動識別,并將識別結(jié)果通過GPRS通信模塊發(fā) 送到指定服務(wù)器。 2、技術(shù)方案本發(fā)明一種手持式的復(fù)雜背景下的激光噴碼字符識別儀,它是由硬
件結(jié)構(gòu)和軟件結(jié)構(gòu)兩大部分構(gòu)成
(1)硬件結(jié)構(gòu) 手持式復(fù)雜背景下的激光噴碼字符識別儀的硬件結(jié)構(gòu)方框示意圖,如圖1。
硬件結(jié)構(gòu)由圖像采集單元、圖像處理單元、數(shù)據(jù)存儲單元、液晶顯示單元、GPRS通 信單元、按鍵操作單元、電源模塊等部分組成。
電源模塊負(fù)責(zé)為該識別儀各個部分供電;按鍵操作單元和液晶顯示單元是人機(jī)接口,負(fù)責(zé)操作命令的輸入和結(jié)果的輸出顯示;圖像采集單元負(fù)責(zé)采集圖像;GPRS通信單元負(fù)責(zé)識別結(jié)果的無線發(fā)送。整個過程是用戶通過按鍵操作單元發(fā)出命令,處理器接收到命令,控制圖像采集單元采集圖像數(shù)據(jù),通過數(shù)據(jù)存儲單元進(jìn)行存儲,然后進(jìn)行圖像識別,最后將識別的結(jié)果通過GPRS通信單元發(fā)送到指定服務(wù)器,同時將結(jié)果存儲到數(shù)據(jù)存儲單元中,便于日后查詢。 所述圖像采集單元是一款高集成度、高分辨率的CM0S傳感芯片0V9650,其內(nèi)部集成了時序電路,模擬信號處理電路,數(shù)字信號處理電路;它帶有標(biāo)準(zhǔn)的Serial CameraControlBus (SCCB)接口 ,通過該接口可實(shí)現(xiàn)各種圖像增強(qiáng)和控制功能,如自動曝光、自動增益、自動平衡控制等,以及控制圖像色彩、飽和度、伽馬校正、銳化、鏡頭校準(zhǔn)、噪聲和白像素刪除等。 所述圖像處理單元是采用三星ARM9S3C2440處理器,它是基于ARM920T內(nèi)核的32位嵌入式微處理器,最高工作頻率可達(dá)533MHz ;其帶有匪U內(nèi)存管理單元可支持WindowsCE、Li皿x等嵌入式操作系統(tǒng),具有豐富的片上資源,如LCD、DMA控制器,以及USB、以太網(wǎng)、UART、攝像頭、觸摸屏等接口。 所述數(shù)據(jù)存儲單元是采用一片三星的K9F1208芯片(64MX8bit),用于儲存系統(tǒng)的Boot Loader、 OS內(nèi)核鏡像、文件系統(tǒng)和用戶應(yīng)用程序;采用兩片三星的HY57V561620芯片(4MX16bitX4Banks)構(gòu)成64MB的SDRAM(同步動態(tài)隨機(jī)存取存儲器),用于加載Windows CE操作系統(tǒng)和運(yùn)行應(yīng)用程序。 所述液晶顯示單元是選用夏普的3. 5寸TFT觸摸屏LQ035Q7DH01 ;其中,S3C2440提供LCD接口,將其控制信號、幀同步信號、行同步信號、像素時鐘信號、數(shù)據(jù)輸出使能信號和數(shù)據(jù)信號與LCD對應(yīng)信號相連;將S3C2440的后4通道A與LCD的觸摸屏接口相連,實(shí)現(xiàn)觸點(diǎn)位置的采集。 所述GPRS通信單元是采用sim300模塊,它具有三頻GSM(全球移動通訊系統(tǒng))和GPRS功能,內(nèi)嵌TCP/IP協(xié)議,利用6PRS網(wǎng)絡(luò)平臺實(shí)現(xiàn)數(shù)據(jù)信息的透明傳輸,GPRS與處理器之間通過串口通信。 所述按鍵操作單元是個4X4的矩陣鍵盤,它與控制器通過8個通用IO相連,用于對整個識別儀的操作。 所述電源系統(tǒng)是采用外部5V供電,利用兩片LM1117-33分別將外部輸入的5V轉(zhuǎn)換為2路3. 3V,對控制器和外圍電路器件單獨(dú)供電,單獨(dú)供電最大程度避免了外圍電路給控制器帶來的影響。由于S3C2440需要3. 3V和1. 3V兩種電壓,故再利用一片LM1117-ADJ將3. 3V轉(zhuǎn)成1. 3V。電源系統(tǒng)為整個識別儀的各個部分提供5V、3. 3V和1. 3V電壓。
(2)軟件結(jié)構(gòu) 該手持式激光噴碼字符識別儀的軟件架構(gòu)示意圖,如圖2。 軟件結(jié)構(gòu)由系統(tǒng)調(diào)度、硬件控制模塊、驅(qū)動模塊、硬件平臺、人機(jī)界面模塊、數(shù)據(jù)庫模塊、識別算法模塊等部分組成。系統(tǒng)調(diào)度負(fù)責(zé)整個軟件系統(tǒng)的任務(wù)調(diào)度,首先,由硬件控制模塊通過驅(qū)動模塊控制硬件平臺將圖像數(shù)據(jù)采集上來,經(jīng)過識別算法模塊,得到識別結(jié)果,然后通過人機(jī)界面模塊將其顯示、通過數(shù)據(jù)存儲模塊將結(jié)果存儲,最后通過硬件控制模塊的控制GPRS通信單元將識別結(jié)果發(fā)送到指定的服務(wù)器。 所述的系統(tǒng)調(diào)度是整個軟件系統(tǒng)的核心,它負(fù)責(zé)整個軟件系統(tǒng)的任務(wù)調(diào)度,其它
6模塊的操作任務(wù)的發(fā)出與控制都是由系統(tǒng)調(diào)度來完成的。 所述硬件控制模塊是整個系統(tǒng)的硬件控制部分,它控制攝像頭、GPRS通信單元、實(shí)時鐘(RTC)和鍵盤。攝像頭的控制基于自主研發(fā)的攝像頭流接口驅(qū)動,操作的基本流程如圖3所示。GPRS通信單元采用RS232串口控制;實(shí)時鐘(RTC)的控制是采用S3C2440內(nèi)置RTC接口 ,鍵盤的控制是通過8個通用10,采用查詢的方式,控制4X4的矩陣鍵盤。
所述的驅(qū)動模塊是硬件控制模塊與硬件平臺之間的接口 ,硬件控制模塊是通過驅(qū)動模塊來完成對硬件平臺的控制。 所述的硬件平臺是指整個系統(tǒng)的硬件部分,包括攝像頭、GPRS通信模塊、按鍵等。 所述人機(jī)界面模塊實(shí)現(xiàn)用戶與識別儀進(jìn)行人機(jī)交互,它基于MFC對話框方式開
發(fā),實(shí)現(xiàn)了登錄界面,主界面、數(shù)據(jù)庫主界面、數(shù)據(jù)庫編輯界面等主要界面,各個界面之間的
狀態(tài)轉(zhuǎn)換如圖5所示。開始后,首先進(jìn)入到登陸界面,正確登陸之后可以進(jìn)入到主界面,從
主界面可以進(jìn)入到數(shù)據(jù)庫主界面,通過編輯和添加可以進(jìn)入到數(shù)據(jù)庫的編輯界面,在數(shù)據(jù)
庫編輯界面退出可回到數(shù)據(jù)庫主界面,退出數(shù)據(jù)庫主界面可回到系統(tǒng)主界面,在登陸界面
和主界面點(diǎn)退出可以關(guān)閉整個人機(jī)界面。 所述數(shù)據(jù)庫模塊用于將識別結(jié)果存儲,它采用Windows CE自帶的數(shù)據(jù)庫EDB設(shè)計
實(shí)現(xiàn)。其具體流程如圖4所示。首先,先掛載數(shù)據(jù)庫巻;然后打開數(shù)據(jù)庫巻;如果失敗,則重
新創(chuàng)建數(shù)據(jù)庫,再打開數(shù)據(jù)庫,如果成功,則繼續(xù)進(jìn)行數(shù)據(jù)庫操作,如查找數(shù)據(jù)庫、寫記錄、
讀記錄等;如果不再需要進(jìn)行數(shù)據(jù)庫操作,則關(guān)閉數(shù)據(jù)庫,最后卸載數(shù)據(jù)庫巻。 所述識別算法模塊是該字符識別儀的軟件部分主體,它包括圖像預(yù)處理、字符區(qū)
域定位、二值化、傾斜矯正、字符分割、特征提取、初步識別、二次識別等。 該圖像預(yù)處理(包括有圖像灰度化、去除噪聲和灰度拉伸)是為了便于后續(xù)的快
速圖像處理,需要先對圖像數(shù)據(jù)進(jìn)行轉(zhuǎn)換,使彩色圖像變?yōu)?56級灰度圖。圖像中不可避免
的含有噪聲,我們采用中值濾波對圖像進(jìn)行預(yù)處理。為了增強(qiáng)背景區(qū)域和字符區(qū)域的對比
度,對圖像進(jìn)行灰度拉伸。 該字符區(qū)域定位是將復(fù)雜背景下的噴碼字符區(qū)域定位出來,這里,由于原圖像是彩色圖像,如果僅在灰度圖像中進(jìn)行處理,會丟失很多有用信息,導(dǎo)致無法將字符區(qū)域準(zhǔn)確的定位出來。因此,本設(shè)計將從灰度圖像和彩色圖像兩個目標(biāo)同時入手,一方面,在灰度圖像中進(jìn)行字符定位,使用紋理分析的方法;另一方面在彩色圖像中進(jìn)行定位,使用顏色聚類、同色聯(lián)通域分析的方法。通過以上的方法進(jìn)行分析結(jié)束后,將結(jié)果信息進(jìn)行融合,再加上先驗(yàn)信息(字符區(qū)域?qū)捀弑仍? : l到7 : l之間,噴碼字符顏色為黑色),將所有這些信息進(jìn)行融合,最終得到?jīng)Q策結(jié)果,即得到字符區(qū)域。 該二值化是對字符區(qū)域內(nèi)的灰度圖像進(jìn)行二值化處理,我們采用最大類間方差法。即類間方差與類內(nèi)方差比的方法,自適應(yīng)計算灰度閾值,小于此閾值的區(qū)域認(rèn)為是目標(biāo)區(qū)域,大于此閾值的區(qū)域認(rèn)為是背景區(qū)域。 該傾斜矯正是由于攝像頭拍攝角度的問題,可能會帶來一些角度不大的傾斜,對字符識別的結(jié)果造成一定的影響,我們對二值圖像進(jìn)行了自適應(yīng)傾斜矯正。即用hough變換得到字符區(qū)域的傾斜角度,最后根據(jù)字符區(qū)域的傾斜角度采用仿射變換來進(jìn)行矯正。
該字符分割是采用局部區(qū)域最小值法進(jìn)行分割,將字符進(jìn)行垂直投影,在字符粘連范圍的垂直投影值最小處進(jìn)行分割。
7
該特征提取即提取字符特征。本系統(tǒng)采用統(tǒng)計特征和結(jié)構(gòu)特征相結(jié)合的特征提取方式,以期取得較好的分類效果。將字符圖像劃分為4X4的網(wǎng)格,統(tǒng)計每個區(qū)域中的黑色像素占該區(qū)域總像素數(shù)的比值,形成16維統(tǒng)計特征;將字符圖像分別沿水平和垂直方向投影,求投影的峰值位置,形成2維結(jié)構(gòu)特征,將兩種特征組合形成18維特征作為字符特征。
該初步識別是采用支持向量機(jī)分類算法,對字母和數(shù)字分別建立SVM識別模型。以數(shù)字識別為例,模型可描述為給定訓(xùn)練集,輸入為18維樣本特征輸入,輸出為IO種可能的輸出,通過樣本訓(xùn)練,得到?jīng)Q策函數(shù),使得對于測試樣本,能得出相應(yīng)的輸出結(jié)果,以此作為初步識別結(jié)果。 該二次識別是在初步識別的基礎(chǔ)上,對字符進(jìn)行再次識別。試驗(yàn)發(fā)現(xiàn),對于一些相似的字符,很難一次識別成功,需要進(jìn)行再次識別。主要結(jié)合字符的特殊結(jié)構(gòu)特征對一些相似字符進(jìn)行再次識別,比如長寬比例,區(qū)域封閉性等,以此識別結(jié)果作為最終識別結(jié)果。經(jīng)過二次識別后,可以很有效的提高字符識別率。 識別算法流程如圖6所示,首先,對采集來的圖像進(jìn)行預(yù)處理,包括圖像灰度化、去除噪聲、灰度拉伸;然后進(jìn)行字符區(qū)域定位,將字符所在的區(qū)域定位出來;接下來對字符區(qū)域進(jìn)行二值化處理,得到二值圖像;然后進(jìn)行傾斜校正;對校正后的圖像進(jìn)行字符分割,將整個字符區(qū)域分割成單個的字符;對每一個字符進(jìn)行特征提取;先進(jìn)行字符的初步識別;最后通過二次識別區(qū)分相似的字符;對每一個字符進(jìn)行特征提取、初步識別和二次識別,得到最后的識別結(jié)果。
3、有益效果 本發(fā)明提供一種手持式的復(fù)雜背景下的激光噴碼字符識別儀,其優(yōu)點(diǎn)和有益效果如下 1.設(shè)備主要電子模塊單元設(shè)計采用較好的抗電磁干擾電路,排除電磁干擾的影響; 2.采用彩色圖像識別和灰度圖像識別相結(jié)合的方式,提高復(fù)雜背景下的字符識別率; 3.采用高效的識別算法,大大縮短識別時間; 4.可將識別結(jié)果通過GPRS自動發(fā)送到指定服務(wù)器,提高了工作效率。
圖1本發(fā)明硬件結(jié)構(gòu)示意圖 圖2嵌入式字符識別儀軟件架構(gòu)示意圖 圖3攝像頭控制流程示意圖 圖4EDB數(shù)據(jù)庫操作流程示意圖 圖5用戶界面狀態(tài)轉(zhuǎn)換示意圖 圖6識別算法流程示意圖 圖中符號說明如下 1圖像處理單元;2液晶顯示單元;3按鍵操作單元;4圖像采集單元;5GPRS通信單元;6數(shù)據(jù)存儲單元;7電源模塊;8系統(tǒng)調(diào)度;9識別算法模塊;10硬件控制模塊;ll驅(qū)動模塊;12硬件平臺;13人機(jī)界面模塊;14數(shù)據(jù)庫模塊。具體實(shí)施例方式
本發(fā)明一種手持式的復(fù)雜背景下的激光噴碼字符識別儀,它是由硬件結(jié)構(gòu)和軟件
結(jié)構(gòu)兩大部分構(gòu)成。
(1)硬件結(jié)構(gòu) 手持式復(fù)雜背景下的激光噴碼字符識別儀的硬件結(jié)構(gòu)方框示意圖,如圖1。
硬件結(jié)構(gòu)由圖像采集單元4、圖像處理單元1、數(shù)據(jù)存儲單元6、液晶顯示單元2、GPRS通信單元5、按鍵操作單元3、電源模塊7等部分組成。電源模塊7負(fù)責(zé)為該識別儀各個部分供電;按鍵操作單元3和液晶顯示單元2是人機(jī)接口 ,負(fù)責(zé)操作命令的輸入和結(jié)果的輸出顯示;圖像采集單元4負(fù)責(zé)采集圖像;GPRS通信單元5負(fù)責(zé)識別結(jié)果的無線發(fā)送。整個過程是用戶通過按鍵操作單元3發(fā)出命令,處理器接收到命令,控制圖像采集單元4采集圖像數(shù)據(jù),放到數(shù)據(jù)存儲單元6中,然后進(jìn)行圖像識別,最后將識別的結(jié)果通過GPRS通信單元5發(fā)送到指定服務(wù)器,同時將結(jié)果存儲到自帶的數(shù)據(jù)存儲單元6中。
所述圖像采集單元4是一款高集成度、高分辨率的CMOS傳感芯片0V9650,其內(nèi)部集成了時序電路,模擬信號處理電路,數(shù)字信號處理電路;它帶有標(biāo)準(zhǔn)的Serial CameraControlBus (SCCB)接口 ,通過該接口可實(shí)現(xiàn)各種圖像增強(qiáng)和控制功能,如自動曝光、自動增益、自動平衡控制等,以及控制圖像色彩、飽和度、伽馬校正、銳化、鏡頭校準(zhǔn)、噪聲和白像素刪除等。 所述圖像處理單元1是采用三星ARM9 S3C2440處理器,它是基于ARM920T內(nèi)核的32位嵌入式微處理器,最高工作頻率可達(dá)533MHz ;其帶有匪U內(nèi)存管理單元可支持WindowsCE、Li皿x等嵌入式操作系統(tǒng),具有豐富的片上資源,如LCD、DMA控制器,以及USB、以太網(wǎng)、UART、攝像頭、觸摸屏等接口。 所述數(shù)據(jù)存儲單元6是采用一片三星的K9F1208芯片(64MX8bit),用于儲存系統(tǒng)的Boot Loader、 0S內(nèi)核鏡像、文件系統(tǒng)和用戶應(yīng)用程序;采用兩片三星的HY57V561620芯片(4MX16bitX4Banks)構(gòu)成64MB的SDRAM(同步動態(tài)隨機(jī)存取存儲器),用于加載Windows CE操作系統(tǒng)和運(yùn)行應(yīng)用程序。 所述液晶顯示單元2是選用夏普的3. 5寸TFT觸摸屏LQ035Q7DH01 ;其中,S3C2440提供LCD接口,將其控制信號、幀同步信號、行同步信號、像素時鐘信號、數(shù)據(jù)輸出使能信號和數(shù)據(jù)信號與LCD對應(yīng)信號相連;將S3C2440的后4通道A與LCD的觸摸屏接口相連,實(shí)現(xiàn)觸點(diǎn)位置的采集。 所述GPRS通信單元5是采用sim300模塊,它具有三頻GSM(全球移動通訊系統(tǒng))和GPRS功能,內(nèi)嵌TCP/IP協(xié)議,利用GPRS網(wǎng)絡(luò)平臺實(shí)現(xiàn)數(shù)據(jù)信息的透明傳輸,GPRS與處理器之間通過串口通信。 所述按鍵操作單元3是個4X4的矩陣鍵盤,它與控制器通過8個通用IO相連,用于對整個識別儀的操作。 所述電源模塊7是采用外部5V供電,利用兩片LM1117-33分別將外部輸入的5V轉(zhuǎn)換為2路3. 3V,對控制器和外圍電路器件單獨(dú)供電,單獨(dú)供電最大程度避免了外圍電路給控制器帶來的影響。由于S3C2440需要3. 3V和1. 3V兩種電壓,故再利用一片LM1117-ADJ將3. 3V轉(zhuǎn)成1. 3V。電源模塊7為整個識別儀的各個部分提供5V、3. 3V和1. 3V電壓。
(2)軟件結(jié)構(gòu) 該手持式激光噴碼字符識別儀的軟件架構(gòu)示意圖,如圖2。 軟件結(jié)構(gòu)由系統(tǒng)調(diào)度8、硬件控制模塊10、驅(qū)動模塊11、硬件平臺12、人機(jī)界面模塊13、數(shù)據(jù)庫模塊14、識別算法模塊9等部分組成。系統(tǒng)調(diào)度8負(fù)責(zé)整個軟件系統(tǒng)的任務(wù)調(diào)度,首先,由硬件控制模塊10通過驅(qū)動模塊11控制硬件平臺12將圖像數(shù)據(jù)采集上來,經(jīng)過識別算法模塊9,得到識別結(jié)果,然后通過人機(jī)界面模塊13將其顯示、通過數(shù)據(jù)庫模塊14將結(jié)果存儲,最后通過硬件控制模塊10控制GPRS通信單元5將識別結(jié)果發(fā)送到指定的服務(wù)器。 所述的系統(tǒng)調(diào)度8是指整個軟件系統(tǒng)的核心,它負(fù)責(zé)整個軟件系統(tǒng)的任務(wù)調(diào)度,其它模塊的操作任務(wù)的發(fā)出與控制都是由系統(tǒng)調(diào)度來完成的。 所述硬件控制模塊10是整個系統(tǒng)的硬件控制部分,它控制圖像采集單元4、 GPRS通信單元5、實(shí)時鐘(RTC)和按鍵操作單元3。圖像采集單元4的控制基于自主研發(fā)的攝像頭流接口驅(qū)動,操作的基本流程如圖3所示。GPRS通信單元5采用RS232串口通信方式;實(shí)時鐘(RTC)的控制是采用S3C2440內(nèi)置RTC接口 ,按鍵操作單元3的控制是通過8個通用10,采用查詢的方式,控制4X4的按鍵操作單元3。 所述的驅(qū)動模塊11是硬件控制模塊10與硬件平臺12之間的接口,硬件控制模塊10是通過驅(qū)動模塊11來完成對硬件平臺12的控制。 所述的硬件平臺12是指整個系統(tǒng)的硬件部分,包括攝像頭、GPRS通信單元5、按鍵操作單元3等。 所述數(shù)據(jù)庫模塊14用于將識別結(jié)果存儲,它采用Windows CE自帶的數(shù)據(jù)庫EDB
設(shè)計實(shí)現(xiàn)。其具體流程如圖4所示。首先,先掛載數(shù)據(jù)庫巻;然后打開數(shù)據(jù)庫巻;如果失敗,
則重新創(chuàng)建數(shù)據(jù)庫,再打開數(shù)據(jù)庫,如果成功,則繼續(xù)進(jìn)行數(shù)據(jù)庫操作,如查找數(shù)據(jù)庫、寫記
錄、讀記錄等;如果不再需要進(jìn)行數(shù)據(jù)庫操作,則關(guān)閉數(shù)據(jù)庫,最后卸載數(shù)據(jù)庫巻。 所述人機(jī)界面模塊13實(shí)現(xiàn)用戶與識別儀進(jìn)行人機(jī)交互,它基于MFC對話框方式開
發(fā),實(shí)現(xiàn)了登錄界面,主界面、數(shù)據(jù)庫主界面、數(shù)據(jù)庫編輯界面等主要界面,各個界面之間的
狀態(tài)轉(zhuǎn)換如圖5所示。開始后,首先進(jìn)入到登陸界面,正確登陸之后可以進(jìn)入到主界面,從
主界面可以進(jìn)入到數(shù)據(jù)庫主界面,通過編輯和添加可以進(jìn)入到數(shù)據(jù)庫的編輯界面,在數(shù)據(jù)
庫編輯界面退出可回到數(shù)據(jù)庫主界面,退出數(shù)據(jù)庫主界面可回到系統(tǒng)主界面,在登陸界面
和主界面點(diǎn)退出可以關(guān)閉整個人機(jī)界面。 所述識別算法模塊9是該字符識別儀的軟件部分主體,它包括圖像預(yù)處理、字符
區(qū)域定位、二值化、傾斜矯正、字符分割、特征提取、初步識別、二次識別等。 該圖像預(yù)處理(包含有圖像灰度化、去除噪聲和灰度拉伸)是為了便于后續(xù)的快
速圖像處理,需要先對圖像數(shù)據(jù)進(jìn)行轉(zhuǎn)換,使彩色圖像變?yōu)?56級灰度圖。圖像中不可避免
的含有噪聲,我們采用中值濾波對圖像進(jìn)行預(yù)處理。為了增強(qiáng)背景區(qū)域和字符區(qū)域的對比
度,對圖像進(jìn)行灰度拉伸。 該字符區(qū)域定位是將復(fù)雜背景下的噴碼字符區(qū)域定位出來,這里,由于原圖像是彩色圖像,如果僅在灰度圖像中進(jìn)行處理,會丟失很多有用信息,導(dǎo)致無法將字符區(qū)域準(zhǔn)確的定位出來。因此,本設(shè)計將從灰度圖像和彩色圖像兩個目標(biāo)同時入手,一方面,在灰度圖像中進(jìn)行字符定位,使用紋理分析的方法;另一方面在彩色圖像中進(jìn)行定位,使用顏色聚
10類、同色聯(lián)通域分析的方法。通過以上的方法進(jìn)行分析結(jié)束后,將結(jié)果信息進(jìn)行融合,再加
上先驗(yàn)信息(字符區(qū)域?qū)捀弑仍? : l到7 : i之間,噴碼字符顏色為黑色),將所有這些信息進(jìn)行融合,最終得到?jīng)Q策結(jié)果,即得到字符區(qū)域。 該二值化是對字符區(qū)域內(nèi)的灰度圖像進(jìn)行二值化處理,我們采用最大類間方差
法。即類間方差與類內(nèi)方差比的方法,自適應(yīng)計算灰度閾值,小于此閾值的區(qū)域認(rèn)為是目標(biāo)區(qū)域,大于此閾值的區(qū)域認(rèn)為是背景區(qū)域。 該傾斜矯正是由于攝像頭拍攝角度的問題,可能會帶來一些角度不大的傾斜,對字符識別的結(jié)果造成一定的影響,我們對二值圖像進(jìn)行了自適應(yīng)傾斜矯正。即用hough變換得到字符區(qū)域的傾斜角度,最后根據(jù)字符區(qū)域的傾斜角度采用仿射變換來進(jìn)行矯正。
該字符分割是采用局部區(qū)域最小值法進(jìn)行分割,將字符進(jìn)行垂直投影,在字符粘連范圍的垂直投影值最小處進(jìn)行分割。 該特征提取即提取字符特征。本系統(tǒng)采用統(tǒng)計特征和結(jié)構(gòu)特征相結(jié)合的特征提取方式,以期取得較好的分類效果。將字符圖像劃分為4X4的網(wǎng)格,統(tǒng)計每個區(qū)域中的黑色像素占該區(qū)域總像素數(shù)的比值,形成16維統(tǒng)計特征;將字符圖像分別沿水平和垂直方向投影,求投影的峰值位置,形成2維結(jié)構(gòu)特征,將兩種特征組合形成18維特征作為字符特征。
該初步識別是采用支持向量機(jī)分類算法,對字母和數(shù)字分別建立SVM識別模型。以數(shù)字識別為例,模型可描述為給定訓(xùn)練集,輸入為18維樣本特征輸入,輸出為IO種可能的輸出,通過樣本訓(xùn)練,得到?jīng)Q策函數(shù),使得對于測試樣本,能得出相應(yīng)的輸出結(jié)果,以此作為初步識別結(jié)果。 該二次識別是在初步識別的基礎(chǔ)上,對字符進(jìn)行再次識別。試驗(yàn)發(fā)現(xiàn),對于一些相似的字符,很難一次識別成功,需要進(jìn)行再次識別。主要結(jié)合字符的特殊結(jié)構(gòu)特征對一些相似字符進(jìn)行再次識別,比如長寬比例,區(qū)域封閉性等,以此識別結(jié)果作為最終識別結(jié)果。經(jīng)過二次識別后,可以很有效的提高字符識別率。 識別算法流程如圖6所示,首先,對采集來的圖像進(jìn)行預(yù)處理,包括圖像灰度化、去除噪聲、灰度拉伸;然后進(jìn)行字符區(qū)域定位,將字符所在的區(qū)域定位出來;接下來對字符區(qū)域進(jìn)行二值化處理,得到二值圖像;然后進(jìn)行傾斜校正;對校正后的圖像進(jìn)行字符分割,將整個字符區(qū)域分割成單個的字符;對每一個字符進(jìn)行特征提??;先進(jìn)行字符的初步識別;最后通過二次識別區(qū)分相似的字符;對每一個字符進(jìn)行特征提取、初步識別和二次識別,得到最后的識別結(jié)果。 當(dāng)識別儀工作時,首先手動控制按鍵,通過圖像采集單元4將帶有復(fù)雜背景的激光噴碼字符圖像采集上來;然后將采集到的圖像進(jìn)行預(yù)處理,去除噪聲;然后采用彩色圖像和灰度圖像相結(jié)合的方法,將字符區(qū)域定位出來;緊接著,對圖像進(jìn)行二值化操作;對傾斜的字符整體進(jìn)行傾斜校正;然后把整個字符區(qū)域分割成多個單獨(dú)的字符;對每一個單獨(dú)的字符進(jìn)行特征提取,進(jìn)行字符的初步識別;最后,對相似的、容易混淆的字符進(jìn)行二次識別,得到最終識別結(jié)果。 通過識別算法得到識別結(jié)果之后,通過串口 ,控制GPRS通信單元5,將識別結(jié)果發(fā)送到指定的服務(wù)器,完成整個字符識別儀的全部功能。
1權(quán)利要求
一種手持式的復(fù)雜背景下的激光噴碼字符識別儀,其特征在于該識別儀是由硬件結(jié)構(gòu)和軟件結(jié)構(gòu)兩大部分構(gòu)成一、硬件結(jié)構(gòu)硬件結(jié)構(gòu)由圖像采集單元、圖像處理單元、數(shù)據(jù)存儲單元、液晶顯示單元、GPRS通信單元、按鍵操作單元和電源模塊組成;電源模塊負(fù)責(zé)為該識別儀各個部分供電;按鍵操作單元和液晶顯示單元是人機(jī)接口,負(fù)責(zé)操作命令的輸入和結(jié)果的輸出顯示;圖像采集單元負(fù)責(zé)采集圖像;GPRS通信單元負(fù)責(zé)識別結(jié)果的無線發(fā)送,整個過程是用戶通過按鍵操作單元發(fā)出命令,處理器接收到命令,控制圖像采集單元采集圖像數(shù)據(jù),通過數(shù)據(jù)存儲單元進(jìn)行存儲,然后進(jìn)行圖像識別,最后將識別的結(jié)果通過GPRS通信單元發(fā)送到指定服務(wù)器,同時將結(jié)果存儲到數(shù)據(jù)存儲單元中,便于日后查詢;所述圖像采集單元是一款高集成度、高分辨率的CMOS傳感芯片OV9650,其內(nèi)部集成了時序電路,模擬信號處理電路,數(shù)字信號處理電路;它帶有標(biāo)準(zhǔn)的Serial Camera Control Bus即SCCB接口,通過該接口可實(shí)現(xiàn)各種圖像增強(qiáng)和控制功能,即自動曝光、自動增益、自動白平衡控制以及控制圖像色彩、飽和度、伽馬校正、銳化、鏡頭校準(zhǔn)、噪聲和白像素刪除;所述圖像處理單元是采用三星ARM9 S3C2440處理器;所述數(shù)據(jù)存儲單元是采用一片三星的K9F1208芯片即64M×8bit,用于儲存系統(tǒng)的Boot Loader、OS內(nèi)核鏡像、文件系統(tǒng)和用戶應(yīng)用程序;采用兩片三星的HY57V561620芯片即4M×16bit×4Banks構(gòu)成64MB的SDRAM即同步動態(tài)隨機(jī)存取存儲器,用于加載Windows CE操作系統(tǒng)和運(yùn)行應(yīng)用程序;所述液晶顯示單元是選用夏普的3.5寸TFT觸摸屏LQ035Q7DH01;其中,S3C2440提供LCD接口,將其控制信號、幀同步信號、行同步信號、像素時鐘信號、數(shù)據(jù)輸出使能信號和數(shù)據(jù)信號與LCD對應(yīng)信號相連;將S3C2440的后4通道A與LCD的觸摸屏接口相連,實(shí)現(xiàn)觸點(diǎn)位置的采集;所述GPRS通信單元是采用sim300模塊,它具有三頻GSM即全球移動通訊系統(tǒng)和GPRS功能,內(nèi)嵌TCP/IP協(xié)議,利用GPRS網(wǎng)絡(luò)平臺實(shí)現(xiàn)數(shù)據(jù)信息的透明傳輸,GPRS與處理器之間通過串口通信;所述按鍵操作單元是個4×4的矩陣鍵盤,它與控制器通過8個通用IO相連,用于對整個識別儀的操作;所述電源模塊是采用外部5V供電,利用兩片LM1117-33分別將外部輸入的5V轉(zhuǎn)換為2路3.3V,對控制器和外圍電路器件單獨(dú)供電,單獨(dú)供電最大程度避免了外圍電路給控制器帶來的影響;由于S3C2440需要3.3V和1.3V兩種電壓,故再利用一片LM1117-ADJ將3.3V轉(zhuǎn)成1.3V;電源模塊為整個識別儀的各個部分提供5V、3.3V和1.3V電壓;二、軟件結(jié)構(gòu)軟件結(jié)構(gòu)由系統(tǒng)調(diào)度、硬件控制模塊、驅(qū)動模塊、硬件平臺、人機(jī)界面模塊、數(shù)據(jù)庫模塊和識別算法模塊組成;系統(tǒng)調(diào)度負(fù)責(zé)整個軟件系統(tǒng)的任務(wù)調(diào)度,首先,由硬件控制模塊通過驅(qū)動模塊控制硬件平臺將圖像數(shù)據(jù)采集上來,經(jīng)過識別算法模塊,得到識別結(jié)果,然后通過人機(jī)界面模塊將其顯示、通過數(shù)據(jù)存儲模塊將結(jié)果存儲,最后通過硬件控制模塊的控制GPRS通信單元將識別結(jié)果發(fā)送到指定的服務(wù)器;所述的系統(tǒng)調(diào)度是整個軟件系統(tǒng)的核心,它負(fù)責(zé)整個軟件系統(tǒng)的任務(wù)調(diào)度,其它模塊的操作任務(wù)的發(fā)出與控制都是由系統(tǒng)調(diào)度來完成的;所述硬件控制模塊是整個系統(tǒng)的硬件控制部分,它控制攝像頭、GPRS通信單元、實(shí)時鐘即RTC和鍵盤;攝像頭的控制基于自主研發(fā)的攝像頭流接口驅(qū)動,GPRS通信單元采用RS232串口控制;實(shí)時鐘即RTC的控制是采用S3C2440內(nèi)置RTC接口,鍵盤的控制是通過8個通用IO,采用查詢的方式,控制4×4的矩陣鍵盤;所述的驅(qū)動模塊是硬件控制模塊與硬件平臺之間的接口,硬件控制模塊是通過驅(qū)動模塊來完成對硬件平臺的控制;所述的硬件平臺是指整個系統(tǒng)的硬件部分,包括攝像頭、GPRS通信模塊和按鍵;所述人機(jī)界面模塊實(shí)現(xiàn)用戶與識別儀進(jìn)行人機(jī)交互,它基于MFC對話框方式開發(fā),實(shí)現(xiàn)了登錄界面,主界面、數(shù)據(jù)庫主界面、數(shù)據(jù)庫編輯界面之間的狀態(tài)轉(zhuǎn)換;轉(zhuǎn)換過程是首先進(jìn)入到登陸界面,正確登陸之后進(jìn)入到主界面,從主界面可以進(jìn)入到數(shù)據(jù)庫主界面,通過編輯和添加進(jìn)入到數(shù)據(jù)庫的編輯界面,在數(shù)據(jù)庫編輯界面退出回到數(shù)據(jù)庫主界面,退出數(shù)據(jù)庫主界面回到系統(tǒng)主界面,在登陸界面和主界面點(diǎn)退出后關(guān)閉整個人機(jī)界面;所述數(shù)據(jù)庫模塊用于將識別結(jié)果存儲,它采用Windows CE自帶的數(shù)據(jù)庫EDB設(shè)計實(shí)現(xiàn);其具體流程是先掛載數(shù)據(jù)庫卷,然后打開數(shù)據(jù)庫卷;如果失敗,則重新創(chuàng)建數(shù)據(jù)庫,再打開數(shù)據(jù)庫;如果成功,則繼續(xù)進(jìn)行數(shù)據(jù)庫操作,查找數(shù)據(jù)庫、寫記錄、讀記錄;如果不再需要進(jìn)行數(shù)據(jù)庫操作,則關(guān)閉數(shù)據(jù)庫,最后卸載數(shù)據(jù)庫卷;所述識別算法模塊是該字符識別儀的軟件部分主體,它包括圖像預(yù)處理、字符區(qū)域定位、二值化、傾斜矯正、字符分割、特征提取、初步識別和二次識別;該圖像預(yù)處理含圖像灰度化、去除噪聲和灰度拉伸,是為了便于后續(xù)的快速圖像處理,需要先對圖像數(shù)據(jù)進(jìn)行轉(zhuǎn)換,使彩色圖像變?yōu)?56級灰度圖;圖像中不可避免的含有噪聲,我們采用中值濾波對圖像進(jìn)行預(yù)處理;為了增強(qiáng)背景區(qū)域和字符區(qū)域的對比度,對圖像進(jìn)行灰度拉伸;該字符區(qū)域定位是將復(fù)雜背景下的噴碼字符區(qū)域定位出來,由于原圖像是彩色圖像,如果僅在灰度圖像中進(jìn)行處理,會丟失很多有用信息,無法將字符區(qū)域準(zhǔn)確的定位出來;因此,本設(shè)計將從灰度圖像和彩色圖像兩個目標(biāo)同時入手,一方面,使用紋理分析的方法,在灰度圖像中進(jìn)行字符定位;另一方面使用顏色聚類、同色聯(lián)通域分析的方法,在彩色圖像中進(jìn)行定位;通過以上的方法進(jìn)行分析結(jié)束后,將結(jié)果信息進(jìn)行融合,再加上先驗(yàn)信息即字符區(qū)域?qū)捀弑仍?∶1到7∶1之間,噴碼字符顏色為黑色,將所有這些信息進(jìn)行融合,最終得到?jīng)Q策結(jié)果,即得到字符區(qū)域;該二值化是對字符區(qū)域內(nèi)的灰度圖像進(jìn)行二值化處理,我們采用最大類間方差法,即類間方差與類內(nèi)方差比的方法,自適應(yīng)計算灰度閾值,小于此閾值的區(qū)域認(rèn)為是目標(biāo)區(qū)域,大于此閾值的區(qū)域認(rèn)為是背景區(qū)域;該傾斜矯正是由于攝像頭拍攝角度的問題,可能會帶來一些角度不大的傾斜,對字符識別的結(jié)果造成一定的影響,我們對二值圖像進(jìn)行了自適應(yīng)傾斜矯正;即用hough變換得到字符區(qū)域的傾斜角度,最后根據(jù)字符區(qū)域的傾斜角度采用仿射變換來進(jìn)行矯正;該字符分割是采用局部區(qū)域最小值法進(jìn)行分割,將字符進(jìn)行垂直投影,在字符粘連范圍的垂直投影值最小處進(jìn)行分割;該特征提取即提取字符特征,本系統(tǒng)采用統(tǒng)計特征和結(jié)構(gòu)特征相結(jié)合的特征提取方式,以期取得較好的分類效果;將字符圖像劃分為4×4的網(wǎng)格,統(tǒng)計每個區(qū)域中的黑色像素占該區(qū)域總像素數(shù)的比值,形成16維統(tǒng)計特征;將字符圖像分別沿水平和垂直方向投影,求投影的峰值位置,形成2維結(jié)構(gòu)特征,將兩種特征組合形成18維特征作為字符特征;該初步識別是采用支持向量機(jī)分類算法,對字母和數(shù)字分別建立SVM識別模型;模型可描述為給定訓(xùn)練集,輸入為18維樣本特征輸入,輸出為10種可能的輸出,通過樣本訓(xùn)練,得到?jīng)Q策函數(shù),使得對于測試樣本能得出相應(yīng)的輸出結(jié)果,以此作為初步識別結(jié)果;該二次識別是在初步識別的基礎(chǔ)上,對字符進(jìn)行再次識別;對于一些相似的字符,很難一次識別成功,需要進(jìn)行再次識別;主要結(jié)合字符的特殊結(jié)構(gòu)特征對一些相似字符進(jìn)行再次識別,以此識別結(jié)果作為最終識別結(jié)果;經(jīng)過二次識別后,可以很有效的提高字符識別率;所述識別算法流程是,先對采集來的圖像進(jìn)行預(yù)處理,包括圖像灰度化、去除噪聲、灰度拉伸;然后進(jìn)行字符區(qū)域定位,將字符所在的區(qū)域定位出來;接下來對字符區(qū)域進(jìn)行二值化處理,得到二值圖像;然后進(jìn)行傾斜校正;對校正后的圖像進(jìn)行字符分割,將整個字符區(qū)域分割成單個的字符;對每一個字符進(jìn)行特征提??;先進(jìn)行字符的初步識別;最后通過二次識別區(qū)分相似的字符;對每一個字符進(jìn)行特征提取、初步識別和二次識別,得到最后的識別結(jié)果。
全文摘要
本發(fā)明一種手持式的復(fù)雜背景下的激光噴碼字符識別儀,它是由硬件結(jié)構(gòu)和軟件結(jié)構(gòu)兩大部分構(gòu)成硬件結(jié)構(gòu)由圖像采集單元、圖像處理單元、數(shù)據(jù)存儲單元、液晶顯示單元、GPRS通信單元、按鍵操作單元、電源模塊等部分組成;軟件結(jié)構(gòu)由系統(tǒng)調(diào)度、硬件控制模塊、驅(qū)動模塊、硬件平臺、人機(jī)界面模塊、數(shù)據(jù)庫模塊、識別算法模塊等部分組成。它采用嵌入式設(shè)計將圖像采集功能、數(shù)字圖像識別功能、基于GPRS的數(shù)據(jù)發(fā)送功能集成于一體,可以現(xiàn)場對目標(biāo)進(jìn)行圖像采集和快速自動識別,并將識別結(jié)果通過GPRS通信單元發(fā)送到指定服務(wù)器。該識別儀操作簡單,使用方便,在模式識別檢測類裝置技術(shù)領(lǐng)域里具有廣泛地實(shí)用價值和應(yīng)用前景。
文檔編號G06K9/62GK101706875SQ20091023817
公開日2010年5月12日 申請日期2009年11月17日 優(yōu)先權(quán)日2009年11月17日
發(fā)明者左廷濤, 張柳軍, 田立巖, 胡曉光 申請人:北京航空航天大學(xué)