基于智能終端、ocr技術(shù)的集裝箱信息自動采集系統(tǒng)的制作方法
【專利摘要】本發(fā)明涉及一項(xiàng)基于智能終端、OCR技術(shù)的集裝箱箱號采集系統(tǒng)。該系統(tǒng)利用移動智能終端的移動性、可編程性,結(jié)合目前已經(jīng)成熟的OCR技術(shù),打造出一個(gè)自動采集集裝箱信息的系統(tǒng),為集裝箱物流的智能化、自動化提供簡便、高效的集裝箱信息自動采集系統(tǒng)。本發(fā)明具有自動采集集裝箱信息,差錯率低、可靠性高、開發(fā)難度小,實(shí)現(xiàn)效率高的特點(diǎn)。能夠廣泛應(yīng)用于交通物流、海關(guān)監(jiān)管等方面,同時(shí)還可以結(jié)合集裝箱物流信息的電子化,進(jìn)行電子數(shù)據(jù)的自動發(fā)送,為打造智能物流提供基礎(chǔ)的數(shù)據(jù)源。
【專利說明】基于智能終端、OCR技術(shù)的集裝箱信息自動采集系統(tǒng)
[0001]本發(fā)明涉及一項(xiàng)基于智能終端、OCR技術(shù)的集裝箱箱號采集系統(tǒng)。該系統(tǒng)利用移動智能終端的移動性、可編程性,結(jié)合目前已經(jīng)成熟的OCR技術(shù),打造出一個(gè)自動采集集裝箱信息的系統(tǒng),為集裝箱物流的智能化、自動化提供簡便、高效的集裝箱信息自動采集系統(tǒng)。
【背景技術(shù)】
[0002]集裝箱信息主要包括集裝箱箱號、集裝箱箱型代碼、集裝箱鉛封號三個(gè)方面的內(nèi)容。
[0003]集裝箱箱號是集裝箱運(yùn)輸過程當(dāng)中最為主要的識別依據(jù),采用IS06346 (1995)標(biāo)準(zhǔn)的集裝箱,其箱號是由11位編碼組成(見附圖1),包括三個(gè)部分:
1、第一部分由4位英文字母組成。
[0004]2、第二部分由6位數(shù)字組成。
[0005]3、第三部分為校驗(yàn)碼,是由前4位字母和6位數(shù)字經(jīng)過校驗(yàn)規(guī)則運(yùn)算得到,用于識別在校驗(yàn)時(shí)是否發(fā)生錯誤,即第11位數(shù)字。具體的檢驗(yàn)規(guī)則如下:集裝箱編號共11位,前四位是字母,最后一位為校驗(yàn)碼。舉例如◎◎◎◎ X X X X X X X。字母取數(shù)值規(guī)則為:A = 10,B至K依次取12至21,L至U依次取23至32,V至Z依次取34至38。箱號第一位的值乘以2的O次冪,第二位乘以2的I次冪,...以此類推,第十位乘以2的9次冪,然后求和。其和除以11的余數(shù)即為校驗(yàn)碼的值,當(dāng)余數(shù)為10時(shí),校驗(yàn)碼也為O。
[0006]集裝箱的箱型代碼是按照ISO 6364.2中第6章“標(biāo)記的標(biāo)志方法”,箱型和尺寸代碼應(yīng)作為一個(gè)整體在集裝箱上標(biāo)識。其組配代碼結(jié)構(gòu)為:四位字母或者數(shù)字,兩位為箱型代碼另外兩位為尺寸代碼(見附圖1)。例如:20BK代表20英尺的散裝貨箱,40TK代表40英尺罐式箱。
集裝箱鉛封是貨物裝入集裝箱并正確地關(guān)閉箱門后,由特定人員施加的類似于鎖扣的設(shè)備。鉛封根據(jù)施加人員不同可分為海關(guān)封識、商檢封識和商業(yè)封識。鉛封一經(jīng)正確鎖上,除非暴力破壞(即剪開)否則無法打開,同時(shí)破壞后的鉛封無法重新使用。每個(gè)鉛封上都有唯一的編號標(biāo)識,叫做鉛封號。鉛封號是由一串的字母以及數(shù)字組成(見附圖2)。
[0007]集裝箱箱號、集裝箱箱型代碼、集裝箱鉛封號這些集裝箱信息都是集裝箱運(yùn)輸過程當(dāng)中非常重要的內(nèi)容,當(dāng)前國家正在積極推行貿(mào)易信息的無紙化,也就是利用電子數(shù)據(jù)進(jìn)行貿(mào)易數(shù)據(jù)的傳輸,以及作為海關(guān)通關(guān)的重要依據(jù),集裝箱箱號、集裝箱封簽號都是構(gòu)成海關(guān)通關(guān)電子數(shù)據(jù)的主要內(nèi)容,是海關(guān)進(jìn)行監(jiān)管中所必須申報(bào)的,如果發(fā)生集裝箱箱號錄入錯誤或者封簽號錄入錯誤,勢必影響貿(mào)易的正常進(jìn)行。
[0008]與此同時(shí),集裝箱箱號、集裝箱鉛封號作為海運(yùn)提單的一部分,是收發(fā)貨人權(quán)利責(zé)任劃分的重要依據(jù),如果集裝箱箱號、鉛封號與實(shí)物不一致,勢必影響收貨人的提貨以及發(fā)貨人貨款的兌付。
[0009]還有,集裝箱箱號、箱型代碼的準(zhǔn)確與否,還關(guān)系集裝箱所有人對于自身集裝箱的調(diào)配、管理、調(diào)劑的效率。因?yàn)橄湫痛a能夠反映出集裝箱的裝貨容積、裝貨類型,裝貨重量等方面的內(nèi)容。集裝箱所有人通過對于集裝箱箱號、箱型的管理能夠有效調(diào)劑運(yùn)力,分配集裝箱倉位,實(shí)現(xiàn)經(jīng)濟(jì)效益的最大化。
[0010]由此可見,集裝箱信息準(zhǔn)確與否不僅關(guān)系到收/發(fā)貨人的貿(mào)易的正常履行,而且還關(guān)系到貨物能否正常順利通關(guān)以及關(guān)系到集裝箱所有人的自身管理效率。
[0011]在實(shí)際的使用過程中,集裝箱信息的輸入主要是通過鍵盤手工進(jìn)行錄入,雖然集裝箱箱號是帶有檢驗(yàn)規(guī)則,但是在實(shí)際的使用中人工錄入的差錯率還是比較高的,在集裝箱箱型代碼和鉛封號碼由于沒有校驗(yàn)規(guī)則,人工錄入的差錯率就更高了。
[0012]OCR (Optical Character Recognition,光學(xué)字符識別),是指電子設(shè)備(例如掃描儀或數(shù)碼相機(jī))檢查紙上打印的字符,通過檢測暗、亮的模式確定其形狀,然后用字符識別方法將形狀翻譯成計(jì)算機(jī)文字的過程;即,對文本資料進(jìn)行掃描,然后對圖像文件進(jìn)行分析處理,獲取文字及版面信息的過程。目前OCR技術(shù)已經(jīng)很成熟,除了英文字母以及數(shù)字之外還能夠識別出中文的印刷體,甚至中文手寫體的也能到準(zhǔn)確的識別。目前已經(jīng)有多家公司推出了基于各種操作系統(tǒng)的OCR開發(fā)包(OCR SDK),便于用戶進(jìn)行高效的二次開發(fā)應(yīng)用,目前網(wǎng)絡(luò)上比較成熟的OCR SDK的供應(yīng)商有:文通OCR SDK,ABBYY OCR SDK,云脈OCR SDK等多款成熟的開發(fā)包。
[0013]利用OCR進(jìn)行字符采集的優(yōu)勢:處理字符數(shù)度快,準(zhǔn)確性高。尤其是對于識別技術(shù)非常成熟的英文字符和阿拉伯?dāng)?shù)字的識別率可以達(dá)到99%以上。印刷在集裝箱上的集裝箱箱號、集裝箱箱型代碼、集裝箱鉛封號等集裝箱信息都是按照ISO規(guī)定,由英文字符、阿拉伯?dāng)?shù)字的標(biāo)準(zhǔn)字體構(gòu)成的。
[0014]智能終端是指具有獨(dú)立的操作系統(tǒng),能夠安裝各種應(yīng)用程序,通常具有圖像以及動態(tài)影像的拍攝功能,具備無線接入互聯(lián)網(wǎng)的功能,具備終端時(shí)間獲取功能,具備終端識別功能,能夠進(jìn)行智能終端的終端地理定位(可以利用衛(wèi)星定位、WIFI無線網(wǎng)絡(luò)定位、移動基站定位)。目前的智能手機(jī)都屬于智能終端,主要的智能手機(jī)操作系統(tǒng)有蘋果手機(jī)的IOS操作系統(tǒng),安卓手機(jī)的Android操作系統(tǒng),微軟的Windows Phone操作系統(tǒng),黑莓手機(jī)的BlackBerry系統(tǒng),諾基亞的Symbian系統(tǒng)和Asha系統(tǒng)。目前智能終端的數(shù)量和普及率都已經(jīng)大大提高,據(jù)統(tǒng)計(jì),2012年全球的智能手機(jī)出貨量超過7億部。另外根據(jù)市場研究公司尼爾森發(fā)布的《2013移動消費(fèi)者報(bào)告》顯示,中國智能手機(jī)的普及率達(dá)66%。據(jù)IT調(diào)查咨詢機(jī)構(gòu)IDC于2013年9月23日發(fā)布的消息稱,2014年中國智能手機(jī)的出貨量將達(dá)4.5億部。除此之外,智能終端還包括目前的平板電腦、iPad、谷歌眼鏡、智能手表,這些可移動的智能終端的出貨量也在快速增長當(dāng)中。由此可見,智能終端正處在高速普及當(dāng)中,個(gè)人擁有智能終端的數(shù)量也在不斷攀升當(dāng)中。
[0015]智能終端具有移動性、便于攜帶型、能夠安裝應(yīng)用程序,普遍具備圖像/影像拍攝功能。
[0016]中國專利公布了 CN200910170227.X的“一種集裝箱箱號識別方法”,該專利的不足之處在于:
1:該項(xiàng)專利實(shí)用性不強(qiáng)。根據(jù)該項(xiàng)專利的說明書第七頁所述,“將包含集裝箱箱號的圖片,經(jīng)過圖像處理技術(shù)切割出有用的箱號,并對切割出箱號再次進(jìn)行圖像的標(biāo)準(zhǔn)化”,這一表述首先就有問題,用何種標(biāo)準(zhǔn)切割出箱號的圖片,計(jì)算機(jī)如何判斷出源圖片哪一部分包含著集裝箱箱號,用哪種技術(shù)手段能夠切割出“有用的”的箱號,是靠人工干預(yù)來操作還是電腦自動判斷來切割?這個(gè)在說明書中都沒有提到,眾所周知,在集裝箱表面,除了印刷有集裝箱號,在集裝箱箱門上印刷內(nèi)容還包含箱號、箱型代碼、最大承載重量、皮重、容積等等信息(集裝箱圖片見附圖1)。如果靠電腦自動判斷集裝箱箱號的圖片,不僅計(jì)算復(fù)雜,而且容易出錯。如果靠人工來裁剪出箱號的圖片,則又失去箱號識別的意義,因?yàn)槿斯聿眉舫鱿涮柕膱D片,不僅僅需要人工來操作,還需要借助電腦等輔助設(shè)備來進(jìn)行,工作量比直接靠人工來錄入11位箱號更為繁瑣、更容易出錯,失去了實(shí)際應(yīng)用上的意義。包含箱號的圖片“切割”不出來,那該項(xiàng)專利所有后續(xù)的內(nèi)容都失去了意義。
[0017]2:算法復(fù)雜,實(shí)現(xiàn)難度較大,實(shí)際使用效果尚待檢驗(yàn)。該項(xiàng)專利,利用神經(jīng)網(wǎng)絡(luò)技術(shù)和歐氏距離法對圖片中進(jìn)行識別。在實(shí)際應(yīng)用中需要按照這一專利來實(shí)現(xiàn)集裝箱箱號的識別,對于技術(shù)人員來說,實(shí)現(xiàn)的過程較為復(fù)雜,實(shí)現(xiàn)時(shí)間較長。同時(shí)按照該項(xiàng)專利技術(shù)在實(shí)際的應(yīng)用方面的實(shí)現(xiàn)效果如何、識別的速度高低、準(zhǔn)確性與否還有待檢驗(yàn)。
[0018]
【發(fā)明內(nèi)容】
本發(fā)明是建立在智能終端上,利用智能終端的移動性、可編程性以及圖像/影像的拍攝功能,借助技術(shù)成熟的OCR技術(shù),建立起一個(gè)便捷、高效、準(zhǔn)確性高的集裝箱信息自動采集系統(tǒng)。
[0019]該系統(tǒng)的實(shí)施步驟如下:
1:該系統(tǒng)調(diào)用智能終端上的攝像頭的拍攝功能,在智能終端的取景觀察屏幕上構(gòu)建一個(gè)固定的區(qū)域(該固定區(qū)域的功能是框選出集裝箱箱號的區(qū)域),通過調(diào)整智能終端的鏡頭、焦距、位置等方法,在集裝箱的箱號都能夠被框選在該固定區(qū)域中之后,進(jìn)行拍攝獲取圖像資料。
[0020]2:針對固定區(qū)域內(nèi)的圖像資料,利用OCR SDK開發(fā)包中應(yīng)用進(jìn)行OCR識別,獲取集裝箱箱號的字符和數(shù)字信息。
[0021]3:針對OCR識別獲取的字符和數(shù)字信息,進(jìn)行集裝箱箱號的排序校驗(yàn),集裝箱型號規(guī)則為前面四位為大寫的英文字母,后面7位為阿拉伯?dāng)?shù)字。
[0022]4:針對OCR識別獲取的字符和數(shù)字信息,根據(jù)ISO組織對于標(biāo)準(zhǔn)集裝箱的要求,集裝箱箱號的最后一位為校驗(yàn)位,該位數(shù)值須用方框框出(見附圖1)。利用這一特性,對于集裝箱箱號的順序進(jìn)行再次校驗(yàn)。
[0023]5:將上述校驗(yàn)通過的字符和數(shù)字信息排序后,利用集裝箱箱號的校驗(yàn)規(guī)則,再次進(jìn)行檢驗(yàn),如果通過,則將經(jīng)過處理的集裝箱箱號信息輸出,完成對于集裝箱箱號的自動采集。如果校驗(yàn)不通過,可以用手工錄入來進(jìn)行補(bǔ)錄,作為自動采集箱號的應(yīng)急補(bǔ)充。
[0024]6:根據(jù)系統(tǒng)需要,按照步驟I的方法,針對集裝箱箱型代碼進(jìn)行自動采集。通過OCR識別獲取的集裝箱箱型代碼可以與ISO 6364.2中的箱型代碼表進(jìn)行核對校驗(yàn),如果符合就可以將經(jīng)過處理的箱型代碼輸出,完成對于集裝箱箱號的自動采集。如果校驗(yàn)不通過,也可以采用手工錄入的方式進(jìn)行補(bǔ)錄,作為自動采集箱型代碼的應(yīng)急補(bǔ)充。
[0025]7:根據(jù)系統(tǒng)需要,按照步驟I的方法,針對集裝箱鉛封號進(jìn)行自動采集,可以在智能終端的取景屏幕上構(gòu)建一個(gè)固定區(qū)域,因?yàn)殂U封較小,便于翻轉(zhuǎn),可以將鉛封號按照固定順序進(jìn)行放置在固定區(qū)域中,進(jìn)行OCR識別,將獲得的鉛封號信息輸出完成對于集裝箱鉛封號碼的自動采集。
【專利附圖】
【附圖說明】[0026]附圖1是集裝箱箱號和集裝箱箱型代碼的實(shí)例。
[0027]附圖2是集裝箱鉛封號的具體實(shí)例。
[0028]附圖3是本發(fā)明中關(guān)于集裝箱箱號自動采集地實(shí)施流程。
具體實(shí)施例
[0029]下面結(jié)合附圖針對本發(fā)明進(jìn)行進(jìn)一步說明。
[0030]附圖3是本發(fā)明中關(guān)于集裝箱箱號自動采集的實(shí)施流程。進(jìn)行集裝箱箱號的自動采集,首先需要調(diào)用智能終端的攝像頭功能,同時(shí)在智能終端的取景器(一般就是智能終端的顯示屏幕)上構(gòu)建一個(gè)固定區(qū)域。
[0031]調(diào)整智能終端的焦距、鏡頭、距離等方式,使得需采集箱號的集裝箱箱號能夠在該固定區(qū)域中顯示,在箱號能夠全部容納入該固定區(qū)域中后,對于固定區(qū)域內(nèi)的集裝箱箱號進(jìn)行拍攝。
[0032]拍攝之后,利用OCR技術(shù)對于拍攝的圖片進(jìn)行分析識別,獲取其中的英文字符和阿拉伯?dāng)?shù)字。
[0033]根據(jù)集裝箱箱號的規(guī)則進(jìn)行首次排序:前面四位是英文字母,后面七位是阿拉伯?dāng)?shù)字的特點(diǎn),對于識別出的英文字符、阿拉伯?dāng)?shù)字進(jìn)行排序。
[0034]根據(jù)ISO標(biāo)準(zhǔn),集裝箱箱號最后一位是校驗(yàn)位,該校驗(yàn)位都要用方框框住(見附圖1),利用這一特性,對于識別出的英文字符、阿拉伯?dāng)?shù)字的排序進(jìn)行再次確認(rèn)。
[0035]利用集裝箱箱號的校驗(yàn)規(guī)則,對于識別出來的集裝箱箱號的英文字符、阿拉伯?dāng)?shù)字進(jìn)行校驗(yàn)。如果校驗(yàn)通過,則說明集裝箱箱號自動采集順利完成。如果校驗(yàn)不通過說明OCR識別或者排序上存在問題,可以用手工補(bǔ)錄的方式進(jìn)行集裝箱箱號的采集。
[0036]集裝箱箱型代碼、集裝箱鉛封號的自動采集也按照上述在取景器上構(gòu)建一個(gè)固定區(qū)域,通過調(diào)整智能終端或者調(diào)整集裝箱鉛封位置的方法,使得被采集字符、數(shù)字被固定區(qū)域容納后進(jìn)行OCR識別,從而自動獲取集裝箱代碼和鉛封號的信息。
[0037]本發(fā)明的有益之處在于:
1:全部自動采集,差錯率低。目前的OCR技術(shù)已經(jīng)非常成熟,已經(jīng)能夠針對中文甚至中文手寫體進(jìn)行高準(zhǔn)確度的識別,而集裝箱信息(包含集裝箱箱號、集裝箱箱型代碼、集裝箱鉛封號)的內(nèi)容都是由簡單的英文字母、阿拉伯?dāng)?shù)字印刷體構(gòu)成,而且根據(jù)ISO要求,這些信息都必須完整規(guī)范準(zhǔn)確,因此采用OCR技術(shù)進(jìn)行識別在技術(shù)層面上是非常簡單。同時(shí),在進(jìn)行集裝箱箱號、集裝箱箱型代碼、集裝箱鉛封號采集時(shí),使用了固定區(qū)域的采集方式,將大量容易干擾的數(shù)據(jù)篩除,不僅減少了 OCR識別的計(jì)算量,提高了運(yùn)算速度,而且大大提高了OCR識別的準(zhǔn)確度。
[0038]2:可靠性高。集裝箱箱號構(gòu)成是有一定的規(guī)則,利用這些規(guī)則在前面基礎(chǔ)上進(jìn)行校驗(yàn),大大減少了識別錯誤的產(chǎn)生幾率,提高了可靠性。同時(shí)還結(jié)合了手工補(bǔ)錄的方法,能夠確保集裝箱信息采集的順利完成。
[0039]3:開發(fā)難度小,實(shí)現(xiàn)效率高。本發(fā)明是利用了智能終端的內(nèi)部的攝像頭、結(jié)合了目前通用的OCR SDK的開發(fā)包,能夠高效地進(jìn)行開發(fā),應(yīng)用于集裝箱信息的自動采集。同時(shí)智能終端具有移動性,非常適合集裝箱運(yùn)輸?shù)牧鲃有?。能夠?qū)崿F(xiàn)全方位的數(shù)據(jù)采集。
[0040]4:可以配合目前物流信息的電子化趨勢,為打造智能物流提供基礎(chǔ)的數(shù)據(jù)源。
【權(quán)利要求】
1.本發(fā)明涉及一項(xiàng)基于智能終端、OCR技術(shù)的集裝箱箱號采集系統(tǒng),該系統(tǒng)調(diào)用智能終端的攝像頭,結(jié)合成熟的OCR識別技術(shù),建立起一個(gè)便捷、高效、準(zhǔn)確性高的集裝箱信息自動米集系統(tǒng)。
2.基于權(quán)利要求1所述,在智能終端的取景觀察屏幕上構(gòu)建一個(gè)固定的區(qū)域,通過調(diào)整智能終端的鏡頭、焦距、位置等方法,使得需采集的集裝箱信息能夠被框選在該固定區(qū)域中之后,進(jìn)行拍攝獲取圖像資料。
3.基于權(quán)利要求1所述,針對獲取的圖像資料,利用OCR技術(shù)進(jìn)行OCR識別,獲取集裝箱信息中的字符和數(shù)字信息。
4.基于權(quán)利要求1所述,根據(jù)集裝箱箱號的規(guī)則進(jìn)行首次排序:前面四位是英文字母,后面七位是阿拉伯?dāng)?shù)字的特點(diǎn),對于識別出的英文字符、阿拉伯?dāng)?shù)字進(jìn)行排序。
5.基于權(quán)利要求1所述,根據(jù)ISO標(biāo)準(zhǔn),集裝箱箱號最后一位是校驗(yàn)位,該校驗(yàn)位都要用方框框住(見附圖1),利用這一特性,對于識別出的英文字符、阿拉伯?dāng)?shù)字的排序進(jìn)行再次確認(rèn)。
6.基于權(quán)利要求1所述,利用集裝箱箱號的校驗(yàn)規(guī)則,對于識別出來的集裝箱箱號的英文字符、阿拉伯?dāng)?shù)字進(jìn)行校驗(yàn)。
7.如果校驗(yàn)通過,則說明集裝箱箱號自動采集順利完成,如果校驗(yàn)不通過說明OCR識別或者排序上存在問題,可以用手工補(bǔ)錄的方式進(jìn)行集裝箱箱號的采集。
8.基于權(quán)利要求1所述,針對鉛封號的自動采集,可以將鉛封號按照固定順序進(jìn)行放置在固定區(qū)域中,進(jìn)行OCR識別,將獲得的鉛封號信息輸出完成對于集裝箱鉛封號碼的自動采集。
9.基于權(quán)利要求1所述,集裝箱箱型代碼、集裝箱鉛封號的自動采集也按照上述在取景器上構(gòu)建一個(gè)固定區(qū)域,通過調(diào)整智能終端或者調(diào)整集裝箱鉛封位置的方法,使得被采集字符、數(shù)字被固定區(qū)域容納后進(jìn)行OCR識別,從而自動獲取集裝箱箱型代碼和鉛封號的信息。
【文檔編號】G06K17/00GK103530758SQ201310528265
【公開日】2014年1月22日 申請日期:2013年10月31日 優(yōu)先權(quán)日:2013年10月31日
【發(fā)明者】鄭恒強(qiáng), 鄧櫻芳 申請人:鄭恒強(qiáng)