本發(fā)明屬于文本識(shí)別檢測(cè)技術(shù)領(lǐng)域,具體涉及一種多過(guò)程匹配煙用材料使用物質(zhì)識(shí)別方法及裝置。
背景技術(shù):
煙用材料是指卷煙生產(chǎn)所使用的材料,包括卷煙紙、卷煙紙鋼印印刷油墨、濾棒成形紙、煙用接裝紙、煙用內(nèi)襯紙、煙用框架紙、包裝紙(條與盒)、封簽紙、煙用水基膠、煙用熱熔膠、煙用二醋酸纖維素絲束、煙用聚丙烯纖維絲束和煙用三乙酸甘油酯。
煙用材料使用物質(zhì)是指在煙用材料生產(chǎn)過(guò)程中所使用的原材料和為滿足預(yù)期用途添加的有助于改善其品質(zhì)、特性或輔助改善品質(zhì)、特性的物質(zhì),以及為促進(jìn)生產(chǎn)過(guò)程的順利進(jìn)行而不是為了改善終產(chǎn)品品質(zhì)、特性所添加的加工助劑。
煙用材料的使用直接影響到卷煙產(chǎn)品的安全性。煙草企業(yè)制定了允許使用的物質(zhì)名單。所有進(jìn)入卷煙產(chǎn)品的煙用材料都必須以標(biāo)準(zhǔn)為依據(jù),進(jìn)行符合性審查。目前,煙用材料許可物質(zhì)審核采用人工審核的方式,對(duì)供應(yīng)商上報(bào)的煙用材料批次物質(zhì)信息逐條進(jìn)行符合性審查,由于煙用材料種類眾多、許可使用物質(zhì)類別多樣、上報(bào)煙用材料許可物質(zhì)數(shù)據(jù)缺乏規(guī)范性等原因,審查工作量巨大,給審核人員帶來(lái)了極大的不便。而且,煙草材料的標(biāo)準(zhǔn)不統(tǒng)一,形式多樣,很難進(jìn)行識(shí)別匹配。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的是提供一種多過(guò)程匹配煙用材料使用物質(zhì)識(shí)別方法及裝置,以解決現(xiàn)有技術(shù)中因煙草材料的標(biāo)準(zhǔn)不統(tǒng)一、形式各樣,很難進(jìn)行識(shí)別匹配的問(wèn)題。
為解決上述技術(shù)問(wèn)題,本發(fā)明的技術(shù)方案是:
本發(fā)明提供一種智能的多過(guò)程匹配煙用材料使用物質(zhì)識(shí)別方法,包括如下方法方案:
方法方案一,包括如下步驟:
1)掃描并識(shí)別煙草材料紙質(zhì)文件或圖片中的煙用材料的信息;
2)將識(shí)別出的煙用材料的信息與煙用材料許可標(biāo)準(zhǔn)數(shù)據(jù)庫(kù)進(jìn)行匹配,若匹配成功,則將結(jié)果進(jìn)行顯示;其中,煙用材料許可標(biāo)準(zhǔn)數(shù)據(jù)庫(kù)存儲(chǔ)的是允許的煙用材料使用物質(zhì)的信息;
3)若匹配不成功,則將煙草材料的信息與歷史經(jīng)驗(yàn)庫(kù)進(jìn)行匹配,若匹配成功,則將結(jié)果進(jìn)行顯示;其中,歷史經(jīng)驗(yàn)庫(kù)存儲(chǔ)的是以前匹配成功或不成功的煙用材料使用物質(zhì)的信息。
方法方案二,在方法方案一的基礎(chǔ)上,還包括將與歷史經(jīng)驗(yàn)庫(kù)匹配的結(jié)果存儲(chǔ)到歷史經(jīng)驗(yàn)庫(kù)的步驟。
方法方案三、四,分別在方法方案一、方法方案二的基礎(chǔ)上,將煙用材料的信息與歷史經(jīng)驗(yàn)庫(kù)進(jìn)行匹配時(shí),對(duì)煙用材料的信息的特征集合采用公式
來(lái)度量,按照匹配相似度由高到低將結(jié)果進(jìn)行顯示;其中,Ci為特征集合簇類的中心,x為簇的集合分布點(diǎn),k為特征數(shù)據(jù)集合數(shù),E為結(jié)果的最優(yōu)值。
方法方案五、六,分別在方法方案一、方法方案二的基礎(chǔ)上,通過(guò)OCR識(shí)別來(lái)識(shí)別煙草材料紙質(zhì)文件或圖片中的煙用材料的信息。
本發(fā)明還提供一種多過(guò)程匹配煙用材料使用物質(zhì)識(shí)別裝置,包括如下裝置方案:
裝置方案一,包括如下模塊:
用于掃描并識(shí)別煙草材料紙質(zhì)文件或圖片中的煙用材料的信息的模塊;
用于將識(shí)別出的煙用材料的信息與煙用材料許可標(biāo)準(zhǔn)數(shù)據(jù)庫(kù)進(jìn)行匹配,若匹配成功,則將結(jié)果進(jìn)行顯示的模塊;其中,煙用材料許可標(biāo)準(zhǔn)數(shù)據(jù)庫(kù)存儲(chǔ)的是允許的煙用材料使用物質(zhì)的信息;
用于若匹配不成功,則將煙草材料的信息與歷史經(jīng)驗(yàn)庫(kù)進(jìn)行匹配,若匹配成功,則將結(jié)果進(jìn)行顯示的模塊;其中,歷史經(jīng)驗(yàn)庫(kù)存儲(chǔ)的是以前匹配成功或不成功的煙用材料使用物質(zhì)的信息。
裝置方案二,在裝置方案一的基礎(chǔ)上,還包括用于將與歷史經(jīng)驗(yàn)庫(kù)匹配的結(jié)果存儲(chǔ)到歷史經(jīng)驗(yàn)庫(kù)的模塊。
裝置方案三、四,分別在裝置方案一、裝置方案二的基礎(chǔ)上,將煙用材料的信息與歷史經(jīng)驗(yàn)庫(kù)進(jìn)行匹配時(shí),對(duì)煙用材料的信息的特征集合采用公式
來(lái)度量,按照匹配相似度由高到低將結(jié)果進(jìn)行顯示;其中,Ci為特征集合簇類的中心,x為簇的集合分布點(diǎn),k為特征數(shù)據(jù)集合數(shù),E為結(jié)果的最優(yōu)值。
裝置方案五、六,分別在裝置方案一、裝置方案二的基礎(chǔ)上,通過(guò)OCR識(shí)別來(lái)識(shí)別煙草材料紙質(zhì)文件或圖片中的煙用材料的信息。
本發(fā)明的有益效果是:
本發(fā)明的多過(guò)程匹配煙用材料使用物質(zhì)識(shí)別方法及裝置,在識(shí)別出煙用材料的信息后,首先快速檢索查詢煙用材料許可標(biāo)準(zhǔn)庫(kù),將煙用材料的信息與標(biāo)準(zhǔn)庫(kù)中進(jìn)行匹配,若匹配不成功,繼續(xù)將煙用材料的信息與構(gòu)建的歷史經(jīng)驗(yàn)庫(kù)進(jìn)行匹配,實(shí)現(xiàn)煙用材料使用物質(zhì)文本信息的智能匹配和預(yù)測(cè)。解決了現(xiàn)有技術(shù)中采用人工審核的方式對(duì)煙用材料許可物質(zhì)進(jìn)行審核工作量大、審核不準(zhǔn)確的問(wèn)題,可以提高煙用材料審核人員的工作效率,降低人工審核帶來(lái)的差錯(cuò)率。
而且,因煙用材料許可標(biāo)準(zhǔn)數(shù)據(jù)庫(kù)不一定能夠囊括所有的煙用材料的化學(xué)式、英文名稱、俗名等等,一次匹配過(guò)程往往很難匹配出結(jié)果,所以,構(gòu)建了具有自學(xué)習(xí)功能的歷史經(jīng)驗(yàn)庫(kù),在與煙用材料許可標(biāo)準(zhǔn)數(shù)據(jù)庫(kù)匹配不成功的情況下,再與歷史經(jīng)驗(yàn)庫(kù)進(jìn)行二次匹配,使得匹配準(zhǔn)確度得到提升。
附圖說(shuō)明
圖1是本發(fā)明的主要組成部分結(jié)構(gòu)示意圖;
圖2是本發(fā)明主要組成部分網(wǎng)絡(luò)連接關(guān)系示意圖;
圖3是本發(fā)明的流程圖;
圖4是供應(yīng)商提供的紙質(zhì)物質(zhì)成分圖;
圖5是煙用材料許可標(biāo)準(zhǔn)數(shù)據(jù)庫(kù)示意圖;
圖6是歷史經(jīng)驗(yàn)庫(kù)示意圖;
圖7是匹配結(jié)果圖。
具體實(shí)施方式
為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖及實(shí)施例,對(duì)本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說(shuō)明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
如圖1所示,本發(fā)明主要包括:手持設(shè)備和服務(wù)器端。其中手持設(shè)備包括手持掃描模塊、第一數(shù)據(jù)收發(fā)模塊、終端顯示模塊;服務(wù)器端包括OCR識(shí)別模塊、第二數(shù)據(jù)收發(fā)模塊、智能匹配模塊、煙用材料許可標(biāo)準(zhǔn)數(shù)據(jù)庫(kù)模塊和匹配經(jīng)驗(yàn)?zāi)K。
具體的:
手持掃描模塊,用于掃描煙用材料使用物質(zhì)化學(xué)文本信息、圖片信息或文本及圖片組合信息,還用于對(duì)終端顯示的匹配結(jié)果信息進(jìn)行確認(rèn)。
第一數(shù)據(jù)收發(fā)模塊,用于將手持設(shè)備發(fā)送過(guò)來(lái)掃描圖片數(shù)據(jù)發(fā)送到服務(wù)器端,進(jìn)行智能匹配處理,還用于接收傳回的匹配結(jié)果。
第二數(shù)據(jù)收發(fā)模塊,用于接收從手持設(shè)備發(fā)送過(guò)來(lái)的圖片數(shù)據(jù)信息,還用于發(fā)送匹配結(jié)果信息到手持設(shè)備。
OCR識(shí)別模塊,用于將第一數(shù)據(jù)收發(fā)模塊發(fā)送來(lái)的圖片數(shù)據(jù)進(jìn)行掃描識(shí)別,識(shí)別圖片中的具體煙用材料信息。
煙用材料許可標(biāo)準(zhǔn)數(shù)據(jù)庫(kù)模塊,用于存儲(chǔ)煙用材料許可物質(zhì)標(biāo)準(zhǔn)信息。
歷史經(jīng)驗(yàn)數(shù)據(jù)庫(kù)模塊,用于存儲(chǔ)匹配經(jīng)驗(yàn)數(shù)據(jù)和歷史數(shù)據(jù)信息。
終端顯示模塊,用于顯示匹配結(jié)果信息,并按照匹配的相似度的高低進(jìn)行排序顯示。
如圖2所示為本發(fā)明主要組成部分網(wǎng)絡(luò)連接關(guān)系示意圖,主要包括:智能手持設(shè)備1、無(wú)線路由器2、應(yīng)用服務(wù)器3和數(shù)據(jù)庫(kù)服務(wù)器4。
具體的:
智能手持設(shè)備1用于掃描煙用材料使用物質(zhì)化學(xué)文本信息圖片,并通過(guò)數(shù)據(jù)收發(fā)模塊把數(shù)據(jù)通過(guò)無(wú)線路由器2發(fā)送到數(shù)據(jù)庫(kù)服務(wù)器4,還用于對(duì)匹配結(jié)果進(jìn)行確認(rèn)的操作。
無(wú)線路由器2用于智能手持設(shè)備1向數(shù)據(jù)庫(kù)服務(wù)器4發(fā)送數(shù)據(jù),并用于應(yīng)用服務(wù)器3向智能手持設(shè)備發(fā)送對(duì)比匹配結(jié)果信息。
應(yīng)用服務(wù)器3對(duì)數(shù)據(jù)庫(kù)服務(wù)器4中存儲(chǔ)的煙用材料使用物質(zhì)化學(xué)文本信息圖片數(shù)據(jù)進(jìn)行OCR識(shí)別,并對(duì)比數(shù)據(jù)庫(kù)服務(wù)器4中存儲(chǔ)的煙用材料許可物質(zhì)標(biāo)準(zhǔn)信息、匹配歷史經(jīng)驗(yàn)數(shù)據(jù)庫(kù)信息,將對(duì)比結(jié)果通過(guò)無(wú)線路由器2,發(fā)送給智能手持設(shè)備1。
數(shù)據(jù)庫(kù)服務(wù)器4存儲(chǔ)的有掃描的煙用材料使用物質(zhì)化學(xué)文本信息圖片和智能手持設(shè)備1發(fā)送過(guò)來(lái)的數(shù)據(jù)、煙用材料許可物質(zhì)標(biāo)準(zhǔn)信息和匹配經(jīng)驗(yàn)數(shù)據(jù)和歷史數(shù)據(jù)信息。
如圖3所示,本發(fā)明的主要流程如下:
1)通過(guò)手持掃描設(shè)備逐行掃描煙草材料紙質(zhì)文件,識(shí)別材料供應(yīng)商提交的紙質(zhì)物質(zhì)成分圖片(比如:碳酸鈣、CaCO3)等,如圖4所示為本實(shí)施例中供應(yīng)商提供的紙質(zhì)物質(zhì)成分圖。
2)掃描設(shè)備將掃描到的圖片信息以無(wú)線方式發(fā)送到服務(wù)器端。
3)服務(wù)器端通過(guò)OCR特征識(shí)別模塊,識(shí)別出圖片中的文字信息或者化學(xué)符號(hào),即識(shí)別出“石灰石”圖片中的文字信息“石灰石”。
4)針對(duì)“石灰石”的文字信息,對(duì)照煙用材料許可標(biāo)準(zhǔn)數(shù)據(jù)庫(kù),采用搜索技術(shù)進(jìn)行全模式匹配,如若發(fā)現(xiàn)“石灰石”出現(xiàn)在許可名錄上,則將結(jié)果反饋用戶終端顯示,完成一次匹配。但是,在本實(shí)施例中,煙用材料許可標(biāo)準(zhǔn)數(shù)據(jù)庫(kù)如圖5所示,在該許可名錄上并未發(fā)現(xiàn)“石灰石”,一次匹配失敗,需要進(jìn)行二次匹配。其中,煙用材料許可標(biāo)準(zhǔn)數(shù)據(jù)庫(kù)中存儲(chǔ)的是煙用材料許可標(biāo)準(zhǔn)里允許的物質(zhì)名稱信息。
5)對(duì)物質(zhì)名稱“石灰石”文本的特征或者圖片段的特征集合進(jìn)行操作,開展模糊智能匹配,在歷史經(jīng)驗(yàn)庫(kù)中進(jìn)行預(yù)測(cè)匹配,如圖6所示為歷史經(jīng)驗(yàn)庫(kù)圖。結(jié)果發(fā)現(xiàn)“石灰石—碳酸鈣”在歷史經(jīng)驗(yàn)庫(kù)中,結(jié)果如圖7所示,計(jì)算的相似度結(jié)果高低,從表格頂部開始排列,越靠近頂部相似度越高,則說(shuō)明“石灰石”在煙用材料許可范圍內(nèi),對(duì)應(yīng)煙用材料許可標(biāo)準(zhǔn)數(shù)據(jù)庫(kù)中編號(hào)5的記錄,則將該結(jié)果顯示在終端上,二次匹配過(guò)程完成。
6)根據(jù)最終的匹配結(jié)果,由操作人員確認(rèn),自動(dòng)將結(jié)果加入到歷史經(jīng)驗(yàn)庫(kù)中。
另外,本發(fā)明還提供一種多過(guò)程匹配煙用材料使用物質(zhì)識(shí)別裝置,包括如下模塊:
用于掃描并識(shí)別煙草材料紙質(zhì)文件或圖片中的煙用材料的信息的模塊;
用于將識(shí)別出的煙用材料的信息與煙用材料許可標(biāo)準(zhǔn)數(shù)據(jù)庫(kù)進(jìn)行匹配,若匹配成功,則將結(jié)果進(jìn)行顯示的模塊;其中,煙用材料許可標(biāo)準(zhǔn)數(shù)據(jù)庫(kù)存儲(chǔ)的是允許的煙用材料使用物質(zhì)的信息;
用于若匹配不成功,則將煙草材料的信息與歷史經(jīng)驗(yàn)庫(kù)進(jìn)行匹配,若匹配成功,則將結(jié)果進(jìn)行顯示的模塊;其中,歷史經(jīng)驗(yàn)庫(kù)存儲(chǔ)的是以前匹配成功或不成功的煙用材料使用物質(zhì)的信息。
上述多過(guò)程匹配煙用材料使用物質(zhì)識(shí)別裝置,實(shí)際上是基于本發(fā)明對(duì)應(yīng)方法流程的一種計(jì)算機(jī)解決方案,即一種軟件構(gòu)架,上述各種模塊即為與方法流程相對(duì)應(yīng)的各處理進(jìn)程或程序。由于對(duì)上述方法的介紹已經(jīng)足夠清楚完整,故不再對(duì)該裝置進(jìn)行詳細(xì)描述。