亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

使用動(dòng)態(tài)文檔識(shí)別框架的文檔驗(yàn)證的制作方法

文檔序號(hào):6479439閱讀:124來(lái)源:國(guó)知局
專利名稱:使用動(dòng)態(tài)文檔識(shí)別框架的文檔驗(yàn)證的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及使用靈活的文檔驗(yàn)證框架對(duì)諸如護(hù)照、駕駛執(zhí)照、出生證明或財(cái)務(wù)文 檔等安全性文檔進(jìn)行計(jì)算機(jī)輔助識(shí)別和驗(yàn)證。
背景技術(shù)
計(jì)算機(jī)輔助技術(shù)越來(lái)越廣泛地用于從安全性文檔捕獲、識(shí)別、驗(yàn)證和提取信息。例 如,ePassport閱讀器等安全性文檔閱讀器更普遍地用于讀取和確認(rèn)安全性文檔的真實(shí)性。 安全性文檔的例子包括護(hù)照、信用卡、身份證、駕駛執(zhí)照、出生證明、商業(yè)票證和財(cái)務(wù)文檔。 對(duì)于某些安全性文檔,ICAO(國(guó)際民用航空組織)提供了使用計(jì)算機(jī)輔助技術(shù)識(shí)別安全性 文檔的明確步驟。對(duì)于其它安全性文檔,不存在指定計(jì)算機(jī)輔助技術(shù)可以使用的用于識(shí)別 不符合ICAO的安全性文檔的步驟的標(biāo)準(zhǔn)。通常,在可確認(rèn)給定安全性文檔的真實(shí)性之前,必須首先識(shí)別安全性文檔的類型。 例如,某些現(xiàn)代的安全性文檔閱讀器支持多種不同類型的安全性文檔,如由各州或各國(guó)頒 發(fā)的護(hù)照。為了確認(rèn)安全性文檔是真實(shí)的護(hù)照,例如,首先必須確定待驗(yàn)證的護(hù)照是具體哪 個(gè)國(guó)家的以及其版本。例如,與澳大利亞護(hù)照的驗(yàn)證相比,英國(guó)護(hù)照的驗(yàn)證可能需要不同算 法的應(yīng)用程序和/或?qū)ψo(hù)照的不同部分進(jìn)行分析。更具體地講,為了驗(yàn)證不同的安全性文 檔,安全性文檔閱讀器可以采用多種算法,包括對(duì)文檔大小、靜態(tài)圖像圖案和/或從文檔和 /或存儲(chǔ)介質(zhì)特定位置(如條形碼、機(jī)讀區(qū)和RFID芯片)所采集的信息進(jìn)行分析的算法。首先識(shí)別安全性文檔類型的方法對(duì)于不符合ICAO的文檔可能存在巨大挑戰(zhàn)。一 種方法是要求操作人員在處理文檔之前手動(dòng)選擇安全性文檔的類型以確認(rèn)其真實(shí)性。然 而,這種方法勞動(dòng)強(qiáng)度大,并且在處理大量安全性文檔的環(huán)境下容易出錯(cuò)?;蛘?,可以應(yīng)用某些計(jì)算機(jī)輔助技術(shù)嘗試自動(dòng)或半自動(dòng)地識(shí)別安全性00-文檔的 類型。然而,迄今為止此類技術(shù)在本質(zhì)上通常是靜態(tài)的(即硬性限定的)。也就是說(shuō),可以 對(duì)文檔驗(yàn)證系統(tǒng)進(jìn)行靜態(tài)的編程,以應(yīng)用第一算法來(lái)對(duì)第一類安全性文檔進(jìn)行測(cè)試。如果 該測(cè)試失敗,該文檔驗(yàn)證系統(tǒng)會(huì)應(yīng)用第二算法來(lái)對(duì)第二類安全性文檔進(jìn)行測(cè)試。該靜態(tài)流 程順序進(jìn)行,直至安全性文檔被識(shí)別或被拒絕為止。該靜態(tài)方法的硬性本質(zhì)和所需的大量 處理時(shí)間無(wú)法很好地適合被設(shè)計(jì)成支持大量不同文檔類型的文檔驗(yàn)證系統(tǒng),并且可能限制 此類系統(tǒng)的擴(kuò)展性。

發(fā)明內(nèi)容
通常,本發(fā)明涉及用于按照可擴(kuò)展的高效動(dòng)態(tài)文檔識(shí)別框架來(lái)識(shí)別和驗(yàn)證安全性 文檔(或更一般的制品)的技術(shù)。也就是說(shuō),描述了可在其中容易地定義不同類型安全性文 檔的可擴(kuò)展的軟件框架,并且該框架可易于放大以適應(yīng)高效地識(shí)別和驗(yàn)證大量不同類型的 安全性文檔。此外,可以從一組可重復(fù)使用的共享文檔識(shí)別軟件模塊中容易地添加和選擇 識(shí)別各文檔類型所必需的算法。在一個(gè)實(shí)施例中,文檔識(shí)別軟件模塊可以按邏輯劃分為“分 類器”、“校驗(yàn)器”和“驗(yàn)證器”。該文檔識(shí)別框架包括一組按分層樹(shù)形結(jié)構(gòu)組織的節(jié)點(diǎn),其橫
7向結(jié)構(gòu)基于可重復(fù)使用的文檔識(shí)別軟件模塊的應(yīng)用情況將文檔分類成文檔類型和子類型。識(shí)別文檔類型時(shí),文檔處理引擎會(huì)根據(jù)樹(shù)形結(jié)構(gòu)中各父節(jié)點(diǎn)處分類器的結(jié)果來(lái)選 擇性地遍歷經(jīng)過(guò)分層文檔識(shí)別框架的路徑。也就是說(shuō),一個(gè)或多個(gè)高效計(jì)算的分類器可以 應(yīng)用于分層文檔識(shí)別框架中的各父節(jié)點(diǎn),以確定是否遍歷到該節(jié)點(diǎn)的任何子節(jié)點(diǎn)。分類器 將未知文檔的一般特性與表示子文檔類型的子節(jié)點(diǎn)的特性進(jìn)行比較。給定節(jié)點(diǎn)的分類器返 回可包含零或表示可能的參照文檔對(duì)象類型的多個(gè)子節(jié)點(diǎn)的子集(如以列表形式)。當(dāng)遍歷分層文檔識(shí)別框架時(shí),計(jì)算能力更強(qiáng)大的校驗(yàn)器也可應(yīng)用于子集的各子節(jié) 點(diǎn),以實(shí)施更多限制,從而進(jìn)一步高度準(zhǔn)確地確認(rèn)安全性文檔對(duì)于分類器所識(shí)別的子節(jié)點(diǎn) 具有正確的特性。如本文所述,可以根據(jù)置信度或相似度確定子節(jié)點(diǎn)的評(píng)估順序,并且可以 選擇相對(duì)于未知文檔具有最高相似度的子節(jié)點(diǎn)。在一些實(shí)施例中,在可認(rèn)為任何子節(jié)點(diǎn)可 能會(huì)匹配未知文檔之前,必須達(dá)到置信度水平或相似度的閾值。一旦進(jìn)行了選擇,子節(jié)點(diǎn)就 將被視為父節(jié)點(diǎn),并且以遞歸方式進(jìn)行遍歷流程,從而相對(duì)于新的父節(jié)點(diǎn)再次應(yīng)用分類器 和校驗(yàn)器。到達(dá)葉節(jié)點(diǎn)時(shí),此最終的父節(jié)點(diǎn)將被視為識(shí)別結(jié)果。此時(shí),對(duì)所得的識(shí)別節(jié)點(diǎn)應(yīng)用 一組一個(gè)或多個(gè)驗(yàn)證器,以嘗試確認(rèn)安全性文檔的真實(shí)性。驗(yàn)證器通常使用圖像比較算法 來(lái)將未知文檔的任何安全性特征與一個(gè)或多個(gè)已知參照進(jìn)行比較,以返回置信度水平或相 似度。如果相似度超過(guò)真實(shí)性閾值,則認(rèn)為未知文檔經(jīng)過(guò)校驗(yàn)是真實(shí)的。這樣,文檔識(shí)別模塊所定義算法的應(yīng)用順序(即框架被遍歷的方式)根據(jù)正在識(shí) 別的安全性文檔的具體屬性是動(dòng)態(tài)的。此方法提供了可擴(kuò)展的高效文檔驗(yàn)證系統(tǒng),其可容 易地?cái)U(kuò)展以支持幾百種甚至幾千種不同類型的安全性文檔。例如,安全性文檔的識(shí)別及后續(xù)驗(yàn)證可能涉及來(lái)自安全性文檔的數(shù)據(jù),如來(lái)自機(jī) 讀區(qū)(MRZ)、條形碼、磁條、文本內(nèi)容、加密圖像或嵌入安全性文檔內(nèi)的射頻識(shí)別(RFID)芯 片的數(shù)據(jù)。根據(jù)本文所述的原理,安全性文檔驗(yàn)證系統(tǒng)通過(guò)執(zhí)行分層框架所定義的分類器 和校驗(yàn)器遍歷框架,以處理來(lái)自安全性文檔的數(shù)據(jù)并且確定該安全性文檔是否包含某些識(shí) 別特性??蚣艿姆謱颖举|(zhì)以及其使用可重復(fù)使用的文檔分類器來(lái)識(shí)別文檔類型的類別和子 類別,使得即使在支持眾多不同文檔類型的情況下,也可快速而高效地識(shí)別安全性文檔。因 此本文所述的技術(shù)對(duì)于保持動(dòng)態(tài)文檔識(shí)別框架可能尤其有用,方法是縮小快速識(shí)別及后續(xù) 確認(rèn)安全性文檔真實(shí)性所需的比較次數(shù),盡管全球當(dāng)前可用的安全性文檔數(shù)量不斷增加。例如,本發(fā)明的技術(shù)可以內(nèi)置在安全性文檔驗(yàn)證設(shè)備中。該設(shè)備可以包括接收制 品的捕捉圖像的圖像捕捉接口以及將多個(gè)文檔類型對(duì)象存儲(chǔ)在按照動(dòng)態(tài)文檔識(shí)別框架的 數(shù)據(jù)結(jié)構(gòu)中的存儲(chǔ)器。安全性文檔驗(yàn)證設(shè)備還包括文檔處理引擎,文檔處理引擎通過(guò)選擇 性調(diào)用這多個(gè)流程中的一個(gè)或多個(gè)而遍歷數(shù)據(jù)結(jié)構(gòu),以將安全性文檔識(shí)別為這多個(gè)文檔類 型對(duì)象中的一個(gè)。通常,數(shù)據(jù)結(jié)構(gòu)包括樹(shù)形數(shù)據(jù)結(jié)構(gòu),以在捕捉圖像與文檔類型對(duì)象之間進(jìn) 行顯著更少的比較。此外,通過(guò)使用動(dòng)態(tài)數(shù)據(jù)結(jié)構(gòu),例如樹(shù)形數(shù)據(jù)結(jié)構(gòu),數(shù)據(jù)結(jié)構(gòu)可以容易 地?cái)U(kuò)展以涵蓋數(shù)量不斷增大的安全性文檔,并且可以在工作時(shí)間中進(jìn)行動(dòng)態(tài)的調(diào)整以實(shí)時(shí) 適應(yīng)額外的數(shù)據(jù)結(jié)構(gòu)。在一個(gè)實(shí)施例中,一種方法包括接收未知文檔的一個(gè)或多個(gè)捕捉圖像,以及將多 個(gè)文檔類型對(duì)象存儲(chǔ)在按照動(dòng)態(tài)文檔識(shí)別框架的數(shù)據(jù)結(jié)構(gòu)中,其中這多個(gè)文檔類型對(duì)象涉 及多個(gè)用于從捕捉圖像提取屬性的遞歸流程,以將未知文檔分類并驗(yàn)證為由文檔類型對(duì)象中的一個(gè)所表示的文檔類型。該方法還包括根據(jù)通過(guò)對(duì)捕捉圖像應(yīng)用這多個(gè)遞歸流程所提 取的屬性以可變的順序遍歷數(shù)據(jù)結(jié)構(gòu)的文檔類型對(duì)象,以及當(dāng)遍歷數(shù)據(jù)結(jié)構(gòu)時(shí)將未知文檔 識(shí)別為這多個(gè)文檔類型對(duì)象中的一個(gè)。在另一個(gè)實(shí)施例中,安全性文檔驗(yàn)證設(shè)備包括捕捉未知文檔的一個(gè)或多個(gè)圖像的 圖像捕捉接口以及將多個(gè)文檔類型對(duì)象存儲(chǔ)在按照動(dòng)態(tài)文檔識(shí)別框架的數(shù)據(jù)結(jié)構(gòu)中的存 儲(chǔ)器,其中這多個(gè)文檔類型對(duì)象涉及多個(gè)用于從捕捉圖像提取屬性的遞歸流程。該設(shè)備還 包括根據(jù)通過(guò)對(duì)捕捉圖像應(yīng)用多個(gè)遞歸流程所提取的屬性以可變的順序遍歷數(shù)據(jù)結(jié)構(gòu)的 文檔類型對(duì)象的文檔處理引擎,其中文檔處理引擎遍歷數(shù)據(jù)結(jié)構(gòu)時(shí)將未知文檔識(shí)別為多個(gè) 文檔類型對(duì)象中的一個(gè)。在另一個(gè)實(shí)施例中,本發(fā)明涉及包含指令的計(jì)算機(jī)可讀介質(zhì)。指令使得可編程的 處理器接收制品的捕捉圖像,然后將多個(gè)文檔類型對(duì)象存儲(chǔ)在按照動(dòng)態(tài)文檔識(shí)別框架的數(shù) 據(jù)結(jié)構(gòu)中,其中這多個(gè)文檔類型對(duì)象涉及多個(gè)流程。指令還使得處理器通過(guò)選擇性調(diào)用這 多個(gè)流程中的一個(gè)或多個(gè)而遍歷數(shù)據(jù)結(jié)構(gòu),從而將捕捉圖像識(shí)別為這多個(gè)文檔類型對(duì)象中 的一個(gè)。附圖和下文的具體實(shí)施方式
詳細(xì)描述了本發(fā)明的一個(gè)或多個(gè)實(shí)施例。根據(jù)本發(fā)明 的具體實(shí)施方式
、附圖以及權(quán)利要求書(shū),本發(fā)明的其它特征、目的和優(yōu)點(diǎn)將顯而易見(jiàn)。


圖1為示意圖,示出了根據(jù)本發(fā)明的原理用于分析安全性文檔12的示例性文檔驗(yàn) 證系統(tǒng)10。圖2為框圖,示出了根據(jù)本發(fā)明的原理用于按照動(dòng)態(tài)文檔識(shí)別框架驗(yàn)證制品的示 例性主機(jī)系統(tǒng)。圖3為流程圖,示出了圖1中文檔驗(yàn)證系統(tǒng)的示例操作。圖4為流程圖,更詳細(xì)地示出了圖2中主機(jī)系統(tǒng)的示例操作。圖5為框圖,更詳細(xì)地示出了圖2中的文檔識(shí)別框架。圖6為流程圖,示出了遍歷文檔識(shí)別框架上時(shí)文檔識(shí)別模塊的示例操作。圖7A-7C為由文檔識(shí)別框架的用戶界面通過(guò)顯示器提供給用戶的窗口的屏幕截 圖。圖8A、8B為主機(jī)系統(tǒng)完成識(shí)別和后續(xù)驗(yàn)證之后由用戶界面通過(guò)顯示器提供給用 戶的窗口的屏幕截圖。圖9為框圖,更詳細(xì)地示出了圖2中主機(jī)系統(tǒng)的存儲(chǔ)器結(jié)構(gòu)的一部分。圖10為流程圖,示出了遍歷文檔識(shí)別框架上以調(diào)用布局匹配識(shí)別流程時(shí)文檔識(shí) 別模塊的示例操作。圖11A-11C為示例性圖像,示出了文檔識(shí)別模塊執(zhí)行布局匹配識(shí)別流程時(shí)捕捉圖 像的狀態(tài)。圖12為流程圖,示出了遍歷文檔識(shí)別框架上以調(diào)用Eigenimage文檔匹配識(shí)別流 程時(shí)文檔識(shí)別模塊的示例操作。圖13A-13C為示例性圖像,示出了文檔識(shí)別模塊執(zhí)行Eigenimage文檔匹配流程時(shí) 捕捉圖像的狀態(tài)。
9
圖14A-14C為文檔驗(yàn)證模塊針對(duì)圖像內(nèi)特性示出捕捉圖像和灰度變化曲線時(shí)的 示例圖像。圖15A-15D和16A-16C為文檔驗(yàn)證模塊示出樣本打印技術(shù)實(shí)例及其分析結(jié)果時(shí)的 示例圖像。圖17A-17C顯示在從206份沒(méi)有使用符合ICAO的MRZ區(qū)的不同美國(guó)駕駛執(zhí)照中 識(shí)別和驗(yàn)證當(dāng)前版本紐約州駕駛執(zhí)照時(shí)系統(tǒng)具有的效率和高準(zhǔn)確度。
具體實(shí)施例方式圖1為示意圖,示出了根據(jù)本發(fā)明的原理用于分析安全性文檔12的示例性文檔驗(yàn) 證系統(tǒng)10。文檔驗(yàn)證系統(tǒng)10包括連接到文檔閱讀器11 (如ePassport文檔閱讀器)的主 機(jī)系統(tǒng)20。文檔閱讀器11用作圖像捕捉設(shè)備,以及確認(rèn)安全性文檔12是有效真實(shí)的安全 性文檔。如本文所述,文檔閱讀器11支持多種類型的安全性文檔。作為驗(yàn)證的一部分,文 檔閱讀器11首先識(shí)別插入設(shè)備中的安全性文檔的具體類型。例如,安全性文檔12可以是 美國(guó)護(hù)照、美國(guó)各州的駕駛執(zhí)照、美國(guó)各州的身份證、歐盟(E.U.)駕駛執(zhí)照、歐盟身份證、 世界各州或國(guó)家政府機(jī)構(gòu)頒發(fā)的護(hù)照或身份證明文件、所有權(quán)文件、身份證和多種其它類 型的文檔。在識(shí)別安全性文檔的類型之后,文檔驗(yàn)證系統(tǒng)10可以進(jìn)行驗(yàn)證以及從安全性文 檔12提取信息。例如,文檔驗(yàn)證系統(tǒng)10的計(jì)算機(jī)主機(jī)系統(tǒng)20可以用于指示文檔閱讀器11首先從 安全性文檔12的全部或一部分捕捉一個(gè)或多個(gè)圖像的序列。接著,應(yīng)用兩段式流程,文檔 驗(yàn)證系統(tǒng)10首先識(shí)別安全性文檔的類型,然后根據(jù)對(duì)捕捉圖像數(shù)據(jù)的分析,可能結(jié)合從安 全性文檔獲取的其它數(shù)據(jù)來(lái)確認(rèn)安全性文檔12是所識(shí)別類型的有效文檔。例如,除了從安 全性文檔12捕捉的掃描圖像數(shù)據(jù),文檔驗(yàn)證系統(tǒng)10還可以利用從一個(gè)或多個(gè)機(jī)讀區(qū)(如 條形碼)接收的數(shù)據(jù)、從嵌入在文檔內(nèi)或固定在文檔上的射頻識(shí)別(RFID)芯片或由文檔提 供的其它信息來(lái)源接收到的數(shù)據(jù)。如本文所述,計(jì)算機(jī)主機(jī)20為文檔處理引擎提供操作環(huán)境,文檔處理引擎利用可 易于擴(kuò)展和修改的動(dòng)態(tài)文檔識(shí)別框架來(lái)支持多種類型的安全性文檔。也就是說(shuō),文檔識(shí)別 框架提供其中可對(duì)各種不同類型的安全性文檔輕松添加、定義和使用識(shí)別算法的環(huán)境。必 要時(shí)文檔處理引擎可與框架進(jìn)行交互,以調(diào)用各種算法進(jìn)行分類并最終將安全性文檔12 識(shí)別為具體類型的文檔,如特定機(jī)構(gòu)頒發(fā)的并且具有后續(xù)驗(yàn)證所需的某些特性和布局特征 的安全性文檔。文檔驗(yàn)證系統(tǒng)10通過(guò)掃描受保護(hù)的文檔以從安全性文檔12的全部或一部分捕捉 一個(gè)或多個(gè)圖像的序列來(lái)開(kāi)始識(shí)別安全性文檔12的流程。接著,文檔驗(yàn)證系統(tǒng)10遍歷按 照動(dòng)態(tài)文檔識(shí)別框架用于存儲(chǔ)定義多個(gè)文檔類型對(duì)象的數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)。多個(gè)文檔類型對(duì) 象以節(jié)點(diǎn)的形式分層設(shè)置,每個(gè)對(duì)象表示安全性文檔類型的類別或子類別。每個(gè)對(duì)象可以 涉及多個(gè)可執(zhí)行的文檔識(shí)別軟件模塊(即可執(zhí)行的“分類器”、“校驗(yàn)器”和“驗(yàn)證器”)中的 任一個(gè)(即包含其指針),這些文檔識(shí)別軟件模塊提供分類、子分類以及最終識(shí)別和驗(yàn)證具 體文檔類型所必需的算法。例如,這些文檔識(shí)別軟件模塊中的每一個(gè)通常執(zhí)行能夠確定文 檔的一個(gè)或多個(gè)屬性的相關(guān)文檔識(shí)別算法。根據(jù)具體的安全性文檔12中是否存在所考慮 的屬性,處理引擎遍歷文檔框架以選擇和應(yīng)用后續(xù)分類器。示例性的文檔識(shí)別軟件模塊包
10括Eigenimage文檔匹配算法或文檔布局匹配算法,二者均在下文中有更詳細(xì)的描述。遍歷文檔識(shí)別框架的數(shù)據(jù)結(jié)構(gòu)時(shí),文檔驗(yàn)證系統(tǒng)10選擇性地調(diào)用這多個(gè)文檔識(shí) 別軟件模塊中的一個(gè)或多個(gè),以處理捕捉圖像數(shù)據(jù)的部分和/或詢問(wèn)安全性文檔12從而獲 得額外的數(shù)據(jù)。例如,識(shí)別文檔類型時(shí),文檔驗(yàn)證系統(tǒng)10的文檔處理引擎從分層文檔識(shí)別 框架的根節(jié)點(diǎn)開(kāi)始,然后根據(jù)分類器在框架中各父節(jié)點(diǎn)處所定義算法的結(jié)果來(lái)選擇性地遍 歷經(jīng)過(guò)框架節(jié)點(diǎn)的路徑。也就是說(shuō),一個(gè)或多個(gè)高效計(jì)算的分類器可以應(yīng)用于分層文檔識(shí) 別框架內(nèi)的各父節(jié)點(diǎn),以確定是否遍歷到該父節(jié)點(diǎn)的任何子節(jié)點(diǎn)的路徑。這些分類器參考 子節(jié)點(diǎn)所表示的子文檔類型的特性,并且用于對(duì)路徑選擇進(jìn)行一般比較。分類器將未知文 檔的一般特性與表示子文檔類型的子節(jié)點(diǎn)特性進(jìn)行比較。給定節(jié)點(diǎn)的分類器返回可包含零 或表示可能的參照文檔對(duì)象類型的多個(gè)子節(jié)點(diǎn)的子集(如以列表形式)。分類器可以按所 鏈接索引的形式存儲(chǔ)并且返回一組可能的參照文檔對(duì)象類型。遍歷分層文檔識(shí)別框架時(shí),可以將與父節(jié)點(diǎn)、子節(jié)點(diǎn)或二者相關(guān)聯(lián)的校驗(yàn)器應(yīng)用 于由更高級(jí)別的分類器所提取的屬性,以進(jìn)一步確認(rèn)安全性文檔對(duì)于分類器所選擇的子節(jié) 點(diǎn)具有正確的特性。校驗(yàn)器參考節(jié)點(diǎn)本身所表示的文檔類型的特性,然后進(jìn)一步用于識(shí)別 流程,并且校驗(yàn)器指定的算法對(duì)此具體文檔類型應(yīng)用更嚴(yán)格的限制以得到正確的識(shí)別結(jié) 果,這些算法可能比分類器指定的算法具有更強(qiáng)的計(jì)算能力。分類器和校驗(yàn)器相結(jié)合為平 衡高速需求和準(zhǔn)確度需求提供了有效而靈活的結(jié)構(gòu)。如本文所述,可以根據(jù)置信度或相似 度確定子節(jié)點(diǎn)的評(píng)估順序,并且可以選擇相對(duì)于未知文檔具有最高相似度的子節(jié)點(diǎn)。在一 些實(shí)施例中,在可認(rèn)為任何子節(jié)點(diǎn)可能會(huì)匹配未知文檔之前,必須達(dá)到置信度水平或相似 度的閾值。一旦進(jìn)行了選擇,子節(jié)點(diǎn)就將被視為父節(jié)點(diǎn),并且以遞歸方式繼續(xù)進(jìn)行遍歷流 程,以相對(duì)于新的父節(jié)點(diǎn)再次應(yīng)用分類器和校驗(yàn)器。到達(dá)葉節(jié)點(diǎn)(即在框架中沒(méi)有任何子節(jié)點(diǎn)的節(jié)點(diǎn))時(shí),應(yīng)用一組一個(gè)或多個(gè)驗(yàn)證 器嘗試確認(rèn)安全性文檔的真實(shí)性。驗(yàn)證器參考葉節(jié)點(diǎn)所表示的文檔類型的特性,并且可比 校驗(yàn)器或分類器所指定算法具有更強(qiáng)的計(jì)算能力,雖然這并非必需。驗(yàn)證器通常使用圖像 比較算法來(lái)將未知文檔的任何安全性特征與一個(gè)或多個(gè)已知參照進(jìn)行比較,以返回置信度 水平或相似度。如果相似度超過(guò)真實(shí)性閾值,則認(rèn)為未知文檔經(jīng)過(guò)確認(rèn)是真實(shí)的。這樣,文檔驗(yàn)證系統(tǒng)10遍歷文檔識(shí)別框架上并且選擇性地調(diào)用文檔識(shí)別軟件模 塊以識(shí)別和最終驗(yàn)證未知文檔。因此,動(dòng)態(tài)文檔識(shí)別框架所實(shí)現(xiàn)的流程是“動(dòng)態(tài)的”,原因是 該文檔識(shí)別框架根據(jù)之前所調(diào)用的文檔識(shí)別軟件模塊的結(jié)果指示文檔驗(yàn)證系統(tǒng)10調(diào)用某 些操作;分層結(jié)構(gòu)內(nèi)的開(kāi)始點(diǎn)和流程的調(diào)用順序根據(jù)正被識(shí)別的具體安全性文檔而有所差 別。也就是說(shuō),文檔驗(yàn)證系統(tǒng)10可以例如隨后應(yīng)用第一、第二和第三操作來(lái)分析美國(guó)護(hù)照 安全性文檔12,但隨后應(yīng)用第一、第三和第五操作來(lái)分析美國(guó)駕駛執(zhí)照安全性文檔12,其 中各操作單獨(dú)確定安全性文檔的僅一個(gè)或多個(gè)屬性。就這一點(diǎn)而言,該技術(shù)不同于常規(guī)系 統(tǒng),常規(guī)系統(tǒng)不論進(jìn)行驗(yàn)證的安全性文檔12的類型如何,通常需要按預(yù)定順序靜態(tài)地應(yīng)用 完整的文檔識(shí)別算法。正如下文將進(jìn)一步描述的那樣,此動(dòng)態(tài)方面通過(guò)根據(jù)對(duì)捕捉圖像自 身的分析選擇性地動(dòng)態(tài)應(yīng)用一組流程而有利于進(jìn)行更高效和全面的安全性文檔校驗(yàn)。文檔驗(yàn)證系統(tǒng)10可以將文檔識(shí)別框架作為分層設(shè)置的樹(shù)形數(shù)據(jù)結(jié)構(gòu)存儲(chǔ)在存儲(chǔ) 器、數(shù)據(jù)庫(kù)或其它存儲(chǔ)介質(zhì)(圖1中未示出)中。本文稱為文檔對(duì)象類型的數(shù)據(jù)結(jié)構(gòu)用于 表示樹(shù)形數(shù)據(jù)結(jié)構(gòu)內(nèi)的各節(jié)點(diǎn)。父節(jié)點(diǎn)表示文檔類型的類別或子類別,并可遞歸地被向下
11遍歷進(jìn)入分層結(jié)構(gòu)的多個(gè)層。葉節(jié)點(diǎn)表示具體文檔類型,如美國(guó)護(hù)照文檔類型對(duì)象、美國(guó)駕 駛執(zhí)照文檔類型對(duì)象或美國(guó)身份證文檔類型對(duì)象??蚣軆?nèi)的某些文檔類型對(duì)象可以包括一 個(gè)或多個(gè)已存儲(chǔ)的圖像或模板,以及一組清楚地描述一種文檔類型區(qū)別于另一種類型的特 定特性。例如,美國(guó)護(hù)照文檔類型對(duì)象可能包括美國(guó)護(hù)照模板的圖像以及一組限定機(jī)讀區(qū) 在美國(guó)護(hù)照模板圖像底部的出現(xiàn)率的特性、描述圖像在模板內(nèi)位置的量度,以及在確定各 種特性之間相對(duì)位置時(shí)指示的其它數(shù)據(jù)。文檔驗(yàn)證系統(tǒng)10可以遍歷框架的數(shù)據(jù)結(jié)構(gòu),從而調(diào)用文檔類型對(duì)象涉及的一個(gè) 或多個(gè)可執(zhí)行的分類器、校驗(yàn)器和驗(yàn)證器。取決于所調(diào)用的具體文檔識(shí)別軟件模塊,文檔驗(yàn) 證系統(tǒng)10可以將文檔類型對(duì)象與捕捉圖像進(jìn)行比較,或?qū)D像數(shù)據(jù)和/或得自安全性文檔 的其它數(shù)據(jù)進(jìn)行一些其它分析,以生成指示安全性文檔12與類別、子類別或具體文檔類型 的匹配相似度的確定性值。如果確定性值超出針對(duì)與父節(jié)點(diǎn)相關(guān)的多個(gè)分類器和/或校驗(yàn) 器的編程或計(jì)算出的最小確定性水平,文檔驗(yàn)證系統(tǒng)10會(huì)從該父節(jié)點(diǎn)開(kāi)始遍歷多個(gè)經(jīng)過(guò) 框架的路徑,直至安全性文檔12在到達(dá)一個(gè)或多個(gè)葉節(jié)點(diǎn)時(shí)通過(guò)最終返回最大確定性值 而被識(shí)別。成功識(shí)別安全性文檔12與多個(gè)所存儲(chǔ)的文檔類型對(duì)象中的一個(gè)相符之后,文檔 驗(yàn)證系統(tǒng)12會(huì)執(zhí)行驗(yàn)證流程以確認(rèn)安全性文檔的真實(shí)性。例如,文檔驗(yàn)證系統(tǒng)12可以分 析捕捉圖像,以確定安全性文檔中是否存在一個(gè)或多個(gè)所存儲(chǔ)的參照?qǐng)D像。如果安全性文 檔中存在參照?qǐng)D像,文檔驗(yàn)證系統(tǒng)10可能提供安全性文檔12已被正確驗(yàn)證的指示(如聽(tīng) 覺(jué)或視覺(jué)指示)。如果捕捉圖像中不存在參照?qǐng)D像,文檔驗(yàn)證系統(tǒng)10會(huì)提供安全性文檔12 無(wú)法被自動(dòng)驗(yàn)證并且可能被拒絕的指示。在操作中,用戶將安全性文檔12放置在文檔閱讀器11的觀察框架14上。觀察框 架14準(zhǔn)確地將安全性文檔12相對(duì)于文檔驗(yàn)證系統(tǒng)10的其它元件布置。在圖1的示例性 實(shí)施例中,文檔驗(yàn)證系統(tǒng)10包括用于照亮放置在觀察框架14上的安全性文檔12的光源。 在一些實(shí)施例中,文檔驗(yàn)證系統(tǒng)10可以包括不止一個(gè)光源,例如紅外(IR)光源和/或紫外 (UV)光源。文檔驗(yàn)證系統(tǒng)10還包括用于從安全性文檔12捕捉圖像數(shù)據(jù)的圖像捕捉設(shè)備。 圖像捕捉設(shè)備可以是CMOS圖像傳感器,例如具有像素陣列的電荷耦合裝置(CCD)、相機(jī)、行 掃描儀或其它光學(xué)輸入裝置。主機(jī)系統(tǒng)20可以與安全性閱讀器11進(jìn)行交互,從而發(fā)出命 令以捕捉圖像數(shù)據(jù)、詢問(wèn)RFID芯片或執(zhí)行相對(duì)于安全性文檔12的其它操作。光源的強(qiáng)度 可以在最小值到最大值的強(qiáng)度范圍內(nèi)由主機(jī)系統(tǒng)20自動(dòng)調(diào)節(jié)或根據(jù)用戶輸入進(jìn)行調(diào)節(jié)。用戶將安全性文檔12放置到觀察框架14中之后,文檔閱讀器11會(huì)捕捉安全性文 檔12的一個(gè)或多個(gè)圖像的序列。捕捉圖像可以表示安全性文檔12的全部或一部分,但通 常捕捉圖像表示安全性文檔12的全部。圖像捕捉設(shè)備11將捕捉圖像數(shù)據(jù)傳輸?shù)街鳈C(jī)系統(tǒng) 20以進(jìn)行圖像處理。由主機(jī)系統(tǒng)20處理過(guò)的捕捉圖像可在與主機(jī)系統(tǒng)20相連的顯示器 (未示出)上顯示以供檢查。主機(jī)系統(tǒng)20可以包括例如計(jì)算機(jī)、筆記本電腦、移動(dòng)個(gè)人數(shù)字 助理(PDA)或具有分析捕捉圖像的足夠處理器和存儲(chǔ)器資源的其它計(jì)算系統(tǒng)。在下文中, 將對(duì)主機(jī)系統(tǒng)20的示例性配置和操作進(jìn)行詳細(xì)說(shuō)明。圖2為示出示例性主機(jī)系統(tǒng)20的框圖,該主機(jī)系統(tǒng)20可按照動(dòng)態(tài)文檔識(shí)別框架 驗(yàn)證制品,例如圖1中的安全性文檔12,從而根據(jù)本發(fā)明的原理識(shí)別安全性文檔12。主機(jī)系 統(tǒng)20分析圖像數(shù)據(jù)22和從文檔閱讀器11 (圖1)接收到的其它可選數(shù)據(jù)(如RFID數(shù)據(jù)),以動(dòng)態(tài)地識(shí)別安全性文檔12。在此例中,主機(jī)系統(tǒng)20包括數(shù)據(jù)接口 24,以從文檔閱讀器11接收數(shù)據(jù)(如圖像和 RFID數(shù)據(jù))。數(shù)據(jù)接口 24可以是例如用于與文檔閱讀器11進(jìn)行通訊的串行或并行硬件接 口。又如,數(shù)據(jù)接口 24可以是通用串行總線(USB)接口。如圖2所示,文檔識(shí)別框架34可以表示為具有多個(gè)節(jié)點(diǎn)的樹(shù)形結(jié)構(gòu),其中節(jié)點(diǎn)表 示安全性文檔的類別、安全性文檔的子類別或安全性文檔的具體類型。文檔識(shí)別框架34的 各節(jié)點(diǎn)可以包括對(duì)一組文檔識(shí)別軟件模塊41的一個(gè)或多個(gè)參照,文檔識(shí)別軟件模塊包括 分類器47、校驗(yàn)器48和驗(yàn)證器49,其中每個(gè)模塊都包含定義用于檢查安全性文檔的一個(gè)或 多個(gè)屬性或特性的流程的可執(zhí)行指令。例如,與父節(jié)點(diǎn)相關(guān)的其中一個(gè)分類器47可以確定 在安全性文檔的某個(gè)位置是否存在機(jī)讀區(qū)(MRZ),從而將安全性文檔的可能類型縮小到具 體類別。與父節(jié)點(diǎn)或其子節(jié)點(diǎn)之一相關(guān)的其中一個(gè)檢驗(yàn)器47還可處理MRZ,以便確認(rèn)MRZ 文本中是否存在文本標(biāo)識(shí)符的具體序列。在這方面,檢驗(yàn)器48確認(rèn)文檔樹(shù)形分層結(jié)構(gòu)中更 高級(jí)別的分類器所提取的屬性,例如是否存在文本標(biāo)識(shí)符的以上具體序列,如“AU”,以進(jìn)一 步將可能的文檔類型集縮小到澳大利亞文檔。最終,在到達(dá)葉節(jié)點(diǎn)(即在框架中沒(méi)有任何 子節(jié)點(diǎn)的節(jié)點(diǎn))時(shí),應(yīng)用該葉節(jié)點(diǎn)所涉及的一組一個(gè)或多個(gè)驗(yàn)證器49嘗試確認(rèn)安全性文檔 的真實(shí)性。主機(jī)系統(tǒng)20包括提供布局編輯器30的用戶界面28,用戶(未示出)可由此編輯 存儲(chǔ)在數(shù)據(jù)庫(kù)32中的數(shù)據(jù)。具體地講,用戶可以與布局編輯器30提供的圖形用戶界面進(jìn) 行交互,以編輯存儲(chǔ)到數(shù)據(jù)庫(kù)32的文檔類型,從而擴(kuò)展文檔識(shí)別框架34以支持不同文檔類 型。例如,在某些情況下,用戶可以與布局編輯器30進(jìn)行交互,以手動(dòng)指定用于插入文檔識(shí) 別框架34中的新文檔類型對(duì)象。此時(shí),用戶可定義屬性,用于定義類別、子類別或各個(gè)文檔 類型。此外,用戶可以將待插入的文檔對(duì)象與一個(gè)或多個(gè)新算法或現(xiàn)有算法相關(guān)聯(lián),從而存 儲(chǔ)為分類器47、校驗(yàn)器48和驗(yàn)證器49?;蛘?,主機(jī)系統(tǒng)20可以設(shè)置為“學(xué)習(xí)”模式,以在接收和處理圖像數(shù)據(jù)和來(lái)自安全 性文檔新類型模板的其它數(shù)據(jù)22時(shí),系統(tǒng)會(huì)自適應(yīng)地更新文檔識(shí)別框架34。在此模式下, 主機(jī)系統(tǒng)20會(huì)處理數(shù)據(jù)并且將新文檔類型對(duì)象自動(dòng)插入與安全性文檔新類型的任何已識(shí) 別屬性相符的文檔識(shí)別框架34中。因此,用戶輸入26可以與用戶界面28進(jìn)行交互,以指定編輯文檔類型對(duì)象的命 令,例如添加或移除與預(yù)定義文檔類型對(duì)象相關(guān)的分類器47、校驗(yàn)器48和驗(yàn)證器49,從而 手動(dòng)或自動(dòng)插入新文檔類型對(duì)象,移除文檔類型對(duì)象,重新排序文檔識(shí)別框架的節(jié)點(diǎn)以區(qū) 分分類器47、校驗(yàn)器48、驗(yàn)證器49的優(yōu)先順序的命令以及其它命令。這樣,用戶便可利用 布局編輯器30來(lái)定制文檔識(shí)別框架34,從而更快地識(shí)別安全性文檔類型。由數(shù)據(jù)接口 24接收到的圖像數(shù)據(jù)可以表示安全性文檔12的全部或一部分的捕捉 圖像。如上文所述,圖像數(shù)據(jù)可以包含一個(gè)或多個(gè)圖像、文本、MRZ、條形碼、水印或其它信 息。主機(jī)系統(tǒng)20包括接收捕捉數(shù)據(jù)并且執(zhí)行上述識(shí)別和后續(xù)驗(yàn)證流程的文檔處理引擎36。 在此例中,文檔處理引擎36包括圖像處理模塊38和用以執(zhí)行文檔識(shí)別流程的文檔識(shí)別模 塊40。文檔處理引擎36還包括在識(shí)別后確認(rèn)安全性文檔真實(shí)性的文檔驗(yàn)證模塊42,以及 從制品(如待校驗(yàn)和驗(yàn)證的安全性文檔12)提取相關(guān)信息的數(shù)據(jù)收集模塊44。具體地講, 數(shù)據(jù)收集模塊44可以接合文檔閱讀器11來(lái)讀取條形碼、詢問(wèn)RFID芯片以及讀取安全性文檔12上的磁條,從而收集可能不包含在圖像數(shù)據(jù)中的附加數(shù)據(jù)。接收捕捉圖像數(shù)據(jù)后,圖像處理模塊38可以調(diào)用圖像預(yù)處理算法,以從捕捉圖像 數(shù)據(jù)生成質(zhì)量更好的灰度圖像、彩色圖像或二進(jìn)制圖像。針對(duì)本文的目的,這些處理過(guò)的捕 捉圖像稱為捕捉圖像,而“捕捉圖像”應(yīng)解釋為表示反映基礎(chǔ)安全性文檔12的任意圖像,無(wú) 論處理與否。圖像處理模塊38可以根據(jù)捕捉圖像時(shí)所用光源的類型確定是否需要進(jìn)行圖 像處理,如UV光源可能需要某些圖像處理算法,或者根據(jù)捕捉圖像的某些方面確定是否需 要進(jìn)行圖像處理,如具有亮色文本的暗背景可能需要某些圖像反轉(zhuǎn)算法。一旦對(duì)圖像數(shù)據(jù) 進(jìn)行了預(yù)處理,文檔識(shí)別模塊40就會(huì)進(jìn)一步分析圖像數(shù)據(jù)以及數(shù)據(jù)收集模塊44獲得的其 它數(shù)據(jù),以識(shí)別安全性文檔的類型。具體而言,在接收捕捉圖像數(shù)據(jù)時(shí),文檔識(shí)別模塊40遍歷存儲(chǔ)到數(shù)據(jù)庫(kù)32的文檔 識(shí)別框架34,從而將安全性文檔識(shí)別為文檔識(shí)別框架34所支持的文檔類型對(duì)象中的一個(gè), 或拒絕安全性文檔。數(shù)據(jù)庫(kù)32可以本地駐留在主機(jī)系統(tǒng)20的存儲(chǔ)器或計(jì)算機(jī)可讀介質(zhì)中; 然而,在其它實(shí)施例中,數(shù)據(jù)庫(kù)32可以在主機(jī)系統(tǒng)20的遠(yuǎn)程并且通過(guò)網(wǎng)絡(luò)連接或一些其它 遠(yuǎn)程訪問(wèn)方法(如通過(guò)公共網(wǎng)絡(luò)的虛擬專用網(wǎng)絡(luò))與主機(jī)系統(tǒng)20連接。數(shù)據(jù)庫(kù)32可以包 括任何類型的數(shù)據(jù)庫(kù),例如關(guān)系數(shù)據(jù)庫(kù),或者能夠存儲(chǔ)文檔識(shí)別框架34的任何其它類型的 存儲(chǔ)器。將文檔識(shí)別框架34組織為樹(shù)形數(shù)據(jù)結(jié)構(gòu)以便于擴(kuò)展。如下文更為詳細(xì)的描述,文 檔識(shí)別模塊40通過(guò)選擇性調(diào)用多個(gè)分類器47、校驗(yàn)器48和驗(yàn)證器49而遍歷文檔識(shí)別框 架34,以將安全性文檔分類并且最終識(shí)別為存儲(chǔ)在文檔識(shí)別框架34中的多個(gè)文檔類型對(duì) 象中的一個(gè)。遍歷文檔識(shí)別框架34之后,文檔識(shí)別模塊40可以將所識(shí)別的安全性文檔類型傳 輸?shù)接脩艚缑?8,于是用戶界面28可以通過(guò)顯示器43將所選文檔類型展示給用戶,供用 戶確認(rèn)?;蛘?,可以不需要用戶確認(rèn)。在任何情況下,將安全性文檔識(shí)別為具體文檔類型對(duì) 象之后,文檔驗(yàn)證模塊42開(kāi)始進(jìn)入驗(yàn)證階段,如上文所述。在整個(gè)識(shí)別或驗(yàn)證階段,數(shù)據(jù)收 集模塊44可以從數(shù)據(jù)庫(kù)32請(qǐng)求的圖像中提取信息。一旦得到驗(yàn)證,文檔處理引擎36通常 會(huì)將驗(yàn)證的結(jié)果傳輸?shù)接脩艚缑?8,于是用戶界面28將此結(jié)果展示到顯示器43。顯示器 43可以包括液晶顯示器(LCD)、平面顯示器、等離子體顯示器、陰極射線管(CRT)顯示器或 能夠展示圖形、文本和視頻的任何其它顯示器類型。主機(jī)系統(tǒng)20還可以包括存儲(chǔ)最近識(shí)別的文檔類型對(duì)象的隊(duì)列數(shù)據(jù)結(jié)構(gòu)46( “隊(duì) 列46”)。因此,當(dāng)例如將安全性文檔12識(shí)別為美國(guó)護(hù)照文檔類型對(duì)象時(shí),文檔處理引擎 36可以將美國(guó)護(hù)照文檔類型對(duì)象或其參照存儲(chǔ)到隊(duì)列46中。當(dāng)接收到識(shí)別另一個(gè)安全性 文檔的請(qǐng)求時(shí),遍歷文檔識(shí)別框架34以嘗試其它可能之前,文檔識(shí)別模塊40可以首先嘗試 將安全性文檔識(shí)別為隊(duì)列46中所保存文檔類型對(duì)象中的一個(gè)。在一些情況下,下一個(gè)識(shí)別 的文檔可以是同一文檔的另一面。在這種情況下,文檔處理引擎36會(huì)自動(dòng)關(guān)聯(lián)該信息并且 將兩組信息結(jié)合成一個(gè)輸出。雖然在圖2中分開(kāi)顯示,但隊(duì)列46可以駐留在數(shù)據(jù)庫(kù)32中。 主機(jī)系統(tǒng)20可以包括能夠存儲(chǔ)隊(duì)列數(shù)據(jù)結(jié)構(gòu)的任何類型的存儲(chǔ)器,例如隨機(jī)存取存儲(chǔ)器 (RAM)、磁盤(pán)或硬盤(pán)、數(shù)字視頻光盤(pán)(DVD)、光盤(pán)(⑶)、只讀閃存(ROM)和U盤(pán)?;蛘撸臋n處 理引擎36可以改變文檔識(shí)別框架的布置方式和/或遍歷路徑,以區(qū)分最近所識(shí)別的安全性 文檔類型的優(yōu)先順序。
14
圖3為流程圖,示出了圖1中文檔驗(yàn)證系統(tǒng)10的示例操作。首先,主機(jī)系統(tǒng)20將 一個(gè)或多個(gè)文檔類型對(duì)象存儲(chǔ)到按照動(dòng)態(tài)文檔識(shí)別框架的數(shù)據(jù)結(jié)構(gòu),例如圖2中的文檔識(shí) 別框架34。接著,用戶將安全性文檔12(如護(hù)照)置于圖像捕捉設(shè)備11下方的觀察框架 14中(50)。主機(jī)系統(tǒng)20接收并存儲(chǔ)安全性文檔12的一個(gè)或多個(gè)捕捉圖像的序列(52)。一旦被存儲(chǔ),主機(jī)系統(tǒng)20就通過(guò)遍歷文檔識(shí)別框架34來(lái)識(shí)別捕獲圖像。主機(jī)系 統(tǒng)20通過(guò)選擇性地調(diào)用一個(gè)或多個(gè)文檔識(shí)別軟件模塊41而遍歷數(shù)據(jù)結(jié)構(gòu),以便將未知文 檔識(shí)別為存儲(chǔ)在文檔識(shí)別框架34中的多個(gè)文檔類型對(duì)象中的一個(gè)(54)。動(dòng)態(tài)文檔識(shí)別框 架指定準(zhǔn)則以確保數(shù)據(jù)結(jié)構(gòu)保持可擴(kuò)展、靈活和高效。也就是說(shuō),動(dòng)態(tài)文檔識(shí)別框架指定用 于遍歷對(duì)象、編輯對(duì)象或從數(shù)據(jù)結(jié)構(gòu)中刪除對(duì)象、以及在數(shù)據(jù)結(jié)構(gòu)中插入對(duì)象的協(xié)議,或更 一般地說(shuō),指定用于保持文檔類型數(shù)據(jù)結(jié)構(gòu)32完整性的協(xié)議。識(shí)別未知文檔時(shí)(除非沒(méi)有發(fā)現(xiàn)匹配且文檔被拒絕),主機(jī)系統(tǒng)20可在驗(yàn)證流程 中根據(jù)所識(shí)別的具體文檔類型對(duì)象所特有的某些安全性特征的可用性來(lái)驗(yàn)證安全性文檔 (56)。例如,識(shí)別流程可能導(dǎo)致將安全性文檔識(shí)別為美國(guó)護(hù)照文檔類型對(duì)象。在驗(yàn)證流程 中,主機(jī)系統(tǒng)20可以訪問(wèn)數(shù)據(jù)結(jié)構(gòu)34內(nèi)的美國(guó)護(hù)照文檔類型對(duì)象,以確定涉及驗(yàn)證美國(guó)護(hù) 照的安全性特征。主機(jī)系統(tǒng)20接著可以調(diào)用文檔類型對(duì)象所涉及的正確流程來(lái)開(kāi)始驗(yàn)證 所有相關(guān)的安全性特征,方法例如讀取MRZ、執(zhí)行各種圖像模板匹配算法,匹配算法包括搜 索水印、反射徽章或其它此類標(biāo)記以及掃描文本的一致性。一旦完成,主機(jī)系統(tǒng)20就可以 通過(guò)顯示器43向用戶顯示識(shí)別流程、驗(yàn)證流程或二者的結(jié)果以及其它所收集到的信息,或 者生成任何其它合適的聲音或視覺(jué)指示標(biāo)記(58)。圖4為流程圖,更詳細(xì)地示出了圖2中的主機(jī)系統(tǒng)20的示例操作。主機(jī)系統(tǒng)20 通過(guò)分析安全性文檔12的至少一幅捕捉圖像來(lái)校驗(yàn)圖1中的安全性文檔12。如上文所述, 主機(jī)系統(tǒng)20通過(guò)數(shù)據(jù)接口 24接收安全性文檔12的捕捉圖像,以用于供文檔處理圖像引擎 36進(jìn)行預(yù)處理(60)。文檔處理引擎36包括圖像處理模塊38,其可確定捕捉圖像是否需要進(jìn)一步處理, 從而有利于識(shí)別和驗(yàn)證流程(62)。在確定捕捉圖像需要額外的圖像處理時(shí)(“是”分支, 64),圖像處理模塊38可以執(zhí)行一個(gè)或多個(gè)圖像加強(qiáng)算法以增強(qiáng)捕捉圖像的質(zhì)量(66),并 且完成之后,將捕捉圖像傳輸?shù)轿臋n識(shí)別模塊40進(jìn)行識(shí)別。如果不需要進(jìn)一步的圖像處理 時(shí)(“否”分支,64),圖像處理模塊38直接將捕捉圖像傳輸?shù)轿臋n識(shí)別模塊40進(jìn)行識(shí)別。文檔識(shí)別模塊40通過(guò)從框架的根對(duì)象開(kāi)始遍歷文檔識(shí)別框架34來(lái)啟動(dòng)識(shí)別流程 (68)。一般來(lái)講,文檔識(shí)別模塊40可以按照三層控制遍歷文檔識(shí)別框架34,以獲得更高的 性能。根據(jù)基于優(yōu)先級(jí)的第一種遍歷方法,文檔識(shí)別模塊40可以按照與存儲(chǔ)在文檔識(shí)別框 架中的文檔類型對(duì)象相關(guān)的優(yōu)先級(jí)遍歷文檔識(shí)別框架34,其中優(yōu)先級(jí)可以由用戶預(yù)定義。 根據(jù)基于隊(duì)列的第二種遍歷方法,文檔識(shí)別模塊40可以訪問(wèn)隊(duì)列數(shù)據(jù)結(jié)構(gòu)46以確定之前 剛剛處理的文檔類型對(duì)象,并且遍歷這些存儲(chǔ)在文檔識(shí)別框架34中的文檔類型對(duì)象。根據(jù) 第三種動(dòng)態(tài)遍歷方法,文檔識(shí)別模塊40動(dòng)態(tài)地遍歷整個(gè)文檔識(shí)別框架34。也就是說(shuō),文檔 識(shí)別模塊40可以從文檔識(shí)別框架34的根對(duì)象開(kāi)始,調(diào)用在框架各父節(jié)點(diǎn)對(duì)象處所涉及的 多個(gè)分類器47中的一個(gè)或多個(gè)。根據(jù)從調(diào)用這些分類器47接收的結(jié)果,文檔識(shí)別模塊40 可以選擇父節(jié)點(diǎn)的一個(gè)或多個(gè)子節(jié)點(diǎn),向下遍歷存儲(chǔ)在文檔識(shí)別框架34中的較低級(jí)對(duì)象。 文檔識(shí)別模塊40可以應(yīng)用與父節(jié)點(diǎn)或所選子節(jié)點(diǎn)相關(guān)的一個(gè)或多個(gè)校驗(yàn)器48,以確認(rèn)安全性文檔具有分類器所選路徑的正確特性。此遍歷識(shí)別可以繼續(xù)進(jìn)行,直至文檔識(shí)別模塊40到達(dá)涉及與文檔屬性匹配的一 組一個(gè)或多個(gè)分類器的葉節(jié)點(diǎn),從而將捕捉圖像識(shí)別為相對(duì)于存儲(chǔ)在文檔識(shí)別框架34中 的多個(gè)文檔類型對(duì)象為高于預(yù)定閾值的最佳匹配或滿意匹配。文檔識(shí)別模塊40可以應(yīng)用(順序或一前一后)任意前述遍歷方法中的兩種或多 種。因此,文檔識(shí)別模塊40可以例如首先訪問(wèn)隊(duì)列數(shù)據(jù)結(jié)構(gòu)48,按照隊(duì)列遍歷數(shù)據(jù)結(jié)構(gòu),接 著通過(guò)選擇性地調(diào)用多個(gè)分類器47中的一個(gè)或多個(gè)動(dòng)態(tài)地遍歷數(shù)據(jù)結(jié)構(gòu)34。根據(jù)文檔識(shí)別框架34的遍歷,文檔識(shí)別模塊40將捕捉圖像識(shí)別為存儲(chǔ)在文檔識(shí) 別框架34中的多個(gè)文檔類型對(duì)象中的一個(gè)(70)。如上文所述,動(dòng)態(tài)地遍歷文檔識(shí)別框架34 時(shí),文檔識(shí)別模塊40可以計(jì)算確定性值并且將這些確定性值與其它確定性值或預(yù)指定的 最小確定性值進(jìn)行比較,以便正確地識(shí)別捕捉圖像。一旦進(jìn)行了識(shí)別,文檔識(shí)別模塊40就 可以通過(guò)顯示器43將所識(shí)別的文檔類型對(duì)象與確定性值一起向用戶顯示以供確認(rèn)(72)。在完成識(shí)別并且用戶確認(rèn)之后,如果需要,文檔識(shí)別模塊40將捕捉圖像與所識(shí)別 的文檔類型對(duì)象或其參照一起傳輸?shù)轿臋n驗(yàn)證模塊42。文檔驗(yàn)證模塊42如上文所述進(jìn)行 驗(yàn)證流程,以確定安全圖像12的真實(shí)性(74)并且通過(guò)顯示器43顯示此驗(yàn)證結(jié)果(76)。圖5為框圖,更詳細(xì)地示出了圖2中的文檔識(shí)別框架34。如圖5所示,文檔識(shí)別 框架34包括樹(shù)形數(shù)據(jù)結(jié)構(gòu);然而,文檔識(shí)別框架34可以包括能夠存儲(chǔ)多個(gè)文檔類型對(duì)象 78A-78M( “文檔類型對(duì)象78”)的其它數(shù)據(jù)結(jié)構(gòu)類型。在此例中,文檔識(shí)別框架34包括根對(duì)象80、多個(gè)文檔類型對(duì)象78和多個(gè)文檔子 類型對(duì)象82A-82M( “文檔子類型對(duì)象82”)。此外,此樹(shù)形結(jié)構(gòu)可按子-子類型文檔對(duì)象 向下擴(kuò)展,以及按相同構(gòu)造更加遞歸地向下擴(kuò)展。根對(duì)象80表示示例性樹(shù)形文檔識(shí)別框架 34的根部,或更一般地說(shuō),如果按照上文所述的動(dòng)態(tài)遍歷方法獨(dú)自遍歷,即為文檔識(shí)別模塊 40開(kāi)始遍歷的對(duì)象。根對(duì)象80保持將根對(duì)象80連接到各文檔類型對(duì)象78的雙向連接 84A-84M(如指針)。文檔類型對(duì)象78還保持將文檔類型對(duì)象78連接到文檔子類型對(duì)象82 的雙向連接84N-84Z。連接84A-84Z( “連接84”)可以包括指明根對(duì)象80、文檔類型對(duì)象 78和文檔子類型對(duì)象82中的一個(gè)在數(shù)據(jù)庫(kù)32中的存儲(chǔ)位置的參照。通常,文檔類型對(duì)象 78和文檔子類型對(duì)象表示安全性文檔類別、子類別和各個(gè)文檔類型(葉節(jié)點(diǎn))基于安全性 文檔的通用物理屬性、安全性特征或布局特性的分層組織結(jié)構(gòu)。雖然所示示例具有三層結(jié) 構(gòu),但可以重復(fù)任意數(shù)量的層級(jí)以分類并最終單獨(dú)識(shí)別安全性文檔的類型。根對(duì)象80包括至少一個(gè)涉及圖2中多個(gè)分類器47中的一個(gè)或多個(gè)的分類器對(duì) 象86N。這些參照可以在所涉及的分類器47駐留的存儲(chǔ)器中指定唯一的標(biāo)識(shí)符、名稱或位 置地址。作為父節(jié)點(diǎn),文檔類型對(duì)象78包括多個(gè)分類器對(duì)象86,并且某些分類器可被復(fù) 制。如圖5所示,各文檔類型對(duì)象78包括各自分類器對(duì)象86A-86M的參照。各分類器對(duì)象 86A-86M( “分類器對(duì)象86”)涉及多個(gè)包含用于進(jìn)行“分類器流程”的可執(zhí)行軟件的分類器 47中的一個(gè)或多個(gè),以評(píng)估待識(shí)別安全性文檔的一個(gè)或多個(gè)特性或?qū)傩?。各文檔類型對(duì)象 78還可以包括各自的優(yōu)先級(jí)值88A-88M( “優(yōu)先級(jí)值88”),雖然再次說(shuō)明文檔類型對(duì)象78 不需要包括優(yōu)先級(jí)值。如上文所述,優(yōu)先級(jí)值88可以描述文檔識(shí)別模塊40遍歷文檔識(shí)別 框架34的某一遍歷順序。雖然在圖5中未示出,文檔類型對(duì)象78或文檔子對(duì)象類型82中的任一個(gè)可以包
16含對(duì)校驗(yàn)器對(duì)象90A-90M的參照,可以應(yīng)用對(duì)校驗(yàn)器對(duì)象90A-90M的參照來(lái)確認(rèn)安全性文 檔對(duì)于分類器86所選擇的路徑而言具有正確特性。在到達(dá)葉節(jié)點(diǎn)時(shí),應(yīng)用一組一個(gè)或多個(gè) 驗(yàn)證器來(lái)確認(rèn)安全性文檔的真實(shí)性。文檔子類型對(duì)象82表示葉節(jié)點(diǎn),而且同樣地,各文檔子類型對(duì)象82包括涉及一個(gè) 或多個(gè)驗(yàn)證器49的各自驗(yàn)證器對(duì)象93A-93M。此外,文檔子類型對(duì)象82包括各自的模板數(shù) 據(jù)91A-91M( “模板數(shù)據(jù)91”)以及一個(gè)或多個(gè)各自的最小確定性值92A-92M( “最小確定性 值92”)。驗(yàn)證器對(duì)象93A-93M通過(guò)指針或唯一的標(biāo)識(shí)符涉及多個(gè)驗(yàn)證器49中的一個(gè)或多 個(gè),用于進(jìn)行比較或以其它方式確認(rèn)是否存在父節(jié)點(diǎn)的各自分類器或潛在的任何校驗(yàn)器所 收集的具體屬性或特性,以便確認(rèn)安全性文檔12的類型。雖然在圖5中未示出,但在一些 實(shí)施例中,各文檔子類型對(duì)象82可以包括多個(gè)校驗(yàn)器對(duì)象,其中這些多個(gè)校驗(yàn)器對(duì)象中的 每一個(gè)都涉及一個(gè)或多個(gè)校驗(yàn)器流程。模板數(shù)據(jù)91通常定義任意模板圖像、布局特性、安 全性特征以及在分類和/或校驗(yàn)文檔子類型對(duì)象82中的具體一個(gè)時(shí)可能需要的其它相關(guān) 數(shù)據(jù)。通常,根據(jù)文檔識(shí)別模塊40在文檔識(shí)別框架34中的當(dāng)前位置,校驗(yàn)器48返回符合 可能的文檔類型或子類型對(duì)象的分類器流程的具體屬性的確定性值。例如,如上文所述,文 檔節(jié)點(diǎn)的一組具體分類器47和各自的校驗(yàn)器可以返回可與待分析的當(dāng)前安全性文檔類型 相對(duì)應(yīng)的子文檔類型對(duì)象78的分級(jí)集。文檔識(shí)別模塊40可以將返回的確定性值與各自的 最小確定性值92中的一個(gè)進(jìn)行比較。為了識(shí)別當(dāng)前的安全性文檔12,文檔識(shí)別模塊40通常按照動(dòng)態(tài)遍歷方法遍歷文 檔識(shí)別框架34。通過(guò)此動(dòng)態(tài)方法,文檔識(shí)別模塊40從根對(duì)象80開(kāi)始,以便調(diào)用由分類器對(duì) 象86N涉及的分類器47。這些初始分類器47分析捕捉圖像以及從安全性文檔12獲得的其 它數(shù)據(jù),然后返回由子節(jié)點(diǎn)表示的可能的文檔類型對(duì)象的集,即文檔類型對(duì)象78。該集可以 指定文檔類型對(duì)象78的任一個(gè)或多個(gè)。在遍歷到文檔類型對(duì)象78中的一個(gè)上時(shí),文檔識(shí)別模塊40會(huì)訪問(wèn)相關(guān)的分類器 對(duì)象86A-86M,調(diào)用所涉及的分類器47,以及接收可能的屬性或特性的集。然后對(duì)于各子文 檔對(duì)象,使用各自的校驗(yàn)器對(duì)象90A-90M與預(yù)期值進(jìn)行比較并且生成相似性確定性因子, 然后根據(jù)這些,在安全性文檔和子文檔類型之間分級(jí)匹配相似性,用于最終選擇到文檔子 類型對(duì)象82的一條或多條路徑。這樣,便可垂直遍歷框架34以進(jìn)行分類、子分類并最終識(shí) 別安全性文檔。可沿著樹(shù)形結(jié)構(gòu)向下重復(fù)遍歷,直至到達(dá)表示具體安全性文檔的葉節(jié)點(diǎn)。這些分 類器47和校驗(yàn)器48可以返回一個(gè)或多個(gè)確定性值,文檔識(shí)別模塊40可以根據(jù)存儲(chǔ)在正在 遍歷的文檔子類型對(duì)象82中的公式計(jì)算這些確定性值的加權(quán)平均數(shù)。利用此加權(quán)平均數(shù), 文檔識(shí)別模塊40可以將加權(quán)平均數(shù)與和正在遍歷的文檔子類型對(duì)象82相關(guān)的最小確定性 值92進(jìn)行比較,以確認(rèn)安全性文檔12是否確實(shí)是該安全性文檔的具體類型。如果加權(quán)平 均數(shù)不符合或超出相關(guān)的最小確定性值92,文檔識(shí)別模塊40可能不再考慮與文檔子類型 對(duì)象82相關(guān)的整個(gè)分支,從而提高效率。文檔標(biāo)識(shí)模塊40可以繼續(xù)重復(fù)上述分類器對(duì)象 86返回的可能的文檔子類型的剩余集,直至放棄或存儲(chǔ)確定性值供進(jìn)一步考慮。在分析完集內(nèi)的所有文檔子類型對(duì)象82之后,文檔識(shí)別模塊40可以將與剩余的 文檔子類型對(duì)象82相關(guān)的確定性值相互比較并且例如通過(guò)選擇最大確定性值來(lái)識(shí)別最佳 確定性值,從而結(jié)束對(duì)文檔識(shí)別框架34的遍歷。文檔識(shí)別模塊40可以將此所識(shí)別的確定性值以及相關(guān)的文檔類型對(duì)象78或子類型對(duì)象82傳輸?shù)接脩艚缑?8,以通過(guò)顯示器43進(jìn) 行顯示。可以要求用戶認(rèn)可此所識(shí)別的文檔類型對(duì)象78或子類型對(duì)象82,或以其它方式確 認(rèn)文檔識(shí)別模塊40根據(jù)對(duì)捕捉圖像的分析正確地識(shí)別出安全性文檔12。圖6為流程圖,示出了如圖5所示按照動(dòng)態(tài)遍歷方法遞歸地遍歷文檔識(shí)別框架34 時(shí)圖2中文檔識(shí)別模塊40的示例操作。雖然下文所述涉及動(dòng)態(tài)遍歷方法,但文檔識(shí)別模塊 40可以按照任何其它方法或其組合遍歷文檔識(shí)別框架34,包括按照存儲(chǔ)在隊(duì)列數(shù)據(jù)結(jié)構(gòu) 46中的文檔類型對(duì)象78的參照、按照優(yōu)先級(jí)88以及這些方法的任意組合遍歷文檔識(shí)別框 架34。文檔識(shí)別模塊40初始接收安全性文檔12的捕捉圖像以及任選的其它數(shù)據(jù)(如 RFID數(shù)據(jù)),然后訪問(wèn)文檔識(shí)別框架34的根對(duì)象80,以開(kāi)始遍歷文檔識(shí)別模塊40并且將根 對(duì)象作為當(dāng)前處理文檔進(jìn)行處理(94)。文檔識(shí)別模塊40可以例如訪問(wèn)與當(dāng)前文檔相關(guān)的 分類器對(duì)象86A,從而調(diào)用分類器對(duì)象86A涉及的多個(gè)分類器47中的一個(gè)或多個(gè),即分類器 流程(95)。作為此調(diào)用的響應(yīng),文檔識(shí)別模塊40會(huì)計(jì)算可能的屬性或特性集。文檔識(shí)別模 塊40可以從此節(jié)點(diǎn)處的此文檔對(duì)象接收可能的文檔子類型對(duì)象集,并且該集通常包括一 個(gè)或多個(gè)文檔子類型對(duì)象78(96)。例如,可能的文檔類型對(duì)象的一個(gè)示例集可以包括文檔 類型對(duì)象78A和78M。給定此可能的文檔類型對(duì)象集,即“子類型集”,文檔識(shí)別模塊40繼 續(xù)按照類型集遍歷文檔識(shí)別框架34(96)。文檔識(shí)別模塊40通過(guò)訪問(wèn)類型集中所返回的第一文檔類型對(duì)象78A及其相關(guān)的 分類器對(duì)象86向下移動(dòng)一層文檔識(shí)別框架34。如果文檔類型對(duì)象78A的任何校驗(yàn)器確認(rèn) 分類器對(duì)象86所提取的屬性(或如同本例中,不存在校驗(yàn)器對(duì)象),則文檔識(shí)別框架34現(xiàn) 在將文檔類型對(duì)象78A作為當(dāng)前文檔處理并且使用分類器對(duì)象86A計(jì)算可能屬性或特征的 附加集(95)。然后文檔識(shí)別模塊40再向下移動(dòng)一層,以檢查其各子子文檔82A-82D,S卩“子 類型集”(96)。文檔識(shí)別模塊40接著按照此新的子類型集遍歷文檔識(shí)別框架34(96)。文檔識(shí)別模塊40通過(guò)訪問(wèn)子類型集中所返回的第一文檔子類型對(duì)象82A及其相 關(guān)的分類器對(duì)象90A向下移動(dòng)文檔識(shí)別框架34。文檔識(shí)別模塊40調(diào)用相關(guān)的校驗(yàn)對(duì)象90A 所涉及的一個(gè)或多個(gè)校驗(yàn)器48以及驗(yàn)證器對(duì)象92A所涉及的一個(gè)或多個(gè)驗(yàn)證器49(因?yàn)?這是葉節(jié)點(diǎn)),然后接收確定性值集(97)。在確定該確定性值時(shí),校驗(yàn)器48可以訪問(wèn)相關(guān) 的模板數(shù)據(jù)91A。該確定性值反映與相關(guān)的模板數(shù)據(jù)91A比較時(shí),相對(duì)于由一對(duì)所調(diào)用的分 類器47和校驗(yàn)器48對(duì)捕捉圖像執(zhí)行的分析的相似性水平。例如,確定性值為100可以反 映相關(guān)的模板數(shù)據(jù)91A與捕捉圖像之間的完美匹配,而確定性值為80可以反映相關(guān)的模板 數(shù)據(jù)91A與捕捉圖像之間的足夠匹配,但可能指示捕捉圖像的一個(gè)或多個(gè)特性沒(méi)有與相關(guān) 的模板數(shù)據(jù)91完美匹配,零則表示完全不匹配。在一些實(shí)施例中,文檔識(shí)別模塊40將調(diào)用 的校驗(yàn)器48所返回的各確定性值與最小確定性值92A進(jìn)行比較,并且在失敗時(shí)停止檢查此 子文檔或從此節(jié)點(diǎn)開(kāi)始的整個(gè)分支(98),或?qū)⒆游臋n的組合確定性值設(shè)置為零。在其它實(shí) 施例中,文檔識(shí)別模塊40將此帶有捕捉圖像的子文檔的組合確定性值計(jì)算為從校驗(yàn)器48 的所有調(diào)用返回的所有確定性值的加權(quán)平均數(shù)(102),并且將該加權(quán)平均數(shù)與最小確定性 值92A進(jìn)行比較,從而只存儲(chǔ)超過(guò)最小確定性值92A的那些加權(quán)平均數(shù)(104)。如果此子文檔被確認(rèn)達(dá)到最小確定性值,則檢查節(jié)點(diǎn)是否為文檔樹(shù)形結(jié)構(gòu)的分支 節(jié)點(diǎn)并且具有子子文檔,即父節(jié)點(diǎn)(106)。如果它在其下級(jí)具有一些子子文檔,此子文檔將
18作為當(dāng)前文檔處理,并且文檔識(shí)別模塊通過(guò)重復(fù)上文所述流程再向下移動(dòng)一層文檔樹(shù)形結(jié) 構(gòu)(95)。這是以深度優(yōu)先遞歸方式實(shí)現(xiàn)的,沿整個(gè)文檔樹(shù)形結(jié)構(gòu)下移,直至到達(dá)葉節(jié)點(diǎn)。一旦完成子類型集中的一個(gè)文檔子類型對(duì)象82,文檔識(shí)別模塊40就可以確定是 否已完成重復(fù)通過(guò)子類型集(108)。如果未完成重復(fù)通過(guò)子類型集,文檔識(shí)別模塊40會(huì)通 過(guò)訪問(wèn)另一個(gè)文檔子類型對(duì)象82、調(diào)用其相關(guān)校驗(yàn)器對(duì)象90所涉及的校驗(yàn)器48、接收確定 性值、以及根據(jù)比較存儲(chǔ)確定性值,而繼續(xù)重復(fù)通過(guò)該子類型集(96-108)。如果已完成,文 檔識(shí)別模塊40會(huì)通過(guò)計(jì)算得到的相關(guān)確定性值對(duì)所有子文檔進(jìn)行分級(jí),以完成給定文檔 節(jié)點(diǎn)處的路徑選擇處理的循環(huán)(110)。下一步根據(jù)當(dāng)前處理的文檔是根文檔還是父文檔類 型來(lái)確定返回結(jié)果的位置(112)。如果是子子文檔,控制上移一層文檔樹(shù)并且返回其父文檔 (114),并且子子文檔的確定性值與父文檔合并。否則,文檔識(shí)別模塊40完成重復(fù)通過(guò)整個(gè) 文檔樹(shù),文檔識(shí)別模塊40根據(jù)存儲(chǔ)的確定性值識(shí)別捕捉圖像(116)。文檔識(shí)別模塊40可以 將所有存儲(chǔ)的確定性值相互比較然后選擇最大的確定性值,從而將捕捉圖像識(shí)別為屬于與 最大確定性值相關(guān)的文檔子類型對(duì)象82。在上文已對(duì)文檔識(shí)別模塊40遍歷文檔識(shí)別框架34的操作進(jìn)行了說(shuō)明。文檔識(shí)別 框架34通過(guò)動(dòng)態(tài)文檔識(shí)別框架存儲(chǔ)文檔類型對(duì)象78和文檔子類型對(duì)象82。該框架是“動(dòng) 態(tài)的”,原因在于遍歷的順序隨安全性文檔的屬性和特性而有所變化,并且該框架有利于通 過(guò)布局編輯器30分別更新、刪除和插入文檔類型和子類型對(duì)象78、80。動(dòng)態(tài)文檔識(shí)別框架 提供可能出現(xiàn)這些動(dòng)態(tài)更新、刪除和插入的協(xié)議,從而保持識(shí)別安全性文檔12的可擴(kuò)展的 靈活框架。該框架的靈活性在于可以識(shí)別多種不同類型的制品,包括美國(guó)和外國(guó)護(hù)照、美國(guó) 和外國(guó)駕駛執(zhí)照、美國(guó)和外國(guó)身份證以及商業(yè)票據(jù)。該框架的可擴(kuò)展性在于包括文檔類型 子類型的一個(gè)或多個(gè)文檔類型可以快速添加到框架以及插入文檔識(shí)別框架34中,下文將 更為詳細(xì)地說(shuō)明。圖7A-7C為由布局編輯器30通過(guò)顯示器43展示給用戶的窗口 118的屏幕截圖。 畫(huà)面118包括文檔選項(xiàng)卡119、表示為文檔類型對(duì)象120的可擴(kuò)展列表的識(shí)別框架34以及 視圖子窗口 121。文檔類型對(duì)象列表120包括一個(gè)或多個(gè)文本區(qū)域,每個(gè)區(qū)域涉及圖5中的 多個(gè)文檔類型對(duì)象78中的一個(gè)。例如,文檔類型對(duì)象78A可包括“DOCument-2Line44”文 檔類型,如圖7A中列表120的第一項(xiàng)所示。因此,文檔類型對(duì)象列表120顯示可以由文檔 識(shí)別框架34定義的示例性組織分層結(jié)構(gòu)。視圖子窗口 121通常顯示存儲(chǔ)到數(shù)據(jù)庫(kù)32并且 與文檔類型對(duì)象列表120中所選的一個(gè)項(xiàng)目相關(guān)的任意相關(guān)模板數(shù)據(jù)91。圖7B顯示用戶選擇此文檔類型識(shí)別流程的項(xiàng)目130之后的窗口 118。作為此選擇 的響應(yīng),布局編輯器30將彈出窗口 132與窗口 118重疊,其中彈出窗口 132允許用戶編輯與 項(xiàng)目130相關(guān)的校驗(yàn)器對(duì)象90中的一個(gè),以定義一個(gè)文檔類型的識(shí)別流程。在此例中,彈 出窗口 132包括最小確定性值輸入134、光源選擇輸入136、現(xiàn)有的校驗(yàn)器流程選擇框138A 和使用過(guò)的校驗(yàn)器流程選擇框138B。用戶可以通過(guò)與最小確定性輸入134交互來(lái)將最小確 定性值與此文檔類型相關(guān)聯(lián),例如將最小確定性值92A與圖5中的文檔子類型對(duì)象82A相 關(guān)聯(lián)。用戶還可以指定在通過(guò)光選擇輸入136捕捉安全性文檔12的圖像時(shí)要使用的參照 光源,例如可見(jiàn)光、紫外線和紅外線。用戶也以可通過(guò)現(xiàn)有的校驗(yàn)器流程選擇框138編輯校 驗(yàn)器對(duì)象90A中的一個(gè)當(dāng)前所涉及的校驗(yàn)器48。最后用戶可通過(guò)使用過(guò)的校驗(yàn)器流程選擇 框138B將額外的校驗(yàn)器48與校驗(yàn)器對(duì)象90A相關(guān)聯(lián)或移動(dòng)到校驗(yàn)器對(duì)象90A。
圖7C顯示在用戶選擇當(dāng)前校驗(yàn)器選項(xiàng)卡140來(lái)配置分類器47或校驗(yàn)器48中的 一個(gè)的具體應(yīng)用之后被彈出窗口 132重疊的窗口 118。如圖7C所示,用戶當(dāng)前正在編輯 “CDocVerifierDominantColor”流程,該流程分析捕捉圖像的主色彩并且將該分析與參照 輸入142中所指定的參照進(jìn)行比較。彈出窗口 132包括參照輸入142,使得用戶可手動(dòng)編輯 這些參照。例如,主色彩流程將捕捉圖像的分析結(jié)果與參照輸入142中所定義的色彩范圍 進(jìn)行比較,在參照輸入中,指定品紅百分比為0. 007、紅色百分比為15. 021、黃色百分比為 34. 547等。用戶可手以動(dòng)編輯這些單獨(dú)的百分比(如藍(lán)色突出顯示區(qū)域所示),或者用戶 可以選擇學(xué)習(xí)按鈕144,如果用戶有可即刻掃描的物理模板,布局編輯器30將利用此前或 即時(shí)掃描到系統(tǒng)中的模板圖像得知這些參照。彈出窗口 132還包括權(quán)重輸入146和具體最小確定性輸入148。用戶可以將權(quán)重 值輸入到權(quán)重輸入146中,使得在計(jì)算多個(gè)調(diào)用的校驗(yàn)器48的加權(quán)平均數(shù)時(shí),文檔識(shí)別模 塊40在計(jì)算加權(quán)平均數(shù)時(shí)使用此指定的權(quán)重值。相似地,用戶可以將具體的最小確定性輸 入到輸入148中以便在遍歷時(shí)使用,如上文圖6中的步驟98所述。這樣,用戶便可以動(dòng)態(tài) 地配置分類器47和校驗(yàn)器48,將分類器47和校驗(yàn)器48與具體對(duì)象86、90相關(guān)聯(lián),然后通 過(guò)配置權(quán)重和最小確定性值動(dòng)態(tài)地修改框架34的遍歷。圖8A、8B為主機(jī)系統(tǒng)20完成識(shí)別和隨后的驗(yàn)證之后,通過(guò)顯示器43由圖2中的 示范用戶界面28展示給用戶的窗口 150的屏幕截圖。此文檔被識(shí)別為當(dāng)前標(biāo)準(zhǔn)版本的美 國(guó)紐約州駕駛執(zhí)照的正面。窗口 150包括識(shí)別置信度水平文本輸出152,其通常表示文檔識(shí) 別模塊40在識(shí)別流程中所計(jì)算出的加權(quán)確定性值。窗口 150還包括顯示驗(yàn)證結(jié)果的驗(yàn)證 詳細(xì)信息輸出154以及在選擇后提供識(shí)別流程結(jié)果的識(shí)別選項(xiàng)卡156。窗口 150還提供其 它相關(guān)信息,例如捕捉圖像158和源自捕捉圖像158分析結(jié)果的安全性文檔詳細(xì)信息160。圖8B所示為在用戶選擇識(shí)別選項(xiàng)卡156之后的窗口 150。用戶界面28在窗口 150 中提供文本輸出162,文本輸出162表示動(dòng)態(tài)地遍歷文檔識(shí)別框架34的結(jié)果。從文本輸出 162的頂部開(kāi)始,文檔識(shí)別模塊40首先遍歷到標(biāo)記有“21ine44”的文檔類型對(duì)象78中的一 個(gè)并且訪問(wèn)其相關(guān)的分類器對(duì)象86,于是文檔識(shí)別模塊40調(diào)用涉及的分類器47。由于測(cè) 試在“行計(jì)數(shù)”上失敗(如文本輸出162的第二行所示),因此結(jié)果返回沒(méi)有可用的文檔子 類型對(duì)象82。接著,文檔識(shí)別模塊40遍歷到標(biāo)記有“us_dl”的文檔類型對(duì)象82 (如文本輸出 162的第三行所示),然而按照文本輸出162的第四行,相關(guān)的分類器對(duì)象86在“識(shí)別”通用 美國(guó)駕駛執(zhí)照時(shí)再次失敗。最后,當(dāng)遍歷到標(biāo)記有“us_dl_ny”的文檔類型對(duì)象78時(shí),文檔 識(shí)別模塊40發(fā)現(xiàn)匹配(如文本輸出162的第六行所示)并且接收文檔子類型對(duì)象集。遍 歷此子類型集時(shí),文檔識(shí)別模塊40調(diào)用如行7-13所示的涉及的分類器47和校驗(yàn)器48,每 行返回一個(gè)“cf”值?!癱f”值反映各校驗(yàn)器所確定的確定性值,“min_cf”值表示通過(guò)各校 驗(yàn)器所需的最小確定性值。文本輸出162的第6行顯示所進(jìn)行的“cf”值的加權(quán)平均數(shù)的 比較結(jié)果、或通過(guò)確認(rèn)捕捉圖像被“識(shí)別為第14行中的[文檔對(duì)象]US_dl_ny”以及為“具 體的[子類型對(duì)象]標(biāo)準(zhǔn)前版本]”的確定性值。圖9為框圖,更詳細(xì)地示出了圖2中主機(jī)系統(tǒng)20的存儲(chǔ)器結(jié)構(gòu)的一部分。在此限 制性實(shí)例中,分類器47和校驗(yàn)器48包括布局匹配流程164A和Eigenimage文檔匹配流程 164B。如圖9中所進(jìn)一步所示,文檔數(shù)據(jù)結(jié)構(gòu)34包括根對(duì)象166、文檔類型對(duì)象168和文檔
20子類型對(duì)象170。文檔類型對(duì)象168包括分類器對(duì)象172,文檔子類型對(duì)象170包括校驗(yàn)器 對(duì)象174、模板數(shù)據(jù)176和最小確定性值178。各對(duì)象168-174、模板數(shù)據(jù)176和最小確定 性值178可以基本上類似于結(jié)合圖5所述的那些對(duì)象。文檔識(shí)別框架34可以包括各對(duì)象 168-174、模板數(shù)據(jù)176和最小確定性值178中的多個(gè),并且此分類結(jié)構(gòu)還可遞歸地重復(fù)到 多個(gè)層中,但為了方便圖示,這些附加的對(duì)象未在圖9中示出。由于在文檔識(shí)別模塊40中使用了通用識(shí)別方法中的兩個(gè),布局匹配流程164A和 Eigenimage文檔匹配流程在縮小可能的候選者方面非常有效。這兩種方法也非常容易配置 為用于識(shí)別文檔。將在下文詳細(xì)討論這兩種方法。文檔識(shí)別模塊40并不僅限于這兩種方 法,并且提供靈活的編程結(jié)構(gòu)來(lái)融入新方法。一些其它常用的識(shí)別方法包括文檔大小、主色 彩、空白、灰度柱狀圖、文本和條形碼的OCR結(jié)果、模板匹配等等。圖10為流程圖,示出了遍歷文檔識(shí)別模塊40以調(diào)用圖9中的布局匹配流程164A 時(shí),在圖2中的文檔識(shí)別模塊40中所采用的處理步驟。該處理步驟的順序可應(yīng)用于參照?qǐng)D 像數(shù)據(jù)以建立文檔模板,或應(yīng)用于捕捉的實(shí)時(shí)圖像數(shù)據(jù)以識(shí)別文檔類型(180)??赏ㄟ^(guò)上文 所述的布局編輯器30手動(dòng)修改文檔參照模板數(shù)據(jù)??赏ㄟ^(guò)在某一光源下對(duì)亮背景或暗背 景、圖像或者灰色或彩色圖像的平面上的關(guān)聯(lián)暗區(qū)域進(jìn)行分段或分類來(lái)分析文檔布局。在調(diào)用布局匹配流程164A時(shí),文檔識(shí)別模塊40執(zhí)行布局匹配流程164A以確定 可能的文檔子類型對(duì)象集,即子類型集。首先,在進(jìn)行一些圖像質(zhì)量加強(qiáng)之后,圖像會(huì)使 用閾值轉(zhuǎn)換為二進(jìn)制圖像(182),然后根據(jù)黑色像素的連接情況分段為多個(gè)區(qū)域(184)。 接下來(lái),隔離的區(qū)域根據(jù)一些特征分類為一些類別,例如文本、條形碼、圖片、磁條、指紋等 (186),然后根據(jù)一些附加信息(例如大小、位置和方向)來(lái)表征各區(qū)域(188)。在大多數(shù)情 況下,例如對(duì)于條形碼、圖片、磁條和靜態(tài)文本,區(qū)域參照最好應(yīng)為中心。但有時(shí)對(duì)于可變區(qū) 域,例如名稱和地址的動(dòng)態(tài)文本,必須使用區(qū)域的左側(cè)。文檔是表示在具有類型和其它特性 的區(qū)域?qū)ο髽?shù)形結(jié)構(gòu)中(190),可按范圍將區(qū)域?qū)ο蠓纸M為以參照模板表示的分層結(jié)構(gòu),以 便人們更容易理解。雖然文檔的位置或其內(nèi)容可由于打印偏移、掃描時(shí)文檔的位移或其它 原因而變化,區(qū)域?qū)ο蟮南鄬?duì)位置在確定文檔類型時(shí)受到更嚴(yán)格的限制,但在閱讀器掃描 的應(yīng)用環(huán)境中圖像的移動(dòng)和旋轉(zhuǎn)受到限制。一旦針對(duì)捕捉圖像圖形化表示和連接不同的圖 像區(qū)域,文檔識(shí)別模塊40就可以進(jìn)一步將多個(gè)所連接的區(qū)域與關(guān)聯(lián)到存儲(chǔ)在數(shù)據(jù)庫(kù)中的 多個(gè)文檔類型對(duì)象中的一個(gè)的模板數(shù)據(jù)(例如圖9中的模板數(shù)據(jù)176)進(jìn)行比較(192)。一 般來(lái)講,模板數(shù)據(jù)176定義了多個(gè)預(yù)定義的連接圖像區(qū)域以及多個(gè)預(yù)定義的連接圖像區(qū)域 之間的關(guān)系,文檔識(shí)別模塊40將已確定的連接區(qū)域和關(guān)系與那些預(yù)定義的連接區(qū)域和關(guān) 系進(jìn)行比較。最后,文檔識(shí)別模塊40根據(jù)比較結(jié)果通過(guò)一致的相似性確定性值(97),例如 0至100,確定捕捉圖像是否屬于這些多個(gè)文檔類型對(duì)象中當(dāng)前正在進(jìn)行比較的一個(gè)(即文 檔類型對(duì)象178)中194)。圖11A至圖11C為示例性圖像,示出了當(dāng)圖2中的文檔識(shí)別模塊40執(zhí)行圖9中的 布局匹配流程164A時(shí)捕捉圖像的狀態(tài)。圖11A示出了進(jìn)行圖像處理和二進(jìn)制處理之后的 捕捉圖像194A(182)。雖然不要求執(zhí)行布局匹配流程164A,但應(yīng)用布局匹配流程164A的結(jié) 果可以通過(guò)執(zhí)行此類圖像處理而得到極大的增強(qiáng)。圖11B顯示執(zhí)行文檔分段法之后的捕捉 圖像194B(184)。文檔識(shí)別模塊40在執(zhí)行布局匹配流程164A時(shí),將捕捉圖像194B分段為 多個(gè)連接的區(qū)域196A-196N。圖11C所示為捕捉圖像的圖形化表示194C,其中多個(gè)連接區(qū)
21域196A-196N中的每一個(gè)均映射到節(jié)點(diǎn)198A-198N中的一個(gè)(190)。各節(jié)點(diǎn)198A-198N也 可以指定其它節(jié)點(diǎn)之間的關(guān)系。一旦圖形化表示捕捉圖像,文檔識(shí)別模塊40就可以將此圖形化表示194C與模板 數(shù)據(jù)(例如圖9中的模板數(shù)據(jù)176)進(jìn)行比較。根據(jù)布局匹配流程164A,文檔識(shí)別模塊40 可以進(jìn)行一個(gè)或多個(gè)不同的比較。例如,文檔識(shí)別模塊40可以簡(jiǎn)單地將圖形化表示194C 中存在的同類區(qū)域與模板數(shù)據(jù)176中存在的區(qū)域進(jìn)行比較。作為另一種選擇或除此區(qū)域類 型比較之外,文檔識(shí)別模塊40還可以將圖形化表示194C與存儲(chǔ)在模板數(shù)據(jù)176中的圖形 化表示按照諸如大小和位置等一些額外的限制條件或更嚴(yán)格的區(qū)域空間關(guān)系進(jìn)行比較???通過(guò)例如按照動(dòng)態(tài)編程算法的不精確圖形匹配來(lái)快速執(zhí)行這種圖形化比較。在圖形化表示 比較的某些情況下,文檔識(shí)別模塊40可以在特定于圖1中圖像捕捉設(shè)備11和文檔類型12 環(huán)境的比較中插入限制,例如有限的平移和旋轉(zhuǎn)限制、掩蔽的匹配限制、缺失或額外的區(qū)域 限制、動(dòng)態(tài)內(nèi)容限制以及不精確的分段和打印偏移限制。應(yīng)用這些限制中的一個(gè)或多個(gè)可 以顯著縮短執(zhí)行布局匹配識(shí)別流程164A所需的時(shí)間。有限的平移和旋轉(zhuǎn)限制對(duì)區(qū)域或整個(gè)文檔在進(jìn)行比較之前可旋轉(zhuǎn)的程度進(jìn)行了 限制。掩蔽的匹配限制可以過(guò)濾掉特定文檔的某些區(qū)域,以減少所需比較的數(shù)量。缺失或 額外的區(qū)域限制可以停止比較由于對(duì)捕捉圖像內(nèi)質(zhì)量不好或干擾嚴(yán)重的圖像進(jìn)行自定義 打印或不良圖像處理而造成的缺失、合并或額外區(qū)域。動(dòng)態(tài)內(nèi)容限制可以減少針對(duì)包含諸 如名稱和地址文本區(qū)域等動(dòng)態(tài)內(nèi)容的區(qū)域需要測(cè)量的關(guān)系的數(shù)量。不精確分段和打印偏移 限制可以組合兩個(gè)或更多個(gè)不正確分段的文本區(qū)域,從而減少進(jìn)行比較的區(qū)域的數(shù)量。圖12右側(cè)的流程圖示出了使用布局編輯器30訓(xùn)練eigenimage分類器47的操作 步驟(200-208)。作為一種信息壓縮方案,也稱為PCA (主成分分析),Eigenimage法可以 有效地將表達(dá)大量圖像的復(fù)雜性降低為少量標(biāo)準(zhǔn)正交的特征圖像,從而快速執(zhí)行對(duì)象識(shí)別 和其它工作。所關(guān)注的區(qū)域可為整個(gè)文檔區(qū)域或最好不包括動(dòng)態(tài)內(nèi)容的部分。此外,文檔 預(yù)處理可用于減小任何動(dòng)態(tài)內(nèi)容的影響。在任何情況下,第一步是收集所有可能的圖像模板或選擇性的典型圖像模板 (200)。所收集圖像模板的模板數(shù)據(jù)可以歸一化為零均值。接下來(lái)會(huì)形成數(shù)據(jù)矩陣,其中各 列存儲(chǔ)不同圖像模板的圖像數(shù)據(jù)(202)。各列中的各條目可以表示圖像模板的同一部分或 所有圖像區(qū)域。根據(jù)此數(shù)據(jù)矩陣的協(xié)方差矩陣計(jì)算特征矢量集并且按各自的特征值排序 (204)??梢岳脕?lái)自模板初始圖像數(shù)據(jù)的數(shù)據(jù)矩陣計(jì)算特征矢量,或通過(guò)轉(zhuǎn)置此數(shù)據(jù)矩 陣將特征矢量減少至更低的維數(shù);這兩種技術(shù)在數(shù)學(xué)層面上產(chǎn)生等同形式的結(jié)果??梢允?用閾值僅選擇具有足夠大特征值(即超過(guò)預(yù)定義閾值的特征值)的特征矢量(206)。作為 一個(gè)實(shí)例,可以應(yīng)用取舍點(diǎn),從而僅選擇在最大特征值10%之內(nèi)的特征值。這些所選特征 值的每一個(gè)均可以作為各自的特征圖像映射回去,如同利用轉(zhuǎn)置的數(shù)據(jù)矩陣計(jì)算并存儲(chǔ)它 們。上文所述的流程可視為在數(shù)學(xué)方面簡(jiǎn)化流程,因?yàn)樵紙D像通常具有非常高的維數(shù),并 且原始圖像被減少為更低的維數(shù)以更快地找到標(biāo)準(zhǔn)正交的特征矢量。然后將此特征矢量映 射回原始圖像的較高維數(shù)。特征圖像形式的最終表示可能更易于最終應(yīng)用捕捉圖像,如下 文所述。此所選標(biāo)準(zhǔn)正交的特征圖像集可以視為原始圖像數(shù)據(jù)集按最小二乘誤差意義的最 佳表示。圖12左側(cè)的流程圖示出了遍歷文檔識(shí)別框架34以調(diào)用圖9中的Eigenimage文檔匹配流程164B時(shí),圖2中文檔識(shí)別模塊40的操作步驟(210-216)。此處理步驟順序可以 (i)應(yīng)用于參照?qǐng)D像數(shù)據(jù)以建立文檔模板及預(yù)計(jì)算存儲(chǔ)在數(shù)據(jù)庫(kù)中的各文檔子類型對(duì)象的 參照權(quán)重系數(shù)矢量,或(ii)應(yīng)用于捕捉圖像數(shù)據(jù)以識(shí)別文檔類型(210)。調(diào)用Eigenimage文檔匹配流程164B時(shí),文檔識(shí)別模塊40會(huì)執(zhí)行Eigenimage文 檔匹配流程164B以計(jì)算由以上文所選標(biāo)準(zhǔn)正交特征圖像表示的捕捉圖像的權(quán)重系數(shù)矢量 (212)。通過(guò)捕捉圖像數(shù)據(jù)矢量(或參照?qǐng)D像數(shù)據(jù))乘以由所選標(biāo)準(zhǔn)正交特征圖像構(gòu)造的數(shù) 據(jù)矩陣以生成捕捉圖像的權(quán)重系數(shù)矢量來(lái)實(shí)現(xiàn)這一點(diǎn)。也就是說(shuō),數(shù)據(jù)矩陣的各列表示特 征圖像中的一個(gè),捕捉圖像數(shù)據(jù)矢量相乘生成系數(shù)矢量,其中各系數(shù)為由標(biāo)準(zhǔn)正交特征值 形成的多維空間中捕捉圖像的表示。接下來(lái),文檔識(shí)別模塊40將捕捉圖像數(shù)據(jù)的權(quán)重系數(shù) 矢量和與存儲(chǔ)在數(shù)據(jù)庫(kù)中的多個(gè)子類型對(duì)象中的一個(gè)(即各可能的參照文檔類型)相關(guān)的 各預(yù)計(jì)算的參照權(quán)重系數(shù)矢量進(jìn)行比較(214)。如此計(jì)算出兩個(gè)矢量相對(duì)于捕捉圖像權(quán)重 系數(shù)矢量和預(yù)計(jì)算的參照權(quán)重系數(shù)矢量的距離或相似性。通常文檔識(shí)別模塊40可以按照 以下四種標(biāo)準(zhǔn)距離計(jì)算法中的一種計(jì)算此距離l)Euclid距離,2)他讓1叫距離,3)((歸 一化互相關(guān)性)以及4)MahanalobiS距離?;诖司嚯x,文檔識(shí)別模塊40根據(jù)Eigenimage 文檔匹配流程164B確定制品是否屬于當(dāng)前正在比較的多個(gè)文檔子類型對(duì)象中的一個(gè),即 文檔子類型對(duì)象170 (216),并且通常根據(jù)最近鄰區(qū)(NN)進(jìn)行分類。可以按各可能的參照文 檔類型對(duì)象的確定性值的形式進(jìn)行確定,其中參照文檔類型對(duì)象按統(tǒng)一比例(如0至100) 表示距離。這樣,確定性值表示捕捉圖像的權(quán)重系數(shù)矢量與各可能的參照文檔的各自權(quán)重 系數(shù)矢量之間的距離是否小于預(yù)定義的閾值。圖13A至圖13C為示例性圖像,示出了當(dāng)文檔識(shí)別模塊(例如圖2中的文檔識(shí)別模 塊40)執(zhí)行Eigenimage文檔匹配流程(例如圖9中的Eigenimage文檔匹配流程164B)時(shí) 圖13C中捕捉圖像230的狀態(tài)。圖13A和圖13B示出了識(shí)別此文檔之前所用的示例性訓(xùn)練 圖像和結(jié)果。圖13A示出了一組七個(gè)美國(guó)駕駛執(zhí)照樣本加利福尼亞州和紐約州各兩種類 型,明尼蘇達(dá)州、蒙大拿州及其它州各一種類型。在實(shí)際應(yīng)用中,這組模板圖像可以處理數(shù) 百個(gè)或更多個(gè)圖像。布局編輯器30計(jì)算其在圖13B中所示的特征圖像和數(shù)值??蛇x擇此組 七個(gè)特征圖像僅使用其具有更高特征值的部分,以近似地表示原始的七個(gè)模板圖像。隨后, 圖13A中七個(gè)模板圖像的每一個(gè)乘以由所選特征圖像構(gòu)造的矩陣,生成作為存儲(chǔ)在數(shù)據(jù)庫(kù) 32中的此文檔子類型模板數(shù)據(jù)的參照權(quán)重系數(shù)矢量。如果有圖13C中的新捕捉圖像230,文檔識(shí)別模塊40就會(huì)調(diào)用圖9中的 Eigenimage文檔匹配流程164B,圖像數(shù)據(jù)乘以與上述相同的由所選特征圖像構(gòu)造的矩陣 以生成權(quán)重系數(shù)矢量。Eigenimage文檔匹配流程將此新的權(quán)重系數(shù)矢量與當(dāng)前正在比較的 多個(gè)文檔子類型對(duì)象(即圖13A中用于訓(xùn)練的七個(gè)美國(guó)駕駛執(zhí)照)相關(guān)的各預(yù)計(jì)算的參照 權(quán)重系數(shù)矢量進(jìn)行比較。例如,文檔識(shí)別模塊40可以使用Hamming距離算法或其它算法確 定新捕捉圖像數(shù)據(jù)與七個(gè)模板圖像數(shù)據(jù)之間的距離,以生成圖13C所示的示例性結(jié)果232。新捕捉圖像數(shù)據(jù)的結(jié)果232示出了按照Hamming距離算法,距與由所選特征圖像 構(gòu)成的多維空間中明尼蘇達(dá)州文檔子類型對(duì)象相關(guān)的模板數(shù)據(jù)的最短距離為518. 21。相較 于與其它六個(gè)文檔子類型對(duì)象相關(guān)的距離,此相對(duì)小得多的距離表示在根據(jù)最近鄰區(qū)(NN) 的文檔分類中具有更好的匹配。在使用文檔識(shí)別模塊40識(shí)別具體文檔類型之后,通過(guò)圖2中的文檔處理引擎36證明真實(shí)性的下一步驟是調(diào)用文檔驗(yàn)證模塊42來(lái)確認(rèn)是否存在所需特征。在實(shí)踐中,驗(yàn)證 特征為可與上述識(shí)別特征互換的概念,其意味著圖像分析方法可以應(yīng)用于驗(yàn)證器、校驗(yàn)器 或甚至分類器的實(shí)施中?;緶?zhǔn)則是在最短時(shí)間內(nèi)使用盡可能少特征以更低的正確文檔類 型拒絕率來(lái)進(jìn)行識(shí)別,而僅以更低的假冒錯(cuò)誤接受率從已識(shí)別文檔中調(diào)用所謂驗(yàn)證流程的 其它部分。本文提供了三種方法作為用于獲得所應(yīng)用印刷技術(shù)特性的示例性驗(yàn)證方法,來(lái)識(shí) 別假冒品。常見(jiàn)形式的假冒品使用替代形式的印刷技術(shù)(如復(fù)印)來(lái)復(fù)制原始文檔。在實(shí) 踐中,文檔驗(yàn)證模塊42可使用除本文所提供的三種示例性技術(shù)之外的更多方法。例如,凹版印刷為15世紀(jì)30年代發(fā)明于德國(guó)的原始文檔印刷方法,至今仍廣泛使 用。此方法雕刻或切成凹板,凹板中注入油墨并且增大紙張壓印區(qū)域的壓力以產(chǎn)生具有3D 效果的雕刻外觀。假冒品常用的廉價(jià)替代形式是熱圖像(凸起的油墨),其用于如常用名片 的印刷。在使用例如3M文檔閱讀器的CCD相機(jī)的透視環(huán)境下進(jìn)行觀察時(shí),可捕捉一些明顯 的3D視覺(jué)效果。與在3M名片樣品中一樣,圖14A中的圖像240由平面掃描器生成,而圖 14B中的圖像244由圖1中的文檔閱讀器11捕捉。如圖14B所示,圖像240示出了包括字 符陰影的3D效果。截取上述兩個(gè)圖像中沿著字母“M”右腿水平移動(dòng)的灰度變化曲線,可在圖14A中 的圖片242和圖14B中的圖片246上看到一些明顯區(qū)別;在圖14A的曲線242上,灰度水平 沿著掃描器行程的變化始終是對(duì)稱的,而如圖14B的曲線246所示,來(lái)自CCD相機(jī)的情況并 非如此。暗谷向相機(jī)初始位置的內(nèi)側(cè)偏移。通過(guò)測(cè)量整個(gè)視域,對(duì)于圖14C中的3M名片, 各谷所表示的不對(duì)稱偏移量會(huì)變化,并且其可按距初始視域的偏移距離進(jìn)行量化。在圖示 實(shí)例中,偏移的量度單位為密耳??梢岳盟^的“Stereo from Shading (明暗重構(gòu)立體視覺(jué))”技術(shù)輕松應(yīng)用該 技術(shù),通過(guò)測(cè)量圖像的精確3D參數(shù)(例如行程升高的高度,其可根據(jù)圖14C中斜率的陡峭 程度來(lái)確定)確認(rèn)是否存在不對(duì)稱性。另一種印刷技術(shù)為雕版,其在印刷表面上產(chǎn)生切口,并且因此產(chǎn)生與上述方法相 反的光學(xué)效果。上述成形技術(shù)可同樣地用于分析由此類印刷技術(shù)產(chǎn)生的圖像和/或字符的 3D特性。將圖像印刷到紙張或其它介質(zhì)上時(shí),除連續(xù)的圖像(如照片或ID打印機(jī))之外, 其它兩種最常用的復(fù)印技術(shù)通過(guò)二進(jìn)制圖像模擬連續(xù)的色調(diào)圖像半色調(diào)絲網(wǎng)印刷技術(shù) (振幅調(diào)制)使用不同大小的等距點(diǎn),而隨機(jī)絲網(wǎng)印刷技術(shù)(頻率調(diào)制)以可變的位置和密 度應(yīng)用同樣大小的點(diǎn)。這些印刷技術(shù)的樣本如圖15A中的樣本圖像250、252和254所示。利用紋理分析的協(xié)方差矩陣法對(duì)于使用半色調(diào)絲網(wǎng)印刷的規(guī)則間距點(diǎn)是良好的 測(cè)定流程,而高頻干擾或邊緣檢測(cè)對(duì)于隨機(jī)絲網(wǎng)印刷是理想的指示。又如,通??梢允褂枚鄠€(gè)絲網(wǎng)重現(xiàn)彩色圖像,并且在半色調(diào)絲網(wǎng)印刷中,位于不同 角度的CMYK四色版與玫瑰斑網(wǎng)點(diǎn)樣式相結(jié)合,如圖15B中的樣本256以及圖15B中的放大 圖像258所示。圖15C示出了一組樣本圖像260、262和264,其通過(guò)分解由彩色(XD相機(jī)捕捉的圖 像256的RGB版而生成。圖15C中的一組圖像示出了可進(jìn)行類似處理的圖15C中的樣本圖像260、262和264中的成角度的絲網(wǎng)。由于在文檔假冒中復(fù)制是最常見(jiàn)的情況之一,也可通過(guò)使用不同的絲印方法來(lái)改 變掃描的文本,如分別使用連續(xù)色調(diào)、半色調(diào)和隨機(jī)絲印法的圖15D中圖像266、268和270 的比較。在這種情況下,行程寬度和邊緣曲率的變化可以是對(duì)于原始文檔復(fù)制流程中絲印 方法所引起的字符變形的很好的測(cè)定方法。除上述傳統(tǒng)印刷技術(shù)之外,設(shè)計(jì)出了許多新方法,不僅限制將圖像復(fù)制到介質(zhì)上, 還在微結(jié)構(gòu)中攜帶其它信息,從而進(jìn)一步有助于防止假冒。雖然這些方法中的大多數(shù)只能 由其自身獨(dú)有的算法進(jìn)行解碼,但在圖像處理中仍可使用一些簡(jiǎn)單的特征提取方式以經(jīng)濟(jì) 有效的解決方案來(lái)確認(rèn)特征是否存在以用于驗(yàn)證目的。下文討論了 一些實(shí)例。例如,一些公司對(duì)包含由人可讀內(nèi)容覆蓋的機(jī)讀代碼的文檔進(jìn)行編碼和解碼,使 得代碼和人可讀內(nèi)容均可分辨。在操作中生成背景圖像,其中背景圖像包括根據(jù)灰度圖像 數(shù)據(jù)值編碼的glyphtone單元,各半色調(diào)單元包括圖16A所示的至少兩個(gè)可分辨圖案中的 一個(gè)。另一個(gè)最近提出的方法基于通過(guò)移動(dòng)一些點(diǎn)而在規(guī)則的半色調(diào)絲網(wǎng)上進(jìn)行相位 調(diào)制,如圖16B的圖像280所示。在這種情況下,放置具有相同絲印頻率的透鏡狀解碼透鏡 使編碼字母“SI”在圖16B的圖像282中可見(jiàn)。本文所述的技術(shù)可以輕松應(yīng)用于此類圖像。另一種方法是將彩色或灰度圖像平面轉(zhuǎn)換為微型字符層,其中每一層均相對(duì)于另 一層以不同的角度設(shè)置。如果為多層色彩(如圖16C所示)并且具有重疊的放大圖像,微 型字符的寬度將根據(jù)灰度或色彩值進(jìn)行寬度調(diào)制。本文所述的技術(shù)可以輕松應(yīng)用于此類圖 像。作為展示系統(tǒng)如何快速高效且高準(zhǔn)確度地識(shí)別文檔的例子,圖17A至圖17C展示 了從一組沒(méi)有使用符合ICA0的MRZ區(qū)的206份不同美國(guó)駕駛執(zhí)照中識(shí)別和驗(yàn)證當(dāng)前版本 紐約州駕駛執(zhí)照的流程。所調(diào)用和應(yīng)用的用于提取和遞歸處理圖像屬性的已實(shí)施的分類器 和校驗(yàn)器列于下表I中表I 表I的右列示出了各自的光源。該列表按計(jì)算效率排序并且順序執(zhí)行。最后兩項(xiàng) 由文檔中預(yù)期的兩個(gè)圖像圖案匹配所限定。圖17B示出了在此例中在一次測(cè)試中各分類器或校驗(yàn)器所檢查的文檔對(duì)象數(shù)量。 如所示的那樣,測(cè)試開(kāi)始時(shí)在所有206個(gè)候選者上所檢查的空白分類器/校驗(yàn)器以及可見(jiàn) 圖案匹配分類器/校驗(yàn)器僅限制到正確文檔類型的一種可能性。圖17B中的曲線展示了該 候選可能性如何在約200毫秒內(nèi)有效地縮小范圍。圖17C示出了各操作的拒絕率,其表示 相對(duì)于此文檔類型在文檔識(shí)別框架上的識(shí)別性能。鑒于徽標(biāo)圖案匹配分類器/校驗(yàn)器在從 15個(gè)候選者中識(shí)別正確文檔及否決其它14個(gè)候選者方面具有的最高性能為93%的拒絕 率,它也是相對(duì)最耗時(shí)的操作。圖17A示出了在從分別來(lái)自紅外線、可見(jiàn)光、紫外線和逆向反射的四個(gè)圖像中搜 索預(yù)期的安全圖像圖形時(shí),將此文檔識(shí)別為當(dāng)前的紐約州駕駛執(zhí)照之后所調(diào)用的部分成功 驗(yàn)證結(jié)果。該結(jié)果與系統(tǒng)完成識(shí)別和后續(xù)驗(yàn)證之后在圖8A中所示的結(jié)果類似。已對(duì)本發(fā)明的多個(gè)實(shí)施例進(jìn)行了說(shuō)明。這些和其它實(shí)施例均在以下權(quán)利要求書(shū)的 范圍之內(nèi)。
權(quán)利要求
一種方法,包括接收未知文檔的一個(gè)或多個(gè)捕捉圖像;按照動(dòng)態(tài)文檔識(shí)別框架將多個(gè)文檔類型對(duì)象存儲(chǔ)在數(shù)據(jù)結(jié)構(gòu)中,其中所述多個(gè)文檔類型對(duì)象引用多個(gè)遞歸流程,用于從所述捕捉圖像提取屬性,以便將所述未知文檔分類并驗(yàn)證為由所述文檔類型對(duì)象中的一個(gè)表示的文檔類型;根據(jù)通過(guò)對(duì)所述捕捉圖像應(yīng)用所述多個(gè)遞歸流程而提取的所述屬性,以可變的順序遍歷所述數(shù)據(jù)結(jié)構(gòu)的所述文檔類型對(duì)象;以及在遍歷所述數(shù)據(jù)結(jié)構(gòu)時(shí),將所述未知文檔識(shí)別為所述多個(gè)文檔類型對(duì)象中的一個(gè)。
2.根據(jù)權(quán)利要求1所述的方法,其中接收所述捕捉圖像包括接收紅外(IR)圖像、可見(jiàn) 光譜圖像、紫外(UV)圖像和逆向反射圖像中的一個(gè)或多個(gè)。
3.根據(jù)權(quán)利要求1所述的方法,其中接收所述未知文檔的所述捕捉圖像包括接收護(hù) 照、駕駛執(zhí)照、出生證明、財(cái)務(wù)文檔、商業(yè)票證、身份證和社會(huì)保險(xiǎn)卡中的一種的捕捉圖像。
4.根據(jù)權(quán)利要求1所述的方法,其中存儲(chǔ)所述多個(gè)文檔類型對(duì)象包括按照動(dòng)態(tài)文檔識(shí) 別框架在樹(shù)形數(shù)據(jù)結(jié)構(gòu)中存儲(chǔ)所述多個(gè)文檔類型對(duì)象。
5.根據(jù)權(quán)利要求1所述的方法,其中存儲(chǔ)所述多個(gè)文檔類型對(duì)象包括以將子文檔類型 作為所述文檔類型對(duì)象的下一級(jí)的遞歸方式按照所述動(dòng)態(tài)文檔識(shí)別框架在所述數(shù)據(jù)結(jié)構(gòu) 中存儲(chǔ)多個(gè)文檔類型和子類型對(duì)象。
6.根據(jù)權(quán)利要求1所述的方法,其中存儲(chǔ)所述多個(gè)文檔類型對(duì)象包括存儲(chǔ)引用所述多個(gè)流程中的一個(gè)或多個(gè)的分類 器對(duì)象,并且其中遍歷所述數(shù)據(jù)結(jié)構(gòu)包括遍歷所述分類器對(duì)象,以調(diào)用由所述分類器對(duì)象引用的所述一個(gè)或多個(gè)流程以確定可能的參照文檔類型對(duì)象 集;以及遍歷所述集,以將所述捕捉圖像識(shí)別為所述多個(gè)可能的參照文檔類型對(duì)象中的一個(gè)。
7.根據(jù)權(quán)利要求6所述的方法,其中存儲(chǔ)所述多個(gè)文檔類型對(duì)象包括存儲(chǔ)最小確定性值和引用所述多個(gè)流程中的一 個(gè)或多個(gè)的校驗(yàn)器對(duì)象,并且其中遍歷所述集包括遍歷所述校驗(yàn)器對(duì)象,以 調(diào)用所述多個(gè)流程中由所述分類器對(duì)象引用的所述一個(gè)或多個(gè); 利用從調(diào)用所述多個(gè)流程中由所述分類器對(duì)象引用的所述一個(gè)或多個(gè)流程接收到的 一個(gè)或多個(gè)返回值來(lái)計(jì)算確定性值,以處理由所述分類器對(duì)象從所述未知文檔提取的屬 性,用于與所述引用的文檔類型對(duì)象進(jìn)行比較;以及根據(jù)所述確定性值與最小確定性值的比較,選擇性地從所述集中舍棄所述可能的參照 文檔類型對(duì)象中的一個(gè)或多個(gè)。
8.根據(jù)權(quán)利要求6所述的方法,其中存儲(chǔ)所述多個(gè)文檔類型對(duì)象包括存儲(chǔ)各引用所述多個(gè)流程中一個(gè)或多個(gè)流程的 第一和第二校驗(yàn)器對(duì)象,并且 其中遍歷所述集包括遍歷所述第一校驗(yàn)器對(duì)象,以根據(jù)在調(diào)用由所述第一校驗(yàn)器對(duì)象引用的所述流程之后接收到的結(jié)果值來(lái)計(jì)算第一確定性值;遍歷所述第二校驗(yàn)器對(duì)象,以根據(jù)在調(diào)用由所述第二校驗(yàn)器對(duì)象引用的所述流程之后 接收到的結(jié)果值來(lái)計(jì)算第二確定性值;以及根據(jù)所述第一確定性值和所述第二確定性值之間的比較,將所述捕捉圖像識(shí)別為所述 多個(gè)可能的參照文檔類型對(duì)象中的一個(gè)。
9.根據(jù)權(quán)利要求6所述的方法,其中存儲(chǔ)所述多個(gè)文檔類型對(duì)象包括 存儲(chǔ)多個(gè)優(yōu)先級(jí);以及將所述優(yōu)先級(jí)中的每一個(gè)與所述數(shù)據(jù)結(jié)構(gòu)中所述多個(gè)文檔類型對(duì)象中的一個(gè)相關(guān)聯(lián),并且其中遍歷所述數(shù)據(jù)結(jié)構(gòu)包括按照與所述多個(gè)可能的參照文檔類型對(duì)象中的每一個(gè)相 關(guān)的優(yōu)先級(jí)遍歷所述數(shù)據(jù)結(jié)構(gòu)。
10.根據(jù)權(quán)利要求6所述的方法,還包括在隊(duì)列數(shù)據(jù)結(jié)構(gòu)中存儲(chǔ)最近校驗(yàn)的文檔類型 對(duì)象集,并且其中遍歷所述數(shù)據(jù)結(jié)構(gòu)包括遍歷所述數(shù)據(jù)結(jié)構(gòu)中所述最近校驗(yàn)的文檔類型對(duì)象集。
11.根據(jù)權(quán)利要求6所述的方法,其中遍歷所述數(shù)據(jù)結(jié)構(gòu)包括調(diào)用所述多個(gè)流程中的 布局匹配識(shí)別流程,以分段及識(shí)別所述捕捉圖像的多個(gè)連接區(qū)域;通過(guò)對(duì)所述多個(gè)連接區(qū)域進(jìn)行分類以及在所述多個(gè)連接區(qū)域之間建立一組關(guān)系來(lái)以 圖形方式表示所述捕捉圖像;將所述多個(gè)連接區(qū)域與所述多個(gè)文檔類型對(duì)象中的一個(gè)相關(guān)的模板數(shù)據(jù)進(jìn)行比較;以及根據(jù)所述比較,確定所述捕捉圖像是否屬于當(dāng)前正在比較的所述多個(gè)文檔類型對(duì)象中 的一個(gè)。
12.根據(jù)權(quán)利要求6所述的方法,其中遍歷所述數(shù)據(jù)結(jié)構(gòu)包括調(diào)用所述多個(gè)流程中的 特征文檔匹配流程,以計(jì)算所述多個(gè)可能的參照文檔類型對(duì)象的所述特征圖像和值,選擇一個(gè)或多個(gè)具有更大特征值并且存儲(chǔ)在所述數(shù)據(jù)結(jié)構(gòu)中的所述參照文檔類型對(duì)象,在學(xué)習(xí)階段計(jì)算存儲(chǔ)在所述數(shù)據(jù)結(jié)構(gòu)中的所述多個(gè)可能的參照文檔類型對(duì)象中每一 個(gè)的參照權(quán)重系數(shù)矢量;計(jì)算所述捕捉圖像的權(quán)重系數(shù)矢量;比較所述圖像和文檔權(quán)重系數(shù)矢量以計(jì)算距離;以及根據(jù)所述距離,確定所述未知文檔是否屬于當(dāng)前正在比較的所述多個(gè)可能的參照文檔 類型對(duì)象中的一個(gè)。
13.根據(jù)權(quán)利要求7所述的方法,其中所述識(shí)別流程的結(jié)果包含一個(gè)或多個(gè)不同文檔類型的候選者列表, 其中所述候選者列表根據(jù)所述確定性值進(jìn)行排序,并且 其中所述識(shí)別流程的結(jié)果作為輸入以確定子文檔類型的后續(xù)處理。
14.根據(jù)權(quán)利要求1所述的方法,還包括應(yīng)用自動(dòng)方法,以得知來(lái)自樣品圖像的文檔類型參照數(shù)據(jù); 存儲(chǔ)所述參照數(shù)據(jù)供所述數(shù)據(jù)結(jié)構(gòu)的節(jié)點(diǎn)調(diào)用;以及應(yīng)用動(dòng)態(tài)方法,以將所述未知文檔分類為所述數(shù)據(jù)結(jié)構(gòu)中所述文檔中的一個(gè),以實(shí)現(xiàn) 所述數(shù)據(jù)結(jié)構(gòu)的后續(xù)處理和遍歷。
15.根據(jù)權(quán)利要求1所述的方法,其中確認(rèn)所識(shí)別文檔的真實(shí)性包括 調(diào)用以下方法中的一個(gè)或多個(gè)第一方法,以評(píng)估所述未知文檔的印刷方法來(lái)自凹版印刷術(shù)或雕版印刷術(shù)的可能性; 第二方法,以辨別用于印刷圖像和文本的絲印方法;或 第三方法,以評(píng)估所述未知文檔的印刷材料是否包括微結(jié)構(gòu);以及 根據(jù)所述可能性確定所述已識(shí)別的文檔是否真實(shí)。
16.根據(jù)權(quán)利要求1所述的方法,還包括將所述未知文檔識(shí)別并驗(yàn)證為結(jié)合有嵌入電 子信息的安全性文檔,所述嵌入電子信息包括射頻識(shí)別(RFID)數(shù)據(jù)、電子護(hù)照數(shù)據(jù)、智能 卡數(shù)據(jù)或磁條數(shù)據(jù)中的一種或多種。
17.根據(jù)權(quán)利要求1所述的方法,還包括向用戶提供所述識(shí)別和驗(yàn)證流程的結(jié)果,其中 提供包括以視覺(jué)或聲音格式向用戶提供反饋。
18. 一種安全性文檔驗(yàn)證設(shè)備,包括圖像捕捉接口,其從未知文檔捕捉一個(gè)或多個(gè)圖像;存儲(chǔ)器,其將多個(gè)文檔類型對(duì)象按照動(dòng)態(tài)文檔識(shí)別框架存儲(chǔ)在數(shù)據(jù)結(jié)構(gòu)中,其中所述 多個(gè)文檔類型對(duì)象引用多個(gè)用于從所述捕捉圖像提取屬性的遞歸流程;以及文檔處理引擎,其根據(jù)通過(guò)將所述多個(gè)遞歸流程應(yīng)用于所述捕捉圖像而提取的所述屬 性,以可變的順序遍歷所述數(shù)據(jù)結(jié)構(gòu)的所述文檔類型對(duì)象,其中所述文檔處理引擎遍歷所 述數(shù)據(jù)結(jié)構(gòu)時(shí)將所述未知文檔識(shí)別為所述多個(gè)文檔類型對(duì)象中的一個(gè)。
19.根據(jù)權(quán)利要求18所述的安全性文檔驗(yàn)證設(shè)備,其中所述圖像捕捉接口通過(guò)接收紅 外(IR)圖像、可見(jiàn)光譜圖像、紫外(UV)圖像和逆向反射圖像中的一個(gè)或多個(gè)來(lái)接收所述捕 捉圖像。
20.根據(jù)權(quán)利要求18所述的安全性文檔驗(yàn)證設(shè)備,其中所述圖像捕捉接口通過(guò)接收護(hù) 照、駕駛執(zhí)照、出生證明、財(cái)務(wù)文檔、商業(yè)票證、身份證或社會(huì)保險(xiǎn)卡中的一種的捕捉圖像來(lái) 接收所述未知文檔的所述捕捉圖像。
21.根據(jù)權(quán)利要求18所述的安全性文檔驗(yàn)證設(shè)備,其中所述存儲(chǔ)器通過(guò)將所述多個(gè)文 檔類型對(duì)象按照動(dòng)態(tài)文檔識(shí)別框架存儲(chǔ)在樹(shù)形數(shù)據(jù)結(jié)構(gòu)中來(lái)存儲(chǔ)所述多個(gè)文檔類型對(duì)象。
22.根據(jù)權(quán)利要求18所述的安全性文檔驗(yàn)證設(shè)備,其中所述存儲(chǔ)器通過(guò)將多個(gè)文檔類 型和子類型對(duì)象按照所述動(dòng)態(tài)文檔識(shí)別框架存儲(chǔ)在所述樹(shù)形數(shù)據(jù)結(jié)構(gòu)中作為父節(jié)點(diǎn)和子 節(jié)點(diǎn)互連以用于按遞歸方式處理來(lái)存儲(chǔ)所述多個(gè)文檔類型對(duì)象。
23.根據(jù)權(quán)利要求18所述的安全性文檔驗(yàn)證設(shè)備,其中所述文檔處理引擎包括遍歷所 述數(shù)據(jù)結(jié)構(gòu)的文檔識(shí)別模塊。
24.根據(jù)權(quán)利要求23所述的安全性文檔驗(yàn)證設(shè)備,其中所述存儲(chǔ)器通過(guò)存儲(chǔ)引用所述多個(gè)流程中的一個(gè)或多個(gè)的分類器對(duì)象來(lái)存儲(chǔ)所 述多個(gè)文檔類型對(duì)象,并且其中所述文檔識(shí)別模塊遍歷所述數(shù)據(jù)結(jié)構(gòu),具體方式為調(diào)用由所述分類器對(duì)象引用的所述一個(gè)或多個(gè)流程以確定可能的參照文檔類型對(duì)象 集;以及遍歷所述集以將所述捕捉圖像識(shí)別為所述多個(gè)文檔類型對(duì)象中的一個(gè)。
25.根據(jù)權(quán)利要求24所述的安全性文檔驗(yàn)證設(shè)備,其中所述存儲(chǔ)器通過(guò)存儲(chǔ)最小確定性值和引用所述多個(gè)流程中一個(gè)或多個(gè)的校驗(yàn)器 對(duì)象來(lái)存儲(chǔ)所述多個(gè)文檔類型對(duì)象,并且其中所述文檔識(shí)別模塊遍歷所述集,具體方式為訪問(wèn)所述校驗(yàn)器對(duì)象并且使所述文檔 識(shí)別模塊調(diào)用由所述校驗(yàn)器節(jié)點(diǎn)引用的所述多個(gè)校驗(yàn)器流程;利用從調(diào)用由所述校驗(yàn)器對(duì)象引用的所述流程接收到的一個(gè)或多個(gè)返回值來(lái)計(jì)算確 定性值;以及根據(jù)所述確定性值與所述最小確定性值之間的比較,選擇性地從所述集中舍棄所述可 能的參照文檔類型對(duì)象中的一個(gè)或多個(gè)。
26.根據(jù)權(quán)利要求24所述的安全性文檔驗(yàn)證設(shè)備,其中所述存儲(chǔ)器通過(guò)存儲(chǔ)各引用多個(gè)校驗(yàn)器流程中的一個(gè)或多個(gè)的兩個(gè)校驗(yàn)器對(duì)象 來(lái)存儲(chǔ)所述多個(gè)文檔類型對(duì)象,并且其中所述文檔識(shí)別模塊遍歷所述集,具體方式為遍歷所述第一校驗(yàn)器對(duì)象,從而引起所述文檔識(shí)別模塊根據(jù)在調(diào)用由所述第一校驗(yàn)器 對(duì)象引用的所述校驗(yàn)器流程之后接收到的結(jié)果值來(lái)計(jì)算第一確定性值;遍歷所述第二校驗(yàn)器對(duì)象,從而引起所述文檔識(shí)別模塊根據(jù)在調(diào)用由所述第二校驗(yàn)器 對(duì)象引用的所述校驗(yàn)器流程之后接收到的結(jié)果值來(lái)計(jì)算第二確定性值;以及根據(jù)所述第一確定性值和所述第二確定性值之間的比較,將所述捕捉圖像識(shí)別為所述 參照文檔類型對(duì)象的所述多個(gè)文檔類型中的一個(gè)。
27.根據(jù)權(quán)利要求24所述的安全性文檔驗(yàn)證設(shè)備,其中所述存儲(chǔ)器還存儲(chǔ)多個(gè)優(yōu)先級(jí)并且將所述多個(gè)優(yōu)先級(jí)中的每一個(gè)與所述數(shù)據(jù)結(jié) 構(gòu)中所述多個(gè)文檔類型對(duì)象中的一個(gè)相關(guān)聯(lián),并且其中所述文檔識(shí)別模塊通過(guò)按照與所述多個(gè)文檔類型對(duì)象中的每一個(gè)相關(guān)的優(yōu)先級(jí) 遍歷所述數(shù)據(jù)結(jié)構(gòu)而遍歷所述數(shù)據(jù)結(jié)構(gòu)。
28.根據(jù)權(quán)利要求24所述的安全性文檔驗(yàn)證設(shè)備,其中所述存儲(chǔ)器還將最近校驗(yàn)的文檔類型對(duì)象集存儲(chǔ)在隊(duì)列數(shù)據(jù)結(jié)構(gòu)中,并且 其中所述文檔識(shí)別模塊通過(guò)首先遍歷所述數(shù)據(jù)結(jié)構(gòu)中最近校驗(yàn)的文檔類型對(duì)象的所 述集而遍歷所述數(shù)據(jù)結(jié)構(gòu)。
29.根據(jù)權(quán)利要求24所述的安全性文檔驗(yàn)證設(shè)備,其中所述文檔識(shí)別模塊通過(guò)調(diào)用所 述多個(gè)流程中的布局匹配識(shí)別流程而遍歷所述數(shù)據(jù)結(jié)構(gòu),所述流程使所述文檔識(shí)別模塊分段及識(shí)別所述捕捉圖像的多個(gè)連接區(qū)域;通過(guò)對(duì)所述多個(gè)連接區(qū)域進(jìn)行分類并且在所述多個(gè)連接區(qū)域之間建立一組關(guān)系來(lái)以 圖形方式表示所述捕捉圖像;將所述多個(gè)連接區(qū)域與存儲(chǔ)在所述數(shù)據(jù)結(jié)構(gòu)中的所述多個(gè)文檔類型對(duì)象中的一個(gè)相 關(guān)的模板數(shù)據(jù)進(jìn)行比較;以及根據(jù)所述比較,確定所述捕捉圖像是否屬于當(dāng)前正在比較的所述多個(gè)文檔類型對(duì)象中 的一個(gè)。
30.根據(jù)權(quán)利要求24所述的安全性文檔驗(yàn)證設(shè)備,其中所述文檔識(shí)別模塊通過(guò)調(diào)用所 述多個(gè)流程中的特征圖像文檔匹配流程而遍歷所述數(shù)據(jù)結(jié)構(gòu),以計(jì)算所述多個(gè)參照文檔類型對(duì)象的所述特征圖像和值,選擇所述參照文檔類型對(duì)象中具有大特征值的一個(gè)或多個(gè);在學(xué)習(xí)階段中,計(jì)算存儲(chǔ)在所述數(shù)據(jù)結(jié)構(gòu)中的所述多個(gè)參照文檔類型對(duì)象中每一個(gè)的 參照權(quán)重系數(shù)矢量;計(jì)算所述捕捉圖像的所述權(quán)重系數(shù)矢量;比較所述圖像和所述文檔權(quán)重系數(shù)矢量以計(jì)算距離;以及根據(jù)所述距離,確定所述未知文檔是否屬于當(dāng)前正在比較的所述多個(gè)參照文檔類型對(duì) 象中的一個(gè)。
31.一種計(jì)算機(jī)可讀媒體,其包含指令用于使可編程處理器接收未知文檔的捕捉圖像,將多個(gè)文檔類型對(duì)象按照動(dòng)態(tài)文檔識(shí)別框架存儲(chǔ)在數(shù)據(jù)結(jié)構(gòu)中,其中所述多個(gè)文檔類 型對(duì)象引用多個(gè)流程;以及通過(guò)選擇性調(diào)用所述多個(gè)流程中的一個(gè)或多個(gè)而遍歷數(shù)據(jù)結(jié)構(gòu),以根據(jù)所述捕捉圖像 將未知文檔識(shí)別為所述多個(gè)文檔類型對(duì)象中的一個(gè)。
全文摘要
本發(fā)明所述的技術(shù)用于按照動(dòng)態(tài)文檔識(shí)別框架識(shí)別和驗(yàn)證安全性文檔。例如,安全性文檔驗(yàn)證設(shè)備包括接收文檔捕捉圖像的圖像捕捉接口以及將多個(gè)文檔類型對(duì)象按照所述動(dòng)態(tài)文檔識(shí)別框架存儲(chǔ)在數(shù)據(jù)結(jié)構(gòu)中的存儲(chǔ)器。所述安全性文檔驗(yàn)證設(shè)備還包括文檔處理引擎,其通過(guò)選擇性調(diào)用所述多個(gè)流程中的一個(gè)或多個(gè)而遍歷所述數(shù)據(jù)結(jié)構(gòu),以將所述捕捉圖像識(shí)別為所述多個(gè)文檔類型對(duì)象中的一個(gè)。與傳統(tǒng)識(shí)別技術(shù)相反,通過(guò)遍歷按照所述動(dòng)態(tài)文檔識(shí)別框架存儲(chǔ)的所述數(shù)據(jù)結(jié)構(gòu)而執(zhí)行的本識(shí)別方法可以更高效的方式提供更準(zhǔn)確的識(shí)別結(jié)果,因?yàn)榭梢詢H應(yīng)用適用的流程來(lái)識(shí)別所述捕捉圖像。在識(shí)別所述文檔類型時(shí),應(yīng)用了一組一個(gè)或多個(gè)驗(yàn)證器來(lái)進(jìn)一步確認(rèn)其真實(shí)性。
文檔編號(hào)G06T1/00GK101925904SQ200880125412
公開(kāi)日2010年12月22日 申請(qǐng)日期2008年11月12日 優(yōu)先權(quán)日2007年12月12日
發(fā)明者詹姆斯·E·麥克萊恩, 雷宜武 申請(qǐng)人:3M創(chuàng)新有限公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1