使用生成的字符模板來光學字符識別的方法和系統(tǒng)的制作方法
【專利摘要】一種用于訓練機器視覺系統(tǒng)的方法和系統(tǒng),所述機器視覺系統(tǒng)與OCR算法一起用于識別字符。所述方法包括:識別待識別的字符,并且單獨為所述字符中的每一個生成至少第一模板集合。每個模板包括由多個單元構(gòu)成的網(wǎng)格,并且通過選擇所述網(wǎng)格的某些單元來限定圖案而生成,所述圖案與所述字符中的相應一個相關聯(lián)。然后將與所述模板相關的信息保存在介質(zhì)上,隨后可從所述介質(zhì)中檢索所述信息來重新生成所述模板。所述模板可用于光學字符識別算法中,以便識別標識中包含的至少一些所述字符。
【專利說明】使用生成的字符模板來光學字符識別的方法和系統(tǒng)
[0001]相關申請案的交叉引用
[0002]本申請要求2011年9月23日申請的美國臨時申請?zhí)?1/538,564的權利,所述申請的內(nèi)容以引用方式并入本說明書。
【背景技術】
[0003]本發(fā)明大體上涉及成像技術及其使用。更具體來說,本發(fā)明涉及機器視覺(MV)成像的方法和設備,所述方法和設備能夠與基于圖像的方法和設備(例如,在監(jiān)測、檢查和/或控制應用程序中所使用的類型)中所采用的目標字符識別(OCR)算法一起使用。
[0004]機器視覺(MV)通常是指:使用圖像感測技術來獲取(“讀取”)視覺圖像并且將所述圖像轉(zhuǎn)換成計算機能夠從所述圖像提取數(shù)據(jù)的形式、將所提取的數(shù)據(jù)與以前開發(fā)的標準相關聯(lián)的數(shù)據(jù)進行比較,并且隨后基于所述比較生成可能對給定應用程序有用的輸出。作為非限定性實例,此類應用程序可包括部件識別、裂紋檢測、部件在三維空間中的位置等。機器視覺系統(tǒng)的領域通常涵蓋OCR設備和算法。一個非限定性實例是識別(“讀取”)與制造的物品相關聯(lián)的一系列字符,例如,包括序列號、部件號、供應商代碼等在內(nèi)的部件標識。部件標識(和許多其他應用程序)中所使用的字符不限于數(shù)字,而是經(jīng)常包括被視為人類可讀的字母數(shù)字字符和/或可能被視為人類不可讀的符號,所述符號包括(但不限于)一維和二維數(shù)據(jù)矩陣條形碼。
[0005]利用OCR設備和算法的機器視覺系統(tǒng)通常通過以下方式來識別物品上的標識:從所述物品上獲取包含所述標識的圖像,并且隨后將所獲取的圖像與所存儲的排版模板相比較,從而識別所獲取圖像中的各個字符。所述模板通常是使用以前獲取的圖像數(shù)據(jù)訓練(train)的,在此情況下,許多模板可映射到單一字符。圖1表示用于執(zhí)行一種過程的視覺系統(tǒng)10,所述過程包括:識別應用程序特定參數(shù),并且隨后例如從部件標識12的字符獲取訓練圖像,模板14從所述訓練圖像生成。這些步驟通常由一位應用程序工程師來執(zhí)行,所述應用程序工程師將模板14存儲在合適的存儲裝置16中。用于給定字符的每個模板14對應于所述字符的物理范圍,本說明書中稱為圖像空間。因為在縮放比例、照明條件、表面光潔度等方面可能發(fā)生變化,所以必須獲取足夠的訓練圖像來開發(fā)用于將要由視覺系統(tǒng)10識別的每個字符的多個模板14。隨后,可使用現(xiàn)有的OCR算法,通過將在線獲取的圖像(例如,從制造的物品獲取的)與所存儲的用于字符識別的模板14相比較來執(zhí)行字符識別。使用這種類型的過程,必須針對特定應用程序及其應用程序特定參數(shù)來訓練每個視覺系統(tǒng)10。
[0006]例如,如果特定字符以前不曾見過并且未經(jīng)成像,則圖1中所示的方法所采用的訓練方式可能導致訓練不足(under-training),并且如果字符已被訓練多次并有各種偽影(artifact)或噪聲嵌入,則所述訓練方式可能導致訓練過度(over-training)。此外,使用所獲取的圖像數(shù)據(jù)來訓練OCR算法產(chǎn)生排版模板14,所述排版模板14的質(zhì)量取決于幾乎恒定的成像條件,如縮放比例、照明條件、表面光潔度和類似條件。
[0007]由于現(xiàn)有(或稱“現(xiàn)用”,off-the-shelf)快速原型視覺系統(tǒng)提供的成像套件,在機器視覺應用程序中存在追求現(xiàn)有快速原型視覺系統(tǒng)的動機,這促使設立對于常見任務的檢查。然而,訓練排版可能是一項艱巨的任務,因為需要每個字符的代表性實例,有時需要同一字符在存在噪聲、偽影或幾何圖形變化時的多個實例。對重復字符訓練的需要在用于廣泛應用程序或通用應用程序的情況下尤其是個問題,所述情況例如為:讀取可能具有不同幾何圖形的不同制造物品,或讀取處于不同照明條件、不同縮放比例等條件下的物品。重復訓練的缺點是訓練過度,其中當具有不同異常的每個實例性字符被添加至限定單一字符的集合時,字符的特定特征可能發(fā)生失真或甚至丟失。
[0008]鑒于上述情況,應了解的是,存在對于能夠克服現(xiàn)存OCR訓練方法中所遇到缺點的OCR系統(tǒng)的持續(xù)需求。具體來說,如果存在提高讀取過程期間準確度的簡化訓練方法,這將是有利的。將更加有利的是,提供獨立于終端應用程序的OCR訓練方法。
【發(fā)明內(nèi)容】
[0009]本發(fā)明提供用于訓練機器視覺系統(tǒng)的方法和系統(tǒng),所述機器視覺系統(tǒng)與OCR算法一起使用來識別字符。
[0010]根據(jù)本發(fā)明的第一方面,提供一種方法,所述方法包括:識別待識別的字符,并且單獨生成用于所述字符中的每一個的至少第一模板集合。每個模板包括由多個單元構(gòu)成的網(wǎng)格并且通過選擇所述網(wǎng)格的某些單元生成,從而限定與所述字符中的相應一個相關聯(lián)的圖案。隨后將與每個模板的形狀相關的信息保存在可從其中檢索所述信息的介質(zhì)上。所述模板隨后可通過從所述介質(zhì)上檢索所述信息來重新生成,并且可輸出用于光學字符識別算法中,從而識別標識中包含的至少一些所述字符。
[0011]根據(jù)本發(fā)明的第二方面,一種用于執(zhí)行字符識別的系統(tǒng)包括:用于單獨為多個字符中的每一個生成至少第一模板集合的裝置;適于保存所述模板并且可從其中檢索所述模板的介質(zhì);和適于使用所述模板來識別標識中包含的至少一些所述字符的光學字符識別算法。每個模板包括由多個單元構(gòu)成的網(wǎng)格并且通過選擇所述網(wǎng)格的某些單元生成,從而限定與所述字符中的相應一個相關聯(lián)的圖案。
[0012]本發(fā)明的一個技術效果是能夠生成基本上無噪聲、無偽影并且可與某些排版或字體相關聯(lián)的模板,以使得對OCR算法的訓練針對每種排版或字體僅需一次,而不是針對每個獨特的OCR應用程序來執(zhí)行。因此,單獨的模板集合可容易地適用于采用相同排版或字體的多個應用程序,但是其字符是在不同條件下讀取的,這將使常規(guī)OCR機器視覺系統(tǒng)的使用復雜化。因為所述模板不是從圖像源生成的,所以它們不存在失真、照明缺陷、表面紋理和其他特定的應用程序異常。此方法提供用于OCR算法的最通用模板,以用于與使用所訓練的排版的眾多應用程序相關聯(lián)。另一個優(yōu)點是,所述模板可用來由與終端應用程序分開的某人在在線過程之外訓練OCR算法,并且這樣操作時能夠增加字符識別訓練過程的速度和效率。
[0013]本發(fā)明的其他方面和優(yōu)勢可從以下【具體實施方式】中更好地了解。
【專利附圖】
【附圖說明】
[0014]圖1示出使用現(xiàn)有技術OCR訓練過程來識別字符的機器視覺系統(tǒng)。
[0015]圖2示意性地描繪根據(jù)本發(fā)明實施例的模板實例,所述模板可結(jié)合機器視覺系統(tǒng)使用來識別字符。
[0016]圖3描繪渦輪機葉片上的并且使用在線機器視覺讀取過程可讀取的部件標識。
[0017]圖4描繪類似于圖2所示的并且針對圖3中所示標識的字符中的每一個生成的各個模板。
[0018]圖5提供可使用類似于圖2所示模板來執(zhí)行的離線模板生成過程和在線字符讀取過程的示例性流程圖。
[0019]圖6示意性地描繪能夠用于圖5所示離線訓練過程的離線模板生成系統(tǒng)。
[0020]圖7示出在OCR訓練過程中使用圖6所示離線模板生成系統(tǒng)來識別字符的機器視覺系統(tǒng)。
【具體實施方式】
[0021]以下對機器視覺系統(tǒng)和操作這樣的系統(tǒng)來產(chǎn)生輸出的方法的實施例進行描述,所述輸出可與OCR算法一起使用來識別字符,例如,物品上部件標識的字符。圖2描繪可由本發(fā)明采用來識別字符的模板20的實例,其非限定性實例是圖2中所示的百分比符號(% ) 340模板20配置為以行26和列28排列的單元24的網(wǎng)格22。如從圖2中明顯看出,一些單元24是“接通”(陰影)30而另一些是“斷開” 32,其中這些“接通”單元24對應于百分比符號34的形狀。這樣,單元24的“接通”或“斷開”狀態(tài)構(gòu)成表示特定字符的數(shù)據(jù)。如果標識是用將點壓印(刻)在物品上來形成字符的機器形成的,那么每個單元24可表示限定所述字符的點刻網(wǎng)格的單一點,并且模板20可以是通過對所述點刻網(wǎng)格進行上采樣以達與所述字符圖像相同的分辨率而形成的單元網(wǎng)格22的表現(xiàn)形式(manifestation)。
[0022]根據(jù)本發(fā)明的一個優(yōu)選方面,網(wǎng)格22及其單元24有效地構(gòu)成與模板20針對字符的形狀相關的信息,并且此信息可在離線過程中生成,通過所述離線過程形成用于任意數(shù)目的應用程序中需要讀取的每個字符的一個單獨模板20。相對于如圖1所示現(xiàn)有技術系統(tǒng)10所要求的那樣,在在線“應用程序”級別上獲取多個訓練圖像以便訓練機器視覺系統(tǒng)的現(xiàn)有技術實踐而言,表示模板20的信息可在離線“系統(tǒng)”級別上產(chǎn)生。更具體來說,所述信息可通過以下方式離線生成:識別哪些字符用于或可用于可使用模板20的一個或多個應用程序,并且隨后選擇能夠分別地與所識別的字符相關的“接通”和“斷開”單元24的圖案。針對每個模板20的單元24陣列限定本說明書中所稱的“網(wǎng)格空間”,所述網(wǎng)格空間由所述陣列的行26和列28限定。針對給定字符,可將陣列的大小(并且,因此為模板20中單元24的數(shù)目)限制到表征受關注字符的數(shù)據(jù)所必需的最小尺寸。同時,可利用模板20的接通-斷開格式來在給定的網(wǎng)格空間中產(chǎn)生最高對比度。在圖2所示的實例中,5X7單元24的陣列足以限定模板20用于百分比符號34的網(wǎng)格空間,盡管應理解,更小或更大的陣列是可預見的。在任何情況下,“接通”單元24的圖案體現(xiàn)了字符的分辨率,而不是所獲取用來生成圖1所示常規(guī)機器視覺系統(tǒng)的模板14的圖像的分辨率。如將要參照圖5至圖7所論述,在生成用于預期應用程序的所需數(shù)目的模板20之后,可將與模板20相關的信息存儲,以供后續(xù)在在線機器視覺字符讀取過程中使用。
[0023]因為將字符限定在網(wǎng)格空間中而不是限定在圖1所示的圖像空間中,所以模板20可被開發(fā)并且基本上用于涉及相同排版或字體的任何應用程序。更具體來說,由網(wǎng)格空間限定的模板20不像圖像空間模板那樣僅限于某些應用程序,所述圖像空間模板必須考慮到針對每個特定應用程序可能存在的具體環(huán)境因素。如將要在下面論述,雖然可開發(fā)不同的模板20集合用于具有不同排版或字體的應用程序,但是排版開發(fā)和產(chǎn)生的模板20以其他方式獨立于終端應用程序。
[0024]圖3示意性地描繪渦輪機葉片36的根部端,在其上已壓印或以其他方式產(chǎn)生了示例性部件標識38(例如,序列號、部件號、供應商代碼等),并且所述部件標識38的各個字符可在葉片36上所執(zhí)行的處理、檢查或一些其他在線過程期間被讀取。圖4示意性地描繪針對標識38的每個字符生成的模板20。雖然將標識38表示為僅包括字母數(shù)字字符(并且因此被視為人類可讀的),但是本發(fā)明還可采用基本上任何系列的字符,包括可被視為人類不可讀的符號或其他字符,包括(但不限于)一維和二維數(shù)據(jù)矩陣條形碼。如從圖4中明顯看出,每個字符可由包括5 X 7單元24的網(wǎng)格空間的一個模板20來限定,盡管同樣,可使用更少或更多數(shù)目的單元24。如前面所指出,模板20可在系統(tǒng)級別上離線限定,并且后續(xù)在應用程序級別上生成并由OCR算法在線使用來識別字符。
[0025]除模板20之外,可需要其他輸入來供OCR算法使用。例如,某些信息可從表示模板20的信息中計算出或?qū)С霾⑶铱捎米鞴㎡CR算法使用的輸出。非限定性實例包括:用于限定類似模板的“查找表”(LUT)、用于限定模板內(nèi)特定類似區(qū)域的LUT、用于模板間距的LUT、用于比例和公差的LUT,以及使用模板形態(tài)中所包含的信息知識可容易地并自動生成的任何其他OCR特定輸入。如從以下關于圖6的論述將更好地理解,可使用這些額外的輸入來幫助訓練OCR算法,以便更好地關聯(lián)被讀取的圖像與特定字符模板20。限定模板20的離線過程可容易地輸出這些額外的輸入,因為所述離線過程具有與每個字符在最基本比例(即,網(wǎng)格空間)處的形狀相關的信息。
[0026]圖5描繪本發(fā)明的離線階段包括對于特定標識(如圖3和圖4所示的標識38)確定OCR參數(shù)的步驟,在所述步驟期間,針對待讀取的標識的每個受關注字符生成模板20并且存儲限定模板20的信息集合。圖5描繪一個額外的步驟,其中針對物品確定將要從其中讀取字符的受關注區(qū)域(R0I),例如,葉片36的圖像內(nèi)。作為離線過程的一部分,這些步驟可重復進行,以便產(chǎn)生用于可利用不同排版或字體的任何數(shù)目的標識系統(tǒng)的單獨模板20集合。圖5進一步描繪利用本發(fā)明的模板生成離線過程的輸出的在線或應用程序級別。在線過程被描繪成包括以下步驟:讀取適當?shù)哪0?0集合,使用受關注區(qū)域來修剪(crop)標識以便避免對物品上不具有受關注標識的區(qū)域的不必要讀取,并且隨后在OCR算法中使用模板20來讀取并識別標識的字符。除使用本發(fā)明的模板生成離線過程的輸出之外,圖5所示的在線過程表示現(xiàn)有OCR算法的操作。所述OCR算法使用一種相關技術來將標識38的圖像與模板20相比較,從而生成從標識38中識別到的字符的數(shù)字表現(xiàn)形式。
[0027]如圖6中所描繪,與模板20的形狀相關的信息可通過使用離線系統(tǒng)40生成,并且隨后存儲在OCR算法可訪問的合適存儲裝置42上的模板數(shù)據(jù)庫中。如從圖6明顯看出,模板20的屏幕圖像可顯示在個人計算機或其他合適的處理設備的屏幕46上,用戶可從所述屏幕46上選擇各個單元24來限定能夠唯一地識別待識別字符的“接通”單元。針對在將要在其中執(zhí)行字符識別的一個或多個應用程序中可能被讀取的每個字符重復此步驟。從圖6中所示模板20的整潔網(wǎng)格空間與圖1所示常規(guī)機器視覺系統(tǒng)的模板14之間的比較,可容易了解本發(fā)明的離線模板生成方法的好處。
[0028]所需的以供由OCR算法使用的任何其他輸入也可存儲在存儲裝置42上。另外,某些信息可從模板20包含的數(shù)據(jù)計算出或?qū)С霾⑶铱晒㎡CR算法使用。例如,圖6描繪納入了“查找表”(LUT)44,所述查找表44可生成用于具有類似模板20的字符,例如數(shù)字“I”和大寫字母“I”??蓪CR算法進行訓練以用于:使在受關注區(qū)域內(nèi)被讀取的每個圖像與字符模板20相關聯(lián),分析所讀取圖像的每一個像素,并且生成受關注區(qū)域內(nèi)每一個像素的輸出相關性得分。高的相關性表示識別出已讀取的字符。還可教導OCR算法來查閱查找表44,以便提高相關性得分。例如,LUT44可提供關于模板20的什么區(qū)是一致的信息,以使OCR算法可將這些區(qū)遮住以便提高相關性得分差異,否則得分會太接近以至于不能做出決定。因此,OCR算法可使用迭代過程來將所讀取的圖像與所存儲的模板20的字符相關,并且還利用可能對訓練過程有用的其他輸入。
[0029]如前面所指出,可開發(fā)不同的模板20集合來用于采用不同排版或字體的應用程序。例如,可開發(fā)用于不同排版或字體的模板20,并且將不同模板20存儲在存儲裝置42上的單獨項目文件中。此外,可調(diào)整模板20的比例(放大/縮小)用于將網(wǎng)格空間中的模板20轉(zhuǎn)化成圖像空間中的圖像券(coupon),以便輸入到OCR算法(圖7中識別為“應用程序細節(jié)”)中。例如,對于5X7單元的網(wǎng)格空間來說,可使用5.0的縮放比例來生成每個模板20 一個25X35像素的圖像。類似地是,可利用非整數(shù)的縮放比例來將模板20從網(wǎng)格空間轉(zhuǎn)化成圖像空間,以使得由OCR算法做出的相關性將與采用所述算法的每個相應應用程序中所獲取的圖像盡可能接近地匹配。此處假設OCR算法可要求模板20與已獲取的圖像具有一致的分辨率和縮放比例。
[0030]圖7描繪類似于圖1所示現(xiàn)有技術,但是被修改來圖示本發(fā)明某些方面的流程圖。圖7同樣描繪某些步驟在檢查過程的系統(tǒng)級別上離線執(zhí)行,而其他步驟在所述檢查過程的應用程序級別上在線執(zhí)行。在離線過程中,識別了針對一個或多個受關注應用程序?qū)⑿枰R別的字符,并且例如在圖6所示屏幕顯示器46上,“繪制出”用于這些字符中的每一個的模板20。如前面所提及,可生成單獨的模板20集合并作為單獨的項目存儲在存儲裝置32上。還可生成用于每個項目及其模板20集合的查找表44。如前面所指出,查找表44的使用不意圖包括所有實例,而僅包括可在本發(fā)明的離線過程內(nèi)生成的OCR相關輸入?yún)?shù)的一個實例。還可生成能夠從網(wǎng)格空間中的模板中導出的其他OCR相關輸入。用戶可生成適當?shù)哪0?0并且將它們保存在存儲裝置42上,以便隨后通過輸入對應于特定應用程序的應用程序細節(jié)來在線使用。隨后將適當?shù)哪0?0輸出到圖像空間中,這意味著對所述模板20進行重新采樣以達圖像中期望的相同分辨率和縮放比例,此后,讀取受關注字符并且運行OCR算法來識別所述字符。
[0031]因為可在與某些排版或字體相關聯(lián)的項目文件中組織模板20,所以對OCR算法的訓練針對每種排版或字體僅需一次,而不是如圖1所示現(xiàn)有技術系統(tǒng)10所要求的那樣需要針對每個獨特的應用程序執(zhí)行。此外,對OCR算法的訓練可在檢查過程的在線過程之外進行。因此,一個顯著的好處是,離線過程減少了訓練OCR算法的過程對于每個應用程序的工程加工時間(engineering touch time),并且提高了機器視覺系統(tǒng)的速度、效率,而且最重要的是提高了準確度,所述機器視覺系統(tǒng)的輸出可被其他標準在線OCR算法使用。另一個好處是,因為OCR算法的訓練離線進行,所以模板20可更容易地適用于采用相同排版或字體的多個其他應用程序,但是其字符是在不同條件下讀取的,這可能使圖1中所描繪類型的常規(guī)系統(tǒng)的使用復雜化。[0032]圖1中所描繪類型的現(xiàn)有技術訓練方法還依賴于看到相同字符的多個實例,以便增加受不同環(huán)境影響的圖像與先前看到的模板的圖像相關聯(lián)的機會。這可能導致訓練過度,其中字符的特定和細微特征可能丟失。本發(fā)明通過使用模板20將此問題解決,所述模板20從一開始就不受環(huán)境影響并且可為OCR算法提供用于每個字符的恰好一個實例性模板20。圖1中所示的現(xiàn)有技術訓練方法還依賴于至少要看到字符的實例一次。如果在在線模式中釋放模板集合之前這并不可能,則將經(jīng)受訓練不足,其中OCR算法將在第一次看到字符時或看到受環(huán)境影響而不與先前實例性模板中的任何一個相關聯(lián)的字符時失效。本發(fā)明通過允許用戶在系統(tǒng)級別上離線訓練整個字符集合來解決這個問題。圖1中所示的現(xiàn)有技術訓練方法還依賴于在訓練過程內(nèi)看到字符串形式的多個字符,以便將字符間距信息訓練到OCR算法中。由于與以上所述相同的原因,本發(fā)明通過以下方式解決這個問題:允許用戶在系統(tǒng)級別上將此間距訓練到網(wǎng)格空間中,并且實時地(on thefly),將所述信息嵌入用于單一排版的排版屬性中。
[0033]雖然已根據(jù)特定實施例對本發(fā)明進行了描述,但是明顯的是,所屬領域技術人員可采用其他形式。例如,用來建構(gòu)機器視覺系統(tǒng)的硬件和軟件的物理配置可不同于以上所述或以上所示的物理配置。因此,本發(fā)明的范圍應僅由以下權利要求書來限定。
【權利要求】
1.一種訓練用于字符識別的機器排版的方法,所述方法包括: 識別待識別的字符; 單獨為所述字符中的每一個生成至少第一模板集合,所述模板中的每一個包括由多個單元構(gòu)成的網(wǎng)格并且每個模板通過選擇所述網(wǎng)格的某些單元來限定圖案而生成,所述圖案與所述字符中的相應一個相關聯(lián); 將與每個模板的形狀相關的信息保存在可從中檢索所述信息的介質(zhì)上; 從所述介質(zhì)中檢索所述信息; 根據(jù)所述信息重新生成所述模板;以及 輸出所述模板,以用在光學字符識別算法中來識別標識中包含的至少一些所述字符。
2.如權利要求1所述的方法,其中識別所述字符、生成所述模板和保存所述模板的步驟是在檢查過程中離線執(zhí)行的。
3.如權利要求1所述的方法,其中檢索和使用所述模板的步驟是在檢查過程中在線執(zhí)行的。
4.如權利要求1所述的方法,其中生成所述模板的步驟是通過在屏幕上顯示所述網(wǎng)格并且從所述屏幕中選擇所述單元來執(zhí)行的。
5.如權利要求1所述的方法,其中生成所述第一模板集合的步驟是針對單一排版或字體執(zhí)行的。
6.如權利要求5所述的方法,所述方法進一步包括為第二排版或字體生成至少第二模板集合。
7.如權利要求1所述的方法,所述方法進一步包括:從所述模板中生成OCR相關輸入?yún)?shù)以及將所述輸入?yún)?shù)保存在所述介質(zhì)上。
8.如權利要求1所述的方法,所述方法進一步包括:從所述網(wǎng)格中導出查找表以及將所述查找表保存在所述介質(zhì)上。
9.如權利要求1所述的方法,其中在所述光學字符識別算法中使用所述模板的步驟包括:在識別所述標識中包含的所述字符之前將所述模板輸出至圖像空間中的圖像券。
10.如權利要求1所述的方法,其中所述輸出步驟包括:對所述模板進行重新采樣以達到所述字符的匹配分辨率和縮放比例。
11.如權利要求1所述的方法,其中所述標識是元件上的部件標識。
12.如權利要求1所述的方法,其中所述元件是燃氣渦輪發(fā)動機元件。
13.—種訓練用于字符識別的機器排版的系統(tǒng),所述系統(tǒng)包括: 用于單獨為多個字符中的每一個生成至少第一模板集合的裝置,所述模板中的每一個包括由多個單元構(gòu)成的網(wǎng)格,并且每個模板通過選擇所述網(wǎng)格的某些單元來限定圖案而生成,所述圖案與所述字符中的相應一個相關聯(lián); 適于保存與每個模板的形狀相關的信息并且可從中檢索所述信息的介質(zhì); 用于從所述信息重新生成所述模板的裝置;以及 適于使用所述模板來識別標識中包含的至少一些所述字符的光學字符識別算法。
14.如權利要求13所述的系統(tǒng),其中所述生成裝置和介質(zhì)是離線系統(tǒng)的元件,并且所述光學字符識別算法是在線系統(tǒng)的元件。
15.如權利要求13所述的系統(tǒng),其中所述生成裝置包括屏幕,在所述屏幕上顯示所述網(wǎng)格并且使用所述屏幕可選擇所述單元。
16.如權利要求13所述的系統(tǒng),其中所述生成裝置配置用于生成用于單一排版或字體的所述第一模板集合。
17.如權利要求16所述的系統(tǒng),其中所述生成裝置配置用于生成用于第二排版或字體的至少第二模板集合。
18.如權利要求13所述的系統(tǒng),所述系統(tǒng)進一步包括:從所述網(wǎng)格中導出的并且存儲在所述介質(zhì)上的查找表。
19.如權利要求13所述的系統(tǒng),所述系統(tǒng)進一步包括:用于在識別所述標識中包含的所述字符之前將所述模板輸出到圖像空間中的裝置。
20.如權利要求13所述的系統(tǒng),其中所述光學字符識別算法使用關聯(lián)技術來將所述標識的圖像與所述模板相比較,從而生成從所述標識識別到的至少一個字符的數(shù)字表現(xiàn)形式。`
【文檔編號】G06K9/62GK103827918SQ201280046267
【公開日】2014年5月28日 申請日期:2012年8月30日 優(yōu)先權日:2011年9月23日
【發(fā)明者】A.F.費羅 申請人:通用電氣公司