亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

用于金融票據(jù)的移動(dòng)圖像捕獲和處理的系統(tǒng)的制作方法

文檔序號(hào):6438947閱讀:205來(lái)源:國(guó)知局
專利名稱:用于金融票據(jù)的移動(dòng)圖像捕獲和處理的系統(tǒng)的制作方法
技術(shù)領(lǐng)域
本發(fā)明大體上涉及自動(dòng)票據(jù)處理,更具體地,涉及金融票據(jù)的移動(dòng)圖像捕獲和處理,以增強(qiáng)用于從在具有照相機(jī)性能的移動(dòng)設(shè)備上捕獲的圖像進(jìn)行數(shù)據(jù)提取的圖像。
背景技術(shù)
通常,金融機(jī)構(gòu)通過在支票上印制金融信息(諸如賬號(hào)和銀行路由號(hào)碼)而具有最大的自動(dòng)化檢查處理系統(tǒng)。在從支付者賬戶扣除支票總額之前,必須從支票中提取總額、 賬號(hào)和其他重要信息。這種提取的高度自動(dòng)化形式由支票處理控制系統(tǒng)來(lái)完成,該支票處理控制系統(tǒng)從磁墨字符識(shí)別(“MICR”)行中獲取信息。MICR行由通過使用磁墨而印制在支票的底部上的特殊設(shè)計(jì)數(shù)字組成。MICR數(shù)據(jù)區(qū)域包括銀行路由號(hào)碼、銀行代號(hào)、賬號(hào)、支票序列號(hào)、支票總額、處理代碼和擴(kuò)展處理代碼。支票和其他票據(jù)可以由銀行和其他金融機(jī)構(gòu)大量地處理??杀惶幚淼钠睋?jù)可以包括支票、存款單、現(xiàn)金支付傳單等。在一些情況下,可以要求銀行或其他金融機(jī)構(gòu)使用實(shí)際的物理票據(jù)。例如,支票可能需要在多個(gè)銀行或其他金融機(jī)構(gòu)之間傳輸。這可能降低金融票據(jù)的處理。另外,本質(zhì)上為非金融的其他類型的票據(jù)可以由商行和其他機(jī)構(gòu)大量地處理。為了有利于處理由移動(dòng)設(shè)備捕獲的圖像中描繪的票據(jù),必須應(yīng)用圖像最優(yōu)化和增強(qiáng)處理操作,使得可以從票據(jù)中提取數(shù)據(jù)。在Nepomniachtchiet. al的美國(guó)專利第 7,778,457號(hào)描述了處理從移動(dòng)設(shè)備中攝取的圖像的一個(gè)方法,其全部?jī)?nèi)容結(jié)合于此作為參考。Nepomniachtchi et. al公開了在移動(dòng)設(shè)備上執(zhí)行多個(gè)圖像處理或?qū)⒋蟛噬珗D像傳輸至服務(wù)器。移動(dòng)設(shè)備通常在可用處理電力和傳輸帶寬方面受到限制。在移動(dòng)設(shè)備上執(zhí)行多個(gè)圖像處理操作可能由于所限制的處理電力而花費(fèi)很長(zhǎng)時(shí)間,并且阻礙用戶在移動(dòng)設(shè)備上有效地執(zhí)行其他任務(wù)。類似地,發(fā)送具有較大票據(jù)大小的圖像也花費(fèi)很長(zhǎng)時(shí)間,并且當(dāng)圖像傳輸時(shí)而限制了移動(dòng)設(shè)備的通信功能。Nepomniachtchi et. al還公開了一種用于使將相同算法應(yīng)用于整個(gè)票據(jù)的圖像二值化的算法。不適宜地,很多圖像存在復(fù)雜的背景或弱圖像前景(一些前景像素具有非常接近于一些背景像素的灰度值的灰度值)。在這些情況下,不可能找到將前景圖像與背景圖像完全分開的單個(gè)閾值或窗口。這導(dǎo)致了在雙調(diào)圖像中產(chǎn)生背景噪音。另外,特定的票據(jù)區(qū)域可以由計(jì)算機(jī)處理來(lái)讀取,使得這些區(qū)域應(yīng)當(dāng)具有受限的背景噪音。Nepomniachtchi et.al還公開了用于在一個(gè)圖像中校正支票的倒置定位的系統(tǒng)和方法,該圖像依賴于將來(lái)自原始圖像的MICR置信與來(lái)自180度旋轉(zhuǎn)圖像的MICR置信相比較。當(dāng)在具有多線程/多處理器的服務(wù)器上執(zhí)行該方法時(shí),依賴于比較MICR置信讀取限制了算法的速度。Nepomniachtchi et. al中的方法沒有解決兩個(gè)圖像的MICR置信太低以致于后面的處理不接受的情況。Nepomniachtchi et. al還公開了通過使用MICR字符的寬度來(lái)校正圖像的大小的系統(tǒng)和方法。由于幾何校正能夠使MICR字符的形狀畸變,所以使用MICR字符的寬度可能產(chǎn)生不準(zhǔn)確的大小變換,Nepomniachtchi et. al還依賴于可能也輕微畸變的幾何校正圖像的縱橫比。而且與其他字符相比,很難辨別特定MICR字符?!猵omniachtchi et. al也沒用縮放票據(jù)來(lái)對(duì)應(yīng)于已知或預(yù)期的票據(jù)或支票尺寸。

發(fā)明內(nèi)容
因此,提供了用于處理由移動(dòng)設(shè)備拍攝的圖像的改進(jìn)的系統(tǒng)。根據(jù)第一方面,提供了一種用于通過移動(dòng)設(shè)備進(jìn)行金融票據(jù)的圖像拍攝和處理的系統(tǒng)。該移動(dòng)設(shè)備包括圖像拍攝裝置,其被配置為拍攝金融票據(jù)的彩色圖像。該移動(dòng)設(shè)備還包括處理器,其被配置為生成退色圖像(colorreduced image);以及傳輸器,其將退色圖像傳輸給服務(wù)器。在某些情況下,退色圖像為灰度圖像。服務(wù)器從移動(dòng)設(shè)備接收退色圖像并且檢測(cè)退色圖像中的金融票據(jù),幾何校正退色圖像,將退色圖像二值化以生成二色調(diào)圖像, 并且校正二色調(diào)圖像的定向和尺寸。在某些情況下,服務(wù)器也校正退色圖像的定向和尺寸。根據(jù)另一方面,服務(wù)器還被配置為將幾何校正的圖像二值化以生成二色調(diào)圖像。 服務(wù)器選擇灰階圖像上的像素,判定所選的像素是否位于票據(jù)區(qū)域內(nèi),并且如果所選的像素在票據(jù)區(qū)域內(nèi),則在票據(jù)區(qū)域內(nèi)選擇窗口,對(duì)于所選的窗口為所選的像素計(jì)算平均值和標(biāo)準(zhǔn)差。如果標(biāo)準(zhǔn)差太小,則像素被轉(zhuǎn)換為白色,而如果標(biāo)準(zhǔn)差不是太小,則基于強(qiáng)度將所選的像素轉(zhuǎn)換為黑色或白色。重復(fù)該處理直到?jīng)]有像素可選為止。在另一方面,為票據(jù)區(qū)域選擇閾值并且判定操作利用該閾值來(lái)判定標(biāo)準(zhǔn)差是否太小。在票據(jù)是支票的情況下,票據(jù)區(qū)域可以是以下之中的任一種=MICR行、小寫金額、大寫金額、日期、簽名和收款人。根據(jù)另一方面,校正拍攝圖像的定向包括如果票據(jù)處于倒置定向則校正圖像內(nèi)票據(jù)的定向。在某些情況下,校正拍攝圖像的定向還包括利用票據(jù)上已知位置的相關(guān)對(duì)象來(lái)判定圖像內(nèi)票據(jù)的定向。在某些情況下,服務(wù)器還被配置為通過讀取金融票據(jù)底部上的 MICR行、生成對(duì)于所讀取的MICR行的MICR置信值、將MICR執(zhí)行值與閾值進(jìn)行比較、當(dāng)MICR 置信值超過閾值時(shí)判定二色調(diào)圖像是正向(right-side up)的、而當(dāng)MICR置信值不超過閾值時(shí)判定二色調(diào)圖像不是正向的、將圖像旋轉(zhuǎn)180度、重新讀取MICR行、生成新的MICR置信值、將新的MICR置信值與閾值進(jìn)行比較、當(dāng)新的MICR置信值超過閾值時(shí)判定經(jīng)過旋轉(zhuǎn)的二色調(diào)圖像是正向的,從而校正二色調(diào)圖像的定向。在另一方面,如果這兩個(gè)MICR置信值至均未超過閾值,則服務(wù)器還被配置為表示圖像的定向未知。根據(jù)另一方面,在圖像中的金融票據(jù)是支票的情況下,服務(wù)器還被配置為利用 MICR行校正二色調(diào)圖像的尺寸。在一個(gè)方面,MICR字符的平均高度被用來(lái)確定用于計(jì)算圖像的尺寸的比例系數(shù)。在另一方面,利用相對(duì)于MICR符號(hào)的距離,諸如一方面為過渡符號(hào) (transit symbol)之間的距離、或第二方面為過渡符號(hào)與支票的前邊緣之間的距離,來(lái)確定比例系數(shù)。在另一方面,MICR字符的高度和寬度都被用來(lái)確定用于計(jì)算圖像的尺寸的高度和寬度比例系數(shù)。在另一方面,為了調(diào)整圖像的縮放比例,將所計(jì)算出的尺寸與期望的尺寸進(jìn)行比較。所期望的尺寸可以使用已知的支票尺寸或基于具有1/8英寸倍數(shù)的票據(jù)尺寸的尺寸。從以下說(shuō)明連同示出了各種實(shí)施方式的附圖中,其他特征和優(yōu)點(diǎn)將顯而易見。


為了更好地理解本文中描述的各種實(shí)施方式,并且為了更清晰地示出它們?nèi)绻麑?shí)現(xiàn)效果,將以實(shí)施例的方式參考示出至少一個(gè)示例性實(shí)施方式的附圖,其中圖I是示出了可能通過本文所述的系統(tǒng)和方法而成像的示例支票的示圖。圖2是示出了可能通過使用本文所述的系統(tǒng)和方法而成像的示例支付息票的示圖。圖3是示出了圖I中所示的支票的示例焦點(diǎn)外圖像的示圖。圖4是示出了圖2中所示的支付息票的焦點(diǎn)外圖像的示圖。圖5是示出了矩形成形票據(jù)的圖像中的透視畸變的示例的示圖。圖6是示出了根據(jù)圖5的示例的示例性原始圖像、焦點(diǎn)矩形和票據(jù)四邊形ABCD的示圖。圖7是示出了根據(jù)本文所述的系統(tǒng)和方法的示例方法的流程圖。圖8是示出了根據(jù)本文所述的系統(tǒng)和方法的圖I和圖3的支票的示例雙調(diào)圖像的示圖。圖9是示出了根據(jù)本文所述的系統(tǒng)和方法的圖2和圖4的支付息票的示例雙調(diào)圖像的示圖。圖10是根據(jù)本文所述的系統(tǒng)和方法的在圖像處理階段使用的示例方法的流程圖。圖Ila是示出了根據(jù)本文所述的系統(tǒng)和方法的在來(lái)自移動(dòng)設(shè)備的彩色圖像中進(jìn)行自動(dòng)票據(jù)檢測(cè)的已知方法的流程圖。圖Ilb是根據(jù)本文所述的系統(tǒng)和方法的描繪其中已檢測(cè)到各個(gè)邊角的支票的示例移動(dòng)圖像。圖Ilc是示出了根據(jù)本文所述的系統(tǒng)和方法的在來(lái)自移動(dòng)設(shè)備的灰階圖像中進(jìn)行自動(dòng)票據(jù)檢測(cè)的改進(jìn)方法的流程圖。圖12a是示出了根據(jù)本文所述的系統(tǒng)和方法的用于將彩色圖像轉(zhuǎn)換為較小的“圖標(biāo)”圖像的示例方法的流程圖。圖12b是根據(jù)本文所述的系統(tǒng)和方法的、在圖Ilb的移動(dòng)圖像被轉(zhuǎn)換成彩色“圖標(biāo)”圖像之后的描繪該圖Ilb的移動(dòng)圖像的示例的移動(dòng)圖像。圖13a是示出了根據(jù)本文所述的系統(tǒng)和方法的色濃度(color depth)降低的示例方法的流程圖。圖13b是根據(jù)本文所述的系統(tǒng)和方法的、在將色濃度降低操作劃分為3 X 3灰度之后的描繪圖12b的彩色“圖標(biāo)”圖像的示例的移動(dòng)圖像。圖13c是根據(jù)本文所述的系統(tǒng)和方法的、一旦圖12b的彩色“圖標(biāo)”圖像通過色濃度降低操作被轉(zhuǎn)換為灰度“圖標(biāo)”圖像的描繪該彩色“圖標(biāo)”圖像的示例的移動(dòng)圖像。圖14是示出了根據(jù)本文所述的系統(tǒng)和方法的用于從灰度“圖標(biāo)”圖像中找出票據(jù)邊角的示例方法的流程圖。圖15a是示出了根據(jù)本文所述的系統(tǒng)和方法的用于幾何校正的示例方法的流程圖。圖15b是描繪畫面定位中的支票的示例移動(dòng)圖像。
圖15c是根據(jù)本文所述的系統(tǒng)和方法的在幾何校正操作之后的描繪圖Ilb的移動(dòng)圖像的示例的移動(dòng)圖像。圖16a是示出了根據(jù)本文所述的系統(tǒng)和方法的用于二值化的示例方法的流程圖。圖16b是根據(jù)本文所述的系統(tǒng)和方法的、在圖15c的移動(dòng)圖像通過二值化操作本轉(zhuǎn)換為雙調(diào)圖像之后的描繪圖15c的移動(dòng)圖像的示例的移動(dòng)圖像。圖16c是示出了圖16a的二進(jìn)制方法的另外操作的流程圖。圖17a是示出了根據(jù)本文所述的系統(tǒng)和方法的用于在移動(dòng)圖像中校正票據(jù)的倒置定位的已知方法的流程圖。圖17b是描繪倒置定位中的支票的示例雙調(diào)圖像。圖17c是示出了用于校正票據(jù)在移動(dòng)圖像中的倒置定位或指出定位是否未知的改進(jìn)方法的流程圖。圖18a是示出了根據(jù)本文所述的系統(tǒng)和方法的、用于使用MICR字符的高度進(jìn)行圖像的大小校正的示例方法的流程圖。圖18b是示出了根據(jù)本文所述的系統(tǒng)和方法的、使用MICR字符的高度和寬度的、 用于進(jìn)行圖像的大小校正的示例方法的流程圖。圖19是示出了示例計(jì)算模塊的簡(jiǎn)化框圖。
具體實(shí)施例方式圖I是示出可通過本文描述的系統(tǒng)和方法進(jìn)行成像的示例性支票100的示圖。移動(dòng)圖像捕獲和處理系統(tǒng)和方法可以用于各種票據(jù),包括諸如個(gè)人支票、商業(yè)支票、收銀員支票、注冊(cè)支票和憑證的金融票據(jù)。通過使用支票100的圖像,更有效地執(zhí)行支票結(jié)清過程。 本領(lǐng)域的技術(shù)人員應(yīng)理解,支票并不是唯一可使用這些系統(tǒng)的票據(jù)類型。例如,使用本文描述的系統(tǒng)和方法還可處理諸如存款憑證的其他票據(jù)。圖2是示出了可使用本文描述的系統(tǒng)和方法進(jìn)行成像的示例性支付息票200的示圖。在一些實(shí)施方式中,支票100、支付息票200或其他票據(jù)可使用移動(dòng)設(shè)備進(jìn)行成像。移動(dòng)設(shè)備可以是移動(dòng)電話手機(jī)、個(gè)人數(shù)字助理或其他移動(dòng)通信設(shè)備。移動(dòng)設(shè)備可包括照相機(jī),或者可包括允許其連接至照相機(jī)的功能件。該連接可以是有線的或無(wú)線的。以這種方式,移動(dòng)設(shè)備可以連接至外部照相機(jī)并從照相機(jī)接收?qǐng)D像。使用移動(dòng)設(shè)備所拍攝或下載至移動(dòng)設(shè)備的票據(jù)的圖像可以傳輸至服務(wù)器。例如, 在一些情況下,圖像可通過諸如碼分多址(“CDMA”)電話網(wǎng)絡(luò)或其他移動(dòng)電話網(wǎng)絡(luò)的移動(dòng)通信設(shè)備網(wǎng)絡(luò)傳輸。例如使用移動(dòng)設(shè)備的照相機(jī)所拍攝的圖像可以初始格式化為每像素24 位(24位/像素)的JPEG圖像。然而,應(yīng)理解,使用不同的照相機(jī)、移動(dòng)設(shè)備等也可拍攝許多其他類型的圖像。各種票據(jù)可包括各種區(qū)域。票據(jù)中的一些區(qū)域可認(rèn)為是“主要”區(qū)域。例如,支票 100的受關(guān)注的主要區(qū)域可包括小寫金額102、法定金額104和MICR行106。MICR行106 可包括在MICR行內(nèi)為區(qū)域定界的符號(hào),諸如表示例如表示傳輸?shù)倪^渡(transit)標(biāo)志113 和表示賬戶號(hào)的on-us標(biāo)志115。受關(guān)注的其他區(qū)域包括收款人108、日期110和簽名112。 支付息票200的受關(guān)注的主要區(qū)域可包括諸如余額、最低支付和利息的支付金額202。計(jì)費(fèi)公司名稱和地址204、賬戶號(hào)206和代碼行208也可是受關(guān)注的區(qū)域。在一些實(shí)施方式中,需要電子讀取票據(jù)中的這些區(qū)域的各種信息。例如,為了處理要存入的支票,需要電子讀取支票上的法定金額104和小寫金額102、MICR行106、收款人108、日期110和簽名112。在一些情況下,這些信息難以讀取,這是因?yàn)槔缰被蚱渌睋?jù)失焦或其他方式的劣質(zhì)圖像。圖3是示出圖I中所示的支票的示例性失焦圖像的示圖。在一些情況下,票據(jù)圖像可能失焦。失焦的票據(jù)圖像可能難以或不可能讀取、電子處理等。例如,可能難以讀取支票100的圖像300上的金額302和304或收款人306。圖4是示出了圖2中所示的支付息票(coupon)的示例性失焦圖像的示圖。因?yàn)橹Ц断⑵?00的圖像400失焦,所以難以正確地將支付存入。例如,支付可能存入至錯(cuò)誤的賬戶,或者可能存入不正確的金額。如果支票和支付息票都難以讀取或掃描質(zhì)量較差時(shí),這種情況尤其真實(shí)存在。許多不同的因素可能會(huì)影響基于圖像捕獲和處理系統(tǒng)的移動(dòng)設(shè)備的能力和圖像的質(zhì)量。諸如失焦圖像(如上所述)、不等的對(duì)比或亮度的光學(xué)缺陷或其它光學(xué)缺陷會(huì)使其難以處理票據(jù)(例如,支票、支付息票、存款憑證等)的圖像。圖像的質(zhì)量還會(huì)受到拍攝時(shí)票據(jù)位置所在的表面上或?qū)ζ睋?jù)進(jìn)行拍攝時(shí)所在的角度的影響。這通過使票據(jù)出現(xiàn)例如朝向正確的方位、倒置、偏斜等來(lái)影響圖像質(zhì)量。此外,如果在倒置時(shí)對(duì)票據(jù)進(jìn)行成像,則系統(tǒng)不可能或幾乎不可能確定包含在票據(jù)中的信息。在一些情況下,表面的類型可能影響最終的圖像。例如,如果在拍攝圖像時(shí)票據(jù)位于粗糙的表面,在粗糙的表面可能會(huì)完全示出。在一些情況下,票據(jù)的表面可能是粗糙的, 這是因?yàn)楸砻嬖谄睋?jù)的下面。此外,粗糙的表面會(huì)導(dǎo)致照相機(jī)拍攝出陰影或其他問題。這些問題可能會(huì)使其難以或不可能讀取票據(jù)中所包含的信息。照明也會(huì)影響圖像的質(zhì)量,例如,光源的位置和光源失真。在票據(jù)上使用光源可以提高圖像質(zhì)量的方式照亮票據(jù),而票據(jù)的側(cè)部的光源可產(chǎn)生難以處理的圖像。來(lái)自側(cè)部的照明可例如導(dǎo)致陰影或其它照明失真。例如,太陽(yáng)、電燈泡、熒光照明等的光的類型也可能是因素。如果照明太亮,則票據(jù)可能出現(xiàn)圖像褪色。另一方面,如果照明太暗,則難以讀取圖像。圖像的質(zhì)量也會(huì)受到諸如票據(jù)的類型、使用的字體,選擇的顏色等的票據(jù)特性的影響。例如,具有黑字的白色票據(jù)的圖像比具有黑字的深色票據(jù)更易于處理。圖像質(zhì)量也會(huì)受到所使用的移動(dòng)設(shè)備的影響。一些移動(dòng)照相手機(jī)例如可具有使用大量的百萬(wàn)像素保存圖像的照相機(jī)。其它的移動(dòng)相機(jī)手機(jī)可具有自動(dòng)調(diào)焦特性、自動(dòng)閃光等。通常,當(dāng)與不包括這些特性的移動(dòng)設(shè)備相比時(shí),這些特性可以改善圖像。使用移動(dòng)設(shè)備拍攝的票據(jù)圖像可以具有以上討論的一個(gè)或多個(gè)缺陷。這些缺陷或其他缺陷可能導(dǎo)致處理圖像(例如,處理票據(jù)的一個(gè)或多個(gè)區(qū)域)時(shí)導(dǎo)致低精度。因此,在一些實(shí)施方式中,使用移動(dòng)設(shè)備創(chuàng)建票據(jù)的圖像的系統(tǒng)和方法可包括識(shí)別低質(zhì)量圖像的能力。如果圖像的質(zhì)量被確定為較低時(shí),可以提示用戶拍攝另一圖像。各種衡量標(biāo)準(zhǔn)可用于檢測(cè)失焦圖像。例如,可利用聚焦測(cè)量。聚焦測(cè)量可以是在整個(gè)圖像上測(cè)出的并且關(guān)于圖像的灰度水平動(dòng)態(tài)范圍歸一化的相鄰像素間的最大視頻梯度和“像素節(jié)距”的比值。像素節(jié)距可以是圖像上的點(diǎn)之間的距離。在一些實(shí)施方式中,聚焦得分可用于確定圖像是否被充分聚焦。如果圖像未充分聚焦,則可提示用戶拍攝另一圖像。
圖像聚焦得分可作為最大視頻梯度、灰度水平動(dòng)態(tài)范圍與像素節(jié)距的函數(shù)來(lái)計(jì)算。例如,在一個(gè)實(shí)施方式中圖像聚焦得分(score)=(最大視頻梯度)*(灰度水平動(dòng)態(tài)范圍)*(像素節(jié)距)(式子I)。視頻梯度可以是第一像素“i”的灰度水平減去第二像素“i+1”的灰度水平的絕對(duì)值。例如視頻梯度=ABS[(像素“i”的灰度水平)-(像素“i+1”的灰度水平)](式子2)?;叶人絼?dòng)態(tài)范圍可以是“η”個(gè)最亮像素的平均值減去“η”個(gè)最暗像素的平均值。例如灰度水平動(dòng)態(tài)范圍=[AVE ( “N”個(gè)最亮像素)-AVE ( “N”個(gè)最暗像素)](式子3)。在上述式子3中,N可以定義為用于確定圖像的平均最暗和最亮像素灰度水平的像素的數(shù)量。在一些實(shí)施方式中,N可選擇為64。因此,在一些實(shí)施方式中,將64個(gè)最暗的像素一起平均和64個(gè)最暗的像素一起平均來(lái)計(jì)算灰度水平動(dòng)態(tài)范圍值。像素節(jié)距可以是圖像分辨率的倒數(shù),例如,每英寸的點(diǎn)數(shù)。像素節(jié)距=[I/圖像分辨率](式子4)。換句話說(shuō),如以上定義,像素節(jié)距是圖像上點(diǎn)之間的距離,因?yàn)閳D像分辨率是圖像上點(diǎn)之間的距離的倒數(shù)。圖5是示出了矩形形狀票據(jù)的圖像中的透視畸變的示例的示圖。圖像可以包括透視變換畸變500,使得矩形可以變?yōu)樗倪呅蜛B⑶502,如圖中所示。透視畸變會(huì)發(fā)生是因?yàn)槭褂迷谂c票據(jù)成一角度的位置處而不是直接位于所述票據(jù)上方的照相機(jī)獲取圖像。當(dāng)直接在矩形票據(jù)上方時(shí),其通常會(huì)呈現(xiàn)為矩形。隨著成像裝置從表面的正上方移動(dòng),票據(jù)畸變直至其不再被看到而是只可以看到頁(yè)的邊緣。虛線框504包括由照相機(jī)獲得的圖像幀(frame)。該圖像幀的大小為hXw,如圖中所示。一般地,優(yōu)選的是其包括單個(gè)圖像的hXw框內(nèi)的整個(gè)票據(jù)。然而,應(yīng)當(dāng)理解,一些票據(jù)可能太大或包括此的太多頁(yè)是優(yōu)選的或甚至可行的。在一些實(shí)施方式中,可以對(duì)圖像進(jìn)行處理或預(yù)處理,以自動(dòng)地找到或“升高”四邊形502。換言之,形成四邊形502的票據(jù)可以與圖像的剩余部分分離,使得可以僅僅處理票據(jù)。通過將四邊形502與圖像中的任何背景分離,隨后可以對(duì)其進(jìn)行進(jìn)一步的處理。四邊形502可以映射至矩形位圖上,以去除或減少透視畸變。另外地,圖像銳化可以用來(lái)改善圖像的失焦得分。隨后,可提高圖像的分辨率并且將圖像轉(zhuǎn)換成黑白圖像。在一些情況下,黑白圖像在根據(jù)本文中所描述的系統(tǒng)和方法使用自動(dòng)票據(jù)處理系統(tǒng)進(jìn)行處理時(shí),可以具有更高的識(shí)別率??梢栽谝恍┫到y(tǒng)中使用雙色調(diào)(例如,黑色和白色)圖像。這樣的系統(tǒng)會(huì)要求每英寸至少200個(gè)點(diǎn)的分辨率的圖像。因此,使用移動(dòng)設(shè)備獲取的彩色圖像需要具有足夠高的質(zhì)量,以使得可將圖像成功地從例如每像素24位(24位/像素)的RGB圖像轉(zhuǎn)換成雙色調(diào)圖像。改變圖像的大小就如同諸如支票、支付票證等的票據(jù)以每英寸200個(gè)點(diǎn)縮放。圖6是示出了示例性原始圖像、聚焦矩形以及根據(jù)圖5的示例性票據(jù)四邊形ABCD。 在一些實(shí)施方式中,將用于處于處理的票據(jù)置于或靠近照相機(jī)附近的輸入圖像是必要的。 所有點(diǎn)A、B、C和D位于圖像中,并且聚焦矩形602位于四邊形AB⑶502內(nèi)部。票據(jù)還可以具有低的失焦得分,并且可以選擇票據(jù)周圍的背景比票據(jù)暗。以此方式,更亮的票據(jù)將從更暗的背景凸顯出。
圖7是示出了根據(jù)本文中所描述的系統(tǒng)和方法的示例性方法700的流程圖?,F(xiàn)在參照?qǐng)D7,在操作701中,用戶登錄移動(dòng)通信設(shè)備上的票據(jù)捕獲系統(tǒng)。根據(jù)各個(gè)實(shí)施方式,用于移動(dòng)通信設(shè)備上的票據(jù)捕獲的方法和系統(tǒng)可以進(jìn)一步包括需要用戶登錄的應(yīng)用程序。以此方式,使用移動(dòng)通信設(shè)備訪問票據(jù)捕獲系統(tǒng)可限定為授權(quán)的用戶。在操作702中,在所示出的實(shí)施方式中,選擇票據(jù)的類型。例如,用戶可以選擇票據(jù)的類型為支票、支付息票或存款憑證。通過選擇票據(jù)的類型,移動(dòng)設(shè)備能夠掃描圖像的特定部分,以確定例如收款人、支票金額、簽名等。然而,在一些實(shí)施方式中,設(shè)備通過處理圖像可以確定獲取哪種類型票據(jù)的圖像。在操作704中,使用例如移動(dòng)通信設(shè)備捕獲圖像。在所示出的實(shí)施方式中,運(yùn)行在移動(dòng)通信設(shè)備上的應(yīng)用程序可以提示設(shè)備的用戶獲取票據(jù)的正面圖像。也可以獲取票據(jù)的背面圖像。例如,如果票據(jù)是支票,則票據(jù)的背面圖像是必要的,這是因?yàn)橹钡谋趁嫘枰M(jìn)行簽名。如果需要獲取票據(jù)背面的圖像,則應(yīng)用程序可以提示用戶獲取該圖像。應(yīng)用程序還可以進(jìn)行一些圖像處理以確定圖像或多個(gè)圖像的質(zhì)量是否足以根據(jù)本文中所描述的系統(tǒng)和方法進(jìn)行進(jìn)一步處理。需要進(jìn)行進(jìn)一步處理的質(zhì)量在各個(gè)實(shí)施方式間可以是不同的。 例如,一些系統(tǒng)可以比其他系統(tǒng)具有確定劣質(zhì)圖像上所包含的信息更好的能力。在所示出的實(shí)施方式中,在操作706處,輸入金額。當(dāng)所處理的票據(jù)是支票時(shí),所輸入的金額可以是支票的金額??商鎿Q地,金額可以是支付金額或存款金額,這取決于所處理的票據(jù)的類型。在一些實(shí)施方式中,該系統(tǒng)通過處理圖像可以確定金額。例如,在一些情況下,光學(xué)字符識(shí)別(“OCR”)可以用于確定票據(jù)上具有什么樣的字符和數(shù)字。例如,可以然后使用 OCR或基于字符確定的其他計(jì)算機(jī)確定位于支票或支付息票的金額框里的數(shù)字。這將可需要手動(dòng)地輸入金額取代。在其他實(shí)施方式中,手動(dòng)輸入可以用于驗(yàn)證使用例如OCR或基于字符確定的其他計(jì)算機(jī)所確定的計(jì)算機(jī)產(chǎn)生值。在操作708中,將圖像傳輸至服務(wù)器。可以使用例如超文本傳輸協(xié)議(“HTTP”) 或移動(dòng)消息服務(wù)(“麗S”)從捕獲票據(jù)圖像的移動(dòng)通信設(shè)備(例如,照相手機(jī))傳輸圖像。 然后,服務(wù)器通過例如向移動(dòng)設(shè)備傳輸回消息確認(rèn)消息已收到。在操作710中,執(zhí)行圖像處理。在示例性實(shí)施方式中,服務(wù)器可以通過執(zhí)行自動(dòng)旋轉(zhuǎn)、傾斜、透視畸變校正、裁切等對(duì)圖像進(jìn)行處理。服務(wù)器還可以處理圖像以產(chǎn)生雙色調(diào)圖像以用于提取數(shù)據(jù)。在其他實(shí)施方式中,可以在移動(dòng)通信設(shè)備中執(zhí)行一些或所有數(shù)據(jù)處理。例如,移動(dòng)通信設(shè)備可以執(zhí)行自動(dòng)旋轉(zhuǎn)、傾斜、透視畸變校正、裁切等。另外地,移動(dòng)設(shè)備還可以處理圖像以產(chǎn)生雙色調(diào)圖像用于提取數(shù)據(jù)。在一些情況下,處理可以在移動(dòng)設(shè)備和服務(wù)器之間分配。在操作712中,使用移動(dòng)設(shè)備進(jìn)行的票據(jù)處理完成。例如,當(dāng)服務(wù)器已經(jīng)確認(rèn)從接收到的圖像提取出所有必要的數(shù)據(jù),其可以將狀態(tài)消息傳輸給傳輸圖像的移動(dòng)設(shè)備??商鎿Q地,如果一些必要數(shù)據(jù)不能被提取,則服務(wù)器可以傳輸附加數(shù)據(jù)的請(qǐng)求。該請(qǐng)求可以包括附加圖像的請(qǐng)求。在一些情況下,該請(qǐng)求可以用于用戶輸入的數(shù)據(jù),例如,使用移動(dòng)通信設(shè)備上的鍵盤輸入如支票的金額。在一些實(shí)施方式中,在移動(dòng)設(shè)備中確定圖像的質(zhì)量。以此方式,可以減少來(lái)自服務(wù)器對(duì)附加圖像的請(qǐng)求數(shù)量。該請(qǐng)求可直接來(lái)源于移動(dòng)設(shè)備。這可以允許更快速地確定請(qǐng)求, 并且可以允許用于在較短的時(shí)間內(nèi)從早前的圖像獲取另外的圖像。這可以意味著例如用戶還要物理上靠近票據(jù)并且還要持有移動(dòng)設(shè)備。這可以使得更容易再獲取圖像。如果圖像質(zhì)量處理在服務(wù)器進(jìn)行,在其需要較長(zhǎng)的時(shí)間來(lái)確定圖像質(zhì)量是可被接受的并將該消息通信回用戶。這可以意味著用戶不再在票據(jù)附近或已近開始執(zhí)行另一任務(wù)。然而,應(yīng)當(dāng)理解,在一些實(shí)施方式中,基于實(shí)施的服務(wù)器可以用于從移動(dòng)設(shè)備卸載處理需求。另外地,在一些情況下,其可以比使用移動(dòng)通信設(shè)備處理圖像來(lái)確定圖像質(zhì)量快或與使用移動(dòng)通信設(shè)備處理圖像來(lái)確定圖像質(zhì)量一樣快。圖8是示出了根據(jù)本文描述的系統(tǒng)和方法的圖I和圖3的支票的示例性雙色調(diào)圖像800的圖示。圖9是示出了根據(jù)本文描述的系統(tǒng)和方法的圖2和圖4的支付息票的示例性雙色調(diào)圖像900的圖示。如所示,在圖8和圖9的雙色調(diào)圖像中,必要信息(諸如收款人、 金額、賬號(hào)等)被保留,而額外信息被去除。例如,可能被一些人置于其支票上的背景圖案不存在于支票的雙色調(diào)圖像800中。圖10是在圖像處理階段使用的示例性方法1000的流程圖。特別地,在圖10中示出的某些或全部操作可以在圖7示出的多種操作期間執(zhí)行?,F(xiàn)參考圖10,在操作1001處, 方法700接收由移動(dòng)設(shè)備原始獲取的彩色圖像(也稱為“移動(dòng)圖像”)。例如,該圖像可能源自照相手機(jī),該照相手機(jī)現(xiàn)將圖像傳輸至服務(wù)器以用于后期捕獲處理。該移動(dòng)圖像具有位于該圖像中某處的票據(jù)。為了檢測(cè)到該票據(jù),在操作1002處設(shè)置有自動(dòng)票據(jù)檢測(cè)模塊。 根據(jù)該實(shí)施方式,該自動(dòng)票據(jù)檢測(cè)模塊可能專用于僅檢測(cè)諸如金融票據(jù)(例如,支票或存款息票)的特定類型票據(jù),或可以普遍地檢測(cè)多種類型的交易票據(jù)。在自動(dòng)票據(jù)檢測(cè)操作結(jié)束時(shí),票據(jù)邊角(例如,支票邊角)的位置被輸出為四邊形ABCD(例如,四邊形ABCD 502) 的邊角A、B、C和D。將參考圖IlA給出有關(guān)自動(dòng)票據(jù)檢測(cè)操作的進(jìn)一步細(xì)節(jié)。在自動(dòng)票據(jù)檢測(cè)之后,方法1000在操作1004處對(duì)移動(dòng)圖像執(zhí)行幾何校正。如前所述,該校正可以包括通過執(zhí)行以下各項(xiàng)來(lái)整理圖像自動(dòng)旋轉(zhuǎn)操作、傾斜操作、透視畸變校正操作以及裁切操作。通常,這歸因于原始移動(dòng)圖像中存在的透視畸變,以及移動(dòng)圖像內(nèi)票據(jù)的不正確定向的可能性。圖15a的討論將給出有關(guān)幾何校正操作的進(jìn)一步細(xì)節(jié)。接下來(lái)是操作1006處的圖像二值化。圖像的二值化也被稱為以每像素I位生成票據(jù)的雙色調(diào)圖像。遠(yuǎn)程存款系統(tǒng)通常需要圖像的二值化以用于處理。將參考圖16a和圖 16c更詳細(xì)地討論二值化操作。由于許多處理引擎對(duì)于圖像大小敏感,因此可以利用大小校正操作1010。例如,在支票的情況下,用于金額識(shí)別的處理引擎可依賴于支票大小來(lái)將個(gè)人支票和商業(yè)支票區(qū)別開,而用于表格識(shí)別的處理引擎可能依賴于票據(jù)大小作為確定表格類型的重要特征。將參照?qǐng)D18更詳細(xì)地討論大小校正操作1010。方法1000結(jié)束于操作1012處,將票據(jù)輸出為雙色調(diào)圖像和灰階圖像。取決于圖像中所呈現(xiàn)出的票據(jù)類型,這些圖像隨后可用于處理(例如,金融處理)。通常,在關(guān)于圖7 的操作712描述的處理完成期間執(zhí)行該金融處理。該雙色調(diào)圖像是由金融處理系統(tǒng)友好識(shí)別的圖像。繼續(xù)參考之前關(guān)于圖10的操作1002所描述的自動(dòng)票據(jù)檢測(cè)操作,圖11至圖14 更詳細(xì)地示出了自動(dòng)票據(jù)檢測(cè)操作。
現(xiàn)在參考圖11a,提供了以下流程圖,其示出了用于在來(lái)自移動(dòng)設(shè)備的彩色圖像內(nèi)進(jìn)行自動(dòng)票據(jù)檢測(cè)的已知方法1100。典型地,在方法1100內(nèi)描述的操作在自動(dòng)票據(jù)檢測(cè)模塊內(nèi)執(zhí)行,然而,存在著該操作駐留在多個(gè)模塊的實(shí)施方式。此外,當(dāng)檢測(cè)移動(dòng)圖像中的票據(jù)時(shí),自動(dòng)票據(jù)檢測(cè)模塊通??紤]多個(gè)因素。自動(dòng)票據(jù)檢測(cè)模塊可以考慮移動(dòng)圖像中票據(jù)的任意定位、移動(dòng)圖像中的3D畸變、票據(jù)的未知大小、票據(jù)的未知顏色、背景的未知顏色以及移動(dòng)引擎的多種其他特性(例如,分辨率、大小等)。方法1100通過接收來(lái)自移動(dòng)設(shè)備的原始彩色圖像而開始于操作1102。一旦接收, 則該原始彩色圖像在操作1104處被轉(zhuǎn)換為較小的彩色圖像,也被稱為彩色“圖標(biāo)”圖像。 該彩色“圖標(biāo)”圖像保留了票據(jù)和背景之間的顏色對(duì)比,而降低了票據(jù)內(nèi)部的對(duì)比。參考圖 12a給出了轉(zhuǎn)換處理的詳細(xì)描述。接下來(lái),在操作1106處,對(duì)彩色“圖標(biāo)”圖像應(yīng)用褪色操作。在該操作期間,圖像的整體顏色變淡,而在圖像中保留票據(jù)與其背景之間的對(duì)比。具體地,操作1104的彩色“圖標(biāo)”圖像被轉(zhuǎn)換為具有相同尺寸的灰“圖標(biāo)”圖像(也稱為灰階“圖標(biāo)”圖像)。參考圖13a 進(jìn)一步詳細(xì)描述顏色深度降低處理。隨后,方法1100在操作1108處定位灰“圖標(biāo)”圖像中票據(jù)的邊角。正如之前在圖 6中提及的,這些邊角A、B、C和D構(gòu)成四邊形AB⑶(例如,四邊形AB⑶502)。反過來(lái),四邊形AB⑶構(gòu)成票據(jù)的周界。例如,圖Ilb描繪了支票1112,其中邊角1114由操作1108檢測(cè)到。一旦檢測(cè)出邊角,就在操作1110處輸出邊角的位置?,F(xiàn)在參考圖11c,提供了以下流程圖,其示出了用于在來(lái)自移動(dòng)設(shè)備的圖像中進(jìn)行自動(dòng)票據(jù)檢測(cè)的改進(jìn)方法1101。方法1101提供了更快速的自動(dòng)票據(jù)檢測(cè),包括在移動(dòng)設(shè)備上將圖像轉(zhuǎn)換為褪色圖像,然后將該圖像傳輸至服務(wù)器從而執(zhí)行自動(dòng)票據(jù)檢測(cè)方法1101 的其余步驟。移動(dòng)設(shè)備通常在可用處理電力以及傳輸帶寬方面受到限制。如果圖Ila的方法1100全部在移動(dòng)設(shè)備上執(zhí)行,則自動(dòng)票據(jù)檢測(cè)將在該裝置上花費(fèi)大量時(shí)間并且占用可能用于其它任務(wù)的、移動(dòng)設(shè)備的處理器運(yùn)轉(zhuǎn)。將彩色圖像從移動(dòng)設(shè)備發(fā)送到服務(wù)器也會(huì)花費(fèi)大量傳輸時(shí)間并使用寶貴的帶寬。相比于傳輸全彩圖像或者在移動(dòng)設(shè)備上執(zhí)行圖像處理,轉(zhuǎn)換為褪色圖像并傳輸該褪色圖像更為快捷。改進(jìn)方法1101依賴于發(fā)送褪色圖像以及使用服務(wù)器來(lái)執(zhí)行方法1101的處理器密集步驟,從而提供快速的圖像處理以及來(lái)自服務(wù)器的快速圖像質(zhì)量反饋。方法1101還向用戶提供了快速處理的感受,原因在于移動(dòng)設(shè)備沒有被圖像處理操作或發(fā)送有關(guān)彩色圖像的龐大數(shù)據(jù)量占用。方法1101以接收來(lái)自移動(dòng)設(shè)備的彩色圖像而開始于操作1122。一旦接收,在操作1124處將褪色操作應(yīng)用于彩色圖像。在該操作期間,圖像的整體顏色變淡,從而產(chǎn)生需要較少存儲(chǔ)大小的褪色圖像??梢允褂妹總€(gè)像素的RGB值和優(yōu)選權(quán)重基于逐個(gè)像素執(zhí)行褪色。還可以使用其他褪色方法,包括在圖13a中描述的方法。在一些實(shí)施方式中,褪色圖像可以是灰階圖像。接下來(lái),在操作1126處,該褪色圖像從移動(dòng)設(shè)備傳輸至服務(wù)器。由于顏色深度降低操作產(chǎn)生具有較小尺寸的圖像,因此相比于發(fā)送彩色圖像而言傳輸時(shí)間減少。一旦在服務(wù)器處接收到,在操作1128處將褪色圖像轉(zhuǎn)換為較小的褪色圖像,為了方便可以將其稱作 “圖標(biāo)”圖像。該轉(zhuǎn)換處理涉及對(duì)褪色圖像進(jìn)行縮減,類似于參考圖12a描述的處理。隨后,方法1101在操作1130處確定“圖標(biāo)”圖像中票據(jù)的邊角的位置。如上所述,邊角構(gòu)成限定票據(jù)周界的四邊形(例如,四邊形ABCD 502)。一旦檢測(cè)到這些邊角,在步驟 1132處輸出邊角的位置。服務(wù)器可以利用邊角的位置,來(lái)幾何地校正服務(wù)器接收到的褪色圖像中的票據(jù)。現(xiàn)在參考圖12a,提供了以下流程圖,其描述了用于將彩色圖像轉(zhuǎn)換為較小的“圖標(biāo)”圖像的示例性方法1200。該較小“圖標(biāo)”圖像保留了其中描繪的票據(jù)與其背景之間的顏色對(duì)比,而降低了票據(jù)內(nèi)部的對(duì)比。一旦在操作1201處接收到來(lái)自移動(dòng)設(shè)備的彩色圖像, 方法1200在操作1202處消除圖像中的過銳化。因此,假設(shè)彩色輸入圖像I具有WXH個(gè)像素的大小,操作1202平均圖像I的強(qiáng)度并將圖像I縮減至圖像I’,使得圖像I’具有的大小為圖像I的一半(即,W’ = W/2以及H’ = H/2)。在特定實(shí)施方式中,彩色變換公式可以描述為C(p' ) = ave{C(q) :p的SXS窗口中的q},(式子5),其中C是色彩強(qiáng)度的紅、綠或藍(lán)分量的任一個(gè);P’是坐標(biāo)(x’,y’)的圖像I’上的任一任意像素;p是圖像I上的相應(yīng)像素P = p(x,y),其中X = 2*x'以及y = 2*y' ;q是包含在以p為中心的SXS窗口的任一像素;S是以實(shí)驗(yàn)方法建立;以及ave是SXS窗口中所有q的平均。在接下來(lái)的操作1204處,消除圖像中的較小“暗”對(duì)象。這種較小“暗”對(duì)象的示例包括但不限于票據(jù)內(nèi)的機(jī)器印制字符和手寫字符。因此,假設(shè)操作1204接收來(lái)自操作 1202的圖像I’,操作1204創(chuàng)建新的彩色圖像I”,其被稱作具有設(shè)定為固定較小值的寬度 W”以及設(shè)定為W”*(H/W)的高度H”的“圖標(biāo)”,從而保留了圖像I的原始縱橫比。在一些實(shí)施方式中,變化式子可以描述為C(p" ) = maxlCQ' ) :p’的S’XS’窗口中的q' },(式子6),其中,C是色彩強(qiáng)度的紅、綠或藍(lán)分量中的任一種;p”是圖像I”上的任意像素;p’是圖像I’上的像素,P’對(duì)應(yīng)于在如上定義的類似變換中的P” ;q’是包含在以P’為中心的 S’ XS’窗口的圖像I’上的任一像素;max是S’ XS’窗口中所有q’中的最大值;W”是以實(shí)驗(yàn)方法建立的;S是以實(shí)驗(yàn)方法建立用于計(jì)算強(qiáng)度I”的;以及I”(p”)是對(duì)于每個(gè)顏色平面單獨(dú)地通過對(duì)圖像I’上對(duì)應(yīng)像素P’的窗口中的強(qiáng)度函數(shù)I’(P’ )取最大值所定義的強(qiáng)度值。使用“最大值”而非“平均值”的原因是使“圖標(biāo)”更白(RGB值為(255,255,255)的白像素)。在接下來(lái)的操作1206中,抑制諸如票據(jù)上的行、文本以及筆跡的“較小”對(duì)象的高局部對(duì)比,而保留“圖標(biāo)”中的其他對(duì)象邊緣。通常,這些其他對(duì)象邊緣是粗的。在抑制“較小”對(duì)象的高局部對(duì)比中利用多個(gè)擴(kuò)大和侵蝕操作(也稱為形態(tài)圖像變換)。本領(lǐng)域技術(shù)人員熟知并且使用這種形態(tài)圖像變化。以實(shí)驗(yàn)方式來(lái)確定擴(kuò)大和侵蝕操作的次序和量。在該抑制操作1206之后,在操作1208處輸出彩色“圖標(biāo)”圖像。圖12b描述了圖Ilb的移動(dòng)圖像在轉(zhuǎn)換為彩色“圖標(biāo)”圖像后的示例?,F(xiàn)在參考圖13a,提供了以下流程圖,其示出了提供了有關(guān)圖Ila中示出的顏色深度降低操作1106的進(jìn)一步細(xì)節(jié)的示例性方法1300。在操作1301處,方法1300接收彩色 “圖標(biāo)”圖像以用于褪色。該方法在操作1302處將彩色“圖標(biāo)”圖像分成具有相等尺寸柵格元素的固定長(zhǎng)度和寬度的柵格(或矩陣)。在一些實(shí)施方式中,優(yōu)選的柵格尺寸是存在中心柵格元素。例如,可以采用3X3的柵格尺寸。圖13b描繪了圖12b的彩色“圖標(biāo)”圖像在被分成3X3柵格的操作1302之后的示例。接下來(lái),在操作1304處,將通常是最中心柵格元素的、圖標(biāo)的“中心部分”的顏色平均。然后,方法1300在操作1306處計(jì)算圖標(biāo)的剩余部分的平均顏色。更具體地,將“圖標(biāo)”的“中心部分”的“外部”柵格元素的顏色平均。通常,在存在中心柵格元素(例如,3X3 柵格)的情況下,“中心部分”的“外部”包括除中心柵格元素外的所有柵格元素。接下來(lái),方法1300在操作1308處確定用于RGB空間的線性變換。線性變換被定義為其將操作1304期間算得的“中心部分”的平均顏色映射成白色(即,255),而將操作1306 期間算得的“外部”的平均顏色映射為黑色(即,O)。所有的其余顏色被線性地映射為灰色陰影。一旦確定,在操作1310處使用該線性變換將來(lái)自彩色“圖標(biāo)”的所有RGB值變換為灰階“圖標(biāo)”圖像,然后在操作1312處輸出該圖像。在特定實(shí)施方式中,產(chǎn)生的灰“圖標(biāo)”圖像(也稱作灰階“圖標(biāo)”圖像)是票據(jù)背景(假設(shè)票據(jù)定位于靠近圖像的中心)與背景之間的對(duì)比。圖13c描繪了圖12b的彩色“圖標(biāo)”圖像一旦被轉(zhuǎn)換至灰“圖標(biāo)”圖像的示例?,F(xiàn)參照?qǐng)D14,提供流程圖以示出用于從包含票據(jù)的灰色“圖標(biāo)”圖像得到票據(jù)邊角的示例性方法1400。一旦在操作1401處接收到灰色“圖標(biāo)”圖像,通過關(guān)于圖像中描繪的票據(jù)的各邊得到灰色“圖標(biāo)”圖像上的“投票”點(diǎn),方法前進(jìn)至操作1402。從而,操作1402 得到灰色“圖標(biāo)”圖像上的能夠利用直線段來(lái)近似代表該票據(jù)的左邊、頂邊、右邊和底邊的所有位置。根據(jù)一實(shí)施方式,操作1402通過首先在“圖標(biāo)”的一半中尋找與當(dāng)前所關(guān)注的邊相對(duì)應(yīng)的“投票”點(diǎn)來(lái)完成其目標(biāo)。例如,如果當(dāng)前所關(guān)注的邊是票據(jù)的頂邊,則檢驗(yàn)“圖標(biāo)”的上部(Y < H/2)并且忽略“圖標(biāo)”的底部(Y. gtoreq. H/2)。在所選擇的“圖標(biāo)”的一半內(nèi),操作1402之后將計(jì)算各像素的正確方向上的強(qiáng)度梯度(對(duì)比)。在一些實(shí)施方式中,通過考慮位于像素中心的小窗口并且之后將該窗口分為所期望的“背景”一半(灰度較低,即,假定其更暗)以及所期望的“票據(jù)”一半(灰度較高,即,假定其更白)。在這兩半之間存在斷線,基于票據(jù)的要被得到的邊而呈水平或垂直。 接著,計(jì)算每個(gè)一半窗口中的平均灰度,從而獲得“背景”的平均圖像亮度和“票據(jù)”的平均圖像亮度。通過從“票據(jù)”的平均圖像亮度減去“背景”的平均圖像亮度來(lái)計(jì)算該像素的亮度梯度。最終,正確方向上的具有充分的灰度梯度的這些像素被標(biāo)記為所選擇的邊的“投票”點(diǎn)。以試驗(yàn)方式來(lái)制定用于進(jìn)行確定的實(shí)際灰度梯度閾值的充分性。繼續(xù)方法1400,操作1404得到潛在表示票據(jù)的邊(即,左邊、頂邊、右邊和底邊) 的候選邊(即,線段)。為了進(jìn)行此,在一些實(shí)施方式中,得到操作1402中所確定的“投票” 點(diǎn)內(nèi)的能夠由直線段來(lái)近似(線性近似)的子組。在許多實(shí)施方式中,以試驗(yàn)方式來(lái)制定用于線性近似的閾值。線的此子組被定義為“候選”邊。作為對(duì)候選邊的組從不為空的確保,灰色“圖標(biāo)”圖像的相應(yīng)的左邊、頂邊、右邊和底邊也被加入該組。接著,操作1406從操作1404所選擇的候選組中選擇票據(jù)的各邊的最佳候選,從而在灰色“圖標(biāo)”圖像內(nèi)定義票據(jù)的位置。在一些實(shí)施方式中,使用如下處理來(lái)選擇票據(jù)各邊的最佳候選。通過選擇線段{L,T,R,B}的四元組來(lái)開始該處理,其中,L是票據(jù)的左邊的最佳候選之一,T是是票據(jù)的頂邊的最佳候選之一,R是票據(jù)的右邊的最佳候選之一,B是票據(jù)的底邊的最佳候選之一。然后,該處理測(cè)量當(dāng)前所選擇的四元組的以下特征。對(duì)于所有四個(gè)邊的所有線段,近似和測(cè)量“投票”點(diǎn)的數(shù)量。此數(shù)量值基于以下假設(shè)票據(jù)的邊是線性的并且沿著這些邊存在顯著的色彩對(duì)比。此特征的更大的值提高了總的四元組等級(jí)。所有線段的所有投票點(diǎn)上的所有亮度梯度的和被測(cè)量。此和值也基于以下假設(shè) 票據(jù)的邊是線性的并且沿著這些邊存在顯著的色彩對(duì)比。再次,此特征的更大的值增加了總的四元組等級(jí)。段的總長(zhǎng)度被測(cè)量。此長(zhǎng)度值基于以下假設(shè)票據(jù)占據(jù)圖像的大部分。再次,此特征的更大的值增加了總的四元組等級(jí)。各邊角中的間隙的最大值被測(cè)量。例如,通過L段中的最上側(cè)的點(diǎn)和T段中的最左側(cè)的點(diǎn)之間的距離來(lái)定義左/頂邊角中的間隙。此最大值基于候選邊適合于“票據(jù)的形狀是四邊形的”這一假設(shè)的程度。此特征的更小的值增加了總的四元組等級(jí)。相對(duì)的段之間(即,L段和R段之間,T段和B段之間)的兩個(gè)角中的最大值被測(cè)量。此最大值基于候選邊適合于“票據(jù)的形狀接近于平行四邊形”這一假設(shè)的程度。此特征的更小的值增加了總的四元組等級(jí)。四元組的縱橫比與“理想的”票據(jù)的縱橫比的偏差被測(cè)量。此特性可用于具有已知縱橫比的票據(jù),例如支票。如果縱橫比是已知的,則此特性應(yīng)被排除用于計(jì)算四元組等級(jí)。以下述方式計(jì)算四元組等級(jí)a)通過交叉四元組的元素來(lái)得到四邊形;b)得到四元組的四個(gè)邊中的每一個(gè)的中點(diǎn);c)計(jì)算相對(duì)邊的中點(diǎn)之間的距離,稱為Dl和D2 ;d)得到兩個(gè)比率中的較大的一個(gè)R = max(Dl/D2,D2/Dl) ;e)假設(shè)“理想的”票據(jù)的縱橫比是已知的并且MinAspectRatio和MaxAspectRatio分別代表最小縱橫比和最大縱橫比,則將所討論的偏差定義為0 (如果 MinAspectRatio ^ R ^ MaxAspectRatio),MinAspectRatio-R (如果 R < MinAspectRatio), R-MaxAspectRatio (如果 R > MaxAspectRatio)。對(duì)于支票,MinAspectRatio可被設(shè)定為2. O,并且MaxAspectRatio可被設(shè)定為 3. O。此縱橫比的值基于以下假設(shè)在透視變換期間,票據(jù)的形狀在一定程度上被保持。 此特征的更小的值增加了總的四元組等級(jí)。在上述四元組的特征的測(cè)量之后,使用加權(quán)線性組合方式,四元組特征被組合為單個(gè)值(被稱為四元組等級(jí))。正權(quán)重被分配給“投票”點(diǎn)的數(shù)量、所有亮度梯度的和以及段的總長(zhǎng)度。負(fù)權(quán)重被分配給各邊角中的最大間隙、相對(duì)的段之間的兩個(gè)邊角中的最大值以及四元組的縱橫比的偏差。以試驗(yàn)方式來(lái)制定各權(quán)重的準(zhǔn)確的值。對(duì)候選邊的所有可能的組合重復(fù)上述操作,最終獲得“最佳”四元組,其為具有最高等級(jí)的四元組。票據(jù)的邊角被定義為“最佳”四元組的邊(即,最佳候選邊)的交點(diǎn)。隨后,操作1408使用最佳候選邊的交點(diǎn)來(lái)定義票據(jù)的邊角。本領(lǐng)域普通技術(shù)人員可意識(shí)到,通過使用前述相似度變換來(lái)轉(zhuǎn)換在“圖標(biāo)”上得到的邊角位置,這些邊角可位于原始移動(dòng)圖像上。通過輸出操作1408中定義的邊角的位置,方法1400在操作1410處結(jié)束。對(duì)于圖10的操作1004中所描述的幾何校正操作,圖15提供了示出用于幾何校正的方法示例1500的流程圖。如前所述,需要幾何校正,以校正存在于原始移動(dòng)圖像中的任何可能的透視畸變。另外,幾何校正可校正原始移動(dòng)圖像內(nèi)的票據(jù)的方向(例如,票據(jù)被定向?yàn)?0度、180度或270度,其中,右-邊-上方向?yàn)镺度)。應(yīng)注意,在一些實(shí)施方式中, 票據(jù)的方向基于移動(dòng)圖像中所描繪的票據(jù)的類型,以及與票據(jù)相關(guān)的區(qū)域。在票據(jù)處于以橫向定向的方向(90度或270度)的示例中,如圖15b中的支票所示,幾何校正適用于校正票據(jù)的方向。當(dāng)票據(jù)處于180度方向時(shí),當(dāng)試圖定位與票據(jù)(已知該票據(jù)位于特定位置)相關(guān)的對(duì)象時(shí),對(duì)180度方向的檢測(cè)及隨后的校正是適用的。例如, 金融票據(jù)上的MICR行可為一個(gè)相關(guān)對(duì)象,因?yàn)镸ICR行通常位于這樣的票據(jù)上的特定位置。 因此,當(dāng)該金融票據(jù)為支票時(shí),MICR行可用作相關(guān)對(duì)象(因?yàn)槠湟幌蛭挥谥钡牡撞?以確定移動(dòng)圖像內(nèi)的支票的當(dāng)前方向。在一些實(shí)施方式中,與票據(jù)相關(guān)的對(duì)象基于票據(jù)的類型。例如,當(dāng)票據(jù)為合同時(shí),相關(guān)對(duì)象可為位于合同上已知位置處的公證人印章、簽名或水印。關(guān)于具有上下方向(180度方向)的票據(jù)(具體地,支票)校正的更多細(xì)節(jié)在圖17a和圖17c中提供。投影變換的數(shù)學(xué)模型被制定,該模型將畸變的圖像轉(zhuǎn)變?yōu)轭A(yù)定尺寸的矩形圖像。 例如,當(dāng)移動(dòng)圖像中描繪的票據(jù)是支票時(shí),預(yù)定尺寸被制定為1200X560像素,這大致等同于以200DPI掃描的個(gè)人支票的尺寸。繼續(xù)參照方法1500,存在兩個(gè)獨(dú)立的操作路徑,它們可順次執(zhí)行或者并行,它們的輸出最終用于方法1500的最終輸出。一個(gè)操作路徑在操作1504處開始,在此處,方法1500 接收彩色原始移動(dòng)圖像。隨后操作1508降低原始移動(dòng)圖像的色彩強(qiáng)度,從具有每像素24 位(24位/像素)的彩色圖像變?yōu)榫哂忻肯袼?位(8位/像素)的灰階圖像。通過操作 1512,此圖像隨后被輸出至操作1516。如果使用圖IIc所示的自動(dòng)化票據(jù)檢測(cè)方法1101,則可不需要步驟1504和1508, 因?yàn)榉?wù)器已經(jīng)接收原始尺寸的褪色圖像。另一操作路徑在操作1502處開始,在此處,方法1500接收由方法1300產(chǎn)生的灰色“圖標(biāo)”圖像內(nèi)的票據(jù)的邊角的位置。基于邊角的位置,操作1506之后確定票據(jù)的方向并且校正該方向。在一些實(shí)施方式中,此操作使用邊角位置以測(cè)量原始圖像內(nèi)的票據(jù)的縱橫比。隨后,操作1506得到各組邊角之間的中點(diǎn)(其中,各組邊角對(duì)應(yīng)于所描繪的票據(jù)的四個(gè)邊之一),獲得左(L)、頂⑴、右(R)和底⑶中點(diǎn)。之后,對(duì)L中點(diǎn)和R中點(diǎn)之間的距離以及T中點(diǎn)和B中點(diǎn)之間的距離進(jìn)行比較,以確定兩對(duì)中的哪個(gè)具有更大的距離。這為操作1506提供了票據(jù)的方向。在一些實(shí)施方式中,票據(jù)的正確方向基于所檢測(cè)到的票據(jù)的類型。例如,如圖15b 所示,其中所關(guān)注的票據(jù)為支票,當(dāng)頂中點(diǎn)和底中點(diǎn)之間的距離大于左中點(diǎn)和右中點(diǎn)之間的距離時(shí),該票據(jù)被確定為橫向的方向。對(duì)于其他類型的票據(jù),相反的情況可能是正確的。如果操作1506確定了需要進(jìn)行方向校正,則以環(huán)狀運(yùn)動(dòng)的方式來(lái)移動(dòng)票據(jù)的邊角,在一些實(shí)施方式中以順時(shí)針方式,在另一些實(shí)施方式中為逆時(shí)針方式。在操作1510處,方法1500建立投影變換,以將票據(jù)的圖像映射至寬度為W像素并且高度為H像素的預(yù)定目標(biāo)圖像尺寸。在一些實(shí)施方式中,投影變換映射票據(jù)的邊角A、B、 C和D如下邊角A到(0,O),邊角B到(W,O),邊角C到(W,H),并且邊角D到(0,H)。對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)說(shuō),用于建立投影變換的算法是公知的并被普遍使用。在操作1516處,操作1514期間創(chuàng)建的投影變換用于從操作1512輸出的灰階移動(dòng)圖像。用于操作1512的灰階移動(dòng)圖像的投影變換導(dǎo)致灰階圖像中所描繪的四邊形ABCD內(nèi)的所有像素被映射至僅僅票據(jù)的經(jīng)幾何校正的灰階圖像。圖15c是圖Ilb中所描繪的票據(jù)在應(yīng)用幾何校正后的灰階圖像的示例。方法1500在操作1518處結(jié)束,在此處,票據(jù)的灰階圖像輸出至下一操作。
現(xiàn)在,對(duì)于圖10的操作1006中所描述的二值化操作,圖16a中提供了示出用于二值化的方法示例1600的流程圖。二值化操作產(chǎn)生色彩強(qiáng)度為每像素I位(I位/像素)的雙色調(diào)圖像。在諸如支票和存款息票的票據(jù)的情況下,需要雙色調(diào)圖像以用于通過自動(dòng)化系統(tǒng)(諸如遠(yuǎn)程存款系統(tǒng))來(lái)處理。另外,許多圖像處理設(shè)備需要這樣的圖像作為輸出。方法1600示出了如何實(shí)現(xiàn)通過幾何操作1004來(lái)產(chǎn)生票據(jù)的灰階圖像的二值化。此具體實(shí)施方式
使用已知的Niblack 二值化方法的變形。同樣地,假設(shè)所接收到的灰階圖像具有W像素XH像素的尺寸,并且強(qiáng)度函數(shù)I (x,y)給出了位置(x,y)處的強(qiáng)度,為256階可能的灰度值(8位/像素)之一。使用強(qiáng)度函數(shù)B (X,y),二值化操作將256階灰度值轉(zhuǎn)變?yōu)?階灰度值(I位/像素)。另外,應(yīng)用此方法,定義具有w像素Xh像素的尺寸的滑動(dòng)窗口,并且定義用于灰度圖像強(qiáng)度I (X,y)的本地(窗口內(nèi))標(biāo)準(zhǔn)偏差的閾值T。均以試驗(yàn)方式來(lái)確定W、h和T的值。一旦方法1600在操作1602處接收到票據(jù)的灰階圖像,方法1600在操作1604處在圖像內(nèi)選擇像素P (X,y)。方法1600在操作1606處計(jì)算像素P (X, y)的當(dāng)前wXh窗口位置(附近)內(nèi)的所選擇的像素強(qiáng)度I (x,y)的平均(均)值ave和標(biāo)準(zhǔn)偏差σ。如果在操作1608處標(biāo)準(zhǔn)偏差σ被確定為太小(即,σ < T),則像素p(x, y)被認(rèn)為是低對(duì)比的, 并且從而為背景的一部分。因此,在操作1610處,低對(duì)比像素被轉(zhuǎn)變?yōu)榘咨?即,將B(x, y)設(shè)定為1,其為白色)。然而,如果標(biāo)準(zhǔn)偏差σ被確定為大于等于閾值T(即,σ 3Τ), 則像素P(x,y)被認(rèn)為是前景的一部分。在操作1612中,如果I(P) < ave-k* σ,則像素ρ 被認(rèn)為是前景像素,并且因此B (x,y)被設(shè)定為O (黑色)。否則,該像素被作為背景(并且因此B(x,y)被設(shè)定為I)。在以上公式中,k是以試驗(yàn)方式制定的系數(shù)。在操作1610或操作1612處對(duì)像素進(jìn)行轉(zhuǎn)換后,在操作1614處選擇下一像素,并且重復(fù)操作1606,直到所有的灰階像素(8位/像素)轉(zhuǎn)換為雙色調(diào)像素(I位/像素)。然而,如果在操作1618處再?zèng)]有要被轉(zhuǎn)換的像素,則在操作1620處輸出票據(jù)的雙色調(diào)圖像。 圖16示出了圖15c所示的支票在二值化操作后的圖像的示例?,F(xiàn)在參照?qǐng)D16c,其示出了可結(jié)合方法1600來(lái)提供可用于進(jìn)一步處理的圖像的經(jīng)改進(jìn)的二值化的附加操作1601的流程圖。附加操作1601對(duì)上述二值化處理中所使用的滑動(dòng)窗口和閾值提供了精確定義,以改善所選擇的票據(jù)區(qū)域內(nèi)的雙色調(diào)圖像的質(zhì)量。附加操作1601可作為二值化操作1006的一部分或圖10的操作1012中的雙色調(diào)圖像的輸出的一部分來(lái)執(zhí)行。附加操作1601可更適用于操作1012,其中,票據(jù)區(qū)域可被更清晰地限定。附加操作1601提供了改進(jìn)的雙色調(diào)圖像,其中,票據(jù)的區(qū)域可稍后經(jīng)過計(jì)算機(jī)識(shí)別技術(shù),例如,諸如OCR或手寫體識(shí)別處理。在操作1604中在灰階圖像上選擇像素后執(zhí)行附加操作1601。之后確定該像素是否位于圖像中的票據(jù)區(qū)域內(nèi)。票據(jù)區(qū)域是票據(jù)中預(yù)計(jì)信息位于票據(jù)上的區(qū)域。例如在支票的情況下,MICR行預(yù)期所在的矩形區(qū)域可為票據(jù)區(qū)域。支票上的其他票據(jù)區(qū)域可包括但不限于小寫金額102、大寫金額104、日期110和收款人108。如果該像素不位于票據(jù)區(qū)域內(nèi), 則在操作1604處,選擇用于操作1606中的處理的上述票據(jù)所使用的窗口和閾值。在操作1626處,如果該像素被確定為位于票據(jù)區(qū)域內(nèi),則選擇窗口以位于該票據(jù)區(qū)域內(nèi)??梢栽囼?yàn)方式確定窗口的尺寸,但窗口的尺寸不應(yīng)延伸出票據(jù)區(qū)域的范圍,以避免捕獲窗口內(nèi)的票據(jù)背景的特征。各票據(jù)區(qū)域可具有其自己的相應(yīng)窗口尺寸。通過將窗口限制于票據(jù)區(qū)域,相關(guān)票據(jù)區(qū)域外的背景偽像不會(huì)對(duì)二值化處理增加噪聲。在選擇了窗口尺寸后,窗口可被定位,以使所選擇的像素置于窗口的中心附近。在一些實(shí)施方式中,可進(jìn)一步包括操作1628,以選擇用于所選擇的像素的票據(jù)區(qū)域的閾值。該閾值可以以試驗(yàn)方式來(lái)確定,并且各票據(jù)區(qū)域可具有其自己的相應(yīng)閾值。對(duì)用于票據(jù)區(qū)域的閾值的選擇可允許二值化處理將票據(jù)區(qū)域中的信息的機(jī)器處理優(yōu)化。關(guān)于在上文中介紹的圖10中的方向校正操作1008,圖17a是示出了用于校正圖像中的倒置方向的票據(jù)的已知方法的流程圖。具體地講,圖17a示出了用于校正雙色調(diào)圖像內(nèi)方向倒置的支票的方法1700。圖17b描繪了方向倒置的支票的示例性雙色調(diào)圖像。本領(lǐng)域技術(shù)人員能夠理解方法1700可以對(duì)其他類型的票據(jù)(例如存款息票)進(jìn)行不同的操作。如上文所述,圖15中的幾何校正操作是一種用于校正移動(dòng)圖像內(nèi)的橫向票據(jù)的方法。然而,即使在橫向校正后,票據(jù)可能仍然為倒置方向。為了校正某些票據(jù)的倒置方向,一些實(shí)施方式要求包含該票據(jù)的圖像被預(yù)先二值化。因此,圖10中示出的方向校正操作1008在二值化操作1006之后。一旦在操作1702中接收到支票的二色調(diào)圖像后,方法1700在操作1704讀取二色調(diào)圖像底部的MICR行,并且產(chǎn)生MICR置信值。在操作1706,將此MICR置信值(MCl)與閾值T比較以確定支票是否為正面朝上。如果在操作1708中MCl > T,則支票的二色調(diào)圖像是正面朝上,并且在操作1710中輸出。然而,如果在操作1708中MCI ( T,則在操作1712中將圖像旋轉(zhuǎn)180度,再次讀取底部的MICR行,產(chǎn)生新的MICR置信值(MC2)。通過本領(lǐng)域公知的方法將圖像旋轉(zhuǎn)180 度。在操作1714將旋轉(zhuǎn)后的MICR置信值(MC2)與前面的MICR置信值(MCl)加上Λ的值比較,以確定現(xiàn)在支票是否正面朝上。如果在操作1716中MC2 > MCl+Λ,則旋轉(zhuǎn)后的二色調(diào)圖像中支票正面朝上,由此,在操作1718輸出旋轉(zhuǎn)后的圖像。否則,如果在操作1716中 MC2 ( MCl+Λ,則支票的原始二色調(diào)圖像是正面朝上,在操作1710中將其輸出。Λ是實(shí)驗(yàn)選擇的正值,該值反映了票據(jù)最初正面朝上比倒置方向具有更高的先驗(yàn)概率?,F(xiàn)在參照?qǐng)D17c,圖17c是示出了用于校正圖像內(nèi)方向倒置的票據(jù)的改進(jìn)方法的流程圖。具體地講,圖17c示出了方法1701,該方法提供更快的速度并且如果票據(jù)的MICR 行不可讀時(shí)會(huì)給出指示。方法1701的部分步驟可以平行地進(jìn)行,從而更快地確定圖像是否能夠被正確地取向。方法1700的另一改進(jìn)是基于MICR行信息提供二色調(diào)圖像未正確地定向的指示。由于MICR行用于后續(xù)處理(例如尺寸校正的圖像處理以及讀取金融賬戶信息),所以MICR行不能被讀取的指示可以用于舍棄該圖像或者提醒移動(dòng)設(shè)備的用戶該圖像未被接受。方法1701在操作1722接收到支票的二色調(diào)圖像后開始。然后,在操作1724中在二色調(diào)圖像底部的MICR行的預(yù)計(jì)位置讀取MICR行,產(chǎn)生MICR置信值。在操作1726中將此置信值(MICR-Confl)與閾值T比較,以確定MICR置信值是否大于閾值。如果MICR置信值大于閾值,在操作1732確定支票的原始二色調(diào)圖像是正面朝上的,并輸出支票的原始二色調(diào)圖像?;蛘?,操作1732可以通過設(shè)置/清除與二色調(diào)圖像關(guān)聯(lián)的標(biāo)記(例如可以在操作1732中清除倒置的標(biāo)記以指示圖像被正確地取向)來(lái)簡(jiǎn)單地提供指示。在操作1728中,二色調(diào)圖像被旋轉(zhuǎn)180度,再次讀取支票底部的MICR行,并產(chǎn)生新的MICR置信值(MICR-Conf2)。在操作1730將旋轉(zhuǎn)后的MICR置信值(MICR_Conf2)與閾值T比較以確定MICR置信值是否大于閾值。如果MICR置信值大于閾值,則在操作1734確定支票的原始二色調(diào)圖像是倒置的,將支票的旋轉(zhuǎn)180度后的二色調(diào)圖像輸出?;蛘?,操作 1734可以通過設(shè)置/清除與二色調(diào)圖像關(guān)聯(lián)的標(biāo)記(例如可以在操作1734中設(shè)置倒置的標(biāo)記以指示二色調(diào)圖像是倒置的)來(lái)簡(jiǎn)單地提供指示。為了更快地確定兩個(gè)MICR置信讀數(shù)是否均低于閾值T,操作1724和1726可以與操作1728和1730平行地執(zhí)行。通過平行的執(zhí)行兩個(gè)操作,可以從服務(wù)器為移動(dòng)設(shè)備提供更快的反饋,以指示從移動(dòng)設(shè)備提供的圖像的適用性。另外,通過在兩個(gè)方向比較MICR置信值與閾值,在不清楚圖像是否正確地定向的情況下,能夠避免錯(cuò)誤肯定。如果原始圖像和旋轉(zhuǎn)后圖像的MICR置信值均不高于閾值,在操作1736中指示圖像的方向是未知的。可以與二色調(diào)圖像關(guān)聯(lián)地設(shè)置標(biāo)識(shí)以指示方向是未知的。在部分實(shí)施方式中,可以將該二色調(diào)圖像再提供給依賴于票據(jù)的另一特征來(lái)校正方向的可選方向校正模塊。如果期望或要求圖像具有清晰的MICR行,可以舍棄該圖像并且可以提醒移動(dòng)設(shè)備該圖像是不可接受的。圖17c還示出了途經(jīng)1740至操作1728的可選順序?qū)嵤┓绞?。在此?shí)施方式中, 僅在原始圖像的MICR置信值不高于閾值的情況下執(zhí)行針對(duì)旋轉(zhuǎn)圖像的操作1728。如果原始二色調(diào)圖像的MICR置信值不高于閾值,該順序?qū)嵤┓绞娇梢匝亓鞒虉D的“否”路徑1740 前進(jìn)至操作1728,其中將二色調(diào)圖像旋轉(zhuǎn)并產(chǎn)生第二 MICR置信值。其他實(shí)施方式可以依賴于可以讀取為MICR置信值形式的MICR字符的數(shù)量。例如, 在操作1724,可以確定有多少M(fèi)ICR字符被讀取,而在操作1726,閾值可以為預(yù)計(jì)的MICR字符的數(shù)量,然后將閾值與讀取的MICR字符的實(shí)際數(shù)量相比較。關(guān)于圖10中示出的大小校正操作1010,圖18a和圖18b為示出了用于圖像的大小校正的示例方法的流程圖。具體地講,圖18a和圖18b示出了用于校正二色調(diào)圖像內(nèi)支票的大小的示例方法1800、1801,其中該支票正面朝上。本領(lǐng)域技術(shù)人員能夠理解的是,方法 1800,1801能夠?qū)ζ渌愋偷钠睋?jù)(例如存款息票)進(jìn)行不同的操作。由于許多圖像處理引擎對(duì)于圖像大小很敏感,所以在其能夠被正確地處理之前, 校正票據(jù)圖像的大小是至關(guān)重要的。例如,表格識(shí)別引擎可能依賴于票據(jù)尺寸,票據(jù)尺寸是用于識(shí)別所要處理的票據(jù)的類型的重要特征。通常,對(duì)于諸如支票的金融票據(jù),圖像尺寸應(yīng)該等于通過以200 DPI運(yùn)行的標(biāo)準(zhǔn)掃描儀所獲得的圖像尺寸。此外,當(dāng)票據(jù)為支票時(shí),在幾何校正操作期間,幾何校正的預(yù)先確定的圖像尺寸為 1200 X 560像素(參見例如圖15所示),大致等于以200 DPI掃描的個(gè)人支票的尺寸。然而, 商業(yè)支票的尺寸往往有很大的不同,已知大多數(shù)的商業(yè)支票的寬度為8. 75",當(dāng)以200DPI 掃描時(shí)寬度被轉(zhuǎn)換為1750像素。因此,為了使已經(jīng)以1200X560像素的預(yù)定圖像尺寸進(jìn)行了幾何校正的商業(yè)支票以及其他支票類型恢復(fù)尺寸,進(jìn)行尺寸校正操作?,F(xiàn)在參照?qǐng)D18a,在操作1802中接收到包含正面朝上的支票的二色調(diào)圖像后,方法1800在操作1804中讀取支票底部的MICR行。這允許方法1800在操作1806中計(jì)算MICR 字符的平均高度。這樣做時(shí),在操作1808中將計(jì)算出的平均高度與200 DPI的MICR字符的高度進(jìn)行比較,相應(yīng)地計(jì)算出比例系數(shù)(scaling factor)。如下計(jì)算比例系數(shù)SF SF = H200/AH(eq. 7),其中AH為得到的MICR字符的平均高度;H200為在200DPI基于ANSI X 9. 37 標(biāo)準(zhǔn)(Specifications for Electronic Exchange of Check andlmage Data)的相應(yīng)“理論”高度值。方法1800在操作1810中使用比例系數(shù)以確定支票的二色調(diào)圖像是否需要尺寸校正。如果比例系數(shù)SF被確定為小于等于I. 0+Λ,則方法1800在操作1812中輸出支票的二色調(diào)圖像以及支票的灰度圖像的最新版本。Λ定義對(duì)錯(cuò)誤圖像尺寸的系統(tǒng)容限。然而,如果比例系數(shù)SF被確定為高于I. 0+Λ,則在操作1811中支票的初步尺度如下計(jì)算AR = HS/WS(eq. 8),H' = H*SF(eq. 9), ff; =H' /AR(eq. 10),其中 HS 和 WS 為在原始圖像獲得的支票頁(yè)(check snippet)的高度和寬度;AR為支票縱橫比(期望在改變尺寸的同時(shí)保持縱橫比);胃為幾何校正后的圖像在調(diào)整尺寸前的寬度;W'是初步調(diào)整后的支票的像素寬度;初步H'為調(diào)整后的支票的像素高度。然后將初步的高度和寬度(H'和W')與在200DPI已知支票尺度的最接近的支票比較,以調(diào)整比例系數(shù)。例如,如果IT和f被計(jì)算為對(duì)應(yīng)于2. 48" *4.82",這些尺度最接近于2.5" *5"的已知支票量度。由于許多支票尺度為1/8英寸的倍數(shù),所以替代實(shí)施方式可以簡(jiǎn)單地四舍五入支票的預(yù)計(jì)尺度至最接近的1/8英寸,以確定最接近的已知支票尺度。然后可以如下調(diào)整比例系數(shù)AFH = HNK/H/ (eq. 11) ,AFff = WNK/ff/ (eq. 12)Η" =AFH*H/ (eq. 13),W" = AFff(eq. 14),其中AFH和AFW是分別應(yīng)用于高度和寬度的調(diào)整因子;HNK和WNK分別是最接近的已知高度和寬度;H"是最終的調(diào)整后的支票像素高度;W"是最終的調(diào)整后的支票像素寬度。由于單獨(dú)的調(diào)整因子被應(yīng)用到高度和寬度,所以圖像的縱橫比的小誤差也被校正。在重新計(jì)算最終尺度之后,操作1814使用新尺度化的支票圖像重復(fù)幾何校正和二值化。在該重復(fù)操作之后,操作1812輸出所得的支票的二色調(diào)圖像以及支票的灰階圖像?,F(xiàn)在參照?qǐng)D18b,示出了用于圖像的尺寸校正的示例方法1801,該方法通過使用高度和寬度測(cè)量來(lái)縮放圖像。與圖18a所示操作對(duì)應(yīng)的操作類似地編號(hào)。方法1801用于在幾何校正的圖像與原始票據(jù)不對(duì)應(yīng)時(shí),改進(jìn)縮放。不是依賴于圖像的縱橫比來(lái)執(zhí)行尺寸校正,而是計(jì)算高度以及寬度的比例系數(shù)。在操作1807中,計(jì)算MICR字符的平均高度和寬度。在操作1809中將計(jì)算出的平均高度和寬度與200DPI的MICR字符比較,并且相應(yīng)地計(jì)算比例系數(shù)。如下計(jì)算比例系數(shù) SFH = H200/AH(eq. 7),SFff = W200/Aff(eq. 15),其中 SFH 和 SFW 是分別應(yīng)用到高度和寬度的比例系數(shù);AW是獲得的MICR字符的平均寬度;胃200為在2000 1基于4吧1\9. 37標(biāo)準(zhǔn)的相應(yīng)“理論”寬度值。然后,可以如下彼此獨(dú)立地(即與縱橫比無(wú)關(guān))計(jì)算最終的高度和寬度H" = SFH*H(eq. 16),W" = SFff*ff(eq. 17)。作為在操作1806和1807中計(jì)算平均寬度的替代方式,通過使用相對(duì)于MICR符號(hào) (例如圖I中所示的過渡符號(hào)113或on-us符號(hào)115)的距離獲得更高的精度。支票使用特定MICR符號(hào)之間的標(biāo)準(zhǔn)距離或MICR符號(hào)與票據(jù)的前緣(正對(duì)支票的右緣)或底部邊緣之間的標(biāo)準(zhǔn)距離。比例系數(shù)可以利用基于標(biāo)準(zhǔn)的理論距離和圖像中測(cè)量出的距離來(lái)計(jì)算。由于這些距離大于MICR字符的寬度,使用相對(duì)于MICR符號(hào)的距離的縮放更不易出現(xiàn)誤差,由此更精確。作為一個(gè)示例,在操作1804中,讀取MICR行以確定兩個(gè)過渡符號(hào)之間的距離。然后在操作1808或1809中如下計(jì)算比例系數(shù)SF
SF = TDist200/MD, (eq. 18),其中,MD是測(cè)量出的過渡符號(hào)之間的距離;TDist200是在200DPI根據(jù)支票MICR標(biāo)準(zhǔn)的相應(yīng)距離??梢允褂脧闹钡那熬壷恋谝贿^渡符號(hào)的測(cè)量距離以及根據(jù)標(biāo)準(zhǔn)在200DPI的距離類似地計(jì)算比例系數(shù)。部分實(shí)施方式可以使用關(guān)于支票圖像的多個(gè)量度來(lái)計(jì)算多個(gè)比例系數(shù),然后可以將這些比例系數(shù)平均以計(jì)算上述比例系數(shù)以應(yīng)用至圖像。部分實(shí)施方式僅可以選擇窗口(window)或閾值之一,而其他實(shí)施方式可以選擇窗口和閾值。本文中使用的術(shù)語(yǔ)模塊可以描述為可以被執(zhí)行的功能的指定單元。本文使用的模塊可以利用任何形式的硬件、軟件或他們的組合來(lái)實(shí)現(xiàn)。例如,一個(gè)或多個(gè)處理器、控制器、 ASIC、PLA、邏輯元件、軟件途徑或其他機(jī)構(gòu)可以用來(lái)構(gòu)成模塊。在實(shí)現(xiàn)過程中,本文中描述的不同模塊可以實(shí)現(xiàn)為分散的模塊或者所描述的功能或特征可以在一個(gè)或多個(gè)模塊中部分或完全地共享。換言之,在閱讀了本說(shuō)明書之后,對(duì)于本領(lǐng)域技術(shù)人員顯而易見的是,本文描述的不同特征和功能可以在任何指定應(yīng)用中被實(shí)現(xiàn),并且可以以一個(gè)或多個(gè)單獨(dú)或共享的模塊以不同的組合以及變換而實(shí)現(xiàn)。即使不同的特征或功能要素可以被單獨(dú)地描述或主張為獨(dú)立模塊,本領(lǐng)域技術(shù)人員也能夠理解這些特征和功能可以在一個(gè)或多個(gè)共同的軟件或硬件要素中共享,而且這樣的描述并不要求或暗示獨(dú)立的硬件或軟件組件被用于實(shí)現(xiàn)這樣的特征或功能。當(dāng)結(jié)合本文描述的操作使用的處理的組件或模塊全部或部分使用軟件實(shí)現(xiàn)時(shí),在一個(gè)實(shí)施方式中,這些軟件要素可以被執(zhí)行以與能夠執(zhí)行相關(guān)部分描述的功能的計(jì)算或處理模塊一起操作。圖19示出了一個(gè)這樣的示例性計(jì)算模塊。就此示例性計(jì)算模塊1900描述了不同的實(shí)施方式。在閱讀了此說(shuō)明書后,如何使用其他計(jì)算模塊或結(jié)構(gòu)來(lái)實(shí)現(xiàn)本發(fā)明對(duì)于相關(guān)領(lǐng)域技術(shù)人員而言將是顯而易見的。參照?qǐng)D19,例如,計(jì)算模塊1900可以表示在臺(tái)式電腦、膝上型電腦和筆記本電腦、 大型機(jī)(mainframe,主機(jī))、超型計(jì)算機(jī)、工作站或服務(wù)器、或者可以適于給定程序或環(huán)境的任何其他類型的專用或通用計(jì)算設(shè)備中建立的計(jì)算或處理能力。計(jì)算模塊1900還可以表示嵌入在給定設(shè)備中或?qū)λ鼋o定設(shè)備可用的計(jì)算能力。例如,可以在其他電子設(shè)備中建立計(jì)算模塊。例如,計(jì)算模塊可以包括一個(gè)或多個(gè)處理器或處理設(shè)備,諸如處理器1904。 可以使用諸如微處理器、控制器或其他控制邏輯電路的通用或?qū)S锰幚硪?processing engine)來(lái)實(shí)現(xiàn)處理器1904。計(jì)算模塊1900還可以包括一個(gè)或多個(gè)存儲(chǔ)模塊(稱作主存儲(chǔ)器1908)。例如,隨機(jī)存取存儲(chǔ)器(RAM)或其他動(dòng)態(tài)存儲(chǔ)器可以用來(lái)存儲(chǔ)將由處理器1904執(zhí)行的信息和指令。 主存儲(chǔ)器1908還可以用來(lái)存儲(chǔ)處理器1904執(zhí)行指令期間的臨時(shí)變量或其他中間信息。計(jì)算模塊1900同樣可以包括連接至總線1903的只讀存儲(chǔ)器(“ROM”)或其他靜態(tài)存儲(chǔ)設(shè)備以用來(lái)存儲(chǔ)用于處理器1904的靜態(tài)信息和指令。計(jì)算模塊1900還可以包括一種或多種形式的信息存儲(chǔ)機(jī)構(gòu)1910,例如,該存儲(chǔ)機(jī)構(gòu)可以包括媒體驅(qū)動(dòng)器(media drive) 1912和存儲(chǔ)單元接口 1920。媒體驅(qū)動(dòng)器1912可以包括驅(qū)動(dòng)器或支持固定或可移動(dòng)存儲(chǔ)介質(zhì)1914的機(jī)構(gòu)。例如,硬盤驅(qū)動(dòng)器、軟盤驅(qū)動(dòng)器、磁帶驅(qū)動(dòng)器、光盤驅(qū)動(dòng)器、CD或DVD驅(qū)動(dòng)器或其他可移動(dòng)或固定媒體驅(qū)動(dòng)器。因此,存儲(chǔ)介質(zhì) 1914例如可以包括硬盤、軟盤、磁帶、卡帶、光盤、⑶或DVD或由媒體驅(qū)動(dòng)器1912讀取、寫入或訪問的其他固定或可移動(dòng)介質(zhì)。作為這些示出的示例,存儲(chǔ)介質(zhì)1914可以包括具有存儲(chǔ)在其中的特定計(jì)算機(jī)軟件或數(shù)據(jù)的計(jì)算機(jī)可用存儲(chǔ)介質(zhì)。在可選的實(shí)施方式中,信息存儲(chǔ)機(jī)構(gòu)1910可以包括其他類似的裝置以用來(lái)允許將計(jì)算機(jī)程序或其他指令或數(shù)據(jù)加載至計(jì)算模塊1900。例如,這樣的裝置可以包括固定或可移動(dòng)存儲(chǔ)單元1922和接口 1920。這樣的存儲(chǔ)單元1922和接口 1920的示例包括程序卡帶和卡帶接口,可移動(dòng)存儲(chǔ)器(例如,閃存或其他可移動(dòng)存儲(chǔ)模塊)和存儲(chǔ)器插槽、PCMCIA 插槽和卡,以及允許將軟件或數(shù)據(jù)從存儲(chǔ)單元1922傳輸至計(jì)算模塊1900的其他的固定或可移動(dòng)存儲(chǔ)單元1922和接口 1920。計(jì)算模塊1900還可以包括通信接口 1924。通信接口 1924可以用來(lái)允許將軟件和數(shù)據(jù)在計(jì)算模塊1900和外部設(shè)備之間傳輸。通信接口 1924的示例可以包括調(diào)制解調(diào)器或軟調(diào)制解調(diào)器(softmodem)、網(wǎng)絡(luò)接口(諸如以太網(wǎng)、網(wǎng)絡(luò)接口卡、Wimedia、IEEE 802. XX (或其他接口 ))、通信端口(諸如USB端口、IR端口、RS232端口、藍(lán)牙⑧接口或其他端口 )或其他通信接口。經(jīng)由通信接口 1924傳輸?shù)能浖蛿?shù)據(jù)通常可以攜帶在信號(hào)上,這些信號(hào)可以是電信號(hào)、電磁(包括光)信號(hào)或是能夠通過給定的通信接口 1924交換的其他信號(hào)??梢越?jīng)由信道1928將這些信號(hào)提供至通信接口 1924。這些信道可以攜帶信號(hào)并且可以利用有線或無(wú)線通信介質(zhì)來(lái)實(shí)現(xiàn)。這些信號(hào)可以將軟件和數(shù)據(jù)從一個(gè)計(jì)算系統(tǒng)中的存儲(chǔ)器或其他存儲(chǔ)介質(zhì)傳送至計(jì)算系統(tǒng)1900中的存儲(chǔ)器或其他存儲(chǔ)介質(zhì)。信道的一些示例可以包括電話線、手機(jī)鏈接、RF鏈接、光學(xué)鏈接、網(wǎng)絡(luò)接口、局域或廣域網(wǎng)絡(luò)以及其他有線或無(wú)線通信信道。計(jì)算模塊1900還可以包括通信接口 1924。通信接口 1924可以用來(lái)允許將軟件和數(shù)據(jù)在計(jì)算模塊1900和外部設(shè)備之間傳輸。通信接口 1924的示例可以包括調(diào)制解調(diào)器或軟調(diào)制解調(diào)器、網(wǎng)絡(luò)接口(諸如以太網(wǎng)、網(wǎng)絡(luò)接口卡、WIMAX、802. XX或其他接口 )、通信端口(諸如USB端口、IR端口、RS232端口、藍(lán)牙 接口或其他端口)或其他通信端口。經(jīng)由通信接口 1924傳輸?shù)能浖蛿?shù)據(jù)通??梢詳y帶在信號(hào)上,這些信號(hào)可以是電信號(hào)、電磁信號(hào)、光信號(hào)或能夠通過給定通信接口 1924交換的其他信號(hào)??梢越?jīng)由信道1928將這些信號(hào)提供至通信接口 1924。該信道1928可以攜帶信號(hào)并可以利用有線或無(wú)線介質(zhì)來(lái)實(shí)現(xiàn)。 信道的一些示例可以包括電話線、手機(jī)鏈接、RF鏈接、光學(xué)鏈接、網(wǎng)絡(luò)接口、局域或廣域網(wǎng)絡(luò)以及其他的有線或無(wú)線通信信道。在本文中,術(shù)語(yǔ)“計(jì)算機(jī)程序介質(zhì)”和“計(jì)算機(jī)可用介質(zhì)”通常用來(lái)指物理存儲(chǔ)介質(zhì),諸如存儲(chǔ)器1908、存儲(chǔ)單元1920和介質(zhì)1914。這些或其他各種形式的計(jì)算機(jī)程序介質(zhì)或計(jì)算機(jī)可用介質(zhì)可以包括在將一個(gè)或多個(gè)序列的一個(gè)或多個(gè)指令存儲(chǔ)至處理設(shè)備以用于執(zhí)行。包含在介質(zhì)上的這樣的指令通常被稱為“計(jì)算機(jī)程序代碼”或“計(jì)算機(jī)程序產(chǎn)品”(其可以以計(jì)算機(jī)程序的形式或其他編組形成被分組)。當(dāng)被執(zhí)行時(shí),這樣的指令可以使得計(jì)算模塊1900執(zhí)行這里所討論的特征(feature)或功能。盡管以上已經(jīng)描述了各種實(shí)施方式,應(yīng)該理解的是,它們僅以示例的方式示出,并不限于此。本發(fā)明的寬度和范圍不應(yīng)該受到任何上述示例性實(shí)施方式的限制。該票據(jù)參考的技術(shù)對(duì)本領(lǐng)域技術(shù)人員來(lái)說(shuō)是顯而易見和已知的,這樣的技術(shù)包含那些對(duì)現(xiàn)在或?qū)?lái)任何時(shí)候的技術(shù)技工來(lái)說(shuō)顯而易見或已知的技術(shù)。此外,本發(fā)明并不限于示出的示例性結(jié)構(gòu)或配置,而是可以利用各種可選的結(jié)構(gòu)和配置來(lái)實(shí)現(xiàn)期望的特征。由于在閱讀了本文后本發(fā)明對(duì)本領(lǐng)域技術(shù)人員來(lái)說(shuō)是顯而易見的,所以可以實(shí)施示出的實(shí)施方式和它們的各種變形而不限于示出的示例。本領(lǐng)域技術(shù)人員還應(yīng)該理解如何利用可選的功能、邏輯電路或物理分隔以及配置來(lái)實(shí)現(xiàn)期望的特征。此外,盡管可以以單數(shù)形式描述或要求保護(hù)項(xiàng)目、元件或部件,但期望復(fù)數(shù)也在其范圍內(nèi),除非明確指出限定為單數(shù)。一些示例中出現(xiàn)的諸如“一個(gè)或多個(gè)”、“至少”、“不限于”或其他短語(yǔ)的拓寬性的詞語(yǔ)和短語(yǔ)不應(yīng)該在出現(xiàn)這些拓寬性短語(yǔ)的情況下認(rèn)為期望或要求較窄的范圍。盡管這里已經(jīng)描述了示例性實(shí)施方式,應(yīng)該理解的是,本發(fā)明并不限于所披露的實(shí)施方式。本發(fā)明意在覆蓋包含在所附權(quán)利要求的精神和范圍內(nèi)的各種變形和等同設(shè)置,權(quán)利要求的范圍與包含所有這樣的變形和等同結(jié)構(gòu)和功能的解釋一致。
權(quán)利要求
1.一種用于金融票據(jù)的圖像捕獲和處理的系統(tǒng),包括移動(dòng)設(shè)備,所述移動(dòng)設(shè)備包括圖像捕獲設(shè)備,被配置為捕獲金融票據(jù)的彩色圖像;處理器,被配置為生成彩色簡(jiǎn)化圖像;以及傳送器,被配置為將所述彩色簡(jiǎn)化圖像傳送至服務(wù)器,所述服務(wù)器被配置為接收來(lái)自所述移動(dòng)設(shè)備的所述彩色簡(jiǎn)化圖像,并且用于檢測(cè)所述彩色簡(jiǎn)化圖像中的所述金融票據(jù),對(duì)所述彩色簡(jiǎn)化圖像進(jìn)行幾何校正,對(duì)所述彩色簡(jiǎn)化圖像進(jìn)行二值化以產(chǎn)生雙色調(diào)圖像,校正所述雙色調(diào)圖像的定向,以及校正所述雙色調(diào)圖像的尺寸。
2.根據(jù)權(quán)利要求I所述的系統(tǒng),其中,所述服務(wù)器被進(jìn)一步配置為通過以下項(xiàng)來(lái)檢測(cè)所述彩色簡(jiǎn)化圖像中的所述金融票據(jù)將所述彩色簡(jiǎn)化圖像轉(zhuǎn)換成更小的彩色簡(jiǎn)化圖像; 以及檢測(cè)所述更小的彩色簡(jiǎn)化圖像中的所述金融票據(jù)的票據(jù)邊角位置。
3.根據(jù)權(quán)利要求2所述的系統(tǒng),其中,所述彩色簡(jiǎn)化圖像是灰階圖像。
4.根據(jù)權(quán)利要求I所述的系統(tǒng),其中,所述服務(wù)器被進(jìn)一步配置為校正所述彩色簡(jiǎn)化圖像的定向并且校正所述彩色簡(jiǎn)化圖像的大小。
5.根據(jù)權(quán)利要求I所述的系統(tǒng),其中,所述服務(wù)器被進(jìn)一步配置為通過以下項(xiàng)來(lái)將幾何校正的圖像二值化以產(chǎn)生雙色調(diào)圖像選擇所述灰階圖像上的像素;確定所選擇的像素是否在票據(jù)區(qū)域范圍內(nèi),并且如果所選擇的像素在票據(jù)區(qū)域范圍內(nèi),則選擇所述票據(jù)區(qū)域內(nèi)的窗口 ;以及遍及所述窗口計(jì)算所選擇像素的平均值和標(biāo)準(zhǔn)偏差;確定所述標(biāo)準(zhǔn)偏差是否太小,并且如果所述標(biāo)準(zhǔn)偏差太小,則將所選擇的圖像轉(zhuǎn)換成白色,如果所述標(biāo)準(zhǔn)偏差不是太小,則基于強(qiáng)度將所選擇的像素轉(zhuǎn)換成黑色或白色;以及選擇另一像素,并且重復(fù)所述計(jì)算步驟和確定步驟直至沒有可選擇的像素。
6.根據(jù)權(quán)利要求5所述的系統(tǒng),其中,以所述窗口不延伸出所述票據(jù)區(qū)域范圍的方式來(lái)選擇所述窗口,以避免捕獲到所述窗口范圍內(nèi)的所述票據(jù)的背景特征。
7.根據(jù)權(quán)利要求5所述的系統(tǒng),其中,如果所選擇的像素在所述票據(jù)區(qū)域范圍內(nèi),則選擇閾值,并且其中所述確定操作利用所述閾值來(lái)確定所述標(biāo)準(zhǔn)偏差是否太小。
8.根據(jù)權(quán)利要求5所述的系統(tǒng),所述票據(jù)是支票,并且所述票據(jù)區(qū)域可以選自于由 MICR行、小寫金額、法定金額、日期、簽名以及收款人組成的組中。
9.根據(jù)權(quán)利要求I所述的系統(tǒng),其中,所述金融票據(jù)是支票,并且其中所述服務(wù)器被進(jìn)一步配置為通過以下項(xiàng)來(lái)校正所述二色調(diào)圖像的定向讀取所述金融票據(jù)底部上的MICR行;為讀取的MICR行產(chǎn)生MICR置信值;將所述MICR置信值與閾值比較;當(dāng)所述MICR置信值超過閾值時(shí)確定所述二色調(diào)圖像是正向的;以及當(dāng)所述MICR置信值未超過所述閾值時(shí)確定所述二色調(diào)圖像是非正向的;將所述圖像旋轉(zhuǎn)180度,重新讀取所述MICR行,生成新的MICR置信值將所述新的MICR置信值與所述閾值進(jìn)行比較,當(dāng)所述新的MICR置信值超過所述閾值時(shí),確定旋轉(zhuǎn)后的雙色調(diào)圖像是正向的。
10.根據(jù)權(quán)利要求9的系統(tǒng),其中,當(dāng)所述新的MICR置信值未超過所述閾值時(shí),所述服務(wù)器被進(jìn)一步配置為指出所述圖像的定向是未知的。
11.根據(jù)權(quán)利要求I所述的系統(tǒng),其中,所述金融票據(jù)是支票,并且其中所述服務(wù)器被進(jìn)一步配置為通過以下項(xiàng)來(lái)校正所述雙色調(diào)圖像的大小讀取所述金融票據(jù)底部上的MICR行;計(jì)算所述MICR字符的平均高度;基于所述MICR字符的平均高度和以所選擇的DPI的期望高度計(jì)算比例系數(shù);當(dāng)所述比例系數(shù)不大于閾值時(shí),輸出所述雙色調(diào)圖像;以及當(dāng)所述比例系數(shù)大于閾值時(shí)基于所述比例系數(shù)計(jì)算所述支票的尺寸;以及重復(fù)幾何校正和二值化,并輸出所述雙色調(diào)圖像。
12.根據(jù)權(quán)利要求11所述的系統(tǒng),其中,計(jì)算所述支票的尺寸進(jìn)一步包括將算得的尺寸與期望的尺寸進(jìn)行比較;基于所述期望的尺寸調(diào)整比例系數(shù)以提供調(diào)整后的比例系數(shù); 以及基于所調(diào)整的比例系數(shù)重算所述支票的尺寸。
13.根據(jù)權(quán)利要求12所述的系統(tǒng),其中,所述期望的尺寸是已知支票尺寸或以1/8英寸的倍數(shù)為基礎(chǔ)的尺寸中的任一種。
14.根據(jù)權(quán)利要求I所述的系統(tǒng),其中,所述金融票據(jù)是支票,并且其中所述服務(wù)器被進(jìn)一步配置為通過以下項(xiàng)來(lái)校正所述雙色調(diào)圖像的大小讀取所述金融票據(jù)底部上的MICR行;計(jì)算所述MICR字符的平均高度和平均寬度;基于所述MICR字符的所述平均高度和以所選擇的DPI的期望高度計(jì)算高度比例系數(shù);基于所述MICR字符的所述平均寬度和以所選擇的DPI的期望寬度計(jì)算寬度比例系數(shù);當(dāng)所述高度比例系數(shù)和所述寬度比例系數(shù)都不大于閾值時(shí),輸出所述雙色調(diào)圖像;以及當(dāng)所述高度比例系數(shù)和所述寬度比例系數(shù)都大于閾值時(shí),基于所述高度比例系數(shù)和所述寬度比例系數(shù)計(jì)算所述支票的尺寸,將所述寬度縮放所述寬度比例系數(shù)以及將所述高度縮放所述高度比例系數(shù);以及重復(fù)幾何校正和二值化,并輸出所述雙色調(diào)圖像。
15.根據(jù)權(quán)利要求I所述的系統(tǒng),其中,所述金融票據(jù)是支票,并且其中所述服務(wù)器被進(jìn)一步配置為通過以下項(xiàng)校正所述雙色調(diào)圖像的大小讀取所述金融票據(jù)底部的MICR行;確定MICR符號(hào)的位置;基于相對(duì)于MICR符號(hào)的距離和以所選擇的DPI的期望距離計(jì)算比例系數(shù);當(dāng)所述比例系數(shù)不大于閾值時(shí),輸出所述雙色調(diào)圖像;以及當(dāng)所述比例系數(shù)大于閾值時(shí)基于所述比例系數(shù)計(jì)算所述支票的尺寸;以及重復(fù)幾何校正和二值化,并輸出所述二色調(diào)圖像。
16.根據(jù)權(quán)利要求15所述的系統(tǒng),其中,所述相對(duì)于MICR符號(hào)的距離是兩個(gè)過渡MICR 符號(hào)間的距離。
17.根據(jù)權(quán)利要求15所述的系統(tǒng),其中,所述相對(duì)于MICR符號(hào)的距離是所述票據(jù)的前邊緣與至少一個(gè)過渡MICR符號(hào)間的距離。
全文摘要
本發(fā)明總體上涉及自動(dòng)化票據(jù)處理,更具體地,涉及金融票據(jù)的移動(dòng)圖像拍攝和處理的系統(tǒng),以增強(qiáng)用于從利用照相能力在移動(dòng)設(shè)備上拍攝的圖像提取數(shù)據(jù)的圖像。該系統(tǒng)包括移動(dòng)設(shè)備,其包括被配置為拍攝票據(jù)的彩色圖像的拍攝裝置。移動(dòng)設(shè)備具有處理器,用于執(zhí)行諸如退色的特定操作;以及傳送器,用于將圖像從移動(dòng)設(shè)備傳送至服務(wù)器。服務(wù)器被配置為處理圖像,以優(yōu)化并增強(qiáng)用于數(shù)據(jù)提取的圖像。服務(wù)器被配置為利用相關(guān)票據(jù)區(qū)域內(nèi)的窗口和/或票據(jù)區(qū)域的閾值來(lái)應(yīng)用改進(jìn)的二值化算法。在服務(wù)器上,還可通過讀取支票上的MICR行并將MICR置信值與閾值進(jìn)行比較來(lái)執(zhí)行定向校正。還可利用MICR行的特征和期望的票據(jù)尺寸來(lái)對(duì)支票圖像進(jìn)行尺寸校正。
文檔編號(hào)G06Q40/00GK102609901SQ201110372469
公開日2012年7月25日 申請(qǐng)日期2011年11月7日 優(yōu)先權(quán)日2010年11月5日
發(fā)明者弗蘭克·麥戈韋恩, 格雷厄姆·海特, 達(dá)米卡·博特尤, 迪馬·薩姆羅尼 申請(qǐng)人:Rdm公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1