亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

收據圖像處理方法和設備的制作方法

文檔序號:6433073閱讀:396來源:國知局
專利名稱:收據圖像處理方法和設備的制作方法
技術領域
本申請總體上涉及圖像處理的領域,更具體而言,涉及ー種收據圖像處理方法和設備。
背景技術
收據是ー種常用的金融票據。在實際應用中,經常通過掃描儀等圖像捕獲設備來捕獲收據圖像,然后對捕獲的收據圖像進行內容分析以獲得相關信息。但是,對收據圖像進行內容分析常常存在很多困難,例如,在收據圖像中,收據的長度通常根據其中記錄項的多少而變化,即收據圖像中包含的文本行的行數根據其中記錄項的多少而變化,一般ー個記錄項對應ー類物品,并且ー個記錄項通常包含若干文本行,每個文本行分別描述該類物品的相關信息,例如金額、識別碼、折扣等;又例如,在收據圖像中,收據的抬頭通常是開具該收據的公司的標識,該標識一般難以準確切割并且難以通過OCR技術來準確識別。因此,現有技術中進行內容分析的可靠性和準確性較差。

發(fā)明內容
在下文中將給出關于本發(fā)明的簡要概述,以便提供關于本發(fā)明的某些方面的基本理解。應當理解,這個概述并不是關于本發(fā)明的窮舉性概述。它并不是意圖確定本發(fā)明的關鍵或重要部分,也不是意圖限定本發(fā)明的范圍。其目的僅僅是以簡化的形式給出某些概念,以此作為稍后論述的更詳細描述的前序。根據本申請的實施例,提供了ー種收據圖像處理方法,該方法可包括根據金額的特征信息檢測收據圖像中表示金額的金額數字;根據金額數字來識別收據圖像中包含金額數字的特征行;以及基于所述特征行的位置分布,分別將所述收據圖像中的各個文本行分組到彼此之間相似的若干重復塊中。這樣,通過將收據圖像中的文本行分組到彼此之間相似的重復塊中,可以以重復塊為單元對收據圖像進行內容分析,從而顯著提高收據圖像的內容分析的可靠性和準確性。根據本申請的實施例,檢測步驟可包括將收據圖像切分成行和詞;在各個文本行的右對齊位置捜索最后兩位或倒數第二、三位字符為兩個連續(xù)數字的十進制數字;以及根據十進制數字與之前字符或詞之間的距離,以及之前字符或詞本身的屬性,來確定金額數字。根據本發(fā)明的實施例,識別步驟包括以已經被識別出的特征行為參照,計算收據圖像中的各個文本行與已經被識別出的特征行之間的第一相似度;以及將第一相似度大于預定閾值的文本行也識別為特征行。根據本發(fā)明的實施例,分組步驟包括分別以特征行為邊界,將特征行以及位于特征行與其之后最鄰近的特征行之間的各個文本行,分組到同一重復塊中。根據本發(fā)明的實施例,分別計算重復塊中除特征行以外的各個文本行與其它重復塊中除特征行以外的各個文本行之間的第二相似度;將第二相似度大于預定閾值的文本行作為重復模式;以及將具有最多重復模式的重復塊作為代表重復塊。根據本申請的實施例,提供了一種收據圖像處理設備,該設備可包括檢測裝置,用于根據金額的特征信息檢測收據圖像中表示金額的金額數字;識別裝置,用于根據金額數字來識別收據圖像中包含金額數字的特征行;以及分組裝置,用于基于所述特征行的位置分布,分別將所述收據圖像中的各個文本行分組到彼此之間相似的若干重復塊中。這樣,通過分組裝置將收據圖像中的文本行分組到彼此之間相似的重復塊中,可以以重復塊為單元對收據圖像進行內容分析,從而顯著提高收據圖像的內容分析的可靠性和準確性。


本發(fā)明可以通過參考下文中結合附圖所給出的描述而得到更好的理解,其中在所有附圖中使用了相同或相似的附圖標記來表示相同或者相似的部件。所述附圖連同下面的詳細說明一起包含在本說明書中并且形成本說明書的一部分,而且用來進ー步舉例說明本發(fā)明的優(yōu)選實施例和解釋本發(fā)明的原理和優(yōu)點。在附圖中
圖I示出根據本發(fā)明的一個實施例的收據圖像處理方法的處理的流程圖;圖2示出根據本發(fā)明的一個實施例的檢測收據圖像中的金額數字的處理的流程圖;圖3是示出從收據圖像中檢測到的金額數字的示意圖;圖4是示出收據圖像中的文本行的詞屬性串的示意圖;圖5示出根據本發(fā)明的一個實施例的校正收據圖像中的特征行的處理的流程圖;圖6是示出特征行與文本行之間的第一相似度的示意圖;圖7是示出利用金額數字的位置信息驗證第一相似度的示意圖;圖8示出根據本發(fā)明的一個實施例的確定代表重復塊的處理的流程圖;圖9是示出從收據圖像中識別的特征行的示意圖;圖10是示出對收據圖像中的文本行進行分組而得到的重復塊的示意圖;圖IlA示出根據發(fā)明的一個實施例的對數據圖像進行劃分并利用重復塊對收據圖像進行聚類的處理的流程圖;圖IlB是示出對數據圖像進行劃分所得到的各部分的示意圖;圖12A示出根據本發(fā)明的一個實施例的收據圖像處理設備的框圖;圖12B示出根據本發(fā)明的另ー實施例的收據圖像處理設備的框圖;圖13示出根據本發(fā)明的一個實施例的檢測裝置的框圖;圖14示出根據本發(fā)明的一個實施例的識別裝置的框圖;圖15示出根據本發(fā)明的一個實施例的分組裝置的框圖;以及圖16示出了可用于作為實施根據本發(fā)明的實施例的信息處理設備的示意性框圖。
具體實施例方式在下文中將結合附圖對本發(fā)明的示范性實施例進行描述。為了清楚和簡明起見,在說明書中并未描述實際實施方式的所有特征。然而,應該了解,在開發(fā)任何這種實際實施方式的過程中可以做出很多特定于實施方式的決定,以便實現開發(fā)人員的具體目標,并且這些決定可能會隨著實施方式的不同而有所改變。在此,還需要說明的一點是,為了避免因不必要的細節(jié)而模糊了本發(fā)明,在附圖中僅僅示出了與根據本發(fā)明的方案密切相關的裝置結構,而省略了與本發(fā)明關系不大的其他細節(jié)。圖I示出根據本發(fā)明的一個實施例的收據圖像處理方法的處理的流程圖。申請人注意到,收據圖像中的文本行有的包含表示金額的金額數字,有的不包含表示金額的金額數字,而且包含表示金額的金額數字的文本行往往是收據中一個新的記錄項的開始。因此,如果能識別收據圖像中包含表示金額的金額數字的文本行,則能夠準確地識別收據中的記錄項,進而能提供收據圖像的內容分析的可靠性和準確性。另外還需說明的是,在此僅僅以英語文字為例來說明根據本發(fā)明的實施例的收據圖像處理方法的說明。本領域技術人員可以理解,根據本發(fā)明的實施例的收據圖像處理方法同樣也適用于其它語言文字的收據圖像。出于簡潔目的,在此以及在下文中并未針對其·它語言文字而逐一舉例說明。在借助根據本發(fā)明的實施例的收據圖像處理方法對收據圖像進行處理時,如圖I所示,該方法在步驟100開始。在步驟102,根據金額的特征信息檢測收據圖像中表示金額的金額數字。收據圖像可以是已經存在于電子收據中的收據圖像,也可以是根據應用需要通過圖像捕獲設備獲取的收據圖像。金額的特征信息指的是可以用來檢測表示金額的金額數字的金額在收據圖像中的位置信息和/或金額本身的符號特征信息。例如,金額在收據圖像中的位置信息可以是金額在收據圖像中的右對齊位置,而金額本身的符號特征信息可以是金額的數字格式為小數點后兩位十進制數字。本領域技術人員可以理解,還可以采用其它的用于表征金額的特征信息,只要可以根據其來檢測收據圖像中表示金額的金額數字即可。下面,根據圖2來詳細描述用于根據金額的特征信息檢測收據圖像中表示金額的金額數字的一個實施例。圖2示出根據本發(fā)明的一個實施例的檢測收據圖像中的金額數字的處理的流程圖。如圖2所示,該方法在步驟200開始。在步驟202,將收據圖像切分成文本行和詞??梢圆捎矛F有技術中已知的各種方法,例如投影方法將收據圖像等圖像數據切分成文本行和詞。由于本發(fā)明并不涉及對將圖像數據切分成文本行和詞的方法的改進,故在此不再贅述。關于利用投影方法切分文本行和詞的方法例如可以參考Mohamed Cheriet,Nawwaf Kharma,Cheng-Lin Liu,Ching Suen 的“Character Recognition Systems A Guidefor Students and Practitioners” (2007 年 10 月由 Wiley 出版),第 208 頁等。接著,在步驟204,在各個文本行的右對齊位置捜索最后兩位或倒數第二、三位字符為兩個連續(xù)數字的十進制數字。如上所述,金額一般位于收據圖像中的右對齊位置,而且金額的數字格式一般為小數點后兩位十進制數字。因此,可以根據諸如右對齊位置、最后兩位或倒數第二、三位字符為兩個連續(xù)數字的十進制數字等金額的特征信息,在收據圖像中捜索表示金額的金額數字。結合圖3來說明從收據圖像中檢測到的金額數字。圖3是示出從收據圖像中檢測到的金額數字的示意圖。如圖3所示,第一字符串301 “2. 99T”和第二字符串302 “14. 98”分別位于其所在文本行的右對齊位置處。另外,第一字符串301 “2. 99T”中的倒數第二、三位字符“99”為兩個連續(xù)數字的十進制數字,而第二字符串302 “14. 98”中的最后兩位字符“98”為兩個連續(xù)數字的十進制數字。因此,如圖3中的方框內的數字所示,在第一字符串301“2. 99T”所在文本行的右對齊位置搜索到第一字符串301 “2. 99T”中的倒數第二、三位字符“99”作為金額數字,在第二字符串302 “14. 98”所在文本行的右對齊位置搜索到第二字符串302 “14. 98”中的最后兩位字符“98”作為金額數字?;氐綀D2,在步驟206,根據由步驟204得到的十進制數字與之前字符或詞之間的距離,以及之前字符或詞本身的屬性,來確定金額數字。注意,本文中所述的字符或詞不包括諸如小數點、冒號等符號。例如,可以通過在確定金額數字之前的預處理將諸如小數點、冒號等符號去除,或者可以在進行金額數字的確定的處理時直接忽略諸如小數點、冒號等符號。 由步驟204得到的十進制數字之前的字符或詞本身的屬性指的是,例如由步驟204得到的十進制數字之前的字符或詞本身是否全部為十進制數字。如果之前的字符或詞本身包含了非十進制數字的其它字符,則可以確定其不是金額數字。如果之前的字符或詞本身全部為十進制數字,則其可能為金額數字,也可能為時間或編碼等其它數字格式,因此在這種情況下,還需要判斷由步驟204得到的十進制數字與之前字符或詞之間的距離是否滿足預定條件。假設由步驟204得到的十進制數字與之前字符或詞之間的距離為d,測量到的平均字符寬度為W,以及測量到的平均字符間距為g,則由步驟204得到的十進制數字與之前字符或詞之間的距離所要滿足的預定條件例如可為r:X (w+g) < d < r2 X (w+g) 公式(I)其中,參數T1和r2的值可以根據經驗確定,例如可根據文本的排版等信息來統計地確定。此外,參數巧和r2的值也可以由用戶預先給定,或者可以根據學習過程由用戶動態(tài)地調整,以達到較高的精度且計算開銷適當的良好折衷。還是以圖3為例,由步驟204得到的第一字符串301“2. 99T”中的十進制數字“99”之前的字符為“2”,該字符“2”全部為十進制數字,并且十進制數字“99”與其之前的字符“2”之間的距離Cl1滿足上述公式(I),因此將第一字符串301 “2. 99T”中的“2. 99”確定為金額數字。類似地,由步驟204得到的第二字符串302 “14. 98”中的十進制數字“98”之前的字符為“14”,該字符“14”全部為十進制數字,并且十進制數字“98”與其之前的字符“14”之間的距離d2也滿足上述公式(I),因此將第二字符串302 “14. 98”中的“14. 98”確定為金額數字。需要注意的是,經過步驟102檢測到的金額數字可能存在錯誤。例如,由于OCR的識別錯誤而導致的漏檢,例如原本應該是金額數字,但是由于OCR識別錯誤而沒有將其檢測出來。再例如,將其它數字格式誤檢為金額數字,例如將諸如時間、編碼等原本不是金額數字的其它數字格式誤檢為金額數字。稍后將詳細描述如何避免或改進這些錯誤?;氐綀D1,在步驟102檢測到收據圖像中表示金額的金額數字之后,接著在步驟104,根據所檢測到的金額數字來識別收據圖像中包含金額數字的特征行。
還是以上述圖3為例,由于在步驟102中將第一字符串301 “2. 99T”中的“2. 99”確定為金額數字,因此將包含該金額數字“2. 99”的文本行“83-SEAS0NAL DEC 019815211
2.99T”識別為特征行。類似地,由于在步驟102中將將第二字符串302“ 14. 98”中的“ 14. 98”確定為金額數字,因此將包含該金額數字“ 14. 98”的文本行“SUBTOTAL 14. 98”也確定為特征行。如上所述,經過步驟102檢測到的金額數字可能存在錯誤,因此在步驟104中根據檢測到的金額數字識別收據圖像中包含金額數字的特征行時也相應地可能存在錯誤。為了避免或改進由金額數字的錯誤所導致的特征行的錯誤,可以采用多種方式來校正特征行。下面,根據圖5來詳細說明對收據圖像中的特征行進行校正的一個實施例。圖5示出根據本發(fā)明的一個實施例的校正收據圖像中的特征行的處理的流程圖。如圖5所示,在步驟502,以已經被識別出的特征行為參照,計算收據圖像中的各 個文本行與已經被識別出的特征行之間的第一相似度。已經被識別出的特征行指的是根據金額數字從收據圖像中識別出的包含金額數字的特征行。如上所述,根據金額數字來識別特征行可能存在錯誤,因此可通過將收據圖像中的各個文本行與已經被識別出的特征行進行第一相似度比較,并且根據第一相似度的比較結果來判斷文本行中是否存在漏識別的特征行(即應該是特征行,但由于OCR識別錯誤未能檢測出金額數字,進而導致沒有被識別出的特征行),或者已經被識別出的特征行中是否存在誤識別的特征行(即原本不是特征行,但由于其中包含的其它數字格式被誤檢為金額數字,進而導致被誤識別出的特征行)??刹捎枚喾N方式來進行上述第一相似度的比較。下面舉出若干種比較第一相似度的方式的示例。但是,本領域技術人員應該理解,本發(fā)明中的第一相似度的比較方式不限于此,還可以采用本領域中其它合適的比較文本行之間相似度的各種方式來進行上述第一相似度的比較,只要其可以用來判斷文本行之間是否相似即可。根據本發(fā)明的ー個示例,上述第一相似度例如為各個文本行與特征行之間的左對齊相似度,其中,左相似度指示各個文本行與特征行左對齊的概率。即,可以根據文本行與特征行之間的左對齊相似度來判斷文本行與特征行是否相似。根據本發(fā)明的又一示例,上述第一相似度例如為各個文本行與所述特征行之間的右對齊相似度,其中,右相似度指示各個文本行與特征行右對齊的概率。即,可以根據文本行與特征行之間的右對齊相似度來判斷文本行與特征行是否相似。根據本發(fā)明的又一示例,上述第一相似度例如為各個文本行與所述特征行之間的尺寸相似度,其中,尺寸相似度指示各個文本行中的字符與特征行中的字符具有相同大小的概率。即,可以根據文本行與特征行之間的尺寸相似度來判斷文本行與特征行是否相似。根據本發(fā)明的又一示例,上述第一相似度例如為各個文本行與所述特征行之間的詞屬性串的編輯距離,其中,詞屬性串的編輯距離表示詞屬性傳之間的相似性,即從ー個詞屬性串變換到另ー詞屬性串所需的操作的多少。即,可以根據文本行與特征行之間的詞屬性串的編輯距離來判斷文本行與特征行是否相似。關于編輯距離例如可以參考Mohamed Cheriet,Nawwaf Kharma,Cheng-Lin Liu,Ching Suen 的“Character RecognitionSystems A Guide for Students and Practitioners”(2007 年 10 月由 Wiley 出版),第172頁等。
另外,文本行的詞屬性串指的是通過給文本行中的每個詞賦以表示其字符屬性的符號而得到的一串符號,其可以表示該文本行的字符屬性組成??山Y合圖4對文本行的詞屬性串進行詳細說明。圖4是示出收據圖像中的文本行的詞屬性串的示意圖。如圖4所示,例如為文本行中的詞“STUDDED”賦以符號“A”以表示該詞“STUDDED”的主要組成為英文字符。又例如,為文本行中的詞“19. 50”賦以符號“ N”以表示該詞“ 19. 50”的主要組成為數字。按照上述方式,可以得到文本行“STUDDED BOARDWALK T 19. 50N”的詞屬性串為“AAANA”。本領域技術人員應該理解,可以將上述符合“ A”和“N”互換,即用符號“ A”表示其主要組成為數字的詞,而用“N”表示其主要組成為英文字符的詞。另外,還可以用其它符號來表示詞屬性串,例如用符號“ I”表示其主要組成為英文字符的詞,用符號“ 0”表示其主要組成為數字的詞,反之亦然。下面,結合圖6來詳細說明如何計算文本行與特征行之間的第一相似度。圖6是示出文本行與特征行之間的第一相似度的示意圖。
如圖6所示,假設上部文本行為已經識別出的特征行(在下文中被稱為“上部特征行”),下部文本行為收據圖像中的任意一個文本行(在下文中被稱為“下部文本行”)。又假設,上部特征行的平均字符寬度為W1,下部文本行的平均字符寬度為W2,兩者之間的差為Sdw= IW1-W2 ;上部特征行的平均字符高度為hi,下部文本行的平均字符高度為1!2,兩者之間的差為Sdh= Ihfh2I ;上部特征行與下部文本行的左邊界之間的水平偏移量為Cl1,上述特征行與下部文本行的右邊界之間的水平偏移量為d2?;谏鲜黾僭O,例如可以分別根據下面的公式來計算上部特征行與下部文本行之間的左對齊相似度、右對齊相似度、尺寸相似度和詞屬性串的編輯距離
^l2左對齊相似度
512 .
d22右對齊相似度
52.
sdw2sdh尺寸相似度(2^)2 {h^2)2以及
S3=(e 2 +e 2 )/2.詞屬性串的編輯距離dp。接著,在步驟504,將第一相似度的值大于預定閾值的文本行也識別為特征行。根據步驟502計算出的第一相似度,將第一相似度的值與預定閾值進行比較,判斷第一相似度的值是否大于預定閾值,并將第一相似度的值大于預定閾值的文本行也識別為特征行,從而可以將漏識別的特征行增補回來,實現了對特征行的校正。另外,如果在步驟502中與已經識別出的特征行進行第一相似度比較的文本行本身也是特征行,即對兩個特征行進行第一相似度的比較,則可以利用所計算的第一相似度來判斷誤識別的特征行。例如,如果某特征行CL與其它特征行之間的第一相似度的值均小于預定閾值,則可將該特征行CL判斷為誤識別特征行,從而可以將誤識別特征行不再識別為特征行,也實現了對特征行的校正。本領域技術人員應當理解,上述預定閾值可以根據經驗確定,也可以由用戶預先給定,或者可以根據學習過程由用戶動態(tài)地調整,以達到較高的精度且計算開銷適當的良好折衷。還是以上述左對齊相似度、右對齊相似度、尺寸相似度和詞屬性串的編輯距離為例,例如可以將左偏移量S1與第一預定閾值T1進行比較,并判斷S1是否大于T1 ;另外,例如可以將右偏移量S2與第二預定閾值T2進行比較,并判斷S2是否大于T2 ;另外,例如可以將尺寸相似度S3與第三預定閾值T3進行比較,并判斷S3是否大于T3 ;以及,例如可以將詞屬性串的編輯距離dp與第四預定閾值T4進行比較,并判斷dp是否大于T4。例如,當同時滿足上述四個條件時,即滿足((S1 > T1) and(S2 > T2) and(S3 > T3) and(dp> T4))吋,確定所比較的文本行與特征行是相似的。本領域技術人員應該可以理解,可以不必同時滿足上述四個條件,而是只要滿足其中任意若干個條件,就可以確定所比較的文本行與特征行是相似的,只要其比較的準確度在可以接收的范圍內即可。另外,本領域技術人員應當理解,上述各個預定閾值T1. T2、T3、T4可以根據經驗確定,也可以由用戶預先給定,或者可以根據學習過程由用戶動態(tài)地調整,以達到較高的精度且計算開銷適當的良好折衷。
·
另外,根據本發(fā)明的又一優(yōu)選實施例,還可根據金額數字在特征行與文本行中的位置對應信息對第一相似度進行驗證。例如,可以根據特征行中的金額數字的位置信息,確定在待檢測文本行中的對應位置是否存在金額數字。如果在待檢測文本行的對應位置處存在金額數字,則判定待檢測文本行與特征行是相似的;反之,則判定待檢測文本行與特征行是不相似的,從而可以對第一相似度進行進一步驗證,以提高特征行識別的準確度和可靠性。下面,結合圖7來詳細說明利用金額數字的位置信息驗證第一相似度的處理。圖7是示出利用金額數字的位置信息驗證第一相似度的示意圖。如圖7所示,假設上部文本行為已經識別出的特征行(在下文中被稱為“上部特征行”),下部文本行為收據圖像中的任意一個文本行(在下文中被稱為“下部文本行”)。如圖7所示,從上部特征行“ SUBTOTAL
14.98”得到的詞屬性串為“100”,從下部文本行“Tl 2 25000 10.99 25”得到的詞屬性串為“10000”。利用上部特征行“SUBTOTAL 14. 98”中的金額數字“ 14. 98”的位置信息(即實方框701所示的位置),確定在下部文本行“ Tl 2 25000 10.99 . 25”的對應位置(即虛方框702所示的位置)是否存在金額數字。在圖7所示的示例中,在上述對應位置(即虛方框702所示的位置)處存在金額數字“25”,因此判定下部文本行“T122500010. 99. 25”與特征行“SUBTOTAL 14. 98”是相似的,從而將下部文本行Tl 2 25000 10.99 .25”也識別為特征行。再次回到圖1,在步驟104根據所檢測到的金額數字識別出收據圖像中包含金額數字的特征行之后,接著在步驟106,基于特征行的位置分布,分別將收據圖像中的各個文本行分組到彼此之間相似的若干重復塊中。如上文中所述,包含表示金額的金額數字的特征行往往是收據中一個新的記錄項的開始,因此在識別出收據圖像中包含金額數字的特征行之后,可以根據特征行在收據圖像中所處的位置,將收據圖像中所有的文本行分組到若干重復塊中,各個重復塊之間在結構上是彼此相似的,即ー個重復塊中所包含的各個文本行與另一重復塊中所包含的各個文本行之間彼此相似。根據本發(fā)明的ー個優(yōu)選實施例,例如可以分別以特征行為邊界,將特征行以及位于特征行與其之后最鄰近的特征行之間的各個文本行,分組到同一重復塊中。本領域技術人員應當理解,以特征行為邊界來分組文本行僅是本發(fā)明的ー個優(yōu)選實施例,但是本發(fā)明不限于此。下面結合圖9和圖10來詳細說明根據特征行的位置分布將文本行分組到重復塊中的處理的具體過程。圖9是示出從收據圖像中識別的特征行的示意圖,圖10是示出對收據圖像中的文本行進行分組而得到的重復塊的示意圖。 如圖9所示,根據步驟104的處理,分別將文本行901 “DRAPED VEST 24. 50N”、文本行 902 “STUDDED BOARDffLK T 19. 50N”、文本行 903 “JEWELED T 9.97N”、文本行904 “SUBTOTAL 53. 97”以及文本行905 “TOTAL 53. 97”識別為特征行(下文中,分別被稱為特征行901、特征行902、特征行903、特征行904和特征行905)。然后,以相鄰的特征行901和特征行902為邊界,將從特征行901到相鄰特征行902之間的兩個文本行“000016632788”、和“Return Price I i 19. 00” 以及特征行 901 本身,一起分組到同一重復塊1001中,因此如圖10所示,重復塊1001中包括特征行901以及兩個文本行“000016632788”、和“Return Price I @ 19.00”。類似地,以相鄰的特征行902和特征行903為邊界,將從特征行902到相鄰特征行903之間的ー個文本行“000016928160”以及特征行902本身,一起分組到同一重復塊1002中,因此如圖10所示,重復塊1002中包括特征行902以及ー個文本行“000016928160”。類似地,以相鄰的特征行903和特征行904為邊界,將從特征行903到相鄰特征行904之間的四個文本行“000016822108”、“19. 95-9. 98”、“B1G150%0FF T’ S,TANKS,POLOS”、和“Return Price I i 15. 47” 以及特征行 903 本身,一起分組到同一重復塊1003中,因此如圖10所示,重復塊1003中包括特征行903以及四個個文本行“000016822108”、“19. 95-9. 98”、“B1G1 50% OFF T’ S,TANKS,POLOS”、和“Return Price I @ 15.47”。另外,由于特征行904與特征行905之間沒有文本行,特征行905之后也沒有文本行,因此將特征行904單獨分組為重復塊1004,將特征行905單獨分組為重復塊1005,因此如圖10所示,重復塊1004僅包括特征行904,重復塊1005僅包括特征行 905。因此,如圖10所示,通過上述處理,將收據圖像中的所有文本行分組成為重復塊
1001、重復塊1002、重復塊1003、重復塊1004和重復塊1005。各個重復塊彼此之間在結構上是相似的,例如上述各個重復塊分別包括一個特征行。再例如,重復塊1001中的文本行“ 000016632788”、重復塊1002中的文本行“ 000016928160”和重復塊1003中的文本行“000016822108”彼此之間也是相似的。再例如,重復塊1001中的文本行“Return Price Ii 19. 00”和重復塊103中的文本行“Return Price I @ 15. 47”彼此之間也是相似的。下面結合圖8來詳細說明根據本發(fā)明的一個實施例的從若干個重復塊中確定代表重復塊的處理的具體過程。圖8示出根據本發(fā)明的一個實施例的確定代表重復塊的處理的流程圖。如圖8所示,在步驟802,分別計算重復塊中除特征行以外的各個文本行與其它重復塊中除特征行以外的各個文本行之間的第二相似度。還是以圖9和圖10為例,例如對于重復塊1001,除了特征行901之外,還包括兩個文本行“000016632788”、和“Return Price I @ 19. 00” ;對于重復塊1003,除了特征行903之外,還包括四個文本行“000016822108”、“ 19. 95-9. 98”、“B1G1 50% OFF T,S,TANKS,POLOS”、和“Return Price I i 15.47”。因此,將重復塊 1001 中的文本行“000016632788”與重復塊1003中的四個文本行中的每個分別進行第二相似度的比較;類似地,將重復塊1001中的文本行“Return Price I i 19. 00”與重復塊1003中的四個文本行中的姆個分別進行第二相似度的比較。重復塊1001中的各個文本行與重復塊1002中的各個文本行之間的第二相似度的比較,以及重復塊1002中的各個文本行與重復塊1003中的各個文本行之間的第二相似度的比較也是類似的,在此不再贅述。可采用多種方式來進行上述第二相似度的比較。下面舉出若干種比較第二相似度的方式的示例。但是,本領域技術人員應該理解,本發(fā)明中的第二相似度的比較方式不限于此,還可以采用本領域中其它合適的比較文本行之間相似度的各種方式來進行上述第二相似度的比較,只要其可以用來判斷文本行之間是否相似即可。
根據本發(fā)明的ー個示例,上述第二相似度例如為文本行之間的左對齊相似度,其中,左相似度指示文本行之間左對齊的概率。即,可以根據文本行之間的左對齊相似度來判斷文本行是否相似。根據本發(fā)明的又一示例,上述第二相似度例如為文本行之間的右對齊相似度,其中,右相似度指示文本行之間對齊的概率。即,可以根據文本行之間的右對齊相似度來判斷文本行是否相似。根據本發(fā)明的又一示例,上述第二相似度例如為文本行之間的詞屬性串的編輯距離,其中,詞屬性串的編輯距離表示詞屬性串之間的相似性,即從ー個詞屬性串變換到另ー詞屬性串所需的操作的多少。即,可以根據文本行之間的詞屬性串的編輯距離來判斷文本行是否相似。關于編輯距離例如可以參考Mohamed Cheriet, Nawwaf Kharma, Cheng-LinLiu, Ching Suen 的“Character Recognition Systems A Guide for Students andPractitioners” (2007 年 10 月由 Wiley 出版),第 172 頁等。上文中已經對左對齊相似度、右對齊相似度和文本行的詞屬性串的編輯距離進行了詳細說明,在此不再贅述。根據本發(fā)明的又一示例,上述第二相似度例如為文本行與該文本行所屬的重復塊中的相鄰特征行之間的相對位置。還是以圖9和圖10為例來說明,例如在重復塊1001中,文本行“000016632788”相對于特征行901的位置是特征行901之后的第一個文本行;類似地,在重復塊1002中,文本行“000016928160”相對于特征行902的位置是特征行901之后的第一個文本行;類似地,在重復塊1003中,文本行“000016822108”相對于特征行903的位置是特征行903之后的第一個文本行。因此,上述三個文本行與其相應的相鄰特征行之間的相對位置是相似的。接著,在步驟804,將第二相似度大于預定閾值的文本行作為重復模式。根據步驟802計算出的第二相似度,將第二相似度的值與預定閾值進行比較,判斷第二相似度的值是否大于預定閾值,并將第二相似度的值大于預定閾值的文本行作為重復模式。本領域技術人員應當理解,上述預定閾值可以根據經驗確定,也可以由用戶預先給定,或者可以根據學習過程由用戶動態(tài)地調整,以達到較高的精度且計算開銷適當的良好折衷。
還是以上述左對齊相似度、右對齊相似度、詞屬性串的編輯距離和文本行與同一重復塊中的相鄰特征行之間的相對距離為例,例如可以將左偏移量S1與第一預定閾值T/進行比較,并判斷S1是否大于T/ ;另外,例如可以將右偏移量S2與第二預定閾值T2’進行比較,并判斷S2是否大于T2’;另外,例如可以將詞屬性串的編輯距離dp與第四預定閾值T3’進行比較,并判斷も是否大于T/ ;以及,例如可以將文本行與同一重復塊中的相鄰特征行之間的相對距離dt。與第四閾值V進行比較,并判斷dt。是否大于T/。例如,當同時滿足上述四個條件吋,即滿足((S1 > T/ ) and(S2 > T2,)and(dp > T3,)and(dtc > T4,))吋,確定該文本行為重復模式。本領域技術人員應該可以理解,可以不必同時滿足上述四個條件,而是只要滿足其中任意若干個條件,就可以確定所比較的文本行與特征行是相似的,只要其比較的準確度在可以接收的范圍內即可。另外,本領域技術人員應當理解,上述各個預定閾值T/、T2’、T3’、T/可以根據經驗確定,也可以由用戶預先給定,或者可以根據學習過程由用戶動態(tài)地調整,以達到較高的精度且計算開銷適當的良好折衷。以圖9和圖10為例,根據上述判斷標準,例如各個重復塊中所包括的特征行為重復模式。再例如,重復塊1001中的文本行“000016632788”、重復塊1002中的文本行 “000016928160”和重復塊1003中的文本行“000016822108”彼此之間也是相似的,因此也為重復模式。再例如,重復塊1001中的文本行“Return Price I i 19. 00”和重復塊103中的文本行“Return Price I § 15. 47”彼此之間也是相似的,因此也為重復模式。接著,在步驟806,將具有最多重復模式的重復塊作為代表重復塊。以圖9和圖10為例,重復塊1001中具有3個重復模式,重復塊1002具有2個重復模式,重復塊1003具有3個重復模式,重復塊1004具有I個重復模式,重復塊1005具有I個重復模式??梢?重復塊1001和重復塊1003具有最多的重復模式,但是重復塊1003中除重復模式外還具有非重復模式的文本行,而重復塊1001中所包括的全部為重復模式。因此,將重復塊1001作為代表重復塊。下面,結合圖IlA和圖IlB來詳細說明根據本發(fā)明的一個實施例的對數據圖像進行劃分并利用重復塊對收據圖像進行聚類的處理的具體過程。圖IlA示出根據發(fā)明的ー個實施例的對數據圖像進行劃分并利用重復塊對收據圖像進行聚類的處理的流程圖;圖IlB是示出對數據圖像進行劃分所得到的各部分的示意圖。如圖IlA所示,在步驟1102,根據所得到的重復塊將收據圖像劃分成頭部、數據部和尾部,其中,數據部包括全部的重復塊,頭部為收據圖像中位于數據部之前的部分,而尾部為收據圖像中位于數據部之后的部分。如圖IlB所示,數據部1112包括全部的重復塊(對應于圖10中的由重復塊1001、
1002、1003、1004和1005所組成的部分),頭部1110位于數據部1112之前,其包括諸如公司標識、公司地址等公司相關信息。尾部1114位于數據部1112之后,其包括諸如公司電話、公司郵箱等公司相關信息。接著,在步驟1104,通過匹配頭部和/或數據部中的各重復塊,對收據圖像進行聚類。例如,可通過預先訓練的數據庫來對收據圖像的頭部進行匹配。由于收據圖像的頭部中的公司標識一般為藝術體格式,一般難以通過OCR技術來準確識別,因此在本發(fā)明中例如可使用標識圖像匹配技術來識別公司標識中的公司名稱。對于頭部中的諸如公司電話、公司地址、公司郵箱等公司相關信息可以使用OCR識別技術來提取和識別。根據本發(fā)明的ー個優(yōu)選實施例,例如可以用代表重復塊進行數據部之間的匹配。由于代表重復塊是包含重復模式最多的重復塊,因此利用代表重復塊進行數據部的匹配能夠提高匹配效率。本領域技術人員應當理解,用代表重復塊進行匹配僅是本發(fā)明的優(yōu)選實施例,但本發(fā)明不限于此。例如,直接用數據部中的各個重復塊進行匹配也能夠實現數據部的匹配。下面結合圖12A來詳細說明根據本發(fā)明的一個實施例的收據圖像處理設備的配置。圖12A示出根據本發(fā)明的一個實施例的收據圖像處理設備的框圖。收據圖像處理設備1200包括檢測裝置1202,用于根據金額的特征信息檢測收據圖像中表示金額的金額數字;識別裝置1204,用于根據金額數字來識別收據圖像中包含金額數字的特征行;以及分組裝置1206,用于基于所述特征行的位置分布,分別將所述收據圖像中的各個文本行分組到彼此之間相似的若干重復塊中。
需要指出的是,在與裝置有關的實施例中所涉及的相關術語或表述與以上對根據本發(fā)明的實施例的方法的實施例闡述中所使用的術語或表述對應,在此不再贅述。圖13示出根據本發(fā)明的一個實施例的檢測裝置的框圖。如圖13所示,在根據本實施例的收據圖像處理設備的ー個改進方案中,檢測裝置1202包括切分裝置1302,用于將收據圖像切分成文本行和詞;搜索裝置1304,用于在各個文本行的右對齊位置搜索最后兩位或倒數第二、三位字符為兩個連續(xù)數字的十進制數字;以及確定裝置1306,用于根據十進制數字與之前字符或詞之間的距離,以及之前字符或詞本身的屬性,來確定金額數字。圖14示出根據本發(fā)明的一個實施例的識別裝置的框圖。如圖14所示,在根據本實施例的收據圖像處理設備的ー個改進方案中,識別裝置1204包括第一相似度計算裝置1402,用于以已經被識別出的特征行為參照,計算收據圖像中的各個文本行與已經被識別出的特征行之間的第一相似度;閾值判斷裝置1404,用于將第一相似度大于預定閾值的文本行也識別為特征行;以及驗證裝置1406,用于根據所述金額數字在所述特征行與文本行中的位置對應信息對所述第一相似度進行驗證。圖15示出根據本發(fā)明的一個實施例的分組裝置的框圖。如圖15所示,在根據本實施例的收據圖像處理設備的ー個改進方案中,分組裝置1206包括第二相似度計算裝置1502,用于分別計算所述重復塊中除特征行以外的各個文本行與其它重復塊中除特征行以外的各個文本行之間的第二相似度;重復模式確定裝置1504,用于將所述第二相似度大于預定閾值的文本行作為重復模式;以及代表重復塊確定裝置1506,用于將具有最多重復模式的重復塊作為代表重復塊。圖12B示出根據本發(fā)明的另ー實施例的收據圖像處理設備1200’的框圖。如圖12B所示,收據圖像處理設備1200’包括檢測裝置1202,用于根據金額的特征信息檢測收據圖像中表示金額的金額數字;識別裝置1204,用于根據金額數字來識別收據圖像中包含金額數字的特征行;分組裝置1206,用于基于所述特征行的位置分布,分別將所述收據圖像中的各個文本行分組到彼此之間相似的若干重復塊中;劃分裝置1208,用于根據所得到的重復塊將所述收據圖像劃分成頭部、數據部和尾部,其中,所述數據部包括全部的所述重復塊,所述頭部為所述收據圖像中位于所述數據部之前的部分,而所述尾部為所述收據圖像中位于所述數據部之后的部分;以及聚類裝置1210,用于通過匹配所述頭部和/或所述數據部中的各重復塊,對所述收據圖像進行聚類。上述圖12至圖15中的各個裝置例如可以被配置成按照相應方法中的相應步驟的工作方式來操作。細節(jié)參見上述針對根據本申請的實施例的方法所闡述的實施例。在此不再贅述。本領域技術人員理解,在上面描述的根據本發(fā)明各實施例的收據圖像處理方法中的各步驟或者收據圖像處理裝置中的各功能裝置,可以根據實際需要進行任意的組合,即,ー個收據圖像處理方法實施例中的處理步驟可以與其它收據圖像處理方法實施例中的處理步驟進行組合,或者,一個收據圖像處理設備實施例中的功能裝置可以與其它收據圖像處理設備實施例中的功能裝置進行組合,以便實現所期望的技術目的。此外,本申請的實施例還提出了ー種多媒體終端設備,其包括上述根據本發(fā)明的實施例的收據圖像處理設備及其改進方案。此外,本申請的實施例還提出了ー種程序產品,該程序產品承載機器可執(zhí)行的指令,當在信息處理設備上執(zhí)行所述指令吋,所述指令使得所述信息處理設備執(zhí)行如根據上·述本發(fā)明的實施例的收據圖像處理方法。此外,本申請的實施例還提出了ー種存儲介質,該存儲介質包括機器可讀的程序代碼,當在信息處理設備上執(zhí)行所述程序代碼時,所述程序代碼使得所述信息處理設備執(zhí)行如根據上述本發(fā)明的實施例的方法。相應地,用于承載上述存儲有機器可讀取的指令代碼的程序產品的存儲介質也包括在本發(fā)明的公開中。所述存儲介質包括但不限于軟盤、光盤、磁光盤、存儲卡、存儲棒等
坐寸o根據本發(fā)明的實施例的收據圖像處理設備及其個組成部件可通過軟件、固件、硬件或其組合的方式進行配置。配置可使用的具體手段或方式為本領域技術人員所熟知,在此不再贅述。在通過軟件或固件實現的情況下,從存儲介質或網絡向具有專用硬件結構的信息處理設備(例如圖16所示的通用計算機1600)安裝構成該軟件的程序,該計算機在安裝有各種程序吋,能夠執(zhí)行各種功能等。在圖16中,中央處理單元(CPU) 1601根據只讀存儲器(ROM) 1602中存儲的程序或從存儲部分1608加載到隨機存取存儲器(RAM) 1603的程序執(zhí)行各種處理。在RAM 1603中,也根據需要存儲當CPU 1601執(zhí)行各種處理等等時所需的數據。CPU 160UROM 1602和RAM1603經由總線1604彼此連接。輸入/輸出接ロ 1605也連接到總線1604。下述部件連接到輸入/輸出接ロ 1605 :輸入部分1606(包括鍵盤、鼠標等等)、輸出部分1607(包括顯示器,比如陰極射線管(CRT)、液晶顯示器(LCD)等,和揚聲器等)、存儲部分1608 (包括硬盤等)、通信部分1609 (包括網絡接ロ卡比如LAN卡、調制解調器等)。通信部分1609經由網絡比如因特網執(zhí)行通信處理。根據需要,驅動器1610也可連接到輸入/輸出接ロ 1605。可拆卸介質1611比如磁盤、光盤、磁光盤、半導體存儲器等等根據需要被安裝在驅動器1610上,使得從中讀出的計算機程序根據需要被安裝到存儲部分1608中。在通過軟件實現上述系列處理的情況下,從網絡比如因特網或存儲介質比如可拆卸介質1611安裝構成軟件的程序。本領域的技術人員應當理解,這種存儲介質不局限于圖16所示的其中存儲有程序、與設備相分離地分發(fā)以向用戶提供程序的可拆卸介質1611。可拆卸介質1611的例子包含磁盤(包含軟盤(注冊商標))、光盤(包含光盤只讀存儲器(⑶-ROM)和數字通用盤(DVD))、磁光盤(包含迷你盤(MD)(注冊商標))和半導體存儲器?;蛘?,存儲介質可以是ROM 1602、存儲部分1608中包含的硬盤等等,其中存有程序,并且與包含它們的設備一起被分發(fā)給用戶。所述指令代碼由機器讀取并執(zhí)行時,可執(zhí)行上述根據本發(fā)明實施例的方法。最后,還需要說明的是,術語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者設備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者設備所固有的
要素。此外,在沒有更多限制的情況下,由語句“包括ー個......”限定的要素,并不排除在
包括所述要素的過程、方法、物品或者設備中還存在另外的相同要素。再者,由措辭“第一”,“第二”,“第三”等等限定的技術特征或者參數,并不因為這些措辭的使用而具有特定的順序或者優(yōu)先級或者重要性程度。換句話說,這些措辭的使用只是為了區(qū)分或識別這些技術 特征或者參數而沒有任何其他的限定含義。通過以上的描述不難看出,本發(fā)明的實施例提供的技術方案包括但不限于附記I. ー種收據圖像處理方法,包括根據金額的特征信息檢測所述收據圖像中表示所述金額的金額數字;根據所述金額數字來識別所述收據圖像中包含所述金額數字的特征行;以及基于所述特征行的位置分布,分別將所述收據圖像中的各個文本行分組到彼此之間相似的若干重復塊中。附記2.根據附記I所述的方法,其中,所述檢測包括將所述收據圖像切分成文本行和詞;在所述各個文本行的右對齊位置捜索最后兩位或倒數第二、三位字符為兩個連續(xù)數字的十進制數字;以及根據所述十進制數字與之前字符或詞之間的距離,以及所述之前字符或詞本身的屬性,來確定所述金額數字。附記3.根據附記I所述的方法,其中,所述識別包括以已經被識別出的特征行為參照,計算所述收據圖像中的各個文本行與所述已經被識別出的特征行之間的第一相似度;以及將所述第一相似度的值大于預定閾值的文本行也識別為特征行。附記4.根據附記3所述的方法,其中,所述第一相似度為各個文本行與所述特征行之間的左對齊相似度、右對齊相似度、尺寸相似度和詞屬性串的編輯距離。附記5.根據附記4所述的方法,其中,還根據所述金額數字在所述特征行與文本行中的位置對應信息對所述第一相似度進行驗證。附記6.根據附記I所述的方法,其中,所述分組包括分別以所述特征行為邊界,將所述特征行以及位于所述特征行與其之后最鄰近的特征行之間的各個文本行,分組到同一重復塊中。附記7.根據附記I所述的方法,其中,所述分組包括分別計算所述重復塊中除特征行以外的各個文本行與其它重復塊中除特征行以外的各個文本行之間的第二相似度;
將所述第二相似度大于預定閾值的文本行作為重復模式;以及將具有最多重復模式的重復塊作為代表重復塊。附記8.根據附記7所述的方法,其中,所述第二相似度包括各個文本行各個文本行之間的左對齊相似度、右對齊相似度、詞屬性串的編輯距離、以及各個文本行與其之前最鄰近的特征行之間的相對位置的相似度。附記9.根據附記1-8中任一項所述的方法,還包括根據所得到的重復塊將所述收據圖像劃分成頭部、數據部和尾部,其中,所述數據部包括全部的所述重復塊,所述頭部為所述收據圖像中位于所述數據部之前的部分,而所述尾部為所述收據圖像中位于所述數據部之后的部分;以及
通過匹配所述頭部和/或所述數據部中的各重復塊,對所述收據圖像進行聚類。附記10.根據附記9所述的方法,其中,用所述代表重復塊進行所述數據部之間的匹配。附記11. 一種收據圖像處理設備,包括檢測裝置,用于根據金額的特征信息檢測所述收據圖像中表示所述金額的金額數字;識別裝置,用于根據所述金額數字來識別所述收據圖像中包含所述金額數字的特征行;以及分組裝置,用于基于所述特征行的位置分布,分別將所述收據圖像中的各個文本行分組到彼此之間相似的若干重復塊中。附記12.根據附記11所述的設備,其中,所述檢測裝置包括切分裝置,用于將所述收據圖像切分成文本行和詞;捜索裝置,用于在所述各個文本行的右對齊位置捜索最后兩位或倒數第二、三位字符為兩個連續(xù)數字的十進制數字;以及確定裝置,用于根據所述十進制數字與之前字符或詞之間的距離,以及所述之前字符或詞本身的屬性,來確定所述金額數字。附記13.根據附記11所述的設備,其中,所述識別裝置包括第一相似度計算裝置,用于以已經被識別出的特征行為參照,計算所述收據圖像中的各個文本行與所述已經被識別出的特征行之間的第一相似度;以及閾值判斷裝置,將所述第一相似度的值大于預定閾值的文本行也識別為特征行。附記14.根據附記13所述的設備,其中,所述第一相似度為所述特征行之間的左對齊相似度、右對齊相似度、尺寸相似度和詞屬性串的編輯距離。附記15.根據附記14所述的設備,其中,所述識別裝置還包括驗證裝置,用于根據所述金額數字在所述特征行與文本行中的位置對應信息對所述第一相似度進行驗證。附記16.根據附記11所述的設備,其中,所述分組裝置用于分別以所述特征行為邊界,將所述特征行以及位于所述特征行與其之后最鄰近的特征行之間的各個文本行,分組到同一重復塊中。附記17.根據附記11所述的設備,所述分組裝置包括第二相似度計算裝置,用于分別計算所述重復塊中除特征行以外的各個文本行與其它重復塊中除特征行以外的各個文本行之間的第二相似度;重復模式確定裝置,用于將所述第二相似度大于預定閾值的文本行作為重復模式;以及代表重復塊確定裝置,用于將具有最多重復模式的重復塊作為代表重復塊。附記18.根據附記17所述的設備,其中,所述第二相似度包括各個文本行各個文本行之間的左對齊相似度、右對齊相似度、詞屬性串的編輯距離、以及各個文本行與其之前最鄰近的特征行之間的相對位置的相似度。附記19.根據附記11-18中任一項所述的設備,還包括劃分裝置,用于根據所得到的重復塊將所述收據圖像劃分成頭部、數據部和尾部, 其中,所述數據部包括全部的所述重復塊,所述頭部為所述收據圖像中位于所述數據部之前的部分,而所述尾部為所述收據圖像中位于所述數據部之后的部分;以及聚類裝置,用于通過匹配所述頭部和/或所述數據部中的各重復塊,對所述收據圖像進行聚類。附記20.根據附記19所述的設備,其中,用所述代表重復塊進行所述數據部之間的匹配。附記21、一種從收據圖像中提取關鍵信息的方法,包括采用附記1-10中任一項所述的收據圖像處理方法獲得所述收據圖像的各重復塊;以及從所述各重復塊中提取所述關鍵信息。附記22. —種從收據圖像中提取關鍵信息的設備,包括用于采用附記11-20中任一項所述的收據圖像處理設備獲得所述收據圖像的各重復塊的裝置;以及用于從所述各重復塊中提取所述關鍵信息的裝置。附記23. —種程序產品,該程序產品承載機器可執(zhí)行的指令,當在信息處理設備上執(zhí)行所述指令時,所述指令使得所述信息處理設備執(zhí)行如附記1-10中任ー項所述的收據圖像處理方法。附記24. —種存儲介質,該存儲介質包括機器可讀的程序代碼,當在信息處理設備上執(zhí)行所述程序代碼時,所述程序代碼使得所述信息處理設備執(zhí)行如附記1-10中任一項所述的收據圖像處理方法。以上雖然結合附圖詳細描述了本發(fā)明的實施例,但是應當明白,上面所描述的實施方式只是用于說明本發(fā)明,而并不構成對本發(fā)明的限制。對于本領域的技術人員來說,可以對上述實施方式作出各種修改和變更而沒有背離本發(fā)明的實質和范圍。因此,本發(fā)明的范圍僅由所附的權利要求及其等同含義來限定。
權利要求
1.ー種收據圖像處理方法,包括 根據金額的特征信息檢測所述收據圖像中表示所述金額的金額數字; 根據所述金額數字來識別所述收據圖像中包含所述金額數字的特征行;以及基于所述特征行的位置分布,分別將所述收據圖像中的各個文本行分組到彼此之間相似的若干重復塊中。
2.根據權利要求I所述的方法,其中,所述檢測包括 將所述收據圖像切分成文本行和詞; 在所述各個文本行的右對齊位置捜索最后兩位或倒數第二、三位字符為兩個連續(xù)數字的十進制數字;以及 根據所述十進制數字與之前字符或詞之間的距離,以及所述之前字符或詞本身的屬性,來確定所述金額數字。
3.根據權利要求I所述的方法,其中,所述識別包括 以已經被識別出的特征行為參照,計算所述收據圖像中的各個文本行與所述已經被識別出的特征行之間的第一相似度;以及 將所述第一相似度的值大于預定閾值的文本行也識別為特征行。
4.根據權利要求I所述的方法,其中,所述分組包括 分別以所述特征行為邊界,將所述特征行以及位于所述特征行與其之后最鄰近的特征行之間的各個文本行,分組到同一重復塊中。
5.根據權利要求I所述的方法,其中,所述分組包括 分別計算所述重復塊中除特征行以外的各個文本行與其它重復塊中除特征行以外的各個文本行之間的第二相似度; 將所述第二相似度大于預定閾值的文本行作為重復模式;以及 將具有最多重復模式的重復塊作為代表重復塊。
6.一種收據圖像處理設備,包括 檢測裝置,用于根據金額的特征信息檢測所述收據圖像中表示所述金額的金額數字;識別裝置,用于根據所述金額數字來識別所述收據圖像中包含所述金額數字的特征行;以及 分組裝置,用于基于所述特征行的位置分布,分別將所述收據圖像中的各個文本行分組到彼此之間相似的若干重復塊中。
7.根據權利要求6所述的設備,其中,所述檢測裝置包括 切分裝置,用于將所述收據圖像切分成文本行和詞; 捜索裝置,用于在所述各個文本行的右對齊位置捜索最后兩位或倒數第二、三位字符為兩個連續(xù)數字的十進制數字;以及 確定裝置,用于根據所述十進制數字與之前字符或詞之間的距離,以及所述之前字符或詞本身的屬性,來確定所述金額數字。
8.根據權利要求6所述的設備,其中,所述識別裝置包括 第一相似度計算裝置,用于以已經被識別出的特征行為參照,計算所述收據圖像中的各個文本行與所述已經被識別出的特征行之間的第一相似度;以及 閾值判斷裝置,將所述第一相似度大于預定閾值的文本行也識別為特征行。
9.根據權利要求6所述的設備,其中,所述分組裝置用于 分別以所述特征行為邊界,將所述特征行以及位于所述特征行與其之后最鄰近的特征行之間的各個文本行,分組到同一重復塊中。
10.根據權利要求6所述的設備,其中,所述分組裝置包括 第二相似度計算裝置,用于分別計算所述重復塊中除特征行以外的各個文本行與其它重復塊中除特征行以外的各個文本行之間的第二相似度; 重復模式確定裝置,用于將所述第二相似度大于預定閾值的文本行作為重復模式;以及 代表重復塊確定裝置,用于將具有最多重復模式的重復塊作為代表重復塊。
全文摘要
本發(fā)明提供一種收據圖像處理方法和設備,該方法包括根據特征信息檢測收據圖像中表示金額的金額數字;根據金額數字來識別收據圖像中包含金額數字的特征行;以及基于特征行的位置分布,分別將收據圖像中的各個文本行分組到彼此之間相似的若干重復塊中。
文檔編號G06K9/00GK102968610SQ201110270388
公開日2013年3月13日 申請日期2011年8月31日 優(yōu)先權日2011年8月31日
發(fā)明者常蘭蘭, 孫俊, 何源, 于浩, 直井聰 申請人:富士通株式會社
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1