亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

特征提取、字符識別、引擎生成、信息確定方法及裝置的制造方法

文檔序號:9376268閱讀:436來源:國知局
特征提取、字符識別、引擎生成、信息確定方法及裝置的制造方法
【技術領域】
[0001] 本申請涉及計算機技術領域,尤其涉及一種字符描述特征提取方法、字符識別方 法、字符識別引擎生成方法、信息確定方法及裝置。
【背景技術】
[0002] 字符識別是眾多視覺創(chuàng)新應用的基礎技術,目前,比較成熟的字符識別技術有光 學字符識別(Optical Character Recognition, OCR)。OCR在名片識別、證件識別和文檔識 別等領域都有著廣泛的應用。
[0003] -般來說,字符識別技術主要包括兩部分內(nèi)容:一部分是對樣本的離線訓練,另一 部分是在線字符識別。
[0004] 其中,對于樣本的離線訓練的目的是建立字符識別引擎。字符識別引擎是指根據(jù) 一定的策略、運用特定的計算機程序對圖像進行處理,并對從圖像中識別出的字符的信息 進行展示的系統(tǒng)。一般地,建立字符識別引擎的流程如圖1所示,依次包括對作為訓練樣本 的圖像的二值化處理、歸一化處理、提取圖像中的字符描述特征和分類器設計。其中,對作 為訓練樣本的圖像的二值化處理,是指將圖像所包含的各像素的灰度值轉化為特定的兩個 灰度值中的一個,比如轉化為0或255。
[0005] 而在線字符識別的主要目的在于利用字符識別引擎,從輸入字符識別引擎的圖像 中識別出字符。對應于字符識別引擎的建立方法,利用字符識別引擎進行在線字符識別的 流程如圖2所示,依次包括對圖像的二值化處理、歸一化處理、提取圖像中的字符描述特 征,以及利用分類器確定提取到的字符描述特征所描述字符的所屬類別。
[0006] 由圖1可以看出,現(xiàn)有的字符識別引擎的建立基礎之一是對圖像的二值化處理。 之所以對圖像進行二值化處理,是因為現(xiàn)有的字符描述特征提取方法往往都是基于二值化 圖像實現(xiàn)的,當該些方法應用在灰度圖像上時,有可能不能提取到合適的字符描述特征,從 而會影響字符識別引擎對于字符的識別準確性。

【發(fā)明內(nèi)容】

[0007] 本申請實施例提供一種字符描述特征提取方法,以適用于對于灰度圖像的字符描 述特征提取。
[0008] 本申請實施例還提供一種字符描述特征提取裝置,以適用于對于灰度圖像的字符 描述特征提取。
[0009] 本申請實施例還提供一種字符識別方法和相應的裝置。
[0010] 本申請實施例還提供一種字符識別引擎生成方法和相應的裝置。
[0011] 本申請實施例還提供一種信息確定方法及裝置。
[0012] 本申請實施例采用下述技術方案:
[0013] -種字符描述特征提取方法,包括:獲得圖像;確定第一灰度信息和第二灰度信 息;其中,第一灰度信息表示所述圖像的基準區(qū)域內(nèi)的像素的灰度等級;第二灰度信息表 示所述圖像的比較區(qū)域內(nèi)的像素的灰度等級;根據(jù)第一灰度信息和第二灰度信息,確定字 符描述特征。
[0014] -種字符識別方法,包括:獲得圖像;確定第一灰度信息和第二灰度信息;其中, 第一灰度信息表示所述圖像的基準區(qū)域內(nèi)的像素的灰度等級;第二灰度信息表示所述圖像 的比較區(qū)域內(nèi)的像素的灰度等級;根據(jù)第一灰度信息和第二灰度信息,確定字符描述特征; 根據(jù)所述字符描述特征確定字符。
[0015] -種字符識別引擎生成方法,包括:獲得圖像集合;分別確定所述圖像集合包含 的各圖像的第一灰度信息和第二灰度信息;其中,第一灰度信息表示基準區(qū)域內(nèi)的像素的 灰度等級;第二灰度信息表示比較區(qū)域內(nèi)的像素的灰度等級;根據(jù)確定出的各第一灰度信 息和各第二灰度信息,確定字符描述特征;根據(jù)所述字符描述特征,生成分類器。
[0016] -種信息確定方法,包括:獲得圖像;確定第一灰度信息和第二灰度信息;其中, 第一灰度信息表示所述圖像的基準區(qū)域內(nèi)的像素的灰度等級;第二灰度信息表示所述圖像 的比較區(qū)域內(nèi)的像素的灰度等級。
[0017] -種字符描述特征提取裝置,包括:圖像獲得單元,用于獲得圖像;信息確定單 兀,用于確定第一灰度?目息和第二灰度?目息;其中,第一灰度?目息表圖像獲得單兀獲得的 所述圖像的基準區(qū)域內(nèi)的像素的灰度等級;第二灰度信息表示所述圖像的比較區(qū)域內(nèi)的像 素的灰度等級;特征確定單元,用于根據(jù)信息確定單元確定的第一灰度信息和第二灰度信 息,確定字符描述特征。
[0018] -種字符識別裝置,包括:圖像獲得單元,用于獲得圖像;信息確定單元,用于確 定第一灰度信息和第二灰度信息;其中,第一灰度信息表示圖像獲得單元獲得的所述圖像 的基準區(qū)域內(nèi)的像素的灰度等級;第二灰度信息表示所述圖像的比較區(qū)域內(nèi)的像素的灰度 等級;特征確定單元,用于根據(jù)信息確定單元確定的第一灰度信息和第二灰度信息,確定字 符描述特征;字符確定單元,用于根據(jù)特征確定單元確定的所述字符描述特征確定字符。
[0019] -種字符識別引擎生成裝置,包括:圖像獲得單元,用于獲得圖像集合;信息確定 單元,用于分別確定圖像獲得單元獲得的所述圖像集合包含的各圖像的第一灰度信息和第 二灰度信息;其中,第一灰度信息表示基準區(qū)域內(nèi)的像素的灰度等級;第二灰度信息表示 比較區(qū)域內(nèi)的像素的灰度等級;特征確定單元,用于根據(jù)信息確定單元確定出的各第一灰 度信息和各第二灰度信息,確定字符描述特征;分類器生成單元,用于根據(jù)特征確定單元確 定的所述字符描述特征,生成分類器。
[0020] -種信息確定裝置,包括:圖像獲得單元,用于獲得圖像;信息確定單元,用于確 定第一灰度信息和第二灰度信息;其中,第一灰度信息表示所述圖像的基準區(qū)域內(nèi)的像素 的灰度等級;第二灰度信息表示所述圖像的比較區(qū)域內(nèi)的像素的灰度等級。
[0021] 本申請實施例采用的上述至少一個技術方案能夠達到以下有益效果:
[0022] 方案可以根據(jù)表示灰度等級的灰度信息來確定字符描述特征,而無論是從二值化 圖像還是灰度圖像中,都可以獲取到這樣的灰度信息,從而該方案可以適用于對于灰度圖 像的字符描述特征提取。
【附圖說明】
[0023] 此處所說明的附圖用來提供對本申請的進一步理解,構成本申請的一部分,本申 請的示意性實施例及其說明用于解釋本申請,并不構成對本申請的不當限定。在附圖中:
[0024] 圖1為現(xiàn)有技術中建立字符識別引擎的流程示意圖;
[0025] 圖2為現(xiàn)有技術中利用字符識別引擎進行在線字符識別的流程示意圖;
[0026] 圖3為本申請實施例1提供的一種字符描述特征提取方法的實現(xiàn)流程示意圖;
[0027] 圖4a為包含字符的灰度圖像的示意圖;
[0028] 圖4b為由坐標軸X和坐標軸y構成的圖像坐標系的示意圖;
[0029] 圖4c為基準區(qū)域和比較區(qū)域的大小以及在圖像坐標系中所在位置的示意圖;
[0030] 圖4d為基準區(qū)域、比較區(qū)域與圖像的位置關系的示意圖;
[0031] 圖4e為基準區(qū)域、比較區(qū)域與字符"一"的位置關系的示意圖;
[0032] 圖4f為本申請實施例1中可使用的一種基準區(qū)域和比較區(qū)域的示意圖;
[0033] 圖4g為本申請實施例1中可使用的另一種基準區(qū)域和比較區(qū)域的示意圖;
[0034] 圖5為本申請實施例2提供的一種字符識別方法的具體流程示意圖;
[0035] 圖6為本申請實施例3提供的一種字符識別引擎生成方法的具體流程示意圖;
[0036] 圖7a為本申請實施例4提供的一種利用對票據(jù)進行掃描而得到的樣本圖像進行 分類器訓練,并利用分類器對待識別圖像進行字符識別的方法的具體流程示意圖;
[0037] 圖7b為本申請實施例4中的決策樹的結構示意圖;
[0038] 圖8a為實施例5提供一種新的字符識別方法的流程示意圖;
[0039] 圖8b為樣本圖像的示意圖;
[0040] 圖8c為按照定位信息集合j確定出的基準區(qū)域和比較區(qū)域與圖8b所示的樣本圖 像的位置關系示意圖;
[0041] 圖8d為本申請實施例5中生成的決策樹的示意圖;
[0042] 圖9為本申請實施例6提供的第一種字符描述特征提取裝置的具體結構示意圖;
[0043] 圖10為本申請實施例6提供的第二種字符描述特征提取裝置的具體結構示意 圖;
[0044] 圖11為本申請實施例7提供的第一種字符識別裝置的具體結構示意圖;
[0045] 圖12為本申請實施例8提供的第一種字符識別引擎生成裝置的具體結構示意 圖;
[0046] 圖13為本申請實施例9提供的第一種信息確定裝置的具體結構示意圖。
【具體實施方式】
[0047] 為使本申請的目的、技術方案和優(yōu)點更加清楚,下面將結合本申請具體實施例及 相應的附圖對本申請技術方案進行清楚、完整地描述。顯然,所描述的實施例僅是本申請一 部分實施例,而不是全部的實施例?;诒旧暾堉械膶嵤├?,本領域普通技術人員在沒有做 出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本申請保護的范圍。
[0048] 以下結合附圖,詳細說明本申請各實施例提供的技術方案。
[0049] 實施例1
[0050] 實施例1提供一種字符描述特征提取方法,該方法的實現(xiàn)流程示意圖如圖3所示, 包括下述步驟:
[0051] 步驟31,獲得圖像。
[0052] 這里的圖像比如可以是包含字符的灰度圖像,如圖4a所示。
[0053] 步驟32,確定第一灰度信息和第二灰度信息。
[0054] 其中,第一灰度信息表示圖像的基準區(qū)域內(nèi)的像素的灰度等級;第二灰度信息表 示圖像的比較區(qū)域內(nèi)的像素的灰度等級。
[0055] 這里所說的"基準區(qū)域"和"比較區(qū)域"是指具備兩個特定屬性的區(qū)域。這兩個特 定屬性分別為"大小"和"位置"。本申請實施例中,同時表示這兩個屬性的信息或者表示這 兩個屬性之一的信息均可以稱為"定位信息"。
[0056] 以基準區(qū)域為例,根據(jù)其定位信息可以確定出基準區(qū)域所在位置和大小,進而可 以確定基準區(qū)域與圖像的位置關系。比如,基于如圖4b所示的由坐標軸X和坐標軸y構成 的圖像坐標系,若基準區(qū)域的定位信息包括"大小為50X50"以及"區(qū)域的第一頂點的坐標 為(20,20),區(qū)域的第二頂點的坐標為(70,20)",則可以確定出基準區(qū)域的大小和在該圖 像坐標系中所在位置;類似地,也可以根據(jù)比較區(qū)域的定位信息,確定出比較區(qū)域的大小和 在圖像坐標系中所在位置,如圖4c所示。圖4c中,比較區(qū)域中的數(shù)字1、2、3表示比較區(qū)域 的編號?;趫D4b和圖4c,可以確定出基準區(qū)域和比較區(qū)域與圖像的位置關系,如圖4d所 示。一般說來,同一圖像中的比較區(qū)域和基準區(qū)域至少有部分不重疊,甚至完全不重疊。此 外,單個比較區(qū)域與基準區(qū)域的大小一般是相同的,但也可以允許存在差異。
[0057] 在確定出基準區(qū)域與圖像的位置關系,以及比較區(qū)域與圖像的位置關系后,就可 以對圖像中分別處于基準區(qū)域和比較區(qū)域內(nèi)的像素的灰度等級進行統(tǒng)計,從而得到第一灰 度信息和第二灰度信息。
[0058] 需要說明的是,本申請實施例中,在確定第一灰度信息和第二灰度信息之前,可以 對基準區(qū)域和比較區(qū)域的定位信息進行設置。比如,可以對不同的字符在包含單個字符的 圖像中所處位置進行統(tǒng)計,并根據(jù)統(tǒng)計結果來分別確定基準區(qū)域和比較區(qū)域的定位信息。
[0059] 針對基準區(qū)域和比較區(qū)域所處位置而言,由于在包含單個字符的圖像中,字符往 往處于圖像中央位置而非邊緣位置,因此,可以按照"將基準區(qū)域定位在圖像邊緣位置,將 比較區(qū)域定位在圖像中央位置;反之亦可"的方式,確定基準區(qū)域和比較區(qū)域的位置;又比 如,針對上下結構的漢字字符,構成字符的筆劃往往集中于圖像中央位置的上部和下部,因 此,可以按照"將基準區(qū)域定位在圖像左側(或右側),將比較區(qū)域定位在圖像中央位置的 上部(或下部);反之亦可"的方式,確定基準區(qū)域和比較區(qū)域的位置;等等。
[0060] 針對基準區(qū)域和比較區(qū)域的面積而言,當基準區(qū)域被定位在圖像邊緣位置時,可 以根據(jù)字符在包含單個
當前第1頁1 2 3 4 5 6 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1