亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于稀疏編碼的字體識別方法

文檔序號:6559414閱讀:363來源:國知局
專利名稱:一種基于稀疏編碼的字體識別方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種基于稀疏編碼的字體識別方法,屬于圖像處理與模式識別的技術(shù)領(lǐng)域。
背景技術(shù)
隨著網(wǎng)絡(luò)辦公的興起以及數(shù)字圖書館業(yè)務(wù)的普及,人們對信息的獲取和交流已經(jīng)更加依賴于電子文檔。而如何將傳統(tǒng)的以書本形式記錄的信息轉(zhuǎn)化為電子文檔,就成為計算機自動文檔分析需要解決的一個基本問題。字體識別就是識別出文本圖像中字體的類型,是計算機自動文檔分析和處理中重要的研究內(nèi)容之一。近20多年來,OCR (optical character recognition,光學(xué)字符識別)獲得了迅猛的發(fā)展。目前,印刷體字符識別技術(shù)已基本成熟,識別率已經(jīng)達(dá)到了商業(yè)應(yīng)用的要求。然而,現(xiàn)有的OCR系統(tǒng)主要面向于“識字” 的層面,即識別出圖像中的文字內(nèi)容,而對文字字體的識別離實用化的要求還相距甚遠(yuǎn),這對于識別出圖像包含文字的版面結(jié)構(gòu)信息以及后續(xù)對文字內(nèi)容的再編輯是一個尚待解決的問題。另一方面,單一字體的文字識別的準(zhǔn)確率要高于多種字體的文字識別的準(zhǔn)確率,因此,如果我們能夠準(zhǔn)確識別文檔圖像的字體信息,就能夠?qū)⒍喾N字體的文字識別轉(zhuǎn)化為單一字體的文字識別,從而提高文檔圖像文字識別的準(zhǔn)確率。字體識別的研究與應(yīng)用具有重大的意義,但還沒有引起人們足夠的重視,對字體識別的研究還相對較少。目前已有的技術(shù)主要包括1)利用字體的局部特征,如襯線、字體粗細(xì)等進行字體識別;幻基于局部或全局版面特征進行字體識別;;3)基于紋理分析的字體識別。這些方法從提取圖像特征的角度出發(fā),取得了一定的識別效果。但由于有些字體之前的差異在圖像特征層面表現(xiàn)的不是特別明顯,從而導(dǎo)致依賴圖像特征的字體識別方法不能正確地識別出相似的字體。

發(fā)明內(nèi)容
本發(fā)明的目的是解決由于有些字體之前的差異在圖像特征層面表現(xiàn)的不是特別明顯,從而導(dǎo)致依賴圖像特征的字體識別方法不能正確地識別出相似字體的問題,進而提供一種基于稀疏編碼的字體識別方法。本發(fā)明的目的是通過以下技術(shù)方案實現(xiàn)的以灰度圖像作為待測試圖像并進行以下兩個階段的操作,在訓(xùn)練階段,將各類別字體的待測試圖像劃分成子塊,并將各子塊的基函數(shù)作為該類字體的模型,所述各子塊的基函數(shù)通過獨立成份分析模型訓(xùn)練,并能夠稀疏線性表示;在測試階段,將待測試圖像劃分成子塊,并計算各子塊在各類字體的基函數(shù)模型下線性表示的系數(shù),通過計算系數(shù)分布的峰度來判斷系數(shù)的稀疏性,從而將待測試圖像包含的字體識別為產(chǎn)生最稀疏表示的那一類字體。本發(fā)明從稀疏編碼的角度出發(fā),通過模擬人類視覺系統(tǒng)對視覺信息的有效編碼, 以最原始的灰度信息作為輸入,為每一種字體訓(xùn)練一組能夠有效表示所屬字體圖像的基函數(shù),所訓(xùn)練的基函數(shù)對輸入信息的響應(yīng)系數(shù)是稀疏的,從而導(dǎo)致高效的編碼。在測試階段, 通過計算測試圖像在各字體的基函數(shù)下的響應(yīng)是否是稀疏的,來識別出測試文檔圖像所屬的字體類別。本發(fā)明能夠?qū)ν徽Z言的不同字體進行識別,也能識別不同語言之間的字體。本發(fā)明可以應(yīng)用在自動文檔分析(識別文檔圖像中的文字以及自動還原排版格式等)和藝術(shù)設(shè)計(識別感興趣的藝術(shù)字體)等方面。
具體實施例方式本專利所發(fā)明的基于稀疏編碼的字體識別方法的具體步驟為步驟一為訓(xùn)練庫中的每一類字體,收集一定數(shù)量的灰度圖像作為訓(xùn)練圖像,例如 10幅圖像。將每一幅圖像隨機劃分成一定數(shù)量的方塊,例如512X512的灰度圖像可以劃分為1000個方塊,假設(shè)方塊的大小為dXd。步驟二 對于第k類字體,將所有訓(xùn)練圖像經(jīng)過劃分之后得到的任一方塊轉(zhuǎn)化為一個B = dXd維的列向量,將所有訓(xùn)練圖像的所有方塊對應(yīng)的列向量作為訓(xùn)練樣本,使用獨立成份分析(Incbpendent Component Analysis, ICA)的方法,訓(xùn)練出一組基函數(shù)矩陣
,φ;,K 和與之對應(yīng)的濾波器矩陣Wi =·[<,K ,WkjiK 廣;其中《表示第k類
字體的第j個基函數(shù),<表示表示第k類字體的第j個濾波器,T表示矩陣轉(zhuǎn)置;步驟三采用與訓(xùn)練階段相似的策略,對待測試文檔圖像進行劃分,得到N個大小為dXd的方塊,將每一個方塊表示成B = dXd維的列向量,所有N個方塊構(gòu)成矩陣X = Ix1, ...,Xi,...,%},其中Xi表示第i個方塊對應(yīng)的列向量;步驟四計算第i子塊Xi由第k類字體的所有基函數(shù)線性表示時第j個基函數(shù)對應(yīng)的系數(shù)《afj =(Wkj)' X1(5)其中T表示矩陣轉(zhuǎn)置。步驟五計算第j個基函數(shù)在所有方塊下的系數(shù)分布的峰度#
權(quán)利要求
1.一種基于稀疏編碼的字體識別方法,其特征在于,以灰度圖像作為待測試圖像并進行以下兩個階段的操作,在訓(xùn)練階段,將各類別字體的待測試圖像劃分成方塊,并將各方塊的基函數(shù)作為該類字體的模型,所述各方塊的基函數(shù)通過獨立成份分析模型訓(xùn)練,并能夠稀疏線性表示各方塊;在測試階段,將待測試圖像劃分成方塊,并計算各方塊在各類字體的基函數(shù)模型下線性表示的系數(shù),通過計算系數(shù)分布的峰度來判斷系數(shù)的稀疏性,從而將待測試圖像包含的字體識別為產(chǎn)生最稀疏表示的那一類字體。
2.根據(jù)權(quán)利要求1所述的基于稀疏編碼的字體識別方法,其特征在于,在訓(xùn)練階段, 對于訓(xùn)練庫中的每一類字體,收集若干訓(xùn)練圖像;對于每一幅圖像,將其隨機劃分成若干方塊,方塊與方塊之間允許部分重疊,方塊的大小為dX d ;對于第k類字體,使用所有劃分的方塊通過獨立成份分析方法,訓(xùn)練出一組基函數(shù)= ■{<,& K ,《1和與之對應(yīng)的濾波器 Wi =
3.根據(jù)權(quán)利要求2所述的基于稀疏編碼的字體識別方法,其特征在于,在測試階段,將測試圖像劃分成相同大小的方塊X = Ix1,...,Xi,...,%},其中Xi表示第i個方塊對應(yīng)的列向量,執(zhí)行以下步驟計算第i個子塊Xi由第k類字體的所有基函數(shù)線性表示時第j個基函數(shù)對應(yīng)的系數(shù)4 4+))、α)其中T表示矩陣轉(zhuǎn)置。計算第j個基函數(shù)在所有方塊下的系數(shù)分布的峰度^1 ^pN Ik \4^=7^^(2)—k-amjra-^g-a-ll^y^ yj '\> ι yj i/a ? ν ■ ι mjijii j^k^r ^ ) η ,J,w),K yB)T,其中B = dXd是基函數(shù)的個數(shù),八丄門丄 O 丄Tf -r, 1 —TTT _LV A Γ-r-、 r> JLL^ -f-H -Tj -TX -r-^- Ar^ Trt JL. L^/丄、Π Π.Ι _其中計算第k類字體的所有B個基函數(shù)系數(shù)分布峰度的平均值77=\tf"⑶ο —ι測試圖像所含文字的字體可以識別為字體類別k* —kk* = arg max /(4)k
4.根據(jù)權(quán)利要求3所述的基于稀疏編碼的字體識別方法,其特征在于,按照公式(1)編程計算每一方塊由每一類字體的基函數(shù)線性表示時的系數(shù)^。
5.根據(jù)權(quán)利要求3所述的基于稀疏編碼的字體識別方法,其特征在于,按照公式(2)為每類字體的每一個基函數(shù)系統(tǒng)計算峰度。
6.根據(jù)權(quán)利要求3所述的基于稀疏編碼的字體識別方法,其特征在于,按照公式(3)為每類字體的所有基函數(shù)系數(shù)的峰度計算平均值。
7.根據(jù)權(quán)利要求3所述的基于稀疏編碼的字體識別方法,其特征在于,按照公式0), 計算出所有字體基函數(shù)系數(shù)的峰度平均值的最大值,并將測試文檔圖像的字體識別為最大值對應(yīng)的字體類別。
全文摘要
本發(fā)明提供了一種基于稀疏編碼的字體識別方法。本發(fā)明以灰度圖像作為輸入,對于任意一幅待測試圖像進行以下兩個階段的操作在訓(xùn)練階段,將各類字體的待測試圖像隨機劃分成一定數(shù)量的方塊,方塊的數(shù)量由圖像大小以及方塊大小共同決定,例如一幅512×512的灰度圖像,可以劃分成4096個8×8大小的方塊。對于任一類字體,以劃分出的方塊為輸入,利用獨立成分分析方法訓(xùn)練出一組能夠稀疏表示任一方塊的基函數(shù),并將這些基函數(shù)作為該類字體的模型。本發(fā)明可以對中文字體進行識別;也可以對其它語言的字體進行識別;還可以對不同語言的字體進行識別。本發(fā)明可以應(yīng)用在自動文檔分析和藝術(shù)設(shè)計等方面。
文檔編號G06K9/62GK102262731SQ201110192198
公開日2011年11月30日 申請日期2011年7月11日 優(yōu)先權(quán)日2011年7月11日
發(fā)明者盧修生, 姚鴻勛, 孫鑫, 張盛平 申請人:哈爾濱工業(yè)大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1