亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

灰度字符詞典的生成裝置的制作方法

文檔序號:6509497閱讀:193來源:國知局
專利名稱:灰度字符詞典的生成裝置的制作方法
技術領域
本發(fā)明涉及一種灰度字符詞典的生成裝置。
背景技術
在自動字符識別技術領域中,對退化的機器印刷字符(包括由各種原因引起的字符模糊,比如低分辨率下的字符圖像,數(shù)碼相機由于抖動造成的字符模糊,傳真或者多次掃描以后造成的字符模糊)進行識別是一個相當大的挑戰(zhàn)。在傳統(tǒng)的方法中,一般運用二值字符圖像來生成詞典,其中二值表示圖像的像素點的取值范圍只有2個選擇0與255,或者0與1。但是對于退化的字符圖像,這種二值化法在進行分類時會損失大量有效信息,有效信息表示能夠有效識別該字符的信息。在損失了大量有效信息的情況下,比如由于二值化造成“日”字被二值化為“11”以后,即便是由人來識別也無法正確識別,也就是說,即便讓人來認這個“11”,也不會認出是由“日”字二值化后的結(jié)果。由于字符識別是模擬人的識別機制,因此如果人都認不出來,計算機是永遠無法正確識別的,因而會嚴重影響到之后的識別效果。由于灰度字符圖像的像素點的取值從0~255,像素點變化范圍是256級,而二值圖像取值從0~1,因此灰度字符圖像能夠更好地保留字符的識別信息,具有更好的圖像表現(xiàn)力,包含更多的細節(jié)信息。因此,在識別退化字符時,關鍵是改用灰度圖像來生成灰度字符詞典,灰度詞典就是直接用灰度字符圖像來構造的詞典。由于在東方語言中(中文、日語、韓語),字符種類的數(shù)量相當大,所以生成灰度字符詞典的一個難題在于如何收集字符樣本來制造灰度字符詞典。比如,一部典型的日語詞典中就包括4299種字符,包括日本漢字、數(shù)字、片假名、平假名和符號等。傳統(tǒng)的詞典采用的是通過掃描儀獲得的二值字符圖像。采集灰度圖像同樣可以通過掃描儀進行灰度掃描得到,但是制作灰度字符詞典所需要的灰度字符圖像比制作二值字符詞典所需要的二值字符圖像要多得多。因此人工收集幾乎是不可能的事情。
對于退化灰度字符圖像的識別,現(xiàn)在已有了多種方法。比如X.W.Wang,X.Q.Ding and C.S.Liu,“A gray-scale image basedcharacter recognition algorithm to low-quality and low-resolution images.”Proceedings of SPIE Vol.4307,pp.315~322.
Yoshimura,H.,Etoh,M.,Kondo,K.,et al.“Gray-scale characterrecognition by gabor jets projection.”Proc.ICPR pp.335-338,2000此外,另外還有一些與基于頻率的特征抽取的方法相關的專利,例如1999年6月8日提交的發(fā)明人為Shinnosuke Taniishi的美國專利No.5,911,013“Character recognition method and apparatus capable of handlinghandwriting”等。
但是,對于退化的灰度字符圖像只使用基于頻率的方法并不能取得較好的效果,這是由于基于頻率的方法無法有效區(qū)分字符的細節(jié)特征,因此在識別相似字符方面有缺陷。

發(fā)明內(nèi)容
本發(fā)明鑒于現(xiàn)有技術的上述缺點而產(chǎn)生,本發(fā)明的目的是提供一種灰度字符詞典的生成裝置,其生成在識別過程中使用的兩級詞典,其中,第一級詞典以分析頻率為基礎,對字符進行粗略的分類。二級詞典對粗略分類的結(jié)果進行優(yōu)化重構,然后進一步精細分類。
為實現(xiàn)上述目的,本發(fā)明提供了一種灰度字符詞典的生成裝置,包括第一級合成灰度退化字符圖像生成單元,用于利用輸入于其中的各二值字符圖像生成第一級合成灰度退化字符圖像;聚類單元,用于將所述第一級合成灰度退化字符圖像生成單元生成的每一類第一級合成灰度退化字符圖像分為多個聚類;模板計算單元,用于為每一類合成灰度退化字符圖像的多個聚類中的每一個聚類生成模板;轉(zhuǎn)換矩陣計算單元,用于針對各模板生成轉(zhuǎn)換矩陣;第二級合成灰度退化字符詞典生成單元,利用所述轉(zhuǎn)換矩陣獲取每個聚類中的每個灰度退化字符的字符特征,并構建各類合成灰度退化字符的特征空間,即第二級合成灰度字符詞典。
優(yōu)選地,所述的灰度字符詞典生成裝置還包括第二級合成灰度退化字符圖像生成單元,用于在所述聚類單元所分出的多個聚類中的一個或多個聚類中的合成灰度退化字符圖像的數(shù)目小于預定值時,利用所述一個或多個聚類中的所述第一合成灰度退化字符圖像生成多個第二級合成灰度退化字符圖像,使所述一個或多個聚類中的所述合成灰度退化字符圖像的數(shù)目大于或等于預定值。
優(yōu)選地,所述聚類單元使用分級聚類法來劃分所述多個聚類。
所述灰度字符詞典生成裝置還可包括第一級合成灰度退化字符詞典生成單元,其利用所述轉(zhuǎn)換矩陣對所述各個聚類的模板進行線性轉(zhuǎn)換,從而生成第一級合成灰度字符詞典。
所述灰度字符詞典生成裝置還可包括輸入單元,用于向所述第一級合成灰度退化字符圖像生成單元輸入二值字符圖像。
所述第一級合成灰度退化字符圖像生成單元包含退化級別估算單元,用于估計需要生成的合成字符的退化級別,不同退化級別對應不同的退化程度;退化灰度字符生成單元,用來為輸入的各二值字符圖像分別生成對應于各個退化級別的合成灰度退化字符圖像。
優(yōu)選地,所述退化級別為3級或4級。
優(yōu)選地,所述轉(zhuǎn)換矩陣生成單元使用主成分分析法生成所述轉(zhuǎn)換矩陣。
優(yōu)選地,所述第二級合成灰度退化字符詞典生成單元使用主成分分析法構建各類合成灰度退化字符的特征空間。
如上所述,如果樣本收集得不夠,相應制作出來的詞典識別效果一般較差,由于樣本收集繁雜,因此往往無法得到足夠的樣本。本發(fā)明能夠自動生成大量灰度字符樣本,此外,本發(fā)明還利用了一種新的詞典制作方法,和傳統(tǒng)算法相比,識別性能更好。


為了進一步理解本發(fā)明而提供了附圖。

了本發(fā)明的實施例,其被引入說明書,構成了說明書的一部分并且與說明書一起說明本發(fā)明的原理。
圖1是本發(fā)明的整體流程圖;圖2是生成第一級合成字符的流程圖;圖3是聚類與模板生成的流程圖;圖4是生成第二級合成字符的流程圖;圖5示出了由退化級別估算單元估算出的退化級別所對應的退化灰度字符圖像。
具體實施例方式
本發(fā)明運用合成灰度字符圖像來生成灰度字符詞典。在本發(fā)明中,首先,使用第一級合成灰度字符圖像生成單元,根據(jù)從外部輸入的各個二值字符圖像,生成多個合成灰度退化字符圖像,并將這些合成灰度退化字符圖像中的每一類字符進行聚類,針對每一聚類,計算其模板,并對模板進行PCA分析,得到一個轉(zhuǎn)換矩陣。利用該轉(zhuǎn)換矩陣作用于各合成灰度退化字符,獲得各合成灰度退化字符的特征,然后,對各類字符的所有合成灰度退化字符的特征再次進行主成分分析,這樣就得到了第二級灰度退化字符字典。優(yōu)選地包括利用該轉(zhuǎn)換矩陣作用于各模板,生成第一級灰度退化字符詞典的步驟。另外,在各聚類中的樣本量小于預定值時,利用第二級合成灰度字符圖像生成單元擴充各類字符圖像樣本的數(shù)量,然后運用第一級灰度字符圖像生成單元和第二級灰度字符圖像生成單元生成的合成灰度字符圖像,生成與每種字符對應的第二級灰度字符詞典。
下面結(jié)合附圖詳細描述本發(fā)明的優(yōu)選實施例。
圖1是本發(fā)明的整體流程圖。如圖1所示,由輸入裝置101輸入N類字符構成的二值字符圖像101。字符的分類就是根據(jù)字符的形狀和意義進行的分類,比如一級日文漢字有3755個,就有3755類,同時,“-”是一個符號,雖然和漢字“一”形狀相似,但是具有不同的意義,因此屬于2個不同的類別。又例如,英文字母有52個類別(大小寫)。每類字符中,不同的字體分別對應不同的二值圖像。輸入的每一個二值字符圖像通過第一級合成灰度字符圖像生成單元102后生成若干個合成灰度退化字符圖像。因為識別的對象是實際的退化字符圖像,比如模糊的字符,小字符,因此需要用相似的模糊字符來制作詞典。這里輸入單元101可以是掃描儀、攝像機、照相機等或存儲有二值字符圖像的PDA(個人數(shù)字助理)、網(wǎng)絡上的遠程計算機、服務器等等,用于輸入的實際二值圖像。該輸入單元也可以是計算機的模塊,用于自動輸出理想二值字符圖像,這些都是本領域所公知的。在第一級合成灰度字符圖像生成單元102中生成合成灰度退化字符圖像。第一級合成灰度字符圖像生成單元102將在下面結(jié)合附圖2詳細描述。生成灰度退化字符圖像之后,由聚類單元103對所生成的每一類第一級合成灰度字符圖像進行聚類。然后由模板計算單元104為所生成的每一聚類計算模板。之后,由轉(zhuǎn)換矩陣生成單元105利用主成分分析法進行分析,生成轉(zhuǎn)換矩陣。
此外,當聚類單元103所生成的聚類中的一個聚類或多個聚類中的合成灰度退化字符數(shù)(樣本數(shù))少于預定值時,由第二級合成灰度退化字符生成單元為該聚類生成第二級合成灰度退化字符,使該聚類中的樣本數(shù)大于等于預定值,然后再由模板計算單元為該聚類計算模板。
下面詳細介紹各單元的工作。
圖2示出了第一級合成灰度字符圖像生成單元102的工作流程。如圖2所示,在第一級合成灰度字符圖像生成單元102中,首先在退化級別估算單元(未示出)中估算退化級別。退化級別估算單元的輸入是需要識別的字符圖像的實際字符大小,輸出的是估算的退化級別,這個退化級別用于生成合成灰度退化字符圖像。比如實際字符(待識別的真實退化字符圖象,即測試樣本)大小是20*20,如果退化級別取3級,則3個退化級別可以定為12*12,20*20,28*28。此處,可以根據(jù)實際測試樣本的尺度來決定退化級別,如果尺度較小,需要4級,否則3級就夠了,12*12是和測試樣本的實際大小相關的,在3級的情況下,第二級的尺度定為實際字符大小,第一級比第二級尺度小k,第三級比第二級大k,一般k=8。如果取4級,則第二級取16*16,第三級取24*24,第四級取32*32,第一級取8*8,如此類推。假設原始二值字符圖像(用來制作字典的樣本,即訓練樣本)的大小是64*64,合成灰度退化字符圖像的生成可以通過把64*64的圖像分別縮小到12*12,20*20,28*28,然后放大回64*64實現(xiàn)。雖然圖像的尺寸在變換前后沒有變化,但是3個圖像分別代表不同的退化級別。在對低分辨率字符進行識別時,N可以為3或4。如果分辨率足夠高(字符尺寸足夠大),利用現(xiàn)有的二值特征就可以解決識別問題。然后在每個退化級別,分別生成對應于各個二值字符圖像的合成灰度退化字符圖像(S202~S204)。生成合成灰度退化字符圖像的算法有許多種,其中最簡單的算法是將原始的二值圖像壓縮為小型灰度圖像,然后再將其放大回原始尺寸。這種方法是現(xiàn)有的技術,參考文獻如下J.Sun,Y.Hotta,Y.Katsuyama,S.Naoi,″Low resolution characterrecognition by dual eigenspace and synthetic degraded patterns″.Proceedingsof the lst ACM Hardcopy Document Processing Workshop,pp.15~222004,Washington DC。
還可以通過對原始圖像進行高斯濾波等方法來生成退化的灰度圖象。
即,假設原始二值字符圖像(事先已知的用來制作字典的二值圖像)的尺寸為64*64像素,N=3,且對低分辨率字符(就是需要處理的字符圖像)的識別尺寸為20*20像素,那么級別1,級別2和級別3的壓縮尺寸分別為12、20和28。單元102的輸出是與N個退化級別對應的一系列合成灰度退化字符圖像(S205)。圖5是示出了輸入的二值字符與對應于退化級別輸出的第一級合成灰度退化字符圖像的示例。
圖3示出了聚類和模板生成的過程的示例。如圖3所示,聚類單元將每一類合成灰度退化字符圖像分為Nclust個聚類。對于第j類字符(代表N類字符中的第j類,j=1,2,....,N)(S401),通過圖像聚類算法將其歸為Nclust個聚類(S402)。在R.O.Duda,P.E.Hart and D.G.Stork所著的“Pattern classification”(第二版,約翰·威利父子出版公司,威利電子期刊出版,2001.pp.550~557)一書中,列出了一種聚類算法的例子分級聚類法(Hierarchical clustering method)。該方法首先假設每個樣本都各自形成一個聚類,由于樣本的數(shù)目大于指定的聚類數(shù)目,因此需要對初始的聚類結(jié)果進行合并,在每一次合并過程中,距離最近的兩個類別被合并在一起。類別合并過程一直重復到合并以后的類別數(shù)目等于預先指定的聚類數(shù)目。
在經(jīng)過合成灰度退化字符圖像聚類的步驟之后,所有字符圖像被分為Nclust個聚類。然后,進行模板計算的步驟(S404),也就是用模板計算單元104得出每個聚類的模板409,模板是通過取每個聚類中所有樣本的平均值來得到的。模板就是屬于每一個類別的所有字符圖像的平均圖像。即該聚類中所有字符圖像的平均字符圖像(409)。記錄下該聚類中所有字符的索引號作為另一項,這是一個單獨的輸出410。比如在聚類以前有10個字符,索引號是從1~10,假設聚類成2類,第一類的索引號可以是1,3,7,8,9。第二類的索引號是2,4,5,6,10。本過程針對各類字符的各個聚類不斷重復(S403~S408),直到所有模板生成完畢。
另外,雖然通過第一級合成灰度字符圖像生成單元對應每一個原始二值字符圖像生成了N個退化字符圖像,但有時在聚類單元103生成的有一些聚類中只含有少數(shù)樣本。這樣的聚類一般都是該類字符中的特殊類型,如果該類字符的樣本數(shù)量不足,那么其字符識別效果將下降。因此設有第二級合成灰度字符圖像生成單元增加各類字符的字符樣本數(shù)量。也就是說,當在步驟S402中,所生成的聚類的樣本數(shù)小于預定值時,則利用第二級合成灰度字符圖像生成單元增加各類字符的字符樣本數(shù)量。圖4示出了第二級合成灰度字符圖像生成單元的具體流程。
如圖4所示,對于第j類字符的第i個聚類中字符的圖像(S410),如果其字符樣本數(shù)量小于既定的閾值Tchar,那么就在字符生成單元(S502)中根據(jù)該聚類數(shù)據(jù)生成合成灰度退化字符圖像。生成合成灰度退化字符圖像具體步驟如下假設第j類字符的第i個聚類中字符的數(shù)量為Nc,則1、如果Nc>=Tchar,其中Tchar為預定值,則輸出第j類字符的第i個聚類中字符的圖像并結(jié)束程序;否則執(zhí)行下列步驟2、按照下列公式計算出該聚類中針對樣本數(shù)小于Tchar的各個樣本生成的圖形的數(shù)量NpNp=(Tchar+Nc-1)/Nc3、生成與該聚類中各個字符相對應的Np個合成灰度退化字符圖像。
Np個合成灰度字符圖像可以通過把原來的灰度字符圖像進行縮小-放大操作實現(xiàn)。比如原來圖像的尺度是64*64,第一個合成灰度字符圖像可以通過把原來的圖像縮小到63*63,然后放大到64*64,第二個合成灰度字符圖像通過把原來圖像縮小到62*62,然后放大回64*64,...,第Np個合成灰度字符圖像通過把原來的字符圖像縮小到64-Np*64-Np,然后放大到64*64。如果Np大于64,則先把原來的字符尺度放大到128*128,然后再縮小。
4、輸出Np*Nc個合成灰度字符圖像,即最終輸出。
在經(jīng)過第二級合成灰度字符圖像生成步驟之后,所有聚類中的樣本數(shù)量均大于Tchar。對所有類別的字符進行以上的操作。
在聚類模板計算完成之后,如圖1所示,由轉(zhuǎn)換矩陣生成單元105生成轉(zhuǎn)換矩陣。這可以通過對所有類別的所有模板進行主成分分析(PCA(Principal Component Analysis))來完成。利用主成份分析可以獲得這些模板在高維空間中的分布,這個分布可以用主成份分析得到的一個轉(zhuǎn)換矩陣來表示A=[a1,a2,...,am]。主成分分析(PCA)的方法可以參考R.O.Duda,P.E.Hart and D.G.Stork所著的“Pattern classification”(第二版,約翰·威利父子出版公司,威利電子期刊出版,2001.pp.115~117,568~569)一書。
在生成轉(zhuǎn)換矩陣之后,就可以進行第一級灰度字符字典和第二級灰度字符字典的生成工作了。
首先介紹第一級灰度字符字典的生成。首先利用轉(zhuǎn)換矩陣對各模板進行線性變換(下文具體說明)。由各類字符生成的模板構建起所有字符圖像的第一級特征空間,即第一級詞典。
構建第一級別詞典的步驟具體描述如下。
假設Xij=[x1ij,x2ij,...,xnij]T,]]>表示第j類字符的第i個模板,其中n為該模板圖像的像素值,A=[a1,a2,...,am]是S302中獲得的主成分矩陣,ai是表示第i個主成分的n*1向量。然后,如下可得到第j類字符的第i個特征向量Fij=AT(Xij-μ)其中μ=Σi=1NcateΣj=1NclustXij/Ncate*Nclust]]>是所有模板的平均向量。
其中“T”表示向量的轉(zhuǎn)置,這里用來表示Xij=[x1ij,x2ij,...,xnij]T]]>是一個列向量。Ncate表示類別的數(shù)目,就是前面的N。Nclust表示每個類別的聚類數(shù)目。
由于每一類字符中都有Nclust個聚類(Nclust)模板,因此每一類字符的第一級灰度字符詞典中都有相應的Nclust個聚類的特征向量。
生成的第一級灰度字符詞典用于進行粗略的分類,對一個輸入待確定類別的字符圖像,首先利用PCA得到的線性變換對該字符圖像進行變換,得到該字符的特征,然后和第一級灰度字符詞典中所有模板的特征進行比對,輸出最相似的M個類別,由于這個步驟沒有確定一個唯一的類別,因此叫做粗略分類,后面的第二級詞典根據(jù)粗略分類的結(jié)果確定最后的類別。
為了取得更好的識別效果,本發(fā)明利用第二級灰度字符詞典生成單元107建立起各類字符的第二級灰度字符詞典。
具體步驟如下1.提取字符特征的步驟。假設第j類字符的第i個字符圖像為Gij=[g1ji,g2ji,...,gnji]T.]]>則通過如下公式獲得其字符特征fji=AT(Gji-μj),其中μj為第j類字符的平均字符圖像。
2.構建特征空間的步驟。運用第j類字符中所有字符圖像的特征fji,其中包括在第一級合成灰度字符圖像生成單元和第二級合成灰度字符圖像生成單元中生成的所有樣本構建起該類字符的特征空間。利用PCA對屬于同一個字符類別的所有字符圖像的特征(包括由第一級合成灰度字符圖像生成單元和第二級合成灰度字符圖像生成單元產(chǎn)生的灰度退化字符圖像的特征)進行分析,得到這些特征在高維空間中的分布,并用一個線性變換矩陣來代表該分布。每個類別所對應的線性變換矩陣就是第二級灰度字符詞典。
如上所述,如果樣本收集得不夠多,相應制作出來的詞典識別效果一般較差,由于樣本收集繁雜,因此在現(xiàn)有技術中往往無法得到足夠的樣本。本發(fā)明能夠自動生成大量灰度字符樣本,此外,本發(fā)明還利用了一種新的詞典制作方法,和傳統(tǒng)算法相比,識別性能更好。
顯然,本領域的技術人員可以在不脫離本發(fā)明的精神或范圍對本發(fā)明進行各種修改和變型。因此,如果本發(fā)明的這些修改和變型落入了所附權利要求書及其等同物的范圍,則本發(fā)明就覆蓋它們。
權利要求
1.一種灰度字符詞典生成裝置,其特征在于,包括第一級合成灰度退化字符圖像生成單元,用于利用輸入于其中的各二值字符圖像生成多個第一級合成灰度退化字符圖像;聚類單元,用于將所述第一級合成灰度退化字符圖像生成單元生成的每一類第一級合成灰度退化字符圖像分為多個聚類;模板計算單元,用于為每一個所述聚類生成模板;轉(zhuǎn)換矩陣生成單元,用于針對各模板生成轉(zhuǎn)換矩陣;第二級合成灰度退化字符詞典生成單元,用于利用所述轉(zhuǎn)換矩陣獲取每個聚類中的每個灰度退化字符的字符特征,并構建各類合成灰度退化字符的特征空間,即第二級合成灰度字符詞典。
2.根據(jù)權利要求1所述的灰度字符詞典生成裝置,其特征在于,還包括第二級合成灰度退化字符圖像生成單元,用于在所述聚類單元所分出的多個聚類中的一個或多個聚類中的合成灰度退化字符圖像的數(shù)目小于預定值時,利用所述一個或多個聚類中的所述第一級合成灰度退化字符圖像生成多個第二級合成灰度退化字符圖像,使所述一個或多個聚類中的所述合成灰度退化字符圖像的數(shù)目大于或等于預定值。
3.根據(jù)權利要求1所述的灰度字符詞典生成裝置,其特征在于,所述聚類單元使用分級聚類法來劃分所述多個聚類。
4.根據(jù)權利要求1、2或3所述的灰度字符詞典生成裝置,其特征在于,還包括第一級合成灰度退化字符詞典生成單元,其利用所述轉(zhuǎn)換矩陣對所述各個聚類的模板進行線性轉(zhuǎn)換,從而生成第一級合成灰度字符詞典。
5.根據(jù)權利要求1、2或3所述的灰度字符詞典生成裝置,其特征在于,還包括輸入單元,用于向所述第一級合成灰度退化字符圖像生成單元輸入二值字符圖像。
6.根據(jù)權利要求1、2或3所述的灰度字符詞典生成裝置,其特征在于,所述第一級合成灰度退化字符圖像生成單元包含退化級別估算單元,用于估計需要生成的合成字符的退化級別,不同退化級別對應不同的退化程度;退化灰度字符生成單元,用來為輸入的各二值字符圖像分別生成對應于各個退化級別的合成灰度退化字符圖像。
7.根據(jù)權利要求6所述的灰度詞典生成裝置,其特征在于,所述退化級別為3級或4級。
8.根據(jù)權利要求1、2或3所述的灰度詞典生成裝置,其特征在于,所述轉(zhuǎn)換矩陣生成單元使用主成分分析法生成所述轉(zhuǎn)換矩陣。
9.根據(jù)權利要求1、2或3所述的灰度詞典生成裝置,其特征在于,所述第二級合成灰度退化字符詞典生成單元使用主成分分析法構建各類合成灰度退化字符的特征空間。
10.根據(jù)權利要求4所述的灰度詞典生成裝置,其特征在于,所述第一級合成灰度退化字符圖像生成單元包含退化級別估算單元,用于估計需要生成的合成字符的退化級別,不同退化級別對應不同的退化程度;退化灰度字符生成單元,用來為輸入的各二值退化字符圖像分別生成對應于各個退化級別的合成灰度退化字符圖像;所述轉(zhuǎn)換矩陣生成單元使用主成分分析法生成所述轉(zhuǎn)換矩陣;所述第二級合成灰度退化字符詞典生成單元使用主成分分析法構建各類合成灰度退化字符的特征空間。
全文摘要
一種灰度字符詞典生成裝置,包括第一級合成灰度退化字符圖像生成單元,用于利用輸入于其中的各二值字符圖像生成第一級合成灰度退化字符圖像;聚類單元,用于將所述第一級合成灰度退化字符圖像生成單元生成的每一類第一級合成灰度退化字符圖像分為多個聚類;模板計算單元,用于為每一個所述聚類生成模板;轉(zhuǎn)換矩陣計算單元,用于針對各模板生成轉(zhuǎn)換矩陣;第二級合成灰度退化字符詞典生成單元,利用所述轉(zhuǎn)換矩陣獲取每個聚類中的每個灰度退化字符的字符特征,構建各類合成灰度退化字符的特征空間,即第二級合成灰度字符詞典。
文檔編號G06K9/72GK1804869SQ200510000439
公開日2006年7月19日 申請日期2005年1月11日 優(yōu)先權日2005年1月11日
發(fā)明者孫俊, 堀田悅伸, 勝山裕, 直井聰 申請人:富士通株式會社
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1