專(zhuān)利名稱(chēng):自適應(yīng)脫機(jī)手寫(xiě)識(shí)別方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬于文字處理領(lǐng)域,涉及一種脫機(jī)手寫(xiě)識(shí)別方法和裝置,具體涉及一種自適應(yīng)脫機(jī)手寫(xiě)識(shí)別方法和裝置。
背景技術(shù):
現(xiàn)有技術(shù)中,脫機(jī)手寫(xiě)研究的熱點(diǎn)集中于各種切分方法和單字識(shí)別方法,然而每個(gè)人書(shū)寫(xiě)習(xí)慣相對(duì)固定,在用戶(hù)書(shū)寫(xiě)的同一篇文檔中,往往字符的寬度、寬高比、字符間距、 傾斜的程度等信息都相對(duì)固定。目前的手寫(xiě)識(shí)別方法按照先對(duì)字符進(jìn)行過(guò)切分,然后根據(jù)幾何、識(shí)別和語(yǔ)義的信息進(jìn)行合并,查找最優(yōu)的合并路徑進(jìn)行識(shí)別,這樣用于分析判斷的幾何模型相對(duì)固化,體現(xiàn)不出用戶(hù)的書(shū)寫(xiě)習(xí)慣,降低了識(shí)別效果。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問(wèn)題是提出一種自適應(yīng)脫機(jī)手寫(xiě)識(shí)別方法和裝置,根據(jù)幾何模型與語(yǔ)義識(shí)別模型的背離度和幾何模型的離散程度進(jìn)行評(píng)價(jià),并對(duì)幾何模型進(jìn)行相應(yīng)的調(diào)整后進(jìn)行手寫(xiě)識(shí)別。經(jīng)過(guò)調(diào)整后的幾何模型降低了幾何特征的影響,保證了幾何模型能夠?qū)崟r(shí)的調(diào)整,符合圖像中字符的書(shū)寫(xiě)特點(diǎn)。本發(fā)明公開(kāi)了一種自適應(yīng)脫機(jī)手寫(xiě)識(shí)別方法,包括如下步驟步驟1 識(shí)別并過(guò)切分文本中的樣本文字,得到過(guò)切分塊,計(jì)算過(guò)切分塊中的最優(yōu)合并路徑,并得到各文本行中最優(yōu)合并路徑上字塊的字塊評(píng)價(jià);步驟2 根據(jù)樣本文字中各文本行中字塊的字塊評(píng)價(jià)分別評(píng)估文本行對(duì)應(yīng)的幾何-識(shí)別語(yǔ)義背離度和幾何模型的離散程度,進(jìn)而對(duì)文本行對(duì)應(yīng)的幾何模型進(jìn)行調(diào)整,根據(jù)調(diào)整后的幾何模型對(duì)步驟1識(shí)別出的字符進(jìn)行調(diào)整。所述步驟1中計(jì)算過(guò)切分塊中的最優(yōu)合并路徑時(shí),對(duì)于各合并路徑中合并后的字塊分別進(jìn)行綜合評(píng)價(jià)后進(jìn)行加權(quán)求和,分別得到對(duì)應(yīng)的各合并路徑的評(píng)價(jià),評(píng)價(jià)最高的路徑為最優(yōu)合并路徑。
所述步驟1中字塊評(píng)價(jià)包括字塊對(duì)應(yīng)的幾何評(píng)價(jià)、語(yǔ)義評(píng)價(jià)和識(shí)別評(píng)價(jià);所述步驟2中對(duì)幾何模型進(jìn)行調(diào)整時(shí),如果文本行對(duì)應(yīng)的幾何-識(shí)別語(yǔ)義背離度大于經(jīng)驗(yàn)閾值,則將文本行對(duì)應(yīng)幾何模型的離散程度最大的幾何特征的權(quán)重進(jìn)行調(diào)整。所述離散程度最大的幾何特征的權(quán)重進(jìn)行調(diào)整時(shí),降低離散程度最大的幾何特征的權(quán)重,并對(duì)幾何模型的所有幾何特征進(jìn)行歸一化。所述降低離散程度最大的幾何特征的權(quán)重時(shí),調(diào)整因子為0.05至0.2之間的浮點(diǎn)數(shù)。所述文本行對(duì)應(yīng)的幾何-識(shí)別語(yǔ)義背離度采用交叉熵進(jìn)行度量。所述幾何模型的離散程度采用幾何模型的各幾何特征分別的方差進(jìn)行度量。所述經(jīng)驗(yàn)閾值在15至25之間。。
本發(fā)明還公開(kāi)了一種自適應(yīng)脫機(jī)手寫(xiě)識(shí)別裝置,包括如下模塊評(píng)價(jià)模塊識(shí)別并過(guò)切分文本中的樣本文字,得到過(guò)切分塊,計(jì)算過(guò)切分塊中的最優(yōu)合并路徑,并得到各文本行中最優(yōu)合并路徑上字塊的字塊評(píng)價(jià);調(diào)整模塊根據(jù)樣本文字中各文本行中字塊的字塊評(píng)價(jià)分別評(píng)估文本行對(duì)應(yīng)的幾何-識(shí)別語(yǔ)義背離度和幾何模型的離散程度,進(jìn)而對(duì)文本行對(duì)應(yīng)的幾何模型進(jìn)行調(diào)整,根據(jù)調(diào)整后的幾何模型對(duì)評(píng)價(jià)模塊識(shí)別出的字符進(jìn)行調(diào)整。本發(fā)明自適應(yīng)脫機(jī)手寫(xiě)識(shí)別方法和裝置的優(yōu)點(diǎn)在于根據(jù)樣本文字的字塊評(píng)價(jià), 逐步調(diào)整文字對(duì)應(yīng)幾何模型,使對(duì)應(yīng)的幾何特征得到不斷地改善,達(dá)到充分表達(dá)書(shū)寫(xiě)人的書(shū)寫(xiě)習(xí)慣,經(jīng)過(guò)調(diào)整后的幾何模型降低了幾何特征的影響,保證了幾何模型能夠?qū)崟r(shí)的調(diào)整,符合圖像中字符的書(shū)寫(xiě)特點(diǎn),從而達(dá)到提高識(shí)別效果的目的。
圖1為本發(fā)明自適應(yīng)脫機(jī)手寫(xiě)識(shí)別方法和裝置的手寫(xiě)樣本文字;圖2為本發(fā)明自適應(yīng)脫機(jī)手寫(xiě)識(shí)別方法和裝置的方法流程圖;圖3為本發(fā)明自適應(yīng)脫機(jī)手寫(xiě)識(shí)別方法和裝置實(shí)施例中過(guò)切分塊的示意圖;圖4為本發(fā)明自適應(yīng)脫機(jī)手寫(xiě)識(shí)別方法和裝置的實(shí)例中第一行圖像的最優(yōu)合并路徑及其識(shí)別結(jié)果;圖5為本發(fā)明自適應(yīng)脫機(jī)手寫(xiě)識(shí)別方法和裝置中最優(yōu)路徑中對(duì)應(yīng)各字符塊的字塊評(píng)價(jià)結(jié)果;圖6為本發(fā)明自適應(yīng)脫機(jī)手寫(xiě)識(shí)別方法和裝置中幾何模型的幾何參數(shù)調(diào)整示意圖;圖7為圖1所示的第8行文字在未經(jīng)調(diào)整過(guò)的幾何模型下的識(shí)別結(jié)果;圖8為本發(fā)明自適應(yīng)脫機(jī)手寫(xiě)識(shí)別方法和裝置中幾何模型前后對(duì)應(yīng)的字塊評(píng)價(jià)對(duì)比圖;圖9為本發(fā)明自適應(yīng)脫機(jī)手寫(xiě)識(shí)別方法和裝置中圖1所示的第8行文字在調(diào)整后的幾何模型下的識(shí)別結(jié)果。
具體實(shí)施例方式為使本發(fā)明的上述目的、特征和優(yōu)點(diǎn)能夠更加明顯易懂,下面結(jié)合附圖和具體實(shí)施方式
對(duì)本發(fā)明作進(jìn)一步詳細(xì)的說(shuō)明。本發(fā)明提出了一種自適應(yīng)脫機(jī)手寫(xiě)識(shí)別方法和裝置,根據(jù)幾何模型與語(yǔ)義識(shí)別模型的背離度和幾何模型的離散程度去考察是否當(dāng)前幾何模型能充分體現(xiàn)該書(shū)寫(xiě)人的書(shū)寫(xiě)習(xí)慣,然后對(duì)幾何模型進(jìn)行相應(yīng)的調(diào)整。本發(fā)明充分利用了書(shū)寫(xiě)人不變這一重要特征,利用已識(shí)別的字符來(lái)不斷地改進(jìn)幾何模型對(duì)人的書(shū)寫(xiě)習(xí)慣的擬合度,達(dá)到提升識(shí)別效果的目的,下面給出一個(gè)具體的實(shí)施實(shí)例,以圖1所示的樣本文字為例。本發(fā)明公開(kāi)了一種自適應(yīng)脫機(jī)手寫(xiě)識(shí)別方法,如圖2所示,包括以下步驟步驟1 識(shí)別并過(guò)切分文本中的樣本文字,得到過(guò)切分塊,計(jì)算過(guò)切分塊中的最優(yōu)合并路徑,并得到各文本行中最優(yōu)合并路徑上字塊的字塊評(píng)價(jià);
字塊評(píng)價(jià)包括字塊對(duì)應(yīng)的幾何評(píng)價(jià)、語(yǔ)義評(píng)價(jià)和識(shí)別評(píng)價(jià)。從整篇文檔中選取一行或者多行文字作為樣本文字進(jìn)行識(shí)別,對(duì)樣本文字進(jìn)行過(guò)切分,對(duì)得到的過(guò)切分塊中前k 條最優(yōu)合并路徑,并且記錄各路徑上每個(gè)字塊對(duì)應(yīng)的幾何評(píng)價(jià)、語(yǔ)義評(píng)價(jià)和識(shí)別評(píng)價(jià)。字塊的幾何評(píng)價(jià)表示某個(gè)字塊符合幾何模型的程度,通過(guò)對(duì)字塊的各種幾何特征加權(quán)得到。幾何模型表示將字塊判斷為字符在幾何上應(yīng)該具備的特點(diǎn),由一組脫機(jī)手寫(xiě)文字的幾何特征組成,通常包括過(guò)切分塊中字塊的寬、字塊的寬高比、字塊的內(nèi)間距、字塊的外間距等等,每組幾何特征包含一個(gè)閾值Thri和幾何特征對(duì)應(yīng)的權(quán)重Wei”本實(shí)施例中,初始的幾何模型通過(guò)對(duì)大量樣本訓(xùn)練得到,包含N組的幾何特征,設(shè)某個(gè)字塊的字寬的評(píng)分為Gem1,字塊的寬高比的評(píng)分為Gem2、字塊的連通度評(píng)分為Gem3、字
塊的外間距評(píng)分為Gem4.....GemN,字塊的幾何評(píng)價(jià)Peem由如公式(1)所示,該公式對(duì)字符
的各種幾何特征評(píng)價(jià)進(jìn)行整合,分別將字塊的各幾何特征Gemi與幾何特征閾值Thri進(jìn)行比較。幾何特征的權(quán)重Weii表示該字塊在對(duì)應(yīng)的幾何特征GemiI為字符的概率,根據(jù)概率進(jìn)行加權(quán)求和后在
之間進(jìn)行歸一化。
權(quán)利要求
1.一種自適應(yīng)脫機(jī)手寫(xiě)識(shí)別方法,其特征在于,包括如下步驟步驟1 識(shí)別并過(guò)切分文本中的樣本文字,得到過(guò)切分塊,計(jì)算過(guò)切分塊中的最優(yōu)合并路徑,并得到各文本行中最優(yōu)合并路徑上字塊的字塊評(píng)價(jià);步驟2:根據(jù)樣本文字中各文本行中字塊的字塊評(píng)價(jià)分別評(píng)估各文本行對(duì)應(yīng)的幾何-識(shí)別語(yǔ)義背離度和幾何模型的離散程度,進(jìn)而對(duì)文本行對(duì)應(yīng)的幾何模型進(jìn)行調(diào)整,根據(jù)調(diào)整后的幾何模型對(duì)步驟1識(shí)別出的字符進(jìn)行調(diào)整。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于所述步驟1中計(jì)算過(guò)切分塊中的最優(yōu)合并路徑時(shí),對(duì)于各合并路徑中合并后的字塊分別進(jìn)行評(píng)價(jià)后進(jìn)行加權(quán)求和,分別得到對(duì)應(yīng)的各合并路徑的評(píng)價(jià),評(píng)價(jià)最高的路徑為最優(yōu)合并路徑。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于所述步驟1中字塊評(píng)價(jià)包括字塊對(duì)應(yīng)的幾何評(píng)價(jià)、語(yǔ)義評(píng)價(jià)和識(shí)別評(píng)價(jià)。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于所述步驟2中對(duì)幾何模型進(jìn)行調(diào)整時(shí),如果文本行對(duì)應(yīng)的幾何-識(shí)別語(yǔ)義背離度大于經(jīng)驗(yàn)閾值,則將文本行對(duì)應(yīng)幾何模型的離散程度最大的幾何特征的權(quán)重進(jìn)行調(diào)整。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于所述離散程度最大的幾何特征的權(quán)重進(jìn)行調(diào)整時(shí),采用調(diào)整因子降低離散程度最大的幾何特征的權(quán)重,并對(duì)幾何模型的所有幾何特征進(jìn)行歸一化。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于所述降低離散程度最大的幾何特征的權(quán)重時(shí),調(diào)整因子為0. 05至0. 2之間的浮點(diǎn)數(shù)。
7.根據(jù)權(quán)利要求4所述的方法,其特征在于所述文本行對(duì)應(yīng)的幾何-識(shí)別語(yǔ)義背離度采用交叉熵進(jìn)行度量。
8.根據(jù)權(quán)利要求4所述的方法,其特征在于所述幾何模型的離散程度分別采用幾何模型的各幾何特征的方差進(jìn)行度量。
9.根據(jù)權(quán)利要求4所述的方法,其特征在于所述經(jīng)驗(yàn)閾值在15至25之間。
10.一種自適應(yīng)脫機(jī)手寫(xiě)識(shí)別裝置,其特征在于,包括如下模塊評(píng)價(jià)模塊識(shí)別并過(guò)切分文本中的樣本文字,得到過(guò)切分塊,計(jì)算過(guò)切分塊中的最優(yōu)合并路徑,并得到各文本行中最優(yōu)合并路徑上字塊的字塊評(píng)價(jià);調(diào)整模塊根據(jù)樣本文字中各文本行中字塊的字塊評(píng)價(jià)分別評(píng)估文本行對(duì)應(yīng)的幾何-識(shí)別語(yǔ)義背離度和幾何模型的離散程度,進(jìn)而對(duì)文本行對(duì)應(yīng)的幾何模型進(jìn)行調(diào)整,根據(jù)調(diào)整后的幾何模型對(duì)評(píng)價(jià)模塊識(shí)別出的字符進(jìn)行調(diào)整。
全文摘要
本發(fā)明一種自適應(yīng)脫機(jī)手寫(xiě)識(shí)別方法和裝置,屬于文字處理領(lǐng)域。本發(fā)明的方法包括識(shí)別并過(guò)切分文檔中的樣本文字,得到過(guò)切分塊,計(jì)算過(guò)切分塊中的最優(yōu)合并路徑,并得到各文本行中最優(yōu)合并路徑上字塊的字塊評(píng)價(jià);分別評(píng)估各文本行對(duì)應(yīng)的幾何-識(shí)別語(yǔ)義背離度和幾何模型的離散程度,進(jìn)而對(duì)文本行對(duì)應(yīng)的幾何模型進(jìn)行調(diào)整,根據(jù)調(diào)整后的幾何模型對(duì)識(shí)別出的字符進(jìn)行調(diào)整。本方法根據(jù)樣本文字的字塊評(píng)價(jià),逐步調(diào)整文字對(duì)應(yīng)幾何模型,使對(duì)應(yīng)的幾何特征得到不斷地改善,達(dá)到充分表達(dá)書(shū)寫(xiě)人的書(shū)寫(xiě)習(xí)慣,經(jīng)過(guò)調(diào)整后的幾何模型降低了幾何特征的影響,保證了幾何模型能夠?qū)崟r(shí)的調(diào)整,符合圖像中字符的書(shū)寫(xiě)特點(diǎn),從而達(dá)到提高了識(shí)別效果。
文檔編號(hào)G06K9/68GK102314616SQ20101022326
公開(kāi)日2012年1月11日 申請(qǐng)日期2010年6月30日 優(yōu)先權(quán)日2010年6月30日
發(fā)明者王琛 申請(qǐng)人:漢王科技股份有限公司