專利名稱:一種漢字書寫計(jì)算機(jī)教學(xué)方法
技術(shù)領(lǐng)域:
本發(fā)明涉及計(jì)算機(jī)藝術(shù)與美學(xué)以及人工智能領(lǐng)域,尤其涉及一種針對(duì)漢字書 寫的計(jì)算機(jī)輔助教學(xué)方法。
背景技術(shù):
已經(jīng)有大量的工作來模擬人類的藝術(shù)思維,并進(jìn)一步建立計(jì)算機(jī)智能系統(tǒng)以
解決真實(shí)世界里的問題。在中文字方面,1995年的Proceedings of the International Conference on Computer Processing of Oriental Languages (ICCPOL)會(huì)議論文集 (文章標(biāo)題"Chinese glyph generation using character composition and beauty evaluation metrics")公布了 一個(gè)使用啟發(fā)式的方法來嘗試定量評(píng)估中文字體美感 的問題他們定義了在漢字寫作里的四條規(guī)則,并實(shí)現(xiàn)到了他們基于規(guī)則的美 學(xué)評(píng)分模塊中;這一模塊簡(jiǎn)單地對(duì)四條規(guī)則逐一計(jì)算相應(yīng)的分?jǐn)?shù),并得到他們 的加權(quán)和。2005年的IEEE Intelligent Systems雜志(文章標(biāo)題"Automatic generation of artistic Chinese calligraphy",以下簡(jiǎn)稱文獻(xiàn)IS2005)刊登了一個(gè)中 國(guó)藝術(shù)書法的自動(dòng)生成系統(tǒng)。但是,他們的工作主要關(guān)注在使用基于約束的推 理來生成格式化的中文字體,而幾乎沒有關(guān)注到這些生成結(jié)果如何具有美感。
為了獲得更好的計(jì)算機(jī)中文字體生成結(jié)果,也為了嘗試對(duì)美學(xué)做定量計(jì)算, 我們通過學(xué)習(xí)基本數(shù)值關(guān)系背后的訓(xùn)練集從而實(shí)現(xiàn)了漢字美觀度評(píng)分。許多在 工作中使用過專家系統(tǒng)的人知道,高級(jí)的專家規(guī)則并不總能正常工作;而有時(shí) 這并不一定是由于專家系統(tǒng)本身的知識(shí)盲點(diǎn),或者問題根本無法總結(jié)。因此我 們覺得,我們基于學(xué)習(xí)技術(shù)的數(shù)據(jù)驅(qū)動(dòng)方法可以提供一種比人類專家的大腦評(píng) 測(cè)更好的機(jī)器評(píng)價(jià)能力。
在繪畫方面,計(jì)算機(jī)圖形學(xué)領(lǐng)域中同樣有一些研究自動(dòng)繪畫創(chuàng)作的工作, 但這大都是在給定一幅照片的基礎(chǔ)上完成的。其他也有人探索了結(jié)合人工智能 和人機(jī)交互技術(shù)來創(chuàng)作繪畫風(fēng)格的動(dòng)畫,如2006年ACM學(xué)報(bào)ACM Trans. Graph 干ll登的文章"Animating Chinese paintings through stroke-based decomposition,,用筆 劃分解的方法來實(shí)現(xiàn)動(dòng)態(tài)的繪畫。在視覺藝術(shù)領(lǐng)域之外,計(jì)算機(jī)音樂是另一個(gè) 應(yīng)用人工智能技術(shù)來進(jìn)行或協(xié)助創(chuàng)作的成功方向。在2007年的國(guó)際人工智能聯(lián) 合大會(huì)(IJCAI2007)上,有一個(gè)獨(dú)立的專題叫音樂人工智能(MUSIC-AI2007) 來專門研討這一話題。值得注意的是,對(duì)于計(jì)算機(jī)音樂的研究包括自動(dòng)音樂創(chuàng) 作與音樂評(píng)價(jià),這與我們?cè)谥形淖煮w上的思路比較相似。此外還有其他大量的
研究工作如故事創(chuàng)作,可信執(zhí)法官,互動(dòng)式故事,等等,都旨在捕捉美學(xué)的
可計(jì)算性。
發(fā)明內(nèi)容
本發(fā)明的目的是克服現(xiàn)有技術(shù)的不足,提供一種針對(duì)漢字書寫的計(jì)算機(jī)輔 助教學(xué)方法。
一種針對(duì)漢字書寫的計(jì)算機(jī)輔助教學(xué)方法包括以下步驟
1) 預(yù)先對(duì)每個(gè)漢字的手寫體樣本的特征和美觀度進(jìn)行人工評(píng)分;
2) 通過計(jì)算機(jī)輸入設(shè)備接受習(xí)作用戶的手寫字體輸入,并使用圖像處理的方 法將用戶手寫字體參數(shù)化;
3) 使用漢字書寫形態(tài)美觀度的計(jì)算機(jī)自動(dòng)評(píng)估方法,對(duì)用戶的手寫字體進(jìn)行 評(píng)分;
4) 將用戶的手寫字體參數(shù)化,將其轉(zhuǎn)化成以若干標(biāo)準(zhǔn)字體的參數(shù)向量線性之 和來表示,使用一個(gè)非線性規(guī)劃的最優(yōu)化方法,反復(fù)調(diào)整插值系數(shù)從而不斷提 高新字體的美觀度評(píng)分,在保留用戶字跡特征基礎(chǔ)上,指導(dǎo)用戶改善自己的手 寫字體美觀度;也可以由用戶指定僅僅為字體某一局部或整體結(jié)構(gòu)作出指導(dǎo)。
所述的預(yù)先對(duì)每個(gè)漢字的手寫體樣本的特征和美觀度進(jìn)行人工評(píng)分步驟
(1) 通過多人調(diào)查方式,讓多個(gè)人各自對(duì)來自100個(gè)漢字的單筆劃圖像做評(píng) 分,評(píng)分結(jié)果為"好"、"一般"、"差"三種其中之一;綜合所有人的評(píng)分結(jié)果,計(jì) 算該筆劃的分?jǐn)?shù)概率,艮卩分別統(tǒng)計(jì)將筆劃評(píng)分為"好"、"一般"、"差"的人數(shù), 除以總?cè)藬?shù),所得三個(gè)百分?jǐn)?shù)分別為該筆劃美觀度為"好"、"一般"、"差,,的概率, 獲得500 2000個(gè)單筆劃的美觀度的人工評(píng)價(jià)結(jié)果;
(2) 通過多人調(diào)查方式,讓多個(gè)人分別對(duì)漢字的內(nèi)部結(jié)構(gòu)美觀度做評(píng)分,評(píng) 分結(jié)果為"好"、"一般"、"差"三種其中之一;綜合所有人的評(píng)分結(jié)果,計(jì)算該字 體的分?jǐn)?shù)概率,即分別統(tǒng)計(jì)將字體評(píng)分為"好"、"一般"、"差"的人數(shù),分別將 其除以總?cè)藬?shù),所得百分?jǐn)?shù)分別為該字體分?jǐn)?shù)為"好"、"一般"、"差"的概率;通 過這樣的方式獲得500 2000個(gè)字體空間結(jié)構(gòu)美觀度的人工評(píng)價(jià)結(jié)果;
(3) 通過多人調(diào)査方式,讓多個(gè)人分別對(duì)多個(gè)漢字圖像的風(fēng)格一致性做評(píng)分, 評(píng)分結(jié)果為"好"、"一般"、"差"三種其中之一;綜合所有人的評(píng)分結(jié)果,計(jì)算該 字體的分?jǐn)?shù)概率,艮卩分別統(tǒng)計(jì)將該字評(píng)分為"好"、"一般"、"差,,的人數(shù),分別 將其除以總?cè)藬?shù),所得百分?jǐn)?shù)分別為該該字分?jǐn)?shù)為"好"、"一般"、"差"的概率; 通過這樣的方式獲得100 300個(gè)漢字字體風(fēng)格一致性的人工評(píng)價(jià)結(jié)果。
所述的通過計(jì)算機(jī)輸入設(shè)備接受習(xí)作用戶的手寫字體輸入,并使用圖像處
理的方法將用戶手寫字體參數(shù)化步驟
(4) 利用計(jì)算機(jī)輸入設(shè)備,如鼠標(biāo)、手寫筆,接受用戶的手寫字體,以數(shù)字 圖像的方式存儲(chǔ);
(5) 若用戶手寫了多個(gè)漢字,將用戶的手寫字體分割成若干個(gè)單字體,并將 每個(gè)單字體圖像轉(zhuǎn)化為相同尺寸的點(diǎn)陣二值黑白圖像;
(6) 對(duì)每個(gè)漢字圖像做細(xì)化,筆劃分解,提取出其軌跡與書寫寬度特征,以
參數(shù)向量的形式表示每個(gè)漢字圖像。
所述的對(duì)每個(gè)漢字圖像做細(xì)化,筆劃分解,提取出其軌跡與書寫寬度特征,
以參數(shù)向量的形式表示每個(gè)漢字圖像步驟
a) 對(duì)漢字圖像做細(xì)化處理,以獲得該字的骨架圖像;
b) 將該字與其標(biāo)準(zhǔn)楷書字體做筆劃匹配,用啟發(fā)式搜索的方法找出骨架各部 分與標(biāo)準(zhǔn)筆劃的一一對(duì)應(yīng)關(guān)系,完成骨架上的筆劃分解;
c) 對(duì)每筆劃上的各骨架點(diǎn),以其為圓心畫橢圓,使該橢圓盡量大而又不包含 任何原字體圖像上的空白部分,該筆劃的所有橢圓區(qū)域總和即為筆劃分解所得 的圖像輪廓;
d) 將所有橢圓的長(zhǎng)短軸、圓心列為一個(gè)矩陣,即為該字體的參數(shù)向量; 所述的使用一種漢字書寫形態(tài)美觀度的計(jì)算機(jī)自動(dòng)評(píng)估方法,對(duì)用戶的手
寫字體進(jìn)行評(píng)分步驟
C7)以預(yù)先獲得的單筆劃美觀度人工評(píng)分結(jié)果為訓(xùn)練集,使用人工神經(jīng)網(wǎng)絡(luò)、 決策樹、模糊邏輯或支持向量機(jī)來訓(xùn)練并獲得字體單筆劃形態(tài)與其美觀度評(píng)價(jià) 結(jié)果間的映射關(guān)系,然后使用訓(xùn)練后的學(xué)習(xí)器對(duì)字體單筆劃美觀度進(jìn)行評(píng)分;
(8) 以預(yù)先獲得的字體內(nèi)部結(jié)構(gòu)美觀度人工評(píng)分結(jié)果為訓(xùn)練集,使用人工神 經(jīng)網(wǎng)絡(luò)、決策樹、模糊邏輯或支持向量機(jī)來訓(xùn)練并獲得字體內(nèi)部結(jié)構(gòu)特征與其 美觀度評(píng)價(jià)結(jié)果間的映射關(guān)系,然后使用訓(xùn)練后的學(xué)習(xí)器對(duì)字體內(nèi)部結(jié)構(gòu)進(jìn)行 評(píng)分,其中,字體內(nèi)部結(jié)構(gòu)包括字體各內(nèi)部筆劃或偏旁部首元素間的拓?fù)潢P(guān)系、 相對(duì)位置關(guān)系、面積遮蓋關(guān)系,以及筆劃與筆劃、筆劃與偏旁部首之間的空間 位置關(guān)系與該字的標(biāo)準(zhǔn)字體的差異,實(shí)現(xiàn)對(duì)字體內(nèi)的各部分空間結(jié)構(gòu)分布的美 觀度評(píng)分;
(9) 以預(yù)先獲得的字體風(fēng)格一致性人工評(píng)分結(jié)果為訓(xùn)練集,使用人工神經(jīng)網(wǎng) 絡(luò)、決策樹、模糊邏輯或支持向量機(jī)來訓(xùn)練并獲得字體風(fēng)格一致性特征與其美 觀度評(píng)價(jià)結(jié)果間的映射關(guān)系,使用訓(xùn)練后的學(xué)習(xí)器對(duì)字體風(fēng)格一致性進(jìn)行評(píng)分; 對(duì)字體各個(gè)內(nèi)部筆劃或偏旁部首元素計(jì)算出與該字多種已知風(fēng)格字體的相似
度,并以此確定該字體的風(fēng)格一致性評(píng)分;
(IO)根據(jù)對(duì)漢字進(jìn)行的單筆劃美觀度評(píng)分、內(nèi)部結(jié)構(gòu)美觀度評(píng)分、風(fēng)格一致 性評(píng)分,應(yīng)用統(tǒng)計(jì)學(xué)習(xí)方法綜合各項(xiàng)得分,獲得該字體的總體美觀度評(píng)分。
所述的以預(yù)先獲得的單筆劃美觀度人工評(píng)分結(jié)果為訓(xùn)練集,使用人工神經(jīng) 網(wǎng)絡(luò)、決策樹、模糊邏輯或支持向量機(jī)來訓(xùn)練并獲得字體單筆劃形態(tài)與其美觀 度評(píng)價(jià)結(jié)果間的映射關(guān)系,然后使用訓(xùn)練后的學(xué)習(xí)器對(duì)字體單筆劃美觀度進(jìn)行
評(píng)分步驟
e) 以預(yù)先獲得單筆劃美觀度人工評(píng)分的各筆劃的楷書體圖像作為該筆劃的 標(biāo)準(zhǔn)筆劃;將這些單筆劃圖像參數(shù)化,即提取出它們的輪廓、軌跡、位置信號(hào), 轉(zhuǎn)換成向量的形式,對(duì)這些向量進(jìn)行預(yù)處理,去除噪音,并進(jìn)一步抽取特征向 量,對(duì)獲得的特征向量,與該筆劃的標(biāo)準(zhǔn)筆劃的特征向量作向量減法,從而得 到單筆劃的形態(tài)差異向量;
f) 使用人工神經(jīng)網(wǎng)絡(luò)、決策樹、模糊邏輯或支持向量機(jī)來訓(xùn)練并獲得單筆劃 的形態(tài)差異向量中的信號(hào)差異與美觀度評(píng)價(jià)結(jié)果間的函數(shù)映射關(guān)系;即以形態(tài) 差異向量與美觀度評(píng)價(jià)結(jié)果分別作為人工神經(jīng)網(wǎng)絡(luò)、決策樹、模糊邏輯或支持 向量機(jī)的輸入和輸出;應(yīng)用預(yù)先獲得的人工評(píng)價(jià)結(jié)果,對(duì)人工神經(jīng)網(wǎng)絡(luò)或決策 樹或模糊邏輯或支持向量機(jī)施行帶有反饋的機(jī)器學(xué)習(xí)過程;
g) 使用訓(xùn)練后的人工神經(jīng)網(wǎng)絡(luò)、決策樹、模糊邏輯或支持向量機(jī)對(duì)單筆劃進(jìn) 行評(píng)分即對(duì)任意給定的單筆劃圖像,應(yīng)用步驟e)得到該筆劃與其標(biāo)準(zhǔn)筆劃間 的形態(tài)差異向量,以該向量作為訓(xùn)練后的人工神經(jīng)網(wǎng)絡(luò)或決策樹或模糊邏輯或 支持向量機(jī)的輸入,獲取此時(shí)輸出的"好"、"一般"、"差"的概率,該漢字筆劃的 美觀度得分為("好"的概率+"—般"的概率+2) xl00。
所述的以預(yù)先獲得的字體內(nèi)部結(jié)構(gòu)美觀度人工評(píng)分結(jié)果為訓(xùn)練集,使用人 工神經(jīng)網(wǎng)絡(luò)、決策樹、模糊邏輯或支持向量機(jī)來訓(xùn)練并獲得字體內(nèi)部結(jié)構(gòu)特征 與其美觀度評(píng)價(jià)結(jié)果間的映射關(guān)系,然后使用訓(xùn)練后的學(xué)習(xí)器對(duì)字體內(nèi)部結(jié)構(gòu) 進(jìn)行評(píng)分,其中,字體內(nèi)部結(jié)構(gòu)包括字體各內(nèi)部筆劃或偏旁部首元素間的拓?fù)?關(guān)系、相對(duì)位置關(guān)系、面積遮蓋關(guān)系,以及筆劃與筆劃、筆劃與偏旁部首之間 的空間位置關(guān)系與該字的標(biāo)準(zhǔn)字體的差異,實(shí)現(xiàn)對(duì)字體內(nèi)的各部分空間結(jié)構(gòu)分 布的美觀度評(píng)分步驟
h) 通過筆劃分解結(jié)果將該字體參數(shù)化,轉(zhuǎn)換成向量的形式;這些向量層次化 的表達(dá)了字體的輪廓、軌跡與相對(duì)位置信息;
i) 將預(yù)先獲得內(nèi)部風(fēng)格美觀度人工評(píng)分的各字體的楷書體圖像作為該字體
的標(biāo)準(zhǔn)字體;提取出這些字體所對(duì)應(yīng)向量中,各筆劃或偏旁部首間的拓?fù)洹?何關(guān)系的信號(hào),與其標(biāo)準(zhǔn)字體的拓?fù)?、幾何關(guān)系的信號(hào)做比較,獲得其信號(hào)差
異,即做向量減法;
j)使用人工神經(jīng)網(wǎng)絡(luò)、決策樹、模糊邏輯或支持向量機(jī)來訓(xùn)練并獲得向量信 號(hào)差異與美觀度評(píng)價(jià)結(jié)果間的映射關(guān)系;應(yīng)用預(yù)先獲得的人工標(biāo)定的評(píng)價(jià)結(jié)果,
對(duì)人工神經(jīng)網(wǎng)絡(luò)、決策樹、模糊邏輯或支持向量機(jī)施行帶有反饋的迭代學(xué)習(xí)過 程;
k)使用訓(xùn)練后的人工神經(jīng)網(wǎng)絡(luò)、決策樹、模糊邏輯或支持向量機(jī)對(duì)字體空間 結(jié)構(gòu)美觀度進(jìn)行評(píng)分。即對(duì)任意給定的字體圖像,應(yīng)用步驟j)-步驟k)得到該字 體內(nèi)部結(jié)構(gòu)與該字的標(biāo)準(zhǔn)字體間的信號(hào)差異,以該差異向量作為訓(xùn)練后的人工 神經(jīng)網(wǎng)絡(luò)或決策樹或模糊邏輯或支持向量機(jī)的輸入,獲取此時(shí)輸出的"好"、"一 般"、"差"的概率,該漢字的內(nèi)部結(jié)構(gòu)美觀度得分為("好"的概率+"—般"的概
率+2) xl00;
所述的以預(yù)先獲得的字體風(fēng)格一致性人工評(píng)分結(jié)果為訓(xùn)練集,使用人工神 經(jīng)網(wǎng)絡(luò)、決策樹、模糊邏輯或支持向量機(jī)來訓(xùn)練并獲得字體風(fēng)格一致性特征與 其美觀度評(píng)價(jià)結(jié)果間的映射關(guān)系,使用訓(xùn)練后的學(xué)習(xí)器對(duì)字體風(fēng)格一致性進(jìn)行
評(píng)分;對(duì)字體各個(gè)內(nèi)部筆劃或偏旁部首元素計(jì)算出與該字多種已知風(fēng)格字體的 相似度,并以此確定該字體的風(fēng)格一致性評(píng)分步驟
l)對(duì)預(yù)先獲得字體風(fēng)格一致性人工評(píng)分的字體,將其對(duì)應(yīng)的楷書體、行書體
及隸書體中的書寫形態(tài)樣本,或更多其他字體,作為已知字體;
m)通過筆劃分解結(jié)果將以上字體參數(shù)化,轉(zhuǎn)換成向量的形式;這些向量層
次化的表達(dá)了字體的輪廓、軌跡與相對(duì)位置信息;
n)對(duì)各字體的每個(gè)部分,計(jì)算出該部分與其各種己知字體該部分的相似程
度;單筆劃Ai與已知字體Bj的相似度Sij的計(jì)算方法可以任選以下兩種之一
(a) 以已知字體Bj作為單筆劃Ai的標(biāo)準(zhǔn)筆劃,使用單筆劃美觀度評(píng)分方法 計(jì)算出該筆劃美觀度的三個(gè)概率值P1, P2, P3,分別表示該筆劃美觀度為"好"、 "一般"、"差"的概率;在本實(shí)施例中,Sij=Plx50%+P2x50°/。;
(b) 求出筆劃Ai的范圍矩形,即能包含該筆劃所有部分的矩形中的最小矩形, 并通過不斷平移和繞范圍矩形中心旋轉(zhuǎn)Ai,使Ai的字跡與其字體Bj相應(yīng)筆劃 的字跡的重合面積最大;設(shè)Ai的字跡面積為Cl,其字體Bj相應(yīng)筆劃的字跡的 面積為C2,貝lJSij叫CinC2l/IClUC21,及相似程度為C1、 C2交集面積與C1、 C2并集面積的比值;
O)將字體每個(gè)部分與每種已知字體的相似程度聚合可得到一個(gè)矩陣,作為該
字體的風(fēng)格一致性特征;
p)使用人工神經(jīng)網(wǎng)絡(luò)、決策樹、模糊邏輯或支持向量機(jī)來訓(xùn)練并獲得該矩陣
與美觀度評(píng)價(jià)結(jié)果間的映射關(guān)系;應(yīng)用人工標(biāo)定的評(píng)價(jià)結(jié)果,對(duì)人工神經(jīng)網(wǎng)絡(luò)、 決策樹、模糊邏輯或支持向量機(jī)施行帶有反饋的迭代學(xué)習(xí)過程;
q)使用訓(xùn)練后的人工神經(jīng)網(wǎng)絡(luò)、決策樹、模糊邏輯或支持向量機(jī)對(duì)字體風(fēng)格 一致性進(jìn)行評(píng)分。即對(duì)任意給定的字體圖像,應(yīng)用步驟h)-步驟k)得到該字體 與各已知字體間的相似度,以該矩陣作為訓(xùn)練后的人工神經(jīng)網(wǎng)絡(luò)或決策樹或模 糊邏輯或支持向量機(jī)的輸入,獲取此時(shí)輸出的"好"、"一般"、"差"的概率,該字 體的風(fēng)格一致性得分為("好"的概率+"—般"的概率+2) xl00;
所述的根據(jù)對(duì)漢字進(jìn)行的單筆劃美觀度評(píng)分、內(nèi)部結(jié)構(gòu)美觀度評(píng)分、風(fēng)格 一致性評(píng)分,應(yīng)用統(tǒng)計(jì)學(xué)習(xí)方法綜合各項(xiàng)得分,獲得該字體的總體美觀度評(píng)分 步驟
r)利用如權(quán)利要求6、 7、 8所述的三個(gè)方法,使用訓(xùn)練后的人工神經(jīng)網(wǎng)絡(luò)、 決策樹、模糊邏輯或支持向量機(jī)自動(dòng)獲得100 300個(gè)漢字的各單筆劃美觀度得 分、內(nèi)部結(jié)構(gòu)美觀度得分和字體風(fēng)格一致性得分;
s)通過多人調(diào)查方式,讓多個(gè)人分別對(duì)步驟r)中所述漢字圖像做美觀度總體 評(píng)分,評(píng)分結(jié)果為"好"、"一般"、"差"三種其中之一;綜合所有人的評(píng)分結(jié)果, 計(jì)算該字體的分?jǐn)?shù)概率,即分別統(tǒng)計(jì)將字體評(píng)分為"好"、"一般"、"差"的人數(shù), 分別將其除以總?cè)藬?shù),所得百分?jǐn)?shù)分別為該字體分?jǐn)?shù)為"好"、"一般"、"差"的概 率;
t)使用人工神經(jīng)網(wǎng)絡(luò)、決策樹、模糊邏輯或支持向量機(jī)來訓(xùn)練并獲得步驟r) 中的得分與步驟s)中的美觀度總體評(píng)分間的映射關(guān)系;應(yīng)用人工標(biāo)定的評(píng)價(jià)結(jié) 果,對(duì)人工神經(jīng)網(wǎng)絡(luò)、決策樹、模糊邏輯或支持向量機(jī)施行帶有反饋的迭代學(xué) 習(xí)過程;
u)使用訓(xùn)練后的人工神經(jīng)網(wǎng)絡(luò)、決策樹、模糊邏輯或支持向量機(jī)對(duì)字體的總 體美觀度進(jìn)行評(píng)分,即對(duì)任意給定的漢字字體圖像,應(yīng)用步驟r)的方法得到該字 體的單筆劃美觀度得分、內(nèi)部結(jié)構(gòu)美觀度得分和字體風(fēng)格一致性得分,并以這 些得分作為訓(xùn)練后的人工神經(jīng)網(wǎng)絡(luò)或決策樹或模糊邏輯或支持向量機(jī)的輸入, 獲取此時(shí)輸出的"好"、"一般"、"差"的概率,該字體的總體美觀度得分為("好" 的概率+"—般"的概率+2) xl00;
所述的將用戶的手寫字體參數(shù)化,將其轉(zhuǎn)化成以若干標(biāo)準(zhǔn)字體的參數(shù)向量
線性之和來表示,使用一個(gè)非線性規(guī)劃的最優(yōu)化方法,反復(fù)調(diào)整插值系數(shù)從而 不斷提高新字體的美觀度評(píng)分,在保留用戶字跡特征基礎(chǔ)上,指導(dǎo)用戶改善自
己的手寫字體美觀度;也可以由用戶指定僅僅為字體某一局部或整體結(jié)構(gòu)作出
指導(dǎo)步驟-
(11) 對(duì)用戶的手寫字體,從預(yù)先獲得的同一漢字的樣本字體中,隨機(jī)選出5 10個(gè)字體,將它們按如權(quán)利要求3所述的參數(shù)化方法轉(zhuǎn)化成參數(shù)向量的形式;
(12) 設(shè)預(yù)先獲得的樣本字體的對(duì)應(yīng)參數(shù)向量為Al,A2,…,An,用戶手寫字體 對(duì)應(yīng)的參數(shù)向量為A',將A'表示為Al,A2,…,An線性插值之和的形式,即 A,=tlxAl+ t2xA2+…十tnxAn,其中tl,t2,…,tn為0 1之間的實(shí)數(shù)且 tl+t2+...+tn=l,用線性方程組解法求出任一 tl,t2,...,tn的近似可行解;
(13) 為該字體的各單筆劃美觀度評(píng)分、內(nèi)部結(jié)構(gòu)美觀度評(píng)分和字體風(fēng)格一致 性評(píng)分各自自動(dòng)或由用戶設(shè)定一個(gè)分?jǐn)?shù)閾值;若自動(dòng)設(shè)定,通常各單筆劃美觀 度分?jǐn)?shù)閾值均設(shè)為30,內(nèi)部結(jié)構(gòu)美觀度和字體風(fēng)格一致性分?jǐn)?shù)閾值設(shè)為60;
(14) 對(duì)如步驟所述的向量A,做如權(quán)利要求5所述的使用一個(gè)已有的漢字書 寫形態(tài)美觀度的計(jì)算機(jī)評(píng)估方法,對(duì)字體進(jìn)行評(píng)分;
(15) 若步驟(14)中的各部分美觀度評(píng)分結(jié)果均超過步驟(13)中所設(shè)的對(duì)應(yīng)分 數(shù)閾值,則終止,輸出該字體,作為教學(xué)指導(dǎo)結(jié)果;
(16) 調(diào)整各樣本向量對(duì)應(yīng)的線性插值系數(shù),重新生成如步驟(12)所述的新向 量A';設(shè)共有n個(gè)樣本向量Al, A2, ...,An,其對(duì)應(yīng)的線性插值系數(shù)為[tU2,.,.,tn] 并滿足tl+t2+…+tr^1,設(shè)函數(shù)f(tl,t2,…,tn)為此時(shí)字體的總體美觀度評(píng)分,使用 微分法求得該函數(shù)在此時(shí)的梯度方向L=[tr,t2',...,tn'],則將各線性插值系數(shù)調(diào) 整為[tl+kxtl,,t2+kxt2,,…,tn+kxtn,],其中k為步長(zhǎng),通常設(shè)定為0.001 0.01;
(17) 對(duì)新生成的向量A'重復(fù)步驟(14);
(18) 若步驟(17)的重復(fù)次數(shù)己超過一個(gè)設(shè)定的迭代次數(shù)上限,則終止,無法 對(duì)該字體在保留基本書寫特征的基礎(chǔ)上作出指導(dǎo)意見;否則轉(zhuǎn)步驟(13);通常該 迭代次數(shù)上限設(shè)為50 200。
本發(fā)明與現(xiàn)有技術(shù)相比具有的有益效果
1) 綜合了多種人工智能與圖像處理技術(shù),使得計(jì)算機(jī)對(duì)漢字的美觀度評(píng)價(jià)
成為可能;
2) 利用了一種機(jī)器學(xué)習(xí)的機(jī)制,使得計(jì)算機(jī)對(duì)漢字的美觀度評(píng)價(jià)能力可以 從人類的審美觀學(xué)習(xí)而來;
3) 在對(duì)漢字的筆劃分解中,引入了用戶的交互式輸入,大大提高了形變嚴(yán)
重的字體尤其是草書體的筆劃分解效果;
1) 利用了漢字美觀度評(píng)估方法來改善自動(dòng)生成的手寫體漢字,提高了生成 字體的質(zhì)量,也豐富了生成字體的多樣性;
2) 在保留個(gè)人筆跡特征的前提下為漢字書寫習(xí)作者提出教學(xué)建議,使?jié)h字 書寫的自動(dòng)教學(xué)成為可能。
圖1是本發(fā)明所述一種針對(duì)漢字書寫的計(jì)算機(jī)輔助教學(xué)方法實(shí)施例系統(tǒng)的 流程圖2是本發(fā)明所述漢字書寫形態(tài)美觀度評(píng)估實(shí)施例系統(tǒng)的流程圖3是本發(fā)明所述美觀度評(píng)分算法的各部分評(píng)分算法的示意圖4(a)是漢字樣本字體;
圖4(b)是圖4(a)中字體的細(xì)化結(jié)果;
圖4(c)是圖4(a)中字體的"幾何圖";
圖5是本發(fā)明所述筆劃分解及漢字參數(shù)化的流程示例圖5(a)為漢字樣本字體; 圖5(b)為圖5(a)的"幾何圖"; 圖5(c)為圖5(a)的對(duì)應(yīng)標(biāo)準(zhǔn)字體,即正楷字體; 圖5(d)為圖5(a)在骨架上的筆劃分解結(jié)果; 圖5(e)為圖5(a)的最終筆劃分解結(jié)果;
圖6是本發(fā)明所述利用用戶交互界面協(xié)助筆劃分解及漢字參數(shù)化的示例圖; 圖6(a)為漢字樣本字體; 圖6(b)為圖6(a)的"幾何圖"; 圖6(c)為圖6(a)的標(biāo)準(zhǔn)字體,即正楷字體;
圖6(d)為圖6(a)的自動(dòng)分解結(jié)果,彩色筆劃表示在自動(dòng)分解成功的筆劃; 圖6(e)為用戶通過交互界面在字體上勾勒的剩余筆劃草圖; 圖6(f)為根據(jù)用戶草圖得到的骨架上的筆劃匹配結(jié)果; 圖6(g)為綜合圖5(d)和圖5(f)所示結(jié)果后的筆劃骨架; 圖6(h)為圖5(a)的最終筆劃分解結(jié)果;
圖7為單筆劃評(píng)分方法中所用到的筆劃特征信號(hào);
圖8為漢字書寫形態(tài)評(píng)分的一個(gè)示例,該字的五個(gè)單筆劃如圖9(a)-(e)所示; 該字的空間結(jié)構(gòu)分布美觀度評(píng)分為(82.5%好、17.1%—般、0.4%差),其風(fēng)格 一致性評(píng)分為(26.8%好、51.1%—般、22.1%差),其總體美觀度評(píng)分為(35.2%
好、49.7%—般、15.1°/。差);
圖9(a)為圖8所示漢字的第1筆劃,其單筆劃美觀度評(píng)分為(56.0%好、 44.0%—般、0%差);
圖9(b)為圖8所示漢字的第2筆劃;其單筆劃美觀度評(píng)分為(84.7%好、
15.3°/。--般、0°/。差);
圖9(c)為圖8所示漢字的第3筆劃;其單筆劃美觀度評(píng)分為(34.8%好、 54.6%—般、10.6%差);
圖9(d)為圖8所示漢字的第4筆劃;其單筆劃美觀度評(píng)分為(12.7%好、 46.9%—般、40.4%差);
圖9(e)為圖8所示漢字的第5筆劃。其單筆劃美觀度評(píng)分為(9.2%好、37.5°/。 一般、63.3%差);
圖10為本發(fā)明所述漢字書寫計(jì)算機(jī)教學(xué)方法實(shí)施例系統(tǒng)的屏幕截圖11為本發(fā)明所述漢字書寫計(jì)算機(jī)教學(xué)方法的單筆劃書寫教學(xué)示例效果
圖;圖ll(a)為用戶書寫筆劃,圖ll(b)為系統(tǒng)對(duì)用戶書寫筆劃提出的改善建議; 圖12為本發(fā)明所述漢字書寫計(jì)算機(jī)教學(xué)方法的整字書寫教學(xué)示例效果圖; 圖12(a)為用戶書寫字體,圖12(b)為系統(tǒng)對(duì)用戶書寫字體提出的改善建議;圖 12(c)為用戶書寫的另一字體,而系統(tǒng)無法對(duì)此字體在保留基本筆跡的基礎(chǔ)上提 出改善建議;
圖13為本發(fā)明所述漢字書寫計(jì)算機(jī)教學(xué)方法的另一個(gè)整字書寫教學(xué)示例效 果圖;圖13(a)為用戶書寫字體,圖13(b)為系統(tǒng)對(duì)用戶書寫字體提出的改善建議; 圖13(c)為用戶書寫的另一字體,而系統(tǒng)無法對(duì)此字體在保留基本筆跡的基礎(chǔ)上 提出改善建議。
具體實(shí)施例方式
針對(duì)漢字書寫的計(jì)算機(jī)輔助教學(xué)方法包括以下步驟
1) 預(yù)先對(duì)每個(gè)漢字的手寫體樣本的特征和美觀度進(jìn)行人工評(píng)分,獲得漢字 手寫體樣本庫(kù)10;
2) 通過計(jì)算機(jī)輸入設(shè)備接受習(xí)作用戶的手寫字體輸入,獲得用戶手寫體圖 像lh
3) 使用漢字美觀度評(píng)估方法12,對(duì)用戶手寫體圖像ll進(jìn)行評(píng)分;
4) 將用戶的手寫字體參數(shù)化,將其轉(zhuǎn)化成以若干標(biāo)準(zhǔn)字體的參數(shù)向量線性 之和來表示,使用美觀度改善方法13,反復(fù)調(diào)整插值系數(shù)從而不斷提高新字體 的美觀度評(píng)分,在保留用戶字跡特征基礎(chǔ)上,指導(dǎo)用戶改善自己的手寫字體美
觀度;也可以由用戶指定僅僅為字體某一局部或整體結(jié)構(gòu)作出指導(dǎo),最后輸出 教學(xué)指導(dǎo)結(jié)果14,(見圖1)。
漢字美觀度的計(jì)算機(jī)評(píng)估方法包括如下步驟-
1) 通過多人調(diào)查的方式為500 2000個(gè)漢字單筆劃的筆劃樣本評(píng)分,并使
用人工神經(jīng)網(wǎng)絡(luò)、決策樹、模糊邏輯或支持向量機(jī)來訓(xùn)練并獲得字體單筆劃形 態(tài)與其美觀度評(píng)價(jià)結(jié)果間的映射關(guān)系,然后使用訓(xùn)練后的學(xué)習(xí)器對(duì)字體單筆劃
美觀度進(jìn)行評(píng)分;
2) 通過多人調(diào)査的方式為500 2000個(gè)漢字樣本的內(nèi)部結(jié)構(gòu)評(píng)分,并使用 人工神經(jīng)網(wǎng)絡(luò)、決策樹、模糊邏輯或支持向量機(jī)來訓(xùn)練并獲得字體內(nèi)部結(jié)構(gòu)特 征與其美觀度評(píng)價(jià)結(jié)果間的映射關(guān)系,然后使用訓(xùn)練后的學(xué)習(xí)器對(duì)字體內(nèi)部結(jié)
構(gòu)進(jìn)行評(píng)分,其中,字體內(nèi)部結(jié)構(gòu)包括字體各內(nèi)部筆劃或偏旁部首元素間的拓 撲關(guān)系、相對(duì)位置關(guān)系、面積遮蓋關(guān)系,以及筆劃與筆劃、筆劃與偏旁部首之 間的空間位置關(guān)系與該字的標(biāo)準(zhǔn)字體的差異,實(shí)現(xiàn)對(duì)字體內(nèi)的各部分空間結(jié)構(gòu) 分布的美觀度評(píng)分;
3) 通過多人調(diào)査的方式為100 300個(gè)漢字樣本的風(fēng)格一致性評(píng)分,并使 用人工神經(jīng)網(wǎng)絡(luò)、決策樹、模糊邏輯或支持向量機(jī)來訓(xùn)練并獲得字體風(fēng)格一致 性特征與其美觀度評(píng)價(jià)結(jié)果間的映射關(guān)系,使用訓(xùn)練后的學(xué)習(xí)器對(duì)字體風(fēng)格一
致性進(jìn)行評(píng)分;對(duì)字體各個(gè)內(nèi)部筆劃或偏旁部首元素計(jì)算出與該字多種已知風(fēng) 格字體的相似度,并以此確定該字體的風(fēng)格一致性評(píng)分;
4) 根據(jù)對(duì)漢字進(jìn)行的單筆劃美觀度評(píng)分、內(nèi)部結(jié)構(gòu)美觀度評(píng)分、風(fēng)格一致 性評(píng)分,應(yīng)用統(tǒng)計(jì)學(xué)習(xí)方法綜合各項(xiàng)得分,獲得該字體的總體美觀度評(píng)分,(見 圖2)。
所述的一種漢字美觀度的計(jì)算機(jī)評(píng)估方法,其特征在于所述的通過多人調(diào) 査的方式為500 2000個(gè)漢字單筆劃的筆劃樣本評(píng)分,并使用人工神經(jīng)網(wǎng)絡(luò)、 決策樹、模糊邏輯或支持向量機(jī)來訓(xùn)練并獲得字體單筆劃形態(tài)與其美觀度評(píng)價(jià) 結(jié)果間的映射關(guān)系,然后使用訓(xùn)練后的學(xué)習(xí)器對(duì)字體單筆劃美觀度進(jìn)行評(píng)分方 法包括如下步驟
a)事先通過多人調(diào)查方式,讓六人各自對(duì)來自IOO個(gè)漢字的單筆劃圖像做 評(píng)分,評(píng)分結(jié)果為"好"、"一般"、"差"三種其中之一;綜合所有人的評(píng)分結(jié)果, 計(jì)算該筆劃的分?jǐn)?shù)概率,即分別統(tǒng)計(jì)將筆劃評(píng)分為"好"、"一般"、"差"的人數(shù), 將其除以總?cè)藬?shù),所得三個(gè)百分?jǐn)?shù)分別為該筆劃美觀度為"好"、"一般"、"差" 的概率,獲得500 2000個(gè)單筆劃的美觀度的人工評(píng)價(jià)結(jié)果;
b)將步驟a)中所述各筆劃的楷書體圖像作為該筆劃的標(biāo)準(zhǔn)筆劃;將這些單 筆劃圖像參數(shù)化,即提取出它們的輪廓、軌跡、位置信號(hào),轉(zhuǎn)換成向量的形式, 對(duì)這些向量進(jìn)行預(yù)處理,去除噪音,并進(jìn)一步抽取特征向量,對(duì)獲得的特征向 量,與該筆劃的標(biāo)準(zhǔn)筆劃的特征向量作向量減法,從而得到單筆劃的形態(tài)差異
e c)使用人工神經(jīng)網(wǎng)絡(luò)、決策樹、模糊邏輯或支持向量機(jī)來訓(xùn)練并獲得單筆 劃的形態(tài)差異向量中的信號(hào)差異與美觀度評(píng)價(jià)結(jié)果間的函數(shù)映射關(guān)系;即以形 態(tài)差異向量與美觀度評(píng)價(jià)結(jié)果分別作為人工神經(jīng)網(wǎng)絡(luò)、決策樹、模糊邏輯或支 持向量機(jī)的輸入和輸出;應(yīng)用步驟a)中的人工評(píng)價(jià)結(jié)果,對(duì)人工神經(jīng)網(wǎng)絡(luò)或決 策樹或模糊邏輯或支持向量機(jī)施行帶有反饋的機(jī)器學(xué)習(xí)過程;
d) 使用訓(xùn)練后的人工神經(jīng)網(wǎng)絡(luò)、決策樹、模糊邏輯或支持向量機(jī)對(duì)單筆劃 進(jìn)行評(píng)分即對(duì)任意給定的單筆劃圖像,應(yīng)用步驟b)得到該筆劃與其標(biāo)準(zhǔn)筆劃 間的形態(tài)差異向量,以該向量作為訓(xùn)練后的人工神經(jīng)網(wǎng)絡(luò)或決策樹或模糊邏輯 或支持向量機(jī)的輸入,獲取此時(shí)的輸出,即為該漢字筆劃的美觀度得分。
所述的一種漢字美觀度的計(jì)算機(jī)評(píng)估方法,其特征在于所述的通過多人調(diào) 査的方式為500 2000個(gè)漢字樣本的內(nèi)部結(jié)構(gòu)評(píng)分,并使用人工神經(jīng)網(wǎng)絡(luò)、決 策樹、模糊邏輯或支持向量機(jī)來訓(xùn)練并獲得字體內(nèi)部結(jié)構(gòu)特征與其美觀度評(píng)價(jià) 結(jié)果間的映射關(guān)系,然后使用訓(xùn)練后的學(xué)習(xí)器對(duì)字體內(nèi)部結(jié)構(gòu)進(jìn)行評(píng)分,其中, 字體內(nèi)部結(jié)構(gòu)包括字體各內(nèi)部筆劃或偏旁部首元素間的拓?fù)潢P(guān)系、相對(duì)位置關(guān) 系、面積遮蓋關(guān)系,以及筆劃與筆劃、筆劃與偏旁部首之間的空間位置關(guān)系與 該字的標(biāo)準(zhǔn)字體的差異,實(shí)現(xiàn)對(duì)字體內(nèi)的各部分空間結(jié)構(gòu)分布的美觀度評(píng)分方 法,包括以下步驟
e) 事先通過多人調(diào)查方式,讓六人分別對(duì)漢字圖像做評(píng)分,評(píng)分結(jié)果為 "好"、"一般"、"差"三種其中之一;綜合所有人的評(píng)分結(jié)果,計(jì)算該字體的分?jǐn)?shù) 概率,艮卩分別統(tǒng)計(jì)將字體評(píng)分為"好"、"一般"、"差"的人數(shù),分別將其除以總 人數(shù),所得百分?jǐn)?shù)分別為該字體分?jǐn)?shù)為"好"、"一般"、"差"的概率;通過這樣的 方式獲得500 2000個(gè)字體空間結(jié)構(gòu)美觀度的人工評(píng)價(jià)結(jié)果;
f) 通過筆劃分解結(jié)果將該字體參數(shù)化,轉(zhuǎn)換成向量的形式;這些向量層次 化的表達(dá)了字體的輪廓、軌跡與相對(duì)位置信息;
g) 將步驟e)中所述各字體的楷書體圖像作為該字體的標(biāo)準(zhǔn)字體;提取出這 些字體所對(duì)應(yīng)向量中,各筆劃或偏旁部首間的拓?fù)?、幾何關(guān)系的信號(hào),與其標(biāo) 準(zhǔn)字體的拓?fù)?、幾何關(guān)系的信號(hào)做比較,獲得其信號(hào)差異,即做向量減法; h) 使用人工神經(jīng)網(wǎng)絡(luò)、決策樹、模糊邏輯或支持向量機(jī)來訓(xùn)練并獲得向量 信號(hào)差異與美觀度評(píng)價(jià)結(jié)果間的映射關(guān)系;應(yīng)用步驟e)中人工標(biāo)定的評(píng)價(jià)結(jié)果, 對(duì)人工神經(jīng)網(wǎng)絡(luò)、決策樹、模糊邏輯或支持向量機(jī)施行帶有反饋的迭代學(xué)習(xí)過 程。
i) 使用訓(xùn)練后的人工神經(jīng)網(wǎng)絡(luò)、決策樹、模糊邏輯或支持向量機(jī)對(duì)字體空 間結(jié)構(gòu)美觀度進(jìn)行評(píng)分。即對(duì)任意給定的字體圖像,應(yīng)用步驟f)-步驟g)得到該 字體內(nèi)部結(jié)構(gòu)與該字的標(biāo)準(zhǔn)字體間的信號(hào)差異,以該差異向量作為訓(xùn)練后的人 工神經(jīng)網(wǎng)絡(luò)或決策樹或模糊邏輯或支持向量機(jī)的輸入,獲取此時(shí)的輸出,即為 該字體的內(nèi)部結(jié)構(gòu)美觀度得分。
所述的一種漢字美觀度的計(jì)算機(jī)評(píng)估方法,其特征在于所述的通過多人調(diào) 查的方式為100 300個(gè)漢字樣本的風(fēng)格一致性評(píng)分,并使用人工神經(jīng)網(wǎng)絡(luò)、決 策樹、模糊邏輯或支持向量機(jī)來訓(xùn)練并獲得字體風(fēng)格一致性特征與其美觀度評(píng) 價(jià)結(jié)果間的映射關(guān)系,使用訓(xùn)練后的學(xué)習(xí)器對(duì)字體風(fēng)格一致性進(jìn)行評(píng)分;對(duì)字 體各個(gè)內(nèi)部筆劃或偏旁部首元素計(jì)算出與該字多種已知風(fēng)格字體的相似度,并 以此確定該字體的風(fēng)格一致性評(píng)分的方法包括如下步驟
j)事先通過多人調(diào)查方式,讓多個(gè)人分別對(duì)多個(gè)漢字圖像的風(fēng)格一致性做 評(píng)分,評(píng)分結(jié)果為"好"、"一般"、"差"三種其中之一;綜合所有人的評(píng)分結(jié)果, 計(jì)算該字體的分?jǐn)?shù)概率,即分別統(tǒng)計(jì)將該字評(píng)分為"好"、"一般"、"差"的人數(shù), 分別將其除以總?cè)藬?shù),所得百分?jǐn)?shù)分別為該該字分?jǐn)?shù)為"好"、"一般"、"差"的概 率;通過這樣的方式獲得100 300個(gè)漢字字體風(fēng)格一致性的人工評(píng)價(jià)結(jié)果;
k)準(zhǔn)備好這些漢字對(duì)應(yīng)的楷書體、行書體及隸書體中的書寫形態(tài)樣本,或 更多其他字體,作為已知字體;
1)通過筆劃分解結(jié)果將以上字體參數(shù)化,轉(zhuǎn)換成向量的形式;這些向量層 次化的表達(dá)了字體的輪廓、軌跡與相對(duì)位置信息;
m)對(duì)各字體的每個(gè)部分,計(jì)算出該部分與其各種己知字體該部分的相似程 度;單筆劃Ai與已知字體Bj的相似度Sij的計(jì)算方法可以任選以下兩種之一
(1) 以已知字體Bj作為單筆劃Ai的標(biāo)準(zhǔn)筆劃,使用單筆劃美觀度評(píng)分方法 計(jì)算出該筆劃美觀度的三個(gè)概率值P1, P2, P3,分別表示該筆劃美觀度為"好"、 "一般"、"差"的概率;在本實(shí)施例中,Sij=Plx50Q/。+P2x50°/。;
(2) 求出筆劃Ai的范圍矩形,即能包含該筆劃所有部分的矩形中的最小矩形, 并通過不斷平移和繞范圍矩形中心旋轉(zhuǎn)Ai,使Ai的字跡與其字體Bj相應(yīng)筆劃 的字跡的重合面積最大;設(shè)Ai的字跡面積為Cl ,其字體Bj相應(yīng)筆劃的字跡的
面積為C2,貝i」Sij = |CinC2|/|ClUC2|,及相似程度為C1、 C2交集面積與C1、 C2并集面積的比值;
n)將字體每個(gè)部分與每種已知字體的相似程度聚合可得到一個(gè)矩陣,作為 該字體的風(fēng)格一致性特征;
o)使用人工神經(jīng)網(wǎng)絡(luò)、決策樹、模糊邏輯或支持向量機(jī)來訓(xùn)練并獲得該矩 陣與美觀度評(píng)價(jià)結(jié)果間的映射關(guān)系;應(yīng)用人工標(biāo)定的評(píng)價(jià)結(jié)果,對(duì)人工神經(jīng)網(wǎng) 絡(luò)、決策樹、模糊邏輯或支持向量機(jī)施行帶有反饋的迭代學(xué)習(xí)過程;
p)使用訓(xùn)練后的人工神經(jīng)網(wǎng)絡(luò)、決策樹、模糊邏輯或支持向量機(jī)對(duì)字體風(fēng) 格一致性進(jìn)行評(píng)分。即對(duì)任意給定的字體圖像,應(yīng)用步驟k)-步驟n)得到該字 體與各己知字體間的相似度,以該矩陣作為訓(xùn)練后的人工神經(jīng)網(wǎng)絡(luò)或決策樹或 模糊邏輯或支持向量機(jī)的輸入,獲取此時(shí)的輸出,即為該字體的風(fēng)格一致性得 分。
所述的一種漢字美觀度的計(jì)算機(jī)評(píng)估方法,其特征在于所述的根據(jù)對(duì)漢字 進(jìn)行的單筆劃美觀度評(píng)分、內(nèi)部結(jié)構(gòu)美觀度評(píng)分、風(fēng)格一致性評(píng)分,應(yīng)用統(tǒng)計(jì) 學(xué)習(xí)方法綜合各項(xiàng)得分,獲得該字體的總體美觀度評(píng)分的方法包括如下步驟
q)利用上述三個(gè)方法,使用訓(xùn)練后的人工神經(jīng)網(wǎng)絡(luò)、決策樹、模糊邏輯或 支持向量機(jī)自動(dòng)獲得100 300個(gè)漢字的各單筆劃美觀度得分、內(nèi)部結(jié)構(gòu)美觀度 得分和字體風(fēng)格一致性得分;
r)通過多人調(diào)査方式,讓多個(gè)人分別對(duì)步驟q)中所述漢字圖像做美觀度總
體評(píng)分,評(píng)分結(jié)果為"好"、"一般"、"差"三種其中之一;綜合所有人的評(píng)分結(jié)果,
計(jì)算該字體的分?jǐn)?shù)概率,艮卩分別統(tǒng)計(jì)將字體評(píng)分為"好"、"一般"、"差"的人數(shù),
分別將其除以總?cè)藬?shù),所得百分?jǐn)?shù)分別為該字體分?jǐn)?shù)為"好"、"一般"、"差"的概 率;
s)使用人工神經(jīng)網(wǎng)絡(luò)、決策樹、模糊邏輯或支持向量機(jī)來訓(xùn)練并獲得步驟 q)中的得分與步驟r)中的美觀度總體評(píng)分間的映射關(guān)系;應(yīng)用人工標(biāo)定的評(píng)價(jià)結(jié) 果,對(duì)人工神經(jīng)網(wǎng)絡(luò)、決策樹、模糊邏輯或支持向量機(jī)施行帶有反饋的迭代學(xué) 習(xí)過程;
t)使用訓(xùn)練后的人工神經(jīng)網(wǎng)絡(luò)、決策樹、模糊邏輯或支持向量機(jī)對(duì)字體的 總體美觀度進(jìn)行評(píng)分,即對(duì)任意給定的漢字字體圖像,應(yīng)用步驟q)的方法得到 該字體的單筆劃美觀度得分、內(nèi)部結(jié)構(gòu)美觀度得分和字體風(fēng)格一致性得分,并 以這些得分作為訓(xùn)練后的人工神經(jīng)網(wǎng)絡(luò)或決策樹或模糊邏輯或支持向量機(jī)的輸 入,獲取此時(shí)的輸出,即為該字體的總體美觀度得分。
基于非線性規(guī)劃的最優(yōu)化方法來反復(fù)調(diào)整插值系數(shù)從而不斷提高新字體的 美觀度評(píng)分的方法,包括以下步驟-
(1) 為該字體的各單筆劃美觀度評(píng)分、內(nèi)部結(jié)構(gòu)美觀度評(píng)分和字體風(fēng)格一致
性評(píng)分自動(dòng)或人工的各自設(shè)定一個(gè)分?jǐn)?shù)閾值;若自動(dòng)設(shè)定,通常各單筆劃美觀 度分?jǐn)?shù)閾值均設(shè)為30,內(nèi)部結(jié)構(gòu)美觀度和字體風(fēng)格一致性分?jǐn)?shù)閾值設(shè)為60;
(2) 對(duì)如權(quán)利要求3所述的新向量A,做如權(quán)利要求4所述的使用一個(gè)已有的 漢字書寫形態(tài)美觀度的計(jì)算機(jī)評(píng)估方法,對(duì)生成的每個(gè)新字體進(jìn)行評(píng)分;
(3) 若步驟(2)中的各部分美觀度評(píng)分結(jié)果均超過步驟(1)中所設(shè)的對(duì)應(yīng)分?jǐn)?shù) 閾值,則終止,輸出該字體,作為生成結(jié)果;
(4) 調(diào)整各樣本向量對(duì)應(yīng)的線性插值系數(shù),重新生成如權(quán)利要求3所述的新 向量A';
(5) 對(duì)新生成的向量A'重復(fù)步驟P);
(6) 若步驟(5)的重復(fù)次數(shù)已超過一個(gè)設(shè)定的迭代次數(shù)上限,則終止,該字體 無法在保留基本書寫特征的基礎(chǔ)上進(jìn)行美化;否則轉(zhuǎn)步驟(3);通常該迭代次數(shù) 上限設(shè)為50 200;
所述的調(diào)整各樣本向量對(duì)應(yīng)的線性插值系數(shù),重新生成如權(quán)利要求3所述 的新向量A',其特征在于設(shè)共有11個(gè)樣本向量八1,八2,...,八11,其對(duì)應(yīng)的線性 插值系數(shù)為&1,12,...加]并滿足11+12+...+加=1,設(shè)函數(shù)《11,12,...扭)為此時(shí)字體的 總體美觀度評(píng)分,使用微分法求得該函數(shù)在此時(shí)的梯度方向L=[tl,,t2,,...,tn,], 則將各線性插值系數(shù)調(diào)整為[tl+kxtl,,t2+kxt2,,…,tn+kxtn,],其中k為步長(zhǎng),通 常設(shè)定為0.001 0.01。
如圖2所示,本發(fā)明所述的漢字美觀度評(píng)分方法實(shí)施例系統(tǒng)的流程包括漢 字圖像101、筆劃分解及漢字參數(shù)化102、漢字美觀度評(píng)分方法103、漢字美觀 度評(píng)分結(jié)果104;其中漢字美觀度評(píng)分方法103的組成包括漢字圖像樣例201、 人類評(píng)分202、機(jī)器學(xué)習(xí)過程203;
本發(fā)明所述的實(shí)施例系統(tǒng)中的漢字美觀度評(píng)分方法103包括學(xué)習(xí)和評(píng)分兩 部分學(xué)習(xí)部分,即使用一個(gè)機(jī)器學(xué)習(xí)過程203,對(duì)漢字圖像樣例201與人類評(píng) 分202之間的潛在關(guān)系進(jìn)行探測(cè),并得到訓(xùn)練后的學(xué)習(xí)器;評(píng)分部分,即使用 經(jīng)過機(jī)器學(xué)習(xí)過程203訓(xùn)練得到的學(xué)習(xí)器,對(duì)漢字圖像101計(jì)算其美觀度得分, 得到漢字美觀度評(píng)分結(jié)果104。
漢字圖像101:漢字圖像是指包含漢字字體的數(shù)字圖像;在本實(shí)施例中,所有的 字體圖像都被分離成了一個(gè)個(gè)的單字,然后將它們歸一化成同一尺寸的二值黑 白圖像(長(zhǎng)寬均為300像素點(diǎn));其示例如圖4A所示。 筆劃分解及漢字參數(shù)化102:在本實(shí)施例中,該部分包括以下步驟
(A) 從字體圖像中提取其結(jié)構(gòu)特征,其步驟詳述如下(參見圖4A、圖4B、 圖4C):
1) 對(duì)漢字圖像101做細(xì)化(Thinning)處理,以獲得該字的骨架圖像;本實(shí)施 例應(yīng)用了 ACM學(xué)報(bào)在1994年所公布的一個(gè)圖像細(xì)化算法("A noniterative thinning algorithm" ^CM 7><msa"/ora Maf/zewa/Zca/ 5byhrare, 20(1 ):5—20, 1994);其示例如圖4B所示;
2) 從骨架圖像中提取"特征點(diǎn)"("特征點(diǎn)"的定義參考IEEE學(xué)報(bào)1999年公布 的一篇文章"Identification of fork points on the skeletons of handwritten Chinese characters" 7>vmyaWora Jwa/戸,s朋d Mac/zz'"e 7nte///gewce (PAMI) 21(10):1095-1100, 1999,以下簡(jiǎn)稱文獻(xiàn)PAMI99),這些特征點(diǎn)將把整個(gè)骨架分 割成若干條曲線段;
3) 對(duì)每條曲線段都用多條首尾相連的直線段來近似,具體步驟如下對(duì)每一 條未被直線段取代的曲線段AB,設(shè)A、 B分別是其兩端端點(diǎn);計(jì)算以曲線段 AB上的某一點(diǎn)C為頂點(diǎn)的夾角ACB,當(dāng)角ACB最大時(shí)的角度值小于一個(gè)預(yù)定 值(如135度),則將曲線段AB分割成AC, CB兩段;否則以直線段連接AB 兩點(diǎn),取代原有的曲線段AB;該步驟不斷進(jìn)行直至所有曲線段均被直線段所取 代;
4) 由一系列直線段及其端點(diǎn)構(gòu)成的圖被稱為該字體的"幾何圖"(geometric graph);對(duì)"幾何圖"做修正和剪枝;本實(shí)施例應(yīng)用了文獻(xiàn)PAMI99中使用的骨架 圖修正技術(shù);最終得到的"幾何圖"示例如圖4C所示;
(B) 在步驟(A)中所述漢字字體與其標(biāo)準(zhǔn)字體間計(jì)算出一個(gè)最佳的筆劃匹 配,從而完成筆劃分解,其步驟詳述如下(參見圖5):
1) 對(duì)步驟(A)所述字體的標(biāo)準(zhǔn)字體重復(fù)步驟(A),得到該標(biāo)準(zhǔn)字體的"幾 何圖";并假設(shè)標(biāo)準(zhǔn)字體的筆劃分解結(jié)果已經(jīng)預(yù)知;
2) 在步驟(A)中所述字體的"幾何圖"與其標(biāo)準(zhǔn)字體的"幾何圖"間,計(jì)算出 一個(gè)最佳的筆劃匹配結(jié)果;本實(shí)施例應(yīng)用了《模式識(shí)別》雜志于2001年公布的 一篇文章("Model-based stroke extraction and matching for handwritten Chinese character recognition".i ecog"衍ow, 34(12):2339—2352, 2001)中所述啟發(fā) 式搜索的方法來計(jì)算出"幾何圖"上的筆劃間一一對(duì)應(yīng)關(guān)系;
3) 將"幾何圖"上以多條直線段表示的各筆劃軌跡,轉(zhuǎn)化為在原字體輪廓上的
筆劃分解結(jié)果,其具體方法為對(duì)各筆劃上的各直線段上的每一點(diǎn),以其為圓 心畫橢圓,使該橢圓盡量大而又不包含任何原字體圖像上的空白部分(即在原 字體的黑白圖像上,該橢圓區(qū)域內(nèi)的所有像素點(diǎn)均為黑色),該筆劃的所有橢圓 區(qū)域總和即為筆劃分解所得的圖像輪廓;
(C) 對(duì)與標(biāo)準(zhǔn)字體形態(tài)相差較大的字體,對(duì)步驟(B)中無法完成匹配的部
分筆劃,使用一個(gè)交互式的用戶界面來協(xié)助筆劃分解,其步驟詳述如下(參見
圖6):
1) 用戶通過交互式的用戶界面來為字體描繪其骨架草2) 根據(jù)用戶草圖來修改由標(biāo)準(zhǔn)字體而得的"幾何圖";本實(shí)施例將步驟(2)中 未完成匹配的部分筆劃在標(biāo)準(zhǔn)字體"幾何圖"中均由用戶草圖的對(duì)應(yīng)部分所替代;
3) 重復(fù)步驟(B),重新計(jì)算筆劃間的最佳匹配方案,從而完成筆劃分解;
(D) 對(duì)完成筆劃分解的字體,將其參數(shù)化,以向量的形式表達(dá);本實(shí)施例采 用了文獻(xiàn)IS2005中的漢字參數(shù)化方法,每個(gè)字體都等價(jià)的用一個(gè)矩陣在向量空 間中表示。
漢字美觀度評(píng)分方法103:如前所述,包括漢字圖像樣例201、人類評(píng)分202、 機(jī)器學(xué)習(xí)過程203;最終用訓(xùn)練得到的學(xué)習(xí)器來對(duì)筆劃分解及漢字參數(shù)化102得 到的結(jié)果做評(píng)分,而得到漢字美觀度評(píng)分結(jié)果104。
漢字圖像樣例201:同漢字圖像IOI,但使用于人類評(píng)分后供機(jī)器學(xué)習(xí)過程 203來學(xué)習(xí);
人類評(píng)分202:通過調(diào)查的方式讓一定數(shù)量的人分別對(duì)字體圖像做評(píng)分(單 筆劃美觀度或字體內(nèi)部結(jié)構(gòu)美觀度或字體風(fēng)格一致性),評(píng)分結(jié)果為"好"、"一 般"、"差"三種其中之一;綜合所有人的評(píng)分結(jié)果,計(jì)算該字體的分?jǐn)?shù)概率,艮口 分別統(tǒng)計(jì)將字體評(píng)分為"好"、"一般"、"差"的人數(shù),分別將其除以總?cè)藬?shù),所得 百分?jǐn)?shù)分別為該字體分?jǐn)?shù)為"好"、"一般"、"差"的概率;
機(jī)器學(xué)習(xí)過程203:使用一個(gè)學(xué)習(xí)器(如人工神經(jīng)網(wǎng)絡(luò)),其輸入為該字體 的特征參數(shù),其輸出為3個(gè)百分?jǐn)?shù),分別表示該字體分?jǐn)?shù)為"好"、"一般"、"差" 的概率;利用漢字圖像樣例201及其對(duì)應(yīng)的人類評(píng)分,對(duì)學(xué)習(xí)器做訓(xùn)練;使用 訓(xùn)練后的學(xué)習(xí)器對(duì)字體美觀度做出評(píng)分。
如圖3所示,漢字美觀度評(píng)分分為四種單筆劃美觀度評(píng)分301、內(nèi)部結(jié)構(gòu) 美觀度評(píng)分302、內(nèi)部風(fēng)格一致性評(píng)分303、總體美觀度評(píng)分304。
(E) 單筆劃美觀度評(píng)分301,包括以下步驟
1)事先準(zhǔn)備一定數(shù)量的漢字圖像樣例201 (均為單筆劃圖像),并對(duì)其做人
類評(píng)分202,獲得一定數(shù)量的單筆劃的美觀度人類評(píng)分結(jié)果;
2) 對(duì)每個(gè)單筆劃,使用筆劃分解及漢字參數(shù)化102中的細(xì)化算法得到其骨 架,并使用文獻(xiàn)IS2005中的參數(shù)化方法得到其參數(shù)化表示;取骨架上的一條最 大路徑;所謂最大路徑是指一條包含于骨架的離散曲線,并且以該曲線上的點(diǎn) 為圓心的覆蓋橢圓的面積之和在所有包含于骨架的離散曲線中為最大(覆蓋橢 圓Covering Ellipse的定義參見文獻(xiàn)IS2005);
3) 對(duì)最大路徑上的每個(gè)點(diǎn),做其法向直線,使直線兩端剛好位于該筆劃字跡 邊沿并過該點(diǎn),此即該點(diǎn)處的筆劃寬度;
4) 將該筆劃的最大路徑分成三段;分段方法包含以下步驟1枚舉分成三 段所需的兩個(gè)分割點(diǎn)的位置;2對(duì)每種分段方法,計(jì)算每段上所有點(diǎn)的筆劃 寬度的平均值,記其為wl、 w2、 w3;3若max(lwl-w21, Iw2-w3l)超過一個(gè)閾 值,則轉(zhuǎn)步驟10),否則轉(zhuǎn)步驟5);在本實(shí)施例中,該閾值取值為最大路徑兩端 端點(diǎn)間直線距離的1/4;
5) 如圖7所示,對(duì)最大路徑上的每個(gè)點(diǎn),提取出它的坐標(biāo)S氣Sx,Sy),它所 對(duì)應(yīng)覆蓋橢圓的長(zhǎng)軸半徑與短軸半徑分別組成的兩條一維曲線Ma、 Mi,以及骨 架該點(diǎn)到字體外輪廓邊緣的最近距離組成的一維曲線D;所有點(diǎn)的這些特征組 成了5條一維曲線;
6) 記co=(Sx, Sy, Ma, Mi, D),求出該筆劃的標(biāo)準(zhǔn)字的對(duì)應(yīng)信號(hào)co0=(Sx0, SyO, Ma0,Mi0,D0),并獲得co與co0之間的差異,設(shè)co*=cd-coO;
7) 對(duì)0)*中每條曲線計(jì)算其一階導(dǎo)數(shù),得到另一曲線集合①'=(Sx,, Sy', Ma', Mi,,D,);
8) 對(duì)0)*中的每一條一維曲線C,求出曲線C上的最大值Cmax,平均值Cave, 中位值Cmed;對(duì)co,中的每一條一維曲線C,,求出曲線C'上的最大值Cmax', 平均值Cave',中位值Cmed';
9) 將Cmax,/Cmax、 Cave,/Cmax、 Cmed7Cmax、 Cmax,/Cave、 Cave,/Cave、 Cmed7Cave、 Cmax7Cmed、 Cave,/Cmed、 Cmed,/Cmed作為學(xué)習(xí)器輸入,三個(gè) 取值在0到100間的實(shí)數(shù)作為學(xué)習(xí)器的輸出(分別對(duì)應(yīng)該筆劃美觀度為"好"、"一 般"、"差"的概率),使用該學(xué)習(xí)器對(duì)步驟l)中所用的漢字圖像樣例201并結(jié)合 其人工評(píng)分結(jié)果202作為學(xué)習(xí)樣本,對(duì)F與單筆劃評(píng)分結(jié)果間的關(guān)系進(jìn)行學(xué)習(xí); 本實(shí)施例使用了反向傳播神經(jīng)網(wǎng)絡(luò)(Back-Propagating Neural Network)作為學(xué) 習(xí)器;轉(zhuǎn)步驟ll);
10) 對(duì)該筆劃三段中的每一段,視為一個(gè)單獨(dú)筆劃并對(duì)其執(zhí)行步驟5)-8);將
這三段中每一段的Cmax7Cmax、 Cave,/Cmax、 Cmed,/Cmax、 Cmax,/Cave、 Cave,/Cave、 Cmed,/Cave、 Cmax7Cmed、 Cave,/Cmed、 Cmed,/Cmed作為學(xué)習(xí)器 輸入,三個(gè)取值在0到100間的實(shí)數(shù)作為學(xué)習(xí)器的輸出(分別對(duì)應(yīng)該筆劃美觀
度為"好"、"一般"、"差"的概率),使用該學(xué)習(xí)器對(duì)步驟l)中所用的漢字圖像樣
例201并結(jié)合其人工評(píng)分結(jié)果202作為學(xué)習(xí)樣本,對(duì)F與單筆劃評(píng)分結(jié)果間的 關(guān)系進(jìn)行學(xué)習(xí);本實(shí)施例使用了反向傳播神經(jīng)網(wǎng)絡(luò)(Back-Propagating Neural Network)作為學(xué)習(xí)器;
ll)使用學(xué)習(xí)后的學(xué)習(xí)器,對(duì)漢字單筆劃進(jìn)行評(píng)分; (F)內(nèi)部結(jié)構(gòu)美觀度評(píng)分302,包括以下步驟
1) 事先準(zhǔn)備一定數(shù)量的漢字圖像樣例201,并對(duì)其內(nèi)部結(jié)構(gòu)美觀度做人類評(píng) 分202,獲得一定數(shù)量的內(nèi)部結(jié)構(gòu)美^l度的人類評(píng)分結(jié)果;
2) 提取出這些字體所對(duì)應(yīng)向量中,各部分(如筆劃、部首)間拓?fù)洹缀蔚?關(guān)系的信號(hào);本實(shí)施例使用的信號(hào)包括對(duì)每一對(duì)筆劃x和y,我們計(jì)算出x和 y所有點(diǎn)在平面上的相互最大距離Lmax、最小距離Lmin和平均距離Lave;這 些值可以描述出這些筆劃間的空間關(guān)系與拓?fù)潢P(guān)系。另外,我們?cè)诿總€(gè)筆劃上 畫出它的范圍矩形(boundingbox,即能包含該筆劃所有部分的矩形中的最小矩 形);然后對(duì)每?jī)蓚€(gè)范圍矩形計(jì)算它們?cè)谒椒较?、豎直方向以及面積上的重疊 部分,分別記為Bh(x,y)、 Bv(x,y)、 Bp(x,y);
3) 假設(shè)該字體的筆劃共有n個(gè),通過步驟2)可以得到6個(gè)nxn矩陣,記為 Mmax、 Mmin、 Mave、 Mh、 Mv、 Mp,其中每個(gè)矩陣的第i行第j列元素代表 了該字體第i筆劃與第j筆劃間的相應(yīng)關(guān)系;
4) 將步驟3)所述6個(gè)矩陣與該字的標(biāo)準(zhǔn)字體所對(duì)應(yīng)的6個(gè)矩陣相減,記其 運(yùn)算結(jié)果為Qmax、 Qmin、 Qave、 Qh、 Qv、 Qp;連同其逆矩陣一起共12個(gè)矩 陣,記為Qi(i-l,…,12);
5) 對(duì)每個(gè)Qi,求得其矩陣元素中的最大值cpmax、最小值cpmin、最大絕對(duì) 值(pmaxa、平均值cpave、中位值cpmed,連同該Qi的前三個(gè)矩陣特征值XI、入2、 X3—起,作為學(xué)習(xí)器的輸入;
6) 三個(gè)取值在0到100間的實(shí)數(shù)作為學(xué)習(xí)器的輸出(分別對(duì)應(yīng)該結(jié)構(gòu)美觀度 為"好"、"一般"、"差"的概率),使用該學(xué)習(xí)器對(duì)步驟l)中所用的漢字圖像樣例 201并結(jié)合其人工評(píng)分結(jié)果202作為學(xué)習(xí)樣本,對(duì)內(nèi)部結(jié)構(gòu)特征與其美觀度評(píng)分 結(jié)果間的關(guān)系進(jìn)行學(xué)習(xí);本實(shí)施例使用了反向傳播神經(jīng)網(wǎng)絡(luò)(Back-Propagating Neural Network)作為學(xué)習(xí)器;
7)使用學(xué)習(xí)后的學(xué)習(xí)器,對(duì)內(nèi)部結(jié)構(gòu)美觀度進(jìn)行評(píng)分;
(G) 內(nèi)部風(fēng)格一致性評(píng)分303,包括以下步驟
1) 事先準(zhǔn)備一定數(shù)量的漢字圖像樣例201,并對(duì)其內(nèi)部風(fēng)格一致性做人類評(píng) 分202,獲得一定數(shù)量的內(nèi)部風(fēng)格一致性的人類評(píng)分結(jié)果;
2) 準(zhǔn)備好字體樣例所對(duì)應(yīng)的若干種已知字體,如楷書體、行書體、隸書體等, 每個(gè)字體樣例均有m種已知字體,記為(B川M,2,…,mh對(duì)該字體圖像內(nèi)的每 個(gè)子部分Ai (如對(duì)每個(gè)單筆劃,i=l,2,...,n),計(jì)算出它與每種己知字體中對(duì)應(yīng)子 部分的相似程度Sij (i=l,2,...,n;j=l,2,...,m),計(jì)算結(jié)果以一個(gè)百分?jǐn)?shù)表示;每個(gè) 字體圖像可得到一個(gè)nxm的矩陣F={Sij};
3) 將矩陣F作為學(xué)習(xí)器的輸入,三個(gè)取值在0到100間的實(shí)數(shù)作為學(xué)習(xí)器的 輸出(分別對(duì)應(yīng)該字體風(fēng)格一致性為"好"、"一般"、"差"的概率),使用該學(xué)習(xí) 器對(duì)步驟1)中所用的漢字圖像樣例201并結(jié)合其人工評(píng)分結(jié)果202作為學(xué)習(xí)樣 本,對(duì)F與字體內(nèi)部風(fēng)格一致性評(píng)分結(jié)果間的關(guān)系進(jìn)行學(xué)習(xí);本實(shí)施例使用了 反向傳播神經(jīng)網(wǎng)絡(luò)(Back-Propagating Neural Network)作為學(xué)習(xí)器;
4) 使用學(xué)習(xí)后的學(xué)習(xí)器,對(duì)內(nèi)部風(fēng)格一致性進(jìn)行評(píng)分;
(H) 總體美觀度評(píng)分304,包含以下步驟
1) 利用上述三個(gè)方法301、 302、 303,使用訓(xùn)練后的人工神經(jīng)網(wǎng)絡(luò)、決策樹、 模糊邏輯或支持向量機(jī)自動(dòng)獲得100 300個(gè)字體的各單筆劃美觀度得分、內(nèi)部 結(jié)構(gòu)美觀度得分和書寫風(fēng)格一致性得分;
2) 通過多人調(diào)査方式,讓一定數(shù)量的人分別對(duì)以上字體圖像做美觀度總體評(píng)
分,評(píng)分結(jié)果為"好"、"一般"、"差"三種其中之一;綜合所有人的評(píng)分結(jié)果,計(jì)
算該字體的分?jǐn)?shù)概率,即分別統(tǒng)計(jì)將字體評(píng)分為"好"、"一般"、"差"的人數(shù),
分別將其除以總?cè)藬?shù),所得百分?jǐn)?shù)分別為該字體分?jǐn)?shù)為"好"、"一般"、"差"的概 率;
3) 使用人工神經(jīng)網(wǎng)絡(luò)、決策樹、模糊邏輯或支持向量機(jī)來訓(xùn)練并獲得步驟 l)中的得分與步驟2)中的美觀度總體評(píng)分間的映射關(guān)系;應(yīng)用人工標(biāo)定的評(píng)價(jià)結(jié) 果,對(duì)人工神經(jīng)網(wǎng)絡(luò)、決策樹、模糊邏輯或支持向量機(jī)施行帶有反饋的迭代學(xué) 習(xí)過程;
4) 使用訓(xùn)練后的人工神經(jīng)網(wǎng)絡(luò)、決策樹、模糊邏輯或支持向量機(jī)對(duì)字體的總 體美觀度進(jìn)行評(píng)分。即對(duì)任意給定的漢字圖像,應(yīng)用步驟(l)的方法得到該字體 的單筆劃美觀度得分、內(nèi)部結(jié)構(gòu)美觀度得分和書寫風(fēng)格一致性得分,并以這些 得分作為訓(xùn)練后的人工神經(jīng)網(wǎng)絡(luò)或決策樹或模糊邏輯或支持向量機(jī)的輸入,獲
取此時(shí)的輸出,即為該字體的總體美觀度得分。
漢字美觀度評(píng)分結(jié)果104:同人類評(píng)分202的結(jié)果,以三個(gè)百分?jǐn)?shù)來分別表示該
字體美觀度為"好"、"一般"、"差"的概率。
權(quán)利要求
1. 一種針對(duì)漢字書寫的計(jì)算機(jī)輔助教學(xué)方法,其特征在于包括以下步驟1)預(yù)先對(duì)每個(gè)漢字的手寫體樣本的特征和美觀度進(jìn)行人工評(píng)分;2)通過計(jì)算機(jī)輸入設(shè)備接受習(xí)作用戶的手寫字體輸入,并使用圖像處理的方法將用戶手寫字體參數(shù)化;3)使用漢字書寫形態(tài)美觀度的計(jì)算機(jī)自動(dòng)評(píng)估方法,對(duì)用戶的手寫字體進(jìn)行評(píng)分;4)將用戶的手寫字體參數(shù)化,將其轉(zhuǎn)化成以若干標(biāo)準(zhǔn)字體的參數(shù)向量線性之和來表示,使用一個(gè)非線性規(guī)劃的最優(yōu)化方法,反復(fù)調(diào)整插值系數(shù)從而不斷提高新字體的美觀度評(píng)分,在保留用戶字跡特征基礎(chǔ)上,指導(dǎo)用戶改善自己的手寫字體美觀度;也可以由用戶指定僅僅為字體某一局部或整體結(jié)構(gòu)作出指導(dǎo)。
2. 如權(quán)利要求1所述的一種針對(duì)漢字書寫的計(jì)算機(jī)輔助教學(xué)方法,其特征在 于所述的預(yù)先對(duì)每個(gè)漢字的手寫體樣本的特征和美觀度進(jìn)行人工評(píng)分步驟(1) 通過多人調(diào)查方式,讓多個(gè)人各自對(duì)來自100個(gè)漢字的單筆劃圖像做評(píng) 分,評(píng)分結(jié)果為"好"、"一般"、"差"三種其中之一;綜合所有人的評(píng)分結(jié)果,計(jì) 算該筆劃的分?jǐn)?shù)概率,艮卩分別統(tǒng)計(jì)將筆劃評(píng)分為"好"、"一般"、"差"的人數(shù), 除以總?cè)藬?shù),所得三個(gè)百分?jǐn)?shù)分別為該筆劃美觀度為"好"、"一般"、"差"的概率, 獲得500 2000個(gè)單筆劃的美觀度的人工評(píng)價(jià)結(jié)果;(2) 通過多人調(diào)查方式,讓多個(gè)人分別對(duì)漢字的內(nèi)部結(jié)構(gòu)美觀度做評(píng)分,評(píng) 分結(jié)果為"好"、"一般"、"差"三種其中之一;綜合所有人的評(píng)分結(jié)果,計(jì)算該字 體的分?jǐn)?shù)概率,艮卩分別統(tǒng)計(jì)將字體評(píng)分為"好"、"一般"、"差"的人數(shù),分別將 其除以總?cè)藬?shù),所得百分?jǐn)?shù)分別為該字體分?jǐn)?shù)為"好"、"一般"、"差"的概率;通 過這樣的方式獲得500 2000個(gè)字體空間結(jié)構(gòu)美觀度的人工評(píng)價(jià)結(jié)果;(3) 通過多人調(diào)査方式,讓多個(gè)人分別對(duì)多個(gè)漢字圖像的風(fēng)格一致性做評(píng)分, 評(píng)分結(jié)果為"好"、"一般"、"差,,三種其中之一;綜合所有人的評(píng)分結(jié)果,計(jì)算該 字體的分?jǐn)?shù)概率,即分別統(tǒng)計(jì)將該字評(píng)分為"好"、"一般"、"差"的人數(shù),分別 將其除以總?cè)藬?shù),所得百分?jǐn)?shù)分別為該該字分?jǐn)?shù)為"好"、"一般"、"差"的概率; 通過這樣的方式獲得100 300個(gè)漢字字體風(fēng)格一致性的人工評(píng)價(jià)結(jié)果。
3. 如權(quán)利要求1所述的一種針對(duì)漢字書寫的計(jì)算機(jī)輔助教學(xué)方法,其特征在 于所述的通過計(jì)算機(jī)輸入設(shè)備接受習(xí)作用戶的手寫字體輸入,并使用圖像處理 的方法將用戶手寫字體參數(shù)化步驟(4) 利用計(jì)算機(jī)輸入設(shè)備,如鼠標(biāo)、手寫筆,接受用戶的手寫字體,以數(shù)字 圖像的方式存儲(chǔ);(5) 若用戶手寫了多個(gè)漢字,將用戶的手寫字體分割成若干個(gè)單字體,并將 每個(gè)單字體圖像轉(zhuǎn)化為相同尺寸的點(diǎn)陣二值黑白圖像;(6) 對(duì)每個(gè)漢字圖像做細(xì)化,筆劃分解,提取出其軌跡與書寫寬度特征,以 參數(shù)向量的形式表示每個(gè)漢字圖像。
4. 如權(quán)利要求3所述的一種針對(duì)漢字書寫的計(jì)算機(jī)輔助教學(xué)方法,其特征在 于所述的對(duì)每個(gè)漢字圖像做細(xì)化,筆劃分解,提取出其軌跡與書寫寬度特征, 以參數(shù)向量的形式表示每個(gè)漢字圖像步驟a) 對(duì)漢字圖像做細(xì)化處理,以獲得該字的骨架圖像;b) 將該字與其標(biāo)準(zhǔn)楷書字體做筆劃匹配,用啟發(fā)式搜索的方法找出骨架各 部分與標(biāo)準(zhǔn)筆劃的一一對(duì)應(yīng)關(guān)系,完成骨架上的筆劃分解;c) 對(duì)每筆劃上的各骨架點(diǎn),以其為圓心畫橢圓,使該橢圓盡量大而又不包 含任何原字體圖像上的空白部分,該筆劃的所有橢圓區(qū)域總和即為筆劃分解所 得的圖像輪廓;d) 將所有橢圓的長(zhǎng)短軸、圓心坐標(biāo)列為一個(gè)矩陣,即為該字體的參數(shù)向量c
5. 如權(quán)利要求1所述的一種針對(duì)漢字書寫的計(jì)算機(jī)輔助教學(xué)方法,其特征在 于所述的使用一種漢字書寫形態(tài)美觀度的計(jì)算機(jī)自動(dòng)評(píng)估方法,對(duì)用戶的手寫 字體進(jìn)行評(píng)分步驟(7) 以預(yù)先獲得的單筆劃美觀度人工評(píng)分結(jié)果為訓(xùn)練集,使用人工神經(jīng)網(wǎng)絡(luò)、 決策樹、模糊邏輯或支持向量機(jī)來訓(xùn)練并獲得字體單筆劃形態(tài)與其美觀度評(píng)價(jià) 結(jié)果間的映射關(guān)系,然后使用訓(xùn)練后的學(xué)習(xí)器對(duì)字體單筆劃美觀度進(jìn)行評(píng)分;(8) 以預(yù)先獲得的字體內(nèi)部結(jié)構(gòu)美觀度人工評(píng)分結(jié)果為訓(xùn)練集,使用人工神 經(jīng)網(wǎng)絡(luò)、決策樹、模糊邏輯或支持向量機(jī)來訓(xùn)練并獲得字體內(nèi)部結(jié)構(gòu)特征與其 美觀度評(píng)價(jià)結(jié)果間的映射關(guān)系,然后使用訓(xùn)練后的學(xué)習(xí)器對(duì)字體內(nèi)部結(jié)構(gòu)進(jìn)行 評(píng)分,其中,字體內(nèi)部結(jié)構(gòu)包括字體各內(nèi)部筆劃或偏旁部首元素間的拓?fù)潢P(guān)系、 相對(duì)位置關(guān)系、面積遮蓋關(guān)系,以及筆劃與筆劃、筆劃與偏旁部首之間的空間 位置關(guān)系與該字的標(biāo)準(zhǔn)字體的差異,實(shí)現(xiàn)對(duì)字體內(nèi)的各部分空間結(jié)構(gòu)分布的美 觀度評(píng)分;(9) 以預(yù)先獲得的字體風(fēng)格一致性人工評(píng)分結(jié)果為訓(xùn)練集,使用人工神經(jīng)網(wǎng) 絡(luò)、決策樹、模糊邏輯或支持向量機(jī)來訓(xùn)練并獲得字體風(fēng)格一致性特征與其美 觀度評(píng)價(jià)結(jié)果間的映射關(guān)系,使用訓(xùn)練后的學(xué)習(xí)器對(duì)字體風(fēng)格一致性進(jìn)行評(píng)分; 對(duì)字體各個(gè)內(nèi)部筆劃或偏旁部首元素計(jì)算出與該字多種已知風(fēng)格字體的相似 度,并以此確定該字體的風(fēng)格一致性評(píng)分;(IO)根據(jù)對(duì)漢字進(jìn)行的單筆劃美觀度評(píng)分、內(nèi)部結(jié)構(gòu)美觀度評(píng)分、風(fēng)格一致 性評(píng)分,應(yīng)用統(tǒng)計(jì)學(xué)習(xí)方法綜合各項(xiàng)得分,獲得該字體的總體美觀度評(píng)分。
6. 如權(quán)利要求5所述的一種漢字書寫形態(tài)美觀度的計(jì)算機(jī)自動(dòng)評(píng)估方法,其 特征在于所述的以預(yù)先獲得的單筆劃美觀度人工評(píng)分結(jié)果為訓(xùn)練集,使用人工 神經(jīng)網(wǎng)絡(luò)、決策樹、模糊邏輯或支持向量機(jī)來訓(xùn)練并獲得字體單筆劃形態(tài)與其 美觀度評(píng)價(jià)結(jié)果間的映射關(guān)系,然后使用訓(xùn)練后的學(xué)習(xí)器對(duì)字體單筆劃美觀度 進(jìn)行評(píng)分步驟e) 以預(yù)先獲得單筆劃美觀度人工評(píng)分的各筆劃的楷書體圖像作為該筆劃的 標(biāo)準(zhǔn)筆劃;將這些單筆劃圖像參數(shù)化,即提取出它們的輪廓、軌跡、位置信號(hào), 轉(zhuǎn)換成向量的形式,對(duì)這些向量進(jìn)行預(yù)處理,去除噪音,并進(jìn)一步抽取特征向 量,對(duì)獲得的特征向量,與該筆劃的標(biāo)準(zhǔn)筆劃的特征向量作向量減法,從而得 到單筆劃的形態(tài)差異向量;f) 使用人工祌經(jīng)網(wǎng)絡(luò)、決策樹、模糊邏輯或支持向量機(jī)來訓(xùn)練并獲得單筆劃 的形態(tài)差異向量中的信號(hào)差異與美觀度評(píng)價(jià)結(jié)果間的函數(shù)映射關(guān)系;即以形態(tài) 差異向量與美觀度評(píng)價(jià)結(jié)果分別作為人工神經(jīng)網(wǎng)絡(luò)、決策樹、模糊邏輯或支持 向量機(jī)的輸入和輸出;應(yīng)用預(yù)先獲得的人工評(píng)價(jià)結(jié)果,對(duì)人工神經(jīng)網(wǎng)絡(luò)或決策 樹或模糊邏輯或支持向量機(jī)施行帶有反饋的機(jī)器學(xué)習(xí)過程;g) 使用訓(xùn)練后的人工神經(jīng)網(wǎng)絡(luò)、決策樹、模糊邏輯或支持向量機(jī)對(duì)單筆劃進(jìn) 行評(píng)分即對(duì)任意給定的單筆劃圖像,應(yīng)用步驟e)得到該筆劃與其標(biāo)準(zhǔn)筆劃間 的形態(tài)差異向量,以該向量作為訓(xùn)練后的人工神經(jīng)網(wǎng)絡(luò)或決策樹或模糊邏輯或 支持向量機(jī)的輸入,獲取此時(shí)輸出的"好"、"一般"、"差"的概率,該漢字筆劃的 美觀度得分為("好"的概率+"—般"的概率+2) xl00。
7. 如權(quán)利要求5所述的一種漢字書寫形態(tài)美觀度的計(jì)算機(jī)自動(dòng)評(píng)估方法,其 特征在于所述的以預(yù)先獲得的字體內(nèi)部結(jié)構(gòu)美觀度人工評(píng)分結(jié)果為訓(xùn)練集,使 用人工神經(jīng)網(wǎng)絡(luò)、決策樹、模糊邏輯或支持向量機(jī)來訓(xùn)練并獲得字體內(nèi)部結(jié)構(gòu) 特征與其美觀度評(píng)價(jià)結(jié)果間的映射關(guān)系,然后使用訓(xùn)練后的學(xué)習(xí)器對(duì)字體內(nèi)部 結(jié)構(gòu)進(jìn)行評(píng)分,其中,字體內(nèi)部結(jié)構(gòu)包括字體各內(nèi)部筆劃或偏旁部首元素間的 拓?fù)潢P(guān)系、相對(duì)位置關(guān)系、面積遮蓋關(guān)系,以及筆劃與筆劃、筆劃與偏旁部首 之間的空間位置關(guān)系與該字的標(biāo)準(zhǔn)字體的差異,實(shí)現(xiàn)對(duì)字體內(nèi)的各部分空間結(jié) 構(gòu)分布的美觀度評(píng)分步驟h) 通過筆劃分解結(jié)果將該字體參數(shù)化,轉(zhuǎn)換成向量的形式;這些向量層次化 的表達(dá)了字體的輪廓、軌跡與相對(duì)位置信息;i)將預(yù)先獲得內(nèi)部風(fēng)格美觀度人工評(píng)分的各字體的楷書體圖像作為該字體 的標(biāo)準(zhǔn)字體;提取出這些字體所對(duì)應(yīng)向量中,各筆劃或偏旁部首間的拓?fù)?、?何關(guān)系的信號(hào),與其標(biāo)準(zhǔn)字體的拓?fù)?、幾何關(guān)系的信號(hào)做比較,獲得其信號(hào)差 異,即做向量減法;j)使用人工神經(jīng)網(wǎng)絡(luò)、決策樹、模糊邏輯或支持向量機(jī)來訓(xùn)練并獲得向量信 號(hào)差異與美觀度評(píng)價(jià)結(jié)果間的映射關(guān)系;應(yīng)用預(yù)先獲得的人工標(biāo)定的評(píng)價(jià)結(jié)果,對(duì)人工神經(jīng)網(wǎng)絡(luò)、決策樹、模糊邏輯或支持向量機(jī)施行帶有反饋的迭代學(xué)習(xí)過 程;k)使用訓(xùn)練后的人工神經(jīng)網(wǎng)絡(luò)、決策樹、模糊邏輯或支持向量機(jī)對(duì)字體空間 結(jié)構(gòu)美觀度進(jìn)行評(píng)分。即對(duì)任意給定的字體圖像,應(yīng)用步驟j)-步驟k)得到該字 體內(nèi)部結(jié)構(gòu)與該字的標(biāo)準(zhǔn)字體間的信號(hào)差異,以該差異向量作為訓(xùn)練后的人工 神經(jīng)網(wǎng)絡(luò)或決策樹或模糊邏輯或支持向量機(jī)的輸入,獲取此時(shí)輸出的"好"、"一 般"、"差"的概率,該漢字的內(nèi)部結(jié)構(gòu)美觀度得分為("好"的概率+ "—般"的概 率+2) x100。
8.如權(quán)利要求5所述的一種漢字書寫形態(tài)美觀度的計(jì)算機(jī)自動(dòng)評(píng)估方法,其 特征在于所述的以預(yù)先獲得的字體風(fēng)格一致性人工評(píng)分結(jié)果為訓(xùn)練集,使用人 工神經(jīng)網(wǎng)絡(luò)、決策樹、模糊邏輯或支持向量機(jī)來訓(xùn)練并獲得字體風(fēng)格一致性特 征與其美觀度評(píng)價(jià)結(jié)果間的映射關(guān)系,使用訓(xùn)練后的學(xué)習(xí)器對(duì)字體風(fēng)格一致性進(jìn)行評(píng)分;對(duì)字體各個(gè)內(nèi)部筆劃或偏旁部首元素計(jì)算出與該字多種已知風(fēng)格字 體的相似度,并以此確定該字體的風(fēng)格一致性評(píng)分步驟l)對(duì)預(yù)先獲得字體風(fēng)格一致性人工評(píng)分的字體,將其對(duì)應(yīng)的楷書體、行書體 及隸書體中的書寫形態(tài)樣本,或更多其他字體,作為已知字體;m)通過筆劃分解結(jié)果將以上字體參數(shù)化,轉(zhuǎn)換成向量的形式;這些向量層 次化的表達(dá)了字體的輪廓、軌跡與相對(duì)位置信息;n)對(duì)各字體的每個(gè)部分,計(jì)算出該部分與其各種已知字體該部分的相似程 度;單筆劃Ai與已知字體Bj的相似度Sij的計(jì)算方法可以任選以下兩種之一(a) 以已知字體Bj作為單筆劃Ai的標(biāo)準(zhǔn)筆劃,使用單筆劃美觀度評(píng)分方法 計(jì)算出該筆劃美觀度的三個(gè)概率值P1, P2, P3,分別表示該筆劃美觀度為"好"、 "一般"、"差"的概率;在本實(shí)施例中,Sij=Plx50%+P2x50%;(b) 求出筆劃Ai的范圍矩形,即能包含該筆劃所有部分的矩形中的最小矩形, 并通過不斷平移和繞范圍矩形中心旋轉(zhuǎn)Ai,使Ai的字跡與其字體Bj相應(yīng)筆劃 的字跡的重合面積最大;設(shè)Ai的字跡面積為Cl,其字體Bj相應(yīng)筆劃的字跡的面積為C2,貝USij叫CinC2l/IClUC21,及相似程度為C1、 C2交集面積與C1、C2并集面積的比值;o)將字體每個(gè)部分與每種已知字體的相似程度聚合可得到一個(gè)矩陣,作為該字體的風(fēng)格一致性特征;p)使用人工神經(jīng)網(wǎng)絡(luò)、決策樹、模糊邏輯或支持向量機(jī)來訓(xùn)練并獲得該矩陣 與美觀度評(píng)價(jià)結(jié)果間的映射關(guān)系;應(yīng)用人工標(biāo)定的評(píng)價(jià)結(jié)果,對(duì)人工神經(jīng)網(wǎng)絡(luò)、 決策樹、模糊邏輯或支持向量機(jī)施行帶有反饋的迭代學(xué)習(xí)過程;q)使用訓(xùn)練后的人工神經(jīng)網(wǎng)絡(luò)、決策樹、模糊邏輯或支持向量機(jī)對(duì)字體風(fēng)格 一致性進(jìn)行評(píng)分。即對(duì)任意給定的字體圖像,應(yīng)用步驟h)-步驟k)得到該字體 與各已知字體間的相似度,以該矩陣作為訓(xùn)練后的人工神經(jīng)網(wǎng)絡(luò)或決策樹或模 糊邏輯或支持向量機(jī)的輸入,獲取此時(shí)輸出的"好"、"一般"、"差"的概率,該字 體的風(fēng)格一致性得分為("好"的概率+"—般"的概率+2) x100。
9.如權(quán)利要求5所述的一種漢字書寫形態(tài)美觀度的計(jì)算機(jī)自動(dòng)評(píng)估方法,其 特征在于所述的根據(jù)對(duì)漢字進(jìn)行的單筆劃美觀度評(píng)分、內(nèi)部結(jié)構(gòu)美觀度評(píng)分、 風(fēng)格一致性評(píng)分,應(yīng)用統(tǒng)計(jì)學(xué)習(xí)方法綜合各項(xiàng)得分,獲得該字體的總體美觀度 評(píng)分步驟r)利用如權(quán)利要求6、 7、 8所述的三個(gè)方法,使用訓(xùn)練后的人工神經(jīng)網(wǎng)絡(luò)、 決策樹、模糊邏輯或支持向量機(jī)自動(dòng)獲得100 300個(gè)漢字的各單筆劃美觀度得 分、內(nèi)部結(jié)構(gòu)美觀度得分和字體風(fēng)格一致性得分;s)通過多人調(diào)査方式,讓多個(gè)人分別對(duì)步驟r)中所述漢字圖像做美觀度總體 評(píng)分,評(píng)分結(jié)果為"好"、"一般"、"差"三種其中之一;綜合所有人的評(píng)分結(jié)果, 計(jì)算該字體的分?jǐn)?shù)概率,即分別統(tǒng)計(jì)將字體評(píng)分為"好"、"一般"、"差"的人數(shù), 分別將其除以總?cè)藬?shù),所得百分?jǐn)?shù)分別為該字體分?jǐn)?shù)為"好"、"一般"、"差"的概"t)使用人工神經(jīng)網(wǎng)絡(luò)、決策樹、模糊邏輯或支持向量機(jī)來訓(xùn)練并獲得步驟r) 中的得分與步驟s)中的美觀度總體評(píng)分間的映射關(guān)系;應(yīng)用人工標(biāo)定的評(píng)價(jià)結(jié) 果,對(duì)人工神經(jīng)網(wǎng)絡(luò)、決策樹、模糊邏輯或支持向量機(jī)施行帶有反饋的迭代學(xué) 習(xí)過程;u)使用訓(xùn)練后的人工神經(jīng)網(wǎng)絡(luò)、決策樹、模糊邏輯或支持向量機(jī)對(duì)字體的總 體美觀度進(jìn)行評(píng)分,即對(duì)任意給定的漢字字體圖像,應(yīng)用步驟r)的方法得到該字 體的單筆劃美觀度得分、內(nèi)部結(jié)構(gòu)美觀度得分和字體風(fēng)格一致性得分,并以這 些得分作為訓(xùn)練后的人工神經(jīng)網(wǎng)絡(luò)或決策樹或模糊邏輯或支持向量機(jī)的輸入, 獲取此時(shí)輸出的"好"、"一般"、"差"的概率,該字體的總體美觀度得分為("好" 的概率+"—般"的概率+2) xl00。
10.如權(quán)利要求1所述的一種針對(duì)漢字書寫的計(jì)算機(jī)輔助教學(xué)方法,其特征在于所述的將用戶的手寫字體參數(shù)化,將其轉(zhuǎn)化成以若干標(biāo)準(zhǔn)字體的參數(shù)向量 線性之和來表示,使用一個(gè)非線性規(guī)劃的最優(yōu)化方法,反復(fù)調(diào)整插值系數(shù)從而 不斷提高新字體的美觀度評(píng)分,在保留用戶字跡特征基礎(chǔ)上,指導(dǎo)用戶改善自己的手寫字體美觀度;也可以由用戶指定僅僅為字體某一局部或整體結(jié)構(gòu)作出 指導(dǎo)步驟(11) 對(duì)用戶的手寫字體,從預(yù)先獲得的同一漢字的樣本字體中,隨機(jī)選出5 10個(gè)字體,將它們按如權(quán)利要求3所述的參數(shù)化方法轉(zhuǎn)化成參數(shù)向量的形式;(12) 設(shè)預(yù)先獲得的樣本字體的對(duì)應(yīng)參數(shù)向量為Al,A2,…,An,用戶手寫字體 對(duì)應(yīng)的參數(shù)向量為A',將A'表示為Al,A2,…,An線性插值之和的形式,即 A,=tlxAl+ t2xA2+...+ tnxAn, 其中tl,t2,…,tn為0 1之間的實(shí)數(shù)且 tl+t2+...+tn=l,用線性方程組解法求出任一tl,t2,…,tn的近似可行解;(13) 為該字體的各單筆劃美觀度評(píng)分、內(nèi)部結(jié)構(gòu)美觀度評(píng)分和字體風(fēng)格一致 性評(píng)分各自自動(dòng)或由用戶設(shè)定一個(gè)分?jǐn)?shù)閾值;若自動(dòng)設(shè)定,通常各單筆劃美觀 度分?jǐn)?shù)閾值均設(shè)為30,內(nèi)部結(jié)構(gòu)美觀度和字體風(fēng)格一致性分?jǐn)?shù)閾值設(shè)為60;(14) 對(duì)如步驟所述的向量A,做如權(quán)利要求5所述的使用一個(gè)已有的漢字書 寫形態(tài)美觀度的計(jì)算機(jī)評(píng)估方法,對(duì)字體進(jìn)行評(píng)分;(15) 若步驟(14)中的各部分美觀度評(píng)分結(jié)果均超過步驟(13)中所設(shè)的對(duì)應(yīng)分 數(shù)閾值,則終止,輸出該字體,作為教學(xué)指導(dǎo)結(jié)果;(16) 調(diào)整各樣本向量對(duì)應(yīng)的線性插值系數(shù),重新生成如步驟(12)所述的新向 量A,;設(shè)共有n個(gè)樣本向量Al, A2,...,八11,其對(duì)應(yīng)的線性插值系數(shù)為[11,12,...,加] 并滿足tl+t2+…+tr^1,設(shè)函數(shù)f(tl,t2,…,tn)為此時(shí)字體的總體美觀度評(píng)分,使用 微分法求得該函數(shù)在此時(shí)的梯度方向L=[tr,t2',...,tn'],則將各線性插值系數(shù)調(diào) 整為[tl+kxtl,,t2+kxt2,,…,tn+kxtn,],其中k為步長(zhǎng),通常設(shè)定為0.001 0.01;(17) 對(duì)新生成的向量A'重復(fù)步驟(14);(18) 若步驟(17)的重復(fù)次數(shù)已超過一個(gè)設(shè)定的迭代次數(shù)上限,則終止,無法 對(duì)該字體在保留基本書寫特征的基礎(chǔ)上作出指導(dǎo)意見;否則轉(zhuǎn)步驟(13);通常該 迭代次數(shù)上限設(shè)為50 200。
全文摘要
本發(fā)明公開了一種針對(duì)漢字書寫的計(jì)算機(jī)輔助教學(xué)方法。采用了一系列計(jì)算機(jī)圖像處理和人工智能的方法,可以實(shí)現(xiàn)自動(dòng)或半自動(dòng)的計(jì)算機(jī)漢字書寫輔助教學(xué)。該方法預(yù)先對(duì)大量手寫體漢字樣本的特征和美觀度進(jìn)行人工評(píng)分;然后接受習(xí)作用戶的手寫輸入,并使用一種漢字書寫形態(tài)美觀度的計(jì)算機(jī)自動(dòng)評(píng)估方法,對(duì)用戶的手寫字體進(jìn)行評(píng)分;接著將用戶的手寫字體參數(shù)化,轉(zhuǎn)化成以若干標(biāo)準(zhǔn)字體的線性之和來表示;最后使用一個(gè)非線性規(guī)劃的最優(yōu)化方法,反復(fù)調(diào)整插值系數(shù)從而不斷提高新字體的美觀度評(píng)分,在保留用戶字跡特征基礎(chǔ)上,指導(dǎo)用戶改善自己的手寫字體美觀度;也可以由用戶指定僅僅為字體某一局部或整體結(jié)構(gòu)作出指導(dǎo)。
文檔編號(hào)G09B5/00GK101393693SQ20081012120
公開日2009年3月25日 申請(qǐng)日期2008年9月12日 優(yōu)先權(quán)日2008年9月12日
發(fā)明者劉智滿, 徐頌華, 浩 江, 潘云鶴 申請(qǐng)人:浙江大學(xué)