1.一種手寫登記方法,該手寫登記方法包括:
構(gòu)建包括偏旁隱馬爾可夫模型HMM的偏旁字典,并且通過組合從所述偏旁字典中選擇的偏旁HMM,來生成基于偏旁的字符HMM,其中,所述偏旁字典中的偏旁HMM是通過以下步驟生成的:
訓(xùn)練數(shù)據(jù)獲取步驟,其包括:選擇包括至少一個類別的訓(xùn)練偏旁,并且獲取所述至少一個類別中的一者的相應(yīng)種子HMM,其中,將該訓(xùn)練偏旁分類到所述至少一個類別是基于該偏旁在不同字符中的幾何布局;獲取字符樣本的訓(xùn)練數(shù)據(jù)集,其中,所述字符樣本包括手寫軌跡;獲取字符HMM的模型數(shù)據(jù)集,其中,所述模型數(shù)據(jù)集包括多個字符的HMM;
偏旁檢測及偏旁采樣點確定步驟,通過使用所獲取到的種子HMM,在所述訓(xùn)練數(shù)據(jù)集當(dāng)中,檢測包含所述偏旁的字符樣本作為所述偏旁的訓(xùn)練字符樣本,并且針對所述偏旁的各個訓(xùn)練字符樣本,確定所述偏旁的采樣點;
狀態(tài)序列提取步驟,通過使用所述模型數(shù)據(jù)集中的相應(yīng)字符的HMM,對所述偏旁的所述訓(xùn)練字符樣本分別進(jìn)行解碼,并且從相應(yīng)字符的HMM中,分別提取表示所述偏旁的狀態(tài)序列;
聚類步驟,基于狀態(tài)數(shù),將所提取出的狀態(tài)序列聚類到子類別,使得每個子類別對應(yīng)于一個偏旁HMM。
2.根據(jù)權(quán)利要求1所述的手寫登記方法,其中,所述基于偏旁的字符HMM是通過以下步驟生成的:
偏旁模型選擇步驟,針對包括要素偏旁的訓(xùn)練字符,基于每個要素偏旁在所述訓(xùn)練字符中的幾何布局,為每個要素偏旁選擇一個類別,并且基于所述訓(xùn)練字符的整體字符HMM中的、表示每個要素偏旁的狀態(tài)序列的狀態(tài)數(shù),從所述偏旁字典中為每個要素偏旁選擇一個子類別,并且針對每個要素偏旁,獲得與所選擇的子類別相對應(yīng)的偏旁HMM;以及
偏旁模型組合步驟,通過組合所獲得的每個要素偏旁的偏旁HMM,來生成所述訓(xùn)練字符的基于偏旁的HMM。
3.根據(jù)權(quán)利要求1或權(quán)利要求2所述的手寫登記方法,其中,所述 幾何布局包括以下屬性中的至少一者:偏旁在字符中的位置、形狀或大小。
4.根據(jù)權(quán)利要求1或權(quán)利要求2所述的手寫登記方法,其中,所述聚類步驟包括:
將狀態(tài)數(shù)相同的所提取出的狀態(tài)序列聚類到同一子類別。
5.根據(jù)權(quán)利要求4所述的手寫登記方法,其中,在所述聚類步驟中,通過從屬于每個子類別的狀態(tài)序列當(dāng)中選擇狀態(tài)序列,來獲得與每個子類別相對應(yīng)的偏旁HMM。
6.根據(jù)權(quán)利要求4所述的手寫登記方法,其中,在所述聚類步驟中,通過訓(xùn)練包含相應(yīng)子類別的訓(xùn)練偏旁的多個手寫樣本,來獲得與每個子類別相對應(yīng)的偏旁HMM。
7.根據(jù)權(quán)利要求1或權(quán)利要求2所述的手寫登記方法,其中,通過從源字符的HMM中提取表示所述訓(xùn)練偏旁的狀態(tài)序列,來獲得所述種子HMM,其中,所述訓(xùn)練偏旁在所述源字符中的幾何布局屬于所述種子HMM相對應(yīng)的類別。
8.根據(jù)權(quán)利要求1或權(quán)利要求2所述的手寫登記方法,其中,通過訓(xùn)練所述訓(xùn)練偏旁的多個手寫樣本,來獲得所述種子HMM,其中,所述訓(xùn)練偏旁的所述多個手寫樣本屬于所述種子HMM相對應(yīng)的類別。
9.根據(jù)權(quán)利要求1或權(quán)利要求2所述的手寫登記方法,其中,所述手寫登記方法用于登記東亞字符。
10.一種手寫識別方法,該手寫識別方法包括以下步驟:
獲取手寫樣本;以及
通過使用包含多個基于偏旁的字符模型的字符字典,來識別所獲取到的手寫樣本,其中,通過權(quán)利要求1至權(quán)利要求9的任一手寫登記方法來生成所述多個基于偏旁的字符模型。
11.根據(jù)權(quán)利要求10所述的手寫識別方法,其中,所述字符字典是離線構(gòu)建的,并且所述手寫識別方法是在線實現(xiàn)的。
12.一種手寫登記裝置,該手寫登記裝置包括偏旁模型構(gòu)造單元以及 字符模型構(gòu)造單元,其中,所述偏旁模型構(gòu)造單元被構(gòu)造為構(gòu)建包括偏旁隱馬爾可夫模型HMM的偏旁字典,并且所述字符模型構(gòu)造單元被構(gòu)造為通過組合從所述偏旁字典中選擇的偏旁HMM,來生成基于偏旁的字符HMM,其中,所述偏旁模型構(gòu)造單元包括:
訓(xùn)練數(shù)據(jù)獲取子單元,其被構(gòu)造為:獲取字符樣本的訓(xùn)練數(shù)據(jù)集,其中,所述字符樣本包括手寫軌跡樣本;選擇訓(xùn)練偏旁,根據(jù)該偏旁在不同字符中的幾何布局,將該偏旁分類為至少一個類別,并且獲取所述至少一個類別中的一者的相應(yīng)種子HMM;以及獲取字符HMM的模型數(shù)據(jù)集,其中,所述模型數(shù)據(jù)集包括多個字符的HMM;
偏旁檢測及偏旁采樣點確定子單元,其被構(gòu)造為通過使用所獲取到的種子HMM,在所述訓(xùn)練數(shù)據(jù)集當(dāng)中,檢測包含所述偏旁的字符樣本作為所述偏旁的訓(xùn)練字符樣本,并且針對所述偏旁的各個訓(xùn)練字符樣本,確定所述偏旁的采樣點;
狀態(tài)序列提取子單元,其被構(gòu)造為通過使用所述模型數(shù)據(jù)集中的相應(yīng)字符的HMM,對所述偏旁的所述訓(xùn)練字符樣本分別進(jìn)行解碼,并且從相應(yīng)字符的HMM中,分別提取表示所述偏旁的狀態(tài)序列;
聚類子單元,其被構(gòu)造為基于狀態(tài)數(shù),將所提取出的狀態(tài)序列聚類到子類別,使得每個子類別對應(yīng)于一個偏旁HMM。
13.根據(jù)權(quán)利要求12所述的手寫登記裝置,其中,所述字符模型構(gòu)造單元包括:
偏旁模型選擇子單元,其被構(gòu)造為針對包括要素偏旁的訓(xùn)練字符,基于每個要素偏旁在所述訓(xùn)練字符中的幾何布局,為每個要素偏旁選擇一個類別,并且基于所述訓(xùn)練字符的整體字符HMM中的、表示每個要素偏旁的狀態(tài)序列的狀態(tài)數(shù),從所述偏旁字典中為每個要素偏旁選擇一個子類別,并且針對每個要素偏旁,獲得與所選擇的子類別相對應(yīng)的偏旁HMM;以及
偏旁模型組合子單元,其被構(gòu)造為通過組合所獲得的每個要素偏旁的偏旁HMM,來生成所述訓(xùn)練字符的基于偏旁的HMM。
14.根據(jù)權(quán)利要求12或權(quán)利要求13所述的手寫登記裝置,其中,所述幾何布局包括以下屬性中的至少一者:偏旁在字符中的位置、形狀或大小。
15.根據(jù)權(quán)利要求12或權(quán)利要求13所述的手寫登記裝置,其中,所述聚類子單元將狀態(tài)數(shù)相同的所提取出的狀態(tài)序列聚類到同一子類別。
16.根據(jù)權(quán)利要求15所述的手寫登記裝置,其中,在所述聚類子單元中,通過從屬于每個子類別的狀態(tài)序列當(dāng)中選擇狀態(tài)序列,來獲得與每個子類別相對應(yīng)的偏旁HMM。
17.根據(jù)權(quán)利要求15所述的手寫登記裝置,其中,在所述聚類子單元中,通過訓(xùn)練包含訓(xùn)練偏旁的多個手寫樣本,來獲得與每個子類別相對應(yīng)的偏旁HMM。
18.根據(jù)權(quán)利要求12或權(quán)利要求13所述的手寫登記裝置,其中,通過從源字符的HMM中提取表示所述訓(xùn)練偏旁的狀態(tài)序列,來獲得所述種子HMM,其中,所述訓(xùn)練偏旁在所述源字符中的幾何布局屬于所述種子HMM相對應(yīng)的類別。
19.根據(jù)權(quán)利要求12或權(quán)利要求13所述的手寫登記裝置,其中,通過訓(xùn)練所述訓(xùn)練偏旁的多個手寫樣本,來獲得所述種子HMM,其中,所述訓(xùn)練偏旁的所述多個手寫樣本屬于所述種子HMM相對應(yīng)的類別。
20.根據(jù)權(quán)利要求12或權(quán)利要求13所述的手寫登記裝置,其中,所述手寫登記裝置用于登記東亞字符。
21.一種手寫識別字典,該手寫識別字典包括多個基于偏旁的字符模型,其中,通過權(quán)利要求1至權(quán)利要求9的任一手寫登記方法,來生成所述多個基于偏旁的字符模型。
22.一種手寫識別裝置,該手寫識別裝置包括:
樣本獲取單元,其被構(gòu)造為獲取手寫樣本;
根據(jù)權(quán)利要求21所述的手寫識別字典;以及
識別單元,其被構(gòu)造為通過使用所述手寫識別字典,來識別所獲取到的手寫樣本。
23.一種移動電話,該移動電話包括:
傳感器,其被構(gòu)造為將用戶在所述移動電話上的觸摸轉(zhuǎn)換為采樣點;
軌跡緩沖器,其被構(gòu)造為存儲所述采樣點;
根據(jù)權(quán)利要求22所述的手寫識別裝置,其被構(gòu)造為將所述采樣點識別為字符;以及
文本編輯模塊,其被構(gòu)造為根據(jù)所識別出的字符來輸出文本。
24.一種圖像處理設(shè)備,該圖像處理設(shè)備包括:
根據(jù)權(quán)利要求22所述的手寫識別裝置;以及
圖像處理單元,其被構(gòu)造為根據(jù)所述手寫識別裝置的識別結(jié)果,來處理輸入圖像。
25.根據(jù)權(quán)利要求24所述的圖像處理設(shè)備,該圖像處理設(shè)備是復(fù)印機、傳真機、掃描儀、打印機或多功能打印機。