專利名稱:一種利用字型以及排序規(guī)則實(shí)現(xiàn)語(yǔ)言拼寫校正的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種語(yǔ)言拼寫校正的方法,尤其涉及一種利用字型以及排序規(guī)則實(shí)現(xiàn)語(yǔ)言拼寫校正的方法。
背景技術(shù):
現(xiàn)在用于語(yǔ)言學(xué)習(xí)的電子系統(tǒng)比比皆是,應(yīng)用非常廣泛,其采用的形式大多都是通過(guò)漢字或者其他字種的特點(diǎn),相應(yīng)也有相對(duì)的方法實(shí)現(xiàn)語(yǔ)言學(xué)習(xí),但是現(xiàn)在的方法一般都比較單一,例如針對(duì)一些小語(yǔ)種,如阿文波文等,沒有一種針對(duì)其特點(diǎn)進(jìn)行學(xué)習(xí)的有效的電子系統(tǒng)方法,因?yàn)檫@些文字的特點(diǎn)非常鮮明,阿文字母在字型上有較高的相似性,因此非常需要一種學(xué)習(xí)系統(tǒng)針對(duì)這種特殊字型。
發(fā)明內(nèi)容
為了解決背景技術(shù)中所存在的技術(shù)問(wèn)題,本發(fā)明提出了一種適用于語(yǔ)言字母有較高的相似度、可以根據(jù)字型相似程度進(jìn)行歸類劃分的語(yǔ)言的拼寫校正方法,大大方便了使用者語(yǔ)言輸入以及語(yǔ)言學(xué)習(xí)。本發(fā)明的技術(shù)解決方案是一種利用字型以及排序規(guī)則實(shí)現(xiàn)語(yǔ)言拼寫校正的方法,其特殊之處在于所述方法包括以下步驟1)將語(yǔ)言字母依據(jù)字母相似程度歸類,建立字型校正數(shù)據(jù)庫(kù);將語(yǔ)言字母依據(jù)字母排序規(guī)則歸類,建立排序規(guī)整數(shù)據(jù)庫(kù);2)將需要進(jìn)行語(yǔ)言學(xué)習(xí)的語(yǔ)言輸入;3)判斷步驟2)中輸入的語(yǔ)言是否有效,若是,則進(jìn)行步驟4);4)對(duì)輸入的語(yǔ)言的排序規(guī)則根據(jù)數(shù)據(jù)庫(kù)中的排序規(guī)則資料進(jìn)行校正;5)得到排序規(guī)則校正結(jié)果;8)將得到的結(jié)果進(jìn)行輸出。上述步驟幻之后包括步驟6)對(duì)輸入的語(yǔ)言的字型相似規(guī)則根據(jù)數(shù)據(jù)庫(kù)中的字型校正數(shù)據(jù)進(jìn)行校正;7)得到字型相似校正結(jié)果。上述步驟8)結(jié)果輸出之后返回步驟幻重復(fù)。本發(fā)明的利用字型以及排序規(guī)則實(shí)現(xiàn)語(yǔ)言拼寫校正的方法,根據(jù)使用者輸入的相關(guān)語(yǔ)言字符串進(jìn)行拼寫校正聯(lián)想,為使用者列出可能出現(xiàn)的字母序列,以供用戶選擇。本發(fā)明為使用者提供了一種錯(cuò)誤輸入或著模糊輸入時(shí),智能拼寫校正,并提供校正結(jié)果。大大方便了使用者語(yǔ)言輸入以及語(yǔ)言學(xué)習(xí)。
圖1是本發(fā)明的方法流程具體實(shí)施例方式參見圖1,本發(fā)明的利用字型以及排序規(guī)則實(shí)現(xiàn)語(yǔ)言拼寫校正的方法,包括以下步驟1)將語(yǔ)言字母依據(jù)字母相似程度歸類,建立字型校正數(shù)據(jù)庫(kù);將語(yǔ)言字母依據(jù)字母排序規(guī)則歸類,建立排序規(guī)整數(shù)據(jù)庫(kù);2)將需要進(jìn)行語(yǔ)言學(xué)習(xí)的語(yǔ)言輸入;3)判斷步驟2)中輸入的語(yǔ)言是否有效,若是,則進(jìn)行步驟4);4)對(duì)輸入的語(yǔ)言的排序規(guī)則根據(jù)數(shù)據(jù)庫(kù)中的排序規(guī)則資料進(jìn)行校正;5)得到排序規(guī)則校正結(jié)果;8)將得到的結(jié)果進(jìn)行輸出,結(jié)果輸出之后返回步驟3)重復(fù)。步驟幻之后包括步驟6)對(duì)輸入的語(yǔ)言的字型相似規(guī)則根據(jù)數(shù)據(jù)庫(kù)中的字型校正數(shù)據(jù)進(jìn)行校正;7)得到字型相似校正結(jié)果。本發(fā)明的方法主要針對(duì)阿拉伯文,因?yàn)榘⒗木哂凶中蜕系奶厥庑?,阿拉伯文共有二十八個(gè)字母,這些字母都是子音字母,每個(gè)字母只代表一個(gè)子音音素,每個(gè)音素只用一個(gè)字母表示,參見表一;表一阿拉伯文的字母沒有大寫和小寫的區(qū)別,但是有印刷體和書寫體的區(qū)別,而且除去五個(gè)字母(J j J ^」)外,其余二十三個(gè)字母都可以和后面的字母聯(lián)寫,而且因其在詞頭、 詞尾和詞中的位置不同,字型也有所變化。表二
權(quán)利要求
1.一種利用字型以及排序規(guī)則實(shí)現(xiàn)語(yǔ)言拼寫校正的方法,其特征在于所述方法包括以下步驟1)將語(yǔ)言字母依據(jù)字母相似程度歸類,建立字型校正數(shù)據(jù)庫(kù);將語(yǔ)言字母依據(jù)字母排序規(guī)則歸類,建立排序規(guī)整數(shù)據(jù)庫(kù);2)將需要進(jìn)行語(yǔ)言學(xué)習(xí)的語(yǔ)言輸入;3)判斷步驟2)中輸入的語(yǔ)言是否有效,若是,則進(jìn)行步驟4);4)對(duì)輸入的語(yǔ)言的排序規(guī)則根據(jù)數(shù)據(jù)庫(kù)中的排序規(guī)則資料進(jìn)行校正;5)得到排序規(guī)則校正結(jié)果; 8)將得到的結(jié)果進(jìn)行輸出。
2.根據(jù)權(quán)利要求1所述的利用字型以及排序規(guī)則實(shí)現(xiàn)語(yǔ)言拼寫校正的方法,其特征在于所述步驟3)之后包括步驟6)對(duì)輸入的語(yǔ)言的字型相似規(guī)則根據(jù)數(shù)據(jù)庫(kù)中的字型校正數(shù)據(jù)進(jìn)行校正;7)得到字型相似校正結(jié)果。
3.根據(jù)權(quán)利要求2所述的利用字型以及排序規(guī)則實(shí)現(xiàn)語(yǔ)言拼寫校正的方法,其特征在于所述步驟8)結(jié)果輸出之后返回步驟3)重復(fù)。
全文摘要
本發(fā)明提出了一種利用字型以及排序規(guī)則實(shí)現(xiàn)語(yǔ)言拼寫校正的方法,包括以下步驟1)將語(yǔ)言字母依據(jù)字母相似程度歸類,建立字型校正數(shù)據(jù)庫(kù);將語(yǔ)言字母依據(jù)字母排序規(guī)則歸類,建立排序規(guī)整數(shù)據(jù)庫(kù);2)將需要進(jìn)行語(yǔ)言學(xué)習(xí)的語(yǔ)言輸入;3)判斷步驟2)中輸入的語(yǔ)言是否有效,若是,則進(jìn)行步驟4);4)對(duì)輸入的語(yǔ)言的排序規(guī)則根據(jù)數(shù)據(jù)庫(kù)中的排序規(guī)則資料進(jìn)行校正;5)得到排序規(guī)則校正結(jié)果;6)將得到的結(jié)果進(jìn)行輸出。本發(fā)明適用于語(yǔ)言字母有較高的相似度、可以根據(jù)字型相似程度進(jìn)行歸類劃分的語(yǔ)言的拼寫校正方法,大大方便了使用者語(yǔ)言輸入以及語(yǔ)言學(xué)習(xí)。
文檔編號(hào)G06F17/27GK102411565SQ20111023627
公開日2012年4月11日 申請(qǐng)日期2011年8月17日 優(yōu)先權(quán)日2011年8月17日
發(fā)明者趙黨建, 陳淮琰 申請(qǐng)人:無(wú)敵科技(西安)有限公司