專利名稱:片語檢查系統(tǒng)及其方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種片語檢查系統(tǒng)及其方法,特別是指一種針對具有動詞或名詞的片 語進(jìn)行錯誤檢查的片語檢查系統(tǒng)及其方法。
背景技術(shù):
隨著信息科技的發(fā)展,信息的傳播速度非常快速,加上國際化的趨勢,一般人接觸 外語的機(jī)會大大的增加,不管是網(wǎng)頁、報章雜志、商業(yè)信件等,常??梢钥吹揭酝庹Z形式出 現(xiàn)的詞句,但是并非所有大眾對外語皆能精通,因此出現(xiàn)了許多可幫助使用者撰寫或閱讀 外語時的輔助翻譯軟件。目前現(xiàn)有的輔助翻譯軟件,當(dāng)使用者輸入的詞句出現(xiàn)部分字詞拼寫錯誤或文法錯 誤時,翻譯軟件可快速找出字詞的拼字錯誤與文法錯誤,并提示使用者進(jìn)行修改,但是使用 者輸入的詞句中,除了字詞之外,還包括由字詞組成的片語,字詞的拼寫錯誤檢查或文法的 錯誤檢查皆無法檢查出片語的錯誤,舉例來說,詞句“I Will go to home. ”由拼寫錯誤 檢查與文法錯誤檢查皆為正確,而實(shí)際存在“go to home”這樣的使用錯誤,應(yīng)為片語“go home ”,因此現(xiàn)有的翻譯軟件無法對其進(jìn)行錯誤檢查。綜上所述,可知現(xiàn)有技術(shù)中長期以來一直存在以往只能檢查詞句中拼字錯誤及文 法錯誤的問題,因此有必要提出改進(jìn)的技術(shù)手段,來解決此一問題。
發(fā)明內(nèi)容
有鑒于現(xiàn)有技術(shù)存在以往只能檢查詞句中拼字錯誤及文法錯誤的問題,本發(fā)明遂 提供一種片語檢查系統(tǒng)及其方法,其中本發(fā)明所提供的片語檢查系統(tǒng),至少包含片語數(shù)據(jù)庫、接收模塊、識別模塊、擷取 模塊、查找模塊、比對運(yùn)算模塊及顯示模塊,其中片語數(shù)據(jù)庫是用于儲存復(fù)數(shù)筆片語數(shù)據(jù); 接收模塊是用于接收來源詞句,其中來源詞句由復(fù)數(shù)個字詞所組成;識別模塊是用于運(yùn)用 文法規(guī)則解析來源詞句識別出字詞為動詞或名詞,以得到目標(biāo)字詞;擷取模塊是用于擷取 來源詞句中目標(biāo)字詞前后的連續(xù)字詞組成檢查詞組;查找模塊是用于依據(jù)目標(biāo)字詞至片語 數(shù)據(jù)庫中查找具有目標(biāo)字詞的片語數(shù)據(jù),以得到目標(biāo)片語;比對運(yùn)算模塊是用于比對運(yùn)算 檢查詞組與目標(biāo)片語中匹配相符的字詞單位數(shù)以得到匹配值;顯示模塊是用于當(dāng)匹配值符 合提示范圍值時,在來源詞句中標(biāo)記顯示檢查詞組并且顯示目標(biāo)片語。本發(fā)明所提供的片語檢查方法,其步驟至少包括建立片語數(shù)據(jù)庫,片語數(shù)據(jù)庫用 于儲存復(fù)數(shù)筆片語數(shù)據(jù),接收來源詞句,其中來源詞句由復(fù)數(shù)個字詞所組成,運(yùn)用文法規(guī)則 解析來源詞句識別出字詞為動詞或名詞,以得到目標(biāo)字詞,擷取來源詞句中目標(biāo)字詞前后 的連續(xù)字詞組成檢查詞組,依據(jù)目標(biāo)字詞至片語數(shù)據(jù)庫中查找具有目標(biāo)字詞的片語數(shù)據(jù), 以得到目標(biāo)片語,比對運(yùn)算檢查詞組與目標(biāo)片語中匹配相符的字詞單位數(shù)以得到匹配值, 當(dāng)匹配值符合提示范圍值時,在來源詞句中標(biāo)記顯示檢查詞組并且顯示目標(biāo)片語。本發(fā)明所提供的系統(tǒng)與方法如上,與現(xiàn)有技術(shù)之間的差異在于本發(fā)明通過以來源
4詞句中為動詞或名詞的字詞作為目標(biāo)字詞,再擷取來源詞句中包含目標(biāo)字詞的連續(xù)字詞來 組成檢查詞組,并查找具有目標(biāo)字詞的目標(biāo)片語,比對運(yùn)算檢查詞組與目標(biāo)片語匹配相符 的字詞單位數(shù)得到匹配值,當(dāng)匹配值符合提示范圍值時,顯示檢查詞組與目標(biāo)片語,進(jìn)而達(dá) 到檢查詞句中含有動詞或名詞的片語是否錯誤的技術(shù)功效。
圖1為本發(fā)明片語檢查系統(tǒng)方框圖;圖2為本發(fā)明片語檢查方法流程圖;圖3至圖6為本發(fā)明片語檢查系統(tǒng)的實(shí)施例示意圖。
具體實(shí)施例方式以下將配合附圖及實(shí)施例來詳細(xì)說明本發(fā)明的實(shí)施方式,借此對本發(fā)明如何應(yīng)用 技術(shù)手段來解決技術(shù)問題并達(dá)到技術(shù)功效的實(shí)現(xiàn)過程能充分理解并據(jù)以實(shí)施。首先配合附圖對本發(fā)明片語檢查系統(tǒng)及其方法作進(jìn)一步的說明,請參閱圖1,圖1 為本發(fā)明片語檢查系統(tǒng)方框圖,片語檢查系統(tǒng)100包含片語數(shù)據(jù)庫110、接收模塊120、識 別模塊130、擷取模塊140、查找模塊150、比對運(yùn)算模塊160及顯示模塊170。片語數(shù)據(jù)庫110是負(fù)責(zé)儲存多筆片語數(shù)據(jù),所述片語數(shù)據(jù)是由多個字詞所組成 的,例如“go home,,、"feel like","make a visit to”。接收模塊120是負(fù)責(zé)接收來源詞句,其中來源詞句由多個字詞所組成,所述來源 詞句是指使用者欲進(jìn)行片語檢查的詞句,舉例來說,若來源詞句為“I make visit to the exhibition. ”,則來源詞句是由字詞 “I”、“make”、“visit”、“exhibition” 所組成。識別模塊130是負(fù)責(zé)運(yùn)用文法規(guī)則來解析識別(recognize)來源詞句中的動詞或 名詞,以得到目標(biāo)字詞。也就是識別模塊130依據(jù)文法規(guī)則解析接收模塊120接收到的來 源詞句中的字詞,經(jīng)過識別得到哪些字詞為動詞、哪些為名詞,并將來源詞句中為動詞或名 詞的字詞作為目標(biāo)字詞。承上述例子,來源詞句為“I make visit to the exhibition.,,, 識別模塊130運(yùn)用文法規(guī)則解析來源詞句“I make visit to the exhibition. ”識別 出字詞 “make”、“visit,,為動詞,字詞 “exhibition” 為名詞,則字詞 “make”、“visit,,、 “exhibition”為目標(biāo)字詞。擷取模塊140是負(fù)責(zé)在來源詞句中擷取包含目標(biāo)字詞及其前后的連續(xù)字詞所組 成檢查詞組,也就是擷取模塊140擷取經(jīng)過識別模塊130識別得到的目標(biāo)字詞前后的連續(xù) 字詞,據(jù)此來組成檢查詞組。值得注意的是,所述擷取來源詞句中目標(biāo)字詞前后的連續(xù)字 詞是指擷取目標(biāo)字詞前后N個連續(xù)字詞來組成檢查詞組,也就是經(jīng)由擷取組成的檢查詞組 中必須包含目標(biāo)字詞,其中N可以是系統(tǒng)預(yù)先設(shè)定,N為正整數(shù),承上述例子,若N為“ 1 ”或 “2”,擷取模塊140擷取來源詞句“I make visit to the exhibition. ”中目標(biāo)字詞“make” 前后的連續(xù)字詞例如是“I make”、“I make visit,,、“I make visit to"make visit”、 "make visit to,,。查找模塊150是負(fù)責(zé)依據(jù)目標(biāo)字詞至片語數(shù)據(jù)庫110中查找具有目標(biāo)字詞的片語 數(shù)據(jù),以得到目標(biāo)片語。也就是查找模塊150依據(jù)識別模塊130得到的目標(biāo)字詞至片語數(shù) 據(jù)庫110中查找片語數(shù)據(jù),而得到目標(biāo)片語,其中片語數(shù)據(jù)包含目標(biāo)字詞,承上述例子,目標(biāo)字詞為 “make,,、“ViSit,,、“eXhibiti0n,,,查找模塊 150 依據(jù)目標(biāo)字詞 “make”、“visit,,、 “exhibition”至片語數(shù)據(jù)庫110中查找具有目標(biāo)字詞“make”、“Visit”、“exhibiti0n”的 片語數(shù)據(jù)例如是“make a visit to”、“make at”、“make an exhibition ofoneself ”,則目 標(biāo)片語為"make a visit to"make at"make an exhibitionof oneself,,。比對運(yùn)算模塊160是負(fù)責(zé)比對運(yùn)算檢查詞組與目標(biāo)片語中匹配相符的字詞單位 數(shù)以得到匹配值,所述字詞單位數(shù)是指字詞的個數(shù),也就是比對模塊160會將由擷取模塊 140擷取的檢查詞組的字詞與查找模塊150得到的目標(biāo)片語的字詞加以比對,運(yùn)算匹配相 符的字詞個數(shù)并得到匹配值。值得注意的是,所述匹配值是將檢查詞組中與目標(biāo)片語相符 的字詞單位數(shù)除以目標(biāo)片語的字詞單位數(shù)再乘以順序系數(shù)所得到的百分比值,其中順序系 數(shù)是依據(jù)檢查詞組與目標(biāo)片語相符的字詞順序與目標(biāo)片語的字詞順序?yàn)檎_或錯誤預(yù)先 設(shè)定的系數(shù),例如,若順序正確則順序系數(shù)為“1”,若順序錯誤則順序系數(shù)為“ 1/2”,另外, 在計算匹配值時,目標(biāo)字詞設(shè)定為2個字詞單位數(shù),其余字詞為1個字詞單位數(shù),因此匹配 值計算方式例如是“匹配值=(檢查詞組與目標(biāo)片語相符的字詞單位數(shù)/目標(biāo)片語的字詞 單位數(shù))*順序系數(shù)*100%”。承上述例子,若目標(biāo)字詞為“make”、“visit”,目標(biāo)片語為“make avisit to”,檢 查詞組為“make visit to”,比對運(yùn)算模塊160比對檢查詞組“makevisit to”與目標(biāo)片語 "make a visit to”中匹配相符的字詞為“make”、“Visit”、“t0”,由于目標(biāo)字詞“make”、 “visit”為2個字詞單位數(shù),其余字詞“to”為1個字詞單位數(shù),檢查詞組“make visit to” 具有5個字詞單位數(shù)與目標(biāo)片語“make a visit to”匹配相符,而目標(biāo)片語“make a visit to”具有6個字詞單位數(shù),但是檢查詞組“make visit to”與目標(biāo)片語“make a visit to” 的順序正確,也就是“make”排列在“visit”前面,因此運(yùn)算“匹配值=(檢查詞組與目標(biāo)片 語相符的字詞單位數(shù)/目標(biāo)片語的字詞單位數(shù))*1*100%= (5/6)*1*100%= 83%”,匹配 值為“83%”。顯示模塊170是負(fù)責(zé)當(dāng)匹配值符合提示范圍值時,在來源詞句中顯示標(biāo)記檢查詞 組,并顯示目標(biāo)片語,值得注意的是,所述提示范圍值是大于等于66%小于100%,顯示模 塊170判斷由比對運(yùn)算模塊得到的匹配值符合提示范圍值時,顯示模塊170會在來源詞句 中標(biāo)記顯示檢查詞組,例如是將檢查詞組以底線標(biāo)記,或改變檢查詞組的顏色,本發(fā)明不予 以限定,只要將在來源詞句中標(biāo)記顯示檢查詞組,皆為本發(fā)明所指,并且顯示模塊170會 同時顯示目標(biāo)片語,以供使用者選擇參考替換,承上述例子,顯示模塊170判斷匹配值為 “80%”大于66%小于100%,并在來源詞句“I make visit to theexhibition. ”標(biāo)記顯示 檢查詞語“make visit to”,并顯示目標(biāo)片語“make a visitto”供使用者參考選擇替換。通過上述片語檢查系統(tǒng)的運(yùn)作,以來源詞句中為動詞或名詞的字詞作為目標(biāo)字 詞,再擷取來源詞句中包含目標(biāo)字詞的連續(xù)字詞來組成檢查詞組,并查找具有目標(biāo)字詞的 目標(biāo)片語,比對運(yùn)算檢查詞組與目標(biāo)片語匹配相符的字詞單位數(shù)得到匹配值,當(dāng)匹配值符 合提示范圍值時,顯示檢查詞組與目標(biāo)片語,可解決以往只能檢查詞句中拼字錯誤及文法 錯誤的問題。以下將搭配本發(fā)明方法流程并舉實(shí)施例具體說明本發(fā)明,然其并非用于限定本發(fā) 明,本領(lǐng)域技術(shù)人員可依照本發(fā)明的精神對下述實(shí)施例稍做修飾,惟其仍屬于本發(fā)明的范圍。
圖2為本發(fā)明片語檢查方法流程圖,圖3至圖6為本發(fā)明片語檢查系統(tǒng)的實(shí)施例 示意圖。以下將同時配合圖2至圖6說明本發(fā)明片語檢查的運(yùn)作步驟和實(shí)施例。請先參閱圖3,片語檢查系統(tǒng)100與先建立片語數(shù)據(jù)庫300,片語數(shù)據(jù)庫300用來 儲存多筆片語數(shù)據(jù)310,片語數(shù)據(jù)310例如是“go home”、“bybuS” (步驟201)。請參閱圖4,片語檢查界面400包含來源詞句輸入?yún)^(qū)域410及片語檢查元件420, 使用者欲進(jìn)行片語檢查時需在來源詞句輸入?yún)^(qū)域410中輸入欲進(jìn)行片語檢查的來源詞句 例如是“I will go home on bus. ”,輸入后點(diǎn)選片語檢查元件420,片語檢查系統(tǒng)100會 接收來源詞句“I will go home on bus. ”,其中來源詞句是由字詞“I”、“will”、“go”、 “home”、“on”、“bus” 所組成的(步驟 202)。片語檢查系統(tǒng)100運(yùn)用文法解析來源詞句“I will go home on bus. ”識別出字 詞“go”為動詞,字詞“home”、“bus”為名詞,而字詞“go”、“home”、“bus”即為目標(biāo)字詞,也 就是目標(biāo)字詞為“go”、“home”、“bus” (步驟203)。請參閱圖5,得到目標(biāo)字詞“g0”、“h0me”、“bUS”后,片語檢查系統(tǒng)100會擷取來源 詞句“I will go home on bus. ”中目標(biāo)字詞“g0”、“h0me”、“buS”前后的連續(xù)字詞組成檢 查詞組510例如是“go home,,、"on bus,,(步驟204)。接著片語檢查系統(tǒng)100依據(jù)目標(biāo)字詞 “g0”、“h0me”、“bUS”至片語數(shù)據(jù)庫300中查找具有目標(biāo)字詞的片語數(shù)據(jù)例如是“go home”、 “bybus”,也就是目標(biāo)片語 520 為 “go home","by bus”(步驟 205)。得到檢查詞組510 “go home","on bus” 與目標(biāo)片語 520 “go home","by bus” 后,片語檢查系統(tǒng)100比對運(yùn)算檢查詞組510 "go home”與目標(biāo)片語520 "go home”匹配 相符的字詞單位數(shù),檢查詞組510 "go home”與目標(biāo)片語520 "go home”匹配相符的字詞 單位數(shù)為“4”除以目標(biāo)片語520 "go home”的字詞單位數(shù)為“4”,再乘以順序系數(shù)“1”,得 到匹配值530 “100%”,片語檢查系統(tǒng)100比對運(yùn)算檢查詞組510 "on bus”與目標(biāo)片語 520 "by bus”匹配相符的字詞單位數(shù),檢查詞組510 "on bus”與目標(biāo)片語520 "by bus” 匹配相符的字詞單位數(shù)為“2”除以目標(biāo)片語520 "by bus”的字詞單位數(shù)為“3”,再乘以順 序系數(shù)“1”,得到匹配值530 “67%”(步驟206)。請參閱圖6,當(dāng)片語檢查系統(tǒng)100得到匹配值530后,匹配值530“67%”符合大于 等于66%小于100%的提示范圍值,因此片語檢查系統(tǒng)100在片語檢查界面400的檢查詞 組顯示區(qū)域430將“on bus”以加底線的方式標(biāo)記顯示,并在目標(biāo)片語顯示區(qū)域440將“by bus”顯示供使用者參考選擇替換(步驟207)。綜上所述,可知本發(fā)明與現(xiàn)有技術(shù)之間的差異在于以來源詞句中為動詞或名詞的 字詞作為目標(biāo)字詞,再擷取來源詞句中包含目標(biāo)字詞的連續(xù)字詞來組成檢查詞組,并查找 具有目標(biāo)字詞的目標(biāo)片語,比對運(yùn)算檢查詞組與目標(biāo)片語匹配相符的字詞單位數(shù)得到匹配 值,當(dāng)匹配值符合提示范圍值時,顯示檢查詞組與目標(biāo)片語,借由此一技術(shù)手段可解決以往 只能檢查詞句中拼字錯誤及文法錯誤的問題,進(jìn)而達(dá)到檢查詞句中含有動詞或名詞的片語 是否錯誤的技術(shù)功效。雖然本發(fā)明所公開的實(shí)施方式如上,惟所述的內(nèi)容并非用于直接限定本發(fā)明的專 利保護(hù)范圍。本領(lǐng)域技術(shù)人員在不脫離本發(fā)明所揭露的精神和范圍的前提下,可以在實(shí)施 的形式上及細(xì)節(jié)上作些許的更動。本發(fā)明的專利保護(hù)范圍,仍須以所附的權(quán)利要求書所界 定為準(zhǔn)。
權(quán)利要求
一種片語檢查系統(tǒng),其特征在于,至少包含一片語數(shù)據(jù)庫,用于儲存復(fù)數(shù)筆片語數(shù)據(jù);一接收模塊,用于接收一來源詞句,其中該來源詞句由復(fù)數(shù)個字詞所組成;一識別模塊,用于運(yùn)用文法規(guī)則解析該來源詞句識別出該些字詞為動詞或名詞,以得到至少一目標(biāo)字詞;一擷取模塊,用于擷取該來源詞句中該目標(biāo)字詞前后的連續(xù)字詞組成至少一檢查詞組;一查找模塊,用于依據(jù)該目標(biāo)字詞至該片語數(shù)據(jù)庫中查找具有該目標(biāo)字詞的片語數(shù)據(jù),以得到至少一目標(biāo)片語;一比對運(yùn)算模塊,用于比對運(yùn)算該檢查詞組與該目標(biāo)片語中匹配相符的字詞單位數(shù)以得到一匹配值;及一顯示模塊,用于當(dāng)該匹配值符合一提示范圍值時,在該來源詞句中標(biāo)記顯示該檢查詞組并且顯示該目標(biāo)片語。
2.如權(quán)利要求1所述的片語檢查系統(tǒng),其特征在于,該擷取模塊是擷取該目標(biāo)字詞前 后N個連續(xù)字詞以組成該檢查詞組,且該檢查詞組包含該目標(biāo)字詞;其中,N為正整數(shù)。
3.如權(quán)利要求1所述的片語檢查系統(tǒng),其特征在于,該匹配值是將該檢查詞組中與該 目標(biāo)片語相符的字詞單位數(shù)除以該目標(biāo)片語的字詞單位數(shù)再乘以一順序系數(shù)所得到的百 分比值。
4.如權(quán)利要求3所述的片語檢查系統(tǒng),其特征在于,該目標(biāo)字詞為2個字詞單位數(shù),其 余字詞皆為1個字詞單位數(shù)。
5.如權(quán)利要求3所述的片語檢查系統(tǒng),其特征在于,該順序系數(shù)是依據(jù)該檢查詞組與 該目標(biāo)片語相符的字詞順序與目標(biāo)片語的字詞順序?yàn)檎_或錯誤預(yù)先設(shè)定的系數(shù)。
6.一種片語檢查方法,其特征在于,至少包含下列步驟 建立一片語數(shù)據(jù)庫,該片語數(shù)據(jù)庫用于儲存復(fù)數(shù)筆片語數(shù)據(jù); 接收一來源詞句,其中該來源詞句由復(fù)數(shù)個字詞所組成;運(yùn)用文法規(guī)則解析該來源詞句識別出該些字詞為動詞或名詞,以得到至少一目標(biāo)字詞;擷取該來源詞句中該目標(biāo)字詞前后的連續(xù)字詞組成至少一檢查詞組; 依據(jù)該目標(biāo)字詞至該片語數(shù)據(jù)庫中查找具有該目標(biāo)字詞的片語數(shù)據(jù),以得到至少一目 標(biāo)片語;比對運(yùn)算該檢查詞組與該目標(biāo)片語中匹配相符的字詞單位數(shù)以得到一匹配值;及 當(dāng)該匹配值符合一提示范圍值時,在該來源詞句中標(biāo)記顯示該檢查詞組并且顯示該目 標(biāo)片語。
7.如權(quán)利要求6所述的片語檢查方法,其特征在于,所述擷取該來源詞句中該目標(biāo)字 詞前后的連續(xù)字詞的步驟是擷取該目標(biāo)字詞前后N個連續(xù)字詞以組成該檢查詞組,且該檢 查詞組包含該目標(biāo)字詞;其中,N為正整數(shù)。
8.如權(quán)利要求6所述的片語檢查方法,其特征在于,該匹配值是將該檢查詞組中與該 目標(biāo)片語相符的字詞單位數(shù)除以該目標(biāo)片語的字詞單位數(shù)再乘以一順序系數(shù)所得到的百 分比值。
9.如權(quán)利要求8所述的片語檢查方法,其特征在于,該目標(biāo)字詞為2個字詞單位數(shù),其 余字詞皆為1個字詞單位數(shù)。
10.如權(quán)利要求8所述的片語檢查方法,其特征在于,該順序系數(shù)是依據(jù)該檢查詞組與 該目標(biāo)片語相符的字詞順序與目標(biāo)片語的字詞順序?yàn)檎_或錯誤預(yù)先設(shè)定的系數(shù)。
全文摘要
本發(fā)明公開了一種片語檢查系統(tǒng)及其方法,其通過以來源詞句中為動詞或名詞的字詞作為目標(biāo)字詞,再擷取來源詞句中包含目標(biāo)字詞的連續(xù)字詞來組成檢查詞組,并查找具有目標(biāo)字詞的目標(biāo)片語,比對運(yùn)算檢查詞組與目標(biāo)片語匹配相符的字詞單位數(shù)得到匹配值,當(dāng)匹配值符合提示范圍值時,顯示檢查詞組與目標(biāo)片語,可以達(dá)到檢查詞句中含有動詞或名詞的片語是否錯誤的技術(shù)功效。
文檔編號G06F17/30GK101853247SQ20091013116
公開日2010年10月6日 申請日期2009年4月3日 優(yōu)先權(quán)日2009年4月3日
發(fā)明者羅雋, 邱全成 申請人:英業(yè)達(dá)股份有限公司