專利名稱:采用一對一比較的漢字校對系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種采用一對一比較的校對系統(tǒng),具體涉及一種采用一對一比較的漢字校對系統(tǒng),借助于這一系統(tǒng),即使是不懂漢字的人也能快速和簡單地校對中文文獻(xiàn),不需要檢查中文文獻(xiàn)全文。在采用一對一比較的這種漢字校對系統(tǒng)中,利用掃描儀掃描中文的原始拷貝并且轉(zhuǎn)換成圖像;由用戶按照原始拷貝輸入漢字,并且選擇一個(gè)一對一比較菜單;在屏幕上顯示原始拷貝中與用戶輸入的相同的漢字相對應(yīng)漢字的位像;對包括不同于位像的漢字的文本做標(biāo)記,然后,用戶可以僅僅再次輸入帶標(biāo)記的文本。
然而,如上所述,常規(guī)的漢字輸入方法從輸入漢字的處理能力上來看過于復(fù)雜并且還有缺陷,因?yàn)橛脩魞H僅是看著漢字的形狀來輸入漢字,往往會(huì)輸入與用戶想要輸入的漢字不同的漢字。
因此,用戶就有必要校對輸入漢字所獲得的文獻(xiàn)。然而,除非校對者能認(rèn)識(shí)所有的漢字,否則就無法校對中文文獻(xiàn)。在外國,由于很少有人能閱讀所有中文文獻(xiàn),他們需要從頭到尾逐個(gè)檢查漢字來校對中文文獻(xiàn),這樣造成的問題是校對文獻(xiàn)需要很長的時(shí)間,并且不能完整地執(zhí)行校對,即使是多次重復(fù)執(zhí)行校對也幾乎不能縮短校對所需的時(shí)間。
進(jìn)而,在混合使用水平和垂直書寫的條件下,要在比較兩個(gè)句子的同時(shí)校對文獻(xiàn)是很困難的,并且校對是很麻煩的,因?yàn)槲墨I(xiàn)需要分開打印。
按照本發(fā)明,用來實(shí)現(xiàn)上述目的的采用一對一比較的漢字校對系統(tǒng)包括以下步驟產(chǎn)生并存儲(chǔ)從掃描儀掃描的原始拷貝轉(zhuǎn)換而來的原始圖像;通過一個(gè)分割執(zhí)行程序?qū)⒃紙D像分割成對應(yīng)著原始圖像中的漢字的各個(gè)圖像,然后通過一個(gè)位圖產(chǎn)生程序產(chǎn)生分割的位圖;由用戶輸入漢字并且選擇一個(gè)一對一比較菜單,根據(jù)這些位圖,通過一個(gè)索引文件產(chǎn)生程序產(chǎn)生在輸入的字符當(dāng)中具有相同代碼的中文文獻(xiàn)的索引文件,然后檢查分割的位像;在完成檢查之后,同時(shí)在屏幕的左邊顯示輸入的字符文本并在其右邊顯示對應(yīng)著輸入字符文本的分割的位像,以便通過一個(gè)比較程序在輸入字符文本和分割的位像之間進(jìn)行觀察比較;確認(rèn)在右邊的原始位像當(dāng)中是否包括任何與左邊的字符文本不同的位像,并且點(diǎn)擊和標(biāo)記不同的位像;收集標(biāo)記的位像和與其相對應(yīng)的字符文本,并且顯示標(biāo)記的位像和字符文本,使用戶能夠再次輸入正確的漢字文本;并且執(zhí)行整體的校對,使再次輸入的正確文本在原先輸入的原始文本中能夠得到自動(dòng)反映和校正。
圖2為表示本發(fā)明的一個(gè)操作過程的流程圖。
圖3到6為表示用于本發(fā)明的操作流程的屏幕顯示的示意圖。
圖1示意性表示了本發(fā)明實(shí)施例的構(gòu)造。
按照這一構(gòu)造,用戶用掃描儀2輸入漢字原始拷貝,由能夠識(shí)別掃描的微處理器1將掃描的文獻(xiàn)轉(zhuǎn)換成一個(gè)圖像,然后產(chǎn)生要存儲(chǔ)在存儲(chǔ)器3中的一個(gè)原始圖像。
微處理器1通過一個(gè)分割執(zhí)行程序4和一個(gè)位圖產(chǎn)生程序5自動(dòng)分割原始圖像,從而產(chǎn)生分割的位圖。
用戶利用光學(xué)字符識(shí)別(OCR)輸入各個(gè)漢字,或者是根據(jù)原始拷貝一對一地輸入,然后存儲(chǔ)在存儲(chǔ)器3中。
如果用戶選擇了一對一比較菜單,識(shí)別到這一選擇的微處理器1就通過一個(gè)索引文件產(chǎn)生程序6根據(jù)原始圖像的分割的位圖為具有相同代碼的漢字產(chǎn)生各自的索引文件,然后指令屏幕8顯示同一個(gè)文本的輸入文本和位像,從而通過一個(gè)比較程序7來確定它們彼此間是否有任何不同。
僅僅收集顯示文本當(dāng)中帶標(biāo)記的漢字,并且再次顯示在屏幕8上。根據(jù)原始圖像,在該文本中再次輸入正確的漢字,從而校正與原始圖像不同的輸入文本。這樣就能快速執(zhí)行校對。
按照本發(fā)明,如此構(gòu)成的采用一對一比較的校對系統(tǒng)是借助一種漢字輸入法輸入漢字來執(zhí)行校對,例如有OCR,一對一輸入等等方法,并且將輸入的文本與原始圖像相比較。
首先,用戶用掃描儀2輸入需要輸入的漢字原始拷貝(步驟11)。然后由能夠識(shí)別掃描的微處理器1將掃描的文獻(xiàn)轉(zhuǎn)換成一個(gè)圖像,產(chǎn)生一個(gè)原始圖像(步驟12),并且將原始圖像存儲(chǔ)在存儲(chǔ)器3中(步驟13)。
接著,微處理器1通過分割執(zhí)行程序4將原始圖像中的各個(gè)漢字分割成各自的圖像(步驟14),并且通過位圖產(chǎn)生程序產(chǎn)生分割的位圖(步驟15)。
然后,用戶利用諸如OCR或一對一輸入等漢字輸入法完整地輸入原始拷貝中的漢字(步驟16)。然后,如果用戶選擇了一對一比較菜單(步驟17),識(shí)別到這一選擇的微處理器1就通過索引文件產(chǎn)生程序6根據(jù)位圖為輸入的漢字當(dāng)中具有相同代碼的漢字產(chǎn)生各自的索引文件,并且檢查分割的位像(步驟18)。
在完成檢查之后,如圖3所示,微處理器1指令屏幕8在其左邊顯示輸入的文本并在其右邊顯示對應(yīng)著輸入的相同漢字那些漢字的位像,以便用戶能夠在它們之間進(jìn)行觀察比較(步驟19)。
因此,在檢查顯示在屏幕8左邊的輸入文本和右邊的位像的同時(shí),用戶要確認(rèn)在屏幕右邊的位像是否與輸入的漢字不同(步驟20)。點(diǎn)擊不同于輸入漢字的位像,如圖4所示給位像做標(biāo)記(步驟21)。
如果包括按上述方法輸入的相同漢字的輸入文本有許多(步驟22),就收集由用戶輸入的包括相同漢字的那些文本的位像,并且顯示在單個(gè)屏幕上(步驟23)。如圖5所示,由用戶確認(rèn)輸入的漢字是否與其位像相同,并且僅僅通過點(diǎn)擊給不同于輸入字符的位像做標(biāo)記(步驟24)。
然后,如果用戶在完成比較之后想要校正這些文本(步驟25),就可以僅僅收集帶標(biāo)記的位像和與其相對應(yīng)的輸入文本(步驟26)并且如圖6所示再次顯示在單個(gè)屏幕上(步驟27),這樣,用戶就能再次輸入正確的漢字(步驟28)。
再次輸入的漢字被自動(dòng)反映在先前輸入的原始文本上并且完成校正。這樣就能完成整個(gè)文本從頭到尾的校對(步驟29)。
工業(yè)實(shí)用性按照本發(fā)明的采用一對一比較的校對系統(tǒng)能夠快速和簡單地校對中文文獻(xiàn),不用檢查整個(gè)中文文獻(xiàn),只需要執(zhí)行以下步驟掃描準(zhǔn)備輸入的原始中文文獻(xiàn)并且產(chǎn)生原始文獻(xiàn)的原始圖像;通過將原始圖像自動(dòng)分割成漢字圖像而產(chǎn)生分割的位圖;采用光學(xué)字符識(shí)別(OCR)或一對一輸入的方法根據(jù)原始文獻(xiàn)輸入對應(yīng)著各個(gè)位像的漢字;在用戶選擇了一對一比較菜單時(shí)產(chǎn)生具有相同代碼的輸入漢字的索引文件,顯示按相同的漢字輸入的位像,并且點(diǎn)擊和標(biāo)記與相應(yīng)的輸入字符不同的位像;以及在僅僅收集帶標(biāo)記的位像之后校正錯(cuò)誤輸入的字符和與其相對應(yīng)的字符文本。
權(quán)利要求
1.一種采用一對一比較的漢字校對系統(tǒng),包括以下步驟產(chǎn)生并存儲(chǔ)從掃描儀掃描的原始拷貝轉(zhuǎn)換而來的原始圖像;通過一個(gè)分割執(zhí)行程序?qū)⒃紙D像分割成對應(yīng)著原始圖像中的漢字的各個(gè)圖像,然后通過一個(gè)位圖產(chǎn)生程序產(chǎn)生分割的位圖;由用戶輸入漢字并且選擇一個(gè)一對一比較菜單,根據(jù)上述位圖,通過一個(gè)索引文件產(chǎn)生程序產(chǎn)生在上述輸入字符當(dāng)中具有相同代碼的漢字的索引文件,然后檢查分割的位像;在完成檢查之后,同時(shí)在屏幕的左邊顯示輸入的字符文本并在其右邊顯示對應(yīng)著輸入字符文本的分割的位像,以便通過一個(gè)比較程序在上述輸入字符文本和上述分割的位像之間進(jìn)行觀察比較;確認(rèn)在上述右邊的原始位像當(dāng)中是否包括任何與上述左邊的字符文本不同的位像,并且點(diǎn)擊和標(biāo)記不同的位像;收集帶標(biāo)記的位像和與其相對應(yīng)的字符文本,并且顯示上述帶標(biāo)記的位像和字符文本,使上述用戶能夠再次輸入正確的漢字文本;并且執(zhí)行整體的校對,使再次輸入的正確文本在上述原先輸入的原始文本中能夠得到自動(dòng)反映和校正。
2.按照權(quán)利要求1的采用一對一比較的漢字校對系統(tǒng),其特征是,如果上述輸入文本有許多,就在單個(gè)屏幕上顯示上述位像和按照相同的字符輸入的上述字符文本,由上述用戶為不同于上述輸入字符文本的上述位像做標(biāo)記,并且,如果上述用戶想要對文本進(jìn)行校正,上述用戶就可以通過收集并顯示上述帶標(biāo)記的位像和與其相對應(yīng)的上述輸入文本而再次輸入正確的漢字。
全文摘要
本發(fā)明涉及一種采用一對一比較的校對系統(tǒng)。按照本發(fā)明可以完成快速和簡單的漢字文獻(xiàn)校對,不用檢查整個(gè)中文文獻(xiàn),只需要執(zhí)行以下步驟:掃描準(zhǔn)備輸入的原始中文文獻(xiàn)并且產(chǎn)生原始文獻(xiàn)的原始圖像;通過將原始圖像自動(dòng)分割成漢字圖像而產(chǎn)生分割的位圖;采用光學(xué)字符識(shí)別(OCR)或一對一輸入的方法根據(jù)原始文獻(xiàn)輸入對應(yīng)著各個(gè)位像的漢字;在用戶選擇了一對一比較菜單時(shí)產(chǎn)生具有相同代碼的輸入漢字的索引文件,顯示按相同的漢字輸入的位像,并且點(diǎn)擊和標(biāo)記與相應(yīng)的輸入字符不同的位像;以及在僅僅收集帶標(biāo)記的位像之后校正錯(cuò)誤輸入的字符和與其相對應(yīng)的字符文本。
文檔編號(hào)G06F17/28GK1383516SQ01801889
公開日2002年12月4日 申請日期2001年4月11日 優(yōu)先權(quán)日2000年7月5日
發(fā)明者全政桓 申請人:八萬系統(tǒng)有限公司