專利名稱:內(nèi)容判斷的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及計算機數(shù)據(jù)處理領(lǐng)域,具體而言,涉及內(nèi)容判斷的方法和裝置。
背景技術(shù):
在生活中,信息的傳遞媒介是通過字符數(shù)據(jù)展示給讀者,包括文字、圖等,主要通過電子形式,或者印刷品形式。例如,在報紙、雜志、期刊等方面,由于撰稿人在發(fā)稿時,使用了一些古文字、簡寫字等,會由于應(yīng)用這些文字,從而應(yīng)用影響閱讀,在報紙、雜志、期刊等這些材料出版前,也要進行相應(yīng)的校對,從而面向相應(yīng)的讀者,如為普通大眾閱讀的,為小學生、中學生、幼兒等出版的相應(yīng)文字作品,更需要仔細校對。還有網(wǎng)絡(luò)作品,例如為各個不同年齡階段使用的付費網(wǎng)站,提供各種網(wǎng)絡(luò)文字數(shù)據(jù),這些網(wǎng)站上的文字數(shù)據(jù),由于也是要面對不同的年齡段的讀者。因此,其公布的文字作品在通過互聯(lián)網(wǎng)發(fā)表前,也需要進行文字校對。特別是對教材配套的教輔中的試題,這類文字作品有嚴格的規(guī)定,不能出現(xiàn)超綱的字、詞;以使教、學、練更好地開展。如小學一年級第二課中的配套試題,不能出現(xiàn)第三課或以后課程中學到的生字。但目前的網(wǎng)絡(luò)教育和出版領(lǐng)域中,對教輔書中生字的是否超綱的檢查還基于人工逐字逐句的方式進行。采用人工校對的方式,很容易出現(xiàn)失誤,人工校對時,需要確定每套教材所對應(yīng)的學年、以及教材允許有多少超綱字、不允許有多少超綱字,在基于這些超綱字,人工在教材中查找,修改相應(yīng)的教材,以使這些教材適應(yīng)于相應(yīng)學年的學生。采用電子設(shè)備、如計算機進行校對出版物時,可通過計算機查找相應(yīng)的超綱字,雖然檢索過程可以減輕些工作量,但這種校對方式需要用戶通過計算機輸入要查詢的檢索詞,由計算機逐個查找,存在用戶工作量大,計算機處理周期長、效率低的問題。
發(fā)明內(nèi)容
本發(fā)明旨在提供一種內(nèi)容判斷的方法和裝置,以解決上述計算機在校對文字數(shù)據(jù)時,處理周期長、效率低的問題。在本發(fā)明的實施例中,提供了一種內(nèi)容判斷的方法,包括確定內(nèi)容所對應(yīng)的級別;在生字集中檢索所述內(nèi)容中的字符的級別;將所述字符與所述內(nèi)容進行比較,并提示比較結(jié)果。在本發(fā)明的實施例中,還提供了一種內(nèi)容判斷的裝置,包括識別單元,用于確定內(nèi)容所對應(yīng)的級別;檢索單元,用于在生字集中檢索所述內(nèi)容中的字符的級別;比較單元,用于將所述字符與所述內(nèi)容進行比較,并提示比較結(jié)果。本發(fā)明因為采用預(yù)先定義了被檢索內(nèi)容的級別、以及生字集的級別,通過在生字集中檢索到內(nèi)容的字符的級別與內(nèi)容級別的比較,可校對當前內(nèi)容中的字符是否正常,從而實現(xiàn)快速對各類字符進行校對,提高了校對的效率,縮短了校對的時間。
此處所說明的附圖用來提供對本發(fā)明的進一步理解,構(gòu)成本申請的一部分,本發(fā)明的示意性實施例及其說明用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的不當限定。在附圖中圖I示出了實施例一的流程圖;圖2示出了實施例二的流程圖;圖3示出了實施例三的流程圖;圖4示出了實施例四中裝置的結(jié)構(gòu)示意圖。
具體實施例方式下面將參考附圖并結(jié)合實施例,來詳細說明本發(fā)明。本發(fā)明可應(yīng)用計算機設(shè)備中,對各種文字材料進行校對,如對試題、期刊、雜志的校對等。參見圖1,圖I是本發(fā)明實施例一的流程圖,包括以下步驟Sll :確定內(nèi)容所對應(yīng)的級別。上述的內(nèi)容可以包括各種類型字符數(shù)據(jù)的文檔,如試題、面向特定學齡階段的報紙、期刊等。這些內(nèi)容會被從級別序列中,預(yù)先賦予一個級別。S12 :在生字集中檢索所述內(nèi)容中的字符的級別。生字集中會預(yù)先存儲字符數(shù)據(jù)、以及每個字符對應(yīng)的級別等數(shù)據(jù)及對應(yīng)關(guān)系,如漢字、或日文等,生字集可以采用二維數(shù)據(jù)庫的形式存儲,例如采用Oracle、MicrosoftSQL Server> MicrosoftAccess、MySQL 等。通過生字集中存儲的數(shù)據(jù)及對應(yīng)關(guān)系,可以檢索出該字符對應(yīng)的級別。S13 :將所述字符與所述內(nèi)容進行比較,并提示比較結(jié)果。優(yōu)選地,在生字集中檢索出字符,進而可檢索出相應(yīng)的級別,與內(nèi)容的級別進行比較后,輸出比較結(jié)果。例如,當在生字集中檢索出的字符的級別高于內(nèi)容的級別,則提示該字符超綱。上述的實施例一中的內(nèi)容判斷過程,可以采用多種形式予以實現(xiàn),下面通過實施例二詳細說明一種實現(xiàn)方式。在實施例二中,被判斷的內(nèi)容為試題類的文檔,例如,為不同的教材編寫的試題,教材可能包括各個出版社出版的教材,每個教材又包括各種科目的課本,如語文、體育等。可事先建立每個教材的科目所對應(yīng)課本的生字集,并判斷試題中的字符是否超出內(nèi)容的級別,從而判斷是否超綱。下面結(jié)合圖2詳細說明。參見圖2,包括以下步驟S21 :創(chuàng)建生字集以及內(nèi)容;按照教材體系創(chuàng)建生字集,如按照人民教育出版社出版的語文、體育等課本創(chuàng)建生字集,按照北京大學出版社出版的語文、體育等課本創(chuàng)建生字集等。創(chuàng)建過程中,可通過關(guān)系型數(shù)據(jù)庫創(chuàng)建,生字集包括多個數(shù)據(jù)項,每個所述數(shù)據(jù)項包括字符屬性、索引屬性和級別屬性,字符屬性包含用于被檢索的字符,如漢字字符;索引屬性包含所述被檢索的字符的索引,如每個漢字的內(nèi)碼;級別屬性包含所述被檢索的字符在所述教材體系中的級別,并表示某一課,如漢字“樂”的級別為84785,表示第8課。這些屬性的數(shù)據(jù)可分類存儲在數(shù)據(jù)庫中,數(shù)據(jù)關(guān)系可如以下的表I所示。
表I
權(quán)利要求
1.一種內(nèi)容判斷的方法,其特征在于,包括 確定內(nèi)容所對應(yīng)的級別; 在生字集中檢索所述內(nèi)容中的字符的級別; 將所述字符與所述內(nèi)容進行比較,并提示比較結(jié)果。
2.根據(jù)權(quán)利要求I所述的方法,其特征在于,在所述檢索之前,還包括 根據(jù)教材體系創(chuàng)建所述生字集,所述生字集包括多個數(shù)據(jù)項,每個所述數(shù)據(jù)項包括字符屬性、索引屬性和級別屬性,所述字符屬性包含用于被檢索的字符,所述索引屬性包含所述被檢索的字符的索引,所述級別屬性包含所述被檢索的字符在所述教材體系中的級別。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述檢索的過程包括 解析所述內(nèi)容中的字符的索引; 按照所述索引在所述生字集中查找所述索引屬性; 從具有所述索引屬性的數(shù)據(jù)項的所述級別屬性中提取所述字符的級別。
4.根據(jù)權(quán)利要求I所述的方法,其特征在于,所述索引為漢字的內(nèi)碼。
5.根據(jù)權(quán)利要求I所述的方法,其特征在于,將所述字符與所述內(nèi)容進行比較是指將所述字符的級別與所述內(nèi)容的級別進行比較。
6.根據(jù)權(quán)利要求I所述的方法,其特征在于,所述提示比較結(jié)果包括 如果所述字符的級別大于所述內(nèi)容的級別,則提示所述字符數(shù)據(jù)為超綱字符數(shù)據(jù)。
7.根據(jù)權(quán)利要求I所述的方法,其特征在于,所述比較之后,還包括 如果所述字符的級別大于所述內(nèi)容的級別,則修改所述內(nèi)容。
8.根據(jù)權(quán)利要求I所述的方法,其特征在于,所述內(nèi)容為試題類文檔內(nèi)容。
9.一種內(nèi)容判斷的裝置,其特征在于, 識別單元,用于確定內(nèi)容所對應(yīng)的級別; 檢索單元,用于在生字集中檢索所述內(nèi)容中的字符的級別; 比較單元,用于將所述字符與所述內(nèi)容進行比較,并提示比較結(jié)果。
10.根據(jù)權(quán)利要求9所述的裝置,其特征在于,還包括 創(chuàng)建單元,用于根據(jù)教材體系創(chuàng)建所述生字集,所述生字集包括多個數(shù)據(jù)項,每個所述數(shù)據(jù)項包括字符屬性、索引屬性和級別屬性,所述字符屬性包含用于被檢索的字符,所述索引屬性包含所述被檢索的字符的索引,所述級別屬性包含所述被檢索的字符在所述教材體系中的級別。
11.根據(jù)權(quán)利要求10所述的裝置,其特征在于,所述檢索單元包括 第一子單元,用于解析所述內(nèi)容中的字符的索引; 第二子單元,按照所述索引在所述生字集中查找所述索引屬性; 第三子單元,從具有所述索引屬性的數(shù)據(jù)項的所述級別屬性中提取所述字符的級別。
12.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述比較單元包括 判別單元,用于比較所述字符的級別與所述內(nèi)容的級別; 提示單元,用于如果所述字符的級別大于所述內(nèi)容的級別,則提示所述字符數(shù)據(jù)為超綱字符數(shù)據(jù)。
全文摘要
本發(fā)明提供了一種內(nèi)容判斷的方法和裝置,本發(fā)明方法包括確定內(nèi)容所對應(yīng)的級別;在生字集中檢索所述內(nèi)容中的字符的級別;比較所述字符的級別與所述內(nèi)容的級別,并提示比較結(jié)果。本發(fā)明的裝置包括識別單元,用于確定內(nèi)容所對應(yīng)的級別;檢索單元,用于在生字集中檢索所述內(nèi)容中的字符的級別;比較單元,用于比較所述字符的級別與所述內(nèi)容的級別,并提示比較結(jié)果。本發(fā)明因為采用預(yù)先定義了被檢索內(nèi)容的級別、以及生字集的級別,通過在生字集中檢索到內(nèi)容的字符的級別與內(nèi)容級別的比較,可校對當前內(nèi)容中的字符是否正常,從而實現(xiàn)快速對各類字符進行校對,提高了校對的效率,縮短了校對的時間??s短了校對的時間。
文檔編號G06F17/27GK102982017SQ20111025909
公開日2013年3月20日 申請日期2011年9月2日 優(yōu)先權(quán)日2011年9月2日
發(fā)明者李少明, 文偉龍 申請人:北大方正集團有限公司, 北京北大方正電子有限公司