1.一種試題數(shù)據(jù)處理方法,其特征在于,所述方法包括:
S101、根據(jù)待測(cè)學(xué)科的考試大綱信息列表中包括的各知識(shí)點(diǎn)信息,在與所述待測(cè)學(xué)科對(duì)應(yīng)的試題庫(kù)中獲取與所述各知識(shí)點(diǎn)信息匹配的試題并存儲(chǔ)至待查重試題庫(kù)中;
S102、按照預(yù)設(shè)規(guī)則從待查重試題庫(kù)中提取試題得到待查重試題,并從待查重試題庫(kù)中篩選出與所述待查重試題相似度超過(guò)預(yù)設(shè)值的試題集合,得到相似試題集合;
S103、分別提取所述待查重試題的數(shù)據(jù)特征和所述相似試題集合中試題的數(shù)據(jù)特征;
S104、按順序分別采用相似度算法計(jì)算待查重試題的數(shù)據(jù)特征和相似試題集合中試題的數(shù)據(jù)特征的相似度,根據(jù)相似度得到與所述待查重試題重復(fù)的試題,并將其從所述待查重試題庫(kù)刪除,得到練習(xí)試題庫(kù)。
2.如權(quán)利要求1所述的一種試題數(shù)據(jù)處理方法,其特征在于,所述S101具體包括:
獲取與所述待測(cè)學(xué)科的各知識(shí)點(diǎn)信息對(duì)應(yīng)的試題存儲(chǔ)地址,并在與所述待測(cè)學(xué)科對(duì)應(yīng)的試題庫(kù)中所述試題存儲(chǔ)地址指向的存儲(chǔ)空間中獲取與所述各知識(shí)點(diǎn)信息對(duì)應(yīng)的試題。
3.如權(quán)利要求1所述的一種試題數(shù)據(jù)處理方法,其特征在于,所述S102具體包括:
采用布爾模型和余弦定理分別計(jì)算出所述待查重試題庫(kù)中其他試題與所述待查重試題的第一相似度值,如果所述第一相似度值大于預(yù)設(shè)第一相似度值,則該試題與所述待查重試題相似度超過(guò)預(yù)設(shè)值,得到相似試題集合。
4.如權(quán)利要求1所述的一種試題數(shù)據(jù)處理方法,其特征在于,所述S103中所述數(shù)據(jù)特征具體包括數(shù)字、字母、漢字和漢字的長(zhǎng)度。
5.如權(quán)利要求1所述的一種試題數(shù)據(jù)處理方法,其特征在于,所述S104之后還包括:
獲取用戶對(duì)所述練習(xí)試題庫(kù)中的試題的答復(fù)信息,并檢測(cè)所述答復(fù)信息是否與預(yù)設(shè)的該試題的試題答案一致,若一致,則將該試題從所述練習(xí)數(shù)據(jù)可中刪除并移動(dòng)至備用試題庫(kù);若不一致,則依然將該試題保存在所述練習(xí)試題庫(kù)中。
6.一種試題數(shù)據(jù)處理系統(tǒng),其特征在于,所述系統(tǒng)包括:
匹配存儲(chǔ)單元,用于根據(jù)待測(cè)學(xué)科的考試大綱信息列表中包括的各知識(shí)點(diǎn)信息,在與所述待測(cè)學(xué)科對(duì)應(yīng)的試題庫(kù)中獲取與所述各知識(shí)點(diǎn)信息匹配的試題并存儲(chǔ)至待查重試題庫(kù)中;
篩選單元,用于按照預(yù)設(shè)規(guī)則從待查重試題庫(kù)中提取試題得到待查重試題,并從待查重試題庫(kù)中篩選出與所述待查重試題相似度超過(guò)預(yù)設(shè)值的試題集合,得到相似試題集合;
提取單元,用于分別提取所述待查重試題的數(shù)據(jù)特征和所述相似試題集合中試題的數(shù)據(jù)特征;
計(jì)算單元,用于按順序分別采用相似度算法計(jì)算待查重試題的數(shù)據(jù)特征和相似試題集合中試題的數(shù)據(jù)特征的相似度,根據(jù)相似度得到與所述待查重試題重復(fù)的試題;
查重刪除單元,用于將與所述待查重試題重復(fù)的試題從所述待查重試題庫(kù)刪除,得到練習(xí)試題庫(kù)。
7.如權(quán)利要求6所述的一種試題數(shù)據(jù)處理系統(tǒng),其特征在于,所述匹配存儲(chǔ)單元具體用于:
獲取與所述待測(cè)學(xué)科的各知識(shí)點(diǎn)信息對(duì)應(yīng)的試題存儲(chǔ)地址,并在與所述待測(cè)學(xué)科對(duì)應(yīng)的試題庫(kù)中所述試題存儲(chǔ)地址指向的存儲(chǔ)空間中獲取與所述各知識(shí)點(diǎn)信息對(duì)應(yīng)的試題。
8.如權(quán)利要求6所述的一種試題數(shù)據(jù)處理系統(tǒng),其特征在于,所述篩選單元具體用于:
采用布爾模型和余弦定理分別計(jì)算出所述待查重試題庫(kù)中其他試題與所述待查重試題的第一相似度值,如果所述第一相似度值大于預(yù)設(shè)第一相似度值,則該試題與所述待查重試題相似度超過(guò)預(yù)設(shè)值,得到相似試題集合。
9.如權(quán)利要求6所述的一種試題數(shù)據(jù)處理系統(tǒng),其特征在于,所述提取單元中所述數(shù)據(jù)特征具體包括數(shù)字、字母、漢字和漢字的長(zhǎng)度。
10.如權(quán)利要求6所述的一種試題數(shù)據(jù)處理系統(tǒng),其特征在于,還包括:
檢測(cè)刪除單元,用于獲取用戶對(duì)所述練習(xí)試題庫(kù)中的試題的答復(fù)信息,并檢測(cè)所述答復(fù)信息是否與預(yù)設(shè)的該試題的試題答案一致,若一致,則將該試題從所述練習(xí)數(shù)據(jù)可中刪除并移動(dòng)至備用試題庫(kù);若不一致,則依然將該試題保存在所述練習(xí)試題庫(kù)中。