專利名稱:一種數(shù)據(jù)處理和檢索的方法及設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及計(jì)算機(jī)技術(shù)領(lǐng)域,特別涉及一種數(shù)據(jù)處理和檢索的方法及設(shè)備。
背景技術(shù):
檢索是指從文獻(xiàn)資料、網(wǎng)絡(luò)信息等信息集合中查找到自己需要的信息或資料的過程。為了進(jìn)行檢索,通常需要對(duì)資料進(jìn)行索引。傳統(tǒng)文獻(xiàn)資料需要提取題名、作者、出版年、主題詞等作為索引,而在網(wǎng)絡(luò)時(shí)代,計(jì)算機(jī)可以對(duì)全文進(jìn)行索引,即文中每一個(gè)詞都能成為檢索點(diǎn)。
全文檢索是計(jì)算機(jī)程序通過掃描文章中的每一個(gè)詞,對(duì)每一個(gè)詞建立一個(gè)索引,指明該詞在文章中出現(xiàn)的次數(shù)和位置。當(dāng)用戶查詢時(shí)根據(jù)建立的索引查找,類似于通過字典的檢索字表查字的過程。
功能上全文檢索系統(tǒng)需要具有建立索引,處理查詢返回結(jié)果集,增加索引,優(yōu)化索引結(jié)構(gòu)等功能。結(jié)構(gòu)上具有索引引擎,查詢引擎,文本分析引擎和對(duì)外接口等。
隨著全球范圍內(nèi)數(shù)據(jù)庫中存儲(chǔ)的數(shù)據(jù)量急劇增加,人們已經(jīng)可以很容易的獲得各種信息,但是如何突破海量數(shù)據(jù)檢索效率的瓶頸,對(duì)這些數(shù)據(jù)進(jìn)行處理和分析,實(shí)現(xiàn)在海量數(shù)據(jù)中快速地檢索數(shù)據(jù),滿足用戶實(shí)時(shí)性檢索的需求一直是個(gè)問題。
綜上所述,目前檢索的效率比較低,檢索速度比較慢。發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供一種數(shù)據(jù)處理和檢索的方法及設(shè)備,用以解決現(xiàn)有技術(shù)中存在的檢索的效率比較低,檢索速度比較慢的問題。
本發(fā)明實(shí)施例提供的一種數(shù)據(jù)處理的方法,包括:
根據(jù)第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的檢索范圍,從第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的第N-1級(jí)數(shù)據(jù)信息的數(shù)據(jù)集合中提取出第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)集合,其中N是正整數(shù);
根據(jù)第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)策略,從第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)集合中檢索對(duì)應(yīng)的數(shù)據(jù);
將檢索到的所有數(shù)據(jù)分配相同的標(biāo)識(shí),并建立檢索所使用的第N級(jí)數(shù)據(jù)信息、標(biāo)識(shí)和數(shù)據(jù)的對(duì)應(yīng)關(guān)系。
本發(fā)明實(shí)施例提供的一種基于本發(fā)明實(shí)施例的數(shù)據(jù)處理方法進(jìn)行數(shù)據(jù)檢索的方法,包括:
根據(jù)數(shù)據(jù)信息和標(biāo)識(shí)的對(duì)應(yīng)關(guān)系,確定用戶需要檢索的數(shù)據(jù)信息對(duì)應(yīng)的標(biāo)識(shí);
根據(jù)標(biāo)識(shí)和數(shù)據(jù)的對(duì)應(yīng)關(guān)系,確定用戶需要檢索的數(shù)據(jù)信息對(duì)應(yīng)的標(biāo)識(shí)對(duì)應(yīng)的數(shù)據(jù);
從確定的數(shù)據(jù)中進(jìn)行數(shù)據(jù)檢索。
本發(fā)明實(shí)施例提供的一種數(shù)據(jù)處理的設(shè)備,包括:
第一處理模塊,用于根據(jù)第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的檢索范圍,從第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的第N-1級(jí)數(shù)據(jù)信息的數(shù)據(jù)集合中提取出第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)集合,其中N是正整數(shù);
第二處理模塊,用于根據(jù)第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)策略,從第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)集合中檢索對(duì)應(yīng)的數(shù)據(jù);
建立模塊,用于將檢索到的所有數(shù)據(jù)分配相同的標(biāo)識(shí),并建立檢索所使用的第N級(jí)數(shù)據(jù)信息、標(biāo)識(shí)和數(shù)據(jù)的對(duì)應(yīng)關(guān)系。
本發(fā)明實(shí)施例提供的一種基于本發(fā)明實(shí)施例的數(shù)據(jù)處理方法進(jìn)行數(shù)據(jù)檢索的設(shè)備,包括:
第一確定模塊,用于根據(jù)數(shù)據(jù)信息和標(biāo)識(shí)的對(duì)應(yīng)關(guān)系,確定用戶需要檢索的數(shù)據(jù)信息對(duì)應(yīng)的標(biāo)識(shí);
第二確定模塊,用于根據(jù)標(biāo)識(shí)和數(shù)據(jù)的對(duì)應(yīng)關(guān)系,確定用戶需要檢索的數(shù)據(jù)信息對(duì)應(yīng)的標(biāo)識(shí)對(duì)應(yīng)的數(shù)據(jù);
檢索模塊,用于從確定的數(shù)據(jù)中進(jìn)行數(shù)據(jù)檢索。
由于從第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)集合中檢索對(duì)應(yīng)的數(shù)據(jù),從而提高了檢索的效率和速度;進(jìn)一步提高了檢索的性能。
圖1為本發(fā)明實(shí)施例數(shù)據(jù)處理的方法流程示意圖2為本發(fā)明實(shí)施例設(shè)置數(shù)據(jù)信息的示意圖3為本發(fā)明實(shí)施例進(jìn)行數(shù)據(jù)檢索的方法流程示意圖4為本發(fā)明實(shí)施例數(shù)據(jù)處理的設(shè)備的結(jié)構(gòu)示意圖5為本發(fā)明實(shí)施例進(jìn)行數(shù)據(jù)檢索的設(shè)備的結(jié)構(gòu)示意圖。
具體實(shí)施方式
本發(fā)明實(shí)施例從第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的第N-1級(jí)數(shù)據(jù)信息的數(shù)據(jù)集合中提取出第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)集合,根據(jù)第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)策略,從第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)集合中檢索對(duì)應(yīng)的數(shù)據(jù),并將檢索到的所有數(shù)據(jù)分配相同的標(biāo)識(shí),并建立檢索所使用的第N級(jí)數(shù)據(jù)信息、標(biāo)識(shí)和數(shù)據(jù)的對(duì)應(yīng)關(guān)系。由于從第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)集合中檢索對(duì)應(yīng)的數(shù)據(jù),從而提高了檢索的效率和速度。
下面結(jié)合說明書附圖對(duì)本發(fā)明實(shí)施例作進(jìn)一步詳細(xì)描述。
如圖1所示,本發(fā)明實(shí)施例數(shù)據(jù)處理的方法包括下列步驟:
步驟101、根據(jù)第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的檢索范圍,從第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的第N-1級(jí)數(shù)據(jù)信息的數(shù)據(jù)集合中提取出第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)集合,其中N是正整數(shù);
步驟102、根據(jù)第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)策略,從第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)集合中檢索對(duì)應(yīng)的數(shù)據(jù);
步驟103、將檢索到的所有數(shù)據(jù)分配相同的標(biāo)識(shí),并建立檢索所使用的第N級(jí)數(shù)據(jù)信息、標(biāo)識(shí)和數(shù)據(jù)的對(duì)應(yīng)關(guān)系。
在實(shí)施中,用戶會(huì)預(yù)先設(shè)置數(shù)據(jù)信息具體設(shè)置幾級(jí)以及每集有幾個(gè)數(shù)據(jù)信息可以根據(jù)用戶需要進(jìn)行設(shè)定。
比如可以按照?qǐng)D2的方式設(shè)置:
第一級(jí)數(shù)據(jù)信息:金融行業(yè)庫;
其中,金融行業(yè)庫還對(duì)應(yīng)多個(gè)第二級(jí)數(shù)據(jù)信息:法律法規(guī)、金融監(jiān)管、銀行業(yè)、保險(xiǎn)業(yè)、證券業(yè)和其他金融業(yè);
其中,第二級(jí)數(shù)據(jù)信息法律法規(guī)還對(duì)應(yīng)多個(gè)第三級(jí)數(shù)據(jù)信息:財(cái)政法、金融法和經(jīng)濟(jì)法;
其中,第二級(jí)數(shù)據(jù)信息金融監(jiān)管還對(duì)應(yīng)多個(gè)第三級(jí)數(shù)據(jù)信息:金融綜合監(jiān)管、市場(chǎng)準(zhǔn)入監(jiān)管、運(yùn)營監(jiān)管、市場(chǎng)退出監(jiān)管和外匯監(jiān)管。
在實(shí)施中,每個(gè)數(shù)據(jù)信息都會(huì)對(duì)應(yīng)一個(gè)數(shù)據(jù)集合,在為檢索所使用的第N級(jí)數(shù)據(jù)信息、標(biāo)識(shí)和數(shù)據(jù)的對(duì)應(yīng)關(guān)系進(jìn)行前期檢索時(shí)只需要對(duì)每個(gè)數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)集合進(jìn)行檢索即可。
較佳地,步驟101中,若N是1,第一級(jí)數(shù)據(jù)信息對(duì)應(yīng)的第N-1級(jí)數(shù)據(jù)信息的數(shù)據(jù)集合是數(shù)據(jù)庫中的所有數(shù)據(jù)。也就是說,對(duì)于第一級(jí)數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)集合是從數(shù)據(jù)庫的所有數(shù)據(jù)中確定的。
對(duì)于非第一級(jí)數(shù)據(jù)信息的數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)集合是從其上一級(jí)的數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)集合中確定的。
比如第二級(jí)數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)集合是從其對(duì)應(yīng)的第一級(jí)數(shù)據(jù)信息的數(shù)據(jù)集合中確定的。以圖2為例,法律法規(guī)對(duì)應(yīng)的數(shù)據(jù)集合是從金融行業(yè)庫對(duì)應(yīng)的數(shù)據(jù)集合中確定的。
比如第三級(jí)數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)集合是從其對(duì)應(yīng)的第二級(jí)數(shù)據(jù)信息的數(shù)據(jù)集合中確定的。以圖2為例,財(cái)政法對(duì)應(yīng)的數(shù)據(jù)集合是從法律法規(guī)對(duì)應(yīng)的數(shù)據(jù)集合中確定的。
在實(shí)施中,本發(fā)明實(shí)施例的數(shù)據(jù)集合包括但不限于下列數(shù)據(jù)中的至少一種:
圖書、報(bào)紙、年鑒。
較佳地,步驟101中,在確定了對(duì)應(yīng)的數(shù)據(jù)集合后,還需要進(jìn)一步查看用戶是否輸入檢索范圍。
若用戶輸入檢索范圍,將用戶輸入的檢索范圍作為第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的檢索范圍,然后根據(jù)第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的檢索范圍,從第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的第N-1級(jí)數(shù)據(jù)信息的數(shù)據(jù)集合中提取出第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)集合。
比如用戶輸入金融行業(yè)庫對(duì)應(yīng)的檢索范圍是X圖書中第10 200頁中所有與金融有關(guān)的內(nèi)容,則從數(shù)據(jù)庫中提取出X圖書中的第10 200頁所有與金融有關(guān)的內(nèi)容作為金融行業(yè)庫對(duì)應(yīng)的數(shù)據(jù)集合。
比如用戶輸入法律法規(guī)對(duì)應(yīng)的檢索范圍是X圖書中的第10 15頁中所有與金融有關(guān)的內(nèi)容,則從金融行業(yè)庫對(duì)應(yīng)的數(shù)據(jù)集合中提取出X圖書中的第10 15頁中所有與金融有關(guān)的內(nèi)容。
比如用戶輸入法律法規(guī)對(duì)應(yīng)的檢索范圍是Yl出版社和Y2出版社,則從金融行業(yè)庫對(duì)應(yīng)的數(shù)據(jù)集合中提取出Yl出版社和Y2出版社的所有圖書。
若用戶未輸入檢索范圍,將第N-1級(jí)數(shù)據(jù)信息對(duì)應(yīng)的檢索范圍作為第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的檢索范圍,然后根據(jù)第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的檢索范圍,從第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的第N-1級(jí)數(shù)據(jù)信息的數(shù)據(jù)集合中提取出第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)集合。
比如用戶輸入金融行業(yè)庫對(duì)應(yīng)的檢索范圍是X圖書中第10 200頁中所有與金融有關(guān)的內(nèi)容,則從數(shù)據(jù)庫中提取出X圖書中的第10 200頁所有與金融有關(guān)的內(nèi)容作為金融行業(yè)庫對(duì)應(yīng)的數(shù)據(jù)集合。
用戶未輸入法律法規(guī)對(duì)應(yīng)的檢索范圍,則將金融行業(yè)庫對(duì)應(yīng)的檢索范圍作為法律法規(guī)對(duì)應(yīng)的檢索范圍。由于將金融行業(yè)庫對(duì)應(yīng)的檢索范圍作為法律法規(guī)對(duì)應(yīng)的檢索范圍,所以法律法規(guī)對(duì)應(yīng)的數(shù)據(jù)集合與金融行業(yè)庫對(duì)應(yīng)的數(shù)據(jù)集合也相同。
比如金融行業(yè)庫對(duì)應(yīng)的數(shù)據(jù)集合是X圖書中第10 200頁中所有與金融有關(guān)的內(nèi)容,由于法律法規(guī)對(duì)應(yīng)的檢索范圍是X圖書中第10 200頁中所有與金融有關(guān)的內(nèi)容,所以法律法規(guī)對(duì)應(yīng)的數(shù)據(jù)集合與金融行業(yè)庫對(duì)應(yīng)的數(shù)據(jù)集合也相同。
較佳地,數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)策略可以包括檢索策略和/或文本挖掘策略,具體可以根據(jù)用戶需要進(jìn)行設(shè)定。
比如用戶可以設(shè)置一些關(guān)鍵詞作為檢索策略;還可以設(shè)置一些篩選條件作為檢索策略,例如數(shù)據(jù)錄入時(shí)間,數(shù)據(jù)的作者等。在實(shí)施中,篩選條件和關(guān)鍵詞可以組合使用,也可以單獨(dú)使用。
比如用戶可以設(shè)置分類要求、主題詞等作為文本挖掘策略。
其中,每個(gè)數(shù)據(jù)信息都會(huì)對(duì)應(yīng)一個(gè)數(shù)據(jù)策略,不同的數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)策略可以相同也可以不同,步驟102中,根據(jù)數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)策略,從步驟101中確定的數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)集合中檢索對(duì)應(yīng)的數(shù)據(jù)。
在檢索到數(shù)據(jù)后,步驟103中會(huì)針對(duì)同一個(gè)數(shù)據(jù)信息檢索到的數(shù)據(jù)分配同一個(gè)標(biāo)識(shí),不同的數(shù)據(jù)信息對(duì)應(yīng)的標(biāo)識(shí)不同,這樣實(shí)際上就建立了數(shù)據(jù)信息和標(biāo)識(shí)之間,以及標(biāo)識(shí)和數(shù)據(jù)之間的對(duì)應(yīng)關(guān)系。
較佳地,觸發(fā)進(jìn)行數(shù)據(jù)處理的方式有很多,下面列舉幾種:
方式一、手動(dòng)觸發(fā)。
具體的,在收到用戶的指令后,開始執(zhí)行步驟101。比如用戶在需要進(jìn)行前期檢索時(shí)可以點(diǎn)擊執(zhí)行按鈕,在確定用戶點(diǎn)擊執(zhí)行按鈕后開始執(zhí)行步驟101。
方式二、自動(dòng)執(zhí)行。
具體的,用戶可以預(yù)先設(shè)定一段時(shí)間,這個(gè)時(shí)間可以是具體的時(shí)間,比如10:30分,則在10:30分時(shí),開始執(zhí)行步驟101 ;還可以設(shè)置具體的時(shí)間的同時(shí)再設(shè)置次數(shù),比如5次,則在10:30分時(shí),開始執(zhí)行步驟101,并循環(huán)執(zhí)行5次。
這個(gè)時(shí)間還可以是一段時(shí)間,比如30分鐘,則每30分鐘,開始執(zhí)行步驟101,也就是說周期執(zhí)行步驟101。
如果每次進(jìn)行前期檢索時(shí)都從第N-1級(jí)數(shù)據(jù)信息的數(shù)據(jù)集合中所有數(shù)據(jù)中提取出對(duì)應(yīng)的數(shù)據(jù),隨著數(shù)據(jù)量的增加,檢索的效率也會(huì)越來越低。一種較佳的方式是:步驟101中,確定上次提取出第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)集合的時(shí)刻到當(dāng)前時(shí)刻之間,第N-1級(jí)數(shù)據(jù)信息的數(shù)據(jù)集合中發(fā)生變化的數(shù)據(jù);
根據(jù)第N級(jí)數(shù)據(jù)信息和檢索范圍的對(duì)應(yīng)關(guān)系,從發(fā)生變化的數(shù)據(jù)中提取出第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù),并將提取的數(shù)據(jù)置于第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)集合中。
這里的發(fā)生變化是指新增加的數(shù)據(jù)或修改的數(shù)據(jù)。
如果是修改的數(shù)據(jù),則將提取的數(shù)據(jù)置于第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)集合中后,還需要?jiǎng)h除對(duì)應(yīng)未修改的數(shù)據(jù)。
比如第N-1級(jí)數(shù)據(jù)信息的數(shù)據(jù)集合中有A、B、C、D和E,如果B、C和D發(fā)生了變化,則只需要從B、C和D中提取第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)。假設(shè)提取了 B和C,當(dāng)前第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)集合包括A和未修改的B,則將B和C加入第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)集合后,還需要?jiǎng)h除未修改的B,最后第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)集合包括A、B和C。
本發(fā)明實(shí)施例數(shù)據(jù)處理的方案是在用戶檢索之前,可以靈活、快速地將相關(guān)數(shù)據(jù)根據(jù)定義的數(shù)據(jù)進(jìn)行檢索,提高用戶檢索的效率,快速的為用戶提供服務(wù)
在本發(fā)明實(shí)施例數(shù)據(jù)處理的方法基礎(chǔ)上,本發(fā)明實(shí)施例還提供了一種進(jìn)行數(shù)據(jù)檢索的方法。
如圖3所示,本發(fā)明實(shí)施例進(jìn)行數(shù)據(jù)檢索的方法包括下列步驟:
步驟301、根據(jù)數(shù)據(jù)信息和標(biāo)識(shí)的對(duì)應(yīng)關(guān)系,確定用戶需要檢索的數(shù)據(jù)信息對(duì)應(yīng)的標(biāo)識(shí);
步驟302、根據(jù)標(biāo)識(shí)和數(shù)據(jù)的對(duì)應(yīng)關(guān)系,確定用戶需要檢索的數(shù)據(jù)信息對(duì)應(yīng)的標(biāo)識(shí)對(duì)應(yīng)的數(shù)據(jù);
步驟303、從確定的數(shù)據(jù)中進(jìn)行數(shù)據(jù)檢索。
其中,圖1和圖3可以合成一個(gè)流程,形成一個(gè)數(shù)據(jù)檢索的方法,即先執(zhí)行步驟101 步驟103,然后執(zhí)行步驟301 步驟303。
以圖2為例,假如用戶需要檢索的數(shù)據(jù)信息是財(cái)政法,關(guān)鍵詞是財(cái)政,則查找財(cái)政法對(duì)應(yīng)的標(biāo)識(shí),然后從該標(biāo)識(shí)對(duì)應(yīng)數(shù)據(jù)中查找符合關(guān)鍵詞是財(cái)政的數(shù)據(jù),并顯示給用戶。
上述內(nèi)容中在檢索時(shí)是以關(guān)鍵詞為例進(jìn)行說明,根據(jù)需要還可以根據(jù)發(fā)明人設(shè)定的檢索條件進(jìn)行檢索。
若本發(fā)明實(shí)施例的方案應(yīng)用到報(bào)紙數(shù)據(jù),由于報(bào)紙數(shù)據(jù)實(shí)時(shí)性更新的特征,在用戶根據(jù)自己的興趣定義數(shù)據(jù)的特征集合后,本發(fā)明實(shí)施例會(huì)對(duì)每天更新的剪報(bào)資源進(jìn)行快速的篩選,為符合特征定義的數(shù)據(jù)記錄特征標(biāo)識(shí)并傳送給剪報(bào)系統(tǒng),保證了資源的實(shí)時(shí)更新,為用戶實(shí)時(shí)的提供個(gè)性化定制的數(shù)字剪報(bào)服務(wù)。
本發(fā)明實(shí)施例還可以應(yīng)用于出版社、報(bào)社、圖書館、企事業(yè)單位等多種行業(yè),包括數(shù)字出版、數(shù)字圖書館等多種業(yè)務(wù):
出版社可以利用本發(fā)明實(shí)施例進(jìn)行圖書章節(jié)試讀、章節(jié)重組、試題題庫、專業(yè)數(shù)據(jù)庫包裝等;
報(bào)社可以利用本發(fā)明實(shí)施例進(jìn)行報(bào)紙新聞行業(yè)包裝、剪報(bào)服務(wù)等;
圖書館可以利用本發(fā)明實(shí)施例進(jìn)行館藏特色資源庫建設(shè)、資源深度加工;
企事業(yè)單位可以利用本發(fā)明實(shí)施例進(jìn)行競爭信息監(jiān)控。
基于同一發(fā)明構(gòu)思,本發(fā)明實(shí)施例中還提供了一種數(shù)據(jù)處理的設(shè)備,由于該設(shè)備解決問題的原理與發(fā)明實(shí)施例數(shù)據(jù)處理的方法相似,因此該設(shè)備的實(shí)施可以參見方法的實(shí)施,重復(fù)之處不再贅述。
如圖4所示,本發(fā)明實(shí)施例數(shù)據(jù)處理的設(shè)備包括:第一處理模塊41、第二處理模塊42和建立模塊43。
第一處理模塊41,用于根據(jù)第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的檢索范圍,從第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的第N-1級(jí)數(shù)據(jù)信息的數(shù)據(jù)集合中提取出第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)集合,其中N是正整數(shù);
第二處理模塊42,用于根據(jù)第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)策略,從第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)集合中檢索對(duì)應(yīng)的數(shù)據(jù);
建立模塊43,用于將檢索到的所有數(shù)據(jù)分配相同的標(biāo)識(shí),并建立檢索所使用的第N級(jí)數(shù)據(jù)信息、標(biāo)識(shí)和數(shù)據(jù)的對(duì)應(yīng)關(guān)系。
較佳地,若N是1,則第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的第N-1級(jí)數(shù)據(jù)信息的數(shù)據(jù)集合是數(shù)據(jù)庫中的所有數(shù)據(jù)。
較佳地,第一處理模塊41根據(jù)下列步驟確定第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的檢索范圍:
若用戶輸入檢索范圍,將用戶輸入的檢索范圍作為第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的檢索范圍;
若用戶未輸入檢索范圍,將第N-1級(jí)數(shù)據(jù)信息對(duì)應(yīng)的檢索范圍作為第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的檢索范圍。
較佳地,第一處理模塊41在收到用戶的指令后,根據(jù)第N級(jí)數(shù)據(jù)信息和檢索范圍的對(duì)應(yīng)關(guān)系,從第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的第N-1級(jí)數(shù)據(jù)信息的數(shù)據(jù)集合中提取出第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)集合;或
較佳地,第一處理模塊41在設(shè)定的時(shí)間到達(dá)時(shí),根據(jù)第N級(jí)數(shù)據(jù)信息和檢索范圍的對(duì)應(yīng)關(guān)系,從第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的第N-1級(jí)數(shù)據(jù)信息的數(shù)據(jù)集合中提取出第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)集合。
較佳地,第一處理模塊41確定上次提取出第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)集合的時(shí)刻到當(dāng)前時(shí)刻之間,第N-1級(jí)數(shù)據(jù)信息的數(shù)據(jù)集合中發(fā)生變化的數(shù)據(jù);根據(jù)第N級(jí)數(shù)據(jù)信息和檢索范圍的對(duì)應(yīng)關(guān)系,從發(fā)生變化的數(shù)據(jù)中提取出第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù),并將提取的數(shù)據(jù)置于第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)集合中。
基于同一發(fā)明構(gòu)思,本發(fā)明實(shí)施例中還提供了一種進(jìn)行數(shù)據(jù)檢索的設(shè)備,由于該設(shè)備解決問題的原理與發(fā)明實(shí)施例進(jìn)行數(shù)據(jù)檢索的方法相似,因此該設(shè)備的實(shí)施可以參見方法的實(shí)施,重復(fù)之處不再贅述。
如圖5所示,本發(fā)明實(shí)施例進(jìn)行數(shù)據(jù)檢索的設(shè)備包括:第一確定模塊51、第二確定模塊52和檢索模塊53。
第一確定模塊51,用于根據(jù)數(shù)據(jù)信息和標(biāo)識(shí)的對(duì)應(yīng)關(guān)系,確定用戶需要檢索的數(shù)據(jù)信息對(duì)應(yīng)的標(biāo)識(shí);
第二確定模塊52,用于根據(jù)標(biāo)識(shí)和數(shù)據(jù)的對(duì)應(yīng)關(guān)系,確定用戶需要檢索的數(shù)據(jù)信息對(duì)應(yīng)的標(biāo)識(shí)對(duì)應(yīng)的數(shù)據(jù);
檢索模塊53,用于從確定的數(shù)據(jù)中進(jìn)行數(shù)據(jù)檢索。
在實(shí)施中,圖4和圖5設(shè)備中的模塊可以合在一個(gè)設(shè)備中,根據(jù)需要使用不同的模塊。
本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本發(fā)明的實(shí)施例可提供為方法、系統(tǒng)、或計(jì)算機(jī)程序產(chǎn)品。因此,本發(fā)明可采用完全硬件實(shí)施例、完全軟件實(shí)施例、或結(jié)合軟件和硬件方面的實(shí)施例的形式。而且,本發(fā)明可采用在一個(gè)或多個(gè)其中包含有計(jì)算機(jī)可用程序代碼的計(jì)算機(jī)可用存儲(chǔ)介質(zhì)(包括但不限于磁盤存儲(chǔ)器、CD-ROM、光學(xué)存儲(chǔ)器等)上實(shí)施的計(jì)算機(jī)程序產(chǎn)品的形式。
本發(fā)明是參照根據(jù)本發(fā)明實(shí)施例的方法、設(shè)備(系統(tǒng))、和計(jì)算機(jī)程序產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計(jì)算機(jī)程序指令實(shí)現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合??商峁┻@些計(jì)算機(jī)程序指令到通用計(jì)算機(jī)、專用計(jì)算機(jī)、嵌入式處理機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個(gè)機(jī)器,使得通過計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的裝置。
這些計(jì)算機(jī)程序指令也可存儲(chǔ)在能引導(dǎo)計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計(jì)算機(jī)可讀存儲(chǔ)器中,使得存儲(chǔ)在該計(jì)算機(jī)可讀存儲(chǔ)器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能。
這些計(jì)算機(jī)程序指令也可裝載到計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計(jì)算機(jī)實(shí)現(xiàn)的處理,從而在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行的指令提供用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的步驟。
盡管已描述了本發(fā)明的優(yōu)選實(shí)施例,但本領(lǐng)域內(nèi)的技術(shù)人員一旦得知了基本創(chuàng)造性概念,則可對(duì)這些實(shí)施例作出另外的變更和修改。所以,所附權(quán)利要求意欲解釋為包括優(yōu)選實(shí)施例以及落入本發(fā)明范圍的所有變更和修改。
顯然,本領(lǐng)域的技術(shù)人員可以對(duì)本發(fā)明進(jìn)行各種改動(dòng)和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含這些改動(dòng)和變型在內(nèi)。
權(quán)利要求
1.一種數(shù)據(jù)處理的方法,其特征在于,該方法包括: 根據(jù)第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的檢索范圍,從第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的第N-1級(jí)數(shù)據(jù)信息的數(shù)據(jù)集合中提取出第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)集合,其中N是正整數(shù); 根據(jù)第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)策略,從第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)集合中檢索對(duì)應(yīng)的數(shù)據(jù); 將檢索到的所有數(shù)據(jù)分配相同的標(biāo)識(shí),并建立檢索所使用的第N級(jí)數(shù)據(jù)信息、標(biāo)識(shí)和數(shù)據(jù)的對(duì)應(yīng)關(guān)系。
2.如權(quán)利要求1所述的方法,其特征在于,若N是1,則第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的第N-1級(jí)數(shù)據(jù)信息的數(shù)據(jù)集合是數(shù)據(jù)庫中的所有數(shù)據(jù)。
3.如權(quán)利要求1所述的方法,其特征在于,第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的檢索范圍是根據(jù)下列步驟確定的: 將用戶輸入的檢索范圍作為第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的檢索范圍,或?qū)⒌贜-1級(jí)數(shù)據(jù)信息對(duì)應(yīng)的檢索范圍作為第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的檢索范圍。
4.如權(quán)利要求1 3任一所述的方法,其特征在于,提取出第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)集合包括: 在收到用戶的指令后,根據(jù)第N級(jí)數(shù)據(jù)信息和檢索范圍的對(duì)應(yīng)關(guān)系,從第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的第N-1級(jí)數(shù)據(jù)信息的數(shù)據(jù)集合中提取出第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)集合;或 在設(shè)定的時(shí)間到達(dá)時(shí),根據(jù)第N級(jí)數(shù)據(jù)信息和檢索范圍的對(duì)應(yīng)關(guān)系,從第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的第N-1級(jí)數(shù)據(jù)信息的數(shù)據(jù)集合中提取出第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)集合。
5.如權(quán)利要求4所述的方法,其特征在于,提取出第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)集合包括: 確定上次提取出第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)集合的時(shí)刻到當(dāng)前時(shí)刻之間,第N-1級(jí)數(shù)據(jù)信息的數(shù)據(jù)集合中發(fā)生變化的數(shù)據(jù); 根據(jù)第N級(jí)數(shù)據(jù)信息和檢索范圍的對(duì)應(yīng)關(guān)系,從發(fā)生變化的數(shù)據(jù)中提取出第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù),并將提取的數(shù)據(jù)置于第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)集合中。
6.一種基于權(quán)利要求1的數(shù)據(jù)處理方法進(jìn)行數(shù)據(jù)檢索的方法,其特征在于,該方法包括: 根據(jù)數(shù)據(jù)信息和標(biāo)識(shí)的對(duì)應(yīng)關(guān)系,確定用戶需要檢索的數(shù)據(jù)信息對(duì)應(yīng)的標(biāo)識(shí); 根據(jù)標(biāo)識(shí)和數(shù)據(jù)的對(duì)應(yīng)關(guān)系,確定用戶需要檢索的數(shù)據(jù)信息對(duì)應(yīng)的標(biāo)識(shí)對(duì)應(yīng)的數(shù)據(jù); 從確定的數(shù)據(jù)中進(jìn)行數(shù)據(jù)檢索。
7.一種數(shù)據(jù)處理的設(shè)備,其特征在于,該設(shè)備包括: 第一處理模塊,用于根據(jù)第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的檢索范圍,從第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的第N-1級(jí)數(shù)據(jù)信息的數(shù)據(jù)集合中提取出第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)集合,其中N是正整數(shù);第二處理模塊,用于根據(jù)第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)策略,從第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)集合中檢索對(duì)應(yīng)的數(shù)據(jù); 建立模塊,用于將檢索到的所有數(shù)據(jù)分配相同的標(biāo)識(shí),并建立檢索所使用的第N級(jí)數(shù)據(jù)信息、標(biāo)識(shí)和數(shù)據(jù)的對(duì)應(yīng)關(guān)系。
8.如權(quán)利要求7所述的設(shè)備,其特征在于,所述第一處理模塊具體用于: 在收到用戶的指令后,根據(jù)第N級(jí)數(shù)據(jù)信息和檢索范圍的對(duì)應(yīng)關(guān)系,從第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的第N-1級(jí)數(shù)據(jù)信息的數(shù)據(jù)集合中提取出第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)集合;或 在設(shè)定的時(shí)間到達(dá)時(shí),根據(jù)第N級(jí)數(shù)據(jù)信息和檢索范圍的對(duì)應(yīng)關(guān)系,從第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的第N-1級(jí)數(shù)據(jù)信息的數(shù)據(jù)集合中提取出第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)集合。
9.如權(quán)利要求8所述的設(shè)備,其特征在于,所述第一處理模塊具體用于: 確定上次提取出第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)集合的時(shí)刻到當(dāng)前時(shí)刻之間,第N-1級(jí)數(shù)據(jù)信息的數(shù)據(jù)集合中發(fā)生變化的數(shù)據(jù);根據(jù)第N級(jí)數(shù)據(jù)信息和檢索范圍的對(duì)應(yīng)關(guān)系,從發(fā)生變化的數(shù)據(jù)中提取出第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù),并將提取的數(shù)據(jù)置于第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)集合中。
10.一種基于權(quán)利要求1的數(shù)據(jù)處理方法進(jìn)行數(shù)據(jù)檢索的設(shè)備,其特征在于,該設(shè)備包括: 第一確定模塊,用于根據(jù)數(shù)據(jù)信息和標(biāo)識(shí)的對(duì)應(yīng)關(guān)系,確定用戶需要檢索的數(shù)據(jù)信息對(duì)應(yīng)的標(biāo)識(shí); 第二確定模塊,用于根據(jù)標(biāo)識(shí)和數(shù)據(jù)的對(duì)應(yīng)關(guān)系,確定用戶需要檢索的數(shù)據(jù)信息對(duì)應(yīng)的標(biāo)識(shí)對(duì)應(yīng)的數(shù)據(jù); 檢索模塊,用于從確定 的數(shù)據(jù)中進(jìn)行數(shù)據(jù)檢索。
全文摘要
本發(fā)明實(shí)施例涉及計(jì)算機(jī)技術(shù)領(lǐng)域,特別涉及一種數(shù)據(jù)處理和檢索的方法及設(shè)備,用以解決現(xiàn)有技術(shù)中存在的檢索的效率比較低,檢索速度比較慢的問題。本發(fā)明實(shí)施例數(shù)據(jù)處理的方法包括根據(jù)第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的檢索范圍,從第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的第N-1級(jí)數(shù)據(jù)信息的數(shù)據(jù)集合中提取出第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)集合,其中N是正整數(shù);根據(jù)第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)策略,從第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)集合中檢索對(duì)應(yīng)的數(shù)據(jù);將檢索到的所有數(shù)據(jù)分配相同的標(biāo)識(shí),并建立檢索所使用的第N級(jí)數(shù)據(jù)信息、標(biāo)識(shí)和數(shù)據(jù)的對(duì)應(yīng)關(guān)系。由于從第N級(jí)數(shù)據(jù)信息對(duì)應(yīng)的數(shù)據(jù)集合中檢索對(duì)應(yīng)的數(shù)據(jù),從而提高了檢索的效率和速度;進(jìn)一步提高了檢索的性能。
文檔編號(hào)G06F17/30GK103164491SQ201110427898
公開日2013年6月19日 申請(qǐng)日期2011年12月19日 優(yōu)先權(quán)日2011年12月19日
發(fā)明者孫容容, 朱傲, 徐劍波 申請(qǐng)人:北大方正集團(tuán)有限公司, 北京方正阿帕比技術(shù)有限公司