一種事件索引與檢索的方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明實(shí)施例涉及計(jì)算機(jī)技術(shù)領(lǐng)域,尤其涉及一種事件索引與檢索的方法及裝 置。
【背景技術(shù)】
[0002] 隨著計(jì)算機(jī)技術(shù)的發(fā)展,在大量的文件與數(shù)據(jù)中進(jìn)行檢索已成為廣泛應(yīng)用的技術(shù) 手段。
[0003] 現(xiàn)有的檢索方法具體為依據(jù)輸入的關(guān)鍵詞,在數(shù)據(jù)庫(kù)或文件庫(kù)中搜索包含該關(guān)鍵 詞的數(shù)據(jù)或文件,即檢索到的數(shù)據(jù)或文件嚴(yán)格包括輸入的關(guān)鍵詞,不包括該關(guān)鍵詞的數(shù)據(jù) 或文件將不可能作為檢索結(jié)果輸出,但不包括關(guān)鍵詞的數(shù)據(jù)或文件也有可能與輸入的關(guān)鍵 詞相關(guān),使得檢索結(jié)果不全面,導(dǎo)致檢索效率低。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明實(shí)施例提供一種事件索引與檢索的方法及裝置,以提高檢索效率。
[0005] 本發(fā)明實(shí)施例的一個(gè)方面是提供一種事件索引與檢索的方法,包括:
[0006] 依據(jù)目標(biāo)關(guān)鍵詞獲取與所述目標(biāo)關(guān)鍵詞對(duì)應(yīng)的目標(biāo)共生詞,所述目標(biāo)共生詞是所 述目標(biāo)關(guān)鍵詞對(duì)應(yīng)的共生詞中共生頻率超出閾值的共生詞,所述共生詞是與所述目標(biāo)關(guān)鍵 詞同時(shí)出現(xiàn)的詞,所述共生頻率是所述目標(biāo)關(guān)鍵詞與所述共生詞同時(shí)出現(xiàn)的次數(shù);
[0007] 依據(jù)所述目標(biāo)關(guān)鍵詞進(jìn)行檢索獲得第一目標(biāo)事件,依據(jù)所述目標(biāo)共生詞進(jìn)行檢索 獲得第二目標(biāo)事件;
[0008] 將所述第一目標(biāo)事件和所述第二目標(biāo)事件作為檢索結(jié)果輸出。
[0009] 本發(fā)明實(shí)施例的另一個(gè)方面是提供一種事件索引與檢索的裝置,包括:
[0010] 目標(biāo)共生詞獲取模塊,用于依據(jù)目標(biāo)關(guān)鍵詞獲取與所述目標(biāo)關(guān)鍵詞對(duì)應(yīng)的目標(biāo)共 生詞,所述目標(biāo)共生詞是所述目標(biāo)關(guān)鍵詞對(duì)應(yīng)的共生詞中共生頻率超出閾值的共生詞,所 述共生詞是與所述目標(biāo)關(guān)鍵詞同時(shí)出現(xiàn)的詞,所述共生頻率是所述目標(biāo)關(guān)鍵詞與所述共生 詞同時(shí)出現(xiàn)的次數(shù);
[0011] 檢索模塊,用于依據(jù)所述目標(biāo)關(guān)鍵詞進(jìn)行檢索獲得第一目標(biāo)事件,依據(jù)所述目標(biāo) 共生詞進(jìn)行檢索獲得第二目標(biāo)事件;
[0012] 輸出模塊,用于將所述第一目標(biāo)事件和所述第二目標(biāo)事件作為檢索結(jié)果輸出。 [0013] 本發(fā)明實(shí)施例提供的一種事件索引與檢索的方法及裝置,依據(jù)目標(biāo)關(guān)鍵詞獲取與 該目標(biāo)關(guān)鍵詞對(duì)應(yīng)的目標(biāo)共生詞,分別檢索獲得包括目標(biāo)關(guān)鍵詞的第一目標(biāo)事件,以及包 括目標(biāo)共生詞的第二目標(biāo)事件,將第一目標(biāo)事件和第二目標(biāo)事件作為最終的檢索結(jié)果,由 于目標(biāo)共生詞與目標(biāo)關(guān)鍵詞同時(shí)出現(xiàn)的頻率超出了閾值,則包括目標(biāo)共生詞的第二目標(biāo)事 件也是與目標(biāo)關(guān)鍵詞密切相關(guān)的事件,使得檢索結(jié)果全面,并提高了檢索效率。
【附圖說(shuō)明】
[0014] 圖1為本發(fā)明實(shí)施例提供的事件索引與檢索的方法流程圖;
[0015] 圖2為本發(fā)明實(shí)施例提供的事件索引與檢索的裝置的結(jié)構(gòu)圖;
[0016] 圖3為本發(fā)明另一實(shí)施例提供的事件索引與檢索的裝置的結(jié)構(gòu)圖。
【具體實(shí)施方式】
[0017] 圖1為本發(fā)明實(shí)施例提供的事件索引與檢索的方法流程圖。本發(fā)明實(shí)施例針對(duì)事 件流構(gòu)成的事件集合,從事件集合中檢索目標(biāo)事件,提供了事件索引與檢索的方法,該方法 的具體步驟如下:
[0018] 步驟S101、依據(jù)目標(biāo)關(guān)鍵詞獲取與所述目標(biāo)關(guān)鍵詞對(duì)應(yīng)的目標(biāo)共生詞,所述目標(biāo) 共生詞是所述目標(biāo)關(guān)鍵詞對(duì)應(yīng)的共生詞中共生頻率超出閾值的共生詞,所述共生詞是與所 述目標(biāo)關(guān)鍵詞同時(shí)出現(xiàn)的詞,所述共生頻率是所述目標(biāo)關(guān)鍵詞與所述共生詞同時(shí)出現(xiàn)的次 數(shù);
[0019] 所述依據(jù)目標(biāo)關(guān)鍵詞獲取與所述目標(biāo)關(guān)鍵詞對(duì)應(yīng)的目標(biāo)共生詞之前,還包括:
[0020] 依據(jù)事件描述構(gòu)建共生詞檢索表,所述共生詞檢索表包括關(guān)鍵詞、所述關(guān)鍵詞對(duì) 應(yīng)的所述共生詞,以及所述關(guān)鍵詞與所述共生詞的共生頻率。
[0021] 本發(fā)明實(shí)施例提供的檢索系統(tǒng)包括事件集合,該事件集合包括多個(gè)事件,每個(gè)事 件對(duì)應(yīng)有一個(gè)事件描述,事件描述包括該事件最關(guān)鍵最核心的詞,依據(jù)所有的事件描述構(gòu) 建共生詞檢索表,該共生詞檢索表包括關(guān)鍵詞、所述關(guān)鍵詞對(duì)應(yīng)的所述共生詞,以及所述關(guān) 鍵詞與所述共生詞的共生頻率。
[0022] 當(dāng)接收到輸入的目標(biāo)關(guān)鍵詞時(shí),通過(guò)查找共生詞檢索表獲得該目標(biāo)關(guān)鍵詞的所有 共生詞,并從所有共生詞中選出共生頻率超出閾值的共生詞作為目標(biāo)共生詞;其中,共生詞 是與目標(biāo)關(guān)鍵詞同時(shí)出現(xiàn)在事件描述中的詞,共生頻率是某一個(gè)共生詞與目標(biāo)關(guān)鍵詞在所 有事件描述中同時(shí)出現(xiàn)的次數(shù)。
[0023] 步驟S102、依據(jù)所述目標(biāo)關(guān)鍵詞進(jìn)行檢索獲得第一目標(biāo)事件,依據(jù)所述目標(biāo)共生 詞進(jìn)行檢索獲得第二目標(biāo)事件;
[0024] 依照現(xiàn)有的搜索技術(shù)在事件集合中檢索出包括該目標(biāo)關(guān)鍵詞的第一目標(biāo)事件,該 第一目標(biāo)事件可以是一個(gè)集合,同理,對(duì)于步驟SlOl中獲得的目標(biāo)共生詞,依照現(xiàn)有的搜 索技術(shù)在事件集合中檢索出包括該目標(biāo)共生詞的第二目標(biāo)事件,該第二目標(biāo)事件也可以是 一個(gè)集合。
[0025] 步驟S103、將所述第一目標(biāo)事件和所述第二目標(biāo)事件作為檢索結(jié)果輸出。
[0026] 將所述第一目標(biāo)事件和所述第二目標(biāo)事件合并起來(lái)作為最終的檢索結(jié)果,并輸出 顯不O
[0027] 本發(fā)明實(shí)施例依據(jù)目標(biāo)關(guān)鍵詞獲取與該目標(biāo)關(guān)鍵詞對(duì)應(yīng)的目標(biāo)共生詞,分別檢索 獲得包括目標(biāo)關(guān)鍵詞的第一目標(biāo)事件,以及包括目標(biāo)共生詞的第二目標(biāo)事件,將第一目標(biāo) 事件和第二目標(biāo)事件作為最終的檢索結(jié)果,由于目標(biāo)共生詞與目標(biāo)關(guān)鍵詞同時(shí)出現(xiàn)的頻率 超出了閾值,則包括目標(biāo)共生詞的第二目標(biāo)事件也是與目標(biāo)關(guān)鍵詞密切相關(guān)的事件,使得 檢索結(jié)果全面,并提高了檢索效率。
[0028] 在上述實(shí)施例的基礎(chǔ)上,所述依據(jù)事件描述構(gòu)建共生詞檢索表包括:
[0029] 對(duì)所述事件描述進(jìn)行分詞處理獲得多個(gè)關(guān)鍵詞,所述多個(gè)關(guān)鍵詞中任意兩個(gè)關(guān)鍵 詞互為共生詞;依據(jù)所述關(guān)鍵詞與所述關(guān)鍵詞的共生詞構(gòu)建所述共生詞檢索表。
[0030] 例如一個(gè)事件描述為"馬航MH17水下搜索",對(duì)該事件描述進(jìn)行分詞處理獲得4個(gè) 關(guān)鍵詞:馬航、MH17、水下和搜索,且該4個(gè)關(guān)鍵詞中兩兩互為共生詞,構(gòu)成多個(gè)共生詞對(duì), 具體為[馬航,MH17]、[馬航,水下]、[馬航,搜索]、[MH17,馬航]、[MH17,水下]、[MH17, 搜索]、[水下,馬航]、[水下,MH17]、[水下,搜索]、[搜索,馬航]、[搜索,MH17]、[搜 索,水下],并統(tǒng)計(jì)出任一共生詞對(duì)在所有事件描述中同時(shí)出現(xiàn)的次數(shù)即頻率,構(gòu)成如表1 所示的共生詞檢索表:
[0031] 表 1
[0032]
【主權(quán)項(xiàng)】
1. 一種事件索引與檢索的方法,其特征在于,包括: 依據(jù)目標(biāo)關(guān)鍵詞獲取與所述目標(biāo)關(guān)鍵詞對(duì)應(yīng)的目標(biāo)共生詞,所述目標(biāo)共生詞是所述目 標(biāo)關(guān)鍵詞對(duì)應(yīng)的共生詞中共生頻率超出闊值的共生詞,所述共生詞是與所述目標(biāo)關(guān)鍵詞同 時(shí)出現(xiàn)的詞,所述共生頻率是所述目標(biāo)關(guān)鍵詞與所述共生詞同時(shí)出現(xiàn)的次數(shù); 依據(jù)所述目標(biāo)關(guān)鍵詞進(jìn)行檢索獲得第一目標(biāo)事件,依據(jù)所述目標(biāo)共生詞進(jìn)行檢索獲得 第二目標(biāo)事件; 將所述第一目標(biāo)事件和所述第二目標(biāo)事件作為檢索結(jié)果輸出。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述依據(jù)目標(biāo)關(guān)鍵詞獲取與所述目標(biāo)關(guān) 鍵詞對(duì)應(yīng)的目標(biāo)共生詞之前,還包括: 依據(jù)事件描述構(gòu)建共生詞檢索表,所述共生詞檢索表包括關(guān)鍵詞、所述關(guān)鍵詞對(duì)應(yīng)的 所述共生詞,W及所述關(guān)鍵詞與所述共生詞的共生頻率。
3. 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述依據(jù)事件描述構(gòu)建共生詞檢索表包 括: 對(duì)所述事件描述進(jìn)行分詞處理獲得多個(gè)關(guān)鍵詞,所述多個(gè)關(guān)鍵詞中任意兩個(gè)關(guān)鍵詞互 為共生詞; 依據(jù)所述關(guān)鍵詞與所述關(guān)鍵詞的共生詞構(gòu)建所述共生詞檢索表。
4. 根據(jù)權(quán)利要求1-3任一項(xiàng)所述的方法,其特征在于,所述依據(jù)所述目標(biāo)關(guān)鍵詞進(jìn)行 檢索獲得第一目標(biāo)事件,依據(jù)所述目標(biāo)共生詞進(jìn)行檢索獲得第二目標(biāo)事件包括: 依據(jù)所述目標(biāo)關(guān)鍵詞進(jìn)行全文索引獲得所述第一目標(biāo)事件,依據(jù)所述目標(biāo)共生詞進(jìn)行 全文索引獲得所述第二目標(biāo)事件。
5. 根據(jù)權(quán)利要求4所述的方法,其特征在于,所述全文索引包括倒排索引。
6. -種事件索引與檢索的裝置,其特征在于,包括: 目標(biāo)共生詞獲取模塊,用于依據(jù)目標(biāo)關(guān)鍵詞獲取與所述目標(biāo)關(guān)鍵詞對(duì)應(yīng)的目標(biāo)共生 詞,所述目標(biāo)共生詞是所述目標(biāo)關(guān)鍵詞對(duì)應(yīng)的共生詞中共生頻率超出闊值的共生詞,所述 共生詞是與所述目標(biāo)關(guān)鍵詞同時(shí)出現(xiàn)的詞,所述共生頻率是所述目標(biāo)關(guān)鍵詞與所述共生詞 同時(shí)出現(xiàn)的次數(shù); 檢索模塊,用于依據(jù)所述目標(biāo)關(guān)鍵詞進(jìn)行檢索獲得第一目標(biāo)事件,依據(jù)所述目標(biāo)共生 詞進(jìn)行檢索獲得第二目標(biāo)事件; 輸出模塊,用于將所述第一目標(biāo)事件和所述第二目標(biāo)事件作為檢索結(jié)果輸出。
7. 根據(jù)權(quán)利要求6所述的事件索引與檢索的裝置,其特征在于,還包括: 構(gòu)建模塊,用于依據(jù)事件描述構(gòu)建共生詞檢索表,所述共生詞檢索表包括關(guān)鍵詞、所述 關(guān)鍵詞對(duì)應(yīng)的所述共生詞,W及所述關(guān)鍵詞與所述共生詞的共生頻率。
8. 根據(jù)權(quán)利要求7所述的事件索引與檢索的裝置,其特征在于,所述構(gòu)建模塊具體用 于對(duì)所述事件描述進(jìn)行分詞處理獲得多個(gè)關(guān)鍵詞,所述多個(gè)關(guān)鍵詞中任意兩個(gè)關(guān)鍵詞互為 共生詞;依據(jù)所述關(guān)鍵詞與所述關(guān)鍵詞的共生詞構(gòu)建所述共生詞檢索表。
9. 根據(jù)權(quán)利要求6-8任一項(xiàng)所述的事件索引與檢索的裝置,其特征在于,所述檢索模 塊具體用于依據(jù)所述目標(biāo)關(guān)鍵詞進(jìn)行全文索引獲得所述第一目標(biāo)事件,依據(jù)所述目標(biāo)共生 詞進(jìn)行全文索引獲得所述第二目標(biāo)事件。
10. 根據(jù)權(quán)利要求9所述的事件索引與檢索的裝置,其特征在于,所述全文索引包括倒 排索引。
【專(zhuān)利摘要】本發(fā)明實(shí)施例提供一種事件索引與檢索的方法及裝置。該方法包括:依據(jù)目標(biāo)關(guān)鍵詞獲取與所述目標(biāo)關(guān)鍵詞對(duì)應(yīng)的目標(biāo)共生詞;依據(jù)所述目標(biāo)關(guān)鍵詞進(jìn)行檢索獲得第一目標(biāo)事件,依據(jù)所述目標(biāo)共生詞進(jìn)行檢索獲得第二目標(biāo)事件;將所述第一目標(biāo)事件和所述第二目標(biāo)事件作為檢索結(jié)果輸出。本發(fā)明實(shí)施例依據(jù)目標(biāo)關(guān)鍵詞獲取與該目標(biāo)關(guān)鍵詞對(duì)應(yīng)的目標(biāo)共生詞,分別檢索獲得包括目標(biāo)關(guān)鍵詞的第一目標(biāo)事件,以及包括目標(biāo)共生詞的第二目標(biāo)事件,將第一目標(biāo)事件和第二目標(biāo)事件作為最終的檢索結(jié)果,由于目標(biāo)共生詞與目標(biāo)關(guān)鍵詞同時(shí)出現(xiàn)的頻率超出了閾值,則包括目標(biāo)共生詞的第二目標(biāo)事件也是與目標(biāo)關(guān)鍵詞密切相關(guān)的事件,使得檢索結(jié)果全面,并提高了檢索效率。
【IPC分類(lèi)】G06F17-30
【公開(kāi)號(hào)】CN104598630
【申請(qǐng)?zhí)枴緾N201510062272
【發(fā)明人】李建欣, 盧忠宇, 于偉仁, 張日崇
【申請(qǐng)人】北京航空航天大學(xué)
【公開(kāi)日】2015年5月6日
【申請(qǐng)日】2015年2月5日