1.一種基于事件要素的事件抽取方法,其特征在于,包括以下步驟:
根據(jù)預(yù)設(shè)事件識(shí)別模型,對(duì)顯示在預(yù)設(shè)長(zhǎng)度文本窗口內(nèi)的數(shù)據(jù)中所包含的事件構(gòu)成要素識(shí)別:
根據(jù)該預(yù)設(shè)事件識(shí)別模型,對(duì)所述數(shù)據(jù)中所包含的事件特征詞進(jìn)行識(shí)別;
對(duì)所述事件特征詞以及事件構(gòu)成要素組合成描述相應(yīng)事件的新的數(shù)據(jù)對(duì)象。
2.根據(jù)權(quán)利要求1所述基于事件要素的事件抽取方法,其特征在于,所述事件構(gòu)成要素包括時(shí)間、地點(diǎn)、數(shù)量以及人物;所述數(shù)量包括數(shù)字及對(duì)應(yīng)的數(shù)量單位。
3.根據(jù)權(quán)利要求2所述基于事件要素的事件抽取方法,其特征在于,在對(duì)事件構(gòu)成要素識(shí)別還包括以下步驟:
對(duì)識(shí)別出的時(shí)間要素,按預(yù)置方法進(jìn)行格式歸一化處理轉(zhuǎn)換統(tǒng)一的時(shí)間格式;
對(duì)識(shí)別出的數(shù)量要素,將數(shù)量要素中的數(shù)字與對(duì)應(yīng)的數(shù)量單位拆分,將數(shù)字轉(zhuǎn)換為預(yù)設(shè)的數(shù)字格式;
對(duì)識(shí)別出的地點(diǎn)要素,根據(jù)地點(diǎn)分類標(biāo)準(zhǔn)將地點(diǎn)分為多級(jí),并給每個(gè)地點(diǎn)賦予上級(jí)行政區(qū)劃的屬性。
4.根據(jù)權(quán)利要求3所述基于事件要素的事件抽取方法,其特征在于,在對(duì)事件構(gòu)成要素中的時(shí)間、地點(diǎn)、數(shù)量要素識(shí)別出后還包括以下步驟:
根據(jù)預(yù)選設(shè)置的時(shí)間、地點(diǎn)、數(shù)量的篩選條件,對(duì)識(shí)別出的事件構(gòu)成要素中的時(shí)間、地點(diǎn)、數(shù)量進(jìn)行篩選。
5.根據(jù)權(quán)利要求1-4任一項(xiàng)所述基于事件要素的事件抽取方法,其特征在于,所述對(duì)顯示在預(yù)設(shè)長(zhǎng)度文本窗口內(nèi)的數(shù)據(jù)中所包含的事件構(gòu)成要素識(shí)別時(shí)以在句內(nèi)的數(shù)據(jù)為限進(jìn)行識(shí)別。
6.一種基于事件要素的事件抽取系統(tǒng),其特征在于,包括:
要素識(shí)別模塊,用于根據(jù)預(yù)設(shè)事件識(shí)別模型,對(duì)顯示在預(yù)設(shè)長(zhǎng)度文本窗口內(nèi)的數(shù)據(jù)中所包含的事件構(gòu)成要素識(shí)別:
特征詞識(shí)別模塊,用于根據(jù)該預(yù)設(shè)事件識(shí)別模型,根據(jù)預(yù)設(shè)事件識(shí)別模型對(duì)所述數(shù)據(jù)中所包含的事件特征詞進(jìn)行識(shí)別;
數(shù)據(jù)組合模塊,用于對(duì)所述事件特征詞以及事件構(gòu)成要素組合成描述相應(yīng)事件的新的數(shù)據(jù)對(duì)象。
7.根據(jù)權(quán)利要求6所述基于事件要素的事件抽取系統(tǒng),其特征在于,所述事件構(gòu)成要素包括時(shí)間、地點(diǎn)、數(shù)量以及人物;所述數(shù)量包括數(shù)字及對(duì)應(yīng)的數(shù)量單位。
8.根據(jù)權(quán)利要求7所述基于事件要素的事件抽取方法,其特征在于,所述要素識(shí)別模塊包括:
時(shí)間要素處理單元,用于對(duì)識(shí)別出的時(shí)間要素,按預(yù)置方法進(jìn)行格式歸一化處理轉(zhuǎn)換統(tǒng)一的時(shí)間格式;
數(shù)量要素處理單元,用于對(duì)識(shí)別出的數(shù)量要素,將數(shù)量要素中的數(shù)字與對(duì)應(yīng)的數(shù)量單位拆分,將數(shù)字轉(zhuǎn)換為預(yù)設(shè)的數(shù)字格式;
地點(diǎn)要素處理單元,用于對(duì)識(shí)別出的地點(diǎn)要素,根據(jù)地點(diǎn)分類標(biāo)準(zhǔn)將地點(diǎn)分為多級(jí),并給每個(gè)地點(diǎn)賦予上級(jí)行政區(qū)劃的屬性。
9.根據(jù)權(quán)利要求8所述基于事件要素的事件抽取方法,其特征在于,所述要素識(shí)別模塊包括篩選單元,用于在對(duì)事件構(gòu)成要素中的時(shí)間、地點(diǎn)、數(shù)量要素識(shí)別出后,根據(jù)預(yù)選設(shè)置的時(shí)間、地點(diǎn)、數(shù)量的篩選條件,對(duì)識(shí)別出的事件構(gòu)成要素中的時(shí)間、地點(diǎn)、數(shù)量進(jìn)行篩選。
10.根據(jù)權(quán)利要求6-9任一項(xiàng)所述基于事件要素的事件抽取方法,其特征在于,所述對(duì)顯示在預(yù)設(shè)長(zhǎng)度文本窗口內(nèi)的數(shù)據(jù)中所包含的事件構(gòu)成要素識(shí)別時(shí)以在句內(nèi)的數(shù)據(jù)為限進(jìn)行識(shí)別。