一種事件特征的獲取方法和設(shè)備的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及計(jì)算機(jī)技術(shù)領(lǐng)域,尤其涉及一種事件特征的獲取方法和設(shè)備。
【背景技術(shù)】
[0002]在互聯(lián)網(wǎng)技術(shù)快速發(fā)展的今天,用戶在應(yīng)用互聯(lián)網(wǎng)時(shí)產(chǎn)生大量的數(shù)據(jù)。面對(duì)互聯(lián)網(wǎng)上產(chǎn)生的海量數(shù)據(jù),人們希望從海量數(shù)據(jù)中獲取自己感興趣的事件。
[0003]然而,每一個(gè)事件都具備個(gè)性化信息,可以通過事件的個(gè)性化信息來區(qū)分不同的事件。事件的個(gè)性化信息一般包括事件的屬性和事件的屬性對(duì)應(yīng)的具體內(nèi)容。
[0004]在對(duì)海量數(shù)據(jù)進(jìn)行處理時(shí),通過人工識(shí)別方式,確定用于描述事件的抽取模板,在利用確定的抽取模板對(duì)海量數(shù)據(jù)進(jìn)行匹配,得到感興趣的事件的個(gè)性化信息。
[0005]其中,抽取模板是指能夠抽取描述事件的屬性和該屬性對(duì)應(yīng)的具體內(nèi)容的抽取規(guī)則。
[0006]但是,由于目前所使用的抽取模板是通過人工方式確定的,隨著事件的發(fā)展,對(duì)于事件出現(xiàn)的新特征,無法及時(shí)確定該新特征對(duì)應(yīng)的抽取模板,導(dǎo)致在對(duì)海量數(shù)據(jù)進(jìn)行處理時(shí),得到感興趣的事件的個(gè)性化信息不夠精確,影響了人們對(duì)該事件的判斷。
【發(fā)明內(nèi)容】
[0007]有鑒于此,本發(fā)明實(shí)施例提供了一種事件特征的獲取方法和設(shè)備,用于解決在對(duì)海量數(shù)據(jù)進(jìn)行處理時(shí),得到感興趣的事件的個(gè)性化信息不夠精確的問題。
[0008]第一方面,提供了一種事件特征的獲取方法,包括:
[0009]獲取用于描述目標(biāo)事件的特征詞集合,其中,所述特征詞集合中包含多個(gè)特征詞;
[0010]從獲取的所述特征詞集合中,確定用于描述所述目標(biāo)事件的屬性的至少一個(gè)特征詞;
[0011]針對(duì)確定的每一個(gè)特征詞,從所述特征詞集合中除用于描述所述目標(biāo)事件的屬性的特征詞之外的剩余特征詞中,抽取出該特征詞所標(biāo)識(shí)的屬性的具體內(nèi)容的至少一個(gè)特征詞,并建立確定的該特征詞與抽取的至少一個(gè)特征詞之間的對(duì)應(yīng)關(guān)系;
[0012]根據(jù)得到至少一組對(duì)應(yīng)關(guān)系,得到所述目標(biāo)事件的特征。
[0013]結(jié)合第一方面,在第一種可能的實(shí)現(xiàn)方式中,所述方法還包括:
[0014]建立所述目標(biāo)事件的特征與得到的至少一組對(duì)應(yīng)關(guān)系之間的映射關(guān)系。
[0015]結(jié)合第一方面,或者結(jié)合第一方面的第一種可能的實(shí)現(xiàn)方式,在第二種可能的實(shí)現(xiàn)方式中,從獲取的所述多個(gè)特征詞中,確定用于描述所述目標(biāo)事件的屬性的至少一個(gè)特征詞,包括:
[0016]針對(duì)獲取的所述特征詞集合,執(zhí)行以下操作,直至確定出所述特征詞集合中全部用于描述所述目標(biāo)事件的屬性的特征詞:
[0017]選擇任意一個(gè)特征詞;
[0018]確定選擇的該特征詞在原始文檔中的上下文內(nèi)容;并根據(jù)所述上下文內(nèi)容,判斷該特征詞是否為用于描述所述目標(biāo)事件的屬性的特征詞;
[0019]若判斷結(jié)果是選擇的該特征詞是用于描述所述目標(biāo)事件的屬性的特征詞,則將該特征詞標(biāo)記為用于描述所述目標(biāo)事件的屬性的特征詞,并選擇下一個(gè)特征詞,繼續(xù)執(zhí)行上述操作;
[0020]若判斷結(jié)果是選擇的該特征詞不是用于描述所述目標(biāo)事件的屬性的特征詞,則選擇下一個(gè)特征詞,繼續(xù)執(zhí)行上述操作。
[0021]結(jié)合第一方面的第二種可能的實(shí)現(xiàn)方式,在第三種可能的實(shí)現(xiàn)方式中,根據(jù)所述上下文內(nèi)容,判斷該特征詞是否為用于描述所述目標(biāo)事件的屬性的特征詞,包括:
[0022]根據(jù)所述上下文內(nèi)容,通過語法分析和句法分析,確定該特征詞是否為所述上下文內(nèi)容的中心詞;
[0023]若確定該特征詞為所述上下文內(nèi)容的中心詞,則確定該特征詞為用于描述所述目標(biāo)事件的屬性的特征詞;
[0024]若確定該特征詞不為所述上下文內(nèi)容的中心詞,則確定該特征詞不為用于描述所述目標(biāo)事件的屬性的特征詞。
[0025]結(jié)合第一方面的第二種可能的實(shí)現(xiàn)方式,或者結(jié)合第一方面的第三種可能的實(shí)現(xiàn)方式,在第四種可能的實(shí)現(xiàn)方式中,在確定出所述特征詞集合中全部用于描述所述目標(biāo)事件的屬性的特征詞之后,所述方法還包括:
[0026]判斷確定出所述特征詞集合中全部用于描述所述目標(biāo)事件的屬性的特征詞中是否存在同義詞;
[0027]在判斷結(jié)果存在同義詞時(shí),從滿足同義詞條件的多個(gè)用于描述所述目標(biāo)事件的屬性的特征詞中選擇一個(gè)特征詞,作為滿足同義詞條件的多個(gè)特征詞所描述的所述目標(biāo)事件的屬性的特征詞。
[0028]結(jié)合第一方面,或者結(jié)合第一方面的第一種可能的實(shí)現(xiàn)方式,或者結(jié)合第一方面的第二種可能的實(shí)現(xiàn)方式,或者結(jié)合第一方面的第三種可能的實(shí)現(xiàn)方式,或者結(jié)合第一方面的第四種可能的實(shí)現(xiàn)方式,在第五種可能的實(shí)現(xiàn)方式中,從所述特征詞集合中除用于描述所述目標(biāo)事件的屬性的特征詞之外的剩余特征詞中,抽取出該特征詞所標(biāo)識(shí)的屬性的具體內(nèi)容的至少一個(gè)特征詞,包括:
[0029]從所述特征詞集合中除用于描述所述目標(biāo)事件的屬性的特征詞之外的剩余特征詞中,選擇一個(gè)特征詞;
[0030]針對(duì)確定的一個(gè)用于描述所述目標(biāo)事件的屬性的特征詞,根據(jù)語義規(guī)則,判斷選擇的該特征詞是否為該確定的特征詞的下位詞;
[0031]若為下位詞,則確定選擇的該特征詞為該確定的特征詞所描述的所述目標(biāo)事件的屬性的具體內(nèi)容。
[0032]結(jié)合第一方面,或者結(jié)合第一方面的第一種可能的實(shí)現(xiàn)方式,或者結(jié)合第一方面的第二種可能的實(shí)現(xiàn)方式,或者結(jié)合第一方面的第三種可能的實(shí)現(xiàn)方式,或者結(jié)合第一方面的第四種可能的實(shí)現(xiàn)方式,或者結(jié)合第一方面的第五種可能的實(shí)現(xiàn)方式,在第六種可能的實(shí)現(xiàn)方式中,獲取用于描述目標(biāo)事件的特征詞集合,包括:
[0033]在對(duì)海量數(shù)據(jù)進(jìn)行處理時(shí),通過聚類分析方式從海量數(shù)據(jù)中獲取用于描述目標(biāo)事件的多個(gè)特征詞;
[0034]將得到的多個(gè)特征詞組合得到用于描述目標(biāo)事件的特征詞集合。
[0035]結(jié)合第一方面,或者結(jié)合第一方面的第一種可能的實(shí)現(xiàn)方式,或者結(jié)合第一方面的第二種可能的實(shí)現(xiàn)方式,或者結(jié)合第一方面的第三種可能的實(shí)現(xiàn)方式,或者結(jié)合第一方面的第四種可能的實(shí)現(xiàn)方式,或者結(jié)合第一方面的第五種可能的實(shí)現(xiàn)方式,或者結(jié)合第一方面的第六種可能的實(shí)現(xiàn)方式,在第七種可能的實(shí)現(xiàn)方式中,在根據(jù)得到至少一組對(duì)應(yīng)關(guān)系得到所述目標(biāo)事件的特征之后,所述方法還包括:
[0036]比較得到的所述目標(biāo)事件的特征與預(yù)設(shè)的所述目標(biāo)事件的特征;
[0037]根據(jù)比較結(jié)果,確定出在得到的所述目標(biāo)事件的特征中包含的用于描述目標(biāo)事件的屬性中,與預(yù)設(shè)的所述目標(biāo)事件的特征中包含的用于描述目標(biāo)事件的屬性不相同的屬性;
[0038]將確定出的不相同的屬性作為所述目標(biāo)事件的新增屬性。
[0039]第二方面,提供了一種事件特征的獲取設(shè)備,包括:
[0040]獲取模塊,用于獲取用于描述目標(biāo)事件的特征詞集合,其中,所述特征詞集合中包含多個(gè)特征詞;
[0041]確定模塊,用于從獲取的所述特征詞集合中,確定用于描述所述目標(biāo)事件的屬性的至少一個(gè)特征詞;
[0042]抽取模塊,用于針對(duì)確定的每一個(gè)特征詞,從所述特征詞集合中除用于描述所述目標(biāo)事件的屬性的特征詞之外的剩余特征詞中,抽取出該特征詞所標(biāo)識(shí)的屬性的具體內(nèi)容的至少一個(gè)特征詞,并建立確定的該特征詞與抽取的至少一個(gè)特征詞之間的對(duì)應(yīng)關(guān)系;根據(jù)得到至少一組對(duì)應(yīng)關(guān)系,得到所述目標(biāo)事件的特征。
[0043]結(jié)合第二方面,在第一種可能的實(shí)現(xiàn)方式中,所述獲取設(shè)備還包括:
[0044]建立模塊,用于建立所述目標(biāo)事件的特征與得到的至少一組對(duì)應(yīng)關(guān)系之間的映射關(guān)系O
[0045]結(jié)合第二方面,或者結(jié)合第二方面的第一種可能的實(shí)現(xiàn)方式,在第二種可能的實(shí)現(xiàn)方式中,所述確定模塊,具體用于針對(duì)獲取的所述特征詞集合,執(zhí)行以下操作,直至確定出所述特征詞集合中全部用于描述所述目標(biāo)事件的屬性的特征詞:
[0046]選擇任意一個(gè)特征詞;
[0047]確定選擇的該特征詞在原始文檔中的上下文內(nèi)容;并根據(jù)所述上下文內(nèi)容,判斷該特征詞是否為用于描述所述目標(biāo)事件的屬性的特征詞;
[0048]若判斷結(jié)果是選擇的該特征詞是用于描述所述目標(biāo)事件的屬性的特征詞,則將該特征詞標(biāo)記為用于描述所述目標(biāo)事件的屬性的特征詞,并選擇下一個(gè)特征詞,繼續(xù)執(zhí)行上述操作;
[0049]若判斷結(jié)果是選擇的該特征詞不是用于描述所述目標(biāo)事件的屬性的特征詞,則選擇下一個(gè)特征詞,繼續(xù)執(zhí)行上述操作。
[0050]結(jié)合第二方面的第二種可能的實(shí)現(xiàn)方式,在第三種可能的實(shí)現(xiàn)方式中,所述確定模塊,具體用于根據(jù)所述上下文內(nèi)容,通過語法分析和句法分析,確定該特征詞是否為所述上下文內(nèi)容的中心詞;
[0051]若確定該特征詞為所述上下文內(nèi)容的中心詞,則確定該特征詞為用于描述所述目標(biāo)事件的屬性的特征詞;
[0052]若確定該特征詞不為所述上下文內(nèi)容的中心詞,則確定該特征詞不為用于描述所述目標(biāo)事件的屬性的特征詞。
[0053]結(jié)合第二方面的第二種可能的實(shí)現(xiàn)方式,或者結(jié)合第二方面的第三種可能的實(shí)現(xiàn)方式,在第四種可能的實(shí)現(xiàn)方式中,所述獲取設(shè)備還包括:判斷模塊,其中:
[0054]所述判斷模塊,用于在確定出所述特征詞集合中全部用于描述所述目標(biāo)事件的屬性的特征詞之后,判斷確定出所