1.一種文本中知識(shí)領(lǐng)域識(shí)別方法,其特征在于,包括:
步驟S1:判斷相關(guān)領(lǐng)域概念和目標(biāo)領(lǐng)域概念是否出現(xiàn)在同一句子中,若是,則進(jìn)行步驟S2,若否,則進(jìn)行步驟S6;
步驟S2:判斷所述相關(guān)領(lǐng)域概念的數(shù)量是否唯一,若是,則判定找到概念/關(guān)系對(duì),若否,則進(jìn)行步驟S3;
步驟S3:計(jì)算第一相關(guān)領(lǐng)域概念距離和第二相關(guān)概念領(lǐng)域距離之差的絕對(duì)值,得到第一相對(duì)距離,其中,所述第一相關(guān)領(lǐng)域概念距離為所述第一相關(guān)領(lǐng)域概念與所述目標(biāo)領(lǐng)域概念之差的絕對(duì)值,所述第二相關(guān)領(lǐng)域概念距離為所述第二相關(guān)領(lǐng)域概念與所述目標(biāo)領(lǐng)域概念之差的絕對(duì)值;
步驟S4:判斷所述第一相對(duì)距離是否大于或等于第一閾值,若是,則進(jìn)行步驟S5,若否,則根據(jù)語境進(jìn)行分析,以得到概念/關(guān)系對(duì);
步驟S5:判定所述第一相關(guān)領(lǐng)域概念距離和所述第二相關(guān)概念領(lǐng)域距離中的較小者相應(yīng)的相關(guān)概念領(lǐng)域?yàn)楦拍?關(guān)系對(duì);
步驟S6:判斷步驟S1中所述相關(guān)領(lǐng)域概念在相鄰句中是否唯一,若是,則判定找到概念/關(guān)系對(duì),若否,則進(jìn)行步驟S7;
步驟S7:計(jì)算第三相關(guān)領(lǐng)域概念距離和第四相關(guān)概念領(lǐng)域距離之差的絕對(duì)值,得到第二相對(duì)距離,其中,所述第三相關(guān)領(lǐng)域概念距離為所述第三相關(guān)領(lǐng)域概念與所述目標(biāo)領(lǐng)域概念之差的絕對(duì)值,所述第四相關(guān)領(lǐng)域概念距離為所述第四相關(guān)領(lǐng)域概念與所述目標(biāo)領(lǐng)域概念之差的絕對(duì)值;
步驟S8:判斷所述第三相對(duì)距離是否大于或等于第二閾值,若是,則進(jìn)行步驟S9,若否,則根據(jù)語境進(jìn)行分析,以得到概念/關(guān)系對(duì);
步驟S9:判定所述第三相關(guān)領(lǐng)域概念距離和所述第四相關(guān)概念領(lǐng)域距離中的較小者相應(yīng)的相關(guān)概念領(lǐng)域?yàn)楦拍?關(guān)系對(duì)。
2.根據(jù)權(quán)利要求1所述的文本中知識(shí)領(lǐng)域識(shí)別方法,其特征在于,步驟S4中所述根據(jù)語境進(jìn)行分析包括:
按照出現(xiàn)順序獲取所述第一相關(guān)領(lǐng)域概念、所述第二相關(guān)領(lǐng)域概念和所述目標(biāo)領(lǐng)域的序列集合,根據(jù)所述序列集合進(jìn)行分析。
3.根據(jù)權(quán)利要求1至2任一項(xiàng)所述的文本中知識(shí)領(lǐng)域識(shí)別方法,其特征在于,還包括:
若存在相關(guān)領(lǐng)域概念的數(shù)量大于2時(shí),判斷每一個(gè)相關(guān)領(lǐng)域概念是否曾被確認(rèn)為所述目標(biāo)領(lǐng)域概念的概念/關(guān)系對(duì),若否,則判定為找到新概念/關(guān)系對(duì),若是,則需要根據(jù)語境判斷。
4.根據(jù)權(quán)利要求1至2任一項(xiàng)所述的文本中知識(shí)領(lǐng)域識(shí)別方法,其特征在于,還包括:
若存在相關(guān)領(lǐng)域概念的數(shù)量大于2時(shí),判斷每一個(gè)相關(guān)領(lǐng)域概念是否曾作為所述目標(biāo)領(lǐng)域概念的結(jié)果出現(xiàn),若否,則判定為找到新概念/關(guān)系對(duì),若是,則需要根據(jù)語境判斷。
5.一種文本中知識(shí)領(lǐng)域識(shí)別系統(tǒng),其特征在于,包括同句判斷模塊、第一數(shù)量判斷模塊、第一相對(duì)距離計(jì)算模塊、第一閾值判斷模塊、第一距離確定模塊、第二數(shù)量判斷模塊、第二相對(duì)距離計(jì)算模塊、第二閾值判斷模塊和第二距離確定模塊,其中:
所述同句判斷模塊,用于判斷相關(guān)領(lǐng)域概念和目標(biāo)領(lǐng)域概念是否出現(xiàn)在同一句子中,若是,則控制所述第一數(shù)量判斷模塊工作,若否,則控制第二數(shù)量判斷模塊工作;
所述第一數(shù)量判斷模塊,用于判斷所述相關(guān)領(lǐng)域概念的數(shù)量是否唯一,若是,則判定找到概念/關(guān)系對(duì),若否,則控制所述第一相對(duì)距離計(jì)算模塊工作;
所述第一相對(duì)距離計(jì)算模塊,用于計(jì)算第一相關(guān)領(lǐng)域概念距離和第二相關(guān)概念領(lǐng)域距離之差的絕對(duì)值,得到第一相對(duì)距離,其中,所述第一相關(guān)領(lǐng)域概念距離為所述第一相關(guān)領(lǐng)域概念與所述目標(biāo)領(lǐng)域概念之差的絕對(duì)值,所述第二相關(guān)領(lǐng)域概念距離為所述第二相關(guān)領(lǐng)域概念與所述目標(biāo)領(lǐng)域概念之差的絕對(duì)值;
所述第一閾值判斷模塊,用于判斷所述第一相對(duì)距離是否大于或等于第一閾值,若是,則控制所述第一距離確定模塊工作,若否,則根據(jù)語境進(jìn)行分析,以得到概念/關(guān)系對(duì);
所述第一距離確定模塊,用于判定所述第一相關(guān)領(lǐng)域概念距離和所述第二相關(guān)概念領(lǐng)域距離中的較小者相應(yīng)的相關(guān)概念領(lǐng)域?yàn)楦拍?關(guān)系對(duì);
所述第二數(shù)量判斷模塊,用于判斷所述同句判斷模塊中的所述相關(guān)領(lǐng)域概念在相鄰句中是否唯一,若是,則判定找到概念/關(guān)系對(duì),若否,則控制所述第二相對(duì)距離計(jì)算模塊工作;
所述第二相對(duì)距離計(jì)算模塊,用于計(jì)算第三相關(guān)領(lǐng)域概念距離和第四相關(guān)概念領(lǐng)域距離之差的絕對(duì)值,得到第二相對(duì)距離,其中,所述第三相關(guān)領(lǐng)域概念距離為所述第三相關(guān)領(lǐng)域概念與所述目標(biāo)領(lǐng)域概念之差的絕對(duì)值,所述第四相關(guān)領(lǐng)域概念距離為所述第四相關(guān)領(lǐng)域概念與所述目標(biāo)領(lǐng)域概念之差的絕對(duì)值;
所述第二閾值判斷模塊,用于判斷所述第三相對(duì)距離是否大于或等于第二閾值,若是,則控制所述第二距離確定模塊工作,若否,則根據(jù)語境進(jìn)行分析,以得到概念/關(guān)系對(duì);
所述第二距離確定模塊,用于判定所述第三相關(guān)領(lǐng)域概念距離和所述第四相關(guān)概念領(lǐng)域距離中的較小者相應(yīng)的相關(guān)概念領(lǐng)域?yàn)楦拍?關(guān)系對(duì)。