知識(shí)數(shù)據(jù)的處理方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及計(jì)算機(jī)技術(shù)領(lǐng)域,特別涉及一種知識(shí)數(shù)據(jù)的處理方法和裝置。
【背景技術(shù)】
[0002]隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,互聯(lián)網(wǎng)已成為人們獲取知識(shí)的重要手段之一,基于互聯(lián)網(wǎng)的知識(shí)庫(kù)應(yīng)運(yùn)而生。由于互聯(lián)網(wǎng)的知識(shí)庫(kù)通常由多個(gè)知識(shí)數(shù)據(jù)源構(gòu)成,而不同知識(shí)數(shù)據(jù)源中同一個(gè)知識(shí)主題的知識(shí)數(shù)據(jù)可能不同,甚至?xí)嬖诒舜藳_突或錯(cuò)誤,因此,在使用多個(gè)知識(shí)數(shù)據(jù)源中的知識(shí)數(shù)據(jù)構(gòu)建知識(shí)庫(kù)時(shí),需要對(duì)其中的知識(shí)數(shù)據(jù)進(jìn)行檢測(cè)。
[0003]通常,可使用較簡(jiǎn)單的屬性約束規(guī)則對(duì)知識(shí)數(shù)據(jù)進(jìn)行檢測(cè),即將知識(shí)數(shù)據(jù)中的主體和/或客體的屬性信息(如性別、年齡等)與預(yù)先設(shè)置的屬性約束條件對(duì)比,如果主體和/或客體的屬性信息滿足屬性約束條件,則該知識(shí)數(shù)據(jù)是正確的,如果主體和/或客體的屬性信息不滿足屬性約束條件,則該知識(shí)數(shù)據(jù)是錯(cuò)誤的。
[0004]前述知識(shí)數(shù)據(jù)的處理方法至少存在以下問(wèn)題:
[0005]通過(guò)上述處理方法并不能夠檢測(cè)出知識(shí)庫(kù)中存在信息沖突的所有知識(shí)數(shù)據(jù),而僅能夠檢測(cè)出很少的一部分知識(shí)數(shù)據(jù)存在錯(cuò)誤,知識(shí)庫(kù)中仍然存在大量相互沖突的知識(shí)數(shù)據(jù),從而使得知識(shí)庫(kù)中知識(shí)數(shù)據(jù)的準(zhǔn)確率較低。
【發(fā)明內(nèi)容】
[0006]本發(fā)明的實(shí)施例提供一種知識(shí)數(shù)據(jù)的處理方法和裝置,通過(guò)將由待檢測(cè)的知識(shí)數(shù)據(jù)得到的第一結(jié)構(gòu)化知識(shí)數(shù)據(jù)和已有的第二結(jié)構(gòu)化知識(shí)數(shù)據(jù)進(jìn)行比對(duì),確定待檢測(cè)的知識(shí)數(shù)據(jù)是否與已有的知識(shí)數(shù)據(jù)存在信息沖突,便于后續(xù)對(duì)存在信息沖突的知識(shí)數(shù)據(jù)的正確性做進(jìn)一步判別,以提高知識(shí)庫(kù)中知識(shí)數(shù)據(jù)的準(zhǔn)確率。
[0007]為達(dá)到上述目的,本發(fā)明的實(shí)施例提供了一種知識(shí)數(shù)據(jù)的處理方法。所述處理方法包括,獲取待檢測(cè)的知識(shí)數(shù)據(jù);從所述待檢測(cè)的知識(shí)數(shù)據(jù)提取主體、謂詞和客體的數(shù)據(jù),得到相應(yīng)的第一結(jié)構(gòu)化知識(shí)數(shù)據(jù);根據(jù)預(yù)設(shè)的知識(shí)沖突檢測(cè)規(guī)則,將所述第一結(jié)構(gòu)化知識(shí)數(shù)據(jù)和已有的第二結(jié)構(gòu)化知識(shí)數(shù)據(jù)進(jìn)行比對(duì),確定所述待檢測(cè)的知識(shí)數(shù)據(jù)是否與所述已有的知識(shí)數(shù)據(jù)存在信息沖突。
[0008]可選地,所述知識(shí)沖突檢測(cè)規(guī)則包括至少一個(gè)以下規(guī)則:主體沖突檢測(cè)規(guī)則、謂詞沖突檢測(cè)規(guī)則和客體沖突檢測(cè)規(guī)則。
[0009]可選地,所述處理方法還包括:根據(jù)預(yù)設(shè)的屬性約束檢測(cè)規(guī)則對(duì)所述第一結(jié)構(gòu)化知識(shí)數(shù)據(jù)中的主體和/或客體的屬性信息進(jìn)行分析,確定所述第一結(jié)構(gòu)化知識(shí)數(shù)據(jù)是否滿足預(yù)設(shè)的屬性約束條件,其中,所述屬性信息包括性別信息、民族信息、年齡信息和/或體重信息。
[0010]可選地,所述根據(jù)預(yù)設(shè)的知識(shí)沖突檢測(cè)規(guī)則,將所述第一結(jié)構(gòu)化知識(shí)數(shù)據(jù)和已有的第二結(jié)構(gòu)化知識(shí)數(shù)據(jù)進(jìn)行比對(duì),確定所述待檢測(cè)的知識(shí)數(shù)據(jù)是否與所述已有的知識(shí)數(shù)據(jù)存在信息沖突的處理包括:如果所述第二結(jié)構(gòu)化知識(shí)數(shù)據(jù)中的任一結(jié)構(gòu)化知識(shí)數(shù)據(jù)與所述第一結(jié)構(gòu)化知識(shí)數(shù)據(jù)中主體、謂詞和客體中的任意兩項(xiàng)的內(nèi)容信息相同,剩余項(xiàng)的內(nèi)容信息不同,則確定所述第一結(jié)構(gòu)化知識(shí)數(shù)據(jù)與所述第二結(jié)構(gòu)化知識(shí)數(shù)據(jù)存在信息沖突。
[0011]可選地,所述處理方法還包括:如果所述第二結(jié)構(gòu)化知識(shí)數(shù)據(jù)與所述第一結(jié)構(gòu)化知識(shí)數(shù)據(jù)中主體、謂詞和客體中的至少兩項(xiàng)的內(nèi)容信息不同,則將所述第一結(jié)構(gòu)化知識(shí)數(shù)據(jù)標(biāo)注為所述第二結(jié)構(gòu)化知識(shí)數(shù)據(jù)。
[0012]可選地,所述第一結(jié)構(gòu)化知識(shí)數(shù)據(jù)和所述第二結(jié)構(gòu)化知識(shí)數(shù)據(jù)分別通過(guò)包括主體、謂詞和客體的數(shù)據(jù)的三元組表征。
[0013]為達(dá)到上述目的,本發(fā)明的實(shí)施例還提供了一種知識(shí)數(shù)據(jù)的處理裝置。所述處理裝置包括:知識(shí)數(shù)據(jù)獲取模塊,用于獲取待檢測(cè)的知識(shí)數(shù)據(jù);結(jié)構(gòu)化知識(shí)獲取模塊,用于從所述待檢測(cè)的知識(shí)數(shù)據(jù)提取主體、謂詞和客體的數(shù)據(jù),得到相應(yīng)的第一結(jié)構(gòu)化知識(shí)數(shù)據(jù);信息沖突確定模塊,用于根據(jù)預(yù)設(shè)的知識(shí)沖突檢測(cè)規(guī)則,將所述第一結(jié)構(gòu)化知識(shí)數(shù)據(jù)和已有的第二結(jié)構(gòu)化知識(shí)數(shù)據(jù)進(jìn)行比對(duì),確定所述待檢測(cè)的知識(shí)數(shù)據(jù)是否與所述已有的知識(shí)數(shù)據(jù)存在息沖突。
[0014]可選地,所述知識(shí)沖突檢測(cè)規(guī)則包括至少一個(gè)以下規(guī)則:主體沖突檢測(cè)規(guī)則、謂詞沖突檢測(cè)規(guī)則和客體沖突檢測(cè)規(guī)則。
[0015]可選地,所述處理裝置還包括:屬性約束檢測(cè)模塊,用于根據(jù)預(yù)設(shè)的屬性約束檢測(cè)規(guī)則對(duì)所述第一結(jié)構(gòu)化知識(shí)數(shù)據(jù)中的主體和/或客體的屬性信息進(jìn)行分析,確定所述第一結(jié)構(gòu)化知識(shí)數(shù)據(jù)是否滿足預(yù)設(shè)的屬性約束條件,其中,所述屬性信息包括性別信息、民族信息、年齡信息和/或體重信息。
[0016]可選地,所述信息沖突確定模塊用于:如果所述第二結(jié)構(gòu)化知識(shí)數(shù)據(jù)中的任一結(jié)構(gòu)化知識(shí)數(shù)據(jù)與所述第一結(jié)構(gòu)化知識(shí)數(shù)據(jù)中主體、謂詞和客體中的任意兩項(xiàng)的內(nèi)容信息相同,剩余項(xiàng)的內(nèi)容信息不同,則確定所述第一結(jié)構(gòu)化知識(shí)數(shù)據(jù)與所述第二結(jié)構(gòu)化知識(shí)數(shù)據(jù)存在息沖突。
[0017]可選地,所述處理裝置還包括:結(jié)構(gòu)化知識(shí)標(biāo)注模塊,用于如果所述第二結(jié)構(gòu)化知識(shí)數(shù)據(jù)與所述第一結(jié)構(gòu)化知識(shí)數(shù)據(jù)中主體、謂詞和客體中的至少兩項(xiàng)的內(nèi)容信息不同,則將所述第一結(jié)構(gòu)化知識(shí)數(shù)據(jù)標(biāo)注為所述第二結(jié)構(gòu)化知識(shí)數(shù)據(jù)。
[0018]本發(fā)明實(shí)施例提供的知識(shí)數(shù)據(jù)的處理方法和裝置,通過(guò)從獲取的待檢測(cè)的知識(shí)數(shù)據(jù)提取主體、謂詞和客體的數(shù)據(jù),得到相應(yīng)的第一結(jié)構(gòu)化知識(shí)數(shù)據(jù),并根據(jù)預(yù)設(shè)的知識(shí)沖突檢測(cè)規(guī)則,將第一結(jié)構(gòu)化知識(shí)數(shù)據(jù)和已有的第二結(jié)構(gòu)化知識(shí)數(shù)據(jù)進(jìn)行比對(duì),確定待檢測(cè)的知識(shí)數(shù)據(jù)是否與已有的知識(shí)數(shù)據(jù)存在信息沖突,便于后續(xù)對(duì)存在信息沖突的知識(shí)數(shù)據(jù)的正確性做進(jìn)一步判別,以提高知識(shí)庫(kù)中知識(shí)數(shù)據(jù)的準(zhǔn)確率。
【附圖說(shuō)明】
[0019]圖1為本發(fā)明實(shí)施例提供的知識(shí)數(shù)據(jù)的處理方法的一種流程圖;
[0020]圖2為本發(fā)明實(shí)施例提供的知識(shí)數(shù)據(jù)的處理方法的另一種流程圖;
[0021]圖3為本發(fā)明實(shí)施例提供的知識(shí)數(shù)據(jù)的處理裝置的一種結(jié)構(gòu)示意圖;
[0022]圖4為本發(fā)明實(shí)施例提供的知識(shí)數(shù)據(jù)的處理裝置的另一種結(jié)構(gòu)示意圖;
[0023]圖5為本發(fā)明實(shí)施例提供的知識(shí)數(shù)據(jù)的處理裝置的又一種結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0024]本方案的發(fā)明構(gòu)思是,通過(guò)從獲取的待檢測(cè)的知識(shí)數(shù)據(jù)提取主體、謂詞和客體的數(shù)據(jù),得到相應(yīng)的第一結(jié)構(gòu)化知識(shí)數(shù)據(jù),并根據(jù)預(yù)設(shè)的知識(shí)沖突檢測(cè)規(guī)則,將第一結(jié)構(gòu)化知識(shí)數(shù)據(jù)和已有的第二結(jié)構(gòu)化知識(shí)數(shù)據(jù)進(jìn)行比對(duì),確定待檢測(cè)的知識(shí)數(shù)據(jù)是否與已有的知識(shí)數(shù)據(jù)存在信息沖突,便于后續(xù)對(duì)存在信息沖突的知識(shí)數(shù)據(jù)的正確性做進(jìn)一步判別,以提高知識(shí)庫(kù)中知識(shí)數(shù)據(jù)的準(zhǔn)確率。
[0025]下面結(jié)合附圖對(duì)本發(fā)明實(shí)施例知識(shí)數(shù)據(jù)的處理方法和裝置進(jìn)行詳細(xì)描述。
[0026]實(shí)施例一
[0027]圖1是本發(fā)明實(shí)施例提供的知識(shí)數(shù)據(jù)的處理方法的流程圖。通過(guò)包括如圖3所示的裝置的計(jì)算機(jī)系統(tǒng)執(zhí)行所述處理方法。
[0028]如圖1所示,在步驟S110,獲取待檢測(cè)的知識(shí)數(shù)據(jù)。
[0029]其中,知識(shí)數(shù)據(jù)可以為知識(shí)庫(kù)中的一個(gè)語(yǔ)句或多個(gè)語(yǔ)句,例如,石家莊市地處河北省中南部,是河北省省會(huì)。知識(shí)庫(kù)可以由多個(gè)知識(shí)源構(gòu)成,例如,百度百科、維基百科和新聞網(wǎng)站等。
[0030]具體地,由于知識(shí)庫(kù)由多個(gè)知識(shí)源構(gòu)成,因此,來(lái)自于不同知識(shí)源的同一個(gè)主題的知識(shí)數(shù)據(jù)可能有真有假,為了給查詢相應(yīng)知識(shí)信息的用戶提供正確的查詢結(jié)果,可預(yù)先對(duì)知識(shí)庫(kù)中的知識(shí)數(shù)據(jù)進(jìn)行沖突檢測(cè)。在進(jìn)行沖