技術(shù)特征:
技術(shù)總結(jié)
本發(fā)明公開了一種基于中心連通子圖的相似實(shí)體識別方法及系統(tǒng),方法包括:將需要比較的實(shí)體轉(zhuǎn)化為通過中心連通子圖進(jìn)行描述;對中心連通子圖進(jìn)行相似度計(jì)算,得到總相似度;判斷總相似度是否大于預(yù)設(shè)的相似度閾值,若是,則判定為相似;反之,則判定為不相似。系統(tǒng)包括轉(zhuǎn)換單元、相似度計(jì)算單元和相似度判斷單元。本發(fā)明通過將實(shí)體轉(zhuǎn)換為中心連通子圖,從而能進(jìn)行整體的相似計(jì)算,相對于現(xiàn)有技術(shù)中的只能針對于數(shù)據(jù)庫,所研究的實(shí)體更為抽象,應(yīng)用更加廣泛,而且本發(fā)明還能結(jié)合結(jié)構(gòu)和語義信息進(jìn)行相似性的比較,有效提高相似性計(jì)算的準(zhǔn)確性。本發(fā)明可廣泛應(yīng)用于數(shù)據(jù)庫領(lǐng)域中。
技術(shù)研發(fā)人員:趙淦森;廖智銳;莊序填;吳杰超;任雪琦;余達(dá)明;湯庸;馬朝輝;王欣明;聶瑞華
受保護(hù)的技術(shù)使用者:華南師范大學(xué)
技術(shù)研發(fā)日:2017.03.21
技術(shù)公布日:2017.09.05