技術(shù)特征:
技術(shù)總結(jié)
本發(fā)明涉及一種基于依存語義的中文無監(jiān)督開放式實(shí)體關(guān)系抽取方法,該方法包括以下步驟:預(yù)處理輸入文本:對輸入文本進(jìn)行中文分詞、詞性標(biāo)注和依存句法分析;對輸入文本進(jìn)行命名實(shí)體識別;從識別出的實(shí)體中任意選出兩個(gè)實(shí)體構(gòu)成候選實(shí)體對;尋找候選實(shí)體對中的兩個(gè)實(shí)體之間的依存路徑;分析依存路徑所映射的句法結(jié)構(gòu)是否與依存語義范式集的范式匹配,若是,則根據(jù)被匹配的范式從輸入文本的剩余部分中抽取出詞或短語作為關(guān)系詞,抽取的關(guān)系詞與候選實(shí)體對構(gòu)成關(guān)系三元組,若否則進(jìn)行下一組候選實(shí)體對的范式匹配;輸出關(guān)系三元組。與現(xiàn)有技術(shù)相比,本發(fā)明具有計(jì)算復(fù)雜度低、抽取效率高、克服距離位置限制和滿足單句也能抽取等優(yōu)點(diǎn)。
技術(shù)研發(fā)人員:向陽;賈圣賓;鄂世嘉;呂東東
受保護(hù)的技術(shù)使用者:同濟(jì)大學(xué)
技術(shù)研發(fā)日:2017.04.27
技術(shù)公布日:2017.10.24