技術(shù)總結(jié)
本發(fā)明涉及數(shù)據(jù)挖掘領(lǐng)域,公開了一種特征詞關(guān)系獲取方法及裝置,以解決現(xiàn)有技術(shù)中只能通過人工打標方式獲得所有特征詞對以及每對特征詞之間的關(guān)聯(lián)關(guān)系,從而導致人力資源大量浪費的技術(shù)問題。該方法包括:獲取種子文件,種子文件中包含M個特征詞對以及每對特征詞之間的關(guān)聯(lián)關(guān)系,M為正整數(shù);將種子文件中的特征詞對作為種子詞對,基于種子詞對從語料信息中提取出特征模板,特征模板中包含對應種子詞對的上下文信息,N為正整數(shù);基于特征模板獲取具有關(guān)聯(lián)關(guān)系的特征詞對。達到了降低人力資源的浪費的技術(shù)效果。
技術(shù)研發(fā)人員:商勝
受保護的技術(shù)使用者:北京搜狗科技發(fā)展有限公司
文檔號碼:201510303223
技術(shù)研發(fā)日:2015.06.05
技術(shù)公布日:2017.01.04