技術(shù)總結(jié)
本發(fā)明實施例提供了一種文本聚類方法和裝置,解決了現(xiàn)有技術(shù)中的文本聚類方式無法在依存句法層面上實現(xiàn)文本聚類的問題。該文本聚類方法包括:識別文本庫的每個待聚類文本中詞語之間的依存句法關(guān)系;將每個待聚類文本中存在的依存句法關(guān)系轉(zhuǎn)化為句法編碼;計算文本庫中待聚類文本的句法編碼之間的相似度;以及根據(jù)相似度的計算結(jié)果對文本庫中的待聚類文本進(jìn)行聚類。
技術(shù)研發(fā)人員:白楊;張磊;朱頻頻
受保護(hù)的技術(shù)使用者:上海智臻智能網(wǎng)絡(luò)科技股份有限公司
文檔號碼:201610539157
技術(shù)研發(fā)日:2016.07.11
技術(shù)公布日:2016.12.07