技術總結
本發(fā)明公開了一種基于用戶畫像的短文本分類方法。本方法為:1)基于用戶發(fā)出的短文本數據生成對應用戶的用戶畫像;其中,用戶ui的用戶畫像為用戶ui屬于類別ci的值;2)采用分類器對該用戶ui的短文本TS進行分類,得到該短文本TS所屬類別的可能性F={f1,...,fi,...,fm};3)根據用戶ui的用戶畫像與F={f1,...,fi,...,fm}計算該短文本TS屬于各類別的值,選出最大的類別結果作為該短文本TS的類別標簽。本發(fā)明大大增加了分類的準確率。
技術研發(fā)人員:張旭;趙志云;劉春陽;龐琳;李雄;王卿;王萌
受保護的技術使用者:國家計算機網絡與信息安全管理中心
文檔號碼:201610453205
技術研發(fā)日:2016.06.21
技術公布日:2016.11.16