技術(shù)特征:
技術(shù)總結(jié)
一種Bagging_BSJ短文本分類方法。短文本具有高稀疏性,實時性,不規(guī)范性等特點,已有的傳統(tǒng)文本分類算法應用于短文本分類時,受奇異數(shù)據(jù)影響較大,難以取得較好的效果。本發(fā)明方法針對短文本的高稀疏性,實時性等特點,提出了基于集成思想的短文本分類方法。將該方法采用Bagging集成算法思想,對短文本進行語義特征擴展,并結(jié)合貝葉斯算法,支持向量機算法以及J48算法,對語義特征擴展后的短文本進行分類,得到了更好的分類效果。本文提出的Bagging_BSJ方法其準確率提高了12%,召回率提高了28%,F(xiàn)值提高了20%。
技術(shù)研發(fā)人員:趙德新;張德干;常智;杜娜娜
受保護的技術(shù)使用者:天津理工大學
技術(shù)研發(fā)日:2017.07.10
技術(shù)公布日:2017.10.24