1.一種基于權重學習和多特征抽取的多情緒分類方法,其特征在于,包括以下步驟:
從互聯(lián)網上獲取多條用戶發(fā)布的微博文本;
對所述多條微博文本進行預處理,以抽取多個詞性特征詞和多個句法特征詞;
通過權重學習融合所述多個詞性特征詞和多個句法特征詞,以得到句子信息;
根據(jù)所述句子信息訓練情緒分類體系中每個節(jié)點的二分類器,以構建所述情緒分類體系,并通過所述分類體系實現(xiàn)情緒分類;以及
根據(jù)分類結果得到所述多條用戶發(fā)布的微博文本的情緒分類信息。
2.根據(jù)權利要求1所述的基于權重學習和多特征抽取的多情緒分類方法,其特征在于,所述對所述多條微博文本進行預處理為對微博文本進行分詞、詞性標注和句法依存分析。
3.根據(jù)權利要求1所述的基于權重學習和多特征抽取的多情緒分類方法,其特征在于,根據(jù)名詞、動詞、形容詞和副詞抽取所述多個詞性特征詞,并且根據(jù)句法結構特征抽取所述多個句法特征,其中,所述句法結構特征包括動補結構、關聯(lián)結構、后附加結構、定中結構、動賓結構、主謂結構、狀中結構、并列結構和核心。
4.根據(jù)權利要求1所述的基于權重學習和多特征抽取的多情緒分類方法,其特征在于,在詞性抽取中,否定詞與后一個詞集合成一個詞,以進行詞向量表示之后再進行抽取。
5.根據(jù)權利要求1所述的基于權重學習和多特征抽取的多情緒分類方法,其特征在于,所述通過權重學習融合所述多個詞性特征詞和多個句法特征詞進一步包括:
運用權重和閾值將所述多個詞性特征詞的預測值和所述多個句法特征詞的預測值相融合,以得到所述句子信息。
6.一種基于權重學習和多特征抽取的多情緒分類裝置,其特征在于,包括:
獲取模塊,用于從互聯(lián)網上獲取多條用戶發(fā)布的微博文本;
抽取模塊,用于對所述多條微博文本進行預處理,以抽取多個詞性特征詞和多個句法特征詞;
融合模塊,用于通過權重學習融合所述多個詞性特征詞和多個句法特征詞,以得到句子信息;
構建模塊,用于根據(jù)所述句子信息訓練情緒分類體系中每個節(jié)點的二分類器,以構建所述情緒分類體系,并通過所述分類體系實現(xiàn)情緒分類;以及
分類模塊,用于根據(jù)分類結果得到所述多條用戶發(fā)布的微博文本的情緒分類信息。
7.根據(jù)權利要求6所述的基于權重學習和多特征抽取的多情緒分類裝置,其特征在于,所述對所述多條微博文本進行預處理為對微博文本進行分詞、詞性標注和句法依存分析。
8.根據(jù)權利要求6所述的基于權重學習和多特征抽取的多情緒分類裝置,其特征在于,根據(jù)名詞、動詞、形容詞和副詞抽取所述多個詞性特征詞,并且根據(jù)句法結構特征抽取所述多個句法特征,其中,所述句法結構特征包括動補結構、關聯(lián)結構、后附加結構、定中結構、動賓結構、主謂結構、狀中結構、并列結構和核心。
9.根據(jù)權利要求6所述的基于權重學習和多特征抽取的多情緒分類裝置,其特征在于,在詞性抽取中,否定詞與后一個詞集合成一個詞,以進行詞向量表示之后再進行抽取。
10.根據(jù)權利要求6所述的基于權重學習和多特征抽取的多情緒分類裝置,其特征在于,所述融合模塊具體用于運用權重和閾值將所述多個詞性特征詞的預測值和所述多個句法特征詞的預測值相融合,以得到所述句子信息。