1.一種實(shí)時(shí)流式文本分級(jí)監(jiān)控方法,其特征在于,包括:
實(shí)時(shí)獲取流式的短文本;
對(duì)所述短文本進(jìn)行數(shù)據(jù)清洗、數(shù)據(jù)補(bǔ)齊和數(shù)據(jù)過(guò)濾處理,生成結(jié)構(gòu)化數(shù)據(jù);
對(duì)所述結(jié)構(gòu)化數(shù)據(jù)進(jìn)行文本分詞處理,獲得K個(gè)詞;所述K為大于0的整數(shù);
根據(jù)敏感詞數(shù)據(jù)庫(kù),對(duì)所述K個(gè)詞進(jìn)行敏感分析,獲得所述短文本的敏感值;
根據(jù)情感詞數(shù)據(jù)庫(kù),對(duì)所述K個(gè)詞進(jìn)行情感分析,獲得所述短文本的情感值;
根據(jù)所述敏感值與所述情感值,獲得所述短文本所屬的用戶的監(jiān)控等級(jí)。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述敏感值與所述情感值,獲得所述短文本對(duì)應(yīng)的用戶的監(jiān)控等級(jí),包括:
根據(jù)所述敏感值和所述情感值,獲得所述用戶的初始監(jiān)控等級(jí);
根據(jù)所述用戶的歷史短文本,獲得所述用戶的歷史監(jiān)控等級(jí);
根據(jù)所述用戶的初始監(jiān)控等級(jí)和所述歷史監(jiān)控等級(jí),獲得所述用戶的監(jiān)控等級(jí)。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述根據(jù)所述用戶的歷史短文本,獲得所述用戶的歷史監(jiān)控等級(jí)之前,還包括:
確定所述用戶的初始監(jiān)控等級(jí)大于第一預(yù)設(shè)監(jiān)控等級(jí)。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括:
標(biāo)注所述K個(gè)詞的詞性;
根據(jù)所述K個(gè)詞的詞性,對(duì)所述K個(gè)詞進(jìn)行語(yǔ)義分析;
所述根據(jù)敏感詞數(shù)據(jù)庫(kù),對(duì)所述K個(gè)詞進(jìn)行敏感分析,獲得所述短文本的敏感值,包括:根據(jù)敏感詞數(shù)據(jù)庫(kù),對(duì)語(yǔ)義分析后的所述K個(gè)詞進(jìn)行敏感分析,獲得所述短文本的敏感值;
所述根據(jù)情感詞數(shù)據(jù)庫(kù),對(duì)所述K個(gè)詞進(jìn)行情感分析,獲得所述短文本的情感值,包括:根據(jù)情感詞數(shù)據(jù)庫(kù),對(duì)語(yǔ)義分析后的所述K個(gè)詞進(jìn)行情感分析,獲得所述短文本的情感值。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述敏感詞數(shù)據(jù)庫(kù)包括以下至少一種:網(wǎng)絡(luò)統(tǒng)計(jì)的敏感詞、預(yù)設(shè)的敏感詞;
所述情感詞數(shù)據(jù)庫(kù)包括以下至少一種:網(wǎng)絡(luò)統(tǒng)計(jì)的情感詞、預(yù)設(shè)的情感詞。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,還包括:
當(dāng)所述用戶的監(jiān)控等級(jí)大于第二預(yù)設(shè)監(jiān)控等級(jí)時(shí),獲取所述短文本的M個(gè)關(guān)鍵詞;所述M為大于0的整數(shù);
將所述M個(gè)關(guān)鍵詞分別添加至所述敏感詞數(shù)據(jù)庫(kù)和所述情感詞數(shù)據(jù)庫(kù)中。
7.一種實(shí)時(shí)流式文本分級(jí)監(jiān)控裝置,其特征在于,包括:
第一獲取模塊,用于實(shí)時(shí)獲取流式的短文本;
生成模塊,用于對(duì)所述短文本進(jìn)行數(shù)據(jù)清洗、數(shù)據(jù)補(bǔ)齊和數(shù)據(jù)過(guò)濾處理,生成結(jié)構(gòu)化數(shù)據(jù);
分詞模塊,用于對(duì)所述結(jié)構(gòu)化數(shù)據(jù)進(jìn)行文本分詞處理,獲得K個(gè)詞;所述K為大于0的整數(shù);
敏感分析模塊,用于根據(jù)敏感詞數(shù)據(jù)庫(kù),對(duì)所述K個(gè)詞進(jìn)行敏感分析,獲得所述短文本的敏感值;
情感分析模塊,用于根據(jù)情感詞數(shù)據(jù)庫(kù),對(duì)所述K個(gè)詞進(jìn)行情感分析,獲得所述短文本的情感值;
第二獲取模塊,用于根據(jù)所述敏感值與所述情感值,獲得所述短文本所屬的用戶的監(jiān)控等級(jí)。
8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述第二獲取模塊,包括:
第一獲取子模塊,用于根據(jù)所述敏感值和所述情感值,獲得所述用戶的初始監(jiān)控等級(jí);
第二獲取子模塊,用于根據(jù)所述用戶的歷史短文本,獲得所述用戶的歷史監(jiān)控等級(jí);
第三獲取子模塊,用于根據(jù)所述用戶的初始監(jiān)控等級(jí)和所述歷史監(jiān)控等級(jí),獲得所述用戶的監(jiān)控等級(jí)。
9.根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述第二獲取模塊,還包括:
確定子模塊,用于在所述第二獲取子模塊根據(jù)所述用戶的歷史短文本,獲得所述用戶的歷史監(jiān)控等級(jí)之前,確定所述用戶的初始監(jiān)控等級(jí)大于第一預(yù)設(shè)監(jiān)控等級(jí)。
10.根據(jù)權(quán)利要求7所述的裝置,其特征在于,還包括:標(biāo)注模塊和語(yǔ)義分析模塊;
所述標(biāo)注模塊,用于標(biāo)注所述K個(gè)詞的詞性;
所述語(yǔ)義分析模塊,用于根據(jù)所述K個(gè)詞的詞性,對(duì)所述K個(gè)詞進(jìn)行語(yǔ)義分析;
所述敏感分析模塊,具體用于根據(jù)敏感詞數(shù)據(jù)庫(kù),對(duì)語(yǔ)義分析后的所述K個(gè)詞進(jìn)行敏感分析,獲得所述短文本的敏感值;
所述情感分析模塊,具體用于根據(jù)情感詞數(shù)據(jù)庫(kù),對(duì)語(yǔ)義分析后的所述K個(gè)詞進(jìn)行情感分析,獲得所述短文本的情感值。