本發(fā)明涉及機器學(xué)習(xí)領(lǐng)域,具體提供一種輿情監(jiān)測預(yù)警平臺的設(shè)計方法及裝置。
背景技術(shù):
1、機器學(xué)習(xí)是一門多領(lǐng)域交叉學(xué)科,涉及概率論、統(tǒng)計學(xué)、逼近論、凸分析、算法復(fù)雜度理論等多門學(xué)科。專門研究計算機怎樣模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為,以獲取新的知識或技能,重新組織已有的知識結(jié)構(gòu)使之不斷改善自身的性能。
2、如何通過互聯(lián)網(wǎng)所采集的多通道輿情數(shù)據(jù),實現(xiàn)對新聞、論壇、博客、門戶、貼吧、微信公眾號、微博、app等通道的輿情信息的過濾和去噪,結(jié)合新聞、論壇、微博等通道的負面輿情信息傳播內(nèi)容和特點,建立基于多通道輿情信息的輿情預(yù)警模型,發(fā)現(xiàn)隱藏的輿情異常情況是本領(lǐng)域技術(shù)人員亟待解決的問題。
技術(shù)實現(xiàn)思路
1、本發(fā)明是針對上述現(xiàn)有技術(shù)的不足,提供一種實用性強的輿情監(jiān)測預(yù)警平臺的設(shè)計方法。
2、本發(fā)明進一步的技術(shù)任務(wù)是提供一種設(shè)計合理,安全適用的輿情監(jiān)測預(yù)警平臺的設(shè)計裝置。
3、本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是:
4、一種輿情監(jiān)測預(yù)警平臺的設(shè)計方法,具有如下步驟:
5、s1、輿情信息分類和去噪;
6、s2、企業(yè)負面輿情判定;
7、s3、企業(yè)輿情異常判定及預(yù)警;
8、s4、預(yù)警通知模塊;
9、s5、熱點發(fā)現(xiàn)和分析。
10、進一步的,在步驟s1中,從海量輿情數(shù)據(jù)中識別發(fā)現(xiàn)相關(guān)輿情數(shù)據(jù),一是基于機器學(xué)習(xí)的自動分類方法,二是基于規(guī)則的自動分類方法;
11、基于機器學(xué)習(xí)的自動分類方法有knn、svm、樸素貝葉斯和神經(jīng)網(wǎng)絡(luò),基于規(guī)則的自動分類是用戶直接為每個類目確定分類規(guī)則形成類別模型,規(guī)則分類器依據(jù)類別模型統(tǒng)計測試樣本中滿足的規(guī)則條數(shù)及規(guī)則出現(xiàn)的次數(shù)信息,同時利用規(guī)則在測試文本結(jié)構(gòu)中的位置信息,來衡量測試樣本所屬的類別。
12、進一步的,采用基于機器學(xué)習(xí)和基于規(guī)則的自動分類相結(jié)合的方式,當(dāng)訓(xùn)練預(yù)料充足,類別特征交叉不大時可采用基于機器學(xué)習(xí)的方式;當(dāng)訓(xùn)練樣本少或者質(zhì)量不高時可采用基于規(guī)則的自動分類方式。
13、進一步的,在步驟s2中,企業(yè)負面輿情判定通過實時對企業(yè)輿情數(shù)據(jù)計算分析,發(fā)現(xiàn)企業(yè)相關(guān)負面,并計算負面程度;
14、對于輿情負面判定常用的有兩種方式:一是情感詞典的方法,二是機器學(xué)習(xí)的方法。
15、進一步的,基于情感詞典的方法是從文本中抽取情感單元,再對情感單元進行極性打分,綜合所有情感單元的打分,最終給出文本的情感得分,反映文本的情感傾向性及其強度;
16、基于機器學(xué)習(xí)的方法彌補情感詞典方法知識的不足,通常的算法有支持向量機、卷積神經(jīng)網(wǎng)絡(luò)和深度信念網(wǎng),采用情感詞典和機器學(xué)習(xí)結(jié)合的方式構(gòu)建負面判定模型。
17、進一步的,在步驟s3中,進一步包括:
18、(1)根據(jù)業(yè)務(wù)需求對企業(yè)異常類型進行定義,即構(gòu)建異常標簽體系,并對每種異常類型定義異常特征,另外根據(jù)異常的嚴重程序,將異常分級別;
19、(2)在明確了異常類型和對應(yīng)特征之后,構(gòu)建企業(yè)異常分類模型,通常也是采用基于規(guī)則和基于機器學(xué)習(xí)兩種方式,通過企業(yè)異常分類模型,對企業(yè)輿情數(shù)據(jù)進行篩選分類,得到企業(yè)相關(guān)異常分級輿情數(shù)據(jù);
20、(3)根據(jù)通道類型、異常級別和異常數(shù)量構(gòu)建企業(yè)輿情預(yù)警模型和預(yù)警知識庫,企業(yè)異常輿情數(shù)據(jù)經(jīng)過預(yù)警模型后判斷是否預(yù)警,以及根據(jù)預(yù)警指數(shù)給出預(yù)警級別。
21、進一步的,在步驟s4中,在預(yù)警通知模塊中通過發(fā)郵件和網(wǎng)頁彈窗的方式進行預(yù)警通知。
22、進一步的,在步驟s5中,基于實時流式聚類技術(shù),對輿情信息中的相關(guān)熱點事件進行發(fā)現(xiàn),具體包括:
23、能夠自動發(fā)現(xiàn)指定時間內(nèi)的事件或話題,能夠?qū)﹂L短文本進行匯聚產(chǎn)生輿情熱點,能夠流式處理最新采集到的輿情數(shù)據(jù)并實時匯集到特定熱點,能夠?qū)狳c進行多維度分析;
24、觀點分析是通過研究熱點事件中的各類典型意見,采用自動化的觀點褒貶分析技術(shù),結(jié)合各類領(lǐng)域的領(lǐng)域詞和屬性詞對網(wǎng)民評論進行褒貶分析,分析和歸納網(wǎng)民的主要觀點,并統(tǒng)計網(wǎng)民的褒貶傾向分布情況。
25、一種輿情監(jiān)測預(yù)警平臺的設(shè)計裝置,包括:至少一個存儲器和至少一個處理器;
26、所述至少一個存儲器,用于存儲機器可讀程序;
27、所述至少一個處理器,用于調(diào)用所述機器可讀程序,執(zhí)行一種輿情監(jiān)測預(yù)警平臺的設(shè)計方法。
28、本發(fā)明的一種輿情監(jiān)測預(yù)警平臺的設(shè)計方法及裝置和現(xiàn)有技術(shù)相比,具有以下突出的有益效果:
29、本發(fā)明通過本平臺的輿情監(jiān)測以及預(yù)警,可以找到公眾對某一事件、事物或服務(wù)的態(tài)度和看法,從而幫助企業(yè)更好地了解公眾的需求和期望,制定出更加有效的策略和措施。
1.一種輿情監(jiān)測預(yù)警平臺的設(shè)計方法,其特征在于,具有如下步驟:
2.根據(jù)權(quán)利要求1所述的一種輿情監(jiān)測預(yù)警平臺的設(shè)計方法,其特征在于,在步驟s1中,從海量輿情數(shù)據(jù)中識別發(fā)現(xiàn)相關(guān)輿情數(shù)據(jù),一是基于機器學(xué)習(xí)的自動分類方法,二是基于規(guī)則的自動分類方法;
3.根據(jù)權(quán)利要求2所述的一種輿情監(jiān)測預(yù)警平臺的設(shè)計方法,其特征在于,采用基于機器學(xué)習(xí)和基于規(guī)則的自動分類相結(jié)合的方式,當(dāng)訓(xùn)練預(yù)料充足,類別特征交叉不大時可采用基于機器學(xué)習(xí)的方式;當(dāng)訓(xùn)練樣本少或者質(zhì)量不高時可采用基于規(guī)則的自動分類方式。
4.根據(jù)權(quán)利要求3所述的一種輿情監(jiān)測預(yù)警平臺的設(shè)計方法,其特征在于,在步驟s2中,企業(yè)負面輿情判定通過實時對企業(yè)輿情數(shù)據(jù)計算分析,發(fā)現(xiàn)企業(yè)相關(guān)負面,并計算負面程度;
5.根據(jù)權(quán)利要求4所述的一種輿情監(jiān)測預(yù)警平臺的設(shè)計方法,其特征在于,基于情感詞典的方法是從文本中抽取情感單元,再對情感單元進行極性打分,綜合所有情感單元的打分,最終給出文本的情感得分,反映文本的情感傾向性及其強度;
6.根據(jù)權(quán)利要求5所述的一種輿情監(jiān)測預(yù)警平臺的設(shè)計方法,其特征在于,在步驟s3中,進一步包括:
7.根據(jù)權(quán)利要求6所述的一種輿情監(jiān)測預(yù)警平臺的設(shè)計方法,其特征在于,在步驟s4中,在預(yù)警通知模塊中通過發(fā)郵件和網(wǎng)頁彈窗的方式進行預(yù)警通知。
8.根據(jù)權(quán)利要求7所述的一種輿情監(jiān)測預(yù)警平臺的設(shè)計方法,其特征在于,在步驟s5中,基于實時流式聚類技術(shù),對輿情信息中的相關(guān)熱點事件進行發(fā)現(xiàn),具體包括:
9.一種輿情監(jiān)測預(yù)警平臺的設(shè)計裝置,其特征在于,包括:至少一個存儲器和至少一個處理器;