一種智能的輿情突發(fā)事件應(yīng)急處理系統(tǒng)及方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于計(jì)算機(jī)應(yīng)用領(lǐng)域,涉及將自然語(yǔ)言處理技術(shù)、本體理論和語(yǔ)義關(guān)聯(lián)技 術(shù)應(yīng)用于互聯(lián)網(wǎng)輿情突發(fā)事件的智能識(shí)別和防控方案的自動(dòng)生成。它基于計(jì)算機(jī)信息處理 方法實(shí)現(xiàn)對(duì)應(yīng)急防控預(yù)案的格式化轉(zhuǎn)化,實(shí)現(xiàn)輿情突發(fā)事件情景與預(yù)案之間的語(yǔ)義匹配, 實(shí)現(xiàn)對(duì)各種互聯(lián)網(wǎng)輿情突發(fā)事件的準(zhǔn)確識(shí)別和輔助決策。
【背景技術(shù)】
[0002] 隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,互聯(lián)網(wǎng)已成為一種被廣泛使用的大眾媒介,其觸角 幾乎伸向社會(huì)的各個(gè)領(lǐng)域,并逐漸成為公眾輿論的一個(gè)新的重要媒介。網(wǎng)絡(luò)輿情是公眾在 互聯(lián)網(wǎng)上公開(kāi)表達(dá)的對(duì)某種社會(huì)現(xiàn)象或社會(huì)問(wèn)題的具有一定影響力和傾向性的共同意見(jiàn), 網(wǎng)絡(luò)輿情對(duì)政治生活秩序和社會(huì)穩(wěn)定的影響與日俱增,一些網(wǎng)絡(luò)輿情突發(fā)事件不能及時(shí) 妥善處理,極有可能誘發(fā)民眾的不良情緒及不良行為的發(fā)生,進(jìn)而對(duì)社會(huì)穩(wěn)定形成嚴(yán)重威 脅。迫切需要一種技術(shù)手段能夠?qū)崿F(xiàn)對(duì)網(wǎng)絡(luò)輿情信息的自動(dòng)監(jiān)控,能夠?qū)浨橥话l(fā)事件的 處置提供決策支持。
【發(fā)明內(nèi)容】
[0003] 本發(fā)明就是針對(duì)上述需求,提出了一種計(jì)算機(jī)應(yīng)用系統(tǒng)一輿情突發(fā)事件應(yīng)急處理 系統(tǒng),它能夠?qū)ヂ?lián)網(wǎng)輿情進(jìn)行實(shí)時(shí)監(jiān)控,能夠輔助決策者根據(jù)輿情突發(fā)事件的實(shí)際情況 有針對(duì)性地形成相適合的防控方案,加快對(duì)網(wǎng)絡(luò)輿情突發(fā)事件的處置響應(yīng)速度。
[0004] 本發(fā)明所要解決的技術(shù)問(wèn)題由以下技術(shù)方案實(shí)現(xiàn):
[0005] -種智能的輿情突發(fā)事件應(yīng)急處理系統(tǒng),其特征在于:該系統(tǒng)包括互聯(lián)網(wǎng)信息采 集與解析模塊、互聯(lián)網(wǎng)信息分析模塊、網(wǎng)絡(luò)文本類別判斷與聚類分析模塊、應(yīng)急處理方案生 成模塊和應(yīng)急處理效果評(píng)估模塊;所述互聯(lián)網(wǎng)信息采集與解析模塊用于從互聯(lián)網(wǎng)上采集信 息,抽取出網(wǎng)頁(yè)中自然語(yǔ)言文字以及網(wǎng)頁(yè)的元數(shù)據(jù)信息,并保存到數(shù)據(jù)庫(kù)中;所述互聯(lián)網(wǎng)信 息分析模塊用于對(duì)采集來(lái)的信息中的自然語(yǔ)言文字進(jìn)行特征抽取,形成文本特征;所述網(wǎng) 絡(luò)文本類別判斷與聚類分析模塊用于對(duì)網(wǎng)絡(luò)文本的類別進(jìn)行判斷,對(duì)累積網(wǎng)絡(luò)文本進(jìn)行聚 類分析;所述應(yīng)急處理方案生成模塊用于根據(jù)輿情事件的具體情況自動(dòng)生成相應(yīng)的處理預(yù) 案,決策人員可以基于處理預(yù)案制定執(zhí)行方案;所述應(yīng)急處理效果評(píng)估模塊用于對(duì)執(zhí)行方 案的執(zhí)行效果進(jìn)行評(píng)估。
[0006] -種智能的輿情突發(fā)事件應(yīng)急處理系統(tǒng)及方法,其特征在于該方法包括以下步 驟:
[0007] ①互聯(lián)網(wǎng)信息采集與解析:由連接互聯(lián)網(wǎng)的計(jì)算機(jī)從互聯(lián)網(wǎng)論壇、博客、新聞網(wǎng)站 上采集論壇帖子、博客內(nèi)容和網(wǎng)站新聞網(wǎng)頁(yè)等網(wǎng)絡(luò)數(shù)據(jù),然后,利用計(jì)算機(jī)采用基于規(guī)則的 信息抽取技術(shù)自動(dòng)地對(duì)網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行解析,從其中抽取兩類信息:自然語(yǔ)言文字信息和網(wǎng) 頁(yè)的元數(shù)據(jù)信息;自然語(yǔ)言文字信息包括新聞標(biāo)題、新聞?wù)摹⒄搲訕?biāo)題、帖子內(nèi)容等 信息;網(wǎng)頁(yè)的元數(shù)據(jù)信息包括發(fā)表時(shí)間、作者、發(fā)帖者、帖子回復(fù)量、帖子閱讀量、出現(xiàn)的網(wǎng) 站名稱、網(wǎng)站URL等信息,解析出來(lái)的信息保存到數(shù)據(jù)庫(kù)中,信息采集與解析是一個(gè)持續(xù)的 過(guò)程,形成對(duì)互聯(lián)網(wǎng)站的自動(dòng)連續(xù)監(jiān)控;
[0008] ②互聯(lián)網(wǎng)信息分析:首先利用自然語(yǔ)言處理技術(shù)的中文分詞方法對(duì)網(wǎng)絡(luò)文本的標(biāo) 題和正文內(nèi)容分別進(jìn)行分詞,并對(duì)分詞結(jié)果中每個(gè)詞項(xiàng)的詞性進(jìn)行標(biāo)注,之后舍棄掉除名 詞、動(dòng)詞、形容詞之外的詞項(xiàng),然后利用文本多精度表示方法抽取網(wǎng)絡(luò)文本的單個(gè)詞項(xiàng)特征 和詞項(xiàng)關(guān)聯(lián)特征,再根據(jù)分詞結(jié)果中的詞性標(biāo)注情況識(shí)別出網(wǎng)絡(luò)文本中的地理位置特征和 人物特征,地理位置特征是網(wǎng)絡(luò)文本中出現(xiàn)的地理位置名稱、人物特征是網(wǎng)絡(luò)文本中出現(xiàn) 的人物名稱;
[0009] ③將步驟②處理后的網(wǎng)絡(luò)文本中的詞項(xiàng)與計(jì)算機(jī)數(shù)據(jù)庫(kù)中設(shè)定的輿情類別的詞 項(xiàng)特征進(jìn)行比對(duì)匹配,并根據(jù)匹配結(jié)果將網(wǎng)絡(luò)文本按照計(jì)算機(jī)數(shù)據(jù)庫(kù)中設(shè)定的輿情類別進(jìn) 行歸類處理;將不能歸類的網(wǎng)絡(luò)文本進(jìn)行聚類分析,把內(nèi)容相近的網(wǎng)絡(luò)文本聚成簇,若簇內(nèi) 網(wǎng)絡(luò)文本數(shù)量超出設(shè)定閾值,則對(duì)簇內(nèi)網(wǎng)絡(luò)文本進(jìn)行輿情類別的詞項(xiàng)特征抽處理,并將抽 取的輿情類別的詞項(xiàng)特征補(bǔ)充到計(jì)算機(jī)數(shù)據(jù)庫(kù)中;對(duì)于完成歸類的網(wǎng)絡(luò)文本轉(zhuǎn)入步驟④; 其中,匹配內(nèi)容包括單個(gè)詞項(xiàng)特征、詞項(xiàng)關(guān)聯(lián)特征、地理位置特征和人物特征;
[0010] ④如果在指定時(shí)間段內(nèi),屬于某一類別的網(wǎng)絡(luò)文本的數(shù)量或者出現(xiàn)該類別網(wǎng)絡(luò)文 本的網(wǎng)站數(shù)量超過(guò)指定的閾值,則啟動(dòng)應(yīng)急預(yù)案;
[0011] 完成智能輿情突發(fā)事件的應(yīng)急處理。
[0012] 其中,在步驟④之后還包括應(yīng)急處理效果評(píng)估步驟:首先按照評(píng)估指標(biāo)采集指標(biāo) 數(shù)據(jù),然后將指標(biāo)數(shù)據(jù)輸入評(píng)估公式得出量化評(píng)估結(jié)果。
[0013] 其中,在步驟③中根據(jù)匹配結(jié)果將網(wǎng)絡(luò)文本按照計(jì)算機(jī)數(shù)據(jù)庫(kù)中設(shè)定的輿情類別 進(jìn)行歸類處理具體為:網(wǎng)絡(luò)文本類別判斷的方法是將網(wǎng)絡(luò)文本的詞項(xiàng)與每個(gè)輿情類別的詞 項(xiàng)特征進(jìn)行比對(duì)匹配,分別在單個(gè)詞特征、詞關(guān)聯(lián)特征、地理位置特征和人物特征四個(gè)方面 進(jìn)行匹配運(yùn)算,根據(jù)匹配情況得到網(wǎng)絡(luò)文本與各個(gè)輿情類別的相似度值,將文本歸屬為相 似度值最高的輿情類別。
[0014] 其中,步驟③中對(duì)簇內(nèi)網(wǎng)絡(luò)文本進(jìn)行輿情類別的詞項(xiàng)特征抽處理,具體為:假設(shè) 簇T包含的網(wǎng)絡(luò)文本有T= {tub,…tn},利用文本多精度表示方法抽取出每個(gè)文本心的 單個(gè)詞項(xiàng)特征和詞項(xiàng)關(guān)聯(lián)特征,再采用統(tǒng)計(jì)方法計(jì)算出T中所有文本的所有單個(gè)詞項(xiàng)特征 和詞項(xiàng)關(guān)聯(lián)特征的統(tǒng)計(jì)分布規(guī)律,選擇在T中一半以上網(wǎng)絡(luò)文本中出現(xiàn)過(guò)的詞匯作為輿情 類別詞項(xiàng)特征,并計(jì)算出其在T內(nèi)的平均發(fā)生頻率作為輿情類別特征詞項(xiàng)的頻率;其中, 1 < i < n〇
[0015] 其中,步驟④中應(yīng)急預(yù)案的生成方法為:基于互聯(lián)網(wǎng)輿情事件情景本體知識(shí)庫(kù)模 型和網(wǎng)絡(luò)輿情防控措施預(yù)案本體知識(shí)庫(kù),利用語(yǔ)義匹配技術(shù)根據(jù)輿情事件情景的具體情 況,從防控措施預(yù)案庫(kù)中自動(dòng)匹配出最適合的應(yīng)急處理預(yù)案。
[0016] 與現(xiàn)有的技術(shù)相比,本發(fā)明具有以下的優(yōu)點(diǎn)和有益效果:
[0017] 1、本發(fā)明不僅能夠?qū)W(wǎng)絡(luò)輿情進(jìn)行自動(dòng)監(jiān)控,還能夠針對(duì)突發(fā)輿情事件給出防控 措施方案。
[0018] 2、本發(fā)明的輿情類型識(shí)別計(jì)算機(jī)數(shù)據(jù)庫(kù)具有可擴(kuò)展性,通過(guò)文本聚類分析不斷補(bǔ) 充新型輿情類型特征到數(shù)據(jù)庫(kù)中,使系統(tǒng)能夠識(shí)別新增類型的輿情事件。
【附圖說(shuō)明】
[0019] 圖1系統(tǒng)模塊組成圖
[0020] 圖2輿情分類體系模型圖
[0021]圖3輿情分類體系概念屬性模型圖
[0022] 圖4輿情分類體系示意圖
[0023] 圖5類別特征產(chǎn)生過(guò)程工作原理圖
[0024] 圖6語(yǔ)義匹配原理圖
[0025] 圖7基于網(wǎng)絡(luò)文本聚類的知識(shí)擴(kuò)展圖
[0026] 圖8輿情事件情景本體知識(shí)庫(kù)圖
[0027] 圖9輿情防控措施預(yù)案本體知識(shí)庫(kù)圖
[0028] 圖10網(wǎng)絡(luò)輿情防控知識(shí)語(yǔ)義模型圖
[0029] 圖11基于語(yǔ)義的匹配方法圖
[0030] 圖12應(yīng)急處理效果評(píng)估指標(biāo)體系圖
【具體實(shí)施方式】
[0031] 下面將結(jié)合附圖和具體實(shí)施例對(duì)本發(fā)明做進(jìn)一步說(shuō)明。但本發(fā)明的實(shí)施方式不限 于此。
[0032] 本實(shí)施例提供一種智能的輿情突發(fā)事件應(yīng)急處理系統(tǒng),該系統(tǒng)包括互聯(lián)網(wǎng)信息采 集與解析模塊,互聯(lián)網(wǎng)信息分析模塊,網(wǎng)絡(luò)文本類別判斷與聚類分析模塊,應(yīng)急處理方案生 成模塊,應(yīng)急處理效果評(píng)估模塊,如附圖1所示;所述互聯(lián)網(wǎng)信息采集與解析模塊用于從互 聯(lián)網(wǎng)上采集信息,抽取出網(wǎng)頁(yè)中自然語(yǔ)言文字以及網(wǎng)頁(yè)的元數(shù)據(jù)信息,并保存到數(shù)據(jù)庫(kù)中; 所述互聯(lián)網(wǎng)信息分析模塊用于對(duì)采集來(lái)的信息中的自然語(yǔ)言文字進(jìn)行特征抽取,形成文本 特征;所述網(wǎng)絡(luò)文本類別判斷與聚類分析模塊用于對(duì)網(wǎng)絡(luò)文本的類別進(jìn)行判斷,對(duì)累積網(wǎng) 絡(luò)文本進(jìn)行聚類分析;所述應(yīng)急處理方案生成模塊用于根據(jù)輿情事件的具體情況自動(dòng)生成 相應(yīng)的處理預(yù)案,決策人員可以基于處理預(yù)案制定執(zhí)行方案;所述應(yīng)急處理效果評(píng)估模塊 用于對(duì)執(zhí)行方案的執(zhí)行效果進(jìn)行評(píng)估。
[0033] 本實(shí)施例還提供一種智能的輿情突發(fā)事件應(yīng)急處理系統(tǒng)的工作方法,該方法包括 以下步驟:
[0034] ①互聯(lián)網(wǎng)信息采集與解析:由連接互聯(lián)網(wǎng)的計(jì)算機(jī)從互聯(lián)網(wǎng)論壇、博客、新聞網(wǎng)站 上采集論壇帖子、博客內(nèi)容和網(wǎng)站新聞網(wǎng)頁(yè)等網(wǎng)絡(luò)數(shù)據(jù),然后,利用計(jì)算機(jī)采用基于規(guī)則的 信息抽取技術(shù)自動(dòng)地對(duì)網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行解析,從其中抽取兩類信息:自然語(yǔ)言文字信息和網(wǎng) 頁(yè)的元數(shù)據(jù)信息。自然語(yǔ)言文字信息包括新聞標(biāo)題、新聞?wù)摹⒄搲?