一種基于大數(shù)據(jù)的電廠設(shè)備故障快速定位系統(tǒng)和方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明設(shè)及工業(yè)大數(shù)據(jù)技術(shù)領(lǐng)域,具體來(lái)說(shuō)是設(shè)及一種基于大數(shù)據(jù)的電廠設(shè)備故 障快速定位系統(tǒng)和方法。
【背景技術(shù)】
[0002] 隨著計(jì)算機(jī)信息技術(shù)的快速發(fā)展,互聯(lián)網(wǎng)產(chǎn)生大量的數(shù)據(jù),并且W每年兩倍W上 的速度在快速增長(zhǎng)。軟件應(yīng)用源源不斷的產(chǎn)生大量數(shù)據(jù),W至于不能依靠人為檢查來(lái)從中 挖掘小部分人們感興趣并可W加 W利用的信息。在商業(yè)智能領(lǐng)域,大量數(shù)據(jù)隱含著不可預(yù) 知的潛在力量,實(shí)時(shí)有效的利用運(yùn)些數(shù)據(jù)可能產(chǎn)生更豐富的收入,W及更好的滿(mǎn)足客戶(hù)需 求。
[0003] 工業(yè)大數(shù)據(jù)是未來(lái)工業(yè)在全球市場(chǎng)競(jìng)爭(zhēng)中發(fā)揮優(yōu)勢(shì)的關(guān)鍵。無(wú)論是德國(guó)工業(yè)4.0、 美國(guó)工業(yè)互聯(lián)網(wǎng)還是《中國(guó)制造2025》,各國(guó)制造業(yè)創(chuàng)新戰(zhàn)略的實(shí)施基礎(chǔ)都是工業(yè)大數(shù)據(jù)的 捜集和特征分析,及W此為未來(lái)制造系統(tǒng)搭建的無(wú)憂環(huán)境。基于工業(yè)4.0的時(shí)代背景,通過(guò) 深入剖析未來(lái)工業(yè)的商業(yè)模式和智能服務(wù)體系的創(chuàng)新技術(shù)變革,如何通過(guò)工業(yè)大數(shù)據(jù)的分 析和應(yīng)用去預(yù)測(cè)需求、預(yù)測(cè)制造,整合產(chǎn)業(yè)鏈和價(jià)值鏈,發(fā)現(xiàn)用戶(hù)的價(jià)值缺口,發(fā)現(xiàn)和管理 不可見(jiàn)的問(wèn)題,實(shí)現(xiàn)為用戶(hù)提供定制化的產(chǎn)品和服務(wù)。
[0004] 處理海量數(shù)據(jù)的傳統(tǒng)方法是將產(chǎn)生的歷史數(shù)據(jù)存儲(chǔ)在數(shù)據(jù)庫(kù)中,或生成日志文 件,間隔一段時(shí)間,借用分布式框架如化doop進(jìn)行批量處理,得到分析結(jié)果。然而,隨著數(shù)據(jù) 的快速增長(zhǎng),傳統(tǒng)的系統(tǒng)不能及時(shí)有效的將所有數(shù)據(jù)完整地存儲(chǔ)在數(shù)據(jù)庫(kù)中,也不能有效 地進(jìn)行實(shí)時(shí)分析處理,很難滿(mǎn)足許多商業(yè)應(yīng)用希望快速獲得數(shù)據(jù)處理結(jié)果的需求,此外,商 業(yè)應(yīng)用對(duì)原始數(shù)據(jù)并不敢興趣,而更關(guān)注從原始數(shù)據(jù)中提取推理出高水平的商業(yè)智能。因 此,系統(tǒng)需要能夠通過(guò)過(guò)濾,聚合,關(guān)聯(lián)運(yùn)些實(shí)時(shí)數(shù)據(jù),從而把檢測(cè)分析的結(jié)果和異常情況 快速地通知給感興趣的群體,為了滿(mǎn)足運(yùn)些需求,系統(tǒng)的實(shí)時(shí)處理性能非常重要。
[0005] 設(shè)備故障是指所有和某故障有關(guān)的錯(cuò)誤造成的工業(yè)系統(tǒng)的非正常運(yùn)行。一個(gè)故障 是若干錯(cuò)誤的直接或間接的原因,錯(cuò)誤是故障的表現(xiàn),失效是故障的總效應(yīng)。某部件的錯(cuò) 誤不一定由于內(nèi)部存在故障,在工業(yè)系統(tǒng)環(huán)境中更有可能是由于故障的傳播所導(dǎo)致的。故 障、失效和告警事件之間的有著密切的關(guān)系。
[0006] 工業(yè)實(shí)時(shí)系統(tǒng)的最新發(fā)展是引入復(fù)雜事件處理技術(shù)CEP(Complex Event Processing),用于檢測(cè)連續(xù)達(dá)到的數(shù)據(jù)之間存在的特定模式,具有高吞吐量、低延時(shí)和復(fù) 雜計(jì)算等特點(diǎn)。
[0007] 復(fù)雜事件檢測(cè)是W事件為驅(qū)動(dòng),對(duì)信息系統(tǒng)的產(chǎn)生的海量數(shù)據(jù)進(jìn)行實(shí)時(shí)處理,可 用于檢測(cè)系統(tǒng)中發(fā)生的特定行為模式,從而進(jìn)行模式挖掘或事件預(yù)測(cè)等。
[000引復(fù)雜事件處理系統(tǒng)接收來(lái)自不同數(shù)據(jù)源、不同類(lèi)型的事件,所需處理的數(shù)據(jù)流非 常大,然而對(duì)實(shí)時(shí)性要求較高,面對(duì)海量而關(guān)系復(fù)雜的數(shù)據(jù)信息,系統(tǒng)需要快速計(jì)算并決 策,運(yùn)對(duì)系統(tǒng)的吞吐量提出了更高的要求。
[0009]面對(duì)分布式物聯(lián)網(wǎng)系統(tǒng),設(shè)備的故障及時(shí)發(fā)現(xiàn)并準(zhǔn)確定位應(yīng)用,需求基于復(fù)雜事 件處理的故障定位方法。
【發(fā)明內(nèi)容】
[0010] 本發(fā)明的目的是提供一種基于大數(shù)據(jù)的電廠設(shè)備故障快速定位系統(tǒng),將該系統(tǒng)用 于工廠設(shè)備運(yùn)維中,用于對(duì)復(fù)雜事件的處理時(shí)也能夠滿(mǎn)足對(duì)系統(tǒng)的高吞吐量、低延時(shí)、復(fù)雜 計(jì)算的要求。
[0011] 本發(fā)明的另一目的是提供一種基于大數(shù)據(jù)的電廠設(shè)備故障快速定位方法,適用于 上述系統(tǒng)。
[0012] 本發(fā)明的目的是運(yùn)樣實(shí)現(xiàn)的:
[0013] -種基于大數(shù)據(jù)的電廠設(shè)備故障快速定位系統(tǒng),包括:故障檢測(cè)單元、事件過(guò)濾單 元、故障定位單元和故障統(tǒng)計(jì)分析單元。
[0014] 其中,故障檢測(cè)單元,通過(guò)輸入代理報(bào)告關(guān)于網(wǎng)絡(luò)資源改變的信息,在故障發(fā)生W 后將故障識(shí)別出來(lái);事件過(guò)濾單元,用于過(guò)濾過(guò)量的信息,所述事件過(guò)濾單元利用過(guò)濾器和 闊值機(jī)制,過(guò)濾掉不重要和不關(guān)屯、的事件、重復(fù)告警噪音等,找出需要處理的事件;故障定 位單元,用于確定網(wǎng)絡(luò)中故障的設(shè)備位置,甚至具體到發(fā)生故障的軟件系統(tǒng);故障統(tǒng)計(jì)分析 單元,用于對(duì)故障和/或系統(tǒng)進(jìn)行記錄、統(tǒng)計(jì)和分析。
[0015] 所述故障定位單元包括:事件信息采集層、事件監(jiān)控分析層、系統(tǒng)顯示層。
[0016] 所述事件信息采集層,通過(guò)分布式的事件采集代理采集分布式網(wǎng)絡(luò)系統(tǒng)的事件信 息,并寫(xiě)入事件流數(shù)據(jù)庫(kù)。
[0017] 所述事件監(jiān)控分析層,包括:檢測(cè)規(guī)則自動(dòng)轉(zhuǎn)換子模塊和事件流監(jiān)控和分析子模 塊。所述檢測(cè)規(guī)則自動(dòng)轉(zhuǎn)換子模塊根據(jù)基于集合的事件流過(guò)濾模型對(duì)規(guī)則數(shù)據(jù)庫(kù)中的記錄 進(jìn)行自動(dòng)轉(zhuǎn)化,生成S化語(yǔ)句;所述事件流監(jiān)控和分析子模塊讀取生成的SQL語(yǔ)句,掃描事件 流數(shù)據(jù)庫(kù)中的記錄,監(jiān)控、分析出分布式系統(tǒng)的故障。
[0018] 所述系統(tǒng)顯示層,包括:故障報(bào)警子模塊、故障查詢(xún)子模塊、檢測(cè)規(guī)則配置子模塊 和事件信息實(shí)時(shí)查看子模塊。所述故障報(bào)警子模塊實(shí)時(shí)展示時(shí)間監(jiān)控分析層定位出的分布 式網(wǎng)絡(luò)系統(tǒng)故障;所述故障查詢(xún)子模塊接收用戶(hù)輸人的分類(lèi)查詢(xún)信息,查詢(xún)故障數(shù)據(jù)庫(kù)后 顯示查詢(xún)結(jié)果;所述檢測(cè)規(guī)則配置子模塊對(duì)不同用戶(hù)開(kāi)放不同接口,將用戶(hù)的輸入寫(xiě)入規(guī) 則數(shù)據(jù)庫(kù);所述事件信息實(shí)時(shí)查看子模塊將時(shí)間采集層采集到的事件流實(shí)時(shí)展示在系統(tǒng)界 面上。
[0019] 進(jìn)一步地,所述故障統(tǒng)計(jì)分析單元對(duì)故障的發(fā)生頻率、哪些故障影響提供的服務(wù) 和/或電廠設(shè)備故障快速定位系統(tǒng)對(duì)故障的識(shí)別率進(jìn)行記錄、統(tǒng)計(jì)和分析。
[0020] 本發(fā)明同時(shí)也提供了一種適用于上述系統(tǒng)的基于大數(shù)據(jù)的電廠設(shè)備故障快速定 位方法,該方法是通過(guò)分布式復(fù)雜事件實(shí)時(shí)檢測(cè)系統(tǒng)接收來(lái)自不同數(shù)據(jù)源的事件流,用戶(hù) 可W定義感興趣的事件規(guī)則,通過(guò)復(fù)雜事件處理技術(shù)對(duì)事件進(jìn)行過(guò)濾、聚集、連接等復(fù)雜計(jì) 算,匹配已定義的事件模式,從而進(jìn)行預(yù)警或相應(yīng)動(dòng)作。
[0021] 具體地,本發(fā)明一種適用于上述系統(tǒng)的基于大數(shù)據(jù)的電廠設(shè)備故障快速定位方 法,包括W下步驟:
[0022] 4.1故障檢測(cè):通過(guò)輸入代理報(bào)告關(guān)于網(wǎng)絡(luò)資源改變的信息,在故障發(fā)生W后將故 障識(shí)別出來(lái);
[0023] 4.2事件過(guò)濾:通過(guò)設(shè)置過(guò)濾器和闊值機(jī)制,過(guò)濾掉不重要和不關(guān)屯、的事件、重復(fù) 告警噪音等,找出需要處理的事件;
[0024] 4.3故障定位:確定網(wǎng)絡(luò)中故障的設(shè)備位置,甚至具體到發(fā)生故障的軟件系統(tǒng);包 括:
[0025] 4.3.1事件信息采集:通過(guò)分布式的事件采集代理采集分布式網(wǎng)絡(luò)系統(tǒng)的事件信 息,并寫(xiě)入事件流數(shù)據(jù)庫(kù);
[0026] 4.3.2事件監(jiān)控分析,包括:
[0027] 4.3.2.1檢測(cè)規(guī)則自動(dòng)轉(zhuǎn)換:根據(jù)基于集合的事件流過(guò)濾模型對(duì)規(guī)則數(shù)據(jù)庫(kù)中的 記錄進(jìn)行自動(dòng)轉(zhuǎn)化,生成SQL語(yǔ)句;
[0028] 4.3.2.2事件流監(jiān)控和分析:讀取生成的S化語(yǔ)句,掃描事件流數(shù)據(jù)庫(kù)中的記錄,監(jiān) 控、分析出分布式系統(tǒng)的故障;
[00巧]4.3.3系統(tǒng)顯示,包括:
[0030] 4.3.3.1故障報(bào)警子:實(shí)時(shí)展示時(shí)間監(jiān)控分析層定位出的分布式網(wǎng)絡(luò)系統(tǒng)故障;
[0031 ] 4.3.3.2故障查詢(xún):接收用戶(hù)輸人的分類(lèi)查詢(xún)信息,查詢(xún)故障數(shù)據(jù)庫(kù)后顯示查詢(xún)結(jié) 果;
[0032] 4.3.3.3檢測(cè)規(guī)則配置:對(duì)不同用戶(hù)開(kāi)放不同接口,將用戶(hù)的輸入寫(xiě)入規(guī)則數(shù)據(jù) 庫(kù);
[0033] 4.3.3.4事件信息實(shí)時(shí)查看:將時(shí)間采集層采集到的事件流實(shí)時(shí)展示在系統(tǒng)界面 上;
[0034] 4.4故障統(tǒng)計(jì)分析:對(duì)故障和/或系統(tǒng)進(jìn)行記錄、統(tǒng)計(jì)和分析。
[0035] 復(fù)雜事件處理技術(shù)結(jié)合事件驅(qū)動(dòng)架構(gòu)和事件流處理,對(duì)數(shù)據(jù)的實(shí)時(shí)性要求較高, 因此如上所述的本發(fā)明基于大數(shù)據(jù)的電廠設(shè)備故障快速定位方法,所述分布式復(fù)雜事件實(shí) 時(shí)檢測(cè)系統(tǒng),采用復(fù)雜事件處理引擎Esper與分布式實(shí)時(shí)計(jì)算框架Storm結(jié)合,W實(shí)現(xiàn)高吞 吐量、低延時(shí)、復(fù)雜計(jì)算為目標(biāo)。
[0036] 進(jìn)一步地,所述步驟4.4故障統(tǒng)計(jì)分析,包括對(duì)故障的發(fā)生頻率、哪些故障影響提 供的服務(wù)和/或電廠設(shè)備故障快速定位系統(tǒng)對(duì)故障的識(shí)別率進(jìn)行記錄、統(tǒng)計(jì)和分析。
[0037] 我們對(duì)本發(fā)明基于大數(shù)據(jù)的電廠設(shè)備故障快速定位系統(tǒng)的功能進(jìn)行了測(cè)試和應(yīng) 用,該系統(tǒng)具有較高的故障檢測(cè)準(zhǔn)確率和較快的時(shí)效性,進(jìn)一步證明了基于復(fù)雜事件處理 的故障定位方法的有效性。
【附圖說(shuō)明】
[0038] 通過(guò)W下本發(fā)明的實(shí)施例并結(jié)合附圖的描述,示出本發(fā)明的其它優(yōu)點(diǎn)和特征,該 實(shí)施例W實(shí)例的形式給出,但并不限于此,其中:
[0039] 圖1所示為本發(fā)明基于大數(shù)據(jù)的電廠設(shè)備故障快速定位系統(tǒng)的結(jié)構(gòu)示意圖。
[0040] 圖2所示為本發(fā)明基于大數(shù)據(jù)的電廠設(shè)備故障快速定位系統(tǒng)的故障定位單元的結(jié) 構(gòu)示意圖。
[0041] 圖3所示為本發(fā)明基于大數(shù)據(jù)的電廠設(shè)備故障快速定位系統(tǒng)的工作流程示意圖。
【具體實(shí)施方式】
[0042] 結(jié)合圖1、圖2所示,本發(fā)明一種基于大數(shù)據(jù)的電廠設(shè)備故障快速定位系統(tǒng),包括: 故障檢測(cè)單元、事件過(guò)濾單元、故障定位單元和故障統(tǒng)計(jì)分析單元。
[0043] 其中,故障檢測(cè)單元,通過(guò)輸入代理報(bào)告關(guān)于網(wǎng)絡(luò)資源改變的信息,在故障發(fā)生W 后將故障識(shí)別出來(lái);事件過(guò)濾單元,用于過(guò)濾過(guò)量的信息,所述事件過(guò)濾單元利用過(guò)濾器和 闊值機(jī)制,過(guò)濾掉不重要和不關(guān)屯、的事件、重復(fù)告警噪音等,找出需要處理的事件;故障定 位單元,用于確定網(wǎng)絡(luò)中故障的設(shè)備位置,甚至具體到發(fā)生故障的軟件系統(tǒng);故障統(tǒng)計(jì)分析 單元,用于對(duì)故障和/或系統(tǒng)進(jìn)行記錄、統(tǒng)計(jì)和分析。
[004