自適應(yīng)總控災(zāi)備切換裝置、系統(tǒng)及信號發(fā)生方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及數(shù)據(jù)中心災(zāi)難備份與智能控制領(lǐng)域,特別涉及一種自適應(yīng)總控災(zāi)備切換裝置、系統(tǒng)及信號發(fā)生方法。
【背景技術(shù)】
[0002]在數(shù)據(jù)大集中的趨勢下,很多企業(yè)機(jī)構(gòu)建設(shè)了自己的數(shù)據(jù)中心。數(shù)據(jù)集中后,在帶來巨大好處的同時(shí),也帶來了風(fēng)險(xiǎn)集中,因此數(shù)據(jù)中心的安全可靠性也就顯得尤為重要。為保證可靠性,數(shù)據(jù)中心的冗余機(jī)制是解決這一問題的重要途徑。但冗余機(jī)制也導(dǎo)致了數(shù)據(jù)中心建設(shè)的復(fù)雜性,及時(shí)準(zhǔn)確的檢測數(shù)據(jù)中心故障,并給出合理的專家建議,無縫切換到備用中心是數(shù)據(jù)中心提供業(yè)務(wù)連續(xù)運(yùn)行的關(guān)鍵。
[0003]傳統(tǒng)的災(zāi)備方案有“同城災(zāi)備”、“異地災(zāi)備”以及“同城-異地災(zāi)備”三種模式,其中,同城災(zāi)備模式主要是指災(zāi)備中心與生產(chǎn)中心處于同一城市內(nèi),可同時(shí)采用同步備份或異步備份,其具有最低的投資成本,最快的災(zāi)難恢復(fù)速度,極高地?cái)?shù)據(jù)保障,但無法應(yīng)對區(qū)域性數(shù)據(jù)災(zāi)難;異地災(zāi)備模式主要是指災(zāi)備中心與生產(chǎn)中心在不同的城市,一般只能實(shí)現(xiàn)異步備份,投資成本較高,災(zāi)難恢復(fù)速度與數(shù)據(jù)保障能力略低,優(yōu)勢是可應(yīng)對區(qū)域性災(zāi)難風(fēng)險(xiǎn);同城-異地災(zāi)備模式是上面兩種模式的結(jié)合,投資成本最高,但具有前兩者的優(yōu)點(diǎn),此種模式又分為兩種實(shí)現(xiàn)方式,一種是先建立同城災(zāi)備中心,再建立異地災(zāi)備對同城災(zāi)備進(jìn)行備份,一種是同城中心與異地中心分別獨(dú)立為生產(chǎn)中心進(jìn)行備份。但以上三種模式或者沒有考慮遇到區(qū)域性不可抗拒的因素(火災(zāi)、斷電、地震),或者采用單一簡單的切換方式,僅僅從生產(chǎn)中心切換到備用中心,忽視備用中心的安全性。這樣一旦災(zāi)難發(fā)生,將很難滿足高可靠、高可用數(shù)據(jù)中心的容災(zāi)備份和切換的要求。
[0004]—種新的多生產(chǎn)中心的災(zāi)備方案中,各中心間可以相互備份,并獨(dú)立承擔(dān)業(yè)務(wù),極大的提高了災(zāi)備等級。在以往多生產(chǎn)中心切換的研究中,研究者更多的是關(guān)注多生產(chǎn)中心發(fā)生災(zāi)難后,生產(chǎn)中心間切換步驟的實(shí)施,而很少考慮應(yīng)用智能技術(shù)準(zhǔn)確而快速的產(chǎn)生切換信號,實(shí)現(xiàn)系統(tǒng)的自適應(yīng)切換。
[0005]監(jiān)控系統(tǒng)在民航信息系統(tǒng)的系統(tǒng)安全、系統(tǒng)維護(hù)方面得到了廣泛的應(yīng)用。監(jiān)控系統(tǒng)應(yīng)用的告警信息中包含了大量有用的信息,但是這些信息只有經(jīng)過深入分析后才能被挖掘出來。目前的大多數(shù)監(jiān)控平臺,只是側(cè)重于告警信息的統(tǒng)一采集、存儲,告警信息的處理分析能力比較弱,并且不能支持多個(gè)應(yīng)用系統(tǒng)報(bào)警數(shù)據(jù)的同時(shí)采集,面對龐大的報(bào)警數(shù)據(jù),無法準(zhǔn)確定位故障源,造成維護(hù)人員所關(guān)注的信息往往淹沒在大量普通的信息中,對系統(tǒng)維護(hù)無法起到提前判斷甚至及時(shí)處理,這使得維護(hù)工作繁重而且艱巨。
【發(fā)明內(nèi)容】
[0006]為解決現(xiàn)有存在的技術(shù)問題,本發(fā)明實(shí)施例提供一種自適應(yīng)總控災(zāi)備切換裝置、系統(tǒng)及信號發(fā)生方法。
[0007]為達(dá)到上述目的,本發(fā)明實(shí)施例的技術(shù)方案是這樣實(shí)現(xiàn)的:
[0008]一種自適應(yīng)總控災(zāi)備切換裝置,所述裝置包括:故障數(shù)據(jù)處理單元、故障推理判斷單元和切換信號發(fā)出單元,其中,
[0009]故障數(shù)據(jù)處理單元,用于采集各生產(chǎn)中心的故障數(shù)據(jù),對所述故障數(shù)據(jù)進(jìn)行分類存儲、分析,得到故障特征數(shù)據(jù);
[0010]故障推理判斷單元,用于將所述故障特征數(shù)據(jù)通過知識庫推理得到故障切換意見;
[0011]切換信號發(fā)出單元,用于根據(jù)所述故障切換意見和人工指令,發(fā)出切換控制指令給各生廣中七、。
[0012]其中,所述故障數(shù)據(jù)處理單元包括:故障數(shù)據(jù)收集模塊,用于收集各生產(chǎn)中心的故障數(shù)據(jù)并進(jìn)行故障數(shù)據(jù)的分類存儲。
[0013]其中,所述故障數(shù)據(jù)收集模塊,具體用于通過安裝在各生產(chǎn)中心的代理Agent程序獲得生產(chǎn)中心的故障數(shù)據(jù),以及通過心跳檢測設(shè)備監(jiān)控其它生產(chǎn)中心運(yùn)行狀態(tài),并收集其它生產(chǎn)中心的故障數(shù)據(jù)。
[0014]其中,所述故障數(shù)據(jù)收集模塊,具體用于按所屬的不同應(yīng)用子系統(tǒng)進(jìn)行故障數(shù)據(jù)的分類存儲。
[0015]其中,所述故障數(shù)據(jù)處理單元還包括:故障分析模塊,用于根據(jù)存儲在不同應(yīng)用子系統(tǒng)的故障數(shù)據(jù)分別進(jìn)行故障分析,并對各應(yīng)用子系統(tǒng)進(jìn)行故障的關(guān)聯(lián)分析,得到故障特征數(shù)據(jù)。
[0016]其中,所述故障分析模塊包括單系統(tǒng)故障分析子模塊;單系統(tǒng)故障分析子模塊用于根據(jù)存儲在不同應(yīng)用子系統(tǒng)的故障數(shù)據(jù)分別進(jìn)行故障分析,得到故障特征數(shù)據(jù)。
[0017]其中,所述故障分析模塊還包括關(guān)聯(lián)系統(tǒng)故障分析子模塊;所述關(guān)聯(lián)系統(tǒng)故障分析子模塊,用于對各應(yīng)用子系統(tǒng)進(jìn)行故障的關(guān)聯(lián)分析,得到故障特征數(shù)據(jù)。
[0018]其中,所述故障數(shù)據(jù)處理單元還包括故障特征數(shù)據(jù)庫,用于保存所述故障特征數(shù)據(jù)。
[0019]其中,所述故障推理判斷單元包括知識庫、知識庫推理模塊;所述知識庫描述了知識處理求解邏輯;所述知識庫推理模塊用于以所述知識庫為后臺數(shù)據(jù)對所述故障特征數(shù)據(jù)進(jìn)行知識庫推理,結(jié)合預(yù)設(shè)的切換策略得到故障切換意見,并發(fā)送給所述切換信號發(fā)出單
J L ο
[0020]其中,所述切換信號發(fā)出單元,包括:轉(zhuǎn)移切換控制模塊,用于在所述故障切換意見通過人工干預(yù)和確認(rèn)后,發(fā)出切換控制指令給各生產(chǎn)中心。
[0021]—種自適應(yīng)總控災(zāi)備切換系統(tǒng),所述系統(tǒng)包括至少兩個(gè)生產(chǎn)中心、心跳檢測設(shè)備和如權(quán)利要求1至11任一項(xiàng)所述的自適應(yīng)總控災(zāi)備切換裝置,各所述生產(chǎn)中心分別與所述自適應(yīng)總控災(zāi)備切換裝置連接,各所述生產(chǎn)中心之間連接有所述心跳檢測設(shè)備。
[0022]其中,所述生成中心包括:狀態(tài)監(jiān)控服務(wù)器和接入服務(wù)器;
[0023]所述狀態(tài)監(jiān)控服務(wù)器,用于通過代理Agent程序?qū)崟r(shí)對生產(chǎn)中心的運(yùn)行狀態(tài)進(jìn)行監(jiān)測,并將生成中心的故障數(shù)據(jù)發(fā)送給所述自適應(yīng)總控災(zāi)備切換裝置;
[0024]所述接入服務(wù)器,用于等待所述自適應(yīng)總控災(zāi)備切換裝置發(fā)出的切換控制指令并進(jìn)行相應(yīng)的故障轉(zhuǎn)移操作。
[0025]其中,所述生成中心還包括:WEB集群、數(shù)據(jù)庫DB集群和中心節(jié)點(diǎn)。
[0026]其中,所述心跳檢測設(shè)備,用于實(shí)時(shí)對生產(chǎn)中心的運(yùn)行狀態(tài)進(jìn)行監(jiān)測,并將生成中心的故障數(shù)據(jù)發(fā)送給所述自適應(yīng)總控災(zāi)備切換裝置。
[0027]—種自適應(yīng)總控災(zāi)備切換信號產(chǎn)生方法,所述方法包括:
[0028]故障數(shù)據(jù)處理單元采集各生產(chǎn)中心的故障數(shù)據(jù),對所述故障數(shù)據(jù)進(jìn)行分類存儲、分析,得到故障特征數(shù)據(jù);
[0029]故障推理判斷單元將所述故障特征數(shù)據(jù)通過知識庫推理得到故障切換意見;
[0030]切換信號發(fā)出單元根據(jù)所述故障切換意見和人工指令,發(fā)出切換控制指令給各生產(chǎn)中心。
[0031 ]其中,所述故障數(shù)據(jù)處理單元的故障數(shù)據(jù)收集模塊收集各生產(chǎn)中心的故障數(shù)據(jù)并進(jìn)行故障數(shù)據(jù)的分類存儲。
[0032]其中,所述故障數(shù)據(jù)收集模塊通過設(shè)置在各生產(chǎn)中心的狀態(tài)監(jiān)控服務(wù)器獲得生產(chǎn)中心的運(yùn)行狀態(tài)數(shù)據(jù),以及通過心跳檢測設(shè)備獲得其它生產(chǎn)中心的運(yùn)行狀態(tài)數(shù)據(jù)。
[0033]其中,所述故障數(shù)據(jù)收集模塊按所屬的不同應(yīng)用子系統(tǒng)進(jìn)行故障數(shù)據(jù)的分類存儲。
[0034]其中,所述故障數(shù)據(jù)處理單元的故障分析模塊根據(jù)不同應(yīng)用子系統(tǒng)的故障數(shù)據(jù)分別進(jìn)行故障分析,并對各應(yīng)用子系統(tǒng)進(jìn)行故障的關(guān)聯(lián)分析,得到故障特征數(shù)據(jù)。
[0035]其中,所述故障分析模塊根據(jù)不同應(yīng)用子系統(tǒng)的故障數(shù)據(jù)分別進(jìn)行故障分析,得到故障特征數(shù)據(jù),包括:所述故障分析模塊的單系統(tǒng)故障分析子模塊根據(jù)存儲在不同應(yīng)用子系統(tǒng)的故障數(shù)據(jù)分別進(jìn)行故障分析,得到故障特征數(shù)據(jù)。
[0036]其中,所述故障分析模塊對各應(yīng)用子系統(tǒng)進(jìn)行故障的關(guān)聯(lián)分析,得到故障特征數(shù)據(jù),為:所述故障分析模塊的關(guān)聯(lián)系統(tǒng)故障分析子模塊對各應(yīng)用子系統(tǒng)進(jìn)行故障的關(guān)聯(lián)分析,得到故障特征數(shù)據(jù)。
[0037]其中,所述方法還包括:將所述故障特征數(shù)據(jù)保存到所述故障數(shù)據(jù)處理單元的故障特征數(shù)據(jù)庫。
[0038]其中,以知識庫為后臺數(shù)據(jù)對所述故障特征數(shù)據(jù)進(jìn)行知識庫推理,結(jié)合預(yù)設(shè)的切換策略得到故障切換意見,并發(fā)送給所述切換信號發(fā)出單元;所述知識庫描述了知識處理求解邏輯。
[0039]其中,在所述故障切換意見通過人工干預(yù)和確認(rèn)后,發(fā)出切換控制指令給各生產(chǎn)中心。
[0040]本發(fā)明實(shí)施例的自適應(yīng)總控災(zāi)備切換裝置、系統(tǒng)及信號發(fā)生方法,當(dāng)有生產(chǎn)中心出現(xiàn)異常時(shí),自適應(yīng)總控災(zāi)備切換系統(tǒng)將自動啟動,產(chǎn)生切換控制指令控制生產(chǎn)中心執(zhí)行故障轉(zhuǎn)移,以使得正常的生產(chǎn)中心能夠自適應(yīng)的接管異常的生產(chǎn)中心的用戶,從而應(yīng)用智能技術(shù)準(zhǔn)確而快速的產(chǎn)生切換信號,實(shí)現(xiàn)系統(tǒng)的自適應(yīng)切換,減輕了人工參與的程度,借助機(jī)器智能,實(shí)現(xiàn)人類專家的智能處理,及時(shí)給出專家切換意見。并且,