本發(fā)明涉及軟件系統(tǒng)出現(xiàn)任務(wù)沖突、錯誤時,軟件自身進行自愈修復(fù)處理的方法領(lǐng)域,尤其涉及企業(yè)信息化系統(tǒng)的自愈修復(fù)處理方法領(lǐng)域,具體的說,是一種企業(yè)信息化系統(tǒng)自愈調(diào)度方法。
背景技術(shù):
概念:自愈調(diào)度是通過軟件系統(tǒng)自身的內(nèi)置模塊,在系統(tǒng)部分功能失效、出錯、卡滯、崩潰的情況下,通過內(nèi)置的自愈調(diào)度合理的分配資源,以實現(xiàn)在避免或者減少認(rèn)為干預(yù)的情況下進行自主的改變運行方式,達到不影響系統(tǒng)任務(wù)正常工作的目的;是一種具有自保護、自修復(fù)、自配置、自優(yōu)化能力的計算機系統(tǒng)調(diào)度分配方法。
企業(yè)信息化系統(tǒng),一般來說傳統(tǒng)意義上的企業(yè)信息化系統(tǒng)應(yīng)該包括兩部分,一部分是oa,辦公類的。另一部分為業(yè)務(wù)系統(tǒng)包括erp,hr,crm等等。伴隨企業(yè)信息化建設(shè)進程的逐漸深入,業(yè)務(wù)數(shù)據(jù)的逐漸積累,另一類企業(yè)信息系統(tǒng)--輔助決策系統(tǒng)的需求也隨之而來。
隨著軟件系統(tǒng)的規(guī)模擴大和復(fù)雜性提高,計算機系統(tǒng)的錯誤所引起的重大損失已經(jīng)越來越常見,使得對軟件可靠性和可用性提出了更高的要求對系統(tǒng)的宕機時間和軟件無錯誤運行都有嚴(yán)格的要求標(biāo)準(zhǔn)。然而,這些要求難以通過設(shè)計來得到保證,在高復(fù)雜性的系統(tǒng)里更是如此。理想的計算機系統(tǒng)是人們完全可依賴的、而且從來沒有錯誤,但是在現(xiàn)實中這是不可能的。因此,對可容錯的計算機系統(tǒng)的研究越來越受到青睞。
軟件可靠性是軟件系統(tǒng)可靠性的重要組成部分。由于企業(yè)信息化系統(tǒng)基本上都是軟件系統(tǒng)。因此,對軟件可靠性和可用性的要求越來越高,對系統(tǒng)的宕機時間和軟件無錯誤運行都有嚴(yán)格的標(biāo)準(zhǔn)。在很多情況下,軟件的錯誤會造成巨大的經(jīng)濟損失,甚至?xí){到人的生命。盡管現(xiàn)在已經(jīng)使用了現(xiàn)有的最好的軟件發(fā)展技術(shù),由軟件故障所導(dǎo)致的系統(tǒng)錯誤的例子依然大量出現(xiàn)。因此,研究企業(yè)信息化系統(tǒng)軟件的自愈技術(shù),顯得尤為迫切。
企業(yè)信息化系統(tǒng)的異構(gòu)性、復(fù)雜性和使用環(huán)境的不斷惡化不可避免地導(dǎo)致了系統(tǒng)失效、使命偏離甚至中斷運行、崩潰死機等現(xiàn)象發(fā)生,從而造成重大的經(jīng)濟損失甚至是人員傷亡等嚴(yán)重后果。這使得人工完成其管理和維護、不間斷地保持其正常運轉(zhuǎn)變得越來越困難,即使號稱可用性達到的計算機系統(tǒng),其年平均停機時間也將達到8至80個小時,這對于追求使命連續(xù)性的企業(yè)信息化系統(tǒng)來說是不能容忍的。傳統(tǒng)的可靠性理論和容錯計算技術(shù)面對這種隨時可能出現(xiàn)的隨機事件顯得恢復(fù)手段過于笨拙,難以滿足實際應(yīng)用的需要,因此需一種自動而靈活、細粒度的恢復(fù)方法來解決上述這些問題。自律計算的提出使傳統(tǒng)恢復(fù)技術(shù)的研究在概念和設(shè)計理念上發(fā)生質(zhì)的變化。自律計算的目的在于通過系統(tǒng)的自主管理,在減少人為干預(yù)的條件下實現(xiàn)系統(tǒng)的自修復(fù)、自配置、自保護和自優(yōu)化,而自愈調(diào)控技術(shù)的研究目的就是將自律計算模式與細粒度恢復(fù)技術(shù)相結(jié)合,通過合理的設(shè)計使系統(tǒng)具有在規(guī)定的條件下和規(guī)定的時間內(nèi)合理調(diào)控現(xiàn)有恢復(fù)手段,完成自我保持和恢復(fù)其規(guī)定狀態(tài)的能力。
企業(yè)信息化系統(tǒng)規(guī)模與復(fù)雜性的增長導(dǎo)致系統(tǒng)功能與結(jié)構(gòu)極為復(fù)雜,即便是有經(jīng)驗的系統(tǒng)管理員都很難完全掌握系統(tǒng)內(nèi)部運行狀態(tài),這就要求系統(tǒng)能夠檢測并分析當(dāng)前運行狀態(tài),通過合理的機制進行決策,最終調(diào)度各種恢復(fù)手段自行恢復(fù)。秉承自律計算的設(shè)計理念,同時借鑒生物系統(tǒng)自愈機制,提出企業(yè)信息化系統(tǒng)自愈調(diào)控技術(shù),通過在系統(tǒng)自愈技術(shù)設(shè)計與實現(xiàn)中添加必要的調(diào)控手段,最終實現(xiàn)自愈過程的可控可靠性,由簡單的“一觸即發(fā)”自愈模式轉(zhuǎn)變?yōu)榫哂型暾答伭鞒痰母咝?、可靠的自愈模式?/p>
中國發(fā)明專利申請,申請?zhí)?01510926572.7,申請公布號cn105550056a公開了一種基于系統(tǒng)重構(gòu)的故障自愈方法,所應(yīng)用的計算機系統(tǒng)在硬件上由多個功能模塊和備份模塊組成,在軟件上包括故障管理、配置管理、系統(tǒng)藍圖等模塊組成,其步驟依次為系統(tǒng)啟動、配置加載、故障檢測、故障記錄、故障濾波、策略選擇、配置更新、系統(tǒng)關(guān)閉。系統(tǒng)藍圖系統(tǒng)故障自愈的關(guān)鍵設(shè)計。它包括多個系統(tǒng)運行的配置項,每個配置項都描述了計算機系統(tǒng)的軟件、硬件、網(wǎng)絡(luò)等各種配置,計算機系統(tǒng)能夠按照配置項的描述運行;這些配置項還包括對所有故障處理策略的描述。備份模塊是系統(tǒng)自愈的必要條件,它能夠在系統(tǒng)中某個模塊發(fā)生不可恢復(fù)故障時,代替該模塊的工作。具有自愈策略簡單、自愈過程可控、自愈結(jié)果確定的優(yōu)點。
技術(shù)實現(xiàn)要素:
本發(fā)明的目的在于提供一種企業(yè)信息化系統(tǒng)自愈調(diào)度方法,用于解決現(xiàn)有的企業(yè)信息化系統(tǒng)在出現(xiàn)任務(wù)失效,出現(xiàn)卡滯,崩潰時,引起的系統(tǒng)部分或者整體癱瘓無法正常工作使用的問題。
本發(fā)明能夠在人工不進行干預(yù)和操作的情況下,利用系統(tǒng)本身的自愈調(diào)控總體架構(gòu)及不同層次的模塊設(shè)計,通過對失效的故障任務(wù)進行及時、合理的調(diào)度,利用避開故障局部區(qū)域,調(diào)度正常工作區(qū)域進行處理失效故障任務(wù)的方法實現(xiàn)系統(tǒng)在出現(xiàn)部分或者區(qū)域性、模塊化失效時依然能夠正常的使用,避免了因系統(tǒng)癱瘓帶來的不便和損失。本發(fā)明與現(xiàn)有的自愈性調(diào)控類方法相比,具有更強的數(shù)據(jù)處理能力、更快的響應(yīng)能力和任務(wù)執(zhí)行能力。根據(jù)本發(fā)明所述總的發(fā)明構(gòu)思,不但能夠解決現(xiàn)有的企業(yè)信息化系統(tǒng)自愈調(diào)控,同時,更重要的是還能夠通過調(diào)控數(shù)據(jù)反應(yīng)系統(tǒng)設(shè)計框架中的壁壘和薄弱環(huán)節(jié),為系統(tǒng)適應(yīng)不同任務(wù)和多種處理方式,甚至不同系統(tǒng)之間的操作協(xié)同和數(shù)據(jù)共享提供科學(xué)的設(shè)計依據(jù),無論是對于已知成型的系統(tǒng),還是對于一個測試階段的新系統(tǒng),都具有增強系統(tǒng)的自我感知、對環(huán)境的自適應(yīng)和分析、決策和執(zhí)行所需的基本智能調(diào)控作用。
本發(fā)明通過下述技術(shù)方案實現(xiàn):
一種企業(yè)信息化系統(tǒng)自愈調(diào)度方法,用于解決現(xiàn)有企業(yè)信息化系統(tǒng)在不進行人工干預(yù)的前提下實現(xiàn)系統(tǒng)的自修復(fù)、自配置、自保護和自優(yōu)化,維持系統(tǒng)的正常運行,包括具有與目標(biāo)系統(tǒng)集群匹配的監(jiān)控模塊和調(diào)度模塊,以及用于隔離故障任務(wù)的多個可恢復(fù)子集群的調(diào)度系統(tǒng);
所述監(jiān)控模塊實時監(jiān)測并記錄目標(biāo)系統(tǒng)任何一個或者多個子集群中正在進行的任務(wù)狀態(tài)并將監(jiān)測數(shù)據(jù)進行實時記錄,當(dāng)監(jiān)測到任務(wù)未正常運行時,監(jiān)控模塊將故障任務(wù)數(shù)據(jù)發(fā)送至調(diào)度模塊,觸發(fā)調(diào)度模塊將故障任務(wù)調(diào)度分配至其他未執(zhí)行任務(wù)的子集群中進行處理;
當(dāng)所述故障任務(wù)數(shù)量大于可調(diào)配的空閑可用子集群數(shù)量時,調(diào)度模塊根據(jù)所述監(jiān)控模塊記錄的故障任務(wù)時間進行先后排序,并將未能分配的故障任務(wù)存放至可恢復(fù)子集群中。
優(yōu)選地,所述監(jiān)控模塊檢測數(shù)據(jù)包括任務(wù)在正常運行階段、失效形成階段和失效截止階段過程中任務(wù)的解析過程實時數(shù)據(jù)。
優(yōu)選地,所述監(jiān)控模塊對每一個被監(jiān)測的任務(wù)分配一個獨有的用于區(qū)分任務(wù)類別的標(biāo)簽,所述標(biāo)簽包括被監(jiān)測任務(wù)按照時間順序分別所處的子集群,被調(diào)度的次數(shù),任務(wù)運行時間以及在可恢復(fù)子集群中排隊的時間。
優(yōu)選地,所述監(jiān)控模塊記錄的故障任務(wù)時間進行先后排序,所述排序遵循兩個優(yōu)先原則進行:
第一優(yōu)先原則是優(yōu)先列隊原則,將所有故障任務(wù)按照監(jiān)控模塊監(jiān)測任務(wù)狀態(tài)標(biāo)記為故障的時刻作為排序的第一排序依據(jù);
第二優(yōu)先原則是優(yōu)先調(diào)度原則,所述監(jiān)控模塊將所有對應(yīng)期間內(nèi)處于空閑狀態(tài)的子集群按照所述標(biāo)簽類別進行依次排序,當(dāng)故障任務(wù)處于排隊調(diào)度時,優(yōu)先調(diào)度至與故障任務(wù)所處的上一個子集群類別相同的子集群中。
優(yōu)選地,所述監(jiān)控模塊包括標(biāo)簽信息統(tǒng)計單元,所述標(biāo)簽信息統(tǒng)計單元根據(jù)所有故障任務(wù)對應(yīng)標(biāo)簽內(nèi)容統(tǒng)計生成故障任務(wù)調(diào)度數(shù)據(jù)包,并依據(jù)數(shù)據(jù)包擬合出正常、擁堵、卡滯三條調(diào)度通道并將所述調(diào)度通道信息發(fā)送至調(diào)度模塊,獲得最佳自愈調(diào)度方案。
優(yōu)選地,所述的自愈調(diào)度方案的獲取步驟具體包括:
s100通過所述調(diào)度數(shù)據(jù)包分別獲得所述正常、擁堵、卡滯三條調(diào)度通道中被調(diào)度故障任務(wù)的標(biāo)簽類型和對應(yīng)處理故障任務(wù)的子集群類型;
s200獲得任務(wù)類型與子集群類型的最佳匹配組合方式;
s300所述調(diào)度模塊對被調(diào)度故障任務(wù)類型進行識別,并按照所述第二優(yōu)先原則的排序順序進行搜尋當(dāng)期處于空閑狀態(tài)步驟s200中所述的最佳匹配組合子集群,當(dāng)獲得匹配空閑子集群信息后完成調(diào)度;當(dāng)未搜尋到匹配空閑子集群信息則將作輪空處理,并將該故障任務(wù)調(diào)度至所述可恢復(fù)子集群中等待,直到匹配類型子集群出現(xiàn)至少一個空閑,則完成調(diào)度;所述故障任務(wù)在可恢復(fù)子集群中等待列隊的同時,調(diào)度模塊按照步驟s100-s200的方式調(diào)度下一故障任務(wù)。
優(yōu)選地,所述步驟s300中調(diào)度故障任務(wù)順序按照“正常調(diào)度通道→擁堵調(diào)度通道→卡滯調(diào)度通道”的先后順序進行依次調(diào)度。
優(yōu)選地,還包括對故障任務(wù)發(fā)生概率的預(yù)測步驟,具體包括:
y100所述標(biāo)簽信息統(tǒng)計單元模擬預(yù)設(shè)不同任務(wù)類型與子集群組合的處理速率值,并按照速率值由大到小劃分為三擋,分別為正常、擁堵和卡滯;
y200所述監(jiān)控模塊檢測的任意一個任務(wù)在對應(yīng)子集群中處理速率逼近所處速率擋邊緣時,觸發(fā)調(diào)度模塊在整個企業(yè)信息化系統(tǒng)中搜尋比任務(wù)當(dāng)期所處擋更高一級擋級中的子集群匹配類型并確定當(dāng)期空閑子集群。
本發(fā)明與現(xiàn)有技術(shù)相比,具有以下優(yōu)點及有益效果:
(1)本發(fā)明能夠在人工不進行干預(yù)和操作的情況下,利用系統(tǒng)本身的自愈調(diào)控總體架構(gòu)及不同層次的模塊設(shè)計,通過對失效的故障任務(wù)進行及時、合理的調(diào)度,利用避開故障局部區(qū)域,調(diào)度正常工作區(qū)域進行處理失效故障任務(wù)的方法實現(xiàn)系統(tǒng)在出現(xiàn)部分或者區(qū)域性、模塊化失效時依然能夠正常的使用,避免了因系統(tǒng)癱瘓帶來的不便和損失。
(2)本發(fā)明與現(xiàn)有的自愈性調(diào)控類方法相比,具有更強的數(shù)據(jù)處理能力、更快的響應(yīng)能力和任務(wù)執(zhí)行能力。
(3)本發(fā)明能夠解決現(xiàn)有的企業(yè)信息化系統(tǒng)自愈調(diào)控,同時,更重要的是還能夠通過調(diào)控數(shù)據(jù)反應(yīng)系統(tǒng)設(shè)計框架中的壁壘和薄弱環(huán)節(jié),為系統(tǒng)適應(yīng)不同任務(wù)和多種處理方式,甚至不同系統(tǒng)之間的操作協(xié)同和數(shù)據(jù)共享提供科學(xué)的設(shè)計依據(jù),無論是對于已知成型的系統(tǒng),還是對于一個測試階段的新系統(tǒng),都具有增強系統(tǒng)的自我感知、對環(huán)境的自適應(yīng)和分析、決策和執(zhí)行所需的基本智能調(diào)控作用。
具體實施方式
下面結(jié)合本發(fā)明的優(yōu)選實施例對本發(fā)明作進一步地詳細說明,但本發(fā)明的實施方式不限于此。
實施例1:
本實施例就結(jié)合現(xiàn)在最為普遍,企業(yè)應(yīng)用最為廣泛,功能最為全面的系統(tǒng)之一的oa系統(tǒng)進行詳細說明。
oa系統(tǒng),即辦公自動化系統(tǒng)(officeautomationsystem)是面向組織的日常運作和管理,員工及管理者使用頻率最高的應(yīng)用系統(tǒng),自1985年國內(nèi)召開第一次辦公自動化規(guī)劃會議以來,oa在應(yīng)用內(nèi)容的深度與廣度、it技術(shù)運用等方面都有了新的變化和發(fā)展,并成為組織不可缺的核心應(yīng)用系統(tǒng)。主要推行一種無紙化辦公模式。
現(xiàn)有的oa系統(tǒng)均包含但不限于公文管理、辦公管理、行政管理、信息管理、文檔管理和協(xié)同工作管理,每個管理模塊之間存在多種協(xié)同性邏輯關(guān)系,不同管理之間存在多種任務(wù)處理和調(diào)配,例如:公文管理模塊中最簡單的發(fā)文流程就會經(jīng)過至少提交→審核→會簽→審批結(jié)束。在所述的“審核→會簽→審批”流程均會涉及到退回、同意、修改的可能性,則整個流程的進行具備邏輯關(guān)系,流程運轉(zhuǎn)過程中的任意一步出現(xiàn)的卡滯或者失效的狀態(tài),則整個任務(wù)流程就無法繼續(xù)進行。值得強調(diào)的是:此處所述的卡滯或者失效是由于oa系統(tǒng)本身出現(xiàn)故障或者沖突導(dǎo)致的,并非指對應(yīng)流程的操作人員未及時進行處理導(dǎo)致的流程暫停。
本實施例中,在具備公文管理模塊的oa辦公系統(tǒng)中,其中一個具體的發(fā)文流程具體分為四步:
第一步為流程提交者草擬文檔并提交審批;
第二步為審批人審閱并批注審批意見;所述審批人的權(quán)限包括四種選擇:否決、退文、通過和傳閱;
第三步為審批人通過審閱后進入會簽流程;由會簽參與者相互審閱并會簽,會簽結(jié)論有四種情況:否決、退文、通過、傳閱;
第四步為審批結(jié)束,當(dāng)會簽參與者結(jié)論為通過時,則完成整個發(fā)文流程。本實施例中,當(dāng)流程提交者進行了第一步,并成功將流程提交到審批人的審批流程;此時,由于該發(fā)文流程在第二步審批人審閱過程中出現(xiàn)卡滯現(xiàn)象,導(dǎo)致發(fā)文流程在審批人環(huán)節(jié)無法進行否決、退文、通過、傳閱等操作,甚至無法查看相關(guān)的審批截面,該發(fā)文審批流程則出現(xiàn)失效,oa系統(tǒng)在不進行人工干預(yù)的前提下通過本發(fā)明實現(xiàn)系統(tǒng)的自修復(fù)、自配置、自保護和自優(yōu)化,維持系統(tǒng)的正常運行,具體地包括具有與所述oa系統(tǒng)集群匹配的監(jiān)控模塊和調(diào)度模塊,以及用于隔離故障任務(wù)的多個可恢復(fù)子集群的調(diào)度系統(tǒng);
所述監(jiān)控模塊實時監(jiān)測并記錄oa系統(tǒng)任何一個或者多個子集群中正在進行的任務(wù)狀態(tài)并將監(jiān)測數(shù)據(jù)進行實時記錄,當(dāng)監(jiān)測到所述發(fā)文流程任務(wù)未正常運行時,監(jiān)控模塊將故障發(fā)文流程任務(wù)數(shù)據(jù)發(fā)送至調(diào)度模塊,觸發(fā)調(diào)度模塊將故發(fā)文流程障任務(wù)調(diào)度分配至其他未執(zhí)行任務(wù)的子集群中進行處理;實現(xiàn)所述發(fā)文流程的正常運行,不會影響到審批人對該發(fā)文流程的審批工作造成任何的影響和不便。實現(xiàn)了oa系統(tǒng)的自愈調(diào)度和調(diào)控,避免了因oa系統(tǒng)自身的故障造成的流程流轉(zhuǎn)無法正常運行的問題。
實施例2:
在實施例1的基礎(chǔ)上當(dāng)所述故障任務(wù)數(shù)量大于可調(diào)配的空閑可用子集群數(shù)量時,調(diào)度模塊根據(jù)所述監(jiān)控模塊記錄的故障任務(wù)時間進行先后排序,并將未能分配的故障任務(wù)存放至可恢復(fù)子集群中。例如,同時有兩個或者兩個以上的人提交了發(fā)文流程,且均出現(xiàn)了卡滯,但是當(dāng)期能夠用于調(diào)度的空閑可用子集群數(shù)量只有一個的情況,即無法將故障或者失效的發(fā)文流程均調(diào)到到其他可用的空閑子集群中進行處理。將無法進行及時分配的任務(wù)放至可恢復(fù)子集群中進行暫存,以等待可執(zhí)行處于等待狀態(tài)的故障發(fā)文流程任務(wù)的子集群將上一個任務(wù)處理完畢,進行依次處理。這樣設(shè)置的好處在于,無論子集群的數(shù)量與當(dāng)期需要處理的故障任務(wù)是否匹配,都能將故障任務(wù)通過調(diào)度的方式進行處理,始終保證oa系統(tǒng)正常運行,無需人工加以干預(yù)就能夠自動化正常運行,只是當(dāng)可用子集群的數(shù)量明顯小于故障任務(wù)數(shù)量時,正常處理故障任務(wù)的時間周期會明顯延長;但不影響故障的正常處理,避免了現(xiàn)有系統(tǒng)出現(xiàn)卡滯后,故障任務(wù)無法進行調(diào)度調(diào)配,導(dǎo)致oa系統(tǒng)的部分功能喪失或者癱瘓。
本實施例中,所述監(jiān)控模塊檢測數(shù)據(jù)包括發(fā)文流程任務(wù)在正常運行階段、失效形成階段和失效截止階段過程中任務(wù)的解析過程實時數(shù)據(jù)。
本實施例中,所述監(jiān)控模塊對每一個被監(jiān)測的任務(wù)分配一個獨有的用于區(qū)分任務(wù)類別的標(biāo)簽,所述標(biāo)簽包括被監(jiān)測任務(wù)按照時間順序分別所處的子集群,被調(diào)度的次數(shù),任務(wù)運行時間以及在可恢復(fù)子集群中排隊的時間。
實施例3:
在實施例2的基礎(chǔ)上,本實施例中,所述監(jiān)控模塊記錄的故障任務(wù)時間進行先后排序,所述排序遵循兩個優(yōu)先原則進行:
第一優(yōu)先原則是優(yōu)先列隊原則,將所有故障任務(wù)按照監(jiān)控模塊監(jiān)測任務(wù)狀態(tài)標(biāo)記為故障的時刻作為排序的第一排序依據(jù);
第二優(yōu)先原則是優(yōu)先調(diào)度原則,所述監(jiān)控模塊將所有對應(yīng)期間內(nèi)處于空閑狀態(tài)的子集群按照所述標(biāo)簽類別進行依次排序,當(dāng)故障任務(wù)處于排隊調(diào)度時,優(yōu)先調(diào)度至與故障任務(wù)所處的上一個子集群類別相同的子集群中。
本實施例中,所述oa系統(tǒng)存在類型標(biāo)記為00的a任務(wù)、類型標(biāo)記為11的b任務(wù)、類型標(biāo)記為22的c任務(wù);按照第一優(yōu)先原則的排序分別為時間先后,即a→b→c當(dāng)期處于空閑的子集群有四個,且分別對應(yīng)子集群的類型為00的一個zz,類型為11的兩個nn,類型為22的一個kk,由于按照第一優(yōu)先排序原則故障任務(wù)a為第一個調(diào)度的故障任務(wù),且與故障任務(wù)a類型一致的只有一個子集群zz,則按照第二優(yōu)先原則,調(diào)度模塊則將類型為00的故障任務(wù)a調(diào)度至類型為00的子集群zz中;故障任務(wù)b可選調(diào)用的子集群還具有三個可以調(diào)度,即子集群nn兩個和kk一個,由于子集群kk的類型為22,與故障任務(wù)b不匹配,因此,按照第二優(yōu)先原則,則將故障任務(wù)b調(diào)度至任意一個與故障任務(wù)b類型一致的11類型的子集群nn中。
本實施例中,所述監(jiān)控模塊包括標(biāo)簽信息統(tǒng)計單元,所述標(biāo)簽信息統(tǒng)計單元根據(jù)所有故障任務(wù)對應(yīng)標(biāo)簽內(nèi)容統(tǒng)計生成故障任務(wù)調(diào)度數(shù)據(jù)包,并依據(jù)數(shù)據(jù)包擬合出正常、擁堵、卡滯三條調(diào)度通道并將所述調(diào)度通道信息發(fā)送至調(diào)度模塊,獲得最佳自愈調(diào)度方案。
本實施例中,所述的自愈調(diào)度方案的獲取步驟具體包括:
s100通過所述調(diào)度數(shù)據(jù)包分別獲得所述正常、擁堵、卡滯三條調(diào)度通道中被調(diào)度故障任務(wù)的標(biāo)簽類型和對應(yīng)處理故障任務(wù)的子集群類型;
s200獲得任務(wù)類型與子集群類型的最佳匹配組合方式;
s300所述調(diào)度模塊對被調(diào)度故障任務(wù)類型進行識別,并按照所述第二優(yōu)先原則的排序順序進行搜尋當(dāng)期處于空閑狀態(tài)步驟s200中所述的最佳匹配組合子集群,當(dāng)獲得匹配空閑子集群信息后完成調(diào)度;當(dāng)未搜尋到匹配空閑子集群信息則將作輪空處理,并將該故障任務(wù)調(diào)度至所述可恢復(fù)子集群中等待,直到匹配類型子集群出現(xiàn)至少一個空閑,則完成調(diào)度;所述故障任務(wù)在可恢復(fù)子集群中等待列隊的同時,調(diào)度模塊按照步驟s100-s200的方式調(diào)度下一故障任務(wù)。
本實施例中,所述所述步驟s300中調(diào)度故障任務(wù)順序按照“正常調(diào)度通道→擁堵調(diào)度通道→卡滯調(diào)度通道”的先后順序進行依次調(diào)度。
本實施例中,還包括對故障任務(wù)發(fā)生概率的預(yù)測步驟,具體包括:
y100所述標(biāo)簽信息統(tǒng)計單元模擬預(yù)設(shè)不同任務(wù)類型與子集群組合的處理速率值,并按照速率值由大到小劃分為三擋,分別為正常、擁堵和卡滯;
y200所述監(jiān)控模塊檢測的任意一個任務(wù)在對應(yīng)子集群中處理速率逼近所處速率擋邊緣時,觸發(fā)調(diào)度模塊在整個企業(yè)信息化系統(tǒng)中搜尋比任務(wù)當(dāng)期所處擋更高一級擋級中的子集群匹配類型并確定當(dāng)期空閑子集群。
以上所述,僅是本發(fā)明的較佳實施例,并非對本發(fā)明做任何形式上的限制,凡是依據(jù)本發(fā)明的技術(shù)實質(zhì)對以上實施例所作的任何簡單修改、等同變化,均落入本發(fā)明的保護范圍之內(nèi)。