電力系統(tǒng)信息狀態(tài)故障識別方法
【專利摘要】本發(fā)明公開了一種電力系統(tǒng)信息狀態(tài)故障識別方法,包括步驟:識別來自至少一個應用服務器中的應用接口類別;通過網絡交換機隨機訪問所述集群系統(tǒng)中的任一應用服務器,識別出連接故障的應用服務器,獲取其特定信息;接收和存儲被識別的應用接口類別,以及存儲所述應用服務器的特定信息,以將這些特定信息進行關聯(lián);根據關聯(lián)信息查找與此應用服務器相鄰的另一個應用服務器,根據其接口類別,控制所述數(shù)據接口識別模塊連接其接口并重新傳輸應用。本發(fā)明系統(tǒng)對系統(tǒng)內設備的健康狀態(tài)做出快速、科學的評價,并根據評價結果,采取必要的處理措施,是確保通訊、網絡與信息系統(tǒng)安全穩(wěn)定運行的前提。
【專利說明】電力系統(tǒng)信息狀態(tài)故障識別方法
【技術領域】
[0001] 本發(fā)明主要涉及一種電力系統(tǒng),尤其是電網系統(tǒng)設備之間的通信服務系統(tǒng),包括 對設備故障精確評價的方法。
【背景技術】
[0002] 長期以來,通訊、信息設備只能根據運行年限、缺陷發(fā)生率及故障發(fā)生率來確定設 備的健康狀況,同時也無法像高壓電氣設備那樣可以定期進行停電試驗和維護,無法對通 訊、信息設備的健康狀況進行準確定性。隨著通訊、信息系統(tǒng)在電力系統(tǒng)中重要性的凸顯, 對通訊、信息設備運行的可靠性要求也越來越高。因此,對設備的健康狀態(tài)作出快速、科學 的評價,并根據評價結果,采取必要的處理措施,是確保通訊、網絡與信息系統(tǒng)安全穩(wěn)定運 行的前提。但目前尚沒有通訊、信息設備狀態(tài)評估方面的規(guī)程、流程和評價方法。因此需要 制訂一系列規(guī)程和制度,研宄一套評價方法,以支撐設備狀態(tài)評估體系的建立。深入研宄信 息設備狀態(tài)評估及檢修工作填補了目前國內電力信息設備狀態(tài)檢修的空白,對于保持我省 在電力系統(tǒng)信息化運維方面的先進性有著十分重要的意義。
【發(fā)明內容】
[0003] 本發(fā)明提出一種能夠實現(xiàn)電力信息交互服務系統(tǒng)的設備快速故障識別方法,并實 現(xiàn)設備故障的及時檢修,本發(fā)明技術方案:電力系統(tǒng)信息狀態(tài)故障識別方法,所述服務器包 括了數(shù)據庫服務器和應用服務器,包括步驟:識別來自至少一個應用服務器中的應用接口 類別;通過網絡交換機隨機訪問所述集群系統(tǒng)中的任一應用服務器,識別出連接故障的應 用服務器,獲取其特定信息;接收和存儲被識別的應用接口類別,以及存儲所述應用服務器 的特定信息,以將這些特定信息進行關聯(lián);根據關聯(lián)信息查找與此應用服務器相鄰的另一 個應用服務器,根據其接口類別,控制所述數(shù)據接口識別模塊連接其接口并重新傳輸應用。
[0004] 在一個實施例中,所述應用是存儲在一個或多個數(shù)據庫服務器中,在其中的至少 一個應用服務器出現(xiàn)故障時,通過與之相鄰的應用服務器從至少一個數(shù)據庫服務器中抽取 應用數(shù)據,轉移其中的應用給相鄰的應用服務器,使之作為備用設備。
[0005] 在一個實施例中,所述的電力系統(tǒng)信息狀態(tài)故障識別方法進一步包括步驟:提取 所述特定信息中的數(shù)據,按照數(shù)據位置、數(shù)據結構和數(shù)據完整性進行格式化;以及接收格式 化的數(shù)據,根據一個評價集成工具進行算法計算,發(fā)送給遠程控制模塊對相應的應用服務 器的應用進行控制。
[0006] 在一個實施例中,所述評價集成工具是設置在一個非易失性存儲器(NVM)中。在 一個實施例中,所述的電力系統(tǒng)信息狀態(tài)故障識別方法進一步包括設置所述的評價集成工 具以將格式化的數(shù)據自動拆分為多個控制代碼,將這些控制代碼與每一應用服務器的接口 類別加以對應。
[0007] 在一個實施例中,所述特定信息包括服務器設備狀態(tài)數(shù)據、應用狀態(tài)數(shù)據。
[0008] 在一個實施例中,根據實際應用需求,系統(tǒng)采用高可靠設備和必要冗余,以及先進 的網絡管理技術,使系統(tǒng)、數(shù)據得以有效保護。系統(tǒng)設備具有企業(yè)級要求,提供7X24小 時的不間斷服務。系統(tǒng)應消除單點故障,提供關鍵設備的故障切換,按照負載均衡方式或 active-active 方式工作。
[0009] 主機服務器和存儲設備的可靠性是整個系統(tǒng)正常可靠運行的基礎,選用的主機服 務器必須保證具有高可靠性。本系統(tǒng)是7 X 24小時連續(xù)運行的核心關鍵任務系統(tǒng),從硬件、 軟件、網絡等方面來保證系統(tǒng)的高可靠性。系統(tǒng)的主要部件采用冗余結構,主要的計算機設 備(如數(shù)據庫服務器),采用雙機熱備處理方式,保證系統(tǒng)不間斷運行,并采用雙路網卡來 增加可靠性,全冗余的連接方式使系統(tǒng)具備高可靠。
[0010] 在另一個方面,本發(fā)明技術方案2 :提供一種服務器集群系統(tǒng)中的核心交換機,它 包括:數(shù)據接口識別模塊,用于識別來自至少一個應用服務器中的應用接口類別,以進一 步連接和控制這些應用;中斷識別模塊,通過網絡交換機隨機訪問所述集群系統(tǒng)中的任一 應用服務器,識別出連接故障的應用服務器,獲取其特定信息;非易失性存儲器(NVM),用 于接收和存儲被識別的應用接口類別,以及存儲所述應用服務器的特定信息,以將這些特 定信息進行關聯(lián);以及遠程控制模塊,用于根據關聯(lián)信息查找與此應用服務器相鄰的另一 個應用服務器,根據其接口類別,控制所述數(shù)據接口識別模塊連接其接口并重新傳輸應用; 數(shù)據格式化模塊,用于提取所述特定信息中的數(shù)據,按照數(shù)據位置、數(shù)據結構和數(shù)據完整性 進行格式化;以及狀態(tài)評價模塊,接收格式化的數(shù)據,根據所述NVM中存儲的一個評價集成 工具進行算法計算,發(fā)送給遠程控制模塊對相應的應用服務器的應用進行控制。
[0011] 在一個實施例中,信息設備評價工具是以部件為單位,分別評價每套部件各狀態(tài) 量參數(shù)。同時研宄信息設備狀態(tài)評價依據,制定狀態(tài)評價標準,根據信息設備缺陷和故障的 性質和概率統(tǒng)計分析,借鑒以往發(fā)現(xiàn)、處理缺陷和故障的方法、數(shù)據和經驗,通過狀態(tài)量的 表述方式,以現(xiàn)有的運行巡視、定期檢測、在線監(jiān)測等技術手段獲取狀態(tài)信息,對在役信息 設備的運行性能進行綜合評定,為設備運行、維護和檢修提供依據。
[0012] 基于此,本發(fā)明技術效果顯而易見,本發(fā)明系統(tǒng)對系統(tǒng)內設備的健康狀態(tài)做出快 速、科學的評價,并根據評價結果,采取必要的處理措施,是確保通訊、網絡與信息系統(tǒng)安全 穩(wěn)定運行的前提。
【專利附圖】
【附圖說明】
[0013] 圖1為本發(fā)明系統(tǒng)實施例的架構原理示意圖。
【具體實施方式】
[0014] 參照圖1,電力系統(tǒng)快速信息狀態(tài)檢修與服務系統(tǒng)的較佳實施例設置有服務器、局 域網絡(LAN或WLAN)和磁盤陣列3,服務器通過局域網絡中的雙通道光纖交換機連接至磁 盤陣列3,使磁盤陣列3的存儲鏈路產生冗余,其中服務器包括數(shù)據庫服務器1和應用服務 器2,在一個較佳例子中,采用多個數(shù)據庫服務器和應用服務器搭建成各自的集群系統(tǒng),在 其中的至少一個應用服務器2出現(xiàn)故障時,通過與之相鄰的應用服務器轉移其中的應用, 例如服務器上安裝的應用程序,插件或類似模塊化組件,使得相鄰應用服務器作為備用設 備。
[0015] 在一個實施例中,在所述局域網絡中進一步設置多個網絡交換機4和負載均衡器 5,通過網絡交換機將服務器彼此互連,并通過負載均衡器連接網絡交換機以在在出現(xiàn)單點 故障時分配應用。
[0016] 參照圖1,在多個數(shù)據庫服務器1和應用服務器2搭建成的集群系統(tǒng)中連接有核 心交換機,且連接多個網絡交換機,其中所述核心交換機包括:數(shù)據接口識別模塊,用于識 別來自至少一個應用服務器中的應用接口類別,以進一步連接和控制這些應用;中斷識別 模塊,通過網絡交換機隨機訪問所述集群系統(tǒng)中的任一應用服務器,識別出連接故障的應 用服務器,獲取其特定信息;非易失性存儲器(NVM),用于接收和存儲被識別的應用接口類 另IJ,以及存儲所述應用服務器的特定信息,以將這些特定信息進行關聯(lián);以及
[0017] 遠程控制模塊,用于根據關聯(lián)信息查找與此應用服務器相鄰的另一個應用服務 器,根據其接口類別,控制所述數(shù)據接口識別模塊連接其接口并重新傳輸應用。在一個實施 例中,所述特定信息包括每一應用服務器的服務器用戶ID、IP地址、MC地址或心跳幀。
[0018] 在一個實施例中,所述特定信息包括服務器設備狀態(tài)數(shù)據、應用狀態(tài)數(shù)據。
[0019] 在一個實施例中,電力系統(tǒng)信息狀態(tài)服務系統(tǒng)進一步包括:數(shù)據格式化模塊,用于 提取所述特定信息中的數(shù)據,按照數(shù)據位置、數(shù)據結構和數(shù)據完整性進行格式化;以及狀態(tài) 評價模塊,接收格式化的數(shù)據,根據所述NVM中存儲的一個評價集成工具進行算法計算,發(fā) 送給遠程控制模塊對相應的應用服務器的應用進行控制。
[0020] 其中,設置所述的評價集成工具以將格式化的數(shù)據自動拆分為多個控制代碼,將 這些控制代碼與每一應用服務器的接口類別加以對應。
[0021] 進一步地,設置所述遠程控制模塊以:從被查找的應用服務器接收表示可用應用 的接口類別,基于存儲在所述NVM中的應用服務器特定信息,將接口類別發(fā)送至網絡中的 至少一個應用服務器;通過中斷識別模塊獲取網絡鏈路上可用的應用服務器接口類別信 息;基于所述的可用接口類別信息生成更新信息,替換原先NVM中出現(xiàn)故障的應用服務器 的接口類別信息;以及控制數(shù)據接口識別模塊向至少一個應用服務器發(fā)送應用數(shù)據。
[0022] 在一個實施例中,進一步設置有連接每一應用服務器的鍵盤、視頻與鼠標交換機 (KVM)6,以通過其中的一個應用服務器遠程訪問另一應用服務器中的應用。在一個實施例 中,所述局域網絡中的數(shù)據是以心跳幀加以發(fā)送。
[0023] 在一個實施例中,信息設備狀態(tài)檢修與服務系統(tǒng)硬件架構由服務器、網絡、存儲部 分組成,其中服務器分為數(shù)據庫服務器和應用服務器。為了保障系統(tǒng)的高可用性,數(shù)據庫服 務器和應用服務器分別采用多臺設備搭建集群系統(tǒng),實現(xiàn)故障時能夠將應用自動切換到備 用服務器上。服務器通過雙通道連接光纖交換機連接到后端的存儲磁盤陣列設備上,做到 存儲鏈路的冗余,提高了整個系統(tǒng)的可靠性。同樣的,在網絡架構上通過多臺網絡交換機、 負載均衡器,避免整個硬件架構中出現(xiàn)單點故障。為了便于管理員遠程維護,采用了 KVM將 控制信號傳輸?shù)浇K端進行管理。
[0024] 進一步地,在所述數(shù)據庫服務器之間,或者所述數(shù)據庫服務器與光纖交換機之間 采用RS232心跳連線加以連接;所述應用服務器之間,或者所述應用服務器與光纖交換機 之間采用RJ45心跳連線加以連接;所述光纖交換機與服務器之間,或者與磁盤陣列之間采 用SAS光纖連線或SAN連線加以連接。
[0025] 在一個實施例中,信息設備狀態(tài)檢修系統(tǒng)的數(shù)據源來自于年度數(shù)據、季度數(shù)據、月 度數(shù)據、隨機抽樣,從機房溫控系統(tǒng)、網管系統(tǒng)自動獲取的實時監(jiān)控數(shù)據,以及從漏洞掃描 系統(tǒng)中的掃描結果,然后將這些數(shù)據按照數(shù)據位置、數(shù)據結構、數(shù)據完整性等標準進行格式 化。格式化完畢的數(shù)據就可以通過用戶定制算法,進行數(shù)據計算,對信息設備進行狀態(tài)評 價。用戶能夠通過瀏覽器查看到最終的信息設備定級情況和狀態(tài)檢修綜合報告,作為今后 執(zhí)行信息設備狀態(tài)檢修的依據。
[0026] 信息設備狀態(tài)檢修系統(tǒng)用戶分為運行管理人員和檢修管理人員,其中運行管理人 員負責信息設備日常運行、性能監(jiān)控、機房巡視、上報故障缺陷等工作內容,檢修管理人員 負責制定檢修計劃、處理設備故障缺陷、信息設備應急演練、反事故演習等工作內容。用戶 通過企業(yè)內網,訪問位于省公司防火墻后端的應用程序服務器,由應用程序服務器對數(shù)據 庫服務器中的數(shù)據進行操作。信息設備狀態(tài)檢修系統(tǒng)底層數(shù)據庫為oracle,頂層信息錄入 系統(tǒng)為定制的ERP系統(tǒng)--信息設備狀態(tài)檢修與服務目錄系統(tǒng),該系統(tǒng)集中部署在專用服 務器上,通過提供網絡門戶的形式匯總由運行(檢修)部門采集的數(shù)據,根據專為該項目設 計的算法,最終得出各信息設備的評價和運行狀態(tài),并出具初評報告。
[0027] 在一個實施例中,設計一種電力系統(tǒng)信息狀態(tài)故障識別方法,具體包括:
[0028] 1、通過所述的數(shù)據接口識別模塊識別來自至少一個應用服務器中的應用接口類 另IJ。在一個實施例中,在一個應用服務器2中安裝了 ERP系統(tǒng)應用,同時其應用中的數(shù)據被 存儲在一個相鄰的數(shù)據庫服務器1中,所述服務器2自動生成一個關聯(lián)ERP系統(tǒng)應用的接 口類別信息,供核心交換機查詢,當此服務器2上的ERP系統(tǒng)應用被核心交換機中的評價工 具檢測出存在系統(tǒng)故障/缺陷時,通過查找與之相鄰的應用服務器來移動這個ERP系統(tǒng)應 用,從而在這個備用設備中重新安裝這個ERP應用,而數(shù)據庫服務器1中與之相關聯(lián)的數(shù)據 被與之關聯(lián),且此數(shù)據庫服務器1與這個備用設備進行互連。
[0029] 2、通過中斷識別模塊,使用網絡交換機隨機訪問所述集群系統(tǒng)中的任一應用服務 器2,識別出其中連接故障的應用服務器,獲取其特定信息;
[0030] 3、通過NVM接收和存儲被識別的應用接口類別,以及存儲所述應用服務器的特定 信息,以將這些特定信息進行關聯(lián);
[0031] 4、通過遠程控制模塊根據關聯(lián)信息查找與此應用服務器相鄰的另一個應用服務 器,根據其接口類別,控制所述數(shù)據接口識別模塊連接其接口并重新傳輸應用。在一個實施 例中,所述應用是存儲在一個或多個數(shù)據庫服務器中,在其中的至少一個應用服務器出現(xiàn) 故障時,通過與之相鄰的應用服務器從至少一個數(shù)據庫服務器中抽取應用數(shù)據,轉移其中 的應用給相鄰的應用服務器,使之作為備用設備。
[0032] 在一個實施例中,所述的電力系統(tǒng)信息狀態(tài)故障識別方法進一步包括步驟:提取 所述特定信息中的數(shù)據,按照數(shù)據位置、數(shù)據結構和數(shù)據完整性進行格式化;以及接收格式 化的數(shù)據,根據一個評價集成工具進行算法計算,發(fā)送給遠程控制模塊對相應的應用服務 器的應用進行控制。
[0033] 在一個實施例中,所述評價集成工具是設置在NVM中。所述的電力系統(tǒng)信息狀態(tài) 故障識別方法進一步包括設置所述的評價集成工具以將格式化的數(shù)據自動拆分為多個控 制代碼,將這些控制代碼與每一應用服務器的接口類別加以對應。例如,評價工具的控制代 碼中包含了一個服務器的設備運行環(huán)境評價目錄,根據溫度采集數(shù)據,按照其在評價周期 內所處時間的長短進行計算,計算公式為
【權利要求】
1. 一種電力系統(tǒng)信息狀態(tài)故障識別方法,其特征在于所述服務器包括數(shù)據庫服務器和 應用服務器,所述方法包括步驟:識別來自至少一個應用服務器中的應用接口類別;通過 網絡交換機隨機訪問所述集群系統(tǒng)中的任一應用服務器,識別出連接故障的應用服務器, 獲取其特定信息;接收和存儲被識別的應用接口類別,W及存儲所述應用服務器的特定信 息,W將該些特定信息進行關聯(lián);根據關聯(lián)信息查找與此應用服務器相鄰的另一個應用服 務器,根據其接口類別,控制所述數(shù)據接口識別模塊連接其接口并重新傳輸應用。
2. 根據權利要求1所述的電力系統(tǒng)信息狀態(tài)故障識別方法,其特征在于:所述應用是 存儲在一個或多個數(shù)據庫服務器中,在其中的至少一個應用服務器出現(xiàn)故障時,通過與之 相鄰的應用服務器從至少一個數(shù)據庫服務器中抽取應用數(shù)據,轉移其中的應用給相鄰的應 用服務器,使之作為備用設備。
3. 根據權利要求1所述的電力系統(tǒng)信息狀態(tài)故障識別方法,其特征在于進一步包括步 驟;提取所述特定信息中的數(shù)據,按照數(shù)據位置、數(shù)據結構和數(shù)據完整性進行格式化;W及 接收格式化的數(shù)據,根據一個評價集成工具進行算法計算,發(fā)送給遠程控制模塊對相應的 應用服務器的應用進行控制。
4. 根據權利要求2所述的電力系統(tǒng)信息狀態(tài)故障識別方法,其特征在于:所述評價集 成工具是設置在一個非易失性存儲器(NVM)中。
5. 根據權利要求2所述的電力系統(tǒng)信息狀態(tài)故障識別方法,其特征在于:設置所述的 評價集成工具W將格式化的數(shù)據自動拆分為多個控制代碼,將該些控制代碼與每一應用服 務器的接口類別加W對應。
6. 根據權利要求1所述的電力系統(tǒng)信息狀態(tài)故障識別方法,其特征在于:所述特定信 息包括服務器設備狀態(tài)數(shù)據、應用狀態(tài)數(shù)據。
【文檔編號】H04L12/24GK104463691SQ201410539863
【公開日】2015年3月25日 申請日期:2014年10月13日 優(yōu)先權日:2014年10月13日
【發(fā)明者】沈瀟軍, 王志強, 朱益斌, 劉鴻寧, 金張果, 蔣錦霞, 蔣鴻城, 黃海潮, 夏威 申請人:國家電網公司, 國網浙江省電力公司