專利名稱:一種雙余度計算機故障處理的切換方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種計算機的故障處理方法,尤其涉及一種雙余度計算機的故障處理切換方法。
背景技術(shù):
為了提高系統(tǒng)的可靠性,許多計算機系統(tǒng)對整個設(shè)備或者部分關(guān)鍵功能采用雙余度熱備份的工作方式,當(dāng)主設(shè)備失效或者出現(xiàn)故障后,備份設(shè)備能夠判斷到主設(shè)備出現(xiàn)故障并自動進行切換,以保證系統(tǒng)繼續(xù)正常工作,現(xiàn)今嵌入式計算機對可靠性功耗和體積要求都比較苛刻,此方法必須對設(shè)備進行備份,而且在系統(tǒng)出現(xiàn)故障后才會通過備份的設(shè)備找到主設(shè)備的故障,進行切換,需要的額外資源很大,功耗大,并且運行過程、操作過程相當(dāng)復(fù)雜。發(fā)明內(nèi)容
為了解決背景技術(shù)中所存在的技術(shù)問題,本發(fā)明提出了一種雙余度計算機故障處理的切換方法,采用離散量信號和FPGA實現(xiàn)故障邏輯,實時完成主從設(shè)備的故障判斷、故障信息傳遞及主從功能切換。
本發(fā)明的技術(shù)解決方案是一種雙余度計算機故障處理的切換方法,其特殊之處在于所述方法包括以下步驟
1)對系統(tǒng)上電,主設(shè)備控制禁止,從設(shè)備控制禁止;
2)從設(shè)備對系統(tǒng)狀態(tài)進行實時監(jiān)控;
3)從設(shè)備判斷主設(shè)備是否工作正常;若是,則主設(shè)備控制輸出,從設(shè)備進行備份監(jiān)控;若否,則進行步驟4);
4)主設(shè)備將故障信息通知從設(shè)備;
5)主設(shè)備控制禁止,從設(shè)備實現(xiàn)切換控制輸出,并同時對主設(shè)備監(jiān)控。
上述步驟幻之后還包括步驟6)若系統(tǒng)運行過程中從設(shè)備出現(xiàn)問題,則進行步驟 6)判斷是否進行強制切換,若是,則切換為主設(shè)備控制輸出。
上述步驟3)從設(shè)備判斷主設(shè)備是否工作正常的具體步驟是
3. 1)從設(shè)備檢測主設(shè)備,首先判斷主設(shè)備是否電源失效,若是,則主設(shè)備的故障寄存器由‘1’置為‘0’,若否,則進行步驟3. 2);
3.2)判斷主設(shè)備是否有看門狗報警,若是,則主設(shè)備的故障寄存器由‘1’置為 ‘0’,若否,則進行步驟3. 3);
3. 3)判斷主設(shè)備是否軟件BIT錯誤,若是,則主設(shè)備的故障寄存器由‘1’置為‘0’, 若否,則返回步驟3)重新進行。
上述步驟4)中通知的具體步驟是
4. 1)主設(shè)備通過硬件將C_G0/N0g0離散量故障信號由高電平變?yōu)榈碗娖剑?br>
4. 2)該C_G0/N0g0離散量經(jīng)過光藕隔離后從低電平變?yōu)楦唠娖剑?br>
4. 3)步驟2中的高電平故障信號送入從設(shè)備的B_g0n0g0_in輸入,通知從設(shè)備主設(shè)備故障。
上述步驟幻主設(shè)備控制禁止,從設(shè)備切換的具體步驟是
5. 1)從設(shè)備通過中斷通知從設(shè)備的應(yīng)用程序主設(shè)備故障,需要切換到從設(shè)備;
5. 2)從設(shè)備硬件配置內(nèi)部故障切換控制寄存器的狀態(tài)置為‘0’,配置為切換狀態(tài);
5.3)切換控制寄存器輸出信號為低電平,表示由從設(shè)備進行系統(tǒng)控制;
5. 4)輸出的B_valid信號經(jīng)過光藕隔離后,送入主設(shè)備&C_Valid_in輸入控制主設(shè)備切換,主設(shè)備通過內(nèi)部硬件將輸出控制禁止;
5. 5)從設(shè)備內(nèi)部的切換控制寄存器控制切換邏輯將從設(shè)備的輸出控制使能。
本發(fā)明的方法正常情況下主設(shè)備進行系統(tǒng)控制,從設(shè)備進行監(jiān)聽備份;主設(shè)備故障時將系統(tǒng)任務(wù)切換至從設(shè)備運行,由從設(shè)備進行系統(tǒng)控制;在系統(tǒng)進入從設(shè)備備份控制狀態(tài)后,根據(jù)實際的需要,可通過強制切換功能將系統(tǒng)任務(wù)強行從從設(shè)備切換至主設(shè)備運行??梢允怪鲝脑O(shè)備之間實現(xiàn)故障判斷、故障信息傳遞及主從功能切換,該方法主從設(shè)備完全電氣隔離采用離散量信號和FPGA實現(xiàn)故障邏輯,系統(tǒng)工作機理清楚、控制實現(xiàn)簡單、運行穩(wěn)定可靠。
圖1是本發(fā)明的方法流程圖2是本發(fā)明的故障處理及切換具體實施例示意圖3是本發(fā)明的方法中從設(shè)備故障判斷流程圖4是本發(fā)明的方法中從主備故障通知的原理圖5是本發(fā)明中從設(shè)備切換的流程示意圖;具體實施方式
參見圖1,圖2,本發(fā)明的雙余度計算機故障處理的切換方法,包括以下步驟
1)對系統(tǒng)上電,主設(shè)備控制禁止,從設(shè)備控制禁止;
2)從設(shè)備對系統(tǒng)狀態(tài)進行實時監(jiān)控;
3)從設(shè)備判斷主設(shè)備是否工作正常;若是,則主設(shè)備控制輸出,從設(shè)備進行備份監(jiān)控;若否,則進行步驟4);
參見圖3,從設(shè)備判斷主設(shè)備是否工作正常的具體步驟是
3. 1)從設(shè)備檢測主設(shè)備,首先判斷主設(shè)備是否電源失效,若是,則主設(shè)備的故障寄存器由‘1’置為‘0’,若否,則進行步驟3. 2);
3.2)判斷主設(shè)備是否有看門狗報警,若是,則主設(shè)備的故障寄存器由‘1’置為 ‘0’,若否,則進行步驟3. 3);
3. 3)判斷主設(shè)備是否軟件BIT錯誤,若是,則主設(shè)備的故障寄存器由‘1’置為‘0’, 若否,則返回步驟3)重新進行。
參見圖4,4)主設(shè)備通知從設(shè)備,通知的具體步驟是
4. 1)主設(shè)備通過硬件將C_G0/N0g0離散量故障信號由高電平變?yōu)榈碗娖剑?br>
4. 2)該C_G0/N0g0離散量經(jīng)過光藕隔離后從低電平變?yōu)楦唠娖剑?br>
4. 3)步驟2)中的高電平故障信號送入從設(shè)備的B_g0n0g0_in輸入,通知從設(shè)備主設(shè)備故障。
參見圖5,主設(shè)備控制禁止,從設(shè)備實現(xiàn)切換控制輸出,并同時對主設(shè)備監(jiān)控,
具體實現(xiàn)方式是
5. 1)從設(shè)備通過中斷通知從設(shè)備的應(yīng)用程序主設(shè)備故障,需要切換到從設(shè)備;
5. 2)從設(shè)備硬件配置內(nèi)部故障切換控制寄存器的狀態(tài)置為‘0’,配置為切換狀態(tài);
5.3)切換控制寄存器輸出信號為低電平,表示由從設(shè)備進行系統(tǒng)控制;
5. 4)輸出的B_valid信號經(jīng)過光藕隔離后,送入主設(shè)備&C_Valid_in輸入控制主設(shè)備切換,主設(shè)備通過內(nèi)部硬件將輸出控制禁止;
5. 5)從設(shè)備內(nèi)部的切換控制寄存器控制切換邏輯將從設(shè)備的輸出控制使能。
6)若系統(tǒng)運行過程中從設(shè)備出現(xiàn)問題,則進行步驟6)判斷是否進行強制切換,若是,則切換為主設(shè)備控制輸出。
本發(fā)明中進行主設(shè)備和從設(shè)備切換的方法用到的信號參數(shù),參見表一;
表一
權(quán)利要求
1.一種雙余度計算機故障處理的切換方法,其特征在于所述方法包括以下步驟1)對系統(tǒng)上電,主設(shè)備控制禁止,從設(shè)備控制禁止;2)從設(shè)備對系統(tǒng)狀態(tài)進行實時監(jiān)控;3)從設(shè)備判斷主設(shè)備是否工作正常;若是,則主設(shè)備控制輸出,從設(shè)備進行備份監(jiān)控; 若否,則進行步驟4);4)主設(shè)備將故障信息通知從設(shè)備;5)主設(shè)備控制禁止,從設(shè)備實現(xiàn)切換控制輸出,并同時對主設(shè)備監(jiān)控。
2.根據(jù)權(quán)利要求1所述的雙余度計算機故障處理的切換方法,其特征在于所述步驟 5)之后還包括步驟6)若系統(tǒng)運行過程中從設(shè)備出現(xiàn)問題,則進行步驟6)判斷是否進行強制切換,若是,則切換為主設(shè)備控制輸出。
3.根據(jù)權(quán)利要求1或2所述的雙余度計算機故障處理的切換方法,其特征在于所述步驟3)從設(shè)備判斷主設(shè)備是否工作正常的具體步驟是3. 1)從設(shè)備檢測主設(shè)備,首先判斷主設(shè)備是否電源失效,若是,則主設(shè)備的故障寄存器由‘1,置為‘0,,若否,則進行步驟3. 2);3. 2)判斷主設(shè)備是否有看門狗報警,若是,則主設(shè)備的故障寄存器由‘1’置為‘0’,若否,則進行步驟3. 3);3.3)判斷主設(shè)備是否軟件BIT錯誤,若是,則主設(shè)備的故障寄存器由‘1’置為‘0’,若否,則返回步驟3)重新進行。
4.根據(jù)權(quán)利要求3所述的雙余度計算機故障處理的切換方法,其特征在于所述步驟4)中通知的具體步驟是4. 1)主設(shè)備通過硬件將C_G0/N0g0離散量故障信號由高電平變?yōu)榈碗娖剑?4. 2)該C_G0/N0g0離散量經(jīng)過光藕隔離后從低電平變?yōu)楦唠娖剑?.3)步驟2)中的高電平故障信號送入從設(shè)備的B_g0n0g0_in輸入,通知從設(shè)備主設(shè)備故障。5.根據(jù)權(quán)利要求4所述的雙余度計算機故障處理的切換方法,其特征在于所述步驟5)主設(shè)備控制禁止,從設(shè)備切換的具體步驟是5
. 1)從設(shè)備通過中斷通知從設(shè)備的應(yīng)用程序主設(shè)備故障,需要切換到從設(shè)備; 5. 2)從設(shè)備硬件配置內(nèi)部故障切換控制寄存器的狀態(tài)置為‘0’,配置為切換狀態(tài); 5. 3)切換控制寄存器輸出信號為低電平,表示由從設(shè)備進行系統(tǒng)控制; 5. 4)輸出的B_valid信號經(jīng)過光藕隔離后,送入主設(shè)備&C_valid_in輸入控制主設(shè)備切換,主設(shè)備通過內(nèi)部硬件將輸出控制禁止;5. 5)從設(shè)備內(nèi)部的切換控制寄存器控制切換邏輯將從設(shè)備的輸出控制使能。
全文摘要
本發(fā)明提出了一種雙余度計算機故障處理的切換方法,包括以下步驟1)對系統(tǒng)上電,主設(shè)備控制禁止,從設(shè)備控制禁止;2)從設(shè)備對系統(tǒng)狀態(tài)進行實時監(jiān)控;3)從設(shè)備判斷主設(shè)備是否工作正常;若是,則主設(shè)備控制輸出,從設(shè)備進行備份監(jiān)控;若否,則進行步驟4);4)主設(shè)備將故障信息通知從設(shè)備;5)主設(shè)備控制禁止,從設(shè)備實現(xiàn)切換控制輸出,并同時對主設(shè)備監(jiān)控。本發(fā)明的一種雙余度計算機故障處理的切換方法,采用離散量信號和FPGA實現(xiàn)故障邏輯,實時完成主從設(shè)備的故障判斷、故障信息傳遞及主從功能切換。
文檔編號G06F11/30GK102541697SQ20101062006
公開日2012年7月4日 申請日期2010年12月31日 優(yōu)先權(quán)日2010年12月31日
發(fā)明者劉文學(xué), 劉碩, 向建軍 申請人:中國航空工業(yè)集團公司第六三一研究所