一種面向衛(wèi)星的輪換式星載計算機(jī)容錯系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及星載計算機(jī)容錯技術(shù)領(lǐng)域,特別是一種面向衛(wèi)星的輪換式星載計算機(jī)容錯系統(tǒng)。
【背景技術(shù)】
[0002]星載計算機(jī)長期工作在充斥著高能帶電粒子的復(fù)雜太空環(huán)境中,當(dāng)電子器件受到輻射攻擊時,會因單粒子效應(yīng)以及總劑量效應(yīng)產(chǎn)生瞬時故障(可恢復(fù)性故障)以及永久故障(不可恢復(fù)性故障),因此設(shè)計科學(xué)高效的中心計算機(jī)容錯策略至關(guān)重要。
[0003]傳統(tǒng)的星載計算機(jī)容錯系統(tǒng)通常有如下幾種:雙機(jī)冷備份容錯結(jié)構(gòu)、雙機(jī)熱備份容錯結(jié)構(gòu)、三機(jī)熱備份容錯結(jié)構(gòu)(包括多機(jī)熱備份容錯結(jié)構(gòu)),對于以上三種容錯方案,熱備份系統(tǒng)功率較大,而冷備份系統(tǒng)實(shí)時性差,三機(jī)熱備份開銷相對雙機(jī)更大。隨著空間任務(wù)對衛(wèi)星可靠性和服務(wù)聯(lián)系性的要求日益提高,星載計算機(jī)作為信息處理的核心單元應(yīng)在滿足高可靠性要求的同時盡可能在發(fā)生故障時減少故障對衛(wèi)星正常工作狀態(tài)和服務(wù)的影響,因此需要一種面向衛(wèi)星、低耗能的計算機(jī)容錯系統(tǒng)。
【發(fā)明內(nèi)容】
[0004]本發(fā)明解決的技術(shù)問題是:克服現(xiàn)有技術(shù)的不足,提供了一種綜合了雙機(jī)冷熱備份和三級備份、兼顧了實(shí)時性和可靠性的面向衛(wèi)星的輪換式星載計算機(jī)容錯系統(tǒng)。
[0005]本發(fā)明的技術(shù)解決方案是:一種面向衛(wèi)星的輪換式星載計算機(jī)容錯系統(tǒng),包括控制模塊、存儲模塊、單機(jī)A、單機(jī)B、單機(jī)C,其中
[0006]控制模塊,包括控制單元、表決器,控制單元從外界獲取狀態(tài)信息參數(shù),按照狀態(tài)信息參數(shù)設(shè)置單機(jī)A、單機(jī)B、單機(jī)C的狀態(tài)模式,接收單機(jī)A、單機(jī)B、單機(jī)C發(fā)送的任務(wù)重要度參數(shù)后控制表決器進(jìn)行表決,
[0007]如果三個任務(wù)重要度參數(shù)表決結(jié)果為1,則進(jìn)入TMR三機(jī)冗余模式,控制表決器對存儲模塊中單機(jī)A、單機(jī)B、單機(jī)C的處理結(jié)果進(jìn)行表決,
[0008]如果三個任務(wù)重要度參數(shù)表決結(jié)果為0,則進(jìn)入“主熱冷”模式,任意指定一臺單機(jī)為主機(jī)、一臺單機(jī)為熱備機(jī)、一臺單機(jī)為冷備機(jī),將主機(jī)的處理結(jié)果輸出,監(jiān)測主機(jī)、熱備機(jī)、冷備機(jī)的狀態(tài)信息參數(shù);
[0009]如果熱備機(jī)的狀態(tài)信息參數(shù)變?yōu)?,則判定熱備機(jī)故障,控制冷備機(jī)切換為熱備機(jī),當(dāng)故障熱備機(jī)在設(shè)定次數(shù)以內(nèi)復(fù)位并排除故障時,則將故障熱備機(jī)切換為冷備機(jī)并繼續(xù)“主熱冷”模式,當(dāng)故障熱備機(jī)在設(shè)定次數(shù)以內(nèi)復(fù)位不能排除故障時,則排除故障熱備機(jī),進(jìn)入“雙機(jī)模式”,并繼續(xù)監(jiān)測主機(jī)與熱備機(jī)的狀態(tài)信息參數(shù);
[0010]如果主機(jī)狀態(tài)信息參數(shù)變?yōu)?,則判定主機(jī)故障,控制熱備機(jī)切換為主機(jī),當(dāng)故障主機(jī)在設(shè)定次數(shù)以內(nèi)復(fù)位并排除故障時,則控制故障主機(jī)切換為熱備機(jī),并繼續(xù)“雙機(jī)模式”,當(dāng)故障主機(jī)在設(shè)定次數(shù)以內(nèi)復(fù)位不能排除故障時,則排除故障主機(jī),進(jìn)入“單機(jī)模式”,并控制主機(jī)保存主機(jī)每段程序起始地址,如果主機(jī)狀態(tài)信息參數(shù)變?yōu)?且進(jìn)行復(fù)位能夠成功排除故障,則回到當(dāng)前執(zhí)行程序的初始位置重新執(zhí)行,否則判定容錯系統(tǒng)崩潰;
[0011]如果熱備機(jī)狀態(tài)信息參數(shù)變?yōu)?且該熱備機(jī)在設(shè)定次數(shù)以內(nèi)復(fù)位并排除故障,則繼續(xù)“雙機(jī)模式”,如果該熱備機(jī)在設(shè)定次數(shù)以內(nèi)復(fù)位不能排除故障,則排除該熱備機(jī),進(jìn)入“單機(jī)模式”,并控制主機(jī)保存主機(jī)每段程序起始地址,如果主機(jī)狀態(tài)信息參數(shù)變?yōu)?且進(jìn)行復(fù)位能夠成功排除故障,則回到當(dāng)前執(zhí)行程序的初始位置重新執(zhí)行,否則判定容錯系統(tǒng)崩潰;
[0012]如果主機(jī)的狀態(tài)信息參數(shù)變?yōu)?,則判定主機(jī)故障,控制主機(jī)復(fù)位并控制熱備機(jī)切換為主機(jī),冷備機(jī)切換為熱備機(jī),當(dāng)故障主機(jī)在設(shè)定次數(shù)以內(nèi)復(fù)位并排除故障時,則將故障主機(jī)切換為冷備機(jī)并繼續(xù)“主熱冷”模式,當(dāng)故障主機(jī)在設(shè)定次數(shù)以內(nèi)復(fù)位不能排除故障時,則排除故障主機(jī),進(jìn)入“雙機(jī)模式”,并繼續(xù)監(jiān)測主機(jī)與熱備機(jī)的狀態(tài)信息參數(shù);
[0013]如果主機(jī)狀態(tài)信息參數(shù)變?yōu)?,則判定主機(jī)故障,控制熱備機(jī)切換為主機(jī),當(dāng)故障主機(jī)在設(shè)定次數(shù)以內(nèi)復(fù)位并排除故障時,則控制故障主機(jī)切換為熱備機(jī),并繼續(xù)“雙機(jī)模式”,當(dāng)故障主機(jī)在設(shè)定次數(shù)以內(nèi)復(fù)位不能排除故障時,則排除故障主機(jī),進(jìn)入“單機(jī)模式”,并控制主機(jī)保存主機(jī)每段程序起始地址,如果主機(jī)狀態(tài)信息參數(shù)變?yōu)?且進(jìn)行復(fù)位能夠成功排除故障,則回到當(dāng)前執(zhí)行程序的初始位置重新執(zhí)行,否則判定容錯系統(tǒng)崩潰;
[0014]如果熱備機(jī)狀態(tài)信息參數(shù)變?yōu)?且該熱備機(jī)在設(shè)定次數(shù)以內(nèi)復(fù)位并排除故障,則繼續(xù)“雙機(jī)模式”,如果該熱備機(jī)在設(shè)定次數(shù)以內(nèi)復(fù)位不能排除故障,則排除該熱備機(jī),進(jìn)入“單機(jī)模式”,并控制主機(jī)保存主機(jī)每段程序起始地址,如果主機(jī)狀態(tài)信息參數(shù)變?yōu)?且進(jìn)行復(fù)位能夠成功排除故障,則回到當(dāng)前執(zhí)行程序的初始位置重新執(zhí)行,否則判定容錯系統(tǒng)崩潰;所述狀態(tài)信息參數(shù)為設(shè)置單機(jī)A、單機(jī)B、單機(jī)C狀態(tài)模式的參數(shù),當(dāng)狀態(tài)信息參數(shù)為O時,對應(yīng)單機(jī)為主機(jī)狀態(tài)模式,當(dāng)狀態(tài)信息參數(shù)為I時,對應(yīng)單機(jī)為熱備機(jī)狀態(tài)模式,當(dāng)單機(jī)狀態(tài)信息參數(shù)為2時,對應(yīng)單機(jī)為冷備機(jī)狀態(tài)模式,當(dāng)狀態(tài)信息參數(shù)為3時,對應(yīng)單機(jī)發(fā)生故障;所述任務(wù)重要度參數(shù)為置于星載任務(wù)數(shù)據(jù)內(nèi)的代表星載任務(wù)數(shù)據(jù)重要性的參數(shù),當(dāng)任務(wù)重要度參數(shù)為I時,代表星載任務(wù)數(shù)據(jù)重要,當(dāng)任務(wù)重要度參數(shù)為O時,代表星載任務(wù)數(shù)據(jù)一般;
[0015]表決器,對單機(jī)A、單機(jī)B、單機(jī)C發(fā)送的任務(wù)重要度參數(shù)進(jìn)行表決;從存儲模塊中讀取單機(jī)A、單機(jī)B、單機(jī)C的處理結(jié)果,并對處理結(jié)果進(jìn)行表決,將多數(shù)相同的處理結(jié)果輸出;
[0016]單機(jī)A,從外界獲取星載任務(wù)數(shù)據(jù)后提取任務(wù)重要度參數(shù)并送至控制單元,對星載任務(wù)數(shù)據(jù)進(jìn)行處理,并將處理結(jié)果送至存儲模塊;
[0017]單機(jī)B,從外界獲取星載任務(wù)數(shù)據(jù)后提取任務(wù)重要度參數(shù)并送至控制單元,對星載任務(wù)數(shù)據(jù)進(jìn)行處理,并將處理結(jié)果送至存儲模塊;
[0018]單機(jī)C,從外界獲取星載任務(wù)數(shù)據(jù)后提取任務(wù)重要度參數(shù)并送至控制單元,對星載任務(wù)數(shù)據(jù)進(jìn)行處理,并將處理結(jié)果送至存儲模塊;
[0019]存儲模塊,接收單機(jī)A、單機(jī)B、單機(jī)C發(fā)送的處理結(jié)果,并進(jìn)行存儲。
[0020]所述的單機(jī)A、單機(jī)B、單機(jī)C均有看門狗電路檢測該單機(jī)的程序是否跑飛,當(dāng)該單機(jī)程序跑飛時看門狗電路將該主機(jī)狀態(tài)信息參數(shù)置為3。
[0021]所述的設(shè)定次數(shù)為3。
[0022]本發(fā)明與現(xiàn)有技術(shù)相比的優(yōu)點(diǎn)在于:
[0023](I)本發(fā)明容錯系統(tǒng)與現(xiàn)有技術(shù)相比融合了任務(wù)等級與備份思想,兼顧了實(shí)時性和可靠性,能更好的應(yīng)對星載計算機(jī)因?yàn)閱瘟W有?yīng)及總劑量效應(yīng)產(chǎn)生的瞬時故障、永久故障等問題;
[0024](2)本發(fā)明容錯系統(tǒng)與現(xiàn)有技術(shù)相比綜合了雙機(jī)冷熱備份和三機(jī)備份,不僅具有三機(jī)備份使容錯系統(tǒng)可靠性能更高的優(yōu)勢,還能夠轉(zhuǎn)換為雙機(jī)熱備份來提高實(shí)時性能;
[0025](3)本發(fā)明容錯系統(tǒng)與現(xiàn)有技術(shù)相比,采取可降級的容錯備份方案,能夠靈活改變?nèi)蒎e系統(tǒng)容錯模式,延長了系統(tǒng)的使用時間;
[0026](4)本發(fā)明容錯系統(tǒng)具有完整的三機(jī)、雙機(jī)及單機(jī)模式下的重構(gòu)與狀態(tài)轉(zhuǎn)移策略,狀態(tài)轉(zhuǎn)移充分考慮了各機(jī)的工作狀態(tài),保證處理結(jié)果的可靠。
【附圖說明】
[0027]圖1為本發(fā)明容錯系統(tǒng)三機(jī)拓?fù)浼軜?gòu)圖;
[0028]圖2本發(fā)明容錯系統(tǒng)工作流程圖;
[0029]圖3本發(fā)明容錯系統(tǒng)三機(jī)模式下輪換式重構(gòu)和降級狀態(tài)轉(zhuǎn)移圖;
[0030]圖4本發(fā)明容錯系統(tǒng)雙機(jī)和單機(jī)模式下輪換式重構(gòu)和降級狀態(tài)轉(zhuǎn)移圖。
【具體實(shí)施方式】
[0031]本發(fā)明涉及一種面向衛(wèi)星的輪換式星載計算機(jī)容錯系統(tǒng)設(shè)計,該系統(tǒng)融合了冷備份和熱備份容錯策略的優(yōu)點(diǎn),可以同時滿足衛(wèi)星可靠性和實(shí)時性要求,可用于星載計算機(jī)的容錯設(shè)計中。本發(fā)明一種面向衛(wèi)星的輪換式星載計算機(jī)容錯系統(tǒng)如圖1所示包括控制模塊、存儲模塊、單機(jī)A、單機(jī)B、單機(jī)C,其中
[0032]控制模塊包括控制單元、表決器,控制單元從外界獲取狀態(tài)信息參數(shù),按照狀態(tài)信息參數(shù)設(shè)置單機(jī)A、單機(jī)B、單機(jī)C的狀態(tài)模式,接收單機(jī)A、單機(jī)B、單機(jī)C發(fā)送的任務(wù)重要度參數(shù)后來決定單機(jī)A、單機(jī)B、單機(jī)C的容錯模式;表決器在TMR三機(jī)冗余模式時從存儲模塊中讀取單機(jī)A、單機(jī)B、單機(jī)C的處理結(jié)果,并對處理結(jié)果進(jìn)行表決,將多數(shù)相同的結(jié)果輸出,狀態(tài)信息參數(shù)為設(shè)置單機(jī)A、單機(jī)B、單機(jī)C狀態(tài)模式的參數(shù),當(dāng)狀態(tài)信息參數(shù)為O時,對應(yīng)單機(jī)為主機(jī)狀態(tài)模式,當(dāng)狀態(tài)信息參數(shù)為I時,對應(yīng)單機(jī)為熱備機(jī)狀態(tài)模式,當(dāng)單機(jī)狀態(tài)信息參數(shù)為2時,對應(yīng)單機(jī)為冷備機(jī)狀態(tài)模式,當(dāng)狀態(tài)信息參數(shù)為3時,對應(yīng)單機(jī)發(fā)生故障;任務(wù)重要度參數(shù)為置于星載任務(wù)數(shù)據(jù)內(nèi)的代表星載任務(wù)數(shù)據(jù)重要性的參數(shù),當(dāng)任務(wù)重要度參數(shù)為I時,代表星載任務(wù)數(shù)據(jù)重要,當(dāng)任務(wù)重要度參數(shù)為O時,代表星載任務(wù)數(shù)據(jù)一般;單機(jī)A、單機(jī)B、單機(jī)C從外界獲取星載任務(wù)數(shù)據(jù)后提取任務(wù)重要度參數(shù)并送至控制單元,對星載任務(wù)數(shù)據(jù)進(jìn)行處理,并將處理結(jié)果送至存儲模塊;存儲模塊接收單機(jī)A、單機(jī)B、單機(jī)C發(fā)送的處理結(jié)果,并進(jìn)行存儲。
[0033]如圖2為本發(fā)明的系統(tǒng)工作流程圖,包括以下步驟:
[0034]I)首先容錯系統(tǒng)進(jìn)入初始化狀態(tài),三機(jī)中一機(jī)為主機(jī)、一機(jī)為熱備機(jī)、一機(jī)為冷備機(jī),任意設(shè)定三機(jī)工作狀態(tài),為A機(jī)作為主機(jī)、B機(jī)作為熱備機(jī)、C機(jī)作為冷備機(jī)(在狀態(tài)轉(zhuǎn)移圖中簡寫做:A主B熱C冷)。
[0035]2)每個單機(jī)看門狗電路開始監(jiān)控工作,當(dāng)輸入進(jìn)來的數(shù)據(jù)中任務(wù)重要度參數(shù)是I時,則切換為TMR三模冗余模式,B、C機(jī)狀態(tài)參數(shù)都設(shè)置為主機(jī)(冷備機(jī)需要上電并從主機(jī)A中復(fù)制程序和數(shù)據(jù))。TMR模式下(當(dāng)前每單機(jī)內(nèi)多模冗余模式參數(shù)為3)控制模塊中的表決器是一段從內(nèi)存中取出三機(jī)處理結(jié)果并進(jìn)行比較的程序,按照三取二原則,表決器留下多數(shù)相同的結(jié)果作為輸出。<