本發(fā)明涉及熱備份技術(shù)領(lǐng)域。更具體地,涉及一種基于仲裁方式的雙冗余熱備份系統(tǒng)。
背景技術(shù):
目前,為滿足地面裝備車輛低成本、高可靠、信息化的發(fā)展需求,采用集成化的綜合控制設(shè)備完成車輛的一體化控制功能已成為未來發(fā)展的重要方向,綜合控制設(shè)備作為地面裝備車輛的核心設(shè)備,主要功能包括流程控制、人機交互、接收其他車載設(shè)備狀態(tài)信息并進行分析處理、對外發(fā)送控制命令完成控制功能,其可靠性、安全性將直接影響裝備車輛的整車性能,同時綜合控制設(shè)備作為裝車設(shè)備,其使用環(huán)境條件惡劣,會受到各種干擾,可能導(dǎo)致設(shè)備在運行中出現(xiàn)死機、通信故障等問題,一旦綜合控制設(shè)備出現(xiàn)故障后,地面裝備車輛的任務(wù)將被迫終止,最終導(dǎo)致裝備無法正常使用。因此車載綜合控制設(shè)備已逐步采用容錯技術(shù)來提高可靠性,針對關(guān)鍵設(shè)備、部件、元器件采用冗余熱備份的設(shè)計方法,但并非余度越多可靠性越高,因為余度提高后對應(yīng)的冗余部件增加,使得用于故障檢測和余度切換的部件增多,仲裁模塊功能越復(fù)雜,可靠性反而可能降低。
因此,需要提供一種針對地面裝備車輛上的綜合控制設(shè)備,綜合考慮可靠性、復(fù)雜度、實現(xiàn)難度以及成本因素的基于仲裁方式的雙冗余熱備份系統(tǒng)。
技術(shù)實現(xiàn)要素:
本發(fā)明的目的在于提供一種基于仲裁方式的雙冗余熱備份系統(tǒng),解決系統(tǒng)可靠性低的問題,特別是解決現(xiàn)有地面車輛裝備上的綜合控制設(shè)備可靠性低的問題。
為達到上述目的,本發(fā)明采用下述技術(shù)方案:
一種基于仲裁方式的雙冗余熱備份系統(tǒng),包括主cpu模塊、備cpu模塊、仲裁模塊、電源模塊和背板模塊;
主cpu模塊、備cpu模塊和仲裁模塊通過vpx總線連接背板模塊,電源模塊通過背板模塊為主cpu模塊、備cpu模塊和仲裁模塊供電;
仲裁模塊將輸入設(shè)備生成的usb信號進行分路后通過usb信號輸出端口分別發(fā)送至主cpu模塊和備cpu模塊;
仲裁模塊通過dvi視頻信號輸入端口接收主cpu模塊發(fā)送的dvi視頻信號并將dvi視頻信號發(fā)送至顯示設(shè)備;
主cpu模塊和備cpu模塊通過背板上vpx總線或直連網(wǎng)線進行數(shù)據(jù)同步;
主cpu模塊和備cpu模塊對自身狀態(tài)進行實時監(jiān)測,在監(jiān)測到發(fā)生故障時生成故障狀態(tài)信息;
主cpu模塊和備cpu模塊分別通過各自的串口向仲裁模塊發(fā)送故障狀態(tài)信息并周期性發(fā)送各自的心跳數(shù)據(jù);
仲裁模塊,根據(jù)心跳數(shù)據(jù)和故障狀態(tài)信息進行故障判定,在判定出現(xiàn)故障后進行故障報警,若故障為主cpu模塊和/或備cpu模塊自身的故障則進行故障的切換處理。
優(yōu)選地,心跳數(shù)據(jù)的發(fā)送周期為10ms。
優(yōu)選地,故障狀態(tài)信息包括:cpu模塊硬件故障的故障狀態(tài)信息、軟件運行故障的故障狀態(tài)信息、通信鏈路故障的故障狀態(tài)信息、數(shù)據(jù)同步失敗故障的故障狀態(tài)信息和數(shù)據(jù)同步不一致故障的故障狀態(tài)信息,其中,數(shù)據(jù)同步失敗故障的故障狀態(tài)信息和數(shù)據(jù)同步不一致故障的故障狀態(tài)信息由主cpu模塊生成。
優(yōu)選地,仲裁模塊根據(jù)心跳數(shù)據(jù)和故障狀態(tài)信息進行故障判定的方式為:當(dāng)仲裁模塊連續(xù)五個周期未收到某個cpu模塊的心跳數(shù)據(jù),或,當(dāng)仲裁模塊收到某個cpu模塊發(fā)送的cpu模塊硬件故障的故障狀態(tài)信息、軟件運行故障的故障狀態(tài)信息或通信鏈路故障的故障狀態(tài)信息時,判定該cpu模塊出現(xiàn)故障;當(dāng)仲裁模塊收到主cpu模塊發(fā)送的數(shù)據(jù)同步失敗故障的故障狀態(tài)信息或數(shù)據(jù)同步不一致故障的故障狀態(tài)信息時,判定同步失效。
優(yōu)選地,仲裁模塊進行故障的切換處理的方式為:
故障為主cpu模塊自身的故障時,仲裁模塊停止接收主cpu模塊發(fā)送的dvi視頻信號、停止將usb信號發(fā)送至主cpu模塊、對主cpu模塊實施斷電處理,同時,仲裁模塊接收備cpu模塊發(fā)送的dvi視頻信號并將dvi視頻信號發(fā)送至顯示設(shè)備、控制備cpu模塊停止其與主cpu模塊之間的數(shù)據(jù)同步,使得備cpu模塊以單余度狀態(tài)工作;
故障為備cpu模塊自身的故障時,仲裁模塊停止將usb信號發(fā)送至備cpu模塊、對主cpu模塊實施斷電處理,同時,仲裁模塊控制主cpu模塊停止其與備cpu模塊之間的數(shù)據(jù)同步,使得主cpu模塊以單余度狀態(tài)工作;
故障為主cpu模塊和備cpu模塊自身的故障時,仲裁模塊停止接收主cpu模塊發(fā)送的dvi視頻信號、停止將usb信號發(fā)送至主cpu模塊和備cpu模塊、對主cpu模塊和備cpu模塊均實施斷電處理。
本發(fā)明的有益效果如下:
本發(fā)明所述技術(shù)方案針對cpu模塊采取雙冗余熱備份的設(shè)計,通過仲裁模塊實現(xiàn)故障監(jiān)測及切換處理,提高了系統(tǒng)的可靠性,特別是應(yīng)用于地面裝備車輛時保證了地面裝備車輛上的綜合控制設(shè)備執(zhí)行任務(wù)的連續(xù)性,提高了地面裝備車輛的整體可靠性。
附圖說明
下面結(jié)合附圖對本發(fā)明的具體實施方式作進一步詳細(xì)的說明。
圖1示出基于仲裁方式的雙冗余熱備份系統(tǒng)。
具體實施方式
為了更清楚地說明本發(fā)明,下面結(jié)合優(yōu)選實施例和附圖對本發(fā)明做進一步的說明。附圖中相似的部件以相同的附圖標(biāo)記進行表示。本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,下面所具體描述的內(nèi)容是說明性的而非限制性的,不應(yīng)以此限制本發(fā)明的保護范圍。
如圖1所示,本發(fā)明公開的基于仲裁方式的雙冗余熱備份系統(tǒng)包括主cpu模塊、備cpu模塊、仲裁模塊、電源模塊和背板模塊;
主cpu模塊、備cpu模塊和仲裁模塊通過vpx總線連接背板模塊,電源模塊通過背板模塊為主cpu模塊、備cpu模塊和仲裁模塊供電;
主cpu模塊和備cpu模塊的硬件完全相同;
主cpu模塊和備cpu模塊的dvi視頻信號輸出端口分別連接仲裁模塊的兩個dvi視頻信號輸入端口,仲裁模塊的dvi視頻信號輸出端口連接至顯示設(shè)備;
主cpu模塊和備cpu模塊的usb信號輸入端口分別連接仲裁模塊的兩個usb信號輸出端口,仲裁模塊的usb信號輸入端口連接至輸入設(shè)備;
主cpu模塊和備cpu模塊的串口分別連接仲裁模塊的兩個串口,其中,串口為rs422串口;
仲裁模塊將輸入設(shè)備生成的usb信號進行一分為二的分路處理后通過usb信號輸出端口分別發(fā)送至主cpu模塊和備cpu模塊;
仲裁模塊通過dvi視頻信號輸入端口接收主cpu模塊發(fā)送的dvi視頻信號并將dvi視頻信號發(fā)送至顯示設(shè)備;
主cpu模塊和備cpu模塊通過背板上vpx總線或直連網(wǎng)線進行數(shù)據(jù)同步;
主cpu模塊和備cpu模塊均具有自檢功能,分別通過底層傳感器及自檢程序?qū)ψ陨頎顟B(tài)進行實時監(jiān)測,在監(jiān)測到發(fā)生故障時生成故障狀態(tài)信息;
主cpu模塊和備cpu模塊分別通過各自的串口向仲裁模塊發(fā)送故障狀態(tài)信息并周期性發(fā)送各自的心跳數(shù)據(jù),其中,心跳數(shù)據(jù)的發(fā)送周期為10ms;
仲裁模塊,根據(jù)心跳數(shù)據(jù)和故障狀態(tài)信息進行故障判定,在判定出現(xiàn)故障后進行故障報警,若故障為主cpu模塊和/或備cpu模塊自身的故障則進行故障的切換處理。
其中,
主cpu模塊和備cpu模塊在監(jiān)測到自身發(fā)生故障時生成故障狀態(tài)信息包括:
1)cpu模塊硬件故障的故障狀態(tài)信息:cpu模塊上電后,采用自檢程序?qū)崟r對自身工作狀態(tài)進行監(jiān)控,自檢狀態(tài)包括對cpu模塊溫度、cpu使用率、cpu電壓值、cpu工作頻率、內(nèi)存溫度、內(nèi)存使用率等進行快速自檢,若自檢結(jié)果異常則生成cpu模塊硬件故障的故障狀態(tài)信息;
2)軟件運行故障的故障狀態(tài)信息:在cpu模塊上運行的應(yīng)用軟件中設(shè)置看門狗,用看門狗定時器監(jiān)控程序狀態(tài),當(dāng)程序出現(xiàn)跑飛或鎖死故障時,生成軟件運行故障的故障狀態(tài)信息;
3)通信鏈路故障的故障狀態(tài)信息:cpu模塊與外部節(jié)點通信過程中,因為通信鏈路故障導(dǎo)致數(shù)據(jù)接收或發(fā)送失敗則生成通信鏈路故障的故障狀態(tài)信息;
4)數(shù)據(jù)同步失敗故障的故障狀態(tài)信息:兩個cpu模塊之間的直連網(wǎng)線出現(xiàn)鏈路故障,導(dǎo)致數(shù)據(jù)同步失敗,則主cpu模塊生成數(shù)據(jù)同步失敗故障的故障狀態(tài)信息。
5)數(shù)據(jù)同步不一致故障的故障狀態(tài)信息:兩個cpu模塊進行數(shù)據(jù)同步過程中出現(xiàn)同步結(jié)果不一致,導(dǎo)致兩個cpu模塊的狀態(tài)不一致,則主cpu模塊生成數(shù)據(jù)同步不一致故障的故障狀態(tài)信息。
仲裁模塊在判定出現(xiàn)故障后進行故障報警時,cpu模塊硬件故障的故障狀態(tài)信息、軟件運行故障的故障狀態(tài)信息、通信鏈路故障的故障狀態(tài)信息、數(shù)據(jù)同步失敗故障的故障狀態(tài)信息和數(shù)據(jù)同步不一致故障的故障狀態(tài)信息均進行具體類型的故障報警。
仲裁模塊根據(jù)心跳數(shù)據(jù)和故障狀態(tài)信息進行故障判定的方式為:當(dāng)仲裁模塊連續(xù)五個周期未收到某個cpu模塊的心跳數(shù)據(jù),或,當(dāng)仲裁模塊收到某個cpu模塊發(fā)送的cpu模塊硬件故障的故障狀態(tài)信息、軟件運行故障的故障狀態(tài)信息或通信鏈路故障的故障狀態(tài)信息時,判定該cpu模塊出現(xiàn)故障;當(dāng)仲裁模塊收到主cpu模塊發(fā)送的數(shù)據(jù)同步失敗故障的故障狀態(tài)信息或數(shù)據(jù)同步不一致故障的故障狀態(tài)信息時,判定同步失效故障。
仲裁模塊進行故障的切換處理的方式為:
故障為主cpu模塊自身的故障時,即當(dāng)判定主cpu模塊出現(xiàn)故障時,仲裁模塊停止接收主cpu模塊發(fā)送的dvi視頻信號、停止將usb信號發(fā)送至主cpu模塊、對主cpu模塊實施斷電處理,同時,仲裁模塊接收備cpu模塊發(fā)送的dvi視頻信號并將dvi視頻信號發(fā)送至顯示設(shè)備、控制備cpu模塊停止其與主cpu模塊之間的數(shù)據(jù)同步,使得備cpu模塊以單余度狀態(tài)工作;仲裁模塊還向其他節(jié)點發(fā)送切換通知;
故障為備cpu模塊自身的故障時,即當(dāng)判定備cpu模塊出現(xiàn)故障時,仲裁模塊停止將usb信號發(fā)送至備cpu模塊、對主cpu模塊實施斷電處理,同時,仲裁模塊控制主cpu模塊停止其與備cpu模塊之間的數(shù)據(jù)同步,使得主cpu模塊以單余度狀態(tài)工作;仲裁模塊還向其他節(jié)點發(fā)送故障通知;
故障為主cpu模塊和備cpu模塊自身的故障時,即當(dāng)判定主cpu模塊和備cpu模塊均出現(xiàn)故障時,仲裁模塊停止接收主cpu模塊發(fā)送的dvi視頻信號、停止將usb信號發(fā)送至主cpu模塊和備cpu模塊、對主cpu模塊和備cpu模塊均實施斷電處理;仲裁模塊還向其他節(jié)點發(fā)送故障通知。
需要說明的是,故障為同步失效故障時,即當(dāng)判定出現(xiàn)同步失效故障時,仲裁模塊不進行故障的切換處理,僅進行故障報警。
在本發(fā)明應(yīng)用于地面裝備車輛上的綜合控制設(shè)備時:
在綜合控制設(shè)備上電后,默認(rèn)第一個槽位上的cpu模塊為主cpu模塊,實現(xiàn)與外部的通訊、控制功能;另一個cpu模塊作為熱備份的備cpu模塊,只接收輸入設(shè)備的usb信號并進行處理,不向顯示設(shè)備發(fā)送dvi視頻信號。兩個cpu模塊上電自檢無誤后開始工作,構(gòu)成雙余度系統(tǒng)。
仲裁模塊進行故障報警的方式為在綜合控制設(shè)備前面板上通過狀態(tài)指示燈進行故障指示。
顯然,本發(fā)明的上述實施例僅僅是為清楚地說明本發(fā)明所作的舉例,而并非是對本發(fā)明的實施方式的限定,對于所屬領(lǐng)域的普通技術(shù)人員來說,在上述說明的基礎(chǔ)上還可以做出其它不同形式的變化或變動,這里無法對所有的實施方式予以窮舉,凡是屬于本發(fā)明的技術(shù)方案所引伸出的顯而易見的變化或變動仍處于本發(fā)明的保護范圍之列。