本發(fā)明涉及bmc芯片領(lǐng)域,具體涉及一種bmc芯片智能協(xié)處理裝置及處理方法。
背景技術(shù):
隨著客戶對服務(wù)器的穩(wěn)定性方面的要求原來越高,對服務(wù)器主板的管理要求越來越嚴(yán)格。服務(wù)器主板采用bmc芯片進(jìn)行管理,bmc芯片可以實現(xiàn)系統(tǒng)運行的監(jiān)測及控制,從而實現(xiàn)對系統(tǒng)更好的維護(hù)。在服務(wù)器的實際應(yīng)用中,bmc芯片會受到各種因素的干擾,比如電磁輻射、電壓不穩(wěn)等,會造成bmc芯片的程序跑飛。當(dāng)bmc芯片失效之后,服務(wù)器的運行和監(jiān)控失去控制,整個服務(wù)器有工作異常的風(fēng)險。同時,bmc芯片失效也就無法發(fā)送報警信息,即使客戶發(fā)現(xiàn)問題也需要耗費人力去現(xiàn)場維護(hù),帶來極大的資源浪費。
技術(shù)實現(xiàn)要素:
為解決上述問題,本發(fā)明提供一種bmc芯片智能協(xié)處理裝置及處理方法,可在bmc芯片內(nèi)部處理器失效后,維持視頻及控制的傳輸,并發(fā)送警報到管理平臺,實時傳送服務(wù)器工作狀態(tài),并根據(jù)配置策略決定是否關(guān)閉服務(wù)器。
本發(fā)明的技術(shù)方案是:一種bmc芯片智能協(xié)處理裝置,包括:arm處理器,通信模塊,與所述arm處理器連接的協(xié)處理模塊,分別與所述arm處理器、協(xié)處理模塊連接的服務(wù)器主板,以及通過通信模塊與協(xié)處理模塊連接的管理平臺;
所述協(xié)處理模塊包括:
看門狗子模塊:對arm處理器進(jìn)行失效檢測并復(fù)位arm處理器,且將arm處理器失效信息和復(fù)位信息發(fā)送給協(xié)處理控制子模塊;
協(xié)處理控制子模塊:設(shè)置有主板信息接收端口和主板控制信號發(fā)出端口;當(dāng)arm處理器正常運行時,將arm處理器發(fā)出的交互信息經(jīng)通信模塊轉(zhuǎn)發(fā)給管理平臺,將arm處理器發(fā)出的主板控制信號經(jīng)主板控制信號發(fā)出端口轉(zhuǎn)發(fā)給服務(wù)器主板,并將經(jīng)通信模塊接收的控制信息發(fā)送給arm處理器;當(dāng)接收到arm處理器失效信息時,將經(jīng)主板信息接收端口接收的主板信息由通信模塊發(fā)給管理平臺,并由主板控制信號發(fā)出端口發(fā)出主板控制信號給服務(wù)器主板,且由通信模塊發(fā)出警報信息給管理平臺。
進(jìn)一步地,所述協(xié)處理控制子模塊包括:
警報接收單元:接收看門口模塊發(fā)出的arm處理器失效信息;
警報判斷單元:根據(jù)arm處理器失效信息判斷警報級別;
警報發(fā)送單元:將警報信息以報文形式發(fā)出。
進(jìn)一步地,警報發(fā)送單元發(fā)出的警報信息報文包括以下信息:警報類型、目的編號、設(shè)備請求編號、本次arm處理器失效時間、上次arm處理器失效時間、24小時失效次數(shù)、歷史失效次數(shù)、溢出標(biāo)志、ecc校驗數(shù)據(jù)。
進(jìn)一步地,主板信息接收端口為視頻信息接收端口,主板控制信號發(fā)出端口為主板電源控制信號發(fā)出端口。
進(jìn)一步地,arm處理器發(fā)出的交互信息包括視頻信息。
進(jìn)一步地,通信模塊為網(wǎng)絡(luò)接口。
進(jìn)一步地,協(xié)處理模塊還包括數(shù)據(jù)封裝解析子模塊,所述數(shù)據(jù)封裝解析子模塊用于對arm處理器與協(xié)處理控制子模塊之間的傳輸數(shù)據(jù)進(jìn)行封裝或解析。
一種bmc芯片智能協(xié)處理方法,包括arm處理器、協(xié)處理模塊和服務(wù)器主板;
還包括以下步驟:
s1:協(xié)處理模塊轉(zhuǎn)發(fā)arm處理器發(fā)出的交互信息和主板控制信號,并判斷arm處理器是否失效;
s2:若arm處理器未失效則重復(fù)步驟s1,若arm處理器失效則協(xié)處理模塊接管交互信息和主板控制信號,并發(fā)出警報信息,且重啟arm處理器。
進(jìn)一步地,步驟s2中協(xié)處理模塊接管交互信息是指協(xié)處理模塊接收主板信息并將其發(fā)出,且發(fā)出主板電源控制信號給服務(wù)器主板。
進(jìn)一步地,步驟s2中發(fā)出警報信息具體包括以下步驟:
s2.1:判斷失效間隔是否小于最短間隔預(yù)設(shè)閾值;
s2.2:若失效間隔小于最短間隔預(yù)設(shè)閾值,則發(fā)出三級警報并關(guān)閉服務(wù)器;否則判斷失效間隔是否小于中級間隔預(yù)設(shè)閾值;
s2.3:若失效間隔小于中級間隔預(yù)設(shè)閾值,則發(fā)出二級警報;否則判斷失效間隔是否小于最長間隔預(yù)設(shè)閾值;
s2.4:若失效間隔小于最長時間預(yù)設(shè)閾值,則發(fā)出一級警報。
本發(fā)明提供的bmc芯片智能協(xié)處理裝置及處理方法,在bmc芯片內(nèi)部處理器失效后,維持視頻及控制的傳輸,并發(fā)送警報到管理平臺,實時傳送服務(wù)器工作狀態(tài),起到監(jiān)視服務(wù)器運行的作用。同時,本裝置具有記錄bmc芯片處理器失效間隔的功能,根據(jù)失效間隔的時間決定發(fā)送警報級別,以及決定是否關(guān)閉服務(wù)器,確保服務(wù)器不出現(xiàn)事故。
附圖說明
圖1是本發(fā)明具體實施例裝置結(jié)構(gòu)示意圖。
圖2是本發(fā)明具體實施例方法流程示意圖。
圖中,1-arm處理器,2-協(xié)處理模塊,21-看門狗子模塊,22-數(shù)據(jù)封裝解析子模塊,23-協(xié)處理控制子模塊,3-服務(wù)器主板,4-通信模塊,5-管理平臺。
具體實施方式
下面結(jié)合附圖并通過具體實施例對本發(fā)明進(jìn)行詳細(xì)闡述,以下實施例是對本發(fā)明的解釋,而本發(fā)明并不局限于以下實施方式。
如圖1所示,本發(fā)明提供的bmc芯片智能協(xié)處理裝置,包括:arm處理器1、通信模塊4、協(xié)處理模塊2、服務(wù)器主板3、管理平臺5。協(xié)處理模塊2與arm處理器1連接,服務(wù)器主板3分別與arm處理器1、協(xié)處理模塊2連接,管理平臺5通過通信模塊4與協(xié)處理器連接。
其中協(xié)處理模塊2包括:看門狗子模塊21和協(xié)處理控制子模塊23。
看門狗子模塊21:對arm處理器1進(jìn)行失效檢測并復(fù)位arm處理器1,且將arm處理器1失效信息和復(fù)位信息發(fā)送給協(xié)處理控制子模塊23。
協(xié)處理控制子模塊23:設(shè)置有主板信息接收端口和主板控制信號發(fā)出端口;當(dāng)arm處理器1正常運行時,將arm處理器1發(fā)出的交互信息經(jīng)通信模塊4轉(zhuǎn)發(fā)給管理平臺5,將arm處理器1發(fā)出的主板控制信號經(jīng)主板控制信號發(fā)出端口轉(zhuǎn)發(fā)給服務(wù)器主板3,并將經(jīng)通信模塊4接收的控制信息發(fā)送給arm處理器1;當(dāng)接收到arm處理器1失效信息時,將經(jīng)主板信息接收端口接收的主板信息由通信模塊4發(fā)給管理平臺5,并由主板控制信號發(fā)出端口發(fā)出主板控制信號給服務(wù)器主板3,且由通信模塊4發(fā)出警報信息給管理平臺5。
本實施例中,通信模塊4可以采用網(wǎng)絡(luò)接口,主板信息接收端口為視頻信息接收端口,主板控制信號發(fā)出端口為主板電源控制信號發(fā)出端口,arm處理器1發(fā)出的交互信息包括視頻信息。服務(wù)器主板3將視頻信息(vga信號)發(fā)出后可經(jīng)數(shù)模轉(zhuǎn)換電路轉(zhuǎn)換為數(shù)字信號后發(fā)送給arm處理器1或協(xié)處理控制子模塊23。
協(xié)處理模塊2還包括數(shù)據(jù)封裝解析子模塊22,數(shù)據(jù)封裝解析子模塊22用于對arm處理器1與協(xié)處理控制子模塊23之間的傳輸數(shù)據(jù)進(jìn)行封裝或解析。
在arm處理器1正常運行時,協(xié)處理模塊2將arm處理器1發(fā)出信息轉(zhuǎn)發(fā)給管理平臺5或服務(wù)器主板3;在arm處理器1失效期間,協(xié)處理模塊2接管對服務(wù)器主板3的監(jiān)控,即接收服務(wù)器主板3發(fā)出的視頻信息,將其直接經(jīng)網(wǎng)絡(luò)發(fā)送給管理平臺5,并發(fā)送主板電源控制信號給服務(wù)器主板3,從而起到監(jiān)視服務(wù)器運行的作用。當(dāng)arm處理器1復(fù)位并啟動完畢后,再將控制權(quán)轉(zhuǎn)交給arm處理器1。
協(xié)處理控制子模塊23接收到arm處理器1失效信息后,還根據(jù)其內(nèi)部配置策略判斷警報級別,實現(xiàn)警報功能,供管理員及時發(fā)現(xiàn)故障。協(xié)處理控制子模塊23配置有:
警報接收單元:接收看門口模塊發(fā)出的arm處理器1失效信息;
警報判斷單元:根據(jù)arm處理器1失效信息判斷警報級別;
警報發(fā)送單元:將警報信息以報文形式發(fā)出。
協(xié)處理控制子模塊23根據(jù)失效間隔時間判斷警報級別,并決定是否關(guān)閉服務(wù)器。
當(dāng)失效間隔小于最短間隔預(yù)設(shè)閾值(可設(shè)置為1小時),則發(fā)出三級警報,并關(guān)閉服務(wù)器;當(dāng)失效間隔小于中間間隔預(yù)設(shè)閾值(可設(shè)置為12小時),則發(fā)出二級警報;當(dāng)失效間隔小于最長間隔預(yù)設(shè)閾值(可設(shè)置為24小時),則發(fā)出三級警報。
警報發(fā)送單元發(fā)出的警報信息報文包括以下信息:警報類型、目的編號、設(shè)備請求編號、本次arm處理器失效時間、上次arm處理器失效時間、24小時失效次數(shù)、歷史失效次數(shù)、溢出標(biāo)志、ecc校驗數(shù)據(jù)。管理平臺5接收報文信息,可實時監(jiān)控服務(wù)器失效狀態(tài)。
如圖2所示,本實施例提供的bmc芯片智能協(xié)處理方法,具體包括以下步驟:
s1:協(xié)處理模塊2轉(zhuǎn)發(fā)arm處理器1發(fā)出的交互信息和主板控制信號,并判斷arm處理器1是否失效;
s2:若arm處理器1未失效則重復(fù)步驟s1,若arm處理器1失效則協(xié)處理模塊2接管交互信息和主板控制信號,并發(fā)出警報信息,且重啟arm處理器1。
步驟s2中協(xié)處理模塊2接管交互信息是指協(xié)處理模塊2接收主板信息并將其發(fā)出,且發(fā)出主板電源控制信號給服務(wù)器主板3。
步驟s2中發(fā)出警報信息具體包括以下步驟:
s2.1:判斷失效間隔是否小于最短間隔預(yù)設(shè)閾值;
s2.2:若失效間隔小于最短間隔預(yù)設(shè)閾值,則發(fā)出三級警報并關(guān)閉服務(wù)器;否則判斷失效間隔是否小于中級間隔預(yù)設(shè)閾值;
s2.3:若失效間隔小于中級間隔預(yù)設(shè)閾值,則發(fā)出二級警報;否則判斷失效間隔是否小于最長間隔預(yù)設(shè)閾值;
s2.4:若失效間隔小于最長時間預(yù)設(shè)閾值,則發(fā)出一級警報。
以上公開的僅為本發(fā)明的優(yōu)選實施方式,但本發(fā)明并非局限于此,任何本領(lǐng)域的技術(shù)人員能思之的沒有創(chuàng)造性的變化,以及在不脫離本發(fā)明原理前提下所作的若干改進(jìn)和潤飾,都應(yīng)落在本發(fā)明的保護(hù)范圍內(nèi)。