本發(fā)明屬于服務器設計技術領域,具體涉及一種服務器上電故障監(jiān)控系統(tǒng)及方法。
背景技術:
在服務器設計中多使用復雜可編程邏輯器件cpld連接各個電源的使能管腳en和powergood管腳,使能管腳en發(fā)出使能信號令芯片上電,當上電完成后powergood管腳發(fā)出信號指示,當cpld檢測到電源a的powergood信號后,按照預設時間進行延時,延時時間到達后向電源b發(fā)送en信號。
一般情況下,電源模塊在收到en信號后會在一定時間內完成上電并發(fā)出powergood信號,若電源模塊出現故障無法上電,會導致powergood信號不能發(fā)出,后續(xù)上電過程不能完成,當服務器出現此類故障時,工程師一般需要測量各個電源信號,確定是哪個電源模塊出現故障,這種方式有操作復雜、效率低等缺點。此為現有技術的不足之處。
技術實現要素:
本發(fā)明的目的在于,針對上述現有技術存在的缺陷,提供設計一種服務器上電故障監(jiān)控系統(tǒng)及方法,以解決上述技術問題。
為了達到上述目的,本發(fā)明的技術方案是:
一種服務器上電故障監(jiān)控系統(tǒng),其特征在于,包括管理控制器、檢測單元和受控終端;
管理控制器經檢測單元與受控終端連接;
檢測單元為受控終端分配序號,檢測受控終端的上電故障;
管理控制器設有調試串口;
該監(jiān)控系統(tǒng)還包括上位機,管理控制器通過調試串口與上位機連接。
受控終端數量為若干個,每個受控終端均連接到檢測單元。
檢測單元分別連接各受控終端的使能管腳en和powergood管腳。
受控終端為電源模塊。
檢測單元包括可編程邏輯器件cpld,所述cpld內設置計數器。一種服務器上電故障監(jiān)控方法,其特征在于,包括以下步驟:
步驟1:初始化檢測單元,為每個受控終端分配序號,設置計數時間閾值;
步驟2:檢測單元發(fā)出上電使能信號,同時計數器開始計時;
步驟3:若計時時間到達設定閾值之前,檢測單元收到了受控終端的反饋信號,則計數器清零并停止計時,表示該受控終端能正常;若計時時間到達設定閾值,檢測單元未收到受控終端發(fā)送的反饋信號,則判斷該受控終端出現故障,并向管理控制器發(fā)送錯誤信息;
步驟4:管理控制器將接收到的錯誤信息發(fā)送到上位機,查看串口發(fā)送的消息,從而快速定位故障所在。
受控終端的反饋信號為上電完成后powergood管腳發(fā)出的信號指示。
錯誤信息內容包括故障受控終端的序號。
本發(fā)明的有益效果在于,當服務器電源出現故障時,能夠快速定位故障電源并通過串口通知調試人員,避免的復雜的人工測試過程。
此外,本發(fā)明設計原理可靠,結構簡單,具有非常廣泛的應用前景。
由此可見,本發(fā)明與現有技術相比,具有突出的實質性特點和顯著地進步,其實施的有益效果也是顯而易見的。
附圖說明
圖1為一種服務器上電故障監(jiān)控系統(tǒng)的系統(tǒng)框圖。
圖2為一種服務器上電故障監(jiān)控方法的流程圖。
其中,1-管理控制器,2-檢測單元,3-受控終端,4-上位機。
具體實施方式
下面結合附圖并通過具體實施例對本發(fā)明進行詳細闡述,以下實施例是對本發(fā)明的解釋,而本發(fā)明并不局限于以下實施方式。
如圖1所示,本實施例提供的一種服務器上電故障監(jiān)控系統(tǒng),包括管理控制器1、檢測單元2和受控終端3;管理控制器1經檢測單元2與受控終端3連接;檢測單元2為受控終端3分配序號,檢測受控終端3的上電故障;管理控制器1設有調試串口;該監(jiān)控系統(tǒng)還包括上位機4,管理控制器1通過調試串口與上位機4連接。
受控終端3數量為若干個,每個受控終端均連接到檢測單元。
檢測單元2分別連接各受控終端3的使能管腳en和powergood管腳。
受控終端為電源模塊。
檢測單元2包括可編程邏輯器件cpld,所述cpld內設置計數器。如圖2所示,本實施例提供的一種服務器上電故障監(jiān)控方法,包括
以下步驟:
步驟1:初始化檢測單元,為每個受控終端分配序號,設置計數時間閾值;
步驟2:檢測單元發(fā)出上電使能信號,同時計數器開始計時;
步驟3:若計時時間到達設定閾值之前,檢測單元收到了受控終端的反饋信號,則計數器清零并停止計時,表示該受控終端能正常;若計時時間到達設定閾值,檢測單元未收到受控終端發(fā)送的反饋信號,則判斷該受控終端出現故障,并向管理控制器發(fā)送錯誤信息;
步驟4:管理控制器將接收到的錯誤信息發(fā)送到上位機,查看串口發(fā)送的消息,快速定位故障所在。
步驟3中所述的受控終端的反饋信號為上電完成后powergood管腳發(fā)出的信號指示。
錯誤信息內容包括故障受控終端的序號。
受控終端一般指服務器上的各個電源模塊,cpld提前為各個受控終端分配序號,以便于調試人員識別。
cpld內設置計數器,當cpld發(fā)出控制信號時,計數器開始計時;若計時時間到達設定閾值之前,cpld收到了受控終端的反饋信號(一般指示上電完成),則計數器清零并停止計時,表示該受控終端能正常;若計時時間到達設定閾值,受控終端依然未向cpld發(fā)送反饋信號,則判斷該受控終端出現故障,cpld向管理控制器發(fā)送該受控終端的序號。
管理控制器設有調試串口,并通過調試串口發(fā)送故障受控終端的序號。調試人員可以通過上位機連接該串口,查看串口發(fā)送的消息,從而快速定位故障所在。
以上公開的僅為本發(fā)明的優(yōu)選實施方式,但本發(fā)明并非局限于此,任何本領域的技術人員能思之的沒有創(chuàng)造性的變化,以及在不脫離本發(fā)明原理前提下所作的若干改進和潤飾,都應落在本發(fā)明的保護范圍內。