亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種高端容錯計算機管理系統(tǒng)及方法

文檔序號:6551875閱讀:250來源:國知局
一種高端容錯計算機管理系統(tǒng)及方法
【專利摘要】本發(fā)明公開了一種高端容錯計算機管理系統(tǒng)及方法,涉及計算機領(lǐng)域。本發(fā)明公開了一種高端容錯計算機管理系統(tǒng),包括系統(tǒng)電源、風(fēng)扇、交換機、多個計算節(jié)點以及系統(tǒng)管理控制器(SMC),其中:SMC,通過交換機接收各個計算節(jié)點上報的采集信息,當(dāng)上報的采集信息滿足預(yù)先設(shè)定的計算節(jié)點管理策略,則通過交換機向該計算節(jié)點發(fā)送對應(yīng)的管理操作指令,以及當(dāng)上報的采集信息滿足預(yù)先設(shè)定的系統(tǒng)供電、溫度管理策略,則對系統(tǒng)電源和/或風(fēng)扇進行對應(yīng)的管理操作。本發(fā)明還公開了一種高端容錯計算機管理方法。本發(fā)明技術(shù)方案充分發(fā)揮每一個層級在管理中的作用,并在這種管理架構(gòu)下實現(xiàn)集中供電、集中散熱、集中管理。
【專利說明】一種高端容錯計算機管理系統(tǒng)及方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及計算機領(lǐng)域,具體地說是一種高端服務(wù)器系統(tǒng)管理方案。
【背景技術(shù)】
[0002]目前,高端容錯計算機以強大的即時計算能力和高可靠等RAS特性被廣泛應(yīng)用于高性能計算、銀行等關(guān)鍵領(lǐng)域。高端服務(wù)器系統(tǒng)復(fù)雜,一般包括計算節(jié)點、互連節(jié)點、IO擴展節(jié)點、存儲節(jié)點等多種節(jié)點形態(tài)。如何對整個系統(tǒng)進行有效的管理,以及如何提高系統(tǒng)的供電和散熱的效率,是高端服務(wù)器面臨的一大技術(shù)難題。傳統(tǒng)服務(wù)器一般米用BMC (BaseboardManagement Controller,基板管理控制器)管理方案,所有管理功能集中于BMC,如系統(tǒng)電源、風(fēng)扇、溫度等的監(jiān)控。當(dāng)BMC出現(xiàn)故障時整個管理功能就意味著失效;同時傳統(tǒng)服務(wù)器的供電和散熱都是各自負(fù)責(zé)各自的部分,沒有一個統(tǒng)一調(diào)度的機制,使得供電和散熱資源不能充分利用。

【發(fā)明內(nèi)容】

[0003]本發(fā)明所要解決的技術(shù)問題是,提供一種高端容錯計算機管理系統(tǒng)及方法,解決高端服務(wù)器系統(tǒng)管理復(fù)雜的問題。
[0004]為了解決上述技術(shù)問題,本發(fā)明公開了一種高端容錯計算機管理系統(tǒng),包括系統(tǒng)電源和風(fēng)扇,還包括交換機、多個計算節(jié)點以及與所有的系統(tǒng)電源和風(fēng)扇均相連的系統(tǒng)管理控制器(SMC),其中:
[0005]所述SMC,通過所述交換機接收各個計算節(jié)點上報的采集信息,當(dāng)計算節(jié)點上報的采集信息滿足預(yù)先設(shè)定的計算節(jié)點管理策略,則通過所述交換機向該計算節(jié)點發(fā)送對應(yīng)的管理操作指令,以及當(dāng)計算節(jié)點上報的采集信息滿足預(yù)先設(shè)定的系統(tǒng)供電、溫度管理策略,則對所述系統(tǒng)電源和/或風(fēng)扇進行對應(yīng)的管理操作;
[0006]所述計算節(jié)點,通過交換機上報本計算節(jié)點的采集信息到所述SMC,以及在收到交換機發(fā)送的管理操作指令時,按照該指令對本計算節(jié)點進行對應(yīng)的管理操作。
[0007]可選地,上述系統(tǒng)中,所述計算節(jié)點包括基板管理控制器(BMC)和復(fù)雜可編程邏輯器件(CPLD),其中:
[0008]所述BMC,獲取本計算節(jié)點的采集信息,并通過所述交換機接上報給所述SMC,以及通過所述交換機接收管理操作指令,將該管理操作指令下發(fā)給所述CPLD ;
[0009]所述CPLD,根據(jù)所述BMC下發(fā)的管理操作指令對本計算節(jié)點進行對應(yīng)的管理操作。
[0010]可選地,上述系統(tǒng)中,述計算節(jié)點上報的采集信息至少包括如下一種或幾種:
[0011]計算節(jié)點內(nèi)的溫度、計算節(jié)點內(nèi)的電壓、關(guān)鍵寄存儲器信息。
[0012]可選地,上述系統(tǒng)中,所述計算節(jié)點的管理操作包括計算節(jié)點的開機、關(guān)機、復(fù)位操作。
[0013]可選地,上述系統(tǒng)中,所述系統(tǒng)電源的管理操作包括:增加系統(tǒng)電源數(shù)目、減少系統(tǒng)電源數(shù)目、讀取系統(tǒng)電源的功耗、輸出電壓、電流、溫度。
[0014]可選地,上述系統(tǒng)中,所述系統(tǒng)風(fēng)扇的管理操作包括:提高風(fēng)扇轉(zhuǎn)速、降低風(fēng)扇轉(zhuǎn)速。
[0015]可選地,上述系統(tǒng)中,所述SMC包括兩個SMC芯片,所述兩個SMC芯片均與所述交換機相連,所述兩個SMC芯片均與所有系統(tǒng)電源和風(fēng)扇相連,兩個SMC芯片之間通過冗余的互連總線連接;
[0016]所述兩個SMC芯片之中,一個SMC芯片為主SMC,處于正常工作模式,另一個SMC芯片為從SMC,處于待命模式,其中:
[0017]所述從SMC通過心跳實時檢測主SMC的狀態(tài),若檢測到所述主SMC發(fā)生故障,則所述從SMC激活為正常工作模式以替換主SMC。
[0018]本發(fā)明還公開了一種高端容錯計算機管理方法,包括:
[0019]如上述所述的高端容錯計算機管理系統(tǒng)中系統(tǒng)管理控制器(SMC),通過所述交換機接收各個計算節(jié)點上報的采集信息,當(dāng)計算節(jié)點上報的采集信息滿足預(yù)先設(shè)定的計算節(jié)點管理策略時,所述SMC通過所述交換機向該計算節(jié)點發(fā)送對應(yīng)的管理操作指令,該計算節(jié)點按照收到的管理操作指令對本計算節(jié)點進行對應(yīng)的管理操作;
[0020]當(dāng)計算節(jié)點上報的采集信息滿足預(yù)先設(shè)定的系統(tǒng)供電、溫度管理策略時,所述SMC對所述系統(tǒng)電源和/或風(fēng)扇進行對應(yīng)的管理操作。
[0021]可選地,上述方法中,所述計算節(jié)點上報的采集信息至少包括如下一種或幾種:
[0022]計算節(jié)點內(nèi)的溫度、計算節(jié)點內(nèi)的電壓、關(guān)鍵寄存儲器信息。
[0023]可選地,上述方法中,所述計算節(jié)點按照收到的管理操作指令對本計算節(jié)點進行對應(yīng)的管理操作指:
[0024]所述計算節(jié)點按照管理操作指令對本計算節(jié)點進行開機、關(guān)機或復(fù)位操作。
[0025]可選地,上述方法中,所述SMC對所述系統(tǒng)電源進行對應(yīng)的管理操作指:
[0026]所述SMC增加系統(tǒng)電源數(shù)目、減少系統(tǒng)電源數(shù)目、讀取系統(tǒng)電源的功耗、輸出電壓、電流、溫度。
[0027]可選地,上述方法中,所述SMC對所述風(fēng)扇進行對應(yīng)的管理操作指:
[0028]所述SMC提高或降低風(fēng)扇轉(zhuǎn)速。
[0029]可選地,上述方法中,所述高端容錯計算機管理系統(tǒng)中采用兩個SMC芯片,其中一個SMC芯片為主SMC,處于正常工作模式,另一個SMC芯片為從SMC,處于待命模式:
[0030]所述從SMC通過心跳實時檢測主SMC的狀態(tài),當(dāng)所述從SMC檢測到所述主SMC發(fā)生故障時,所述從SMC激活為正常工作模式以替換主SMC。
[0031]本申請技術(shù)方案提供一種層次式的高端容錯計算機的管理系統(tǒng),可以充分發(fā)揮每一個層級在管理中的作用,并且優(yōu)選采用多種冗余措施來保證管理的可靠性,同時提出在這種管理架構(gòu)下實現(xiàn)集中供電、集中散熱、集中管理的方法,可以達到系統(tǒng)資源利用最大化,是對現(xiàn)有技術(shù)是一個很大的改進和提升。
【專利附圖】

【附圖說明】
[0032]圖1為本發(fā)明層次式管理系統(tǒng)拓?fù)鋱D?!揪唧w實施方式】
[0033]為使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚明白,下文將結(jié)合附圖對本發(fā)明技術(shù)方案作進一步詳細說明。需要說明的是,在不沖突的情況下,本申請的實施例和實施例中的特征可以任意相互組合。
[0034]實施例1
[0035]本實施例介紹一種高端容錯計算機管理系統(tǒng),其采用自上而下的層次式管理架構(gòu),至少包括:與所有的系統(tǒng)電源和風(fēng)扇均相連的SMC(System Management Control,系統(tǒng)管理控制器)、交換機以及多個計算節(jié)點(也可稱為服務(wù)器節(jié)點);
[0036]SMC,通過交換機接收各個計算節(jié)點上報的采集信息,當(dāng)計算節(jié)點上報的采集信息滿足預(yù)先設(shè)定的計算節(jié)點管理策略,則通過交換機向該計算節(jié)點發(fā)送對應(yīng)的管理操作指令,以及當(dāng)計算節(jié)點上報的采集信息滿足預(yù)先設(shè)定的系統(tǒng)供電、溫度管理策略,則對系統(tǒng)電源和/或風(fēng)扇進行對應(yīng)的管理操作;
[0037]具體地,SMC可通過控制總線監(jiān)控管理系統(tǒng)電源和風(fēng)扇。
[0038]計算節(jié)點,通過交換機上報本計算節(jié)點的采集信息到所述SMC,以及在收到交換機發(fā)送的管理操作指令時,按照該指令對本計算節(jié)點進行對應(yīng)的管理操作。
[0039]需要說明的是,本實施例中的計算節(jié)點包括部署在計算節(jié)點上的BMC和CPLD (Complex Programmable Logic Device,復(fù)雜可編程邏輯器件),CPLD 和 BMC 之間通過SMBUS (System Management Bus,系統(tǒng)管理總線)、GP10 (General Purpose Input Output,通用輸入/輸出)等信號連接,其中:
[0040]BMC,由交換機和SMC通訊,獲取本計算節(jié)點的采集信息,并通過交換機接上報給SMC,以及通過交換機接收管理操作指令,將該管理操作指令下發(fā)給CPLD ;
[0041]具體地,計算節(jié)點上報的采集信息至少包括如下一種或幾種:
[0042]計算節(jié)點內(nèi)的溫度、計算節(jié)點內(nèi)的電壓、關(guān)鍵寄存儲器信息。
[0043]而BMC獲取的采集信息可以是MBC內(nèi)的傳感器直接采集的,例如,BMC內(nèi)部集成ADC(模數(shù)轉(zhuǎn)換)模塊,可以對主板電壓實時采集。也可以是通過系統(tǒng)中其他傳感器而獲取的,例如,可將溫度傳感器連接到BMC,由BMC讀取計算節(jié)點內(nèi)的溫度。在此,本實施例對MBC獲取采集信息的方式不作任何限制。
[0044]而關(guān)鍵寄存儲器信息一般可以認(rèn)為是BMC通過SMBUS連接到的關(guān)鍵芯片(如CPU、PCH等)的信息,此關(guān)鍵寄存儲器信息可由實際應(yīng)用場景或人為需要來確定,在此不做任何限制。
[0045]CPLD,根據(jù)BMC下發(fā)的管理操作指令對本計算節(jié)點進行對應(yīng)的管理操作。
[0046]而CPLD進行的管理操作包括計算節(jié)點的開機、關(guān)機、復(fù)位操作。
[0047]另外,SMC對系統(tǒng)電源的管理操作包括:增加系統(tǒng)電源數(shù)目、減少系統(tǒng)電源數(shù)目、讀取系統(tǒng)電源的功耗、輸出電壓、電流、溫度。
[0048]SMC對系統(tǒng)風(fēng)扇的管理操作包括:提高風(fēng)扇轉(zhuǎn)速、降低風(fēng)扇轉(zhuǎn)速。
[0049]以SMC對風(fēng)扇的管理控制舉例來說,在SMC內(nèi)部預(yù)先設(shè)定的系統(tǒng)供電、溫度管理策略中有一個根據(jù)溫度升高提高風(fēng)扇轉(zhuǎn)速的策略,這樣,當(dāng)BMC上報計算節(jié)點內(nèi)的溫度信息反饋給SMC時,SMC會根據(jù)溫度結(jié)果提高或降低風(fēng)扇轉(zhuǎn)速。
[0050]還要說明的是,客戶端主機通過管理網(wǎng)絡(luò)連接到SMC上進行訪問。即用戶可以通過登入SMC的管理界面(Web頁面)去手動查看系統(tǒng)電源信息、控制風(fēng)扇轉(zhuǎn)速等。
[0051]優(yōu)化地,上述管理系統(tǒng)還可以采用多重冗余機制:
[0052]首先采用冗余機制是,采用兩個SMC,兩個SMC以主、從工作模式設(shè)計,此時,整個系統(tǒng)架構(gòu)如圖1所示,平時只有主SMC(即SMC0)工作,從SMC(即SMC1)作為待命狀態(tài)。兩個SMC之間通過兩組以上的冗余心跳總線進行狀態(tài)監(jiān)聽和數(shù)據(jù)同步。具體地,心跳總線可采用SMMBUS、RS232或其他總線形式,心跳機制每隔一個固定周期監(jiān)聽主SMCO是否正常,并將從SMCl的數(shù)據(jù)與主SMCO同步,如果發(fā)現(xiàn)主SMCO出現(xiàn)故障,心跳機制將管理功能切換到從SMCl上。兩個SMC還通過PMBUS負(fù)責(zé)監(jiān)控服務(wù)器系統(tǒng)的電源的電壓、電流、功耗和溫度情況,以及監(jiān)控及調(diào)整系統(tǒng)風(fēng)扇轉(zhuǎn)速等。
[0053]其次,采用冗余的管理網(wǎng)絡(luò),即BMC的兩個網(wǎng)絡(luò)接口分別連接到兩個交換機,兩套網(wǎng)絡(luò)可以互為冗余備份。
[0054]此時,交換機負(fù)責(zé)連接兩個SMC和所有BMC之間的通訊,所有符合IPMI的命名都通過交換機傳輸。交換機O和交換機I的下行接口分別連接到BMC的兩個管理網(wǎng)卡,上行接口分別連接到SMCO和SMCl。
[0055]實施例2
[0056]本實施例提供一種聞端容錯計算機管理方法,其可依賴上述實施例1提供的聞端容錯計算機管理系統(tǒng)來實現(xiàn)。該方法包括如下操作:
[0057]高端容錯計算機管理系統(tǒng)中系統(tǒng)管理控制器(SMC),通過所述交換機接收各個計算節(jié)點上報的采集信息,當(dāng)計算節(jié)點上報的采集信息滿足預(yù)先設(shè)定的計算節(jié)點管理策略時,所述SMC通過所述交換機向該計算節(jié)點發(fā)送對應(yīng)的管理操作指令,該計算節(jié)點按照收到的管理操作指令對本計算節(jié)點進行對應(yīng)的管理操作;
[0058]當(dāng)計算節(jié)點上報的采集信息滿足預(yù)先設(shè)定的系統(tǒng)供電、溫度管理策略時,所述SMC對所述系統(tǒng)電源和/或風(fēng)扇進行對應(yīng)的管理操作。
[0059]其中,計算節(jié)點上報的采集信息至少包括如下一種或幾種:
[0060]計算節(jié)點內(nèi)的溫度、計算節(jié)點內(nèi)的電壓、關(guān)鍵寄存儲器信息。
[0061]而計算節(jié)點按照收到的管理操作指令對本計算節(jié)點進行對應(yīng)的管理操作一般包括對本計算節(jié)點進行開機、關(guān)機和復(fù)位操作。
[0062]SMC對系統(tǒng)電源進行對應(yīng)的管理操作包括增加系統(tǒng)電源數(shù)目、減少系統(tǒng)電源數(shù)目、讀取系統(tǒng)電源的功耗、輸出電壓、電流、溫度。
[0063]SMC對風(fēng)扇進行對應(yīng)的管理操作包括提高和降低風(fēng)扇轉(zhuǎn)速。
[0064]優(yōu)化地,上述管理方法還可以采用多重冗余機制:
[0065]其中,一套冗余機制就是,高端容錯計算機管理系統(tǒng)中采用兩個SMC芯片,其中一個SMC芯片為主SMC,處于正常工作模式,另一個SMC芯片為從SMC,處于待命模式:
[0066]從SMC通過心跳實時檢測主SMC的狀態(tài),當(dāng)從SMC檢測到主SMC發(fā)生故障時,從SMC激活為正常工作模式以替換主SMC。
[0067]另一套冗余機制是,BMC的兩個網(wǎng)絡(luò)接口分別連接到兩個交換機,兩套網(wǎng)絡(luò)可以互為冗余備份。
[0068]具體地,本實施例中,從SMC (即SMC1)通過心跳檢測從SMC (即SMC0)的工作狀態(tài),周期在微秒級或毫秒級,若SMCO反饋信息正常,則SMCl同步其狀態(tài)信息并保持待命模式;若SMCO沒有反應(yīng),SMCl通過心跳總線再次發(fā)出檢測命令,若SMCO仍然沒有反應(yīng),則SMCl進入激活模式,接替SMCO的工作。本實施例中的冗余心跳總線可有效地避免單心跳總線突然失效的問題。
[0069]SMCO通過以太網(wǎng)連接到交換機0,所有計算節(jié)點中BMC的第一個網(wǎng)口也通過以太網(wǎng)連接到交換機0,建立起SMCO與BMC的通訊機制。SMCl通過以太網(wǎng)連接到交換機1,所有計算節(jié)點中BMC的第二個網(wǎng)口也通過以太網(wǎng)連接到交換機1,建立起SMCO與BMC的通訊機制。BMC的兩個網(wǎng)口分別連接到兩個交換機,形成一套冗余的管理網(wǎng)絡(luò)。
[0070]SMCO和SMCl還通過控制總線連接到系統(tǒng)電源和系統(tǒng)風(fēng)扇,由SMC統(tǒng)一對其集中管理和控制,如讀取電源模塊電流、功耗,控制風(fēng)扇轉(zhuǎn)速等。集中供電、集中散熱和集中控制的優(yōu)點是最大化利用資源和降低成本,如集中供電可有效減少電源模塊數(shù)量、降低供電壓降;集中散熱可優(yōu)化風(fēng)道設(shè)計,減少風(fēng)阻。
[0071]從上述實施例可以看出,本申請技術(shù)方案顯著特征是采用自上而下的層次式管理架構(gòu)、且具有多重冗余功能、模塊化分工管理功能,同時在這種管理架構(gòu)下提出一種系統(tǒng)集中供電、集中散熱和集中管理的方案??偨Y(jié)來說,本申請技術(shù)方案具有冗余可靠、執(zhí)行效率高、可以降低系統(tǒng)能耗的優(yōu)點。
[0072]集中供電和散熱:整個服務(wù)器系統(tǒng)將采用集中供電和集中散熱技術(shù),即所有計算節(jié)點(或模塊)的供電都由匯流排或中背板提供,可有效減少PSU(電源供電模塊)數(shù)量和降低供電壓降。所有系統(tǒng)電源由SMC統(tǒng)一管理調(diào)度。集中散熱技術(shù),摒棄傳統(tǒng)服務(wù)器中各模塊獨自散熱的方式,采用風(fēng)扇墻集中散熱技術(shù),有效優(yōu)化風(fēng)道,減少阻力。所有系統(tǒng)風(fēng)扇由SMC統(tǒng)一管理調(diào)度。
[0073]本領(lǐng)域普通技術(shù)人員可以理解上述方法中的全部或部分步驟可通過程序來指令相關(guān)硬件完成,所述程序可以存儲于計算機可讀存儲介質(zhì)中,如只讀存儲器、磁盤或光盤等??蛇x地,上述實施例的全部或部分步驟也可以使用一個或多個集成電路來實現(xiàn)。相應(yīng)地,上述實施例中的各模塊/單元可以采用硬件的形式實現(xiàn),也可以采用軟件功能模塊的形式實現(xiàn)。本申請不限制于任何特定形式的硬件和軟件的結(jié)合。
[0074]以上所述,僅為本發(fā)明的較佳實例而已,并非用于限定本發(fā)明的保護范圍。凡在本發(fā)明的精神和原則之內(nèi),所做的任何修改、等同替換、改進等,均應(yīng)包含在本發(fā)明的保護范圍之內(nèi)。
【權(quán)利要求】
1.一種高端容錯計算機管理系統(tǒng),包括系統(tǒng)電源和風(fēng)扇,其特征在于,還包括交換機、多個計算節(jié)點以及與所有的系統(tǒng)電源和風(fēng)扇均相連的系統(tǒng)管理控制器(SMC),其中: 所述SMC,通過所述交換機接收各個計算節(jié)點上報的采集信息,當(dāng)計算節(jié)點上報的采集信息滿足預(yù)先設(shè)定的計算節(jié)點管理策略,則通過所述交換機向該計算節(jié)點發(fā)送對應(yīng)的管理操作指令,以及當(dāng)計算節(jié)點上報的采集信息滿足預(yù)先設(shè)定的系統(tǒng)供電、溫度管理策略,則對所述系統(tǒng)電源和/或風(fēng)扇進行對應(yīng)的管理操作; 所述計算節(jié)點,通過交換機上報本計算節(jié)點的采集信息到所述SMC,以及在收到交換機發(fā)送的管理操作指令時,按照該指令對本計算節(jié)點進行對應(yīng)的管理操作。
2.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述計算節(jié)點包括基板管理控制器(BMC)和復(fù)雜可編程邏輯器件(CPLD),其中: 所述BMC,獲取本計算節(jié)點的采集信息,并通過所述交換機接上報給所述SMC,以及通過所述交換機接收管理操作指令,將該管理操作指令下發(fā)給所述CPLD ; 所述CPLD,根據(jù)所述BMC下發(fā)的管理操作指令對本計算節(jié)點進行對應(yīng)的管理操作。
3.如權(quán)利要求2所述的系統(tǒng),其特征在于,所述計算節(jié)點上報的采集信息至少包括如下一種或幾種: 計算節(jié)點內(nèi)的溫 度、計算節(jié)點內(nèi)的電壓、關(guān)鍵寄存儲器信息。
4.如權(quán)利要求2所述的系統(tǒng),其特征在于, 所述計算節(jié)點的管理操作包括計算節(jié)點的開機、關(guān)機、復(fù)位操作。
5.如權(quán)利要求1所述的系統(tǒng),其特征在于, 所述系統(tǒng)電源的管理操作包括:增加系統(tǒng)電源數(shù)目、減少系統(tǒng)電源數(shù)目、讀取系統(tǒng)電源的功耗、輸出電壓、電流、溫度。
6.如權(quán)利要求6所述的系統(tǒng),其特征在于, 所述系統(tǒng)風(fēng)扇的管理操作包括:提高風(fēng)扇轉(zhuǎn)速、降低風(fēng)扇轉(zhuǎn)速。
7.如權(quán)利要求1至6任一項所述的系統(tǒng),其特征在于, 所述SMC包括兩個SMC芯片,所述兩個SMC芯片均與所述交換機相連,所述兩個SMC芯片均與所有系統(tǒng)電源和風(fēng)扇相連,兩個SMC芯片之間通過冗余的互連總線連接; 所述兩個SMC芯片之中,一個SMC芯片為主SMC,處于正常工作模式,另一個SMC芯片為從SMC,處于待命模式,其中: 所述從SMC通過心跳實時檢測主SMC的狀態(tài),若檢測到所述主SMC發(fā)生故障,則所述從SMC激活為正常工作模式以替換主SMC。
8.一種高端容錯計算機管理方法,其特征在于,包括: 如上述權(quán)利要求1至7所述的高端容錯計算機管理系統(tǒng)中系統(tǒng)管理控制器(SMC),通過所述交換機接收各個計算節(jié)點上報的采集信息,當(dāng)計算節(jié)點上報的采集信息滿足預(yù)先設(shè)定的計算節(jié)點管理策略時,所述SMC通過所述交換機向該計算節(jié)點發(fā)送對應(yīng)的管理操作指令,該計算節(jié)點按照收到的管理操作指令對本計算節(jié)點進行對應(yīng)的管理操作; 當(dāng)計算節(jié)點上報的采集信息滿足預(yù)先設(shè)定的系統(tǒng)供電、溫度管理策略時,所述SMC對所述系統(tǒng)電源和/或風(fēng)扇進行對應(yīng)的管理操作。
9.如權(quán)利要求8所述的方法,其特征在于,所述計算節(jié)點上報的采集信息至少包括如下一種或幾種:計算節(jié)點內(nèi)的溫度、計算節(jié)點內(nèi)的電壓、關(guān)鍵寄存儲器信息。
10.如權(quán)利要求8所述的方法,其特征在于,所述計算節(jié)點按照收到的管理操作指令對本計算節(jié)點進行對應(yīng)的管理操作指: 所述計算節(jié)點按照管理操作指令對本計算節(jié)點進行開機、關(guān)機或復(fù)位操作。
11.如權(quán)利要求8所述的方法,其特征在于,所述SMC對所述系統(tǒng)電源進行對應(yīng)的管理操作指: 所述SMC增加系統(tǒng)電源數(shù)目、減少系統(tǒng)電源數(shù)目、讀取系統(tǒng)電源的功耗、輸出電壓、電流、溫度。
12.如權(quán)利要求8所述的方法,其特征在于,所述SMC對所述風(fēng)扇進行對應(yīng)的管理操作指: 所述SMC提高或降低風(fēng)扇轉(zhuǎn)速。
13.如權(quán)利要求8至12任一項所述的方法,其特征在于, 所述高端容錯計算機管理系統(tǒng)中采用兩個SMC芯片,其中一個SMC芯片為主SMC,處于正常工作模式,另一個SMC芯片為從SMC,處于待命模式: 所述從SMC通過心跳 實時檢測主SMC的狀態(tài),當(dāng)所述從SMC檢測到所述主SMC發(fā)生故障時,所述從SMC激活為正常工作模式以替換主SMC。
【文檔編號】G06F11/07GK104035831SQ201410309564
【公開日】2014年9月10日 申請日期:2014年7月1日 優(yōu)先權(quán)日:2014年7月1日
【發(fā)明者】貢維, 吳孝磊 申請人:浪潮(北京)電子信息產(chǎn)業(yè)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1