專利名稱:計(jì)算機(jī)系統(tǒng)及計(jì)算機(jī)系統(tǒng)的開機(jī)管理方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種基板管理控制器(Baseboard Management Controller, BMC)技術(shù),尤其涉及一種計(jì)算機(jī)系統(tǒng)及利用遠(yuǎn)程服務(wù)器對(duì)多臺(tái)計(jì)算機(jī)裝置的開機(jī)管理方法。
背景技術(shù):
基板管理控制器(Baseboard Management Controller ;BMC)是智能平臺(tái)管理接口(Intelligent Platform Management Interface ;IPMI)架構(gòu)中的核心處理控制器,其可傳感、監(jiān)控及記錄服務(wù)器中的各種工作情況,并將異常的工作情況進(jìn)行偵測(cè)以執(zhí)行相應(yīng)程序,以及時(shí)排除異常。此外,BMC并具有遠(yuǎn)程管理、系統(tǒng)狀態(tài)偵測(cè)與記錄、數(shù)據(jù)追蹤與系統(tǒng)恢復(fù)等功能,使從業(yè)人員能夠有效管理眾多服務(wù)器,并同時(shí)可以降低維護(hù)成本的期望。有鑒于BMC的功能強(qiáng)大,因此BMC在服務(wù)器管理的地位上越發(fā)重要。BMC在服務(wù)器中的效率及地位逐漸提升的同時(shí),BMC芯片的成本也逐漸偏于昂貴,尤其是具有高計(jì)算效率的BMC芯片更是如此。在云計(jì)算技術(shù)的蓬勃發(fā)展下,許多研究機(jī)構(gòu)及相關(guān)應(yīng)用服務(wù)逐漸將復(fù)雜的計(jì)算及龐大的數(shù)據(jù)庫由本機(jī)逐漸轉(zhuǎn)移到許多服務(wù)器所串聯(lián)而成的云服務(wù)器中,藉以在網(wǎng)絡(luò)聯(lián)通的情況下能夠增加計(jì)算的速度及應(yīng)用服務(wù)的反應(yīng)速度。于現(xiàn)在的云服務(wù)器中,每個(gè)服務(wù)器內(nèi)部亦具有BMC來進(jìn)行監(jiān)控管理。因此,是否可將BMC中的計(jì)算機(jī)制與云計(jì)算機(jī)制相互結(jié)合,讓服務(wù)器能夠利用低成本的BMC芯片亦可達(dá)到高計(jì)算效率,便是研究人員可以研究的重要方向。
發(fā)明內(nèi)容
本發(fā)明提供一種計(jì)算機(jī)系統(tǒng)的開機(jī)管理方法,使得遠(yuǎn)程服務(wù)器可利用云計(jì)算機(jī)制對(duì)計(jì)算機(jī)裝置進(jìn)行開機(jī)管理流程,讓計(jì)算機(jī)裝置采用低計(jì)算效率的基板管理控制器來降低成本。此外,本發(fā)明提供一種計(jì)算機(jī)系統(tǒng),此計(jì)算機(jī)系統(tǒng)中的遠(yuǎn)程服務(wù)器可利用云計(jì)算機(jī)制對(duì)受其管理的計(jì)算機(jī)裝置進(jìn)行開機(jī)管理流程,讓計(jì)算機(jī)裝置可采用低計(jì)算效率的基板管理控制器來降低成本。本發(fā)明提出一種計(jì)算機(jī)系統(tǒng)的開機(jī)管理方法,其適用于計(jì)算機(jī)系統(tǒng)內(nèi)的遠(yuǎn)程服務(wù)器中。計(jì)算機(jī)系統(tǒng)的開機(jī)管理方法包括下列步驟。當(dāng)受遠(yuǎn)程服務(wù)器管理的計(jì)算機(jī)裝置為關(guān)機(jī)狀態(tài)時(shí),便可通過網(wǎng)絡(luò)來發(fā)送一開機(jī)命令到計(jì)算機(jī)裝置,并重置一計(jì)數(shù)器以開始倒數(shù)一超時(shí)時(shí)間。在此超時(shí)時(shí)間倒數(shù)完畢之前,檢驗(yàn)是否通過網(wǎng)絡(luò)接收到計(jì)算機(jī)裝置所發(fā)送的基本輸入輸出系統(tǒng)(Basic Input/Output System ;B10S)啟動(dòng)完畢日志信息。以及,當(dāng)沒有接收到上述BIOS啟動(dòng)完畢日志信息,并且上述超時(shí)時(shí)間已倒數(shù)完畢之后,便通過網(wǎng)絡(luò)發(fā)送一重新開機(jī)命令到上述計(jì)算機(jī)裝置,并再次重置上述計(jì)數(shù)器以使其重新開始倒數(shù)所述的超時(shí)時(shí)間。在本發(fā)明之一實(shí)施例中,上述的開機(jī)管理方法還包括下列步驟。當(dāng)在發(fā)送上述開機(jī)命令時(shí),遠(yuǎn)程服務(wù)器將一重新啟動(dòng)標(biāo)記重置為O。當(dāng)在發(fā)送上述重新開機(jī)命令時(shí),遠(yuǎn)程服務(wù)器便對(duì)上述重新啟動(dòng)標(biāo)記加I。當(dāng)重新啟動(dòng)標(biāo)記等于一預(yù)設(shè)數(shù)值時(shí),遠(yuǎn)程服務(wù)器便停止發(fā)送上述重新開機(jī)命令并停止重置上述計(jì)數(shù)器,且執(zhí)行一警告操作以告知計(jì)算機(jī)系統(tǒng)的維護(hù)人員。在本發(fā)明之一實(shí)施例中,上述的開機(jī)管理方法還包括下列步驟。在上述超時(shí)時(shí)間倒數(shù)完畢,并且檢驗(yàn)是否接收到上述BIOS啟動(dòng)完畢日志信息之前,遠(yuǎn)程服務(wù)器應(yīng)可檢驗(yàn)是否接收到上述計(jì)算機(jī)裝置所發(fā)送的一 BIOS開始執(zhí)行日志信息。在本發(fā)明之一實(shí)施例中,上述的開機(jī)管理方法還包括下列步驟。在上述超時(shí)時(shí)間倒數(shù)完畢,并且檢驗(yàn)是否接收到上述BIOS啟動(dòng)完畢日志信息之前,遠(yuǎn)程服務(wù)器應(yīng)可檢驗(yàn)是否接收到上述計(jì)算機(jī)裝置所發(fā)送的一電源啟動(dòng)日志信息。在本發(fā)明之一實(shí)施例中,上述的計(jì)算機(jī)裝置包括有一基板管理控制器(BaseboardManagement Controller ;BMC),其可接收上述開機(jī)命令以執(zhí)行一開機(jī)操作。并且,BMC亦會(huì)將計(jì)算機(jī)裝置的每一個(gè)運(yùn)行情況皆處理為系統(tǒng)事件日志(System Event Log;SEL),并觸發(fā)一云傳輸事件以及時(shí)將每個(gè)系統(tǒng)事件日志通過網(wǎng)絡(luò)來發(fā)送到遠(yuǎn)程服務(wù)器。此外,上述的系統(tǒng)事件日志應(yīng)可包括上述的BIOS開始執(zhí)行日志信息、BIOS啟動(dòng)完畢日志信息及電源啟動(dòng)日志信息。從另一個(gè)角度而言,本發(fā)明提出一種計(jì)算機(jī)系統(tǒng),其包括有至少一計(jì)算機(jī)裝置及一遠(yuǎn)程服務(wù)器。每個(gè)計(jì)算機(jī)裝置中皆包括有BMC,其可接收開機(jī)命令以執(zhí)行開機(jī)操作,并且將計(jì)算機(jī)裝置上每一運(yùn)行情況皆處理為系統(tǒng)事件日志,并觸發(fā)一云傳輸事件以將上述系統(tǒng)事件日志通過網(wǎng)絡(luò)及時(shí)地發(fā)送到遠(yuǎn)程服務(wù)器。遠(yuǎn)程服務(wù)器包括一計(jì)數(shù)器,其中,當(dāng)所述計(jì)算機(jī)裝置為關(guān)機(jī)狀態(tài)時(shí),遠(yuǎn)程服務(wù)器可通過網(wǎng)絡(luò)發(fā)送開機(jī)命令到計(jì)算機(jī)裝置,并重置計(jì)數(shù)器以開始倒數(shù)一超時(shí)時(shí)間。在上述超時(shí)時(shí)間倒數(shù)完畢之前,遠(yuǎn)程服務(wù)器便會(huì)檢驗(yàn)是否通過網(wǎng)絡(luò)來接收到此計(jì)算機(jī)裝置發(fā)送的一 BIOS啟動(dòng)完畢日志信息。如果在超時(shí)時(shí)間已倒數(shù)完畢后還沒有接收到BIOS啟動(dòng)完畢日志信息的時(shí)候,遠(yuǎn)程服務(wù)器便通過網(wǎng)絡(luò)發(fā)送一重新開機(jī)命令到上述計(jì)算機(jī)裝置,并重置上述計(jì)數(shù)器以使其重新開始倒數(shù)超時(shí)時(shí)間。接續(xù)上述,此計(jì)算機(jī)系統(tǒng)的其余實(shí)施細(xì)節(jié)請(qǐng)參照上述說明,在此不多加贅述?;谏鲜?,本發(fā)明實(shí)施例為了使計(jì)算機(jī)裝置采用低計(jì)算效率的BMC,本發(fā)明實(shí)施例的BMC便會(huì)持續(xù)將計(jì)算機(jī)裝置的系統(tǒng)管理日志通過網(wǎng)絡(luò)來提供給遠(yuǎn)程服務(wù)器,讓BMC的開機(jī)管理機(jī)制皆利用云計(jì)算機(jī)制中的遠(yuǎn)程服務(wù)器進(jìn)行處理,BMC本身不具判斷功能。因此,遠(yuǎn)程服務(wù)器便可在發(fā)送開機(jī)命令后,利用超時(shí)時(shí)間(time-out)的倒數(shù)機(jī)制(或是俗稱的看門狗(watch dog)機(jī)制)來判斷計(jì)算機(jī)裝置的BIOS是否啟動(dòng)完畢,藉以完成對(duì)計(jì)算機(jī)裝置的錯(cuò)誤恢復(fù)開機(jī)(FRB)機(jī)制。為讓本發(fā)明的上述特征和優(yōu)點(diǎn)能更明顯易懂,下文特舉實(shí)施例,并配合附圖作詳細(xì)說明如下。
圖1是根據(jù)本發(fā)明一實(shí)施例所述的計(jì)算機(jī)系統(tǒng)的示意圖。圖2為計(jì)算機(jī)裝置的功能方框圖。圖3為遠(yuǎn)程服務(wù)器的功能方框圖。
圖4是根據(jù)本發(fā)明一實(shí)施例所述的計(jì)算機(jī)系統(tǒng)的開機(jī)管理方法。圖5是根據(jù)本發(fā)明另一實(shí)施例所述的計(jì)算機(jī)系統(tǒng)的開機(jī)管理方法。附圖標(biāo)記:100:計(jì)算機(jī)系統(tǒng)110:計(jì)算機(jī)裝置120:基板管理控制器(BMC)130:網(wǎng)絡(luò)140:遠(yuǎn)程服務(wù)器210:傳感器215:事件接收器220:系統(tǒng)事件日志器230云傳輸模塊240:網(wǎng)卡接口250:消息處理器260:平臺(tái)事件過濾器270:警告處理模塊280:錯(cuò)誤恢復(fù)開機(jī)模塊290:計(jì)數(shù)器S410 S53O:步驟
具體實(shí)施例方式現(xiàn)將詳細(xì)參考本發(fā)明的示范性實(shí)施例,在附圖中說明所述示范性實(shí)施例的實(shí)例。另外,凡可能之處,在附圖及實(shí)施方式中使用相同標(biāo)號(hào)的元件/構(gòu)件/符號(hào)代表相同或類似部分。如圖1所示,圖1是根據(jù)本發(fā)明一實(shí)施例所述的計(jì)算機(jī)系統(tǒng)100的示意圖。計(jì)算機(jī)系統(tǒng)100包括有至少一個(gè)計(jì)算機(jī)裝置110、網(wǎng)絡(luò)130及遠(yuǎn)程服務(wù)器140,并且每個(gè)計(jì)算機(jī)裝置110中亦包括有基板管理控制器(BMC) 120。計(jì)算機(jī)裝置110在此以多臺(tái)服務(wù)器為例,但本發(fā)明并不限制于此。于其他實(shí)施例中,可利用具有BMC 120的個(gè)人計(jì)算機(jī)來作為計(jì)算機(jī)裝置110的實(shí)現(xiàn)方式。因此,符合本實(shí)施例的基板管理控制器120及遠(yuǎn)程服務(wù)器140的功能架構(gòu)則如圖2及圖3所示,圖2及圖3分別為計(jì)算機(jī)裝置110及遠(yuǎn)程服務(wù)器140的功能方框圖。如圖2及圖3所示,為了使計(jì)算機(jī)裝置110可采用低計(jì)算效率的BMC 120,本發(fā)明實(shí)施例的BMC120本身不具備判斷功能,讓BMC的判斷機(jī)制皆利用云計(jì)算機(jī)制中的遠(yuǎn)程服務(wù)器進(jìn)行處理。詳細(xì)說明之,本實(shí)施例的BMC 120與以往BMC的不同之處在于,BMC 120并不包含以往BMC中所擁有的消息處理器(Message Handler) 250、平臺(tái)事件過濾器(Platform EventFilter, PEF) 260、錯(cuò)誤恢復(fù)開機(jī)(Fault Resilient Booting ;FRB)模塊 280,甚到將警告處理模塊270中的復(fù)雜判斷機(jī)制皆轉(zhuǎn)移到遠(yuǎn)程服務(wù)器140中,讓以往BMC 120的判斷機(jī)制皆利用遠(yuǎn)程服務(wù)器140以云計(jì)算機(jī)制的方式來進(jìn)行處理。其中,F(xiàn)RB模塊280中包括有一錯(cuò)誤恢復(fù)計(jì)數(shù)器(也就是,圖3中的計(jì)數(shù)器290),其于下述的開機(jī)管理方法中詳細(xì)描述。
如圖2所示,計(jì)算機(jī)裝置110包括有BMC 120,而BMC 120本身僅保留有多個(gè)傳感器210、事件接收器215、系統(tǒng)事件日志(System Event Log, SEL)器220、云傳輸模塊230及網(wǎng)卡接口 240。不同種類及用途的傳感器210將會(huì)安裝于計(jì)算機(jī)裝置110各處。BMC 120利用傳感器210或與其他接口相連的其他傳感設(shè)備來偵測(cè)計(jì)算機(jī)裝置的運(yùn)行情況,例如微處理器的溫度、風(fēng)扇轉(zhuǎn)速...等,并將這些所有的運(yùn)行情況皆發(fā)送到事件接收器215以整理為系統(tǒng)事件日志(SEL)。系統(tǒng)事件日志器220則是將這些系統(tǒng)事件日志進(jìn)行儲(chǔ)存記錄。接著,BMC 120便在事件接收器215產(chǎn)生系統(tǒng)事件日志后,立即觸發(fā)云傳輸模塊230中的云傳輸事件,以利用云傳輸模塊230及網(wǎng)卡接口 240將系統(tǒng)事件日志通過網(wǎng)絡(luò)130傳遞到圖1之遠(yuǎn)程服務(wù)器140。此外,BMC 120亦可以利用網(wǎng)卡接口 240及云傳輸模塊230來接收并執(zhí)行由圖1的遠(yuǎn)程服務(wù)器140發(fā)送到計(jì)算機(jī)裝置110的程序命令。于其他實(shí)施例中,如果想要更為節(jié)省BMC 120的制作成本,亦可以將系統(tǒng)事件日志器220設(shè)置于圖3的遠(yuǎn)程服務(wù)器140內(nèi),而不是設(shè)置于BMC 120中,使得BMC 120亦不需具備有系統(tǒng)事件日志的儲(chǔ)存功能。請(qǐng)參照?qǐng)D3,遠(yuǎn)程服務(wù)器140的網(wǎng)卡接口 240及云傳輸模塊230可從網(wǎng)絡(luò)130中接收此計(jì)算機(jī)裝置Iio所發(fā)送的系統(tǒng)事件日志,在經(jīng)過BMC種類的判斷流程、并且記錄BMC的來源網(wǎng)址之后,消息處理器250便會(huì)配合平臺(tái)事件過濾器260來分析上述系統(tǒng)事件日志,進(jìn)而判斷計(jì)算機(jī)裝置的運(yùn)行情況是否正常。當(dāng)判斷出系統(tǒng)不正常時(shí)(例如微處理器過熱、風(fēng)扇無正常運(yùn)轉(zhuǎn)等),消息處理器250及平臺(tái)事件過濾器260便會(huì)產(chǎn)生相應(yīng)的程序命令,并通過網(wǎng)卡接口 240及云傳輸模塊230將程序命令傳遞到對(duì)應(yīng)的計(jì)算機(jī)裝置110的BMC 120中。其中,云傳輸模塊230的云傳輸事件是利用軟件進(jìn)行實(shí)現(xiàn),但亦可以利用模塊化方式以硬件來實(shí)現(xiàn),藉以降低開發(fā)成本,因此本發(fā)明并不限制于此。遠(yuǎn)程服務(wù)器140亦可利用警告處理模塊260來進(jìn)行一警告操作,藉以通知維修人員對(duì)該臺(tái)計(jì)算機(jī)裝置110進(jìn)行處理。另一方面,遠(yuǎn)程服務(wù)器140亦可利用錯(cuò)誤恢復(fù)開機(jī)模塊280來進(jìn)行受其管理的計(jì)算機(jī)裝置110的開機(jī)管理/開機(jī)恢復(fù)程序。特別說明的是,以往每個(gè)BMC在進(jìn)行開機(jī)管理程序時(shí),現(xiàn)有技術(shù)是采用BMC當(dāng)中的錯(cuò)誤恢復(fù)開機(jī)(Fault Resilient Booting ;FRB)模塊,通過判斷基本輸入輸出系統(tǒng)(BasicInput/Output System ;B10S)是否在一超時(shí)時(shí)間(time-out)內(nèi)執(zhí)行完畢與否,藉以達(dá)成開機(jī)管理/錯(cuò)誤恢復(fù)開機(jī)機(jī)制。但若將BMC 120的計(jì)算機(jī)制利用云計(jì)算機(jī)制來實(shí)現(xiàn)的同時(shí),BMC120當(dāng)中便不會(huì)具有上述的FRB模塊,因此便無法對(duì)計(jì)算機(jī)裝置110進(jìn)行良好的開機(jī)管理程序。于此,本發(fā)明的精神在于,利用云計(jì)算機(jī)制將每個(gè)計(jì)算機(jī)裝置110中BMC 120的開機(jī)管理/錯(cuò)誤恢復(fù)開機(jī)機(jī)制功能挪到遠(yuǎn)程服務(wù)器140進(jìn)行實(shí)現(xiàn),藉以降低基板管理控制器的運(yùn)行效率,從而減少BMC 120的制作成本。于此,在此提出一實(shí)施例以實(shí)現(xiàn)本發(fā)明的精神。圖4是根據(jù)本發(fā)明一實(shí)施例所述的計(jì)算機(jī)系統(tǒng)100的開機(jī)管理方法,其可適用于計(jì)算機(jī)系統(tǒng)100內(nèi)的遠(yuǎn)程服務(wù)器140。此夕卜,計(jì)算機(jī)裝置110的BMC 120亦需對(duì)應(yīng)此開機(jī)管理方法而進(jìn)行相應(yīng)的適合設(shè)計(jì)。 請(qǐng)以圖4配合圖1及圖3來說明,在計(jì)算機(jī)系統(tǒng)100的開機(jī)管理方法中,計(jì)數(shù)器290當(dāng)中已預(yù)設(shè)有一超時(shí)時(shí)間(time-out)。若遠(yuǎn)程服務(wù)器140在所有受其管理的計(jì)算機(jī)裝置110的系統(tǒng)事件日志中得知其中一個(gè)計(jì)算機(jī)裝置110為關(guān)機(jī)狀態(tài),而此計(jì)算機(jī)裝置110應(yīng)該為開機(jī)狀態(tài)時(shí);或是,如果想要將已知以關(guān)機(jī)的計(jì)算機(jī)裝置110開啟時(shí),便進(jìn)入步驟S410,遠(yuǎn)程服務(wù)器140通過其云傳輸模塊230及網(wǎng)卡接口 240以通過網(wǎng)絡(luò)130來發(fā)送一開機(jī)命令到計(jì)算機(jī)裝置110。并且,于本實(shí)施例的步驟S410中,錯(cuò)誤恢復(fù)開機(jī)模塊280中的計(jì)數(shù)器290將會(huì)被重置,并開始將預(yù)先設(shè)定的超時(shí)時(shí)間進(jìn)行倒數(shù)。此外,錯(cuò)誤恢復(fù)開機(jī)模塊280也會(huì)同時(shí)將一重新啟動(dòng)標(biāo)記Frst重置為O。于其他實(shí)施例中,計(jì)數(shù)器290亦可通過看門狗計(jì)數(shù)器(WatchDog Timer)作為其實(shí)現(xiàn)方式,在此不再贅述。于步驟S420中,遠(yuǎn)程服務(wù)器140的錯(cuò)誤恢復(fù)開機(jī)模塊280便會(huì)持續(xù)判斷超時(shí)時(shí)間是否倒數(shù)完畢。在超時(shí)時(shí)間倒數(shù)完畢之前,遠(yuǎn)程服務(wù)器140將會(huì)持續(xù)檢驗(yàn)是否通過網(wǎng)絡(luò)130來接收到計(jì)算機(jī)裝置110所發(fā)送的基本輸入輸出系統(tǒng)(BIOS)啟動(dòng)完畢日志信息(步驟S430)。于本實(shí)施例中,在此所指的BIOS啟動(dòng)完畢日志信息為系統(tǒng)事件日志(SEL)的一種,是在計(jì)算機(jī)裝置110中的BIOS將其電源啟動(dòng)自我測(cè)試(Power-On Self-Test ;P0ST)程序執(zhí)行完成時(shí)將會(huì)產(chǎn)生的系統(tǒng)事件日志。正常而言,遠(yuǎn)程服務(wù)器140如果在超時(shí)時(shí)間倒數(shù)完畢之前收到上述BIOS啟動(dòng)完畢日志信息,便表示計(jì)算機(jī)裝置110已開機(jī)完畢,因此便進(jìn)入步驟S440,遠(yuǎn)程服務(wù)器140便會(huì)在計(jì)算機(jī)裝置110的狀態(tài)中標(biāo)記其為開機(jī)狀態(tài)。然而,不幸地,如果并沒有接收到計(jì)算機(jī)裝置110的BIOS啟動(dòng)完畢日志信息,而步驟S420中的超時(shí)時(shí)間已倒數(shù)完畢后,便由步驟S420進(jìn)入步驟S450,錯(cuò)誤恢復(fù)開機(jī)模塊280先行檢驗(yàn)其重新啟動(dòng)標(biāo)記Frst是否超過一預(yù)定數(shù)值的重新啟動(dòng)次數(shù),使遠(yuǎn)程服務(wù)器140不必一直對(duì)該計(jì)算機(jī)裝置110持續(xù)不斷地進(jìn)行重新開機(jī)動(dòng)作。于本實(shí)施例中,上述的預(yù)定數(shù)值可為5,但不限制于此。如果重新啟動(dòng)標(biāo)記Frst并沒有等于或是超過上述的預(yù)定數(shù)值,便由步驟S450進(jìn)入步驟S460,遠(yuǎn)程服務(wù)器140通過網(wǎng)絡(luò)130發(fā)送一重新開機(jī)命令、或是再次發(fā)送一開機(jī)命令到對(duì)應(yīng)的計(jì)算機(jī)裝置110,錯(cuò)誤恢復(fù)開機(jī)模塊280亦再次將計(jì)數(shù)器290進(jìn)行重置,以使其回到步驟S420,并且重新開始倒數(shù)該超時(shí)時(shí)間。此外,錯(cuò)誤恢復(fù)開機(jī)模塊280于此同時(shí)并且對(duì)重新啟動(dòng)標(biāo)記Frst加1,藉以計(jì)數(shù)遠(yuǎn)程服務(wù)器140對(duì)該計(jì)算機(jī)裝置110進(jìn)行重新開機(jī)動(dòng)作的次數(shù)。相對(duì)地,如果重新啟動(dòng)標(biāo)記Frst已等于或是超過上述的預(yù)定數(shù)值時(shí),表示已對(duì)該計(jì)算機(jī)裝置110進(jìn)行重新開機(jī)的次數(shù)已達(dá)到預(yù)定的次數(shù)。因此,便從步驟S450進(jìn)入步驟S470,遠(yuǎn)程服務(wù)器140便停止發(fā)送上述的重新開機(jī)命令,錯(cuò)誤恢復(fù)開機(jī)模塊280于此同時(shí)亦停止重置計(jì)數(shù)器290。并且,在步驟S470中,遠(yuǎn)程服務(wù)器140便會(huì)利用警告處理模塊270來執(zhí)行一警告操作,以對(duì)計(jì)算機(jī)系統(tǒng)100的維護(hù)人員自動(dòng)告知此項(xiàng)信息,并請(qǐng)求維護(hù)人員的協(xié)助。上述警告操作可以是:發(fā)送特定的警告信息于遠(yuǎn)程服務(wù)器140的屏幕上、發(fā)送特定的警告封包到特定服務(wù)器或發(fā)出特定的警告聲響等,本發(fā)明應(yīng)不能受限于上述舉例中。綜上所述,在每個(gè)計(jì)算機(jī)裝置110中的BMC 120均將其開機(jī)管理/錯(cuò)誤恢復(fù)開機(jī)機(jī)制的相關(guān)模塊刪除時(shí),本發(fā)明實(shí)施例的遠(yuǎn)程服務(wù)器140可通過其中的錯(cuò)誤恢復(fù)開機(jī)模塊280來對(duì)每臺(tái)計(jì)算機(jī)裝置110達(dá)到以往BMC同樣的效果。與以往的計(jì)算機(jī)系統(tǒng)相較,本發(fā)明實(shí)施例還可利用低計(jì)算效率的BMC來達(dá)成原本高計(jì)算效率的BMC的相關(guān)機(jī)制,因此可以更為降低每個(gè)計(jì)算機(jī)裝置110的架設(shè)成本。在此特別說明的是,只要錯(cuò)誤恢復(fù)開機(jī)模塊280中的計(jì)數(shù)器290具有足夠的數(shù)量,遠(yuǎn)程服務(wù)器140便可同時(shí)對(duì)多臺(tái)受其管理的計(jì)算機(jī)裝置110同時(shí)進(jìn)行上述的開機(jī)管理方法/錯(cuò)誤恢復(fù)開機(jī)機(jī)制。圖5是根據(jù)本發(fā)明另一實(shí)施例所述的計(jì)算機(jī)系統(tǒng)100的開機(jī)管理方法。本實(shí)施例與上述圖4中所顯示的開機(jī)管理方法相類似,其相同或類似的描述在此不再贅述。本實(shí)施例與圖4的實(shí)施例的不同處在于,由于以往的BMC在其開機(jī)管理方法/錯(cuò)誤恢復(fù)開機(jī)機(jī)制中,除了判斷BIOS啟動(dòng)完畢日志信息以外,亦需對(duì)其他與錯(cuò)誤恢復(fù)開機(jī)機(jī)制有關(guān)的系統(tǒng)事件信息進(jìn)行判斷,例如:計(jì)算機(jī)裝置110的電源啟動(dòng)日志信息(于計(jì)算機(jī)裝置110通電時(shí)產(chǎn)生的系統(tǒng)事件日志)、及BIOS開始執(zhí)行日志信息(于計(jì)算機(jī)裝置110中BIOS開始執(zhí)行時(shí)時(shí)產(chǎn)生的系統(tǒng)事件日志)。因此,于圖5的步驟S530中,在超時(shí)時(shí)間倒數(shù)完畢之前,遠(yuǎn)程服務(wù)器140將會(huì)持續(xù)檢驗(yàn)是否通過網(wǎng)絡(luò)130依次接收到計(jì)算機(jī)裝置110所發(fā)送的電源啟動(dòng)日志信息(亦即,先行檢驗(yàn)計(jì)算機(jī)裝置110是否通電),然后繼續(xù)檢驗(yàn)是否接收BIOS開始執(zhí)行日志信息(亦即,檢驗(yàn)計(jì)算機(jī)裝置110的BIOS是否開始執(zhí)行),最后才檢驗(yàn)是否接收上述的BIOS啟動(dòng)完畢日志信息(亦即,檢驗(yàn)計(jì)算機(jī)裝置110的BIOS是否執(zhí)行完畢)。若有依據(jù)上述的順序來接收到這些系統(tǒng)事件日志,那么便進(jìn)入步驟S440以認(rèn)定計(jì)算機(jī)裝置110已開機(jī)完成。相對(duì)地,如果沒有依據(jù)上述順序接收到這些系統(tǒng)事件日志,表示計(jì)算機(jī)裝置110在其開機(jī)程序中有產(chǎn)生錯(cuò)誤,因此便進(jìn)入步驟S450 S470以繼續(xù)進(jìn)行錯(cuò)誤恢復(fù)開機(jī)機(jī)制。綜合上述,本發(fā)明實(shí)施例為了使計(jì)算機(jī)裝置可采用低計(jì)算效率的BMC,本發(fā)明實(shí)施例的BMC便會(huì)持續(xù)將計(jì)算機(jī)裝置的系統(tǒng)管理日志通過網(wǎng)絡(luò)來提供給遠(yuǎn)程服務(wù)器,讓BMC的開機(jī)管理機(jī)制皆利用云計(jì)算機(jī)制中的遠(yuǎn)程服務(wù)器進(jìn)行處理,BMC本身不具判斷功能。因此,遠(yuǎn)程服務(wù)器便可在發(fā)送開機(jī)命令后,利用超時(shí)時(shí)間(time-out)的倒數(shù)機(jī)制(或是俗稱的看門狗(watch dog)機(jī)制)來判斷計(jì)算機(jī)裝置的BIOS是否啟動(dòng)完畢,藉以完成對(duì)計(jì)算機(jī)裝置的開機(jī)管理機(jī)制(或稱為,錯(cuò)誤恢復(fù)開機(jī)(FRB)機(jī)制)。雖然本發(fā)明已以實(shí)施例揭示如上,然其并非用以限定本發(fā)明,任何所屬技術(shù)領(lǐng)域中普通技術(shù)人員,當(dāng)可作些許更動(dòng)與潤(rùn)飾,而不脫離本發(fā)明的精神和范圍。
權(quán)利要求
1.一種計(jì)算機(jī)系統(tǒng)的開機(jī)管理方法,適用于一遠(yuǎn)程服務(wù)器,該計(jì)算機(jī)系統(tǒng)的開機(jī)管理方法包括: 當(dāng)受遠(yuǎn)程服務(wù)器管理的一計(jì)算機(jī)裝置為一關(guān)機(jī)狀態(tài)時(shí),通過一網(wǎng)絡(luò)發(fā)送一開機(jī)命令到該計(jì)算機(jī)裝置,并重置該遠(yuǎn)程服務(wù)器中的一計(jì)數(shù)器以開始倒數(shù)一超時(shí)時(shí)間; 在該超時(shí)時(shí)間倒數(shù)完畢之前,檢驗(yàn)是否通過該網(wǎng)絡(luò)接收到該計(jì)算機(jī)裝置發(fā)送的一 BIOS啟動(dòng)完畢日志信息;以及 當(dāng)沒有接收到該BIOS啟動(dòng)完畢日志信息,且該超時(shí)時(shí)間已倒數(shù)完畢后,通過該網(wǎng)絡(luò)發(fā)送一重新開機(jī)命令到該計(jì)算機(jī)裝置,并重置該計(jì)數(shù)器以使其重新開始倒數(shù)該超時(shí)時(shí)間。
2.根據(jù)權(quán)利要求1所述的計(jì)算機(jī)系統(tǒng)的開機(jī)管理方法,其中還包括: 當(dāng)在發(fā)送該開機(jī)命令時(shí),重置一重新啟動(dòng)標(biāo)記為O ; 當(dāng)在發(fā)送該重新開機(jī)命令時(shí),對(duì)該重新啟動(dòng)標(biāo)記加I;以及 當(dāng)該重新啟動(dòng)標(biāo)記等于一預(yù)設(shè)數(shù)值時(shí),停止發(fā)送該重新開機(jī)命令并停止重置該計(jì)數(shù)器,且執(zhí)行一警告操作。
3.根據(jù)權(quán)利要求1所述的計(jì)算機(jī)系統(tǒng)的開機(jī)管理方法,其中還包括: 在該超時(shí)時(shí)間倒數(shù)完畢,且檢驗(yàn)是否接收到該BIOS啟動(dòng)完畢日志信息之前,檢驗(yàn)是否接收到該計(jì)算機(jī)裝置發(fā)送的一 BIOS開始執(zhí)行日志信息。
4.根據(jù)權(quán)利要求1所述的計(jì)算機(jī)系統(tǒng)的開機(jī)管理方法,其中還包括: 在該超時(shí)時(shí)間倒數(shù)完畢,且檢驗(yàn)是否接收到該BIOS啟動(dòng)完畢日志信息之前,檢驗(yàn)是否接收到該計(jì)算機(jī)裝置發(fā)送的一電源啟動(dòng)日志信息。
5.根據(jù)權(quán)利要求1所述的計(jì)算機(jī)系統(tǒng)的開機(jī)管理方法,其中該計(jì)算機(jī)裝置包括: 一基板管理控制器,其接收該開機(jī)命令以執(zhí)行一開機(jī)操作,且將該計(jì)算機(jī)裝置的每一運(yùn)行情況處理為至少一系統(tǒng)事件日志,并觸發(fā)一云傳輸事件以將所述系統(tǒng)事件日志通過該網(wǎng)絡(luò)發(fā)送到該遠(yuǎn)程服務(wù)器。
6.根據(jù)權(quán)利要求5所述的計(jì)算機(jī)系統(tǒng)的開機(jī)管理方法,其中該系統(tǒng)事件日志包括一BIOS開始執(zhí)行日志信息及該BIOS啟動(dòng)完畢日志信息。
7.一種計(jì)算機(jī)系統(tǒng),包括: 至少一計(jì)算機(jī)裝置,包括: 一基板管理控制器,其接收一開機(jī)命令以執(zhí)行一開機(jī)操作,且將該計(jì)算機(jī)裝置的每一運(yùn)行情況處理為至少一系統(tǒng)事件日志,并觸發(fā)一云傳輸事件以將所述系統(tǒng)事件日志通過一網(wǎng)絡(luò)發(fā)送到該遠(yuǎn)程服務(wù)器;以及 一遠(yuǎn)程服務(wù)器,其包括一計(jì)數(shù)器,其中,當(dāng)受遠(yuǎn)程服務(wù)器管理的該計(jì)算機(jī)裝置為一關(guān)機(jī)狀態(tài)時(shí),該遠(yuǎn)程服務(wù)器通過該網(wǎng)絡(luò)發(fā)送一開機(jī)命令到該計(jì)算機(jī)裝置,并重置該計(jì)數(shù)器以開始倒數(shù)一超時(shí)時(shí)間;在該超時(shí)時(shí)間倒數(shù)完畢之前,該遠(yuǎn)程服務(wù)器檢驗(yàn)是否通過該網(wǎng)絡(luò)接收到該計(jì)算機(jī)裝置發(fā)送的一 BIOS啟動(dòng)完畢日志信息;當(dāng)沒有接收到該BIOS啟動(dòng)完畢日志信息,且該超時(shí)時(shí)間已倒數(shù)完畢后,該遠(yuǎn)程服務(wù)器通過該網(wǎng)絡(luò)發(fā)送一重新開機(jī)命令到該計(jì)算機(jī)裝置,并重置該計(jì)數(shù)器以使其重新開始倒數(shù)該超時(shí)時(shí)間。
8.根據(jù)權(quán)利要求7所述的計(jì)算機(jī)系統(tǒng),其中該遠(yuǎn)程服務(wù)器在發(fā)送該開機(jī)命令時(shí)還重置一重新啟動(dòng)標(biāo)記為0,且在發(fā)送該重新開機(jī)命令時(shí),該遠(yuǎn)程服務(wù)器還對(duì)該重新啟動(dòng)標(biāo)記加.1,當(dāng)該重新啟動(dòng)標(biāo)記等于一預(yù)設(shè)數(shù)值時(shí),該遠(yuǎn)程服務(wù)器停止發(fā)送該重新開機(jī)命令,停止重置該計(jì)數(shù)器,并執(zhí)行一警告操作。
9.根據(jù)權(quán)利要求8所述的計(jì)算機(jī)系統(tǒng),其中在該超時(shí)時(shí)間倒數(shù)完畢,且檢驗(yàn)是否接收到該BIOS啟動(dòng)完畢日志信息之前,該遠(yuǎn)程服務(wù)器檢驗(yàn)是否接收到該計(jì)算機(jī)裝置發(fā)送的一BIOS開始執(zhí)行日志信息。
10.根據(jù)權(quán)利要求8所述的計(jì)算機(jī)系統(tǒng),其中在該超時(shí)時(shí)間倒數(shù)完畢,且檢驗(yàn)是否接收到該BIOS啟動(dòng)完畢日志信息之前,該遠(yuǎn)程服務(wù)器檢驗(yàn)是否接收到該計(jì)算機(jī)裝置發(fā)送的一電源啟動(dòng)日志信 息。
全文摘要
一種計(jì)算機(jī)系統(tǒng)及計(jì)算機(jī)系統(tǒng)的開機(jī)管理方法,適用于一遠(yuǎn)程服務(wù)器。此開機(jī)管理方法包括下列步驟。當(dāng)受遠(yuǎn)程服務(wù)器管理的計(jì)算機(jī)裝置為關(guān)機(jī)狀態(tài)時(shí),便通過網(wǎng)絡(luò)發(fā)送一開機(jī)命令到所述計(jì)算機(jī)裝置,并重置計(jì)數(shù)器以開始倒數(shù)一超時(shí)時(shí)間。當(dāng)沒有接收到BIOS啟動(dòng)完畢日志信息,并且上述超時(shí)時(shí)間已倒數(shù)完畢后,便通過網(wǎng)絡(luò)發(fā)送重新開機(jī)命令到計(jì)算機(jī)裝置,并再次重置計(jì)數(shù)器,以重新檢驗(yàn)所述計(jì)算機(jī)裝置是否開機(jī)完成。因此,遠(yuǎn)程服務(wù)器可利用云計(jì)算機(jī)制對(duì)計(jì)算機(jī)裝置進(jìn)行開機(jī)管理,使得計(jì)算機(jī)裝置可采用低計(jì)算效率的基板管理控制器來降低成本。
文檔編號(hào)H04L29/08GK103178977SQ201110434798
公開日2013年6月26日 申請(qǐng)日期2011年12月22日 優(yōu)先權(quán)日2011年12月22日
發(fā)明者陳宗楠 申請(qǐng)人:英業(yè)達(dá)股份有限公司