專利名稱:伺服器機柜系統(tǒng)與其操作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種伺服器機柜系統(tǒng),特別是涉及一種具有電池備援單元的伺服器機柜系統(tǒng)。
背景技術(shù):
刀鋒型伺服器已廣泛地應(yīng)用。將為數(shù)眾多的刀鋒型伺服器集合在機柜系統(tǒng)中,稱為伺服器機柜系統(tǒng)(rack server system),可提升操作便利性。在伺服器機柜系統(tǒng)中的各刀鋒型伺服器可視為一臺功能完整的計算機。換言之,各個刀鋒型伺服器除了設(shè)置核心電路(例如包括中央處理器、主機板、隨機存取存儲器及硬盤等),還配置諸如電源供應(yīng)器及散熱裝置等周邊裝置。 為避免市電萬一發(fā)生不穩(wěn)定/不正常/斷電情形,導(dǎo)致伺服器的操作不穩(wěn)定(比如當機),甚至可能使得儲存于伺服器內(nèi)的寶貴數(shù)據(jù)受到毀損,現(xiàn)以利用不斷電電源系統(tǒng)(UPS, uninterruptible power supply)來避免電源異常所造成的電腦數(shù)據(jù)損失與設(shè)備破壞,并可有效保護內(nèi)部元件,確保設(shè)備的使用壽命與精確度。然而現(xiàn)有UPS的可靠度(reliability)不是很好。故而,現(xiàn)提出在伺服器機柜系統(tǒng)中設(shè)置電池備援單元(BBU,battery backupunit)來取代/輔助UPS的做法,以期能到達低成本、效率高、穩(wěn)定性佳。然而,當BBU內(nèi)的電池模塊故障或因維修而被拔出時,萬一剛好碰到市電不穩(wěn)定/不正常/斷電的話,則伺服器機柜系統(tǒng)的操作穩(wěn)定度可能會因為電源供應(yīng)不足而受到影響。此外,為使BBU能維持正常,隔一段時間可能需要進行電池自放電測試,以根據(jù)其放電曲線來判斷BBU內(nèi)的電池是否正常。進行電池自放電測試時,萬一剛好碰到市電不穩(wěn)定/不正常/斷電的話,則伺服器機柜系統(tǒng)的操作穩(wěn)定度可能會因為電源供應(yīng)不足而受到影響。此外,于現(xiàn)有作法中,在對BBU進行維修時,伺服器機柜系統(tǒng)通常要被關(guān)機,對于使用者/管理人員造成不便。
發(fā)明內(nèi)容
本發(fā)明實施例涉及一種伺服器機柜系統(tǒng)與其操作方法,其BBU包括多個獨立運作的并聯(lián)BBU子系統(tǒng),即便其中一個BBU子系統(tǒng)故障/被抽出時,仍可在市電斷電時,由其他BBU子系統(tǒng)提供電源給伺服器,使伺服器運作不受影響。根據(jù)本發(fā)明的一實施例,提出一種伺服器機柜系統(tǒng)的操作方法。該伺服器機柜系統(tǒng)包括一電池備援單元(BBU)與至少一伺服器。該操作方法包括該伺服器與該電池備援單元互相通訊;該電池備援單元提供一狀態(tài)信息與一先前自放電測試信息給該伺服器,以使得該伺服器判斷該電池備援單元的一狀態(tài);以及于一輸入電源斷電時,該電池備援單元提供電源給該伺服器,且該伺服器根據(jù)該電池備援單元的該狀態(tài)信息,該伺服器調(diào)整其負載。根據(jù)本發(fā)明的另一實施例,提出一種伺服器機柜系統(tǒng),包括一電池備援單元(BBU);以及至少一伺服器,耦接至該電池備援單元。該伺服器與該電池備援單元互相通訊。該電池備援單元提供一狀態(tài)信息與一先前自放電測試信息給該伺服器,以使得該伺服器判斷該電池備援單元的一狀態(tài)。于一輸入電源斷電時,該電池備援單元提供電源給該伺服器,且該伺服器根據(jù)該電池備援單元的該狀態(tài)信息,該伺服器調(diào)整其負載。為了對本發(fā)明的上述及其他方面有更佳的了解,下文特舉實施例,并結(jié)合附圖詳細說明如下。
圖I顯示根據(jù)本發(fā)明實施例的伺服器機柜系統(tǒng)的功能示意圖。
圖2顯示根據(jù)本實施例的電池備援單元(BBU)的方塊圖。 圖3顯示根據(jù)本發(fā)明實施例的伺服器端與電池備援單元(BBU)端的控制流程圖。附圖符號說明100:伺服器機柜系統(tǒng)110:變壓器120:發(fā)電機130:機架電源配電單元140 :伺服器150:電池備援單元160 AC/DC電源供應(yīng)器200A.200B BBU 子系統(tǒng)210:電池模塊220 DC/DC 轉(zhuǎn)換器3IOA 345:步驟
具體實施例方式圖I顯示根據(jù)本發(fā)明實施例的伺服器機柜系統(tǒng)的功能示意圖。如圖I所示,伺服器機柜系統(tǒng)100包括至少一個伺服器140與BBU150。伺服器140的數(shù)量在此并不受限。變壓器110、發(fā)電機120、機架電源配電單元(PDU, power distribution unit) 130、及交流(AC)/直流(DC)電源供應(yīng)器160的功能、數(shù)量與其操作在本實施例中可不特別限定的。于本實施例中,若市電發(fā)生斷電/不穩(wěn)定,則BBU 150將提供電源給該些伺服器140。之后,發(fā)電機120會啟動,而將AC電源提供給AC/DC電源供應(yīng)器160,AC/DC電源供應(yīng)器160將AC電源轉(zhuǎn)換成DC電源之后,會更進一步提供DC電源給該些伺服器140。也就是說,于本實施例中,BBU 150提供電源的時間,原則上要從檢測市電不穩(wěn)定的時間點到發(fā)電機120能正常啟動的時間點為止?,F(xiàn)請參考圖2,其顯示根據(jù)本實施例的BBU150的方塊圖。如圖2所示,BBU150包括BBU子系統(tǒng)200A與200B。請注意,雖然于圖2中,BBU150包括兩個BBU子系統(tǒng),然而,于本發(fā)明其他可能實施例中,BBU可包括I個BBU子系統(tǒng)或是更多個BBU子系統(tǒng),此皆在本發(fā)明的范圍內(nèi)。于本實施例中,BBU150包括BBU子系統(tǒng)200A與200B。當其中一個BBU子系統(tǒng)被抽出(比如因為故障、電池壽命問題或更換)時,另一個BBU子系統(tǒng)仍可正常運作。故而,維修、更換BBU子系統(tǒng)對于BBU的影響不大。也就是說,當其中一個BBU子系統(tǒng)故障或是被抽出時,即便剛好遇到市電斷電/不穩(wěn)定的話,另一個BBU子系統(tǒng)統(tǒng)仍可發(fā)揮其供電功能,讓伺服器機柜系統(tǒng)正常運作。另外,可依輸出功率多寡來決定伺服器機柜系統(tǒng)所包括的電池模塊的數(shù)量,如此可使得系統(tǒng)配置與成本保持彈性。亦即,如果需要高輸出功率的話,伺服器機柜系統(tǒng)可包括多一些的電池模塊;反之亦然。各BBU子系統(tǒng)200A與200B包括多個電池模塊210與DC/DC轉(zhuǎn)換器220。雖然圖2中,一個BBU子系統(tǒng)包括5個電池模塊210,但本發(fā)明并不受限于此。于本實施例中,一個電池模塊210搭配一個DC/DC轉(zhuǎn)換器220。DC/DC轉(zhuǎn)換器220將電池模塊210的DC輸出電壓轉(zhuǎn)換成伺服器140所需的DC電壓。此外,為方便解說,亦可將一個電池模塊210與一個·DC/DC轉(zhuǎn)換器220合稱為一個BBU模塊。當然,BBU子系統(tǒng)可還包括其他元件,如微控制器(即)、電壓檢測電路、阻隔電路等,此皆在本發(fā)明的范圍內(nèi)。于本實施例中,比如但不受限于,使用鋰電池做為電池模塊210中的儲能裝置,可以縮小體積。BBU子系統(tǒng)之間可以相互并聯(lián)。而且,于本實施例中,模塊化設(shè)計有利于找到能用于保護電池模塊的保險絲,因為單一 DC/DC轉(zhuǎn)換器220的電池/電流并不高,所以易于找到能符合安規(guī)的保險絲。此外,于本實施例中,DC/DC轉(zhuǎn)換器220更保護電池模塊210免于受到外界電壓變化的影響。以圖2來說,抽出BBU子系統(tǒng)的目的通常是為了抽拔其內(nèi)部的BBU模塊,因為BBU模塊的損壞機會較高。更進一步說,可將BBU子系統(tǒng)200A或200B抽出,以更換其內(nèi)部的BBU模塊。所以,于本實施例中,BBU 150包括多個BBU子系統(tǒng)(圖2以2個BBU子系統(tǒng)200A與200B為例,但本實施例并不受限于此)的好處在于,如果BBU的內(nèi)部有BBU模塊故障需要更換時,可抽出該BBU子系統(tǒng)即可,而且,即便將BBU子系統(tǒng)抽出,仍不會讓整個BBU150在抽換時失效。現(xiàn)請參考圖3,其顯示根據(jù)本發(fā)明實施例的伺服器端與BBU端的控制流程圖。于步驟310A與310B中,伺服器與BBU彼此互相通訊。于步驟315中,BBU提供其本身的狀態(tài)信息與先前自放電測試信息(比如上次執(zhí)行自放電測試的時間點等)給伺服器。詳細地說,為了解電池模塊的蓄/放電狀態(tài),BBU隔一段時間會進行自放電測試,將電池模塊放電,以檢測電池模塊的放電曲線。藉由放電曲線,能了解此電池模塊是否符合需求/故障。如果此電池模塊已不符合需求/故障的話,BBU會將此信息記錄起來(比如記錄于BBU子系統(tǒng)的內(nèi)部存儲器)。故而,由BBU所提供的狀態(tài)信息比如包括,其內(nèi)部電池模塊中有幾個是符合需求、幾個不符合需求、是否有故障等等。原則上,一次對一個電池模塊進行自放電測試,直到所有的電池模塊都進行自放電測試為止。另外,于本實施例中,在對一個BBU子系統(tǒng)的某一個電池模塊進行自放電測試時,如果剛好市電斷電的話,此BBU子系統(tǒng)的其他電池模塊仍能正常供電,另一個正常BBU子系統(tǒng)(如果有的話)也尚能正常供電給伺服器(也就是說,整個BBU 150尚能正常供電給伺服器),所以,伺服器的操作可不受市電斷電的影響。在本實施例中,BBU子系統(tǒng)包括多個電池模塊。有其中一個或數(shù)個電池模塊故障/不符需求,BBU150與伺服器可將此信息記錄起來。即便發(fā)生電池模塊故障/不符需求,伺服器的運作仍不受影響。另外,即便是BBU只包括一個BBU子系統(tǒng),在對此BBU子系統(tǒng)的某一個電池模塊進行自放電測試時,如果剛好市電斷電的話,此BBU子系統(tǒng)可立即停止自放電測試,并令其他電池模塊正常供電給伺服器,所以,伺服器的操作可不受市電斷電的影響。于步驟320中,伺服器讀取并記錄BBU的狀態(tài)信息及先前自放電測試信息,以判斷 BBU的狀態(tài)(比如是否有BBU子系統(tǒng)被抽出/故障等,電池模塊的良好狀態(tài)等)。比如,以為圖2為例,BBU原本應(yīng)該包括2個BBU子系統(tǒng)。但如果由BBU所傳來的信息只有一個BBU子系統(tǒng)的信息,則代表可能有其中一個BBU子系統(tǒng)被抽出/故障。于步驟325中,假設(shè)因為BBU子系統(tǒng)或BBU模塊已被抽出,維修人員放入新BBU子系統(tǒng)或新BBU模塊?;蛘?,假設(shè)因為BBU子系統(tǒng)或BBU模塊故障,維修人員抽出舊BBU子系統(tǒng)或舊BBU模塊并放入新BBU子系統(tǒng)或新的BBU模塊。于步驟330中,新BBU子系統(tǒng)或新BBU模塊充電完畢后,新BBU子系統(tǒng)或新BBU模塊傳送狀態(tài)信息給伺服器。在本實施例中,由BBU系統(tǒng)或BBU子系統(tǒng)或BBU模塊自行判斷充電是否完畢。比如,由BBU內(nèi)的微控制器或BBU子系統(tǒng)內(nèi)的微控制器或BBU模塊內(nèi)的微控制器來判斷電池模塊的充電是否完畢。此外,狀態(tài)信息亦可儲存于BBU內(nèi)部。于步驟335中,伺服器接收并記錄新BBU子系統(tǒng)或新BBU模塊的狀態(tài)信息。請注意,于本實施例中,步驟325 335并非必要步驟。也就是說,如果BBU中的BBU子系統(tǒng)都是好的,則步驟325 335則未必要進行。于步驟340中,于市電斷電時,BBU提供電源給伺服器。于步驟345中,于市電斷電時,伺服器接受BBU的供電;且根據(jù)BBU的狀態(tài)信息,伺服器調(diào)整其負載。于本實施例中,市電是否斷電可由BBU單方面檢測,或是由伺服器單方面檢測,或者是BBU與伺服器兩者來檢測,此皆在本發(fā)明的范圍內(nèi)。另外,比如,BBU共包括10個電池模塊。假設(shè)BBU的狀態(tài)信息顯示此10個電池模塊都是好的,則于市電斷電時,伺服器可依此來調(diào)整其負載,比如,伺服器可以最高工作負載操作。在此,最高工作負載比如是伺服器的CPU/存儲器(未示出)等以最高操作頻率操作。但是,如果BBU的狀態(tài)信息顯示此10個電池模塊當中只有9個電池模塊是好的,則于市電斷電時,伺服器可依此來調(diào)整其負載,比如,伺服器可以最高工作負載的90%來操作,t匕如,CPU/存儲器等以最高操作頻率的90%操作。其余可依此類推。此外,于本實施例中,當有BBU子系統(tǒng)被抽出時,伺服器會記錄此信息,以便于在市電斷電時,伺服器能依此來調(diào)整其負載。綜上所述,雖然本發(fā)明已以實施例揭示如上,然其并非用以限定本發(fā)明。本領(lǐng)域的技術(shù)人員,在不脫離本發(fā)明的精神和范圍的前提下,可作各種的更動與潤飾。因此,本發(fā)明的保護范圍是以本發(fā)明的權(quán)利要求為準。
權(quán)利要求
1.一種伺服器機柜系統(tǒng)的操作方法,該伺服器機柜系統(tǒng)包括一電池備援單兀與至少一伺服器,該操作方法包括 該伺服器與該電池備援單元互相通訊; 該電池備援單元提供一狀態(tài)信息與一先前自放電測試信息給該伺服器,以使得該伺服器判斷該電池備援單元的一狀態(tài);以及 于一輸入電源斷電時,該電池備援單元提供電源給該伺服器,且該伺服器根據(jù)該電池備援單元的該狀態(tài)信息,該伺服器調(diào)整其負載。
2.如權(quán)利要求I所述的操作方法,其中,該電池備援單元包括多個并聯(lián)電池備援單元子系統(tǒng),各電池備援單元子系統(tǒng)包括多個電池備援單元模塊,該操作方法還包括 于放入一新電池備援單元子系統(tǒng)或一新電池備援單元模塊于該電池備援單元內(nèi)后,該電池備援單元或該新電池備援單元子系統(tǒng)或該新電池備援單元模塊判斷充電是否完成,并于充電完成后,該新電池備援單元子系統(tǒng)或該新電池備援單元模塊傳送其狀態(tài)信息給該伺服器或該電池備援單元儲存該狀態(tài)信息;以及 該伺服器接收并記錄該新電池備援單元子系統(tǒng)或該新電池備援單元模塊的該狀態(tài)信肩、O
3.如權(quán)利要求2所述的操作方法,其中, 如果其中一個電池備援單元子系統(tǒng)被抽出或故障的話,于該輸入電源斷電時,另一個電池備援單元子系統(tǒng)提供電源給該伺服器; 在對該電池備援單元子系統(tǒng)的一電池備援單元模塊進行自放電測試時,如果剛好該輸入電源斷電的話,該電池備援單元子系統(tǒng)的其他電池備援單元模塊正常供電給該伺服器;以及 當該電池備援單元子系統(tǒng)被抽出或故障時,該伺服器記錄一相關(guān)信息,使得在該輸入電源斷電時,該伺服器依此來調(diào)整負載。
4.如權(quán)利要求2所述的操作方法,其中,各電池備援單元子系統(tǒng)包括多個電池模塊與多個轉(zhuǎn)換器,各電池模塊搭配各轉(zhuǎn)換器。
5.如權(quán)利要求4所述的操作方法,其中 依該伺服器機柜系統(tǒng)的一輸出功率決定該電池備援單元所包括的電池模塊的數(shù)量;以及 該電池模塊包括鋰可充電電池。
6.如權(quán)利要求I所述的操作方法,其中,該先前自放電測試信息包括上次執(zhí)行自放電測試的時間點。
7.如權(quán)利要求4所述的操作方法,其中,該伺服器判斷該電池備援單元的狀態(tài)的該步驟包括 該伺服器判斷是否有電池備援單元子系統(tǒng)或電池備援單元模塊被抽出或故障,和/或判斷該些電池模塊的良好狀態(tài)。
8.如權(quán)利要求I所述的操作方法,其中,該輸入電源是否斷電由該電池備援單元檢測,或是由該伺服器檢測,或者是該電池備援單元與該伺服器兩者檢測。
9.一種伺服器機柜系統(tǒng),包括 一電池備援單元;以及至少一伺服器,耦接至該電池備援單元; 其中, 該伺服器與該電池備援單元互相通訊; 該電池備援單元提供一狀態(tài)信息與一先前自放電測試信息給該伺服器,以使得該伺服器判斷該電池備援單元的一狀態(tài);以及 于一輸入電源斷電時,該電池備援單元提供電源給該伺服器,且該伺服器根據(jù)該電池備援單元的該狀態(tài)信息,該伺服器調(diào)整其負載。
10.如權(quán)利要求9所述的伺服器機柜系統(tǒng),其中 該電池備援單元包括多個并聯(lián)電池備援單元子系統(tǒng),各電池備援單元子系統(tǒng)包括多個電池備援單元模塊; 于放入一新電池備援單元子系統(tǒng)或一新電池備援單元模塊于該電池備援單元內(nèi)后,該電池備援單元或該新電池備援單元子系統(tǒng)或該新電池備援單元模塊判斷充電是否完成,并于充電完成后,該新電池備援單元子系統(tǒng)或該新電池備援單元模塊傳送其狀態(tài)信息給該伺服器或該電池備援單元儲存該狀態(tài)信息;以及 該伺服器接收并記錄該新電池備援單元子系統(tǒng)或該新電池備援單元模塊的該狀態(tài)信肩、O
11.如權(quán)利要求10所述的伺服器機柜系統(tǒng),其中, 如果其中一個電池備援單元子系統(tǒng)被抽出或故障的話,于該輸入電源斷電時,另一個電池備援單元子系統(tǒng)提供電源給該伺服器; 在對該電池備援單元子系統(tǒng)的一電池備援單元模塊進行自放電測試時,如果剛好該輸入電源斷電的話,該電池備援單元子系統(tǒng)的其他電池備援單元模塊正常供電給該伺服器;以及 當該電池備援單元子系統(tǒng)被抽出或故障時,該伺服器記錄一相關(guān)信息,使得在該輸入電源斷電時,該伺服器依此來調(diào)整負載。
12.如權(quán)利要求10所述的伺服器機柜系統(tǒng),其中,各電池備援單元子系統(tǒng)包括多個電池模塊與多個轉(zhuǎn)換器,各電池模塊搭配各轉(zhuǎn)換器。
13.如權(quán)利要求12所述的伺服器機柜系統(tǒng),其中 依該伺服器機柜系統(tǒng)的一輸出功率決定該電池備援單元所包括的電池模塊的數(shù)量;以及 該電池模塊包括鋰可充電電池。
14.如權(quán)利要求9所述的伺服器機柜系統(tǒng),其中,該先前自放電測試信息包括上次執(zhí)行自放電測試的時間點。
15.如權(quán)利要求12所述的伺服器機柜系統(tǒng),其中,該伺服器判斷是否有電池備援單元子系統(tǒng)或電池備援單元模塊被抽出或故障,和/或判斷該些電池模塊的良好狀態(tài)。
16.如權(quán)利要求9所述的伺服器機柜系統(tǒng),其中,該輸入電源是否斷電由該電池備援單元檢測,或是由該伺服器檢測,或者是該電池備援單元與該伺服器兩者檢測。
全文摘要
本發(fā)明涉及伺服器機柜系統(tǒng)與其操作方法。該伺服器機柜系統(tǒng)包括一電池備援單元(BBU)與至少一伺服器。該伺服器機柜系統(tǒng)的操作方法包括該伺服器與該電池備援單元互相通訊;該電池備援單元提供一狀態(tài)信息與一先前自放電測試信息給該伺服器,以使得該伺服器判斷該電池備援單元的一狀態(tài);以及于一輸入電源斷電時,該電池備援單元提供電源給該伺服器,且該伺服器根據(jù)該電池備援單元的該狀態(tài)信息,該伺服器調(diào)整其負載。
文檔編號G06F1/30GK102902341SQ20111024796
公開日2013年1月30日 申請日期2011年8月26日 優(yōu)先權(quán)日2011年7月28日
發(fā)明者趙茂贊, 汪子鴻, 詹景翔 申請人:廣達電腦股份有限公司