背景技術(shù):
許多當(dāng)前的機(jī)架安裝式計(jì)算機(jī)系統(tǒng)利用冷卻劑分布單元(cdu),這些冷卻劑分布單元封裝到計(jì)算機(jī)機(jī)架單元的較大部分或者整個(gè)部分中。然后使用這種類型的cdu來(lái)促進(jìn)對(duì)若干其它計(jì)算機(jī)機(jī)架單元的冷卻。然而,具有像這樣較大的cdu有降低行級(jí)密度的傾向,對(duì)集群可用性產(chǎn)生負(fù)面影響,影響客戶的具有所需二次水暖循環(huán)的設(shè)施,并且使服務(wù)成本更高。
附圖說(shuō)明
為了更全面地理解各個(gè)示例,現(xiàn)在對(duì)結(jié)合附圖所進(jìn)行的以下說(shuō)明進(jìn)行參照,在附圖中:
圖1圖示了包括后門換熱器并且容納有示例冷卻劑分布單元的示例計(jì)算機(jī)機(jī)架單元;
圖2圖示了容納在計(jì)算機(jī)機(jī)架單元中的冷卻劑分布單元的內(nèi)部部件的透視圖;
圖3圖示了冷卻劑分布單元的部件的示例框圖;以及
圖4圖示了用于對(duì)液冷式計(jì)算單元進(jìn)行冷卻的示例過(guò)程的示例流程圖。
具體實(shí)施方式
本文描述的示例系統(tǒng)和方法組合了與計(jì)算機(jī)機(jī)架單元的后門換熱器進(jìn)行組合的小的(例如,約3u機(jī)架單元,其中,一個(gè)u占用約1.75英寸豎直機(jī)架空間)cdu。這種配置可以利用不使用的后門空間來(lái)安裝換熱器,諸如,例如,液體-液體換熱器。
本文描述的各個(gè)示例cdu是基于機(jī)架的單元,這些單元將冷卻劑(水、制冷劑等)分布至液冷式機(jī)架安裝式信息技術(shù)(it)設(shè)備,諸如,服務(wù)器、組網(wǎng)設(shè)備、存儲(chǔ)設(shè)備,其在本文稱為液冷式計(jì)算單元。cdu通常由泵、向泵提供可變速度的變頻驅(qū)動(dòng)器(vfd)、液體-液體(或者液體-空氣)換熱器(hx)、控制器、貯存器和管路組成。
通常,(多個(gè))泵以及vfd、hx和貯存器是最大的部件并且占用最大的空間。cdu的冷卻能力越大,所需的hx越大。cdu往往安裝在專用機(jī)架中,該專用機(jī)架占據(jù)單個(gè)機(jī)架面積。另外,增加計(jì)算機(jī)機(jī)架的數(shù)量不存在改善行密度的傾向。相反,本文描述的cdu的模式比當(dāng)前的部署模式更有吸引力。例如,與專用整個(gè)機(jī)架cdu占據(jù)一個(gè)機(jī)架的整個(gè)42u空間相反,結(jié)合后門換熱器(如本文所描述的)的基于機(jī)架的cdu可以占用42u機(jī)架中的3u。
如果小的基于機(jī)架的cdu出現(xiàn)故障,則僅會(huì)影響到一個(gè)機(jī)架。另外,通過(guò)將多個(gè)泵放在機(jī)架的cdu中,由于泵是cdu最容易出故障的部件,所以能夠獲得很大的冗余。
現(xiàn)在參照附圖,圖1圖示了包括后門換熱器120并且容納有示例冷卻劑分布單元(cdu)130的示例計(jì)算機(jī)機(jī)架單元100。計(jì)算機(jī)機(jī)架單元100包括外殼110,該外殼110配置為用于容納多個(gè)液冷式計(jì)算單元150。后門換熱器120聯(lián)接至后門115,該后門115聯(lián)接至外殼110。后門換熱器120可以是使第一冷卻劑(可以包括水或者其它制冷劑)循環(huán)以對(duì)cdu130的第二冷卻劑(可以包括水或者其它制冷劑)進(jìn)行冷卻的液體-液體換熱器,其中,第二冷卻劑對(duì)計(jì)算單元150進(jìn)行冷卻。第一和第二冷卻劑分別處于單獨(dú)的冷卻劑環(huán)路中。第一冷卻劑可以是來(lái)自設(shè)施的水,該設(shè)施諸如是容納計(jì)算機(jī)機(jī)架單元100的建筑。在其中容納在計(jì)算機(jī)機(jī)架單元100中的一些計(jì)算單元150不是液冷式的示例中,可以在機(jī)架單元100中嵌入液體-空氣換熱器或者,可替代地,除了液體-液體換熱器120之外,后門115還可以包括液體-空氣換熱器以允許空氣流入外殼110的內(nèi)部從而對(duì)外殼110內(nèi)的非液冷式計(jì)算單元進(jìn)行冷卻。
后門換熱器115包括流體流路(未示出)以經(jīng)由換熱器進(jìn)入管線155接收來(lái)自液冷式計(jì)算單元150的經(jīng)加熱的冷卻劑,以便對(duì)該經(jīng)加熱的冷卻劑進(jìn)行冷卻。示例冷卻劑分布單元130完全包含在外殼110內(nèi)。例如流體供應(yīng)管線135的第一流體管線聯(lián)接至冷卻劑分布單元130并且將冷卻劑供應(yīng)至液冷式計(jì)算單元150。例如流體返回管線140的第二流體管線將來(lái)自后門換熱器120的冷卻流體返回至冷卻劑分布單元130。在示例計(jì)算機(jī)機(jī)架100中,冷卻劑分布單元130位于外殼110的底部。如果在冷卻劑分布單元130中發(fā)生泄漏,這可以是有利的。其它各個(gè)示例計(jì)算機(jī)機(jī)架單元可以將冷卻劑分布單元定位在外殼110的頂部或者定位在計(jì)算機(jī)機(jī)架單元所在的地板下。
在各個(gè)示例中,后門液體-液體換熱器120可以安裝在計(jì)算機(jī)機(jī)架單元100的后門115上。在后門115上使用液體-液體換熱器120可以實(shí)現(xiàn)比大小相當(dāng)?shù)囊后w-空氣換熱器更好的效果。例如,80kw液體-液體換熱器對(duì)于30c的水可能需要約25加侖/分鐘(gpm),并且可能會(huì)小于相當(dāng)?shù)?0kw液體-空氣換熱器。
在各個(gè)示例中,冷卻劑分布單元130中使用的冷卻劑可以是水,這可允許冷卻劑分布單元130直接連接至設(shè)施水暖,并且可能不需要專用的二次水暖。這對(duì)于減少部署和服務(wù)成本并且改善機(jī)架級(jí)可服務(wù)性具有重要影響。
在各個(gè)示例中,使用基于機(jī)架的冷卻劑分布單元130可以使災(zāi)難性的泄漏更少。例如,機(jī)架中的災(zāi)難性泄漏會(huì)需要拆卸掉該單個(gè)機(jī)架。對(duì)于針對(duì)多個(gè)計(jì)算機(jī)機(jī)架單元使用一整塊機(jī)架冷卻劑分布單元的設(shè)計(jì),災(zāi)難性泄漏可能需要拆卸掉整個(gè)集群。
圖2圖示了冷卻劑分布單元200的部件的正視圖,該冷卻劑分布單元200可容納在計(jì)算機(jī)機(jī)架單元(諸如,圖1的計(jì)算機(jī)機(jī)架單元100)中并且可與后門液體-液體換熱器120配對(duì)。在該示例中,冷卻劑分布單元200可以容納在冷卻劑分布單元底盤230中,該冷卻劑分布單元底盤230的寬度可以是約17?英寸,高度為3u,其中,3u相當(dāng)于約5.25英寸。冷卻劑分布單元200包括并聯(lián)安裝的第一泵210-1和第二泵210-2。泵210的輸出聯(lián)接至冷卻劑供應(yīng)管線235,該冷卻劑供應(yīng)管線235可以將泵出的冷卻劑供應(yīng)至如圖1所示的液冷單元150。
冷卻劑分布單元200還包括貯存器220,該貯存器220聯(lián)接至冷卻劑返回管線240,該冷卻劑返回管線240可以接收來(lái)自換熱器120的冷卻劑。貯存器220可以提供一容量,該容量足夠大以能夠用于容納從換熱器120接收到的冷卻劑,其中,由于冷卻劑的溫度變化,冷卻劑的體積可以有所不同。貯存器還可配備有可以用于釋放多余的冷卻劑和/或氣體的壓力釋放閥和/或排出口250。
冷卻劑分布單元200還可以包括一對(duì)防回流閥或者單向閥270。
冷卻劑分布單元200還可以包括用于顯示冷卻系統(tǒng)的狀態(tài)的狀態(tài)顯示器260。例如,該狀態(tài)可以是冷卻劑和/或計(jì)算單元150的最大溫度的形式。
并聯(lián)的第一和第二泵210-1和210-2可以配備有包括第一隔離閥275和第二隔離閥280的一對(duì)隔離閥。隔離閥275和280可以用于限制流入并聯(lián)的泵210中的一個(gè),從而在需要維修的時(shí)候,允許該泵在另一個(gè)泵210在進(jìn)行熱交換時(shí)保持處于工作狀態(tài)。對(duì)于包含冷卻劑分布單元200中的一個(gè)的每個(gè)機(jī)架,這種冗余為整個(gè)冷卻系統(tǒng)提供了額外的安全保障。
在各個(gè)示例中,當(dāng)處于假設(shè)最大功率密度為每個(gè)機(jī)架約80kw時(shí),一個(gè)計(jì)算機(jī)機(jī)架單元100的計(jì)算單元150針對(duì)30c的水可能需要大概25gpm。如果將水溫降低到低于30c,則泵送功率和泵大小都可減小,并且/或者換熱器120的大小可減小。在各個(gè)示例中,如果在計(jì)算單元150上使用液冷式冷板,則該技術(shù)的更低熱阻可能會(huì)使對(duì)流率和泵送功率的需求低得多。例如,針對(duì)包括具有液冷式冷板(這是示例配置)的計(jì)算單元150的機(jī)架,當(dāng)處于假設(shè)最大功率密度為約40kw時(shí),分析建議:針對(duì)33c的水,低至10gpm可能便足夠。
在各個(gè)示例中,第一和第二泵210-1和210-2可以包括本領(lǐng)域技術(shù)人員所熟知的任何類型的泵。各個(gè)計(jì)算機(jī)機(jī)架單元100可以配備有泄漏抑制/防止/檢測(cè)系統(tǒng)。
現(xiàn)在參照?qǐng)D3,圖示了冷卻劑分布單元300的部件的示例框圖。例如,冷卻劑分布單元300可以用作圖1的冷卻劑分布單元130或者圖2的冷卻劑分布單元200。示例冷卻劑分布單元300可以利用用于控制冷卻劑流動(dòng)通過(guò)容納在圖1的計(jì)算機(jī)機(jī)架單元100中的多個(gè)計(jì)算單元150的示例控制器330。示例冷卻劑分布單元300可以包括嵌入式固件和硬件部件,以便持續(xù)地收集與冷卻劑的溫度和/或圖1所示的計(jì)算單元150的溫度相關(guān)聯(lián)的數(shù)據(jù)。
示例冷卻劑分布單元300可以包括服務(wù)器cpu(中央處理單元)310、至少一個(gè)存儲(chǔ)器裝置320、和電源340。電源340聯(lián)接至電氣接口345,該電氣接口345聯(lián)接至外部電源,諸如,ac電源350。冷卻劑分布單元300還可以包括操作系統(tǒng)部件355,該操作系統(tǒng)部件355包括:例如,存儲(chǔ)在rom(只讀存儲(chǔ)器)中并且聯(lián)接至cpu310的操作系統(tǒng)驅(qū)動(dòng)器部件和預(yù)啟動(dòng)bios(基本輸入/輸出系統(tǒng))部件。在各個(gè)示例中,cpu310可以具有非暫時(shí)性存儲(chǔ)器裝置320。在各個(gè)示例中,存儲(chǔ)器裝置320可以與cpu310一體形成或者可以是外部存儲(chǔ)器裝置。存儲(chǔ)器裝置320可以包括由cpu320執(zhí)行的程序代碼。例如,可以實(shí)施一個(gè)或者多個(gè)處理器以執(zhí)行用戶控制接口375和/或軟件應(yīng)用380。
示例冷卻劑分布單元300可以包含有單獨(dú)的服務(wù)器,諸如,容納在圖1和圖2的基于機(jī)架的冷卻劑分布單元130或者200中的一個(gè)內(nèi)的刀片式服務(wù)器??商娲?,冷卻劑分布單元300的部分,諸如,例如,cpu310、存儲(chǔ)器裝置320、操作系統(tǒng)355、用戶控制接口375和/或軟件應(yīng)用380可以是容納在計(jì)算機(jī)機(jī)架單元100內(nèi)的其它計(jì)算單元150中的一個(gè)的部分。
控制器330可以實(shí)施在軟件、固件和/或硬件中??刂破?30可以接收表示冷卻劑溫度、液冷式計(jì)算單元150的溫度、冷卻劑流率、功率消耗、泵速度等的信號(hào)??梢酝ㄟ^(guò)溫度傳感器將表示冷卻劑溫度的信號(hào)報(bào)告至控制器。在圖2的冷卻劑分布單元200中圖示的泵210可以將表示功率消耗、速度、累積轉(zhuǎn)數(shù)的信號(hào)報(bào)告至控制器330??刂破?30可以經(jīng)由可通信地聯(lián)接至計(jì)算單元150的網(wǎng)絡(luò)接口365接收表示計(jì)算單元150的溫度的信號(hào)。控制器330可以使用冷卻劑溫度和/或液冷式計(jì)算單元150的溫度來(lái)控制泵370的速度。
網(wǎng)絡(luò)接口365可以聯(lián)接至網(wǎng)絡(luò),諸如,內(nèi)聯(lián)網(wǎng)、局域網(wǎng)(lan)、無(wú)線局域網(wǎng)(wlan)、互聯(lián)網(wǎng)等,其中,其它液冷式計(jì)算單元150可以是網(wǎng)絡(luò)的一部分或者至少聯(lián)接至網(wǎng)絡(luò)。冷卻劑分布單元300還可以包括顯示器360,該顯示器360可以是圖2中圖示的顯示器260的示例。
圖4圖示了用于對(duì)液冷式計(jì)算單元進(jìn)行冷卻的示例過(guò)程400的示例流程圖。過(guò)程400僅僅是示例性的并且可以對(duì)其進(jìn)行修改?,F(xiàn)在將進(jìn)一步參照?qǐng)D1、圖2和圖3來(lái)描述圖4的示例過(guò)程400。
現(xiàn)在參照?qǐng)D4,冷卻劑分布單元200或者300可以經(jīng)由冷卻劑流體返回管線240接收來(lái)自后門換熱器120的冷卻劑。在框420中,冷卻劑分布單元200或者300通過(guò)使用都聯(lián)接至冷卻劑流體返回管線240的這兩個(gè)并聯(lián)的泵210中的至少一個(gè)朝著液冷式計(jì)算單元150泵送冷卻劑,以經(jīng)由聯(lián)接至多個(gè)液冷式計(jì)算單元150的冷卻劑流體供應(yīng)管線235將冷卻劑供應(yīng)至液冷式計(jì)算單元150。
在框430中,控制器330可以基于冷卻劑的溫度和/或液冷式計(jì)算單元的溫度來(lái)控制并聯(lián)的泵210中的一個(gè)或者兩個(gè)的速度。在各個(gè)示例中,控制器330可以接收表示冷卻劑溫度的信號(hào)和/或表示液冷式計(jì)算單元150的溫度的信號(hào)??梢詮牟⒙?lián)的泵210中的一個(gè)或者兩個(gè)接收表示冷卻劑溫度的信號(hào)??刂破?30可以經(jīng)由可通信地聯(lián)接至計(jì)算單元150的網(wǎng)絡(luò)接口365來(lái)接收表示計(jì)算單元150的溫度的信號(hào)。
以方法步驟或者過(guò)程為一般上下文描述了本文描述的各個(gè)示例,在一個(gè)示例中,該方法步驟或者過(guò)程可以由軟件程序產(chǎn)品或者部件來(lái)實(shí)施,該軟件程序產(chǎn)品或者部件包含在機(jī)器可讀介質(zhì)中,該機(jī)器可讀介質(zhì)包括可由組網(wǎng)環(huán)境中的實(shí)體執(zhí)行的可執(zhí)行指令,諸如,程序代碼。通常,程序模塊可以包括被設(shè)計(jì)為執(zhí)行特定任務(wù)或者實(shí)施特定抽象數(shù)據(jù)類型的例程、程序、對(duì)象、部件、數(shù)據(jù)結(jié)構(gòu)等??蓤?zhí)行指令、相關(guān)聯(lián)的數(shù)據(jù)結(jié)構(gòu)、和程序模塊表示用于執(zhí)行本文公開的方法的步驟的程序代碼的示例。這種可執(zhí)行指令或者相關(guān)聯(lián)的數(shù)據(jù)結(jié)構(gòu)的特定序列表示用于執(zhí)行在這些步驟或者過(guò)程中描述的功能的對(duì)應(yīng)動(dòng)作的示例。
可以利用具有基于規(guī)則的邏輯和其它邏輯的標(biāo)準(zhǔn)編程技術(shù)來(lái)實(shí)現(xiàn)各個(gè)示例的軟件實(shí)施方式,以實(shí)現(xiàn)各個(gè)數(shù)據(jù)庫(kù)搜索步驟或者過(guò)程、相關(guān)步驟或者過(guò)程、對(duì)比步驟或者過(guò)程、以及判定步驟或者過(guò)程。
已經(jīng)出于圖示和描述的目的提出了對(duì)各個(gè)示例的上述描述。上述描述不旨在是窮盡性的或者是局限于所公開的示例,并且,鑒于上述教導(dǎo)或者從各個(gè)示例的實(shí)踐可知,修改和變型都是可能的。對(duì)本文討論的示例的選擇和描述是為了解釋本公開及其實(shí)際應(yīng)用的各個(gè)示例的原理和性質(zhì)以使本領(lǐng)域中的技術(shù)人員能夠利用在各個(gè)示例中的公開內(nèi)容以及適用于所設(shè)想的特定用途的各種修改。可以將本文描述的示例的特征組合在方法、設(shè)備、模塊、系統(tǒng)和計(jì)算機(jī)程序產(chǎn)品的所有可能的組合中。
還要注意,雖然上面描述了示例,但是不應(yīng)該將這些描述視為具有限制意義。相反,在不偏離隨附權(quán)利要求書中限定的范圍的情況下,可以進(jìn)行多種變化和修改。