專利名稱:用于功率分析的技術(shù)的制作方法
用于功率分析的技術(shù)本公開內(nèi)容的領(lǐng)域本公開內(nèi)容大體上涉及功率分析并且更具體地涉及用于數(shù)據(jù)中心的功率分析的技術(shù)。本公開內(nèi)容的背景數(shù)據(jù)中心正在迅速地成為最大的能量消耗者之一,尤其是在美國(guó)。當(dāng)需求正在以驚人的速度增長(zhǎng)時(shí),數(shù)據(jù)中心的能量消耗是非常低效的。迄今為止,似乎沒(méi)有用于使數(shù)據(jù)中心的能量完全高效同時(shí)滿足業(yè)務(wù)需要的可行的整體方法??紤]到上文,可以理解的是,可能具有與當(dāng)前的數(shù)據(jù)中心的功率分析技術(shù)相關(guān)聯(lián)的顯著的問(wèn)題和缺點(diǎn)。本公開內(nèi)容的概述公開了用于數(shù)據(jù)中心的功率分析的技術(shù)。在一個(gè)具體的示例性的實(shí)施方案中,該技術(shù)可以實(shí)現(xiàn)為用于對(duì)多個(gè)計(jì)算平臺(tái)部件進(jìn)行功率分析的方法,所述方法包括接收與部件相關(guān)聯(lián)的信息,使用計(jì)算機(jī)處理器檢索與所述部件相關(guān)聯(lián)的電子存儲(chǔ)數(shù)據(jù),至少部分地基于所述存儲(chǔ)數(shù)據(jù)估計(jì)所述部件的功率使用,以及輸出功率使用的指示(indicator)。根據(jù)本具體的示例性的實(shí)施方案的其他方面,所述部件可以包括計(jì)算機(jī)處理器、電子存儲(chǔ)部和聯(lián)網(wǎng)部件中的至少一個(gè)。根據(jù)本具體的示例性的實(shí)施方案的另外的方面,所述技術(shù)還可以包括對(duì)設(shè)備的多個(gè)部件重復(fù)所述過(guò)程,以及匯集所述設(shè)備的部件的功率使用的功率估計(jì),以提供所述設(shè)備的所估計(jì)的功率使用。根據(jù)本具體的示例性的實(shí)施方案的另外的方面,所述設(shè)備可以包括服務(wù)器、網(wǎng)絡(luò)設(shè)備、主機(jī)和存儲(chǔ)設(shè)備中的至少一個(gè)。根據(jù)本具體的示例性的實(shí)施方案的另外的方面,還包括對(duì)區(qū)域中的多個(gè)設(shè)備重復(fù)所述過(guò)程。根據(jù)本具體的示例性的實(shí)施方案的另外的方面,所述技術(shù)還可以包括接收與部件相關(guān)聯(lián)的一個(gè)或多個(gè)測(cè)量結(jié)果,以及至少部分地基于所述一個(gè)或多個(gè)所接收的測(cè)量結(jié)果來(lái)估計(jì)所述部件的功率使用。
根據(jù)本具體的示例性的實(shí)施方案的另外的方面,所述一個(gè)或多個(gè)測(cè)量結(jié)果可以包括來(lái)自下列項(xiàng)中的至少一個(gè)的讀數(shù)溫度傳感器、處理器芯片、散熱器、磁盤控制器、電源和網(wǎng)絡(luò)部件。根據(jù)本具體的示例性的實(shí)施方案的另外的方面,所述一個(gè)或多個(gè)測(cè)量結(jié)果可以包括CPU使用率、事務(wù)處理速率、通信速率、配置信息、活動(dòng)進(jìn)程和多種虛擬機(jī)中的至少一個(gè)。根據(jù)本具體的示例性的實(shí)施方案的另外的方面,所述技術(shù)還可以包括至少部分地基于所述部件的所述估計(jì)的功率使用和一個(gè)或多個(gè)所接收的測(cè)量結(jié)果中的一個(gè)或多個(gè)來(lái)估計(jì)部件的熱變化曲線(thermal profile)。根據(jù)本具體的示例性的實(shí)施方案的另外的方面,所述技術(shù)還可以包括基于所述熱變化曲線來(lái)估計(jì)功率使用。
根據(jù)本具體的示例性的實(shí)施方案的另外的方面,基于所述熱變化曲線來(lái)估計(jì)功率使用可以包括使用所述熱變化曲線來(lái)估計(jì)冷卻成本。根據(jù)本具體的示例性的實(shí)施方案的另外的方面,所述技術(shù)還可以包括接收來(lái)自配電單元和計(jì)算機(jī)機(jī)房空氣調(diào)節(jié)器中的至少一個(gè)的一個(gè)或多個(gè)測(cè)量結(jié)果。根據(jù)本具體的示例性的實(shí)施方案的另外的方面,所述技術(shù)還可以包括使用所接收的一個(gè)或多個(gè)測(cè)量結(jié)果來(lái)估計(jì)功率使用和熱變化曲線中的至少一個(gè)。根據(jù)本具體的示例性的實(shí)施方案的另外的方面,接收與部件相關(guān)聯(lián)的信息可以包括通過(guò)網(wǎng)絡(luò)接口發(fā)現(xiàn)部件。根據(jù)本具體的示例性的實(shí)施方案的另外的方面,通過(guò)網(wǎng)絡(luò)接口發(fā)現(xiàn)部件可以包括 使用以下項(xiàng)中的至少一個(gè)簡(jiǎn)單網(wǎng)絡(luò)管理協(xié)議(SNMP)、存儲(chǔ)管理計(jì)劃規(guī)范(SMI-S)、智能平臺(tái)管理接口(IPMI)、Windows 管理規(guī)范(WMI)、安全外殼(SSH)、BACNet 和 ModBus。根據(jù)本具體的示例性的實(shí)施方案的另外的方面,通過(guò)網(wǎng)絡(luò)接口發(fā)現(xiàn)部件可以包括在來(lái)自遠(yuǎn)程地點(diǎn)的數(shù)據(jù)中心上進(jìn)行的發(fā)現(xiàn)。根據(jù)本具體的示例性的實(shí)施方案的另外的方面,所述技術(shù)還可以包括在未檢索到與所述部件相關(guān)聯(lián)的電子存儲(chǔ)的數(shù)據(jù)的情況下接受用于未被識(shí)別的部件的輸入。根據(jù)本具體的示例性的實(shí)施方案的另外的方面,所述技術(shù)還可以包括發(fā)現(xiàn)與部件相關(guān)聯(lián)的一個(gè)或多個(gè)邏輯要素,以及至少部分地基于所述一個(gè)或多個(gè)發(fā)現(xiàn)的邏輯要素來(lái)估計(jì)功率使用。根據(jù)本具體的示例性的實(shí)施方案的另外的方面,所述一個(gè)或多個(gè)邏輯要素可以包括與部件相關(guān)聯(lián)的操作系統(tǒng)組成部分、與部件相關(guān)聯(lián)的進(jìn)程、與部件相關(guān)聯(lián)的虛擬機(jī)和與部件相關(guān)聯(lián)的應(yīng)用程序中的至少一個(gè)。根據(jù)本具體的示例性的實(shí)施方案的另外的方面,與所述部件相關(guān)聯(lián)的電子存儲(chǔ)的數(shù)據(jù)可以包括以下項(xiàng)中的至少一個(gè)的數(shù)據(jù)庫(kù)部件的配置文件、服務(wù)器陣列、計(jì)算機(jī)機(jī)房空氣調(diào)節(jié)器、配電單元和數(shù)據(jù)中心物理基礎(chǔ)設(shè)施。根據(jù)本具體的示例性的實(shí)施方案的另外的方面,所述技術(shù)還可以包括基于以下項(xiàng)中的至少一個(gè)提供一個(gè)或多個(gè)建議部件的估計(jì)的功率使用、設(shè)備的估計(jì)的功率使用、區(qū)域的估計(jì)的功率使用、數(shù)據(jù)中心的估計(jì)的功率使用、區(qū)域的熱變化曲線和區(qū)域的熱變化曲線。根據(jù)本具體的示例性的實(shí)施方案的另外的方面,所述一個(gè)或多個(gè)建議包括以下項(xiàng)中的至少一個(gè)去除未利用的部件、整合未充分利用的部件、升級(jí)低效的部件、更換低效的 部件、將一地理位置內(nèi)的部件重新布置以改進(jìn)熱變化曲線、和將工作負(fù)荷在地理區(qū)域內(nèi)的部件上重新分布以改進(jìn)熱變化曲線。根據(jù)本具體的示例性的實(shí)施方案的另外的方面,可以使用計(jì)算流體動(dòng)力學(xué)估計(jì)所述熱變化曲線。根據(jù)本具體的示例性的實(shí)施方案的另外的方面,所述技術(shù)可以實(shí)現(xiàn)為至少一種非瞬時(shí)性處理器可讀存儲(chǔ)介質(zhì),所述至少一個(gè)非瞬時(shí)性處理器可讀存儲(chǔ)介質(zhì)用于存儲(chǔ)被配置為可由至少一個(gè)處理器讀取以指示所述至少一個(gè)處理器執(zhí)行用于進(jìn)行所述方法的計(jì)算機(jī)進(jìn)程的計(jì)算機(jī)程序指令(computer program of instructions)。在另一個(gè)具體的示例性的實(shí)施方案中,所述技術(shù)可以實(shí)現(xiàn)為用于多個(gè)計(jì)算平臺(tái)部件的功率分析的制造物品(article of manufacture),所述制造物品包括至少一個(gè)非瞬時(shí)性處理器可讀介質(zhì),以及存儲(chǔ)在所述至少一個(gè)介質(zhì)上的指令,其中所述指令被配置為可由至少一個(gè)處理器從所述至少一個(gè)介質(zhì)讀取并且由此使所述至少一個(gè)處理器操作從而接收與部件相關(guān)聯(lián)的信息,檢索與所述部件相關(guān)聯(lián)的電子存儲(chǔ)的數(shù)據(jù),至少部分地基于所述存儲(chǔ)的數(shù)據(jù)估計(jì)所述部件的功率使用,以及輸出功率使用的指示。在又一個(gè)具體的示例性的實(shí)施方案中,所述技術(shù)可以實(shí)現(xiàn)為用于多個(gè)計(jì)算平臺(tái)部件的功率分析的系統(tǒng),所述系統(tǒng)包括通信地耦合于網(wǎng)絡(luò)的一個(gè)或多個(gè)處理器,其中所述一個(gè)或多個(gè)處理器被配置為接收與部件相關(guān)聯(lián)的信息,檢索與所述部件相關(guān)聯(lián)的電子存儲(chǔ)的數(shù)據(jù),至少部分地基于所述存儲(chǔ)的數(shù)據(jù)估計(jì)所述部件的功率使用,以及輸出功率使用的指示。 現(xiàn)在將參照在附圖中所示的其示例性的實(shí)施方案更詳細(xì)地描述本公開內(nèi)容。雖然在下文參照示例性的實(shí)施方案描述了本公開內(nèi)容,但是應(yīng)當(dāng)理解,本公開內(nèi)容不限于此。可以獲得本文的教導(dǎo)的本領(lǐng)域的技術(shù)人員將意識(shí)到,在本文描述的本公開內(nèi)容的范圍內(nèi)并且本公開內(nèi)容可以關(guān)于其具有重要的用途的另外的實(shí)現(xiàn)、修改和實(shí)施方案以及其他的使用領(lǐng)域。附圖簡(jiǎn)述為了便于本公開內(nèi)容的更充分理解,現(xiàn)在參照附圖,在附圖中相似的元件用相似的數(shù)字標(biāo)示。這些附圖不應(yīng)當(dāng)被解釋為限制本公開內(nèi)容,其意圖僅是示例性的。圖I示出了描繪了根據(jù)本公開內(nèi)容的實(shí)施方案的含有用于功率分析的平臺(tái)的網(wǎng)絡(luò)體系結(jié)構(gòu)的框圖。圖2示出了描繪了根據(jù)本公開內(nèi)容的實(shí)施方案的含有用于功率分析的平臺(tái)的網(wǎng)絡(luò)體系結(jié)構(gòu)的框圖。圖3描繪了根據(jù)本公開內(nèi)容的實(shí)施方案的計(jì)算機(jī)系統(tǒng)的框圖。圖4示出了根據(jù)本公開內(nèi)容的實(shí)施方案的用于功率分析的模塊。圖5描繪了根據(jù)本公開內(nèi)容的實(shí)施方案的用于功率分析的方法。圖6描繪了根據(jù)本公開內(nèi)容的實(shí)施方案的用于功率分析的方法。圖7描繪了根據(jù)本公開內(nèi)容的實(shí)施方案的功率分析系統(tǒng)的對(duì)象和數(shù)據(jù)。圖8描繪了根據(jù)本公開內(nèi)容的實(shí)施方案的用于功率分析系統(tǒng)中的命令執(zhí)行的管道設(shè)計(jì)。圖9是描繪了根據(jù)本公開內(nèi)容的實(shí)施方案的識(shí)別數(shù)據(jù)中心內(nèi)的僵尸服務(wù)器(即未利用的服務(wù)器)的數(shù)據(jù)流圖。
圖10描繪了根據(jù)本公開內(nèi)容的實(shí)施方案的用于分析數(shù)據(jù)中心的功率的系統(tǒng)。圖11描繪了根據(jù)本公開內(nèi)容的實(shí)施方案的用于分析數(shù)據(jù)中心的功率的軟件體系結(jié)構(gòu)。圖12描繪了根據(jù)本公開內(nèi)容的實(shí)施方案的用于優(yōu)化數(shù)據(jù)中心的能量節(jié)約的系統(tǒng)圖。圖13描繪了根據(jù)本公開內(nèi)容的實(shí)施方案的數(shù)據(jù)中心的熱流圖。圖14描繪了根據(jù)本公開內(nèi)容的實(shí)施方案的用于監(jiān)測(cè)數(shù)據(jù)中心的功率計(jì)量的用戶界面。圖15描繪了根據(jù)本公開內(nèi)容的實(shí)施方案的用于監(jiān)測(cè)數(shù)據(jù)中心的目錄的用戶界面。圖16描繪了根據(jù)本公開內(nèi)容的實(shí)施方案的用于識(shí)別數(shù)據(jù)中心內(nèi)的設(shè)備的放置的用戶界面。圖17描繪了根據(jù)本公開內(nèi)容的實(shí)施方案的用于識(shí)別數(shù)據(jù)中心內(nèi)的僵尸服務(wù)器的用戶界面。圖18描繪了根據(jù)本公開內(nèi)容的實(shí)施方案的數(shù)據(jù)中心的熱圖(thermal map)。
圖19描繪了根據(jù)本公開內(nèi)容的實(shí)施方案的將一個(gè)或多個(gè)資源分配給數(shù)據(jù)中心內(nèi)的區(qū)域的圖。圖20描繪了根據(jù)本公開內(nèi)容的實(shí)施方案的將一個(gè)或多個(gè)資源分配給數(shù)據(jù)中心內(nèi)的區(qū)域的圖。圖21描繪了根據(jù)本公開內(nèi)容的實(shí)施方案的數(shù)據(jù)中心內(nèi)的設(shè)備故障和使用年限之間的關(guān)系。圖22描繪了根據(jù)本公開內(nèi)容的實(shí)施方案的設(shè)備故障和溫度之間的關(guān)系。圖23描繪了根據(jù)本公開內(nèi)容的實(shí)施方案的使用指標(biāo)來(lái)識(shí)別數(shù)據(jù)中心內(nèi)的溫度問(wèn)題。圖24描繪了根據(jù)本公開內(nèi)容的實(shí)施方案的使用指標(biāo)來(lái)識(shí)別數(shù)據(jù)中心內(nèi)的溫度問(wèn)題。圖25描繪了根據(jù)本公開內(nèi)容的實(shí)施方案的使用指標(biāo)來(lái)識(shí)別數(shù)據(jù)中心內(nèi)的溫度問(wèn)題。圖26描繪了根據(jù)本公開內(nèi)容的實(shí)施方案的用于數(shù)據(jù)中心的功率分析的示例性的用戶界面。圖27描繪了根據(jù)本公開內(nèi)容的實(shí)施方案的用于數(shù)據(jù)中心的功率分析的示例性的用戶界面。圖28描繪了根據(jù)本公開內(nèi)容的實(shí)施方案的用于數(shù)據(jù)中心的功率分析的示例性的用戶界面。圖29描繪了根據(jù)本公開內(nèi)容的實(shí)施方案的用于數(shù)據(jù)中心的功率分析的示例性的用戶界面。圖30描繪了根據(jù)本公開內(nèi)容的實(shí)施方案的用于數(shù)據(jù)中心優(yōu)化的技術(shù)的高水平概覽。不例性實(shí)施方案的詳細(xì)描述圖I示出了根據(jù)本公開內(nèi)容的實(shí)施方案的用于功率分析的網(wǎng)絡(luò)體系結(jié)構(gòu)100的框圖。圖I是網(wǎng)絡(luò)體系結(jié)構(gòu)100的簡(jiǎn)化的視圖,其可以包括未描繪的另外的元件。網(wǎng)絡(luò)體系結(jié)構(gòu)100可以含有數(shù)據(jù)中心110(1)至IlO(N)。雖然傳統(tǒng)上是較大的設(shè)施,但是用于本公開內(nèi)容的目的的數(shù)據(jù)中心可以被理解為是專用于支持多個(gè)計(jì)算平臺(tái)的大型結(jié)構(gòu)、服務(wù)器機(jī)房、或甚至支持單個(gè)計(jì)算平臺(tái)的小房間。數(shù)據(jù)中心110(1)可以含有多個(gè)單元110和單元130。單元110和130可以含有一個(gè)或多個(gè)部件120。數(shù)據(jù)中心110 (I)還可以含有電源150和冷卻部160。在數(shù)據(jù)中心110中可以含有其他的部件和設(shè)備(例如存儲(chǔ)單元、磁帶庫(kù)、光盤庫(kù)和大型計(jì)算機(jī))。單元110和130可以通信地耦合于彼此和/或其他的部件。單元110和130還可以通信地耦合于網(wǎng)絡(luò)190。
根據(jù)某些實(shí)施方案,單元110和130可以是用于支承一個(gè)或多個(gè)計(jì)算設(shè)備和/或部件(例如部件120)的機(jī)架。單元110可以布置在數(shù)據(jù)中心中的第一通道中并且單元130可以布置在數(shù)據(jù)中心中的第二通道中。單元110和130與部件120可以由電源150中的一個(gè)或多個(gè)供應(yīng)功率。單元110和130與部件120可以將熱散發(fā)到數(shù)據(jù)中心110中并且可以由冷卻部160冷卻。電源150可以是一個(gè)或多個(gè)配電單元(PDU)、不間斷電源(UPS)、主配電單元(MDU)和/或發(fā)電機(jī)。電源150可以含有用于遠(yuǎn)程管理和/或監(jiān)測(cè)的網(wǎng)絡(luò)訪問(wèn)接口(例如RS-232接口和/或以太網(wǎng)接口)。電源150可以向數(shù)據(jù)中心110中的一個(gè)或多個(gè)設(shè)備提供數(shù)據(jù)和從數(shù)據(jù)中心110中的一個(gè)或多個(gè)設(shè)備接收數(shù)據(jù)。電源150還可以通過(guò)網(wǎng)絡(luò)190向平臺(tái)170提供數(shù)據(jù)和從平臺(tái)170接收數(shù)據(jù)。冷卻部160可以是一個(gè)或多個(gè)計(jì)算機(jī)機(jī)房空氣調(diào)節(jié)器(CRACS)或其他的溫度監(jiān)測(cè)設(shè)備、溫度控制設(shè)備和濕度控制設(shè)備。冷卻部160可以向數(shù)據(jù)中心110中的一個(gè)或多個(gè)設(shè)備提供數(shù)據(jù)和從數(shù)據(jù)中心110中的一個(gè)或多個(gè)設(shè)備接收數(shù)據(jù)。冷卻部160還可以通過(guò)網(wǎng)絡(luò)190向平臺(tái)170提供數(shù)據(jù)和從平臺(tái)170接收數(shù)據(jù)。 網(wǎng)絡(luò)190可以是局域網(wǎng)(LAN)、廣域網(wǎng)(WAN)、因特網(wǎng)、蜂窩網(wǎng)絡(luò)、衛(wèi)星網(wǎng)絡(luò)或另一種允許在通信地耦合于網(wǎng)絡(luò)190的設(shè)備之間進(jìn)行通信的網(wǎng)絡(luò)。網(wǎng)絡(luò)190可以還包括一個(gè)或任何數(shù)量的上文提到的示例性類型的作為獨(dú)立網(wǎng)絡(luò)或通過(guò)彼此協(xié)作來(lái)運(yùn)行的網(wǎng)絡(luò)。網(wǎng)絡(luò)190可以利用通信地耦合于它們的一個(gè)或多個(gè)客戶端或服務(wù)器的一個(gè)或多個(gè)協(xié)議。網(wǎng)絡(luò)190可以將其他的協(xié)議或從其他協(xié)議轉(zhuǎn)換為網(wǎng)絡(luò)設(shè)備的一個(gè)或多個(gè)協(xié)議。雖然將網(wǎng)絡(luò)190作為一個(gè)網(wǎng)絡(luò)描繪,但是應(yīng)意識(shí)到,根據(jù)一個(gè)或多個(gè)實(shí)施方案、網(wǎng)絡(luò)190可以包括多個(gè)互相連接的網(wǎng)絡(luò)。根據(jù)某些實(shí)施方案,部件120可以是計(jì)算平臺(tái)(例如,服務(wù)器計(jì)算機(jī)、刀片式服務(wù)器、網(wǎng)絡(luò)部件、網(wǎng)絡(luò)存儲(chǔ)設(shè)備或其他的設(shè)備)。根據(jù)某些實(shí)施方案,部件120可以是較大設(shè)備的部件(例如用于網(wǎng)絡(luò)設(shè)備或服務(wù)器的卡)。部件120和/或單元110和120可以用于一個(gè)或多個(gè)目的(例如,檔案平臺(tái)、備份服務(wù)器、網(wǎng)絡(luò)存儲(chǔ)設(shè)備、媒體服務(wù)器、電子郵件服務(wù)器、文檔管理平臺(tái)、企業(yè)搜索服務(wù)器和應(yīng)用服務(wù)器)。下文描述可以包括一個(gè)或多個(gè)模塊的用于功率分析的系統(tǒng)和方法的網(wǎng)絡(luò)元件、計(jì)算機(jī)和/或部件。如本文所使用的,術(shù)語(yǔ)“模塊”可以理解為是指計(jì)算軟件、固件、硬件和/或其各種組合。然而,模塊應(yīng)被解釋為在硬件、固件上實(shí)施的軟件或記錄在處理器可讀取可記錄的存儲(chǔ)介質(zhì)上的軟件(即就其本身而論,模塊不是軟件)。注意,模塊是示例性的??梢詫⒛K組合、集成、分離和/或復(fù)制以支持各種應(yīng)用。此外,代替在特定的模塊處執(zhí)行的功能或除了在特定的模塊處執(zhí)行的功能之外,在本文中描述為在特定的模塊上執(zhí)行的功能可以在一個(gè)或多個(gè)其他的模塊上執(zhí)行和/或由一個(gè)或多個(gè)其他的設(shè)備執(zhí)行。此外,模塊可以在彼此相距較近或較遠(yuǎn)的多個(gè)設(shè)備和/或其他的部件上實(shí)施。此外,模塊可以從一個(gè)設(shè)備移動(dòng)并且添加到另一個(gè)設(shè)備中,和/或可以包括在兩個(gè)設(shè)備中。平臺(tái)170可以通信地耦合于網(wǎng)絡(luò)190。根據(jù)某些實(shí)施方案,平臺(tái)170可以是支持功率分析模塊172的一個(gè)或多個(gè)主機(jī)或計(jì)算平臺(tái)。功率分析模塊172可以分析數(shù)據(jù)中心110、單元110、單元130、部件120、電源150、冷卻部160中的一個(gè)或多個(gè)、和一個(gè)或多個(gè)元件的子部件的功率使用。功率分析模塊172還可以分析數(shù)據(jù)中心110、單元110、單元130、部件120、電源150、冷卻部160中的一個(gè)或多個(gè)、和一個(gè)或多個(gè)元件的子部件的熱變化曲線(例如溫度、散熱等等)。根據(jù)某些實(shí)施方案,功率分析模塊172可以位于遠(yuǎn)離數(shù)據(jù)中心110的位置(例如在服務(wù)中心處)。根據(jù)某些實(shí)施方案,功率分析模塊172的一個(gè)或多個(gè)部件或模塊可以包含在數(shù)據(jù)中心110中或與數(shù)據(jù)中心110處于同一位置。數(shù)據(jù)存儲(chǔ)部192可以是網(wǎng)絡(luò)可訪問(wèn)的存儲(chǔ)部,并且可以是距平臺(tái)170較近、較遠(yuǎn)或其組合。數(shù)據(jù)存儲(chǔ)部192可以利用廉價(jià)磁盤的冗余陣列(“RAID”)、磁帶、磁盤、存儲(chǔ)區(qū)域網(wǎng)絡(luò)(“SAN”)、因特網(wǎng)小型計(jì)算機(jī)系統(tǒng)接口( “13051”)54隊(duì)光纖通道5八隊(duì)通用因特網(wǎng)文件系統(tǒng)(“CIFS”)、網(wǎng)絡(luò)連接式存儲(chǔ)(“NAS”)、網(wǎng)絡(luò)文件系統(tǒng)(“NFS”)、或其他的計(jì)算機(jī)可訪問(wèn)的存儲(chǔ)部。在一個(gè)或多個(gè)實(shí)施方案中,數(shù)據(jù)存儲(chǔ)部192可以是數(shù)據(jù)庫(kù),例如Oracle數(shù)據(jù)庫(kù)、Microsoft SQL Server數(shù)據(jù)庫(kù)、DB2數(shù)據(jù)庫(kù)、MySQL數(shù)據(jù)庫(kù)、Sybase數(shù)據(jù)庫(kù)、面向?qū)ο蟮臄?shù)據(jù)庫(kù)、分層數(shù)據(jù)庫(kù)或其他的數(shù)據(jù)庫(kù)。在某些實(shí)施方案中,數(shù)據(jù)存儲(chǔ)部192可以利用平面文件結(jié)構(gòu)或XML進(jìn)行數(shù)據(jù)的存儲(chǔ)。
數(shù)據(jù)存儲(chǔ)部192可以存儲(chǔ)關(guān)于多種數(shù)據(jù)中心資產(chǎn)的經(jīng)銷商可靠性和功率規(guī)格配置文件數(shù)據(jù)。這種數(shù)據(jù)可以用于估計(jì)資產(chǎn)的功率和可靠性。數(shù)據(jù)可以包括一個(gè)或多個(gè)數(shù)據(jù)中心的資產(chǎn)的資產(chǎn)數(shù)據(jù)、配置文件數(shù)據(jù)、地理空間數(shù)據(jù)和相關(guān)數(shù)據(jù)。這些類型的數(shù)據(jù)可以人工發(fā)現(xiàn)、導(dǎo)入或鍵入。歷史數(shù)據(jù)、分析數(shù)據(jù)和可靠性數(shù)據(jù)可以是計(jì)算結(jié)果、所搜集的資產(chǎn)的調(diào)查數(shù)據(jù)或二者的組合。數(shù)據(jù)存儲(chǔ)部192可以通過(guò)基于從數(shù)據(jù)中心接收的信息增加和/或修正數(shù)據(jù)庫(kù)中數(shù)據(jù)來(lái)維護(hù)數(shù)據(jù)。功率分析模塊172可以含有分析模塊174、發(fā)現(xiàn)模塊176、數(shù)據(jù)收集模塊178和優(yōu)化器模塊180。發(fā)現(xiàn)模塊176可以使用一種或多種方法識(shí)別和編目數(shù)據(jù)中心資源。例如,發(fā)現(xiàn)模塊176可以使用簡(jiǎn)單網(wǎng)絡(luò)管理協(xié)議(SNMP)、存儲(chǔ)管理計(jì)劃規(guī)范(SMI-S)、智能平臺(tái)管理接口(IPMI) ,Windows管理規(guī)范(WMI)、安全外殼(SSH)、BACNet、ModBus和/或私有協(xié)議中的一個(gè)或多個(gè)來(lái)識(shí)別數(shù)據(jù)中心的資源。根據(jù)某些實(shí)施方案,發(fā)現(xiàn)模塊176可以提供允許手動(dòng)錄入資源的用戶界面和/或提供資源信息(例如格式化為XML的供給信息)的API。根據(jù)一個(gè)或多個(gè)實(shí)施方案,可以提供快照工具、導(dǎo)出工具或另一個(gè)工具以從不能夠被遠(yuǎn)程地訪問(wèn)的數(shù)據(jù)中心(例如安全設(shè)施)發(fā)現(xiàn)和導(dǎo)出數(shù)據(jù)到便攜式電子存儲(chǔ)部。發(fā)現(xiàn)模塊176能夠向數(shù)據(jù)收集模塊178和/或數(shù)據(jù)存儲(chǔ)部192提供數(shù)據(jù)。數(shù)據(jù)收集模塊178可以監(jiān)測(cè)所發(fā)現(xiàn)的數(shù)據(jù)中心資源以采集和存儲(chǔ)一個(gè)或多個(gè)資源測(cè)量用于分析。資源測(cè)量可以包括例如CPU性能數(shù)據(jù)、內(nèi)存使用、存儲(chǔ)部使用和性能、溫度傳感器、進(jìn)程表性能、PDU功率使用、UPS狀態(tài)信息、CRAC單元狀態(tài)信息、功率調(diào)節(jié)狀態(tài)信息、開關(guān)配置和狀態(tài)信息、以及致冷器狀態(tài)信息??梢允褂靡粋€(gè)或多個(gè)協(xié)議和/或API (例如SNMP)采集資源測(cè)量。測(cè)量和其他的數(shù)據(jù)可以存儲(chǔ)在電子存儲(chǔ)部(例如數(shù)據(jù)存儲(chǔ)部192)中或從電子存儲(chǔ)部(例如數(shù)據(jù)存儲(chǔ)部192)獲取。分析模塊174可以使用存儲(chǔ)的測(cè)量(例如來(lái)自數(shù)據(jù)存儲(chǔ)部192的測(cè)量)估計(jì)或計(jì)算功率使用。分析模塊174還可以匯集一個(gè)或多個(gè)部件上的功率使用(例如用于服務(wù)器、區(qū)域或數(shù)據(jù)中心的總功率消耗)。分析模塊174可以確定或估計(jì)一個(gè)或多個(gè)部件的熱變化曲線。分析模塊174可以基于接收的溫度數(shù)據(jù)、估計(jì)的溫度數(shù)據(jù)(例如基于功率使用)、其他的數(shù)據(jù)(例如使用數(shù)據(jù)或活動(dòng)數(shù)據(jù))或前述的組合來(lái)估計(jì)熱變化曲線。分析模塊174可以基于一個(gè)或多個(gè)熱變化曲線或匯集的熱變化曲線(例如所匯集的服務(wù)器的部件的、機(jī)架中的設(shè)備的、區(qū)域中的設(shè)備的、區(qū)域中的機(jī)架的、數(shù)據(jù)中心的通道的、整個(gè)數(shù)據(jù)中心的等等的熱變化曲線)估計(jì)冷卻單元的功率要求。分析模塊174可以使用計(jì)算流體動(dòng)力學(xué)(CFD)產(chǎn)生熱變化曲線。根據(jù)某些實(shí)施方案,分析模塊174可以使用與一個(gè)或多個(gè)設(shè)備的邏輯配置相關(guān)聯(lián)的數(shù)據(jù),如在下文參照?qǐng)D2更詳細(xì)地討論的。優(yōu)化器模塊180可以使用來(lái)自分析模塊174的分析數(shù)據(jù)識(shí)別一個(gè)或多個(gè)問(wèn)題。優(yōu)化器模塊180可以產(chǎn)生和提供對(duì)所識(shí)別的問(wèn)題的一個(gè)或多個(gè)建議和/或解決方案。優(yōu)化器模塊180可以進(jìn)行建模以識(shí)別和圖示所建議的改變的影響。根據(jù)某些實(shí)施方案,一個(gè)或多個(gè)策略可以用于識(shí)別改進(jìn)。例如,可以識(shí)別未利用的 部件(例如未使用的服務(wù)器)。如果可能的話,可以去除未利用的部件(例如將其斷電和/或從數(shù)據(jù)中心去除)??梢越M合未充分利用的部件并且可以去除一個(gè)或多個(gè)部件(例如,可以將負(fù)載從第一服務(wù)器轉(zhuǎn)移至第二服務(wù)器并且可以將第二服務(wù)器斷電和/或去除)??梢詫⒌托实牟考?jí)或更換(例如,可以將每秒的事務(wù)處理或每秒的數(shù)據(jù)包與其他的可選擇設(shè)備的功率使用和發(fā)熱進(jìn)行比較)??梢宰R(shí)別熱點(diǎn)。計(jì)算流體動(dòng)力學(xué)可以用于產(chǎn)生數(shù)據(jù)中心內(nèi)的溫度模型??梢曰谝粋€(gè)區(qū)域、多個(gè)區(qū)域或數(shù)據(jù)中心的熱場(chǎng)建議設(shè)備的放置(現(xiàn)有設(shè)備的重新放置或新設(shè)備的放置)??梢园凑諈^(qū)域來(lái)匯集溫度。用戶或管理員可以定制區(qū)域以包括部件、單個(gè)設(shè)備、多個(gè)設(shè)備、一個(gè)機(jī)架、多個(gè)機(jī)架、數(shù)據(jù)中心的通道、或跨過(guò)數(shù)據(jù)中心的其他區(qū)域或部分。區(qū)域可以豎直地(例如整個(gè)機(jī)架的上下方向)、水平地(例如跨過(guò)多個(gè)機(jī)架的所有底部隔間或插槽、或跨過(guò)多個(gè)機(jī)架的頂部?jī)蓚€(gè)隔間或插槽)或在其他的方向(例如跨過(guò)熱或冷通道或沿著單個(gè)通道)聚集部件和/或設(shè)備。根據(jù)某些實(shí)施方案,可以改變冷卻通風(fēng)部、穿孔地磚或其他的冷卻結(jié)構(gòu),以提供數(shù)據(jù)中心的冷卻區(qū)域到較熱區(qū)域的更高效的傳遞,或以引入熱阻擋層以創(chuàng)建熱通道和冷通道之間的隔離。除了一個(gè)或多個(gè)其他的策略之外或代替一個(gè)或多個(gè)其他的策略,可以執(zhí)行這個(gè)策略。根據(jù)某些實(shí)施方案,優(yōu)化器模塊180可以使用與一個(gè)或多個(gè)設(shè)備的邏輯配置相關(guān)聯(lián)的數(shù)據(jù),如在下文參照?qǐng)D2更詳細(xì)地討論的。平臺(tái)170可以與多個(gè)數(shù)據(jù)中心110通信以向數(shù)據(jù)中心提供功率分析數(shù)據(jù),并且在某些實(shí)施例中,所接收的信息與數(shù)據(jù)中心的配置、計(jì)算機(jī)器的在物理級(jí)和/或邏輯級(jí)的用途、和/或功率使用和/或散熱數(shù)據(jù)相關(guān)。在某些實(shí)施例中,由功率分析模塊172向數(shù)據(jù)中心提供的信息可以允許數(shù)據(jù)中心的管理員和/或軟件控制進(jìn)程確定或估計(jì)數(shù)據(jù)中心內(nèi)的設(shè)備的功率使用和/或散熱方面。在某些實(shí)施例中,這提供功率使用與單獨(dú)的計(jì)算機(jī)器的關(guān)聯(lián),或聚集為較大的單元,諸如機(jī)器的組(例如整個(gè)機(jī)架)。在某些實(shí)施例中,可以更精細(xì)地獲得功率使用,例如根據(jù)機(jī)器中的具體的物理部件,或根據(jù)在計(jì)算機(jī)器上執(zhí)行的不同的進(jìn)程或應(yīng)用的分裂的共享(factional share)。參照?qǐng)D2,單元210的物理視圖可以是計(jì)算機(jī)器(例如服務(wù)器計(jì)算機(jī))的物理視圖。單元210的物理視圖可以包括多種分離的物理部件220,例如處理器芯片、磁盤控制器和半導(dǎo)體存儲(chǔ)器件。此外,單元210的物理視圖還可以包括多個(gè)監(jiān)視器230,其可以監(jiān)測(cè)部件的物理屬性,諸如功率使用(例如,瓦特)、散熱(例如散熱器溫度)和操作特性(例如,處理器時(shí)鐘速率、磁盤轉(zhuǎn)速、數(shù)據(jù)信號(hào)傳輸速度)。監(jiān)視器可以是軟件可訪問(wèn)的。繼續(xù)參照?qǐng)D2,單元210的邏輯視圖可以是在單元210的物理視圖中描繪的相同的物理機(jī)器或平臺(tái)的邏輯視圖。單元210邏輯視圖可以包括多個(gè)邏輯/軟件部件240-266。例如,單元210的邏輯視圖可以包括操作系統(tǒng)/內(nèi)核部件240和進(jìn)程250。在一個(gè)或多個(gè)實(shí)施方案中,單元210的邏輯視圖可以包括用于虛擬機(jī)部件262的監(jiān)視器和/或虛擬環(huán)境260 (例如“管理程序”),虛擬機(jī)部件262本身可以包括進(jìn)程264、266和其他的軟件部件。單元210的邏輯視圖還可以包括一個(gè)或多個(gè)軟件監(jiān)視器268,軟件監(jiān)視器268可以提供邏輯/軟件部件的屬性,例如CPU使用率、事務(wù)處理速率(例如每秒的數(shù)據(jù)庫(kù)查詢數(shù)量)和通信速率(例如各種協(xié)議級(jí)的消息或數(shù)據(jù)包),以及配置信息,例如活動(dòng)進(jìn)程的身份、虛擬機(jī)等等。來(lái)自監(jiān)視器230和監(jiān)視器268的信息可以傳遞至平臺(tái)170,平臺(tái)170可以包括功率分析模塊172。根據(jù)某些實(shí)施方案,該模塊可以估計(jì)物理和/或邏輯部件和/或計(jì)算機(jī)器/軟件環(huán)境的功率使用。功率分析模塊172可以使用數(shù)據(jù)存儲(chǔ)部192,數(shù)據(jù)存儲(chǔ)部192可以包括所估計(jì)的統(tǒng)計(jì)參數(shù)以提供在數(shù)據(jù)存儲(chǔ)部192中表示的各種元件的從使用數(shù)據(jù)到所估計(jì)的功率使用的映射。功率估計(jì)可以傳遞至優(yōu)化器模塊180,優(yōu)化器模塊180可以提供所估計(jì)的功率使用的表格化或圖形化的表示。 根據(jù)某些實(shí)施方案,平臺(tái)170還可以包括分析模塊274,分析模塊274可以用于更新數(shù)據(jù)存儲(chǔ)部192。例如,可以基于從數(shù)據(jù)中心接收的數(shù)據(jù)估計(jì)新元件(例如在數(shù)據(jù)中心發(fā)現(xiàn)的之前未看到的部件)的數(shù)據(jù),或可以基于從數(shù)據(jù)中心接收的另外的監(jiān)測(cè)數(shù)據(jù)細(xì)化現(xiàn)有部件的統(tǒng)計(jì)參數(shù)。即,數(shù)據(jù)存儲(chǔ)部192最初可以具有幾乎沒(méi)有可用數(shù)據(jù)的部件的相對(duì)不精確的或過(guò)于保守的估計(jì),并且分析部件可以用于結(jié)合該信息用于數(shù)據(jù)中心監(jiān)測(cè)以改進(jìn)估計(jì)的精確度。作為實(shí)施例,來(lái)自監(jiān)視器230的機(jī)器監(jiān)測(cè)數(shù)據(jù)可以與特定的計(jì)算機(jī)器(例如單元210)相關(guān)聯(lián)。這種相關(guān)聯(lián)的數(shù)據(jù)可以提供至功率分析模塊174。機(jī)器監(jiān)測(cè)數(shù)據(jù)可以包括用于物理部件的數(shù)據(jù)和/或用于邏輯部件的數(shù)據(jù)(例如分別從監(jiān)視器230和268采集)。功率分析模塊174可以利用數(shù)據(jù)存儲(chǔ)部192中的功率配置文件,功率配置文件可以包括與每種類型的部件相關(guān)聯(lián)的(例如與部件類型的標(biāo)識(shí)符相關(guān)聯(lián)的)數(shù)據(jù)。這可以允許從每個(gè)部件的所監(jiān)測(cè)的數(shù)據(jù)到估計(jì)的功率消耗的繪圖(例如基于參數(shù)函數(shù),諸如多項(xiàng)式曲線擬合)。功率分析模塊174的輸出可以是總功率,以及各種物理和/或邏輯部件的功率分配。根據(jù)某些實(shí)施方案,與多個(gè)計(jì)算機(jī)器相關(guān)聯(lián)的功率估計(jì)可以與機(jī)器的位置數(shù)據(jù)組合,以確定數(shù)據(jù)中心的空間功率損耗配置文件。在某些實(shí)施例中,空間配置文件還可以將冷卻設(shè)備的位置考慮在內(nèi),以確定所估計(jì)的散熱或溫度配置文件。應(yīng)當(dāng)理解,雖然在某些實(shí)施方案中分析和功率預(yù)測(cè)功能可以集中,使數(shù)據(jù)中心向集中功能提供監(jiān)測(cè)數(shù)據(jù),其中可以組合功率配置文件數(shù)據(jù)以確定估計(jì)的功率使用。在其他的實(shí)施方案中,功率配置文件數(shù)據(jù)可以分發(fā)至距離數(shù)據(jù)中心較近或距離單獨(dú)的計(jì)算機(jī)器較近的功率估計(jì)部件。在某些這樣的實(shí)施方案中,監(jiān)測(cè)數(shù)據(jù)或這樣的數(shù)據(jù)的匯集或處理后的形式可以提供至中心計(jì)算平臺(tái),在中心計(jì)算平臺(tái)可以增加和/或細(xì)化功率配置文件數(shù)據(jù)。圖3描繪了根據(jù)一種實(shí)施方案的計(jì)算機(jī)系統(tǒng)300的框圖。計(jì)算機(jī)系統(tǒng)300可以適合于實(shí)施根據(jù)一種或多種實(shí)施方案的技術(shù)。計(jì)算機(jī)系統(tǒng)300可以是客戶端、服務(wù)器、網(wǎng)絡(luò)節(jié)點(diǎn)、網(wǎng)關(guān)或其他的網(wǎng)絡(luò)可處理平臺(tái)。計(jì)算機(jī)系統(tǒng)300可以包括總線302,總線302可以 通信地耦合于計(jì)算機(jī)系統(tǒng)300的一個(gè)或多個(gè)部件,例如計(jì)算機(jī)處理器304、存儲(chǔ)器306 (例如RAM(隨機(jī)存取存儲(chǔ)器)、R0M(只讀存儲(chǔ)器)、閃存RAM等等)、輸入/輸出(I/O)控制器308、網(wǎng)絡(luò)接口 310、提供到固定磁盤314的連接的存儲(chǔ)接口 312、可操作以接收可移動(dòng)磁盤318的磁盤驅(qū)動(dòng)器316、通過(guò)顯示適配器320連接的顯示器322、串行端口 324和328、通過(guò)鍵盤控制器332的鍵盤334、可操作以連接SCSI設(shè)備338 (例如存儲(chǔ)部、掃描儀等等)的SCSI適配器336、可操作以接收光盤342的光盤驅(qū)動(dòng)器340以及通過(guò)多媒體接口 344耦合的多媒體設(shè)備346 (例如揚(yáng)聲器、照相機(jī)、話筒等等)。其他的部件可以包括指點(diǎn)設(shè)備330 (例如鼠標(biāo)、軌跡球、控制桿等等,通過(guò)串行端口 328耦合于總線302)、調(diào)制解調(diào)器326 (通過(guò)串行端口 324耦合于總線312)、功率管理器348和電池350。總線302可以允許在計(jì)算機(jī)處理器304、存儲(chǔ)器306和一個(gè)或多個(gè)其他的部件之間的數(shù)據(jù)通信。根據(jù)某些實(shí)施方案,存儲(chǔ)器306可以是主存儲(chǔ)器,其中可以加載操作系統(tǒng)和一個(gè)或多個(gè)應(yīng)用程序。應(yīng)用程序或其他的軟件可以存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)上和通過(guò)計(jì)算機(jī)可讀介質(zhì)訪問(wèn),計(jì)算機(jī)可讀介質(zhì)例如硬盤驅(qū)動(dòng)器(例如固定磁盤314)、光盤驅(qū)動(dòng)器(例如光盤驅(qū)動(dòng)器340)、磁盤驅(qū)動(dòng)器316或其他的存儲(chǔ)介質(zhì)(例如通過(guò)網(wǎng)絡(luò)接口 310訪問(wèn)的網(wǎng)絡(luò)可訪問(wèn)存儲(chǔ)器)。例如,擴(kuò)展名賦值模塊114可以駐留在存儲(chǔ)器306中。存儲(chǔ)接口 312可以連接于用于信息的存儲(chǔ)和檢索的標(biāo)準(zhǔn)計(jì)算機(jī)可讀介質(zhì),例如固定硬盤驅(qū)動(dòng)器314。固定硬盤驅(qū)動(dòng)器314可以是計(jì)算機(jī)系統(tǒng)300的一部分或可以是分離的并且通過(guò)其他的接口系統(tǒng)被訪問(wèn)。調(diào)制解調(diào)器326可以通過(guò)電話鏈路提供到遠(yuǎn)程服務(wù)器的直接連接或通過(guò)因特網(wǎng)服務(wù)提供商(ISP)提供到因特網(wǎng)的直接連接。網(wǎng)絡(luò)接口 310可以通過(guò)直接網(wǎng)絡(luò)鏈路提供到遠(yuǎn)程服務(wù)器的直接連接或通過(guò)P0P(入網(wǎng)點(diǎn))提供到因特網(wǎng)的直接連接。功率管理器348可以監(jiān)測(cè)電池350的功率水平。根據(jù)某些實(shí)施方案,電池350可以是距計(jì)算機(jī)系統(tǒng)300較近或較遠(yuǎn)的不間斷電源(UPS)。在這樣的實(shí)施方案中,功率管理器348可以提供關(guān)于UPS的功率水平的信息。其他的設(shè)備或部件可以以相似的方式連接(例如數(shù)字照相機(jī)、不間斷電源等等)。圖3的部件不是必要的,并且圖示的部件中的一個(gè)或多個(gè)可以在實(shí)施方案中不存在。在某些實(shí)施方案中,可以包括相同類型的多個(gè)部件(例如多個(gè)計(jì)算機(jī)處理器304、多個(gè)存儲(chǔ)接口 312等等)。設(shè)備和子系統(tǒng)可以以與圖3中示出的方式不同的方式互相連接。用于實(shí)施一個(gè)或多個(gè)實(shí)施方案的代碼可以存儲(chǔ)在計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,例如存儲(chǔ)器306、固定磁盤314、光盤342或可移動(dòng)磁盤318中的一個(gè)或多個(gè)。用于實(shí)施一個(gè)或多個(gè)實(shí)施方案的代碼還可以通過(guò)一個(gè)或多個(gè)接口接收并且存儲(chǔ)在存儲(chǔ)器中。設(shè)置在計(jì)算機(jī)系統(tǒng)300上的操作系統(tǒng)可以是 MS- WINDOWS 、UNIX 、Linux 、Mac OS 、Mac OS X 或另一種操作系統(tǒng)。參照?qǐng)D4,示出了根據(jù)本公開內(nèi)容的實(shí)施方案的功率分析模塊410。如圖示的,功率分析模塊410可以含有一個(gè)或多個(gè)部件,包括部件檢測(cè)模塊412、部件配置文件模塊414、部件監(jiān)測(cè)模塊416、邏輯分析模塊418、部件分析模塊420、區(qū)域和中心分析模塊422、優(yōu)化策略模塊424以及錯(cuò)誤記錄和報(bào)告模塊426。部件檢測(cè)模塊412可以使用一種或多種方法識(shí)別和編目數(shù)據(jù)中心資源。例如,部件檢測(cè)模塊412可以使用簡(jiǎn)單網(wǎng)絡(luò)管理協(xié)議(SNMP)、存儲(chǔ)管理計(jì)劃規(guī)范(SMI-S)、智能平臺(tái)管理接口 (IPMI)、Windows管理規(guī)范(WMI)、安全外殼(SSH)、BACNet、ModBus和/或私有 協(xié)議中的一個(gè)或多個(gè)來(lái)識(shí)別數(shù)據(jù)中心的資源。根據(jù)某些實(shí)施方案,部件檢測(cè)模塊412可以提供允許手動(dòng)錄入資源的用戶界面和/或允許提供資源信息(例如格式化為XML的供應(yīng)信息)的API。根據(jù)一個(gè)或多個(gè)實(shí)施方案,可以提供快照工具、導(dǎo)出工具或另一種工具以從不能夠被遠(yuǎn)程訪問(wèn)的數(shù)據(jù)中心(例如安全設(shè)施)發(fā)現(xiàn)和導(dǎo)出數(shù)據(jù)到便攜式電子存儲(chǔ)部。部件配置文件模塊414可以存儲(chǔ)關(guān)于多種數(shù)據(jù)中心資產(chǎn)的經(jīng)銷商可靠性和功率規(guī)格配置文件數(shù)據(jù)。這種數(shù)據(jù)可以用于估計(jì)資產(chǎn)的功率和可靠性。數(shù)據(jù)可以包括一個(gè)或多個(gè)數(shù)據(jù)中心的資產(chǎn)的資產(chǎn)數(shù)據(jù)、配置文件數(shù)據(jù)、地理空間數(shù)據(jù)和相關(guān)數(shù)據(jù)。這些類型的數(shù)據(jù)可以人工發(fā)現(xiàn)、導(dǎo)入或鍵入。歷史數(shù)據(jù)、分析數(shù)據(jù)和可靠性數(shù)據(jù)可以是計(jì)算結(jié)果、所搜集的資產(chǎn)的調(diào)查數(shù)據(jù)或二者的組合。部件配置文件模塊414可以通過(guò)基于從數(shù)據(jù)中心接收的信息增加和/或修正數(shù)據(jù)庫(kù)中數(shù)據(jù)來(lái)維護(hù)數(shù)據(jù)。部件監(jiān)測(cè)模塊416可以監(jiān)測(cè)數(shù)據(jù)中心的所發(fā)現(xiàn)的資源以采集和存儲(chǔ)一個(gè)或多個(gè)資源測(cè)量以進(jìn)行分析。資源測(cè)量可以包括例如CPU性能數(shù)據(jù)、內(nèi)存使用、存儲(chǔ)部使用和性能、溫度傳感器、進(jìn)程表性能、PDU功率使用、UPS狀態(tài)信息、CRAC單元狀態(tài)信息、功率調(diào)節(jié)狀態(tài)信息、開關(guān)配置和狀態(tài)信息、以及制冷器狀態(tài)信息??梢允褂靡环N或多種協(xié)議和/或API (例如SNMP)采集資源測(cè)量。測(cè)量和其他的數(shù)據(jù)可以存儲(chǔ)在電子存儲(chǔ)部(例如數(shù)據(jù)存儲(chǔ)部192)中或從電子存儲(chǔ)部(例如數(shù)據(jù)存儲(chǔ)部192)中獲取。 邏輯分析模塊418可以使用所存儲(chǔ)的測(cè)量(例如來(lái)自數(shù)據(jù)存儲(chǔ)部192的測(cè)量)估計(jì)或計(jì)算功率使用。邏輯分析模塊418可以使用與一個(gè)或多個(gè)設(shè)備的邏輯配置相關(guān)聯(lián)的數(shù)據(jù)(例如CPU使用率、事務(wù)處理速率(例如每秒的數(shù)據(jù)庫(kù)查詢數(shù)量)和通信速率(例如各種協(xié)議級(jí)別的消息或數(shù)據(jù)包),以及配置信息,例如活動(dòng)進(jìn)程的身份、虛擬機(jī)等等)。活動(dòng)進(jìn)程的身份可以用于基于歷史數(shù)據(jù)、配置文件數(shù)據(jù)或其他的數(shù)據(jù)來(lái)估計(jì)功率使用(例如,報(bào)告進(jìn)程的數(shù)據(jù)庫(kù)可以已知為是使用涉及大計(jì)算負(fù)荷和頻繁磁盤存取的進(jìn)程的強(qiáng)功率(intensive power))??梢詫?duì)一個(gè)或多個(gè)物理部件或設(shè)備繪制邏輯利用率以估計(jì)功率使用、散熱和其他的影響數(shù)據(jù)中心成本和性能的因素。部件分析模塊420可以使用所存儲(chǔ)的測(cè)量(例如來(lái)自數(shù)據(jù)存儲(chǔ)部192的測(cè)量)估計(jì)或計(jì)算一個(gè)或多個(gè)部件的功率使用。部件分析模塊420可以使用所接收的實(shí)際測(cè)量、歷史數(shù)據(jù)和配置文件數(shù)據(jù)(例如制造商的規(guī)格或其他的與部件或設(shè)備相關(guān)聯(lián)的統(tǒng)計(jì)數(shù)據(jù))計(jì)算和/或估計(jì)部件或設(shè)備的功率使用和熱性質(zhì)。設(shè)備或部件的功率使用可以用于估計(jì)散熱和相關(guān)聯(lián)的冷卻成本。區(qū)域和中心分析模塊422可以匯集一個(gè)或多個(gè)部件、設(shè)備或數(shù)據(jù)中心的部分上的功率使用(例如服務(wù)器、區(qū)域或數(shù)據(jù)中心的總功率消耗)。區(qū)域和中心分析模塊422可以確定或估計(jì)一個(gè)或多個(gè)部件的熱變化曲線。區(qū)域和中心分析模塊422可以基于所接收的溫度數(shù)據(jù)、估計(jì)的溫度數(shù)據(jù)(例如基于功率使用)、其他的數(shù)據(jù)(例如使用數(shù)據(jù)或活動(dòng)數(shù)據(jù))或前述的組合來(lái)估計(jì)熱變化曲線。區(qū)域和中心分析模塊422可以基于一個(gè)或多個(gè)熱變化曲線或匯集的熱變化曲線(例如所匯集的服務(wù)器的部件的、機(jī)架中的設(shè)備的、區(qū)域中的設(shè)備的、區(qū)域中的機(jī)架的、數(shù)據(jù)中心的通道的、整個(gè)數(shù)據(jù)中心的等等的熱變化曲線)估計(jì)冷卻單元的功率要求。區(qū)域和中心分析模塊422可以使用計(jì)算流體動(dòng)力學(xué)(CFD)產(chǎn)生熱變化曲線。優(yōu)化策略模塊424可以使用分析數(shù)據(jù)來(lái)識(shí)別一個(gè)或多個(gè)問(wèn)題。優(yōu)化策略模塊424可以產(chǎn)生和提供對(duì)所識(shí)別的問(wèn)題的一個(gè)或多個(gè)建議和/或解決方案。優(yōu)化策略模塊424可以進(jìn)行建模以識(shí)別和圖示所建議的改變的影響。根據(jù)某些實(shí)施方案,一個(gè)或多個(gè)策略可以用于識(shí)別改進(jìn)。例如,可以識(shí)別未利用的部件(例如未使用的服務(wù)器(即,“僵尸服務(wù)器”))。如果可能的話,可以去除未利用的部件(例如將其斷電和/或從數(shù)據(jù)中心去除)。可以組合未充分利用的部件并且可以去除一個(gè)或多個(gè)部件(例如,可以將負(fù)載從第一服務(wù)器轉(zhuǎn)移至第二服務(wù)器并且可以將第二服務(wù)器斷電和/或去除)??梢詫⒌托实牟考?jí)或更換(例如,可以將每秒的事務(wù)處理或每秒的數(shù)據(jù)包與其他的可選擇設(shè)備的功率使用和發(fā)熱進(jìn)行比較)。可以識(shí)別熱點(diǎn)。計(jì)算流體動(dòng)力學(xué)可以用于產(chǎn)生數(shù)據(jù)中心內(nèi)的溫度模型??梢园凑諈^(qū)域來(lái)匯集溫度。用戶或管理員可以定制區(qū)域以包括部件、單個(gè)設(shè)備、多個(gè)設(shè)備、一個(gè)機(jī)架、多個(gè)機(jī)架、數(shù)據(jù)中心的通道、或跨過(guò)數(shù)據(jù)中心的其他區(qū)域或部分。區(qū)域可以豎直地(例如整個(gè)機(jī)架的上下方向)、水平地(例如跨過(guò)多個(gè)機(jī)架的所有底部隔間或插槽、或跨過(guò)多個(gè)機(jī)架的頂部?jī)蓚€(gè)隔間或插槽)或在其他的方向(例如跨過(guò)熱或冷通道或沿著單個(gè)通道)聚集部件和/或設(shè)備。根據(jù)某些實(shí)施方案,根據(jù)某些實(shí)施方案,優(yōu)化策略模塊424可以使用與邏輯配置相關(guān)聯(lián)的數(shù)據(jù)。來(lái)自優(yōu)化策略模塊424的輸出可以是用戶顯示(例如網(wǎng)頁(yè))、報(bào)告、警報(bào)(SMS消息、電子郵件等等)和其他的電子通信。錯(cuò)誤日志和報(bào)告模塊426可以產(chǎn)生日志、報(bào)告或其他的與計(jì)算平臺(tái)部件的功率分 析相關(guān)聯(lián)的信息。參照?qǐng)D5,描繪了根據(jù)本公開內(nèi)容的實(shí)施方案的用于計(jì)算平臺(tái)部件的功率分析的方法500。在塊502,方法500可以開始。在塊504,可以接收關(guān)于部件的信息??梢园l(fā)現(xiàn)或可以從數(shù)據(jù)中心輸出或通過(guò)用戶錄入接收信息。發(fā)現(xiàn)可以使用一種或多種方法識(shí)別和編目數(shù)據(jù)中心資源。例如,發(fā)現(xiàn)可以使用簡(jiǎn)單網(wǎng)絡(luò)管理協(xié)議(SNMP)、存儲(chǔ)管理計(jì)劃規(guī)范(SMI-S)、智能平臺(tái)管理接口(IPMI)、Windows管理規(guī)范(WMI)、安全外殼(SSH)、BACNet、ModBus和/或私有協(xié)議中的一個(gè)或多個(gè)來(lái)識(shí)別數(shù)據(jù)中心的資源。根據(jù)某些實(shí)施方案,發(fā)現(xiàn)進(jìn)程可以提供允許手動(dòng)錄入資源的用戶界面和/或允許提供資源信息(例如格式化為XML的供應(yīng)信息)的API。根據(jù)一個(gè)或多個(gè)實(shí)施方案,可以提供快照工具、導(dǎo)出工具或另一種工具以從不能遠(yuǎn)程訪問(wèn)的數(shù)據(jù)中心(例如安全設(shè)施)發(fā)現(xiàn)和導(dǎo)出數(shù)據(jù)到便攜式電子存儲(chǔ)部。在塊506,方法500可以確定所發(fā)現(xiàn)的部件是否被識(shí)別。方法500可以訪問(wèn)電子資源庫(kù)以試圖使用一個(gè)或多個(gè)發(fā)現(xiàn)的屬性來(lái)匹配發(fā)現(xiàn)的部件。如果部件被識(shí)別,那么方法500可以在塊512繼續(xù)。如果部件不被識(shí)別,那么方法500可以在塊508繼續(xù)。在塊508,可以請(qǐng)求關(guān)于發(fā)現(xiàn)的但是未被識(shí)別的部件的數(shù)據(jù)。方法500可以將電子通信發(fā)送至用戶或管理員(例如SMS消息、電子郵件),可以在用戶界面或報(bào)告上列出未被識(shí)別的部件,或可以以其他方式提示用戶或管理員與未被識(shí)別的部件相關(guān)聯(lián)的配置文件數(shù)據(jù)。在塊510,可以通過(guò)用戶輸入或另一個(gè)界面(例如使用新的制造商的規(guī)范更新已知的配置文件數(shù)據(jù)的刷新)接收數(shù)據(jù)。在接收配置文件數(shù)據(jù)之后,該方法可以更新配置文件數(shù)據(jù)資源庫(kù)并且以其他方式處理接收的配置文件數(shù)據(jù)。然后該方法可以在塊514繼續(xù)。在塊512,可以從電子資源庫(kù)獲取部件配置文件數(shù)據(jù)。配置文件數(shù)據(jù)可以包括歷史的和/或估計(jì)的功率使用、熱性質(zhì)(例如產(chǎn)生的熱)、相關(guān)聯(lián)的邏輯過(guò)程(例如驅(qū)動(dòng)器)以及其他的數(shù)據(jù)。在塊514,邏輯基礎(chǔ)架構(gòu)或部件可以被對(duì)物理部件繪圖。例如,內(nèi)核或0/S部件、進(jìn)程、線程、應(yīng)用程序、虛擬機(jī)和/或虛擬機(jī)的進(jìn)程、線程和應(yīng)用程序可以與物理部件相關(guān)聯(lián)。例如,報(bào)告進(jìn)程可以與磁盤陣列或其他的電子存儲(chǔ)部上的負(fù)荷相關(guān)聯(lián),以方便功率使用和產(chǎn)生的熱的估計(jì)。在塊516,可以監(jiān)測(cè)物理和/或邏輯部件。監(jiān)測(cè)可以以一個(gè)或多個(gè)精度級(jí)別(例如處理器、磁盤控制器、刀片服務(wù)器、機(jī)架、區(qū)域、數(shù)據(jù)中心通道、數(shù)據(jù)中心、跨過(guò)多個(gè)數(shù)據(jù)中心的業(yè)務(wù)單元/客戶端/成本中心等等)采集數(shù)據(jù)。在塊518,可以基于存儲(chǔ)的數(shù)據(jù)配置功率使用和熱性質(zhì)。還可以基于所監(jiān)測(cè)的邏輯和物理部件計(jì)算功率使用。測(cè)量的功率使用和/或配置的(profiled)功率使用可以被平均、匯集或以其他方式處理以確定在一個(gè)或多個(gè)精度級(jí)別的功率使用輸出。計(jì)算和估計(jì)的類型和數(shù)量可以取決于測(cè)量的量值的可用性、為了獲得這樣的量值的潛在的干涉性和影響或負(fù)載、所配置的數(shù)據(jù)或歷史數(shù)據(jù)的可用性和其他的因素。用于獲得數(shù)據(jù)的負(fù)載可以被在數(shù)據(jù)中心中最小化至可能的程度(例如,在較低的峰值使用時(shí)間收集并且在較高的負(fù)載估計(jì)的,或收集但是被以較低的峰值使用時(shí)間傳輸)。在塊520,由一個(gè)或多個(gè)部件產(chǎn)生和散發(fā)的熱可以基于功率使用測(cè)量、功率使用估計(jì)、熱配置文件數(shù)據(jù)和其他的因素來(lái)估計(jì)??梢允褂糜?jì)算流體動(dòng)力學(xué)計(jì)算。 在塊522,方法500可以確定是否仍然存在要發(fā)現(xiàn)和/或分析的其他的部件。如果仍然存在要發(fā)現(xiàn)和/或分析的其他的部件,那么該方法可以返回至塊504。如果不存在其他的部件,那么該方法可以在塊524繼續(xù)。在塊524,方法524可以提供與功率使用相關(guān)聯(lián)的輸出。輸出可以是用戶顯示(例如網(wǎng)頁(yè))、報(bào)告、警報(bào)(SMS消息、電子郵件等等)和其他的電子通信。在塊526,方法500可以結(jié)束。參照?qǐng)D6,描繪了根據(jù)本公開內(nèi)容的實(shí)施方案的用于計(jì)算平臺(tái)部件的功率分析的方法600。在塊602,方法600可以開始。在塊604,方法可以分析功率使用和溫度輸出以識(shí)別一個(gè)或多個(gè)問(wèn)題、熱點(diǎn)和/或優(yōu)化策略??梢赃M(jìn)行建模以識(shí)別和圖示所建議的改變的影響。根據(jù)某些實(shí)施方案,一個(gè)或多個(gè)策略可以用于識(shí)別改進(jìn)。一個(gè)或多個(gè)量值可以用于確定利用率、效率和部件因素。例如,CPU使用率、磁盤使用率和存取模式、可以相對(duì)于功率使用和/或散熱測(cè)量數(shù)據(jù)吞吐量和其他的因素。在塊606,該方法可以確定是否可以識(shí)別未利用的部件(例如未使用的服務(wù)器)。如果識(shí)別了未利用的部件,那么方法可以在塊608繼續(xù)。如果沒(méi)有識(shí)別未利用的部件,那么方法可以在塊610繼續(xù)。在塊608,可以去除未利用的部件(例如將其斷電和/或從數(shù)據(jù)中心去除)。在塊610,該方法可以確定是否具有任何未被充分利用的部件。如果具有未被充分利用的部件,那么該方法可以在塊612繼續(xù)。如果不具有未被充分利用的部件,那么該方法可以在塊614繼續(xù)。在塊612,可以組合未被充分利用的部件并且可以去除一個(gè)或多個(gè)部件(例如,可以將負(fù)載從第一服務(wù)器轉(zhuǎn)移至第二服務(wù)器并且可以將第二服務(wù)器斷電和/或去除)。在塊614,該方法可以確定是否檢測(cè)到任何低效率的部件。如果檢測(cè)到低效率的部件,那么該方法可以在塊616繼續(xù)。如果未檢測(cè)到一個(gè)或多個(gè)低效率的部件,那么該方法可以在塊618繼續(xù)。
在塊616,可以升級(jí)或更換低效率的部件(例如,可以將每秒的事務(wù)處理或每秒的數(shù)據(jù)包與其他的可選擇設(shè)備的功率使用和發(fā)熱比較)。在塊618,可以將部件和/或設(shè)備按區(qū)域進(jìn)行分類和/或組織。分析可以根據(jù)所識(shí)別的區(qū)域被分組或匯集。可以識(shí)別熱點(diǎn)。計(jì)算流體動(dòng)力學(xué)可以用于產(chǎn)生數(shù)據(jù)中心內(nèi)的溫度模型。在塊620,可以確定是否具有任何熱點(diǎn)。如果識(shí)別了熱點(diǎn),那么該方法600可以在塊622繼續(xù)。如果沒(méi)有識(shí)別熱點(diǎn),那么該方法可以在塊624結(jié)束。在塊622,可以基于一個(gè)區(qū)域、多個(gè)區(qū)域或數(shù)據(jù)中心的熱場(chǎng)建議設(shè)備的放置(現(xiàn)有設(shè)備的重新放置或新設(shè)備的放置)。根據(jù)某些實(shí)施方案,可以改變冷卻通風(fēng)部、穿孔地磚或其他的冷卻結(jié)構(gòu),以提供數(shù)據(jù)中心的冷卻區(qū)域到較熱區(qū)域的更高效的傳遞,或以引入熱阻擋層以創(chuàng)建熱通道和冷通道之間的隔離。除了一個(gè)或多個(gè)其他的策略之外或代替一個(gè)或多、個(gè)其他的策略,可以執(zhí)行這個(gè)策略。在塊624,方法600可以結(jié)束。根據(jù)某些實(shí)施方案,數(shù)據(jù)中心功率分析軟件可以發(fā)現(xiàn)數(shù)據(jù)中心的資產(chǎn)并且周期性地收集利用率數(shù)據(jù)和環(huán)境數(shù)據(jù),以提供分析、優(yōu)化和控制機(jī)制。這些機(jī)制可以協(xié)作地工作以優(yōu)化功率、冷卻、空間和可靠性,從而最大化數(shù)據(jù)中心效率。此外,這種環(huán)境數(shù)據(jù)的一個(gè)或多個(gè)部分可以被向應(yīng)用程序上繪圖。這可以提供數(shù)據(jù)中心效率和使用的可選擇的業(yè)務(wù)水平視圖。根據(jù)某些實(shí)施方案,軟件可以發(fā)現(xiàn)、收集、分析并且然后優(yōu)化數(shù)據(jù)中心部件。根據(jù)某些實(shí)施方案,為了遵照該流程,可以將軟件體系結(jié)構(gòu)組織為三個(gè)主要的邏輯處理域。這些處理域可以是發(fā)現(xiàn)引擎、數(shù)據(jù)收集器和分析引擎。處理域的邏輯視圖可以是自然邊界,通過(guò)自然邊界特征設(shè)置可以被內(nèi)容定義并且工作可以被分割。此外,從功能的觀點(diǎn)來(lái)看,這些域中的每個(gè)可以與其他的域相互獨(dú)立,其功能可以被容易地分解或代替同時(shí)對(duì)系統(tǒng)的其余部分具有最小的影響。根據(jù)某些實(shí)施方案,體系結(jié)構(gòu)可以支持必須操縱數(shù)百萬(wàn)個(gè)數(shù)據(jù)中心的元件的產(chǎn)品。這可以包括調(diào)查的數(shù)據(jù)、分析、優(yōu)化、控制、發(fā)現(xiàn)和/或報(bào)告。這進(jìn)而可以需要體系結(jié)構(gòu)的元件在分布式環(huán)境中操作,使得可以劃分工作。每個(gè)部件在設(shè)計(jì)時(shí)應(yīng)當(dāng)考慮這些因素。根據(jù)一個(gè)或多個(gè)實(shí)施方案,體系結(jié)構(gòu)可以足夠靈活,以允許功能的主要部分被取代,而不影響系統(tǒng)的其余部分。這可以利用在系統(tǒng)的主要部件之間的定義明確的接口和抽象層。此外,可能的是,分析特征的集合可以非常頻繁地改變。作為結(jié)果,框架可以存在,以允許新的分析特征的迅速利用和可能地在地理上分散的開發(fā)。最后,系統(tǒng)中的某些分析特征可以是部分托管的服務(wù),而某些可能僅為本地服務(wù)。分析框架可以能夠操縱這些模型。根據(jù)某些實(shí)施方案,諸如計(jì)算流體動(dòng)力學(xué)(CFD)分析和某些報(bào)告的許多產(chǎn)品特征的運(yùn)行可以需要耗費(fèi)以小時(shí)計(jì)的時(shí)間。其他的特征可能耗費(fèi)數(shù)秒。對(duì)于一般的體系結(jié)構(gòu),性能考慮和實(shí)踐可以在部件的設(shè)計(jì)時(shí)考慮,因?yàn)槊恳粋€(gè)可能具有不同的性能要求。每個(gè)特征或系統(tǒng)部件可以以不干擾可能需要迅速響應(yīng)的關(guān)鍵任務(wù)(例如輪詢和交互任務(wù))的方式操作。此外,軟件可以對(duì)其正在監(jiān)測(cè)的實(shí)體具有最小的影響。根據(jù)某些實(shí)施方案,體系結(jié)構(gòu)中的一個(gè)或多個(gè)主要部件的邏輯視圖可以被分類為多個(gè)不同的功能和責(zé)任區(qū)域。圖7描繪了根據(jù)一個(gè)或多個(gè)實(shí)施方案的主要部件。在下文更詳細(xì)地描述圖7的每個(gè)部件。發(fā)現(xiàn)引擎可以是負(fù)責(zé)發(fā)現(xiàn)數(shù)據(jù)中心內(nèi)的對(duì)象并且將它們存儲(chǔ)在系統(tǒng)的資產(chǎn)數(shù)據(jù)庫(kù)中的實(shí)體。這些對(duì)象可以包括物理資產(chǎn)和邏輯資產(chǎn)二者。發(fā)現(xiàn)引擎可以支持多種用于實(shí)現(xiàn)這一點(diǎn)的協(xié)議和方法,包括但不限于SNMP、SMI-S、IPMI、WMI、SSH、BACNet、ModBus和/或私有協(xié)議。數(shù)據(jù)收集器可以周期性地收集關(guān)于資產(chǎn)數(shù)據(jù)庫(kù)中的所述對(duì)象的利用率數(shù)據(jù)和環(huán)境數(shù)據(jù)。與發(fā)現(xiàn)引擎很相似地,數(shù)據(jù)收集器可以支持很多協(xié)議和方法。分析引擎可以提供支持性設(shè)施的綜合的框架和集合,以用于分析、優(yōu)化和控制特征??蚣芸梢允亲畲蠡a的再使用率并且允許快速和獨(dú)立地開發(fā)特征的管道和過(guò)濾器設(shè)計(jì)。
對(duì)象模型可以是資產(chǎn)、相關(guān)聯(lián)的數(shù)據(jù)、以及在存儲(chǔ)在電子存儲(chǔ)部(例如數(shù)據(jù)庫(kù))中的資產(chǎn)之間的關(guān)系的代表。該層可以貫穿所有的三個(gè)處理域。這可以提供普遍的用于向所有的三個(gè)處理域的提取和訪問(wèn)的方法。圖7的管理層和配置對(duì)象可以是對(duì)象模型的管理代表。其可以含有用于在用戶界面(UI)和系統(tǒng)的一個(gè)或多個(gè)其他部分之間通信狀態(tài)、配置、同步和控制信息的對(duì)象。其主要目的之一可以是允許對(duì)象模型的管理視圖從處理域的視圖變化。在該級(jí)可以包括從對(duì)象模型到管理模型的翻譯層。圖7的持久層對(duì)象可以是對(duì)象模型的持久層代表。其可以是負(fù)責(zé)在對(duì)象模型代表對(duì)象和持久層代表對(duì)象之間的翻譯的層。其還可以含有用于表格管理、查詢和數(shù)據(jù)庫(kù)管理的邏輯。根據(jù)某些實(shí)施方案,GxDB可以是向系統(tǒng)提供關(guān)于多種數(shù)據(jù)中心資產(chǎn)的經(jīng)銷商可靠性和功率規(guī)格配置文件數(shù)據(jù)的托管服務(wù)。該數(shù)據(jù)可以與發(fā)現(xiàn)引擎和分析引擎結(jié)合使用,以估計(jì)功率和可靠性而無(wú)需周期性搜集實(shí)際的資產(chǎn)利用率數(shù)據(jù)。分析引擎可以含有用于與GxDB中的具體的資產(chǎn)類型通信的設(shè)施以及用于查詢關(guān)于GxDB中的具體的資產(chǎn)類型的信息的邏輯。根據(jù)至少一個(gè)實(shí)施方案,可以具有兩種主要的由系統(tǒng)存儲(chǔ)的數(shù)據(jù)類型。GxBD可以含有描述資產(chǎn)和它們的特征的數(shù)據(jù)以及周期性地收集或計(jì)算的數(shù)據(jù)。資產(chǎn)數(shù)據(jù)、配置文件數(shù)據(jù)、地理空間數(shù)據(jù)和依賴性數(shù)據(jù)都可以描述數(shù)據(jù)中心的資產(chǎn)。這些類型的數(shù)據(jù)可以手動(dòng) 地發(fā)現(xiàn)、導(dǎo)入或鍵入。歷史數(shù)據(jù)、分析數(shù)據(jù)和可靠性數(shù)據(jù)可以是由分析引擎寫入的計(jì)算結(jié)果或所搜集的來(lái)自在數(shù)據(jù)中心中發(fā)現(xiàn)的資產(chǎn)的調(diào)查數(shù)據(jù)。根據(jù)某些實(shí)施方案,系統(tǒng)中的數(shù)據(jù)可以被組織為三個(gè)主要的邏輯模型。這些模型可以是對(duì)象模型、持久模型和管理層模型。這些模型可以允許在軟件的不同的水平的提取數(shù)據(jù)組織和獨(dú)立數(shù)據(jù)組織二者。這還可以允許每個(gè)層獨(dú)立于其他的層而變化,僅使薄的翻譯層受到影響。數(shù)據(jù)模型可以水平地?cái)U(kuò)展,以表示多種設(shè)備和這些設(shè)備的相關(guān)聯(lián)的數(shù)據(jù)。其還可以適應(yīng)較寬范圍的收集數(shù)據(jù)和計(jì)算數(shù)據(jù)。隨時(shí)間推移所存儲(chǔ)的收集數(shù)據(jù)的量可以在數(shù)十TB的范圍內(nèi)。數(shù)據(jù)可以以允許快速存取而幾乎沒(méi)有競(jìng)爭(zhēng)的方式進(jìn)行組織和分割。在至少一個(gè)實(shí)施方案中,數(shù)據(jù)模型可以足夠靈活,以適應(yīng)模型的不同層的變化,而不影響模型層的其余部分。例如,持久層的變化可以不影響管理層模型或任何其他的對(duì)復(fù)制模型之間的數(shù)據(jù)的薄的翻譯層的代碼接受。在本文中的性能可以是指對(duì)象從一個(gè)層向另一個(gè)層的翻譯以及數(shù)據(jù)存取。通常,設(shè)備屬性在層之間的復(fù)制可以是少量的數(shù)據(jù)。然而,被收集的數(shù)據(jù)在層之間的復(fù)制可以由于大數(shù)量被避免。此外,對(duì)數(shù)據(jù)的訪問(wèn)可以能夠同時(shí)地適應(yīng)至少數(shù)百次事務(wù)處理。對(duì)象模型層可以是由收集引擎、發(fā)現(xiàn)引擎和分析引擎共享和直接使用的視圖。其可以包括7種不同的主要類別的數(shù)據(jù)資產(chǎn)數(shù)據(jù)、歷史數(shù)據(jù)、分析數(shù)據(jù)、地理空間數(shù)據(jù)、可靠性/功率配置文件數(shù)據(jù)、計(jì)算的可靠性數(shù)據(jù)以及依賴性數(shù)據(jù)。在以下的部分更詳細(xì)地描述這些種類中的每一類。資產(chǎn)數(shù)據(jù)可以描述數(shù)據(jù)中心的軟件資產(chǎn)和硬件資產(chǎn)以及它們?nèi)绾伪舜讼嚓P(guān)。其可以包括屬性,例如設(shè)備的地址、訪問(wèn)設(shè)備的方法以及設(shè)備的類型。其可以是回答問(wèn)題“這是什么以及我如何尋址它”的元數(shù)據(jù)。歷史數(shù)據(jù)可以是從資產(chǎn)收集的實(shí)際使用數(shù)據(jù)。例如,對(duì)于磁盤驅(qū)動(dòng)器,其可以是多 個(gè)被轉(zhuǎn)移的塊,并且對(duì)于CPU,其可以是非空閑時(shí)間的百分比??梢噪S時(shí)間推移以周期性的間隔收集這種數(shù)據(jù)并且可以將其用于獲取其他的數(shù)據(jù),例如實(shí)際功率利用率。分析數(shù)據(jù)可以大體上指從其他類型的數(shù)據(jù)的組合計(jì)算的數(shù)據(jù)。例如,可以使用歷史數(shù)據(jù)或配置文件數(shù)據(jù)中的一個(gè)及資產(chǎn)數(shù)據(jù)、地理空間數(shù)據(jù)的組合來(lái)計(jì)算CFD分析數(shù)據(jù)。地理空間數(shù)據(jù)可以是描述資產(chǎn)或甚至非資產(chǎn)例如門或窗的物理尺寸和放置的元數(shù)據(jù)。例如,這種數(shù)據(jù)可以用于計(jì)算封閉空間中的環(huán)境方面,例如空氣流和溫度。配置文件數(shù)據(jù)可以是描述資產(chǎn)的功率/溫度足跡和設(shè)備的可靠性特征的元數(shù)據(jù)。這種數(shù)據(jù)可以在例如GxDB中使用,使得可以估計(jì)功率,而無(wú)需收集歷史利用率數(shù)據(jù)。根據(jù)某些實(shí)施方案,計(jì)算的可靠性數(shù)據(jù)可以簡(jiǎn)單地是系統(tǒng)的基于環(huán)境的正在進(jìn)行的被計(jì)算的可靠性。其可以從更寬泛的分析數(shù)據(jù)分離地調(diào)用,以強(qiáng)調(diào)其的與可靠性配置文件數(shù)據(jù)的差異。依賴性數(shù)據(jù)可以是描述資產(chǎn)之間的依賴性的元數(shù)據(jù)。例如,進(jìn)程依賴于服務(wù)器和存儲(chǔ)陣列以及存儲(chǔ)陣列內(nèi)含有的物理驅(qū)動(dòng)器的集合。該數(shù)據(jù)可以用于例如分析服務(wù)的端對(duì)端的可靠性。持久性模型可以提取數(shù)據(jù)如何被從系統(tǒng)的其余部分存儲(chǔ)。其可以由在對(duì)象模型和持續(xù)模型之間翻譯以進(jìn)行修改和查詢二者的薄層組成。該層還可以含有在數(shù)據(jù)中心功率分析產(chǎn)品中使用的用于數(shù)據(jù)庫(kù)的維護(hù)和管理的邏輯。持久層的架構(gòu)可以是對(duì)象模型的標(biāo)準(zhǔn)化的代表。架構(gòu)還可以以最大化數(shù)據(jù)的高效檢索和存儲(chǔ)的方式布局。數(shù)據(jù)存取層可以是從關(guān)于數(shù)據(jù)庫(kù)查詢、事務(wù)處理和表格操作的細(xì)節(jié)提取的對(duì)象的
隹A
口 O數(shù)據(jù)庫(kù)管理總監(jiān)可以是管理數(shù)據(jù)庫(kù)的子系統(tǒng)。其可以管理數(shù)據(jù)庫(kù)創(chuàng)建,包括架構(gòu)的實(shí)現(xiàn)、數(shù)據(jù)庫(kù)毀壞、數(shù)據(jù)庫(kù)備份/恢復(fù)、架構(gòu)升級(jí)、表格維護(hù)和空間管理。管理層模型可以從系統(tǒng)的其余部分提取對(duì)象模型的管理級(jí)視圖。其可以由向和從對(duì)象模型視圖翻譯的薄層組成。分析引擎可以是管理數(shù)據(jù)中心功率分析軟件中的報(bào)告特征、分析特征、優(yōu)化特征和控制特征的域。其可以以最大化代碼在多個(gè)特征中的反復(fù)使用率、提供對(duì)獨(dú)立開發(fā)的自然提取以及向要改變的特征的集合提供最大的靈活性(甚至在必要時(shí)動(dòng)態(tài)地)的方式設(shè)計(jì)結(jié)構(gòu)。其可以是可以擴(kuò)展以同時(shí)處理許多任務(wù)(無(wú)論這些任務(wù)是針對(duì)相同的特征還是不同的特征)的多任務(wù)狀態(tài)機(jī)。分析引擎可以擴(kuò)展以在非常大的量的數(shù)據(jù)上同時(shí)地處理數(shù)百個(gè)任務(wù)。這些任務(wù)可以包括需要實(shí)時(shí)狀態(tài)和返回?cái)?shù)據(jù)的由用戶發(fā)起的任務(wù)以及不需要返回?cái)?shù)據(jù)和基于日志的狀態(tài)的系統(tǒng)內(nèi)部任務(wù)。來(lái)自系統(tǒng)透視圖的特征集合可以是在所得到的數(shù)據(jù)和其存在的方式的方面不同的,雖然相同數(shù)據(jù)中的大部分可以用于計(jì)算和制造中間結(jié)果。然而,這些計(jì)算的實(shí)現(xiàn)方式可以有很大的不同。分析引擎可以支持范圍從部分托管的分布式服務(wù)至I/O密集的本地服務(wù)的特征。其還可以管理可能耗費(fèi)大量的時(shí)間運(yùn)行的特征以及需要即時(shí)的結(jié)果的特征。分析引擎執(zhí)行完全從彼此提取的任務(wù)。作為結(jié)果,實(shí)體的集合可以存在以限制這些獨(dú)立的任務(wù)耗盡資源。資源池用于在可能時(shí)實(shí)現(xiàn)這一點(diǎn)(例如線程池、內(nèi)存池等等)。在 分析引擎內(nèi)構(gòu)建的特征還可以考慮它們正在監(jiān)測(cè)的系統(tǒng)的資源利用率。用于分析引擎的面向?qū)ο蟮目蚣芸梢员粯?gòu)建在設(shè)計(jì)的管道和過(guò)濾器類型上,其中被稱為過(guò)濾器對(duì)象(也被稱為管道階段)的小的集中的獨(dú)立的功能模塊可以在管道中有序地共同存在。命令可以在一個(gè)方向運(yùn)行經(jīng)過(guò)管道,給予每個(gè)階段對(duì)象沿途收集或處理數(shù)據(jù)的機(jī)會(huì)。當(dāng)?shù)竭_(dá)管道的尾部時(shí),命令可以在相反的方向運(yùn)行經(jīng)過(guò)管道,給予每個(gè)階段對(duì)象再一次收集或處理數(shù)據(jù)的機(jī)會(huì)。圖8描繪了管道設(shè)計(jì),其將在以下的部分中解釋。工廠對(duì)象可以是根據(jù)負(fù)責(zé)創(chuàng)建和銷毀管道的特征對(duì)象。它們可以接收指定用于管道自身的建立參數(shù),例如資源限制以及階段的參數(shù)的創(chuàng)建事件。在大多數(shù)情況下,這些管道可以在啟動(dòng)時(shí)建立并且在本質(zhì)上可以是靜態(tài)的,但是可能沒(méi)有任何防止它們成為根據(jù)需要霎來(lái)即去的短暫地存活的動(dòng)態(tài)實(shí)體的事情。階段對(duì)象可以是定義特征如何工作的邏輯塊。它們可以是共同地創(chuàng)建復(fù)雜特征的簡(jiǎn)單的集中的獨(dú)立的功能模塊。階段對(duì)象每個(gè)可以接收命令并且對(duì)附屬于命令的數(shù)據(jù)執(zhí)行計(jì)算或檢索進(jìn)行進(jìn)一步處理所需要的另外的數(shù)據(jù)。階段對(duì)象還可以選擇不處理某些類型的命令,在這種情況下不受干擾地傳遞命令。階段對(duì)象相對(duì)于單獨(dú)的命令可以是無(wú)狀態(tài)的。它們可以簡(jiǎn)單地作用于攜帶狀態(tài)信息隨它們經(jīng)過(guò)管道的命令,然而它們可以追蹤管道或系統(tǒng)的一部分的不涉及任何單命令情況的狀態(tài)。命令對(duì)象可以運(yùn)行經(jīng)過(guò)管道并且可以不經(jīng)過(guò)階段對(duì)象。命令對(duì)象可以含有命令的參數(shù)、計(jì)算和/或檢索的數(shù)據(jù)的參數(shù)、命令的當(dāng)前狀態(tài)以及最終狀態(tài)的參數(shù)。命令處理器可以是可以創(chuàng)建、銷毀和引導(dǎo)命令通過(guò)所有的階段對(duì)象實(shí)現(xiàn)的熟知的接口經(jīng)過(guò)管道的單件對(duì)象。其還可以是含有線程內(nèi)容的實(shí)體,其中命令運(yùn)行經(jīng)過(guò)管道。可以具有攜帶命令經(jīng)過(guò)管道的根據(jù)命令的線程。命令處理器可以接收來(lái)自管理接口層的請(qǐng)求并且將這些請(qǐng)求轉(zhuǎn)換為管道命令。當(dāng)完成時(shí),可以將命令數(shù)據(jù)和狀態(tài)傳送至管理層。除了根據(jù)特征的單獨(dú)的管道外,存在兩個(gè)其他的管道。一個(gè)稱為總體管道(GlobalPipeline),其可以是跨過(guò)整個(gè)系統(tǒng)的單個(gè)實(shí)例。總體管道中含有的階段適用于整套特征。例如,其可以含有將內(nèi)存分配到要在某些實(shí)例中返回的數(shù)據(jù)的階段,或其可以是確定許可證限制已經(jīng)被超出并且不允許命令繼續(xù)至其他的管道的許可證階段。根據(jù)某些實(shí)施方案,所有的命令在通過(guò)其他的管道之前可以運(yùn)行經(jīng)過(guò)總體管道。
另一管道可以稱為首先運(yùn)行管道??梢跃哂羞@種類型的根據(jù)常規(guī)的管道實(shí)例的管道實(shí)例,然而其可以含有可能僅適用于正被討論的分別的管道實(shí)例的共有的階段。例如,防止由錯(cuò)誤條件導(dǎo)致的命令在特征管道惰轉(zhuǎn)的健康階段可以在這種管道上存在。所有的命令在運(yùn)行經(jīng)過(guò)總體管道之后運(yùn)行經(jīng)過(guò)首先運(yùn)行管道的合適的實(shí)例,但是在運(yùn)行經(jīng)過(guò)特征管道的分別的實(shí)例之前??梢跃哂卸喾N可以由分析引擎支持的一般特征型式??梢跃哂袃?nèi)部系統(tǒng)維護(hù)特征,例如數(shù)據(jù)卷和數(shù)據(jù)庫(kù)表格維護(hù)。可以具有托管服務(wù),例如可以被與分析引擎通信的GxDB和CFD分析??梢跃哂袌?bào)告服務(wù),例如僵尸服務(wù)器探測(cè)器和功率利用率報(bào)告。還可以具有控制特征,例如光輸出控制和功率上限設(shè)置。所有這些類型的服務(wù)可以被構(gòu)建在上文描繪的框架內(nèi)??梢栽诜治鲆嬷幸远喾N方式處理錯(cuò)誤。命令可以將錯(cuò)誤狀態(tài)隨它們攜帶,并且每個(gè)階段可以基于錯(cuò)誤確定其應(yīng)當(dāng)執(zhí)行的動(dòng)作。當(dāng)嚴(yán)重的錯(cuò)誤發(fā)生并且可以確定命令不能夠繼續(xù)時(shí),階段設(shè)備可以返回將命令反轉(zhuǎn)的狀態(tài),如同已經(jīng)到達(dá)管道的末端。在這種情況下,命令處理器可以簡(jiǎn)單地模擬管道條件的末端??赡芫哂行枰M(jìn)行重大處理以及因此需要大量的時(shí)間以完成命令的特征。狀態(tài)子系統(tǒng)可以存在于分析引擎框架的外部,然而,該子系統(tǒng)可以通過(guò)向命令處理器請(qǐng)求而查詢框架內(nèi)的狀態(tài)。命令處理器知曉在任何給定的時(shí)間,命令可能在管道中的地點(diǎn)以及命令處理器可以根據(jù)階段來(lái)計(jì)算所完成的百分比??梢圆樵兠畋旧硪垣@取有關(guān)其當(dāng)前可以在分別的階段過(guò)程中進(jìn)行的程度??梢酝ㄟ^(guò)管道本身實(shí)現(xiàn)許可強(qiáng)制。在總體管道和每個(gè)首先運(yùn)行管道二者上可能存在許可階段。當(dāng)已經(jīng)達(dá)到許可限制時(shí),這些階段隨錯(cuò)誤狀態(tài)反轉(zhuǎn)命令。由于框架以及體系結(jié)構(gòu)在本質(zhì)上可能有些抽象,所以關(guān)于如何可以實(shí)現(xiàn)特征的例子在圖9中的布局中圖示。特征可以是僵尸服務(wù)器定位器,其返回屬于具體的組容器的僵尸服務(wù)器的標(biāo)識(shí)和地理空間位置。其他的特征也可以使用框架實(shí)現(xiàn)。在圖9中可以具有三個(gè)階段。第一個(gè)可以是組至元件階段,其僅解決了給定一個(gè)組容器名稱,哪些服務(wù)器屬于它。如果我們僅尋找組中的僵尸服務(wù)器,那么階段對(duì)象可以僅使用其從資產(chǎn)數(shù)據(jù)庫(kù)檢索到的屬于該組的那些服務(wù)器填充命令數(shù)據(jù)。下一個(gè)階段可以是識(shí)別僵尸塊。該階段簡(jiǎn)單地基于命令中含有的要素的利用率數(shù)據(jù)發(fā)現(xiàn)僵尸服務(wù)器。最后一個(gè)階段可以是定位服務(wù)器塊。該階段簡(jiǎn)單地查詢地理空間數(shù)據(jù)庫(kù)以返回關(guān)于其接收的命令中的資產(chǎn)的位置信息。這三個(gè)階段全部可以被自包含和提取,使得一個(gè)階段不知道在其之前的階段已經(jīng)完成的動(dòng)作或在其之后的階段將進(jìn)行的動(dòng)作。這些階段中的每一個(gè)可以是足夠通用的,使它們可以容易地使用在其他的特征中。例如,定位服務(wù)器階段可以在服務(wù)器放置類型的特征中使用。發(fā)現(xiàn)引擎可以負(fù)責(zé)將數(shù)據(jù)中心資產(chǎn)和相關(guān)聯(lián)的屬性編目到永久存儲(chǔ)部中。數(shù)據(jù)中心資產(chǎn)不但包括典型的IT資產(chǎn),例如服務(wù)器、磁盤、磁盤陣列、存儲(chǔ)器、主板、擴(kuò)展卡和開關(guān),而且包括設(shè)施資產(chǎn),例如計(jì)算機(jī)機(jī)房空氣調(diào)節(jié)器(CRACS)、配電單元(PDU)、發(fā)電機(jī)、電路、表示在服務(wù)器上運(yùn)行的應(yīng)用程序的軟件資產(chǎn)、以及最后,結(jié)構(gòu)資產(chǎn),例 如建筑物、墻壁、地板、機(jī)架等等
資產(chǎn)可以具有某些共有的屬性,例如描述資產(chǎn)當(dāng)前駐留或可能駐留的位置的地理空間信息。可以收集這些共有的屬性并將其寫入永久存儲(chǔ)部并且將其與資產(chǎn)相關(guān)聯(lián)。此外,可能需要收集資產(chǎn)專有的屬性、并將其寫入永久存儲(chǔ)部并且與資產(chǎn)相關(guān)聯(lián)。例如 IT資產(chǎn)屬性可以包括,制造/模型,串聯(lián),存儲(chǔ)器或存儲(chǔ)部的量等等; 結(jié)構(gòu)資產(chǎn)屬性可以具有表面類型、密度等等; 設(shè)施資產(chǎn)屬性可以具有制造/模型和冷卻能力等等;以及 軟件資產(chǎn)屬性可以具有賣方和版本信息等等。可以支持多個(gè)同時(shí)發(fā)現(xiàn)的實(shí)例以適應(yīng)大型網(wǎng)絡(luò)。這可以意味著單個(gè)操作者運(yùn)行多 個(gè)實(shí)例或多個(gè)操作者運(yùn)行發(fā)現(xiàn)的實(shí)例。發(fā)現(xiàn)引擎的規(guī)??梢允菑木哂袉蝹€(gè)服務(wù)器的小房間擴(kuò)大至可以容納百萬(wàn)資產(chǎn)的最大的數(shù)據(jù)中心。來(lái)源于資產(chǎn)和屬性的編目的發(fā)現(xiàn)過(guò)程和數(shù)據(jù)庫(kù)足跡可以據(jù)此增減規(guī)模。除用戶界面(UI)和永久存儲(chǔ)部層之外,發(fā)現(xiàn)引擎可能不知道系統(tǒng)的任何其他的部分??赡艿氖?,可以在此利用(leverage)第三方的解決方案,所以可以最少地知曉關(guān)于其他的部件的知識(shí)。實(shí)際的資產(chǎn)和資產(chǎn)屬性可能是未知的,并且所以它們可以是可擴(kuò)展的。資產(chǎn)和屬性的發(fā)現(xiàn)方法和發(fā)現(xiàn)順序可以是靈活的。在某些情況下,數(shù)據(jù)中心的資產(chǎn)發(fā)現(xiàn)的一個(gè)或多個(gè)部分可以直接地來(lái)自電子表格。在其它情況下,部分可以從自動(dòng)的資產(chǎn)發(fā)現(xiàn)和某個(gè)量的計(jì)算機(jī)輔助數(shù)據(jù)錄入檢測(cè)到。在其它情況下,地理空間信息可以來(lái)自電子表格、輔助手動(dòng)輸入、手動(dòng)輸入或可以完全不采集該信息。可以進(jìn)行發(fā)現(xiàn)而使其對(duì)數(shù)據(jù)中心具有最小影響。根據(jù)某些實(shí)施方案,可以不太頻繁地發(fā)起發(fā)現(xiàn)過(guò)程。相似地,發(fā)現(xiàn)過(guò)程可以不是實(shí)時(shí)的,但是可以盡可能地高效。用戶可以發(fā)現(xiàn)數(shù)據(jù)中心資產(chǎn)和屬性(包括地理空間屬性例如資產(chǎn)的位置),至在使用工具的幾分鐘至一小時(shí)內(nèi)至少一個(gè)密集的(pod)水平,與之相反,其當(dāng)前使用常規(guī)的方法要耗費(fèi)幾周時(shí)間。發(fā)現(xiàn)引擎可以由數(shù)據(jù)中心的操作者調(diào)用以初始地發(fā)現(xiàn)資產(chǎn),或可能作為周期性的安排任務(wù)??梢栽谝粋€(gè)服務(wù)器、特定的子網(wǎng)或IP范圍或整個(gè)數(shù)據(jù)中心引導(dǎo)發(fā)現(xiàn)過(guò)程。發(fā)現(xiàn)引擎可以利用現(xiàn)有的技術(shù),其中所述技術(shù)可用于自動(dòng)地發(fā)現(xiàn)資產(chǎn)和屬性。這可以包括或不包括使用SNMP、WMI、IPMI、SSH、BACNet, ModBus或甚至私有協(xié)議。單個(gè)發(fā)現(xiàn)可能需要多個(gè)協(xié)議以完成過(guò)程。此外,在某些情況下,可以在采集關(guān)于資產(chǎn)的更多細(xì)節(jié)之前,首先發(fā)現(xiàn)高水平的資產(chǎn)??梢赃M(jìn)行多個(gè)發(fā)現(xiàn)過(guò)程以完全地捕獲資產(chǎn)。可以發(fā)現(xiàn)資產(chǎn)和屬性并將其寫入永久存儲(chǔ)部,而不需要直接知曉獲得數(shù)據(jù)所使用的協(xié)議。此外,發(fā)現(xiàn)引擎可以不具有永久存儲(chǔ)部層細(xì)節(jié)的直接知識(shí)。發(fā)現(xiàn)引擎可以不直接地依賴于任何協(xié)議。在本文中,手動(dòng)錄入數(shù)據(jù)或從文件導(dǎo)入數(shù)據(jù)可以是另一個(gè)“協(xié)議”。代替地,可以使用基于協(xié)議的提取。以這種方式,可以增加用于收集和寫入數(shù)據(jù)的另外的協(xié)議或甚至習(xí)慣性方法。不是所有的協(xié)議都具有同樣的功能。因此,每個(gè)協(xié)議可以定義其支持什么功能。設(shè)計(jì)可以假設(shè)多個(gè)協(xié)議和多個(gè)過(guò)程可能用于完成單個(gè)發(fā)現(xiàn)。
從協(xié)議返回的數(shù)據(jù)可以匹配或不匹配內(nèi)部對(duì)象模型表示。因此,可以將所收集的數(shù)據(jù)進(jìn)行轉(zhuǎn)換。這種轉(zhuǎn)換可以客觀化,使得可以支持新的設(shè)備,而不要求重新編譯核心代碼。存儲(chǔ)器內(nèi)對(duì)象模型對(duì)象可以寫入到/讀取自永久存儲(chǔ)部。該過(guò)程的細(xì)節(jié)可以被提取。實(shí)際的備用存儲(chǔ)部可以是服務(wù)中心的本地/托管的數(shù)據(jù)庫(kù)或數(shù)據(jù)中心的本地/托管的數(shù)據(jù)庫(kù)、平面文件、調(diào)試日志等等。數(shù)據(jù)持續(xù)提取層可以負(fù)責(zé)將存儲(chǔ)器內(nèi)對(duì)象轉(zhuǎn)換為數(shù)據(jù)持續(xù)對(duì)象,被向后備存儲(chǔ)寫出的中,以及在讀取操作期間負(fù)責(zé)將后備存儲(chǔ)對(duì)象轉(zhuǎn)換為存儲(chǔ)器內(nèi)表示??梢詫?duì)永久存儲(chǔ)部層的請(qǐng)求匯集在一起以最小化后備存儲(chǔ)訪問(wèn)的量。如果認(rèn)為是必需的,那么最近使用的存儲(chǔ)器內(nèi)對(duì)象的寫入緩存或回寫緩存可以減輕重復(fù)訪問(wèn)的需要。
配置管理數(shù)據(jù)庫(kù)(CMDB)導(dǎo)入請(qǐng)求可以只是發(fā)現(xiàn)啟動(dòng),其中在協(xié)議提取以下的實(shí)現(xiàn)可以是特定類型的“CMDB導(dǎo)入”協(xié)議。用于資產(chǎn)和相關(guān)聯(lián)的屬性的數(shù)據(jù)庫(kù)存儲(chǔ)部可以是服務(wù)資源或數(shù)據(jù)中心資源。因此,設(shè)計(jì)應(yīng)當(dāng)不排除距備用存儲(chǔ)部的位置較遠(yuǎn)地運(yùn)行的發(fā)現(xiàn)引擎。此外,可以設(shè)想,發(fā)現(xiàn)過(guò)程本身可以是完全地距正在被發(fā)現(xiàn)的數(shù)據(jù)中心遠(yuǎn)程的或具有距正在被發(fā)現(xiàn)的數(shù)據(jù)中心遠(yuǎn)程的部分。然而,可以在中心分析數(shù)據(jù)。錯(cuò)誤處理具有兩個(gè)方面、即檢測(cè)和恢復(fù)。如果特定的發(fā)現(xiàn)實(shí)例“再次發(fā)現(xiàn)”資產(chǎn)并且檢測(cè)到?jīng)_突,那么其可以與已經(jīng)被編目的內(nèi)容調(diào)和。例如,其可以發(fā)現(xiàn),在給定的IP地址的服務(wù)器已經(jīng)被另一個(gè)服務(wù)器代替,或其被升級(jí)為具有更多存儲(chǔ)器或容納新的擴(kuò)展卡。如果發(fā)現(xiàn)過(guò)程檢測(cè)到資產(chǎn),但是在詳細(xì)或深入的發(fā)現(xiàn)期間時(shí)間超時(shí),那么發(fā)現(xiàn)引擎可以作出備注并且繼續(xù)前進(jìn)。如果在與數(shù)據(jù)中心操作者交談或計(jì)算機(jī)輔助交互期間發(fā)生錯(cuò)誤,那么發(fā)現(xiàn)引擎可以提供關(guān)于恢復(fù)方法的建議??梢詡渥㈠e(cuò)誤并且在發(fā)現(xiàn)結(jié)束時(shí)提供該錯(cuò)誤,以減小發(fā)現(xiàn)過(guò)程受到的阻礙。例如,不大可能的是,操作者可能在較長(zhǎng)的導(dǎo)入或自動(dòng)發(fā)現(xiàn)期間站在控制臺(tái)的前方。在發(fā)現(xiàn)期間,引擎可以提供進(jìn)度信息(例如所發(fā)現(xiàn)的資產(chǎn)的數(shù)量和類型的可見(jiàn)的遞增計(jì)數(shù)、丟失的連接計(jì)數(shù)等等)。如果發(fā)現(xiàn)具有多個(gè)階段,那么引擎可以報(bào)告目前活動(dòng)的可能是哪一階段。如果具有多個(gè)發(fā)現(xiàn)實(shí)例,那么每個(gè)實(shí)例可以獨(dú)立地報(bào)告并且還提供匯集的視圖。當(dāng)發(fā)現(xiàn)完成時(shí),狀態(tài)可以指示完成并且提供關(guān)于如何處理任何錯(cuò)誤情況的建議。發(fā)現(xiàn)引擎可以通過(guò)用戶界面層從n輪詢狀態(tài)命令發(fā)送狀態(tài)信息。數(shù)據(jù)收集引擎可以是資產(chǎn)監(jiān)視器。數(shù)據(jù)收集引擎的工作可以是收集關(guān)于資產(chǎn)的關(guān)鍵信息以及將該信息存檔到永久存儲(chǔ)部中。所收集的信息的類型可以根據(jù)資產(chǎn)的類型變化并且可以通過(guò)分析引擎要求驅(qū)動(dòng)。之前發(fā)現(xiàn)的數(shù)據(jù)中心資產(chǎn)(IT、設(shè)施和軟件)可以被輪詢并且所收集的數(shù)據(jù)與時(shí)間戳記可以共同寫入歷史永久存儲(chǔ)部中。待收集的數(shù)據(jù)實(shí)例可能/可行的源
CPU性能數(shù)據(jù)SNMP
內(nèi)存使用SNMP
存儲(chǔ)部使用和性能SNMP.SMI-s.API
溫度傳感器SNMP, API
進(jìn)程表性能SNMP, SSH
PDU功率使用SNMP, API
UPS狀態(tài)信息SNMP, API
CRAC單元狀態(tài)信息SNMP, API
功率調(diào)節(jié)狀態(tài)信息SNMP, API
開關(guān)配置和狀態(tài)信息S麗P、SMI-S、API
制冷器狀態(tài)信息SNMP, API輪詢頻率可以由用戶根據(jù)合理的默認(rèn)值來(lái)指定??梢灾С侄鄠€(gè)同時(shí)的數(shù)據(jù)收集實(shí)例以適應(yīng)大型網(wǎng)絡(luò)。這可以意味著單個(gè)操作者運(yùn)行多個(gè)實(shí)例或多個(gè)操作者運(yùn)行數(shù)據(jù)收集實(shí)例。根據(jù)某些實(shí)施方案,系統(tǒng)能夠在5分鐘內(nèi)輪詢一百萬(wàn)個(gè)資產(chǎn),而不會(huì)消極地影響數(shù)據(jù)中心服務(wù)的表現(xiàn)。歷史數(shù)據(jù)可以被連續(xù)地寫入永久存儲(chǔ)部。因此,歷史數(shù)據(jù)的足跡可以對(duì)于被配置的時(shí)間的某個(gè)量擴(kuò)大規(guī)模至每5分鐘一百萬(wàn)個(gè)被輪詢的資產(chǎn)。分開安排的“卷起”分析任務(wù)可以通過(guò)將數(shù)據(jù)平均以避免數(shù)據(jù)超程來(lái)匯集統(tǒng)計(jì)量。然而,在卷起之間的存儲(chǔ)量可以據(jù)此進(jìn)行增減。實(shí)際收集的數(shù)據(jù)可以是未知的,所以其可以被配置為可擴(kuò)展的。收集的方法和順序可以是靈活的。在某些情況下,數(shù)據(jù)可能直接來(lái)自電子表格。在其它情況下,部分?jǐn)?shù)據(jù)可以從自動(dòng)輪詢和一些計(jì)算機(jī)輔助數(shù)據(jù)錄入收集??梢詫⑹占O(shè)計(jì)為最小化對(duì)數(shù)據(jù)中心的影響。數(shù)據(jù)收集可以是連續(xù)的輪詢過(guò)程并且因此可以非常高效。系統(tǒng)能夠在5分鐘內(nèi)輪詢一百萬(wàn)個(gè)資產(chǎn),而不會(huì)消極地影響數(shù)據(jù)中心服務(wù)(服務(wù)器、網(wǎng)絡(luò)等等)。數(shù)據(jù)收集引擎可以使用之前發(fā)現(xiàn)的資產(chǎn)計(jì)算出待輪詢的內(nèi)容,從這些資產(chǎn)收集關(guān)鍵信息,并且將與資產(chǎn)相關(guān)的關(guān)鍵信息與時(shí)間戳記一起寫入歷史永久存儲(chǔ)部。如果監(jiān)視器不能夠發(fā)現(xiàn)之前發(fā)現(xiàn)的服務(wù)器,那么可以向用戶發(fā)起警報(bào)。沖突可以被備注并且在數(shù)據(jù)收集過(guò)程結(jié)束時(shí)提出。
分開安排的“卷起”分析任務(wù)可以通過(guò)將數(shù)據(jù)平均以避免數(shù)據(jù)超程來(lái)匯集統(tǒng)計(jì)量。監(jiān)測(cè)任務(wù)可以記錄關(guān)鍵信息但是可以不進(jìn)行數(shù)據(jù)匯集??梢允占Y產(chǎn)關(guān)鍵信息并且將其存檔到永久存儲(chǔ)部中,而不需要直接知曉用于獲得數(shù)據(jù)的協(xié)議。此外,數(shù)據(jù)收集弓I擎可以不直接知曉永久存儲(chǔ)部層的細(xì)節(jié)。數(shù)據(jù)收集引擎可以不直接地依賴于任何協(xié)議。在本文中,手動(dòng)錄入歷史數(shù)據(jù)或從文件導(dǎo)入數(shù)據(jù)可以是另一個(gè)“協(xié)議”??梢允褂没趨f(xié)議的提取。以這種方式,可以增加用于收集和寫入數(shù)據(jù)的另外的協(xié)議或甚至習(xí)慣性方法。不是所有的協(xié)議都具有同樣的功能。因此,每個(gè)協(xié)議可以定義其支持什么功能。從協(xié)議返回的數(shù)據(jù)可以匹配或不匹配內(nèi)部對(duì)象模型表示。因此,可以將所收集的數(shù)據(jù)進(jìn)行轉(zhuǎn)換。這種轉(zhuǎn)換可以客觀化,使得可以支持新的設(shè)備,而不要求重新編譯核心代 碼。存儲(chǔ)器內(nèi)對(duì)象模型對(duì)象可以寫入到/讀取自永久存儲(chǔ)部。該過(guò)程的細(xì)節(jié)可以被提取。實(shí)際的備用存儲(chǔ)部可以是本地/托管的服務(wù)中心數(shù)據(jù)庫(kù)或本地/托管的客戶數(shù)據(jù)庫(kù)、平面文件、調(diào)試日志等等。數(shù)據(jù)持續(xù)提取層可以負(fù)責(zé)將存儲(chǔ)器內(nèi)對(duì)象轉(zhuǎn)換為數(shù)據(jù)持續(xù)對(duì)象,被向后備存儲(chǔ)寫出的中,以及在讀取操作期間負(fù)責(zé)將后備存儲(chǔ)對(duì)象轉(zhuǎn)換為存儲(chǔ)器內(nèi)表示。在可能時(shí),可以將對(duì)永久存儲(chǔ)部層的請(qǐng)求匯集在一起以最小化后備存儲(chǔ)訪問(wèn)的量。如果認(rèn)為是必需的,那么最近使用的存儲(chǔ)器內(nèi)對(duì)象的寫入緩存或回寫緩存可以減輕重復(fù)訪問(wèn)的需要某些資產(chǎn)的數(shù)據(jù)收集可能手動(dòng)地從電子表格或某些定制的格式導(dǎo)入。例如,可能的是,某些第三方工具可以以某個(gè)頻率收集某些資產(chǎn)的某些數(shù)據(jù)并且可以產(chǎn)生某個(gè)特定格式的歷史報(bào)告。收集引擎可以被足夠地提取以支持歷史數(shù)據(jù)的該習(xí)慣源。收集引擎可以距備用存儲(chǔ)部的位置較遠(yuǎn)地運(yùn)行。發(fā)現(xiàn)過(guò)程本身可以是完全地距正在被發(fā)現(xiàn)的數(shù)據(jù)中心遠(yuǎn)程的或具有距正在被發(fā)現(xiàn)的數(shù)據(jù)中心遠(yuǎn)程的部分。然而,可以在中心分析數(shù)據(jù)。錯(cuò)誤處理具有兩個(gè)方面、即檢測(cè)和恢復(fù)。如果在與數(shù)據(jù)中心操作者交談或計(jì)算機(jī)輔助交互期間發(fā)生錯(cuò)誤,那么數(shù)據(jù)收集引擎可以提供關(guān)于恢復(fù)方法的建議。錯(cuò)誤可以被備注并且在結(jié)束時(shí)提供該錯(cuò)誤,以允許數(shù)據(jù)的收集完成。例如,不大可能的是,操作者在較長(zhǎng)的導(dǎo)入或收集期間站在控制臺(tái)的前方??梢跃哂辛己玫挠糜诳刂茢?shù)據(jù)超程的方式。收集引擎可以沒(méi)有假設(shè)用戶已經(jīng)正確地配置和提供了卷起。在數(shù)據(jù)收集期間,引擎可以提供進(jìn)度信息(例如所輪詢的資產(chǎn)的數(shù)量和類型的可見(jiàn)的遞增計(jì)數(shù)、丟失的連接計(jì)數(shù)等等)。如果數(shù)據(jù)收集具有多個(gè)階段,那么引擎可以報(bào)告目前活動(dòng)的可能是哪一階段。如果具有多個(gè)數(shù)據(jù)收集實(shí)例,那么每個(gè)實(shí)例可以獨(dú)立地報(bào)告并且還提供匯集的視圖。當(dāng)數(shù)據(jù)收集完成時(shí),狀態(tài)可以指示完成并且提供關(guān)于如何處理錯(cuò)誤情況的建議。數(shù)據(jù)收集引擎可以通過(guò)n層(例如,從n輪詢狀態(tài)命令)發(fā)送狀態(tài)信息。數(shù)據(jù)中心基因組圖譜(GxDB)可以是可能含有通用的數(shù)據(jù)中心設(shè)備的詳細(xì)特征的web托管的數(shù)據(jù)庫(kù),通用的數(shù)據(jù)中心設(shè)備包括但不限于服務(wù)器、陣列、CRAC、功率管理系統(tǒng)和物理基礎(chǔ)設(shè)施。一般的途徑可以是將系統(tǒng)(例如服務(wù)器或存儲(chǔ)陣列)描述為它們的構(gòu)成部件即CPU、存儲(chǔ)器、磁盤等等的匯集。對(duì)于每個(gè)部件,可以關(guān)于功率消耗、可靠性、功能、性能和接口以及在合適時(shí)尺寸和重量來(lái)收集和維護(hù)數(shù)據(jù)。數(shù)據(jù)庫(kù)中的信息可以用于執(zhí)行基于軟件的功率測(cè)量、可靠性分析和邏輯/物理仿真。圖10圖示了根據(jù)一個(gè)或多個(gè)實(shí)施方案的組成配置數(shù)據(jù)庫(kù)或配置文件數(shù)據(jù)庫(kù)(例如GxDB)的托管服務(wù)以及服務(wù)的多個(gè)客戶端的主要部件。GxDB能夠保持在客戶的數(shù)據(jù)中心發(fā)現(xiàn)的設(shè)備和部件的詳細(xì)特征。隨時(shí)間推移,這種收集信息可以增長(zhǎng)以包括所有的普遍可用的IT設(shè)備。數(shù)據(jù)庫(kù)可以含有以數(shù)萬(wàn)的數(shù)量級(jí)的部件描述。數(shù)據(jù)庫(kù)的內(nèi)容和形式可以隨時(shí)間推移而演變。架構(gòu)可以是足夠通用和可擴(kuò)展,以允許容易添加關(guān)于在測(cè)試期間發(fā)現(xiàn)的各種部件類型的新信息。部件或配置文件數(shù)據(jù)庫(kù)(例如GxDB)可能具有非常低的信息增長(zhǎng)速率;僅相對(duì)少 量的記錄可以被每日加入至可以可能地具有數(shù)十或數(shù)百范圍的地點(diǎn)。數(shù)據(jù)庫(kù)能夠以每秒數(shù)十個(gè)復(fù)雜查詢的數(shù)量級(jí)進(jìn)行服務(wù)。根據(jù)某些實(shí)施方案,GxDB通??梢允且淮螌懭攵啻巫x取的資源庫(kù),并且可以容易地創(chuàng)建系統(tǒng)的多個(gè)復(fù)件。根據(jù)某些實(shí)施方案,可以使用標(biāo)準(zhǔn)開放源數(shù)據(jù)庫(kù)和web托管工具實(shí)現(xiàn)GxDB。在其他的實(shí)施方案中,可以使用用于支持SQL引擎或web中間件的定制數(shù)據(jù)庫(kù)系統(tǒng)或較大的商業(yè)系統(tǒng)。GxDB架構(gòu)可以來(lái)源于上文描述的數(shù)據(jù)中心對(duì)象模型??梢越M織關(guān)于數(shù)據(jù)中心部件類型的表格(例如CPU表格、磁盤表格、主板表格等等)。表格內(nèi)的數(shù)據(jù)中心部件可以具有唯一的鍵以用于識(shí)別組成較大的系統(tǒng)例如服務(wù)器和存儲(chǔ)陣列的特定部件。對(duì)于給定的數(shù)據(jù)中心部件,架構(gòu)區(qū)分關(guān)于該部件的信息的來(lái)源和質(zhì)量根據(jù)某些實(shí)施方案,可以具有三個(gè)水平的信息i.規(guī)格表-來(lái)自制造商的規(guī)格數(shù)據(jù);ii.用戶貢獻(xiàn)-由用戶社團(tuán)貢獻(xiàn)的數(shù)據(jù);以及iii.由服務(wù)提供商驗(yàn)證的信息-使用供應(yīng)的工具收集的功率和可靠性數(shù)據(jù)。根據(jù)某些實(shí)施方案,可以在web上托管GxDB。托管服務(wù)可以使用由任何web托管的應(yīng)用所需要的Linux服務(wù)器平臺(tái)、存儲(chǔ)、維護(hù)和備份/恢復(fù)操作。GxDB可以使用具有ssh訪問(wèn)以及安裝任意的程序包的功能的專用服務(wù)器(有形的或虛擬的)。帶寬可以不是主要關(guān)心的問(wèn)題。GxDB可以具有兩個(gè)類型的接口 用于結(jié)束用戶訪問(wèn)的異步Web⑶I 用于其他部件的計(jì)劃性的訪問(wèn)的API這些接口中的一個(gè)或兩個(gè)可以支持查找/查詢、插入新數(shù)據(jù)、對(duì)日志的訪問(wèn)、維護(hù)、表格空間、備份、恢復(fù)以及基因組用途。為了便于GxDB的廣泛使用,可以具有用于幫助表征現(xiàn)場(chǎng)的IT設(shè)備的一套工具。這些工具包括但不限于CPU負(fù)荷發(fā)生器、I/O負(fù)荷發(fā)生器(存儲(chǔ)和數(shù)據(jù)網(wǎng)絡(luò))、用于讀取配置信息的發(fā)現(xiàn)工具、來(lái)自基于PDU或USB的功率計(jì)的自動(dòng)功率讀數(shù)以及用于將收集的數(shù)據(jù)插入中央GxDB中的用具。根據(jù)某些實(shí)施方案,客戶私人信息不能被傳輸至或存儲(chǔ)在GxDB中??梢詫?shí)施用于保護(hù)托管的數(shù)據(jù)的最好的措施。API和用戶界面二者都可能需要用戶認(rèn)證??梢宰粉櫲魏斡捎脩糌暙I(xiàn)的信息的來(lái)源。GxDB中的信息可能對(duì)于客戶數(shù)據(jù)中心部署的軟件部件的操作是重要的。由于性能和網(wǎng)絡(luò)訪問(wèn)/安全方面的原因,GxDB的子集可以緩存或復(fù)制至在客戶位置處部署的軟件上。作為可以由一個(gè)或多個(gè)客戶連續(xù)地使用的集中托管的服務(wù),GxDB可以檢測(cè)到多種系統(tǒng)故障并且自動(dòng)地從多種系統(tǒng)故障恢復(fù)??梢砸匀哂嗟姆绞讲渴饠?shù)據(jù)庫(kù)本身,其還可以實(shí)施監(jiān)測(cè)以檢測(cè)功能上和性能上的問(wèn)題,并且可以在檢測(cè)到潛在的故障時(shí)“致電家中”和/或報(bào)警。用于產(chǎn)品的用戶界面可以支持多種特征,從軟件部件的基本配置到大型復(fù)雜的數(shù)據(jù)中心的三維建模和仿真的技術(shù)現(xiàn)狀??梢跃哂卸喾N分立的用于支持特定的用戶情況的接
□。 用戶界面體系結(jié)構(gòu)可以提供緩存機(jī)制以高效地保持信息的當(dāng)前工作設(shè)置。顯示部件可以具有頁(yè)入IT部件和結(jié)果設(shè)置的子集的能力。多個(gè)用戶可以同時(shí)與功率分析系統(tǒng)交互。⑶I體系結(jié)構(gòu)可以支持簡(jiǎn)單的數(shù)據(jù)收集用途、系統(tǒng)配置向?qū)?、CAD風(fēng)格布局工具和先進(jìn)的數(shù)據(jù)可視化。⑶I的通用的高水平可以在圖11中圖示。圖11描繪了多個(gè)示例性的視圖。數(shù)據(jù)模型層可以提供從OM的核心部件視圖到為了高效的GUI操作而組織的模型的轉(zhuǎn)換。在許多情況下這可能是不重要的,然而該體系結(jié)構(gòu)可以允許視圖從系統(tǒng)中的處理元件完全分離。該層還可以實(shí)施在視圖中普遍的業(yè)務(wù)邏輯,但是不適于在分析系統(tǒng)、發(fā)現(xiàn)系統(tǒng)或監(jiān)測(cè)系統(tǒng)中實(shí)施。用戶界面可以是在兩個(gè)水平上多線程的。GUI窗口系統(tǒng)可以是由事件驅(qū)動(dòng)和多線程的以確保響應(yīng)的非阻擋的小部件,并且遠(yuǎn)程API可以圍繞可以處理多個(gè)重要的請(qǐng)求的異步的命令/響應(yīng)機(jī)制構(gòu)建。遠(yuǎn)程API層可以便利在⑶I、GxDB和核心軟件之間的通信。該層可以實(shí)施異步的命令/響應(yīng)機(jī)制以及某種形式的結(jié)果緩存。基于角色的安全性可以用于控制對(duì)數(shù)據(jù)收集和系統(tǒng)控制特征的訪問(wèn)。軟件還可以支持對(duì)通過(guò)公共網(wǎng)絡(luò)被遠(yuǎn)程地監(jiān)測(cè)和管理的數(shù)據(jù)中心的線加密(wire encryption)。數(shù)據(jù)中心功率分析產(chǎn)品可以包括托管的GxDB Web服務(wù)器、客戶安裝的軟件以及Web部署服務(wù)器,從所述Web部署服務(wù)器,用戶和/或客戶可以下載其軟件補(bǔ)丁。屬性管理器可以是在系統(tǒng)中的一個(gè)或多個(gè)部件普遍地使用的單件。該子系統(tǒng)可以允許每個(gè)產(chǎn)品具有可以被修改(甚至在運(yùn)行時(shí)間)的一組默認(rèn)值,以避免對(duì)重構(gòu)建、重部署的需要,以及在某些情況下重啟我們的產(chǎn)品服務(wù)以改變行為的需要。用于察看和修改當(dāng)前屬性值的用戶界面可以通過(guò)僅由內(nèi)部或現(xiàn)場(chǎng)支持人員使用的命令行接口可用。某些屬性的幾個(gè)實(shí)例可以包括 總體或部件水平的調(diào)試使能夠/使不能夠進(jìn)行布爾運(yùn)算;
邊界限制; 超時(shí)設(shè)置;以及 記錄日志。記錄日志管理者可以是在系統(tǒng)中的一個(gè)或多個(gè)部件普遍使用的單件。其可以是可以利用屬性管理器使能/禁止各種日志設(shè)置的子系統(tǒng)的實(shí)施例。每個(gè)部件可以具有提供清楚和簡(jiǎn)明的錯(cuò)誤、警告和信息性消息的単獨(dú)的日志文件。這樣的消息提供足夠的用于監(jiān)測(cè)我們產(chǎn)品的運(yùn)行時(shí)間狀態(tài)的信息。日志文件可以在我們的服務(wù)開始時(shí)創(chuàng)建并且可以被增補(bǔ),直到服務(wù)停止。之前的日志文件可以被輪換(達(dá)到、上限;例如10)以用于歷史回顧。根據(jù)某些實(shí)施方案,記錄日志管理器可以由ー個(gè)或多個(gè)部件和子系統(tǒng)采用以提供各種部件的輸出風(fēng)格(即日期/時(shí)間格式)的一致性,并且在錯(cuò)誤和警告的情況下,消息可以分別以“錯(cuò)誤”和“警告”開頭??梢蕴岣哂涗浫罩炯?jí)別以通過(guò)開發(fā)、QA和現(xiàn)場(chǎng)支持來(lái)幫助調(diào)試。這樣的記錄日志級(jí)別將被認(rèn)為是調(diào)試水平輸出,其通過(guò)管理器管理的屬性來(lái)使能??梢跃哂惺顾械恼{(diào)試消息發(fā)出以及特定的部件或子系統(tǒng)的更細(xì)化的記錄日志的總體調(diào)試選項(xiàng)。這樣的調(diào)試輸出可以被預(yù)先設(shè)置其的具體的調(diào)試標(biāo)簽,以用于容易地搜索日志文件;例如發(fā)現(xiàn)調(diào)試。調(diào)試種類的類型的實(shí)例可以包括發(fā)現(xiàn)、數(shù)據(jù)收集、分析、安全、作業(yè)排程、持續(xù)/數(shù)據(jù)庫(kù)訪問(wèn)、配置、作業(yè)排程、用戶界面以及需要的其他類型。審計(jì)管理器可以是在數(shù)據(jù)中心功率分析系統(tǒng)中的一個(gè)或多個(gè)部件中普遍使用以管理與安全審計(jì)相關(guān)的信息的ー個(gè)或多個(gè)部分的單件。在每個(gè)VSS上的審計(jì)日志引用與安全相關(guān)的信息,所述與安全相關(guān)的信息識(shí)別日期/時(shí)間、用戶和在我們的系統(tǒng)中發(fā)起的請(qǐng)求及任何與安全相關(guān)的警報(bào)或錯(cuò)誤。對(duì)于Web服務(wù)器訪問(wèn),也將記錄進(jìn)行請(qǐng)求的客戶端的IP地址。所有的VSS部件可以提供跟蹤設(shè)施,其在默認(rèn)情況下被禁用,但可以根據(jù)需要通過(guò)屬性管理器動(dòng)態(tài)地啟用。軌跡水平信息可以包括日期/時(shí)間、類名稱、方法名稱、進(jìn)入/離開指示器(entry/exit indicator)和方法參數(shù)。調(diào)試命令行接ロ可以是能夠訪問(wèn)活動(dòng)系統(tǒng)的調(diào)試實(shí)用程序。其使用戶能夠顯示和修改對(duì)象信息,包括對(duì)象屬性值,以及堆棧信息。雖然軟件可以是安裝有Linux發(fā)行版的白盒,所述Linux發(fā)行版后安裝數(shù)據(jù)中心功率分析產(chǎn)品,但是用戶可能將它視為黑盒(即不與其他的產(chǎn)品和/或服務(wù)共享),從而確保合適的系統(tǒng)資源是可用的。升級(jí)在Viridity Web服務(wù)器上進(jìn)行并且可用干。作業(yè)排程程序可以是在數(shù)據(jù)中心功率分析系統(tǒng)中的一個(gè)或多個(gè)部件中普遍使用的單件。其支持在指定的時(shí)間由用戶或我們系統(tǒng)中的部件安排和執(zhí)行任務(wù)。軟件的主要內(nèi)部部件或用戶可以依賴于時(shí)間密集型任務(wù)的作業(yè)排程程序,我們?cè)谄渖蠜](méi)有阻礙的用于,例如大型數(shù)據(jù)中心繪圖發(fā)現(xiàn)會(huì)話或長(zhǎng)期分析運(yùn)行。此外,客戶可以依賴于作業(yè)排程程序以進(jìn)行過(guò)時(shí)(aged-out)的數(shù)據(jù)的以預(yù)賦值的間隔的數(shù)據(jù)庫(kù)清理或以進(jìn)行為了災(zāi)難恢復(fù)目的的管理配置備份。
作業(yè)排程程序可以接受用于解決以下問(wèn)題的輸入 待執(zhí)行什么作業(yè)? 誰(shuí)安排作業(yè)? 作業(yè)安排在何時(shí)? 作業(yè)被安排執(zhí)行多長(zhǎng)時(shí)間? 作業(yè)是否重復(fù)發(fā)生,如果是的話,以多長(zhǎng)的間隔發(fā)生?狀態(tài)管理器可以是在數(shù)據(jù)中心分析平臺(tái)的一個(gè)或多個(gè)部件中普遍使用的單件。其可以提供允許用戶理解當(dāng)前運(yùn)行狀態(tài)(包括進(jìn)行中的作業(yè)和所安排的用于將來(lái)執(zhí)行的作業(yè))的狀態(tài)信息。該子系統(tǒng)可以提供對(duì)即將進(jìn)行的內(nèi)容和其如何進(jìn)行的洞察。由于作業(yè)安排最終需要對(duì)作業(yè)狀態(tài)的可見(jiàn)性,所以作業(yè)排程程序的結(jié)果可以是狀態(tài)管理器角色的不可缺的一部分,顯示任務(wù)的當(dāng)前狀態(tài)(例如安排的、在進(jìn)行中的、已完成的),以及,如果在進(jìn)行中,則顯示其完成的百分比。對(duì)于任何任務(wù)的完成狀態(tài)(例如成功、失敗、時(shí)間超時(shí)等等)也可能是可用的。狀態(tài)管理器可以追蹤作業(yè)的以下屬性 安排了什么作業(yè)。 誰(shuí)請(qǐng)求了該作業(yè)。 發(fā)起執(zhí)行作業(yè)的請(qǐng)求的時(shí)間?!ぷ鳂I(yè)被排程多長(zhǎng)時(shí)間以開始執(zhí)行?;n作業(yè)狀態(tài)(例如已安排的、在進(jìn)行中的、已完成的)。 作業(yè)狀態(tài)(例如,完成的百分比)。 作業(yè)返回碼(例如成功、失敗、時(shí)間超時(shí)等等)用戶界面(UI)可以提供儀表板(例如圖26),提供主要部件的當(dāng)前狀態(tài)的可見(jiàn)性,例如已安排的任務(wù)、正在運(yùn)行的任務(wù)和完成的任務(wù)。任務(wù)信息可以持續(xù)可配置的時(shí)間期間,在其之后可以將歷史イ目息去除。用于普遍使用的功能的程序庫(kù)的集合可以提供部件實(shí)現(xiàn)之間的一致性,并且最大化代碼反復(fù)使用率和維護(hù)的容易性。程序庫(kù)可以包括但不限于線程池和存儲(chǔ)器管理工具、用于信號(hào)量和互斥鎖的與鎖定相關(guān)的功能、以及用于字符串處理的方便功能和類似的功能。用于開發(fā)類程序庫(kù)的源可以存儲(chǔ)在公共源控制程序包中,并且可以不與任何ー個(gè)具體的部件相關(guān)聯(lián)。此外,持續(xù)的數(shù)據(jù),以及配置和數(shù)據(jù)庫(kù)數(shù)據(jù),可以以UTF-8格式存儲(chǔ)。含有數(shù)據(jù)中心資產(chǎn)和收集的數(shù)據(jù)的數(shù)據(jù)庫(kù)或電子存儲(chǔ)部可有助于對(duì)客戶問(wèn)題的理解。導(dǎo)入/導(dǎo)出設(shè)施可以用于使獲取具體的配置并且將它們導(dǎo)入到其他系統(tǒng)上的功能容易。該設(shè)施可以被局部地采用以幫助自動(dòng)的質(zhì)量保證(QA)測(cè)試配置以及允許支持人員對(duì)客戶地點(diǎn)配置問(wèn)題的洞察。 對(duì)于具有到托管的服務(wù)器的外部網(wǎng)絡(luò)連接的客戶地點(diǎn),存在遠(yuǎn)程訪問(wèn)設(shè)施以通知用戶他們當(dāng)前安裝的軟件的升級(jí)。在數(shù)據(jù)中心,安全具有高優(yōu)先級(jí)。即,可能不具有對(duì)客戶系統(tǒng)的用于輔助產(chǎn)品使用或調(diào)試產(chǎn)品問(wèn)題的訪問(wèn)。存在用于對(duì)服務(wù)系統(tǒng)進(jìn)行快照拍攝的工具,以收集各種產(chǎn)品和系統(tǒng)日志文件,包括配置和性質(zhì)信息??蛻艨梢詫嚎s的收集信息上傳至我們的現(xiàn)場(chǎng)支持地點(diǎn)。包含在收集信息內(nèi)的狀態(tài)可以足以遠(yuǎn)程地調(diào)試客戶問(wèn)題。實(shí)現(xiàn)數(shù)據(jù)中心效率可能需要不同的但是在技術(shù)上嚴(yán)謹(jǐn)?shù)姆椒?,所述方法自?dòng)地識(shí)別低效率并且應(yīng)用被證明為最大化能量節(jié)約的特定的策略。根據(jù)某些實(shí)施方案,所述方法可以被概括為以下的步驟i.理解現(xiàn)有的物理基礎(chǔ)設(shè)施捕獲數(shù)據(jù)中心的物理結(jié)構(gòu);ii.監(jiān)測(cè)操作(儀表和測(cè)量,以連續(xù)地識(shí)別所有的能量系統(tǒng)和IT設(shè)備使用的當(dāng)前的操作效率);以及 iii.理解物理基礎(chǔ)設(shè)施的邏輯將物理IT設(shè)備對(duì)邏輯業(yè)務(wù)水平IT使用繪圖?;谧R(shí)別的與功率相關(guān)的低效率,可以提出計(jì)劃策略以解決低效率問(wèn)題。邏輯、操作和計(jì)劃步驟可以結(jié)合起來(lái)工作,以創(chuàng)建用于優(yōu)化數(shù)據(jù)中心的能量消耗的自動(dòng)化過(guò)程。在圖12的示例性的實(shí)施方案中所示的自動(dòng)化過(guò)程具有五個(gè)要素I)邏輯模擬器(IT資源的功率消耗);2)物理工廠模擬器(物理工廠熱變化曲線估計(jì));3)エ廠能量模型(數(shù)據(jù)中心冷卻功率估計(jì)模型);4)策略選擇器(用于能量節(jié)約);以及5)能量?jī)?yōu)化器(數(shù)據(jù)中心范圍)。邏輯模擬器可以在邏輯級(jí)工作,以估計(jì)IT系統(tǒng)需要的功率,并且產(chǎn)生作為輸出的可行的能量節(jié)約策略和候選的放置或位置的列表,并且將列表提供至物理工廠模擬器。邏輯模擬器的輸入可以包括i)用于所有的IT設(shè)備的物理網(wǎng)絡(luò)和連接布局;ii)維護(hù)部署的所有IT設(shè)備的IT資產(chǎn)數(shù)據(jù)庫(kù);iii) IT設(shè)備利用率、效率、功率消耗等等的歷史數(shù)據(jù)庫(kù);iv)測(cè)量-關(guān)于溫度、空氣流的所有傳感器數(shù)據(jù)或來(lái)自任何IT設(shè)備的其他設(shè)備內(nèi)測(cè)量的相關(guān)數(shù)據(jù);以及V)新的IT設(shè)備部署(或IT設(shè)備部署的任何變化)提出新的IT部署或重新部署或報(bào)廢,或可能的重新定位等等。邏輯模擬器可以使用基于約束的優(yōu)化來(lái)產(chǎn)生其推薦。物理工廠模擬器可以用于獲取邏輯模擬器的輸出并且將IT功率消耗轉(zhuǎn)換為物理エ廠的熱變化曲線,例如提出30熱圖??梢允褂糜?jì)算流體動(dòng)力學(xué)(CFD)建模獲取在數(shù)據(jù)中心的不同區(qū)域的熱圖(如圖13所示的)。一旦獲得熱圖,那么我們可以估計(jì)冷卻負(fù)荷(例如BTU)。根據(jù)某些實(shí)施方案,這可以使用參考表(例如來(lái)自ASHME的那些參考表)來(lái)進(jìn)行,以確定為了保持期望的數(shù)據(jù)中心在設(shè)定點(diǎn)溫度操作所需要的總冷卻能量。模型可以捕獲估計(jì)冷卻負(fù)荷的非線性模型,所述冷卻負(fù)荷為在數(shù)據(jù)中心部署給定的熱源(即,新的IT設(shè)備)時(shí)エ廠所需要的冷卻負(fù)荷。由于模型可以依賴于數(shù)據(jù)中心的具體的物理配置和IT布局及冷卻系統(tǒng),所以其可以通過(guò)適配(反饋)并且利用エ廠的熱力學(xué)性質(zhì)的任何現(xiàn)有技術(shù)來(lái)構(gòu)建?;谟晌锢砉S模擬器和邏輯模擬器提供的冷卻負(fù)荷需要的策略和放置選項(xiàng),該模塊可以使用博弈論技術(shù)確定來(lái)自數(shù)據(jù)中心的測(cè)量和我們稱為V指標(biāo)(在下文定義的)的量值,其是設(shè)備的最小化對(duì)于數(shù)據(jù)中心的總冷卻和功率的最佳放置選項(xiàng)。優(yōu)化器可以基于計(jì)劃的總能量(來(lái)自邏輯模擬器的IT功率消耗和來(lái)自物理エ廠模擬器的冷卻負(fù)荷)成本來(lái)評(píng)價(jià)和分析由能量策略選擇器推薦的放置選項(xiàng)。其可以確定最優(yōu)的策略和放置選項(xiàng)。當(dāng)執(zhí)行最優(yōu)策略和放置選項(xiàng)時(shí),優(yōu)化器可以比較實(shí)際的冷卻和總能量負(fù)荷,并且基于來(lái)自計(jì)劃的值的錯(cuò)誤,更新エ廠能量模型。 使用閉環(huán)控制,數(shù)據(jù)中心物理エ廠模型可以為了精確度而連續(xù)地更新。這進(jìn)而可 以改進(jìn)給定的數(shù)據(jù)中心的總能量節(jié)約的可預(yù)測(cè)性。如在圖14的示例性的⑶I中示出的,可以監(jiān)測(cè)數(shù)據(jù)中心的操作以理解在任何時(shí)間每個(gè)IT部件消耗多少功率??梢允褂没谂渲貌考?,例如在服務(wù)器的情況下,CPU核、存儲(chǔ)器等等的數(shù)量,估計(jì)不同的賣方IT設(shè)備(例如服務(wù)器、存儲(chǔ)部等等)的功率抽運(yùn)的數(shù)據(jù)庫(kù)或電子存儲(chǔ)部。一旦數(shù)據(jù)中心的物理布局和邏輯IT基礎(chǔ)架構(gòu)已知,那么該數(shù)據(jù)庫(kù)可以允許自動(dòng)化軟件預(yù)測(cè)在設(shè)備級(jí)的功率消耗。該數(shù)據(jù)庫(kù)和用于使用的儀表的關(guān)鍵的使用情況可以是在任何時(shí)間被任何設(shè)備的實(shí)際的功率消耗的預(yù)測(cè)中。根據(jù)某些實(shí)施方案,可以通過(guò)連續(xù)地監(jiān)測(cè)功率和冷卻能量使用,執(zhí)行對(duì)能量和功率消耗的當(dāng)前狀態(tài)的理解。其可以具有多個(gè)原因首先,由設(shè)備賣方列出的功率消耗和冷卻規(guī)格可以是最壞情況的值。使用賣方的面板數(shù)量可以因此導(dǎo)致高水平的超量供應(yīng),這進(jìn)而可以導(dǎo)致功率系統(tǒng)的較高成本以及因此功率輸送的較低效率和較高成本。第二,IT設(shè)備的功率消耗水平可以隨利用率的水平顯著地變化。當(dāng)服務(wù)器從很少使用變?yōu)橥耆脮r(shí),功率水平的50%的波動(dòng)可能是常見(jiàn)的。當(dāng)功率消耗的這種變化在數(shù)據(jù)中心的很多服務(wù)器中放大時(shí),總功率抽運(yùn)的差異可以是非常大的。第三,可能由于服務(wù)器的物理配置的相對(duì)小的變化而引起功率抽運(yùn)的大的變化。第四,精確的功率抽運(yùn)測(cè)量可以需要干涉性儀表,尤其在多個(gè)設(shè)備例如服務(wù)器從單個(gè)電路抽運(yùn)功率并且安裝分別的服務(wù)器水平計(jì)可能不是可能的吋。第五,雖然估計(jì)功率是困難的,但是當(dāng)不同的IT設(shè)備被放置在數(shù)據(jù)中心的不同區(qū)域時(shí),預(yù)測(cè)在數(shù)據(jù)中心的不同區(qū)域的冷卻負(fù)荷是更困難的。目前沒(méi)有用干與數(shù)據(jù)中心內(nèi)的每個(gè)物理區(qū)域相關(guān)聯(lián)的冷卻負(fù)荷或成本的良好的可承受或可行的實(shí)時(shí)測(cè)量。構(gòu)建數(shù)據(jù)中心內(nèi)的物理IT和功率資源的目錄可以使用手動(dòng)檢查數(shù)據(jù)中心和使用儀表檢測(cè)數(shù)據(jù)中心二者??梢允褂迷敿?xì)的目錄以測(cè)量在地板上部署了什么消耗功率的物理IT設(shè)備。細(xì)節(jié)的水平可以包括位置,即在服務(wù)器機(jī)架內(nèi)的位置、數(shù)據(jù)中心內(nèi)的機(jī)架的通過(guò)通道的位置等等,由于冷卻所需要的能量可能依賴于可以具有較寬地變化的熱力學(xué)配置文件的具體位置。然后可以檢索和搜索物理目錄,如圖15中所示的,其中對(duì)于每個(gè)已經(jīng)通過(guò)位置標(biāo)識(shí)的服務(wù)器,可以使用以足夠的精確度測(cè)量功率消耗的儀表檢測(cè)。由于預(yù)期的能量節(jié)約水平可能在20% -40%的范圍內(nèi),所以任何具有高于幾個(gè)百分點(diǎn)的公差的儀表檢測(cè)方法可能不足以精確地表征操作功率消耗和能量節(jié)約的潛力。因?yàn)楣β氏哪壳安辉谠O(shè)備處測(cè)量而是在數(shù)據(jù)中心中的粗略的水平處測(cè)量,所以可能缺乏精確而詳細(xì)的儀表檢測(cè)??梢栽趩为?dú)的IT設(shè)備(或電路)級(jí)估計(jì)功率抽運(yùn)。這種新技術(shù)可以使用設(shè)備內(nèi)信息來(lái)預(yù)測(cè)消耗的功率,而不需要任何專門的測(cè)量或接線。這可以解決兩個(gè)問(wèn)題 首先,可能不能物理地安裝儀表以得到分別的設(shè)備,例如在機(jī)架內(nèi)的服務(wù)器。
第二,即使儀表檢測(cè)是可能的,某些數(shù)據(jù)中心的所有者可能不情愿允許侵入性的儀表檢測(cè)??紤]到這些限制并且因?yàn)槲墨I(xiàn)上一直沒(méi)有用于解決該問(wèn)題的途徑,這種新的歸納法可以通過(guò)從設(shè)備直接地讀取其他的數(shù)據(jù)來(lái)估計(jì)在單獨(dú)的設(shè)備級(jí)的功率消耗,而不考慮它們所在的電路。這可以提供與設(shè)備相關(guān)的功率,而與設(shè)備配置無(wú)關(guān)?!┎东@了所有的IT設(shè)備的物理目錄,那么我們使用數(shù)據(jù)庫(kù)可以允許對(duì)什么業(yè)務(wù)應(yīng)用軟件被邏輯地對(duì)物理設(shè)備繪圖,例如什么服務(wù)器用于電子郵件服務(wù)。使用這種邏輯搭配,可以確定什么IT設(shè)備用于什么業(yè)務(wù)關(guān)鍵的(或,相反地,業(yè)務(wù)上不重要的)應(yīng)用程序以及其是否被分配了功率預(yù)算的不公平的份額。物理工廠模擬器可以提供物理エ廠的熱圖。然而,為了估計(jì)冷卻負(fù)荷,策略選擇器可以使用物理工廠模擬器和數(shù)據(jù)中心エ廠能量模型的輸出。這種估計(jì)可以幫助定量地評(píng)價(jià)任何新的或改變的IT負(fù)荷的總能量影響,并且可以輔助提供所選擇的能量節(jié)約策略的預(yù)測(cè)能力。就我們所知,雖然現(xiàn)有的用于減小數(shù)據(jù)中心的能量的方法使用手動(dòng)方法和點(diǎn)對(duì)點(diǎn)方法,但是本發(fā)明的方法可以提供用于數(shù)據(jù)中心的能量減小的自動(dòng)的和可擴(kuò)展的方法。目前的數(shù)據(jù)中心的能量效率的測(cè)量是非常粗略的并且不能幫助確定可以節(jié)約能量的具體區(qū)域。其包括僅指示由數(shù)據(jù)中心使用的總功率的哪一部分由IT設(shè)備使用的功率使用效率(PUE)測(cè)量。其可以具有嚴(yán)重的限制例如,PUE不提供關(guān)于區(qū)域中的熱點(diǎn)(數(shù)據(jù)中心內(nèi)的比其他的區(qū)域更熱的區(qū)域或區(qū))或冷卻低效率如何増加冷卻成本的信息,因?yàn)闊狳c(diǎn)升高了毗鄰區(qū)域中的溫度,所述毗鄰區(qū)域在正常情況下會(huì)較冷。這種低效率可以將冷卻成本増加20%或更多。如果PUE不能夠隔離導(dǎo)致低效率的局部區(qū)域,那么其不指示數(shù)據(jù)中心的哪個(gè)區(qū)域可以導(dǎo)致最大的能量節(jié)約,以及低效率的本質(zhì)原因。因?yàn)槟壳暗男蕼y(cè)量提供有限的信息,所以識(shí)別數(shù)據(jù)中心的低效率來(lái)源是ー個(gè)手動(dòng)過(guò)程。新的定量的細(xì)化的效率量值,即“Viridity指標(biāo)”或“V指標(biāo)”可以以小于機(jī)架的単元和機(jī)架內(nèi)的單元來(lái)表征數(shù)據(jù)中心。其可以從數(shù)據(jù)中心內(nèi)的可測(cè)量的參數(shù)導(dǎo)出或計(jì)算。其可以定量地指示在應(yīng)用任何能量節(jié)約策略之后能量效率的改進(jìn)。已經(jīng)開發(fā)了多種不同的V指標(biāo),包括關(guān)于IT設(shè)備在數(shù)據(jù)中心內(nèi)的最好的放置、關(guān)于IT設(shè)備的能量效率以及關(guān)于數(shù)據(jù)中心內(nèi)的任何區(qū)域的冷卻效率的指標(biāo)。
作為關(guān)于如何使用V指標(biāo)的簡(jiǎn)單的例證,考慮新的IT設(shè)備即服務(wù)器在數(shù)據(jù)中心內(nèi)的放置。圖13示出了數(shù)據(jù)中心的熱配置文件(其通過(guò)稱為計(jì)算流體動(dòng)力學(xué)或CFD的計(jì)算密集型過(guò)程產(chǎn)生)。在數(shù)據(jù)中心上標(biāo)記了兩個(gè)區(qū)域,即ー個(gè)熱區(qū)域和ー個(gè)冷區(qū)域。簡(jiǎn)單的方法將是將服務(wù)器定位在冷區(qū)域中。然而,設(shè)備的放置更復(fù)雜,因?yàn)槠浔仨毧紤]到在該區(qū)域的冷卻成本(效率)、在機(jī)架和空間中可用的總功率(瓦持)。使用放置V指標(biāo),我們可以自動(dòng)地確定數(shù)據(jù)中心內(nèi)的最小化冷卻成本同時(shí)確保滿足可用的功率和空間限制等等的最好區(qū)域。圖16示出了使用V指標(biāo)進(jìn)行服務(wù)器在數(shù)據(jù)中心內(nèi)的最優(yōu)放置的可視化結(jié)果。綠色區(qū)域指示服務(wù)器的理想位置。、
作為計(jì)劃步驟的一部分,可以提供可以在數(shù)據(jù)中心內(nèi)實(shí)現(xiàn)的策略的按優(yōu)先級(jí)列出且可行的列表。該列表由策略選擇器使用。圖17描繪了消除僵尸服務(wù)器策略的可視視圖。紅色區(qū)域指示可以去除的僵尸服務(wù)器(例如未使用的服務(wù)器或其他的未利用的資源)的位置??尚械牟呗缘膸讉€(gè)實(shí)施例包括 熱點(diǎn)消除識(shí)別熱點(diǎn)可以包括識(shí)別數(shù)據(jù)中心內(nèi)的比其他的區(qū)域更熱的區(qū)域。通過(guò)移動(dòng)設(shè)備或修改負(fù)荷,我們可以減小所使用的功率(產(chǎn)生的熱)或改進(jìn)冷卻(例如空氣流)。該策略可以導(dǎo)致較低的冷卻負(fù)荷和較低的成本。 設(shè)備放置設(shè)備放置可以涉及明智地將新的設(shè)備放置在較冷的點(diǎn)而不是較熱的點(diǎn)處,以降低數(shù)據(jù)中心的總體溫度。 在較高的溫度運(yùn)行數(shù)據(jù)中心在較高的溫度運(yùn)行數(shù)據(jù)中心可以減小總的冷卻負(fù)荷并且因此提高數(shù)據(jù)中心的功率消耗效率。 去除僵尸服務(wù)器通過(guò)識(shí)別和棄用“僵尸”服務(wù)器(即數(shù)據(jù)中心內(nèi)的不用于任何應(yīng)用程序的服務(wù)器),可以減小功率消耗和冷卻負(fù)荷?!?IT資源的整合整合IT資源使得計(jì)算和存儲(chǔ)資源具有較高的容量,可以減小消耗的總功率(即可以減小KW/單元)。 更換較低能效的設(shè)備使用較高能效的設(shè)備更換較低能效的設(shè)備可以減小總的功率消耗。這些策略中的大多數(shù),無(wú)論設(shè)備放置還是技術(shù)革新,都不是簡(jiǎn)單的決定。其要求考慮以下因素i.將邏輯IT設(shè)備使用對(duì)其的當(dāng)前物理位置繪圖;以及ii.空間和可用功率的限制。做出變化,無(wú)論是放置還是重新定位新的設(shè)備,將局部地和在毗鄰的區(qū)域中改變功率負(fù)荷和相關(guān)聯(lián)的冷卻負(fù)荷。
典型地,這樣的問(wèn)題的解決方案在能量?jī)?yōu)化器中實(shí)現(xiàn),其要求解決多約束的優(yōu)化問(wèn)題。根據(jù)ー個(gè)實(shí)施方案,ー種方法是監(jiān)測(cè)-理解-控制整個(gè)數(shù)據(jù)中心的能量效率。根據(jù)某些實(shí)施方案,ー個(gè)或多個(gè)計(jì)算可以包括含有其他的成本因素(包括冷卻成本)的指標(biāo)。例如,可以具有可計(jì)算瓦特的實(shí)際成本的Viridity指標(biāo)。功率的成本可以等于IT-功率-成本+冷卻_功率-成本+損失。其他的計(jì)算可以包括籲功率的成本 PUE*瓦特_成本; 空間的成本=數(shù)據(jù)中心/瓦特的分?jǐn)偟馁Y本成本;以及
超量供應(yīng)的功率+冷卻HW/瓦特的成本= >過(guò)量的H)U、制冷器、UPS、UPS電池等等/瓦持。此外,數(shù)據(jù)中心內(nèi)的任何IT部署可以影響功率、冷卻、空間和可用性(可靠性)。傳統(tǒng)的PUE計(jì)算可能是不足夠的。例如,圖18可以是表示數(shù)據(jù)中心內(nèi)的用于放置設(shè)備的兩個(gè)不同位置的熱圖。選項(xiàng)I可以是熱位置并且選項(xiàng)2可以是冷位置。根據(jù)某些實(shí)施方案,可以使用計(jì)算流體力學(xué)識(shí)別這些位置。傳統(tǒng)的PUE計(jì)算可能不足以識(shí)別它們。計(jì)算范圍可以被細(xì)化其中可以放置設(shè)備的次機(jī)架級(jí)“區(qū)域”。這可以用于設(shè)備的最優(yōu)放置。功率的效率的指示被向區(qū)域傳送(對(duì)于被IT設(shè)備完成的功)。數(shù)據(jù)中心可以被分解或組織為區(qū)域。區(qū)域的精細(xì)度可以小于機(jī)架(例如跨過(guò)兩個(gè)機(jī)架IU或2U)或大于或等于機(jī)架(例如多個(gè)機(jī)架)?;⒉刍騏可以被匯集入?yún)^(qū)域中。例如,圖19可以是在劃分區(qū)域之前的單個(gè)機(jī)架単元。圖20可以是根據(jù)某些實(shí)施方案的機(jī)架単元的示例性的區(qū)域劃分。區(qū)域還可以跨越機(jī)架和/或包括ー個(gè)或多個(gè)機(jī)架。示例性的指標(biāo)包括· Vt-相對(duì)溫度指標(biāo)/區(qū)域其是可以指示如何在可能被不均勻地冷卻(例如具有熱點(diǎn))的數(shù)據(jù)中心分布冷卻成本的指標(biāo)?!?Vw-瓦特指標(biāo)該指標(biāo)指示在具體的區(qū)域中使用的瓦特相對(duì)于所提供的總潛在瓦持。· Vs-區(qū)域中可用的標(biāo)準(zhǔn)化空間該指標(biāo)指示可用的槽(U的)和連續(xù)的槽(U的)?!?Vu-區(qū)域中的IT設(shè)備的利用率為了計(jì)算該指標(biāo),人們可能首先需要?dú)wー化核X時(shí)鐘頻率X利用率的數(shù)字。· Vp :區(qū)域(矢量)或數(shù)據(jù)中心的放置指標(biāo)(成本)Vp = Vt Vw VsVp是溫度指標(biāo)、瓦特指標(biāo)和空間指標(biāo)的函數(shù)。較高值的區(qū)域可能是不太期望的位置。·νε:ΙΤ的歸ー化效率Ve = f(Vt Vu)(非線性函數(shù)!)Ve是IT利用率和溫度指標(biāo)的函數(shù)。較低值的區(qū)域的效率較低在利用率Vu是較高吋。Ve可能較高。如果熱指標(biāo)Vt較高,那么Ve可能較低。其可以從CPU溫度、服務(wù)器的GxDB配置文件等等來(lái)估計(jì)。
· I =IT設(shè)備/區(qū)域的可靠性指標(biāo)如圖21中圖示的,可靠性可以取決于區(qū)域中的設(shè)備的使用年限。如圖22中圖示的,其可以取決于區(qū)域的溫度Vt。關(guān)于設(shè)備的放置的熱指標(biāo)可以包括 總體(數(shù)據(jù)中心范圍)\其可以測(cè)量數(shù)據(jù)中心(DC)內(nèi)的熱配置文件的不平衡。其可以提供示出了不平衡的品質(zhì)的單個(gè)數(shù)值(特別是冷卻低效率)。其可以與區(qū)域溫度的加權(quán)差值相關(guān)。
iy y (Z1-ZtY ぐ_ _ _
t _NZi、Zj意指區(qū)域i和j的溫度Clij :區(qū)域i和j之間的距離1總#區(qū)域 局部 Vt其可以測(cè)量單個(gè)區(qū)域的熱配置文件的不平衡。其可以是區(qū)域中的任何IT設(shè)備的放置成本。其可以是相對(duì)成本測(cè)量。其可以與數(shù)據(jù)中心熱配置文件相關(guān)。可以使用計(jì)算流體動(dòng)力學(xué)驗(yàn)證熱點(diǎn)。
ITu(Z1-Zt)2 d-m" 11
VtI= Γ\圖23可以是用于比較兩個(gè)數(shù)據(jù)中心配置的總體Vt指標(biāo)的使用的實(shí)施例??梢跃哂性诓煌瑴囟鹊?6個(gè)均一的(機(jī)架級(jí))區(qū)域。圖24可以是總體Vt的第二實(shí)施例。兩個(gè)數(shù)據(jù)中心配置可以含有相同的區(qū)域溫度設(shè)置,但是具有不同的分布。圖25可以是局部(區(qū)域)Vt的另ー個(gè)實(shí)施例。局部區(qū)域Vt可以是用于將設(shè)備放置在那兒的“粗金”成本。如果區(qū)域溫度比毗鄰的區(qū)域具有更大的差異的話,其可能較高這可以反映熱-冷空氣混合的較高成本。總之,許多不同的能量節(jié)約策略是可能的,每種策略在不同的參數(shù)工作并且產(chǎn)生不同的V指標(biāo)。能量節(jié)約策略
權(quán)利要求
1.一種用于多個(gè)計(jì)算平臺(tái)部件的功率分析的方法,包括 接收與部件相關(guān)聯(lián)的信息; 使用計(jì)算機(jī)處理器檢索與所述部件相關(guān)聯(lián)的電子存儲(chǔ)的數(shù)據(jù); 至少部分地基于所述存儲(chǔ)的數(shù)據(jù)估計(jì)所述部件的功率使用;以及 輸出所述功率使用的指示。
2.根據(jù)權(quán)利要求I所述的方法,其中所述部件包括計(jì)算機(jī)處理器、電子存儲(chǔ)部和聯(lián)網(wǎng)部件中的至少一個(gè)。
3.根據(jù)權(quán)利要求I所述的方法,還包括 對(duì)設(shè)備的多個(gè)部件重復(fù)所述過(guò)程;以及 匯集所述設(shè)備的部件的功率使用的功率估計(jì),以提供所述設(shè)備的估計(jì)的功率使用。
4.根據(jù)權(quán)利要求3所述的方法,其中所述設(shè)備包括服務(wù)器、網(wǎng)絡(luò)設(shè)備、主機(jī)和存儲(chǔ)設(shè)備中的至少一個(gè)。
5.根據(jù)權(quán)利要求3所述的方法,還包括 對(duì)區(qū)域中的多個(gè)設(shè)備重復(fù)所述過(guò)程。
6.根據(jù)權(quán)利要求I所述的方法,還包括 接收與部件相關(guān)聯(lián)的一個(gè)或多個(gè)測(cè)量結(jié)果;以及 至少部分地基于所接收的一個(gè)或多個(gè)測(cè)量結(jié)果來(lái)估計(jì)所述部件的功率使用。
7.根據(jù)權(quán)利要求6所述的方法,其中所述一個(gè)或多個(gè)測(cè)量結(jié)果包括來(lái)自溫度傳感器、處理器芯片、散熱器、磁盤控制器、電源和網(wǎng)絡(luò)部件的讀數(shù)中的至少一個(gè)。
8.根據(jù)權(quán)利要求6所述的方法,其中所述一個(gè)或多個(gè)測(cè)量結(jié)果包括CPU使用率、事務(wù)處理速率、通信速率、配置信息、活動(dòng)進(jìn)程和多種虛擬機(jī)中的至少一個(gè)。
9.根據(jù)權(quán)利要求I所述的方法,還包括 至少部分地基于部件的所估計(jì)的功率使用和一個(gè)或多個(gè)接收的測(cè)量結(jié)果中的一個(gè)或多個(gè)來(lái)估計(jì)所述部件的熱變化曲線。
10.根據(jù)權(quán)利要求9所述的方法,還包括基于所述熱變化曲線估計(jì)功率使用。
11.根據(jù)權(quán)利要求10所述的方法,其中基于所述熱變化曲線的所述估計(jì)的功率使用包括使用所述熱變化曲線來(lái)估計(jì)冷卻成本。
12.根據(jù)權(quán)利要求I所述的方法,還包括 接收來(lái)自配電單元和計(jì)算機(jī)機(jī)房空氣調(diào)節(jié)器中的至少一個(gè)的一個(gè)或多個(gè)測(cè)量結(jié)果。
13.根據(jù)權(quán)利要求12所述的方法,還包括 使用所接收的一個(gè)或多個(gè)測(cè)量結(jié)果來(lái)估計(jì)功率使用和熱變化曲線中的至少一個(gè)。
14.根據(jù)權(quán)利要求I所述的方法,其中接收與部件相關(guān)聯(lián)的信息包括通過(guò)網(wǎng)絡(luò)接口發(fā)現(xiàn)部件。
15.根據(jù)權(quán)利要求14所述的方法,其中通過(guò)網(wǎng)絡(luò)接口發(fā)現(xiàn)部件包括使用以下項(xiàng)中的至少一個(gè) 簡(jiǎn)單網(wǎng)絡(luò)管理協(xié)議(SNMP)、存儲(chǔ)管理計(jì)劃規(guī)范(SMI-S)、智能平臺(tái)管理接口(IPMI)、Windows 管理規(guī)范(WMI)、安全外殼(SSH)、BACNet 和 ModBus。
16.根據(jù)權(quán)利要求14所述的方法,其中通過(guò)網(wǎng)絡(luò)接口發(fā)現(xiàn)部件包括在來(lái)自遠(yuǎn)程地點(diǎn)的數(shù)據(jù)中心上進(jìn)行的發(fā)現(xiàn)。
17.根據(jù)權(quán)利要求I所述的方法,還包括 在沒(méi)有檢索到與部件相關(guān)聯(lián)的電子存儲(chǔ)的數(shù)據(jù)的情況下接受用于未被識(shí)別的該部件的輸入。
18.根據(jù)權(quán)利要求I所述的方法,還包括 發(fā)現(xiàn)與部件相關(guān)聯(lián)的一個(gè)或多個(gè)邏輯要素;以及 至少部分地基于所發(fā)現(xiàn)的一個(gè)或多個(gè)邏輯要素來(lái)估計(jì)功率使用。
19.根據(jù)權(quán)利要求18所述的方法,其中所述一個(gè)或多個(gè)邏輯要素包括與部件相關(guān)聯(lián)的操作系統(tǒng)組成部分、與部件相關(guān)聯(lián)的進(jìn)程、與部件相關(guān)聯(lián)的虛擬機(jī)和與部件相關(guān)聯(lián)的應(yīng)用程序中的至少一個(gè)。
20.根據(jù)權(quán)利要求I所述的方法,其中與所述部件相關(guān)聯(lián)的電子存儲(chǔ)的數(shù)據(jù)包括以下項(xiàng)中的至少一個(gè)的數(shù)據(jù)庫(kù)部件的配置文件、服務(wù)器陣列、計(jì)算機(jī)機(jī)房空氣調(diào)節(jié)器、配電單元和數(shù)據(jù)中心物理基礎(chǔ)設(shè)施。
21.根據(jù)權(quán)利要求I所述的方法,還包括 基于以下項(xiàng)中的至少一個(gè)提供一個(gè)或多個(gè)建議部件的估計(jì)的功率使用、設(shè)備的估計(jì)的功率使用、區(qū)域的估計(jì)的功率使用、數(shù)據(jù)中心的估計(jì)的功率使用、區(qū)域的熱變化曲線和區(qū)域的熱變化曲線。
22.根據(jù)權(quán)利要求21所述的方法,其中所述一個(gè)或多個(gè)建議包括以下項(xiàng)中的至少一個(gè)去除未利用的部件、整合未充分利用的部件、升級(jí)低效的部件、更換低效的部件、將一地理位置內(nèi)的部件重新布置以改進(jìn)熱變化曲線、和將工作負(fù)荷在地理區(qū)域內(nèi)的部件上重新分布以改進(jìn)熱變化曲線。
23.根據(jù)權(quán)利要求9所述的方法,其中使用計(jì)算流體動(dòng)力學(xué)估計(jì)所述熱變化曲線。
24.至少一種非瞬時(shí)性處理器可讀的存儲(chǔ)介質(zhì),用于存儲(chǔ)被配置為由至少一個(gè)處理器可讀取以指示所述至少一個(gè)處理器執(zhí)行用于進(jìn)行根據(jù)權(quán)利要求I所述的方法的計(jì)算機(jī)進(jìn)程的計(jì)算機(jī)程序指令。
25.一種制造物品,其用于多個(gè)計(jì)算平臺(tái)部件的功率分析,所述制造物品包括 至少一種非瞬時(shí)性處理器可讀介質(zhì);以及 存儲(chǔ)在至少一種介質(zhì)上的指令; 其中所述指令被配置為由至少一個(gè)處理器從所述至少一種介質(zhì)可讀取并且由此使所述至少一個(gè)處理器操作從而 接收與部件相關(guān)聯(lián)的信息; 檢索與所述部件相關(guān)聯(lián)的電子存儲(chǔ)的數(shù)據(jù); 至少部分地基于所述存儲(chǔ)的數(shù)據(jù)來(lái)估計(jì)所述部件的功率使用;以及 輸出功率使用的指示。
26.一種用于多個(gè)計(jì)算平臺(tái)部件的功率分析的系統(tǒng),包括 一個(gè)或多個(gè)處理器,其通信地耦合于網(wǎng)絡(luò);其中所述一個(gè)或多個(gè)處理器被配置為 接收與部件相關(guān)聯(lián)的信息; 檢索與所述部件相關(guān)聯(lián)的電子存儲(chǔ)的數(shù)據(jù); 至少部分地基于所述存儲(chǔ)的數(shù)據(jù)來(lái)估計(jì)所述部件的功率使用;以及 輸出功率使用的指示。
全文摘要
公開了用于數(shù)據(jù)中心的功率分析的技術(shù),在一個(gè)具體的示例性實(shí)施方案中,該技術(shù)可以被實(shí)現(xiàn)為用于對(duì)多個(gè)計(jì)算平臺(tái)部件進(jìn)行功率分析的方法,該方法包括接收與部件相關(guān)聯(lián)的信息,使用計(jì)算機(jī)處理器檢索與所述部件相關(guān)聯(lián)的電子存儲(chǔ)的數(shù)據(jù),至少部分地基于所存儲(chǔ)的數(shù)據(jù)估計(jì)所述部件的功率使用,以及輸出功率使用的指示。
文檔編號(hào)G06F7/38GK102687111SQ201080041811
公開日2012年9月19日 申請(qǐng)日期2010年7月20日 優(yōu)先權(quán)日2009年7月20日
發(fā)明者亞當(dāng)·馬圖夏克, 克里斯多佛·羅卡, 威廉·懷特, 邁克爾·D·安東尼, 邁克爾·T·羅溫, 邁克爾·亨里克森, 阿羅克·古哈 申請(qǐng)人:美國(guó)能量變換公司