專利名稱::平衡網(wǎng)格計算環(huán)境中的工作負荷的方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
:本發(fā)明一般地涉及網(wǎng)格計算,更具體地涉及網(wǎng)格計算環(huán)境中的工作負荷管理。
背景技術(shù):
:網(wǎng)格計算環(huán)境允許多個異類的和/或在地理上遠離的系統(tǒng)間的互連。在一個例子中,為了方便系統(tǒng)間的互連,采用了位于紐約阿蒙克(Armonk)的國際商業(yè)機器公司所提供的Globus工具包。Globus使得用戶能夠指定所述多個系統(tǒng)中的哪個系統(tǒng)將運行作業(yè)。用戶使用一種資源規(guī)范語言(ResourceSpecificationLanguage,RSL)向選定系統(tǒng)提交作業(yè)。Globus收到這種RSL之后,將其轉(zhuǎn)換成目標系統(tǒng)上的調(diào)度器所能識別的恰當格式。例如,如果調(diào)度器是國際商業(yè)機器公司所提供的LoadLeveler,那么該RSL將被轉(zhuǎn)換成命令文件。因為,或者說盡管,用戶可以選擇一個或多個系統(tǒng)運行他們的作業(yè),網(wǎng)格計算環(huán)境的各系統(tǒng)可能會變得不平衡。例如,一個系統(tǒng)可能有過多的工作負荷,而另一個系統(tǒng)卻可能有過少的工作負荷。因此,需要一種對網(wǎng)格計算環(huán)境中的工作負荷進行平衡的能力。并且需要一種用于對特定工作確定最佳配合的能力。
發(fā)明內(nèi)容通過提供一種網(wǎng)格計算環(huán)境中工作負荷平衡方法,本發(fā)明克服了以往技術(shù)的缺點并且具有其它優(yōu)點。該方法包括,例如,獲取關(guān)于網(wǎng)格計算環(huán)境的多個系統(tǒng)中一個或多個系統(tǒng)的信息;以及使用至少一部分所獲取的信息來平衡所述所述多個系統(tǒng)中至少兩個系統(tǒng)的工作負荷。在這里,也對前面概述的方法所對應(yīng)的系統(tǒng)及計算機程序產(chǎn)品進行了描述和聲明。通過本發(fā)明的技術(shù)還實現(xiàn)了其它的特性和優(yōu)點。這里還對本發(fā)明的其它實施例和其它方面進行了詳細描述,并且認為它們是所聲明的本發(fā)明的一部分。本發(fā)明的主題在權(quán)利要求書中被具體指出并且被清楚聲明。參照附圖的以下詳細描述,清晰描繪了本發(fā)明的以上和其它目的、特性和優(yōu)點,其中圖1示出了一種計算環(huán)境的實施例,該計算環(huán)境引入和采用了本發(fā)明的一個或多個方面;圖2示出了根據(jù)本發(fā)明的一個方面、與在圖1的計算環(huán)境中平衡工作負荷相關(guān)聯(lián)的邏輯的一個實施例;圖3示出了根據(jù)本發(fā)明的一個方面、關(guān)于工作負荷平衡邏輯的一個實施例的更具體的細節(jié);以及圖4示出了根據(jù)本發(fā)明的一個方面、用于決定由該環(huán)境中的哪一個系統(tǒng)來運行一給定作業(yè)的邏輯的一個實施例。具體實施例方式根據(jù)本發(fā)明的一個方面,在一網(wǎng)格計算環(huán)境中執(zhí)行工作負荷平衡。在一個例子中,該網(wǎng)格計算環(huán)境的管理器守護程序(managerdaemon)獲取該環(huán)境中一個或者多個系統(tǒng)的信息,并且根據(jù)這些所獲取的信息確定工作負荷在這些系統(tǒng)中的布置。工作負荷的布置可包括例如將作業(yè)從一個系統(tǒng)調(diào)換到另一個系統(tǒng)或者最初將作業(yè)布置到一特定系統(tǒng)等。舉例來說,所述信息是從所述系統(tǒng)的調(diào)度器中獲取的。網(wǎng)格計算允許虛擬化分布式計算和數(shù)據(jù)資源,例如數(shù)據(jù)處理、網(wǎng)絡(luò)帶寬和存儲能力,以便創(chuàng)建單個的系統(tǒng)映像,以準許用戶和應(yīng)用程序?qū)A啃畔⒓夹g(shù)(IT)能力的無縫訪問。一個網(wǎng)格計算環(huán)境的各個系統(tǒng)經(jīng)常是異類的系統(tǒng)。也就是說,所述環(huán)境的多個系統(tǒng)中至少一個系統(tǒng)包含與該環(huán)境的至少一個其它系統(tǒng)不同的硬件或者軟件。此外或者可選擇地,這些系統(tǒng)相互間可以是地理上相互遠離的。關(guān)于網(wǎng)格計算的更多細節(jié)請參見例如網(wǎng)址www-1.ibm.com/grid/about_grid/what_is.shtml。圖1示出了一種計算環(huán)境的實施例,該計算環(huán)境引入和采用了本發(fā)明的一個或多個方面。網(wǎng)格計算環(huán)境100包括例如多個系統(tǒng)102。在這個特定例子中,描述了兩個系統(tǒng),系統(tǒng)A和系統(tǒng)B。但在其它例子中,計算環(huán)境可包含兩個以上的系統(tǒng)。在一個例子中,系統(tǒng)A包含一個由位于紐約阿蒙克的國際商業(yè)機器公司所提供的具有多個RS/6000節(jié)點的可伸縮并行(ScalableParallel,SP)機,而系統(tǒng)B包含一個也是由國際商業(yè)機器公司提供的LINUX群集。通過連接104,例如以太網(wǎng)連接或其它類型的連接,各系統(tǒng)102相互連接。舉例來講,系統(tǒng)102包含一個調(diào)度器106用來調(diào)度該系統(tǒng)中的作業(yè)。一個調(diào)度器可以是多種類型的調(diào)度器中的一種,并且每個系統(tǒng)可具有相同或不同類型的調(diào)度器。例如,系統(tǒng)A中的調(diào)度器106包含有國際商業(yè)機器公司提供的LoadLeveler,而系統(tǒng)B中的調(diào)度器106包含有AltairGridTechnologies,LLC提供的PortableBatchSystem(PBS)。在2001年12月出版的、IBM出版號為SA22-7881-00的、V3R1、標題為IBMLoadLevelerUsingandAdministrating”(IBMLoadleveler使用和管理)的IBM出版物中描述了LoadLeveler的一個例子,特此將該出版物作為參考全文引入本說明書。在一個例子中,至少一個調(diào)度器進行回填調(diào)度(backfillscheduling)。回填調(diào)度允許一個應(yīng)用程序亂序運行,只要其不影響已被調(diào)度運行的應(yīng)用程序的開始時間。在2003年4月4日申請的、標題為“BackfillSchedulingOfApplicationsBasedOnDataofTheApplications”(基于應(yīng)用程序數(shù)據(jù)的應(yīng)用程序回填調(diào)度)的美國專利申請No.10/406,985中描述了回填調(diào)度的一個例子,特此將該申請作為參考全文引入本說明書。在一個例子中,由于網(wǎng)格計算環(huán)境中的各個系統(tǒng)是異類的,因此采用了由國際商業(yè)機器公司提供的稱為Globus的工具包,以方便系統(tǒng)間的通信。這一工具包在各系統(tǒng)間創(chuàng)建了一個公共層。例如,對于一個啟用了Globus的系統(tǒng),作業(yè)的信息經(jīng)由Globus,而Globus將其轉(zhuǎn)換為一Globus格式,而后將該信息傳給另一個Globus系統(tǒng),并由它將該信息轉(zhuǎn)換成一種該接收系統(tǒng)能夠識別的格式。這使得具有一個或多個不同的操作系統(tǒng)、不同的中間件和/或不同的調(diào)度器的各個系統(tǒng)之間能夠進行有效地通信。關(guān)于Globus的更多細節(jié)請參見例如2003年6月18日出版的、IBM出版號SG24-6936-00的、標題為“EnablingApplicationsforGridComputingwithGlobus”(具有Globus的網(wǎng)格計算的使能應(yīng)用程序)的IBM出版物,特此將該出版物作為參考全文引入本說明書。根據(jù)本發(fā)明的一個方面,在網(wǎng)格計算環(huán)境中的一個系統(tǒng)還包含一管理器守護程序108。所述管理器守護程序運行于后臺,并負責(zé)平衡所述環(huán)境中至少一部分系統(tǒng)之間的工作負荷。所述管理器守護程序獲取(例如,被提供、確定等)將被管理的多個系統(tǒng)的信息。這種信息包括例如這些系統(tǒng)的標識、聯(lián)系這些系統(tǒng)的方式等。管理器守護程序定期執(zhí)行對網(wǎng)格計算環(huán)境中的工作負荷進行平衡的邏輯。在一個例子中,這種邏輯是以可配置的時間間隔執(zhí)行的(例如,每5分鐘執(zhí)行一次)。作為另一個例子,這種邏輯的執(zhí)行是基于事件的(例如,根據(jù)作業(yè)的啟動和/或完成、可用系統(tǒng)資源的變化等)。參照圖2-4描述了與平衡一網(wǎng)格計算環(huán)境中的工作負荷相關(guān)的邏輯的一實施例。首先參看圖2,所述管理器守護程序獲取一個或多個系統(tǒng)的調(diào)度器信息(步驟200)。例如,管理器守護程序聯(lián)系這些系統(tǒng)的調(diào)度器來獲取所需的信息。這種信息包括,例如該系統(tǒng)當前的空閑節(jié)點、該系統(tǒng)的等待作業(yè)的作業(yè)隊列、以及用于該系統(tǒng)的作業(yè)混合的當前狀態(tài)的、調(diào)度器的特定變量設(shè)置,例如下一個等待作業(yè)的陰影時間(shadowtime)(即,該作業(yè)需要等待資源多長時間)以及該陰影時間所保護的一個或多個資源。根據(jù)所獲取的信息,管理器守護程序執(zhí)行工作負荷平衡(步驟202)。參照圖3描述了關(guān)于工作負荷平衡的一個例子的進一步細節(jié)。首先,使用調(diào)度信息確定將由哪一個系統(tǒng)運行一給定的作業(yè)(步驟300)。在一個例子中,這包括確定一特定系統(tǒng)中哪一項等待作業(yè)可以在另一系統(tǒng)上運行。參照圖4描述了進行這種確定所采用的邏輯的一個例子。在這里所描述的例子中,確定系統(tǒng)A中的一個或者多個作業(yè)是否可以轉(zhuǎn)移到系統(tǒng)B中。但是本領(lǐng)域的技術(shù)人員明白的是,可使用類似的邏輯將作業(yè)轉(zhuǎn)移到系統(tǒng)A或其它正在被管理的系統(tǒng)中。參見圖4,確定系統(tǒng)B中是否有任何空閑節(jié)點(查詢400)。如果沒有空閑節(jié)點,則該處理結(jié)束(步驟402)。但是,如果有一個或者多個空閑節(jié)點,就進一步確定系統(tǒng)A中是否有一個或多個等待的作業(yè)(查詢404)。如果系統(tǒng)A中有等待的作業(yè),就進一步確定該等待的作業(yè)是否適合于系統(tǒng)B(查詢406)。如果該等待的作業(yè)適合于系統(tǒng)B,則在一個例子中,進一步確定這一作業(yè)是否可以回填(查詢408)。如果這一作業(yè)適合該新的系統(tǒng)并且可以回填,那么這一作業(yè)就被放置于一傳送列表中(步驟401)。否則就確定系統(tǒng)A中是否還有其它等待的作業(yè)(查詢404)。如果沒有,則該處理結(jié)束(步驟402)。回到圖3,除了確定由哪一個系統(tǒng)運行一給定的作業(yè)之外,工作負荷平衡還包括將所述作業(yè)放置于該系統(tǒng)中(步驟302)。在一個例子中,這包括將每一項作業(yè)(或者這些作業(yè)的一部分)從傳送列表中轉(zhuǎn)移到指定的一個(或多個)系統(tǒng)中。這包括,例如,將該作業(yè)在原系統(tǒng)(例如,系統(tǒng)A)中進行保持以防止啟動被選定傳送的該作業(yè)。這一作業(yè)然后被提交至新的系統(tǒng)中(例如,系統(tǒng)B)。如果轉(zhuǎn)移成功,那么從第一個系統(tǒng)中將這一作業(yè)取消。通過使用保持而后轉(zhuǎn)移的技術(shù),可根據(jù)設(shè)計者的自行決定而提供進一步的錯誤校驗功能。在一個例子中,在作業(yè)轉(zhuǎn)移中使用了Globus所提供的命令。以上詳細描述的是與在一網(wǎng)格計算環(huán)境中采用管理器守護程序執(zhí)行工作負荷平衡相關(guān)的邏輯的一實施例。以下是用于執(zhí)行工作負荷平衡的偽碼的一實施例Doforever{#獲得兩個批系統(tǒng)的當前快照訪問系統(tǒng)A中的LoadLever以獲得空閑節(jié)點A,陰影時間A,等待作業(yè)A訪問系統(tǒng)B中的LoadLever以獲得空閑節(jié)點B,陰影時間B,等待作業(yè)B清空A到B以及B到A的傳送列表#查找系統(tǒng)A中哪些等待的作業(yè)可以在系統(tǒng)B中運行if(空閑節(jié)點B){#如果系統(tǒng)B中有空閑節(jié)點...Foreach(等待作業(yè)A){#那么對于系統(tǒng)A中所有等待作業(yè)...If(作業(yè)A的節(jié)點要求<=空閑節(jié)點B){#如果該作業(yè)適合在系統(tǒng)B中運行...If(作業(yè)AWallclock時間<=陰影時間B){#如果該作業(yè)可以回填...將作業(yè)A放入所述A到B的傳送列表中}}}}#查找系統(tǒng)B中哪些等待的作業(yè)可以在系統(tǒng)A中運行if(空閑節(jié)點A){#如果系統(tǒng)A中有空閑節(jié)點...Foreach(等待作業(yè)B){#那么對于系統(tǒng)B中所有等待作業(yè)...If(作業(yè)B的節(jié)點要求<=空閑節(jié)點A){#如果該作業(yè)適合在系統(tǒng)A中運行...If(作業(yè)BWallclock時間<=陰影時間A){#如果該作業(yè)可以回填...將作業(yè)B放入所述B到A的傳送列表中}}}}#將潛在的作業(yè)從A轉(zhuǎn)移到Bforeach(所述A到B陣列中的作業(yè)){轉(zhuǎn)移作業(yè)A到系統(tǒng)B}#將潛在的作業(yè)從B轉(zhuǎn)移到Aforeach(所述B到A陣列中的作業(yè)){轉(zhuǎn)移作業(yè)B到系統(tǒng)A}#睡眠一段時間#可由用戶配置,大約30秒}#Doforever結(jié)束#轉(zhuǎn)移作業(yè)子例程,用于將作業(yè)從一個系統(tǒng)轉(zhuǎn)移到另一個系統(tǒng)SubMoveJobXtoSystemY{將作業(yè)X置于系統(tǒng)保持提交作業(yè)X至系統(tǒng)Y一旦作業(yè)X出現(xiàn)在系統(tǒng)Y中{將作業(yè)X從系統(tǒng)X中清除}}#子例程結(jié)束這里描述的是在網(wǎng)格計算環(huán)境中平衡工作負荷的一種能力。在一個例子中,為了平衡工作負荷,將作業(yè)從一個負荷較重的系統(tǒng)轉(zhuǎn)移到另外一個負荷較輕的系統(tǒng)中。在其它例子中,工作負荷也可以通過其它的方法進行平衡,例如,工作負荷平衡可包括首先確定由哪一個系統(tǒng)運行一特定的作業(yè)并向這一系統(tǒng)提交該作業(yè)。在這種情況下,用戶將作業(yè)提交至對于管理器守護程序是可見的一待宰欄(holdingpen)。在這一例子中,雖然所述待宰欄中的作業(yè)對于管理器守護程序是可見的,但對各個系統(tǒng)中的調(diào)度器來說是不可見的。管理器守護程序從調(diào)度器請求信息并根據(jù)該信息確定對一特定作業(yè)的最佳配合,而后將作業(yè)提交至選定的系統(tǒng)。雖然作業(yè)的最初的提交是受控制的,但系統(tǒng)仍然可能變得不平衡。作業(yè)運行過程中的不可預(yù)知的事件可導(dǎo)致系統(tǒng)不平衡的發(fā)生(例如,導(dǎo)致作業(yè)提早結(jié)束的作業(yè)失敗),這些事件將破壞先前的排隊決策等。于是,在一個例子中,所述守護程序還運行上述的邏輯來保持工作負荷的平衡。在平衡工作負荷的過程中所用到的信息可以不同于、少于和/或多于以上所描述的信息。作為例子,可使用作業(yè)類別和/或資源匹配(例如存儲器或者軟件許可)以及其它信息來決定工作負荷的布置。本發(fā)明的工作負荷平衡能力使得能夠有利地平衡網(wǎng)格計算環(huán)境中兩個或者更多系統(tǒng)的工作負荷。而且,雖然這里只描述了兩個系統(tǒng),但卻可以使用單個管理器守護程序?qū)Χ嘤趦蓚€的具有獨立的分批排隊能力的系統(tǒng)進行控制。所述邏輯將被擴展以檢查來自其它系統(tǒng)的信息。并且,雖然前面給出了系統(tǒng)的一些例子,但是還存在著很多其它的可能性。作為一個例子,系統(tǒng)是同類的,但卻是在地理上遠離的。還存在很多其它的變化。在一個方面,可以使管理器守護程序無效。當其無效時,用戶仍然可以向多個系統(tǒng)提交作業(yè),但在兩個網(wǎng)格連接的系統(tǒng)之間的自動負荷平衡就不再發(fā)生了。此外,雖然上述例子中采用了回填調(diào)度的技術(shù),但是,包括那些不回填的其它的調(diào)度技術(shù)也可被采用。如果采用了不回填的技術(shù),則可不將陰影時間包括在所述所收集的信息中。舉例說,在一種先進先出(FIFO)的調(diào)度技術(shù)中,管理器守護程序確定空閑的節(jié)點、等待的作業(yè)以及可能地等待的作業(yè)的順序,但它不要求陰影時間。當決定要轉(zhuǎn)移作業(yè)到一個系統(tǒng)時,將考慮空閑的資源,并且沒有陰影時間的檢測。以類似的方式,其它的批調(diào)度技術(shù)可以被用于管理工作負荷。另外,對于那些采用回填技術(shù)的調(diào)度器,在其它實施例中,使用受陰影時間保護(以及不受陰影時間保護)的資源的列表來改善決策過程。例如,可以將具有大于陰影時間的Wallclock(總耗時)估計的作業(yè)轉(zhuǎn)移到不被陰影時間保護的節(jié)點(因此,不限于回填時間約束)。此外,雖然前面提供了調(diào)度器的例子,但也可以采用許多其它的調(diào)度器而并不違反本發(fā)明的精神。其它調(diào)度器的例子包括,例如,由PlatformComputing提供的LoadSharingFacility(LSF)以及由MauiSupercomputingCenter提供的Maui。作為另一個實施例,多于一個的系統(tǒng)可以包含有管理器守護程序,一個可作為另一個的備份并且/或者多個管理器守護程序協(xié)同工作來管理網(wǎng)格計算環(huán)境中的工作負荷等。并且,該計算環(huán)境中的一個或多個系統(tǒng)可以不具有調(diào)度器,而是由其它系統(tǒng)中的調(diào)度器進行調(diào)度,等等。有利地,本發(fā)明的一個或多個方面使得能夠?qū)崿F(xiàn)網(wǎng)格計算環(huán)境工作負荷的平衡。這將提高效率和生產(chǎn)率。因為其動態(tài)和自動的特性,這種平衡對于用戶是透明的。通過從調(diào)度器獲取信息并保持調(diào)度器的調(diào)度責(zé)任,管理器守護程序的復(fù)雜性被降低到最小。因為管理器守護程序獲取的信息來自復(fù)雜的調(diào)度軟件程序,因此輸入至管理器守護程序的信息量得到了減少。并且調(diào)度器可以將已經(jīng)運行的算法的結(jié)果發(fā)送給管理器守護程序,這樣管理器守護程序就不需要進行復(fù)雜的分析(例如,陰影時間的計算等)。有利地,本發(fā)明的一個或多個方面使多個并行的機器能夠借助例如單個Globus的實現(xiàn)而組合資源,其中每個機器被獨立地管理。本發(fā)明可以包含于具有例如計算機可用媒介的制造物品中(例如,一個或者多個計算機程序產(chǎn)品)。該媒介在其中具有例如計算機可讀程序代碼手段或者邏輯(例如,指令、代碼、命令等),來提供或促進本發(fā)明的能力。這種制造物品可以被包括為一計算機系統(tǒng)中的一部分,或者單獨出售。另外,可以提供至少一個可被一機器讀取的程序存儲設(shè)備,該程序存儲設(shè)備包含了至少一個指令程序,該指令程序可被該機器執(zhí)行來實現(xiàn)本發(fā)明的能力。這里示出的流程圖只是一些例子。在這些流程圖或這里描述的步驟(或操作)中可以有很多變化,而并不違反本發(fā)明的精神。例如,這些步驟可以不同的順序執(zhí)行,也可以增加、刪除、更改某些步驟。所有這些變化都被認為是所聲明的本發(fā)明的一部分。雖然在這里詳細說明和描述了優(yōu)選實施例,但相關(guān)領(lǐng)域的技術(shù)人員明白的是,可以進行各種修改、增加、替換等,而并不違反本發(fā)明的精神,因此,這些修改等也被認為處于權(quán)利要求書中所定義的本發(fā)明的范圍之內(nèi)。權(quán)利要求1.一種平衡計算環(huán)境中的工作負荷的方法,所述方法包括獲取關(guān)于一網(wǎng)格計算環(huán)境的多個系統(tǒng)中的一個或多個系統(tǒng)的信息;應(yīng)用至少一部分所獲取的信息平衡所述多個系統(tǒng)中的至少兩個系統(tǒng)的工作負荷。2.權(quán)利要求1的方法,其中所述獲取包括,由所述網(wǎng)格計算環(huán)境中的管理器守護程序從與所述一個或多個系統(tǒng)相關(guān)聯(lián)的一個或多個調(diào)度器中獲取所述信息。3.權(quán)利要求2的方法,其中,從至少兩個調(diào)度器中獲取信息,并且其中,所述至少兩個調(diào)度器中的一個調(diào)度器是與所述至少兩個調(diào)度器中的至少一個其它調(diào)度器不同的調(diào)度器。4.權(quán)利要求1的方法,其中所述信息包括關(guān)于所述一個或多個系統(tǒng)的工作負荷的信息。5.權(quán)利要求4的方法,其中所述關(guān)于系統(tǒng)的信息包括以下至少之一所述系統(tǒng)中空閑節(jié)點的數(shù)量、零個或者多個等待作業(yè)的作業(yè)隊列以及一個或多個用于所述系統(tǒng)的作業(yè)混合的當前狀態(tài)的、特定于調(diào)度器的變量設(shè)置。6.權(quán)利要求1的方法,其中所述平衡包括確定將作業(yè)分配給所述至少兩個系統(tǒng)中哪一個系統(tǒng);以及將所述作業(yè)分配給所確定的系統(tǒng)。7.權(quán)利要求1的方法,其中所述平衡包括從所述至少兩個系統(tǒng)中的一個系統(tǒng)中清除作業(yè);以及將所述作業(yè)分配給所述至少兩個系統(tǒng)中的另一個系統(tǒng)。8.一種平衡計算環(huán)境中的工作負荷的系統(tǒng),所述系統(tǒng)包括用于獲取關(guān)于一網(wǎng)格計算環(huán)境的多個系統(tǒng)中的一個或多個系統(tǒng)的信息的裝置;用于使用至少一部分所述所獲取的信息來平衡所述多個系統(tǒng)中的至少兩個系統(tǒng)的工作負荷的裝置。9.權(quán)利要求8的系統(tǒng),其中所述用于獲取的裝置包括,用于由所述網(wǎng)格計算環(huán)境中的管理器守護程序從與所述一個或多個系統(tǒng)相關(guān)聯(lián)的一個或多個調(diào)度器中獲取所述信息的裝置。10.權(quán)利要求9的系統(tǒng),其中,從至少兩個調(diào)度器獲取信息,并且其中,所述至少兩個調(diào)度器中的一個調(diào)度器與所述至少兩個調(diào)度器中的至少一個其它調(diào)度器不同。11.權(quán)利要求8的系統(tǒng),其中所述信息包括關(guān)于所述一個或多個系統(tǒng)的工作負荷的信息。12.權(quán)利要求11的系統(tǒng),其中所述關(guān)于系統(tǒng)的信息包括以下至少之一所述系統(tǒng)的空閑節(jié)點的數(shù)量、零個或者多個等待作業(yè)的作業(yè)隊列以及一個或多個用于所述系統(tǒng)的作業(yè)混合的當前狀態(tài)的、特定于調(diào)度器的變量設(shè)置。13.權(quán)利要求8的系統(tǒng),其中所述用于平衡的裝置包括用于確定將作業(yè)分配給所述至少兩個系統(tǒng)中的哪一個系統(tǒng)的裝置;以及用于將所述作業(yè)分配給所確定的系統(tǒng)的裝置。14.權(quán)利要求8的系統(tǒng),其中所述用于平衡的裝置包括用于從所述至少兩個系統(tǒng)中的一個系統(tǒng)中清除作業(yè)的裝置;以及用于將所述作業(yè)分配給所述至少兩個系統(tǒng)中的另一個系統(tǒng)的裝置。15.一種制造物品,包括至少一個計算機可用介質(zhì),其具有用來平衡一計算環(huán)境中的工作負荷的計算機可讀的程序代碼邏輯,所述計算機可讀的程序代碼邏輯包括用于獲取關(guān)于一網(wǎng)格計算環(huán)境的多個系統(tǒng)中的一個或多個系統(tǒng)的信息的獲取邏輯;用于使用至少一部分所述所獲取的信息平衡所述多個系統(tǒng)中的至少兩個系統(tǒng)的工作負荷的平衡邏輯。16.權(quán)利要求15的制造物品,其中所述獲取邏輯包括,用于由所述網(wǎng)格計算環(huán)境中的管理器守護程序從與所述一個或多個系統(tǒng)相關(guān)聯(lián)的一個或多個調(diào)度器中獲取所述信息的邏輯。17.權(quán)利要求15的制造物品,其中所述信息包括所述一個或多個系統(tǒng)的工作負荷的信息。18.權(quán)利要求17的制造物品,其中所述關(guān)于系統(tǒng)的信息包含以下至少之一所述系統(tǒng)中的空閑節(jié)點的數(shù)量、零個或多個等待作業(yè)的作業(yè)隊列以及一個或多個用于所述系統(tǒng)的作業(yè)混合的當前狀態(tài)的、特定于調(diào)度器的變量設(shè)置。19.權(quán)利要求15的制造物品,其中所述平衡邏輯包括用于確定將作業(yè)分配給所述至少兩個系統(tǒng)中哪一個系統(tǒng)的確定邏輯;用于將所述作業(yè)分配給所確定的系統(tǒng)的分配邏輯。20.權(quán)利要求15的制造物品,其中所述平衡的邏輯包括用于從所述至少兩個系統(tǒng)的中一個系統(tǒng)中清除作業(yè)的清除邏輯;將所述作業(yè)分配給所述至少兩個系統(tǒng)中的另一個系統(tǒng)的分配邏輯。全文摘要本發(fā)明提供了一種用于平衡網(wǎng)格計算環(huán)境中的工作負荷的方法和系統(tǒng)。一管理器守護程序從網(wǎng)格計算環(huán)境的多個系統(tǒng)的多個調(diào)度器中獲取信息,并且應(yīng)用這些信息平衡該環(huán)境中的工作負荷。這些信息包括空閑資源、等待的作業(yè)以及可能的其它信息的指示。文檔編號G06F9/46GK1581806SQ20041004551公開日2005年2月16日申請日期2004年5月28日優(yōu)先權(quán)日2003年8月5日發(fā)明者J·F·斯科維拉申請人:國際商業(yè)機器公司