專利名稱:用于在服務器系統(tǒng)中路由業(yè)務的方法和系統(tǒng)的制作方法
技術領域:
本發(fā)明一般地涉及計算機服務器系統(tǒng),更具體地,涉及用于在服務器系統(tǒng)中路由業(yè)務的方法和系統(tǒng)。
背景技術:
在當今的環(huán)境中,計算機系統(tǒng)通常包括多個部件,諸如服務器、硬盤驅動器以及其它外圍設備。這些部件通常被存放于機架之上。對于大型的公司,可以有數(shù)百個存放機架并且這些機架占用很大的場地空間。而且,因為這些部件通常是獨立的部件,即,它們不是集成的,諸如軟盤驅動器、鍵盤和顯示器等資源不能被共享。
紐約Armonk的國際商業(yè)機器公司(International Business MachinesCorp.)已經開發(fā)了一種系統(tǒng),該系統(tǒng)將上述的計算機系統(tǒng)捆綁成一個緊湊的操作單元。這個系統(tǒng)被稱為IBM eServer BladeCenterTM。BladeCenter是一個7U的模塊機殼(chassis),其能夠容納多達14個獨立的服務器片(blade)。一個服務器片或片是一種計算機部件,其具有處理器、存儲器、硬盤存儲器和工業(yè)標準服務器的固件。每個片被“熱插入”到機殼的一個槽內。該機殼還容納有諸如電源模塊、交換模塊、管理模塊以及送風模塊等支持性資源。因此,該機殼允許各個片共享支持性資源基礎設施。
出于冗余的目的,在該機殼中安裝了兩個以太網交換模塊(ESM)。ESM為片服務器系統(tǒng)提供以太網交換能力。每個交換模塊的主要目的是提供服務器片、管理模塊以及外部網絡基礎設施之間的以太網互連。
ESM是較高層功能的ESM,例如,OSI第4層-路由層及更上層,它們有能力在連接著多個服務器片的不同以太網端口之間實現(xiàn)負載平衡。每個ESM執(zhí)行一種標準的負載平衡算法,該算法用于在多個服務器片之間路由業(yè)務,從而負載被均勻地分布在各片上。這種負載平衡算法基于工業(yè)標準虛擬路由器冗余協(xié)議。該標準沒有以ESM說明其實現(xiàn)。這種標準算法專用于該實現(xiàn),并可基于輪轉式(round robin)選擇、最短連接或響應時間。
盡管如此,當多個服務器片中的一個失效時還是會產生問題。因為該標準的負載平衡算法未考慮即將發(fā)生的片失效,所以業(yè)務被路由到將要失效的服務器片上直到該片真的失效了為止。在這種情況下,該片將立刻斷開所有存在的連接。用戶應用程序必須認識到該斷開并重新建立每個連接。對于訪問該服務器系統(tǒng)的單獨的用戶,這一連串的事件具有高度的破壞性,這是因為該用戶將經歷大約40秒的服務停歇。累積地來看,如果該失效的片在失效前在以全部能力運行,即,正在全負荷運行,則其破壞性的影響將被擴大幾倍。
在正常運行狀態(tài)下服務器片不會立刻失效。由于各種原因存在有服務衰退。在一種情況下,服務器片請求,即用戶,已經超出了該服務器片的處理能力。此處,虛擬路由技術抑制該請求從而限制新用戶的數(shù)目。因此,衰退中的服務器片能夠為其當前的用戶提供服務。盡管如此,如果服務器片經歷著諸如高溫或超出了額定電壓等的環(huán)境的衰退,則現(xiàn)有技術的服務器片沒有辦法在虛擬路由算法中將這些狀態(tài)考慮在內。
因此,存在著對用于在服務器系統(tǒng)中路由業(yè)務的系統(tǒng)和方法的需要,該系統(tǒng)和方法對于服務器的衰退環(huán)境問題是敏感的。該系統(tǒng)和方法應當允許依據每個服務器的運行健康狀態(tài)動態(tài)地調整負載平衡算法。本發(fā)明就是為了滿足這種需求。
發(fā)明內容
本發(fā)明公開了一種用于在服務器系統(tǒng)中路由業(yè)務的方法以及使用該方法的計算機系統(tǒng)。在第一個方面,該方法包括檢測多個服務器中的一個服務器的第一狀態(tài),并且響應所述的第一狀態(tài)調整到該服務器的業(yè)務。在第二方面,一種計算機系統(tǒng),包括多個服務器,其中多個服務器中的每個服務器都包括用于檢測服務器內的第一狀態(tài)的監(jiān)視機制;多個交換模塊,連接于所述的多個服務器;一個管理模塊,也連接于所述的多個服務器;以及一個業(yè)務控制機制連接于所述管理模塊,其中當在服務器中檢測到了所述的第一狀態(tài)時,所述業(yè)務控制機制使得多個交換模塊中的每個交換模塊調整到該服務器的業(yè)務。
圖1是表示了BladeCenter的前部的透視圖。
圖2是BladeCenter后部的透視圖。
圖3是表示了服務器片系統(tǒng)的管理子系統(tǒng)的示意圖。
圖4是根據本發(fā)明的優(yōu)選實施例的服務器片系統(tǒng)的示意性方框圖。
圖5是表示了根據本發(fā)明的優(yōu)選實施例,業(yè)務控制機制路由業(yè)務的方法的流程圖。
具體實施例方式
本發(fā)明一般地涉及服務器系統(tǒng),更具體地,涉及用于在服務器系統(tǒng)中路由業(yè)務的方法和系統(tǒng)。提供下面的說明以便使得本領域的普通技術人員可以做出并使用本發(fā)明,并且這是在專利申請和其要求的背景下提供的。雖然將以BladeCenter說明本發(fā)明的優(yōu)選實施例,但是對于本領域的技術人員來說,對此處說明的優(yōu)選實施例以及總體原則和特征的各種修改是顯而易見的。因此,本發(fā)明并不旨在限于給出的實施例,而是將涵蓋與此處說明的原則和特征相一致的最寬泛的范圍。
根據本發(fā)明的優(yōu)選實施例,連接于多個服務器的每個服務器的業(yè)務控制機制監(jiān)視每個服務器的任何的環(huán)境衰退跡象,例如,超出了額定的溫度或電壓。當業(yè)務控制機制檢測到了服務器中的衰退跡象時,它使到該服務器的其它業(yè)務停止。為了做到這一點,該業(yè)務控制機制指示每個ESM調整其負載平衡算法,這樣一來在衰退狀態(tài)存在時就不能建立到該服務器的新的連接。通過當服務器出現(xiàn)衰退跡象時限制到該服務器的新的業(yè)務,如果該服務器最終失效了,可能潛在地被斷開的連接的數(shù)目被大大地減少了。因此,對用戶群體的破壞性影響被最小化。而且,如果沒有新的連接被建立,則該服務器的健康狀態(tài)可能會改善,例如,電源消耗可能會更少并且由于更少的連接而使得環(huán)境條件有可能會改善。
為了說明本發(fā)明的特征,請參考下面的討論和附圖,其描述了一種計算機系統(tǒng),例如BladeCenter,該系統(tǒng)可以結合本發(fā)明使用。圖1是BladeCenter系統(tǒng)100的分解的透視圖。參考此圖,主機殼102容納該系統(tǒng)的所有部件。多達14個服務器片104(或其它片,諸如存儲片)被熱插入到機殼102前面的14個槽中。片104可以被“熱交換”而不影響該系統(tǒng)100中其它片104的運行。服務器片104a可以使用任何微處理器技術,只要其兼容于系統(tǒng)100的機械的和電的接口以及供電和冷卻要求。
中間平面電路板106被近似地安置在機殼102的中部,并且包括兩排連接器108、108’。14個槽中的每個槽包括一對中間平面連接器,例如,108a、108a’,它們一個位于另一個之上,并且每對中間平面連接器,例如,108a、108a’與每個服務器片104a的后部的邊上的一對連接器(未示出)相匹配。
圖2是BladeCenter系統(tǒng)100的后部的透視圖,其中相似的部件被以相似的標號標識。參考圖1和圖2,第二機殼202也容納各種用于冷卻、供電、管理以及交換的可以熱插拔的部件。第二機殼202滑動并被閂鎖入主機殼102的后部。如圖1和2所示,兩個可熱插拔的送風器204a,204b為片系統(tǒng)部件提供冷卻。四個可熱插拔的供電模塊206為服務器片和其它部件提供電源。管理模塊MM1和MM2(208a、208b)是可熱插拔的部件并且提供基本的管理功能,諸如控制,監(jiān)視、報警、重新啟動和診斷。管理模塊208還提供管理共享的資源所需的其它功能,諸如,復用鍵盤/視頻/鼠標(KVM)(未示出)以便為各個片服務器104提供本地控制臺以及配置系統(tǒng)100和交換模塊210。
管理模塊208與系統(tǒng)100的所有關鍵部件通信,這些關鍵部件包括交換模塊210、供電模塊206和送風模塊204以及片服務器104本身。管理模塊208檢測這些部件中的每一個的存在、缺失及其狀態(tài)。當安裝有兩個管理模塊時,第一模塊,例如,MM1(208a),承擔當前管理角色,而第二模塊MM2(208b)充當備用模塊。
第二機殼202還容納多至4個交換模塊SM1到SM4(210a-210d)。每個交換模塊包括幾個用于連接到外部網絡基礎設施的外部數(shù)據端口(未示出)。每個交換模塊210還連接于每個片104。交換模塊210的主要用途是提供服務器片(104a-104n)和外部網絡基礎設施之間的互連。另外還存在用于交換管理目的的到該管理模塊的局域網(LAN)連接。根據應用,該外部接口可以被配置成滿足各種帶寬和功能要求。
圖3是服務器片系統(tǒng)的管理子系統(tǒng)300的示意圖,其中類似的部件使用類似的標號。參考此圖,每個管理模塊(208a、208b)具有到每個交換模塊(210a-210d)的獨立的以太網鏈路302。這僅僅為控制和管理的目的提供了到每個交換模塊(210)的安全的高速通信路徑。此外,管理模塊(208a、208b)通過兩個眾所周知的串行I2C總線(304)和交換模塊(210a-210d)連接,該總線提供了管理模塊(208a、208b)和交換模塊(210a-210d)之間的“帶外”通信。管理模塊(208)使用I2C串行總線304在內部提供交換模塊(210)的控制,即,在每個交換模塊(210a-210d)內配置參數(shù)。管理模塊(208a,208b)還通過兩個用于管理模塊(208a、208b)和服務器片(104a-104n)之間的“帶外”通信的串行總線(308)連接于服務器片(104a-104n)。
圖4是根據本發(fā)明的優(yōu)選實施例的服務器系統(tǒng)400的示意性方框圖。出于清晰的目的,圖4給出了一個管理模塊402、三個片404a-404c、兩個ESM406a、406b。然而應當理解,下面說明的原理可以適用于多于一個管理模塊、多于三個片以及多于兩個ESM。
每個片404a-404c包括幾個將其連接于每個ESM406a、406b的內部端口405。因此,每個片404a-404c可以訪問ESM406a、406b中的每一個。ESM406a、406b執(zhí)行到每個服務器片404a-404c的以太網業(yè)務的負載平衡。在任意給定的時刻,每個服務器片404a-404c保持著多個以太網連接,每個連接代表著與一個用戶的一個會話。如果片服務器,例如404a由于某種原因失效了,則所有連接都被斷開并且必須重新建立/重新路由到其它服務器片404b、404c。這個過程大致要花費40秒,這將在受影響的用戶的服務中產生很大的破壞。
本發(fā)明解決這個問題。每個片404a-404c包括一個監(jiān)視機制412a-412c,其監(jiān)視片404a-404c中的環(huán)境狀態(tài),諸如,片溫度、電壓和存儲器錯誤。在本發(fā)明的優(yōu)選實施例中,監(jiān)視機制412a-412c基于不同的環(huán)境狀態(tài)設置閾值。該閾值代表可接受的運行環(huán)境。如果任何環(huán)境狀態(tài)超過(或低于)相關聯(lián)的閾值,監(jiān)視機制412a-412c檢測該狀態(tài)并向管理模塊402發(fā)送警告。這樣,通過監(jiān)視機制412a-412c,該系統(tǒng)400檢測潛在的片衰退跡象,并且可以在服務器片404a-404c達到災難性的失效之前能夠采取校正措施。
在本發(fā)明的優(yōu)選實施例中,業(yè)務控制機制416被連接于每個片404a-404c以及每個ESM406a、406b。在一個實施例中,該業(yè)務控制機制416位于管理模塊402內并且因此利用“帶外”串行總線410通過在每個片中的專用的服務處理器408a-408c與每個片404a-404c通信。在另一個實施例中,該業(yè)務控制機制416是獨立的模塊,其連接于服務處理器408a-408c并連接于ESM406a、406b。
優(yōu)選地,業(yè)務控制機制416與ESM通信以便監(jiān)視片404a-404c和交換模塊406a、406b之間的業(yè)務流。業(yè)務控制機制416還與每個服務處理器408a-408c通信以便確定每個服務器片404a-404c的環(huán)境的健康狀態(tài)。如果服務器片(例如,404a)顯示出了正在衰退的跡象,上述跡象是通過服務處理器408a在“帶外”串行總線410之上進行傳送的,該業(yè)務控制機制416通過連接418向每個ESM406a、406b發(fā)送消息,指示它們停止建立到正在衰退的服務器片404a的新的連接直到正在衰退的服務器片404a恢復為止。通過以這種方式限制到正在衰退的服務器片404a的新的連接,如果其衰退的環(huán)境狀態(tài)是基于負載的,則該正在衰退的服務器片404a被給予了恢復的機會。在正在衰退的服務器片404a失效了的情況下,對用戶的不利的影響被最小化了。
圖5是表示了根據本發(fā)明的優(yōu)選實施例業(yè)務控制機制416路由業(yè)務的過程的流程圖。當監(jiān)視機制,例如,512a檢測到服務器片404a中的正在衰退的環(huán)境狀態(tài)時,該過程500在步驟502處開始。該正在衰退的狀態(tài)可以是任何潛在的失效的指示,包括,但是不限于,高的溫度或電壓的測量值、過多的存儲器錯誤數(shù)目或是PCI/PCIX并行總線錯誤。所有這些狀態(tài)在由服務器片404a中的監(jiān)視機制412a檢測出之后被服務處理器408a記錄。監(jiān)視機制412a優(yōu)選地通過服務處理器408a和總線410向業(yè)務控制機制416發(fā)送警告。
在步驟504,業(yè)務控制機制416向每個ESM406a、406b發(fā)送消息指示它們調整到該已衰退服務器片404a的業(yè)務。在優(yōu)選實施例中,每個ESM406a、406b通過從負載平衡算法中移除,即,排除該已衰退的服務器片404a,調整負載分布。結果,不為該已衰退的片404a建立新的連接。在另一個實施例中,到已衰退的服務器片404a的新的連接的數(shù)目被減少而不是完全被消除。在任一情況下,到已衰退的片404a的已存在的連接不受影響。
接著,或同時,業(yè)務控制機制416在步驟506中設置用于監(jiān)視時間的定時器。該監(jiān)視時間是一個時間段,在其之后業(yè)務控制機制查找來自已衰退的服務器片404a中的監(jiān)視機制412a的更新。該監(jiān)視時間通常在幾分鐘的范圍內以便避免過度反應并且可以平滑掉已衰退的和未衰退的狀態(tài)之間的過渡。在監(jiān)視時間期間,由于減少了的業(yè)務,該衰退的服務器片404a的狀態(tài)可能是穩(wěn)定的。例如,該衰退的片的狀態(tài)可能是由業(yè)務高峰引起的,該業(yè)務高峰產生了功率的相應的高的消耗,引起了溫度峰值的產生。通過減少到衰退的片404a的業(yè)務,該狀態(tài)可能穩(wěn)定下來并返回到正常狀態(tài)。
在步驟508,業(yè)務控制機制416在監(jiān)視時間超時后檢查衰退的片404a的狀態(tài)。如果該衰退的片404a已經恢復,即,片404a正運行于閾值之內,在步驟512該業(yè)務控制機制416向每個ESM406a、406b發(fā)送消息以便重新調整到已恢復的服務器片404a的業(yè)務到其正常水平。在優(yōu)選實施例中,ESM406a、406b中的每一個都將恢復的服務器片404a包括回負載平衡算法從而建立新的連接。如果該已衰退的片404a未能恢復(在步驟510確定),即,片404a中的正在衰退的狀態(tài)持續(xù)存在或已經惡化,則業(yè)務控制機制416在步驟514復位定時器并且重復步驟508和510。
最后,如果狀況沒有改善,系統(tǒng)管理員將被報警并且該已衰退的服務器片404a將被關閉。然而,因為限制了新的連接,此時只有最少數(shù)目的連接被斷開。因此,服務器片404a關閉的不利的影響被最小化了。
雖然在BladeCenter的環(huán)境中說明了本發(fā)明的優(yōu)選實施例,負載平衡機制416的功能可以在任何計算機環(huán)境中實現(xiàn),在該計算機環(huán)境中服務器是被緊密地連接在一起的。因此,雖然已經依據給出的實施例說明了本發(fā)明,本領域的普通技術人員將容易理解可以有各實施例的變形,且這些變形在本發(fā)明的精神和范圍之內。因此,本領域的普通技術人員可以做出多種修改而不脫離所附的權利要求書的精神和范圍。
權利要求
1.一種用于在服務器系統(tǒng)中路由業(yè)務的方法,該服務器系統(tǒng)包括多個服務器,所述的方法包括如下的步驟a)檢測多個服務器中的一個服務器的第一狀態(tài);以及b)響應所述第一狀態(tài)調整到該服務器的業(yè)務。
2.如權利要求1所述的方法,其中所述的多個服務器連接于多個交換模塊。
3.如權利要求2所述的方法,其中所述調整步驟(b)進一步包括步驟(b1)向多個交換模塊中的每個模塊發(fā)送消息;以及(b2)響應所述的消息在多個交換模塊的每個模塊中從負載平衡算法中排除掉該服務器從而不會建立到該服務器的新的連接。
4.如權利要求3所述的方法,其中所述調整步驟(b)還包括(b3)保持到該服務器的已存在的連接。
5.如權利要求1所述的方法,還包括c)設置用于監(jiān)視時間的定時器。
6.如權利要求5所述的方法,其中所述的第一狀態(tài)是該服務器中由超出的溫度或電壓、過多的存儲器錯誤數(shù)目或PCI/PCIX并行總線錯誤中的一個產生的正在衰退的環(huán)境狀態(tài)。
7.如權利要求6所述的方法,還包括如下的步驟d)在所述的監(jiān)視時間超時后檢查該服務器中的所述的正在衰退的環(huán)境狀態(tài);以及e)如果該服務器恢復了,重新調整到該服務器的業(yè)務。
8.如權利要求7所述的方法,其中所述重新調整步驟(e)包括(e1)向多個交換模塊中的每個模塊發(fā)送另一個消息;以及(e2)響應所述的另一個消息在多個交換模塊中的每個模塊中將該服務器包括回負載平衡算法中,使得到該服務器的業(yè)務回到其正常水平。
9.如權利要求7所述的方法,還包括f)如果該服務器未能恢復,復位該定時器;以及g)重復步驟(d)-(f)。
10.如權利要求9所述的方法,還包括(h)向管理員發(fā)送報警。
11.如權利要求1所述的方法,其中所述的第一狀態(tài)是指示潛在的服務器失效的非臨界的環(huán)境狀態(tài)。
12.一種計算機可讀的介質,該介質包括用于在服務器系統(tǒng)中路由業(yè)務的程序指令,所述的服務器系統(tǒng)包括多個服務器,所述的指令用于a)檢測多個服務器中的一個服務器的第一狀態(tài);以及b)響應所述的第一狀態(tài)調整到該服務器的業(yè)務。
13.如權利要求12所述的計算機可讀的介質,其中所述的多個服務器連接于多個交換模塊。
14.如權利要求13所述的計算機可讀的介質,其中所述的調整指令(b)還包括用于如下方面的指令(b1)向多個交換模塊中的每個模塊發(fā)送消息;以及(b2)響應所述的消息在多個交換模塊的每個模塊中從負載平衡算法中排除掉該服務器,從而不會建立到該服務器的新的連接。
15.如權利要求14所述的計算機可讀的介質,其中所述調整指令(b)還包括(b3)保持到該服務器的已存在的連接。
16.如權利要求12所述的計算機可讀的介質,還包括c)設置用于監(jiān)視時間的定時器。
17.如權利要求16所述的計算機可讀的介質,其中所述的第一狀態(tài)是該服務器中由超出的溫度或電壓、過多的存儲器錯誤數(shù)目或PCI/PCIX并行總線錯誤中的一個產生的正在衰退的環(huán)境狀態(tài)。
18.如權利要求17所述的計算機可讀的介質,還包括用于如下方面的指令d)在所述的監(jiān)視時間超時后檢查該服務器中的所述的正在衰退的環(huán)境狀態(tài);以及e)如果該服務器恢復了,重新調整到該服務器的業(yè)務。
19.如權利要求18所述的計算機可讀的介質,其中所述重新調整指令(e)包括(e1)向多個交換模塊中的每個模塊發(fā)送另一個消息;以及(e2)響應所述的另一個消息在多個交換模塊中的每個模塊中將該服務器包括回負載平衡算法中,使得到該服務器的業(yè)務回到其正常水平。
20.如權利要求18所述的計算機可讀的介質,還包括f)如果該服務器未能恢復,復位該定時器;以及g)重復指令(d)-(f)。
21.如權利要求20所述的計算機可讀的介質,還包括(h)向管理員發(fā)送報警。
22.如權利要求12所述的計算機可讀的介質,其中所述的第一狀態(tài)是指示潛在的服務器失效的非臨界的環(huán)境狀態(tài)。
23.一種用于在服務器系統(tǒng)中路由業(yè)務的系統(tǒng),該服務器系統(tǒng)包括多個服務器,所述的系統(tǒng)包括多個服務器中的每個服務器內的用于檢測服務器中的第一狀態(tài)的監(jiān)視機制;與所述的多個服務器相連接的多個交換模塊;以及與所述的多個服務器中的每個服務器以及多個交換模塊中的每個交換模塊相連接的業(yè)務控制機制,其中該業(yè)務控制機制包括用于當在服務器內檢測到了所述的第一狀態(tài)時,使得多個交換模塊中的每個交換模塊調整到該服務器的業(yè)務的裝置。
24.如權利要求23所述的系統(tǒng),其中所述的業(yè)務控制機制包括用于向多個交換模塊中的每個交換模塊發(fā)送消息的裝置。
25.如權利要求24所述的系統(tǒng),其中所述交換模塊中的每個交換模塊執(zhí)行負載平衡算法,并且所述交換模塊中的每個交換模塊包括用于響應所述的消息將該服務器從所述的負載平衡算法中排除掉從而不會建立到該服務器的新的連接的裝置。
26.如權利要求25所述的系統(tǒng),其中所述交換模塊中的每個交換模塊還包括用于保持到該服務器的已存在的連接的裝置。
27.如權利要求23所述的系統(tǒng),其中業(yè)務控制機制還包括用于設置監(jiān)視時間的定時裝置。
28.如權利要求27所述的系統(tǒng),其中所述的第一狀態(tài)是在該服務器中由超出的溫度或電壓、過多的存儲器錯誤數(shù)目或PCI/PCIX并行總線錯誤中的一個產生的正在衰退的環(huán)境狀態(tài)。
29.如權利要求28所述的系統(tǒng),其中業(yè)務控制機制還包括用于在所述的監(jiān)視時間超時后檢查所述的正在衰退的環(huán)境狀態(tài)的裝置;以及用于如果該服務器恢復了,則使得每一交換模塊重新調整到該服務器的業(yè)務的裝置。
30.如權利要求29所述的系統(tǒng),其中業(yè)務控制機制還包括用于向多個交換模塊中的每個交換模塊發(fā)送另一個消息的裝置。
31.如權利要求30所述的系統(tǒng),其中每個交換模塊還包括用于響應所述的另一個消息將該服務器包括回負載平衡算法中使得到該服務器的業(yè)務回到其正常水平的裝置。
32.如權利要求29所述的系統(tǒng),其中所述的業(yè)務控制機制還包括用于如果該服務器未能恢復則復位所述定時器的裝置。
33.如權利要求32所述的系統(tǒng),還包括用于向管理員發(fā)送報警的裝置。
34.一種計算機系統(tǒng),包括多個服務器,其中所述的多個服務器中的每個服務器包括用于檢測服務器內的第一狀態(tài)的監(jiān)視機制;與所述的多個服務器相連接的多個交換模塊;與所述的多個服務器中的每個服務器以及所述的多個交換模塊中的每個交換模塊相連接的管理模塊;以及與所述的管理模塊相連接的業(yè)務控制機制,其中當在服務器內檢測到所述的第一狀態(tài)時,所述的業(yè)務控制機制使得所述的多個交換模塊中的每個交換模塊調整到該服務器的業(yè)務。
35.如權利要求34所述的系統(tǒng),其中業(yè)務控制機制包括用于向所述的多個交換模塊中的每個交換模塊發(fā)送消息的裝置。
36.如權利要求35所述的系統(tǒng),其中所述的交換模塊中的每個交換模塊執(zhí)行負載平衡算法,并且所述的交換模塊中的每個交換模塊還包括用于響應所述的消息從所述的負載平衡算法中排除掉該服務器從而不會建立到該服務器的新的連接的裝置。
37.如權利要求36所述的系統(tǒng),其中所述的交換模塊中的每個交換模塊還包括用于保持到該服務器的已存在的連接的裝置。
38.如權利要求34所述的系統(tǒng),其中所述業(yè)務控制機制還包括用于設置監(jiān)視時間的定時裝置。
39.如權利要求38所述的系統(tǒng),其中所述的第一狀態(tài)是在該服務器中由超出的溫度或電壓、過多的存儲器錯誤數(shù)目或PCI/PCIX并行總線錯誤中的一個產生的正在衰退的環(huán)境狀態(tài)。
40.如權利要求39所述的系統(tǒng),其中所述業(yè)務控制機制還包括用于在所述的監(jiān)視時間超時后檢查該服務器中的所述的正在衰退的環(huán)境狀態(tài)的裝置;以及用于如果該服務器恢復了,則使得每一交換模塊重新調整到該服務器的業(yè)務的裝置。
41.如權利要求40所述的系統(tǒng),其中所述業(yè)務控制機制還包括用于向多個交換模塊中的每個交換模塊發(fā)送另一個消息的裝置。
42.如權利要求41所述的系統(tǒng),其中每個交換模塊還包括用于響應所述的另一個消息將該服務器包括回負載平衡算法中使得到該服務器的業(yè)務回到其正常水平的裝置。
43.如權利要求40所述的系統(tǒng),其中所述業(yè)務控制機制還包括用于如果該服務器未能恢復則復位所述定時器的裝置。
44.如權利要求43所述的系統(tǒng),其中所述管理模塊包括用于向管理員發(fā)送報警的裝置。
全文摘要
本發(fā)明公開了一種用于在服務器系統(tǒng)中路由業(yè)務的方法以及一種使用該方法的計算機系統(tǒng)。在第一方面,該方法包括檢測多個服務器中的一個服務器的第一狀態(tài)并且響應所述的第一狀態(tài)調整到該服務器的業(yè)務。在第二方面,一種計算機系統(tǒng)包括多個服務器,其中所述的多個服務器中的每個服務器包括用于檢測服務器內的第一狀態(tài)的監(jiān)視機制;與所述的多個服務器相連接的多個交換模塊;管理模塊;以及與該管理模塊相連接的業(yè)務控制機制,其中當在服務器內檢測到了所述的第一狀態(tài)時,所述的業(yè)務控制機制使得所述的多個交換模塊中的每個交換模塊調整到該服務器的業(yè)務。
文檔編號G06F15/173GK1578254SQ20041003413
公開日2005年2月9日 申請日期2004年4月22日 優(yōu)先權日2003年6月30日
發(fā)明者E·S·蘇費恩, J·E·博蘭 申請人:國際商業(yè)機器公司