亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

數(shù)據(jù)處理系統(tǒng)以及用于監(jiān)視數(shù)據(jù)處理系統(tǒng)的方法

文檔序號:6517147閱讀:161來源:國知局
專利名稱:數(shù)據(jù)處理系統(tǒng)以及用于監(jiān)視數(shù)據(jù)處理系統(tǒng)的方法
技術(shù)領(lǐng)域
本發(fā)明總體上涉及數(shù)據(jù)處理領(lǐng)域,尤其涉及用于監(jiān)視能夠從數(shù)據(jù)處理系統(tǒng)的空閑資源池中被分配給數(shù)據(jù)處理系統(tǒng)的不同分區(qū)的資源的系統(tǒng)、方法和計算機程序產(chǎn)品。
背景技術(shù)
越來越多地,大型的對稱多處理器數(shù)據(jù)處理系統(tǒng)不再是被用作單個的大型數(shù)據(jù)處理系統(tǒng),而是被分區(qū),用作多個較小的系統(tǒng)。這些系統(tǒng)通常被稱為邏輯分區(qū)(LPAR,logical partitioned)數(shù)據(jù)處理系統(tǒng)。一個數(shù)據(jù)處理系統(tǒng)內(nèi)的邏輯分區(qū)功能允許單個操作系統(tǒng)的多個拷貝或者多個異類操作系統(tǒng)在單個數(shù)據(jù)處理系統(tǒng)平臺上同時運行。平臺資源的一個不重疊子集被分配給其中運行一個操作系統(tǒng)的一個分區(qū)。這些平臺資源可以包括一個或者多個不同架構(gòu)的處理器,各有自己的中斷管理區(qū)、系統(tǒng)存儲區(qū)以及輸入輸出(I/O)適配器總線插槽。分區(qū)的資源由平臺的固件提供給操作系統(tǒng)。
在一個平臺內(nèi)運行的每一個操作系統(tǒng)都受到保護不受其它操作系統(tǒng)的影響,從而一個邏輯分區(qū)中的軟件錯誤不會影響任意其它分區(qū)中的正確操作。通過分配平臺資源的要由每一個操作系統(tǒng)直接管理的不相交集合,并提供保證各操作系統(tǒng)不能控制沒有分配給該系統(tǒng)的資源的機制,提供這種保護。另外,防止在控制操作系統(tǒng)的分配資源時的軟件錯誤影響任意其它操作系統(tǒng)的資源。這樣,每一個操作系統(tǒng)直接控制平臺內(nèi)的可分配資源的一個獨立集合。
對于邏輯分區(qū)數(shù)據(jù)處理系統(tǒng)中的硬件資源,這些資源在各分區(qū)之間是被不相交地共享的。硬件資源例如可以包括輸入輸出(I/O)適配器、存儲器DIMM、非易失性隨機存取存儲器(NVRAM)以及硬盤驅(qū)動器。
在自主數(shù)據(jù)處理系統(tǒng)中,例如在動態(tài)邏輯分區(qū)(DLPAR)數(shù)據(jù)處理系統(tǒng)或者處理能力按需動態(tài)升級(DCUoD,Dynamic CapacityUpgrade on Demand)數(shù)據(jù)處理系統(tǒng)中,可分配資源經(jīng)常在空閑資源池和邏輯分區(qū)之間移動,以滿足分區(qū)的動態(tài)工作負荷的要求。自主計算的一個重要方面是服務(wù)器自我修復(fù)的能力。實現(xiàn)自我修復(fù)的一種技術(shù)是數(shù)據(jù)處理系統(tǒng)用來自可用資源池的類似資源,或者用按需升級處理能力的資源(capacity upgrade on demand resource),來替代預(yù)計要失效的資源。失效預(yù)測一般是通過分析與每一個資源相關(guān)聯(lián)的錯誤記錄實現(xiàn)的。
實現(xiàn)數(shù)據(jù)處理系統(tǒng)的這種自我修復(fù)功能的一個問題在于,當(dāng)資源在分區(qū)和空閑資源池之間移動時,也就是當(dāng)資源在資源被分配給某個分區(qū)的狀態(tài)和資源沒有被分配給某個分區(qū)但是在需要時可用于分配的狀態(tài)之間移動時,系統(tǒng)不能監(jiān)視對某個資源記錄的有關(guān)錯誤。尤其是,當(dāng)一個資源從第一分區(qū)移動到空閑資源池,然后再被分配給第二分區(qū)時,在第一分區(qū)中時可能對該資源記錄到的錯誤會丟失。如果與資源的故障預(yù)測有關(guān)的錯誤在該資源被分配給第一分區(qū)時被記錄在該分區(qū)中,則當(dāng)該資源被分配給第二分區(qū)時可能會意想不到地出現(xiàn)故障,這是因為對于第二分區(qū)中的預(yù)測故障分析(Predictive Failure Analysis(PFA)),無法考慮當(dāng)被分配給第一分區(qū)時針對該資源記錄的錯誤。
因此,希望能夠精確地監(jiān)視能夠從數(shù)據(jù)處理系統(tǒng)的空閑資源池被分配給數(shù)據(jù)處理系統(tǒng)的不同分區(qū)的資源。

發(fā)明內(nèi)容
本發(fā)明提供了一種系統(tǒng)、方法和計算機程序產(chǎn)品,用于監(jiān)視能夠從數(shù)據(jù)處理系統(tǒng)的空閑資源池被分配給數(shù)據(jù)處理系統(tǒng)的不同分區(qū)的資源。一個空閑資源事件記錄與空閑資源池相關(guān)聯(lián),用于維護空閑資源池中的每一個資源的事件的記錄。當(dāng)一個資源從空閑資源池被分配給一個分區(qū)時,所分配資源的事件的記錄就從空閑資源事件記錄轉(zhuǎn)移到與該分區(qū)相關(guān)聯(lián)的事件記錄。
本發(fā)明允許針對預(yù)測故障分析以及其它目的,精確地監(jiān)視能夠從數(shù)據(jù)處理系統(tǒng)的空閑資源池被分配給數(shù)據(jù)處理系統(tǒng)的不同分區(qū)的資源。


在所附的權(quán)利要求中給出了被認(rèn)為是本發(fā)明的特點的新穎特征。但是,本發(fā)明本身以及其使用的最優(yōu)模式,以及其它的目的和優(yōu)點,要在結(jié)合附圖閱讀對說明性實施例的詳細說明之后才能得到最好的理解。附圖中圖1是可以實現(xiàn)本發(fā)明的數(shù)據(jù)處理系統(tǒng)的框圖;圖2是可以實現(xiàn)本發(fā)明的舉例的邏輯分區(qū)平臺的框圖;圖3A、3B和3C的示意圖簡要地圖示了一種已知的用于監(jiān)視能夠從數(shù)據(jù)處理系統(tǒng)的空閑資源池被分配給數(shù)據(jù)處理系統(tǒng)的不同分區(qū)的資源的方法,用于幫助解釋本發(fā)明;圖4A、4B和4C的示意圖簡要地圖示了本發(fā)明的優(yōu)選實施例的一種用于監(jiān)視能夠從數(shù)據(jù)處理系統(tǒng)的空閑資源池被分配給數(shù)據(jù)處理系統(tǒng)的不同分區(qū)的資源的方法;圖5的流程示了本發(fā)明的優(yōu)選實施例的一種用于監(jiān)視從數(shù)據(jù)處理系統(tǒng)的一個分區(qū)轉(zhuǎn)移到空閑資源池的資源的方法;圖6的流程示了本發(fā)明的優(yōu)選實施例的一種用于監(jiān)視從數(shù)據(jù)處理系統(tǒng)的空閑資源池被分配到一個分區(qū)的資源的方法。
具體實施例方式
現(xiàn)在看附圖,圖1圖示了可以實現(xiàn)本發(fā)明的數(shù)據(jù)處理系統(tǒng)的框圖。數(shù)據(jù)處理系統(tǒng)100可以是包括連接到系統(tǒng)總線106的多個處理器101、102、103和104的對稱多處理器(SMP)系統(tǒng)。連接到系統(tǒng)總線106的還有存儲器控制器/高速緩存108,其提供到多個本地存儲器160-163的接口。I/O總線橋110連接到系統(tǒng)總線106,提供到I/O總線112的接口。存儲器控制器/高速緩存108和I/O總線橋110可以如圖所示集成在一起。
數(shù)據(jù)處理系統(tǒng)100是一個邏輯分區(qū)(logical partitioned(LPAR))數(shù)據(jù)處理系統(tǒng)。因此,數(shù)據(jù)處理系統(tǒng)100可以具有多個同時運行的異類操作系統(tǒng)(或者單個操作系統(tǒng)的多個實例)。這些操作系統(tǒng)都可具有在其中執(zhí)行的任意數(shù)量的軟件程序。數(shù)據(jù)處理系統(tǒng)100被邏輯分區(qū),使得不同的PCI I/O適配器120-121、128-129以及136、圖形適配器148和硬盤適配器149可以被分配給不同的邏輯分區(qū)。在此例中,圖形適配器148為顯示設(shè)備(未圖示)提供連接,而硬盤適配器149提供控制硬盤150的連接。
這樣,例如,假設(shè)數(shù)據(jù)處理系統(tǒng)100被分為三個邏輯分區(qū)P1、P2和P3。每一個PCI I/O適配器120-121、128-129、36、圖形適配器148、硬盤適配器149,每一個主處理器101-104,以及來自本地存儲器160-163的存儲器,被分配給這三個分區(qū)中的每一個。在這些例子中,存儲器160-163可以是雙列直插存儲器模塊(DIMM)。DIMM一般不是按每個DIMM被分配給各分區(qū)。相反,一個分區(qū)可以獲得平臺所見的總存儲空間的一部分。例如,處理器101、來自本地存儲器160-163的存儲空間的某些部分以及I/O適配器120、128和129可以被分配給邏輯分區(qū)P1;處理器102-103、來自本地存儲器160-163的存儲空間的某些部分以及PCI I/O適配器121和136可以被分配給邏輯分區(qū)P2;處理器104、來自本地存儲器160-163的存儲空間的某些部分、圖形適配器148以及硬盤適配器149可以被分配給邏輯分區(qū)P3。
在數(shù)據(jù)處理系統(tǒng)100內(nèi)執(zhí)行的每一個操作系統(tǒng)被分配給不同的邏輯分區(qū)。這樣,在數(shù)據(jù)處理系統(tǒng)100內(nèi)執(zhí)行的每一個操作系統(tǒng)只可以訪問在其邏輯分區(qū)內(nèi)的I/O單元。這樣,例如,高級交互執(zhí)行(AIX)操作系統(tǒng)的一個實例可以在分區(qū)P1內(nèi)執(zhí)行,AIX操作系統(tǒng)的第二實例(鏡像)可以在分區(qū)P2內(nèi)執(zhí)行,LINUX或者OS/400操作系統(tǒng)可以在邏輯分區(qū)P3內(nèi)工作。
連接到I/O總線112的外設(shè)部件互連(PCI)主橋(host bridge)114提供到PCI本地總線115的接口。多個PCI輸入輸出適配器120-121可以通過PCI到PCI橋116、PCI總線118、PCI總線119、I/O插槽170以及I/O插槽171連接到PCI總線115。PCI到PCI橋116提供到PCI總線118和PCI總線119的接口。PCI I/O適配器120和121分別被置入I/O插槽170和171內(nèi)。典型的PCI總線實現(xiàn)能夠支持4到8個I/O適配器(也就是用于內(nèi)裝連接器的擴展槽)。每一個PCI I/O適配器120-121提供數(shù)據(jù)處理系統(tǒng)100和輸入輸出設(shè)備之間的接口,輸入輸出設(shè)備例如是作為數(shù)據(jù)處理系統(tǒng)100的客戶機的其它網(wǎng)絡(luò)計算機。
另外一個PCI主橋122提供用于另外的PCI總線123的接口。PCI總線123連接到多個PCI I/O適配器128-129。PCI I/O適配器128-129可以通過PCI到PCI橋124,PCI總線126、PCI總線127、I/O插槽172和I/O插槽173連接到PCI總線123。PCI到PCI橋124提供到PCI總線126和PCI總線127的接口。PCI I/O適配器128和128分別被置入I/O插槽172和173內(nèi)。這樣,另外的I/O設(shè)備,比如調(diào)制解調(diào)器或者網(wǎng)絡(luò)適配器可以通過每一個PCI I/O適配器128-129得到支持。這樣,數(shù)據(jù)處理系統(tǒng)100允許連接到多個網(wǎng)絡(luò)計算機。
插入到I/O插槽174的存儲器映射圖形適配器148可以通過PCI總線144、PCI到PCI橋142、PCI總線141和PCI主橋140連接到I/O總線112。硬盤適配器149可以被置入連接到PCI總線145的I/O插槽175。該總線又連接到PCI到PCI橋142,后者通過PCI總線141連接到PCI主橋140。
PCI主橋130為PCI總線131提供連接到I/O總線112的接口。PCI I/O適配器136連接到I/O插槽176,后者通過PCI總線133連接到PCI到PCI橋132。PCI到PCI橋132連接到PCI總線131。該PCI總線也將PCI主橋130連接到服務(wù)處理器郵箱接口和ISA總線訪問傳遞邏輯(ISA bus access pass-through logic)194以及PCI到PCI橋132。服務(wù)處理器郵箱接口和ISA總線訪問傳遞邏輯194轉(zhuǎn)發(fā)以PCI/ISA橋193為目的地的PCI訪問。NVRAM存儲器192被連接到ISA總線196。服務(wù)處理器135通過其本地PCI總線195被耦接到服務(wù)處理器郵箱接口和ISA總線訪問傳遞邏輯194。服務(wù)處理器135還通過多個JTAG/I2C總線134連接到處理器101-104。JTAG/I2C總線134是JTAG/掃描總線(見IEEE 1149.1)以及飛利浦I2C總線的組合。但是,作為替代方案,JTAG/I2C總線134也可以替換為飛利浦I2C總線或者JTAG/掃描總線。主處理器101、102、103和104的所有SP-ATTN信號被一起連接到服務(wù)處理器的中斷輸入信號。服務(wù)處理器135具有自己的本地存儲器191,具有對硬件OP面板190的訪問權(quán)。
當(dāng)數(shù)據(jù)處理系統(tǒng)100最初加電時,服務(wù)處理器135使用JTAG/I2C總線134詢問系統(tǒng)(主機)處理器101-104、存儲器控制器/高速緩存108以及I/O橋110。在完成該步驟后,服務(wù)處理器135對數(shù)據(jù)處理系統(tǒng)100具有一個設(shè)備目錄和拓撲結(jié)構(gòu)方面的了解。服務(wù)處理器135還對通過詢問主處理器101-104、存儲器控制器/高速緩存108和I/O橋110找到的所有部件執(zhí)行內(nèi)部自檢(Built-In-Self-Tests(BIST))、基本保證檢驗(Basic Assurance Tests(BATs))和存儲器測試。在BIST、BAT和存儲器測試期間檢測到的故障的任意錯誤信息由服務(wù)處理器135進行收集和報告。
如果在將BIST、BAT和存儲器測試期間找到的有故障的原件剔除之后還能夠形成系統(tǒng)資源的有意義/有效配置,則允許數(shù)據(jù)處理系統(tǒng)100繼續(xù)向本地(主機)存儲器160-163裝入可執(zhí)行代碼。服務(wù)處理器135然后釋放主處理器101-104以執(zhí)行裝入本地存儲器160-163的代碼。當(dāng)主處理器101-104執(zhí)行來自數(shù)據(jù)處理系統(tǒng)100內(nèi)的各操作系統(tǒng)的代碼時,服務(wù)處理器135進入監(jiān)視和報告錯誤的模式。由服務(wù)處理器135監(jiān)視的項目類型包括,例如,冷卻風(fēng)扇的速度和工作情況,熱傳感器,電源調(diào)節(jié)器,處理器101-104,本地存儲器160-163以及I/O橋110報告的可恢復(fù)的和不可恢復(fù)的錯誤。
服務(wù)處理器135負責(zé)保存和報告與數(shù)據(jù)處理系統(tǒng)100中所有被監(jiān)視項目有關(guān)的錯誤信息。服務(wù)處理器135還根據(jù)錯誤的類型和所定義的閾值采取行動。例如,服務(wù)處理器135可以注意處理器的高速緩存上的過多的可恢復(fù)錯誤,從而判斷這預(yù)示著硬錯誤。根據(jù)該判斷,服務(wù)處理器135可以將該資源標(biāo)記為在當(dāng)前的運行期間和未來的初始程序裝入(IPL)過程中退出配置。IPL有時也稱為“引導(dǎo)”或者“自引導(dǎo)”。
本領(lǐng)域的普通技術(shù)人員知道,圖1所示的硬件是可以變化的。例如,除了圖示的硬件之外或者取代圖1所示的硬件,還可以使用其它外圍設(shè)備,比如光盤驅(qū)動器等。圖示的例子不是要對本發(fā)明進行結(jié)構(gòu)上的限制。
見圖2,其中圖示了可以實現(xiàn)本發(fā)明的舉例的邏輯分區(qū)平臺的框圖。邏輯分區(qū)平臺200中的硬件可以被實現(xiàn)為,例如,圖1中的數(shù)據(jù)處理系統(tǒng)100。邏輯分區(qū)平臺200包括分區(qū)的硬件230、操作系統(tǒng)202、204、206、208以及分區(qū)管理固件210。操作系統(tǒng)202、204、206和208可以是單個操作系統(tǒng)的多個拷貝,或者是同時在邏輯分區(qū)平臺200上運行的多個異類操作系統(tǒng)。利用可從國際商用機器公司(International Business Machine Corporation of Armonk,NewYork)購得的OS/400操作系統(tǒng)可實現(xiàn)這些操作系統(tǒng),OS/400操作系統(tǒng)被設(shè)計為與分區(qū)管理固件比如Hypervisor(管理程序)相互作用。OS/400只是用作這些說明性實施例中的一個例子。當(dāng)然,取決于具體的實現(xiàn),其它類型的操作系統(tǒng)也可以使用,比如AIX和LINUX。操作系統(tǒng)202、204、206和208位于分區(qū)203、205、207和209中。Hypervisor(管理程序)軟件是可以用來實現(xiàn)分區(qū)管理固件210的軟件的一個例子,可以從國際商用機器公司獲得。固件是存儲在不需電能也能保持其內(nèi)容的存儲器芯片上的“軟件”。所述存儲器芯片比如是只讀存儲器(ROM)、可編程ROM(PROM)、可擦可編程ROM(EPROM)、電可擦可編程ROM(EEPROM)以及非易失性隨機存取存儲器(非易失性RAM)。
另外,這些分區(qū)還包括分區(qū)固件211、213、215和217。分區(qū)固件211、213、215和217可以用初始引導(dǎo)代碼、IEEE-1275標(biāo)準(zhǔn)開放固件(IEEE-1275Standard Open Firmware)以及可從國際商用機器公司獲得的運行時摘要軟件(runtime abstraction software(RTAS))來實現(xiàn)。當(dāng)分區(qū)203、205、207和209被實例化時,引導(dǎo)程序代碼的一個拷貝由平臺固件210裝入分區(qū)203、205、207和209。之后,控制轉(zhuǎn)移到引導(dǎo)程序代碼,引導(dǎo)程序代碼然后裝入開放固件和RTAS。與分區(qū)相關(guān)或者被分配給分區(qū)的處理器然后被分派給分區(qū)的存儲器以執(zhí)行分區(qū)固件。
被分區(qū)的硬件230包括多個處理器232-238、多個系統(tǒng)存儲器單元240-246、多個輸入輸出(I/O)適配器248-262以及存儲單元270。每一個處理器232-238、存儲器單元240-246、NVRAM存儲器298和I/O適配器248-262可以被分配給邏輯分區(qū)平臺200中的多個分區(qū)之一,每一個分區(qū)對應(yīng)于操作系統(tǒng)202、204、206和208之一。
分區(qū)管理固件210對分區(qū)203、205、207和209執(zhí)行許多功能和服務(wù),以創(chuàng)立和實施邏輯分區(qū)平臺200的分區(qū)。分區(qū)管理固件210是用固件實現(xiàn)的與底層硬件相同的虛擬機。這樣,通過將邏輯分區(qū)平臺200的所有硬件資源虛擬化,分區(qū)管理固件210允許同時執(zhí)行獨立的OS鏡像202、204、206和208。
服務(wù)處理器290可以用來提供各種服務(wù),比如處理分區(qū)中的平臺錯誤。這些服務(wù)也可以作為將錯誤報告給供貨商比如國際商用機器公司的服務(wù)代理。不同分區(qū)的操作可以通過硬件管理控制臺比如硬件管理控制臺280加以控制。硬件管理控制臺280是一個單獨的數(shù)據(jù)處理系統(tǒng),系統(tǒng)管理員可以從該數(shù)據(jù)處理系統(tǒng)執(zhí)行各種功能,包括向不同分區(qū)重新分派資源。
圖3A、3B和3C的示意圖簡要地圖示了一種已知的用于監(jiān)視能夠從數(shù)據(jù)處理系統(tǒng)的空閑資源池被分配給數(shù)據(jù)處理系統(tǒng)的不同分區(qū)的資源的方法,用于幫助解釋本發(fā)明。圖3A圖解了具有包括分區(qū)302和304的多個邏輯分區(qū)以及空閑資源池306的數(shù)據(jù)處理系統(tǒng)300的第1種狀態(tài)。操作系統(tǒng)312在分區(qū)302中運行,操作系統(tǒng)314在分區(qū)304中運行。
三個資源320、322和324被分配給分區(qū)302,三個資源330、332和334被分配給分區(qū)304,三個資源340、342和344目前未被分配給任何分區(qū),并被保持在空閑資源池306中。空閑資源池306中的資源340、342和344可用于在需要時分配給數(shù)據(jù)處理系統(tǒng)300中的多個分區(qū)中的任何分區(qū),包括分區(qū)302和304。資源320-324、330-334和340--344例如可以是I/O適配器或者通過I/O適配器連接到系統(tǒng)300的設(shè)備。
事件記錄352與分區(qū)302相關(guān)聯(lián),事件記錄354與分區(qū)304相關(guān)聯(lián)。事件記錄352和354分別保持與分配給分區(qū)302和304的每一個資源相關(guān)聯(lián)的事件的記錄。所述事件可以是資源所遇到的某些出錯情況的結(jié)果,或者與資源相關(guān)聯(lián)的消息的信息類型。事件記錄中的事件一般被用于根據(jù)對資源的事件歷史的分析對資源的故障進行預(yù)測。
如圖3A所示,與分區(qū)302相關(guān)聯(lián)的事件記錄352包括被分配給分區(qū)302的每一個資源320、322和324的事件記錄。與分區(qū)304相關(guān)聯(lián)的事件記錄354包括被分配給分區(qū)304的每一個資源330、332和334的事件記錄。
圖3B圖解了數(shù)據(jù)處理系統(tǒng)300的第2種狀態(tài)。在第2種狀態(tài)中,例如由于已滿足分區(qū)304對資源332的臨時需要的結(jié)果,資源332已經(jīng)從分區(qū)304被移動到空閑資源池306。如圖3B所示,在資源332移動到空閑資源池306之后,與分區(qū)304相關(guān)聯(lián)的事件記錄354中資源332的事件仍然留在事件記錄354中。
圖3C圖解了數(shù)據(jù)處理系統(tǒng)300的第3種狀態(tài)。在第3種狀態(tài)中,例如由于需要滿足分區(qū)302的增加的I/O要求,資源332已經(jīng)從空閑資源池306被分配給分區(qū)302。注意,當(dāng)資源332被分配給304時所發(fā)生的資源332的事件仍然留在與分區(qū)304相關(guān)聯(lián)的事件記錄354中。
圖4A、4B和4C的示意圖簡要地圖示了根據(jù)本發(fā)明的一個優(yōu)選實施例的一種用于監(jiān)視能夠從數(shù)據(jù)處理系統(tǒng)的空閑資源池被分配給數(shù)據(jù)處理系統(tǒng)的不同分區(qū)的資源的方法。圖4A圖解了具有包括分區(qū)402和404的多個邏輯分區(qū)以及空閑資源池406的數(shù)據(jù)處理系統(tǒng)400的第1種狀態(tài)。操作系統(tǒng)412在分區(qū)402中運行,操作系統(tǒng)414在分區(qū)404中運行。
三個資源420、422和424被分配給分區(qū)402,三個資源430、432和434被分配給分區(qū)404,三個資源440、442和444當(dāng)前沒有被分配給任何分區(qū),被保留在空閑資源池406中。空閑資源池中的資源440、442和444可用于在需要時分配給數(shù)據(jù)處理系統(tǒng)400中的多個分區(qū)中的任何分區(qū),包括分區(qū)402和404。
圖4A-4C所示的數(shù)據(jù)處理系統(tǒng)400與圖3A-3C所示的數(shù)據(jù)處理系統(tǒng)300的不同之處在于數(shù)據(jù)處理系統(tǒng)400包括與空閑資源池406相關(guān)聯(lián)的空閑資源事件記錄(FREL)456。FREL 456包括空閑資源池406中的資源的事件記錄。具體地,在FREL 456中記錄的事件是當(dāng)資源被分配給數(shù)據(jù)處理系統(tǒng)400中的某個分區(qū)比如分區(qū)402和404之一時,對資源440、442和444發(fā)生的事件的結(jié)果。
在圖4A所圖示的數(shù)據(jù)處理系統(tǒng)400的第1種狀態(tài)下,F(xiàn)REL 456包括空閑資源池406中的資源440、442和444的事件記錄。
圖4B圖解了數(shù)據(jù)處理系統(tǒng)400的第2種狀態(tài)。在第2種狀態(tài)中,由于已滿足分區(qū)404中對資源432的臨時需要,資源432已經(jīng)從分區(qū)404移動到空閑資源池406。如圖4B所示,與分區(qū)404相關(guān)聯(lián)的事件記錄454中關(guān)于資源432的事件記錄已經(jīng)隨同資源432向空閑資源池406的移動一起從事件記錄454移動到FREL 456。這樣,在第2種狀態(tài)中,除了留在FREL 456中的資源440、442和444的資源的事件記錄之外,F(xiàn)REL 456還包括資源432的事件記錄。
圖4C圖解了數(shù)據(jù)處理系統(tǒng)的第3種狀態(tài)。在第3種狀態(tài)中,資源432已經(jīng)從空閑資源池406被分配給分區(qū)402。如圖4C所示,F(xiàn)REL456中與資源432相關(guān)聯(lián)的事件也已隨同資源432從空閑資源池406向分區(qū)402的移動從FREL 456移動到與分區(qū)402相關(guān)聯(lián)的事件記錄452。
在圖3A-3C所圖示的系統(tǒng)300中,當(dāng)資源332被分配給分區(qū)304或者數(shù)據(jù)處理系統(tǒng)300的任何其它分區(qū)時,分區(qū)302中的操作系統(tǒng)312看不到資源332的事件歷史。這種信息的缺乏會妨礙應(yīng)用程序?qū)Y源332作出準(zhǔn)確的故障預(yù)測,從而可能會發(fā)生資源332在被分配給分區(qū)302時發(fā)生故障而不報警的情況。
另一方面,在圖4A-4C所圖示的系統(tǒng)400中,操作系統(tǒng)412看得見資源432的完整事件歷史,因而能夠根據(jù)資源432先前被分配給數(shù)據(jù)處理系統(tǒng)400的另一個分區(qū)時的在先事件歷史,并根據(jù)在資源432當(dāng)前被分配給分區(qū)402期間可能發(fā)生的任何新事件,更準(zhǔn)確地預(yù)測資源432的故障。
圖5的流程解了根據(jù)本發(fā)明的一個優(yōu)選實施例,監(jiān)視從數(shù)據(jù)處理系統(tǒng)的一個分區(qū)轉(zhuǎn)移到空閑資源池的資源的方法。該方法總體上用附圖標(biāo)記500表示,一開始是判斷資源是否應(yīng)當(dāng)從分區(qū)移動到空閑資源池(步驟502)。如果不是,則該方法返回。如果是,則判斷在與分區(qū)相關(guān)聯(lián)的事件記錄中是否有該資源的事件(步驟504)。如果沒有,則將該資源轉(zhuǎn)移到空閑資源池,方法結(jié)束。如果有,則將該分區(qū)的事件記錄中與該資源相關(guān)聯(lián)的事件拷貝到空閑資源池中的FREL(步驟506),方法結(jié)束。所述事件也可以從該分區(qū)的事件記錄中被刪除(步驟506),或者,該分區(qū)的事件記錄可以保留所移動的資源的事件記錄。在后一種可選的情況下,如果以后該資源又從空閑資源池被重新分配給該分區(qū),那么不轉(zhuǎn)移FREL中該資源的作為記錄在該分區(qū)的事件記錄中的錯誤的副本的任何事件。在該可選的實施例中,F(xiàn)REL還保持對資源發(fā)生了事件的特定分區(qū)的記錄,以及該資源的事件的數(shù)量。
圖6的流程解了根據(jù)本發(fā)明的一個優(yōu)選實施例,監(jiān)視從數(shù)據(jù)處理系統(tǒng)的空閑資源池被分配給分區(qū)的資源的方法。該方法總體上用附圖標(biāo)記600表示,一開始是判斷資源是否要從空閑資源池移動到分區(qū)(步驟602)。若否,則方法返回。若是,則判斷與空閑資源池相關(guān)聯(lián)的FREL是否有對該資源記錄的事件(步驟604)。若無,則將該資源分配給該分區(qū),方法結(jié)束。若是,則將FREL中該資源的事件拷貝到該分區(qū)的事件記錄,并刪除FREL中該資源的事件記錄(步驟606),該方法結(jié)束。
使用本發(fā)明,在從空閑資源池向分區(qū)分配資源的數(shù)據(jù)處理系統(tǒng)中,與一個分區(qū)相關(guān)聯(lián)的操作系統(tǒng)能夠看見與當(dāng)前分配給該分區(qū)的資源相關(guān)聯(lián)的所有事件。因此,能夠根據(jù)對該資源記錄的事件的全系統(tǒng)的總覽,更準(zhǔn)確地判斷特定資源何時應(yīng)當(dāng)被更換。這減少了把資源分配給分區(qū)時資源故障的出現(xiàn)。
另外,使用本發(fā)明,應(yīng)用程序能夠更好地判斷相同的資源當(dāng)中哪些資源應(yīng)當(dāng)被分配給需要另外的資源以針對關(guān)鍵應(yīng)用提供服務(wù)的分區(qū)。例如,如果某個資源的預(yù)測故障閾值為某一類型的10個錯誤,并且FREL中該資源的記錄表明對該資源已經(jīng)發(fā)生了八次錯誤,則應(yīng)用程序可以決定使用記錄的錯誤更少或者沒有錯誤記錄的另一個相同資源,以降低出現(xiàn)故障或者必需進行延期維護的風(fēng)險。
總之,本發(fā)明提供了一種監(jiān)視能夠從數(shù)據(jù)處理系統(tǒng)的空閑資源池被分配給數(shù)據(jù)處理系統(tǒng)的不同分區(qū)的資源的方法、設(shè)備和系統(tǒng)。本發(fā)明允許在數(shù)據(jù)處理系統(tǒng)工作期間從空閑資源池向不同分區(qū)分配資源時,精確地監(jiān)視與資源相關(guān)的錯誤或者其它事件。
重要的是要注意到,盡管對本發(fā)明的描述是在全功能數(shù)據(jù)處理系統(tǒng)的上下文中進行的,本領(lǐng)域的普通技術(shù)人員知道,本發(fā)明的處理過程能夠以指令的計算機可讀介質(zhì)的形式以及多種形式分布,無論實際用于進行所述分布的信號承載介質(zhì)的具體類型如何,本發(fā)明都同樣適用。計算機可讀介質(zhì)的例子包括可記錄類型的介質(zhì),比如軟盤、硬盤驅(qū)動器、RAM、CD-ROM、DVD-ROM,以及傳輸類型的介質(zhì),比如數(shù)字和模擬通信鏈路,使用諸如射頻和光波傳輸?shù)葌鬏斝问降挠芯€或者無線通信鏈路。計算機可讀介質(zhì)可以采用編碼格式的形式,所述編碼格式被解碼以實際用于具體的數(shù)據(jù)處理系統(tǒng)。
上面對本發(fā)明的說明是為了解釋和說明的目的,不是要窮盡本發(fā)明或者將本發(fā)明限于所公開的形式。對于本領(lǐng)域普通技術(shù)人員,許多修改和變化都是顯而易見的。上述實施例的選擇和描述是為了更好地解釋本發(fā)明的原理和其實際應(yīng)用,并使本領(lǐng)域的普通技術(shù)人員能夠理解本發(fā)明的針對所能想到的具體用途進行了各種適當(dāng)?shù)男薷牡母鞣N實施例。
權(quán)利要求
1.一種數(shù)據(jù)處理系統(tǒng),包括多個分區(qū);空閑資源池;至少一個能夠從所述空閑資源池被分配給所述多個分區(qū)中的任何分區(qū)的資源;以及與所述空閑資源池相關(guān)聯(lián)的空閑資源事件記錄,用于保存所述空閑資源池中的所述至少一個資源中的每個資源的事件記錄。
2.如權(quán)利要求1所述的數(shù)據(jù)處理系統(tǒng),其中,所述空閑資源事件記錄保存當(dāng)所述至少一個資源被分配給所述多個分區(qū)中的任何分區(qū)時,關(guān)于每個所述至少一個資源發(fā)生的事件的記錄。
3.如權(quán)利要求2所述的數(shù)據(jù)處理系統(tǒng),其中,一個事件記錄與所述多個分區(qū)中的每一個相關(guān)聯(lián),其中,當(dāng)一個資源從所述空閑資源池被分配給一個分區(qū)時,該資源的事件從所述空閑資源事件記錄被轉(zhuǎn)移到該分區(qū)的事件記錄。
4.如權(quán)利要求2所述的數(shù)據(jù)處理系統(tǒng),其中,一個事件記錄與所述多個分區(qū)的每一個相關(guān)聯(lián),其中,當(dāng)一個資源從一個分區(qū)移動到所述空閑資源池時,該資源的事件從該分區(qū)的事件記錄轉(zhuǎn)移到所述空閑資源事件記錄。
5.如權(quán)利要求1所述的數(shù)據(jù)處理系統(tǒng),其中,所述至少一個資源包括多個資源,其中,所述空閑資源事件記錄保存所述多個資源中在所述空閑資源池中的每個資源的事件記錄。
6.如權(quán)利要求1所述的數(shù)據(jù)處理系統(tǒng),其中,所述事件包括與所述至少一個資源相關(guān)聯(lián)的信息。
7.如權(quán)利要求1所述的數(shù)據(jù)處理系統(tǒng),其中,所述事件包括所述至少一個資源遇到的錯誤。
8.如權(quán)利要求1所述的數(shù)據(jù)處理系統(tǒng),其中,所述數(shù)據(jù)處理系統(tǒng)包括動態(tài)邏輯分區(qū)數(shù)據(jù)處理系統(tǒng)。
9.如權(quán)利要求1所述的數(shù)據(jù)處理系統(tǒng),其中,所述數(shù)據(jù)處理系統(tǒng)包括按需建立動態(tài)處理能力的數(shù)據(jù)處理系統(tǒng)。
10.一種監(jiān)視數(shù)據(jù)處理系統(tǒng)中的資源的方法,所述數(shù)據(jù)處理系統(tǒng)具有多個分區(qū)、至少一個能夠被分配給所述多個分區(qū)中的任何分區(qū)的資源以及空閑資源池,所述至少一個資源從所述空閑資源池被分配給一個分區(qū),該方法包括提供與所述空閑資源池相關(guān)聯(lián)的空閑資源事件記錄,用于保存所述至少一個資源中,在所述空閑資源池中的每個資源的事件記錄。
11.如權(quán)利要求10所述的方法,其中,當(dāng)所述至少一個資源被分配給所述多個分區(qū)中的任何分區(qū)時,發(fā)生所述至少一個資源中的每個資源的事件。
12.如權(quán)利要求11所述的方法,其中,一個事件記錄與所述多個分區(qū)中的每一個相關(guān)聯(lián),該方法還包括當(dāng)一個資源從所述空閑資源池被分配給一個分區(qū)時,將該資源的事件從所述空閑資源事件記錄轉(zhuǎn)移到該分區(qū)的事件記錄。
13.如權(quán)利要求11所述的方法,其中,一個事件記錄與所述多個分區(qū)的每一個相關(guān)聯(lián),該方法還包括當(dāng)一個資源從一個分區(qū)移動到所述空閑資源池時,將該資源的事件從該分區(qū)的事件記錄轉(zhuǎn)移到所述空閑資源事件記錄。
14.如權(quán)利要求12所述的方法,還包括當(dāng)所述資源從所述空閑資源池被分配給所述分區(qū)時,從所述空閑資源事件記錄刪除該資源的事件記錄。
15.如權(quán)利要求13所述的方法,還包括當(dāng)所述資源從所述分區(qū)移動到所述空閑資源池時,從所述分區(qū)的事件記錄刪除該資源的事件記錄。
16.計算機可讀介質(zhì)中的用于監(jiān)視數(shù)據(jù)處理系統(tǒng)中的資源的計算機程序產(chǎn)品,所述數(shù)據(jù)處理系統(tǒng)具有多個分區(qū)、至少一個能夠被分配給所述多個分區(qū)中的任何分區(qū)的資源以及空閑資源池,所述至少一個資源從所述空閑資源池被分配給一個分區(qū),該計算機程序產(chǎn)品包括提供與所述空閑資源池相關(guān)聯(lián)的空閑資源事件記錄,用于保存所述至少一個資源中,在所述空閑資源池中的每個資源的事件記錄的指令。
17.如權(quán)利要求16所述的計算機程序產(chǎn)品,其中,一個事件記錄與所述多個分區(qū)中的每一個相關(guān)聯(lián),該計算機程序產(chǎn)品還包括當(dāng)一個資源從所述空閑資源池被分配給一個分區(qū)時,將該資源的事件從所述空閑資源事件記錄轉(zhuǎn)移到該分區(qū)的事件記錄的指令。
18.如權(quán)利要求16所述的計算機程序產(chǎn)品,其中,一個事件記錄與所述多個分區(qū)的每一個相關(guān)聯(lián),該計算機程序產(chǎn)品還包括當(dāng)一個資源從一個分區(qū)移動到所述空閑資源池時,將該資源的事件從該分區(qū)的事件記錄轉(zhuǎn)移到所述空閑資源事件記錄的指令。
19.如權(quán)利要求17所述的計算機程序產(chǎn)品,還包括當(dāng)所述資源從所述空閑資源池被分配給所述分區(qū)時,從所述空閑資源事件記錄刪除該資源的事件記錄的指令。
20.如權(quán)利要求18所述的計算機程序產(chǎn)品,還包括當(dāng)所述資源從所述分區(qū)移動到所述空閑資源池時,從所述分區(qū)的事件記錄刪除該資源的事件記錄的指令。
全文摘要
本申請涉及數(shù)據(jù)處理系統(tǒng)以及用于監(jiān)視數(shù)據(jù)處理系統(tǒng)的方法。具體地,本發(fā)明提供了一種系統(tǒng)、方法和計算機程序產(chǎn)品,用于監(jiān)視能夠從數(shù)據(jù)處理系統(tǒng)的空閑資源池分配給數(shù)據(jù)處理系統(tǒng)的不同分區(qū)的資源。一個空閑資源事件記錄與空閑資源池相關(guān)聯(lián),用于保存空閑資源池中的每一個資源的事件記錄。當(dāng)一個資源從空閑資源池被分配給一個分區(qū)時,所分配資源的事件記錄就從空閑資源事件記錄轉(zhuǎn)移到與該分區(qū)相關(guān)聯(lián)的事件記錄。
文檔編號G06F9/50GK1696904SQ20051000930
公開日2005年11月16日 申請日期2005年2月18日 優(yōu)先權(quán)日2004年5月13日
發(fā)明者法薩爾·M.·阿瓦達, 喬·內(nèi)森·布朗, 菲利普·伯納德·布克斯, 小維克托·艾克斯皮諾扎 申請人:國際商業(yè)機器公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1