專利名稱:實(shí)際產(chǎn)品it系統(tǒng)的采用推測的在線性能建模方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及信息技術(shù)(IT)系統(tǒng)的性能建模。更確切的說,本發(fā)明涉及實(shí)際產(chǎn)品IT系統(tǒng)的采用推測的在線性能建模。
背景技術(shù):
幾十年來,性能建模已經(jīng)在計(jì)算機(jī)和通訊系統(tǒng)以及各種應(yīng)用程序的設(shè)計(jì)、操縱和優(yōu)化方面具有重大理論和實(shí)踐重要性。建模方法在向設(shè)計(jì)師和工程師提供關(guān)于所考慮的系統(tǒng)的定量和定性的理解上特別有效。
然而,隨著信息技術(shù)(IT)在可利用的應(yīng)用范圍的成熟和發(fā)展,IT系統(tǒng)的大小和復(fù)雜度都以遞增的速度增長。例如現(xiàn)今典型網(wǎng)絡(luò)服務(wù)主機(jī)中心也許有數(shù)百個(gè)節(jié)點(diǎn)和同時(shí)在其中運(yùn)行的幾十個(gè)不同的應(yīng)用程序。每一個(gè)節(jié)點(diǎn)反過來通常具有多個(gè)處理器和分級高速緩存。這些節(jié)點(diǎn)利用本地和共享的存儲(chǔ)系統(tǒng)。如果還能管理的話,這些系統(tǒng)的大小和復(fù)雜度也使得性能建模益發(fā)困難。具體建模,精確調(diào)試和準(zhǔn)確分析僅在非常小的系統(tǒng)或系統(tǒng)的非常小的元件上進(jìn)行。
此外,源自硬件技術(shù)的飛快發(fā)展,這些系統(tǒng)的元件以比新近的過往更快的速度升級著,以滿足性能和有效性的需求和改善性能和有效性的服務(wù)質(zhì)量(QoS)參數(shù)。因此,性能建模應(yīng)在很短的時(shí)間幀完成以使得模型和分析相互關(guān)聯(lián)。
這些限制使得對現(xiàn)代IT系統(tǒng)的性能建模工作非常昂貴,且常常無法負(fù)擔(dān)。為了在很短的周轉(zhuǎn)期獲得相對準(zhǔn)確的性能評估結(jié)果,也就是在所考慮的系統(tǒng)變荒廢前,在人力和計(jì)算機(jī)資源方面的大量投資是必需的。
另一方面,IT系統(tǒng)已經(jīng)在大多商業(yè)上變得非常關(guān)鍵。當(dāng)一家公司的IT系統(tǒng)癱瘓時(shí),每分鐘百萬美元的損失已被充分證明。因而,用戶們自然越來越苛求他們系統(tǒng)中的服務(wù)質(zhì)量(QoS)。在IT外購時(shí),在多邊協(xié)定間簽訂的服務(wù)級協(xié)議(SLA)規(guī)定了服務(wù)質(zhì)量保證以及其他事項(xiàng),通常伴隨有懲罰條款以防止違反協(xié)議。結(jié)果,在這種系統(tǒng)中的容量規(guī)劃和服務(wù)質(zhì)量管理的預(yù)測建模至關(guān)重要。
為了在短時(shí)間幀內(nèi)建立性能模型,其中典型地沒有時(shí)間建立任何測試環(huán)境,設(shè)計(jì)人員應(yīng)考慮使用由實(shí)際IT系統(tǒng)(production IT system)得到的性能參數(shù)來在線調(diào)試該模型。這么做時(shí)有些基本的挑戰(zhàn),由于該實(shí)際系統(tǒng)是一個(gè)非可控環(huán)境,工作負(fù)載典型地為易變的,非靜止的,具有高峰期/非高峰期的變化特征,還具有每天,每周或每季度的變化方式。沒有關(guān)于這種混合事務(wù)(transaction)的詳細(xì)信息,因?yàn)樗撬沧兊摹?br>
此外,只有有限的監(jiān)測/性能測量是可以收集來助以建構(gòu)模型,因此這些測量對于該實(shí)際系統(tǒng)并沒有太多打擾。這種監(jiān)測和性能測量典型地通過從各種不同地理位置周期偵測來收集,由于該偵測來自不同地理位置,在包括不同的和瞬間的網(wǎng)絡(luò)延遲的這種端到端延遲測量的意義上說,這也導(dǎo)致進(jìn)一步挑戰(zhàn)。
排隊(duì)網(wǎng)絡(luò)模型已經(jīng)是并將繼續(xù)是這種系統(tǒng)的性能分析上最流行的樣式(參見,例如,L.Kleinrock;Queueing Systems Volume IIComputerApplications;John Wiley and Sons,1976;and D.Menasce and V.Almeida;Capacity Planning for web Performance;Prentice hall,1998)。人們也使用離散事件仿真方法來模型化一復(fù)雜的IT系統(tǒng)。這種方法要求饋送具體的模型參數(shù)給仿真器,但直接測量這些參數(shù)通常費(fèi)錢,耗時(shí),且干擾實(shí)際系統(tǒng)。
發(fā)明內(nèi)容
需要工具、系統(tǒng)和方法旨在自動(dòng)進(jìn)行在線實(shí)際IT基礎(chǔ)構(gòu)造(productionIT infrastructure)和應(yīng)用的性能建模和最優(yōu)化處理,以減少設(shè)備和人力成本,縮短性能評估、預(yù)測和容量規(guī)劃的周轉(zhuǎn)期。這種系統(tǒng)和方法應(yīng)當(dāng)能夠處理在在線實(shí)際IT系統(tǒng)中很常見的實(shí)時(shí)的動(dòng)態(tài)變化,包括了易失性,非靜態(tài)的特性,高峰期/非高峰期的狀態(tài)(regime),以及每天,每周或每季的模式。
具有執(zhí)行許多種類事務(wù)的服務(wù)器(組)的用于信息技術(shù)(IT)系統(tǒng)的性能建模的系統(tǒng)和方法包括接收系統(tǒng)拓?fù)浜褪聞?wù)流(transaction flow)數(shù)據(jù),接收IT系統(tǒng)的性能測量數(shù)據(jù)。該測量數(shù)據(jù)基于共性被叢集(clustered)成多種狀態(tài)(multiple regimes)?;趨布臄?shù)據(jù)推測服務(wù)請求和網(wǎng)絡(luò)延遲參數(shù)。
這些以及其它的目標(biāo),特征和優(yōu)點(diǎn)將由以下連同附圖一起閱讀的實(shí)施例的具體描述而變得更明顯。
本公開提供了結(jié)合下述附圖的下列優(yōu)選實(shí)施例的具體描述,其中圖1示出可根據(jù)本發(fā)明建模的電子商務(wù)站點(diǎn)構(gòu)造的示例;圖2示出與圖1中所示的電子商務(wù)站點(diǎn)相應(yīng)的排隊(duì)模型的示例;圖3示出根據(jù)本發(fā)明一實(shí)施例的基于叢集方法的通過推測數(shù)據(jù)來進(jìn)行IT系統(tǒng)建模的系統(tǒng)/方法的方塊/流程圖;圖4示出根據(jù)本發(fā)明另一實(shí)施例的用于IT系統(tǒng)建模的系統(tǒng)/方法的方塊/流程圖。
具體實(shí)施例方式
提供了實(shí)際產(chǎn)品信息技術(shù)系統(tǒng)的在線性能建模的系統(tǒng)和方法。實(shí)施例包括了接收端到端延遲和服務(wù)器利用率(server utilization)的在線性能測量數(shù)據(jù),接收事務(wù)流和系統(tǒng)拓?fù)鋽?shù)據(jù)以及利用叢集算法(clusteringalgorithm)將測量數(shù)據(jù)重新組織成多種狀態(tài)?;谠摱喾N狀態(tài)叢集的測量數(shù)據(jù)推測服務(wù)請求參數(shù),以及基于在預(yù)測和測量響應(yīng)時(shí)間之間的最小間隔的最優(yōu)化算法可以用于推測性能參數(shù)。另外,在線預(yù)測和費(fèi)用最優(yōu)化方法被引用來進(jìn)行預(yù)測,假定推測分析和費(fèi)用-效率系統(tǒng)設(shè)計(jì)。
考慮到傳統(tǒng)方法的前述問題、缺陷和缺點(diǎn),本發(fā)明的一方面合并了叢集、排隊(duì)模型和推測技術(shù)來自動(dòng)進(jìn)行實(shí)時(shí)實(shí)際IT系統(tǒng)和應(yīng)用程序的在線性能建模和最優(yōu)化的過程。
本發(fā)明的方法采用叢集技術(shù)來處理實(shí)際系統(tǒng)的工作負(fù)載在通訊強(qiáng)度和混合事務(wù)兩方面都不穩(wěn)定的現(xiàn)實(shí)。依照本發(fā)明方案的叢集算法用于基于共性重新組織監(jiān)測到的性能測量數(shù)據(jù),因此所述性能數(shù)據(jù)在模型建構(gòu)中被分組成單獨(dú)考慮的多種狀態(tài)。
借助于所述的重新組織的性能數(shù)據(jù),更先進(jìn)的推測技術(shù)提出來以自動(dòng)建構(gòu)基礎(chǔ)的排隊(duì)網(wǎng)絡(luò)模型和工具。該推測考慮了所述性能數(shù)據(jù)是在不同地理位置的多個(gè)測試站點(diǎn)收集的這一事實(shí),并考慮到了不同地理位置間的網(wǎng)絡(luò)延遲的差異。本發(fā)明的實(shí)施例可以包括采用最常見和最廉價(jià)的測量作為輸入。這些測量可以包括,例如系統(tǒng)信息通過量,服務(wù)器利用率,端到端響應(yīng)時(shí)間等。
借助于上述的方法和系統(tǒng),可以對任一用途的任一給定的系統(tǒng)結(jié)構(gòu)建立性能模型。由于通過持續(xù)地供給實(shí)時(shí)性能數(shù)據(jù),該模型可以快速地(onthe fly)自動(dòng)重新校準(zhǔn),該模型可應(yīng)用在諸如次要版本(dot release)的發(fā)展和維護(hù)階段,因此,該模型能快速適應(yīng)實(shí)際系統(tǒng)(在硬件和軟件升級兩方面)的快速演化。
作為副產(chǎn)品,評估了在不同機(jī)器/服務(wù)器上的不同應(yīng)用/事務(wù)的計(jì)算機(jī)處理單元(CPU)利用率。這對于具體的儀表技術(shù)而言是非干擾的備選方案。此方法對于基于利用率的列表很有用。
在本發(fā)明的一實(shí)施例中,可利用閉合式等式來表征IT系統(tǒng)。在該實(shí)施例中,推測方法包括下述步驟基于閉合式等式導(dǎo)出端到端響應(yīng)時(shí)間公式;根據(jù)可獲得的性能度量用公式表述推測(參數(shù)估計(jì))問題;把事務(wù)的端到端響應(yīng)時(shí)間和服務(wù)器利用率數(shù)據(jù)輸入推測問題公式中;求解模型參數(shù)(每個(gè)服務(wù)器每個(gè)事務(wù)的服務(wù)要求)的推測問題,從而使模型產(chǎn)生的性能度量到測量的結(jié)果的距離最小化。
本發(fā)明的另一實(shí)施例致力于不存在閉合式表達(dá)式的情況。在這種情況下,離散事件仿真器以及一組巨集式啟發(fā)式(meta-heuristic)搜索方法可被用于獲得優(yōu)化的性能參數(shù)。巨集式啟發(fā)式搜索方式將引導(dǎo)搜索產(chǎn)生下一候選參數(shù)設(shè)置。所述模型的仿真器將被用于評估性能度量以進(jìn)行候選參數(shù)設(shè)置。巨集式啟發(fā)式搜索方式將被再次根據(jù)當(dāng)前和過去的候選設(shè)置的性能度量,產(chǎn)生下一候選參數(shù)設(shè)置。重復(fù)該過程,直到指定的停止標(biāo)準(zhǔn)被滿足為止。該程序的輸出是所述參數(shù)設(shè)置的當(dāng)前最佳估計(jì)。
本發(fā)明的實(shí)施例可完全采用硬件實(shí)施例的形式,完全軟件實(shí)施例的形式,或者軟硬件都包括的實(shí)施例形式。在一優(yōu)選實(shí)施例中,本發(fā)明由軟件來實(shí)現(xiàn),其中軟件包括但不限于固件,常駐軟件,微碼等。
此外,本發(fā)明可采用計(jì)算機(jī)程序產(chǎn)品的形式,其可由提供程序代碼的計(jì)算機(jī)可用或計(jì)算機(jī)可讀媒介來訪問,該介質(zhì)用于計(jì)算機(jī)或任一指令執(zhí)行系統(tǒng)或與一計(jì)算機(jī)或任一指令執(zhí)行系統(tǒng)連接。為了本說明的目的,計(jì)算機(jī)可用或計(jì)算機(jī)可讀媒介可以包括,用于所述指令執(zhí)行系統(tǒng)、設(shè)備、儀器或者與其連接的存儲(chǔ)、通訊、傳播或傳送所述程序的任一設(shè)備。這些媒介可以是電的,磁的,光學(xué)的,電磁的,紅外線的,或半導(dǎo)體系統(tǒng)(或設(shè)備或儀器)或傳播媒介。計(jì)算機(jī)可讀媒介的例子包括半導(dǎo)體或固態(tài)存儲(chǔ)器,磁帶,可移動(dòng)計(jì)算機(jī)磁盤,隨機(jī)存儲(chǔ)器(RAM),只讀存儲(chǔ)器(ROM),硬磁盤和光盤。本例中的光盤包括壓縮盤-只讀存儲(chǔ)器(CD-ROM),讀/寫壓縮盤(CD-R/W)和DVD。
適于存儲(chǔ)和/或執(zhí)行程序代碼的數(shù)據(jù)處理系統(tǒng)可以包括通過系統(tǒng)總線直接或間接耦合到存儲(chǔ)元件的至少一個(gè)處理器。所述存儲(chǔ)元件包括在實(shí)際執(zhí)行程序代碼時(shí)使用的本地存儲(chǔ)器、大容量存儲(chǔ)器,和提供暫時(shí)存儲(chǔ)至少部分程序代碼以減少在執(zhí)行期間從大容量存儲(chǔ)器中檢索代碼的次數(shù)的高速緩存器。輸入/輸出或I/O裝置(包括但不限于鍵盤、顯示器、打印裝置)可以直接或通過插入的I/O控制器耦合到所述系統(tǒng)。
網(wǎng)絡(luò)適配器也可以耦合到所述系統(tǒng)中使得所述數(shù)據(jù)處理系統(tǒng)通過中間的專用或公共網(wǎng)絡(luò)和其它數(shù)據(jù)處理系統(tǒng)或遠(yuǎn)端打印機(jī)或存儲(chǔ)設(shè)備耦合起來。調(diào)制解調(diào)器,電纜調(diào)制解調(diào)器和以太網(wǎng)卡是網(wǎng)絡(luò)適配器的現(xiàn)有的幾種可用的種類。
本發(fā)明提供實(shí)際產(chǎn)品IT系統(tǒng)和應(yīng)用的自動(dòng)在線性能建模和工具。本發(fā)明的一方面包括使用叢集技術(shù)來處理實(shí)際系統(tǒng)的工作量在通訊強(qiáng)度和事務(wù)混合兩方面的不穩(wěn)定的現(xiàn)實(shí)。先進(jìn)的叢集算法被用于基于共性來重新組織監(jiān)測到的性能測量數(shù)據(jù),因此所述性能數(shù)據(jù)被分成在模型建構(gòu)中被單獨(dú)考慮的多種狀態(tài)。
借助于所述的重新組織的性能數(shù)據(jù),進(jìn)一步的推測技術(shù)提出來以自動(dòng)建構(gòu)基礎(chǔ)的排隊(duì)網(wǎng)絡(luò)模型。該推測考慮了所述性能數(shù)據(jù)是在不同地理位置的多個(gè)測試站點(diǎn)收集的,并考慮了不同地理位置間的網(wǎng)絡(luò)延遲的差異。本發(fā)明優(yōu)選以最常見和最廉價(jià)的測量作為輸入。這些測量包括,例如系統(tǒng)信息通過量,服務(wù)器利用率,端到端響應(yīng)時(shí)間。
本發(fā)明的實(shí)施例相對于常規(guī)方法提供了許多有吸引力的特點(diǎn)和優(yōu)點(diǎn)。例如,一個(gè)實(shí)施例利用先進(jìn)的叢集分析技術(shù)把非靜止瞬時(shí)測量數(shù)據(jù)組成基于共性的多種狀態(tài)。另外,通過依靠高水平的排隊(duì)網(wǎng)絡(luò)模型和基于觀測利用率和端到端性能數(shù)據(jù)的先進(jìn)的推測技術(shù),本發(fā)明的實(shí)施例避免了傳統(tǒng)排隊(duì)網(wǎng)絡(luò)建模作業(yè)的問題。傳統(tǒng)排隊(duì)網(wǎng)絡(luò)需要大量的低端系統(tǒng)監(jiān)測和數(shù)據(jù)收集。
本發(fā)明實(shí)施例的模型建構(gòu)方法允許采用快速和準(zhǔn)確的方式建構(gòu)性能模型,尤其對于復(fù)雜的實(shí)際系統(tǒng)而言。與基于手工參數(shù)調(diào)試的傳統(tǒng)性能建模方法相比,利用本發(fā)明的方案導(dǎo)致了顯著的時(shí)間上的節(jié)約。本發(fā)明實(shí)施例還允許基于系統(tǒng)的監(jiān)測信息快速地建構(gòu)性能模型。此特點(diǎn)對于隨選系統(tǒng)(on-demand system)的動(dòng)態(tài)供應(yīng)(dynamic provisioning)特別有效。
因此本發(fā)明實(shí)施例提供了一種端到端、自調(diào)試和靈活的系統(tǒng)/方法,其允許基于所述系統(tǒng)的監(jiān)測的信息快速地建構(gòu)在線性能模型。它能很容易的并入一組性能操控功能中去,包括從性能預(yù)測,到優(yōu)化現(xiàn)有的IT基礎(chǔ)構(gòu)造,和設(shè)計(jì)費(fèi)用-效率體系。所有的所述功能可以提供對一網(wǎng)點(diǎn)能力的洞悉,同時(shí)可以很好的了解在可量測性(scalability),服務(wù)質(zhì)量(QoS),容量成本(capacity cost),操作風(fēng)險(xiǎn)(operations risk)等之間的平衡。從而本發(fā)明在其它事務(wù)中,能使得IT規(guī)劃者積極發(fā)展和提供用于增加客戶基礎(chǔ)構(gòu)造、應(yīng)用程序和服務(wù)管理能力的解決方法,以及能幫助客戶主動(dòng)管理他們的資源以及滿足他們隨選的服務(wù)級協(xié)議。
現(xiàn)在參見附圖,圖中相同的數(shù)字代表與圖1最初的元件相同或相似的元件,示出了一個(gè)電子商務(wù)環(huán)境以示意性地展示本發(fā)明實(shí)施例。本發(fā)明優(yōu)選實(shí)施例在一個(gè)分布數(shù)據(jù)處理環(huán)境實(shí)現(xiàn),其中端到端響應(yīng)時(shí)間和CPU利用率測量被編輯并用于自動(dòng)模型建構(gòu)。在本發(fā)明一有用實(shí)施例中,一分布數(shù)據(jù)處理環(huán)境可以用于一商業(yè)網(wǎng)點(diǎn)的在線實(shí)際環(huán)境建模。
一實(shí)際IT系統(tǒng)100包括多個(gè)電子商務(wù)服務(wù)器,其可以被組織成具有多層結(jié)構(gòu)。該體系100由因特網(wǎng)131分配;然而,也可使用任何網(wǎng)絡(luò)或其它分配系統(tǒng)。在此實(shí)施例中,為了安全使用了防火墻109;然而,如同實(shí)際情況中一樣,每一系統(tǒng)也可以包括附加的或另外的網(wǎng)絡(luò)構(gòu)造。
例如,站點(diǎn)101可以包括兩個(gè)分離的服務(wù)器群集(cluster)。一門戶群集(portal cluster)103主要負(fù)責(zé)與認(rèn)證相關(guān)的請求。商務(wù)相關(guān)的請求由一商務(wù)事務(wù)服務(wù)器群集105單獨(dú)處理。在每個(gè)群集內(nèi),有兩個(gè)或多個(gè)層,前端服務(wù)器121-122,和后端數(shù)據(jù)庫服務(wù)器123-124。進(jìn)入站點(diǎn)的請求通過一負(fù)載平衡路由器107(例如,IBM的企業(yè)網(wǎng)絡(luò)分配器(eND),或類似產(chǎn)品)發(fā)送到一組前端服務(wù)器121-122(參見,例如G.Hunt,G.Goldszmidt,R.King,and,R.Mukherjee.Network dispatcherA connection router forscalable Internet services.Proceedings of the 7th International WorldWide Web Conference,April,1998)。所述路由器107以加權(quán)輪詢調(diào)度(Weighted round robin)方式發(fā)送請求,以至均勻分布工作負(fù)載到前端服務(wù)器121-122。處理后的頁面直接回程到客戶機(jī)110-112,而非通過路由器107返回。前端服務(wù)器121-122和后端服務(wù)器123-124利用率測量可以通過持續(xù)的在線測量得到。
由事務(wù)和到電子商務(wù)服務(wù)器的請求組成的電子商務(wù)工作負(fù)載,也是相當(dāng)復(fù)雜的。以企業(yè)在線購物情景為例來考慮。這一相互作用包括了認(rèn)證例如登錄的事務(wù),諸如瀏覽產(chǎn)品目錄的商業(yè)事務(wù),搜索產(chǎn)品,增加條目到購物車,進(jìn)行付帳等。這些事務(wù)的每一種使用站點(diǎn)的不同資源。
諸如瀏覽的各事務(wù)可以僅包含前端應(yīng)用服務(wù)器去引出靜態(tài)頁,其相對便宜,而其它事務(wù),例如搜索或付帳事務(wù),可以包括動(dòng)態(tài)頁或到數(shù)據(jù)庫的多種查詢的組合,其需要大量的處理時(shí)間和同時(shí)包括了前端應(yīng)用服務(wù)器和后端數(shù)據(jù)庫服務(wù)器。此外,不同用戶之間的在網(wǎng)上的瀏覽模式有相當(dāng)顯著不同。一些用戶可能將所有時(shí)間用于瀏覽和搜索,而一些經(jīng)常性的買主可能直接上網(wǎng)購買。
對于實(shí)際系統(tǒng)100,電子商務(wù)混合工作負(fù)荷通常并非清楚明了。即使該系統(tǒng)記錄的日志文件可以提供一些關(guān)于混合負(fù)荷的信息,但這些信息經(jīng)常不完整。一組在地理上分散的探測站點(diǎn)可以用來監(jiān)測IT系統(tǒng)的性能。這些探測站點(diǎn)可以定時(shí)發(fā)出不同交易事務(wù)的探測請求以及測量端到端的響應(yīng)時(shí)間。而該響應(yīng)時(shí)間包括了網(wǎng)絡(luò)延遲,該網(wǎng)絡(luò)延遲在每個(gè)地理位置間通常不相同。
由于用于實(shí)際系統(tǒng)中的IT系統(tǒng)的工作負(fù)荷是非靜態(tài)的,所以建模極具挑戰(zhàn)性。工作負(fù)荷具有高峰期的/非高峰期的容量,具有每天/每周模式,并可能很不穩(wěn)定。因此,在系統(tǒng)結(jié)構(gòu)多種多樣,具有不同功能的應(yīng)用程序眾多和用戶行為差異巨大的情況下,評估通過整個(gè)IT環(huán)境傳遞端到端性能確認(rèn)的IT系統(tǒng)的容量是件艱巨的任務(wù)。
建模為了確保模型框架的可行性并仍抓住電子商務(wù)基礎(chǔ)構(gòu)造的基本原則,提出了排隊(duì)模型,將以一種既不太具體也不太籠統(tǒng)的方式來描述該模型,并將其描述為依賴于可控制的參數(shù)數(shù)量。
現(xiàn)參看圖2并繼續(xù)參照圖1,描述了一高級多類別排隊(duì)網(wǎng)絡(luò)模型200。這種形式的模型抓住了主要資源和延遲效應(yīng),并提供性能測量和系統(tǒng)結(jié)構(gòu)之間良好的可跟蹤性。引起不可忽略的延遲的每個(gè)資源組件將通過具有排隊(duì)效應(yīng)的通用服務(wù)站點(diǎn)(service station)來建模。這種通用服務(wù)站點(diǎn)可具有從一個(gè)到無限個(gè)的任何數(shù)量的服務(wù)器。例如,如果在防火墻109引發(fā)的延遲是不變的且不可忽略的,設(shè)計(jì)人員可以把防火墻109模型化成具有不變服務(wù)時(shí)間的無限服務(wù)站點(diǎn)。
其次,事務(wù)被特征化并概括(profiled)成不同類別,因此在每一類別中的請求將通過流經(jīng)不同服務(wù)器站點(diǎn)的相似的路徑,并沿著所述路徑在每個(gè)站點(diǎn)需要相似的服務(wù)請求。這種概括可以基于先前的操控知識或在仔細(xì)工作負(fù)荷分析后。例如,登錄事務(wù)(login transaction)通常不同于購買事務(wù),這些不同事務(wù)段將訪問不同組的服務(wù)器站點(diǎn)和產(chǎn)生不同的資源請求。
參照圖1所描述的系統(tǒng)可以模型化成圖2中的閉合排隊(duì)網(wǎng)絡(luò)200。圖2中,網(wǎng)絡(luò)231相當(dāng)于圖1中的因特網(wǎng)131;網(wǎng)絡(luò)分配器207相當(dāng)于路由器107;服務(wù)器221-224相當(dāng)于服務(wù)器121-124。
要獲取計(jì)算機(jī)環(huán)境的多線程處理,為了說明性目的可設(shè)想這些服務(wù)器根據(jù)處理器共享(PS)規(guī)程服務(wù)于各作業(yè)。由于網(wǎng)絡(luò)231導(dǎo)致的延遲是不可忽略的,這種延遲效應(yīng)被模型化成延遲服務(wù)器。還假定網(wǎng)絡(luò)231具有不變的延遲(依賴于客戶機(jī)的地理位置)。
為了說明性目的,特別作業(yè)(或事務(wù))的端到端延遲可以定義為用戶從她發(fā)布事務(wù)的時(shí)間到她接收到期望的完整響應(yīng)時(shí)間時(shí)所經(jīng)歷的總響應(yīng)時(shí)間。從而客戶的端到端延遲包括在網(wǎng)絡(luò)231的網(wǎng)絡(luò)延遲和在網(wǎng)絡(luò)服務(wù)器221-224的延遲。
叢集分析法重新組織測量的性能數(shù)據(jù)通過叢集分析法提供重新組織的測量的實(shí)際系統(tǒng)的性能數(shù)據(jù)。傳統(tǒng)上,在人們投放使用一種IT系統(tǒng)到生產(chǎn)中去時(shí),經(jīng)常建立一測試系統(tǒng)。采用測試系統(tǒng)具有可全盤控制環(huán)境的優(yōu)點(diǎn)。通過采用本發(fā)明的方案,可以知曉混合工作負(fù)載和工作負(fù)載強(qiáng)度的全部信息。而且,所述系統(tǒng)可以運(yùn)行到其穩(wěn)定狀態(tài)以收集性能測量數(shù)據(jù)。
建立測試系統(tǒng)費(fèi)財(cái)又耗時(shí)。IT系統(tǒng)的飛快演化經(jīng)常使得很困難去判斷用于測試系統(tǒng)的費(fèi)用和時(shí)間。尤其在測試系統(tǒng)幾乎不能完全模擬包括真實(shí)客戶使用、混合工作負(fù)載、用戶行為、系統(tǒng)使用和網(wǎng)絡(luò)利用率等的實(shí)際系統(tǒng)時(shí)。因此,對實(shí)際系統(tǒng)直接建構(gòu)性能模型更為理想。
由于來自實(shí)際系統(tǒng)的性能測量的瞬變性和不穩(wěn)定性的本質(zhì)特點(diǎn),較為理想的是將所述監(jiān)測的數(shù)據(jù)重新組織成不同的狀態(tài)。每一狀態(tài)可以代表一個(gè)工作環(huán)境,在其中所述系統(tǒng)的每一服務(wù)器以不變的工作負(fù)載運(yùn)行。叢集分析技術(shù)可以用于獲取不同的狀態(tài)。
K法(K-means)算法有許多不同類型的叢集分析算法。本公開示例性描述了K-MEANS算法,因?yàn)樗且环N最簡單的無需監(jiān)督的排他分塊(un-supervised exclusivepartitioning)算法,其將對象集合劃分成K個(gè)組。除K-MEANS外或代替K-MEANS的其它叢集分析算法也可以使用。下面簡要描述K-MEANS算法。
放置K個(gè)點(diǎn)在由成被分類的對象所表示的空間內(nèi)。這些點(diǎn)代表了初始質(zhì)心組(initial group of centroids)。每一對象被指派到具有最接近質(zhì)心的組內(nèi),當(dāng)所有對象都被指派完后,重新計(jì)算所述K個(gè)質(zhì)心的位置。重復(fù)這一過程直到所述質(zhì)心不再移動(dòng)。這導(dǎo)致所述對象被分為多個(gè)組,由此可計(jì)算要被最小化的度量。
當(dāng)指派每個(gè)對象到一個(gè)組中時(shí),定義一個(gè)距離度量。對于高維度數(shù)據(jù)的常用度量為閔可夫斯基(Minkowski)度量(dp),dp(xi,xj)=(Σk=ld|xik-xjk|p)lp]]>這里d是數(shù)據(jù)的維數(shù)。閔可夫斯基(Minkowski)度量的兩個(gè)特例是歐幾里德(Euclidean)距離和曼哈頓(Manhattan)距離,分別對應(yīng)于p=2和p=1的情況。然而對于任一給定的應(yīng)用沒有一般的指導(dǎo)規(guī)則用于選擇p。在一實(shí)施例中選擇歐幾里德距離。
多種狀態(tài)的性能數(shù)據(jù)用(Rt,ρt)定義在探測時(shí)間t(t=t1,t2,....,tN)的端到端延遲(或用于模型化系統(tǒng)的其他的度量)和系統(tǒng)利用率。對ρt項(xiàng)應(yīng)用K-MEANS算法以獲得K個(gè)叢集,這里叢集k大小為nk,并具有組元Ck={t1k,t2k,....,tnkk}。因此,狀態(tài)k的性能數(shù)據(jù)計(jì)算為R-k=1nkΣt∈CkRt]]>ρ-k=1nkΣt∈Ckρt]]>模型參數(shù)校準(zhǔn)在所述性能模型的建構(gòu)中,獲取排隊(duì)網(wǎng)絡(luò)模型中每個(gè)通用服務(wù)器上每個(gè)類別的服務(wù)請求參數(shù)。理想地,獲得這些參數(shù)值涉及直接測量在每個(gè)設(shè)備處每個(gè)類別的資源消耗,實(shí)踐中,這樣做的成本很高。一種解決方案依賴于可測量并且相對廉價(jià)的性能度量,例如端到端響應(yīng)時(shí)間,一些或全部服務(wù)器的CPU負(fù)載信息等。端到端響應(yīng)時(shí)間可被容易地測量,端到端的響應(yīng)時(shí)間可定義成從用戶發(fā)起請求的開始到用戶收到響應(yīng)為止的時(shí)間。事實(shí)上,公司通常為這些端到端延遲設(shè)置具體目標(biāo),以便保證令人滿意的用戶體驗(yàn)。CPU負(fù)載信息是用于Web服務(wù)性能監(jiān)視的另一種度量。其它的度量也可以使用。
本發(fā)明可利用通用推測方法,以利用最常見的測量結(jié)果,例如系統(tǒng)信息通過量,服務(wù)器的利用率,和端到端響應(yīng)時(shí)間,來推測這些服務(wù)時(shí)間參數(shù)。由于IT系統(tǒng)的隨機(jī)性,因此難以精確地確認(rèn)哪個(gè)測量數(shù)據(jù)組最佳。從而,如果所得到的IT系統(tǒng)模型的性能“最接近于”所述測量的性能,那么該組推測的參數(shù)可定義為“最佳”。兩種不同性能度量之間的距離可以是廣義的,例如跨越不同組件或類別的加權(quán)平均。
本發(fā)明中應(yīng)用的推測方法可以包括兩方面。如果基礎(chǔ)的排隊(duì)網(wǎng)絡(luò)模型具有閉合形式的性能表示(或良好的解析近似),那么其性能可用公式表示成未知服務(wù)要求參數(shù)的函數(shù),解算機(jī)或其它優(yōu)化工具可被用于獲得最佳參數(shù)設(shè)置。圖3中說明性描述了上述建模過程,其表示了本發(fā)明的實(shí)現(xiàn)方式。
下面描述關(guān)于在基礎(chǔ)排隊(duì)網(wǎng)絡(luò)模型中具有I個(gè)服務(wù)器,J種不同的事務(wù)類型(作業(yè)種類)的系統(tǒng)的一個(gè)例子。以下的輸入?yún)?shù)和性能測量假定已給出J=作業(yè)種類的數(shù)目;I=服務(wù)站的數(shù)目;L=探測站的數(shù)目;Vji;=j(luò)類作業(yè)訪問i站點(diǎn)的次數(shù);Ejlm=從探測點(diǎn)l探測j類作業(yè)而測量到的端到端延遲;ρim=測量到的i服務(wù)站的利用率;下面估算以下參數(shù)和性能度量sji=站點(diǎn)i的j類作業(yè)的平均服務(wù)請求;njl=從探測點(diǎn)l探測j類作業(yè)的平均網(wǎng)絡(luò)延遲;Rji=站點(diǎn)i的j類作業(yè)的平均響應(yīng)時(shí)間;Tji=VjiRji站點(diǎn)i的j類作業(yè)(多次訪問總和)的總平均響應(yīng)時(shí)間;Ejle=從探測點(diǎn)l探測j類作業(yè)而估算的端到端延遲;更進(jìn)一步用矩陣形式表示S={sji}J×I;(服務(wù)時(shí)間)N={njl}J×L;(探測延遲)T={υjiRji}J×I;(多重訪問響應(yīng)時(shí)間矩陣)Em={Ejlm}J×L;]]>(測量的端到端延遲)Ee={Ejle}J×L;]]>(估算的端到端延遲)ρm={ρim}I×l;]]>(測量的服務(wù)器利用率)為了使得該模型易處理,假定所述通用服務(wù)站點(diǎn)或是延遲中心,例如,模型化為無限服務(wù)器(IS)隊(duì)列(下文中稱為IS站點(diǎn)),或是運(yùn)行在服務(wù)器共享(PS)服務(wù)規(guī)程(下文中稱為PS站點(diǎn))下的有限容量服務(wù)站點(diǎn)。
那么j類作業(yè)在站點(diǎn)i的到達(dá)速率為λji=υjiλj以及在站點(diǎn)I的全部作業(yè)的到達(dá)速率為λ(i)=Σj=1Jλji]]>i=1,......,I站點(diǎn)i的總業(yè)務(wù)量強(qiáng)度為ρi=Σj=1Jρji]]>=Σj=1Jυjiλjsji]]>i=1,......,I由于所有的服務(wù)站點(diǎn)被假定為或是無限服務(wù)器(IS)或是服務(wù)器共享(PS)站點(diǎn)(都是對稱的隊(duì)列),因此,所述基礎(chǔ)排隊(duì)網(wǎng)絡(luò)是準(zhǔn)可逆網(wǎng)絡(luò)?;谂抨?duì)理論,對于PS站點(diǎn),在站點(diǎn)i的j類作業(yè)的平均響應(yīng)時(shí)間Rji表示為Rji=Ljiλji=sji1-ρi]]>對于IS站點(diǎn),在站點(diǎn)i的j類作業(yè)的平均響應(yīng)時(shí)間Rji表示為Rji=sji因此,j類作業(yè)的端到端延遲可由下式得到Ej=Σsjii∈H(j).i∈lS+Σi∈H(j),i∈PSSji1-ρi]]>
基于上述響應(yīng)時(shí)間公式,應(yīng)用統(tǒng)計(jì)推測技術(shù)來搜索最佳的參數(shù)組,從而得到的性能最接近于測量的性能,min||Em-Ee||這里距離||Em-Ee||可以是廣義的,例如,絕對差值,最大差值,絕對差值加權(quán)總和,或最小二乘方差加權(quán)總和等。由叢集分析法得到的多種狀態(tài)現(xiàn)在可以用來闡明推測問題。
單一狀態(tài)首先來關(guān)注單一狀態(tài)來得到推測程序的相應(yīng)二次參數(shù)。多種實(shí)驗(yàn)的擴(kuò)展隨后將提出。
由探測站點(diǎn)l探測j類作業(yè)而估算的總的端到端延遲是網(wǎng)絡(luò)延遲和服務(wù)器延遲(響應(yīng)時(shí)間)的總和。也就是說,Ejie=njl+T·1I×1=njl+Sj·D(Vj)·β]]>其中 以及Sj和Vj分別代表矩陣S={sji}和V={Vji}中的第j行,D(Vj)是Vj的對角矩陣。
因此,參數(shù)估計(jì)最優(yōu)化的問題是找到服務(wù)請求S和探測延遲N從而使得加權(quán)最小二乘方差最小化。該問題已被修訂從而在所述參數(shù)估計(jì)值和測量值之間的差以確定的約束條件呈現(xiàn),并且根據(jù)這些差值,這些偏差的平方和被最小化。換句話說,在對服務(wù)請求sji和探測延遲njl的非負(fù)約束條件下,二次規(guī)劃(quadratic program)可解,即,
minsΣj=1JΣl=1Lδjl2]]>Ejle(s)-Ejlm=δjl,]]>j=1,...,J,l=1,...,Ls.t.sji≥0, j=1,...,J;i=1,...,Injl≥0,j=1,...,J;l=1,...,L于是最優(yōu)化問題可以重新表述為下面的標(biāo)準(zhǔn)形式的二次規(guī)劃公式min12xTHx]]>(QP)s.t.Ax=b;xk≥0,k=1,...,J×(I+L)其中x=x~x≈δ,]]>H=0J×(I+L)002IJL×JL]]>其中 和 代表網(wǎng)絡(luò)延遲{njl}項(xiàng)和服務(wù)時(shí)間{sji}項(xiàng),用向量而非矩陣表示。具體地x~:=njl,]]>如果k=(j-1)×L+1,并且x≈:=sjl,]]>如果k=(j-1)×I+i,δ={δjl}以及A=0K×JLAυ0K×JLIJL×JLAs-IJL×JL]]>其中
并且b=bυbs]]>其中bυ=0K×1bsk=Ejlm,]]>k=(j-1)×L+l多種狀態(tài)推測問題的通式如前所述推測問題或參數(shù)估計(jì)問題可以歸納為使相對于測量的參數(shù)值的偏差的平方和最小化。對于任一特定狀態(tài)的任一組測量值,前面的模型可以求解,以得到這種狀態(tài)的恰當(dāng)?shù)膮?shù)。
然而,如同起源于一系列實(shí)驗(yàn)的任何參數(shù)估計(jì)問題的情況一樣,單單求解單個(gè)實(shí)驗(yàn)的上述二次推測問題是不夠的。事實(shí)上,由于負(fù)載過程非靜態(tài),所述測量的數(shù)據(jù)被分成多種負(fù)載狀態(tài)。
完整的狀態(tài)組包括在參數(shù)估計(jì)步驟中,以在整個(gè)參數(shù)范圍內(nèi),尤其是面臨非線性隊(duì)列效應(yīng)時(shí)盡可能多地獲取數(shù)據(jù)。
假定可得到N種狀態(tài)的數(shù)據(jù),基于在所述實(shí)驗(yàn)中給定的輸入?yún)?shù),ρn,EN,...,每一數(shù)據(jù)提供矩陣HN和約束值XN的估計(jì)。
因此,對于多個(gè)實(shí)驗(yàn)的組的推測問題的目的就是為每一實(shí)驗(yàn)找出參數(shù)的魯棒向量x,x最佳地代表了通過求解逆參數(shù)估算問題而得到的參數(shù),且能夠偵測和排除了無關(guān)的實(shí)驗(yàn)。
min12xTΣn=1NHnx]]>s.t.Anx=bn;n=1,...,Nxk≥0,k=1,...,J×(I+L)上述將所有實(shí)驗(yàn)結(jié)合成單個(gè)最優(yōu)化問題的QP方法可以用于推測相應(yīng)參數(shù),尤其是推測網(wǎng)絡(luò)延遲{njl}項(xiàng)和服務(wù)時(shí)間{sji}項(xiàng)。
參看圖3,示例性示出了本發(fā)明的方法300的具體實(shí)現(xiàn)。模型系統(tǒng)300包括4個(gè)模塊301,303,305和307。每個(gè)模塊采用不同的方法來使得建模過程自動(dòng)化成為可能。模塊301處理數(shù)據(jù)和系統(tǒng)設(shè)置輸入功能。模塊303可以執(zhí)行叢集分析功能從而將在線測量數(shù)據(jù)重組為多種狀態(tài)。模塊305可以執(zhí)行模型建構(gòu)功能,該功能包括建構(gòu)排隊(duì)模型和中心推測引擎(engine)。模塊307可以執(zhí)行性能預(yù)測和成本優(yōu)化功能。每個(gè)模型可以包括軟件和硬件特征以及可以包括軟件模塊,或如上所述可包括由一個(gè)或多個(gè)計(jì)算機(jī)設(shè)備執(zhí)行的算法組。
模塊301可執(zhí)行兩個(gè)初始步驟(i)在模塊312中認(rèn)識所述系統(tǒng)構(gòu)造,(ii)在模塊311中收集在線測量數(shù)據(jù),其包括了端到端延遲測量和每一服務(wù)器利用率數(shù)據(jù),其它度量也可使用。在一實(shí)施例中,模塊303應(yīng)用了叢集分析算法并基于共性將在線測量數(shù)據(jù)組織成多組。在當(dāng)天的時(shí)間,地理位置,事務(wù)發(fā)生速率,處理所述請求的服務(wù)時(shí)間等方面,在不同叢集中的請求可能不同。
接著,模塊305將系統(tǒng)結(jié)構(gòu)映射成通用服務(wù)器網(wǎng)絡(luò)。不同組的請求(歸納的結(jié)果)被映射成多種狀態(tài),其中每種狀態(tài)在服務(wù)器延遲,網(wǎng)絡(luò)延遲等方面可以具有不同的性能。模塊307利用上述的在模塊321中的所述排隊(duì)等式和模塊322中的最優(yōu)化公式推測未知的網(wǎng)絡(luò)和服務(wù)請求參數(shù)。模塊309可以使用部分?jǐn)?shù)據(jù)集來修整模型以及用剩余的數(shù)據(jù)集來驗(yàn)證該模型。事實(shí)上,上述學(xué)習(xí)過程可以重復(fù),隨著更多測量數(shù)據(jù)的獲取,該模型可被改進(jìn)。當(dāng)驗(yàn)證結(jié)果令人滿意并溫定時(shí),性能模型就全面完成了。從而,要獲取有效的性能模型進(jìn)需要獲取優(yōu)化的推測參數(shù)。
一旦有效的性能模型已經(jīng)建立,先前的排隊(duì)公式可用以預(yù)測(在模塊321)性能,優(yōu)化(在模塊322)存在的IT基礎(chǔ)構(gòu)造,并通過配置和操作提出成本-效率結(jié)構(gòu)設(shè)計(jì)。這些功能能夠在模塊321和322中完成。
舉例來說,預(yù)測在不同工作負(fù)載下的性能(假定所預(yù)測的負(fù)載具有期望的未來交易增長),輸入負(fù)載可以插入解析的排隊(duì)公式來獲得在所述預(yù)測負(fù)載下的期望的延遲和資源利用率?;谒鲚敵鲂阅芏攘亢唾Y源利用率度量,本發(fā)明的系統(tǒng)可以決定用現(xiàn)有基礎(chǔ)構(gòu)造可以為每一服務(wù)輸送的服務(wù)品質(zhì)等級,系統(tǒng)瓶頸的位置等。
同樣,來自模塊321的推測模型可以用于理解所述可量測性和分析一系列假設(shè)分析(what-if)情況。例如,為了回答“如果前端服務(wù)器容量翻倍會(huì)怎樣”的問題,僅僅需要修改相應(yīng)的排隊(duì)公式即可。輸出立刻可以提供答案。
在電子商務(wù)環(huán)境中,對于IT規(guī)劃者而言將經(jīng)濟(jì)因素和容量相結(jié)合是很重要的。模塊322進(jìn)一步提供費(fèi)用最優(yōu)化功能,其量化了成本性能平衡。由提供電子商務(wù)系統(tǒng)基礎(chǔ)結(jié)構(gòu)的總成本和容量利用率,能夠計(jì)算每個(gè)事務(wù)的成本,每種服務(wù)的成本,以及支持每一客戶的成本。
現(xiàn)參考圖4,方塊/流程圖示例性示出對具有一個(gè)或多個(gè)的服務(wù)器來執(zhí)行多種事務(wù)的IT系統(tǒng)進(jìn)行性能建模的系統(tǒng)/方法的例子。在模塊402中為要被建模的系統(tǒng)收集和接收系統(tǒng)拓?fù)浜褪聞?wù)流程數(shù)據(jù)。這可包括接收相應(yīng)于所述系統(tǒng)中至少一個(gè)元件的至少一個(gè)模型化的隊(duì)列。
在模塊404中確定所述IT系統(tǒng)的性能測量數(shù)據(jù)。這可包括接收在許多不同情況下的實(shí)際IT系統(tǒng)執(zhí)行的事務(wù)的端到端響應(yīng)時(shí)間。所述情況可以包括來自多個(gè)地理位置,和/或一天多次的或持續(xù)的事務(wù)。持續(xù)的或一天多次的IT系統(tǒng)的在線服務(wù)器利用率可以被接收以被評估從而用于建模。在這種方式中所述模型或多個(gè)模型可以基于要被建模的系統(tǒng)所經(jīng)歷的動(dòng)態(tài)狀況來運(yùn)行。
在模塊406中,基于共性性能測量數(shù)據(jù)被叢集(clusted)成多種狀態(tài)。例如可采用K-MEANS或其它叢集算法。
在模塊408種,基于叢集的數(shù)據(jù)推測服務(wù)命令和網(wǎng)絡(luò)延遲參數(shù)。這可以包括基于叢集的多種狀態(tài)的測量數(shù)據(jù)推測由一個(gè)或多個(gè)服務(wù)器處理的事務(wù)的服務(wù)時(shí)間和來自多個(gè)地理位置的網(wǎng)絡(luò)延遲參數(shù)。所述推測可以包括在模塊409中導(dǎo)出用于性能測量數(shù)據(jù)的等式,并求解這些等式以找到對應(yīng)于在模塊410中的一個(gè)服務(wù)器處理的事務(wù)的服務(wù)時(shí)間的至少一個(gè)值。在模塊412中選擇出服務(wù)時(shí)間的最佳值。
選擇優(yōu)化值(模塊412)的步驟可以包括,在模塊414中求解用叢集的多種狀態(tài)性能測量數(shù)據(jù)用公式表達(dá)的二次規(guī)劃程序(quadraticprogram),在模塊416中比較計(jì)算的性能參數(shù)和接收的性能測量數(shù)據(jù),在模塊418中選擇與最接近于所述性能測量數(shù)據(jù)的所述計(jì)算的性能值相應(yīng)的服務(wù)時(shí)間值。
在另一個(gè)實(shí)施例中,模塊414包括在模塊420中產(chǎn)生一個(gè)IT系統(tǒng)的隨機(jī)多種狀態(tài)排隊(duì)網(wǎng)絡(luò)模型,在模塊422中從該隨機(jī)模型中獲取對應(yīng)于由服務(wù)器處理的事務(wù)的服務(wù)時(shí)間的至少一個(gè)值,以及在模塊424中尋找服務(wù)時(shí)間的最佳值。
已經(jīng)描述了在線性能建模的方法和系統(tǒng)的優(yōu)選實(shí)施例(其意在說明而非限定),該在線性能建模使用了對它所針對的真實(shí)產(chǎn)品的推測,應(yīng)指出本領(lǐng)域的技術(shù)人員可在上述教導(dǎo)下進(jìn)行各種修改和變更。因而應(yīng)明了能夠在所公開的具體實(shí)施例中做出如附加權(quán)利要求所概括的本發(fā)明的范圍和精神之內(nèi)的改變。在根據(jù)專利法要求的細(xì)節(jié)及規(guī)定描述了本發(fā)明的各個(gè)方案后,由所附的權(quán)利要求書限定所要求保護(hù)的或期望由專利證保護(hù)的內(nèi)容。
權(quán)利要求
1.具有一個(gè)或多個(gè)服務(wù)器用于執(zhí)行多種事務(wù)的信息技術(shù)(IT)系統(tǒng)的性能建模方法,包括接收系統(tǒng)拓?fù)浜褪聞?wù)流的數(shù)據(jù);接收所述IT系統(tǒng)性能測量數(shù)據(jù);基于共性把所述性能測量數(shù)據(jù)叢集成多種狀態(tài);以及基于所述叢集的性能測量數(shù)據(jù)推測服務(wù)請求和網(wǎng)絡(luò)延遲參數(shù)。
2.如權(quán)利要求1所述的方法,其中接收系統(tǒng)拓?fù)浜褪聞?wù)流的數(shù)據(jù)包括接收與所述系統(tǒng)的至少一個(gè)組件相對應(yīng)的至少一個(gè)模型化的隊(duì)列。
3.如權(quán)利要求1所述的方法,其中接收性能測量數(shù)據(jù)包括接收在多個(gè)不同情況下實(shí)際IT系統(tǒng)執(zhí)行的事務(wù)的端到端響應(yīng)時(shí)間。
4.如權(quán)利要求3所述的方法,其中所述情形包括從多個(gè)地理位置,和/或在一天中多次或持續(xù)的事務(wù)。
5.如權(quán)利要求1所述的方法,其中接收性能測量數(shù)據(jù)包括持續(xù)或在一天中多次地接收所述IT系統(tǒng)的在線服務(wù)器的利用率。
6.如權(quán)利要求1所述的方法,其中基于所述叢集的性能測量數(shù)據(jù)推測服務(wù)請求和網(wǎng)絡(luò)延遲參數(shù)包括基于所述叢集的多種狀態(tài)性能測量數(shù)據(jù)推測由一個(gè)或多個(gè)服務(wù)器處理的事務(wù)的服務(wù)時(shí)間和來自多個(gè)地理位置的網(wǎng)絡(luò)延遲參數(shù)。
7.如權(quán)利要求1所述的方法,其中基于所述叢集的數(shù)據(jù)推測服務(wù)請求和網(wǎng)絡(luò)延遲參數(shù)包括導(dǎo)出性能測量數(shù)據(jù)的等式;求解所述等式,以找出和一個(gè)所述服務(wù)器處理的事務(wù)的服務(wù)時(shí)間相對應(yīng)的至少一個(gè)值;以及選擇服務(wù)時(shí)間的最佳值。
8.如權(quán)利要求7所述的方法,其中選擇最佳值的所述步驟包括求解采用所述叢集的多種狀態(tài)性能測量數(shù)據(jù)表達(dá)的二次規(guī)劃程序;比較計(jì)算的性能數(shù)據(jù)和所述接收的測量性能數(shù)據(jù);以及選擇與最接近于所述性能測量數(shù)據(jù)的所述計(jì)算的性能數(shù)據(jù)相對應(yīng)的服務(wù)時(shí)間的所述值。
9.如權(quán)利要求1所述的方法,其中所述推測步驟包括產(chǎn)生所述IT系統(tǒng)的隨機(jī)多種狀態(tài)排隊(duì)網(wǎng)絡(luò)模型;從所述隨機(jī)模型得到與服務(wù)器處理的事務(wù)的服務(wù)時(shí)間相對應(yīng)的至少一個(gè)值;以及搜索服務(wù)時(shí)間的最佳值。
10.為具有一個(gè)或多個(gè)服務(wù)器來執(zhí)行多種事務(wù)的信息技術(shù)(IT)系統(tǒng)建模的系統(tǒng),其包括第一模塊,用以接收要模型化的所述IT系統(tǒng)的系統(tǒng)拓?fù)浜褪聞?wù)流數(shù)據(jù)以及性能測量數(shù)據(jù);叢集模塊,其將所述測量數(shù)據(jù)基于共性叢集成多種狀態(tài);以及推測模塊,其基于叢集的數(shù)據(jù)來推測服務(wù)請求和網(wǎng)絡(luò)延遲參數(shù)以形成模型來模擬在多種情況下的所述IT系統(tǒng)的操作和狀況。
11.如權(quán)利要求10所述的系統(tǒng),還包括一個(gè)模塊,其通過準(zhǔn)許多個(gè)參數(shù)變更來執(zhí)行性能預(yù)測和性能優(yōu)化從而改善所述IT系統(tǒng)建模。
12.如權(quán)利要求10所述的系統(tǒng),還包括模型驗(yàn)證模塊,其基于可獲取的數(shù)據(jù)改進(jìn)模型。
全文摘要
具有一個(gè)或多個(gè)服務(wù)器用于執(zhí)行多種事務(wù)的信息技術(shù)IT系統(tǒng)的性能建模方法,包括接收事務(wù)流和系統(tǒng)拓?fù)涞臄?shù)據(jù)以及接收所述IT系統(tǒng)性能測量數(shù)據(jù)。測試數(shù)據(jù)基于共性叢集成多種狀態(tài)?;趨布臄?shù)據(jù)可以推測服務(wù)請求和網(wǎng)絡(luò)延遲參數(shù)。
文檔編號H04L12/26GK1987922SQ20061014702
公開日2007年6月27日 申請日期2006年11月13日 優(yōu)先權(quán)日2005年12月22日
發(fā)明者劉震, 張帆, 夏紅輝, 張俐 申請人:國際商業(yè)機(jī)器公司