合的過(guò)程。二者的比較可W檢驗(yàn)虛擬機(jī)遷移整合收縮的有效性。
[0130] NVUFASA畑:與FASA畑的區(qū)別在于NVUFASA畑沒(méi)有采用垂直擴(kuò)展方式,從而對(duì)比檢 驗(yàn)垂直擴(kuò)展方式的有效性。
[013U NVDFASA畑:與FASA畑的區(qū)別在于NVDFASA畑沒(méi)有采用垂直收縮方式。二者的比 較檢驗(yàn)垂直收縮方式的有效性。
[0132] NBSFASA畑:與FASA畑的區(qū)別在于NBSFASA畑中沒(méi)有采用任務(wù)后移策略,通過(guò)對(duì)比 NBSFASA畑與FASA畑檢驗(yàn)任務(wù)后移策略的有效性。
[0133] eF畑是一種經(jīng)典的依賴任務(wù)容錯(cuò)調(diào)度算法。eF畑采用AsEarlyAs化ssible策 略調(diào)度主副版本。然而,該算法不具備動(dòng)態(tài)調(diào)整資源規(guī)模的能力。
[0134] 我們采用完成率、主機(jī)活動(dòng)時(shí)間與任務(wù)時(shí)間與主機(jī)時(shí)間百分比來(lái)檢驗(yàn)系統(tǒng)的性 能。其中,完成率佑uarantee Ratio, GR)表示能成功完成的依賴任務(wù)組占所有提交任務(wù) 組的百分比;主機(jī)活動(dòng)時(shí)間化ost Active Time, HAT)表示所有活動(dòng)主機(jī)的總開機(jī)時(shí)間,該 指標(biāo)反映了系統(tǒng)的資源開銷情況;任務(wù)時(shí)間與主機(jī)時(shí)間百分比(Ratio of Task time over 化sts time, RTH)表示所有任務(wù)的執(zhí)行時(shí)間的總和與主機(jī)活動(dòng)時(shí)間的比值,該指標(biāo)反映了 系統(tǒng)的資源利用率。
[01巧]首先,我們進(jìn)行基于隨機(jī)合成依賴任務(wù)組值A(chǔ)G)的實(shí)驗(yàn)。為保證實(shí)驗(yàn)的可重復(fù)性, 我們采用仿真模擬的方式測(cè)試上述算法。在本文的模擬實(shí)驗(yàn)中,我們使用了一種在工業(yè)界、 學(xué)術(shù)界常用的云平臺(tái)仿真工具CloudSim。云平臺(tái)中各參數(shù)設(shè)置如下:
[0136] 每臺(tái)主機(jī)的處理能力為1000、1500、2000或3000MIPS,并由1抓PS網(wǎng)絡(luò)互連; 系統(tǒng)中共有四種類型的虛擬機(jī),處理能力分別為250、500、700或1000MIPS ;開啟一臺(tái)主 機(jī)的時(shí)間為90s,創(chuàng)建一臺(tái)虛擬機(jī)的時(shí)間為15s ;依賴任務(wù)組按平均到達(dá)時(shí)間為1/A的 泊松分布到達(dá)云系統(tǒng),1/A在[1/\。,1/\。+2]之間均勻分布。依賴任務(wù)組的截止期設(shè) 定為4.二口, +axef",其中表示該依賴任務(wù)組可能的最短執(zhí)行時(shí)間,a符合均勻 分布U(l. 5, 2. 5)。依賴任務(wù)組按下述步驟生產(chǎn):首先確定依賴任務(wù)組中的任務(wù)數(shù)量NW及依賴關(guān)系的數(shù)量U,本文實(shí)驗(yàn)中假設(shè)U = 4N;依賴任務(wù)組內(nèi)各個(gè)任務(wù)的大小在范圍 [1X105, 2X105]MI內(nèi)均勻分布;在依賴任務(wù)組內(nèi)不產(chǎn)生環(huán)的前提下,隨機(jī)選定各依賴關(guān)系 的前驅(qū)任務(wù)與后繼任務(wù),各依賴關(guān)系所表示的消息的容量大小在[10,l00]MB內(nèi)均勻分布; 根據(jù)依賴任務(wù)組的截止期計(jì)算各任務(wù)的截止期。
[0137] 關(guān)于任務(wù)組數(shù)量對(duì)性能的影響方面,圖6至圖8示出的是FASA畑與6種基準(zhǔn)算法 在隨機(jī)合成依賴任務(wù)組上工作時(shí)的算法性能-依賴任務(wù)組數(shù)量柱形比較圖。具體地,圖6 是GR-count柱形圖;圖7是HAT-count柱形圖;圖8是RTH-count柱形圖。
[0138] 從圖6可W看出,無(wú)論任務(wù)組數(shù)量如何變化,除eFRD外所有算法均能保持一個(gè)較 為穩(wěn)定的完成率。該是由于其他算法充分考慮了云環(huán)境下資源規(guī)模龐大的特征,可根據(jù)任 務(wù)組數(shù)量的變化動(dòng)態(tài)地調(diào)整資源規(guī)模,而eFRD不具備該種在線調(diào)整資源規(guī)模的能力,資源 規(guī)模一定,因此在任務(wù)組數(shù)量增加時(shí),eFRD的完成率下降。由于NOFASARD沒(méi)有采用重疊技 術(shù),副版本需要消耗更多的資源,所W任務(wù)完成率要低于FASARD。此外,我們還可W發(fā)現(xiàn), NBSFASARD的任務(wù)完成率同樣低于FASARD,該說(shuō)明任務(wù)后移策略可W通過(guò)充分利用各個(gè)已 調(diào)度任務(wù)之間的空閑時(shí)間槽,插入新的任務(wù),從而提高系統(tǒng)的可調(diào)度性。值得注意的是,圖 6表明FASARD與NCFASARD具有相近的較高的任務(wù)完成率,對(duì)于FASARD該是由于該算法綜 合采用了重疊、任務(wù)后移策略、資源彈性供給等多種策略,有效地提高了系統(tǒng)的可調(diào)度性; 而對(duì)于NCFASARD,則是由于消耗了更多的計(jì)算資源。
[0139] 圖7則表明,相比除eF畑外的其他算法,F(xiàn)ASA畑始終保持一個(gè)更低的HAT值,該 說(shuō)明FASARD中采用的各項(xiàng)技術(shù)與策略能有效地提高系統(tǒng)的資源利用率。另外,由于沒(méi)有采 用虛擬機(jī)整合收縮方法,NCFASARD算法會(huì)產(chǎn)生大量空閑資源,所W資源開銷最大,特別是隨 著任務(wù)組數(shù)量的增加,資源浪費(fèi)的情況更加明顯。此外,我們還可W發(fā)現(xiàn)NVUFASARD的資源 開銷是除NCFASARD W往的第二高,該是由于該算法無(wú)法通過(guò)垂直擴(kuò)展方式來(lái)容納新的任 務(wù),必須通過(guò)水平擴(kuò)展方式開啟更多的虛擬機(jī),而導(dǎo)致主機(jī)活動(dòng)時(shí)間明顯上升。由于缺少任 務(wù)后移策略,一些任務(wù)無(wú)法插入到各個(gè)空閑的時(shí)間槽內(nèi),致使出現(xiàn)資源浪費(fèi),NBSFASARD的 HAT也較高。隨著任務(wù)組數(shù)量的增加,eF畑的HAT值也出現(xiàn)了一些上升,然而eF畑不具備 資源動(dòng)態(tài)調(diào)整能力,該種上升只是因?yàn)橄到y(tǒng)運(yùn)行的時(shí)間更長(zhǎng)。
[0140] 在圖8中,F(xiàn)ASA畑有最高的RTH值,即資源利用率最高。該再次說(shuō)明FASA畑中融 合的多種技術(shù)與策略可W有效地提高系統(tǒng)的資源利用率。NCFASARD由于沒(méi)有采用資源整 合收縮方法,造成了大量資源浪費(fèi),而導(dǎo)致RTH值偏低,該表明虛擬機(jī)整合收縮對(duì)提高資源 利用率有重要作用。隨著任務(wù)組數(shù)量的增多,前六種算法均由于接收更多的任務(wù)而資源利 用率上升。然而,eFRD的RTH值隨著任務(wù)組數(shù)量的增加,先上升后下降,當(dāng)任務(wù)組數(shù)量從50 增加到100時(shí),更多的任務(wù)組可W被系統(tǒng)接收,而由于主機(jī)數(shù)量固定,主機(jī)活動(dòng)時(shí)間僅少量 增加,因此RTH值上升,而當(dāng)任務(wù)組數(shù)量進(jìn)一步增加時(shí),由于可接收的任務(wù)組數(shù)基本保持不 變,而系統(tǒng)運(yùn)行時(shí)間增加,導(dǎo)致RTH值下降。
[0141] 關(guān)于任務(wù)組到達(dá)率對(duì)性能的影響方面,圖9至圖11示出的是FASA畑與6種基 準(zhǔn)算法在隨機(jī)合成依賴任務(wù)組上工作時(shí)的算法性能-依賴任務(wù)組到達(dá)率柱形比較圖。具 體地,圖9是GR-intervalTime柱形圖;圖10是HAT-intervalTime柱形圖;圖11是 RTH-intervalTime柱形圖。其中,參數(shù)1/A。從W2為步長(zhǎng),從0增加到10。
[0142] 圖9顯示前6種算法由于可W動(dòng)態(tài)調(diào)整資源規(guī)模,因此任務(wù)完成率均高于eFRD。 隨著1/A。的增加,前六種算法的完成率均略有增加,該是由于當(dāng)?shù)竭_(dá)間隔時(shí)間較短時(shí),系 統(tǒng)負(fù)載較重,擴(kuò)展資源需要主機(jī)開機(jī)時(shí)間、虛擬機(jī)創(chuàng)建時(shí)間等額外的調(diào)整時(shí)間,導(dǎo)致大量任 務(wù)無(wú)法在截止前完成而被拒絕。相對(duì)應(yīng)的,當(dāng)間隔時(shí)間邊長(zhǎng)時(shí),系統(tǒng)有較為充裕的時(shí)間進(jìn)行 資源擴(kuò)展,更多的任務(wù)可W在截止期內(nèi)成功完成。同時(shí),F(xiàn)ASARD與NCFASARD有更高的完成 率,原因與圖6中的類似。從圖9還可W看出,由于無(wú)法動(dòng)態(tài)擴(kuò)展資源規(guī)模,eFRD的任務(wù)完 成率較低。
[0143] 從圖10我們可W發(fā)現(xiàn),F(xiàn)ASA畑始終在前六種算法中保持最低的HAT值,該又一次 說(shuō)明FASARD中所用的各種技術(shù)與策略的有效性。當(dāng)間隔時(shí)間變長(zhǎng)是,NCFASARD與其他算法 之間在資源開銷上的差別變得更加明顯,該說(shuō)明缺少虛擬機(jī)整合收縮方法會(huì)在間隔時(shí)間變 長(zhǎng)時(shí)明顯導(dǎo)致更多的資源開銷。此外,當(dāng)1/ A。為0時(shí),NOFASARD的HAT值也較高,該是由 于當(dāng)大量任務(wù)組幾乎同時(shí)涌入系統(tǒng)時(shí),缺乏重疊技術(shù)會(huì)導(dǎo)致副版本的資源開銷顯著增大, 系統(tǒng)必須通過(guò)開啟更多的主機(jī)才能應(yīng)對(duì)該種過(guò)載情況。同時(shí),我們還可W發(fā)現(xiàn),隨著間隔時(shí) 間的增大,由于接收任務(wù)數(shù)量增多,系統(tǒng)運(yùn)行時(shí)間更長(zhǎng),eFRD的HAT值也略有上升。
[0144] 圖11顯示,隨著間隔時(shí)間的變化,F(xiàn)ASA畑的RTH值始終保持最高,表明FASA畑在 不同的任務(wù)到達(dá)情況下,均能有效地提高系統(tǒng)的資源利用率。而NCFASARD與eFRD的RTH 值在4到10之間下降,該是由于NCFASARD沒(méi)有采用整合收縮方式,eFRD無(wú)法動(dòng)態(tài)調(diào)整資 源規(guī)模,因此在系統(tǒng)負(fù)載變輕時(shí)出現(xiàn)更多的資源浪費(fèi),導(dǎo)致資源利用率下降。
[0145] 關(guān)于任務(wù)組截止期對(duì)性能的影響方面,圖12至圖14示出的是FASA畑與6種基準(zhǔn) 算法在隨機(jī)合成依賴任務(wù)組上工作時(shí)的算法性能-依賴任務(wù)組截止期柱形比較圖。具體 地,圖12是GR-a柱形圖;圖13是HAT-a柱形圖;圖14是RTH-a柱形圖。其中,確定截 止期的參數(shù)a W 0. 2為步長(zhǎng),從1. 5變化到2. 5。
[0146] 從圖12可W看出,截止期對(duì)各算法的完成率均有顯著的影響。當(dāng)截止期非常緊張 時(shí)(如,a = 1. 5),由于系統(tǒng)無(wú)法在短時(shí)間內(nèi)完成資源擴(kuò)展,大多數(shù)任務(wù)組都被拒絕。然而, 當(dāng)截止期變得寬松時(shí),前6種算法幾乎可W接收所有任務(wù)組。值得注意的是,當(dāng)截止期非常 緊張時(shí),NVUFASARD的完成率明顯低于除eFRD W外的所有算法,該是由于垂直擴(kuò)展方式可 W在短時(shí)間內(nèi)完成計(jì)算資源的擴(kuò)展,響應(yīng)系統(tǒng)變化的能力更強(qiáng),我們可W認(rèn)為,缺乏垂直擴(kuò) 展能力時(shí),系統(tǒng)的可調(diào)度性將大大惡化,特別是在任務(wù)截止期非常緊張的情況下。此外,由 于無(wú)法動(dòng)態(tài)調(diào)整資源規(guī)模,我們?cè)僖淮伟l(fā)現(xiàn)eFRD的任務(wù)完成率最低。
[0147] 圖13顯示,隨著a的增加,所有算法的HAT值都隨之增加。該是由于當(dāng)a增加 時(shí),系統(tǒng)可W接納更多的任務(wù)組,需要更多的主機(jī)時(shí)間來(lái)執(zhí)行該些任務(wù)。值得注意的是, NCFASARD的HAT值的上升速度明顯快于其他算啊,該表明當(dāng)截止期變寬松時(shí),NCFASARD由 于無(wú)法充分利用已有資源,必須消耗更多的計(jì)算資源。此外,NVDFASA畑的HAT值僅次于 NCFASARD,該是由于當(dāng)截止期變寬松時(shí),NVDFASARD缺少垂直收縮方式,無(wú)法及時(shí)縮小閑置 的資源,造成了一定的資源浪費(fèi)。
[0148] FASA畑的優(yōu)勢(shì)在圖14中再一次得到展現(xiàn)。當(dāng)截止期非常緊張時(shí)(a = 1.5), NCFASARD與NVDFASARD同樣具有較高的RTH值。該是由于在該種情況下,系統(tǒng)過(guò)載,很少會(huì) 收縮計(jì)算資源規(guī)模,因此缺少虛擬機(jī)整合收縮方法與垂直收縮方式并不會(huì)對(duì)系統(tǒng)的資源利 用率造成很大影響。然而,當(dāng)截止期變得寬松時(shí),NCFASARD與NVDFASARD的資源利用率明 顯劣于其他算法。eFRD的RTH值在截止期非常緊張時(shí)同樣比較高,該是由于系統(tǒng)中幾乎所 有資源都被使用了,而當(dāng)截止期變得寬松時(shí),出現(xiàn)閑置的計(jì)算資源,RTH值下降。
[0149] 完成了基于隨機(jī)合成依賴任務(wù)組值A(chǔ)G)的實(shí)驗(yàn)之后,我們進(jìn)一步進(jìn)行基于真實(shí)依 賴任務(wù)組的實(shí)驗(yàn)。為了檢驗(yàn)本文所提出的算法在真實(shí)應(yīng)用下的可行性,我們基于5種真實(shí) 應(yīng)用:LIGO,Montage,切berShake,Epegenomics與SIPHT進(jìn)一步開展實(shí)驗(yàn)。對(duì)于每種應(yīng)用, 我們使用Wo