本發(fā)明涉及計(jì)算機(jī)的
技術(shù)領(lǐng)域:
,特別是涉及一種基于云計(jì)算環(huán)境的節(jié)約帶寬資源租賃成本的方法。
背景技術(shù):
:傳統(tǒng)的互聯(lián)網(wǎng)應(yīng)用不僅需要完成軟件開發(fā)工作,還需要進(jìn)行購買服務(wù)器或租賃服務(wù)器、部署運(yùn)行環(huán)境、尋找托管環(huán)境、維護(hù)服務(wù)器和應(yīng)用、均衡用戶負(fù)載、解決性能瓶頸和服務(wù)器擴(kuò)展等諸多繁瑣復(fù)雜的工作。云計(jì)算技術(shù)能夠解決這些繁復(fù)的后續(xù)工作,減輕開發(fā)者的負(fù)擔(dān),故而成為現(xiàn)今部署和運(yùn)行網(wǎng)絡(luò)應(yīng)用的一個重要平臺選擇。通常,互聯(lián)網(wǎng)應(yīng)用開發(fā)者租用這些云計(jì)算公司提供的虛擬機(jī),在虛擬機(jī)上運(yùn)行其開發(fā)的軟件。在租賃虛擬機(jī)時需要租戶提供所需要的資源大小,比如CPU個數(shù)、存儲空間、帶寬的大小以及其他諸如負(fù)載均衡、數(shù)據(jù)庫等增值服務(wù)。租戶需要按照所租賃資源的個數(shù)以及時間長短來付費(fèi)。目前,國外的亞馬遜的AWS、國內(nèi)的阿里云、青云提供的虛擬機(jī)服務(wù)等都是按照類似的策略計(jì)費(fèi)。在人們使用互聯(lián)網(wǎng)應(yīng)用的過程中,當(dāng)網(wǎng)絡(luò)流量巨大而帶寬資源不足時,服務(wù)請求的延遲和丟包率會相應(yīng)增加,嚴(yán)重影響用戶體驗(yàn)。因此開發(fā)者盡可能租賃更多的帶寬來保證服務(wù)質(zhì)量。但是,人們使用互聯(lián)網(wǎng)應(yīng)用產(chǎn)生的流量多少是動態(tài)多變的。當(dāng)流量很少所需的帶寬資源也少時,租賃太多的資源顯然使得資源利用率很低,造成不必要的成本開支。因此,預(yù)估未來帶寬資源需求并進(jìn)行適時調(diào)整,是一種節(jié)約帶寬資源租賃成本的思路。技術(shù)實(shí)現(xiàn)要素:鑒于以上所述現(xiàn)有技術(shù)的缺點(diǎn),本發(fā)明的目的在于提供一種基于云計(jì)算環(huán)境的節(jié)約帶寬資源租賃成本的方法,通過使用ARIMA模型來預(yù)測下一時刻的流量的期望值,進(jìn)而確定下次所要租賃的帶寬值,從而減少帶寬資源租賃的成本,同時保證服務(wù)質(zhì)量不受影響。為實(shí)現(xiàn)上述目的及其他相關(guān)目的,本發(fā)明提供一種基于云計(jì)算環(huán)境的節(jié)約帶寬資源租賃成本的方法,包括以下步驟:步驟S1、獲取歷史的流量數(shù)據(jù);步驟S2、根據(jù)所述歷史的流量數(shù)據(jù)預(yù)測下一時刻流量的均值和標(biāo)準(zhǔn)差;步驟S3、根據(jù)下一時刻流量的均值和標(biāo)準(zhǔn)差,確定下次所要租賃的帶寬值。根據(jù)上述的基于云計(jì)算環(huán)境的節(jié)約帶寬資源租賃成本的方法,其中:所述步驟S1中,每 隔一定的時間間隔,統(tǒng)計(jì)流量的均值,生成流量的時間序列,以獲取歷史的流量數(shù)據(jù)。根據(jù)上述的基于云計(jì)算環(huán)境的節(jié)約帶寬資源租賃成本的方法,其中:所述步驟S2包括以下步驟:21)判斷流量的時間序列是否為平穩(wěn)序列,若是,轉(zhuǎn)入23);若否,轉(zhuǎn)入22);22)對流量的時間序列做若干次差分處理,使之成為平穩(wěn)序列;23)進(jìn)行ARIMA(r,d,m)模型的參數(shù)估計(jì),其中AR表示自回歸,r表示自回歸項(xiàng)數(shù),MA表示滑動平均,m表示滑動平均項(xiàng)數(shù),d表示使時間序列成為平穩(wěn)序列所作的差分階數(shù);24)構(gòu)建ARIMA(r,d,m)模型;25)根據(jù)ARIMA(r,d,m)模型,預(yù)測下一時刻流量的均值和標(biāo)準(zhǔn)差。進(jìn)一步地,根據(jù)上述的基于云計(jì)算環(huán)境的節(jié)約帶寬資源租賃成本的方法,其中:ARIMA模型表示為:▿dXt=φ(B)▿dXt+Zt+θ(B)Zt]]>其中,Xt表示要分析的時間序列,φ(B)和θ(B)分別表示AR(r)模型中的r次多項(xiàng)式和MA(m)模型中的m次多項(xiàng)式,B表示后向移位算子,Zt表示服從均值為0,方差為的高斯分布,表示進(jìn)行d次差分處理。進(jìn)一步地,根據(jù)上述的基于云計(jì)算環(huán)境的節(jié)約帶寬資源租賃成本的方法,其中:ARIMA(r,d,m)的階數(shù)m和r從的自相關(guān)函數(shù)和偏自相關(guān)函數(shù)圖形中觀察拖尾和截尾的特征來確定。進(jìn)一步地,根據(jù)上述的基于云計(jì)算環(huán)境的節(jié)約帶寬資源租賃成本的方法,其中:步驟23)中,選取使AIC函數(shù)取值最小時所對應(yīng)的r和m。進(jìn)一步地,根據(jù)上述的基于云計(jì)算環(huán)境的節(jié)約帶寬資源租賃成本的方法,其中:ARIMA模型支持單步預(yù)測和k步預(yù)測;所述k步預(yù)測是通過遞歸使用單步預(yù)測實(shí)現(xiàn)的。根據(jù)上述的基于云計(jì)算環(huán)境的節(jié)約帶寬資源租賃成本的方法,其中:所述步驟S3中,采用μ+θσ數(shù)值作為下次所要租賃的帶寬值;其中,θ為可選參數(shù),μ和σ分別為下一時刻流量的均值和標(biāo)準(zhǔn)差。進(jìn)一步地,根據(jù)上述的基于云計(jì)算環(huán)境的節(jié)約帶寬資源租賃成本的方法,其中:θ=2。如上所述,本發(fā)明的基于云計(jì)算環(huán)境的節(jié)約帶寬資源租賃成本的方法,具有以下有益效果:(1)有效提高了資源利用率;(2)降低了帶寬資源租賃成本;(3)保證一定的服務(wù)質(zhì)量指數(shù)。附圖說明圖1顯示為本發(fā)明的基于云計(jì)算環(huán)境的節(jié)約帶寬資源租賃成本的方法的流程圖;圖2顯示為本發(fā)明的基于云計(jì)算環(huán)境的節(jié)約帶寬資源租賃成本的仿真結(jié)果示意圖。具體實(shí)施方式以下通過特定的具體實(shí)例說明本發(fā)明的實(shí)施方式,本領(lǐng)域技術(shù)人員可由本說明書所揭露的內(nèi)容輕易地了解本發(fā)明的其他優(yōu)點(diǎn)與功效。本發(fā)明還可以通過另外不同的具體實(shí)施方式加以實(shí)施或應(yīng)用,本說明書中的各項(xiàng)細(xì)節(jié)也可以基于不同觀點(diǎn)與應(yīng)用,在沒有背離本發(fā)明的精神下進(jìn)行各種修飾或改變。需要說明的是,本實(shí)施例中所提供的圖示僅以示意方式說明本發(fā)明的基本構(gòu)想,遂圖式中僅顯示與本發(fā)明中有關(guān)的組件而非按照實(shí)際實(shí)施時的組件數(shù)目、形狀及尺寸繪制,其實(shí)際實(shí)施時各組件的型態(tài)、數(shù)量及比例可為一種隨意的改變,且其組件布局型態(tài)也可能更為復(fù)雜。在本發(fā)明的本發(fā)明的基于云計(jì)算環(huán)境的節(jié)約帶寬資源租賃成本的方法中,按需調(diào)整帶寬租賃大小的關(guān)鍵問題是如何預(yù)估未來時刻流量帶寬的需求,以及如何根據(jù)預(yù)測值在保證服務(wù)質(zhì)量的同時,確定下一段時間內(nèi)該該租用多大的帶寬。參照圖1,本發(fā)明的基于云計(jì)算環(huán)境的節(jié)約帶寬資源租賃成本的方法包括以下步驟:步驟S1、獲取歷史的流量數(shù)據(jù)。具體地,通過在虛擬機(jī)中使用Ganglia、nProbe等流量分析程序統(tǒng)計(jì)帶寬資源使用情況,生成流量的時間序列。優(yōu)選地,可每隔一定的時間間隔,統(tǒng)計(jì)流量的均值,并寫入文件系統(tǒng)進(jìn)行記錄。步驟S2、使用ARIMA模型,根據(jù)歷史的流量數(shù)據(jù)預(yù)測下一時刻流量的均值和標(biāo)準(zhǔn)差。具體地,本發(fā)明使用時間序列分析技術(shù)實(shí)現(xiàn)未來時刻流量需求的預(yù)測。長相關(guān)性、短相關(guān)性、大時間尺度下的自相似性以及小時間尺度下的多重分形性是網(wǎng)絡(luò)流量重要的統(tǒng)計(jì)特征。差分整合移動平均自回歸模型(AutoregressiveIntegratedMovingAverageModel,ARIMA)能夠提供較好的數(shù)學(xué)模型,在對流量建立合理的模型之后可進(jìn)行未來時刻流量需求的預(yù)測。ARIMA模型的基本思想是:將預(yù)測對象隨時間推移而形成的數(shù)據(jù)序列視為一個隨機(jī)序列,用一定的數(shù)學(xué)模型來近似描述這個序列。這個模型一旦被識別后就可以從時間序列的過去值及現(xiàn)在值來預(yù)測未來值。具體地,步驟S2包括以下步驟:21)判斷流量的時間序列是否為平穩(wěn)序列,若是,轉(zhuǎn)入23);若否,轉(zhuǎn)入22)。22)對流量的時間序列若干次差分處理,使之成為平穩(wěn)序列。在ARIMA(r,d,m)模型中,AR表示自回歸,r表示自回歸項(xiàng)數(shù),MA表示滑動平均,m表示滑動平均項(xiàng)數(shù),d表示使時間序列成為平穩(wěn)序列所作的差分階數(shù)。ARIMA模型適用于平穩(wěn)的時間序列,對于非平穩(wěn)的隨機(jī)過程,則要通過多次差分直到序列達(dá)到平穩(wěn),而差分的次數(shù)為參數(shù)d的取值。具體地,設(shè)定其中,Xt表示要分析的時間序列,Yt表示Xt經(jīng)過d次差分后的序列。當(dāng)d=1時,Yt=Xt-Xt-1當(dāng)d=2時,Yt=(Xt-Xt-1)-(Xt-1-Xt-2)以此類推,即可獲得Xt經(jīng)過任意次差分后的序列。23)進(jìn)行ARIMA(r,d,m)模型的參數(shù)估計(jì)。ARIMA模型可以表示為:▿dXt=φ(B)▿dXt+Zt+θ(B)Zt]]>其中,φ(B)和θ(B)分別表示AR(r)模型中的r次多項(xiàng)式和MA(m)模型中的m次多項(xiàng)式,B表示后向移位算子,即BjXt=Xt-j。Zt為服從均值為0,方差為的高斯分布,即表示進(jìn)行d次差分處理。具體地,需要確定ARIMA(r,d,m)模型的階數(shù),然后對模型的各個參數(shù)進(jìn)行估計(jì),即確定φ(B)、θ(B)等多項(xiàng)式的系數(shù)。ARIMA(r,d,m)的階數(shù)m和r可以從的自相關(guān)函數(shù)(ACF)和偏自相關(guān)函數(shù)(PACF)圖形中觀察拖尾和截尾的特征來確定。具體地,流量的時間序列經(jīng)過平穩(wěn)化處理后,ARIMA(r,d,m)模型的選擇與自相關(guān)函數(shù)和偏自相關(guān)函數(shù)性質(zhì)關(guān)系如表1所示。表1、ARIMA(r,d,m)模型選擇與ACF/PACF關(guān)系A(chǔ)CF拖尾m階截尾拖尾PACFr階截尾拖尾拖尾選擇模型AR(r)MA(m)ARMA(r,m)其中,自回歸AR(r)模型可表示為:Xt=Σi=1rφi×iXt-i+Zt=φ(B)Xt+Zt,]]>其中φ(B)表示r次多項(xiàng)式,B表示后向移位算子?;瑒悠骄鵐A(m)模型表示為:其中θ(B)表示m次多項(xiàng)式。ARMA(r,m)是d為0時的ARIMA(r,d,m)模型。對于計(jì)算機(jī)定階,一般采用AIC、BIC準(zhǔn)則定階,也就是排列組合所有可能的r和m,通過AIC函數(shù)得到的值越小,那么說明那一組r和m最好,故選取對應(yīng)的r和m。在上述模型識別的基礎(chǔ)上,進(jìn)行參數(shù)估計(jì),通過樣本矩估計(jì)法、極大似然法等確定模型中的各未知系數(shù):▿dXt=φ(B)▿dXt+Zt+θ(B)Zt,]]>其中至此,完成了ARIMA模型中的參數(shù)估計(jì)。24)構(gòu)建ARIMA(r,d,m)模型。25)根據(jù)ARIMA(r,d,m)模型,預(yù)測下一時刻流量的均值μ和標(biāo)準(zhǔn)差σ。具體地,建立了ARIMA模型之后,可以預(yù)測未來一個時間序列點(diǎn)的流量數(shù)學(xué)期望。ARIMA模型支持單步預(yù)測,也支持k步預(yù)測。k步預(yù)測是通過遞歸使用單步預(yù)測實(shí)現(xiàn)的。其中,預(yù)測值會包括下一時刻流量均值μ和標(biāo)準(zhǔn)差σ。步驟S3、根據(jù)下一時刻流量的均值和標(biāo)準(zhǔn)差,確定下次所要租賃的帶寬值。具體地,采用μ+θσ數(shù)值作為下次所要租賃的帶寬值。其中,θ為可選參數(shù)。根據(jù)不同互聯(lián)網(wǎng)應(yīng)用對服務(wù)質(zhì)量的不同要求,選取不同的θ取值。以統(tǒng)計(jì)中常見的3σ原則為例,當(dāng)θ=2時,可以保證實(shí)際帶寬以95.44%的概率不超過預(yù)留帶寬,落在置信區(qū)間[μ-2σ,μ+2σ]中。因此,優(yōu)選地,可以將此區(qū)間的上界μ+2σ作為帶寬預(yù)留值,即θ=2。下面根據(jù)具體實(shí)驗(yàn)來測試本發(fā)明的基于云計(jì)算環(huán)境的節(jié)約帶寬資源租賃成本的方法的技術(shù)效果。具體地,采用歐洲某大學(xué)監(jiān)測到的Dropbox應(yīng)用流量公開數(shù)據(jù)進(jìn)行模擬仿真。該公開數(shù)據(jù)包含了從4個監(jiān)測點(diǎn)監(jiān)測到的2012年3月24日至2012年5月5日期間的Dropbox應(yīng)用相關(guān)網(wǎng)絡(luò)流量日志。該數(shù)據(jù)經(jīng)過匿名化處理保護(hù)用戶的隱私。原始數(shù)據(jù)是由Tsat開源工具截取的與Dropbox應(yīng)用相關(guān)的所有TCP數(shù)據(jù)包相關(guān)信息。由于該流量日志數(shù)據(jù)比較小,故將2012年3月24日至2012年5月5日之間所有監(jiān)測數(shù)據(jù)歸并為一天的流量數(shù)據(jù)用于實(shí)驗(yàn),每10分鐘統(tǒng)計(jì)一次平均流量,生成流量的時間序列,采用ARIMA(0,1,1)模型預(yù)測網(wǎng)絡(luò)流,如圖2所示。由圖2可知,只有1.19%的預(yù)留值小于真實(shí)值;預(yù)留值比真實(shí)值平均多了30%。預(yù)留值能夠隨著實(shí)際值進(jìn)行波動,若采用固定的帶寬預(yù)留方式,那么至少應(yīng)預(yù)留80Mbps才不會顯著影響應(yīng)用的服務(wù)質(zhì)量。由上可知,根據(jù)藍(lán)線申請帶寬資源,相對于固定80Mpbs的方式,有效提高了資源利用率,降低了資源租賃成本。綜上所述,本發(fā)明的基于云計(jì)算環(huán)境的節(jié)約帶寬資源租賃成本的方法在保證一定的服務(wù)質(zhì)量指數(shù)的前提下,有效提高了資源利用率,降低了帶寬資源租賃成本。所以,本發(fā)明有效 克服了現(xiàn)有技術(shù)中的種種缺點(diǎn)而具高度產(chǎn)業(yè)利用價值。上述實(shí)施例僅例示性說明本發(fā)明的原理及其功效,而非用于限制本發(fā)明。任何熟悉此技術(shù)的人士皆可在不違背本發(fā)明的精神及范疇下,對上述實(shí)施例進(jìn)行修飾或改變。因此,舉凡所屬
技術(shù)領(lǐng)域:
中具有通常知識者在未脫離本發(fā)明所揭示的精神與技術(shù)思想下所完成的一切等效修飾或改變,仍應(yīng)由本發(fā)明的權(quán)利要求所涵蓋。當(dāng)前第1頁1 2 3