一種基于萬有引力搜索模型的副本替換方法
【專利摘要】本發(fā)明公開了一種基于萬有引力搜索模型的副本替換方法:步驟1:獲得最近T時間段內(nèi)文件的副本文件被訪問記錄;步驟2:獲得文件所在節(jié)點(diǎn)與副本文件所在節(jié)點(diǎn)之間最大網(wǎng)絡(luò)帶寬及副本文件訪問時間;步驟3:當(dāng)存儲節(jié)點(diǎn)的文件被訪問后,得到新的副本文件,判斷該節(jié)點(diǎn)上是否至少有一個副本文件,是則執(zhí)行步驟4,否則執(zhí)行步驟5;步驟4:計算該文件的所有副本文件的替換價值,判斷新的副本文件的大小是否小于替換價值最小的副本文件與該存儲節(jié)點(diǎn)的剩余存儲空間之和,是則替換價值最小的副本文件;步驟5:判斷該存儲節(jié)點(diǎn)的剩余存儲空間是否大于新的副本文件的大小,存儲將新的副本文件。該方法能夠提高系統(tǒng)副本管理能力,優(yōu)化網(wǎng)絡(luò)存儲系統(tǒng)整體性能。
【專利說明】一種基于萬有引力搜索模型的副本替換方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及ー種副本替換方法,具體是ー種基于萬有引力搜索模型的副本替換方法。
【背景技術(shù)】
[0002]在海量網(wǎng)絡(luò)存儲系統(tǒng)中,由于存儲節(jié)點(diǎn)多而雜,而且存儲網(wǎng)絡(luò)存在異構(gòu)性,使得各個存儲節(jié)點(diǎn)在性能和可靠性上不盡相同,系統(tǒng)需要合理的管理這些節(jié)點(diǎn),協(xié)調(diào)它們的工作,盡量使用大量價格低廉的存儲設(shè)備按一定的規(guī)則組合成一個可靠性較強(qiáng)、可用性較高的存儲系統(tǒng),因此需要創(chuàng)建文件副本。
[0003]副本管理技術(shù)是海量網(wǎng)絡(luò)存儲系統(tǒng)中保證數(shù)據(jù)可用性和可靠性的重要技術(shù),其用于避免由于個別存儲節(jié)點(diǎn)的網(wǎng)絡(luò)故障或機(jī)器故障等不可預(yù)知的情況而造成文件的不可訪問或丟失。因此,從理論上分析文件副本越多,則系統(tǒng)和文件的可用性及可靠性就越高;但是,副本的數(shù)量即副本冗余度的増加會消耗更多的系統(tǒng)資源如存儲空間,并且隨著副本數(shù)量的増加,為了更新副本,保持副本的一致性,也將會占用一定的網(wǎng)絡(luò)資源,勢必會加重網(wǎng)絡(luò)帶寬的負(fù)擔(dān)。因此,副本管理過程要權(quán)衡上述兩方面。副本數(shù)量的管理是在適當(dāng)?shù)臅r間、合適的節(jié)點(diǎn)創(chuàng)建或刪除對應(yīng)的副本,可明顯地提高數(shù)據(jù)文件的訪問速度以及降低網(wǎng)絡(luò)資源的消耗和系統(tǒng)的負(fù)載均衡。海量網(wǎng)絡(luò)存儲系統(tǒng)中,副本選擇策略可提高系統(tǒng)的響應(yīng)時間、降低網(wǎng)絡(luò)的時間延遲和帶寬消耗,從而提高數(shù)據(jù)文件的訪問速度。
[0004]副本替換是副本管理技術(shù)中的ー種手段,由于文件副本數(shù)量的增加,不但占用了存儲節(jié)點(diǎn)中的大量存儲空間,而且加大了系統(tǒng)對副本管理和維護(hù)的開銷,因此必須要適當(dāng)?shù)剡M(jìn)行副本替換。副本替換的好壞會對存儲系統(tǒng)的性能產(chǎn)生直接的影響。副本替換一般有以下兩種情況:(I)創(chuàng)建副本之初,如果存儲節(jié)點(diǎn)上沒有足夠的空間來存儲,新的副本文件,這時需要存儲系統(tǒng)調(diào)用副本替換策略,刪除舊的文件副本;(2)需要定期進(jìn)行副本替換來實(shí)現(xiàn)對系統(tǒng)中文件副本進(jìn)行更新,舊版本的文件副本需要刪除。
[0005]當(dāng)存儲節(jié)點(diǎn)中剩余的存儲空間不足以存儲新副本的時候,如何選擇ー個新的副本來替換舊的副本?傳統(tǒng)的副本替換方法通常采用操作系統(tǒng)的頁面置換算法的操作方式。傳統(tǒng)的副本替換方法一般只適應(yīng)于単一網(wǎng)絡(luò)存儲環(huán)境下,其無法適應(yīng)海量信息網(wǎng)絡(luò)存儲環(huán)境(系統(tǒng)),對數(shù)據(jù)文件的讀取速度較慢,且常常陷入局部最優(yōu)值,無法在海量存儲整體環(huán)境中找到最優(yōu)的替換的副本文件。這是由于以下幾個原因:1)海量存儲環(huán)境中的存儲節(jié)點(diǎn)更多,存儲節(jié)點(diǎn)覆蓋范圍更廣;2)存儲的副本文件不僅僅放在單ー網(wǎng)絡(luò)系統(tǒng)中,而可能分布在不同的網(wǎng)絡(luò)系統(tǒng)中,因此具有更高的動態(tài)性;3)文件訪問時延、網(wǎng)絡(luò)帶寬和硬件的配置等。
[0006]因此,研究一種能夠有效降低文件訪問時間的副本替換方法,對于提高系統(tǒng)副本管理能力,達(dá)到優(yōu)化系統(tǒng)的整體性能是十分有必要的。
[0007]Esmat Rashedi和H.Nezamabadrpour等人于2009年提出一種源于對物理學(xué)中的牛頓萬有引力定律進(jìn)行模擬的優(yōu)化捜索技術(shù),即引力捜索算法(GSA),它與粒子群算法相似,是ー種元啟發(fā)式算法,它通過群體中各粒子之間的萬有引力相互作用產(chǎn)生的群體智能指導(dǎo)優(yōu)化捜索,以達(dá)到節(jié)約網(wǎng)絡(luò)資源,提高系統(tǒng)服務(wù)性能的目的。萬有引力是自然界4種基礎(chǔ)的カ之一,粒子在萬有引力的作用下相互之間不斷地靠近,在自然界中,每ー個里粒子都會和其他的所有粒子相互吸引,對于兩個相互分離的粒子,它們相互之間的萬有引力是沒有間隔和延遲的。
【發(fā)明內(nèi)容】
[0008]針對目前海量存儲中因用戶數(shù)量、數(shù)據(jù)類型以及網(wǎng)絡(luò)環(huán)境復(fù)雜而引起對數(shù)據(jù)文件的讀取速度較慢,導(dǎo)致系統(tǒng)整體服務(wù)性能降低、浪費(fèi)部分網(wǎng)絡(luò)資源的問題,本發(fā)明的目的在于,提供一種基于萬有引力捜索模型的副本替換算法(GMRA),該方法根據(jù)海量網(wǎng)絡(luò)存儲的副本替換的特點(diǎn)及萬有引力捜索算法的特性而提出,實(shí)現(xiàn)對數(shù)據(jù)文件讀取請求快速響應(yīng)。本發(fā)明在海量網(wǎng)絡(luò)存儲環(huán)境下,采用萬有引力捜索模型有效地對系統(tǒng)進(jìn)行負(fù)載均衡,降低文件訪問時間,降低網(wǎng)絡(luò)帶寬的消耗和數(shù)據(jù)訪問的延遲,使用本發(fā)明的方法能夠提高副本管理能力,達(dá)到優(yōu)化海量信息網(wǎng)絡(luò)存儲系統(tǒng)的整體性能的目的。
[0009]為了實(shí)現(xiàn)上述任務(wù),本發(fā)明采用如下的技術(shù)方案予以解決:
[0010]一種基于萬有引力捜索模型的副本替換方法,具體包括如下步驟:
[0011]步驟1:獲得最近T時間段內(nèi)文件f的所有副本文件も的被訪問記錄,并將訪問記錄存儲在多維關(guān)系索引表中;每條訪問記錄包括:最近T時間段內(nèi)副本文件も被訪問次數(shù)t、副本文件も所在節(jié)點(diǎn)位置、副本文件も的大小Si ;
[0012]步驟2:根據(jù)多維關(guān)系索引表中的索引地址,找到步驟I中文件f的所有副本文件各自所在的節(jié)點(diǎn),井分別獲得文件f所在節(jié)點(diǎn)與它的每個副本文件所在節(jié)點(diǎn)之間的最大網(wǎng)絡(luò)帶寬Bi及每個副本文件的訪問時間Tvt ;
[0013]步驟3:當(dāng)某存儲節(jié)點(diǎn)上的某文件f被訪問后,得到該文件f的新的副本文件,此處的訪問是指用戶對文件的寫操作。
[0014]如果在文件f被訪問前,該存儲節(jié)點(diǎn)上存有文件f的至少ー個副本文件,執(zhí)行步驟
4;否則執(zhí)行步驟5 ;
[0015]步驟4:判斷步驟3得到的新的副本文件的大小是否大于原有的所有副本文件與該存儲節(jié)點(diǎn)的剩余存儲空間之和,如果是,則將新的副本文件刪除;否則,利用式3分別計算該文件f?的所有副本文件的替換價值,并按照替換價值將副本文件升序排列;此時,判斷新的副本文件的大小是否小于替換價值最小的副本文件與該存儲節(jié)點(diǎn)的剩余存儲空間之和,是則用新的副本文件替換替換價值最小的副本文件,否則,比較新的副本文件的大小是否小于替換價值最小的兩個副本文件與該存儲節(jié)點(diǎn)的剩余存儲空間之和,是則用新的副本文件替換該替換價值最小的兩個副本文件,否則增加副本文件的個數(shù)繼續(xù)判斷并刪除原有的副本文件,直到將新的副本文件存入該存儲節(jié)點(diǎn);
[0016]
【權(quán)利要求】
1.一種基于萬有引力捜索模型的副本替換方法,其特征在于,具體包括如下步驟: 步驟1:獲得最近T時間段內(nèi)文件f的所有副本文件も的被訪問記錄,并將訪問記錄存儲在多維關(guān)系索引表中;每條訪問記錄包括:最近T時間段內(nèi)副本文件も被訪問次數(shù)t、副本文件も所在節(jié)點(diǎn)位置、副本文件も的大小Si ; 步驟2:根據(jù)多維關(guān)系索引表中的索引地址,找到步驟I中文件f的所有副本文件各自所在的節(jié)點(diǎn),井分別獲得文件f?所在節(jié)點(diǎn)與它的每個副本文件所在節(jié)點(diǎn)之間的最大網(wǎng)絡(luò)帶寬Bi及每個副本文件的訪問時間Tvt ; 步驟3:當(dāng)某存儲節(jié)點(diǎn)上的某文件f被訪問后,得到該文件f的新的副本文件,此處的訪問是指用戶對文件的寫操作。 如果在文件f被訪問前,該存儲節(jié)點(diǎn)上存有文件f的至少ー個副本文件,執(zhí)行步驟4 ;否則執(zhí)行步驟5 ; 步驟4:判斷步驟3得到的新的副本文件的大小是否大于原有的所有副本文件與該存儲節(jié)點(diǎn)的剩余存儲空間之和,如果是,則將新的副本文件刪除;否則,利用式3分別計算該文件f?的所有副本文件的替換價值,并按照替換價值將副本文件升序排列;此時,判斷新的副本文件的大小是否小于替換價值最小的副本文件與該存儲節(jié)點(diǎn)的剩余存儲空間之和,是則用新的副本文件替換替換價值最小的副本文件,否則,比較新的副本文件的大小是否小于替換價值最小的兩個副本文件與該存儲節(jié)點(diǎn)的剩余存儲空間之和,是則用新的副本文件替換該替換價值最小的兩個副本文件,否則增加副本文件的個數(shù)繼續(xù)判斷并刪除原有的副本文件,直到將新的副本文件存入該存儲節(jié)點(diǎn)
2.如權(quán)利要求1所述的基于萬有引力捜索模型的副本替換方法,其特征在于,所述步驟4中,所述引力常數(shù)Gtl=0.02。
【文檔編號】G06F17/30GK103455579SQ201310374827
【公開日】2013年12月18日 申請日期:2013年8月26日 優(yōu)先權(quán)日:2013年8月26日
【發(fā)明者】邊根慶, 邵必林, 盧才武, 張維琪, 張志霞, 葉娜, 李智杰, 龔培嬌, 權(quán)西瑞, 趙華龍 申請人:西安建筑科技大學(xué)