專利名稱:一種數(shù)據(jù)網(wǎng)格副本的選擇方法
技術(shù)領(lǐng)域:
本發(fā)明是一種數(shù)據(jù)網(wǎng)格副本選擇算法,主要用于解決在分布著大量數(shù)據(jù)和計 算能力的數(shù)據(jù)網(wǎng)格環(huán)境下,對海量的數(shù)據(jù)副本進(jìn)行最優(yōu)化選擇以達(dá)到提升數(shù)據(jù)網(wǎng) 格性能的問題。該發(fā)明屬于數(shù)據(jù)網(wǎng)格技術(shù)領(lǐng)域。
背景技術(shù):
數(shù)據(jù)復(fù)制與副本創(chuàng)建
數(shù)據(jù)網(wǎng)格(Data Grid)是當(dāng)前網(wǎng)格領(lǐng)域的研究熱點,其目標(biāo)是使地理上廣
泛分布的用戶能夠共享數(shù)據(jù)資源,以完成對大規(guī)模海量數(shù)據(jù)集的復(fù)雜分析和處
理。數(shù)據(jù)網(wǎng)格系統(tǒng)為提高數(shù)據(jù)的可靠性以及降低用戶對遠(yuǎn)端數(shù)據(jù)的訪問延遲帶寬
消耗,廣泛采用數(shù)據(jù)復(fù)制技術(shù)以提高系統(tǒng)性能。數(shù)據(jù)復(fù)制技術(shù)通過在數(shù)據(jù)網(wǎng)格系
統(tǒng)內(nèi)提供多個數(shù)據(jù)副本以縮短數(shù)據(jù)的訪問延遲,實現(xiàn)系統(tǒng)容錯及負(fù)載平衡等。副
本是某一文件的確切拷貝,并且通過某種明確的機(jī)制與源文件相聯(lián)系。同一文件 的不同副本可以有不同的一致性級別和存活時間。由于數(shù)據(jù)網(wǎng)格系統(tǒng)分布于廣域
網(wǎng)上并具有一定的動態(tài)性i量、用戶量都很大,因此一般由數(shù)據(jù)網(wǎng)格系統(tǒng)在運行時
刻動態(tài)創(chuàng)建數(shù)據(jù)副本。
副本定位與選擇
在這種情況下,用戶任務(wù)所需的相當(dāng)一部分?jǐn)?shù)據(jù)是分布在各自分散的網(wǎng)格 節(jié)點上。要在如此廣域分布的數(shù)據(jù)中進(jìn)行有效快速的訪問,需要對數(shù)據(jù)副本進(jìn)行 優(yōu)化選擇。副本優(yōu)化選擇就是指基于副本性能和訪問特性從一組副本中選擇一個 最佳副本的過程。
數(shù)據(jù)副本的優(yōu)化選擇具有非常關(guān)鍵的作用,其很大程度上決定了數(shù)據(jù)網(wǎng)絡(luò) 資源的利用率。在理想情況下,被選擇的副本提供最佳性能。副本選擇的關(guān)鍵是 對遠(yuǎn)程數(shù)據(jù)訪問時間的預(yù)測,這依賴于很多因素,如傳輸特性、用戶和服務(wù)器間
的網(wǎng)絡(luò)狀態(tài)、副本所在節(jié)點的負(fù)載情況及磁盤1/0讀取速度等。 數(shù)據(jù)副本選擇的因素
副本選擇算法的優(yōu)劣很大程度上取決于對影響副本選擇因素參數(shù)的選取。這 些因素成為副本選擇的主要依據(jù),主要包括以下幾個方面
磁盤1/0傳輸針對副本選擇策略而言,主要指磁盤讀取時間。低的讀取時 間能降低數(shù)據(jù)副本的遠(yuǎn)程訪問時間。
網(wǎng)絡(luò)狀態(tài)在進(jìn)行副本選擇時,通用的作法是選擇最小延遲的鏈路進(jìn)行數(shù) 據(jù)訪問。傳輸帶寬決定了數(shù)據(jù)的傳輸速率,因此網(wǎng)絡(luò)中最大可用傳輸帶寬可成為 副本選擇的一個依據(jù),并且平均傳輸帶寬可以幫助預(yù)測對某一特定副本的訪問 情況。
存儲副本節(jié)點的負(fù)載情況如果許多個任務(wù)需要訪問某一網(wǎng)格節(jié)點上的相 同數(shù)據(jù)副本,則該節(jié)點訪問負(fù)載也是影響數(shù)據(jù)遠(yuǎn)程訪問時間的重要因素之一。 一個良好的副本策略常常具有以下優(yōu)點
(1) 減少數(shù)據(jù)訪問延遲。數(shù)據(jù)被復(fù)制到本地,這里的本地可以指一個vo(虛
擬組織), 一個Site(網(wǎng)格中的站點)等,顯然程序的運行不會因為缺少數(shù)據(jù)而停 頓。
(2) 減少網(wǎng)絡(luò)帶寬的消耗,避免擁塞。數(shù)據(jù)被事先拷貝到本地,以后的程 序運行不必再到遠(yuǎn)程讀取,節(jié)省了網(wǎng)絡(luò)帶寬。
(3) 對服務(wù)器端的負(fù)載起到平衡作用。經(jīng)過拷貝后使數(shù)據(jù)分散,對數(shù)據(jù)的 請求只有一部分仍然需要到服務(wù)器獲取,有效的減緩了服務(wù)器的負(fù)載。
(4) 提高數(shù)據(jù)的可用性。在數(shù)據(jù)己經(jīng)被拷貝到本地的情況下,如果服務(wù)器 發(fā)生失敗,也不會影響本地程序的運行。
技術(shù)現(xiàn)狀與問題
由于對數(shù)據(jù)網(wǎng)格的研究較之計算網(wǎng)格起步晚,很多副本選擇策略主要集中 在對計算網(wǎng)格中計算資源的選擇。"網(wǎng)格之父"IanFoster在他的著作中提出了
幾種不同的副本/緩存策略,包括最佳客戶副本策略、瀑布副本策略、基于緩存 的副本策略、緩存加瀑布副本策略、快速傳播副本策略、基于經(jīng)濟(jì)模型的副本策 略。上述副本策略在大部分情況下都能夠縮小訪問延遲并節(jié)省網(wǎng)絡(luò)帶寬.。但瀑 布副本策略、緩存加瀑布副本策略以及快速傳播副本策略是拓?fù)浣Y(jié)構(gòu)為層次式且
源數(shù)據(jù)存儲于頂層節(jié)點的數(shù)據(jù)網(wǎng)格所獨有的副本策略,其通用性并不理想。而最 佳客戶副本創(chuàng)建策略、基于緩存的副本創(chuàng)建策略和基于經(jīng)濟(jì)模型的副本創(chuàng)建策略
雖然可克服上述缺點,但其并沒有考慮一些規(guī)模較小的數(shù)據(jù)網(wǎng)格的拓?fù)浣Y(jié)構(gòu)、數(shù) 據(jù)分布、網(wǎng)絡(luò)帶寬以及節(jié)點存儲能力等特點,故其性能較差。值得一提的是基于 經(jīng)濟(jì)模型的副本策略使用拍賣成本協(xié)議進(jìn)行副本選擇以及動態(tài)副本創(chuàng)建,進(jìn)行 副本選擇的同時還融入了副本的創(chuàng)建與數(shù)據(jù)的訪問模式。由于該策略綜合了副本 創(chuàng)建定位等多方面因素,可以得到較好效率,但不曾考慮副本存儲節(jié)點的負(fù)載 動態(tài)平衡情況。還有些學(xué)者提出了基于概率模型的副本選擇算法并使用一個中間 部件對副本進(jìn)行選擇,概率模型以先前副本訪問的歷史記錄作為輸入,在此基
礎(chǔ)上對副本選擇情況進(jìn)行預(yù)測。實驗結(jié)果表明,上述策略都存在著不同程度的弊 端。因此,提出一種新的副本定位與訪問策略就顯得很有必要。
發(fā)明內(nèi)容
技術(shù)問題:本發(fā)明的目的是提供一種數(shù)據(jù)網(wǎng)格環(huán)境中基于遺傳算法的副本選 擇方法,由于副本對請求者是透明的,副本管理系統(tǒng)査閱副本目錄,尋找數(shù)據(jù)副 本,根據(jù)該方案從數(shù)據(jù)的所有副本中選擇一個最合適的副本給請求者訪問,解決 數(shù)據(jù)網(wǎng)格中復(fù)雜的副本選擇問題。
技術(shù)方案本發(fā)明是一種啟發(fā)式方法。遺傳算法(Genetic Algorithm,簡稱 GA)最早由美國學(xué)者Holland于1975年首先提出來,原來是一種基于自然群體遺 傳演化機(jī)制的高效探索算法,它利用與環(huán)境的動態(tài)交互獲得反饋信息調(diào)整自我, 以期逐步獲得最佳解。遺傳算法已被應(yīng)用到一些全局優(yōu)化問題中,如TSP分配問 題、網(wǎng)絡(luò)路由、任務(wù)調(diào)度及著色問題。
本發(fā)明的數(shù)據(jù)網(wǎng)格副本的選擇方法為
步驟一.從數(shù)據(jù)網(wǎng)格的副本管理器中獲取副本,副本管理器的副本目錄中將 獲得的各個數(shù)據(jù)文件的邏輯文件名映射為副本名,每個副本都包含了文件大小, 訪問時間的參數(shù),副本所在站點即網(wǎng)格中的節(jié)點間有通信帶寬,
步驟二.將每個副本作為一個個體進(jìn)行二進(jìn)制編碼轉(zhuǎn)換為一個遺傳型,進(jìn)行 二進(jìn)制編碼便于利用模式定理進(jìn)行理論分析,
步驟三.確定控制參數(shù)的值,包括交叉算子,變異算子,最大遺傳代數(shù),在
求解中使用可變的變異算子,運用指數(shù)函數(shù)使得算子值隨遺傳代數(shù)的增多而減 小,并控制在O. OOOl到O. l之間,
步驟四.產(chǎn)生初始種群,副本管理器提供的每個副本都是初始種群的一個個
體,
步驟五.計算種群個體目標(biāo)函數(shù)值,目標(biāo)函數(shù)f(Xi(k))力/fi+Si充分考慮了
副本的各種參數(shù)如副本文件大小、訪問時間、網(wǎng)絡(luò)帶寬的因素的影響,對每個目 標(biāo)函數(shù)值確定轉(zhuǎn)換為適應(yīng)度函數(shù)值的直接概率,改善下一代種群的性能,
步驟六.產(chǎn)生中間種群,由于引入了直接概率,結(jié)合交叉算子的使用,因而 既避免了過早收斂又有利于充分交叉,改進(jìn)了以往的遺傳算法,
步驟七.對各副本個體的二進(jìn)制編碼進(jìn)行變異處理,獲得另一個中間種群; 在進(jìn)化過程中,引入指數(shù)函數(shù)來修改變異算子的值,使之隨進(jìn)化代數(shù)的增加而減 小,有利于盡可能早地獲得最優(yōu)解,
步驟八.將當(dāng)前種群及剛產(chǎn)生的兩個中間種群綜合處理,獲取適應(yīng)度最優(yōu)的 若干個體,再與隨機(jī)獲得的N,個個體組合成新一代的種群;在種群個體適應(yīng)度接 近情況下,它們配對的概率相當(dāng),交叉后的個體也不會有很大變化,這樣進(jìn)化過 程容易陷入停頓找不到最優(yōu)解,由于引入了兩個中間種群對適應(yīng)度進(jìn)行了排序選 擇和隨機(jī)選擇的處理,避免了這種情況的發(fā)生,
步驟九.從獲得的新一代種群幵始,重復(fù)步驟五,至設(shè)定的最大遺傳代數(shù)為 止,最大遺傳代數(shù)的經(jīng)驗值約為副本數(shù)目乘以O(shè).l,
步驟十.從最后得到的種群中獲取最優(yōu)解,其個體所對應(yīng)的副本即為所選擇 副本。
有益效果相對于其它方法,遺傳算法本身具有以下優(yōu)點 ,遺傳算法的搜索過程從一群初始點開始搜索,搜索過程可以有效的跳出局
部極值點;遺傳算法只需要利用目標(biāo)函數(shù)值的信息,而不是像傳統(tǒng)的優(yōu)化方法主
要采用目標(biāo)函數(shù)的梯度等解析信息;
,遺傳算法具有顯著的隱并行性,遺傳算法雖然在每一代只對有限個個體進(jìn)
行操作,但處理的信息量為群體規(guī)模的高次方;
,遺傳算法具有很強(qiáng)的魯棒性,即在存在噪音的情況下,對同一問題的遺傳算法的多次求解中得到的結(jié)果是相似的。
本文提出的基于遺傳算法的副本優(yōu)化選擇算法針對大規(guī)模數(shù)據(jù)密集型網(wǎng)格 環(huán)境,既考慮了副本文件的物理屬性,又可以有效做到副本存儲節(jié)點的負(fù)載動 態(tài)平衡。
圖l是遺傳算法進(jìn)化示意圖2是應(yīng)用遺傳算法求解副本選擇問題原理圖。
圖3求解步驟流程圖。
具體實施例方式
本發(fā)明所提出的基于遺傳算法的副本選擇策略是在數(shù)據(jù)網(wǎng)格模擬器 OptorSim中進(jìn)行的。該模擬器旨在研究動態(tài)數(shù)據(jù)副本策略。它提供了一系列副本 創(chuàng)建及選擇方法并就算法的性能給出仿真數(shù)據(jù)。其目的在于研究典型數(shù)據(jù)網(wǎng)格中 的復(fù)雜動態(tài)特性及在數(shù)據(jù)網(wǎng)格環(huán)境中對副本優(yōu)化算法的性能做出評價。
為了對基于遺傳算法的副本選擇策略進(jìn)行評估和驗證,并與其他副本選擇 算法進(jìn)行比較,對網(wǎng)格仿真器OptorSim進(jìn)行擴(kuò)展。通過擴(kuò)充該仿真器的副本優(yōu)化 模塊,將基于遺傳方法的副本選擇算法在該模塊中實現(xiàn)。由于OptorSim中的副本 優(yōu)化模塊中已存在多種副本選擇算法,在此基礎(chǔ)上更方便了對所提出的新算法結(jié) 果進(jìn)行對比評估。通過改寫模塊間的接口,新算法能在該仿真器中成功運行。
—.遺傳算法的基本思想
遺傳算法是模擬生物在自然環(huán)境中優(yōu)勝劣汰、適者生存的遺傳和進(jìn)化過程而 形成的一種具有自適應(yīng)能力的、全局性的概率搜索算法。
遺傳算法從代表待優(yōu)化問題的一個初始種群開始求解,種群由經(jīng)過基因編碼
的一定數(shù)目的個體組成。基因編碼成染色體,每個個體實際上是帶有染色體特征 的實體。染色體作為遺傳物質(zhì)的主要載體,是多個基因的集合,其內(nèi)部表現(xiàn)(即 基因型)是多個基因的某種組合,它決定了個體的形狀的外部表現(xiàn)。因此,在一 開始需要實現(xiàn)從表現(xiàn)型到基因型的映射即編碼工作。初代種群產(chǎn)生之后,按照適 者生存和優(yōu)勝劣汰的原理,逐代演化產(chǎn)生出適應(yīng)度越來越好的個體。在每一代中,
根據(jù)問題域中個體的適應(yīng)度的優(yōu)劣,選擇一些適應(yīng)度高的個體,基于這些選出的 適應(yīng)度高的個體,并借助于自然遺傳學(xué)的交叉、變異算子,產(chǎn)生出代表新解集的 下一代種群。這個過程將導(dǎo)致種群像自然進(jìn)化一樣,使后生代種群比前代種群具 有更高的適應(yīng)度,更加適應(yīng)于環(huán)境。在優(yōu)化過程結(jié)束后,末代種群中的最優(yōu)個體 經(jīng)過解碼,即可以作為問題的近似最優(yōu)解。
遺傳算法的主要本質(zhì)特征在于群體搜索策略和簡單的進(jìn)化算子。群體搜索使 遺傳算法得以突破鄰域搜索的限制,可以實現(xiàn)整個解空間上的分布式信息搜索、 采集和繼承,從而保證了解的全局性;進(jìn)化算子僅僅利用適應(yīng)值度量作為運算指 標(biāo)進(jìn)行染色體的隨機(jī)操作,降低了一般啟發(fā)式算法在搜索過程中對人機(jī)交互的依 賴,這樣就使得遺傳算法獲得強(qiáng)大的全局最優(yōu)解搜索能力。問題域獨立性,信息 處理的隱并行性,應(yīng)用的魯棒性,操作的簡明性,使得遺傳算法成為一種良好的 優(yōu)化算法。
二.遺傳算法設(shè)計幾個要素
1. 參數(shù)編碼
當(dāng)用遺傳算法求解問題時,必須在目標(biāo)問題實際表示域內(nèi)對遺傳算法的染色 體位串結(jié)構(gòu)之間建立聯(lián)系,即確定編碼和解碼運算。
2. 初始種群
一定數(shù)量的個體組成了群體,群體中個體的數(shù)目稱為群體規(guī)模。由于遺傳法 的群體性操作需要,所以在執(zhí)行遺傳操作之前,必須已經(jīng)有了一個由若干初始解 組成的初始群體。由于對實際工程問題,往往并不具有關(guān)于問題解空間的先驗知 識,所以很難確定最優(yōu)解的數(shù)量及其在可行解空間中的分布狀況。所以我們往往 希望在問題解空間均勻分布,隨機(jī)生成一定數(shù)目的個體。初始種群中的個體一般 是隨機(jī)產(chǎn)生的。群體規(guī)模是遺傳算法的控制參數(shù)之一,其取值對遺傳算法效能有 影響。
3. 適應(yīng)度函數(shù)
遺傳算法將問題空間表示為染色位串空間,為了執(zhí)行適者生存的原則必須對 個體位串的適應(yīng)性進(jìn)行評價。因此,適應(yīng)度函數(shù)就構(gòu)成了個體的生存環(huán)境。根據(jù) 個體的適應(yīng)值,就可以決定它在此環(huán)境下的生存能力。 一般來說,較好的染色體 位i具有較高的適應(yīng)函數(shù)值,即可以獲得較高的評價,具有較強(qiáng)的生存能力。由
于適應(yīng)度函數(shù)是群體中個體生存機(jī)會選擇的唯一確定性指標(biāo),所以適應(yīng)度函數(shù)的 形式直接決定著群體的遺傳行為。為了能夠直接將適應(yīng)函數(shù)與群體中的個體優(yōu)劣 度量相聯(lián)系,在遺傳算法中的適應(yīng)度函數(shù)規(guī)定為非負(fù),并且在任何情況下總是希 望越大越好。 一般而言,適應(yīng)度函數(shù)是通過對目標(biāo)函數(shù)的轉(zhuǎn)換而形成的。 4.遺傳算子
標(biāo)準(zhǔn)的遺傳算子一般都包括選擇(selection)、交叉(crossover)和變異 (mutation)三種形式。它們構(gòu)成了遺傳算法的核心,使得算法具有強(qiáng)大的搜索能 力。其中雜交算子是遺傳算法中最主要的遺傳操作。
求解目標(biāo)在上述環(huán)境下,作業(yè)的運行需要一系列的數(shù)據(jù)文件,這些數(shù)據(jù)文 件的在"作業(yè)配置文件"載入時被副本管理器讀取,并分配到各個站點上(站點 是數(shù)據(jù)網(wǎng)格的節(jié)點在0ptorSim中的模擬)成為副本,作業(yè)運行時根據(jù)遺傳算法所 描述的策略決定哪個副本是最優(yōu)的,由此來獲得最佳的網(wǎng)格性能。
求解步驟
Stepl設(shè)置種群規(guī)模值pop, pop值來自于副本管理器當(dāng)前提供的副本數(shù)目; 設(shè)置最大進(jìn)化代數(shù)N,也就是優(yōu)化策略循環(huán)執(zhí)行的次數(shù),這個值可以根據(jù)副本多 樣性程度或者算法最優(yōu)解連續(xù)多少次沒有新的改進(jìn)來確定;設(shè)置雜交算子p。的值 為0.8;設(shè)置變異算子Pm的初始值仏(0)為0.1;設(shè)置最合適的整數(shù)N的值為pop/10。
對現(xiàn)有副本管理器副本目錄中的所有副本的邏輯文件名進(jìn)行二進(jìn)制編碼。
Step2初始化,令k:0,產(chǎn)生初始種群P(k)^Xi(k)li^,2,…,p叩L并計算每
個個體的目標(biāo)函數(shù)f (Xi (k) ) , i=l, 2,…,pop,其計算方法為 f(Xi(k))^i/fi+Si
其中ri代表對數(shù)據(jù)副本的讀取速度,ri受網(wǎng)絡(luò)帶寬與負(fù)載的影響,fi表示副 本文件的大小,Si表示參數(shù)包的大小,這三個參數(shù)的值可以從存儲副本的站點獲 得。
St印3對當(dāng)前種群pop個種群的目標(biāo)函數(shù)值按從小到大排列,對每個目標(biāo)函 數(shù)值產(chǎn)生一個直接概率p(i)-2i/[p叩"p叩+l)], 1《i《p叩。 Step4產(chǎn)生適應(yīng)度函數(shù)f(Xi(k)) = f(Xi(k))*p(i)
這樣避免了適應(yīng)度函數(shù)早熟的可能,使每一代當(dāng)前解以最大的概率p(i)遺傳。
St印5在區(qū)間(0,l)上產(chǎn)生隨機(jī)數(shù)r!,同時在區(qū)間[l,p叩]上按交叉算子pc產(chǎn) 生兩個整數(shù)1"2和1~3且1"2#1~3。若r《p。,則取父代的兩個個體分別為&(k)和&,(k), 由交叉算子產(chǎn)生它們的中間后代y(k)。
Step6重復(fù)步驟三p叩次,設(shè)產(chǎn)生pop。個后代個體,構(gòu)成一個中間種群集,記為 Pc (k) = {y! (k),…,ypopc (k)},并計算每個個體的適應(yīng)度f (yi (k)), i=l,…,popc。
St印7指定二進(jìn)制編碼的末位為變異點。對每個yi(k)的編碼的末位按照變異 算子"的概率改變值,這樣得到新的種群Pjk)。
Step8當(dāng)副本種群中個體適應(yīng)度彼此非常接近時,這些個體進(jìn)入配對集的機(jī) 會相當(dāng),而且交叉后得到的新個體也不會有多大變化。這樣,搜索過程就不能有 效地進(jìn)行,選擇機(jī)制有可能趨向于純粹的隨即選擇,從而使進(jìn)化過程陷于停頓的 狀態(tài),難以找到全局最優(yōu)解。
為了提高種群的多樣性,選擇算子采取以下策略
在當(dāng)前種群(父代)及所有后代(雜交產(chǎn)生的后代以及變異產(chǎn)生的后代)個體 中,按適應(yīng)度的升序排列,選擇前pop-N個個體,再隨機(jī)產(chǎn)生N個個體,把這兩部分 個體合起來作為下一代種群,并且保留每一代產(chǎn)生的最好解。
St印9隨著優(yōu)化次數(shù)的增加,不斷修改變異算子的值,使其減小。 pra(k)=pra(0)*e—k
St印lO對當(dāng)前種群重新計算目標(biāo)函數(shù),重復(fù)上面步驟,直至算法進(jìn)行了最 大進(jìn)化代數(shù)N,所得的適應(yīng)度最好的解就是全局最優(yōu)的解,即最優(yōu)副本。
權(quán)利要求
1. 一種數(shù)據(jù)網(wǎng)格副本的選擇方法,其特征在于該方法為步驟一. 從數(shù)據(jù)網(wǎng)格的副本管理器中獲取副本,副本管理器的副本目錄中將獲得的各個數(shù)據(jù)文件的邏輯文件名映射為副本名,每個副本都包含了文件大小,訪問時間的參數(shù),副本所在站點即網(wǎng)格中的節(jié)點間有通信帶寬,步驟二. 將每個副本作為一個個體進(jìn)行二進(jìn)制編碼轉(zhuǎn)換為一個遺傳型,進(jìn)行二進(jìn)制編碼便于利用模式定理進(jìn)行理論分析,步驟三. 確定控制參數(shù)的值,包括交叉算子,變異算子,最大遺傳代數(shù),在求解中使用可變的變異算子,運用指數(shù)函數(shù)使得算子值隨遺傳代數(shù)的增多而減小,并控制在0.0001到0.1之間,步驟四. 產(chǎn)生初始種群,副本管理器提供的每個副本都是初始種群的一個個體,步驟五. 計算種群個體目標(biāo)函數(shù)值,目標(biāo)函數(shù)f(xi(k))=ri/fi+si充分考慮了副本的各種參數(shù)如副本文件大小、訪問時間、網(wǎng)絡(luò)帶寬的因素的影響,對每個目標(biāo)函數(shù)值確定轉(zhuǎn)換為適應(yīng)度函數(shù)值的直接概率,改善下一代種群的性能,步驟六. 產(chǎn)生中間種群,由于引入了直接概率,結(jié)合交叉算子的使用,因而既避免了過早收斂又有利于充分交叉,改進(jìn)了以往的遺傳算法,步驟七. 對各副本個體的二進(jìn)制編碼進(jìn)行變異處理,獲得另一個中間種群;在進(jìn)化過程中,引入指數(shù)函數(shù)來修改變異算子的值,使之隨進(jìn)化代數(shù)的增加而減小,有利于盡可能早地獲得最優(yōu)解,步驟八. 將當(dāng)前種群及剛產(chǎn)生的兩個中間種群綜合處理,獲取適應(yīng)度最優(yōu)的若干個體,再與隨機(jī)獲得的N1個個體組合成新一代的種群;在種群個體適應(yīng)度接近情況下,它們配對的概率相當(dāng),交叉后的個體也不會有很大變化,這樣進(jìn)化過程容易陷入停頓找不到最優(yōu)解,由于引入了兩個中間種群對適應(yīng)度進(jìn)行了排序選擇和隨機(jī)選擇的處理,避免了這種情況的發(fā)生,步驟九. 從獲得的新一代種群開始,重復(fù)步驟五,至設(shè)定的最大遺傳代數(shù)為止,最大遺傳代數(shù)的經(jīng)驗值約為副本數(shù)目乘以0.1,步驟十. 從最后得到的種群中獲取最優(yōu)解,其個體所對應(yīng)的副本即為所選擇副本。
全文摘要
一種數(shù)據(jù)網(wǎng)格副本的選擇方法在數(shù)據(jù)網(wǎng)格環(huán)境下,各種數(shù)據(jù)被抽象為數(shù)據(jù)元,各數(shù)據(jù)元的各個副本有各自不同的物理副本名,在對這些副本進(jìn)行定位后,選擇一個最佳副本供網(wǎng)格作業(yè)執(zhí)行使用對網(wǎng)格的性能有至關(guān)重要的影響。本發(fā)明綜合考慮了數(shù)據(jù)通路,節(jié)點負(fù)載,節(jié)點距離等因素,提供了一種副本選擇方案。其實現(xiàn)過程如下對各副本名進(jìn)行編碼并分配到各初始種群中,對初始種群各個體生成目標(biāo)函數(shù)并由目標(biāo)函數(shù)結(jié)合直接概率導(dǎo)出適應(yīng)度函數(shù),由此來衡量副本的好壞程度。進(jìn)行交叉產(chǎn)生中間種群,并對中間種群進(jìn)行變異。對當(dāng)前的種群選取部分最優(yōu)解結(jié)合部分隨機(jī)產(chǎn)生的個體作為下一代種群。每次進(jìn)化都修改變異算子的值。循環(huán)執(zhí)行上述步驟,至結(jié)束條件滿足為止。
文檔編號H04L29/08GK101378406SQ20081015572
公開日2009年3月4日 申請日期2008年10月8日 優(yōu)先權(quán)日2008年10月8日
發(fā)明者雄 付, 任勛益, 季一木, 侃 易, 楊明慧, 王汝傳, 松 鄧, 鄧蘇明 申請人:南京郵電大學(xué)