一種基于memetic算法的基因模體重構(gòu)技術(shù)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及生物網(wǎng)絡(luò)和智能優(yōu)化領(lǐng)域,具體地說是一種基于memetic算法的基因 模體重構(gòu)技術(shù)。
【背景技術(shù)】
[0002] 基因網(wǎng)絡(luò)研究是當前國內(nèi)外研究的前沿課題,其主要目的是通過建立基因轉(zhuǎn)錄調(diào) 控網(wǎng)絡(luò)模型對某個物種或組織中全部基因的表達關(guān)系進行整體的模擬分析和研究。量化方 法是基因調(diào)控網(wǎng)絡(luò)研究中一種有效的策略,可以從一個側(cè)面對基因表達過程中的信息進行 挖掘,通過信息提取、分析,了解基因功能,理解遺傳網(wǎng)絡(luò)來弄清疾病發(fā)病機制?;驈谋磉_ 中展示其功能,基因的表達是彼此相互作用和調(diào)控的過程?;蛘{(diào)控網(wǎng)絡(luò)中出現(xiàn)頻率非常 高的連接子圖被稱為網(wǎng)絡(luò)模體,它是基于網(wǎng)絡(luò)的拓撲連接特征提出來的,是網(wǎng)絡(luò)中具有簡 單結(jié)構(gòu)的單元,它表示的是轉(zhuǎn)錄因子和靶基因之間相互調(diào)控關(guān)系的特定小規(guī)模模式,通常 由少量的基因按照一定的拓撲結(jié)構(gòu)構(gòu)成。
[0003] 描述基因調(diào)控系統(tǒng)的數(shù)學(xué)方法和模型有很多,如微分方程模型、布爾模型等。加權(quán) 矩陣模型是其中一種建模基因調(diào)控網(wǎng)絡(luò)的方法,利用這種結(jié)構(gòu)可以有效判別基因模體的調(diào) 控作用是否有問題,同時以權(quán)值的形式簡單描述出基因間相互作用的強度,在系統(tǒng)分析和 控制設(shè)計方面有一定的優(yōu)勢。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明的目的在于綜合應(yīng)用加權(quán)矩陣模型和memetic優(yōu)化算法推斷基因模體中 基因之間的相互關(guān)系,提出一種基于memetic算法的基因模體重構(gòu)技術(shù),尋優(yōu)過程中以基 因表達響應(yīng)輸出誤差為優(yōu)化算法的評價函數(shù),充分利用基于種群的全局搜索和基于個體的 局部啟發(fā)式搜索,通過優(yōu)化種群分布,及早剔除不良個體,加快算法的求解速度,在保證較 1?收斂性能的基礎(chǔ)上,提1?全局搜索能力,獲得1?質(zhì)量的解,以推測出與實驗數(shù)據(jù)最符合的 基因模體結(jié)構(gòu)。
[0005] 在基因網(wǎng)絡(luò)模體的加權(quán)矩陣模型中,一個基因的表達值是其他基因表達值的函 數(shù)。含有個基因的基因表達狀態(tài)用η維空間中的向量u(t)表示,u(t)代表一個基因在時 刻t的表達水平。以一個加權(quán)矩陣W= (Wipnxn表示基因之間的相互調(diào)控作用,Wu代表基 因 j的表達水平對基因 i的影響?;?i的總調(diào)控輸入A⑴為
【主權(quán)項】
1. 一種基于memetic算法的基因模體重構(gòu)技術(shù),其特征是所述方法包括如下步驟: 步驟1 ;生成數(shù)據(jù)。由真實基因模體調(diào)控作用中產(chǎn)生所有基因表達的tf個離散時間序 列111似,1=(1,2,...,]1),1=(1,2,...,1,)。 步驟2 ;編碼。根據(jù)基因模體中加權(quán)模型權(quán)值變量的解空間,將可行解數(shù)據(jù)表示成搜索 空間的浮點型串結(jié)構(gòu)數(shù)據(jù),該些串結(jié)構(gòu)數(shù)據(jù)不同組合構(gòu)成不同可行解。 步驟3 ;產(chǎn)生初始群體。確定網(wǎng)絡(luò)模體的基因個數(shù)n,搜索種群規(guī)模M,解空間維數(shù)大小 D=n2,雜交概率P。,變異概率Py,隨機產(chǎn)生M個初始個體,進化代數(shù)變量k=l,最大進化代數(shù) Kmax° 步驟4 ;交叉。按照雜交概率P。在M個個體中任意選取兩個進行雜交運算,產(chǎn)生新一代 群體的兩個新個體。 步驟5 ;變異。在雜交運算雜生的新群體中,按照變異概率Py從中選取若干個體,進行 變異操作。 步驟6 ;計算適應(yīng)度函數(shù)。對變異后的新群體根據(jù)基因表達響應(yīng)輸出誤差分別計算每 個個體的適應(yīng)度函數(shù),其公式為:
其中,Ui (t)、iJ,的分別表示基因i在t時刻真實與預(yù)測的基因表達水平。 步驟7;選擇。從當前群體中選擇M個優(yōu)良(適應(yīng)度高)的個體,選擇概率與其適應(yīng)度 成正比,舍棄適應(yīng)度低的個體。 步驟8 ;局部搜索。對種群中的所有個體采用擬牛頓法進行局部搜索。 步驟9 ;如果滿足停止條件或達到最大迭代次數(shù)化=KmJ,則尋優(yōu)結(jié)束,所得到的全局 最優(yōu)值,即為基因模體的加權(quán)矩陣模型權(quán)值;否則,k ;= k+1,轉(zhuǎn)步驟4。
2. 根據(jù)權(quán)利要求1所述的一種基于memetic算法的基因模體重構(gòu)技術(shù),其特征是所述 步驟8中,局部搜索策略可采用爬山法、單純形優(yōu)化法、共輛梯度法、牛頓法等,本發(fā)明為了 提高局部收斂速度,采用擬牛頓法。
【專利摘要】本發(fā)明公開了一種基于memetic算法的基因模體重構(gòu)技術(shù),結(jié)合了群體算法搜索的廣度優(yōu)點和局部搜索算法的深度優(yōu)點,以基因表達響應(yīng)輸出誤差為優(yōu)化算法的評價函數(shù),通過個體間的交叉和變異增加了粒子的多樣性,利用最小化評價函數(shù)來確定基因模體加權(quán)矩陣模型的最優(yōu)結(jié)構(gòu)及參數(shù),從而推測出與實驗數(shù)據(jù)相吻合的基因模體結(jié)構(gòu)。
【IPC分類】G06F17-50
【公開號】CN104598657
【申請?zhí)枴緾N201310525115
【發(fā)明人】樓旭陽
【申請人】江南大學(xué)
【公開日】2015年5月6日
【申請日】2013年10月30日