基于單樣本數(shù)據(jù)的個體特異性網(wǎng)絡(luò)構(gòu)建方法和裝置的制造方法
【專利摘要】本發(fā)明公開了一種基于單樣本數(shù)據(jù)的個體特異性網(wǎng)絡(luò)構(gòu)建方法和裝置,能夠利用單個樣本的表達(dá)信息構(gòu)建該樣本特異性的分子網(wǎng)絡(luò)。其技術(shù)方案為:首先建立一個多樣本的參考網(wǎng)絡(luò),在這個參考網(wǎng)絡(luò)的基礎(chǔ)上,加入一個獨(dú)立樣本,并重新建立新網(wǎng)絡(luò)(即擾動網(wǎng)絡(luò)),擾動網(wǎng)絡(luò)和參考網(wǎng)絡(luò)的所有差別都是由獨(dú)立樣本引起的,對擾動網(wǎng)絡(luò)和參考網(wǎng)絡(luò)的邊對應(yīng)做減法,即可得到樣本的個體特異性網(wǎng)絡(luò)。利用單樣本數(shù)據(jù)構(gòu)建的單樣本特異性生物分子網(wǎng)絡(luò),能夠在單樣本的水平上標(biāo)識出基因間異常的調(diào)控關(guān)系和失調(diào)的蛋白相互作用,為復(fù)雜疾病對不同病人的精確性治療提供必要的分子間調(diào)控信息,為個性化治療發(fā)展提供了新的研究方向。
【專利說明】
基于單樣本數(shù)據(jù)的個體特異性網(wǎng)絡(luò)構(gòu)建方法和裝置
技術(shù)領(lǐng)域
[0001] 本發(fā)明設(shè)及一種計算系統(tǒng)生物學(xué)和生物信息學(xué),尤其設(shè)及構(gòu)建生物分子網(wǎng)絡(luò)的方 法和裝置。
【背景技術(shù)】
[0002] 人類復(fù)雜疾病是對病因不明確、設(shè)及因素眾多、無有效治療手段的一類疾病的統(tǒng) 稱,如各類癌癥及糖尿病等。而目前在復(fù)雜疾病的診斷,藥物設(shè)計和治療等方面存在著很多 個體差異性,此時,個性化醫(yī)療的概念既應(yīng)運(yùn)而生。隨著生物醫(yī)學(xué)的發(fā)展,個性化醫(yī)療,又被 稱為精確醫(yī)療,正在成為未來治療復(fù)雜疾病的發(fā)展方向,然而目前僅能夠?qū)€人的基因的 表達(dá)量和突變信息進(jìn)行研究,雖然個性化的表達(dá)信息和基因突變是重要的個性化信息,但 運(yùn)些信息不能夠體現(xiàn)基因之間個性化的調(diào)控方式和相互作用。生物分子網(wǎng)絡(luò)可W掲示生物 分子之間的相互作用和調(diào)控關(guān)系,是理解生物分子間信息交流,調(diào)控機(jī)制和多分子協(xié)同作 用的基礎(chǔ),在許多方面具有單分子監(jiān)測信息(如,表達(dá)和突變)不可替代的功能。然而,由于 在建立生物網(wǎng)絡(luò)的過程中需要統(tǒng)計和計算不同生物分子之間的相關(guān)性信息,因此就需要多 個樣本數(shù)據(jù)建立網(wǎng)絡(luò)。而且運(yùn)種網(wǎng)絡(luò)只包含了多樣本之間公共的調(diào)控信息,而忽略了每個 樣本特異的調(diào)控異常信息。而基于單樣本生物分子網(wǎng)絡(luò)既包含了疾病共同的調(diào)控信息,也 掲示的樣本特異性的調(diào)控信息,運(yùn)能夠為個性化醫(yī)療的發(fā)展提供個性化的網(wǎng)絡(luò)調(diào)控信息。
[0003] 在單個生物體內(nèi),分子間呈現(xiàn)出錯綜復(fù)雜的相互作用網(wǎng)絡(luò),運(yùn)些相互作用的改變 往往是導(dǎo)致復(fù)雜疾病發(fā)生發(fā)展的關(guān)鍵因素,而利用單樣本檢測數(shù)據(jù),構(gòu)建傳統(tǒng)上要通過多 樣本數(shù)據(jù)才能建立的生物分子網(wǎng)絡(luò)是目前亟待解決的技術(shù)問題。
【發(fā)明內(nèi)容】
[0004] W下給出一個或多個方面的簡要概述W提供對運(yùn)些方面的基本理解。此概述不是 所有構(gòu)想到的方面的詳盡綜覽,并且既非旨在指認(rèn)出所有方面的關(guān)鍵性或決定性要素亦非 試圖界定任何或所有方面的范圍。其唯一的目的是要W簡化形式給出一個或多個方面的一 些概念W為稍后給出的更加詳細(xì)的描述之序。 陽〇化]本發(fā)明的目的在于解決上述問題,提供了一種基于單樣本數(shù)據(jù)的個體特異性網(wǎng)絡(luò) 構(gòu)建方法和裝置,能夠利用單個樣本的表達(dá)信息構(gòu)建該樣本特異性的分子網(wǎng)絡(luò),利用單樣 本數(shù)據(jù)構(gòu)建的單樣本特異性生物分子網(wǎng)絡(luò),能夠在單樣本的水平上標(biāo)識出基因間異常的調(diào) 控關(guān)系和失調(diào)的蛋白相互作用,為復(fù)雜疾病對不同病人的精確性治療提供必要的分子間調(diào) 控信息,為個性化治療發(fā)展提供了新的研究方向。
[0006] 本發(fā)明的技術(shù)方案為:本發(fā)明掲示了一種基于單樣本數(shù)據(jù)的個體特異性網(wǎng)絡(luò)構(gòu)建 方法,包括:
[0007] 利用特定表象的表達(dá)數(shù)據(jù)作為參考數(shù)據(jù),計算參考數(shù)據(jù)之間的相關(guān)系數(shù)并利用參 考數(shù)據(jù)之間的相關(guān)系數(shù)構(gòu)建參考網(wǎng)絡(luò);
[0008] 將需要構(gòu)建的個體單樣本的表達(dá)數(shù)據(jù)添加到參考數(shù)據(jù)成為更新后的參考數(shù)據(jù)中, 計算更新后的參考數(shù)據(jù)之間的相關(guān)系數(shù),并利用更新后的參考數(shù)據(jù)之間的相關(guān)系數(shù)構(gòu)建擾 動網(wǎng)絡(luò);
[0009] 計算擾動網(wǎng)絡(luò)和參考網(wǎng)絡(luò)之間的每條邊的相關(guān)系數(shù)的差值并計算每條邊的相關(guān) 系數(shù)的差值在標(biāo)準(zhǔn)正態(tài)分布中的Z值;
[0010] 計算得到的標(biāo)準(zhǔn)正態(tài)分布中的Z值對應(yīng)的概率值,基于概率值和預(yù)設(shè)值的大小關(guān) 系確定概率值對應(yīng)的邊是否在統(tǒng)計上顯著;
[0011] 保留統(tǒng)計上顯著的邊,消除統(tǒng)計上不顯著的邊,從而得到基于個體單樣本的個體 特異性網(wǎng)絡(luò)。
[0012] 根據(jù)本發(fā)明的基于單樣本數(shù)據(jù)的個體特異性網(wǎng)絡(luò)構(gòu)建方法的一實施例,計算每條 邊的相關(guān)系數(shù)的差值在標(biāo)準(zhǔn)正態(tài)分布中的Z值的公式為:
[0013]
陽014] 其中Δ PCC。為差異相關(guān)系數(shù),PCC。為η個樣本的相關(guān)系數(shù)。
[0015] 根據(jù)本發(fā)明的基于單樣本數(shù)據(jù)的個體特異性網(wǎng)絡(luò)構(gòu)建方法的一實施例,預(yù)設(shè)值為 0. 05〇
[0016] 根據(jù)本發(fā)明的基于單樣本數(shù)據(jù)的個體特異性網(wǎng)絡(luò)構(gòu)建方法的一實施例,表達(dá)數(shù)據(jù) 包括基因表達(dá)數(shù)據(jù)、蛋白質(zhì)譜數(shù)據(jù)。
[0017] 本發(fā)明還掲示了一種基于單樣本數(shù)據(jù)的個體特異性網(wǎng)絡(luò)構(gòu)建裝置,包括:
[0018] 參考網(wǎng)絡(luò)構(gòu)建模塊,利用特定表象的表達(dá)數(shù)據(jù)作為參考數(shù)據(jù),計算參考數(shù)據(jù)之間 的相關(guān)系數(shù)并利用參考數(shù)據(jù)之間的相關(guān)系數(shù)構(gòu)建參考網(wǎng)絡(luò);
[0019] 擾動網(wǎng)絡(luò)構(gòu)建模塊,將需要構(gòu)建的個體單樣本的表達(dá)數(shù)據(jù)添加到參考數(shù)據(jù)成為更 新后的參考數(shù)據(jù)中,計算更新后的參考數(shù)據(jù)之間的相關(guān)系數(shù),并利用更新后的參考數(shù)據(jù)之 間的相關(guān)系數(shù)構(gòu)建擾動網(wǎng)絡(luò);
[0020] 差值分布模塊,計算擾動網(wǎng)絡(luò)和參考網(wǎng)絡(luò)之間的每條邊的相關(guān)系數(shù)的差值并計算 每條邊的相關(guān)系數(shù)的差值在標(biāo)準(zhǔn)正態(tài)分布中的Ζ值;
[0021] 邊顯著統(tǒng)計模塊,計算得到的標(biāo)準(zhǔn)正態(tài)分布中的Ζ值對應(yīng)的概率值,基于概率值 和預(yù)設(shè)值的大小關(guān)系確定概率值對應(yīng)的邊是否在統(tǒng)計上顯著;
[0022] 邊處理模塊,保留統(tǒng)計上顯著的邊,消除統(tǒng)計上不顯著的邊,從而得到基于個體單 樣本的個體特異性網(wǎng)絡(luò)。
[0023] 根據(jù)本發(fā)明的基于單樣本數(shù)據(jù)的個體特異性網(wǎng)絡(luò)構(gòu)建裝置的一實施例,差值分布 模塊計算每條邊的相關(guān)系數(shù)的差值在標(biāo)準(zhǔn)正態(tài)分布中的Ζ值的公式為:
[0024]
[00巧]其中Δ PCC。為差異相關(guān)系數(shù),PCC。為η個樣本的相關(guān)系數(shù)。
[00%] 根據(jù)本發(fā)明的基于單樣本數(shù)據(jù)的個體特異性網(wǎng)絡(luò)構(gòu)建裝置的一實施例,邊顯著統(tǒng) 計模塊中的預(yù)設(shè)值為0.05。
[0027] 根據(jù)本發(fā)明的基于單樣本數(shù)據(jù)的個體特異性網(wǎng)絡(luò)構(gòu)建裝置的一實施例,表達(dá)數(shù)據(jù) 包括基因表達(dá)數(shù)據(jù)、蛋白質(zhì)譜數(shù)據(jù)。
[0028] 本發(fā)明對比現(xiàn)有技術(shù)有如下的有益效果:本發(fā)明首先建立一個多樣本的參考網(wǎng) 絡(luò),在運(yùn)個參考網(wǎng)絡(luò)的基礎(chǔ)上,加入一個獨(dú)立樣本,并重新建立新網(wǎng)絡(luò)(即擾動網(wǎng)絡(luò)),擾動 網(wǎng)絡(luò)和參考網(wǎng)絡(luò)的所有差別都是由獨(dú)立樣本引起的,對擾動網(wǎng)絡(luò)和參考網(wǎng)絡(luò)的邊對應(yīng)做減 法,即可得到樣本的個體特異性網(wǎng)絡(luò)。通過本發(fā)明的方法和裝置所構(gòu)建的個體特異性網(wǎng)絡(luò), 能夠在單樣本的水平上標(biāo)識出基因間異常的調(diào)控關(guān)系和失調(diào)的蛋白相互作用,為復(fù)雜疾病 對不同病人的精確性治療提供必要的分子間調(diào)控信息,為個性化治療發(fā)展提供了新的研究 方向。
【附圖說明】
[0029] 圖1示出了本發(fā)明的基于單樣本數(shù)據(jù)的個體特異性網(wǎng)絡(luò)構(gòu)建方法的較佳實施例 的流程圖。
[0030] 圖2示出了本發(fā)明的基于單樣本數(shù)據(jù)的個體特異性網(wǎng)絡(luò)構(gòu)建裝置的較佳實施例 的原理圖。
[0031] 圖3示出了基于單樣本數(shù)據(jù)的個體特異性網(wǎng)絡(luò)構(gòu)建流程的示意圖。
【具體實施方式】
[0032] 在結(jié)合W下附圖閱讀本公開的實施例的詳細(xì)描述之后,能夠更好地理解本發(fā)明的 上述特征和優(yōu)點(diǎn)。在附圖中,各組件不一定是按比例繪制,并且具有類似的相關(guān)特性或特征 的組件可能具有相同或相近的附圖標(biāo)記。
[0033] 圖1示出了本發(fā)明的基于單樣本數(shù)據(jù)的個體特異性網(wǎng)絡(luò)構(gòu)建方法的較佳實施例 的流程。請參見圖1,本實施例的基于單樣本數(shù)據(jù)的個體特異性網(wǎng)絡(luò)構(gòu)建方法的各個步驟詳 述如下。
[0034] 步驟S1 :利用已有的特定表象的表達(dá)數(shù)據(jù)作為參考數(shù)據(jù),計算參考數(shù)據(jù)之間的相 關(guān)系數(shù)并利用參考數(shù)據(jù)之間的相關(guān)系數(shù)構(gòu)建參考網(wǎng)絡(luò)。
[0035] 將已有的特定表象的表達(dá)數(shù)據(jù)比如正常情況下的表達(dá)數(shù)據(jù)作為疾病研究的參考 數(shù)據(jù),此類數(shù)據(jù)主要是基因表達(dá)數(shù)據(jù),主要W Microarray和RNA-Seq產(chǎn)生的數(shù)據(jù)為主,對于 其他符合標(biāo)準(zhǔn)的數(shù)據(jù),如蛋白質(zhì)譜數(shù)據(jù),也可W應(yīng)用于本方法。
[0036] 本步驟的實施請見圖3所示的曰。
[0037] 步驟S2 :將需要構(gòu)建的個體單樣本的表達(dá)數(shù)據(jù)添加到參考數(shù)據(jù)成為更新后的參 考數(shù)據(jù)中,計算更新后的參考數(shù)據(jù)之間的相關(guān)系數(shù),并利用更新后的參考數(shù)據(jù)之間的相關(guān) 系數(shù)構(gòu)建擾動網(wǎng)絡(luò)。
[003引在本步驟中,按照傳統(tǒng)的方式計算基因間的相關(guān)系數(shù),建立一個新的擾動網(wǎng)絡(luò),如 圖3所示的b。
[0039] 步驟S3 :計算擾動網(wǎng)絡(luò)和參考網(wǎng)絡(luò)之間的每條邊的相關(guān)系數(shù)的差值并計算每條 邊的相關(guān)系數(shù)的差值在標(biāo)準(zhǔn)正態(tài)分布中的Z值。
[0040] 在單樣本網(wǎng)絡(luò)方法的基礎(chǔ)上,計算每條邊的相關(guān)系數(shù)的差值在標(biāo)準(zhǔn)正態(tài)分布中的 Z值,利用統(tǒng)計學(xué)理論推導(dǎo)出化arson相關(guān)系數(shù)在單樣本網(wǎng)絡(luò)上的應(yīng)用公式為:
[0041 ]
陽042] 其中Δ PCC。為差異相關(guān)系數(shù),PCC。為η個樣本的相關(guān)系數(shù)。
[0043] 本步驟的實施如圖3所示的c。
[0044] 步驟S4 :計算得到的標(biāo)準(zhǔn)正態(tài)分布中的Z值對應(yīng)的概率值,基于概率值和預(yù)設(shè)值 的大小關(guān)系確定概率值對應(yīng)的邊是否在統(tǒng)計上顯著。
[0045] 本實施例中的預(yù)設(shè)值為0. 05,如果一條邊的概率值(p-value)小于0. 05,則認(rèn)為 運(yùn)條邊在統(tǒng)計上顯著,如果一條邊的概率值(p-value)大于0.05,則認(rèn)為運(yùn)條邊在統(tǒng)計上 不顯著。
[0046] 步驟S5:保留統(tǒng)計上顯著的邊,消除統(tǒng)計上不顯著的邊,從而得到基于個體單樣 本的個體特異性網(wǎng)絡(luò)。
[0047] 圖2示出了本發(fā)明的基于單樣本數(shù)據(jù)的個體特異性網(wǎng)絡(luò)構(gòu)建裝置的較佳實施例 的原理。請參見圖1,本實施例的個體特異性網(wǎng)絡(luò)構(gòu)建裝置包括:參考網(wǎng)絡(luò)構(gòu)建模塊1、擾動 網(wǎng)絡(luò)構(gòu)建模塊2、差值分布模塊3、邊顯著統(tǒng)計模塊4、W及邊處理模塊5。
[0048] 參考網(wǎng)絡(luò)構(gòu)建模塊1利用特定表象的表達(dá)數(shù)據(jù)作為參考數(shù)據(jù),計算參考數(shù)據(jù)之間 的相關(guān)系數(shù)并利用參考數(shù)據(jù)之間的相關(guān)系數(shù)構(gòu)建參考網(wǎng)絡(luò)。將已有的特定表象的表達(dá)數(shù)據(jù) 比如正常情況下的表達(dá)數(shù)據(jù)作為疾病研究的參考數(shù)據(jù),此類數(shù)據(jù)主要是基因表達(dá)數(shù)據(jù),主 要W Microarray和RNA-Seq產(chǎn)生的數(shù)據(jù)為主,對于其他符合標(biāo)準(zhǔn)的數(shù)據(jù),如蛋白質(zhì)譜數(shù)據(jù), 也可W應(yīng)用于本方法。
[0049] 擾動網(wǎng)絡(luò)構(gòu)建模塊2將需要構(gòu)建的個體單樣本的表達(dá)數(shù)據(jù)添加到參考數(shù)據(jù)成為 更新后的參考數(shù)據(jù)中,計算更新后的參考數(shù)據(jù)之間的相關(guān)系數(shù),并利用更新后的參考數(shù)據(jù) 之間的相關(guān)系數(shù)構(gòu)建擾動網(wǎng)絡(luò)。
[0050] 差值分布模塊3計算擾動網(wǎng)絡(luò)和參考網(wǎng)絡(luò)之間的每條邊的相關(guān)系數(shù)的差值并計 算每條邊的相關(guān)系數(shù)的差值在標(biāo)準(zhǔn)正態(tài)分布中的Z值。
[0051] 差值分布模塊3計算每條邊的相關(guān)系數(shù)的差值在標(biāo)準(zhǔn)正態(tài)分布中的Z值的公式 為:
[0052]
[0053] 其中Δ PCC。為差異相關(guān)系數(shù),PCC。為η個樣本的相關(guān)系數(shù)。
[0054] 邊顯著統(tǒng)計模塊4計算得到的標(biāo)準(zhǔn)正態(tài)分布中的Ζ值對應(yīng)的概率值,基于概率值 和預(yù)設(shè)值的大小關(guān)系確定概率值對應(yīng)的邊是否在統(tǒng)計上顯著。本實施例中的預(yù)設(shè)值例如為 0.05,如果一條邊的概率值(p-value)小于0.05,則認(rèn)為運(yùn)條邊在統(tǒng)計上顯著,如果一條邊 的概率值(p-value)大于0.05,則認(rèn)為運(yùn)條邊在統(tǒng)計上不顯著。 陽化5] 邊處理模塊5保留統(tǒng)計上顯著的邊,消除統(tǒng)計上不顯著的邊,從而得到基于個體 單樣本的個體特異性網(wǎng)絡(luò)。
[0056] 盡管為使解釋簡單化將上述方法圖示并描述為一系列動作,但是應(yīng)理解并領(lǐng)會, 運(yùn)些方法不受動作的次序所限,因為根據(jù)一個或多個實施例,一些動作可按不同次序發(fā)生 和/或與來自本文中圖示和描述或本文中未圖示和描述但本領(lǐng)域技術(shù)人員可W理解的其 他動作并發(fā)地發(fā)生。
[0057] 本領(lǐng)域技術(shù)人員將進(jìn)一步領(lǐng)會,結(jié)合本文中所公開的實施例來描述的各種解說性 邏輯板塊、模塊、電路、和算法步驟可實現(xiàn)為電子硬件、計算機(jī)軟件、或運(yùn)兩者的組合。為清 楚地解說硬件與軟件的運(yùn)一可互換性,各種解說性組件、框、模塊、電路、和步驟在上面是W 其功能性的形式作一般化描述的。此類功能性是被實現(xiàn)為硬件還是軟件取決于具體應(yīng)用和 施加于整體系統(tǒng)的設(shè)計約束。技術(shù)人員對于每種特定應(yīng)用可用不同的方式來實現(xiàn)所描述的 功能性,但運(yùn)樣的實現(xiàn)決策不應(yīng)被解讀成導(dǎo)致脫離了本發(fā)明的范圍。
[0058] 結(jié)合本文所公開的實施例描述的各種解說性邏輯板塊、模塊、和電路可用通用處 理器、數(shù)字信號處理器值SP)、專用集成電路(ASIC)、現(xiàn)場可編程口陣列(FPGA)或其它可編 程邏輯器件、分立的口或晶體管邏輯、分立的硬件組件、或其設(shè)計成執(zhí)行本文所描述功能的 任何組合來實現(xiàn)或執(zhí)行。通用處理器可W是微處理器,但在替換方案中,該處理器可W是任 何常規(guī)的處理器、控制器、微控制器、或狀態(tài)機(jī)。處理器還可W被實現(xiàn)為計算設(shè)備的組合,例 如DSP與微處理器的組合、多個微處理器、與DSP核屯、協(xié)作的一個或多個微處理器、或任何 其他此類配置。
[0059] 結(jié)合本文中公開的實施例描述的方法或算法的步驟可直接在硬件中、在由處理器 執(zhí)行的軟件模塊中、或在運(yùn)兩者的組合中體現(xiàn)。軟件模塊可駐留在RAM存儲器、閃存、ROM存 儲器、EPROM存儲器、EEPR0M存儲器、寄存器、硬盤、可移動盤、CD-ROM、或本領(lǐng)域中所知的任 何其他形式的存儲介質(zhì)中。示例性存儲介質(zhì)禪合到處理器W使得該處理器能從/向該存儲 介質(zhì)讀取和寫入信息。在替換方案中,存儲介質(zhì)可W被整合到處理器。處理器和存儲介質(zhì) 可駐留在ASIC中。ASIC可駐留在用戶終端中。在替換方案中,處理器和存儲介質(zhì)可作為分 立組件駐留在用戶終端中。
[0060] 在一個或多個示例性實施例中,所描述的功能可在硬件、軟件、固件或其任何組合 中實現(xiàn)。如果在軟件中實現(xiàn)為計算機(jī)程序產(chǎn)品,則各功能可W作為一條或更多條指令或代 碼存儲在計算機(jī)可讀介質(zhì)上或藉其進(jìn)行傳送。計算機(jī)可讀介質(zhì)包括計算機(jī)存儲介質(zhì)和通信 介質(zhì)兩者,其包括促成計算機(jī)程序從一地向另一地轉(zhuǎn)移的任何介質(zhì)。存儲介質(zhì)可W是能被 計算機(jī)訪問的任何可用介質(zhì)。作為示例而非限定,運(yùn)樣的計算機(jī)可讀介質(zhì)可包括ram、rom、 EEPR0M、CD-ROM或其它光盤存儲、磁盤存儲或其它磁存儲設(shè)備、或能被用來攜帶或存儲指令 或數(shù)據(jù)結(jié)構(gòu)形式的合意程序代碼且能被計算機(jī)訪問的任何其它介質(zhì)。任何連接也被正當(dāng) 地稱為計算機(jī)可讀介質(zhì)。例如,如果軟件是使用同軸電纜、光纖電纜、雙絞線、數(shù)字訂戶線 值化)、或諸如紅外、無線電、W及微波之類的無線技術(shù)從web網(wǎng)站、服務(wù)器、或其它遠(yuǎn)程源 傳送而來,則該同軸電纜、光纖電纜、雙絞線、DSL、或諸如紅外、無線電、W及微波之類的無 線技術(shù)就被包括在介質(zhì)的定義之中。如本文中所使用的盤(disk)和碟(disc)包括壓縮碟 (CD)、激光碟、光碟、數(shù)字多用碟值VD)、軟盤和藍(lán)光碟,其中盤(disk)往往W磁的方式再現(xiàn) 數(shù)據(jù),而碟(disc)用激光W光學(xué)方式再現(xiàn)數(shù)據(jù)。上述的組合也應(yīng)被包括在計算機(jī)可讀介質(zhì) 的范圍內(nèi)。
[0061] 提供對本公開的先前描述是為使得本領(lǐng)域任何技術(shù)人員皆能夠制作或使用本公 開。對本公開的各種修改對本領(lǐng)域技術(shù)人員來說都將是顯而易見的,且本文中所定義的普 適原理可被應(yīng)用到其他變體而不會脫離本公開的精神或范圍。由此,本公開并非旨在被限 定于本文中所描述的示例和設(shè)計,而是應(yīng)被授予與本文中所公開的原理和新穎性特征相一 致的最廣范圍。
【主權(quán)項】
1. 一種基于單樣本數(shù)據(jù)的個體特異性網(wǎng)絡(luò)構(gòu)建方法,包括: 利用特定表象的表達(dá)數(shù)據(jù)作為參考數(shù)據(jù),計算參考數(shù)據(jù)之間的相關(guān)系數(shù)并利用參考數(shù) 據(jù)之間的相關(guān)系數(shù)構(gòu)建參考網(wǎng)絡(luò); 將需要構(gòu)建的個體單樣本的表達(dá)數(shù)據(jù)添加到參考數(shù)據(jù)成為更新后的參考數(shù)據(jù)中,計算 更新后的參考數(shù)據(jù)之間的相關(guān)系數(shù),并利用更新后的參考數(shù)據(jù)之間的相關(guān)系數(shù)構(gòu)建擾動網(wǎng) 絡(luò); 計算擾動網(wǎng)絡(luò)和參考網(wǎng)絡(luò)之間的每條邊的相關(guān)系數(shù)的差值并計算每條邊的相關(guān)系數(shù) 的差值在標(biāo)準(zhǔn)正態(tài)分布中的Z值; 計算得到的標(biāo)準(zhǔn)正態(tài)分布中的Z值對應(yīng)的概率值,基于概率值和預(yù)設(shè)值的大小關(guān)系確 定概率值對應(yīng)的邊是否在統(tǒng)計上顯著; 保留統(tǒng)計上顯著的邊,消除統(tǒng)計上不顯著的邊,從而得到基于個體單樣本的個體特異 性網(wǎng)絡(luò)。2. 根據(jù)權(quán)利要求1所述的基于單樣本數(shù)據(jù)的個體特異性網(wǎng)絡(luò)構(gòu)建方法,其特征在于, 計算每條邊的相關(guān)系數(shù)的差值在標(biāo)準(zhǔn)正態(tài)分布中的Z值的公式為:其中A PCC。為差異相關(guān)系數(shù),PCC。為n個樣本的相關(guān)系數(shù)。3. 根據(jù)權(quán)利要求1所述的基于單樣本數(shù)據(jù)的個體特異性網(wǎng)絡(luò)構(gòu)建方法,其特征在于, 預(yù)設(shè)值為0. 05。4. 根據(jù)權(quán)利要求1至3中任一項所述的基于單樣本數(shù)據(jù)的個體特異性網(wǎng)絡(luò)構(gòu)建方法, 其特征在于,表達(dá)數(shù)據(jù)包括基因表達(dá)數(shù)據(jù)、蛋白質(zhì)譜數(shù)據(jù)。5. -種基于單樣本數(shù)據(jù)的個體特異性網(wǎng)絡(luò)構(gòu)建裝置,包括: 參考網(wǎng)絡(luò)構(gòu)建模塊,利用特定表象的表達(dá)數(shù)據(jù)作為參考數(shù)據(jù),計算參考數(shù)據(jù)之間的相 關(guān)系數(shù)并利用參考數(shù)據(jù)之間的相關(guān)系數(shù)構(gòu)建參考網(wǎng)絡(luò); 擾動網(wǎng)絡(luò)構(gòu)建模塊,將需要構(gòu)建的個體單樣本的表達(dá)數(shù)據(jù)添加到參考數(shù)據(jù)成為更新后 的參考數(shù)據(jù)中,計算更新后的參考數(shù)據(jù)之間的相關(guān)系數(shù),并利用更新后的參考數(shù)據(jù)之間的 相關(guān)系數(shù)構(gòu)建擾動網(wǎng)絡(luò); 差值分布模塊,計算擾動網(wǎng)絡(luò)和參考網(wǎng)絡(luò)之間的每條邊的相關(guān)系數(shù)的差值并計算每條 邊的相關(guān)系數(shù)的差值在標(biāo)準(zhǔn)正態(tài)分布中的Z值; 邊顯著統(tǒng)計模塊,計算得到的標(biāo)準(zhǔn)正態(tài)分布中的Z值對應(yīng)的概率值,基于概率值和預(yù) 設(shè)值的大小關(guān)系確定概率值對應(yīng)的邊是否在統(tǒng)計上顯著; 邊處理模塊,保留統(tǒng)計上顯著的邊,消除統(tǒng)計上不顯著的邊,從而得到基于個體單樣本 的個體特異性網(wǎng)絡(luò)。6. 根據(jù)權(quán)利要求5所述的基于單樣本數(shù)據(jù)的個體特異性網(wǎng)絡(luò)構(gòu)建裝置,其特征在于, 差值分布模塊計算每條邊的相關(guān)系數(shù)的差值在標(biāo)準(zhǔn)正態(tài)分布中的Z值的公式為:其中A PCC。為差異相關(guān)系數(shù),PCC。為n個樣本的相關(guān)系數(shù)。7. 根據(jù)權(quán)利要求5所述的基于單樣本數(shù)據(jù)的個體特異性網(wǎng)絡(luò)構(gòu)建裝置,其特征在于, 邊顯著統(tǒng)計模塊中的預(yù)設(shè)值為0. 05。8. 根據(jù)權(quán)利要求5至7中任一項所述的基于單樣本數(shù)據(jù)的個體特異性網(wǎng)絡(luò)構(gòu)建方法, 其特征在于,表達(dá)數(shù)據(jù)包括基因表達(dá)數(shù)據(jù)、蛋白質(zhì)譜數(shù)據(jù)。
【文檔編號】G06F19/26GK105989250SQ201510058477
【公開日】2016年10月5日
【申請日】2015年2月4日
【發(fā)明人】陳洛南, 劉小平, 合原幸, 合原一幸
【申請人】中國科學(xué)院上海生命科學(xué)研究院