專利名稱:基于蛋白質(zhì)網(wǎng)絡(luò)的藥物靶標(biāo)確定和/或藥物功能確定方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種新的確定藥物靶標(biāo)和/或確定藥物新功能的方法,即 基于蛋白質(zhì)相互作用網(wǎng)絡(luò)的藥物靶標(biāo)確定和/或藥物功能確定方法。
背景技術(shù):
近些年來(lái),雖然在藥物開發(fā)中投入的經(jīng)費(fèi)越來(lái)越多,但每年由美國(guó)食品及藥物管理局(FDA)批準(zhǔn)的新藥物個(gè)數(shù)一直沒有增加。不僅如此,人類基因組的全部測(cè)序也沒有像預(yù)期那樣給藥物開發(fā)帶來(lái)一個(gè)飛躍,每年只有2 3個(gè)新的基因被確定為藥物的靶標(biāo),而大多數(shù)的藥物還都是針對(duì)已有的藥物靶標(biāo)基因而設(shè)計(jì)。同時(shí),每年又都會(huì)有很多藥物因臨床上出現(xiàn)的各種各樣非預(yù)期的問(wèn)題被回收。這種高投入,低產(chǎn)出的問(wèn)題一直是新藥物開發(fā)中的一個(gè)難題。針對(duì)已有的知識(shí)對(duì)藥物潛在的靶標(biāo)進(jìn)行預(yù)測(cè)是解決這一難題的一個(gè)很好途徑。通過(guò)對(duì)藥物潛在的靶標(biāo)進(jìn)行定位,我們可以深入理解藥物作用的機(jī)制,預(yù)測(cè)藥物的潛在功能、 副作用等關(guān)鍵信息,并為我們研發(fā)新藥物提供幫助。以往對(duì)藥物靶標(biāo)進(jìn)行預(yù)測(cè)的研究主要可以分為兩類。一類是基于藥物的藥理作用或治療作用,簡(jiǎn)稱藥物作用;另一類是基于藥物本身的化學(xué)結(jié)構(gòu)特點(diǎn)。基于藥物作用的方法認(rèn)為如果藥物具有相似的作用,那它們可能有相同的靶標(biāo),從而通過(guò)已有靶標(biāo)的藥物來(lái)推斷未知靶標(biāo)的藥物。基于結(jié)構(gòu)的方法認(rèn)為藥物如果結(jié)構(gòu)類似,那么它們有可能與相似的蛋白質(zhì)綁定、有相似的靶標(biāo)。目前研究的局限主要在于1.以上兩種假設(shè)并不是總是成立。眾多研究已經(jīng)發(fā)現(xiàn),藥物可能會(huì)由于干預(yù)相同信號(hào)轉(zhuǎn)導(dǎo)通路(pattway)的不同功能蛋白而產(chǎn)生相似的作用。因而,簡(jiǎn)單認(rèn)為具有相似的作用就有相同的靶標(biāo)是不完全合理的。而基于結(jié)構(gòu)的預(yù)測(cè)方法也有局限,因?yàn)橐阎承┧幬镫m然結(jié)構(gòu)差異很大,但作用機(jī)理和靶標(biāo)完全相似。2.以往的研究往往是將這兩種預(yù)測(cè)思路分開,而沒有同時(shí)利用藥物作用和結(jié)構(gòu)信肩、ο3.更重要的是,以上研究只能在小規(guī)模上展開,而且沒有充分利用藥物靶標(biāo)的相互作用等多種信息。本發(fā)明人的前期研究工作發(fā)現(xiàn)利用基因在生物網(wǎng)絡(luò)上的距離能夠有效地解釋疾病表型的相似性,在此基礎(chǔ)上通過(guò)建立特定的回歸模型,能夠?qū)崿F(xiàn)在全基因組水平上對(duì)于致病基因的大規(guī)模預(yù)測(cè),并達(dá)到了目前最高的致病基因預(yù)測(cè)精度(發(fā)章發(fā)表于mi X, Jiang R, Zhang MQ, Li S. Network-based global inferenceof human disease genes. Molecular Systems Biology 2008 ;4 :189)。本論文發(fā)表后在國(guó)際上取得了較大影響,例如Nature出版集團(tuán)的四個(gè)領(lǐng)域選為重要文章,NatureChina作為亮點(diǎn)專題報(bào)道;美國(guó)醫(yī)學(xué)信息學(xué)會(huì)“轉(zhuǎn)化生物信息學(xué)(TranslationalBioinformatics) 2009峰會(huì)”將本文作為年度選評(píng)論文之一,評(píng)價(jià)本成果“基于分子數(shù)據(jù),創(chuàng)建了一種新的疾病分類方法(create a new classification of diseasebased on molecular (1已七8),,,等。
以上研究積累,為我們突破當(dāng)前藥物靶標(biāo)研究的局限,提出并建立新的藥物靶標(biāo)確定、藥物功能發(fā)現(xiàn)方法,奠定了很好的基礎(chǔ)。
發(fā)明內(nèi)容
根據(jù)本發(fā)明的一個(gè)方面,提供了一種藥物靶標(biāo)確定方法,其特征在于包括確定一個(gè)已知藥物集中的一個(gè)第一藥物和一個(gè)第一蛋白質(zhì)之間的相互作用關(guān)系評(píng)價(jià)指標(biāo),所述評(píng)價(jià)指標(biāo)綜合了所述第一藥物和所述第一蛋白質(zhì)之間在藥物作用相似度的權(quán)重系數(shù)估計(jì)值和和藥物結(jié)構(gòu)相似度的權(quán)重系數(shù)估計(jì)值;所述第一藥物到所述藥物集中的其他所有藥物的作用相似度的分布;所述第一藥物到所述藥物集中的其他所有藥物的結(jié)構(gòu)相似度的分布;所述蛋白質(zhì)到所述藥物集中的所有藥物的親近度的分布。
圖1顯示了一個(gè)ATC編碼樹狀示例的結(jié)構(gòu)示意圖。圖2示意顯示了藥物-蛋白質(zhì)的親近度9W。
具體實(shí)施例方式本發(fā)明人在研究中發(fā)現(xiàn)1.具有相似治療作用的藥物,它們?cè)诎袠?biāo)上的相關(guān)性可以體現(xiàn)在存在同一條生物通路的基因產(chǎn)物、或者在蛋白質(zhì)網(wǎng)絡(luò)(即蛋白質(zhì)相互作用網(wǎng)絡(luò),Protein-Protein Interaction Network,簡(jiǎn)稱為PPI網(wǎng)絡(luò))中緊密聯(lián)系的蛋白等。正是由于它們靶標(biāo)在生物過(guò)程中的相關(guān)性及模塊性,導(dǎo)致了它們治療作用上的相似性。2.結(jié)構(gòu)上相似的藥物可能會(huì)作用于具有相似4級(jí)結(jié)構(gòu)的蛋白質(zhì)上。而這種三維中的蛋白結(jié)構(gòu)的相似性往往與其功能的相關(guān)性有直接的關(guān)系,例如在蛋白質(zhì)相互作用網(wǎng)絡(luò)上具有緊密聯(lián)系。基于以上分析,本發(fā)明人認(rèn)為,藥物治療作用的相似性(TherapeuticSimilarity, 下文簡(jiǎn)稱為TS)以及藥物化學(xué)結(jié)構(gòu)上的相似性(Chemical Similarity,下文簡(jiǎn)稱為CS),以上二者是與藥物作用的靶標(biāo)在PPI網(wǎng)絡(luò)中的模塊性相關(guān)的。這種“模塊性”可以體現(xiàn)為PPI 網(wǎng)絡(luò)中的緊密連接的子聚團(tuán),或者為最短距離非常接近的多個(gè)蛋白質(zhì)。基于這個(gè)理解,本發(fā)明人建立了一種基于蛋白質(zhì)相互作用網(wǎng)絡(luò)的藥物靶標(biāo)預(yù)測(cè)方法,稱之為drugCIPHER。根據(jù)本發(fā)明的一個(gè)實(shí)施例的基于蛋白質(zhì)網(wǎng)絡(luò)的藥物靶標(biāo)預(yù)測(cè)方法(drugCIPHER) 包括1.提出新的衡量藥物作用相似性的方法——基于語(yǔ)義網(wǎng)絡(luò)的藥物作用相似性衡量,用于計(jì)算藥物作用相似性(TS);2.綜合藥物作用相似性、化學(xué)結(jié)構(gòu)相似性,構(gòu)成藥物相似性網(wǎng)絡(luò),同時(shí)利用藥物靶標(biāo)所構(gòu)成的靶標(biāo)網(wǎng)絡(luò),建立藥物網(wǎng)絡(luò)與靶標(biāo)網(wǎng)絡(luò)這兩層網(wǎng)絡(luò)關(guān)聯(lián)的回歸模型,從而利用靶標(biāo)網(wǎng)絡(luò)的相互作用信息來(lái)解釋藥物的相似性。如果某一靶標(biāo)在網(wǎng)絡(luò)中的相互作用信息,與藥物的相似性信息吻合的越好,那么這個(gè)靶標(biāo)就越可能是這個(gè)藥物作用的靶標(biāo)。本發(fā)明的藥物靶標(biāo)確定方法可以對(duì)這種吻合程度進(jìn)行量化(即下文公式4定義的“親近度Φ^”),從而確定藥物的靶標(biāo),如果出現(xiàn)親近度很高的靶標(biāo),而這個(gè)靶標(biāo)目前并沒有報(bào)道,則成為藥物的新靶標(biāo)。3.利用藥物靶標(biāo)所組成的特征向量的相似性,發(fā)現(xiàn)藥物的新功能或副作用。按照該方法,發(fā)明人對(duì)7 種藥物組成的一個(gè)藥物集中的所有藥物靶標(biāo)進(jìn)行了預(yù)測(cè)。同時(shí),發(fā)明人發(fā)現(xiàn)將藥物作用信息和自身的化學(xué)結(jié)構(gòu)信息結(jié)合起來(lái)能夠起到更好的效果,并能夠預(yù)測(cè)出藥物的新功能和副作用。本方法適用于藥物靶標(biāo)預(yù)測(cè)、藥物新功能發(fā)現(xiàn)、 組合藥物發(fā)現(xiàn)、藥物副作用發(fā)現(xiàn)等多個(gè)領(lǐng)域。值得注意的是,本方法不僅限于將藥物作用相似度(TS)和結(jié)構(gòu)相似度(CS)作為輸入的實(shí)施例中。用drugBank等其它各種數(shù)據(jù)庫(kù)中記載的有關(guān)藥物治療作用、藥理作用、毒理作用、副作用等信息,都可以用于本方法計(jì)算相似度的依據(jù),也均屬于本專利的保護(hù)范圍。藥物作用的相似度(TS)為了衡量藥物作用上的相似度,發(fā)明人利用了世界衛(wèi)生組織藥物統(tǒng)計(jì)中心編制的解剖-治療-化學(xué)的藥物分類編碼系統(tǒng)(Anatomic Therapeutic Chemicalclassification system,下文簡(jiǎn)稱 ATC。見http://www. whocc. no/atcddd/)。ATC 分類系統(tǒng)是一個(gè) 5 層的編碼系統(tǒng),各稱為大類碼、亞類碼、一級(jí)次亞類碼、二級(jí)次亞類碼和品名碼。其中大類碼按解剖學(xué)分類方法進(jìn)行分類,亞類碼和一級(jí)次亞類碼按治療學(xué)分類方法進(jìn)行分類,二級(jí)次亞類碼則按化學(xué)品和治療學(xué)混合分類法進(jìn)行分類。藥品ATC碼分別記錄了藥物不同層次的特點(diǎn)。 每一個(gè)藥物被分配給一個(gè)或多個(gè)ATC編碼,而同一個(gè)ATC編碼又有可能對(duì)應(yīng)多個(gè)藥物。ATC 編碼共有5部分,分別記錄了對(duì)應(yīng)ATC分類系統(tǒng)的5層信息。例如,ATC編碼為A10BA02代表著如表1所示的含義。表IATC編碼示例
權(quán)利要求
1.藥物靶標(biāo)確定方法,其特征在于包括確定一個(gè)已知藥物集中的一個(gè)第一藥物(d)和一個(gè)第一蛋白質(zhì)(P)之間的相互作用關(guān)系評(píng)價(jià)指標(biāo),所述評(píng)價(jià)指標(biāo)綜合了 所述第一藥物(d)和所述第一蛋白質(zhì)(P)之間在藥物作用相似度(化)的權(quán)重系數(shù)估計(jì)值(《W)和和藥物結(jié)構(gòu)相似度(CS)的權(quán)重系數(shù)估計(jì)值(^piO;所述第一藥物(d)到所述藥物集中的其他所有藥物的作用相似度(TSd)的分布;所述第一藥物(d)到所述藥物集中的其他所有藥物的結(jié)構(gòu)相似度(CSd)的分布;所述蛋白質(zhì)(P)到所述藥物集中的所有藥物的親近度(φρ)的分布。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于所述作用相似度0 )由作用相似度向量 (TSd= ITSddl,TSdd2...TSddnD表征,所述作用相似度向量的每個(gè)分量為所述第一藥物與另一藥物所對(duì)應(yīng)的ATC編碼的一個(gè)相似度的最大值。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于所述ATC編碼的相似度為所述第一藥物與所述另一藥物所分別對(duì)應(yīng)ATC編碼的兩個(gè)葉節(jié)點(diǎn)(i,j)在所述藥物集中分別出現(xiàn)的頻率和它們最長(zhǎng)前綴出現(xiàn)的頻率的函數(shù),該函數(shù)可以由下式表征
4.根據(jù)權(quán)利要求2或3所述的方法,其特征在于所述結(jié)構(gòu)相似度(CSd)由結(jié)構(gòu)相似度向量為(C&= ICSddl,CSdd2... CSddnD表征,該結(jié)構(gòu)相似度向量的每個(gè)分量為所述第一藥物與另一藥物的分子子結(jié)構(gòu)的交集與這兩個(gè)藥物子結(jié)構(gòu)的并集之比。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于所述親近度(Φρ)由所述蛋白質(zhì)(ρ)到所述藥物集中的所有藥物的親近度向量為
6.根據(jù)權(quán)利要求5所述的方法,其特征在于所述親近度((Py)由下式表征
7.根據(jù)權(quán)利要求6的方法,其特征在于藥物作用相似度(TS)的權(quán)重系數(shù)估計(jì)值彳《W) 和藥物結(jié)構(gòu)相似度(CS)的權(quán)重系數(shù)估計(jì)值(^pO是從回歸模型
8.根據(jù)權(quán)利要求1的方法,其特征在于為了將( 式簡(jiǎn)化,根據(jù)本發(fā)明的一個(gè)實(shí)施例,那些對(duì)所述式( 貢獻(xiàn)最大的藥物能夠很好地?cái)M合下式的情況下
9.根據(jù)權(quán)利要求8的方法,根據(jù)(7)式,任意一個(gè)藥物都得到一個(gè)對(duì)應(yīng)所有蛋白質(zhì)的特征向量,即藥物靶標(biāo)特征向量。利用這一藥物靶標(biāo)特征向量的相似度,可以進(jìn)行藥物新功能和副作用的預(yù)測(cè)。
全文摘要
藥物靶標(biāo)確定方法,其特征在于包括確定一個(gè)已知藥物集中的一個(gè)第一藥物(d)和一個(gè)第一蛋白質(zhì)(p)之間的相互作用關(guān)系評(píng)價(jià)指標(biāo),所述評(píng)價(jià)指標(biāo)綜合了所述第一藥物(d)和所述第一蛋白質(zhì)(p)之間在藥物作用相似度(TS)的權(quán)重系數(shù)估計(jì)值和和藥物結(jié)構(gòu)相似度(CS)的權(quán)重系數(shù)估計(jì)值所述第一藥物(d)到所述藥物集中的其他所有藥物的作用相似度(TSd)的分布;所述第一藥物(d)到所述藥物集中的其他所有藥物的結(jié)構(gòu)相似度(CSd)的分布;所述蛋白質(zhì)(p)到所述藥物集中的所有藥物的親近度(Φp)的分布。以上藥物靶標(biāo)確定方法還可有效發(fā)現(xiàn)藥物的新功能或副作用。
文檔編號(hào)G06F19/18GK102298674SQ201010218468
公開日2011年12月28日 申請(qǐng)日期2010年6月25日 優(yōu)先權(quán)日2010年6月25日
發(fā)明者李梢, 趙世文 申請(qǐng)人:清華大學(xué)