亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

基于基因表達(dá)和藥物靶標(biāo)的藥物活性預(yù)測(cè)與篩選方法

文檔序號(hào):10687415閱讀:2605來(lái)源:國(guó)知局
基于基因表達(dá)和藥物靶標(biāo)的藥物活性預(yù)測(cè)與篩選方法
【專利摘要】本發(fā)明公開(kāi)了一種基于基因表達(dá)和藥物靶標(biāo)的藥物活性預(yù)測(cè)與篩選方法,包括以下步驟:1)根據(jù)藥物靶標(biāo)數(shù)據(jù)庫(kù)中的信息,獲取待測(cè)藥物對(duì)應(yīng)的靶基因;獲取病人的疾病組織的基因表達(dá)數(shù)據(jù)以及相應(yīng)對(duì)照數(shù)據(jù),通過(guò)系統(tǒng)生物學(xué)的方法計(jì)算評(píng)價(jià)基因的重要性,得出在該病人發(fā)病過(guò)程中的重要基因列表;2)通過(guò)統(tǒng)計(jì)分析查看步驟1)中得到的待測(cè)藥物的靶基因是否靶向了該病人發(fā)病過(guò)程中的重要基因列表來(lái)預(yù)測(cè)該待測(cè)藥物對(duì)于該病人的活性,篩選適合該病人的藥物。本發(fā)明的方法易于使用、效率高、適用范圍廣,本發(fā)明的預(yù)測(cè)方法可以用于篩選針對(duì)特定病人個(gè)體的適合藥物,從而為該病人提供個(gè)性化的治療方案。
【專利說(shuō)明】
基于基因表達(dá)和藥物靶標(biāo)的藥物活性預(yù)測(cè)與篩選方法
技術(shù)領(lǐng)域
[0001]本發(fā)明涉及生物醫(yī)藥技術(shù)領(lǐng)域,尤其涉及一種基于基因表達(dá)和藥物靶標(biāo)數(shù)據(jù)、針對(duì)某個(gè)病人個(gè)體進(jìn)行藥物活性預(yù)測(cè)與藥物篩選的方法。
【背景技術(shù)】
[0002]精準(zhǔn)醫(yī)療(Precis1n Medicine)是指利用基因組、轉(zhuǎn)錄組、蛋白組等高通量生物數(shù)據(jù),通過(guò)生物信息學(xué)等技術(shù)手段來(lái)對(duì)一種疾病不同狀態(tài)和過(guò)程進(jìn)行精確分類(lèi),最終實(shí)現(xiàn)對(duì)于疾病和特定患者進(jìn)行個(gè)性化精準(zhǔn)治療,從而提高疾病診治與預(yù)防的效益(可參見(jiàn):Collins F S,Varmus H.A new initiative on precis1n medicine[J].N Engl J Med,2015,372(9):793-795.)的概念與醫(yī)療模式。對(duì)于癌癥等復(fù)雜疾病,精準(zhǔn)化醫(yī)療具有重要的意義(可參見(jiàn):Friedman A A,Letai A,Fisher D E , et al.Precis1n medicine forcancer with next-generat1n funct1nal diagnostics[J].Nature Reviews Cancer,2015,15(12): 747-756.),而預(yù)測(cè)某種藥物或某種組合藥物對(duì)病人的藥效是精準(zhǔn)化醫(yī)療中的重要課題(可參見(jiàn):Dittmer J , Leyh B.The impact of tumor stroma on drugresponse in breast cancer[J].Seminars In Cancer B1logy,2015,31:3-15.;Petrillo M,Zannoni G F,Beltrame L,et al.1dentificat1n of high-grade serousovarian cancer miRNA species associated with survival and drug response inpatients receiving neoadjuvant chemotherapy:a retrospective longitudinalanalysis using matched tumor b1psies[J].Annals Of Oncology,2016,27(4):625-634.)。
[0003]目前的方法主要從生物醫(yī)學(xué)大數(shù)據(jù)出發(fā),以遺傳學(xué)為基礎(chǔ),建立疾病人群的基因型-表型關(guān)聯(lián)(可參見(jiàn):Low S K , Takahashi A ,Mushiroda T , et al.Genome-wideassociat1n study: a useful tool to identify common genetic variantsassociated with drug toxicity and efficacy in cancer pharmacogenomics[J]? Clinical Cancer Research,2014,20( 10): 2541-2552.),然后根據(jù)基因型進(jìn)行有針對(duì)性的治療。該思路有兩個(gè)潛在的困難:1、由于疾病對(duì)應(yīng)基因型的外顯率(penetrance)不清楚,因此所建立的基因型-表型關(guān)聯(lián)在應(yīng)用于患者個(gè)體時(shí)效果不能保證,發(fā)現(xiàn)的關(guān)聯(lián)通常不具有臨床應(yīng)用價(jià)值(可參見(jiàn):AK M, JP I, IS K.Cl inical Genomics: From PathogenicityClaims to Quantitative Risk Estimates[J].JAMA,2016.) ;2、米用的各種遺傳學(xué)推斷大都基于統(tǒng)計(jì)學(xué)和有限的樣本,因此只能揭示表面的基因型-表型關(guān)聯(lián),缺乏對(duì)疾病機(jī)制的解釋,據(jù)此建立的預(yù)測(cè)模型推廣性不強(qiáng)。如果考慮到除了 DNA的突變,病人還存在表觀修飾等方面的個(gè)體差異,目前基于遺傳學(xué)的個(gè)體化醫(yī)療策略將更難實(shí)施(可參見(jiàn):Manrai A K,1annidis J P,Kohane I S.Clinical Genomics: From Pathogenicity Claims toQuantitative Risk Estimates[J].JAMA,2016,315(12):1233-1234.)0
[0004]眾所周知,基因表達(dá)譜數(shù)據(jù)攜帶了個(gè)體間基因型、表觀修飾等各方面的差異,而且與表型的距離比較近,因此我們認(rèn)為從表達(dá)譜出發(fā)可能更有利于開(kāi)展個(gè)性化治療。也有學(xué)者通過(guò)對(duì)某個(gè)藥物響應(yīng)的病人的基因表達(dá)數(shù)據(jù)以及未響應(yīng)的病人的基因表達(dá)數(shù)據(jù)進(jìn)行差異表達(dá)分析,將差異表達(dá)基因作為特征,建立分類(lèi)器模型來(lái)預(yù)測(cè)某個(gè)病人對(duì)特定藥物是否口向應(yīng)(可參見(jiàn):Hatzis C1Pusztai L,Valero V,et al.A genomic predictor of responseand survival following taxane-anthracycline chemotherapy for invasive breastcancer[J].JAMA, 2011,305(18): 1873-1881.)。這類(lèi)方法取得了一定的效果,顯示了基因表達(dá)數(shù)據(jù)在預(yù)測(cè)病人對(duì)特定藥物的藥效方面的潛能。但是這種方法需要對(duì)每種疾病建立一個(gè)預(yù)測(cè)模型,而每種模型的構(gòu)建都需要大量的基因表達(dá)數(shù)據(jù)集,這大大影響了這類(lèi)方法的實(shí)用價(jià)值。同時(shí),由于癌癥等復(fù)雜疾病存在著高度的異質(zhì)性(可參見(jiàn):Burrell R A,McGranahan N,Bartek J,et al.The causes and consequences of geneticheterogeneity in cancer evolut1n[J].Nature,2013,501(7467):338-345.),這種完全數(shù)據(jù)驅(qū)動(dòng)、沒(méi)有考慮疾病背后的生物機(jī)制的方法存在著過(guò)擬合現(xiàn)象。

【發(fā)明內(nèi)容】

[0005]本發(fā)明的目的在于克服現(xiàn)有技術(shù)存在的不足之處而提供了基于基因表達(dá)譜和藥物靶標(biāo)的藥物活性預(yù)測(cè)及篩選方法,進(jìn)而實(shí)現(xiàn)病人的個(gè)性化治療。本發(fā)明的方法具有易于實(shí)現(xiàn)、效率高、適用范圍廣等優(yōu)點(diǎn),在精準(zhǔn)化醫(yī)療中的病人對(duì)特定藥物的藥效預(yù)測(cè),以及特定病人的藥物篩選方面具有廣闊的應(yīng)用前景。
[0006]本發(fā)明采用的技術(shù)方案為:一種基于基因表達(dá)和藥物靶標(biāo)的藥物活性預(yù)測(cè)與篩選方法,包括以下步驟:
[0007]I)根據(jù)藥物靶標(biāo)數(shù)據(jù)庫(kù)中的信息,獲取待測(cè)藥物對(duì)應(yīng)的靶基因;
[0008]獲取病人的疾病組織的基因表達(dá)數(shù)據(jù)以及相應(yīng)對(duì)照數(shù)據(jù),通過(guò)系統(tǒng)生物學(xué)的方法計(jì)算評(píng)價(jià)基因的重要性,得出在該病人發(fā)病過(guò)程中的重要基因列表;
[0009]2)通過(guò)統(tǒng)計(jì)分析查看步驟I)中得到的待測(cè)藥物的靶基因是否靶向了該病人發(fā)病過(guò)程中的重要基因列表來(lái)預(yù)測(cè)該待測(cè)藥物對(duì)于該病人的活性,篩選適合該病人的藥物。
[0010]在本發(fā)明中,待測(cè)藥物可為單一藥物,也可為組合藥物。當(dāng)待測(cè)藥物為單一藥物時(shí),所述靶基因即為此藥物對(duì)應(yīng)的靶基因;當(dāng)待測(cè)藥物為組合藥物時(shí),所述靶基因?yàn)榻M合藥物中每種藥物對(duì)應(yīng)的靶基因的并集。
[0011 ]作為對(duì)上述技術(shù)方案的進(jìn)一步改進(jìn),所述步驟I)中,通過(guò)fold-change的絕對(duì)值來(lái)計(jì)算評(píng)價(jià)基因的重要性。
[0012]作為對(duì)上述技術(shù)方案的進(jìn)一步改進(jìn),所述步驟I)中的藥物靶標(biāo)數(shù)據(jù)庫(kù)為DGIdb(Drug-Gene Interact1n database)、TTD(Therapeutic target database)和Drugbank中的至少一種。
[0013]作為對(duì)上述技術(shù)方案的更進(jìn)一步改進(jìn),所述待測(cè)藥物的靶基因?yàn)镈GIdb、TTD和Drugbank三個(gè)數(shù)據(jù)庫(kù)數(shù)據(jù)的靶基因數(shù)據(jù)的并集。
[0014]作為對(duì)上述技術(shù)方案的進(jìn)一步改進(jìn),所述步驟2)中,統(tǒng)計(jì)分析是指富集分析,通過(guò)分析步驟I)中得到的待測(cè)藥物的靶基因是否富集于該病人發(fā)病過(guò)程中的重要基因列表來(lái)確定其是否靶向了該病人發(fā)病過(guò)程中的重要基因列表。
[0015]作為對(duì)上述技術(shù)方案的更進(jìn)一步改進(jìn),所述富集分析使用的富集分析模型為Ko Imogorov-Smirnov 檢驗(yàn)。
[0016]作為對(duì)上述技術(shù)方案的進(jìn)一步改進(jìn),所述基因表達(dá)數(shù)據(jù)通過(guò)基因表達(dá)量分析方法獲得,所述基因表達(dá)量分析方法包括基因芯片、RNA-Seq中的至少一種。
[0017]作為對(duì)上述技術(shù)方案的進(jìn)一步改進(jìn),所述對(duì)照數(shù)據(jù)為正常組織的基因表達(dá)數(shù)據(jù)。本發(fā)明的正常組織是相對(duì)于疾病組織而言的,正常組織包括疾病組織旁的正常組織以及其他正常組織;其中,疾病組織旁的正常組織可為完全正常、無(wú)病理形態(tài)變化的組織,也可為呈現(xiàn)病理形態(tài)變化的正常組織,例如,當(dāng)所述疾病組織為癌變組織,所述對(duì)照數(shù)據(jù)可為癌旁正常組織或正常組織的基因表達(dá)數(shù)據(jù)。
[0018]本發(fā)明還提供了所述的基于基因表達(dá)譜和藥物靶標(biāo)的藥物活性預(yù)測(cè)與篩選方法在個(gè)性化藥物和/或藥物組合篩選、個(gè)性化用藥中的應(yīng)用。
[0019 ]相對(duì)于現(xiàn)有技術(shù),本發(fā)明的有益效果為:
[0020]本發(fā)明提供的基于基因表達(dá)和藥物靶標(biāo)的藥物活性預(yù)測(cè)與篩選方法可預(yù)測(cè)藥物對(duì)病人的藥效,該方法易于使用、效率高、適用范圍廣;本發(fā)明的方法可以用于篩選針對(duì)病人個(gè)體的適合藥物(包含藥物組合),從而為該病人提供個(gè)性化的治療方案。本發(fā)明在精準(zhǔn)醫(yī)療領(lǐng)域具有廣闊的應(yīng)用前景。
【附圖說(shuō)明】
[0021]圖1為本發(fā)明基于基因表達(dá)和藥物靶標(biāo)的藥物活性預(yù)測(cè)與篩選方法的一個(gè)實(shí)施例的流程圖;
[0022]圖2為本發(fā)明實(shí)施例1?3中基于基因表達(dá)和藥物靶標(biāo)的藥物活性預(yù)測(cè)與篩選方法的驗(yàn)證流程圖;
[0023]圖3為本發(fā)明的實(shí)施例1中的生存分析圖,該生存分析是對(duì)使用本發(fā)明的方法預(yù)測(cè)的兩組卵巢癌病人(按照是否正確使用藥物分成兩組)的生存時(shí)間的統(tǒng)計(jì)分析;
[0024]圖4為本發(fā)明的實(shí)施例2中的生存分析圖,該生存分析是對(duì)使用本發(fā)明的方法預(yù)測(cè)的兩組多形性成膠質(zhì)細(xì)胞瘤病人(按照是否正確使用藥物分成兩組)的生存時(shí)間的統(tǒng)計(jì)分析。
【具體實(shí)施方式】
[0025]藥物治療的本質(zhì)是藥物(小分子)與致病因子(靶標(biāo))相互作用,從而調(diào)控疾病相關(guān)基因的表達(dá)。我們由此提出一種基于病人的基因表達(dá)譜和藥物靶標(biāo)數(shù)據(jù)(Vivian L1CraigK,Yannick D,et al.DrugBank 4.0: shedding new light on drug metabolism[J].Nucleic Acids Research,2014,42(Database issue):1091-1097.;
[0026]Griffith MjGriffith 0 LjCoffman A C,et al.DGIdb:mining the druggablegenome[J].Nature Methods,2013,10(12):1209-1210.;Yang H,Qin C, Li Y Hj etal.Therapeutic target database update 2016: enriched resource for bench toclinical drug target and targeted pathway informat1n[J].Nucleic AcidsResearch,2015:gkvl230.)的藥物活性預(yù)測(cè)與藥物篩選方法該方法通過(guò)分析藥物的革巴基因(或組合藥物的靶基因集合)是否靶向了病人的基因表達(dá)數(shù)據(jù)中的差異表達(dá)基因來(lái)預(yù)測(cè)(組合)藥物活性,確定合適的治療藥物。該方法的特點(diǎn)是從藥物作用的基本原理出發(fā),利用了表達(dá)譜中蘊(yùn)含的個(gè)性化信息,不基于任何遺傳學(xué)模型,從而實(shí)現(xiàn)了理性的個(gè)性化治療,具有很好的推廣性。
[0027]圖1為本發(fā)明基于基因表達(dá)和藥物靶標(biāo)的藥物活性預(yù)測(cè)與篩選方法的一個(gè)實(shí)施例的流程圖,本發(fā)明基于基因表達(dá)和藥物靶標(biāo)的藥物活性預(yù)測(cè)與篩選方法,包括以下步驟:
[0028]S1、根據(jù)藥物靶標(biāo)數(shù)據(jù)庫(kù)中的信息,獲取待測(cè)藥物對(duì)應(yīng)的靶基因;
[0029]其中,待測(cè)藥物可為單一藥物或組合藥物,當(dāng)待測(cè)藥物為單一藥物時(shí),所述靶基因即為此藥物對(duì)應(yīng)的靶基因;當(dāng)待測(cè)藥物為組合藥物時(shí),所述靶基因?yàn)榻M合藥物中每種藥物對(duì)應(yīng)的靶基因的并集。
[0030]藥物靶標(biāo)數(shù)據(jù)庫(kù)為DGIdb、TTD和Drugbank中的至少一種;優(yōu)選地,所述待測(cè)藥物的靶基因?yàn)镈GIdb、TTD和Drugbank三個(gè)數(shù)據(jù)庫(kù)數(shù)據(jù)的靶基因數(shù)據(jù)的并集,這樣可使得預(yù)測(cè)結(jié)果更為準(zhǔn)確。
[0031]S2、獲取病人的疾病組織的基因表達(dá)數(shù)據(jù)以及相應(yīng)對(duì)照數(shù)據(jù),通過(guò)系統(tǒng)生物學(xué)的方法計(jì)算評(píng)價(jià)基因的重要性,得出在該病人發(fā)病過(guò)程中的重要基因列表;
[0032]其中,病人是指患某種疾病的特定病人個(gè)體;對(duì)照數(shù)據(jù)是指疾病組織相應(yīng)的正常組織的基因表達(dá)數(shù)據(jù);在本發(fā)明的一個(gè)實(shí)施例中,所述疾病組織為癌變組織,所述對(duì)照數(shù)據(jù)為癌旁組織或正常組織的基因表達(dá)數(shù)據(jù),因?yàn)榘┡越M織與癌癥組織具有相似的腫瘤微環(huán)境,所以更優(yōu)選為癌旁組織的基因表達(dá)數(shù)據(jù)。
[0033]所使用的基因表達(dá)數(shù)據(jù)是病人的疾病組織的基因表達(dá)數(shù)據(jù)和相應(yīng)的對(duì)照數(shù)據(jù)(在癌癥病人中,優(yōu)選為癌癥組織的基因表達(dá)數(shù)據(jù)和癌旁組織的基因表達(dá)譜數(shù)據(jù)(作為對(duì)照數(shù)據(jù)))?;虮磉_(dá)數(shù)據(jù)反映的是直接或間接測(cè)量得到的基因轉(zhuǎn)錄產(chǎn)物mRNA在細(xì)胞中的豐度,這些數(shù)據(jù)可以用于分析哪些基因的表達(dá)發(fā)生了改變,基因之間有何相關(guān)性,在不同條件下基因的活動(dòng)是如何受影響的。因此可以通過(guò)病人的疾病組織的全基因組的基因表達(dá)數(shù)據(jù)和相應(yīng)對(duì)照數(shù)據(jù),計(jì)算每個(gè)基因的差異表達(dá)。
[0034]基因表達(dá)數(shù)據(jù)通過(guò)基因表達(dá)量分析方法獲得,所述基因表達(dá)量分析方法包括基因芯片、RNA-Seq中的至少一種。在本發(fā)明的優(yōu)選實(shí)施例中,基因表達(dá)數(shù)據(jù)包括通過(guò)基因芯片和RNA-Seq獲取的基因表達(dá)數(shù)據(jù)。在本發(fā)明的優(yōu)選實(shí)施例中,獲取每個(gè)病人發(fā)病過(guò)程中的重要基因列表的方法如下:根據(jù)每個(gè)病人的疾病組織的基因表達(dá)數(shù)據(jù)和相應(yīng)對(duì)照數(shù)據(jù),計(jì)算每個(gè)基因的f ο I d-change值,按照基因的f ο I d-change值的絕對(duì)值排序(降序),則該序列中排在越前面的基因的重要性可能越大。通常,對(duì)每個(gè)病人的藥物藥效預(yù)測(cè)過(guò)程中使用的重要基因列表不一樣。
[0035]S3、通過(guò)統(tǒng)計(jì)分析查看步驟SI中得到的待測(cè)藥物的靶基因是否靶向了該病人發(fā)病過(guò)程中的重要基因列表來(lái)預(yù)測(cè)該待測(cè)藥物對(duì)于該病人的活性,篩選適合該病人的藥物。
[0036]其中,統(tǒng)計(jì)分析是指富集分析,通過(guò)分析SI中得到的待測(cè)藥物的靶基因是否富集于該病人發(fā)病過(guò)程中的重要基因列表來(lái)確定其是否靶向了該病人發(fā)病過(guò)程中的重要基因列表;如果某種藥物的靶基因富集于特定病人發(fā)病過(guò)程中的關(guān)鍵基因列表,則這種藥物就是適合該病人的藥物,特別地,當(dāng)藥物為組合藥物時(shí),如果此組合藥物的靶基因集合(也即這幾種藥物的靶基因數(shù)據(jù)的并集)富集于特定病人發(fā)病過(guò)程中的關(guān)鍵基因列表,則這幾種藥物就是適合該病人的組合藥物。
[0037]所述的藥物靶基因富集分析的思路是對(duì)于某種藥物或組合藥物,如果該種藥物或組合藥物的靶基因主要分布于病人中的重要基因列表的上部(重要基因集合),那么就認(rèn)為該種藥物或組合藥物對(duì)此病人具有較好的療效。具體的方法是使用Kolmogoro v-Smirno V檢驗(yàn),該統(tǒng)計(jì)能夠統(tǒng)計(jì)一個(gè)集合中的元素是否顯著地分布于一個(gè)序列中的上部或者下部。在本發(fā)明中,最上部分的基因列表是最重要的基因,因此我們使用該統(tǒng)計(jì)查看(組合)藥物的靶基因是否顯著地分布于病人的關(guān)鍵基因列表的最上部分。這樣,根據(jù)步驟SI得到的藥物靶基因數(shù)據(jù)集,以及步驟S2得到的病人發(fā)病過(guò)程中的關(guān)鍵基因列表(也即重要基因列表),我們采用步驟S3中的富集分析就可以查看藥物的靶基因是否主要靶向病人發(fā)病過(guò)程中的重要基因,從而預(yù)測(cè)藥物對(duì)于該病人是否具有藥效。對(duì)于Kolmogorov-Smirnov檢驗(yàn),如果該檢驗(yàn)的p-value〈0.05,就認(rèn)為該藥物對(duì)于此病人是合適的藥物,具有活性和療效。藥物對(duì)某個(gè)病人的藥效預(yù)測(cè)模型的構(gòu)建過(guò)程中沒(méi)有使用類(lèi)標(biāo)簽,沒(méi)有訓(xùn)練過(guò)程。
[0038]本發(fā)明整合使用了基因表達(dá)數(shù)據(jù)(包含通過(guò)基因芯片和RNA-Seq等基因表達(dá)量分析方法獲得的基因表達(dá)數(shù)據(jù))和藥物靶標(biāo)信息,綜合使用了一個(gè)或多個(gè)目標(biāo)藥物對(duì)應(yīng)的多個(gè)靶基因的差異表達(dá)數(shù)據(jù)。在本發(fā)明中,利用藥物靶基因信息和該病人的關(guān)鍵基因信息不僅可以預(yù)測(cè)某種藥物或某些藥物的組合(即組合藥物)對(duì)該病人的藥效,還可以篩選最適合該病人的藥物(組合),包括目前沒(méi)有使用在該疾病中的藥物,因而本發(fā)明的方法不僅可以預(yù)測(cè)某個(gè)病人對(duì)特定(組合)藥物的藥效,還可以實(shí)現(xiàn)(組合)藥物篩選,甚至是老藥新用。同時(shí),本發(fā)明還可以通過(guò)分析藥物組合的靶基因(比如兩種藥物的靶基因的并集)是否正確靶向病人的差異表達(dá)基因來(lái)預(yù)測(cè)組合藥物對(duì)于特定病人的藥效,實(shí)現(xiàn)組合藥物的篩選。
[0039]對(duì)于任何疾病的病人,只要能夠獲取其基因表達(dá)數(shù)據(jù)和相應(yīng)對(duì)照數(shù)據(jù),就可以篩選出適合該病人的(組合)藥物,因而我們的方法易于實(shí)現(xiàn)、效率高,可以廣泛地應(yīng)用于(組合)藥物對(duì)特定病人的藥效預(yù)測(cè)。
[0040]為更好地說(shuō)明本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn),下面將結(jié)合附圖和具體實(shí)施例對(duì)本發(fā)明作進(jìn)一步說(shuō)明。
[0041]實(shí)施例中,所使用的實(shí)驗(yàn)方法如無(wú)特殊說(shuō)明,均為常規(guī)方法,所用的材料、試劑等,如無(wú)特殊說(shuō)明,均可從商業(yè)途徑得到。
[0042]實(shí)施例1
[0043]使用本發(fā)明方法對(duì)卵巢癌病人進(jìn)行藥物活性預(yù)測(cè)
[0044]—、收集人類(lèi)成功上市或者在研藥物及其革巴標(biāo)
[0045]查找藥物革E標(biāo)數(shù)據(jù)庫(kù)(包含DGIdb:http: //dgidb.genome.wustl.edu/、DrugBank:http://www.drugbank.ca/和TTD:http://bidd.nus.edu.Sg/group/ttd/ttd.asp),得到數(shù)據(jù)庫(kù)中所包含的所有藥物以及其對(duì)應(yīng)的靶標(biāo)數(shù)據(jù)。
[0046]二、收集卵巢癌病人樣本的基因表達(dá)數(shù)據(jù)和臨床數(shù)據(jù)
[0047]從TCGA(The Cancer Genome Atlas)下載卵巢癌(OV)病人和對(duì)照樣本的基因表達(dá)數(shù)據(jù)(AgilentG4502A芯片的level 3數(shù)據(jù))、病人的預(yù)后跟蹤數(shù)據(jù)(死亡時(shí)間、死亡狀態(tài))以及病人的用藥信息。剔除用藥信息缺乏(或藥物靶標(biāo)不明)和預(yù)后信息缺失的樣本,共得到499個(gè)癌癥病人和10個(gè)正常卵巢組織樣本的基因表達(dá)數(shù)據(jù),這499個(gè)病人的預(yù)后跟蹤信息以及用藥信息(1982組用藥信息)。
[0048]三、計(jì)算病人發(fā)病過(guò)程中的關(guān)鍵基因列表
[0049]對(duì)每個(gè)癌癥病人,基于其基因表達(dá)數(shù)據(jù)和對(duì)照數(shù)據(jù)(本實(shí)施例以10個(gè)正常組織的基因表達(dá)數(shù)據(jù)的均值作為對(duì)照樣本的基因表達(dá)數(shù)據(jù),實(shí)際應(yīng)用時(shí)的優(yōu)選為每個(gè)癌癥病人的癌旁組織的基因表達(dá)數(shù)據(jù)作為對(duì)照),計(jì)算每個(gè)基因的fold-change值,然后按照f(shuō)old-change 絕對(duì)值的大小將基因進(jìn)行排序 (降序 )。根據(jù)排序后的基因序列就可以得到該病人在發(fā)病過(guò)程中的重要基因列表,排名越靠前的基因越重要。
[0050]四、對(duì)每個(gè)病人的藥物藥效預(yù)測(cè)
[0051]對(duì)于每個(gè)病人,從步驟二中查看其使用了哪些藥物,而對(duì)于每種藥物,我們從步驟一中搜索其革G基因,將該藥物的所有革El基因構(gòu)成一個(gè)革El基因集合。通過(guò)KolmogoroV-Smirnov檢驗(yàn)來(lái)查看該藥物的靶基因是否顯著地分布在步驟三得到的基因列表的靠前部分,也就是查看該藥物的靶基因是否靶向了該病人發(fā)病過(guò)程中的那些最重要的基因。如果該統(tǒng)計(jì)的p-value〈0.05,就認(rèn)為該藥物對(duì)于此病人是合適的藥物,具有療效。
[0052]五、預(yù)測(cè)性能評(píng)估
[0053]對(duì)本實(shí)施例中的499個(gè)卵巢癌病人,如果其使用的藥物中至少存在一個(gè)藥物對(duì)其具有藥效,那么就認(rèn)為該病人接受了正確的藥物治療,將該病人劃分為正確治療組,否則將其劃分為錯(cuò)誤治療組。根據(jù)這兩組病人的預(yù)后信息(死亡時(shí)間、死亡狀態(tài))對(duì)這兩組病人進(jìn)行生存分析,查看正確治療組是否比錯(cuò)誤治療組具有更長(zhǎng)的生存時(shí)間。如果正確治療組顯著地比錯(cuò)誤治療組具有更長(zhǎng)的生存時(shí)間,那么就可以證實(shí)我們的藥物藥效預(yù)測(cè)方法的正確性。
[0054]在這499個(gè)病人中,根據(jù)我們的預(yù)測(cè)方法,一共有129個(gè)病人接受了正確的藥物治療,370個(gè)病人接受了錯(cuò)誤的治療。對(duì)這兩組病人進(jìn)行生存分析顯示它們的風(fēng)險(xiǎn)比(HazardRat1)為1.46(95%置信區(qū)間為1.08到1.97),其Log-rank test的p-value為0.0074,這顯示了我們的預(yù)測(cè)方法的有效性。實(shí)施例1中得到的兩組病人的生存曲線見(jiàn)附圖2.為了進(jìn)一步驗(yàn)證我們的方法的有效性,我們隨機(jī)打亂該實(shí)施例中的病人與藥物關(guān)系,然后根據(jù)本發(fā)明所述方法重新對(duì)病人進(jìn)行劃分,并計(jì)算新劃分的兩組病人的風(fēng)險(xiǎn)比和Log-rank test的p-value,重復(fù)該過(guò)程1000次,發(fā)現(xiàn)在置換檢驗(yàn)中沒(méi)有結(jié)果比真實(shí)數(shù)據(jù)中的劃分好(風(fēng)險(xiǎn)比大于1.00且p_value〈0.0074),顯示置換檢驗(yàn)的p_value = 0o
[0055]實(shí)施例2
[0056]使用本發(fā)明方法預(yù)測(cè)多形性成膠質(zhì)細(xì)胞瘤病人的藥物活性
[0057]本實(shí)施例步驟一同實(shí)施例1,其他步驟如下:
[0058]二、收集多形性成膠質(zhì)細(xì)胞瘤病人樣本的基因表達(dá)數(shù)據(jù)和臨床數(shù)據(jù)
[0059]從TCGA(The Cancer Genome Atlas)下載多形性成膠質(zhì)細(xì)胞瘤病人(GBM)和對(duì)照樣本的基因表達(dá)數(shù)據(jù)(AgilentG4502A芯片的level 3數(shù)據(jù))、病人的預(yù)后跟蹤數(shù)據(jù)(死亡時(shí)間、死亡狀態(tài))以及病人的用藥信息。剔除用藥信息缺乏(或藥物靶標(biāo)不明)和預(yù)后信息缺失的樣本,共得到193個(gè)癌癥病人和10個(gè)相應(yīng)正常組織樣本的基因表達(dá)數(shù)據(jù)、這193個(gè)病人的預(yù)后跟蹤信息以及用藥信息(445組用藥信息)。
[0060]三、計(jì)算病人發(fā)病過(guò)程中的關(guān)鍵基因列表
[0061]對(duì)每個(gè)癌癥病人,基于其基因表達(dá)數(shù)據(jù)和對(duì)照數(shù)據(jù)(本實(shí)施例以10個(gè)正常組織的基因表達(dá)數(shù)據(jù)的均值作為對(duì)照樣本的基因表達(dá)數(shù)據(jù),實(shí)際應(yīng)用時(shí)的優(yōu)選為每個(gè)癌癥病人的癌旁組織的基因表達(dá)數(shù)據(jù)作為對(duì)照),計(jì)算每個(gè)基因的fold-change值,然后按照f(shuō)old-change 絕對(duì)值的大小將基因進(jìn)行排序 (降序 )。根據(jù)排序后的基因序列就可以得到該病人在發(fā)病過(guò)程中的重要基因列表,排名越靠前的基因越重要。
[0062]四、對(duì)每個(gè)病人的藥物藥效預(yù)測(cè)
[0063]對(duì)于每個(gè)病人,從步驟二中查看其使用了哪些藥物,而對(duì)于每種藥物,我們從步驟一中搜索其靶基因,將該藥物的所有靶基因構(gòu)成一個(gè)靶基因集合。然后通過(guò)Kolmogorov-Smirnov檢驗(yàn)來(lái)查看該藥物的靶基因是否顯著地分布在步驟三得到的基因列表的靠前部分,也就是查看該藥物的靶基因是否靶向了該病人發(fā)病過(guò)程中的那些最重要的基因。如果該統(tǒng)計(jì)的p-value〈0.05,就認(rèn)為該藥物對(duì)于此病人是合適的藥物,具有療效。
[0064]五、預(yù)測(cè)性能評(píng)估
[0065]對(duì)本實(shí)施例中所涉及的193個(gè)患有多形性成膠質(zhì)細(xì)胞瘤的病人,如果其使用的藥物中至少存在一個(gè)藥物對(duì)其具有藥效,那么就認(rèn)為該病人接受了正確的藥物治療,將其劃分為正確治療組,否則將其劃分為錯(cuò)誤治療組。根據(jù)這兩組病人的預(yù)后信息(死亡時(shí)間、死亡狀態(tài))對(duì)這兩組病人進(jìn)行生存分析,查看正確治療組是否比錯(cuò)誤治療組具有更長(zhǎng)的生存時(shí)間。如果正確治療組顯著地比錯(cuò)誤治療組具有更長(zhǎng)的生存時(shí)間,那么就可以證實(shí)我們的藥物藥效預(yù)測(cè)方法的正確性。
[0066]在這193個(gè)病人中,一共有45個(gè)病人接受了正確的藥物治療,148個(gè)病人接受了錯(cuò)誤的治療。對(duì)這兩組病人的進(jìn)行生存分析顯示它們的風(fēng)險(xiǎn)比(Hazard Rat1)為1.49(95%置信區(qū)間為1.00到2.22),其Log-rank test的p-value為0.026,這顯示了我們的預(yù)測(cè)方法的有效性。實(shí)施例2中得到的兩組病人的生存曲線見(jiàn)附圖3.為了進(jìn)一步驗(yàn)證我們的方法的有效性,我們隨機(jī)打亂該實(shí)施例數(shù)據(jù)中的病人與藥物關(guān)系,然后根據(jù)本發(fā)明所述方法重新對(duì)病人進(jìn)行劃分,并計(jì)算新劃分的兩組病人的風(fēng)險(xiǎn)比和Log-rank test的p-value,重復(fù)該過(guò)程1000次,發(fā)現(xiàn)在置換檢驗(yàn)中僅有25次結(jié)果比真實(shí)數(shù)據(jù)中的劃分好(風(fēng)險(xiǎn)比大于1.00且p-value<0.026),顯示置換檢驗(yàn)的p-value = 0.025。
[0067]實(shí)施例3
[0068]使用本發(fā)明方法對(duì)乳腺癌病人進(jìn)行組合藥物活性預(yù)測(cè)
[0069]—、本實(shí)施例所使用的藥物靶標(biāo)數(shù)據(jù)庫(kù)同實(shí)施例1和實(shí)施例2,對(duì)組合藥物,其靶標(biāo)為這幾種藥物的靶標(biāo)數(shù)據(jù)的并集,其他步驟如下:
[0070]二、從NCBI GEO上下載MDAl和MDA/MAQC-1I這兩個(gè)乳腺癌數(shù)據(jù)集。該數(shù)據(jù)集包含這些病人的基因表達(dá)數(shù)據(jù)(278個(gè)乳腺癌病人的GPL96芯片數(shù)據(jù))以及后續(xù)接受了T-FAC(pacIitaxeI,f IuorouraciI,doxorubicin和cyIclophosphamide)治療后的口向應(yīng)狀況信息。從NCBI GEO下載GSE9574數(shù)據(jù)集,該數(shù)據(jù)中包含正常乳腺組織的基因芯片數(shù)據(jù)(GPL96芯片)。首先將乳腺癌病人和對(duì)照數(shù)據(jù)的基因芯片探針數(shù)據(jù)匹配到基因ID,處理得到以基因ID為基本單位的基因表達(dá)數(shù)據(jù)。因?yàn)槿橄侔┎∪撕蛯?duì)照數(shù)據(jù)來(lái)自不同的數(shù)據(jù)源,將每個(gè)樣本的芯片數(shù)據(jù)標(biāo)準(zhǔn)化以作下一步處理。
[0071]三、計(jì)算病人發(fā)病過(guò)程中的關(guān)鍵基因列表
[0072]對(duì)每個(gè)癌癥病人,基于其基因表達(dá)數(shù)據(jù)和對(duì)照數(shù)據(jù)(本實(shí)施例以正常組織的基因表達(dá)數(shù)據(jù)的均值作為對(duì)照樣本的基因表達(dá)數(shù)據(jù)),計(jì)算每個(gè)基因的fold-change值,然后按照f(shuō)old-change絕對(duì)值的大小將基因進(jìn)行排序(降序)。根據(jù)排序后的基因序列就可以得到該病人在發(fā)病過(guò)程中的重要基因列表,排名越靠前的基因越重要。
[0073]四、對(duì)每個(gè)病人的藥物藥效預(yù)測(cè)
[0074]因?yàn)樵摂?shù)據(jù)集的病人均接受了T-FAC治療,通過(guò)步驟一得到這四種藥物的靶基因集合(94個(gè)藥物革El基因)。然后通過(guò)Kolmogorov-Smirnov檢驗(yàn)來(lái)查看該革El基因集合是否顯著地分布在步驟三得到的基因列表的靠前部分,也就是查看該組合藥物的靶基因是否靶向了該病人發(fā)病過(guò)程中的那些最重要的基因。如果該統(tǒng)計(jì)的p-value〈0.05,就認(rèn)為該病人接受了合適的治療。
[0075]五、預(yù)測(cè)性能評(píng)估
[0076]對(duì)本實(shí)施例中所涉及的278個(gè)病人,按照本發(fā)明所述的方法預(yù)測(cè),一共137個(gè)病人接受了正確的治療,141個(gè)病人接受了錯(cuò)誤的治療。而這些病人中,共有56個(gè)病人接受了T-FAC治療后有響應(yīng),剩余的222個(gè)病人沒(méi)有響應(yīng)。
[0077]為了評(píng)估本發(fā)明對(duì)組合藥物的活性的預(yù)測(cè)能力,我們用卡方檢驗(yàn)來(lái)查看本發(fā)明的活性預(yù)測(cè)結(jié)果與這這些病人的真實(shí)響應(yīng)情況之間是否具有顯著的相關(guān)性。在本發(fā)明方法預(yù)測(cè)的137個(gè)接受了正確治療的病人中,有37個(gè)病人對(duì)藥物有響應(yīng),而沒(méi)有接受正確治療的141個(gè)病人中,僅有19病人對(duì)治療有響應(yīng)。兩組病人的odds rat1為2.38(95%置信區(qū)間為
1.29到4.38),卡方檢驗(yàn)表明本發(fā)明的預(yù)測(cè)結(jié)果與實(shí)際的響應(yīng)狀況具有顯著的相關(guān)性,其P-value為0.0049。進(jìn)一步地,我們隨機(jī)打亂該實(shí)施例數(shù)據(jù)中的每個(gè)病人的差異表達(dá)基因序列,然后根據(jù)本發(fā)明所述方法重新對(duì)病人進(jìn)行劃分,并計(jì)算新劃分的兩組病人的oddsrat1和劃分結(jié)果與病人藥物響應(yīng)之間的關(guān)系(卡方檢驗(yàn)),重復(fù)該過(guò)程1000次,發(fā)現(xiàn)在置換檢驗(yàn)中沒(méi)有結(jié)果比真實(shí)數(shù)據(jù)中的劃分好(odds瓜1^0大于1.00且口-¥31116〈0.0049),說(shuō)明置換檢驗(yàn)的p-value = 0。該結(jié)果證實(shí)了本發(fā)明能夠準(zhǔn)確預(yù)測(cè)組合藥物對(duì)特定病人的活性,同時(shí)說(shuō)明了本發(fā)明提出的藥物活性預(yù)測(cè)方法可用于組合藥物活性預(yù)測(cè)及組合藥物篩選,具有顯著的預(yù)測(cè)效果。
[0078]最后所應(yīng)當(dāng)說(shuō)明的是,以上實(shí)施例僅用以說(shuō)明本發(fā)明的技術(shù)方案而非對(duì)本發(fā)明保護(hù)范圍的限制,盡管參照較佳實(shí)施例對(duì)本發(fā)明作了詳細(xì)說(shuō)明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解,可以對(duì)本發(fā)明的技術(shù)方案進(jìn)行修改或者等同替換,而不脫離本發(fā)明技術(shù)方案的實(shí)質(zhì)和范圍。
【主權(quán)項(xiàng)】
1.一種基于基因表達(dá)和藥物靶標(biāo)的藥物活性預(yù)測(cè)與篩選方法,其特征在于:包括以下步驟: 1)根據(jù)藥物靶標(biāo)數(shù)據(jù)庫(kù)中的信息,獲取待測(cè)藥物對(duì)應(yīng)的靶基因; 獲取病人的疾病組織的基因表達(dá)數(shù)據(jù)以及相應(yīng)對(duì)照數(shù)據(jù),通過(guò)系統(tǒng)生物學(xué)的方法計(jì)算評(píng)價(jià)基因的重要性,得出在該病人發(fā)病過(guò)程中的重要基因列表; 2)通過(guò)統(tǒng)計(jì)分析查看步驟I)中得到的待測(cè)藥物的靶基因是否靶向了該病人發(fā)病過(guò)程中的重要基因列表來(lái)預(yù)測(cè)該待測(cè)藥物對(duì)于該病人的活性,篩選適合該病人的藥物。2.根據(jù)權(quán)利要求1所述的基于基因表達(dá)譜和藥物靶標(biāo)的藥物活性預(yù)測(cè)與篩選方法,其特征在于:所述步驟I)中,通過(guò)fold-change的絕對(duì)值來(lái)計(jì)算評(píng)價(jià)基因的重要性。3.根據(jù)權(quán)利要求1所述的基于基因表達(dá)譜和藥物靶標(biāo)的藥物活性預(yù)測(cè)與篩選方法,其特征在于:所述步驟I)中的藥物革El標(biāo)數(shù)據(jù)庫(kù)為DGIdb、TTD和Drugbank中的至少一種。4.根據(jù)權(quán)利要求3所述的基于基因表達(dá)譜和藥物靶標(biāo)的藥物活性預(yù)測(cè)與篩選方法,其特征在于:所述待測(cè)藥物的靶基因?yàn)镈GIdb、TTD和Drugbank三個(gè)數(shù)據(jù)庫(kù)數(shù)據(jù)的靶基因數(shù)據(jù)的并集。5.根據(jù)權(quán)利要求1所述的基于基因表達(dá)譜和藥物靶標(biāo)的藥物活性預(yù)測(cè)與篩選方法,其特征在于:所述步驟2)中,統(tǒng)計(jì)分析是指富集分析,通過(guò)分析步驟I)中得到的待測(cè)藥物的靶基因是否富集于該病人發(fā)病過(guò)程中的重要基因列表來(lái)確定其是否靶向了該病人發(fā)病過(guò)程中的重要基因列表。6.根據(jù)權(quán)利要求5所述的基于基因表達(dá)譜和藥物靶標(biāo)的藥物活性預(yù)測(cè)與篩選方法,其特征在于:所述富集分析使用的富集分析模型為Ko Imogorov-Smirnov檢驗(yàn)。7.根據(jù)權(quán)利要求1所述的基于基因表達(dá)譜和藥物靶標(biāo)的藥物活性預(yù)測(cè)與篩選方法,其特征在于:所述基因表達(dá)數(shù)據(jù)通過(guò)基因表達(dá)量分析方法獲得,所述基因表達(dá)量分析方法包括基因芯片、RNA-Seq中的至少一種。8.根據(jù)權(quán)利要求1?7中任一項(xiàng)所述的基于基因表達(dá)譜和藥物靶標(biāo)的藥物活性預(yù)測(cè)與篩選方法,其特征在于:所述對(duì)照數(shù)據(jù)為正常組織的基因表達(dá)數(shù)據(jù)。9.權(quán)利要求1?8中任一項(xiàng)所述的基于基因表達(dá)譜和藥物靶標(biāo)的藥物活性預(yù)測(cè)與篩選方法在個(gè)性化藥物和/或藥物組合篩選、個(gè)性化用藥中的應(yīng)用。
【文檔編號(hào)】G06F19/18GK106055921SQ201610361900
【公開(kāi)日】2016年10月26日
【申請(qǐng)日】2016年5月27日
【發(fā)明人】張紅雨, 周雄輝, 朱麗達(dá), 全源, 崔澤嘉, 楊慶勇
【申請(qǐng)人】華中農(nóng)業(yè)大學(xué)
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1