一種用于復(fù)雜大腦疾病靶向組合治療分析的系統(tǒng)及方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于醫(yī)療服務(wù)技術(shù)領(lǐng)域,涉及一種復(fù)雜大腦疾病靶向組合治療分析的系統(tǒng)及方法。
【背景技術(shù)】
[0002]近年來(lái),隨著醫(yī)療服務(wù)信息化技術(shù)的快速發(fā)展,疾病治療也在發(fā)生重大的變化。對(duì)于某些疾病,傳統(tǒng)的治療方法(如手術(shù)、放療、化療等),無(wú)法從根本上徹底治愈,而且,還容易導(dǎo)致疾病的復(fù)發(fā)。這不僅給病人帶來(lái)了身體上的痛苦,還帶來(lái)了一定的經(jīng)濟(jì)負(fù)擔(dān)。因此,基于這樣的醫(yī)療現(xiàn)狀,發(fā)掘能精準(zhǔn)定位疾病細(xì)胞、靶向性強(qiáng)、治療徹底、持續(xù)免疫、終身受益的疾病治療方法,是醫(yī)療健康發(fā)展的必然趨勢(shì)。
[0003]目前,很多研究人員已經(jīng)針對(duì)不同的大腦疾病,研究出了針對(duì)不同疾病可靶向治療的方法,如靶向治療難治性癲癇的藥物組合物、5A靶向生物免疫治療、抗腫瘤靶向治療藥物tivozanib的合成方法、基因融合革El向治療等。這些方法都能在某種疾病上產(chǎn)生很好的治療效果。但是,這些方法也只是針對(duì)特定的疾病進(jìn)行研究,不具有系統(tǒng)性,普遍性。而且,對(duì)于國(guó)內(nèi)外大量的研究資料和臨床試驗(yàn),也導(dǎo)致了研究者在疾病治療研究時(shí),數(shù)據(jù)處理能力有限,研究周期長(zhǎng)。因此,借助于當(dāng)前的大數(shù)據(jù)技術(shù)和數(shù)據(jù)挖掘技術(shù),設(shè)計(jì)一種能系統(tǒng)分析各種大腦疾病及藥物治理的方法,以便開(kāi)發(fā)出相應(yīng)的疾病靶向治療藥物,為治療各種疾病服務(wù)。
【發(fā)明內(nèi)容】
[0004]本發(fā)明的目的是在于提供一種用于復(fù)雜大腦疾病靶向組合治療分析的系統(tǒng)及方法,旨在解決目前大腦疾病致死率和致殘率居高不下、患者與家庭負(fù)擔(dān)和社會(huì)問(wèn)題有增無(wú)減;醫(yī)學(xué)研究中,疾病靶向治療研究的不系統(tǒng)性、單一性、研究周期長(zhǎng)、數(shù)據(jù)量大的問(wèn)題。本發(fā)明“一種用于復(fù)雜大腦疾病靶向組合治療分析的系統(tǒng)及方法”,旨在建立全新的藥理學(xué)研究技術(shù)與方法,對(duì)大腦疾病防治研究的突破具有特別意義,為支撐和引領(lǐng)我國(guó)創(chuàng)新藥物的研發(fā)與產(chǎn)業(yè)化積極努力和貢獻(xiàn)。
[0005]本發(fā)明是這樣實(shí)現(xiàn)的,一種用于復(fù)雜大腦疾病靶向組合治療分析的系統(tǒng),所述用于復(fù)雜大腦疾病靶向組合治療分析的系統(tǒng)包括:
[0006]疾病亞型獲取模塊,用于根據(jù)用戶(hù)輸入的疾病關(guān)鍵詞,從MeSH網(wǎng)站中爬取與輸入的疾病關(guān)鍵詞相關(guān)的疾病亞型列表,并將取得的疾病亞型列表和輸入的關(guān)鍵詞保存;
[0007]疾病亞型閾值設(shè)置模塊,用于根據(jù)疾病亞型獲取模塊中取得的疾病亞型列表,選擇其中需要研究的疾病亞型,并為其設(shè)置閾值,設(shè)置完成后保存;
[0008]基因與疾病相關(guān)性分析模塊,用于根據(jù)疾病亞型閾值設(shè)置模塊中設(shè)置了閾值的疾病亞型列表,從CoreMine醫(yī)學(xué)信息檢索平臺(tái)數(shù)據(jù)庫(kù)中取得疾病的Significance值小于閾值的基因列表并保存;
[0009]種子基因生成模塊,用于根據(jù)基因與疾病相關(guān)性分析模塊中得到的基因和Disease Connect數(shù)據(jù)庫(kù)中的基因組合,形成種子基因列表,并保存;
[0010]數(shù)據(jù)篩選模塊,用于根據(jù)從String9.1數(shù)據(jù)庫(kù)中取得的蛋白表和基因蛋白表中的蛋白進(jìn)行比對(duì),將蛋白表中的蛋白置換為對(duì)應(yīng)的基因,并根據(jù)輸入的邊值,篩選出符合條件的基因,形成相應(yīng)的基因表并保存;
[0011]區(qū)間劃分模塊,用于根據(jù)數(shù)據(jù)篩選模塊中保存的基因表,以及輸入的模塊篩選區(qū)間范圍,使用BGLL算法,對(duì)基因表中的基因進(jìn)行劃分,形成模塊基因關(guān)系表,并保存;
[0012]富集分析模塊,用于根據(jù)區(qū)間劃分模塊中得到的模塊和基因表,使用拓?fù)浞治鏊惴?,?duì)種子基因和各個(gè)模塊進(jìn)行富集分析,得到富集分析結(jié)果并保存;
[0013]疾病靶點(diǎn)獲取模塊,用于根據(jù)富集分析模塊中得到的疾病模塊和種子基因列表,與DrugBank數(shù)據(jù)庫(kù)中的基因列表進(jìn)行比對(duì),查找出在DrugBank數(shù)據(jù)庫(kù)中存在的基因列表即為疾病靶點(diǎn)列表,并保存;
[0014]疾病藥物列表生成模塊,用于根據(jù)疾病亞型獲取模塊中保存的疾病關(guān)鍵詞,使用網(wǎng)絡(luò)爬蟲(chóng)技術(shù),從DrugBank數(shù)據(jù)庫(kù)中爬取獲得藥品的鏈接列表,打開(kāi)每個(gè)藥品的鏈接,在網(wǎng)頁(yè)中爬取藥品相關(guān)的信息和藥品對(duì)應(yīng)的靶點(diǎn)信息,形成藥品信息和靶點(diǎn)信息列表并保存;
[0015]潛在藥物靶點(diǎn)生成模塊,用于根據(jù)疾病藥物列表爬取模塊中得到的藥品和靶點(diǎn)列表以及疾病靶點(diǎn)獲取模塊中保存的疾病靶點(diǎn)列表進(jìn)行比對(duì),如果疾病靶點(diǎn)列表中的基因不在疾病藥物的基因列表中,貝判斷該革G點(diǎn)是否在該革E1點(diǎn)對(duì)應(yīng)模塊的Pathway中p值最小的基因列表中,如果是,則該靶點(diǎn)為潛在靶點(diǎn),否則為非潛在靶點(diǎn)。
[0016]進(jìn)一步,所述疾病亞型獲取模塊,用于獲取用戶(hù)輸入的疾病關(guān)鍵詞,將查詢(xún)疾病關(guān)鍵詞的請(qǐng)求通過(guò)網(wǎng)絡(luò)爬蟲(chóng)算法轉(zhuǎn)發(fā)到遠(yuǎn)程MeSH服務(wù)器中,MeSH服務(wù)器從MeSH數(shù)據(jù)庫(kù)中查詢(xún)和疾病相關(guān)的疾病亞型,并將查詢(xún)的結(jié)果返回。疾病亞型獲取模塊分析MeSH服務(wù)器返回的結(jié)果,進(jìn)而獲取和疾病相關(guān)的疾病亞型列表。
[0017]進(jìn)一步,所述疾病亞型閾值設(shè)置模塊,用于獲取疾病亞型獲取模塊中得到的疾病亞型列表,選擇其中需要研究的疾病亞型,并為其設(shè)置閾值。設(shè)置閾值可以針對(duì)每個(gè)疾病亞型進(jìn)行設(shè)置,也可以為所有的疾病亞型統(tǒng)一設(shè)置。每個(gè)疾病亞型的閾值默認(rèn)值為0.05,設(shè)置完成后,保存每個(gè)疾病亞型的閾值。
[0018]進(jìn)一步,所述基因與疾病相關(guān)性分析模塊,用于根據(jù)疾病亞型閾值設(shè)置模塊中設(shè)置了閾值的疾病亞型列表,從CoreMine醫(yī)學(xué)數(shù)據(jù)庫(kù)中查找出所有Significance值小于閾值的基因,并將符合條件的基因保存到數(shù)據(jù)庫(kù)中。
[0019]進(jìn)一步,所述種子基因生成模塊,用于根據(jù)基因與疾病相關(guān)性分析模塊中得到的疾病亞型和基因列表,將每個(gè)疾病亞型的基因列表與Disease Connect數(shù)據(jù)庫(kù)中的相關(guān)基因做并集處理,生成合并后的每個(gè)疾病亞型的種子基因列表,并將各基因列表保存到數(shù)據(jù)庫(kù)中。
[0020]進(jìn)一步,所述數(shù)據(jù)篩選模塊,用于獲取用戶(hù)進(jìn)行篩選需要的邊值,邊值范圍為0至999,默認(rèn)值為700。用戶(hù)輸入邊值后,將從String9.1數(shù)據(jù)庫(kù)中取得的蛋白表和系統(tǒng)提供的基因蛋白表進(jìn)行比對(duì),將蛋白表中的蛋白置換為相應(yīng)的基因。系統(tǒng)根據(jù)用戶(hù)輸入的邊值和蛋白表中的基因邊值進(jìn)行比對(duì),篩選出大于用戶(hù)輸入邊值的基因,并保存到基因表中。
[0021]進(jìn)一步,所述區(qū)間劃分模塊,用于獲取用戶(hù)進(jìn)行劃分的區(qū)間范圍,默認(rèn)值為5至400。根據(jù)數(shù)據(jù)篩選模塊得到的基因表和區(qū)間范圍,使用社區(qū)發(fā)現(xiàn)經(jīng)典算法BGLL算法,對(duì)基因表中的基因進(jìn)行劃分,形成各個(gè)模塊以及各個(gè)模塊中的基因,并保存劃分結(jié)果。
[0022]進(jìn)一步,所述富集分析模塊,用于根據(jù)區(qū)間劃分模塊中,得到的模塊列表和種子基因列表,使用拓?fù)浞治鏊惴?,?duì)各個(gè)模塊進(jìn)行G0富集分析和Pathway富集分析,得到G0和Pathway分析的結(jié)果。包括模塊列表和模塊中的基因列表。
[0023]進(jìn)一步,所述疾病靶點(diǎn)獲取模塊,用戶(hù)根據(jù)富集分析模塊模塊中得到的種子基因列表和疾病模塊列表,將各種子基因與DrugBank數(shù)據(jù)庫(kù)中的各基因列表進(jìn)行比對(duì),如果種子基因在DrugBank數(shù)據(jù)庫(kù)中,則該基因?yàn)楝F(xiàn)有藥物靶點(diǎn),并記性標(biāo)記,否則不是現(xiàn)有藥物的靶點(diǎn)。循環(huán)比較后保存各基因以及模塊的信息。
[0024]進(jìn)一步,所述疾病藥物列表生成模塊,用于根據(jù)疾病亞型獲取模塊中保存的疾病關(guān)鍵詞,使用網(wǎng)絡(luò)爬蟲(chóng)技術(shù),將查詢(xún)疾病的請(qǐng)求轉(zhuǎn)發(fā)到DrugBank網(wǎng)站系統(tǒng)中,DrugBank網(wǎng)站系統(tǒng)從DrugBank數(shù)據(jù)庫(kù)中,查詢(xún)出針對(duì)于該疾病的藥品列表,針對(duì)每個(gè)藥品,查找出該藥品的靶向基因列表。將查詢(xún)所得的藥品列表和各藥品的靶向基因列表,保存到數(shù)據(jù)庫(kù)中。
[0025]進(jìn)一步,所述潛在藥物靶點(diǎn)生成模塊,用于疾病藥物列表爬取模塊中得到的藥品列表和藥品中的靶向基因列表,以及疾病靶點(diǎn)獲取模塊中疾病模塊和模塊基因,將模塊基因和靶向基因列表進(jìn)行比對(duì),如果模塊基因在藥物的靶向基因列表中,則該基因不是潛在藥物革G點(diǎn),否則判斷該基因是否在對(duì)應(yīng)模塊的Pathway中p值最小的基因列表中,如果是,則該基因?yàn)闈撛谒幬锇悬c(diǎn),對(duì)應(yīng)的藥物為潛在的藥物。否則,該基因不是潛在藥物的靶點(diǎn)。對(duì)比完成后,保存生成的潛在藥物靶點(diǎn)和非潛在藥物靶點(diǎn)列表以及對(duì)應(yīng)的模塊列表。
[0026]本發(fā)明另一目的在于提供一種用于復(fù)雜大腦疾病靶向組合治療分析