的方法,該用于復雜大腦疾病靶向組合治療分析的方法包括以下步驟:
[0027]步驟一:用戶打開云計算服務器上的復雜大腦疾病靶向組合治療分析工具,在檢索框中輸入需要分析的疾病。疾病亞型獲取模塊獲取檢索框中輸入的疾病,將查詢請求,通過網(wǎng)絡爬蟲技術,轉發(fā)到MeSH服務器中。MeSH服務器,從MeSH數(shù)據(jù)庫中讀取和該查詢疾病相關的疾病亞型信息,并返回查詢結果。疾病亞型獲取模塊解析返回的結果,從返回的結果中,提取出和查詢疾病相關的疾病亞型和疾病亞型別名列表,保存到本地數(shù)據(jù)庫中,轉至步驟二 ;
[0028]步驟二:為步驟一中保存的疾病亞型設置閾值??梢詥为殲槊總€疾病亞型設置閾值,也可以為疾病亞型設置統(tǒng)一的值。閾值默認值為0.05 ;設置完成后,轉至步驟三;
[0029]步驟三:根據(jù)步驟二中得到的疾病亞型列表和對應的閾值,使用網(wǎng)絡爬蟲技術,分別從CoreMine網(wǎng)站系統(tǒng)中查詢出Significance值小于疾病亞型閾值的基因列表,并將查詢返回的各基因列表保存到數(shù)據(jù)庫中。分別針對每個基因,使用網(wǎng)絡爬蟲技術,從PubMed網(wǎng)站系統(tǒng)中,查詢獲取與該基因疾病相關的文章列表,并將返回的文章列表保存到數(shù)據(jù)庫中。分別針對以上得到的基因列表中的每個基因,使用網(wǎng)絡爬蟲技術,從HGNC網(wǎng)站系統(tǒng)中,查詢獲取基因的名稱、符號和同義詞信息,并將返回的結果保存到數(shù)據(jù)庫中。轉至步驟四;
[0030]步驟四:從Disease Connect網(wǎng)站系統(tǒng)中,下載Disease Connect數(shù)據(jù)庫文件,保存到本地系統(tǒng)中。根據(jù)步驟三中得到的疾病亞型列表和對應的基因列表,分別將疾病亞型輸入到Disease Connect數(shù)據(jù)庫中,查詢出對應基因列表,將該基因列表與原疾病亞型中的基因列表做并集處理,得到每個疾病亞型的種子基因。轉至步驟五;
[0031]步驟五:獲取用戶輸入查詢需要的邊值。如果用戶不輸入,則默認值為700,邊值的輸入范圍為0至999。系統(tǒng)根據(jù)輸入的邊值,從String9.1數(shù)據(jù)庫中,查詢出邊值大于用戶輸入邊值的邊列表,并保存。轉至步驟六;
[0032]步驟六:獲取用戶輸入模塊劃分的區(qū)間范圍。根據(jù)步驟五中得到的邊,使用經(jīng)典社區(qū)劃分算法BGLL,將各個邊數(shù)據(jù)以及用戶輸入的區(qū)間劃分范圍輸入到BGLL算法中,經(jīng)過運算處理后,生成各個模塊,每個模塊中包含對應的劃分基因,并保存各個模塊及基因到本地數(shù)據(jù)庫中。轉至步驟七;
[0033]步驟七:根據(jù)步驟六中得到的各個模塊和模塊中的基因列表,使用拓撲分析算法對各個模塊進行富集分析,得到各個模塊的富集分析結果,包括Pathway分析結果和G0分析結果,并保存到本地數(shù)據(jù)庫中。轉至步驟八;
[0034]步驟八:根據(jù)步驟七中得到的富集分析結果文件,用戶選擇需要分析的模塊,將各模塊中保存的基因列表,和DrugBank數(shù)據(jù)庫中保存的基因列表進行對比,如果模塊基因列表中的基因在DrugBank數(shù)據(jù)庫中,則該基因為現(xiàn)有藥物靶點,并將該基因同Pathway分析結果中的各基因列進行比較,如果該基因在“Corrected p_Value”最小的列中,則保存該基因信息和對應的模塊信息,轉至步驟九;
[0035]步驟九:根據(jù)步驟一中保存的疾病關鍵詞,使用網(wǎng)絡爬蟲技術,從醫(yī)學數(shù)據(jù)庫DrugBank數(shù)據(jù)庫中,查詢出該疾病的藥品列表。針對每個藥品列表,查詢出藥品的信息,包括:藥品標識、藥品名稱、藥品注冊號、所屬組、藥品描述、適應癥、藥效學、基因列表和有機體。并保存查詢的藥品列表信息。轉至步驟十;
[0036]步驟十:根據(jù)步驟八中保存的模塊和基因和步驟九中的藥品列表信息,將各模塊中的基因同藥品列表中的基因進行比對,如果該基因在對應的藥品列表中,則該基因不是潛在的藥物靶點,否則為潛在的藥物靶點。
[0037]本發(fā)明提供的用于復雜大腦疾病靶向組合治療分析的系統(tǒng)及方法,將數(shù)據(jù)挖掘技術,云計算技術,大數(shù)據(jù)分析技術結合起來,根據(jù)不同的大腦疾病,發(fā)掘出不同的潛在藥物靶點。解決了目前醫(yī)學研究中,疾病靶向治療研究的不系統(tǒng)性、單一性、研究周期長、數(shù)據(jù)量大的問題。本發(fā)明通過使用先進的網(wǎng)絡爬蟲技術,從不同的醫(yī)學數(shù)據(jù)庫中,將和疾病相關的信息有效的結合了起來,通過大數(shù)據(jù)分析,最終分析得到疾病潛在的藥物和靶點,以便開發(fā)出相應的疾病靶向治療藥物,為治療各種疾病服務。
【附圖說明】
[0038]圖1是本發(fā)明實施例提供的用于復雜大腦疾病靶向組合治療分析的系統(tǒng)模塊關系圖;
[0039]圖中:1、疾病亞型獲取模塊;2、疾病亞型閾值設置模塊;3、基因與疾病相關性分析模塊;4、種子基因生成模塊;5、數(shù)據(jù)篩選模塊;6、區(qū)間劃分模塊;7、富集分析模塊;8、疾病靶點獲取模塊;9、疾病藥物列表生成模塊;10、潛在藥物靶點生成模塊;11、潛在藥物靶點展示模塊;
[0040]圖2是本發(fā)明實施例提供的用于復雜大腦疾病靶向組合治療分析的系統(tǒng)結構示意圖。
[0041]圖3是疾病亞型獲取模塊的關系結構圖;
[0042]圖4是疾病亞型閾值設置模塊、基因與疾病相關性分析??斓年P系結構圖;
[0043]圖5是種子基因生成模塊的關系結構圖;
[0044]圖6是數(shù)據(jù)篩選和區(qū)間劃分模塊的關系結構圖;
[0045]圖7是富集分析和疾病靶點獲取模塊的關系結構圖;
[0046]圖8是潛在藥物靶點生成模塊的關系結構圖;
[0047]圖9是本發(fā)明實施例提供的用于復雜大腦疾病靶向組合治療分析的方法流程圖。
【具體實施方式】
[0048]為了使本發(fā)明的目的,技術方案及優(yōu)點更加清楚明白,以下結合實施例,對本發(fā)明進行進一步的詳細說明。應當理解,此處所描述的具體實施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
[0049]本發(fā)明基于用戶輸入的疾病關鍵詞(如癲癇,英文為epilepsy),使用網(wǎng)絡爬蟲技術,轉發(fā)用戶的查詢請求到醫(yī)學網(wǎng)站服務系統(tǒng)MeSH中,從MeSH中取得查詢的疾病亞型列表和疾病別名列表,并將疾病關鍵詞保存到疾病關鍵詞數(shù)據(jù)庫和疾病亞型列表保存到疾病亞型數(shù)據(jù)庫中。用戶選擇需要分析的疾病亞型列表,并為其設置相應的閾值,閾值的默認值為0.05 ;設置完成后,使用網(wǎng)絡爬蟲技術,從CoreMine網(wǎng)站系統(tǒng)服務器中,取得Significance值小于疾病亞型閾值的基因列表,并根據(jù)此基因,從PubMed網(wǎng)站中查詢出與該基因相關的英文文獻,保存到基因文獻數(shù)據(jù)庫中。將各疾病列表輸入到Disease Connect網(wǎng)站服務系統(tǒng)中得到各疾病列表的種子基因。并通過String9.1數(shù)據(jù)庫篩選邊值,使用BGLL算法進行模塊基因劃分,以進行富集分析,將富集分析結果同DrugBank數(shù)據(jù)庫中的基因藥物進行比對,以得到潛在的藥物靶點。
[0050]下面結合附圖1-9及對本發(fā)明的應用原理做進一步描述。
[0051]如圖2所示,本發(fā)明用于復雜大腦疾病靶向組合治療分析的系統(tǒng),包括疾病數(shù)據(jù)庫、基因數(shù)據(jù)庫、模塊基因關系數(shù)據(jù)庫、藥物靶點數(shù)據(jù)庫、Disease Connect數(shù)據(jù)庫、String9.1數(shù)據(jù)庫、DrugBank數(shù)據(jù)庫;以及MeSH服務器、CoreMine服務器、PubMed服務器、HGNC服務器、NCBI服務器、K0BAS服務器;并且包括用于區(qū)間劃分的BGLL算法。
[0052]所述疾病數(shù)據(jù)庫,包括疾病的名稱、疾病亞型名稱、疾病別名名稱;
[0053]所述基因數(shù)據(jù)庫,包括基因的名稱、基因的符號、基因的編號,基因所屬的疾病亞型、基因所屬模塊;
[0054]所述模塊基因關系數(shù)據(jù)庫,包括模塊名稱、基因的編號、基因名稱、基因符號;
[0055]所述藥物靶點數(shù)據(jù)庫包括藥品名稱、登記號、所屬組、藥品描述、適應癥、藥效、作用機制;
[0056]所述Disease Connect數(shù)據(jù)庫,包括疾病編號、疾病名稱、疾病類型和基因;
[0057]所述String9.1數(shù)據(jù)庫,包括蛋白編號、蛋白邊值、蛋白符號;
[0058]所述DrugBank數(shù)據(jù)庫,包括疾病編號、疾病名稱、基因名稱、基因庫蛋白編號、蛋白庫編號、蛋白庫名稱;
[0059]所述MeSH服務器、CoreMine服務器、PubMed