腫瘤外顯子組測(cè)序分析系統(tǒng)及方法
【專利摘要】本發(fā)明提供腫瘤外顯子組測(cè)序分析系統(tǒng)及方法。所述分析系統(tǒng)包括Web交互單元、Java交互單元和數(shù)據(jù)分析單元。其中Web交互單元用于以Web方式接收腫瘤外顯子組測(cè)序數(shù)據(jù)和測(cè)序參數(shù);Java交互單元用于對(duì)接收的數(shù)據(jù)和參數(shù),生成測(cè)序分析任務(wù);數(shù)據(jù)分析單元用于根據(jù)生成的任務(wù),讀取所述腫瘤外顯子組測(cè)序數(shù)據(jù),并通過調(diào)用生物信息學(xué)軟件庫(kù)和腳本庫(kù),對(duì)數(shù)據(jù)進(jìn)行分析,獲取分析結(jié)果。本發(fā)明提供的腫瘤外顯子組測(cè)序分析系統(tǒng)及方法,通過調(diào)用高效準(zhǔn)確的生物信息學(xué)軟件和個(gè)性化分析模塊,一鍵式完成腫瘤外顯子組測(cè)序分析流程,提高了測(cè)序效率;此外,本發(fā)明還具有保存腫瘤外顯子組測(cè)序分析結(jié)果,進(jìn)行二次查詢檢索的功能,節(jié)省了科研成本,有助于更深入地挖掘數(shù)據(jù)信息。
【專利說明】
腫瘤外顯子組測(cè)序分析系統(tǒng)及方法
技術(shù)領(lǐng)域
[0001]本發(fā)明屬于生物信息學(xué)領(lǐng)域,具體地說,涉及腫瘤外顯子組測(cè)序分析系統(tǒng)及方法。
【背景技術(shù)】
[0002]生物信息學(xué)(B1informatics)作為生命科學(xué)和計(jì)算機(jī)科學(xué)相結(jié)合的新興學(xué)科,是研究生物信息的采集、處理、存儲(chǔ)、傳播、分析等的學(xué)科,可以有效揭示大量而復(fù)雜的生物數(shù)據(jù)所蘊(yùn)含的生物學(xué)規(guī)律。
[0003]腫瘤外顯子組測(cè)序分析作為生物信息領(lǐng)域的重要研究方向,通過運(yùn)用高通量測(cè)序技術(shù)對(duì)個(gè)體或群體中的不同樣本進(jìn)行全外顯子組或腫瘤相關(guān)基因的測(cè)序,對(duì)解決重大的基礎(chǔ)理論研究和腫瘤治療的精準(zhǔn)治療策略提供重要的指導(dǎo)作用。
【發(fā)明內(nèi)容】
[0004]本發(fā)明的目的是提供腫瘤外顯子組測(cè)序分析系統(tǒng)。
[0005]本發(fā)明的另一目的是提供基于上述分析系統(tǒng)的腫瘤外顯子組測(cè)序分析方法。
[0006]本發(fā)明基于以下構(gòu)思:腫瘤外顯子組測(cè)序是對(duì)已知基因組序列的物種進(jìn)行全外顯子組或腫瘤相關(guān)基因的測(cè)序,并在此基礎(chǔ)上對(duì)個(gè)體或群體中樣本的異質(zhì)性進(jìn)行差異分析?,F(xiàn)有技術(shù)中,腫瘤外顯子組測(cè)序數(shù)據(jù)分析需要多款軟件的人工銜接和操作,同時(shí)需要操作人員具備一定的專業(yè)技術(shù)技能,操作流程繁瑣。為解決上述問題,本發(fā)明提供腫瘤外顯子組測(cè)序分析系統(tǒng)及方法,使整個(gè)生物信息學(xué)分析流程實(shí)現(xiàn)自動(dòng)化。
[0007]為了實(shí)現(xiàn)本發(fā)明目的,本發(fā)明提供腫瘤外顯子組測(cè)序分析系統(tǒng),所述分析系統(tǒng)包括Web交互單元、Java交互單元和數(shù)據(jù)分析單元,通過生成腫瘤外顯子組測(cè)序數(shù)據(jù)任務(wù)信息訂單,調(diào)用相關(guān)生物信息學(xué)軟件庫(kù)和腳本庫(kù)進(jìn)行分析,獲取腫瘤外顯子測(cè)序分析結(jié)果。
[0008]具體而言,Web交互單元,以Web方式接收腫瘤外顯子組測(cè)序數(shù)據(jù)和測(cè)序參數(shù),并將測(cè)序數(shù)據(jù)和參數(shù)發(fā)送至Java交互單元,還用于將最終分析結(jié)果展示給用戶;
[0009]Java交互單元,用于根據(jù)所述Web交互單元接收的腫瘤外顯子組測(cè)序數(shù)據(jù)和測(cè)序參數(shù),生成腫瘤外顯子組測(cè)序分析任務(wù)信息,并將所述信息發(fā)送至數(shù)據(jù)分析單元;以及
[0010]數(shù)據(jù)分析單元,用于根據(jù)所述Java交互單元生成的腫瘤外顯子組測(cè)序分析任務(wù)信息,讀取所述腫瘤外顯子組測(cè)序數(shù)據(jù),并通過調(diào)用生物信息學(xué)軟件庫(kù)和腳本庫(kù),對(duì)所述數(shù)據(jù)進(jìn)行系統(tǒng)分析,獲取腫瘤外顯子組測(cè)序分析結(jié)果。
[0011 ] 其中,所述生物信息學(xué)軟件庫(kù)包括BWA、SamtooIs、GATK、Picard、Varscan、Anno var、MusigCV、SomaticSignature s和 Blast等;所述腳本庫(kù)包括 SNV檢測(cè)腳本、InDe I 檢測(cè)腳本、CNV檢測(cè)腳本、功能注釋腳本和繪圖及統(tǒng)計(jì)腳本等。
[0012]所述Java交互單元包括任務(wù)調(diào)度模塊,用于將Web交互單元所接收的測(cè)序數(shù)據(jù)和測(cè)序參數(shù)以及相應(yīng)生成的測(cè)序分析任務(wù)信息發(fā)送至數(shù)據(jù)分析單元;同時(shí)還可以實(shí)時(shí)監(jiān)測(cè)任務(wù)的運(yùn)行狀態(tài)及進(jìn)展。
[0013]所述Java交互單元還包括:
[0014]結(jié)果推送模塊,用于分析結(jié)束時(shí),根據(jù)相應(yīng)任務(wù)調(diào)度模塊發(fā)送的展示指令,將各數(shù)據(jù)分析單元中獲取的腫瘤外顯子組測(cè)序分析結(jié)果在Web交互單元進(jìn)行展示;
[0015]數(shù)據(jù)庫(kù)交互模塊,用于將腫瘤外顯子組測(cè)序分析結(jié)果根據(jù)任務(wù)調(diào)度模塊發(fā)送的存儲(chǔ)指令,將各數(shù)據(jù)分析單元中獲取的腫瘤外顯子組測(cè)序分析結(jié)果存儲(chǔ)至數(shù)據(jù)庫(kù)。
[0016]所述數(shù)據(jù)分析單元包括:
[0017]數(shù)據(jù)評(píng)估模塊,用于對(duì)所述測(cè)序數(shù)據(jù)進(jìn)行質(zhì)量檢測(cè),并根據(jù)質(zhì)量檢測(cè)結(jié)果,判斷所述測(cè)序數(shù)據(jù)是否可以進(jìn)行后續(xù)的測(cè)序分析;其中,所述質(zhì)量檢測(cè)包括堿基質(zhì)量分布檢測(cè)和堿基類型分布檢測(cè);
[0018]序列比對(duì)模塊,用于將評(píng)估后的腫瘤外顯子組測(cè)序數(shù)據(jù)與參考基因組序列分別進(jìn)行比對(duì)率統(tǒng)計(jì)、測(cè)序深度分布統(tǒng)計(jì)及插入片段分布統(tǒng)計(jì),得到相應(yīng)的比對(duì)率、基因組覆蓋深度及基因組覆蓋度結(jié)果,同時(shí)獲得過濾后的測(cè)序數(shù)據(jù);以及
[0019]突變檢測(cè)模塊,通過調(diào)用所述生物信息學(xué)軟件庫(kù)和腳本庫(kù),對(duì)所述過濾后的腫瘤外顯子組測(cè)序數(shù)據(jù)進(jìn)行突變檢測(cè)分析,包括單核苷酸多態(tài)性檢測(cè)和插入缺失檢測(cè)以及LOH檢測(cè)。
[0020]優(yōu)選地,所述數(shù)據(jù)分析單元還包括功能注釋模塊,通過調(diào)用腳本庫(kù)和功能注釋庫(kù)完成突變位點(diǎn)的功能注釋挖掘,所述基因位置包括基因區(qū)、基因間區(qū)和非翻譯區(qū)。
[0021]優(yōu)選地,所述數(shù)據(jù)分析單元還包括驅(qū)動(dòng)基因和通路富集分析模塊,通過調(diào)用腳本庫(kù)和功能注釋庫(kù)完成驅(qū)動(dòng)基因的檢測(cè)和篩選,同時(shí)對(duì)篩選出的高可信度的基因進(jìn)行生物體功能通路的還原。
[0022]優(yōu)選地,所述數(shù)據(jù)分析單元還包括:體細(xì)胞突變檢測(cè)模塊,用于對(duì)測(cè)序數(shù)據(jù)進(jìn)行突變類型的統(tǒng)計(jì)分析;以及拷貝數(shù)變異檢測(cè)模塊,用于通過調(diào)用腳本庫(kù),完成對(duì)腫瘤外顯子測(cè)序數(shù)據(jù)的拷貝數(shù)變異的檢測(cè)統(tǒng)計(jì),同時(shí)完成在相應(yīng)參考基因組上的位置展示。
[0023]本發(fā)明進(jìn)一步提供基于上述分析系統(tǒng)的腫瘤外顯子組測(cè)序分析方法,包括以下步驟:
[0024]S1、通過Web交互單元接收腫瘤外顯子組測(cè)序數(shù)據(jù)和測(cè)序參數(shù);
[0025]S2、通過Java交互單元,根據(jù)Web交互單元接收的腫瘤外顯子組測(cè)序數(shù)據(jù)和參數(shù),生成腫瘤外顯子組測(cè)序分析任務(wù)信息;以及
[0026]S3、利用數(shù)據(jù)分析單元,根據(jù)所述腫瘤外顯子組測(cè)序分析任務(wù),通過調(diào)用生物信息學(xué)軟件庫(kù)和腳本庫(kù),對(duì)所述腫瘤外顯子組測(cè)序數(shù)據(jù)進(jìn)行分析,獲取腫瘤外顯子組測(cè)序分析結(jié)果并將結(jié)果展示給用戶。
[0027]本發(fā)明提供的腫瘤外顯子組測(cè)序分析系統(tǒng)及方法,通過調(diào)用高效準(zhǔn)確的生物信息學(xué)軟件和個(gè)性化分析模塊,一鍵式完成腫瘤外顯子組測(cè)序分析流程,提高了測(cè)序效率;此夕卜,本發(fā)明還具有保存腫瘤外顯子組測(cè)序分析結(jié)果,進(jìn)行二次查詢檢索的功能,節(jié)省了科研成本,有助于更深入地挖掘數(shù)據(jù)信息。
【附圖說明】
[0028]圖1為本發(fā)明實(shí)施例中腫瘤外顯子組測(cè)序分析系統(tǒng)的結(jié)構(gòu)示意圖。
[0029]圖2為本發(fā)明實(shí)施例中腫瘤外顯子組測(cè)序分析系統(tǒng)的詳細(xì)結(jié)構(gòu)示意圖。
[0030]圖3為本發(fā)明實(shí)施例中腫瘤外顯子組測(cè)序分析系統(tǒng)的數(shù)據(jù)分析單元的工作流程示意圖。
[0031]圖4為本發(fā)明實(shí)施例中腫瘤外顯子組測(cè)序分析方法的流程示意圖。
【具體實(shí)施方式】
[0032]以下實(shí)施例用于說明本發(fā)明,但不用來限制本發(fā)明的范圍。若未特別指明,實(shí)施例中所用的技術(shù)手段為本領(lǐng)域技術(shù)人員所熟知的常規(guī)手段,所用原料均為市售商品。
[0033]實(shí)施例腫瘤外顯子組測(cè)序分析系統(tǒng)及方法
[0034]本實(shí)施例提供的腫瘤外顯子組測(cè)序分析系統(tǒng)的結(jié)構(gòu)示意圖見圖1,該分析系統(tǒng)包括:
[0035]Web交互單元11,用于接收腫瘤外顯子組測(cè)序數(shù)據(jù)和測(cè)序參數(shù),并將所述腫瘤外顯子組測(cè)序數(shù)據(jù)和參數(shù)發(fā)送至Java交互單元12;
[0036]Java交互單元12,用于根據(jù)所述Web交互單元11接收的腫瘤外顯子組測(cè)序數(shù)據(jù)和參數(shù),生成腫瘤外顯子組測(cè)序分析任務(wù)信息,并將所述測(cè)序分析任務(wù)信息發(fā)送至數(shù)據(jù)分析單元13;
[0037]數(shù)據(jù)分析單元13,用于根據(jù)所述Java交互單元12生成的腫瘤外顯子組測(cè)序分析任務(wù)信息,讀取所述測(cè)序數(shù)據(jù),并通過調(diào)用生物信息學(xué)軟件庫(kù)和腳本庫(kù),對(duì)所述腫瘤外顯子組測(cè)序數(shù)據(jù)進(jìn)行分析,獲取腫瘤外顯子組測(cè)序分析結(jié)果。
[0038]其中,所述生物信息學(xué)軟件庫(kù)包括:BWA、Samtools、GATK、Picard、Varscan、Anno var、MusigCV、SomaticSignature s和 Blast等;所述腳本庫(kù)包括 SNV檢測(cè)腳本、InDe I 檢測(cè)腳本、CNV檢測(cè)腳本、功能注釋腳本和繪圖及統(tǒng)計(jì)腳本等。
[0039]該腫瘤外顯子組測(cè)序分析系統(tǒng)的詳細(xì)結(jié)構(gòu)示意圖見圖2,包括Web交互單元21、Java交互單元22和數(shù)據(jù)分析單元23。
[0040]其中,Java交互單元22包括:結(jié)果推送模塊221、任務(wù)調(diào)度模塊222、數(shù)據(jù)庫(kù)交互模塊223 0
[0041 ]數(shù)據(jù)分析單元23包括:數(shù)據(jù)評(píng)估模塊231、序列比對(duì)模塊232、突變檢測(cè)模塊233、功能注釋模塊234、驅(qū)動(dòng)基因和通路富集分析模塊235、體細(xì)胞突變檢測(cè)和拷貝數(shù)變異檢測(cè)模塊236。
[0042]Web交互單元21用于接收腫瘤外顯子組測(cè)序數(shù)據(jù)和測(cè)序參數(shù),并將所述腫瘤外顯子組測(cè)序數(shù)據(jù)和參數(shù)發(fā)送至Java交互單元22的任務(wù)調(diào)度模塊222。
[0043]Java交互單元22用于根據(jù)所述Web交互單元21接收的腫瘤外顯子組測(cè)序數(shù)據(jù)和參數(shù),生成腫瘤外顯子組測(cè)序任務(wù)信息,并將所述測(cè)序任務(wù)信息發(fā)送至數(shù)據(jù)分析單元23。
[0044]數(shù)據(jù)分析單元23用于根據(jù)所述Java交互單元22生成的腫瘤外顯子組測(cè)序任務(wù)信息,讀取所述腫瘤外顯子組測(cè)序數(shù)據(jù),并通過調(diào)用生物信息學(xué)軟件庫(kù)和腳本庫(kù),對(duì)所述測(cè)序數(shù)據(jù)進(jìn)行分析,獲取腫瘤外顯子組測(cè)序分析結(jié)果。
[0045]數(shù)據(jù)評(píng)估模塊231用于對(duì)所述腫瘤外顯子測(cè)序數(shù)據(jù)進(jìn)行質(zhì)量檢測(cè),并根據(jù)質(zhì)量檢測(cè)結(jié)果,判斷所述測(cè)序數(shù)據(jù)是否可以進(jìn)行腫瘤外顯子組測(cè)序分析;其中,所述質(zhì)量檢測(cè)包括堿基質(zhì)量分布檢測(cè)和堿基類型分布檢測(cè)。
[0046]可以理解的是,所述質(zhì)量檢測(cè)包括堿基質(zhì)量分布檢測(cè),基于測(cè)序數(shù)據(jù)中包含的堿基質(zhì)量值,利用Perl腳本對(duì)所有堿基的質(zhì)量值進(jìn)行統(tǒng)計(jì),當(dāng)85%以上的堿基質(zhì)量值高于30分時(shí),此數(shù)據(jù)才可以繼續(xù)進(jìn)行后續(xù)分析,否則需要先進(jìn)行低質(zhì)量序列過濾方可使用。
[0047]其中,所述質(zhì)量檢測(cè)還包括堿基類型分布檢測(cè),用于檢測(cè)有無(wú)AT、GC堿基分離現(xiàn)象,高通量測(cè)序時(shí),基因組隨機(jī)打斷,由于位點(diǎn)在基因組上的分布是近似均勻的,同時(shí),G/C、A/T含量也是近似均勻的,因此,根據(jù)大數(shù)定理,在每個(gè)測(cè)序循環(huán)上,GC、AT含量應(yīng)當(dāng)分別相等,且等于基因組的GC、AT含量,因此當(dāng)發(fā)生AT或GC分離的情況時(shí),此數(shù)據(jù)不能繼續(xù)進(jìn)行后續(xù)分析。
[0048]序列比對(duì)模塊232用于將所述數(shù)據(jù)評(píng)估模塊評(píng)估后的測(cè)序數(shù)據(jù)與參考基因組分別進(jìn)行比對(duì)率統(tǒng)計(jì)、測(cè)序深度分布統(tǒng)計(jì)、插入片段分布統(tǒng)計(jì),分別得到比對(duì)率、基因組覆蓋深度、基因組覆蓋度。
[0049]上述的序列比對(duì)模塊232,還用于過濾評(píng)估后的腫瘤外顯子組測(cè)序數(shù)據(jù)中的重復(fù)序列,得到過濾后的腫瘤外顯子組測(cè)序數(shù)據(jù)。
[0050]具體而言,序列比對(duì)模塊232還用于過濾比對(duì)結(jié)果中的重復(fù)序列,重復(fù)序列主要是由于測(cè)序PCR產(chǎn)生的,會(huì)影響測(cè)序深度等比對(duì)評(píng)估參數(shù),最終導(dǎo)致突變檢測(cè)的假陽(yáng)性,比對(duì)結(jié)果一般以BAM格式(二進(jìn)制的比對(duì)結(jié)果存儲(chǔ)格式,占用空間小,檢索速度快)進(jìn)行存儲(chǔ),使用Picard的Mark Duplicate模塊進(jìn)行處理去重復(fù),屏蔽PCR-duplicat1n的影響。
[0051]突變檢測(cè)模塊233用于通過調(diào)用所述生物信息學(xué)軟件庫(kù)和腳本庫(kù),對(duì)所述過濾后的腫瘤外顯子組測(cè)序數(shù)據(jù)進(jìn)行突變檢測(cè)分析。
[0052]可以理解的是,所述突變檢測(cè)分析包括單核苷酸多態(tài)性檢測(cè)、插入缺失檢測(cè)、結(jié)構(gòu)變異檢測(cè)。
[0053]功能注釋模塊234,在突變檢測(cè)分析過程中,用于對(duì)突變所在的基因組位置進(jìn)行功能注釋,所述基因位置包括基因區(qū)、基因間區(qū)和非翻譯區(qū)。
[0054]驅(qū)動(dòng)基因檢測(cè)和通路富集模塊235用于將突變檢測(cè)的過濾結(jié)果進(jìn)行驅(qū)動(dòng)基因的檢測(cè)和相應(yīng)富集通路的展示。
[0055]體細(xì)胞突變檢測(cè)模塊236用于對(duì)體細(xì)胞中的突變類型進(jìn)行統(tǒng)計(jì)。
[0056]其中,所述功能注釋數(shù)據(jù)庫(kù)包括KEGG。
[0057]具體地,數(shù)據(jù)分析單元23的工作流程見圖3,用BWA將測(cè)序數(shù)據(jù)Reads比對(duì)到參考基因組上,并用Picard去除比對(duì)重復(fù),用Samtools統(tǒng)計(jì)比對(duì)結(jié)果;SNV和InDel檢測(cè)以及LOH檢測(cè),基于比對(duì)結(jié)果,用GATK進(jìn)行檢測(cè),檢測(cè)前需進(jìn)行InDel附近重新比對(duì)、堿基校正,以降低檢測(cè)的假陽(yáng)性;使用Varscan進(jìn)行CNV檢測(cè);突變基因注釋,使用Annovar進(jìn)行功能區(qū)域注釋,使用Blast進(jìn)行基因功能注釋。
[0058]對(duì)本發(fā)明的腫瘤外顯子組測(cè)序分析系統(tǒng)進(jìn)行了不同真實(shí)數(shù)據(jù)集的測(cè)試,與預(yù)期的結(jié)果一致。
[0059]基于上述分析系統(tǒng),本實(shí)施例還提供腫瘤外顯子組測(cè)序分析方法(圖4),包括以下步驟:
[0060]S1、通過Web交互單元接收腫瘤外顯子組測(cè)序數(shù)據(jù)和測(cè)序參數(shù);
[0061]S2、通過Java交互單元,根據(jù)Web交互單元接收的腫瘤外顯子組測(cè)序數(shù)據(jù)和參數(shù),生成腫瘤外顯子組測(cè)序分析任務(wù)信息;
[0062]S3、利用數(shù)據(jù)分析單元,根據(jù)所述腫瘤外顯子組測(cè)序分析任務(wù),通過調(diào)用生物信息學(xué)軟件庫(kù)和腳本庫(kù),對(duì)所述腫瘤外顯子組測(cè)序數(shù)據(jù)進(jìn)行分析,獲取腫瘤外顯子組測(cè)序分析結(jié)果并將結(jié)果展示給用戶。
[0063]本實(shí)施例提供的腫瘤外顯子組測(cè)序分析系統(tǒng)及方法,通過調(diào)用高效準(zhǔn)確的生物信息學(xué)軟件和個(gè)性化分析模塊,一鍵式完成腫瘤外顯子組測(cè)序分析流程,提高了測(cè)序效率;此夕卜,該系統(tǒng)還具有保存腫瘤外顯子組測(cè)序分析結(jié)果,進(jìn)行二次查詢檢索的功能,節(jié)省了科研成本,有助于更深入地挖掘數(shù)據(jù)信息。
[0064]雖然,上文中已經(jīng)用一般性說明及具體實(shí)施方案對(duì)本發(fā)明作了詳盡的描述,但在本發(fā)明基礎(chǔ)上,可以對(duì)之作一些修改或改進(jìn),這對(duì)本領(lǐng)域技術(shù)人員而言是顯而易見的。因此,在不偏離本發(fā)明精神的基礎(chǔ)上所做的這些修改或改進(jìn),均屬于本發(fā)明要求保護(hù)的范圍。
[0065]參考文獻(xiàn)
[0066](I)Li H,Durbin R.Fast and accurate short read alignment with Burrows-WheelerTransform.B1informatics,2009 25:1754-60.
[0067](2)DePr isto MA,Banks E ,Poplin R,et al.A framework for variat1ndiscovery and genotyping usingnext-generat1n DNA sequencing data.Naturegenetics,201I,43(5):491-498.
[0068](3)Koboldt D Cj Zhang QjLarson D E,et al.VarScan 2: somatic mutat1nand copy number alterat1ndiscovery in cancer by exome sequencing[J].Genomeresearch,2012,22(3):568-576.
[0069](4)Picard:http://sourceforge.net/projects/picard/.(Picard).
[0070](5)ffang KjLi MjHakonarson H.ANN0VAR:funct1naI annotat1n of geneticvariants fromhigh-throughput sequencing data[J].Nucleic acids research,2010,38(16):el64-el64.
[0071](6)Chang XjWang K.wANNOVAR:annotating genetic variants for personalgenomes via the web[J].Journal of medical genetics,2012,49(7):433-436.
[0072](7)Yang HjWang K.Genomic variant annotat1n and pr1ritizat1n withANN0VAR andwANN0VAR[J].Nature protocols,2015,10(10):1556-1566.
[0073](8)Dees ND,Zhang QjKandoth CjWendl MC,Schierding WjKoboldt DC,etal.MuSiC:1dentifyingmutat1nal significance in cancer genomes.Genome Res2012;22(8):1589-98.
[0074](9)ffendl MCjWallis JffjLin L,et al.PathScan: a tool for discerningmutat1nal significance in groupsof putative cancer genes.B1informatics2011;27:1595-602.
[0075](1)Lawrence M SjStojanov PjPolak P,et al.Mutat1nal heterogeneity incancer and the search fornew cancer-associated genes[J].Nature,2013,499(7457):214-218.
[0076](Il)Futreal P AjCoin LjMarshall M,et al.A census of human cancergenes[J].Nature ReviewsCancer,2004,4(3):177-183.
[0077](12)Vogelstein B,Papadopoulos NjVelculescu V E,et al.Cancer genomelandscapes!! J].science,2013,339(6127): 1546-15580
【主權(quán)項(xiàng)】
1.腫瘤外顯子組測(cè)序分析系統(tǒng),其特征在于,所述分析系統(tǒng)包括: Web交互單元,以Web方式接收腫瘤外顯子組測(cè)序數(shù)據(jù)和測(cè)序參數(shù),并將測(cè)序數(shù)據(jù)和參數(shù)發(fā)送至Java交互單元,還用于將最終分析結(jié)果展示給用戶; Java交互單元,用于根據(jù)所述Web交互單元接收的腫瘤外顯子組測(cè)序數(shù)據(jù)和測(cè)序參數(shù),生成腫瘤外顯子組測(cè)序分析任務(wù)信息,并將所述信息發(fā)送至數(shù)據(jù)分析單元;以及 數(shù)據(jù)分析單元,用于根據(jù)所述Java交互單元生成的腫瘤外顯子組測(cè)序分析任務(wù)信息,讀取所述腫瘤外顯子組測(cè)序數(shù)據(jù),并通過調(diào)用生物信息學(xué)軟件庫(kù)和腳本庫(kù),對(duì)所述數(shù)據(jù)進(jìn)行系統(tǒng)分析,獲取腫瘤外顯子組測(cè)序分析結(jié)果。2.根據(jù)權(quán)利要求1所述的分析系統(tǒng),其特征在于,所述生物信息學(xué)軟件庫(kù)包括BWA、SamtooIs、GATK、Picard、Varscan、Annovar、MusigCV、SomaticSignatures和Blast; 所述腳本庫(kù)包括SNV檢測(cè)腳本、InDel檢測(cè)腳本、CNV檢測(cè)腳本、功能注釋腳本和繪圖及統(tǒng)計(jì)腳本。3.根據(jù)權(quán)利要求1或2所述的分析系統(tǒng),其特征在于,所述Java交互單元包括任務(wù)調(diào)度模塊,用于將Web交互單元所接收的測(cè)序數(shù)據(jù)和測(cè)序參數(shù)以及相應(yīng)生成的測(cè)序分析任務(wù)信息發(fā)送至數(shù)據(jù)分析單元;同時(shí)還可以實(shí)時(shí)監(jiān)測(cè)任務(wù)的運(yùn)行狀態(tài)及進(jìn)展。4.根據(jù)權(quán)利要求1-3任一項(xiàng)所述的分析系統(tǒng),其特征在于,所述Java交互單元還包括: 結(jié)果推送模塊,用于分析結(jié)束時(shí),根據(jù)相應(yīng)任務(wù)調(diào)度模塊發(fā)送的展示指令,將各數(shù)據(jù)分析單元中獲取的腫瘤外顯子組測(cè)序分析結(jié)果在Web交互單元進(jìn)行展示;以及 數(shù)據(jù)庫(kù)交互模塊,用于將腫瘤外顯子組測(cè)序分析結(jié)果根據(jù)任務(wù)調(diào)度模塊發(fā)送的存儲(chǔ)指令,將各數(shù)據(jù)分析單元中獲取的腫瘤外顯子組測(cè)序分析結(jié)果存儲(chǔ)至數(shù)據(jù)庫(kù)。5.根據(jù)權(quán)利要求1-4任一項(xiàng)所述的分析系統(tǒng),其特征在于,所述數(shù)據(jù)分析單元包括: 數(shù)據(jù)評(píng)估模塊,用于對(duì)所述測(cè)序數(shù)據(jù)進(jìn)行質(zhì)量檢測(cè),并根據(jù)質(zhì)量檢測(cè)結(jié)果,判斷所述測(cè)序數(shù)據(jù)是否可以進(jìn)行后續(xù)的測(cè)序分析;其中,所述質(zhì)量檢測(cè)包括堿基質(zhì)量分布檢測(cè)和堿基類型分布檢測(cè); 序列比對(duì)模塊,用于將評(píng)估后的腫瘤外顯子組測(cè)序數(shù)據(jù)與參考基因組序列分別進(jìn)行比對(duì)率統(tǒng)計(jì)、測(cè)序深度分布統(tǒng)計(jì)及插入片段分布統(tǒng)計(jì),得到相應(yīng)的比對(duì)率、基因組覆蓋深度及基因組覆蓋度結(jié)果,同時(shí)獲得過濾后的測(cè)序數(shù)據(jù);以及 突變檢測(cè)模塊,通過調(diào)用所述生物信息學(xué)軟件庫(kù)和腳本庫(kù),對(duì)所述過濾后的腫瘤外顯子組測(cè)序數(shù)據(jù)進(jìn)行突變檢測(cè)分析,包括單核苷酸多態(tài)性檢測(cè)和插入缺失檢測(cè)以及LOH檢測(cè)。6.根據(jù)權(quán)利要求1-5任一項(xiàng)所述的分析系統(tǒng),其特征在于,所述數(shù)據(jù)分析單元還包括功能注釋模塊,通過調(diào)用腳本庫(kù)和功能注釋庫(kù)完成突變位點(diǎn)的功能注釋挖掘,所述基因位置包括基因區(qū)、基因間區(qū)和非翻譯區(qū)。7.根據(jù)權(quán)利要求1-6任一項(xiàng)所述的分析系統(tǒng),其特征在于,所述數(shù)據(jù)分析單元還包括驅(qū)動(dòng)基因和通路富集分析模塊,通過調(diào)用腳本庫(kù)和功能注釋庫(kù)完成驅(qū)動(dòng)基因的檢測(cè)和篩選,同時(shí)對(duì)篩選出的高可信度的基因進(jìn)行生物體功能通路的還原。8.根據(jù)權(quán)利要求1-7任一項(xiàng)所述的分析系統(tǒng),其特征在于,所述數(shù)據(jù)分析單元還包括: 體細(xì)胞突變檢測(cè)模塊,用于對(duì)測(cè)序數(shù)據(jù)進(jìn)行突變類型的統(tǒng)計(jì)分析;以及 拷貝數(shù)變異檢測(cè)模塊,用于通過調(diào)用腳本庫(kù),完成對(duì)腫瘤外顯子測(cè)序數(shù)據(jù)的拷貝數(shù)變異的檢測(cè)統(tǒng)計(jì),同時(shí)完成在相應(yīng)參考基因組上的位置展示。9.基于權(quán)利要求1-8任一項(xiàng)所述分析系統(tǒng)的腫瘤外顯子組測(cè)序分析方法。10.根據(jù)權(quán)利要求9所述的方法,其特征在于,包括以下步驟: .51、通過Web交互單元接收腫瘤外顯子組測(cè)序數(shù)據(jù)和測(cè)序參數(shù); .52、通過Java交互單元,根據(jù)Web交互單元接收的腫瘤外顯子組測(cè)序數(shù)據(jù)和參數(shù),生成腫瘤外顯子組測(cè)序分析任務(wù)信息;以及. 53、利用數(shù)據(jù)分析單元,根據(jù)所述腫瘤外顯子組測(cè)序分析任務(wù),通過調(diào)用生物信息學(xué)軟件庫(kù)和腳本庫(kù),對(duì)所述腫瘤外顯子組測(cè)序數(shù)據(jù)進(jìn)行分析,獲取腫瘤外顯子組測(cè)序分析結(jié)果并將結(jié)果展示給用戶。
【文檔編號(hào)】G06F19/20GK106021993SQ201610316928
【公開日】2016年10月12日
【申請(qǐng)日】2016年5月12日
【發(fā)明人】鄭洪坤, 張?jiān)鼋? 孔關(guān)義, 李俊暉, 梁運(yùn)鵬
【申請(qǐng)人】北京百邁客云科技有限公司