一組用于腫瘤分子分型的基因及其應(yīng)用
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及癌癥診斷和分子生物學(xué)領(lǐng)域,以及診斷技術(shù)在臨床上的應(yīng)用。具體地, 本發(fā)明涉及一組用于腫瘤分子分型的基因及其應(yīng)用。本發(fā)明還涉及一種用于腫瘤分子分型 的試劑盒。
【背景技術(shù)】
[0002] 腫瘤是威脅人類健康的重要疾病之一。根據(jù)《2012中國腫瘤登記年報》,全國每 6分鐘就有一人被確診為癌癥,每天有8550人確診為癌癥,每七到八人中就有一人死于癌 癥。我國惡性腫瘤的發(fā)病及死亡呈上升趨勢,每年新發(fā)癌癥病例約350萬,癌癥特異性死亡 約250萬。預(yù)計到2020年,中國每年的癌癥死亡總數(shù)將達(dá)到300萬左右,患病總數(shù)達(dá)600 萬。
[0003]目前,癌癥的診斷主要包括詳細(xì)的病史詢問,全面的體格檢查,影像學(xué)檢查(包括 X線常規(guī)透視、拍片、各種造影、各種體層檢查;CT、ECT、核磁共振檢查;B型超聲檢查,核醫(yī) 學(xué)檢查等),病理學(xué)檢查,內(nèi)窺鏡檢查,放射免疫學(xué)檢查等。腫瘤的影像診斷雖有了很大的發(fā) 展,但是目前最先進(jìn)的醫(yī)學(xué)技術(shù)也只能"捕捉"到直徑0. 5厘米以上的腫塊,體積較小時傳 統(tǒng)影像方法則束手無策。病理學(xué)診斷是腫瘤診斷的"金標(biāo)準(zhǔn)"和臨床治療的基礎(chǔ),但病理診 斷也有局限性。病理學(xué)檢查的結(jié)果大大依賴于病理醫(yī)生的專業(yè)技術(shù)水平。因此,需要一種 比較客觀的判斷腫瘤類型和組織來源的方法。
[0004] 腫瘤是一類分子水平上高度異質(zhì)性的疾病。組織學(xué)形態(tài)相同的腫瘤,其分子遺傳 學(xué)改變不盡一致,從而導(dǎo)致了腫瘤治療反應(yīng)和預(yù)后的差別。近年來,隨著科學(xué)技術(shù)的發(fā)展, 手術(shù)治療、化學(xué)治療、放射治療等傳統(tǒng)治療手段不斷發(fā)展,生物靶向治療藥物不斷研發(fā),為 了達(dá)到最大療效和最小毒性,腫瘤類型的診斷和精確分型是關(guān)鍵。因此對腫瘤進(jìn)行分子分 型是腫瘤個體化治療的必然要求。
[0005] 在世界范圍內(nèi),大約3% -5%的癌癥是原發(fā)灶不明轉(zhuǎn)移性癌(Carcinomasof unknownprimary,CUP),是一類病理學(xué)確診為轉(zhuǎn)移性惡性,但是經(jīng)過詳細(xì)評估仍不能確定 原發(fā)位點的異質(zhì)性腫瘤。目前臨床上,盡管經(jīng)過詳細(xì)的影像學(xué)檢查和免疫組化分析,但是還 是只有大概20% -30%的原發(fā)灶不明轉(zhuǎn)移癌能夠找到原發(fā)灶。因此,如何準(zhǔn)確識別原發(fā)灶 不明轉(zhuǎn)移癌的組織起源是目前腫瘤臨床診斷中存在的痛點和難點。
[0006] 基因分子診斷具有靈敏度高、特異性強(qiáng)、背景機(jī)理明確的優(yōu)點,近年來被越來越多 地運(yùn)用于腫瘤檢測。例如乳腺癌HER-2基因的擴(kuò)增檢測,肺癌、結(jié)直腸癌EGFR和K-RAS基 因突變檢測,腹腔胃腸道間質(zhì)瘤C-kit基因檢測等。但基本都是采用少數(shù)幾個腫瘤標(biāo)志物, 只能用于單一腫瘤的亞型分類。而且,這些腫瘤標(biāo)志物的研究往往是基于一定量的實驗數(shù) 據(jù),所涉及的癌癥種類和樣本量都相對有限。近年來,隨著基因組學(xué)不斷發(fā)展,腫瘤基因大 數(shù)據(jù)不斷增加。因此,利用大數(shù)據(jù)分析方法,找到一種適用范圍廣、準(zhǔn)確率高的識別腫瘤類 型和組織來源的基因診斷方法,有助于實現(xiàn)個性化用藥,對患者進(jìn)行精準(zhǔn)治療具有重要的 臨床意義。
【發(fā)明內(nèi)容】
[0007] 本發(fā)明要解決的技術(shù)問題之一是提供一組用于腫瘤分子分型的基因,建立腫瘤分 類模型,能夠識別多種腫瘤的組織來源和腫瘤類型,有助于實現(xiàn)個體化治療。
[0008] 本發(fā)明要解決的技術(shù)問題之二是提供一組用于腫瘤分子分型的基因的用途。
[0009] 本發(fā)明要解決的技術(shù)問題之三是提供一種用于腫瘤分子分型的試劑盒及其用途。
[0010] 本發(fā)明要解決的技術(shù)問題之四是提供一組用于腫瘤分子分型的基因在制備用于 腫瘤分子分型的基因芯片中的應(yīng)用。
[0011] 為解決上述技術(shù)問題,本發(fā)明采用如下技術(shù)方案:
[0012] 在本發(fā)明的一方面,提供一組用于腫瘤分子分型的基因,包括如下38個基因: ACPP基因、AGR2基因、ASPN基因、AZGPl基因、CDHl基因、CEACAM5基因、CEACAM6基因、 CYP17A1基因、EPCAM基因、FABPl基因、GATA3基因、GCG基因、GFAP基因、IGJ基因、KLK2基 因、KLK3基因、KRT13基因、KRT14基因、KRT15基因、KRT19基因、LUM基因、MGP基因、MMPl 基因、MMP12基因、MS4A1基因、NPTX2基因、PCP4基因、PEG3基因、POSTN基因、RPSll基因、 S100A8基因、SERPINA3基因、SFN基因、SLC3A1基因、TACSTD2基因、TG基因、VEGFA基因、 XIST基因。
[0013] 作為本發(fā)明優(yōu)選的技術(shù)方案,該組用于腫瘤分子分型的基因,還包括如下58個基 因(即包括96個基因):ACTG2基因、AP0BEC3B基因、APOD基因、ATPlBl基因、C7基因、CA12 基因、0(^18基因、0)1117基因、(^^基因、011311基因、(:0)附8基因、0〇]基因、0^1認(rèn)1基 因、CXCL14基因、DLKl基因、EGFR基因、ESRl基因、FABP4基因、GJAl基因、GPM6B基因、GPX3 基因、GREMl基因、HBB基因、HLA-DQAl基因、ID4基因、IGFBP2基因、IGFBP7基因、ISLl基 因、KRT20基因、LGALS4基因、MMP3基因、MSMB基因、NKX2-1基因、NKX3-1基因、NPYlR基 因、PCDH7基因、PI15基因、PIGR基因、PLA2G2A基因、PRRXl基因、PTCDS基因、PTN基因、 RGS4基因、RPS4Y1基因、S100A2基因、S100P基因、SCGB2A2基因、SERPINB3基因、SFRPl基 因、SFTPB基因、SPINKl基因、SPPl基因、SST基因、SULT2A1基因、TH基因、TM4SF4基因、 TSPAN8基因、TYRPl基因。
[0014] 所述腫瘤包括(但不限于):腎上腺癌,腦癌,乳腺癌,宮頸癌,結(jié)直腸癌,子宮內(nèi)膜 癌,胃食管癌,頭頸部腫瘤,腎癌,肝癌,肺癌,淋巴瘤,黑色素瘤,間皮瘤,神經(jīng)內(nèi)分泌腫瘤, 子宮癌,胰腺癌,前列腺癌,肉瘤,睪丸癌,甲狀腺腫瘤,泌尿系統(tǒng)腫瘤和原發(fā)灶不明轉(zhuǎn)移癌。
[0015] 本發(fā)明通過基因檢測、標(biāo)志物組合及數(shù)據(jù)挖掘算法的聯(lián)合應(yīng)用來建立基因標(biāo)志物 組合模型,利用多基因預(yù)測模型判斷原發(fā)灶不明轉(zhuǎn)移癌的原發(fā)位點,主要包括以下步驟:
[0016] (1)收集腫瘤樣本的臨床診斷數(shù)據(jù)和基因表達(dá)譜數(shù)據(jù),構(gòu)建包含人類已知2萬多 個基因、22種癌癥類型,5800例腫瘤樣品的癌癥基因表達(dá)譜數(shù)據(jù)庫;
[0017] (2)對基因表達(dá)模式進(jìn)行統(tǒng)計分析,篩選出96個與腫瘤組織起源密切相關(guān)的基 因,分別為:ACPP基因、AGR2基因、ASPN基因、AZGP1基因、CDHl基因、CEACAM5基因、CEACAM6 基因、CYP17A1基因、EPCAM基因、FABPl基因、GATA3基因、GCG基因、GFAP基因、IGJ基因、 KLK2基因、KLK3基因、KRT13基因、KRT14基因、KRT15基因、KRT19基因、LUM基因、MGP基因、 MMP1基因、MMP12基因、MS4A1基因、NPTX2基因、PCP4基因、PEG3基因、POSTN基因、RPS11 基因、S100A8基因、SERPINA3基因、SFN基因、SLC3A1基因、TACSTD2基因、TG基因、VEGFA 基因、XIST基因、ACTG2基因、AP0BEC3B基因、APOD基因、ATPlBl基因、C7基因、CA12基因、CCL18 基因、CDH17 基因、CHGA基因、CHI3L1 基因、CLDN18 基因、CLU基因、COLlIAl基因、 CXCL14 基因、DLKl基因、EGFR基因、ESRl基因、FABP4 基因、GJAl基因、GPM6B基因、GPX3 基因、GREMl基因、HBB基因、HLA-DQAl基因、ID4基因、IGFBP2基因、IGFBP7基因、ISLl基 因、KRT20 基因、LGALS4 基因、MMP3 基因、MSMB基因、NKX2-1 基因、NKX3-1 基因、NPYlR基 因、PCDH7基因、PI15基因、PIGR基因、PLA2G2A基因、PRRXl基因、PTCDS基因、PTN基因、 RGS4 基因、RPS4Y1 基因、S100A2 基因、S100P基因、SCGB2A2 基因、SERPINB3 基因、SFRPl基 因、SFTPB基因、SPINKl基因、SPPl基因、SST基因、SULT2A1基因、TH基因、TM4SF4基因、 TSPAN8 基因、TYRPl基因;
[0018] (3)計算上述96個基因表達(dá)模式,通過腫瘤分類模型對組織來源進(jìn)行評價,計算 該樣本與每種癌癥類型的相似度分?jǐn)?shù)(SimilarityScore)。根據(jù)相似度分?jǐn)?shù)最高的判定規(guī) 貝IJ,判定組織來源和腫瘤類型。
[0019] 本發(fā)明提供了一種用于腫瘤分子分型的檢測方法,包括以下步驟:
[0020] (1)將取自腫瘤患者的生物學(xué)樣本與生物標(biāo)志物接觸,所述生物標(biāo)志物包括上述 96個基因;所述生物學(xué)樣本是取自所述對象的離體腫瘤組織,可以是新鮮樣本或者福爾馬 林固定的石蠟包埋(FFPE)樣本;
[0021] 在此基礎(chǔ)上,進(jìn)一步進(jìn)行腫瘤分類:
[0022] (2)檢測該生物學(xué)樣本中96個基因的表達(dá)模式和表達(dá)水平,基于96個基因的表達(dá) 水平來判斷該生物學(xué)樣本的腫瘤類型。采用數(shù)據(jù)分析方法,計算該生物學(xué)樣本與各種腫瘤 類別的相似度分?jǐn)?shù)(SimilarityScore)。根據(jù)相似度分?jǐn)?shù)最高的判定規(guī)則,判定組織來源 和腫瘤類型,進(jìn)行腫瘤分子分型。所述檢測包括從所述樣本制備RNA,所述RNA用于聚合酶 鏈?zhǔn)椒磻?yīng)(PCR),所述PCR是逆轉(zhuǎn)錄PCR(RT-PCR),可選實時RT-PCR或者基因芯片或者高通 量測序技術(shù)。
[0023] 在本發(fā)明的另一方面,提供一組用于腫瘤分子分型的基因在制備用于腫瘤分子分 型的試劑盒中的應(yīng)用。
[0024] 在本發(fā)明的另一方面,提供一種用于腫瘤分子分型的試劑盒,該試劑盒包含如下 生物標(biāo)志物,所述生物標(biāo)志物選自上述一組用于腫瘤分子分型的基因中的任意一種或多 種。
[0025] 作為本發(fā)明優(yōu)選的技術(shù)方案,所述生物標(biāo)志物是核酸、寡核酸鏈、或PCR引物組。
[0026] 作為本發(fā)明優(yōu)選的技術(shù)方案,所述PCR引物組包括:
[0027]ACPP基因:正向引物如SEQIDNO. 1所示,反向引物如SEQIDNO. 2所示;
[0028]AGR2基因:正向引物如SEQIDNO. 3所示,反向引物如SEQIDNO. 4所示;
[0029]ASPN基因:正向引物如SEQIDNO. 5所示,反向引物如SEQIDNO. 6所示;
[0030]AZGPl基因:正向引物如SEQIDNO. 7所示,反向引物如SEQIDNO. 8所示;
[0031]CDHl基因:正向引物如SEQIDNO. 9所示,反向引物如SEQIDNO. 10所示;
[0032]CEACAM5基因:正向引物如SEQIDNO. 11所示,反向引物如SEQIDNO. 12所示;
[0033]CEACAM6基因:正向引物如SEQIDNO. 13所示,反向引物如SEQIDNO. 14所示;
[0034]CYP17A1基因:正向引物如SEQIDNO. 15所示,反向引物如SEQIDNO. 16所示;
[0035] EPCAM基因:正向引物如SEQ ID NO. 17所示,反向引物如SEQ ID NO. 18所示;
[0036] FABPl基因:正向引物如SEQ ID NO. 19所示,反向引物如SEQ ID NO. 20所示;
[0037] GATA3基因:正向引物如SEQ ID NO. 21所示,反向引物如SEQ ID NO. 22所示;
[0038] GCG基因:正向引物如SEQ ID NO. 23所示,反向引物如SEQ ID NO. 24所示;
[0039] GFAP基因:正向引物如SEQ ID NO. 25所示,反向引物如SEQ ID NO. 26所示;
[0040] IGJ基因:正向引物如SEQ ID NO. 27所示,反向引物如SEQ ID NO. 28所示;
[0041] KLK2基因:正向引物如SEQ ID NO. 29所示,反向引物如SEQ ID NO. 30所示;
[0042] KLK3基因:正向引物如SEQ ID NO. 31所示,反向引物如SEQ ID NO. 32所示;
[0043] KRT13基因:正向引物如SEQ ID NO. 33所示,反向引物如SEQ ID NO. 34所示;
[0044] KRT14基因:正向引物如SEQ ID NO. 35所示,反向引物如SEQ ID NO. 36所示;
[0045] KRT15基因:正向引物如SEQ ID NO. 37所示,反向引物如SEQ ID NO. 38所示;
[0046] KRT19基因:正向引物如SEQ ID NO. 39所示,反向引物如SEQ ID NO. 40所示;
[0047] LUM基因:正向引物如SEQ ID NO. 41所示,反向引物如SEQ ID NO.