本發(fā)明涉及分子生物學技術(shù)領(lǐng)域,具體地說,是一種與惡性膠質(zhì)瘤診斷相關(guān)的標志物及其應(yīng)用。
背景技術(shù):
gbm最初命名為多形性膠質(zhì)母細胞瘤,就是在試圖描述腫瘤內(nèi)不同細胞的顯著差異,這也反映了分子的異質(zhì)性。早在基因組技術(shù)能夠明確gbm分子特征的情況下,一個簡單的臨床現(xiàn)象就重塑了gbm作為一種單一的疾病這種概念。臨床上,大多數(shù)膠質(zhì)母細胞瘤(約90%)為原發(fā)性,僅少數(shù)是從低級別膠質(zhì)瘤進展而來(繼發(fā)性gbm)。原發(fā)性和繼發(fā)性gbms表現(xiàn)出完全不同的分子特征,例如,表皮生長因子受體(egfr)和磷酸酶張力蛋白同源物(pten)常在原發(fā)性gbms中異常,而tp53在繼發(fā)性gbms中異常。雖然繼發(fā)性gbms很罕見的,僅占gbms的5%到10%,但其獨特的分子特征和臨床過程讓我們認識到gbm是一種異質(zhì)性的疾病。
gbm是癌癥基因組圖譜(tcga)項目首選研究的癌癥,2008年nature雜志發(fā)表了tcga發(fā)出的第一篇研究結(jié)果,其從拷貝數(shù)變異,基因表達,dna甲基化等方面對gbm分子特征進行了多角度大規(guī)模的分析。除了常見的體細胞突變,包括tp53,pten,nf1,egfr,erbb2,rb1,pik3r1,pik3ca等,tcga還發(fā)現(xiàn)了一些新的顯著性變異,如nf1、park2的純合子缺失,以及akt3的擴增等,并且發(fā)現(xiàn)這些遺傳變異主要富集在三條信號通路:(a)受體酪氨酸激酶/ras/磷脂酰肌醇3激酶(rtk/ras/pi3k)信號通路(在88%的gbm病人中異常);(b)p53信號通路(在87%的gbm病人中異常);and(c)rb信號通路(在78%的gbm病人中異常)。
tcga及其他研究小組的研究成果描繪了一幅gbm的分子景觀圖:egfr,met,pdgfra,mdm4,mdm2,ccnd2,pik3cad等基因的擴增及cdkn2a/b,cdkn2c,pten,rb1,nfkb1a等基因的缺失;及p53、pten、nf1、rb1、idh1和idh2在體細胞中有不同頻率的突變,如egfr胞外域的突變,包括egfr變異iii(egfrviii)。隨著基因組技術(shù)的進步,一些新的遺傳改變被發(fā)現(xiàn),包括wnt信號調(diào)節(jié)器fat1在20%膠質(zhì)母細胞瘤中出現(xiàn)體細胞突變,和fgfr3/tacc融合基因的發(fā)現(xiàn)。盡管這些新的遺傳改變可能并不常見,但是他們可以擴展我們的生物信息認知并且可能具有很大臨床應(yīng)用價值。
通過對tcga基因表達數(shù)據(jù)的分析,verhaak等人將gbm分為四個亞型,即neural,proneural,mesenchymal,classical亞型,每個亞型均有完全不同的分子改變。proneural亞型特點是有豐富的pdgfra,cdk6,cdk4和met改變,并且伴有頻繁的idh1突變;classical亞型特點是具有egfr擴增,及pten和cdkn2a缺失;mesenchymal亞型特點是nf1、tp53和cdkn2a的突變和/或缺失。最后是neural亞型,其遺傳特征尚不明確。
技術(shù)實現(xiàn)要素:
本發(fā)明的目的是針對現(xiàn)有技術(shù)中的不足,提供tnc基因的一種新用途。
為實現(xiàn)上述目的,本發(fā)明采取的技術(shù)方案是:tnc基因作為診斷標志物在制備惡性膠質(zhì)瘤診斷產(chǎn)品中的應(yīng)用。
tnc基因的表達產(chǎn)物作為診斷標志物在制備惡性膠質(zhì)瘤診斷產(chǎn)品中的應(yīng)用。
進一步地,tnc基因的表達產(chǎn)物為tenascinc蛋白。
檢測tnc基因或其表達產(chǎn)物的試劑在制備惡性膠質(zhì)瘤診斷產(chǎn)品中的應(yīng)用。
進一步地,所述的惡性膠質(zhì)瘤為多形性膠質(zhì)母細胞瘤。
進一步地,所述的惡性膠質(zhì)瘤診斷產(chǎn)品用于惡性膠質(zhì)瘤的診斷或預(yù)后判斷。
進一步地,所述的診斷產(chǎn)品為試劑盒、芯片或試紙。
本發(fā)明優(yōu)點在于:
本發(fā)明對gbm進行了綜合的基因組學及蛋白組學分析,通過基于基因芯片及rna測序的基因表達分析及l(fā)c-ms/ms的蛋白質(zhì)譜分析,發(fā)現(xiàn)tnc基因在mrna水平及蛋白水平上調(diào)。對tnc做了生存分析,發(fā)現(xiàn)它的過表達與gbm病人預(yù)后不良有關(guān),說明tnc可作為gbm生物標志物及潛在的治療靶點。
附圖說明
附圖1:15個lggs中45個5倍差異改變的mrna的聚類分析(p<0.01)。
附圖2:7個gbm中20個5倍差異改變的基因的聚類分析(p<0.01)。
附圖3:22個lggs中21個5倍差異改變基因(p<0.01)的聚類分析。
附圖4:27個gbm中25個5倍差異改變基因(p<0.01)。
附圖5:148個基因的go分析。主要的生物過程是:生物過程正向調(diào)控,代謝過程正向調(diào)控,細胞過程正向調(diào)控,生物過程負向調(diào)控,單一生物體定位;主要的分子功能是:核定位,受體結(jié)合,蛋白質(zhì)轉(zhuǎn)運活性,mrna3’-非翻譯區(qū)au-富集區(qū)結(jié)合,細胞周期過程;主要的細胞組件是:胞漿部分,細胞漿,胞內(nèi)細胞器,高分子復(fù)合物,細胞器。
附圖6:keggpathway分析。五條主要信號通路為:催產(chǎn)素信號轉(zhuǎn)導(dǎo)通路,逆行大麻信號通路,晝夜夾帶,血管平滑肌收縮,谷氨酸神經(jīng)突觸。
附圖7:sring在線分析。重要的蛋白包括plk4,cdk6,prdm10和mef2c。
附圖8:15個顯著失調(diào)的蛋白。上調(diào)的包括hexb,nes;下調(diào)的包括mbp,hspa12a。
附圖9:16個在基因和蛋白層面上下調(diào)趨勢一致的分子。
附圖10:gbm中nes、hexb和hspa12a、mbp的相對表達量。qrt-pcr結(jié)果顯示nes、hexb表達顯著上調(diào);hspa12a、mbp表達顯著下調(diào)。
附圖11:nes的ihc染色結(jié)果示意圖。
附圖12:693個蛋白的go分析。主要生物過程是:能量和代謝前提的產(chǎn)生,通過氧化作用派生能量,細胞呼吸,嘌呤核苷酸的代謝,atp的代謝過程;主要分子功能是:nadh氧化還原酶活性,nadh脫氫酶活性,氧化還原活性,催化活性,陽離子運輸atp酶活性;主要細胞組分是:髓鞘,細胞外囊,外泌體,有界膜囊,線粒體。
附圖13:kegg分析。主要通路是:氧化磷酸化,亨丁頓舞蹈癥,帕金森病,阿爾茨海默病,代謝通路。
附圖14:string蛋白質(zhì)相互作用分析。重要的蛋白包括ndufv2,eno2andatp2a1。
附圖15:10個與693個差異蛋白為共同差異基因/蛋白的分子。
附圖16:14個共同分子。包括hspa12a,snca,gnao1,serpina3,capg,anxa1,sod2,tnc,pygl,cd44,tgfbi,gbp1,serpinh1,nes。其中上調(diào)的nes,tgfbi及下調(diào)的hspa12a,snca也同時出現(xiàn)在圖15及圖9中。
附圖17:基因表達聯(lián)合質(zhì)譜分析??偣驳玫?6個差異分子,其中25個上調(diào),11個下調(diào)。
附圖18:go分析。主要生物過程包括:電子傳遞鏈,化學平衡,創(chuàng)傷反應(yīng),細胞呼吸,藥物反應(yīng);主要分子功能包括:蛋白結(jié)合,蛋白復(fù)合物結(jié)合,結(jié)合,結(jié)構(gòu)分子活性,膠原蛋白結(jié)合;主要細胞組成包括:外泌體,部分胞外區(qū),有界膜囊,胞外區(qū),肌動蛋白細胞骨架。
附圖19:keegpathway分析。主要通路:帕金森病,代謝通路,逆行大麻信號通路,氧化磷酸化,神經(jīng)信號傳遞通路。
附圖20:蛋白質(zhì)相互作用分析。重要的分子包括stat3,cd44。
附圖21:14個蛋白質(zhì)的14條肽段在正常腦組織和gbm中出現(xiàn)突變的情況。
附圖22:不同突變數(shù)的蛋白質(zhì)的比例。myh11,fn1,synm出現(xiàn)10個以上突變數(shù)。
附圖23:3個蛋白(myh11,fn1,synm)出現(xiàn)saavs的氨基酸位點的示意圖。
附圖24:19個突變蛋白(9.5%)富集在focaladhesion通路上,突變的蛋白質(zhì)用紅框標出。
附圖25:soat1和nes為我們geo基因表達芯片、tcag基因表達芯片和質(zhì)譜突變鑒定共同的分子;apob為tcag測序、tcga基因表達芯片和質(zhì)譜突變鑒定共同的分子。
附圖26:生存曲線表明nes的上調(diào)與較短的os有關(guān),預(yù)示著較差的預(yù)后。
附圖27:生存曲線表明tnc的上調(diào)與較短的os有關(guān),預(yù)示著較差的預(yù)后。
具體實施方式
下面結(jié)合附圖對本發(fā)明提供的具體實施方式作詳細說明。
實施例1
本領(lǐng)域已知的各種技術(shù)檢測tnc基因的表達情況。
實施例2
本領(lǐng)域已知的各種技術(shù)檢測tnc基因的表達產(chǎn)物(例如tenascinc蛋白)。
實施例3
1.材料與方法
1.1病人組織樣本
我們收集了8對經(jīng)外科切除并根據(jù)最新的who分類的膠質(zhì)母細胞瘤(gbm)及配對的正常腦組織的新鮮組織樣本;樣本均來自贛州市人民醫(yī)院。所有患者均簽署知情同意書,該項操作受贛州市人民醫(yī)院倫理委員會許可。
1.2試劑配制
uabuffer配方:urea48.048g,tris1.2114g,加入100ml水,調(diào)節(jié)ph=8.5
iaa:0.005miaa溶解于ua中(13.875mgiaa溶解于1.5mlua中)
200mmdtt:30.86mgdtt溶解于1ml100mmnh4hco3中
abc/碳酸氫銨:0.05mabc溶解于h2o中(395.3mg溶于100mlddh2o)
50mmnh4hco3:50ul1mnh4hco3(79.06mg溶于1mlddh2o)加入950ulddh2o
sdt裂解液配方:sds4g,dtt1.54g,tris1.21g,hcl調(diào)ph=7.6
2.1lc-ms/ms蛋白質(zhì)譜分析
2.1.1樣品準備(以下操作均在冰上進行)
1.8對gbm及正常腦組織樣本被切成小碎塊(約1mm3),并用pbs清洗;
2.20-50mg組織(約含2-5mg蛋白),加入sdt裂解液(4%sds,0.1mdtt,0.1mtris-hcl,ph7.6)400ul,4℃低溫均漿90s;
3.100℃水浴煮3min;
4.超聲10次,條件:80w,每次超聲10s,間隔15s;
5.16,000g離心10min,取上清(不要吸到沉淀,寧少勿多);
6.熒光分光光度法測定蛋白質(zhì)濃度;
2.1.2質(zhì)譜樣品前處理(faspmethod,在10k超濾管中進行)
1.20-200ug蛋白加30ulsdt裂解液(不要加大于30ulsdt,有可能堵塞濾芯,如濃度低,可分次加入sdt裂解液和ua,不可一次加入超過30ul);加入100ulua,600rpm,混勻儀混勻1min,14,000g離心15min,具體離心時間視情況而定,離干,注意離心管中液體不可過多;
2.再加入200ulua,14,000g離心15min,去除離心管中液體;
3.加入100uliaa,600rpm混勻儀混勻1min,暗處孵育20min;
4.14,000g離心10min;
5.加入100ulureabuffer,14000g離心10min,重復(fù)兩次;
6.加入100ul50mm的abc到超濾管中,14000g離心10min,重復(fù)兩次;
7.加入40ul50mm含1-4μg胰酶的abc(胰酶:蛋白為1:50-1:100),振蕩1min;
8.超濾管放入37℃的水浴鍋中酶解16-18h;
9.將超濾管轉(zhuǎn)移到新的收集管中,14,000g離心10min收集超濾下來的肽段;
10.往超濾管中再加入50ulabc,14,000g離心10min收集超濾下來的肽段;
11.多肽混合物-80℃冷凍后凍干;
12.多肽混合物經(jīng)固相萃取柱脫鹽處理;
2.1.3nano-lc-ms/ms分析
凍干的多肽混合物重溶于0.1%甲酸溶液中,使用ltqorbitrapvelos專業(yè)質(zhì)譜儀鑒定多肽混合物。easynanolcsystem儀器參數(shù)設(shè)置為:全掃描范圍為300-2000amu(1個微掃描),之后為20個信號依賴二級掃描(掃描寬度為3amu,35%標準化能量碰撞,動態(tài)排除1min)。
2.1.4數(shù)據(jù)分析
原始數(shù)據(jù)使用maxquant軟件(version1.3.0.5)分析,檢索數(shù)據(jù)庫為swissprot人蛋白質(zhì)數(shù)據(jù)庫(www.uniprot.org)。檢索參數(shù)為:胰蛋白酶,1%誤切率,誤切位點為2,母離子質(zhì)量誤差為0.05da,固定修飾為脲甲基化修飾carbamidomethy(c),無可變修飾。
搜索條件:胰酶消化,最大遺漏酶切位點1個,肽段質(zhì)量精確度±0.1,ms/ms質(zhì)量精確度±0.1,固定修飾carbamidomethyl(c)。人工測序獲得的肽序列通過embl(http://dove.embl-heidelber.de/blast2/)搜索非冗余蛋白質(zhì)序列數(shù)據(jù)庫nrdb95,參數(shù)設(shè)置為默認值。
2.2quantitativereal-timepcr
2.2.1總rna抽提
1.每50mg-100mg組織加1mltrizol裂解,組織的體積不應(yīng)超過加入trizol體積的10%,使用勻漿器充分勻漿;勻漿液在室溫(15℃~30℃)放置5min;
2.rna分離:按1:0.2(trizol:氯仿)的體積比加入氯仿,蓋嚴,用力劇烈震蕩15秒,在室溫放置3-5min,12000rpm、4℃條件下離心15分鐘;離心后上述混合液可以分為三相,下層的為苯酚-氯仿相,中間層及上層無色的水相層。小心取出ep管,將上層含rna的透明水相轉(zhuǎn)移至新的ep管中;
3)rna沉淀:按照每1mltrizol加0.5ml異丙醇的比例,加入異丙醇,混勻,室溫放置10min。12,000rpm、4℃條件下離心10min,rna沉淀形成膠狀物沉在管底。
4.rna洗滌:棄上清,按照trizol與乙醇比例為1:1加入75%乙醇,進行洗滌,渦旋混合;4℃、7500rpm條件下離心5min,棄上清;置于室溫干燥沉淀。注意不要讓rna完全干燥,因rna完全干燥后很難溶解。
5.rna再溶解:用depc處理過的水重新溶解rna。
注意:提取rna時需戴上口罩、手套,使用專用的rnasefree的槍頭和離心管,離心機需要提前預(yù)冷。
2.2.2rna定量及純度檢測
使用微量分光光度計對上述rna進行定量分析,檢測其濃度及純度。a260/a280比值是純度檢測的重要指標,一般在1.8-2.0,低于此值表示有rna或其他雜質(zhì)的污染,定量后的rna樣本可以進行rt-pcr或保存在-80℃冰箱備用。
2.2.3cdna的合成
按takara公司primescripttmrt-pcr試劑盒說明書進行逆轉(zhuǎn)錄合成cdna,下列組分配制rt反應(yīng)體系(冰上操作):
反轉(zhuǎn)錄反應(yīng)條件:42℃10min;95℃2min;16℃forever
反應(yīng)結(jié)束后即得到的cdna溶液加80μlh2o(20μl→100μl),使終濃度為10ng/μl,繼續(xù)進行qrt-pcr反應(yīng)或-20℃凍存?zhèn)溆谩?/p>
2.2.4qrt-pcr
本實驗所有mrna引物及內(nèi)參均由上海生工生物公司設(shè)計合成。
實時熒光定量pcr引物序列
按takara公司sybrpremixextaqkit說明書上的操作步驟,進行實時熒光定量pcr檢測。冰上加樣,反應(yīng)體系如下:
反應(yīng)條件如下:
熔解曲線分析,判斷產(chǎn)物純度:反應(yīng)結(jié)束后,rqmanager分析軟件統(tǒng)計處理,獲取ct值,并根據(jù)熔解曲線判斷產(chǎn)物的純度。
2.2.5數(shù)據(jù)分析及處理
獲取每次試驗?zāi)康幕蚣皟?nèi)參的ct值(c代表cycle,t代表threshold),ct值代表每個反應(yīng)孔內(nèi)的熒光強度達到設(shè)定的閾值時所經(jīng)歷的循環(huán)數(shù)。具體計算方法如下:
△ct=目的基因ct值-管家基因gapdhct值
△△ct=目的基因△ct-參照樣本(即對照組)目的基因△ct
相對表達量=2-△△ct
2.3免疫組化染色
1.脫蠟和水化:常規(guī)二甲苯脫蠟,梯度酒精水化;
2.pbs沖洗3次,每次5min;
3.抗原修復(fù):以0.01m檸檬酸緩沖液(ph6.0)高壓2min修復(fù)抗原,冷卻至室溫;
4.pbs洗3次,每次5min;
5.在3%h202-甲醇溶液中孵育10min,以滅活內(nèi)源性過氧化物酶活性;
6.pbs洗3次,每次5min;
7.封閉:滴加正常5%山羊血清,室溫孵育30min,甩去多余液體;
8.pbs沖洗3遍除去血清,滴加一抗(pbs代替一抗作為陰性對照),4℃冰箱過夜;
9.次日pbs洗3次,每次5min;
10.滴加辣根過氧化物酶(hrp)標記的二抗,室溫孵育30min;
11.pbs洗3次,每次5min;
12.滴加sp(鏈霉親和素-過氧化酶),室溫孵育10min;
13.pbs洗3次,每次5min;
14.顯色:dab顯色5-10min,顯微鏡下判斷染色程度,蒸餾水洗終止顯色;
15.復(fù)染:蘇木精復(fù)染,1%鹽酸酒精分化幾秒;
16.自來水沖洗5min;
17.常規(guī)脫水透明、中性樹膠封片、鏡檢。
2.4生物信息學分析
我們從geo數(shù)據(jù)庫下載了兩組膠質(zhì)瘤的全基因組表達譜數(shù)據(jù)(gse45921和gse51146),并用mev4.7.1軟件對差異基因做了分層聚類分析?;虮倔w(geneontology,go)((http://www.geneontology.org/)按照生物途徑(biologyprocess),分子功能(molecularfunction)和細胞定位(cellularlocation)對基因進行注釋和分類,被用來評價差異基因富集在gbm中哪些功能類群。keegpathway記錄了細胞之中的分子相互作用網(wǎng)絡(luò)以及具體生物所特有的變化形式,被用來評價差異基因富集在哪些信號通路。蛋白質(zhì)相互作用通過string進行在線分析(http://string-db.org/)。
2.5統(tǒng)計學分析
所有的統(tǒng)計分析采用ibmspssstatistics20(ibmcorp.;armonk,ny,usa)統(tǒng)計軟件包進行數(shù)據(jù)處理。表達量用均數(shù)±標準偏差呈現(xiàn)。獨立樣本t檢驗進行組間差異比較,卡方檢驗進行組間率的差異比較。kaplan-meier曲線來確定各組的總生存率,結(jié)果與對數(shù)秩檢驗比較。p<0.05被認為有統(tǒng)計學意義。
3.結(jié)果
3.1geo數(shù)據(jù)庫基因芯片的分析
我們分析了利用affymetrixu133plus2.0芯片對22個膠質(zhì)瘤及配對正常腦組織進行的全基因組表達譜分析的數(shù)據(jù)(geodataset:gse45921),其中包括15個低級別的膠質(zhì)瘤(lggs)和7個膠質(zhì)母細胞瘤(gbm)。
結(jié)果發(fā)現(xiàn):相對于配對的正常腦組織,15個lggs中有492個2倍以上差異改變(foldchange≥2;p<0.05)的mrna,其中367個上調(diào),125個下調(diào);相對于配對的正常腦組織,15個lggs中有45個5倍以上差異改變(foldchange≥5;p<0.01)的mrna,其中35個上調(diào),包括sfrp2,rpe65,cd44,myc等;10個下調(diào),包括arg1,enc1,psg5等。用mev4.7.1軟件做聚類分析(圖1)。
相對于配對的正常腦組織,7個gbm中有657個1.5倍以上差異改變(foldchange≥1.5;p<0.05)的差異基因,其中133個上調(diào),524個下調(diào);相對于配對的正常腦組織,7個gbm中有20個5倍以上差異改變(foldchange≥5;p<0.01)的mrna,其中8個上調(diào),12個為下調(diào)。上調(diào)的包括top2a,gfap,sod2,cdca7l,gdf8,id3,xist,cdc2;下調(diào)的包括vipr1,camk2a,gjb6,ryr2,cntnap2,scel,slc8a2,creg2,mfsd4,cacng3,neurod6,cabp1。用mev4.7.1軟件做聚類分析(圖2)。
此外,我們還分析了另外一組利用上海博星公司biostarh-140s×32芯片進行的全基因組表達譜芯片數(shù)據(jù)(geodataset:gse51146),包括49個膠質(zhì)瘤及配對的正常腦組織,其中22個低級別膠質(zhì)瘤(lggs),27個膠質(zhì)母細胞瘤(gbm)。
結(jié)果發(fā)現(xiàn):相對于配對的正常腦組織,22個lggs中有399個2倍以上差異改變(foldchange≥2;p<0.05)的mrna,其中332個上調(diào),67個為下調(diào);相對于配對的正常腦組織,22個lggs中有21個5倍以上差異改變(foldchange≥5;p<0.01)的mrna,其中17個上調(diào),包括itsn2,rps6kc1,sb92,kcmf1,thap3,wipi49,snd1,itga5,yes1,bhmt2,pp1553,lrrtm2,col1a2,snx16,slco1b1,paf400,uvrag;4個為下調(diào),包括rtn1,atxn10,nap1l3,dmbt1。用mev4.7.1軟件做聚類分析(圖3)。
相對于配對的正常腦組織,27個gbm中有609個1.5倍以上差異改變(foldchange≥1.5;p<0.05)的mrna,其中481個上調(diào),128個為下調(diào);相對于配對的正常腦組織,27個gbm中有25個5倍以上差異改變(foldchange≥5;p<0.01)的mrna,其中23個上調(diào),包括rps6kc1,ywhag,rxrb,trrap,tomm22,htt,smarcal1,utp15,col3a1,itga5,timp1,ccl2,trp2,ehd3,ranbp2,sr140,b3galnt1,phf10,umps,dhcr7,mettl5,zdhhc2,tppp2;2個下調(diào),包括taf10,plp1。用mev4.7.1軟件做聚類分析(圖4)。
通過對比兩組基因芯片中g(shù)bm與正常腦組織的1.5倍差異改變的mrna(affymetrix芯片中657個與biostarh芯片中609個),我們發(fā)現(xiàn)了148個共同表達改變的基因。
3.2go,keggpathway及蛋白質(zhì)相互作用分析
為了判斷差異基因主要富集在哪些功能類群和代謝通路,我們對148個基因進行了go(圖5)和keggpathway(圖6)分析及蛋白質(zhì)相互作用分析(圖7)。
3.3蛋白質(zhì)譜分析
我們利用nano-lc-ms/ms對8個gbm及其配對的正常腦組織進行了全蛋白組測序。每個樣品做了3次重復(fù)。
結(jié)果發(fā)現(xiàn):相對于配對的正常腦組織,8個gbm中有693個1.5倍以上差異改變(foldchange≥1.5;p<0.05)的差異蛋白,其中500個上調(diào),193個為下調(diào);其中有15個改變最顯著的差異蛋白(foldchange≥10;p<0.01),6個上調(diào),包括tmx1,acox1,hexb,gorasp2,synm,nes;9個下調(diào),包括mbp,cnp,plp1,mylpf,tuba4a,sncg,hspa12a,gpd1,dmtn。用mev4.7.1軟件做聚類分析(圖8)。
在693個差異蛋白中,與148個差異基因相比有16個共同的分子,并且上下調(diào)趨勢一致(圖9),包括nes,hexb,cnn3,h2afz,stat3,rps28,elavl1,ilf3,arpc5,eif2s2,mcts1,ndufs2,ndufa10,calm1,hspa12a,mbp,說明這些蛋白水平的改變可能是由于基因改變引起的。
在16個共同差異基因/蛋白中,我們選取了最顯著上調(diào)的nes、hexb和最顯著下調(diào)的hspa12a、mbp進行了qrt-pcr(圖10)和ihc(圖11,nes的ihc結(jié)果)驗證,結(jié)果證實了這些差異基因/蛋白的上調(diào)和下調(diào)表達趨勢和芯片/質(zhì)譜結(jié)果是一致的。
3.4go,keggpathway及蛋白質(zhì)相互作用分析
接著,我們對上述gbm與正常腦組織的693個1.5倍差異改變的蛋白,進行了go(圖12),keggpathway(圖13)和蛋白質(zhì)相互作用分析(圖14)。
3.5tcga數(shù)據(jù)庫基因表達分析
我們下載了tcga數(shù)據(jù)庫的gbmgeneexpression(illuminahiseq)測序結(jié)果,包含了172例樣本,其中5例正常腦組織,167例gbm組織。相對于正常腦組織,167個gbm中有2881個1.5倍以上差異改變(foldchange≥1.5;p<0.05)的差異基因。2881個1.5倍差異改變的基因中,有10個與693個1.5倍差異改變蛋白為共同的差異基因/蛋白,包括sncg,snca,sptb,ckmt1a,myh1,myh4,f2,hist1h1b,tgfbi,lmnb1(圖15)。
我們還下載了tcga數(shù)據(jù)庫中另外一組基因芯片數(shù)據(jù)gbmgeneexpression(tcga_gbm_exp_u133a),包含了539例樣本,其中10例正常腦組織,529例gbm組織。相對于正常腦組織,529個gbm中有298個1.5倍差異改變(foldchange≥1.5;p<0.05)的基因。298個1.5倍差異改變的基因中,有14個與693個1.5倍差異改變蛋白為共同的差異基因/蛋白(圖16)。
總之,我們利用基因表達和蛋白質(zhì)譜聯(lián)合分析,總共得到了36個共同的差異分子(foldchange≥1.5;p<0.05)包括gnao1,sncg,snca,sptb,ckmt1a,myh1,myh4,ndufa10,calm1,hspa12a,mbp,serpina3,capg,anxa1,sod2,tnc,pygl,cd44,tgfbi,gbp1,serpinh1,nes,f2,hist1h1b,lmnb1,hexb,cnn3,h2afz,stat3,rps28,elavl1,ilf3,arpc5,eif2s2,mcts1,ndufs2,其中25個上調(diào),11個下調(diào)。geo-基因芯片/蛋白質(zhì)譜16個共同分子,tcga-基因芯片/蛋白質(zhì)譜14個,tcga-測序/蛋白質(zhì)譜10個。其中兩兩共同的分子有4個(上調(diào)的tgfbi,nes和下調(diào)的snca,hspa12a),沒有三種共同的分子(圖17)。
3.6go,keggpathway及蛋白質(zhì)相互作用分析
我們對這36個在mrna水平及蛋白水平均失調(diào)的分子做了go(圖18),keggpathway(圖19)及蛋白質(zhì)相互作用分析(圖20)。
3.7單氨基酸變異(saavs)的鑒定
為了從質(zhì)譜結(jié)果中分析單氨基酸突變,我們利用tcga_gbm外顯子測序的突變結(jié)果(http://cbio.mskcc.org/cancergenomics/pancan_tcga/)構(gòu)建了gbm的單氨基酸變異(saavs)數(shù)據(jù)庫。
我們在swissprot人標準蛋白質(zhì)數(shù)據(jù)庫中搜索得到的質(zhì)譜結(jié)果,包括4834個蛋白的36858條肽段信息;平均7.6條肽段/每個蛋白。而我們將質(zhì)譜結(jié)果在新構(gòu)建的saavs數(shù)據(jù)庫中進行重新搜索,得到了8對gbm樣本的突變肽段數(shù)據(jù),其中包括2515個蛋白的23405條肽段信息;平均9.3條突變肽段/每個蛋白。與正常人數(shù)據(jù)庫相比,我們構(gòu)建的saavs數(shù)據(jù)庫搜索得到新的897個蛋白質(zhì)的3884條突變肽段,平均4.3條突變肽段/每個蛋白。
其中有14個蛋白質(zhì)的14條肽段在8個正常腦組織中只有一個樣本中出現(xiàn)(正常組織中突變概率12.5%),而在8個gbm中的至少6個gbm中出現(xiàn)了一次突變(gbm中突變概率≥75%)(圖21)。
186個蛋白質(zhì)的335條肽段只在gbm中出現(xiàn)了突變,平均1.8條突變肽段/每個蛋白(從1-48條肽段);150個蛋白質(zhì)(80.6%)只有一個gbm樣本的一條肽段出現(xiàn)saavs,突變數(shù)(numbersofmutation,nm)等于1(突變數(shù)等于出現(xiàn)突變的gbm樣本×突變位點);20個蛋白(10.8%)突變數(shù)等于2;18個蛋白(7.0%)突變數(shù)為2-10個;3個蛋白(1.6%)(myh11,fn1,synm)出現(xiàn)10個以上突變數(shù),nms>10(圖22),分別有48,16和14個nms;3個蛋白(myh11,fn1,synm)出現(xiàn)saavs的氨基酸位點如圖所示(圖23)。
與正常腦組織相比,上述gbm中總共有200個蛋白質(zhì)出現(xiàn)了概率≥75%的突變。對這些突變做keggpathway分析,發(fā)現(xiàn)有19個蛋白質(zhì)(9.5%)在focaladhesion的pathway上(圖24)。
這200個突變的蛋白質(zhì)與我們37個geo數(shù)據(jù)庫中g(shù)bm芯片結(jié)果(7+27)1.5倍差異基因相比,有6個共同的分子;與tcga-gbm-u133a的529例gbm表達芯片1.5倍差異基因相比,有3個共同的分子;與tcga-gbm-u133a的167例gbm組織illuminahiseq測序結(jié)果的1.5倍差異基因相比,有8個共同的分子。
質(zhì)譜突變分析與基因表達差異基因篩選得到的共同分子總共有14個,8個上調(diào),6個下調(diào),包括apob,rufy1,ceacam5,ldb3,krt82,c1ql3,soat1,col6a3,acin1,nes,tnc,cilp,ikbip,hk3(圖25)。
3.8生存分析
我們利用基因表達和蛋白質(zhì)譜定量聯(lián)合分析,總共得到了36個差異分子,利用基因表達與氨基酸突變聯(lián)合分析,得到14個共同分子,其中nes和tnc在兩組聯(lián)合分析中均出現(xiàn)。我們進一步對這兩個分子在我們的27個gbm表達譜芯片數(shù)據(jù)和529個gbm表達譜芯片數(shù)據(jù)(15個病人失訪,只分析了514個gbm)中做了生存分析。
結(jié)果表明:nes在我們的27個gbm表達譜芯片數(shù)據(jù)和514個gbm表達譜芯片數(shù)據(jù)中,表達越高,gbm病人生存時間越短(p=0.012和0.018)(圖26);tnc在我們的27個gbm表達譜芯片數(shù)據(jù)和514個gbm表達譜芯片數(shù)據(jù)中,表達越高gbm病人生存時間越短(p=0.036)(圖27)。
4.討論
膠質(zhì)母細胞瘤(gbm)是成人最常見原發(fā)性惡性腦瘤,也是最致命的人類癌癥之一。本文對gbm進行了綜合的基因組學及蛋白組學分析,為理解gbm的發(fā)病機制提供了一點新見解,并且鑒定出了一些潛在的治療靶點,為開發(fā)新的更有效的治療方法提供了分子基礎(chǔ)。
通過基于基因芯片及rna測序的基因表達分析及基于液相色譜-串聯(lián)質(zhì)譜聯(lián)用技術(shù)(lc-ms/ms)的蛋白質(zhì)譜分析,我們鑒定出了36個在mrna水平及蛋白水平均出現(xiàn)失調(diào)的分子,包括上調(diào)的tgfbi,nes,及下調(diào)的snca,hspa12a。并且我們在分析兩組geo基因芯片數(shù)據(jù)中發(fā)現(xiàn),gbm與正常腦組織的差異基因,和lggs與正常腦組織的差異基因重復(fù)不多,這說明從正常腦膠質(zhì)細胞發(fā)展為低級別膠質(zhì)瘤(lggs)或膠質(zhì)母細胞瘤(gbm)是兩種完全不同的生物學過程,這也符合我們的臨床觀察,即大部分(約90%)的gbm是原發(fā)性的,僅有不到10%是由低級別膠質(zhì)瘤進展而來。
同時,我們發(fā)現(xiàn)的失調(diào)的基因,包括tgfbi,nes,snca,hspa12a等已經(jīng)被發(fā)現(xiàn)在gbm及其它腫瘤中起重要作用。轉(zhuǎn)錄生長因子誘導(dǎo)基因(tgfbi,transforminggrowthfactor,beta-induced),編碼一種能夠結(jié)合i,ii和iv型膠原蛋白的含有精氨酸、甘氨酸和天冬氨酸(rgd,l-arginine,glycine,andl-asparticacid)序列的蛋白,其在gbm通過tgf-β信號通路表達上調(diào);nestin(nes)基因,編碼中間絲蛋白家族的一個成員,神經(jīng)巢蛋白,主要在神經(jīng)細胞表達,被證明是gbm的一個預(yù)后標志物;突觸核蛋白α(snca,synucleinalpha)是突觸核蛋白家族的一員,在大腦表達豐富,其過表達能通過腫瘤壞死因子α(tnf-alpha)介導(dǎo)的信號通路來促進人腦膠質(zhì)瘤細胞系u373細胞的凋亡;hspa12a(heatshockproteinfamilya(hsp70)member12a),是熱休克蛋白家族的一員,被報道稱與漢族人群中胃癌的發(fā)病風險有關(guān),并且其過表達與早期hbv相關(guān)的肝細胞癌的預(yù)后不良相關(guān)。
其它一些通過生物信息學分析預(yù)測的重要分子,包括cd6,cd44和stat3等,也有相關(guān)研究表明其在gbm及其它腫瘤的發(fā)病中起重要作用。信號傳導(dǎo)及轉(zhuǎn)錄活化因子3(stat3,signaltransducerandactivatoroftranscription-3),是stat蛋白家族的一員,已被報道在gbm發(fā)生,發(fā)展及侵襲中起重要作用。cd44基因編碼一種有多種異構(gòu)體的細胞表面糖蛋白,參與細胞間相互作用、細胞黏附與遷移,被證明在包括gbm的多種癌癥中過表達,在腫瘤細胞惡性進展中起重要作用,如細胞遷移,腫瘤生長及血管形成。cdk6在gbm中通過小泛素化修飾劑1(sumo1)的作用驅(qū)動腫瘤細胞周期改變,促進腫瘤進展。cdk4和cdk6的選擇性靶向抑制劑,如abemaciclib已被報道在實體性腫瘤,包括乳腺癌,非小細胞肺癌,神經(jīng)膠質(zhì)母細胞瘤及其它實體性腫瘤中是安全有效的。
蛋白組學的一個根本問題就是鑒定哪些蛋白編碼序列的改變能夠引起蛋白表達水平的改變。因為標準數(shù)據(jù)庫不能從質(zhì)譜結(jié)果中鑒定出突變的肽段,我們利用cosmic數(shù)據(jù)庫中g(shù)bm外顯子測序結(jié)果構(gòu)建了單氨基酸變異數(shù)據(jù)庫(saavs)。通過分析質(zhì)譜數(shù)據(jù),我們鑒定出了200個高突變率的蛋白,結(jié)合基因表達分析,我們發(fā)現(xiàn)14個分子同時有mrna水平的改變,其中nes及tnc又同時有蛋白水平的改變。我們進一步對nes及tnc做了生存分析,發(fā)現(xiàn)它們的過表達與gbm病人預(yù)后不良有關(guān),說明nes及tnc有可能成為gbm生物標志物及潛在的治療靶點。
毫無疑問,更深入的基因組分析會產(chǎn)生更豐富和更深層次的分子亞型,但是如何從中找到藥物靶點是我們要解決的關(guān)鍵問題。一種方法是應(yīng)用生物信息學工具來預(yù)測分子功能。carro等人應(yīng)用生物信息學的逆向工程算法從tcgagbm數(shù)據(jù)庫中發(fā)現(xiàn)了兩個轉(zhuǎn)錄因子c/ebpβ和stat3,它們能調(diào)節(jié)間充質(zhì)表達樣式,并有明顯的抗腫瘤作用。sumazin等人用另一種生物信息驅(qū)動的方法開發(fā)了一種多變量分析工具(hermes),能從全基因組轉(zhuǎn)錄和mirna譜的綜合分析中系統(tǒng)地推斷出microrna作用的候選靶點。用這種方法,他們揭示了一個豐富的轉(zhuǎn)錄后microrna調(diào)控網(wǎng)絡(luò),鑒定出了pten缺失在促進腫瘤生長中的核心作用,即通過microrna依賴性的調(diào)節(jié)網(wǎng)絡(luò)。genovese等人應(yīng)用另外一種算法揭示了一條新的,受mir-34a調(diào)節(jié)的,轉(zhuǎn)化生長因子(tgf)-β依賴的信號通路。因此,應(yīng)用生物信息學工具來預(yù)測疾病發(fā)生中的關(guān)鍵分子,結(jié)合實驗?zāi)P偷墓δ茯炞C,已經(jīng)開始產(chǎn)生一系列具有臨床價值的理論。
另一種方法,集中在評估異常分子所匯聚的核心信號通路及它們對下游效應(yīng)器的影響。brennan等人對20個gbm組織樣本中57個信號蛋白分子(包括已知信號通路中的翻譯后修飾蛋白)進行分析,結(jié)果揭示了三條信號通路:egfr亞組,以egfr激活及pi3k信號增強為特點;(b)pdgf亞組,特點是pdgfr信號通路;(c)nf1亞組,其下游信號效應(yīng)器不明確。對tcga基因表達亞型的分析表明egfr、pdgfra、nf1的改變彼此之間是不交叉的,這些發(fā)現(xiàn)都是基于tcga定義的三條核心信號通路(rtk/ras/pi3k、p53及rb1通路)。
總之,綜合的基因組學及蛋白組學分析為理解gbm的發(fā)病機制及開發(fā)新的治療方法提供了新的分子基礎(chǔ)。并且氨基酸突變分析有可能拓展我們對蛋白質(zhì)突變在其它癌癥中的理解。
以上所述僅是本發(fā)明的優(yōu)選實施方式,應(yīng)當指出,對于本技術(shù)領(lǐng)域的普通技術(shù)人員,在不脫離本發(fā)明方法的前提下,還可以做出若干改進和補充,這些改進和補充也應(yīng)視為本發(fā)明的保護范圍。
sequencelisting
<110>上海市第十人民醫(yī)院
<120>一種與惡性膠質(zhì)瘤診斷相關(guān)的標志物及其應(yīng)用
<130>/
<160>4
<170>patentinversion3.3
<210>1
<211>22
<212>dna
<213>人工序列
<400>1
gaactggactgtggcattgaga22
<210>2
<211>21
<212>dna
<213>人工序列
<400>2
cacaaagcgactggatgaacc21
<210>3
<211>21
<212>dna
<213>人工序列
<400>3
tgggtgtgaaccatgagaagt21
<210>4
<211>21
<212>dna
<213>人工序列
<400>4
tgagtccttccacgataccaa21