本發(fā)明屬于抗原篩選,具體涉及一種從轉(zhuǎn)座元件中篩選腫瘤潛在新抗原的方法。
背景技術(shù):
1、腫瘤特異性抗原(tumor-specific?antigen,tsa),也稱為新抗原,是由腫瘤細(xì)胞特異產(chǎn)生的抗原,主要源于編碼基因的基因突變、異常的rna剪接和蛋白質(zhì)的翻譯后修飾。由于腫瘤新抗原具有高度的腫瘤特異性,因而與腫瘤相關(guān)抗原相比可引起更強(qiáng)的免疫反應(yīng),更少的免疫耐受及更低的脫靶可能。目前腫瘤新抗原疫苗開發(fā)仍多關(guān)注于基因突變來(lái)源,一些i期和ii期臨床試驗(yàn)已在黑色素瘤、胰腺癌和肝細(xì)胞肝癌等腫瘤中發(fā)現(xiàn),突變來(lái)源的腫瘤新抗原疫苗可與免疫檢查點(diǎn)抑制劑協(xié)同顯著增強(qiáng)患者的免疫應(yīng)答并取得生存獲益,這表明了新抗原在癌癥治療中的巨大潛力。然而,腫瘤中的大多數(shù)基因突變是隨機(jī)事件,并且在個(gè)體患者中表現(xiàn)出顯著的異質(zhì)性。并非所有的突變都能引起有效的免疫應(yīng)答,這表明其他類型的抗原也可能在腫瘤免疫中發(fā)揮重要作用。有時(shí),即使腫瘤中有大量突變,患者對(duì)icb治療的應(yīng)答也有限。此外值得注意的是,某些腫瘤中總體突變頻率較低,如卵巢癌和肝細(xì)胞肝癌。因此,靶向突變來(lái)源的新抗原在數(shù)量和選擇上都有局限性。
2、基因組的非編碼區(qū)是腫瘤新抗原的重要來(lái)源。超過(guò)90%的人類基因組由非編碼區(qū)組成,隨著高通量測(cè)序技術(shù)的進(jìn)步,人們發(fā)現(xiàn)大約70%的非編碼基因組可以被轉(zhuǎn)錄成rna。轉(zhuǎn)座元件(transposable?elements,簡(jiǎn)稱te)作為可移動(dòng)的dna序列,占人類基因組一半以上,主要位于非編碼區(qū),發(fā)揮重要的基因調(diào)節(jié)作用。在腫瘤中,te經(jīng)歷dna低甲基化和組蛋白修飾改變等表觀遺傳重塑而大量激活由于正常生理狀況下te轉(zhuǎn)錄的嚴(yán)格控制,腫瘤中te的轉(zhuǎn)錄激活具有特異性,其轉(zhuǎn)錄產(chǎn)物潛在可作為腫瘤新抗原的全新來(lái)源。一些研究陸續(xù)發(fā)現(xiàn),te-基因的嵌合轉(zhuǎn)錄本以及te開放重新編碼的病毒蛋白,可以產(chǎn)生新的抗原表位,被mhc?i類分子呈遞激活t細(xì)胞免疫反應(yīng)。這些研究提示te來(lái)源的新抗原在腫瘤中廣泛存在,并且極大地豐富了腫瘤患者新抗原的數(shù)量和多樣性。由于te的開放主要來(lái)源于表觀重塑,te來(lái)源新抗原有望克服突變來(lái)源新抗原的局限性。特別是對(duì)于低頻突變的患者,這些來(lái)源于te的新抗原比來(lái)源于突變的新抗原更有可能增強(qiáng)t細(xì)胞免疫應(yīng)答,從而進(jìn)一步提高腫瘤免疫治療的療效。
3、te的轉(zhuǎn)錄形式復(fù)雜,包括由孤立的te自主轉(zhuǎn)錄以及te同基因之間通過(guò)可變起始、外顯子化等多種方式形成的嵌合轉(zhuǎn)錄本。由于te本身序列的重復(fù)性和基因組多拷貝,目前廣泛應(yīng)用的rna短讀長(zhǎng)二代測(cè)序難以完整和準(zhǔn)確的鑒定和區(qū)分這些轉(zhuǎn)錄形式,并且很難對(duì)te來(lái)源轉(zhuǎn)錄本進(jìn)行單一位點(diǎn)水平的精確定量,這無(wú)疑會(huì)影響對(duì)te編碼抗原的鑒定以及其腫瘤特異性的判別。鑒于上述限制,當(dāng)前部分研究選擇在家族或亞家族水平進(jìn)行te表達(dá)分析,但可能遺漏具有治療意義的特定位點(diǎn)的信息,并且難以在完整轉(zhuǎn)錄本中對(duì)te非經(jīng)典開放閱讀框進(jìn)行鑒定;另一些則主要關(guān)注te同蛋白編碼基因之間的嵌合轉(zhuǎn)錄產(chǎn)生的新抗原,而忽略了其他的te轉(zhuǎn)錄形式。例如,一些te轉(zhuǎn)錄本來(lái)源于基因間區(qū)域,與經(jīng)典的蛋白編碼基因無(wú)關(guān),但具有促進(jìn)癌癥免疫治療的潛力。與報(bào)道的te嵌合轉(zhuǎn)錄本相比,這些基因間te轉(zhuǎn)錄本更豐富,并且核糖體測(cè)序(ribo-seq)或免疫肽組等實(shí)驗(yàn)技術(shù)已經(jīng)證實(shí),這些轉(zhuǎn)錄本具有產(chǎn)生te新抗原的潛力,其數(shù)量可能更豐富。因此,鑒定全新的te轉(zhuǎn)錄形式,尤其是基因間區(qū)te來(lái)源轉(zhuǎn)錄本,對(duì)從te轉(zhuǎn)錄產(chǎn)物中待選腫瘤新抗原至關(guān)重要。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明提供一種從轉(zhuǎn)座元件中篩選腫瘤潛在新抗原的方法,該方法創(chuàng)新性地從rna剪接的角度,成功鑒定到了全新的基因間區(qū)te來(lái)源轉(zhuǎn)錄本,并可對(duì)轉(zhuǎn)錄本進(jìn)行唯一定位和精確定量,從而篩選腫瘤特異轉(zhuǎn)錄本作為潛在腫瘤新抗原,te來(lái)源新抗原較突變產(chǎn)生的單個(gè)氨基酸替換可提供更多新抗原表位,且在病人間共享,因而在開發(fā)腫瘤新抗原疫苗方面,尤其是針對(duì)那些低突變負(fù)荷的腫瘤,具有巨大潛力。
2、本發(fā)明為實(shí)現(xiàn)上述目的采用的技術(shù)方案是:一種從轉(zhuǎn)座元件中篩選腫瘤潛在新抗原的方法,包括以下步驟:
3、(1)收集腫瘤組織轉(zhuǎn)錄組測(cè)序數(shù)據(jù)和正常組織轉(zhuǎn)錄組測(cè)序數(shù)據(jù);
4、(2)基于te剪接事件鑒定te轉(zhuǎn)錄本新類型tetrans
5、首先使用rna剪接位點(diǎn)識(shí)別和定量程序asja鑒定步驟(1)收集的腫瘤組織轉(zhuǎn)錄組測(cè)序數(shù)據(jù)和正常組織轉(zhuǎn)錄組測(cè)序數(shù)據(jù)te剪接事件,然后基于所述te剪接事件的位置和定量信息,進(jìn)一步根據(jù)篩選標(biāo)準(zhǔn),篩選得到由te自主轉(zhuǎn)錄、完全由te內(nèi)部發(fā)生剪接并且具有較高te序列比例的te轉(zhuǎn)錄形式tetrans;
6、(3)tetrans的特征分析
7、對(duì)從腫瘤組織和正常組織中選取的癌和癌旁樣本的tetrans數(shù)量進(jìn)行統(tǒng)計(jì),進(jìn)一步從單個(gè)轉(zhuǎn)錄本水平分析tetrans的表達(dá)模式,根據(jù)比較標(biāo)準(zhǔn)比較其在腫瘤樣本和癌旁樣本及正常組織中的表達(dá)水平,對(duì)tetrans進(jìn)行特征分析;
8、(4)篩選具有潛在編碼能力的tetrans
9、先通過(guò)gffread軟件對(duì)tetrans的序列進(jìn)行提取,再通過(guò)cpat軟件對(duì)tetrans的編碼能力和開放閱讀框進(jìn)行預(yù)測(cè),鑒定tetrans序列中起始密碼子為atg且長(zhǎng)度大于30bp的開放閱讀框,并根據(jù)軟件推薦標(biāo)準(zhǔn)篩選潛在編碼的開放閱讀框;再進(jìn)一步篩選編碼開放閱讀框的長(zhǎng)度大于75個(gè)氨基酸的tetrans,并要求在腫瘤細(xì)胞系中可檢測(cè)到,且至少包含一個(gè)腫瘤特異或相關(guān)的剪接事件;
10、(5)鑒定tetrans來(lái)源新抗原表位肽
11、將所有待選tetrans的開放閱讀框水解為相互交疊的9肽,去除包含在uniprot中已注釋的肽段后,根據(jù)tcga腫瘤樣本的hla-a、b、c的等位基因分型,將netmhcpan預(yù)測(cè)為高親和力的肽段定義為tetrans來(lái)源的新抗原表位肽,進(jìn)一步將tetrans來(lái)源的新抗原同3種常見的基因組變異來(lái)源的新抗原進(jìn)行比較,篩選得到腫瘤潛在新抗原。
12、優(yōu)選地,所述步驟(2)中的篩選標(biāo)準(zhǔn)包括轉(zhuǎn)錄起始位點(diǎn)上下游100bp位于te內(nèi)、所有剪接位點(diǎn)均發(fā)生于te之間和總體轉(zhuǎn)錄本超過(guò)50%由te組成。
13、優(yōu)選地,所述步驟(3)中比較標(biāo)準(zhǔn)包括:
14、(1)某一瘤種中腫瘤樣本表達(dá)頻率大于1%,表達(dá)均值>0.01cpt,對(duì)應(yīng)癌旁組織以及所有的正常組織中均不表達(dá)的te剪接事件定義為腫瘤特異te剪接事件;
15、(2)某一瘤種中腫瘤樣本表達(dá)頻率大于癌旁組織的5倍,同時(shí)也大于所有g(shù)tex正常組織表達(dá)頻率的5倍,且腫瘤樣本中表達(dá)均值>0.1cpt的te剪接事件定義為腫瘤相關(guān)te剪接事件。
16、優(yōu)選地,所述步驟(4)中軟件推薦標(biāo)準(zhǔn)為將編碼能力分?jǐn)?shù)大于0.364的開放閱讀框作為潛在編碼的開放閱讀框。
17、優(yōu)選地,所述步驟(5)中3種常見的基因組變異為單堿基突變、插入缺失以及融合基因。
18、與現(xiàn)有技術(shù)相比,本說(shuō)明書實(shí)施例采用的上述至少一個(gè)技術(shù)方案能夠達(dá)到的有益效果至少包括:
19、第一、本發(fā)明通過(guò)直接對(duì)rna高通量測(cè)序數(shù)據(jù)進(jìn)行剪接位點(diǎn)的提取和定量,并將剪接位點(diǎn)對(duì)應(yīng)到單一轉(zhuǎn)錄本上,獲取的剪接位置信息可以用于區(qū)分te不同基因組拷貝來(lái)源的轉(zhuǎn)錄本,而剪接位點(diǎn)的定量則有利于對(duì)te來(lái)源轉(zhuǎn)錄本位點(diǎn)水平上的比較,從而鑒定腫瘤特異的轉(zhuǎn)錄形式;
20、第二、既往研究多關(guān)注在基因相關(guān)的te來(lái)源轉(zhuǎn)錄本編碼腫瘤新抗原的潛能,如te-基因嵌合轉(zhuǎn)錄本,而本發(fā)明鑒定到了由te自主轉(zhuǎn)錄并剪接形成的te轉(zhuǎn)錄本新類型,包含大量基因間區(qū)te來(lái)源轉(zhuǎn)錄本,90%以上為未注釋,且具有較高的腫瘤特異性,部分具有編碼能力,具有編碼腫瘤新抗原的良好潛能,說(shuō)明本方法提供了一個(gè)從te中篩選腫瘤新抗原待選靶點(diǎn)的全新途徑;
21、第三、本發(fā)明篩選到的潛在編碼且腫瘤特異的tetrans,尤其是基因間區(qū)轉(zhuǎn)錄本,由于整條轉(zhuǎn)錄本均為“非己”序列,因而相較于相較于突變產(chǎn)生的單個(gè)氨基酸替換,免疫原性更強(qiáng),同時(shí)也通過(guò)mhc親和力預(yù)測(cè)發(fā)現(xiàn)tetrans較基因組變異潛在提供更多的新抗原表位;
22、第四、本發(fā)明篩選到的潛在編碼的tetrans由te自主轉(zhuǎn)錄,主要來(lái)源于腫瘤表觀失調(diào),在基因組變異貢獻(xiàn)新抗原較少的腫瘤中,這些tetrans的表達(dá)可以引入更多潛在的新抗原,說(shuō)明本發(fā)明的方法可以為表觀顯著失調(diào)但突變負(fù)荷較低的腫瘤,如卵巢癌、肝癌等腫瘤提供更多新抗原選擇。