專利名稱:肝癌高表達(dá)基因peg10、其編碼蛋白及其應(yīng)用的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及生物技術(shù)領(lǐng)域,具體地,本發(fā)明涉及一種主要在人類肝癌組織中高表達(dá)的印跡基因PEG10及其編碼蛋白;此外,本發(fā)明還涉及PEG10基因的應(yīng)用。
背景技術(shù):
1986年著名生物學(xué)家諾貝爾獎(jiǎng)獲得者RenatoDulbecco在Science雜志上率先提出“人類基因組計(jì)劃”(Human Genomic Pr山ect,簡(jiǎn)稱HGP),該建議的提出引發(fā)了科學(xué)界長(zhǎng)達(dá)三年的激烈爭(zhēng)論。1990年10月美國(guó)政府決定出資30億美元正式啟動(dòng)“人類基因組計(jì)劃”,預(yù)期到2005年拿到人體的全部基因序列(共約30億個(gè)核苷酸全序列);隨后研究其相互作用和基因功能,從而揭開(kāi)人類全部遺傳信息之謎,使人類對(duì)自身的認(rèn)識(shí)達(dá)到一個(gè)新的高度。
人類基因組計(jì)劃可以說(shuō)是人類有史以來(lái)最為偉大的認(rèn)識(shí)自身的世紀(jì)工程之一。1997年底,有人提出HGP的最終目標(biāo)應(yīng)該是提供生物學(xué)周期表,這個(gè)周期表的“元素”就是決定人類一切性狀的10-14萬(wàn)個(gè)基因。完成30億個(gè)堿基的測(cè)序只不過(guò)為這個(gè)目標(biāo)打下了結(jié)構(gòu)上的基礎(chǔ)(即結(jié)構(gòu)基因組學(xué)),而比較基因組學(xué)(包括其編碼的蛋白質(zhì))和整個(gè)基因組的功能研究(功能基因組學(xué))在基因組的價(jià)值發(fā)現(xiàn)上才能直接發(fā)揮其重要作用。隨著基因組學(xué)的發(fā)展,人們?cè)O(shè)計(jì)和創(chuàng)造了許多重要的生物分子,廣泛用于制藥、農(nóng)業(yè)、食品、化工、化妝品、環(huán)境、能源等各領(lǐng)域,不僅會(huì)推動(dòng)科學(xué)的進(jìn)步,還將產(chǎn)生驚人的經(jīng)濟(jì)效益,從而引發(fā)產(chǎn)業(yè)革命,以基因組學(xué)為基礎(chǔ)的生命科學(xué)工業(yè)已經(jīng)形成。人類有限的基因資源正在做著一次性分配,獲取基因效率最高和數(shù)量最多的企業(yè),有望利用其基因?qū)@麃?lái)壟斷未來(lái)生物和制藥工業(yè)市場(chǎng)。比爾.蓋茨曾說(shuō)下一個(gè)創(chuàng)造出更大財(cái)富的人將出現(xiàn)在基因領(lǐng)域。
隨著基因組計(jì)劃的迅猛發(fā)展,攻克包括肝癌在內(nèi)的惡性腫瘤在不久的將來(lái)將成為現(xiàn)實(shí)。我國(guó)是原發(fā)性肝細(xì)胞肝癌(primaryhepatocellularcarcinoma,HCC)的高發(fā)地區(qū),其死亡率已占我國(guó)部分農(nóng)村和城市的第一、二位,是嚴(yán)重影響我國(guó)人民健康的重大疾病,每年世界上有38.6萬(wàn)人死于肝癌,而其中的45%是在中國(guó)。目前認(rèn)為,肝癌的發(fā)生、發(fā)展,亦和其它惡性腫瘤一樣,是多基因、多因素參與的復(fù)雜過(guò)程,包括體細(xì)胞基因突變、抑癌基因的丟失、癌基因的激活和過(guò)表達(dá)等等,許多癌基因、抑癌基因,及相關(guān)基因的異常激活或失活是肝癌發(fā)生的分子基礎(chǔ)。從理論上講,應(yīng)該有更多的基因參與其中,但目前已發(fā)現(xiàn)的許多基因,其詳盡功能仍不十分清楚。目前已證明與人類肝癌相關(guān)的癌基因或異常表達(dá)基因包括;pTEN、p21、p27、p73、p15、p53、RBl、APC、nm23、P16、MXR7、IGF-I、TGFO、HGF-R(C-met)/HGF、c-fins(CSF-IR)、c-erbB-1(EGF-R)/c-erbB-2(neu)、Ras、Raf、c-myc、c-ets-2等等,但沒(méi)有一個(gè)為肝癌特異性表達(dá)基因,因此,尋找新的肝癌異常表達(dá)或缺失基因,從基因水平認(rèn)識(shí)肝細(xì)胞的生長(zhǎng)、分化、再生和癌變的分子機(jī)理,并闡明其信號(hào)傳遞過(guò)程與途徑,不僅有重要的生物學(xué)意義,而且對(duì)于肝癌的早期基因診斷和信息治療,均具有重大的臨床應(yīng)用意義和經(jīng)濟(jì)開(kāi)發(fā)價(jià)值,在人類基因組的研究中也能占領(lǐng)新的制高點(diǎn)。
隨著分子生物學(xué)技術(shù)的迅猛發(fā)展,尋找、分離基因的新方法不斷出現(xiàn),主要有以下四種1、從eDNA或mRNA出發(fā)的方法利用細(xì)胞基因表達(dá)的差異宋分離致病基因是一類重要方法,目前進(jìn)展較快。包括cDNA消減雜交法、mRNA差異顯示技術(shù)、EST(Expressed sequence tags)差異雜交篩選等;2、從分析蛋白質(zhì)入手;根據(jù)蛋白的位置、結(jié)合特點(diǎn)或部分功能出發(fā),先分離所需蛋白,再得到相應(yīng)的基因。包括免疫沉淀法、雙向電泳法、酵母雙雜交系統(tǒng)法等;3、從尋找基因組DNA片段出發(fā)尋找到與目標(biāo)基因座位緊密連鎖的遺傳標(biāo)記或部分功能信息,從而確定某性狀相關(guān)的基因在基因組中某區(qū)段的位置,然后再利用不同方法找到該區(qū)段染色體內(nèi)的表達(dá)序列,最終克隆到目的基因。包括復(fù)雜探針篩庫(kù)法、Northern雜交法、剪接位點(diǎn)篩選法、CpG島篩選法、種間同源序列雜交法、PCR直選法、外顯子捕獲、一致序列克隆法等;4、從全基因組出發(fā)根據(jù)有關(guān)基因的效應(yīng)直接分離該基因的克隆,而不必事先探知其生化功能或圖譜定位,也不需要假設(shè)基因的數(shù)目或其相互作用方式,包括基因組錯(cuò)配掃描及代表性差別分析等。上述尋找新基因的方法各有利弊,使用哪一種方法,應(yīng)根據(jù)各自實(shí)驗(yàn)室的條件與優(yōu)勢(shì),揚(yáng)長(zhǎng)避短,采取切實(shí)可行的方法。
1992年美國(guó)學(xué)者LiangPeng等首次應(yīng)用mRNA差別顯示技術(shù)分離和鑒定不同組織和細(xì)胞間的基因表達(dá),使用該方法,人們已經(jīng)發(fā)現(xiàn)了大量的未知基因,如Liang等,用該方法比較正常乳腺和乳腺癌的mRNA,發(fā)現(xiàn)了全長(zhǎng)600bp的S1基因Chen等(ChenSL,MaroulakouIG,GreenJE,et al.Isolation and characterizationofnovelgene expressed inmultiple cancers,Oncogene,199612(4)741-751)用該方法發(fā)現(xiàn)了一個(gè)新基因N8,全長(zhǎng)2.4kb,定位于8q13染色體上,在肺癌組織中過(guò)表達(dá);日本學(xué)者Shibabara等(ShibaharaK;AsanoM;IshidaY;Aoki T;KoikeT;Ho山OT,IsolationofanovelmousegeneMA-3thatiSinduceduponprogrammed celldeath,Gene,1995Dec,166(2)297-301)用該方法分離到一個(gè)引起細(xì)胞程序性死亡的新基因MA-3,等等。但是DDPCR技術(shù)目前尚存在一些不足,近年來(lái)雖然一些學(xué)者已在這方面做了許多改進(jìn),如引物設(shè)計(jì)的合理性、如何減少假陽(yáng)性等,但仍需不斷完善,相信DDPCR技術(shù)的不斷完善,將會(huì)在生命科學(xué)領(lǐng)域中成為十分有用的工具。
因此,為治療和診斷目的研究和開(kāi)發(fā)在肝癌中高表達(dá)的基因和/或蛋白具有重要意義。本領(lǐng)域迫切需要新的在肝癌中高表達(dá)的基因和/或蛋白。
印跡基因PEG10,定位于人類染色體7q21上,PEG10位于SGCE基因附近,其小鼠同族體最近顯示被印跡。因此在人類染色體7q21中很可能存在一類新的印跡基因群。兩種預(yù)知的公開(kāi)閱讀框架(ORF1 and ORF2)的分析顯示ORF1和ORF2相對(duì)于一些脊椎動(dòng)物的蛋白質(zhì)是同源的。有胎盤(pán)的PEG10在早期缺氧階段是低調(diào)節(jié)的,在懷孕的11-12周內(nèi)是高活性的。PEG10的外因表達(dá)對(duì)致瘤活性有作用。PEG10蛋白質(zhì)與媒介SIAH1相關(guān)聯(lián),PEG10的過(guò)量表達(dá)降低了媒介SIAH1的細(xì)胞死亡。結(jié)構(gòu)顯示,印跡基因PEG10在人類肝細(xì)胞的肝臟再生及抑癌中會(huì)起到重要的作用。
鑒于印跡基因PEG10的重要功能,研究和開(kāi)發(fā)印跡基因PEG10具有重要意義。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問(wèn)題之一是提供一種在肝癌中高表達(dá)的印跡基因PEG10(Paternally Expressed 10)。
本發(fā)明要解決的技術(shù)問(wèn)題之二是提供一種人蛋白PEG10。
本發(fā)明要解決的技術(shù)問(wèn)題之三是提供PEG10基因作為肝癌診斷標(biāo)志物的應(yīng)用。
本發(fā)明從肝癌組織中獲得一基因片段,進(jìn)而通過(guò)基因克隆技術(shù)克隆了一個(gè)與PEG10正相關(guān)新基因全長(zhǎng)cDNA序列,該基因序列與原發(fā)性肝細(xì)胞肝癌高度相關(guān)。令人感興趣的是該基因在肝癌中的表達(dá)高達(dá)66%,而癌旁肝組織不表達(dá)或表達(dá)極低。該基因編碼一568個(gè)氨基酸的蛋白質(zhì),定位于細(xì)胞漿。
為了解決上述技術(shù)問(wèn)題,本發(fā)明通過(guò)如下技術(shù)方案實(shí)現(xiàn)在本發(fā)明的一個(gè)方面,提供了一種分離出的DNA分子,該分子包括編碼具有人PEG10蛋白質(zhì)活性的多肽的核苷酸序列,所述的核苷酸序列與SEQ ID NO.1中從核苷酸第1-1707位DNA分子的核苷酸序列有至少70%的同源性;或者所述的核苷酸序列能在中度嚴(yán)緊條件下與SEQ ID NO.1中從核苷酸第1-1707位的核苷酸序列雜交。較佳地,所述的序列編碼具有SEQ ID NO.2所示的氨基酸序列的多肽。更佳地,所述的序列具有SEQ ID NO.1中從核苷酸第1-1707位的核苷酸序列。
在本發(fā)明的另一方面,提供了一種分離出的人PEG10蛋白質(zhì)多肽,它包括具有SEQ ID NO.2氨基酸序列的多肽、或其保守性變異多肽、或其活性片段,或其活性衍生物。較佳地,該多肽是具有SEQ ID NO.2序列的多肽。
在本發(fā)明的另一方面,還提供了一種載體,它包含上述的DNA分子。
在本發(fā)明的另一方面,還提供了一種用上述載體轉(zhuǎn)化的宿主細(xì)胞。
在本發(fā)明的另一方面,還提供了一種具有人PEG10蛋白質(zhì)活性的多肽的制備方法,該方法包括(1)將編碼具有人PEG10蛋白活性的多肽的核苷酸序列可操作地連于表達(dá)調(diào)控序列,形成人PEG10蛋白表達(dá)載體,所述的核苷酸序列與SEQ ID NO.1中從核苷酸第1-1707位的核苷酸序列有至少70%的同源性;(2)將步驟(1)中的表達(dá)載體轉(zhuǎn)入宿主細(xì)胞,形成人PEG10蛋白的重組細(xì)胞;(3)在適合表達(dá)人PEG10蛋白多肽的條件下,培養(yǎng)步驟(2)中的重組細(xì)胞;(4)分離出具有人PEG10蛋白活性的多肽。
較佳地,在該方法中使用的核酸序列具有SEQ ID NO.1中第1-1707位的序列。
本發(fā)明還提供了與PEG10蛋白多肽特異性結(jié)合的抗體。
在本發(fā)明中,“分離的”DNA是指,該DNA或片段已從天然狀態(tài)下位于其兩側(cè)的序列中分離出來(lái),還指該DNA或片段已經(jīng)與天然狀態(tài)下伴隨核酸的組份分開(kāi),而且已經(jīng)與在細(xì)胞中伴隨其的蛋白質(zhì)分開(kāi)。
在本發(fā)明中,術(shù)語(yǔ)“人PEG10蛋白(或多肽)編碼序列”指編碼具有人PEG10蛋白活性的多肽的核苷酸序列,如SEQ ID NO.1中第1-1707位核苷酸序列及其簡(jiǎn)并序列。該簡(jiǎn)并序列是指,位于SEQ ID NO.1序列的編碼框第1-1707位核苷酸中,有一個(gè)或多個(gè)密碼子被編碼相同氨基酸的簡(jiǎn)并密碼子所取代后而產(chǎn)生的序列。由于密碼子的簡(jiǎn)并性,所以與SEQ ID NO.1中第1-1707位核苷酸序列同源性低至約70%的簡(jiǎn)并序列也能編碼出SEQ ID NO.2所述的序列。該術(shù)語(yǔ)還包括能在中度嚴(yán)緊條件下,更佳的在高度嚴(yán)緊條件下與SEQ ID NO.1中從核苷酸第1-1707位的核苷酸序列雜交的核苷酸序列。其中,“嚴(yán)緊條件”是指核苷酸序列在膜上雜交后的洗膜條件。例如,在本領(lǐng)域中,低嚴(yán)緊度洗膜可以在雜交管中倒入150ml左右洗液,放入雜交膜,室溫持續(xù)搖動(dòng)20分鐘左右,而高嚴(yán)緊度洗膜可以是在雜交管中倒入200ml左右洗液,放入雜交膜,50℃搖床中持續(xù)搖動(dòng)20分鐘左右。該術(shù)語(yǔ)還包括與SEQ ID NO.1中從核苷酸第1-1707位的核苷酸序列的同源性至少70%,較佳地至少80%,更佳地至少90%,最佳地至少95%的核苷酸序列。
該術(shù)語(yǔ)還包括能編碼具有與人PEG10相同功能的蛋白的、SEQ ID NO.1中開(kāi)放閱讀框序列的變異形式。這些變異形式包括(但并不限于)若干個(gè)(通常為1-90個(gè),較佳地1-60個(gè),更佳地1-20個(gè),最佳地1-10個(gè))核苷酸的缺失、插入和/或取代,以及在5’和/或3’端添加數(shù)個(gè)(通常為60個(gè)以內(nèi),較佳地為30個(gè)以內(nèi),更佳地為10個(gè)以內(nèi),最佳地為5個(gè)以內(nèi))核苷酸。
在本發(fā)明中,術(shù)語(yǔ)“人PEG10蛋白或多肽”指具有PEG10蛋白活性的SEQ ID NO.2序列的多肽。該術(shù)語(yǔ)還包括具有與天然的人PEG10相同功能的SEQ ID NO.2序列的變異形式。這些變異形式包括(但并不限于)若干個(gè)(通常為1-50個(gè),較佳地1-30個(gè),更佳地1-20個(gè),最佳地1-10個(gè))氨基酸的缺失、插入和/或取代,以及在C末端和/或N末端添加一個(gè)或數(shù)個(gè)(通常為20個(gè)以內(nèi),較佳地為10個(gè)以內(nèi),更佳地為5個(gè)以內(nèi))氨基酸。例如,在本領(lǐng)域中,用性能相近或相似的氨基酸進(jìn)行取代時(shí),通常不會(huì)改變蛋白質(zhì)的功能。又比如,在C末端和/或N末端添加一個(gè)或數(shù)個(gè)氨基酸通常也不會(huì)改變蛋白質(zhì)的功能。該術(shù)語(yǔ)還包括PEG10蛋白的活性片段和活性衍生物。
本發(fā)明人PEG10多肽的變異形式包括同源序列、保守性變異體、等位變異體、天然突變體、誘導(dǎo)突變體、在高或低的嚴(yán)緊條件下能與人PEG10 DNA雜交的DNA所編碼的蛋白、以及利用抗人PEG10多肽的抗血清獲得的多肽或蛋白。本發(fā)明還提供了其他多肽,如包含人PEG10多肽或其片段的融合蛋白。除了幾乎全長(zhǎng)的多肽外,本發(fā)明還包括人PEG10多肽的可溶性片段。通常,該片段具有人PEG10多肽序列的至少約10個(gè)連續(xù)氨基酸,通常至少約30個(gè)連續(xù)氨基酸,較佳地至少約50個(gè)連續(xù)氨基酸,更佳地至少約80個(gè)連續(xù)氨基酸,最佳地至少約100個(gè)連續(xù)氨基酸。
在本發(fā)明中,“人PEG10保守性變異多肽”指與SEQ ID NO.2的氨基酸序列相比,有至多10個(gè),較佳地至多8個(gè),更佳地至多5個(gè)氨基酸被性質(zhì)相似或相近的氨基酸所替換而形成多肽。這些保守性變異多肽最好根據(jù)表1進(jìn)行替換而產(chǎn)生。
表1
發(fā)明還包括人PEG10蛋白或多肽的類似物。這些類似物與天然的人PEG10多肽的差別可以是氨基酸序列上的差異,也可以是不影響序列的修飾形式上的差異,或者兼而有之。這些多肽包括天然或誘導(dǎo)的遺傳變異體。誘導(dǎo)變異體可以通過(guò)各種技術(shù)得到,如通過(guò)輻射或暴露于誘變劑而產(chǎn)生隨機(jī)誘變,還可通過(guò)定點(diǎn)誘變法或其他已知分子生物學(xué)的技術(shù)。類似物還包括具有不同于天然L-氨基酸的殘基(如D-氨基酸)的類似物,以及具有非天然存在的或合成的氨基酸(如β、γ-氨基酸)的類似物。應(yīng)理解,本發(fā)明的多肽并不限于上述例舉的代表性的多肽。
修飾(通常不改變一級(jí)結(jié)構(gòu))形式包括體內(nèi)或體外的多肽的化學(xué)衍生形式如乙?;螋然?。修飾還包括糖基化,如那些在多肽的合成和加工中或進(jìn)一步加工步驟中進(jìn)行糖基化修飾而產(chǎn)生的多肽。這種修飾可以通過(guò)將多肽暴露于進(jìn)行糖基化的酶(如哺乳動(dòng)物的糖基化酶或去糖基化酶)而完成。修飾形式還包括具有磷酸化氨基酸殘基(如磷酸酪氨酸,磷酸絲氨酸,磷酸蘇氨酸)的序列。還包括被修飾從而提高了其抗蛋白水解性能或優(yōu)化了溶解性能的多肽。
在本發(fā)明中,可選用本領(lǐng)域已知的各種載體,如市售的載體,包括質(zhì)粒,粘粒等。在生產(chǎn)本發(fā)明的人PEG10多肽時(shí),可以將PEG10編碼序列可操作地連于表達(dá)調(diào)控序列,從而形成人PEG10蛋白表達(dá)載體。
如本文所用,“可操作地連于”指這樣一種狀況,即線性DNA序列的某些部分能夠影響同一線性DNA序列其他部分的活性。例如,如果信號(hào)肽DNA作為前體表達(dá)并參與多肽的分泌,那么信號(hào)肽(分泌前導(dǎo)序列)DNA就是可操作地連于多肽DNA;如果啟動(dòng)子控制序列的轉(zhuǎn)錄,那么它是可操作地連于編碼序列;如果核糖體結(jié)合位點(diǎn)被置于能使其翻譯的位置時(shí),那么它是可操作地連于編碼序列。一般,“可操作地連于”意味著相鄰,而對(duì)于分泌前導(dǎo)序列則意味著在閱讀框中相鄰。
在本發(fā)明中,術(shù)語(yǔ)“宿主細(xì)胞”包括原核細(xì)胞和真核細(xì)胞。常用的原核宿主細(xì)胞的例子包括大腸桿菌、枯草桿菌等。常用的真核宿主細(xì)胞包括酵母細(xì)胞、昆蟲(chóng)細(xì)胞和哺乳動(dòng)物細(xì)胞。較佳地,該宿主細(xì)胞是真核細(xì)胞,如CHO細(xì)胞、COS細(xì)胞等。
本發(fā)明還提供了對(duì)人PEG10特異的抗體,包括多克隆抗體和單克隆抗體。
在本發(fā)明中,可以使用一系列本領(lǐng)域已知的方法來(lái)制備針對(duì)PEG10特異的抗體。例如,將提純的人PEG10基因產(chǎn)物或它的抗原片段注射入動(dòng)物體內(nèi)以產(chǎn)生多克隆抗體。同樣,表達(dá)人PEG10或它的抗原片段的細(xì)胞也可以用來(lái)對(duì)動(dòng)物致免疫而產(chǎn)生抗體。根據(jù)本發(fā)明制備的抗體也可以是單克隆抗體,這些單克隆抗體可以用雜交瘤技術(shù)制各(例如,Kohler et al.,Nature 256495,1975;Kohler et al.,Eur.J.Immunol.6511,1976;Kohler et al.,Eur.J.Immunol.6292,1976)。本發(fā)明的抗體包括可以阻抑人PEG10功能的抗體,也可以是不影響人PEG10功能的抗體。每一類抗體都可以通過(guò)對(duì)人PEG10基因產(chǎn)物的片段或功能域致免疫而產(chǎn)生,而人PEG10基因產(chǎn)物及其片段可以用重組方法產(chǎn)生或用多肽合成儀進(jìn)行合成。與非修飾形式的PEG10基因產(chǎn)物結(jié)合的抗體,可以通過(guò)用在原核細(xì)胞例如E.coli中產(chǎn)生的基因產(chǎn)物來(lái)免疫動(dòng)物而得到。與翻譯后修飾形式如糖基化或磷酸化蛋白或多肽結(jié)合的抗體,可以通過(guò)用在真核細(xì)胞如酵母或昆蟲(chóng)細(xì)胞中產(chǎn)生的基因產(chǎn)物的來(lái)免疫動(dòng)物而得到。
本發(fā)明的人PE610抗體可以用來(lái)鑒定表達(dá)人PEG10蛋白或多肽的細(xì)胞,如JurkatT細(xì)胞。例如,可以用一種可檢測(cè)的分子例如熒光素異硫氰酸(FITC)來(lái)標(biāo)記PEG10特異抗體,然后讓人PEG10特異抗體與細(xì)胞樣品接觸,再用熒光顯微鏡或流式細(xì)胞儀檢測(cè)出與PEG10特異抗體結(jié)合的細(xì)胞。
除了在細(xì)胞表面檢測(cè)人PEG10外,還可以用Western印跡技術(shù)分析該蛋白質(zhì)。細(xì)胞裂解液可以從培養(yǎng)細(xì)胞或取自病人的組織標(biāo)本如腎上腺中提取,并溶解在含有去污劑的裂解緩沖液中。然后用SDS聚丙烯酰胺凝膠電泳分離細(xì)胞提取物(同時(shí)將提純的人PEG10多肽作為陽(yáng)性對(duì)照),接著通過(guò)電泳雜交將其轉(zhuǎn)移到硝酸纖維素上。為了用Western印跡免疫探測(cè)PEG10多肽,可以使用典型的抗體結(jié)合檢測(cè)方法,例如放射自顯影或堿性磷酸酶檢測(cè)方法。并可使用免疫接種血清或不相關(guān)的單克隆抗體作為非特異反應(yīng)的對(duì)照。
還可用Nothern印跡法技術(shù)分析PEG10基因產(chǎn)物的表達(dá),即分析人PEG10的RNA轉(zhuǎn)錄物在細(xì)胞中的存在與否和數(shù)量。
人PEG10 DNA的Nothern印跡分析和人PEG10特異抗體的Western印跡分析可以聯(lián)合使用,以證實(shí)人PEG10在生物樣本中的表達(dá)。人PEG10 DNA還可以用于Southern印跡分析或原位雜交分析,以將該基因定位于染色體上,并可進(jìn)行遺傳連鎖分析以找出其它可能的疾病相關(guān)基因。
本發(fā)明的人PEG10核苷酸全長(zhǎng)序列或其片段通??梢杂肞CR擴(kuò)增法、重組法或人工合成的方法獲得。對(duì)于PCR擴(kuò)增法,可根據(jù)本發(fā)明所公開(kāi)的有關(guān)核苷酸序列,尤其是開(kāi)放閱讀框序列來(lái)設(shè)計(jì)引物,并用市售的cDNA庫(kù)或按本領(lǐng)域技術(shù)人員已知的常規(guī)方法所制備的cDNA庫(kù)作為模板,擴(kuò)增而得有關(guān)序列。當(dāng)序列較長(zhǎng)時(shí),常常需要進(jìn)行兩次或多次PCR擴(kuò)增,然后再將各次擴(kuò)增出的片段按正確次序拼接在一起。
一旦獲得了有關(guān)的序列,就可以用重組法來(lái)大批量地獲得有關(guān)序列。這通常是將其克隆入載體,再轉(zhuǎn)入細(xì)胞,然后通過(guò)常規(guī)方法從增殖后的宿主細(xì)胞中分離得到有關(guān)序列。
此外,還可用人工化學(xué)合成的方法來(lái)合成有關(guān)序列。在本申請(qǐng)之前,現(xiàn)有技術(shù)已完全可以通過(guò)先合成多個(gè)多核苷酸小片段,然后再進(jìn)行連接而獲得編碼本發(fā)明人PEG10蛋白的的核酸序列。然后,可將該核酸序列引入本領(lǐng)域中各種現(xiàn)有的DNA分子(如載體)和細(xì)胞中。此外,還可通過(guò)化學(xué)合成將突變引入本發(fā)明蛋白序列中。
除了用重組法產(chǎn)生之外,本發(fā)明蛋白的片段還可用固相技術(shù),通過(guò)直接合成肽而加以生產(chǎn)(Stewart等人,(1969)Solid-Phase Peptide Synthesis,WH Freeman Co.,San Francisco;Merrifield J.(1963)J.Am Chem.Soc 852149-2154)。在體外合成蛋白質(zhì)可以用手工或自動(dòng)進(jìn)行。例如,可以用Applied Biosystems的431A型肽合成儀(Foster City,CA)來(lái)自動(dòng)合成肽??梢苑謩e化學(xué)合成本發(fā)明蛋白的各片段,然后用化學(xué)方法加以連接以產(chǎn)生全長(zhǎng)的分子。
利用本發(fā)明的人PEG10蛋白,通過(guò)各種常規(guī)篩選方法,可篩選出與人PEG10發(fā)生相互作用的物質(zhì)或,如受體、抑制劑或拮抗劑等。
本發(fā)明人PEG10蛋白及其抗體、抑制劑、拮抗劑或受體等,當(dāng)在治療上進(jìn)行施用(給藥)時(shí),可提供不同的效果。通常,可將這些物質(zhì)配制于無(wú)毒的、惰性的和藥學(xué)上可接受的水性載體介質(zhì)中,其中pH通常約為5-8,較佳地pH約為6-8,盡管pH值可隨被配制物質(zhì)的性質(zhì)以及待治療的病癥而有所變化。配制好的藥物組合物可以通過(guò)常規(guī)途徑進(jìn)行給藥,其中包括(但并不限于)肌內(nèi)、腹膜內(nèi)、皮下、皮內(nèi)、或局部給藥。
本發(fā)明還提供了PEG10基因作為肝癌診斷標(biāo)志物的應(yīng)用。本發(fā)明PEG10基因是一種肝癌高表達(dá)基因,PEG10在肝癌中的表達(dá)率高達(dá)66%,而在癌旁肝組織的表達(dá)率和表達(dá)水平極低。因此,PEG10基因可作為肝癌診斷標(biāo)志物,使得對(duì)其進(jìn)行深入地研究有可能定量化肝癌的檢測(cè)指標(biāo),為進(jìn)一步的臨床推廣做貢獻(xiàn)。此外,PEG10多核苷酸、PEG10蛋白及其抗體,以及PEG10蛋白相關(guān)的拮抗劑、激動(dòng)劑等可為治療包括肝癌等多種疾病提供新的治療途徑,因而具有巨大的應(yīng)用前景。
圖1是通過(guò)RT-PCR驗(yàn)證本發(fā)明印跡基因PEG10在肝癌/癌旁組織中的表達(dá)圖,N為癌旁組織,C為癌組織,β-actin作為內(nèi)對(duì)照。
具體實(shí)施例方式
下面結(jié)合附圖和實(shí)施例對(duì)本發(fā)明作進(jìn)一步詳細(xì)的說(shuō)明。應(yīng)理解,這些實(shí)施例僅用于說(shuō)明本發(fā)明而不用于限制本發(fā)明的范圍。下列實(shí)施例中未注明具體條件的實(shí)驗(yàn)方法,通常按照常規(guī)條件,例如Sambrook等人,分子克隆實(shí)驗(yàn)室手冊(cè)(New YorkColdSpring Harbor Laboratory Press,1989)中所述的條件,或按照制造廠商所建議的條件。
實(shí)施例11.組織分離(Tissue isolation)來(lái)源于HBV陽(yáng)性并表達(dá)甲胎蛋白的原發(fā)性肝癌的手術(shù)病人(RT-PCR證實(shí)AFP在肝癌均為陽(yáng)性而癌旁為陰性)。手術(shù)切除的肝臟一經(jīng)離體,迅速切取病灶及周圍5公分外癌旁組織,放入液氮中(-80℃)保存。癌和癌旁的診斷均以病理診斷為最終依據(jù)。
2.總RNA的抽提試劑盒抽提RNA試劑采用TRIzol reagent(GIBCO/BRL),該試劑是基于酸性酚一步抽提法生產(chǎn)的。用于抽提RNA所用的器皿和水均要進(jìn)行無(wú)RNA酶處理,以保證實(shí)驗(yàn)中無(wú)RNA酶的環(huán)境。
3.RNA的抽提步驟將碾杵和勻漿器等器皿在200℃干烤4h,去除RNA酶,冷卻;加入液氮中預(yù)冷,將組織從液氮中迅速取出,碾成粉末;用刮匙將組織放入預(yù)先加入TRIzol試劑的勻漿器中,勻漿數(shù)分鐘;將勻漿后的液體轉(zhuǎn)入無(wú)RNA酶的離心管中,加入氯仿后,4℃離心分層;將上層水相轉(zhuǎn)入一無(wú)RNA酶的離心管中,加異丙醇,4℃離心沉淀RNA;用75%乙醇洗滌沉淀2次;用無(wú)RNA酶的去離子水溶解沉淀。抽提的RNA質(zhì)量鑒定紫外分光光度計(jì)測(cè)定260/280比值(比值均在1.7~2.0);并在MOPS甲醛變性膠中觀察有無(wú)降解。
4.cDNA的合成取總RNA2μg,OligodT161μL,70℃保溫3min,立即冰上變性5min。加入5×buffer,DTT和50mg/L的dNTP各2μL及1μL的逆轉(zhuǎn)錄酶,充分混勻后,42℃2h。模板使用終濃度通常為1μg/100μL。
5.RT-PCR擴(kuò)增設(shè)計(jì)引物,PEG10前向引物為5’-TGCTTCTGGCAACTTCATTG-3’,后向引物為5’-TCAAATGACAGCACCTCTCG-3’;Beta-actin前向引物為5’-TCACCCACACTGTGCCCATCTACGA-3’,后向引物為5’-CAGCGGAACCGCTCATTGCCAATGG-3’。以β-actin作內(nèi)對(duì)照,反應(yīng)混合物中各成分為β-actin(F)、β-actin(R)、PEG10(F)、PEG10(R)、10×Buffer、MgCl2、dNTP、Taq DNA聚合酶、cDNA模板分別為0.2、0.2、0.4、0.4、1.0、1.0、0.2、0.1和5μLcDNA模板,最后補(bǔ)充ddH2O使反應(yīng)體系為10μL。PCR的反應(yīng)條件是94℃變性5min;然后每個(gè)循環(huán)94℃30s、53℃30s、72℃30s,共30個(gè)循環(huán);最后72℃延伸7min。
6.結(jié)果結(jié)果如圖1所示利用RT-PCR技術(shù)在32對(duì)肝癌及癌旁組織中檢測(cè)PEG10基因的表達(dá)差異,發(fā)現(xiàn)在32例中有24例PEG10基因明顯升高,即PEG10基因在肝癌組織中的表達(dá)率高達(dá)66%。
實(shí)施例2人PEG10多肽的制備和提純?cè)谠搶?shí)施例中,將全長(zhǎng)的PEG10編碼序列或片段構(gòu)建入商品化的蛋白質(zhì)融合表達(dá)載體之中,以表達(dá)和提純重組蛋白。
將人PEG10多肽以GST融合蛋白的形式在大腸桿菌中進(jìn)行原核表達(dá)。
1.原核表達(dá)載體的構(gòu)建,以及轉(zhuǎn)化大腸桿菌根據(jù)人PEG10的全長(zhǎng)編碼序列(SEQ ID NO.1),設(shè)計(jì)擴(kuò)增出完整編碼閱讀框的引物(分別對(duì)應(yīng)于編碼序列5’和3’端的約20個(gè)以上核苷酸),并在正反引物上分別引入限制性內(nèi)切酶位點(diǎn)(這根據(jù)選用的pGEX-2T載體而定),以便構(gòu)建表達(dá)載體。以實(shí)施例1中獲得的擴(kuò)增產(chǎn)物為模板,經(jīng)PCR擴(kuò)增后,將人PEG10基因在保證閱讀框正確的前提下克隆至pGEX-2T載體(Pharmacia,Piscataway,NJ)。鑒定好的表達(dá)載體利用CaCl2方法轉(zhuǎn)入大腸桿菌DH5α,篩選鑒定得到含有pGEX-2T-PEG10表達(dá)載體的工程菌DH5α-pGEX-2T-PEG10。
2.表達(dá)GST-PEG10重組蛋白的工程菌的分離鑒定挑取單菌落的DH5α-pGEX-2T-PEG10工程菌于3ml含100μg/ml氨芐青霉素的LB培養(yǎng)基中振搖培養(yǎng)過(guò)夜,按1∶100的濃度吸取培養(yǎng)液于新的LB培養(yǎng)基(含100μg/ml氨芐青霉素)中培養(yǎng)約3小時(shí),至OD600達(dá)0.5后,加入IPTG至終濃度1mmol/L繼續(xù)于37℃分別培養(yǎng)0,1,2,3小時(shí)。取培養(yǎng)時(shí)間不同的1ml菌液離心,在細(xì)菌沉淀物中加入裂解液(2×SDS上樣緩沖液50μl,蒸餾水45μl,二巰基乙醇5μl),混懸細(xì)菌沉淀,沸水浴中煮5分鐘,10000rpm離心1分鐘,上清加入12%SDS-PAGE膠中電泳。染色后觀察預(yù)期分子量大小的蛋白量隨IPTG誘導(dǎo)時(shí)間增加而增加的菌株即為表達(dá)GST-PEG10融合蛋白的工程菌。
3.GST-PEG10融合蛋白的提取純化按上述方法誘導(dǎo)表達(dá)GST-PEG10融合表達(dá)蛋白的工程菌DH5α-pGEX-2T-PEG10。誘導(dǎo)后的細(xì)菌離心沉淀,按每400ml菌加入20ml PBS重懸細(xì)菌,超聲破碎細(xì)菌。破菌完全的超聲液按每毫升加入20微升的量加入PBS飽和的50%谷胱苷肽Sepharose4B,37℃振搖結(jié)合30分鐘,10000rpm離心10分鐘沉淀結(jié)合了GST-PEG10的谷胱苷肽Sepharose 4B,棄上清。按每毫升超聲液所得沉淀加入100μl PBS的量清洗兩次,而后按每毫升超聲液所得沉淀加入10μl還原型谷胱苷肽洗脫液,室溫置10分鐘,10000rpm離心10分鐘,上清即為洗脫的融合蛋白。重復(fù)洗脫兩次。洗脫的上清保存于-80℃,并進(jìn)行SDS-PAGE電泳,檢測(cè)純化效果。在31kDa處的蛋白質(zhì)條帶即為人PEG10蛋白。
序列表<110> 上海人類基因組研究中心<120> 肝癌高表達(dá)基因PEG10、其編碼蛋白及其應(yīng)用<130> NP-10015<160> 2<210> 1<211> 6861<212> DNA<213> 智人(Homo sapiens)<220>
<221> CDS<222> (1)..(1707)<400> 11 ATGTGCCACA AACTGACGGA TGGGCGCTTC AGTGGCGCTA CAATCCAGAA CGAGGAGCAG61 CGATATAGGA GCTGCAGACA GAAAACTGAA TTGCGCTTTA CATGCGCTGC AAAATCTGAG121 CTGCAGAAGA GTAGCACTAC AAAAAACGCT ACAAAAACGA TGCGATTAGC CAGCCCGACA181 ACAGCGCTTC ATTGCGCTGC GAGGCACATG AACTGCAGAG CGCCTCCTCC TACAGCGCCT241 CCTCAGAGCC GCCTCCCCTG CAGCGCCGTG ACCCAGAGTC CTTGTGCTAC CATGCGGCCT301 TCGCAGGCCC GTGCGCCCAG CTCGAGAGCA CGTGACTTCT GGATCCAGGA CCATCGGTCT361 GAGGCCCCGC ATGAGTTAGT AGGGAGGGGT AGTGCCCTGC TAGTGTCGGG GCGCCATGGT421 GATGTTCGGA GGGCGCAGCA CGCAGACCAG GGTTCGGATG GGACGCTGTG GTGTCTTTTT481 GGGTCGGTCG GGTGGTATAG GGCGATAAAT AAGCGGGTTT TGAAAACAAA AAAAAGAAGG541 AGTGGAAGAG GGGGCCAGGA TCCAGGCCTC CATCCCCACA GAAGTGAAGC TACAGCTGGG601 AGGTCTCCTC CCACCCCAAC CGTCACCCTG GGTCCCGACT GCCCACCTCC TCCTCCTCCC661 CCTCCCCCCA ACAACAACAA CAACAACAAC TCCAAGCACA CCGGCCATAA GAGTGCGTGT721 GTCCCCAACA TGACCGAACG AAGAAGGGAC GAGCTCTCTG AAGAGATCAA CAACTTAAGA781 GAGAAGGTCA TGAAGCAGTC GGAGGAGAAC AACAACCTGC AGAGCCAGGT GCAGAAGCTC841 ACAGAGGAGA ACACCACCCT TCGAGAGCAA GTGGAACCCA CCCCTGAGGA TGAGGATGAT901 GACATCGAGC TCCGCGGTGC TGCAGCAGCT GCTGCCCCAC CCCCTCCAAT AGAGGAAGAG961 TGCCCAGAAG ACCTCCCAGA GAAGTTCGAT GGCAACCCAG ACATGCTGGC TCCTTTCATG1021 GCCCAGTGCC AGATCTTCAT GGAAAAGAGC ACCAGGGATT TCTCAGTTGA TCGTGTCCGT1081 GTCTGCTTCG TGACAAGCAT GATGACCGGC CGTGCTGCCC GTTGGGCCTC AGCAAAGCTG1141 GAGCGCTCCC ACTACCTGAT GCACAACTAC CCAGCTTTCA TGATGGAAAT GAAGCATGTC
1201 TTTGAAGACC CTCAGAGGCG AGAGGTTGCC AAACGCAAGA TCAGACGCCT GCGCCAAGGC1261 ATGGGGTCTG TCATCGACTA CTCCAATGCT TTCCAGATGA TTGCCCAGGA CCTGGATTGG1321 AACGAGCCTG CGCTGATTGA CCAGTACCAC GAGGGCCTCA GCGACCACAT TCAGGAGGAG1381 CTCTCCCACC TCGAGGTCGC CAAGTCGCTG TCTGCTCTGA TTGGGCAGTG CATTCACATT1441 GAGAGAAGGC TGGCCAGGGC TGCTGCAGCT CGCAAGCCAC GCTCGCCACC CCGGGCGCTG1501 GTGTTGCCTC ACATTGCAAG CCACCACCAG GTAGATCCAA CCGAGCCGGT GGGAGGTGCC1561 CGCATGCGCC TGACGCAGGA AGAAAAAGAA AGACGCAGAA AGCTGAACCT GTGCCTCTAC1621 TGTGGAACAG GAGGTCACTA CGCTGACAAT TGTCCTGCCA AGGCCTCAAA GTCTTCGCCG1681 GCGGGAAACT CCCCGGCCCC GCTGTAGAGG GACCTTCAGC GACCGGGCCA GAAATAATAA1741 GGTCCCCACA AGATGATGCC TCATCTCCAC ACTTGCAAGT GATGCTCCAG ATTCATCTTC1801 CGGGCAGACA CACCCTGTTC GTCCGAGCCA TGATCGATTC TGGTGCTTCT GGCAACTTCA1861 TTGATCACGA ATATGTTGCT CAAAATGGAA TTCCTCTAAG AATCAAGGAC TGGCCAATAC1921 TTGTGGAAGC AATTGATGGG CGCCCCATAG CATCGGGCCC AGTTGTCCAC GAAACTCACG1981 ACCTGATAGT TGACCTGGGA GATCACCGAG AGGTGCTGTC ATTTGATGTG ACTCAGTCTC2041 CATTCTTCCC TGTCGTCCTA GGGGTTCGCT GGCTGAGCAC ACATGATCCC AATATCACAT2101 GGAGCACTCG ATCTATCGTC TTTGATTCTG AATACTGCCG CTACCACTGC CGGATGTATT2161 CTCCAATACC ACCATCGCTC CCACCACCAG CACCACAACC GCCACTCTAT TATCCAGTAG2221 ATGGATACAG AGTTTACCAA CCAGTGAGGT ATTACTATGT CCAGAATGTG TACACTCCAG2281 TAGATGAGCA CGTCTACCCA GATCACCGCC TGGTTGACCC TCACATAGAA ATGATACCTG2341 GAGCACACAG TATTCCCAGT GGACATGTGT ATTCACTGTC CGAACCTGAA ATGGCAGCTC2401 TTCGAGATTT TGTGGCAAGA AATGTAAAAG ATGGGCTAAT TACTCCAACG ATTGCACCTA2461 ATGGAGCCCA AGTTCTCCAG GTGAAGAGGG GGTGGAAACT GCAAGTTTCT TATGATTGCC2521 GAGCTCCAAA CAATTTTACT ATCCAGAATC AGTATCCTCG CCTATCTATT CCAAATTTAG2581 AAGACCAAGC ACACCTGGCA ACGTACACTG AATTCGTACC TCAAATACCT GGATACCAAA2641 CATACCCCAC ATATGCCGCG TACCCGACCT ACCCAGTAGG ATTCGCCTGG TACCCAGTGG2701 GACGAGACGG ACAAGGAAGA TCACTATATG TACCTGTGAT GATCACTTGG AATCCACACT2761 GGTACCGCCA GCCTCCGGTA CCACAGTACC CGCCGCCACA GCCGCCGCCT CCACCACCAC2821 CACCGCCGCC GCCTCCATCT TACAGTACCC TGTAAATACC TGTCATGTCC TTCAGGATCT2881 CTGCCCTCAA AATTTATTCC TGTTCAGCTT CTCAATCAGT GACTGTGTGC TAAATTTTAG2941 GCTACTGTAT CTTCAGGCCA CCTGAGGCAC ATCCTCTCTG AAACGGCTAT GGAAGGTTAG3001 GGCCACTCTG GACTGGCACA CATCCTAAAG CACCAAAAGA CCTTCAACAT TTTCTGAGAG3061 CAACAGAGTA TTTGCCAATA AATGATCTCT CATTTTTCCA CCTTGACTGC CAATCTAACT3121 AAAATAATTA ATAAGTTTAC TTTCCAGCCA GTCCTGGAAG TCTGGGTTTT ACCTGCCAAA3181 ACCTCCATCA CCATCTAAAT TATAGGCTGC CAAATTTGCT GTTTAACATT TACAGAGAAG3241 CTGATACAAA CGCAGGAAAT GCTGATTTCT TTATGGAGGG GGAGACGAGG AGGAGGAGGA3301 CATGACTTTT CTTGCGGTTT CGGTACCCTC TTTTTAAATC ACTGGAGGAC TGAGGCCTTA3361 TTAAGGAAGC CAAAATTATC GGTGCAGTGT GGAAAGGCTT CCGTGATCCT CTCGCTGCAC3421 CCTTAGAAAC TTCACCGTCT TCAAACTCCA TTTCCATGGT TCTGTTAATT CTCAAGGAGC3481 AGCAACTCGA CTGGTTCTCC CAGGAGCAGG AAAAACCCTT GTGACATGAA ACATCTCAGG3541 CCTGAAAAGA AAGTGCTCTC TCAGATGGAC TCTTGCATGT TAAGACTATG TCTTCACATC3601 ATGGTGCAAA TCACATGTAC CCAATGACTC CGGCTTTGAC ACAACACCTT ACCATCATCA3661 TGCCATGATG GCTTCCACAA AGCATTAAAC CTGGTAACCA GAGATTACTG GTGGCTCCAG3721 CGTTGTTAGA TGTTCATGAA ATGTGACCAC CTCTCAATCA CCTTTGAGGG CTAAAGAGTA3781 GCACATCAAA AGGACTCCAA AATCCCATAC CCAACTCTTA AGAGATTTGT CCTGGTACTT
3841 CAGAAAGAAT TTTCATGAGT GTTCTTAATT GGCTGGAAAA GCACCAGCTG ACGTTTTGGA3901 AGAATCTATC CATGTGTCTG CCTCCATATG CATCTGGGCA TTTCATCTTC AGTCCCCTCA3961 TTAGACTGTA GCATTAGGAT GTGTGGAGAG AGGAGAAATG ATTTAGCACC CAGATTCACA4021 CTCCTATGCC TGGAAGGGGG ACATCTTTGA AGAAGAGGAA TTAGGGCTGT GGACACTGTC4081 TTGAGGATGT GGACTTCCTT AGTGAGCTCC ACATTACTTG ATGGTAACCA CTTCAAAAGG4141 ATCAGAATCC ACGTAATGAA AAAGGTCCCT CTAGAGGATG GAGCTGATGT GAAGCTGCCA4201 ATGGATGAAA AGCCTCAGAA AGCAACTCAA AGGACTCAAA GCAACGGACA ACACAAGAGT4261 TGTCTTCAGC CCAGTGACAC CTCTGATGTC CCCTGGAAGC TTTGTGCTAA CCTGGGACTG4321 CCTGACTTCC TTTAGCCTGG TCCCTTGCTA CTACCTTGAA CTGTTTTATC TAACCTCTCT4381 TTTTCTGTTT AATTCTTTGC TACTGCCATT GACCCTGCTG CAGGATTTGT GTCATTTTCC4441 TGCCTGGTTG CTGAGACTCC ATTTTGCTGC CACACACAGA GATGTAAGAG GCAGGCTTTA4501 ATTGCCAAAG CACAGTTTGA GCAGTAGAAA ACAACATGGT GTATATCTCA AATTGCCTGA4561 CATGAAGAGG AGTCTAACGG TGAAGTTTCA CTTTTCATCA GCATCATCTT TCACATGTTC4621 ATTATCATCT GCTCTTATTC TTGCATGTTT AAACACTTAA AATTTTTAGT ATAATTTTTA4681 GTGTGTTTTG AAGTGGTGAC TAGGCTTTCA AAAACTTCCA TTGAATTACA AAGCACTATC4741 CAGTTCTTAT TGTTAAACTA AGTAAAAATG ATAAGTAACA TAGTGTAAAA TATTCCTTTA4801 CTGTGAACTT CTTACAATGC TGTGAATGAG AGGCTCCTCA GAACTGGAGC ATTTGTATAA4861 TAATTCATCC TGTTCATCTT CAATTTTAAC ATCATATATA ATTTCAATTC TATCAATTGG4921 GCCTTTAAAA ATCATATAAA AGGATATAAA ATTTGAAAAG AGAAACCTAA TTGGCTATTT4981 AATCCAAAAC AACTTTTTTT TTCCTTCAAT GGAATCAGAA AGCTTGTCAA TCACTCATGT5041 GTTTTAGAGT AATTACTTTT AAAATGGTGC ATTTGTGCTT CTGAACTATT TTGAAGAGTC5101 ACTTCTGTTT ACCTCAAGTA TCAATTCATC CTCCATACAT TTGAATTCAA GTTGTTTTTT5161 TGTCAAATTT ACAGTTGTCA ATTGATCTTC AAGCTGCAGG GTGCCTAGAA ATGGGCCGTT5221 GTCTGTAGCC CTGGCATGTG CACACGGACA TTTGCCACCA CTGCAAGCAA AAGTCTGGAG5281 AAGTTCACCA ACGACAAGAA CGATTAGGGA AAATATGCTG CTGTGGGTTA ACAACTCAGA5341 AAGTCCCTGA TCCACATTTG GCTGTTTACT AAAGCTTGTG ATTAACTTTT TGGCAGTGTG5401 TACTATGCTC TATTGCTATA TATGCTATCT ATAAATGTAG ATGTTAAGGA TAAGTAATTC5461 TAAATTTATT ATTCTATAGT TTTGAAGTTT GGTTAAGTTT CCTTTCACTC AATTGATTTA5521 TTTTGTTGTT AATCAAATTT ATGTTAATTG GATCCTTTAA ATTTTTTTTG GCATTTTCCA5581 ACAAAAATGG CTTTATTCAT AAGAAAGGAA AAAAATCAAT GGAATTTGAT ATCTAAAGAA5641 GTTAGAAAGG GAGCAAAATA AAAAACATAA AGGAGATAGA TGAATTAGTA AGCAAATCAG5701 TAGTCGAGTT TTTCAAACTG GCAAAATTAA TTAATTGACT TTTAGCCCAA ATTTACATTG5761 TTAATTAAAT CAAGAAGGAA GAAGATCTAA GAGCTCCCAT TGATAGGCAA GCCTAGAGAG5821 AACTAGCTAA ATTTATCATG CTAGGATATT GAAACACAGA AAGTTTACAT ACATTTATGA5881 AGGGTCAATT TAGTTTGGAC AGTGAGGTAT TTGTCTTAGT GGAAAAAAGG AGAATTAGTC5941 TGATCAAATC GTGAAGTAAT ACAGTGAACT TGCAGGTGCA CAAAATAAGA GGGCCACATC6001 TATATGGTGC AGTCTGGAAT TCTGTTTAAG TTTGTAGGTA CCTCTTGGAC TTCTGAATTG6061 ATCCAGTTGT CATCCACCAC AGACATCTCA CATCAGATAC AGTTCCAAGA TTGACAACAG6121 AGAACAACCT GCTGGAAAGA CCTGGGCAGA AATGGAGAGC CCTGCGGGAA CCATGCTACA6181 TTTTCATCTA AAGAGAGAAT GCACATCTGA TGAGACTGAA AGTTCTTTGT TGTTTTAGAT6241 TGTAGAATGG TATTGAATTG GTCTGTGGAA AATTGCATTG CTTTTATTTC TTTGTGTAAT6301 CAAGTTTAAG TAATAGGGGA TATATAATCA TAAGCATTTT AGGGTGGGAG GGACTATTAA6361 GTAATTTTAA GTGGGTGGGG TTATTTAGAA TGTTAGAATA ATATTATGTA TTAGATATCG6421 CTATAAGTGG ACATGCGTAC TTACTTGTAA CCCTTTACCC TATAATTGCT ATCCTTAAAG
6481 ATTTCAAATA AACTCGGAGG GAACTGCAGG GAGACCAACT TATTTAGAGC GAATTGGACA6541 TGGATAAAAA CCCCAGTGGG AGAAAGTTCA AAGGTGATTA GATTAATAAT TTAATAGAGG6601 ATGAGTGACC TCTGATAAAT TACTGCTAGA ATGAACTTGT CAATGATGGA TGGTAAATTT6661 TCATGGAAGT TATAAAAGTG ATAAATAAAA ACCCTTGCTT TTACCCCTGT CAGTAGCCCT6721 CCTCCTACCA CTGAACCCCA TTGCCCCTAC CCCTCCTTCT AACTTTATTG CTGTATTCTC6781 TTCACTCTAT ATTTCTCTCT ATTTGCTAAT ATTGCATTGC TGTTACAATA AAAATTCAAT6841 AAAGATTTAG TGGTTAAGTG C<210> 2<211> 568<212> PRT<213> 智人(Homo sapiens)<400> 21 MCHKLTDGRF SGATIQNEEQ RYRSCRQKTE LRFTCAAKSE LQKSSTTKNA51 TKTMRLASPT TALHCAARHM NCRAPPPTAP PQSRLPCSAV TQSPCATMRP101 SQARAPSSRA RDFWIQDHRS EAPHELVGRG SALLVSGRHG DVRRAQHADQ151 GSDGTLWCLF GSVGWYRAIN KRVLKTKKRR SGRGGQDPGL HPHRSEATAG201 RSPPTPTVTL GPDCPPPPPP PPPNNNNNNN SKHTGHKSAC VPNMTERRRD251 ELSEEINNLR EKVMKQSEEN NNLQSQVQKL TEENTTLREQ VEPTPEDEDD301 DIELRGAAAA AAPPPPIEEE CPEDLPEKFD GNPDMLAPFM AQCQIFMEKS351 TRDFSVDRVR VCFVTSMMTG RAARWASAKL ERSHYLMHNY PAFMMEMKHV401 FEDPQRREVA KRKIRRLRQG MGSVIDYSNA FQMIAQDLDW NEPALIDQYH451 EGLSDHIQEE LSHLEVAKSL SALIGQCIHI ERRLARAAAA RKPRSPPRAL501 VLPHIASHHQ VDPTEPVGGA RMRLTQEEKE RRRKLNLCLY CGTGGHYADN551 CPAKASKSSP AGNSPAPL
權(quán)利要求
1.一種分離出的DNA分子,其特征在于,它包括編碼具有人PEG10蛋白質(zhì)活性的多肽的核苷酸序列,而且所述的核苷酸序列與SEQ ID NO.1中從核苷酸第1-1707位的核苷酸序列有至少70%的同源性;或者所述的核苷酸序列能在中度嚴(yán)緊條件下與SEQ ID NO.1中從核苷酸第1-1707位的核苷酸序列雜交。
2.如權(quán)利要求1所述的DNA分子,其特征在于,所述的序列編碼具有SEQ ID NO.2所示的氨基酸序列的多肽。
3.如權(quán)利要求1所述的DNA分子,其特征在于,該序列具有SEQ ID NO.1中從核苷酸第1-1707位的核苷酸序列。
4.一種分離出的人PEG10蛋白多肽,其特征在于,它包括具有SEQ ID NO.2氨基酸序列的多肽、或其保守性變異多肽、或其活性片段,或其活性衍生物。
5.如權(quán)利要求4所述的多肽,其特征在于,該多肽是具有SEQ ID NO.2序列的多肽。
6.一種載體,其特征在于,它包含權(quán)利要求1所述的DNA。
7.一種由權(quán)利要求6所述載體轉(zhuǎn)化的宿主細(xì)胞,其特征在于,包括原核細(xì)胞和真核細(xì)胞。
8.一種具有人PEG10蛋白質(zhì)活性的多肽的制備方法,其特征在于,包括如下步驟(1)將編碼具有人PEG10蛋白活性的多肽的核苷酸序列可操作地連于表達(dá)調(diào)控序列,形成人PEG10蛋白表達(dá)載體,所述的核苷酸序列與SEQ ID NO.1中從核苷酸第1-1707位的核苷酸序列有至少70%的同源性;(2)將步驟(1)中的表達(dá)載體轉(zhuǎn)入宿主細(xì)胞,形成人PEG10蛋白的重組細(xì)胞;(3)在適合表達(dá)人PEG10蛋白多肽的條件下,培養(yǎng)步驟(2)中的重組細(xì)胞;(4)分離出具有人PEG10蛋白活性的多肽。
9.一種能與權(quán)利要求4所述的人PEG10蛋白多肽特異性結(jié)合的抗體,其特征在于,包括多克隆抗體和單克隆抗體。
10.PEG10基因作為肝癌診斷標(biāo)志物的應(yīng)用。
全文摘要
本發(fā)明公開(kāi)了一種肝癌高表達(dá)基因PEG10,本發(fā)明還公開(kāi)了PEG10基因的 編碼蛋白,此外,本發(fā)明還公開(kāi)了PEG10基因作為肝癌診斷標(biāo)志物的應(yīng)用。本發(fā)明PEG10基因是一種肝癌高表達(dá)基因,PEG10在肝癌中的表達(dá)率高達(dá)66%,而在癌旁肝組織的表達(dá)率和表達(dá)水平極低。因此PEG10多核苷酸、PEG10蛋白及其抗體,以及PEG10蛋白相關(guān)的拮抗劑、激動(dòng)劑等可為治療包括肝癌等多種疾病提供新的治療途徑,因而具有巨大的應(yīng)用前景。
文檔編號(hào)C07K14/435GK1952130SQ20051003068
公開(kāi)日2007年4月25日 申請(qǐng)日期2005年10月20日 優(yōu)先權(quán)日2005年10月20日
發(fā)明者黃健, 韓澤廣, 林昀 申請(qǐng)人:上海人類基因組研究中心