專利名稱:一種新的人鋅指蛋白及其編碼序列的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及發(fā)育生物學(xué),神經(jīng)生理學(xué),分子生物學(xué),腫瘤學(xué),病毒學(xué)及基因工程領(lǐng)域。具體地,本發(fā)明涉及一種在人類腎上腺中表達(dá)的鋅指蛋白hZNFshgc及其核酸序列。本發(fā)明還涉及該蛋白和核酸序列的制備方法和用途。
鋅指結(jié)構(gòu)是指肽鏈上結(jié)合DNA的特定短序列,通過結(jié)合DNA來調(diào)控基因的轉(zhuǎn)錄與表達(dá),因而包含有鋅指結(jié)構(gòu)的蛋白廣泛參與了轉(zhuǎn)錄調(diào)控的生理過程。(J Mol Biol1999 Oct 22;293(2)215-8)。
ZNF140是Kruppel鋅指蛋白超家族的成員之一。ZNF140包含有一個KRAB(Kruppel-associated box)片段,抑制基因的表達(dá)(Genomics 1995 May20;27(2)259-64,F(xiàn)EBS Lett 1995 Aug 7;369(2-3)153-7)。
本發(fā)明中,hZNFshgc是一個新的鋅指蛋白,它與ZNF140同源。蛋白結(jié)構(gòu)決定了它的生理功能,可以說明本發(fā)明中的hZNFshgc有與ZNF140相似或者相同的功能。
在本申請之前,尚沒有公開或報道過本發(fā)明所涉及的人鋅指蛋白hZNFshgc。
本發(fā)明的第一目的就是提供一種新的人基因鋅指蛋白hZNFshgc(GenbankAccession No.AF155656),該基因是一個鋅指蛋白hZNFshgc基因。
本發(fā)明的第二目的是提供一種新的人鋅指蛋白hZNFshgc。
本發(fā)明的第三目的是提供一種利用重組技術(shù)生產(chǎn)上述的新的人鋅指蛋白hZNFshgc和核酸序列的方法。
本發(fā)明還提供了這種鋅指蛋白hZNFshgc多肽和編碼序列的應(yīng)用。
在本發(fā)明的一個方面,提供了一種分離出的DNA分子,該分子包括編碼具有人鋅指蛋白hZNFshgc活性的多肽的核苷酸序列,所述的核苷酸序列與SEQ IDNO.6中從核苷酸第214-1449位DNA分子的核苷酸序列有至少70%的同源性;或者所述的核苷酸序列能在中度嚴(yán)緊條件下與SEQ ID NO.6中從核苷酸第214-1449位的核苷酸序列雜交。較佳地,所述的序列編碼具有SEQ ID NO.7所示的氨基酸序列的多肽。更佳地,所述的序列具有SEQ ID NO.6中從核苷酸第214-1449位的核苷酸序列。
在本發(fā)明的另一方面,提供了一種分離出的人鋅指蛋白hZNFshgc多肽,它包括具有SEQ ID NO.7氨基酸序列的多肽、或其保守性變異多肽、或其活性片段,或其活性衍生物。較佳地,該多肽是具有SEQ ID NO.7序列的多肽。
在本發(fā)明的另一方面,還提供了一種載體,它包含上述的DNA分子。
在本發(fā)明的另一方面,還提供了一種用上述載體轉(zhuǎn)化的宿主細(xì)胞。在一個實(shí)例中該宿主細(xì)胞是大腸桿菌;在另一實(shí)例中,該宿主細(xì)胞是真核細(xì)胞。
在本發(fā)明的另一方面,還提供了一種產(chǎn)生具有人鋅指蛋白hZNFshgc活性的多肽的方法,該方法包括(1)將編碼具有人鋅指蛋白hZNFshgc活性的多肽的核苷酸序列可操作地連于表達(dá)調(diào)控序列,形成人鋅指蛋白hZNFshgc表達(dá)載體,所述的核苷酸序列與SEQID NO.6中從核苷酸第214-1449位的核苷酸序列有至少70%的同源性;(2)將步驟(1)中的表達(dá)載體轉(zhuǎn)入宿主細(xì)胞,形成人鋅指蛋白hZNFshgc的重組細(xì)胞;(3)在適合表達(dá)人鋅指蛋白hZNFshgc多肽的條件下,培養(yǎng)步驟(2)中的重組細(xì)胞;(4)分離出具有人鋅指蛋白hZNFshgc活性的多肽。
較佳地,在該方法中使用的核酸序列具有SEQ ID NO.6中第214-1449位的序列。
本發(fā)明還提供了與鋅指蛋白hZNFshgc多肽特異性結(jié)合的抗體。
在本發(fā)明中,“分離的”、“純化的”或“基本純的”DNA是指,該DNA或片段已從天然狀態(tài)下位于其兩側(cè)的序列中分離出來,還指該DNA或片段已經(jīng)與天然狀態(tài)下伴隨核酸的組份分開,而且已經(jīng)與在細(xì)胞中伴隨其的蛋白質(zhì)分開。
在本發(fā)明中,術(shù)語“人鋅指蛋白hZNFshgc(或多肽)編碼序列”指編碼具有人鋅指蛋白hZNFshgc活性的多肽的核苷酸序列,如SEQ ID NO.6中第214-1449位核苷酸序列及其簡并序列。該簡并序列是指,位于SEQ ID NO.6序列的編碼框第214-1449位核苷酸中,有一個或多個密碼子被編碼相同氨基酸的簡并密碼子所取代后而產(chǎn)生的序列。由于密碼子的簡并性,所以與SEQ ID NO.6中第214-1449位核苷酸序列同源性低至約70%的簡并序列也能編碼出SEQ ID NO.7所述的序列。該術(shù)語還包括能在中度嚴(yán)緊條件下,更佳的在高度嚴(yán)緊條件下與SEQID NO.6中從核苷酸第214-1449位的核苷酸序列雜交的核苷酸序列。該術(shù)語還包括與SEQ ID NO.6中從核苷酸第214-1449位的核苷酸序列的同源性至少70%,較佳地至少80%,更佳地至少90%,最佳地至少95%的核苷酸序列。
該術(shù)語還包括能編碼具有與人鋅指蛋白hZNFshgc相同功能的蛋白的、SEQID NO.6中開放閱讀框序列的變異形式。這些變異形式包括(但并不限于)若干個(通常為1-90個,較佳地1-60個,更佳地1-20個,最佳地1-10個)核苷酸的缺失、插入和/或取代,以及在5’和/或3’端添加數(shù)個(通常為60個以內(nèi),較佳地為30個以內(nèi),更佳地為10個以內(nèi),最佳地為5個以內(nèi))核苷酸。
在本發(fā)明中,“基本純的”蛋白質(zhì)或多肽是指其至少占樣品總物質(zhì)的至少20%,較佳地至少50%,更佳地至少80%,最佳地至少90%(按干重或濕重計)。純度可以用任何合適的方法進(jìn)行測量,如用柱層析、PAGE或HPLC法測量多肽的純度。基本純的多肽基本上不含天然狀態(tài)下的伴隨其的組分。
在本發(fā)明中,術(shù)語“人鋅指蛋白hZNFshgc或多肽”指具有鋅指蛋白hZNFshgc活性的SEQ ID NO.7序列的多肽。該術(shù)語還包括具有與人鋅指蛋白hZNFshgc相同功能的、SEQ ID NO.7序列的變異形式。這些變異形式包括(但并不限于)若干個(通常為1-50個,較佳地1-30個,更佳地1-20個,最佳地1-10個)氨基酸的缺失、插入和/或取代,以及在C末端和/或N末端添加一個或數(shù)個(通常為20個以內(nèi),較佳地為10個以內(nèi),更佳地為5個以內(nèi))氨基酸。例如,在本領(lǐng)域中,用性能相近或相似的氨基酸進(jìn)行取代時,通常不會改變蛋白質(zhì)的功能。又比如,在C末端和/或N末端添加一個或數(shù)個氨基酸通常也不會改變蛋白質(zhì)的功能。該術(shù)語還包括鋅指蛋白hZNFshgc的活性片段和活性衍生物。
本發(fā)明人鋅指蛋白hZNFshgc多肽的變異形式包括同源序列、保守性變異體、等位變異體、天然突變體、誘導(dǎo)突變體、在高或低的嚴(yán)緊條件下能與人鋅指蛋白hZNFshgc DNA雜交的DNA所編碼的蛋白、以及利用抗人鋅指蛋白hZNFshgc多肽的抗血清獲得的多肽或蛋白。本發(fā)明還提供了其他多肽,如包含人鋅指蛋白hZNFshgc多肽或其片段的融合蛋白。除了幾乎全長的多肽外,本發(fā)明還包括人鋅指蛋白hZNFshgc多肽的可溶性片段。通常,該片段具有人鋅指蛋白hZNFshgc多肽序列的至少約10個連續(xù)氨基酸,通常至少約30個連續(xù)氨基酸,較佳地至少約50個連續(xù)氨基酸,更佳地至少約80個連續(xù)氨基酸,最佳地至少約100個連續(xù)氨基酸。
在本發(fā)明中,“鋅指蛋白hZNFshgc保守性變異多肽”指與SEQ ID NO.7的氨基酸序列相比,有至多10個,較佳地至多8個,更佳地至多5個氨基酸被性質(zhì)相似或相近的氨基酸所替換而形成多肽。這些保守性變異多肽最好根據(jù)表1進(jìn)行替換而產(chǎn)生。
表1最初的殘基代表性的取代 優(yōu)選的取代Ala(A)Val;Leu;Ile ValArg(R)Lys;Gln;Asn LysAsn(N)Gln;His;Lys;Arg GlnAsp(D)GluGluCys(C)SerSerGln(Q)AsnAsnGlu(E)AspAspGly(G)Pro;Ala AlaHis(H)Asn;Gln;Lys;Arg ArgIle(I)Leu; Val;Met;Ala;Phe LeuLeu(L)Ile;Val;Met;Ala;PheIleLys(K)Arg;Gln;Asn ArgMet(M)Leu;Phe;Ile LeuPhe(F)Leu; Val;Ile;Ala;Tyr LeuPro(P)AlaAlaSer(S)ThrThrThr(T)SerSerTrp(W)Tyr;Phe TyrTyr(Y)Trp;Phe;Thr;Ser PheVal(V)Ile;Leu;Met;Phe;AlaLeu發(fā)明還包括人鋅指蛋白hZNFshgc或多肽的類似物。這些類似物與天然人鋅指蛋白hZNFshgc多肽的差別可以是氨基酸序列上的差異,也可以是不影響序列的修飾形式上的差異,或者兼而有之。這些多肽包括天然或誘導(dǎo)的遺傳變異體。誘導(dǎo)變異體可以通過各種技術(shù)得到,如通過輻射或暴露于誘變劑而產(chǎn)生隨機(jī)誘變,還可通過定點(diǎn)誘變法或其他已知分子生物學(xué)的技術(shù)。類似物還包括具有不同于天然L-氨基酸的殘基(如D-氨基酸)的類似物,以及具有非天然存在的或合成的氨基酸(如β、γ-氨基酸)的類似物。應(yīng)理解,本發(fā)明的多肽并不限于上述例舉的代表性的多肽。
修飾(通常不改變一級結(jié)構(gòu))形式包括;體內(nèi)或體外的多肽的化學(xué)衍生形式如乙?;螋然?。修飾還包括糖基化,如那些在多肽的合成和加工中或進(jìn)一步加工步驟中進(jìn)行糖基化修飾而產(chǎn)生的多肽。這種修飾可以通過將多肽暴露于進(jìn)行糖基化的酶(如哺乳動物的糖基化酶或去糖基化酶)而完成。修飾形式還包括具有磷酸化氨基酸殘基(如磷酸酪氨酸,磷酸絲氨酸,磷酸蘇氨酸)的序列。還包括被修飾從而提高了其抗蛋白水解性能或優(yōu)化了溶解性能的多肽。
在本發(fā)明中,可選用本領(lǐng)域已知的各種載體,如市售的載體,包括質(zhì)粒,粘粒等。在生產(chǎn)本發(fā)明的人鋅指蛋白hZNFshgc多肽時,可以將鋅指蛋白hZNFshgc編碼序列可操作地連于表達(dá)調(diào)控序列,從而形成人鋅指蛋白hZNFshgc表達(dá)載體。
如本文所用,“可操作地連于”指這樣一種狀況,即線性DNA序列的某些部分能夠影響同一線性DNA序列其他部分的活性。例如,如果信號肽DNA作為前體表達(dá)并參與多肽的分泌,那么信號肽(分泌前導(dǎo)序列)DNA就是可操作地連于多肽DNA;如果啟動子控制序列的轉(zhuǎn)錄,那么它是可操作地連于編碼序列;如果核糖體結(jié)合位點(diǎn)被置于能使其翻譯的位置時,那么它是可操作地連于編碼序列。一般,“可操作地連于”意味著相鄰,而對于分泌前導(dǎo)序列則意味著在閱讀框中相鄰。
在本發(fā)明中,術(shù)語“宿主細(xì)胞”包括原核細(xì)胞和真核細(xì)胞。常用的原核宿主細(xì)胞的例子包括大腸桿菌、枯草桿菌等。常用的真核宿主細(xì)胞包括酵母細(xì)胞、昆蟲細(xì)胞和哺乳動物細(xì)胞。較佳地,該宿主細(xì)胞是真核細(xì)胞,如CHO細(xì)胞、COS細(xì)胞等。
本發(fā)明還提供了對人鋅指蛋白hZNFshgc特異的抗體,包括多克隆抗體和單克隆抗體。
在本發(fā)明中,可以使用一系列本領(lǐng)域已知的方法來制備針對鋅指蛋白hZNFshgc特異的抗體。例如,將提純的人鋅指蛋白hZNFshgc基因產(chǎn)物或它的抗原片段注射入動物體內(nèi)以產(chǎn)生多克隆抗體。同樣,表達(dá)人鋅指蛋白hZNFshgc或它的抗原片段的細(xì)胞也可以用來對動物致免疫而產(chǎn)生抗體。根據(jù)本發(fā)明制備的抗體也可以是單克隆抗體,這些單克隆抗體可以用雜交瘤技術(shù)制備(例如,Kohler et al.,Nature 256495,1975;Kohler et al.,Eur.J.Immunol.6511,1976;Kohler et al.,Eur.J.Immunol.6292,1976)。本發(fā)明的抗體包括可以阻抑鋅指蛋白hZNFshgc功能的抗體,也可以是不影響人鋅指蛋白hZNFshgc功能的抗體。每一類抗體都可以通過對人鋅指蛋白hZNFshgc基因產(chǎn)物的片段或功能域致免疫而產(chǎn)生,而人鋅指蛋白hZNFshgc基因產(chǎn)物及其片段可以用重組方法產(chǎn)生或用多肽合成儀進(jìn)行合成。與非修飾形式的鋅指蛋白hZNFshgc基因產(chǎn)物結(jié)合的抗體,可以通過用在原核細(xì)胞例如E.coli中產(chǎn)生的基因產(chǎn)物來免疫動物而得到。與翻譯后修飾形式如糖基化或磷酸化蛋白或多肽結(jié)合的抗體,可以通過用在真核細(xì)胞如酵母或昆蟲細(xì)胞中產(chǎn)生的基因產(chǎn)物的來免疫動物而得到。
本發(fā)明的人鋅指蛋白hZNFshgc抗體可以用來鑒定表達(dá)人鋅指蛋白hZNFshgc或多肽的細(xì)胞,如Jurkat T細(xì)胞。例如,可以用一種可檢測的分子例如熒光素異硫氰酸(FITC)來標(biāo)記鋅指蛋白hZNFshgc特異抗體,然后讓人鋅指蛋白hZNFshgc特異抗體與細(xì)胞樣品接觸,再用熒光顯微鏡或流式細(xì)胞儀檢測出與鋅指蛋白hZNFshgc特異抗體結(jié)合的細(xì)胞。
除了在細(xì)胞表面檢測人鋅指蛋白hZNFshgc外,還可以用Western印跡技術(shù)分析該蛋白質(zhì)。細(xì)胞裂解液可以從培養(yǎng)細(xì)胞或取自病人的組織標(biāo)本如腎上腺中提取,并溶解在含有去污劑的裂解緩沖液中。然后用SDS聚丙烯酰胺凝膠電泳分離細(xì)胞提取物(同時將提純的人鋅指蛋白hZNFshgc多肽作為陽性對照),接著通過電泳雜交將其轉(zhuǎn)移到硝酸纖維素上。為了用Western印跡免疫探測鋅指蛋白hZNFshgc多肽,可以使用典型的抗體結(jié)合檢測方法,例如放射自顯影或堿性磷酸酶檢測方法。并可使用免疫接種血清或不相關(guān)的單克隆抗體作為非特異反應(yīng)的對照。
還可用Nothern印跡法技術(shù)分析鋅指蛋白hZNFshgc基因產(chǎn)物的表達(dá),即分析人鋅指蛋白hZNFshgc的RNA轉(zhuǎn)錄物在細(xì)胞中的存在與否和數(shù)量。
人鋅指蛋白hZNFshgc DNA的Nothern印跡分析和人鋅指蛋白hZNFshgc特異抗體的Western印跡分析可以聯(lián)合使用,以證實(shí)人鋅指蛋白hZNFshgc在生物樣本中的表達(dá)。人鋅指蛋白hZNFshgc DNA還可以用于Southern印跡分析或原位雜交分析,以將該基因定位于染色體上,并可進(jìn)行遺傳連鎖分析以找出其它可能的疾病相關(guān)基因。
此外,本發(fā)明還提供了一種可用作探針的核酸分子,該分子通常具有鋅指蛋白hZNFshgc核苷酸編碼序列的8-100個,較佳地15-50個連續(xù)核苷酸。該探針可用于檢測樣品中是否存在編碼鋅指蛋白hZNFshgc的核酸分子。
本發(fā)明還提供了檢測樣品中是否存在鋅指蛋白hZNFshgc核苷酸序列的方法,它包括用上述的探針與樣品進(jìn)行雜交,然后檢測探針是否發(fā)生了結(jié)合。較佳地,該樣品是PCR擴(kuò)增后的產(chǎn)物,其中PCR擴(kuò)增引物對應(yīng)于鋅指蛋白hZNFshgc核苷酸編碼序列,并可位于該編碼序列的兩側(cè)或中間。引物長度一般為15-50個核苷酸。
此外,根據(jù)本發(fā)明的鋅指蛋白hZNFshgc核苷酸序列和氨基酸序列,可以在核酸同源性或表達(dá)蛋白質(zhì)的同源性基礎(chǔ)上,篩選鋅指蛋白hZNFshgc同源基因或同源蛋白。
為了得到與鋅指蛋白hZNFshgc基因相關(guān)的人cDNAs或基因組DNAs的點(diǎn)陣,可以用DNA探針篩選人cDNA或基因組DNA文庫,這些探針是在低嚴(yán)緊條件下,用32P對鋅指蛋白hZNFshgc的全部或部分做放射活性標(biāo)記而得的。最適合于篩選的cDNA文庫是來自人腎上腺組織的文庫。來自參與內(nèi)分泌的其它人體組織或特定人體細(xì)胞株的cDNA文庫也可用于篩選目的。構(gòu)建來自感興趣的細(xì)胞或者組織的cDNA文庫的方法是分子生物學(xué)領(lǐng)域眾所周知的。另外,許多這樣的cDNA文庫也可以購買到,例如購自Clontech,Palo Alto,Cal.。這種篩選方法可以識別與鋅指蛋白hZNFshgc相關(guān)的基因家族的核苷酸序列。
根據(jù)核苷酸相似性篩選鋅指蛋白hZNFshgc同源物可以按如下方法完成。人體腎上腺cDNA文庫,例如Clontech Cat.#7430-1(Clontech,Palo Alto,Cal.)可以使用一段包含鋅指蛋白hZNFshgc基因序列的全部或部分的隨機(jī)引物化DNA探針篩選。要完成對與鋅指蛋白hZNFshgc序列至少有70%同源性的DNA插入序列的克隆的鑒定,可以使用雜交溫度為55℃的雜交液,然后用0.5×SSC和0.1%SDS清洗。用這種方法識別的克隆的DNA插入序列可以進(jìn)一步用DNA限制性內(nèi)切酶分析和DNA測序來評價它與鋅指蛋白hZNFshgc基因的相似性。組織表達(dá)的分布可以用上述的Northern印跡法技術(shù)分析。
鋅指蛋白hZNFshgc同源物也可以用針對鋅指蛋白hZNFshgc或多肽的抗體來識別。例如,可以用標(biāo)準(zhǔn)的方法對商品化的或者用已知方法構(gòu)建的,來自細(xì)胞或者組織例如腎上腺的表達(dá)文庫進(jìn)行篩選。將文庫倒入平皿,菌落轉(zhuǎn)移到一張硝化纖維素膜上,使表達(dá)的重組蛋白結(jié)合到膜上。然后就可以用特異性的人鋅指蛋白hZNFshgc抗體進(jìn)行典型的抗體結(jié)合和檢測。用這種方法所識別出克隆中的DNA插入序列,可以進(jìn)一步用DNA限制性內(nèi)切酶分析和DNA測序進(jìn)行分析以評價它與鋅指蛋白hZNFshgc基因的相似性。新識別的基因的組織表達(dá)分布可以同樣地按上述方法進(jìn)行分析。
本發(fā)明的人鋅指蛋白hZNFshgc核苷酸全長序列或其片段通??梢杂肞CR擴(kuò)增法、重組法或人工合成的方法獲得。對于PCR擴(kuò)增法,可根據(jù)本發(fā)明所公開的有關(guān)核苷酸序列,尤其是開放閱讀框序列來設(shè)計引物,并用市售的cDNA庫或按本領(lǐng)域技術(shù)人員已知的常規(guī)方法所制備的cDNA庫作為模板,擴(kuò)增而得有關(guān)序列。當(dāng)序列較長時,常常需要進(jìn)行兩次或多次PCR擴(kuò)增,然后再將各次擴(kuò)增出的片段按正確次序拼接在一起。
一旦獲得了有關(guān)的序列,就可以用重組法來大批量地獲得有關(guān)序列。這通常是將其克隆入載體,再轉(zhuǎn)入細(xì)胞,然后通過常規(guī)方法從增殖后的宿主細(xì)胞中分離得到有關(guān)序列。
此外,還可用人工合成的方法來合成有關(guān)序列,尤其是片段長度較短時。通常,通過先合成多個小片段,然后再進(jìn)行連接可獲得序列很長的片段。
通過同源檢索發(fā)現(xiàn),本發(fā)明的新基因具有與已發(fā)表并被確認(rèn)為人ZNF140蛋白的基因高度同源的序列,并且本發(fā)明的新蛋白具有人ZNF140蛋白高度保守的氨基酸序列。所以,本發(fā)明的鋅指蛋白hZNFshgc是人ZNF140蛋白基因的一個同源基因而具有相似的功能。
表2為本發(fā)明的人鋅指蛋白hZNFshgc與人ZNF140基因核酸序列(GenBankAccession No.NM_003440)的同源比較(FASTA)表。其中,相同的核苷酸用“|”標(biāo)出。
表3為本發(fā)明的人鋅指蛋白hZNFshgc與人ZNF140蛋白的氨基酸序列(GenPeptAccession No.4507991)的同源比較(FASTA)表。其中,相同的氨基酸在兩個序列之間用氨基酸單字符標(biāo)出,相似的氨基酸用“+”標(biāo)出。
下面結(jié)合具體實(shí)施例,進(jìn)一步闡述本發(fā)明。應(yīng)理解,這些實(shí)施例僅用于說明本發(fā)明而不用于限制本發(fā)明的范圍。下列實(shí)施例中未注明具體條件的實(shí)驗(yàn)方法,通常按照常規(guī)條件,例如Sambrook等人,分子克隆實(shí)驗(yàn)室手冊(NewYorkCold Spring Harbor Laboratory Press,1989)中所述的條件,或按照制造廠商所建議的條件。
實(shí)施例1鋅指蛋白hZNFshgc基因的克隆1.組織分離(Tissue isolation)腎上腺來源于5個正常成年男性供體,在死后四小時內(nèi)取出腎上腺組織,立即置于液氮中冷凍保存。
2.mRNA的分離(mRNA isolation)取出組織,用研缽研碎,加入盛有裂解液的50ml管,充分振蕩后,再移入玻璃勻漿器內(nèi)。勻漿后移至50ml新管,抽提總RNA(TRIzol Reagents,Gibco,NY,USA)。用甲醛變性膠電泳鑒定總RNA質(zhì)量。用帶Oligo d(T)的纖維素柱分離總RNA中的mRNA,定量。
3.cDNA文庫的構(gòu)建(Construction of cDNA library)以mRNA為模板,合成雙鏈cDNA,反轉(zhuǎn)錄引物見SEQ ID NO.1。補(bǔ)平末端后,加含EcoRI切點(diǎn)的接頭,接頭序列分別見SEQ ID NO.2和3。磷酸化EcoRI末端后,用XhoI限制性內(nèi)切酶消化1.5小時,再進(jìn)行片段分離。過柱篩選長度>500bp的片段,用酚-氯仿抽提,乙醇沉淀,無菌水溶解,連接至Uni-ZAP XR載體(Stratagene,CA9203,USA),以Zap-cDNA Gigapack III Gold Cloning Kit(Stratagene,CA9203,USA)進(jìn)行包裝,宿主菌使用XL 1-Blue MRF’(Stratagene,CA9203,USA)細(xì)菌。涂板并測定滴度。
4.測序及數(shù)據(jù)庫建立(Seqencing and Database Constructing)挑選文庫中有外源片段插入的克隆,擴(kuò)增后抽提質(zhì)粒(Qiagen,Germany),用T3和T7作為3’端和5’端的通用引物,采用終止物熒光標(biāo)記(Big-Dye,Perkin-Elmer,USA)的方法,在ABI 377測序儀(Perkin-Elmer,USA)上進(jìn)行EST大規(guī)模測序。測序結(jié)果用FACTURA軟件去除載體序列,傳輸?shù)絊UN Ultra 450 Server上進(jìn)行下一步的處理。所有的序列信息再用GCG軟件包(Wisconsin group,USA)中的BLAST和FASTA軟件搜索已有的數(shù)據(jù)庫(Genebank+EMBL),將無同源性或同源性低于95%的序列視為新基因建立數(shù)據(jù)庫。
5.基因的全長克隆(Cloning of Full-length cDNA)在得到的新基因片段序列信息基礎(chǔ)上,進(jìn)行cDNA全長克隆,分兩階段進(jìn)行(1)“電子克隆”(Electronic Cloning)以新基因片段序列作為探針?biāo)褜bEST數(shù)據(jù)庫,將重疊序列>50bp,同源性在98%以上的表達(dá)序列標(biāo)簽(Expressed Sequence Tag,簡稱“EST”)序列認(rèn)為同一序列(consensus sequence),取出并用AUTOASSEMBLER軟件進(jìn)行拼接,部分EST可以延伸探針序列。再用STRIDER軟件分析被延伸的序列是否具有完整的開放閱讀框架(Open Reading Frame,ORF),用BLAST搜尋Genbank或GenPept以確定該序列在核苷酸和氨基酸水平上是否與其他物種有同源性,以幫助判別所得到的基因全長完整性如何。通過電子克隆的方法,通??色@取鋅指蛋白hZNFshgc基因的全長序列。
(2)cDNA末端快速擴(kuò)增(Rapid Amplification of cDNA Ends,RACE)
如果通過“電子克隆”方法仍未得到完整的cDNA全長,則在已有序列的5’或3’端設(shè)計引物,在人類腎上腺M(fèi)arathon-Ready cDNA文庫(Clontech Lab,Inc,USA)中進(jìn)行長距離PCR反應(yīng)。然后對PCR產(chǎn)物克隆、測序。用AUTOASSEMBLER及STRIDER軟件分析被延長的序列有無完整的ORF,如無,重復(fù)上述過程直至獲得全長。
(3)RT-PCR對于5’和3’端已知的序列,如果中間尚有一段間隙(gap)無法從已有的公共數(shù)據(jù)庫或自身數(shù)據(jù)庫獲得,可考慮采用RT-PCR的方法。在序列5’端設(shè)計引物,3’端引物采用Oligo-dT,在腎上腺總RNA庫中進(jìn)行擴(kuò)增。然后對產(chǎn)物進(jìn)行克隆、測序。最后拼接并獲得全長。
通過組合使用上述3種方法,獲得了候選的人鋅指蛋白hZNFshgc的全長編碼序列。在拼接得到全長(至少包含完整的開放讀框)的基礎(chǔ)上,進(jìn)一步設(shè)計引物R15’-CTTCCAAGCTAAGGAACGGTTT-3’(SEQ ID NO.4)為正向引物,寡核苷酸R25’-GGGATGCACTTGGAACTGG-3’(SEQ ID NO.5)為反向引物,以腎上腺組織的總RNA為模板,進(jìn)行RT-PCR擴(kuò)增,R1/R2的PCR條件為94℃5分鐘,隨之以94℃30秒、58℃30秒和72℃1分鐘進(jìn)行35個循環(huán),最后以72℃延伸5分鐘。電泳檢測PCR擴(kuò)增產(chǎn)物,獲得擴(kuò)增片段長度為2180bp。然后按常規(guī)方法以PCR擴(kuò)增產(chǎn)物進(jìn)行克隆、測序,獲得SEQ ID NO.6所示的序列。
實(shí)施例2鋅指蛋白hZNFshgc基因的序列信息與同源性分析本發(fā)明新的人鋅指蛋白hZNFshgc全長cDNA(GenBank AccessionNo.AF155656。因申請保密,故在本申請之前未對公眾公開)的長度為2180bp,詳細(xì)序列見SEQ ID NO.6,其中開放讀框位于214-1449位核苷酸。根據(jù)全長cDNA推導(dǎo)出鋅指蛋白hZNFshgc的氨基酸序列,共411個氨基酸殘基,分子量47066.13,pI為9.01。詳細(xì)序列見SEQ ID NO.7。
將鋅指蛋白hZNFshgc的全長cDNA序列及其編碼蛋白質(zhì)用BLAST程序在Non-redundant GenBank+EMBL+DDBJ+PDB和Non-redundant GenBank CDS trans-lations+PDB+GenPept+Superdate+PIR數(shù)據(jù)庫中進(jìn)行核苷酸和蛋白質(zhì)同源性檢索,結(jié)果發(fā)現(xiàn)它與人的一個已知基因ZNF140存在一定的同源性。在核苷酸水平上,它與人ZNF140基因的mRNA全編碼序列(GenBank Accession No.NM_003440)的738-1695位堿基有65.6%的相同性(表2),在氨基酸水平上,它與人ZNF140蛋白(GenPept Accession No.4507991)的第1-450位氨基酸殘基有44.4%的相同性和64.6%的相似性(表3)。由上可見,鋅指蛋白hZNFshgc基因與人ZNF140基因無論從核酸還是蛋白水平上都存在較高的同源性,可以認(rèn)為兩者在功能上也有很高相似性。
本發(fā)明的人鋅指蛋白hZNFshgc除了可作為該家族一員用于進(jìn)一步的功能研究,還可用于與其他蛋白一起產(chǎn)生融合蛋白,比如與免疫球蛋白一起產(chǎn)生融合蛋白。此外,本發(fā)明人鋅指蛋白hZNFshgc還可以與該家族的其他成員進(jìn)行融合或交換片段,以產(chǎn)生新的蛋白。例如將本發(fā)明人鋅指蛋白hZNFshgc的N端與人ZNF140蛋白的N端進(jìn)行交換,以產(chǎn)生新的活性更高或具有新特性的蛋白。
針對本發(fā)明人鋅指蛋白hZNFshgc的抗體,用于篩選該家族的其他成員,或者用于親和純化相關(guān)蛋白(如該家族的其他成員)。
此外,本發(fā)明人鋅指蛋白hZNFshgc核酸(編碼序列或反義序列)可以被引入細(xì)胞,以提高人鋅指蛋白hZNFshgc的表達(dá)水平或者抑制人鋅指蛋白hZNFshgc的過度表達(dá)。本發(fā)明的人鋅指蛋白hZNFshgc或其活性多肽片段可以施用于病人,以治療或減輕因人鋅指蛋白hZNFshgc缺失、無功能或異常而導(dǎo)致的有關(guān)病癥。此外,還可以用基于本發(fā)明的核酸序列或抗體進(jìn)行有關(guān)的診斷或預(yù)后判斷。
由于本發(fā)明的人鋅指蛋白hZNFshgc具有源自人的天然氨基酸序列,因此,預(yù)計在施用于人時將具有較高的活性和/或較低的副作用(例如在人體內(nèi)的免疫原性更低或沒有)。
實(shí)施例3鋅指蛋白hZNFshgc的結(jié)構(gòu)和功能研究1.將鋅指蛋白hZNFshgc的氨基酸序列在blocks數(shù)據(jù)庫(網(wǎng)址為http//blocks.fhcrc.org/blocks-bin/blocks_search)中檢索,得到以下結(jié)果
加框區(qū)蛋白DNA結(jié)合鋅指結(jié)構(gòu)功能模塊(PROTEIN DNA-BINDING ZINC-FINGERMETAL)
陰影區(qū)C2H2型鋅指結(jié)構(gòu)功能模塊(Zinc finger,C2H2 type,domainproteins.)(2)功能分析由上可知本發(fā)明中的鋅指蛋白hZNFshgc存在多個鋅指結(jié)構(gòu),也同樣有相關(guān)功能。由于蛋白質(zhì)結(jié)構(gòu)決定了功能特異性的生物化學(xué)原理,因此本發(fā)明中的人鋅指蛋白hZNFshgc具有人ZNF140相似或相同的功能。
實(shí)施例4鋅指蛋白hZNFshgc基因的組織表達(dá)譜電子Northern表達(dá)譜。按Ton C.等人的方法(Ton C et al.,BiochemBiophys Res Commun 1997 Dec 18;241(2)589-594;Hwang DM,et al.,Circulation 1997 Dec 16;96(12)4146-4203),將鋅指蛋白hZNFshgc cDNA序列在GCG軟件包中的dbEST數(shù)據(jù)庫中做BLAST檢索,在得到的人類EST中,概率值<10e-10、相同性>95%的EST有42個,可視為該基因在組織中的轉(zhuǎn)錄表達(dá)本,由此得出表達(dá)該基因的組織譜,發(fā)現(xiàn)其在松果體、腎上腺、腦、心臟、腎、肝、肺、卵巢、神經(jīng)上皮細(xì)胞等等中均有表達(dá),表明它在人體許多組織器官中都發(fā)揮著重要作用。
實(shí)施例5鋅指蛋白hZNFshgc多肽的制備和提純在該實(shí)施例中,將全長的鋅指蛋白hZNFshgc編碼序列或片段構(gòu)建入商品化的蛋白質(zhì)融合表達(dá)載體之中,以表達(dá)和提純重組蛋白。
1.將鋅指蛋白hZNFshgc多肽以GST融合蛋白的形式在大腸桿菌中進(jìn)行原核表達(dá)。
原核表達(dá)載體的構(gòu)建,以及轉(zhuǎn)化大腸桿菌根據(jù)人鋅指蛋白hZNFshgc的全長編碼序列(SEQ ID NO.6),設(shè)計擴(kuò)增出完整編碼閱讀框的引物(分別對應(yīng)于編碼序列5’和3’端的約20個以上核苷酸),并在正反引物上分別引入限制性內(nèi)切酶位點(diǎn)(這根據(jù)選用的pGEX-2T載體而定),以便構(gòu)建表達(dá)載體。以實(shí)施例1中獲得的擴(kuò)增產(chǎn)物為模板,經(jīng)PCR擴(kuò)增后,將鋅指蛋白hZNFshgc基因在保證閱讀框正確的前提下克隆至pGEX-2T載體(Pharmacia,Piscataway,NJ)。鑒定好的表達(dá)載體利用CaCl2方法轉(zhuǎn)入大腸桿菌DH5α,篩選鑒定得到含有pGEX-2T-鋅指蛋白hZNFshgc表達(dá)載體的工程菌DH5α-pGEX-2T-鋅指蛋白hZNFshgc。
表達(dá)GST-鋅指蛋白hZNFshgc重組蛋白的工程菌的分離鑒定挑取單菌落的DH5α-pGEX-2T-鋅指蛋白hZNFshgc工程菌于3ml含100μg/ml氨芐青霉素的LB培養(yǎng)基中振搖培養(yǎng)過夜,按1∶100的濃度吸取培養(yǎng)液于新的LB培養(yǎng)基(含100μg/ml氨芐青霉素)中培養(yǎng)約3小時,至OD600達(dá)0.5后,加入IPTG至終濃度1mmol/L繼續(xù)于37℃分別培養(yǎng)0,1,2,3小時。取培養(yǎng)時間不同的1ml菌液離心,在細(xì)菌沉淀物中加入裂解液(2×SDS上樣緩沖液50μl,蒸餾水45μl,二巰基乙醇5μl),混懸細(xì)菌沉淀,沸水浴中煮5分鐘,10000rpm離心1分鐘,上清加入12%SDS-PAGE膠中電泳。染色后觀察預(yù)期分子量大小的蛋白量隨IPTG誘導(dǎo)時間增加而增加的菌株即為表達(dá)GST-鋅指蛋白hZNFshgc融合蛋白的工程菌。
GST-鋅指蛋白hZNFshgc融合蛋白的提取純化按上述方法誘導(dǎo)表達(dá)GST-鋅指蛋白hZNFshgc融合表達(dá)蛋白的工程菌DH5α-pGEX-2T-鋅指蛋白hZNFshgc。誘導(dǎo)后的細(xì)菌離心沉淀,按每400ml菌加入20mlPBS重懸細(xì)菌,超聲破碎細(xì)菌。破菌完全的超聲液按每毫升加入20微升的量加入PBS飽和的50%谷胱苷肽Sepharose 4B,37℃振搖結(jié)合30分鐘,10000rpm離心10分鐘沉淀結(jié)合了GST-鋅指蛋白hZNFshgc的谷胱苷肽Sepharose 4B,棄上清。按每毫升超聲液所得沉淀加入100μl PBS的量清洗兩次,而后按每毫升超聲液所得沉淀加入10μl還原型谷胱苷肽洗脫液,室溫置10分鐘,10000rpm離心10分鐘,上清即為洗脫的融合蛋白。重復(fù)洗脫兩次。洗脫的上清保存于-80℃,并進(jìn)行SDS-PAGE電泳,檢測純化效果。在47kDa處的蛋白質(zhì)條帶即為鋅指蛋白hZNFshgc。
實(shí)施例6鋅指蛋白hZNFshgc或多肽在昆蟲細(xì)胞中進(jìn)行真核細(xì)胞表達(dá)1.鋅指蛋白hZNFshgc桿狀病毒表達(dá)載體的構(gòu)建及轉(zhuǎn)染Sf9昆蟲細(xì)胞株根據(jù)人鋅指蛋白hZNFshgc的全長編碼序列(SEQ ID NO.6),設(shè)計擴(kuò)增出完整編碼閱讀框的引物,并在正反引物上分別引入限制性內(nèi)切酶位點(diǎn)(這可視選用的載體而定),以便構(gòu)建表達(dá)載體。以實(shí)施例1中獲得的擴(kuò)增產(chǎn)物為模板,經(jīng)PCR擴(kuò)增后,將鋅指蛋白hZNFshgc cDNA在保證閱讀框架的前提下克隆至pVL1392載體(Invitrogen,Carlsbad,CA)。鑒定好的表達(dá)載體3μg,野生型線性桿狀病毒DNA(BaculoGoldTMACMNPV DNA,Pharmingen,San Diego,CA)1μg和Lipofection(Gibco-BRL,NY)25μl,加入1ml無血清的昆蟲培養(yǎng)基中,振蕩15秒混勻,室溫孵育15分鐘備用。取1ml(2×106)Sf9昆蟲細(xì)胞懸液于60mm組織培養(yǎng)板中,貼壁1小時后換轉(zhuǎn)染培養(yǎng)基,室溫孵育15分鐘后棄培養(yǎng)基,加入前面制備好的DNA載體轉(zhuǎn)染混合物,Parafilm密封培養(yǎng)板,于室溫27℃振搖培養(yǎng)4小時,而后換完全培養(yǎng)基培養(yǎng)3天,收集上清備用。
2.轉(zhuǎn)入重組表達(dá)載體的昆蟲細(xì)胞株的篩選鑒定轉(zhuǎn)染3天后的昆蟲細(xì)胞用新鮮培養(yǎng)基制成細(xì)胞懸液(2×106/1ml),取1ml細(xì)胞懸液置于60mm組織培養(yǎng)皿中,加入3ml培養(yǎng)基,100μl收集的培養(yǎng)上清,貼壁1小時,棄2ml培養(yǎng)基,繼續(xù)室溫培養(yǎng)1小時,棄去所有的培養(yǎng)基,加入預(yù)熱的含20μl 4%X-gal的3ml半固體培養(yǎng)基,培養(yǎng)5-7天后挑取白色細(xì)胞克隆于96孔培養(yǎng)板中培養(yǎng)3-5天,而后吸取上清感染Sf9昆蟲細(xì)胞。
收集感染的細(xì)胞進(jìn)行Western鑒定。將細(xì)胞裂解后進(jìn)行SDS-PAGE電泳,電泳后的膠于Pharmacia的Multiphor II半干電轉(zhuǎn)移儀中將蛋白質(zhì)轉(zhuǎn)印到硝酸纖維膜上,將硝酸纖維膜置于封閉液中封閉1小時,而后于抗鋅指蛋白hZNFshgc的抗體溶液中封閉1小時,TBS液振搖清洗5分鐘共2次,而后將膜置于生物素標(biāo)記的抗鋅指蛋白hZNFshgc一抗的第二抗體溶液中振搖1小時,TBS清洗,加入親和素-堿性磷酸酶復(fù)合物反應(yīng)30分鐘,TBS清洗2次,加入新鮮配制的顯色液顯色觀察蛋白條帶。
挑取高表達(dá)鋅指蛋白hZNFshgc的Sf9細(xì)胞克隆。
3.鋅指蛋白hZNFshgc的提取純化用高表達(dá)鋅指蛋白hZNFshgc的Sf9細(xì)胞克隆的上清大量感染Sf9細(xì)胞,感染48小時后收集細(xì)胞,PBS洗滌。每2×108細(xì)胞加入20ml細(xì)胞裂解液(0.5%TritonX-100,20mM Na3PO4(磷酸鈉,pH7.8),500mM NaCl,1mM Na3VO4(釩酸鈉),1mMPefabloc,1μg/ml胃蛋白酶抑制劑,亮抑蛋白酶肽和抑蛋白酶肽)破細(xì)胞,12000×g離心20min去除細(xì)胞碎片,上清按每2×108的細(xì)胞加入2ml NTA-瓊脂糖(Qiagen,Germany),4℃吸附1小時。而后用含100nM咪唑的His緩沖液洗滌兩次,用含20mM N,N’-二哌嗪,500mM NaCl,300mM咪唑的緩沖液洗脫以得到純化的蛋白。洗脫液保存于4℃,并進(jìn)行SDS-PAGE電泳檢測提取的鋅指蛋白hZNFshgc的純度。在47kDa處的蛋白質(zhì)條帶即為鋅指蛋白hZNFshgc。
實(shí)施例7
抗人鋅指蛋白hZNFshgc抗體的制備1.免疫小鼠和脾細(xì)胞的制備將實(shí)施例5和實(shí)施例6中獲得的鋅指蛋白hZNFshgc用層析法進(jìn)行分離后備用,也可以用SDS-PAGE凝膠電泳法進(jìn)行分離,將電泳條帶從凝膠中割下,并用等體積的完全Freund’s佐劑乳化。取6-8周齡Balb/C雌鼠,用50-100μg/0.2ml乳化過的蛋白,對小鼠進(jìn)行腹膜內(nèi)注射。14天后,用非完全Freund’s佐劑乳化的同樣抗原對小鼠以50-100μg/0.2ml的劑量再加強(qiáng)免疫一次,3-5天后用于融合。其中,脾細(xì)胞制備見鄂征主編,《組織培養(yǎng)和分子細(xì)胞學(xué)技術(shù)》,北京出版社,第210頁。
2.按《組織培養(yǎng)和分子細(xì)胞學(xué)技術(shù)》(同上),第371頁中的方法,制備飼養(yǎng)細(xì)胞。
3.按《組織培養(yǎng)和分子細(xì)胞學(xué)技術(shù)》(同上),第213頁中的方法,進(jìn)行細(xì)胞融合。
4.抗體的檢測在細(xì)胞融合10-15天后,需逐孔進(jìn)行檢查,一旦發(fā)現(xiàn)旺盛的雜交細(xì)胞集落生長,就應(yīng)用鋅指蛋白hZNFshgc做抗體活性的初步篩選,常用的方法有免疫熒光試驗(yàn)、發(fā)射免疫試驗(yàn)(RIA)、酶聯(lián)免疫吸附試驗(yàn)(ELISA)。檢查出抗體活性的孔后,立刻進(jìn)行克隆培養(yǎng),并分離出抗體。
本發(fā)明涉及的序列與記號分列如下(1)SEQ ID NO.1的信息(i)序列特征(A)長度50bp(B)類型核苷酸(C)鏈性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型寡核苷酸(iii)序列描述SEQ ID NO.1GAGAGAGAGAGAGAGAGAGAACTAGTCTCGAGTTTTTTTTTTTTTTTTTT50(2)SEQ ID NO.2的信息(i)序列特征(A)長度13bp
(B)類型核苷酸(C)鏈性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型寡核苷酸(iii)序列描述SEQ ID NO.2AATTCGGCAC GA G13(3)SEQ ID NO.3的信息(i)序列特征(A)長度9bp(B)類型核苷酸(C)鏈性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型寡核苷酸(iii)序列描述SEQ ID NO.3GCCGTGCTC 9(4)SEQ ID NO.4的信息(i).序列特征(A)長度22bp(B)類型核苷酸(C)鏈性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii).分子類型寡核苷酸(iii).序列描述SEQ ID NO.4CTTCCAAGCTAAGGAACGGTTT 22(5)SEQ ID NO.5的信息(i).序列特征(A)長度19bp(B)類型核苷酸(C)鏈性單鏈
(D)拓?fù)浣Y(jié)構(gòu)線性(ii).分子類型寡核苷酸(iii).序列描述SEQ ID NO.5GGGATGCACTTGGAACTGG19(6)SEQ ID NO.6的信息(i)序列特征(A)長度2180bp(B)類型核苷酸(C)鏈性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型核苷酸(iii)序列描述SEQ ID NO.61 CTTCCAAGCT AAGGAACGGT TTGGGGCAGT GTCGTTCCCG GAGGTCGGCC51 GCCGTTACCC GCTCACCAGC TACGCGGCGC GTCAGGTCCG CGAAGGCGCG101 GGCTCGGGGC GCCTGCGGGA CGGTGAGGCC CTGCTGAGGA CTCCGGACAC151 TGCCCATCTC TAAGATAAGA ACCTGGAAAG GGGACTCTGT TGGCCATTGG201 AAATTGCAGA ATAATGTCTC AGGTGACATT TAGTGATGTG GCTATAGACT251 TCTCTCATGA AGAGTGGGCA TGCCTAGATT CTGCTCAGAG GGACTTATAC301 AAGGATGTGA TGGTCCAGAA TTATGAGAAC CTGGTCTCTG TAGGTCTTTC351 CGTAACTAAG CCATATGTGA TCATGTTATT GGAGGATGGA AAAGAGCCCT401 GGATGATGGA GAAAAAACTG TCAAAAGATT GGGAATCAAG ATGGGAAAAC451 AAGGAATTAT CAACAAAGAA GGATATTTAT GATGAAGATT CACCCCAACC501 AGTAACAATG GAAAAAGTTG TAAAACAAAG TTATGAATTT TCAAATTCTA551 ATAAGAATTT GGAATATACA GAATGCGACA CATTTAGAAG CACCTTTCAT601 TCAAAGTCTA CTCTTTCTGA ACCACAAAAC AATTCTGCTG AAGGGAATTC651 ACACAAATAT GATATATTAA AGAAGAATTT ATCAAAAAAG TCAGTTATAA701 AAAGTGAGAG AATAAATGGT GGAAAGAAAC TTTTAAATTC TAATAAAAGT751 GGGGCAGCCT TCAACCAGAG CAAATCTCTT ACCCTTCCCC AGACTTGTAA801 TAGAGAGAAA ATCTATACAT GCAGTGAATG TGGGAAAGCC TTTGGCAAAC851 AGTCAATCCT CAGTCGCCAC TGGAGAATTC ATACAGGAGA GAAGCCCTAT901 GAATGTCGTG AATGTGGGAA GACTTTTAGC CATGGTTCAT CCCTTACACG951 ACATCAGATA AGCCATAGTG GAGAGAAACC TTACAAATGC ATTGAATGTG1001 GGAAGGCCTT TAGCCATGGC TCATCACTTA CTAACCATCA GAGCACTCAC1051 ACGGGAGAGA AACCGTATGA ATGTATGAAC TGTGGAAAGT CTTTTAGTCG1101 TGTGTCCCTT CTCATTCAGC ATCTAAGAAT TCATACGCAA GAAAAACGCT1151 ATGAGTGTCG TATATGTGGA AAGGCCTTCA TTCATAGTTC GTCTCTCATT1201 CACCATCAGA AAAGCCATAC TGGAGAGAAG CCTTATGAAT GTAGAGAATG1251 TGGGAAAGCT TTCTGCTGTA GCTCACACCT TACTCAACAT CAAAGAATTC1301 ACAGTATGAA GAAAAAATAT GAATGCCACA AATGTCTCAA GGGCTTTAGT1351 AGCTTCTCAT TTCTTGGTCA ACATCAGAGT ATTCATACTG GAGAAAAACC1401 GTTGAAGTTT AGAAATGCAG GAAATCCTTC AACCAGCTTG AATCACTGAA1451 TATGCATTTG AGAAATCACA TTAGATTGAA ACCCTACGAA TGCAGTATAT1501 GTGGGAAAGC CTTTAGTCAT AGGTCGTCCC TGCTTCAACA TCACAGTATT1551 CATACTGGAG AGAAACCTTA CGAATGTATT AAATGTGGGA AGACCTTCAG1601 CTGTAGTTCA AACCTTACTG TACATCAGAG AATTCATACT GGAGAAAAGC1651 CATATAAATG TAGTGAGTGT GGGAAAGCTT TTAGCAAAGG CTCGAATCTT1701 ACTGCCCATC AAAGAGTACA TAATGGAGAG AAACCCAATA GTGTGGTAAG1751 TGTGGAAAAG CCTTTAGATC ATATGAATCC CTATACATGT GAGAAATCTT1801 ACAGAAGAGA AGCAGTGTTT ATCACGGTAA ACTTCATTCA TAGATCCTCC1851 CTTATTTAAC ATCAGAAAAA TGTATACTGG GGAAAAGTTG TATGAAGGTG1901 GTGAACATGG GAGACTTTTA GCAATGATGC AGATTTTTTT ATTAGAGTTT1951 ATACTGTAGA GAAATCATAT GAAGTCAATA AATGTGGGAA AGCCTTTGTC2001 AGTATTAATC CCTTAATTGA CCNTAAGTAT ACTCACACTA GGAAAAATCT2051 GTGTACATGT AGCAAATGTG GGAAAGACTA TAGGCAATAG GAATCTCCTG2101 CAAACTCCTA CAGGAGAAAA GTTGTATGAA TGTGGAAACT TTAGAAATTG2151 AAGGAATTTT TCCAGTTCCA AGTGCATCCC(7)SEQ ID NO.7的信息(i)序列特征(A)長度411氨基酸(B)類型氨基酸(C)鏈性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型多肽(iii)序列描述SEQ ID NO.71 MSQVTFSDVA IDFSHEEWAC LDSAQRDLYK DVMVQNYENL VSVGLSVTKP51 YVIMLLEDGK EPWMMEKKLS KDWESRWENK ELSTKKDIYD EDSPQPVTME101 KVVKQSYEFS NSNKNLEYTE CDTFRSTFHS KSTLSEPQNN SAEGNSHKYD151 ILKKNLSKKS VIKSERINGG KKLLNSNKSG AAFNQSKSLT LPQTCNREKI201 YTCSECGKAF GKQSILSRHW RIHTGEKPYE CRECGKTFSH GSSLTRHQIS251 HSGEKPYKCI ECGKAFSHGS SLTNHQSTHT GEKPYECMNC GKSFSRVSLL301 IQHLRIHTQE KRYECRICGK AFIHSSSLIH HQKSHTGEKP YECRECGKAF351 CCSSHLTQHQ RIHSMKKKYE CHKCLKGFSS FSFLGQHQSI HTGEKPLKFR401 NAGNPSTSLN H表265.6%identity in 968 nt overlap710 720 730 740 750 760hh.seqAAGAAGCCCTGGCTCAACATATGAATATCAGTACTGTGGAGAGGCCCTATGGATGCCATG||| | |||||||| |||| ||h.seq AGAGCAAATCTCTTACCCTTCCCCAGACTTGTAATAGAGAGAAAATCTATACATGCAGTG770 780 790 800 810 820770 780 790 800 810 820hh.seqAATGTGGAAAAACTTTTGGTCGACGCTTTTCCCTGGTGTTACACCAGAGGACTCATACTG||||||| ||| | ||||| || |||| ||| ||| | |||||| |h.seq AATGTGGGAAAGCCTTTGGCAAACAGTCAATCCTCAGTCGCCACTGGAGAATTCATACAG830 840 850 860 870 880830 840 850 860 870 880hh.seqGAGAGAAACCATATGCATGTAAGGAATGTGGCAAAACCTTTAGCCAGATTTCAAACCTTG||||||| || |||| |||| |||||||| || || |||||||| |||| ||||h.seq GAGAGAAGCCCTATGAATGTCGTGAATGTGGGAAGACTTTTAGCCATGGTTCATCCCTTA890 900 910 920 930 940890 900 910 920 930 940hh.seqTGAAACACCAAATGATACATACTGGAAAGAAACCCCATGAGTGTAAGGACTGTAATAAAA||| || || | |||| |||| ||||||| | | || | || ||| ||h.seq CACGACATCAGATAAGCCATAGTGGAGAGAAACCTTACAAATGCATTGAATGTGGGAAGG950 960 970 980 990 1000950 960 970 980 990 1000hh.seqCATTCAGTTACCTTTCATTTCTTATTGAACACCAGAGAACGCACACTGGGGAGAAACCTT| || || ||||| |||| | | || ||||| || ||||| || |||||||| |h.seq CCTTTAGCCATGGCTCATCACTTACTAACCATCAGAGCACTCACACGGGAGAGAAACCGT1010 1020 1030 1040 1050 10601010 1020 1030 1040 1050 1060hh.seqATGAATGTACTGAGTGTGGAAAGGCCTTTAGCCGTGCCTCCAACCTCACTCGACATCAAA||||||||| | ||||||||| | ||||| |||| ||| |||| || |||| ||h.seqATGAATGTATGAACTGTGGAAAGTCTTTTAGTCGTGTGTCCCTTCTCATTCAGCATCTAA1070 1080 1090 1100 1110 11201070 1080 1090 1100 1110 1120hh.seq GAATTCACATAGGAAAGAAACAATATATATGTAGGAAATGTGGTAAAGCATTTAGCAGTG||||||| || | |||| ||| ||| | | |||||| || || || |h.seqGAATTCATACGCAAGAAAAACGCTATGAGTGTCGTATATGTGGAAAGGCCTTCATTCATA1130 1140 1150 1160 1170 11801130 1140 1150 1160 1170 1180hh.seq GCTCAGAACTCATTCGCCACCAGATTACACATACTGGAGAGAAACCTTATGAATGCATTG| ||||||||| ||| |||| | |||||||||||||| ||||||||||| | |h.seqGTTCGTCTCTCATTCACCATCAGAAAAGCCATACTGGAGAGAAGCCTTATGAATGTAGAG1190 1200 1210 1220 1230 12401190 1200 1210 1220 1230 1240hh.seq AATGTGGGAAGGCATTTCGCCGTTTCTCACACCTTACTCGACATCAGAGCATCCATACAA|||||||||| || || | || |||||||||||||| |||||| || || || | |h.seqAATGTGGGAAAGCTTTCTGCTGTAGCTCACACCTTACTCAACATCAAAGAATTCACAGTA1250 1260 1270 1280 1290 13001250 1260 1270 1280 1290 1300hh.seq CCAAAACCCCGTATGAATGTAATGAATGTAGGAAAGCTTTGCGTTGTCACTCATTCCTTA|| | |||||||| | ||||| || | || || | |||||| |||h.seqTGAAGAAAAAATATGAATGCCACAAATGTCTCAAGGGCTTTAGTAGCTTCTCATTTCTTG1310 1320 1330 1340 1350 13601310 1320 1330 1340 1350 1360hh.seq TTAAACATCAGAGAATTCATGCTGGAGAAAAGCTCTATGAATGTGATGAATGTGGTAAAG| |||||||||| |||||| |||||||||| | | |||| | | |||| | |||h.seqGTCAACATCAGAGTATTCATACTGGAGAAAAAC-CGTTGAAGTTTAGAAATGCAGGAAAT1370 1380 1390 1400 1410 14201370 1380 1390 1400 1410 1420hh.seq TTTTCACTTGGCATGCATCCCTTATTCAACATACGAAGAGTCACACTGGAGAGAAACCCT|||| || || ||| || | | ||| || | ||||| | || ||||||||h.seqCCTTCAACCAGCTTGAATCACTGAATATGCATTTGAGAAATCACATTAGATTGAAACCCT1430 1440 1450 1460 1470 14801430 1440 1450 1460 1470 1480hh.seq ATGCGTGTGCTGAATGTGATAAAGCCTTCAGCCGGAGCTTTTCCCTCATTCTACATCAGA| | || | ||||| ||||||| || | || | ||||| ||| |||||| |h.seqACGAATGCAGTATATGTGGGAAAGCCTTTAGTCATAGGTCGTCCCTGCTTCAACATCACA1490 1500 1510 1520 1530 15401490 1500 1510 1520 1530 1540hh.seq GAACTCATACTGGAGAGAAACCCTATGTATGTAAGGTATGCAACAAATCCTTCAGCTGGA| | |||||||||||||||||| || | |||||||| || |||||||||| |h.seqGTATTCATACTGGAGAGAAACCTTACGAATGTATTAAATGTGGGAAGACCTTCAGCTGTA1550 1560 1570 1580 1590 16001550 1560 1570 1580 1590hh.seq GCTCAAACCTTGCTAAACATCAGAGGACACACACTCTTGACAACCCCTA---------TG| ||||||||| || ||||||||| | || ||| || || || || ||h.seqGTTCAAACCTTACTGTACATCAGAGAATTCATACTGGAGAAAAGCCATATAAATGTAGTG1610 1620 1630 1640 1650 16601600 1610 1620 1630 1640 1650hh.seq AATATGAAAATTCATTTAATTACCACTCATTCCTTACTGAACACCAGTGAATTTACACTG| | || || | |||| | |||||||||| || || || | | | ||h.seqAGTGTGGGAAAGCTTTTAGCAAAGGCTCGAATCTTACTGCCCATCAAAGAGTACATAATG
1670 1680 1690 1700 1710 17201660 1670 1680 1690 1700 1710hh.seqCAAAGAAAAACTATGAATGTATGGAATTTTTTAAAAAGAAGTATAATGCCTTACTTCAGA| ||||| | |||| ||| | | | |||||h.seq GAGAGAAACCCAAT---AGTGTGGTAAGTGTGGAAAAGCCTTTAGATCATATGAATCCCT1730 1740 1750 1760 1770 17801720 1730 1740 1750 1760 1770hh.seqGAACTCTTGGAAAGAAGCCTTATGTGAAAGTGATGACTGTGAAGTAATATGGCCCACACTh.seq ATACATGTGAGAAATCTTACAGAAGAGAAGCAGTGTTTATCACGGTAAACTTCATTCATA17901800 1810 1820 1830 1840hh.seq人鋅指蛋白ZNF140的核酸序列(GenBank Accession No.NM_003440)h.seq人鋅指蛋白ZNFshgc的核酸序列(GenBank Accession No.AF155656)表344.4% identity in 450 aa overlap.64.6%similarity in 450 aa overlap.
10 203040 5060hh.pepMSQGSVTFRDVAIDFSQEEWKWLQPAQRDLYRCVMLENYGHLVSLGLSISKPDVVSLLEQ||| ||| |||||||+||| |+ ||||||+ ||++|| +|||+|||++|| |+ |||+h.pep MSQ--VTFSDVAIDFSHEEWACLDSAQRDLYKDVMVQNYENLVSVGLSVTKPYVIMLLED1020 304050708090 100 110119hh.pepGKEPWLGKREVKRDLFSVSESSGEIKDFSPKNVIYD-DSSQYLIMERILSQGPVYSSFKG|||||+ ++++++| || | |++| |+ ||| || | + ||++++|+ +|+ +h.pep GKEPWMMEKKLSKDW----ESRWENKELSTKKDIYDEDSPQPVTMEKVVKQSYEFSNSN-60 7080 90 100110120130140 150160 170hh.pepGWKCKDHTEMLQENQGC-IRKVTVSHQEALAQHMNISTVERPYGCHECGKTFGRRFSLVL| ++|| | + |+ +|++ +| |++ |+++++ |++h.pep --KNLEYTE-------CDTFRSTFHSKSTLSEPQNNSAEGNSHKYDILKKNLSKK-SVIK120 130140 150 160180 190 200 210220 230hh.pepHQRTHTGEKPYACKECGKTFSQISNLVKHQMIHTGKKPHECKDCNKTFSYLSFLIEHQRT+| + |+|++ | +|+| ++|+ | ||+h.pep SERINGGKKLLNSNKSGAAFNQSKSLTLPQT------------CNR--------------170180 190240 250 260 270280 290hh.pepHTGEKPYECTECGKAFSRASNLTRHQRIHIGKKQYICRKCGKAFSSGSELIRHQITHTGE|| | |+||||||++ | |+|| ||| |+| | ||+|||+|| || | ||||+|+||h.pep ---EKIYTCSECGKAFGKQSILSRHWRIHTGEKPYECRECGKTFSHGSSLTRHQISHSGE200210 220 230240 250300 310320 330340 350hh.pepKPYECIECGKAFRRFSHLTRHQSIHTTKTPYECNECRKALRCHSFLIKHQRIHAGEKLYE|||+|||||||| + | || ||| || + |||| +| |++ |+||+| |||+ || ||h.pep KPYKCIECGKAFSHGSSLTNHQSTHTGEKPYECMNCGKSFSRVSLLIQHLRIHTQEKRYE260270 280 290300 310
360 370380 390400 410hh.pepCDECGKVFTWHASLIQHTKSHTGEKPYACAECDKAFSRSFSLILHQRTHTGEKPYVCKVC| |||+| +|||+| ||||||||| | || ||| | | ||| |+ +| | |+ |h.pep CRICGKAFIHSSSLIHHQKSHTGEKPYECRECGKAFCCSSHLTQHQRIHSMKKKYECHKC320 330340 350360 370420 430 440 450hh.pepNKSFSWSSNLAKHQRTHTLDNPYEYENSFNYHSFLTEHQ|+|| | |++|| || ++| +++|+ |h.pep LKGFSSFSFLGQHQSIHTGEKPLKFRNAGNPSTSLNH380390 400 410hh.pep人鋅指蛋白hZNF140氨基酸序列h.pep人hZNFshgc蛋白氨基酸序列(GenPept Accession No.4507991)
權(quán)利要求
1.一種分離出的DNA分子,其特征在于它包括編碼具有人鋅指蛋白hZNFshgc活性的多肽的核苷酸序列,所述的核苷酸序列與SEQ ID NO.6中從核苷酸第214-1449位的核苷酸序列有至少70%的同源性;或者所述的核苷酸序列能在中度嚴(yán)緊條件下與SEQ ID NO.6中從核苷酸第214-1449位的核苷酸序列交。
2.如權(quán)利要求1所述的DNA分子,其特征在于,所述的序列編碼具有SEQ IDNO.7所示的序列的多肽。
3.如權(quán)利要求1所述的DNA分子,其特征在于,該序列具有SEQ ID NO.6中從核苷酸第214-1449位的核苷酸序列。
4.一種分離出的人鋅指蛋白hZNFshgc多肽,其特征在于,它包括具有SEQID NO.7氨基酸序列的多肽、或其保守性變異多肽、或其活性片段,或其活性衍生物。
5.如權(quán)利要求4所述的多肽,其特征在于,該多肽是具有SEQ ID NO.7序列的多肽。
6.一種載體,其特征在于,它包含權(quán)利要求1所述的DNA。
7.一種用權(quán)利要求6所述載體轉(zhuǎn)化的宿主細(xì)胞,其特征在于它包括真核細(xì)胞和原核細(xì)胞。
8.一種產(chǎn)生具有人鋅指蛋白hZNFshgc活性的多肽的方法,其特征在于,該方法步驟如下(1)將編碼具有人鋅指蛋白hZNFshgc活性的多肽的核苷酸序列可操作地連于表達(dá)調(diào)控序列,形成人鋅指蛋白hZNFshgc表達(dá)載體,所述的核苷酸序列與SEQID NO.6中從核苷酸第214-1449位的核苷酸序列有至少70%的同源性;(2)將步驟(1)中的表達(dá)載體轉(zhuǎn)入宿主細(xì)胞,形成人鋅指蛋白hZNFshgc的重組細(xì)胞;(3)在適合表達(dá)人鋅指蛋白hZNFshgc多肽的條件下,培養(yǎng)步驟(2)中的重組細(xì)胞;(4)分離出具有人鋅指蛋白hZNFshgc活性的多肽。
9.一種能與權(quán)利要求7所述的人鋅指蛋白hZNFshgc多肽特異性結(jié)合的抗體,其特征在于它包括多克隆抗體和單克隆抗體。
10.一種探針分子,其特征在于,它包含權(quán)利要求1所述的DNA分子中8-100個連續(xù)核苷酸。
全文摘要
本發(fā)明提供了一種在人體正常腎上腺組織中表達(dá)的新的人鋅指蛋白hZNFshgc及其編碼序列,本發(fā)明還提供了該蛋白和核酸序列的制備方法,以及在樣品中檢測鋅指蛋白hZNFshgc核酸序列和多肽的方法。
文檔編號C12N15/12GK1267726SQ0011168
公開日2000年9月27日 申請日期2000年2月17日 優(yōu)先權(quán)日2000年2月17日
發(fā)明者李能干, 錢斌治, 彭永德, 陳竺, 韓澤廣 申請人:國家人類基因組南方研究中心