專利名稱:一種多肽——人轉(zhuǎn)座酶105和編碼這種多肽的多核苷酸的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬于生物技術(shù)領(lǐng)域,具體地說,本發(fā)明描述了一種多肽——人轉(zhuǎn)座酶105,以及編碼此多肽的多核苷酸序列。本發(fā)明還涉及此多核苷酸和多肽的制備方法和應(yīng)用。
Mariner轉(zhuǎn)座子以一種“剪切與粘貼”的機制在DNA中間體上移動,結(jié)果是轉(zhuǎn)座子被從原先的地方切割下來,并插入基因組的新位置。此過程有兩個關(guān)鍵因素一是需有活性的轉(zhuǎn)座酶,二是轉(zhuǎn)座子末端的反向重復(fù)序列(ITRs),轉(zhuǎn)座酶識別并移動ITRs。Mariner轉(zhuǎn)座子總是整合到一個TA雙核苷酸序列中,而此序列在插入過程中被復(fù)制。最近證實,純化后的mariner轉(zhuǎn)座酶在體外能有效介導(dǎo)轉(zhuǎn)座作用,且轉(zhuǎn)座酶功能實現(xiàn)無需宿主特異性因子的參與。
Tc1/mariner超家族包括Tc1、mar iner和pogo轉(zhuǎn)座子,長度約為1300-2400bp,包含一編碼轉(zhuǎn)座酶的基因,兩端有ITPs。雖然在基序上有一些差別(轉(zhuǎn)座酶蛋白15%同源性),超家族成員有同一起源,且有相同的結(jié)構(gòu)和分子轉(zhuǎn)座機制。
轉(zhuǎn)座酶主要的結(jié)構(gòu)功能分析集中于N末端的DNA結(jié)合區(qū)。
Tc1和mariner轉(zhuǎn)座酶有雙重的DNA結(jié)合區(qū),包含兩個HTH結(jié)構(gòu),第一個類似于一些轉(zhuǎn)錄因子的成對區(qū),而第二個處于一同源性DNA結(jié)合區(qū)中。Pogo轉(zhuǎn)座酶只含單一HTH結(jié)構(gòu)。核酸定位信號(NLS)與DNA結(jié)合區(qū)部分重疊,在轉(zhuǎn)座作用中起調(diào)控作用。另一主要區(qū)域為催化區(qū),有DD35D或DD35E的特殊結(jié)構(gòu),由一個保守的Asp與一段“D35D”或“D35E”區(qū)域相連,此區(qū)域包括保守的精氨酸和谷氨酸殘基,中間一般有35個相對保守的氨基酸殘基。
轉(zhuǎn)座子兩端有ITPs,包含轉(zhuǎn)座酶結(jié)合位點。在Tc1/mariner超家族的不同成員中,ITPs的長度與結(jié)合位點的數(shù)量和類型均有所差異。Tc1和mariner最簡單,ITPs<100bp,每個只含單一轉(zhuǎn)座酶結(jié)合位點。結(jié)合位點也是雙重結(jié)構(gòu),5′端部分由同源區(qū)識別,而3′端部分與成對區(qū)相互作用。
在轉(zhuǎn)座作用中轉(zhuǎn)座酶和ITRs參與一系列的分子作用,導(dǎo)致轉(zhuǎn)座子從原序列中切割下來,又重新整合到不同的基因座中(剪切與粘貼作用)。
轉(zhuǎn)座子經(jīng)剪切作用后兩端產(chǎn)生一對交錯的雙鏈DNA缺口,這種交錯切口可能在染色體或其它DNA分子中形成轉(zhuǎn)座子“足跡”。在某些情況下,“足跡”可能是交錯末端直接結(jié)合的結(jié)果。Tc1/mariner轉(zhuǎn)座子一般留下2-3bp的“足跡”。由于隨后的整合反應(yīng)由3′端完成,5′端切割位點只影響需修復(fù)的單鏈缺口的大小,而對轉(zhuǎn)座作用的最終產(chǎn)物沒有影響。
絕大多數(shù)Tc1/mariner轉(zhuǎn)座子整合入TA雙核苷酸序列。TA旁側(cè)的序列可能對轉(zhuǎn)座酶識別靶序列產(chǎn)生影響,另外,DNA的結(jié)構(gòu)也會影響轉(zhuǎn)座子的活動。
除轉(zhuǎn)座酶外,Tc1/mariner轉(zhuǎn)座子在轉(zhuǎn)座作用中不需其它蛋白參與,這表明它們沒有嚴格的宿主限制。
根據(jù)氨基酸同源比較的結(jié)果,本發(fā)明的多肽被推斷鑒定為一種新的人轉(zhuǎn)座酶105。
本發(fā)明的另一個目的是提供編碼該多肽的多核苷酸。
本發(fā)明的另一個目的是提供含有編碼人轉(zhuǎn)座酶105的多核苷酸的重組載體。
本發(fā)明的另一個目的是提供含有編碼人轉(zhuǎn)座酶105的多核苷酸的基因工程化宿主細胞。
本發(fā)明的另一個目的是提供生產(chǎn)人轉(zhuǎn)座酶105的方法。
本發(fā)明的另一個目的是提供針對本發(fā)明的多肽——人轉(zhuǎn)座酶105的抗體。
本發(fā)明的另一個目的是提供了針對本發(fā)明多肽——人轉(zhuǎn)座酶105的模擬化合物、拮抗劑、激動劑、抑制劑。
本發(fā)明的另一個目的是提供診斷治療與人轉(zhuǎn)座酶105異常相關(guān)的疾病的方法。
在本發(fā)明的第一方面,提供新穎的分離出的人轉(zhuǎn)座酶105,該多肽是人源的,它包含具有<210>2氨基酸序列的多肽、或其保守性變異多肽、或其活性片段、或其活性衍生物、類似物。較佳地,該多肽是具有<210>2氨基酸序列的多肽。
在本發(fā)明的第二方面,提供編碼分離的這些多肽的多核苷酸,該多核苷酸包含一核苷酸序列,該核苷酸序列與選自下組的一種核苷酸序列有至少98%相同性(a)編碼上述人轉(zhuǎn)座酶105的多核苷酸;(b)與多核苷酸(a)互補的多核苷酸。較佳地,該多核苷酸編碼具有<210>2所示氨基酸序列的多肽。更佳地,該多核苷酸的序列是選自下組的一種(a)具有<210>1中181-3039位的序列;和(b)具有<210>1中1-3351位的序列。
在本發(fā)明的第三方面,提供了含有上述多核苷酸的載體,以及被該載體轉(zhuǎn)化或轉(zhuǎn)導(dǎo)的宿主細胞或者被上述多核苷酸直接轉(zhuǎn)化或轉(zhuǎn)導(dǎo)的宿主細胞。
本發(fā)明的其它方面由于本文的技術(shù)的公開,對本領(lǐng)域的技術(shù)人員而言是顯而易見的。
如本發(fā)明所用,“分離的”是指物質(zhì)從其原始環(huán)境中分離出來(如果是天然的物質(zhì),原始環(huán)境即是天然環(huán)境)。如活體細胞內(nèi)的天然狀態(tài)下的多聚核苷酸和多肽是沒有分離純化的,但同樣的多聚核苷酸或多肽如從天然狀態(tài)中同存在的其他物質(zhì)中分開,則為分離純化的。
如本文所用,“分離的人轉(zhuǎn)座酶105”是指人轉(zhuǎn)座酶105基本上不含天然與其相關(guān)的其它蛋白、脂類、糖類或其它物質(zhì)。本領(lǐng)域的技術(shù)人員能用標準的蛋白質(zhì)純化技術(shù)純化人轉(zhuǎn)座酶105?;旧霞兊亩嚯脑诜沁€原聚丙烯酰胺凝膠上能產(chǎn)生單一的主帶。人轉(zhuǎn)座酶105多肽的純度能用氨基酸序列分析。
本發(fā)明提供了一種多肽——人轉(zhuǎn)座酶105,其基本上是由<210>2所示的氨基酸序列組成的。本發(fā)明的多肽可以是重組多肽、天然多肽、合成多肽,優(yōu)選重組多肽。本發(fā)明的多肽可以是天然純化的產(chǎn)物,或是化學(xué)合成的產(chǎn)物,或使用重組技術(shù)從原核或真核宿主(例如,細菌、酵母、高等植物、昆蟲和哺乳動物細胞)中產(chǎn)生。根據(jù)重組生產(chǎn)方案所用的宿主,本發(fā)明的多肽可以是糖基化的,或可以是非糖基化的。本發(fā)明的多肽還可包括或不包括起始的甲硫氨酸殘基。
本發(fā)明還包括人轉(zhuǎn)座酶105的片段、衍生物和類似物。如本發(fā)明所用,術(shù)語“片段”、“衍生物”和“類似物”是指基本上保持本發(fā)明的人轉(zhuǎn)座酶105相同的生物學(xué)功能或活性的多肽。本發(fā)明多肽的片段、衍生物或類似物可以是(I)這樣一種,其中一個或多個氨基酸殘基被保守或非保守氨基酸殘基(優(yōu)選的是保守氨基酸殘基)取代,并且取代的氨基酸可以是也可以不是由遺傳密碼子編碼的;或者(II)這樣一種,其中一個或多個氨基酸殘基上的某個基團被其它基團取代包含取代基;或者(III)這樣一種,其中成熟多肽與另一種化合物(比如延長多肽半衰期的化合物,例如聚乙二醇)融合;或者(IV)這樣一種,其中附加的氨基酸序列融合進成熟多肽而形成的多肽序列(如前導(dǎo)序列或分泌序列或用來純化此多肽的序列或蛋白原序列)通過本文的闡述,這樣的片段、衍生物和類似物被認為在本領(lǐng)域技術(shù)人員的知識范圍之內(nèi)。
本發(fā)明提供了分離的核酸(多核苷酸),基本由編碼具有<210>2氨基酸序列的多肽的多核苷酸組成。本發(fā)明的多核苷酸序列包括<210>1的核苷酸序列。本發(fā)明的多核苷酸是從人胎腦組織的cDNA文庫中發(fā)現(xiàn)的。它包含的多核苷酸序列全長為3351個堿基,其開放讀框(181--3039)編碼了952個氨基酸。根據(jù)氨基酸序列同源比較發(fā)現(xiàn),此多肽與人的KIAA0686蛋白有97%的同源性,可推斷出該人轉(zhuǎn)座酶105具有人的KIAA0686蛋白相似的結(jié)構(gòu)和功能。
本發(fā)明的多核苷酸可以是DNA形式或是RNA形式。DNA形式包括cDNA、基因組DNA或人工合成的DNA。DNA可以是單鏈的或是雙鏈的。DNA可以是編碼鏈或非編碼鏈。編碼成熟多肽的編碼區(qū)序列可以與<210>1所示的編碼區(qū)序列相同或者是簡并的變異體。如本發(fā)明所用,“簡并的變異體”在本發(fā)明中是指編碼具有<210>2的蛋白質(zhì)或多肽,但與<210>1所示的編碼區(qū)序列有差別的核酸序列。
編碼<210>2的成熟多肽的多核苷酸包括只有成熟多肽的編碼序列;成熟多肽的編碼序列和各種附加編碼序列;成熟多肽的編碼序列(和任選的附加編碼序列)以及非編碼序列。
術(shù)語“編碼多肽的多核苷酸”是指包括編碼此多肽的多核苷酸和包括附加編碼和/或非編碼序列的多核苷酸。
本發(fā)明還涉及上述描述多核苷酸的變異體,其編碼與本發(fā)明有相同的氨基酸序列的多肽或多肽的片斷、類似物和衍生物。此多核苷酸的變異體可以是天然發(fā)生的等位變異體或非天然發(fā)生的變異體。這些核苷酸變異體包括取代變異體、缺失變異體和插入變異體。如本領(lǐng)域所知的,等位變異體是一個多核苷酸的替換形式,它可能是一個或多個核苷酸的取代、缺失或插入,但不會從實質(zhì)上改變其編碼的多肽的功能。
本發(fā)明還涉及與以上所描述的序列雜交的多核苷酸(兩個序列之間具有至少50%,優(yōu)選具有70%的相同性)。本發(fā)明特別涉及在嚴格條件下與本發(fā)明所述多核苷酸可雜交的多核苷酸。在本發(fā)明中,“嚴格條件”是指(1)在較低離子強度和較高溫度下的雜交和洗脫,如0.2×SSC,0.1%SDS,60℃;或(2)雜交時加用變性劑,如50%(v/v)甲酰胺,0.1%小牛血清/0.1%Ficoll,42℃等;或(3)僅在兩條序列之間的相同性至少在95%以上,更好是97%以上時才發(fā)生雜交。并且,可雜交的多核苷酸編碼的多肽與<210>2所示的成熟多肽有相同的生物學(xué)功能和活性。
本發(fā)明還涉及與以上所描述的序列雜交的核酸片段。如本發(fā)明所用,”核酸片段”的長度至少含10個核苷酸,較好是至少20-30個核苷酸,更好是至少50-60個核苷酸,最好是至少100個核苷酸以上。核酸片段也可用于核酸的擴增技術(shù)(如PCR)以確定和/或分離編碼人轉(zhuǎn)座酶105的多核苷酸。
本發(fā)明中的多肽和多核苷酸優(yōu)選以分離的形式提供,更佳地被純化至均質(zhì)。
本發(fā)明的編碼人轉(zhuǎn)座酶105的特異的多核苷酸序列能用多種方法獲得。例如,用本領(lǐng)域熟知的雜交技術(shù)分離多核苷酸。這些技術(shù)包括但不局限于1)用探針與基因組或cDNA文庫雜交以檢出同源的多核苷酸序列,和2)表達文庫的抗體篩選以檢出具有共同結(jié)構(gòu)特征的克隆的多核苷酸片段。
本發(fā)明的DNA片段序列也能用下列方法獲得1)從基因組DNA分離雙鏈DNA序列;2)化學(xué)合成DNA序列以獲得所述多肽的雙鏈DNA。
上述提到的方法中,分離基因組DNA最不常用。DNA序列的直接化學(xué)合成是經(jīng)常選用的方法。更經(jīng)常選用的方法是cDNA序列的分離。分離感興趣的cDNA的標準方法是從高表達該基因的供體細胞分離mRNA并進行逆轉(zhuǎn)錄,形成質(zhì)?;蚴删wcDNA文庫。提取mRNA的方法已有多種成熟的技術(shù),試劑盒也可從商業(yè)途徑獲得(Qiagene)。而構(gòu)建cDNA文庫也是通常的方法(Sambrook,et al.,MolecularCloning,A Laboratory Manual,Cold Spring Harbor Laboratory.New York,1989)。還可得到商業(yè)供應(yīng)的cDNA文庫,如Clontech公司的不同cDNA文庫。當結(jié)合使用聚合酶反應(yīng)技術(shù)時,即使極少的表達產(chǎn)物也能克隆。
可用常規(guī)方法從這些cDNA文庫中篩選本發(fā)明的基因。這些方法包括(但不限于)(1)DNA-DNA或DNA-RNA雜交;(2)標志基因功能的出現(xiàn)或喪失;(3)測定人轉(zhuǎn)座酶105的轉(zhuǎn)錄本的水平;(4)通過免疫學(xué)技術(shù)或測定生物學(xué)活性,來檢測基因表達的蛋白產(chǎn)物。上述方法可單用,也可多種方法聯(lián)合應(yīng)用。
在第(1)種方法中,雜交所用的探針是與本發(fā)明的多核苷酸的任何一部分同源,其長度至少10個核苷酸,較好是至少30個核苷酸,更好是至少50個核苷酸,最好是至少100個核苷酸。此外,探針的長度通常在2000個核苷酸之內(nèi),較佳的為1000個核苷酸之內(nèi)。此處所用的探針通常是在本發(fā)明的基因序列信息的基礎(chǔ)上化學(xué)合成的DNA序列。本發(fā)明的基因本身或者片段當然可以用作探針。DNA探針的標記可用放射性同位素,熒光素或酶(如堿性磷酸酶)等。
在第(4)種方法中,檢測人轉(zhuǎn)座酶105基因表達的蛋白產(chǎn)物可用免疫學(xué)技術(shù)如Wcstcrn印跡法,放射免疫沉淀法,酶聯(lián)免疫吸附法(ELISA)等。
應(yīng)用PCR技術(shù)擴增DNA/RNA的方法(Saiki,et al.Science1985;2301350-1354)被優(yōu)選用于獲得本發(fā)明的基因。特別是很難從文庫中得到全長的cDNA時,可優(yōu)選使用RACE法(RACE-cDNA末端快速擴增法),用于PCR的引物可根據(jù)本文所公開的本發(fā)明的多核苷酸序列信息適當?shù)剡x擇,并可用常規(guī)方法合成??捎贸R?guī)方法如通過凝膠電泳分離和純化擴增的DNA/RNA片段。
如上所述得到的本發(fā)明的基因,或者各種DNA片段等的多核苷酸序列可用常規(guī)方法如雙脫氧鏈終止法(Sanger et al.PNAS,1977,745463-5467)測定。這類多核苷酸序列測定也可用商業(yè)測序試劑盒等。為了獲得全長的cDNA序列,測序需反復(fù)進行。有時需要測定多個克隆的cDNA序列,才能拼接成全長的cDNA序列。
本發(fā)明也涉及包含本發(fā)明的多核苷酸的載體,以及用本發(fā)明的載體或直接用人轉(zhuǎn)座酶105編碼序列經(jīng)基因工程產(chǎn)生的宿主細胞,以及經(jīng)重組技術(shù)產(chǎn)生本發(fā)明所述多肽的方法。
本發(fā)明中,編碼人轉(zhuǎn)座酶105的多核苷酸序列可插入到載體中,以構(gòu)成含有本發(fā)明所述多核苷酸的重組載體。術(shù)語“載體”指本領(lǐng)域熟知的細菌質(zhì)粒、噬菌體、酵母質(zhì)粒、植物細胞病毒、哺乳動物細胞病毒如腺病毒、逆轉(zhuǎn)錄病毒或其它載體。在本發(fā)明中適用的載體包括但不限于在細菌中表達的基于T7啟動子的表達載體(Rosenberg,et al.Gene,1987,56125);在哺乳動物細胞中表達的pMSXND表達載體(Lee and Nathans,J Bio Chem.2633521,1988)和在昆蟲細胞中表達的來源于桿狀病毒的載體??傊?,只要能在宿主體內(nèi)復(fù)制和穩(wěn)定,任何質(zhì)粒和載體都可以用于構(gòu)建重組表達載體。表達載體的一個重要特征是通常含有復(fù)制起始點、啟動子、標記基因和翻譯調(diào)控元件。
本領(lǐng)域的技術(shù)人員熟知的方法能用于構(gòu)建含編碼人轉(zhuǎn)座酶105的DNA序列和合適的轉(zhuǎn)錄/翻譯調(diào)控元件的表達載體。這些方法包括體外重組DNA技術(shù)、DNA合成技術(shù)、體內(nèi)重組技術(shù)等(Sambroook,et al.Molecular Cloning,a LaboratoryManual,cold Spring Harbor Laboratory.New York,1989)。所述的DNA序列可有效連接到表達載體中的適當啟動子上,以指導(dǎo)mRNA合成。這些啟動子的代表性例子有大腸桿菌的lac或trp啟動子;λ噬菌體的PL啟動子;真核啟動子包括CMV立即早期啟動子、HSV胸苷激酶啟動子、早期和晚期SV40啟動子、反轉(zhuǎn)錄病毒的LTRs和其它一些已知的可控制基因在原核細胞或真核細胞或其病毒中表達的啟動子。表達載體還包括翻譯起始用的核糖體結(jié)合位點和轉(zhuǎn)錄終止子等。在載體中插入增強子序列將會使其在高等真核細胞中的轉(zhuǎn)錄得到增強。增強子是DNA表達的順式作用因子,通常大約有10到300個堿基對,作用于啟動子以增強基因的轉(zhuǎn)錄??膳e的例子包括在復(fù)制起始點晚期一側(cè)的100到270個堿基對的SV40增強子、在復(fù)制起始點晚期一側(cè)的多瘤增強子以及腺病毒增強子等。
此外,表達載體優(yōu)選地包含一個或多個選擇性標記基因,以提供用于選擇轉(zhuǎn)化的宿主細胞的表型性狀,如真核細胞培養(yǎng)用的二氫葉酸還原酶、新霉素抗性以及綠色熒光蛋白(GFP),或用于大腸桿菌的四環(huán)素或氨芐青霉素抗性等。
本領(lǐng)域一般技術(shù)人員都清楚如何選擇適當?shù)妮d體/轉(zhuǎn)錄調(diào)控元件(如啟動子、增強子等)和選擇性標記基因。
本發(fā)明中,編碼人轉(zhuǎn)座酶105的多核苷酸或含有該多核苷酸的重組載體可轉(zhuǎn)化或轉(zhuǎn)導(dǎo)入宿主細胞,以構(gòu)成含有該多核苷酸或重組載體的基因工程化宿主細胞。術(shù)語“宿主細胞”指原核細胞,如細菌細胞;或是低等真核細胞,如酵母細胞;或是高等真核細胞,如哺乳動物細胞。代表性例子有大腸桿菌,鏈霉菌屬;細菌細胞如鼠傷寒沙門氏菌;真菌細胞如酵母;植物細胞;昆蟲細胞如果蠅S2或Sf9;動物細胞如CHO、COS或Rowes黑素瘤細胞等。
用本發(fā)明所述的DNA序列或含有所述DNA序列的重組載體轉(zhuǎn)化宿主細胞可用本領(lǐng)域技術(shù)人員熟知的常規(guī)技術(shù)進行。當宿主為原核生物如大腸桿菌時,能吸收DNA的感受態(tài)細胞可在指數(shù)生長期后收獲,用CaCl2法處理,所用的步驟在本領(lǐng)域眾所周知??晒┻x擇的是用MgCl2。如果需要,轉(zhuǎn)化也可用電穿孔的方法進行。當宿主是真核生物,可選用如下的DNA轉(zhuǎn)染方法磷酸鈣共沉淀法,或者常規(guī)機械方法如顯微注射、電穿孔、脂質(zhì)體包裝等。
通過常規(guī)的重組DNA技術(shù),利用本發(fā)明的多核苷酸序列可用來表達或生產(chǎn)重組的人轉(zhuǎn)座酶105(Science,1984;2241431)。一般來說有以下步驟(1).用本發(fā)明的編碼人人轉(zhuǎn)座酶105的多核苷酸(或變異體),或用含有該多核苷酸的重組表達載體轉(zhuǎn)化或轉(zhuǎn)導(dǎo)合適的宿主細胞;(2).在合適的培養(yǎng)基中培養(yǎng)宿主細胞;(3).從培養(yǎng)基或細胞中分離、純化蛋白質(zhì)。
在步驟(2)中,根據(jù)所用的宿主細胞,培養(yǎng)中所用的培養(yǎng)基可選自各種常規(guī)培養(yǎng)基。在適于宿主細胞生長的條件下進行培養(yǎng)。當宿主細胞生長到適當?shù)募毎芏群?,用合適的方法(如溫度轉(zhuǎn)換或化學(xué)誘導(dǎo))誘導(dǎo)選擇的啟動子,將細胞再培養(yǎng)一段時間。
在步驟(3)中,重組多肽可包被于細胞內(nèi)、或在細胞膜上表達、或分泌到細胞外。如果需要,可利用其物理的、化學(xué)的和其它特性通過各種分離方法分離和純化重組的蛋白。這些方法是本領(lǐng)域技術(shù)人員所熟知的。這些方法包括但并不限于常規(guī)的復(fù)性處理、蛋白沉淀劑處理(鹽析方法)、離心、滲透破菌、超聲波處理、超離心、分子篩層析(凝膠過濾)、吸附層析、離子交換層析、高效液相層析(HPLC)和其它各種液相層析技術(shù)及這些方法的結(jié)合。
本發(fā)明的多肽以及該多肽的拮抗劑、激動劑和抑制劑可直接用于疾病治療,例如,可治療惡性腫瘤、腎上腺缺乏癥、皮膚病、各類炎癥、HIV感染和免疫性疾病等。
轉(zhuǎn)座子可被用作轉(zhuǎn)基因載體,將新的表型帶入染色體中,或者是以插入突變作用破壞致癌基因。
Tc1/mariner轉(zhuǎn)座子與現(xiàn)存的基因轉(zhuǎn)移技術(shù)相比有一些潛在的優(yōu)勢。轉(zhuǎn)座子介導(dǎo)穩(wěn)定的單拷貝基因整合入染色體,在轉(zhuǎn)基因細胞或組織中可長期表達。雖然有大插入片段的轉(zhuǎn)座子的轉(zhuǎn)座作用的頻率會下降,但大于14kb的片段仍可進行轉(zhuǎn)座作用。因此,在實驗中高轉(zhuǎn)座頻率高低并不是至關(guān)重要的條件下,轉(zhuǎn)座子比逆轉(zhuǎn)錄病毒、腺病毒等對插入片段大小有嚴格限制的載體有明顯的優(yōu)勢。另一個有用的特征是轉(zhuǎn)座作用只需轉(zhuǎn)座酶的參與,因此,轉(zhuǎn)座的位點和時機可簡單地由轉(zhuǎn)座酶的表達來調(diào)控。
本發(fā)明的多肽被認為可用于診斷和治療很多疾病,包括但不限于以下惡性腫瘤,內(nèi)分泌系統(tǒng)疾病,神經(jīng)系統(tǒng)疾病,免疫性疾病,人獲得性免疫缺乏綜合癥(AIDS)。
本發(fā)明也提供了篩選化合物以鑒定提高(激動劑)或阻遏(拮抗劑)人轉(zhuǎn)座酶105的藥劑的方法。激動劑提高人轉(zhuǎn)座酶105刺激細胞增殖等生物功能,而拮抗劑阻止和治療與細胞過度增殖有關(guān)的紊亂如各種癌癥。例如,能在藥物的存在下,將哺乳動物細胞或表達人轉(zhuǎn)座酶105的膜制劑與標記的人轉(zhuǎn)座酶105一起培養(yǎng)。然后測定藥物提高或阻遏此相互作用的能力。
人轉(zhuǎn)座酶105的拮抗劑包括篩選出的抗體、化合物、受體缺失物和類似物等。人轉(zhuǎn)座酶105的拮抗劑可以與人轉(zhuǎn)座酶105結(jié)合并消除其功能,或是抑制該多肽的產(chǎn)生,或是與該多肽的活性位點結(jié)合使該多肽不能發(fā)揮生物學(xué)功能。
在篩選作為拮抗劑的化合物時,可以將人轉(zhuǎn)座酶105加入生物分析測定中,通過測定化合物對人轉(zhuǎn)座酶105和其受體之間相互作用的影響來確定化合物是否是拮抗劑。用上述篩選化合物的同樣方法,可以篩選出起拮抗劑作用的受體缺失物和類似物。能與人轉(zhuǎn)座酶105結(jié)合的多肽分子可通過篩選由各種可能組合的氨基酸結(jié)合于固相物組成的隨機多肽庫而獲得。篩選時,一般應(yīng)對人轉(zhuǎn)座酶105分子進行標記。
本發(fā)明提供了用多肽,及其片段、衍生物、類似物或它們的細胞作為抗原以生產(chǎn)抗體的方法。這些抗體可以是多克隆抗體或單克隆抗體。本發(fā)明還提供了針對人轉(zhuǎn)座酶105抗原決定簇的抗體。這些抗體包括(但不限于)多克隆抗體、單克隆抗體、嵌合抗體、單鏈抗體、Fab片段和Fab表達文庫產(chǎn)生的片段。
多克隆抗體的生產(chǎn)可用人轉(zhuǎn)座酶105直接注射免疫動物(如家兔,小鼠,大鼠等)的方法得到,多種佐劑可用于增強免疫反應(yīng),包括但不限于弗氏佐劑等。制備人轉(zhuǎn)座酶105的單克隆抗體的技術(shù)包括但不限于雜交瘤技術(shù)(Kohler andMilstein.Nature,1975,256495-497),三瘤技術(shù),人B-細胞雜交瘤技術(shù),EBV-雜交瘤技術(shù)等。將人恒定區(qū)和非人源的可變區(qū)結(jié)合的嵌合抗體可用已有的技術(shù)生產(chǎn)(Morrison et al,PNAS,1985,816851)。而已有的生產(chǎn)單鏈抗體的技術(shù)(U.S.Pat No.4946778)也可用于生產(chǎn)抗人轉(zhuǎn)座酶105的單鏈抗體。
抗人轉(zhuǎn)座酶105的抗體可用于免疫組織化學(xué)技術(shù)中,檢測活檢標本中的人轉(zhuǎn)座酶105。
與人轉(zhuǎn)座酶105結(jié)合的單克隆抗體也可用放射性同位素標記,注入體內(nèi)可跟蹤其位置和分布。這種放射性標記的抗體可作為一種非創(chuàng)傷性診斷方法用于腫瘤細胞的定位和判斷是否有轉(zhuǎn)移。
抗體還可用于設(shè)計針對體內(nèi)某一特殊部位的免疫毒素。如人轉(zhuǎn)座酶105高親和性的單克隆抗體可與細菌或植物毒素(如白喉毒素,蓖麻蛋白,紅豆堿等)共價結(jié)合。一種通常的方法是用巰基交聯(lián)劑如SPDP,攻擊抗體的氨基,通過二硫鍵的交換,將毒素結(jié)合于抗體上,這種雜交抗體可用于殺滅人轉(zhuǎn)座酶105陽性的細胞。
本發(fā)明中的抗體可用于治療或預(yù)防與人轉(zhuǎn)座酶105相關(guān)的疾病。給予適當劑量的抗體可以刺激或阻斷人轉(zhuǎn)座酶105的產(chǎn)生或活性。
本發(fā)明還涉及定量和定位檢測人轉(zhuǎn)座酶105水平的診斷試驗方法。這些試驗是本領(lǐng)域所熟知的,且包括FISH測定和放射免疫測定。試驗中所檢測的人轉(zhuǎn)座酶105水平,可以用作解釋人轉(zhuǎn)座酶105在各種疾病中的重要性和用于診斷人轉(zhuǎn)座酶105起作用的疾病。
本發(fā)明的多肽還可用作肽譜分析,例如,多肽可用物理的、化學(xué)或酶進行特異性切割,并進行一維或二維或三維的凝膠電泳分析,更好的是進行質(zhì)譜分析。
編碼人轉(zhuǎn)座酶105的多核苷酸也可用于多種治療目的?;蛑委熂夹g(shù)可用于治療由于人轉(zhuǎn)座酶105的無表達或異常/無活性表達所致的細胞增殖、發(fā)育或代謝異常。重組的基因治療載體(如病毒載體)可設(shè)計用于表達變異的人轉(zhuǎn)座酶105,以抑制內(nèi)源性的人轉(zhuǎn)座酶105活性。例如,一種變異的人轉(zhuǎn)座酶105可以是縮短的、缺失了信號傳導(dǎo)功能域的人轉(zhuǎn)座酶105,雖可與下游的底物結(jié)合,但缺乏信號傳導(dǎo)活性。因此重組的基因治療載體可用于治療人轉(zhuǎn)座酶105表達或活性異常所致的疾病。來源于病毒的表達載體如逆轉(zhuǎn)錄病毒、腺病毒、腺病毒相關(guān)病毒、單純皰疹病毒、細小病毒等可用于將編碼人轉(zhuǎn)座酶105的多核苷酸轉(zhuǎn)移至細胞內(nèi)。構(gòu)建攜帶編碼人轉(zhuǎn)座酶105的多核苷酸的重組病毒載體的方法可見于已有文獻(Sambrook,et al.)。另外重組編碼人轉(zhuǎn)座酶105的多核苷酸可包裝到脂質(zhì)體中轉(zhuǎn)移至細胞內(nèi)。
多核苷酸導(dǎo)入組織或細胞內(nèi)的方法包括將多核苷酸直接注入到體內(nèi)組織中;或在體外通過載體(如病毒、噬菌體或質(zhì)粒等)先將多核苷酸導(dǎo)入細胞中,再將細胞移植到體內(nèi)等。
抑制人轉(zhuǎn)座酶105mRNA的寡核苷酸(包括反義RNA和DNA)以及核酶也在本發(fā)明的范圍之內(nèi)。核酶是一種能特異性分解特定RNA的酶樣RNA分子,其作用機制是核酶分子與互補的靶RNA特異性雜交后進行核酸內(nèi)切作用。反義的RNA和DNA及核酶可用已有的任何RNA或DNA合成技術(shù)獲得,如固相磷酸酰胺化學(xué)合成法合成寡核苷酸的技術(shù)已廣泛應(yīng)用。反義RNA分子可通過編碼該RNA的DNA序列在體外或體內(nèi)轉(zhuǎn)錄獲得。這種DNA序列已整合到載體的RNA聚合酶啟動子的下游。為了增加核酸分子的穩(wěn)定性,可用多種方法對其進行修飾,如增加兩側(cè)的序列長度,核糖核苷之間的連接應(yīng)用磷酸硫酯鍵或肽鍵而非磷酸二酯鍵。
編碼人轉(zhuǎn)座酶105的多核苷酸可用于與人轉(zhuǎn)座酶105的相關(guān)疾病的診斷。編碼人轉(zhuǎn)座酶105的多核苷酸可用于檢測人轉(zhuǎn)座酶105的表達與否或在疾病狀態(tài)下人轉(zhuǎn)座酶105的異常表達。如編碼人轉(zhuǎn)座酶105的DNA序列可用于對活檢標本進行雜交以判斷人轉(zhuǎn)座酶105的表達狀況。雜交技術(shù)包括Southern印跡法,Northern印跡法、原位雜交等。這些技術(shù)方法都是公開的成熟技術(shù),相關(guān)的試劑盒都可從商業(yè)途徑得到。本發(fā)明的多核苷酸的一部分或全部可作為探針固定在微陣列(Microarray)或DNA芯片(又稱為“基因芯片”)上,用于分析組織中基因的差異表達分析和基因診斷。用人轉(zhuǎn)座酶105特異的引物進行RNA-聚合酶鏈反應(yīng)(RT-PCR)體外擴增也可檢測人轉(zhuǎn)座酶105的轉(zhuǎn)錄產(chǎn)物。
檢測人轉(zhuǎn)座酶105基因的突變也可用于診斷人轉(zhuǎn)座酶105相關(guān)的疾病。人轉(zhuǎn)座酶105突變的形式包括與正常野生型人轉(zhuǎn)座酶105 DNA序列相比的點突變、易位、缺失、重組和其它任何異常等??捎靡延械募夹g(shù)如Southern印跡法、DNA序列分析、PCR和原位雜交檢測突變。另外,突變有可能影響蛋白的表達,因此用Northern印跡法、Western印跡法可間接判斷基因有無突變。
本發(fā)明的序列對染色體鑒定也是有價值的。該序列會特異性地針對某條人染色體具體位置且并可以與其雜交。目前,需要鑒定染色體上的各基因的具體位點?,F(xiàn)在,只有很少的基于實際序列數(shù)據(jù)(重復(fù)多態(tài)性)的染色體標記物可用于標記染色體位置。根據(jù)本發(fā)明,為了將這些序列與疾病相關(guān)基因相關(guān)聯(lián),其重要的第一步就是將這些DNA序列定位于染色體上。
簡而言之,根據(jù)cDNA制備PCR引物(優(yōu)選15-35bp),可以將序列定位于染色體上。然后,將這些引物用于PCR篩選含各條人染色體的體細胞雜合細胞。只有那些含有相應(yīng)于引物的人基因的雜合細胞會產(chǎn)生擴增的片段。
體細胞雜合細胞的PCR定位法,是將DNA定位到具體染色體的快捷方法。使用本發(fā)明的寡核苷酸引物,通過類似方法,可利用一組來自特定染色體的片段或大量基因組克隆而實現(xiàn)亞定位。可用于染色體定位的其它類似策略包括原位雜交、用標記的流式分選的染色體預(yù)篩選和雜交預(yù)選,從而構(gòu)建染色體特異的cDNA庫。
將cDNA克隆與中期染色體進行熒光原位雜交(FISH),可以在一個步驟中精確地進行染色體定位。此技術(shù)的綜述,參見Verma等,Human Chromosomesa Manualof Basic Techniques,Pergamon Press,New York(1988)。
一旦序列被定位到準確的染色體位置,此序列在染色體上的物理位置就可以與基因圖數(shù)據(jù)相關(guān)聯(lián)。這些數(shù)據(jù)可見于例如,V.Mckusick,Mendelian Inheritancein Man(可通過與Johns Hopkins Univcrsity Welch Medical Library聯(lián)機獲得)。然后可通過連鎖分析,確定基因與業(yè)已定位到染色體區(qū)域上的疾病之間的關(guān)系。
接著,需要測定患病和未患病個體間的cDNA或基因組序列差異。如果在一些或所有的患病個體中觀察到某突變,而該突變在任何正常個體中未觀察到,則該突變可能是疾病的病因。比較患病和未患病個體,通常涉及首先尋找染色體中結(jié)構(gòu)的變化,如從染色體水平可見的或用基于cDNA序列的PCR可檢測的缺失或易位。根據(jù)目前的物理作圖和基因定位技術(shù)的分辨能力,被精確定位至與疾病有關(guān)的染色體區(qū)域的cDNA,可以是50至500個潛在致病基因間之一種(假定1兆堿基作圖分辨能力和每20kb對應(yīng)于一個基因)。
可以將本發(fā)明的多肽、多核苷酸及其模擬物、激動劑、拮抗劑和抑制劑與合適的藥物載體組合后使用。這些載體可以是水、葡萄糖、乙醇、鹽類、緩沖液、甘油以及它們的組合。組合物包含安全有效量的多肽或拮抗劑以及不影響藥物效果的載體和賦形劑。這些組合物可以作為藥物用于疾病治療。
本發(fā)明還提供含有一種或多種容器的藥盒或試劑盒,容器中裝有一種或多種本發(fā)明的藥用組合物成分。與這些容器一起,可以有由制造、使用或銷售藥品或生物制品的政府管理機構(gòu)所給出的指示性提示,該提示反映出生產(chǎn)、使用或銷售的政府管理機構(gòu)許可其在人體上施用。此外,本發(fā)明的多肽可以與其它的治療化合物結(jié)合使用。
藥物組合物可以以方便的方式給藥,如通過局部、靜脈內(nèi)、腹膜內(nèi)、肌內(nèi)、皮下、鼻內(nèi)或皮內(nèi)的給藥途徑。人轉(zhuǎn)座酶105以有效地治療和/或預(yù)防具體的適應(yīng)癥的量來給藥。施用于患者的人轉(zhuǎn)座酶105的量和劑量范圍將取決于許多因素,如給藥方式、待治療者的健康條件和診斷醫(yī)生的判斷。
圖1是本發(fā)明人轉(zhuǎn)座酶105和人的KIAA0686蛋白的氨基酸序列同源性比較圖。上方序列是人轉(zhuǎn)座酶105,下方序列是人的KIAA0686蛋白。相同氨基酸在兩個序列間用單字符氨基酸表示,相似氨基酸用“+”表示。
圖2為分離的人轉(zhuǎn)座酶105的聚丙烯酰胺凝膠電泳圖(SDS-PAGE)。105kDa為蛋白質(zhì)的分子量。箭頭所指為分離出的蛋白條帶。
實施例2cDNA克隆的同源檢索將本發(fā)明的人轉(zhuǎn)座酶105的序列及其編碼的蛋白序列,用Blast程序(BasiclocalAlignment search tool)[Altschul,SF et al.J.Mol.Biol.1990;215403-10],在Genbank、Swissport等數(shù)據(jù)庫進行同源檢索。與本發(fā)明的人轉(zhuǎn)座酶105同源性最高的基因是一種已知的人的KIAA0686蛋白,其編碼的蛋白在Genbank的準入號為AB014586。蛋白質(zhì)同源結(jié)果示于圖1,兩者高度同源,其相同性為97%;相似性為98%。實施例3用RT-PCR方法克隆編碼人轉(zhuǎn)座酶105的基因用胎腦細胞總RNA為模板,以oligo-dT為引物進行逆轉(zhuǎn)錄反應(yīng)合成cDNA,用Qiagene的試劑盒純化后,用下列引物進行PCR擴增Primer15’-GAAGAACAAACTCTTACCCTTAT-3’ (<210>3)Primer25’-TTCTATTGCTTTATTGATTATTA-3’ (<210>4)Primer1為位于<210>1的5’端的第1bp開始的正向序列;Primer2為<210>1的中的3’端反向序列。
擴增反應(yīng)的條件在50μl的反應(yīng)體積中含有50mmol/L KCl,10mmol/LTris-Cl,(pH8.5),1.5mmol/L MgCl2,200μmol/L dNTP,10pmol引物,1U的Taq DNA聚合酶(Clontech公司產(chǎn)品)。在PE9600型DNA熱循環(huán)儀(Perkin-Elmer公司)上按下列條件反應(yīng)25個周期94℃ 30sec;55℃ 30sec;72℃ 2min。在RT-PCR時同時設(shè)β-actin為陽性對照和模板空白為陰性對照。擴增產(chǎn)物用QIAGEN公司的試劑盒純化,用TA克隆試劑盒連接到pCR載體上(Invitrogen公司產(chǎn)品)。DNA序列分析結(jié)果表明PCR產(chǎn)物的DNA序列與<210>1所示的1-3351bp完全相同。實施例4Northern印跡法分析人轉(zhuǎn)座酶105基因的表達用一步法提取總RNA[Anal.Biochem 1987,162,156-159]。該法包括酸性硫氰酸胍苯酚-氯仿抽提。即用4M異硫氰酸胍-25mM檸檬酸鈉,0.2M乙酸鈉(pH4.0)對組織進行勻漿,加入1倍體積的苯酚和1/5體積的氯仿-異戊醇(49∶1),混合后離心。吸出水相層,加入異丙醇(0.8體積)并將混合物離心得到RNA沉淀。將得到的RNA沉淀用70%乙醇洗滌,干燥并溶于水中。用20μg RNA,在含20mM 3-(N-嗎啉代)丙磺酸(pH7.0)-5mM乙酸鈉-1mM EDTA-2.2M甲醛的1.2%瓊脂糖凝膠上進行電泳。然后轉(zhuǎn)移至硝酸纖維素膜上。用α-32P dATP通過隨機引物法制備32P-標記的DNA探針。所用的DNA探針為圖1所示的PCR擴增的人轉(zhuǎn)座酶105編碼區(qū)序列(181bp至3039bp)。將32P-標記的探針(約2×106cpm/ml)與轉(zhuǎn)移了RNA的硝酸纖維素膜在一溶液中于42℃雜交過夜,該溶液包含50%甲酰胺-25mM KH2PO4(pH7.4)-5×SSC-5×Denhardt’s溶液和200μg/ml鮭精DNA。雜交之后,將濾膜在1×SSC-0.1%SDS中于55℃洗30min。然后,用PhosphorImager進行分析和定量。實施例5重組人轉(zhuǎn)座酶105的體外表達、分離和純化根據(jù)<210>1和圖1所示的編碼區(qū)序列,設(shè)計出一對特異性擴增引物,序列如下Primer35’-CCCGGATCCATGGTTATTATTACAGGGAGTGAC-3’(<210>5)Primer45’-CCCCTCGAGCTCAGTCGAATGGTTAGTGAGGAG-3’(<210>6)此兩段引物的5’端分別含有BamHI和XboI酶切位點,其后分別為目的基因5’端和3’端的編碼序列,BamHI和XboI酶切位點相應(yīng)于表達載體質(zhì)粒pET-28b(+)(Novagen公司產(chǎn)品,Cat.No.69865.3)上的選擇性內(nèi)切酶位點。以含有全長目的基因的pBS-0196c09質(zhì)粒為模板,進行PCR反應(yīng)。PCR反應(yīng)條件為總體積50μl中含pBS-0196c09質(zhì)粒10pg、引物Primer-3和Primer-4分別為10pmol、Advantage polymerase Mix(Clontech公司產(chǎn)品)1μl。循環(huán)參數(shù)94℃ 20s,60℃ 30s,68℃ 2min,共25個循環(huán)。用BamIII和XboI分別對擴增產(chǎn)物和質(zhì)粒pET-28(+)進行雙酶切,分別回收大片段,并用T4連接酶連接。連接產(chǎn)物轉(zhuǎn)化用氯化鈣法大腸桿細菌DH5α,在含卡那霉素(終濃度30μg/ml)的LB平板培養(yǎng)過夜后,用菌落PCR方法篩選陽性克隆,并進行測序。挑選序列正確的陽性克隆(pET-0196c09)用氯化鈣法將重組質(zhì)粒轉(zhuǎn)化大腸桿菌BL21(DE3)plySs(Novagen公司產(chǎn)品)。在含卡那霉素(終濃度30μg/ml)的LB液體培養(yǎng)基中,宿主菌BL21(pET-0196c09)在37℃培養(yǎng)至對數(shù)生長期,加入IPTG至終濃度1mmol/L,繼續(xù)培養(yǎng)5小時。離心收集菌體,經(jīng)超聲波破菌,離心收集上清,用能與6個組氨酸(6His-Tag)結(jié)合的親和層析柱His.Bind Quick Cartridge(Novagen公司產(chǎn)品)進行層析,得到了純化的目的蛋白人轉(zhuǎn)座酶105。經(jīng)SDS-PAGE電泳,在105kDa處得到一單一的條帶(圖2)。將該條帶轉(zhuǎn)移至PVDF膜上用Edams水解法進行N-端氨基酸序列分析,結(jié)果N-端15個氨基酸與<210>2所示的N-端15個氨基酸殘基完全相同。實施例6抗人轉(zhuǎn)座酶105抗體的產(chǎn)生用多肽合成儀(PE公司產(chǎn)品)合成下述人轉(zhuǎn)座酶105特異性的多肽
NH2-Met-Val-Ile-Ile-Thr-Gly-Ser-Asp-Leu-His-Asn-Gly-Ile-Ile-Gly-COOH。將該多肽分別與血藍蛋白和牛血清白蛋白耦合形成復(fù)合,方法參見Avrameas,et al.Immunochemistry,1969;643。用4mg上述血藍蛋白多肽復(fù)合物加上完全弗氏佐劑免疫家兔,15天后再用血藍蛋白多肽復(fù)合物加不完全弗氏佐劑加強免疫一次。采用經(jīng)15μg/ml牛血清白蛋白多肽復(fù)合物包被的滴定板做ELISA測定兔血清中抗體的滴度。用蛋白A-Sepharose從抗體陽性的家兔血清中分離總IgG。將多肽結(jié)合于溴化氰活化的Sepharose4B柱上,用親和層析法從總IgG中分離抗多肽抗體。免疫沉淀法證明純化的抗體可特異性地與人轉(zhuǎn)座酶105結(jié)合。
序列表<110>上海博德基因開發(fā)有限公司<120>一種多肽--人轉(zhuǎn)座酶105和編碼這種多肽的多核苷酸<130>0196c09<160>6<170>PatentIn version 3.1<210>1<211>3351<212>DNA<213>Homo sapiens<220><221>CDS<222>(181)..(3039)<223><400>1gaagaacaaa ctcttaccct tatattccta gatggagaaa gagaacgtaa agtatcagtt 60caaattttgg atgatgatga gcctgagggg caggaattct tctacgtgtt tctcgcaaac 120cctcaagggg gagcacagat tgtggagggg aaggatgata ctggatttgc agcttttgcc 180atg gtt att att aca ggg agt gac ctt cac aat ggc atc ata gga ttc228Met Val Ile Ile Thr Gly Ser Asp Leu His Asn Gly Ile Ile Gly Phe15 10 15agt gag gag tcc cag agt gga cta gaa ctc agg gaa gga gct gtt atg 276Ser Glu Glu Ser Gln Ser Gly Leu Glu Leu Arg Glu Gly Ala Val Met20 25 30aga aga ttg cac ctt att gtc aca aga cag cca aac agg gcc ttt gaa 324Arg Arg Leu His Leu Ile Val Thr Arg Gln Pro Asn Arg Ala Phe Glu35 40 45gat gtc aag gtc ttt tgg cga gtc aca ctt aac aaa aca gtt gtc gtg 372Asp Val Lys Val Phe Trp Arg Val Thr Leu Asn Lys Thr Val Val Val50 55 60ctc cag aag gat ggg gta aac ctg atg gag gaa ctt cag tct gtg tca 420Leu Gln Lys Asp Gly Val Asn Leu Met Glu Glu Leu Gln Ser Val Ser65 70 75 80ggg acc aca acc tgt aca atg ggt caa aca aaa tgc ttt atc agc att 468Gly Thr Thr Thr Cys Thr Met Gly Gln Thr Lys Cys Phe Ile Ser Ile85 90 95gaa ctc aaa cca gaa aag gta cca cag gtt gaa gtg tat ttt ttt gtg 516Glu Leu Lys Pro Glu Lys Val Pro Gln Val Glu Val Tyr Phe Phe Val100 105 110gaa cta tat gaa gct act gct gga gca gca ata aac aac agt gcc aga 564Glu Leu Tyr Glu Ala Thr Ala Gly Ala Ala Ile Asn Asn Ser Ala Arg115 120 125ttc gca cag att aaa atc tta gaa agt gat gaa tct caa agc ctt gtg 612Phe Ala Gln Ile Lys Ile Leu Glu Ser Asp Glu Ser Gln Ser Leu Val130 135 140tat ttt tct gtg ggt tct cgg ctg gca gtg gct cac aag aag gcc act 660Tyr Phe Ser Val Gly Ser Arg Leu Ala Val Ala His Lys Lys Ala Thr145 150 155 160tta atc agt ctg cag gtg gcc aga gat tct ggg aca gga cta atg atg 708Leu Ile Ser Leu Gln Val Ala Arg Asp Ser Gly Thr Gly Leu Met Met165 170 175tct gtt aac ttt agt acc cag gag ttg agg agt gct gaa aca att ggt 756Ser Val Asn Phe Ser Thr Gln Glu Leu Arg Ser Ala Glu Thr Ile Gly180 185 190cgt acc atc ata tct cca gct att tct gga aag gat ttt gtg ata act 804Arg Thr Ile Ile Ser Pro Ala Ile Ser Gly Lys Asp Phe Val Ile Thr195 200 205gaa ggc aca ttg gtc ttt gaa cct ggc cag aga agc act gta ttg gat 852Glu Gly Thr Leu Val Phe Glu Pro Gly Gln Arg Ser Thr Val Leu Asp210 215 220gtc atc cta acg cca gag aca gga tct tta aat tca ttt cct aaa cgc 900Val Ile Leu Thr Pro Glu Thr Gly Ser Leu Asn Ser Phe Pro Lys Arg225 230 235 240ttc cag att gtc ctt ttt gac cca aaa ggt ggt gcc aga att gat aaa 948Phe Gln Ile Val Leu Phe Asp Pro Lys Gly Gly Ala Arg Ile Asp Lys245 250 255gtg tat ggg act gcc aac atc act ctt gtc tca gat gca gat tcg cag 996Val Tyr Gly Thr Ala Asn Ile Thr Leu Val Ser Asp Ala Asp Ser Gln260 265 270gcc att tgg ggg ctt gca gat cag cta cat cag cct gtg aat gat gat 1044Ala Ile Trp Gly Leu Ala Asp Gln Leu His Gln Pro Val Asn Asp Asp275 280 285att ctc aac aga gtg ctc cat acc atc agc atg aaa gtg gcc aca gaa 1092Ile Leu Asn Arg Val Leu His Thr Ile Ser Met Lys Val Ala Thr Glu290 295 300aac aca gat gaa caa ctc agt gcc atg atg cat tta ata gaa aag ata 1140Asn Thr Asp Glu Gln Leu Ser Ala Met Met His Leu Ile Glu Lys Ile305 310 315 320act act gaa gga aaa att caa gct ttc agt gtt gcc agc cga act ctt 1188Thr Thr Glu Gly Lys Ile Gln Ala Phe Ser Val Ala SerArg Thr Leu325 330335ttc tat gag att ctt tgt tct ctt att aac cca aag cgc aag gac act 1236Phe Tyr Glu Ile Leu Cys Ser Leu Ile Asn Pro Lys Arg Lys Asp Thr340 345 350agg gga ttc agt cac ttt gct gaa gtg act gag aat ttt gcc ttt tct 1284Arg Gly Phe Ser His Phe Ala Glu Val Thr Glu Asn Phe Ala Phe Ser355 360 365ctg ctg act aat gtt act tgc ggc tct cct ggt gaa aaa agc aaa acc 1332Leu Leu Thr Asn Val Thr Cys Gly Ser Pro Gly Glu Lys Ser Lys Thr370 375 380atc ctt gat agt tgc cca tat ttg tca ata ttg gct ctt cac tgg tat 1380Ile Leu Asp Ser Cys Pro Tyr Leu Ser Ile Leu Ala Leu His Trp Tyr385 390 395 400cct cag caa atc aat gga cac aag ttt gaa gga aag gaa gga gat tac 1428Pro Gln Gln Ile Asn Gly His Lys Phe Glu Gly Lys Glu Gly Asp Tyr405 410 415att cga att cca gag agg cta ctg gat gtc cag gat gca gaa ata atg 1476Ile Arg Ile Pro Glu Arg Leu Leu Asp ValGln Asp Ala Glu Ile Met420 425430gct ggg aaa agt aca tgt aaa tta gtc cag ttt aca gag tat agc agc 1524Ala Gly Lys Ser Thr Cys Lys Leu Val Gln Phe Thr Glu Tyr Ser Ser435 440 445caa cag tgg ttt ata agt gga aac aat ctt cct acc cta aaa aat aag 1572Gln Gln Trp Phe Ile Ser Gly Asn Asn Leu Pro Thr Leu Lys Asn Lys450 455 460gta tta tct ttg agt gtg aaa ggt cag agt tca caa ctc ctg act aat 1620Val Leu Ser Leu Ser Val Lys Gly Gln Ser Ser Gln Leu Leu Thr Asn465 470 475 480gac aat gag gtt ctc tac agg att tat gct gct gag cct aga att att 1668Asp Asn Glu Yal Leu Tyr Arg Ile Tyr Ala Ala Glu Pro Arg Ile Ile485 490 495cct cag aca tct ctg tgt ctc ctt tgg aat cag gct gct gca agc tgg 1716Pro Gln Thr Ser Leu Cys Leu Leu Trp Asn Gln Ala Ala Ala Ser Trp500 505 510ttg tct gac agt cag ttt tgc aaa gtg gtt gag gaa act gca gac tat 1764Leu Ser Asp Ser Gln Phe Cys Lys Val Val Glu Glu Thr Ala Asp Tyr515 520 525gtg gaa tgt gcc tgt tca cac atg tct gtg tat gct gtc tat gct cgg 1812Val Glu Cys Ala Cys Ser His Met Ser Val Tyr Ala Val Tyr Ala Arg530 535 540act gac aac ttg tct tca tac aat gaa gcc ttc ttc act tct gga ttt 1860Thr Asp Asn Leu Ser Ser Tyr Asn Glu Ala Phe Phe Thr Ser Gly Phe545 550 555 560ata tgt atc tca ggt ctt tgc ttg gct gtt ctt tcc cat atc ttc tgt 1908Ile Cys Ile Ser Gly Leu Cys Leu Ala Val Leu Ser His Ile Phe Cys565 570 575gcc agg tac tcc atg ttt gca gct aaa ctt ctg act cac atg atg gca 1956Ala Arg Tyr Set Met Phe Ala Ala Lys Leu Leu Thr His Met Met Ala580 585 590gcc agc tta ggt aca cag att cta ttt ctg gcg tct gca tac gca agt 2004Ala Ser Leu Gly Thr Gln Ile Leu Phe Leu Ala Ser Ala Tyr Ala Ser595 600 605ccc caa ctc gct gag gag agc tgt tca gct atg gct gct gtc aca cat 2052Pro Gln Leu Ala Glu Glu Ser Cys Ser Ala Met Ala Ala Val Thr His610 615 620tac ctg tat ctt tgc cag ttt agc tgg atg ctc att cag tct gtg aat 2100Tyr Leu Tyr Leu Cys Gln Phe Ser Trp Met Leu Ile Gln Ser Val Asn625 630 635 640ttc tgg tac gtg ctg gtg atg aat gat gag cac aca gag agg cga tat 2148Phe Trp Tyr Val Leu Val Met Asn Asp Glu His Thr Glu Arg Arg Tyr645 650 655ctg ctg ttt ttc ctt ctg agt tgg gga cta cca gct ttt gtg gtg att 2196Leu Leu Phe Phe Leu Leu Ser Trp Gly Leu Pro Ala Phe Val Val Ile660 665 670ctc ctc ata gtt att ttg aaa gga atc tat cat cag agc atg tca cag 2244Leu Leu Ile Val Ile Leu Lys Gly Ile Tyr His Gln Ser Met Ser Gln675 680 685atc tat gga ctc att cat ggt gac ctg tgt ttt att cca aac gtc tat 2292Ile Tyr Gly Leu Ile His Gly Asp Leu Cys Phe Ile Pro Asn Val Tyr690 695 700gct gct ttg ttc act gca gct ctt gtt cct ttg acg tgc ctc gtg gtg 2340Ala Ala Leu Phe Thr Ala Ala Leu Val Pro Leu Thr Cys Leu Val Val705 710 715 720gtg ttc gtg gtg ttc atc cat gcc tac cag gtg aag cca cag tgg aaa 2388Val Phe Val Val Phe Ile His Ala Tyr Gln Val Lys Pro Gln Trp Lys725 730 735gca tat gat gat gtc ttc aga gga agg aca aat gct gca gaa att cca 2436Ala Tyr Asp Asp Val Phe Arg Gly Arg Thr Asn Ala Ala Glu Ile Pro740 745 750ctg att tta tat ctc ttt gct ctg att tcc gtg aca tgg ctt tgg gga 2484Leu Ile Leu Tyr Leu Phe Ala Leu Ile Ser Val Thr Trp Leu Trp Gly755 760 765gga cta cac atg gcc tac aga cac ttc tgg atg ttg gtt ctc ttt gtc 2532Gly Leu His Met Ala Tyr Arg His Phe Trp Met Leu Val Leu Phe Val770 775 780att ttc aac agt ctg cag gga ctt tat gtt ttc atg gtt tat ttc att 2580Ile Phe Asn Ser Leu Gln Gly Leu Tyr Val Phe Met Val Tyr Phe Ile785 790 795 800tta cac aac caa atg tgt tgc cct atg aag gcc agt tac act gtg gaa 2628Leu His Asn Gln Met Cys Cys Pro Met Lys Ala Ser Tyr Thr Val Glu805 810 815atg aat ggg cat cct gga ccc agc aca gcc ttt ttc acg ccc ggg agt 2676Met Asn Gly His Pro Gly Pro Ser Thr Ala Phe Phe Thr Pro Gly Ser820 825 830gga atg cct cct gct gga ggg gaa atc atc aag tcc acc cag aat ctc 2724Gly Met Pro Pro Ala Gly Gly Glu Ile Ile Lys Ser Thr Gln Asn Leu835 840 845atc ggt gct atg gag aag gtg cca cct gac tgg gag aga gca tcc ttc 2772Ile Gly Ala Met Glu Lys Val Pro Pro Asp Trp Glu Arg Ala Ser Phe850 855 860caa cag ggc agt cag gcc agc cct gat tta aag cca agt cca caa aat 2820Gln Gln Gly Ser Gln Ala Ser Pro Asp Leu Lys Pro Ser Pro Gln Asn865 870 875 880gga gcc acg ttc ccg tcc tct gga gga tat ggc cag ggg tca ctg ata 2868Gly Ala Thr Phe Pro Ser Ser Gly Gly Tyr Gly Gln Gly Ser Leu Ile885 890 895gcc gat gag gag tcc cag gag ttt gat gat tta ata ttt gca tta aaa 2916Ala Asp Glu Glu Ser Gln Glu Phe Asp Asp Leu Ile Phe Ala Leu Lys900 905 910act ggt gct ggt ctc agt gtc agt gat aat gaa tct ggt caa ggc agc2964Thr Gly Ala Gly Leu Ser Val Ser Asp Asn Glu Ser Gly Gln Gly Ser915 920 925cag gag ggg ggc acc ttg act gac tcc cag atc gtg gag ctc agg agg3012Gln Glu Gly Gly Thr Leu Thr Asp Ser Gln Ile Val Glu Leu Arg Arg930 935 940ata ccc atc gcc gac act cac ctg tag cacctcacta accattcgac 3059Ile Pro Ile Ala Asp Thr His Leu945 950tgagcacact ttcatatttg tatcagcttt tgtgctaaaa ctctctaagt acatccacct 3119gtgtaatagg aacctgtgaa ttgtactgga tgattaatac aaacgtgatt gttgtatttg 3179gagtataaat tactgattgt atgtgacctg aaaattcact gctataagaa aggtggagtc 3239agtttgtatc agttaatagg atgttcatat tccaaggata ttagttgttt ttttaatcat 3299cctatatggc taacattgtt taatgaaagt aataatcaat aaagcaatag aa 3351<210>2<211>952<212>PRT<213>Homo sapiens<400>2Met Val Ile Ile Thr Gly Ser Asp Leu His Asn Gly Ile Ile Gly Phe1 5 10 15Ser Glu Glu Ser Gln Ser Gly Leu Glu Leu Arg Glu Gly Ala Val Met20 25 30Arg Arg Leu His Leu Ile Val Thr Arg Gln Pro Asn Arg Ala Phe Glu35 40 45Asp Val Lys Val Phe Trp Arg Val Thr Leu Asn Lys Thr Val Val Val50 55 60Leu Gln Lys Asp Gly Val Asn Leu Met Glu Glu Leu Gln Ser Val Ser65 70 75 80Gly Thr Thr Thr Cys Thr Met Gly Gln Thr Lys Cys Phe Ile Ser Ile85 90 95Glu Leu Lys Pro Glu Lys Val Pro Gln Val Glu Val Tyr Phe Phe Val100 105 110Glu Leu Tyr Glu Ala Thr Ala Gly Ala Ala Ile Asn Asn Ser Ala Arg115 120 125Phe Ala Gln Ile Lys Ile Leu Glu Ser Asp Glu Ser Gln Ser Leu Val130 135 140Tyr Phe Ser Val Gly Ser Arg Leu Ala Val Ala His Lys Lys Ala Thr145 150 155 160Leu Ile Ser Leu Gln Val Ala Arg Asp Ser Gly Thr Gly Leu Met Met165 170 175Ser Val Asn Phe Ser Thr Gln Glu Leu Arg Ser Ala Glu Thr Ile Gly180 185 190Arg Thr Ile Ile Ser Pro Ala Ile Ser Gly Lys Asp Phe Val Ile Thr195 200 205Glu Gly Thr Leu Val Phe Glu Pro Gly Gln Arg Ser Thr Val Leu Asp210 215 220Val Ile Leu Thr Pro Glu Thr Gly Ser Leu Asn Ser Phe Pro Lys Arg225 230 235 240Phe Gln Ile Val Leu Phe Asp Pro Lys Gly Gly Ala Arg Ile Asp Lys245 250 255Val Tyr Gly Thr Ala Asn Ile Thr Leu Val Ser Asp Ala Asp Ser Gln260 265 270Ala Ile Trp Gly Leu Ala Asp Gln Leu His Gln Pro Val Asn Asp Asp275 280 285Ile Leu Asn Arg Val Leu His Thr Ile Ser Met Lys Val Ala Thr Glu290 295 300Asn Thr Asp Glu Gln Leu Ser Ala Met Met His Leu Ile Glu Lys Ile305 310 315 320Thr Thr Glu Gly Lys Ile Gln Ala Phe Ser Val Ala Ser Arg Thr Leu325 330 335Phe Tyr Glu Ile Leu Cys Ser Leu Ile Asn Pro Lys Arg Lys Asp Thr340 345 350Arg Gly Phe Ser His Phe Ala Glu Val Thr Glu Asn Phe Ala Phe Ser355 360 365Leu Leu Thr Asn Val Thr Cys Gly Ser Pro Gly Glu Lys Ser Lys Thr370 375 380Ile Leu Asp Ser Cys Pro Tyr Leu Ser Ile Leu Ala Leu His Trp Tyr385 390 395 400Pro Gln Gln Ile Asn Gly His Lys Phe Glu Gly Lys Glu Gly Asp Tyr405 410 415Ile Arg Ile Pro Glu Arg Leu Leu Asp Val Gln Asp Ala Glu Ile Met420 425 430Ala Gly Lys Ser Thr Cys Lys Leu Val Gln Phe Thr Glu Tyr Ser Ser435 440 445Gln Gln Trp Phe Ile Ser Gly Asn Asn Leu Pro Thr Leu Lys Asn Lys450 455 460Val Leu Ser Leu Ser Val Lys Gly Gln Ser Ser Gln Leu Leu Thr Asn465 470 475 480Asp Asn Glu Val Leu Tyr Arg Ile Tyr Ala Ala Glu Pro Arg Ile Ile485 490 495Pro Gln Thr Ser Leu Cys Leu Leu Trp Asn Gln Ala Ala Ala Ser Trp500 505 510Leu Ser Asp Ser Gln Phe Cys Lys Val Val Glu Glu Thr Ala Asp Tyr
515 520 525Val Glu Cys Ala Cys Ser His Met Ser Val Tyr Ala Val Tyr Ala Arg530 535 540Thr Asp Asn Leu Ser Ser Tyr Asn Glu Ala Phe Phe Thr Ser Gly Phe545 550 555 560Ile Cys Ile Ser Gly Leu Cys Leu Ala Val Leu Ser His Ile Phe Cys565 570 575Ala Arg Tyr Ser Met Phe Ala Ala Lys Leu Leu Thr His Met Met Ala580 585 590Ala Ser Leu Gly Thr Gln Ile Leu Phe Leu Ala Ser Ala Tyr Ala Ser595 600 605Pro Gln Leu Ala Glu Glu Ser Cys Ser Ala Met Ala Ala Val Thr His610 615 620Tyr Leu Tyr Leu Cys Gln Phe Ser Trp Met Leu Ile Gln Ser Val Asn625 630 635 640Phe Trp Tyr Val Leu Val Met Asn Asp Glu His Thr Glu Arg Arg Tyr645 650 655Leu Leu Phe Phe Leu Leu Ser Trp Gly Leu Pro Ala Phe Val Val Ile660 665 670Leu Leu Ile Val Ile Leu Lys Gly Ile Tyr His Gln Ser Met Ser Gln675 680 685Ile Tyr Gly Leu Ile His Gly Asp Leu Cys Phe Ile Pro Asn Val Tyr690 695 700Ala Ala Leu Phe Thr Ala Ala Leu Val Pro Leu Thr Cys Leu Val Val705 710 715 720Val Phe Val Val Phe Ile His Ala Tyr Gln Val Lys Pro Gln Trp Lys725 730 735Ala Tyr Asp Asp Val Phe Arg Gly Arg Thr Asn Ala Ala Glu Ile Pro740 745 750Leu Ile Leu Tyr Leu Phe Ala Leu Ile Ser Val Thr Trp Leu Trp Gly755 760 765Gly Leu His Met Ala Tyr Arg His Phe Trp Met Leu Val Leu Phe Val770 775 780Ile Phe Asn Ser Leu Gln Gly Leu Tyr Val Phe Met Val Tyr Phe Ile785 790 795 800Leu His Asn Gln Met Cys Cys Pro Met Lys Ala Ser Tyr Thr Val Glu805 810 815Met Asn Gly His Pro Gly Pro Ser Thr Ala Phe Phe Thr Pro Gly Ser820 825 830Gly Met Pro Pro Ala Gly Gly Glu Ile Ile Lys Ser Thr Gln Asn Leu835 840 845Ile Gly Ala Met Glu Lys Val Pro Pro Asp Trp Glu Arg Ala Ser Phe850 855 860Gln Gln Gly Ser Gln Ala Ser Pro Asp Leu Lys Pro Ser Pro Gln Asn865 870 875 880Gly Ala Thr Phe Pro Ser Ser Gly Gly Tyr Gly Gln Gly Ser Leu Ile885 890 895Ala Asp Glu Glu Ser Gln Glu Phe Asp Asp Leu Ile Phe Ala Leu Lys900 905 910Thr Gly Ala Gly Leu Ser Val Ser Asp Asn Glu Ser Gly Gln Gly Ser915 920 925Gln Glu Gly Gly Thr Leu Thr Asp Ser Gln Ile Val Glu Leu Arg Arg930 935 940Ile Pro Ile Ala Asp Thr His Leu945 950<210>3<211>23<212>DNA<213>Homo sapiens<400>3gaagaacaaa ctcttaccct tat23<210>4<211>23<212>DNA<213>Homo sapiens<400>4ttctattgct ttattgatta tta23<210>5<211>33<212>DNA<213>Homo sapiens<400>5cccggatcca tggttattat tacagggagt gac33<210>6<211>33<212>DNA<213>Homo sapiens<400>6cccctcgagc tcagtcgaat ggttagtgag gag3權(quán)利要求
1.一種分離的多肽-人轉(zhuǎn)座酶105,其特征在于它包含有<210>2所示的氨基酸序列的多肽、或其多肽的活性片段、類似物或衍生物。
2.如權(quán)利要求1所述的多肽,其特征在于所述多肽、類似物或衍生物的氨基酸序列具有與<210>2所示的氨基酸序列至少95%的相同性。
3.如權(quán)利要求2所述的多肽,其特征在于它包含具有<210>2所示的氨基酸序列的多肽。
4.一種分離的多核苷酸,其特征在于所述多核苷酸包含選自下組中的一種(a)編碼具有<210>2所示氨基酸序列的多肽或其片段、類似物、衍生物的多核苷酸;(b)與多核苷酸(a)互補的多核苷酸;或(c)與(a)或(b)有至少98%相同性的多核苷酸。
5.如權(quán)利要求4所述的多核苷酸,其特征在于所述多核苷酸包含編碼具有<210>2所示氨基酸序列的多核苷酸。
6.如權(quán)利要求4所述的多核苷酸,其特征在于所述多核苷酸的序列包含有<210>1中181-3039位的序列或<210>1中1-3351位的序列。
7.一種含有外源多核苷酸的重組載體,其特征在于它是由權(quán)利要求4-6中的任一權(quán)利要求所述多核苷酸與質(zhì)粒、病毒或運載體表達載體構(gòu)建而成的重組載體。
8.一種含有外源多核苷酸的遺傳工程化宿主細胞,其特征在于它是選自于下列一種宿主細胞(a)用權(quán)利要求7所述的重組載體轉(zhuǎn)化或轉(zhuǎn)導(dǎo)的宿主細胞;或(b)用權(quán)利要求4-6中的任一權(quán)利要求所述多核苷酸轉(zhuǎn)化或轉(zhuǎn)導(dǎo)的宿主細胞。
9.一種具有人轉(zhuǎn)座酶105活性的多肽的制備方法,其特征在于所述方法包括(a)在表達人轉(zhuǎn)座酶105條件下,培養(yǎng)權(quán)利要求8所述的工程化宿主細胞;(b)從培養(yǎng)物中分離出具有人轉(zhuǎn)座酶105活性的多肽。
10.一種能與多肽結(jié)合的抗體,其特征在于所述抗體是能與人轉(zhuǎn)座酶105特異性結(jié)合的抗體。
11.一類模擬或調(diào)節(jié)多肽活性或表達的化合物,其特征在于它們是模擬、促進、拮抗或抑制人轉(zhuǎn)座酶105的活性的化合物。
12.如權(quán)利要求11所述的化合物,其特征在于它是<210>1所示的多核苷酸序列或其片段的反義序列。
13.一種權(quán)利要求11所述化合物的應(yīng)用,其特征在于所述化合物用于調(diào)節(jié)人轉(zhuǎn)座酶105在體內(nèi)、體外活性的方法。
14.一種檢測與權(quán)利要求1-3中的任一權(quán)利要求所述多肽相關(guān)的疾病或疾病易感性的方法,其特征在于其包括檢測所述多肽的表達量,或者檢測所述多肽的活性,或者檢測多核苷酸中引起所述多肽表達量或活性異常的核苷酸變異。
15.如權(quán)利要求1-3中的任一權(quán)利要求所述多肽的應(yīng)用,其特征在于它應(yīng)用于篩選人轉(zhuǎn)座酶105的模擬物、激動劑,拮抗劑或抑制劑;或者用于肽指紋圖譜鑒定。
16.如權(quán)利要求4-6中的任一權(quán)利要求所述的核酸分子的應(yīng)用,其特征在于它作為引物用于核酸擴增反應(yīng),或者作為探針用于雜交反應(yīng),或者用于制造基因芯片或微陣列。
17.如權(quán)利要求1-6及11中的任一權(quán)利要求所述的多肽、多核苷酸或化合物的應(yīng)用,其特征在于用所述多肽、多核苷酸或其模擬物、激動劑、拮抗劑或抑制劑以安全有效劑量與藥學(xué)上可接受的載體組成作為診斷或治療與人轉(zhuǎn)座酶105異常相關(guān)的疾病的藥物組合物。
18.權(quán)利要求1-6及11中的任一權(quán)利要求所述的多肽、多核苷酸或化合物的應(yīng)用,其特征在于用所述多肽、多核苷酸或化合物制備用于治療如惡性腫瘤,血液病,HIV感染和免疫性疾病和各類炎癥的藥物。
全文摘要
本發(fā)明公開了一種多肽—人轉(zhuǎn)座酶105,編碼此多肽的多核苷酸和經(jīng)DNA重組技術(shù)產(chǎn)生這種多肽的方法。本發(fā)明還公開了此多肽用于治療多種疾病的方法,如惡性腫瘤,血液病,HIV感染和免疫性疾病和各類炎癥等。本發(fā)明還公開了抗此多肽的拮抗劑及其治療作用。本發(fā)明還公開了編碼這種新的人轉(zhuǎn)座酶105的多核苷酸的用途。
文檔編號C12N15/63GK1477194SQ0213662
公開日2004年2月25日 申請日期2002年8月23日 優(yōu)先權(quán)日2002年8月23日
發(fā)明者毛裕民, 謝毅 申請人:上海博德基因開發(fā)有限公司