專利名稱:新的dna分子的制作方法
技術(shù)領(lǐng)域:
本發(fā)明提供編碼結(jié)核分支桿菌RNA聚合酶δ亞單位的新的核酸分子。它也涉及這種核酸分子編碼的稱為SigA和SigB多肽,以及載體和用該核酸分子轉(zhuǎn)化的宿主細胞。本發(fā)明進一步提供了抑制δ亞單位和核心RNA聚合酶之間相互作用的化合物的篩選方法。
背景技術(shù):
基因轉(zhuǎn)錄成相應(yīng)的RNA分子是一個復(fù)雜的過程,它由DNA依賴性RNA聚合酶催化,并涉及許多不同的蛋白因子。在真細菌中,核心RNA聚合酶由比例為2∶1∶1的α,β和β′亞單位組成。為了指導(dǎo)RNA聚合酶到待轉(zhuǎn)錄的特異基因的啟動子,細菌產(chǎn)生多種稱為δ因子的蛋白,其與RNA聚合酶相互作用以形成有活性的全酶。所產(chǎn)生的復(fù)合物能識別和附著到啟動子中特異的核苷酸序列。
物理學測量表明δ亞單位結(jié)合至核心RNA聚合酶時誘導(dǎo)其構(gòu)型轉(zhuǎn)變。δ亞單位結(jié)合到核心酶,增加核心酶對DNA結(jié)合常數(shù)的好幾個數(shù)量級。(Chamberlin,M.J.(1974)生物化學綜述年刊43,721-)。
根據(jù)鑒定和測序不同生物來源的δ亞單位的特征描述將它們分為兩大類組I和組II。組Iδ也稱為δ70類或“管家”δ組。屬于該組的δ亞單位識別細胞中的相似啟動子序列。這些特性反映在種間是高度保守的蛋白質(zhì)的某些區(qū)域中。
細菌δ因子與真核細胞的轉(zhuǎn)錄因子沒有任何同源性,因而是抗菌化合物的潛在的靶子。δ亞單位的突變,影響了它的結(jié)合及賦予DNA序列對酶特異性的能力,已知其對細胞而言是致死性的。
結(jié)核分支桿菌是主要的肺部致病菌,它的特征是生長速度很慢。作為一種致病菌,它進入肺泡的巨噬細胞,在其吞噬體內(nèi)增殖,最終裂解細胞,經(jīng)血液不僅傳播至肺的其它區(qū)域,而且至肺外組織。因此病原菌在至少兩種完全不同的環(huán)境增殖,涉及利用不同營養(yǎng)物質(zhì)和多種可能的宿主因子;一種成功的感染涉及新的多套基因協(xié)調(diào)表達。這種調(diào)節(jié)類似不同的生理階段,以芽孢桿菌屬為最好例證,其不同階段特異的基因表達通過RNA聚合酶與不同δ因子結(jié)合而被轉(zhuǎn)錄。這提供了不僅定向結(jié)核分支桿菌的看家δ的可能性,而且定向不同感染和傳播階段的特異的δ亞單位的可能性。
附圖簡述
圖1質(zhì)粒pARC 8175圖譜圖2質(zhì)粒pARC 8176圖譜發(fā)明目的由于與特異性δ亞單位的結(jié)合對RNA聚合酶的特異性來說是至關(guān)重要的,因此該相關(guān)過程是藥物設(shè)計的適宜靶子。為了鑒定能抑制上述相關(guān)過程的化合物,鑒定δ亞單位的一級結(jié)構(gòu)是必要的。
因此本研究的目的在于提供δ亞單位的序列和結(jié)構(gòu)的信息,此信息將能夠篩選、鑒定和設(shè)計能與δ亞單位競爭結(jié)合核心RNA聚合酶的化合物,這些化合物可開發(fā)為有效的治療制劑。發(fā)明公開貫穿本描述,特別是在以下的實施例中,術(shù)語“標準方案”和“標準步驟”當用于上下文分子克隆技術(shù)時,應(yīng)理解為是通常能在普通實驗室手冊中查到的方案和步驟,如Sambrook J.,F(xiàn)ritsch,E.F.及Maniatis,T(1989)分子克隆實驗手冊,第二版,冷泉港實驗室出版社,冷泉港,紐約。
第一方面本發(fā)明提供了結(jié)構(gòu)分支桿菌RNA聚合酶的組Iδ亞單位的分離的多肽,或其有功能的等價修飾形式。
優(yōu)選的具有根據(jù)序列表中SEQ ID NO2或4的氨基酸序列的這種多肽經(jīng)重組DNA技術(shù)獲得,且在下文稱為SigA和SigB多肽,然而應(yīng)該明確的是根據(jù)本發(fā)明多肽并不嚴格局限于具有與序列表內(nèi)SEQ IDNO2或4相同的氨基酸序列的多肽。更有甚者本發(fā)明另外包括這些帶有修飾的天然多肽的修飾形式,如替代、小的缺失、插入或倒位,然而這些多肽基本上有結(jié)核分支桿菌δ亞單位的生物活性。這些生物活性包括與核心酶結(jié)合和/或賦予啟動子序列識別以及轉(zhuǎn)錄起始特性的能力。因而,包括在本發(fā)明中的有多肽,其氨基酸序列與列于序列表中SEQ IDNO2或4的氨基酸序列至少90%同源,優(yōu)選至少有95%同源。
另一方面本發(fā)明提供分離和純化的核酸分子,其具有編碼本發(fā)明的多肽即SigA或SigB多肽的核苷酸序列。在本發(fā)明的優(yōu)選形式中,上述核酸分子為DNA分子,其具有與序列表中SEQ ID NO1或3相同的核苷酸序列。然而,根據(jù)本發(fā)明的核酸分子并不嚴格局限于具有SEQID NO1或3所示序列的DNA分子。更有甚者,本發(fā)明包括帶有修飾的核酸分子,如替代、小的缺失、插入或倒位,然而其編碼基本具有根據(jù)本發(fā)明多肽的生物化學活性的蛋白。因此包括在本發(fā)明中有DNA分子,其核苷酸序列與列于序列表中SEQ ID NO1或3的核苷酸序列具有至少90%的同源性,優(yōu)選至少95%的同源性。
包括在本發(fā)明中也有這類DNA分子,其核苷酸序列因遺傳編碼簡并而成為SEQ ID NO1或3的核苷酸序列。三個核苷酸的序列組即為一個密碼子,編碼一個氨基酸。因有64個可能的密碼子,但僅有20個天然氨基酸,故大多數(shù)氨基酸由多個密碼子所編碼。遺傳密碼子的這種天然的簡并性或豐余性在本領(lǐng)域中眾所周知。因此應(yīng)理解序列表中所顯示的DNA序列,僅是大量但又確定的編碼上述多肽DNA序列中的一個實例。本發(fā)明因此包括選自下列來源的分離的核酸分子(a)包括在SEQ ID NO1或SEQ ID NO3中顯示的編碼結(jié)核分支桿菌RNA聚合酶組Iδ亞單位的核苷酸序列的DNA分子;(b)核酸分子,其包括能與(a)中定義的DNA分子多肽編碼區(qū)互補的核苷酸序列雜交的并且編碼結(jié)核分支桿菌組Iδ亞單位的多肽的核苷酸序列或其有功能的等價修飾形式;(c)核酸分子,其包括由于遺傳編碼的簡并而成為(a)或(b)中定義的核苷酸序列并且編碼結(jié)核分支桿菌組Iδ亞單位的核酸序列或其有功能的等價修飾形式。
術(shù)語“與核苷酸序列的雜交”應(yīng)理解為在本領(lǐng)域的技術(shù)人員熟知的嚴格條件下雜交到一段核苷酸序列或其特異性部分。
本發(fā)明的DNA分子可以是載體形式如可復(fù)制的表達載體,它能攜帶和介導(dǎo)根據(jù)本發(fā)明的DNA分子的表達。本文中“復(fù)制”意指該載體能在其被導(dǎo)入的給定類型宿主細胞中復(fù)制。載體的實例是病毒,例如嗜菌體、粘粒、質(zhì)粒和其它重組載體。用本領(lǐng)域眾所周知的方法將核酸分子插入載體基因組。根據(jù)本發(fā)明載體包括質(zhì)粒載體含有SigA基因的編碼序列pARC 8175(NCIMB 40738)或含SigB基因編碼序列的pARC 8176(NCIMB 40739)。
包含根據(jù)本發(fā)明載體的宿主細胞也包括在本發(fā)明之中。這種宿主細胞可以是原核細胞、單細胞的真核細胞或來自多細胞生物的細胞。因此宿主細胞可以是,如細菌如大腸桿菌細胞;來自酵母的細胞如啤酒糖酵母或巴斯德畢赤酵母;或哺乳動物細胞。載體有效地導(dǎo)入宿主細胞使用的方法是眾所周知的標準方法即重組DNA方法。
本發(fā)明更進一步的方面是關(guān)于本發(fā)明多肽的制備方法,包括在所述多肽產(chǎn)生的情況下培養(yǎng)以根據(jù)本發(fā)明的表達載體轉(zhuǎn)化的宿主細胞及回收該多肽。
用于培養(yǎng)細胞的培養(yǎng)基可以是適合此目的任何常規(guī)培養(yǎng)基。適宜的載體可以是上述任何載體,且合適的宿主細胞可以是上面已列出的任何類型細胞。構(gòu)建載體和有效將其導(dǎo)入宿主細胞使用的方法可以是在重組DNA領(lǐng)域中用于此目的已知的任何方法。依據(jù)細胞的類型和載體的組成,細胞表達的重組多肽能夠分泌即經(jīng)細胞膜輸出。
若該多肽由宿主細胞在細胞內(nèi)產(chǎn)生即不由細胞分泌,于是可用標準步驟回收,包括機械法使細胞裂解,例如超聲粉碎或勻漿,或通過酶或化學法,其后純化。
為達到分泌的目的,編碼多肽的DNA序列應(yīng)接上編碼信號肽的序列,信號肽的存在方可保證多肽由細胞分泌出來,從而至少表達多肽的重要部分分泌到培養(yǎng)基并回收。
本發(fā)明的另一重要方面是測定化合物的方法,此化合物具有抑制劑δ亞單位與結(jié)核分支桿菌RNA聚合酶結(jié)合的能力,所述方法包括使用重組SigA或SigB多肽或上述定義的核酸分子。這種方法優(yōu)選包括(i)待檢測的用于該抑制能力的化合物與上述SigA或SigB多肽和結(jié)核分支桿菌核心RNA聚合酶接觸;和(ii)檢測是否上述多肽與該核心RNA聚合酶結(jié)合形成RNA聚合酶全酶。術(shù)語“核心RNA聚合酶”應(yīng)理解為是一種至少包含α,β和β′亞單位但不包括δ亞單位的RNA聚合酶。術(shù)語“RNA聚合酶全酶”應(yīng)理解為是一種至少包含α、β、β′和δ亞單位。如需要,δ亞單位多肽可被標記,例如用適宜的放射性分子如35S或125I標記。
Lesley等發(fā)表了測定δ多肽是否與核心RNA聚合酶結(jié)合的適宜方法(生物化學28,7728-7734,1989)。這方法是基于δ多肽與核心RNA聚合酶結(jié)合后與未結(jié)合多肽的大小差異。用層析法可分離出不同大小的兩種形式,如用凝膠過濾柱如Waters Protein Pok300SW大小柱。洗脫過柱后這兩種形式可用已知的如閃爍計數(shù)或SDS-聚丙烯酰胺凝膠電泳接著以免疫印跡法檢測和定量。
根據(jù)Lesley等(上述)描述的另一種方法,用一種與RNA聚合酶結(jié)合抗體的免疫沉淀法來檢測RNA聚合酶全酶。來源于生物體如大腸桿菌、結(jié)核分支桿菌或包皮垢分支桿菌的核心RNA聚合酶能與放射性標記的SigA或SigB多肽反應(yīng)。這種反應(yīng)混合物用福爾馬林處理的金黃色葡萄球菌細胞懸液處理,用抗RNA聚合酶抗體進行預(yù)處理。洗滌細胞懸液去除未結(jié)合蛋白,重懸于SDS-聚丙烯酰胺凝膠電泳上樣緩沖液中并用SDS-聚丙烯酰胺凝膠電泳分離。結(jié)合的SigA或SigB多肽用放射自顯影,其后閃爍計數(shù)來檢測。
另一種用來分析抑制δ亞單位依賴性結(jié)核分支桿菌RNA聚合酶轉(zhuǎn)錄的化合物的方法包括(i)用于所述抑制能力的待測化合物與本發(fā)明的多肽、結(jié)核分支桿菌RNA聚合酶和具有開放連接到當結(jié)合至所述多肽時能由該核心RNA聚合酶識別啟動子序列的編碼序列的DNA接觸,上述接觸在當結(jié)核分支桿菌RNA聚合酶與上述啟動子結(jié)合時,在上述編碼序列轉(zhuǎn)錄適宜條件下完成;和(ii)檢測相應(yīng)于上述編碼序列的mRNA的形成。
這種檢定是基于這樣的事實大腸桿菌共同的啟動子序列,若核心RNA聚合酶缺乏δ亞單位是不可轉(zhuǎn)錄的。然而如加入Sigma70蛋白將能使該復(fù)合物識別特異的啟動子并起始轉(zhuǎn)錄。因此用含有適宜啟動子的DNA作為模板,監(jiān)測形成特異長度的mRNA可完成篩選具有抑制δ依賴的轉(zhuǎn)錄能力的化合物。通過測量游離3H-UTP摻入可沉淀TCA計數(shù)和測定特異轉(zhuǎn)錄本的長度來監(jiān)測轉(zhuǎn)錄(Ashok kumar et al.(1994)分子生物學雜志235,405-413;Kajitani,M.and Ishihama,A.(1983)核酸研究11,671-686和3873-3888)。用這種分析方法鑒定的化合物可抑制不同機制的轉(zhuǎn)錄,如(a)與δ蛋白結(jié)合并阻止其與核心RNA聚合酶結(jié)合;(b)與核心RNA聚合酶結(jié)合并從空間上抑制δ蛋白的結(jié)合;或(c)抑制轉(zhuǎn)錄中起始或延伸的中間步驟。本發(fā)明進一步的方面為檢測結(jié)核分支桿菌RNA聚合酶δ亞單位的蛋白結(jié)構(gòu)的方法,其特征在于SigA或SigB多肽用于X射線晶體衍射分析,晶體形成中SigA或SigB多肽的應(yīng)用有助于一種基于X射線晶體衍射分析的具有治療作用的化合物的合理設(shè)計,該化合物抑制Sigma70蛋白與核心RNA聚合酶之間相互作用,或者抑制與核心RNA聚合酶結(jié)合的δ70蛋白在基因轉(zhuǎn)錄過程中結(jié)合DNA。
實施例實施例1與Sigma70基因同源的結(jié)核分支桿菌DNA序列的鑒定1.1.推斷性Sigma70同源物的PCR擴增以下PCR引物是基于枯草芽孢桿菌Sigma70(Sigma70的同源物)和大腸桿菌Sigma70的保守氨基酸序列而設(shè)計的(Gitt,M.A.等.(1985)生物化學雜志260,7178-7185)。正向引物(SEQ ID NO5)5′-AAG TTC AGC ACG TAC GCC ACG TGG TGG ATC-3′C G C反向引物(SEQ ID NO6)5′-CTT GGC CTC GAT CTG GCG GAT GCG CTC-3C C C在一些位置所示的可選核苷酸表明該引物是簡并性引物,它適合于未確定基因的擴增。
結(jié)核分支桿菌H37RV(ATCC 27294)染色體DNA的制備遵循標準方法。一段長約500bp DNA片段的PCR擴增在下述條件下完成退火+55℃ 1分鐘變性+93℃ 1分鐘延伸+73℃ 2分鐘1.2.結(jié)核分支桿菌DNA的Southern雜交結(jié)核分支桿菌H37RV(ATCC 27294)結(jié)核分支桿菌H37RA及包皮垢分支桿菌染色體DNA用標準方法制備,并用限制酶SalI限制性酶切。DNA片段用1%凝膠電泳分離并轉(zhuǎn)移至尼龍膜上用標準方法進行“Southern印跡”分析。膜以上述PCR產(chǎn)生的帶自放射標記的500bp DNA片段為探針,來檢測同源片段。
Southern雜交試驗分析表明在用SalI消化的兩個結(jié)核分支桿菌株都存在至少三條雜交片段,分別約為4.2,2.2及0.9kb。在包皮垢分支桿菌,可檢出4.2及2.2kb二條雜交片段。由此得出結(jié)論有多條DNA片段與已知Sigma70基因同源。
用結(jié)核分支桿菌的四種不同臨床分離物進行類似Southern雜交實驗,顯示相同的結(jié)果,提示類似基因也存在于結(jié)核分支桿菌其它毒性分離物中。實施例2推斷性Sigma70的同源物的克隆2.1.結(jié)核分支桿菌SigA的克隆采用下述標準方法以上述500bp PCR探針篩選結(jié)核分支桿菌Erdman菌株的染色體DNA的λgt11文庫(來自WHO)。一個含有4.7kbEcoRI插入子的λgt11噬菌體被鑒定并確認可與PCR探針雜交。該4.7kb插入子的限制酶分析,揭示它具有內(nèi)在的與PCR探針雜交的2.2kb SalI片段。
4.7片段用EcoRI限制酶從λgt11 DNA中切除,亞克隆至克隆載體pBR322,獲得重組質(zhì)粒pARC8175(圖1)(NCIMB 40738)。
在2.2kb SalI片段上的推斷性Sigma70同源物稱為結(jié)核分支桿菌SigA,發(fā)現(xiàn)SigA基因編碼序列具有內(nèi)在的SalI位點,這就可以解釋在Southern實驗中0.9kb片段的雜交帶。2.2.結(jié)核分支桿菌SigB的克隆結(jié)核分支桿菌H37Rv DNA用SalI限制性酶切且DNA片段用制備瓊脂糖凝膠電泳分離。切除4.0至5.0kb區(qū)域的凝膠塊,用標準方法提取凝膠塊中的DNA。該DNA連接至克隆載體pBR329的SalI位點,連接的DNA轉(zhuǎn)化至大腸桿菌DH5α以獲得亞基因文庫。亞基因庫轉(zhuǎn)化子用PCR產(chǎn)生的500bp探針用標準方法進行菌落印跡鑒定。分析單個轉(zhuǎn)化子菌落的質(zhì)粒圖譜。用限制酶圖譜分析詳細含有所需質(zhì)粒大小的重組質(zhì)粒中的其中一個質(zhì)粒并發(fā)現(xiàn)其含有所需4.2kb SalI DNA片段。在4.2kb插入點帶有SigB基因的質(zhì)粒命名為pARC 8176(圖2)(NCIMB40739)。實施例3結(jié)核分支桿菌SigA和SigB基因核苷酸序列3.1.SigA核苷酸序列預(yù)期含有全部SigA基因的EcoRV-EcoRI DNA片段亞克隆至適宜的M13載體且基因每條鏈用雙脫氧法測序。所得序列列于序列表中SEQ ID NO1。編碼526個氨基酸蛋白的1580個核苷酸(SEQ IDNO1中位置70至1620)開放閱讀框(ORF)由DNA序列中得到預(yù)測。N-末端氨基酸根據(jù)開放閱讀框架頭一個GTG(啟始密碼子)嘗試性設(shè)定。
基因產(chǎn)物SigA(SEQ ID NO1)衍生的氨基酸序列具有與大腸桿菌Sigma7060%的一致性和與天青藍鏈霉菌的HrdB序列70%的一致性。全面分析SigA的序列,其與不同生物體所見的Sigma70蛋白類似。本分析包含具有高度保守的C-末端部分,而N-末端部分一般顯示更少的同源性。這兩個區(qū)域被一段不同長度的且一般在蛋白中罕見的氨基酸連接。SigA序列有相似的結(jié)構(gòu),其非保守中心片段相當于SEQID NO2中270-306位的氨基酸。
N-末端的部分與大腸桿菌Sigma70具有有限的同源性,但其類似于天青藍鏈霉菌HrdB的Sigma70同源物的N-末端部分。天青藍鏈霉菌的3.1,3.2,4.1及4.2區(qū)域高度保守結(jié)構(gòu)域單元可能參與DNA結(jié)合(Lonetto,M.等(1992)細菌學雜志174,3843-3849),在結(jié)核分支桿菌SigA序列中發(fā)現(xiàn)近乎相同的結(jié)構(gòu)域單元。蛋白質(zhì)N-末端起點基于與天青藍鏈霉菌HrdB序列的同源結(jié)構(gòu)域單元而嘗試性設(shè)定。
SigA及SigB氨基酸序列與已知Sigma70序列的全序列相似性提示結(jié)核分支桿菌SigA應(yīng)劃為組I Sigma70蛋白。然而,SigA與已知Sigma70蛋白有明顯的不同,尤其是一段獨特而長的N-末端氨基酸(SEQ IDNO2中24至263位),該片段在識別及從結(jié)核分支桿菌啟動子序列起始轉(zhuǎn)錄中是至關(guān)重要的。3.2.SigB的核苷酸序列SigB基因核苷酸序列(SEQ ID NO3)編碼323個氨基酸(SEQ ID NO4)。蛋白N-末端起始部位基于開放閱讀框中第一個氨基酸存在而被嘗試性鑒定。這個開放閱讀框架因此估計在SEQID NO3中起始于325位并終止于1293位。SigB基因氨基酸序列與其它Sigma70蛋白的序列比較使SigB基因歸入組I Sigma70蛋白家族?;虍a(chǎn)物SigB的全部結(jié)構(gòu)與前述SigA同樣類型。然而,SigB序列與SigA序列僅有60%同源性,不僅在蛋白的非保守區(qū)存在許多差異而且在SigB蛋白的推斷性DNA結(jié)合部位也存在很多差異。這些特性提示SigB蛋白在生物體生理學上有獨特的功能。實施例4SigA和SigB的表達4.1.結(jié)核分支桿菌SigA基因在大腸桿菌中的表達SigA基因N-末端部分用下列引物進行PCR擴增正向引物(SEQ ID NO7),包含一個NcoI位點66核苷酸-----------------80核苷酸| |5′-TT CC ATG GGG TAT GTG GCA GCG ACC-3′M G Y V A A T反向引物(SEQ ID NO7)5′-GTA CAG GCC AGC CTC GAT CCG CTT GGC-3′(a)從SigA基因構(gòu)建體pARC 8175中擴增出一長約750bp片段。擴增產(chǎn)物用NcoI及BamHI限制酶切以獲得163bp片段。
(b)用BamHI及EcoRV酶切pARC 8175獲1400bp DNA片段。
(c)表達質(zhì)粒pET 8ck,是一種pET 8c(Studier,F(xiàn).W.等(1990)酶學方法185,61-89)的衍生物,其中β-半乳糖基因由帶有卡那霉素抗性基因所替代,其用NcoI和EcoRV酶切并純化長約4.2kb片段。
這三個片段(a)、(b)和(c)用標準方法連接,產(chǎn)物轉(zhuǎn)化至大腸桿菌DH5α。單個轉(zhuǎn)化子用下述標準方法篩選質(zhì)粒圖譜。轉(zhuǎn)化子根據(jù)預(yù)期質(zhì)粒大小(大約6.35kb)和質(zhì)粒的限制酶作圖鑒定。帶有SigA編碼片段的重組質(zhì)粒命名為pARC 8171。
質(zhì)粒pARC 8174轉(zhuǎn)化進T7表達宿主大腸桿菌BL21(DE3),篩選存在6.35kb質(zhì)粒單個轉(zhuǎn)化子,并由限制酶分析證實。轉(zhuǎn)化子之一培養(yǎng)于37℃并用標準方法用1mM異丙基-β-D-硫代吡喃半乳糖苷(IPTG)誘導(dǎo)在表達條件下誘導(dǎo)出一個特異的90kDa蛋白。細胞用低速離心收集并在pH7.4磷酸緩沖液中超聲法裂解細胞。裂解物100,000×g離心分成上清及沉淀。用IPTG誘導(dǎo)后獲得的大部分70kDa產(chǎn)物存在于沉淀中,提示該蛋白質(zhì)形成包含體。
為了提純誘導(dǎo)的SigA基因產(chǎn)物,上述獲得的細胞裂解物用BeckmanJA21轉(zhuǎn)頭1000rpm離心15分鐘澄清。上清液置于15-60%蔗糖梯度液中,100,000×g離心60分鐘,包含體從60%蔗糖墊層中沉淀出來。沉淀溶于6M鹽酸胍,繼而通過含有遞減濃度的鹽酸胍緩沖液透析而去除。透析液含75%豐度的SigA蛋白,其基本上延用Brokhov,S.和Goldfarb,A.(1993)蛋白表達和純化,vol.4,503-511描述的純化大腸桿菌Sigma70的方法進行純化。4.2.結(jié)核分支桿菌SigB基因在大腸桿菌中表達SigB基因產(chǎn)物表達并從包含體中將其純化。SigB基因編碼序列用下列引物進行PCR擴增正向引物(SEQ ID NO9),包含一個NcoI限制酶位點5′-TTTC ATG CGG GAT GCA CCC ACA AGG GCC-3′M A D A P T R A反向引物(SEQ ID NO10)包含一個EcoRI限制酶位點5′-CTT GAA TTC AGC TGG CGT ACG ACC GCA-3′擴增出的920bp片段用EcoRI及NcoI消化,并連接至經(jīng)EcoRI及NcoI消化的pRSETB上(Kroll等.(1993)DNA和細胞生物學12,441)。連接混合物轉(zhuǎn)化入大腸桿菌DH5α。篩選單個轉(zhuǎn)化子用于質(zhì)粒圖譜及限制酶分析。具有預(yù)期質(zhì)粒圖譜的重組質(zhì)粒命名為pARC 8193。
含有pARC 8193的大腸桿菌DH5α在含50μg/ml氨芐青霉素的LB中培養(yǎng)至OD值為0.5,按標準方法37℃時以1mM IPTG誘導(dǎo)。誘導(dǎo)的SigB蛋白獲得的是包含體,采用與所述SigA蛋白相同的方法變性、復(fù)性。純化的SigB蛋白具有>90%的均一性,適于用作轉(zhuǎn)錄分析。微生物的保藏下述質(zhì)粒遵循布達佩斯條約保藏于國立工業(yè)和海洋微生物保藏有限公司(NCIMB),阿伯丁,蘇格蘭,聯(lián)合王國。質(zhì)粒 登記號 保藏日期pARC 8175NCIMB 407381995年6月15日pARC 8176NCIMB 407391995年6月15日序列表(1)一般信息(i)申請人(A)姓名Astra AB(B)大街Vastra Malarehamnen 9(C)國家瑞典(E)郵政編碼S-15185(G)電話+46-8-55326000(H)傳真+46-8-55328820(I)電報19237 astras(ii)發(fā)明題目新的DNA分子(iii)序列數(shù)目10(vi)計算機可讀方式(A)媒介物形式軟盤(B)計算機IBM PC兼容機(C)操作系統(tǒng)PC-DOS/MC-DOS(D)軟件PatentIn Release#1.0,Varsion#1.30(EPO)(2)SEQ ID NO1信息(i)序列特征(A)長度1724堿基對(B)類型核苷酸(C)鏈型雙鏈(D)拓撲學線性(vi)最初來源(A)生物體結(jié)核分支桿菌(B)株Erdman菌株(vii)直接來源(B)克隆pARC 8175(ix)特征(A)名稱/鍵CDS(B)位置70..1653(xi)序列描述SEQ ID NO1AACTAGCAGA CACTTTCGGT TACGCACGCC CAGACCCAAC CGGAAGTGAG TAACGACCGA 60AGGGTGTAT GTG GCA GCG ACC AAA GCA AGC ACG GCG ACC GAT GAG CCG 108Val Ala Ala Thr Lys Ala Ser Thr Ala Thr Asp Glu Pro1 5 10GTA AAA CGC ACC GCC ACC AAG TCG CCC GCG GCT TCC GCG TCC GGG GCC156Val Lys Arg Thr Ala Thr Lys Ser Pro Ala Ala Ser Ala Ser Gly Ala15 20 25AAG ACC GGC GCC AAG CGA ACA GCG GCG AAG TCC GCT AGT GGC TCC CCA204Lys Thr Gly Ala Lys Arg Thr Ala Ala Lys Ser Ala Ser Gly Ser Pro30 35 40 45CCC GCG AAG CGG GCT ACC AAG CCC GCG GCC CGG TCC GTC AAG CCC GCC252Pro Ala Lys Arg Ala Thr Lys Pro Ala Ala Arg Ser Val Lys Pro Ala50 55 60TCG GCA CCC CAG GAC ACT ACG ACC AGC ACC ATC CCG AAA AGG AAG ACC300Ser Ala Pro Gln Asp Thr Thr Thr Ser Thr Ile Pro Lys Arg Lys Thr65 70 75CGC GCC GCG GCC AAA TCC GCC GCC GCG AAG GCA CCG TCG GCC CGC GGC348Arg Ala Ala Ala Lys Ser Ala Ala Ala Lys Ala Pro Ser Ala Arg Gly80 85 90CAC GCG ACC AAG CCA CGG GCG CCC AAG GAT GCC CAG CAC GAA GCC GCA396His Ala Thr Lys Pro Arg Ala Pro Lys Asp Ala Gln His Glu Ala Ala95 100 105ACG GAT CCC GAG GAC GCC CTG GAC TCC GTC GAG GAG CTC GAC GCT GAA444Thr Asp Pro Glu Asp Ala Leu Asp Ser Val Glu Glu Leu Asp Ala Glu110 115 120 125CCA GAC CTC GAC GTC GAG CCC GGC GAG GAC CTC GAC CTT GAC GCC GCC492Pro Asp Leu Asp Val Glu Pro Gly Glu Asp Leu Asp Leu Asp Ala Ala130 135 140GAC CTC AAC CTC GAT GAC CTC GAG GAC GAC GTG GCG CCG GAC GCC GAC540Asp Leu Asn Leu Asp Asp Leu Glu Asp Asp Val Ala Pro Asp Ala Asp145 150 155GAC GAC CTC GAC TCG GGC GAC GAC GAA GAC CAC GAA GAC CTC GAA GCT588Asp Asp Leu Asp Ser Gly Asp Asp Glu Asp His Glu Asp Leu Glu Ala160 165 170GAG GCG GCC GTC GCG CCC GGC CAG ACC GCC GAT GAC GAC GAG GAG ATC636Glu Ala Ala Val Ala Pro Gly Gln Thr Ala Asp Asp Asp Glu Glu Ile175 180 185GCT GAA CCC ACC GAA AAG GAC AAG GCC TCC GGT GAT TTC GTC TGG GAT684Ala Glu Pro Thr Glu Lys Asp Lys Ala Ser Gly Asp Phe Val Trp Asp190 195 200 205GAA GAC GAG TCG GAG GCC CTG CGT CAA GCA CGC AAG GAC GCC GAA CTC732Glu Asp Glu Ser Glu Ala Leu Arg Gln Ala Arg Lys Asp Ala Glu Leu210 215 220ACC GCA TCC GCC GAC TCG GTT CGC GCC TAC CTC AAA CAG ATC GGC AAG780Thr Ala Ser Ala Asp Ser Val Arg Ala Tyr Leu Lys Gln Ile Gly Lys225 230 235GTA GCG CTG CTC AAC GCC GAG GAA GAG GTC GAG CTA GCC AAG CGG ATC 828Val Ala Leu Leu Asn Ala Glu Glu Glu Val Glu Leu Ala Lys Arg Ile240 245 250GAG GCT GGC CTG TAC GCC ACG CAG CTG ATG ACC GAG CTT AGC GAG CGC 876Glu Ala Gly Leu Tyr Ala Thr Gln Leu Met Thr Glu Leu Ser Glu Arg255 260 265GGC GAA AAG CTG CCT GCC GCC CAG CGC CGC GAC ATG ATG TGG ATC TGC 924Gly Glu Lys Leu Pro Ala Ala Gln Arg Arg Asp Met Met Trp Ile Cys270 275 280 285CGC GAC GGC GAT CGC GCG AAA AAC CAT CTG CTG GAA GCC AAC CTG CGC 972Arg Asp Gly Asp Arg Ala Lys Asn His Leu Leu Glu Ala Asn Leu Arg290 295 300CTG GTG GTT TCG CTA GCC AAG CGC TAC ACC GGC CGG GGC ATG GCG TTT 1020Leu Val Val Ser Leu Ala Lys Arg Tyr Thr Gly Arg Gly Met Ala Phe305 310 315CTC GAC CTG ATC CAG GAA GGC AAC CTG GGG CTG ATC CGC GCG GTG GAG 1068Leu Asp Leu Ile Gln Glu Gly Asn Leu Gly Leu Ile Arg Ala Val Glu320 325 330AAG TTC GAC TAC ACC AAG GGG TAC AAG TTC TCC ACC TAC GCT ACG TGG 1116Lys Phe Asp Tyr Thr Lys Gly Tyr Lys Phe Ser Thr Tyr Ala Thr Trp335 340 345TGG ATT CGC CAG GCC ATC ACC CGC GCC ATG GCC GAC CAG GCC CGC ACC 1164Trp Ile Arg Gln Ala Ile Thr Arg Ala Met Ala Asp Gln Ala Arg Thr350 355 360 365ATC CGC ATC CCG GTG CAC ATG GTC GAG GTG ATC AAC AAG CTG GGC CGC 1212Ile Arg Ile Pro Val His Met Val Glu Val Ile Asn Lys Leu Gly Arg370 375 380ATT CAA CGC GAG CTG CTG CAG GAC CTG GGC CGC GAG CCC ACG CCC GAG 1260Ile Gln Arg Glu Leu Leu Gln Asp Leu Gly Arg Glu Pro Thr Pro Glu385 390 395GAG CTG GCC AAA GAG ATG GAC ATC ACC CCG GAG AAG GTG CTG GAA ATC 1308Glu Leu Ala Lys Glu Met Asp Ile Thr Pro Glu Lys Val Leu Glu Ile400 405 410CAG CAA TAC CCC CGC GAG CCG ATC TCG TTG GAC CAG ACC ATC GGC GAC 1356Gln Gln Tyr Ala Arg Glu Pro Ile Ser Leu Asp Gln Thr Ile Gly Asp415 420 425GAG GGC GAC AGC CAG CTT GGC GAT TTC ATC GAA GAC ACC GAG GCG GTG 1404Glu Gly Asp Ser Gln Leu Gly Asp Phe Ile Glu Asp Ser Glu Ala Val430 435 440 445GTG GCC GTC GAC GCG GTG TCC TTC ACT TTG CTG CAG GAT CAA CTG CAG 1452Val Ala Val Asp Ala Val Sar Phe Thr Leu Leu Gln Asp Gln Leu Gln450 455 460TCG GTG CTG GAC ACG CTC TCC GAG CGT GAG GCG GGC GTG GTG CGG CTA 1500Ser Val Leu Asp Thr Leu Ser Glu Arg Glu Ala Gly Val Val Arg Leu465 470 475CGC TTC GGC CTT ACC GAC GGC CAG CCG CGC ACC CTT GAC GAG ATC GGC 1548Arg Phe Gly Leu Thr Asp Gly Gln Pro Arg Thr Leu Asp Glu Ile Gly480 485 490CAG GTC TAC GGC GTG ACC CGG GAA CGC ATC CGC CAG ATC GAA TCC AAG 1596Gln Val Tyr Gly Val Thr Arg Glu Arg Ile Arg Gln Ile Glu Ser Lys495 500 505ACT ATG TCG AAG TTG CGC CAT CCG AGC CGC TCA CAG GTC CTG CGC GAC 1644Thr Met Ser Lys Leu Arg His Pro Ser Arg Ser Gln Val Leu Arg Asp510 515 520 525TAC CTG GAC TGAGAGCGCC CGCCGAGGCG ACCAACGTAG CACGTGAGCC 1693Tyr Leu AspCCCAGCAGCT AGCCGCACCA TGGTCTCGTC C 1724(2)SEQ ID NO2信息(i)序列特征(A)長度528個氨基酸(B)類型氨基酸(D)拓撲學線性(ii)分子類型蛋白質(zhì)(xi)序列描述SEQ ID NO2Val Ala Ala Thr Lys Ala Ser Thr Ala Thr Asp Glu Pro Val Lys Arg1 5 10 15Thr Ala Thr Lys Ser Pro Ala Ala Ser Ala Ser Gly Ala Lys Thr Gly20 25 30Ala Lys Arg Thr Ala Ala Lys Ser Ala Ser Gly Ser Pro Pro Ala Lys35 40 45Arg Ala Thr Lys Pro Ala Ala Arg Ser Val Lys Pro Ala Ser Ala Pro50 55 60Gln Asp Thr Thr Thr Ser Thr Ile Pro Lys Arg Lys Thr Arg Ala Ala65 70 75 80Ala Lys Ser Ala Ala Ala Lys Ala Pro Ser Ala Arg Gly His Ala Thr85 90 95Lys Pro Arg Ala Pro Lys Asp Ala Gln His Glu Ala Ala Thr Asp Pro100 105 110Glu Asp Ala Leu Asp Ser Val Glu Glu Leu Asp Ala Glu Pro Asp Leu115 120 125Asp Val Glu Pro Gly Glu Asp Leu Asp Leu Asp Ala Ala Asp Leu Asn130 135 140Leu Asp Asp Leu Glu Asp Asp Val Ala Pro Asp Ala Asp Asp Asp Leu145 150 155 160Asp Ser Gly Asp Asp Glu Asp His Glu Asp Leu Glu Ala Glu Ala Ala165 170 175Val Ala Pro Gly Gln Thr Ala Asp Asp Asp Glu Glu Ile Ala Glu Pro180 185 190Thr Glu Lys Asp Lys Ala Ser Gly Asp Phe Val Trp Asp Glu Asp Glu195 200 205Ser Glu Ala Leu Arg Gln Ala Arg Lys Asp Ala Glu Leu Thr Ala Ser210 215 220Ala Asp Ser Val Arg Ala Tyr Leu Lys Gln Ile Gly Lys Val Ala Leu225 230 235 240Leu Asn Ala Glu Glu Glu Val Glu Leu Ala Lys Arg Ile Glu Ala Gly245 250 255Leu Tyr Ala Thr Gln Leu Met Thr Glu Leu Ser Glu Arg Gly Glu Lys260 265 270Leu Pro Ala Ala Gln Arg Arg Asp Met Met Trp Ile Cys Arg Asp Gly275 280 285Asp Arg Ala Lys Asn His Leu Leu Glu Ala Asn Leu Arg Leu Val Val290 295 300Ser Leu Ala Lys Arg Tyr Thr Gly Arg Gly Met Ala Phe Leu Asp Leu305 310 315 320Ile Gln Glu Gly Asn Leu Gly Leu Ils Arg Ala Val Glu Lys Phe Asp325 330 335Tyr Thr Lys Gly Tyr Lys Phe Ser Thr Tyr Ala Thr Trp Trp Ile Arg340 345 350Gln Ala Ile Thr Arg Ala Met Ala Asp Gln Ala Arg Thr Ile Arg Ile355 360 365Pro Val His Met Val Glu Val Ile Asn Lys Leu Gly Arg Ile Gln Arg370 375 380Glu Leu Leu Gln Asp Leu Gly Arg Glu Pro Thr Pro Glu Glu Leu Ala385 390 395 400Lys Glu Met Asp Ile Thr Pro Glu Lys Val Leu Glu Ile Gln Gln Tyr405 410 415Ala Arg Glu Pro Ile Ser Leu Asp Gln Thr Ile Gly Asp Glu Gly Asp420 425 430Ser Gln Leu Gly Asp Phe Ile Glu Asp Ser Glu Ala Val Val Ala Val435 440 445Asp Ala Val Ser Phe Thr Leu Leu Gln Asp Gln Leu Gln Ser Val Leu450 455 460Asp Thr Leu Ser Glu Arg Glu Ala Gly Val Val Arg Leu Arg Phe Gly465 470 475 480Leu Thr Asp Gly Gln Pro Arg Thr Leu Asp Glu Ile Gly Gln Val Tyr465 490 495Gly Val Thr Arg Glu Arg Ile Arg Gln Ile Glu Ser Lys Thr Met Ser500 505 510Lys Leu Arg His Pro Ser Arg Ser Gln Val Leu Arg Asp Tyr Leu Asp515 520 525(2)SEQ ID NO3信息(i)序列特征(A)長度1508堿基對(B)類型核苷酸(C)鏈型雙鏈(D)拓撲學線性(vi)最初來源(A)生物體結(jié)核分支桿菌(C)株單個分離菌atcc 27294(vii)直接來源(B)克隆pARC 8176(ix)特征(A)名稱/鍵CDS(B)位置325..1293(xi)序列描述SEQ ID NO3ACCAGCCCGA CGACCGACGA ACCCCGCCGC TTCGACGTGC CCAGCCGGCG CATCCCGCTG60TTCCCGACCG CGAACGGCCC GCACTCGAGC CGACGGCGAC AGCCGGCAAG AAGCGGTCAG120CCCGCGGGGA TTCGCCGACC ACGGTTAGCC GTCTGTTGGC CGGCGTTCCG GGTTGTCGCC180ACTGGCCACA CTTCTCAGGA CTTTCTCAGG TCTTCGGCAG ATTCCTGCAC GTCACAGGGC240GTCAGATCAC TGCTGGGTGG GAACTCAAAG TCCGGCTTTG TCGTTAAACC CTGACAGTGC300AAGCCGATCG GGGAACGGCT CGCT ATG GCC GAT GCA CCC ACA AGG GCC ACC 351Met Ala Asp Ala Pro Thr Arg Ala Thr530 535ACA AGC CGG GTT GAC ACA GAT CTG GAT GCT CAA AGC CCC GCG GCG GAC 399Thr Ser Arg Val Asp Thr Asp Leu Asp Ala Gln Ser Pro Ala Ala Asp540 545 550CTC GTG CGC GTC TAT CTG AAC GGC ATC GGC AAG ACG GCG TTG CTC AAC 447Leu Val Arg Val Tyr Leu Asn Gly Ile Gly Lys Thr Ala Leu Leu Asn555 560 565GCG GCG GAT GAA GTC GAA CTG GCC AAG CGC ATA GAA GCC GGG TTG TAT 495Ala Ala Asp Glu Val Glu Leu Ala Lys Arg Ile Glu Ala Gly Leu Tyr570 575 580 585GCC GAG CAT CTG CTG GAA ACC CGG AAG CGC CTC GGC GAG AAC CGA AAA 543Ala Glu His Leu Leu Glu Thr Arg Lys Arg Leu Gly Glu Asn Arg Lys590 595 600CGC GAC CTG GCG GCC GTG GTG CGT GAT GGC GAG GCC GCC CGC CGC CAC 591Arg Asp Leu Ala Ala Val Val Arg Asp Gly Glu Ala Ala Arg Arg His605 610 615CTG CTG GAA GCA AAC CTG CGG CTG GTG GTA TCG CTG GCC AAG CGC TAC 639Leu Leu Glu Ala Asn Leu Arg Leu Val Val Ser Leu Ala Lys Arg Tyr620 625 630ACG GGT CGG GGC ATG CCG TTG CTG GAC CTC ATC CAG GAG GGC AAC CTG 687Thr Gly Arg Gly Met Pro Leu Leu Asp Leu Ile Gln Glu Gly Asn Leu635 640 645GGT CTG ATT CGA GCG ATG GAG AAG TTC GAC TAC ACA AAG GGA TTC AAG 735Gly Leu Ile Arg Ala Met Glu Lys Phe Asp Tyr Thr Lys Gly Phe Lys650 655 660 665TTC TTA ACG TAT GCC ACG TGG TGG ATT CGC CAG GCC ATC ACC CGC GGA 783Phe Ser Thr Tyr Ala Thr Trp Trp Ile Arg Gln Ala Ile Thr Arg Gly670 675 680ATG GCC GAC CAG AGC CGC ACC ATC CGC CTG CCC GTA CAC CTG GTT GAG 831Met Ala Asp Gln Ser Arg Thr Ile Arg Leu Pro Val His Leu Val Glu685 690 695CAG GTC AAC AAG CTG GCG CGG ATC AAG CGG GAG ATG CAC CAG CAT CTG 879Gln Val Asn Lys Leu Ala Arg Ile Lys Arg Glu Met His Gln His Leu700 705 710GGT CGC GAA CGC ACC GAT GAG GAG CTC GCC GCC GAA TCC GGC ATT CCA 927Gly Arg Glu Arg Thr Asp Glu Glu Leu Ala Ala Glu Ser Gly Ile Pro715 720 725ATC GAC AAG ATC AAC GAC CTG CTG GAA CAC AGT CGC GAC CCG GTG AGT 975Ile Asp Lys Ile Asn Asp Leu Leu Glu His Ser Arg Asp Pro Val Ser730 735 740 745CTG GAT ATG CCG GTC GGC TTC GAG GAG GAG GCC CCT TTG GGC GAT TTC 1023Leu Asp Met Pro Val Gly Ser Glu Glu Glu Ala Pro Leu Gly Asp Phe750 755 760ATC GAG GAC GCC GAA GCC ATG TTC GCG GAG AAC GCG GTC ATC GCC GAA 1071Ile Glu Asp Ala Glu Ala Met Ser Ala Glu Asn Ala Val Ile Ala Glu765 770 775CTG TTA CAC ACC GAC ATC CGC AGC GTG CTG GCC ACT CTC GAC GAG CGT 1119Leu Leu His Thr Asp Ile Arg Ser Val Leu Ala Thr Leu Asp Glu Arg780 785 790GAC GAC CAG GTG ATC CGG CTG CGC TTC GGC CTG GAT GAC GGC CAA CCA 1167Asp Asp Gln Val Ile Arg Leu Arg Phe Gly Leu Asp Asp Gly Gln Pro795 800 805CGC ACC CTG GAT CAA ATC GGC AAA CTA TTC GGG CTG TCC CGT GAG CGG 1215Arg Thr Leu Asp Gln Ile Gly Lys Leu Phe Gly Leu Ser Arg Glu Arg810 815 820 825GTT CGT CAG ATT GAG CGC GAC GTG ATG AGT AAG CTG CGG CAC GGT GAG 1263Val Arg Gln Ile Glu Arg Asp Val Met Ser Lys Leu Arg His Gly Glu830 835 840CGG GCG GAT CGG CTG CGG TCG TAC GCC AGC TGAAGCTGGA CATCCTGAGC 1313Arg Ala Asp Arg Leu Arg Ser Tyr Ala Ser845 850CAGGTAGCAG ACGGTATGCC CGCCGCGCCA GCATAGCCTG CGGTGGGGCG GCGGGCAACC 1373ATTTTCGCAG CTGGCCAAGT GTAGACTCAG CTGCAATGGA GGGTGCTGAA TGAACGAGTT 1433GGTTGATACC ACCGAGATGT ACCTGCGGAC CATCTACGAC CTCGAGGAAG AGGGCGTGAC 1493GCACTGCGTG CCGGA 1508(2)SEQ ID NO4信息(i)序列特征(A)長度323個氨基酸(B)類型氨基酸(D)拓撲學線性(ii)分子類型蛋白質(zhì)(xi)序列描述SEQ ID NO4Met Ala Asp Ala Pro Thr Arg Ala Thr Thr Ser Arg Val Asp Thr Asp1 5 10 15Leu Asp Ala Gln Ser Pro Ala Ala Asp Leu Val Arg Val Tyr Leu Asn20 25 30Gly Ile Gly Lys Thr Ala Leu Leu Asn Ala Ala Asp Glu Val Glu Leu35 40 45Ala Lys Arg Ile Glu Ala Gly Leu Tyr Ala Glu His Leu Leu Glu Thr50 55 60Arg Lys Arg Leu Gly Glu Asn Arg Lys Arg Asp Leu Ala Ala Val Val65 70 75 80Arg Asp Gly Glu Ala Ala Arg Arg His Leu Leu Glu Ala Asn Leu Arg85 90 95Leu Val Val Ser Leu Ala Lys Arg Tyr Thr Gly Arg Gly Met Pro Leu100 105 110Leu Asp Leu Ile Gln Glu Gly Asn Leu Gly Leu Iie Arg Ala Met Glu115 120 125Lys Phe Asp Tyr Thr Lys Gly Phe Lys Phe Ser Thr Tyr Ala Thr Trp130 135 140Trp Ile Arg Gln Ala Ile Thr Arg Gly Met Ala Asp Gln Ser Arg Thr145 150 155 160Ile Arg Leu Pro Val His Leu Val Glu Gln Val Asn Lys Leu Ala Arg165 170 175Ile Lys Arg Glu Met His Gln His Leu Gly Arg Glu Arg Thr Asp Glu180 185 190Glu Leu Ala Ala Glu Ser Gly Ile Pro Ile Asp Lys Ile Asn Asp Leu195 200 205Leu Glu His Ser Arg Asp Pro Val Ser Leu Asp Met Pro Val Gly Ser210 215 220Glu Glu Glu Ala Pro Leu Gly Asp Phe Ile Glu Asp Ala Glu Ala Met225 230 235 240Ser Ala Glu Asn Ala Val Ile Ala Glu Leu Leu His Thr Asp Ile Arg245 250 255Ser Val Leu Ala Thr Leu Asp Glu Arg Asp Asp Gln Val Ile Arg Leu260 265 270Arg Phe Gly Leu Asp Asp Gly Gln Pro Arg Thr Leu Asp Gln Ile Gly275 280 285Lys Leu Phe Gly Leu Ser Arg Glu Arg Val Arg Gln lle Glu Arg Asp290 295 300Val Met Ser Lys Leu Arg His Gly Glu Arg Ala Asp Arg Leu Arg Ser305 310 315 320Tyr Ala Ser(2)SEQ ID NO5信息(i)序列特征(A)長度30個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲學線性(ii)分子類型其它核酸(A)說明/desc即“PCR引物”(xi)序列描述SEQ ID NO5AAGTTCAGCA CSTACGCSAC STGGTGGATC30(2)SEQ ID NO6信息(i)序列特征(A)長度27個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲學線性(ii)分子類型其它核酸(A)說明/desc即“PCR引物”(xi)序列描述SEQ ID NO6CTTSGCCTCG ATCTGSCGGA TSCGCTC 27(2)SEQ ID NO7信息(i)序列特征
(A)長度25個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲學線性(ii)分子類型其它核酸(A)說明/desc即“PCR引物”(xi)序列描述SEQ ID NO7TTCCATGGGG TATGTGGCAG CGACC 25(2)SEQ ID NO8信息(i)序列特征(A)長度27個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲學線性(ii)分子類型其它核酸(A)說明/desc即“PCR引物”(xi)序列描述SEQ ID NO8GTACAGGCCA GCCTCGATCC GCTTGGC 27(2)SEQ ID NO9信息(i)序列特征(A)長度28個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲學線性(ii)分子類型其它核酸(A)說明/desc 即“PCR引物”(xi)序列描述SEQ ID NO9TTTCATGGCC GATGCACCCA CAAGGGCC28(2)SEQ ID NO10信息(i)序列特征(A)長度27個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲學線性(ii)分子類型其它核酸(A)說明/desc即“PCR引物”(xi)序列描述SEQ ID NO10CTTGAATTCA GCTGGCGTAC GACCGCA2權(quán)利要求
1.一種分離的多肽,其為結(jié)核分支桿菌RNA聚合酶組Iδ亞單位,或為其功能相當?shù)男揎椥问健?br>
2.根據(jù)權(quán)利要求1的多肽,其氨基酸序列與序列表中SEQ IDNO2或4中相同或基本上類似。
3.一種分離的核酸分子,其含有編碼根據(jù)權(quán)利要求1或2的多肽的核酸序列。
4.一種分離的核酸,選自(a)包含在SEQ ID NO1或SEQ ID NO3中所示編碼結(jié)核分支桿菌RNA聚合酶組Iδ亞單位的核苷酸序列的DNA分子;(b)核酸分子,其包含一個能與(a)中所定義的DNA分子的多肽編碼區(qū)互補的核苷酸序列雜交并編碼結(jié)核分枝桿菌組Iδ亞單位的多肽或其功能相當?shù)男揎楏w的核苷酸序列;和(c)核酸分子,其包含一個由于遺傳編碼簡并而形成的在(a)或(b)中定義的核苷酸序列并編碼結(jié)核分支桿菌組Iδ亞單位的多肽或其功能相當?shù)男揎椥问降暮怂嵝蛄小?br>
5.包含根據(jù)權(quán)利要求3或4的核酸分子的載體。
6.根據(jù)權(quán)利要求5的載體,其為質(zhì)粒載體pARC 8175(NCIMB 40738)或pARC 8176(NCIMB 40739)。
7.根據(jù)權(quán)利要求5的載體其是一種可介導(dǎo)根據(jù)權(quán)利要求1或2中的多肽表達的表達載體。
8.攜帶有根據(jù)權(quán)利要求5至7中任何一個權(quán)利要求載體的宿主細胞。
9.用于制備根據(jù)權(quán)利要求1或2多肽的方法,包括在所述多肽產(chǎn)生的條件下培養(yǎng)以權(quán)利要求7表達載體轉(zhuǎn)化的權(quán)利要求8的宿主細胞和回收該多肽。
10.具有抑制δ亞單位與結(jié)核分支桿菌核心RNA聚合酶結(jié)合能力的化合物的分析方法,所述方法包括(i)將待測所述抑制能力的化合物與權(quán)利要求1或2的多肽及結(jié)構(gòu)分枝桿菌核心RNA聚合酶接觸;和(ii)檢測是否多肽與核心RNA聚合酶結(jié)合形成RNA聚合酶全酶。
11.根據(jù)權(quán)利要求10的方法,其中結(jié)合核心RNA聚合酶的多肽和/或不結(jié)合RNA聚合酶的多肽是用層析法如凝膠過濾加以檢測。
12.根據(jù)權(quán)利要求10的方法,其中RNA聚合酶全酶的檢測是用結(jié)合RNA聚合酶全酶抗體的免疫沉淀法。
13.一種分析化合物的方法,該化合物具有抑制δ亞單位依賴性的結(jié)核分支桿菌RNA聚合酶轉(zhuǎn)錄的能力,該方法包括(i)將待測所述抑制能力的化合物與權(quán)利要求1或2的多肽、結(jié)核分支桿菌核心RNA聚合酶和一段DNA分子接觸,該DNA分子具有當結(jié)合到所述多肽時能由該核心RNA聚合酶所識別的與啟動子序列可操縱地連接的編碼序列,所述的接觸是在當結(jié)核分枝桿菌RNA聚合酶結(jié)合到啟動子上時,適于該編碼序列轉(zhuǎn)錄的條件下完成的;和(ii)檢測上述編碼序列對應(yīng)的mRNA的形成。
14.確定結(jié)核分支桿菌RNA聚合酶δ亞單位蛋白結(jié)構(gòu)的方法,其特征在于根據(jù)權(quán)利要求1或2的多肽用于X-射線晶體學分析。
全文摘要
本發(fā)明提供了編碼結(jié)構(gòu)分支桿菌RNA聚合酶δ亞單位的新的核酸分子。它也涉及由該核酸分子編碼的、稱為SigA和SigB的多肽、以及載體和用上述核酸分子轉(zhuǎn)化的宿主細胞。本發(fā)明進一步提供了抑制δ亞單位與核心RNA聚合酶相互作用的化合物的篩選分析方法。
文檔編號A61K38/00GK1201465SQ9619426
公開日1998年12月9日 申請日期1996年3月12日 優(yōu)先權(quán)日1995年5月30日
發(fā)明者M·巴加內(nèi), U·沙爾馬 申請人:阿斯特拉公司