專利名稱:鋅指結(jié)構(gòu)域及其鑒定方法
技術(shù)領(lǐng)域:
本發(fā)明涉及DNA-結(jié)合蛋白例如轉(zhuǎn)錄因子。
背景技術(shù):
大多數(shù)基因在轉(zhuǎn)錄水平上受與基因中一般是啟動(dòng)子或者增強(qiáng)子區(qū)中特異性DNA位點(diǎn)結(jié)合的多肽轉(zhuǎn)錄因子的調(diào)節(jié)。這些蛋白質(zhì)激活或抑制RNA聚合酶在啟動(dòng)子處對(duì)轉(zhuǎn)錄的起始,從而調(diào)節(jié)靶基因的表達(dá)。很多轉(zhuǎn)錄因子,激活劑和抑制劑,結(jié)構(gòu)是模塊化的。這樣的組件能夠折疊為結(jié)構(gòu)上獨(dú)特的結(jié)構(gòu)域并且具有特異功能,例如DNA結(jié)合,二聚化作用,或者與轉(zhuǎn)錄機(jī)構(gòu)相互作用。效應(yīng)子結(jié)構(gòu)域例如激活結(jié)構(gòu)域或抑制結(jié)構(gòu)域當(dāng)轉(zhuǎn)移到異源轉(zhuǎn)錄因子的DNA-結(jié)合結(jié)構(gòu)域時(shí)保持它們的功能(Brent和Ptashne,(1985)Cell 43729-36;Dawson等,(1995)Mol.Cell Biol.156923-31)。很多三維DNA-結(jié)合結(jié)構(gòu),包括鋅指結(jié)構(gòu)域,同源域,和螺旋-轉(zhuǎn)角-螺旋結(jié)構(gòu)域,已經(jīng)根據(jù)NMR和X-射線晶體學(xué)數(shù)據(jù)確定出來。
發(fā)明概述本發(fā)明提供快捷并且可定量地對(duì)嵌合轉(zhuǎn)錄因子鑒定和構(gòu)建的以細(xì)胞為基礎(chǔ)的方法。這樣的轉(zhuǎn)錄因子可以用來例如改變生物藥物和生物工程應(yīng)用中內(nèi)源基因的表達(dá)。在體內(nèi),即在完整活細(xì)胞中測(cè)試轉(zhuǎn)錄因子。通過例如在基因組序列篩選中應(yīng)用該方法能夠找到的新的核酸結(jié)合結(jié)構(gòu)域也在本發(fā)明范圍內(nèi)。
本發(fā)明特征在于鑒定識(shí)別DNA上靶點(diǎn)的肽結(jié)構(gòu)域的方法。該方法有時(shí)在這里稱″結(jié)構(gòu)域篩選方法″或者″體內(nèi)篩選方法″。該方法包括提供(1)包含報(bào)道基因構(gòu)建體的細(xì)胞和(2)多個(gè)雜合核酸。所述報(bào)道基因構(gòu)建體具有與具有募集位點(diǎn)(recruitment site)和靶位點(diǎn)的啟動(dòng)子可操作連接的報(bào)道基因。當(dāng)轉(zhuǎn)錄因子識(shí)別(即以高于背景的程度結(jié)合)啟動(dòng)子的募集位點(diǎn)和靶位點(diǎn)時(shí),報(bào)道基因表達(dá)高于給定水平,但是當(dāng)轉(zhuǎn)錄因子只識(shí)別啟動(dòng)子的募集位點(diǎn)時(shí)則不如此。每一個(gè)雜合核酸編碼具有下面元件的非天然存在的蛋白質(zhì)(i)轉(zhuǎn)錄激活結(jié)構(gòu)域,(ii)識(shí)別募集位點(diǎn)的DNA結(jié)合結(jié)構(gòu)域,和(iii)試驗(yàn)鋅指結(jié)構(gòu)域。試驗(yàn)鋅指結(jié)構(gòu)域的氨基酸序列隨著該多個(gè)雜合核酸中的不同成員而不同。該方法還包括在使至少一個(gè)核酸進(jìn)入至少一個(gè)細(xì)胞的條件下使該多個(gè)核酸接觸細(xì)胞;在使得雜合核酸在細(xì)胞中表達(dá)的條件下維持細(xì)胞;鑒定高于給定水平表達(dá)報(bào)道基因的細(xì)胞,這是細(xì)胞包含編碼識(shí)別靶位點(diǎn)的試驗(yàn)鋅指結(jié)構(gòu)域的雜合核酸的指征。
所述DNA結(jié)合結(jié)構(gòu)域,即識(shí)別募集位點(diǎn)并且不隨著多個(gè)核酸各成員而不同的結(jié)構(gòu)域,可以包括,例如,一個(gè),兩個(gè),三個(gè),或者多個(gè)鋅指結(jié)構(gòu)域。該方法中使用的細(xì)胞可以是原核細(xì)胞或者真核細(xì)胞。舉例的真核細(xì)胞是酵母細(xì)胞,例如啤酒酵母(Saccharomyces cerevisiae),粟酒裂殖酵母(Schizosaccharomyces pombe),或者,巴斯德畢赤氏酵母(Pichia pasteuris);昆蟲細(xì)胞例如Sf9細(xì)胞;和哺乳動(dòng)物細(xì)胞例如成纖維細(xì)胞或淋巴細(xì)胞。
″給定水平″是當(dāng)轉(zhuǎn)錄因子識(shí)別募集位點(diǎn)但是不識(shí)別靶位點(diǎn)時(shí)觀察到的表達(dá)量?!褰o定水平″在某些情況下可以是零(至少在應(yīng)用的測(cè)試檢測(cè)范圍內(nèi))。
所述方法可以包括從核酸例如基因組DNA,mRNA混合物,或者cDNA擴(kuò)增編碼試驗(yàn)鋅指結(jié)構(gòu)域的源核酸產(chǎn)生擴(kuò)增的片段的附加步驟。使用寡核苷酸引物可以擴(kuò)增源核酸。所述寡核苷酸引物可以是與編碼保守結(jié)構(gòu)域邊界的核酸退火的一組簡(jiǎn)并寡核苷酸(例如,具有不同核酸序列的特異性寡核苷酸的集合,或者具有非天然堿基例如肌苷的特異性寡核苷酸的集合)之一?;蛘撸鲆锟梢允翘禺愋怨押塑账?。使用擴(kuò)增的片段產(chǎn)生雜合核酸用于包含在上述方法中使用的多個(gè)雜合核酸中。
所述方法可以進(jìn)一步包括步驟(i)在序列數(shù)據(jù)庫(kù)中鑒定侯選鋅指結(jié)構(gòu)域氨基酸序列;(ii)提供編碼候選鋅指結(jié)構(gòu)域氨基酸序列的侯選核酸;和(iii)使用侯選核酸構(gòu)建雜合核酸用于包含在上述方法中使用的多個(gè)雜合核酸中。所述數(shù)據(jù)庫(kù)包括多個(gè)氨基酸序列的記錄,例如,已知的和/或預(yù)測(cè)的蛋白質(zhì),以及多個(gè)核酸序列,例如cDNAs,ESTs,基因組DNA,或者計(jì)算機(jī)處理去除預(yù)測(cè)的內(nèi)含子的基因組DNA。
如果期望,可以重復(fù)該方法來鑒定識(shí)別第二靶位點(diǎn)的第二試驗(yàn)鋅指結(jié)構(gòu)域,所述第二靶位點(diǎn)例如是除了第一試驗(yàn)鋅指結(jié)構(gòu)域識(shí)別的位點(diǎn)之外的位點(diǎn)。接著可以構(gòu)建編碼第一和第二鑒定的試驗(yàn)鋅指結(jié)構(gòu)域的核酸。編碼的雜合蛋白特異性識(shí)別包括第一試驗(yàn)鋅指結(jié)構(gòu)域的靶位點(diǎn)和第二試驗(yàn)鋅指結(jié)構(gòu)域的靶位點(diǎn)的靶位點(diǎn)。
本發(fā)明特征還在于確定試驗(yàn)鋅指結(jié)構(gòu)域是否識(shí)別啟動(dòng)子上的靶位點(diǎn)的方法。該方法在這里有時(shí)指″位點(diǎn)篩選方法″。該方法包括提供報(bào)道基因構(gòu)建體和雜合核酸的步驟。報(bào)道基因可操作連接包括募集位點(diǎn)和靶位點(diǎn)的啟動(dòng)子,并且當(dāng)轉(zhuǎn)錄因子識(shí)別啟動(dòng)子的募集位點(diǎn)和靶位點(diǎn)時(shí)高于給定水平表達(dá),但是轉(zhuǎn)錄因子只識(shí)別啟動(dòng)子的募集位點(diǎn)時(shí)則不如此。所述雜合核酸編碼具有下面元件的非天然存在的蛋白質(zhì)(i)轉(zhuǎn)錄激活結(jié)構(gòu)域,(ii)識(shí)別募集位點(diǎn)的DNA結(jié)合結(jié)構(gòu)域,和(iii)試驗(yàn)鋅指結(jié)構(gòu)域。該方法還包括在使得報(bào)道基因構(gòu)建體進(jìn)入細(xì)胞的條件下使報(bào)道基因構(gòu)建體接觸細(xì)胞;在上述步驟之前,之后,或者同時(shí),在使雜合核酸進(jìn)入細(xì)胞的條件下使雜合核酸與細(xì)胞接觸;在使雜合核酸在細(xì)胞中表達(dá)的條件下保持細(xì)胞;并且檢測(cè)細(xì)胞中報(bào)道基因的表達(dá)。報(bào)道基因表達(dá)水平大于給定水平是試驗(yàn)鋅指結(jié)構(gòu)域識(shí)別靶位點(diǎn)的指征。
在不同質(zhì)粒中可以包含報(bào)道基因構(gòu)建體和雜合核酸。這兩個(gè)質(zhì)粒同時(shí)或相繼插入細(xì)胞。一個(gè)質(zhì)粒或兩個(gè)質(zhì)??梢院泻线m的可選擇標(biāo)記物。報(bào)道基因構(gòu)建體和雜合核酸也可以包含在相同質(zhì)粒上,在這種情況下只需要一個(gè)步驟將兩個(gè)核酸導(dǎo)入細(xì)胞。在另一個(gè)實(shí)施方案中,這一個(gè)或兩個(gè)核酸被穩(wěn)定插入細(xì)胞的基因組。對(duì)于這種方法,和對(duì)于這里描述的任何體內(nèi)方法一樣,可以用轉(zhuǎn)錄抑制結(jié)構(gòu)域置換轉(zhuǎn)錄激活結(jié)構(gòu)域,并且鑒定其中報(bào)道基因表達(dá)水平低于給定水平的細(xì)胞。
本發(fā)明的另一個(gè)方法有利于通過融合兩個(gè)細(xì)胞快速確定試驗(yàn)鋅指結(jié)構(gòu)域的結(jié)合偏好(binding preference)。該方法包括提供含有報(bào)道基因的第一細(xì)胞;提供含有雜合核酸的第二細(xì)胞;融合第一和第二細(xì)胞形成融合細(xì)胞;在使雜合核酸在融合細(xì)胞中表達(dá)的條件下保持融合細(xì)胞;并且檢測(cè)融合細(xì)胞中報(bào)道基因表達(dá),其中報(bào)道基因表達(dá)水平大于給定水平是試驗(yàn)鋅指結(jié)構(gòu)域識(shí)別靶位點(diǎn)的指征。例如,所述第一和第二細(xì)胞可以是組織培養(yǎng)細(xì)胞或真菌細(xì)胞。舉例的實(shí)施方法使用啤酒酵母(S.cerevisiae)細(xì)胞。所述第一細(xì)胞具有第一接合類型,例如MATa;所述第二細(xì)胞具有與第一細(xì)胞不同的第二接合類型,例如MATα。這兩個(gè)細(xì)胞彼此接觸,酵母接合產(chǎn)生具有含有第一細(xì)胞和第二細(xì)胞基因組的細(xì)胞核的單細(xì)胞(例如MATa/α)。該方法可以包括提供多個(gè)第一細(xì)胞,都具有相同的第一接合類型,其中各個(gè)第一細(xì)胞包含具有不同的靶位點(diǎn)的報(bào)道基因構(gòu)建體。也提供多個(gè)第二細(xì)胞,都具有相同的第二接合類型,并且各自具有不同的試驗(yàn)鋅指結(jié)構(gòu)域。多個(gè)成對(duì)接合產(chǎn)生矩陣,例如所有可能的成對(duì)接合。利用該方法來測(cè)定多個(gè)試驗(yàn)鋅指結(jié)構(gòu)域?qū)Χ鄠€(gè)結(jié)合位點(diǎn)例如一全套可能的靶位點(diǎn)的結(jié)合偏好。
本發(fā)明也提供了測(cè)定試驗(yàn)鋅指結(jié)構(gòu)域結(jié)合偏好的方法。所述方法包括提供(1)細(xì)胞,基本上所有的細(xì)胞都包含雜合核酸,和(2)多個(gè)報(bào)道基因構(gòu)建體。這多個(gè)報(bào)道基因構(gòu)建體的每一個(gè)具有與具有募集位點(diǎn)和靶位點(diǎn)的啟動(dòng)子可操作連接的報(bào)道基因。當(dāng)轉(zhuǎn)錄因子識(shí)別啟動(dòng)子的募集位點(diǎn)和靶位點(diǎn)兩者時(shí)報(bào)道基因表達(dá)高于給定水平,但是當(dāng)轉(zhuǎn)錄因子只識(shí)別啟動(dòng)子的募集位點(diǎn)時(shí)則不這樣。多個(gè)報(bào)道基因構(gòu)建體的各成員之間第二個(gè)靶位點(diǎn)不同。雜合核酸編碼具有下面元件的雜合蛋白質(zhì)(i)轉(zhuǎn)錄激活結(jié)構(gòu)域,(ii)識(shí)別募集位點(diǎn)的DNA結(jié)合結(jié)構(gòu)域,和(iii)試驗(yàn)鋅指結(jié)構(gòu)域。所述方法進(jìn)一步包括在使得多個(gè)報(bào)道基因構(gòu)建體的至少一種進(jìn)入至少一個(gè)細(xì)胞的條件下使多個(gè)報(bào)道基因構(gòu)建體接觸細(xì)胞;在使核酸在細(xì)胞中表達(dá)的條件下保持細(xì)胞;鑒定細(xì)胞中包含報(bào)道基因構(gòu)建體并且表達(dá)報(bào)道基因構(gòu)建體高于給定水平的細(xì)胞,表達(dá)報(bào)道基因構(gòu)建體高于給定水平是細(xì)胞中報(bào)道基因構(gòu)建體具有鋅指結(jié)構(gòu)域識(shí)別的靶位點(diǎn)的指征。
如果試驗(yàn)鋅指結(jié)構(gòu)域具有與一個(gè)以上靶位點(diǎn)的結(jié)合偏好,則各自具有不同的靶位點(diǎn)的多個(gè)細(xì)胞可以用上述方法鑒定。所述方法可以進(jìn)一步包括鑒定表現(xiàn)出最高水平報(bào)道基因表達(dá)的細(xì)胞?;蛘?,測(cè)定報(bào)道基因表達(dá)的閾值,例如報(bào)道基因表達(dá)提高2,4,8,20,50,100,1000倍或者更大,選擇表現(xiàn)出報(bào)道基因表達(dá)高于閾值的所有的細(xì)胞。
靶結(jié)合位點(diǎn)例如可以是2至6個(gè)核苷酸長(zhǎng)。多個(gè)報(bào)道基因構(gòu)建體可以在靶結(jié)合位點(diǎn)2個(gè),3個(gè),或者4個(gè)或者更多個(gè)位置處包括A,T,G,和C核苷酸的每一種可能的組合。
另一方面,本發(fā)明特征在于鑒定多個(gè)鋅指結(jié)構(gòu)域的方法。所述方法包括實(shí)施結(jié)構(gòu)域篩選方法來鑒定第一鋅指結(jié)構(gòu)域,并且再次實(shí)施結(jié)構(gòu)域篩選方法來鑒定識(shí)別不同于第一試驗(yàn)鋅指結(jié)構(gòu)域的靶位點(diǎn)的靶位點(diǎn)的第二鋅指結(jié)構(gòu)域。特征還在于產(chǎn)生編碼嵌合鋅指蛋白的核酸的方法,該方法包括實(shí)施兩次結(jié)構(gòu)域篩選方法來鑒定第一和第二試驗(yàn)鋅指結(jié)構(gòu)域,并且構(gòu)建編碼包括第一和第二試驗(yàn)鋅指結(jié)構(gòu)域的多肽的核酸。所述核酸可以編碼包括特異性識(shí)別包括兩個(gè)亞位點(diǎn)的位點(diǎn)的兩個(gè)結(jié)構(gòu)域的雜合蛋白。所述亞位點(diǎn)是第一試驗(yàn)鋅指結(jié)構(gòu)域的靶位點(diǎn)和第二試驗(yàn)鋅指結(jié)構(gòu)域的靶位點(diǎn)。
在另一方面,本發(fā)明特征在于鑒定鋅指結(jié)構(gòu)域識(shí)別的DNA序列的方法。所述方法包括實(shí)施位點(diǎn)篩選方法來鑒定第一試驗(yàn)鋅指結(jié)構(gòu)域的第一結(jié)合偏好,并且再實(shí)施位點(diǎn)篩選方法來鑒定第二試驗(yàn)鋅指結(jié)構(gòu)域的第二結(jié)合偏好??梢詷?gòu)建編碼第一和第二鑒定的試驗(yàn)鋅指結(jié)構(gòu)域兩者的核酸。所述核酸能編碼包括特異性識(shí)別包括第一試驗(yàn)鋅指結(jié)構(gòu)域的靶位點(diǎn)和第二試驗(yàn)鋅指結(jié)構(gòu)域的靶位點(diǎn)的位點(diǎn)的兩個(gè)結(jié)構(gòu)域的雜合蛋白。
本發(fā)明特征還在于鑒定識(shí)別DNA上靶位點(diǎn)的肽結(jié)構(gòu)域的方法。所述方法包括提供(1)含有報(bào)道基因構(gòu)建體的細(xì)胞和(2)多個(gè)雜合核酸。所述報(bào)道基因構(gòu)建體具有與具有募集位點(diǎn)和靶位點(diǎn)兩者的啟動(dòng)子可操作連接的報(bào)道基因。當(dāng)轉(zhuǎn)錄因子識(shí)別(即結(jié)合程度高于背景)啟動(dòng)子的募集位點(diǎn)和靶位點(diǎn)兩者時(shí)報(bào)道基因表達(dá)低于給定水平,但是當(dāng)轉(zhuǎn)錄因子只識(shí)別啟動(dòng)子的募集位點(diǎn)時(shí)則不這樣。每一個(gè)雜合核酸編碼具有下面元件的非天然存在的蛋白質(zhì)(i)轉(zhuǎn)錄抑制結(jié)構(gòu)域,(ii)識(shí)別募集位點(diǎn)的DNA結(jié)合結(jié)構(gòu)域,和(iii)試驗(yàn)鋅指結(jié)構(gòu)域。試驗(yàn)鋅指結(jié)構(gòu)域的氨基酸序列隨著該多個(gè)雜合核酸的成員而不同。該方法進(jìn)一步包括在允許該多個(gè)核酸至少一個(gè)進(jìn)入至少一個(gè)細(xì)胞的條件下使該多個(gè)核酸接觸細(xì)胞;在使得雜合核酸在細(xì)胞中表達(dá)的條件下保持細(xì)胞;鑒定報(bào)道基因表達(dá)低于給定水平的細(xì)胞,這是含有編碼識(shí)別靶位點(diǎn)的試驗(yàn)鋅指結(jié)構(gòu)域的雜合核酸的細(xì)胞的指征。該方法的另外的實(shí)施方案和使用轉(zhuǎn)錄激活結(jié)構(gòu)域的相似方法一樣。同樣,這里描述的任何其它篩選方法可以使用轉(zhuǎn)錄抑制結(jié)構(gòu)域代替轉(zhuǎn)錄激活結(jié)構(gòu)域進(jìn)行。
另一方面,本發(fā)明特征在于一些純化的多肽和分離的核酸。本發(fā)明的純化的多肽包括具有下面氨基酸序列的多肽Xa-X-Cys-X2-5-Cys-X3-Xa-X-Cys-X-Ser-Asn-Xb-X-Arg-His-X3-5-His(SEQ IDNO68),Xa-X-Cys-X2-5-Cys-X3-Xa-X-His-X-Ser-Asn-Xb-X-Lys-His-X3-5-His(SEQ IDNO69),Xa-X-Cys-X2-5-Cys-X3-Xa-X-Ser-X-Ser-Asn-Xb-X-Arg-His-X3-5-His(SEQ IDNO70),Xa-X-Cys-X2-5-Cys-X3-Xa-X-Gln-X-Ser-Thr-Xb-X-Val-His-X3-5-His(SEQ IDNO71),Xa-X-Cys-X2-5-Cys-X3-Xa-X-Val-X-Ser-Xc-Xb-X-Arg-His-X3-5-His(SEQ IDNO72),Xa-X-Cys-X2-5-Cys-X3-Xa-X-Gln-X-Ser-His-Xb-X-Arg-His-X3-5-His(SEQ IDNO73),Xa-X-Cys-X2-5-Cys-X3-Xa-X-Gln-X-Ser-Asn-Xb-X-Val-His-X3-5-His(SEQ IDNO74),Xa-X-Cys-X2-5-Cys-X3-Xa-X-Gln-X-Ser-Xc-Xb-X-Arg-His-X3-5-His(SEQ IDNO75),Xa-X-Cys-X2-5-Cys-X3-Xa-X-Gln-X-Ala-His-Xb-X-Arg-His-X3-5-His(SEQ ID NO150),Xa-X-Cys-X2-5-Cys-X3-Xa-X-Gln-X-Phe-Asn-Xb-X-Arg-His-X3-5-His(SEQ ID NO151),
Xa-X-Cys-X2-5-Cys-X3-Xa-X-Gln-X-Ser-His-Xb-X-Thr-His-X3-5-His(SEQ ID NO152),Xa-X-Cys-X2-5-Cys-X3-Xa-X-Gln-X-Ser-His-Xb-X-Val-His-X3-5-His(SEQ ID NO153),Xa-X-Cys-X2-5-Cys-X3-Xa-X-Gln-X-Ser-Asn-Xb-X-Ile-His-X3-5-His(SEQ ID NO154),Xa-X-Cys-X2-5-Cys-X3-Xa-X-Gln-X-Ser-Asn-Xb-X-Arg-His-X3-5-His(SEQ ID NO155),Xa-X-Cys-X2-5-Cys-X3-Xa-X-Gln-X-Thr-His-Xb-X-Gln-His-X3-5-His(SEQ ID NO156),Cys-X2-5-Cys-X3-Xa-X-Gln-X-Thr-His-Xb-X-Arg-His-X3-5-His(SEQ ID NO157),Xa-X-Cys-X2-5-Cys-X3-Xa-X-Arg-X-Asp-Lys-Xb-X-Ile-His-X3-5-His(SEQ ID NO158),Xa-X-Cys-X2-5-Cys-X3-Xa-X-Arg-X-Ser-Asn-Xb-X-Arg-His-X3-5-His(SEQ ID NO159),Xa-X-Cys-X2-5-Cys-X3-Xa-X-Gln-X-Gly-Asn-Xb-X-Arg-His-X3-5-His(SEQ ID NO161),Xa-X-Cys-X2-5-Cys-X3-Xa-X-Arg-X-Asp-Glu-Xb-X-Arg-His-X3-5-His(SEQ ID NO162),Xa-X-Cys-X2-5-Cys-X3-Xa-X-Arg-X-Asp-His-Xb-X-Arg-His-X3-5-His(SEQ ID NO163),Xa-X-Cys-X2-5-Cys-X3-Xa-X-Arg-X-Asp-His-Xb-X-Thr-His-X3-5-His(SEQ ID NO164),Xa-X-Cys-X2-5-Cys-X3-Xa-X-Arg-X-Asp-Lys-Xb-X-Arg-His-X3-5-His(SEQ ID NO165),Xa-X-Cys-X2-5-Cys-X3-Xa-X-Arg-X-Ser-His-Xb-X-Arg-His-X3-5-His(SEQ ID NO166),或Xa-X-Cys-X2-5-Cys-X3-Xa-X-Arg-X-Thr-Asn-Xb-X-Arg-His-X3-5-His(SEQ ID NO167),其中Xa上苯丙氨酸或酪氨酸,Xb是疏水性殘基,和Xc是絲氨酸或蘇氨酸。本發(fā)明的核酸包括編碼上述多肽的核酸。
另外,本發(fā)明純化的多肽可以具有與SEQ ID NOs23,25,27,29,31,33,35,37,39,41,43,45,47,49,51,53,55,57,59,61,63,65,67,103,105,107,111,113,115,117,119,121,123,125,127,129,131,133,135,137,14l,143,145,147,149,或151 50%,60%,70%,80%,90%,93%,95%,96%,98%,99%,或100%相同的氨基酸序列。所述多肽可以與SEQ ID NOs23,25,27,29,31,33,35,37,39,41,43,45,47,49,51,53,55,57,59,61,63,65,67,103,105,107,111,113,115,117,119,121,123,125,127,129,131,133,135,137,141,143,145,147,149,或151在相應(yīng)于多肽的核酸接觸殘基的氨基酸位置相同?;蛘?,所述多肽在相應(yīng)于多肽的核酸接觸殘基的至少一個(gè)殘基處不同于SEQ ID NOs23,25,27,29,31,33,35,37,39,41,43,45,47,49,51,53,55,57,59,61,63,65,67,103,105,107,111,113,115,117,119,121,123,125,127,129,131,133,135,137,141,143,145,147,149,或151。所述純化的多肽也可以包括下面的一項(xiàng)或多項(xiàng)異源DNA結(jié)合結(jié)構(gòu)域,核定位信號(hào),小分子結(jié)合結(jié)構(gòu)域(例如,甾族化合物結(jié)合結(jié)構(gòu)域),表位標(biāo)記或純化手柄(handle),催化結(jié)構(gòu)域(例如,核酸修飾結(jié)構(gòu)域,核酸切割結(jié)構(gòu)域,或者DNA修復(fù)催化結(jié)構(gòu)域)和/或轉(zhuǎn)錄功能結(jié)構(gòu)域(例如,激活結(jié)構(gòu)域,抑制結(jié)構(gòu)域等等)。本發(fā)明還包括編碼上述多肽的分離的核酸序列,在嚴(yán)謹(jǐn)條件下與單鏈探針雜交的分離的核酸,所述探針序列由SEQ ID NOs22,24,26,28,30,32,34,36,38,40,42,44,46,48,50,52,54,56,58,60,62,64,66,102,104,106,110,112,114,116,118,120,122,124,126,128,130,132,134,136,140,142,144,146,148,或150或者它們的互補(bǔ)序列。本發(fā)明進(jìn)一步包括在細(xì)胞中表達(dá)與異源核酸結(jié)合結(jié)構(gòu)域融合的本發(fā)明多肽的方法。該方法包括將編碼上述融合蛋白的核酸導(dǎo)入細(xì)胞。異源核酸序列例如可誘導(dǎo)啟動(dòng)子(例如甾族激素調(diào)節(jié)啟動(dòng)子,小分子調(diào)節(jié)的啟動(dòng)子,或者工程可誘導(dǎo)體系例如四環(huán)素Tet-On和Tet-Off體系)可以操作性地調(diào)節(jié)本發(fā)明的核酸。
術(shù)語(yǔ)″堿基接觸位置″指結(jié)構(gòu)上相應(yīng)于SEQ ID NO21的氨基酸精氨酸73,天冬氨酸75,谷氨酸76,和精氨酸79的鋅指結(jié)構(gòu)域的四個(gè)氨基酸位置。這些位置也稱為位置-1、2、3和6。為了在查詢序列中鑒定相應(yīng)于堿基接觸位置的位置,將查詢序列對(duì)感興趣的鋅指結(jié)構(gòu)域比對(duì),使得查詢序列的半胱氨酸和組氨酸殘基與Zif268的指3的那些比對(duì)。歐洲生物信息所(European Bioinformatics Institute)的The C1ustalW WWWService(http//www2.ebi.ac.uk/clustalw;Thompson等(1994)Nucleic Acids Res.224673-4680)提供了比對(duì)序列的方便的方法。
術(shù)語(yǔ)″異源″指在一環(huán)境中天然不存在的通過技術(shù)導(dǎo)入該環(huán)境中的多肽。與內(nèi)源個(gè)體不同的是,異源多肽可以在至少一側(cè)鄰連在任何天然存在的多肽中不在其側(cè)翼的多肽序列。術(shù)語(yǔ)″雜合″指包含從(i)至少兩種不同的天然存在的序列;(ii)至少一種人工序列(即,天然不存在的序列)和天然存在的序列;或者(iii)至少兩種不同的人工序列衍生的氨基酸序列的多肽。人工序列的例子包括天然存在的序列和從頭設(shè)計(jì)的序列的突變體。
如這里使用的,術(shù)語(yǔ)″在嚴(yán)謹(jǐn)條件下雜交″指45℃下6X氯化鈉/檸檬酸鈉(SSC)中雜交,接著在65℃下0.2XSSC,0.1%SDS中洗滌兩次的條件。
術(shù)語(yǔ)″結(jié)合偏好″指多肽相對(duì)于另一個(gè)選擇一個(gè)核酸結(jié)合位點(diǎn)的有識(shí)別力的性質(zhì)。例如,當(dāng)多肽相對(duì)于核酸結(jié)合位點(diǎn)的量有限時(shí),更大量的多肽將在這里描述的體內(nèi)或體外測(cè)試中結(jié)合相對(duì)于其它位點(diǎn)來說偏好的位點(diǎn)。
如這里使用的,術(shù)語(yǔ)″識(shí)別″指多肽區(qū)別一個(gè)核酸結(jié)合位點(diǎn)和第二個(gè)競(jìng)爭(zhēng)位點(diǎn)的能力,以致在例如這里描述的測(cè)試中所述多肽在過量第二位點(diǎn)存在下保持與第一位點(diǎn)結(jié)合。所述多肽對(duì)于要單獨(dú)結(jié)合的第一位點(diǎn)可以沒有足夠的親合力,但是當(dāng)與結(jié)合附近募集位點(diǎn)的另一個(gè)核酸融合成本發(fā)明的雜合多肽時(shí)可以被檢測(cè)出。
如這里使用的,″簡(jiǎn)并寡核苷酸″指能夠與一個(gè)以上的序列例如帶有非天然核苷酸例如肌苷的寡核苷酸退火的(a)不同寡核苷酸群體和(b)一種寡核苷酸。
本發(fā)明提供了很多好處。篩選識(shí)別特定序列的DNA結(jié)合結(jié)構(gòu)域的能力使得可以設(shè)計(jì)結(jié)合DNA上特異性位點(diǎn)的新的多肽。因此,本發(fā)明有利于常規(guī)產(chǎn)生能夠調(diào)節(jié)選定靶標(biāo)的表達(dá)的新的多肽,例如,能夠抑制病原體需要的基因,能夠抑制癌癥生長(zhǎng)需要的基因,能夠激活并且超表達(dá)表達(dá)不好的基因或者編碼突變蛋白質(zhì)的基因,等等。
鋅指結(jié)構(gòu)域的應(yīng)用是特別有益的。首先,鋅指基序識(shí)別非常不同的DNA序列。第二,天然存在的鋅指蛋白的結(jié)構(gòu)是模塊化的。例如,鋅指蛋白Zif268,也稱為″Egr-1″,由三個(gè)鋅指結(jié)構(gòu)域串連排列組成。
圖1是由與DNA復(fù)合的三個(gè)指組成的鋅指蛋白Zif268的x-射線結(jié)晶學(xué)結(jié)構(gòu)(Pavletich和Pabo,(1991)Science 252809-817)。每一個(gè)指獨(dú)立地接觸DNA識(shí)別位點(diǎn)的3-4堿基對(duì)。因此,各個(gè)指接觸的亞位點(diǎn)可以被認(rèn)為是獨(dú)立的分子識(shí)別事件。相同多肽鏈中有多個(gè)鋅指組件的共同操作作用可實(shí)現(xiàn)高親合力結(jié)合。
體內(nèi)篩選步驟的應(yīng)用使人直接鑒定胞內(nèi)介質(zhì)中結(jié)合DNA上的特異性位點(diǎn)的那些多肽。與細(xì)胞中特別是真核細(xì)胞中的識(shí)別作用相關(guān)的因素可以大大不同于體外篩選方案中存在的因素。例如,在真核細(xì)胞核中,多肽一定會(huì)與無(wú)數(shù)其它核蛋白競(jìng)爭(zhēng)特異性核酸結(jié)合位點(diǎn)。核小體或者其它染色質(zhì)蛋白質(zhì)可以占據(jù),閉合,或者競(jìng)爭(zhēng)結(jié)合位點(diǎn)。即使如果不結(jié)合,細(xì)胞中核酸的構(gòu)象也易于彎曲,超卷曲,扭轉(zhuǎn),和解旋。相反地,多肽本身暴露于蛋白酶和伴侶蛋白,以及其它因素。此外,該多肽面對(duì)可能的結(jié)合位點(diǎn)的整個(gè)基因組,因此為了幸免于篩選過程一定會(huì)被賦予對(duì)于期望位點(diǎn)的高特異性。與體內(nèi)篩選相反,體外篩選能夠篩選最高親合力結(jié)合劑而不是最高特異性結(jié)合劑。
利用報(bào)道基因來指示表達(dá)的多肽嵌合體的結(jié)合能力不僅是有效而簡(jiǎn)單的,而且還避免了發(fā)展復(fù)雜的相互作用密碼的需要,所述密碼解釋蛋白質(zhì)-核酸界面的能量學(xué)和大量外周因素,例如周圍的殘基和也影響結(jié)合界面的核苷酸。(Segal等(1999)Proc.Natl.Acad.Sci.USA 962758-2763)。
本發(fā)明利用人基因組或者任何其它基因組中存在的所有的鋅指結(jié)構(gòu)域。鋅指結(jié)構(gòu)域折疊結(jié)構(gòu)占據(jù)的序列空間的不同取樣可以具有天然篩選時(shí)代固有的另外的優(yōu)點(diǎn)。此外,通過利用來自宿主物種結(jié)構(gòu)域,通過這里描述的方法進(jìn)行改造用于基因治療應(yīng)用的DNA結(jié)合蛋白具有被認(rèn)為是宿主免疫應(yīng)答的外來物質(zhì)的減小的可能性。
附圖和下面的說明書中給出本發(fā)明的一個(gè)或多個(gè)實(shí)施方案的詳細(xì)描述。說明書,附圖和權(quán)利要求書使得本發(fā)明的其它特征,目的,和優(yōu)點(diǎn)清晰可見。
附圖描述圖1是對(duì)由三個(gè)指結(jié)構(gòu)域組成的并且結(jié)合DNA序列,5’-GCG TGG GCGT-3’的Zif268鋅指蛋白的三維結(jié)構(gòu)的說明。黑色圓圈代表鋅離子的位置。
圖2是Zif268的氨基酸殘基與DNA堿基之間氫鍵相互作用的說明。沿著α-螺旋的位置-1,2,3,和6處的氨基酸殘基與特異性位置處的堿基相互作用。粗體線代表理想氫鍵,而虛線代表可能的氫鍵。
圖3是總結(jié)DNA堿基與沿著鋅指結(jié)構(gòu)域α-螺旋的位置-1,2,3,和6處的氨基酸殘基之間的相互作用的識(shí)別密碼表。
圖4是氨基酸殘基和它們相應(yīng)的3堿基三聯(lián)體位置的描述。粗體線代表觀察到的主要相互作用,而虛線代表輔助相互作用。
圖5是說明這里公開的體內(nèi)篩選系統(tǒng)的原理圖。各種鋅指突變體中,鋅指結(jié)構(gòu)域A識(shí)別靶序列(指定為XXX X)并且激活HIS3報(bào)道基因的轉(zhuǎn)錄。作為結(jié)果,酵母菌落在沒有組氨酸的培養(yǎng)基中生長(zhǎng)。相反,鋅指結(jié)構(gòu)域B不識(shí)別該靶序列并且因此該報(bào)道基因保持被抑制。作為結(jié)果,沒有組氨酸的培養(yǎng)基中沒有生長(zhǎng)菌落。AD代表轉(zhuǎn)錄激活結(jié)構(gòu)域。
圖6是HIV-1的長(zhǎng)末端重復(fù)序列(LTR)和CCR5(編碼HIV-1共同受體的人基因)的啟動(dòng)子區(qū)中發(fā)現(xiàn)的10-bp序列表(分別是SEQ IDNOs1-5)。下劃線部分代表該篩選中使用的4-bp靶序列。
圖7是與報(bào)道基因連接的結(jié)合位點(diǎn)的堿基序列的描述(分別是SEQID NOs6-17)。每個(gè)結(jié)合位點(diǎn)由4個(gè)復(fù)合結(jié)合序列的串連排列組成。通過連接Zif268的指1和指2識(shí)別的截短的結(jié)合序列5’-GG GCG-3’和4-bp靶序列構(gòu)建每個(gè)復(fù)合結(jié)合序列。
圖8是pPCFMS-Zif圖,pPCFMS-Zif是能用來構(gòu)建雜合質(zhì)粒庫(kù)的質(zhì)粒(SEQ ID NOs18和19)。
圖9代表編碼插入到pPCFMS-Zif中的Zif268鋅指蛋白的基因的堿基序列和相應(yīng)的翻譯的氨基酸序列(分別是SEQ ID NOs20和21)。下劃線是限制酶識(shí)別的位點(diǎn)。
圖10是有使用通過體內(nèi)篩選系統(tǒng)篩選的鋅指蛋白從再轉(zhuǎn)化和交叉轉(zhuǎn)化獲得的酵母細(xì)胞的培養(yǎng)板的照片。
圖11是通過體內(nèi)系統(tǒng)從由人基因組衍生的鋅指庫(kù)篩選的鋅指結(jié)構(gòu)域的一些DNA序列和DNA序列編碼的氨基酸序列的列表(SEQ IDNOs22-33)。相應(yīng)于用來從人基因組擴(kuò)增編碼鋅指結(jié)構(gòu)域的DNA片段的簡(jiǎn)并PCR引物的DNA序列有下劃線。指明了四個(gè)可能的堿基接觸位置,粗體指示氨基酸殘基。斜體字指出預(yù)期與鋅離子配位的兩個(gè)Cys殘基和兩個(gè)His殘基。
詳細(xì)描述本發(fā)明特征在于測(cè)定試驗(yàn)鋅指結(jié)構(gòu)域核酸結(jié)合偏好的新的篩選方法。該方法容易改動(dòng)以適合各種DNA結(jié)合結(jié)構(gòu)域,各種這些結(jié)構(gòu)域的來源,和多種文庫(kù)設(shè)計(jì),報(bào)道基因,和選擇和篩選系統(tǒng)。該篩選方法可以作為高流通量平臺(tái)加以實(shí)施。從該篩選方法獲得的信息容易應(yīng)用于設(shè)計(jì)人工核酸結(jié)合蛋白的方法。該設(shè)計(jì)方法利用試驗(yàn)鋅指結(jié)構(gòu)域的結(jié)合偏好指導(dǎo)嵌合核酸結(jié)合蛋白的組件裝配。可以利用該篩選方法進(jìn)一步優(yōu)化或改變?cè)O(shè)計(jì)的蛋白質(zhì)。
DNA結(jié)合結(jié)構(gòu)域本發(fā)明利用具有不同結(jié)合特異性的核酸結(jié)合結(jié)構(gòu)域的集合。已知各種各樣的蛋白質(zhì)結(jié)構(gòu)以高親和性和高特異性結(jié)合核酸。在多種不同蛋白質(zhì)中重復(fù)使用這些結(jié)構(gòu)來特異性控制核酸功能(關(guān)于識(shí)別雙鏈DNA的結(jié)構(gòu)基序的綜述參見例如,Pabo和Sauer(1992)Annu.Rev.Biochem.611053-95;Patikoglou和Burley(1997)Annu.Rev.Biophys.Biomol.Struct.26289-325;Nelson(1995)Curr Opin Genet Dev.5180-9)。核酸結(jié)合結(jié)構(gòu)域的幾個(gè)非限制性例子包括鋅指.鋅指是大約30個(gè)氨基酸殘基的小多肽結(jié)構(gòu)域,其中有四個(gè)氨基酸,或者是半胱氨酸或者是組氨酸,適當(dāng)間隔,使得它們能夠配位鋅離子(圖1;關(guān)于綜述,參見例如,Klug和Rhodes,(1987)Trends Biochem.Sci.12464-469(1987);Evans和Hollenberg,(1988)Cell 521-3;Payre和Vincent,(1988)FEBS Lett.234245-250;Miller等,(1985)EMBO J.41609-1614;Berg,(1988)Proc.Natl.Acad.Sci.U.S.A.8599-102;Rosenfeld和Margalit,(1993)J.Biomol.Struct.Dyn.11557-570)。因此,鋅指結(jié)構(gòu)域可以根據(jù)配位鋅離子的殘基的特性分類,例如分為Cys2-His2類,Cys2-Cys2類,Cys2-CysHis類,等等。Cys2-His2鋅指的鋅配位殘基一般作如下間隔Xa-X-C-X2-5-C-X3-Xa-X5-φ-X2-H-X3-5-H,其中φ(psi)是疏水性殘基(Wolfe等,(1999)Annu.Rev.Biophys.Biomol.Struct.3183-212)(SEQ ID NO76),其中″X″代表任何氨基酸,其中Xa是苯丙氨酸或酪氨酸,腳注指示氨基酸的數(shù)目,兩個(gè)腳注指示插入的氨基酸的一般范圍。一般情況下,插入的氨基酸折疊形成反平行β-折疊,其對(duì)α-螺旋疊集,但是反平行β-折疊可以是短的,非理想的,或者不存在的。折疊位于鋅配位側(cè)鏈,這樣它們處于適合配位鋅離子的四面體構(gòu)象。堿基接觸殘基位于鋅指的N-末端并且在前面的環(huán)形區(qū)中(圖2)。鋅指DNA-結(jié)合蛋白正常地由三個(gè)或多個(gè)鋅指結(jié)構(gòu)域的串連排列組成。
鋅指結(jié)構(gòu)域(或″ZFD″)是在從酵母到高級(jí)植物到人的物種中發(fā)現(xiàn)的最常見的真核細(xì)胞DNA結(jié)合基序之一。據(jù)估計(jì),僅在人基因組中至少存在幾千個(gè)鋅指結(jié)構(gòu)域??梢詮匿\指蛋白分離鋅指結(jié)構(gòu)域。鋅指蛋白的非限制性例子包括CF2-II,Kruppel,WTl,堿性核蛋白,BCL-6/LAZ-3,紅細(xì)胞Kruppel-樣轉(zhuǎn)錄因子,轉(zhuǎn)錄因子Sp1,Sp2,Sp3,和Sp4,轉(zhuǎn)錄抑制劑YY1,EGR1/Krox24,EGR2/Krox20,EGR3/Pilot,EGR4/AT133,Evi-1,GLI1,GLI2,GLI3,HIV-EP1/ZNF40,HIV-EP2,KR1,ZfX,ZfY,和ZNF7。
可以利用下面描述的計(jì)算機(jī)方法來鑒定測(cè)序的基因組中或者核酸數(shù)據(jù)庫(kù)中編碼的所有的鋅指結(jié)構(gòu)域??梢允褂盟械倪@樣的鋅指結(jié)構(gòu)域。另外,例如利用計(jì)算機(jī)方法設(shè)計(jì)了人工鋅指結(jié)構(gòu)域(例如,Dahiyat和Mayo,(1997)Science 27882-7)。Dahiyat和Mayo的鋅指采用鋅指折疊,但是其核心不包含鋅離子。這樣,就其多肽骨架與天然存在的鋅指的折疊的結(jié)構(gòu)類似性來說,而不是就其配合鋅離子的功能能力來說,其是鋅指。
同源異型域.同源異型域是初級(jí)真核細(xì)胞結(jié)構(gòu)域,其由接觸DNA小溝的N-末端臂,接著的接觸大溝的三個(gè)α-螺旋組成(關(guān)于綜述,參見,Laughon,(1991)Biochemistry 3011357-67)。第三α-螺旋位于大溝中并且包含決定性的DNA-接觸側(cè)鏈。同源異型域具有在導(dǎo)向第三α-螺旋轉(zhuǎn)角處存在的特征性高度保守基序。所述基序包括包在該結(jié)構(gòu)域疏水性中心中的不變的色氨酸。在Prosite數(shù)據(jù)庫(kù)(seehttp//www.expasy.ch/)中該基序被描述為PDOC00027([L/I/V/M/F/Y/G]-[A/S/L/V/R]-X(2)-[L/I/V/M/S/T/A/C/N]-X-[L/I/V/M]-X(4)-[L/I/V]-[R/K/N/Q/E/S/T/A/I/Y]-[L/I/V/F/S/T/N/K/H]-W-[F/Y/V/C]-X-[N/D/Q/T/A/H]-X(5)-[R/K/N/A/I/M/W];SEQ ID NO77)。同源異型域一般在決定細(xì)胞特性的轉(zhuǎn)錄因子中發(fā)現(xiàn)并且在生物體發(fā)育期間提供位置信息。在基因組中成簇發(fā)現(xiàn)這樣的標(biāo)準(zhǔn)的同源異型域,使得同源異型域在簇中的順序大約相應(yīng)于它們沿著體軸線的表達(dá)模式。通過與同源異型域例如Hox-1排列,或者通過與同源異型域分布或者同源異型域隱藏Markov模型(HMM;參見下文)例如,Pfam數(shù)據(jù)庫(kù)的PF00046或者SMART數(shù)據(jù)庫(kù)(http//smart.embl-heidelberg.de/)的″HOX″排列,或者通過上述Prosite基序PDOC00027,可以鑒定同源異型域。
螺旋-轉(zhuǎn)角-螺旋蛋白.這種DNA結(jié)合基序在很多原核轉(zhuǎn)錄因子中常見。有很多亞家族,例如,LacI家族,AraC家族,等等。名稱中的兩個(gè)螺旋指緊靠并且位于DNA的大溝中第二α-螺旋組裝的第一α-螺旋。通過與HMM,例如,SMART數(shù)據(jù)庫(kù)(http//smart.embl-heidelberg.de/)可獲得的HTH_ARAC,HTH_ARSR,HTH_ASNC,HTH_CRP,HTH_DEOR,HTH_DTXR,HTH_GNTR,HTH_ICLR,HTH_LACI,HTH_LUXR,HTH_MARR,HTH_MERR,和HTH_XRE分布排列,可以鑒定這些結(jié)構(gòu)域。
螺旋-環(huán)-螺旋蛋白.通常在同源和異源二聚轉(zhuǎn)錄因子例如MyoD,fos,jun,E11,和肌細(xì)胞生成素中常發(fā)現(xiàn)這種DNA結(jié)合結(jié)構(gòu)域。該結(jié)構(gòu)域由二聚體組成,每一個(gè)單體有兩個(gè)α-螺旋和中間的環(huán)。通過與HMM例如SMART數(shù)據(jù)庫(kù)(http//smart.embl-heidelberg.de/)可獲得的″HLH″分布排列,可以鑒定該結(jié)構(gòu)域。盡管螺旋-環(huán)-螺旋蛋白一般是二聚體,但是通過在兩個(gè)亞基之間基因工程插入多肽連接體使得單一可讀框編碼這兩個(gè)亞基和該連接體,能夠構(gòu)建單體形式。
DNA結(jié)合結(jié)構(gòu)域的鑒定可以利用各種各樣的方法來鑒定結(jié)構(gòu)域。
計(jì)算機(jī)方法.可以將通過這里描述的方法分離的DNA結(jié)合結(jié)構(gòu)域的氨基酸序列與已知序列的數(shù)據(jù)庫(kù)相比較的,所述已知序列的數(shù)據(jù)庫(kù)例如蛋白質(zhì)序列的注釋數(shù)據(jù)庫(kù)或者包括核酸結(jié)合結(jié)構(gòu)域全部的注釋數(shù)據(jù)庫(kù)。在另一個(gè)實(shí)施方案中,沒有表征的序列例如沒有注釋的基因組,EST或者全長(zhǎng)cDNA序列的數(shù)據(jù)庫(kù);表征的序列的數(shù)據(jù)庫(kù),例如SwissProt或PDB;和結(jié)構(gòu)域數(shù)據(jù)庫(kù),例如,Pfam,ProDom(http//www.tooulouse.inra.fr/),和SMART(Simple ModularArchitecture Research Tool,http//smart.embl-heidelberg.de/)能夠提供核酸結(jié)合結(jié)構(gòu)域序列的來源。為了與查詢氨基酸序列相比較的目的在所有六個(gè)可讀框中可以翻譯核酸序列數(shù)據(jù)庫(kù)??梢詮暮线m的核酸來源,例如基因組DNA或細(xì)胞RNA,擴(kuò)增標(biāo)記為編碼候選核酸結(jié)合結(jié)構(gòu)域的核酸序列。這樣的核酸序列可以克隆到表達(dá)載體中。以計(jì)算機(jī)為基礎(chǔ)的結(jié)構(gòu)域鑒定程序可以與寡核苷酸合成儀和機(jī)器人系統(tǒng)接合,在高流通量平臺(tái)產(chǎn)生編碼結(jié)構(gòu)域的核酸。編碼候選結(jié)構(gòu)域的克隆的核酸也可以貯存在宿主表達(dá)載體中并且容易穿梭到表達(dá)載體中,例如到攜帶Zif268指1和2的翻譯融合載體中,這或者通過限制酶介導(dǎo)的亞克隆或者通過位點(diǎn)特異的,重組酶介導(dǎo)的亞克隆(參見美國(guó)專利No.5,888,732)??梢岳酶吡魍科脚_(tái)來產(chǎn)生含有編碼不同的候選核酸結(jié)合結(jié)構(gòu)域的核酸的多個(gè)微量滴定平板。
從起始序列或者分布(profile)鑒定結(jié)構(gòu)域的詳細(xì)方法是本領(lǐng)域公知的。參見,例如,Prosite(Hofmann等,(1999)Nucleic Acids Res.27215-219),F(xiàn)ASTA,BLAST(Altschul等,(1990)J.Mol.Biol.215403-10.),等??梢赃M(jìn)行簡(jiǎn)單的字串檢索來發(fā)現(xiàn)與查詢序列或查詢分布具有同一性的氨基酸序列,例如,使用Perl(http//bio.perl.org/)來掃描文本文件。這樣鑒定序列可以與最初輸入的序列有大約30%,40%,50%,60%,70%,80%,90%,或更大的同一性。
可以從公開數(shù)據(jù)庫(kù)鑒定與查詢結(jié)構(gòu)域類似的結(jié)構(gòu)域,例如,使用Altschul等,(1990)J.Mol.Biol.215403-10的XBLAST程序(2.0版本)。例如,可以使用如下XBLAST參數(shù)進(jìn)行BLAST蛋白質(zhì)檢索分?jǐn)?shù)=50,字長(zhǎng)度=3。根據(jù)Altschul等,(1997)Nucleic Acids Res.25(17)3389-3402所述,可以將間隙引入查詢或檢索序列。在http//www.ncbi.nlm.nih.gov可獲得XBLLAST和Gapped BLAST程序的默認(rèn)參數(shù)。
Prosite分布PS00028和PS50157可以用來鑒定鋅指結(jié)構(gòu)域。在-SWISSPROT中公開了80,000個(gè)蛋白質(zhì)序列,這些分布分別檢測(cè)了3189和2316鋅指結(jié)構(gòu)域。通過各種各樣的不同的技術(shù)從相關(guān)蛋白質(zhì)的多個(gè)序列排列能夠構(gòu)建分布。Gribskov和同事(Gribskov等,(1990)Meth.Enzymol.183146-159)利用符號(hào)對(duì)比表來將殘基頻率分布及提供的多個(gè)序列排列轉(zhuǎn)化為對(duì)于每一個(gè)位置的加權(quán)。參見,例如,PROSITE數(shù)據(jù)庫(kù)和Luethy等的工作,(1994)Protein Sci.3139-1465。
可以從這樣的模型的數(shù)據(jù)庫(kù)例如Pfam數(shù)據(jù)庫(kù)2.1版本產(chǎn)生或獲得代表感興趣的DNA結(jié)合結(jié)構(gòu)域的Hidden Markov模型(HMM’s)。例如使用默認(rèn)參數(shù),使用HMM檢索數(shù)據(jù)庫(kù),以發(fā)現(xiàn)另外的結(jié)構(gòu)域(參見,例如,http//www.sanger.ac.uk/Software/Pfam/HMM對(duì)于默認(rèn)參數(shù)的檢索)?;蛘撸褂谜呖梢詢?yōu)化參數(shù)??梢赃x擇閾值分?jǐn)?shù)來過濾序列數(shù)據(jù)庫(kù)使得分?jǐn)?shù)高于閾值的序列顯示是候選結(jié)構(gòu)域。在Sonhammer等,(1997)Proteins 28(3)405-420中可以找到Pfam數(shù)據(jù)庫(kù)的描述,并且例如在Gribskov等,(1990)Meth.Enzymol.183146-159;Gribskov等,(1987)Proc.Natl.Acad.Sci.USA 844355-4358;Krogh等,(1994)J.Mol.Biol.2351501-1531;和Stultz等,(1993)Protein Sci.2305-314中可以找到HMMs的詳細(xì)描述。
HMM’s的SMART數(shù)據(jù)庫(kù)(Simple Modular Architecture ResearchTool,http//smart.embl-heidelberg.de/;Schultz等,(1998)Proc.Natl.Acad.Sci.USA 955857和Schultz等,(2000)Nucl.Acids Res28231)提供了鋅指結(jié)構(gòu)域目錄(ZnF_C2H2;ZnF_C2C2;ZnF_C2HC;ZnF_C3H1;ZnF_C4;ZnF_CHCC;ZnF_GATA;和ZnF_NFX),是通過HMMer2檢索程序的hidden Markov模型分布鑒定的(Durbin等,(1998)Biological sequence analysisprobabilistic models of proteins andnucleic acids.Cambridge University Press.;http//hmmer.wustl.edu/)。
以雜交為基礎(chǔ)的方法.可以分析編碼不同形式的DNA結(jié)合結(jié)構(gòu)域的核酸的集合以獲得編碼保守氨基-和羧基-末端邊界序列的序列分布??梢栽O(shè)計(jì)簡(jiǎn)并寡核苷酸來雜交編碼這樣的保守邊界序列的序列,此外,通過將它們的組成與已知基因組序列中可能的退火位點(diǎn)的頻率相比較可以估計(jì)這樣的簡(jiǎn)并寡核苷酸的效率??梢岳枚啻卧O(shè)計(jì)來優(yōu)化簡(jiǎn)并寡核苷酸。例如,已知Cys2-His2鋅指的比較揭示了天然序列中相鄰指之間的連接體區(qū)中共同序列(Agata等,(1998)Gene 21355-64)。使用這樣的簡(jiǎn)并寡核苷酸擴(kuò)增多個(gè)DNA結(jié)合結(jié)構(gòu)域。擴(kuò)增的結(jié)構(gòu)域作為試驗(yàn)鋅指結(jié)構(gòu)域插入雜合核酸中,并且接著通過這里描述的方法測(cè)定與靶位點(diǎn)的結(jié)合。
文庫(kù)設(shè)計(jì)該方法使得可以對(duì)編碼DNA結(jié)合結(jié)構(gòu)域的核酸的集合(例如,質(zhì)粒,噬粒,或者噬菌體文庫(kù)的形式)篩選功能核酸結(jié)合性質(zhì)。該集合能夠編碼不同組的DNA結(jié)合結(jié)構(gòu)域,甚至不同折疊結(jié)構(gòu)的結(jié)構(gòu)域。在一個(gè)例子中,該集合編碼單一折疊結(jié)構(gòu)的結(jié)構(gòu)域例如鋅指結(jié)構(gòu)域。盡管對(duì)鋅指結(jié)構(gòu)域描述了下面的方法,但是本領(lǐng)域技術(shù)人員應(yīng)該能將它們適用于核酸結(jié)合結(jié)構(gòu)域的其它類型。
突變結(jié)構(gòu)域.在另一個(gè)例子中,所述集合由從簡(jiǎn)并模式文庫(kù)裝配的結(jié)構(gòu)域的編碼核酸組成。例如,在鋅指的例子中,可以利用已知鋅指的排列來鑒定各位置處的最佳氨基酸?;蛘撸梢岳媒Y(jié)構(gòu)研究和誘變實(shí)驗(yàn)來測(cè)定各位置處的氨基酸的優(yōu)選性質(zhì)。任何核酸結(jié)合結(jié)構(gòu)域可以被用作誘導(dǎo)誘變的結(jié)構(gòu)構(gòu)架。特別地,對(duì)于誘變可以定向緊鄰核酸結(jié)合界面的位置或者與該位置鄰接的位置。利用模式化簡(jiǎn)并庫(kù),突變的試驗(yàn)鋅指結(jié)構(gòu)域可以在任何突變位置被約束成可能氨基酸的子集。可以用簡(jiǎn)并密碼子組在各個(gè)位置處編碼該分布。例如,可獲得只編碼疏水性殘基,脂肪族殘基,或者親水性殘基的密碼子組。可以對(duì)文庫(kù)篩選編碼折疊多肽的全長(zhǎng)克隆。Cho等((2000)J.Mol.Biol.297(2)309-19)提供了使用簡(jiǎn)并寡核苷酸產(chǎn)生這樣的簡(jiǎn)并文庫(kù)的方法,還提供了篩選編碼全長(zhǎng)多肽的文庫(kù)核酸的方法。對(duì)于這里描述的篩選方法,使用常規(guī)的限制性酶切位點(diǎn)或者轉(zhuǎn)座酶或重組酶識(shí)別位點(diǎn),可以容易地將這樣的核酸插入表達(dá)質(zhì)粒中。
通過簡(jiǎn)單地檢查表示遺傳密碼的表或者通過計(jì)算算法可以確定給定位置處合適的密碼子的篩選和各核苷酸的相對(duì)比例。例如,Cho等,上文,描述了輸入期望的簡(jiǎn)并蛋白質(zhì)序列,輸出編碼該序列的優(yōu)選寡核苷酸設(shè)計(jì)的計(jì)算機(jī)程序。
天然全部結(jié)構(gòu)域的分離.可以從真核細(xì)胞生物體例如人的基因組DNA或cDNA構(gòu)建結(jié)構(gòu)域文庫(kù)。進(jìn)行這樣的構(gòu)建有多種方法。例如,如上所述,可以利用可獲得氨基酸序列的計(jì)算機(jī)檢索來鑒定結(jié)構(gòu)域??梢苑蛛x編碼每一個(gè)結(jié)構(gòu)域的核酸并且插入到適合在細(xì)胞中表達(dá)的載體中,例如含有啟動(dòng)子,激活結(jié)構(gòu)域和可選擇標(biāo)記的載體。在另一個(gè)實(shí)施例中,使用與保守基序雜交的簡(jiǎn)并寡核苷酸例如通過PCR擴(kuò)增大量含有該基序的有關(guān)結(jié)構(gòu)域。例如,Kruppel-樣Cys2His2鋅指可以通過Agata等,(1998)Gene 21355-64的方法擴(kuò)增。該方法也保留了天然存在的鋅指結(jié)構(gòu)域連接體肽序列,例如,具有下面模式的序列Thr-Gly-(Glu/Gln)-(Lys/Arg)-Pro-(Tyr/Phe)(SEQ ID NO78)。此外,篩選限于感興趣的結(jié)構(gòu)域的集合,不像篩選沒有篩選的基因組或cDNA序列的文庫(kù),顯著降低了文庫(kù)的復(fù)雜性并且降低了由于完全篩選大的文庫(kù)所固有的困難而遺失期望的序列的可能性。
人基因組含有多個(gè)鋅指結(jié)構(gòu)域,其中很多還沒有被表征并且沒有被鑒定。估計(jì)有幾千個(gè)編碼帶有鋅指結(jié)構(gòu)域的蛋白質(zhì)的基因(Pellegrino和Berg,(1991)Proc.Natl.Acad.Sci.USA 88671-675)。這些人鋅指結(jié)構(gòu)域代表不同結(jié)構(gòu)域的廣泛集合,從中可以構(gòu)建新的DNA-結(jié)合蛋白。如果每一個(gè)鋅指結(jié)構(gòu)域識(shí)別一個(gè)獨(dú)特的3-至4-bp序列,則結(jié)合所有可能的3-至4-bp序列所需要的結(jié)構(gòu)域的總數(shù)只是64至256(43至44)??赡艿氖翘烊蝗咳嘶蚪M含有足夠數(shù)目的獨(dú)特的鋅指結(jié)構(gòu)域,跨越所有可能的識(shí)別位點(diǎn)。這些鋅指結(jié)構(gòu)域是構(gòu)建人工嵌合DNA-結(jié)合蛋白的有價(jià)值的來源。天然存在的鋅指結(jié)構(gòu)域,不像從人基因組衍生的人工突變體,在天然篩選壓力下進(jìn)化,因此對(duì)于結(jié)合特異性DNA序列和體內(nèi)功能可能被天然優(yōu)化。
例如在基因治療應(yīng)用中當(dāng)導(dǎo)入人體中時(shí),人鋅指結(jié)構(gòu)域誘導(dǎo)免疫應(yīng)答的可能性大大減小。
具有特異性DNA結(jié)合性質(zhì)的鋅指結(jié)構(gòu)域的體內(nèi)篩選使用下面的體內(nèi)篩選系統(tǒng)可以鑒定具有期望的DNA識(shí)別性質(zhì)的鋅指結(jié)構(gòu)域。將感興趣的復(fù)合結(jié)合位點(diǎn)插入報(bào)道基因下游使得轉(zhuǎn)錄激活結(jié)構(gòu)域募集到復(fù)合結(jié)合位點(diǎn),導(dǎo)致提高報(bào)道基因轉(zhuǎn)錄高于給定水平。構(gòu)建編碼由與固定DNA結(jié)合結(jié)構(gòu)域融合的試驗(yàn)鋅指結(jié)構(gòu)域和轉(zhuǎn)錄激活結(jié)構(gòu)域組成的雜合蛋白的表達(dá)質(zhì)粒。
復(fù)合結(jié)合位點(diǎn)包括至少兩個(gè)元件,募集位點(diǎn)和靶位點(diǎn)。該系統(tǒng)經(jīng)基因工程處理使得固定DNA結(jié)合結(jié)構(gòu)域識(shí)別募集位點(diǎn)。但是,固定DNA結(jié)合結(jié)構(gòu)域?qū)τ谀技稽c(diǎn)的結(jié)合親合力是使得體內(nèi)它獨(dú)自不足以轉(zhuǎn)錄激活報(bào)道基因的親合力。通過對(duì)照實(shí)驗(yàn)可以證實(shí)這一點(diǎn)。
例如,當(dāng)在細(xì)胞中表達(dá)時(shí),固定DNA結(jié)合結(jié)構(gòu)域(不存在試驗(yàn)鋅指結(jié)構(gòu)域,或者存在已知沒有功能或者其已知的DNA接觸殘基已經(jīng)被另一種氨基酸例如丙氨酸置換的試驗(yàn)鋅指結(jié)構(gòu)域)應(yīng)該不能激活高于很低水平的報(bào)道基因的轉(zhuǎn)錄。一些滲漏的或者低水平激活作用是可以的,因?yàn)槠渌椒梢詫⒃撓到y(tǒng)靈敏化(例如,通過使用報(bào)道基因的競(jìng)爭(zhēng)抑制劑)。預(yù)期固定DNA結(jié)合結(jié)構(gòu)域不穩(wěn)定結(jié)合募集位點(diǎn)。例如,固定DNA結(jié)合結(jié)構(gòu)域能以大約0.1nM,1nM,1μM,10μM,100μM,或者更大的解離常數(shù)(Kd)結(jié)合募集位點(diǎn)。通過不存在試驗(yàn)鋅指結(jié)構(gòu)域或者不存在對(duì)于第二靶位點(diǎn)具有特異性的試驗(yàn)鋅指結(jié)構(gòu)域下通過電泳遷移率變動(dòng)分析(EMSA),可以體外測(cè)定DNA結(jié)合結(jié)構(gòu)域?qū)τ诎形稽c(diǎn)的Kd。
因此,識(shí)別靶位點(diǎn)例如復(fù)合結(jié)合位點(diǎn)的可變位點(diǎn)的功能試驗(yàn)鋅指結(jié)構(gòu)域的連接對(duì)于雜合蛋白穩(wěn)定結(jié)合細(xì)胞中復(fù)合結(jié)合位點(diǎn)是必需的,從而激活報(bào)道基因。試驗(yàn)鋅指結(jié)構(gòu)域?qū)υ摪形稽c(diǎn)的結(jié)合偏好導(dǎo)致報(bào)道基因表達(dá)相對(duì)給定水平提高。例如,觀察水平除以給定水平所獲得的報(bào)道基因表達(dá)增加的倍數(shù)大約是2,4,8,20,50,100,1000倍或者更大。當(dāng)試驗(yàn)鋅指結(jié)構(gòu)域識(shí)別靶位點(diǎn)時(shí),DNA結(jié)合結(jié)構(gòu)域和試驗(yàn)鋅指結(jié)構(gòu)域的轉(zhuǎn)錄因子的Kd降低,例如,相對(duì)于沒有對(duì)于靶位點(diǎn)有特異性的試驗(yàn)鋅指結(jié)構(gòu)域的轉(zhuǎn)錄因子來說。例如,與對(duì)其有特異性的靶位點(diǎn)復(fù)合的轉(zhuǎn)錄因子的解離常數(shù)(Kd)可以是大約50nM,10nM,1nM,0.1nM,0.01nM或者更小。通過EMSA可以體外測(cè)定Kd。
通過測(cè)定試驗(yàn)鋅指結(jié)構(gòu)域增加固定DNA結(jié)合結(jié)構(gòu)域的體內(nèi)結(jié)合親合力的能力可以靈敏而精確地測(cè)定DNA結(jié)合特異性的發(fā)現(xiàn)使得從人基因組快速分離和表征新的鋅指結(jié)構(gòu)域成為可行。
固定DNA結(jié)合結(jié)構(gòu)域包括從天然存在的DNA-結(jié)合蛋白例如具有多個(gè)結(jié)構(gòu)域或者是寡聚物的天然存在的DNA-結(jié)合蛋白分離的組件結(jié)構(gòu)域。例如,可以使用兩個(gè)已知的鋅指例如Zif268的指1和2作為固定DNA結(jié)合結(jié)構(gòu)域。本領(lǐng)域技術(shù)人員應(yīng)該能夠從眾多核酸結(jié)合結(jié)構(gòu)域(例如這里描述的結(jié)構(gòu)域家族,例如同源異型域,螺旋-轉(zhuǎn)角-螺旋結(jié)構(gòu)域,或者螺旋-環(huán)-螺旋結(jié)構(gòu)域,或者本領(lǐng)域充分表征過的核酸結(jié)合結(jié)構(gòu)域)中鑒定適合該系統(tǒng)的固定DNA結(jié)合結(jié)構(gòu)域。適當(dāng)篩選固定DNA結(jié)合結(jié)構(gòu)域識(shí)別的募集位點(diǎn)也是必需的。募集位點(diǎn)可以是從中獲得固定DNA結(jié)合結(jié)構(gòu)域的天然存在的DNA結(jié)合蛋白的天然結(jié)合位點(diǎn)中的亞位點(diǎn)。如果需要,為了使系統(tǒng)變得靈敏,可以將誘變導(dǎo)入固定結(jié)構(gòu)域或者導(dǎo)入募集位點(diǎn)。
適合體內(nèi)篩選系統(tǒng)的細(xì)胞包括真核細(xì)胞和原核細(xì)胞。舉例的真核細(xì)胞包括酵母細(xì)胞,例如啤酒酵母(Saccharomyces cerevisiae),Saccharomyces pombe,和巴斯德畢赤氏酵母(Pichia pastoris)細(xì)胞。
使用上述篩選系統(tǒng)修飾酵母單雜種系統(tǒng)(one-hybrid system),使用啤酒酵母,來篩選鋅指結(jié)構(gòu)域。首先,制備編碼HIS3報(bào)道基因的報(bào)道質(zhì)粒。預(yù)先測(cè)定的4-bp靶DNA序列與截短的結(jié)合序列連接,提供用于DNA-結(jié)合結(jié)構(gòu)域的復(fù)合結(jié)合序列,每一個(gè)復(fù)合結(jié)合序列在分開的質(zhì)粒上與報(bào)道基因可操作連接。
雜合核酸序列編碼與包括截短的DNA-結(jié)合結(jié)構(gòu)域和鋅指結(jié)構(gòu)域的DNA-結(jié)合結(jié)構(gòu)域連接的轉(zhuǎn)錄激活結(jié)構(gòu)域。
這里使用的結(jié)合位點(diǎn)不一定是連續(xù)的,但是常常使用連續(xù)的位點(diǎn)。在核酸結(jié)合結(jié)構(gòu)域之間可以使用柔順的和/或可延伸的連接體來構(gòu)建識(shí)別不連續(xù)位點(diǎn)的蛋白質(zhì)。
根據(jù)本發(fā)明的一個(gè)方面,可以使用由Zif268的指1和指2組成的沒有指3的多肽作為固定DNA-結(jié)合結(jié)構(gòu)域。(Zif268的三個(gè)鋅指結(jié)構(gòu)域中,指1指位于N-末端的鋅指結(jié)構(gòu)域,指2,中間的鋅指結(jié)構(gòu)域,和指3,C-末端的鋅指結(jié)構(gòu)域)?;蛘撸浣Y(jié)合位點(diǎn)被表征的任兩個(gè)鋅指結(jié)構(gòu)域可以被用作固定DNA-結(jié)合結(jié)構(gòu)域。
其它有用的DNA-結(jié)合結(jié)構(gòu)域可以衍生自其它鋅指蛋白,例如Sp1,CF2-II,YY1,Kruppel,WT1,Egr2,或者POU-結(jié)構(gòu)域蛋白,例如Oct1,Oct2,和Pit1。舉例提供這些,而本發(fā)明不局限于此。
根據(jù)本發(fā)明的一個(gè)具體實(shí)施例,通過從最佳Zif268識(shí)別序列(5’-GCG TGG GCG-3)的5’末端缺失4-bp產(chǎn)生的堿基序列5’-GGGCG-3’,可以被用作募集位點(diǎn)。3至4bp的任何靶序列可以連接該募集位點(diǎn),得到復(fù)合結(jié)合序列。
激活結(jié)構(gòu)域.可以在本發(fā)明中使用的轉(zhuǎn)錄激活結(jié)構(gòu)域包括但不限于來自酵母的Gal4激活結(jié)構(gòu)域和來自單純皰疹病毒的VP16結(jié)構(gòu)域。細(xì)菌中,通過融合能夠募集野生型RNA聚合酶α亞基C-末端結(jié)構(gòu)域或者突變體α亞基C-末端結(jié)構(gòu)域的結(jié)構(gòu)域,例如與蛋白質(zhì)相互作用結(jié)構(gòu)域融合的C-末端結(jié)構(gòu)域,能夠模擬激活結(jié)構(gòu)域功能。
抑制結(jié)構(gòu)域.如果期望,可以用抑制結(jié)構(gòu)域代替激活結(jié)構(gòu)域與DNA結(jié)合結(jié)構(gòu)域融合。真核細(xì)胞抑制結(jié)構(gòu)域的例子包括ORANGE,groucho,和WRPW(Dawson等,(1995)Mol.Cell Biol.156923-31)。當(dāng)使用抑制結(jié)構(gòu)域時(shí),可以使用毒物報(bào)道基因和/或非可選擇標(biāo)記來篩選降低的表達(dá)。
報(bào)道基因.報(bào)道基因可以是可選擇標(biāo)記,例如,帶來藥物抗性的基因或者營(yíng)養(yǎng)缺陷標(biāo)記。藥物抗性基因的例子包括啤酒酵母環(huán)六酰胺抗性(CYH)基因,啤酒酵母刀豆氨酸抗性基因(CAN1),和潮霉素抗性基因。啤酒酵母營(yíng)養(yǎng)缺陷標(biāo)記包括URA3,HIS3,LEU2,ADE2和TRP1基因。當(dāng)營(yíng)養(yǎng)缺陷標(biāo)記是報(bào)道基因時(shí),使用沒有營(yíng)養(yǎng)缺陷基因的功能拷貝并且因此缺乏產(chǎn)生特定代謝物能力的細(xì)胞。通過在沒有所述代謝物的培養(yǎng)基中保持細(xì)胞實(shí)現(xiàn)編碼結(jié)合靶位點(diǎn)的試驗(yàn)鋅指結(jié)構(gòu)域的構(gòu)建體的篩選。例如,可以使用HIS3基因作為與his3酵母菌株結(jié)合的可選擇標(biāo)記。將編碼雜合轉(zhuǎn)錄因子的構(gòu)建體導(dǎo)入之后,細(xì)胞在沒有組氨酸下生長(zhǎng)。對(duì)哺乳動(dòng)物細(xì)胞使用的可選擇標(biāo)記,例如胸苷激酶,新霉素抗性,和HPRT,也是技術(shù)人員公知的。
或者,報(bào)道基因編碼其存在可以容易地被檢測(cè)和/或定量測(cè)定的蛋白質(zhì)。舉例的報(bào)道基因包括lacZ,氯霉素乙酰轉(zhuǎn)移酶(CAT),螢光素酶,綠色熒光蛋白(GFP),β-葡糖醛酸酶(GUS),藍(lán)色熒光蛋白(BFP),和GFP的衍生物,例如,具有改變的或增強(qiáng)的熒光性質(zhì)(Clontech Laboratories.Inc.CA)。通過使菌落在含有比色底物X-gal的平板上生長(zhǎng)可以容易地檢測(cè)表達(dá)lacZ的細(xì)胞菌落。通過監(jiān)測(cè)激發(fā)時(shí)的熒光發(fā)射可以檢測(cè)GFP表達(dá)。利用熒光激活細(xì)胞分揀(FACS)可以鑒定和分離各表達(dá)GFP的細(xì)胞。
可以用兩個(gè)報(bào)道基因例如可選擇報(bào)道基因和不可選擇報(bào)道基因構(gòu)建該系統(tǒng)。可選擇標(biāo)記有利于快速鑒定感興趣的結(jié)構(gòu)域,這是在適當(dāng)?shù)纳L(zhǎng)條件下,只有攜帶感興趣的結(jié)構(gòu)域的細(xì)胞生長(zhǎng)。不可選擇報(bào)道基因提供一種檢驗(yàn)方法,例如來區(qū)別假陽(yáng)性,和定量測(cè)定結(jié)合程度的方法。這兩個(gè)報(bào)道基因可以在基因組中分開的位置整合,在基因組中串聯(lián)整合,包含在相同的染色體外元件(例如質(zhì)粒)上或者包含在分開的染色體外元件上。
圖5說明用來篩選期望的鋅指結(jié)構(gòu)域的修飾的單雜種體系的原理。雜合轉(zhuǎn)錄因子的DNA-結(jié)合結(jié)構(gòu)域由(a)由Zif268的指1和指2組成的截短的DNA-結(jié)合結(jié)構(gòu)域和(b)鋅指結(jié)構(gòu)域A或B組成。位于報(bào)道基因的啟動(dòng)子區(qū)的結(jié)合位點(diǎn)結(jié)合位點(diǎn)的堿基序列是復(fù)合結(jié)合序列(5’-XXXXGGGCG-3’),其由4-bp靶序列(核苷酸1-4,5’-XXXX-3’),和截短的結(jié)合序列(核苷酸5-9,5’-GGGCG-3’)組成。
如果雜合轉(zhuǎn)錄因子中的試驗(yàn)鋅指結(jié)構(gòu)域(圖5中的A)識(shí)別靶序列,則該雜合轉(zhuǎn)錄因子能夠結(jié)合穩(wěn)定復(fù)合結(jié)合序列。這種穩(wěn)定結(jié)合導(dǎo)致報(bào)道基因通過雜合轉(zhuǎn)錄因子的激活結(jié)構(gòu)域(圖5中的AD)的作用表達(dá)。作為結(jié)果,當(dāng)使用HIS3作為報(bào)道基因時(shí),轉(zhuǎn)化的酵母在沒有組氨酸的培養(yǎng)基中生長(zhǎng)?;蛘撸?dāng)使用lacZ作為報(bào)道基因時(shí),轉(zhuǎn)化的酵母在含有l(wèi)acZ蛋白質(zhì)的底物X-gal的培養(yǎng)基中作為蘭色菌落生長(zhǎng)。但是,如果雜合轉(zhuǎn)錄因子的鋅指結(jié)構(gòu)域(圖5中的B)不識(shí)別靶序列,則不誘導(dǎo)報(bào)道基因的表達(dá)。作為結(jié)果,轉(zhuǎn)化的酵母不能在沒有組氨酸的培養(yǎng)基中生長(zhǎng)(當(dāng)使用HIS3作為報(bào)道基因時(shí))或者作為白色菌落在含有X-gal的培養(yǎng)基中生長(zhǎng)(當(dāng)使用lacZ作為報(bào)道基因時(shí))。
使用這種修飾的單雜種系統(tǒng)的篩選方法是有利的,因?yàn)樽C明利用該方法篩選的鋅指結(jié)構(gòu)域在細(xì)胞環(huán)境中有功能。因此,推測(cè)該結(jié)構(gòu)域能夠折疊,進(jìn)入細(xì)胞核,并且經(jīng)得起胞內(nèi)蛋白酶和其它有效破壞胞內(nèi)物質(zhì)。此外,這里公開的修飾的單雜種系統(tǒng)使得可以快速而簡(jiǎn)單地分離期望的鋅指結(jié)構(gòu)域。修飾的單雜種系統(tǒng)只要求一輪酵母細(xì)胞轉(zhuǎn)化來分離期望的鋅指結(jié)構(gòu)域。
可以使用這里描述的篩選方法從基因組例如植物或動(dòng)物物種(例如哺乳動(dòng)物,例如人)的基因組鑒定鋅指結(jié)構(gòu)域。也可以用該方法從例如通過隨機(jī)誘變制備的突變體鋅指結(jié)構(gòu)域文庫(kù)鑒定鋅指結(jié)構(gòu)域。另外,可以結(jié)合使用這兩種方法。例如,對(duì)于特定的3-bp或4-bp DNA序列如果不能從人基因組分離鋅指結(jié)構(gòu)域,則可以對(duì)通過隨機(jī)或定向誘變制備的鋅指結(jié)構(gòu)域文庫(kù)鑒定這樣的結(jié)構(gòu)域。
雖然酵母中修飾的單雜種系統(tǒng)是篩選識(shí)別和結(jié)合給定靶序列的鋅指結(jié)構(gòu)域的優(yōu)選方法,但是對(duì)本領(lǐng)域技術(shù)人員顯而易見的是可以使用除酵母單雜種篩選之外的系統(tǒng)。例如,可以使用噬菌體展示篩選來篩選從真核細(xì)胞生物體基因組衍生的天然存在的鋅指結(jié)構(gòu)域文庫(kù)。
本發(fā)明包括單雜種方法在各種培養(yǎng)細(xì)胞中的用途。例如,與靶序列可操作連接的報(bào)道基因可以導(dǎo)入培養(yǎng)的原核細(xì)胞或動(dòng)物或植物細(xì)胞,然后用鋅指結(jié)構(gòu)域文庫(kù)編碼的質(zhì)粒,噬菌體或病毒轉(zhuǎn)染培養(yǎng)的細(xì)胞。然后可以從其中報(bào)道基因被激活的分離細(xì)胞獲得識(shí)別靶序列的期望的鋅指結(jié)構(gòu)域。
下面公開的實(shí)施例證明該方法能夠鑒定結(jié)合感興趣位點(diǎn)的的鋅指結(jié)構(gòu)域。制備指3位帶有各種鋅指結(jié)構(gòu)域的雜合轉(zhuǎn)錄因子文庫(kù)。從該文庫(kù)中篩選的新的鋅指結(jié)構(gòu)域(如HSNK,QSTV和VSTR鋅指;見下文)中沒有一個(gè)天然位于其相應(yīng)的母體鋅指蛋白中的C-末端。這清楚地證明鋅指結(jié)構(gòu)域是組件的并且通過混合和匹配合適的鋅指結(jié)構(gòu)域可以構(gòu)建新的DNA-結(jié)合結(jié)構(gòu)域。
通過本發(fā)明方法篩選的鋅指結(jié)構(gòu)域可以被用作通過適當(dāng)重排和重組制備新的DNA-結(jié)合蛋白質(zhì)的構(gòu)件。例如,可以如下構(gòu)建識(shí)別人HIV-1共同受體CCR5的啟動(dòng)子區(qū)的新的DNA結(jié)合蛋白。人CCR5的啟動(dòng)子區(qū)包含下面的10-bp序列5’-AGG GTG GAG T-3’(SEQ ID NO4)(圖6)。使用這里公開的修飾的單雜種系統(tǒng),人們能夠分離三種鋅指結(jié)構(gòu)域,其中每一種特異識(shí)別下面的4-bp靶序列之一;5’-AGGG-3’,5’-GTGG-3’,和5’-GAGT-3’。這些靶序列重疊CCR5靶序列的4-bp片段。為了產(chǎn)生與CCR5啟動(dòng)子特異性結(jié)合的新的轉(zhuǎn)錄因子,這三種鋅指結(jié)構(gòu)域可以連接適當(dāng)?shù)倪B接體并且連接調(diào)節(jié)結(jié)構(gòu)域例如VP16結(jié)構(gòu)域和GAL4結(jié)構(gòu)域或抑制結(jié)構(gòu)域例如KRAB結(jié)構(gòu)域。在基因治療中可以使用這些鋅指蛋白來幫助防止HIV-1的增殖。
高流通量篩選下面的方法使得可以快速地對(duì)集合中各結(jié)構(gòu)域測(cè)定多個(gè)可能的DNA-結(jié)合位點(diǎn)或者甚至所有可能的DNA-結(jié)合位點(diǎn)的體內(nèi)結(jié)合親和性。制備編碼核酸結(jié)合結(jié)構(gòu)域的核酸的大的集合體。每個(gè)核酸結(jié)合結(jié)構(gòu)域被編碼為雜合核酸構(gòu)建體中的試驗(yàn)鋅指結(jié)構(gòu)域,并且在一種接合型的酵母菌株中表達(dá)。因此,產(chǎn)生第一組表達(dá)所有可能的或期望的結(jié)構(gòu)域的酵母菌株。在相對(duì)接合型中構(gòu)建含有用于報(bào)道構(gòu)建體中結(jié)構(gòu)域推導(dǎo)的靶位點(diǎn)的報(bào)道構(gòu)建體的第二組酵母菌株。為了產(chǎn)生融合細(xì)胞矩陣,該方法要求進(jìn)行很多或所有的可能的成對(duì)匹配,每一個(gè)都具有不同的鋅指結(jié)構(gòu)域和不同的靶位點(diǎn)報(bào)道構(gòu)建體。對(duì)每一個(gè)融合細(xì)胞測(cè)定報(bào)道基因表達(dá)。從而該方法快速并且容易地測(cè)定試驗(yàn)結(jié)構(gòu)域的結(jié)合偏好。
例如通過對(duì)基因組數(shù)據(jù)庫(kù)檢索符合給定分布的推導(dǎo)結(jié)構(gòu)域來鑒定結(jié)構(gòu)域的集合。所述集合可以包括例如10至20個(gè)結(jié)構(gòu)域,或者所有鑒定的結(jié)構(gòu)域,可能幾千個(gè)或者更多。利用合成的寡核苷酸擴(kuò)增編碼從數(shù)據(jù)庫(kù)鑒定的結(jié)構(gòu)域的核酸。設(shè)計(jì)這樣的合成的寡核苷酸的人工和自動(dòng)方法是本領(lǐng)域常規(guī)的。使用簡(jiǎn)并引物可以擴(kuò)增編碼另外的結(jié)構(gòu)域的核酸。編碼集合的結(jié)構(gòu)域的核酸克隆到上述酵母表達(dá)質(zhì)粒中,這樣產(chǎn)生結(jié)構(gòu)域和Zif268的頭兩個(gè)指和轉(zhuǎn)錄激活結(jié)構(gòu)域的融合蛋白。為了克隆編碼多個(gè)結(jié)構(gòu)域的核酸可以以微量滴定平板形式進(jìn)行擴(kuò)增和克隆步驟。
或者,可以應(yīng)用重組克隆方法來將編碼結(jié)構(gòu)域的多個(gè)擴(kuò)增的核酸快速插入到酵母表達(dá)載體中。描述于美國(guó)專利No.5,888,732和″Gateway″指南(Life Technologies-Invitrogen,CA,USA)的該方法,詳細(xì)描述了包括在擴(kuò)增引物末端的位點(diǎn)特異性重組酶的定制位點(diǎn)。所述表達(dá)載體在插入編碼結(jié)構(gòu)域的擴(kuò)增核酸位置處包含另外的一個(gè)或幾個(gè)位點(diǎn)。設(shè)計(jì)這些位點(diǎn)使缺少終止密碼子。向重組反應(yīng)加入擴(kuò)增產(chǎn)物,表達(dá)載體,和位點(diǎn)特異性重組酶導(dǎo)致對(duì)載體插入擴(kuò)增的序列。附加特征,例如,成功插入時(shí)毒性基因的置換使得該方法對(duì)于高流通量克隆是高效并且合適的。
可以利用限制酶介導(dǎo)的和/或重組克隆將編碼各鑒定的結(jié)構(gòu)域的核酸插入表達(dá)載體。載體可以在細(xì)菌中繁殖,并且在編號(hào)的微量滴定平板上冷凍,這樣每個(gè)孔含有攜帶編碼不同的獨(dú)特的DNA-結(jié)合結(jié)構(gòu)域之一的核酸的細(xì)胞。
對(duì)于每一個(gè)結(jié)構(gòu)域獲得分離的質(zhì)粒DNAI并且轉(zhuǎn)化到酵母細(xì)胞,例如啤酒酵母MATα細(xì)胞中。因?yàn)楸磉_(dá)載體包含可選擇標(biāo)記,所以轉(zhuǎn)化的細(xì)胞在為該標(biāo)記選擇的營(yíng)養(yǎng)條件下在基本培養(yǎng)基中生長(zhǎng)。這樣的細(xì)胞也可以例如在微量滴定平板中冷凍并且儲(chǔ)存以備以后使用。
例如在啤酒酵母MATα細(xì)胞中構(gòu)建第二組酵母菌株。這組酵母菌株含有各種不同的報(bào)道基因載體。然后使攜帶獨(dú)特DNA-結(jié)合結(jié)構(gòu)域的表達(dá)載體的各酵母菌株與報(bào)道基因組的各酵母菌株接合。因?yàn)檫@兩個(gè)菌株來自相對(duì)接合型并且經(jīng)基因工程處理而具有不同的輔源營(yíng)養(yǎng),因此能夠容易地篩選二倍體。這樣的二倍體具有報(bào)道質(zhì)粒和表達(dá)質(zhì)粒兩者。也在對(duì)報(bào)道質(zhì)粒和表達(dá)質(zhì)粒兩者選擇的營(yíng)養(yǎng)條件下保持這些細(xì)胞。Uetz等(2000)Nature 403623-7通過產(chǎn)生這樣的酵母接合矩陣描述了所有酵母蛋白質(zhì)的完全雙雜種圖。
可以以大容量形式例如在微量滴定平板中檢測(cè)報(bào)道基因表達(dá)。例如,當(dāng)使用GFP作為報(bào)道基因時(shí),可以熒光掃描含有結(jié)合細(xì)胞矩陣的平板。
新的DNA-結(jié)合蛋白質(zhì)的組件裝配通過混合和匹配合適的鋅指結(jié)構(gòu)域可以合理地構(gòu)建識(shí)別靶9-bp或者更長(zhǎng)DNA序列的新的DNA-結(jié)合蛋白。鋅指結(jié)構(gòu)域的組件結(jié)構(gòu)有利于它們重排構(gòu)建新的DNA-結(jié)合蛋白。如圖1所示,天然存在的Zif268蛋白質(zhì)中的鋅指結(jié)構(gòu)域沿著DNA雙螺旋串聯(lián)分布。每一個(gè)結(jié)構(gòu)域獨(dú)立地識(shí)別一個(gè)不同的3-4bp DNA片段。
鋅指結(jié)構(gòu)域數(shù)據(jù)庫(kù).可以應(yīng)用上述單雜種篩選系統(tǒng)來為每一個(gè)可能的3或4堿基對(duì)結(jié)合位點(diǎn)鑒定一個(gè)或多個(gè)鋅指結(jié)構(gòu)域。這些結(jié)果可以保存為矩陣或數(shù)據(jù)庫(kù)。數(shù)據(jù)庫(kù)可以包括結(jié)合每一個(gè)位點(diǎn)的鋅指結(jié)構(gòu)域的相對(duì)親合力的指征。
也可以在多個(gè)不同的融合蛋白中測(cè)定這樣的鋅指結(jié)構(gòu)域來證實(shí)它們的特異性。此外,可獲得少數(shù)結(jié)構(gòu)域的特定結(jié)合位點(diǎn)可以是另外的選擇篩選的靶物。通過誘變結(jié)合類似但不相同的位點(diǎn)的鋅指結(jié)構(gòu)域可以制備這樣的選擇的文庫(kù)。對(duì)于每一個(gè)可能的結(jié)合位點(diǎn)的鋅指結(jié)構(gòu)域的完全矩陣不是必要的,因?yàn)闉榱俗罴训厥褂每色@得的結(jié)構(gòu)域,結(jié)構(gòu)域可以相對(duì)于靶結(jié)合位點(diǎn)交錯(cuò)。這樣的交錯(cuò)可以通過最有用的3或4堿基對(duì)結(jié)合位點(diǎn)中結(jié)合位點(diǎn)的解析,以及鋅指結(jié)構(gòu)域之間連接體長(zhǎng)度的改變來實(shí)現(xiàn)。為了對(duì)設(shè)計(jì)的多肽引入選擇性和高親和性,對(duì)于期望的位點(diǎn)具有高特異性的鋅指結(jié)構(gòu)域側(cè)翼可以有以更高親和性但是更小特異性結(jié)合的其它結(jié)構(gòu)域??梢岳眠@里描述的體內(nèi)篩選方法來測(cè)定人工裝配的鋅指蛋白及其衍生物的體內(nèi)功能,親和性,和特異性。同樣,該方法可以用來優(yōu)化這樣裝配的蛋白質(zhì),例如,通過創(chuàng)建不同的連接體成份庫(kù),鋅指結(jié)構(gòu)域組件庫(kù),鋅指結(jié)構(gòu)域成份庫(kù)等等。
剖析靶位點(diǎn).9-bp或者更長(zhǎng)的靶DNA序列分成3或4bp部分。鑒定識(shí)別每部分3或4bp片段的鋅指結(jié)構(gòu)域(例如,從上述數(shù)據(jù)庫(kù)鑒定)。更長(zhǎng)的靶序列,例如,20bp至500bp序列,也是合適的靶標(biāo),因?yàn)樗鼈冎锌梢澡b定9bp,12bp,和15bp亞序列。特別地,適合剖析到數(shù)據(jù)庫(kù)中完好代表的位點(diǎn)中的亞序列可以作為最初的設(shè)計(jì)靶標(biāo)。
構(gòu)建裝配的組件.設(shè)計(jì)包含多個(gè)識(shí)別相鄰的3或4bp亞位點(diǎn)或者近旁亞位點(diǎn)的鋅指結(jié)構(gòu)域的多肽序列??梢院铣删幋a設(shè)計(jì)的多肽序列的核酸序列。構(gòu)建合成的基因的方法是本領(lǐng)域常規(guī)的。這樣的方法包括從常規(guī)合成的寡核苷酸構(gòu)建基因,PCR介導(dǎo)的克隆,和mega-引物PCR??梢院铣啥喾N核酸序列例如來形成一個(gè)文庫(kù)。例如,可以設(shè)計(jì)該文庫(kù)核酸使得編碼任何給定位置的結(jié)構(gòu)域的序列是不同的,使得它們編碼不同的鋅指結(jié)構(gòu)域,這些鋅指結(jié)構(gòu)域的識(shí)別特異性適合那個(gè)位置??梢岳糜行院汀錎NA改組TM″(Maxygen,Inc.,CA)來改變每一個(gè)位置的鋅指結(jié)構(gòu)域的特性。
肽連接體.DNA結(jié)合結(jié)構(gòu)域可以通過各種不同的連接體連接。連接體的應(yīng)用和設(shè)計(jì)是本領(lǐng)域公知的。特別有用的連接體是核酸編碼的肽連接體。因此,人們可以構(gòu)建編碼第一DNA結(jié)合結(jié)構(gòu)域,肽連接體,和第二DNA結(jié)合結(jié)構(gòu)域的合成基因。為了構(gòu)建大的合成的多結(jié)構(gòu)域的DNA結(jié)合蛋白,可以重復(fù)該設(shè)計(jì)。PCT WO 99/45132和Kim和Pabo((1998)Proc.Natl.Acad.Sci.USA 952812-7)描述了適合連接鋅指結(jié)構(gòu)域的肽連接體的設(shè)計(jì)。
形成隨機(jī)螺旋,α-螺旋或β-折疊三級(jí)結(jié)構(gòu)的另外的肽連接體是可獲得的。形成合適的柔性連接體的多肽是本領(lǐng)域公知的(參見例如,Robinson和Sauer(1998)Proc Natl Acad Sci USA.955929-34)。柔性連接體一般包括甘氨酸,因?yàn)檫@種沒有側(cè)鏈的氨基酸其旋轉(zhuǎn)自由度是獨(dú)特的。連接體中可以點(diǎn)綴絲氨酸或蘇氨酸以提高親水性。另外,為了提高結(jié)合親合力可以使用能與DNA的磷酸骨架相互作用的氨基酸。正確使用這樣的氨基酸使得可以平衡提高親合力而不降低序列的特異性。如果期望剛性延長(zhǎng)作為連接體,α-螺旋連接體,例如可以使用Pantoliano等(1991)Biochem.3010117-10125中描述的螺旋連接體。也可以通過計(jì)算機(jī)模擬設(shè)計(jì)連接體(參見例如美國(guó)專利No.4,946,778)。用于分子模擬的軟件可以購(gòu)得(例如,從Molecular Simulations,Inc.,San Diego,Calif.購(gòu)得)。任選地,應(yīng)用標(biāo)準(zhǔn)誘變技術(shù)和蛋白質(zhì)工程領(lǐng)域中公知的合適的生物物理試驗(yàn),和這里描述的功能測(cè)試,優(yōu)化連接體,例如,以減小抗原性和/或提高穩(wěn)定性。
對(duì)于利用鋅指結(jié)構(gòu)域的實(shí)施方式,鋅指之間天然存在的肽可以被用作將指連接在一起的連接體。典型的這樣的天然存在的連接體是Thr-Gly-(Glu或Gln)-(Lys或Arg)-Pro-(Tyr或Phe)(SEQ ID NO78)(Agata等,上文)。
二聚結(jié)構(gòu)域.連接DNA結(jié)合結(jié)構(gòu)域的另一種方法是使用二聚結(jié)構(gòu)域,特別是異源二聚結(jié)構(gòu)域(參見例如,Pomerantz等(1998)Biochemistry37965-970)。在該實(shí)施方案中,DNA結(jié)合結(jié)構(gòu)域存在于分開的多肽鏈中。例如,第一多肽編碼DNA結(jié)合結(jié)構(gòu)域A,連接體,和結(jié)構(gòu)域B,而第二多肽編碼結(jié)構(gòu)域C,連接體,和結(jié)構(gòu)域D。技術(shù)人員能夠從很多充分鑒定的二聚結(jié)構(gòu)域篩選二聚結(jié)構(gòu)域。如果不期望同源二聚體,則可以使用有利于異源二聚作用的結(jié)構(gòu)域。特別合適的二聚結(jié)構(gòu)域是卷曲螺旋基序,例如二聚平行的或者反向平行的卷曲螺旋。優(yōu)先形成異源二聚體的卷曲螺旋序列也是可獲得的(Lumb和Kim,(1995)Biochemistry 348642-8648)。另外一種二聚作用結(jié)構(gòu)域是其中二聚作用由小分子或者由信號(hào)作用引發(fā)的二聚作用結(jié)構(gòu)域。例如,可以使用FK506的二聚體形式將兩個(gè)FK506結(jié)合蛋白(FKBP)結(jié)構(gòu)域二聚化。可以利用這樣的二聚結(jié)構(gòu)域來提供附加水平的調(diào)節(jié)。
功能測(cè)定和應(yīng)用除了生物化學(xué)分析之外,可以測(cè)試或者體內(nèi)應(yīng)用通過這里描述的方法設(shè)計(jì)的例如通過組件裝配設(shè)計(jì)的核酸結(jié)合結(jié)構(gòu)域或者蛋白質(zhì)的功能。例如,可以篩選結(jié)合靶位點(diǎn)例如細(xì)胞增殖所需要的基因的啟動(dòng)子位點(diǎn)的功能域。通過組件裝配,可以設(shè)計(jì)這樣的蛋白質(zhì),其包括(1)分別結(jié)合跨越靶啟動(dòng)子位點(diǎn)的亞位點(diǎn)的選擇的結(jié)構(gòu)域,和(2)DNA抑制結(jié)構(gòu)域,例如,WRPW結(jié)構(gòu)域。
可以將編碼設(shè)計(jì)的蛋白質(zhì)的核酸序列克隆到表達(dá)載體中,例如,Kang和Kim,(2000)J Biol Chem 2758742中描述的可誘導(dǎo)表達(dá)載體。所述可誘導(dǎo)表達(dá)載體可以包括可誘導(dǎo)啟動(dòng)子或調(diào)節(jié)序列??烧T導(dǎo)啟動(dòng)子非限制性例子包括甾族激素響應(yīng)啟動(dòng)子(例如,蛻皮素響應(yīng),雌激素-響應(yīng),和glutacorticoid響應(yīng)啟動(dòng)子),四環(huán)素″Tet-On″和″Tet-Off″系統(tǒng),和金屬響應(yīng)啟動(dòng)子。能夠?qū)?gòu)建體轉(zhuǎn)染到組織培養(yǎng)細(xì)胞中或者到胚胎干細(xì)胞中產(chǎn)生作為模式個(gè)體的轉(zhuǎn)基因生物體。通過誘導(dǎo)蛋白質(zhì)表達(dá)和測(cè)試組織培養(yǎng)細(xì)胞的細(xì)胞增殖或者測(cè)定轉(zhuǎn)基因動(dòng)物模型中發(fā)育變化和/或腫瘤生長(zhǎng),可以測(cè)定設(shè)計(jì)的蛋白質(zhì)的效力。另外,通過檢測(cè)mRNA的常規(guī)方法,例如RT-PCR或Northern印跡,可以測(cè)定導(dǎo)向的基因的表達(dá)水平。更完全的診斷包括從表達(dá)和不表達(dá)設(shè)計(jì)的蛋白質(zhì)的細(xì)胞純化mRNA。使用mRNA的兩個(gè)庫(kù)探測(cè)含有基因大集合的探針的微陣列,所述基因大集合是例如與感興趣的狀態(tài)(例如癌癥)相關(guān)聯(lián)的基因的集合或者生物體基因組中鑒定的基因的集合。這樣的測(cè)試對(duì)于測(cè)定設(shè)計(jì)的蛋白質(zhì)的特異性是特別有價(jià)值的。如果蛋白質(zhì)以高親和性結(jié)合但是幾乎沒有特異性,則它將通過影響除了涉及的靶物之外的基因的表達(dá)而引起多效而不期望的作用。轉(zhuǎn)錄物的綜合分析揭示這樣的作用。
另外,為了調(diào)節(jié)內(nèi)源基因可以在試驗(yàn)細(xì)胞或試驗(yàn)生物體中產(chǎn)生設(shè)計(jì)的蛋白質(zhì)。如上所述裝配設(shè)計(jì)的蛋白質(zhì),以結(jié)合內(nèi)源基因的區(qū)并且提供轉(zhuǎn)錄激活或抑制功能。根據(jù)Kang和Kim(上文)所述,編碼設(shè)計(jì)的蛋白質(zhì)的核酸的表達(dá)與可誘導(dǎo)的啟動(dòng)子可操作連接。通過調(diào)節(jié)啟動(dòng)子的誘導(dǎo)物的濃度,可以以濃度依賴方式調(diào)節(jié)內(nèi)源基因的表達(dá)。
測(cè)定結(jié)合位點(diǎn)偏好通過生物化學(xué)分析例如EMSA,DNase足跡法,表面等離子體共振,或者柱結(jié)合,可以證實(shí)每一個(gè)結(jié)構(gòu)域的結(jié)合位點(diǎn)偏好。結(jié)合底物可以是包括靶位點(diǎn)的合成寡核苷酸。所述測(cè)試還可以包括非特異性DNA作為競(jìng)爭(zhēng)物,或者特異性DNA序列作為競(jìng)爭(zhēng)物。特異性競(jìng)爭(zhēng)物DNAs可以包括具有一個(gè),兩個(gè)或者三個(gè)核苷酸突變的識(shí)別位點(diǎn)。因此,可以利用生物化學(xué)測(cè)試不僅測(cè)定給定位點(diǎn)結(jié)構(gòu)域的親和性,而且測(cè)定其對(duì)相對(duì)于其它位點(diǎn)的位點(diǎn)的親和性。Rebar和Pabo,(1994)Science 263671-673描述了從EMSA獲得對(duì)于鋅指結(jié)構(gòu)域的表觀Kd常數(shù)的方法。
通過下面的實(shí)施例更詳細(xì)地描述了本發(fā)明。但是,應(yīng)該注意這些實(shí)施例不是要限制本發(fā)明的范圍。
實(shí)施例1用于雜合轉(zhuǎn)錄因子表達(dá)的質(zhì)粒的構(gòu)建通過修飾pPC86(Chevray和Nathans,(1991)Proc.Natl.Acad.Sci.USA 895789-5793)制備表達(dá)鋅指轉(zhuǎn)錄因子的表達(dá)質(zhì)粒。如Ausubel等人所述(Current Protocols in Molecular Biology(1998),John Wiley andSons,Inc.)進(jìn)行DNA操作。將編碼Zif268鋅指蛋白的DNA片段插入到pPC86的SalI和EcoRI識(shí)別位點(diǎn)之間,產(chǎn)生pPCFM-Zif。該克隆步驟的結(jié)果是編碼后面接三個(gè)Zif268鋅指的酵母Gal4激活結(jié)構(gòu)域的翻譯融合蛋白。pPCFM-Zif轉(zhuǎn)化到酵母細(xì)胞中導(dǎo)致包括酵母Gal4激活結(jié)構(gòu)域和Zif268鋅指的雜合轉(zhuǎn)錄因子的表達(dá)。圖9給出了克隆到pPCFM-Zif中的編碼Zif268鋅指蛋白的DNA序列。
質(zhì)粒pPCFMS-Zif被用作構(gòu)建鋅指結(jié)構(gòu)域庫(kù)的載體(圖8)。通過在pPCFM-Zif指3編碼區(qū)前面插入含有終止密碼子和PstI識(shí)別位點(diǎn)的寡核苷酸盒構(gòu)建pPCFMS-Zif。通過將兩個(gè)合成的寡核苷酸退火生成所述寡核苷酸盒5’-TGCCTGCAGCATTTGTGGGAGGAAGTTTG-3’(SEQ ID NO79);和5’-ATGCTGCAGGCTTAAGGCTTCTCGCCGGTG-3’(SEQ ID NO80)。終止密碼子的插入防止編碼Zif268的指3的質(zhì)粒庫(kù)的產(chǎn)生。
所述質(zhì)粒被用作產(chǎn)生下面實(shí)施例2描述的鋅指結(jié)構(gòu)域的載體。
另外,根據(jù)Hudson等所述((1997)Genome Research 71169-1173),有少量修改,進(jìn)行編碼各鋅指結(jié)構(gòu)域的DNA序列的缺口修復(fù)克隆。
為了克隆各鋅指結(jié)構(gòu)域,合成兩種重疊的寡核苷酸。每種寡核苷酸包括用于第二輪PCR(rePCR)的5’末端處21-核苷酸長(zhǎng)共有尾部和退火至編碼各鋅指結(jié)構(gòu)域的核酸的特異性序列。正向和反向引物的序列分別是5’-ACCCACACTGGCCAGAAACCCN48-51-3’(SEQ ID NO108)和5’-GATCTGAATTCATTCACCGGTN42-45-3’(SEQ ID NO109),其中N48-51和N42-45相應(yīng)于退火至編碼鋅指結(jié)構(gòu)域的核酸的定制序列。通過用兩種寡核苷酸等克分子混合物擴(kuò)增模板核酸制備雙鏈DNA。PCR條件組成如下94℃進(jìn)行3分鐘一次循環(huán),接著是94℃進(jìn)行1分鐘,50℃進(jìn)行1分鐘,和72℃進(jìn)行30秒,進(jìn)行5次循環(huán)。
然后將編碼各鋅指結(jié)構(gòu)域的雙鏈DNA用作第二輪PCR的模板。RePCR引物具有兩個(gè)區(qū),一個(gè)區(qū)與酵母載體pPCFM-Zif相同,第二個(gè)區(qū)與上面描述的21-核苷酸長(zhǎng)共有尾部序列相同。正向引物序列是5’-TGTCGAATCTGCATGCGTAACTTCAGTCGTAGTGACCACCTTACCACCCACATCCGGACCCACACTGGCCAGAAACCC-3’(SEQ ID NO138),反向引物序列是5’-GGTGGCGGCCGTTACTTACTTAGAGCTCGACGTCTTACTTACTTAGCGGCCGCACTAGTAGATCTGAATTCATTCACCGGT-3’(SEQ ID NO139)。25微升反應(yīng)混合物中含有2.5皮摩爾的各種引物,1.5mM Mg2+,2單位的Taq聚合酶和0.01單位的Pfu聚合酶。反應(yīng)在94℃進(jìn)行3分鐘,然后進(jìn)行94℃進(jìn)行1分鐘,65℃進(jìn)行1分鐘,和72℃進(jìn)行30秒進(jìn)行20次循環(huán)。通過將已經(jīng)用MscI和EcoRI消化過的rePCR產(chǎn)物和線性化pPCFM-Zif載體的混合物轉(zhuǎn)化到酵母YW1細(xì)胞中進(jìn)行缺口修復(fù)克隆。使與酵母載體pPCFM-Zif相同的區(qū)與細(xì)胞中的載體進(jìn)行同源重組。
實(shí)施例2鋅指結(jié)構(gòu)域文庫(kù)的構(gòu)建通過從人基因組克隆鋅指結(jié)構(gòu)域來制備天然存在的鋅指結(jié)構(gòu)域的質(zhì)粒庫(kù)。利用PCR和簡(jiǎn)并寡核苷酸引物從模板人基因組DNA(購(gòu)自PromegaCorporation,Madison,Wis.,USA)擴(kuò)增編碼鋅指結(jié)構(gòu)域的DNA片段。用來克隆人鋅指結(jié)構(gòu)域的簡(jiǎn)并PCR引物的DNA序列如下;5’-GCGTCCGGACNCAYACNGGNSARA-3’(SEQ ID NO81)和5’-CGGAATTCANNBRWANGGYYTYTC-3’(SEQ ID NO82),其中R代表G和A;B代表G,C,和T;S代表G和C;W代表A和T;Y代表C和T;和N代表A,C,G,和T。
簡(jiǎn)并PCR引物退火至編碼氨基酸序列His-Thr-Gly-(Glu或Gln)-(Lys或Arg)-Pro-(Tyr或Phe)(SEQ ID NO83)的核酸序列,發(fā)現(xiàn)該序列位于很多天然存在的鋅指蛋白中的鋅指結(jié)構(gòu)域之間的連接處(Agata等(1998)Gene 21355-64)。
PCR反應(yīng)的緩沖液組成是50mM KCl,3mM MgCl2,10mM Tris pH8.3。加入Taq DNA聚合酶并且將反應(yīng)混合物在94℃下溫育30秒,42℃下溫育60秒,然后72℃下溫育30秒。將該循環(huán)重復(fù)35次,接著最后在72℃下溫育10分鐘。
如下將PCR產(chǎn)物克隆到pPCFMS-Zif中將PCR產(chǎn)物電泳,并且分離相應(yīng)于大約120bp的DNA片段。用BspEI和EcoRI消化之后,將120-bpDNA片段連接pPCFMS-Zif。作為結(jié)果,該質(zhì)粒庫(kù)編碼的雜合轉(zhuǎn)錄因子的DNA-結(jié)合結(jié)構(gòu)域由Zif268的指1和指2和從人基因組衍生的鋅指結(jié)構(gòu)域組成。從總共106個(gè)大腸埃希氏桿菌轉(zhuǎn)化體制備質(zhì)粒庫(kù)。該文庫(kù)構(gòu)建設(shè)計(jì)保留了鋅指結(jié)構(gòu)域之間發(fā)現(xiàn)的天然存在的連接體序列。
實(shí)施例3鋅指結(jié)構(gòu)域文庫(kù)的構(gòu)建通過隨機(jī)誘變制備突變體鋅指結(jié)構(gòu)域庫(kù)。使用Zif268的指3作為多肽結(jié)構(gòu)。沿著α-螺旋在-1,2,3,4,5,和6位置處導(dǎo)入隨機(jī)突變,分別相應(yīng)于SEQ ID NO21的73位點(diǎn)處的精氨酸,75位點(diǎn)處的天冬氨酸,76位點(diǎn)處的谷氨酸,77位點(diǎn)處的精氨酸,78位點(diǎn)處的賴氨酸,和79位點(diǎn)處的精氨酸(Zif268的指3內(nèi))。
在編碼這些氨基酸的核酸序列位點(diǎn)的每一處導(dǎo)入隨機(jī)化密碼子,5’-(G/A/C)(G/A/C/T)(G/C)-3。該隨機(jī)化密碼子編碼16個(gè)氨基酸的每一個(gè)(不包括四種氨基酸色氨酸,酪氨酸,半胱氨酸和苯丙氨酸)。也不包括所有三個(gè)可能的終止密碼子。用從下面兩個(gè)寡核苷酸構(gòu)建的寡核苷酸盒導(dǎo)入隨機(jī)化密碼子
5’-GGGCCCGGGGAGAAGCCTTACGCATGTCCAGTCGAATCTTGTGATAGAAGATTC-3’(SEQ ID NO84);和5’-CTCCCCGCGGTTCGCCGGTGTGGATTCTGATATGSNBSNBAAGSNBSNBSNBSNBTGAGAATCTTCTATCACAAG-3’(SEQ ID NO85),其中B代表G,T,和C;S代表G和C;和N代表A,G,C,和T。
將這兩種寡核苷酸退火之后,通過與Klenow聚合酶反應(yīng)30分鐘合成DNA雙螺旋盒。用AvaI和SacII消化之后,DNA雙螺旋與用SgrAI和SacII消化過的pPCFMS-Zif連接。從大約109個(gè)大腸埃希氏桿菌轉(zhuǎn)化體分離質(zhì)粒。
實(shí)施例4報(bào)道質(zhì)粒的構(gòu)建通過修飾pRS315His(Wang和Reed(1993)Nature 364121-126)制備包括酵母HIS3基因的報(bào)道質(zhì)粒。所述報(bào)道質(zhì)粒還包含篩選攜帶該質(zhì)粒的轉(zhuǎn)化體目的的其天然啟動(dòng)子之下的LEU2標(biāo)記。首先,通過連接SalI和BamHI消化后的pRS315His的小片段和BamHI和XhoI消化之后的大片段去除pRS315His中的SalI識(shí)別位點(diǎn),制備pRS315HisΔSal。接著,通過將寡核苷酸雙螺旋插入pRS315HisΔSal BamHI和SmaI位點(diǎn)之間而在HIS3基因的啟動(dòng)子區(qū)內(nèi)產(chǎn)生新的SalI識(shí)別位點(diǎn)。退火產(chǎn)生插入的雙螺旋的兩種寡核苷酸序列是5’-CTAGACCCGGGAATTCGTCGACG-3’(SEQ ID NO86);和5’-GATCCGTCGACGAATTCCCGGGT-3’(SEQ ID NO87)。得到的質(zhì)粒命名為pRS315HisMCS。
通過將期望的復(fù)合序列插入到pRS315HisMCS中構(gòu)建多種報(bào)道質(zhì)粒。插入所述復(fù)合序列成為包含復(fù)合序列的四個(gè)拷貝的串聯(lián)排列。靶序列衍生自HIV-1的LTR區(qū)中發(fā)現(xiàn)的10-bp DNA序列(圖6)5’-GAC ATC GAG C-3’(SEQ ID NO1)HIV-1 LTR(-124/-115)5’-GCA GCT GCT T-3’(SEQ ID NO2)HIV-1 LTR(-23/-14)5’-GCT GGG GAC T-3’(SEQ ID NO3)HIV-1 LTR(-95/-86))
和在人CCR5基因的啟動(dòng)子中發(fā)現(xiàn)的10bp DNA序列5’-AGG GTG GAG T-3’(SEQ ID NO4)人CCR5(-70/-79)5’-GCT GAG ACA T-3’(SEQ ID NO5)人CCR5(+7/+16))。
為了鑒定識(shí)別所述位點(diǎn)的各個(gè)區(qū)的鋅指結(jié)構(gòu)域,可以將這些10-bpDNA序列的每一個(gè)分成4-bp靶位點(diǎn)成分。利用模塊組裝方法,這樣的鋅指結(jié)構(gòu)域可以偶聯(lián)產(chǎn)生體內(nèi)識(shí)別所述位點(diǎn)的DNA結(jié)合蛋白。
圖6的下劃線部分描述4-bp靶序列的實(shí)施例。這些4-bp靶序列的每一個(gè)連接5-bp補(bǔ)充序列,5’-GGGCG-3’,它被Zif268的指1和指2識(shí)別。得到的9-bp序列構(gòu)成復(fù)合結(jié)合序列。每一個(gè)復(fù)合結(jié)合序列具有下面的格式5’-XXXXGGGCG-3’,其中XXXX是4-bp靶序列并且鄰接的5’-GGGCG-3’是補(bǔ)充序列。
圖7描述插入的復(fù)合結(jié)合位點(diǎn)串聯(lián)陣列的DNA序列,每一個(gè)與pRS315HisMCS中的報(bào)道基因可操作連接。每個(gè)串聯(lián)陣列包含復(fù)合序列的四個(gè)拷貝。對(duì)于每一個(gè)結(jié)合位點(diǎn),合成兩個(gè)寡核苷酸,退火并且連接到用SalI和XmaI位點(diǎn)限制的pRS315HisMCS中制備報(bào)道質(zhì)粒。
實(shí)施例5報(bào)道質(zhì)粒的構(gòu)建如下構(gòu)建對(duì)于每個(gè)3堿基對(duì)亞位點(diǎn)包括一對(duì)報(bào)道基因(一個(gè)具有l(wèi)acZ,另一個(gè)具有HIS3)的一組報(bào)道質(zhì)粒通過將期望的靶序列插入pRS315HisMCS和pLacZi中構(gòu)建報(bào)道質(zhì)粒。對(duì)于每個(gè)3堿基對(duì)靶位點(diǎn),合成兩個(gè)寡核苷酸,退火并且連接到pRS315HisMCS的和pLacZi的SalI和XmaI位點(diǎn)中制備報(bào)道質(zhì)粒。所述寡核苷酸的DNA序列如下5’-CCGGT NNNTGGGCG TAC NNNTGGGCG TCA NNNTGGGCG-3’(SEQ ID NO88)和5’-TCGA CGCCCANNN TGA CGCCCANNN GTA CGCCCANNN A-3’(SEQ IDNO89)。合成了共64對(duì)寡核苷酸并且插入到兩個(gè)報(bào)道質(zhì)粒中。
實(shí)施例6具有期望的DNA-結(jié)合特異性的鋅指結(jié)構(gòu)域的篩選為了篩選特異性結(jié)合給定靶序列的鋅指結(jié)構(gòu)域,首先用報(bào)道質(zhì)粒并且然后用編碼雜合轉(zhuǎn)錄因子的雜交質(zhì)粒庫(kù)轉(zhuǎn)化酵母細(xì)胞。根據(jù)Ausubel等所述(Current Protocols in Molecular Biology(1998),John Wileyand Sons,Inc.)實(shí)施酵母轉(zhuǎn)化和篩選程序。使用酵母菌株yWAM2(MATα(alpha)Δgal4Δgal80 URA3∷GAL1-lacZ lys2801 his3-Δ200trp1-Δ63 leu2 ade2-101CYH2)。
在一個(gè)例子中,首先用包含復(fù)合結(jié)合序列5’-GAGCGGGCG-3’(將4-bp靶序列下劃線)的報(bào)道質(zhì)粒轉(zhuǎn)化酵母細(xì)胞,其中所述復(fù)合結(jié)合序列與報(bào)道基因可操作連接。然后,將隨機(jī)誘變制備的突變體鋅指結(jié)構(gòu)域的質(zhì)粒庫(kù)導(dǎo)入轉(zhuǎn)化的酵母細(xì)胞。在沒有亮氨酸和色氨酸的培養(yǎng)基中獲得大約106個(gè)菌落。因?yàn)閳?bào)道質(zhì)粒和鋅指結(jié)構(gòu)域表達(dá)質(zhì)粒分別包含酵母LEU2和TRP1基因作為標(biāo)記,為了篩選包含報(bào)道基因和鋅指結(jié)構(gòu)域表達(dá)質(zhì)粒的細(xì)胞在沒有亮氨酸和色氨酸的培養(yǎng)基中培養(yǎng)酵母細(xì)胞。
在一個(gè)實(shí)施方案中,將從人基因組衍生的鋅指結(jié)構(gòu)域庫(kù)轉(zhuǎn)化到攜帶報(bào)道質(zhì)粒的細(xì)胞中。對(duì)5個(gè)不同的宿主細(xì)胞菌株進(jìn)行轉(zhuǎn)化,包含5個(gè)不同的靶序列之一的各菌株與報(bào)道基因可操作連接。在沒有亮氨酸和色氨酸的培養(yǎng)基中每一次轉(zhuǎn)化獲得大約105菌落。轉(zhuǎn)化體在含有沒有亮氨酸和色氨酸的合成培養(yǎng)基的培養(yǎng)皿中生長(zhǎng)。溫育之后,通過對(duì)平板施加10%無(wú)菌甘油溶液,將菌落刮到溶液中,并且提取溶液,收集轉(zhuǎn)化的細(xì)胞。細(xì)胞以甘油溶液中冷凍等份貯存。將一等份散布到?jīng)]有亮氨酸,色氨酸和組氨酸的培養(yǎng)基中。向生長(zhǎng)培養(yǎng)基中加入0,0.03,0.1和0.3mM終濃度的3-氨基三唑(AT)。AT是His3的競(jìng)爭(zhēng)抑制劑并且用滴定法測(cè)定HIS3篩選體系的靈敏性。AT抑制His3的基本活性。這樣的基本活性能從報(bào)道質(zhì)粒上HIS3基因的滲漏表達(dá)產(chǎn)生。培養(yǎng)基上散布大約107個(gè)以上酵母細(xì)胞,在沒有AT的選擇性培養(yǎng)基中生長(zhǎng)著幾百數(shù)量級(jí)個(gè)菌落。菌落的數(shù)目隨著AT濃度的增加而逐漸減少。含有0.3mM AT的選擇性培養(yǎng)基中生長(zhǎng)著幾十?dāng)?shù)量級(jí)個(gè)菌落。從沒有AT的培養(yǎng)基和含有0.3mM AT的培養(yǎng)基隨機(jī)選出幾個(gè)菌落。從酵母細(xì)胞分離出質(zhì)粒并且轉(zhuǎn)化到大腸埃希氏桿菌菌株KC8(pyrF leuB600 trpC hisB463)中。分離編碼鋅指轉(zhuǎn)錄因子的質(zhì)粒,并且測(cè)定篩選的鋅指結(jié)構(gòu)域的DNA序列。
從DNA序列推導(dǎo)出各篩選的鋅指結(jié)構(gòu)域的氨基酸序列。根據(jù)堿基接觸位置,即沿著α-螺旋的-1,2,3,和6位點(diǎn)處四個(gè)氨基酸殘基命名各鋅指結(jié)構(gòu)域。結(jié)果如表1所示。根據(jù)堿基接觸位置處四個(gè)氨基酸命名鑒定的鋅指結(jié)構(gòu)域。序列分析表明在某些情況下重復(fù)獲得相同的鋅指結(jié)構(gòu)域。表1中圓括號(hào)中的數(shù)據(jù)代表獲得了多少次相同的鋅指結(jié)構(gòu)域。例如,四個(gè)堿基接觸位點(diǎn)處具有CSNR的兩個(gè)鋅指被鑒定為結(jié)合GAGC核酸位點(diǎn)(參見第3欄,″GAGC/人基因組″)。
表1靶序列GAGC GAGC GCTT GACT GAGT ACAT鋅指結(jié)構(gòu) 隨機(jī)誘變 人基因組 人基因組 人基因組 人基因組 人基因組域庫(kù)來源堿基接觸 KTNR(2) RTNR(2) VSTR(9) HSNK(2) RDER(2) QSTV(3)RTTR RTNRCSNR(7) SSNR(5)位置處的 RPNR CSNR(2)氨基酸殘 HSNR SSNR(3)基* RLKP RSTVTRQR SSGETALHRQKAPARVRTFRRNNRDPLHRGNR*第6欄以右的四字母標(biāo)識(shí)符是對(duì)于每一個(gè)靶序列分離的鋅指結(jié)構(gòu)域的描述符。盡管這些名稱指示了堿基接觸位點(diǎn)處的氨基酸殘基,但是它們不是多肽的序列。
圖11給出了編碼篩選的人鋅指結(jié)構(gòu)域的全長(zhǎng)DNA序列和它們翻譯的氨基酸序列。與用來擴(kuò)增編碼人基因組中鋅指結(jié)構(gòu)域的DNA片段的簡(jiǎn)并PCR引物互補(bǔ)的DNA序列帶下劃線。由于在擴(kuò)增期間導(dǎo)入等位差異和改變,所以該序列可以不同于報(bào)道的人基因組序列的原堿基序列。
根據(jù)本發(fā)明篩選鑒定的大多數(shù)人鋅指結(jié)構(gòu)域是新的多肽或者相對(duì)于無(wú)名可讀框。例如,在功能未知的蛋白質(zhì)中發(fā)現(xiàn)指定為HSNK(包含在GenBank登記號(hào)AF155100報(bào)道的序列中)和VSTR(包含在GenBank登記號(hào)AF02577報(bào)道的序列中)的鋅指結(jié)構(gòu)域。這里描述的結(jié)果不僅表明這些鋅指結(jié)構(gòu)域能夠作為序列特異性DNA結(jié)合結(jié)構(gòu)域而發(fā)揮功能,而且也證明了嵌合蛋白中優(yōu)選的結(jié)合位點(diǎn)偏好。
另外,本發(fā)明闡明從人基因組獲得的鋅指結(jié)構(gòu)域可以被用作構(gòu)建新的DNA-結(jié)合蛋白的組件結(jié)構(gòu)單元。當(dāng)與Zif268的指1和指2的C-末端連接時(shí),作為它們體內(nèi)功能的結(jié)果,獲得本發(fā)明的人鋅指結(jié)構(gòu)域。因此,鑒定的鋅指結(jié)構(gòu)域能夠識(shí)別人工序列中的特異序列,并且適合作為設(shè)計(jì)合成轉(zhuǎn)錄因子的組件結(jié)構(gòu)單元。
實(shí)施例7成對(duì)接合為了有利于鑒定與每個(gè)三堿基對(duì)靶位點(diǎn)結(jié)合的鋅指結(jié)構(gòu)域,利用酵母接合來估計(jì)重復(fù)性轉(zhuǎn)化酵母細(xì)胞的需要和來檢索對(duì)一次轉(zhuǎn)化的64個(gè)報(bào)道基因構(gòu)建體的每一個(gè)的陽(yáng)性結(jié)合物。使用兩個(gè)酵母菌株,YWI(MATα接合型)和YPH499(MATα接合型)。為了產(chǎn)生yWAM2的ura3-衍生物,通過篩選對(duì)5-氟代乳清酸(FOA)有抗性的克隆,從yWAM2衍生YW1。
通過酵母轉(zhuǎn)化將鋅指結(jié)構(gòu)域的質(zhì)粒庫(kù)導(dǎo)入YW1細(xì)胞。通過用10%的甘油溶液刮洗平板從大約10個(gè)獨(dú)立的轉(zhuǎn)化菌落收集細(xì)胞。將溶液凍干成等份。也將64個(gè)報(bào)道質(zhì)粒的每一對(duì)(衍生自pLacZi或pRS315 His)共轉(zhuǎn)染到酵母菌株YPH499中。將包含兩種報(bào)道質(zhì)粒的轉(zhuǎn)化體收集并且冷凍。
解凍之后,酵母細(xì)胞在基本培養(yǎng)基中生長(zhǎng)至對(duì)數(shù)中期。然后混合這兩種細(xì)胞類型并且使在YPD中接合5小時(shí)。在含有X-gal和AT(1mM)但是沒有色氨酸,亮氨酸,尿嘧啶,和組氨酸的基本培養(yǎng)基中篩選二倍體細(xì)胞。幾天之后,分離在選擇平板上生長(zhǎng)的蘭色菌落。從蘭色菌落分離編碼鋅指結(jié)構(gòu)域的質(zhì)粒,并且測(cè)定篩選的鋅指結(jié)構(gòu)域的DNA序列。
將從蘭色菌落分離的核酸分別轉(zhuǎn)化到Y(jié)W1細(xì)胞中。對(duì)于每一種分離的核酸,再轉(zhuǎn)化的YW1細(xì)胞在96-孔板中與含有64種LacZ報(bào)道質(zhì)粒的一種的YPH499細(xì)胞接合,然后散布在含有X-gal但是沒有色氨酸和尿嘧啶的基本培養(yǎng)基中。通過蘭色強(qiáng)度測(cè)定鋅指結(jié)構(gòu)域?qū)τ?4種靶序列的DNA結(jié)合親合力和特異性。使用Zif268鋅指結(jié)構(gòu)域的對(duì)照實(shí)驗(yàn)表明鋅指結(jié)構(gòu)域和結(jié)合位點(diǎn)之間的陽(yáng)性相互作用產(chǎn)生暗至淺蘭色菌落,(其蘭色強(qiáng)度與結(jié)合親合力成正比),并且陰性相互作用產(chǎn)生白色菌落。
實(shí)施例8鑒定的鋅指結(jié)構(gòu)域與相互作用密碼的比較將選擇的鋅指結(jié)構(gòu)域關(guān)鍵堿基接觸位置處的氨基酸殘基與從鋅指結(jié)構(gòu)域-DNA相互作用密碼推導(dǎo)出的那些相比較(圖3)。大多數(shù)鋅指結(jié)構(gòu)域表現(xiàn)出預(yù)期的模式,即關(guān)鍵位置處的氨基酸殘基與從密碼子推導(dǎo)出的那些匹配很好。
例如,從隨機(jī)誘變產(chǎn)生的庫(kù)篩選的鋅指結(jié)構(gòu)域中的共有氨基酸殘基是-1位處的R(Arg;7/14)或者K(Lys;2/14),3位處的N(Asp;6/14),和6位處的R(9/14)(表1)。使用GAGC質(zhì)粒篩選這些鋅指結(jié)構(gòu)域。(其中復(fù)合結(jié)合序列,5’-GAGCGGGCG-3’,與報(bào)道基因可操作連接的報(bào)道質(zhì)粒被稱作GAGC質(zhì)粒。同樣,其中序列,5’-XXXXGGGCG-3’,與報(bào)道基因可操作連接的報(bào)道質(zhì)粒被稱作XXXX質(zhì)粒)。關(guān)鍵堿基接觸位置處的這些氨基酸殘基與從密碼預(yù)期的那些精確匹配。[人基因組中大多數(shù)鋅指結(jié)構(gòu)域在位置2處含有S(絲氨酸),絲氨酸殘基能夠與四種堿基中的任一個(gè)形成氫鍵。因此下面將不再考慮該位置的作用。位置2處的殘基在堿基識(shí)別中通常只起著小的作用(Pavletich和Pabo(1991)Science 252,809-817)]。
從人基因組獲得的鋅指結(jié)構(gòu)域中的氨基酸殘基也與從密碼預(yù)期的那些十分匹配。例如,使用GAGC質(zhì)粒獲得的鋅指結(jié)構(gòu)域中的位置-1,3,和6處的共有氨基酸殘基分別是R,N,和R(表1,第3欄)。這些氨基酸正是從密碼推導(dǎo)出的那些。
使用GCTT質(zhì)粒獲得的鋅指結(jié)構(gòu)域中的位置-1,3,和6處的氨基酸殘基分別是V,T和R(表1,第4欄)。T和R殘基正是從密碼預(yù)測(cè)的那些。與GCTT位點(diǎn)的堿基T(下劃線)相互作用的位置-1處的密碼子推測(cè)的氨基酸殘基是L,T或N。使用GCTT質(zhì)粒篩選的VSTR鋅指結(jié)構(gòu)域含有V(纈氨酸),與該位置處的L(亮氨酸)相似的疏水性氨基酸。
總之,篩選的鋅指結(jié)構(gòu)域中的氨基酸殘基與三個(gè)關(guān)鍵位置中至少兩個(gè)位置處的密碼子預(yù)測(cè)的那些匹配。表1中下劃線的是從密碼子預(yù)測(cè)的篩選的鋅指結(jié)構(gòu)域中的氨基酸殘基。這些結(jié)果有力證明這里公開的體內(nèi)篩選系統(tǒng)正如所預(yù)期的發(fā)揮功能。
實(shí)施例9再轉(zhuǎn)化和交叉轉(zhuǎn)化為了排除假陽(yáng)性結(jié)果的可能性和研究上述鋅指蛋白的序列特異性,使用分離的質(zhì)粒進(jìn)行酵母細(xì)胞的再轉(zhuǎn)化和交叉轉(zhuǎn)化。
首先用報(bào)道質(zhì)粒和編碼鋅指結(jié)構(gòu)域的雜交質(zhì)粒共轉(zhuǎn)染酵母細(xì)胞。將酵母轉(zhuǎn)化體接種到?jīng)]有亮氨酸和色氨酸的基本培養(yǎng)基中并且溫育36小時(shí)。將生長(zhǎng)培養(yǎng)基中大約1,000個(gè)細(xì)胞直接點(diǎn)斑到?jīng)]有亮氨酸,色氨酸和組氨酸的固體培養(yǎng)基中(圖10中指定為-組氨酸)和沒有亮氨酸和色氨酸的固體培養(yǎng)基中(圖10中指定為+組氨酸)。然后將這些細(xì)胞在30℃下溫育50小時(shí)。這些結(jié)果在圖10中給出。
預(yù)期當(dāng)雜合轉(zhuǎn)錄因子的鋅指部分結(jié)合復(fù)合結(jié)合序列時(shí),菌落能夠在沒有組氨酸的培養(yǎng)基中生長(zhǎng),使得雜合轉(zhuǎn)錄因子激活HIS3報(bào)道基因的表達(dá)。當(dāng)轉(zhuǎn)錄因子的鋅指部分不結(jié)合復(fù)合結(jié)合序列時(shí),菌落不能夠在沒有組氨酸的培養(yǎng)基中生長(zhǎng)。
如圖10所示,分離的鋅指結(jié)構(gòu)域能夠結(jié)合相應(yīng)的靶序列并且證明序列特異性與Zif268的顯著不同。Zif268表現(xiàn)出與GCGT質(zhì)粒比與其它5種質(zhì)粒高的活性,并且使用GAGT質(zhì)粒有相對(duì)高活性。具有包含其它結(jié)合位點(diǎn)并且表達(dá)Zif268蛋白質(zhì)的報(bào)道基因的菌株沒有形成菌落。
最初使用GAGC報(bào)道質(zhì)粒篩選從隨機(jī)突變體庫(kù)分離的KTNR鋅指結(jié)構(gòu)域。根據(jù)所期望的,只有用GAGC質(zhì)粒形成菌落。從人基因組衍生的庫(kù)獲得的鋅指結(jié)構(gòu)域也表現(xiàn)出預(yù)期的特異性。例如,HSNK,其是用GACT質(zhì)粒篩選的,當(dāng)再轉(zhuǎn)化到酵母細(xì)胞中時(shí)只有用GACT質(zhì)粒才使細(xì)胞生長(zhǎng)。VSTR,其是用GCTT質(zhì)粒篩選的,表現(xiàn)出與GCTT質(zhì)粒的最高活性。RDER,其是用GAGT質(zhì)粒篩選的,在四個(gè)堿基接觸位置具有和Zif268的指3相同的氨基酸殘基。根據(jù)所期望的,該鋅指結(jié)構(gòu)域表現(xiàn)出與指3的相似的序列特異性。用GAGC和GAGT質(zhì)粒篩選的SSNR使細(xì)胞在有GAGC質(zhì)粒但是沒有GAGT質(zhì)粒的組氨酸-缺乏培養(yǎng)基上生長(zhǎng)。用ACAT質(zhì)粒獲得的QSTV使用該項(xiàng)測(cè)試中測(cè)試的任何質(zhì)粒都不使細(xì)胞生長(zhǎng)。但是,根據(jù)下面所證明的,該鋅指結(jié)構(gòu)域能體外緊密結(jié)合ACAT序列。
實(shí)施例10凝膠移位分析含有使用修飾的單雜種系統(tǒng)篩選的鋅指結(jié)構(gòu)域的鋅指蛋白在大腸桿菌中表達(dá),純化,并且在凝膠移位分析中使用。通過用SalI和NotI消化分離雜合質(zhì)粒中編碼鋅指蛋白的DNA片段并且插入pGEX-4T2(Pharmacia Biotech)SalI和NotI位點(diǎn)之間。鋅指蛋白在大腸桿菌菌株BL21中表達(dá)為與GST(谷胱甘肽-S-轉(zhuǎn)移酶)連接的融合蛋白。使用谷胱甘肽親和層析(Pharmacia Biotech,Piscataway,N.J.)純化融合蛋白,然后用凝血酶消化,其裂解GST部分和鋅指蛋白之間的連接位點(diǎn)。純化的鋅指蛋白含有Zif268的指1和指2和C-末端處的選擇的鋅指結(jié)構(gòu)域。
合成下面的探針DNAs,退火,使用T4多核苷酸激酶用32P標(biāo)記,并且在凝膠移位分析中使用。
GCGT;5′-CCGGGTCGCGCGTGGGCGGTACCG-3′(SEQ ID NO90)3′CAGCGCGCACCCGCCATGGCAGCT-5′(SEQ IDNO91)GAGC;5′-CCGGGTCGCGAGCGGGCGGTACCG-3′(SEQ ID NO92)3′-CAGCGCTCGCCCGCCATGGCAGCT-5′(SEQ IDNO93)GCTT;5′-CCGGGTCGTGCTTGGGCGGTACCG-3′(SEQ ID NO94)3′-CAGCACGAACCCGCCATGGCAGCT-5′(SEQ IDNO95)
GAGT;5′-CCGGGTCGGGACTGGGCGGTACCG-3′(SEQ ID NO96)3′-CAGCCCTGACCCGCCATGGCAGCT-5′(SEQ IDNO97)GAGT;5′-CCGGGTCGGGAGTGGGCGGTACCG-3′(SEQ ID NO98)3′-CAGCCCTCACCCGCCATGGCAGCT-5′(SEQ IDNO99)ACAT;5′-CCGGGTCGGACATGGGCGGTACCG-3′(SEQ ID NO100)3′-CAGCCTGTACCCGCCATGGCAGCT-5′(SEQ IDNO101)室溫下在20mM Tris pH7.7,120mM NaCl,5mM MgCl2,20μM ZnSO4,10%甘油,0.1%Nonidet P-40,5mM DTT,和0.10mg/mL BSA(牛血清白蛋白)中將不同量的鋅指蛋白與標(biāo)記的探針DNA溫育1小時(shí),然后使反應(yīng)混合物進(jìn)行凝膠電泳。通過PhosphorImager(TM)分析(MolecularDynamics)定量測(cè)定放射性信號(hào),根據(jù)(Rebar和Pabo(1994)Science263671-673)所述測(cè)定解離常數(shù)(Kd)。表2中描述了結(jié)果。在至少兩個(gè)獨(dú)立的實(shí)驗(yàn)中測(cè)定所有的常數(shù),指明平均值的標(biāo)準(zhǔn)誤差。表2也表明酵母轉(zhuǎn)化體在組氨酸缺乏的基本培養(yǎng)基上的細(xì)胞生長(zhǎng)(圖10)。表2鋅指蛋白探針DNAA 解離常數(shù)(nM)酵母生長(zhǎng)Zif268 GCTT2.1±0.3 -GCGT0.024±0.004 +++GAGT0.17±0.04 ++GAGC2.3±0.9 -GACT4.9±0.6 -ACAT1.3±0.3 -KTNR GCGT5.5±0.7 -GAGC0.17±0.01 ++GACT30±1-CSNR GCGT2.7±0.3 -GAGT0.46±0.04 +++GAGC1.2±0.1 ++GACT0.17±0.01 +++
HSNK GCGT42±14-GAGT3.5±0.1 -GACT0.32±0.08++RDER GCGT0.027+0.002 +++GAGT0.18±0.01++GACT28±9 -SSNR GCGT3.8±1.3 -GAGC0.45±0.09++GACT0.61±0.21+VSTR GCTT0.53±0.07++GCGT0.76±0.22-GAGT1.4±0.2 -QSTV GCTT29±3 -GCGT9.8±3.4 -ACAT2.3±0.4 -*+++,20至100%生長(zhǎng);++,5至20%生長(zhǎng);+,1-5%生長(zhǎng);-,<1%生長(zhǎng)。
使細(xì)胞在組氨酸缺乏平板上生長(zhǎng)的鋅指蛋白緊密結(jié)合相應(yīng)的探針DNAs。例如,用作對(duì)照的Zif268蛋白質(zhì)使攜帶GCGT和GAGT報(bào)道質(zhì)粒的細(xì)胞生長(zhǎng),使用相應(yīng)的探針DNAs體外測(cè)定的解離常數(shù)分別是0.024nM和0.17nM。相反,Zif268蛋白質(zhì)沒有使攜帶其它質(zhì)粒的細(xì)胞生長(zhǎng),并且使用相應(yīng)的探針DNAs體外測(cè)定的解離常數(shù)高于1nM。
含有新的鋅指結(jié)構(gòu)域的鋅指蛋白也表現(xiàn)出相似結(jié)果。例如,KTNR蛋白對(duì)于GAGC探針DNA表現(xiàn)出強(qiáng)親和性,解離常數(shù)是0.17nM,但是對(duì)于GCGT或GACT探針DNA沒有表現(xiàn)出強(qiáng)親和性,解離常數(shù)分別是5.5nM或30nM。這種蛋白質(zhì)只使攜帶GAGC質(zhì)粒的細(xì)胞生長(zhǎng)。HSNK蛋白能緊密結(jié)合GACT探針DNA(Kd=0.32nM),但是不能結(jié)合GCGT或GAGT探針DNA;如所預(yù)期的,HSNK蛋白只使攜帶GACT質(zhì)粒的細(xì)胞生長(zhǎng)。
當(dāng)再轉(zhuǎn)化到酵母中時(shí),使用ACAT報(bào)道質(zhì)粒篩選的QSTV蛋白不能促進(jìn)攜帶任何其它報(bào)道質(zhì)粒的細(xì)胞生長(zhǎng)。凝膠移位分析證明這種蛋白質(zhì)比對(duì)其它探針DNAs更緊密地結(jié)合ACAT探針DNA。即,QSTV結(jié)合ACAT探針DNA分別比結(jié)合GCTT或GCGT探針強(qiáng)13倍或4.3倍。
一般情況下,例如具有三個(gè)鋅指結(jié)構(gòu)域的鋅指蛋白結(jié)合DNA序列,解離常數(shù)低于1nM,其使得細(xì)胞生長(zhǎng),而當(dāng)鋅指蛋白以高于1nM的解離常數(shù)結(jié)合DNA序列時(shí),其不使細(xì)胞生長(zhǎng)。以高于1nM但是小于5nM的解離常數(shù)結(jié)合的鋅指蛋白例如在具有四個(gè)鋅指結(jié)構(gòu)域的嵌合鋅指蛋白中也是有用的。
實(shí)施例11TG-ZFD-001″CSNR1″通過體內(nèi)從人基因組序列篩選來鑒定TG-ZFD-001″CSNR1″。其氨基酸序列是YKCKQCGKAFGCPSNLRRHGRTH(SEQ ID NO23)。下面的人核酸序列編碼該氨基酸序列5’-TATAAATGTAAGCAATGTGGGAAAGCTTTTGGATGTCCCTCAAACCTTCGAAGGCATGGAAGGACTCAC-3’(SEQ ID NO22).
作為與Zif268的指1和2融合的多肽,TG-ZFD-001″CSNR1″證明對(duì)3-bp靶序列GAA,GAC,和GAG的識(shí)別特異性。根據(jù)體內(nèi)篩選結(jié)果和EMSA測(cè)定,其結(jié)合位點(diǎn)偏好是GAA>GAC>GAG>GCG。在EMSA中,與Zif268的指1和2融合的TG-ZFD-001″CSNR″融合物和GST純化手柄對(duì)于含有GAC的位點(diǎn)具有0.17nM的表觀Kd,對(duì)于含有GAG的位點(diǎn)是0.46nM,對(duì)于含有GCG的位點(diǎn)是2.7nM。
TG-ZFD-001″CSNR1″可以被用作構(gòu)建包括多個(gè)鋅指結(jié)構(gòu)域的嵌合DNA結(jié)合蛋白的組件,例如,為了識(shí)別含有序列GAA,GAC,或GAG的DNA位點(diǎn)的目的。
實(shí)施例12TG-ZFD-002″HSNK″通過體內(nèi)從人基因組序列篩選來鑒定TG-ZFD-002″HSNK″。其氨基酸序列是YKCKECGKAFNHSSNFNKHHRIH(SEQ ID NO25)。下面的人核酸序列編碼該氨基酸序列5’-TATAAGTGTAAGGAGTGTGGGAAAGCCTTCAACCACAGCTCCAACTTCAATAAACACCACAGAATCCAC-3’(SEQ ID NO24).
作為與Zif268的指1和2融合的多肽,TG-ZFD-002″HSNK″證明對(duì)3-bp靶序列GAC的識(shí)別特異性。根據(jù)體內(nèi)篩選結(jié)果和EMSA測(cè)定,其結(jié)合位點(diǎn)偏好是GAC>GAG>GCG。在EMSA中,與Zif268的指1和2和GST純化手柄融合的TG-ZFD-002″HSNK″融合物對(duì)于含有GAC的位點(diǎn)具有0.32nM的表觀Kd,對(duì)于含有GAG的位點(diǎn)是3.5nM,對(duì)于含有GCG的位點(diǎn)是42nM。
TG-ZFD-002″HSNK″可以被用作構(gòu)建包括多個(gè)鋅指結(jié)構(gòu)域的嵌合DNA結(jié)合蛋白的組件,例如,為了識(shí)別含有序列GAC的DNA位點(diǎn)的目的。
實(shí)施例13TG-ZFD-003″SSNR″通過體內(nèi)從人基因組序列篩選來鑒定TG-ZFD-003″SSNR″。其氨基酸序列是YECKECGKAFSSGSNFTRHQRIH(SEQ ID NO27)。下面的人核酸序列編碼該氨基酸序列5’-TATGAATGTAAGGAATGTGGGAAAGCCTTTAGTAGTGGTTCAAACTTCACTCGACATCAGAGAATTCAC-3’(SEQ ID NO26).
作為與Zif268的指1和2融合的多肽,TG-ZFD-003″SSNR″證明對(duì)3-bp靶序列GAG的識(shí)別特異性。根據(jù)體內(nèi)篩選結(jié)果和EMSA測(cè)定,其結(jié)合位點(diǎn)偏好是GAG>GAC>GCG。在EMSA中,與Zif268的指1和2和GST純化手柄融合的TG-ZFD-003″SSNR″融合物對(duì)于含有GAG的位點(diǎn)具有0.45nM的表觀Kd,對(duì)于含有GAC的位點(diǎn)是0.61nM,對(duì)于含有GCG的位點(diǎn)是3.8nM。
TG-ZFD-003″SSNR″可以被用作構(gòu)建包括多個(gè)鋅指結(jié)構(gòu)域的嵌合DNA結(jié)合蛋白的組件,例如,為了識(shí)別含有序列GAG或GAC的DNA位點(diǎn)的目的。
實(shí)施例14TG-ZFD-004″RDER1″通過體內(nèi)從人基因組序列篩選來鑒定TG-ZFD-004″RDER1″。其氨基酸序列是YVCDVEGCTWKFARSDELNRHKKRH(SEQ ID NO29)。下面的人核酸序列編碼該氨基酸序列
5’-TATGTATGCGATGTAGAGGGATGTACGTGGAAATTTGCCCGCTCAGATGAGCTCAACAGACACAAGAAAAGGCAC-3’(SEQ ID NO28).
作為與Zif268的指1和2融合的多肽,TG-ZFD-004″RDER1″證明對(duì)3-bp靶序列GCG的識(shí)別特異性。根據(jù)體內(nèi)篩選結(jié)果和EMSA測(cè)定,其結(jié)合位點(diǎn)偏好是GCG>GTG,GAG>GAC。在EMSA,與Zif268的指1和2和GST純化手柄融合的TG-ZFD-004″RDER1″融合物對(duì)于含有GCG的位點(diǎn)具有0.027nM的表觀Kd,對(duì)于含有GAG的位點(diǎn)是0.18nM,對(duì)于含有GAC的位點(diǎn)是28nM。
TG-ZFD-004″RDER1″可以被用作構(gòu)建包括多個(gè)鋅指結(jié)構(gòu)域的嵌合DNA結(jié)合蛋白的組件,例如,為了識(shí)別含有序列GCG,GTG or GAG的DNA位點(diǎn)的目的。
實(shí)施例15TG-ZFD-005″QSTV″通過體內(nèi)從人基因組序列篩選來鑒定TG-ZFD-005″QSTV″。其氨基酸序列是YECNECGKAFAQNSTLRVHQRIH(SEQ ID NO31)。下面的人核酸序列編碼該氨基酸序列5’-TATGAGTGTAATGAATGCGGGAAAGCTTTTGCCCAAAATTCAACTCTCAGAGTACACCAGAGAATTCAC-3’(SEQ ID NO30).
作為與Zif268的指1和2融合的多肽,TG-ZFD-005″QSTV″證明對(duì)3-bp靶序列ACA的識(shí)別特異性。根據(jù)體內(nèi)篩選結(jié)果和EMSA測(cè)定,其結(jié)合位點(diǎn)偏好是ACA>GCG>GCT。在EMSA中,與Zif268的指1和2和GST純化手柄融合的TG-ZFD-005″QSTV″融合物對(duì)于含有ACA的位點(diǎn)具有2.3nM的表觀Kd,對(duì)于含有GCG的位點(diǎn)是9.8nM,對(duì)于含有GCT的位點(diǎn)是29nM。
TG-ZFD-005″QSTV″可以被用作構(gòu)建包括多個(gè)鋅指結(jié)構(gòu)域的嵌合DNA結(jié)合蛋白的組件,例如,為了識(shí)別含有序列ACA的DNA位點(diǎn)的目的。
實(shí)施例16TG-ZFD-006″VSTR″通過體內(nèi)從人基因組序列篩選來鑒定TG-ZFD-006″VSTR″。其氨基酸序列是YECNYCGKTFSVSSTLIRHQRIH(SEQ ID NO33)。下面的人核酸序列編碼該氨基酸序列5’-TATGAGTGTAATTACTGTGGAAAAACCTTTAGTGTGAGCTCAACCCTTATTAGACATCAGAGAATCCAC-3’(SEQ ID NO32).
作為與Zif268的指1和2融合的多肽,TG-ZFD-006″VSTR″證明對(duì)3-bp靶序列GCT的識(shí)別特異性。根據(jù)體內(nèi)篩選結(jié)果和EMSA測(cè)定,其結(jié)合位點(diǎn)偏好是GCT>GCG>GAG。在EMSA中,與Zif268的指1和2和GST純化手柄融合的TG-ZFD-006″VSTR″融合物對(duì)于含有GCT的位點(diǎn)具有0.53nM的表觀Kd,對(duì)于含有GCG的位點(diǎn)是0.76nM,對(duì)于含有GAG的位點(diǎn)是1.4nM。
TG-ZFD-006″VSTR″可以被用作構(gòu)建包括多個(gè)鋅指結(jié)構(gòu)域的嵌合DNA結(jié)合蛋白的組件,例如,為了識(shí)別含有序列GCT或GCG的DNA位點(diǎn)的目的。
實(shí)施例17TG-ZFD-007″CSNR2″通過體內(nèi)從人基因組序列篩選來鑒定TG-ZFD-007″CSNR2″。其氨基酸序列是YQCNICGKCFSCNSNLHRHQRTH(SEQ ID NO35)。下面的人核酸序列編碼該氨基酸序列5’-TATCAGTGCAACATTTGCGGAAAATGTTTCTCCTGCAACTCCAACCTCCACAGGCACCAGAGAACGCAC-3’(SEQ ID NO34).
作為與Zif268的指1和2融合的多肽,TG-ZFD-007″CSNR2″證明對(duì)3-bp靶序列GAA,GAC,和GAG的識(shí)別特異性。根據(jù)體內(nèi)篩選結(jié)果和EMSA測(cè)定,其結(jié)合位點(diǎn)偏好是GAA>GAC>GAG。
TG-ZFD-007″CSNR2″可以被用作構(gòu)建包括多個(gè)鋅指結(jié)構(gòu)域的嵌合DNA結(jié)合蛋白的組件,例如,為了識(shí)別含有序列GAA,GAC,或GAG的DNA位點(diǎn)的目的。
實(shí)施例18TG-ZFD-008″QSHR1″通過體內(nèi)從人基因組序列篩選來鑒定TG-ZFD-008″QSHR1″。其氨基酸序列是YACHLCGKAFTQSSHLRRHEKTH(SEQ ID NO37)。下面的人核酸序列編碼該氨基酸序列5’-TATGCATGTCATCTATGTGGAAAAGCCTTCACTCAGAGTTCTCACCTTAGAAGACATGAGAAAACTCAC-3’(SEQ ID NO36).
作為與Zif268的指1和2融合的多肽,TG-ZFD-008″QSHR1″證明對(duì)3-bp靶序列GGA,GAA,和AGA的識(shí)別特異性。根據(jù)體內(nèi)篩選結(jié)果和EMSA測(cè)定,其結(jié)合位點(diǎn)偏好是GGA>GAA>AGA。
TG-ZFD-008″QSHR1″可以被用作構(gòu)建包括多個(gè)鋅指結(jié)構(gòu)域的嵌合DNA結(jié)合蛋白的組件,例如,為了識(shí)別含有序列GGA,GAA,或AGA的DNA位點(diǎn)的目的。
實(shí)施例19TG-ZFD-009″QSHR2″通過體內(nèi)從人基因組序列篩選來鑒定TG-ZFD-009″QSHR2″。其氨基酸序列是YKCGQCGKFYSQVSHLTRHQKIH(SEQ ID NO39)。下面的人核酸序列編碼該氨基酸序列5’-TATAAATGCGGCCAGTGTGGGAAGTTCTACTCGCAGGTCTCCCACCTCACCCGCCACCAGAAAATCCAC-3’(SEQ ID NO38).
作為與Zif268的指1和2融合的多肽,TG-ZFD-009″QSHR2″證明對(duì)3-bp靶序列GGA的識(shí)別特異性。
TG-ZFD-009″QSHR2″可以被用作構(gòu)建包括多個(gè)鋅指結(jié)構(gòu)域的嵌合DNA結(jié)合蛋白的組件,例如,為了識(shí)別含有序列GGA的DNA位點(diǎn)的目的。
實(shí)施例20TG-ZFD-010″QSHR3″通過體內(nèi)從人基因組序列篩選來鑒定TG-ZFD-010″QSHR3″。其氨基酸序列是YACHLCGKAFTQCSHLRRHEKTH(SEQ ID NO41)。下面的人核酸序列編碼該氨基酸序列5’-TATGCATGTCATCTATGTGGAAAAGCCTTCACTCAGTGTTCTCACCTTAGAAGACATGAGAAAACTCAC-3’(SEQ ID NO40).
作為與Zif268的指1和2融合的多肽,TG-ZFD-010″QSHR3″證明對(duì)3-bp靶序列GGA和GAA的識(shí)別特異性。根據(jù)體內(nèi)篩選結(jié)果測(cè)定,其結(jié)合位點(diǎn)偏好是GGA>GAA。
TG-ZFD-010″QSHR3″可以被用作構(gòu)建包括多個(gè)鋅指結(jié)構(gòu)域的嵌合DNA結(jié)合蛋白的組件,例如,為了識(shí)別含有序列GGA或GAA的DNA位點(diǎn)的目的。
實(shí)施例21TG-ZFD-011″QSHR4″通過體內(nèi)從人基因組序列篩選來鑒定TG-ZFD-011″QSHR4″。其氨基酸序列是YACHLCAKAFIQCSHLRRHEKTH(SEQ ID NO43)。下面的人核酸序列編碼該氨基酸序列5’-TATGCATGTCATCTATGTGCAAAAGCCTTCATTCAGTGTTCTCACCTTAGAAGACATGAGAAAACTCAC-3’(SEQ ID NO42).
作為與Zif268的指1和2融合的多肽,TG-ZFD-011″QSHR4″證明對(duì)3-bp靶序列GGA和GAA的識(shí)別特異性。根據(jù)體內(nèi)篩選結(jié)果測(cè)定,其結(jié)合位點(diǎn)偏好是GGA>GAA。
TG-ZFD-011″QSHR4″可以被用作構(gòu)建包括多個(gè)鋅指結(jié)構(gòu)域的嵌合DNA結(jié)合蛋白的組件,例如,為了識(shí)別含有序列GGA或GAA的DNA位點(diǎn)的目的。
實(shí)施例22TG-ZFD-012″QSHR5″通過體內(nèi)從人基因組序列篩選來鑒定TG-ZFD-012″QSHR5″。其氨基酸序列是YVCRECGRGFRQHSHLVRHKRTH(SEQ ID NO45)。下面的人核酸序列編碼該氨基酸序列
5’-TATGTTTGCAGGGGAATGTGGGCGTGGCTTTCGCCAGCATTCACACCTGGTCAGACACAAGAGGACACAT-3’(SEQ ID NO44).
作為與Zif268的指1和2融合的多肽,TG-ZFD-012″QSHR5″證明對(duì)3-bp靶序列GGA,AGA,GAA,和CGA的識(shí)別特異性。根據(jù)體內(nèi)篩選結(jié)果測(cè)定,其結(jié)合位點(diǎn)偏好是GGA>AGA>GAA>CGA。
TG-ZFD-012″QSHR5″可以被用作構(gòu)建包括多個(gè)鋅指結(jié)構(gòu)域的嵌合DNA結(jié)合蛋白的組件,例如,為了識(shí)別含有序列GGA,AGA,GAA,或CGA的DNA位點(diǎn)的目的。
實(shí)施例23TG-ZFD-013″QSNR1″通過體內(nèi)從人基因組序列篩選來鑒定TG-ZFD-013″QSNR1″。其氨基酸序列是FECKDCGKAFIQKSNLIRHQRTH(SEQ ID NO47)。下面的人核酸序列編碼該氨基酸序列5’-TTTGAGTGTAAAGATTGCGGGAAAGCTTTCATTCAGAAGTCAAACCTCATCAGACACCAGAGAACTCAC-3’(SEQ ID NO46).
作為與Zif268的指1和2融合的多肽,TG-ZFD-013″QSNR1″證明對(duì)3-bp靶序列GAA的識(shí)別特異性。
TG-ZFD-013″QSNR1″可以被用作構(gòu)建包括多個(gè)鋅指結(jié)構(gòu)域的嵌合DNA結(jié)合蛋白的組件,例如,為了識(shí)別含有序列GAA的DNA位點(diǎn)的目的。
實(shí)施例24TG-ZFD-014″QSNR2″通過體內(nèi)從人基因組序列篩選來鑒定TG-ZFD-014″QSNR2″。其氨基酸序列是YVCRECRRGFSQKSNLIRHQRTH(SEQ ID 30 NO49)。下面的人核酸序列編碼該氨基酸序列5’-TATGTCTGCAGGGAGTGTAGGCGAGGTTTTAGCCAGAAGTCAAATCTCATCAGACACCAGAGGACGCAC-3’(SEQ ID NO48).
作為與Zif268的指1和2融合的多肽,TG-ZFD-014″QSNR2″證明對(duì)3-bp靶序列GAA的識(shí)別特異性。
TG-ZFD-014″QSNR2″可以被用作構(gòu)建包括多個(gè)鋅指結(jié)構(gòu)域的嵌合DNA結(jié)合蛋白的組件,例如,為了識(shí)別含有序列GAA的DNA位點(diǎn)的目的。
實(shí)施例25TG-ZFD-015″QSNV1″通過體內(nèi)從人基因組序列篩選來鑒定TG-ZFD-015″QSNV1″。其氨基酸序列是YECNTCRKTFSQKSNLIVHQRTH(SEQ ID NO51)。下面的人核酸序列編碼該氨基酸序列5’-TATGAATGTAACACATGCAGGAAAACCTTCTCTCAAAAGTCAAATCTCATTGTACATCAGAGAACACAC-3’(SEQ ID NO50).
作為與Zif268的指1和2融合的多肽,TG-ZFD-015″QSNV1″證明對(duì)3-bp靶序列AAA和CAA的識(shí)別特異性。根據(jù)體內(nèi)篩選結(jié)果測(cè)定,其結(jié)合位點(diǎn)偏好是AAA>CAA。
TG-ZFD-015″QSNV1″可以被用作構(gòu)建包括多個(gè)鋅指結(jié)構(gòu)域的嵌合DNA結(jié)合蛋白的組件,例如,為了識(shí)別含有序列AAA和CAA的DNA位點(diǎn)的目的。
實(shí)施例26TG-ZFD-016″QSNV2″通過體內(nèi)從人基因組序列篩選來鑒定TG-ZFD-016″QSNV2″。其氨基酸序列是YVCSKCGKAFTQSSNLTVHQKIH(SEQ ID NO53)。下面的人核酸序列編碼該氨基酸序列5’-TATGTTTGCTCAAAATGTGGGAAAGCCTTCACTCAGAGTTCAAATCTGACTGTACATCAAAAAATCCAC-3’(SEQ ID NO52).
作為與Zif268的指1和2融合的多肽,TG-ZFD-016″QSNV2″證明對(duì)3-bp靶序列AAA和CAA的識(shí)別特異性。根據(jù)體內(nèi)篩選結(jié)果測(cè)定,其結(jié)合位點(diǎn)偏好是AAA>CAA。
TG-ZFD-016″QSNV2″可以被用作構(gòu)建包括多個(gè)鋅指結(jié)構(gòu)域的嵌合DNA結(jié)合蛋白的組件,例如,為了識(shí)別含有序列AAA和CAA的DNA位點(diǎn)的目的。
實(shí)施例27TG-ZFD-017″QSNV3″通過體內(nèi)從人基因組序列篩選來鑒定TG-ZFD-017″QSNV3″。其氨基酸序列是YKCDECGKNFTQSSNLIVHKRIH(SEQ ID NO55)。下面的人核酸序列編碼該氨基酸序列5’-TACAAATGTGACGAATGTGGAAAAAACTTTACCCAGTCCTCCAACCTTATTGTACATAAGAGAATTCAT-3’(SEQ ID NO54).
作為與Zif268的指1和2融合的多肽,TG-ZFD-017″QSNV3″證明對(duì)3-bp靶序列AAA的識(shí)別特異性。
TG-ZFD-017″QSNV3″可以被用作構(gòu)建包括多個(gè)鋅指結(jié)構(gòu)域的嵌合DNA結(jié)合蛋白的組件,例如,為了識(shí)別含有序列AAA的DNA位點(diǎn)的目的。
實(shí)施例28TG-ZFD-018″QSNV4″通過體內(nèi)從人基因組序列篩選來鑒定TG-ZFD-018″QSNV4″。其氨基酸序列是YECDVCGKTFTQKSNLGVHQRTH(SEQ ID NO57)。下面的人核酸序列編碼該氨基酸序列5’-TATGAATGTGATGTGTGTGGAAAAACCTTCACGCAAAAGTCAAACCTTGGTGTACATCAGAGAACTCAT-3’(SEQ ID NO56).
作為與Zif268的指1和2融合的多肽,TG-ZFD-018″QSNV4″證明對(duì)3-bp靶序列AAA的識(shí)別特異性。
TG-ZFD-018″QSNV4″可以被用作構(gòu)建包括多個(gè)鋅指結(jié)構(gòu)域的嵌合DNA結(jié)合蛋白的組件,例如,為了識(shí)別含有序列AAA的DNA位點(diǎn)的目的。
實(shí)施例29TG-ZFD-019″QSSR1″
通過體內(nèi)從人基因組序列篩選來鑒定TG-ZFD-019″QSSR1″。其氨基酸序列是YKCPDCGKSFSQSSSLIRHQRTH(SEQ ID NO59)。下面的人核酸序列編碼該氨基酸序列5’-TATAAGTGCCCTGATTGTGGGAAGAGTTTTAGTCAGAGTTCCAGCCTCATTCGCCACCAGCGGACACAC-3’(SEQ ID NO58).
作為與Zif268的指1和2融合的多肽,TG-ZFD-019″QSSR1″證明對(duì)3-bp靶序列GTA和GCA的識(shí)別特異性。根據(jù)體內(nèi)篩選結(jié)果測(cè)定,其結(jié)合位點(diǎn)偏好是GTA>GCA。
TG-ZFD-019″QSSR1″可以被用作構(gòu)建包括多個(gè)鋅指結(jié)構(gòu)域的嵌合DNA結(jié)合蛋白的組件,例如,為了識(shí)別含有序列GTA或GCA的DNA位點(diǎn)的目的。
實(shí)施例30TG-ZFD-020″QSSR2″通過體內(nèi)從人基因組序列篩選來鑒定TG-ZFD-020″QSSR2″。其氨基酸序列是YECQDCGRAFNQNSSLGRHKRTH(SEQ ID NO61)。下面的人核酸序列編碼該氨基酸序列5’-TATGAGTGTCAGGACTGTGGGAGGGCCTTCAACCAGAACTCCTCCCTGGGGCGGCACAAGAGGACACAC-3’(SEQ ID NO60).
作為與Zif268的指1和2融合的多肽,TG-ZFD-020″QSSR2″證明對(duì)3-bp靶序列GTA的識(shí)別特異性。
TG-ZFD-020″QSSR2″可以被用作構(gòu)建包括多個(gè)鋅指結(jié)構(gòu)域的嵌合DNA結(jié)合蛋白的組件,例如,為了識(shí)別含有序列GTA的DNA位點(diǎn)的目的。
實(shí)施例31TG-ZFD-021″QSTR″通過體內(nèi)從人基因組序列篩選來鑒定TG-ZFD-021″QSTR″。其氨基酸序列是YKCEECGKAFNQSSTLTRHKIVH(SEQ ID NO63)。下面的人核酸序列編碼該氨基酸序列
5’-TACAAATGTGAAGAATGTGGCAAACCTTTTAACCAGTCCTCAACCCTTACTAGACATAAGATAGTTCAT-3’(SEQ ID NO62).
作為與Zif268的指1和2融合的多肽,TG-ZFD-021″QSTR″證明對(duì)3-bp靶序列GTA和GCA的識(shí)別特異性。根據(jù)體內(nèi)篩選結(jié)果測(cè)定,其結(jié)合位點(diǎn)偏好是GTA>GCA。
TG-ZFD-021″QSTR″可以被用作構(gòu)建包括多個(gè)鋅指結(jié)構(gòu)域的嵌合DNA結(jié)合蛋白的組件,例如,為了識(shí)別含有序列GTA和GCA的DNA位點(diǎn)的目的。
實(shí)施例32TG-ZFD-022″RSHR″通過體內(nèi)從人基因組序列篩選來鑒定TG-ZFD-022″RSHR″。其氨基酸序列是YKCMECGKAFNRRSHLTRHQRIH(SEQ ID NO65)。下面的人核酸序列編碼該氨基酸序列5’-TATAAGTGCATGGAGTGTGGGAAGGCTTTTAACCGCAGGTCACACCTCACACGGCACCAGCGGATTCAC-3’(SEQ ID NO64).
作為與Zif268的指1和2融合的多肽,TG-ZFD-022″RSHR″證明對(duì)3-bp靶序列GGG的識(shí)別特異性。
TG-ZFD-022″RSHR″可以被用作構(gòu)建包括多個(gè)鋅指結(jié)構(gòu)域的嵌合DNA結(jié)合蛋白的組件,例如,為了識(shí)別含有序列GGG的DNA位點(diǎn)的目的。
實(shí)施例33TG-ZFD-023″VSSR″通過體內(nèi)從人基因組序列篩選來鑒定TG-ZFD-023″VSSR″。其氨基酸序列是YTCKQCGKAFSVSSSLRRHETTH(SEQ ID NO67)。下面的人核酸序列編碼該氨基酸序列5’-TATACATGTAAACAGTGTGGGAAAGCCTTCAGTGTTTCCAGTTCCCTTCGAAGACATGAAACCACTCAC-3’(SEQ ID NO66).
作為與Zif268的指1和2融合的多肽,TG-ZFD-023″VSSR″證明對(duì)3-bp靶序列GTT,GTG,和GTA的識(shí)別特異性。根據(jù)體內(nèi)篩選結(jié)果測(cè)定,其結(jié)合位點(diǎn)偏好是GTT>GTG>GTA。
TG-ZFD-023″VSSR″可以被用作構(gòu)建包括多個(gè)鋅指結(jié)構(gòu)域的嵌合DNA結(jié)合蛋白的組件,例如,為了識(shí)別含有序列GTT,GTG,或GTA的DNA位點(diǎn)的目的。
實(shí)施例34TG-ZFD-024″QAHR″通過體內(nèi)從人基因組序列篩選來鑒定TG-ZFD-024″QAHR″。其氨基酸序列是YKCKECGQAFRQRAHLIRHHKLH(SEQ ID NO103)。下面的人核酸序列編碼該氨基酸序列5’-TATAAGTGTAAGGAATGTGGGCAGGCCTTTAGACAGCGTGCACATCTTATTCGACATCACAAACTTCAC-3’(SEQ ID NO102).
作為與Zif268的指1和2融合的多肽,TG-ZFD-024″QAHR″證明對(duì)3-bp靶序列GGA的識(shí)別特異性。
TG-ZFD-024″QAHR″可以被用作構(gòu)建包括多個(gè)鋅指結(jié)構(gòu)域的嵌合DNA結(jié)合蛋白的組件,例如,為了識(shí)別含有序列GGA的DNA位點(diǎn)的目的。
實(shí)施例35TG-ZFD-025″QFNR″通過體內(nèi)從人基因組序列篩選來鑒定TG-ZFD-025″QFNR″。其氨基酸序列是YKCHQCGKAFIQSFNLRRHERTH(SEQ ID NO105)。下面的人核酸序列編碼該氨基酸序列5’-TATAAGTGTCATCAATGTGGGAAAGCCTTTATTCAATCCTTTAACCTTCGAAGACATGAGAGAACTCAC-3’(SEQ ID NO104).
作為與Zif268的指1和2融合的多肽,TG-ZFD-025″QFNR″證明對(duì)3-bp靶序列GAC的識(shí)別特異性。
TG-ZFD-025″QFNR″可以被用作構(gòu)建包括多個(gè)鋅指結(jié)構(gòu)域的嵌合DNA結(jié)合蛋白的組件,例如,為了識(shí)別含有序列GAC的DNA位點(diǎn)的目的。
實(shí)施例36TG-ZFD-026″QGNR″通過體內(nèi)從人基因組序列篩選來鑒定TG-ZFD-026″QGNR″。其氨基酸序列是FQCNQCGASFTQKGNLLRHIKLH(SEQ ID NO107)。下面的人核酸序列編碼該氨基酸序列5’-TTCCAGTGTAATCAGTGTGGGGCATCTTTTACTCAGAAAGGTAACCTCCTCCGCCACATTAAACTGCAC-3’(SEQ ID NO106).
作為與Zif268的指1和2融合的多肽,TG-ZFD-026″QGNR″證明對(duì)3-bp靶序列GAA的識(shí)別特異性。
TG-ZFD-026″QGNR″可以被用作構(gòu)建包括多個(gè)鋅指結(jié)構(gòu)域的嵌合DNA結(jié)合蛋白的組件,例如,為了識(shí)別含有序列GAA的DNA位點(diǎn)的目的。
實(shí)施例37TG-ZFD-028″QSHT″通過體內(nèi)從人基因組序列篩選來鑒定TG-ZFD-028″QSHT″。其氨基酸序列是YKCEECGKAFRQSSHLTTHKIIH(SEQ ID NO111)。下面的人核酸序列編碼該氨基酸序列5’-TACAAATGTGAAGAATGTGGCAAAGCCTTTAGGCAGTCCTCACACCTTACTACACATAAGATAATTCAT-3’(SEQ ID NO110).
作為與Zif268的指1和2融合的多肽,TG-ZFD-028″QSHT″證明對(duì)3-bp靶序列AGA,CGA,TGA,和GGA的識(shí)別特異性。根據(jù)體內(nèi)篩選結(jié)果測(cè)定,其結(jié)合位點(diǎn)偏好是(AGA和CGA)>TGA>GGA。
TG-ZFD-028″QSHT″可以被用作構(gòu)建包括多個(gè)鋅指結(jié)構(gòu)域的嵌合DNA結(jié)合蛋白的組件,例如,為了識(shí)別含有序列AGA,CGA,TGA,和GGA的DNA位點(diǎn)的目的。
實(shí)施例38TG-ZFD-029″QSHV″
通過體內(nèi)從人基因組序列篩選來鑒定TG-ZFD-029″QSHT″。其氨基酸序列是YECDHCGKSFSQSSHLNVHKRTH(SEQ ID NO113)。下面的人核酸序列編碼該氨基酸序列5’-TATGAGTGTGATCACTGTGGAAAATCCTTTAGCCAGAGCTCTCATCTGAATGTGCACAAAAGAACTCAC-3’(SEQ ID NO112).
作為與Zif268的指1和2融合的多肽,TG-ZFD-029″QSHV″證明對(duì)3-bp靶序列CGA,AGA,和TGA的識(shí)別特異性。根據(jù)體內(nèi)篩選結(jié)果測(cè)定,其結(jié)合位點(diǎn)偏好是CGA>AGA>TGA。
TG-ZFD-029″QSHV″可以被用作構(gòu)建包括多個(gè)鋅指結(jié)構(gòu)域的嵌合DNA結(jié)合蛋白的組件,例如,為了識(shí)別含有序列CGA,AGA,和TGA的DNA位點(diǎn)的目的。
實(shí)施例39TG-ZFD-030″QSNI″通過體內(nèi)從人基因組序列篩選來鑒定TG-ZFD-030″QSNI″。其氨基酸序列是YMCSECGRGFSQKSNLIIHQRTH(SEQ ID NO115)。下面的人核酸序列編碼該氨基酸序列5’-TACATGTGCAGTGAGTGTGGGCGAGGCTTCAGCCAGAAGTCAAACCTCATCATACACCAGAGGACACAC-3’(SEQ ID NO114).
作為與Zif268的指1和2融合的多肽,TG-ZFD-030″QSNI″證明對(duì)3-bp靶序列AAA和CAA的識(shí)別特異性。
TG-ZFD-029″QSHV″可以被用作構(gòu)建包括多個(gè)鋅指結(jié)構(gòu)域的嵌合DNA結(jié)合蛋白的組件,例如,為了識(shí)別含有序列AAA或CAA的DNA位點(diǎn)的目的。
實(shí)施例40TG-ZFD-031″QSNR3″通過體內(nèi)從人基因組序列篩選來鑒定TG-ZFD-031″QSNR3″。其氨基酸序列是YECEKCGKAFNQSSNLTRHKKSH(SEQ ID NO117)。下面的人核酸序列編碼該氨基酸序列5’-TATGAATGTGAAAAATGTGGCAAAGCTTTTAACCAGTCCTCAAATCTTACTAGACATAAGAAAAGTCAT-3’(SEQ ID NO116).
作為與Zif268的指1和2融合的多肽,TG-ZFD-031″QSNR3″證明對(duì)3-bp靶序列GAA的識(shí)別特異性。
TG-ZFD-031″QSNR3″可以被用作構(gòu)建包括多個(gè)鋅指結(jié)構(gòu)域的嵌合DNA結(jié)合蛋白的組件,例如,為了識(shí)別含有序列GAA的DNA位點(diǎn)的目的。
實(shí)施例41TG-ZFD-032″QSSR3″通過體內(nèi)從人基因組序列篩選來鑒定TG-ZFD-032″QSSR3″。其氨基酸序列是YECNECGKFFSQSSSLIRHRRSH(SEQ ID NO119)。下面的人核酸序列編碼該氨基酸序列5’-TATGAGTGCAATGAATGTGGGAAGTTTTTTAGCCAGAGCTCCAGCCTCATTAGACATAGGAGAAGTCAC-3’(SEQ ID NO118).
作為與Zif268的指1和2融合的多肽,TG-ZFD-032″QSSR3″證明對(duì)3-bp靶序列GTA和GCA的識(shí)別特異性。根據(jù)體內(nèi)篩選結(jié)果測(cè)定,其結(jié)合位點(diǎn)偏好是GTA>GCA。
TG-ZFD-032″QSSR3″可以被用作構(gòu)建包括多個(gè)鋅指結(jié)構(gòu)域的嵌合DNA結(jié)合蛋白的組件,例如,為了識(shí)別含有序列GTA或GCA的DNA位點(diǎn)的目的。
實(shí)施例42TG-ZFD-033″QTHQ″通過體內(nèi)從人基因組序列篩選來鑒定TG-ZFD-033″QTHQ″。其氨基酸序列是YECHDCGKSFRQSTHLTQHRRIH(SEQ ID NO121)。下面的人核酸序列編碼該氨基酸序列5’-TATGAGTGTCACGATTGCGGAAAGTCCTTTAGGCAGAGCACCCACCTCACTCAGCACCGGAGGATCCAC-3’(SEQ ID NO120).
作為與Zif268的指1和2融合的多肽,TG-ZFD-033″QTHQ″證明對(duì)3-bp靶序列AGA,TGA,和CGA的識(shí)別特異性。根據(jù)體內(nèi)篩選結(jié)果測(cè)定,其結(jié)合位點(diǎn)偏好是AGA>(TGA和CGA)。
TG-ZFD-033″QTHQ″可以被用作構(gòu)建包括多個(gè)鋅指結(jié)構(gòu)域的嵌合DNA結(jié)合蛋白的組件,例如,為了識(shí)別含有序列AGA,TGA,和CGA的DNA位點(diǎn)的目的。
實(shí)施例43TG-ZFD-034″QTHR1″通過體內(nèi)從人基因組序列篩選來鑒定TG-ZFD-034″QTHR1″。其氨基酸序列是YECHDCGKSFRQSTHLTRHRRIH(SEQ ID NO123)。下面的人核酸序列編碼該氨基酸序列5’-TATGAGTGTCACGATTGCGGAAAGTCCTTTAGGCAGAGCACCCACCTCACTCGGCACCGGAGGATCCAC-3’(SEQ ID NO122).
作為與Zif268的指1和2融合的多肽,TG-ZFD-034″QTHR1″證明對(duì)3-bp靶序列GGA,GAA,和AGA的識(shí)別特異性。根據(jù)體內(nèi)篩選結(jié)果測(cè)定,其結(jié)合位點(diǎn)偏好是GGA>(GAA和AGA)。
TG-ZFD-034″QTHR1″可以被用作構(gòu)建包括多個(gè)鋅指結(jié)構(gòu)域的嵌合DNA結(jié)合蛋白的組件,例如,為了識(shí)別含有序列GGA,GAA,和AGA的DNA位點(diǎn)的目的。
實(shí)施例44TG-ZFD-035″QTHR2″通過體內(nèi)從人基因組序列篩選來鑒定TG-ZFD-035″QTHR2″。其氨基酸序列是HKCLECGKCFSQNTHLTRHQRT(SEQ ID NO125)。下面的人核酸序列編碼該氨基酸序列5’-CACAAGTGCCTTGAATGTGGGAAATGCTTCAGTCAGAACACCCATCTGACTCGCCACCAACGCACCCAC-3’(SEQ ID NO124).
作為與Zif268的指1和2融合的多肽,TG-ZFD-035″QTHR2″證明對(duì)3-bp靶序列GGA的識(shí)別特異性。
TG-ZFD-035″QTHR2″可以被用作構(gòu)建包括多個(gè)鋅指結(jié)構(gòu)域的嵌合DNA結(jié)合蛋白的組件,例如,為了識(shí)別含有序列GGA的DNA位點(diǎn)的目的。
實(shí)施例45TG-ZFD-036″RDER2″通過體內(nèi)從人基因組序列篩選來鑒定TG-ZFD-036″RDER2″。其氨基酸序列是YHCDWDGCGWKFARSDELTRHYRKH(SEQ ID NO127)。下面的人核酸序列編碼該氨基酸序列5’-TACCACTGTGACTGGGACGGCTGTGGATGGAAATTCGCCCGCTCAGATGAACTGACCAGGCACTACCGTAAACAC-3’(SEQ ID NO126).
作為與Zif268的指1和2融合的多肽,TG-ZFD-036″RDER2″證明對(duì)3-bp靶序列GCG和GTG的識(shí)別特異性。根據(jù)體內(nèi)篩選結(jié)果測(cè)定,其結(jié)合位點(diǎn)偏好是GCG>GTG。
TG-ZFD-036″RDER2″可以被用作構(gòu)建包括多個(gè)鋅指結(jié)構(gòu)域的嵌合DNA結(jié)合蛋白的組件,例如,為了識(shí)別含有序列GCG和GTG的DNA位點(diǎn)的目的。
實(shí)施例46TG-ZFD-037″RDER3″通過體內(nèi)從人基因組序列篩選來鑒定TG-ZFD-037″RDER3″。其氨基酸序列是YRCSWEGCEWRFARSDELTRHFRKH(SEQ ID NO129)。下面的人核酸序列編碼該氨基酸序列5’-TACAGATGCTCATGGGAAGGGTGTGAGTGGCGTTTTGCAAGAAGTGATGAGTTAACCAGGCACTTCCGAAAGCAC-3’(SEQ ID NO128).
作為與Zif268的指1和2融合的多肽,TG-ZFD-037″RDER3″證明對(duì)3-bp靶序列GCG和GTG的識(shí)別特異性。
TG-ZFD-037″RDER3″可以被用作構(gòu)建包括多個(gè)鋅指結(jié)構(gòu)域的嵌合DNA結(jié)合蛋白的組件,例如,為了識(shí)別含有序列GCG和GTG的DNA位點(diǎn)的目的。
實(shí)施例47TG-ZFD-038″RDER4″通過體內(nèi)從人基因組序列篩選來鑒定TG-ZFD-038″RDER4″。其氨基酸序列是FSCSWKGCERRFARSDELSRHRRTH(SEQ ID NO131)。下面的人核酸序列編碼該氨基酸序列5’-TTCAGCTGTAGCTGGAAAGGTTGTGAAAGGAGGTTTGCCCGTTCTGATGAACTGTCCAGACACAGGCGAACCCAC-3’(SEQ ID NO130)作為與Zif268的指1和2融合的多肽,TG-ZFD-038″RDER4″證明對(duì)3-bp靶序列GCG和GTG的識(shí)別特異性。
TG-ZFD-038″RDER4″可以被用作構(gòu)建包括多個(gè)鋅指結(jié)構(gòu)域的嵌合DNA結(jié)合蛋白的組件,例如,為了識(shí)別含有序列GCG和GTG的DNA位點(diǎn)的目的。
實(shí)施例48TG-ZFD-039″RDER5″通過體內(nèi)從人基因組序列篩選來鑒定TG-ZFD-039″RDER5″。其氨基酸序列是FACSWQDCNKKFARSDELARHYRTH(SEQ ID NO133)。下面的人核酸序列編碼該氨基酸序列5’-TTCGCCTGCAGCTGGCAGGACTGCAACAAGAAGTTCGCGCGCTCCGACGAGCTGGCGCGGCACTACCGCACACAC-3’(SEQ ID NO132).
作為與Zif268的指1和2融合的多肽,TG-ZFD-039″RDER5″證明對(duì)3-bp靶序列GCG的識(shí)別特異性。
TG-ZFD-039″RDER5″可以被用作構(gòu)建包括多個(gè)鋅指結(jié)構(gòu)域的嵌合DNA結(jié)合蛋白的組件,例如,為了識(shí)別含有序列GCG的DNA位點(diǎn)的目的。
實(shí)施例49TG-ZFD-040″RDER6″
通過體內(nèi)從人基因組序列篩選來鑒定TG-ZFD-040″RDER6″。其氨基酸序列是YHCNWDGCGWKFARSDELTRHYRKH(SEQ ID NO135)。下面的人核酸序列編碼該氨基酸序列5’-TACCACTGCAACTGGGACGGCTGCGGCTGGAAGTTTGCGCGCTCAGACGAGCTCACGCGCCACTACCGAAAGCAC-3’(SEQ ID NO134).
作為與Zif268的指1和2融合的多肽,TG-ZFD-040″RDER6″證明對(duì)3-bp靶序列GCG和GTG的識(shí)別特異性。根據(jù)體內(nèi)篩選結(jié)果測(cè)定,其結(jié)合位點(diǎn)偏好是GCG>GTG。
TG-ZFD-040″RDER6″可以被用作構(gòu)建包括多個(gè)鋅指結(jié)構(gòu)域的嵌合DNA結(jié)合蛋白的組件,例如,為了識(shí)別含有序列GCG和GTG的DNA位點(diǎn)的目的。
實(shí)施例50TG-ZFD-041″RDHR1″通過體內(nèi)從人基因組序列篩選來鑒定TG-ZFD-041″RDHR1″。其氨基酸序列是FLCQYCAQRFGRKDHLTRHMKKSH(SEQ ID NO137)。下面的人核酸序列編碼該氨基酸序列5’-TTCCTCTGTCAGTATTGTGCACAGAGATTTGGGCGAAAGGATCACCTGACTCGACATATGAAGAAGAGTCAC-3’(SEQ ID NO136)。
作為與Zif268的指1和2融合的多肽,TG-ZFD-041″RDHR1″證明對(duì)3-bp靶序列GAG和GGG的識(shí)別特異性。
TG-ZFD-041″RDHR1″可以被用作構(gòu)建包括多個(gè)鋅指結(jié)構(gòu)域的嵌合DNA結(jié)合蛋白的組件,例如,為了識(shí)別含有序列GAG和GGG的DNA位點(diǎn)的目的。
實(shí)施例51TG-ZFD-043″RDHT″通過體內(nèi)從人基因組序列篩選來鑒定TG-ZFD-043″RDHT″。其氨基酸序列是FQCKTCQRKFSRSDHLKTHTRTH(SEQ IDNO141)。下面的人核酸序列編碼該氨基酸序列5’-TTCCAGTGTAAAACTTGTCAGCGAAAGTTCTCCCGGTCCGACCACCTGAAGACCCACACCAGGACTCAT-3’(SEQ ID NO140).
作為與Zif268的指1和2融合的多肽,TG-ZFD-043″RDHT″證明對(duì)3-bp靶序列TGG,AGG,CGG,和GGG的識(shí)別特異性。
TG-ZFD-043″RDHT″可以被用作構(gòu)建包括多個(gè)鋅指結(jié)構(gòu)域的嵌合DNA結(jié)合蛋白的組件,例如,為了識(shí)別含有序列TGG,AGG,CGG,和GGG的DNA位點(diǎn)的目的。
實(shí)施例52TG-ZFD-044″RDKI″通過體內(nèi)從人基因組序列篩選來鑒定TG-ZFD-044″RDKI″。其氨基酸序列是FACEVCGVRFTRNDKLKIHMRKH(SEQ ID NO143)。下面的人核酸序列編碼該氨基酸序列5’-TTTGCCTGCGAGGTCTGCGGTGTTCGATTCACCAGGAACGACAAGCTGAAGATCCACATGCGGAAGCAC-3’(SEQ ID NO142).
作為與Zif268的指1和2融合的多肽,TG-ZFD-044″RDKI″證明對(duì)3-bp靶序列GGG的識(shí)別特異性。
TG-ZFD-044″RDKI″可以被用作構(gòu)建包括多個(gè)鋅指結(jié)構(gòu)域的嵌合DNA結(jié)合蛋白的組件,例如,為了識(shí)別含有序列GGG的DNA位點(diǎn)的目的。
實(shí)施例53TG-ZFD-045″RDKR″通過體內(nèi)從人基因組序列篩選來鑒定TG-ZFD-045″RDKR″。其氨基酸序列是YVCDVEGCTWKFARSDKLNRHKKRH(SEQ ID NO145)。下面的人核酸序列編碼該氨基酸序列5’-TATGTATGCGATGTAGAGGGATGTACGTGGAAATTTGCCCGCTCAGATAAGCTCAACAGACACAAGAAAAGGCAC-3’(SEQ ID NO144).
作為與Zif268的指1和2融合的多肽,TG-ZFD-045″RDKR″證明對(duì)3-bp靶序列GGG和AGG的識(shí)別特異性。根據(jù)體內(nèi)篩選結(jié)果測(cè)定,其結(jié)合位點(diǎn)偏好是GGG>AGG。
TG-ZFD-045″RDKR″可以被用作構(gòu)建包括多個(gè)鋅指結(jié)構(gòu)域的嵌合DNA結(jié)合蛋白的組件,例如,為了識(shí)別含有序列GGG和AGG的DNA位點(diǎn)的目的。
實(shí)施例54TG-ZFD-046″RSNR″通過體內(nèi)從人基因組序列篩選來鑒定TG-ZFD-046″RSNR″。其氨基酸序列是YICRKCGRGFSRKSNLIRHQRTH(SEQ ID NO147)。下面的人核酸序列編碼該氨基酸序列5’-TATATTTGCAGAAAGTGTGGACGGGGCTTTAGTCGGAAGTCCAACCTTATCAGACATCAGAGGACACAC-3’(SEQ ID NO146).
作為與Zif268的指1和2融合的多肽,TG-ZFD-046″RSNR″證明對(duì)3-bp靶序列GAG和GTG的識(shí)別特異性。根據(jù)體內(nèi)篩選結(jié)果測(cè)定,其結(jié)合位點(diǎn)偏好是GAG>GTG。
TG-ZFD-046″RSNR″可以被用作構(gòu)建包括多個(gè)鋅指結(jié)構(gòu)域的嵌合DNA結(jié)合蛋白的組件,例如,為了識(shí)別含有序列GAG和GTG的DNA位點(diǎn)的目的。
實(shí)施例55TG-ZFD-047″RTNR″通過體內(nèi)從人基因組序列篩選來鑒定TG-ZFD-047″RTNR″。其氨基酸序列是YLCSECDKCFSRSTNLIRHRRTH(SEQ ID NO149)。下面的人核酸序列編碼該氨基酸序列5’-TATCTATGTAGTGAGTGTGACAAATGCTTCAGTAGAAGTACAAACCTCATAAGGCATCGAAGAACTCAC-3’(SEQ ID NO148).
作為與Zif268的指1和2融合的多肽,TG-ZFD-047″RTNR″證明對(duì)3-bp靶序列GAG的識(shí)別特異性。
TG-ZFD-047″RTNR″可以被用作構(gòu)建包括多個(gè)鋅指結(jié)構(gòu)域的嵌合DNA結(jié)合蛋白的組件,例如,為了識(shí)別含有序列GAG的DNA位點(diǎn)的目的。
現(xiàn)已描述了本發(fā)明的很多實(shí)施方案。然而,應(yīng)當(dāng)明白不超出本發(fā)明的精神和范圍可以進(jìn)行各種各樣的修飾。因此,其它實(shí)施方案在下面的權(quán)利要求書范圍內(nèi)。
序列表序列表<110>Kim,Jin-SooKwon,Young-DoKim,Hyun-WonRyu,Eun HyunHwang,Moon Sun<120>靶特異性鋅指域的選擇<130>12279-002001<160>167<170>FastSEQ for Windows Version 4.0<210>1<211>10<212>DNA<213>HIV-1<400>1gacatcgagc10<210>2<211>10<212>DNA<213>HIV-1<400>2gcagctgctt10gctgagacat 10<210>6<211>47<212>DNA<213>人工序列<220><223>最佳結(jié)合位點(diǎn)<400>6ccggcgtggg cggctgcgtg ggcgtgcgtg ggcggactgc gtgggcg47<210>7<211>47<212>DNA<213>人工序列<220><223>最佳結(jié)合位點(diǎn)<400>7tcgacgccca cgcagtccgc ccacgcacgc ccacgcagcc gcccacg47<210>8<211>49<212>DNA<213>HIV-1<400>8ccggcgagcg ggcggtcgag cgggcgtgag cgggcggatc gagcgggcg49<210>9<211>49<212>DNA<213>HIV-1<400>9tcgacgcccg ctcgatccgc ccgctcacgc ccgctcgacc gcccgctcg49<210>10<211>50<212>DNA<213>HIV-1<400>10ccggctgctt gggcggctgc ttgggcgtgc ttgggcgggc tgcttgggcg50<210>11<211>50<212>DNA<213>HIV-1<400>11tcgacgccca agcagcccgc ccaagcacgc ccaagcagcc gcccaagcag50<210>12<211>47<212>DNA<213>HIV-1<400>12ccggactggg cgggggactg ggcgtgactg ggcggaggga ctgggcg47<210>13<211>47<212>DNA<213>HIV-1<400>13tcgacgccca gtccctccgc ccagtcacgc ccagtccccc gcccagt47<210>14<211>47<212>DNA<213>人<400>14ccggagtggg cggtggagtg ggcgtgagtg ggcggatgga gtgggcg47<210>15<211>47<212>DNA<213>人<400>15tcgacgccca ctccatccgc ccactcacgc ccactccacc gcccact47<210>16<211>48<212>DNA<213>人<400>16ccggacatgg gcggagacat gggcgtacat gggcggaaga catgggcg48<210>17<211>48<212>DNA<213>人<400>17tcgacgccca tgtcttccgc ccatgtacgc ccatgtctcc gcccatgt48<210>18<211>120<212>DNA<213>人工序列<220><223>質(zhì)粒序列<221>CDS<222>(1)...(81)<400>18aaa gag ggt ggg tcg acc ttc cgg act ggc cag gaa cgc cca gat ccg48Lys Glu Gly Gly Ser Thr Phe Arg Thr Gly Gln Glu Arg Pro Asp Pro1 5 10 15cgg gaa ttc aga tct act agt gcg gcc gct aag taagtaagac gtcgagctcg101Arg Glu Phe Arg Ser Thr Ser Ala Ala Ala Lys20 25ccatcgcggt ggaagcttt120<210>19<211>27<212>PRT<213>人工序列<220><223>質(zhì)粒序列<400>19Lys Glu Gly Gly Ser Thr Phe Arg Thr Gly Gln Glu Arg Pro Asp Pro1 5 10 15Arg Glu Phe Arg Ser Thr Ser Ala Ala Ala Lys20 25<210>20<211>303<212>DNA<213>人工序列<220><223>質(zhì)粒序列<221>CDS<222>(25)...(291)<400>20gggtcgacct tccggactgg ccag gaa cgc cca tat gct tgc cct gtc gag51Glu Arg Pro Tyr Ala Cys Pro Val Glu1 5tcc tgc gat cgc cgc ttt tct cgc tcg gat gag ctt acc cgc cat atc99Ser Cys Asp Arg Arg Phe Ser Arg Ser Asp Glu Leu Thr Arg His Ile10 15 20 25cgc atc cac act ggc cag aag ccc ttc cag tgt cga atc tgc atg cgt147Arg Ile His Thr Gly Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg30 35 40aac ttc agt cgt agt gac cac ctt acc acc cac atc cgg acc cac acc195Asn Phe Ser Arg Ser Asp His Leu Thr Thr His Ile Arg Thr His Thr45 50 55ggc gag aag cct ttt gcc tgt gac att tgt ggg agg aag ttt gcc agg243Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Arg60 65 70agt gat gaa cgc aag agg cat acc aaa atc cat tta aga cag aag gat291Ser Asp Glu Arg Lys Arg His Thr Lys Ile His Leu Arg Gln Lys Asp75 80 85ccgcgggaat cc303<210>21<211>89<212>PRT<213>人工序列<220><223>質(zhì)粒序列<400>21Glu Arg Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg Phe Ser1 5 10 15Arg Ser Asp Glu Leu Thr Arg His Ile Arg Ile His Thr Gly Gln Lys20 25 30Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Ser Asp His35 40 45Leu Thr Thr His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys50 55 60Asp Ile Cys Gly Arg Lys Phe Ala Arg Ser Asp Glu Arg Lys Arg His65 70 75 80Thr Lys Ile His Leu Arg Gln Lys Asp85<210>22<211>102<212>DNA<213>人<220><221>CDS<222>(1)...(102)<400>22acc ggg cag aaa ccg tac aaa tgt aag caa tgt ggg aaa gct ttt gga48Thr Gly Gln Lys Pro Tyr Lys Cys Lys Gln Cys Gly Lys Ala Phe Gly1 5 10 15tgt ccc tca aac ctt cga agg cat gga agg act cac acc ggc gag aaa96Cys Pro Ser Asn Leu Arg Arg His Gly Arg Thr His Thr Gly Glu Lys20 25 30ccg cgg102Pro Arg<210>23<211>34<212>PRT<213>人<400>23Thr Gly Gln Lys Pro Tyr Lys Cys Lys Gln Cys Gly Lys Ala Phe Gly1 5 10 15Cys Pro Ser Asn Leu Arg Arg His Gly Arg Thr His Thr Gly Glu Lys20 25 30Pro Arg<210>24<211>102<212>DNA<213>人<220><221>CDS<222>(1)...(102)<400>24acc ggg gag aag cca tac aag tgt aag gag tgt ggg aaa gcc ttc aac48Thr Gly Glu Lys Pro Tyr Lys Cys Lys Glu Cys Gly Lys Ala Phe Asn1 5 10 15cac agc tcc aac ttc aat aaa cac cac aga atc cac acc ggc gaa aag96His Ser Ser Asn Phe Asn Lys His His Arg Ile His Thr Gly Glu Lys20 25 30ccg cgg102Pro Arg<210>25<211>34<212>PRT<213>人<400>25Thr Gly Glu Lys Pro Tyr Lys Cys Lys Glu Cys Gly Lys Ala Phe Asn1 5 10 15His Ser Ser Asn Phe Asn Lys His His Arg Ile His Thr Gly Glu Lys20 25 30Pro Arg<210>26<211>102<212>DNA<213>人<220><221>CDS<222>(1)...(102)<400>26acc ggg gag agg cca ttt gaa tgt aag gaa tgt ggg aaa gcc ttt agt48Thr Gly Glu Arg Pro Phe Glu Cys Lys Glu Cys Gly Lys Ala Phe Ser1 5 10 15agt ggt tca aac ttc act cga cat cag aga att cac acc ggt gaa aag96Ser Gly Ser Asn Phe Thr Arg His Gln Arg Ile His Thr Gly Glu Lys20 25 30ccg cgg102Pro Arg<210>27<211>34<212>PRT<213>人<400>27Thr Gly Glu Arg Pro Phe Glu Cys Lys Glu Cys Gly Lys Ala Phe Ser1 5 10 15Ser Gly Ser Asn Phe Thr Arg His Gln Arg Ile His Thr Gly Glu Lys20 25 30Pro Arg<210>28<211>108<212>DNA<213>人<220><221>CDS<222>(1)...(108)<400>28acc ggg cag aag cca tac gta tgc gat gta gag gga tgt acg tgg aaa48Thr Gly Gln Lys Pro Tyr Val Cys Asp Val Glu Gly Cys Thr Trp Lys1 5 10 15ttt gcc cgc tca gat gag ctc aac aga cac aag aaa agg cac acc ggc96Phe Ala Arg Ser Asp Glu Leu Asn Arg His Lys Lys Arg His Thr Gly20 25 30gaa aga ccg cgg108Glu Arg Pro Arg35<210>29<211>36<212>PRT<213>人<400>29Thr Gly Gln Lys Pro Tyr Val Cys Asp Val Glu Gly Cys Thr Trp Lys15 10 15Phe Ala Arg Ser Asp Glu Leu Asn Arg His Lys Lys Arg His Thr Gly20 25 30Glu Arg Pro Arg35<210>30<211>102<212>DNA<213>人<220><221>CDS<222>(1)...(102)<400>30acc ggg gag aga cct tac gag tgt aat gaa tgc ggg aaa gct ttt gcc48Thr Gly Glu Arg Pro Tyr Glu Cys Asn Glu Cys Gly Lys Ala Phe Ala1 5 10 15caa aat tca act ctc aga gta cac cag aga att cac acc ggc gaa aag96Gln Asn Ser Thr Leu Arg Val His Gln Arg Ile His Thr Gly Glu Lys20 25 30ccg cgg102Pro Arg<210>31<211>34<212>PRT<213>人<400>31Thr Gly Glu Arg Pro Tyr Glu Cys Asn Glu Cys Gly Lys Ala Phe Ala1 5 10 15Gln Asn Ser Thr Leu Arg Val His Gln Arg Ile His Thr Gly Glu Lys20 25 30Pro Arg<210>32<211>102<212>DNA<213>人<220><221>CDS<222>(1)...(102)<400>32acc ggg gag agg cct tat gag tgt aat tac tgt gga aaa acc ttt agt48Thr Gly Glu Arg Pro Tyr Glu Cys Asn Tyr Cys Gly Lys Thr Phe Ser1 5 10 15gtg agc tca acc ctt att aga cat cag aga atc cac acc ggc gag aga96Val Ser Ser Thr Leu Ile Arg His Gln Arg Ile His Thr Gly Glu Arg20 25 30ccg cgg102Pro Arg<210>33<211>34<212>PRT<213>人<400>33Thr Gly Glu Arg Pro Tyr Glu Cys Asn Tyr Cys Gly Lys Thr Phe Ser1 5 10 15Val Ser Ser Thr Leu Ile Arg His Gln Arg Ile His Thr Gly Glu Arg20 25 30Pro Arg<210>34<211>69<212>DNA<213>人<220><221>CDS<222>(1)...(69)<400>34tat cag tgc aac att tgc gga aaa tgt ttc tcc tgc aac tcc aac ctc48Tyr Gln Cys Asn Ile Cys Gly Lys Cys Phe Ser Cys Asn Ser Asn Leu1 5 10 15cac agg cac cag aga acg cac69His Arg His Gln Arg Thr His20<210>35<211>23<212>PRT<213>人<400>35Tyr Gln Cys Asn Ile Cys Gly Lys Cys Phe Ser Cys Asn Ser Asn Leu1 5 10 15His Arg His Gln Arg Thr His20<210>36<211>69<212>DNA<213>人<220><221>CDS<222>(1)...(69)<400>36tat gca tgt cat cta tgt gga aaa gcc ttc act cag agt tct cac ctt48Tyr Ala Cys His Leu Cys Gly Lys Ala Phe Thr Gln Ser Ser His Leu1 5 10 15aga aga cat gag aaa act cac69Arg Arg His Glu Lys Thr His20<210>37<211>23<212>PRT<213>人<400>37Tyr Ala Cys His Leu Cys Gly Lys Ala Phe Thr Gln Ser Ser His Leu1 5 10 15Arg Arg His Glu Lys Thr His20<210>38<211>69<212>DNA<213>人<220><221>CDS<222>(1)...(69)<400>38tat aaa tgc ggc cag tgt ggg aag ttc tac tcg cag gtc tcc cac ctc48Tyr Lys Cys Gly Gln Cys Gly Lys Phe Tyr Ser Gln Val Ser His Leu1 5 10 15acc cgc cac cag aaa atc cac69Thr Arg His Gln Lys Ile His20<210>39<211>23<212>PRT<213>人<400>39Tyr Lys Cys Gly Gln Cys Gly Lys Phe Tyr Ser Gln Val Ser His Leu1 5 10 15Thr Arg His Gln Lys Ile His20<210>40<211>69<212>DNA<213>人<220><221>CDS<222>(1)...(69)<400>40tat gca tgt cat cta tgt gga aaa gcc ttc act cag tgt tct cac ctt48Tyr Ala Cys His Leu Cys Gly Lys Ala Phe Thr Gln Cys Ser His Leu1 5 10 15aga aga cat gag aaa act cac69Arg Arg His Glu Lys Thr His20<210>41<211>23<212>PRT<213>人<400>41Tyr Ala Cys His Leu Cys Gly Lys Ala Phe Thr Gln Cys Ser His Leu1 5 10 15Arg Arg His Glu Lys Thr His20<210>42<211>69<212>DNA<213>人<220><221>CDS<222>(1)...(69)<400>42tat gca tgt cat cta tgt gca aaa gcc ttc att cag tgt tct cac ctt48Tyr Ala Cys His Leu Cys Ala Lys Ala Phe Ile Gln Cys Ser His Leu1 5 10 15aga aga cat gag aaa act cac 69Arg Arg His Glu Lys Thr His20<210>43<211>23<212>PRT<213>人<400>43Tyr Ala Cys His Leu Cys Ala Lys Ala Phe Ile Gln Cys Ser His Leu1 5 10 15Arg Arg His Glu Lys Thr His20<210>44<211> 69<212>DNA<213>人<220><221>CDS<222>(1)...(69)<400>44tat gtt tgc agg gaa tgt ggg cgt ggc ttt cgc cag cat tca cac ctg48Tyr Val Cys Arg Glu Cys Gly Arg Gly Phe Arg Gln His Ser His Leu1 5 10 15gtc aga cac aag agg aca cat69Val Arg His Lys Arg Thr His20<210>45<211>23<212>PRT<213>人<400>45Tyr Val Cys Arg Glu Cys Gly Arg Gly Phe Arg Gln His Ser His Leu1 5 10 15Val Arg His Lys Arg Thr His20<210>46<211>69<212>DNA<213>人<220><221>CDS<222>(1)...(69)<400>46ttt gag tgt aaa gat tgc ggg aaa gct ttc att cag aag tca aac ctc48Phe Glu Cys Lys Asp Cys Gly Lys Ala Phe Ile Gln Lys Ser Asn Leu1 5 10 15atc aga cac cag aga act cac69Ile Arg His Gln Arg Thr His20<210>47<211>23<212>PRT<213>人<400>47Phe Glu Cys Lys Asp Cys Gly Lys Ala Phe Ile Gln Lys Ser Asn Leu1 5 10 15Ile Arg His Gln Arg Thr His20<210>48<211>69<212>DNA<213>人<220><221>CDS<222>(1)...(69)<400>48tat gtc tgc agg gag tgt agg cga ggt ttt agc cag aag tca aat ctc48Tyr Val Cys Arg Glu Cys Arg Arg Gly Phe Ser Gln Lys Ser Asn Leu1 5 10 15atc aga cac cag agg acg cac69Ile Arg His Gln Arg Thr His20<210>49<211>23<212>PRT<213>人<400>49Tyr Val Cys Arg Glu Cys Arg Arg Gly Phe Ser Gln Lys Ser Asn Leu1 5 10 15Ile Arg His Gln Arg Thr His20<210>50<211>69<212>DNA<213>人<220><221>CDS<222>(1)...(69)<400>50tat gaa tgt aac aca tgc agg aaa acc ttc tct caa aag tca aat ctc48Tyr Glu Cys Asn Thr Cys Arg Lys Thr Phe Ser Gln Lys Ser Asn Leu1 5 10 15att gta cat cag aga aca cac69Ile Val His Gln Arg Thr His20<210>51<211>23<212>PRT<213>人<400>51Tyr Glu Cys Asn Thr Cys Arg Lys Thr Phe Ser Gln Lys Ser Asn Leu1 5 10 15Ile Val His Gln Arg Thr His20<210>52<211>69<212>DNA<213>人<220><221>CDS<222>(1)...(69)<400>52tat gtt tgc tca aaa tgt ggg aaa gcc ttc act cag agt tca aat ctg48Tyr Val Cys Ser Lys Cys Gly Lys Ala Phe Thr Gln Ser Ser Asn Leu1 5 10 15act gta cat caa aaa atc cac69Thr Val His Gln Lys Ile His20<210>53<211>23<212>PRT<213>人<400>53Tyr Val Cys Ser Lys Cys Gly Lys Ala Phe Thr Gln Ser Ser Asn Leu1 5 10 15Thr Val His Gln Lys Ile His20<210>54<211>69<212>DNA<213>人<220><221>CDS<222>(1)...(69)<400>54tac aaa tgt gac gaa tgt gga aaa aac ttt acc cag tcc tcc aac ctt48Tyr Lys Cys Asp Glu Cys Gly Lys Asn Phe Thr Gln Ser Ser Asn Leu1 5 10 15att gta cat aag aga att cat69Ile Val His Lys Arg Ile His20<210>55<211>23<212>PRT<213>人<400>55Tyr Lys Cys Asp Glu Cys Gly Lys Asn Phe Thr Gln Ser Ser Asn Leu1 5 10 15Ile Val His Lys Arg Ile His20<210>56<211>69<212>DNA<213>人<220><221>CDS<222>(1)...(69)<400>56tat gaa tgt gat gtg tgt gga aaa acc ttc acg caa aag tca aac ctt48Tyr Glu Cys Asp Val Cys Gly Lys Thr Phe Thr Gln Lys Ser Asn Leu1 5 10 15ggt gta cat cag aga act cat69Gly Val His Gln Arg Thr His20<210>57<211>23<212>PRT<213>人<400>57Tyr Glu Cys Asp Val Cys Gly Lys Thr Phe Thr Gln Lys Ser Asn Leu1 5 10 15Gly Val His Gln Arg Thr His20<210>58<211>69<212>DNA<213>人<220><221>CDS<222>(1)...(69)<400>58tat aag tgc cct gat tgt ggg aag agt ttt agt cag agt tcc agc ctc48Tyr Lys Cys Pro Asp Cys Gly Lys Ser Phe Ser Gln Ser Ser Ser Leu1 5 10 15att cgc cac cag cgg aca cac69Ile Arg His Gln Arg Thr His20<210>59<211>23<212>PRT<213>人<400>59Tyr Lys Cys Pro Asp Cys Gly Lys Ser Phe Ser Gln Ser Ser Ser Leu1 5 10 15Ile Arg His Gln Arg Thr His20<210>60<211>69<212>DNA<213>人<220><221>CDS<222>(1)...(69)<400>60tat gag tgt cag gac tgt ggg agg gcc ttc aac cag aac tcc tcc ctg48Tyr Glu Cys Gln Asp Cys Gly Arg Ala Phe Asn Gln Asn Ser Ser Leu1 5 10 15ggg cgg cac aag agg aca cac69Gly Arg His Lys Arg Thr His20<210>61<211>23<212>PRT<213>人<400>61Tyr Glu Cys Gln Asp Cys Gly Arg Ala Phe Asn Gln Asn Ser Ser Leu1 5 10 15Gly Arg His Lys Arg Thr His20<210>62<211>69<212>DNA<213>人<220><221>CDS<222>(1)...(69)<400>62tac aaa tgt gaa gaa tgt ggc aaa gct ttt aac cag tcc tca acc ctt48Tyr Lys Cys Glu Glu Cys Gly Lys Ala Phe Asn Gln Ser Ser Thr Leu1 5 10 15act aga cat aag ata gtt cat69Thr Arg His Lys Ile Val His20<210>63<211>23<212>PRT<213>人<400>63Tyr Lys Cys Glu Glu Cys Gly Lys Ala Phe Asn Gln Ser Ser Thr Leu1 5 10 15Thr Arg His Lys Ile Val His20<210>64<211>69<212>DNA<213>人<220><221>CDS<222>(1)...(69)<400>64tat aag tgc atg gag tgt ggg aag gct ttt aac cgc agg tca cac ctc48Tyr Lys Cys Met Glu Cys Gly Lys Ala Phe Asn Arg Arg Ser His Leu1 5 10 15aca cgg cac cag cgg att cac69Thr Arg His Gln Arg Ile His20<210>65<211>23<212>PRT<213>人<400>65Tyr Lys Cys Met Glu Cys Gly Lys Ala Phe Asn Arg Arg Ser His Leu1 5 10 15Thr Arg His Gln Arg Ile His20<210>66<211>69<212>DNA<213>人<220><221>CDS<222>(1)...(69)<400>66tat aca tgt aaa cag tgt ggg aaa gcc ttc agt gtt tcc agt tcc ctt48Tyr Thr Cys Lys Gln Cys Gly Lys Ala Phe Ser Val Ser Ser Ser Leu1 5 10 15cga aga cat gaa acc act cac69Arg Arg His Glu Thr Thr His20<210>67<211>23<212>PRT<213>人<400>67Tyr Thr Cys Lys Gln Cys Gly Lys Ala Phe Ser Val Ser Ser Ser Leu1 5 10 15Arg Arg His Glu Thr Thr His20<210>68<211>20<212>PRT<213>人工序列<220><223>純化的多肽<221>VARIANT<222>4<223>Xaa=任何氨基酸;2-5個(gè)氨基酸長(zhǎng)<221>VARIANT<222>2,6-8,10,12,16<223>Xaa=任何氨基酸<221>VARIANT<222>1,9<223>Xaa=Phe或Tyr<221>VARIANT<222>15<223>Xaa=疏水殘基<221>VARIANT<222>19<223>Xaa=任何氨基酸;3-5個(gè)氨基酸長(zhǎng)<400>68Xaa Xaa Cys Xaa Cys Xaa Xaa Xaa Xaa Xaa Cys Xaa Ser Asn Xaa Xaa1 5 10 15Arg His Xaa His20<210>69<211>20<212>PRT<213>人工序列<220><223>純化的多肽<221>VARIANT<222>4<223>Xaa=任何氨基酸;2-5個(gè)氨基酸長(zhǎng)<221>VARIANT<222>2,6-8,10,12,16<223>Xaa=任何氨基酸<221>VARIANT<222>1,9<223>Xaa=Phe或Tyr<221>VARIANT<222>15<223>Xaa=疏水殘基<221>VARIANT<222>19<223>Xaa=任何氨基酸;3-5個(gè)氨基酸長(zhǎng)<400>69Xaa Xaa Cys Xaa Cys Xaa Xaa Xaa Xaa Xaa His Xaa Ser Asn Xaa Xaa1 5 10 15Lys His Xaa His20<210>70<211>20<212>PRT<213>人工序列<220><223>純化的多肽<221>VARIANT<222>4<223>Xaa=任何氨基酸;2-5個(gè)氨基酸長(zhǎng)<221>VARIANT<222>2,6-8,10,12,16<223>Xaa=任何氨基酸<221>VARIANT<222>1,9<223>Xaa=Phe或Tyr<221>VARIANT<222>15<223>Xaa=疏水殘基<221>VARIANT<222>19<223>Xaa=任何氨基酸;3-5個(gè)氨基酸長(zhǎng)<400>70Xaa Xaa Cys Xaa Cys Xaa Xaa Xaa Xaa Xaa Ser Xaa Ser Asn Xaa Xaa1 5 10 15Arg His Xaa His20<210>71<211>20<212>PRT<213>人工序列<220><223>純化的多肽<221>VARIANT<222>4<223>Xaa=任何氨基酸;2-5個(gè)氨基酸長(zhǎng)<221>VARIANT<222>2,6-8,10,12,16<223>Xaa=任何氨基酸<221>VARIANT<222>1,9<223>Xaa=Phe或Tyr<221>VARIANT<222>15<223>Xaa=疏水殘基<221>VARIANT<222>19<223>Xaa=任何氨基酸;3-5個(gè)氨基酸長(zhǎng)<400>71Xaa Xaa Cys Xaa Cys Xaa Xaa Xaa Xaa Xaa Gln Xaa Ser Thr Xaa Xaa1 5 10 15Val His Xaa His20<210>72<211>20<212>PRT<213>人工序列<220><223>純化的多肽<221>VARIANT<222>4<223>Xaa=任何氨基酸;2-5個(gè)氨基酸長(zhǎng)<221>VARIANT<222>2,6-8,10,12,16<223>Xaa=任何氨基酸<221>VARIANT<222>1,9<223>Xaa=Phe或Tyr<221>VARIANT<222>14<223>Xaa=Ser或Thr<221>VARIANT<222>15<223>Xaa=疏水殘基<221>VARIANT<222>(19)...(19)<223>Xaa=任何氨基酸;3-5個(gè)氨基酸長(zhǎng)<400>72Xaa Xaa Cys Xaa Cys Xaa Xaa Xaa Xaa Xaa Val Xaa Ser Xaa Xaa Xaa1 5 10 15Arg His Xaa His20<210>73<211>20<212>PRT<213>人工序列<220><223>純化的多肽<221>VARIANT<222>4<223>Xaa=任何氨基酸;2-5個(gè)氨基酸長(zhǎng)<221>VARIANT<222>2,6-8,10,12,16<223>Xaa=任何氨基酸<221>VARIANT<222>1,9<223>Xaa=Phe或Tyr<221>VARIANT<222>15<223>Xaa=疏水殘基<221>VARIANT<222>19<223>Xaa=任何氨基酸;3-5個(gè)氨基酸長(zhǎng)<400>73Xaa Xaa Cys Xaa Cys Xaa Xaa Xaa Xaa Xaa Gln Xaa Ser His Xaa Xaa1 5 10 15Arg His Xaa His20<210>74<211>20<212>PRT<213>人工序列<220><223>純化的多肽<221>VARIANT<222>4<223>Xaa=任何氨基酸;2-5個(gè)氨基酸長(zhǎng)<221>VARIANT<222>2,6-8,10,12,16<223>Xaa=任何氨基酸<221>VARIANT<222>1,9<223>Xaa=Phe或Tyr<221>VARIANT<222>15<223>Xaa=疏水殘基<221>VARIANT<222>19<223>Xaa=任何氨基酸;3-5個(gè)氨基酸長(zhǎng)<400>74Xaa Xaa Cys Xaa Cys Xaa Xaa Xaa Xaa Xaa Gln Xaa Ser Asn Xaa Xaa1 5 10 15Val His Xaa His20<210>75<211>20<212>PRT<213>人工序列<220><223>純化的多肽<221>VARIANT<222>4<223>Xaa=任何氨基酸;2-5個(gè)氨基酸長(zhǎng)<221>VARIANT<222>2,6-8,10,12,16<223>Xaa=任何氨基酸<221>VARIANT<222>1,9<223>Xaa=Phe或Tyr<221>VARIANT<222>14<223>Xaa=Ser或Thr<221>VARIANT<222>15<223>Xaa=疏水殘基<221>VARIANT<222>(19)...(19)<223>Xaa=任何氨基酸;3-5個(gè)氨基酸長(zhǎng)<400>75Xaa Xaa Cys Xaa Cys Xaa Xaa Xaa Xaa Xaa Gln Xaa Ser Xaa Xaa Xaa1 5 10 15Arg His Xaa His20<210>76<211>20<212>PRT<213>人工序列<220><223>配合殘基(coordinating residue)<221>VARIANT<222>1,9<223>Xaa=Phe或Tyr<221>VARIANT<222>2,6-8,10-14,16,17<223>Xaa=任何氨基酸<221>VARIANT<222>4<223>Xaa=任何氨基酸;2-5個(gè)氨基酸長(zhǎng)<221>VARIANT<222>15<223>Xaa=疏水殘基<221>VARIANT<222>19<223>Xaa=任何氨基酸;3-5個(gè)氨基酸長(zhǎng)<400>76Xaa Xaa Cys Xaa Cys Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa1 5 10 15Xaa His Xaa His20<210>77<211>24<212>PRT<213>人工序列<220><223>多肽基序<221>VARIANT<222>1<223>Xaa=Leu,Ile,Val,Met,Phe,Tyr,或Gly<221>VARIANT<222>2<223>Xaa=Ala,Ser,Leu,Val,或Arg<221>VARIANT<222>3-4,6,8-11,17,19-23<223>Xaa=任何氨基酸<221>VARIANT<222>5<223>Xaa=Leu,Ile,Val,Met,Ser,Thr,Ala,Cys,或Asn<221>VARIANT<222>7<223>Xaa=Leu,Ile,Val,或Met<221>VARIANT<222>(12)...(12)<223>Xaa=Leu,Ile,或Val<221>VARIANT<222>(13)...(13)<223>Xaa=Arg,Lys,Asn,Gln,Glu,Ser,Thr,Ala,Ile,或Tyr<221>VARIANT<222>(14)...(14)<223>Xaa=Leu,Ile,Val,Phe,Ser,Thr,Asn,Lys,或His<221>VARIANT<222>(16)...(16)<223>Xaa=Phe,Tyr,Val,或Cys<221>VARIANT<222>(18)...(18)<223>Xaa=Asn,Asp,Gln,Thr,Ala,或His<221>VARIANT<222>(24)...(24)<223>Xaa=Arg,Lys,Asn,Ala,Ile,Met,或Trp<400>77Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Trp Xaa1 5 10 15Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa20<210>78<211>6<212>PRT<213>真核生物<220><221>VARIANT<222>3<223>Xaa=Tyr或Phe<221>VARIANT<222>4<223>Xaa=Lys或Arg<221>VARIANT<222>6<223>Xaa=Tyr或Phe<400>78Thr Gly Xaa Xaa Pro Xaa1 5<210>79<211>29<212>DNA<213>人工序列<220><223>合成寡核苷酸<400>79tgcctgcagc atttgtggga ggaagtttg29<210>80<211>30<212>DNA<213>人工序列<220><223>合成寡核苷酸<400>80atgctgcagg cttaaggctt ctcgccggtg30<210>81<211>24<212>DNA<213>人工序列<220><223>PCR引物<221>misc_feature<222>(0)...(0)<223>n=A,T,G,或C;y=T或C;s=G或C;r=G或A<400>81gcgtccggac ncayacnggn sara24<210>82<211>24<212>DNA<213>人工序列<220><223>PCR引物<221>misc_feature<222>(0)...(0)<223>n=A,T,G,或C;b=G,C,或T;r=G或A;w=A或T;y=T或C<400>82cggaattcan nbrwanggyy tytc24<210>83<211>7<212>PRT<213>人工序列<220><223>氨基酸基序<221>VARIANT<222>4<223>Xaa=Glu或Gln<221>VARIANT<222>5<223>Xaa=Lys或Arg<221>VARIANT<222>3<223>Xaa=Tyr或Phe<400>83His Thr Gly Xaa Xaa Pro Xaa1 5<210>84<211>54<212>DNA<213>人工序列<220><223>合成寡核苷酸<400>84gggcccgggg agaagcctta cgcatgtcca gtcgaatctt gtgatagaag attc54<210>85<211>75<212>DNA<213>人工序列<220><223>合成寡核苷酸<221>misc_feature<222>(0)...(0)<223>n=A,T,G,或C;b=G,C,或T;s=G或C<400>85ctccccgcgg ttcgccggtg tggattctga tatgsnbsnb aagsnbsnbs nbsnbtgaga60atcttctatc acaag75<210>86<211>23<212>DNA<213>人工序列<220><223>合成寡核苷酸<400>86ctagacccgg gaattcgtcg acg23<210>87<211>23<212>DNA<213>人工序列<220><223>合成寡核苷酸<400>87gatccgtcga cgaattcccg ggt23<210>88<211>38<212>DNA<213>人工序列<220><223>合成寡核苷酸<221>misc_feature<222>(0)...(0)<223>n=A,T,G,或C<400>88ccggtnnntg ggcgtacnnn tgggcgtcan nntgggcg38<210>89<211>38<212>DNA<213>人工序列<220><223>合成寡核苷酸<221>misc_feature<222>(0)...(0)<223>n=A,T,G,或C<400>89tcgacgccca nnntgacgcc cannngtacg cccannna38<210>90<211>24<212>DNA<213>人工序列<220><223>用于凝膠位移分析的合成探針<400>90ccgggtcgcg cgtgggcggt accg24<210>91<211>24<212>DNA<213>人工序列<220><223>用于凝膠位移分析的合成探針<400>91tcgacggtac cgcccacgcg cgac24<21D>92<211>24<212>DNA<213>人工序列<220><223>用于凝膠位移分析的合成探針<400>92ccgggtcgcg agcgggcggt accg24<210>93<211>24<212>DNA<213>人工序列<220><223>用于凝膠位移分析的合成探針<400>93tcgacggtac cgcccgctcg cgac24<210>94<211>24<212>DNA<213>人工序列<220><223>用于凝膠位移分析的合成探針<400>94ccgggtcgtg cttgggcggt accg24<210>95<211>24<212>DNA<213>人工序列<220><223>用于凝膠位移分析的合成探針<400>95tcgacggtac cgcccaagca cgac24<210>96<211>24<212>DNA<213>人工序列<220><223>用于凝膠位移分析的合成探針<400>96ccgggtcggg actgggcggt accg24<210>97<211>24<212>DNA<213>人工序列<220><223>用于凝膠位移分析的合成探針<400>97tcgacggtac cgcccagtcc cgac24<210>98<211>24<212>DNA<213>人工序列<220><223>用于凝膠位移分析的合成探針<400>98ccgggtcggg agtgggcggt accg24<210>99<211>24<212>DNA<213>人工序列<220><223>用于凝膠位移分析的合成探針<400>99tcgacggtac cgcccactcc cgac24<210>100<211>24<212>DNA<213>人工序列<220><223>用于凝膠位移分析的合成探針<400>100ccgggtcgga catgggcggt accg24<210>101<211>24<212>DNA<213>人工序列<220><223>用于凝膠位移分析的合成探針<400>101tcgacggtac cgcccatgtc cgac24<210>102<211>69<212>DNA<213>人<220><221>CDS<222>(1)...(69)<400>102tat aag tgt aag gaa tgt ggg cag gcc ttt aga cag cgt gca cat ctt48Tyr Lys Cys Lys Glu Cys Gly Gln Ala Phe Arg Gln Arg Ala His Leu1 5 10 15att cga cat cac aaa ctt cac69Ile Arg His His Lys Leu His20<210>103<211>23<212>PRT<213>人<400>103Tyr Lys Cys Lys Glu Cys Gly Gln Ala Phe Arg Gln Arg Ala His Leu1 5 10 15Ile Arg His His Lys Leu His20<210>104<211>69<212>DNA<213>人<220><221>CDS<222>(1)...(69)<400>104tat aag tgt cat caa tgt ggg aaa gcc ttt att caa tcc ttt aac ctt48Tyr Lys Cys His Gln Cys Gly Lys Ala Phe Ile Gln Ser Phe Asn Leu1 5 10 15cga aga cat gag aga act cac69Arg Arg His Glu Arg Thr His20<210>105<211>23<212>PRT<213>人<400>105Tyr Lys Cys His Gln Cys Gly Lys Ala Phe Ile Gln Ser Phe Asn Leu1 5 10 15Arg Arg His Glu Arg Thr His20<210>106<211>69<212>DNA<213>人<220><221>CDS<222>(1)...(69)<400>106ttc cag tgt aat cag tgt ggg gca tct ttt act cag aaa ggt aac ctc48Phe Gln Cys Asn Gln Cys Gly Ala Ser Phe Thr Gln Lys Gly Asn Leu1 5 10 15ctc cgc cac att aaa ctg cac69Leu Arg His Ile Lys Leu His20<210>107<211>23<212>PRT<213>人<400>107Phe Gln Cys Asn Gln Cys Gly Ala Ser Phe Thr Gln Lys Gly Asn Leu1 5 10 15Leu Arg His Ile Lys Leu His20<210>108<211>22<212>DNA<213>人工序列<220><223>PCR引物<221>misc_feature<222>(0)...(0)<223>n=A,T,G,或C;48-51 nucleotides in length<400>108acccacactg gccagaaacc cn22<210>109<211>22<212>DNA<213>人工序列<220><223>PCR引物<221>misc_feature<222>(0)...(0)<223>n=A,T,G,或C;42-45 nucleotides in length<400>109gatctgaatt cattcaccgg tn22<210>110<211>69<212>DNA<213>人<220><221>CDS<222>(1)...(69)<400>110tac aaa tgt gaa gaa tgt ggc aaa gcc ttt agg cag tcc tca cac ctt48Tyr Lys Cys Glu Glu Cys Gly Lys Ala Phe Arg Gln Ser Ser His Leu1 5 10 15act aca cat aag ata att cat69Thr Thr His Lys Ile Ile His20<210>111<211>23<212>PRT<213>人<400>111Tyr Lys Cys Glu Glu Cys Gly Lys Ala Phe Arg Gln Ser Ser His Leu1 5 10 15Thr Thr His Lys Ile Ile His20<210>112<211>69<212>DNA<213>人<220><221>CDS<222>(1)...(69)<400>112tat gag tgt gat cac tgt gga aaa tcc ttt agc cag agc tct cat ctg48Tyr Glu Cys Asp His Cys Gly Lys Ser Phe Ser Gln Ser Ser His Leu1 5 10 15aat gtg cac aaa aga act cac69Asn Val His Lys Arg Thr His20<210>113<211>23<212>PRT<213>人<400>113Tyr Glu Cys Asp His Cys Gly Lys Ser Phe Ser Gln Ser Ser His Leu1 5 10 15Asn Val His Lys Arg Thr His20<210>114<211>69<212>DNA<213>人<220><221>CDS<222>(1)...(69)<400>114tac atg tgc agt gag tgt ggg cga ggc ttc agc cag aag tca aac ctc48Tyr Met Cys Ser Glu Cys Gly Arg Gly Phe Ser Gln Lys Ser Asn Leu1 5 10 15atc ata cac cag agg aca cac69Ile Ile His Gln Arg Thr His20<210>115<211>23<212>PRT<213>人<400>115Tyr Met Cys Ser Glu Cys Gly Arg Gly Phe Ser Gln Lys Ser Asn Leu1 5 10 15Ile Ile His Gln Arg Thr His20<210>116<211>69<212>DNA<213>人<220><221>CDS<222>(1)...(69)<400>116tat gaa tgt gaa aaa tgt ggc aaa gct ttt aac cag tcc tca aat ctt48Tyr Glu Cys Glu Lys Cys Gly Lys Ala Phe Asn Gln Ser Ser Asn Leu1 5 10 15act aga cat aag aaa agt cat69Thr Arg His Lys Lys Ser His20<210>117<211>23<212>PRT<213>人<400>117Tyr Glu Cys Glu Lys Cys Gly Lys Ala Phe Asn Gln Ser Ser Asn Leu1 5 10 15Thr Arg His Lys Lys Ser His20<210>118<211>69<212>DNA<213>人<220><221>CDS<222>(1)...(69)<400>118tat gag tgc aat gaa tgt ggg aag ttt ttt agc cag agc tcc agc ctc48Tyr Glu Cys Asn Glu Cys Gly Lys Phe Phe Ser Gln Ser Ser Ser Leu1 5 10 15att aga cat agg aga agt cac 69Ile Arg His Arg Arg Ser His20<210>119<211>23<212>PRT<213>人<400>119Tyr Glu Cys Asn Glu Cys Gly Lys Phe Phe Ser Gln Ser Ser Ser Leu1 5 10 15Ile Arg His Arg Arg Ser His20<210>120<211>69<212>DNA<213>人<220><221>CDS<222>(1)...(69)<400>120tat gag tgt cac gat tgc gga aag tcc ttt agg cag agc acc cac ctc48Tyr Glu Cys His Asp Cys Gly Lys Ser Phe Arg Gln Ser Thr His Leu1 5 10 15act cag cac cgg agg atc cac69Thr Gln His Arg Arg Ile His20<210>121<211>23<212>PRT<213>人<400>121Tyr Glu Cys His Asp Cys Gly Lys Ser Phe Arg Gln Ser Thr His Leu1 5 10 15Thr Gln His Arg Arg Ile His20<210>122<211>69<212>DNA<213>人<220><221>CDS<222>(1)...(69)<400>122tat gag tgt cac gat tgc gga aag tcc ttt agg cag agc acc cac ctc48Tyr Glu Cys His Asp Cys Gly Lys Ser Phe Arg Gln Ser Thr His Leu1 5 10 15act cgg cac cgg agg atc cac69Thr Arg His Arg Arg Ile His20<210>123<211>23<212>PRT<213>人<400>123Tyr Glu Cys His Asp Cys Gly Lys Ser Phe Arg Gln Ser Thr His Leu1 5 10 15Thr Arg His Arg Arg Ile His20<210>124<211>69<212>DNA<213>人<220><221>CDS<222>(1)...(69)<400>124cac aag tgc ctt gaa tgt ggg aaa tgc ttc agt cag aac acc cat ctg48His Lys Cys Leu Glu Cys Gly Lys Cys Phe Ser Gln Asn Thr His Leu15 10 15act cgc cac caa cgc acc cac69Thr Arg His Gln Arg Thr His20<210>125<211>23<212>PRT<213>人<400>125His Lys Cys Leu Glu Cys Gly Lys Cys Phe Ser Gln Asn Thr His Leu1 5 10 15Thr Arg His Gln Arg Thr His20<210>126<211>75<212>DNA<213>人<220><221>CDS<222>(1)...(75)<400>126tac cac tgt gac tgg gac ggc tgt gga tgg aaa ttc gcc cgc tca gat48Tyr His Cys Asp Trp Asp Gly Cys Gly Trp Lys Phe Ala Arg Ser Asp1 5 10 15gaa ctg acc agg cac tac cgt aaa cac75Glu Leu Thr Arg His Tyr Arg Lys His20 25<210>127<211>25<212>PRT<213>人<400>127Tyr His Cys Asp Trp Asp Gly Cys Gly Trp Lys Phe Ala Arg Ser Asp1 5 10 15Glu Leu Thr Arg His Tyr Arg Lys His20 25<210>128<211>75<212>DNA<213>人<220><221>CDS<222>(1)...(75)<400>128tac aga tgc tca tgg gaa ggg tgt gag tgg cgt ttt gca aga agt gat48Tyr Arg Cys Ser Trp Glu Gly Cys Glu Trp Arg Phe Ala Arg Ser Asp1 5 10 15gag tta acc agg cac ttc cga aag cac75Glu Leu Thr Arg His Phe Arg Lys His20 25<210>129<211>25<212>PRT<213>人<400>129Tyr Arg Cys Ser Trp Glu Gly Cys Glu Trp Arg Phe Ala Arg Ser Asp1 5 10 15Glu Leu Thr Arg His Phe Arg Lys His20 25<210>130<211>75<212>DNA<213>人<220><221>CDS<222>(1)...(75)<400>130ttc agc tgt agc tgg aaa ggt tgt gaa agg agg ttt gcc cgt tct gat48Phe Ser Cys Ser Trp Lys Gly Cys Glu Arg Arg Phe Ala Arg Ser Asp1 5 10 15gaa ctg tcc aga cac agg cga acc cac75Glu Leu Ser Arg His Arg Arg Thr His20 25<210>131<211>25<212>PRT<213>人<400>131Phe Ser Cys Ser Trp Lys Gly Cys Glu Arg Arg Phe Ala Arg Ser Asp1 5 10 15Glu Leu Ser Arg His Arg Arg Thr His20 25<210>132<211>75<212>DNA<213>人<220><221>CDS<222>(1)...(75)<400>132ttc gcc tgc agc tgg cag gac tgc aac aag aag ttc gcg cgc tcc gac48Phe Ala Cys Ser Trp Gln Asp Cys Asn Lys Lys Phe Ala Arg Ser Asp1 5 10 15gag ctg gcg cgg cac tac cgc aca cac75Glu Leu Ala Arg His Tyr Arg Thr His20 25<210>133<211>25<212>PRT<213>人<400>133Phe Ala Cys Ser Trp Gln Asp Cys Asn Lys Lys Phe Ala Arg Ser Asp1 5 10 15Glu Leu Ala Arg His Tyr Arg Thr His20 25<210>134<211>75<212>DNA<213>人<220><221>CDS<222>(1)...(75)<400>134tac cac tgc aac tgg gac ggc tgc ggc tgg aag ttt gcg cgc tca gac48Tyr His Cys Asn Trp Asp Gly Cys Gly Trp Lys Phe Ala Arg Ser Asp1 5 10 15gag ctc acg cgc cac tac cga aag cac75Glu Leu Thr Arg His Tyr Arg Lys His20 25<210>135<211>25<212>PRT<213>人<400>135Tyr His Cys Asn Trp Asp Gly Cys Gly Trp Lys Phe Ala Arg Ser Asp1 5 10 15Glu Leu Thr Arg His Tyr Arg Lys His20 25<210>136<211>72<212>DNA<213>人<220><221>CDS<222>(1)...(72)<400>136ttc ctc tgt cag tat tgt gca cag aga ttt ggg cga aag gat cac ctg48Phe Leu Cys Gln Tyr Cys Ala Gln Arg Phe Gly Arg Lys Asp His Leu1 5 10 15act cga cat atg aag aag agt cac72Thr Arg His Met Lys Lys Ser His20<210>137<211>24<212>PRT<213>人<400>137Phe Leu Cys Gln Tyr Cys Ala Gln Arg Phe Gly Arg Lys Asp His Leu1 5 10 15Thr Arg His Met Lys Lys Ser His20<210>138<211>78<212>DNA<213>人工序列<220><223>PCR引物<400>138tgtcgaatct gcatgcgtaa cttcagtcgt agtgaccacc ttaccaccca catccggacc60cacactggcc agaaaccc78<210>139<211>81<212>DNA<213>人工序列<220><223>PCR引物<400>139ggtggcggcc gttacttact tagagctcga cgtcttactt acttagcggc cgcactagta60gatctgaatt cattcaccgg t81<210>140<211>69<212>DNA<213>人<220><221>CDS<222>(1)...(69)<400>140ttc cag tgt aaa act tgt cag cga aag ttc tcc cgg tcc gac cac ctg48Phe Gln Cys Lys Thr Cys Gln Arg Lys Phe Ser Arg Ser Asp His Leu1 5 10 15aag acc cac acc agg act cat69Lys Thr His Thr Arg Thr His20<210>141<211>23<212>PRT<213>人<400>141Phe Gln Cys Lys Thr Cys Gln Arg Lys Phe Ser Arg Ser Asp His Leu1 5 10 15Lys Thr His Thr Arg Thr His20<210>142<211>69<212>DNA<213>人<220><221>CDS<222>(1)...(69)<400>142ttt gcc tgc gag gtc tgc ggt gtt cga ttc acc agg aac gac aag ctg48Phe Ala Cys Glu Val Cys Gly Val Arg Phe Thr Arg Asn Asp Lys Leu1 5 10 15aag atc cac atg cgg aag cac69Lys Ile His Met Arg Lys His20<210>143<211>23<212>PRT<213>人<400>143Phe Ala Cys Glu Val Cys Gly Val Arg Phe Thr Arg Asn Asp Lys Leu1 5 10 15Lys Ile His Met Arg Lys His20<210>144<211>75<212>DNA<213>人<220><221>CDS<222>(1)...(75)<400>144tat gta tgc gat gta gag gga tgt acg tgg aaa ttt gcc cgc tca gat48Tyr Val Cys Asp Val Glu Gly Cys Thr Trp Lys Phe Ala Arg Ser Asp1 5 10 15aag ctc aac aga cac aag aaa agg cac75Lys Leu Asn Arg His Lys Lys Arg His20 25<210>145<211>25<212>PRT<213>人<400>145Tyr Val Cys Asp Val Glu Gly Cys Thr Trp Lys Phe Ala Arg Ser Asp1 5 10 15Lys Leu Asn Arg His Lys Lys Arg His20 25<210>146<211>69<212>DNA<213>人<220><221>CDS<222>(1)...(69)<400>146tat att tgc aga aag tgt gga cgg ggc ttt agt cgg aag tcc aac ctt48Tyr Ile Cys Arg Lys Cys Gly Arg Gly Phe Ser Arg Lys Ser Asn Leu1 5 10 15atc aga cat cag agg aca cac69Ile Arg His Gln Arg Thr His20<210>147<211>23<212>PRT<213>人<400>147Tyr Ile Cys Arg Lys Cys Gly Arg Gly Phe Ser Arg Lys Ser Asn Leu1 5 10 15Ile Arg His Gln Arg Thr His20<210>148<211>69<212>DNA<213>人<220><221>CDS<222>(1)...(69)<400>148tat cta tgt agt gag tgt gac aaa tgc ttc agt aga agt aca aac ctc48Tyr Leu Cys Ser Glu Cys Asp Lys Cys Phe Ser Arg Ser Thr Asn Leu1 5 10 15ata agg cat cga aga act cac69Ile Arg His Arg Arg Thr His20<210>149<211>23<212>PRT<213>人<400>149Tyr Leu Cys Ser Glu Cys Asp Lys Cys Phe Ser Arg Ser Thr Asn Leu1 5 10 15Ile Arg His Arg Arg Thr His20<210>150<211>20<212>PRT<213>人工序列<220><223>純化的多肽<221>VARIANT<222>1,9<223>Xaa=Phe或Tyr<221>VARIANT<222>2,6-8,10,12,16<223>Xaa=任何氨基酸<221>VARIANT<222>4<223>Xaa=任何氨基酸;2-5個(gè)氨基酸長(zhǎng)<221>VARIANT<222>15<223>Xaa=疏水殘基<221>VARIANT<222>19<223>Xaa=任何氨基酸;3-5個(gè)氨基酸長(zhǎng)<400>150Xaa Xaa Cys Xaa Cys Xaa Xaa Xaa Xaa Xaa Gln Xaa Ala His Xaa Xaa1 5 10 15Arg His Xaa His20<210>151<211>20<212>PRT<213>人工序列<220><223>純化的多肽<221>VARIANT<222>1,9<223>Xaa=Phe或Tyr<221>VARIANT<222>2,6-8,10,12,16<223>Xaa=任何氨基酸<221>VARIANT<222>4<223>Xaa=任何氨基酸;2-5個(gè)氨基酸長(zhǎng)<221>VARIANT<222>15<223>Xaa=疏水殘基<221>VARIANT<222>19<223>Xaa=任何氨基酸;3-5個(gè)氨基酸長(zhǎng)<400>151Xaa Xaa Cys Xaa Cys Xaa Xaa Xaa Xaa Xaa Gln Xaa Phe Asn Xaa Xaa1 5 10 15Arg His Xaa His20<210>152<211>20<212>PRT<213>人工序列<220><223>純化的多肽<221>VARIANT<222>1,9<223>Xaa=Phe或Tyr<221>VARIANT<222>2,6-8,10,12,16<223>Xaa=任何氨基酸<221>VARIANT<222>4<223>Xaa=任何氨基酸;2-5個(gè)氨基酸長(zhǎng)<221>VARIANT<222>15<223>Xaa=疏水殘基<221>VARIANT<222>19<223>Xaa=任何氨基酸;3-5個(gè)氨基酸長(zhǎng)<400>152Xaa Xaa Cys Xaa Cys Xaa Xaa Xaa Xaa Xaa Gln Xaa Ser His Xaa Xaa1 5 10 15Thr His Xaa His20<210>153<211>20<212>PRT<213>人工序列<220><223>純化的多肽<221>VARIANT<222>1,9<223>Xaa=Phe或Tyr<221>VARIANT<222>2,6-8,10,12,16<223>Xaa=任何氨基酸<221>VARIANT<222>4<223>Xaa=任何氨基酸;2-5個(gè)氨基酸長(zhǎng)<221>VARIANT<222>15<223>Xaa=疏水殘基<221>VARIANT<222>19<223>Xaa=任何氨基酸;3-5個(gè)氨基酸長(zhǎng)<400>153Xaa Xaa Cys Xaa Cys Xaa Xaa Xaa Xaa Xaa Gln Xaa Ser His Xaa Xaa1 5 10 15Val His Xaa His20<210>154<211>20<212>PRT<213>人工序列<220><223>純化的多肽<221>VARIANT<222>1,9<223>Xaa=Phe或Tyr<221>VARIANT<222>2,6-8,10,12,16<223>Xaa=任何氨基酸<221>VARIANT<222>4<223>Xaa=任何氨基酸;2-5個(gè)氨基酸長(zhǎng)<221>VARIANT<222>15<223>Xaa=疏水殘基<221>VARIANT<222>19<223>Xaa=任何氨基酸;3-5個(gè)氨基酸長(zhǎng)<400>154Xaa Xaa Cys Xaa Cys Xaa Xaa Xaa Xaa Xaa Gln Xaa Ser Asn Xaa Xaa1 5 10 15Ile His Xaa His
20<210>155<211>20<212>PRT<213>人工序列<220><223>純化的多肽<221>VARIANT<222>1,9<223>Xaa=Phe或Tyr<221>VARIANT<222>2,6-8,10,12,16<223>Xaa=任何氨基酸<221>VARIANT<222>4<223>Xaa=任何氨基酸;2-5個(gè)氨基酸長(zhǎng)<221>CONFLICT<222>15<223>Xaa=疏水殘基<221>VARIANT<222>19<223>Xaa=任何氨基酸;3-5個(gè)氨基酸長(zhǎng)<400>155Xaa Xaa Cys Xaa Cys Xaa Xaa Xaa Xaa Xaa Gln Xaa Ser Asn Xaa Xaa1 5 10 15Arg His Xaa His20<210>156<211>20<212>PRT<213>人工序列<220><223>純化的多肽<221>VARIANT<222>1,9<223>Xaa=Phe或Tyr<221>VARIANT<222>2,6-8,10,12,16<223>Xaa=任何氨基酸<221>VARIANT<222>4<223>Xaa=任何氨基酸;2-5個(gè)氨基酸長(zhǎng)<221>VARIANT<222>15<223>Xaa=疏水殘基<221>VARIANT<222>19<223>Xaa=任何氨基酸;3-5個(gè)氨基酸長(zhǎng)<400>156Xaa Xaa Cys Xaa Cys Xaa Xaa Xaa Xaa Xaa Gln Xaa Thr His Xaa Xaa1 5 10 15Gln His Xaa His20<210>157<211>18<212>PRT<213>人工序列<220><223>純化的多肽<221>VARIANT<222>2<223>Xaa=任何氨基酸;2-5個(gè)氨基酸長(zhǎng)<221>VARIANT<222>4-6,8,10,14<223>Xaa=任何氨基酸<221>VARIANT<222>7<223>Xaa=Phe或Tyr<221>VARIANT<222>13<223>Xaa=疏水殘基<221>VARIANT<222>17<223>Xaa=任何氨基酸;3-5個(gè)氨基酸長(zhǎng)<400>157Cys Xaa Cys Xaa Xaa Xaa Xaa Xaa Gln Xaa Thr His Xaa Xaa Arg His1 5 10 15Xaa His<210>158<211>20<212>PRT<213>人工序列<220><223>純化的多肽<221>VARIANT<222>1,9<223>Xaa=Phe或Tyr<221>VARIANT<222>2,6-8,10,12,16<223>Xaa=任何氨基酸<221>VARIANT<222>4<223>Xaa=任何氨基酸;2-5個(gè)氨基酸長(zhǎng)<221>VARIANT<222>15<223>Xaa=疏水殘基<221>VARIANT<222>19<223>Xaa=任何氨基酸;3-5個(gè)氨基酸長(zhǎng)<400>158Xaa Xaa Cys Xaa Cys Xaa Xaa Xaa Xaa Xaa Arg Xaa Asp Lys Xaa Xaa1 5 10 15Ile His Xaa His20<210>159<211>20<212>PRT<213>人工序列<220><223>純化的多肽<221>VARIANT<222>1,9<223>Xaa=Phe或Tyr<221>VARIANT<222>2,6-8,10,12,16<223>Xaa=任何氨基酸<221>VARIANT<222>4<223>Xaa=任何氨基酸;2-5個(gè)氨基酸長(zhǎng)<221>VARIANT<222>15<223>Xaa=疏水殘基<221>VARIANT<222>19<223>Xaa=任何氨基酸;3-5個(gè)氨基酸長(zhǎng)<400>159Xaa Xaa Cys Xaa Cys Xaa Xaa Xaa Xaa Xaa Arg Xaa Ser Asn Xaa Xaa1 5 10 15Arg His Xaa His20<210>160<211>20<212>PRT<213>人工序列<220><223>純化的多肽<221>VARIANT<222>1,9<223>Xaa=Phe或Tyr<221>VARIANT<222>2,6-8,10,12,16<223>Xaa=任何氨基酸<221>VARIANT<222>4<223>Xaa=任何氨基酸;2-5個(gè)氨基酸長(zhǎng)<221>VARIANT<222>15<223>Xaa=疏水殘基<221>VARIANT<222>19<223>Xaa=任何氨基酸;3-5個(gè)氨基酸長(zhǎng)<400>160Xaa Xaa Cys Xaa Cys Xaa Xaa Xaa Xaa Xaa Thr Xaa Gly Asn Xaa Xaa1 5 10 15Arg His Xaa His20<210>161<211>20<212>PRT<213>人工序列<220><223>純化的多肽<221>VARIANT<222>1,9<223>Xaa=Phe或Tyr<221>VARIANT<222>2,6-8,10,12,16<223>Xaa=任何氨基酸<221>VARIANT<222>4<223>Xaa=任何氨基酸;2-5個(gè)氨基酸長(zhǎng)<221>VARIANT<222>15<223>Xaa=疏水殘基<221>VARIANT<222>19<223>Xaa=任何氨基酸;3-5個(gè)氨基酸長(zhǎng)<400>161Xaa Xaa Cys Xaa Cys Xaa Xaa Xaa Xaa Xaa Gln Xaa Gly Asn Xaa Xaa1 5 10 15Arg His Xaa His20<211>20<213>人工序列<220><223>純化的多肽<221>VARIANT<222>1,9<223>Xaa=Phe或Tyr<221>VARIANT<222>2,6-8,10,12,16<223>Xaa=任何氨基酸<221>VARIANT<223>Xaa=任何氨基酸;2-5個(gè)氨基酸長(zhǎng)<221>VARIANT<222>15<223>Xaa=疏水殘基<221>VARIANT<222>19<223>Xaa=任何氨基酸;3-5個(gè)氨基酸長(zhǎng)<400>162Xaa Xaa Cys Xaa Cys Xaa Xaa Xaa Xaa Xaa Arg Xaa Asp Glu Xaa Xaa1 5 10 15Arg His Xaa His20<210>163<211>20<212>PRT<213>人工序列<220><223>純化的多肽<221>VARIANT<222>1,9<223>Xaa=Phe或Tyr<221>VARIANT<222>2,6-8,10,12,16<223>Xaa=任何氨基酸<221>VARIANT<222>4<223>Xaa=任何氨基酸;2-5個(gè)氨基酸長(zhǎng)<221>VARIANT<222>15<223>Xaa=疏水殘基<221>VARIANT<222>19<223>Xaa=任何氨基酸;3-5個(gè)氨基酸長(zhǎng)<400>163Xaa Xaa Cys Xaa Cys Xaa Xaa Xaa Xaa Xaa Arg Xaa Asp His Xaa Xaa1 5 10 15Arg His Xaa His20<210>164<211>20<212>PRT<213>人工序列<220><223>純化的多肽<221>VARIANT<222>1,9<223>Xaa=Phe或Tyr<221>VARIANT<222>2,6-8,10,12,16<223>Xaa=任何氨基酸<221>VARIANT<222>4<223>Xaa=任何氨基酸;2-5個(gè)氨基酸長(zhǎng)<221>VARIANT<222>15<223>Xaa=疏水殘基<221>VARIANT<222>19<223>Xaa=任何氨基酸;3-5個(gè)氨基酸長(zhǎng)<400>164Xaa Xaa Cys Xaa Cys Xaa Xaa Xaa Xaa Xaa Arg Xaa Asp His Xaa Xaa1 5 10 15Thr His Xaa His20<210>165<211>20<212>PRT<213>人工序列<220><223>純化的多肽<221>VARIANT<222>1,9<223>Xaa=Phe或Tyr<221>VARIANT<222>2,6-8,10,12,16<223>Xaa=任何氨基酸<221>VARIANT<222>4<223>Xaa=任何氨基酸; 2-5個(gè)氨基酸長(zhǎng)<221>VARIANT<222>15<223>Xaa=疏水殘基<221>VARIANT<222>19<223>Xaa=任何氨基酸; 3-5個(gè)氨基酸長(zhǎng)<400>165Xaa Xaa Cys Xaa Cys Xaa Xaa Xaa Xaa Xaa Arg Xaa Asp Lys Xaa Xaa1 5 10 15Arg His Xaa His20<210>166<211>20<212>PRT<213>人工序列<220><223>純化的多肽<221>VARIANT<222>1,9<223>Xaa=Phe或Tyr<221>VARIANT<222>2,6-8,10,12,16<223>Xaa=任何氨基酸<221>VARIANT<222>4<223>Xaa=任何氨基酸;2-5個(gè)氨基酸長(zhǎng)<221>VARIANT<222>15<223>Xaa=疏水殘基<221>VARIANT<222>19<223>Xaa=任何氨基酸; 3-5個(gè)氨基酸長(zhǎng)<400>166Xaa Xaa Cys Xaa Cys Xaa Xaa Xaa Xaa Xaa Arg Xaa Ser His Xaa Xaa1 5 10 15Arg His Xaa His20<210>167<211>20<212>PRT<213>人工序列<220><223>純化的多肽<221>VARIANT<222>1,9<223>Xaa=Phe或Tyr<221>VARIANT<222>2,6-8,10,12,16<223>Xaa=任何氨基酸<221>VARIANT<222>4<223>Xaa=任何氨基酸; 2-5個(gè)氨基酸長(zhǎng)<221>VARIANT<222>15<223>Xaa=疏水殘基<221>VARIANT<222>19<223>Xaa=任何氨基酸; 3-5個(gè)氨基酸長(zhǎng)<400>167Xaa Xaa Cys Xaa Cys Xaa Xaa Xaa Xaa Xaa Arg Xaa Thr Asn Xaa Xaa1 5 10 15Arg His Xaa His20
權(quán)利要求
1.一種鑒定識(shí)別DNA上靶位點(diǎn)的鋅指結(jié)構(gòu)域的方法,該方法包括(a)提供包含報(bào)道構(gòu)建體的細(xì)胞,所述構(gòu)建體包含與啟動(dòng)子可操作連接的報(bào)道基因,其中當(dāng)轉(zhuǎn)錄因子識(shí)別啟動(dòng)子的募集位點(diǎn)和靶位點(diǎn)兩者時(shí)報(bào)道基因表達(dá)高于給定水平,但是當(dāng)轉(zhuǎn)錄因子只識(shí)別啟動(dòng)子的募集位點(diǎn)時(shí)則不這樣;(b)提供多個(gè)雜合核酸,其中每一個(gè)編碼包含(i)轉(zhuǎn)錄激活結(jié)構(gòu)域,(ii)識(shí)別募集位點(diǎn)的DNA結(jié)合結(jié)構(gòu)域,和(iii)試驗(yàn)鋅指結(jié)構(gòu)域的非天然存在的蛋白質(zhì),其中編碼的試驗(yàn)鋅指結(jié)構(gòu)域的氨基酸序列在所述多個(gè)雜合核酸的成員間各不相同;(c)在使得所述多個(gè)雜合核酸中的至少一個(gè)進(jìn)入至少一個(gè)細(xì)胞的條件下使所述多個(gè)雜合核酸接觸所述細(xì)胞;(d)在使雜合核酸在所述細(xì)胞中表達(dá)的條件下保持所述細(xì)胞;和(e)鑒定含有(b)的雜合核酸并且報(bào)道基因表達(dá)高于給定水平的細(xì)胞,報(bào)道基因表達(dá)高于給定水平是細(xì)胞包含編碼識(shí)別靶位點(diǎn)的試驗(yàn)鋅指結(jié)構(gòu)域的雜合核酸的指征。
2.權(quán)利要求1的方法,其中所述細(xì)胞是真核細(xì)胞。
3.權(quán)利要求2的方法,其中所述細(xì)胞是酵母細(xì)胞。
4.權(quán)利要求3的方法,其中所述細(xì)胞是啤酒酵母細(xì)胞。
5.權(quán)利要求1的方法,其中所述報(bào)道基因是可選擇標(biāo)記。
6.權(quán)利要求5的方法,其中所述可選擇標(biāo)記選自URA3,HIS3,LEU2,ADE2,和TRP1。
7.權(quán)利要求1的方法,其中所述報(bào)道基因選自lacZ,CAT,螢光素酶,GUS,和GFP。
8.權(quán)利要求1的方法,其中所述DNA結(jié)合結(jié)構(gòu)域包含鋅指結(jié)構(gòu)域。
9.權(quán)利要求8的方法,其中所述DNA結(jié)合結(jié)構(gòu)域包含兩個(gè)鋅指結(jié)構(gòu)域。
10.權(quán)利要求9的方法,其中所述DNA結(jié)合結(jié)構(gòu)域包含三個(gè)鋅指結(jié)構(gòu)域。
11.權(quán)利要求1的方法,進(jìn)一步包括步驟(i)使用與編碼保守結(jié)構(gòu)域邊界的序列退火的寡核苷酸引物,從基因組核酸,信使RNA(mRNA)混合物,或者互補(bǔ)DNA(cDNA)混合物擴(kuò)增編碼試驗(yàn)鋅指結(jié)構(gòu)域的源核酸,產(chǎn)生擴(kuò)增的片段;和(ii)使用擴(kuò)增的片段構(gòu)建用于包含在步驟(b)中的多個(gè)雜合核酸中的雜合核酸。
12.權(quán)利要求1的方法,進(jìn)一步包括步驟(i)在序列數(shù)據(jù)庫(kù)中鑒定候選鋅指結(jié)構(gòu)域氨基酸序列;(ii)提供編碼候選鋅指結(jié)構(gòu)域氨基酸序列的候選核酸,和(iii)使用候選核酸構(gòu)建用于包含在步驟(b)中的多個(gè)雜合核酸中的雜合核酸。
13.權(quán)利要求5的方法,其中可選擇標(biāo)記是代謝物的合成所需要的輔源營(yíng)養(yǎng)基因;細(xì)胞的基因組缺少所述輔源營(yíng)養(yǎng)基因的功能拷貝;而且,在步驟(d)期間,細(xì)胞維持在沒有代謝物制備的培養(yǎng)基中。
14.權(quán)利要求1的方法,其中重復(fù)步驟(a)-(e)來鑒定識(shí)別第二靶位點(diǎn)的第二試驗(yàn)鋅指結(jié)構(gòu)域。
15.權(quán)利要求14的方法,進(jìn)一步包括構(gòu)建編碼包含第一試驗(yàn)鋅指結(jié)構(gòu)域和第二試驗(yàn)鋅指結(jié)構(gòu)域的多肽的核酸。
16.一種鑒定識(shí)別DNA上靶位點(diǎn)的鋅指結(jié)構(gòu)域的方法,該方法包括(a)提供包含報(bào)道構(gòu)建體的細(xì)胞,所述構(gòu)建體包含與啟動(dòng)子可操作連接的報(bào)道基因,其中當(dāng)轉(zhuǎn)錄因子識(shí)別啟動(dòng)子的募集位點(diǎn)和靶位點(diǎn)兩者時(shí)報(bào)道基因表達(dá)高于給定水平,但是當(dāng)轉(zhuǎn)錄因子只識(shí)別啟動(dòng)子的募集位點(diǎn)時(shí)則不這樣;(b)使用與編碼保守結(jié)構(gòu)域邊界的核酸退火的寡核苷酸引物擴(kuò)增多個(gè)核酸序列,其中每一個(gè)核酸序列都編碼試驗(yàn)鋅指結(jié)構(gòu)域;(c)將(b)的每一個(gè)核酸序列與編碼(i)轉(zhuǎn)錄激活結(jié)構(gòu)域,和(ii)識(shí)別募集位點(diǎn)的DNA結(jié)合結(jié)構(gòu)域的核酸序列相連,生成多個(gè)雜合核酸;(d)在使得所述多個(gè)雜合核酸中的至少一個(gè)進(jìn)入至少一個(gè)細(xì)胞的條件下使(c)的所述多個(gè)雜合核酸接觸(a)的細(xì)胞;(e)在使雜合核酸在細(xì)胞中表達(dá)的條件下保持細(xì)胞;和(f)鑒定含有(c)的雜合核酸并且報(bào)道基因表達(dá)高于給定水平的細(xì)胞,其中雜合核酸編碼識(shí)別DNA上靶位點(diǎn)的鋅指結(jié)構(gòu)域。
17.權(quán)利要求16的方法,其中所述細(xì)胞是酵母細(xì)胞。
18.權(quán)利要求16的方法,其中所述報(bào)道基因選自lacZ,CAT,螢光素酶,GUS,和GFP。
19.權(quán)利要求16的方法,其中所述DNA結(jié)合結(jié)構(gòu)域包含鋅指結(jié)構(gòu)域。
20.權(quán)利要求19的方法,其中所述DNA結(jié)合結(jié)構(gòu)域包含兩個(gè)鋅指結(jié)構(gòu)域。
21.一種測(cè)定試驗(yàn)鋅指結(jié)構(gòu)域是否識(shí)別DNA上靶位點(diǎn)的方法,該方法包括(a)提供包含與啟動(dòng)子可操作連接的報(bào)道基因的報(bào)道構(gòu)建體,其中當(dāng)轉(zhuǎn)錄因子識(shí)別啟動(dòng)子的募集位點(diǎn)和靶位點(diǎn)兩者時(shí)報(bào)道基因表達(dá)高于給定水平,但是當(dāng)轉(zhuǎn)錄因子只識(shí)別啟動(dòng)子的募集位點(diǎn)時(shí)則不這樣;(b)提供編碼包含(i)轉(zhuǎn)錄激活結(jié)構(gòu)域,(ii)識(shí)別募集位點(diǎn)的DNA結(jié)合結(jié)構(gòu)域,和(iii)試驗(yàn)鋅指結(jié)構(gòu)域的非天然存在的蛋白質(zhì)的雜合核酸;(c)在使得報(bào)道構(gòu)建體進(jìn)入細(xì)胞的條件下使報(bào)道構(gòu)建體接觸細(xì)胞;(d)在步驟(c)之前,之后或同時(shí),在使雜合核酸進(jìn)入該細(xì)胞的條件下使雜合核酸接觸該細(xì)胞;(e)在使雜合核酸在細(xì)胞中表達(dá)的條件下保持細(xì)胞;和(f)檢測(cè)細(xì)胞中的報(bào)道基因表達(dá),其中報(bào)道基因表達(dá)水平高于給定水平是試驗(yàn)鋅指結(jié)構(gòu)域識(shí)別靶位點(diǎn)的指征。
22.權(quán)利要求21的方法,進(jìn)一步包括步驟使用與編碼保守結(jié)構(gòu)域邊界的序列退火的寡核苷酸引物,從基因組DNA,mRNA混合物,或者cDNA混合物擴(kuò)增編碼試驗(yàn)鋅指結(jié)構(gòu)域的核酸。
23.權(quán)利要求21的方法,進(jìn)一步包括步驟(i)在序列數(shù)據(jù)庫(kù)中鑒定候選鋅指結(jié)構(gòu)域氨基酸序列;(ii)提供編碼候選鋅指結(jié)構(gòu)域氨基酸序列的候選核酸,和(iii)使用候選核酸構(gòu)建用于包含在步驟(b)中的多個(gè)雜合核酸中的雜合核酸。
24.一種測(cè)定試驗(yàn)鋅指結(jié)構(gòu)域是否識(shí)別啟動(dòng)子上靶位點(diǎn)的方法,該方法包括(a)提供含有包含與啟動(dòng)子可操作連接的報(bào)道基因的報(bào)道構(gòu)建體的第一細(xì)胞,其中當(dāng)轉(zhuǎn)錄因子識(shí)別啟動(dòng)子的募集位點(diǎn)和靶位點(diǎn)兩者時(shí)報(bào)道基因表達(dá)高于給定水平,但是當(dāng)轉(zhuǎn)錄因子只識(shí)別啟動(dòng)子的募集位點(diǎn)時(shí)則不這樣;(b)提供包含編碼含(i)轉(zhuǎn)錄激活結(jié)構(gòu)域,(ii)識(shí)別募集結(jié)合位點(diǎn)的DNA結(jié)合結(jié)構(gòu)域,和(iii)試驗(yàn)鋅指結(jié)構(gòu)域的蛋白質(zhì)的雜合核酸的第二細(xì)胞;(c)融合第一和第二細(xì)胞,生成融合細(xì)胞;(d)在使雜合核酸在細(xì)胞中表達(dá)的條件下保持融合細(xì)胞;和(e)檢測(cè)融合細(xì)胞中的報(bào)道基因表達(dá),其中報(bào)道基因表達(dá)水平高于給定水平是試驗(yàn)鋅指結(jié)構(gòu)域識(shí)別靶位點(diǎn)的指征。
25.權(quán)利要求24的方法,其中所述第一和第二細(xì)胞是相反接合型的酵母細(xì)胞。
26.一種測(cè)定試驗(yàn)鋅指結(jié)構(gòu)域是否識(shí)別啟動(dòng)子上靶位點(diǎn)的方法,該方法包括(a)提供多個(gè)報(bào)道構(gòu)建體,各構(gòu)建體包含與啟動(dòng)子可操作連接的報(bào)道基因,其中當(dāng)轉(zhuǎn)錄因子識(shí)別啟動(dòng)子的募集位點(diǎn)和靶位點(diǎn)兩者時(shí)報(bào)道基因表達(dá)高于給定水平,但是當(dāng)轉(zhuǎn)錄因子只識(shí)別啟動(dòng)子的募集位點(diǎn)時(shí)則不這樣;(b)提供含有編碼包含(i)轉(zhuǎn)錄激活結(jié)構(gòu)域,(ii)識(shí)別募集位點(diǎn)的DNA結(jié)合結(jié)構(gòu)域,和(iii)試驗(yàn)鋅指結(jié)構(gòu)域的非天然存在的蛋白質(zhì)的雜合核酸的細(xì)胞;(c)在使得所述多個(gè)報(bào)道構(gòu)建體中的至少一個(gè)進(jìn)入細(xì)胞的條件下使所述多個(gè)報(bào)道構(gòu)建體接觸細(xì)胞;(d)在使雜合核酸在細(xì)胞中表達(dá)的條件下保持細(xì)胞;和(e)鑒定含有(a)的報(bào)道基因并且報(bào)道基因表達(dá)高于給定水平的細(xì)胞,報(bào)道基因表達(dá)高于給定水平是細(xì)胞中的報(bào)道構(gòu)建體包含試驗(yàn)鋅指結(jié)構(gòu)域識(shí)別的靶位點(diǎn)的指征。
27.權(quán)利要求26的方法,其中所述靶結(jié)合位點(diǎn)長(zhǎng)2-6個(gè)核苷酸。
28.權(quán)利要求27的方法,其中所述多個(gè)報(bào)道構(gòu)建體在靶結(jié)合位點(diǎn)的至少兩個(gè)位置包含A,T,G,和C核苷酸的所有可能的組合。
29.權(quán)利要求28的方法,其中所述多種報(bào)道構(gòu)建體在靶結(jié)合位點(diǎn)的至少三個(gè)位置包含A,T,G,和C核苷酸的所有可能的組合。
30.權(quán)利要求26的方法,其中對(duì)于第二試驗(yàn)鋅指結(jié)構(gòu)域重復(fù)步驟(a)-(e)來鑒定第二結(jié)合偏好。
31.權(quán)利要求30的方法,進(jìn)一步包括構(gòu)建編碼包含第一第二試驗(yàn)鋅指結(jié)構(gòu)域的多肽的核酸。
32.一種鑒定多個(gè)鋅指結(jié)構(gòu)域的方法,該方法包括進(jìn)行權(quán)利要求1的方法來鑒定第一試驗(yàn)鋅指結(jié)構(gòu)域;和再次進(jìn)行權(quán)利要求1的方法來鑒定識(shí)別不同于第一試驗(yàn)鋅指結(jié)構(gòu)域識(shí)別的靶位點(diǎn)的靶位點(diǎn)的第二試驗(yàn)鋅指結(jié)構(gòu)域。
33.一種產(chǎn)生編碼嵌合鋅指蛋白的核酸的方法,該方法包括進(jìn)行權(quán)利要求32的方法;構(gòu)建編碼包含第一和第二試驗(yàn)鋅指結(jié)構(gòu)域的多肽的核酸。
34.一種鑒定鋅指結(jié)構(gòu)域識(shí)別的DNA序列的方法,該方法包括進(jìn)行權(quán)利要求24的方法來鑒定第一試驗(yàn)鋅指結(jié)構(gòu)域識(shí)別的第一靶位點(diǎn);和再次進(jìn)行權(quán)利要求24的方法來鑒定第二試驗(yàn)鋅指結(jié)構(gòu)域識(shí)別的第二靶位點(diǎn)。
35.一種產(chǎn)生編碼嵌合鋅指蛋白的核酸的方法,該方法包括進(jìn)行權(quán)利要求34的方法;構(gòu)建編碼包含第一和第二試驗(yàn)鋅指結(jié)構(gòu)域的多肽的核酸。
36.一種包含下面氨基酸序列的純化的多肽Xa-X-Cys-X2-5-Cys-X3-Xa-X-Cys-X-Ser-Asn-Xb-X-Arg-His-X3-5-His(SEQ ID NO68),其中Xa是苯丙氨酸或酪氨酸,并且Xb是疏水性殘基。
37.包含編碼權(quán)利要求36的多肽的序列的核酸。
38.一種包含下面氨基酸序列的純化的多肽Xa-X-Cys-X2-5-Cys-X3-Xa-X-His-X-Ser-Asn-Xb-X-Lys-His-X3-5-His(SEQ ID NO69),其中Xa是苯丙氨酸或酪氨酸,并且Xb是疏水性殘基。
39.包含編碼權(quán)利要求38的多肽的序列的核酸。
40.一種包含下面氨基酸序列的純化的多肽Xa-X-Cys-X2-5-Cys-X3-Xa-X-Ser-X-Ser-Asn-Xb-X-Arg-His-X3-5-His(SEQ ID NO70),其中Xa是苯丙氨酸或酪氨酸,并且Xb是疏水性殘基。
41.包含編碼權(quán)利要求40的多肽的序列的核酸。
42.一種包含下面氨基酸序列的純化的多肽Xa-X-Cys-X2-5-Cys-X3-Xa-X-Gln-X-Ser-Thr-Xb-X-Val-His-X3-5-His(SEQ ID NO71),其中Xa是苯丙氨酸或酪氨酸,并且Xb是疏水性殘基。
43.包含編碼權(quán)利要求42的多肽的序列的核酸。
44.一種包含下面氨基酸序列的純化的多肽Xa-X-Cys-X2-5-Cys-X3-Xa-X-Val-X-Ser-Xc-Xb-X-Arg-His-X3-5-His(SEQ IDNO72),其中Xa是苯丙氨酸或酪氨酸,Xb是疏水性殘基,并且Xc是絲氨酸或蘇氨酸。
45.包含編碼權(quán)利要求44的多肽的序列的核酸。
46.一種包含下面氨基酸序列的純化的多肽Xa-X-Cys-X2-5-Cys-X3-Xa-X-Gln-X-Ser-His-Xb-X-Arg-His-X3-5-His(SEQ ID NO73),其中Xa是苯丙氨酸或酪氨酸,并且Xb是疏水性殘基。
47.包含編碼權(quán)利要求46的多肽的序列的核酸。
48.一種包含下面氨基酸序列的純化的多肽Xa-X-Cys-X2-5-Cys-X3-Xa-X-Gln-X-Ser-Asn-Xb-X-Val-His-X3-5-His(SEQ ID NO74),其中Xa是苯丙氨酸或酪氨酸,并且Xb是疏水性殘基。
49.包含編碼權(quán)利要求48的多肽的序列的核酸。
50.一種包含下面氨基酸序列的純化的多肽Xa-X-Cys-X2-5-Cys-X3-Xa-X-Gln-X-Ser-Xc-Xb-X-Arg-His-X3-5-His(SEQ ID NO75),其中Xa是苯丙氨酸或酪氨酸,Xb是疏水性殘基,并且Xc是絲氨酸或蘇氨酸。
51.包含編碼權(quán)利要求50的多肽的序列的核酸。
52.包含與SEQ ID NO65 60%相同的氨基酸序列的純化的多肽。
53.包含編碼權(quán)利要求52的多肽的序列的核酸。
54.一種純化的多肽,包含與選自SEQ ID NO29,127,129,131,133,和135的氨基酸序列60%相同的氨基酸序列。
55.一種核酸,包含編碼權(quán)利要求54的多肽的序列。
56.一種包含下面氨基酸序列的純化的多肽Xa-X-Cys-X2-5-Cys-X3-Xa-X-Gln-X-Ala-His-Xb-X-Arg-His-X3-5-His(SEQ ID NO150),其中Xa是苯丙氨酸或酪氨酸,并且Xb是疏水性殘基。
57.包含編碼權(quán)利要求56的多肽的序列的核酸。
58.一種包含下面氨基酸序列的純化的多肽Xa-X-Cys-X2-5-Cys-X3-Xa-X-Gln-X-Phe-Asn-Xb-X-Arg-His-X3-5-His(SEQ ID NO151),其中Xa是苯丙氨酸或酪氨酸,并且Xb是疏水性殘基。
59.包含編碼權(quán)利要求58的多肽的序列的核酸。
60.一種包含下面氨基酸序列的純化的多肽Xa-X-Cys-X2-5-Cys-X3-Xa-X-Gln-X-Ser-His-Xb-X-Thr-His-X3-5-His(SEQ ID NO152),其中Xa是苯丙氨酸或酪氨酸,并且Xb是疏水性殘基。
61.包含編碼權(quán)利要求60的多肽的序列的核酸。
62.一種包含下面氨基酸序列的純化的多肽Xa-X-Cys-X2-5-Cys-X3-Xa-X-Gln-X-Ser-His-Xb-X-Val-His-X3-5-His(SEQ ID NO153),其中Xa是苯丙氨酸或酪氨酸,并且Xb是疏水性殘基。
63.包含編碼權(quán)利要求62的多肽的序列的核酸。
64.一種包含下面氨基酸序列的純化的多肽Xa-X-Cys-X2-5-Cys-X3-Xa-X-Gln-X-Ser-Asn-Xb-X-Ile-His-X3-5-His(SEQ ID NO154),其中Xa是苯丙氨酸或酪氨酸,并且Xb是疏水性殘基。
65.包含編碼權(quán)利要求64的多肽的序列的核酸。
66.一種包含下面氨基酸序列的純化的多肽Xa-X-Cys-X2-5-Cys-X3-Xa-X-Gln-X-Ser-Asn-Xb-X-Arg-His-X3-5-His(SEQ ID NO155),其中Xa是苯丙氨酸或酪氨酸,并且Xb是疏水性殘基。
67.包含編碼權(quán)利要求66的多肽的序列的核酸。
68.一種包含下面氨基酸序列的純化的多肽Xa-X-Cys-X2-5-Cys-X3-Xa-X-Gln-X-Thr-His-Xb-X-Gln-His-X3-5-His(SEQ ID NO156),其中Xa是苯丙氨酸或酪氨酸,并且Xb是疏水性殘基。
69.包含編碼權(quán)利要求68的多肽的序列的核酸。
70.一種包含下面氨基酸序列的純化的多肽Cys-X2-5-Cys-X3-Xa-X-Gln-X-Thr-His-Xb-X-Arg-His-X3-5-His(SEQ ID NO157),其中Xa是苯丙氨酸或酪氨酸,并且Xb是疏水性殘基。
71.包含編碼權(quán)利要求70的多肽的序列的核酸。
72.一種包含下面氨基酸序列的純化的多肽Xa-X-Cys-X2-5-Cys-X3-Xa-X-Arg-X-Asp-Lys-Xb-X-Ile-His-X3-5-His(SEQ ID NO158),其中Xa是苯丙氨酸或酪氨酸,并且Xb是疏水性殘基。
73.包含編碼權(quán)利要求72的多肽的序列的核酸。
74.一種包含下面氨基酸序列的純化的多肽Xa-X-Cys-X2-5-Cys-X3-Xa-X-Arg-X-Ser-Asn-Xb-X-Arg-His-X3-5-His(SEQ ID NO159),其中Xa是苯丙氨酸或酪氨酸,并且Xb是疏水性殘基。
75.包含編碼權(quán)利要求74的多肽的序列的核酸。
76.包含與SEQ ID NO107 60%相同的氨基酸序列的純化的多肽。
77.包含編碼權(quán)利要求76的多肽的序列的核酸。
78.包含與SEQ ID NO137 60%相同的氨基酸序列的純化的多肽。
79.包含編碼權(quán)利要求78的多肽的序列的核酸。
80.包含與SEQ ID NO145 60%相同的氨基酸序列的純化的多肽。
81.包含編碼權(quán)利要求80的多肽的序列的核酸。
82.包含與SEQ ID NO149 60%相同的氨基酸序列的純化的多肽。
83.包含編碼權(quán)利要求82的多肽的序列的核酸。
84.包含與SEQ ID NO141 60%相同的氨基酸序列的純化的多肽。
85.包含編碼權(quán)利要求84的多肽的序列的核酸。
全文摘要
本發(fā)明公開了鑒定識(shí)別任何給定靶位點(diǎn)的鋅指結(jié)構(gòu)域的體內(nèi)篩選方法。也公開了識(shí)別特定位點(diǎn)的鋅指結(jié)構(gòu)域的氨基酸序列。
文檔編號(hào)C07K14/47GK1416467SQ01806252
公開日2003年5月7日 申請(qǐng)日期2001年2月17日 優(yōu)先權(quán)日2000年2月18日
發(fā)明者金晉秀, 權(quán)寧道, 金炫元, 柳銀鉉, 黃文宣 申請(qǐng)人:圖爾金株式會(huì)社