專利名稱:用雙鏈rna抑制鑒定基因功能的制作方法
技術(shù)領(lǐng)域:
本發(fā)明為分案申請,原申請的申請?zhí)枮?00510052742.X,申請日為1999年7月2日,發(fā)明名稱為“用雙鏈RNA抑制鑒定基因功能”。
本發(fā)明涉及采用雙鏈RNA抑制(dsRNAi)來特征鑒定或鑒定基因的功能,涉及鑒定負責(zé)在細胞中誘導(dǎo)特定表型的DNA的方法以及將功能確定到已知基因序列的方法。
最近,在Nature第391卷,第806-811頁(1998年2月)中已經(jīng)描述了將雙鏈RNA引入到細胞中,導(dǎo)致有效且特異性地干擾細胞中內(nèi)源基因的表達,并且這種干擾比在反義技術(shù)中提出的單獨提供任一RNA鏈要有效得多。也發(fā)現(xiàn)當(dāng)將所述RNA引入到線蟲Caenorhabditis elegans(C.celegans)蠕蟲基因組或體腔中時,在這種蠕蟲中存在該基因活性的這種特異性降低。
本發(fā)明人已經(jīng)利用了這種技術(shù),并應(yīng)用其進一步設(shè)計新的發(fā)明方法,以將功能確定至已經(jīng)在各種計劃諸如人類基因組計劃中測序、并且還給予了一種特定功能的基因或DNA片段上,并且將其用于鑒定負責(zé)賦予特定表型的DNA。
因此,按照本發(fā)明的第一個方面,提供一種鑒定負責(zé)在細胞中賦予表型的DNA的方法,所述方法包括a)以相應(yīng)于啟動子的方向,構(gòu)建所述細胞DNA的cNDA文庫或基因組文庫,使得在合適的轉(zhuǎn)錄因子結(jié)合于所述啟動子時能夠促進從所述cDNA或DNA轉(zhuǎn)錄出雙鏈(ds)RNA,b)將所述文庫引入到包含所述轉(zhuǎn)錄因子的一種或多種所述細胞中,且c)鑒定并分離包含所述文庫的所需表型的所述細胞,并鑒定所述文庫中負責(zé)賦予所述表型的DNA或cDNA片段。
在本發(fā)明的一個優(yōu)選實施方案中,在步驟b)之前,可以將所述文庫組成為如在所提供的實施例中更詳細描述的等級庫,以致包括例如基因家族。
按照本發(fā)明的再一方面,也提供一種將功能確定到已知DNA序列的方法,所述方法包括a)鑒定細胞中所述DNA的同源物,b)從所述細胞中分離出相關(guān)的DNA同源物或其片段,c)以相應(yīng)于合適的轉(zhuǎn)錄因子結(jié)合于啟動子時能夠促進dsRNA轉(zhuǎn)錄的啟動子的方向,將所述同源物或片段克隆到合適的載體中,d)將所述載體引入到得自步驟a)的包含所述轉(zhuǎn)錄因子的所述細胞中,以及e)鑒定與野生型相比所述細胞的表型。
在本發(fā)明的每一方面,均可以以相應(yīng)于具有以上所定義特性的單個啟動子的有義和反義方向提供所述核苷酸序列或DNA序列,或者可選擇地,可以在兩個相同啟動子之間提供所述核苷酸序列或DNA序列。在這兩個實施方案中,在啟動子結(jié)合其合適的轉(zhuǎn)錄因子后,由所述啟動子啟動的轉(zhuǎn)錄提供dsRNA。
按照本發(fā)明的細胞可以得自一種生物或包含于一種生物中。在所述細胞包含于一種生物中的場合下,可以改變所述生物以表達合適的轉(zhuǎn)錄因子。所述生物可以為植物、動物、真菌或酵母中的任何一種,但最好可以是線蟲蠕蟲C.elegans,它可以是C.elegans野生型、nuc-1或pha-ts突變體中的任何一種或所述突變的組合。在一個替代實施方案中,可以便利地將所述DNA或cDNA文庫或所述DNA同源物或其片段轉(zhuǎn)染或轉(zhuǎn)化到可以飼喂給所述生物的微生物中,諸如細菌或酵母細胞,所述生物最好是線蟲蠕蟲C.elegans。在本發(fā)明的該實施方案中,可以將所述微生物改變以表達所述合適的轉(zhuǎn)錄因子。所述微生物最好是大腸桿菌。
在本發(fā)明的每個方面,可以在包含編碼所述轉(zhuǎn)錄因子的核苷酸序列的合適的DNA載體中,構(gòu)建所述DNA文庫、DNA同源物或DNA片段?;蛘?,可以由另一載體編碼所述轉(zhuǎn)錄因子。在再一替代方法中,所述細胞或生物可以表達所述轉(zhuǎn)錄因子,或者可以將其改變以表達所述轉(zhuǎn)錄因子。最好是,用于按照本發(fā)明的方法中的任一所述載體包含一種選擇標(biāo)記,可以例如為編碼sup-35或其片段的核苷酸序列??梢詫⑺龊塑账嵝蛄邢鄳?yīng)于啟動子定向,以致轉(zhuǎn)錄因子結(jié)合至所述啟動子而啟動從所述DNA轉(zhuǎn)錄出雙鏈RNA。
圖10圖解了使得在C.elegans中能夠產(chǎn)生雙鏈RNA的載體和DNA序列的方向。因此,在一個實施方案中,所述DNA位于載體上的兩個啟動子之間,當(dāng)合適的轉(zhuǎn)錄因子結(jié)合于所述啟動子時,所述載體能夠表達dsRNA?;蛘?,所述載體包含兩個拷貝的所述DNA序列,所述兩個拷貝以相應(yīng)于所述啟動子的有義和反義方向組織,而且當(dāng)所述標(biāo)記包含于pha-1突變C.elegans中時,所述標(biāo)記為可選擇的。所述啟動子最好是T7、T3或SP6啟動子中的任一種,所述轉(zhuǎn)錄因子包括所述合適的聚合酶。
所述選擇標(biāo)記最好包含能夠在所述細胞中抑制或防止基因表達的核苷酸序列,而且所述基因負責(zé)賦予已知的表型。該核苷酸序列可以是賦予所述表型的所述基因的一部分,或與所述基因相同,而所述核苷酸序列本身的定向與在合適的轉(zhuǎn)錄因子結(jié)合于所述啟動子時能夠啟動雙鏈RNA轉(zhuǎn)錄的合適啟動子的定向相應(yīng)。或者,所述核苷酸序列可以是賦予所述表型的所述基因序列的一部分,或與所述基因序列相同,而所述核苷酸序列是這樣的序列,以致允許所述合適的載體或另一載體通過同源重組整合到所述細胞的基因組中,并且在所述整合后,所述核苷酸序列能夠抑制賦予所述表型的所述基因序列的表達。在該實施方案中,所述核苷酸序列包含足以防止所述核苷酸序列在其整合到所述基因組中之后進行翻譯的終止密碼子。
有利地是,在所述方法中,可以將化合物加到所述細胞上或生物中,以便篩選所需表型,諸如當(dāng)與野生型相比時,具有對該化合物的抗性或敏感性。所述啟動子最好是誘導(dǎo)型的。在某些實施方案中,所述轉(zhuǎn)錄因子可以得自噬菌體,諸如為由噬菌體啟動子驅(qū)動的T7聚合酶。然而,當(dāng)利用C.elegan時,可以使用蠕蟲特異性或組織特異性啟動子,例如Let858、SERCA、UL6、myo-2或myo-3。所述大腸桿菌菌株最好是RNA酶III陰性菌株,甚至更優(yōu)選為RNA酶陰性菌株。
本發(fā)明的再一方面提供一種產(chǎn)生包含一種外源轉(zhuǎn)錄因子和一種轉(zhuǎn)基因的非人類轉(zhuǎn)基因生物的方法,其中所述轉(zhuǎn)基因包含一個有效連接至DNA片段的啟動子,當(dāng)所述轉(zhuǎn)錄因子結(jié)合于所述啟動子時表達所述DNA片段;所述方法包括a)提供包含第一構(gòu)成物的第一轉(zhuǎn)基因生物和包含第二構(gòu)成物的第二轉(zhuǎn)基因生物,所述第一構(gòu)成物摻入了編碼外源轉(zhuǎn)錄因子的DNA,而所述第二構(gòu)成物包括至少一個有效連接至所需DNA序列的啟動子,在所述第一轉(zhuǎn)基因生物的轉(zhuǎn)錄因子結(jié)合于所述啟動子時,表達所述所需DNA序列,b)將所述第一轉(zhuǎn)基因生物與所述第二轉(zhuǎn)基因生物雜交,并選擇表達所述所需DNA序列的后代。在一個實施方案中,通過將所述第一和第二構(gòu)成物轉(zhuǎn)化到相應(yīng)的微生物中,隨后用所述微生物飼喂所述相應(yīng)的生物,產(chǎn)生所述第一和第二轉(zhuǎn)基因生物。最好是,所述第二構(gòu)成物包含所述所需DNA序列,所述所需DNA序列相應(yīng)于所述啟動子的方向,使得當(dāng)所述轉(zhuǎn)錄因子結(jié)合于所述啟動子時,能夠啟動從所述DNA轉(zhuǎn)錄出dsRNA。在該實施方案中,所述第二構(gòu)成物包含兩個鄰接所述所需DNA序列的啟動子,所述啟動子在所述轉(zhuǎn)錄因子與其結(jié)合時,可以啟動從所述DNA序列轉(zhuǎn)錄出dsRNA?;蛘?,以相應(yīng)于所述啟動子的有義和反義的方向提供所述DNA序列,使得可以在所述轉(zhuǎn)錄因子結(jié)合于所述啟動子時產(chǎn)生dsRNA。在這些實施方案中的每一個中,可能最好為所述第一構(gòu)成物和/或第二構(gòu)成物提供一個有效連接至啟動子的報道基因,所述啟動子在所述轉(zhuǎn)錄因子與其結(jié)合時能夠啟動所述報道基因的轉(zhuǎn)錄。最好是,所述報道基因編碼熒光素酶、綠熒光蛋白、β半乳糖苷酶或β-內(nèi)酰胺酶中的任一個。
本發(fā)明也包括在酵母雙雜種載體實驗中所鑒定的克隆的驗證方法,所述實驗是本領(lǐng)域技術(shù)人員眾所周知的,并且所述實驗由Chien等(1991)首先提出,用于探測蛋白-蛋白相互作用。按照本發(fā)明的方法包括提供一種構(gòu)成物,所述構(gòu)成物包含在雙雜種載體實驗中所鑒定的蛋白的編碼DNA,所述構(gòu)成物使得以相應(yīng)于一個或多個啟動子的方向提供所述DNA,所述啟動子在合適的轉(zhuǎn)錄因子結(jié)合于所述啟動子時,能夠促進從所述DNA轉(zhuǎn)錄出雙鏈RNA;用所述構(gòu)成物轉(zhuǎn)化諸如細菌細胞的細胞,或者轉(zhuǎn)化包含所述轉(zhuǎn)錄因子的生物;并且與野生型相比,鑒定在所述細胞或生物中的表型變化,所述生物可以是C.elegan或諸如此類的生物。最好是,所述轉(zhuǎn)錄因子在所述細胞或生物中為可誘導(dǎo)的。如上所述,可以再一次將所述DNA序列定位于兩種啟動子之間,或以相對于單一啟動子的有義和反義兩個方向定位。最好是,所述啟動子為噬菌體聚合酶啟動子,而所述轉(zhuǎn)錄因子為RNA聚合酶,最好是T7聚合酶。本發(fā)明的范圍也包括用于轉(zhuǎn)化所述細胞或生物的載體以及所述細胞或生物本身。
在本發(fā)明的再一方面,提供減輕植物害蟲侵染的方法,所述方法包括a)從所述害蟲中鑒定出或者對于其生存、生長、增殖或者對于其生殖重要的DNA序列,b)在合適的載體中,以相對于一個或多個啟動子的方向克隆得自步驟a)的所述序列或其片段,所述啟動子在合適的轉(zhuǎn)錄因子與其結(jié)合時能夠從所述序列轉(zhuǎn)錄出RNA或dsRNA,并且c)將所述載體引入到所述植物中。
因此,有利的是,按照本發(fā)明的方法提供一種特別具有選擇性的機制,用于減輕害蟲侵染,而且在某些情況下用于減輕植物寄生蟲侵染,使得當(dāng)所述害蟲在所述植物上攝食時,它將攝入植物中所表達的dsRNA,因此抑制對于害蟲生長、生存、增殖或生殖重要的DNA在害蟲中的表達。在一個優(yōu)選實施方案中,所述害蟲可以為小墊刃線蟲屬物種(Tylenchulus ssp.)、穿孔線蟲屬物種(Radopholus ssp.)、細桿滑刃線蟲屬物種(Rhadinaphelenchus ssp.)、異皮線蟲屬物種(Heteroderassp.)、小盤旋線蟲屬物種(Rotylenchulus,ssp.)、短體線蟲屬物種(Pratylenchus ssp.)、刺線蟲屬物種(Belonolaimus ssp.)、Canjanus ssp.、根結(jié)線蟲屬物種(Meloidogyne ssp.)、球異皮線蟲屬物種(Globoderassp.)、科布線蟲屬物種(Nacobbus ssp.)、莖線蟲屬物種(Ditylenchusssp.)、滑刃線蟲屬物種(Aphelenchoides ssp.)、潛根線蟲屬物種(Hirschmenniella ssp.)、鰻線蟲屬物種(Anguina ssp.)、紐帶線蟲屬物種(Hoplolaimus ssp.)、螺旋線蟲屬物種(Heliotylenchus ssp.)、小環(huán)線蟲屬物種(Criconemella ssp.)、劍線蟲屬物種(Xiphinema ssp.)、長針線蟲屬物種(Longidorus ssp.)、毛刺線蟲屬物種(Trichodorus ssp.)、副毛刺線蟲屬物種(Paratriehodorus ssp.)、真滑刃線蟲屬物種(Aphelenchs ssp.)中的任何一種??梢詫凑毡景l(fā)明該方面的DNA序列或其片段克隆在兩個組織特異性啟動子之間,諸如在兩個根特異性啟動子之間。
本發(fā)明的再一方面涉及用于本發(fā)明每個方法中用于構(gòu)建所述文庫的載體,所述載體包含兩個相同的啟動子,所述啟動子的定向使得在合適的轉(zhuǎn)錄因子結(jié)合于所述啟動子時,所述啟動子能夠啟動從位于所述啟動子之間的DNA序列轉(zhuǎn)錄出dsRNA。所述DNA序列可以例如包括一個多克隆位點。最好是,所述表達載體包含一段編碼選擇標(biāo)記的核苷酸序列。在一個實施方案中,編碼所述選擇標(biāo)記的所述核苷酸序列位于兩個相同的啟動子之間,所述啟動子的定向使得在合適的轉(zhuǎn)錄因子結(jié)合于所述啟動子時,所述啟動子能夠啟動從位于所述啟動子之間的DNA轉(zhuǎn)錄出雙鏈RNA。為了引入到具有pha-1突變的C.elegans中,所述選擇標(biāo)記最好包含一段編碼sup-35的核苷酸序列。
最好是,所述轉(zhuǎn)錄因子或者包括一個結(jié)合于其相應(yīng)啟動子的噬菌體聚合酶,或者包括一個C.elegans特異性啟動子,甚至更優(yōu)選T7聚合酶。最好是,所述載體包含一個在所述相同的啟動子之間的多克隆位點。
在本發(fā)明的再一方面,提供一種表達載體,用于表這供按照本發(fā)明方法使用的合適的轉(zhuǎn)錄因子,所述載體包含一段有效連接至合適的表達控制序列的、編碼所述轉(zhuǎn)錄因子的核苷酸序列。所述表達控制序列最好包括啟動子,所述啟動子為誘導(dǎo)型啟動子、組成型啟動子、普遍性啟動子或組織特異性啟動子或它們的組合。最好是所述轉(zhuǎn)錄因子包括噬菌體聚合酶,最好為T7、T3或SP6的RNA聚合酶。
本發(fā)明的再一方面提供一個選擇系統(tǒng),用于鑒定用按照本發(fā)明的載體對細胞或生物的轉(zhuǎn)化,所述系統(tǒng)包括一個按照本發(fā)明的載體,其中所述選擇標(biāo)記包括一段在所述細胞或生物中能夠抑制或防止負責(zé)賦予已知表型的基因表達的核苷酸序列。所述核苷酸序列最好對應(yīng)于賦予所述已知表型的所述基因的一部分,或與所述基因相同,而且所述核苷酸序列本身位于兩個相同啟動子之間,所述啟動子在合適的轉(zhuǎn)錄因子與其結(jié)合時,能夠啟動雙鏈RNA的轉(zhuǎn)錄?;蛘撸龊塑账嵝蛄邪囊欢魏塑账嵝蛄惺琴x予所述細胞或生物已知表型的所述基因序列的一部分,或與所述基因相同,并且使得在所述載體通過同源重組而整合到所述細胞或生物的染色體中之后,所述序列抑制賦予所述已知表型的所述基因序列的表達。最好是,按照該實施方案,所述核苷酸序列包含足以防止所述核苷酸序列在整合到所述染色體之后進行翻譯的終止密碼子。所述已知基因序列最好包含可選擇的sup-35基因或其片段,可通過鑒定將其引入到pha-1 et123ts突變型C.elegans蠕蟲中之后于高于25℃的溫度下生長的后代,可選擇出該基因或片段。
在本發(fā)明的再一方面,提供所述已知基因的序列,所述序列包括通過鑒定將所述載體引入到pha-1 et123ts突變型C.elegans蠕蟲中之后后代在高于25℃的溫度下生長可選擇出的sup-35基因或其片段。又一個方面包括將功能確定至多細胞生物的DNA序列的方法,所述方法包括a)在能夠從所述啟動子啟動子轉(zhuǎn)錄的多細胞生物中,提供i)構(gòu)成物,所述構(gòu)成物包含在所述多細胞生物中能夠促進轉(zhuǎn)錄的兩個啟動子之間克隆的所述DNA片段;b)與野生型相比,鑒定所述多細胞生物的表型。
參考附圖,通過以下僅為示例性的實施例,可以更清楚地理解本發(fā)明,在附圖中圖1是按照本發(fā)明的質(zhì)粒PGN1的核苷酸序列。
圖2是按照本發(fā)明的質(zhì)粒PGN100的核苷酸序列。
圖3是按照本發(fā)明的方法中使用的質(zhì)粒和轉(zhuǎn)化方案的示意圖。
圖4是按照本發(fā)明使用的表達載體的說明。
圖5是用于轉(zhuǎn)化C.elegans的T7 RNA聚合酶表達載體的示意圖。
圖6是質(zhì)粒PGN1的圖解。
圖7是用于dsRBA抑制、編碼sup-35dsRNA的增強載體的圖示說明。
圖8是用于整合到C.elegans基因組中的載體的說明。
圖9是相對于從所述DNA序列啟動dsRNA表達的合適啟動子的DNA序列位置的說明。
圖10是質(zhì)粒pGN108的說明。
圖11是質(zhì)粒pGN105的說明。
圖12是質(zhì)粒pGN400的說明。
圖13是質(zhì)粒pGN401的說明。
圖14是質(zhì)粒pGN110的說明。
圖15是具有正向和反向T7/T3/SP6啟動子的質(zhì)粒pAS2的說明。
圖16是具有正向和反向T7/T3/SP6啟動子的質(zhì)粒pGAD424的說明。
圖17是質(zhì)粒pAS2-cyh2-HA+both T7-final的說明。
圖18為質(zhì)粒pGAD424-without-FULL-ICE-BOTH-T7的說明。
圖19(a)為質(zhì)粒pGN205的說明,而(b)為質(zhì)粒pGN207的說明。
實施例A有序等級匯集的cDNA文庫的構(gòu)建及其應(yīng)用隨機有序和匯集的文庫所述載體為一種大腸桿菌載體,帶有兩個T7啟動子,在所述兩個啟動子之間有一個多克隆位點(MCS)。所述兩個啟動子彼此相對地定向并朝向所述MCS定向。在存在在大腸桿菌、C.elegans或任何其它生物中表達的T7 RNA聚合酶的情況下,將從所述兩個T7啟動子開始,產(chǎn)生RNA。由于這些啟動子以相反的方向定向,因此將從插入(或克隆)到位于所述兩個啟動子之間的MCS中的DNA,產(chǎn)生兩條RNA鏈,當(dāng)T7 RNA聚合酶與啟動子結(jié)合時,導(dǎo)致產(chǎn)生雙鏈RNA(dsRNA)。
采用標(biāo)準分子生物學(xué)技術(shù),在所述MCS中構(gòu)建了一個C.eleganscDNA文庫。將所述文庫轉(zhuǎn)化到大腸桿菌中,讓所產(chǎn)生的大腸桿菌在在培養(yǎng)基中生長并貯存在96孔多孔板中。在該階段,可以分離質(zhì)粒DNA并將其對應(yīng)于大腸桿菌菌落的96多孔板貯存在96孔多孔板中。記錄了大約100,000個菌落。以這種方式,該文庫將含有約5倍于總的表達的C.elegans cDNA變異的cDNA變異,這為低表達序列出現(xiàn)在該文庫中提供了機會。這將產(chǎn)生約1041塊96孔板。必要時將所述板進行等級匯集。目前,將所述克隆的匯集范圍安排在10-100個。如果按每8個或每12個進行等級匯集(因為96孔板具有8排12列,則這些數(shù)字更為方便),則這產(chǎn)生大約87塊多孔板,大約8352個孔。如果按96孔即整個板進行等級匯集,則這產(chǎn)生約11塊板,大約1041個孔。在等級匯集的任一階段,均可以分離質(zhì)粒DNA,當(dāng)使用較少的板時,工作量可能較少,但將導(dǎo)致復(fù)雜度的降低,盡管在按12列匯集的條件下不應(yīng)該是這種情況。也可以用所述原始DNA進行所述DNA的匯集。
以下實驗描述了應(yīng)該如何對所述DNA文庫以及對大腸桿菌文庫進行等級匯集。
用于RNAi技術(shù)的、含有C.elegans基因組中每個基因的有序文庫及其應(yīng)用由于基因組測序計劃即將進入尾聲,因而可以將這種信息用于T7RNA抑制技術(shù)的應(yīng)用中。采用PCR技術(shù),可以克隆C.elegans基因組的每個基因。優(yōu)選克隆最小長度為500bp的外顯子。如果外顯子太小,則用PCR分離較小的片段,或甚至用PCR技術(shù)分離多個內(nèi)含子的部分和相鄰的外顯子,使得至少克隆足夠部分的所述基因的翻譯區(qū)。為此,需要進行至少17000個PCR反應(yīng)。將這種PCR產(chǎn)物的收集物克隆在所述T7載體(兩個T7啟動子彼此相對地定向,在其之間具有一個多克隆位點)中。獨立地克隆每種PCR產(chǎn)物,或可以用全部PCR產(chǎn)物產(chǎn)生類似于所述cDNA文庫的隨機文庫。如果單獨克隆每種PCR產(chǎn)物,則可以以不同方式匯集所產(chǎn)生的細菌和質(zhì)粒DNA。首先,可以如在隨機文庫中所述,將這種分別在T7 RNAi載體中克隆的PCR產(chǎn)物的收集物隨機地匯集。也可以以更合理的方式進行這種匯集。例如,可以采用生物信息工具(載于silico biology)分析C.elegans基因組的基因。該基因組的不同基因?qū)儆谝粋€基因家族,或在該基因組中具有同源物。匯集該基因家族的這些成員,或?qū)橥次锏某蓡T匯集。以這種方式,將約17000個克隆的總數(shù)降至更合用的量。在按照本發(fā)明的方法中可以用該文庫篩選表型。所產(chǎn)生的表型給出了對C.elegans基因組的所述基因或基因家族或基因同源物的功能描述。由于該文庫由該基因組中每個基因的一部分構(gòu)成,因此該方法使得能夠用功能-表型術(shù)語描述整個基因組。為此,需要將雙鏈RNA(dsRNA)引入到所述蠕蟲中??梢砸运龅膸追N方式,完成這種單獨的克隆、或者隨機匯集或合理匯集的匯集克隆的引入。
用于表達雙鏈RNAi的載體的實例可以使用含有T7啟動子的任何載體,且所述載體含有一個多克隆位點(有許多市售的載體)。設(shè)計具有合適末端的含有T7啟動子的引物和具有合適末端的反向互補鏈的引物。可以將這些引物雜交,并且如果很好地設(shè)計,可以將其克隆在選擇的載體中。作為T7啟動子的最小序列為TAATACGACTCACTATAGGGCGA。盡管可以使用任何載體構(gòu)建一個T7表達載體,但以下是用載體pGEM-3zf(-)如何完成這一過程的實例。
-用HindIII和SalI消化載體pGEM-3zf(+)(PROMEGA)。
-將引物oGN1和oGN2以1μg/30μl的終濃度混合在一起,將其煮沸并緩慢冷卻至室溫。
-采用標(biāo)準連接程序?qū)⑺鲆镞B接到該載體中。所產(chǎn)生的載體為pGN1(示于圖1),它含有彼此相對地定向的兩個T7啟動子,兩個啟動子之間含有一個多克隆位點。
oGN1和oGN2的序列為-oGN1AGC TGT AAT ACG ACT CAC TAT AGG GCG AGA AGC TT-oGN2TCG AAA GCT TCT CGC ATA ATA GTG AGT CGT ATT AC文庫構(gòu)建實施例從對RNAi敏感的每種生物中分離RNA。一般接著將分離的RNA拷貝為雙鏈cDNA,隨后在合適的載體中制備用于克隆。存在幾種方法,分子生物學(xué)試劑盒可以購自不同公司,包括promega,clontech,boehringer Mannheim、BRL等,所述試劑盒使得能夠-分離RNA,-最終可以分離polyA RNA(可利用幾種技術(shù)和試劑盒)-用AMV逆轉(zhuǎn)錄酶、隨機六聚引物和/或寡聚(dT)引物合成第一條鏈-用RNA酶H、DNA聚合酶I合成第二條鏈,-用T4 DNA聚合酶填平末端-用T4 DNA連接酶加入一個連接物-最后用T4多核苷酸激酶處理-將所述cDNA克隆到所述載體中。
所產(chǎn)生的連接混合物可以被認為是cDNA文庫。連接翻譯物含有連接到目的載體中的所有該步驟的cDNA。為了安排文庫,需要將該連接反應(yīng)物轉(zhuǎn)化到大腸桿菌菌株中。
該大腸桿菌文庫或DNA文庫的應(yīng)用產(chǎn)生T7 RNA的菌株-一種標(biāo)準的菌株為BL21(DE3)F-ompT[lon]hsds(r-m-);和大腸桿菌B菌株)λ(DE3)。最后可使用BL21(DE3)的變異體,盡管使用BL21(DE3)pLysS。
-需要構(gòu)建可以利用的、產(chǎn)生T7 RNA聚合酶的任何其它大腸桿菌菌株??梢杂檬惺鄣氖删w容易地產(chǎn)生這種菌株,在這種情況下,使用λCE6載體(由Promega提供)??梢杂迷撌删w轉(zhuǎn)染幾乎每種大腸桿菌,并將產(chǎn)生T7 RNA聚合酶。
-RNA酶III突變大腸桿菌原則上可利用各種菌株,我們選擇在第一個實驗中使用菌株AB301-105rna-19,suc-11,bio-3,gdhA2,his95,rnc-105,relA1,spoT1,metB1。(kinder等,1973 Mol.Gen.Genet 12653),但其它菌株可能更適合。用λDE6感染該菌株,由此構(gòu)建生產(chǎn)T7的變異體。
可以在細菌庫(bacteria pool)上培養(yǎng)野生型C.elegans蠕蟲。所述細菌正在表達T7 RNA聚合酶。這在C.elegans腸中產(chǎn)生大量的dsRNA,dsRNA將在這種生物中擴散,并導(dǎo)致抑制表達?,F(xiàn)在可以用該文庫篩選幾種表型。這種技術(shù)的優(yōu)點是與已知的C.elegans技術(shù)相比,它探測某些途徑中的相關(guān)基因要快得多。此外,如果發(fā)現(xiàn)一種感興趣的表型,則可以容易地克隆負責(zé)的基因。
采用等級匯集,人們可以容易地在第二次篩選中發(fā)現(xiàn)該庫的相關(guān)克隆。然后可以對該克隆的插入DNA進行測序。該實驗以一個步驟產(chǎn)生遺傳和生化的數(shù)據(jù)。
可以將野生型C.elegans株系與化合物混合,以根據(jù)表型、藥物抗性和或藥物敏感性進行篩選。所述C.elegans株系可以是突變型株系,根據(jù)增強的表型、減弱的表型或新表型篩選。所述C.elegans株系可以是一種突變株系,并且可以將所述文庫的篩選與化合物相結(jié)合。因此,人們可以篩選藥物抗性、藥物敏感性、增強的表型、減弱的表型或新表型。所述大腸桿菌菌株可以是表達T7 RNA聚合酶的任何菌株,例如像BL21(DE3),但通過采用RNA酶III陰性的特殊大腸桿菌菌株,可以增強雙鏈RNA的形成。最后,可以使用非RNA酶III的RNA酶缺失的大腸桿菌,或可以使用一種或多種RNA酶缺失的大腸桿菌。T7 RNA聚合酶在大多數(shù)已知的大腸桿菌菌株和可用來產(chǎn)生生產(chǎn)T7 RNA聚合酶的大腸桿菌菌株的構(gòu)成物中的表達,一般包括一個誘導(dǎo)型啟動子。以這種方式,調(diào)節(jié)T7 RNA聚合酶的產(chǎn)生,并由此產(chǎn)生所述dsRNA。最好是,可以用這一特征來“脈沖式”飼喂特定生長階段的C.elegans蠕蟲。讓所述蠕蟲生長在非誘導(dǎo)的大腸桿菌菌株上。當(dāng)所述蠕蟲長到目的階段時,在所述細菌中誘導(dǎo)產(chǎn)生T7 RNA。這使得可以在所述動物生活周期中的任何點研究任一基因的功能。篩選文庫中推定的目的人類基因的同源物并將功能確定至這些基因已經(jīng)在各種計劃(為基因組計劃、差異表達排列、雜交研究等)中分離出數(shù)百個基因。所描述的cDNA文庫可以提供一種以快速有效的方式驗證功能和或?qū)⒐δ艽_定至這些基因的方法。首先,需要通過生物信息工具(載于silico biology)鑒定出該蠕蟲的一種或多種同源物或所述基因。研制出PCR引物,并用PCR技術(shù)分離所述cDNA片段??梢栽诘燃墡焐线M行PCR。將含帶有合適cDNA的細菌的陽性庫或陽性孔的所述細菌飼喂C.elegans并記錄表型。
可以在從C.elegans中分離的cDNA上進行PCR??蓪a(chǎn)生的DNA克隆到T7載體中,并轉(zhuǎn)化到所述生產(chǎn)dsRNA的大腸桿菌中,然后用該大腸桿菌飼喂C.elegans蠕蟲。需要根據(jù)哪種方式更快和更可靠而作出選擇。
如果該基因?qū)儆谝粋€基因家族,則可能需要用細菌混合物飼喂所述蠕蟲。細菌混合物中的每種細菌均含有該基因家族成員的一部分??梢匀缟纤鍪褂么竽c桿菌菌株、生長條件及進行與化合物的混合。
如果使用其中以組織和結(jié)構(gòu)方式克隆C.elegans的所有基因的該文庫的合理形式,則可以用silico biology容易地在該文庫中追蹤回該基因家族的C.elegans同源物,并最終追蹤回該基因家族的其它同源物、orthologues和成員。在該步驟中不涉及PCR,可以分離用于養(yǎng)所述蠕蟲的細菌和或DNA。
實施例所述系列實驗的既測試所述RNAi載體和也測試構(gòu)建的各種大腸桿菌菌株。
1)試驗質(zhì)粒的構(gòu)建可以使用當(dāng)被失效或用于RNAi實驗中時在蠕蟲中產(chǎn)生清楚表型的任何cDNA。已知unc-22是一個良好的候選者,但可能其它基因也是可以的。我們選擇可以用于較晚階段的一個敏感型系統(tǒng)。用在pha-1背景中的sup-35測試該系統(tǒng)。通過PCR分離sup-35的外顯子5,并將其克隆到T7啟動子載體pGN1中。產(chǎn)生的載體被命名為pGN2。pha-1(e2123)突變型蠕蟲不能在高于25℃的溫度下產(chǎn)生后代。這是由于胚胎發(fā)生中的發(fā)育問題而引起的。當(dāng)在該株系中sup-35被失效或抑制時,后代可以在該溫度下生長。pha-1突變型蠕蟲和sup-35 RNAi的組合是一個驗證各種可選擇之物的良好系統(tǒng)。
2)用產(chǎn)生dsRNA的大腸桿菌菌株測試所述RNAi-將pGN2引入大腸桿菌菌株BL21(DE3)中,并用IPTG誘導(dǎo)T7RNA聚合酶。在該細菌上接種C.elegans蠕蟲(pha-1(e2123)),讓其在25℃限制溫度下生長。因為該突變體在該溫度下是胚胎突變體,所以將觀察不到后代。如果大腸桿菌中存在的sup-35dsRNA有效抑制sup-35基因,則將觀察到后代。
-將pGN2引入大腸桿菌AB301-105(DE3)中,并用IPTG誘導(dǎo)T7RNA聚合酶。在該細菌上接種C.elegans蠕蟲(pha-1(e2123)),讓其在25℃限制溫度下生長。因為該突變體在該溫度下是胚胎突變體,所以觀察不到后代。如果大腸桿菌中存在的sup-35dsRNA有效抑制sup-35基因,則將觀察到后代。
3)改良蠕蟲株系以更好地攝入dsRNA在將pha-1 C.elegans接種到產(chǎn)生雙鏈sup-35 RNA的大腸桿菌菌株平板上之前,用EMS(甲磺酸乙酯)誘變該蠕蟲。然后將誘變?nèi)湎x的后代接種到所述細菌平板上。攝食該細菌的蠕蟲產(chǎn)生較大的后代,所述后代具有導(dǎo)致dsRNA攝入改善的突變,可以將其用于進一步的實驗。
所述產(chǎn)生dsRNA的載體穩(wěn)定地整合到產(chǎn)生T7 RNA聚合酶的蠕蟲的基因組中構(gòu)建具有以下特征的大腸桿菌載體彼此相對的兩個T7啟動子,在所述兩個啟動子之間具有一個限制位點或一個多克隆位點。此外,該載體可以含有C.elegans sup-35基因組DNA,對該載體的工程改造方式使得其在不同的間隔含有幾個終止密碼子,以致從sup35基因組DNA片段不可能表達出全長蛋白,如圖8所示。在所述兩個T7啟動子之間的多克隆位點中可以克隆任何cDNA或cDNA片段。如果將該載體引入到表達T7 RNA聚合酶的C.elegans株系中,則在所述兩個T7啟動子之間克隆的cDNA或cDNA片段將轉(zhuǎn)錄,并從所克隆的片段產(chǎn)生dsRNA。
設(shè)計該載體以用于表達T7 RNA聚合酶的pha-1(e2123)突變型蠕蟲中。T7 RNA聚合酶的表達可以是組成型的,或可以被調(diào)節(jié),可以是普遍性的或是組織特異性的。這些pha-1(e2123)蠕蟲在高于25℃的溫度下不能產(chǎn)生后代,這是由于胚胎發(fā)生中的發(fā)育問題引起的。當(dāng)在該株系中sup-35被失效或抑制時,后代可以在該溫度下生長。
如果將該載體引入到所述蠕蟲中,則該載體可以通過同源重組而整合(Campbell樣整合)。已經(jīng)表明,在C.elegans中發(fā)生同源重組,盡管其頻率低(Plasterk和Groenen,EMBO J.11287-290,1992)。與sup-35基因的同源重組將導(dǎo)致該基因的失效,因為所產(chǎn)生的兩個sup-35基因?qū)⒑薪K止密碼子。如果這種重組發(fā)生在卵中,則所產(chǎn)生的蠕蟲及其后代將具有一個拷貝的整合到基因組中的所述載體??梢詫⑵溥x擇出來,因為僅有sup-35已經(jīng)被失效的蠕蟲在高于25℃的溫度下具有后代。此外,所產(chǎn)生的蠕蟲將穩(wěn)定地從所述兩個T7啟動子之間的克隆的DNA片段產(chǎn)生雙鏈RNA。這種蠕蟲現(xiàn)在可以被認為是基因功能減低的穩(wěn)定的轉(zhuǎn)基因蠕蟲株系,而所述基因是所述兩個T7啟動子之間所克隆片段所屬的基因。
可以通過幾種技術(shù)將所述DNA傳遞至蠕蟲,所述技術(shù)包括注射、彈道轉(zhuǎn)化(ballistic transformation)、浸泡在所述DNA溶液中、飼喂所述細菌。可以考慮提高轉(zhuǎn)化率的新方法和其它方法。
另外,C.elegans靶株系可以具有除pha-1(e2123)突變以外的其它突變,并且可以表達除T7 RNA聚合酶以外的其它基因。
實施例B酵母雙雜種-RNAi載體可以構(gòu)建含有所述兩個T7啟動子的酵母雙雜種載體。所述載體可被設(shè)計為既在酵母中復(fù)制,又在大腸桿菌中復(fù)制。一般而言,可以在Ga14或LexA載體中制備適合于所述酵母雙雜種系統(tǒng)的cDNA文庫。在具有這些基因中的一個基因的激活域的載體中構(gòu)建該文庫。可以構(gòu)建一種載體,該載體在酵母雙雜種篩選中仍可以執(zhí)行功能,但它也含有兩個彼此相對定向的T7啟動子,并且在所述兩個啟動子之間具有一個克隆位點。在該質(zhì)粒中所述序列的順序則將為“質(zhì)粒骨架、(GAL4-T7)、MCS、T7、骨架”。在實驗中在該載體中構(gòu)建的C.elegans cDNA文庫可以用作標(biāo)準酵母雙雜種文庫,以分離與給定蛋白相互作用的蛋白。一旦分離出克隆,則可以將該質(zhì)粒引入到表達T7RNA聚合酶的大腸桿菌菌株中,并因此將產(chǎn)生所克隆片段的dsRNA??梢詫a(chǎn)生該dsRNA的細菌飼喂所述蠕蟲,并可記錄表型。如先前的實施例中,這種對于新分離的酵母雙雜種克隆的驗證方法明顯比標(biāo)準方法省時,標(biāo)準方法需要PCR步驟和/或克隆步驟、RNA實驗和/或失效實驗。在大多數(shù)情況下,首先對分離出的克隆測序,在該序列的基礎(chǔ)上,作出繼續(xù)進行進一步的實驗的決定。在本發(fā)明中,可以容易地將每個分離出的克隆引入到合適的大腸桿菌中并將其飼喂所述蠕蟲。然后通過表型分析進行驗證。
為了應(yīng)用該方法,用一個已知基因作餌,用新構(gòu)建的文庫作為靶,使用酵母雙雜種。在所述靶中,由所述克隆編碼的與餌蛋白相互作用的蛋白,將產(chǎn)生表達報道分子的陽性酵母克隆,所述報道分子諸如可以通過用X-gal的LacZ染色觀察到的報道分子。直接從該酵母菌株中分離出編碼靶蛋白的質(zhì)粒,并將其引入到大腸桿菌中。該大腸桿菌為產(chǎn)生T7 RNA聚合酶的大腸桿菌。在這種情況下,從克隆在該載體的多克隆位點中的DNA產(chǎn)生雙鏈RNA。如果用前述方法將該dsRNA飼喂所述蠕蟲,則所述基因在蠕蟲中被抑制,產(chǎn)生特定表型。
-這種酵母雙雜種載體可以有利地用來構(gòu)建一個先前實施例中所述的有序且等級匯集的文庫。
-也可以構(gòu)建一種有條件地產(chǎn)生T7 RNA聚合酶的酵母菌株。在酵母雙雜種實驗后,可以誘導(dǎo)所述T7聚合酶的表達,導(dǎo)致在酵母細胞中產(chǎn)生dsRNA。因此,可以將該酵母飼喂蠕蟲??傻玫降淖C明表明,C.elegans蠕蟲可以攝食酵母。
產(chǎn)生T7 RNA聚合酶的菌株的構(gòu)建及其應(yīng)用可以構(gòu)建表達T7 RNA聚合酶的C.elegans株系。表達可以是普遍的和組成型的,但也可以在一個組織特異性啟動子、誘導(dǎo)型啟動子或瞬時啟動子或含有這些特征之一或特征組合的啟動子之下而被調(diào)節(jié)??梢詫NA引入到該C.elegans株系中。這種引入或者通過注射、用粒子射擊、電穿孔進行,或者如上所述通過攝食進行。如果所述DNA為前述實施例中描述的質(zhì)粒,即在兩個側(cè)翼T7啟動子之間具有所克隆cDNA片段或PCR片段的質(zhì)粒,則在所述細胞或整個生物中形成該cDNA或PCR片段的dsRNA,導(dǎo)致向下調(diào)節(jié)相應(yīng)的基因。所引入的DNA可以具有有效的瞬時向下調(diào)節(jié)作用。所引入的DNA可以形成染色體外布置(array),所述布置可能導(dǎo)致更具催化性的功能表型的剔除或降低。該質(zhì)粒也可能整合到所述生物的基因組中,導(dǎo)致同樣催化性的功能表型的剔除或降低,但這可被穩(wěn)定地傳遞。
-如實施例A)和B)中所述,可以通過標(biāo)準技術(shù),將在兩個T7啟動子之間具有一個克隆的C.elegans cDNA或cDNA部分或EST或PCR片段的質(zhì)粒引入到T7 RNA聚合酶蠕蟲中??梢苑治霰硇?可以通過標(biāo)準技術(shù)(注射、射擊),將如同實施例A)中的、得自有序匯集文庫的DNA引入到T7 RNA聚合酶蠕蟲中??梢苑蛛x表型。用所述等級庫,可以容易地發(fā)現(xiàn)原始克隆。
-可以用表達T7 RNA聚合酶的突變?nèi)湎x完成同樣的步驟。篩選增強的、降低的或新的表型。
-可以使用能夠篩選化合物的方法?;蛘哂靡吧椭晗祷蛘哂猛蛔冎晗岛Y選增強的表型或新表型。
-可以用新方法將所述DNA引入到蠕蟲中。其中一個方法是用大腸桿菌傳遞DNA。在這種情況下,用所述等級匯集文庫飼喂所述動物。為了防止所述大腸桿菌DNA在線蟲腸中被消化,優(yōu)先使用DNA酶缺陷型C.elegans,例如nuc-1(e1392)。這種方法將的最令人感興趣的方法,因為它與其它技術(shù)的轉(zhuǎn)化效率無關(guān),并且一般更快且工作量更少。
2)該方法推定的增強作用-設(shè)計一種載體,使其含有sup-35cDNA或該cDNA的一部分,將其克隆在兩個T7啟動子之間。該載體的其余部分如實施例A)和B)中所述。可以將該載體引入到pha-1ts突變C.elegans中。在這種情況下存在一個溫度選擇系統(tǒng),只有已經(jīng)攝入所述DNA并表達雙鏈sup-35RNA的那些蠕蟲將在限制溫度下存活??梢酝ㄟ^上述任何方法傳遞所述等級匯集文庫。
-可以用該載體構(gòu)建一個文庫,將所述載體引入到表達T7 RNA聚合酶的大腸桿菌中。在這種情況下,我們已經(jīng)如部分A)中所述,類似地進行了篩選,并在sup-35的dsRNA有活性的場合下,對蠕蟲進行額外的篩選。
-可以在不同質(zhì)粒上傳遞sup-35的DNA和或dsRNA。對于飼喂,即對于DNA飼喂(實施例C)和dsRNA飼喂實施例A)和B),這意味著所述兩種質(zhì)??梢源嬖谟谝环N細菌中,或意味著用細菌混合物飼喂蠕蟲,其中一種細菌含有sup-35構(gòu)成物。
構(gòu)建產(chǎn)生T7 RNA的C.elegans的實施例為了在所述蠕蟲中產(chǎn)生T7 RNA聚合酶,有幾種可能性。所述T7聚合酶可以在不同啟動子下表達,即在誘導(dǎo)型啟動子、組成型啟動子、普遍性啟動子和組織(細胞)特異性啟動子或它們的組合下表達。這些啟動子的實例是熱激啟動子hsp-6、腸啟動子ges1、得自cet858的啟動子,而且也有dpy7的啟動子和啟動子元件GATA1。在該實施例中,在pPD49.78載體中可利用的hsp-16啟動子控制下表達所述T7 RNA聚合酶。用GN3和GN4引物,分離作為PCR產(chǎn)物的T7 RNA聚合酶。
用NheI和NcoI消化所產(chǎn)生的PCR產(chǎn)物,同樣消化我們想用于克隆的載體,即Fire載體pPD49.78。所產(chǎn)生的載體為圖2中說明的pGN100,包括oGN3CAT GGC AGG ATG AAC ACG ATT AAC ATCGC oGN4ATG GCC CCA TGG TTA CGG GAA CGC GAA GTC CGpGN100。
用標(biāo)準技術(shù)例如微注射,將該載體引入到蠕蟲中。
然后構(gòu)建以下株系-野生型(pGN100)-nuc-1(e1392)(pGN100)-pha-1(e2123)(pGN100)-pha-1;nuc-1(pGN100)當(dāng)溫度誘導(dǎo)時,或者用金屬諸如應(yīng)用重金屬鎘或汞時,所有這些株系均能夠產(chǎn)生T7 RNA聚合酶。溫度誘導(dǎo)方法是將動物轉(zhuǎn)移至30-33℃的溫度下達至少1小時,然后可將所述動物轉(zhuǎn)移回到標(biāo)準溫度(15-25℃)下。
可以用產(chǎn)生T7 RNA聚合酶的野生型株系在所述蠕蟲中產(chǎn)生任何RNA。更具體地講,可以將得自所述文庫的質(zhì)粒引入到這些蠕蟲中,并可記錄表型。
用nuc-1突變?nèi)湎x,通過喂給蠕蟲的細菌來引入DNA。因為nuc-1蠕蟲不消化所述DNA,所以所述質(zhì)粒DNA可以穿過腸壁。如果所述DNA被產(chǎn)生T7 RNA聚合酶的細胞吸收,則將產(chǎn)生dsRNA,由此抑制轉(zhuǎn)錄出所述RNA的基因。
產(chǎn)生T7 RNA聚合酶的pha-1突變株系可以用來增強上述方法??梢酝ㄟ^射擊、微注射或攝食引入DNA。更具體地講,對于從sup-35和從目的基因產(chǎn)生dsRNA的載體,可以使用該株系,所述目的基因可以是PCR產(chǎn)物、cDNA或所述的文庫。
產(chǎn)生T7 RNA聚合酶的pha-1、nuc-1突變體可以用于所述DNA的細菌傳遞。DNA將優(yōu)選為從sup-35和目的基因產(chǎn)生dsRNA的質(zhì)粒。該蠕蟲株系將優(yōu)先在腸中產(chǎn)生T7 RNA聚合酶。優(yōu)選通過用帶有該質(zhì)粒的細菌飼喂蠕蟲而發(fā)生傳遞。
RNAi技術(shù)在植物中的應(yīng)用線蟲是使植物受到損害的一個很大原因,對于農(nóng)業(yè)產(chǎn)業(yè)中使用的植物更尤其如此??梢詫凑毡景l(fā)明的RNAi方法用于植物,以阻止這些寄生線蟲攝食更長時間。第一步,從寄生于植物的線蟲中分離出對于所述動物生存或生長或攝食或增殖重要的cDNA片段。必需表達的任何基因均適用于此目的。
克隆該基因、外顯子或cDNA的一部分??梢詫⒃揇NA片段克隆置于組織特異性啟動子的影響之下,所述啟動子優(yōu)選根特異性啟動子,甚至更優(yōu)選將該DNA片段克隆在兩個根特異性啟動子之間。可以用植物轉(zhuǎn)基因技術(shù),將在根特異性啟動子控制下的所克隆基因的DNA引入目的植物中。對于每種寄生線蟲,可能需要不同片段的DNA,同樣,對于每個植物品種,將需要不同的啟動子。
當(dāng)利用根特異性啟動子時,根將從引入的DNA片段產(chǎn)生RNA或dsRNA。因為線蟲在植物上攝食,故所述線蟲將消耗或攝入所述RNA和/或dsRNA。所述RNA和/或dsRNA可以進入線蟲的細胞,并對所述靶DNA發(fā)揮其抑制作用。根據(jù)所克隆的蠕蟲的DNA片段的性質(zhì),所述線蟲將不能存活、進食、增殖等,在所有情況下均阻止該動物在所述植物上更長久地攝食,并因此保護植物。
產(chǎn)生T7 RNA聚合酶的C.elegans的構(gòu)建為了在動物中、更具體地講在線蟲中,更尤其在C.elegans中產(chǎn)生T7 RNA聚合酶或其它RNA聚合酶,可以設(shè)想幾種可能性??梢栽诟鞣N啟動子下表達T7 RNA聚合酶。這些啟動子可以是誘導(dǎo)型啟動子、組成型啟動子、普遍性啟動子、組織特異性啟動子或它們的組合。
實施例1構(gòu)建用于在C.elegans中表達T7聚合酶的基本載體用引物oGN26(ATGGAATTCTTACGCGAACGCGAAGTCCG)和oGN46(CTCACCGGTAATGAACACGATTAACATCGC),采用標(biāo)準方法(PCR,A practical A practical approach,1993,J.McPherson等編輯,IRL Press),從λCE6(Novagen,Madison,USA)經(jīng)PCR擴增T7聚合酶的編碼序列。用AgeI和EcoRI消化所得的編碼T7 RNA聚合酶的DNA片段,并插入用AgeI和EcoRI消化的Fire載體pPD97.82中。所得的構(gòu)成物編碼一個與SV40大T抗原核定位信號(NLS)融合的T7 RNA聚合酶的可讀框,其中NLS的氨基酸序列為MTAPKKKRKVPV。將T7RNA聚合酶從胞質(zhì)轉(zhuǎn)運至細胞核需要這種核定位信號序列,在細胞核中T7 RNA聚合酶能夠結(jié)合于名為T7啟動子的其特異性啟動子上。T7聚合酶融合蛋白編碼序列的上游為最小啟動子(myo-2),在最小啟動。子之前為一個多克隆位點(MCS),在其中可以插入幾個C.elegans啟動子。該質(zhì)粒(示于圖11的pGN105)為基本T7 RNA聚合酶質(zhì)粒,該質(zhì)粒能夠在C.elegans中表達T7聚合酶。其中將啟動子克隆到該質(zhì)粒多克隆位點中的該質(zhì)粒衍生物,在C.elegans中可提供T7 RNA聚合酶的誘導(dǎo)型、組成型、普遍型和組織特異性表達,因為表達將受到在多克隆位點中所克隆的啟動子的調(diào)節(jié)。
盡管不限于這些實施例,但對于以下啟動子,已知它們在以下組織中誘導(dǎo)表達let-858(遍在表達)、myo-2(咽表達)、myo-3(體壁肌)、egl-15(陰戶肌)、unc-119(全身神經(jīng)元)。
實施例2構(gòu)建用于在C.elegans肌肉組織中表達T7 RNA聚合酶的載體用引物oGN43(GCCACCGGTGCGAGCTCATGAACACGATTAACATCGC)和oGN44(CACTAGTGGGCCCTTACGCGAACGCGAAGTCCG),從λCE6經(jīng)PCR擴增T7 RNA聚合酶的編碼序列,用AgeI/SpeI消化,并插入用AgeI/SpeI消化的pGK13載體中。(該載體含有在咽、陰戶肌、尾部和體壁肌中驅(qū)動表達的強SERCA啟動子)。通過將兩個重疊寡核苷酸oGN45(CCGGATGACTGCTCCAAAGAAGAAGCGTAAGCT)和oGN46(CTCACCGGTAATGAACACGATTAACATCGC)插入SacI/AgeI限制位點中,將SV40大T抗原的核定位信號(NLS)插入T7聚合酶編碼序列之前。將所得的構(gòu)成物稱為pGN108,如圖10所示。將該質(zhì)粒引入到C.elegans中,導(dǎo)致T7RNA聚合酶在咽、陰戶肌、尾部和體壁肌中表達。
為了測試T7 RNA聚合酶在C.elegans中處于SERCA啟動子調(diào)節(jié)下的表達和功能性,將編碼在SERCA啟動子控制下的T7RNA聚合酶的pGN108注射到C.elegans中。共同注射一種試驗載體。該試驗載體編碼在T7啟動子控制下的GFP(圖13中的pGN401)。通過將兩個重疊的寡核苷酸oGN41(CCCGGGATTAATACGACTCACTATA)和oGN42(CCGGTATAGTGAGTCGTATTAATCCCGGGAGCT)插入SacI/AgeI打開的Fire載體pPD97.82中,產(chǎn)生一個T7啟動子,來構(gòu)建質(zhì)粒pGN401。此外,共注射一種選擇標(biāo)記以選擇轉(zhuǎn)化體(ro16,pRF4)。后一選擇載體pRF4是本領(lǐng)域技術(shù)人員眾所周知的。可以容易地分離出轉(zhuǎn)基因F1,因為它們表現(xiàn)出ro16表型。這些轉(zhuǎn)基因C.elegans均在咽、陰戶肌、尾部和體壁肌中表達GFP。該數(shù)據(jù)清楚地表明,T7 RNA聚合酶在SERCA啟動子調(diào)節(jié)下進行功能性表達,并且所表達的T7RNA聚合酶結(jié)合于pGN401中存在的T7啟動子,從而啟動GFP基因的轉(zhuǎn)錄,然后功能性地表達GFP,在SERCA正在誘導(dǎo)表達T7 RNA聚合酶的肌肉組織中產(chǎn)生熒光。
實施例3構(gòu)建用于在C.elegans中遍在表達T7聚合酶的載體用XmaI/Bsp1201從pGN108中分離NLS-T7 RNA聚合酶融合基因,將其克隆到用XmaI/Bsp120I消化的Fire載體pPD103.05中。這產(chǎn)生一種載體,其中將T7 RNA聚合酶克隆在let858啟動子調(diào)節(jié)之下。這種特異性啟動子使得能夠在所有組織中表達T7 RNA聚合酶。將所得的質(zhì)粒命名為pGN110(圖14)。
實施例4構(gòu)建一種載體,用于經(jīng)T7 RNA聚合酶介導(dǎo)在T7啟動子控制下表達DNA片段、基因和cDNA用SacI/AgeI消化Fire載體pPD97.82,通過將兩個重疊寡核苷酸oGN41(CCCGGGATTAATACGACTCACTATA)和oGN41(CCGGTATAGTGAGTCGTATTAATCCCGGGAGCT)插入SacI/AgeI限制性內(nèi)切核酸酶位點中,產(chǎn)生一個T7啟動子序列。該構(gòu)成物(圖12中的pGN400)含有一個克隆在SacI和EcoRI限制性內(nèi)切核酸酶位點之間的、在T7啟動子調(diào)節(jié)之下的GFP可讀框。通過缺失作為AgeI/SacI片段的GFP基因,并將目的DNA片段插入該載體中,可以在該載體中克隆任何基因、cDNA或DNA片段。優(yōu)選可以通過PCR擴增獲得目的DNA片段,將其插入引物的SacI/AfeI位點中。將PCR擴增后所得的DNA片段消化,用擴增的DNA片段取代pGN400中的GFP基因。對于在C.elegans中由T7RNA聚合酶誘導(dǎo)的表達而言,可以使用含有T7啟動子的每種載體,所述載體諸如市售的pGEM載體和pBluescript載體。通過pGN401載體清楚地表明了這一點pGN401在表達T7 RNA聚合酶的轉(zhuǎn)基因C.elegans中,在T7啟動子調(diào)節(jié)下表達GFP。
應(yīng)用pGN400的優(yōu)點是該載體包括得自unc-54的3’UTR片段,該片段增強所述RNA的轉(zhuǎn)錄或穩(wěn)定性。
永久性、組織特異性“假失效”RNAi C.elegans系的產(chǎn)生目前,在隨機大規(guī)模誘變和PCR堿基同胞選擇后,獲得C.elegans中的基因失效。該方法工作量大、非常耗時并且煩瑣。已經(jīng)描述了,將雙鏈RNA引入到細胞中導(dǎo)致內(nèi)源基因表達的有效而特異性的干擾。在C.elegans中,通過將RNA注射到該蠕蟲的體腔中、將蠕蟲浸泡在含dsRNA的溶液中,或飼喂表達對應(yīng)于目的基因的dsRNA的大腸桿菌,可以向下調(diào)節(jié)基因的表達。C.elegans細胞具有從其胞外環(huán)境中攝入dsRNA的能力。已經(jīng)報道m(xù)RNA是該ds RNA介導(dǎo)的遺傳干擾的靶(Montgomery和Fire 1998)。也提示了,在可以發(fā)生翻譯之前,所述靶RNA在細胞核中被降解。雖然RNAi介導(dǎo)的基因表達的降低可以傳遞至下一代,但可遺傳性差,在更遠的后代期間該效應(yīng)迅速喪失。這可能是由于dsRNA庫的持續(xù)減少。我們在這里提出一種方法,來構(gòu)建具有永久性的、可遺傳的RNAi表型的C.elegans系。該方法包括通過將含有義方向和反義方向靶基因cDNA片段的質(zhì)粒引入并置于蠕蟲啟動子的控制之下,或通過從單一構(gòu)成物轉(zhuǎn)錄反向重復(fù)的所述cDNA,產(chǎn)生轉(zhuǎn)基因C.elegans系?;蛘?,可以在表達T7聚合酶的C.elegans株系中,從含有鄰接兩個T7啟動子的cDNA的載體轉(zhuǎn)錄dsRNA。結(jié)果是具有可遺傳的穩(wěn)定的“假失效”表型的轉(zhuǎn)基因蠕蟲。所述cDNA或T7聚合酶的表達可以是普遍型的和組成型的,但也可以在組織特異性啟動子下而被調(diào)節(jié)。與通過外來ds RNAi(注射的、浸泡的或飼喂的)誘導(dǎo)的RNAi對比,該方法使人們能夠獲得基因表達的有條件的、組織特異性抑制。
通過RNA干擾抑制unc-22表達導(dǎo)致“痙攣(twicthing)”表型將uno 22cDNA(外顯子22)以有義和反義方向克隆到pPD103.05中。(A.Fire nr L2865)含有能夠在所有組織中表達RNA序列的let 858啟動子。將所得的質(zhì)粒命名為pGN205(圖19a)和pGN207(圖19b)。將這些構(gòu)成物與一種選擇標(biāo)記(rol-6;GFP)一起引入到C.elegans中。轉(zhuǎn)基因F1個體(表達rol-6或GFP)表現(xiàn)出“痙攣”表型,表明RNAi可以通過從轉(zhuǎn)基因DNA內(nèi)源轉(zhuǎn)錄的RNA來介導(dǎo)。RNAi表型與所述選擇標(biāo)記共分離到更遠的后代。這導(dǎo)致具有永久性RNAi表型的C.elegans系的產(chǎn)生。
穩(wěn)定系T7 RNA聚合酶系的產(chǎn)生和雙轉(zhuǎn)基因蠕蟲的產(chǎn)生在C.elegans中基于外源RNA聚合酶的一種表達系統(tǒng)要求兩種質(zhì)粒。一種質(zhì)粒編碼在特異性啟動子控制之下的RNA聚合酶,而另一種質(zhì)粒編碼在T7啟動子調(diào)節(jié)下表達的DNA片段。對于也稱為假穩(wěn)定失效的半穩(wěn)定RNAi而言,將目的DNA克隆到兩個T7啟動子之間,使得可以產(chǎn)生dsRNA。
因為已知T7 RNA聚合酶表達系統(tǒng)是一種高效表達系統(tǒng),所以這將導(dǎo)致產(chǎn)生雙轉(zhuǎn)基因動物的問題。如果要在C.elegans線蟲中表達的基因有毒性,則這將導(dǎo)致致死效應(yīng),并因此導(dǎo)致在構(gòu)建出的C.elegans中沒有目的基因的高度調(diào)節(jié)的穩(wěn)定表達。如果目的基因?qū)τ谒錾锏纳媸潜夭豢缮俚?,則具有得自該基因的DNA片段的RNAi也將導(dǎo)致致死效應(yīng),使得不可能假穩(wěn)定失效。
為了解決這一問題,本發(fā)明人已經(jīng)設(shè)計出一種由兩種轉(zhuǎn)基因動物組成的系統(tǒng)。第一種動物為T7 RNA聚合酶的轉(zhuǎn)基因動物,正如前述實施例中所表明的,這種T7 RNA聚合酶可以在所有細胞或特定細胞或組織中表達。第二種轉(zhuǎn)基因動物是目的DNA片段的轉(zhuǎn)基因動物。這可以是連接于T7啟動子的基因或cDNA,或者如果人們想要進行RNAi,則它可以是克隆在兩個T7啟動子之間的這樣的基因的DNA片段。
這兩種轉(zhuǎn)基因動物均是活的,并且不表現(xiàn)出任何異常表型。這是因為在第一種轉(zhuǎn)基因生物中表達的T7 RNA聚合酶即使以相對高水平表達,也對該生物無毒性。在第二種轉(zhuǎn)基因生物中,不表達目的基因,或者不產(chǎn)生所述dsRNA,因為這些轉(zhuǎn)基因動物不含有T7 RNA聚合酶。
通過讓這兩種轉(zhuǎn)基因動物交配,可以獲得目的基因或目的cDNA的表達、或具有DNA片段的RNAi。這些轉(zhuǎn)基因動物的后代是雙轉(zhuǎn)基因動物,并且表達目的基因,或表達目的DNA片段的dsRNA。為了在這種交配中產(chǎn)生足夠的雄性動物,其中一種所述轉(zhuǎn)基因雄性動物可以是具有適于產(chǎn)生雄性的表型的C.elegans突變體。這樣一種突變體的實例是him-5。將優(yōu)選用這樣一種突變體來產(chǎn)生T7 RNA聚合酶的轉(zhuǎn)基因C.elegans,而雌雄同體動物含有在T7啟動子調(diào)節(jié)下的所述DNA片段。
為了有效選擇所述雙轉(zhuǎn)基因后代,可以將一種第二轉(zhuǎn)基因引入到所述第二種轉(zhuǎn)基因動物中。這種轉(zhuǎn)基因含有一個在T7啟動子調(diào)節(jié)下的報道基因。所述報道基因可以是GFP、熒光素酶、β半乳糖苷酶或β-內(nèi)酰胺酶。這種轉(zhuǎn)基因的實例是載體pGB400和pGN401。
為了在C.elegans中獲得轉(zhuǎn)基因的可誘導(dǎo)的組織特異性表達,我們可以產(chǎn)生這樣的雄性原種(即him-5)所述雄性原種(即him-5)攜帶使得能夠進行例如組織特異性表達的不同C.elegans啟動子控制下的T7聚合酶構(gòu)成物??梢允惯@種雄性動物與攜帶在T7啟動子控制下的目的基因的雌雄同體交雜。
此外,可以將所述轉(zhuǎn)基因整合到動物的基因組中。已經(jīng)描述了導(dǎo)致質(zhì)粒穩(wěn)定地整合到動物基因組中的方法(Methods in cell biology,第48卷,1995,epstein和Shakes編輯,Academic Press),所述方法涉及對所述動物輻照??梢詫煞N動物輻照,但優(yōu)選對表達T7 RNA聚合酶的動物進行這種處理。這產(chǎn)生一群在不同啟動子控制下穩(wěn)定表達T7RNA聚合酶的C.elegans線蟲,這樣的啟動子的實例是myo-2(咽表達)、myo-3(體壁肌)、dgl-15(陰戶肌)、unc-119(全身神經(jīng)元)、SERCA(肌肉)、let858(所有細胞)、ges-1(腸)。
RNAi T7啟動子酵母雙雜種載體的構(gòu)建具有正向和反向T7T3和或Sp6的pGAD424在大多數(shù)雙雜種實驗中,用已經(jīng)進行工程改造的、在多接頭中具有額外限制位點(諸如Ncol位點)的質(zhì)粒pGAD424(圖16)(Clontech),克隆一個cDNA文庫。該文庫便于在酵母雙雜種實驗中篩選結(jié)合蛋白。我們構(gòu)建了一種新的酵母雙雜種載體,該載體具有完成酵母雙雜種的同樣的可能性,但它含有兩個額外的T7啟動子,使得該載體可以用于T7 RNA聚合酶誘導(dǎo)的假穩(wěn)定失效。為此,通過用一個T7接頭(由以下引物aattcttaatacgactcactatagggcc和catgggccctatagtgagtcgtattaag構(gòu)成),我們將一個正向T7插入pGAD424的EcoRI-NcoI位點中。我們將所得的載體命名為pGAD424-without-FULL-ICE-both-T7。小心地去除終止密碼子并使用最大多接頭可匹配的氨基酸。對于反向T7(由兩種引物gatccgtcgacagatctccctatagtgagtcgtattactgca和gtaatacgactcactatagggagatctgtcgacg構(gòu)成),我們采用同一策略并使用BamHl和Patl。為了避免喪失SalI,我們在所述引物中包括了這一位點。
所述SalI位點是重要的,因為大多數(shù)文庫均在該位點克隆,連接物也買得到。這使得新構(gòu)建的載體與現(xiàn)有的載體相容。
具有正向和反向T7/T3和或Sp6的pAS2基于pAS2(Clontech)構(gòu)建了一種類似的酵母雙雜種載體。通過用EcoRV部分消化,我們能夠去除cyh2基因相當(dāng)大的部分。可以分離出正確的構(gòu)成物,并通過用BglII限制消化進行檢查,該位點存在于被去除的PAS2的EcoRV片段中。這消除了略有毒性并涉及生長延遲的cyh2基因。該基因?qū)τ谶M行RNAi和酵母雙雜種實驗不是必不可少的。在消除EcoR片段后,位于編碼GAL4DB和HA(表位)的DNA序列之間的EcoRI限制位點成為該載體唯一的EcoRI限制位點,可以用來用含接頭的T7啟動子取代HA。這確保所有的限制位點存留,允許既符合讀框地克隆,也與先前的載體和pAD424相容。我們使用了以下接頭(引物aattcttaatacgactcactatagggca和tatgccctatagtgagtcgtattaag),使用EcoRI和NdeI克隆位點。我們采用同一策略用于反向T7(引物gatccgtcgacagatctccctatagtgagtcgtattactgcacatgggccctatagtgagtcgtattaag和gtaatacgactcactatagggagatctgtcgacg),使用BamH1和Pst1。為了避免喪失Sal1,我們在所述引物中包括了該位點。將所得的載體命名為pAS2-cyh2-HA+both T7-final。
在PGAD424中具有T7啟動子(或者T3,或SP6啟動子),使得可以很快地從相互作用蛋白轉(zhuǎn)變至RNAi,并將功能確定至所分離的DNA片段。另一優(yōu)點是具有這樣一種能力,即能夠通過與體外翻譯偶聯(lián)的體外轉(zhuǎn)錄(有一個ATG或者GAL4DB或者GAL4AD的讀框符合),制備可以用于體外控制(例如摧毀(pull down)測定)實際蛋白-蛋白相互作用的標(biāo)記蛋白。
在以下提供的序列表中確定了所產(chǎn)生的質(zhì)粒序列和SP6和T3聚合酶的序列。
SP6DNA依賴性RNA聚合酶 SEQENCE ID NO.1swissprot登錄號P06221蛋白序列1 mqdlhaiqlq leeemfnggi rrfeadqqrq iaagsesdta wnrrllseli apmaegiqay61 keeyegkkgr apralaflqc venevaayit mkvvmdmlnt datlgaiams vaeriedqvr121 fskleghaak yfekvkkslk asrtksyrha hnvavvaeks vaekdadfdr weawpketql181 gigttlleil egsvfyngep vfmramrtyg gktiyylqts esvggwisaf kehvaqlspa241 yapcvipprp wrtpfnggfh tekvasrirl vkgnrehvrk ltgkgmpkvy kainalqntq301 wginkdvlav ieevirldlg ygvpsfkpli dkenkpanpv pvefghlrgr elkemlspeq361 wqqfinwkge carlytaetk rgsksaavvr mvggarkysa fesiyfvyam dsrsrvyvqs421 stlspqsndl gkallrfteg rpvngvealk wfcinganlw gwdkktfdvr vsnvldeefg481 dmcrdiaadp ltftgwakad apyeflawcf eyaqyldlvd egradefrth lpvhgdgscs541 giqhysamlr devgakavnl kpsdapqdiy gavaqvvikk nalymdadda ttftsgsvtl601 sgtelramas awdsigitrs ltkkpvmtlp ygstrltcre svidyivdle ekeaqkavae661 gttankvhpf eddrqdyltp gaaynymtal iwpsisevvk apivamkmir qlarfaakrn721 eglmytlptg fileqkimat emlrvrtclm gdikmslqve tdivdeaamm gaaapnfvhg781 hdashliltv celvdkgvts iavihdsfgt hadntltlrv alkgqmvamy idgnalqkll841 eehevrwmvd tgievpeqge fdlneimdse yvfaT3DNA依賴性RNA聚合酶 SEQENCE ID NO.2swissprot登錄號P07659蛋白序列1 mniieniekn dfseielaai pfntladhyg salakeqlal ehesyelger rflkmlerga61 kageiadnaa akpllatllp klttrivewl eeyaskkgrk psayaplqll kpeasafitl121 kvilasltst nmttigaaag mlgkaiedea rfgrirdlea khfkkhveeq lnkrhggvyk181 kafmqvvead migrgllgge awsswdkett mhvgirliem liestglvel qrhnagnags241 dhealglaqe yvdvlakrag alagispmfg pcvvppkpwv aitgggywan grrplalvrt301 hskkglmrye dvympevyka vnlaqntawk inkkvlavvn eivnwkncpv adipslerqe361 lppkpddidt neaalkewkk aaagiyrldk arvsrrisle fmleqankfa skkaiwfpyn421 mdwrgrvyav pmfnpqgncm tkglltlakg kpigeegfyw lkihgancag vdkvpfperi481 afiekhvddi lacakdpinn twwaegdspf cflafcfeya gvthhglsyn cslplafdgs541 csgiqhfsam lrdevggrav nllpsetvqd iygivaqkvn eilkqdaing tpnemitvtd601 kdtgeisekl klgtstlaqg wlaygvtrsv tkrsvmtlay gskefgfrgg vlddtiqpai661 dsgkglmftg pngaagymak liwdavsvtv vaaveamnwl ksaakllaae vkdkktkeil721 rhrcavhwtt pdgfpvwqey rkplqkrldm iflgqfrlqp tintlkdsgi dahkqesgia781 pnfvhsqdgs hlrmtvvyah ekygiesfal ihdsfgtipa dagklfkavr etmvityenn841 dvladfysqf adqlhetqld kmpplpkkgn lnlqdilksd fafa
pGN108SEQUENCE ID NO.3gttgtcgtaaagagatgtttttattttactttacaccgggtcctctctctctgccagcacagctcagtgttggctgtgtgctcgggctcctgccaccggcggcctcatcttcttcttcttcttctctcctgctctcgcttatcacttcttcattcattcttattccttttcatcatcaaactagcattttcttactttatttatttttttcaattttcaattttcagataaaaccaaactacttgggttacagccgtcaacagatccccgggattggccaaaggacccaaaggtatgtttcgaatgatactaacataacatagaacattttcaggaggacccttgcttggagggtaccggatgactgctccaaagaagaagcgtaagctcatgaacacgattaacatcgctaagaacgacttctctgacatcgaactggctgctacccgttcaacactctggctgaccattacggtgagcgtttagctcgcgaacagttggcccttgagcatgagtcttacgagatgggtgaagcacgcttccgcaagatgtttgagcgtcaacttaaagctggtgaggttgcggataacgctgccgccaagcctctcatcactaccctactccctaagatgattgcacgcatcaacgactggtttgaggaagtgaaagctaagcgcggcaagcgcccgacagccttccagttcctgcaagaaatcaagccggaagccgtagcgtacatcaccattaagaccactctggcttgcctaaccagtgctgacaatacaaccgttcaggctgtagcaagcgcaatcggtcgggccattgaggacgaggctcgcttcggtcgtatccgtgaccttgaagctaagcacttcaagaaaaacgttgaggaacaactcaacaagcgcgtagggcacgtctacaagaaagcatttatgcaagttgtcgaggctgacatgctctctaagggtctactcggtggcgaggcgtggtcttcgtggcataaggaagactctattcatgtaggagtacgctgcatcgagatgctcattgagtcaaccggaatggttagcttacaccgccaaaatgctggcgtagtaggtcaagactctgagactatcgaactcgcacctgaatacgctgaggctatcgcaacccgtgcaggtgcgctggctggcatctctccgatgttccaaccttgcgtagttcctcctaagccgtggactggcattactggtggtggctattgggctaacggtcgtcgtcctctggcgctggtgcgtactcacagtaagaaagcactgatgcgctacgaagacgtttacatgcctgaggtgtacaaagcgattaacattgcgcaaaacaccgcatggaaaatcaacaagaaagtcctagcggtcgccaacgtaatcaccaagtggaagcattgtccggtcgaggacatccctgcgattgagcgtgaagaactcccgatgaaaccggaagacatcgacatgaatcctgaggctctcaccgcgtggaaacgtgctgccgctgctgtgaccgcaagacaaggctcgcaagtctcgccgtatcagccttgagttcatgcttgagcaagccaataagtttgctaaccataaggccatctggttcccttacaacatggactggcgcggttcgtgtttacgctgtgtcaatgttcaacccgcaaggtaacgatatgaccaaaggacgtcttacgctggcgaaaggtaaaccaatcggtaaggaaggttactactggctgaaaatccacggtgcaaactgtgcgggtgtcgataaggtttcgtttcctgagcgcatcaagttcattgaggaaaaccacgagaacatcatggcttgcgctaagtctccactggagaacacttggtgggctgagcaagattctccgttctgcttccttgcgttctgctttgagtacgctggggtacagcaccacggcctgagctataactgctcccttccgctggcgtttgacgggtcttgctctggcatccagcacttctccgcgatgctccgagatgaggtaggtggtcgcgcggttaacttgcttcctagtgaaaccgttcaggacatctacgggattgttgctaagaaagtcaacgagattctgcaagcagacgcaatcaatgggaccgataacgaagtagttaccgtgaccgatgagaacactggtgaaatctctgagaaagtcaagctgggcactaaggcactggctggtcaatggctggcttacggtgttactcgcagtgtgactaagcgttcagtcatgacgctggcttacgggtccaaagattcggcttccgtcaacaagtgctggaagataccattcagccagctattgattccggcaagggtctgatgttcactcagccgaatcaggctgctggatacatggctaagctgatttgggaatccgtgagcgtgacggtggtagctgcggttgaagcaatgaactggcttaagtctgctgctaagctgctggctgctgaggtcaaagataagaagactggagagattcttcgcaagcgttgcgctgtgcattgggtaactcctgatggtttccctgtgtggcaggaatacaagaagcctattcagacgcgcttgaacctgatgttcctcggtcagttccgcttacagcctaccattaacaccaacaaagatagcgagattgatgcacacaaacaggagtctggtatcgctcctaactttgtacacagccaagacggtagccaccttcgtaagactgtagtgtgggcacacgagaagtacggaatcgaatcttttgcactgattcacgactccttcggtaccattccggctgacgctgcgaacctgttcaaagcagtgcgcgaaactatggttgacacatatgagtcttgtgatgtactggctgatttctacgaccagttcgctgaccagttgcacgagtctcaattggacaaaatgccagcacttccggctaaaggtaacttgaacctccgtgacatcttagagtcggacttcgcgttcgcgtaagggcccactagtcggccgtacgggccctttcgtctcgcgcgtttcggtgatgacggtgaaaacctctgacacatgcagctcccggagacggtcacagcttgtctgtaagcggatgccgggagcagacaagcccgtcagggcgcgtcagcgggtgttggcgggtgtcggggctggcttaactatgcggcatcagagcagattgtaactgagagtgcaccatatgcggtgtgaaataccgcacagatgcgtaaggagaaaataccgcatcaggcggccttaagggcctcgtgatacgcctatttttataggttaatgtcatgataataatggtttcttagacgtcaggtggcacttttcggggaaatgtgcgcggaacccctatttgtttatttttctaaatacattcaaatatgtatccgctcatgagacaataaccctgataaatgcttcaataatattgaaaaaggaagagtatgagtattcaacatttccgtgtcgcccttattcccttttttgcggcattttgccttcctgtttttgctcacccagaaacgctggtgaaagtaaaagatgctgaagatcagttgggtcacgagtgggttacatcgaactggatctcaacagcggtaagatccttgagagttttcgccccgaagaacggttttccaatgatgagcacttttaaagttctgctatgtggcgcggtattatcccgtattgacgccgggcaagagcaactcggtcgccgcatacactattctcagaatgacttggttgagtactcaccagtcacagaaaagcatcttacggatggcatgacagtaagagaattatgcagtgctgccataaccatgagtgataacactgcggccaacttacttctgacaacgatcggaggaccgaaggagctaaccgcttttttgcacaacatgggggatcatgtaactcgccttgatcgttgggaacccggagctgaatgaagccataccaaacgacgagcgtgacaccacgatgcctgtagcaatggcaacaacgttgcgcaaactattaactggcgaactacttactctagcttcccggcaacaattaatagactggatggaggcggataaaagttgcaggaccacttctgcgctcggcccttccggctggctggtttattgctgataaatctggagccggtgagcgtgggtctcgcggtatcattgcagcactggggccagatggtaagccctcccgtatcgtagttatctacacgacggggagtcaggcaactatggatgaacgaaatagacagatcgctgagataggtgcctcactgattaagcattggtaactgtcagaccaagtttactcatatatactttagattgatttaaaacttcatttttaatttaaaaggatctaggtgaagatcctttttgataatctcatgaccaaaatcccttaacgtgagttttcgttccactgagcgtcagaccccgtagaaaagatcaaaggatcttcttgagatcctttttttctgcgcgtaatctgctgcttgcaaacaaaaaaaccaccgctaccagcggtggtttgtttgccggatcaagagctaccaactctttttccgaaggtaactggcttcagcaacgcagataccaaatactgtccttctagtgtagccgtagttaggccaccacttcaagaactctgtagcaccgcctacatacctcgctctgctaatcctgttaccagtggctgctgccagtggcgataagtcgtgtcttaccgggttggactcaagacgatagttaccggataaggcgcagcggtcgggctgaacggggggttcgtgcacacagcccagcttggagcgaacgacctacaccgaactgagatacctacagcgtgagcattgagaaagcgccacgcttcccgaagggagaaaggcggacaggtatccggtaaagcggcagggtcggaacaggagagcgcacgagggagcttccagggggaaacgcctggtatctttaugtcctgtcgggtttcgccacctctgacttgagcgtcgatttttgtgatgctcgtcaggggggcggagcctatggaaaaacgccagcaacgcggcctttttacggttcctggccttttgctggccttttgctcacatgttctttcctgcgttatcccctgattctgtggataaccgtattaccgcctttgagtgagctgataccgctcgccgcagccgaacgaccgagcgcagcgagtcagtgagcgaggaagcggaagagcgcccaatacgcaaaccgcctctccccgcgcgttggccgattcattaatgcagctggcacgacaggtttcccgactggaaagcgggcagtgagcgcaacgcaattaatgtgagttagctcactcattaggcaccccaggctttacactttatgcttccggctcgtatgttgtgtggaattgtgagcggataacaatttcacacaggaaacagctatgaccatgattacgccaagctgtaagtttaaacatgatcttactaactaactattctcatttaaattttcagagcttaaaaatggctgaaatcactcacaacgatggatacgctaacaacttggaaatgaaataagcttgcatgcctgcagagcaaaaaaatactgcttttccttgcaaaattcggtgctttcttcaaagagaaacttttgaagtcggcgcgagcat
ttccttctttgacttctctctttccgccaaaaagcctagcatttttattgataatttgattacacacactcagagttcttcgacatgataaagtgtttcattggcactcgccctaacagtacatgacaagggcggattattatcgatcgatattgaagacaaactccaaatgtgtgctcattttggagccccgtgtggggcagctgctctcaatatattactagggagacgaggagggggaccttatcgaacgtcgcatgagccattctttcttctttatgcactctcttcactctctcacacattaatcgattcatagactcccatattccttgatgaaggtgtgggtttttagctttttttcccgatttgtaaaaggaagaggctgacgatgttaggaaaaagagaacggagccgaaaaaacatccgtagtaagtcttccttttaagccgacactttttagacagcattcgccgctagttttgaagtttaaattttaaaaaataaaaattagtttcaatttttttaattactaaataggcaaaagttttttcaagaactctagaaaaactagcttaattcatgggtactagaaaaattcttgttttaaatttaatatttatcttaagatgtaattacgagaagcttttttgaaaattctcaattaaaagaatttgccgatttagaataaaagtcttcagaaatgagtaaaagctcaaattagaagtttgtttttaaaggaaaaacacgaaaaaagaacactatttatcttttcctccccgcgtaaaattagttgttgtgataatagtgatccgctgtctatttgcactcggctcttcacaccgtgcttccgtcacttgacccaacaggaaaaaaaaacatcacgtctgagacggtgaattgccttatcaagagcgtcgtctctttcacccagtaacaaaaaaaatttggtttctttactttatatttatgtaggtcacaaaaaaaagtgatgcagttttgtgggtcggttgtctccacaccacctccgcctccagcagcacacaatcatcttcgtgtgttctcgacgattccttgtatgccgcggtcgtgaatgcaccacattcgacgcgcaactacacaccacactcactttcggtggtattactacacgtcatcgttgttcgtagtctcccgctctttcgtccccactcactcctcattattccccttggtgtattgattttttttaaatggtacaccactcctgacgtttctaccttcttgttttccgtccatttagattttatctggaaatttttttaaaattttaggccagagagttctagttcttgttctaaaagctaggtcagacatacattttctatttctcatcaaaaaaaaagttgataaagaaaactggttattcagaaagagtgtgtctcgttgaaattgattcaaaaaaaaattcccacccctcgcttgtttctcaaaatatgagatcaacggattttttccttctcgattcaattttttgctgcgcttgtctgccaaagtgtgtgtgtccgagtaaagatgagagaatttacaaacagaaatgaaaaaaagttggccaaataatgaagttttatccgagattgatgggaaagatattaatgttctttacggtttggaggggagagagagatagattttcgcatcaaactccgccttttacatgtcttttagaatctaaaatagatttttctcatcatttttaatagaaaatcgagaaattacagtaatttcgcaattttcttgccaaaaatacacgaaatttgtgggtctcgccacgatctcggtcttagtggttcatttggtttaaaagtttataaaatttcaattctagtgtttaatttccgcataattggacctaaatgggtttttgtcatcattttcaacaagaaatcgtgaaaatctgttgtttcgcaattttcttttcaaaaatacacgaaatatatggtaatttcccgaaatattgagggtctcgccacgatttcagtcacagtggccaggatttatcacgaaaaaagttcgcctagtctcacatttccggaaaaaccgaatctaaattagttttttgtcatcattttgaacaaaaaatcgagacatccctatagtttcgcaattttcgtcgcttttctctccaaaaatgacagtctagaattaaaattcgctggaactgggaccatgatatcttttctccccgtttttcattttattttttattacactggattgactaaaggtcaccaccaccgccagtgtgtgccatatcacacacacacacaccacacaatgtcgagattttatgtgttatccctgcttgattttcgttccgttgtctctctctctctattcatcttttgagccgagaagctccagagaatggagcacacaggatcccggcgcgcgatgtcgtcgggagatggcgccgcctgggaagccgccgagagatatcagggaagatcgtctgatttctcctcggatgccacctcatctctcgagtttctccgcctgttactccctgccgaacctgatatttccc
pGN105SEQUENCE ID NO.4aagcttgcatgcctgcaggccttggtcgactctagacacttttcagctacctagatacatggatatccccgcctcccaatccacccacccagggaaaaagaagggctcgccgaaaaatcaaagttatctccaggctcgcgcatcccaccgagcggttgacttctctccaccacttttcattttaaccctcggggtacgggattggccaaaggacccaaaggtatgtttcgaatgatactaacataacatagaacattttcaggaggacccttgcttggagggtaccgagctcagaaaaaatgactgctccaaagaagaagcgtaaggtaccggtaatgaacacgattaacatcgctaagaacgacttctctgacatcgaactggctgctatcccgttcaacactctggctgaccattacggtgagcgtttagctcgcgaacagttggcccttgagcatgagtcttacgagatgggtgaagcacgcttccgcaagatgtttgagcgtcaacttaaagctggtgaggttgcggataacgctgccgccaagcctctcatcactaccctactccctaagatgattgcacgcatcaacgactggtttgaggaagtgaaagctaagcgcggcaagcgcccgacagccttccagttcctgcaagaaatcaagccggaagccgtagcgtacatcaccattaagaccactctggcttgcctaaccagtgctgacaatacaaccgttcaggctgtagcaagcgcaatcggtcgggccattgaggacgaggctcgcttcggtcgtatccgtgaccttgaagctaagcacttcaagaaaaacgttgaggaacaactcaacaagcgcgtagggcacgtctacaagaaagcatttatgcaagttgtcgaggctgacatgctctctaagggtctactcggtggcgaggcgtggtcttcgtggcataaggaagactctattcatgtaggagtacgctgcatcgagatgctcattgagtcaaccggaatggttagcttacaccgccaaaatgctggcgtagtaggtcaagactctgagactatcgaactcgcacctgatacgctgaggctatcgcaacccgtgcaggtgcgctggctggcatctctccgatgttccaaccttgcgtagttcctcctaagccgtggactggcattactggtggtggctattgggctaacggtcgtcgtcctctggcgctggtgcgtactcacagtaagaaagcactgatgcgctacgaagacgtttacatgcctgaggtgtacaaagcgattaacattgcgcaaaacaccgcatggaaaatcaacaagaaagtcctagcggtcgccaacgtaatcaccaagtggaagcattgtccggtcgaggacatccctgcgattgagcgtgaagaactcccgatgaaaccggaagacatcgacatgaatcctgaggctctcaccgcgtggaaacgtgctgccgctgctgtgtaccgcaaggacagggctcgcaagtctcgccgtatcagccttgagttcatgcttgagcaagccaataagtttgctaaccataaaggccatctggttcccttacaacatggactggcgcggtcgtgtttacgccgtgtcaatgttcaacccgcaaggtaacgatatgaccaaaggactgcttacgctggcgaaaggtaaaccaatcggtaaggaaggttactactggctgaaaatccacggtgcaaactgtgcgggtgtcgataaggttccgttccctgagcgcatcaagttcattgaggaaaaccacgagaacatcatggcttgcgctaagtctccactggagaacacttggtgggctgagcaagattctccgttctgcttccttgcgttctgctttgagtacgctggggacagcaccacggcctgagctataactgctcccttccgctggcgtttgacgggtcttgctctggcatccagcacttctccgcgatgctccgagatgaggtaggtggtcgcgcggttaacttgcttcctagtgagaccgttcaggacatctacgggattgttgctaagaaagtcaacgagattctacaagcagacgcaatccaatgggaccgataacgaagtagttaccgtgaccgatgagaacactggtgaaatctctgagaaagtcaagctgggcactaaggcactggctggtcaatggctggctcacggtgttactcgcagtgtgactaagcgttcagtcatgacgctggcttacgggtccaaagagttcggcttccgtcaacaagtgctggaagataccattcagccagctattgattccggcaagggtccgatgttcactcagccgaatcaggctgctggatacatggctaagctgatttgggaatctgtgagcgtgacggtggtagctgcggttgaagcaatgaactggcttaagtctgctgctaagctgctggctgctgaggtcaaagataagaagactggagagattcttcgcaagcgttgcgctgtgcattgggtaactcctgatggtttccctgtgtggcaggaatacaagaagcctattcagacgcgcttgaacctgatgttcctcggtcagttccgcttacagcctaccattaacaccaacaaagatagcgagattgatgcacacaaacaggagtctggtatcgctcctaactttgtacacagccaagacggtagccaccttcgtaagactgtagtgtgggcacacgagaagtacggaatcgaatcttttgcactgattcacgactccttcggtaccattccggctgacgctgcgaacctgttcaaagcagtgcgcgaaactatggttgacacatatgagtcttgtgatgtactggctgattctacgaccagttcgctgaccagttgcacgagtctcaattggacaaaatgccagcacttccggctaaaggtaacttgaacctccgtgacatcttagagtcggacttcgcgttcgcgtaagaattccaactgagcgccggtcgctaccattaccaacttgtctggtgtcaaaaataataggggccgctgtcatcagagtaagtttaaactgagttctactaactaacgagtaatatttaaattttcagcatctcgcgcccgtgcctctgacttctaagtccaattactcttcaaacatccctacatgctctttctccctgtgctcccaccccctatttttgttattatcaaaaaaacttcttcttaatttctttgttttttagcttcttttaagtcacctctaacaatgaaattgtgtagattcaaaaatagaattaattcgtaataaaaagtcgaaaaaaattgtgctccctccccccattaataataattctatcccaaaatctacacaatgttctgtgtacacttcttatgttttttttacttctgataaattttttttgaaacatcatagaaaaaaccgcacacaaaataccttatcatatgttacgtttcagtttatgaccgcaatttttatttcttcgcacgtctgggcctctcatgacgtcaaatcatgctcatcgtgaaaaagttttggagtatttttggaatttttcaatcaagtgaaagtttatgaaattaattttcctgcttttgctttttgggggtttcccctattgtttgtcaagagtttcgaggacggcgtttttcttgctaaaatcacaagtattgatgagcacgatgcaagaaagatcggaagaaggtttgggtttgaggctcagtggaaggtgagtagaagttgataatttgaaagtggagtagtgtctatggggtttttgccttaaatgacagaatacattcccaatataccaaacataactgtttcctactagtcggccgtacgggccctttcgtctcgcgcgtttcggtgatgacggtgaaaacctctgacacatgcagctcccggagacggtcacagcttgtctgtaagcggatgccgggagcagacaagcccgtcagggcgcgtcagcgggtgttggcgggtgtcggggctggcttaactatgcggcatcagagcagattgtactgagagtgcaccatatgcggtgtgaaataccgcacagatgcgtaaggagaaaataccgcatcaggcggccttaagggcctcgtgatacgcctatttttataggttaatgtcatgataataatggtttcttagacgtcaggtggcacttttcggggaaatgtgcgcggaacccctatttgtttatttttctaaatacattcaaatatgtatccgctcatgagacaataaccctgataaatgcttcaataatattgaaaaaggaagagtatgagtattcaacatttccgtgtcgcccttattcccttttttgcggcattttgccttcctgtttttgctcacccagaaacgctggtgaaagtaaaagatgctgaagatcagttgggtgcacgagtgggttacatcgaactggatctcaacagcggtaagatccttgagaggttcgccccgaagaacgttttccaatgatgagcacttttaaagttctgctatgtggcgcggtattatcccgtattgacgccgggcaagagcaactcggtcgccgcatacactattctcagaatgacttggttgagtactcaccagtcacagaaaagcatcttacggatggcatgacagtaagagaattatgcagtgctgccataaccatgagtgataacactgcggccaacttacttctgacaacgatcggaggaccgaaggagctaaccgcttttttgcacaacatgggggatcatgtaactcgccttgatcgttgggaaccggagctgaatgaagccataccaaacgacgagcgtgacaccacgatgcctgtagcaatggcaacaactttgcgcaaactattaactggcgaactacttactctagcttcccggcaacaattaatagaactggatggaggcggataaaagttgcaggaccacttctgcgctcggcccttccggctggctggtttattgctgataaatctggagccggtgagcgtgggtctcgcggtatcattgcagcactggggccagatggtaagccctcccgtatcgtagttatctacacgacggggagtcaggcaactatggatgaacgaaatagacagatcgctgagataggtgcctcactgattaagcattggtaactgtcagaccaagtttactcatatatactttagattgatttaaaacttcatttttaatttaaaaggatctaggtgaagatcctttttgataatctcatgaccaaaatcccttaacgtgagttttcgttccactgagcgtcagaccccgtagaaaagatcaaaggatcttcttgagatcctttttttctgcgcgtaatctgctgcttgcaaacaaaaaaccaccgctaccagcggtggtttgtttgccggatcaagagctaccaactctttttccgaaggtaactggcttcagcagagcgcagataccaaatactgtccttctagtgtagccgtagttaggccaccacttcaagaactctgtagcaccgcctacatacctcgctctgctaatcctgttaccagtggctgctgccagtggcgataagtcgtgtcttaccgggttggactcaagacgatagttaccggataaggcgcagcggtcgggctgaacggggggttcg
tgcacacagcccagcttggagcgaacgacctacaccgaactgagatacctacagcgtgagcattgagaaagcgccacgcttcccgaagggagaaaggcggacaggtatccggtaagcggcagggtcggaacaggagagcgcacgagggagcttccagggggaaacgcctggtatctttatagtcctgtcgggtttcgccacctctgacttgagcgtcgatttttgtgatgctcgtcaggggggcggagcctatggaaaaacgccagcaacgcggcctttttacggttcctggccttttgctggccttttgctcacatgttctttcctgcgttatcccctgattctgtggataaccgtattaccgcctttgagtgagctgataccgctcgccgcagccgaacgaccgagcgcagcgagtcagtgagcgaggaagcggaagagcgcccaatacgcaaaccgcctctccccgcgcgttggccgattcattaatgcagctggcacgacaggtttcccgactggaaagcgggcagtgaagcgcaacgcaattaatgtgagttagctcactcattaggcaccccaggctttacactttatgcttccggctcgtatgttgtgtggaattgtgagcggataacaatttcacacaggaaacagctatgaccatgattacgccaagctgtaagtttaaacatgatcttactaactaactattctcatttaaattttcagagcttaaaaatggctgaaatcactcacaacgatggatacgctaacaacttggaaatgaaat
pGN400SEQUENCE ID NO.5aagcttgcatgcctgcaggccttggtcgactctagacacttttcagctacctagatacatggatatccccgcctcccaatccacccacccagggaaaaagaagggctcgccgaaaaatcaaagttatctccaggctcgcgcatcccaccgagcggttgacttctctccaccacttttcattttaaccctcggggtacgggattggccaaaggacccaaaggtatgtttcgaatgatactaacataacatagaacattttcaggaggacccttgcttggagggtaccgagctcccgggattaatacgactcactataccggtagaaaaaatgagtaaaggagaagaacttttcactggagttgtcccaattcttgttgaattagatggtgatgttaatgggcacaaattttctgtcagtggagagggtgaaggtgatgcaacatacggaaaacttacccttaaatttatttgcactactggaaaactacctgttccatgggtaagtttaaacatatatatactaactaaccctgatttatttaaattttcagccaacacttgtcactactttctgttatggtgttcaatgcttctcgagatacccagatcatatgaaacggcatgactttttcaagagtgccatgcccgaaggttatgtacaggaaagaactatatttttcaaagatgacgggaactacaagacacgtaagtttaaacagttcggtactaactaaccatacatatttaaattttcaggtgctgaagtcaagtttgaaggtgatacccttgttaatagaatcgagttaaaaggtattgattttaaagaagatggaaacattcttggacacaaattggaatacaactataactcacacaatgtatacatcatggcagacaaacaaaagaatggaatcaaagttgtaagtttaaacatgattttactaactaactaatctgatttaaattttcagaacttcaaaattagacacaacattgaagatggaagcgttcaactagcagaccattatcaacaaaatactccaattggcgatggccctgtccttttaccagacaaccattacctgtccacacaatctgccctttcgaaagatcccaacgaaaagagagaccacatggtccttcttgagtttgtaacagctgctgggattacacatggcatggatgaactatacaaatagcattcgtagaattccaactgagcgccggtcgctaccattaccaacttgtctggtgtcaaaaataataggggccgctgtcatcagagtaagtttaaactgagttctactaactaacgagtaatatttaattttcagcatctcgcgcccgtgcctctgacttctaagtccaattactcttcaacatccctacatgctctttctccctgtgctcccaccccctatttttgttattatcaaaaaaacttcttcttaattttctttgttttttagcttcttttaagtcacctctaacaatgaaattgtgtagattcaaaaatagaattaattcgtaataaaaaagtcgaaaaaaattgtgctccctccccccattaataataattctatcccaaaatctacacaatgttctgtgtacacttcttatgttttttttacttctgataaattttttttgaaacatcatagaaaaaaccgcacacaaaataccttatcatatgttacgtttcagtttatgaccgcaatttttatttcttcgcacgtctgggcctctcatgacgtcaaatcatgctcatcgtgaaaaagttttggagtatttttggaatttttcaatcaagtgaaagtttatgaaattaattttcctgcttttgctttttgggggtttcccctattgtttgtcaagagtttcgaggacggcgtttttcttgctaaaatcacaagtattgatgagcacgatgcaagaaagatcggaagaaggtttgggtttgaggctcagtggaaggtgagtagaagttgataatttgaaagtggagtagtgtctatggggtttttgccttaaatgacagaatacattcccaatataccaaacataactgtttcctactagtcggccgtacgggccctttcgtctcgcgcgtttcggtgatgacggtgaaaacctctgacacatgcagctcccggagacggtcacagcttgtctgtaagcggatgccggaggcagacaagcccgtcagggcgcgtcagcgggtgttggcgggtgtcggggctggcttaactatgcggcatcagagcagattgtactgagagtgcaccatatgcggtgtgaaataccgcacagatgcgtaaggagaaaataccgcatcaggcggccttaagggcctcgtgatacgcctatttttataggttaatgtcatgataataatggtttcttagacgtcaggtggcacttttcggggaaatgtgcgcggaacccctatttgtttatttttctaaatacattcaaatatgtatccgctcatgagacaataaccctgataaaatgcttcaataaatattgaaaaaggaagagtatgagtattcaacatttccgtgtcgcccttattcccttttttgcggcgtttgccttcctgtttttgctcacccagaaacgctggtgaaagtaaaagatgctgaagatcagttgggtgcacgagtgggttacatcgaactggatctcaacagcggtaagatccttgagagttttcgccccgaagaacgttttccaatgatgagcacttttaaagttctgctatgtggcgcggtattatcccgtattgacgccgggcaagagcaactcggtcgccgcatacactattctcagaatgacttggttgagtactcaccagtcacagaaaagcatcttacggatggcatgacagtaagagaattatgcagtgctgccataaccatgagtgataacactgcggccaacttacttctgacaacgatcggaggaccgaaggagctaaccgcttttttgcacaacatgggggatcatgtaactcgccttgatcgttgggaaccggagctgaatgaagccataccaaacgacgagcgtgacaccacgatgcctgtagcaatggcaacaacgttgcgcaaactattaactggcgaactacttactctagcttcccggcaacaattaatagactggatggaggcggataaagttgcaggaccacttctgcgctcggcccttccggctggctggtttattgctgataaatctggagccggtgagcgtgggtctcgcggtatcattgcagcactggggccagatggtaagccctcccgtatcgtagttatctacacgacggggagtcaggcaactatggatgaacgaaaatagacagatcgctgagataggtgcctcactgattaagcattggtaactgtcagaccaagtttactcatatatactttagattgatttaaaacttcatttttaatttaaaaggatctaggtgaagatcctttttgataatctcatgaccaaaatcccttaacgtgagttttcgttccactgagcgtcagaccccgtagaaaagatcaaaggatcttcttgagatcctttttttctgcgcgtaatctgctgcttgcaaacaaaaaaaaccaccgctaccagcggtggtttgtttgccggatcaagagctaccaactctttttccgaaggtaactggcttcagcagagcgcagataccaaatactgtccttctagtgtagccgtagttaggccaccacttcaagaactctgtagcaccgcctacatacctcgctctgctaatcctgttaccagtggctgctgccagtggcgataagtcgtgtcttaccgggttggactcaagacgatagttaccggataaggcgcagcggtcgggctgaacggggggttcgtgcacacagcccagcttggagcgaacgacctacaccgaactgagatacctacagcgtgagcattgagaaagcgccacgcttcccgaagggagaaaggcggacaggtatccggtaagcggcagggtcggaacaggagagcgcacgagggagcttccagggggaaacgcctggtatctttatagtcctgtcgggtttcgccacctctgacttgagcgtcgatttttgtgatgctcgtcaggggggcggagcctatggaaaaacgccagcaacgcggcctttttacggttcctggccttttgctggccttttgctcacatgttctttcctgcgttatcccctgattctgtggataaccgtattaccgcctttgagtgagctgataccgctcgccgcagccgaacgaccgagcgcagcgagtcagtgagcgaggaagcggaagagcgcccaatacgcaaaccgcctctccccgcgcgttggccgattcattaatgcagctggcacgacaggtttcccgactggaaaagcgggcagtgagcgcaacgcaattaatgtgagttagctcactcattaggcaccccaggctttacactttatgcttccggctcgtatgttgtgtggaattgtgagcggataacaatttcacacaggaaacagctatgaccatgattacgccaagctgtaagtttaaacatgatcttactaactaactattctcatttaaattttcagagcttaaaaatggctgaaatcactcacaacgatggatacgctaacaacttggaaatgaaat
pGN401 SEQUENCE ID NO.6gatcccggcgcgcgatgtcgtcgggagatggcgccgcctgggaagccgccgagagatatcagggaagatcgtctgatttctcctcggatgccacctcatctctcgagtttctccgcctgttactccctgccgaacctgatatttcccgttgtcgtaaagagatgtttttattttactttacaccgggtcctctctctctgccagcacagctcaggttggctgtgtgctcgggctcctgccaccggcggcctcatcttcttcttcttcttctctcctgctctcgcttatcacttcttcattcattcttattccttttcatcatcaaactagcatttcttactttatttatttttttcaattttcaattttcagataaaaccaaactacttgggttacagccgtcaacagatccccgggattggccaaaggacccaaaggtatgtttcgaatgatactaacataacatagaacattttcaggaggacccttgcttggagggtaccggtagaaaaaatgagtaaaggagaagaacttttcactggagttgtcccaattcttgttgaattagatggtgatgttaatgggcacaaattttctgtcagtggagagggtgaaggtgatgcaacatacggaaaacttacccaaaatttatttgcactactggaaaactacctgttccatgggtaagtttaaacatatatatactaactaaccctgattatttaaattttcagccaacacttgtcactactttctgttatgggttcaatgcttctcgagatacccagatcatatgaaacggcatgactttttcaagagtgccatgcccgaaggttatgtacaggaaagaactatatttttcaaagatgacgggaactacaagacacgtaagtttaaacagttcggtactaactaaccatacatatttaaattttcaggtgctgaagtcaagtttgaaggtgatacccttgttaatagaatcgagttaaaaggtattgattttaaagaagatggaaacattcttggacacaaattggaatacaactataactcacacaatgtatacatcatggcagacaaacaaaagaatggaatcaaagttgtaagtttaaacttggacttactaactaacggattatatttaaattttcagaacttcaaaattagacacaacattgaagatggaagcgttcaactagcagaccattatcaacaaaatactccaattggcgatggccctgtccttttaccagacaaccattacctgtccacacaatctgccctttcgaaagatcccaacgaaaagagagaccacatggtccttcttgagtttgtaacagctgctgggattacacatggcatggatgaactatacaaatagcattcgtagaattccaactgagcgccggtcgctaccattaccaacttgtctggtgtcaaaaataataggggccgctgtcatcagagtaagtttaaactgagttctactaactaacgagtaatatttaaattttcagcatctcgcgcccgtgcctctgacttctaagtccaattactcttcaacatccctacatgctctttctccctgtgctcccaccccctatttttgttattatcaaaaaaacttcttcttaatttctttgttttttagcttcttttaagtcacctctaacaatgaaattgtgtagattcaaaaaatagaattaattcgtaataaaaagtcgaaaaaaattgtgctccctccccccattaataataattctatcccaaaatctacacaatgttctgtgtacacttcttatgttttttttacttctgataaattttttttgaaacatcatagaaaaaaccgcacacaaaataccttatcatatgttacgtttcagtttatgaccgcaatttttatttcttcgcacgtctgggcctctcatgacgtcaaatcatgccatcgtgaaaaagttttggagtatttttggaatttttcaatcaagtgaaagtttatgaaattaattttcctgcttttgctttttggggggtttcccctattgtttgtcaagagtttcgaggacggcgtttttcttgctaaaatcacaagtattgatgagcacgatgcaagaaagatcggaagaaggtttgggtttgaggctcagtggaaggtgagtagaagttgataatttgaaagtggagtalgtctatggggtttttgccttaaatgacagaatacattcccaatataccaaacataactgtttcctactagtcggccgtacgggcccggtacccagcttttgttccctttagtgagggttaattgcgcgcttggcgtaatcatggtcatagctgtttcctgtgtgaaattgttatccgctcacaattccaccaacatacgagccggaagcataaagtgtaaagcctggggtgcctaatgagtgagctaactcacattaattgcgttgcgctcactgcccgctttccagtcgggaaacctgtcgtgccagctgcattaatgaatcgttccaacgcgcggggagaggcggtttgcgtattgggcgctcttccgcttcctcgctcactgactcgctgcgctcggtcgttcggctgcggcgagcggtatcagctcactcaaaggcggtaatacggttatccacagaatcaggggataacgcaggaaagaacatgtgagcaaaaggccagcaaaaggccaggaaccgtaaaaaggccgcgttgctggcgtttttccataggctccgcccccctgacgagcatcacaaaaatcgacgctcaagtcagagtggcgaaacccgacaactataaagataccaggcgtttccccctggaagctccctcgtgcgctctcctgttccgaccctgccgcttaccggatacctgtccgcctttctcccttcgggaagcgtggcgctttctcatagctcacgctgtaggtatctcagttcggtgtaggtcgttcgctccaagctgggctgtgtgcacgaaaccccccgacagcccgaccgctgcgccttatccggtaactatcgtcttgagtccaacccggtaagacacgacttatcgccactggcagcagccactggtaacaggattagcagagcgaggtatgtaggcggtgctacagagttcttgaagtggtggcctaactacggctacactagaaggacagtatttggtatctgcgctctgctgaagccagttaccttcggaaaaagagttggtagctcttgatccggcaaacaaaccaccgctggtagcggtggtttttttgtttgcaagcagcagattacgcgcagaaaaaaaggatctcaagaagatcctttgatcttttctacggggtctgacgctcagtggaacgaaaactcacgttaagggattttggtcatgagattatcaaaaaggatcttcacctagatccttttaaattaaaatgaagttttaaatcaatctaaagtatatatgagtaaacttggtctgacagttaccaatgcttaatcagtgaggcacctatctcagcgatctgtctatttcgttcatccatagttgcctgactccccgtcgtgtagataactacgatacgggagggcttaccatctggccccagtgctgcaatgataccgcgaccccacgctcaccggctccagatttatcagcaataaaccagccagccggaagggccgagcgcagaagtggtcctgcaactttatccgcctccatccagtctattaattgttgccgggaagctagagtaagtagttcgccagttaatagtttgcgcaacgttgttgccattgctacaggcatcgtggtgtcacgctcgtcgtttggtatggcttcattcagctccggttcccaacgatcaaggcgagttacatgatcccccatgttgtgcaaaaaaagcggttagctccttcggtcctccgatcgttgtcagaagtaagttggccgcagtgttatcactcatggttatggcagcactgcataattctcttactgtcatgccatccgtaagatgcttttctgtgactggtgagtactcaaccaagtcattctgagaatagtgtatgcggcgaccgagttgctcttgcccggcgtcaatacgggataataccgcgccacatagcagaactttaaaagtgctcatcattggaaaacgttcttcggggcgaaaactctcaaggatctttaccgctgttgagatccagttcgatgtaacccactcgtgcacccaactgatcttcagcatcttttactttcaccagcgtttctgggtgagcaaaaacaggaaggcaaaatgccgcaaaaaagggaataagggcgacacggaaatgttgaatactcatactcttcctttttcaatattattgaagcatttatcagggttattgtctcatgagcggatacatatttgaatgtatttagaaaaataaacaaataggggttccgcgcacatttccccgaaaaagtgccacctaaattgtaagcgttaatattttgttaaaattcgcgttaaatttttgttaaatcagctcattttttaaccaataggccgaaatcggcaaaatcccttataaatcaaaagaatagaccgagatagggttgagtgttgttccagtttggaacaagagtccactattaaagaacgtggactccaacgtcaaagggcgaaaaaccgtctatcagggcgatggcccactacgtgaaccatcaccctaatcaagttttttggggtcgaggtgccgtaaagcactaaatcggaaccctaaagggagcccccgatttagagcttgacggggaaagccggcgaacgtggcgagaaaggaagggaagaaagcgaaaggagcgggcgctagggcgctggcaagtgtagcggtcacgctgcgcgtaaccaccacacccgccgcgcttaatgcgccgctacagggcgcgtcccattcgccattcaggctgcgcaactgttgggaagggcgatcggtgcgggcctctttcgctattacgccagctggcgaaagggggatgtgctgcaaggcgattaagttgggtaacgccagggttttcccagtcacgacgttgtaaaacgacggccagtgagcgcgcgtatacgactcactatagggcgaattggagctccaccgcggtggcggccgctctagaactagtg
pGN110SEQUENCE ID NO.7gatcctccaaaatcgtcttccgctctgaaaaacgaaagtggacctttgacatccgaaaaaatgggcgaaaaaatgaaattgagctttttgggtcgaaaaaagatgtttttagaatgctgagaacacgttaaacacgaagatcatatttattttgagacccggatgctctgaaaatgtctgacatagatttaaaaaagcatatatatatttttcattttcaacgtgaaagttttgtgcaactttatagaatctcctattggcacattgttttttatttaactgaggcagtttttgaacacctttttgaaactttgaatctctttgaagtatactgtcgaaaaagactgacttgagcgttcgaaatgccagaagaaaactatatttgaatctcgcgctaaattgagaaatgcaaccgcgctccactggacaattggaaaaaaaatttattcggaggcgacaacggtattttcgaaattgattttctgtgtattttctcattttttataaattcttctttgatttatcgttcgtttgtgagaaatttaattgtattcaaacttttttatagtaagataccggtggtaccgctagccgtacgaacccgggattggccaaaggacccaaaggtatgtttcgaatgatactaacataacatagaacattttcaggaggacccttgcttggagggtaccggatgactgctccaaagaagaagcgtaagctcatgaacacgattaacatcgctaagaacgacttctctgacatcgaactggctgctatcccgttcaacactctggctgaccattacggtgagcgtttagctcgcgaacagttggcccttgagcatgagtcttacgagatgggtgaagcacgcttccgcaagatgtttgagcgtcaacttaaagctggtgaggttgcggataacgctgccgccaagcctctcatcactaccctactccctaagatgattgcacgcatcaacgactggtttgaggaagtgaaagctaagcgcggcaagcgcccgacagccttccagttcctgcaagaaatcaagccggaagccgtagcgtacatcaccattaagaccactctggcttgcctaaccagtgctgacaatacaaccgttcaggctgtagcaagcgcaatcggtcgggccattgaggacgaggctcgcttcggtcgtatccgtgaccttgaagctaagcacttcaagaaaaacgttgaggaacaactcaacaagcgcgtagggcacgtctacaagaaagcatttatgcaagttgtcgaggctgacatgctctctaagggtctactcggtggcgaggcgtggtcttcgtggcataaggaagactctattcatgtaggagtacgctgcatcgagatgctcattgagtcaaccggaatggttagcttacaccgccaaaatgctggcgtagtaggtcaagactctgagactatcgaactcgcacctgaatacgctgaggctatcgcaacccgtgcaggtgcgctggctggcatctctccgatgttccaaccttgcgtagttcctcctaagccgtggactggcattactggtggtggctattgggctaacggtcgtcgtcctctggcgctggtgcgtactcacagtaagaaagcactgatgcgctacgaapcgtttacatgcctgaggtgtacaaagcgattaacattgcgcaaaacaccgcatggaaaatcaacaagaaagtcctagcggtcgccaacgtaatcaccaagtggaagcattgtccggtcgaggacatccctgcgattgagcgtgaagaactcccgatgaaaccggaagacatcgacatgaatcctgaggctctcaccgcgtggaaacgtgctgccgctgctgtgtaccgcaagacaaggctcgcaagtctcgccgtatcagccttgagttcatgcttgagcaagccaataagtttgctaaccataaggccatctggttcccttacaacatggactggcgcggttcgtgtttacgctgtgtcaatgttcaacccgcaaggtaacgatatgaccaaaggacgtcttacgctggcgaaaggtaaaccaatcggtaaggaaggttactactggctgaaaatccacggtgcaaactgtgcgggtgtcgataaggtttcgtttcctgagcgcatcaagttcattgaggaaaaccacgagaacatcatggcttgcgctaagtctccactggagaacacttggtgggctgagcaagattctccgttctgcttccttgcgttctgctttgagtacgctggggtacagcaccacggcctgagctataactgctcccttccgctggcgtttgacgggtcttgctctggcatccagcacttctccgcgatgctccgagatgaggtaggtggtcgcgcggttaacttgcttcctagtgaaaccgttcaggacatctacgggattgttgctaagaaagtcaacgagattctgcaagcagacgcaatcaatgggaccgataacgaagtagttaccgtgaccgatgagaacactggtgaaatctctgagaaagtcaagctgggcactaaggcactggctggtcaatggctggcttacggtgttactcgcagtgtgactaagcgttcagtcatgacgctggcttacgggtccaaagagttcggcttccgtcaacaagtgctggaagataccattcagccagctattgattccggcaagggtctgatgttcactcagccgaatcaggctgctggatacatggctaagctgatttgggaatccgtgagcgtgacggtggtagctgcggttgaagcaatgaactggcttaagtctgctgctaagctgctggctgctgaggtcaaagataagaagactggagagattcttcgcaagcgttgcgctgtgcattgggtaactcctgatggtttccctgtgtggcaggaatacaagaagcctattcagacgcgcttgaaacctgatgttcctcggtcagttccgcttacagcctaccattaacaccaacaaagatagcgagattgatgcacacaaacaggagtctggtatcgctcctaactttgtacacagccaagacggtagccaccttcgtaagactgtagtgtgggcacacgagaagtacggaatcgaatcattgcactgattcacgactccttcggtaccattccggctgacgctgcgaacctgttcaaagcagtgcgcgaaactatggttgacacatatgagtcttgtgatgtactggctgatttctacgaccagttcgctgaccagttgcacgagtctcaattggacaaaatgccagcacttccggctaaaggtaacttgaacctccgtgacatcttagagtcggacttcgcgttcgcgtaagggccctcgtcgagtcggtcacaatcacctgaaactccaaaggcagccagtgaggaacgtgaagaagaagaaaaagagtcatctgaacaggtttgattttctttctggtcaaaaagatgaaatttgattttcagccagatactcccaaaactagcagcgagaagtctgcaagtcgttcacagtcgcccagagaatcgcgggaagtgagccaagaggtatgtttttcaaaaatcaataactgatcataatttttattgtttggtgaatttaagaaaataatattcgaaaattcctctgaattatcaagattgcagtattaaatttcgagaaaaattgagatattcatagagctattgtaaattttcttgatttcagactgaaacttcggaaaatcaagagaaaatcaaagaaaaggatgacggggatgatcagcctggcacaccgaacagctatagaagccgggaaacttcaccagctccaaaaaggtccaaggagaccaggtttgtcaaaagcttcctgcgattaattctcatttcaatttttcagagaatcagagtctcctgaaaaatccccggttcgttcaagatctcccagaaggtcttcagcacgttccccgtcacgatctcctagacggcgccgagaaagaagctcagaaagaaagcaatccgaagagccagcaccgctaccagagaaaaagaagaaagagccgctggatattctacgaacaagaaccggaggagcatatattccacccgccaaacttcgacttatgcaacaacagattagtgataagcaaagtgaacagtatcagagaatgaattgggaaagaaatgaagaaaaagattcacggattggttaacagagtcaacgcgaagaatcttgttcaaattgtcagagaacttcttcaagagaatgtgattcgttcaaagtgagtgagaaaatcgaaggaaaaggaaagaattaatttaatttttcaggggacttctctgccgtgacattattcaagctcaggctttctcaccaggattctctaacgtctatgcagctttggcggcagttatcaactcgaaattccctcatgtcggtgaacttcttctccgtcgtctgattgtacagttcaaaagaagtttccgtagaaatgacagaggcgtcacggtgaacgtgatcaaattcatcgcacatttgattaatcaacaagttgctcacgaagttcttgcgctggaaatcatgattctgatgcttgaagaaccaactgatgattcagttgaagtcgccattgcgttcctgaaagagtgtggagcaaagcttctggagattgctccagcagctcttaacagtgtctacgaccgtcttcgtgcaattctcatggaaactgaaagatcggaaaatgcactggatcgacgtattcagtatatgattgagactgcaatgcagattcgaaaggacaaatttgcggtaaggtagaatatataaatagtttattagaaaaaaataaattagaataatttaaattcctactagccaatcaggcgaccttttttgcgcatagttctattattgaaaaatttggagaatttctcatattctcgctcggaaatctggaattcgacgagatcttctggcttctgtgcagctgcatcgctttgtgctccctttctcgcttgtcttctgtgtacaccaagaaccttgttgagttcatcaactgaatctgtgactggcttgttgctcactggatgcactagacgactgattctcgagaaatcagattgagttgcgattagggtgacctagaaattgggaataatacgaacttttgaaaatattcaggaggattaaaaaaattattctcgacaatcctacaaatttacttattgcaccatgttgctccaacatttttcattaaaagttaatgaaaaaatgtagaaaatcggaaattggcaattttcagaccatttttaagcattttcaaaaaaaaattgcagctgaaataaatgtcattttcagataaatcgagcgattttctgttgtctgacactagtttttagttttaaaaaatgttggaagaacatggtgcaataggtaatttcatagaatttccatgtgttttttttcaattaaccaattatccaaatcttccaaactcacattttgcggagctgggctatcaagaatctgctgcagttttataagacgagcatctctgatatcactgaaaattaattttttaatcaaaacttgaatatcaactaaacccacttcttaacttttctcgatcttctgtcgttcggtacgatgacggtgaagaagccaattgtagtagttgatttggttcaagt
cctttcggtgttgtacgtcagtgtcctgcaatgctatttagttataacttaggcctaagattcaatttaatgaagtgatttaaatttgttctctgaacctcttaagatgatcttttggattagaaacatataagacaggtttacctatctattaaaaaacagatcaaaatagatacgaccaaatcggataatccatgcctacctggcatcagggacgtgttcttagaagatttcttacgtaatcgtatgaagaaaataacaatttgatcgttggccagcaaaaatagggttttaagtgggatagtgtttttattagctaaccggaaaattttatagtttttttttgcaagaaaccactgaaaaccccctaattgtatacattttttggagcagcttctggtctttttgagcaataaaattcgataaaacagaatttaagtgtaaattgttcacatttagtttctattttatcaaattttgttgctcaaaaacattcgaagctgctctaaaaaaatgcattaaaaaaggggttttcagtggtttttcacattaaaaaagctaattttaactaaaaatccatcatatttccaactttgtccacaacaataaaatgctggtcaaaatgtgttcgaaaaaatgtttttttttttaatttttataatttaaaaatagttttctttcgctgggacacatacatttttgggcgtaaattttcagttcaaatttccatttttacaaccataatcataaagctacgtctgatctctctcgcacttacctgcgcctgattcgaaagaacaaccgtagccaaaagaacaagaagaacaagcacgtagttgtggtagtggacgttcatcacgcaatactgaccaatggtcgtggggtctcactttccgtactattgagagaggggagactgaagatggcaattgaggacagtgtcttcgacgcacgcatgcatccataagcataaatccaggagggatggagagaaaaatcttgtttctaagcccctccctttgtaatacatacacatatctaataccgaagaatggctaaattgaatggacgtcagctgttgctgtagttgccaaggcatcatcgatgaaataactgaaagaaagaattaaataattattgcaggcgtatccggcggtcattgaagacttggacttgattgaggaggaggatcagatcatccatacacttaatttggaggatgcggttgatccggaaaatgggcttagtaagtgactgaccacacgcggggggcattaatttaataaattgaattccatttcagatgtgttcaaactagatccagaattcgaaaagaacgaggaggtttatgaggagatccgtaaggaaatcattggaaacgccgatatttcggatgaggatggtggcgacgagttggatgatgaagaagagggtagtgatgtggaagaggctccgaagaagactacagagattattgataatactgatcagaattgactgctttcagaaggtattcattttgagttttgggccggcaaatctgtaagttgccggttgccgaaaatttgctgaatttgccggaaaaaaaaattccggaatttatttaaaaactttttgtaaaaattaaattaaatttgcaacttttcagagaagtctacctgacaatgcaatcatctttggactaccaagaagctgctcacaaattgctgaaaatgaagattccagacagcatgcaggtcagcgatgttgcaaagaaaaattttcgaccaaaaaaaccaaccaatcataaaatttaaaaaaaaactccgtttttttctttttttttatacgagaaaaaccaaaaaaatgtatttttgccaaattctaaaatactccccgaaattttcaatattttctctttcagaacgaactctgcgcgatgcttgtcgattgttgtgctcaacagcgtacctacgagcgattctacggaatgctcatcgaacgtttctgccgacttcgcctcgaataccagcaatactttgaaaagctctgccaggacacgtattccacgattcaccgaattgacatcacaaaactgcggaatttggctcgccttattgctcatttgctctcgacggatgctattgactggaagattttggccgatatgaaaatgaccgaagaggacacaacttcttctggcagaatctatattaaatatatatttaaatgaacttgtggaggcgatgggaatggttaaacttcattcgagagttactgatccgtgagtttcctagagagagttgttttcgtattcaattttccctattttcagaactttggctcattgctttgttggattattcccacgaactaatccgaacagcgcacgattttcgatcaacttcttcacaatgattggattgggtggtttgacgttggaacttcgtgaatggctggcaaagggtctcaagaagaagaagggaatgctggatcagttgaaggccgaatcaagctcagattcatcgtcgtcttcggattcgtcagactcgtctgattcttcggattctgacgattcatccgactcgtcttcagattcctcatcttcttcagaatcagagccagaaccaccgaagaaaaagaagaagaagaacagtgaagagagttccaaaaagaaggaaaaagagaatattggtcgacgggatcgtggagacaagagagctgaacgtcatcgtgatcaaagtgtggagaacaaggacaaggatcgtcgacgtcgccaggattctgacgaaaatcgtcggccagaacgaggagatgaccgcaaggatcggagtaaagatcgtcgtcgtcaagactcggatgatgaggatcggaaaggtcgtgaacgtcgggaagattcaggggaaagacgtcgcggagatcgggatcgacgtgatcgaaacaaggatcaggaggatcaccgtgaagatcgccgtgaccgaagcaaggatcgtgaggatcgacgtgatcgccgtcgtcatgactctgatgatgatcgtaaaactcgtcgggatagaagtgaagagcgaggaggacgtcgtcgtgaagtggaatcggatgatcgacgccgacgtcgttgaattttcaaattttaaatactgaatatttgttttttttcctattatttatttattctctttgtgttttttttcttgctttcttaaaaaaattaattcaatccaaaatctaaacatgagcggttttttttctctttccgtctcccaattcgtattccgctcctctcatctgaacacaatgtgcaagtttatttatcttctcgctttcatttcattaggacgtggggggaattggtggaagggggaaacacacaaaaggatgatggaaatgaaataaggacacacaatatgcaacaacattcaattcagaaatatggaggaaggtttaaaagaaaacataaaaaatatatagaggaggaaggaaaactagtaaaaaataagcaaagaaattaggcgaacgatgagaattgtcctcgcttggcaaaatgcgaatccgtatggagaggcacgtttggcgaaggcaaatgttcggtatggagatctgtaaaaatttttaagttgaaatttggtgttgctcttttacaaaattttccgattttcgcttgaaattacggtgccaggtctcgacacgtcttccaatttttcaaattcaaaagagcctttaatgaactgtagttgctaatttctcgtttttgaaaatttttcttccgtttaatcgaaatttgatgtattttatttatgattttcaataaatttcaaagaaactggtgaaaactcggaaaattgtgaactacagtaatccaatccttaaaggcgcacaccttttaaatgtccgccccaatacgatattttttttaagattcgctagagcggccgccaccgcggtggagctccaattcgccctatagtgagtcgtattacaattcactggccgtcgttttacaacgtcgtgactgggaaaaccctggcgttacccaacttaatcgccttgcagcacatccccccttcgccagctggcgtaatagcgaagaggcccgcaccgatcgcccttcccaacagttgcgtagcctgaatggcgaatgggacgcgccctgtagcggcgcattaagcgcggcgggtgtggtggttacgcgcagcgtgaccgctacacttgccagcgccctagcgcccgctcctttcgctttcttcccttcctttctcgccacgttcgccggctttccccgtcaagctctaaatcgggggctccctttagggttccgatttagtgcttttacggcacctcgaccccaaaaaacttgattagggtgatggttcacgtagtgggccatcgccctgatagacggtttttcgccctttgacgttggagtccacgttctttaatagtggactcttgttccaaactggaacaacactcaaccctatctcggtctattcttttgatttataagggattttgccgatttcggcctattggttaaaaaatgagctgatttaacaaaaatttaacgcgaattttaacaaaatattaacgttacaatttcaggtggcacttttcggggaaatgtgcgcggaacccctatttgtttatttttctaaatacattcaaatatgtatccgctcatgagacaataaccctgataaatgcttcaataatattgaaaaaggaagagtatgagtattcaacatttccgtgtcgcccttattccctttttttgcggcattttgccttcctgtttttgctcacccagaaacgctggtgaaagtaaaagatgctgaagatcagttgggtgcacgagtgggttacatcgaactggatctcaacagcggtaagatccttgagagttttcgccccgaagaacgttttccaatgatgagcacttttaaagttctgctatgtggcgcggtattatcccgtattgacgccgggcaagagcaactcggtcgccgcatacactattctcagaatgacttggttgagtactcaccagtcacagaaaagcatcttacggatggcatgacagtaagagaattatgcagtgctgccataagcatgagtgataacactgcggccaacttacttctgacaacgatcggaggaccgaaggagctaaccgctttttttcacaacatgggggatcatgtaactcgccttgatcgttgggaaccggagctgaatgaagccataccaaacgactgcgtgacaccacgstgcctgtagcaaatggcaacaacgttgcgcaaactattactggcgaactacttactctagcttcccggcaacaattaatagactggatggaggcggataaagttgcaggaccacttctgcgctcggcccttccggctggctggtttattgctgataaatctggagccggtgagcgtgggtctcgcggtatcattgcagcactggggccagatggtaagccctcccgtatcgtagttatctacacgacgggcagtcaggcaactatggatgaacgaaaaagacagatcgctgagataggtgcctcactgattaagcattggtaactgtcagaccaagtttactcatatatactttagattgatttaaaacttcatttttaatttaaaaggatctaggtgaagatcctttttgataatctcatgaccaaaatcccttaacgtgagttttcgttccactgagcgtcagaccccgtagaaaagatcaaaggatcttcttgagatcctttttttctgcgcgtaatctgctgcttgcaaacaaaaaaaccaccgctaccagcggtggtttgtttgccggatcaagagctaccaactctttttccgaaggtaactggcttcagcagagcgcagataccaaatactgtccttctagtgtagccgtagttaggccaccacttcaagaactctgtagcaccgcctacatacctcgctctgctaatcctgttaccagtggctectgccagtggcgataagtcgtgtcttaccgggttggactcaagacgatagttaccggataaggcgcagcggtcgggctgaacggggggttcgtgcacacagcc
cagcttggagcgaacgacctacaccgaactgagatacctacagcgtgagcattgagaaagcgccacgcttcccgaagggagaaaggcggacaggtatccggtaagcggcagggtcggaacaggagagcgcacgagggagcttccaggggggaacgcctggtatctttatagtcctgtcgggtttcgccacctctgacttgagcgtcgatttttttgatgctcgtcaggggggccgagcctatggaaaaacgccagcaacgcggcctttttacggttcctggccttttgctggccttttgctcacatgttctttcctgcgttatcccctgattctgtggataaccgtattaccgcctttgagtgagctgataccgctcgccgcagccgaacgaccgagcgcagcgagtcagtgagcgaggaagcggaagagcgcccaatacgcaaaccgcctctccccgcgcgttggccgattcattaatgcagctggcacgacaggtttcccgactggaaagcgggcagtgagcgcaacgcaattaatgtgagttacctcactcattaggcaccccaggctttacactttatgcttccggctcctatgttgtgtggaattgtgagcggataacaatttcacacaggaaacagctatgaccatgattacgccaagctcggaattaaccctcactaaagggaacaaaagctgggggg
pAS2-cyh2-HA+bothT7-final SEQUENCE ID NO.8gatccgtcgacagatctccctatagtgagtcgtattactgcagccaagctaattccgggcgaatttcttatgatttatgatttttattattaaataagttataaaaaaaataagtgtatacaaattttaaagtgactcttaggttttaaaacgaaaattcttgttcttgagtaactctttcctgtaggtcaggttgctttctcaggtatagcatgaggtcgctcttattgaccacacctctaccggcatgcaagcttggcgtaatcatggtcatagctgtttcctgtgtgaaattgttatccgctcacaattccacacaacatacgagccggaagcataaagtgtaaagcctggggtgcccaatgagtgaggtaactcacattaattgcgttgcgctcactgcccgctttccagtcgggaaacctgtcgtgccagctggattaatgaatcggccaacgcgcggggagaggcggtttgcgtattgggcgctcttccgcttcctcgctcactgactcgctgcgctcggtcgttggctgcggcgagcggtatcagctcactcaaaggcggtaatacggttatccacagaatcaggggataacgcaggaaagaacatgtgagcaaaaggccagcaaaaggccaggaaccgtaaaaaggccgcgttgctggcgtttttccataggctccgcccccctgacgagcatcacaaaaatcgacgctcaagtcagaggtggcgaaacccgacaaggactataaagataccaggcgtttccccctggaagctccctcgtgcgctctcctgttccgaccctgccgcttaccggatacctgtccgcctttctcccttcgggaagcgtggcgctttctcatagctcacgctgtaggtatctcagttcggtgtaggtcgttcgctccaagctgggctgtgtgcacgaaccccccgttcagcccgaccgctgcgccttatccggtaactatcgtcttgagtccaacccggtaagacacgacttatcgccactggcagcagccactggtaacaggattagcagagcgaggtatgtaggcggtgctacagagttcttgaagtggtggcctaactacggctacactagaaggacagtatttggtatctgcgctctgctgaagccagttaccttcggaaaaagagttggtagctcttgatccggcaaacaaaccaccgctggtagcggtggtttttttgtttgcaagcagcagattacgcgcagaaaaaaaggatctcaagaagatcctttgatcttttctacggggtctgacgctcagtggaacgaaaactcacgttaagggattttggtcatgagattatcaaaaaggatcttcacctagatccttttaaattaaaaatgaagttttaaatcaatctaaagtatatatgagtaaacttggtctgacagttaccaatgcttaatcagtgaggcacctatctcagcgatctgtctatttcgttcatccatagttgcctgactccccgtcgtgtagataactacgatacgggagggcttaccatctggccccagtgctgcaatgataccgcgagacccacgctcaccggctccagatttatcagcaataaaaccagccagccggaagggcccgagcgcagaagtggtcctgcaactttatccgcctccatccagtctattaattttgccgggaagctagagtaagtagttcgccagttaatagtttgcgcaacgttgttgccattgctacaggcatcgtggtgtcacgctcgtcgtttggtatggcttcattcagctccggttcccaacgatcaaggcgagttacatgatcccccatgttgtgcaaaaaagcggttagctccttcggtcctccgatcgttgtcaagaagtaagttggccgcagtgttatcactcatggttatggcagcactgcataattctcttactgtcatgccatccgtaagatgcttttctgtgactggtgagtactcaaccaagtcattctgagaatagtgtatgcggcgaccgagttgctcttgcccggcgtcaatacgggataataccgcgccacatagcagaactttaaaagtgctcatcattggaaaacgttcttcggggcgaaaaactctcaaggatcttaccgctgttgagatccagttcgatgtaacccactcgtgcacccaactgatcttcagcatcttttactttcaccagcgtttctgggtgagcaaaaacaggaaggcaaaatgccgcaaaaaagggaataagggcgacacggaaatgttgaatactcatactcttcctttttcaatattattgaagcatttatcagggttattgtctcatgagcggatacatatttgaatgtatttagaaaaataaacaaataggggtteegcgcacatttccccgaaaagtgccacctgaacgaagcatctgtgcttcattttgtagaacaaaaatgcaacgcgagagcgctaaatttttcaaacaaagaatctgagctgcatttttacagaacagaaatgcaacgcgaaagcgctattttaccaacgaagaatctgtgcttcatttttgtaaaacaaaaatgcaacgcgagagcgctaatttttcaaacaaagaatctgagctgcatttttacagaacagaaatgcaacgcgagagcgctattttaccaacaaagaatctatacttcttttttgttctacaaaaatgcatcccgagagcgctatttttctaacaaagcatcttagattacttttttttcctttgtgcgctctataatgcagtctcttgataactttttgcactgtaggtccgttaaggttagaagaaggctactttggtgtctattttctcttccataaaaaaagcctgactccacttcccgcgtttactgattactagcgaagctgcgggtgcattttttcaagataaaggcatccccgattattctataccgatgtggattgcgcatactttgtgaacagaaagtgatagcgttgatgattcttcattggtaagaaaattatgaacggtttcttctattttgtctctatatactacgtataggaaatgtttacattttcgtattgttttcgattcactctatgaatagttcttactacaattttttgtctaaagagtaatactagagataaacataaaaaatgtagaggtcgagtttagatgcaagttcaaggagcgaaaggtggatgggtaggttatatagggatatagcacagagatatatagcaaagagatacttttgagcaatgtttgtggaagcggtattcgcaatattttagtagctcgttacagtccggtgcgtttttggttttttgaaagtgcgtcttcagagcgcttttggttttcaaaagcgctctgaagttcctatactttctagagaataggaacttcggaataggaacttcaaagcgtttccgaaaacgagcgcttccgaaaatgcaacgcgagctgcgcacatacagctcactgttcacgtcgcacctatatctgcgtgttgcctgtatatatatatacatgagaagaacggcatagtgcgtgtttatgcttaatgcgtacttatatgcgtctatttatgtaggatgaaaggtagtctagtacctcctgtgatattatcccattccatgcggggtatcgtatgcttccttcagcactaccctttagctgttctatatgctgccactcctcaattggattagtctcatccttcaatgctatcatttcctttgatattggatcatattaagaaaccattattatcatgacattaacctataaaaataggcgtatcacgaggccctttcgtctcgcgcgtttcggtgatgacggtgaaaacctctgacacatgcagctcccggagacggtcacagcttgtctgtaaagcggatgccgggagcagacaagcccgtcagggcgcgtcagcgggtgttggcgggtgtcggggctggcttaactatgcggcatcagagcagattgtactgagagtcaccatagatcaacgacattactatatatataatataggaagcatttaatagacagcatcgtaatatatgtgtactttgcagttatgacgccagatggcagtagtggaagatattctttattgaaaaatagcttgtcaaccttacgtacaatcttgatccggagcttttctttttttgccgattaagaattaattcggtcgaaaaaagaaaaggagagggccaagagggagggcattggtgactattgagcacgtgagtatacgtgattaagcacacaaaggcagcttggagatgtctgttattaatttcacaggtagttctggtccattggtgaaagtttgcggcttgcagagcacagaggccgcagaatgtgctctagattccgatgctgacttgctgggtattatatgtgtgcccaatagaaagagaacaattgacccggttattgcaaggaaaatttcaagtcttgtaaaagcatataaaaatagttcaggcactccgaaatacttggttggcgtgtttcgtaatcaacctaaggaggatgttttggctctggtcaatgattacggcattgatatcgtccaactgcatggagatgagtcgtggcaagaataccaagagttcctcggtttgccagttattaaaagactcgtatttccaaaagactgcaacatactactcagtgcagcttcacagaaacctcattcgtttattcccttgtttgattcgaagcaggtgggacaggtgaacttttggattggaactcgatttctgactgggttggaaggcaagagagccccgaaagcttacattttatgttagctggtggactgacgccagaaaatgttggtgatgcgcttagattaaaatggcgttattggtgttgatgtaagcggaggtgtggagacaaatggtgtaaaagactctaacaaaatagcaaatttcgtcaaaaatgctaagaaataggttattactgagtagatttatttaagtattgtttgtgcacttgccgatctatgcggtgtgaaataccgcacagatgcgtaaggagaaaataccgcatcaggaaattgtaaacgttaatattttgttaaaattcgcgttaaatttttgttaaatcagctcattttttaaccaataggccgaaatcggcaaaatcccttataaatcaaaagaatagaccgagattgggttgagtgttgttccagtttggaacaagagtccactattaaagaacgtggactccaacgtcaaagggcgaaaaaccgtctatcagggcgatggcccactacgtgaaccatcaccctaatcaagttttttggggtcgaggtgccgtaaagcactaaatcggaaccctaaagggagcccccgatttagagcttgacggggaaagccggcgaacgtggcgagaaaggaagggaagaaagcgaaaggagcgggcgctagggcgctggcaagtgtagcggtcacgctgcgcgtaaccaccacacccgccgcgcttaatgcgccgctacagggcgcgtcgcgccattcgccattcaggctgcgcaactgttgggaagggcgatcggtgcgggcctcttcgctattacgccagctggcgaaagggggatgtgctgcaaggcgattaagtt
gggtaacgccagggttttcccagtcacgacgttgtaaaacgacggccagtcgtccaagctttcgcgagctcgagatcccgagctttgcaaattaaagccttcgagcgtcccaaaaccttctcaagcaaggttttcagtataatgttacatgcgtacacgcgtctgtacagaaaaaaaagaaaaatttgaaatataaataacgttcttaatactaacataactataaaaaaataaatagggacctagacttcaggttgtctaactccttccttttcggttagagcggatgtggggggagggcgtgaatgtaagcgtgacataactaattacatgatatccttttgttgtttccgggtgtaacaatatggacttcctcttttctggcaaccaaacccatacatcgggattcctataataccttcgttggtctccctaacatgtaggtggcggaggggagatatacaatagaacagataccagacaagacataatgggctaaacaagactacaccaattacactgcctcattgatggtggtaacataaacgaactaatactgtagccctagacttgatagccatcatcatatcgaagtttcactaccctttttccatttgccactattgaagtaataataggcgcatgcaacttcttttctttttttttcttttctctctcccccgttgttgtctcaccatatccgcaatgacaaaaaaaatgatggaagacactaaaggaaaaaattaacgacaaagacagcaccaacagatgtcgttgttccagagctgatgaggggtatcttcgaacacacgaaactttttccttccttcattcacgcacactactctctaatgagcaacggtatacggccttccttccagttacttgaatttgaaataaaaaaagtttgccgctttgctatcaagtataaatagacctgcaattattaatcttttgtttcctcgtcattgttctcgttccctttcttccttgtttctttttctgcacaatatttcaagctataccaagcatacaatcaactccaagcttgaagcaagcctcctgaaagatgaagctactgtcttctatcgaacaagcatgcgatatttgccgacttaaaaagctcaagtgctccaaagaaaaaccgaagtgcgccaagtgtctgaagaacaactgggagtgtcgctactctcccaaaaccaaaaggtctccgctgactagggcacatctgacagaagtggaatcaaggctagaaagactggaacagctatttctactgattttttcctcgagaagaccttgacatgattttgaaaatggattctttacaggatataaaagcattgttaacaggattatttgtacaagataatgtgaataaagatgccgtcacagatagattggcttcagtggagactgatatgcctctaacattgagacagcatagaataagtgcgacatcatcatcggaagagagtagtaacaaaggtcaaagacagttgactgtatcgccggaattcttaatacgactcactatagggcatatggccatggaggccccggg
pGAD424-without-FULL-ICE-BOTH-T7 SEQUENCE ID NO.9gatccgtcgacagatctccctatagtgagtcgtattactgcagagatctatgaatcgtagatactgaaaaaccccgcaagttcacttcaactgtgcatcgtgcaccatctcaatttctttcatttatacatcgttttgccttcttttatgtaactatactcctctaagtttcaatcttggccatgtaacctctgatctatagaattttttaaatgactagaattaatgcccatcttttttttggacctaaattcttcatgaaaaatatattacgagggcttattcagaagctttggacttcttcgccagaggtttggtcaagtctccaatcaaggttgtcggcttgtctaccttgccagaaatttacgaaaagatggaaaagggtcaaatcgttggtagatacgttgttgacacttctaaataagcgaatttcttgtgatttatgatttttattattaaataagttataaaaaaaataagtgtatacaaatttttaaagtgactcttaggttttaaaacgaaaattcttgttcttgagtaactctttcctgtaggtcaggttgctttctcaggtatagcatgaggtcgctcttattgacacacctcaccggcatgcccgaaattccccaccctatgaacaattccattttgtaatttcgtgtcgtttctattatgaatttcatttataaagtttatgtacaaatatcataaaaaaagagaatctttttaagcaaggattttcttaacttcttcggcgacagcatcaccgacttcggtggtactgttggaaccacctaaatcaccagttctgatacctgcatccaaaaccttttaactgcatcttcaatggccttaccttcttcaggcaagttcaatgacaatttcaacatcattgcagcagacaagatagtggcgatagggtcaaccttattctttggcaaatctggagcagaaccgtggcatggttcgtacaaaccaaatgcggtgttcttgtctggcaaagaggccaaggacgcagatggcaacaaacccaaggaacctgggataacggaggcttcatcggagatgatatcaccaaacatgttgctggtgattataataccatttaggtgggttgggttcttaactaggatcatggcggcagaatcaatcaattgatgttgaaccttcaatgtaggaaattcgttcttgatggtttcctccacagtttttctccataatcttgaagaggccaaaacattagctttatccaaggaccaaataggcaatggtggctcatgttgtagggccatgaaagcggccattcttgtgattctttgcacttctggaacggtgtattgttcactatcccaagcgacaccatcaccatcgtcttcctttctcttaccaaagtaaatacctcccactaattctctgacaacaacgaagtcagtacctttagcaaattgtggcttgattggagataagtctaaaagagagtcggatgcaaagttacatggtcttaagtttggcgtacaattgaagttctttacggatttttagtaaaccttgttcaggtctaacactacctgtaccccatttaggaccacccacagcacctaacaaaacggcatcaaccttcttggaggcttccagcgcctcatctggaagtgggacacctgtagcatcgatagcagcaccaccaattaaatgattttcgaaatcgaacttgacattggaacgaacatcagaaatagctttaagtaccttaatggcttcggctgtgatttcttgaccaacgtggtcacctggcaaaaacgacgatcttcttaggggcagacattagaatggtatatccttgaaatatatatatatattgctgaaatgtaaaaggtaagaaaagttagaaagtaagacgattgctaaccacctattggaaaaaacaataggtccttaaataatattgtcaacttcaagtattgtgatgcaagcatttagtcatgaacgcttctctattctatatgaaaagccggttccggcctctcacctttcctttttctcccaatttttcagttgaaaaaggtataatgcgtcaggcgacctctgaaattaacaaaaaatttccagtcatcgaatttgattctgtgcgatagcgcccctgtgtgttctcgttatgttgaggaaaaaaataatggttgctaagagattcgaactcttgcatcttacgatacctgagtaattcccacagttggggatctcgactctagctagaggatcaattcgtaatcatggtcatagctgtttcctgtgtgaaatttatccgctcacaattccacacaacatacgagccggaagcataaagtgtaaagcctggggtgcctaatgagtgaggtaactcacattaattgcgttgcgctcactgcccgctttccagtcgggaaacctgtcgtgccagctggattaatgaatcggccaacgcgcggggagaggcggtttgcgtattgggcgctcttccgcttcctcgctcactgactcgctgcgctcggtcgttcggctgcggcgagcggtatcagctcactcaaaggcggtaatacggttatccacagaatcaggggataacgcaggaaagaacatgtgagcaaaaggccagcaaaaggccaggaaccgtaaaaaggccgcgttgctggcgtttttccataggctccgcccccctgacgagcatcacaaaaatcgacgctcaagtcagaggtggcgaaacccgacaggactataaagataccaggcgtttccccctggaagctccctcgtgcgctctcctgttccgaccctgccgcttaccggatacctgtccgcctttctcccttcgggaagcgtggcgctttctcatagctcacgctgtaggtatctcagttcggtaggtcgttcgctccaagctgggctgtgtgcacgaaccccccgttcagcccgaccgctgcgccttatccggtaactatcgtcttgagtccaacccggtaagacacgacttatcgccactggcagcagccactggtaacaggattagcagagcgaggtatgtaggcggtgctacagagttcttgaagtggtggcctaactacggctacactagaaggacagtatttggtatctgcgctctgctgaagccagttaccttcggaaaaagagttggtagctcttgatccggcaaacaaaccaccgctggtagcggtggttttttttgtttgcaagcagcagattacgcgcagaaaaaaaggatctcaagaagatcctttgatcttttctacggggtctgacgctcagtggaacgaaaactcacgttaagggattttggtcatgagattatcaaaaaggatcttcacctagatccttttaaattaaaaatgaagttttaaatcaatctaaagtatatatgagtaaacttggtctgacagttaccaatgcttaatcagtgaggcacctatctcagcgatctgtctatttcgttcatccatagttgcctgactccccgtcgtgtagataactacgatacgggagggcttaccatctggccccagtgctgcaatgataccgcgagacccacgctcaccggctccagattatcagcaataaaccagccagccggaagggccgagcgcagaagtggtcctgcaactttatccgcctccatccagtctattaattgttgccgggaagctagagtaagtagttcgccagttaatagtttgcgcaacgttgttgccattgctacaggcatcgtggtgtcacgctcgtcgtttggtatggcttcattcagctccggttcccaacgatcaaggcgagttacatgatcccccatgttgtgcaaaaaagcggttagctccttcggtcctccgatcgttgtcagaagtaagttggccgcagtgttatcactcatggttatggcagcactgcataattctcttactgtcatgccatccgtaagatgcttttctgtgactggtgagtactcaaccaagtcattctgagaatagtgtatgcggcgaccgagttgctcttgcccggcgtcaatacgggataataccgcgccacatagcagaactttaaaagtgctcatcattggaaaacgttcttcggggcgaaaactctcaaggatcttaccgctgttgagatccagttcgatgtaaacccactcgtgcacccaactgatcttcagcatcttttactttcaccagcgtttctgggtgagcaaaaacaggaaggcaaaaatgccgcaaaaaagggaataagggcgacacggaaatgttgaatactcatactcttcctttttcaatattattgaagcatttatcagggttattgtctcatgagcggatacatatttgaatgtatttagaaaaaaataaacaaataggggttccgcgcacatttccccgaaaagtgccacctgacgtctaagaaaccattattatcatgacattaacctataaaaataggcgtatcacgaggccctttcgtctcgcgcgtttcggtgatgacggtgaaaacctctgacacatgcagctcccggagacggtcacagcttgtctgtaagcggatgccgggagcagacaagcccgtcagggcgcgtcagcgggtgttggcgggtgtcggggctggcttaactatgcggcatcagagcagattgtactgagagtgcaccataacgcatttaagcataaaacacgcactatgccgttcttctcatgtatatatatatacaggcaacacgcagatataggtgcgacgtgaacagtgagctgtatgtgcgcagctcgcgttgcattttcggaagcgctcgttttcggaaacgctttgaagttcctattccgaagttcctattctctagctagaaagtataggaacttcagagcgcttttgaaaaccaaaagcgctctgaagacgcactttcactttcaaaaaaccaaaaacgcaccggactgtaacgagctactaaaatattgcgaataccgcttccacaaacattgctcaaaagtatctctttgctatatatctctgtgctatatccctatataacctacccatccacctttcgctccttgaacttgcatctaaactcgacctctacattttttatgtttatctctagtattactctttagacaaaaaaattgtagtaagaactattcatagagtgaatcgaaaacaatacgaaaatgtaaacatttcctatacgtagtatatagagacaaaatagaagaaaccgttcataattttctgaccaatgaagaatcatcaacgctatcactttctgttcacaaagtatgcgcaatccacatcggtatagaatataatcggggatgcctttatcttgaaaaaatgcacccgcagcttcgctagtaatcagtaaacgcgggaagtggagtcaggctttttttatggaagagaaaatagacaccaaagtagccttcttctaaccttaacggacctacagtgcaaaaagttatcaagagactgcattatagagcgcacaaaggagaaaaaaagtaatctaagatgctttgttagaaaaatagcgctctcgggatgcatttttgtagaacaaaaaagaagtatagattctttgttggtaaaatagcgctctcgcgttgcatttctgttctgtaaaaatgcagctcagattctttgtttgaaaaattagcgctctcg
cgttgcatttttgttttacaaaaaatgaagcacagattcttcgttggtaaaaatagcgctttcgcgttgcatttctgttctgtaaaaatgcagctcagattctttgtttgaaaaattagcgctctcgcgttgcatttttgttctacaaaaatgaagcacagatgcttcgttgcttgcatgcaacttcttttctttttttttcttttctctctcccccgttgttgtctcaccatatccgcaatgacaaaaaaaatgatggaagacactaaaggaaaaaattaacgacaaagacagcaccaacagatgtcgttgttccagagctgatgaggggtatcttcgaacacacgaaactttttccttccttcattcacgcacactactctctaatggagcaacggtatacggccttccttccagttacttgaatttgaaataaaaaaagtttgccgctttgctatcaagtataatagacctgcaattattaatcttttgtttcctcgtcattgttctcgttccctttcttccttgtttctttttctgcacaatatttcaagctataccaagcatacaatcaactccaagcttcaagatggaaaagcggaattaattcccgagcctccaaaaaagaagagaaaggtcgaattgggtaccgccgccaattttaaatcaaagtgggaatattgctgatagctcattgtccttcactttcactaacagtagcaacggtccgaacctcataacaactcaaacaaattctcaagcgctttcacaaccaattgcctcctctaacgttcatgataacttcatgaataatgaaatcacggctagtaaaattgatgatggtaataattcaaaaccactgtcacctggttggacggaccaaactgcgtataacgcgtttggaatcactacagggatgtttaataaccactacaatggatgatgtatataaactatcattcgatgatgaagataccccaccaaacccaaaaaaagagatcgaattcttaatacgactcactatagggcccatggacgaagaatccagttcattcttatgacctatgctgagaatgtgccaataagaagccatacttccttagatgatgcaataaatattaaaataaaacaaaacagaagggctg
pGN205SEQUENCE ID NO.10ccggtggtaccgggccccccctcgaggtcgacggtatcgataagctttcgtcattgaaaagaaggataagaatggacgatgggaagaagctctcgttgttccaggagatcagaaaacagcaactgttccaaaatcttaaggagggagaagaatatcaattcagaatttctgctcgtaaacaaggctggaactggagatccttctgatccttctgatcgtgttgttgcgaagccaagaaaccttgctccaagaattcatcgtgaagatctttctgatacaactgtcaaggtcggagccactctcaagttcattgttacatattgatggtgagccagcaccaagatgtaacatggtcactcaatggaaaaggaatcggagagagcaaggctcaaattgaaaatgagccatacatctcgagatttgctttgccaaaggcacttcgtaagcaaagtggaaaatataccatcactgcaaccaacattaatggaactgacagtgtcactatcaatatcaaggtaaaagcaagccaacgaaaccaaagggaccaatcgaggtaactgatgtcttcgaagatcgtgcaactcttgactggaaaccaccagaggatgacggaggagagccaattgagttctatgaaattgaaaagatgaacaccaaggacggaatctgggttccatgtggacgtagtggagatacccacttcacagtcgattcactcaacaagggagatcattacaagttccgtgtcaaggctgtcaacagcgaaggaccttctgatccattggaaactgaaaccgatattttggctaaaatccatttgatcgtccagatagaccaggtcgtccagagccaactgattgggattctgatcatgttgatctcaagtgggatccactagttctagaagcgctgctaagggggccctcgtcgagtcggtcacaatcacctgaaactccaaaggcagccagtgaggaacgtgaagaagaagaaaaagagtcatctgaacaggtttgattttctttctggtcaaaaagatgaaattattgattttcagccagatactcccaaaactagcagcgagaagtctgcaagtcgttcacagtcgcccagagaatcgcgggaagtgagccaagaggtatgtttttcaaaaatcaataactgatcataatttttattgtttggtgaatttaagaaaataatatttcgaaaattcctctgaattatcaagattgcaagtattaatttcgagaaaaattgagatattcatagagctattgtaaattttcttgatttcagactgaaacttcggaaaatcaagagaaaatcaaagaaaaggatgacggggatgatcagcctggcacaccgaacagctatagaagccgggaaacttcaccagctccaaaaaggtccaaggagaccaggtttgtcaaaagcttcctgcgattaattctcatttcaatttttcagagaatcagagtctcctgaaaaatccccggttcgttcaagatctcccagaaggtcttcagcacgttccccgtcacgatctcctagacggcgccgagaaagaagctcagaaagaaagcaatccgaagagccagcaccgctaccagagaaaaagaagaaagagccgctggatattctacgaacaagaaccggaggagcatatattccacccgccaaacttcgacttatgcaacaacagattagtgataagcaaagtgaacagtatcagagaatgaattgggaaagaatgaagaaaaagattcacggattggttaacagagtcaacgcgaagaatcttgttcaaattgtcagagacttcttcaagagaatgtgattcgttcaaagtgagtgagaaaatcgaaggaaaaggaaagaattaatttaatttttcaggggacttctctgccgtgacattattcaagctcaggctttctcaccaggattctctaacgtctatgcagctttggcggcagttatcaactcgaaattccctcatgtcggtgaacttcttctccgtcgtctgattgtacagttcaaaagaagtttccgtagaaatgacagaggcgtcacggtgaacgtgatcaaattcatcgcacatttgattaatcaacaagttgctcacgaagttcttgcgctggaaatcatgattctgatgcttgaagaaccaactgatgattcagttgaagtcgccattgcgttcctgaaagagtgtggagcaaagcttctggagattgctccagcagctcttaacagtgtctacgaccgtcttcgtgcaattctcatggaaactgaaagatcggaaaatgcactggatcgacgtattcagtatatgattgagactgcaatgcagattcgaaaggacaaatttgcggtaaggtagaatatataaatagtttattagaaaaaaataaattagaataaatttaaattcctactagccaatcaggcgacctttttgcgcatagttctattattgaaaaatttggagaatttctcatattctcgctcggaaaatctggaattcgacgagatcttctggcttctgtgcagctgcatcgctttgtgctccctttctcgcttgtcttctgtgtacaccaagaaccttgttgagttcatcaactgaatctgtgactggcttgttgctcactggatgcactagacgactgattctcgagaaatcagattgagttgcgattagggtgacctagaaattgggaatatacgaacttttgaaaatattcaggaggattaaaaaaattattctcgacaatcctacaaatttacttattgcaccatgttgctccaacatttttcattaaaagttaatgaaaaaatgtagaaaatcggaaattggcaattttcagaccattttttaagcattttcaaaaaaaaattgcagctgaaataaatgtcattttcagataaaatcgagcgattttctgttgtctgacactagtttttagttttaaaaaatgttggaagaacatggtgcaataggtaatttcatagaatttccatgtgttttttttcaattaaccaattatccaaatcttccaaactcattttgcggagctgggctatcaagaatctgctgcagttttataagacgagcatctctgatatcactgaaaaattaatttttaatcaaaacttgaatatcaactaacccacttattaaactttctcgatcttctgtcgttcggtacgatgacggtgaagaagccaattgtagtagttgatttggttcaagtcctttcggtgttgtacgtcagtgtcctgcaatgctatttagttataacttaggcctaagattcaatttaatgaagtgattaaatttgttctctgaacctcttaagatgatcttttggattagaaacatataagacaggtttacctatctattaaaaaacagatcaaaatagatacgaccaaatcggataatccatgcctacctggcatctaggaacgtgttcttagaagatttcttacgtaatcgtatgaagaaataacaatttgatcgttggccagcaaaaatagggttttaagtgggatagtgtttttattagctaaccggaaaattttatagtttttttttgcaagaaaccactgaaaaccccctaattgtatacattttttggagcagcttctggtctttttgagcaataaaattcgataaaacagaatttaagtgtaaattgttcacatttagtttctattttatcaaattttgttgctcaaaaacattcgaagctgctctaaaaaaatgcattaaaaaggggttttcagtggtttttcacattaaaaaagctaattttaactaaaaatccatcatattttccaactttgtcacaacaataaaaatgctggtcaaaatgtgttcgaaaaaatgtttttttttatttttaataatttaaaaatagttttctttcgctgggacacatacatttttgggcgtaaattttcagttcaaatttccattttttacaaccataatcataaagctacgtctgatctctctcgcacttacctgcgcctgattcgaaagaacaaccgtagccaaaagaacaagaagaacaagcacgtagttgtggtagtggacgttcatcacgcaatactgaccaatggtcgtggggtctcactttccgtactattgagagaggggagactgaagatggcaattgaggacagtgtcttcgacgcacgcatgcatccaataagcataatccaggagggatggagagaaaaatcttgtttctaagcccctccctttgtaatacatacacatatctaataccgaagaatggctaattgaatggacgtccagctgttgctgtagttgccaaggcatcatcgatgaaataactgaaagaaagaattaaataattaattgcaggcgtatccggcggtcattgaagacttggacttgattgaggaggaggatcagatcatccatacacttaatttggaggatgcggttgatccggaaaatgggcttagtaagtgactgaccacacgcggggggcattaatttaataaattgaattccatttcagatgtgttcaaactagatccagaattcgaaaagaacgaggaggtttatgaggagatccgtaaggaaatcattggaaacgccgatatttcggatgaggatggtggcgacgagttggatgatgaagaagagggtagtgatgtggaagaggctccgaagaagactacagagattattgataatactgatcagaattgactgctttcagaaggtattcattttgagttttgggccggcaaatctgtaagttgccggttgccgaaaatttgctgaatttgccggaaaaaaaaattccggaatttatttaaaaactttttgtaaaaattaaattaaatttgcaacttttcagagaagtctacctgacaatgcaatcatctttggactaccaagaagctgctcacaaattgctgaaaatgaagattccagacagcatgcaggtcagcgatgttgcaaagaaaaattttcgaccaaaaaaaccaaccaatcataaaatttaaaaaaaaactccgtttttttctttttttttatacgagaaaaaccaaaaaaatgtatttttgccaaattctaaaatactatccccgaaattttcaatatttttctctttcagaacgaactctgcgcgatgcttgtcgattgttgtgctcaacagcgtacctacgagcgattctacggaatgctcatcgaacgtttctgccgacttcgcctcgaataccagcaatactttgaaaagctctgccaggacacgtattccacgattcaccgaattgacatcacaaaactgcggaatttggctcgccttattgctcatttgctctcgacggatgctattgactggaagattttggccgatatgaaaatgaccgaagaggacacaacttcttctggcagaatctatattaaatatatatttaatgaacttgtggaggcgatgggaatggttaaacttcattcgagagttactgatccgtgagtttcctagagagagttgttttcgtattcaattttccctattttcagaactttggctcattgctttgttggattattcccacgaactaatccgaacagcgcacgattttcgatcaacttcttccacaatgattggattgggtggtttgacgttggaacttcgtgaatggctggcaaagggtctcaagaagaagaagggaatgctggatcagttgaaggccgaatcaagctcagattcatcgtcgtcttcggattcgtcagactcgtctgattcttcggattctgacgattcatccgactcgtcttcagattcctcatcttcttcagaatcagagccagaaccaccgaagaaaaagaagaa
gaagaacagtgaagagagttccaaaaagaaggaaaaagagaatattggtcgacgggatcgtggagacaagagagctgaacgtcatcgtgatcaaagtgtggagaacaaggacaaggatcgtcgacgtcgccaggattctgacgaaaatcgtcggccagaacgaggagatgaccgcaaggatcggagtaaagatcgtcgtcgtcaagactcggatgatgaggatcggaaaggtcgtgaacgtcgggaagattcaggggaaagacgtcgcggagatcgggatcgacgtgatcgaaacaaggatcaggaggatcaccgtgaagatcgccgtgaccgaagcaaggatcgtgaggatcgacgtgatcgccgtcgtcatgactctgatgatgatcgtaaaactcgtcgggatagaagtgaagagcgaggaggacgtcgtcgtgaagtggaatcggatgatcgacgccgacgtcgttgaattttcaaattttaaatactgaatatttgttttttttcctattatttatttattctctttgtgttttttttcttgctttctaaaaattaattcaatccaaatctaaacatgagcggttttttttctctttccgtctcccaattcgtattccgctcctctcatctgaacacaatgtgcaagtttatttatcttctcgctttcatttcattaggacgtgggggggaattggtggaagggggaaacacacaaaaggatgatggaaatgaaataaggacacacaatatgcaacaacattcaattcagaaatatggaggaaggtttaaaagaaaacataaaaatatatagaggaggaaggaaaactagtaaaaataagcaaagaaattaggcgaacgatgagaattgtcctcgcttggcaaatgcgaatccgtatggagaggcacgtttggcgaaggcaaatgttcggtatggagatctgaaaaatttttaagttgaaatttggtgttgctcttttacaaaattttccgattttcgcttgaaattacggtgccaggtctcgacacgtcttccaatttttcaaattcaaaagagcctttaatgggctgtagttgcaaatttctcgtttttgaaaatttttcttccgtttaatcgaaatttgatgaattttatttatgattttcaataaatttcaaagaaactggtgaaaactcggaaaattgtgaactacagtaatccaatccttaaaggcgcacaccttttaaatgtccgccccaatacgatatttttttaagattcgctagagcggccgccaccgcggtggagctccaattcgccctatagtgagtcgtattacaattcactggccgtcgttttacaacgtcgtgactgggaaaaccctggcgttacccaacttaatcgccttgcagcacatccccccttcgccagctggcgtaatagcgaagaggcccgcaccgatcgcccttcccaacagttgcgtagcctgaatggcgaatgggacgcgccctgtagcggcgcattaagcgcggcgggtgtggtggttacgcgcagcgtgaccgctacacttgccagcgccctagcgcccgctcctttcgctttcttcccttcctttctcgccacgttcgccggctttccccgtcaagctctaatcgggggctccctttagggttccgatttagtgctttacggcacctcgaccccaaaaaacttgattagggtgatggttcacgtagtgggccatcgccctgatagacggtttttcgccctttgacgttggagtccacgttctttaatagtggactcttgttccaaactggaacaacactcaaccctatctcggtctattcttttgatttataagggatttttgccgatttcggcctattggttaaaaaaatgagctgatttaacaaaaaatttaacgcgaattttaacaaaatattaacgtttacaatttcaggtggcactttttcggggaaatgtgcgcggaacccctatttgtttatttttctaaatacattcaaatatgtatccgctcatgagacaataaaccctgataaatgcttcaataatattgaaaaaggaaagagtatgagtattcaacatttccgtgtcgcccttattcccttttttgcggcattttgccttcctgtttttgctcacccagaaacgctggtgaaagtaaaagatgctgaagatcagttgggtgcacgagtgggttacatcgaactggatctcaacagcggtaagatccttgagagttttcgccccgaagaacgttttccaatgatgagcacttttaaagttctgctatgtggcgcggtattatcccgtattgacgccgggcaagagcaactcggtcgccgcatacactattctcagaatgacttggttgagtactcaccagtcacagaaaagcatcttacggatggcatgacagtaagagaattatgcagtgctgccataagcatgagtgataacactgcggccaacttacttctgacaacgatcggaggaccgaaggagctaaccgctttttttcacaacatgggggatcatgtaactcgccttgatcgttgggaaccggagctgaatgaagccataccaaacgacgagcgtgacaccacgatgcctgtagcaatggcaacaacgttgcgcaaactattaactggcgaactacttactctagcttcccggcaacaattaatagactggatggaggcggataaagttgcaggaccacttctgcgctcggcccttccggctggctggtttattgctgataaatctggagccggtgagcgtgggtctcgcggtatcattgcagcactggggccagatggtaagccctcccgtatcgtagttatctacacgacgggcagtcaggcaaactaatggatgaacgaaatagacagatcgctgagataggtgcctcactgattaagcattggtaactgtcagaccaagtttactcatatatactttagattgatttaaaacttcatttttaatttaaaaggatctaggtgaagatcctttttgataatctcatgaccaaaatcccttaacgtgagttttcgttccactgagcgtcagaccccgtagaaaagatcaaaggatcttcttgagatcctttttttctgcgcgtaatctgctgcttgcaaacaaaaaaaaccaccgctaccagcggtggtttgtttgccggatcaagagctaccaactctttttccgaaggtaactggcttcagcagagcgcagataccaaatactgtccttctagtgtagccgtagttaggccaccacttcaagaactctgtagcaccgcctacatacctcgctctgctaatcctgttaccagtggctgctgccagtggcgaagtcgtgtcttaccgggttggactcaagacgatagttaaccggataaggcgcagcggtcgggctgaacggggggttcgtgcacacagcccagcttggagcgaacgacctacaccgaactgagatacctacagcgtgagcattgagaaagcgccacgcttcccgaagggagaaaggcggacaggtatccggtaagcggcagggtcggaacaggagagcgcacgagggagcttccaggggggaacgcctggtatctttatagtcctgtcgggtttcgccacctctgacttgagcgtcgatttttgtgatgctcgtcaggggggccgagcctatggaaaaacgccagcaacgcggcctttttacggttcctggccttttgctggccttttgctcacatgttctttcctgcgttatcccctgattctgtggataaccgtattaccgcctttgagtgagctgataaccgctcgccgcagccgaacgaccgagcgcagcgagtcagtgagcgaggaagcggaagagcgcccaatacgcaaaccgcctctccccgcgcgttggccgattcattaatgcagctggcacgacaggtttcccgactggaaagcgggcagtgagcgcaacgcaattaatgtgagttacctcactcattaggcaccccaggctttacactttatgcttccggctcctatgttgtgtggaattgtgagcggataacaatttcacacaggaaacagctatgaccatgattacgccaagctcggaattaaccctcacaaagggaacaaaagctgggggggatcctccaaaatcgtcttccgctctgaaaaacgaaaagtggacctttgacatccgaaaaaatgggcgaaaaaatgaaattgagctttttgggtcgaaaaaaatgtttttagaatgctgagaacacgttaaacacgaagatcatatttattttgagacccggatgctctgaaaatgtctgacatagatttaaaaaagcatatatatatttttcattttcaacgtgaaagttttgtgcaactttatagaatctcctattggcacattgttttttataactgaggcagtttttgaacacctttttgaaactttgaatctctttgaagtatactgtcgaaaagactgacttgagcgttcgaaatgccagaagaaaactatatttgaatctcgcgctaaattgagaaatgcaaccgcgctccactggacaattggaaaaaaaatttattcggaggcgacaacggtattttcgaaattgattttctgtgtattttctcattttttataaattcttctttgatttatcgttcgtttgtgagaaatttaattgtatttcaaacttttttatagtaagata
pGN207SEQUENCE ID NO.11ccggtggtaccgctagccgtacgaacccgggttctagaactagtggatcccacttgagatcaacatgatcagaatcccaatcagttggctctggacgacctggtctatctggacgatcaaatggatttttagccaaaatatcggtttcagtttccaatggatcagaaggtccttcgctgttgacagccttgacacggaacttgtaatgatctcccttgttgagtgaatcgactgtgaagtgggtatctccactacgtccacatggaacccagattccgtccttggtgttcatcttttcaatttcatagaactcaattggctctcctccgtcatcctctggtggtttccagtcaagagttgcacgatcttcgaagacatcagttaacctcgattggtccctttggtttcgttggcttgctttttaccttgatattgatagtgacactgtcagttccattaatgttggttgcagtgatggtatattttccactttgcttacgaagtgcctttggcaaagcaaatctcgagatgtatggctcattttcaatttgagccttgctctctccgattccttttccattgaatgaccatgttacatctggtgctggctcaccatcaatatgaacaatgaacttgagagtggctccgaccttgacagttgtatcagaaagatcttcacgatgaatttcttggagcaaggtttcttggcttcgcaacaacacgatcagaaggatcagaaggatctccagttccagccttgttacgagcagaaattctgaattgatattcttctccctccttaagatttggaacagttgctgttttctgatctcctggaacaacgagagcttcttcccatcgtccattcttatccttctttttcaatgacgaaagcttatcgataccgtcgacctcgagggggggccctcgtcgagtcggtcacaatcacctgaaactccaaaggcagccagtgaggaacgtgaagaagaagaaaaagagtcatctgaacaggtttgattttctttctggtcaaaaagatgaaattattgattttcagccagatactcccaaaactagcagcgagaagtctgcaagtcgttcacagtcgcccagagaatcgcgggaagtgagccaagaggtatgtttttcaaaaatcaataactgatcataatttttattgtttggtgaatttaagaaaataatattcgaaaattcctctgaattatcaagattgcagtattaatttcgagaaaaattgagatattcatagagctattgtaaattttcttgatttcagactgaaacttcggaaaatcaagagaaaatcaaagaaaaggatgacggggatgatcagcctggcacaccgaacagctatagaagccgggaaacttcaccagctccaaaaaggtccaaggagaccaggtttgtcaaaagcttcctgcgattaattctcatttcaatttttcagagaatcagagtctcctgaaaaatccccggttcgttcaagatctcccagaaggtcttcagcacgttccccgtcacgatctcctagacggcgccgagaaagaagctcagaaagaaagcaatccgaagagccagcaccgctaccagagaaaaagaagaaagagccgctggatattctacgaacaagaaccggaggagcatatattccacccgccaaacttcgacttatgcaacaacagattagtgataagcaaagtgaacagtatcagagaatgaattgggaaagaatgaagaaaaagattcacggattggttaacagagtcaacgcgaagaatcttgaacaaattgtcagagaacttcttcaagagaatgtgattcgttcaaagtgagtgagaaaatcgaaggaaaaggaaagaattaatttaatttttcaggggacttctctgccgtgacattattcaagctcaggctttctcaccaggattctctaacgtctatgcagctttggcggcagttatcaactcgaaattccctcatgtcggtgaacttcttctccgtcgtctgattgtacagttcaaaagaagtttccgtagaaatgacagaggcgtcacggtgaacgtgatcaaattcatcgcacatttgattaatcaacaagttgctcacgaagttcttgcgctggaaatcatgattctgatgcttgaagaaccaactgatgattcagttgaagtcgccattgcgttcctgaaagagtgtggagcaaagcttctggagattgctccagcagctcttaacagtgtctacgaccgtcttcgtggcaattctcatggaaactgaaagatcggaaaatgcactggatcgacgtattcagtatatgattgagactgcaatgcagattcgaaaggacaaatttgcggtaaggtagaatatataaatagtttattgaaaaaaataaattagaataatttaaattcctactagccaatcaggcgacctttttgcgcatagttctattattgaaaaatttggagaatttctcatattctcgctcggaaatctggaattcgacgagatcttctggcttctgtgcagctgcatcgctttgtgctccctttctcgcttgtcttctgtgtacaccaagaaccttgttgagttcatcaactgaatctgtgactggcttgttgctcactggatgcactagacgactgattctcgagaaatcagattgagttgcgattagggtgacctagaaattgggaataatacgaacttttgaaaatattcaggaggattaaaaaaattattctcgacaatcctacaaatttacttattgcaccatgttgctccaacatttttcattaaaagttaatgaaaaaatgtagaaaatcggaaattggcaattttcagaccatttttaagcattttcaaaaaaaaattgcagctgaaataaatgtcattttcagataaatcgagcgattttctgttgtctgacactagtttttagttttaaaaaatgttggaagaacatggtgcaataggtaatttcatagaatttccatgtgttttttttcaattaaccaattatccaaatcttccaaactcacattttgcggagctgggctatcaagaatctgctgcagttttataagacgagcatctctgatatcactgaaaattaatttttaatcaaaacttgaatatcaactaaacccacttattaactttctcgatcttctgtcgttcggtacgatgacggtgaagaagccaattgtagtagttgatttggttcaagtcctttcggtgttgtacgtcagtgtcctgcaatgctatttagttataacttaggcctaagattcaatttaatgaagtgattaaatttgttcctgaacctcttaagatgatcttttggattagaaacatataagacaggtttacctatctattaaaaaacagatcaaaatagatacgaccaaatcggataatccatgcctacctggcattagctaaccggaaaaattttatagtttttttttgcaagaaaccactgaaaaccccctaattgtatacattttttggagcagcttctggtctttttgagcaataaaattcgataaaacagaatttaagtgtaaattgttcacatttagtttctattttatcaaattttgttgctcaaaaacattcgaagctgctctaaaaaaatgcattaaaaatggggttttcagtggtttttcaccattaaaaaagctaattttaactaaaaatccatcatatttccaactttgtcacaacaataaaatgctggtcaaaatgtgttcgaaaaaatgtttttttttttaatttttataatttaaaaatagttttctttcgctgggacacatacatttttgggcgtaaattttcagttcaaatttccatttttacaaccataatcataaagctacgtctgatctctctcgcacttacctgcgcctgattcgaaagaacaaccgtagccaaaagaacaagaagaacaagcacgtagttgtgtgtcttcgacgcacgcatgcatccataagcataatccaggagggatggagagaaaaatcttgtttctaagcccctccctttgtaatacatacacatatctaataccgaagaatggctaattgaatggacgtcagctgttgctgtagttgccaaggcatcatcgatgaaataactgaaagaaagaattaaataattattgcaggcgtatccggcggtcattgaagacttggacttgattgaggaggaggatcagatcatccatacacttaatttggaggatgcggttgatccggaaaatgggcttagtaagtgactgaccacacgcggggggcattaatttaataaattgaattccatttcagatgtgttcaaactagatccagaattcgaaaagaacgaggaggtttatgaggagatccgtaaggaaaatcattggaaacgccgatattcggatgaggatggtggcgacgagttggatgatgaagaagagggtagtgatgtggaagaggctccgaagaagactacagagattattgataatactgatcagaattgactgctttcagaaggtattcattttgagttttgggccggcaaatctgtaagttgccggttgccgaaaatttgctgaatttgccggaaaaaaaaattccggaatttatttaaaaactttttgtaaaaattaaattaaaatttgcaacttttcagagaagtctacctgacaatgcaatcatctttggactaccaagaagctgctcacaaattgctgaaaatgaagattccagacagcatgcaggtcagcgatgttgcaaagaaaattttcgaccaaaaccaaccaatcataaaatttaaaaaaaaactccgtttttttcttttttttttatacgagaaaaaccaaaaaaatgtatttttgccaaattctaaaatactatccccgaaattttcaatattttctctttcagaacgaactctgcgcgatgcttgtcgattgttgtgctcaacagcgtacctacgagcgattctaacggaatgctcatcgaacgtttctgccgacttcgcctcgaataccagcaatactttgaaaagctctgccaggacacgtattccacgattcaccgaattgacatcacaaaactgcggaatttggctcgccttattgctcatttgctctcgacaaatgctattgactggaagattttggccagtatgaaaatgaccgaagaggacacaacttcttctggcagaatctatattaaatatatatttaatgaacttgtggaggcgatgggaatggttaaacttcattcgagagttactgatccgtgagtttcctagagagagttgttttcgtattcaattttccctattttcagaactttggctcattgctttgttggattattcccacgaactaatccgaacagcgcacgattttcgatcaacttcttcacaatgattggattgggtggtttgacgttggaacttcgtgaatggctggcaaagggtctcaagaagaagaagggaatgctggatcagttgaaggccgaatcaagctcagattcatcgtcgtcttcggattcgtcagactcgtctgattcttcggattctgacgattcatccgactcgtcttcagattcctcatcttcttcagaatcagagccagaaccaccgaagaaaaagaagaagaagaacagtgaagagagttccaaaaagaag
gaaaaagagaatattggtcgacggggatcgtggagacaagagagctgaacgtcatcgtgatcaaagtgtggagucaaggacaaggatcgtcgacgtcgccaggattctgacgaaaatcgtcggccagaacgaggagatgaccgcaaggatcggagtaaagatcgtcgtcgtcaagactcggatgatgaggatcggaaaggtcgtgaacgtcgggaagattcaggggaaagacgtcgcggagatcggatcgacgtgatcgaaacaaggatcaggaggatcaccgtgaagatcgccgtgaccgaagcaaggatcgtgaggatcgacgtgatcgccgtcgtcatgactctgatgatgatcgtaaaactcgtcgggatagaagtgaagagcgaggaggacgtcgtcgtgaagtggaatcggatgatcgacgccgacgtcgttgaattttcaaattttaaatactgaatatttgttttttttcctattatttatttattctctttgtgttttttttcttgctttctaaaaattaattcaatccaaatctaaacatgagcggttttttttctctttccgtctcccaattcgtattccgctcctctcatctgaacacaatgtgcaagtttatttatcttctcgctttcatttcataggacgtggggggaattggtggaagggggaaacacacaaaaggatgatggaaatgaaataaggacacacaatatgcaacaacattcaattcagaaatatggaggaaggtttaaaagaaaacataaaaatatatagaggaggaaggaaaactagtaaaaaataagcaaagaaattaggcgaacgatgagaattgtcctcgcttggcaaatgcgaatccgtatggagaggcacgtttggcgaaggcaaatgttcggtatggagatctgtaaaaatttttaagttgaaatttggtgugctcttttacaaaattttccgattttcgcttgaaattacggtgccaggtctcgacacgtcttccaatttttcaaattcaaaaagagcctttaatgggctgtagttgctaatttctcggtttgaaaatttttcttccgtttaatcgaaatttgatgtatrrtatttatgattttcaataaatttcaaagaaactggtgaaaactcggaaaattgtgaactacagtaatccaatccttaaaggcgcacaccttttaaatgtccgccccaatacgatatttttttaagattcgctagagcggccgccaccgcggtggagctccaattcgccctataghtpgtcgtattacaattcactggccgtcgttttacaacgtcgtgactgggaaaaccctggcgttacccaacttaatcgccttgcagcacatccccccttcgccagctggcgtaaatagcgaagaggcccgcaccgatcgcccucccaacagttgcgtagcctgaatggcgaatgggacgcgccctgtagcggcgcattaagcgcggcgggtgtggtggttacgcgcagcgtgaccgctacacttgccagcgccctagcgcccgctcctttcgctttcttcccttcctttctcgccacgttcgccggctttccccgtcaagctctaaatcgggggctccctttagggttccgatttagtgctttacggcacctcgaccccaaaaaacttgattagggtgatggttcacgtagtgggccatcgccctgatagacggtttttcgccctttgacgttggagtccacgttctttaatagtggactcttgttccaaactggaacaacactcaaccctatctcggtctattcttttgatttataagggattttgccgatttcggcctattggttaaaaaaatgagctgatttaacaaaaatttaacgcgaattttaacaaaatattaacgtttacaatttcaggtggcacttttcggggaaatgtgcgcggaacccctatttgtttatttttctaaatacattcaaatatgtatccgctcatgagacaataaccctgataaatgcttcaataatattgaaaaaggaagagtatgagtattcaacatttccgtgtcgcccttattcccttttttgcggcattttgccttcctgtttttgctcacccagaaacgctggtgaaagtaaaagatgctgaagatcagttgggtgcacgagtgggttacatcgaactggatctcaacagcggtaagatccttgagagttttcgccccgaagaacgttttccaatgatgagcacttttaaagttctgctatgtggcgcggtattatcccgtattgacgccgggcaagagcaactcggtcgccgcatacactattctcagaatgacttggttgagtactcaccagtcacagaaaagcatcttacggatggcatgaccagtaagagaattatgcagtgctgccataagcatgagtgataacactgcggccaacttacttctgacaacgatcggaggaccgaaggagctaaccgctttttttcacaacatgggggatcatgtaactcgccttgatcgttgggaaccggagctgaatgaagccataccaaacgacgagcgtgacaccacgatgcctgtagcaatggcaacaacgttgcgcaaactattaactggcgaactacttactctagcttcccggcaacaattaaatagactggatggaggcggataaagttgcaggaccacttctgcgctcggcccttccggctggctggtttattgctgataaatctggagccggtgagcgtgggtctcgcggtatcattgcagcactggggccagatggtaagccctcccgtatcgtagttatctacacgacgggcagtcaggcaactatggatgaacgaaatagacagatcgctgagataggtgcctcactgattaagcattggtaactgtcagaccaagtttactcatatatactttagattgatttaaaacttcatttttaatttaaaaggatctaggtgaagatccttttgataatctcatgaccaaaatcccttaacgtgagttttcgttccactgagcgtcagaccccgtagaaaagatcaaaggatcttcttgagatccttttttctgcgcgtaatctgctgcttgcuaaacaaaaaaaccaccgctaccagcggtggtttgtttgccggatcaagagctaccaactctttttccgaaggtaactggcttcagcagagcgcagataccaaatactgtccttctagtgtagccgtagttaggccaccacttcaagaactctgtagcaccgcctacatacctcgctctgctaatcctgttaccagtggctgctgccagtggcgataagtcgtgtcttaccgggttggactcaagacgatagttaccggataaggcgcagcggtcgggctgaacggggggttcgtgcacacagcccagcttggagcgaacgacctacaccgaactgagatacctacagcgtgagcattgagaaagcgccacgcttcccgaagggagaaaggcggacaggtatccggtaagcggcagggtcggaacaggagagcgcacgagggagcttccaggggggaacgcctggtatctttatagtcctgtcgggtttcgccacctctgacttgagcgtcgatttttgtgatgctcgtcaggggggccgagcctatggaaaaacgccagcaacgcggcctttttacggttcctggccttttgctggccttttgctcacatgttctttcctgcgrtatccccttgattctgtggattaaccgtattaccgcctttgagtgagctgataccgctcgccgcagccgaacgaccgagcgcagcgagtcagtgagcgaggaagcggaagagcgcccaatacgcaaaccgcctctccccgcgcgttggccgattcattaatgcagctggcacgacaggtttcccgactggaaagcgggcagtgagcgcaacgcaattaatgtgagttacctcactcattaggcaccccaggctttacactttatgcttccggctcctatgttgtgtggaattgtgagcggataacaatttcacacaggaaacagctatgaccatgattacgccaagctcggaattaaccctcactaaagggaacaaaagctgggggggatcctccaaaatcgtcttccgctctgaaaaacgaaagtggacctttgacatccgaaaaaatgggcgaaaaaatgaaaattgagctttttgggtcgaaaaaaatgtttttagaatgctgagaacacgttaaacacgaagatcatatttattttgagacccggatgctctgaaaatgtctgacatagatttaaaaaagcatatatatatttttcattttcaacgtgaaagttttgtgcaactttatagaatctcctattggcacattgttttttatttaactgaggcagtttttgaacacctttttgaaactttgaatctctttgaagtatactgtcgaaaagactgacttgagcgttcgaaatgccagaagaaaactatatttgaatctcgcgctaaattgagaaatgcaaccgcgctccactggacaattggaaaaaaaatttattcggaggcgacaacggtattttcgaattttgattttctgtgtatttttctcattttttataaattcttctttgatttatcgttcgtttgtgagaaatttaattgtattcaaactttttatagtaagata
權(quán)利要求
1.負責(zé)在細胞中賦予特定表型的DNA的鑒定方法,所述方法包括a)以相應(yīng)于啟動子、當(dāng)合適的轉(zhuǎn)錄因子結(jié)合于所述啟動子時能夠啟動從所述cDNA或DNA轉(zhuǎn)錄出雙鏈(ds)RNA的方向,在合適的載體中構(gòu)建所述細胞DNA的cDNA文庫或基因組文庫,b)將所述文庫引入包含所述轉(zhuǎn)錄因子的一種或多種所述細胞中,且c)鑒定和分離包含所述文庫的特定表型的所述細胞,并鑒定所述文庫中負責(zé)賦予所述表型的DNA或cDNA片段。
2.按照權(quán)利要求1的方法,其中在步驟b)之前,將所述文庫組成為等級庫。
3.將功能確定到已知DNA序列的方法,所述方法包括a)鑒定細胞中所述DNA序列的同源物,b)從所述細胞中分離出相關(guān)的DNA同源物或其片段,c)將所述同源物或其片段以相應(yīng)于合適啟動子、當(dāng)合適的轉(zhuǎn)錄因子結(jié)合于所述啟動子時能夠啟動從所述DNA同源物或其片段轉(zhuǎn)化dsRNA的方向,克隆到合適的載體中,d)將所述載體引入得自步驟a)的包含所述轉(zhuǎn)錄因子的所述細胞中,且e)鑒定與野生型相比的所述細胞的表型。
4.根據(jù)權(quán)利要求1-3中任一項的方法,其中將所述DNA文庫、同源物或片段以相應(yīng)于所述啟動子的有義和反義的方向克隆。
5.根據(jù)權(quán)利要求1-3中任一項的方法,其中將所述DNA文庫、同源物或片段克隆在兩個啟動子之間,使得當(dāng)合適的轉(zhuǎn)錄因子結(jié)合于所述啟動子時能夠從所述DNA文庫、同源物或片段產(chǎn)生dsRNA。
6.根據(jù)權(quán)利要求1-5中任一項的方法,其中所述細胞被改變以表達所述轉(zhuǎn)錄因子。
7.根據(jù)權(quán)利要求1-6中任一項的方法,其中將所述DNA文庫、同源物或片段構(gòu)建在合適的載體中,所述載體包含一段有效連接至合適啟動子的編碼所述轉(zhuǎn)錄因子的核苷酸序列。
8.根據(jù)權(quán)利要求1-6中任一項的方法,其中所述轉(zhuǎn)錄因子由另一載體編碼,所述另一載體與包含所述DNA文庫、同源物或片段無關(guān)的載體,并且編碼所述轉(zhuǎn)錄因子的序列有效連接至合適的啟動子。
9.根據(jù)權(quán)利要求7或8的方法,其中所述轉(zhuǎn)錄因子包括T7、T3或SP6聚合酶中的任一種。
10.根據(jù)權(quán)利要求7或8的方法,其中所述合適的啟動子包括let858、SERCA、UL6、myo-2或myo-3中的任一種。
11.根據(jù)權(quán)利要求7-10中任一項的方法,其中所述合適的載體或所述另一載體包含一個選擇標(biāo)記。
12.根據(jù)權(quán)利要求11的方法,其中所述選擇標(biāo)記包含能夠抑制或防止基因在所述細胞中表達的核苷酸序列,而所述基因負責(zé)賦予一種已知表型。
13.根據(jù)權(quán)利要求12的方法,其中所述核苷酸序列包含的一段片列是賦予所述表型的所述基因的一部分,或與所述基因相同,而所述核苷酸序列本身的定向與在合適的轉(zhuǎn)錄因子結(jié)合于所述啟動子時能夠啟動雙鏈RNA轉(zhuǎn)錄的合適啟動子相應(yīng)。
14.根據(jù)權(quán)利要求12的方法,其中所述核苷酸序列是賦予所述表型的所述基因序列的一部分,或與所述基因序列相同,而所述核苷酸序列是這樣的序列,以致允許所述合適的載體或另一載體通過同源重組整合到所述細胞的基因組中,并且在所述整合后,所述核苷酸序列能夠抑制賦予所述表型的所述基因序列的表達。
15.根據(jù)權(quán)利要求14的方法,其中所述核苷酸序列包含足以防止所述核苷酸序列在其整合到所述基因組中之后進行翻譯的終止密碼子。
16.根據(jù)任一前述權(quán)利要求的方法,其中所述細胞為適合于飼喂、轉(zhuǎn)化或感染生物的微生物。
17.根據(jù)權(quán)利要求1-14中任一項的方法,其中所述細胞包含于生物或其胚胎中。
18.根據(jù)權(quán)利要求1-17中任一項的方法,其中所述啟動子為T7啟動子。
19.根據(jù)權(quán)利要求12-18中任一項的方法,其中所述已知基因序列包括sup-35基因或其片段,在將所述載體引入pha-1 et123ts突變C.elegans蠕蟲的基因座中之后,通過鑒定在高于25℃的溫度下生長的后代,可選擇出所述基因或其片段。
20.根據(jù)權(quán)利要求1-19中任一項的方法,其中使所述細胞或生物與用于篩選所需表型的所述化合物接觸,所述表型諸如當(dāng)與野生型細胞或生物相比時對所述化合物的抗性或敏感性。
21.根據(jù)任一前述權(quán)利要求的方法,其中所述轉(zhuǎn)錄因子是可誘導(dǎo)的。
22.根據(jù)權(quán)利要求16的方法,其中所述微生物為RNA酶III陰性、且最好為RNA酶陰性的大腸桿菌菌株。
23.根據(jù)權(quán)利要求17的方法,其中所述生物選自線蟲綱。
24.根據(jù)權(quán)利要求23的方法,其中所述生物為Caenorhabditiselegans。
25.產(chǎn)生包含一種外源轉(zhuǎn)錄因子和一種轉(zhuǎn)基因的轉(zhuǎn)基因非人類生物的方法,其中所述轉(zhuǎn)基因包含一個有效連接至DNA片段的啟動子,當(dāng)所述轉(zhuǎn)錄因子結(jié)合于啟動子時,表達所述DNA片段;所述方法包括a)提供包含第一構(gòu)成物的第一轉(zhuǎn)基因生物和包含第二構(gòu)成物的第二轉(zhuǎn)基因生物,所述第一構(gòu)成物加入了編碼外源轉(zhuǎn)錄因子的DNA,而所述第二構(gòu)成物包括至少一個有效連接至所需DNA序列的啟動子,在所述第一轉(zhuǎn)基因生物的所述轉(zhuǎn)錄因子結(jié)合于所述啟動子時,表達所需DNA序列。b)將所述第一轉(zhuǎn)基因生物與所述第二轉(zhuǎn)基因生物雜交,并選擇表達所述所需DNA序列的后代。
26.根據(jù)權(quán)利要求25的方法,其中通過將所述第一和第二構(gòu)成物轉(zhuǎn)化到相應(yīng)的微生物中,隨后用所述微生物飼喂所述相應(yīng)的生物,來產(chǎn)生所述第一和第二轉(zhuǎn)基因生物。
27.根據(jù)權(quán)利要求25或26的方法,其中所述第二構(gòu)成物包含所述所需DNA序列,所述所需DNA序列相應(yīng)于所述啟動子的方向,使得可以當(dāng)所述轉(zhuǎn)錄因子結(jié)合于所述啟動子時,能夠啟動從所述DNA轉(zhuǎn)錄出dsRNA。
28.根據(jù)權(quán)利要求27的方法,其中所述第二構(gòu)成物包含兩個鄰接所述所需DNA序列的啟動子,所述啟動子在所述轉(zhuǎn)錄因子與其結(jié)合時,可以啟動從所述DNA序列轉(zhuǎn)錄出dsRNA。
29.根據(jù)權(quán)利要求27的方法,其中以相應(yīng)于所述啟動子的有義和反義的方向提供所述DNA序列,使得在所述轉(zhuǎn)錄因子結(jié)合于所述啟動子時產(chǎn)生dsRNA。
30.根據(jù)權(quán)利要求25-29中任一項的方法,其中所述第二轉(zhuǎn)基因生物還包含一個有效連接至啟動子的報道基因,所述啟動子在所述轉(zhuǎn)錄因子與其結(jié)合時能夠啟動所述報道基因的轉(zhuǎn)錄。
31.根據(jù)權(quán)利要求25-30中任一項的方法,其中所述轉(zhuǎn)錄因子包括聚合酶。
32.根據(jù)權(quán)利要求31的方法,其中所述聚合酶包括T7、T3或SP6聚合酶中的任一種。
33.根據(jù)權(quán)利要求25-31中任一項的方法,其中所述啟動子包括T7、T3或SP6啟動子中的任一種。
34.根據(jù)權(quán)利要求30的方法,其中所述報道基因包括包括熒光素酶、綠熒光蛋白、β半乳糖苷酶或β-內(nèi)酰胺酶的編碼序列中的任一種。
35.根據(jù)權(quán)利要求25-30中任一項的方法,其中所述生物為線蟲綱物種的生物。
36.根據(jù)權(quán)利要求35的方法,其中所述線蟲綱物種為C.elegans。
37.根據(jù)權(quán)利要求25-34中任一項的方法可獲得的轉(zhuǎn)基因非人類多細胞生物。
38.在酵母雙雜種載體實驗所鑒定的克隆的驗證方法,所述方法包括a)提供一種構(gòu)成物,所述構(gòu)成物包含在雙雜種載體實驗中所鑒定的蛋白的編碼DNA,所述構(gòu)成物使得所述DNA以相應(yīng)于一個或多個啟動子的方向定向,在合適的轉(zhuǎn)錄因子結(jié)合于所述啟動子時,所述啟動子能夠啟動從所述DNA轉(zhuǎn)錄出雙鏈RNA,b)用所述構(gòu)成物轉(zhuǎn)化包含所述轉(zhuǎn)錄因子的細胞,并且c)鑒定在所述細胞或生物中與野生型相比的表型變化。
39.根據(jù)權(quán)利要求38的方法,其中在兩個啟動子之間提供所述DNA序列,所述啟動子在所述轉(zhuǎn)錄因子結(jié)合于所述啟動子時,能夠啟動從所述DNA序列轉(zhuǎn)錄出dsRNA。
40.根據(jù)權(quán)利要求38的方法,其中以相應(yīng)于所述啟動子的有義和反義的方向提供所述DNA,使得合適的轉(zhuǎn)錄因子與所述啟動子的結(jié)合,啟動從所述DNA轉(zhuǎn)錄出dsRNA。
41.根據(jù)權(quán)利要求38-40中任一項的方法,其中所述轉(zhuǎn)錄因子在所述細胞中是可誘導(dǎo)的。
42.根據(jù)權(quán)利要求38-41中任一項的方法,其中所述啟動子為噬菌體聚合酶啟動子,而所述轉(zhuǎn)錄因子為RNA聚合酶。
43.根據(jù)權(quán)利要求42的方法,其中所述聚合酶為T7RNA聚合酶、T3RNA聚合酶或SP6RNA聚合酶中的任一種。
44.根據(jù)權(quán)利要求43的方法,其中所述啟動子包括T7、T3或SP6啟動子中的任一種。
45.根據(jù)權(quán)利要求38-44中任一項的方法,其中所述構(gòu)成物使得它可以用于酵母雙雜種實驗。
46.根據(jù)權(quán)利要求38-45中任一項的方法,其中所述細胞為大腸桿菌細胞。
47.根據(jù)權(quán)利要求38-45中任一項的方法,其中所述細胞為生物或其胚胎的一部分。
48.根據(jù)權(quán)利要求47的方法,其中所述生物為線蟲綱物種的生物,最好為C.elegans。
49.在圖1中圖解的質(zhì)粒pGN1。
50.在圖2中圖解的質(zhì)粒pGN100。
51.在圖4、15或16(Sequence ID No 8和9)的任一個中圖解的酵母雙雜種載體質(zhì)粒。
52.在圖7中圖解的質(zhì)粒。
53.在圖8中圖解的質(zhì)粒。
54.減輕植物害蟲侵染的方法,所述方法包括a)從所述害蟲中鑒定出對其生存、生長、增殖重要的DNA序列,b)在合適的載體中,以相對于啟動子的方向克隆得自步驟a)的所述序列或其片段,所述啟動子在合適的轉(zhuǎn)錄因子與其結(jié)合時能夠啟動從所述DNA序列轉(zhuǎn)錄出RNA或dsRNA,并且c)將所述載體引入所述植物中。
55.根據(jù)權(quán)利要求54的方法,其中在兩個啟動子之間提供所述DNA序列,使得所述轉(zhuǎn)錄因子結(jié)合于所述啟動子,導(dǎo)致從所述DNA序列轉(zhuǎn)錄出dsRNA。
56.根據(jù)權(quán)利要求54的方法,其中以相應(yīng)于所述啟動子的有義和反義的方向提供所述DNA,使得所述轉(zhuǎn)錄因子結(jié)合于所述啟動子,導(dǎo)致從所述DNA轉(zhuǎn)錄出dsRNA。
57.根據(jù)權(quán)利要求54的方法,其中所述害蟲為線蟲蠕蟲。
58.根據(jù)權(quán)利要求57的方法,其中所述線蟲包括小墊刃線蟲屬物種(Tylenchulus ssp.)、穿孔線蟲屬物種(Radopholus ssp.)、細桿滑刃線蟲屬物種(Rhadinaphelenchus ssp.)、異皮線蟲屬物種(Heterodera ssp.)、小盤旋線蟲屬物種(Rotylenchulus,ssp.)、短體線蟲屬物種(Pratylenchusssp.)、刺線蟲屬物種(Belonolaimus ssp.)、Canjanus ssp.、根結(jié)線蟲屬物種(Meloidogyne ssp.)、球異皮線蟲屬物種(Globodera ssp.)、科布線蟲屬物種(Nacobbus ssp.)、莖線蟲屬物種(Dity1enchus ssp.)、滑刃線蟲屬物種(Aphelenchoides ssp.)、潛根線蟲屬物種(Hirschmenniella ssp.)、鰻線蟲屬物種(Anguina ssp.)、紐帶線蟲屬物種(Hoplo1aimus ssp.)、螺旋線蟲屬物種(Heliotylenchus ssp.)、小環(huán)線蟲屬物種(Criconemella ssp.)、劍線蟲屬物種(Xiphinema ssp.)、長針線蟲屬物種(Longidorus ssp.)、毛刺線蟲屬物種(Trichodorus ssp.)、副毛刺線蟲屬物種(Paratrichodorus ssp.)、真滑刃線蟲屬物種(Aphelenchs ssp.)中的任一種。
59.根據(jù)權(quán)利要求55的方法,其中將所述DNA序列或其片段克隆在兩個組織特異性啟動子之間,最好是克隆在兩個根特異性啟動子之間。
60.用于按照任一前述權(quán)利要求的方法的表達載體,所述載體包含一個或多個啟動子,所述啟動子相對于DNA序列的定向使得在合適的轉(zhuǎn)錄因子結(jié)合于所述一個或多個啟動子時,所述啟動子能夠啟動從所述DNA序列轉(zhuǎn)錄出雙鏈RNA。
61.根據(jù)權(quán)利要求60的表達載體,其包含兩個鄰接所述DNA序列的相同的啟動子。
62.根據(jù)權(quán)利要求60的表達載體,其包含相對于所述啟動子為有義和反義方向的所述DNA。
63.根據(jù)權(quán)利要求60-62中任一項的表達載體,其還包含一段編碼選擇標(biāo)記的核苷酸序列。
64.根據(jù)權(quán)利要求63的表達載體,其中將編碼所述選擇標(biāo)記的所述核苷酸序列相對于所述啟動子的定向,使得在合適的轉(zhuǎn)錄因子結(jié)合于所述啟動子時,發(fā)生從所述核苷酸序列轉(zhuǎn)錄出雙鏈RNA。
65.根據(jù)權(quán)利要求64的表達載體,其中在兩個相同的啟動子之間提供編碼所述選擇標(biāo)記的所述核苷酸序列,所述啟動子在所述轉(zhuǎn)錄因子結(jié)合于所述啟動子時,能夠啟動從所述核苷酸序列轉(zhuǎn)錄出dsRNA。
66.根據(jù)權(quán)利要求64的表達載體,其中以相對于所述啟動子的有義和反義方向提供編碼所述選擇標(biāo)記的所述核苷酸序列,使得在合適的轉(zhuǎn)錄因子結(jié)合于所述啟動子時,從所述核苷酸序列轉(zhuǎn)錄出雙鏈RNA。
67.根據(jù)權(quán)利要求63或64的表達載體,其中所述選擇標(biāo)記包含一段編碼sup-35的核苷酸序列,用于引入具有pha-1突變的C.elegans中。
68.表達載體,用于表達用于按照權(quán)利要求1-48和54-59中任一項的方法中的合適的轉(zhuǎn)錄因子,所述載體包含一段有效連接至合適的表達控制序列的、編碼所述轉(zhuǎn)錄因子的核苷酸序列。
69.根據(jù)權(quán)利要求68的表達載體,其中所述表達控制序列包括誘導(dǎo)型啟動子、組成型啟動子、普遍性啟動子或組織特異性啟動子或它們的組合。
70.根據(jù)權(quán)利要求68-69中任一項的表達載體,其中所述轉(zhuǎn)錄因子包括噬菌體聚合酶,最好是T7RNA聚合酶。
71.用根據(jù)權(quán)利要求49-53中任一項的質(zhì)?;蛴酶鶕?jù)權(quán)利要求60-70中任一項的表達載體轉(zhuǎn)化或轉(zhuǎn)染的生物或細胞。
72.根據(jù)權(quán)利要求71的生物,其中所述生物為線蟲綱物種的生物,最好是C.elegans。
73.將dsRNA或?qū)⒛軌虍a(chǎn)生dsRNA的DNA引入生物中的方法,所述方法包括用包含根據(jù)權(quán)利要求60-67中任一項的表達載體的合適微生物飼喂所述生物,或用根據(jù)權(quán)利要求60-67中任一項的表達載體直接飼喂所述生物。
74.根據(jù)權(quán)利要求73的方法,其中所述微生物或所述生物被改變以表達所述轉(zhuǎn)錄因子。
75.根據(jù)權(quán)利要求74的方法,其中或者所述微生物或者所述生物包含根據(jù)權(quán)利要求66-69中任一項的表達載體。
76.根據(jù)權(quán)利要求73-75中任一項的方法,其中所述生物為C.elegans,而所述微生物是大腸桿菌。
77.根據(jù)權(quán)利要求76的方法,其中所述大腸桿菌菌株為RNA酶III陰性菌株。
78.根據(jù)權(quán)利要求73-75中任一項的方法,其中所述生物為C.elegans nuc-1突變體。
79.選擇系統(tǒng),用于鑒定用根據(jù)權(quán)利要求60-63的載體對細胞或生物的轉(zhuǎn)化,所述系統(tǒng)包括一個根據(jù)權(quán)利要求60-63的載體,而所述選擇標(biāo)記包括一段在所述細胞或生物中能夠抑制或防止負責(zé)賦予已知表型的基因表達的核苷酸序列。
80.根據(jù)權(quán)利要求79的選擇系統(tǒng),其中所述核苷酸序列包含的一段序列是賦予所述已知表型的所述基因的一部分,或與所述基因相同,而所述核苷酸序列本身位于兩個相同啟動子之間,所述啟動子在合適的轉(zhuǎn)錄因子結(jié)合于所述啟動子時,能夠啟動轉(zhuǎn)錄雙鏈RNA轉(zhuǎn)錄。
81.根據(jù)權(quán)利要求79的選擇系統(tǒng),其中所述核苷酸序列是賦予所述細胞或生物已知表型的所述基因的一部分,或與所述基因相同,并且所述核苷酸序列允許所述載體通過同源重組整合到所述細胞或生物的染色體中,并且在所述整合后,所述序列抑制賦予所述已知表型的所述基因序列的表達。
82.根據(jù)權(quán)利要求81的選擇系統(tǒng),其中所述核苷酸序列包含足以防止所述核苷酸序列在整合到所述基因組中后翻譯的終止密碼子。
83.根據(jù)權(quán)利要求79的選擇系統(tǒng),其中所述已知基因序列包含sup-35基因或其片段,在將所述載體引入pha-1 et123ts突變型C.elegans蠕蟲中之后,通過鑒定在高于25℃的溫度下生長的后代,可選擇出所述基因或其片段。
84.根據(jù)權(quán)利要求74的方法,其中所述轉(zhuǎn)錄因子為T7 RNA聚合酶。
85.將功能確定到多細胞生物的DNA序列的方法,所述方法包括a)將以下構(gòu)成物i)第一構(gòu)成物,包含以有義方向克隆的、在合適的啟動子調(diào)節(jié)下的所述DNA序列,ii)第二構(gòu)成物,包含以反義方向克隆的、在與步驟(i)中的相同啟動子調(diào)節(jié)下的所述DNA序列,提供到多細胞生物中,所述多細胞生物被改變以啟動從合適的啟動子轉(zhuǎn)錄所述DNA片段,b)鑒定與野生型相比的所述多細胞生物的表型。
86.將功能確定到給多細胞生物的DNA序列的方法,所述方法包括a)在多細胞生物中提供i)第一構(gòu)成物,包含在兩個能夠在所述多細胞生物中啟動轉(zhuǎn)錄的啟動子之間克隆的所述DNA片段,所述多細胞生物能夠啟動從合適的啟動子轉(zhuǎn)錄所述DNA片段,b)鑒定與野生型相比的所述多細胞生物的表型。
87.在C.elegans中表達基因、cDNA或DNA片段的方法,所述方法包括i)提供表達外源轉(zhuǎn)錄因子的轉(zhuǎn)基因C.elegans,ii)將所述基因或cDNA或DNA片段克隆到合適的載體中,與在所述外源轉(zhuǎn)錄因子與啟動子結(jié)合時能夠啟動所述基因、cDNA或DNA片段轉(zhuǎn)錄的啟動子有效連接,iii)將所述載體引入得自步驟i)的所述轉(zhuǎn)基因C.elegans中。
88.根據(jù)權(quán)利要求87的方法,其中所述外源轉(zhuǎn)錄因子為噬菌體聚合酶。
89.根據(jù)權(quán)利要求88的方法,其中所述噬菌體聚合酶為T3、SP6或T7 RNA聚合酶。
90.根據(jù)權(quán)利要求87-89中任一項的方法,其中所述啟動子為T7、T3或SP6啟動子中的任一種。
全文摘要
提供負責(zé)在細胞中賦予特定表型的DNA的鑒定方法,所述方法包括a)以相應(yīng)于啟動子、當(dāng)合適的轉(zhuǎn)錄因子結(jié)合于所述啟動子時能夠啟動從所述cDNA或DNA轉(zhuǎn)錄出雙鏈(ds)RNA的方向,在合適的載體中構(gòu)建所述細胞DNA的cDNA文庫或基因組文庫,b)將所述文庫引入包含所述轉(zhuǎn)錄因子的一種或多種所述細胞中,且c)鑒定和分離包含所述文庫的特定表型的所述細胞,并鑒定所述文庫中負責(zé)賦予所述表型的DNA或cDNA片段。采用該技術(shù),可以將功能確定到已知DNA序列,方法為a)鑒定細胞中所述DNA序列的同源物,b)從所述細胞中分離出相關(guān)的DNA同源物或其片段,c)將所述同源物或其片段以相應(yīng)于合適啟動子、當(dāng)合適的轉(zhuǎn)錄因子結(jié)合于所述啟動子時能夠啟動從所述DNA同源物或其片段轉(zhuǎn)化dsRNA的方向,克隆到合適的載體中,d)將所述載體引入得自步驟a)的包含所述轉(zhuǎn)錄因子的所述細胞中。
文檔編號C12Q1/68GK1900319SQ200610094480
公開日2007年1月24日 申請日期1999年7月2日 優(yōu)先權(quán)日1998年7月3日
發(fā)明者G·普萊廷克, C·普拉托伊夫, K·莫蒂爾, T·波格爾特 申請人:德福根有限公司