突變受體以及它們在基于核受體的誘導型基因表達系統(tǒng)中的應用的制作方法

文檔序號：813997閱讀：274來源：國知局

專利名稱：突變受體以及它們在基于核受體的誘導型基因表達系統(tǒng)中的應用的制作方法
技術領域：
本發(fā)明涉及生物技術或遺傳工程領域。具體地，本發(fā)明涉及基因表達領域。更具體地，本發(fā)明涉及包含置換突變的新型核受體，和它們在基于核受體的誘導型基因表達系統(tǒng)中的應用，以及使用這種誘導型基因表達系統(tǒng)在宿主細胞內(nèi)調(diào)節(jié)基因表達的方法。
背景技術：
本文引用了各種公開物，它們的公開內(nèi)容以其整體并入本文，作為參考。然而，本文中對任何文獻的引用不應該解釋為承認所引用的文獻是相對于本申請的“現(xiàn)有技術”。在遺傳工程領域，基因表達的精確控制對于研究、操縱和控制發(fā)育和其他生理過程而言是有價值的工具?；虮磉_是復雜的生物過程，涉及大量特定的蛋白質-蛋白質相互作用。引發(fā)基因表達，從而產(chǎn)生RNA，是蛋白合成所必需的第一步，為此，轉錄激活子必需被帶到控制基因轉錄的啟動子的附近。通常，轉錄激活子本身與具有至少一個DNA結合結構域的蛋白締合，所述DNA結合結構域與存在于基因的啟動子區(qū)域中的DNA結合位點結合。因此，為了使得基因表達發(fā)生，包含DNA結合結構域以及與該DNA結合域具有適當距離的反式激活結構域的蛋白必須被帶入基因的啟動子區(qū)域的正確位置。傳統(tǒng)的轉基因方法利用細胞型特異性的啟動子來驅動設計的轉基因的表達。含有該轉基因的DNA構建物首先被整合入宿主基因組。當被轉錄激活子激發(fā)時，該轉基因在給定的細胞類型中表達。在細胞中調(diào)控外來基因的表達的另一手段通過誘導型啟動子進行。這樣的誘導型啟動子的應用例子包括PRl-a啟動子、原核阻遏物-操縱子系統(tǒng)、免疫抑制-親免素(immunophilin)系統(tǒng)和高等真核轉錄激活系統(tǒng)，例如蛻皮類固醇激素受體系統(tǒng)，下文對它們進行了描述。病原體攻擊之后，來自煙草的PRl-a啟動子在系統(tǒng)性獲得性抗性應答期間得以誘導。因為PRl-a常常是對內(nèi)源性物質和外部因素如病原體、UV-B輻射和污染物產(chǎn)生應答，所以PRl-a的應用可能受到限制。基于由熱激、干擾素和重金屬誘導的啟動子的基因調(diào)控系統(tǒng)已被描述(Wurn et al.，1986，Proc. Natl. Acad. Sci.USA83:5414-5418 ；Arnheiter et al.，1990，Cell62:51-61 ;Filmus et al. , 1992, NucleicAcidsResearch20:27550-27560)。然而，由于這些系統(tǒng)對非目標基因的表達有影響，所以它們也有局限性。這些系統(tǒng)也是有遺漏性的。原核阻遏物-操縱子系統(tǒng)利用細菌阻遏蛋白和阻遏蛋白與之結合的獨特操縱子DNA序列。大腸桿菌(Escherichia coli)細菌的四環(huán)素(“Tet”)和乳糖(“Lac”)阻遏物-操縱子系統(tǒng)已經(jīng)用于植物和動物來控制基因表達。在Tet系統(tǒng)中，四環(huán)素結合TetR阻遏蛋白，導致構象變化，從而將該阻遏蛋白從操縱子上釋放下來，其結果是允許發(fā)生轉錄。在Lac系統(tǒng)中，在對存在的乳糖或合成的類似物如異丙基_β -D-硫代半乳糖苷的應答中，Iac操縱子被激活。不幸的是，此類系統(tǒng)的應用受到配體即四環(huán)素和乳糖的不穩(wěn)定的化學特性、它們的毒性、它們的天然存在性或者誘導或阻遏所需要的相對高的水平的限制。由于類似的原因，此類系統(tǒng)在動物中的應用受到限制。免疫抑制分子諸如FK506、雷帕霉素和環(huán)孢菌素A能夠結合親免素FKBP12、親環(huán)素(cyclophilin)等。利用這些信息，已經(jīng)設計出一般性的策略來使任何兩個蛋白集合在一起，這僅僅是通過將FK506置于這兩種蛋白的每一種上，或通過將FK506置于一個蛋白上而將環(huán)孢菌素A置于另一個蛋白上。合成的FK506同型二聚體(FK1012)或通過融合FK506-環(huán)孢菌素(FKCsA)而形成的化合物然后可以用于誘導這些分子的二聚體化(Spencer et al. , 1993, Science262:1019-24 ；Belshaw et al. , 1996Proc Natl Acad Sci USA93:4604-7)。與FKBP12融合的Gal4DNA結合結構域和與親環(huán)素融合的VP16激活子結構域，以及FKCsA化合物被用于顯示異源二聚作用和在含有Gal4結合位點的啟動子的控制之下對報告基因的激活作用。不幸的是，該系統(tǒng)包括可能具有不期望的副作用的免疫抑制齊U，因此限制了其用于各種哺乳動物基因開關應用。高等真核生物轉錄激活系統(tǒng)例如類固醇激素受體系統(tǒng)也已得到應用。類固醇激素受體是核受體超家族的成員，發(fā)現(xiàn)于脊椎動物和無脊椎動物的細胞中。不幸的是，激活受體的類固醇化合物在調(diào)控基因表達中的應用特別是在植物和動物中的應用受到限制，原因是這些類固醇化合物在這些生物中參與許多其他的天然生物途徑。為了克服這些困難，已經(jīng)開發(fā)出了使用昆蟲蛻皮素受體(EcR)的替代系統(tǒng)。昆蟲的生長、蛻皮和發(fā)育受到蛻皮素類固醇激素(蛻皮激素)和保幼激素的調(diào)控(Dhadialla, et al. , 1998, Annu. Rev. Entomol. 43:545-569)。在昆蟲中1 兌皮激素的分子革巴標至少由脫皮激素受體(EcR)和超氣門蛋白(USP,ultraspiracle protein)組成。EcR是核類固醇受體超家族的成員，其特征為標志DNA(signature DNA)和配體結合結構域以及激活結構域(Koelle et al. 1991，Cell, 67:59-77)。EcR受體對許多蛻皮類固醇化合物，例如松甾酮(ponasterone)A和幕黎留酮(muristerone) A具有應答性。近來，已經(jīng)描述了具有蛻皮類固醇激動劑活性的非固醇類化合物，包括商業(yè)上可獲得的殺蟲劑雙苯酰肼和甲氧蟲酰肼(methoxyfenozide),它們由Rohm and Haas Company在全球銷售(參見國際專利申請PCT/EP96/00686和美國專利5，530, 028)。兩種類似物對其他生物都是非常安全的。昆蟲蛻皮激素受體(EcR)與哺乳動物RXR的昆蟲同源物超氣門(USP)形成異源二聚體，結合蛻皮類固醇和蛻皮激素受體應答元件，并激活蛻皮激素應答基因的轉錄(Riddiford et al. , 2000) 0 EcR/USP/配體復合物在昆蟲發(fā)育和繁殖期間發(fā)揮重要作用。EcR是類固醇激素受體超家族的成員，具有五個模塊結構域(modular domain), A/B(反式激活)、C (DNA結合，異源二聚體化)、D (鉸鏈，異源二聚體化)、E (配體結合，異源二聚體化和反式激活)以及F(反式激活)結構域。這些結構域中的一些例如A/B、C和E當與其他蛋白融合時保留它們的功能。緊密調(diào)控的誘導型基因表達系統(tǒng)或基因開關(“gene switchs”)可用于各種應用，如基因療法、在細胞中大規(guī)模生產(chǎn)蛋白、基于細胞的高通量篩選分析、功能基因組學和調(diào)控轉基因植物和動物的性狀。第一種基于EcR的基因開關使用黑腹果蜆(Drosophila melanogaster)EcR(DmEcR)和小家鼠(Mus musculus) RXR(MmRXR)，并且顯示，在哺乳動物細胞系和轉基因小鼠中這些受體在存在蛻皮類固醇，松留酮A的情況下反式激活報告基因(Christopherson et al., 1992; No et al.，1996)。后來,Suhr et al.，1998 顯不，非 1 兌皮類固醇蛻皮激素激動劑，雙苯酰肼，在哺乳動物細胞中通過家蠶(Bombyx mori) EcR(BmEcR)，在不存在外源異源二聚體伴侶的情況下，高水平地誘導對報告基因的反式激活作用。國際專利申請 PCT/US97/05330(W097/38117)和 PCT/US99/08381 (W099/58155)公開了調(diào)節(jié)外源基因的表達的方法，其中，包含該外源基因和蛻皮激素應答元件的DNA構建物被包含蛻皮激素受體的第二 DNA構建物激活，蛻皮激素受體在其配體存在的情況下，和可選地在能夠充當沉默伴侶的受體存在的情況下，與蛻皮激素應答元件結合，從而誘導基因表達。選擇的蛻皮激素受體分離自黑腹果蠅。通常，此類系統(tǒng)需要存在有沉默伴侶，優(yōu)選類視黃醇X受體(RXR)，以便提供最佳的激活作用。在哺乳動物細胞中，昆蟲蛻皮激素受體(EcR)與類視黃醇X受體(RXR)形成異源二聚體，并以配體依賴型方式調(diào)控目標基因的表達。國際專利申請PCT/US98/14215(W099/02683)公開了分離自蠶蛾家蠶的蛻皮激素受體在哺乳動物系統(tǒng)中具有功能，無需外源的二聚體伴侶。美國專利6，265，173 BI公開了類固醇/甲狀腺受體超家族的各種成員能夠與黑腹果蠅超氣門受體(USP)或其包含至少USP的二聚化結構域的片段結合，用于基因表達系統(tǒng)。美國專利5，880，333公開了用于植物中的黑腹果蠅EcR和超氣門(USP)異源二聚體系統(tǒng)，其中反式激活結構域和DNA結合結構域位于兩個不同的雜合蛋白上。不幸的是，這些基于USP的系統(tǒng)在動物細胞中是組成型的，因此，對于調(diào)控報告基因表達是沒有效果的。在這些例子中的每一個中，反式激活結構域和DNA結合結構域(或者如在國際專利申請PCT/US98/14215中的天然EcR，或者如在國際專利申請PCT/US97/05330中的修飾的EcR)，被整合入單個的分子，其他的異源二聚體伴侶，USP或者RXR，則以它們天然的狀態(tài)使用。上述基于EcR的基因調(diào)控系統(tǒng)的缺點包括，在不存在配體的情況下具有相當明顯的背景活性，且不能將這些系統(tǒng)用于植物和動物(參見美國專利5，880，333)。因此，本技術領域需要改進的基于EcR的系統(tǒng)，以精確地調(diào)節(jié)外源基因在植物和動物中的表達。此種改進的系統(tǒng)將可以用于各種應用，如基因療法、大規(guī)模生產(chǎn)蛋白和抗體、基于細胞的高通量篩選分析、功能基因組學和調(diào)節(jié)在轉基因動物中的性狀。對于某些應用例如基因療法，具有誘導型基因表達系統(tǒng)可能是有利的，這些表達系統(tǒng)恰當?shù)貙铣傻姆峭懫ゎ惞檀寂潴w產(chǎn)生應答，同時對天然蛻皮類固醇不敏感。因此，改進的系統(tǒng)是簡單的，縝密的，依賴于相對便宜的且容易獲得的和對宿主毒性低的配體，它們將被證明可用于調(diào)控生物系統(tǒng)。之前，申請人已經(jīng)說明了基于蛻皮激素受體的誘導型基因表達系統(tǒng)一其中通過將反式激活結構域和DNA結合結構域置于兩個不同的蛋白上使得它們相互分開——導致在配體不存在的情況下背景活性大大減少，并且在配體存在的情況下相比背景其活性顯著增加(在審申請PCT/US01/09050，其整體并入本文作為參考)。相比申請PCT/US97/05330和PCT/US98/14215中公開的兩種系統(tǒng)，該雙雜合系統(tǒng)是明顯改進的誘導型基因表達調(diào)節(jié)系統(tǒng)。該雙雜合系統(tǒng)利用了一對相互作用的蛋白將轉錄激活結構域帶到相對于DNA結合結構域更為有利的位置的能力，這樣，當DNA結合結構域結合到基因上的DNA結合位點時，反式激活結構域更有效地激活啟動子(參見例如美國專利5，283，173)。簡言之，該雙雜合基因表達系統(tǒng)包含兩個基因表達盒；第一個編碼融合到核受體多肽的DNA結合結構域，第二個編碼融合到不同的核受體多肽的反式激活結構域。在配體存在的情況下，第一多肽和第二多肽的相互作用有效地將DNA結合結構域束縛于反式激活結構域。因為DNA結合結構域和反式激活結構域位于兩個不同的分子上，在配體不存在的情況下的背景活性大大降低。與蛻皮類固醇配體例如松甾酮A( “PonA”)或幕黎甾酮A( “MurA”)相比，雙雜合系統(tǒng)對于非蛻皮類固醇配體例如二酰肼也具有改進的敏感性。也就是說，相比蛻皮類固醇，非蛻皮類固醇配體在較低濃度下提供較高的活性。此外，因為基于EcR基因開關的反式激活常常是細胞系依賴性的，所以更容易對開關系統(tǒng)進行調(diào)整，以針對每一應用獲得最大的反式激活能力。而且，該雙雜合系統(tǒng)避免了由于RXR的過表達引起的一些副作用，當未修飾的RXR用作開關伴侶時，經(jīng)常發(fā)生RXR的過表達。在優(yōu)選的雙雜合系統(tǒng)中，EcR或RXR的天然DNA結合結構域和反式激活結構域被除掉，結果，這些雜交分子鮮有機會與存在于細胞中的其他類固醇激素受體相互作用，從而減少了副作用。EcR是核受體超家族的成員，歸為亞家族1，H組(在本文中稱為“H組核受體(Group H nuclear receptor) ”)。在E (配體結合)結構域中，各組的成員共有40-60%的氨基酸同一性(Laudet et al. , A Unified Nomenclature System for the Nuclear ReceptorSubfamily, 1999;CelI 97:161-163)。除了蛻皮激素受體，該核受體亞家族1，H組的其他成員包括遍在受體(UR)、孤獨受體I (0R-1)、類固醇激素核受體I (NER-I)、RXR相互作用蛋白-15(RIP-15)、肝臟X受體β (LXRi3)、類固醇激素受體樣蛋白(RLD-I)、肝臟X受體(LXR)、肝臟X受體a (LXR α )、類法尼醇X受體(FXR)、受體相互作用蛋白14 (RIP-14)和法呢醇受體(HRR-I)。為了開發(fā)出改進的基于H組核受體的誘導型基因表達系統(tǒng)——其中配體結合性或配體特異性被改變，申請人創(chuàng)造了在配體結合結構域(LBD)中包含置換的氨基酸殘基的置換突變型EcRs。同源建模和分子對接方法被用來預測介導蛻皮類固醇和非蛻皮類固醇與EcR LBD結合的關鍵殘基。在配體結合和反式激活分析中評價這些置換突變型EcRs。如本文介紹，申請人的新型置換突變型核受體和它們在基于核受體的誘導型基因表達系統(tǒng)中的應用，提供了在原核和真核宿主細胞中的改進的誘導型基因表達系統(tǒng)，其中，如果需要，根據(jù)用途可以對配體靈敏性和反式激活的程度加以選擇。發(fā)明詳述申請人:在此描述了包含置換突變的H組核受體(本文稱之為“置換突變體(substitution mutant) ” )的構建,所述突變發(fā)生在參與配體與H組核受體配體結合結構域的結合的氨基酸殘基處，所述突變影響H組核受體的配體靈敏性和誘導程度，而且證明了這些置換突變型核受體在調(diào)節(jié)基因表達的方法中有用的。具體地，申請人已經(jīng)開發(fā)出新型的基于核受體的誘導型基因表達系統(tǒng)，該系統(tǒng)包括含有置換突變的H組核受體配體結合結構域。申請人已經(jīng)表明，這樣的置換突變的作用可以增加或降低配體結合活性或配體敏感性，配體可以是蛻皮類固醇特異性的或非蛻皮類固醇特異性的。因此，申請人的發(fā)明提供了可用于調(diào)節(jié)感興趣的基因在宿主細胞中的表達的基于H組核受體的誘導型基因表達系統(tǒng)。在特別有利的實施方案中，申請人的發(fā)明提供了基于蛻皮激素受體的誘導型基因表達系統(tǒng)，其僅僅對蛻皮類固醇配體或非蛻皮類固醇配體產(chǎn)生應答。此外，本發(fā)明也提供了改進的非蛻皮類固醇配體應答性的基于蛻皮激素受體的誘導型基因表達系統(tǒng)。因此，申請人的新型的誘導型基因表達系統(tǒng)和其在宿主細胞中調(diào)節(jié)基因表達的方法中的應用克服了現(xiàn)有誘導型表達系統(tǒng)的局限，并為技術人員提供了控制基因表達的有效手段。本發(fā)明可以用于各種用途中，如基因療法、蛋白和抗體的大規(guī)模生產(chǎn)、基于細胞的高通量篩選分析、正交配體篩選分析、功能基因組學、蛋白質組學、代謝組學和在轉基因生物中性狀的調(diào)控，在這些情形中對基因表達水平進行控制是被期望的。申請人的發(fā)明的優(yōu)點在于它提供了調(diào)控基因表達和調(diào)整表達水平以適應使用者的需要的手段。定義在本公開中，使用了許多術語和縮寫。下面提供了定義，應該有助于理解本發(fā)明的范圍和實踐。在具體的實施方案中，術語“大約”或“近似”是指在給定的值或范圍的20%、優(yōu)選10%、更優(yōu)選5%和甚至更優(yōu)選1%范圍內(nèi)。術語“基本上無”是指當組合物中按重量計約75%的蛋白、DNA、載體(取決于A和B所屬的物質種類)是“A”時，包含“A” (其中“A”是單一的蛋白、DNA分子、載體、重組宿主細胞等)的該組合物基本上無“B”(其中“B”包括一種或多種污染蛋白、DNA分子、載體等)。優(yōu)選地，按組合物中A+B物質的重量計算，“A”占至少約90%，最優(yōu)選地按重量計算占至少約99%。而且，優(yōu)選地，基本上無污染的組合物僅僅包含單一分子量的物質，該物質具有感興趣的物質活性或特征。對于本發(fā)明的目的而言，術語“分離的”是指已從其原始環(huán)境(其自然存在的環(huán)境)中移出的生物物質(核酸或蛋白質)。例如，以自然狀態(tài)存在于植物或動物中的多核苷酸不是分離的，然而，與其中自然存在的相鄰核酸分離開的同樣的多核苷酸被認為是“分離的”。術語“純化的”并不要求該物質以絕對純、不存在其他化合物的形式存在。它只是一個相對的定義。在將起始材料或天然材料純化至少一個數(shù)量級、優(yōu)選2或3個數(shù)量級,優(yōu)選4或5個數(shù)量級之后，多核苷酸便為“純化的”狀態(tài)?！昂怂帷笔怯晒矁r連接的稱之為核苷酸的亞基組成的聚合化合物。核酸包括多核糖核酸(RNA)和多脫氧核糖核酸(DNA)，兩者都可以是單鏈或雙鏈的。DNA包括但是不限于cDNA、基因組DNA、質粒DNA、合成DNA和半合成DNA。DNA可以是線性的、環(huán)狀的或超螺旋的?！昂怂岱肿印笔侵负颂呛塑?腺苷、鳥苷、尿苷或胞苷；“RNA分子”)，或脫氧核糖核苷(脫氧腺苷、脫氧鳥苷、脫氧胸苷或脫氧胞苷；“DNA分子”)的磷酸酯聚合形式，或其任何磷酸酯類似物，如硫代磷酸酯和硫酯，其為或者單鏈形式或者雙鏈螺旋?？梢允请p鏈DNA-DNA、DNA-RNA和RNA-RNA螺旋體。術語核酸分子，特別是DNA或RNA分子，僅指該分子的一級和二級結構，并不將之限于任何特定的三級結構形式。因此，該術語包括在線性或環(huán)狀DNA分子(例如限制性片段)、質粒和染色體等中發(fā)現(xiàn)的雙鏈DNA。在論述特定的雙鏈DNA分子的結構時，序列可以根據(jù)常規(guī)慣例進行描述，僅給出沿著DNA的非轉錄鏈(S卩，與mRNA具有序列同源性的鏈)從5’至3’方向的序列。“重組DNA分子”是指經(jīng)過分子生物學操作的DNA分子。術語“片段”將被理解為指長度比參考核酸短并且在共同部分包含與參考核酸相同的核苷酸序列的核苷酸序列。如果合適的話，根據(jù)本發(fā)明的這樣的核酸片段可以被包含在更大的多核苷酸中，該片段是該更大的多核苷酸的組成成分。這樣的片段包括長度在本發(fā)明的核酸的至少 6、8、9、10、12、15、18、20、21、22、23、24、25、30、39、40、42、45、48、50、51、54、57、60、63、66、70、75、78、80、90、100、105、120、135、150、200、300、500、720、900、1000 或1500個連續(xù)核苷酸范圍內(nèi)的寡核苷酸，或可選地由這樣的寡核苷酸組成。如本文中使用地，“分離的核酸片段”是指單鏈或雙鏈的RNA或DNA聚合物，可選地包含合成的、非天然的或改變的核苷酸堿基。DNA聚合物形式的分離的核酸片段可以包括cDNA、基因組DNA或合成的DNA中的一個或多個片段。“基因”是指編碼多肽的核苷酸的裝配物，包括cDNA和基因組DNA核酸?！盎颉币?指表達特定蛋白或多肽的核酸片段，包括編碼序列之前(5’非編碼序列)和之后(3’非編碼序列)的調(diào)控序列。“天然基因”是指天然發(fā)現(xiàn)的具有它自己的調(diào)控序列的基因。“嵌合基因”是指不是天然基因的任何基因，其包含在天然條件下不在一起的調(diào)控序列和/或編碼序列。因此，嵌合基因可以包含不同來源的調(diào)控序列和編碼序列，或相同來源但以與天然發(fā)現(xiàn)的不同的方式排列的調(diào)控序列和編碼序列。嵌合基因可以包括不同來源的編碼序列，和/或不同來源的調(diào)控序列?！皟?nèi)源基因”是指在生物體的基因組中的天然位置的天然基因?！巴鈦怼被蚧颉爱愒础被蚴侵冈谡Ｇ闆r下不在宿主生物體中的基因，而是通過基因轉移導入宿主生物體的基因。外來基因可以包括插入到非天然生物中的天然基因或嵌合基因?！稗D基因”是通過轉化程序被導入到基因組中的基因?！爱愒础疍NA是指不是天然位于細胞或細胞染色體位點的DNA。優(yōu)選地,異源DNA包括對該細胞而言為外來的基因。術語“基因組”包括染色體以及線粒體、葉綠體和病毒DNA或RNA。當在合適的溫度和溶液離子強度條件下，單鏈形式的核酸分子能夠與其他核酸分子退火，那么該核酸分子便與另一核酸分子如cDNA、基因組DNA或RNA是可雜交的(參見Sambrook et al.，1989infra)。雜交條件和洗漆條件是眾所周知的，并在 Sambrook, J. , Fritsch, E. F.和 Maniatis,T.Molecular Cloning: A LaboratoryManual, Second Edition,Cold Spring Harbor Laboratory Press,Cold SpringHarbor (1989)中列舉出，特別是在其中的第11章和表11. I (該文獻整體并入本文作為參考)。溫度和離子強度條件決定了雜交的“嚴格性”?？梢哉{(diào)整嚴格性條件以篩選中等程度類似的片段例如來自關系遠的生物的同源序列，至高度相似的片段例如來自關系近的生物的同樣功能的酶的基因。對于同源核酸的初篩，可以使用低嚴格性的雜交條件，對應于55°C的Tm，例如5XSSC、0. 1%SDS、0. 25%牛奶，無甲酰胺；或30%甲酰胺、5XSSC、0. 5%SDS)。中度嚴格性雜交條件對應于較高的Tm，例如40%甲酰胺、5X或6XSCC。高度嚴格性雜交條件對應于最高的Tm，例如50%甲酰胺、5X或6 X SCC0雜交要求兩條核酸含有互補序列，盡管取決于雜交的嚴格性，堿基之間還是可能會發(fā)生錯配。術語“互補”被用于描述能夠相互雜交的核苷酸堿基之間的關系。例如，對于DNA，腺嘌呤與胸腺嘧啶互補，胞嘧啶與鳥嘌呤互補。因此，本發(fā)明也包括與公開或使用于此的全序列以及那些基本上類似的核酸序列互補的分離的核酸片斷。在本發(fā)明的特定實施方案中，通過使用包括Tm為55°C的雜交步驟的雜交條件并利用上述的條件，檢測多核苷酸。在優(yōu)選的實施方案中，！為60°C，在更優(yōu)選的實施方案中，Tm為63 °C，在更為優(yōu)選的實施方案中，Tm為65V。雜交后的洗滌也決定嚴格性條件。一組優(yōu)選的條件使用一系列的洗滌步驟以6XSSC、0. 5%SDS室溫中進行15分鐘起始，然后2 X SSC、0. 5%SDS在45°C進行30分鐘，重復洗滌；然后O. 2XSSC、0. 5%SDS在50°C進行30分鐘，重復兩次。更優(yōu)選的一組嚴格性條件使用更高的溫度，其中洗滌步驟與上述步驟相同，除了在O. 2XSSC、0. 5%SDS中進行最后兩次30分鐘洗滌的溫度增加到60°C。另一組優(yōu)選的高嚴格性條件是在65°C，在O. I X SSC,
O.P/oSDS中進行最后2次洗滌。雜交要求兩條核酸含有互補序列，盡管取決于雜交的嚴格性，堿基之間還是可能會錯配。使核酸雜交的合適的嚴格性取決于核酸的長度和互補程度，這些是本領域熟知的變量。兩條核苷酸序列之間的相似性或同源性程度越大，具有那些序列的核酸雜合子的Tm值越大。核酸雜交的相對穩(wěn)定性(對應于較高的Tm)按照下列次序降低RNA:RNA、DNA:RNA、DNA:DNAο對于長度大于100個核苷酸的雜合子，已經(jīng)推導出計算Tm的公式(參見Sambrooket al.，supra, 9. 50-0. 51)。對于較短核酸即寡核苷酸的雜交,錯配的位置變得更加重要，寡核苷酸的長度決定其特異性(參見Sambrook et al.，supra, 11. 7-11. 8)。在本發(fā)明特定的實施方案中，利用包括在小于500mM鹽和至少37°C的雜交步驟以及在2X SSPE和至少63°C的洗滌步驟的雜交條件來檢測多核苷酸。在優(yōu)選的實施方案中，雜交條件包括小于200mM鹽和至少37°C的雜交步驟。在更優(yōu)選的實施方案中，雜交條件包括2 X SSPE和63°C的雜交和洗滌步驟。在一個實施方案中，可雜交核酸的長度為至少約10個核苷酸。優(yōu)選地，可雜交核酸的最小長度為至少約15個核苷酸；更優(yōu)選至少約20個核苷酸；最優(yōu)選地長度為至少30個核苷酸。而且，技術人員將認識到，溫度和洗滌溶液的鹽濃度可以根據(jù)各種因素例如探針長度作必要的調(diào)整。術語“探針”是指單鏈核酸分子，其可以與互補的單鏈目標核酸進行堿基配對，形成雙鏈分子。如在此所使用，術語“寡核苷酸”是指通常至少18個核苷酸的核酸，其可以與基因組DNA分子、cDNA分子、質粒DNA或mRNA分子雜交。寡核苷酸可以被標記，例如用32P-核苷酸或已經(jīng)與標記物例如生物素共價偶聯(lián)的核苷酸進行標記。標記的寡核苷酸可以用作探針來檢測核酸的存在。寡核苷酸(其中之一或兩者可以被標記)可以用作PCR引物，用于克隆全長核酸或核酸片段，或者用于檢測核酸的存在。寡核苷酸也可以用于與DNA分子形成三螺旋。一般而言，寡核苷酸通過合成制得，優(yōu)選在核酸合成儀上合成。因此，寡核苷酸可以用非天然存在的磷酸酯類似鍵例如硫酯鍵等制備。“引物”是指在合適的條件下與目標核酸序列雜交從而產(chǎn)生可以充當DNA合成起點的雙鏈核酸區(qū)域的寡核苷酸。這樣的引物可以用于聚合酶鏈式反應?！熬酆厦告準椒磻笨s寫為PCR，是指酶促擴增特定核酸序列的體外方法。PCR涉及一系列反復的溫度循環(huán)，每一循環(huán)包括三個階段對模板核酸變性以分開目標分子的鏈，將單鏈PCR寡核苷酸引物與模板核酸退火，用DNA聚合酶延伸退火的引物。PCR提供了檢測目標分子存在與否的手段，并且在定量或半定量條件下，可以確定目標分子在原始核酸庫中的相對數(shù)量?！澳孓D錄-聚合酶鏈式反應”的縮寫是RT-PCR，是指由RNA分子或多個RNA分子酶法產(chǎn)生目標cDNA分子或多個分子，然后如上所述酶法擴增目標cDNA分子或多個分子內(nèi)的特定核酸序列或多個序列的體外方法。RT-PCR也提供了檢測目標分子存在與否的手段，并且在定量或半定量條件下，可以確定目標分子在起始核酸庫中的相對數(shù)量。DNA “編碼序列”是雙鏈DNA序列，該序列當置于合適的調(diào)控序列的控制下時在細胞中以體外或體內(nèi)的方式被轉錄并翻譯成多肽。“合適的調(diào)控序列”是指位于編碼序列的上游(5’非編碼序列)、之內(nèi)或下游(3’非編碼序列)的核苷酸序列，它們影響相關聯(lián)的編碼序列的轉錄、RNA加工或穩(wěn)定性或翻譯。調(diào)控序列可以包括啟動子、翻譯前導序列、內(nèi)含子、多腺苷酸化識別序列、RNA加工位點、效應物結合位點和莖-環(huán)結構。編碼序列的邊界由5’(氨基)端的起始密碼子和3’(羧基)端的翻譯終止密碼子確定。編碼序列可以包括但是不限于原核序列、mRNA產(chǎn)生的cDNA、基因組DNA序列、甚至合成的DNA序列。如果編碼序列欲在真核細胞中表達，多腺苷酸化信號序列和轉錄終止序列通常將位于該編碼序列的3’端?！伴_放閱讀框”縮寫為0RF，是指一定長度的核酸序列，其是DNA、cDNA或者RNA，包括翻譯起始信號或起始密碼子，例如ATG或AUG，和終止密碼子，并且潛在地能夠翻譯成多肽序列。術語“頭對頭”在此被用于描述兩條多核苷酸序列彼此之間的定向。當一條多核苷酸的編碼鏈的5’端與另一條多核苷酸的編碼鏈的5’端相鄰時，這兩條多核苷酸以頭對頭的方向定位，因此，各條多核苷酸的轉錄方向以遠離另一條多核苷酸的5’端的方式進行。術語“頭對頭”可以縮寫為(5’)_對_(5’)，也可以用符號(一一)或(3’ 一 5’5’ 一 3’)表
/Jn ο術語“尾對尾”在此被用于描述兩條多核苷酸序列彼此之間的定向。當一條多核苷酸的編碼鏈的3’端與另一條多核苷酸的編碼鏈的3’端相鄰時，這兩條多核苷酸以尾對尾的方向定位，因此，各條多核苷酸的轉錄方向朝著另一條多核苷酸的方向進行。術語“尾對尾”可以縮寫為(3’)_對_(3’)，也可以用符號(一一)或(5’ 一3’3’ 一5’)表示。術語“頭對尾”在此被用于描述兩條多核苷酸序列彼此之間的定向。當一條多核苷酸的編碼鏈的5’端與另一條多核苷酸的編碼鏈的3’端相鄰時，這兩條多核苷酸以頭對尾的方向定位，因此，各條多核苷酸的轉錄方向以與另一條多核苷酸相同的方向進行。術語“頭對尾”可以縮寫為(5’)_對_(3’)，也可以用符號(一一)或(5’ 一3’5’ 一3’)表示。術語“下游”是指位于參考核苷酸序列3’端的核苷酸序列。特別地，下游核苷酸序列通常涉及轉錄起始點之后的序列。例如，基因的翻譯起始密碼子位于轉錄起始位點的下游。術語“上游”是指位于參考核苷酸序列5’端的核苷酸序列。特別地，上游核苷酸通常涉及位于編碼序列或轉錄起始點的5’側的序列。例如，大部分的啟動子位于轉錄起始位點的上游。術語“限制性核酸內(nèi)切酶”和“限制性酶”是指結合并切割雙鏈DNA內(nèi)的特定核苷酸序列的酶。
“同源重組”是指將外來DNA序列插入另一 DNA分子，例如將載體插入染色體。優(yōu)選地，載體靶向于特定的染色體位點進行同源重組。對于特異性的同源重組，載體將含有與染色體的序列同源的足夠長的區(qū)域，以允許載體進行互補性結合并整合入染色體。較長的同源區(qū)域和較高的序列相似性程度，可以提高同源重組的效率。本領域已知的若干方法可以用于增殖本發(fā)明的多核苷酸。一旦建立合適的宿主系統(tǒng)和生長條件，可以定量增殖和制備重組表達載體。如在此所描述，可以使用的表達載體包括但是不限于下述載體或它們的衍生物人或動物病毒例如牛痘病毒或腺病毒；昆蟲病毒例如桿狀病毒；酵母載體；噬菌體載體(例如λ噬菌體載體)以及質粒和粘粒DNA載體，以這些為例?！拜d體”是指用于克隆核酸和/或將核酸轉移入宿主細胞的任何工具。載體可以是另一 DNA片段可以連接到其上從而使得該被連接的片段可以被復制的復制子?！皬椭谱印笔侵缸鳛樵隗w內(nèi)的自主DNA復制單元而發(fā)揮功能，即能夠在它自己的控制下進行復制的任何遺傳元件(例如質粒、噬菌體、粘粒、染色體、病毒)。術語“載體”包括用于體外、離體或體內(nèi) 將核酸導入細胞的病毒和非病毒工具。本領域已知的大量載體可以被用于操作核酸、將應答元件和啟動子整合入基因等?？赡艿妮d體包括例如質?；蛐揎椀牟《荆ɡ缂毦删w，如λ衍生物,或質粒如pBR322或pUC質粒衍生物,或Bluescript載體。例如,通過將合適的DNA片段連接入具有互補粘性末端的選擇載體，可以將對應于應答元件和啟動子的DNA片段插入合適的載體中。可選擇地，DNA分子的末端可以通過酶法修飾，或者可以通過將核苷酸序列(接頭)連接到該DNA末端產(chǎn)生任何位點。這樣的載體可以進行工程改造，以含有選擇性標記基因，用于選擇已經(jīng)將該標記整合入細胞基因組的細胞。這樣的標記允許鑒定和/或選擇整合并表達由該標記編碼的蛋白的宿主細胞。病毒載體，特別是逆轉錄病毒載體，已經(jīng)在細胞以及活的動物對象中用于各種各樣的基因傳遞應用中?？梢允褂玫牟《据d體包括但不限于逆轉錄病毒、腺相關病毒、痘病毒、桿狀病毒、牛痘病毒、單純皰疹病毒、EB病毒、腺病毒、雙生病毒和花椰菜花葉病毒載體。非病毒載體包括質粒、脂質體、帶電荷脂質(cytofectins)、DNA-蛋白質復合體和生物聚合物。除了核酸外，載體還可以包括一個或多個調(diào)控區(qū)域，和/或選擇性標記，這些標記可用于選擇、測定和監(jiān)控核酸轉移結果(轉移到哪些組織，表達的持續(xù)時間等)。術語“質?！笔侵割~外的染色體元件，它們常常攜帶不是作為細胞的中心代謝的一部分的基因，并且常常是環(huán)狀雙鏈DNA分子的形式。這樣的元件可以是來自任何來源的自主復制序列、基因組整合序列、噬菌體或核苷酸序列，線性、環(huán)狀或超螺旋的，單鏈或雙鏈DNA或RNA，其中許多核苷酸序列已經(jīng)被連接入或重組入獨特的結構中，該結構能夠將針對所選的基因產(chǎn)物的啟動子片段和DNA序列以及合適的3’端非翻譯序列導入細胞?！翱寺≥d體”是“復制子”，為核酸優(yōu)選DNA的單元長度，它按順序復制，并包含復制起點，例如質粒、噬菌體或粘粒，其上可以連接另一核酸片段從而復制該被連接的片段。克隆載體可以具有在一種細胞類型中復制并在另一細胞類型中表達的能力(“穿梭載體”)。載體可以通過本領域已知的方法導入期望的宿主細胞，例如轉染、電穿孔、微注射、轉導、細胞融合、DEAE葡聚糖、磷酸鈣沉淀、脂轉染(溶酶體融合)、使用基因槍或DNA載體轉運蛋白(參見例如 Wu et al·，1992，J. Biol. Chem. 267:963-967 ;Wu 和 Wu, 1988，J.Biol. Chem. 263:14621-14624 ;和 Hartmut et al.，1990 年 3 月 15 日提交的加拿大專利申請 2，012，311)。本發(fā)明的多核苷酸也可以通過脂轉染體內(nèi)導入。在過去10年中，使用脂質體體外包囊和轉染核酸一直在增加。設計用來限制脂質體介導的轉染所遇到的困難和危險的合成陽離子脂質，可以用于制備脂質體，用于體內(nèi)轉染編碼標記的基因(Feigner etal. , 1987, Proc. Natl. Acad. Sci. U. S. A. 84: 7413 ；Mackey, et al. , 1988, Proc. Natl. Acad.Sci. U.S. A. 85:8027-8031 ;和 Ulmer et al.，1993，Science259:1745-1748)。使用陽離子脂質可以促進帶負電荷的核酸的包囊，還可以促進與帶負電的細胞膜的融合(Feigner andRingold, 1989，Science337:387-388)。國際專利出版物 TO95/18863 和 TO96/17823 以及美國專利5，459，127描述了可用于轉移核酸的特別有用的脂質化合物和組合物。利用脂轉染將外源基因體內(nèi)導入特定的器官具有某些實踐優(yōu)點。脂質體對特定細胞的分子靶向代表了一個方面的益處。明顯的是，針對特定的細胞類型進行轉染在具有細胞異質性的組織例如胰腺、肝臟、腎臟和腦中將是特別優(yōu)選的。脂質可以用化學的方法偶聯(lián)到其他分子以用于靶向的目的(Mackey，et al.，1988，supra)。被靶向的肽例如激素或神經(jīng)遞質以及蛋白質例如抗體或非肽分子可以通過化學方法偶聯(lián)到脂質體。
其他分子也可用于幫助進行核酸的體內(nèi)轉染，例如陽離子寡肽(例如W095/21931)、衍生自DNA結合蛋白的肽(例如W096/25508)或陽離子聚合物(例如W095/21931)。將載體作為裸DNA質粒體內(nèi)導入也是可能的(參見美國專利5，693，622、5，589，466和5，580, 859)。也可以使用受體介導的DNA傳遞方法(Curiel etal.，1992，Hum. Gene Ther. 3:147-154 ;和 Wu 和 Wu, 1987，J. Biol. Chem. 262:4429-4432)。術語“轉染”是指細胞攝取外源或異源RNA或DNA。當外源或異源RNA或DNA已被引入細胞內(nèi)時，該細胞便被這樣的RNA或DNA “轉染”。當轉染的RNA或DNA影響表型變化時，該細胞便被外源或異源RNA或DNA “轉化”。轉化RNA或DNA可以被整合入(共價連接入)構成細胞基因組的染色體DNA?！稗D化”是指將核酸片段轉移入宿主生物的基因組，產(chǎn)生遺傳上穩(wěn)定的遺傳。含有轉化的核酸片段的宿主生物稱為“轉基因”或“重組”或“轉化的”生物。術語“遺傳區(qū)域”將指包含編碼多肽的基因的核酸分子區(qū)域或核苷酸序列。此外，包含本發(fā)明的多核苷酸的重組載體可以包括一個或多個用于在細胞宿主中復制的起點(在該細胞宿主中多核苷酸的擴增或表達被謀求)、標記或選擇性標記。術語“選擇性標記”是指鑒定性因子，通常是抗生素或化學品抗性基因、比色標記、酶、熒光標記和類似物，其中抗性基因能夠基于標記基因的效應，即對抗生素的抗性、對除草劑的抗性進行選擇，其中，所述效應被用于追蹤感興趣的核酸的遺傳性，和/或鑒定遺傳有感興趣的核酸的細胞或生物。本技術領域已知并被使用的選擇性標記基因的例子包括提供對氨芐青霉素、鏈霉素、慶大霉素、卡那霉素、潮霉素、雙丙氨磷除草劑、磺胺和類似物的抗性的基因；用作表型標記的基因，即花色素苷調(diào)控基因、異戊烯轉移酶基因和類似物。術語“報道基因”是指編碼能夠基于該報道基因的效應而被鑒定的鑒定性因子的核酸，其中所述效應被用于追蹤感興趣的核酸的遺傳性，鑒定遺傳有感興趣的核酸的細胞或生物，和/或測定基因表達誘導或轉錄。本技術領域已知并被使用的報道基因的例子包括熒光素酶(Luc)、綠色熒光蛋白(GFP)、氯霉素乙?；D移酶(CAT)、β_半乳糖苷酶(LacZ)、β-葡糖醛酸酶(Gus)和類似物。選擇性標記基因也可以考慮用作報道基因?！皢幼印笔侵改軌蚩刂凭幋a序列或功能性RNA的表達的DNA序列。一般而言，編碼序列位于啟動子序列的3’端。啟動子可以整體源自天然基因，或由源自天然發(fā)現(xiàn)的不同啟動子的不同元件組成，或甚至包括合成的DNA片段。本領域技術人員應該理解的是，不同的啟動子可以指導基因在不同的組織或細胞類型中，或在發(fā)育的不同階段，或應答于不同的環(huán)境或生理條件進行表達。導致基因在大多數(shù)細胞類型中在大多數(shù)的時間被表達的啟動子通常稱為“組成型啟動子”。導致基因在特定的細胞類型中被表達的啟動子通常稱為“細胞特異性啟動子”或“組織特異性啟動子”。導致基因在特定的發(fā)育或細胞分化階段被表達的啟動子通常稱為“發(fā)育特異性啟動子”或“細胞分化特異性啟動子”。在將細胞暴露于誘導啟動子的藥劑、生物分子、化學品、配體、光或類似物，或用這些物質對細胞進行處理之后，被誘導并導致基因被表達的啟動子通常被稱為“誘導型啟動子”或“調(diào)控型啟動子”。還應該認識的是，因為在大多數(shù)情況下，調(diào)控序列的準確界限還沒有完全限定，所以不同長度的DNA片段可能具有相同的啟動子活性?！皢幼有蛄小笔悄軌蚪Y合細胞中RNA聚合酶，并啟動下游(3’方向)編碼序列的轉錄的DNA調(diào)控區(qū)域。為了定義本發(fā)明的目的，啟動子序列的范圍被界定為其3’端至轉錄起始位點，并向上游(5’方向)延伸，包括以高于背景的可檢測水平啟動轉錄所必需的最小數(shù)目的堿基或元件。在啟動子序列內(nèi)，將發(fā)現(xiàn)轉錄起始位點(該位點例如可以通過用核酸酶SI作圖方便地確定)和負責結合RNA聚合酶的蛋白質結合結構域(共有序列)。當RNA聚合酶將編碼序列轉錄成mRNA，然后mRNA進行反式RNA剪接(如果該編碼序列含有內(nèi)含子的話)，并翻譯成由該編碼序列編碼的蛋白時，該編碼序列便在細胞中處于轉錄和翻譯控制序列的“控制之下”?！稗D錄和翻譯控制序列”是DNA調(diào)控序列，例如啟動子、增強子、終止子、和類似物，其使得編碼序列能夠在宿主細胞中表達。在真核細胞中，多腺苷酸化信號是控制序列。術語“應答元件”是指一個或多個順式作用DNA元件，其賦予啟動子通過與第一嵌合基因的DNA結合結構域的相互作用介導的應答性。該DNA元件可以在其序列中具有回文結構(精確的或不精確的)，或由被可變數(shù)目的核苷酸隔開的序列基序或半位點組成。半位點可以是相似的或相同的，并以同向重復或反向重復排列，或以單個半位點或相鄰半位點串聯(lián)形成的多聚體排列。取決于應答元件將要被整合入的細胞或生物的屬性，該應答元件可以包含分離自不同生物的最小的啟動子。在配體存在或不存在的情況下，第一雜合蛋白的DNA結合結構域結合于應答元件的DNA序列，從而在該應答元件的調(diào)控下啟動或抑制下游基因的轉錄。天然蛻皮激素受體的應答元件的DNA序列的例子包括RRGG/TTCANTGAC/ACYY(參見 Cherbas L. , et. al. , (1991), Genes Dev. 5, 120-131) ；AGGTCAN(n)AGGTCA，其中Νω可以是一個或多個間隔核苷酸(參見D’Avino PP. , et. al. , (1995), Mol.Cell. Endocrinol, 113，1-9);和 GGGTTGAATGAATTT (參見 Antoniewski C. , et. al. , (1994).Mol. Cell Biol.14，4465-4474)。術語“可操作性連接”是指核酸序列連接在單個核酸片段上，從而一條核酸序列的功能受到其他核酸序列的影響。例如，當啟動子能夠影響編碼序列的表達時(即，編碼序列在啟動子的轉錄控制之下)，則啟動子可操作性地與編碼序列連接。編碼序列可以以有義或反義方向與調(diào)控序列可操作性地連接。
如本文中所用，術語“表達”是指衍生自核酸或多核苷酸的有義(mRNA)或反義RNA的轉錄和穩(wěn)定積聚。表達也可以指mRNA翻譯成蛋白或多肽。術語“盒”、“表達盒”和“基因表達盒”是指可以在特定的限制性位點或通過同源重組插入核酸或多核苷酸的DNA片段。DNA片段包含編碼感興趣的多肽的多核苷酸，該盒和限制性位點經(jīng)過設計以確保能夠將該盒插入正確的轉錄和翻譯閱讀框?！稗D化盒”是指包含編碼感興趣的多肽的多核苷酸并且除了所述多核苷酸外還具有幫助轉化特定宿主細胞的元件的特定載體。本發(fā)明的盒、表達盒、基因表達盒和轉化盒也可以包含增強編碼感興趣的多肽的多核苷酸在宿主細胞中的表達的元件。這些元件可以包括但不限于啟動子、最小啟動子、增強子、應答元件、終止子序列、多腺苷酸化序列和類似元件。對于本發(fā)明的目的，術語“基因開關”是指與啟動子相關聯(lián)的應答元件和基于 EcR的系統(tǒng)的組合，其在一種或多種配體存在的情況下，調(diào)節(jié)整合有該應答元件和啟動子的基因的表達。術語“調(diào)節(jié)”是指誘導、減少或抑制核酸或基因表達，分別導致蛋白或多肽生產(chǎn)的誘導、減少或抑制。本發(fā)明的質?；蜉d體還可以包含適于驅使基因在宿主細胞中表達的至少一個啟動子。術語“表達載體”是指被設計成使得插入的核酸序列在轉化入宿主后能夠表達的載體、質?；蛎浇?。克隆的基因，即，插入的核酸序列，通常被置于控制元件例如啟動子、最小啟動子、增強子或類似控制元件的控制之下。啟動控制區(qū)域或啟動子可用于驅使核酸在期望的宿主細胞中表達，它們數(shù)量眾多，并且為本領域技術人員所熟悉。事實上，能夠驅動這些基因的任何啟動子都適合于本發(fā)明，包括但不限于病毒啟動子、細菌啟動子、動物啟動子、哺乳動物啟動子、合成啟動子、組成型啟動子、組織特異性啟動子、發(fā)育特異性啟動子、誘導型啟動子、光調(diào)控啟動子；CYC1、HIS3、GAL1、GAL4、GAL10、ADH1、PGK、PH05、GAPDH、ADC1、TRPU URA3、LEU2、ENO, TPI、堿性磷酸酶啟動子(用于在酵母屬(Saccharomyces)中的表達);A0X1啟動子(用于在畢赤酵母(Pichia)中的表達)；β -內(nèi)酰胺酶、lac、aa、tet、trp、1PL> 1PE> T7、tac和c啟動子(用于在大腸桿菌(Escherichia coli)中的表達)；光調(diào)控的、種子特異性的、花粉特異性的、子房特異性的、發(fā)病機理或疾病相關的、花椰菜花葉病毒35S、CMV35S最小、木薯葉脈花葉病毒(CsVMV)、葉綠素a/b結合蛋白、核酮糖1，5- 二磷酸羧化酶、芽枝特異性的、根特異性的、幾丁質酶、應激誘導型的、水稻東格魯桿狀病毒、植物超級啟動子(plant super-promoter)、馬鈴薯亮氨酸氨肽酶、硝酸鹽還原酶、甘露氨酸合成酶、胭脂氨酸合成酶、泛蛋白、玉米醇溶蛋白和花色苷啟動子(用于在植物細胞中的表達)；本領域已知的動物和哺乳動物啟動子包括但不限于SV40早期(SV40e)啟動子區(qū)域、包含在勞斯肉瘤病毒(RSV)的3’長末端重復(LTR)中的啟動子、腺病毒(Ad)的ElA或主要晚期啟動子(MLP)基因的啟動子、巨細胞病毒(CMV)早期啟動子、單純皰疹病毒(HSV)胸苷激酶(TK)啟動子、桿狀病毒IEl啟動子、延伸因子la (EFl)啟動子、磷酸甘油酸激酶(PGK)啟動子、泛蛋白(Ubc)啟動子、白蛋白啟動子、小鼠金屬硫蛋白的調(diào)控序列L啟動子和轉錄控制區(qū)、遍在啟動子(HPRT、波形蛋白、a-肌動蛋白、微管蛋白和類似物)、中間纖維的啟動子(結蛋白、神經(jīng)纖絲蛋白、角蛋白、GFAP和類似物)、治療性基因的啟動子(MDR、CFTR或VIII類因子和類似物的啟動子)、發(fā)病或疾病相關啟動子，以及顯示出組織特異性并已用于轉基因動物的啟動子，例如在胰腺腺泡細胞中具有活性的彈性蛋白酶I基因控制區(qū)；在胰腺β細胞中具有活性的胰島素基因控制區(qū)；在淋巴細胞中具有活性的免疫球蛋白基因控制區(qū)；在睪丸、乳房、淋巴和肥大細胞中具有活性的小鼠乳腺腫瘤病毒控制區(qū)域；在肝臟中具有活性的白蛋白基因、Apo Al和Apo AII控制區(qū)；在肝臟中具有活性的α-甲胎蛋白基因控制區(qū)；在肝臟中具有活性的α I-抗胰蛋白酶基因控制區(qū)；在骨髓細胞中具有活性的β_球蛋白基因控制區(qū)；在腦的少突膠質細胞中具有活性的髓磷脂堿蛋白基因控制區(qū)；在骨骼肌中具有活性的肌球蛋白輕鏈-2基因控制區(qū)，以及在下丘腦中具有活性的促性腺激素釋放激素基因控制區(qū)，丙酮酸激酶啟動子，絨毛蛋白啟動子，脂肪酸結合腸蛋白的啟動子，平滑肌細胞α-肌動蛋白的啟動子和類似物。此外，通過加入增強子或調(diào)控序列和類似物，這些表達序列可以被修飾?？梢杂糜诒景l(fā)明的實施方案的增強子包括但不限于SV40增強子、巨細胞病毒(CMV)增強子、延伸因子I(EFl)增強子、酵母增強子、病毒基因增強子和類似物。終止控制區(qū)，S卩，終止子或多腺苷酸化序列，也可以來自對于優(yōu)選的宿主而言為天然的各種基因?？蛇x地，終止位點并非必需，然而，最優(yōu)選的情況是包括終止位點。在本發(fā)明優(yōu)選的實施方案中，終止控制區(qū)域可以包括或來自合成序列、合成的多腺苷酸化信號、SV40晚期多腺苷酸化信號、SV40多腺苷酸化信號、牛生長激素(BGH)多腺苷酸化信號、病毒終止子序列或類似物。術語“3’非編碼序列”或“3’非翻譯區(qū)(UTR) ”是指位于編碼序列下游(3’)的DNA序列，并且可以包含多腺苷酸化[多(A)]識別序列和編碼能夠影響mRNA加工或基因表達的調(diào)控信號的其他序列。多腺苷酸化信號通常是通過將多腺苷酸序列束加入到mRNA前體的3’末端來表征的?！罢{(diào)控區(qū)域”是指調(diào)控第二核酸序列的表達的核酸序列。調(diào)控區(qū)域可以包括在自然情況下負責表達特定核酸的序列(同源區(qū)域)，或可以包括負責表達不同的蛋白或甚至合成蛋白的不同來源的序列(異源區(qū)域)。特別地，序列可以是以特異性或非特異性方式和以誘導型或非誘導型方式刺激或抑制基因轉錄的原核、真核或病毒基因序列或衍生的序列。調(diào)控區(qū)域包括復制起點、RNA剪接位點、啟動子、增強子、轉錄終止序列和指導多肽進入目標細胞的分泌途徑的信號序列?！爱愒磥碓础钡恼{(diào)控區(qū)域是與被表達的核酸并不天然連接的調(diào)控區(qū)域。異源調(diào)控區(qū)域包括來自不同種的調(diào)控區(qū)域、來自不同基因的調(diào)節(jié)區(qū)域、雜合調(diào)控序列和在天然情況下并不存在而是由本領域普通技術人員設計出的調(diào)控區(qū)域。“RNA轉錄物”是指經(jīng)RNA聚合酶催化由DNA序列轉錄而得的產(chǎn)物。當RNA轉錄物是DNA序列的精確互補的拷貝時，它被稱為初級轉錄物，或者它可以是對初級轉錄物進行轉錄后加工所產(chǎn)生的RNA序列，這被稱為成熟RNA?！靶攀筊NA (mRNA) ”是指無內(nèi)含子并可以被細胞翻譯成蛋白的RNA?！癱DNA”是指與mRNA互補并源自mRNA的雙鏈DNA。“有義” RNA是指包括mRNA并因此可以被細胞翻譯成蛋白的RNA轉錄物?！胺戳xRNA”是指與目標初級轉錄物或mRNA的全部或部分互補并且阻斷目標基因表達的RNA轉錄物。反義RNA的互補性可以在特定的基因轉錄物的任何部分，即，在5’非編碼序列、3’非編碼序列或編碼序列?！肮δ躌NA”是指反義RNA、核酶RNA或不被翻譯但對細胞進程有影響的其他RNA?！岸嚯摹笔怯晒矁r連接的氨基酸殘基組成的聚合化合物。氨基酸具有下述通用結構
H
I
wm2根據(jù)側鏈R，氨基酸被分為七組(1)脂肪族側鏈，(2)含有羥基(OR)基團的側鏈，
(3)含有硫原子的側鏈，(4)含有酸性基團或酰胺基團的側鏈，(5)含有堿性基團的側鏈，
(6)含有芳香環(huán)的側鏈，和(7)脯氨酸，一種側鏈與氨基基團稠合的亞氨酸。本發(fā)明的多肽優(yōu)選包含至少大約14個氨基酸?！暗鞍踪|”是在活細胞中發(fā)揮結構或功能作用的多肽。 “分離的多肽”或“分離的蛋白”是基本上沒有那些在其天然狀態(tài)下通常與其相隨的化合物(例如，其他蛋白或多肽、核酸、碳水化合物、脂類)的多肽或蛋白。“分離的”并不旨在排除與其他化合物形成的人工或合成的混合物，或并不排除存在有不干擾生物活性以及例如因不徹底的純化、加入穩(wěn)定劑或混合形成藥學上可接受的制劑而可能存在的雜質。將被理解的是，“置換突變多肽”或“置換突變體”是指與野生型或天然存在的多肽相比包含至少一個(I)野生型或天然存在的氨基酸用不同的氨基酸取代的突變多肽。置換突變多肽可以僅僅包含一個(I)野生型或天然存在的氨基酸置換，并可以稱為“點突變”或“單點突變”多肽。作為選擇，與野生型或天然存在的多肽相比，置換突變多肽可以包含兩個
(2)或更多個野生型或天然存在的氨基酸用2個或更多個氨基酸進行的置換。根據(jù)本發(fā)明，與野生型或天然存在的H組核受體配體結合結構域多肽相比，包含置換突變的H組核受體配體結合結構域多肽包含至少一個(I)野生型或天然存在的氨基酸用不同的氨基酸進行的取代。在置換突變多肽包含兩個(2)或更多個野生型或天然存在的氨基酸的置換時，一種情況是該置換可以對等同數(shù)量的刪除的野生型或天然存在的氨基酸進行置換，即，2個野生型或天然存在的氨基酸用2個非野生型或非天然存在的氨基酸替換，另一種情況是對非等同數(shù)量的刪除的野生型氨基酸進行置換，即，2個野生型氨基酸用I個非野生型氨基酸替換(置換+刪除突變)，或2個野生型氨基酸用3個非野生型氨基酸替換(置換+插入突變)。置換突變可以用縮寫命名系統(tǒng)進行描述，以指出該氨基酸殘基和在參考多肽序列中所處的編號以及新的置換的氨基酸殘基。例如，多肽的第20個氨基酸殘基被置換的置換突變體可以縮寫為"x20z"，其中"X"表示將被替換的氨基酸，"20"表示該氨基酸殘基在多肽中的位置或編號，〃z〃表示新的替換的氨基酸。因此，縮寫為"E20A"或〃Glu20Ala〃的置換突變體表示該突變體在多肽的位置20用丙氨酸殘基(本技術領域通?？s寫為"A"或"Ala")替換谷氨酸(本技術領域通常縮寫為"E"或"Glu")。突變或突變體可以是任何改變，包括但不限于置換、刪除、插入或其任何組合?？梢杂帽绢I域已知的任何誘變技術進行置換突變，包括但不限于體外定點誘變(Hutchinson, C.，et al.，1978，J. Biol. Chem. 253 : 6551 ;Zoller 和Smith, 1984，DNA3:479-488 ;Oliphant et al.，1986，Gene44:177 ;Hutchinson etal.，1986，Proc. Natl. Acad. Sci. U. S. A. 83:710)，使用 γαIi 接頭(Pharmacia),限制性內(nèi)切核酸酶消化/片段刪除和置換，PCR介導的/寡核苷酸介導的誘變，和類似方法。定點誘變優(yōu)選基于PCR的技術(參見Higuchi, 1989，"Using PCR to EngineerDNA〃，PCR Technology:Principles and Applications for DNA Amplification, H.Erlich, ed. , Stockton Press,第 6 章，第 61-70 頁)。本發(fā)明的多肽的“片段”將理解為指氨基酸序列比參考多肽的氨基酸序列短的多肽，并且其在這些參考多肽的整個部分內(nèi)，包含相同的氨基酸序列。如果合適的話，這樣的片段可以被包括在更大的多肽內(nèi)，而所述片段是該更大多肽的一部分。本發(fā)明多肽的這樣的片段的長度可以為至少 2、3、4、5、6、8、10、13、14、15、16、17、18、19、20、21、22、25、26、30、35、40、45、50、100、200、240 或 300 個氨基酸。多肽或蛋白的“變體”是源自多肽或蛋白并保留該多肽或蛋白的至少一種生物學特性的任何類似物、片段、衍生物或突變體。多肽或蛋白的不同變體可以存在于自然界中。這些變體可以是由編碼蛋白的結構基因的核苷酸序列中的差異表征的等位基因突變體，或可以涉及差異性剪接或翻譯后修飾。技術人員可以制備具有單個或多個氨基酸置換、刪除、添加或替代的變體。這些變體可以包括(a)其中一個或多個氨基酸殘基被保守的或非保守的氨基酸置換的變體；(b)其中一個或多個氨基酸被加入到多肽或蛋白的變體；(c)其中一個或多個氨基酸包括取代基團的變體；和(d)其中多肽或蛋白與另一多肽例如血清白蛋白融合的變體；等等。獲得這些變體的技術是本領域普通技術人員所知曉的，包括遺傳技術(抑制、剔除、突變等)、化學技術和酶技術。變體多肽優(yōu)選包含至少大約14個氨基酸?！爱愒吹鞍住笔侵覆⒎羌毎烊划a(chǎn)生的蛋白。“成熟蛋白”是指翻譯后加工得到的多肽，S卩，初級翻譯產(chǎn)物中存在的任何前肽或肽原已從其中被去除的一種多肽?！扒绑w”蛋白是指mRNA的初級翻譯產(chǎn)物；即，前肽和肽原依然存在。前肽和肽原可以是但不限于胞內(nèi)定位信號。術語“信號肽”是指分泌的成熟蛋白前面的氨基端多肽。信號肽與成熟蛋白割裂開，因此成熟蛋白中沒有信號肽。信號肽具有將分泌的蛋白引導并轉運通過細胞膜的功能。信號肽也稱作信號蛋白?！靶盘栃蛄小北话ㄔ趯⒈槐磉_在細胞表面的蛋白的編碼序列的開始位置。該序列編碼成熟多肽的N-端的信號肽，信號肽指導宿主細胞轉運多肽。術語“轉運信號序列”在此用來指代這類信號序列?？梢园l(fā)現(xiàn)轉運信號序列與真核和原核細胞中天然的各種蛋白相連，并常常在兩類生物中具有功能。術語“同源性”是指兩個多核苷酸或兩個多肽部分之間的同一性百分比。利用本領域已知的技術可以測定一個部分與另一部分的序列之間的一致性。例如，通過比對序列信息并使用容易獲取的計算機程序，對兩個多肽分子之間的序列信息直接進行比較，可以確定同源性。作為選擇，通過在同源區(qū)域之間形成穩(wěn)定的雙鏈體的條件下對多核苷酸進行雜交，然后用單鏈特異性核酸酶消化并測定消化的片段的大小，可以確定同源性。如在此所使用，術語“同源”所有的語法形式和拼寫變化形式是指擁有“共同進化起源”的蛋白之間的關系，包括來自超家族(例如免疫球蛋白超家族)的蛋白和來自不同種的同源蛋白(例如肌球蛋白輕鏈等)(Reeck et al.，1987，Cell50:667.)。這樣的蛋白(和它們的編碼基因)具有序列同源性，正如它們高度的序列相似性所反映。然而，在通常的用法和本申請中，當用副詞例如“高度的”來修飾術語“同源”時，該術語可以指序列相似性而不是共同的進化起源。
因此，術語“序列相似性”所有的語法形式是指可以或不必享有共同進化起源的蛋白的核酸或氨基酸序列之間的同一性或一致性程度(參見Reeck et al.，1987，Cell50:667)。在特定的實施方案中，當在限定長度的DNA序列范圍內(nèi)有至少大約50%(優(yōu)選至少大約75%、最優(yōu)選地至少大約90或95%)的核苷酸匹配時，這兩個DNA序列“實質上同源”或“實質上相似”。通過使用可從序列數(shù)據(jù)庫中獲取的標準軟件進行序列比較，或在例如針對特定系統(tǒng)所限定的嚴格條件下進行的Southern雜交試驗中，可以鑒定基本上同源的序列。限定合適的雜交條件是在本領域的技術范圍之內(nèi)。參見Sambrook et al.，1989，supra。如本文所使用地，術語“實質上相似”是指這樣的核酸片段，其中一個或多個核苷酸堿基的變化導致一個或多個氨基酸的置換，但是并不影響由該DNA序列編碼的蛋白的功能特性?！皩嵸|上相似”同樣指這樣的核酸片段，其中一個或多個核苷酸堿基的變化并不影響該核酸片段通過反義或共抑制技術介導改變基因表達的能力?！皩嵸|上相似”也指對本發(fā) 明的核酸片段進行的修飾，例如刪除或插入一個或多個核苷酸堿基，這并不實質上影響到所得轉錄物的功能特性。因此可以理解的是，本發(fā)明所包含的不僅僅是這些特定的示例性序列。各種提議的修飾都完全在本領域的常規(guī)技術的范圍內(nèi)，測定被編碼的產(chǎn)物的生物學活性的保留也是如此。此外，技術人員認識到本發(fā)明所包含的實質上相似的序列也由它們在嚴格條件(O. 1XSSC,0. 1%SDS，65°C 和用 2 X SSC, O. 1%SDS 洗滌，再用 O. I X SSC, O. 1%SDS 洗滌)下與在此示例的序列的雜交能力來限定。本發(fā)明的實質上相似的核酸片段是那些其DNA序列與在此報告的核酸片段的DNA序列具有至少70%同一性的核酸片段。本發(fā)明的優(yōu)選的實質上相似的核酸片段是那些其DNA序列與在此報告的核酸片段的DNA序列具有至少80%同一性的核酸片段。更優(yōu)選的核酸片段與在此報告的核酸片段的DNA序列具有至少90%同一性。甚至更優(yōu)選的是與在此報告的核酸片段的DNA序列具有至少95%同一性的核酸片段。當大約40%以上的氨基酸相同，或60%以上氨基酸相似(功能上相同)時，這兩個氨基酸序列“實質上同源”或“實質上相似”。優(yōu)選地，通過使用例如GCG(Genetics ComputerGroup, Program Manual for the GCG Package, Version 7，Madison, Wisconsin)pileup 程序進行比對，鑒定相似或同源的序列。術語“對應于”用于本文是指相似的或同源的序列，無論該確切的位置與同其進行相似性或同源性測量的分子相同或不同。核酸或氨基酸序列比對可以包括空位。因此，術語“對應于”是指序列相似性，而不是氨基酸殘基或核苷酸堿基的編號。氨基酸或核苷酸序列的“實質部分”包括多肽足夠的氨基酸序列或基因足夠的核苷酸序列，從而足以推測性地鑒定那個多肽或基因，這通過本領域技術人員對序列進行手工評價來進行,或者通過使用算法諸如BLAST (Basic Local Alignment Search Tool ；Altschul, S. F. , et al. , (1993) J. Mol. Biol. 215:403-410 ;也參見www. ncbi. nlm. nih. gov/BLAST/)進行計算機自動化序列比較和鑒定來進行。一般而言，為了推測性地鑒定與已知的蛋白或基因同源的多肽或核酸序列，10個或更多個連續(xù)氨基酸或30個或更多個核苷酸的序列是必需的。而且，對于核苷酸序列，包含20-30個連續(xù)核苷酸的基因特異性寡核苷酸探針可以用于序列依賴性的基因鑒定方法(例如Southern雜交)和基因分離方法(例如細菌菌落或噬菌體噬菌斑的原位雜交)。此外，12-15個堿基的短的寡核苷酸可以用作PCR的擴增引物，以便獲得包含所述引物的特定核酸片段。因此，核苷酸序列的“實質部分”包含足夠的序列，足以特異性地鑒定和/或分離包含該序列的核酸片段。如本領域所知道的，術語“同一性百分比”是指兩條或更多多肽序列之間或兩條或更多多核苷酸序列之間的關系，正如通過比較序列所確定的。在該技術領域，“同一性”也指多肽或多核苷酸序列之間的序列相關性程度，這種情況時，可以通過這些序列的鏈之間的匹配來測定?！巴恍浴焙汀跋嗨菩浴笨梢杂靡阎姆椒ㄈ菀椎赜嬎悖ǖ幌抻诿枋鲇谙率鑫墨I中的方法Computational Molecular Biology (Lesk, A. Μ. , ed. ) Oxford UniversityPress, New York(1988) ；Biocomputing:Informatics and Genome Projects(Smith, D.ff. ,ed. ) Academic Press, New York(1993) ；Computer Analysis of Sequence Data, PartI(Griffin, A. M.和 Griffin, H. G.，eds. ) Humana Press, New Jersey (1994) ；SequenceAnalysis in Molecular Biology(vonHeinje, G. , ed. ) Academic Press (1987)；和Sequence Analysis Primer(Gribskov, M.和 Devereux, J.，eds. ) Stockton Press, NewYork(1991) 0測定同一性的優(yōu)選方法被設計以便得到測試序列之間的最佳匹配。測定同一性和相似性的方法編入公開可獲得的計算機程序中。可以應用LASERGENE bioinformaticscomputing suite 的Megalign 程序(DNASTAR Inc. ,Madison, WI)進行序列比對并計算同一性百分比?？梢詰脦в心J參數(shù)(GAP PENALTY= I O, GAP LENGTH PENALTY= 10)的Clustal比對方法(Higgins和Sharp (1989) CABIOS. 5:151-153)進行多序列比對。使用Clustal方法的配對比對的默認參數(shù)可以被選擇KTUPLE1，GAP PENALTY=3, WIND0ff=5和DIAGONALSSAVED=50術語“序列分析軟件”是指可用于分析核苷酸或氨基酸序列的任何計算機算法或軟件程序?！靶蛄蟹治鲕浖笨梢酝ㄟ^商業(yè)途經(jīng)獲得或獨立開發(fā)。典型的序列分析軟件將包括但不限于GCG程序組(Wisconsin Package Version9.0，Genetics Computer Group (GCG)，Madison, WI)、BLASTP, BLASTN, BLASTX (Altschulet al.，J. Mol. Biol. 215:403-410 (1990)和 DNASTAR(DNASTAR,Inc. 1228S.ParkSt. Madison, WI53715USA)。在本申請的上下文中，應該理解，當序列分析軟件用于分析時，分析的結果將基于所參考的程序的“默認值”，除非另外指出。如本文中所使用的，“默認值”指當?shù)谝淮晤A置時軟件最初加載的任何一組值或參數(shù)?！昂铣苫颉笨梢杂墒褂帽绢I域技術人員已知的程序化學合成的寡核苷酸構建模塊裝配而成。這些構建模塊被連接起來并退火，從而形成基因片段，然后將基因片段酶法裝配以構建整個基因。“化學合成”，當涉及DNA序列時，是指核苷酸組分在體外被裝配。使用充分建立的程序可以完成DNA的人工化學合成，或者使用許多商業(yè)上可得的機器中的一種可以進行自動化化學合成。因此，基于為了反映出宿主細胞的密碼子偏愛性的核苷酸序列優(yōu)化，基因可以被修改以獲得最佳的基因表達。如果使密碼子使用偏向于宿主所喜好的那些密碼子，技術人員將有可能成功地進行基因表達?；趯碜孕蛄行畔⒖色@得的宿主細胞的基因的調(diào)查，可以確定優(yōu)選的密碼子。如本文所使用，當a)給定的系統(tǒng)中的每一個系統(tǒng)被其各自的配體以選定的濃度調(diào)節(jié)，導致該系統(tǒng)的基因的表達程度發(fā)生可測量的變化；和b)不論實際進行的調(diào)節(jié)是同時進行還是順序進行，所述變化在統(tǒng)計學上與在細胞、組織或生物體中同時可操作的所有其他系統(tǒng)的表達變化明顯不同時，這兩個或更多個分別可操作的基因調(diào)控系統(tǒng)便認為是“正交的”。優(yōu)選地，對各個可操作的基因調(diào)控系統(tǒng)的調(diào)節(jié)產(chǎn)生比在細胞、組織或生物體中的所有其他可操作的系統(tǒng)大至少2倍的基因表達變化。更優(yōu)選地，變化為至少5倍以上。甚至更優(yōu)選地，變化為至少10倍以上。還有更優(yōu)選地，變化為至少100倍以上。甚至還有更優(yōu)選地，變化為至少500倍以上。理想地，每一個給定的系統(tǒng)被選定濃度的各自的配體調(diào)節(jié)，導致該系統(tǒng)的基因的表達程度發(fā)生可測量的變化，而在細胞、組織或生物體中可操作的所有其他系統(tǒng)的表達沒有可測量的變化。在這樣的情況下，該多重誘導型基因調(diào)控系統(tǒng)可以認為是“完全正交的”。本發(fā)明可用于搜索正交配體和基于正交受體的基因表達系統(tǒng)，諸如在共同在審的美國專利申請09/965，697中所描述的那些，該申請整體并入本文作為參考。本發(fā)明的基因表達調(diào)節(jié)系統(tǒng)申請人:在此已經(jīng)鑒定了參與配體與H組核受體配體結合結構域結合的氨基酸殘基，所述氨基酸殘基影響配體敏感性和基于蛻皮激素受體的誘導型基因表達系統(tǒng)的誘導程度。申請人在此描述了在這些關鍵殘基處包含置換突變(本文稱為“置換突變體”)的H組核受體的構建，并且證明了這些置換突變核受體可用于調(diào)節(jié)基因表達的方法。如本文所呈現(xiàn)，申請人的新型置換突變核受體和它們在基于核受體的誘導型基因表達系統(tǒng)中的應用，在原核和真核宿主細胞中提供了改進的誘導型基因表達系統(tǒng)，在其中，如果需要，根據(jù)用途，可以對配體敏感性和反式激活的程度加以選擇。因此，本發(fā)明涉及新型的置換突變型H組核受體多核苷酸和多肽、包含這樣的突變的H組核受體多核苷酸和多肽的基于核受體的誘導型基因表達系統(tǒng)，以及使用這樣的基于核受體的誘導型基因表達系統(tǒng)在宿主細胞中調(diào)控基因表達的方法。特別地，本發(fā)明涉及包含至少一個基因表達盒的基因表達調(diào)節(jié)系統(tǒng)，該基因表達盒能夠在宿主細胞中被表達，包括編碼多肽的多核苷酸，所述多肽包括含有置換突變的H組核受體配體結合結構域。優(yōu)選地，包含置換突變的H組核受體配體結合結構域來自蛻皮激素受體、遍在受體、孤獨受體I、NER-1、類固醇激素核受體I、類視黃醇X受體相互作用蛋白-15、肝臟X受體β、類固醇激素受體樣蛋白、肝臟X受體、肝臟X受體α、類法尼醇X受體、受體相互作用蛋白14和法呢醇受體。更優(yōu)選地，包含置換突變的H組核受體配體結合結構域來自蛻皮激素受體。在特定的實施方案中，基因表達調(diào)節(jié)系統(tǒng)包含基因表達盒，該基因表達盒包含編碼多肽的多核苷酸，所述多肽包括反式激活結構域，識別應答元件的DNA結合結構域，所述應答元件與其表達待被調(diào)節(jié)的基因相連接；以及含有置換突變的H組核受體配體結合結構域?；虮磉_調(diào)節(jié)系統(tǒng)還可以包括第二基因表達盒，包括i)被第一基因表達盒的被編碼多肽的DNA結合結構域識別的應答元件；ii)被第一基因表達盒的被編碼多肽的反式激活結構域激活的啟動子；和iii)其表達待被調(diào)節(jié)的基因。在另一特定的實施方案中，基因表達調(diào)節(jié)系統(tǒng)包括基因表達盒，該表達盒包含a)編碼多肽的多核苷酸，所述多肽包含反式激活結構域、識別應答元件的DNA結合結構域，所述應答元件與其表達待被調(diào)節(jié)的基因連接；所述多肽還包含含有置換突變的H組核受體配體結合結構域，和b)第二核受體配體結合結構域，選自脊椎動物類視黃醇X受體配體結合結構域、無脊椎動物類視黃醇X受體配體結合結構域、超氣門蛋白配體結合結構域和包含兩個多肽片段的嵌合配體結合結構域，其中第一多肽片段來自脊椎動物類視黃醇X受體配體結合結構域、無脊椎動物類視黃醇X受體配體結合結構域或超氣門蛋白配體結合結構域，第二多肽片段來自不同的脊椎動物類視黃醇X受體配體結合結構域、無脊椎動物類視黃醇X受體配體結合結構域或超氣門蛋白配體結合結構域。基因表達調(diào)節(jié)系統(tǒng)還可以包括第二基因表達盒，包含i)被第一基因表達盒的被編碼多肽的DNA結合結構域識別的應答元件；ii)被第一基因表達盒的被編碼多肽的反式激活結構域激活的啟動子；和iii)其表達待被調(diào)節(jié)的基因。在另一特定的實施方案中，基因表達調(diào)節(jié)系統(tǒng)包含第一基因表達盒和第二基因表達盒，第一基因表達盒包含編碼第一多肽的多核苷酸，所述第一多肽包含識別應答兀件的DNA結合結構域和核受體配體結合結構域，所述應答元件與其表達待被調(diào)節(jié)的基因連接，第二基因·表達盒包含編碼第二多肽的多核苷酸，所述第二多肽包含反式激活結構域和核受體配體結合結構域，其中，核受體配體結合結構域中的一個是包含置換突變的H組核受體配體結合結構域。在優(yōu)選的實施方案中，第一多肽基本上無反式激活結構域，第二多肽基本上無DNA結合結構域。對于本發(fā)明的目的，“基本上無”指討論中的蛋白不含有足夠的討論中的結構域的序列，以賦予激活或結合活性?；虮磉_調(diào)節(jié)系統(tǒng)還可以包括第三基因表達盒，包含i)被第一基因表達盒的第一多肽的DNA-結合結構域識別的應答元件；ii)被第二基因表達盒的第二多肽的反式激活結構域激活的啟動子；和iii)其表達待被調(diào)節(jié)的基因。當只有一個核受體配體結合結構域是包含置換突變的H組配體結合結構域時，另一個核受體配體結合結構域可以來自任何其他的核受體，其與包含置換突變的H組配體結合結構域形成二聚體。例如，當包含置換突變的H組核受體配體結合結構域是包含置換突變的蛻皮激素受體配體結合結構域時，另一個核受體配體結合結構域(“伴侶”)可以來自蛻皮激素受體、脊椎動物類視黃醇X受體(RXR)、無脊椎動物RXR、超氣門蛋白(USP)，或包含至少兩個不同的核受體配體結合結構域多肽片段的嵌合核受體，所述多肽片段選自脊椎動物RXR、無脊椎動物RXR和RXR(參見共同在審專利申請PCT/US01/09050、US60/294, 814和US60/294，819，在此整體引入作為參考)?！鞍閭H”核受體配體結合結構域還可以包括截短突變、剔除突變、置換突變或其他修飾。優(yōu)選地，脊椎動物RXR配體結合結構域來自人Homo sapiens、小家鼠Musmusculus、褐家鼠 Rattus norvegicus、原雞 Gallus gallus、豬 Sus scrofa domestica、非洲爪蟾 Xenopus laevis、斑馬魚 Danio rerio、被囊動物 Polyandrocarpa misakiensis 或7jC母 Tripedalia cysophora RXR0優(yōu)選地，無脊椎動物RXR配體結合結構域來自飛幢Locusta migratoria RXR多妝(〃LmRXR〃)、美洲花蝶 Amblyomma americanum RXR 同源物 I (〃AmaRXRl〃)、美洲花蝶Amblyomma americanum RXR 同源物 2 ("AmaRXRZ")、招潮蟹 Celuca pugilator RXR 同源物("CpRXR〃)、甲蟲黃粉蟲 Tenebrio moIitor RXR 同源物(〃TmRXR〃)、蜜蜂 Apis melliferaRXR同源物("AmRXR")、桃蚜Myzus persicae RXR同源物("MpRXR")、或非-雙翅昆蟲/非-鱗翅昆蟲RXR同源物。優(yōu)選地，嵌合RXR配體結合結構域包括至少兩個多肽片段，選自脊椎動物種RXR多肽片段、無脊椎動物種RXR多肽片段和非雙翅昆蟲/非鱗翅昆蟲無脊椎動物種RXR同源多肽片段。用于本發(fā)明的嵌合RXR配體結合結構域可以包括至少兩個不同的物種的RXR多肽片段，或當物種相同的時候，這兩個或更多個多肽片段可以來自該物種RXR多肽片段的兩個或更多個不同的同種型。
在優(yōu)選的實施方案中，嵌合RXR配體結合結構域包含至少一個脊椎動物種RXR多肽片段和一個無脊椎動物種RXR多肽片段。在更優(yōu)選的實施方案中，嵌合RXR配體結合結構域包含至少一個脊椎動物種RXR多肽片段和一個非雙翅昆蟲/非鱗翅昆蟲無脊椎動物種RXR同源物多肽片段。在特定的實施方案中，其表達待被調(diào)節(jié)的基因是宿主細胞的同源基因。在另一特定的實施方案中，其表達待被調(diào)節(jié)的基因是宿主細胞的異源基因。如下所述的用于本發(fā)明的配體與核受體的配體結合結構域組合，核受體又結合到與基因連接的應答元件，這時便提供了對基因的表達進行外部臨時調(diào)控的手段。本發(fā)明的各種成分相互結合的結合機制或順序，即，例如，配體與配體結合結構域、DNA結合結構域與應答元件、反式激活結構域與啟動子等的結合機制或順序等，并不是關鍵的。在特定的例子中，配體與H組核受體的配體結合結構域和它的核受體配體結合結構域伴侶的結合使得能夠進行基因的表達或抑制。該機制并不排除配體結合H組核受體(GHNR)或它的伴侶和形成活性同源二聚體復合體的可能(例如GHNR+GHNR或伴侶+伴侶)。優(yōu)選地，受體結構域中的一個或多個是可變的，從而產(chǎn)生雜合基因開關。典型地，DBD、LBD和反式激活結構域這三個結構域中的一個或多個可以選自與其他結構域的來源不同的來源，以便優(yōu)化雜合基因和所得到的雜合蛋白在所選擇的宿主細胞或生物中的反式激活活性、配體互補結合性和特定應答元件的識別。此外，應答元件本身可以進行修飾，或者用其他DNA結合蛋白結構域的應答元件或合成的應答元件替換，以適應雜合受體，所述其他的DNA結合蛋白例如酵母的 GAL-4 蛋白(參見 Sadowski, et al. (1988), Nature, 335:563-564)或大腸桿菌的LexA蛋白(參見Brent和Ptashne (1985)，Cell, 43:729-736)，而所述合成的應答元件對與經(jīng)過設計、修飾和選擇以進行特異性相互作用的蛋白的目標相互作用具有特異性(參見例如 Kim, et al. (1997)，Proc. Natl. Acad. Sci.，USA, 94:3616-3620)。雙雜合系統(tǒng)的另一優(yōu)點是它們允許根據(jù)期望的最終結果對用于驅動基因表達的啟動子進行選擇。這樣的雙重控制在基因療法領域，特別當產(chǎn)生的是毒性蛋白時特別重要，這是因為可以對表達的時機以及發(fā)生表達的細胞進行控制。當可操作性地連接到合適的啟動子的基因被導入對象的細胞時，借助于本發(fā)明的系統(tǒng)的存在，該外源基因的表達得以控制。啟動子可以以組成型或誘導型的方式被調(diào)控，或者可以是組織特異性的(即，僅在特定的細胞類型中表達)或對生物體的某些發(fā)育階段具有特異性。蛻皮激素受體是核受體超家族的成員，歸入亞家族1，H組(本文稱為“H組核受體”)。每一組的成員在E(配體結合)結構域中享有40-60%的氨基酸同一性(Laudetet al. , A Unified Nomenclature System for the Nuclear Resceptor Subfamily,1999 ；Cell97:161-163)。除了蛻皮激素受體，該核受體亞家族1，H組的其他成員包括遍在受體(UR)、孤獨受體I (0R-1)、類固醇激素核受體I (NER-I)、類視黃醇X受體相互作用蛋白-15(RIP-15)、肝臟X受體β (LXRi3)、類固醇激素受體樣蛋白(RLD-I)、肝臟X受體(LXR)、肝臟X受體a (LXR α )、類法呢醇X受體(FXR)、受體相互作用蛋白14 (RIP-14)和法呢醇受體(HRR-I)。申請人:已經(jīng)開發(fā)了 CfEcR同源模型，并已經(jīng)應用這個同源模型與公開的Chironomous tetans 脫皮激素受體(“CtEcR”)同源模型(ffurtz et al. , 2000)來鑒定參與結合蛻皮類固醇和非蛻皮類固醇的關鍵殘基。已經(jīng)顯示，合成的非蛻皮類固醇、二酰肼以高親和力結合鱗翅類EcRs，并誘導這些昆蟲發(fā)生早熟性不完全蛻皮(Wing et al.，1988)，這些化合物中的一些目前作為殺蟲劑出售。EcRs的配體結合腔(cavity)或“袋(pocket)”已經(jīng)進化以配合蛻皮類固醇例如20-羥基蛻皮激素(20E)的長主架結構。與蛻皮類固醇相t匕，二酰肼具有緊密的結構，僅僅占據(jù)EcR結合袋的底部部分。這使得結合袋的頂部具有一些關鍵殘基，它們與蛻皮類固醇而不與非蛻皮類固醇例如二酰肼接觸。申請人在此描述了在這些結合袋殘基處包含有置換突變的突變型蛻皮激素受體的構建，并已經(jīng)鑒定了若干類具有改變的配體結合特征和反式激活特征的置換突變蛻皮激素受體?？紤]到蛻皮激素受體與其他H組核受體的密切相關性，申請人鑒定的蛻皮激6素受體配體結合結構域置換突變在被導入其他H組核受體的配體結合結構域的類似位置以修改它們的配體結合性或配體敏感性時，也有望發(fā)揮作用。使用本技術領域常規(guī)的方法例如序列分析、通過同源建模和結合分析來分析結合袋的方法，本領域技術人員能夠鑒定出序列和功能上的類似氨基酸位置。申請人的新型的置換突變H組核受體多核苷酸和多肽可用于基于核受體的誘導型基因調(diào)節(jié)系統(tǒng)，用于各種應用中，包括基因治療、在宿主細胞中表達感興趣的蛋白、產(chǎn)生轉基因生物以及基于細胞的分析。特別地，申請人在此描述了新型的基因表達調(diào)節(jié)系統(tǒng)，該系統(tǒng)包括含有置換突變的H組核受體配體結合結構域。該基因表達系統(tǒng)可以是基于“單開關”的基因表達系統(tǒng)，其中反式激活結構域、DNA結合結構域和配體結合結構域在一個編碼多肽上?？蛇x擇地，基因表達調(diào)節(jié)系統(tǒng)可以是基于“雙開關”或“雙雜合”的基因表達調(diào)節(jié)系統(tǒng)，其中反式激活結構域、DNA結合結構域位于兩個不同的編碼多肽上。申請人已經(jīng)首次證明了，置換突變的核受體可以在原核和真核細胞中用作基于核受體的誘導型基因表達系統(tǒng)的成分，以改變配體結合活性和/或配體特異性。如上所述，申請人的發(fā)現(xiàn)是意想不到而且令人驚奇的。本發(fā)明的基于蛻皮激素受體的基因表達調(diào)節(jié)系統(tǒng)可以是異源二聚體或同源二聚體。功能EcR復合體通常指異源二聚體蛋白復合體，由類固醇受體家族的兩個成員組成，它們是獲自各種昆蟲的蛻皮激素受體蛋白和超氣門(USP)蛋白或USP的脊椎動物同源物，類視黃醇 X 受體蛋白(參見 Yao，et al. (1993)Nature366:476-479 ；Yao, et al. , (1992)Cell71:63-72)。然而，復合體也可以是下面詳細描述的同源二聚體。功能性蛻皮類固醇受體復合體也可以包括額外的蛋白例如親免素。類固醇受體蛋白質家族的其他成員，稱為轉錄因子(例如DHR38或β FTZ-1)，也可以是EcR、USP和/或RXR的配體依賴型或非配體依賴型的伴侶。此外，可以需要其他的輔因子，例如通常稱為輔激活物(也稱為適體或介體)的蛋白質。這些蛋白并不以序列特異性的方式結合DNA，也不參與基礎轉錄。它們可以通過各種機制對轉錄激活施加它們的影響，包括通過影響染色質結構，或通過介導激活物-起始復合體相互作用，來刺激激活物的DNA結合。這樣的輔激活物的例子包括RIP140、TIFl、RAP46/Bag-1、ARA70、SRC-l/NCoA-l、TIF2/GRIP/NCoA_2、ACTR/AIBl/RAC3/pCIP,以及乏主輔激活物C應答元件B結合蛋白、CBP/p300(參見綜述Glass et al. , Curr. Opin.Cell Biol. 9:222-232, 1997)。而且，可能需要通常稱為輔阻遏物(也稱為阻遏物、沉默子或沉默介體)的蛋白輔因子，以便在不存在配體的情況下有效地抑制轉錄激活。這些輔阻遏蛋白可以與未配體化的蛻皮激素受體相互作用，以沉默對應答元件的活性。目前的證據(jù)顯示，與配體的結合改變了受體的構象，這導致輔阻遏物的釋放和上述輔激活物的招募，從而廢止它們的沉默活性。輔阻遏物的例子包括N-CoR和SMRT (參見綜述Horwitz et al. MolEndocrinol. 10:1167-1177, 1996)。這些輔因子在細胞或生物中可以是內(nèi)源性的，或者可以作為將以調(diào)控或非調(diào)控的方式被表達的轉基因外源性地加入。在一些環(huán)境中，蛻皮激素受體蛋白、USP或RXR的同型二聚體復合物也可以發(fā)揮功能。蛻皮激素受體復合體典型地包括核受體超家族成員的蛋白，其中超家族中的所有成員的一般特征是存在氨基端的反式激活結構域、DNA結合結構域(“DBD”)和通過鉸鏈區(qū)與DBD隔開的配體結合結構域(“LBD”)。如在此所使用，術語“DNA結合結構域”包括DNA結合蛋白的最小的多肽序列，至全長的DNA結合蛋白，只要該DNA結合域具有與特定應答元件締合的功能即可。核受體超家族的成員也被表征為存在四個或五個結構域:A/B、C、D、E，在一些成員中存在 F (參見美國專利 4，981，784 和 Evans, Science240:889-895 (1988))?！ˋ/B"結構域對應于反式激活結構域，〃C"對應于DNA結合結構域，"D"對應于鉸鏈區(qū)，"E〃對應于配體結合結構域。該家族的一些成員也可能在LBD的羧基末端一側具有另一反式激活結構域，即對應于"F"。DBD的特征是存在兩個半胱氨酸鋅指結構，在它們之間是兩個氨基酸基序，P-box 和D-box，其賦予了對蛻皮激素應答元件的特異性。這些結構域可以是天然的、經(jīng)修飾的，或異源的受體蛋白的不同結構域的嵌合物。如同類固醇受體家族的亞群，EcR受體也擁有負責異源二聚化特性的尚未充分限定的區(qū)域。因為核受體的結構域在天然狀態(tài)下是模塊化的，所以LBD、DBD和反式激活結構域可以相互變換。整合有來自蛻皮激素受體復合體的成分的基因開關系統(tǒng)是已知的。然而，在這些已知的系統(tǒng)中，凡是使用EcR的時候，它都是在同一個分子上與天然的或修飾的DNA結合結構域和反式激活結構域連接。USP或RXR通常用作沉默伴侶。申請人之前已經(jīng)說明，當DNA結合結構域和反式激活結構域在同一個分子上時，在沒有配體時具有高的背景活性，也說明了當DNA結合結構域和反式激活結構域在不同的分子上，即分別在異型二聚體或同型二聚體復合物的各個伴侶上時，這樣的背景活性顯著降低(參見PCT/US01/09050)。本發(fā)明的基因表達盒本發(fā)明的新型的基于核受體的誘導型基因表達系統(tǒng)包含至少一個基因表達盒，該基因表達盒能夠在宿主細胞中被表達，其中該基因表達盒包含編碼多肽的多核苷酸，所述多肽包括含有置換突變的H組核受體配體結合結構域。因此，申請人的發(fā)明也提供了用于本發(fā)明的基因表達系統(tǒng)的新型基因表達盒。在一個特定的實施方案中，能夠在宿主細胞中表達的基因表達盒包含編碼多肽的多核苷酸，所述多肽選自a)包含反式激活結構域、DNA結合結構域和含有置換突變的H組核受體配體結合結構域的多肽山)包含DNA結合結構域和含有置換突變的H組核受體配體結合結構域的多肽；c)包含反式激活結構域和含有置換突變的H組核受體配體結合結構域的多肽。在另一特定的實施方案中，本發(fā)明提供了能夠在宿主細胞中表達的基因表達盒，其中該基因表達盒包含編碼雜合多肽的多核苷酸，所述雜合多肽選自a)包含反式激活結構域、DNA結合結構域和含有置換突變的H組核受體配體結合結構域的雜合多肽；b)包含DNA結合結構域和含有置換突變的H組核受體配體結合結構域的雜合多肽；和c)包含反式激活結構域和含有置換突變的H組核受體配體結合結構域的雜合多肽。本發(fā)明的雜合多肽包含至少兩個多肽片段，其中每個多肽片段來自不同的來源，即，不同的多肽、不同的核受體、不同的物種等。本發(fā)明的雜合多肽包含至少兩個多肽結構域，其中每個多肽結構域來自不同的來源。在特定的實施方案中，含有置換突變的H組核受體配體結合結構域來自蛻皮激素受體、遍在受體、孤獨受體I、NER-1、類固醇激素核受體I、類視黃醇X受體相互作用蛋白-15、肝臟X受體β、類固醇激素受體樣蛋白、肝臟X受體、肝臟X受體α、類法呢醇X受體、受體相互作用蛋白14和法呢醇受體。在優(yōu)選的實施方案中，H組核受體配體結合結構域來自蛻皮激素受體。因此，本發(fā)明也提供了包含編碼多肽的多核苷酸的基因表達盒，所述多肽選自a)包含反式激活結構域、DNA結合結構域和含有置換突變的蛻皮激素受體配體結合結構域的多肽；b)包含DNA結合結構域和含有置換突變的蛻皮激素受體配體結合結構域的多肽；和
c)包含反式激活結構域和含有置換突變的蛻皮激素受體配體結合結構域的多肽。優(yōu)選地，該基因表達盒包含編碼雜合多肽的多核苷酸，所述雜合多肽選自a)包含反式激活結構域、DNA結合結構域和含有置換突變的蛻皮激素受體配體結合結構域的雜合多肽；b)包含DNA結合結構域和含有置換突變的蛻皮激素受體配體結合結構域的雜合多肽；和c)包含反式激活結構域和含有置換突變的蛻皮激素受體配體結合結構域的雜合多肽，其中被編碼的雜合多肽包含至少兩個多肽片段，其中每個多肽片段來自不同的來源。蛻皮激素受體(EcR)配體結合結構域(LBD)可以來自無脊椎動物EcR，優(yōu)選地選自節(jié)肢動物綱的EcR。優(yōu)選地，EcR選自鱗翅類EcR、雙翅類EcR、直翅類EcR、同翅類EcR和半翅類EcR。更優(yōu)選地，用于本發(fā)明的EcR配體結合結構域來自云杉蚜蟲云杉色卷蛾(Choristoneura fumiferana) EcR(〃CfEcR〃)、甲蟲黃粉蟲(Tenebrio molitor)EcR("TmEcR")、煙草天蛾(Manduca sexta) EcR("MsEcR")、Heliothies virescensEcR("HvEcR")、搖蚊(Chironomus tentans) EcR("CtEcR")、香蛾家香(Bombyx mori)EcR("BmEcR")、斜視小眉眼蝶(squinting bush brown)Bicyclus anynana EcR("BanEcR")、buckeye Junonia coenia EcR(〃JcEcR〃)、果蜆黑腹果蜆 EcR(〃DmEcR〃)、蚊子埃及伊蚊(Aedes aegypti) EcR("AaEcR")、HH 妮 Lucilia capitata("LcEcR")、HH 妮 Luciliacuprina EcR("LucEcR")、 HH 妮 Calliphora viciniaEcR("CvEcR")、地中海果妮Ceratitis capitata EcR(〃CcEcR〃)、蟲皇蟲 Locusta migratoriaEcR(〃LmEcR〃)、蟲牙蟲 Myzuspersicae EcR("MpEcR")、招潮蟹 Celuca pugiIatorEcR("CpEcR")、美洲花蝶(Amblyommaamericanum) EcR(〃AmaEcR〃)、白粉風 Bamecia argentifoli EcR(〃BaEcR〃)或葉 !單Nephotetix cincticeps EcR("NcEcR")。更優(yōu)選地，LBD 來自 CfEcR、DmEcR 或 AmaEcR。在特定的實施方案中，LBD來自截短的EcR多肽。EcR多肽的截短導致刪除了至少
1、2、3、4、5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、I15、120、125、130、135、140、145、150、155、160、165、170、175、180、185、190、195、200、205、210、215、220、225、230、235、240、245、250、255、260 或 265 個氨基酸。優(yōu)選地，EcR 多肽的截短導致刪除了多肽結構域的至少一部分。更優(yōu)選地，EcR多肽的截短導致刪除了至少一個完整的多肽結構域。在特定的實施方案中，EcR多肽的截短導致刪除了至少Α/B結構域、C結構域、D結構域、F結構域、A/B/C結構域、A/B/1/2-C結構域、A/B/C/D結構域、A/B/C/D/F結構域、A/B/F結構域、A/B/C/F結構域、部分E結構域或部分F結構域。也可以組合刪除若干完整和/或部分結構域。
在特定的實施方案中，H組核受體配體結合結構域由包含密碼子突變的多核苷酸編碼，所述密碼子突變導致置換a) SEQ ID勵1的氨基酸殘基48、51、52、54、92、95、96、109、110、119、120、125、128、132、219、223、234 或 238 ；b)SEQ ID NO: I 的氨基酸殘基 96 和 119 ；
c)SEQ ID NO: I的氨基酸殘基110和128 ;d) SEQ ID NO: I的氨基酸殘基52和110 ;e) SEQID NO: I的氨基酸殘基107、110和127 ;或f) SEQ ID NO: I氨基酸殘基52、107和127。在另一實施方案中，H組核受體配體結合結構域由包含密碼子突變的多核苷酸編碼，所述密碼子突變導致SEQ ID NO: I的氨基酸殘基107和127的置換和氨基酸259的插入。在優(yōu)選的實施方案中，H組核受體配體結合結構域來自蛻皮激素受體。在另一特定的實施方案中，H組核受體配體結合結構域由包含密碼子突變的多核苷酸編碼，所述密碼子突變導致下述的置換a)等同于或類似于SEQ ID NO: I的氨基酸殘基48的位置置換以天冬酰胺、精氨酸、酪氨酸、色氨酸、亮氨酸或賴氨酸殘基；b)等同于或類似于SEQ ID NO: I的氨基酸殘基51的位置置換以蛋氨酸、天冬酰胺或亮氨酸殘基；c)等
同于或類似于SEQ ID NO: I的氨基酸殘基52的位置置換以亮氨酸、脯氨酸、蛋氨酸、精氨酸、色氨酸、甘氨酸、谷氨酰胺或谷氨酸殘基；d)等同于或類似于SEQ ID NO: I的氨基酸54的位置置換以色氨酸或蘇氨酸；e)等同于或類似于SEQ ID NO: I的氨基酸92的位置置換以亮氨酸或谷氨酸；f)等同于或類似于SEQ ID NO: I的氨基酸殘基95的位置置換以組氨酸、蛋氨酸或色氨酸殘基；g)等同于或類似于SEQ ID NO: I的氨基酸殘基96的位置置換以亮氨酸、絲氨酸、谷氨酸或色氨酸殘基；h)等同于或類似于SEQ ID NO: I的氨基酸109的位置置換以色氨酸、脯氨酸、亮氨酸、蛋氨酸或天冬酰胺；i)等同于或類似于SEQ ID NO: I的氨基酸殘基110的位置置換以谷氨酸、色氨酸或天冬酰胺殘基；j)等同于或類似于SEQ IDNO: I的氨基酸119的位置置換以苯丙氨酸；k)等同于或類似于SEQ ID NO: I的氨基酸120的位置置換以色氨酸或蛋氨酸；1)等同于或類似于SEQ ID NO: I的氨基酸125的位置置換以谷氨酸、脯氨酸、亮氨酸、半胱氨酸、色氨酸、甘氨酸、異亮氨酸、天冬酰胺、絲氨酸、纈氨酸或精氨酸；m)等同于或類似于SEQ ID NO: I的氨基酸128的位置置換以苯丙氨酸；n)等同于或類似于SEQ ID NO: I的氨基酸132的位置置換以蛋氨酸、天冬酰胺、谷氨酸或纈氨酸；ο)等同于或類似于SEQ ID NO: I的氨基酸殘基219的位置置換以丙氨酸、賴氨酸、色氨酸或酪氨酸殘基；P)等同于或類似于SEQ ID NO: I的氨基酸殘基223的位置置換以賴氨酸、精氨酸或酪氨酸殘基；q)等同于或類似于SEQID NO: I的氨基酸234的位置置換以蛋氨酸、精氨酸、色氨酸或異亮氨酸；r)等同于或類似于SEQ ID NO: I的氨基酸238的位置置換以脯氨酸、谷氨酸、亮氨酸、蛋氨酸或酪氨酸；s)等同于或類似于SEQ ID NO: I的氨基酸119的位置置換以苯丙氨酸殘基和等同于或類似于SEQ ID NO: I的氨基酸96的位置置換以蘇氨酸；t)等同于或類似于SEQ ID NO: I的氨基酸110的位置置換以脯氨酸殘基和等同于或類似于SEQ ID NO: I的氨基酸128的位置上置換以苯丙氨酸殘基；u)等同于或類似于SEQ ID NO: I的氨基酸52的位置置換以纈氨酸殘基和等同于或類似于SEQID NO: I的氨基酸110的位置置換以脯氨酸殘基；v)等同于或類似于SEQ ID NO: I的氨基酸107的位置置換以異亮氨酸殘基、等同于或類似于SEQ ID NO: I的氨基酸127的位置置換以谷氨酸殘基和等同于或類似于SEQ ID NO: I的氨基酸110的位置置換以脯氨酸殘基；或《)等同于或類似于SEQ IDNO: I的氨基酸107的位置置換以異亮氨酸、等同于或類似于SEQ ID NO: I的氨基酸127的位置置換以谷氨酸和等同于或類似于SEQ ID NO: I的氨基酸52的位置置換以纈氨酸殘基。在另一實施方案中，H組核受體配體結合結構域由包含密碼子突變的多核苷酸編碼，所述密碼子突變導致等同于或類似于SEQ ID NO: I的氨基酸107的位置置換以異亮氨酸殘基、等同于或類似于SEQ ID NO: I的氨基酸127的位置置換以谷氨酸殘基，和在等同于或類似于SEQ ID NO: I的氨基酸259的位置插入甘氨酸殘基。在優(yōu)選的實施方案中，H組核受體配體結合結構域來自蛻皮激素受體。在特定的實施方案中，包含置換突變的H組核受體配體結合結構域是包含置換突變的蛻皮激素受體配體結合結構域，所述結構域由包含密碼子突變的多核苷酸編碼，所述密碼子突變導致產(chǎn)生選自下列的置換突變SEQ ID勵1上發(fā)生的？48￥44814481^448隊F48R、F48K、I51M、I51N、I51L、T52M、T52V、T52L、T52E、T52P、T52R、T52W、T52G、T52Q、M54W、M54T、M92L、M92E、R95H、R95M、R95W、V96L、V96W、V96S、V96E、F109W、F109P、F109L、F109M、F109N、A110E、A110N、A110W、N119F、Y120W、Y120M、M125P、M125R、M125E、M125L、M125C、M125W、M125G、M125I、M125N、M125S、M125V、V128F、L132M、L132N、L132V、L132E、M219K、M219W、M219Y、M219A、L223K、L223R、L223Y、L234M、L234I、L234R、L234W、W238P、W238E、 W238Y、W238M、W238L、N119F/V96T、V128F/A110P、T52V/A110P、V107I/Y127E/T52V 和 V107I/Y127E/A1IOP置換突變。在另一特定的實施方案中，包含置換突變的H組核受體配體結合結構域是包含置換突變的蛻皮激素受體配體結合結構域，所述結構域由包含密碼子突變的多核苷酸編碼，所述密碼子突變導致產(chǎn)生置換突變SEQ ID N0:1的V107I/Y127E，其進一步包括插入突變SEQ IDNO: I 的 G259(V107I/Y127E/G259)。在另一特定的實施方案中，包含置換突變的H組核受體配體結合結構域是包含置換突變的蛻皮激素受體配體結合結構域多肽，所述結構域多肽由在雜交條件下與包含密碼子突變的多核苷酸雜交的多核苷酸編碼，所述密碼子突變導致產(chǎn)生選自下述的置換突變SEQ ID NO: I 上發(fā)生的 F48Y、F48W、F48L、F48N、F48R、F48K、I51M、I51N、I51L、T52M、T52V、T52L、T52E、T52P、T52R、T52W、T52G、T52Q、M54W、M54T、M92L、M92E、R95H、R95M、R95W、V96L、V96W、V96S、V96E、F109W、F109P、F109L、F109M、F109N、Al 10E、Al ION、Al 10W、NI 19F、Y120W、Y120M、M125P、M125R、M125E、M125L、M125C、M125W、M125G、M125I、M125N、M125S、M125V、V128F、L132M、L132N、L132V、L132E、M219K、M219W、M219Y、M219A、L223K、L223R、L223Y、L234M、L234I、L234R、L234W、W238P、W238E、W238Y、W238M、W238L、N119F/V96T、V128F/A110P、T52V/A110P.V107I/Y127E/T52V 和 V107I/Y127E/A110P，所述雜交條件包括在少于 500mM 鹽和至少37°C中的雜交步驟，和在2XSSPE、至少63°C的洗滌步驟。在優(yōu)選的實施方案中，雜交條件包括小于200mM鹽和至少37°C的雜交步驟。在另一優(yōu)選實施方案中，雜交條件包括2 X SSPE和63°C的雜交和洗滌步驟。在另一特定的實施方案中，H組核受體配體結合結構域包含置換突變，置換突變的位置等同于或類似于a) SEQ ID NO: I的氨基酸殘基48、51、52、54、92、95、96、109、110、119、120、125、128、132、219、223、234 或 238 ；b)SEQ IDNO: I 的氨基酸殘基 96 和 119 ；c)SEQ IDNO: I的氨基酸殘基110和128 ；d) SEQ IDNO: I的氨基酸殘基52和110 ；e)SEQ ID NO: I的氨基酸殘基107、110和127 ;或f) SEQ ID NO: I的氨基酸殘基52、107和127。在另一實施方案中，H組核受體配體結合結構域包括等同于或類似于SEQ ID NO: I的氨基酸殘基107和127的位置的置換突變和氨基酸殘基259位置的插入突變。在優(yōu)選的實施方案中，H組核受體配體結合結構域來自蛻皮激素受體。
優(yōu)選地，H組核受體配體結合結構域包括下述置換a)等同于或類似于SEQIDNO: I的氨基酸殘基48的位置置換以天冬酰胺、精氨酸、酪氨酸、色氨酸、亮氨酸或賴氨酸殘基山)等同于或類似于SEQ ID NO: I的氨基酸殘基51的位置置換以蛋氨酸、天冬酰胺或亮氨酸殘基；c)等同于或類似于SEQ ID NO: I的氨基酸殘基52的位置置換以亮氨酸、脯氨酸、蛋氨酸、精氨酸、色氨酸、甘氨酸、谷氨酰胺或谷氨酸殘基；d)等同于或類似于SEQ ID NO: I的氨基酸54的位置置換以色氨酸或蘇氨酸殘基；e)等同于或類似于SEQ ID N0:1的氨基酸92的位置置換以亮氨酸或谷氨酸殘基；f)等同于或類似于SEQ ID NO: I的氨基酸殘基95的位置置換以組氨酸、蛋氨酸或色氨酸殘基；g)等同于或類似于SEQ ID NO: I的氨基酸殘基96的位置置換以亮氨酸、絲氨酸、谷氨酸或色氨酸殘基；h)等同于或類似于SEQ ID NO: I的氨基酸109的位置置換以色氨酸、脯氨酸、亮氨酸、蛋氨酸或天冬酰胺；i)等同于或類似于SEQ ID NO: I的氨基酸殘基110的位置置換以谷氨酸、色氨酸或天冬酰胺殘基；j)等同于或類似于SEQ ID NO: I的氨基酸119的位置置換以苯丙氨酸殘基；k)等同于或類似于SEQID NO: I的氨基酸120的位置置換以色氨酸或蛋氨酸殘基；I)等同于或類似于SEQ ID NO: I的氨基酸125的位置置換以谷氨酸、脯氨酸、亮氨酸、半胱氨酸、色氨酸、甘氨酸、異亮氨酸、天冬酰胺、絲氨酸、纈氨酸或精氨酸殘基；m)等同于或類似于SEQ ID NO: I的氨基酸128的位置置換以苯丙氨酸殘基；n)等同于或類似于SEQ ID NO: I的氨基酸132的位置置換以蛋氨酸、天冬酰胺、谷氨酸或纈氨酸殘基；ο)等同于或類似于SEQ ID NO: I的氨基酸殘基219的位置置換以丙氨酸、賴氨酸、色氨酸或酪氨酸殘基；P)等同于或類似于SEQ ID NO: I的氨基酸殘基223的位置置換以賴氨酸、精氨酸或酪氨酸殘基；q)等同于或類似于SEQ ID NO: I的氨基酸234的位置上置換以蛋氨酸、精氨酸、色氨酸或異亮氨酸殘基；r)等同于或類似于SEQ ID NO: I的氨基酸238的位置置換以脯氨酸、谷氨酸、亮氨酸、蛋氨酸或酪氨酸殘基；s)等同于或類似于SEQ ID NO: I的氨基酸119的位置置換以苯丙氨酸殘基和等同于或類似于SEQID NO: I的氨基酸96的位置置換以蘇氨酸；t)等同于或類似于SEQ ID NO: I的氨基酸110的位置置換以脯氨酸殘基和等同于或類似于SEQ ID NO: I的氨基酸128的位置置換以苯丙氨酸殘基；u)等同于或類似于SEQ ID NO: I的氨基酸52的位置置換以纈氨酸殘基和等同于或類似于SEQ ID NO: I的氨基酸110的位置置換以脯氨酸殘基；v)等同于或類似于SEQ ID NO: I的氨基酸107的位置置換以異亮氨酸殘基、等同于或類似于SEQ ID NO: I的氨基酸127的位置置換以谷氨酸殘基和等同于或類似于SEQ ID NO: I的氨基酸110的位置置換以脯氨酸殘基；或4等同于或類似于SEQ ID NO: I的氨基酸107的位置置換以異亮氨酸殘基、等同于或類似于SEQ ID NO: I的氨基酸127的位置置換以谷氨酸殘基和等同于或類似于SEQ ID NO: I的氨基酸52的位置置換以纈氨酸殘基。在另一實施方案中，H組核受體配體結合結構域包括在等同于或類似于SEQ ID NO: I的氨基酸107的位置置換異亮氨酸殘基、在等同于或類似于SEQ ID NO: I的氨基酸127的位置置換谷氨酸殘基，和在等同于或類似于SEQ ID NO: I的氨基酸259的位置插入甘氨酸殘基。在優(yōu)選的實施方案中，H組核受體配體結合結構域來自蛻皮激素受體。在另一特定的實施方案中，包含置換突變的H組核受體配體結合結構域是包含置換突變的蛻皮激素受體配體結合結構域多肽，其中所述置換突變選自SEQ IDN0:1的F48Y、F48W、F48L、F48N、F48R、F48K、I51M、I51N、I51L、T52M、T52V、T52L、T52E、T52P、T52R、T52W、T52G、T52Q、M54W、M54T、M92L、M92E、R95H、R95M、R95W、V96L、V96W、V96S、V96E、F109W、F109P、F109L、F109M、F109N、A110E、AllON、AllOW、N119F、Y120W、Y120M、M125P、M125R、M125E、M125L、M125C、M125W、M125G、M125I、M125N、M125S、M125V、V128F、L132M、L132N、L132V、L132E、M219K、M219W、M219Y、M219A、L223K、L223R、L223Y、L234M、L234I、L234R、L234W、W238P、W238E、W238Y、W238M、W238L、NI 19F/V96T、T52V/A110P、V128F/A110P、V107I/Y127E/T125V和V107I/Y127E/A110P置換突變。在另一實施方案中，包含置換突變的H組核受體配體結合結構域是包含SEQ ID N0:1中的置換突變V107I/Y127E的蛻皮激素受體配體結合結構域多肽，其進一步包括插入突變SEQ ID N0:1中的G259(V107I/Y127E/G259)。DNA結合結構域可以是已知的應答元件的任何DNA結合結構域，包括合成的和嵌合的DNA結合結構域，或其類似物、組合或修飾。優(yōu)選地，DBD是GAL4DBD、LexA DBD、轉錄因子DBD、H組核受體成員DBD、類固醇/甲狀腺激素核受體超家族成員DBD或細菌LacZ DBD0更優(yōu)選地,DBD 是 EcR DBD [SEQ IDN0:4(多核苷酸)或 SEQ ID NO: 5 (多肽)]、GAL4DBD [SEQID NO: 6 (多核苷酸)或 SEQ ID N0:7(多肽)]或 LexA DBD [(SEQ ID NO: 8 (多核苷酸)或SEQ ID N0:9(多肽))。反式激活結構域(縮寫為〃AD〃或"TA")可以是任何H組核受體成員AD、類固醇/甲狀腺激素核受體AD、合成或嵌合AD、多谷氨酰胺AD、堿性或酸性氨基酸AD、VP16AD、GAL4AD.NF- κ B AD、BP64AD、B42酸性激活結構域(B42AD)、p65反式激活結構域(p65AD)或其類似物、組合或修飾。在特定的實施方案中，AD是合成的或嵌合的AD，或獲自EcR、糖皮質激素受體、VP16、GAL4、NF- κ B或B42酸性激活結構域AD。優(yōu)選地，AD是EcRAD [SEQ IDNO: 10 (多核苷酸)或 SEQID N0:11(多肽)]、VP16AD[SEQ ID NO: 12 (多核苷酸)或 SEQ IDN0:13(多肽)]、B42AD[SEQ ID NO: 14 (多核苷酸)或 SEQ ID 勵15(多肽)]或 p65AD[SEQIDNO: 16 (多核苷酸)或 SEQ ID N0:17(多肽)]。在特定的實施方案中，基因表達盒編碼雜合多肽，該雜合多肽包含a]由包含SEQID NO:4, SEQ ID N0:6或SEQ ID N0:8的核酸序列的多核苷酸編碼的DNA結合結構域，或
b]由包含 SEQ ID NO: 10,SEQ ID NO: 12,SEQ ID NO: 14 或 SEQID NO: 16 的核酸序列的多核苷酸編碼的反式激活結構域；以及包含由本發(fā)明的多核苷酸編碼的置換突變的H組核受體配體結合結構域。優(yōu)選地，包含置換突變的H組核受體配體結合結構域是包含置換突變的蛻皮激素受體配體結合結構域，其由本發(fā)明的多核苷酸編碼。在另一特定的實施方案中，基因表達盒編碼雜合多肽，該雜合多肽包含a)包含SEQ ID NO:5, SEQ ID N0:7或SEQ ID NO:9的氨基酸序列的DNA結合結構域；或b)包含SEQ ID NO: 11、EQ ID NO: 13、SEQ ID NO: 15 或 SEQ ID NO: 17 的氨基酸序列的反式激活結構域；和本發(fā)明的包含置換突變的H組核受體配體結合結構域。優(yōu)選地，包含置換突變的H組核受體配體結合結構域是包含本發(fā)明的置換突變的蛻皮激素受體配體結合結構域。本發(fā)明也提供了基因表達盒，該基因表達盒包括i)應答元件，其含有被包含DNA結合結構域的多肽識別的區(qū)域；ii)啟動子，其被包含反式激活結構域的多肽激活；和iii)基因，其表達待被調(diào)節(jié)。應答元件(“RE”)可以是已知的DNA結合結構域的任何應答元件或其類似物、組合或修改。在本發(fā)明中可以利用單個RE，或可以使用多個RE，其或者是相同RE的多個拷貝，或者是兩個或更多個不同的RE。在特定的實施方案中，RE是來自GAL4的RE( “GAL4RE”)、LexA, H組核受體RE、類固醇/甲狀腺激素核受體RE或識別合成的DNA結合結構域的合成RE。優(yōu)選地，RE是包含SEQ IDNO: 18的多核苷酸序列的蛻皮激素應答元件(EcRE)、包含SEQID NO: 19的多核苷酸序列的GAL4RE或包含SEQ ID NO:20的多核苷酸序列的LexA RE(操縱子，“op”) ( “2XlexAopRE”)。本發(fā)明的類固醇/甲狀腺激素核受體DNA結合結構域、激活結構域或應答元件可以獲自類固醇/甲狀腺激素核受體，其選自甲狀腺激素受體a (TRci )、甲狀腺受體l(c-erbA-l)、甲狀腺激素受體β (TR3)、視黃酸受體a (RARa )、視黃酸受體β (RAR β，HAP)、視黃酸受體Y (RAR Y)、視黃酸受體Y-樣(RARD)、過氧化物酶體增殖物激活受體ct (PPARa )、過氧化物酶體增殖物激活受體β (PPAR0 )、過氧化物酶體增殖物激活受體S (PPARS，NUC-1)、過氧化物酶體增殖物激活相關受體(FFAR)、過氧化物酶體增殖物激活受體Y (PPARY)、由甲狀腺激素受體α的非編碼鏈編碼的孤獨受體(REVERBa )、v-erb A相關受體(EAR-1)、v-erb相關受體(EAR-IA)，Y)、由甲狀腺激素受體β的非編碼鏈編碼的孤獨受體(REVERB β )、v-erb相關受體(EAR-1 β )、孤獨核受體BD73 (BD73)、rev-erbA相關受體(RVR)、鋅指蛋白126 (HZF2)、蛻皮激素誘導蛋白E75 (E75)、蛻皮激素誘導蛋白E78(E78)、果蠅受體78(DR_78)、類視黃醇相關孤獨受體a (RORa)、類視黃醇Z受體a (RZRa )、類視黃醇相關孤獨受體β (R0Rβ )、類視黃醇Z受體β (RZRβ )、類視黃醇相關孤獨受體Y (R0R Y )、類視黃醇Z受體Y (RZR Y )、類視黃醇相關孤獨受體(TOR)、激素受體3(HR-3)、果蠅激素受體3(DHR-3)、天娥(Manduca)激素受體(MHR-3)、螟(Galleria)激素受體 3(GHR-3)、線蟲(C. elegans)核受體 3 (CNR-3)、卷蛾(Choristoneura)激素受體3(CHR-3)、線蟲核受體14(CNR-14)、蛻皮激素受體(ECR)、遍在受體(UR)、孤獨核受體(0R-1)、NER-1、受體相互作用蛋白15(RIP-15)、肝臟X受體β (LXRi3)、類固醇激素受體樣蛋白(RLD-I)、肝臟X受體(LXR)、肝臟X受體a (LXR α )、類法呢醇X受體(FXR)、受體相互作用蛋白14(RIP-14)、HRR-I、維生素D受體(VDR)、孤獨核受體(0NR-1)、孕烷X受體(PXR)、類固醇和異生素受體(SXR)、甲苯酸鹽X受體(BXR)、核受體(MB-67)、組成型雄烷受體I (CAR-I)、組成型雄烷受體a (CARa )、組成型雄烷受體2 (CAR-2)、組成型雄烷受體β (CAR^)、果蠅激素受體96(DHR-96)、核激素受體I (NHR-I)、肝細胞核因子4 (HNF-4)、肝細胞核因子4G(HNF-4G)、肝細胞核因子4B (HNF-4B)、肝細胞核因子4D (HNF-4D, DHNF-4)、類視黃醇X受體a (RXRa)、類視黃醇X受體β (RXR^)、Η-2區(qū)域II結合蛋白(H-2RIIBP)、核受體輔調(diào)蛋白-I (RCoR-I)、類視黃醇X受體Y (RXR Y)、超氣門(USP)、2C1核受體、絨毛膜因子I (CF-I)、睪丸受體2(TR-2)、睪丸受體2-11 (TR2-11)、睪丸受體4(TR4)、TAK-I、果蠅激素受體(DHR78)、Tailless (TLL)、tailless同源物(TLX)、XTLL、雞卵蛋白上游啟動子轉錄因子I (COUP-TFI)、雞卵蛋白上游啟動子轉錄因子A(COUP-TFA)、EAR-3、SVP-44、雞卵蛋白上游啟動子轉錄因子II (C0UP-TFII)、雞卵蛋白上游啟動子轉錄因子B(COUP-TFB)、ARP-1, SVP-40、SVP、雞卵蛋白上游啟動子轉錄因子III (C0UP-TFIII)、雞卵蛋白上游啟動子轉錄因子G(COUP-TFG)、SVP-46、EAR-2、雌激素受體a (ERa )、雌激素受體β (ER0 )、雌激素相關受體I (ERRl)、雌激素相關受體a (ERRa )、雌激素相關受體2(ERR2)、雌激素相關受體β (ERR β)、糖皮質激素受體(GR)、鹽皮質激素受體(MR)、孕酮受體(PR)、雄激素受體(AR)、神經(jīng)生長因子誘導基因B(NGFI-B)、與Nur-77類似的核受體(TRS)、N10、孤獨受體(NUR-77)、人類早期應答基因(NAK-I)、Nurr相關因子I (NURR-I)、人類即時早期應答基因(NOT)、再生肝核受體I (RNR-I)、造血鋅指3 (HZF-3) ,Nur相關蛋白-I (TINOR)、核孤獨受體I (NOR-1)、NORl相關受體(MINOR)、果蠅激素受體38 (DHR-38)、線蟲核受體8 (CNR-8)、C48D5、類固醇生成因子I (SFl)、endozepine樣肽(ELP)、果蠅ftz因子I (FTZ-Fl)、腎上腺4結合蛋白(AD4BP)、肝受體同源物(LRH-I)、Ftz-Fl-相關孤獨受體A (xFFrA)、Ftz-Fl-相關孤獨受體B(xFFrB)、與LRH-I相關的核受體(FFLR)、與LRH-I相關的核受體(PHR)、甲胎蛋白轉錄因子(FTF)、生殖細胞核因子(GCNFM)、類視黃醇受體相關睪丸關聯(lián)受體(RTR)、knirps (KNI)、knirps相關(KNRL)、胚胎生殖腺(EGON)、配體依賴型核受體的果蠅基因(EAGLE)、與trithorax (三胸腔)類似的核受體(0DR7)、Trithorax、劑量敏感型性別逆轉腎上腺發(fā)育不全先天性關鍵區(qū)域染色體X基因(DAX-I)、腎上腺發(fā)育不全先天性和促性腺激素分泌不足性性腺機能減退(AHCH)和短雜二聚體伴侶(SHP)。對于本發(fā)明的目的，核受體和H組核受體也包括合成的和嵌合的核受體和H組核受體以及它們的類似物。用于申請人的基因表達盒的感興趣的基因可以是內(nèi)源性基因或異源性基因。期望的基因或蛋白的核酸或氨基酸序列信息可以從眾多公共數(shù)據(jù)庫中的一個數(shù)據(jù)庫中查找，例如GENBANK、EMBL、Swiss-Prot和PIR，或從眾多生物學相關期刊出版物查找。因此，本領域技術人員能夠獲得實質上所有已知基因的核酸序列信息。然后此信息可以用于構建期望的構建物，從而將感興趣的基因插入到在此描述的申請人方法所使用的基因表達盒中。用于申請人的基因表達盒的感興趣的基因的例子但是包括但不限于編碼治療上有益的多肽或產(chǎn)物的基因，所述多肽或產(chǎn)物可以用于治療病癥、疾病、紊亂、功能障礙、遺傳缺陷，例如單克隆抗體、酶、蛋白酶、細胞因子、干擾素、胰島素、促紅細胞生成素、凝血因子、其他血液因子或成分，用于基因治療的病毒載體、用于疫苗的病毒、藥物開發(fā)的靶標、功能基因組學和蛋白質組學分析和應用，等等。本發(fā)明的多核苷酸本發(fā)明的新型的基于核受體的誘導型基因表達系統(tǒng)包含至少一個基因表達盒，該基因表達盒包含編碼含有置換突變的H組核受體配體結合結構域的多核苷酸。這些基因表達盒、它們包含的多核苷酸和它們編碼的多肽，可用作基于核受體的基因表達系統(tǒng)的成分，以在宿主細胞內(nèi)調(diào)節(jié)基因的表達。因此，本發(fā)明提供了編碼含有置換突變的H組核受體配體結合結構域的分離的多核苷酸。在特定的實施方案中，H組核受體配體結合結構域由包含密碼子突變的多核苷酸編碼，所述密碼子突變導致在下述位置的氨基酸殘基的置換，所述位置等同于或類似于a)SEQ ID NO: I 的氨基酸殘基 48、51、52、54、92、95、96、109、110、119、120、125、128、132、219、223、234或238 ；b)SEQ ID NO: I的氨基酸殘基96和119 ;c) SEQ ID NO: I的氨基酸殘基110和128 ;d) SEQ ID NO: I的氨基酸殘基52和110 ;e) SEQ ID NO: I的氨基酸殘基107、110和127;或f)SEQ ID NO: I的氨基酸殘基52、107和127。在另一實施方案中，H組核受體配體結合結構域由包含密碼子突變的多核苷酸編碼，所述密碼子突變導致在等同于或類似于SEQIDNO: I的氨基酸殘基107和127的位置的置換和氨基酸259的插入。在優(yōu)選的實施方案中，H組核受體配體結合結構域來自蛻皮激素受體。在另一特定的實施方案中，H組核受體配體結合結構域由包含密碼子突變的多核苷酸編碼，所述密碼子突變導致下列置換a)等同于或類似于SEQ ID NO: I的氨基酸殘基48的位置置換以天冬酰胺、精氨酸、酪氨酸、色氨酸、亮氨酸或賴氨酸殘基；b)等同于或類似于SEQ ID NO: I的氨基酸殘基51的位置置換以蛋氨酸、天冬酰胺或亮氨酸殘基；c)等同于或類似于SEQ ID NO: I的氨基酸殘基52的位置置換以亮氨酸、脯氨酸、蛋氨酸、精氨酸、色氨酸、甘氨酸、谷氨酰胺或谷氨酸殘基；d)等同于或類似于SEQ ID NO: I的氨基酸54的位置置換以色氨酸或蘇氨酸；e)等同于或類似于SEQ ID NO: I的氨基酸92的位置置換以亮氨酸或谷氨酸；f)等同于或類似于SEQ ID NO: I的氨基酸殘基95的位置置換以組氨酸、蛋氨酸或色氨酸殘基；g)等同于或類似于SEQ ID NO: I的氨基酸殘基96的位置置換以亮氨酸、絲氨酸、谷氨酸或色氨酸殘基；h)等同于或類似于SEQ ID NO: I的氨基酸109的位置置換以色氨酸、脯氨酸、亮氨酸、蛋氨酸或天冬酰胺；i)等同于或類似于SEQ ID ΝΟ:1的氨基酸殘基110的位置置換以谷氨酸、色氨酸或天冬酰胺殘基；j)等同于或類似于SEQ ID NO: I的氨基酸119的位置置換以苯丙氨酸；k)等同于或類似于SEQ IDNO: I的氨基酸120的位置置換以色氨酸或蛋氨酸；1)等同于或類似于SEQ ID NO: I的氨基酸125的位置置換以谷氨酸、脯氨酸、亮氨酸、半胱氨酸、色氨酸、甘氨酸、異亮氨酸、天冬酰胺、絲氨酸、纈氨酸或精氨酸；m)等同于或類似于SEQ ID NO: I的氨基酸128的位置置換以苯丙氨酸；n)等同于或類似于SEQ ID NO: I的氨基酸132的位置置換以蛋氨酸、天冬酰胺、谷氨酸或纈氨酸；o)等同于或類似于SEQ ID NO: I的氨基酸殘基219的位置置換以丙氨酸、賴氨酸、色氨酸或酪氨酸殘基；P)等同于或類似于SEQ ID NO: I的氨基酸殘基223的位置置換以賴氨酸、精氨酸或酪氨酸殘基；q)等同于或類似于SEQID NO: I的氨基酸234的位置置換以蛋氨酸、精氨酸、色氨酸或異亮氨酸；r)等同于或類似于SEQ ID NO: I的氨基酸238的位置置換以脯氨酸、谷氨酸、亮氨酸、蛋氨酸或酪氨酸；s)等同于或類似于SEQ ID NO: I的氨基酸119的位置置換以苯丙氨酸殘基和等同于或類似于SEQ ID NO: I的氨基酸96的位置上置換以蘇氨酸；t)等同于或類似于SEQ ID NO: I的氨基酸110的位置置換以脯氨酸和等同于或類似于SEQ IDNO: I的氨基酸128的位置置換以苯丙氨酸；u)等同于或類似于SEQID NO: I的氨基酸52的位置上置換以纈氨酸殘基和等同于或類似于SEQ ID NO: I的氨基酸110的位置置換以脯氨酸殘基；v)等同于或類似于SEQ ID NO: I的氨基酸107的位置置換以異亮氨酸、等同于或類似于SEQ ID NO: I的氨基酸127的位置置換以谷氨酸和等同于或類似于SEQ ID NO: I的氨基酸110的位置置換以脯氨酸；或w)等同于或類似于SEQ ID NO: I的氨基酸107的位置置換以異亮氨酸、等同于或類似于SEQ ID NO: I的氨基酸127的位置置換以谷氨酸和等同于或類似于SEQ ID NO: I的氨基酸52的位置置換以纈氨酸。在另一實施方案中，H組核受體配體結合結構域由包含密碼子突變的多核苷酸編碼，所述密碼子突變導致在等同于或類似于SEQ ID NO: I的氨基酸107的位置置換以異亮氨酸殘基、等同于或類似于SEQ ID NO: I的氨基酸127的位置置換以谷氨酸殘基，和在等同于或類似于SEQ ID NO: I的氨基酸259的位置插入甘氨酸殘基。在優(yōu)選的實施方案中，H組核受體配體結合結構域來自蛻皮激素受體。在另一特定的實施方案中，包含置換突變的H組核受體配體結合結構域是包含置換突變的蛻皮激素受體配體結合結構域，其由包含密碼子突變的多核苷酸編碼，所述密碼子突變產(chǎn)生選自如下的置換突變SEQ ID NO: I的F48Y、F48W、F48L、F48N、F48R、F48K、I51M、I51N、I51L、T52M、T52V、T52L、T52E、T52P、T52R、T52W、T52G、T52Q、M54W、M54T、M92L、M92E、R95H、R95M、R95W、V96L、V96W、V96S、V96E、F109W、F109P、F109L、F109M、F109N、Al10E、AllON、AllOW、N119F、Y120W、Y120M、M125P、M125R、M125E、M125L、M125C、M125W、M125G、M125I、M125N、M125S、M125V、V128F、L132M、L132N、L132V、L132E、M219K、M219W、M219Y、M219A、L223K、L223R、L223Y、L234M、L234I、L234R、L234W、W238P、W238E、W238Y、W238M、W238L、N119F/V96T、V128F/A110P、T52V/A110P、V107I/Y127E/T52V 和 V107I/YI27E/A110P置換突變。在另一實施方案中，包含置換突變的H組核受體配體結合結構域是包含置換突變的蛻皮激素受體配體結合結構域，其由包含密碼子突變的多核苷酸編碼，所述密碼子突變導致產(chǎn)生置換突變SEQ ID N0:1的V107I/Y127E，其進一步包括插入突變SEQ ID NO: I的 G259 (V107I/Y127E/G259)。
在另一特定的實施方案中，包含置換突變的H組核受體配體結合結構域是包含置換突變的蛻皮激素受體配體結合結構域，其由在雜交條件下與含有密碼子突變的多核苷酸雜交的多核苷酸編碼，所述密碼子突變產(chǎn)生置換突變，所述置換突變選自SEQ ID NO: I的F48Y、F48W、F48L、F48N、F48R、F48K、I51M、I51N、I51L、T52M、T52V、T52L、T52E、T52P、T52R、T52W、T52G、T52Q、M54W、M54T、M92L、M92E、R95H、R95M、R95W、V96L、V96W、V96S、V96E、F109W、F109P、F109L、F109M、F109N、A110E、AllON、A110W、N119F、Y120W、Y120M、M125P、M125R、M125E、M125L、M125C、M125W、M125G、M125I、M125N、M125S、M125V、V128F、L132M、L132N、L132V、L132E、M219K、M219W、M219Y、M219A、L223K、L223R、L223Y、L234M、L234I、L234R、L234W、W238P、W238E、W238Y、W238M、W238L、NI 19F/V96T、V128F/A1IOP,T52V/A110P、V107I/Y127E/T52V和V107I/Y127E/A110P，所述雜交條件包括在小于500mM鹽和至少37°C的雜交步驟，和在2 X SSPE、至少63 °C的洗滌步驟。在優(yōu)選的實施方案中，雜交條件包括小于200mM鹽和至少37°C的雜交步驟。在另一優(yōu)選實施方案中，雜交條件包括2 X SSPE和63V的雜交和洗滌步驟。本發(fā)明也提供了編碼多肽的分離的多核苷酸，所述多肽選自a)包含反式激活結構域、DNA結合結構域和本發(fā)明的包含置換突變的H組核受體配體結合結構域的多肽；b)包含DNA結合結構域和本發(fā)明的包含置換突變的H組核受體配體結合結構域的多肽；和c)包含反式激活結構域和本發(fā)明的包含置換突變的H組核受體配體結合結構域的多肽。在特定的實施方案中，分離的多核苷酸編碼雜合多肽，所述雜合多肽選自a)包含反式激活結構域、DNA結合結構域和本發(fā)明的包含置換突變的H組核受體配體結合結構域的雜合多肽山)包含DNA結合結構域和本發(fā)明的包含置換突變的H組核受體配體結合結構域的雜合多肽；和(3)包含反式激活結構域和本發(fā)明的包含置換突變的H組核受體配體結合結構域的雜合多肽。本發(fā)明也涉及編碼含有置換突變的H組核受體配體結合結構域的分離的多核苷酸，其中，所述置換突變影響H組核受體配體結合結構域的配體結合活性或配體敏感性。在另一特定的實施方案中，本發(fā)明涉及編碼含有置換突變的H組核受體配體結合結構域的分離的多核苷酸，其中，所述置換突變降低H組核受體配體結合結構域的非蛻皮類固醇二酰肼結合活性或非蛻皮類固醇二酰肼敏感性。優(yōu)選地，分離的多核苷酸包含導致產(chǎn)生氨基酸殘基置換的密碼子突變，所述氨基酸殘基的置換發(fā)生的位置等同于或類似于SEQ ID N0:1 的氨基酸殘基 48、51、52、54、92、95、96、109、120、125、219、223、234 或 238。更優(yōu)選地，分離的多核苷酸包含密碼子突變，所述密碼子突變導致下述置換a)等同于或類似于SEQ ID NO: I的氨基酸殘基48或109的位置置換以天冬酰胺殘基；b)等同于或類似于SEQ IDNO: I的氨基酸殘基51、92、96或238的位置置換以亮氨酸殘基；c)等同于或類似于SEQ ID N0:1的氨基酸殘基52、92、96、125或238的位置置換以谷氨酸殘基；d)等同于或類似于SEQ ID勵1的氨基酸殘基54、95、96、120、219或234的位置置換以色氨酸殘基；
e)等同于或類似于SEQ ID N0:1的氨基酸殘基51、52、120、234或238的位置置換以蛋氨酸殘基；f)等同于或類似于SEQ IDN0:1的氨基酸殘基219的位置置換以丙氨酸殘基；g)等同于或類似于SEQ ID NO: I的氨基酸殘基48、219或223的位置置換以賴氨酸殘基；h)等同于或類似于SEQ ID NO: I的氨基酸殘基234的位置置換以異亮氨酸、精氨酸或色氨酸殘基；i)等同于或類似于SEQ ID NO: I的氨基酸殘基219或238的位置置換以酪氨酸殘基；j)等同于或類似于SEQ ID NO: I的氨基酸殘基125的位置置換以纈氨酸殘基；k)等同于或類似于SEQ ID NO: I的氨基酸殘基52的位置置換以甘氨酸或谷氨酰胺殘基；或I)等同于或類似于SEQ ID NO: I的氨基酸殘基52或223的位置置換以精氨酸殘基。甚至更優(yōu)選地，分離的多核苷酸包括密碼子突變，所述密碼子突變導致產(chǎn)生置換突變SEQ ID NO: I的F48N、F48K、I51L、I51M、T52E、T52M、T52R、T52G、T52Q、M54W、M92L、M92E、R95W、V96W、V96E、V96L、F109N、Y120M、Y120W、M125E、M125V、M219A、M219K、M219W、M219Y、L223K、L223R、L234M、L234I、L234R、L234W、W238E、W238Y、W238L 或 W238M。此外，本發(fā)明也涉及編碼含有置換突變的H組核受體配體結合結構域的分離的多核苷酸，其中，所述置換突變增強H組核受體配體結合結構域的配體結合活性或對配體的敏感性。在特定的實施方案中，本發(fā)明涉及編碼含有置換突變的H組核受體配體結合結構域的分離的多核苷酸，其中，所述置換突變通常增強H組核受體配體結合結構域的蛻皮類固醇結合活性或蛻皮類固醇敏感性。優(yōu)選地，分離的多核苷酸包含密碼子突變，所述密碼子突變導致等同于或類似于a) SEQ ID NO: I的氨基酸殘基96或b) SEQ ID NO: I的氨基酸殘基96和119的位置上的氨基酸殘基發(fā)生置換。更優(yōu)選地，分離的多核苷酸包含密碼子突變，所述密碼子突變導致下列置換a)等同于或類似于SEQ ID NO: I的氨基酸殘基96的位置置換以絲氨酸殘基；或《等同于或類似于SEQ ID NO: I的氨基酸殘基96的位置置換以蘇氨酸殘基和等同于或類似于SEQ ID NO: I的氨基酸殘基119的位置置換以苯丙氨酸殘基。甚至更優(yōu)選地，分離的多核苷酸編碼包含密碼子突變，所述密碼子突變導致置換突變SEQIDNO: I 的 V96T 或 N119F/V96T。在另一特定的實施方案中，本發(fā)明涉及編碼包含置換突變的H組核受體配體結合結構域的分離的多核苷酸，其中所述置換突變總體上增強H組核受體配體結合結構域的非蛻皮類固醇二酰肼結合活性或非蛻皮類固醇二酰肼敏感性。優(yōu)選地，分離的多核苷酸包含密碼子突變，所述密碼子突變導致在等同于或類似于a) SEQID NO: I的氨基酸殘基48、52、54、109、110、125、132或223 ;或b)SEQ ID NO: I的氨基酸殘基52和110的位置上的氨基酸殘基發(fā)生置換。更優(yōu)選地，分離的多核苷酸包含密碼子突變，所述密碼子突變導致下述置換a)等同于或類似于SEQ IDNO: I的氨基酸殘基48的位置置換以酪氨酸、色氨酸、精氨酸或亮氨酸殘基山)等同于或類似于SEQ ID NO: I的氨基酸殘基52的位置置換以亮氨酸殘基；c)等同于或類似于SEQ ID NO: I的氨基酸殘基54的位置置換以蘇氨酸殘基；d)等同于或類似于SEQ ID NO: I的氨基酸殘基109的位置置換以蛋氨酸殘基；e)等同于或類似于SEQ ID NO: I的氨基酸殘基110的位置置換以脯氨酸、谷氨酸或天冬酰胺殘基；f)等同于或類似于SEQ ID NO: I的氨基酸殘基125的位置置換以異亮氨酸、天冬酰胺或甘氨酸殘基；g)等同于或類似于SEQ ID NO: I的氨基酸殘基132的位置置換以谷氨酸殘基；h)等同于或類似于SEQ ID NO: I的氨基酸殘基223的位置置換以酪氨酸殘基；或i)等同于或類似于SEQID NO: I的氨基酸52的位置置換以纈氨酸殘基以及等同于或類似于SEQ ID NO: I的氨基酸110的位置置換以脯氨酸殘基。甚至更優(yōu)選地，分離的多核苷酸包含密碼子突變，該密碼子突變對 SEQ IDNO: I 產(chǎn)生下述置換突變F48Y、F48W、F48L、F48R、T52L、M54T、F109M、A110P、A110E、A110N、M125I、M125G、M125N、L132E、L223Y 或 T52V/A110P。在另一特定的實施方案中，本發(fā)明涉及編碼包含置換突變的H組核受體配體結合結構域的分離的多核苷酸，其中所述置換突變總體上增強H組核受體配體結合結構域的非蛻皮類固醇二酰肼和非蛻皮類固醇四氫喹啉結合活性，或非蛻皮類固醇二酰肼和非蛻皮類固醇四氫喹啉的敏感性。優(yōu)選地，分離的多核苷酸包括密碼子突變，所述密碼子突變導致在等同于或類似于a) SEQ ID NO: I的氨基酸殘基107和127 ;或b) SEQ ID NO: I的氨基酸殘基107、110和127的位置上的氨基酸殘基發(fā)生置換。更優(yōu)選地，分離的多核苷酸包含密碼子突變，所述密碼子突變導致下述置換a)等同于或類似于SEQ ID N0:1的氨基酸殘基107 的位置置換以異亮氨酸殘基和等同于或類似于SEQ ID NO: I的氨基酸殘基127的位置置換以谷氨酸殘基；或《等同于或類似于SEQ ID NO: I的氨基酸殘基107的位置置換以異亮氨酸殘基、等同于或類似于SEQ ID NO: I的氨基酸殘基110的位置置換以脯氨酸殘基和等同于或類似于SEQ ID NO: I的氨基酸殘基127的位置置換以谷氨酸殘基。甚至更優(yōu)選地，分離的多核苷酸包含密碼子突變，該密碼子突變對SEQ ID勵:1產(chǎn)生下述置換突變￥1071/Y127E 或 V107I/Y127E/A110P。在另一特定的實施方案中，本發(fā)明涉及編碼包含置換突變的H組核受體配體結合結構域的分離的多核苷酸，其中所述置換突變總體上增強H組核受體配體結合結構域的蛻皮類固醇結合活性或蛻皮類固醇敏感性和非蛻皮類固醇二酰肼結合活性或非蛻皮類固醇二酰肼敏感性。優(yōu)選地，分離的多核苷酸包括密碼子突變，所述密碼子突變導致在等同于或類似于a)SEQ ID N0:l的氨基酸殘基109、132或W238P;b)SEQ ID NO: I的氨基酸殘基52、107和127 ;或c)SEQ ID NO: I的氨基酸殘基107和127的位置上的氨基酸殘基發(fā)生置換，以及SEQ ID NO: I的氨基酸259位置發(fā)生插入突變。更優(yōu)選地，分離的多核苷酸包含密碼子突變，所述密碼子突變導致a)等同于或類似于SEQ ID NO: I的氨基酸殘基109的位置置換以色氨酸殘基山)等同于或類似于SEQ ID NO: I的氨基酸殘基132的位置置換以纈氨酸或蛋氨酸殘基；c)等同于或類似于SEQ ID NO: I的氨基酸殘基238的位置置換以脯氨酸殘基；
d)等同于或類似于SEQ ID NO: I的氨基酸殘基107的位置置換以異亮氨酸殘基、等同于或類似于SEQ ID NO: I的氨基酸殘基127的位置置換以谷氨酸殘基和等同于或類似于SEQ IDNO: I的氨基酸殘基132的位置置換以纈氨酸殘基；或e)等同于或類似于SEQ ID N0:1的氨基酸殘基107的位置置換以異亮氨酸殘基、等同于或類似于SEQ ID NO: I的氨基酸殘基127的位置置換以谷氨酸殘基和等同于或類似于SEQ ID NO: I的氨基酸殘基259的位置插入甘氨酸殘基。甚至更優(yōu)選地，分離的多核苷酸包含密碼子突變，該密碼子突變對SEQ ID NO: I產(chǎn)生下述置換突變F109W、L132M、L132V、W238P、V107I/Y127E/T52V 或 V107I/Y127E/259G。在另一個實施方案中，分離的多核苷酸包含密碼子突變，該密碼子突變對SEQ ID NO: I產(chǎn)生置換突變V107I/Y127E，還包括在SEQ ID NO: I中產(chǎn)生插入突變G259 (V107I/Y127E/G259)。
在另一特定的實施方案中，本發(fā)明涉及編碼包含置換突變的H組核受體配體結合結構域的分離的多核苷酸，其中所述置換突變總體上增強H組核受體配體結合結構域的非蛻皮類固醇四氫喹啉結合活性或非蛻皮類固醇四氫喹啉敏感性。優(yōu)選地，分離的多核苷酸包括密碼子突變，所述密碼子突變導致a)等同于或類似于SEQ ID NO: I的氨基酸殘基110或128的位置上的氨基酸殘基；或b)等同于或類似于SEQ ID NO: I的氨基酸殘基110和128的位置上的氨基酸殘基發(fā)生置換。更優(yōu)選地，分離的多核苷酸包含密碼子突變，所述密碼子突變導致a)等同于或類似于SEQ ID NO: I的氨基酸殘基110的位置置換以色氨酸殘基山)等同于或類似于SEQ ID NO: I的氨基酸殘基128的位置置換以苯丙氨酸殘基；或c)等同于或類似于SEQ ID NO: I的氨基酸殘基110的位置置換以脯氨酸殘基和等同于或類似于SEQ ID NO: I的氨基酸殘基128的位置置換以苯丙氨酸殘基。甚至更優(yōu)選地，分離的多核苷酸包含密碼子突變，該密碼子突變對SEQ ID勵:1產(chǎn)生下述置換突變4110胃、￥128卩或V128F/A110P。
·
在另一特定的實施方案中，本發(fā)明涉及編碼包含置換突變的H組核受體配體結合結構域的分離的多核苷酸，其中所述置換突變對非蛻皮類固醇二酰肼配體產(chǎn)生差異性的應答。優(yōu)選地，分離的多核苷酸包含密碼子突變，所述密碼子突變導致在等同于或類似于SEQID NO: I的氨基酸殘基52、95、109、125或132的位置上的氨基酸殘基產(chǎn)生置換突變。更優(yōu)選地，分離的多核苷酸包含密碼子突變，所述密碼子突變導致a)等同于或類似于SEQ ID NO: I的氨基酸殘基52的位置置換以脯氨酸殘基；b)等同于或類似于SEQ ID N0:1的氨基酸殘基95的位置置換以組氨酸或蛋氨酸殘基；c)等同于或類似于SEQ ID NO: I的氨基酸殘基109的位置置換以亮氨酸殘基；d)等同于或類似于SEQ ID NO: I的氨基酸殘基125的位置置換以亮氨酸、色氨酸、精氨酸、半胱氨酸或脯氨酸殘基；或6)等同于或類似于SEQID NO: I的氨基酸殘基132的位置置換以蛋氨酸殘基。甚至更優(yōu)選地，分離的多核苷酸包含密碼子突變，該密碼子突變對SEQ ID NO: I產(chǎn)生下述置換突變T52P、T52W、R95H、R95M、F109L、M125L、M125W、M125R、M125C、Μ125Ρ 或 L132M。在另一特定的實施方案中，本發(fā)明涉及編碼包含置換突變的H組核受體配體結合結構域的分離的多核苷酸，其中所述置換突變對非蛻皮類固醇二酰肼配體產(chǎn)生差異性的應答。更優(yōu)選地，分離的多核苷酸包含密碼子突變，所述密碼子突變導致a)等同于或類似于SEQ ID NO: I的氨基酸殘基48的位置置換以賴氨酸或精氨酸殘基；b)等同于或類似于SEQID NO: I的氨基酸殘基52的位置置換以甘氨酸、谷氨酰胺、蛋氨酸、精氨酸或色氨酸殘基；
c)等同于或類似于SEQ ID NO: I的氨基酸殘基125的位置置換以異亮氨酸、甘氨酸、天冬酰胺、絲氨酸或纈氨酸殘基；d)等同于或類似于SEQ ID NO: I的氨基酸殘基132的位置置換以谷氨酸殘基；e)等同于或類似于SEQ ID NO: I的氨基酸殘基219的位置置換以賴氨酸、色氨酸或酪氨酸殘基；f)等同于或類似于SEQ ID NO: I的氨基酸殘基223的位置置換以精氨酸或酪氨酸殘基；或8)等同于或類似于SEQ ID NO: I的氨基酸殘基238的位置置換以亮氨酸或蛋氨酸殘基。甚至更優(yōu)選地，分離的多核苷酸包含密碼子突變，該密碼子突變對SEQ IDNO: I 產(chǎn)生下述置換突變F48K、F48R、T52G、T52Q、T52M、T52R、T52W、M125I、M125G、M125N、M125S、M125V、L132E、M219K、M219W、M219Y、L223R、L223Y、W238L 或 W238M。此外，本發(fā)明涉及包含可操作性地與轉錄調(diào)控元件連接的本發(fā)明多核苷酸的表達載體。優(yōu)選地，編碼包含置換突變的核受體配體結合結構域的多核苷酸與表達控制序列可操作性連接，從而允許在勝任表達的宿主細胞中表達該核受體配體結合結構域。該表達控制序列可以包含在期望進行表達的宿主細胞中具有功能的啟動子。載體可以是質粒DNA分子或病毒載體。優(yōu)選的病毒載體包括逆轉錄病毒、腺病毒、腺相關病毒、皰疫病毒和牛痘病毒。本發(fā)明進一步涉及復制缺陷型重組病毒，在它的基因組中包含編碼含有上述置換突變的核受體配體結合結構域的多核苷酸。因此，本發(fā)明也涉及包含這樣的表達載體的分離的宿主細胞，其中轉錄調(diào)控元件在該宿主細胞中是可操作性的。本發(fā)明也涉及由本發(fā)明的多核苷酸編碼的分離的多肽。本發(fā)明的多肽本發(fā)明新型的基于核受體的誘導型基因表達系統(tǒng)包含含有多核苷酸的至少一個基因表達盒，所述多核苷酸編碼包含含有置換突變的H組核受體配體結合結構域的多肽。因此，本發(fā)明也提供分離的多肽，其含有本發(fā)明的包含置換突變的H組核受體配體結合結構域。
在另一特定的實施方案中，H組核受體配體結合結構域在等同于或類似于a) SEQID NO: I 的氨基酸殘基 48、51、52、54、92、95、96、109、110、119、120、125、128、132、219、223、234或238 ;b) SEQ ID NO: I的氨基酸殘基96和119 ;c) SEQ ID NO: I的氨基酸殘基110和128 ；d)SEQ ID NO: I 的氨基酸殘基52 和 110 ;e) SEQ ID NO: I 的氨基酸殘基 107、110和 127 ;或f)SEQ ID NO: I的氨基酸殘基52、107和127的位置包含置換突變。在另一實施方案中，H組核受體配體結合結構域包含在等同于或類似于SEQ ID NO: I的氨基酸殘基107和127的位置的置換突變，和在SEQ ID NO: I的氨基酸259的插入。在優(yōu)選的實施方案中，H組核受體配體結合結構域來自蛻皮激素受體。優(yōu)選地，H組核受體配體結合結構域包含下述置換a)等同于或類似于SEQIDNO: I的氨基酸殘基48的位置置換以天冬酰胺、精氨酸、酪氨酸、色氨酸、亮氨酸或賴氨酸殘基山)等同于或類似于SEQ ID NO: I的氨基酸殘基51的位置置換以蛋氨酸、天冬酰胺或亮氨酸殘基；c)等同于或類似于SEQ ID NO: I的氨基酸殘基52的位置置換以亮氨酸、脯氨酸、蛋氨酸、精氨酸、色氨酸、甘氨酸、谷氨酰胺或谷氨酸殘基；d)等同于或類似于SEQ ID NO: I的氨基酸54的位置置換以色氨酸或蘇氨酸殘基；e)等同于或類似于SEQ ID N0:1的氨基酸92的位置置換以亮氨酸或谷氨酸；f)等同于或類似于SEQ ID NO: I的氨基酸殘基95的位置置換以組氨酸、蛋氨酸或色氨酸殘基；g)等同于或類似于SEQ ID NO: I的氨基酸殘基96的位置置換以亮氨酸、絲氨酸、谷氨酸或色氨酸殘基；h)等同于或類似于SEQID NO: I的氨基酸109的位置置換以色氨酸、脯氨酸、亮氨酸、蛋氨酸或天冬酰胺；i)等同于或類似于SEQID NO: I的氨基酸殘基110的位置置換以谷氨酸、色氨酸或天冬酰胺殘基；j)等同于或類似于SEQ ID NO: I的氨基酸119的位置置換以苯丙氨酸；k)等同于或類似于SEQ ID NO: I的氨基酸120的位置置換以色氨酸或蛋氨酸；1)等同于或類似于SEQ ID NO: I的氨基酸125的位置置換以谷氨酸、脯氨酸、亮氨酸、半胱氨酸、色氨酸、甘氨酸、異亮氨酸、天冬酰胺、絲氨酸、纈氨酸或精氨酸；m)等同于或類似于SEQ ID NO: I的氨基酸128的位置置換以苯丙氨酸；n)等同于或類似于SEQ ID NO: I的氨基酸132的位置置換以蛋氨酸、天冬酰胺、谷氨酸或纈氨酸；ο)等同于或類似于SEQ ID NO: I的氨基酸殘基219的位置置換以丙氨酸、賴氨酸、色氨酸或酪氨酸殘基；P)等同于或類似于SEQ ID NO: I的氨基酸殘基223的位置置換以賴氨酸、精氨酸或酪氨酸殘基；q)等同于或類似于SEQ ID NO: I的氨基酸234的位置置換以蛋氨酸、精氨酸、色氨酸或異亮氨酸；r)等同于或類似于SEQ ID NO: I的氨基酸238的位置置換以脯氨酸、谷氨酸、亮氨酸、蛋氨酸或酪氨酸；s)等同于或類似于SEQ ID NO: I的氨基酸119的位置置換以苯丙氨酸和等同于或類似于SEQ ID NO: I的氨基酸96的位置置換以蘇氨酸；t)等同于或類似于SEQ ID NO: I的氨基酸110的位置置換以脯氨酸和等同于或類似于SEQ ID NO: I的氨基酸128的位置置換以苯丙氨酸；u)等同于或類似于SEQID NO: I的氨基酸52的位置置換以纈氨酸殘基和等同于或類似于SEQ ID NO: I的氨基酸110的位置置換以脯氨酸殘基；v)等同于或類似于SEQ ID NO: I的氨基酸107的位置置換以異亮氨酸、等同于或類似于SEQ ID NO: I的氨基酸127的位置置換以谷氨酸殘基和等同于或類似于SEQ ID NO: I的氨基酸110的位置置換以脯氨酸；或w)等同于或類似于SEQ ID ΝΟ:1的氨基酸107的位置置換以異亮氨酸、等同于或類似于SEQ ID NO: I的氨基酸127的位置置換以谷氨酸和等同于或類似于SEQ ID NO: I的氨基酸52的位置置換以纈氨酸。在另一實施方案中，H組核受體配體結合結構域包括在等同于或類似于SEQ ID ΝΟ:1的氨基酸107的
位置置換以異亮氨酸殘基、等同于或類似于SEQ ID NO: I的氨基酸127的位置置換以谷氨酸殘基，和在等同于或類似于SEQ ID NO: I的氨基酸259的位置插入甘氨酸殘基。在優(yōu)選的實施方案中，H組核受體配體結合結構域來自蛻皮激素受體。在另一特定的實施方案中，包含置換突變的H組核受體配體結合結構域是包含置換突變的蛻皮激素受體配體結合結構域多肽，其中所述置換突變選自SEQ IDNOil的F48Y、F48W、F48L、F48N、F48R、F48K、I51M、I51N、I51L、T52M、T52V、T52L、T52E、T52P、T52R、T52W、T52G、T52Q、M54W、M54T、M92L、M92E、R95H、R95M、R95W、V96L、V96W、V96S、V96E、F109W、F109P、F109L、F109M、F109N、A110E、A110N、A110W、N119F、Y120W、Y120M、M125P、M125R、M125E、M125L、M125C、M125W、M125G、M125I、M125N、M125S、M125V、V128F、L132M、L132N、L132V、L132E、M219K、M219W、M219Y、M219A、L223K、L223R、L223Y、L234M、L234I、L234R、L234W、W238P、W238E、W238Y、W238M、W238L、NI 19F/V96T、V128F/A1IOP,T52V/A110P、V107I/Y127E/T52V和V107I/Y127E/A110P置換突變。在另一實施方案中，包含置換突變的H組核受體配體結合結構域是包含置換突變SEQ ID N0:1的V107I/Y127E的蛻皮激素受體配體結合結構域多肽，該多肽還包含插入突變SEQID NO: I的G259(V107I/Y127E/G259)。本發(fā)明也提供了分離的多肽，所述多肽選自a)包含反式激活結構域、DNA結合結構域和本發(fā)明的包含置換突變的H組核受體配體結合結構域的分離的多肽；b)包含DNA結合結構域和本發(fā)明的包含置換突變的H組核受體配體結合結構域的分離的多肽；和(3)包含反式激活結構域和本發(fā)明的包含置換突變的H組核受體配體結合結構域的分離的多肽。在優(yōu)選的實施方案中，H組核受體配體結合結構域來自蛻皮激素受體。本發(fā)明也提供了分離的雜合多肽，所述雜合多肽選自a)包含反式激活結構域、DNA結合結構域和本發(fā)明的含有置換突變的H組核受體配體結合結構域的分離的雜合多肽；b)包含DNA結合結構域和本發(fā)明的含有置換突變的H組核受體配體結合結構域的分離的雜合多肽；和(3)包含反式激活結構域和本發(fā)明的含有置換突變的H組核受體配體結合結構域的分離的雜合多肽。在優(yōu)選的實施方案中，H組核受體配體結合結構域來自蛻皮激素受體。本發(fā)明也提供了包含含有置換突變的H組核受體配體結合結構域的分離的多肽，所述置換突變影響H組核受體配體結合結構域的配體結合活性或配體敏感性。
特別地，本發(fā)明涉及包含含有置換突變的配體結合結構域的分離的H組核受體多肽，所述置換突變降低H組核受體配體結合結構域的配體結合活性或配體敏感性。在另一特定的實施方案中，本發(fā)明涉及包含含有置換突變的H組核受體配體結合結構域的分離的多肽，所述置換突變降低H組核受體配體結合結構域的非蛻皮類固醇二酰肼結合活性或非蛻皮類固醇二酰肼敏感性。優(yōu)選地，分離的多肽包含在等同于或類似于SEQID N0:1 的氨基酸殘基48、51、52、54、92、95、96、109、120、125、219、223、234或 238 的位置上的氨基酸殘基置換。更優(yōu)選地，分離的多肽包含密碼子突變，所述密碼子突變導致a)等同于或類似于SEQ IDNO: I的氨基酸殘基48或109的位置置換以天冬酰胺殘基；b)等同于或類似于SEQID NO: I的氨基酸殘基51、92、96或238的位置置換以亮氨酸殘基；c)等同于或類似于SEQ ID NO: I的氨基酸殘基52、92、96、125或238的位置置換以谷氨酸殘基；d)等同于或類似于SEQ ID NO: I的氨基酸殘基54、95、96、120或219的位置置換以色氨酸殘基；e)等同于或類似于SEQ ID N0:1的氨基酸殘基51、52、120、234或238的位置置換以蛋氨酸殘基；f)等同于或類似于SEQ IDN0:1的氨基酸殘基219的位置置換以丙氨酸殘基；g)等同于或類似于SEQ ID NO: I的氨基酸殘基48、219或223的位置置換以賴氨酸殘基；h)等同于或類似于SEQ ID NO: I的氨基酸殘基234的位置置換以異亮氨酸、精氨酸或色氨酸殘基；i)等同于或類似于SEQ ID NO: I的氨基酸殘基219或238的位置置換以酪氨酸殘基；j)等同于或類似于SEQ ID N0:1的氨基酸殘基52或223的位置置換以精氨酸殘基；k)等同于或類似于SEQ ID NO: I的氨基酸殘基125的位置置換以纈氨酸殘基；或I)等同于或類似于SEQ IDNO: I的氨基酸殘基52的位置置換以甘氨酸或谷氨酰胺殘基。甚至更優(yōu)選地，分離的多肽包括密碼子突變，所述密碼子突變導致SEQ ID NO: I產(chǎn)生置換突變F48N、I51L、I51M、T52E、T52M、T52R、T52G、T52Q、M54W、M92L、M92E、R95W、V96W、V96E、V96L、FM125V、M219A、M219K、M219W、M219Y、L223K、L223R、L234M、L234I、L234W、L234R、W238E、W238L、W238M 或 W238Y。此外，本發(fā)明還涉及包含含有置換突變的H組核受體配體結合結構域的分離的多肽，所述置換突變增強H組核受體配體結合結構域的配體結合活性或配體敏感性。在特定的實施方案中，本發(fā)明涉及包含含有置換突變的H組核受體配體結合結構域的分離的多肽，所述置換突變總體上增強H組核受體配體結合結構域的蛻皮類固醇結合活性或蛻皮類固醇敏感性。優(yōu)選地，分離的多肽包含在等同于或類似于a) SEQ ID NO: I的氨基酸殘基96或b) SEQ ID NO: I的氨基酸殘基96和119的位置上的氨基酸殘基置換。更優(yōu)選地，分離的多肽包含密碼子突變，所述密碼子突變導致a)在等同于或類似于SEQ IDNO: I的氨基酸殘基96的位置置換以絲氨酸殘基；或幻在等同于或類似于SEQ ID NO: I的氨基酸殘基96的位置置換以蘇氨酸殘基和在等同于或類似于SEQ ID NO: I的氨基酸殘基119的位置置換以苯丙氨酸殘基。甚至更優(yōu)選地，分離的多肽包括密碼子突變，所述密碼子突變導致SEQ ID NO: I中產(chǎn)生置換突變V96T或N119F/V96T。在另一特定的實施方案中，本發(fā)明涉及包含含有置換突變的H組核受體配體結合結構域的分離的多肽，所述置換突變總體上增強H組核受體配體結合結構域的二酰肼結合活性或二酰肼敏感性。優(yōu)選地，分離的多肽包含在等同于或類似于a) SEQ ID NO: I的氨基酸殘基48、52、54、109、110、125、132或 223 或b)SEQID NO: I 的氨基酸殘基 52 和 110 的位置上的氨基酸殘基置換。更優(yōu)選地，分離的多肽包含密碼子突變，所述密碼子突變導致a)等同于或類似于SEQ ID NO: I的氨基酸殘基48的位置置換以酪氨酸、色氨酸、精氨酸或亮氨酸殘基；b)等同于或類似于SEQ ID NO: I的氨基酸殘基52的位置置換以亮氨酸殘基；d)等同于或類似于SEQ ID NO: I的氨基酸殘基54的位置置換以蘇氨酸殘基；e)等同于或類似于SEQ ID NO: I的氨基酸殘基109的位置置換以蛋氨酸殘基；f)等同于或類似于SEQ IDNO: I的氨基酸殘基110的位置置換以脯氨酸、谷氨酸或天冬酰胺殘基；g)等同于或類似于SEQ ID NO: I的氨基酸殘基125的位置置換以異亮氨酸、甘氨酸或天冬酰胺殘基；h)等同于或類似于SEQ ID NO: I的氨基酸殘基52 的位置置換以纈氨酸殘基和等同于或類似于SEQID NO: I的氨基酸殘基110的位置置換以脯氨酸殘基；i)等同于或類似于SEQ ID NO: I的氨基酸殘基132的位置置換以谷氨酸殘基；或j)等同于或類似于SEQ ID NO: I的氨基酸殘基223的位置置換以酪氨酸殘基。甚至更優(yōu)選地，分離的多肽包括密碼子突變，所述密碼子突變導致 SEQ IDNO: I 產(chǎn)生置換突變F48Y、F48W、F48L、F48R、T52L、M54T、F109M、A110P、A110E、A110N、M125I、M125G、M125N、L132E、L223Y 或 T52V/A110P。在另一特定的實施方案中，本發(fā)明涉及包含含有置換突變的H組核受體配體結合結構域的分離的多肽，所述置換突變總體上增強H組核受體配體結合結構域的蛻皮類固醇結合活性或蛻皮類固醇敏感性和非蛻皮類固醇二酰肼結合活性或非蛻皮類固醇二酰肼敏感性。優(yōu)選地，分離的多肽包含在等同于或類似于a) SEQ IDN0:1的氨基酸殘基109、132或W238P的位置上的氨基酸殘基置換；b)SEQ IDN0:1的氨基酸殘基52、107和127的位置上的氨基酸殘基置換；或c) SEQ ID NO: I的氨基酸殘基107和127的位置上的氨基酸殘基置換，以及SEQ ID NO: I的氨基酸259的插入突變。更優(yōu)選地，分離的多肽包含密碼子突變，所述密碼子突變導致a)等同于或類似于SEQ ID NO: I的氨基酸殘基109的位置置換以色氨酸殘基山)等同于或類似于SEQ ID NO: I的氨基酸殘基132的位置置換以纈氨酸或蛋氨酸殘基；c)等同于或類似于SEQ ID NO: I的氨基酸殘基238的位置置換以脯氨酸殘基；d)等同于或類似于SEQ ID NO: I的氨基酸殘基107的位置置換以異亮氨酸殘基、等同于或類似于SEQ ID NO: I的氨基酸殘基127的位置置換以谷氨酸殘基和等同于或類似于SEQ ID NO: I的氨基酸殘基132的位置置換以纈氨酸殘基；或e)等同于或類似于SEQ ID N0:1的氨基酸殘基107的位置置換以異亮氨酸殘基、等同于或類似于SEQ ID NO: I的氨基酸殘基127的位置置換以谷氨酸殘基和等同于或類似于SEQ ID NO: I的氨基酸殘基259的位置插入甘氨酸殘基。甚至更優(yōu)選地，分離的多核苷酸包含密碼子突變，該密碼子突變對SEQ ID NO: I產(chǎn)生下述置換突變F109W、L132M、L132V、W238P或V107I/Y127E/T52V。在另一個實施方案中，分離的多肽包含密碼子突變，該密碼子突變對SEQ ID N0:1產(chǎn)生置換突變V107I/Y127E，還包括在 SEQ ID NO: I 中產(chǎn)生插入突變G259(V107I/Y127E/G259)。在另一特定的實施方案中，本發(fā)明涉及包含含有置換突變的H組核受體配體結合結構域的分離的多肽，其中所述置換突變總體上增強H組核受體配體結合結構域的二酰肼和四氫喹啉結合活性或二酰肼和四氫喹啉敏感性。優(yōu)選地，分離的多肽包含置換突變，所述置換突變導致在等同于或類似于a) SEQ ID NO: I的氨基酸殘基107和127 ;或b) SEQ IDNOil的氨基酸殘基107、110和127的位置上的氨基酸殘基置換。更優(yōu)選地，分離的多肽包含密碼子突變，所述密碼子突變導致a)等同于或類似于SEQ ID NO: I的氨基酸殘基107的位置置換以異亮氨酸殘基和等同于或類似于SEQ ID NO: I的氨基酸殘基127的位置置換以谷氨酸殘基；或幻等同于或類似于SEQ ID NO: I的氨基酸殘基107的位置置換以異亮氨酸殘基、等同于或類似于SEQ ID NO: I的氨基酸殘基110的位置置換以脯氨酸殘基和等同于或類似于SEQ ID NO: I的氨基酸殘基127的位置置換以谷氨酸殘基。甚至更優(yōu)選地，分離的多肽包含密碼子突變，該密碼子突變對SEQ ID N0:1產(chǎn)生下述置換突變V107I/Y127E或V107I/Y127E/A110P。在另一特定的實施方案中，本發(fā)明涉及包含含有置換突變的H組核受體配體結合結構域的分離的多肽，其中所述置換突變總體上增強H組核受體配體結合結構域的非蛻皮類固醇四氫喹啉結合活性或非蛻皮類固醇四氫喹啉敏感性。優(yōu)選地，分離的多肽包含密碼子突變，所述密碼子突變導致替換a)等同于或類似于SEQ IDN0:1的氨基酸殘基110或128的位置上的氨基酸殘基；或b)等同于或類似于SEQID NO: I的氨基酸殘基110和128的位置上的氨基酸殘基。更優(yōu)選地，分離的多肽包含密碼子突變，所述密碼子突變導致a)等同于或類似于SEQ ID NO: I的氨基酸殘基110的位置置換以色氨酸殘基；b)等同于或類似于SEQ ID NO: I的氨基酸殘基128的位置置換以苯丙氨酸殘基；或c)等同于或類似于SEQ IDNO: I的氨基酸殘基110的位置置換以脯氨酸殘基和等同于或類似于SEQ ID NO: I的氨基酸殘基128的位置置換以苯丙氨酸殘基。甚至更優(yōu)選地，分離的多肽包含密碼子突變，該密碼子突變對SEQ ID NO: I產(chǎn)生下述置換突變A110W、V128F或V128F/A110P。在另一特定的實施方案中，本發(fā)明涉及包含含有置換突變的H組核受體配體結合結構域的分離的多肽，其中所述置換突變對非蛻皮類固醇二酰肼配體產(chǎn)生差異性的應答。優(yōu)選地，分離的多肽包括密碼子突變，所述密碼子突變導致對等同于或類似于SEQ ID NO: I的氨基酸殘基52、95、109、125或132的位置上的氨基酸殘基產(chǎn)生置換。更優(yōu)選地，分離的多肽包含密碼子突變，所述密碼子突變導致a)等同于或類似于SEQ ID N0:1的氨基酸殘基52的位置置換以脯氨酸殘基；b)等同于或類似于SEQ ID NO: I的氨基酸殘基95的位置置換以組氨酸或蛋氨酸殘基；c)等同于或類似于SEQ ID NO: I的氨基酸殘基109的位置置換以亮氨酸殘基；d)等同于或類似于SEQ ID NO: I的氨基酸殘基125的位置置換以亮氨酸、色氨酸、精氨酸、半胱氨酸或脯氨酸殘基；或6)等同于或類似于SEQ ID NO: I的氨基酸殘基132的位置置換以蛋氨酸殘基。甚至更優(yōu)選地，分離的多肽包含密碼子突變，該密碼子突變對 SEQ ID NO: I 產(chǎn)生下述置換突變T52P、R95H、R95M、F109L、M125L、M125W、M125R、M125C、M125P 或 L132M。在另一特定的實施方案中，本發(fā)明涉及包含含有置換突變的H組核受體配體結合結構域的分離的多肽，其中所述置換突變對非蛻皮類固醇二酰肼配體產(chǎn)生差異性的應答。更優(yōu)選地，分離的多肽包含密碼子突變，所述密碼子突變導致a)等同于或類似于SEQ IDNO: I的氨基酸殘基48的位置置換以賴氨酸或精氨酸殘基；b)等同于或類似于SEQ ID NO: I的氨基酸殘基52的位置置換以甘氨酸、谷氨酰胺、蛋氨酸、精氨酸或色氨酸殘基；c)等同于或類似于SEQ ID NO: I的氨基酸殘基125的位置置換以異亮氨酸、甘氨酸、天冬酰胺、絲氨酸或纈氨酸殘基；d)等同于或類似于SEQ ID NO: I的氨基酸殘基132的位置置換以谷氨酸殘基；e)等同于或類似于SEQ ID NO: I的氨基酸殘基219的位置置換以賴氨酸、色氨酸或酪氨酸殘基；f)等同于或類似于SEQ ID NO: I的氨基酸殘基223的位置置換以精氨酸或酪氨酸殘基；或g)等同于或類似于SEQ ID NO: I的氨基酸殘基238的位置置換以亮氨酸或蛋氨酸殘基。甚至更優(yōu)選地，分離的多肽包含密碼子突變，該密碼子突變對SEQ ID NO: I產(chǎn)生下述置換突變F48K、F48R、T52G、T52Q、T52M、T52R、T52W、M125I、M125G、M125N、M125S、M125V、L132E、M219K、M219W、M219Y、L223R、L223Y、W238L 或 W238M。
本發(fā)明也涉及包含本發(fā)明的分離的多肽的組合物。本發(fā)明的調(diào)節(jié)基因表達的方法申請人:的發(fā)明也涉及在宿主細胞中使用本發(fā)明的基因表達調(diào)節(jié)系統(tǒng)來調(diào)節(jié)基因表達的方法。具體地，申請人的發(fā)明提供了在宿主細胞中調(diào)節(jié)基因表達的方法，該方法包括步驟a)將本發(fā)明的基因表達調(diào)節(jié)系統(tǒng)導入宿主細胞；和b)將配體導入宿主細胞，在配體導入宿主細胞之后，該基因的表達被調(diào)節(jié)，其中待調(diào)節(jié)的基因是基因表達盒的成分，所述基因表達盒包括i)應答元件，其包含被基因表達系統(tǒng)的DNA結合結構域識別的區(qū)域；ii)被基因表達系統(tǒng)的反式激活結構域激活的啟動子；和iii)其表達待被調(diào)節(jié)的基因。本發(fā)明也提供了在宿主細胞中調(diào)節(jié)基因表達的方法，該方法包括步驟a)將本發(fā)明的基因表達調(diào)節(jié)系統(tǒng)導入宿主細胞；b)將本發(fā)明的基因表達盒導入宿主細胞，其中所述基因表達盒包含i)應答元件，其包含被基因表達系統(tǒng)的DNA結合結構域識別的區(qū)域；ii)被基因表達系統(tǒng)的反式激活結構域激活的啟動子；和iii)其表達待被調(diào)節(jié)的基因；和c)將配體引入宿主細胞；因此，一旦所述配體被導入所述宿主細胞，基因的表達被調(diào)節(jié)。申請人:的發(fā)明也提供了在含有基因表達盒的宿主細胞中調(diào)節(jié)基因表達的方法，所述基因表達盒包含應答元件，其包含基因表達調(diào)節(jié)系統(tǒng)的第一雜合多肽的DNA結合結構域與之結合的區(qū)域；被基因表達調(diào)節(jié)系統(tǒng)的第二雜合多肽的反式激活結構域激活的啟動子；和其表達待被調(diào)節(jié)的基因；其中所述方法包括步驟a)將本發(fā)明的基因表達調(diào)節(jié)系統(tǒng)導入宿主細胞；和b)將配體導入宿主細胞；因此，一旦所述配體被導入所述宿主細胞，基因的表達被調(diào)節(jié)。使用申請人的方法在宿主細胞中表達的感興趣的基因可以是內(nèi)源性基因或異源性基因。期望的基因或蛋白的核酸或氨基酸序列信息可以從眾多公共數(shù)據(jù)庫，例如GENBANK, EMBL, Swiss-Prot和PIR，或者從大量的生物學相關期刊出版物獲得。因此，本領域技術人員能夠獲得幾乎所有已知基因的核酸序列信息。這樣的信息然后可以用于構建期望的構建物，用來將感興趣的基因插入到在此描述的申請人的方法所使用的基因表達盒中。使用申請人的方法在宿主細胞中表達的感興趣的基因的例子包括但不限于在植物中生產(chǎn)的抗原如疫苗，酶如α -淀粉酶、植酸酶、葡聚糖酶、木糖酶和木聚糖酶，對昆蟲、線蟲、真菌、細菌、病毒和非生物應激具有抗性的基因，營養(yǎng)物、藥物、維生素，改變氨基酸內(nèi)容、除草劑抗性、對冷、干旱和熱的耐受性的基因，工業(yè)產(chǎn)品、油、蛋白質、碳水化合物、抗氧化劑、雄性不育植物、花、燃料、其他表現(xiàn)性狀，編碼治療上理想的多肽或產(chǎn)物的基因，所述多肽或產(chǎn)物可以用于治療病癥、疾病、紊亂、功能障礙、遺傳缺陷，如單克隆抗體、酶、蛋白酶、細胞因子、干擾素、胰島素、促紅細胞生成素、凝血因子、其他血液因子或成分，用于基因治療的病毒載體、用于疫苗的病毒、藥物開發(fā)的靶標、功能基因組學和蛋白質組學分析和應
田坐坐川寸寸ο可接受的配體是當本發(fā)明的基因表達系統(tǒng)的DNA結合結構域在配體存在的情況下與應答元件的結合導致激活或抑制基因表達時，調(diào)節(jié)基因表達的任何配體。優(yōu)選的配體包括蛻皮類固醇，例如蛻皮激素、20-羥基蛻皮激素、松留酮Α、幕黎留酮A和類似物，9-順-視黃酸、視黃酸的合成類似物、N, N’-二酰肼，例如在美國專利6，013，836 ；5，117，057 ;5，530，028 ;5，378，726 和美國專利申請 10/775，883 和 10/787，906 中公開的那些；二苯甲酰烷基氰肼，例如在歐洲專利申請461，809中公開的那些；N-烷基-N，N’- 二芳酰肼，例如在美國專利5，225，443中公開的那些；N_酰基-N-烷基羰基肼，例如在歐洲專利申請234，994中公開的那些；N-芳?；?N-烷基-N’ -芳酰肼，例如在美國專利4，985，461中公開的那些；四氫喹啉，例如在國際專利申請PCT/US03/00915中公開的那些；這些專利或專利申請中的每一個都并入本文作為參考，其他類似的物質包括3，5- 二-叔丁基-4-輕基-N-異丁基-苯甲酰胺、8-0-乙酰哈帕苷、氧固醇、22 (R)羥基膽固醇、24(S)羥基膽固醇、25-環(huán)氧膽固醇、T0901317、5- α -6- α -環(huán)氧膽固醇-3-硫酸酯(ECHS)、7_酮膽固醇_3_硫酸酯、法呢醇、膽汁酸、1，I-二膦酸酯、保幼激素III和類似物。在優(yōu)選的實施方案中，用于申請人的調(diào)節(jié)基因表達的方法的配體是下式的化合物
I4
, OO _/
I ..........\||j I
K2"R1其中E是含有叔碳的支鏈(C4-C12)烷基或支鏈(C4-C12)烯基，或含有叔碳的氰基(C3-C12)燒基；R1 是 H、Me、Et、i-Pr、F、甲?；?、CF3、CHF2、CHCl2、CH2F、CH2Cl、CH2OH,CH2OMe、CH2CN、CN、C0CHU-丙炔基、2-丙炔基、乙烯基、OH、OMe, OEt、環(huán)丙基、CF2CF3^ CH=CHCN、烯丙基、疊氮、SCN 或 SCHF2 ；R2 是 H、Me、Et、n_Pr、i_Pr、甲酰基、CF3、CHF2, CHCl2, CH2F, CH2Cl、CH2OH, CH2OMe,CH2CN, CN、C0CHU-丙炔基、2-丙炔基、乙烯基、Ac、F、Cl、OH、OMe, OEt、OtPr、OAc、NMe2,NEt2, SMe、SEt、SOCF3, OCF2CF2H, COEt、環(huán)丙基、CF2CF3, CH=CHCN、烯丙基、疊氮、OCF3> OCHF2,0-i-Pr、SCN、SCHF2, SOMe, NH-CN,或與R3以及連接R2和R3的苯基碳連接形成次乙二氧基、其中氧與苯基碳相鄰的二氫呋喃環(huán)(dihydrofuryl ring)、或其中氧與苯基碳相鄰的二氫批喃環(huán)(dihydropyryl ring)；R3是H、Et,或與R2以及連接R2和R3的苯基碳連接形成次乙二氧基、其中氧與苯基碳相鄰的二氫呋喃環(huán)、或其中氧與苯基碳相鄰的二氫吡喃環(huán)；R4、R5 和 R6 獨立地是 H、Me、Et、F、Cl、Br、甲?；?、CF3> CHF2、CHC12、CH2F、CH2Cl,CH2OH, CN、C0CH, I-丙炔基、2-丙炔基、乙烯基、OMe、OEt、SMe 或 Set。在另一優(yōu)選的實施方案中，用于申請人的調(diào)節(jié)基因表達的方法的配體是下式的化合物
_ I I xF Jfi 0
R2
其中
權利要求
1.基因表達調(diào)節(jié)系統(tǒng)，包括基因表達盒，所述基因表達盒能夠在宿主細胞中被表達，所述基因表達盒包含編碼多肽的多核苷酸，所述多肽包含 i)反式激活結構域； )識別應答元件的DNA結合結構域，所述應答元件與其表達待被調(diào)節(jié)的基因連接；和 iii)H組核受體配體結合結構域，其包括至少一個突變，所述突變的位置在等同于或類似于選自下述的氨基酸殘基處a) SEQ ID NO: I 的 48、51、52、54、92、95、96、109、110、119、120、125、128、132、219、223、234 和 238 中的至少一個；b)SEQ ID NO: I 的 96 和 119 ；c)SEQID NO: I 的 110 和 128 ；d) SEQ ID NO: I 的 52 和 110 ；e)SEQ ID NO: I 的 107、110 和 127 ；f)SEQ ID NO: I 的 52、107 和 127 ;和 g) SEQ ID NO: I 的 107、127 和 259，或它們的任何組合。
2.根據(jù)權利要求I的基因表達調(diào)節(jié)系統(tǒng)，進一步包括第二個核受體配體結合結構域，其選自脊椎動物類視黃醇X受體配體結合結構域、無脊椎動物類視黃醇X受體配體結合結構域、超氣門蛋白配體結合結構域，和包含兩個多肽片段的嵌合配體結合結構域，其中第一多肽片段來自脊椎動物類視黃醇X受體配體結合結構域、無脊椎動物類視黃醇X受體配體結合結構域或超氣門蛋白配體結合結構域，第二多肽片段來自不同的脊椎動物類視黃醇X受體配體結合結構域、無脊椎動物類視黃醇X受體配體結合結構域或超氣門蛋白配體結合結構域。
3.基因表達調(diào)節(jié)系統(tǒng)，包括 a)第一基因表達盒，其能夠在宿主細胞中被表達，包含編碼第一多肽的多核苷酸，所述第一多肽包括 i)識別應答元件的DNA結合結構域，所述應答元件與其表達待被調(diào)節(jié)的基因連接；和 )核受體配體結合結構域；以及 b)第二基因表達盒，其能夠在宿主細胞中被表達，包括編碼第二多肽的多核苷酸，所述第二多肽包括 i)反式激活結構域；和 )核受體配體結合結構域，其中，所述核受體配體結合結構域中的一個是含有至少一個突變的H組核受體配體結合結構域，其中所述突變的位置在等同于或類似于選自下述的氨基酸殘基處a)SEQ IDNO: I 的 48、51、52、54、92、95、96、109、110、119、120、125、128、132、219、223、234 和 238 中的至少一個；b) SEQ ID NO: I 的 96 和 119 ;c) SEQ ID NO: I 的 110 和 128 ;d) SEQ ID NO: I 的 52和 110 ；e)SEQ ID NO: I 的 107、110 和 127 所有這三個；f) SEQ ID NO: I 的 52、107 和 127 所有這三個；和g)SEQ ID NO: I的107、127和259所有這三個，或它們的任何組合。
4.根據(jù)權利要求I或3的基因表達調(diào)節(jié)系統(tǒng)，其中所述H組核受體配體結合結構域來自H組核受體，該H組核受體選自蛻皮激素受體、遍在受體、孤獨受體1、NER-1、類固醇激素核受體I、類視黃醇X受體相互作用蛋白-15、肝臟X受體β、類固醇激素受體樣蛋白、肝臟X受體、肝臟X受體α、類法呢醇X受體、受體相互作用蛋白14和法呢醇受體。
5.根據(jù)權利要求4的基因表達調(diào)節(jié)系統(tǒng)，其中所述H組核受體配體結合結構域由包含至少一個突變的多核苷酸編碼，所述至少一個突變導致至少一個氨基酸殘基突變，其中所述氨基酸殘基的位置等同于或類似于a) SEQ ID ΝΟ:1的氨基酸殘基48、51、52、54、92、95、/96、109、110、119、120、125、128、132、219、223、234 和 238 中的至少一個；b)SEQ ID NO: I 的氨基酸殘基96和119 ；c)SEQ ID NO: I的氨基酸殘基110和128 ；d) SEQ ID NO: I的氨基酸殘基52和110 ;e) SEQ ID NO: I的所有三個氨基酸殘基107、110和127 ;f) SEQ ID NO: I的所有三個氨基酸殘基52、107和127 ;或g) SEQ ID NO: I的所有三個氨基酸殘基107、127和259，或它們的任何組合。
6.根據(jù)權利要求5的基因表達調(diào)節(jié)系統(tǒng)，其中所述包含置換突變的H組核受體配體結合結構域是蛻皮激素受體配體結合結構域。
7.根據(jù)權利要求6的基因表達調(diào)節(jié)系統(tǒng)，其中所述突變選自SEQID ΝΟ:1的F48Y、F48W、F48L、F48N、F48R、F48K、I51M、15IN、I51L、T52M、T52V、T52L、T52E、T52P、T52R、T52W、T52G、T52Q、M54W、M54T、M92L、M92E、R95H、R95M、R95W、V96L、V96W、V96S、V96E、F109W、F109P、F109L、F109M、F109N、A110E、A110N、A110W、N119F、Y120W、Y120M、M125P、M125R、M125E、M125L、M125C、M125W、M125G、M125I、M125N、M125S、M125V、V128F、L132M、L132N、L132V、L132E、M219K、M219W、M219Y、M219A、L223K、L223R、L223Y、L234M、L234I、L234R、L234W、W238P、W238E、W238Y、W238M、W238L、NI 19F/V96T、V128F/A1IOP,T52V/A110P、V107I/Y127E/T52V.V107I/Y127E/G259 和 V107I/Y127E/A110P。
8.根據(jù)權利要求I或3的基因表達調(diào)節(jié)系統(tǒng)，其中所述DNA結合結構域選自蛻皮激素受體DNA結合結構域、GAL4DNA結合結構域和LexA DNA結合結構域。
9.根據(jù)權利要求I或3的基因表達調(diào)節(jié)系統(tǒng)，其中所述反式激活結構域選自蛻皮激素受體反式激活結構域、VP16反式激活結構域、B42酸性激活物反式激活結構域和p65反式激活結構域。
10.分離的多核苷酸，其編碼包含至少一個突變的H組核受體配體結合結構域，其中所述分離的多核苷酸包含至少一個突變，所述至少一個突變導致至少一個氨基酸殘基突變，其中所述氨基酸殘基突變的位置等同于或類似于a)SEQ ID勵:1的氨基酸殘基48、51、52、54、92、95、96、109、110、119、120、125、128、132、219、223、234 和 238 中的至少一個；b) SEQID NO: I的氨基酸殘基96和119 ;c) SEQ ID NO: I的氨基酸殘基110和128 ;d) SEQ ID NO: I的氨基酸殘基52和110 ;e) SEQ ID NO: I的所有三個氨基酸殘基107、110和127 ;f) SEQ IDNO: I的所有三個氨基酸殘基52、107和127 ;或g) SEQ ID NO: I的所有三個氨基酸殘基107、127和259，或它們的任何組合。
11.根據(jù)權利要求10的分離的多核苷酸，其中所述突變導致選自SEQID ΝΟ:1的F48Y、F48W、F48L、F48N、F48R、F48K、I51M、151N、I51L、T52M、T52V、T52L、T52E、T52P、T52R、T52W、T52G、T52Q、M54W、M54T、M92L、M92E、R95H、R95M、R95W、V96L、V96W、V96S、V96E、F109W、F109P、F109L、F109M、F109N、A110E、A110N、A110W、N119F、Y120W、Y120M、M125P、M125R、M125E、M125L、M125C、M125W、M125G、M125I、M125N、M125S、M125V、V128F、L132M、L132N、L132V、L132E、M219K、M219W、M219Y、M219A、L223K、L223R、L223Y、L234M、L234I、L234R、L234W、W238P、W238E、W238Y、W238M、W238L、NI 19F/V96T、V128F/A1IOP,T52V/A110P、V107I/Y127E/T52V.V107I/Y127E/G259 和 V107I/Y127E/A110P 的突變。
12.表達載體，包含可操作性地連接到轉錄調(diào)控元件的權利要求10的分離的多核苷酸。
13.分離的宿主細胞，包含權利要求12的表達載體，其中所述轉錄調(diào)控元件在所述宿主細胞中是可操作性的。
14.分離的多肽，由權利要求10的分離的多核苷酸編碼。
15.分離的多肽,包含H組核受體配體結合結構域,所述H組核受體配體結合結構域包含至少一個突變，其中所述突變的位置等同于或類似于a) SEQ ID NO: I的氨基酸殘基48、51、52、54、92、95、96、109、110、119、120、125、128、132、219、223、234 和 238 中的至少一個；b)SEQ ID NO: I的氨基酸殘基96和119 ;c) SEQ ID NO: I的氨基酸殘基110和128 ;d) SEQID NO: I的氨基酸殘基52和110 ;e) SEQ ID NO: I的所有三個氨基酸殘基107、110和127 ;f) SEQ ID NO: I的所有三個氨基酸殘基52、107和127 ;*g)SEQ ID NO: I的所有三個氨基酸殘基107、127和259，或它們的任何組合。
16.根據(jù)權利要求15的分離的多肽，其中所述突變選自SEQID NO: I的F48Y、F48W、F48L、F48N、F48R、F48K、I51M、I51N、I51L、T52M、T52V、T52L、T52E、T52P、T52R、T52W、T52G、T52Q、M54W、M54T、M92L、M92E、R95H、R95M、R95W、V96L、V96W、V96S、V96E、F109W、F109P、F109L、F109M、F109N、A110E、A110N、A110W、N119F、Y120W、Y120M、M125P、M125R、M125E、M125L、M125C、M125W、M125G、M125I、M125N、M125S、M125V、V128F、L132M、L132N、L132V、L132E、M219K、M219W、M219Y、M219A、L223K、L223R、L223Y、L234M、L234I、L234R、L234W、W238P、W238E、W238Y、W238M、W238L、NI 19F/V96T、V128F/A1IOP,T52V/A110P、V107I/Y127E/T52V.V107I/Y127E/G259 和 V107I/Y127E/A110P。
17.在宿主細胞中調(diào)節(jié)基因表達的方法，包括下述步驟 a)將權利要求I或權利要求3的基因表達調(diào)節(jié)系統(tǒng)導入所述宿主細胞；和 b)將配體導入所述宿主細胞；其中待被調(diào)節(jié)的基因是基因表達盒的組成部分，所述基因表達盒包括 i)被DNA結合結構域識別的應答元件； )被反式激活結構域激活的啟動子；和 iii)其表達待被調(diào)節(jié)的基因；由此，一旦所述配體被導入所述宿主細胞，b)iii)的基因的表達被調(diào)節(jié)。
18.根據(jù)權利要求17的方法，其中所述配體選自 a)下式化合物
19.根據(jù)權利要求18的方法，進一步包括將第二配體導入所述宿主細胞，其中所述第二配體是9-順-視黃酸，或視黃酸的合成類似物。
20.分離的宿主細胞，包含權利要求I或權利要求3的基因表達調(diào)節(jié)系統(tǒng)。
21.非人生物,包含權利要求20的宿主細胞。
全文摘要
本發(fā)明涉及生物技術或遺傳工程領域。具體地，本發(fā)明涉及基因表達領域。更具體地，本發(fā)明涉及新型的置換突變型受體，和它們在基于核受體的誘導型基因表達系統(tǒng)中的應用，以及在宿主細胞中調(diào)節(jié)基因表達的方法，可用于各種應用，如基因療法、大規(guī)模生產(chǎn)蛋白質和抗體、基于細胞的高通量篩選分析、功能基因組學和調(diào)控轉基因生物的性狀。
文檔編號A61K31/47GK102776218SQ20121027049
公開日2012年11月14日申請日期2005年5月2日優(yōu)先權日2004年4月30日
發(fā)明者M·B·庫瑪, S·R·帕里申請人:因特萊克森公司

完整全部詳細技術資料下載