專利名稱::用于脊椎動物細胞的雜合抑制tRNA的制作方法
技術領域:
:本發(fā)明涉及脊椎動物細胞中的翻譯生物化學領域。本發(fā)明涉及在脊椎動物細胞中產生正交tRNA、正交合成酶和其對的方法以及正交tRNA、正交合成酶與其對的組合物。本發(fā)明還涉及非天然氨基酸組合物、包括非天然氨基酸的蛋白質以及在脊椎動物細胞中產生包括非天然氨基酸的蛋白質的方法。
背景技術:
:從細菌到人類,每一種已知生物體的遺傳密碼都編碼相同的二十種常見氨基酸。這二十種相同天然氨基酸的不同組合形成實質上進行生命的所有復雜過程(光合作用到信號轉導和免疫反應)的蛋白質。為研究和修飾蛋白質的結構和功能,科學家們曾嘗試操縱蛋白質的遺傳密碼和氨基酸序列。然而,難以去除由遺傳密碼所強加的將蛋白質局限于二十種基因編碼的標準結構單元(其中極少見的特例為,硒代半胱氨酸(例如參看A.Bock等人、(1991),MolecularMicrobiology5:515-20)和吡咯賴氨酸(例如參看G.Srinivasan等人,(2002),Science296:1459-62))的約束。已取得一些進展來去除這些約束,但這一進展受到限制并且合理控制蛋白質結構和功能的能力仍不成熟。舉例來說,化學家們已開發(fā)出合成和操縱小分子結構的方法和策略(例如參看E.J.Corey和X.-M.Cheng,TheLogicofChemicalSynthesis(Wiley-Interscience,NewYork,1995))。全合成(例如參看B.Merrifield,(1986),Science232:341-7(1986))和半合成方法(例如參看D.Y.Jackson等人,(1994)Science266:243-7;以及P.E.Dawson和S.B.Kent,(2000),AnnualReviewofBiochemistry69:923-60)使得合成肽和小蛋白質成為可能,但這些方法限制了超過10千道爾頓(kil0Dalton,kDa)的蛋白質的效用。誘變方法盡管有效,但也局限于有限數量的結構改變。在多種情況下,在整個蛋白質中競爭性并入常見氨基酸的極其接近的結構類似物已成為可能。例如參看R.Furter,(1998),ProteinScience7:419-26;K.Kirshenbaum等人,(2002),ChemBioChem3:235-7;和V.Doring等人,(2001),Scie腦292:501-4。在嘗試擴大操縱蛋白質結構和功能的能力的過程中,開發(fā)出使用經化學酰化的正交tRNA的活體外方法,其使得能在活體外響應無義密碼子選擇性并入非天然氨基酸(例如參看,J.A.Ellman等人,(1992),Science255:197-200)。將具有新穎結構和物理特性的氨基酸選擇性并入蛋白質中,來研究蛋白質折疊和穩(wěn)定性以及生物分子識別和催化。例如參看,D.Mendel等人(1995),AnnualReviewofBiophysicsandBiomolecularStructure24:435-462;禾nV.W.Cornish等人(1995年3月31、日),AngewandteChemie-InternationalEditioninEnglish34:621-633。然而,這一方法的化學計量性質極大限制了能產生的蛋白質的量。已將非天然氨基酸顯微注射到細胞中。舉例來說,通過顯微注射以化學方式錯?;氖葻崴哪はx(Tetrahymenathermophila)tRNA(例如,M.E.Saks等人(1996),/Wo/ro/^/m15w/7pms;s7'o",J.Biol.Chem.271:23169-23175)禾口相關mRNA而將非天然氨基酸引入爪蟾卵母細胞(Xenopusoocyte)中的煙堿型乙酰膽堿受體中(例如,M.W.Nowak等人(1998),/"w'vo/"cor/ora"o"o/w朋她m/a7m'朋鏡.(is"z'o"c/2a朋e/sz'wZewopiwooc,expmwz'ows,em,MethodEnzymol.293:504-529)。這允許通過引入具有獨特物理或化學特性的含側鏈氨基酸來對卵母細胞中的受體進行詳細生物物理研究。例如參看,D.A.Dougherty(2000),[/朋<^畫/畫'"o<xs"戶h。/.profe/"WmCi/re朋(i細"/ow,Curr.Opin.Chem.Biol.4:645-652。不幸的是,這禾中方法局限于細胞中可進行顯微注射的蛋白質,并且由于相關tRNA是在活體外以化學方式酰化并且無法再?;?,故蛋白質的產率極低。為克服這些缺點,將新組件添加到原核生物大腸桿菌(&c/2en'c/n'flcW,五.cw7)的蛋白質生物合成機器中(參看L.Wang等人,(2001),Science292:498-500),這允許在活體內基因編碼非天然氨基酸。已使用這種方法響應琥珀密碼子TAG將多種具有新穎化學、物理或生物特性的新氨基酸有效且高保真地并入大腸桿菌的蛋白質中,所述新氨基酸包括光親和標記和光致異構化氨基酸、酮基氨基酸和糖基化氨基酸。例如參看J.W.Chin等人,(2002),JournaloftheAmericanChemicalSociety124:9026-9027;J.W.Chin,&P.G.Schultz,(2002),ChemBioChem11:1135-1137;J.W.Chin等人,(2002),PNASUnitedStatesofAmerica99:11020-11024;和L,Wang,&P,G.Schultz,(2002),Chem.Comm.,1-10。然而,原核生物和真核生物的翻譯機器并不高度保守;因此,添加到大腸桿菌中的生物合成機器的組件通常無法用于將非天然氨基酸位點特異性并入脊椎動物細胞中的蛋白質中。舉例來說,用于大腸桿菌中的詹氏甲垸球菌(ikfeA朋ococcM/amKwcM)酪氨酰-tRNA合成酶/tRNA對在脊椎動物細胞中并不正交。此外,真核生物而非原核生物中tRNA的轉錄是通過RNA聚合酶III進行,并且這會限制能在脊椎動物細胞中轉錄的tRNA結構基因的一級序列。而且,與原核生物細胞相比,脊椎動物細胞中的tRNA都是從轉錄tRNA的細胞核輸出到細胞質,以進行翻譯。最后,脊椎動物的80S核糖體與70S原核生物核糖體截然不同。因此,需要開發(fā)出經改進的生物合成機器組件以擴充脊椎動物遺傳密碼。如在仔細查看以下公開內容后將顯而易見,本發(fā)明滿足這些要求和其它要求。
發(fā)明內容本發(fā)明對脊椎動物細胞提供翻譯組件,例如正交氨?;?tRNA合成酶(O-RS)與正交tRNA(O-tRNA)對和其個別組件,所述翻譯組件可用于脊椎動物蛋白質生物合成機器中以將非天然氨基酸并入脊椎動物細胞中正在生長的多肽鏈中。本發(fā)明的組合物包括包含正交氨?;?tRNA合成酶(O-RS)(例如,得自非脊椎動物生物體,諸如大腸桿菌、嗜熱脂肪芽孢桿菌(5ac/〃wWearo快e,印/n7w)等)的脊椎動物細胞(例如,哺乳動物細胞、禽類細胞、魚細胞、爬行動物細胞、兩棲動物細胞、得自非哺乳動物的細胞等),其中O-RS優(yōu)先在脊椎動物細胞中利用至少一個非天然氨基酸將正交tRNA(O-tRNA)氨?;?扇芜x將指定脊椎動物細胞中的兩個或兩個以上OtRNA氨酰化。一方面,O-RS利用非天然氨基酸將0-tRNA氨?;?,這與具有(例如)如SEQIDNO.:86或45中所述的氨基酸序列的O-RS例如至少40%、至少45%、至少50%、至少60%、至少75%、至少80%或者甚至90%或90%以上有效。在一個實施例中,本發(fā)明的O-RS利用非天然氨基酸將O-tRNA氨?;@比0-RS利用天然氨基酸將O-tRNA氨?;行Ю缰辽?0倍、至少20倍、至少30倍等。在一個實施例中,O-RS或其部分是由如SEQIDNO.:3-35中任一序列所述的多聚核苷酸序列或其互補多聚核苷酸序列編碼。在另一實施例中,O-RS包含如SEQIDNO.:36-63和/或86中任一序列所述的氨基酸序列,或其保守變異體。在另一實施例中,O-RS包含例如與天然存在的酪氨?;滨;?tRNA合成酶(TyrRS)的氨基酸序列至少卯%、至少95%、至少98%、至少99%或至少99.5%或99.5%以上一致并且包含兩個或兩個以上來自A-E組的氨基酸的氨基酸序列。A組包括在與大腸桿菌TyrRS的Tyr37對應的位置的纈氨酸、異亮氨酸、亮氨酸、甘氨酸、絲氨酸、丙氨酸或蘇氨酸。B組包括在與大腸桿菌TyrRS的Asnl26對應的位置的天冬氨酸。C組包括在與大腸桿菌TyrRS的Aspl82對應的位置的蘇氨酸、絲氨酸、精氨酸、天冬酰胺或甘氨酸。D組包括在與大腸桿菌TyrRS的Phel83對應的位置的甲硫氨酸、丙氨酸、纈氨酸或酪氨酸;并且E組包括在與大腸桿菌TyrRS的Leu186對應的位置的絲氨酸、甲硫氨酸、纈氨酸、半胱氨酸、蘇氨酸或丙氨酸。在另一實施例中,O-RS具有一種或多種相比天然氨基酸改進或增強的針對非天然氨基酸的酶特性。舉例來說,相比天然氨基酸,改進或增強的針對非天然氨基酸的特性包括例如較高Km、較低Km、較高kcat、較低kcat、較低kcat/km、較高kcat/km等。脊椎動物細胞還任選包括非天然氨基酸。脊椎動物細胞任選包括正交tRNA(O-tRNA)(例如,得自非脊椎動物生物體,諸如大腸桿菌、嗜熱脂肪芽孢桿菌等),其中O-tRNA識別選擇性密碼子且優(yōu)先通過O-RS利用非天然氨基酸氨?;?。一方面,O-tRNA例如以至少45%、至少50%、至少60%、至少75%、至少80%、至少卯%、至少95%或99%的包含如SEQIDNO.:65中所述的多聚核卄酸序列或在細胞中由如SEQIDNO.:65中所述的多聚核苷酸序列加工的tRNA的效率,介導將非夭然氨基酸并入蛋白質中。另一方面,O-tRNA包含SEQIDNO.:65的序列,且O-RS包含選自SEQIDNO.:36-63和/或86中任一序列中所述的氨基酸序列的多肽序列和/或其保守變異體。在另一實施例中,脊椎動物細胞包含包括編碼所關注多肽的多聚核苷酸的核酸,其中所述多聚核苷酸包含由O-tRNA所識別的選擇性密碼子。一方面,包含非天然氨基酸的所關注多肽的產率例如為從多聚核苷酸缺乏選擇性密碼子的細胞中獲得天然存在的所關注多肽的產率的至少2.5%、至少5%、至少10%、至少25%、至少30%、至少40%、50%或更多。另一方面,細胞在不存在非天然氨基酸的情況下以一定產率產生所關注多肽,所述產率例如為在存在非天然氨基酸的情況下多肽產率的不到35%、不到30%、不到20%、不到15%、不到10%、不到5%、不到2.5%等。本發(fā)明還提供一種脊椎動物細胞,其包含正交氨?;?tRNA合成酶(O-RS)、正交tRNA(OtRNA)、非天然氨基酸和包含編碼所關注多肽的多聚核苷酸的核酸。所述多聚核苷酸包含由O-tRNA識別的選擇性密碼子。此外,在脊椎動物細胞中,O-RS優(yōu)先利用非天然氨基酸將正交tRNA(O-tRNA)氨?;宜黾毎诓淮嬖诜翘烊话被岬那闆r下以一定產率產生所關注多肽,所述產率例如為在存在非天然氨基酸的情況下多肽產率的不到30%、不到20%、不到15%、不到10%、不到5%、不到2.5%等。包括包含正交tRNA(O-tRNA)的脊椎動物細胞的組合物也為本發(fā)明的特征。通常,O-tRNA介導在活體內將非天然氨基酸并入蛋白質中,所述蛋白質是由包含由O-tRNA識別的選擇性密碼子的多聚核苷酸編碼。在一個實施例中,O-tRNA例如以至少45%、至少50%、至少60%、至少75%、至少80%、至少90%、至少95%或甚至99%或99。/。以上的包含如SEQIDNO.:65中所述的多聚核苷酸序列或在細胞中由如SEQIDNO.:65中所述的多聚核苷酸序列加工的tRNA的效率,介導將非天然氨基酸并入蛋白質中。在另一實施例中,O-tRNA包含如SEQIDNO.:65中所述的多聚核苷酸序列或其保守變異體,或者是由如SEQIDNO.:65中所述的多聚核苷酸序列或其保守變異體加工。在另一實施例中,O-tRNA包含可重復利用的O-tRNA。在本發(fā)明一方面中,O-tRNA經轉錄后修飾。本發(fā)明還提供一種在脊椎動物細胞中編碼O-tRNA的核酸,或其互補多聚核苷酸。在一個實施例中,核酸包含A盒和B合本發(fā)明還涉及產生例如O-RS或O-tRNA/O-RS對等翻譯組件的方法(和由這些方法產生的翻譯組件)。舉例來說,本發(fā)明提供產生正交氨?;?tRNA合成酶(O-RS)的方法,所述O-RS在脊椎動物細胞中優(yōu)先利用非天然氨基酸將正交tRNA氨?;?。所述方法包括例如(a)在存在非天然氨基酸的情況下,使第一物種的脊椎動物細胞群經歷正選擇,其中所述脊椎動物細胞各自包含i)氨?;?tRNA合成酶(RS)文庫成員,ii)正交tRNA(O-tRNA),iii)編碼正選擇標記的多聚核苷酸,和iv)編碼負選擇標記的多聚核苷酸;其中在正選擇下存活的細胞包含在存在非天然氨基酸的情況下將正交tRNA(O-tRNA)氨?;幕钚訰S。使在正選擇下存活的細胞在不存在非天然氨基酸的情況下經歷負選擇,以除去利用天然氨基酸將O-tRNA氨酰化的活性RS。這提供優(yōu)先利用非天然氨基酸將O-tRNA氨?;腛-RS。在某些實施例中,將編碼正選擇標記的多聚核苷酸可操作性連接到反應元件,并且所述細胞另外包含一種多聚核苷酸,其a)編碼調節(jié)由反應元件進行的轉錄的轉錄調節(jié)蛋白(例如,脊椎動物轉錄調節(jié)蛋白等);且b)包含至少一個選擇性密碼子。通過利用非天然氨基酸氨?;腛-tRNA將非天然氨基酸并入轉錄調節(jié)蛋白中,將會引起正選擇標記的轉錄。在一個實施例中,轉錄調節(jié)蛋白為轉錄活化蛋白(例如GAL4等),且選擇性密碼子為琥珀終止密碼子,例如其中所述琥珀終止密碼子位于編碼轉錄活化蛋白的DNA結合結構域的多聚核苷酸的一部分中,或實質上鄰近編碼轉錄活化蛋白的DNA結合結構域的多聚核苷酸的一部分。正選擇標記可為多種分子中的任一個。在一個實施例中,正選擇標記包含供生長的營養(yǎng)補充并且所述選擇是在缺乏所述營養(yǎng)補充的培養(yǎng)基上執(zhí)行。在另一實施例中,編碼正選擇標記的多聚核苷酸例如為ura3、leu2、lys2、lacZ基因、his3(例如,其中his3基因編碼咪唑甘油磷酸酯脫水酶,通過提供3-氨基三唑(3-AT)檢測)等。在另一實施例中,編碼正選擇標記的多聚核苷酸包含選擇性密碼子。與正選擇標記相同,負選擇標記也可為多種分子中的任一個。在某些實施例中,將編碼負選擇標記的多聚核苷酸可操作性連接到反應元件,轉錄調節(jié)蛋白通過所述反應元件介導轉錄。通過利用天然氨基酸氨?;腛-tRNA將天然氨基酸并入轉錄調節(jié)蛋白中,將會引起負選擇標記的轉錄。在一個實施例中,編碼負選擇標記的多聚核苷酸為例如ura3基因,且負選擇是在包含5-氟乳清酸(5-FOA)的培養(yǎng)基上實現。在另一實施例中,用于負選擇的培養(yǎng)基包含轉化成通過負選擇標記可檢測的物質的選擇或篩選劑。在本發(fā)明一方面中,可檢測物質為有毒物質。在一個實施例中,編碼負選擇標記的多聚核苷酸包含選擇性密碼子。在某些實施例中,正選擇標記和/或負選擇標記包含在存在適當反應物的情況下發(fā)熒光或催化發(fā)光反應的多肽。在本發(fā)明一方面中,通過熒光活化細胞分選(fluorescence-activatedcellsorting,FACS)或通過發(fā)光來檢測正選擇標記和/或負選擇標記。在某些實施例中,正選擇標記和/或負選擇標記包含基于親和力的篩選標記或轉錄調節(jié)蛋白。在一個實施例中,同一多聚核苷酸編碼正選擇標記和負選擇標記。在一個實施例中,編碼本發(fā)明的正選擇標記和/或負選擇標記的多聚核苷酸可包含至少兩個選擇性密碼子,其各自或都可包含至少兩個不同選擇性密碼子或至兩個相同選擇性密碼子。其它水平的選擇/篩選嚴格度也可用于本發(fā)明方法中。在一個實施例中,所述方法可例如包含在步驟(a)、(b)或(a)和(b)中提供不同量的無活性合成酶,其中所述不同量的無活性合成酶提供另一水平的選擇或篩選嚴格度。在一個實施例中,用于產生O-RS的方法的步驟(a)、(b)或步驟(a)和(b)包括改變例如正和/或負選擇標記的選擇或篩選嚴格度。所述方法任選包括使優(yōu)先利用非天然氨基酸將O-tRNA氨?;腛-RS經歷另一回合選擇,例如另一回合(數回合)正選擇、另一回合(數回合)負選擇或另一回合正和負選擇的組合。在一個實施例中,選擇/篩選包含一次或多次例如選自氨基酸滲透性改變、翻譯效率改變、翻譯保真度改變等的正或負選擇/篩選。所述一種或多種改變是建立在一個或多個編碼用于產生蛋白質的正交tRNA-tRNA合成酶對的組件的多聚核苷酸突變的基礎上。通常,RS文庫(例如,突變型RS文庫)包含由例如來自非脊椎動物生物體的至少一種氨酰基-tRNA合成酶(RS)得到的RS。在一個實施例中,RS文庫是從無活性RS得到,例如其中所述無活性RS是由使活性RS突變而產生。在另一實施例中,無活性RS包含氨基酸結合袋并且一個或多個包含所述結合袋的氨基酸經一個或多個不同氨基酸取代,例如所述經取代氨基酸經丙氨酸取代。在某些實施例中,產生O-RS的方法另外包括對編碼RS的核酸執(zhí)行隨機突變、位點特異性突變、重組、嵌合構建或其任何組合,從而產生突變型RS文庫。在某些實施例中,所述方法另外包括例如(c)分離出編碼O-RS的核酸;(d)由所述核酸產生一組編碼突變型O-RS的多聚核苷酸(例如,通過隨機誘變、位點特異性誘變、嵌合構建、重組或其任何組合);和(e)重復步驟(a)和/或(b),直到獲得優(yōu)先利用非天然氨基酸將O-tRNA氨?;耐蛔冃蚈-RS。在本發(fā)明一方面中,將步驟(c)-(e)執(zhí)行至少2次。產生O-tRNA/0-RS對的方法也為本發(fā)明的特征。在一個實施例中,如上文所述獲得O-RS,且通過使第一物種的脊椎動物細胞群(其中所述脊椎動物細胞包含tRNA文庫成員)經歷負選擇以除去包含經對于脊椎動物細胞為內源性的氨?;?tRNA合成酶(RS)氨?;膖RNA文庫成員的細胞,來獲得O-tRNA。這提供與第一物種的脊椎動物細胞正交的tRNA池。在本發(fā)明一方面中,tRNA文庫包含由例如來自非脊椎動物生物體的至少一個tRNA得到的tRNA。在本發(fā)明另一方面中,氨酰基-tRNA合成酶(RS)文庫包含由例如來自非脊椎動物生物體的至少一個氨?;?tRNA合成酶(RS)得到的RS。在本發(fā)明另一方面中,tRNA文庫包含由來自第一非脊椎動物生物體的至少一個tRNA得到的tRNA。氨?;?tRNA合成酶(RS)文庫任選包含由來.自第二非脊椎動物生物體的至少一個氨酰基-tRNA合成酶(RS)得到的RS。在一個實施例中,第一與第二非脊椎動物生物體相同。或者,第一與第二非脊椎動物生物體可不同。由本發(fā)明方法產生的特定0-tRNA/0-RS對也為本發(fā)明的特征。本發(fā)明另一特征為用于在一種物種中產生翻譯組件并將選擇/篩選的翻譯組件引入第二物種中的方法。舉例來說,在第一物種(例如,脊椎動物物種,諸如酵母等)中產生O-tRNA/0-RS對的方法另外包括將編碼O-tRNA的核酸和編碼O-RS的核酸引入第二物種(例如,哺乳動物、昆蟲、真菌、藻類、植物等)的脊椎動物細胞中。第二物種可使用引入的翻譯組件在活體內例如在翻譯期間將非天然氨基酸并入正在生長的多肽鏈中。在另一實例中,在脊椎動物細胞中產生優(yōu)先利用非天然氨基酸將正交tRNA氨?;恼话滨;?tRNA合成酶(O-RS)的方法包括(a)在存在非天然氨基酸的情況下,使第一物種(例如,脊椎動物物種,諸如酵母等)的脊椎動物細胞群經歷正選擇。第一物種的脊椎動物細胞各自包含i)氨?;?tRNA合成酶(RS)文庫成員,ii)正交tRNA(0-tRNA),iii)編碼正選擇標記的多聚核苷酸,和iv)編碼負選擇標記的多聚核苷酸。在正選擇中存活的細胞包含在存在非天然氨基酸的情況下將正交tRNA(O-tRNA)氨?;幕钚訰S。使在正選擇下存活的細胞在不存在非天然氨基酸的情況下經歷負選擇,以除去利用天然氨基酸將O-tRNA氨?;幕钚訰S,從而提供優(yōu)先利用非天然氨基酸將O-tRNA氨?;腛-RS。將編碼O-tRNA的核酸和編碼O-RS的核酸引入第二物種(例如,哺乳動物、昆蟲、真菌、藻類、植物等)的脊椎動物細胞中。當在第二物種中翻譯時,可使用這些組件將非天然氨基酸并入第二物種中的所關注蛋白質或多肽中。在一個實施例中,將O-tRNA和/或O-RS引入第二物種的脊椎動物細胞中。在某些實施例中,通過使第一物種的脊椎動物細胞群(其中所述脊椎動物細胞包含tRNA文庫成員)經歷負選擇以除去包含經對于脊椎動物細胞為內源性的氨?;?tRNA合成酶(RS)氨?;膖RNA文庫成員的細胞,來獲得O-tRNA。這提供與第一物種和第二物種的脊椎動物細胞正交的tRNA池。具有至少一個非天然氨基酸的蛋白質(或所關注多肽)也為本發(fā)明的特征。在本發(fā)明某些實施例中,具有至少一個非天然氨基酸的蛋白質包括至少一個翻譯后修飾。在一個實施例中,至少一個翻譯后修飾包含通過[3+2]環(huán)加成將包含第二反應性基團的分子(例如,染料、例如聚乙二醇衍生物等聚合物、光交聯(lián)劑、細胞毒性化合物、親和標記、生物素衍生物、樹脂、第二蛋白質或多肽、金屬螯合劑、輔因子、脂肪酸、碳水化合物、多聚核苷酸(例如,DNA、RNA等)等)與至少一個包含第一反應性基團的非天然氨基酸連接。舉例來說,第一反應性基團為炔基部分(例如,在非天然氨基酸對-炔丙基氧基苯丙氨酸中)(這個基團有時也稱為乙炔部分),且第二反應性基團為疊氮基部分。在另一實例中,第一反應性基團為疊氮基部分(例如,在非天然氨基酸對疊氮基-L-苯丙氨酸中)且第二反應性基團為炔基部分。在某些實施例中,本發(fā)明的蛋白質包括至少一個包含至少一個翻譯后修飾的非天然氨基酸(例如,酮基非天然氨基酸),其中所述至少一個翻譯后修飾包含糖部分。在某些實施例中,翻譯后修飾是于脊椎動物細胞中在活體內進行。在某些實施例中,蛋白質包括至少一個在活體內由脊椎動物細胞所產生的翻譯后修飾,其中所述翻譯后修飾通常不是由原核細胞進行。翻譯后修飾的實例包括(但不限于)乙酰化、?;⒅|修飾、棕櫚酰化、棕櫚酸鹽加成、磷酸化、糖脂連接修飾等。在一個實施例中,翻譯后修飾包含通過GlcNAc-天冬酰胺鍵將寡糖與天冬酰胺連接在一起(例如,寡糖包含(GlcNAc-Man)2-Man-GlcNAc-GlcNAc等的情形)。在另一實施例中,翻譯后修飾包含通過GalNAc-絲氨酸、GalNAc-蘇氨酸、GlcNAc-絲氨酸或GlcNAc-蘇氨酸鍵將寡糖(例如,Gal-GalNAc、Gal-GlcNAc等)與絲氨酸或蘇氨酸連接在一起。在某些實施例中,本發(fā)明的蛋白質或多肽可包含分泌或定位序列、抗原決定基標簽(epit叩etag)、FLAG標簽、聚組氨酸標簽、GST融合體等。通常,蛋白質與任何可用蛋白質(例如,治療性蛋白質、診斷性蛋白質、工業(yè)酶或其部分等)例如至少60%、至少70%、至少75%、至少80%、至少90%、至少95%或甚至至少99%或99%以上一致,且其包含一個或多個非天然氨基酸。在一個實施例中,本發(fā)明的組合物包括所關注蛋白質或多肽和賦形劑(例如,緩沖液、醫(yī)藥學上可接受的賦形劑等)。所關注蛋白質或多肽可含有至少一個、至少兩個、至少三個、至少四個、至少五個、至少六個、至少七個、至少八個、至少九個或者十個或十個以上非天然氨基酸。非天然氨基酸可相同或不同,例如可在蛋白質中1、2、3、4、5、6、7、8、9、IO個或更多不同位點包含1、2、3、4、5、6、7、8、9、10個或更多不同非天然氨基酸。在某些實施例中,天然存在的蛋白質型式中所存在的至少一個(但少于全部)特定氨基酸經非天然氨基酸取代。蛋白質(或所關注多肽)的實例包括(但不限于)例如,細胞因子、生長因子、生長因子受體、干擾素、白細胞介素、炎癥分子、癌基因產物、肽激素、信號轉導分子、類固醇激素受體、促紅細胞生成素(EPO)、胰島素、人生長激素、a-l抗胰蛋白酶、血管抑素(Angiostatin)、抗溶血因子(Antihemolyticfactor)、抗體、載脂蛋白、脫輔基蛋白、心房利鈉因子、心房利鈉多肽、心房肽、C-X-C趨化因子、T39765、NAP-2、ENA-78、Gro-a、Gro-b、Gro-c、IP-IO、GCP-2、NAP-4、SDF-1、PF4、MIG、降鈣素、c-kit配體、細胞因子、CC趨化因子、單核細胞趨化蛩白-1、單核細胞趨化蛋白-2、單核細胞趨化蛋白-3、單核細胞炎癥蛋白-la、單核細胞炎癥蛋白-l卩、RANTES、1309、R83915、R91733、HCC1、T58847、D31065、T64262、CD40、CD40配體、C-kit配體、膠原蛋白、群落刺激因子(CSF)、補體因子5a、補體抑制劑、補體受體1、細胞因子、DHFR、上皮中性粒細胞活化肽-78、GROa/MGSA、GRO(3、GROy、MIP-la、MIP-1S、MCP-1、表皮生長因子(EGF)、上皮中性粒細胞活化肽、促紅細胞生成素(EPO)、脫落毒素、因子IX、因子VII、因子VIII、因子X、成纖維細胞生長因子(FGF)、纖維蛋白原、纖維粘連蛋白、G-CSF、GM-CSF、葡糖腦苷脂酶、促性腺激素、生長因子、生長因子受體、刺猬蛋白(hedgehogprotein)、血紅蛋白、肝細胞生長因子(HGF)、水蛭素(hirudin)、人血清白蛋白、ICAM-1、ICAM-1受體、LFA-1、LFA-1受體、胰島素、類胰島素生長因子(IGF)、IGF-I、IGF-II、干擾素(IFN)、IFN-a、IFN-(3、IFN卞白細胞介素、IL-1、IL-2、IL-3、IL-4、IL墨5、IL-6、IL-7、IL-8、IL-9、IL-IO、IL-ll、IL-12、角質細胞生長因子(KGF)、乳鐵蛋白、白血病抑制因子、熒光素酶、神經營養(yǎng)因子、中性粒細胞抑制因子(NIF)、抑瘤素M、成骨蛋白、癌基因產物、甲狀旁腺激素、PD-ECSF、PDGF、肽激素、人生長激素、多效生長因子、蛋白質A、蛋白質G、致熱性外毒素A、B或C、松馳素、腎素、SCF、可溶性補體受體I、可溶性I-CAM1、可溶性白細胞介素受體、可溶性TNF受體、生長調節(jié)素、生長抑素、生長激素、鏈激酶、超抗原、葡萄球菌腸毒素、SEA、SEB、SEC1、SEC2、SEC3、SED、SEE、類固醇激素受體、超氧化物歧化酶(SOD)、中毒性休克綜合癥毒素、胸腺肽al、組織型纖溶酶原活化劑、腫瘤生長因子(TGF)、TGF-a、TGF-p、腫瘤壞死因子、腫瘤壞死因子a、腫瘤壞死因子p、腫瘤壞死因子受體(TNFR)、VLA-4蛋白、VCAM-l蛋白、血管內皮生長因子(VEGEF)、尿激酶、Mos、Ras、Raf、Met、p53、Tat、Fos、Myc、Jun、Myb、Rel、雌激素受體、孕酮受體、睪酮受體、醛固酮受體、LDL受體、SCF/c-Kit、CD40L/CD40、VLA-4/VCAM-l、ICAM-1/LFA-1、透明質酸(hyalurin)/CD44、皮質酮、存在于Genebank或其它可用數據庫中的蛋白質等,和/或其部分。在一個實施例中,所關注多肽包括轉錄調節(jié)蛋白(例如,轉錄活化蛋白(諸如GAL4)或轉錄阻遏蛋白等)或其部分。本發(fā)明的脊椎動物細胞提供合成包含大量有用非天然氨基酸的蛋白質的能力。舉例來說,可產生在細胞提取物、緩沖液、醫(yī)藥學上可接受的賦形劑等中濃度為例如至少10微克/升、至少50微克/升、至少75微克/升、至少100微克/升、至少200微克/升、至少250微克/升或至少500微克/升或更多蛋白質的包含非天然氨基酸的蛋白質。在某些實施例中,本發(fā)明的組合物包括例如至少10^g、至少50^g、至少75pg、至少100貼、至少200嗎、至少250嗎或至少500pg或更多包含非天然氨基酸的蛋白質。在某些實施例中,所關注蛋白質或多肽(或其部分)是由核酸編碼。通常,核酸包含至少一個選擇性密碼子、至少兩個選擇性密碼子、至少三個選擇性密碼子、至少四個選擇性密碼子、至少五個選擇性密碼子、至少六個選擇性密碼子、至少七個選擇性密碼子、至少八個選擇性密碼子、至少九個選擇性密碼子或甚至十個或十個以上選擇性密碼子。本發(fā)明還提供用于在脊椎動物細胞中產生至少一種包含至少一個非天然氨基酸的蛋白質的方法(以及由所述方法產生的蛋白質)。所述方法包括例如使包含包括至少一個選擇性密碼子且編碼蛋白質的核酸的脊椎動物細胞在適當培養(yǎng)基中生長。脊椎動物細胞還包含正交tRNA(O-tRNA),其在細胞中起作用并且識別選擇性密碼子;和正交氨?;鵷RNA合成酶(O-RS),其優(yōu)先利用非天然氨基酸將O-tRNA氨?;?;并且所述培養(yǎng)基包含非天然氨基酸。在一個實施例中,O-RS利用非天然氨基酸將O-tRNA氨?;?,這與具有(例如)如SEQIDNO.:86或45中所述序列的氨基酸序列的O-RS例如至少45%、至少50%、至少60%、至少75%、至少80%、至少90%、至少95'%或者甚至99%或99%以上有效。在另一實施例中,0-tRNA包含SEQIDNO.:64或65或者其互補多聚核苷酸序列;由SEQIDNO.:64或65或者其互補多聚核苷酸序列加工;或由SEQIDNO.:64或65或者其互補多聚核苷酸序列編碼。在另一實施例中,O-RS包含如SEQIDNO.:36-63和/或86中任一序列所述的氨基酸序列。在一個實施例中,所述方法另外包括將非天然氨基酸并入蛋白質中,其中所述非天然氨基酸包含第一反應性基團;和使所述蛋白質與包含第二反應性基團的分子(例如,染料、例如聚乙二醇衍生物等聚合物、光交聯(lián)劑、細胞毒性化合物、親和標記、生物素衍生物、樹脂、第二蛋白質或多肽、金屬螯合劑、輔因子、脂肪酸、碳水化合物、多聚核苷酸(例如,DNA、RNA等)等)接觸。第一反應性基團與第二反應性基團反應以通過[3+2]環(huán)加成將所述分子與非天然氨基酸連接。在一個實施例中,第一反應性基團為炔基或疊氮基部分且第二反應性基團為疊氮基或炔基部分。舉例來說,第一反應性基團為炔基部分(例如,在非天然氨基酸對炔丙基氧基苯丙氨酸中)且第二反應性基團為疊氮基部分。在另一實例中,第一反應性基團為疊氮基部分(例如,在非天然氨基酸對疊氮基-L-苯丙氨酸中)且第二反應性基團為炔基部分。在某些實施例中,所編碼的蛋白質包含治療性蛋白質、診斷性蛋白質、工業(yè)酶或其部分。在一個實施例中,由所述方法產生的蛋白質進一步通過非天然氨基酸來得以修飾。舉例來說,例如通過親核-親電反應、[3+2]環(huán)加成等來修飾非天然氨基酸。在另一實施例中,在活體內通過至少一個翻譯后修飾(例如,N-糖基化、O-糖基化、乙?;Ⅴ;⒅|修飾、棕櫚酰化、棕櫚酸鹽加成、磷酸化、糖脂連接修飾等)來修飾由所述方法產生的蛋白質。還提供產生篩選或選擇轉錄調節(jié)蛋白的方法(以及由所述方法產生的篩選或選擇轉錄調節(jié)蛋白)。所述方法包括例如選擇第一多聚核苷酸序列,其中所述多聚核苷酸序列編碼核酸結合結構域;和使所述第一多聚核苷酸序列突變以包括至少一個選擇性密碼子。這將提供篩選或選擇多聚核苷酸序列。所述方法還包括例如選擇第二多聚核苷酸序列,其中所述第二多聚核苷酸序列編碼轉錄活化結構域;提供包含可操作性連接到第二多聚核苷酸序列的篩選或選擇多聚核苷酸序列的構建體;和將所述構建體、非天然氨基酸、正交tRNA合成酶(O-RS)和正交tRNA(O-tRNA)引入細胞中。利用這些組件,0-RS優(yōu)先利用非天然氨基酸將0-tRNA氨?;?,且0-tRNA識別選擇性密碼子,并響應篩選或選擇多聚核苷酸序列中的選擇性密碼子將非天然氨基酸并入核酸結合結構域中。這將提供篩選或選擇轉錄調節(jié)蛋白。在某些實施例中,本發(fā)明的組合物和方法包括脊椎動物細胞。本發(fā)明的脊椎動物細胞包括例如哺乳動物細胞、酵母細胞、真菌細胞、植物細胞、昆蟲細胞等中的任一種。本發(fā)明的翻譯組件可得自多種生物體,例如非脊椎動物生物體,諸如原核生物體(例如,大腸桿菌、嗜熱脂肪芽孢桿菌等)或古細菌;或例如脊椎動物生物體。本發(fā)明的選擇性密碼子將擴充脊椎動物蛋白質生物合成機器的遺傳密碼子框架。多個選擇性密碼子中的任一個可用于本發(fā)明中,包括終止密碼子(例如,琥珀密碼子、赭石密碼子或蛋白石終止密碼子)、無義密碼子、稀有密碼子、四(或更多)堿基密碼子等??捎糜诒疚乃龅慕M合物和方法中的非天然氨基酸的實例包括(但不限于)對-乙?;?L-苯丙氨酸;對-碘-L-苯丙氨酸;O-甲基-L-酪氨酸;對-炔丙基氧基苯丙氨酸;對-炔丙基-苯丙氨酸;L-3-(2-萘基)丙氨酸;3-甲基-苯丙氨酸;0-4-烯丙基-L-酪氨酸;4-丙基-L-酪氨酸;三-O-乙酰基-GlcNAcp-絲氨酸;L-多巴(L-Dopa);氟化苯丙氨酸;異丙基-L-苯丙氨酸;對-疊氮基-L-苯丙氨酸;對-酰基-L-苯丙氨酸;對-苯甲?;?L-苯丙氨酸;L-磷酸絲氨酸;膦?;z氨酸;膦酰基酪氨酸;對-溴苯丙氨酸;對-氨基-L-苯丙氨酸;異丙基-L-苯丙氨酸;酪氨酸氨基酸的非天然類似物;谷氨酰胺氨基酸的非天然類似物;苯丙氨酸氨基酸的非天然類似物;絲氨酸氨基酸的非天然類似物;蘇氨酸氨基酸的非天然類似物;垸基、芳基、?;?、疊氮基、氰基、鹵基、肼、酰肼、羥基、烯基、炔基、醚、硫醇、磺?;⑽?、酯、硫代酸、硼酸酯基(borate)、硼酸酯基(boronate)、磷酸基、膦酸基、膦、雜環(huán)、烯酮、亞胺、醛、羥胺、酮基或氨基取代的氨基酸,或其任何組合;具有可光活化交聯(lián)劑的氨基酸;自旋標記的氨基酸;發(fā)熒光氨基酸;結合金屬的氨基酸;含金屬氨基酸;放射性氨基酸;光籠蔽(photocaged)和/或光致異構化氨基酸;含生物素或生物素類似物氨基酸;含酮基氨基酸;包含聚乙二醇或聚醚的氨基酸;重原子取代的氨基酸;化學可裂解或可光裂解氨基酸;具有伸長側鏈的氨基酸;含有毒基團的氨基酸;糖取代的氨基酸;含碳連接的糖的氨基酸;具有氧化還原活性的氨基酸;含a-羥基的酸;氨基硫代酸;a,a雙取代氨基酸;p-氨基酸;除脯氨酸或組氨酸外的環(huán)狀氨基酸;除苯丙氨酸、酪氨酸或色氨酸外的芳香族氨基酸等。本發(fā)明還提供多肽(O-RS)和多聚核苷酸,例如O-tRNA、編碼O-RS或其部分(例如,合成酶活性位點)的多聚核苷酸、用于構建氨?;?tRNA合成酶突變體的寡聚核苷酸、編碼所關注蛋白質或多肽的包含一個或多個選擇性密碼子的多聚核苷酸等。舉例來說,本發(fā)明的多肽包括包含如SEQIDNO.:36-63和/或86中任一序列中所述的氨基酸序列的多肽;包含由如SEQIDNO.:3-35中任一序列所述的多聚核苷酸序列編碼的氨基酸序列的多肽;以及與對包含如SEQIDNO.:36-63和/或86中任一序列中所示的氨基酸序列的多肽具特異性的抗體特異性免疫反應的多肽;或包含由如SEQIDNO.:3-35中任一序列所示的多聚核苷酸序列編碼的氨基酸序列的多肽。本發(fā)明的多肽中還包括包含與天然存在的酪氨酰基氨?;?tRNA合成酶(TyrRS)的氨基酸序列(例如,SEQIDNO.:2)至少90%—致的氨基酸序列且包含兩個或兩個以上A-E組(上文所述)氨基酸的多肽。類似地,本發(fā)明的多肽還任選包括包含SEQIDNO.:36-63和/或86中任一序列的至少20個相鄰氨基酸以及兩個或兩個以上如上文在A-E組中所述的氨基酸取代的多肽。還包括包含任一上述多肽的保守變異體的氨基酸序列作為本發(fā)明的多肽。在一個實施例中,組合物包括本發(fā)明的多肽和賦形劑(例如,緩沖液、水、醫(yī)藥學上可接受的賦形劑等)。本發(fā)明還提供與本發(fā)明的多肽特異性免疫反應的抗體或抗血清。本發(fā)明中還提供多聚核苷酸。本發(fā)明的多聚核苷酸包括具有一個或多個選擇性密碼子的編碼本發(fā)明的所關注蛋白質或多肽的多聚核苷酸。此外,本發(fā)明的多聚核苷酸包括例如包含如SEQIDNO.:3-35、64-85中任一序列所述的核苷酸序列的多聚核苷酸;與其多聚核苷酸序列互補或編碼其多聚核苷酸序列的多聚核苷酸;和/或編碼包含如SEQIDNO.:36-63和/或86中任一序列中所述的氨基酸序列的多肽的多聚核苷酸,或其保守變異體。本發(fā)明的多聚核苷酸還包括編碼本發(fā)明的多肽的多聚核苷酸。類似地,在高度嚴格條件下在實質上整個核酸長度上與上文所述的多聚核苷酸雜交的核酸為本發(fā)明的多聚核苷酸。本發(fā)明的多聚核苷酸還包括編碼多肽的多聚核苷酸,所述多肽包含與天然存在的酪氨?;滨;?tRNA合成酶(TyrRS)的氨基酸序列(例如,SEQIDNO.:2)至少90%—致的氨基酸序列且包含兩個或兩個以上如上文在A-E組(上文指出)中所述的突變。本發(fā)明的多聚核苷酸中還包括與上文所述的多聚核苷酸至少70%(或至少75%、至少80%、至少85%、至少90%、至少95%、至少98%或至少99%或更多)一致的多聚核苷酸,和/或包含任一上文所述的多聚核苷酸的保守變異體的多聚核苷酸。在某些實施例中,載體(例如,質粒、柯斯質粒(cosmid)、噬菌體、病毒等)包含本發(fā)明的多聚核苷酸。在一個實施例中,載體為表達載體。在另一實施例中,表達載體包括可操作性連接到一個或多個本發(fā)明的多聚核苷酸的啟動子。在另一實施例中,細胞包含包括本發(fā)明的多聚核苷酸的載體。另一方面,本發(fā)明提供化合物的組合物和制造所述化合物的方法。舉例來說,化合物包括例如非天然氨基酸(諸如對-(炔丙基氧基)-苯丙氨酸(例如,圖11中的l));疊氮基染料(諸如化學結構4和化學結構6中所示);炔基聚乙二醇(例如,如化學結構7中所示),其中n為介于例如50與10,000之間、75與5,000之間、100與2,000之間、100與1,000之間等的整數等。在本發(fā)明的實施例中,炔基聚乙二醇具有例如約5,000到約100,000Da、約20,000到約50,000Da、約20,000到約10,000Da(例如,20,000Da)的分子量。還提供包含這些化合物,例如具有蛋白質和細胞的各種組合物。一方面,包括對-(炔丙基氧基)-苯丙氨酸非天然氨基酸的組合物進一步包括正交tRNA。可將非天然氨基酸與正交tRNA鍵接(例如共價鍵接),例如通過氨?;I與正交tRNA共價鍵接、與正交tRNA的末端核糖的3'0H或2'OH共價鍵接。試劑盒也為本發(fā)明的特征。舉例來說,提供在細胞中產生包含至少一個非天然氨基酸的蛋白質的試劑盒,其中所述試劑盒包括含有編碼O-tRNA的多聚核苷酸序列或O-tRNA以及編碼O-RS的多聚核苷酸序列或O-RS的容器。在一個實施例中,試劑盒另外包括至少一個非天然氨基酸。在另一實施例中,試劑盒另外包含用于產生蛋白質的說明材料。圖1表示使用雜合tRNA使hGH的表達增加。具體實施例方式在詳細描述本發(fā)明之前,應了解,本發(fā)明不限于特定裝置或生物系統(tǒng),其當然可以變化。還應了解,本文所使用的術語只是出于描述特定實施例的目的,并且不打算限制本發(fā)明。除非內容另作明確指示,否則如本說明書和隨附權利要求中所使用,單數形式"一"和"所述"包括多個參考物。因此,例如提及"一細胞"包括兩個或兩個以上細胞的組合;提及"細菌"包括細菌混合物等。除非本文或下文說明書的剩余部分中另作定義,否則本文所使用的所有科技術語都具有與本發(fā)明所屬領域技術人員通常所了解相同的含義。同源:當蛋白質和/或蛋白質序列是天然或以人工方式從共同的祖先蛋白質或蛋白質序列得到時,其為"同源"的。類似地,當核酸和/或核酸序列是天然或以人工方式從共同的祖先核酸或核酸序列得到時,其為同源的。舉例來說,可通過任何可用的誘變方法來修飾任何天然存在的核酸以使其包括一個或多個選擇性密碼子。當表達時,這一經誘變核酸將編碼包含一個或多個非天然氨基酸的多肽。當然,突變方法可另外改變一個或多個標準密碼子,從而也使所得突變蛋白質中的一個或多個標準氨基酸改變。同源性一般是從兩種或兩種以上核酸或蛋白質(或其序列)之間的序列相似性推斷得出??捎糜诖_定同源性的序列之間相似性的確切百分比隨所討論的核酸和蛋白質而變化,但通常使用僅25%的序列相似性來確定同源性。較高的序列相似性水平(例如,30%、40%、50%、60%、70%、80%、90%、95%或99%或更多)也可用于確定同源性。測定序列相似性百分比的方法(例如,使用默認參數的BLASTP禾nBLASTN)在本文中得以描述并且一般可用。正交:如本文所使用,術語"正交"是指與對于細胞或翻譯系統(tǒng)為內源的相應分子相比,以降低的效率利用細胞的內源性組件起作用,或者無法利用細胞的內源性組件起作用的分子(例如,正交tRNA(O-tRNA)和/或正交氨?;鵷RNA合成酶(O-RS))。在tRNA和氨?;?tRNA合成酶的情況下,正交是指與利用內源性tRNA合成酶起作用的內源性tRNA相比,正交tRNA無法利用內源性tRNA合成酶起作用或以降低的效率(例如,低于20%的效率、低于10%的效率、低于5%的效率或低于1%的效率)利用內源性tRNA合成酶起作用;或者與利用內源性tRNA起作用的內源性tRNA合成酶相比,正交氦?;?tRNA合成酶無法利用內源性tRNA起作用或以降低的效率(例如,低于20%的效率、低于10%的效率、低于5%的效率或低于1%的效率)利用內源性tRNA起作用。正交分子在細胞中缺乏功能性內源互補分子。舉例來說,當與通過內源性RS將內源性tRNA氨?;啾容^時,細胞中的任何內源性RS以降低的效率或甚至為零的效率將所述細胞中的正交tRNA氨?;?。在另一實例中,當與通過內源性RS將內源性tRNA氨?;啾容^時,正交RS以降低的效率或甚至為零的效率將所關注細胞中的任何內源性tRNA氨?;?。可將第二正交分子引入細胞中從而與第一正交分子一起作用。舉例來說,正交tRNA/RS對包括所引入的在細胞中相對于相應內源性tRNA/RS對以一定效率(例如,50%效率、60%效率、70%效率、75%效率、80%效率、90%效率、95%效率或99%或更高效率)一起作用的互補組件?;パa:術語"互補"是指可一起作用的正交對O-tRNA與O-RS的組件,例如其中O-RS將O-tRNA氨酰化。優(yōu)先氨酰化:術語"優(yōu)先氨?;?是指與O-RS將天然存在的tRNA或用于產生O-tRNA的原材料氨?;啾?,O-RS利用非天然氨基酸將O-tRNA氨?;男?,例如70%效率、75%效率、85%效率、卯%效率、95%效率或99%或更高效率。將非天然氨基酸以高保真度,例如以對指定選擇性密碼子高于75%的效率、對指定選擇性密碼子高于約80%的效率、對指定選擇性密碼子高于約90%的效率、對指定選擇性密碼子高于約95%的效率或對指定選擇性密碼子高于約99%或更高效率并入正在生長的多肽鏈中。選擇性密碼子:術語"選擇性密碼子"是指在翻譯過程中由O-tRNA識別且不被內源性tRNA識別的密碼子。O-tRNA反密碼子環(huán)識別mRNA上的選擇性密碼子并且在多肽中的這一位點并入其氨基酸,例如非天然氨基酸。選擇性密碼子可例如包括無義密碼子,諸如終止密碼子,例如琥珀密碼子、赭石密碼子和蛋白石密碼子;四個或四個以上堿基的密碼子;稀有密碼子;從天然或非天然堿基對獲得的密碼子等。抑制性tRNA:抑制性tRNA是(例如)通過提供響應選擇性密碼子將氨基酸并入多肽鏈的機制來改變指定翻譯系統(tǒng)中信使RNA(mRNA)的閱讀的tRNA。舉例來說,抑制性tRNA可通讀例如終止密碼子、四堿基密碼子或稀有密碼子等??芍貜屠胻RNA:術語"可重復利用tRNA"是指在翻譯期間經氨?;铱衫冒被?例如非天然氨基酸)反復地再氨?;詫⑺霭被?例如非天然氨基酸)并入一個或多個多肽鏈中的tRNA。翻譯系統(tǒng):術語"翻譯系統(tǒng)"是指將天然存在的氨基酸并入正在生長的多肽鏈(蛋白質)的組件集合。翻譯系統(tǒng)的組件可包括例如核糖體、tRNA、合成酶、mRNA、氨基酸等。本發(fā)明的組件(例如,ORS、OtRNA、非天然氨基酸等)可添加到活體外或活體內翻譯系統(tǒng)中,例如脊椎動物細胞,例如酵母細胞、哺乳動物細胞、植物細胞、藻類細胞、真菌細胞、昆蟲細胞等。非天然氨基酸:如本文所使用,術語"非天然氨基酸"是指不為20種常見的天然存在的氨基酸中的一種或者硒代半胱氨酸或吡咯賴氨酸的任何氨基酸、經修飾氨基酸和/或氨基酸類似物。得自:如本文所使用,術語"得自"是指從特定分子或生物體分離或者使用來自特定分子或生物體的信息制得的組件。無活性RS:如本文所使用,術語"無活性RS"是指已突變以致其無法再利用氨基酸將其天然同源tRNA氨?;暮铣擅?。正選擇或篩選標記:如本文所使用,術語"正選擇或篩選標記"是指當存在(例如,經表達、經活化等)時導致將具有正選擇標記的細胞從不具有正選擇標記的細胞中鑒別出的標記。負選擇或篩選標記:如本文所使用,術語"負選擇或篩選標記"是指當存在(例如,經表達、經活化等)時使得鑒別出不具有所需特性(例如,當與具有所需特性的細胞相比較時)的細胞的標記。報告基因:如本文所使用,術語"報告基因"是指可用于選擇所關注系統(tǒng)中的靶組件的組件。舉例來說,報告基因可包括熒光篩選標記(例如,綠色熒光蛋白質);發(fā)光標記(例如,螢火蟲熒光素酶蛋白);基于親和力的篩選標記;或可選擇標記基因,諸如his3、ura3、leu2、lys2、lacZ、卩-gal/lacZ(卩-半乳糖苷酶)、Adh(醇脫氫酶)等。脊椎動物:如本文所使用,術語"脊椎動物"是指屬于系統(tǒng)發(fā)生域真核生物的生物體,諸如動物,例如哺乳動物、爬行動物、鳥類等。非真核生物:如本文所使用,術語"非真核生物"是指非脊椎動物生物體。舉例來說,非脊椎動物生物體可屬于真細菌(例如,大腸桿菌(&c/^n'c/n'aco/0、極端嗜熱細菌(JTzermiw^2erwo/7/n'"csO、嗜熱月旨肪芽孢桿菌CBoci//^WeaTO/7^r附op/n7iiy)等)系統(tǒng)發(fā)生域;或古細菌(例如,詹氏甲垸球菌(MW/m"oeoccMya朋oyc/n'z')、嗜熱自養(yǎng)甲烷桿菌(Me^377o6a"en'wwAenw)m^Wra;^/cww)、諸如沃氏嗜鹽富饒菌(i/a/o/eraxw/cam'0禾Q嗜鹽菌屬iViC-7(i7a/o6a"en'wwspeciesiViC-7)的嗜鹽菌(//a/o6a"eW謂)、超嗜熱古菌dc/aeog/o6iw/w/gzWiw)、強烈嗜熱球菌(尸戸cocciw)、極端嗜熱古菌(尸戶coccus/zo"'A:(^W)、嗜熱泉生古細菌"ewrap>T,j^mfjc)等)系統(tǒng)發(fā)生域??贵w:如本文所使用,術語"抗體"包括(但不限于)實質上由一個或多個特異性結合并識別分析物(抗原)的免疫球蛋白基因或其片段所編碼的多肽。實例包括多克隆抗體、單克隆抗體、嵌合抗體和單鏈抗體等。如本文所使用的術語"抗體"中也包括免疫球蛋白的片段,包括Fab片段和由表達文庫(包括噬菌體呈現)所產生的片段。有關抗體結構和技術例如參看Paul,Fwm/ame"to//mw朋o/o狄第4版,1999,RavenPress,NewYork。保守變異體:術語"保守變異體"是指在功能上與得到保守變異體的組件(例如O-tRNA或O-RS)類似但序列變異的翻譯組件,例如保守變異體O-tRNA或保守變異體O-RS。舉例來說,O-RS將利用非天然氨基酸將互補O-tRNA或保守變異體O-tRNA氨?;?,但所述O-tRNA和所述保守變異體O-tRNA不具有相同序列。保守變異體的序列可具有例如一處變異、兩處變異、三處變異、四處變異或者五處或五處以上變異,只要保守變異體與相應O-tRNA或O-RS互補即可。選擇或篩選劑:如本文所使用,術語"選擇或篩選劑"是指當存在時允許從群體中選擇/篩選某些組件的試劑。舉例來說,選擇或篩選劑例如包括(但不限于)養(yǎng)分、抗生素、光波長、抗體、經表達多聚核苷酸(例如,轉錄調節(jié)蛋白)等。可例如通過濃度、強度等來改變選擇劑??蓹z測物質:如本文所使用,術語"可檢測物質"是指當經活化、改變、表達等時允許從群體中選擇/篩選出某些組分的試劑。舉例來說,可檢測物質可為化學劑,例如5-氟乳清酸(5-FOA),其在某些條件下,例如表達URA3報告基因時,變?yōu)槔鐨⑺辣磉_URA3報告基因的細胞的可檢測的有毒產物。除由遺傳密碼所強加的化學約束外,直接在脊椎動物細胞中基因修飾蛋白質結構的能力將提供探查和操縱細胞過程的有力的分子工具。本發(fā)明提供擴充脊椎動物細胞中基因編碼的氨基酸數量的翻譯組件。其包括tRNA(例如,正交tRNA(O-tRNA))、氨?;?tRNA合成酶(例如,正交合成酶(O-RS))、O-tRNA/0-RS對和非天然氨基酸。通常,有效地表達和加工本發(fā)明的O-tRNA且其在脊椎動物細胞中的翻譯過程中起作用,但不會被宿主的氨?;?tRNA合成酶有效氮?;T趍RNA翻譯期間,本發(fā)明的O-tRNA響應選擇性密碼子將不編碼常見20種氨基酸中的任一種的非天然氨基酸遞送到正在生長的多肽鏈中。本發(fā)明的O-RS在脊椎動物細胞中優(yōu)先利用非天然氨基酸將本發(fā)明的O-tRNA氨?;?,但不會將任何細胞質中宿主的tRNA氨?;?。此外,本發(fā)明的氨?;?tRNA合成酶的特異性使得能接受非天然氨基酸,同時排除任何內源性氨基酸。包括例如O-RS的氮基酸序列的多肽或其部分也為本發(fā)明的特征。此夕卜,編碼翻譯組件0-tRNA、0-RS和其部分的多聚核苷酸為本發(fā)明的特征。本發(fā)明還提供產生所需翻譯組件(例如)O-RS和或正交對(正交tRNA和正交氨?;?tRNA合成酶)的方法,所述正交對利用非天然氨基酸用于脊椎動物細胞中,(和由所述方法產生的翻譯組件)。舉例來說,來自大腸桿菌的酪氨酰-tRNA合成酶/tRNAcuA對為本發(fā)明的0-tRNA/0-RS對。此外,本發(fā)明還提供在一種脊椎動物細胞中選擇/篩選翻譯組件并且當選擇/篩選后將這些組件用于不同脊椎動物細胞(未用于選擇/篩選的脊椎動物細胞)中的方法。舉例來說,可在酵母(例如釀酒酵母(Sacc/zaTOmyc^ce^v^'ae))中進行產生用于脊椎動物細胞的翻譯組件的選擇/篩選方法,且隨后可將這些所選組件用于另一脊椎動物細胞中,例如另一酵母細胞、哺乳動物細胞、昆蟲細胞、植物細胞、真菌細胞等。本發(fā)明進一步提供在脊椎動物細胞中產生蛋白質的方法,其中所述蛋白質包含非天然氨基酸。所述蛋白質是使用本發(fā)明的翻譯組件產生。本發(fā)明還提供包括非天然氨基酸的蛋白質(和由本發(fā)明的方法產生的蛋白質)。所關注蛋白質或多肽還可包括翻譯后修飾,其例如是通過[3+2]環(huán)加成或親核-親電反應添加,并非由原核細胞所產生等。在某些實施例中,利用非天然氨基酸產生轉錄調節(jié)蛋白的方法(和由所述方法產生的蛋白質)也都包括在本發(fā)明中。包括包含非天然氨基酸的蛋白質的組合物也為本發(fā)明的特征。用于產生具有非天然氨基酸的蛋白質或多肽的試劑盒也為本發(fā)明的特征。正交氨酰基-TRNA合成酶(O-RS)為了將非天然氨基酸特異性并入脊椎動物細胞中的所關注蛋白質或多肽中,將改變合成酶的底物特異性,以致僅將所需非天然氨基酸而非常見20種氨基酸中任一種裝入tRNA中。如果正交合成酶混雜,那么其將產生在耙位置具有天然與非天然氨基酸的混合物的突變蛋白質。本發(fā)明提供對特定非天然氨基酸具有經修飾的底物特異性的正交氨?;?tRNA合成酶的組合物以及產生所述合成酶的方法。包括正交氨?;?tRNA合成酶(O-RS)的脊椎動物細胞為本發(fā)明的特征。O-RS在脊椎動物細胞中優(yōu)先利用非天然氨基酸將正交tRNA(0-tRNA)氨?;T谀承嵤├?,O-RS利用一個以上非天然氨基酸,例如兩個或兩個以上、三個或三個以上等。因此,本發(fā)明的O-RS可具有優(yōu)先利用不同非天然氨基酸將O-tRNA氨酰化的能力。這允許通過選擇將何種非天然氨基酸或非天然氨基酸組合放于細胞中和/或通過選擇不同量的放于細胞中的非天然氨基酸以供其并入來達到另一層面的控制。本發(fā)明的0-RS任選具有一種或多種相比天然氨基酸改進或增強的針對非天然氨基酸的酶特性。這些特性包括例如與天然存在的氨基酸(例如,20種己知常見氨基酸中的一種)相比較,針對非天然氨基酸的較高Km、較低Km、較高kcat、較低kcat、較低kcat/km、較高kcat/km等??扇芜x通過包括O-RS的多肽和/或編碼O-RS或其部分的多聚核苷酸將O-RS提供到脊椎動物細胞中。舉例來說,O-RS或其部分是由如SEQIDNO.:3-35中任一序列所述的多聚核苷酸序列或其互補多聚核苷酸序列編碼。在另一實例中,O-RS包含如SEQIDNO.:36-63和/或86中任一序列所述的氨基酸序列,或其保守變異體。關于例示性O-RS分子的序列,例如參看本文中表5、6和8以及實例6。O-RS還可包含與天然存在的酪氨?;滨;?tRNA合成酶(TyrRS)的氨基酸序列(例如,如SEQIDNO.:2中所述)例如至少90%、至少95%、至少98%、至少99%或甚至至少99.5%—致且包含兩個或兩個以上A-E組的氨基酸的氨基酸序列。A組包括在與大腸桿菌TyrRS的Tyr37對應的位置的纈氨酸、異亮氨酸、亮氨酸、甘氨酸、絲氨酸、丙氨酸或蘇氨酸;B組包括在與大腸桿菌TyrRS的Asnl26對應的位置的天冬氨酸;C組包括在與大腸桿菌TyrRS的Asp182對應的位置的蘇氨酸、絲氨酸、精氨酸、天冬酰胺或甘氨酸;D組包括在與大腸桿菌TyrRS的Phel83對應的位置的甲硫氨酸、丙氨酸、纈氨酸或酪氨酸;且E組包括在與大腸桿菌TyrRS的Leul86對應的位置的絲氨酸、甲硫氨酸、纈氨酸、半胱氨酸、蘇氨酸或丙氨酸。除0-RS外,本發(fā)明的脊椎動物細胞還可包括其它組件,例如非天然氨基酸。脊椎動物細胞還包括正交tRNA(O-tRNA)(例如,得自非脊椎動物生物體,諸如大腸桿菌、嗜熱脂肪芽孢桿菌等),其中O-tRNA識別選擇性密碼子且優(yōu)先通過O-RS利用非天然氨基酸氨酰化。所述細胞中還可存在包含編碼所關注多肽的多聚核苷酸的核酸,其中所述多聚核苷酸包含由O-tRNA識別的選擇性密碼子或者一個或多個所述密碼子的組合。一方面,O-tRNA例如以至少45%、至少50%、至少60%、至少75%、至少80%、至少卯%、至少95%或99%的包含如SEQIDNO.:65中所述的多聚核苷酸序列或由如SEQIDNO.:65中所述的多聚核苷酸序列加工的tRNA的效率,介導將非天然氨基酸并入蛋白質中。另一方面,O-tRNA包含SEQIDNO.:65,且O-RS包含SEQIDNO.:36-63和/或86中任一序列中所述的多肽序列和/或其保守變異體。關于例示性O-RS和O-tRNA分子的序列,也例如參看本文中表5和實例6。在一個實例中,脊椎動物細胞包含正交氨酰基-tRNA合成酶(O-RS)、正交tRNA(O-tRNA)、非天然氨基酸和包含編碼所關注多肽的多聚核苷酸的核酸,所述多聚核苷酸包含由O-tRNA識別的選擇性密碼子。在脊椎動物細胞中,O-RS優(yōu)先利用非天然氨基酸將正交tRNA(O-tRNA)氨酰化,且所述細胞在不存在非天然氨基酸的情況下以一定產率產生所關注多肽,所述產率例如為在存在非天然氨基酸的情況下多肽產率的不到30%、不到20%、不到15%、不到10%、不到5%、不到2.5%等。用于產生O-RS的方法(其為本發(fā)明的特征)任選包括由野生型合成酶框架產生突變合成酶池,且隨后根據相對于常見20種氨基酸,針對非天然氨基酸的特異性選擇突變RS。為分離出所述合成酶,其選擇方法(i)敏感,因為由最初幾回合得到的所需合成酶的活性較低且群體較?。?ii)"可調",因為需要以不同選擇回合改變選擇嚴格度;和(iii)通用,以致所述方法可用于不同非天然氨基酸。在脊椎動物細胞中產生優(yōu)先利用非天然氨基酸將正交tRNA氨酰化的正交氨?;?tRNA合成酶(0-RS)的方法通常包括應用正選擇隨后負選擇的組合。在正選擇過程中,抑制正標記非必需位置處所引入的選擇性密碼子將使脊椎動物細胞能在正選擇壓力下存活。因此,在存在非天然氨基酸的情況下,存活細胞編碼將非天然氨基酸裝于正交抑制tRNA的活性合成酶。在負選擇的過程中,抑制負標記非必需位置處所引入的選擇性密碼子將去除具有天然氨基酸特異性的合成酶。負選擇和正選擇的存活細胞編碼只能(或至少優(yōu)先)利用非天然氨基酸將正交抑制tRNA氨酰化(裝入)的合成酶。舉例來說,所述方法包括(a)在存在非天然氨基酸的情況下,使第一物種的脊椎動物細胞群經歷正選擇,其中所述脊椎動物細胞各自包含i)氨?;?tRNA合成酶(RS)文庫成員,ii)正交tRNA(O-tRNA),iii)編碼正選擇標記的多聚核苷酸和iv)編碼負選擇標記的多聚核苷酸;其中在正選擇下存活的細胞包含在存在非天然氨基酸的情況下將正交tRNA(O-tRNA)氨?;幕钚訰S;和(b)在不存在非天然氨基酸的情況下,使在正選擇下存活的細胞經歷負選擇,以除去利用天然氨基酸將O-tRNA氨?;幕钚訰S,從而提供優(yōu)先利用非天然氨基酸將O-tRNA氨?;腛墨RS。正選擇標記可為多種分子中的任一個。在一個實施例中,正選擇標記為提供營養(yǎng)補充以供生長的產物,并且所述選擇是在缺乏所述營養(yǎng)補充的培養(yǎng)基上執(zhí)行。編碼正選擇標記的多聚核苷酸的實例包括(但不限于)例如基于補充細胞的氨基酸營養(yǎng)缺陷的報告基因、his3基因(例如,其中所述his3基因編碼咪唑甘油磷酸酯脫水酶,通過提供3-氨基三唑(3-AT)檢測)、ura3基因、leu2基因、lys2基因、lacZ基因、adh基因等。例如參看G.M.Kishore,&D.M.Shah,(1988),爿/m'mflcft/6/os^"Ae^iw/n'i^ons<xs/zerWcit/eAAnnualReviewofBiochemistry57:627-663。在一個實施例中,通過鄰-硝基苯基-P-D-半乳糖吡喃糖苷(ONPG)水解檢測lacZ產生。例如參看I.G.Serebriiskii,&E.A.Golemis,(2000),t/^sto加辦/wwc/7cw..ev"/wa/7'卵o/Z)"a-ga/ac加/(i(xyeawa,ewp/oyed/"/7eyeaW/>v<-/i_y6rzW手"w,AnalyticalBiochemistry285:1-15。其它正選擇標記包括例如熒光素酶、綠色熒光蛋白質(GFP)、YFP、EGFP、RFP、抗生素抗性基因的產物(例如,氯霉素乙酰轉移酶(CAT))、轉錄調節(jié)蛋白(例如GAL4)等。編碼正選擇標記的多聚核苷酸任選包含選擇性密碼子。可將編碼正選擇標記的多聚核苷酸可操作性連接到反應元件。還可存在另一多聚核苷酸,其編碼調節(jié)由反應元件進行的轉錄的轉錄調節(jié)蛋白且包含至少一個選擇性密碼子。通過經非天然氨基酸氨酰化的O-tRNA將非天然氨基酸并入轉錄調節(jié)蛋白中,將引起編碼正選擇標記的多聚核苷酸(例如報告基因)的轉錄。選擇性密碼子任選位于編碼轉錄調節(jié)蛋白的DNA結合結構域的多聚核苷酸的一部分中或實質上鄰近編碼轉錄調節(jié)蛋白的DNA結合結構域的多聚核苷酸的一部分。還可將編碼負選擇標記的多聚核苷酸可操作性連接到反應元件,轉錄調節(jié)蛋白將通過所述反應元件介導轉錄。例如參看A丄DeMaggio等人,(2000),77ze,"W■^/"-/y^nW^We附'MethodEnzymol.328:128-137;H.M.Shih等人,(1996),^jrow."ve附w/a/7'o"x/7za^(Xwoc/Wo"w"/z/7zecoa"/v加rC5尸'Proc.Natl.Acad.Sci.U.S.A.93:13896-13901;M.Vidal等人,(1996),GeweO'cc/zarflCe"'zfl/z》wo/aj^Y)feiW"pro/eiwiw&rac/iowdomain&yw^"ga少eas1/reversefwo-/y^rz'<is少s/"e附./co/n附ew(/,Proc.Natl.Acad.Sci.U.S.A.93:10321-10326;和M.Vidal等人,(1996),DiV^-jWo/^fwz'""rfl"/o"s./co附wg"/7'Proc.Natl.Acad.Sci.U.S.A.93:10315-10320。通過經天然氨基酸氨?;腛-tRNA將天然氨基酸并入轉錄調節(jié)蛋白中,將引起負選擇標記的轉錄。負選擇標記任選包含選擇性密碼子。在一個實施例中,本發(fā)明的正選擇標記和/或負選擇標記可包含至少兩個選擇性密碼子,其各自或都可包含至少兩個不同選擇性密碼子或至少兩個相同選擇性密碼子。轉錄調節(jié)蛋白為結合(直接或間接)核酸序列(例如,反應元件)且調節(jié)可操作性連接到反應元件的序列的轉錄的分子。轉錄調節(jié)蛋白可為轉錄活化蛋白(例如,GAL4、核激素受體、AP1、CREB、LEF/tcf家族成員、SMAD、VP16、SP1等)、轉錄阻遏蛋白(例如,核激素受體、Groucho/tle家族、Engrailed家族等)或可視環(huán)境而具有兩種活性的蛋白質(例如LEF/tcf、同源異型盒蛋白等)。反應元件通常為轉錄調節(jié)蛋白所識別的核酸序列或與轉錄調節(jié)蛋白一起作用的額外試劑。轉錄調節(jié)蛋白的另一實例為轉錄活化蛋白GAL4。例如參看A.Laughon等人,(1984),她"/7yca"'o"o/fwo/rato.似ewcocfed/7zeSacc/zar固ycescewWw'aeg墮,Molecular&CellularBiology4:268-275;A.Laughon,&R.F.Gesteland,(1984),戶n.wflrysfrwc/i^eo//7zeiSacc/zarowycescerev/w.aeCL4丄4ge"e.Molecular&CellularBiology4:260-267;L.Keegan等人,(1986),鄉(xiāng)固麵ZWJ/raw/"mracrip"o"-(2"/w^'"g/kwWonaveWe6mferegw/atory/rato'",Science231-.699-704;禾卩M.Ptashne,(1988),i/oww"e6ra^Zra""〃;p"o"a/ac"》WonyNature335:683-689。此881個氨基酸的蛋白質的N末端147個氨基酸形成特異性結合DNA序列的DNA結合結構域(DBD)。例如參看M.Carey等人,(1989),J"fl冊'朋-"rm&a//ragwe"/1o/04Z^DA^(a^'mer,J.Mol.Biol.209:423-432;和E.Giniger等人,(1985),印e"ycD假6z'ndz'"gapo礎veregw/a^yprate/"o/,賦Cell40:767-774。DBD通過插入蛋白質序列連接到當結合DNA時可活化轉錄的C末端113個氨基酸的活化結構域(AD)。例如參看J.Ma,&M.Ptashne,(1987),"e/"z'o"朋fl(yw^o/(X4丄4fife/"es/"wotra似cr/p"o"(2/ac/traZi"gsegme"&,Cell48:847-853;禾口J.Ma,&M.Ptashne,(1987),77zecar6o;c_y-/"e7-OTZ"a/30am/"oo/G^丄4arerecogw.zet/6}CL4丄S0,Cell50:137-142。將琥珀密碼子朝向例如含有GAL4的N末端DBD和其C末端AD的單一多肽的N末端DBD放置,可將由O-tRNA/O-RS對執(zhí)行的琥珀抑制連接到由GAL4執(zhí)行的轉錄活化??墒褂肎AL4活化的報告基因以利用所述基因執(zhí)行正選擇和負選擇。用于負選擇的培養(yǎng)基可包含轉化成通過負選擇標記可檢測的物質的選擇或篩選劑。在本發(fā)明一方面中,可檢測物質為有毒物質。編碼負選擇標記的多聚核苷酸可例如為ura3基因。舉例來說,可將URA3報告基因置于含有GAL4DNA結合位點的啟動子的控制下。當例如通過翻譯編碼具有選擇性密碼子的GAL4的多聚核苷酸產生負選擇標記時,GAL4將活化URA3的轉錄。在包含5-氟乳清酸(5-FOA)的培養(yǎng)基上實現負選擇,所述5-FOA將經ura3基因的基因產物轉化成可檢測物質(例如,殺死細胞的有毒物質)。例如參看J.D.Boeke等人,(1984),jw/""o"/or腦W腦'加"ce,Molecular&GeneralGenetics197:345-346;M.Vidal等人,(1996),yeastreverses3Ay"附./c0附附en(/,Proc.Natl.Acad.Sci.U.S.A.93:10321-10326;禾口M.Vidal等人,(1996),i譜,/wo-一"(iam/騰-一"Ws,慰6fe/^cfcZ/5^ocz'a/7'o"o//n/"e/"-;"o/"e/wa"fiDA^4-pro/^z'"z'nferac/iows,/co附附e"(/,Proc.Natl.Acad.Sci.U.S.A.93:10315-10320。與正選擇標記相同,負選擇標記也可為多種分子中的任一個。在一個實施例中,正選擇標記和/或負選擇標記為在存在適當反應物的情況下發(fā)熒光或催化發(fā)光反應的多肽。舉例來說,負選擇標記包括(但不限于)例如熒光素酶、綠色熒光蛋白質(GFP)、YFP、EGFP、RFP、抗生素抗性基因的產物(例如,氯霉素乙酰轉移酶(CAT))、lacZ基因的產物、轉錄調節(jié)蛋白等。在本發(fā)明一方面中,通過熒光活化細胞分選(FACS)或通過發(fā)光來檢測正選擇標記和/或負選擇標記。在另一實例中,正選擇標記和/或負選擇標記包含基于親和力的篩選標記。同一多聚核苷酸可編碼正選擇標記和負選擇標記。其它水平的選擇/篩選嚴格度也可用于本發(fā)明方法中。在產生O-RS的方法的一個或兩個步驟中可改變選擇或篩選嚴格度。這可包括例如改變編碼正選擇和/或負選擇標記的多聚核苷酸中反應元件的量;將不同量的無活性合成酶添加到一個或兩個步驟中;改變所使用的選擇/篩選劑的量等。還可執(zhí)行額外回合的正和/或負選擇。選擇或篩選也可包含一次或多次正或負選擇或篩選,所述選擇或篩選包括例如氨基酸滲透性的改變、翻譯效率的改變、翻譯保真度的改變等。通常,一種或多種改變是建立在一個或多個包含或編碼用于產生蛋白質的正交tRNA-tRNA合成酶對組件的多聚核苷酸突變的基礎上。還可使用模型富集研究從過量無活性合成酶中迅速選擇活性合成酶??蛇M行正和/或負模型選擇研究。舉例來說,將包含潛在活性氨?;?tRNA合成酶的脊椎動物細胞與不同倍數過量的無活性氨酰基-tRNA合成酶混合。在生長于非選擇性培養(yǎng)基中并例如通過X-GAL覆蓋分析的細胞與生長于選擇性培養(yǎng)基(例如,在不存在組氨酸和/或尿嘧啶的情況下)中且能存活并例如通過X-GAL分析的細胞之間進行比率比較。對于負選擇模型,將潛在活性氨?;?tRNA合成酶與不同倍數過量的無活性氨?;?tRNA合成酶混合,并利用例如5-FOA等負選擇物質執(zhí)行選擇。通常,RS文庫(例如,突變型RS文庫)包含由例如來自非脊椎動物生物體的至少一種氨酰基-tRNA合成酶(RS)得到的RS。在一個實施例中,RS文庫是得自無活性RS,例如其中無活性RS是通過使活性RS例如在所述合成酶的活性位點、所述合成酶的編輯機制位點、由組合合成酶的不同結構域得到的不同位點等突變而產生。舉例來說,使RS活性位點中的殘基突變成例如丙氨酸殘基。將編碼丙氨酸突變的RS的多聚核苷酸用作模板,以將丙氨酸殘基誘變?yōu)樗?0種氨基酸。選擇/篩選突變型RS的文庫以產生O-RS。在另一實施例中,無活性RS包含氨基酸結合袋并且一個或多個包含所述結合袋的氨基酸經一個或多個不同氨基酸取代。在一個實例中,經取代氨基酸是經丙氨酸取代。任選將編碼丙氨酸突變的RS的多聚核苷酸用作模板以將丙氨酸殘基誘變?yōu)樗?0種氨基酸,并加以選擇/篩選。產生O-RS的方法可進一步包括通過使用所屬領域中已知的各種誘變技術產生RS文庫。舉例來說,可通過位點特異性突變、隨機點突變、同源重組、DNA改組或其它遞歸式誘變方法、嵌合構建或其任何組合產生突變型RS。舉例來說,可由兩個或兩個以上其它(例如)較小、較少多樣性的"子文庫"產生突變型RS文庫。在使合成酶經歷正和負選擇/篩選策略后,可隨后使這些合成酶經歷進一步誘變。舉例來說,可分離出編碼O-RS的核酸;可由所述核酸產生一組編碼突變型O-RS的多聚核苷酸(例如,通過隨機誘變、位點特異性誘變、重組或其任何組合);且可重復這些個別步驟或這些步驟的組合,直到獲得優(yōu)先利用非天然氨基酸將O-tRNA氨酰化的突變型O-RS。在本發(fā)明一方面中,將所述步驟執(zhí)行至少2次。有關產生O-RS的其它細節(jié)可見于題為"MethodsandcompositionsfortheproductionoforthogonaltRNA-aminoacyltRNAsynthetasepairs."的^WO2002/086075中。還參看Hamano-Takaku等人,(2000)』腦咖,^foc/zm'c/^co",c^/-醇yiJournalofBiologicalChemistry.275(51):40324陽40328;Kiga等人(2002),*e"g/廳r^E^c/zer/c/n'aco//Z^ra^/-^A^f^"/7zetoe/orie,e"ycf"cor^oraricm。/朋w""a^ra/cd/-/ree^We附'PNAS99(15):9715-9723;和Francklyn等人,(2002),^附/"oflc;;"iA^■syWZzetowFfen"a"7e//a,^s1Aec/z朋gfng7/ea^fr<ms7a"<9",.RNA.8:1363-1372。正交tRNA本發(fā)明提供包括正交tRNA(O-tRNA)的真核細胞。正交tRNA介導在活體內將非天然氨基酸并入蛋白質中,所述蛋白質是由包含由O-tRNA識別的選擇性密碼子的多聚核苷酸編碼。在某些實施例中,本發(fā)明的O-tRNA例如以至少40%、至少45%、至少50%、至少60%、至少75%、至少80%或甚至90%或更高的包含如SEQIDNO.:65中所述的多聚核苷酸序列或在細胞中由如SEQIDNO.:65中所述的多聚核苷酸序列加工的tRNA的效率,介導將非天然氨基酸并入蛋白質中。參看本文中表5。本發(fā)明O-tRNA的實例為SEQIDNO.:65(參看本文中實例6和表5)。SEQIDNO.:65為剪接前/加工前轉錄物,其在細胞中任選例如使用標準內源細胞剪接和加工機器加工,且經修飾以形成活性O-tRNA。通常,所述剪接前轉錄物群在細胞中形成活性tRNA群。本發(fā)明還包括O-tRNA的保守變異體和其經加工細胞產物。舉例來說,O-tRNA的保守變異體包括功能與SEQIDNO.:65的O-tRNA類似且保持經加工形式的tRNAL形結構,但不具有相同序列的分子(且不為野生型tRNA分子)。通常,由于O-tRNA可在活體內再氨酰化,從而再次介導響應選擇性密碼子將非天然氨基酸并入由多聚核苷酸編碼的蛋白質中,故本發(fā)明的O-tRNA為可重復利用的O-tRNA。真核生物而非原核生物中tRNA的轉錄是通過RNA聚合酶III進行,這將限制能在脊椎動物細胞中轉錄的tRNA結構基因的一級序列。而且,在脊椎動物細胞中,tRNA需要從轉錄tRNA的細胞核輸出到細胞質,以進行翻譯。編碼本發(fā)明的O-tRNA或其互補多聚核苷酸的核酸也為本發(fā)明的特征。在本發(fā)明一個方面中,編碼本發(fā)明的O-tRNA的核酸包括內部啟動子序列,例如A盒(例如,TRGCNNAGY)和B盒(例如,GGTTCGANTCC,SEQIDNO:95)。A盒和B盒序列的其它實例可見于Geiduschek,(1988),7><myc,"'o"i濕尸o/,mwe瓜Ann-Rev.Biochem.57:873-914,其以引用的方式并入本文中。本發(fā)明的O-tRNA也可經轉錄后修飾。舉例來說,真核生物中tRNA基因的轉錄后修飾包括分別通過RnaseP和3'-內切核酸酶去除5'-和3'-側接序列。添加3'-CCA序列也為真核生物中tRNA基因的轉錄后修飾。在一個實施例中,通過使第一物種的脊椎動物細胞群(其中所述脊椎動物細胞包含tRNA文庫成員)經歷負選擇來獲得O-tRNA。負選擇除去包含如下tRNA文庫成員的細胞,所述tRNA文庫成員經對于脊椎動物細胞為內源性的氨?;?tRNA合成酶(RS)氨?;?。這提供與第一物種的脊椎動物細胞正交的tRNA池。另外,或者與上文所述其它方法組合,使用反式翻譯系統(tǒng)以將非天然氨基酸并入多肽中。此系統(tǒng)涉及存在于大腸桿菌中的稱為tmRNA的分子。這一RNA分子在結構上與丙氨酰tRNA相關且經丙氨酰合成酶氨?;mRNA與tRNA之間的差異在于,反密碼子環(huán)經特定較大序列置換。這一序列允許核糖體使用tmRNA內編碼的開放式閱讀框作為模板在已停止的序列上重新開始翻譯。在本發(fā)明中,可產生優(yōu)先經正交合成酶氨?;已b載有非天然氨基酸的正交tmRNA。通過所述系統(tǒng)轉錄基因,核糖體將在特定位點停止;將非天然氨基酸引入此位點處,并且使用正交tmRNA內編碼的序列重新開始翻譯。有關產生重組正交tRNA的其它方法可見于例如題為"MethodsandcompositionsfortheproductionoforthogonaltRNA-aminoacyltRNAsynthetasepairs."的國際專禾U申請案WO2002/086075中。還參看Forster等人,(2003)Prograw/m'"g;e;"Wo/m'附W/c/rara/a/7酵wgge"W/ccodestifey/gwet/<ie"ovoPNAS100(11):6353陽6357;禾口Feng等人,(2003),ixp""W"g,iiVylrecog礎owo/as聲Aetoeaw."g/e函/"oa"Wc/z""ge,PNAS100(10):5676-5681。正交TRNA與正交氨?;?TRNA合成酶對正交對是由例如抑制tRNA、移碼tRNA等O-tRNA與O-RS構成。O-tRNA不經內源性合成酶酰化,且能夠在活體內介導將非天然氨基酸并入蛋白質中,所述蛋白質是由包含由O-tRNA識別的選擇性密碼子的多聚核苷酸編碼。在脊椎動物細胞中,O-RS識別O-tRNA且優(yōu)先利用非天然氨基酸將O-tRNA氨?;?。本發(fā)明中包括用于產生正交對的方法連同由所述方法產生的正交對,和用于脊椎動物細胞中的正交對組合物。多種正交tRNA/合成酶對的開發(fā)可允許使用不同密碼子將多個非天然氨基酸同時并入脊椎動物細胞中。可通過利用無效跨物種氨?;斎雭碜圆煌矬w的對(例如,無義抑制子對)在脊椎動物細胞中產生正交O-tRNA/O-RS對。在脊椎動物細胞中有效表達和加工O-tRNA和O-RS,并且將O-tRNA從細胞核有效地輸出到細胞質。舉例來說,一種所述對為來自大腸桿菌的酪氨酰-tRNA合成酶/tRNAcuA對(例如參看,H.M.Goodman等人,(1968),Nature217:1019-24;和D.G.Barker等人,(1982),FEBSLetters150:419-23)。當在釀酒酵母細胞質中表達大腸桿菌酪氨酰-tRNA合成酶和其同源大腸桿菌tRNACUA時,大腸桿菌酪氨酰-tRNA合成酶有效地將其同源大腸桿菌tRNACUA氨?;粫⑨劸平湍竧RNA氨?;?。例如參看,H.Edwards,&P.Schimmel,(1990),Molecular&CellularBiology10:1633-41;和H.Edwards等人,(1991),PNASUnitedStatesofAmerica88:1153-6。此外,大腸桿菌酪氨酰tRNACUA為釀酒酵母氨酰基-tRNA合成酶的弱底物(例如參看V.Trezeguet等人,(1991),Molecular&CellularBiology11:2744-51),但其有效地在釀酒酵母的蛋白質翻譯中起作用。例如參看,H.Edwards,&P.Schimmel,(1990)Molecular&CellularBiology10:1633-41;H.Edwards等人,(1991),PNASUnitedStatesofAmerica88:1153-6;和V.Trezeguet等人,(1991),Molecular&CellularBiology11:2744-51。此外,大腸桿菌TyrRS不具有校對接合到tRNA的非天然氨基酸的編輯機制。O-tRNA和O-RS可為天然存在的,或可通過使來自多種生物體的天然存在的tRNA和/或RS突變得到,這將產生tRNA文庫和/或RS文庫。參看本文中題為"來源和宿主"的章節(jié)。在各個實施例中,O-tRNA和O-RS是得自至少一種生物體。在另一實施例中,O-tRNA得自第一物種的天然存在或突變的天然存在的tRNA,且O-RS得自第二物種的天然存在或突變的天然存在的RS。在一個實施例中,第一與第二非脊椎動物生物體相同?;蛘?,第一與第二非脊椎動物生物體可不同。有關產生O-RS和O-tRNA的方法,參看本文中題為"正交氨?;?tRNA合成酶(Orthogonalaminoacyl-tRNAsynthetases),,和"O-tRNA"的章節(jié)。還參看題為"MethodsandcompositionsfortheproductionoforthogonaltRNA-aminoacyltRNAsynthetasepairs."的國際專利申請案WO2002/086075。保真度、效率和產率保真度是指將所需分子(例如非天然氨基酸或氨基酸)并入正在生長的多肽中的所需位置的準確度。本發(fā)明的翻譯組件響應選擇性密碼子以高保真度將非天然氨基酸并入蛋白質中。舉例來說,與并入正在生長的多肽鏈中所需位置的特定天然氨基酸的不合需要的并入相比,使用本發(fā)明的組件將所需非天然氨基酸并入正在生長的多肽鏈中所需位置(例如響應選擇性密碼子)的效率為例如大于75%、大于85%、大于95%或甚至大于99%有效。、效率還可以指與相關對照相比,O-RS利用非天然氨基酸將O-tRNA氨?;某潭?。本發(fā)明的O-RS可通過其效率定義。在本發(fā)明某些實施例中,將O-RS與另一O-RS相比較。例如,本發(fā)明的O-RS利用非天然氨基酸將O-tRNA氨酰化,這與具有(例如)如SEQIDNO.:86或45中所述的氨基酸序列的O-RS或表5)中另一特定RS將O-tRNA氨酰化相比例如至少40%、至少50%、至少60%、至少75%、至少80%、至少90%、至少95%或甚至99%或更高有效。在另一實施例中,本發(fā)明的O-RS利用非天然氨基酸將O-tRNA氨?;?,這比O-RS利用天然氨基酸將O-tRNA氨?;行Ю缰辽?0倍、至少20倍、至少30倍等。使用本發(fā)明的翻譯組件,包含非天然氨基酸的所關注多肽的產率例如為從多聚核苷酸缺乏選擇性密碼子的細胞中獲得天然存在的所關注多肽的產率的至少5%、至少10%、至少20%、至少30%、至少40%、50%或更多。另一方面,細胞在不存在非天然氨基酸的情況下以一定產率產生所關注多肽,所述產率例如為在存在非天然氨基酸的情況下多肽產率的不到30%、不到20%、不到15%、不到10%、不到5%、不到2.5%等。來源和宿主生物體本發(fā)明的正交翻譯組件通常得自非脊椎動物生物體從而用于脊椎動物細胞或翻譯系統(tǒng)。舉例來說,正交O-tRNA可得自非脊椎動物生物體,例如真細菌,諸如大腸桿菌、極端嗜熱細菌(T7zmm^^^m叩/n'^)、嗜熱脂肪芽孢桿菌等;或古細菌,例如詹氏甲烷球菌、嗜熱自養(yǎng)甲烷桿菌(M""/wno6(3"en'wmAermom^ofrop/n.ct)、嗜鹽古菌(/fo/o6a"en'ww)(諸如沃氏嗜鹽富饒菌(i/a/o/eraxw/caw'0和嗜鹽古菌NRC-1(f/ia/oZ)(3"m.簡speciesiVU))、閃爍古生球菌dc/zaeog/o6w51/w/g油s)、強烈火球菌(戶"cocciw1/鵬'oras)、掘越氏熱球菌(尸戶coccMZwr汰(w/n7)、嗜熱泉生古細菌Uewra/^rwm網rm'x)等,而正交O-RS可得自非脊椎動物生物體,例如真細菌,諸如大腸桿菌、極端嗜熱細菌、嗜熱脂肪芽孢桿菌等;或古細菌,例如詹氏甲烷球菌、嗜熱自養(yǎng)甲垸桿菌、嗜鹽古菌(諸如沃氏嗜鹽富饒菌和嗜鹽古菌NRC-1)、閃爍古生球菌、強烈火球菌、掘越氏熱球菌、嗜熱泉生古細菌等。另外,還可使用脊椎動物來源,例如植物、藻類、原生生物、真菌、酵母、動物(例如,哺乳動物、昆蟲、節(jié)肢動物等)等,例如其中所述組件與所關注細胞或翻譯系統(tǒng)正交,或其中其經修飾(例如,突變)而與所述細胞或翻譯系統(tǒng)正交。0-tRNA/0-RS對的個別組件可搏自相同生物體或不同生物體。在一個實施例中,0-tRNA/0-RS對是來自相同生物體。舉例來說,O-tRNA/0-RS對可得自大腸桿菌的酪氨酰-tRNA合成酶/tRNAcuA對?;蛘逴-tRNA/0-RS對的O-tRNA和0-RS任選來自不同生物體。正交0-tRNA、0-RS或O-tRNA/0-RS對可經選擇或篩選和/或用于脊椎動物細胞中以產生具有非天然氨基酸的多肽。脊椎動物細胞可來自各種來源,例如任何脊椎動物(例如,哺乳動物、兩棲動物、鳥類、爬行動物、魚類等)等。具有本發(fā)明的翻譯組件的脊椎動物細胞的組合物也為本發(fā)明的特征。本發(fā)明還提供在一種物種中有效篩選以任選用于所述物種和/或第二物種(任選無需額外選擇/篩選)中。舉例來說,在一種物種(例如,易于操縱的物種,諸如酵母細胞等)中選擇或篩選0-tRNA/0-RS組件,且將其引入第二脊椎動物物種,例如植物(例如復雜植物,諸如單子葉植物或雙子葉植物)、藻類、原生生物、真菌、酵母、動物(例如哺乳動物、昆蟲、節(jié)肢動物等)等中,以用于在活體內將非天然氨基酸并入所述第二物種中。舉例來說,由于釀酒酵母(SaccAarawycMcerevz'w'ae,S.cerev/w'ae)為單細胞的,具有快速換代時間和相對充分表征的遺傳學,故可將其選作脊椎動物第一物種。例如參看D.Burke等人,(2000)MethodsinYeastGenetics.ColdSpringHarborLaboratoryPress,ColdSpringHarbor,NY。此外,由于真核生物的翻譯機器高度保守(例如參看(1996)TranslationalControl.ColdSpringHarborLaboratory,ColdSpringHarbor,NY;Y.Kwok,&J.T.Wong,(1980),EVo/Wo"a/^re/a"'ow血》6eAveew7fa/o6a"m'謂;/z盧ge"Wc;raZ^,CanadianJournalofBiochemistry58:213-218;禾口(2001)TheRibosome.ColdSpringHarborLaboratoryPress,ColdSpringHarbor,NY),古女可將在酉良酒酵母中發(fā)現的用于并入非天然氨基酸的aaRS基因引入高級脊椎動物生物體中,且與同源tRNA合作(例如參看K.Sakamoto等人,(2002)5""e-印ec折c/"corporario"o/a"w朋afwra/z'柳jtra/e/朋mamma//awce//^,NucleicAcidsRes.30:4692-4699;禾口C.Kohrer等人,(2001),/附戸Zq/謹hWoc/zre膨jkz'她附謂附aZ/awce〃fagewem/a,roac/zs"e,e"ycz'/wer"'owo/薩/朋""fl/og證她Proc.Natl.Acad.Sci.U.S.A.98:14310-14315)用于并入非天然氨基酸。在一個實例中,在如本文所述的第一物種中產生O-tRNA/O-RS對的方法另外包括將編碼O-tRNA的核酸和編碼O-RS的核酸引入第二物種(例如,哺乳動物、昆蟲、真菌、藻類、植物等)的脊椎動物細胞中。在另一實例中,產生在脊椎動物細胞中優(yōu)先利用非天然氨基酸將正交tRNA氨?;恼话滨;?tRNA合成酶(O-RS)的方法包括(a)在存在非天然氨基酸的情況下,使第一物種(例如,酵母等)的脊椎動物細胞群經歷正選擇。所述脊椎動物細胞各自包含i)氨?;?tRNA合成酶(RS)文庫成員,ii)正交tRNA(O-tRNA),iii)編碼正選擇標記的多聚核苷酸,和iv)編碼負選擇標記的多聚核苷酸。在正選擇中存活的細胞包含在存在非天然氨基酸的情況下將正交tRNA(O-tRNA)氨?;幕钚訰S。使在正選擇下存活的細胞在不存在非天然氨基酸的情況下經歷負選擇,以除去利用天然氨基酸將O-tRNA氨?;幕钚訰S。這提供優(yōu)先利用非天然氨基酸將O-tRNA氨?;腛-RS。將編碼O-tRNA的核酸和編碼O-RS的核酸(或O-tRNA和/或O-RS的組件)引入第二物種(例如,哺乳動物、昆蟲、真菌、藻類、植物等)的脊椎動物細胞中。通常,通過使第一物種的脊椎動物細胞群經歷負選擇來獲得O-tRNA,其中所述脊椎動物細胞包含tRNA文庫成員。負選擇標記除去包含tRNA文庫成員的細胞,所述tRNA文庫成員經對于脊椎動物細胞為內源性的氨酰基-tRN合成酶(RS)氨?;?,其提供與第一物種和第二物種的脊椎動物細胞正交的tRNA池。選擇性密碼子本發(fā)明的選擇性密碼子將擴充蛋白質生物合成機器的遺傳密碼子框架。舉例來說,選擇性密碼子包括例如獨特的三堿基密碼子、無義密碼子(諸如終止密碼子,例如琥珀密碼子(UAG)、蛋白石密碼子(UGA))、非天然密碼子、至少四堿基的密碼子、稀有密碼子等。可將多個(例如一個或多個、兩個或兩個以上、三個以上等)選擇性密碼子引入所需基因中?;蚩砂ǘ鄠€指定選擇性密碼子拷貝,或可包括多個不同選擇性密碼子或其組合。在一個實施例中,所述方法涉及使用作為終止密碼子的選擇性密碼子以在脊椎動物細胞中于活體內并入非天然氨基酸。舉例來說,產生識別終止密碼子(例如UAG)且通過O-RS和用所需非天然氨基酸氨酰化的0-tRNA。天然存在的宿主氨?;?tRNA合成酶不識別所述O-tRNA??墒褂贸R?guī)定點誘變將終止密碼子(例如TAG)引入所關注多肽中的所關注位點處。例如參看Sayers,J.R.等人(1988),5',_3'Exo"wde氾ej^asp/zoTO/7u'oafe-6ase(io"go肌c/eWcfe-6frecfed麵togewes7's.NucleicAcidsRes.791-802。當在活體內將O-RS、O-tRNA和編碼所關注多肽的核酸組合時,響應UAG密碼子而并入非天然氨基酸從而得到在指定位置處含有所述非天然氨基酸的多肽。在活體內并入非天然氨基酸可在不顯著干擾脊椎動物宿主細胞的情況下進行。舉例來說,由于UAG密碼子的抑制效率視O-tRNA(例如,琥珀抑制性tRNA)與脊椎動物釋放因子(例如,eRF)(其與終止密碼子結合并且起始正在生長的肽從核糖體釋放)之間的競爭而定,故所述抑制效率可例如通過增加O-tRNA(例如,抑制性tRNA)的表達水平來調節(jié)。選擇性密碼子還包含擴充的密碼子,例如四個或四個以上堿基的密碼子,諸如四堿基密碼子、五堿基密碼子、六堿基密碼子或更多個堿基的密碼子。四堿基密碼子的實例包括例如AGGA、CUAG、UAGA、CCCU等。五堿基密碼子的實例包括例如AGGAC、CCCCU、CCCUC、CUAGA、CUACU、UAGGC等。本發(fā)明的特征包括基于移碼抑制使用擴充的密碼子。四個或四個以上堿基的密碼子可將例如一個或多個非天然氨基酸插入同一蛋白質中。舉例來說,在存在具有反密碼子環(huán)、例如具有8-10nt反密碼子環(huán)的突變O-tRNA(例如,特定移碼抑制性tRNA)的情況下,將四個或四個以上堿基的密碼子讀作單一氨基酸。在其它實施例中,反密碼子環(huán)可解碼例如至少四堿基密碼子、至少五堿基密碼子或至少六堿基密碼子或更多堿基的密碼子。由于存在256個可能的四堿基密碼子,故可在同一細胞中使用四個或四個以上堿基的密碼子編碼多個非天然氨基酸。參看Anderson等人,(2002)五xp/on'叫Aeo/CWona""w"co(iow5fee,ChemistryandBiology.9:237-244;Magliery,(2001)J.Mol.Biol.307:755-769。舉例來說,已使用四堿基密碼子使用活體外生物合成方法將非天然氨基酸并入蛋白質中。例如參看Ma等人,0993)Biochemistry.32:7939;和Hohsaka等人,(1999)J.Am.Chem.Soc,121:34。使用CGGG和AGGU利用兩個以化學方式酰化的移碼抑制性tRNA在活體外將2-萘基丙氨酸和賴氨酸的NBD衍生物同時并入抗生蛋白鏈菌素中。例如參看Hohsaka等人,(1999).Am.Chem.Soc,121:12194。在活體內研究中,Moore等人檢査具有NCUA反密碼子的tRNALeu衍生物抑制UAGN密碼子(N可為U、A、G或C)的能力,并且發(fā)現四聯(lián)體UAGA可以通過具有UCUA反密碼子的tRNALeu以13%到26%的效率解碼且在0或-1框內極少解碼。參看Moore等人,(2000)J.Mol.Biol.,298:195。在一個實施例中,可將基于稀有密碼子或無義密碼子的擴充密碼子用于本發(fā)明中,其可減少錯義通讀和其它不合需要的位點處的移碼抑制。對于指定系統(tǒng)來說,選擇性密碼子也可包括一個天然三堿基密碼子,其中內源系統(tǒng)不使用(或極少使用)天然堿基密碼子。舉例來說,這包括缺乏識別天然三堿基密碼子的tRNA的系統(tǒng)和/或三堿基密碼子為稀有密碼子的系統(tǒng)。選擇性密碼子任選包括非天然堿基對。這些非天然堿基對使現有的遺傳代碼進一步擴展。一種額外的堿基對使三聯(lián)體密碼子的數量從64增加到125。第三堿基對的特性包括穩(wěn)定且具選擇性的堿基配對、通過聚合酶以高保真度有效酶促并入DNA中以及合成新的非天然堿基對之后有效的持續(xù)引物5r伸。可適于方法和組合物的非天然堿基對的描述包括例如Hirao等人,(2002)』"w朋a&ra/6氾eprn'r/orz'wco7ora/7'wga加'"oa"'c/ana/ogwesz'幽NatureBiotechnology.20:177-182。其它相關公開文獻列于下文中。對于活體內使用來說,非天然核苷可滲透膜并且磷酸化形成相應的三磷酸鹽。此外,增加的遺傳信息穩(wěn)定并且不被細胞酶所破壞。Bermer和其它人先前的工作利用不同于規(guī)范Watson-Crick配對的氫鍵模式,最值得關注的實例為iso-C:iso-G配對。例如參看Switzer等人,(1989)J.Am.Chem.Soc.111:8322;禾卩Piccirilli等人,(1990)Nature,343:33;Kool,(2000)Curr.Opin.Chem.Biol.4:602。一般說來,這些堿基在某種程度上與天然堿基錯配并且無法酶促復制。Kool和同事證實,堿基之間的疏水堆積相互作用可替代氫鍵以驅動堿基對的形成。參看Kool,(2000)Curr.Opin.Chem.Biol,4:602;和Guckian及Kool,(1998)Angew.Chem.Int.Ed.Engl.,36,2825。在開發(fā)滿足所有上述需求的非天然堿基對的工作中,Schultz、Romesberg和同事已系統(tǒng)地合成一系列非天然疏水堿基并且對其進行研究。已發(fā)現,PICS:PICS自身配對比天然堿基對穩(wěn)定,并且能夠通過大腸桿菌DNA聚合酶I的Klenow片段(KF)有效地并入看McMinn等人,(1999)J.Am.Chem.Soc,121:11586;以及Ogawa等人,(2000)J.Am.Chem.Soc,122:3274。3MN:3MN自身配對可通過KF以足以用于生物功能的效率和選擇性合成。例如參看Ogawa等人,(2000)J.Am.Chem.Soc.122:8803。然而,兩種堿基都充當用于進一步復制的鏈終止子。近來已開發(fā)出可用于復制PICS自身配對的突變體DNA聚合酶。此外,可復制7AI自身配對。例如參看Tae等人,(2001)J.Am.Chem.Soc,123:7439。也已開發(fā)出新穎的金屬堿基對Dipic:Py,其在結合Cu(II)后形成穩(wěn)定的配對。參看Meggers等人,(2000)J.Am.Chem.Soc,122:10714。由于擴充密碼子和非天然密碼子內在地與天然密碼子正交,故本發(fā)明的方法可利用這一特性產生正交tRNA供其使用。也可使用翻譯旁路系統(tǒng)將非天然氨基酸并入所需多肽中。在翻譯旁路系統(tǒng)中,將較大序列插入基因中但并不被翻譯成蛋白質。所述序列含有充當誘導核糖體越過所述序列并且在插入下游重新開始翻譯的線索的結構。非天然氨基酸如本文所使用,非天然氨基酸是指除硒代半胱氨酸和/或吡咯賴氨酸和以下20種基因編碼的a-氨基酸外的任何氨基酸、經修飾氨基酸或氨基酸類似物丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、組氨酸、異亮氨酸、亮氨酸、賴氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、絲氨酸、蘇氨酸、色氨酸、酪氨酸、纈氨酸。通過式I說明a-氨基酸的一般結構IR非天然氨基酸通常為具有式r的任何結構,其中R基團為除二十種天然氨基酸中所用基團外的任何取代基。有關二十種天然氨基酸的結構,例如參看L.Stryer的第3版1988,FreemanandCompany,NewYork。應注意,本發(fā)明的非天然氨基酸可為除上述二十種a-氨基酸外的天然存在的化合物。由于本發(fā)明的非天然氨基酸與天然氨基酸的不同之處通常僅在于側鏈,故非天然氨基酸以與其在天然存在的蛋白質中形成酰胺鍵相同的方式與其它氨基酸(例如,天然或非天然)形成酰胺鍵。然而,非天然氨基酸具有使其與天然氨基酸相區(qū)別的側鏈基團。舉例來說,式I中的R任選包含烷基-、芳基-、酰基-、酮基-、疊氮基-、羥基-、肼、氰基-、鹵基-、酰肼、烯基、炔基、醚、硫醇、硒基-、磺?;?、硼酸酯基(borate)、硼酸酯基(boronate)、磷酸基、膦酸基、膦、雜環(huán)、烯酮、亞胺、醛、酯、硫代酸、羥胺、胺等,或其任何組合。其它所關注非天然氨基酸包括(但不限于)包含可光活化交聯(lián)劑的氨基酸、自旋標記的氨基酸、發(fā)熒光氨基酸、結合金屬的氨基酸、含金屬的氨基酸、放射性氨基酸、具有新穎官能團的氨基酸、與其它分子共價或非共價相互作用的氨基酸、光籠蔽和/或光致異構化氨基酸、含有生物素或生物素類似物的氨基酸、含酮基氨基酸、包含聚乙二醇或聚醚的氨基酸、重原子取代的氨基酸、可化學裂解和/或可光裂解的氨基酸、與天然氨基酸相比具有伸長側鏈(例如,聚醚或長鏈烴,例如大于約5個、大于約IO個碳原子等)的氨基酸、含碳連接的糖的氨基酸、具有氧化還原活性的氨基酸、含有氨基硫代酸的氨基酸和包含一個或多個有毒部分的氨基酸。在一些實施例中,非天然氨基酸具有例如用于將蛋白質與固體支撐物連接的可光活化交聯(lián)劑。在一個實施例中,非天然氨基酸具有連接到氨基酸側鏈的糖部分(例如,糖基化氨基酸)和/或其它碳水化合物修飾。除含有新穎側鏈的非天然氨基酸外,非天然氨基酸還任選包含經修飾的主鏈結構,例如,如式II和III的結構所示<formula>formulaseeoriginaldocumentpage41</formula>其中Z通常包含OH、NH2、SH、NH-R'或S-R';X和Y可相同或不同且通常包含S或0;且R和R'任選相同或不同且通常選自與上文關于具有式I的非天然氨基酸所述的R基的組分相同的列表以及氫。舉例來說,如式n和m所示,本發(fā)明的非天然氨基酸任選在氨基或羧基中包含取代。此類非天然氨基酸包括(但不限于)例如具有與常見二十種天然氨基酸相對應的側鏈或非天然側鏈的a-羥基酸、a-硫代酸、a-氨基硫代羧酸酯。此外,a-碳的取代任選包括L、D或a-a雙取代氨基酸,諸如D-谷氨酸、D-丙氨酸、D-甲基-O-酪氨酸、氨基丁酸等。其它結構替代物包括環(huán)狀氨基酸,諸如脯氨酸類似物以及3、4、6、7、8和9元環(huán)脯氨酸類似物;P和y氨基酸,諸如經取代(3-丙氨酸和y-氨基丁酸。舉例來說,許多非天然氨基酸都是建立在諸如酪氨酸、谷氨酸、苯丙氨酸等天然氨基酸的基礎上。酪氨酸類似物包括對位取代的酪氨酸、鄰位取代的酪氨酸和間位取代的酪氨酸,其中所述經取代酪氨酸包含例如酮基(例如乙?;?、苯甲?;?、氨基、肼、羥胺、硫醇基、羧基、異丙基、甲基、c6-C20直鏈或支鏈烴、飽和或不飽和經、O-甲基、聚醚基、硝基、炔基等。此外,也涵蓋多取代的芳基環(huán)。本發(fā)明的谷氨酰胺類似物包括(但不限于)a-羥基衍生物、y取代的衍生物、環(huán)狀衍生物和酰胺取代的谷氨酰胺衍生物。苯丙氨酸類似物的實例包括(但不限于)對位取代的苯丙氨酸、鄰位取代的苯丙氨酸和間位取代的苯丙氨酸,其中所述取代基包含例如羥基、甲氧基、甲基、烯丙基、醛、疊氮基、碘基、溴基、酮基(例如乙?;?、苯甲?;⑷不?。非天然氨基酸的特定實例包括(但不限于)對乙?;?L-苯丙氨酸、對炔丙基氧基苯丙氨酸、O-甲基-L-酪氨酸、L-3-(2-萘基)丙氨酸、3-甲基-苯丙氨酸、0-4-烯丙基-L-酪氨酸、4-丙基-L-酪氨酸、三-O-乙?;?GlcNAc卩-絲氨酸、L-多巴、氟化苯丙氨酸、異丙基-L-苯丙氨酸、對疊氮基-L-苯丙氨酸、對?;?L-苯丙氨酸、對苯甲?;?L-苯丙氨酸、L-磷酸絲氨酸、膦酰基絲氨酸、膦?;野彼?、對碘-苯丙氨酸、對溴苯丙氨酸、對氨基-L-苯丙氨酸和異丙基-L-苯丙氨酸等。多種非天然氨基酸的其它結構提供于例如題為"Invivoincorporationof腿aturalaminoacids."的WO2002/085923的圖16、17、18、19、26和29中。關于其它甲硫氨酸類似物,還參看Kiick等人,(2002)/wco/yomrio"o/azWM/"torgcow6z'n朋z/orc/ze歸se/ec"vemO(i折co/7'ow/7ze5Yaw(i/wge/"http://gto"o",PNAS99:19-24的圖1結構2-5。在一個實施例中,提供包括非天然氨基酸(諸如對-(炔丙基氧基)-苯丙氨酸)的組合物。還提供包含對-(炔丙基氧基)-苯丙氨酸和例如蛋白質和/或細胞的各種組合物。一方面,包括對-(炔丙基氧基)-苯丙氨酸非天然氨基酸的組合物進一步包括正交tRNA??蓪⒎翘烊话被崤c正交tRNA鍵接(例如共價),例如通過氨?;I與正交tRNA共價鍵接、與正交tRNA的末端核糖的3'OH或2'OH共價鍵接??赏ㄟ^非天然氨基酸并入蛋白質中的化學部分為蛋白質提供多種益處和操縱。舉例來說,酮基官能團的獨特反應性允許在活體外和活體內利用多種含肼或羥胺試劑中任一種選擇性修飾蛋白質。舉例來說,重原子非天然氨基酸例如可用于定相X射線結構數據。使用非天然氨基酸位點特異性地引入重原子還為選擇重原子的位置提供選擇性和靈活性。光反應性非天然氨基酸(例如,具有二苯甲酮和疊氮芳基(例如疊氮苯)側鏈的氨基酸)例如允許在活體內和活體外有效地光交聯(lián)蛋白質。光反應性非天然氨基酸的實例包括(但不限于)例如對疊氮基-苯丙氨酸和對苯甲?;?苯丙氨酸。隨后可通過激發(fā)光反應性基團-提供時間(和/或空間)控制使具有光反應性非天然氨基酸的蛋白質隨意交聯(lián)。在一個實例中,非天然氨基酸的甲基可經作為局部結構和動力學探針(例如,使用核磁共振和振動光譜)的同位素標記的(例如)甲基取代。舉例來說,炔基或疊氮基官能團允許利用分子通過[3+2]環(huán)加成反應選擇性修飾蛋白質。非天然氨基酸的化學合成上文所提供的許多非天然氨基酸都是購自例如Sigma(USA))或Aldrich(Milwaukee,WI,USA)。非市售的非天然氨基酸是任選如本文所提供或如各種公開文獻中所提供或使用所屬領域技術人員巳知的標準方法來合成。有關有機合成技術,例如參看Fessendon和Fessendon的OrganicChemistry,(1982,第2版,WillardGrantPress,BostonMass.);March的AdvancedOrganicChemistry(第3版,1985,WileyandSons,NewYork);以及Carey禾卩Sundberg的AdvancedOrganicChemistrv(第3版,第A和B部分,1990,PlenumPress,NewYork)。描述非天然氨基酸的合成的其它公開文獻例如包括題為"InvivoincorporationofUnnaturalAminoAcids"的WO2002/085923,Matsoukas等人,(1995)J.Med.Chem.,38-4669;King,F.E.&Kidd,D.A.A.(1949)JA^ew5^w,/zes/《o/o/y層Dfpep/7'(ieso/G7wfawz'cJc/t/々owi^f/^/afei//"fermec^'afes.J.Chem.Soc.3315-3319;Friedman,O.M.&Chatterrji,R.(1959)5^"/7zewJq/"De〃.va"veso/G7w/mz."eA/o<ie/5"w65tra&s/or^"/7'-rwmor爿ge"tt.J.Am.Chem.Soc.81,3750-3752;Craig,J.C.等人(1988)Jfeo/WeCo"/^wrario"o/&e〖C7z/or,—.J.Org.Chem.53,1167-1170;Azoulay,M.,Vilmont,M.&Frappier,F.(1991)G,wfa附/"ea打a/ogwe51asPofe打"a/^4wfz7na/an'a/s,Eur.J.Med.Chem.26-5;Koskinen,A.M.P.&Rapoport,H.(1989)Syw^ewio/4-S"6w/ft^ed/VoZ/wesawCo"/orw加'owa/(yCo組m/"ec/Jw/woy4"W勘a/ogwe義J.Org.Chem.54,1859-1866;Christie,B.D.&Rapoport,H.(1985)5^W/2es/so/0/^/ca〃少尸wre尸/peco/fl^es/row43爿c/c/Z)ecarZ)o"少/Wowawd/附z'w'謂TowC_yc//za"'o".J.Org.Chem.1989:1859-1866;Barton等人,(1987)iS"Aew'《o/Wove/a-^4wz'"o"c油朋(iDm'va/7'v^版wgia血a/y4///"op"'a^f/wa加ra&c/De"》fl^ve51.Tetrahedron43:4297-4308;禾口Subasinghe等人,(1992)wa//c腦W朋at/ogwe《.'■s1"/^*o/Ae/a-A"";^"^2-膽/"opropawo/caczWcife"'va^v《scmcf/iez'rac/tv辦awove/gw一wa/她-"w礎ze(is"e.J.Med.Chem.35:4602-7。非天然氨基酸的細胞攝取脊椎動物細胞對非天然氨基酸的攝取是在設計和選擇例如并入蛋白質中的非天然氨基酸時通??紤]的一個問題。舉例來說,a-氨基酸的高電荷密度表明這些化合物可能無法滲透細胞。天然氨基酸是經由一系列基于蛋白質的轉運系統(tǒng)而吸收到脊椎動物細胞中。可進行快速篩選以評定哪些非天然氨基酸(如果存在)被細胞吸收。例如參看,例如2002年12月22日申請名稱為"ProteinArrays"的代理人案號為P1001US00的申請案以及Liu,D.R.&Schultz,RG.(1999)to而rafew/Wowo/aworgan/纖w"/cmexp朋fife(ige"Wcco血PNASUnitedStates96:4780-4785中的毒性分析法。盡管易于利用各種分析法分析攝取,但設計適用于細胞攝取路徑的非天然氨基酸的替代方法是提供生物合成路徑以在活體內產生氨基酸。非天然氨基酸的生物合成許多生物合成路徑已經存在于細胞中以產生氨基酸和其它化合物。特定非天然氨基酸的生物合成方法可能不存在于自然界(例如,脊椎動物細胞)中,而本發(fā)明提供所述方法。舉例來說,任選在宿主細胞中通過添加新穎酶或改變現存的宿主細胞路徑來產生非天然氨基酸的生物合成路徑。其它新穎酶任選為天然存在的酶或人工開發(fā)的酶。舉例來說,對氨基苯丙氨酸的生物合成(如題為"Invivoincorporationofunnaturalaminoacids"的WO2002/085923中的實例所提供)依賴于添加來自其它生物體的已知酶的組合??赏ㄟ^用包含這些酶的基因的質粒轉化細胞來將所述基因引入脊椎動物細胞中。當在細胞中表達時,這些基因提供合成所需化合物的酶促路徑。任選添加的酶類型的實例提供于下文實例中。其它酶序列可見于例如Genbank中。也任選以相同方式將人工開發(fā)的酶添加到細胞中。以此方式,操縱細胞機器和細胞資源以產生非天然氨基酸。多種方法可用于產生用于生物合成路徑或發(fā)展現存路徑中的新穎酶。舉例來說,任選將(例如)如Maxygen,Inc.所開發(fā)的遞歸重組(recursiverecombination)(可在萬維網www,maxygen,com上獲得)用于開發(fā)新穎酶和路徑。例如參看Stemmer(1994),iapzWevo/Wo"o/av"ra6>>_DA^4s/zw,.wg,Nature370(4):389-391;禾口Stemmer,(1994),IWJAt^z'wgZyrawt/ow々agwew加/cw朋c/re(xwe附6(y:WfrorecowZu—wfi^/cw/ormo/ecw/arevo/z^/o",Proc.Natl.Acad.Sci,USA..91:10747-10751。類似地,任選將Genencor所開發(fā)的DesignPath(可在萬維網genencor.com上獲得)用于代謝路徑工程改造,例如工程改造某一路徑以在細胞中產生O-甲基-L-酪氨酸。這項技術使用例如通過功能性基因組學以及分子進化和設計所鑒別出的新基因的組合在宿主生物體中重建現存路徑。Diversa公司(可在萬維網diversa.com上獲得)也提供迅速篩選基因文庫和基因路徑(例如建立新路徑)的技術。通常以足以有效進行蛋白質生物合成但未達到影響其它氨基酸的濃度或耗盡細胞資源的程度的濃度(例如天然細胞量)來產生利用本發(fā)明的經工程改造的生物合成路徑所產生的非天然氨基酸。在活體內以此方式所產生的典型濃度為約lOmM到約0.05mM。在用包含用于產生特定路徑所需的酶的基因的質粒轉化細胞并且產生非天然氨基酸后,任選使用活體內選擇以針對核糖體蛋白質合成和細胞生長進一步優(yōu)化非天然氨基酸的產生。'具有非天然氨基酸的多肽具有至少一個非天然氨基酸的所關注蛋白質或多肽為本發(fā)明的特征。本發(fā)明還包括使用本發(fā)明的組合物和方法產生的具有至少一個非天然氨基酸的多肽或蛋白質。賦形劑(例如,醫(yī)藥學上可接受的賦形劑)也可與蛋白質一起存在。通過在脊椎動物細胞中產生具有至少一個非天然氨基酸的所關注蛋白質或多肽,蛋白質或多肽通常將包括脊椎動物翻譯后修飾。在某些實施例中,蛋白質包括至少一個非天然氨基酸和至少一個由脊椎動物細胞于活體內所產生的翻譯后修飾,其中所述翻譯后修飾不是由原核細胞產生。舉例來說,翻譯后修飾包括例如乙?;Ⅴ;?、脂質修飾、棕櫚?;?、棕櫚酸鹽加成、磷酸化、糖酯連接修飾、糖基化等。一方面,翻譯后修飾包括通過GlcNAc-天冬酰胺鍵將寡糖(例如(GlcNAc-Man)2-Man-GlcNAc-GlcNAc))與天冬酰胺連接在一起。參看表7,其列出脊椎動物蛋白質的N連接寡糖的一些實例(也可存在其它未展示的殘基)。另一方面,翻譯后修飾包括通過GalNAc-絲氨酸或GalNAc-蘇氨酸鍵或者GlcNAc-絲氨酸或GlcNAc-蘇氨酸鍵將寡糖(例如Gal-GalNAc、Gal-GlcNAc等)與絲氨酸或蘇氨酸連接在一起。表7:通過GlcNAc鍵連接的寡糖的實例<table>tableseeoriginaldocumentpage46</column></row><table>另一方面,翻譯后修飾包括前體(例如,降鈣素前體、降鈣素基因相關肽前體、前甲狀旁腺激素原、前胰島素原、前胰島素、前阿黑皮素原(prepro-opiomelanocortin)、阿黑皮素原等)的蛋白水解處理;組裝成多亞單元蛋白質或大分子組裝物;翻譯到細胞中另一位點處(例如,細胞器,諸如內質網、高爾基體(golgiapparatus)、細胞核、溶酶體、過氧化物酶體、線粒體、葉綠體、液泡等,或通過分泌途徑)。在某些實施例中,蛋白質包含分泌或定位序列、抗原決定基標簽、FLAG標簽、聚組氨酸標簽、GST融合體等。非天然氨基酸的一個優(yōu)勢在于,其提供可用于添加額外分子的額外化學部分。這些修飾可在脊椎動物細胞中于活體內進行或在活體外進行。因此,在某些實施例中,翻譯后修飾是通過非天然氨基酸進行。舉例來說,翻譯后修飾可通過親核-親電反應進行。當前用于選擇性修飾蛋白質的大部分反應涉及親核與親電反應搭配物之間的共價鍵形成,例如a-鹵代酮與組氨酸或半胱氨酸側鏈的反應。在這些情況中,選擇性是由蛋白質中親核殘基的數量和可接近性決定。在本發(fā)明的蛋白質中,可在活體外或活體內使用其它更具選擇性的反應,諸如非天然酮基氨基酸與酰肼或氨氧基化合物的反應。例如參看Comish等人,(1996)J.Am.Chem.Soc.118:8150-8151;Mahal等人,(1997)Science.276:1125-1128;Wang等人,(2001)Science292:498-500;Chin等人,(2002)Am.Chem.Soc.124:9026-卯27;Chin等人,(2002)Proc.Natl.Acad.99:11020-11024;Wang等人,(2003)Proc.Natl.Acad.Sci100:56-61;Zhang等人,(2003)Biochemistry.42:6735-6746;和Chin等人,(2003)Science.,出版中。這使得能夠用包括熒光團、交聯(lián)劑、糖衍生物和細胞毒性分子在內的多種試劑選擇性標記幾乎任何蛋白質。還參看2003年10月15日申請名稱為"Glycoproteinsynthesis"的專利申請案USSN10/686,944。翻譯后修飾(例如通過疊氮基氨基酸)也可通過施陶丁格接合(Staudingerligation)(例如,用三芳基膦試劑)進行。例如參看Kiick等人,(2002)/"corpomrio"c/rec蘭6/朋"/"jproto'm1/orc/ze腳se/ecriv"e,6fzyc油'o"&Sto/W"ger//g她.ow,PNAS99:19-24。本發(fā)明提供另一種選擇性修飾蛋白質的極為有效的方法,其涉及響應選擇性密碼子將例如含有疊氮基或炔基部分的非天然氨基酸遺傳并入蛋白質中。隨后可通過例如胡伊斯根(Huisgen)[3+2]環(huán)加成反應(例如參看Padwa,A.ComprehensiveOrganicSynthesis,第4巻.(1991)Trost,B.M.編,Pergamon,Oxford,第1069-1109頁;和Huisgen,R.1,3-Di.polarCycloadditionChemistry,(1984)Padwa,A.編,Wiley,NewYork,第1-176頁)分別用例如炔基或疊氮化物衍生物來修飾這些氨基酸側鏈。例如參看圖16。由于這種方法涉及環(huán)加成而非親核取代反應,故可以極高的選擇性修飾蛋白質。可在室溫下于水性條件中通過將催化量的Cu(I)鹽添加到反應混合物中以優(yōu)良的區(qū)位選擇性(1,4>1,5)進行所述反應。例如參看Tornoe等人,(2002)J.Org.Chem.67:3057-3064;禾口Rostovtsev,等人,(2002)Angew,Chem.Int.Ed.41:2596-2599??墒褂玫牧硪环椒ㄊ窃陔p砷化合物上配體交換四半胱氨酸基元,例如參看Griffm等人,(1998)Science281:269-272??赏ㄟ^非天然編碼的氨基酸的官能團添加到本發(fā)明的蛋白質中的分子包括實質上任何具有互補官能團的分子。所述分子包括(但不限于)染料、熒光團、交聯(lián)劑、糖衍生物、聚合物(例如,聚乙二醇衍生物)、光交聯(lián)劑、細胞毒性化合物、親和標記、生物素衍生物、樹脂、珠粒、第二蛋白質或多肽(或更多)、多聚核苷酸(例如,DNA、RNA等)、金屬螯合劑、輔因子、脂肪酸、碳水化合物等。另一方面,本發(fā)明提供包括所述分子的組合物以及產生這些分子(例如,聚乙二醇)的方法,其中n為介于例如50與10,000之間、75與5,000之間、100與2,000之間、100與1,000之間等的整數。在本發(fā)明的實施例中,聚乙二醇具有例如約5,000到約100,000Da、約20,000到約30,000Da、約40,000或約50,000Da、約20,000Da到約10,000Da等的分子量。還提供包含這些化合物,例如具有蛋白質和細胞的各種組合物。在本發(fā)明一方面中,包含疊氮基染料(例如,具有化學結構4或化學結構6)的蛋白質進一步包括至少一個非天然氨基酸(例如,炔基氨基酸),其中所述疊氮塞染料通過[3+2]環(huán)加成連接到所述非天然氨基酸。本發(fā)明的脊椎動物細胞提供合成包含大量有用非天然氨基酸的蛋白質的能力。一方面,組合物任選包括例如至少IO微克、至少50微克、至少75微克、至少'100微克、至少200微克、至少250微克、至少500微克、至少1毫克、至少10毫克或更多包含非天然氨基酸的蛋白質,或可利用活體內蛋白質產生方法所實現的量(關于重組蛋白產生和純化的細節(jié)提供于本文中)。另一方面,蛋白質任選以在例如細胞溶解產物、緩沖液、醫(yī)藥緩沖液或其它液體懸浮液(例如,在從約1nl到約100L間任何數量的體積中)中為例如每升至少10微克蛋白質、每升至少50微克蛋白質、每升至少75微克蛋白質、每升至少100微克蛋白質、每升至少200微克蛋白質、每升至少250微克蛋白質、每升至少500微克蛋白質、每升至少1毫克蛋白質或每升至少10毫克蛋白質或更高的濃度存在于組合物中。在包括至少一個非天然氨基酸的脊椎動物細胞中產生大量(例如,大于通常用其它方法、例如活體外翻譯可能獲得的量)蛋白質為本發(fā)明的特征??蛇M行非天然氨基酸的并入,例如以調整蛋白質結構和/或功能的改變,例如改變尺寸、酸度、親核性、氫鍵、疏水性、蛋白酶靶位點可接取性、靶向部分(例如,對于蛋白質陣列)等。包括非天然氨基酸的蛋白質可具有增強或者甚至全新的催化或物理特性。舉例來說,任選通過將非天然氨基酸包涵入蛋白質中來改變以下特性毒性、生物分布、結構特性、光譜特性、化學和/或光化學特性、催化能力、半衰期(例如,血清半衰期)、與其它分子反應(例如共價或非共價)的能力等。包括包含至少一個非天然氨基酸的蛋白質的組合物可用于例如新穎治療劑、診斷劑、催化酶、工業(yè)酶、結合蛋白(例如,抗體)以及例如蛋白質結構和功能研究。例如參看Dougherty,(2000)C/n"c^Mra/jfm'woas/Vo6eso/iVofe/nS/rw"wreFwnc/io",CurrentOpinioninChemicalBiology.4:645-652。在本發(fā)明一方面中,組合物包括至少一種具有至少一個、例如至少兩個、至少三個、至少四個、至少五個、至少六個、至少七個、至少八個、至少九個或至少十個或更多非天然氨基酸的蛋白質。非天然氨基酸可相同或不同,例如可在蛋白質中1、2、3、4、5、6、7、8、9、10個或更多不同位點包含1、2、3、4、5、6、7、8、9、10個或更多不同非天然氨基酸。另一方面,組合物包括蛋白質中存在的至少一個(但少于全部)特定氨基酸經非天然氨基酸取代的蛋白質。對于具有一個以上非天然氨基酸的指定蛋白質,非天然氨基酸可相同或不同(例如,所述蛋白質可包括兩種或48兩種以上不同類型的非天然氨基酸,或可包括相同非天然氨基酸中的兩個)。對于具有兩個以上非天然氨基酸的指定蛋白質,非天然氨基酸可相同、不同或為多個相同種類的非天然氨基酸與至少一個不同非天然氨基酸的組合?;旧先魏伟ǚ翘烊话被岬牡鞍踪|(或其部分)(以及任何相應編碼核酸,例如其包括一個或多個選擇性密碼子)都可使用本文中的組合物和方法產生。未進行嘗試來鑒別成千上萬種已知蛋白質,所述蛋白質中任一種可例如通過調整任何可用突變方法以在相關翻譯系統(tǒng)中包括一個或多個適當選擇性密碼子來修飾,從而包括一個或多個非天然氨基酸。已知蛋白質的常見序列譜系包括GenBankEMBL、DDBJ和NCBI??梢子谕ㄟ^搜索互聯(lián)網鑒別其它譜系。通常,蛋白質與任何可用蛋白質(例如,治療性蛋白質、診斷性蛋白質、工業(yè)酶或其部分等)例如至少60%、至少70%、至少75%、至少80%、至少卯%、至少95%或至少99%或更高一致,且其包含一個或多個非天然氨基酸??山浶揎椧园粋€或多個非天然氨基酸的治療性、診斷性和其它蛋白質的實例包括(但不限于)例如(x-l抗胰蛋白酶、血管抑素、抗溶血因子、抗體(關于抗體的其它細節(jié)見下文)、載脂蛋白、脫輔基蛋白、心房利鈉因子、心房利鈉多肽、心房肽、C-X-C趨化因子(例如,T39765、NAP-2、ENA-78、Gro-a、Gro-b、Gro-c、IP-IO、GCP-2、NAP-4、SDF-1、PF4、MIG)、降鈣素、CC趨化因子(例如,單核細胞趨化蛋白-1、單核細胞趨化蛋白-2、單核細胞趨化蛋白-3、單核細胞炎癥蛋白-lct、單核細胞炎癥蛋白-ip、RANTES、1309、R83915、R91733、HCC1、T58847、D31065、T64262)、CD40配體、C-kit酉己體、膠原蛋白、群落刺激因子(CSF)、補體因子5a、補體抑制劑、補體受體1、細胞因子(例如,上皮中性粒細胞活化肽-78、GROa/MGSA、GRO卩、GROy、MlP-la、MIP-15、MCP-1)、表皮生長因子(EGF)、促紅細胞生成素("EPO",代表通過并入一個或多個非天然氨基酸修飾的優(yōu)選靶)、脫落毒素A和B、因子IX、因子VII、因子VIII、因子X、成纖維細胞生長因子(FGF)、纖維蛋白原、纖維粘連蛋白、G-CSF、GM-CSF、葡糖腦苷脂酶、促性腺激素、生長因子、剌猬蛋白(例如,音速(Sonic)、印度(Indian)、沙漠(Desert))、血紅蛋白、肝細胞生長因子(HGF)、水蛭素、人血清白蛋白、胰島素、類胰島素生長因子(IGF)、干擾素(例如,IFN-a、IFN-(3、IFN-Y)、白細胞介素(例如,IL-1、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL墨8、IL-9、IL-10、IL-ll、IL-12等)、角質細胞生長因子(KGF)、乳鐵蛋白、白血病抑制因子、熒光素酶、神經營養(yǎng)因子、中性粒細胞抑制因子(NIF)、抑瘤素M、成骨蛋白、甲狀旁腺激素、PD-ECSF、PDGF、肽激素(例如,人生長激素)、多效生長因子、蛋白質A、蛋白質G、致熱性外毒素A、B和C、松馳素、腎素、SCF、可溶性補體受體I、可溶性I-CAM1、可溶性白細胞介素受體(IL-1、2、3、4、5、6、7、9、10、11、12、13、14、15)、可溶性TNF受體、生長調節(jié)素、生長抑素、生長激素、鏈激酶、超抗原(即葡萄球菌腸毒素(SEA、SEB、SEC1、SEC2、SEC3、SED、SEE))、超氧化物歧化酶(SOD)、中毒性休克綜合癥毒素(TSST-1)、胸腺肽otl、組織型纖溶酶原活化劑、腫瘤壞死因子|3(TNFP)、腫瘤壞死因子受體(TNFR)、腫瘤壞死因子a(TNFa)、血管內皮生長因子(VEGEF)、尿激酶等。可使用本文所述的用于活體內并入非天然氨基酸的組合物和方法產生的一類蛋白質包括轉錄調節(jié)蛋白或其部分。轉錄調節(jié)蛋白的實例包括調節(jié)細胞生長、分化、調控等的基因和轉錄調節(jié)蛋白。轉錄調節(jié)蛋白可在原核生物、病毒和真核生物(包括真菌、植物、酵母、昆蟲,和動物,包括哺乳動物)中發(fā)現,從而提供多種治療靶。應了解,表達和轉錄活化因子通過許多機制,例如通過結合受體、刺激信號轉導級聯(lián)、調控轉錄因子表達、結合啟動子和增強子、與結合啟動子和增強子的蛋白質結合、解開DNA、剪接前體mRNA、使RNA多聚腺苷酸化和降解RNA,來調控轉錄。舉例來說,脊椎動物細胞中的GAL4蛋白或其部分的組合物也為本發(fā)明的特征。通常,GAL4蛋白或其部分包含至少一個非天然氨基酸。也參看本文中題為"正交氨酰基-tRNA合成酶"的章節(jié)。本發(fā)明的一類蛋白質(例如,具有一個或多個非天然氨基酸的蛋白質)包括表達活化因子,諸如細胞因子、炎癥分子、生長因子、其受體和癌基因產物,例如白細胞介素(例如,IL-1、IL-2、IL-8等)、干擾素、FGF、IGF-I、IGF墨II、FGF、PDGF、TNF、TGF-a、TGF-p、EGF、KGF、SCF/c-Kit、CD40L/CD40、VLA-4/VCAM-l、ICAM-1/LFA-1和透明質酸/CD44;信號轉導分子和相應癌基因產物,例如,Mos、Ras、Raf禾口Met;和轉錄活化因子和抑制因子,例如p53、Tat、Fos、Myc、Jun、Myb、Rel,和類固醇激素受體,諸如雌激素、孕酮、睪酮、醛固酮、LDL受體配體和皮質酮的受體。本發(fā)明還提供具有至少一個非天然氨基酸的酶(例如,工業(yè)酶)或其部分。酶的實例包括(但不限于)例如酰胺酶、氨基酸消旋酶、?;?、脫鹵酶、雙加氧酶、二芳基丙垸過氧化物酶、表異構酶、環(huán)氧化物水解酶、酯酶、異構酶、激酶、葡萄糖異構酶、糖苷酶、糖基轉移酶、鹵素過氧化物酶、單加氧酶(例如,p450)、脂肪酶、木素過氧化物酶、腈水合酶、腈水解酶、蛋白酶、磷酸酶、枯草桿菌蛋白酶、轉氨酶和核酸酶。這些蛋白質中有許多在市面上有售(例如參看,SigmaBiosciences2002目錄和報價單),且相應蛋白質序列和基因以及其許多常見變異體眾所周知(例如參看Genbank)??赏ㄟ^插入根據本發(fā)明的一個或多個非天然氨基酸來修飾其中任一種,從而例如改變蛋白質的所關注的一種或多種治療、診斷或酶特性。治療相關特性的實例包括血清半衰期、保存半衰期、穩(wěn)定性、免疫原性、治療活性、可檢測性(例如,通過在非天然氨基酸中包涵報告子基團(例如,標記或標記結合位點))、LD50或其它副作用的減少、通過腸道進入身體的能力(例如,口服生物可用性)等。診斷特性的實例包括保存半衰期、穩(wěn)定性、診斷活性、可檢測性等。相關酶特性的實例包括保存半衰期、穩(wěn)定性、酶活性、生產量等。還可對多種其它蛋白質加以修飾以包括本發(fā)明的一個或多個非天然氨基酸。舉例來說,本發(fā)明可包括利用例如以下來源的蛋白質中的非天然氨基酸取代一種或多種蛋白疫苗中的一個或多個天然氨基酸感染性真菌,例如曲霉屬U印wg///^)、念珠菌屬(Omcfe/a);充當病原菌模型的細菌、尤其大腸桿菌,以及醫(yī)學上重要的細菌,諸如葡萄球菌屬(5top/^/ococcz')(例如,金黃葡萄球菌(awe^))或鏈球菌屬(S/r印,ococcO(例如,肺炎鏈球菌(;"ewmom'ae));原生生物,諸如孢子蟲類(sporozoa)(例如,,原蟲(尸/畫o&a))、根足蟲)(例如,內阿米巴屬(嵐謂oe6a))禾口鞭毛蟲(flagellate)(錐蟲(D7戸歸0應)、禾U什曼蟲(Leish附疆.a)、毛滴蟲(7Wc/wmo"^)、賈第蟲(Gz'aWa)等);病毒,諸如(+)RNA病毒(實例包括痘病毒,例如牛痘(v"c"'m'");細小核糖核酸病毒,例如,脊髓灰質炎病毒&0//0);外衣病毒,例如風疹病毒(rw6e//a);黃病毒,例如HCV;和冠狀病毒)、(-)RNA病毒(例如,棒狀病毒,例如VSV;副粘病毒,例如RSV;流感粘病毒,例如流感病毒;本雅病毒(Bunyavirus);和腺病毒)、dsDNA病毒(例如,呼腸孤病毒(Reovims))、RNA變?yōu)镈NA的病毒(即逆轉錄病毒,例如HIV和HTLV)和某些DNA變?yōu)镽NA的病毒(諸如乙型肝炎病毒)。農業(yè)相關的蛋白也為非天然氨基酸修飾的適當靶,諸如昆蟲抗性蛋白(例如,Cry蛋白)、淀粉和脂質產生酶、植物和昆蟲毒素、毒素抗性蛋白、霉菌毒素脫毒蛋白、植物生長酶(例如,1,5-二磷酸核酮糖羧化酶/加氧酶,"RUBISCO")、脂氧合酶(LOX)和烯醇丙酮酸磷酸(PEP)羧化酶。本發(fā)明還提供用于在脊椎動物細胞中產生至少一種包含至少一個非天然氨基酸的蛋白質的方法(以及由所述方法產生的蛋白質)。舉例來說,方法包括使包含包括至少一個選擇性密碼子且編碼蛋白質的核酸的脊椎動物細胞在適當培養(yǎng)基中生長。脊椎動物細胞還包含正交tRNA(O-tRNA),其在細胞中起作用并且識別選擇性密碼子;和正交氨?;?tRNA合成酶(O-RS),其優(yōu)先利用非天然氨基酸將O-tRNA氨?;?;并且所述培養(yǎng)基包含非天然氨基酸。在一個實施例中,所述方法另外包括將非天然氨基酸并入蛋白質中,其中所述非天然氨基酸包含第一反應性基團;和使所述蛋白質與包含第二反應性基團的分子(例如,染料、例如聚乙二醇衍生物等聚合物、光交聯(lián)劑、細胞毒性化合物、親和標記、生物素衍生物、樹脂、第二蛋白質或多肽、金屬螯合劑、輔因子、脂肪酸、碳水化合物、多聚核苷酸(例如,DNA、RNA等)等)接觸。第一反應性基團與第二反應性基團反應以通過[3+2]環(huán)加成將所述分子與非天然氨基酸連接。在一個實施例中,第一反應性基團為炔基或疊氮基部分且第二反應性基團為疊氮基或炔基部分。舉例來說,第一反應性基團為炔基部分(例如,在非天然氨基酸對炔丙基氧基苯丙氨酸中)且第二反應性基團為疊氮基部分。在另一實例中,第一反應性基團為疊氮基部分(例如,在非天然氨基酸對疊氮基-L-苯丙氨酸中)且第二反應性基團為炔基部分。在一個實施例中,0-RS利用非天然氨基酸以與具有(例如)如SEQIDNO.:86或45中所述的氨基酸序列的O-RS至少50%—樣的效率將O-tRNA氨?;?。在另一實施例中,O-tRNA包含SEQIDNO::65或64或者其互補多聚核苷酸序列;由SEQIDNO.:64或65或者其互補多聚核苷酸序列加工;或由SEQIDNO.:64或65或者其互補多聚核苷酸序列編碼。在另一實施例中,O-RS包含SEQIDNO.:36-63和/或86中任一序列所述的氨基酸。所編碼的蛋白質可包含例如治療性蛋白質、診斷性蛋白質、工業(yè)酶或其部分。由所述方法產生的蛋白質任選進一步經非天然氨基酸修飾。舉例來說,任選通過至少一種活體內翻譯后修飾來修飾由所述方法產生的蛋白質。還提供產生篩選或選擇轉錄調節(jié)蛋白的方法.(以及由所述方法產生的篩選或選擇轉錄調節(jié)蛋白)。舉例來說,方法包括選擇第一多聚核苷酸序列,其中所述多聚核苷酸序列編碼核酸結合結構域;和使所述第一多聚核苷酸序列突變以包括至少一個選擇性密碼子。這將提供篩選或選擇多聚核苷酸序列。所述方法還包括選擇第二多聚核苷酸序列,其中所述第二多聚核苷酸序列編碼轉錄活化結構域;提供包含可操作性連接到第二多聚核苷酸序列的篩選或選擇多聚核苷酸序列的構建體;和將所述構建體、非天然氨基酸、正交tRNA合成酶(O-RS)和正交tRNA(O-tRNA)引入細胞中。利用這些組件,O-RS優(yōu)先利用非天然氨基酸將O-tRNA氨?;?,且52O-tRNA識別選擇性密碼子,并響應篩選或選擇多聚核苷酸序列中的選擇性密碼子將非天然氨基酸并入核酸結合結構域中,從而提供篩選或選擇轉錄調節(jié)蛋白。在某些實施例中,本發(fā)明的方法和/或組合物中的所關注蛋白質或多肽(或其部分)是由核酸編碼。通常,核酸包含至少一個選擇密碼子、至少兩個選擇密碼子、至少三個選擇密碼子、至少四個選擇密碼子、至少五個選擇密碼子、至少六個選擇密碼子、至少七個選擇密碼子、至少八個選擇密碼子、至少九個選擇密碼子、十個或十個以上選擇密碼子。可使用所屬領域技術人員眾所周知且在本文中在"誘變和其它分子生物學技術"下描述的方法誘變編碼所關注蛋白質或多肽的基因以包括例如一個或多個選擇性密碼子以便并入非天然氨基酸。舉例來說,使所關注蛋白質的核酸誘變以包括一個或多個選擇性密碼子,從而插入一個或多個非天然氨基酸。本發(fā)明包括例如包括至少一個非天然氨基酸的任何蛋白質的任何此種變異體(例如,突變體)型式。類似地,本發(fā)明還包括相應核酸,即,具有一個或多個編碼一個或多個非天然氨基酸的選擇性密碼子的任何核酸。純化包含非天然氨基酸的重組蛋白根據所屬領域技術人員已知且使用的標準程序,可將本發(fā)明的蛋白質(例如包.含非天然氨基酸的蛋白質、針對包含非天然氨基酸的蛋白質的抗體等)部分或實質上純化成均質。因此,可通過所屬領域中眾所周知的眾多方法中的任一種來回收和純化本發(fā)明的多肽,這些方法包括例如硫酸銨或乙醇沉淀、酸或堿萃取、柱色譜、親和柱色譜、陰離子或陽離子交換色譜、磷酸纖維素色譜、疏水相互作用色譜、羥基磷灰石色譜、凝集素色譜、凝膠電泳等。必要時,在制備正確折疊的成熟蛋白質時可使用蛋白質再折疊步驟??蓪⒏咝б合嗌V(HPLC)、親和色譜或其它適合方法用于需要高純度的最后純化步驟中。在一個實施例中,將針對非天然氨基酸(或包含非天然氨基酸的蛋白質)制成的抗體用作純化試劑,例如以基于親和力純化包含一個或多個非天然氨基酸的蛋白質。必要時,在部分純化或純化達到均質后,任選將多肽例如用作分析組分、治療劑或抗體產生的免疫原。除了本文中指出的其它參考文獻之外,所屬領域中眾所周知多種純化/蛋白質折疊方法,包括例如以下文獻中描述的那些R.Scopes,ProteinPurification,Springer-Verlag,N.Y.(1982);Deutscher,MethodsinEnzymology第182巻GuidetoProteinPurification.AcademicPress,Inc.N.Y.(1990);Sandana,(1997)BioseparationofProteins.AcademicPress,Inc.;Bollag等人(1996)ProteinMethods,第2版Wiley-Liss,NY;Walker,(1996)TheProteinProtocolsHandbookHumanaPress,NJ,Harris禾口Angal,(1990)ProteinPurificationApplications:APracticalApproachIRLPressatOxford,Oxford,England;Harris禾口Angal,ProteinPurificationMethods:APracticalApproachIRLPressatOxford,Oxford,England;Scopes,(1993)ProteinPurification:PrinciplesandPractice第3版SpringerVerlag,NY;Janson禾口Ryden,(1998)ProteinPurification:Principles.HighResolutionMethodsandApplications,第2版Wiley-VCH,NY;禾口Walker(1998),ProteinProtocolsonCD-ROMHumanaPress,NJ;以及其中所引用的參考文獻。在脊椎動物細胞中產生具有至少一個非天然氨基酸的所關注蛋白質或多肽的一個優(yōu)點在于,通常所述蛋白質或多肽將以其天然構象折疊。然而,在本發(fā)明某些實施例中,所屬領域技術人員將認識到,在合成、表達和/或純化之后,蛋白質可具有與相關多肽的所需構象不同的構象。在本發(fā)明一個方面中,所表達的蛋白質任選變性且隨后復性。這是例如通過將伴侶蛋白(chaperonin)添加到所關注蛋白質或多肽中,和/或通過將蛋白質溶解于諸如鹽酸胍等離液劑中來實現。一般來說,有時候需要變性和還原所表達的多肽且隨后使多肽再折疊成優(yōu)選構象。舉例來說,可將胍、尿素、DTT、DTE和/或伴侶蛋白添加到所關注翻譯產物中。所屬領域技術人員眾所周知還原、變性和復性蛋白質的方法(參看上述參考文獻,以及Debinski等人,(1993)J.Biol.Chem.,268:14065-14070;Kreitman和Pastan(1993)Bioconjug.Chem.,4:581-585;禾口Buchner等人,(1992)Anal.Biochem.,205:263-270)。舉例來說,Debinski等人描述在胍-DTE中使包涵體蛋白質變性和還原。所述蛋白質可在含有例如氧化谷胱甘肽和L-精氨酸的氧化還原緩沖液中再折疊。再折疊試劑可流動或以其它方式移動以與一種或多種多肽或其它表達產物接觸,或者一種或多種多肽或其它表達產物可流動或以其它方式移動以與再折疊試劑接觸??贵w一方面,本發(fā)明提供針對本發(fā)明的分子,例如合成酶、tRNA和包含非天然氨基酸的蛋白質的抗體。針對本發(fā)明的分子的抗體可用作純化試劑,例如以供純化本發(fā)明的分子。此外,可將所述抗體用作指示劑以指示合成酶、tRNA或包含非天然氨基酸的蛋白質的存在,例如以便追蹤所述分子的存在或位置(例如,活體內或原位)。本發(fā)明的抗體可為包含一個或多個實質上或部分由免疫球蛋白基因或免疫球蛋白基因片段編碼的多肽的蛋白質。認可的免疫球蛋白基因包括K、x、a、y、S、s和p恒定區(qū)基因,以及多種免疫球蛋白可變區(qū)基因。輕鏈分為K或x。重鏈分為y、ha、S或s,其又分別定義免疫球蛋白種類IgG、IgM、IgA、IgD和IgE。典型免疫球蛋白(例如抗體)結構單元包含四聚體。各四聚體是由兩對相同的多肽鏈構成,各對具有一條"輕鏈"(約25kD)和一條"重鏈"(約50-70kD)。各鏈的N末端界定主要負責抗原識別的具有約100到110或更多個氨基酸的可變區(qū)。術語可變輕鏈(VL)和可變重鏈(Vh)分別是指這些輕鏈和重鏈。抗體是以完整免疫球蛋白形式或由各種肽酶消化產生的多個充分表征的片段的形式存在。因此,舉例來說,胃蛋白酶消化抗體鉸鏈區(qū)中的二硫鍵聯(lián),產生F(ab')2,即Fab的二聚體,所述Fab本身為通過二硫鍵與VH-CH1連接的輕鏈。F(ab')2可在溫和條件下還原以斷開鉸鏈區(qū)中的二硫鍵聯(lián),從而將F(ab')2二聚體轉化成Fab'單體。Fab'單體基本上為具有鉸鏈區(qū)的部分的Fab(關于其它抗體片段的更為詳細地描述,參看FundamentalImmunology.第4版,W.E.Paul編,RavenPress,N.Y.(1999))。盡管根據完整抗體的消化定義各種抗體片段,但所屬領域技術人員將了解,所述Fab'片段等可以化學方法或通過利用重組DNA方法重新合成。因此,如本文所使用,術語抗體還任選包括由修飾完整抗體產生或使用重組DNA方法重新合成的抗體片段??贵w包括單鏈抗體,包括單鏈Fv(sFv或scFv)抗體,其中可變重鏈與可變輕鏈連接在一起(直接連接或通過肽連接子連接)形成連續(xù)多肽。本發(fā)明的抗體可例如為多克隆抗體、單克隆抗體、嵌合抗體、人化抗體、單鏈抗體、Fab片段、由Fab表達文庫產生的片段等。一般說來,本發(fā)明的抗體在多種分子生物或制藥過程中作為普通試劑和治療劑都極具價值。產生多克隆和單克隆抗體的方法可得到,并且可用于制造本發(fā)明的抗體。多個基本文本中描述標準抗體產生方法,包括例如Borrebaeck(編)(1995)AntibodyEngineering.第2版FreemanandCompany,NY(Borrebaeck);McCafferty等人(1996)AntibodyEngineering,APracticalApproachIRLOxfordPress,Oxford,England(McCafferty);禾口Paul(1995)AntibodyEngineeringProtocolsHumanaPress,Towata,NJ(Paul);Paul(編),(1999)FundamentalImmunology.第5版RavenPress,N.Y.;Coligan(1991)CurrentProtocolsinImmunologyWiley/Greene,NY;Harlow禾口Lane(1989)Antibodies:ALaboratoryManualColdSpringHarborPress,NY;Stites等人(編)BasicandClinicalImmunology(第4版)LangeMedicalPublications,LosAltos,CA,和其中引用的參考文獻;Goding(1986)MonoclonalAntibodies:PrinciplesandPractice(第2版)AcademicPress,NewYork,NY;以及Kohler和Milstein(1975)Nature256:495-497。已開發(fā)出多種用于抗體制備的不依賴于例如將抗原注射到動物中的重組技術,并且可將其用于本發(fā)明的情形中。舉例來說,有可能在噬菌體或類似載體中產生并選擇重組抗體文庫。關于評論,例如參看Winter等人(1994)Mafe'"gJ""6o^"^尸/wgeZ)z'"/a;;rgc/z"o/ogvA腿.Rev.Immunol.12:433-55和其中所引用的參考文獻。還參看,Griffiths禾口Duncan(1998)iSYm&g^/orse/e"/o"o/6>>-agefifop一CurrOpinBiotechnol9:102-8;Hoogenboom等人(1998)^4""6o辦_p/agg<i—/a_y/"ecA"o/ogy朋c/"卯//(^".0朋Immunotechnology4:1-20;Gram等人(1992)/"/附ww"og/o6w/Z"/Ara7PNAS89:3576-3580;Huse等人(1989)Science246:1275-1281;和Ward等人(1989)Nature341:544-546。在一個實施例中,抗體文庫可包括V基因譜系(例如,從淋巴細胞群采集或在活體外組裝),其經克隆以在絲狀噬菌體表面上展示相關重鏈和輕鏈可變結構域。通過結合抗原來選擇噬菌體??扇苄钥贵w是由感染噬菌體的細菌表達并且可例如經由誘變來改進抗體。例如參看,Balint禾QLarrick(1993)乂""6o辦^尸an7'歸"f(9wxA/utoge"e^Gsnc137:109-118;Stemmer等人(1993)<SWeWowo/朋Jcfz've>S7wg/e-CTza/wy4wri6ot(vFn9附aiVof"'"丄/wA;er丄z'6rar3;Prepare<i£>K_y/wa^c/"verse戶CiBiotechniques14(2):256-65;Crameri等人(1996)Co"欲wcriowa"<ievo/Wo"q/h""6o辦"http://zagg//6m"'^ZWJ^/zw^7z'"gNatureMedicine2:100-103;以及Crameri禾口Stemmer(1995)Cow6f"a/"oWa/7nw//7》/ec<xwe"ewwtagewewicreafesa////zeper腦加z'owo/麵她/"ccm"e"esBioTechniques18:194-195。用于克隆和表達重組抗體噬菌體系統(tǒng)的試劑盒也已知且可得,例如來自Amersham-PharmaciaBiotechnology(Uppsala,Sweden)的"重組噬菌體抗體系統(tǒng)小鼠ScFv組件(mouseScFvmodule)"。也已產生噬菌體抗體文庫以通過鏈改組制造高親和力人類抗體(例如參看,Marks等人(1992)3少-Pa^/"g/wwwm'za"o",萬w/Wf"gi/妙4^m'(y^"扁朋Jw/^oW"C7zaz'w5Tzw,wgBiotechniques10:779-782)。還應認識到,可通過多種商務服務中任一種(例如,BethylLaboratories(Montgomery,TX)、Anawa(Switzerland)、Eurogentec(Belgium且在US,Philadelphia,PA)等制備抗體。在某些實施例中,將本發(fā)明的抗體"人化"是有用的,例如在所述抗體將會治療性給予的情況下。使用人化抗體傾向于減少針對治療性抗體的不合需要的免疫反應的發(fā)生率(例如,當患者為人類時)。上述抗體參考文獻中描述人化策略。除人化抗體外,人類抗體也為本發(fā)明的特征。人類抗體是由特征性人類免疫球蛋白序列組成。人類抗體可使用多種方法產生(關于評論,例如參看Larrick等人的美國專利第5,001,065號)。通過三源雜交瘤技術產生人類抗體的通用方法描述于Ostberg等人(1983),/^油顧2:361-367;Ostberg的美國專利第4,634,664號和Engelman等人的美國專利第4,634,666號中。已知多種將抗體用于蛋白質的純化和檢測中的方法,且其可用于檢測和純化如本文所述包含非天然氨基酸的蛋白質。一般說來,抗體為ELISA、Westem印跡法、免疫化學、親和色譜法、SPR和許多其它方法的有用試劑。上文所述的參考文獻提供有關如何執(zhí)行ELISA分析、Western印跡、表面等離子體共振(SPR)等的細節(jié)。在本發(fā)明一方面中,本發(fā)明的抗體本身包括非天然氨基酸,提供具有所關注特性的抗體(例如,改進的半衰期、穩(wěn)定性、毒性等)。還參看本文中題為"具有非天然氨基酸的多肽"的章節(jié)。抗體占當前臨床試驗中所有化合物的近50。/。(Wittmp,(1999)尸/^geowcfap/avTibtech17:423-424)且抗體普遍用作診斷試劑。因此,利用非天然氨基酸修飾抗體的能力提供修飾這些有價值的試劑的重要工具。舉例來說,存在將MAb用于診斷領域的多種應用。分析范圍從簡單的斑點試驗到較為復雜的方法,諸如用于腫瘤成像的來自DuPontMerckCo.放射性標記的NR-LU-10MAb(Rusch等人(1993)iVi-丄L^0婦朋c/o朋/朋hZw辦5ca應'"g.jAe/p/w/CardiovascSurg106:200-4)。如所述,MAb為ELISA、Western印跡法、免疫化學、親和色譜法等的重要試劑??蓪θ魏未祟愒\斷抗體加以修飾以包括一個或多個非天然氨基酸,從而改變例如Ab對靶的特異性或親合力,或例如通過在非天然氨基酸中包括可檢測標記(例如,光譜、熒光、發(fā)光等)來改變一種或多種可檢測特性。一類有價值的抗體試劑為治療性Ab。舉例來說,抗體可為通過靶向腫瘤細胞以通過抗體依賴細胞介導的細胞毒性(ADCC)或補體介導的細胞溶解(CML)破壞來阻止腫瘤生長的腫瘤特異性Mab(這些常見類型的Ab有時稱為"魔術彈(magicbullet)")。一個實例為利妥昔單抗(Rituxan),一種治療非霍奇金氏淋巴瘤(Non-Hodgkinslymphoma)的抗CD20Mab(Scott(1998)i/to/扁6:aw,Aera;eWcwomc/owcr/aw幼o辦/or"0"-//^沐"^/,//w則CancerPract6:195-7)。第二個實例涉及干擾腫瘤生長的關鍵組分的抗體。赫賽汀(Herceptin)為一種用于治療轉移性乳癌的抗HER-2單克隆抗體,并且提供具有此作用機制的抗體的實例(Basdga等人(1998)ieco附^/waw/1/zwmaw/zet/awf/-/^^72awfz'6o^i^(7i/ercep/7wjew/zawcesa打fffwmorac/7v/(y<9/p"c///axe/<ioxorwZ/c/"ga/wsfii/Ei2/wewoverex/r《5^f打g/zw/na打6rea5tca"cerxewogm/"[公開的勘誤表見于CancerRes(1999)59(8):2020],CancerRes58:2825-31)。第三個實例涉及將細胞毒性化合物(毒素、放射性核素等)直接遞送到腫瘤或其它所關注部位的抗體。舉例來說,一個應用Mab為CYT-356,—種將輻射直接靶向前列腺腫瘤細胞的90Y連接的抗體(Deb等人7>ea^eW0//zw7wwe-re/ra"or;;p簡加ec朋cerw/z7卯7-ClT-35(5歸woc/owa/朋/7'6o辦ClinCancerRes2:1289-97)。第四個應用為抗體定向酶前藥療法(antibody-directedenzymeprodrugtherapy),其中共定位于腫瘤的酶可活化在腫瘤鄰近地區(qū)中全身給予的前藥。舉例來說,正開發(fā)一種連接到羧肽酶A的抗Ep-CAM1抗體來治療結腸直腸癌(Wolfe等人(1999)爿w幼o辦-<iz>ec,e<if/era"術'A77(58GwwtoWo/A膽awcar6ox"印rit/flwe力丄.<3"<i/"由oWwcf^w//7z//xxirag》o/膨/7zo/rex她朋d^z,/一她■orsGW/OWa"<iBioconiugChem10:38-48)。其它Ab(例如,拮抗劑)經設計以特異性抑制正常細胞功能用于治療益處。實例為奧素健體(Orthoclone)OKT3,一種由強生公司(JohnsonandJohnson)所提供的用于減少急性器官移植物排斥的抗CD3MAb(Strate等人(1990)CW/wc/o"eOST3w/^/"http://"e/7emj9少ac她rewa/a〃0grq/rej'ecricwTransplantProc22:219-20)。另~^類抗體產物為激動劑。這些Mab經設計以特異性增強正常細胞功能用于治療益處。舉例來說,用于神經療法的基于Mab的.J先膽堿受體激動劑正在開發(fā)中(Xie等人zWeW訴c加"wc;/"agom'rfScFvNat.Biotechnol.15:768-71)。這些抗體中任一種可經修飾以包括一個或多個非天然氨基酸以增強一種或多種治療特性(特異性、親合力、血清半衰期等)。另一類抗體產物提供新穎功能。這一組中的主要抗體為巳經工程改造以模擬酶的催化能力的催化抗體,諸如Ig序列(Wentworth和Janda(1998)Q^a(y"ca"〃6o&^CurrOpinChemBiol2:138-44)。舉例來說,值得關注的應用涉及使用催化抗體mAb-15A10以在活體內水解可卡因(cocaine)以用于成癮的治療(Mets等人(1998)Acato/,'caw,/6o辦agaz'wWcocaz'we_preve"&coca/weant/tox/c她ProcNatlAcadSciUSA95:10176-81)。催化抗體還可經修飾以包括一個或多個非天然氨基酸以改進一種或多種所關注特性。通過免疫反應性定義多肽由于本發(fā)明的多肽提供多種新的多肽序列(例如,在本文中的翻譯系統(tǒng)中合成的蛋白質的情況下包含非天然氨基酸;或例如在本文中新穎合成酶的情況下,包含新穎標準氨基酸序列),故所述多肽還提供可例如在免疫學分析中識別的新結構特征。特異性結合本發(fā)明多肽的抗體或抗血清的產生以及所述抗體或抗血清所結合的多肽為本發(fā)明的特征。舉例來說,本發(fā)明包括合成酶蛋白,其特異性結合針對包含選自(SEQIDNO:36-63和/或86)中一個或多個序列的氨基酸序列的免疫原所產生的抗體或抗血清或與所述抗體或抗血清特異性免疫反應。為除去與其它同源物交叉反應,利用諸如野生型大腸桿菌酪氨?;铣擅?TyrRS)(例如SEQIDNO.:2)等可用對照合成酶同源物消減抗體或抗血清。在一種典型形式中,免疫分析使用針對一種或多種包含一個或多個對應于SEQIDNO:36-63和/或86中一個或多個序列或者其實質子序列(即,提供至少約30%的全長序列)的序列的多肽產生的多克隆抗血清。得自SEQIDNO:36-63和86的潛在多肽免疫原組在下文中統(tǒng)稱為"免疫原性多肽"。任選選擇所得抗血清以對于對照合成酶同源物具有低交叉反應性,并且在免疫分析中使用多克隆抗血清之前,利用一種或多種對照合成酶同源物,例如通過免疫吸附去除任何此類交叉反應性。為了能產生用于免疫分析中的抗血清,可如本文所述產生一種或多種免疫原性多肽并加以純化。舉例來說,可在重組細胞中產生重組蛋白。利用免疫原性蛋白與標準佐劑(諸如,夫羅因德佐劑(Freimd'sadjuvant))的組合以及標準小鼠免疫方案,對近交系小鼠(因為結果歸因于小鼠的實質遺傳一致更為可重復從而用于此分析中)進行免疫(有關抗體產生、可用于測定特異性免疫反應性的免疫分析形式和條件,例如參看Harlow禾口Lane(1988)Antibodies,ALaboratoryManual.ColdSpringHarborPublications,NewYork。有關抗體的其它參考文獻和論述也見于本文中且可在本文中用于制造通過免疫反應性定義/檢測多肽的抗體)。另外,可將得自本文中所公開的序列的一種或多種合成或重組多肽與載體蛋白連結并用作免疫原。收集多克隆血清并且在免疫分析,例如,利用一種或多種固定于固體支撐物上的免疫原性蛋白的固相免疫分析中,對免疫原性多肽進行滴定。選擇具有106或更高滴度的多克隆抗血清,匯集并利用對照合成酶多肽消減,以產生消減的經匯集的經滴定多克隆抗血清。在比較免疫分析中,測試消減的所匯集的經滴定多克隆抗血清對于對照同源物的交叉反應性。在這個比較分析中,測定用于消減的經滴定多克隆抗血清的差別結合條件,這引起比結合對照合成酶同源物高至少約5-10倍的經滴定多克隆抗血清和免疫原性合成酶的信噪比。也就是說,通過添加諸如白蛋白或無脂肪奶粉等非特異59性競爭劑,和/或通過調節(jié)鹽條件、溫度等,來調節(jié)結合/洗滌反應的嚴格度。將這些結合/洗滌條件用于后續(xù)分析中,以測定所匯集的經消減的多克隆抗血清是否特異性結合測試多肽(與免疫原性多肽和/或對照多肽相比較的多肽)。具體說來,如與已知合成酶相比,在差別結合條件下展示比對照合成酶同源物高至少2-5x的信噪比以及為免疫原性多肽的至少約y2的信噪比的測試多肽與免疫原性多肽共有相當大的結構相似性,且因此為本發(fā)明的多肽。在另一實例中,將競爭性結合形式的免疫分析用于檢測測試多肽。舉例來說,如所述,通過利用對照多肽的免疫吸附將交叉反應的抗體從匯集的抗血清混合物中去除。隨后,將免疫原性多肽固定于暴露于所匯集的消減抗血清的固體支撐物上。將測試蛋白質添加到所述分析中以競爭結合所匯集的消減抗血清。將與固定蛋白質相比,測試蛋白質競爭結合所匯集的消減抗血清的能力與添加到所述分析中的免疫原性多肽競爭結合的能力(所述免疫原性多肽有效地與固定的免疫原性多肽競爭結合所匯集的抗血清)相比較。使用標準計算法計算測試蛋白質的交叉反應性百分比。在平行分析中,任選與免疫原性多肽競爭結合抗血清的能力相比較,測定對照蛋白質競爭結合所匯集的消減抗血清的能力。再使用標準計算法計算對照多肽的交叉反應性百分比。當測試多肽的交叉反應性百分比為對照多肽的至少5-10x高時,和或當測試多肽的結合大致在免疫原性多肽結合的范圍內時,認為所述測試多肽特異性結合所匯集的消減抗血清。一般說來,可將經免疫吸附且匯集的抗血清用于如本文所述的競爭性結合免疫分析中,以將任何測試多肽與免疫原性和/或對照多肽相比較。為進行這個比較,分別分析多種濃度的免疫原性、測試和對照多肽,并且使用標準技術測定抑制50%的消減抗血清與例如經固定對照、測試或免疫原性蛋白質結合所需的各多肽的量。如果在競爭性分析中結合所需的測試多肽的量比所需的免疫原性多肽的量少2倍,那么只要所述量為對照多肽的至少約5-10x高,即認為測試多肽特異性結合針對免疫原性蛋白質所產生的抗體。作為特異性的另一測定法,任選利用免疫原性多肽(而非對照多肽)完全免疫吸附所匯集的抗血清,直到可檢測到極少所得免疫原性多肽-經匯集的消減抗血清與免疫吸附中所使用的免疫原性多肽的結合或無法檢測到結合。隨后測試所述完全免疫吸附的抗血清與測試多肽的反應性。如果觀察到極少反應性或未觀察到反應性(即,關于完全免疫吸附的抗血清與免疫原性多肽結合觀察到不超過2x的信噪比),那么免疫原性蛋白質引起抗血清與測試多肽的特異性結合。60醫(yī)藥組合物將本發(fā)明的多肽或蛋白質(例如,合成酶、包含一個或多個非天然氨基酸的蛋白質等)任選例如與適當醫(yī)藥載劑組合用于治療用途。所述組合物例如包含治療有效量的化合物和醫(yī)藥學上可接受的載劑或賦形劑。所述載劑或賦形劑包括(但不限于)生理鹽水、緩沖生理鹽水、葡萄糖、水、甘油、乙醇和/或其組合。調配物經制備成與給藥模式相適應。一般來說,所屬領域眾所周知給予蛋白質的方法并且其可應用于給予本發(fā)明的多肽。根據所屬領域眾所周知的方法,任選在一種或多種適當的活體外和/或活體內動物疾病模型中測試包含一種或多種本發(fā)明的多肽的治療性組合物,以確定功效、組織代謝并評估劑量。具體來說,最初可通過本文中非天然氨基酸同源物相對于天然氨基酸同源物的活性、穩(wěn)定性或其它適當量度(例如,經修飾以包括一個或多個非天然氨基酸的EPO與天然氨基酸EPO的比較)(即在相關分析中)來確定劑量。給藥可通過通常用于將分子引入以使其與血液或組織細胞緊密接觸的任何途徑進行。本發(fā)明的非天然氨基酸多肽是以任何適當的方式任選與一種或多種醫(yī)藥學上可接受的載劑一起給予。對患者給予本發(fā)明上下文中的所述多肽的適當方法都可用,且盡管可使用一種以上途徑給予特定組合物,但特定途徑通常能夠提供比另一途徑更快捷且更有效的作用或反應。醫(yī)藥學上可接受的載劑部分是由所給予的特定組合物以及用于給予組合物的特定方法決定。因此,存在多種本發(fā)明醫(yī)藥組合物的適當調配物。多肽組合物可通過多種途徑給予,包括(但不限于)口服、靜脈內、腹膜內、肌肉內、透皮、皮下、局部、舌下或直腸方式。還可經由脂質體給予非天然氨基酸多肽組合物。所屬領域技術人員通常已知所述給藥途徑和適當的調配物。單獨或與其它適當組分組合的非天然氨基酸多肽也可制成氣霧劑調配物(即,其可"成霧狀")以經由吸入給予??蓪忪F劑調配物放入諸如二氯二氟甲烷、丙烷、氮氣等加壓可接受推進劑中。適于不經腸給藥(諸如通過關節(jié)內(在關節(jié)中)、靜脈內、肌肉內、皮內、腹膜內和皮下途徑)的調配物包括水性和非水性等張無菌注射液,其可含有抗氧化劑、緩沖劑、抑菌劑和使調配物與預定接受者血液等張的溶質,以及可包括懸浮劑、增溶劑、增稠劑、穩(wěn)定劑和防腐劑的水性和非水性無菌懸浮液。可于單位劑量或多劑量密封容器(諸如安瓿和小瓶)中提供包裝好的核酸調配物。不經腸給藥和靜脈內給藥是優(yōu)選的給藥方法。具體來說,已經用于天然氨基酸同源物治療劑的給藥途徑(例如,通常用于EPO、GCSF、GMCSF、IFN、白細胞介素、抗體和/或任何其它醫(yī)藥學上遞送蛋白質的途徑)以及當前使用的調配物提供包括本發(fā)明的非天然氨基酸的蛋白質(當前治療性蛋白質的聚乙二醇化變異體等)的優(yōu)選給藥途徑以及調配物。在本發(fā)明的情況下,視應用而定,給予患者的劑量足以在患者體內隨時間實現有益的治療反應,或例如抑制病原體感染或其它適當活性。通過特定組合物/調配物的功效、所使用的非天然氨基酸多肽的活性、穩(wěn)定性或血清半衰期和患者的病狀以及欲治療患者的體重或表面積來確定劑量。劑量大小也通過在特定患者體內伴隨特定組合物/調配物的給藥的任何不利副作用的存在、性質和程度等來確定。在確定疾病(例如,癌癥、遺傳疾病、糖尿病、AIDS等)的治療或預防中欲給予的組合物/調配物的有效量時,醫(yī)師會評估循環(huán)血漿水平、調配物毒性、疾病進展和/或(相關時)抗非天然氨基酸多肽抗體的產生。例如給予70公斤患者的劑量通常在等于當前使用的治療性蛋白質的劑量范圍內,所述范圍可針對相關組合物的活性或血清半衰期的改變而調節(jié)。本發(fā)明的組合物/調配物可通過任何已知的常規(guī)療法來補充治療條件,包括抗體給予、疫苗給予、給予細胞毒性劑、天然氨基酸多肽、核酸、核苷酸類似物、生物反應調節(jié)劑等。對于給藥,本發(fā)明的調配物是以由以下因素所確定的速率給予相關調配物的LD-50,和/或例如當關系到患者的質量和總體健康狀況時,對各種濃度的非天然氨基酸的任何副作用的觀察。給藥可以單次劑量或分劑量實現。如果進行調配物輸注的患者出現發(fā)燒、寒戰(zhàn)或肌肉疼痛,那么其接收適當劑量的阿司匹林(aspirin)、布洛芬(ibuprofen)、對乙酰氨基酚(acetaminophen)或其它疼痛/發(fā)燒控制藥物。在將要進行輸注之前30分鐘,對經歷輸注反應(諸如發(fā)燒、肌肉疼痛和寒戰(zhàn))的患者預先給予阿司匹林、對乙酰氨基酚或例如苯海拉明(diphenhydramine)。將哌替啶(Meperidine)用于不能對解熱劑和抗組織胺快速作出反應的更為嚴重的寒戰(zhàn)和肌肉疼痛。視反應的嚴重程度減緩或中斷治療。核酸和多肽序列及變異體如上文和下文所述,本發(fā)明提供核酸多聚核苷酸序列和多肽氨基酸序列(例如,O-tRNA和O-RS)以及例如包含所述序列的組合物和方法。例如O-tRNA和O-RS等所述序列的實例在本文中公幵(參看表5,例如SEQIDNO.3-65、86,以及SEQIDNO.:l和2)。然而,所屬領域技術人員將了解,本發(fā)明不限于本文(例如,實例和表5)中所公開的這些序列。所屬領域技術人員將了解,本發(fā)明還提供具有本文所述的功能(例如,編碼O-tRNA或O-RS)的許多相關和甚至不相關的序列。本發(fā)明還提供多肽(0-RS);和多聚核苷酸,例如O-tRNA、編碼O-RS或其部分(例如,所述合成酶的活性位點)的多聚核苷酸;用于構建氮?;?tRNA合成酶突變體的寡聚核苷酸等。舉例來說,本發(fā)明的多肽包括包含如SEQIDNO.:36-63和/或86中任一序列中所示的氨基酸序列的多肽;包含由如SEQIDNO.:3-35中任一序列所示的多聚核苷酸序列編碼的氨基酸序列的多肽;以及與對包含如SEQIDNO.:36-63和/或86中任一序列中所示的氨基酸序列的多肽具特異性的抗體特異性免疫反應的多肽;或包含由如SEQIDNO.:3-35中任一序列所示的多聚核苷酸序列編碼的氨基酸序列的多肽。本發(fā)明的多肽中還包括包含與天然存在的酪氨?;滨;?tRNA合成酶(TyrRS)的氨基酸序列(例如,SEQIDNO.:2)至少90%—致的氨基酸序列且包含兩個或兩個以上A-E組氨基酸的多肽。舉例來說,A組包括在與大腸桿菌TyrRS的Tyr37對應的位置的纈氨酸、異亮氨酸、亮氨酸、甘氨酸、絲氨酸、丙氨酸或蘇氨酸;B組包括在與大腸桿菌TyrRS的Asnl26對應的位置的天冬氨酸;C組包括在與大腸桿菌TyrRS的Asp182對應的位置的蘇氨酸、絲氨酸、精氨酸、天冬酰胺或甘氨酸;D組包括在與大腸桿菌TyrRS的Phel83對應的位置的甲硫氨酸、丙氨酸、纈氨酸或酪氨酸;且E組包括在與大腸桿菌TyrRS的Leul86對應的位置的絲氨酸、甲硫氨酸、纈氨酸、半胱氨酸、蘇氨酸或丙氨酸。類似地,本發(fā)明的多肽還包括包含SEQIDNO.:36-63和/或86的至少20個相鄰氨基酸以及兩個或兩個以上如上文在A-E組中所述的氨基酸取代的多肽。還包括包含任一上述多肽的保守變異體的氨基酸序列作為本發(fā)明的多肽。在一個實施例中,組合物包括本發(fā)明的多肽和賦形劑(例如,緩沖液、水、醫(yī)藥學上可接受的賦形劑等)。本發(fā)明還提供與本發(fā)朋的多肽特異性免疫反應的抗體或抗血清。本發(fā)明中還提供多聚核苷酸。本發(fā)明的多聚核苷酸包括編碼本發(fā)明的所關注蛋白質或多肽或包括一個或多個選擇性密碼子或二者的多聚核苷酸。舉例來說,本發(fā)明的多聚核苷酸包括例如包含如SEQIDNO.:3-35、64-85中任一序列所述的核苷酸序列的多聚核苷酸;與其多聚核苷酸序列互補或編碼其多聚核苷酸序列的多聚核苷酸;和/或編碼包含如SEQIDNO.:36-63和/或86中任一序列中所述的氨基酸序列的多肽的多聚核苷酸,或其保守變異體。本發(fā)明的多聚核苷酸還包括編碼本發(fā)明的多肽的多聚核苷酸。類似地,在高度嚴格條件下在實質上整個核酸長度上與上文所述的多聚核苷酸雜交的核酸為本發(fā)明的多聚核苷酸。本發(fā)明的多聚核苷酸還包括編碼多肽的多聚核苷酸,所述多肽包含與天然存在的酪氨?;滨;?tRNA合成酶(TyrRS)的氨基酸序列(例如,SEQIDNO.:2)至少90%—致的氨基酸序列且包含兩個或兩個以上如上文在第ll段中A-E組中所述的突變。本發(fā)明的多聚核苷酸中還包括與上文所述的多聚核苷酸至少70%(或至少75%、至少80%、至少85%、至少90%、至少95%、至少98%或至少99%或更多)一致的多聚核苷酸,和/或包含任一上文所述的多聚核苷酸的保守變異體的多聚核苷酸。在某些實施例中,載體(例如,質粒、柯斯質粒、噬菌體、病毒等)包含本發(fā)明的多聚核苷酸。在一個實施例中,載體為表達載體。在另一實施例中,表達載體包括可操作性連接到一個或多個本發(fā)明的多聚核苷酸的啟動子。在另一實施例中,細胞包含包括本發(fā)明的多聚核苷酸的載體。技術人員還應了解,所公開的序列的許多變異體都包括在本發(fā)明中。舉例來說,本發(fā)明中包括得到功能相同的序列的所公開的序列的保守變異體。認為核酸多聚核苷酸序列的變異體與至少一個所公開的序列雜交的變異體包括在本發(fā)明中。本發(fā)明中還包括如例如通過標準序列比較技術確定的本文所公開的序列的獨特子序列。保守變異體歸因于遺傳密碼的簡并性,"沉默取代(silentsubstitution)"(即,不會引起所編碼的多肽改變的核酸序列的取代)為編碼氨基酸的各核酸序列所暗含的特征。類似地,"保守氨基酸取代"(即,氨基酸序列中一個或數個氨基酸經具有高度相似性的不同氨基酸取代)也易于鑒別為與所公開的構建體高度相似。所述各所公開序列的保守變異體為本發(fā)明的特征。,特定核酸序列的"保守變異體"是指編碼相同或基本上相同的氨基酸序列的核酸,或當所述核酸不編碼氨基酸序列時是指基本上相同的序列。所屬領域技術人員將認識到,在編碼序列中改變、添加或缺失單一氨基酸或少量氨基酸(通常小于5%,更通常小于4%、2%或1%)的個別取代、缺失或添加為"保守性修飾變異",其中所述改變將導致氨基酸的缺失、氨基酸的添加或化學上類似的氮基酸對氨基酸的取代。因此,本發(fā)明所列多肽序列的"保守變異"包括少量、通常小于5%、更通常小于2%或1%的多肽序列的氨基酸經具有相同保守取代基團的保守所選氨基酸取代。最后,不改變核酸分子的編碼活性的序列的添加(諸如,非功能性序列的添加)為基本核酸的保守變異。所屬領域技術人員眾所周知提供功能類似的氨基酸的保守取代表。以下陳述含有包括彼此互為"保守取代"的天然氨基酸的例示性群組:保守取代組<table>tableseeoriginaldocumentpage65</column></row><table>核酸雜交可使用比較雜交來鑒別本發(fā)明的核酸,包括本發(fā)明核酸的保守變異體,并且所述比較雜交方法是區(qū)別本發(fā)明的核酸的優(yōu)選方法。此外,與SEQIDNO:3-35、64-85所示的核酸在高、超高和極高嚴格條件下雜交的靶核酸為本發(fā)明的特征。所述核酸的實例包括與指定的核酸序列相比具有一個或數個沉默或保守核酸取代的核酸。當測試核酸以其與完全匹配的互補靶雜交的至少1/2水平與探針雜交時,g卩,以高達探針與靶在一定條件下(其中完全匹配的探針以關于與任何不匹配靶核酸雜交所觀察到的信噪比的至少約5x-10x高的信噪比與完全匹配的互補靶結合)雜交的信噪比的至少1/2信噪比雜交時,認為所述測試核酸與探針核酸特異性雜交。當核酸通常在溶液中締合時,其"雜交"。核酸因存在多種諸如氫鍵、溶劑排斥、堿基堆疊等充分表征的物理化學力而雜交。核酸雜交的廣泛指導可見于Tijssen(1993)iVwc/ez'dWJVo6es第2章第I部分,"Overviewofprinciplesofhybridizationandthestrategyofnucleicacidprobeassays,"(Elsevier,NewYork),以及Ausubel,廚J:文中。Hames禾口Higgins(1995)GeneProbes1IRLPressatOxford'UniversityPress,Oxford,England,(HamesandHigginsl)以及Hames禾口Higgins(1995)GeneProbes2IRLPressatOxfordUniversityPress,Oxford,England(HamesandHiggins2)中提供有關合成、標記、檢測和量化DNA和RNA(包括寡核苷酸)的細節(jié)。。在Southern印跡或Northern印跡中于過濾器上具有超過100個互補殘基的互補核酸雜交的嚴格雜交條件的實例為42'C,50%福爾馬林和lmg肝素,且進行雜交整夜。嚴格洗滌條件的實例為65'C下0.2xSSC洗滌15分鐘(關于SSC緩沖液的描述參看Sambrook,局上文)。通常,高度嚴格洗滌是在低嚴格度洗滌之前以去除背景探針信號。例示性低嚴格度洗滌是在4(TC下以2xSSC洗滌15分鐘。一般來說,5x(或更高)于在特定雜交分析中關于不相關探針所觀察到的信噪比的信噪比指示檢測到特異性雜交。在諸如Southern和Northern雜交等核酸雜交實驗的情形中,"嚴格雜交洗滌條件"為序列依賴性,并且在不同環(huán)境參數下不同。有關核酸雜交的廣泛指導可見于Tijssen(1993),局上文以及Hames和Higgins,1和2。任何測試核酸的嚴格雜交和洗滌條件都可易于根據經驗確定。舉例來說,在確定高度嚴格雜交和洗滌條件的過程中,將雜交和洗滌條件逐漸增加(例如,通過增加溫度、降低鹽濃度、增加清潔劑濃度和/或增加雜交或洗滌中諸如福爾馬林等有機溶劑的濃度),直到滿足一組所選擇的標準。舉例來說,逐漸增加雜交和洗滌條件,直到探針與完全匹配的互補靶以對于探針與不匹配靶雜交所觀察到的至少5倍高的信噪比結合。選擇與特定探針的熱熔點(Tm)相等的"極嚴格"條件。Tm為50。/。的測試序列與完全匹配的探針雜交的溫度(在指定離子強度和pH值下)。出于本發(fā)明的目的,一般地說,選擇在指定離子強度和pH值下比特定序列的Tm低約5'C的"高度嚴格"雜交和洗滌條件。"超高嚴格"雜交和洗滌條件為增加雜交和洗滌條件的嚴格度,直到探針與完全匹配的互補耙核酸結合的信噪比為對于雜交任何不匹配耙核酸所觀察到的至少10倍高。據悉,在所述條件下以完全匹配的互補靶核酸的至少1/2的信噪比與探針雜交的耙核酸在超高嚴格條件下與所述探針結合。類似地,可通過逐漸增加相關雜交分析的雜交和/或洗滌條件來確定甚至較高的嚴格度。舉例來說,增加雜交和洗滌條件的嚴格度,直到探針與完全匹配的互補靶核酸結合的信噪比為對于雜交任何不匹配靶核酸所觀察到的至少10x、20x、50x、100x或500x或更高倍數。據悉,在所述條件下以完全匹配的互補靶核酸的至少1/2的信噪比與探針雜交的靶核酸在極高嚴格條件下與所述探針結合。如果在嚴格條件下彼此不雜交的核酸編碼的多肽實質上相同,那么所述核酸也實質上相同。例如當使用遺傳密碼所允許的最大密碼子簡并性產生核酸拷貝時,出現此情形。獨特子序列一方面,本發(fā)明提供一種核酸,其包含選自本文所公開的O-tRNA和O-RS序列的核酸中的獨特子序列。獨特子序列與對應于任何已知的O-tRNA或O-RS核酸序列的核酸相比為獨特的??墒褂美缭O置為默認參數的BLAST執(zhí)行比對。任何獨特子序列都例如可用作鑒別本發(fā)明的核酸的探針。類似地,本發(fā)明包括一種多肽,其包含選自本文所公開的O-RS序列的多肽中的獨特子序列。在本文中,獨特子序列與對應于任何巳知多肽序列的多肽相比為獨特的。本發(fā)明還提供靶核酸,其在嚴格條件下與編碼選自O-RS的序列的多肽中的獨特子序列的獨特編碼寡聚核苷酸雜交,其中所述獨特子序列與對應于任何對照多肽的多肽(例如,通過突變得到本發(fā)明的合成酶的親本序列)相比為獨特的。獨特子序列是如上文所述確定。序列比較、一致性和同源性在兩個或兩個以上核酸或多肽序列的情形中,術語"一致"或"一致性"百分比是指當比較和比對最大對應性時,如使用下文所述的序列比較算法中的一種(或所屬領域技術人員可用的其它算法)或通過目測所測量,相同或具有特定的相同氨基酸殘基或核苷酸百分比的兩個或兩個以上序列或子序列。在兩個核酸或多肽(例如,編碼O-tRNA或O-RS的DNA,或O-RS的氨基酸序列)的情形中,短語"實質上一致"是指當比較和比對最大對應性時,如使用序列比較算法或通過目測所測量,具有至少約60%、優(yōu)選80%、最優(yōu)選卯-95%的核苷酸或氨基酸殘基一致性的兩個或兩個以上序列或子序列。在不提及實際祖先的情況下,通常認為所述"實質上一致"的序列"同源"。"實質一致性"優(yōu)選在至少約50個殘基長的序列區(qū)、更優(yōu)選至少約100個殘基的區(qū)域上存在,且最優(yōu)選所述序列在至少約150個殘基或欲比較的兩個序列的全長上實質上一致。為進行序列比較和同源性測定,通常將一個序列充當與測試序列相比較的參考序列。當使用序列比較算法時,將測試序列和參考序列輸入計算機內,視需要指定子序列坐標,并且指定序列算法程序參數。隨后序列比較算法基于指定的程序參數計算測試序列相對于參考序列的序列一致性百分比??衫缤ㄟ^Smith&Waterman,Adv.Appl.Math.2:482(1981)的局部同源性算法、Needleman&Wunsch,J.Mol.Biol.48:443(1970)的同源性比對算法、Pearson&Lipman,Proc.Nat,l.Acad.Sci.USA85:2444(1988)的相似性搜索方法、這些算法的計算機實施(WisconsinGeneticsSoftwarePackage,GeneticsComputerGroup,575ScienceDr.,Madison,WI中的GAP、BESTFIT、FASTA和TFASTA)或通過目測(例如參看Ausubel等人,JETOt")進行供比較序列的最佳比對。適于測定序列一致性百分比和序列相似性的算法的一個實例為BLAST算法,其描述于Altschul等人,J.Mol.Biol.215:403-410(1990)中。執(zhí)行BLAST分析的軟件可67通過美國生物技術信息中心(NationalCenterforBiotechnologyInformation,www.ncbi.nlm.nih.gov/)公共可用。所述算法涉及首先通過鑒別詢問序列中長度W的短字來鑒別高得分的序列對(highscoringsequencepair,HSP),當與數據庫序列中相同長度的字比對時,所述HSP匹配或滿足一些正值臨界得分T。T是指鄰近字的臨界分值(neighborhoodwordscorethreshold)(Altschul等人,局J:文)。這些初始鄰近字匹配(wordhit)充當起始搜索的種子以發(fā)現含有其的較長HSP。隨后使字匹配沿各序列的兩個方向延伸直到可增加累積比對的分值。對核苷酸序列使用參數M(—對匹配殘基的獎勵分值;通常>0)和N(錯配殘基的處罰分值,通常<0)計算累積分值。對于氨基酸序列,使用得分矩陣計算累積分值。當累積比對分值比其所達到的最大值低數量X;累積分值因一個或多個負得分殘基比對的積累而為零或更低值;或到達各序列的末端時,在各個方向上的字匹配延伸停止。BLAST算法參數W、T和X將決定比對的靈敏性和速度。BLASTN程序(對于核苷酸序列)使用11的字長(W)、10的期望值(expectation,E)、100的截止值、M=5、N;4和兩條鏈的比較作為默認值。對于氨基酸序列,BLASTP程序使用3的字長(W)、10的期望值(E)和BLOSUM62得分矩陣(參看Henikoff&Henikoff(1989)Proc.Natl.Acad.Sci.USA89:10915)作為默認值。除計算序列一致性百分比外,BLAST算法還執(zhí)行兩個序列之間相似性的統(tǒng)計學分析(例如參看Karlin&Altschul,Proc.Nat'l.Acad.Sci.USA90:5873-5787(1993))。BLAST算法所提供的一種相似性量度為最小和概率(smallestsumprobability,P(N)),其提供對于兩個核苷酸或氨基酸序列之間偶然出現匹配的概率的指示。舉例來說,如果在將測試核酸與參考核酸相比較時,最小和概率小于約O.l、更優(yōu)選小于約O.Ol且最優(yōu)選小于約0.001,那么可認為所述核酸與參考序列相似。誘變和其它分子生物學技術描述分子生物技術的常見文章包括Berger和KimmelGuidetoMolecularCloningTechniques.MethodsinEnzymology第152巻AcademicPress,Inc.,SanDiego,CA(Berger);Sambrook等人,MolecularCloning-ALaboratoryManual(第2版)第1-3巻.ColdSpringHarborLaboratory,ColdSpringHarbor,NewYork,1989("Sambrook")禾口CurrentProtocolsinMolecularBiology.F.M.Ausubel等人,編,CurrentProtocols,GreenePublishingAssociates,Inc.與JohnWiley&Sons,Inc.的合資公司,(1999增干U)("Ausubel")。這些文章描述誘變、載體的使用、啟動子和許多其它相關課題,所述相關課題涉及例如包括用于產生包括非天然氨基酸的蛋白質的選擇密碼子、正交6tRNA、正交合成酶和其對在內的基因的產生。多類誘變方法用于本發(fā)明中,例如以產生tRNA文庫、產生合成酶文庫、插入編碼所關注蛋白質或多肽中的非天然氨基酸的選擇性密碼子。所述誘變方法包括(但不限于)定點誘變、隨機點誘變、同源重組、DNA改組或其它遞歸誘變方法、嵌合構建、使用含尿嘧啶的模板的誘變、寡核苷酸定向誘變、硫代磷酸酯修飾DNA誘變、使用缺口雙螺旋DNA的誘變等或其任何組合。其它適當方法包括點錯配修復、使用修復缺陷型宿主株的誘變、限制性選擇和限制性純化、缺失誘變、通過總基因合成誘變、雙鏈斷裂修復等。舉例來說,涉及嵌合構建體的誘變也包括在本發(fā)明中。在一個實施例中,可通過天然存在分子或者改變或突變的天然存在的分子的巳知信息(例如,序列、序列比較、物理特性、晶體結構等)指導誘變。上述本文中所見的文章和實例描述這些程序。其它信息可見于文中所引用的以下公開文獻禾口參考文獻'Ling等人,^4邵raac/^,o_0濕腦啤e"ei.a"overv/ew,AnalBiochem.254(2):157-178(1997);Dale等人,Wgo匿/eo"UzVe"W謂d畫附wtogewew^p/w印/ora/7^o她匿/7cxi,MethodsMol.Biol.57:369-374(1996);Smith,/"W加腦toge腦^,Arm.Rev.Genet19:423-462(1985);Botstei-n&Shortle,S/ra&g/e《朋6opWcW/o朋o/v/加畫/""ge"e^,Science229:1193-1201(1985);Carter,甜e-Wre"e(i聽/agene^,Biochem.J.237:1-7(1986);Kunkel,77zeo/o//go"wc/etz7c/eWrecfedm幽ge打e我NucleicAcids&MolecularBiology(Eckstein,F.禾口Lilley,D.M.J編,SpringerVerlag,Berlin))(1987);Kunkel,x"e,ec訴cmwtogewe*vw'/7zo啤/2e"o妙Zcse/ec/7'ow,Proc.Natl.Acad.Sci.USA82:488-492(1985);Kunkel等人,iapzWe^c/ewfwYe-s/eczycww^fgewes^w"/zotrf;Z/ewo妙z'cse/ec/7'cw,MethodsinEnzymol.154,367-382(1987);Bass等人,7>prepmwoAyw欣"譜6zWz'wg印e"yc"Zes,Scisncs242:240-245(1988);MethodsinEnzvmol,100:468,(1983);MethodsinEnz豫ol.154:329-350(1987);Zoller&Smith,Wgo做c/eo/7We-Wre"ed附z^agewew'sM/3-<ien》e<ive"o朋e^de"/1AcidsRes.10:6487-6500(1982);Zoller&Smith,0/fgowwc/eo"W"z>*e"ei/證啤eweio/IWJ女flgme她c/o"ed/幽M/3vec/w&MethodsinEnzymol.100:468-500(1983);Zoller&Smith,0/z'gowwc/eo/7Uz>e"e<i;w幽gewe^:aw',/e,/7wd/woo/igowwc/eWfite/hmersaw'wg/e-WrtmcfefiZ)iV/4fewp/她,MethodsinEnzvmol.154:329-350(1987);Taylor等人,77jeteo/p/w^p/zorW/n'oWe-mo^/kc/Z)A^/"my/W"z》wreac/7owfopre/weZWJ,Nucl.AcidsRes,13:8749-8764(1985);Taylor等人,TTzer,Wgewera/itm(9/一wwc/eoriU/rec/W腿/a/7oraZz妙加《w^c^顧7g—oyp/wc^/n'o她-腳丄y^ZWJ,Nucl,AcidsRes,13:8765-8787(1985);Nakamaye&Eckstein,T//n力"Zowmst"'"/owe/^owwc/eoye臉z'/c/eavageNucl.AcidsRes,14:9679-9698(1986);Sayers等人,7-T£xom^/^w^/^(xs^/zo^^/n'o"/^-6ase(io//gowwc/eo"'<ie-dz'rec/edwwfagewexzXNucl.AcidsRes.16:791-802(1988);Sayers等人,5Vram/c/MV"gej^/zos^/zoro/^/oa/^-Z;wmVfe,(1988)Nucl.AcidsRes.16:803-814;Kramer等人,77^g";;^dd,fecZM^4oppraac/z0/一肌(:/^(9/^(^-(^>^/^wwto^owcowWrac/7冊,Nucl.AcidsRes.12:9441—9456(1984);Kramer&FritzWgo鼎c/eW^-d/recz^c欣w"/ow/77w加zom1由g卿W—/exD風MethodsinEnzvmol.154:350-367(1987);Kramer等人,oZ/g^wwc/eoOUrec/W0/mw她'o叫Nucl.AcidsRes.16:7207(1988);Fritz等人,(9/一wwc/eW6fe-(i〖/TC/Wcow^rac/z'ow0/附w/a/7o肌'ag",eJ(it/p/exZWJ/^ocedwrew/zTzow/1ewzy附a"creacaowsz'wvdro,Nucl.AcidsRes*16:6987-6999(1988);Kramer等人,尸o/"f她匿fc/z7^戸>,38:879-887(1984);Carter等人,/,謂Wo"go"wc/eW^fesU^"e(i聽啤e"e^腿.wgw"o/xNucl.AcidsRes*13:4431-4443(1985);Carter,/琴raved0/加肌c/eo/iHe"edmw啤eww/s腦'wgM/3ve"歸,MethodsinEnzvmol.154:382-403(1987);Eghtedarzadeh&Henikoff,t/化0/一wwc/e0/油s^gewer她/argede/"/o叫Nucl,AcidsRes.14:5115(1986);Wells等人,/,o他wceyb環(huán)a/7ow加6z7^wgAe/ra腦'"owW她o/swZjf/fez-w,Phil.Trans.R.Soc.Lond.A317:415-423(1986);Nambiar等人,7b^/矽"^^"am/c/om'wg0/age/eco<i/wg/or〃'Zowwc/eaye5|proto>7,Science223:1299-1301(1984);Sakamar禾口Khorana,Tbfa/^w/Z/e*expre^o"0/agewe/br/7zea-raiwm'/1rodo她rMgmeWwwc/eo^/e-^W/"gpTOto'wfyra^c/w">^.Nucl.AcidsRes.14:6361-6372(1988》Wells等人,mM啤e/ei'aw/br0/扁/印/e應她'owsW<s7'b,Gctic34:315-323(1985);Gmndstr6m等人,Wgo"wc/eW油-d/rec/W附wf"g^"e^6少m/crosca/e、/zo/1-gww'gewes"/^,XNucl.AcidsRes.13:3305-3316(1985);Mandecki,(9//g^wwc/ec^油-^yec/W^tow6/e-Wra"d6reaA:repa/r//ay附z'^fe五sc/^n'c/n'aco/zame/7oc//ors"e層57e"yk附w/agewes&,Proc.70Natl.Acad.Sci.USA,83:7177-7181(1986);Arnold,尸ra^.w/or薩層/e謂Vo扁e她,CurrentOpinioninBiotechnology4:450-455(1993);Sieber,等人,NatureBiotechnology,19:456-460(2001).W.P.C.Stemmer,Nature370,389-91(1994);和I.A.Lorimer,I.Pastan,NucleicAcidsRes.23,3067-8(1995)。關于眾多上述方法的其它細節(jié)可見于MethodsinEnzymologv第154巻,其也描述對于各種誘變方法引起的故障査找問題的有效控制。本發(fā)明還涉及經由正交tRNA/RS對活體內并入非天然氨基酸的脊椎動物宿主細胞和生物體。利用本發(fā)明的多聚核苷酸或包括本發(fā)明的多聚核苷酸的構建體(例如本發(fā)明的載體,其可為例如克隆載體或表達載體)對宿主細胞進行基因工程改造(例如,轉化、轉導或轉染)。載體可為例如質粒、細菌、病毒、裸多聚核苷酸或連結多聚核苷酸的形式??赏ㄟ^標準方法將載體引入細胞和/或微生物中,所述方法包括電穿孔(Fromm等人,Proc.Natl.Acad.Sci,USA82,5824(1985))、通過病毒載體感染、在小珠粒或粒子基質內或在表面上用具有核酸的小粒子高速彈道穿透(Klein等人,Nature327,70-73(1987))。可在經調節(jié)適用于諸如篩選步驟、活化啟動子或選擇轉化株的活動的常規(guī)營養(yǎng)培養(yǎng)基中培養(yǎng)經工程改造的宿主細胞。這些細胞可任選培養(yǎng)入轉基因有機體中。關于例如細胞分離和培養(yǎng)(例如用于隨后核酸分離)的其它有用參考文獻包括Freshney(1994)CultureofAnimalCells,aManualofBasicTechnique,第3版,Wiley-Liss,NewYork及其中所引用的參考文獻;Payne等人〔1992)PlantCellandTissueCultureinLiquidSystemsJohnWiley&Sons,Inc.NewYork,NY;Gamborg禾口Phillips(編)(1995)PlantCell,TissueandOrganCulture;FundamentalMethodsSpringerLabManual,Springer-Verlag(BerlinHeidelbergNewYork)以及Atlas禾口Parks(編)TheHandbookofMicrobiologicalMedia(1993)CRCPress,BocaRaton,FL。本發(fā)明還涉及具有經由正交tRNA/RS對并入一個或多個非天然氨基酸的能力的脊椎動物細胞系??墒褂盟鶎兕I域中已知的細胞培養(yǎng)技術在已經本發(fā)明的多聚核苷酸或包括本發(fā)明的多聚核苷酸的構建體轉化、轉導或轉染的宿主細胞上建立這些細胞系。將外源核酸引入宿主細胞中的方法已為所屬領域中眾所周知且將隨所使用的宿主細胞而變化。技術包括(但不限于)葡聚糖介導的轉染、磷酸鈣沉淀、氯化鈣處理、聚凝胺(polybrene)介導的轉染、原生質體融合、電穿孔、病毒或噬菌體感染、脂質體中多聚核苷酸的封裝和定向微注射??梢栽试S瞬時或穩(wěn)定并入DNA的方式轉化或轉染細胞。對于重組蛋白的長期、高產率產生來說,優(yōu)選穩(wěn)定表達。舉例來說,可對穩(wěn)定表達抗體分子的細胞系進行工程改造??捎猛ㄟ^適當表達控制元件(例如,啟動子、增強子、序列、轉錄終止子、多聚腺苷酸位點等)控制的DNA和可選擇標記轉化宿主細胞,而非使用含有病毒復制起點的表達載體。在引入外來DNA后,可使經工程改造的細胞在富集培養(yǎng)基中生長l-2天,且隨后轉換為選擇性培養(yǎng)基。重組質粒中的可選擇標記賦予對選擇的抗性,并且使細胞能將質粒穩(wěn)定整合到其染色體組中并生長,從而形成細胞群,又可對其進行克隆并擴充成細胞系??捎欣厥褂盟龇椒▉砉こ谈脑毂磉_抗體分子的細胞系。所述經工程改造的細胞系尤其適用于篩選和評估與抗體分子直接或間接相互作用的化合物。另外,諸如一些病毒介導的載體轉染技術等所屬領域技術人員眾所周知的其它技術可允許瞬時轉染細胞。可使用將靶核酸引入細胞中的若干種眾所周知的方法,其中任一種都可用于本發(fā)明中。這些方法包括受體細胞與含有DNA的細菌原生質體融合、電穿孔、基因槍法(projectilebombardment)(對于較為穩(wěn)定的表達)和經病毒載體感染(其可用于穩(wěn)定或瞬時轉染且也在下文中進一步論述)等。細菌細胞可用于擴增含有本發(fā)明的DNA構建體的質粒的數目。使細菌生長到對數生長期且可通過所屬領域中已知的多種方法分離細菌中的質粒(例如參看Sambrook)。另外,可購得大量試劑盒以從細菌中純化質粒(例如參看都來自PharmaciaBiotech的EasyPrep、FlexiPrep;來自Stratagene的StrataClean;和來自Qiagen的QIAprep)。隨后進一步操縱經分離和純化的質粒以產生其它質粒,其用于轉染細胞或并入相關載體中以感染生物體。典型載體含有轉錄和翻譯終止子、轉錄和翻譯起始序列以及可用于調控特定靶核酸表達的啟動子。載體任選包含通用表達盒,其含有至少一個獨立終止子序列、允許表達盒在真核細胞或原核細胞或兩者中復制的序列(例如,穿梭載體)和用于原核系統(tǒng)與脊椎動物系統(tǒng)的選擇標記。載體適用于在原核細胞、真核細胞或優(yōu)選兩者中復制和整合。參看Gillam&Smith,Gene8:81(1979);Roberts等人,Nature.328:731(1987);Schneider,B.等人,ProteinExpr.Purif.6435:10(1995);A讓bel,Sambrook,Berger(都同上文)。例如,ATCC(例如由ATCC出版的TheATCCCatalogueofBacteriaandBacteriophage(1992)Ghema等人(編))提供可用于克隆的細菌和噬菌體的目錄。用于測序、克隆和分子生物學的其它方面的其它基本程序以及基礎理論探討也見于Watson等人(1992)RecombinantDNA第2版ScientificAmericanBooks,NY。另外,基本上任何核酸(和幾乎任何標記核酸,無論標準或非標準)都可從多種商業(yè)來源中的任一種定制或標準定購,這些商業(yè)來源諸如MidlandCertifiedReagentCompany(Midland,TX,mcrc.com)、TheGreatAmericanGeneCompan,'^ilamona,CA,可通過萬維網在genco.com上獲得)、ExpressGenInc.(Chicago,IL,可通過萬維網在expressgen.com上獲得)、OperonTechnologiesInc.(Alameda,CA)禾口許多其它來源。試劑盒試劑盒也為本發(fā)明的特征。舉例來說,提供在細胞中產生包含至少一個非天然氨基酸的蛋白質的試劑盒,其中所述試劑盒包括含有編碼O-tRNA的多聚核苷酸序列和/或O-tRNA和/或編碼O-RS的多聚核苷酸序列和/或O-RS的容器。在一個實施例中,試劑盒另外包括至少一個非天然氨基酸。在另一實施例中,試劑盒另外包含用于產生蛋白質的說明材料。實例提供以下實例說明但非限制所主張的本發(fā)明。所屬領域技術人員將認識到,在不背離所主張的本發(fā)明的范圍的情況下,可改變多個不重要的參數。實例1:在脊椎動物細胞中產生并入非天然氨基酸的氨?;?tRNA合成酶的方法以及所述氨?;?tRNA合成酶的組合物擴充脊椎動物遺傳密碼以包括具有新穎物理、化學或生物特性的非天然氨基酸,將提供用于分析和控制這些細胞中的蛋白質功能的有效工具。為此,描述用于分離氨?;?tRNA合成酶的通用方法,所述氨?;?tRNA合成酶響應釀酒酵母(Saccharomycescerevisiae,S.cerevisiae)中的琥珀密碼子以高保真度并入非天然氨基酸。所述方法是建立在通過抑制GAL4的DNA結合結構域與轉錄活化結構域之間的琥珀密碼子來活化GAL4反應性報告基因HIS3、URA3或LacZ的基礎上。描述用于正選擇活性大腸桿菌酪氨?;?tRNA合成酶(EcTyrRS)變異體的GAL4報告基因的優(yōu)化。還曾利用作為"有毒等位基因(toxicallele)"添加到生長培養(yǎng)基中的小分子,利用URA3報告基因來發(fā)展無活性EcTyrRS變異體的負選擇。重要的是,可對單一細胞且以多種嚴格度執(zhí)行正選擇和負選擇。這可促進從大型突變合成酶文庫中分離出多種氨酰基-tRNA合成酶(aaRS)活性。用于分離所需aaRS表現型的方法的功效可通過模型選擇加以證實。實例2大腸桿菌和嗜熱脂肪芽孢桿菌TyrtRNA雜合tRNA的構建從釀酒酵母中進行的工作巳知,大腸桿菌TyrtRNA/RS對與內源性tRNA/RS對正交并且支持非天然氨基酸抑制。然而,在活體內于哺乳動物細胞中轉錄功能性大腸桿菌tRNATyr的嘗試富有挑戰(zhàn)。為此,關注焦點已轉向作為tRNA序列來源的嗜熱脂肪芽孢桿菌,其可支持哺乳動物細胞中非天然氨基酸的抑制。盡管嗜熱脂肪芽孢桿菌tRNA為大腸桿菌tRNATyr合成酶的底物,但仍需要進一步工程改造tRNA以改進tRNA氨?;男省8倪MtRNA氨?;瘜倪M抑制效率。tRNA的接受莖(acceptorstem)為tRNA合成酶識別的關鍵決定因素。在本實例中,通過將大腸桿菌與嗜熱脂肪芽孢桿菌tRNA7"的不同結構組件組合來構建雜合tRNA。所述雜合tRNA具有大腸桿菌tRNATyr接受莖,以及D臂、TvC臂、可變環(huán)和嗜熱脂肪芽孢桿菌tRNAT"的反密碼子莖。具有得自大腸桿菌的接受莖的新雜合tRNA為大腸桿菌tRNATyr合成酶的良好底物。下文的實驗中將展示,當使用新近建立的雜合琥珀抑制tRNA時,獲得改進的琥珀抑制效率。為進行比較,對雜合tRNA與得到所述雜合tRNA的嗜熱脂肪芽孢桿菌tRNATyr加以測試。實驗編碼雜合tRNA的質粒的構建通過使用以下引物的重疊PCR:FTam73:具有EcoRI和BglII位點的正向引物OTACGAATTCCCGAGATCTGGATTACGCATGCTCAGTGCAATCTTCGGTTGCCTGGAC丁AGCGCTCCGGTTTTTCTGTGC(SEQIDNO:91)FTamll5:反向引物AGTCCGCCGCGTTTAGCCACTTCGCTACCCCACCGACGTGTACGTGTGTCGGCCiTCCCCTGAGGTTCAGCACAGAAAAACCGGAGCGC(SEQIDNO:92)Ftamll6:第2段的正向引物GTGGCTAAACGCGGCOGACTCTAAATCCGCTCCCTTTGGGTTCGGCGGTTCGAATCCGTCCCCCACCAGACAAGTG(SEQIDNO:93)Ftamll7:第2段的反向引物GATGCAAGCTTOATOCiATCCGCCATAAGTCATCGGGAGCTGGAGAAAAAAACCGCACTTGTCTGGTGGGOGACGG(SEQIDNO:94),來構建單拷貝雜合琥珀抑制tRNA表達插入物,其包括5'限制性位點(EcoRI和Bgl11)、人類tRNA1"的5'側接序列(GGATTACGCATGCTCAGTGCAATCTTCGGTTGCCTGGACTAGCGCTCCGGTTTTTCTGTGCTGAACCTCAGGGGACGCCGACACACGTACACGTC(SEQIDNO:,,缺乏3'-CCA的雜合WA64琥珀抑制突變體(雜合tRNA的核苷酸序列如下IDNO:87)且編碼所述tRNA的DNA序列如下GGGTTCGGCGGTTCGAATCCGTCCCCCA(SEQIDNO:88))、人類tRNA,的3'NO:90))和3'限制位點(BamHI和HindIII)。將所述插入物接合到pUC19中EcoRI和HindIII位點處。利用雜合tRNA的琥珀抑制實驗(圖1):將編碼hGHE88琥珀突變體、大腸桿菌tRNA合成酶和單拷貝琥珀抑制嗜熱脂肪芽孢桿菌tRNA或單拷貝琥珀抑制雜合tRNA的質粒共轉染到CHOKl細胞中。轉染后42小時分析hGH的表達。當使用雜合tRNA(hbl).時,琥珀抑制效率相對于當使用嗜熱脂肪芽孢桿菌琥珀抑制tRNA時所獲得的效率增加約30%。實例3將分子添加到具有非天然氨基酸的蛋白質中一方面,本發(fā)明提供包含非天然氨基酸的蛋白質與其它取代基分子偶聯(lián)的方法和相關組合物。應了解,本文所述的實例和實施例僅出于說明性目的,并且將對所屬領域技術人員提出根據所述實例和實施例的各種修改或改變,且所述修改和改變都將包括在本申請案的精神和范圍以及隨附權利要求書的范圍內。盡管已出于清楚和理解的目的相當詳細地描述本發(fā)明,但在閱讀本發(fā)明后所屬領域技術人員將了解,在不偏離本發(fā)明的真實范圍的情況下,可對形式和細節(jié)進行各種修改。舉例來說,上述所有技術和設備可以各種組合使用。本申請案中引用的所有公開文獻、專利、專利申請案和/或其它文獻都以全文引用的方式并入本文中用于所有目的,所引用的程度就如同將各個別公開文獻、專利、專利申請案和/或其它文獻個別地以引用的方式并入本文中用于所有目的一般。表5IDNO.:標記序列SEQIDNO.:1大腸桿菌野生型TyrRS(合成酶)多聚核苷酸ATGGCAAGCAGTAACTTGATTAAACAATTGCAAGAGCCKiGGGCTGGTAGCCCAGGTGACGGACGAOGAAGCGTTAGCAGAGCOACTOOCGCAAGGCCCGATCGCOCTCTATTGCGGCTTCGATCCTACCGCTGACAGCTTGCATTTGGGGCATCTTGTTCCATTGTrATGCCTOAAACOCTTCCAGCAGGCGGGCCACAAGCCGGTTGCGCTGGTAGGCGGCGCGACGGGTCTGATTCGCGACCCGAGCTTCAAAGCTGCCGAOCGTAAOCTOAACACCGAAGAAACTGTTCAGGAGTOGGTGGACAAAATCCGTAAGCAGGTTGCCCCCiTTCCTCOATTTCGACTGTGGAGAAAACTCTCiCTATCGCGGCGAACAACTATCJACTOGTTCGGCAATATOAATGTGCTGACCTTCCTGCGCGATATTCJGCAAACACTTCTCCGTTAACCAGATGATCAACAAAGAAGCGGTTAAGCAGCGTCTCAACCGTGAAGATCAGGWATTTCGTTCACTCAGTTTTCCTACAACCTGTTGCAOGGTTATGACTTCGCCTGTCTGAACAAACAGTACGGTGTGGTGCTGCAAATTGGTGGTTCTGACCAGTGGGGTAACATCACTTCTGGTATCGACCTGACCCGTCGTCTGCATCAGAATCAGGTGTTTGGCCTGAC03TTCCGCTGATCACTAAAGCAGATGGCACCAAATTTGGTAAAACTGAAGGCGGCGCAGTCTGGTTGGATCC(3AAGAAAACCAGCCCGTACAAATTCTACC人GTTCTGGATCAACACTGCGGATGCCGACGTTTACCGCTTCCTGAAGTTCTTCACCl.n'ATOAGCATTGAAGACiATCAACGCCCTGGAAGAAGAAGATAAAAACAGCGGTAAAGCACCGCGCGCCCAGTATGTACTGGCGGAGCAGGTGACTCOTCTGGTTCACGGTOAAGAAGOTTTACAG(3CGOCAAAACGTATTACCGAATGCCTGTTCAGCGGTTCTTTCAGTGCGCTCJAGTGAAGCGGACTTCGAACAGCTGGCOCAGGACGGCGTACCGATGGTTGAGATGGAAAAGGGCGCAGACCTGATGCAGGCACTCJGTCGATTCTGAACTGCAACCTTCCCGTGGTCAGGCACGTAAAACTATCGCCTCCAATGCCATCACCATTAACGGTGAAAAACAGTCCGATCCTGAATACTTCTTTAAAGAAGAAGATCGTCTGTTTGGTCG'ITrl'ACCTTACTGCGTCGC。GTAAAAAGAATTACTGTCTGATTTGCTGGAAATAASEQIDNO.:2大腸桿菌野生型TyrRS(合成酶)氨基酸(aa)MASSNLIKQLQERGLVAQVTDEEALAERLAQGPIALYCGFDPTADSLHLGHLVPLLCLKRFQQAGHKPVALWGATGUGDPSFKAAERKLNTEETVQEWVDKIRKQVAPFLDFDCGENSAIAANNYDWFGNNTNVLTFLRXMGICHFSVNQMINKEAVKQRLNREDQOlSFTEFSYNLLQGYDFACXNKQYGVVLQlGCiSDQWGNITSGlDLTRRLHQNQVFGLTVPUTKADGTXFGKTEGGAVVaDPKKTSPYKPYQFWINTADADVYRFLKFFTFMSIEE1NALEEEDKNSGKAPRAQYVLAEQVTRLVHGEEGLQAAKRITECLFSGSLSALSEADFECJLAQDGVPMVEM汰GADLMQALVDSEU5PSROQARKTlASNAITINGEKQSDPEYFFKEEDiaPGRFTXLRRGKKNYCLICWK76<table>tableseeoriginaldocumentpage77</column></row><table><table>tableseeoriginaldocumentpage78</column></row><table><table>tableseeoriginaldocumentpage79</column></row><table>SEQIDNO.:11.pOMe-9(活性位點)合成酶多聚核苷酸CGGCGOCTGGTAGCCCAGGTGACGGACGAGGAAGCGTTAGCAGAGCGACTGGCGCAAGGCCCGATCGCACTCACTTGTGOCTTCGATCCTACCGCTGACAGCTTGCATTTGGOGCATCTTGTTCCATTGTTATGCCTGAAACGCTTCCAGCAGGCGGGCCACAAGCCGGTTGCGCTGGTAGGCGGCGCGACGGGTCTGATTGGCGACCCGAGCTTCAAAGCTGCCCiAGCGTAAGCTGAACACCGAAGAAACTOTTCAG<3AGTGGGTGGACAAAATCCGTAAGCAGGTTGCCCCGTTCCTCGATTTCGACTGTGGAGAAAACTCTGCTATCGCGGCCAATAATTATGACTGGTTCGOCAATATGAATGTGCTGACCTTCCTGCGCGATATTOGCAAACACTTCTCCOTTAACCAGATGATCAACAAAGAAGCGCJTTAAGCAGCGTCTCAACCGTGAAGATCAGGGGATTTCGTTCACTGAOTTTTCCTACAACCTOCTGCAGGGTTATTCGTATGCCTGTOCOAACAAACAGTACGGTGTGSEQIDNO.:.12pOMe-10(活性位點)合成酶多聚核苷酸CGGGGGCTGGTAGCCCAGGTGACGGACGAGGAAGCGTTAGCAGAGCGACTGGCOCAAGGCCCGATCGCACTCACTTGTOGCTTCGATCCTACCGCTGACAGCTTGCATTTGGGGCATCTTGTTCCATTCTTATGCCTGAAACGCTTCCAGCAGGCGGGCCACAAGCCGGTTGCGCTGGTAGGCGGCGCCJACGGOTCTGATTCGCGACCCGACJCTTCAAAGCTGCCGAGCGTAAGCTOAACACCGAAGAAACTGTTCAGGAGTGGGTGGACAAAATCCGTAAGCAGGTTGCCCCGTTCCTCGATTTCGACTGTCGAGAAAACTCTC5CTATCGCGGCCAATAATTATGACTGGTTCAGCAATATGAATGTGCTGACCTTCCTGCGCGATATTGGCAAACACTTCTCCGTTAACCAGATGATCAACAAAGAAGCGGTTAAGCAGC(3TCTCAACCGTGAAGATCAGG(3GATTTCGTTCACT(3ACnlllCCTACAACCTGCTGCAGGGTTATACGTATOCCTGTCTGAACAAACAGTACGGTGTGSEQIDNO.:13pOMe-ll(活性位點)合成酶多聚核苷酸CGGGGGCTGGTACCcCAGGTGACGGACGAGGAAGCGTTAGCAGAGCGACTGGCOCAAGGCCCGATCGCACTCCTTTGTGGCTTCGATCCTACCOCTOACAGCTTGCATTTCOOGCATCTTOTTCCATTCTTATGCCTGAAACGCTTCCAGCAGGCGGGCCACAAGCCGGTTGCGCTGGTAGCiCGGCGCGACGGGTCTGATTGGCGACCCGAGCTTCAAAGCTGCCGAGCGTAAGCTGAACACCGAAGAAACTGTTCAOGAGTCGGTGGACAAAATCCGTAAGCAGGTTGCCCCGTTCCTCGATTTCGACTGTGOAGAAAACTCTGCTATCGCGGCCAATAATTATGACTGGTTCGGCAATA化AATGTGCTGACCTTCCTGCGCGATATTGOCAAACACTTCTCCOTTAACCAGATGATCAACAAAOAAGCGGTTAAGCAGCGTCTCAACCGTGAAGATCAGGGGATTTCGTTCACTGAGTTTTCCTACAACCTGCTGCAGGGTTATTCTATTGCCTGTTCGAACAAACAGTACGGTGTCSEQIDNO.:14pOMe-12(活性位點)合成酶多聚核苷酸CGGGGGCTGGTAGCCCAGGTGACGGACGAGGAAGCGTTAGCAGAGCGACTGGCGCAAGGCCCGATCGCACTCGTGTGTGGCTTCGATCCTACCGCTOACAOCTTCJCATTTGGGOCATCTTGTTCCATTGrrATGCCTCAAACGCTTCCAGCAGGCGGGCCACAAGCCGGTTGC(3CTGGTAGGCGGCGCGACGGGTCTGATTGGCGACCCGAGCTTCAAAGCTGCCGAGCGTAAGCTGAACACCGAAOAAACTOTTCAGOAGTGGGTOOACAAAATCCGTAAGCAGGTTGCCCCOTTCCTCGATTTCGACTroTGGAGAAAACTCTGCTATCGCGGCCAATAATTATGACTGGTTCGGCAATATGAAT<3TGCTCACCTTCCTGCGCGATATTGGCAAACACTTCTCCGTTAACCAGATGATCAACAAAGAAGCOOITAAGCAGCGTCTCAACCGTGAAGATCAGGGGATTTCGTTCACTGAGTTTTCCTACAACCTGCTGCAGGGTTATAGTATTGCCTGTTTGAACAAACAGTACGOTGTGSEQIDNO.:15pOMe-13(活性位點)合成酶多聚核苷酸CGGGOGCTGGTACCCCAGGTGACGGACGAGGAAGCGTTAGCAGAGCXJACTGGCGCAAGGCCCGATCGCACTCGTGTGTGGCTTCGATCCTACCGCTGACACCTTGCATTTGGGGCATCTTGTTCCATTGTTATGCCTOAAACGCTTCCAGCAGCCOGGCCACAAOCCGGTTGCGCTOGTAGGCGGCGCCiACGGGTCTGATTGGCGACCCGAGCTTCAAAGCTGCCGAGCGTAAGCTGAACACCGAAGAAACTGTTCAGGAGTCGGTGGACAAAATCCGTAAGCAOGTTGCCCCGTTCCTCGATTTCGACTOTOC3AGAAAACTCTGCTATCGCC!GCCAATAArrATGACTCGTTCOGCAATATGAATGTGCTGACCTTCCTCCGCGATATTGGCAAACACTTCTCCGTTAACCAGATGATCAACAAAGAAGCGGTTAAOCAGCOTCTCAACCOTOAAGATCAGOGCJATTTCGTTCACTGAGTTTTCCTACAACCTGCTGCAGGGTTATAGTATTCCCTGTTTGAACAAACAGTACG80<table>tableseeoriginaldocumentpage81</column></row><table><table>tableseeoriginaldocumentpage82</column></row><table><table>tableseeoriginaldocumentpage83</column></row><table><table>tableseeoriginaldocumentpage84</column></row><table><table>tableseeoriginaldocumentpage85</column></row><table><table>tableseeoriginaldocumentpage86</column></row><table><table>tableseeoriginaldocumentpage87</column></row><table><table>tableseeoriginaldocumentpage88</column></row><table><table>tableseeoriginaldocumentpage89</column></row><table><table>tableseeoriginaldocumentpage90</column></row><table><table>tableseeoriginaldocumentpage91</column></row><table>權利要求1.一種脊椎動物細胞或細胞系,其包含如SEQIDNO87或SEQIDNO88中所述的核苷酸序列。2.根據權利要求1所述的細胞,其中所述核苷酸序列編碼具有對選擇性密碼子具特異性的反密碼子識別序列的tRNA分子。3.根據權利要求2所述的細胞,其中所述選擇性密碼子選自由以下組成的群組琥珀密碼子、赭石密碼子、蛋白石密碼子或者四個或四個以上堿基的密碼子。4.根據權利要求2所述的細胞,其中所述核苷酸序列編碼能夠利用至少一個非天然氨基酸氨?;膖RNA分子。5.根據權利要求1所述的細胞,其中所述核苷酸序列編碼作為正交tRNA(O-tRNA)的tRNA分子。6.根據權利要求5所述的細胞,其中所述O-tRNA包含如SEQIDNO.:87、SEQIDNO.:88所述的氨基酸序列或其保守變異體。7.根據權利要求5所述的細胞,其中所述O-tRNA能夠利用天然氨基酸或非天然氨基酸氨?;?。8.根據權利要求4所述的細胞,其中所述O-tRNA能夠利用天然氨基酸和非天然氨基酸氨?;?。.9.根據權利要求5所述的細胞,其中所述O-tRNA能夠利用非天然氨基酸氨?;?0.根據權利要求1所述的細胞,其中所述核苷酸序列是得自非脊椎動物生物體或一種以上非脊椎動物生物體。11.根據權利要求1所述的細胞,其中所述核苷酸序列是得自脊椎動物生物體或一種以上脊椎動物生物體。12.根據權利要求1所述的細胞,其中所述核苷酸序列是得自脊椎動物和非脊椎動物生物體。13.根據權利要求1所述的細胞,其中所述核苷酸序列為野生型、突變型或經修飾的野生型。14.根據權利要求5所述的細胞,其中所述核苷酸序列是得自大腸桿菌(E^c/zen'c/z/aco/z')或嗜熱月旨肪芽孢桿菌(5a"7/wsWeara^ze^7wop/H7iw1)。15.根據權利要求1所述的細胞,其中所述脊椎動物細胞為哺乳動物細胞。16.根據權利要求15所述的細胞,其中所述脊椎動物細胞為CH0-K1。17.根據權利要求15所述的細胞,其中所述脊椎動物細胞為CHODG-44。18.根據權利要求15所述的細胞,其中所述脊椎動物細胞為人類細胞系。19.根據權利要求9所述的細胞,其中所述非天然氨基酸選自由以下組成的群組對-乙酰基-L-苯丙氨酸;對-碘-L-苯丙氨酸;O-甲基-L-酪氨酸;對-炔丙基氧基苯丙氨酸;L-3-(2-萘基)丙氨酸;3-甲基-苯丙氨酸;0-4-烯丙基-L-酪氨酸;4-丙基-L-酪氨酸;三-O-乙?;?GlcNAce-絲氨酸;L-多巴(L-Dopa);氟化苯丙氨酸;異丙基-L-苯丙氨酸;對-疊氮基-L-苯丙氨酸;對-?;?L-苯丙氨酸;對-苯甲?;?L-苯丙氨酸;L-磷酸絲氨酸;膦?;z氨酸;膦?;野彼?;對-溴苯丙氨酸;對-氨基-L-苯丙氨酸;異丙基-L-苯丙氨酸;酪氨酸氨基酸的非天然類似物;谷氨酰胺氨基酸的非天然類似物;苯丙氨酸氨基酸的非天然類似物;絲氨酸氨基酸的非天然類似物;蘇氨酸氨基酸的非天然類似物;垸基、芳基、酰基、疊氮基、氰基、鹵基、肼、酰肼、羥基、烯基、炔基、醚、硫醇、磺酰基、硒基、酯、硫代酸、硼酸酯基、硼酸酯基、磷酸基、膦酸基、膦、雜環(huán)、烯酮、亞胺、醛、羥胺、酮基或氨基取代的氨基酸,或其任何組合;具有可光活化交聯(lián)劑的氨基酸;自旋標記的氨基酸;發(fā)熒光氨基酸;結合金屬的氨基酸;含金屬氨基酸;放射性氨基酸;光籠蔽和/或光致異構化氨基酸;含生物素或生物素類似物氨基酸;含酮基氨基酸;包含聚乙二醇或聚醚的氨基酸;重原子取代的氨基酸;化學可裂解或可光裂解氨基酸;具有伸長側鏈的氨基酸;含有毒基團的氨基酸;糖取代的氨基酸;含碳連接糖的氨基酸;具有氧化還原活性的氨基酸;含a-羥基的酸;氨基硫代酸;(X,a雙取代氨基酸;P-氨基酸;除脯氨酸或組氨酸外的環(huán)狀氨基酸;除苯丙氨酸、酪氨酸或色氨酸外的芳香族氨基酸。20.根據權利要求15所述的細胞,其另外包含正交tRNA合成酶(O-RS),其中所述O-RS識別所述tRNA,并且所述tRNA優(yōu)先通過所述O-RS利用非天然氨基酸氨?;?1.根據權利要求20所述的細胞,其中所述O-RS是得自非脊椎動物生物體。22.根據權利要求20所述的細胞,其中所述0-RS包含SEQIDN0:3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、86的核苷酸序列或其保守變異體。23.根據權利要求21所述的細胞,其中所述非脊椎動物生物體為大腸桿菌或嗜熱脂肪芽胞桿菌。24.根據權利要求20所述的細胞,其另外包含核酸,所述核酸包含編碼所關注多肽的多聚核苷酸,其中所述多聚核苷酸包含由所述O-tRNA所識別的選擇性密碼子。25.根據權利要求24所述的細胞,其中所述所關注多肽為治療性蛋白質、診斷性蛋白質、工業(yè)酶或其部分。26.根據權利要求24所述的細胞,其中所述所關注多肽包含選自由以下組成的群組的蛋白質或蛋白質的一部分細胞因子、生長因子、生長因子受體、干擾素、白細胞介素、炎癥分子、癌基因產物、肽激素、信號轉導分子、類固醇激素受體、促紅細胞生成素(EPO)、胰島素、人生長激素、a-l抗胰蛋白酶、血管抑素、抗溶血因子、抗體、載脂蛋白、脫輔基蛋白、心房利鈉因子、心房利鈉多肽、心房肽、c-x-c趨化因子、T39765、NAP-2、ENA-78、Gro-a、Gro-b、Gro-c、IP-IO、GCP-2、NAP-4、SDF-1、PF4、MIG、'降鈣素、c-kit配體、細胞因子、CC趨化因子、單核細胞趨化蛋白-1、單核細胞趨化蛋白-2、單核細胞趨化蛋白-3、單核細胞炎癥蛋白-la、單核細胞炎癥蛋白-lp、RANTES、1309、R83915、R91733、HCC1、T58847、D31065、T64262、CD40、CD40配體、C-kit配體、膠原蛋白、群落刺激因子(CSF)、補體因子5a、補體抑制劑、補體受體1、細胞因子、DHFR、上皮中性粒細胞活化肽-78、GROa/MGSA、GROP、GROy、MIP-la、mip-15、mcp-1、表皮生長因子(EGF)、上皮中性粒細胞活化肽、促紅細胞生成素(EPO)、脫落毒素、因子IX、因子VII、因子VIII、因子X、成纖維細胞生長因子(FGF)、纖維蛋白原、纖維粘連蛋白、G-CSF、GM-CSF、葡糖腦苷脂酶、促性腺激素、生長因子、生長因子受體、刺猬蛋白(hedgehogprotein)、血紅蛋白、肝細胞生長因子(HGF)、水蛭素、人血清白蛋白、ICAM-1、ICAM-1受體、LFA-1、LFA-1受體、胰島素、類胰島素生長因子(IGF)、IGF-I、IGF-II、干擾素、IFN-a、IFN-0、IFN-y、白細胞介素、IL-1、IL-'2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IL陽10、IL-ll、IL-12、角質細胞生長因子(KGF)、乳鐵蛋白、白血病抑制因子、熒光素酶、神經營養(yǎng)因子、中性粒細胞抑制因子(NIF)、抑瘤素M、成骨蛋白、癌基因產物、甲狀旁腺激素、PD-ECSF、PDGF、肽激素、人生長激素、多效生長因子、蛋白質A、蛋白質G、致熱性外毒素A、b或C、松馳素、腎素、SCF、可溶性補體受體i、可溶性i-CAM1、可溶性白細胞介素受體、可溶性TNF受體、生長調節(jié)素、生長抑素、生長激素、鏈激酶、超抗原、葡萄球菌腸毒素、SEA、SEB、SEC1、SEC2、SEC3、SED、SEE、類固醇激素受體、超氧化物歧化酶(SOD)、中毒性休克綜合癥毒素、胸腺肽al、組織型纖溶酶原活化劑、腫瘤生長因子(TGF)、TGF-cc、TGF-e、腫瘤壞死因子、腫瘤壞死因子a、腫瘤壞死因子5、腫瘤壞死因子受體(TNFR)、VLA-4蛋白、VCAM-1蛋白、血管內皮生長因子(VEGEF)、尿激酶、Mos、Ras、Raf、Met、p53、Tat、Fos、Myc、Jun、Myb、Rel、雌激素受體、孕酮受體、睪酮受體、醛固酮受體、LDL受體、SCF/c-Kit、CD40L/CD40、VLA-4/VCAM-1、ICAM-1/LFA-1、透明質酸/CD44和皮質酮。27.—種脊椎動物細胞,其包含正交氨?;?tRNA合成酶(O-RS)、由SEQIDNO:87或SEQIDNO:88所編碼的tRNA、非天然氨基酸以及包含編碼所關注多肽的多聚核苷酸的核酸,其中所述多聚核苷酸包含由所述tRNA識別的選擇性密碼子,其中所述O-RS在所述脊椎動物細胞中優(yōu)先利用所述非天然氨基酸將所述tRNA氨?;移渲兴黾毎a生具有所述非天然氨基酸的所述所關注多肽。28.根據權利要求l所述的核酸,其中所述核酸包含A盒和B盒。29.根據權利要求1所述的細胞系,其中所述細胞系己經穩(wěn)定轉染。30.根據權利要求1所述的細胞系,其中所述細胞系己經瞬時轉染。31.—種在脊椎動物細胞中產生至少一種包含至少一個非天然氨基酸的蛋白質的方法,所述方法包含使包含核酸的脊椎動物細胞在適當培養(yǎng)基中生長,所述核酸包含至少一個選擇性密碼子且編碼所述蛋白質;其中所述培養(yǎng)基包含非天然氨基酸且所述脊椎動物細胞包含tRNA,其具有SEQIDNO:87或SEQIDNO:88中所述的在所述細胞中起作用并識別所述選擇性密碼子的核苷酸序列;和正交氨?;鵷RNA合成酶(O-RS),其優(yōu)先利用所述非天然氨基酸將所述O-tRNA氨?;?。32.根據權利要求31所述的方法,其中所述細胞已經穩(wěn)定轉染以包含所述O-tRNA和所述O-RS。33.根據權利要求31所述的方法,其中所述細胞己經瞬時轉染以包含所述O-tRNA和所述O-RS。34.根據權利要求31所述的方法,其中所述細胞已經穩(wěn)定轉染以包含所述O-tRNA或所述O-RS,并且經瞬時轉染以包含所述O-tRNA或所述O-RS,以致所述細胞仍包含t-RNA和O-RS。35.根據權利要求31所述的方法,其中所述非天然氨基酸選自由以下組成的群組對-乙?;?L-苯丙氨酸;對-碘-L-苯丙氨酸;O-甲基-L-酪氨酸;對-炔丙基氧基苯丙氨酸;L-3-(2-萘基)丙氨酸;3-甲基-苯丙氨酸;0-4-烯丙基-L-酪氨酸;4-丙基丄-酪氨酸;三-O-乙?;?GlcNAc0-絲氨酸;L-多巴;氟化苯丙氨酸;異丙基-L-苯丙氨酸;對-疊氮基-L-苯丙氨酸;乂^?;?L-苯丙氨酸;對-苯甲?;?L-苯丙氨酸;L-磷酸絲氨酸;膦?;z氨酸;膦?;野彼?;對-溴苯丙氨酸;對-氨基-L-苯丙氨酸;異丙基-L-苯丙氨酸;酪氨酸氨基酸的非天然類似物;谷氨酰胺氨基酸的非天然類似物;苯丙氨酸氨基酸的非天然類似物;絲氨酸氨基酸的非天然類似物;蘇氨酸氨基酸的非天然類似物;垸基、芳基、?;B氮基、氰基、鹵基、肼、酰肼、羥基、烯基、炔基、醚、硫醇、磺?;⑽?、酯、硫代酸、硼酸酯基、硼酸酯基、磷酸基、膦酸基、膦、雜環(huán)、烯酮、亞胺、醛、羥胺、酮基或氨基取代的氨基酸,或其任何組合;具有可光活化交聯(lián)劑的氨基酸;自旋標記的氨基酸;發(fā)熒光氨基酸;結合金屬的氨基酸;含金屬氨基酸;放射性氨基酸;光籠蔽和/或光致異構化氨基酸;含生物素或生物素類似物氨基酸;含酮基氨基酸;包含聚乙二醇或聚醚的氨基酸;重原子取代的氨基酸;化學可裂解或可光裂解氨基酸;具有伸長側鏈的氨基酸;含有毒基團的氨基酸;糖取代的氨基酸;含碳連接糖的氨基酸;具有氧化還原活性的氨基酸;含0C-羥基的酸;氨基硫代酸;a,(X雙取代氨基酸;P-氨基酸;除脯氨酸或組氨酸外的環(huán)狀氨基酸;除苯丙氨酸、酪氨酸或色氨酸外的芳香族氨基酸。36.根據權利要求32所述的方法,其中所述蛋白質包含治療性蛋白質、診斷性蛋白質、工業(yè)酶或其部分。37.根據權利要求32所述的方法,其中所述蛋白質包含選自由以下組成的群組的蛋白質或蛋白質的一部分細胞因子、生長因子、生長因子受體、干擾素、白細胞介素、炎癥分子、癌基因產物、肽激素、信號轉導分子、類固醇激素受體、促紅細胞生成素(EPO)、胰島素、人生長激素、(x-l抗胰蛋白酶、血管抑素、抗溶血因子、抗體、載脂蛋白、脫輔基蛋白、心房利鈉因子、心房利鈉多肽、心房肽、C-X-C趨化因子、T39765、NAP-2、ENA-78、Gro-a、Gro-b、Gro-c、IP-10、GCP-2、NAP-4、SDF-1、PF4、MIG、降轉素、c-kit配體、細胞因子、CC趨化因子、單核細胞趨化蛋白-1、單核細胞趨化蛋白-2、單核細胞趨化蛋白-3、單核細胞炎癥蛋白-la、單核細胞炎癥蛋白-lp、RANTES、1309、R83915、R91733、HCC1、T58847、D31065、T64262、CD40、CD40酉己體、C-kit配體、膠原蛋白、群落刺激因子(CSF)、補體因子5a、補體抑制劑、補體受體1、細胞因子、DHFR、上皮中性粒細胞活化肽-78、GROa/MGSA、GROe、GROy、MIP-la、MIP-15、MCP-1、表皮生長因子(EGF)、上皮中性粒細胞活化肽、促紅細胞生成素(EPO)、脫落毒素、因子IX、因子VII、因子VIII、因子X、成纖維細胞生長因子(FGF)、纖維蛋白原、纖維粘連蛋白、G-CSF、GM-CSF、葡糖腦苷脂酶、促性腺激素、生長因子、生長因子受體、剌猬蛋白、血紅蛋白、肝細胞生長因子(HGF)、水蛭素、人血清白蛋白、ICAM-1、ICAM-1受體、LFA-1、LFA-1受體、胰島素、類胰島素生長因子(IGF)、IGF-I、IGF-II、干擾素、IFN-oc、IFN-e、IFN-y、白細胞介素、IL-1、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IL-10、'IL-ll、IL-12、角質細胞生長因子(KGF)、乳鐵蛋白、白血病抑制因子、熒光素酶、神經營養(yǎng)因子、中性粒細胞抑制因子(NIF)、抑瘤素M、成骨蛋白、癌基因產物、甲狀旁腺激素、PD-ECSF、PDGF、肽激素、人生長激素、多效生長因子、蛋白質A、蛋白質G、致熱性外毒素A、B或C、松馳素、腎素、SCF、可溶性補體受體I、可溶性I-CAM1、可溶性白細胞介素受體、可溶性TNF受體、生長調節(jié)素、生長抑素、生長激素、鏈激酶、超抗原、葡萄球菌腸毒素、SEA、SEB、SEC1、SEC2、sec3、SED、SEE、類固醇激素受體、超氧化物歧化酶(SOD)、中毒性休克綜合癥毒素、胸腺肽al、組織型纖溶酶原活化劑、腫瘤生長因子(TGF)、TGF-a、TGF-P、腫瘤壞死因子、腫瘤壞死因子cc、腫瘤壞死因子e、腫瘤壞死因子受體(TNFR)、VLA-4蛋白、VCAM-1蛋白、血管內皮生長因子(VEGEF)、尿激酶、Mos、Ras、Raf、Met、p53、Tat、Fos、Myc、Jun、Myb、Rel、雌激素受體、孕酮受體、睪酮受體、醛固酮受體、LDL受體、SCF/c-Kit、CD40L/CD40、VLA-4/VCAM-l、ICAM-1/LFA-1、透明質酸/CD44和皮質酮。38.—種用于產生包含至少一個非天然氨基酸的蛋白質的試劑盒,所述試劑盒包含容器,其含有SEQIDNO:87或SEQIDNO:88中所述的多聚核苷酸序列。39.根據權利要求38所述的試劑盒,其中所述試劑盒另外包含至少一個非天然氨基酸。40.根據權利要求38所述的試劑盒,其中所述試劑盒另外包含關于產生所述蛋白質的說明材料。全文摘要本發(fā)明提供用于產生擴充脊椎動物細胞中基因編碼氨基酸的數量的翻譯組件的組合物和方法。所述組件包括正交tRNA、正交氨?;?tRNA合成酶、tRNA/合成酶正交對和非天然氨基酸。還提供具有非天然氨基酸的蛋白質和在脊椎動物細胞中產生具有非天然氨基酸的蛋白質的方法。本發(fā)明對脊椎動物細胞提供翻譯組件,例如正交氨酰基-tRNA合成酶(O-RS)與正交tRNA(O-tRNA)對和其個別組件,所述翻譯組件可用于脊椎動物蛋白質生物合成機器中以將非天然氨基酸并入脊椎動物細胞中正在生長的多肽鏈中。文檔編號C12N5/10GK101541955SQ200780033108公開日2009年9月23日申請日期2007年9月7日優(yōu)先權日2006年9月8日發(fā)明者席雅·諾曼,斯蒂芬妮·周,鋒田申請人:Ambrx公司