專利名稱::將炔基氨基酸體內(nèi)摻入真細(xì)菌的蛋白的制作方法將炔基氨基酸體內(nèi)摻入真細(xì)菌的蛋白相關(guān)申請(qǐng)的交叉參考本申請(qǐng)要求2004年9月21日提交的美國(guó)臨時(shí)專利申請(qǐng)系列號(hào)60/612,220;2004年11月24日提交的美國(guó)臨時(shí)專利申請(qǐng)系列號(hào)60/630,876和2004年12月7日提交的美國(guó)臨時(shí)專利申請(qǐng)系列號(hào)60/634,151的優(yōu)先權(quán),這些申請(qǐng)的內(nèi)容出于所有目的全文納入本文作為參考。由聯(lián)邦政府資助的研究和開(kāi)發(fā)所作出發(fā)明的權(quán)利聲明本發(fā)明在國(guó)家衛(wèi)生研究院基金號(hào)GM62159的政府支持下作出。政府可對(duì)本發(fā)明享有某些權(quán)利。發(fā)明領(lǐng)域本發(fā)明屬于翻譯生物化學(xué)(translationbiochemistry)領(lǐng)域。本發(fā)明涉及制備和使用能將炔基氨基酸摻入蛋白質(zhì)的正交tRNA、正交氨酰tRNA合成酶及正交tRNA/正交氨酰tRNA合成酶配對(duì)的組合物和方法。本發(fā)明也涉及利用這種配對(duì)及相關(guān)組合物在細(xì)胞內(nèi)產(chǎn)生蛋白質(zhì)的方法。發(fā)明背景能利用非肽分子,例如光譜探針、催化輔助物質(zhì)或聚合物位點(diǎn)特異性地化學(xué)修飾蛋白質(zhì)或使蛋白質(zhì)共價(jià)交聯(lián)于另一蛋白質(zhì)或任何其它部分是研究和操作蛋白質(zhì)的化學(xué)和生物學(xué)特性的有力手段。常規(guī)方法包括將蛋白質(zhì)上的親核表面殘基,例如賴氨酸、組氨酸或半胱氨酸的側(cè)鏈與外源性分子,例如醛、oc-卣代羧酰胺和N-羥基琥珀酰亞胺的親電基團(tuán)生物綴合(bioconjugation)(Lemineux,G.A.;Bertozzi,C.R.,77Sr£C//,1996,76,506)。不幸的是,利用蛋白質(zhì)中天然產(chǎn)生的親核耙標(biāo)耙向修飾的問(wèn)題在于,這些反應(yīng)的選擇性中等并且蛋白質(zhì)中存在大量親核氨基酸,從而形成標(biāo)記蛋白質(zhì)的異質(zhì)混合物。此外,親核靶向修飾反應(yīng)往往需要非生理?xiàng)l件,這樣就不可能進(jìn)行體內(nèi)修飾方案和/或可導(dǎo)致蛋白質(zhì)生物學(xué)活性喪失。本領(lǐng)域需要有特異性并靶向蛋白質(zhì)修飾的新耙標(biāo)和新方案。不幸的是,從細(xì)菌到人,每種已知的生物均編碼相同的20種常見(jiàn)氨基酸(罕見(jiàn)的例外是硒代半胱氨酸)(參見(jiàn),例如A.Bock等,(1991),MolecularMicrobiology,5:515-20)和吡咯賴氨酸(參見(jiàn),例如G.Srinivasan等,(2002),Science,296:1459-62)。此特征限制了利用天然產(chǎn)生的氨基酸開(kāi)發(fā)用于靶向蛋白質(zhì)修飾的新化學(xué)物質(zhì)??朔司窒扌缘姆桨钢皇菙U(kuò)大遺傳密碼并將具有不同化學(xué)特性的氨基酸加入生物學(xué)物質(zhì)中。利用真細(xì)菌大腸桿菌(五.co/Z)和其它生物的體內(nèi)蛋白質(zhì)生物合成機(jī)器,用"正交"tRNA和相應(yīng)的新型"正交"氨酰-tRNA合成酶將非天然氨基酸加入蛋白質(zhì)證明此方案是可行的(例如,Wang等,(2001),Science,292:498-500;Chin等,(2002),JournaloftheAmericanChemicalSociety,124:9026-9027;Chin禾口Schultz,(2002),ChemBioChem,11:1135-1137;Chin等,(2002),PNASUnitedStatesofAmerica,99:11020-11024;Wang禾口Schultz,(2002),Chem.Comm.,1-10)。也可參見(jiàn)名為"制備正交tRNA氨酰-tRNA合成酶配對(duì)的方法與組合物"(METHODSANDCOMPOSITIONSFORTHEPRODUCTIONOFORTHOGONALtRNAAMINOACYL陽(yáng)tRNASYNTHETASEPAIRS)的國(guó)際公布WO2002/086075;名為"非天然氨基酸的體內(nèi)摻入"(INVIVOINCORPORATIONOFUNNATURALAMINOACIDS)的WO2002/085923;名為"擴(kuò)展真核生物遺傳密碼"(EXPANDINGTHEEUKARYOTICGENETICCODE)的WO2004/094593;2004年7月7日提交的WO2005/019415;2004年7月7日提交的WO2005/007870與2004年7月7日提交的WO2005/007624。本領(lǐng)域需要新方法來(lái)實(shí)現(xiàn)高度特異性與靶向的蛋白質(zhì)修飾。本領(lǐng)域需要開(kāi)發(fā)能將非天然氨基酸體內(nèi)摻入大腸桿菌蛋白質(zhì)的正交翻譯組分,其中所述非天然氨基酸可以摻入確定位置,所述非天然氨基酸具有不同的化學(xué)特性從而能用作特異性修飾的靶標(biāo)以排除與蛋白質(zhì)的其它部分發(fā)生交叉反應(yīng)或副反應(yīng)。本領(lǐng)域的此需要特別適用于大腸桿菌,因?yàn)檎婕?xì)菌蛋白質(zhì)表達(dá)系統(tǒng)可為科學(xué)研究或治療應(yīng)用生產(chǎn)大量重組蛋白。閱讀下文后可明白本發(fā)明滿足了這些和其它需要。發(fā)明概述本發(fā)明提供制備正交組分的組合物與方法,所述正交組分在體內(nèi)或體外響應(yīng)于選擇者密碼子(selectorcodon),例如,琥珀終止密碼子、四堿基或多堿基密碼子等,將炔基氨基酸摻入到延伸中的多肽鏈。本發(fā)明提供正交tRNA(O-tRNA)、正交氨酰tRNA合成酶(O-RS)和它們的配對(duì)。這些配對(duì)可用于細(xì)胞或非細(xì)胞系統(tǒng)中將炔基氨基酸摻入延伸中的多肽鏈。發(fā)現(xiàn)含有塊基氨基酸的多肽尤其可用于綴合反應(yīng),其中炔基部分在[3+2]環(huán)加成反應(yīng)中易于并且特異性地和疊氮基部分反應(yīng)從而形成三唑鍵。如本文所述,由于炔基對(duì)于體內(nèi)系統(tǒng)是外來(lái)的,而疊氮基團(tuán)基本上可加入任何化學(xué)化合物,所以能位點(diǎn)特異地慘入炔基氨基酸的系統(tǒng)是位點(diǎn)特異性修飾的重要工具。一方面,真細(xì)菌細(xì)胞含有正交氨酰-tRNA合成酶(O-RS),該O-RS用非天然氨基酸優(yōu)先氨酰化正交tRNA(O-tRNA),所述非天然氨基酸是炔基氨基酸。在一些實(shí)施方案中,所述真細(xì)菌細(xì)胞是大腸桿菌細(xì)胞。在一些方面,O-RS衍生自詹氏甲烷球菌(Me/Z2a"ococcw>""fl■yc/^//)氨酰-tRNA合成酶,例如詹氏甲垸球菌酪氨酰-tRNA合成酶。在一些實(shí)施方案中,用于獲得O-RS的酪氨酰-tRNA合成酶是具有SEQIDNO:2所示氨基酸序列的野生型詹氏甲垸球菌酪氨酰-tRNA合成酶。在一些實(shí)施方案中,衍生自SEQIDNO:2所示野生型詹氏甲垸球菌酪氨酰-tRNA合成酶的O-RS在共有位置的組合含有突變,例如(a)氨基酸32位的丙氨酸;(b)氨基酸107位的脯氨酸或谷氨酰胺;(c)氨基酸158位的丙氨酸;和(d)氨基酸162位的丙氨酸或脯氨酸。在一些實(shí)施方案中,O-RS的氨基酸序列含有SEQIDNO:4、6、8、10、12、14、16、18所示序列之一或其保守性變體。含有O-RS的細(xì)胞通常含有能編碼O-RS,例如任何上述O-RS種類的核酸。編碼O-RS的核酸可含有,例如SEQIDNO:5、7、9、11、13、15、17或19所示核苷酸序列。在一些實(shí)施方案中,細(xì)胞所用的O-tRNA是琥珀抑制型tRNA。例如,所述O-tRNA是或含有SEQIDNO:1所示多核苷酸序列。在一些實(shí)施方案中,作為O-RS底物的炔基氨基酸是對(duì)炔丙基氧苯丙氨酸(para-propargyloxyphenylalanine)(pPRO-Phe)。細(xì)胞系統(tǒng)也包含具有至少一個(gè)選擇者密碼子的核酸,其中O-tRNA識(shí)別所述選擇者密碼子。含有正交組分的細(xì)胞還可含有炔基氨基酸,例如pPRO-Phe。在一些實(shí)施方案中,細(xì)胞含有第二正交配對(duì)(即,第二O-tRNA與第二O-RS),其中所述第二配對(duì)對(duì)不同于第一非天然氨基酸的非天然氨基酸特異,所述第二O-tRNA識(shí)別的選擇者密碼子不同于第一O-tRNA所識(shí)別的選擇者密碼子。在一些方面,含有正交組分的細(xì)胞包含翻譯系統(tǒng),其中除O-RS和O-tRNA夕卜,所述系統(tǒng)還包含具有至少一個(gè)選擇者密碼子的、編碼感興趣多肽的核酸與炔基氨基酸,其中所述O-tRNA識(shí)別所述選擇者密碼子,所述O-RS能使所述O-tRNA帶有炔基氨基酸。在一些方面,本發(fā)明提供多肽,例如本文所述的O-RS多肽。這些多肽可衍生自SEQIDNO:2所示的詹氏甲烷球菌酪氨酰氨酰-tRNA合成酶,它們具有以下氨基酸共有序列(a)氨基酸32位的丙氨酸;(b)氨基酸107位的脯氨酸或谷氨酰胺;(c)氦基酸158位的丙氨酸;和(d)氨基酸162位的丙氨酸或脯氨酸,并且這些多肽具有能用炔基氨基酸優(yōu)先氨?;籺RNA(O-tRNA)的氨酰-tRNA合成酶活性。在一些實(shí)施方案中,本發(fā)明多肽選自SEQIDNO:4、6、8、10、12、14、16、18或其保守性變體。任何這樣的本發(fā)明O-RS多肽是能用炔基氨基酸優(yōu)先氨?;婕?xì)菌細(xì)胞內(nèi)的正交tRNA(O-tRNA)的氨酰-tRNA合成酶。本發(fā)明也提供編碼上述本發(fā)明的任何O-RS多肽的多核苷酸。在一些實(shí)施方案中,本發(fā)明的多核苷酸(編碼本發(fā)明的O-RS)選自SEQIDNOS:5、7、9、11、13、15、17和19。編碼本發(fā)明O-RS的任何本發(fā)明多核苷酸可摻入載體,例如表達(dá)載體。本發(fā)明載體可用于細(xì)胞中。在一些方面,本發(fā)明提供在真細(xì)菌細(xì)胞中制備含有非天然炔基氨基酸的蛋白質(zhì)的方法。所述方法能安排將炔基氨基酸插入蛋白質(zhì)中任何所需的特定位置。所述方法具有以下步驟(a)提供真細(xì)菌細(xì)胞,其含有(i)正交氨酰-tRNA合成酶(O-RS);(ii)正交tRNA(O-tRNA),其中所述O-RS用炔基氨基酸優(yōu)先氨酰化所述O-tRNA;(iii)編碼蛋白質(zhì)的核酸,其中所述核酸含有至少一個(gè)被所述O-tRNA識(shí)別的選擇者密碼子;和(iv)炔基氨基酸;和,(b)培養(yǎng)細(xì)胞;(C)在所述蛋白質(zhì)的翻譯期間將炔基氨基酸摻入所述核酸編碼的蛋白質(zhì)的特定位置,其中蛋白質(zhì)的所述特定位置對(duì)應(yīng)于所述核酸中選擇者密碼子的位置,從而產(chǎn)生在所述特定位置含有炔基氨基酸的蛋白質(zhì)。這些方法通常利用大腸桿菌細(xì)胞。這些方法所用的O-RS通常衍生自詹氏甲垸球菌氨酰-tRNA合成酶,例如詹氏甲垸球菌酪氨酰-tRNA合成酶。在一些實(shí)施方案中,詹氏甲烷球菌酪氨酰-tRNA合成酶是SEQIDNO:2所示的合成酶。在一些實(shí)施方案中,O-RS衍生自SEQIDNO:2所示的詹氏甲垸球菌酪氨酰-tRNA合成酶,其中所述O-RS具有的氨基酸序列具有以下突變(a)氨基酸32位的丙氨酸;(b)氨基酸107位的脯氨酸或谷氨酰胺;(c)氨基酸158位的丙氨酸;和(d)氨基酸162位的丙氨酸或脯氨酸。在一些實(shí)施方案中,本發(fā)明所用的O-RS具有選自SEQIDNO:4、6、8、10、12、14、16、18的氨基酸序列或其保守性變體。在本發(fā)明方法中,細(xì)胞可含有編碼任意這些O-RS多肽的多核苷酸。例如,可利用含有SEQIDNO:5、7、9、11、13、15、17或19所示核苷酸序列的多核苷酸。在這些方法的一些實(shí)施方案中,O-tRNA是琥珀抑制型tRNA,選擇者密碼子是琥珀終止密碼子(TAG)。在一些實(shí)施方案中,O-tRNA包含SEQIDNO:1所示的多核苷酸序列或由其編碼??刹捎眠@些方法來(lái)產(chǎn)生具有炔基氨基酸(對(duì)炔丙基氧苯丙氨酸(pPRO-Phe))的蛋白質(zhì)。本發(fā)明方法所產(chǎn)生的蛋白質(zhì)含有的氨基酸序列可與野生型治療性蛋白質(zhì)、診斷性蛋白質(zhì)、工業(yè)酶或其一部分的氨基酸序列至少75%相同。這些蛋白質(zhì)可任選與藥學(xué)上可接受的運(yùn)載體結(jié)合。在一些實(shí)施方案中,可在炔基氨基酸的位置修飾本發(fā)明方法所產(chǎn)生的蛋白質(zhì),例如通過(guò)[3+2]環(huán)加成反應(yīng)以形成三唑鍵。定義在詳細(xì)描述本發(fā)明前,應(yīng)該知道本發(fā)明并不限于具體的生物系統(tǒng),這些系統(tǒng)當(dāng)然可以不同。還應(yīng)知道本文所用術(shù)語(yǔ)只是為了描述具體實(shí)施方案,并不是對(duì)本發(fā)明的限制。除非另有明確指出,本說(shuō)明書(shū)和附屬權(quán)利要求書(shū)中所用的單數(shù)形式"一個(gè)"、"一種"和"該"也包括復(fù)數(shù)對(duì)象。因此,例如"一個(gè)細(xì)胞"包括兩個(gè)或多個(gè)細(xì)胞的組合;"一個(gè)多核苷酸"實(shí)際上包括該多核苷酸的多份拷貝。除了此處和說(shuō)明書(shū)下文定義的,本文所用的所有技術(shù)和科學(xué)術(shù)語(yǔ)都與本發(fā)明所屬領(lǐng)域普通技術(shù)人員常規(guī)理解的意義相同。正交:本文所用的術(shù)語(yǔ)"正交"指與某細(xì)胞或翻譯系統(tǒng)的內(nèi)源性相應(yīng)分子相比,某分子(例如,正交tRNA(0-tRNA)和/或正交氨?;鵷RNA合成酶(O-tRNA))與該細(xì)胞內(nèi)源性組分起作用的效率降低,或不能與該細(xì)胞的內(nèi)源性組分起作用。就tRNA和氨酰-tRNA合成酶而言,正交指與和內(nèi)源性tRNA合成酶起作用的內(nèi)源性tRNA相比,正交tRNA不能與內(nèi)源性tRNA合成酶起作用或起作用的效率降低;或者與和內(nèi)源性tRNA起作用的內(nèi)源性tRNA合成酶相比,正交氨酰tRNA合成酶與內(nèi)源性tRNA不起作用或起作用的效率降低,所述效率降低例如,20%以下的效率,10%以下的效率,5%以下的效率,或1%以下的效率。正交分子缺乏細(xì)胞中功能正常的內(nèi)源性互補(bǔ)分子。例如,與內(nèi)源性RS氨?;瘍?nèi)源性tRNA相比,細(xì)胞的任何內(nèi)源性RS氨酰化細(xì)胞中正交tRNA的效率降低或者甚至降為0。在另一例子中,與內(nèi)源性RS氨?;瘍?nèi)源性tRNA相比,正交RS氨酰化感興趣細(xì)胞中任何內(nèi)源性tRNA的效率降低或者降為0??蓪⒛芘c第一正交分子起作用的第二正交分子引入細(xì)胞。例如,正交tRNA/RS配對(duì)包括引入的互補(bǔ)組份,它們?cè)诩?xì)胞中共同起作用的效率與對(duì)照(如對(duì)應(yīng)的tRNA/RS內(nèi)源性配對(duì)或活性正交配對(duì)(如酪氨酰正交tRNA/RS配對(duì))相當(dāng)(例如是45%效率、50%效率、60%效率、70%效率、75%效率、80%效率、90%效率、95%效率或99%效率,或更高)。正交酪氨酰-tRNA:本文所用的術(shù)語(yǔ)正交酪氨酰-tRNA(酪氨酰-O-tRNA)是與感興趣翻譯系統(tǒng)正交的tRNA,其中所述tRNA是(1)與天然產(chǎn)生的酪氨酰-tRNA相同或基本類似;(2)通過(guò)天然或人工誘變衍生自天然產(chǎn)生的酪氨酰tRNA;(3)由考慮了(1)或(2)的野生型或突變型酪氨酰tRNA序列的方法所產(chǎn)生;(4)與野生型或突變型酪氨酰tRNA同源;(5)與稱為表4中酪氨酰tRNA合成酶底物的任何示例性tRNA同源;或(6)稱為表4中酪氨酰tRNA合成酶底物的任何示例性tRNA的保守變體。酪氨酰tRNA可攜帶氨基酸,或處于非負(fù)載狀態(tài)。也應(yīng)知道"酪氨酰-O-tRNA"任選被關(guān)聯(lián)(cognate)合成酶加載(氨?;?除酪氨酸以外的氨基酸,例如非天然氨基酸對(duì)炔丙基氧苯丙氨酸。應(yīng)該理解,實(shí)際上本發(fā)明酪氨酰-O-tRNA可有利地用于在翻譯期間響應(yīng)于選擇者密碼子而將基本上任何氨基酸(無(wú)論天然或人工的)摻入延伸中的多肽內(nèi)。正交酪氨酰氨基酸合成酶:本文所用的正交酪氨酰氨基酸合成酶(酪氨酰-O-RS)是在感興趣翻譯系統(tǒng)內(nèi)用氨基酸優(yōu)先氨酰化酪氨酰-O-tRNA的合成酶。酪氨酰-O-RS加載到酪氨酰-O-tRNA上的氨基酸可以是任何氨基酸,無(wú)論是天然的還是人工的,并且不限于本文所述的氨基酸。該合成酶任選與天然的酪氨酰氨基酸合成酶相同或同源,或者與表4中稱為O-RS的合成酶相同或同源。例如,所述0-RS可以是表4的酪氨酰-0-RS的保守變體,和/或與表4中0-RS的序列至少有50。/。、60%、70%、80%、90%、95%、98%、99%或以上相同。關(guān)聯(lián)物(cognate):術(shù)語(yǔ)"關(guān)聯(lián)物"指共同起作用的組分,例如正交tRNA和正交氨酰-tRNA合成酶。這些組分也可互稱為"互補(bǔ)的"。優(yōu)先氨?;?對(duì)于正交翻譯系統(tǒng)而言,當(dāng)某表達(dá)系統(tǒng)中O-RS使O-tRNA帶上氨基酸的效率高于其使任何內(nèi)源性tRNA帶上氨基酸的效率時(shí),該O-RS"優(yōu)先氨酰化"關(guān)聯(lián)O-tRNA。艮卩,當(dāng)翻譯系統(tǒng)中存在大致相等摩爾比的O-tRNA與任何給定的內(nèi)源性tRNA時(shí),O-RS使O-tRNA帶上氨基酸的頻率高于它使內(nèi)源性tRNA帶上氨基酸的頻率。當(dāng)翻譯系統(tǒng)中存在等摩爾濃度的O-tRNA與內(nèi)源性tRNA時(shí),通過(guò)O-RS帶上氨基酸的O-tRNA與通過(guò)O-RS帶上氨基酸的內(nèi)源性tRNA的相對(duì)比例優(yōu)選較高,最好導(dǎo)致O-RS僅使或幾乎僅使O-tRNA帶上氨基酸。當(dāng)存在等摩爾濃度的O-tRNA與O-RS時(shí),通過(guò)O-RS帶上氨基酸的O-tRNA與通過(guò)O-RS帶上氨基酸的內(nèi)源性tRNA的相對(duì)比例大于l:1,優(yōu)選至少約2:1,更優(yōu)選5:1,更優(yōu)選10:1,更優(yōu)選20:1,更優(yōu)選50:1,更優(yōu)選75:1,更優(yōu)選95:1、98:1、99:1、100:1、500:1、1,000:1、5,000:1或更高。當(dāng)(a)與內(nèi)源性tRNA相比,O-RS優(yōu)先氨酰化O-tRNA,和(b)與O-RS用任何天然氨基酸氨酰化O-tRNA相比,氨酰化對(duì)非天然氨基酸特異時(shí),O-RS"用非天然氨基酸優(yōu)先氨酰化O-tRNA"。艮卩,當(dāng)包含O-RS和O-tRNA的翻譯系統(tǒng)中存在等摩爾量的非天然和天然氨基酸時(shí),O-RS將非天然氨基酸加載到O-tRNA上的頻率高于加載天然氨基酸的頻率。帶有非天然氨基酸的O-tRNA與帶有天然氨基酸的O-tRNA的相對(duì)比例優(yōu)選較高。O-RS最好使O-tRNA僅僅,或者幾乎僅僅帶上非天然氨基酸。當(dāng)翻譯系統(tǒng)中存在等摩爾濃度的天然和非天然氨基酸時(shí),使O-tRNA帶上非天然氨基酸與使O-tRNA帶上天然氨基酸的相對(duì)比例大于1:1,優(yōu)選至少約2:1,更優(yōu)選5:1,更優(yōu)選10:1,更優(yōu)選20:1,更優(yōu)選50:1,更優(yōu)選75:1,更優(yōu)選95:1、98:1、99:1、100:1、500:1、l,OOO:1、5,000:1或更高。選擇者密碼子:術(shù)語(yǔ)"選擇者密碼子"指翻譯過(guò)程中為O-tRNA所識(shí)別而不為內(nèi)源性tRNA所識(shí)別的密碼子。0-tRNA反密碼子環(huán)識(shí)別mRNA上的選擇者密碼子并在多肽的此位置摻入其氨基酸,例如非天然氨基酸(如炔基氨基酸)。選擇者密碼子可包括,例如無(wú)義密碼子,如終止密碼子(如,琥珀、赭石和乳白密碼子);四堿基或四堿基以上密碼子;罕用密碼子;衍生自天然或非天然堿基對(duì)的密碼子,等等。抑制型tRNA:抑制型tRNA是例如通過(guò)提供響應(yīng)選擇者密碼子而將氨基酸摻入多肽鏈的機(jī)制來(lái)改變給定的翻譯系統(tǒng)中信使RNA(mRNA)閱讀的tRNA。例如,抑制型tRNA可讀通如終止密碼子(如,琥珀、赭石和乳白密碼子)、四堿基密碼子、罕用密碼子等。抑制活性:本文所用的術(shù)語(yǔ)"抑制活性"總體上指tRNA(例如,抑制型tRNA)能翻譯讀通在其它情況中可導(dǎo)致翻譯終止或錯(cuò)譯(例如,移碼)的密碼子(例如,作為選擇者密碼子的琥珀密碼子或四個(gè)或以上堿基的密碼子)的能力。抑制型tRNA的抑制活性可表達(dá)為與第二抑制型tRNA,或與對(duì)照系統(tǒng),例如缺乏O-RS的對(duì)照系統(tǒng)相比,觀察到的翻譯讀通活性的百分比。本發(fā)明提供了能定量測(cè)定抑制活性的各種方法。具體O-tRNA和O-RS對(duì)感興趣的選擇者密碼子(例如,琥珀密碼子)的抑制百分比是指,在感興趣的翻譯系統(tǒng)中,在編碼表達(dá)測(cè)試標(biāo)記的核酸中含有選擇者密碼子的給定表達(dá)測(cè)試標(biāo)記(例如,LacZ)的活性與陽(yáng)性對(duì)照構(gòu)建物相比的百分比,所述感興趣的翻譯系統(tǒng)包含O-RS和O-tRNA,所述陽(yáng)性對(duì)照沒(méi)有O-tRNA、O-RS和選擇者密碼子。因此,例如,如果在給定翻譯系統(tǒng)中觀察到不含選擇者密碼子的活性陽(yáng)性對(duì)照標(biāo)記構(gòu)建物的活性為X(其單位與具體的標(biāo)記試驗(yàn)相關(guān)),則含有選擇者密碼子的測(cè)試構(gòu)建物的抑制百分比是在與陽(yáng)性對(duì)照標(biāo)記的表達(dá)基本相同的環(huán)境條件下(除了測(cè)試標(biāo)記構(gòu)建物在也含有O-tRNA和O-RS的翻譯系統(tǒng)中表達(dá)外),該測(cè)試標(biāo)記構(gòu)建物顯示的X百分比。表達(dá)該測(cè)試標(biāo)記的翻譯系統(tǒng)一般也包含被O-RS和O-tRNA所識(shí)別的氨基酸??扇芜x通過(guò)將測(cè)試標(biāo)記與"背景"或"陰性"對(duì)照標(biāo)記構(gòu)建物比較來(lái)校正抑制百分比的測(cè)量值,所述"背景"或"陰性"對(duì)照標(biāo)記構(gòu)建物含有與測(cè)試標(biāo)記相同的選擇者密碼子,但其所在的系統(tǒng)不含O-tRNA、0-RS和/或被0-tRNA和/或0-RS所識(shí)別的相關(guān)氨基酸。該陰性對(duì)照可用于標(biāo)準(zhǔn)化抑制百分比測(cè)定值以消除感興趣的翻譯系統(tǒng)中標(biāo)記的背景信號(hào)的影響??赏ㄟ^(guò)本領(lǐng)域已知的許多試驗(yàn)來(lái)測(cè)定抑制效率。例如,可采用,半乳糖苷酶報(bào)道試驗(yàn),如可將衍生的lacZ質(zhì)粒(該構(gòu)建物在lacZ核酸序列中含有選擇者密碼子)連同含有本發(fā)明的O-tRNA的質(zhì)粒引入合適生物(例如,可利用正交組分的生物)的細(xì)胞。也可引入關(guān)聯(lián)合成酶(為多肽或表達(dá)時(shí)能編碼該關(guān)聯(lián)合成酶的多核苷酸)。細(xì)胞在培養(yǎng)基中生長(zhǎng)至所需密度,例如至OD6Q。約為0.5,進(jìn)行卩-半乳糖苷酶試驗(yàn),例如用BetaFluorTMp-半乳糖苷酶試驗(yàn)試劑盒(Novagen)??蓪⒁种瓢俜直扔?jì)算為樣品相對(duì)于可比較對(duì)照,例如,與衍生的lacZ構(gòu)建物的觀察值的活性百分比,該衍生的lacZ構(gòu)建物在所需位置具有相應(yīng)的有義密碼子而非選擇者密碼子。翻譯系統(tǒng):術(shù)語(yǔ)"翻譯系統(tǒng)"指將氨基酸摻入延伸中的多肽鏈(蛋白質(zhì))的各組分。翻譯系統(tǒng)的組分可包括,例如核糖體、tRNA、合成酶、mRNA等。本發(fā)明的O-tRNA和/或O-RS可加入體外或體內(nèi)翻譯系統(tǒng)或是其一部分,例如存在于非真核細(xì)胞,如細(xì)菌(如大腸桿菌)中,或存在于真核細(xì)胞中,如酵母菌、哺乳動(dòng)物細(xì)胞、植物細(xì)胞、藻類細(xì)胞、真菌細(xì)胞、昆蟲(chóng)細(xì)胞等。非天然氨基酸:本文所用的術(shù)語(yǔ)"非天然氨基酸"指不在20種常見(jiàn)天然氨基酸和硒代半胱氨酸或吡咯賴氨酸之列的任何氨基酸,修飾的氨基酸和/或氨基酸類似物,例如炔基氨基酸。衍生自:本文所用的術(shù)語(yǔ)"衍生自"分離自特定分子或生物,或是用特定分子或生物的信息制得的某組份。例如,衍生自第二多肽的多肽含有與該第二多肽的氨基酸序列相同或基本上類似的氨基酸序列。以多肽為例,可通過(guò),例如天然產(chǎn)生的誘變、人工定向誘變或人工隨機(jī)誘變獲得衍生的種類。用于衍生多肽的誘變可以是有意定向或有意隨機(jī)的。誘變多肽以產(chǎn)生衍生自第一(多肽)的不同多肽可以是隨機(jī)事件(例如,聚合酶失真所致),鑒定衍生的多肽可以是偶然發(fā)現(xiàn)的。誘變多肽通常需要處理編碼該多肽的多核苷酸。陽(yáng)性選擇或篩選標(biāo)記:本文所用的術(shù)語(yǔ)"陽(yáng)性選擇或篩選標(biāo)記"指當(dāng)存在該標(biāo)記時(shí)(例如被表達(dá)或激活等)可鑒定出具有特征,例如具有陽(yáng)性選擇標(biāo)記的細(xì)胞,從而區(qū)別于不具有該特征的細(xì)胞。陰性選擇或篩選標(biāo)記:本文所用的術(shù)語(yǔ)"陰性選擇或篩選標(biāo)記"指當(dāng)存在該標(biāo)記時(shí)(例如被表達(dá)或激活等)可鑒定不含有所選特性或特征的細(xì)胞(例如,與確實(shí)具有該特性或特征的細(xì)胞相比)。報(bào)道分子:本文所用的術(shù)語(yǔ)"報(bào)道分子"是指可用于鑒定和/或選擇感興趣系統(tǒng)的靶組分的組分。例如,報(bào)道分子可以包括蛋白質(zhì),如能賦予抗生素抗性或敏感性的酶(如P-內(nèi)酰胺酶、氯霉素乙酰轉(zhuǎn)移酶(CAT)等)、熒光篩選標(biāo)記(如綠色熒光蛋白(如GFP)、YFP、EGFP、RFP等)、冷光標(biāo)記(如螢火蟲(chóng)螢光素酶蛋白)、親和力篩選標(biāo)記,或者正或負(fù)可選擇標(biāo)記基因如lacZ、P-gal/lacZ(p-半乳糖苷酶)、ADH(乙醇脫氫酶)、his3、ura3、leu2、lys2等。真核生物:本文所用的術(shù)語(yǔ)"真核生物"指屬于真核生物界(KingdomEucarya)的生物。真核生物通常因其以下特征而區(qū)別于原核生物典型的多細(xì)胞組織(但不都是多細(xì)胞,例如酵母),存在膜限制的核與其它膜限制的細(xì)胞器,線性遺傳物質(zhì)(即,線性染色體),不存在操縱子,存在內(nèi)含子、信使(RNA)加帽和poly-AmRNA,以及其它生物化學(xué)特征,如不同的核糖體結(jié)構(gòu)。真核生物包括,例如動(dòng)物(如哺乳動(dòng)物、昆蟲(chóng)、爬行動(dòng)物、鳥(niǎo)等),纖毛蟲(chóng),植物(如單子葉植物、雙子葉植物、藻類等)、真菌、酵母菌、鞭毛蟲(chóng)類、微孢子蟲(chóng)、原生動(dòng)物等。原核生物:本文所用的術(shù)語(yǔ)"原核生物"指屬于原核生物界(也稱為原核生物(Procarya))的生物。原核生物通常因其以下特征而區(qū)別于真核生物單細(xì)胞組織,通過(guò)出芽或分裂的無(wú)性生殖,缺乏膜限制的核與其它膜限制的細(xì)胞器,環(huán)狀染色體,存在操縱子,不存在內(nèi)含子、信使(RNA)加帽和poly-AmRNA,以及其它生物化學(xué)特征,如不同的核糖體結(jié)構(gòu)。原核生物包括真細(xì)菌和古細(xì)菌(Archaea)(有時(shí)稱為"古細(xì)菌(Archaebacteria)")亞界。在原核生物界有時(shí)將藍(lán)細(xì)菌(藍(lán)綠藻)與支原體分為不同類別。細(xì)菌-.本文所用的術(shù)語(yǔ)"細(xì)菌"和"真細(xì)菌"指不同于古細(xì)菌的原核生物。類似地,古細(xì)菌指不同于真細(xì)菌的原核生物。可根據(jù)許多形態(tài)和生物化學(xué)標(biāo)準(zhǔn)區(qū)分真細(xì)菌和古細(xì)菌。例如,可采用核糖體RNA序列、RNA聚合酶結(jié)構(gòu)的差異,存在或不存在內(nèi)含子,抗生素敏感性,存在或不存在細(xì)胞壁肽聚糖和其它細(xì)胞壁組分,膜脂質(zhì)的分枝與不分枝結(jié)構(gòu),存在/不存在組蛋白和組蛋白樣蛋白將某生物指定為真細(xì)菌或古細(xì)菌。真細(xì)菌的例子包括大腸桿菌Cfoc/zen'c/z/flco//)、嗜熱棲熱菌(7Tzemm^〖/zerwo//w7w力、嗜熱脂肪芽孢桿菌CBac/〃m>^^^/7^附0;/2//^)等)。古細(xì)菌的例子包括詹氏甲烷球菌(Me^mococcwsy'a"mwC/z//)(^)、梅氏甲垸八疊球菌(M"/z朋o^rc/加顧ze/)(似—、嗜熱喊甲烷桿菌(她^3wo6a"m-^7f/zermoflw加ro/9/z/c膽)(Mif)、海沼甲烷球菌(M^/wf"ococcwsmfl/-—/wfifo)、甲院嗜熱菌(Me/zfl"o"ms^mfife"')、鹽細(xì)菌(//"/0^"^/^7)(例如沃氏富鹽菌(Z/fl/o/eraxw/cfl",'/)和鹽細(xì)菌種A^C-7)、閃爍古生球菌(/^c/2aeog7oZms/w/g油s)(4/)、激烈火球菌(戶戶coc,/鵬'o愿)(尸力、尸jtococcmZzo〃'fowM(尸/z)、好氧火球菌(尸yraZ)acw/扁aerap/n'/調(diào))、尸yracoccws"6戸/、硫磺礦硫化口十菌(Sw^/b/o&iwso^!/ar/ciw)(&)、5^^/b/o6w5toA:o血7、^eMro"r畫(huà)per"/jc(^p)、嗜酸熱原體(77zer;wop/asmooc/afo;/n7M附)禾口火山熱原體(777ermop/oswflvo/c朋/調(diào))。保守性變體:就翻譯組分而言,本文所用的術(shù)語(yǔ)"保守性變體"指在功能上類似于和該保守性變體相似的基本組分,例如O-tRNA或O-RS,但與參比O-tRNA或O-RS相比,序列中有變異的某翻譯組份,例如保守性變體O-tRNA或保守性變體O-RS。例如,O-RS可用非天然氨基酸,例如炔基氨基酸,如對(duì)炔丙基氧苯丙氨酸來(lái)氨?;パa(bǔ)O-tRNA或保守性變體O-tRNA,雖然O-tRNA和保守性變體O-tRNA不具有相同的序列。保守性變體在序列中可具有例如一處變異、兩處變異、三處變異、四處變異或五處或更多處變異,只要該保守性變體與相應(yīng)的O-tRNA或O-RS互補(bǔ)。選擇或篩選試劑:本文所用的術(shù)語(yǔ)"選擇或篩選試劑"指當(dāng)其存在時(shí)可從某群體中選擇或篩選某些組分的試劑。例如,選擇或篩選試劑可以是但不限于,如營(yíng)養(yǎng)物、抗生素、某波長(zhǎng)的光、抗體、表達(dá)的多核苷酸等。選擇試劑可依例如濃度、強(qiáng)度等而不同。響應(yīng)于:本文所用的術(shù)語(yǔ)"響應(yīng)于"指本發(fā)明的O-tRNA識(shí)別選擇者密碼子并介導(dǎo)與該tRNA偶聯(lián)的炔基氨基酸摻入延伸中的多肽鏈的過(guò)程。編碼:本文所用的術(shù)語(yǔ)"編碼"指用多聚大分子或序列鏈中的信息來(lái)指導(dǎo)不同于該第一分子或序列鏈的第二種分子或序列鏈產(chǎn)生的任何過(guò)程。本文所用的該術(shù)語(yǔ)應(yīng)用廣泛,可用于各種領(lǐng)域。一方面,術(shù)語(yǔ)"編碼"描述了半保留DNA復(fù)制的過(guò)程,其中雙鏈DNA分子的一條鏈用作模板通過(guò)依賴DNA的DNA合成酶來(lái)編碼新合成的互補(bǔ)姊妹鏈。在另一方面,術(shù)語(yǔ)"編碼"指用一種分子的信息來(lái)指導(dǎo)產(chǎn)生化學(xué)性質(zhì)不同于該第一分子的第二種分子的任何過(guò)程。例如,DNA分子可編碼RNA分子(例如,通過(guò)依賴DNA的RNA聚合酶參與的轉(zhuǎn)錄過(guò)程)。RNA分子也可編碼多肽,例如翻譯過(guò)程。當(dāng)術(shù)語(yǔ)"編碼"用于描述翻譯過(guò)程時(shí),其含義也延伸至編碼氨基酸的三聯(lián)密碼子。在一些方面,RNA分子可編碼DNA分子,例如通過(guò)依賴RNA的DNA合成酶參與的逆轉(zhuǎn)錄過(guò)程。在另一方面,DNA分子可編碼多肽,應(yīng)理解該情況用"編碼"同時(shí)包括轉(zhuǎn)錄和翻譯過(guò)程。炔本文所用的術(shù)語(yǔ)"炔"(有時(shí)也稱為"乙炔")指具有以下通式的在兩個(gè)碳原子之間含有三鍵的化學(xué)結(jié)構(gòu)(如圖1B,)^^R其中R是任何原子或結(jié)構(gòu)。當(dāng)用作取代基時(shí),該炔部分稱為"炔基"。炔基碳原子是spZ雜化,形成只與兩個(gè)其它原子結(jié)合的鍵;這些鍵之一是單價(jià),而另一鍵是三鍵。例如,炔基氨基酸是在兩個(gè)碳中心之間含有三鍵的氨基酸。由于自然界中氨基酸上不存在炔基取代基,任何炔基氨基酸都是非天然氨基酸。疊氮基:本文所用的術(shù)語(yǔ)"疊氮基"指具有以下通式的化學(xué)基團(tuán)-N3:R-N=N+=N-該疊氮基通常與碳原子相連。例如,疊氮基染料是具有疊氮取代基的染料分子(參見(jiàn),例如圖6A和6B中的疊氮基染料2和3)。術(shù)語(yǔ)"疊氮化物"指含有疊氮基團(tuán)的化合物(例如,芐基疊氮、疊氮鈉等)。附圖簡(jiǎn)述圖1提供了非天然氨基酸對(duì)炔丙基氧苯丙氨酸(按照IUPAC命名法也稱為2-氨基-3-[4-(丙-2-炔基氧)苯基]-丙酸)的化學(xué)結(jié)構(gòu)(1)。圖1B給出了室溫下在有銅存在時(shí)疊氮(化物)與炔發(fā)生[3+2]環(huán)加成反應(yīng)從而可逆地形成三唑的通用化學(xué)反應(yīng)。圖2提供了野生型詹氏甲烷球菌酪氨酰-tRNA合成酶(MjTyrRS)的核苷酸與氨基酸序列。對(duì)炔丙基氧苯丙氨酸(pPRO-Phe)tRNA合成酶中定向誘變所靶向的氨基酸位置或其它突變的氨基酸位置(與相應(yīng)的三聯(lián)密碼子)加框表示。圖3提供的表格描述了編碼野生型詹氏甲烷球菌酪氨酰-tRNA合成酶的多核苷酸誘變后鑒定與分離的8種對(duì)炔丙基氧苯丙氨酸(pPRO-Phe)tRNA合成酶。顯示了野生型詹氏甲垸球菌酪氨酰-tRNA合成酶與對(duì)炔丙基氧苯丙氨酸t(yī)RNA合成酶(pPRO-PheRS)的所示密碼子編碼的氨基酸。也顯示了突變位置的密碼子。如圖2所示,按照野生型詹氏甲垸球菌酪氨酰-tRNA合成酶的氨基酸編號(hào)給突變體的氨基酸位置編號(hào)。圖4是純化的Ser4—pPRO-Phe4突變型肌紅蛋白的Gelcode②藍(lán)(PierceBiotechnology,Inc.)-染色的SDS-PAGE凝膠(電泳圖譜)。泳道1含有在有對(duì)炔丙基氧苯丙氨酸(pPRO-Phe)存在時(shí)在基本培養(yǎng)基中培養(yǎng)的大腸桿菌表達(dá)的蛋白質(zhì);泳道2含有在沒(méi)有pPRO-Phe存在時(shí)產(chǎn)生的蛋白質(zhì)樣品。下圖顯示了利用抗-His6抗體檢測(cè)肌紅蛋白C-末端的六組氨酸標(biāo)簽的同一樣品物質(zhì)的western印跡。圖5提供了含有炔基非天然氨基酸(以¥*表示)的胰蛋白酶消化肽段HGVTVLTALGY*ILK的串聯(lián)質(zhì)譜圖,顯示了它們預(yù)計(jì)的離子質(zhì)量。箭頭表示觀察到的肽的b和y離子系列。圖6A和6B提供了疊氮基功能化染料的化學(xué)結(jié)構(gòu)(分別是2和3)。圖6A中的染料2含有丹磺酰熒光團(tuán),圖6B的染料3含有熒光素?zé)晒鈭F(tuán)。圖7A給出了在工程改造的琥珀密碼子(4ATG)處含有炔基氨基酸的突變型肌紅蛋白與疊氮基功能化染料(如圖6A和6B所示)間發(fā)生[3+2]環(huán)加成反應(yīng)從而可逆地形成三唑的通用化學(xué)反應(yīng)。圖7B提供了分辨的(resolved)標(biāo)記肌紅蛋白在UV照射下的熒光凝膠成像,其中[3+2]環(huán)加成反應(yīng)共價(jià)連接于染料2或染料3。圖8A和8B提供炔基非天然氨基酸的結(jié)構(gòu)和名稱。圖8A提供了可從非天然前體化學(xué)合成的炔基非天然氨基酸。圖8B提供了可能能夠從現(xiàn)存的天然產(chǎn)生氨基酸底物合成的炔基非天然氨基酸。發(fā)明詳述極其需要能在生理?xiàng)l件下以高度選擇性方式修飾蛋白質(zhì)的化學(xué)反應(yīng)(Lemineux和Bertozzi,(1996),775r£C//,76:506)。本領(lǐng)域目前用于蛋白質(zhì)選擇性修飾的大多數(shù)反應(yīng)包括在親核和親電配對(duì)(partners)之間形成共價(jià)鍵,所述配對(duì)靶向蛋白質(zhì)氨基酸鏈中天然產(chǎn)生的親核殘基,例如a-卣代酮與組氨酸或半胱氨酸側(cè)鏈的反應(yīng)。在這些情況中,選擇性取決于蛋白質(zhì)中親核殘基的數(shù)量與可接近性。不幸的是,天然產(chǎn)生的蛋白質(zhì)往往含有位置不佳(例如,不可接近)的反應(yīng)位點(diǎn)或多個(gè)反應(yīng)靶標(biāo)(例如,賴氨酸、組氨酸和半胱氨酸殘基),導(dǎo)致修飾反應(yīng)選擇性差,使得通過(guò)親核/親電試劑進(jìn)行高度靶向的蛋白質(zhì)修飾非常困難。此外,修飾位點(diǎn)通常局限于天然產(chǎn)生的賴氨酸、組氨酸或半胱氨酸的親核側(cè)鏈。難于或不可能在其它位點(diǎn)修飾。此問(wèn)題的解決方法之一是利用正交翻譯組分將具有新反應(yīng)性的非天然氨基酸以按計(jì)劃的、位點(diǎn)特異性生物合成方式摻入蛋白質(zhì)(Wang和Schultz,(2002),C/zem.Commtm.,7:1;vanMaarseveen禾卩Back,(2003),CTze/n.,775:6106)。在此,我們報(bào)道了選擇性修飾蛋白質(zhì)的高度有效的新方法,所述方法包括響應(yīng)于琥珀無(wú)義密碼子TAG將含炔基的非天然氨基酸遺傳摻入細(xì)菌(例如,大腸桿菌)所產(chǎn)生的蛋白質(zhì)。然后可特異性且區(qū)域選擇性地(regioselectively)修飾這些炔基氨基酸側(cè)鏈。由于炔基獨(dú)特的反應(yīng)化學(xué)性質(zhì),可以極高的選擇性修飾這些蛋白質(zhì)。為在細(xì)菌表達(dá)系統(tǒng)所產(chǎn)生的蛋白質(zhì)的獨(dú)特位點(diǎn)(例如,所需位點(diǎn))選擇性地引入炔基官能團(tuán),我們開(kāi)發(fā)了在遺傳編碼炔基氨基酸對(duì)炔丙基氧苯丙氨酸(pPRO-Phe;見(jiàn)圖1A)的真細(xì)菌中起作用的正交tRNA/氨酰-tRNA合成酶配對(duì)。簡(jiǎn)言之,我們鑒定出在大腸桿菌細(xì)胞中使琥珀抑制型tRNA選擇性帶上對(duì)炔丙基氧苯丙氨酸(pPRO-Phe)的詹氏甲烷球菌酪氨酰-tRNA合成酶的新突變體??捎眠@些開(kāi)發(fā)的tRNA-合成酶將炔基位點(diǎn)特異地?fù)饺氲鞍踪|(zhì)。靶向蛋白質(zhì)修飾在本文,我們報(bào)道了選擇性修飾蛋白質(zhì)的高度有效的新方法,所述方法包括響應(yīng)于琥珀無(wú)義密碼子TAG將含炔基的非天然氨基酸遺傳摻入細(xì)菌(例如,大腸桿菌)所產(chǎn)生的蛋白質(zhì)。本文所述的新組合物和方法利用正交tRNA/氨酰-tRNA合成酶系統(tǒng),該正交系統(tǒng)利用衍生自詹氏甲垸球菌的組分,這些組分用于真細(xì)菌宿主系統(tǒng)來(lái)產(chǎn)生感興趣的蛋白質(zhì)。通過(guò)工程改造編碼感興趣蛋白質(zhì)的多核苷酸使之含有能發(fā)出摻入炔基氨基酸信號(hào)的選擇者密碼子,從而可使炔基氨基酸摻入蛋白質(zhì)安排發(fā)生在任何所需位置。然后可通過(guò)Huisgen[3+2]環(huán)加成反應(yīng)用疊氮基衍生物特異性且區(qū)域選擇性地修飾感興趣蛋白質(zhì)上的這些炔基氨基酸側(cè)鏈(參見(jiàn),圖lB)(Padwa,刊于《綜合有機(jī)合成》(C麵p"/ze肌've(9rgam'c5""Ae^);[Trost,B.M.編],Pergamon:牛津,1991,第四巻,第1069-1109頁(yè);Huisgen,刊于《1,3-兩級(jí)環(huán)加成化學(xué)》(/,3-Z^po/wC>c/oaoW/"6>"C7zem/Wo0,[Padwa,A.編],Wiley:紐約,1984,第1-176頁(yè))。由于此方法涉及環(huán)加成而不是親核取代,因此可以極高選擇性地修飾蛋白質(zhì)。此反應(yīng)的優(yōu)點(diǎn)在于,通過(guò)向反應(yīng)混合物中加入催化量的Cu(I)鹽,該反應(yīng)能在室溫、水性條件下進(jìn)行同時(shí)具有優(yōu)秀的區(qū)域選擇性(1,4>1,5)(Tomoe等,(2002),/.Org.C/z艮,67:3057-3064;Rostovtsev等,(2002),綺譜.CAem.,M見(jiàn)化2596-2599)。炔基反應(yīng)性靶標(biāo)的優(yōu)點(diǎn)是對(duì)體內(nèi)系統(tǒng)是完全外來(lái)的,其反應(yīng)化學(xué)性質(zhì)具有高度選擇性(例如,對(duì)含疊氮基的部分具有高度反應(yīng)性),可采用允許涉及蛋白質(zhì)并保留蛋白質(zhì)生物學(xué)活性的、在體外和體內(nèi)進(jìn)行的綴合反應(yīng)的較溫和的反應(yīng)條件來(lái)綴合。為闡述(但不是限制)本發(fā)明,將炔基部分摻入肌紅蛋白模型蛋白,然后通過(guò)形成穩(wěn)定三唑鍵的[3+2]環(huán)加成反應(yīng)(見(jiàn)圖1B)使蛋白與疊氮基熒光染料(見(jiàn)圖6A和6B)生物綴合。雖然本發(fā)明利用兩種疊氮基熒光染料來(lái)說(shuō)明炔基氨基酸與疊氮基部分之間的[3+2]環(huán)加成(見(jiàn)實(shí)施例4),但不應(yīng)理解為本發(fā)明只限于利用這兩種疊氮基染料,或者任何染料或標(biāo)記物,或者實(shí)際上任何單一類型的可綴合材料。本發(fā)明的含疊氮基部分實(shí)際上可以是作為疊氮基衍生物的任何分子。這種分子包括但不限于染料、熒光團(tuán)、交聯(lián)劑、糖衍生物、聚合物(例如,聚乙二醇衍生物)、光交聯(lián)劑、細(xì)胞毒性化合物、親和標(biāo)記物、生物素衍生物、樹(shù)脂、珠、第二蛋白或多肽(或更多)、多核苷酸(例如,DNA、RNA等)、金屬螯合劑、輔因子、脂肪酸、碳水化合物等。這些疊氮基分子可與具有炔基的非天然氨基酸,例如對(duì)炔丙基氧苯丙氨酸(見(jiàn)圖1A)綴合。本發(fā)明詳述了圖6A和6B所示疊氮基染料的合成。分別見(jiàn)實(shí)施例6和7。然而,本領(lǐng)域技術(shù)人員熟知感興趣的任何具體分子的疊氮基衍生物的合成。例如,有許多教材和方案描述了如何合成疊氮基化合物。綜合參考可見(jiàn)Patai,Saul,刊于《官能團(tuán)化學(xué)》(77^C/zem/Wo;o/Fw"c"o"a/Oo";w)中的"疊氮基化學(xué)"(Thechemistryoftheazidogroup),London,NewYork,IntersciencePublishers,1971。在另一方面,本發(fā)明提供利用含炔基多肽的綴合反應(yīng)所用的聚乙二醇疊氮基衍生物(疊氮基-PEG)來(lái)產(chǎn)生PEG化多肽的組合物與方法。疊氮基聚乙二醇的通用結(jié)構(gòu)是N3-CH2-(CH2-0-CH2)n-CH2OR其中R是H或CH3,n是介于例如50-10,000,75-5,000,100-2,000,100-1,000等之間的整數(shù)。在本發(fā)明的各種實(shí)施方案中,疊氮基聚乙二醇的分子量是,例如約5,000-約100,000Da(艮卩,約5kDa-約100kDa),約20,000-50,000Da,約20,000-約10,000Da(如20,000Da)等。本領(lǐng)域技術(shù)人員熟知合成疊氮基聚乙二醇的技術(shù)。例如,含有親電基團(tuán)(如,溴或W-羥基琥珀酰亞胺酯)的聚乙二醇分子可與含有疊氮基的親核分子(如,疊氮鈉或3-疊氮基丙胺)反應(yīng)產(chǎn)生疊氮基聚乙二醇。當(dāng)經(jīng)三唑鍵與含炔基蛋白質(zhì)生物綴合時(shí),疊氮基-PEG可用于本發(fā)明。用聚乙二醇衍生蛋白質(zhì)治療劑(PEG化)??筛纳频鞍踪|(zhì)的藥代動(dòng)力學(xué)和藥效學(xué)特性,從而提高效力并盡可能降低給藥頻率。例如,Ddters等,"位點(diǎn)特異性PEG化含非天然氨基酸的蛋白質(zhì)"(Site-specificPEGylationofproteinscontainingunnaturalaminoacids),Bioorganic&MedicinalChemistryLetters,14:5743-5745,(2004)討論和說(shuō)明了PEG化蛋白質(zhì)治療劑的各種優(yōu)點(diǎn)。此外,考慮了與產(chǎn)生含有非天然炔基氨基酸的多肽有關(guān)的其它優(yōu)點(diǎn),所述氨基酸也具有酯鍵。例如,利用具有酯鍵的炔基氨基酸產(chǎn)生的PEG化多肽能通過(guò)酯鍵的體內(nèi)或體外皂化緩慢釋放多肽。利用聚合支持物(疊氮基樹(shù)脂)取代疊氮基-PEG分子也能進(jìn)行蛋白質(zhì)親和純化。三唑共價(jià)鍵可允許有強(qiáng)烈洗滌步驟,利用酯炔基氨基酸可通過(guò)堿處理釋放蛋白質(zhì)。這種親和純化方案明顯不再需要感興趣蛋白質(zhì)上存在用于純化的人工標(biāo)簽(例如,六組氨酸)或表位。取決于所用的非天然氨基酸,切割步驟后親和樹(shù)脂可釋放基本上野生型(天然)的多肽。可合成含有酯鍵的非天然炔基氨基酸并將其摻入蛋白質(zhì),例如3-[(丙-2-炔基氧)羰基]-2-氨基丙酸和4-[(丙-2-炔基氧)羰基]-2-氨基丁酸(見(jiàn)圖8B)。經(jīng)[3+2]環(huán)加成生物綴合后,可在體內(nèi)或體外皂化切割酯鍵;應(yīng)用之一可以是,例如緩慢釋放PEG化蛋白質(zhì)的肽部分。在一些方面,本發(fā)明多肽包括含炔基的多肽,此外也包括那些多肽的綴合形式。例如,在一些方面,本發(fā)明包括含有三唑鍵與共價(jià)偶聯(lián)的熒光疊氮基染料(如,見(jiàn)圖6A、6B和7A)的多肽。在此方面,所述多肽先前含有炔基,所述染料先前含有疊氮基,二者經(jīng)[3+2]環(huán)加成綴合而形成三唑鍵。在另一實(shí)施方案中,本發(fā)明含炔基的蛋白質(zhì)含有疊氮基聚乙二醇(見(jiàn)化學(xué)結(jié)構(gòu)6)。正交tRNA/氨酰-tRNA合成酶技術(shù)理解正交tRNA和正交氨酰-tRNA合成酶配對(duì)相關(guān)的活性有助于理解本發(fā)明的新組合物和方法。正交tRNA和氨酰-tRNA合成酶技術(shù)的討論可見(jiàn),例如國(guó)際公布WO2002/085923,WO2002/086075,WO204/09459,WO2005/019415,WO2005/007870和WO2005/007624。為向遺傳密碼中加入額外的反應(yīng)性非天然氨基酸,例如炔基氨基酸,需要能在宿主翻譯系統(tǒng)機(jī)器中有效地發(fā)揮功能但與所述翻譯系統(tǒng)是"正交"的、含有氨酰-tRNA合成酶與合適的tRNA的新正交配對(duì),與所述翻譯系統(tǒng)"正交"意味著它發(fā)揮作用不依賴于該翻譯系統(tǒng)的內(nèi)源性合成酶和tRNA。正交配對(duì)的所需特征包括能解碼或識(shí)別不由任何內(nèi)源性tRNA解碼的僅一種特定密碼子(例如選擇者密碼子)的tRNA,和只能利用一種特定非天然氨基酸優(yōu)先氨?;潢P(guān)聯(lián)tRNA(或"使之負(fù)載")的氨酰-tRNA合成酶。內(nèi)源性合成酶通常不氨酰化O-tRNA。例如,在大腸桿菌中,正交配對(duì)包括不與任何內(nèi)源性tRNA(例如,大腸桿菌中有40種)交叉反應(yīng)的氨酰-tRNA合成酶和不被任何內(nèi)源性合成酶(例如,大腸桿菌中有21種)氨酰化的正交tRNA。本文所述發(fā)明提供在真細(xì)菌,例如大腸桿菌中遺傳編碼和將炔基氨基酸摻入蛋白質(zhì)的正交配對(duì),其中所述正交組分不與宿主細(xì)胞的翻譯系統(tǒng)的內(nèi)源性大腸桿菌組分交叉反應(yīng),但能識(shí)別所需的非天然氨基酸并響應(yīng)于琥珀無(wú)義密碼子TAG將其摻入蛋白質(zhì)。本發(fā)明提供的正交組分包括衍生自詹氏甲烷球菌酪氨酰-tRNA合成酶的正交氨酰-tRNA合成酶和突變型酪氨酰tRNAoM琥珀抑制物。在此系統(tǒng)中,突變型氨酰-tRNA合成酶用pPRO-Phe而不是常見(jiàn)的20種氨基酸來(lái)氨?;种菩蛅RNA。本發(fā)明提供鑒定和產(chǎn)生可用于將炔基氨基酸摻入蛋白質(zhì)的其它正交tRNA-氨酰tRNA合成酶配對(duì)(例如O-tRNA/0-RS對(duì))的組合物和方法。本發(fā)明的O-tRNA能介導(dǎo)將炔基氨基酸摻入含有例如在體內(nèi)能被O-tRNA識(shí)別的選擇者密碼子的多核苷酸所編碼的蛋白質(zhì)中。O-tRNA的反密碼子環(huán)識(shí)別mRNA上的選擇者密碼子并在多肽的此位點(diǎn)摻入其氨基酸,例如炔基氨基酸。本發(fā)明的正交氨酰tRNA合成酶只用一種特定的炔基氮基酸優(yōu)先氨?;銸-tRNA(或使之負(fù)載)。例如,如本文所述,可響應(yīng)于選擇者密碼子,例如TAG密碼子將炔基氨基酸對(duì)炔丙基氧苯丙氨酸(pPRO-Phe;見(jiàn)圖1A,結(jié)構(gòu)l)選擇性且有效地?fù)饺胝婕?xì)菌(大腸桿菌)的蛋白質(zhì),所述氨基酸可被靶向以進(jìn)行高度選擇性的修飾。摻入蛋白質(zhì)后,在細(xì)胞內(nèi)可化學(xué)靶向pPRO-Phe,例如可用含有疊氮基的染料靶向修飾。染料分子上的疊氮基能與炔基氨基酸反應(yīng),并能以高度選擇性方式靶向該蛋白進(jìn)行染料標(biāo)記。能將炔基氨基酸位點(diǎn)特異地?fù)饺氲鞍踪|(zhì)有助于研究蛋白質(zhì)以及能工程改造蛋白質(zhì)使之具有新特性。例如,表達(dá)含炔基的蛋白質(zhì)有助于通過(guò)特異性標(biāo)記研究蛋白質(zhì),改變酶的催化功能,使蛋白與其它蛋白、小分子和生物分子交聯(lián)等。正交tRNA/正交氨酰-tRNA合成酶及其配對(duì)適用于制備包含一個(gè)或多個(gè)非天然氨基酸的蛋白質(zhì)的翻譯系統(tǒng)描述于,例如名為"產(chǎn)生正交tRNA-氨?;?tRNA合成酶配對(duì)物的方法與組合物"(Methodsandcompositionforthe-productionoforthogonaltRNA-aminoacyl-tRNAsynthetasepairs)的國(guó)際公布號(hào)WO2002/086075和名為"非天然氨基酸的體內(nèi)摻入"(Invivoincorporationofunnaturalaminoacids)的WO2002/085923;名為"擴(kuò)展真核生物遺傳密碼"(EXPANDINGTHEEUKARYOTICGENETICCODE)的國(guó)際公布號(hào)WO2004/094593;2004年7月7日提交的WO2005/019415;2004年7月7日提交的WO2005/007870與2004年7月7日提交的WO2005/007624。這些申請(qǐng)的每篇均全文納入本文作為參考。這種翻譯系統(tǒng)通常包括含有正交tRNA(O-tRNA)、正交氨酰tRNA-合成酶(O-RS)和非天然氨基酸(在本發(fā)明中是炔基氨基酸)的細(xì)胞(可以是非真核細(xì)胞,例如大腸桿菌;或真核細(xì)胞,例如酵母菌),其中O-RS用炔基氨基酸氨?;疧-tRNA。本發(fā)明的正交配對(duì)包括O-tRNA(例如抑制型tRNA、移碼tRNA等)和O-RS。本發(fā)明還提供單獨(dú)的各組分??傮w上,當(dāng)正交配對(duì)識(shí)別選擇者密碼子并響應(yīng)該選擇者密碼子加載氨基酸時(shí),稱該正交配對(duì)"抑制"了該選擇者密碼子。即,不為翻譯系統(tǒng)(例如細(xì)胞的)的內(nèi)源性機(jī)制所識(shí)別的選擇者密碼子未被正常翻譯,從而阻斷多肽合成,否則多肽就可以從核酸上翻譯出來(lái)。與含有或由本文序列表所示多核苷酸序列編碼的O-tRNA的抑制效率相比,本發(fā)明O-tRNA能識(shí)別選擇者密碼子,在有關(guān)聯(lián)合成酶存在時(shí),其響應(yīng)選擇者密碼子而具有至少約,例如45%、50%、60%、75%、80%或90%或更高的抑制效率。O-RS用感興趣的非天然氨基酸例如炔基氨基酸氨?;疧-tRNA。細(xì)胞利用O-tRNA/O-RS配對(duì)(例如)通過(guò)含有編碼感興趣多肽的多核苷酸的核酸將非天然氨基酸摻入延伸中的多肽鏈,其中所述多核苷酸含有所述O-tRNA能識(shí)別的選擇者密碼子。在某些所需方面,細(xì)胞可包含額外的0-tRNA/0-RS配對(duì),其中所述額外的O-RS將不同的非天然氨基酸加載于所述額外的O-tRNA上。例如,其中的一個(gè)O-tRNA能識(shí)別四堿基密碼子,另一個(gè)能識(shí)別終止密碼子?;蛘?,多個(gè)不同的終止密碼子或多個(gè)不同的四堿基密碼子能特異性識(shí)別不同的選擇者密碼子。在本發(fā)明的某些實(shí)施方案中,細(xì)胞,例如大腸桿菌細(xì)胞包含正交tRNA(O-tRNA)、正交氨酰-tRNA合成酶(O-RS)、炔基氨基酸和含有編碼感興趣多肽的多核苷酸的核酸,其中所述多核苷酸含有O-tRNA可識(shí)別的選擇者密碼子。翻譯系統(tǒng)也可以是無(wú)細(xì)胞的系統(tǒng),例如聯(lián)用本文所述O-tRNA/O-RS配對(duì)和非天然氨基酸以及各種商業(yè)可購(gòu)得的"體外"轉(zhuǎn)錄/翻譯系統(tǒng)。在一個(gè)實(shí)施方案中,O-RS和O-tRNA聯(lián)用的抑制效率比缺乏O-RS的O-tRNA的抑制效率高約例如5倍、10倍、15倍、20倍或25倍或更高。一方面,O-RS和O-tRNA聯(lián)用的抑制效率至少是本文序列表所列正交合成酶配對(duì)的抑制效率的約例如35%、40%、45%、50%、60%、75%、80%或90%或更高。應(yīng)注意,本發(fā)明任選在細(xì)胞或其它翻譯系統(tǒng)中包含多對(duì)O-tRNA/O-RS配對(duì),從而可摻入多種非天然氨基酸,例如炔基氨基酸和另一非天然氨基酸。例如,細(xì)胞還可額外包含一對(duì)不同的O-tRNA/0-RS配對(duì)和第二種非天然氨基酸,其中該額外的O-tRNA識(shí)別第二選擇者密碼子,該額外的O-RS用第二非天然氨基酸優(yōu)先氨酰化O-tRNA。例如,包含O-tRNA/0-RS配對(duì)(其中,O-tRNA識(shí)別例如琥珀選擇密碼子)的細(xì)胞還可含有第二正交配對(duì),例如亮氨酰、賴氨酰、谷氨酰(RNA/RS配對(duì))等,其中所述第二O-tRNA識(shí)別不同的選擇密碼子,如乳白密碼子、四堿基密碼子等。不同的正交配對(duì)宜衍生自不同來(lái)源,這有助于識(shí)別不同的選擇者密碼子。O-tRNA和/或O-RS可以是天然產(chǎn)生的或可以,例如通過(guò)產(chǎn)生各種生物的tRNA文庫(kù)和/或RS文庫(kù)和/或通過(guò)采用各種可用的突變方法來(lái)突變天然產(chǎn)生的tRNA和/或RS來(lái)獲得。例如,產(chǎn)生正交tRNA/氨酰-tRNA合成酶配對(duì)的方案之一包括將例如除宿主細(xì)胞以外來(lái)源或多種來(lái)源的異源(對(duì)宿主細(xì)胞而言)tRNA/合成酶配對(duì)遞送入宿主細(xì)胞。候選異源合成酶的特性包括例如不加載任何宿主細(xì)胞tRNA,候選異源tRNA的特性包括例如不被任何宿主細(xì)胞合成酶氨酰化。此外,異源tRNA對(duì)所有宿主細(xì)胞合成酶是正交的。產(chǎn)生正交配對(duì)的第二方案包括產(chǎn)生突變體文庫(kù),從中篩選和/或選擇O-tRNA或O-RS。也可聯(lián)用這些方案。正交簡(jiǎn)A(O-tRNA)本發(fā)明正交tRNA(O-tRNA)宜,例如在體外或體內(nèi),介導(dǎo)將非天然氨基酸例如炔基氨基酸摻入由含有O-tRNA能識(shí)別的選擇密碼子的多核苷酸所編碼的蛋白質(zhì)。在某些實(shí)施方案中,與含有或由本文序列表的O-tRNA序列中所示多核苷酸序列編碼的O-tRNA相比,在關(guān)聯(lián)合成酶存在下,本發(fā)明O-tRNA響應(yīng)選擇者密碼子具有至少約例如45%、50%、60%、75%、80%或90%或更高的抑可通過(guò)本領(lǐng)域己知的任何試驗(yàn)測(cè)定抑制效率。例如,可采用々-半乳糖苷酶報(bào)道試驗(yàn),如可將衍生的lacZ質(zhì)粒(該構(gòu)建物在lacZ核酸序列中含有選擇者密碼子)連同含有本發(fā)明O-tRNA的質(zhì)粒引入合適生物(例如可用正交組分的生物)的細(xì)胞。還可引入關(guān)聯(lián)合成酶(以多肽或表達(dá)時(shí)能編碼該關(guān)聯(lián)合成酶的多核苷酸的形式)。使細(xì)胞在培養(yǎng)基中生長(zhǎng)至所需密度,例如至OD6o。約為0.5,(例如)用BetaFluorTMP-半乳糖苷酶試驗(yàn)試劑盒(Novagen)進(jìn)行p-半乳糖苷酶試驗(yàn)??蓪⒁种瓢俜直扔?jì)算為樣品活性相對(duì)于可比較對(duì)照(例如,衍生的lacZ構(gòu)建物的觀測(cè)值)的百分比,該衍生的lacZ構(gòu)建物在所需位置具有相應(yīng)的有義密碼子而非選擇密碼子。本發(fā)明O-tRNA的例子見(jiàn)本文的序列表。示范性O(shè)-tRNA和O-RS分子的序列也可參見(jiàn)本文的表、實(shí)施例和附圖。也可參見(jiàn)本文中名為"核酸和多肽序列及變體"的章節(jié)。在RNA分子(例如O-RSmRNA或O-tRNA分子)中,與給定的序列(或?qū)幋aDNA而言反之亦然)或其互補(bǔ)序列相比,胸腺嘧啶(T)被尿嘧啶(U)取代。還可存在對(duì)堿基的其它修飾。本發(fā)明也包括對(duì)應(yīng)于本文具體O-tRNA的O-tRNA保守性變體。例如,O-tRNA保守性變體包括功能與具體(例如本文序列表中的)O-tRNA相似,由于合適的自身互補(bǔ)性而保留了tRNA的L-形結(jié)構(gòu)但不具有與例如本文序列表、附圖或?qū)嵤├灸切?序列)相同的序列(并且,最好也不是野生型tRNA分子)的那些分子。也可參見(jiàn)本文中名為"核酸和多肽序列及變體"的章節(jié)。含有O-tRNA的組合物還可包含正交氨酰-tRNA合成酶(O-RS),其中所述0-RS用非天然氨基酸例如塊基氨基酸優(yōu)先氨?;?-tRNA。在某些實(shí)施方案中,含有O-tRNA的組合物還可包含(例如體外或體內(nèi))翻譯系統(tǒng)。細(xì)胞中也可存在含有編碼感興趣多肽的多核苷酸的核酸或這些的一個(gè)或多個(gè)的組合,所述多核苷酸含有O-tRNA能識(shí)別的選擇者密碼子。也可參見(jiàn)本文中名為"正交氨酰-tRNA合成酶"的章節(jié)。產(chǎn)生正交tRNA(O-tRNA)的方法也是本發(fā)明的特征。用該方法產(chǎn)生的O-tRNA也是本發(fā)明的特征。在本發(fā)明的某些實(shí)施方案中,可通過(guò)構(gòu)建突變體文庫(kù)來(lái)產(chǎn)生O-tRNA。突變體tRNA文庫(kù)可用本領(lǐng)域已知的各種誘變技術(shù)構(gòu)建。例如,突變體tRNA可通過(guò)位點(diǎn)特異性突變、隨機(jī)位點(diǎn)突變、同源重組、DNA改組或其它遞歸誘變(recursivemutagenesis)方法、嵌合體構(gòu)建、或者聯(lián)用這些技術(shù)來(lái)產(chǎn)生。也可將其他的突變引入特定位置,例如tRNA的所需環(huán)或區(qū)域中的非保守位置、保守位置、隨機(jī)位置或者二者的組合位置,如反密碼子環(huán)、接納莖、D臂或環(huán)、可變環(huán)、TPC臂或環(huán)、tRNA分子的其他區(qū)域或其組合。tRNA分子中的突變通常包括使突變型tRNA文庫(kù)內(nèi)各成員的反密碼子環(huán)突變以使其能識(shí)別選擇者密碼子。該方法還可包括將一個(gè)額外的序列(CCA)加到O-tRNA的末端。與起始材料(例如多種tRNA序列灘比,0-tRNA通常提高了對(duì)所需生物的正交性,同時(shí)保留其對(duì)所需RS的親和力。本發(fā)明方法任選包括分析tRNA和/或氨酰-tRNA合成酶序列的相似性(和/或所推斷的同源性)以確定顯示與特定生物正交的潛在候選O-tRNA、O-RS和/或其配對(duì)??衫帽绢I(lǐng)域己知和本文所述的計(jì)算機(jī)程序進(jìn)行這種分析,例如可用BLAST和pileup程序。在一個(gè)實(shí)施例中,為了篩選用于大腸桿菌的可能的正交翻譯組分,可選擇不顯示與真細(xì)菌生物有接近的序列同源性的合成酶和/或tRNA。通常可通過(guò),例如負(fù)選擇第一物種的細(xì)胞群來(lái)獲得O-tRNA,所述細(xì)胞含有多種潛在O-tRNA的成員。負(fù)選擇可去除含有可被細(xì)胞內(nèi)源性氨酰-tRNA合成酶(RS)氨?;臐撛贠-tRNA文庫(kù)成員的細(xì)胞。這樣就可以得到與第一物種細(xì)胞正交的tRNA庫(kù)。某些實(shí)施方案在負(fù)選擇中將選擇者密碼子引入編碼負(fù)選擇標(biāo)記(例如能賦予抗生素抗性的酶如(3內(nèi)酰胺酶;能得到可檢測(cè)產(chǎn)物的酶如(3半乳糖苷酶、氯霉素乙酰轉(zhuǎn)移酶(CAT),所述產(chǎn)物例如是毒性產(chǎn)物,如芽孢桿菌RNA酶)的多核苷酸的非必須位置(例如,仍能產(chǎn)生功能性芽孢桿菌RNA酶)等。還任選在有選擇性試劑(比如抗生素,如氨芐青霉素)存在的培養(yǎng)基中培養(yǎng)細(xì)胞群來(lái)進(jìn)行篩選/選擇。在一個(gè)實(shí)施方案中,選擇性試劑的濃度不同。例如,為測(cè)定抑制型tRNA的活性,可利用以選擇者密碼子的體內(nèi)抑制為基礎(chǔ)的選擇系統(tǒng),例如將無(wú)義或移碼突變引入編碼負(fù)性選擇標(biāo)記的多核苷酸(如編碼P半乳糖苷酶的基因(Wfl))中。例如,構(gòu)建在某位置(如,A184)含有選擇者密碼子的多核苷酸變體,如Z)/fl變體。用這些多核苷酸轉(zhuǎn)化細(xì)胞,如細(xì)菌。以不能被內(nèi)源性大腸桿菌合成酶有效加載的正交tRNA為例,抗生素抗性,例如氨芐青霉素抗性應(yīng)約為或小于未用質(zhì)粒轉(zhuǎn)化的細(xì)菌。如果tRNA不是正交的,或者能加載tRNA的異源合成酶在此系統(tǒng)內(nèi)共表達(dá),應(yīng)可觀察到更高水平的抗生素(如氨芐青霉素)抗性。選出那些不能在抗生素濃度約等于未用質(zhì)粒轉(zhuǎn)化的細(xì)胞的LB瓊脂平板上生長(zhǎng)的細(xì)胞,如細(xì)菌。以毒性產(chǎn)物(如RNA酶或芽孢桿菌RNA酶)為例,當(dāng)多種候選tRNA的成員被內(nèi)源性宿主(如大腸桿菌)合成酶氨?;瘯r(shí)(即不與宿主如大腸桿菌合成酶正交),選擇者密碼子被抑制,所產(chǎn)生的毒性多核苷酸產(chǎn)物可導(dǎo)致細(xì)胞死亡。而含有正交tRNA或非功能性tRNA的細(xì)胞可存活。然后,在一個(gè)實(shí)施方案中,對(duì)與所需生物正交的tRNA庫(kù)進(jìn)行正選擇,其中將選擇者密碼子置于正選擇標(biāo)記中(例如抗藥性基因(如P內(nèi)酰胺酶基因)編碼的標(biāo)記)。在含有編碼或包含與細(xì)胞正交的tRNA庫(kù)某成員的多核苷酸、編碼正選擇標(biāo)記的多核苷酸和編碼關(guān)聯(lián)RS的多核苷酸的細(xì)胞內(nèi)進(jìn)行正選擇。在某些實(shí)施方案中,第二群細(xì)胞含有不能通過(guò)負(fù)選擇除去的細(xì)胞。該多核苷酸在胞內(nèi)表達(dá),細(xì)胞在有選擇試劑(如氨芐青霉素)的培養(yǎng)基內(nèi)生長(zhǎng)。然后選擇能被共表達(dá)的關(guān)聯(lián)合成酶氨?;约绊憫?yīng)此選擇者密碼子而摻入氨基酸的tRNA。與含有非功能性tRNA或不能被感興趣合成酶有效識(shí)別的tRNA的細(xì)胞相比,這些細(xì)胞通常顯示抑制效率升高。含有非功能性的tRNA或不能被感興趣合成酶有效識(shí)別的tRNA的細(xì)胞對(duì)該抗生素敏感。因此在兩次選擇中能保留下的tRNA是(i)不是內(nèi)源性宿主(如大腸桿菌)合成酶的底物;(ii)能被感興趣合成酶氨?;灰约?iii)能在翻譯過(guò)程中發(fā)揮作用。因此,取決于所篩選的環(huán)境,同一標(biāo)記可以是正或負(fù)標(biāo)記。即,如果為了篩選該標(biāo)記,則它是正標(biāo)記,但如果為了抵御該標(biāo)記而篩選則它是負(fù)標(biāo)記。上述方法中,篩選,如正選擇、負(fù)選擇或者正負(fù)選擇的嚴(yán)格性任選包括改變選擇的嚴(yán)格性。例如,由于芽孢桿菌RNA酶是毒性極高的蛋白質(zhì),可通過(guò)將不同數(shù)目的選擇者密碼子引入到芽孢桿菌RNA酶基因內(nèi)和/或通過(guò)使用可誘導(dǎo)啟動(dòng)子來(lái)控制負(fù)選擇的嚴(yán)格性。在另一個(gè)實(shí)施例中,選擇或篩選試劑的濃度(如氨芐青霉素的濃度)可以不同。在本發(fā)明的一個(gè)方面,因?yàn)樵谇皫纵喼兴杌钚暂^低,嚴(yán)格性可不同。因此,前幾輪適用較低的嚴(yán)格性標(biāo)準(zhǔn),而后幾輪選擇適用更嚴(yán)謹(jǐn)?shù)臉?biāo)準(zhǔn)。在某些實(shí)施方案中,負(fù)選擇、正選擇或者正負(fù)選擇可重復(fù)多次。也可以使用多個(gè)不同的負(fù)選擇標(biāo)記、正選擇標(biāo)記或正負(fù)選擇標(biāo)記。在某些實(shí)施方案中,正選擇標(biāo)記和負(fù)選擇標(biāo)記可以相同。其他類型的選擇/篩選方法也可用于本發(fā)明以制備正交的翻譯組分,如O-tRNA、O-RS和能響應(yīng)選擇者密碼子而加載非天然氨基酸如炔基氨基酸的O-tRNA/0-RS對(duì)。例如,負(fù)選擇標(biāo)記、正選擇標(biāo)記或正負(fù)選擇標(biāo)記可包括發(fā)熒光或在合適反應(yīng)物存在下能催化發(fā)光反應(yīng)的標(biāo)記。在另一個(gè)實(shí)施方案中,標(biāo)記的產(chǎn)物可通過(guò)熒光激活細(xì)胞分選(FACS)或發(fā)光檢測(cè)。標(biāo)記任選可包括親和選擇標(biāo)記。也參見(jiàn)Francisco,J.A.等,(1993),"在外表面表達(dá)功能性抗體片段的大腸桿菌的制備與熒光激活細(xì)胞分選"(/Vo^"/ow,oresce"ce-fif"/vatedce〃soW"go/£^c/en'c/2/aco//ex/re加'wgayi<"c//o"a/a"/7力o辦yh3ge,wZowAeexterna/5"^/^ce),ProcNatlAcadSciUSA.,90:10444-8。制備重組正交tRNA的其它方法見(jiàn)名為"制備正交tRNA-氨酰-tRNA合成酶配對(duì)的方法和組合物"(METHODSANDCOMPOSITIONSFORTHEPRODUCTIONOFORTHOGONAL,AAMINOACYL-tRNASYNTHETASEPAIRS)的國(guó)際專利公布WO2002/086075;名為題為"擴(kuò)展真核生物遺傳密碼"(EXPANDINGTHEEUKARYOTICGENETICCODE)的WO2004/094593;與2004年7月7日提交的WO2005/019415。也參見(jiàn)Forster等,(2003),"通過(guò)翻譯從頭設(shè)計(jì)的遺傳密碼來(lái)編程肽模擬合成酶"(/Vograwm/wg/epfWo/m'mWc"wZ/z由se56yZnms/WwggewWccodes<ie>s7'g"e(i"ovo),PNAS,100(11):6353-6357;和Feng等,(2003),"通過(guò)單氨基酸改變擴(kuò)大tRNA合成酶的tRNA識(shí)另ll"C&cpa"WwgfiA^4recogm'"o"o/aWjV^^s7"Aetoe6yas/"g/e畫(huà)f"ocrc/t/PNAS,100(10):5676-5681。正交氨酰-tRNA合成酶(O-RS)本發(fā)明O-RS在體外或體內(nèi)用非天然氨基酸例如炔基氨基酸(如對(duì)炔丙基氧苯丙氨酸)優(yōu)先氨?;疧-tRNA??赏ㄟ^(guò)含有O-RS的多肽和/或編碼O-RS或其一部分的多核苷酸將本發(fā)明的O-RS提供給翻譯系統(tǒng),例如細(xì)胞。例如,一例O-RS含有本文序列表和實(shí)施例所示的氨基酸序列或其保守性變體。在另一實(shí)施例中,編碼含有本文序列表或?qū)嵤├行蛄械陌被?序列)的多核苷酸序列或其互補(bǔ)多核苷酸序列編碼O-RS或其一部分。也可參見(jiàn)本文中名為"核酸和多肽序列及變體"的章節(jié)。鑒定可與O-tRNA聯(lián)用的正交氨酰-tRNA合成酶(O-RS)的方法也是本發(fā)明的特征。例如,該方法包括選擇(如正選擇)第一物種的細(xì)胞群,其中所述細(xì)胞各自含有1)多種氨酰-tRNA合成酶(RS)的成員之一(例如,所述多種RS可包括突變型RS、衍生自第一物種之外物種的RS,或二者);2)正交tRNA(O-tRNA)(例如,一個(gè)或多個(gè)物種的);以及3)編碼選擇(例如正選擇)標(biāo)記并含有至少一個(gè)選擇者密碼子的多核苷酸。與缺乏所述多種RS的成員或成員數(shù)目少的細(xì)胞相比,那些顯示抑制效率升高的細(xì)胞被選擇或篩選出來(lái)??捎帽绢I(lǐng)域己知和本文所述方法測(cè)定抑制效率。抑制效率升高的細(xì)胞包含能氨?;疧-tRNA的活性RS。將第一物種的第一組tRNA被活性RS氨?;乃?體外或體內(nèi))與第二物種的第二組tRNA被活性RS氨?;乃阶鞅容^。通過(guò)可檢測(cè)底物(例如,標(biāo)記的氨基酸或非天然氨基酸,如,標(biāo)記的對(duì)炔丙基氧苯丙氨酸)測(cè)定氨?;健Mǔ_x擇與第一組tRNA相比更有效地氨?;诙MtRNA的活性RS,從而獲得能與O-tRNA聯(lián)用的有效(優(yōu)化)的正交氨酰-tRNA合成酶。采用這種方法鑒定的O-RS也是本發(fā)明的特征??捎迷S多試驗(yàn)來(lái)測(cè)定氨?;_@些試驗(yàn)可在體外或體內(nèi)進(jìn)行。例如,體外氨?;囼?yàn)可見(jiàn)例如Hoben和Soil,(1985),MethodsEnzymol.,113:55-59。也可聯(lián)用報(bào)道物質(zhì)和正交翻譯組分并檢測(cè)細(xì)胞中的報(bào)道物質(zhì)來(lái)測(cè)定氨?;?,所述細(xì)胞表達(dá)含有至少一個(gè)選擇者密碼子并編碼蛋白質(zhì)的多核苷酸。也參見(jiàn)名為"非天然氨基酸的體內(nèi)摻入"(INVIVOINCORPORATIONOFUNNATURALAMINOACIDS)的WO2002/085923和名為"擴(kuò)展真核生物遺傳密碼"(EXPANDINGTHEEUKARYOTICGENETICCODE)的WO2004/094593。還可進(jìn)一步改變所鑒定的O-RS底物特異性,這可使O-tRNA只帶上所需的非天然氨基酸,例如炔基氨基酸,而不是常見(jiàn)20種氨基酸中的任一種。產(chǎn)生對(duì)非天然氨基酸具有底物特異性的正交氨?;鵷RNA-合成酶的方法包括,例如通過(guò)組合合成酶不同的結(jié)構(gòu)域而在合成酶的活性位點(diǎn)、在合成酶的編輯機(jī)理位點(diǎn)、在不同的位點(diǎn)使之突變等,并應(yīng)用選擇方法。也可以采用先正選擇再負(fù)選擇的方案。在正選擇中,抑制引入陽(yáng)性標(biāo)記非重要位置的選擇者密碼子使得細(xì)胞在正選擇壓力下存活。在同時(shí)有天然和非天然氨基酸存在時(shí),如此存活的細(xì)胞編碼使正交抑制型tRNA帶有天然或非天然氨基酸的活性合成酶。在負(fù)選擇中,抑制引入陰性標(biāo)記的非重要位置的選擇者密碼子使合成酶失去天然氨基酸特異性。正和負(fù)選擇的存活細(xì)胞編碼只用非天然氨基酸氨?;?加載)正交抑制型tRNA的合成酶。然后通過(guò)例如DNA改組或其它遞歸誘變方法進(jìn)一步誘變這些合成酶。可采用本領(lǐng)域已知的各種誘變技術(shù)產(chǎn)生突變型O-RS文庫(kù)。例如,可用位點(diǎn)特異性突變、隨機(jī)點(diǎn)突變、同源重組、DNA改組或其它遞歸誘變方法,嵌合構(gòu)建或它們的組合來(lái)產(chǎn)生突變型RS。例如,可從兩種或更多種其它如較小、多樣性較低的"亞文庫(kù)"來(lái)產(chǎn)生突變型RS文庫(kù)。本發(fā)明也包括RS的嵌合文庫(kù)。應(yīng)注意,可以構(gòu)建多種生物(例如微生物,如真細(xì)菌和古細(xì)菌)的tRNA合成酶文庫(kù),例如具有天然多樣性的文庫(kù)(參見(jiàn),例如授予Short等的美國(guó)專利號(hào)6,238,884;授予Schallenberger等的美國(guó)專利號(hào)5,756,316;授予Petersen等的美國(guó)專利號(hào)5,783,431;授予Thompson等的美國(guó)專利號(hào)5,824,485;授予Short等的美國(guó)專利號(hào)5,958,672),并任選構(gòu)建和篩選正交配對(duì)。一旦合成酶經(jīng)過(guò)正和負(fù)選擇/篩選方法后,就可進(jìn)一步誘變這些合成酶。例如可分離編碼O-RS的核酸;從該核酸制備編碼突變的O-RS的一組多核苷酸(例如通過(guò)隨機(jī)誘變、位點(diǎn)特異性誘變、重組或它們的任何組合);和可重復(fù)各步驟或各步驟的組合直至獲得用非天然氨基酸例如炔基氨基酸優(yōu)先氨?;疧-tRNA的突變O-RS。在本發(fā)明的一方面,這些步驟可進(jìn)行多次,例如至少兩次。本發(fā)明方法也可采用其它水平的選擇/篩選嚴(yán)格性來(lái)產(chǎn)生O-tRNA、O-RS或其配對(duì)。可改變O-RS產(chǎn)生方法中一個(gè)或兩個(gè)步驟的選擇或篩選嚴(yán)格性。這包括,例如,改變選擇/篩選試劑的用量等。也可額外進(jìn)行幾輪正和/或負(fù)選擇。選擇或篩選也可包括以下一種或多種改變氨基酸滲透性、翻譯效率、翻譯保真度(translationsfidelity)等。一種或多種改變通常是以用正交tRNA-tRNA合成酶配對(duì)來(lái)產(chǎn)生蛋白質(zhì)的生物中一種或多種基因突變?yōu)榛A(chǔ)。產(chǎn)生O-RS并改變合成酶底物特異性的其它通用細(xì)節(jié)見(jiàn)名為"產(chǎn)生正交tRNA-氨?;鵷RNA合成酶配對(duì)物的方法和組合物"(METHODSANDCOMPOSITIONSFORTHEPRODUCTIONOFORTHOGONALtRNAAMINOACYL-tRNASYNTHETASEPAIRS)的WO2002/086075和名為"擴(kuò)展真核生物遺傳密碼"(EXPANDINGTHEEUKARYOTICGENETICCODE)的WO2004/094593。來(lái)源和宿主生物本發(fā)明正交翻譯組分(O-tRNA和O-RS)可衍生自任何生物(或生物的組合)從而可用于任何其它物種的宿主翻譯系統(tǒng),只要所述O-tRNA/O-RS組分與宿主系統(tǒng)以正交方式工作。所述O-tRNA和所述O-RS無(wú)需衍生自同一生物。在一方面,正交組分衍生自用于真細(xì)菌宿主系統(tǒng)的古菌(即,古細(xì)菌)基因。例如,正交O-tRNA可衍生自古菌生物,例如古細(xì)菌,如詹氏甲烷球菌、嗜熱堿甲垸桿菌;鹽細(xì)菌,如沃氏富鹽菌和鹽細(xì)菌種A^C-/;閃爍古生球菌、激烈火球菌、尸fococcms/zo"'A:os/n7、v4ewrapyr扁/er"/x、海沼甲院球菌、M"/zawo/yn^^mti/eW、梅氏甲烷八疊球菌(Mm)、尸,o6acw/謂aero/A//"m、尸F(xiàn)oco"ma6,w'、硫磺礦硫化葉菌OS^)、5W/o/o6ws/o/toda//、嗜酸熱原體、火山熱原體等;或真細(xì)菌,如大腸桿菌、嗜熱棲熱菌、嗜熱脂肪芽孢桿菌等;而正交O-RS可衍生自以下生物(或生物的組合),例如古細(xì)菌,如詹氏甲垸球菌、嗜熱堿甲烷桿菌;鹽細(xì)菌,如沃氏富鹽菌和鹽細(xì)菌種A^C-/;閃爍古生球菌、激烈火球菌、尸yrococcw51/wr汰os/n7、Jewra/yr應(yīng)/e環(huán)'x、海沼甲烷球菌、Me^zawop>rwsA:awd/en'、梅氏甲烷八疊球菌、尸^ro6acw/wmaerop/zZ/wmAi^yracoccwsfl^m/、硫磺礦硫化葉菌、Mtoc/fl/z'、嗜酸熱原體、火山熱原體等;或真細(xì)菌,如大腸桿菌、嗜熱棲熱菌、嗜熱脂肪芽孢桿菌等。在一個(gè)實(shí)施方案中,真核生物來(lái)源,例如植物、藻類、原生動(dòng)物、真菌、酵母菌、動(dòng)物(例如哺乳動(dòng)物、昆蟲(chóng)、節(jié)肢動(dòng)物等)等也可用作O-tRNA和O-RS的來(lái)源。O-tRNA/0-RS配對(duì)的各組分可衍生自同一生物或不同生物。在一個(gè)實(shí)施方案中,O-tRNA/0-RS配對(duì)可來(lái)自同一生物?;蛘撸琌-tRNA/0-RS配對(duì)的O-tRNA和O-RS可來(lái)自不同生物。O-tRNA、O-RS或O-tRNA/O-RS配對(duì)可在體外或體內(nèi)選擇或篩選和/或可用于細(xì)胞,例如真細(xì)菌細(xì)胞中來(lái)產(chǎn)生含有炔基氨基酸的多肽。所述真細(xì)菌細(xì)胞例如但不限于大腸桿菌、嗜熱棲熱菌、嗜熱脂肪芽孢桿菌等。含本發(fā)明翻譯組分的真細(xì)菌細(xì)胞的組合物也是本發(fā)明特征之一。為在一種生物中篩選O-tRNA和/或O-RS用于另一種生物,也可參見(jiàn)2004年4月16日提交的名為"擴(kuò)展真核生物遺傳密碼"(EXPANDINGTHEEUKARYOTICGENETICCODE)的國(guó)際申請(qǐng)公布號(hào)WO2004/094593。選擇者密碼子本發(fā)明的選擇者密碼子擴(kuò)大了蛋白質(zhì)生物合成機(jī)理的遺傳密碼子框架。例如,選擇者密碼子包括,獨(dú)特的三堿基密碼子、無(wú)義密碼子(如終止密碼子(如琥珀密碼子(UAG)或乳白密碼子(UGA)))、非天然密碼子、至少四堿基的密碼子、罕用密碼子等??蓪⒃S多選擇者密碼子引入所需基因,例如一個(gè)以上、兩個(gè)以上、三個(gè)以上等。通過(guò)用不同的選擇者密碼子,可采用多對(duì)正交tRNA/合成酶配對(duì),從而能利用這些不同的選擇者密碼子同時(shí)位點(diǎn)特異性地?fù)饺攵喾N不同的非天然氨基酸,例如含有至少一個(gè)炔基氨基酸。在一個(gè)實(shí)施方案中,這些方法包括,例如在體內(nèi)即細(xì)胞中,用作為終止密碼子的選擇者密碼子摻入炔基氨基酸。例如,制備能識(shí)別終止密碼子的O-tRNA,該O-tRNA被O-RS用炔基氨基酸氨酰化。天然產(chǎn)生的宿主的氨酰-tRNA合成酶不識(shí)別該O-tRNA。可采用常規(guī)的定點(diǎn)誘變將終止密碼子引入編碼感興趣多肽的多核苷酸中感興趣的位點(diǎn)。參見(jiàn),例如Sayers,J.R.等,(1988),"硫代磷酸酯寡核苷酸定向誘變中的5,,3'核酸外切酶"(5',3'Exonucleaseinphosphorothioate-basedoligonucleotide-directedmutagenesis),NucleicAcidsRes,791-802。當(dāng)例如在體內(nèi)聯(lián)用O-RS、O-tRNA和編碼感興趣多肽的核酸時(shí),可響應(yīng)選擇密碼子而摻入炔基氨基酸,從而獲得在特定位點(diǎn)含有炔基氨基酸的多肽。在本發(fā)明的一個(gè)實(shí)施方案中,用作選擇者密碼子的終止密碼子是琥珀密碼子UAG和/或乳白密碼子UGA。在一實(shí)施例中,UAG和UGA都用作選擇者密碼子的遺傳密碼可編碼22個(gè)氨基酸,同時(shí)保留作為最豐富的終止信號(hào)的赭石無(wú)義密碼子,UAA。體內(nèi)摻入炔基氨基酸不會(huì)對(duì)宿主細(xì)胞有顯著影響。例如,在非真核細(xì)胞,如大腸桿菌中,由于UAG密碼子的抑制效率依賴于O-tRNA(如琥珀抑制型tRNA)與釋放因子l(RFl)(其可結(jié)合UAG密碼子,而引起延伸中的肽鏈從核糖體釋放)之間的競(jìng)爭(zhēng),因此可通過(guò)提高O-tRNA(如抑制型tRNA)的表達(dá)水平,或利用RF1缺陷型菌株來(lái)調(diào)節(jié)抑制效率。在真核細(xì)胞中,由于UAG密碼子的抑制效率依賴于O-tRNA(如琥珀抑制型tRNA)和真核釋放因子(如eRF)(其可結(jié)合終止密碼子從而引起延伸中的肽鏈從核糖體釋放)之間的競(jìng)爭(zhēng),因此可通過(guò)提高O-tRNA(如抑制型tRNA)的表達(dá)水平來(lái)調(diào)節(jié)抑制效率。此外,也可存在其它化合物,例如還原劑,如二硫蘇糖醇(DTT)。炔基氨基酸也可以由罕有密碼子編碼。例如,當(dāng)體外蛋白合成反應(yīng)中的精氨酸濃度下降時(shí),證實(shí)罕有的精氨酸密碼子AGG可通過(guò)用丙氨酸?;暮铣蓆RNA有效地將丙氨酸摻入多肽鏈中。見(jiàn)Ma等,Biochemistry,32:7939(1993)。在這種情況中,合成的tRNA可與大腸桿菌中作為次要成分存在的天然產(chǎn)生的tRNAArg競(jìng)爭(zhēng)。此外,某些生物不能利用所有的三聯(lián)密碼子。藤黃微球菌(^r/cTococcw/We^)的未指定密碼子AGA可用于在體外將氨基酸插入轉(zhuǎn)錄/翻譯提取物中。見(jiàn)Kowal禾BOliver,Nucl.Acid.Res.,25:4685(1997)??稍隗w內(nèi)利用這些罕有密碼子產(chǎn)生本發(fā)明的各組分。選擇者密碼子也可包括延伸密碼子,例如四個(gè)或四個(gè)以上堿基的密碼子,如四個(gè)、五個(gè)、六個(gè)或更多堿基的密碼子。四堿基密碼子的例子包括,例如AGGA、CUAG、UAGA、CCCU等。五堿基密碼子的例子包括,例如AGGAC、CCCCU、CCCUC、CUAGA、CUACU、UAGGC等。本發(fā)明方法可包括使用基于移碼抑制的延伸密碼子。四個(gè)或四個(gè)以上堿基的密碼子可將例如一個(gè)或多個(gè)非天然氨基酸例如炔基氨基酸插入同一蛋白質(zhì)。在其它實(shí)施方案中,反密碼子環(huán)可解碼例如至少一種四堿基密碼子、至少一種五堿基密碼子或至少一種六堿基密碼子或更多。由于有256種可能的四堿基密碼子,所以同一細(xì)胞中可用四個(gè)或四個(gè)以上堿基的密碼子編碼多種非天然氨基酸。也可參見(jiàn),Anderson等,(2002),"密碼子和反密碼子大小極限的研究"(ExploringtheLimitsofCodonandAnticodonSize),ChemistryandBiology,9:237-244和Magliery,(2001),"擴(kuò)增遺傳密碼在大腸桿菌中選擇有效的四堿基密碼子抑制劑并用文庫(kù)方法鑒定"變化的"四堿基密碼子"(ExpandingtheGeneticCode:SelectionofEfficientSuppressorsofFour-baseCodonsandIdentificationof"Shifty"Four-baseCodonswithaLibraryApproachinEscherichiacoli),J.Mol.Biol.,307:755-769。例如,已采用體外生物合成方法利用四堿基密碼子將非天然氨基酸摻入蛋白質(zhì)。參見(jiàn),例如Ma等,(1993),Biochemistry,32:7939和Hohsaka等,(1999),J.Am.Chem.Soc.,121:34。利用CGGG禾BAGGU及兩種化學(xué)?;囊拼a抑制型tRNA在體外將2-萘基丙氨酸和賴氨酸的NBD衍生物摻入鏈霉親和素。參見(jiàn),例如Hohsaka等,(1999),J.Am.Chem.Soc.,121:12194。在體內(nèi)研究中,Moore等檢測(cè)了含NCUA反密碼子的tRNA""衍生物抑制UAGN密碼子(N可以是U、A、G或C)的能力,發(fā)現(xiàn)含UCUA反密碼子的tRNALeu解碼四聯(lián)UAGA的效率為13到26%,而在0或-1讀框中幾乎不解碼。參見(jiàn)Moore等,(2000),J.Mol.Biol.,298:195。在一個(gè)實(shí)施方案中,本發(fā)明可利用基于罕用密碼子或無(wú)義密碼子的延伸密碼子,它們能降低在其它非期望位點(diǎn)的錯(cuò)義連讀(missensereadthrough)和移碼抑制。對(duì)于給定系統(tǒng),選擇者密碼子也可包括天然三聯(lián)密碼子中內(nèi)源性系統(tǒng)不用(或很少用)的那個(gè)密碼子。例如,這包括缺乏能識(shí)別天然三堿基密碼子的tRNA的系統(tǒng),和/或所述三堿基密碼子是罕用密碼子的系統(tǒng)。選擇者密碼子可以包含非天然堿基對(duì)。這些非天然堿基對(duì)進(jìn)一步擴(kuò)大了現(xiàn)有的遺傳字符集(geneticalphabet)。一種額外的堿基對(duì)可將三聯(lián)密碼子的數(shù)目從64增加至125。第三堿基對(duì)的性質(zhì)包括穩(wěn)定和選擇性的堿基配對(duì),通過(guò)聚合酶以有效的酶促方式高保真地?fù)饺隓NA,新生非天然堿基對(duì)合成后引物繼續(xù)有效延伸。對(duì)適用于這些方法和組合物的非天然堿基對(duì)的描述于例如Hirao等,(2002),"將氨基酸類似物摻入蛋白質(zhì)的非天然堿基對(duì)"(Anunnaturalbasepairforincorporatingaminoacidanaloguesintoprotein),NatureBiotechnology,20:177-182。也可參見(jiàn)Wu,Y.等,(2002),J.Am.Chem.Soc.,124:14626-14630。下文列出了其它的相關(guān)出版物。對(duì)于體內(nèi)使用,非天然核苷是膜可滲透的,并可磷酸化形成相應(yīng)的磷酸三酯。此外,增加的遺傳信息穩(wěn)定且不為細(xì)胞酶所破壞。Benner與他人以前的工作利用了不同于經(jīng)典Watson-Crick配對(duì)的氫鍵模式,其中最值得注意的例子是異-C:異-G配對(duì)(iso-C:iso-Gpair)。參見(jiàn),例如Switzer等,(1989),J.Am.Chem.Soc.,111:8322;Piccirilli等,(1990),Nature,343:33;Kool,(2000),Curr.Opin.Chem.Biol.,4:602。這些堿基通常上與天然堿基有一定程度的錯(cuò)配,因而不能酶促?gòu)?fù)制。Kool等證實(shí),堿基間的疏水包裝相互作用可替代氫鍵來(lái)驅(qū)動(dòng)堿基對(duì)形成。參見(jiàn)Kool,(2000),Curr.Opin.Chem.Biol.,4:602;Guckian禾BKool,(1998),Angew.Chem.hit.Ed.Engl.,36:2825。在致力于開(kāi)發(fā)符合以上所有要求的非天然堿基對(duì)的過(guò)程中,Schultz、Romesberg等已系統(tǒng)地合成并研究了一系列非天然疏水堿基。發(fā)現(xiàn)PICS:PICS自身配對(duì)比天然堿基對(duì)更穩(wěn)定,可用大腸桿菌DNA聚合酶I的Klenow片段(KF)有效地?fù)饺隓NA。參見(jiàn),例如McMinn等,(1999),J.Am.Chem.Soc.,121:11586;和Ogawa等,(2000),J.Am.Chem.Soc.,122:3274。就生物學(xué)功能而言,KF能以足夠的效率和選擇性合成3MN:3MN自身配對(duì)。參見(jiàn),例如Ogawa等,(2000),J.Am.Chem.Soc.,122:8803。然而,這兩種堿基均起到阻止進(jìn)一步復(fù)制的鏈終止子的作用。近來(lái)開(kāi)發(fā)了可用于復(fù)制PICS自身配對(duì)的突變型DNA聚合酶。此外,7AI自身配對(duì)可復(fù)制。參見(jiàn),例如Tae等,(2001),J.Am.Chem.Soc.,123:7439。己開(kāi)發(fā)了與Cu(II)結(jié)合后可形成穩(wěn)定配對(duì)的金屬堿基(metallobase)對(duì)Dipis:Py。參見(jiàn),Meggers等,(2000),J.Am.Chem.Soc.,122:10714。因?yàn)檠由烀艽a子和非天然密碼子在本質(zhì)上與天然密碼子正交,所以本發(fā)明方法可利用該特性產(chǎn)生它們的正交tRNA。也可采用翻譯繞行系統(tǒng)將炔基氨基酸摻入所需多肽。在一翻譯繞行系統(tǒng)中,將大序列插入基因,但該大序列不翻譯成蛋白質(zhì)。該序列包含用作誘導(dǎo)核糖體跳過(guò)該序列并繼續(xù)翻譯該插入物下游序列的指示結(jié)構(gòu)。非天然氨基酸本文所用的非天然氨基酸指除硒代半胱氨酸和/或吡咯賴氨酸和以下20種遺傳編碼的oc-氨基酸以外的任何氨基酸、修飾的氨基酸或氨基酸類似物丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、組氨酸、異亮氨酸、亮氨酸、賴氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、絲氨酸、蘇氨酸、色氨酸、酪氨酸和纈氨酸。a-氨基酸的通用結(jié)構(gòu)如式I所示<formula>formulaseeoriginaldocumentpage37</formula>非天然氨基酸一般具有任何式I所示結(jié)構(gòu),其中R基團(tuán)是除20種天然氨基酸中所用以外的任何取代基。20種天然氨基酸的結(jié)構(gòu)可參見(jiàn),例如《生物化學(xué)》(Biochemistry),L.Stryer編,第三版,1988,F(xiàn)reemanandCompany,紐約。注意,本發(fā)明的非天然氨基酸可以是除以上20種ct-氨基酸以外的天然產(chǎn)生的化合物。由于本發(fā)明的非天然氨基酸與天然氨基酸通常區(qū)別在側(cè)鏈,所以非天然氨基酸與其它氨基酸(例如天然或非天然的)形成酰胺鍵的方式與天然蛋白質(zhì)中酰胺鍵的形成方式相同。然而,非天然氨基酸的側(cè)鏈不同于天然氨基酸的側(cè)鏈。本文特別感興趣的是含有反應(yīng)性炔基的非天然氨基酸,例如含有能與疊氮基特異且區(qū)域選擇性地反應(yīng)的炔基部分的非天然氨基酸。例如,在炔基氨基酸中,式I中的R包括任何含炔的結(jié)構(gòu)。例如,對(duì)炔丙基氧苯丙氨酸(縮寫(xiě)為pPRO-Phe;參見(jiàn)圖1A)是本發(fā)明可用的所需非天然炔基氨基酸。本發(fā)明不限于聯(lián)用pPRO-Phe與正交翻譯組分。例如,(本發(fā)明)考慮了各種其它炔基氨基酸(參見(jiàn)圖8A和8B),包括但不限于,如2-氨基-4-戊炔酸2-氨基-3-(4-乙炔基苯基)丙酸2-氨基-3-[4-(丙-2-炔基)苯基]丙酸2-氨基-3-(丙-2-炔基氧)丙酸2-氨基-3-(丙-2-炔基硫)丙酸3-[(丙-2-炔基氧)羰基]-2-氨基丙酸4-[(丙-2-炔基氧)羰基]-2-氨基丁酸在其他的非天然氨基酸中,例如式I中的R可任選含有垸基-、芳基-、?;?、肼、氰基-、鹵代-、酰肼、烯基、醚、硼酸基(borate)、硼酸酯基(boronate)、磷、膦酰基、膦、烯酮、亞胺、酯、羥胺、胺等,或上述基團(tuán)的任何組合。感興趣的其它非天然氨基酸包括但不限于含光可活化交聯(lián)劑的氨基酸、自旋-標(biāo)記氨基酸、熒光氨基酸、金屬結(jié)合氨基酸、含金屬的氨基酸、放射性氨基酸、含有新官能團(tuán)的氨基酸、能與其它分子共價(jià)或非共價(jià)結(jié)合的氨基酸、光陷入(photocaged)和/或可光促異構(gòu)(photoisomerizable)的氨基酸、含生物素或生物素類似物的氨基酸、含酮基氨基酸、糖基化氨基酸、側(cè)鏈連有糖部分的氨基酸、含聚乙二醇或聚醚的氨基酸、重原子取代的氨基酸、化學(xué)方法可裂解或光可切割的氨基酸、與天然氨基酸相比側(cè)鏈延長(zhǎng)的氨基酸(如聚醚或長(zhǎng)鏈烴,如超過(guò)約5個(gè)、約10個(gè)碳原子等)、含碳連接糖的氨基酸、含氨基硫代酸的氨基酸以及含一個(gè)或多個(gè)毒性結(jié)構(gòu)部分的氨基酸。本發(fā)明另一方面提供具有下式IV所示通式的炔基氨基酸具有此結(jié)構(gòu)的炔基氨基酸通??梢允侨魏谓Y(jié)構(gòu),其中R,是20種天然氨基酸之一所用的取代基,R2是炔基取代基。因此,此類炔基氨基酸可視作天然氨基酸衍生物。如上所述,本發(fā)明不限于利用非天然氨基酸對(duì)炔丙基氧苯丙氨酸(pPRO-Phe)。實(shí)際上可用于真細(xì)菌中本發(fā)明正交翻譯系統(tǒng)的任何炔基氨基酸屬于本發(fā)明的范圍。已知各種其它炔基氨基酸,例如圖8所示的炔基氨基酸。由于一些所述炔基氨基酸結(jié)構(gòu)極其類似于pPRO-Phe,考慮可利用本文提供的正交tRNA和氨酰-tRNA合成酶組分(例如SEQIDNO:1所示的O-tRNA和SEQIDNO:4、6、8、10、12、14、16、18所示的O-RS或其保守變體)將一些所述氨基酸摻入真細(xì)菌的蛋白質(zhì)。因此,本發(fā)明也提供慘入除pPRO-Phe以外的其它炔基氨基酸的方法。無(wú)論表4所提供的正交組分(見(jiàn)實(shí)施例9)是否能摻入除pPRO-Phe以外的炔基氨基酸,本文內(nèi)容為構(gòu)建能摻入所述其它炔基氨基酸的正交tRNA組分提供了充足的指導(dǎo),此外那些正交組分也屬于本發(fā)明的范圍。除了含有新側(cè)鏈,例如炔基的非天然氨基酸以外,非天然炔基氨基酸也可任選含有修飾的骨架結(jié)構(gòu),例如式II和III所示結(jié)構(gòu)<formula>formulaseeoriginaldocumentpage39</formula>III其中,Z—般包括0H、NH2、SH、NH-R'或S-R';X和Y可以相同或不同,一般包括S或O;R和R'任選相同或不同,一般選自式I所示非天然氨基酸中上述R基團(tuán)的同一取代基清單以及氫。例如,本發(fā)明的非天然氨基酸任選在式II和III所示氨基或羧基中可包含取代。此類非天然氨基酸包括但不限于例如具有對(duì)應(yīng)于20種常見(jiàn)天然氨基酸的側(cè)鏈或非天然炔基側(cè)鏈的oc-羥酸、a-硫代酸、oc-氨基硫代羧酸酯。此外,在a-碳處的取代任選包括L、D或a-ct-雙取代的氨基酸,例如D-谷氨酸、D-丙氨酸、D-甲基-O-酪氨酸、氨基丁酸等。其它結(jié)構(gòu)替代物包括環(huán)狀氨基酸,例如脯氨酸類似物以及3、4、6、7、8和9元環(huán)脯氨酸類似物,(5和y氨基酸,如取代的卩-丙氨酸和y-氨基丁酸。例如,許多非天然氨基酸(包括一些炔基氨基酸)以天然氨基酸,例如酪氨酸、絲氨酸、半胱氨酸、天冬氨酸、谷氨酸等為基礎(chǔ)。例如,炔基氨基酸2-氨基-3-(丙-2-炔基氧)丙酸;2-氨基-3-(丙-2-炔基硫)丙酸;3-[(丙-2-炔基氧)羰基]-2-氨基丙酸;和4-[(丙-2-炔基氧)羰基]-2-氨基丁酸均可衍生自天然氨基酸。酪氨酸類似物包括對(duì)位取代的酪氨酸、鄰位取代的酪氨酸和間位取代的酪氨酸,其中該取代的酪氨酸含有炔基、乙?;⒈郊柞;?、氨基、肼、羥胺、巰基、羧基、異丙基、甲基、CVC2o直鏈或支鏈烴、飽和或不飽和的烴、O-甲基、聚醚基團(tuán)、硝基等。此外,也考慮多取代的芳環(huán)。本發(fā)明的谷氨酰胺類似物包括但不限于a-羥基衍生物、y-取代的衍生物、環(huán)形衍生物和酰胺取代的谷氨酰胺衍生物。苯丙氨酸類似物的例子包括但不限于對(duì)位取代的苯丙氨酸、鄰位取代的苯丙氨酸和間位取代的苯丙氨酸,其中所述取代基含有炔基、羥基、甲氧基、甲基、烯丙基、醛基、硝基、巰基或酮基等。非天然氨基酸的具體例子包括但不限于對(duì)炔丙基氧苯丙氨酸、3,4-二羥基-L-苯丙氨酸(DHP)、3,4,6-三羥基-L-苯丙氨酸、3,4,5-三羥基-L-苯丙氨酸、4-硝基-苯丙氨酸、對(duì)乙?;?L-苯丙氨酸、O-甲基-L-酪氨酸、L-3-(2-萘基)丙氨酸、3-甲基-苯丙氨酸、O-4-烯丙基-L-酪氨酸、4-丙基-L-酪氨酸、3-硝基-酪氨酸、3-巰基-酪氨酸、3-0-乙酰基-GlcNAcp-絲氨酸、L-多巴(D叩a)、氟化苯丙氨酸、異丙基-L-苯丙氨酸、對(duì)疊氮基-L-苯丙氨酸、對(duì)?;?L-苯丙氨酸、對(duì)苯甲?;?L-苯丙氨酸、L-磷酸絲氨酸、膦酰基絲氨酸、膦?;野彼?、對(duì)碘-苯丙氨酸、對(duì)溴苯丙氨酸、對(duì)氨基-L-苯丙氨酸和異丙基-L-苯丙氨酸等。本文提供了各種非天然氨基酸的結(jié)構(gòu),例如見(jiàn)圖1A、8A和8B。也參見(jiàn)名為"擴(kuò)展真核生物遺傳密碼"(EXPANDINGTHEEUKARYOTICGENETICCODE)的公開(kāi)的國(guó)際申請(qǐng)WO2004/094593。非天然氨基酸的化學(xué)合成上述許多非天然氨基酸可商業(yè)購(gòu)自,例如Sigma(USA)或Aldrich(密爾沃基,威斯康星,美國(guó))。無(wú)法商業(yè)購(gòu)得的化合物可根據(jù)各種出版物提供的或用本領(lǐng)域技術(shù)人員己知的方法合成。就有機(jī)合成技術(shù)而言,可參見(jiàn)例如《有機(jī)化學(xué)》(OrganicChemistry),Fessendon禾卩Fessendon,(1982,第二版,WillardGrantPress,BostonMass.);《高等有機(jī)化學(xué)》(AdvancedOrganicChemistry),March,(第三版,1985,WileyandSons,紐約);和《高級(jí)有機(jī)化學(xué)》(AdvancedOrganicChemistry),Carey禾口Sundberg,(第三版,A和B部分,1990,PlenumPress,紐約)。其它描述非天然氨基酸合成的出版物包括,例如名為"非天然氨基酸的體內(nèi)摻入"(InvivoincorporationofUnnaturalAminoAcids)的WO2002/085923;Matsoukas等,(1995),J.Med.Chem.,38:4660-4669;King,F.E.禾口Kidd,D.A.A.,(1949),"從鄰苯二甲?;虚g體合成谷氨酰胺和谷氨酸的Y-二肽的新方法"(ANewSynthesisofGlutamineandofy-DipeptidesofGlutamicAcidfromPhthylatedIntermediates),J.Chem.Soc.,3315-3319;Friedman,O.M.和Chatterrji,R.,(1959),"合成谷氨酰胺衍生物作為抗腫瘤藥物的模型底物"(SynthesisofDerivativesofGlutamineasModelSubstratesforAnti-TumorAgents),J.Am.Chem.Soc.,81:3750-3752;Craig,J.C.等,(1988),"7-氯-4[[4-(二乙氨基)-1-甲基丁基]氨基]喹啉(氯喹)的對(duì)映異構(gòu)體的絕對(duì)構(gòu)型"(AbsoluteConfigurationoftheEnantiomersof7-Chloro-4[[4-(diethylamino)-l-methylbutyl]amino]quinoline(Chloroquine)),J.Org.Chem.,53:1167-1170;Azoulay,M.,Vilmont,M.和Frappier,F(xiàn).,(1991),"作為潛在抗瘧疾藥物的谷氨酰胺類似物"(GlutamineanaloguesasPotentialAntimalarials),Eur.J.Med.Chem.,26:201-5;Koskinen,A旦P.禾口Rapoport,H.,(1989),"合成作為構(gòu)象限制的氨基酸類似物的4-取代脯氨酸"(Synthesisof4-SubstitutedProlinesasConformationallyConstrainedAminoAcidAnalogues),J.Org.Chem.,54:1859-1866;Christie,B.D.和Rapoport,H.,(1985),"從L-天冬酰胺合成光學(xué)純的哌啶酯。應(yīng)用于通過(guò)氨基酸脫羧和亞胺镥離子環(huán)化來(lái)全合成(+)-Apovincamine"(SynthesisofOpticallyPurePipecolatesfromL-Asparagine.ApplicationtotheTotalSynthesisof(+)-ApovincaminethroughAminoAcidDecarbonylationandIminiumIonCyclization),J.Org.Chem.,1989:1M9-1S66;Barton等,(1987),"采用基團(tuán)化學(xué)方法合成a-氨基酸及衍生物合成L-和D-a-氨基-己二酸、L-a-氨基庚二酸與合適的不飽和衍生物"(SynthesisofNovela-Amino-AcidsandDerivativesUsingRadicalChemistry:SynthesisofL-andD-a-Amino-AdipicAcids,L-a-aminopimelicAcidandAppropriateUnsaturatedDerivatives),TetrahedronLett.,43:4297-4308;Subasinghe等,(1992),"使君子氨酸類似物合成(3-雜環(huán)2-氨基丙酸衍生物和它們?cè)谛碌氖咕影彼崦艋稽c(diǎn)的活性"(Quisqualicacidanalogues:synthesisofbeta-heterocyclic2-aminopropanoicacidderivativesandtheiractivityatanovelquisqualate-sensitizedsite),J.Med.Chem.,35:4602-7。也可參見(jiàn)2003年12月22日提交,名為"蛋白質(zhì)陣列"(ProteinArrays)的國(guó)際公布號(hào)WO2004/058946。非天然氨基酸的細(xì)胞攝取細(xì)胞攝取非天然氨基酸通常是設(shè)計(jì)和選擇非天然氨基酸,例如用于摻入蛋白質(zhì)中應(yīng)考慮的問(wèn)題之一。例如,a-氨基酸的高電荷密度提示這些化合物不可能透過(guò)細(xì)胞。天然氨基酸通過(guò)蛋白質(zhì)轉(zhuǎn)運(yùn)系統(tǒng)的收集(在于)攝取入細(xì)胞,這些系統(tǒng)往往顯示不同程度的氨基酸特異性。可進(jìn)行快速篩選來(lái)評(píng)估哪種非天然氨基酸(如果有的話)將被細(xì)胞所攝取。參見(jiàn),例如2003年12月22日提交的名為"蛋白質(zhì)陣列"(ProteinArrays)的國(guó)際申請(qǐng)?zhí)朠CT/US03/41346中的毒性試驗(yàn);Liu,D.R.和Schultz,P.G.,(1999),"含擴(kuò)增遺傳密碼的生物演化的進(jìn)展"(Progresstowardtheevolutionofanorganismwithanexpandedgeneticcode),PNASUnitedStates,96:4780-4785。雖然不難采用各種試驗(yàn)分析攝取情況,設(shè)計(jì)符合細(xì)胞攝取途徑的非天然氨基酸的另一種方法是提供生物合成途徑在體內(nèi)產(chǎn)生氨基酸。非天然氨基酸的生物合成細(xì)胞中已有許多產(chǎn)生氨基酸和其它化合物的生物合成途徑。盡管自然界中,例如細(xì)胞中,可能不存在特定非天然氨基酸的生物合成方法,本發(fā)明提供了這種方法。例如,通過(guò)加入新的酶或修飾現(xiàn)有的宿主細(xì)胞途徑可以在宿主細(xì)胞中任選形成非天然氨基酸的生物合成途徑。其它新的酶任選是天然產(chǎn)生的酶或人工獲得的酶。例如,生物合成對(duì)氨基苯丙氨酸(如WO2002/085923中的實(shí)施例所示,同上)依賴加入其它生物的已知酶的混合物。可通過(guò)用含這些酶的基因的質(zhì)粒轉(zhuǎn)染細(xì)胞而將這些基因引入細(xì)胞。當(dāng)這些基因在細(xì)胞中表達(dá)時(shí),它們提供了合成所需化合物的酶途徑??扇芜x加入的酶的例子見(jiàn)以下實(shí)施例。其它酶序列見(jiàn)例如Genbank。也可以相同方式將人工開(kāi)發(fā)的酶加入細(xì)胞??梢源朔绞讲倏丶?xì)胞機(jī)理和資源用以產(chǎn)生非天然氨基酸。實(shí)際上,可采用各種方法產(chǎn)生新的酶從而在體內(nèi)或體外用于生物合成途徑,改進(jìn)現(xiàn)有途徑,或產(chǎn)生非天然氨基酸。開(kāi)發(fā)酶和其它生物合成途徑組分的許多可用方法適用于本發(fā)明來(lái)產(chǎn)生非天然氨基酸(或者,實(shí)際上,用于開(kāi)發(fā)合成酶使之具有新的底物特異性或其它感興趣的活性)。例如,可以采用DNA改組來(lái)開(kāi)發(fā)新的酶和/或這些酶途徑從而在體外或體內(nèi)產(chǎn)生非天然氨基酸(或產(chǎn)生新的酶)。參見(jiàn),例如Stemmer,(1994),"通過(guò)DNA改組在體外快速進(jìn)化蛋白質(zhì)"(RapidevolutionofaproteininvitrobyDNAshuffling),Nature,370(4):389-391;Stemmer,(1994),"通過(guò)隨機(jī)斷裂和裝配的DNA改組分子進(jìn)化的體夕卜重組"(DNAshufflingbyrandomfragmentationandreassembly:Invitrorecombinationformolecularevolution),Proc.Natl.Acad.Sci.USA.,91:10747-10751。相關(guān)的方法改組關(guān)聯(lián)的(例如同源性)基因家族從而快速開(kāi)具有所需特性的酶。這種"家族基因改組"方法的例子見(jiàn)Crameri等,(1998),"不同種類基因家族的DNA改組加速了定向進(jìn)化"(DNAshufflingofafamilyofgenesfromdiversespeciesacceleratesdirectedevolution),Nature,391(6664):288-291。也可采用稱為"產(chǎn)生雜交酶的遞增截短"(ITCHY)的DNA重組方法來(lái)產(chǎn)生新的酶(無(wú)論是生物合成途徑組分或合成酶),例如Ostermeier等,(1999),"不依賴DNA同源性的雜交酶的組合方法"(AcombinatorialapproachtohybridenzymesindependentofDNAhomology),NatureBiotech,17:1205中所述。該方法也可用于產(chǎn)生酶或可用作一種或多種體外或體內(nèi)重組方法底物的其它途徑變體的文庫(kù)。也可參見(jiàn),Ostermeier等,(1999),"采用遞增截短的組合蛋白質(zhì)工程"(CombinatorialProteinEngineeringbyIncrementalTruncation),Proc.Natl.Acad.Sci.USA,96:3562-67;Oste腿ier等,(1999),"作為工程改造新生物催化劑的方法的遞增截短"(IncrementalTruncationasaStrategyintheEngineeringofNovelBiocatalysts),BiologicalandMedicinalChemistry,7:2139-44。另一禾中方法采用指數(shù)集合誘變(exponentialensemblemutagenesis)來(lái)產(chǎn)生酶或其它途徑變體的文庫(kù),從中選擇催化與產(chǎn)生非天然氨基酸(或新合成酶)有關(guān)的生物合成反應(yīng)的能力。在該方法中,平行地隨機(jī)選取(mndomized)感興趣序列中的小基團(tuán)殘基來(lái)鑒定在各個(gè)不同位置上可導(dǎo)致功能性蛋白質(zhì)的氨基酸。適用于本發(fā)明來(lái)產(chǎn)生新酶進(jìn)而產(chǎn)生非天然氨基酸(或新的合成酶)的此類方法的例子見(jiàn)Delegrave和Youvan,(1993),Biotechnology—Research,11:1548-1552。在另一方法中,可采用用慘雜或簡(jiǎn)并寡核苷酸的隨機(jī)或半隨機(jī)誘變來(lái)工程改造酶和/或途徑成分,例如通過(guò)用如Arkin和Youvan,(1992),"優(yōu)化核苷酸混合物來(lái)編碼用于半隨機(jī)誘變的特定氨基酸亞組"(Optimizingnucleotidemixturestoencodespecificsubsetsofaminoacidsforsemi-randommutagenesis),Biotechnology10:297-300;或Reidhaar-Olson等,(1991),"用寡核苷酸盒隨機(jī)誘變蛋白質(zhì)序歹U"(Randommutagenesisofproteinsequencesusingoligonucleotidecassettes),MethodsEnzymol.,208:564-86所述的通用誘變方法??刹捎糜枚嗪塑账嶂匮b配和位點(diǎn)飽和誘變的另一種方法(常稱為"非隨機(jī)"誘變)來(lái)產(chǎn)生酶和/或途徑組分,然后篩選它們行使一種或多種合成酶或生物合成途徑功能(例如為在體內(nèi)產(chǎn)生非天然氨基酸)的能力。參見(jiàn),例如Short,"遺傳疫苗和酶的非隨機(jī)產(chǎn)生"(Non-StochasticGenerationofGeneticVaccinesandEnzymes》WO00/46344。這種突變方法的替代方法包括重組生物的整個(gè)基因組并在得到的后代中選擇特定的途徑功能(常稱為"全基因組改組")。該方法可應(yīng)用于本發(fā)明,例如通過(guò)基因組重組并選擇能夠產(chǎn)生非天然氨基酸(或其中間體)的生物(大腸桿菌或其它細(xì)胞)。例如,以下出版物所指導(dǎo)的方法可應(yīng)用于途徑設(shè)計(jì)從而改進(jìn)細(xì)胞的現(xiàn)有和/或開(kāi)發(fā)相比的新途徑進(jìn)而在體內(nèi)產(chǎn)生非天然氨基酸。(參見(jiàn))Patnaik等,(2002),"乳酸桿菌基因組改組來(lái)提高酸耐受性"(Genomeshufflingoflactobacillusforimprovedacidtolerance),NatureBiotechnology,20(7):707-712;和Zhang等,(2002),"基因組改組導(dǎo)致細(xì)菌表型快速改善"(Genomeshufflingleadstorapidphenotypicimprovementinbacteria),Nature,415:644-646。也有許多其它用于生物和代謝途徑工程改造(例如為產(chǎn)生所需化合物)的技術(shù),它們也可用于產(chǎn)生非天然氨基酸。指導(dǎo)可用的路徑工程改造方法的出版物的例子包括Nakamura和White,(2003),"微生物生產(chǎn)1,3丙二醇的代謝工程"(Metabolicengineeringforthemicrobialproductionof1,3propanediol),Curr.Opin.Biotechnol.,14(5):454-9;Berry等,(2002),"應(yīng)用代謝工程來(lái)提高BiotechIndigo的生產(chǎn)禾口用途"(ApplicationofMetabolicEngineeringtoimproveboththeproductionanduseofBiotechIndigo),J.IndustrialMicrobiologyandBiotechnology,28:127-133;Banta等,(2002),"優(yōu)化人工代謝途徑工程改造用于維生素C生物合成的棒狀桿菌2,5-二酮基-D-葡糖酸還原酶的輔助因子特異性"(Optimizinganartificialmetabolicpathway:EngineeringthecofactorspecificityofCorynebacterium2,5-diketo-D-gluconicacidreductaseforuseinvitaminCbiosynthesis),Biochemistry,41(20):6226-36;Selivonova等,(2001),"微生物中新特性的快速進(jìn)化"(RapidEvolutionofNovelTraitsinMicroorganisms),AppliedandEnvironmentalMicrobiology,67:3645,禾口許多其它出版物。無(wú)論采用什么方法,用本發(fā)明工程改造的生物合成途徑產(chǎn)生的非天然氨基酸的濃度應(yīng)足夠有效地生物合成蛋白質(zhì),例如天然細(xì)胞內(nèi)的含量,但應(yīng)不能達(dá)到顯著影響其它細(xì)胞氨基酸或耗盡細(xì)胞資源的程度。此方式在體內(nèi)所產(chǎn)生的一般濃度為約10mM到約0.05mM。一旦細(xì)胞被工程改造從而產(chǎn)生了特定途徑所需的酶和非天然氨基酸,可任選采用體內(nèi)選擇為核糖體蛋白質(zhì)合成和細(xì)胞生長(zhǎng)而進(jìn)一步優(yōu)化非天然氨基酸的產(chǎn)生。用于摻入對(duì)炔丙基氧苯丙氨酸(TDro-Phe)的IH交組分本發(fā)明提供響應(yīng)選擇者密碼子,例如琥珀終止密碼子、無(wú)義密碼子、四堿基或四堿基以上密碼子等(例如)在體內(nèi)將炔基氨基酸(例如對(duì)炔丙基氧苯丙氨酸(Ppro-Phe))摻入延伸中的多肽鏈的組合物和方法。例如,本發(fā)明提供正交-tRNA(O-tRNA)、正交氨酰-tRNA合成酶(O-RS)和它們的配對(duì)??捎眠@些配對(duì)將pPRO-Phe摻入延伸中的多肽鏈。本發(fā)明的組合物包括正交氨酰-tRNA合成酶(O-RS),其中所述O-RS用pPRO-Phe優(yōu)先氨?;?-tRNA。在某些實(shí)施方案中,O-RS含有包含SEQIDNO:4、6、8、10、12、14、16或18或其保守變體的氨基酸序列。在本發(fā)明的某些實(shí)施方案中,與任何內(nèi)源性tRNA相比,所述O-RS用炔基氨基酸(例如pPRO-Phe)優(yōu)先氨酰化O-tRNA,其中所述O-RS偏好O-tRNA,其中帶有pPRO-Phe的O-tRNA與帶有pPRO-Phe的內(nèi)源性tRNA的比例大于1:1,更優(yōu)選所述O-RS只加載或幾乎只加載O-tRNA。含有O-RS的組合物還可任選含有正交tRNA(O-tRNA),所述O-tRNA會(huì)g識(shí)別選擇者密碼子。與包含本文序列表(例如,SEQIDNO:l)和實(shí)施例所列的多核苷酸序列或由其編碼的O-tRNA相比,在有關(guān)聯(lián)合成酶存在下,本發(fā)明O-tRNA響應(yīng)于選擇者密碼子而產(chǎn)生的抑制效率一般至少為45%、50%、60%、75%、80%、90%或更高。在一個(gè)實(shí)施方案中,聯(lián)用O-RS與O-tRNA所產(chǎn)生的抑制效率至少比缺少O-RS的O-tRNA所產(chǎn)生的抑制效率高例如5倍、10倍、15倍、20倍、25倍或更高。一方面,聯(lián)用O-RS與O-tRNA所產(chǎn)生的抑制效率至少是衍生自詹氏甲垸球菌的正交酪氨酰-tRNA合成酶配對(duì)所產(chǎn)生的抑制效率的45%。包含O-tRNA的組合物還可以包含細(xì)胞(例如真細(xì)菌細(xì)胞,如大腸桿菌等)和/或翻譯系統(tǒng)。本發(fā)明也提供包含翻譯系統(tǒng)的細(xì)胞(例如真細(xì)菌細(xì)胞),其中所述翻譯系統(tǒng)包括正交-tRNA(O-tRNA);正交氨酰-tRNA合成酶(O-RS)和炔基氨基酸,例如對(duì)炔丙基氧苯丙氨酸(Ppro-Phe)。通常,與任何內(nèi)源性tRNA相比,所述O-RS用炔基氨基酸(例如pPRO-Phe)優(yōu)先氨?;疧-tRNA,其中所述O-RS偏好O-tRNA,其中帶有pPRO-Phe的O-tRNA與帶有pPRO-Phe的內(nèi)源性tRNA的比例大于l:l,更優(yōu)選所述O-RS只加載或幾乎只加載O-tRNA。O-tRNA識(shí)別第一選擇者密碼子,O-RS用pPRO-Phe優(yōu)先氨?;疧-tRNA。在一個(gè)實(shí)施方案中,O-tRNA含有SEQIDNO.:1所示序列或其互補(bǔ)多核苷酸序列,或者由其編碼。在一個(gè)實(shí)施方案中,O-RS含有SEQIDNO:4、6、8、10、12、14、16或18中任一所示的氨基酸序列或其保守變體。本發(fā)明細(xì)胞還可任選包含其它不同的O-tRNA/O-RS配對(duì)和第二種非天然氨基酸,例如,其中所述O-tRNA識(shí)別第二選擇者密碼子,所述O-RS用第二種非天然氨基酸優(yōu)先氨酰化相應(yīng)的O-tRNA,其中所述第二氨基酸不同于pPRO-Phe。本發(fā)明細(xì)胞任選包含含有編碼感興趣多肽的多核苷酸的核酸,其中所述多核苷酸含有O-tRNA能識(shí)別的選擇者密碼子。在某些實(shí)施方案中,本發(fā)明細(xì)胞是真細(xì)菌細(xì)胞,例如大腸桿菌,所述細(xì)胞中含有正交-tRNA(O-tRNA)、正交氨酰-tRNA合成酶(O-RS)、炔基氨基酸(例如pPRO-Phe)和含有編碼感興趣多肽的多核苷酸的核酸,其中所述多核苷酸含有O-tRNA能識(shí)別的選擇者密碼子。在某些實(shí)施方案中,0-RS優(yōu)先氨?;疧-tRNA的效率高于O-RS氨?;魏蝺?nèi)源性tRNA的效率。在本發(fā)明的某些實(shí)施方案中,本發(fā)明O-tRNA含有本文序列表(例如,SEQIDNO:l)或?qū)嵤├径嗪塑账嵝蛄谢蚱浠パa(bǔ)多核苷酸序列,或者由其編碼。在本發(fā)明的某些實(shí)施方案中,O-RS含有序列表所示的氨基酸序列或其保守變體。在一個(gè)實(shí)施方案中,O-RS或其部分由編碼本文序列表或?qū)嵤├景被嵝蛄械亩嗪塑账嵝蛄谢蚱浠パa(bǔ)多核苷酸序列編碼。本發(fā)明O-tRNA和/或O-RS可衍生自各種生物(例如,真核和/或非真核生物)。多核苷酸也是本發(fā)明的特征。本發(fā)明多核苷酸包括含有編碼本文序列表所示多肽的核苷酸序列和/或與該多核苷酸序列互補(bǔ)的多核苷酸序列的人工(如人造和非天然產(chǎn)生的)多核苷酸。本發(fā)明多核苷酸也包括在高度嚴(yán)格條件下能與上述多核苷酸在基本上核酸的全長(zhǎng)上雜交的核酸。本發(fā)明多核苷酸也包括與天然產(chǎn)生的tRNA或相應(yīng)的編碼核酸具有至少75%、80%、90%、95%、98%或更高相同性的多核苷酸(但是本發(fā)明多核苷酸不是天然產(chǎn)生的tRNA或相應(yīng)的編碼核酸),其中所述tRNA能識(shí)別選擇者密碼子,如四堿基密碼子。本發(fā)明多核苷酸也包括與上述任何多核苷酸序列有,例如至少80%、至少90%、至少95%、至少98%或更高相同性的人工多核苷酸序列,禾卩/或含上述序列的保守變體的多核苷酸。含本發(fā)明多核苷酸的載體也是本發(fā)明的特征。例如,本發(fā)明載體可以是質(zhì)粒、粘粒、噬菌體、病毒、表達(dá)載體等。含本發(fā)明載體的細(xì)胞也是本發(fā)明的特征。產(chǎn)生O-tRNA/O-RS配對(duì)的組分的方法也是本發(fā)明的特征。采用這些方法產(chǎn)生的組分也是本發(fā)明的特征。例如,至少產(chǎn)生一個(gè)與細(xì)胞正交的tRNA(O-tRNA)的方法包括產(chǎn)生突變型tRNA文庫(kù);使所述突變型tRNA文庫(kù)各成員的反密碼子環(huán)突變使之能識(shí)別選擇者密碼子,從而形成潛在的O-tRNA文庫(kù);負(fù)選擇第一物種的第一細(xì)胞群,其中所述細(xì)胞含有潛在O-tRNA文庫(kù)的成員。負(fù)選擇除去含有可被細(xì)胞內(nèi)源性氨酰-tRNA合成酶(RS)氨?;臐撛贠-tRNA文庫(kù)成員的細(xì)胞。藉此形成一個(gè)與第一物種的細(xì)胞正交的tRNA庫(kù),從而至少獲得一個(gè)O-tRNA。也提供了采用本發(fā)明方法產(chǎn)生的O-tRNA。在某些實(shí)施方案中,所述方法還包括正選擇第一物種的第二細(xì)胞群,其中所述細(xì)胞含有與第一物種的細(xì)胞正交的tRNA庫(kù)成員、關(guān)聯(lián)氨酰-tRNA合成酶和正選擇標(biāo)記。采用正選擇來(lái)選擇或篩選出含有能被關(guān)聯(lián)氨酰-tRNA合成酶氨?;⑶以谡x擇標(biāo)記存在下可出現(xiàn)所需反應(yīng)的tRNA庫(kù)成員的細(xì)胞,從而獲得O-tRNA。在某些實(shí)施方案中,第二細(xì)胞群含有未被負(fù)選擇除去的細(xì)胞。本發(fā)明也提供了用炔基氨基酸加載O-tRNA的正交-氨酰-tRNA合成酶的鑒定方法。例如,所述方法包括選擇第一物種的細(xì)胞群,其中所述細(xì)胞各含有l(wèi))多種氨酰-tRNA合成酶(RS)的成員(如所述多種RS可包括突變型RS、衍生自第一物種以外物種的RS或者同時(shí)包括二者);2)正交-tRNA(O-tRNA)(例如,(衍生)自一個(gè)或多個(gè)物種);和3)編碼正選擇標(biāo)記并包含至少一個(gè)選擇者密碼子的多核苷酸。選擇或篩選細(xì)胞(如宿主細(xì)胞)中顯示與缺乏多種RS的成員或成員含量較低的細(xì)胞相比抑制效率升高的那些細(xì)胞。這些所選擇/篩選的細(xì)胞含有能氨?;疧-tRNA的活性RS。采用這種方法鑒定的正交氨酰-tRNA合成酶也是本發(fā)明的特征。在細(xì)胞(例如真細(xì)菌細(xì)胞,如大腸桿菌細(xì)胞等)中產(chǎn)生在特定位置具有對(duì)炔丙基氧苯丙氨酸(pPRO-Phe)的蛋白質(zhì)的方法也是本發(fā)明的特征。例如,一種方法包括在適當(dāng)培養(yǎng)基內(nèi)培養(yǎng)含有核酸的細(xì)胞,所述核酸含有至少一個(gè)選擇者密碼子并編碼蛋白;提供pPR;和,利用所述至少一個(gè)選擇者密碼子在核酸翻譯過(guò)程中將pPR摻入蛋白質(zhì)的特定位置,從而產(chǎn)生所述蛋白質(zhì)。細(xì)胞還含有能在細(xì)胞內(nèi)起作用并能識(shí)別選擇者密碼子的正交-tRNA(O-tRNA);以及用pPRO-Phe優(yōu)先氨?;疧-tRNA的正交氨酰-tRNA合成酶(O-RS)。利用這種方法產(chǎn)生的蛋白質(zhì)也是本發(fā)明的特征。本發(fā)明也提供了包含蛋白質(zhì)的組合物,所述蛋白質(zhì)含有例如pPRO-Phe。在某些實(shí)施方案中,蛋白質(zhì)含有的氨基酸序列與已知蛋白,如治療性蛋白、診斷性蛋白、工業(yè)用酶的氨基酸序列或其一部分至少有75%的相同性。組合物任選包含藥學(xué)上可接受的載體。核酸和多肽序列及其變體如上下文所述,本發(fā)明提供編碼例如O-tRNA和O-RS的多核苷酸序列和多肽,例如O-RS的氨基酸序列,以及包含所述序列的組合物、系統(tǒng)和方法。本文也公開(kāi)了所述序列的例子,如O-tRNA和O-RS的氨基酸和核苷酸序列(見(jiàn)表4,例如SEQIDN0:5、7、9、11、13、15、17和19)。但是,本領(lǐng)域技術(shù)人員應(yīng)知道本發(fā)明不局限于本文例如實(shí)施例和序列表中公開(kāi)的序列。本領(lǐng)域技術(shù)人員應(yīng)知道本發(fā)明提供了具有本文所述功能,例如編碼O-tRNA或O-RS的許多相關(guān)序列。實(shí)施例1描述了能用pPRO-Phe氨?;疧-tRNA的O-RS的構(gòu)建和分析。此實(shí)施例描述了分離出的8種O-RS(參見(jiàn),圖3和實(shí)施例9)。如在這些氨基酸序列中所見(jiàn)到的,在此8種突變型O-RS中觀察到氨基酸取代的部分共有趨勢(shì)。在多個(gè)克隆中,結(jié)合袋(bindingpocket)中發(fā)現(xiàn)以下氨基酸中至少兩個(gè)Ala32、Prol07/Gln107、Alal58、Ilel59和Alal62/Pro162(參見(jiàn),SEQIDNO:21)。Tyr32—Ala32和Aspl58—Ala158的突變可導(dǎo)致Tyr32、Aspl58和天然底物酪氨酸之間的氫鍵喪失,從而不利于其結(jié)合。預(yù)計(jì)存在小的和主要是疏水的側(cè)鏈促進(jìn)pPRO-Phe結(jié)合。這些共有趨勢(shì)可用于設(shè)計(jì)其它O-RS,預(yù)計(jì)這些O-RS能在正交系統(tǒng)中與真細(xì)菌宿主系統(tǒng)的SEQIDNO:1所示O-tRNA起作用從而摻入pPRO-Phe。這些共有趨勢(shì)表示如下表1<table>tableseeoriginaldocumentpage49</column></row><table>因此,根據(jù)這些共有趨勢(shì),可以合理地設(shè)計(jì)經(jīng)實(shí)驗(yàn)鑒定的8種pPRO-PheRS(即,pPRO-PheRS-l到pPRO-PheRS-8)未代表的至少4種其它正交pPRO-Phe合成酶(pPRO-PheRS-conl到pPRO-PheRS-con4)。所述正交pPRO-Phe合成酶如下所示表2<table>tableseeoriginaldocumentpage49</column></row><table>本發(fā)明提供了多肽(O-RS)和多核苷酸,例如O-tRNA、編碼O-RS或其一部分的多核苷酸,用于分離氨酰-tRNA合成酶克隆的寡核苷酸等。本發(fā)明多核苷酸包括那些編碼本發(fā)明感興趣蛋白或多肽并含有一個(gè)或多個(gè)選擇者密碼子的多核苷酸。此外,本發(fā)明多核苷酸還包括,例如含有SEQIDNO:5、7、9、11、13、15、17或19所示核苷酸序列的多核苷酸;與(所示)多核苷酸序列互補(bǔ)的多核苷酸或編碼其多核苷酸序列的多核苷酸。本發(fā)明多核苷酸也包括編碼包含SEQIDN0:4、6、8、10、12、14、16或18的氨基酸序列的任何多核苷酸。本發(fā)明多核苷酸也包括編碼本發(fā)明多肽的多核苷酸。類似地,在高嚴(yán)格條件下,可與上述多核苷酸在基本上全長(zhǎng)核酸序列上雜交的人工核酸也是本發(fā)明多核苷酸。在一個(gè)實(shí)施方案中,組合物包含本發(fā)明多肽和各種賦形劑(如緩沖液、水、藥學(xué)上可接受的賦形劑等)。本發(fā)明也提供了可與本發(fā)明多肽發(fā)生特異性免疫反應(yīng)的抗體或抗血清。人工多核苷酸是人造的、不是天然產(chǎn)生的多核苷酸。本發(fā)明多核苷酸也包括人工多核苷酸,這種多核苷酸與天然產(chǎn)生的tRNA至少有75%、80%、90%、95%、98%或更高的相同性(但不是天然產(chǎn)生的tRNA)。多核苷酸也包括與天然產(chǎn)生的tRNA有,例如至少75%、至少80%、至少90%、至少95%、至少98%或更高相同性(但不是100%相同)的人工多核苷酸。在某些實(shí)施方案中,載體(如質(zhì)粒、粘粒、噬菌體、病毒等)含有本發(fā)明多核苷酸。在一個(gè)實(shí)施方案中,載體是表達(dá)載體。在另一實(shí)施方案中,表達(dá)載體包含與本發(fā)明一個(gè)或多個(gè)多核苷酸操作性相連的啟動(dòng)子。在另一實(shí)施方案中,細(xì)胞包含含有本發(fā)明多核苷酸的載體。本領(lǐng)域技術(shù)人員還應(yīng)知道本發(fā)明還包括所公開(kāi)序列的許多變體。例如,能得到功能相同序列的所公開(kāi)序列的保守變體也屬于本發(fā)明。可認(rèn)為核酸多核苷酸序列的變體屬于本發(fā)明,其中所述變體可與至少一個(gè)公開(kāi)序列雜交。通過(guò)例如標(biāo)準(zhǔn)序列比較技術(shù)測(cè)定的本文所公開(kāi)序列的獨(dú)特亞序列也屬于本發(fā)明。保守性變異由于遺傳密碼的簡(jiǎn)并性,"沉默取代"(B卩,核酸序列中的取代不導(dǎo)致所編碼多肽改變)是編碼氨基酸序列的每條核酸序列所蘊(yùn)含的特征。類似地,也不難鑒定氨基酸序列中有一個(gè)或少數(shù)氨基酸被具有高度相似特性的不同氨基酸取代的"保守性氨基酸取代",因?yàn)樗c具體公開(kāi)的構(gòu)建物高度相似。各公開(kāi)序列的這種保守性變異是本發(fā)明的特征之一。具體核酸序列的"保守性變異"指編碼相同或基本相同的氨基酸序列的那些核酸,或者,如果是不編碼氨基酸序列的核酸,則指基本上相同的序列。技術(shù)人員知道改變、加入或刪除被編碼序列中一個(gè)氨基酸或少部分氨基酸(一般低于5%、更常見(jiàn)低于4%、2%或1%)的各種取代、缺失或插入是"保守性修飾變異",這些改變導(dǎo)致氨基酸的缺失、插入或被化學(xué)性質(zhì)相似的氨基酸所取代。因此,本發(fā)明所列舉多肽序列的"保守性變異"包括用同一保守性取代組的氨基酸取代該多肽序列的少部分(通常低于5%,更常見(jiàn)是低于2%或1%)的氨基酸。最后,插入不改變某核酸分子所編碼活性的序列,例如插入無(wú)功能序列是基礎(chǔ)核酸的保守性變異。本領(lǐng)域熟知提供功能類似的氨基酸的保守性取代表,其中一個(gè)氨基酸殘基被另一個(gè)具有相似化學(xué)特性(例如芳族側(cè)鏈或帶正電荷的側(cè)鏈)的氨基酸殘基取代,因此基本上不改變?cè)摱嚯姆肿拥墓δ芴匦?。以下例舉多組化學(xué)特性相似的天然氨基酸,其中,各組內(nèi)的取代即"保守性取代"。表3<table>tableseeoriginaldocumentpage51</column></row><table>可采用比較雜交來(lái)鑒定本發(fā)明核酸,包括本發(fā)明核酸的保守性變異,該比較雜交方法是區(qū)別出本發(fā)明核酸的優(yōu)選方法。此外,能在高度、超高度和超超高度嚴(yán)格條件下與SEQIDNO:5、7、9、11、13、15、17和19所代表的核酸雜交的靶核酸是本發(fā)明特征之一。這種核酸的例子包括與某給定的核酸序列相比含有一個(gè)或少許沉默或保守性核酸取代的核酸。當(dāng)測(cè)試核酸與探針的雜交程度至少是與完美匹配的互補(bǔ)靶(核酸)雜交程度的50%時(shí),可稱測(cè)試核酸與探針核酸特異性雜交,即信噪比至少是該探針與耙核酸在完美匹配的探針與完美匹配的互補(bǔ)靶核酸結(jié)合的條件下雜交的信噪比的1/2;此該條件下,完美匹配的探針與完美匹配的互補(bǔ)靶核酸結(jié)合的信噪比至少是與任何不匹配靶核酸雜交所觀察到的信噪比的5-10倍。當(dāng)核酸結(jié)合(一般在溶液中)時(shí),稱其"雜交"。核酸因各種已充分特征鑒定的理化力,例如氫鍵、溶劑排斥、堿基堆積等而雜交。核酸雜交的廣泛指南見(jiàn)Tijssen,(1993),《生物化學(xué)與分子生物學(xué)的實(shí)驗(yàn)室技術(shù)》(LaboratoryTechniquesinBiochemistryandMolecularBiology—HybridizationwithNucleicAcidProbes),第一部分第二章,"雜交原理概述與核酸探針試驗(yàn)方法"(Overviewofprinciplesofhybridizationandthestrategyofnucleicacidprobeassays),(Elsevier,紐約);以及《最新分子生物學(xué)方法》(CurrentProtocolsinMolecularBiology),Ausubel等編,"最新方法"(CurrentProtocols),GreenePublishingAssociates,Inc.和JohnWiley&Sons的合資企業(yè),(2004年增補(bǔ))("Ausubel");Hames和Higgins,(1995),《基因探針1》(GeneProbes1),IRL出版社,牛津大學(xué)出版社,牛津,英格蘭,(Hames和Higgins1);Hames和Higgins,(1995),《基因探針2》(GeneProbes2),IRL出版社,牛津大學(xué)出版社,牛津,英格蘭,(Hames和Higgins2)提供了合成、標(biāo)記、檢測(cè)和定量測(cè)定DNA及RNA,包括寡核苷酸的細(xì)節(jié)。在Southern或northern印跡濾膜上具有100個(gè)以上互補(bǔ)殘基的互補(bǔ)核酸雜交的嚴(yán)格雜交條件的例子是含lmg肝素的50%福爾馬林,42。C雜交過(guò)夜。嚴(yán)格洗滌條件的例子是65"C,用0.2XSSC洗滌15分鐘(SSC緩沖液的描述可參見(jiàn)Sambrook,同上)。通常先進(jìn)行低嚴(yán)格洗滌除去背景信號(hào),再進(jìn)行髙嚴(yán)格洗滌。示例性低嚴(yán)格洗滌是40°C,用2XSSC洗滌15分鐘。具體雜交試驗(yàn)中信噪比是無(wú)關(guān)探針觀察到的信噪比的5倍(或更高)通常表示檢測(cè)到特異性雜、-父。核酸雜交實(shí)驗(yàn)(例如,Southern和northern雜交)的"嚴(yán)格雜交洗滌條件"取決于序列,并隨不同的環(huán)境參數(shù)而不同。核酸雜交的廣泛介紹見(jiàn)Tijssen,(1993),同上;Hames和Higgins,1和2。不難憑經(jīng)驗(yàn)確定適合任何測(cè)試核酸的嚴(yán)格雜交和洗滌條件。例如,在確定嚴(yán)格雜交和洗滌條件時(shí),可逐漸提升雜交和洗滌條件(例如,通過(guò)升高雜交或洗滌中的溫度、降低雜交或洗滌中的鹽濃度、增加雜交或洗滌中的洗滌劑濃度和/或增加雜交或洗滌中的有機(jī)溶劑如福爾馬林的濃度)直至符合一組選定標(biāo)準(zhǔn)。例如,在高度嚴(yán)格雜交和洗滌條件中,逐漸提升雜交和洗滌條件直至探針與完美匹配的互補(bǔ)靶(核酸)結(jié)合的信噪比至少是探針與不匹配靶(核酸)雜交信噪比的5倍。選擇的"非常嚴(yán)格"的條件等于具體探針的熱解鏈溫度(Tm)。Tm是50%的測(cè)試序列與完美匹配的探針雜交的溫度(在限定的離子強(qiáng)度和pH下)。為本發(fā)明的目的,"高度嚴(yán)格"的雜交和洗滌條件一般選擇為在限定的離子強(qiáng)度和pH時(shí)比具體序列的Tm約低5'C。"超高嚴(yán)格"的雜交和洗滌條件指,增加雜技和洗滌條件的嚴(yán)格性直至探針與完美匹配的互補(bǔ)靶(核酸)結(jié)合的信噪比至少是探針與不匹配靶(核酸)雜交觀察到的信噪比的10倍。靶核酸在這種條件下與探針雜交的信噪比至少是完美匹配的互補(bǔ)耙核酸的1/2時(shí),可稱其在超高度嚴(yán)格條件下與探針結(jié)合。類似地,可通過(guò)逐漸提升相關(guān)雜交試驗(yàn)的雜交和/或洗滌條件來(lái)確定甚至更高的嚴(yán)格性水平。例如,提升雜交和洗滌的條件直至探針與完美匹配的互補(bǔ)靶核酸結(jié)合的信噪比至少比探針與任何不匹配靶核酸雜交信噪比高10、20、50、100或500倍或更高的嚴(yán)格性。耙核酸在這種條件下與探針雜交的信噪比至少是完美匹配的互補(bǔ)靶核酸的1/2時(shí),可稱其在超超高度嚴(yán)格條件下與探針結(jié)合。如果在嚴(yán)格條件下不彼此雜交的核酸所編碼的多肽基本相同,則它們基本仍相同。例如,當(dāng)利用遺傳密碼所允許的最大密碼簡(jiǎn)并性產(chǎn)生核酸的拷貝時(shí)就會(huì)發(fā)生這種情況。獨(dú)特亞序列一方面,本發(fā)明提供了含有選自本文所述O-tRNA和O-RS序列的核酸的獨(dú)特亞序列的核酸。與對(duì)應(yīng)于任何已知O-tRNA或O-RS核酸序列的核酸相比,所述獨(dú)特亞序列是獨(dú)特的。可采用,例如設(shè)置默認(rèn)參數(shù)的BLAST進(jìn)行核酸比對(duì)。任何獨(dú)特亞序列可用作,例如探針來(lái)鑒定本發(fā)明核酸。類似地,本發(fā)明包括含有選自本文所述O-RS序列的多肽的獨(dú)特亞序列的多肽。與對(duì)應(yīng)于任何已知多肽序列的多肽相比,本文的獨(dú)特亞序列是獨(dú)特的。本發(fā)明也提供能在嚴(yán)格條件下與獨(dú)特的編碼寡核苷酸雜交的耙核酸,所述寡核苷酸編碼選自O(shè)-RS序列的多肽的獨(dú)特亞序列,其中與任何對(duì)照多肽(例如,本發(fā)明合成酶(例如)通過(guò)突變所衍生自的親本序列)相應(yīng)的多肽相比,所述獨(dú)特亞序列是獨(dú)特的。可通過(guò)上述方法測(cè)定獨(dú)特序列。序列比較、相同性和同源性描述兩個(gè)或多個(gè)核酸或多肽序列關(guān)系的術(shù)語(yǔ)"相同的"或"百分相同性"指當(dāng)用下文所述序列比較算法(或技術(shù)人員可用的其它算法)或通過(guò)目測(cè)觀察來(lái)比較和比對(duì)兩個(gè)或多個(gè)序列或亞序列的最大相應(yīng)性時(shí),這兩個(gè)或多個(gè)序列或亞序列相同,或者有特定百分比的氨基酸殘基或核苷酸相同。描述兩個(gè)或多個(gè)核酸或多肽(例如,編碼O-tRNA或O-RS的DNA,O-RS的氨基酸序列)關(guān)系的術(shù)語(yǔ)"基本相同"指當(dāng)利用序列比較算法或通過(guò)目測(cè)觀察來(lái)比較和比對(duì)兩個(gè)或多個(gè)序列或亞序列的最大相應(yīng)性時(shí),這兩個(gè)或多個(gè)序列或亞序列至少有約60%、約80%、約90-95%、約98%、約99%或更多的核苷酸或氨基酸殘基相同。這種"基本相同的"序列通常認(rèn)為是"同源的",而不考慮其實(shí)際祖先。優(yōu)選在至少長(zhǎng)約50個(gè)殘基的序列區(qū)域,更優(yōu)選在至少約100個(gè)殘基的區(qū)域存在"基本相同性",待比較兩條序列最好有至少約150個(gè)殘基或者在全長(zhǎng)上基本相同。當(dāng)?shù)鞍踪|(zhì)和/或蛋白質(zhì)序列(天然或人工地)衍生自同一祖先蛋白或蛋白序列時(shí),它們是"同源的"。類似地,當(dāng)核酸和/或核酸序列(天然或人工地)衍生自同一祖先核酸或核酸序列時(shí),它們是"同源的"。例如,可通過(guò)各種可用的誘變方法來(lái)修飾任何天然產(chǎn)生的核酸使之含有一個(gè)或多個(gè)選擇者密碼子。當(dāng)該誘變的核酸表達(dá)時(shí),它編碼的多肽含有一個(gè)或多個(gè)非天然氨基酸,例如炔基氨基酸。當(dāng)然,該突變方法還可改變一個(gè)或多個(gè)標(biāo)準(zhǔn)密碼子,從而也改變了所得突變型蛋白質(zhì)中一個(gè)或多個(gè)標(biāo)準(zhǔn)氨基酸。通??蓮膬煞N或多種核酸或蛋白質(zhì)(或其序列)間的序列相似性推斷同源性。用于確認(rèn)同源性的序列間精確的相似性百分比依所述的核酸與蛋白質(zhì)而不同,但常規(guī)將低至25%的序列相似性用來(lái)確認(rèn)同源性。也可用更高水平的序列相似性,例如30%、40%、50%、60%、70%、80%、90%、95%或99%或更高來(lái)確認(rèn)同源性。本文描述了測(cè)定序列相似性百分比的方法(例如,采用參數(shù)默認(rèn)的BLASTP和BLASTN),這些方法眾所周知。為比較序列并測(cè)定同源性,通常將一條序列用作與測(cè)試序列比較的參比序列。當(dāng)采用序列比較算法時(shí),將測(cè)試序列與參比序列輸入計(jì)算機(jī),如果需要可設(shè)計(jì)亞序列坐標(biāo),并設(shè)計(jì)序列算法程序參數(shù)。然后根據(jù)所設(shè)計(jì)的程序參數(shù),序列比較算法可計(jì)算測(cè)試序列相比于參比序列的序列相同性百分比??捎靡韵路椒ㄟM(jìn)行比較的最佳序列比對(duì),例如Sm池和Waterman,(1981),Adv.A卯l.Math.,2:482的局部同源性算法;Needleman和Wunsch,J.,(1970),Mol.Biol.,48:443的同源性比對(duì)算法;Pearson和Lipman,(1988),P腦.Nat,l.Acad.Sd.USA,85:2444的相似性檢索方法;計(jì)算機(jī)執(zhí)行這些算法(Wisconsin遺傳軟件包中的GAP,BESTFIT,F(xiàn)ASTA和TFASTA,GeneticsComputerGroup,575ScienceDr.,Madison,WI);或者目測(cè)(一般可參見(jiàn)《最新分子生物學(xué)方法》(CurrentProtocolsinMolecularBiology),Ausubel等編,"最新方法"(CurrentProtocols),GreenePublishingAssociates,Inc.禾口JohnWiley&Sons的合資企業(yè),2004年增補(bǔ))。適用于測(cè)定序列相同性和序列相似性百分比的算法的一個(gè)例子是Altschul等,J.Mol.Biol.,215:403-410,(1990)所述的BLAST算法。進(jìn)行BLAST分析的軟件由國(guó)家生物技術(shù)信息中心(在萬(wàn)維網(wǎng)ncbi.nlm.nih.gov/)對(duì)公眾開(kāi)放。該算法包括首先通過(guò)在査詢序列中鑒定長(zhǎng)為W的短字串來(lái)鑒定高評(píng)分序列配對(duì)(HSP),這些字串與數(shù)據(jù)庫(kù)中相同長(zhǎng)度的字串比對(duì)時(shí)符合或滿足某些正值閾值評(píng)分T。T稱為鄰近字串評(píng)分閾值(Altschul等,同上)。這些原始鄰近字串作為啟動(dòng)檢索的種子來(lái)找尋含有它們的較長(zhǎng)HSP。然后使這些字串選中(hit)沿著各條序列雙向延伸,以致累積比對(duì)評(píng)分增加。以核苷酸序列為例,用參數(shù)M(—對(duì)匹配殘基的獎(jiǎng)勵(lì)評(píng)分;恒大于0)和N(錯(cuò)配殘基的罰分;恒小于O)計(jì)算累積評(píng)分。對(duì)于氨基酸序列,則用評(píng)分矩陣來(lái)計(jì)算累積評(píng)分。當(dāng)出現(xiàn)以下情況時(shí)任一方向的字串選中延伸停止累積比對(duì)評(píng)分從其達(dá)到的最高值下降X;因一個(gè)或多個(gè)負(fù)評(píng)分殘基比對(duì)的累積導(dǎo)致累積評(píng)分降至0或0以下;或者到達(dá)各序列的末端。BLAST算法參數(shù)W、T和X決定比對(duì)的靈敏度和速度。BLAST程序(用于核苷酸序列)默認(rèn)11為字長(zhǎng)(W)、10為期望值(E)、100為截?cái)嘀?、M二5、N^4,并進(jìn)行雙鏈比較。對(duì)于氨基酸序列,BLAST程序默認(rèn)3為字長(zhǎng)(W)、10為期望值(E)并采用BLOSUM62評(píng)分矩陣(參見(jiàn)Henikoff和Henikoff,(1989),Proc.Natl.Acad.Sci.USA,89:10915)。除了計(jì)算序列相同性百分比之外,BLAST算法也可對(duì)兩條序列間的相似性進(jìn)行統(tǒng)計(jì)學(xué)分析(參見(jiàn),例如Karlin和Altschul,Proc.Nat,l.Acad.Sci.USA,90:5873-5787,(1993))。BLAST算法提供的相似性量度之一是最小總概率(P(N)),其指示兩條核苷酸或氨基酸序列之間發(fā)生隨機(jī)匹配的概率。例如,如果比較測(cè)試核酸與參比核酸的最小總概率小于約0.1,更優(yōu)選小于約0.01,最優(yōu)選小于約0.001,則可認(rèn)為該核酸與參比核酸相似。誘變與其它分子生物學(xué)技術(shù)可采用分子生物學(xué)技術(shù)操作本發(fā)明和用于本發(fā)明的多核苷酸和多肽。描述分子生物學(xué)的通用教材包括Berger和Kimmd,《分子克隆技術(shù)指南,酶學(xué)方法,第152巻》(GuidetoMolecularCloningTechniques,MethodsinEnzymologyvolume152),AcademicPress,Inc.,SanDiego,CA("Berger,,);Sambrook等《分子克隆一實(shí)驗(yàn)室手冊(cè)》(MolecularCloning-ALaboratoryManual),(第三版),第l-3巻,冷泉港實(shí)驗(yàn)室,冷泉港,紐約,2001("Sambrook")和《最新分子生物學(xué)方法》(CurrentProtocolsinMolecularBiology),F.M.Ausubel等編;"最親斤方法"(CurrentProtocols),GreenePublishingAssociates,Inc.禾口JohnWiley&80115的合資企業(yè),(2004年增補(bǔ))("Ausubel")。這些教材描述了誘變、載體的應(yīng)用、啟動(dòng)子和許多其它相關(guān)課題,例如產(chǎn)生含有選擇者密碼子的基因從而產(chǎn)生含有炔基氨基酸(如pPRO-Phe)的蛋白質(zhì),以及產(chǎn)生正交tRNA、正交合成酶及其配對(duì)的課題。本發(fā)明可利用各種類型的誘變來(lái)(例如)使tRNA分子突變、產(chǎn)生tRNA文庫(kù)、產(chǎn)生合成酶的文庫(kù)和/或在感興趣蛋白質(zhì)或多肽中插入編碼炔基氨基酸的選擇者密碼子。它們包括但不限于定點(diǎn)誘變、隨機(jī)點(diǎn)誘變、同源重組、DNA改組或其它遞歸誘變方法、嵌合構(gòu)建、利用含有尿嘧啶的模板誘變、寡核苷酸指導(dǎo)的誘變、硫代磷酸酯修飾的DNA誘變、利用缺口雙螺旋DNA的誘變等,或者是它們的任何組合。其它合適的方法包括點(diǎn)錯(cuò)配修復(fù)、利用修復(fù)缺陷宿主株的誘變、限制性選擇和限制性純化、缺失誘變、總基因合成誘變、雙鏈斷裂修復(fù)等。本發(fā)明也包括,例如涉及嵌合構(gòu)建物的誘變。在一個(gè)實(shí)施方案中,可用天然產(chǎn)生分子或改變或突變的天然產(chǎn)生分子的已知信息,例如序列,序列比較、物理特性、晶體結(jié)構(gòu)等來(lái)指導(dǎo)誘變??衫帽景l(fā)明多核苷酸或含有本發(fā)明多核苷酸的構(gòu)建物,例如本發(fā)明載體(例如可以是克隆載體或表達(dá)載體)來(lái)遺傳改造(例如轉(zhuǎn)化、轉(zhuǎn)導(dǎo)或轉(zhuǎn)染)宿主細(xì)胞。例如,可將正交tRNA、正交tRNA合成酶和待衍生蛋白質(zhì)的編碼區(qū)操作性連接于可在所需宿主細(xì)胞中起作用的基因表達(dá)控制元件。典型的載體含有轉(zhuǎn)錄和翻譯終止子、轉(zhuǎn)錄和翻譯起始序列和用于調(diào)節(jié)具體靶核酸表達(dá)的啟動(dòng)子。這些載體可任選地包含遺傳表達(dá)盒,所述表達(dá)盒含有至少一個(gè)獨(dú)立的終止子序列,允許該表達(dá)盒在真核細(xì)胞或原核細(xì)胞或二者中復(fù)制的序列(例如,穿梭載體),和適用于原核與真核系統(tǒng)的選擇標(biāo)記。載體適用于在原核細(xì)胞、真核細(xì)胞或二者中復(fù)制和/或整合。參見(jiàn)Giliman和Smith,(1979),Gene,8:81;Roberts等,(1987),Nature,328:731;Schneider,B.等,(1995),ProteinExpr.Purif.,6435:10;Ausubel,Samb脂k,Berger(均同上)。例如,載體可以是質(zhì)粒、細(xì)菌、病毒、裸多核苷酸或綴合的多核苷酸形式。可通過(guò)標(biāo)準(zhǔn)方法將載體導(dǎo)入細(xì)胞和/或微生物,包括電穿孔(From等,(1985),Proc.Natl.Acad.Sci.USA,82,5824),病毒載體感染,利用在小珠或顆粒的基質(zhì)內(nèi)或其表面上含有核酸的小顆粒的高速?gòu)椡璐┩?Klein等,(1987),Nature,327:70-73)等。ATCC提供了大量可用于克隆的細(xì)菌和細(xì)菌噬菌體,例如ATCC出版的《ATCC細(xì)菌和細(xì)菌噬菌體目錄》(TheATCCCatalogueofBacteriaandBacteriophage),(1996),Gherna等編。其它測(cè)序、克隆的基本方法和分子生物學(xué)的其它方面及對(duì)其潛在理論的考慮也可見(jiàn)Sambrook(同上),Ausubel(同上)和Watson等,(1992),《重組DNA》(RecombinantDNA),第二版,ScientificAmericanBooks,NY。此外,可以向各種商業(yè)來(lái)源定制的或標(biāo)準(zhǔn)定購(gòu)基本上任何核酸(和實(shí)際上任何標(biāo)記的核酸,無(wú)論標(biāo)準(zhǔn)或非標(biāo)準(zhǔn)的),例如MidlandCertifiedReagentCompany(Midland,TXmcrc.com)、TheGreatAmericanGeneCompany(Ramona,CA,從萬(wàn)維網(wǎng)genco.com處可得)、ExpressGenInc.(Chicago,IL,從萬(wàn)維網(wǎng)expressgen.com處可得)、OperonTechnologiesInc.(Alameda,CA)和許多其它公司。工程改造的宿主細(xì)胞可在為例如篩選步驟、激活啟動(dòng)子或選擇轉(zhuǎn)化子的活性而適當(dāng)改進(jìn)的常規(guī)營(yíng)養(yǎng)培養(yǎng)基中培養(yǎng)。這些細(xì)胞任選培養(yǎng)成轉(zhuǎn)基因生物。其它可用的參考文獻(xiàn),例如用于細(xì)胞分離和培養(yǎng)(例如,用于隨后核酸分離或蛋白質(zhì)表達(dá)和/或純化)的文獻(xiàn),包括Freshney,(1994),《動(dòng)物細(xì)胞培養(yǎng),基本技術(shù)手冊(cè)》(CultureofAnimalCells,aManualofBasicTechnique),第三版,Wiley-Liss,紐約及其所引用的參考文獻(xiàn);Payne等,(1992),《液體系統(tǒng)中的植物細(xì)胞與組織培養(yǎng)》(PlantCellandTissueCultureinLiquidSystems),JohnWileyandSons,Inc.,紐約,NY;Gamborg禾QPhillips編,(1995),《植物細(xì)胞、組織和器官培養(yǎng)》(PlantCell,TissueandOrganCulture);FundamentalMethodsSpringerLabManual,Springer陽(yáng)Verlag(BerlinHeidelbergNewYork);Atlas和Parks編,《微生物培養(yǎng)基手冊(cè)》(TheHandbookofMicrobiologicalMedia),(1993),CRCPress,BocaRaton,FL。感興趣的蛋白質(zhì)與多肽炔基氨基酸的一個(gè)顯著優(yōu)點(diǎn)是(但不限于)含有炔基氨基酸的蛋白質(zhì)可用于交聯(lián)或綴合蛋白質(zhì)與各種小分子、生物分子或其它蛋白質(zhì)等。含有至少一個(gè)炔基氨基酸的感興趣蛋白或多肽是本發(fā)明的特征之一。本發(fā)明也包括用本發(fā)明組合物和方法制備的至少含有一個(gè)炔基氨基酸的多肽或蛋白質(zhì)。蛋白質(zhì)也可和賦形劑(如藥學(xué)上可接受的賦形劑)一起存在。本發(fā)明蛋白可任選在單個(gè)氨基酸位置或多個(gè)氨基酸位置含有翻譯后修飾(除了對(duì)炔基氨基酸殘基可能的亞序列修飾外),或者所述蛋白質(zhì)可具有多個(gè)不同類型的修飾。在細(xì)胞內(nèi)產(chǎn)生特定位置上有炔基氨基酸的蛋白質(zhì)的方法也是本發(fā)明的特征之一。例如,一種方法包括在適宜的培養(yǎng)基內(nèi)培養(yǎng)細(xì)胞,所述細(xì)胞含有的核酸至少包含一個(gè)選擇者密碼子并能編碼蛋白質(zhì);提供炔基氨基酸;其中所述細(xì)胞還包含能在細(xì)胞內(nèi)起作用并識(shí)別選擇者密碼子的正交-tRNA(O-tRNA);和用炔基氨基酸優(yōu)先氨?;疧-tRNA的正交氨酰-tRNA合成酶(O-RS)。利用這種方法產(chǎn)生的蛋白也是本法發(fā)明的特征之一。在某些實(shí)施方案中,與表達(dá)系統(tǒng)中任何內(nèi)源性tRNA相比,O-RS對(duì)氨?;P(guān)聯(lián)O-tRNA有偏好。O-RS所加載的O-tRNA與內(nèi)源性tRNA的相對(duì)比例大于1:1,更優(yōu)選至少約2:1,更優(yōu)選5:1,更優(yōu)選10:1,更優(yōu)選20:1,更優(yōu)選50:1,更優(yōu)選75:1,更優(yōu)選95:1,98:1,99:1,100:1,500:1,1,000:1,5,000:l或更高。本發(fā)明也提供含有蛋白的組合物,所述蛋白含有炔基氨基酸。在某些實(shí)施方案中,蛋白質(zhì)含有的氨基酸序列與治療性蛋白、診斷性蛋白、工業(yè)用酶或其片段的序列至少有75%相同。本發(fā)明組合物和利用本發(fā)明方法產(chǎn)生的組合物任選存在于細(xì)胞中。然后,宿主系統(tǒng)的翻譯機(jī)制可利用本發(fā)明O-tRNA/0-RS配對(duì)或其單獨(dú)的組分將炔基氨基酸摻入蛋白質(zhì)。2004年4月16日提交的名為"擴(kuò)展真核生物遺傳密碼"(EXPANDINGTHEEUKARYOTICGENETICCODE)的國(guó)際公布號(hào)WO2004/094593和名為"非天然氨基酸的體內(nèi)摻入"(Invivoincorporationofunnaturalaminoacids)的WO2002/085923描述了該方法,該兩篇文獻(xiàn)納入本文作為參考。例如,當(dāng)O-tRNA/O-RS配對(duì)引入宿主(如大腸桿菌)細(xì)胞時(shí),該配對(duì)響應(yīng)選擇者密碼子在體內(nèi)將炔基氨基酸(例如對(duì)炔丙基氧苯丙氨酸)摻入蛋白質(zhì)。加入系統(tǒng)的對(duì)炔丙基氧苯丙氨酸是可外源性加入生長(zhǎng)培養(yǎng)基中的合成氨基酸,例如酪氨酸或苯丙氨酸的衍生物。本發(fā)明組合物可任選存在于體外翻譯系統(tǒng)或體內(nèi)系統(tǒng)中。本發(fā)明細(xì)胞能合成大量有用的含非天然氨基酸的蛋白質(zhì)。在一方面,該組合物任選包含,例如至少10微克、至少50微克、至少75微克、至少100微克、至少200微克、至少250微克、至少500微克、至少1毫克、至少10毫克或更多含炔基氨基酸的蛋白質(zhì),或體內(nèi)蛋白質(zhì)制備方法所能實(shí)現(xiàn)的的產(chǎn)量(詳見(jiàn)本文所述重組蛋白質(zhì)制備和純化)。在另一方面,組合物中包含在例如細(xì)胞裂解液、緩沖液、藥學(xué)緩沖液或其它液體混懸液中(例如,體積為約lnL-約100L)的蛋白質(zhì)濃度任選是,例如每升至少10微克蛋白質(zhì)、每升至少50微克蛋白質(zhì)、每升至少75微克蛋白質(zhì)、每升至少100微克蛋白質(zhì)、每升至少200微克蛋白質(zhì)、每升至少250微克蛋白質(zhì)、每升至少500微克蛋白質(zhì)、每升至少1毫克蛋白質(zhì)或每升至少10毫克蛋白質(zhì)。在細(xì)胞中制備大量(例如,大于采用其它方法如體外翻譯通??赡艿玫降牧?包含至少一個(gè)炔基氨基酸的蛋白質(zhì)是本發(fā)明特征之一。摻入炔基氨基酸可改變蛋白質(zhì)結(jié)構(gòu)和/或功能,如改變大小、酸性、親核性、氫鍵、疏水性、蛋白酶靶位的易接近性、對(duì)某部分的靶向(如用于蛋白陣列)等。含有炔基氨基酸的蛋白質(zhì)的催化或物理特性可得到改善,或者獲得全新的催化或物理特性。例如,可通過(guò)將炔基氨基酸摻入蛋白質(zhì)來(lái)任選改進(jìn)以下特性毒性、生物分布、結(jié)構(gòu)特性、光譜特性、化學(xué)和/或光化學(xué)特性、催化能力、半衰期(例如血清半衰期)、與其它分子相互作用的能力(共價(jià)或非共價(jià)的)等。包含至少含有一個(gè)炔基氨基酸的蛋白質(zhì)的組合物可用作,例如新型治療劑、診斷劑、催化酶、工業(yè)用酶、結(jié)合蛋白(如抗體)以及用于例如研究蛋白質(zhì)結(jié)構(gòu)和功能。參見(jiàn)Dougherty,(2000),"作為蛋白質(zhì)結(jié)構(gòu)和功能探針的非天然氨基酸"C/wMfl/wfl/爿m/wo^c/^tw7Vo6e5/Vc^e/w5Trw由reFw""/ow),CurrentOpinioninChemicalBiology,4:645-652。在本發(fā)明的一方面,組合物包含至少一種含有至少一個(gè),例如至少兩個(gè)、至少三個(gè)、至少四個(gè)、至少五個(gè)、至少六個(gè)、至少七個(gè)、至少八個(gè)、至少九個(gè)或至少十個(gè)或更多非天然氨基酸,如含炔基氨基酸和/或其它非天然氨基酸的蛋白質(zhì)。所述非天然氨基酸可以相同或不同,例如蛋白質(zhì)中可以在l、2、3、4、5、6、7、8、9或10個(gè)或更多不同的位點(diǎn)上含有1、2、3、4、5、6、7、8、9或10個(gè)或更多不同的非天然氨基酸。在另一方面,組合物包含的蛋白質(zhì)中至少一個(gè)但少于全部的具體氨基酸被炔基氨基酸取代。對(duì)于含有一個(gè)以上非天然氨基酸的給定蛋白質(zhì),所述非天然氨基酸可以相同或不同(例如,蛋白質(zhì)可包含兩種或兩種以上不同類型的非天然氨基酸,或者可包含兩個(gè)相同的非天然氨基酸)。對(duì)于含有兩個(gè)以上非天然氨基酸的蛋白質(zhì),所述非天然氨基酸可以相同、不同或是多個(gè)同一類型的非天然氨基酸與至少一個(gè)不同的非天然氨基酸的組合。采用本文組合物和方法可制備基本上任何含炔基氨基酸的蛋白質(zhì)(或其一部分)(與任何相應(yīng)的編碼核酸,例如含有一個(gè)或更多選擇者密碼子的核酸)。未鑒定成百上千的已知蛋白質(zhì),可修飾它們中的任一種使之含有一個(gè)或多個(gè)非天然氨基酸,例如通過(guò)改進(jìn)任何可用的突變方法從而在相關(guān)翻譯系統(tǒng)中包含一個(gè)或多個(gè)合適的選擇者密碼子。已知蛋白質(zhì)的共有序列庫(kù)包括GenBankEMBL、DDBJ和NCBI。通過(guò)檢索internet不難鑒定其它庫(kù)。這些蛋白質(zhì)通常與任何可用的蛋白質(zhì)(例如,治療性蛋白、診斷性蛋白、工業(yè)用酶或其一部分等)有,例如至少60%、至少70%、至少75%、至少80%、至少90%、至少95%或至少99%或更高相同性,同時(shí)這些蛋白質(zhì)含有一個(gè)或多個(gè)非天然氨基酸??山?jīng)修飾包含一個(gè)或多個(gè)炔基氨基酸的治療性、診斷性和其它蛋白質(zhì)的例子見(jiàn),但不限于2004年4月16日提交的名為"擴(kuò)展真核生物遺傳密碼"(ExpandingtheEukaryoticGeneticCode)的國(guó)際公布號(hào)WO2004/094593和名為"非天然氨基酸的體內(nèi)摻入"(INVIVOINCORPORATIONOFUNNATURALAMINOACIDS.)的WO2002/085923??山?jīng)修飾包含一個(gè)或多個(gè)炔基氨基酸的治療性、診斷性和其它蛋白質(zhì)的例子包括但不限于例如a-l抗胰蛋白酶、血管生成抑制素、抗溶血因子(Antihemolyticfactor)、抗體(詳見(jiàn)下文)、載脂蛋白、脫輔蛋白、心房利鈉因子、心房利鈉多肽、心房肽(Atrialpeptides)、C-X-C趨化因子(如T39765、NAP-2、ENA-78、Gro-a、Gro-b、Gro-c、IP-IO、GCP隱2、NAP-4、SDF-1、PF4、MIG)、降鈣素、CC趨化因子(如單核細(xì)胞趨化蛋白-1、單核細(xì)胞趨化蛋白-2、單核細(xì)胞趨化蛋白-3、單核細(xì)胞炎性蛋白-la、單核細(xì)胞炎性蛋白-1J3、RANTES、1309、R83915、R91733、HCCl、T58847、D31065、T64262)、CD40配體、C-kit配體、膠原、集落刺激因子(CSF)、補(bǔ)體因子5a、補(bǔ)體抑制劑、補(bǔ)體受體1、細(xì)胞因子(如,上皮嗜中性活化肽-78(epithelialNeutrophilActivatingPeptide-78)、GROa/MGSA、GROf3、GROy、MIP-la、MIP-1S、MCP-l)、表皮生長(zhǎng)因子(EGF)、促紅細(xì)胞生成素("EPO")、剝落性毒素A和B、因子IX、因子VII、因子VIII、因子X(jué)、成纖維細(xì)胞生長(zhǎng)因子(FGF)、血纖蛋白原、纖連蛋白、G-CSF、GM-CSF、葡糖腦苷脂酶、促性腺激素、生長(zhǎng)因子、Hedgehog蛋白(如Sonic,Indian,Desert)、血紅蛋白、肝細(xì)胞生長(zhǎng)因子(HGF)、水蛭素、人血清白蛋白、胰島素、胰島素樣生長(zhǎng)因子(IGF)、干擾素(如,IFN-a、IFN-P、IFN-力、白介素(如,IL陽(yáng)1、IL陽(yáng)2、IL-3、IL-4、IL隱5、IL-6、IL-7、IL-8、IL-9、IL-IO、IL-ll、IL-12等)、角質(zhì)形成細(xì)胞生長(zhǎng)因子(KGF)、乳鐵蛋白、白血病抑制因子、螢光素酶、神經(jīng)營(yíng)養(yǎng)因子(Neurturin)、嗜中性白細(xì)胞抑制因子(NIF)、抑瘤蛋白M、成骨蛋白、甲狀腺激素、PD-ECSF、PDGF、肽激素(如,人生長(zhǎng)激素)、多效營(yíng)養(yǎng)因子、A蛋白、G蛋白、熱源性外毒素A、B和C、松弛素、腎素、SCF、可溶性補(bǔ)體受體I、可溶性I-CAM1、可溶性白介素受體(IL-l、2、3、4、5、6、7、9、10、11、12、13、14、15)、可溶性TNF受體、生長(zhǎng)調(diào)節(jié)素、促生長(zhǎng)素抑制劑、促生長(zhǎng)素、鏈激酶、超抗原,即葡萄球菌腸毒素(SEA、SEB、SEC1、SEC2、SEC3、SED、SEE)、超氧化物岐化酶(SOD)、中毒性休克綜合征毒素(TSST-l)、胸腺素al、組織纖溶酶原激活物、腫瘤壞死因子(3(TNFP)、腫瘤壞死因子受體(TNFR)、腫瘤壞死因子-a(TNFa)、血管內(nèi)皮生長(zhǎng)因子(VEGEF)、尿激酶和許多其它蛋白??刹捎帽疚乃瞿茉隗w內(nèi)摻入炔基氨基酸的組合物和方法制備的一類蛋白質(zhì)包括轉(zhuǎn)錄調(diào)節(jié)劑或其一部分。示例性轉(zhuǎn)錄調(diào)節(jié)劑包括調(diào)節(jié)細(xì)胞生長(zhǎng)、分化、調(diào)控等的基因和轉(zhuǎn)錄調(diào)節(jié)劑蛋白。轉(zhuǎn)錄調(diào)節(jié)劑存在于原核生物、病毒和真核生物(包括真菌、酵母菌)、昆蟲(chóng)和動(dòng)物(包括哺乳動(dòng)物)中,提供了廣泛的治療靶點(diǎn)。應(yīng)該理解表達(dá)和轉(zhuǎn)錄激活物通過(guò)許多機(jī)理調(diào)控轉(zhuǎn)錄,例如通過(guò)與受體結(jié)合、刺激信號(hào)轉(zhuǎn)導(dǎo)級(jí)聯(lián)反應(yīng)、調(diào)控轉(zhuǎn)錄因子表達(dá)、與啟動(dòng)子和增強(qiáng)子結(jié)合、與結(jié)合啟動(dòng)子和增強(qiáng)子的蛋白質(zhì)結(jié)合、DNA解鏈、前-mRNA剪接、RNA聚腺苷酸化和RNA降解。本發(fā)明的一類蛋白質(zhì)(例如,含有一個(gè)或多個(gè)炔基氨基酸的蛋白質(zhì))包括生物學(xué)活性蛋白,例如細(xì)胞因子,炎性分子,生長(zhǎng)因子,它們的受體和癌癥基因產(chǎn)物,如白介素(如IL-1、IL-2、IL-8等)、干擾素、FGF、IGF-I、IGF-II、FGF、PDGF、TNF、TGF-a、TGF-卩、EGF、KGF、SCF/c-Kit、CD40L/CD40、VLA陽(yáng)4/VCAM陽(yáng)1、ICAM-1/LFA-1和hydurin/CD44;信號(hào)轉(zhuǎn)導(dǎo)分子和相應(yīng)的癌基因產(chǎn)物,例如Mos、Ras、Raf和Met;轉(zhuǎn)錄激活物和抑制劑,例如p53、Tat、Fos、Myc、Jun、Myb、Rel和類固醇激素受體,例如雌激素、孕酮、睪酮、醛甾酮的那些受體,LDL受體配體和皮質(zhì)酮。本發(fā)明也提供含有至少一個(gè)炔基氨基酸的酶(例如工業(yè)用酶)。酶的例子包括但不限于酰胺酶、氨基酸消旋酶、?;D(zhuǎn)移酶、脫鹵酶、雙加氧酶、二芳基丙烷過(guò)氧化物酶(diarylpr叩aneperoxidases).差向異構(gòu)酶、環(huán)氧化物水解酶、酯酶、異構(gòu)酶、激酶、葡糖異構(gòu)酶、糖苷酶、糖基轉(zhuǎn)移酶、鹵素過(guò)氧化物酶(haloperoxidases)、單加氧酶(例如p450)、脂酶、木質(zhì)素過(guò)氧化物酶、腈水合酶、腈水解酶、蛋白酶、磷酸酶、枯草桿菌蛋白酶、轉(zhuǎn)氨酶和核酶。許多這些蛋白質(zhì)可購(gòu)得(參見(jiàn),例如SigmaBiosciences2004目錄和價(jià)目表),相應(yīng)的蛋白質(zhì)序列和基因及其許多變體通常是熟知的(參見(jiàn),例如Genbank)??筛鶕?jù)本發(fā)明通過(guò)插入一個(gè)以上炔基氨基酸來(lái)修飾任何這些蛋白,從而(例如)有助于改變這些蛋白質(zhì)的一種或多種感興趣的治療、診斷或酶活性。治療相關(guān)特性包括血清半衰期、保存半衰期、穩(wěn)定性、免疫原性、治療活性、可檢測(cè)性(例如,通過(guò)在非天然氨基酸如炔基氨基酸上摻入報(bào)告基團(tuán)(如標(biāo)記物或標(biāo)記結(jié)合位點(diǎn)))、LDso或其他負(fù)效應(yīng)的降低、通過(guò)胃腸道進(jìn)入體內(nèi)的能力(如口服利用度)等。診斷特性的例子包括保存半衰期、穩(wěn)定性、診斷活性、可檢測(cè)性等。相關(guān)的酶特性的例子包括保存半衰期、穩(wěn)定性、酶活性、生產(chǎn)能力等。也可采用本發(fā)明方法和組合物修飾各種其它蛋白質(zhì)使之包含一個(gè)或多個(gè)炔基氨基酸。例如,本發(fā)明可包括用炔基氨基酸取代一種或多種疫苗蛋白質(zhì)中的一個(gè)或多個(gè)天然氨基酸,例如以下來(lái)源的蛋白質(zhì)感染性真菌,如曲霉0^/^"http:///"力、假絲酵母(O^A^)種;細(xì)菌,特別是用作病原性細(xì)菌模型的大腸桿菌,以及醫(yī)學(xué)上重要的細(xì)菌,如葡萄球菌屬(&印/zj;/ococcO(如,金黃色葡萄球菌)或鏈球菌屬0S"e;^ococc/)(如,肺炎鏈球菌);原生動(dòng)物,如孢子綱(如,瘧原蟲(chóng)CP/wmoWa))、根足蟲(chóng)(Wz/zopoA)(如,內(nèi)變形蟲(chóng)(五"tomoe^))和鞭毛蟲(chóng)類(錐蟲(chóng)(ro^a"cwoma)、利什曼原蟲(chóng)(Ze/Wmam'")、毛滴蟲(chóng)(7Wc/w附omw)、賈第蟲(chóng)(G,'^YZ/力等);病毒,如(+)RNA病毒(例子包括痘病毒,如痘苗病毒(vacc/m'a);小RNA病毒,如脊髓灰質(zhì)炎病毒(po"o);披膜病毒,如風(fēng)疹病毒0"&/&);熱病毒(Flaviviruses),如HCV;和冠狀病毒)、(-)RNA病毒(如彈狀病毒,如VSV;副粘病毒,如RSV;正粘病毒,如流感病毒;布尼亞病毒和嵌沙樣病毒)、dsDNA病毒(如呼腸孤病毒)、RNA到DNA的病毒,即逆轉(zhuǎn)錄病毒,如HIV和HTLV和某些DNA到RNA的病毒,如乙肝病毒。農(nóng)業(yè)相關(guān)的蛋白也是炔基氨基酸修飾的合適靶位,例如抗蟲(chóng)蛋白(如Cry蛋白)、淀粉和脂質(zhì)產(chǎn)生酶、植物和昆蟲(chóng)毒素、毒素耐受性蛋白、真菌毒素解毒蛋白、植物生長(zhǎng)酶(如核酮糖1,5-二磷酸羧化酶/加氧酶,"RUBISCO")、脂氧合酶(LOX)和磷酸烯醇式丙酮酸(PEP)羧化酶。在某些實(shí)施方案中,本發(fā)明方法和/或組合物中感興趣的蛋白質(zhì)或多肽(或其一部分)由核酸編碼。所述核酸通常含有至少一個(gè)、至少兩個(gè)、至少三個(gè)、至少四個(gè)、至少五個(gè)、至少六個(gè)、至少七個(gè)、至少八個(gè)、至少九個(gè)、十個(gè)或更多選擇者密碼子??刹捎帽绢I(lǐng)域技術(shù)人員熟知和本文在"誘變與其它分子生物學(xué)技術(shù)"中所述的方法誘變編碼感興趣蛋白質(zhì)或多肽的基因,使之含有(例如)一個(gè)或多個(gè)選擇者密碼子來(lái)?yè)饺肴不被?。例如,可誘變感興趣蛋白質(zhì)的核酸,使之含有一個(gè)或多個(gè)選擇者密碼子來(lái)插入一個(gè)或多個(gè)含炔基氨基酸。本發(fā)明包括任何蛋白質(zhì)的這種變體(例如突變體)形式,例如摻入至少一個(gè)炔基氨基酸。類似地,本發(fā)明也包括相應(yīng)的核酸,即任何具有一個(gè)或多個(gè)編碼一個(gè)或多個(gè)炔基氨基酸的選擇者密碼子的核酸。為制備包含炔基氨基酸的蛋白質(zhì),可利用適合于通過(guò)正交tRNA/RS配對(duì)在體內(nèi)摻入炔基氨基酸的宿主細(xì)胞和生物。可用一個(gè)或多個(gè)表達(dá)正交tRNA、正交tRNA合成酶的載體和編碼待衍生蛋白質(zhì)的載體來(lái)遺傳改造(例如轉(zhuǎn)化、轉(zhuǎn)導(dǎo)或轉(zhuǎn)染)宿主細(xì)胞。各組分可以位于同一載體或各位于不同載體,或者可以兩個(gè)組分位于一個(gè)載體而第三組分位于第二載體。載體可以是例如質(zhì)粒、細(xì)菌、病毒、裸多核苷酸或綴合多核苷酸的形式。通過(guò)免疫反應(yīng)性確定多肽因?yàn)楸景l(fā)明多肽提供了多種新的多肽序列(例如,以在本文翻譯系統(tǒng)中合成的蛋白質(zhì)為例,多肽含有炔基氨基酸;或者,以新合成酶為例,則是標(biāo)準(zhǔn)氨基酸的新序列),這些多肽也提供了可在例如免疫學(xué)測(cè)定中識(shí)別的新結(jié)構(gòu)特征。產(chǎn)生能與本發(fā)明多肽特異性結(jié)合的抗血清以及能耐與這種血清結(jié)合的多肽是本發(fā)明的特征之一。本文所用的術(shù)語(yǔ)"抗體"包括但不限于基本上由一個(gè)或多個(gè)免疫球蛋白基因編碼的多肽,或其能特異性結(jié)合并識(shí)別分析物(抗原)的片段。例子包括多克隆、單克隆、嵌合型和單鏈抗體等。本文所用的術(shù)語(yǔ)"抗體"也包括免疫球蛋白片段,包括Fab片段和由表達(dá)文庫(kù)(包括噬菌體文庫(kù))產(chǎn)生的片段??贵w的結(jié)構(gòu)與術(shù)語(yǔ)可參見(jiàn),例如Paul,(1999),《基礎(chǔ)免疫學(xué)》(FundamentalImmunology),第四版,RavenPress,紐約。為產(chǎn)生用于免疫學(xué)測(cè)定的抗血清,可根據(jù)本文所述產(chǎn)生并純化一種或多種免疫原性多肽。例如,可在重組細(xì)胞中產(chǎn)生重組蛋白。釆用標(biāo)準(zhǔn)小鼠免疫方案,用免疫原性蛋白和標(biāo)準(zhǔn)佐劑(如弗氏佐劑)來(lái)免疫小鼠的近交品系(所述測(cè)定中選用此類小鼠是因其實(shí)際遺傳相同性而使實(shí)驗(yàn)結(jié)果重現(xiàn)性較高)(用于測(cè)定特異性免疫反應(yīng)性的抗體產(chǎn)生、免疫學(xué)測(cè)定形式和條件的標(biāo)準(zhǔn)說(shuō)明可參見(jiàn),例如Harlow和Lane,(1988),《抗體,實(shí)驗(yàn)室手冊(cè)》(Antibodies,ALaboratoryManual),ColdSpringHarborPublications,紐約)。蛋白質(zhì)、抗體、抗血清等的其它細(xì)節(jié)可見(jiàn)名為"擴(kuò)展真核生物遺傳密碼"(EXPANDINGTHEEUKARYOTICGENETICCODE)的國(guó)際公布號(hào)WO2004/094593;名為"非天然氨基酸的體內(nèi)摻入"(INVIVOINCORPORATIONOFUNNATURALAMINOACIDS)的WO2002/085923;名為"糖蛋白合成"(GLYCOPROTEINSYNTHESIS)的WO2004/035605和名為"蛋白質(zhì)陣列"(PROTEINARRAYS)的WO2004/058946。O-tRNA、O-RS和O-tRNA/O-RS配對(duì)的應(yīng)用本發(fā)明組合物與本發(fā)明方法制備的組合物可任選包含在細(xì)胞中。然后,宿主系統(tǒng)的翻譯工具可利用本發(fā)明O-tRNA/O-RS配對(duì)或單獨(dú)組分將炔基氨基酸摻入蛋白質(zhì)。Schultz等人名為"非天然氨基酸的體內(nèi)摻入"(INVIVOINCORPORATIONOFUNNATURALAMINOACIDS)的國(guó)際公布號(hào)WO2002/085923描述了該方法,該文獻(xiàn)納入本文作為參考。例如,當(dāng)將O-tRNA/O-RS配對(duì)引入宿主例如大腸桿菌時(shí),該配對(duì)可響應(yīng)于選擇者密碼子,例如琥珀無(wú)義密碼子將可外源性加入生長(zhǎng)培養(yǎng)基的炔基氨基酸體內(nèi)摻入蛋白質(zhì),例如肌紅蛋白測(cè)試蛋白或治療性蛋白。本發(fā)明組合物可任選處于體外翻譯系統(tǒng)或細(xì)胞體內(nèi)系統(tǒng)中。含有炔基氨基酸的蛋白質(zhì)可用于各種領(lǐng)域。最值得注意的是,摻入蛋白質(zhì)的炔基部分可用作各種修飾的靶位,例如與其它蛋白質(zhì)、小分子,如標(biāo)記物或染料和/或生物分子交聯(lián)。利用這些修飾,摻入炔基氨基酸可改善治療性蛋白質(zhì),可用于改變或改善酶的催化功能。在一些方面,在蛋白質(zhì)中摻入炔基氨基酸以及隨后的修飾有助于研究蛋白質(zhì)的結(jié)構(gòu)、與其他蛋白質(zhì)的相互作用等。試齊u盒試劑盒也是本發(fā)明的特征。例如,本發(fā)明提供了用于在細(xì)胞內(nèi)產(chǎn)生含至少一個(gè)炔基氨基酸的蛋白質(zhì)的試劑盒,其中所述試劑盒包括容器,其含有編碼O-tRNA的多核苷酸序列、和/或0-tRNA、和/或編碼O-RS的多核苷酸序列、和/或O-RS。在一個(gè)實(shí)施方案中,試劑盒還包含炔基氨基酸,例如對(duì)炔丙基氧苯丙氨酸。在另一個(gè)實(shí)施方案中,試劑盒還包括關(guān)于制備蛋白的使用說(shuō)明書(shū)。實(shí)施例提供以下實(shí)施例是為了說(shuō)明,而不是為了限制本發(fā)明。本領(lǐng)域技術(shù)人員應(yīng)知道可對(duì)各種非關(guān)鍵性參數(shù)做出修改而不脫離本發(fā)明范圍。實(shí)施例1設(shè)計(jì)開(kāi)發(fā)正交tRNA/合成酶配對(duì)以在大腸桿菌中將炔基氨基酸摻入蛋白質(zhì)通過(guò)設(shè)計(jì)正交tRNA-合成酶配對(duì)的特異性,我們能選擇性且有效地在原核生物和真核生物中響應(yīng)于無(wú)義和移碼密碼子將許多非天然氨基酸摻入蛋白質(zhì)(Anderson等,(2004),淑/.f/.SU/:7566;Alfonta等,(2003),/CAe附.Ac.,"5:14662;Wang等,(2003),TVoc.7Vfl〃.爿cadSc,.".S.A,,56;Chin等,(2003),Sc/e匿,30/:964;Chin等,(2002),尸亂淑/id99:11020;和Wang等,(2001),Sc/e"ce,292:498)。本發(fā)明提供利用大腸桿菌翻譯機(jī)制將含有反應(yīng)性炔基部分的氨基酸生物合成性摻入蛋白質(zhì)的組合物和方法。利用大腸桿菌翻譯組分的生物合成可在體內(nèi)(例如,在大腸桿菌細(xì)胞中)或在體外利用粗制細(xì)胞提取物或純化的翻譯組分進(jìn)行。摻入蛋白質(zhì)的炔基可方便且特異性地與含疊氮基的部分綴合,從而產(chǎn)生蛋白質(zhì)修飾/操作的有用靶位。炔基和疊氮基(圖1B所示)的化學(xué)性質(zhì)與蛋白質(zhì)中所有內(nèi)源性官能團(tuán)的化學(xué)性質(zhì)完全正交。其獨(dú)特的反應(yīng)活性的例子是通過(guò)[3+2]環(huán)加成反應(yīng)可逆地形成三唑(參見(jiàn)圖1B;禾BPadwa,刊于《綜合有機(jī)合成》(Comp"/^"w'veOga"/c5y"Aew》;[Trost,B.M.編],Pergamon:牛津,1991,第四巻,第1069-1109頁(yè);Huisgen,刊于《1,3-兩級(jí)環(huán)加成化學(xué)》(A^D/po/arC>WoafiW/"o"C7zem/Wo0,[Padwa,A.編],Wiley:紐約,1984,第1頁(yè))。當(dāng)室溫,有銅(CuI)存在下在水性介質(zhì)中進(jìn)行時(shí)(對(duì)于修飾生物學(xué)樣品足夠溫和的條件),此反應(yīng)以完全區(qū)域選擇性的方式進(jìn)行(Rostovtsev"a/.(2002",w.C/z亂風(fēng)47:2596),可用于選擇性地修飾引入了炔基和疊氮基官能團(tuán)的蛋白質(zhì)(Deiters等,(2003),JC/zem.Soc.,7Z5:11782;Wang等,(2003),C/ze肌Soc.,3192;Link和Tirrell,(2003),■/^m.Ozem.Soc.,125:11164)。本文所述發(fā)明提供衍生自詹氏甲垸球菌組分的正交tRNA/tRNA-合成酶配對(duì),其能在大腸桿菌宿主系統(tǒng)中選擇性摻入炔基氨基酸對(duì)炔丙基氧苯丙氨酸(縮寫(xiě)為pPRO-Phe;根據(jù)IUPAC命名法也稱為2-氨基-3-[4-(丙-2-炔基氧)苯基]-丙酸;結(jié)構(gòu)如圖1A所示,化學(xué)結(jié)構(gòu)指定為名稱l)。本項(xiàng)研究證實(shí)利用本文提供的新型正交tRNA和tRNA合成酶試劑能將pPRO-Phe選擇性地?fù)饺氪竽c桿菌所表達(dá)的蛋白質(zhì)。本文中,我們報(bào)道了對(duì)衍生自詹氏甲烷球菌酪氨酰tRNA/tRNA-合成酶配對(duì)(MjTyrRS/tRNAoM)的正交tRNA/tRNA-合成酶配對(duì)的設(shè)計(jì),其中所述正交配對(duì)對(duì)任何常見(jiàn)的(即,天然產(chǎn)生的)氨基酸沒(méi)有親和力或親和力非常低。所衍生的正交tRNA合成酶選擇性地將pPRO-Phe加載于琥珀抑制型tRNACUA,該氨酰化的抑制型tRNA(即,"加載的"tRNA)可響應(yīng)于轉(zhuǎn)錄物中遇到的TAG琥珀終止密碼子(選擇者密碼子)而用作內(nèi)源性大腸桿菌翻譯機(jī)器的底物進(jìn)而摻入pPRO-Phe。此tRNA/合成酶配對(duì)的正交性(Steer和Schimmel,(1999),S/o/.C&m.,274:35601)可確保tRNA或合成酶均不與內(nèi)源性大腸桿菌tRNA或合成酶交叉反應(yīng)并且確保只響應(yīng)于琥珀無(wú)義密碼子TAG而遞送非天然氨基酸。通過(guò)誘變野生型詹氏甲垸球菌酪氨酰tRNA合成酶得到約有107個(gè)不同詹氏甲垸球菌酪氨酰tRNA合成酶的文庫(kù)。為制備MjTyrRS文庫(kù),首先將要耙向突變的5個(gè)位置轉(zhuǎn)化為丙氨酸密碼子。MjTyrRS基因在質(zhì)粒pBK-JYRS的大腸桿菌GlnRS啟動(dòng)子和終止子的控制下表達(dá),所述質(zhì)粒是具有卡那霉素抗性的pBR322衍生質(zhì)粒。通過(guò)定點(diǎn)誘變用Ala取代殘基Tyr32、Glu1G7、Asp158、lie159禾口Leu162,從而得到質(zhì)粒pBK-JYA5。在突變位點(diǎn)具有NNK(N=A+T+G+C和K=G+T)的8種寡核苷酸用于Ala5MjTyrRS突變體(pBK-JYA5)的PCR擴(kuò)增并連接回用NdeI-Pstl消化的pBK-JYA5進(jìn)而得到MjTyrRS文庫(kù)。將連接的載體轉(zhuǎn)化入大腸桿菌DH10B感受態(tài)細(xì)胞從而得到1.6X109個(gè)菌落形成單位的文庫(kù)。野生型詹氏甲垸球菌酪氨酰tRNA-合成酶分子的多核苷酸和氨基酸序列如圖2所示,也分別可見(jiàn)SEQIDNO:3和2。根據(jù)嗜熱脂肪芽孢桿菌的同源性酪氨酰tRNA合成酶的晶體結(jié)構(gòu)(可知)誘變由隨機(jī)化的5個(gè)活性位點(diǎn)殘基(Tyr32、Glul07、Aspl58、Ilel59和Leul62)構(gòu)成。誘變后,合成酶庫(kù)經(jīng)多輪正和負(fù)選擇。正選擇以氯霉素乙酰轉(zhuǎn)移酶(CAT)基因中允許(permissive)位點(diǎn)處(Aspl12)琥珀終止密碼子的抑制為基礎(chǔ)。當(dāng)攜帶MjTyrRS突變體文庫(kù)、突變型CAT基因和共表達(dá)的Mj琥珀抑制型tRNACUA的大腸桿菌細(xì)胞在存在pPRO-Phe(1mM)和氯霉素(80ng/mL)的基本培養(yǎng)基中生長(zhǎng)時(shí),只有含能用內(nèi)源性氨基酸或pPRO-Phe氨?;痶RNACUA的突變型合成酶的細(xì)胞能存活。然后將合成酶文庫(kù)基因轉(zhuǎn)化入含有編碼毒性蛋白質(zhì)芽孢桿菌RNA酶的突變基因的細(xì)胞,所述基因在允許位點(diǎn)(Gln2、Asp44、Gly65)具有3個(gè)琥珀突變。攜帶芽孢桿菌RNA酶報(bào)道(基因)的載體也含有抑制型tRNA。這些細(xì)胞缺少pPRO-Phe時(shí)的生長(zhǎng)選擇出能接受內(nèi)源性氨基酸作為底物的合成酶。三輪選擇后,對(duì)96個(gè)克隆對(duì)存在或不存在pPRO-Phe的生長(zhǎng)速率依賴性進(jìn)行了篩選,鑒定并測(cè)序了8個(gè)候選克隆。圖3顯示了在這些分離的克隆中觀察到的氨基酸取代。SEQIDNO:4-19也提供了這8個(gè)克隆的多核苷酸與氨基酸序列。在8個(gè)突變型O-RS克隆中觀察到氨基酸取代的共有趨勢(shì)。在大多數(shù)克隆的結(jié)合袋中發(fā)現(xiàn)以下氨基酸占優(yōu)勢(shì)Ala32、Prol07/Gln107、Alal58、Uel59和Alal62/Prol62。Tyr32—Ala32和Aspl58~>Alal58突變可導(dǎo)致Tyr32、Aspl58和天然底物酪氨酸之間的氫鍵喪失,因此不利于結(jié)合。預(yù)計(jì)小的和大多數(shù)疏水性側(cè)鏈的存在可促進(jìn)pPRO-Phe結(jié)合。在這些克隆之一(pPRO-PheRS-l)中也觀察到另外的Leul10—PhellO突變。選擇合成酶pPRO-PheRS-l進(jìn)行進(jìn)一步特征鑒定。分別在有和沒(méi)有pPRO-Phe存在下,此合成酶賦予大腸桿菌IC5o值分別為110和5pg/mL的氯霉素抗性。有和沒(méi)有pPRO-Phe時(shí)氯霉素抗性的巨大差異提示pPRO-PheRS-l在體內(nèi)對(duì)非天然氨基酸pRPO-Phe基本上特異。實(shí)施例2在大腸桿菌中將炔基氨基酸位點(diǎn)特異地?fù)饺氲鞍踪|(zhì)利用突變型琥珀抑制型tRNACUA和pPRO-PheRS-l正交配對(duì)在大腸桿菌中選擇性地將pPRO-Phe摻入鯨精子肌紅蛋白,該蛋白是153-殘基的含亞鐵血紅素的單體蛋白,其是許多結(jié)構(gòu)、機(jī)理和蛋白質(zhì)折疊研究的焦點(diǎn)(Reedy和Gibney,(2004),C/7e肌iev.,704:617,及其引用的參考文獻(xiàn);Uzawa等,(2004),/Voc.Wa〃.爿cadSc/.!7.S.A,/0/:1171,及其引用的參考文獻(xiàn);Wright和Baldwin,刊于《分子生物學(xué)的新領(lǐng)域蛋白質(zhì)折疊機(jī)理》CFVo"&mMo/ecw/wMec/^m'sms0/尸rWe/"F0W/"g),[Pain,R.編],牛津大學(xué)出版社,倫敦,2000,第309頁(yè))。為制備炔基修飾的肌紅蛋白,將肌紅蛋白開(kāi)放讀框的第四個(gè)密碼子(Ser4)突變?yōu)門(mén)AG(琥珀終止密碼子)并將C-末端6XHis(六組氨酸)標(biāo)簽加入開(kāi)放讀框。為表達(dá)突變型蛋白,將質(zhì)粒pBAD/JYAMB-4TAG(其編碼突變型鯨精子肌紅蛋白基因,其具有阿拉伯糖啟動(dòng)子和rrnB終止子;在lpp啟動(dòng)子和rrnC終止子上的酪氨酰tRNAojA;和四環(huán)素抗性標(biāo)記)與pBK載體(編碼突變型合成酶和卡那霉素抗性基因)共同轉(zhuǎn)化入DH10B大腸桿菌。在補(bǔ)加了四環(huán)素(25mg/L)和卡那霉素(30mg/L)的Luria-Bertani培養(yǎng)基(5mL)中擴(kuò)增細(xì)胞,用磷酸緩沖液洗滌,接種入500ml含有合適的抗生素、pPRO-Phe(1mM)和阿拉伯糖(0.002%)的液體甘油基本培養(yǎng)基中(補(bǔ)加了0.3mM亮氨酸)。細(xì)胞生長(zhǎng)至飽和,然后離心收集。采用Ni-親和層析純化蛋白質(zhì),純化后得到2mg/L的收率,通過(guò)SDS-PAGE/Gelcode②藍(lán)染色(PierceBiotechnology,Inc.)估計(jì)均質(zhì)性為90%。得到突變型肌紅蛋白的總產(chǎn)率約lmg。如圖4泳道1所示,通過(guò)6^(:0(168藍(lán)染色和利用抗-1^56抗體的Western印跡使如此制備的蛋白質(zhì)顯影。在沒(méi)有pPRO-Phe存在下,染色或Western印跡后(利用抗-His6抗體)未觀察到肌紅蛋白,表明所開(kāi)發(fā)的合成酶的高度選擇性(參見(jiàn),圖4,泳道2)。實(shí)施例3通過(guò)質(zhì)譜確認(rèn)在大腸桿菌中炔基氨基酸摻入蛋白質(zhì)為進(jìn)一步證實(shí)摻入突變型肌紅蛋白的琥珀終止密碼子位點(diǎn)的氨基酸身份,對(duì)肌紅蛋白的胰蛋白酶消化物進(jìn)行液相色譜/串聯(lián)質(zhì)譜(檢測(cè))。此實(shí)驗(yàn)中的突變型肌紅蛋白在74位含有工程改造的琥珀終止密碼子。在此位置的pPRO-Phe摻入(pPRO-Phe74)被檢測(cè)為74突變。利用肌紅蛋白-74TAG突變體替代上述Ser4—TAG(琥珀終止密碼子),因?yàn)閷?duì)于LCMS/MS分析而言該突變體具有改善的性能。真細(xì)菌表達(dá)后,采用鎳親和柱純化肌紅蛋白74TAG。通過(guò)SDS-PAGE凝膠的GdC0d浐藍(lán)染色顯影蛋白質(zhì)條帶。從聚丙烯酰胺凝膠上切下對(duì)應(yīng)于突變型肌紅蛋白的凝膠條帶,切成1.5-mm的立方體,并基本上如上所述進(jìn)行胰蛋白酶水解(Shevchenko等,(1996),^"a/.CZzew.,6&850-858)。采用裝配有LCQ離子捕獲質(zhì)譜儀的納米流(nanoflow)反相HPLCESI/MS分析含有非天然氨基酸的胰蛋白酶(水解的)肽。利用裝配有NanosprayHPLC(Agilent1100系列)的FinniganLCQDeca離子捕獲質(zhì)譜儀(ThermoFinnigan)進(jìn)行液相層析串聯(lián)質(zhì)譜(LC-MS/MS)分析。離子捕獲質(zhì)譜儀將含有非天然氨基酸(以¥*表示)的肽HGVTVLTALGY*ILK(SEQIDNO:X)的單電荷和雙電荷離子分離并破碎。此分析的結(jié)果見(jiàn)圖5??汕宄刂付ㄋ槠x子質(zhì)量,從而證實(shí)pPRO-Phe的位點(diǎn)特異性摻入。LCMS/MS運(yùn)作未提示在此位置摻入了任何天然氨基酸,從而證實(shí)所開(kāi)發(fā)合成酶的高度選擇性。實(shí)施例4通過(guò)[3+2環(huán)加成衍生含有炔基氨基酸的蛋白質(zhì)采用[3+2]環(huán)加成反應(yīng)可有效地靶向修飾含有炔基官能團(tuán)的蛋白質(zhì)。本實(shí)施例描述了用兩個(gè)不同的含疊氮基染料分子衍生炔基肌紅蛋白。如實(shí)施例1所述,本實(shí)施例所用的突變型肌紅蛋白在第四密碼子處摻入了pPRO-Phe(Ser"pPRO-Phe4)。如實(shí)施例2所述在大腸桿菌中制備Ser4—pPRO-Phe4肌紅蛋白,然后用分別含有丹磺酰基和熒光素?zé)晒鈭F(tuán)的疊氮基功能化染料2或3(如圖6A和6B所示;也參見(jiàn)Deiters等,(2003),J.顛.C/zem.Soc.,"5:11782;Wang等,(2003),,C/zem.Soc,,"5:3192;Link和Tirrell,(2003),/爿肌C/zem,Soc.,125:11164)衍生。[3+2]環(huán)加成衍生反應(yīng)如圖7A所示。對(duì)于環(huán)加成反應(yīng),向0.1M磷酸緩沖液(pH-8)配制的45pL純化突變型肌紅蛋白(~0.5mg/mL)中加入1pLCuS04(H20配制的50mM儲(chǔ)備液;在最終反應(yīng)體積中是lmM)、2染料2或3(50mM,EtOH配制)、2pL三(l-節(jié)基-1//-[1,2,3]三唑-4-基甲基)胺(DMSO配制的50mM)和1mg銅絲或1pL三(羧基乙基)膦(H20配制的100mM)(作為還原劑)。室溫8小時(shí)或4。C過(guò)夜后,力口入450pLH20,混合物經(jīng)透析膜(IOkDa截?cái)嘀?離心。通過(guò)離心用2X500pL磷酸緩沖液洗滌上清液后,將溶液調(diào)節(jié)至50nL體積。利用銅絲或三(羧乙基)膦(2mM)作為還原劑通常得到類似的標(biāo)記效率。配體三(1-芐基-17/-[1,2,3]三唑-4-基甲基)胺存在或不存在對(duì)這些反應(yīng)的結(jié)果沒(méi)有顯著影響,這與以前的觀察結(jié)果(Wang等,(2003),/CAem.Soc.,"5:3192)相反。然后通過(guò)SDS-PAGE和凝膠內(nèi)成像分析20的熒光標(biāo)記蛋白樣品(Blake,(2001),C紅(9—.尸A麵,/.,7:533;Wouters等,(2001),r腦ACe〃5/o/ogy,//:203;Zacharias等,(2000),Cz^r.Op/".A^wro6Zo/.,416)。利用鷹眼密度計(jì)(EagleEyedensitometer)(Stratagene)對(duì)丹磺?;玖?(Xex=337nm,Xem=506nm)修飾的突變型肌紅蛋白進(jìn)行360±30nm凝膠內(nèi)成像。利用StormPhosphorimager(MolecularDynamics)在450±30nm處觀察熒光素染料3(Xex=495nm,Xem=516nm)的連接情況。此熒光成像的結(jié)果見(jiàn)圖7B。染料2和3均有效地標(biāo)記突變型肌紅蛋白。通過(guò)比較用3標(biāo)記的肌紅蛋白的A28()/A495值(參見(jiàn)Wang等,(2003),敘C/z置Soc.,"5:3192)測(cè)定到標(biāo)記效率約75%。野生型肌紅蛋白與2或3之間未觀察到有反應(yīng),證實(shí)此生物綴合的選擇性(結(jié)果未顯示)。本(實(shí)施例)的內(nèi)容證實(shí)炔基氨基酸,例如對(duì)炔丙基氧苯丙氨酸能有效且選擇性地?fù)饺肷?,例如大腸桿菌的蛋白質(zhì)。然后這些氨基酸可在蛋白質(zhì)內(nèi)化學(xué)耙向以進(jìn)行綴合,例如通過(guò)利用疊氮基部分的[3+2]環(huán)加成,此外,該耙向修飾是高度特異性和區(qū)域選擇性的。能將炔基氨基酸位點(diǎn)特異性地?fù)饺氲鞍踪|(zhì)為需要蛋白質(zhì)綴合或修飾的任何蛋白質(zhì)研究提供了重要工具。實(shí)施例5合成非天然炔基氨基酸對(duì)炔丙基氧苯丙氨酸從可商業(yè)購(gòu)得的W-Boc-酪氨酸經(jīng)三步(參見(jiàn)Deiters等,(2003),丄爿m.C/zem.Soc.,7Z5:11782;Wang等,(2003),丄C/em,Soc.,3192;Link和Tirrell,(2003),/.^m,C/zem.Soc.,125:11164)合成非天然氨基酸對(duì)炔丙基氧苯丙氨酸(縮寫(xiě)為pPRO-Phe;參見(jiàn)圖1A,化合物1),總產(chǎn)率為81%。步驟1將W-叔丁氧基羰基-酪氨酸(2g,7mmol,1當(dāng)量)和K2C03(3g,21mmol,3當(dāng)量)懸浮在無(wú)水DMF(15mL)中。緩慢加入炔丙基溴(2.1mL,21mmol,3當(dāng)量,80%甲苯溶液),反應(yīng)混合物在室溫?cái)嚢?8小時(shí)。加入水(75mL)和Et20(50mL),分層,用EtzO(2X50mL)萃取水相。干燥(MgS04)合并的有機(jī)層,減壓除去溶劑。得到如下所示并命名的黃色油狀產(chǎn)物(4)(2.3g,91%),其無(wú)需進(jìn)一步純化即可用于下一步。2-叔丁氧基羰基氨基-3-[4-(丙-2-炔基氧)苯基]-丙酸炔丙酯(化合物4)(TC將乙酰氯(7mL)小心地加入甲醇(60mL)中得到無(wú)水HC1的5MMeOH溶液。加入上一步的產(chǎn)物(化合物4;2g,5.6mmol),反應(yīng)(體系)攪拌4小時(shí)同時(shí)使之回暖至室溫。減壓除去揮發(fā)性物質(zhì)后得到淡黃色固體(化合物5,結(jié)果和名稱如下所示,1.6g,98%),其直接用于下一步。將上一步的炔丙酯(1.6g,5.5mmol)(5)溶解于2NNaOH(14mL)和MeOH(10mL)的水性混合物中。室溫?cái)嚢?.5小時(shí)后,加入濃鹽酸將pH調(diào)節(jié)至7。加入水(20mL),混合物在4t:維持過(guò)夜。濾去沉淀物,用冰冷的1120洗滌,真空干燥得到白色固體狀的1.23g(90%)pPRO-Phe(l)。!HNMR(400MHz,D20;D20配制的鉀鹽)S7.20(d,/二8.8Hz,2H),6.99(d,/=8.8Hz,2H),4.75(s,2H),3.50(dd,■/=5.6,7.2Hz,1H),2.95(dd,7=5.6,13.6Hz,1H),2.82(dd,J=7.2,13.6Hz,1H);13CNMR(100MHz,D20)3181.3,164.9,155.6,131.4,130.7,115.3,57.3,56.1,39.3;HRMS(CI)m/z220.0969[C12H13N03(M+l)為220.0968]。步驟22-氨基-3-[4-(丙-2-炔基氧)苯基]-丙酸炔丙酯(化合物5)步驟3<formula>formulaseeoriginaldocumentpage73</formula>對(duì)炔丙基氧苯丙氨酸(化合物1)實(shí)施例6合成疊氮基染料2按照以下方案合成疊氮基染料2(參見(jiàn)圖6A;化合物2)。0°C,將3-疊氮基丙胺(371mg,3.71mmol,3當(dāng)量)(按照Carboni等,(1993),Org.Chem.,58:3736-3741合成)加入丹磺酰氯(500mg,1.85mmol,I當(dāng)量)和三乙胺(258^L,1.85mmol,1當(dāng)量)的CH2C12(10mL)溶液中。攪拌1小時(shí)后,反應(yīng)混合物回暖至室溫,再攪拌1小時(shí)。真空除去揮發(fā)性物質(zhì),硅膠層析(Et20/己烷=1:l)純化粗產(chǎn)物得到黃色油狀的2(548mg,89%)。1HNMR(400MHz,CDC13)38.55(d,〉8.4Hz,1H),8.29(d,h8.8Hz,1H),8.23(dd,J=1.2,7.2Hz,1H),7.56-7.49(comp,2H),7.18(d,J=7.6Hz,1H),5.24(brs,1H),3.21(t,J-6.4Hz,2H),2.95(dt,J=6.4Hz,2H),2.89(s,6H),1.62(quin,7=6.4Hz,2H);13CNMR(100MHz,CDC13)S134.3,130.4,129.7,129.4,128.4,123.3,118.8,115.3,48.6,45.4,40.6,28.7(13CNMR光譜中未觀察到季碳原子的所有信號(hào));HRMS(CI)m/z334.1336[C15H20N5O2S(M+l)為334.1332]。o="o疊氮基染料2(化合物2)實(shí)施例7合成疊氮基染料3按照以下方案合成疊氮基染料3(參見(jiàn)圖6B;化合物3)。在室溫將EDCI(83mg,0.43mmol,1當(dāng)量)力卩入熒光胺(fluoresceinamine)(150mg,0.43mmol,1當(dāng)量)和4-(3-疊氮基丙基氨基甲酰基)-丁酸(92mg,0.43,l當(dāng)量)的吡啶(2mL)溶液。(通過(guò)使3-疊氮基丙胺與谷氨酸酐反應(yīng)來(lái)合成4-(3-疊氮基丙基氨基甲酰基)-丁酸)。攪拌懸浮液過(guò)夜,將反應(yīng)混合物倒入1120(15mL)中。通過(guò)加入濃鹽酸酸化(pH<2)。攪拌1小時(shí)后,濾出沉淀物,用1NHCl(3X3mL)洗滌,用少量EtOAc溶解。加入己垸沉淀得到橙色晶體狀的3,收集并真空干燥(200mg,86%)。^NMR(楊MHz,CD3OD)58.65(s,1H),8.15(d,^8.4Hz,1H),7.61-7.51(comp,2H),7.40(d,《/=8.4Hz,1H),7.35(brs,2H),7.22-7.14(comp,2H),6.85-6.56(comp,3H),3.40-3.24(comp,4H),2.54(t,《/=7.2Hz,2H),2.39-2.30(comp,2H),2.10-1.99(comp,2H),1.82-1.72(comp,2H);13CNMR(100MHz,CD3OD)S175.7,174.4,172.4,167.9,160.8,143.0,134.3,132.9'131.8,129.6,124.4,123.3,121.1,118.5103.5,50.2,38.0,37.2,36.2,29.8,22.9;4HRMS(CI)m/z544.1835[C28H25N507(M+l)為544.1827]。實(shí)施例8用于在大腸桿菌中摻入炔基氨基酸的示范性O(shè)-RS和O-tRNA示范性O(shè)-tRNA含有SEQIDNO.:1(參見(jiàn)實(shí)施例9,表4)。示例性O(shè)-RS含有SEQIDNOS:4、6、8、10、12、14、16和18所示的氨基酸序列(參見(jiàn)圖3和實(shí)施例9,表4)。編碼O-RS或其部分的示例性多核苷酸包括編碼含有SEQIDNOS:4、6、8、10、12、14、16和18的氨基酸序列的多核苷酸。例如,SEQIDNOS:5、7、9、11、13、15、17和19所示多核苷酸編碼示范性0-RS。應(yīng)知道本文所述實(shí)施例和實(shí)施方案只是為了說(shuō)明目的,鑒于這些實(shí)施例和實(shí)施方案,本領(lǐng)域技術(shù)人員可作出各種改進(jìn)或改變,這些改進(jìn)或改變應(yīng)屬于本申請(qǐng)的精神和范圍以及附加的權(quán)利要求的范圍內(nèi)。雖然為澄清和理解的目的描述了以上發(fā)明的一些細(xì)節(jié),但本領(lǐng)域技術(shù)人員應(yīng)該明白通過(guò)閱讀本文內(nèi)容可在形式和細(xì)節(jié)中作出各種改進(jìn)而不脫離本發(fā)明的實(shí)際范圍。例如,可以各種組合使用所有上述技術(shù)和設(shè)備。如同各份出版物、專利、專利申請(qǐng)和/或其它文件單獨(dú)表明出于所有目的納入?yún)⒖家粯?,本申?qǐng)引用的所有出版物、專利、專利申請(qǐng)和/或其它文件出于所有目的全文納入?yún)⒖?。疊氮基染料3(化合物3)實(shí)施例9核苷酸和氨基酸序列本實(shí)施例分別提供各種多核苷酸和多肽的核苷酸和氨基酸序列。表4所提供的序列表示只是提供實(shí)例,不應(yīng)理解為本發(fā)明以任何方式局限于表4所提供的序列。表4<table>tableseeoriginaldocumentpage75</column></row><table>SEQIDNO:描述序列野生型詹氏甲烷球菌酪氨酰-tRNA合成酶(MjTyrRS)核苷酸序列ATGGACGAATTTGAAATGATAAAGAGAAACACATCTGAAATTATCAGCGAGGAAGAGTTAAGAGAGGTTTTAAAAAAAGATGAAAAATCTGCTTACATAGGTTTTGAACCAAGTGGTAAAATACATTTAGGGCATTATCTCCAAATAAAAAAGATGATTGATTTACAAAATGCTGGATTTGATATAATTATATTGTTGGCTGATTTACACGCCTATTTAAACCAGAAAGGAGAGTTGGATGAGATTAGAAAAATAGGAGATTATAACAAAAAAGTTTTTGAAGCAATGGGGTTAAAGGCAAAATATGTTTATGGAAGTGAATTCCAGCTTGATAAGGATTATACACTGAATGTCTATAGATTGGCTTTAAAAACTACCTTAAAAAGAGCAAGAAGGAGTATGGAACTTATAGCAAGAGAGGATGAAAATCCAAAGGTTGCTGAAGTTATCTATCCAATAATGCAGGTTAATGATATTCATTATTTAGGCGTTGATGTTGCAGTTGGAGGGATGGAGCAGAGAAAAATACACATGTTAGCAAGGGAGCTTTTACCAAAAAAGGTTGTTTGTATTCACAACCCTGTCTTAACGGGTTTGGATGGAGAAGGAAAGATGAGTTCTTCAAAAGGGAATTTTATAGCTGTTGATGACTCTCCAGAAGAGATTAGGGCTAAGATAAAGAAAGCATACTGCCCAGCTGGAGTTGTTGAAGGAAATCCAATAATGGAGATAGCTAAATACTTCCTTGAATATCCTTTAACCATAAAAAGGCCAGAAAAATTTGGTGGAGATTTGACAGTTAATAGCTATGAGGAGTTAGAGAGTTTATTTAAAAATAAGGAATTGCATCCAATGGATTTAAAAAATGCTGTAGCTGAAGAACTTATAAAGATTTTAGAGCCAATTAGAAAGAGATTA<table>tableseeoriginaldocumentpage77</column></row><table><table>tableseeoriginaldocumentpage78</column></row><table><table>tableseeoriginaldocumentpage79</column></row><table><table>tableseeoriginaldocumentpage80</column></row><table>SEQIDNO:描述序列8pPRO-PheRS-3;衍生自野生型詹氏甲垸球菌酪氨酰-tRNA合成酶,具有以下氨基酸改變的對(duì)炔丙基氧苯丙氨酸氨酰-tRNA合成酶分離物-3的氨基酸序列Tyr32~>Ala32Glul07—Argl07Aspl58—Alal58Leu162—Pro162MDEFEMIKRNTSEIISEEELREVLKKDEKSAAIGFEPSGKIHLGHYLQIKKMIDLQNAGFDIIILLADLHAYLNQKGELDEIRKIGDYNKKVFE雄GLKAKYVYGSRFQLDKDYTLNVYRLALKTTLKRARRSMELIAREDENPKVAEVIYPIMQVNAIHYPGVDVAVGGMEQRKIHMLARELLPKKVVCIHNPVLTGLDGEGKMSSSKGNFIAVDDSPEEIRAKIKKAYCPAGVVEGNPIMEIAKYFLEYPLTIKRPEKFGGDLTVNSYEELESLFKNKELHPMDLK隨AEELIKILEPI證L<table>tableseeoriginaldocumentpage82</column></row><table><table>tableseeoriginaldocumentpage83</column></row><table><table>tableseeoriginaldocumentpage84</column></row><table><table>tableseeoriginaldocumentpage85</column></row><table><table>tableseeoriginaldocumentpage86</column></row><table><table>tableseeoriginaldocumentpage87</column></row><table><table>tableseeoriginaldocumentpage88</column></row><table><table>tableseeoriginaldocumentpage89</column></row><table><table>tableseeoriginaldocumentpage90</column></row><table><table>tableseeoriginaldocumentpage91</column></row><table><table>tableseeoriginaldocumentpage92</column></row><table><table>tableseeoriginaldocumentpage93</column></row><table><table>tableseeoriginaldocumentpage94</column></row><table><table>tableseeoriginaldocumentpage95</column></row><table>權(quán)利要求1.一種含有在細(xì)胞中起作用的第一正交氨酰-tRNA合成酶(O-RS)的真細(xì)菌細(xì)胞,其中所述O-RS用第一非天然氨基酸優(yōu)先氨?;谝徽籺RNA(O-tRNA),所述第一非天然氨基酸是炔基氨基酸。2.如權(quán)利要求l所述的細(xì)胞,其特征在于,所述真細(xì)菌細(xì)胞是大腸桿菌細(xì)胞。3.如權(quán)利要求l所述的細(xì)胞,其特征在于,所述O-RS衍生自詹氏甲烷球菌氨酰-tRNA合成酶。4.如權(quán)利要求l所述的細(xì)胞,其特征在于,所述O-RS衍生自詹氏甲垸球菌酪氨酰-tRNA合成酶。5.如權(quán)利要求1所述的細(xì)胞,其特征在于,所述O-RS衍生自具有SEQIDNO:2所示氨基酸序列的野生型詹氏甲烷球菌酪氨酰-tRNA合成酶。6.如權(quán)利要求1所述的細(xì)胞,其特征在于,所述O-RS衍生自具有SEQIDNO:2所示氨基酸序列的野生型詹氏甲垸球菌酪氨酰-tRNA合成酶,其中所述O-RS具有的氨基酸序列中包含(a)氨基酸32位的丙氨酸;(b)氨基酸107位的脯氨酸或谷氨酰胺;(c)氨基酸158位的丙氨酸;和(d)氨基酸162位的丙氨酸或脯氨酸。7.如權(quán)利要求l所述的細(xì)胞,其特征在于,所述O-RS含有選自SEQIDNO:4、6、8、10、12、14、16、18及其保守性變體的氨基酸序列。8.如權(quán)利要求l所述的細(xì)胞,其特征在于,所述細(xì)胞包含編碼所述O-RS的多核苷酸,其中所述O-RS含有選自SEQIDNO:4、6、8、10、12、14、16、18及其保守性變體的氨基酸序列。9.如權(quán)利要求8所述的細(xì)胞,其特征在于,所述多核苷酸選自SEQIDNO:5、7、9、11、13、15、17或19所示核苷酸序列。10.如權(quán)利要求1所述的細(xì)胞,其特征在于,所述O-tRNA是琥珀抑制型tRNA。11.如權(quán)利要求1所述的細(xì)胞,其特征在于,所述O-tRNA包含SEQIDNO:1所示多核苷酸序列或由其編碼。12.如權(quán)利要求1所述的細(xì)胞,其特征在于,所述炔基氨基酸是對(duì)炔丙基氧苯丙氨酸。13.如權(quán)利要求1所述的細(xì)胞,其特征在于,包含的核酸含有至少一個(gè)選擇者密碼子,其中所述第一O-tRNA識(shí)別所述選擇者密碼子。14.如權(quán)利要求13所述的細(xì)胞,其特征在于,包含第二O-RS和第二O-tRNA,其中所述第二O-RS用第二非天然氨基酸優(yōu)先氨?;龅诙RNA,其中所述第二非天然氨基酸不同于所述第一非天然氨基酸,其中所述第二O-tRNA識(shí)別的選擇者密碼子不同于所述第一O-tRNA所識(shí)別的選擇者密碼子。15.如權(quán)利要求l所述的細(xì)胞,其特征在于,包含所述炔基氨基酸。16.如權(quán)利要求15所述的細(xì)胞,其特征在于,所述炔基氨基酸是對(duì)炔丙基氧苯丙氨酸。17.如權(quán)利要求l所述的細(xì)胞,其特征在于,包含翻譯系統(tǒng)。18.如權(quán)利要求17所述的細(xì)胞,其特征在于,所述翻譯系統(tǒng)包含(a)所述O-RS;(b)所述O-tRNA;(c)編碼感興趣多肽的核酸,所述核酸含有至少一個(gè)選擇者密碼子,其中所述O-tRNA識(shí)別所述選擇者密碼子;(d)炔基氨基酸,其中所述O-RS能用所述炔基氨基酸加載所述O-tRNA。19.一種衍生自SEQIDNO:2所示詹氏甲烷球菌酪氨酰-tRNA合成酶的多肽,其中所述衍生的多肽具有的氨基酸序列中包含(a)氨基酸32位的丙氨酸;(b)氨基酸107位的脯氨酸或谷氨酰胺;(c)氨基酸158位的丙氨酸;和(d)氨基酸162位的丙氨酸或脯氨酸;其中所述多肽是能用炔基氨基酸優(yōu)先氨?;籺RNA(O-tRNA)的氨酰-tRNA合成酶。20.—種含有SEQIDNO:4、6、8、10、12、14、16、18所示氨基酸序列或其保守性變體的多肽。21.如權(quán)利要求20所述的多肽,其特征在于,所述多肽是能用炔基氨基酸優(yōu)先氨酰化真細(xì)菌細(xì)胞內(nèi)的正交tRNA(O-tRNA)的氨酰-tRNA合成酶。22.—種編碼如權(quán)利要求19、20或21所述多肽的多核苷酸。23.如權(quán)利要求22所述的多核苷酸,其特征在于,所述多核苷酸選自SEQIDNO:5、7、9、11、13、15、17和19。24.—種含有如權(quán)利要求22所述多核苷酸的載體。25.如權(quán)利要求24所述的載體,其特征在于,所述載體是表達(dá)載體。26.—種含有如權(quán)利要求24所述載體的細(xì)胞。27.—種在真細(xì)菌細(xì)胞中制備含非天然炔基氨基酸的蛋白質(zhì)的方法,其中所述炔基氨基酸位于特定位置,該方法包括(a)提供真細(xì)菌,其含有(i)正交氨酰-tRNA合成酶(O-RS);(ii)正交tRNA(O-tRNA),其中所述O-RS用所述炔基氨基酸優(yōu)先氨?;鯫-tRNA;(iii)編碼所述蛋白質(zhì)的核酸,其中所述核酸含有至少一個(gè)被O-tRNA識(shí)別的選擇者密碼子;和(iv)炔基氨基酸;和,(b)培養(yǎng)所述細(xì)胞;(C)在蛋白質(zhì)的翻譯期間將所述炔基氨基酸摻入所述核酸編碼的蛋白質(zhì)的所述特定位置,其中所述蛋白質(zhì)的所述特定位置對(duì)應(yīng)于所述核酸中選擇者密碼子的位置,從而產(chǎn)生在所述特定位置含有所述炔基氨基酸的所述蛋白質(zhì)。28.如權(quán)利要求27所述的方法,其特征在于,所述真細(xì)菌細(xì)胞是大腸桿菌細(xì)胞。29.如權(quán)利要求27所述的方法,其特征在于,所述O-RS衍生自詹氏甲烷球菌氨酰-tRNA合成酶。30.如權(quán)利要求27所述的方法,其特征在于,所述O-RS衍生自詹氏甲烷球菌酪氨酰-tRNA合成酶。31.如權(quán)利要求27所述的方法,其特征在于,所述O-RS衍生自SEQIDNO:2所示詹氏甲垸球菌酪氨酰-tRNA合成酶。32.如權(quán)利要求27所述的方法,其特征在于,所述O-RS衍生自SEQIDNO:2所示詹氏甲烷球菌酪氨酰-tRNA合成酶,其中所述O-RS具有的氨基酸序列中包含(a)氨基酸32位的丙氨酸;(b)氨基酸107位的脯氨酸或谷氨酰胺;(c)氨基酸158位的丙氨酸;和(d)氨基酸162位的丙氨酸或脯氨酸。33.如權(quán)利要求27所述的方法,其特征在于,所述0-RS含有選自SEQIDNO:4、6、8、10、12、14、16、18及其保守性變體的氨基酸序列。34.如權(quán)利要求27所述的方法,其特征在于,所述細(xì)胞包含編碼所述O-RS的多核苷酸,其中所述O-RS含有選自SEQIDNO:4、6、8、10、12、14、16、18及其保守性變體的氨基酸序列。35.如權(quán)利要求34所述的方法,其特征在于,所述多核苷酸選自SEQIDNO:5、7、9、11、13、15、17或19所示核苷酸序列。36.如權(quán)利要求27所述的方法,其特征在于,所述O-tRNA是琥珀抑制型tRNA,所述選擇者密碼子是琥珀終止密碼子CTAG)。37.如權(quán)利要求27所述的方法,其特征在于,所述O-tRNA包含SEQIDNO:1所示多核苷酸序列或由其編碼。38.如權(quán)利要求27所述的方法,其特征在于,所述炔基氨基酸是對(duì)炔丙基氧苯丙氨酸。39.如權(quán)利要求27所述的方法,其特征在于,所述蛋白質(zhì)包含的氨基酸序列與野生型治療性蛋白質(zhì)、診斷性蛋白質(zhì)、工業(yè)用酶或其一部分至少有75%相同。40.如權(quán)利要求39所述的方法,其特征在于,所述蛋白質(zhì)與藥學(xué)上可接受的運(yùn)載體結(jié)合。41.如權(quán)利要求27所述的方法,其特征在于,在所述特定位置修飾所述蛋白質(zhì)。42.如權(quán)利要求41所述的方法,其特征在于,所述蛋白質(zhì)在所述特定位置包含三唑鍵。全文摘要本發(fā)明涉及tRNA和氨酰-tRNA合成酶的正交配對(duì),其能將炔基氨基酸(例如對(duì)炔丙基氧苯丙氨酸)摻入真細(xì)菌宿主中(例如大腸桿菌)產(chǎn)生的蛋白質(zhì)。本發(fā)明提供新型正交合成酶、該新型合成酶的鑒定和制備方法、含炔基氨基酸的蛋白質(zhì)的制備方法、以及細(xì)胞翻譯系統(tǒng)。文檔編號(hào)C12N9/22GK101151366SQ200580036361公開(kāi)日2008年3月26日申請(qǐng)日期2005年9月20日優(yōu)先權(quán)日2004年9月21日發(fā)明者A·戴特斯,P·舒爾茨申請(qǐng)人:斯克利普斯研究院