本申請是國際申請pct/2006/025572,國際申請日2006年6月29日,中國國家階段申請?zhí)?00680024666.4的發(fā)明專利申請的分案申請。
交叉參考
本申請要求2005年7月5日提交的美國臨時專利申請60/697,067的優(yōu)先權(quán),將該申請的全文納入本文作參考。
本發(fā)明涉及類異戊烯(isoprenoid)化合物生產(chǎn)領(lǐng)域,具體是修飾類異戊烯化合物的酶。
背景技術(shù):
類異戊烯構(gòu)成了極大并且多樣的一類天然產(chǎn)物,它們具有相同的生物合成來源,即一種代謝前體二磷酸異戊-1-烯酯(isopentenyldiphosphate,ipp)。已經(jīng)描述了至少20,000種類異戊烯。由定義可以看出,類異戊烯由所謂的異戊烯(isoprene)(c5)單元組成。類異戊烯中存在的c原子的數(shù)量一般可被5除盡(c5、c10、c15、c20、c25、c30和c40),但也報道了不規(guī)則的類異戊烯和多萜。類異戊烯化合物也稱為“萜”或“類萜”。類異戊烯的重要成員包括類胡蘿卜素、倍半萜類、雙萜類和半萜。類胡蘿卜素包括例如:番茄紅素,β-胡蘿卜素等許多用作抗氧化劑的物質(zhì)。倍半萜類包括例如:一種具有抗瘧活性的化合物青蒿素。雙萜類包括例如:一種癌癥化療藥紫杉醇。
類異戊烯包括許多結(jié)構(gòu)各異的天然產(chǎn)物家族。在這個家族中,分離自植物和其它天然來源的萜類化合物用作商業(yè)性調(diào)味劑和香料化合物,以及藥物化合物如抗瘧藥、抗病毒藥和抗癌藥。目前使用的大多數(shù)萜類化合物是天然產(chǎn)物或其衍生物。許多這些天然產(chǎn)物的來源生物體(如樹、海洋無脊椎動物)既不適合生產(chǎn)商業(yè)上可行量所需的大規(guī)模培育,也不適合遺傳操作以提高這些化合物的產(chǎn)量或衍生這些化合物。因此,必須由類似物半合成地產(chǎn)生,或用常規(guī)化學(xué)合成方法合成這些天然產(chǎn)物。而且,許多天然產(chǎn)物具有復(fù)雜結(jié)構(gòu),因此,目前合成這些天然產(chǎn)物不具經(jīng)濟性或不可能合成。這些天然產(chǎn)物必須由天然來源如樹、海綿、珊瑚和海洋微生物提??;或由較豐富的前體合成或半合成地產(chǎn)生。由天然來源提取天然產(chǎn)物受限于天然來源的可用性;合成或半合成地生產(chǎn)天然產(chǎn)物可能遇到低產(chǎn)率和/或高成本的困擾。這些生產(chǎn)問題和天然來源的局限性可限制這種產(chǎn)物的商業(yè)和臨床開發(fā)。
倍半萜化合物的一個重要例子是青蒿素。青蒿素是非常有效的抗瘧藥,目前提取自植物(黃花蒿(artemisiaannua)),用于聯(lián)合治療藥物療法。植物衍生的青蒿素昂貴,并且其可獲得性收到栽培這種植物的國家的天氣和政治環(huán)境的影響。青蒿酸(artemisinicacid)是青蒿素生物合成中的關(guān)鍵中間體。通過傳統(tǒng)化學(xué)方法將紫穗槐-4,11-二烯轉(zhuǎn)化為青蒿醇是青蒿素制備中的重要步驟,該步驟難以進行并且成本高。
本領(lǐng)域需要能避免一部分上述缺點的產(chǎn)生類異戊烯化合物的方法。本發(fā)明通過提供編碼修飾類異戊烯化合物的酶的多核苷酸和經(jīng)遺傳修飾能生產(chǎn)這種酶的宿主細(xì)胞滿足了這種需求。
文獻(xiàn)
bertea等(2005)plantamed.71:40-47;dekraker等(2003)tetradedron59:409-418;martin等(2003)nat.biotechnol.21:796-802;wo03/025193;美國專利公開號20050019882;美國專利公開號20030148479;美國專利公開號20040005678;美國專利公開號20030166255。
技術(shù)實現(xiàn)要素:
本發(fā)明提供了包含編碼類異戊烯修飾酶的核苷酸序列的分離核酸,以及含有該核酸的重組載體。本發(fā)明還提供了包含本發(fā)明核酸或重組載體的遺傳修飾的宿主細(xì)胞。本發(fā)明還提供了包含本發(fā)明核酸的轉(zhuǎn)基因植物。本發(fā)明還提供了生產(chǎn)類異戊烯化合物的方法,所述方法通常包括在能夠合成本發(fā)明核酸編碼的酶的條件下培養(yǎng)本發(fā)明遺傳修飾的宿主細(xì)胞,該酶能修飾類異戊烯化合物。
附圖說明
圖1描述了cyp71d-a4cdna編碼序列的核苷酸序列(seqidno:1)。
圖2描述了紫穗槐二烯12-氧化酶氨基酸序列(seqidno:2)。
圖3描述了黃花蒿細(xì)胞色素p450還原酶cdna編碼區(qū)的核苷酸序列(seqidno:3)。
圖4描述了黃花蒿細(xì)胞色素p450還原酶氨基酸序列(seqidno:4)。
圖5a-c描述了體內(nèi)底物進料實驗的結(jié)果。
圖6a和6b描述了由gc-ms進行產(chǎn)物驗證。
圖7a-c描述了在酵母中從頭生產(chǎn)青蒿酸。
圖8a-c描述了體外紫穗槐二烯氧化酶實驗。
圖9描述了編碼類異戊烯修飾酶的cdna的核苷酸序列(克隆71d-b1)(seqidno:5)。
圖10描述了類異戊烯修飾酶的氨基酸序列(71d-b1;seqidno:6)。
圖11a-c描述了酶71d-b1的羥基化活性。
圖12描述了編碼類異戊烯修飾酶的基因組dna的核苷酸序列(seqidno:7)。
圖13是類異戊烯代謝途徑的示意圖,該代謝途徑由二磷酸異戊-1-烯酯(ipp)和二磷酸二甲基烯丙酯(dmapp)生產(chǎn)類異戊烯生物合成途徑中間體二磷酸多異戊烯酯(polyprenyldiphosphate)、二磷酸牻牛兒基酯(gpp)、二磷酸法呢酯(fpp)和二磷酸牻牛兒基牻牛兒基酯(ggppp)。
圖14是產(chǎn)生ipp的甲羥戊酸(mev)途徑的示意圖。
圖15是用于產(chǎn)生ipp和焦磷酸二甲基烯丙酯(dmapp)的dxp途徑的示意圖。
具體實施方式
定義
術(shù)語“類異戊烯”、“類異戊烯化合物”、“萜”、“萜化合物”、“類萜”和“類萜化合物”可互換使用。類異戊烯化合物由不同數(shù)量的所謂的異戊烯(c5)單位組成。類異戊烯中存在的碳原子數(shù)目一般可被5整除(如c5、c10、c15、c20、c25、c30和c40)。曾報道過不規(guī)則的類異戊烯和多萜,它們也包括在“類異戊烯”的定義中。類異戊烯化合物包括但不限于:單萜、倍半萜、三萜、多萜和二萜。
本文所用術(shù)語“二磷酸異戊烯酯(prenyldiphosphate)”與“焦磷酸異戊烯酯(prenylpyrophosphate)”可互換使用,包括含有一個異戊烯基的二磷酸單異戊烯酯(如ipp和dmapp),以及含有兩個或多個異戊烯基的二磷酸多異戊烯酯。二磷酸單異戊烯酯包括焦磷酸異戊-1-烯酯(ipp)和其異構(gòu)體焦磷酸二甲基烯丙酯(dmapp)。
本文所用術(shù)語“萜合酶”指能酶學(xué)修飾ipp、dmapp或焦磷酸多異戊烯酯,以便產(chǎn)生萜類化合物的任何酶。術(shù)語“萜合酶”包括能催化二磷酸異戊烯酯轉(zhuǎn)化為類異戊烯的酶。
在本文中,術(shù)語“焦磷酸”可與“二磷酸”互換使用。因此,例如,術(shù)語“二磷酸異戊烯酯”和“焦磷酸異戊烯酯”可互換;術(shù)語“焦磷酸異戊-1-烯酯”和“二磷酸異戊-1-烯酯”可互換;術(shù)語“二磷酸法呢酯”和“焦磷酸法呢酯”可互換;等等。
本文所用術(shù)語“甲羥戊酸途徑”或“mev途徑”指將乙酰-coa轉(zhuǎn)變?yōu)閕pp的生物合成途徑。甲羥戊酸途徑包括催化以下步驟的酶:(a)使兩個乙酰-coa分子縮合成乙酰乙酰coa;(b)使乙酰乙酰coa與乙酰coa縮合形成hmg-coa;(c)將hmg-coa轉(zhuǎn)化為甲羥戊酸;(d)將甲羥戊酸磷酸化為甲羥戊酸5-磷酸;(e)將甲羥戊酸5-磷酸轉(zhuǎn)化為甲羥戊酸5-焦磷酸;和(f)將甲羥戊酸5-焦磷酸轉(zhuǎn)化為焦磷酸異戊-1-烯酯。圖14示意性說明了甲羥戊酸途徑。甲羥戊酸途徑的“上半部分”指負(fù)責(zé)通過mev途徑中間體將乙酰-coa轉(zhuǎn)變?yōu)榧琢u戊酸的酶。
本文所用術(shù)語“1-脫氧-d-木酮糖5-二磷酸途徑”或“dxp途徑”指通過dxp途徑中間體將甘油醛-3-磷酸和丙酮酸轉(zhuǎn)變?yōu)閕pp和dmapp的途徑,其中dxp途徑包括催化圖15示意性說明的反應(yīng)的酶。
本文所用術(shù)語“異戊烯基轉(zhuǎn)移酶”與術(shù)語“二磷酸異戊烯酯合酶”和“多異戊烯基合酶”(如“gpp合酶”、“fpp合酶”、“opp合酶”等)可互換使用,指能催化二磷酸異戊-1-烯酯與烯丙基初始底物(primersubstrate)的連續(xù)1’-4縮合,導(dǎo)致形成各種鏈長度的二磷酸異戊烯酯的酶。
術(shù)語“多核苷酸”和“核酸”在本文中可互換使用,指聚合形式的任何長度的核苷酸,包括核糖核苷酸或脫氧核苷酸。因此,該術(shù)語包括但不限于:單鏈、雙鏈或多鏈dna或rna,基因組dna,cdna,dna-rna雜交體,或含有嘌呤和嘧啶堿基或其它天然的、化學(xué)或生化修飾的非天然的、或衍生的核苷酸堿基的聚合物。
術(shù)語“肽”、“多肽”和“蛋白質(zhì)”在本文中可互換使用,指聚合形式的任何長度的氨基酸,可包括編碼和非編碼的氨基酸,化學(xué)或生化修飾或衍生的氨基酸,以及含有修飾的肽主鏈的多肽。
本文所用術(shù)語“天然產(chǎn)生”可應(yīng)用于核酸、細(xì)胞或生物體,指在天然情況下發(fā)現(xiàn)的核酸、細(xì)胞或生物體。例如,可由天然來源分離并且未經(jīng)實驗室人員有意修飾的生物體(包括病毒)中存在的多肽或多核苷酸序列是天然產(chǎn)生的。
本文所用術(shù)語“分離”指與多核苷酸、多肽或細(xì)胞天然存在環(huán)境不同的環(huán)境中的多核苷酸、多肽或細(xì)胞。分離的遺傳修飾的宿主細(xì)胞可存在于遺傳修飾的宿主細(xì)胞的混合群體中。
本文所用術(shù)語“外源性核酸”指通?;蛱烊磺闆r下沒有在給定的天然細(xì)菌、生物體或細(xì)胞中發(fā)現(xiàn)和/或產(chǎn)生的核酸。本文所用術(shù)語“內(nèi)源性核酸”指通常在給定的天然細(xì)菌、生物體或細(xì)胞中發(fā)現(xiàn)和/或產(chǎn)生的核酸?!皟?nèi)源性核酸”也稱為“天然核酸”或?qū)τ诮o定的細(xì)菌、生物體或細(xì)胞“天然”的核酸。例如,編碼hmgs、甲羥戊酸激酶和磷酸甲羥戊酸激酶的核酸代表大腸桿菌(e.coli)的外源性核酸??捎舍劸平湍?sacchromycescerevisiae)克隆這些甲羥戊酸途徑核酸。在釀酒酵母中,染色體上編碼hmgs、mk和pmk的基因序列為“內(nèi)源性”核酸。
本文所用術(shù)語“異源核酸”指至少滿足以下一種條件的核酸:(a)核酸是給定的宿主微生物或宿主細(xì)胞以外的(“外源性”)(即不是天然發(fā)現(xiàn)的);(b)核酸包含在給定宿主微生物或宿主細(xì)胞中天然發(fā)現(xiàn)的(如“內(nèi)源性”)核苷酸序列(如核酸包含宿主微生物或宿主細(xì)胞內(nèi)源性核苷酸序列),但該核酸在細(xì)胞中的產(chǎn)量是非天然量(如大于預(yù)期產(chǎn)量或大于天然情況下的產(chǎn)量);或者該核酸的序列與內(nèi)源性核苷酸序列不同,以致在細(xì)胞中產(chǎn)生非天然量(如大于預(yù)期產(chǎn)量或大于天然情況下的產(chǎn)量)的內(nèi)源發(fā)現(xiàn)的同一編碼蛋白(氨基酸序列相同或基本相同);(c)核酸包含在天然情況下相互關(guān)系不同的兩種或多種核苷酸序列或節(jié)段,如核酸是重組核酸。
本文所用術(shù)語“重組”指具體核酸(dna或rna)是克隆、限制性酶切和/或連接步驟的各種組合的產(chǎn)物,這些組合產(chǎn)生具有可與天然系統(tǒng)中發(fā)現(xiàn)的內(nèi)源性核酸區(qū)別開的結(jié)構(gòu)性編碼或非編碼序列的構(gòu)建物。通常,編碼結(jié)構(gòu)性編碼序列的dna序列可由cdna片段和短寡核苷酸接頭、或由一系列合成寡核苷酸組裝,以提供能夠由細(xì)胞或無細(xì)胞轉(zhuǎn)錄和翻譯系統(tǒng)所含的重組轉(zhuǎn)錄單元表達(dá)的合成核酸??梢圆槐粌?nèi)部非翻譯序列或內(nèi)含子(一般存在于真核基因中)中斷的開放閱讀框的形式提供這種序列。包含相關(guān)序列的基因組dna也可用于形成重組基因或轉(zhuǎn)錄單元。非翻譯dna序列可以存在于開放閱讀框的5’或3’端,這些序列不干擾編碼區(qū)的操作或表達(dá),并且實際上可用于以各種機制調(diào)節(jié)所需產(chǎn)物的產(chǎn)生(參見下面的“dna調(diào)控序列”)。
因此,例如,術(shù)語“重組”多核苷酸或核酸指不是天然產(chǎn)生的,例如通過人類介入人工組合兩種分離的序列節(jié)段制備的多核苷酸或核酸。常常通過化學(xué)合成方法或通過人工操作分離的核酸節(jié)段(如遺傳工程技術(shù))實現(xiàn)此人工組合。通常這樣做是為了用編碼相同或保守性氨基酸的冗余密碼子取代密碼子,一般引入或去除序列識別位點?;蛘?,進行該方法以連接具有所需功能的核酸節(jié)段,產(chǎn)生所需的功能組合。常常通過化學(xué)合成方法或通過人工操作分離的核酸節(jié)段(如遺傳工程技術(shù))實現(xiàn)此人工組合。
“構(gòu)建物”指重組核酸,通常是重組dna,產(chǎn)生重組dna的目的是表達(dá)特定的核苷酸序列,或用其構(gòu)建其它重組核苷酸序列。
本文所用術(shù)語“操縱子”和“單轉(zhuǎn)錄單元”可互換使用,指受一個或多個控制元件(如啟動子)協(xié)同調(diào)節(jié)的兩個或多個毗連編碼區(qū)(編碼基因產(chǎn)物如rna或蛋白質(zhì)的核苷酸序列)。本文所用術(shù)語“基因產(chǎn)物”指dna編碼的rna(反之亦然)或者rna或dna編碼的蛋白質(zhì),其中基因一般包含編碼蛋白質(zhì)的一種或多種核苷酸序列,也可包括內(nèi)含子和其它非編碼核苷酸序列。
本文中術(shù)語“dna調(diào)控序列”、“控制元件”和“調(diào)控元件”可互換使用,指轉(zhuǎn)錄或翻譯控制序列,如啟動子、增強子、聚腺苷酸化信號、終止子、蛋白降解信號等,它們提供和/或調(diào)控宿主細(xì)胞中編碼序列的表達(dá)和/或編碼多肽的產(chǎn)生。
本文中術(shù)語“轉(zhuǎn)化”與“遺傳修飾”可互換使用,指引入新核酸(即細(xì)胞外源性dna)后永久或瞬時誘導(dǎo)的細(xì)胞遺傳改變??赏ㄟ^將新dna摻入宿主細(xì)胞基因組,或通過將新dna瞬時或穩(wěn)定地維持為外遺元件實現(xiàn)遺傳改變(“修飾”)。當(dāng)細(xì)胞是真核細(xì)胞時,通常通過將dna引入細(xì)胞基因組實現(xiàn)永久遺傳改變。在原核細(xì)胞中,可將永久改變引入染色體或通過染色體外元件如質(zhì)粒和表達(dá)載體引入,染色體外元件可包含一個或多個可選擇標(biāo)記以幫助將它們維持在重組宿主細(xì)胞中。遺傳修飾的合適方法包括病毒感染、轉(zhuǎn)染、接合、原生質(zhì)體融合、電穿孔、基因槍技術(shù)、磷酸鈣沉淀、直接顯微注射等。對方法的選擇通常取決于待轉(zhuǎn)化的細(xì)胞類型和發(fā)生轉(zhuǎn)化的環(huán)境(即體外、離體或體內(nèi))。對這些方法的總體討論可參見ausubel等,shortprotocolsinmolecularbiology(分子生物學(xué)簡單方法),第3版,維森出版集團(wileyandsons),1995。
“操作性連接”指并列,其中所述組件的相互關(guān)系允許它們以所需方式起作用。例如,如果啟動子影響某編碼序列轉(zhuǎn)錄或表達(dá),那么該啟動子操作性連接于該編碼序列。本文所用術(shù)語“異源啟動子”和“異源控制區(qū)”指正常情況下不與天然具體核酸相連的啟動子和其它控制區(qū)。例如,“與編碼區(qū)異源的轉(zhuǎn)錄控制區(qū)”是正常情況下不與天然編碼區(qū)相連的轉(zhuǎn)錄控制區(qū)。
本文所用“宿主細(xì)胞”指體內(nèi)或體外真核細(xì)胞、原核細(xì)胞或來自多細(xì)胞生物體(如細(xì)胞系)但培養(yǎng)為單細(xì)胞實體的細(xì)胞,其中真核或原核細(xì)胞可用作或已用作核酸受體(如包含編碼一種或多種生物合成途徑基因產(chǎn)物如甲羥戊酸途徑基因產(chǎn)物的核苷酸序列的表達(dá)載體),它包括已用核酸遺傳修飾的原始細(xì)胞的后代。應(yīng)理解,單個細(xì)胞的后代不一定與原始親本的形態(tài)或基因組dna或整套dna完全相同,因為有天然、偶然或有意突變?!爸亟M宿主細(xì)胞”(也稱為“遺傳修飾的宿主細(xì)胞”)是引入了異源核酸如表達(dá)載體的宿主細(xì)胞。例如,由于將異源核酸引入合適的原核宿主細(xì)胞,所述原核宿主細(xì)胞是遺傳修飾的原核宿主細(xì)胞(如細(xì)菌),其中所述異源核酸是例如該原核宿主細(xì)胞以外(天然情況下未發(fā)現(xiàn))的外源性核酸,或通常未在該原核宿主細(xì)胞中發(fā)現(xiàn)的重組核酸;由于將異源核酸引入了合適的真核宿主細(xì)胞,所述真核宿主細(xì)胞是遺傳修飾的真核宿主細(xì)胞,其中異源核酸例如該真核宿主細(xì)胞以外的外源性核酸或通常未在該真核宿主細(xì)胞中發(fā)現(xiàn)的重組核酸。
當(dāng)在溫度和溶液離子強度合適的條件下,核酸的單鏈形式可退火于另一核酸時,該核酸與另一核酸(如cdna、基因組dna或rna)“可雜交”。雜交和洗滌條件是熟知的,參見例如sambrook,j.,fritsch,e.f.和maniatis,t.《分子克?。簩嶒炇沂謨浴?molecularcloning:alaboratorymanual),第二版,冷泉港實驗室出版社(coldspringharborlaboratorypress),冷泉港(1989),特別是其中第11章和表11.1;和sambrook,j.和russell,w.,《分子克?。簩嶒炇沂謨浴?molecularcloning:alaboratorymanual),第三版,冷泉港實驗室出版社,冷泉港(2001)。溫度和離子強度條件決定了雜交的“嚴(yán)謹(jǐn)性”??烧{(diào)節(jié)嚴(yán)謹(jǐn)性條件以篩選中等類似的片段如相關(guān)性較少的生物體的同源序列,至高度相似的片段如復(fù)制密切相關(guān)生物體的功能酶的基因。雜交條件和雜交后洗滌可用于獲得所需的雜交決定性嚴(yán)謹(jǐn)條件。一組說明性雜交后洗滌是一系列洗滌,開始是6×ssc(ssc是0.15mnacl和15mm檸檬酸鹽緩沖液),0.5%sds,室溫下15分鐘,然后用2×ssc,0.5%sds,45℃重復(fù)洗滌30分鐘,然后用0.2×ssc,0.5%sds,50℃洗滌30分鐘,重復(fù)兩次。用較高溫度獲得其它嚴(yán)謹(jǐn)條件,其中洗滌與上述洗滌相同,除了最后兩次用0.2×ssc,0.5%sds洗滌30分鐘的溫度提高到60℃。另一組高度嚴(yán)謹(jǐn)條件最后兩次洗滌采用0.1×ssc,0.1%sds,65℃。嚴(yán)謹(jǐn)雜交條件的另一個例子是在50℃或更高溫度下和0.1×ssc(15mm氯化鈉/1.5mm檸檬酸鈉)中雜交。嚴(yán)謹(jǐn)雜交條件的另一個例子是在溶液中42℃孵育過夜,所用溶液是:50%甲酰胺、5×ssc(150mmnacl、15mm檸檬酸三鈉)、50mm磷酸鈉(ph7.6)、5×denhardt溶液、10%硫酸葡聚糖和20μg/ml變性剪切的鮭精dna,然后用0.1×ssc在約65℃洗滌濾器。嚴(yán)謹(jǐn)雜交條件和雜交后洗滌條件是至少與上述代表性條件同樣嚴(yán)謹(jǐn)?shù)碾s交條件和雜交后洗滌條件。
雜交需要兩種核酸含有互補序列,但根據(jù)雜交的嚴(yán)謹(jǐn)性,可能有堿基錯配。核酸雜交的合適嚴(yán)謹(jǐn)性取決于核酸長度和互補程度,它們是本領(lǐng)域熟知的變量。兩個核苷酸序列之間的相似性或同源性程度越大,具有這些序列的核酸雜交體的解鏈溫度(tm)越高。核酸雜交的相對穩(wěn)定性(對應(yīng)于較高tm)按以下順序依次降低:rna:rna、dna:rna、dna:dna。對于長度大于100個核苷酸的雜交體,產(chǎn)生了計算tm的等式(參見sambrook等,同上,9.50-9.51)。對于較短核酸即寡核苷酸的雜交,錯配位置變得更重要,寡核苷酸的長度決定其特異性(參見sambrook等,同上,11.7-11.8)。一般地,可雜交核酸的長度至少約為10個核苷酸??呻s交核酸的示范性最小長度為:至少約15個核苷酸;至少約20個核苷酸;至少約30個核苷酸。而且,本領(lǐng)域技術(shù)人員知道,可根據(jù)諸如探針長度等因素調(diào)節(jié)溫度和洗滌溶液鹽濃度。
術(shù)語“保守性氨基酸取代”指蛋白質(zhì)中具有相似側(cè)鏈的氨基酸殘基可互換。例如,具有脂族側(cè)鏈的一組氨基酸由甘氨酸、丙氨酸、纈氨酸、亮氨酸和異亮氨酸組成;具有脂族-羥基側(cè)鏈的一組氨基酸由絲氨酸和蘇氨酸組成;具有含酰胺側(cè)鏈的一組氨基酸由天冬酰胺和谷胺酰胺組成;具有芳族側(cè)鏈的一組氨基酸由苯丙氨酸、酪氨酸和色氨酸組成;具有堿性側(cè)鏈的一組氨基酸由賴氨酸、精氨酸和組氨酸組成;具有含硫側(cè)鏈的一組氨基酸由半胱氨酸和甲硫氨酸組成。示范性保守性氨基酸取代基是:纈氨酸-亮氨酸-異亮氨酸、苯丙氨酸-酪氨酸、賴氨酸-精氨酸、丙氨酸-纈氨酸和天冬酰胺-谷胺酰胺。
“合成核酸”可由用本領(lǐng)域技術(shù)人員已知的方法化學(xué)合成的寡核苷酸結(jié)構(gòu)塊(buildingblock)組裝。連接和退火這些結(jié)構(gòu)塊,以形成基因節(jié)段,之后用酶組裝這些節(jié)段構(gòu)建整個基因。提到dna序列時,“化學(xué)合成”指其組成氨基酸是在體外組裝的??梢杂靡呀?jīng)建立的方法手工化學(xué)合成dna,或可用許多市售機器之一自動化學(xué)合成dna??尚揎椇怂岬暮塑账嵝蛄?,以根據(jù)優(yōu)化核苷酸序列以反映宿主細(xì)胞的密碼子偏倚性(的原則)優(yōu)化表達(dá)。本領(lǐng)域技術(shù)人員應(yīng)理解,如果密碼子使用偏向于適合宿主的密碼子,就能提高成功表達(dá)的可能性??筛鶕?jù)對獲自可獲得序列信息的宿主細(xì)胞的基因研究,確定優(yōu)選密碼子。
多核苷酸或多肽與另一種多核苷酸或多肽具有某百分?jǐn)?shù)的“序列相同性”是指,當(dāng)比對時,此百分?jǐn)?shù)的堿基或氨基酸相同,以及在比較兩個序列時,此百分?jǐn)?shù)的堿基或氨基酸在相同的相對位置中??捎迷S多不同方式測定序列相似性。為了測定序列相同性,可用方法和計算機程序比對序列,計算機程序包括可由因特網(wǎng)址ncbi.nlm.nih.gov/blast獲得的blast。參見例如,altschul等(1990),j.mol.biol.215:403-10。另一種比對算法是fasta,可從美國威斯康星州麥迪遜的遺傳學(xué)計算組(gcg)包(牛津分子集團公司(oxfordmoleculargroup,inc.)的全資子公司)獲得。其它比對技術(shù)參見《酶學(xué)方法》(methodsinenzymology),第266卷:大分子序列分析的計算機方法(computermethodsformacromolecularsequenceanalysis)(1996),doolittle編,學(xué)術(shù)出版社公司(academicpress,inc.),哈布公司(harcourtbrace&co.)的分公司,美國加利福尼亞州圣地亞哥。尤其感興趣的是允許序列有缺口的比對程序。smith-waterman是允許序列比對中有缺口的一種算法類型。參見meth.mol.biol.70:173-187(1997)。同時,采用needleman&wunsch比對法的gap程序可用于比對序列。參見j.mol.biol.48:443-453(1970)。
在進一步描述本發(fā)明之前,應(yīng)理解,本發(fā)明不僅限于所述的具體實施方式,當(dāng)然它們也可以改變。也應(yīng)理解,本文所用術(shù)語僅僅為了描述具體實施方式,不旨在限制,因此,本發(fā)明范圍僅受所附權(quán)利要求書的限制。
當(dāng)提供值的范圍時,應(yīng)理解,本發(fā)明包括該范圍上下限之間以下限單位十分之一為間隔的各居中值(除非文中明確指出不是這樣)以及任何其它指出值或指出范圍中的居中值。這些較小范圍的上下限可獨立地包括在較小范圍內(nèi),并且也屬于本發(fā)明,還可在指出范圍中特別排除限值。當(dāng)所述范圍包括一個或兩個限值時,本發(fā)明也包括排除一個或兩個限值的范圍。
除非另有說明,本文所用的所有科技術(shù)語與本發(fā)明所屬領(lǐng)域普通技術(shù)人員通常理解的含義相同。雖然實施或測試本發(fā)明也可采用類似或等效于本文所述內(nèi)容的任何方法和材料,但現(xiàn)在描述了優(yōu)選的方法和材料。將本文所述所有發(fā)表物納入本文作參考,以便連同引用的發(fā)表物公開和描述方法和/或材料。
必須注意,本文和所附權(quán)利要求書中所用的單數(shù)形式“一”、“一種”以及“這種”包括復(fù)數(shù)含義,除非文中明確指出不是這樣。因此,例如,提到“一種類異戊烯修飾酶”包括多種這類酶,提到“一種細(xì)胞色素p450還原酶”包括本領(lǐng)域技術(shù)人員已知的一種或多種細(xì)胞色素p450還原酶和其等效物等。還需注意,可以使權(quán)利要求書排除任何任選元件。因此,此聲明旨在用作排除性術(shù)語如“單獨”、“僅僅”等與權(quán)利要求部分聯(lián)用的前提基礎(chǔ),或采用“負(fù)”限制。
提供本文所述發(fā)表物僅僅是因為它們在本申請的申請日之前公開。不應(yīng)理解為承認(rèn)由于在先發(fā)明而使本發(fā)明不具資格先于這種出版物。而且,提供的公開日可能與實際公開日不同,可能需要單獨確認(rèn)。
發(fā)明詳述
本發(fā)明提供了含有編碼類異戊烯修飾酶的核苷酸序列的分離核酸,以及含有該核酸的重組載體。本發(fā)明還提供了包含本發(fā)明核酸或重組載體的遺傳修飾的宿主細(xì)胞。本發(fā)明還提供了包含本發(fā)明核酸的轉(zhuǎn)基因植物。本發(fā)明還提供了生產(chǎn)類異戊烯化合物的方法,所述方法通常包括在能夠合成本發(fā)明核酸編碼的類異戊烯化合物修飾酶的條件下培養(yǎng)本發(fā)明遺傳修飾的宿主細(xì)胞。
核酸、載體和宿主細(xì)胞
本發(fā)明提供了包含編碼修飾類異戊烯化合物的酶的核苷酸序列的分離核酸,在本文中將修飾類異戊烯化合物的酶稱為“類異戊烯修飾酶”。包含編碼類異戊烯修飾酶的核苷酸序列的本發(fā)明核酸稱為“類異戊烯修飾酶核酸”。在具體實施方式中,分離的本發(fā)明類異戊烯修飾酶核酸包含編碼細(xì)胞色素p450加單氧酶的核苷酸序列。在具體實施方式中,分離的本發(fā)明類異戊烯修飾酶核酸包含編碼類異戊烯氧化酶的核苷酸序列。在一些實施方式中,分離的本發(fā)明類異戊烯修飾酶核酸包含編碼萜羥化酶的核苷酸序列。在一些實施方式中,分離的本發(fā)明類異戊烯修飾酶核酸包含編碼萜氧化酶的核苷酸序列。在一些實施方式中,分離的本發(fā)明類異戊烯修飾酶核酸包含編碼倍半萜氧化酶的核苷酸序列。在一些實施方式中,分離的本發(fā)明類異戊烯修飾酶核酸包含編碼倍半萜羥化酶的核苷酸序列。
nadph-細(xì)胞色素p450氧化還原酶(cpr,ec1.6.2.4)是許多p450-加單氧酶的氧化還原伴侶。本發(fā)明還提供了包含編碼細(xì)胞色素p450還原酶(cpr)的核苷酸序列的分離核酸。包含編碼cpr的核苷酸序列的本發(fā)明核酸稱為“cpr核酸”。本發(fā)明cpr核酸編碼的cpr將電子由nadph傳遞給細(xì)胞色素p450。通常,本發(fā)明cpr核酸編碼的cpr將電子由nadph傳遞給本發(fā)明類異戊烯修飾酶編碼核酸編碼的類異戊烯修飾酶,如倍半萜氧化酶。
編碼類異戊烯修飾酶的核酸
在一些實施方式中,本發(fā)明分離核酸包含編碼具有類異戊烯羥化酶和/或類異戊烯氧化酶活性的多肽的核苷酸序列。在一些實施方式中,本發(fā)明分離核酸包含編碼細(xì)胞色素p450加單氧酶的核苷酸序列。在一些實施方式中,本發(fā)明分離核酸包含編碼類異戊烯羥化酶的核苷酸序列。在一些實施方式中,本發(fā)明分離核酸包含編碼類異戊烯氧化酶的核苷酸序列。在一些實施方式中,本發(fā)明分離核酸包含編碼進行連續(xù)的羥化和氧化反應(yīng)的多肽的核苷酸序列,例如,所述多肽羥化萜化合物產(chǎn)生萜醇,氧化該萜醇產(chǎn)生萜醛,氧化該萜醛產(chǎn)生萜羧酸。在一些實施方式中,本發(fā)明分離核酸包含編碼催化萜的異丙烯基的羥化和/或氧化的多肽的核苷酸序列,例如,該多肽催化單萜、二萜、三萜、倍半萜或多萜的異丙烯基的羥化。在一些實施方式中,本發(fā)明分離核酸包含編碼單萜氧化酶的核苷酸序列。在一些實施方式中,本發(fā)明分離核酸包含編碼單萜羥化酶的核苷酸序列。在一些實施方式中,本發(fā)明分離核酸包含編碼多萜羥化酶的核苷酸序列。在一些實施方式中,本發(fā)明分離核酸包含編碼多萜氧化酶的核苷酸序列。在一些實施方式中,本發(fā)明分離核酸包含編碼二萜羥化酶的核苷酸序列。在一些實施方式中,本發(fā)明分離核酸包含編碼二萜氧化酶的核苷酸序列。在一些實施方式中,本發(fā)明分離核酸包含編碼三萜羥化酶的核苷酸序列。在一些實施方式中,本發(fā)明分離核酸包含編碼三萜氧化酶的核苷酸序列。在一些實施方式中,本發(fā)明分離核酸包含編碼倍半萜羥化酶的核苷酸序列。在一些實施方式中,本發(fā)明分離核酸包含編碼倍半萜氧化酶的核苷酸序列。在一些實施方式中,本發(fā)明分離核酸包含編碼倍半萜c12-羥化酶的核苷酸序列。在一些實施方式中,本發(fā)明分離核酸包含編碼能進行倍半萜的c12氧化的多肽的核苷酸序列。在一些實施方式中,本發(fā)明分離核酸包含編碼紫穗槐二烯12-氧化酶的核苷酸序列。
萜環(huán)化酶(也稱為“萜合酶”)反應(yīng)產(chǎn)物是所謂的“萜骨架”。在一些實施方式中,本發(fā)明分離核酸包含編碼催化萜骨架或其下游產(chǎn)物的羥化和/或氧化的類異戊烯修飾酶的核苷酸序列。通常,本發(fā)明核酸編碼的類異戊烯修飾酶的底物包括萜骨架或修飾的萜骨架。在許多實施方式中,本發(fā)明核酸編碼的類異戊烯修飾酶的底物包括異丙烯基。
本發(fā)明核酸編碼的類異戊烯修飾酶的單萜底物包括但不限于:產(chǎn)生的氧化產(chǎn)物是單萜化合物或者是產(chǎn)生單萜化合物的生物合成途徑的中間體的任何單萜底物。示范性單萜底物包括但不限于:屬于以下家族的單萜底物:無環(huán)單萜、二甲基辛烷、薄荷烷、不規(guī)則的類單萜、桉油醇、莰烷、異莰烷、單環(huán)單萜、蒎烷、葑烷、苧烷、蒈烷、紫羅酮、虹彩烷(iridanes)和大麻(cannabanoids)。示范性單萜底物、中間體和產(chǎn)物包括但不限于:苧烯、香茅醇(citranellol)、牻牛兒醇、薄荷醇、紫蘇子醇、芳樟醇和寧酮。
本發(fā)明核酸編碼的類異戊烯修飾酶的二萜底物包括但不限于:產(chǎn)生的氧化產(chǎn)物是二萜化合物或者是產(chǎn)生二萜化合物的生物合成途徑的中間體的任何二萜底物。示范性二萜底物包括但不限于:屬于以下家族的二萜底物:無環(huán)雙萜類、雙環(huán)雙萜類、單環(huán)雙萜類、半日花烷(labdanes)、克羅登烷(clerodanes)、紫杉烷、三環(huán)雙萜類、四環(huán)雙萜類、貝殼杉烯、貝葉烷(beyerenes)、吖地烯(atiserenes)、蚜腸霉素(aphidicolins)、木藜蘆毒素、赤霉素、大環(huán)二萜和伊麗莎白三烷(elizabethatrianes)。示范性二萜底物、中間體和產(chǎn)物包括但不限于:篦麻素、艾榴塞洛素(eleutherobin)、紫杉醇、蔓生素(prostratin)和假蕨素。
本發(fā)明核酸編碼的類異戊烯修飾酶的三萜底物包括但不限于:產(chǎn)生的氧化產(chǎn)物是三萜化合物或者是產(chǎn)生三萜化合物的生物合成途徑的中間體的任何三萜底物。示范性三萜底物、中間體和產(chǎn)物包括但不限于:阿布糖苷e(arbrusidee)、鴉膽丁(bruceantin)、睪酮、孕酮、可的松和洋地黃毒苷。
本發(fā)明核酸編碼的類異戊烯修飾酶的倍半萜底物包括但不限于:產(chǎn)生的氧化產(chǎn)物是倍半萜化合物或者是產(chǎn)生倍半萜化合物的生物合成途徑的中間體的任何倍半萜底物。示范性倍半萜底物包括但不限于:屬于以下家族的倍半萜底物:法呢烷、單環(huán)法呢烷、單環(huán)倍半萜、雙環(huán)倍半萜、雙環(huán)法呢烷、雙波烷(bisbolanes)、檀香烷、卡波烷(cupranes)、剪葉苔烷(herbertanes)、瓣苔烷(gymnomitranes)、單端孢霉烷、花柏烷(chamigranes)、胡蘿卜烷、菖蒲烷、安提薩汀(antisatins)、杜松烷、倍半萜酮右旋日本刺參萜酮(oplopananes)、胡椒烷(copaanes)、苦毒烷(picrotoxanes)、雪松烷、長葉蒎烷、長葉環(huán)烷(longicyclanes)、丁香烷、莫得烷(modhephanes)、斯非葉烷(siphiperfolanes)、葎草烷、全葉烷(intergrifolianes)、麗皮葉烷(lippifolianes)、原伊魯烷(protoilludanes)、隱環(huán)傘烷(illudanes)、多毛烷(hirsutanes)、乳菇烷(lactaranes)、斯蒂波烷(sterpuranes)、富麻烷(fomannosanes)、馬拉烷(marasmanes)、大根香葉烷、欖香烷、桉葉烷、貝克烷(bakkanes)、綺羅烷(chilosyphanes)、愈創(chuàng)木烷、假愈創(chuàng)木烷、三環(huán)倍半萜、廣霍香烷、三
不難采用合適底物以這些酶活性的標(biāo)準(zhǔn)測定方法來確定本發(fā)明核酸編碼萜氧化酶或是萜羥化酶。通常用氣相色譜-質(zhì)譜分析酶修飾的產(chǎn)物。不難以這些酶活性的標(biāo)準(zhǔn)測定方法來確定本發(fā)明核酸編碼倍半萜氧化酶或是倍半萜羥化酶。參見例如,美國專利公開號20050019882,將其內(nèi)容納入本文作參考。
在一些實施方式中,本發(fā)明核酸包含圖1所示和seqidno:1所列的核苷酸序列。在一些實施方式中,本發(fā)明核酸包含與seqidno:1所列核苷酸序列的核苷酸序列相同性為至少約45%、至少約50%、至少約55%、至少約57%、至少約60%、至少約65%、至少約70%、至少約75%、至少約80%、至少約85%、至少約90%、至少約95%、至少約98%或至少約99%的核苷酸序列。在一些實施方式中,本發(fā)明核酸包含與seqidno:1所列核苷酸序列相比含有1、2、3、4、5、6、7、8、9、10、約10-15、約15-20、約20-25、或者約25-50個核苷酸取代的核苷酸序列。
在一些實施方式中,本發(fā)明核酸包含與seqidno:1所列核苷酸序列的核苷酸序列相同性為至少約45%、至少約50%、至少約55%、至少約57%、至少約60%、至少約65%、至少約70%、至少約75%、至少約80%、至少約85%、至少約90%、至少約95%、至少約98%或至少約99%的核苷酸序列,其中該核酸編碼具有萜羥化酶和/或萜氧化酶活性(如倍半萜氧化酶活性、倍半萜羥化酶活性等)的多肽。
在一些實施方式中,本發(fā)明核酸包含與seqidno:1所列核苷酸序列中至少約500、至少約600、至少約700、至少約800、至少約900、至少約1000、至少約1100、至少約1200、至少約1300、至少約1400或至少約1450個毗連核苷酸的部分的核苷酸序列相同性為至少約50%、至少約55%、至少約57%、至少約60%、至少約65%、至少約70%、至少約75%、至少約80%、至少約85%、至少約90%、至少約95%、至少約98%或至少約99%的核苷酸序列。
在一些實施方式中,本發(fā)明核酸包含seqidno:1所列核苷酸序列的至少約500、至少約600、至少約700、至少約800、至少約900、至少約1000、至少約1100、至少約1200、至少約1300、至少約1400或至少約1450個毗連核苷酸。在一些實施方式中,本發(fā)明核酸包含seqidno:1所列核苷酸序列的至少約500、至少約600、至少約700、至少約800、至少約900、至少約1000、至少約1100、至少約1200、至少約1300、至少約1400或至少約1450個毗連核苷酸,它編碼具有萜羥化酶和/或萜氧化酶活性,如倍半萜羥化酶和/或氧化酶活性的多肽。
在一些實施方式中,本發(fā)明核酸包含在嚴(yán)謹(jǐn)雜交條件下能與包含seqidno:1所列核苷酸序列或其互補物的核酸雜交的核苷酸序列。
在一些實施方式中,本發(fā)明核酸包含編碼含有圖2所示和seqidno:2所列的氨基酸序列的多肽的核苷酸序列。在一些實施方式中,本發(fā)明核酸包含編碼一多肽的核苷酸序列,該多肽包含與seqidno:2所列氨基酸序列的氨基酸序列相同性為至少約45%、至少約50%、至少約55%、至少約60%、至少約65%、至少約70%、至少約75%、至少約80%、至少約85%、至少約90%、至少約95%、至少約98%或至少約99%的氨基酸序列。在一些實施方式中,本發(fā)明核酸包含編碼一多肽的核苷酸序列,該多肽包含與seqidno:2所列氨基酸序列中至少約50、至少約75、至少約100、至少約150、至少約200、至少約250、至少約300、至少約350、至少約400、至少約450或至少約490個毗連氨基酸的部分的氨基酸序列相同性為至少約45%、至少約50%、至少約55%、至少約60%、至少約65%、至少約70%、至少約75%、至少約80%、至少約85%、至少約90%、至少約95%、至少約98%或至少約99%的氨基酸序列。在一些實施方式中,本發(fā)明核酸包含編碼一多肽的核苷酸序列,該多肽包含與seqidno:2所列氨基酸序列相比含有1、2、3、4、5、6、7、8、9、10、約10-15、約15-20、或者約20-25個保守性氨基酸取代的氨基酸序列。在一些實施方式中,所述編碼多肽具有萜羥化酶和/或萜氧化酶活性。在一些實施方式中,所述編碼多肽具有倍半萜氧化酶活性。在一些實施方式中,所述編碼多肽能催化倍半萜底物的c12氧化。在其它實施方式中,所述編碼多肽具有倍半萜羥化酶活性。
在一些實施方式中,本發(fā)明核酸包含編碼一多肽的核苷酸序列,該多肽包含與seqidno:2所列氨基酸序列的氨基酸序列相同性為至少約45%、至少約50%、至少約55%、至少約60%、至少約65%、至少約70%、至少約75%、至少約80%、至少約85%、至少約90%、至少約95%、至少約98%、至少約99%或100%的氨基酸序列中的至少約50、至少約75、至少約100、至少約150、至少約200、至少約250、至少約300、至少約350、至少約400、至少約450或至少約490個毗連氨基酸。在一些實施方式中,所述編碼多肽具有萜羥化酶和/或萜氧化酶活性。在一些實施方式中,所述編碼多肽具有倍半萜氧化酶活性。在一些實施方式中,所述編碼多肽能催化倍半萜底物的c12氧化。在其它實施方式中,所述編碼多肽具有倍半萜羥化酶活性。
在一些實施方式中,本發(fā)明核酸包含圖9所示和seqidno:5所列的核苷酸序列。在一些實施方式中,本發(fā)明核酸包含與seqidno:5所列核苷酸序列的核苷酸序列相同性為至少約45%、至少約50%、至少約55%、至少約57%、至少約60%、至少約65%、至少約70%、至少約75%、至少約80%、至少約85%、至少約90%、至少約95%、至少約98%或至少約99%的核苷酸序列。在一些實施方式中,本發(fā)明核酸包含與seqidno:5所列核苷酸序列相比含有1、2、3、4、5、6、7、8、9、10、約10-15、約15-20、約20-25、或者約25-50個核苷酸取代的核苷酸序列。
在一些實施方式中,本發(fā)明核酸包含與seqidno:5所列核苷酸序列的核苷酸序列相同性為至少約45%、至少約50%、至少約55%、至少約57%、至少約60%、至少約65%、至少約70%、至少約75%、至少約80%、至少約85%、至少約90%、至少約95%、至少約98%或至少約99%的核苷酸序列,其中核酸編碼具有萜羥化酶和/或萜氧化酶活性(如倍半萜氧化酶活性、倍半萜羥化酶活性等)的多肽。
在一些實施方式中,本發(fā)明核酸包含與seqidno:5所列核苷酸序列中至少約500、至少約600、至少約700、至少約800、至少約900、至少約1000、至少約1100、至少約1200、至少約1300、至少約1400或至少約1450個毗連核苷酸的部分的核苷酸序列相同性為至少約45%、至少約50%、至少約55%、至少約57%、至少約60%、至少約65%、至少約70%、至少約75%、至少約80%、至少約85%、至少約90%、至少約95%、至少約98%或至少約99%的核苷酸序列。
在一些實施方式中,本發(fā)明核酸包含編碼一多肽的核苷酸序列,該多肽包含與seqidno:6所列氨基酸序列的氨基酸序列相同性為至少約50%、至少約55%、至少約60%、至少約65%、至少約70%、至少約75%、至少約80%、至少約85%、至少約90%、至少約95%、至少約98%、至少約99%或100%的氨基酸序列的至少約50、至少約75、至少約100、至少約150、至少約200、至少約250、至少約300、至少約350、至少約400、至少約450或至少約480個毗連氨基酸。在許多實施方式中,所述編碼多肽具有萜羥化酶和/或萜氧化酶活性。在許多實施方式中,所述編碼多肽具有倍半萜氧化酶或倍半萜羥化酶活性。在許多實施方式中,所述編碼多肽能催化倍半萜底物的羥化。
在一些實施方式中,本發(fā)明核酸包含seqidno:5所列核苷酸序列的至少約500、至少約600、至少約700、至少約800、至少約900、至少約1000、至少約1100、至少約1200、至少約1300、至少約1400或至少約1450個毗連核苷酸。在一些實施方式中,本發(fā)明核酸包含seqidno:5所列核苷酸序列的至少約500、至少約600、至少約700、至少約800、至少約900、至少約1000、至少約1100、至少約1200、至少約1300、至少約1400或至少約1450個毗連核苷酸,其編碼具有萜羥化酶和/或氧化酶活性,如倍半萜氧化酶活性、倍半萜羥化酶活性等的多肽。
在一些實施方式中,本發(fā)明核酸包含在嚴(yán)謹(jǐn)雜交條件下能與包含seqidno:5所列核苷酸序列或其互補物的核酸雜交的核苷酸序列。
在一些實施方式中,本發(fā)明核酸包含編碼一多肽的核苷酸序列,該多肽包含圖9所示和seqidno:6所列的氨基酸序列。在一些實施方式中,本發(fā)明核酸包含編碼一多肽的核苷酸序列,該多肽包含與seqidno:6所列氨基酸序列的氨基酸序列相同性為至少約45%、至少約50%、至少約55%、至少約60%、至少約65%、至少約70%、至少約75%、至少約80%、至少約85%、至少約90%、至少約95%、至少約98%或至少約99%的氨基酸序列。在一些實施方式中,本發(fā)明核酸包含編碼一多肽的核苷酸序列,該多肽包含與seqidno:6所列氨基酸序列中至少約50、至少約75、至少約100、至少約150、至少約200、至少約250、至少約300、至少約350、至少約400、至少約450或至少約480個毗連氨基酸的部分的氨基酸序列相同性為至少約45%、至少約50%、至少約55%、至少約60%、至少約65%、至少約70%、至少約75%、至少約80%、至少約85%、至少約90%、至少約95%、至少約98%或至少約99%的氨基酸序列。在一些實施方式中,本發(fā)明核酸包含編碼一多肽的核苷酸序列,該多肽包含與seqidno:6所列氨基酸序列相比含有1、2、3、4、5、6、7、8、9、10、約10-15、約15-20、或者約20-25個保守性氨基酸取代的氨基酸序列。在一些實施方式中,所述編碼多肽具有萜羥化酶和/或萜氧化酶活性。在一些實施方式中,所述編碼多肽具有倍半萜氧化酶活性。在一些實施方式中,所述編碼多肽能催化倍半萜底物的羥化。在其它實施方式中,所述編碼多肽具有倍半萜羥化酶活性。
在一些實施方式中,本發(fā)明核酸包含編碼一多肽的核苷酸序列,該多肽包含與seqidno:6所列氨基酸序列的氨基酸序列相同性為至少約50%、至少約55%、至少約60%、至少約65%、至少約70%、至少約75%、至少約80%、至少約85%、至少約90%、至少約95%、至少約98%、至少約99%或100%的氨基酸序列中的至少約50、至少約75、至少約100、至少約150、至少約200、至少約250、至少約300、至少約350、至少約400、至少約450或至少約480個毗連氨基酸。在一些實施方式中,所述編碼多肽具有萜羥化酶和/或萜氧化酶活性。在一些實施方式中,所述編碼多肽具有倍半萜氧化酶活性。在一些實施方式中,所述編碼多肽催化倍半萜底物的羥化。在其它實施方式中,所述編碼多肽具有倍半萜羥化酶活性。
在一些實施方式中,本發(fā)明核酸包含編碼含有seqidno:2或seqidno:6所列氨基酸序列的多肽的變體的核苷酸序列。例如,在一些實施方式中,本發(fā)明核酸包含編碼某種酶的核苷酸序列,與包含seqidno:2或seqidno:6所列氨基酸序列的酶相比,該酶具有以下一種或多種特性:1)酶活性提高;2)體外和/或體內(nèi)穩(wěn)定性提高;3)產(chǎn)率提高;4)蛋白質(zhì)周轉(zhuǎn)率改變;5)底物特異性改變(例如,使得變異酶修飾選擇的底物);6)酶效率提高(例如將底物轉(zhuǎn)變產(chǎn)生產(chǎn)物的效率提高);和7)溶解性提高(例如在胞質(zhì)或胞漿中的溶解性)。
編碼細(xì)胞色素p450還原酶的核酸
本發(fā)明提供了包含編碼細(xì)胞色素p450還原酶(cpr)的核苷酸序列的分離核酸。在一些實施方式中,本發(fā)明cpr核酸包含編碼cpr的核苷酸序列,cpr能將電子由nadph傳遞給本發(fā)明類異戊烯修飾酶核酸編碼的細(xì)胞色素p450氧化酶。
在一些實施方式中,本發(fā)明核酸包含圖3所示和seqidno:3所列的核苷酸序列。在一些實施方式中,本發(fā)明核酸包含與seqidno:3所列核苷酸序列的核苷酸序列相同性為至少約85%、至少約90%、至少約95%、至少約98%或至少約99%的核苷酸序列。
在一些實施方式中,本發(fā)明核酸包含在嚴(yán)謹(jǐn)雜交條件下能與包含seqidno:3所列核苷酸序列或其互補物的核酸雜交的核苷酸序列。
在一些實施方式中,本發(fā)明核酸包含編碼一多肽的核苷酸序列,該多肽包含圖4所示和seqidno:4所列的氨基酸序列。在一些實施方式中,本發(fā)明核酸包含編碼一多肽的核苷酸序列,該多肽包含與seqidno:4所列氨基酸序列的氨基酸序列相同性為至少約80%、至少約85%、至少約90%、至少約95%、至少約98%或至少約99%的氨基酸序列。在一些實施方式中,本發(fā)明核酸包含編碼一多肽的核苷酸序列,該多肽包含與seqidno:4所列氨基酸序列相比含有1、2、3、4、5、6、7、8、9、10、約10-15、約15-20、或者約20-25個保守性氨基酸取代的氨基酸序列。
在一些實施方式中,本發(fā)明核酸包含編碼一多肽的核苷酸序列,該多肽包含與seqidno:4所列氨基酸序列的氨基酸序列相同性為至少約80%、至少約85%、至少約90%、至少約95%、至少約98%、至少約99%或100%的氨基酸序列中的至少約50、至少約75、至少約100、至少約150、至少約200、至少約250、至少約300、至少約350、至少約400、至少約450、至少約500、至少約550、至少約600、至少約650或至少約700個毗連氨基酸。在一些實施方式中,所述編碼多肽將電子由nadph傳遞給本發(fā)明類異戊烯修飾酶核酸編碼的多肽(如類異戊烯修飾酶)。
在一些實施方式中,本發(fā)明核酸包含seqidno:3所列核苷酸序列中的至少約500、至少約600、至少約700、至少約800、至少約900、至少約1000、至少約1100、至少約1200、至少約1300、至少約1400、至少約1500、至少約1600、至少約1700、至少約1800、至少約1900、至少約2000或至少約2100個毗連核苷酸。在一些實施方式中,本發(fā)明核酸包含seqidno:3所列核苷酸序列的至少約500、至少約600、至少約700、至少約800、至少約900、至少約1000、至少約1100、至少約1200、至少約1300、至少約1400、至少約1500、至少約1600、至少約1700、至少約1800、至少約1900、至少約2000或至少約2100個毗連核苷酸,其編碼能將電子由nadph傳遞給本發(fā)明類異戊烯修飾酶核酸編碼的細(xì)胞色素p450氧化酶的多肽,例如,所述編碼多肽能將電子由nadph傳遞給本發(fā)明類異戊烯修飾酶核酸編碼的多肽(如類異戊烯修飾酶)。
在一些實施方式中,本發(fā)明核酸包含編碼含有seqidno:4所列氨基酸序列的多肽的變體的核苷酸序列。例如,在一些實施方式中,本發(fā)明核酸包含編碼某種酶的核苷酸序列,與包含seqidno:4所列氨基酸序列的酶相比,該酶具有以下一種或多種特性:1)酶活性提高;2)體外和/或體內(nèi)穩(wěn)定性提高;3)產(chǎn)率提高;4)蛋白質(zhì)周轉(zhuǎn)率改變;5)底物特異性改變(例如,使得變異酶修飾選擇的底物);6)酶效率提高(例如將底物轉(zhuǎn)變產(chǎn)生產(chǎn)物的效率提高);和7)溶解性提高(例如在胞質(zhì)或胞漿中的溶解性)。
在一些實施方式中,本發(fā)明核酸包含編碼融合蛋白的核苷酸序列,所述融合蛋白包含融合于異源多肽(“融合伴侶”)的具有萜羥化酶和/或萜氧化酶活性的類異戊烯修飾酶(如上所述)的氨基酸序列,所述異源多肽是(例如)除上述類異戊烯修飾酶以外的多肽。在一些實施方式中,本發(fā)明核酸包含編碼融合蛋白的核苷酸序列,所述融合蛋白包含上述cpr的氨基酸序列和異源多肽,所述異源多肽是(例如)除cpr以外的多肽。合適的融合伴侶包括但不限于:能提高類異戊烯修飾酶或cpr的溶解度的多肽;提供可檢測信號的多肽(如熒光蛋白;產(chǎn)生可檢測產(chǎn)物的酶如β-半乳糖苷酶、熒光素酶、辣根過氧化物酶等);使類異戊烯修飾酶或cpr位于特定細(xì)胞區(qū)室(如胞漿、胞質(zhì)等)中的多肽;等等。
在一些實施方式中,本發(fā)明核酸包含編碼類異戊烯修飾酶(如具有萜羥化酶和/或萜氧化酶活性的多肽)和cpr的核苷酸序列。在一些實施方式中,本發(fā)明核酸包含編碼融合蛋白的核苷酸序列,所述融合蛋白包含融合于cpr多肽的具有萜羥化酶和/或萜氧化酶活性的類異戊烯修飾酶(如上所述)的氨基酸序列。在一些實施方式中,所述編碼融合蛋白具有通式nh2-a-x-b-cooh,式中a是具有萜羥化酶和/或萜氧化酶活性的類異戊烯修飾酶,x是任選接頭,b是cpr多肽。在一些實施方式中,所述編碼融合蛋白具有通式nh2-a-x-b-cooh,式中a是cpr多肽,x是任選接頭,b是具有萜羥化酶和/或萜氧化酶活性的類異戊烯-修飾多肽。
接頭肽可具有各種氨基酸序列??赏ㄟ^通常有彈性的間隔肽連接蛋白質(zhì),但不排除其它化學(xué)連接。接頭可以是可切割接頭。合適的接頭序列通常是長度約為5-50個氨基酸,或者約為6-25個氨基酸的肽。通常采用有一定彈性的肽接頭。連接肽幾乎可以是任何氨基酸序列,記住優(yōu)選接頭具有產(chǎn)生通常有彈性的肽的序列。小氨基酸如甘氨酸和丙氨酸可用于產(chǎn)生彈性肽。本領(lǐng)域技術(shù)人員通常能夠產(chǎn)生這種序列??少彽酶鞣N不同接頭,它們也適用于本發(fā)明。
合適的接頭肽常常包括富含丙氨酸和脯氨酸殘基的氨基酸序列,已知這些殘基能賦予蛋白質(zhì)結(jié)構(gòu)以彈性。示范性接頭含有甘氨酸、丙氨酸、脯氨酸和甲硫氨酸殘基的組合,如aaaggm(seqidno:8);aaaggmppaaaggm(seqidno:9);aaaggm(seqidno:10);和ppaaaggm(seqidno:11)。其它示范性接頭肽包括iegr(seqidno:12;和ggkggk(seqidno:13)。然而,可采用通常長度約為5-50個氨基酸的任何彈性接頭。接頭幾乎可以是能產(chǎn)生通常有彈性的肽的任何序列,包括上述類型的富含丙氨酸-脯氨酸的序列。
構(gòu)建物
本發(fā)明還提供了包含本發(fā)明核酸的重組載體(“構(gòu)建物”)。在一些實施方式中,本發(fā)明重組載體能夠擴增本發(fā)明核酸。在一些實施方式中,本發(fā)明重組載體能夠在真核細(xì)胞、原核細(xì)胞或無細(xì)胞轉(zhuǎn)錄/翻譯系統(tǒng)中產(chǎn)生編碼的類異戊烯修飾酶或編碼的cpr。合適的表達(dá)載體包括但不限于:桿狀病毒載體、噬菌體載體、質(zhì)粒、噬菌粒、粘粒、f粘粒(fosmid)、細(xì)菌人工染色體、病毒載體(如基于牛痘病毒、脊髓灰質(zhì)炎病毒、腺病毒、腺伴隨病毒、sv40、單純皰疹病毒等的病毒載體)、基于p1的人工染色體、酵母質(zhì)粒、酵母人工染色體和對感興趣的特定宿主(如大腸桿菌(e.coli)、酵母和植物細(xì)胞)特異的任何其它載體。
在一些實施方式中,本發(fā)明重組載體包含本發(fā)明類異戊烯修飾酶-編碼核酸和本發(fā)明cpr-編碼核酸。在一些實施方式中,本發(fā)明重組載體是能夠在真核細(xì)胞、原核細(xì)胞或無細(xì)胞轉(zhuǎn)錄/翻譯系統(tǒng)中產(chǎn)生編碼的類異戊烯修飾酶和編碼的cpr的表達(dá)載體。
某些載體類型能夠擴增本發(fā)明表達(dá)盒。將本發(fā)明核酸有效引入細(xì)胞和引入后的表達(dá)需要其它載體類型。能夠接受本發(fā)明核酸的任何載體均可考慮用作本發(fā)明的重組載體。載體可以是整合到宿主基因組中或保持附加體形式的環(huán)狀或線性dna。載體可能需要附加操作或具體條件才能有效摻入宿主細(xì)胞中(如許多表達(dá)質(zhì)粒),或者可以是自身整合的細(xì)胞特異性系統(tǒng)的一部分(如重組病毒)。在一些實施方式中,載體在原核細(xì)胞中有功能,這種載體用于增殖重組載體和/或表達(dá)本發(fā)明核酸。在一些實施方式中,載體在真核細(xì)胞中有功能,在許多情況下這種載體是表達(dá)載體。
本領(lǐng)域技術(shù)人員已知許多合適的表達(dá)載體,許多可從市場上購得。以舉例方式提供以下載體;用于細(xì)菌宿主細(xì)胞:pbluescript(加州圣地亞哥的司查塔基公司(stratagene))、pqe載體(凱杰公司(qiagen))、pbluescript質(zhì)粒、pnh載體、λ-zap載體(司查塔基公司);ptrc(amann等、gene、69:301-315(1988));ptrc99a、pkk223-3、pdr540和prit2t(法瑪西亞公司(pharmacia));用于真核宿主細(xì)胞:pxt1、psg5(司查塔基公司)、psvk3、pbpv、pmsg和psvlsv40(法瑪西亞公司)。然而,可采用任何其它質(zhì)?;蚱渌d體,只要它與宿主細(xì)胞相容。
在許多實施方式中,本發(fā)明重組載體含有一種或多種選擇性標(biāo)記基因,以提供用于選擇轉(zhuǎn)化的宿主細(xì)胞的表型特征。合適的選擇性標(biāo)記物包括但不限于:二氫葉酸還原酶,用于真核細(xì)胞培養(yǎng)物的新霉素抗性;和用于原核宿主細(xì)胞如大腸桿菌的四環(huán)素或氨芐青霉素抗性。
在許多實施方式中,本發(fā)明核酸包含編碼類異戊烯修飾酶的核苷酸序列,其中編碼類異戊烯修飾酶的核苷酸序列操作性連接于一種或多種轉(zhuǎn)錄和/或翻譯控制元件。在許多實施方式中,本發(fā)明核酸包含編碼cpr的核苷酸序列,其中編碼cpr的核苷酸序列操作性連接于一種或多種轉(zhuǎn)錄和/或翻譯控制元件。
在一些實施方式中,如上所述,本發(fā)明重組載體包含本發(fā)明類異戊烯修飾酶-編碼核酸和本發(fā)明cpr-編碼核酸。在一些實施方式中,編碼的類異戊烯修飾酶核苷酸序列和編碼cpr的核苷酸序列操作性連接于不同的轉(zhuǎn)錄控制元件。在其它實施方式中,編碼類異戊烯修飾酶的核苷酸序列和編碼cpr的核苷酸序列操作性連接于同一個轉(zhuǎn)錄控制元件。在一些實施方式中,編碼類異戊烯修飾酶的核苷酸序列和編碼cpr的核苷酸序列均操作性連接于同一個誘導(dǎo)型啟動子。在一些實施方式中,編碼類異戊烯修飾酶的核苷酸序列和編碼cpr的核苷酸序列均操作性連接于同一個組成型啟動子。
適用于原核宿主細(xì)胞的啟動子包括但不限于:噬菌體t7rna聚合酶啟動子;trp啟動子;lac操縱子啟動子;雜合啟動子,如lac/tac雜合啟動子、tac/trc雜合啟動子、trp/lac啟動子、t7/lac啟動子;trc啟動子;tac啟動子等;arabad啟動子;體內(nèi)調(diào)節(jié)啟動子,如ssag啟動子或相關(guān)啟動子(參見例如,美國專利公開號20040131637)、pagc啟動子(pulkkinen和miller,j.bacteriol.,1991:173(1):86-93;alpuche-aranda等,pnas,1992;89(21):10079-83)、nirb啟動子(harborne等(1992)mol.micro.6:2805-2813)等(參見例如dunstan等(1999)infect.immun.67:5133-5141;mckelvie等(2004)vaccine22:3243-3255;和chatfield等(1992)biotechnol.10:888-892);σ70啟動子,如共有σ70啟動子(參見例如,genbank登錄號ax798980、ax798961和ax798183);穩(wěn)定期啟動子,如dps啟動子、spv啟動子等;衍生自致病島spi-2的啟動子(參見例如wo96/17951);acta啟動子(參見例如,shetron-rama等(2002)infect.immun.70:1087-1096);rpsm啟動子(參見例如,valdivia和falkow(1996),mol.microbiol.22:367-378);tet啟動子(參見例如,hillen,w.和wissmann,a.(1989),刊于saenger,w.和heinemann,u所編的topicsinmolecularandstructuralbiology,protein–nucleicacidinteraction(分子和結(jié)構(gòu)生物學(xué)專題,蛋白質(zhì)-核酸相互作用),英國倫敦麥克米蘭(macmillan),第10卷,第143–162頁);sp6啟動子(參見例如,melton等(1984)nucl.acidsres.12:7035-7056);等等。
合適的真核啟動子的非限制性例子包括cmv立即早期、hsv胸苷激酶、早期和晚期sv40、來自逆轉(zhuǎn)錄病毒的ltr和小鼠金屬硫蛋白-i。在一些實施方式中,例如在酵母細(xì)胞中表達(dá)時,合適啟動子是組成型啟動子如adh1啟動子、pgk1啟動子、eno啟動子、pyk1啟動子等;或者調(diào)節(jié)型啟動子如gal1啟動子、gal10啟動子、adh2啟動子、pho5啟動子、cup1啟動子、gal7啟動子、met25啟動子、met3啟動子等。本領(lǐng)域普通技術(shù)人員能夠選擇合適的載體和啟動子。表達(dá)載體也可含有用于啟動翻譯的核糖體結(jié)合位點和轉(zhuǎn)錄終止子。表達(dá)載體還可含有擴大表達(dá)的合適序列。
在許多實施方式中,編碼類異戊烯修飾酶的核苷酸序列操作性連接于誘導(dǎo)型啟動子。在許多實施方式中,編碼cpr的核苷酸序列操作性連接于誘導(dǎo)型啟動子。本領(lǐng)域熟知誘導(dǎo)型啟動子。合適的誘導(dǎo)型啟動子包括但不限于:λ噬菌體的pl;plac;ptrp;ptac(ptrp-lac雜合啟動子);異丙基-β-d-硫代吡喃半乳糖苷(iptg)-誘導(dǎo)型啟動子,如lacz啟動子;四環(huán)素-誘導(dǎo)型啟動子;阿拉伯糖誘導(dǎo)型啟動子,如pbad(參見例如,guzman等(1995)j.bacteriol.177:4121-4130);木糖誘導(dǎo)型啟動子,如pxyl(參見例如,kim等(1996)gene181:71-76);gal1啟動子;色氨酸啟動子;lac啟動子;醇誘導(dǎo)型啟動子,如甲醇誘導(dǎo)型啟動子、乙醇-誘導(dǎo)型啟動子;棉子糖-誘導(dǎo)型啟動子;熱誘導(dǎo)型啟動子,如熱誘導(dǎo)型λpl啟動子、由熱敏阻抑物控制的啟動子(如ci857-阻抑的λ基表達(dá)載體;參見例如,hoffmann等(1999)femsmicrobiollett.177(2):327-34);等等。
在酵母中,可采用含有組成型或誘導(dǎo)型啟動子的許多載體。綜述參見currentprotocolsinmolecularbiology(新編分子生物學(xué)實驗指南),第2卷,1988,ausubel等編,greenepublish.assoc.&wileyinterscience(格林出版聯(lián)合集團和韋氏科學(xué)出版社),第13章;grant等,1987,expressionandsecretionvectorforyeast(用于酵母的表達(dá)和分泌載體),methodsinenzymology(酶學(xué)方法),wu和grossman編,31987,學(xué)術(shù)出版社(acad.press),紐約,第153卷,第516-544頁;glover,1986,dnacloning(dna克隆),第ii卷,irl出版社,華盛頓特區(qū),第3章;和bitter,1987,heterologousgeneexpressioninyeast(酵母中的異源基因表達(dá)),methodsinenzymology(酶學(xué)方法),berger和kimmel編,學(xué)術(shù)出版社,紐約,第152卷,第673-684頁;和themolecularbiologyoftheyeastsaccharomyces(釀酒酵母的分子生物學(xué)),1982,strathern等編,冷泉港出版社,第i和ii卷。可采用組成型酵母啟動子如adh或leu2或誘導(dǎo)型啟動子如gal(cloninginyeast(在酵母中克隆),第3章,r.rothstein,刊于dnacloning(dna克隆)第11卷,apracticalapproach(實踐方法),dmglover編,1986,irl出版社,華盛頓特區(qū))?;蛘撸刹捎媚艽龠M外來dna序列整合到酵母染色體中的載體。
在一些實施方式中,本發(fā)明核酸或本發(fā)明載體包含用于在植物細(xì)胞中表達(dá)的啟動子或其它調(diào)控元件。在植物細(xì)胞中有功能的合適的組成型啟動子的非限制性例子是花椰菜花葉病毒35s啟動子、串聯(lián)35s啟動子(kay等,science236:1299(1987))、花椰菜花葉病毒19s啟動子、胭脂堿合酶基因啟動子(singer等,plantmol.biol.14:433(1990);an,plantphysiol.81:86(1986)、章魚堿合酶基因啟動子和泛素啟動子。在植物細(xì)胞中有功能的合適的誘導(dǎo)型啟動子包括但不限于:苯丙氨酸氨-裂合酶基因啟動子、查耳酮合酶基因啟動子、病理相關(guān)蛋白基因啟動子、銅-誘導(dǎo)性調(diào)控元件(mett等,proc.natl.acad.sci.usa90:4567-4571(1993);furst等,cell55:705-717(1988));四環(huán)素和氯四環(huán)素-誘導(dǎo)性調(diào)控元件(gatz等,plantj.2:397-404(1992);
本發(fā)明核酸或本發(fā)明載體中也可包含植物組織選擇性調(diào)控元件。適用于在一種組織或有限數(shù)量的組織中異位表達(dá)核酸的組織選擇性調(diào)控元件包括但不限于:木質(zhì)部-選擇性調(diào)控元件、管胞-選擇性調(diào)控元件、纖維-選擇性調(diào)控元件、毛狀體-選擇性調(diào)控元件(參見例如,wang等(2002)j.exp.botany53:1891-1897)、腺毛-選擇性調(diào)控元件等。
本領(lǐng)域已知適用于植物細(xì)胞的載體,任何這種載體均可用于將本發(fā)明核酸引入植物宿主細(xì)胞。合適載體包括例如:根癌土壤桿菌(agrobacteriumtumefaciens)的ti質(zhì)?;蛎寥罈U菌(a.rhizogenes)的ri1質(zhì)粒。感染土壤桿菌(agrobacterium)后,ti或ri1質(zhì)粒被輸送到植物細(xì)胞中,并穩(wěn)定整合到植物基因組中。j.schell,science,237:1176-83(1987)。適合采用的還有植物人工染色體,如美國專利號6,900,012所述。
組合物
本發(fā)明還提供了含有本發(fā)明核酸的組合物。本發(fā)明還提供了含有本發(fā)明重組載體的組合物。在許多實施方式中,含有本發(fā)明核酸或本發(fā)明表達(dá)載體的組合物包含以下一種或多種物質(zhì):鹽,如nacl、mgcl、kcl、mgso4等;緩沖劑,如tris緩沖液、n-(2-羥乙基)哌嗪-n'-(2-乙磺酸)(hepes)、2-(n-嗎啉代)乙磺酸(mes)、2-(n-嗎啉代)乙磺酸鈉(mes)、3-(n-嗎啉代)丙磺酸(mops)、n-三[羥甲基]甲基-3-氨基丙磺酸(taps)、等;增溶劑;去污劑,如非離子型去污劑如吐溫-20等;核酸酶抑制劑;等等。在一些實施方式中,凍干本發(fā)明核酸或本發(fā)明重組載體。
宿主細(xì)胞
本發(fā)明提供了遺傳修飾的宿主細(xì)胞,如用本發(fā)明核酸或本發(fā)明重組載體遺傳修飾的宿主細(xì)胞。在許多實施方式中,本發(fā)明遺傳修飾的宿主細(xì)胞是體外宿主細(xì)胞。在其它實施方式中,本發(fā)明遺傳修飾的宿主細(xì)胞是體內(nèi)宿主細(xì)胞。在其它實施方式中,本發(fā)明遺傳修飾的宿主細(xì)胞是多細(xì)胞生物體的一部分。
在許多實施方式中,宿主細(xì)胞是單細(xì)胞生物,或作為單細(xì)胞培養(yǎng)。在一些實施方式中,宿主細(xì)胞是真核細(xì)胞。合適的真核宿主細(xì)胞包括但不限于:酵母細(xì)胞、昆蟲細(xì)胞、植物細(xì)胞、真菌細(xì)胞和藻類細(xì)胞。合適的真核宿主細(xì)胞包括但不限于:巴斯德畢赤酵母(pichiapastoris)、芬蘭畢赤酵母(pichiafinlandica)、pichiatrehalophila、pichiakoclamae、膜醭畢赤酵母(pichiamembranaefaciens)、pichiaopuntiae、耐熱畢赤酵母(pichiathermotolerans)、pichiasalictaria、pichiaguercuum、pichiapijperi、樹干畢赤酵母(pichiastiptis)、甲醇畢赤酵母(pichiamethanolica)、畢赤酵母(pichiasp.)、釀酒酵母(saccharomycescereviseae)、酵母(saccharomycessp.)、多形漢遜酵母(hansenulapolymorpha)、克魯維酵母(kluyveromycessp.)、乳糖克魯維酵母(kluyveromyceslactis)、白假絲酵母(candidaalbicans)、構(gòu)巢曲霉(aspergillusnidulans)、黑曲霉(aspergillusniger)、米曲霉(aspergillusoryzae)、木霉(trichodermareesei)、chrysosporiumlucknowense、鐮刀菌(fusariumsp.)、禾谷鐮刀菌(fusariumgramineum)、鐮孢霉(fusariumvenenatum)、粗糙鏈胞菌(neurosporacrassa)、萊茵衣藻(chlamydomonasreinhardtii)等。在一些實施方式中,宿主細(xì)胞是除植物細(xì)胞以外的真核細(xì)胞。
在其它實施方式中,宿主細(xì)胞是植物細(xì)胞。植物細(xì)胞包括單子葉植物和雙子葉植物的細(xì)胞。
在其它實施方式中,宿主細(xì)胞是原核細(xì)胞。合適的原核細(xì)胞包括但不限于:大腸桿菌(escherichiacoli)、乳桿菌(lactobacillussp.)、沙門菌(salmonellasp.)、志賀菌(shigellasp.)等的各種實驗室菌株。參見例如,carrier等(1992)j.immunol.148:1176-1181;美國專利號6,447,784;和sizemore等(1995)science270:299-302??捎糜诒景l(fā)明的沙門菌菌株的例子包括但不限于:傷寒沙門菌(salmonellatyphi)和鼠傷寒沙門菌(s.typhimurium)。合適的志賀菌菌株包括但不限于:弗志賀菌(shigellaflexneri)、宋內(nèi)志賀菌(shigellasonnei)和shigelladisenteriae。一般地,所述實驗室菌株是非致病性菌株。其它合適細(xì)菌的非限制性例子包括但不限于:枯草芽孢桿菌(bacillussubtilis)、普假單胞菌(pseudomonaspudita)、綠膿假單胞菌(pseudomonasaeruginosa)、pseudomonasmevalonii、類球紅細(xì)菌(rhodobactersphaeroides)、莢膜紅細(xì)菌(rhodobactercapsulatus)、深紅紅螺菌(rhodospirillumrubrum)、紅球菌屬(rhodococcussp.)等。在一些實施方式中,宿主細(xì)胞是大腸桿菌。
為了產(chǎn)生本發(fā)明遺傳修飾的宿主細(xì)胞,用已經(jīng)建立的技術(shù)將包含編碼類異戊烯修飾酶的核苷酸序列的本發(fā)明核酸穩(wěn)定或瞬時地引入親代宿主細(xì)胞中,這些技術(shù)包括但不限于:電穿孔、磷酸鈣沉淀、deae-右旋糖苷介導(dǎo)的轉(zhuǎn)染、脂質(zhì)體介導(dǎo)的轉(zhuǎn)染等。在穩(wěn)定轉(zhuǎn)化中,核酸一般還包括選擇性標(biāo)記物,例如幾種熟知的選擇性標(biāo)記物如新霉素抗性、氨芐青霉素抗性、四環(huán)素抗性、氯霉素抗性、卡那霉素抗性等。
在一些實施方式中,本發(fā)明遺傳修飾的宿主細(xì)胞是植物細(xì)胞。本發(fā)明遺傳修飾的植物細(xì)胞可用于在體外植物細(xì)胞培養(yǎng)物中產(chǎn)生選擇的類異戊烯化合物。關(guān)于植物組織培養(yǎng)的指南可參見(例如):plantcellandtissueculture(植物細(xì)胞和組織培養(yǎng)),1994,vasil和thorpe編,克魯維學(xué)術(shù)出版集團(kluweracademicpublishers);和plantcellcultureprotocols(植物細(xì)胞培養(yǎng)方法)(methodsinmolecularbiology(分子生物學(xué)方法)111),1999,hall編,休曼出版社(humanapress)。
遺傳修飾的宿主細(xì)胞
在一些實施方式中,本發(fā)明遺傳修飾的宿主細(xì)胞包含本發(fā)明表達(dá)載體,所述本發(fā)明表達(dá)載體包含編碼類異戊烯修飾酶的核苷酸序列。在一些實施方式中,本發(fā)明遺傳修飾的宿主細(xì)胞包含本發(fā)明表達(dá)載體,所述本發(fā)明表達(dá)載體包含編碼具有萜羥化酶和/或萜氧化酶活性的多肽的核苷酸序列。
在一些實施方式中,本發(fā)明遺傳修飾的宿主細(xì)胞包含第一種本發(fā)明表達(dá)載體和第二種本發(fā)明表達(dá)載體,所述第一種本發(fā)明表達(dá)載體包含的本發(fā)明核酸含有編碼具有萜羥化酶和/或萜氧化酶活性的多肽的核苷酸序列;所述第二種本發(fā)明表達(dá)載體包含的本發(fā)明核酸含有編碼cpr的核苷酸序列。在其它實施方式中,本發(fā)明遺傳修飾的宿主細(xì)胞包含本發(fā)明表達(dá)載體,其中所述本發(fā)明表達(dá)載體包含含有編碼類異戊烯修飾酶的核苷酸序列的本發(fā)明核酸和含有編碼cpr的核苷酸序列的本發(fā)明核酸。在其它實施方式中,本發(fā)明遺傳修飾的宿主細(xì)胞包含本發(fā)明表達(dá)載體,所述本發(fā)明表達(dá)載體包含的本發(fā)明核酸含有編碼融合多肽(如包含類異戊烯修飾酶和cpr的多肽)的核苷酸序列。
合適的cpr-編碼核酸包括編碼植物中發(fā)現(xiàn)的cpr的核酸。合適的cpr-編碼核酸包括編碼真菌中發(fā)現(xiàn)的cpr的核酸。合適的cpr編碼核酸的例子包括:genbank登錄號aj303373(普通小麥(triticumaestivum)cpr);genbank登錄號ay959320(紅豆杉(taxuschinensis)cpr);genbank登錄號ay532374(大阿米(ammimajus)cpr);genbank登錄號ag211221(水稻(oryzasativa)cpr);和genbank登錄號af024635(皺葉歐芹(petroselinumcrispum)cpr)。
在一些實施方式中,本發(fā)明遺傳修飾的宿主細(xì)胞是通常不通過甲羥戊酸途徑合成焦磷酸異戊-1-烯酯(ipp)或甲羥戊酸的宿主細(xì)胞。甲羥戊酸途徑包括:(a)將兩個分子的乙酰-coa縮合成乙酰乙酰-coa;(b)使乙酰乙酰-coa與乙酰-coa縮合形成hmg-coa;(c)將hmg-coa轉(zhuǎn)化為甲羥戊酸;(d)將甲羥戊酸磷酸化為甲羥戊酸5-磷酸;(e)將甲羥戊酸5-磷酸轉(zhuǎn)化為甲羥戊酸5-焦磷酸;和(f)將甲羥戊酸5-焦磷酸轉(zhuǎn)化為焦磷酸異戊-1-烯酯。產(chǎn)生ipp所需的甲羥戊酸途徑酶可能因培養(yǎng)條件而變。
如上所述,在一些實施方式中,本發(fā)明遺傳修飾的宿主細(xì)胞是通常不通過甲羥戊酸途徑合成焦磷酸異戊-1-烯酯(ipp)或甲羥戊酸的宿主細(xì)胞。在一些實施方式中,用本發(fā)明表達(dá)載體遺傳修飾宿主細(xì)胞,所述本發(fā)明表達(dá)載體包含編碼類異戊烯修飾酶的本發(fā)明核酸;并且用一種或多種異源核酸遺傳修飾宿主細(xì)胞,所述異源核酸包含編碼乙酰乙酰-coa硫解酶、羥甲基戊二?;?coa合酶(hmgs)、羥甲基戊二?;?coa還原酶(hmgr)、甲羥戊酸激酶(mk)、磷酸甲羥戊酸激酶(pmk)和甲羥戊酸焦磷酸脫羧酶(mpd)(還有任選的ipp異構(gòu)酶)的核苷酸序列。在許多這類實施方式中,用表達(dá)載體遺傳修飾宿主細(xì)胞,所述表達(dá)載體包含編碼cpr的核苷酸序列。在一些實施方式中,用本發(fā)明表達(dá)載體遺傳修飾宿主細(xì)胞,所述本發(fā)明表達(dá)載體包含編碼類異戊烯修飾酶的本發(fā)明核酸;用一種或多種異源核酸遺傳修飾宿主細(xì)胞,所述異源核酸包含編碼mk、pmk、mpd(還有任選的ipp異構(gòu)酶)的核苷酸序列。在許多這類實施方式中,用表達(dá)載體遺傳修飾宿主細(xì)胞,所述表達(dá)載體包含編碼cpr的核苷酸序列。
在一些實施方式中,本發(fā)明遺傳修飾的宿主細(xì)胞是通常不通過甲羥戊酸途徑合成ipp或甲羥戊酸的宿主細(xì)胞;用本發(fā)明表達(dá)載體遺傳修飾宿主細(xì)胞,所述本發(fā)明表達(dá)載體包含編碼類異戊烯修飾酶的本發(fā)明核酸;并且用一種或多種異源核酸遺傳修飾宿主細(xì)胞,所述異源核酸包含編碼乙酰乙酰-coa硫解酶、hmgs、hmgr、mk、pmk、mpd、ipp異構(gòu)酶和異戊烯基轉(zhuǎn)移酶的核苷酸序列。在許多這類實施方式中,用表達(dá)載體遺傳修飾宿主細(xì)胞,所述表達(dá)載體包含編碼cpr的核苷酸序列。在一些實施方式中,本發(fā)明遺傳修飾的宿主細(xì)胞是通常不通過甲羥戊酸途徑合成ipp或甲羥戊酸的宿主細(xì)胞;用本發(fā)明表達(dá)載體遺傳修飾宿主細(xì)胞,所述本發(fā)明表達(dá)載體包含編碼類異戊烯修飾酶的本發(fā)明核酸;并且用一種或多種異源核酸遺傳修飾宿主細(xì)胞,所述異源核酸包含編碼mk、pmk、mpd、ipp異構(gòu)酶和異戊烯基轉(zhuǎn)移酶的核苷酸序列。在許多這類實施方式中,用表達(dá)載體遺傳修飾宿主細(xì)胞,所述表達(dá)載體包含編碼cpr的核苷酸序列。
在一些實施方式中,本發(fā)明遺傳修飾的宿主細(xì)胞是通常通過甲羥戊酸途徑合成ipp或甲羥戊酸的宿主細(xì)胞,例如,宿主細(xì)胞是包含內(nèi)源性甲羥戊酸途徑的宿主細(xì)胞。在一些實施方式中,宿主細(xì)胞是酵母細(xì)胞。在一些實施方式中,宿主細(xì)胞是釀酒酵母。
在一些實施方式中,還用一種或多種核酸遺傳修飾本發(fā)明遺傳修飾的宿主細(xì)胞,所述核酸包含編碼脫氫酶的核苷酸序列,所述脫氫酶進一步修飾類異戊烯化合物。所述編碼的脫氫酶可以是在原核細(xì)胞或真核細(xì)胞中天然發(fā)現(xiàn)的脫氫酶,或者可以是這種脫氫酶的變體。在一些實施方式中,本發(fā)明提供了編碼這種脫氫酶的核苷酸序列的分離核酸。
甲羥戊酸途徑核酸
本領(lǐng)域已知編碼mev途徑基因產(chǎn)物的核苷酸序列,可采用任何已知的編碼mev途徑基因產(chǎn)物的核苷酸序列,以產(chǎn)生本發(fā)明遺傳修飾的宿主細(xì)胞。例如,編碼乙酰乙酰-coa硫解酶、hmgs、hmgr、mk、pmk、mpd和idi的核苷酸序列是本領(lǐng)域已知的。以下是編碼mev途徑基因產(chǎn)物的已知核苷酸序列的非限制性例子,后面括號中的內(nèi)容表示各mev途徑酶的genbank登錄號和生物體:乙酰乙酰-coa硫解酶:(nc_000913區(qū):2324131..2325315;大腸桿菌)、(d49362;脫氮副球菌(paracoccusdenitrificans))和(l20428;釀酒酵母);hmgs:(nc_001145互補物19061..20536;釀酒酵母)、(x96617;釀酒酵母)、(x83882;擬南芥(arabidopsisthaliana))、(ab037907;灰北里孢菌(kitasatosporagriseola))和(bt007302;智人(homosapiens));hmgr:(nm_206548;黑腹果蠅(drosophilamelanogaster))、(nm_204485;紅原雞(gallusgallus))、(ab015627;鏈霉菌(streptomycessp.)ko-3988)、(af542543;煙草(nicotianaattenuata))、(ab037907;灰北里孢菌(kitasatosporagriseola))、(ax128213,提供了編碼截短的hmgr的序列;釀酒酵母)和(nc_001145:互補物(115734..118898;釀酒酵母));mk:(l77688;擬南芥)和(x55875;釀酒酵母);pmk:(af429385;巴西橡膠樹(heveabrasiliensis))、(nm_006556;智人)、(nc_001145,互補物712315..713670;釀酒酵母);mpd:(x97557;釀酒酵母)、(af290095;屎腸球菌(enterococcusfaecium))和(u49260;智人);和idi:(nc_000913,3031087..3031635;大腸桿菌)和(af082326;雨生紅球藻(haematococcuspluvialis))。
在一些實施方式中,hmgr編碼區(qū)編碼缺少野生型hmgr的跨膜結(jié)構(gòu)域的截短形式的hmgr(“thmgr”)。hmgr的跨膜結(jié)構(gòu)域含有該酶的調(diào)節(jié)部分,但沒有催化活性。
可以本領(lǐng)域已知的各種方式改變?nèi)魏我阎猰ev途徑酶的編碼序列,以靶向改變編碼酶的氨基酸序列。變異mev途徑酶的氨基酸通常與任何已知mev途徑酶的氨基酸序列基本相似,即其區(qū)別為至少一個氨基酸,區(qū)別可能是至少兩個、至少5個、至少10個、或至少20個氨基酸,但一般不超過約50個氨基酸。序列改變可以是取代、插入或缺失。例如,如下所述,可根據(jù)具體宿主細(xì)胞的密碼子偏倚性改變核苷酸序列。此外,可引入使編碼蛋白發(fā)生保守性氨基酸改變的一個或多個核苷酸序列差異。
異戊烯基轉(zhuǎn)移酶
在一些實施方式中,遺傳修飾本發(fā)明遺傳修飾的宿主細(xì)胞,以包含含有編碼類異戊烯修飾酶的核苷酸序列的核酸;在一些實施方式中,還通過遺傳修飾以包含含有編碼一種或多種甲羥戊酸途徑酶的核苷酸序列的一種或多種核酸(如上所述);和編碼異戊烯基轉(zhuǎn)移酶的核苷酸序列的核酸。
異戊烯基轉(zhuǎn)移酶構(gòu)成了催化ipp連續(xù)縮合導(dǎo)致形成各種鏈長度的二磷酸異戊烯酯的一大類酶。合適的異戊烯基轉(zhuǎn)移酶包括催化ipp與烯丙基初始底物縮合形成類異戊烯化合物的酶,所述類異戊烯化合物具有約2個異戊烯單元-6000個異戊烯單元或更多,例如,2個異戊烯單元(焦磷酸牻牛兒酯合酶)、3個異戊烯單元(焦磷酸法呢酯合酶)、4個異戊烯單元(焦磷酸牻牛兒基牻牛兒酯合酶)、5個異戊烯單元、6個異戊烯單元(焦磷酸十六烷基酯合酶)、7個異戊烯單元、8個異戊烯單元(八氫番茄紅素合酶、焦磷酸八異戊烯酯合酶)、9個異戊烯單元(焦磷酸九異戊烯酯合酶)、10個異戊烯單元(焦磷酸十異戊烯酯合酶)、約10個異戊烯單元-15個異戊烯單元、約15個異戊烯單元-20個異戊烯單元、約20個異戊烯單元-25個異戊烯單元、約25個異戊烯單元-30個異戊烯單元、約30個異戊烯單元-40個異戊烯單元、約40個異戊烯單元-50個異戊烯單元、約50個異戊烯單元-100個異戊烯單元、約100個異戊烯單元-250個異戊烯單元、約250個異戊烯單元-500個異戊烯單元、約500個異戊烯單元-1000個異戊烯單元、約1000個異戊烯單元-2000個異戊烯單元、約2000個異戊烯單元-3000個異戊烯單元、約3000個異戊烯單元-4000個異戊烯單元、約4000個異戊烯單元-5000個異戊烯單元、或約5000個異戊烯單元-6000個異戊烯單元或更多。
合適的異戊烯基轉(zhuǎn)移酶包括但不限于:二磷酸e-異戊烯酯合酶,包括但不限于:二磷酸牻牛兒酯(gpp)合酶、二磷酸法呢酯(fpp)合酶、二磷酸牻牛兒基牻牛兒酯(ggpp)合酶、二磷酸六異戊烯酯(hexpp)合酶、二磷酸七異戊烯酯(heppp)合酶、二磷酸八異戊烯酯(opp)合酶、二磷酸茄呢酯(spp)合酶、二磷酸十異戊烯酯(dpp)合酶、糖膠樹膠合酶和古塔膠合酶;以及二磷酸z-異戊烯酯合酶,包括但不限于:二磷酸九異戊烯酯(npp)合酶、二磷酸十一異戊烯酯(upp)合酶、二磷酸脫氫多萜酯(dehydrodolichyldiphosphate)合酶、二磷酸二十異戊烯酯合酶、天然橡膠合酶和其它二磷酸z-異戊烯酯合酶。
已知各種物種的多種異戊烯基轉(zhuǎn)移酶的核苷酸序列,可用于或修飾后用于產(chǎn)生所述遺傳修飾的宿主細(xì)胞。本領(lǐng)域已知編碼異戊烯基轉(zhuǎn)移酶的核苷酸序列。參見例如,人焦磷酸法呢酯合成酶mrna(genbank登錄號j05262;智人);二磷酸法呢酯合成酶(fpp)基因(genbank登錄號j05091;釀酒酵母);二磷酸單異戊烯酯:二磷酸二甲基烯丙酯異構(gòu)酶基因(j05090;釀酒酵母);wang和ohnuma(2000)biochim.biophys.acta1529:33-48;美國專利號6,645,747;擬南芥焦磷酸法呢酯合成酶2(fps2)/fpp合成酶2/二磷酸法呢酯合酶2(at4g17190)mrna(genbank登錄號nm_202836);銀杏(ginkgobiloba)二磷酸牻牛兒基牻牛兒酯合酶(ggpps)mrna(genbank登錄號ay371321);擬南芥焦磷酸牻牛兒基牻牛兒酯合酶(ggps1)/ggpp合成酶/法呢基轉(zhuǎn)移酶(at4g36810)mrna(genbank登錄號nm_119845);細(xì)長聚球藻(synechococcuselongatus)的二磷酸法呢基、牻牛兒基牻牛兒基、牻牛兒基法呢基、六異戊烯基、七異戊烯基酯合酶基因(self-hepps)(genbank登錄號ab016095);等。
萜合酶
在一些實施方式中,遺傳修飾本發(fā)明遺傳修飾的宿主細(xì)胞,以包含含有編碼萜合酶的核苷酸序列的核酸。在一些實施方式中,萜合酶是修飾fpp產(chǎn)生倍半萜的萜合酶。在其它實施方式中,萜合酶是修飾gpp產(chǎn)生單萜的萜合酶。在其它實施方式中,萜合酶是修飾ggpp產(chǎn)生二萜的萜合酶。
本領(lǐng)域已知編碼萜合酶的核苷酸序列,可用編碼萜合酶的任何已知核苷酸序列遺傳修飾宿主細(xì)胞。例如,已知并可采用以下編碼萜合酶的核苷酸序列(后面是它們的genbank登錄號和鑒定到它們的生物):(-)-大根香葉烯d合酶mrna(ay438099;小葉楊毛果亞種(populusbalsamiferasubsp.trichocarpa)×三角楊(populusdeltoids));e,e-α-法呢烯合酶mrna(ay640154;黃瓜(cucumissativus));1,8-桉油素合酶mrna(ay691947;擬南芥(arabidopsisthaliana));萜合酶5(tps5)mrna(ay518314;玉米(zeamays));萜合酶4(tps4)mrna(ay518312;玉米);香葉烯/羅勒烯合酶(tps10)(at2g24210)mrna(nm_127982;擬南芥);牻牛兒醇合酶(ges)mrna(ay362553;羅勒(ocimumbasilicum));蒎烯合酶mrna(ay237645;piceasitchensis);香葉烯合酶1e20mrna(ay195609;金魚草(antirrhinummajus));(e)-β-羅勒烯合酶(0e23)mrna(ay195607;金魚草(antirrhinummajus));e-β-羅勒烯合酶mrna(ay151086;金魚草);萜合酶mrna(af497492;擬南芥);(-)-莰烯合酶(ag6.5)mrna(u87910;北美冷杉(abiesgrandis));(-)-4s-苧烯合酶基因(如基因組序列)(af326518;北美冷杉);δ-蛇床烯合酶基因(af326513;北美冷杉);紫穗槐-4,11-二烯合酶mrna(aj251751;黃花蒿(artemisiaannua));e-α-紅沒藥烯合酶mrna(af006195;北美冷杉);γ-葎草烯合酶mrna(u92267;北美冷杉);δ-蛇床烯合酶mrna(u92266;北美冷杉);蒎烯合酶(ag3.18)mrna(u87909;北美冷杉);香葉烯合酶(ag2.2)mrna(u87908;北美冷杉)等。
密碼子使用
在一些實施方式中,修飾用于產(chǎn)生本發(fā)明遺傳修飾的宿主細(xì)胞的核苷酸序列,以使該核苷酸序列反映出具體宿主細(xì)胞優(yōu)選的密碼子。例如,在一些實施方式中,根據(jù)酵母優(yōu)選的密碼子修飾核苷酸序列。參見例如,bennetzen和hall(1982)j.biol.chem.257(6):3026-3031。作為另一個非限制性例子,在其它實施方式中,根據(jù)大腸桿菌優(yōu)選的密碼子修飾核苷酸序列。參見例如,gouy和gautier(1982)nucleicacidsres.10(22):7055-7074;eyre-walker(1996)mol.biol.evol.13(6):864-872。也參見nakamura等(2000)nucleicacidsres.28(1):292。
其它遺傳修飾
在一些實施方式中,本發(fā)明遺傳修飾的宿主細(xì)胞指經(jīng)過以下修飾的宿主細(xì)胞:遺傳修飾以包含一種或多種含有編碼類異戊烯修飾酶的核苷酸序列的核酸;以及進一步遺傳修飾以提高萜生物合成途徑中間體產(chǎn)生,和/或進一步遺傳修飾以使內(nèi)源性萜生物合成途徑基因功能損傷。提到內(nèi)源性萜生物合成途徑基因時,本文所用術(shù)語“功能損傷”指遺傳修飾萜生物合成途徑基因,導(dǎo)致該基因編碼的基因產(chǎn)物的產(chǎn)量低于正常水平,和/或沒有功能。
提高內(nèi)源性萜生物合成途徑中間體產(chǎn)量的遺傳修飾包括但不限于:導(dǎo)致宿主細(xì)胞中磷酸轉(zhuǎn)乙酰酶水平和/或活性降低的遺傳修飾。通過增加乙酰輔酶a的細(xì)胞內(nèi)濃度而增加萜生物合成途徑中間體的細(xì)胞內(nèi)濃度。大腸桿菌將大量的醋酸酯形式的細(xì)胞內(nèi)乙酰輔酶a分泌入培養(yǎng)基中。編碼磷酸轉(zhuǎn)乙酰酶(pta,負(fù)責(zé)乙酰輔酶a轉(zhuǎn)化形成醋酸酯的第一個酶)的基因的缺失將減少醋酸酯分泌。降低原核宿主細(xì)胞中磷酸轉(zhuǎn)乙酰酶的水平和/或活性的遺傳修飾是特別有用的,其中,遺傳修飾的宿主細(xì)胞是用包含編碼一種或多種mev途徑基因產(chǎn)物的核苷酸序列的核酸遺傳修飾的宿主細(xì)胞。
在一些實施方式中,導(dǎo)致原核宿主細(xì)胞中磷酸轉(zhuǎn)乙酰酶水平降低的遺傳修飾是使原核宿主細(xì)胞編碼磷酸轉(zhuǎn)乙酰酶的內(nèi)源性pta基因功能損傷的遺傳突變??梢远喾N方式使pta基因功能損傷,包括:插入可動遺傳元件(例如轉(zhuǎn)座子等);缺失所有或部分基因,導(dǎo)致不形成基因產(chǎn)物、或產(chǎn)物被截短且在將乙酰輔酶a轉(zhuǎn)化為乙酸酯的過程中沒有功能;基因突變,導(dǎo)致不形成基因產(chǎn)物、產(chǎn)物被截短且在將乙酰輔酶a轉(zhuǎn)化為乙酸酯的過程中沒有功能;缺失或突變一個或多個控制pta基因表達(dá)的控制元件,導(dǎo)致不產(chǎn)生基因產(chǎn)物;等等。
在一些實施方式中,缺失了遺傳修飾宿主細(xì)胞的內(nèi)源性pta基因??墒褂萌魏稳笔Щ虻姆椒?。pta基因缺失方法的一個非限制性例子是使用λred重組系統(tǒng)。datsenko和wanner(2000)procnatlacadsciusa97(12):第6640-5頁。在一些實施方式中,pta基因在用包含編碼mk、pmk、mpd和idi的核苷酸序列的核酸遺傳修飾的宿主細(xì)胞(如大腸桿菌)中缺失。在一些實施方式中,pta基因在用包含編碼mk、pmk、mpd和ipp的核苷酸序列的核酸遺傳修飾的宿主細(xì)胞(如大腸桿菌)中缺失。在一些實施方式中,pta基因在用包含編碼mk、pmk、mpd、ipp和異戊烯基轉(zhuǎn)移酶的核苷酸序列的核酸遺傳修飾的宿主細(xì)胞(如大腸桿菌)中缺失。
在一些實施方式中,本發(fā)明遺傳修飾的宿主細(xì)胞是經(jīng)遺傳修飾包含一種或多種核酸的宿主細(xì)胞,所述核酸包含編碼mev生物合成途徑基因產(chǎn)物的核苷酸序列;和經(jīng)進一步遺傳修飾使內(nèi)源性dxp生物合成途徑基因功能損傷的核苷酸序列。在其它實施方式中,本發(fā)明遺傳修飾的宿主細(xì)胞是經(jīng)遺傳修飾包含一種或多種核酸的宿主細(xì)胞,所述核酸包含編碼dxp生物合成途徑基因產(chǎn)物的核苷酸序列;和經(jīng)進一步遺傳修飾以使內(nèi)源性mev生物合成途徑基因功能損傷的核苷酸序列。
在一些實施方式中,當(dāng)本發(fā)明遺傳修飾的宿主細(xì)胞是用包含編碼一種或多種mev途徑基因產(chǎn)物的核苷酸序列的核酸遺傳修飾的原核宿主細(xì)胞時,進一步遺傳修飾宿主細(xì)胞,以使一種或多種內(nèi)源性dxp途徑基因功能損傷。可被功能損傷的dxp途徑基因包括編碼任何以下dxp基因產(chǎn)物的一種或多種基因:l-脫氧-d-木酮糖-5-磷酸酯合酶、1-脫氧-d-木酮糖-5-磷酸酯還原酮異構(gòu)酶(reductoisomerase)、4-二磷酸胞苷酰-2-c-甲基-d-赤蘚醇合酶、4-二磷酸胞苷酰-2-c-甲基-d-赤蘚醇激酶、2c-甲基-d-赤蘚醇2,4-環(huán)二磷酸酯合酶和1-羥基-2-甲基-2-(e)-丁烯基4-二磷酸酯合酶。
可以多種方式使內(nèi)源性dxp途徑基因功能損傷,包括插入可動遺傳元件(例如,轉(zhuǎn)座子等);缺失所有或部分基因,導(dǎo)致不形成基因產(chǎn)物、或產(chǎn)物被截短且沒有酶活性;基因突變,導(dǎo)致不形成基因產(chǎn)物、產(chǎn)物被截短且沒有酶功能;缺失或突變一個或多個控制基因表達(dá)的控制元件,導(dǎo)致不產(chǎn)生基因產(chǎn)物;等等。
在其它實施方式中,當(dāng)本發(fā)明遺傳修飾的宿主細(xì)胞是用包含編碼一種或多種dxp途徑基因產(chǎn)物的核苷酸序列的核酸遺傳修飾的原核宿主細(xì)胞時,進一步遺傳修飾宿主細(xì)胞,以使一種或多種內(nèi)源性mev途徑基因功能損傷??杀还δ軗p傷的內(nèi)源性mev途徑基因包括編碼任何以下mev基因產(chǎn)物的一種或多種基因:hmgs、hmgr、mk、pmk、mpd和idi??梢远喾N方式使內(nèi)源性mev途徑基因功能損傷,包括插入可動遺傳元件(例如,轉(zhuǎn)座子等);缺失所有或部分基因,導(dǎo)致不形成基因產(chǎn)物、或產(chǎn)物被截短且沒有酶活性;基因突變,導(dǎo)致不形成基因產(chǎn)物、產(chǎn)物被截短且沒有酶功能;缺失或突變一個或多個控制基因表達(dá)的控制元件,導(dǎo)致不產(chǎn)生基因產(chǎn)物;等等。
包含本發(fā)明遺傳修飾的宿主細(xì)胞的組合物
本發(fā)明還提供包含本發(fā)明遺傳修飾宿主細(xì)胞的組合物。本發(fā)明組合物包含本發(fā)明遺傳修飾的宿主細(xì)胞;并且在一些實施方式中還包含一種或多種其它成分,這些成分的選擇部分基于遺傳修飾宿主細(xì)胞的特定用途。合適的成分包括但不限于:鹽;緩沖劑;穩(wěn)定劑;蛋白酶抑制劑;核酸酶抑制劑;細(xì)胞膜和/或細(xì)胞壁保存性化合物,例如甘油、二甲亞砜等;適合細(xì)胞的營養(yǎng)培養(yǎng)基;等等。在一些實施方式中,凍干細(xì)胞。
轉(zhuǎn)基因植物
在一些實施方式中,本發(fā)明核酸或本發(fā)明表達(dá)載體(如本發(fā)明類異戊烯修飾酶核酸或包含類異戊烯修飾酶核酸的本發(fā)明表達(dá)載體)用作轉(zhuǎn)基因,以產(chǎn)生能生產(chǎn)編碼的類異戊烯修飾酶的轉(zhuǎn)基因植物。因此,本發(fā)明還提供了轉(zhuǎn)基因植物,該植物包含含有本發(fā)明核酸的轉(zhuǎn)基因,所述本發(fā)明核酸包含編碼具有萜羥化酶和/或萜氧化酶活性的酶(如上所述)的核苷酸序列。在一些實施方式中,轉(zhuǎn)基因植物的基因組包含本發(fā)明核酸。在一些實施方式中,轉(zhuǎn)基因植物是遺傳修飾純合的。在一些實施方式中,轉(zhuǎn)基因植物是遺傳修飾雜合的。
在一些實施方式中,與同一物種的對照植物如非轉(zhuǎn)基因植物(不包含編碼該多肽的轉(zhuǎn)基因的植物)的多肽產(chǎn)量相比,本發(fā)明轉(zhuǎn)基因植物產(chǎn)生的具有萜羥化酶和/或氧化酶活性的轉(zhuǎn)基因編碼多肽的產(chǎn)量高出至少約50%、至少約2倍、至少約5倍、至少約10倍、至少約25倍、至少約50倍或至少約100倍或更高。
在一些實施方式中,本發(fā)明轉(zhuǎn)基因植物是非轉(zhuǎn)基因?qū)φ罩参锏霓D(zhuǎn)基因型式,該非轉(zhuǎn)基因?qū)φ罩参锿ǔ.a(chǎn)生的類異戊烯化合物是具有萜羥化酶和/或氧化酶活性的轉(zhuǎn)基因編碼多肽產(chǎn)生的化合物或者是該轉(zhuǎn)基因編碼多肽的下游產(chǎn)物;與同一物種的對照植物如非轉(zhuǎn)基因植物(不包含編碼該多肽的轉(zhuǎn)基因的植物)的類異戊烯化合物產(chǎn)量相比,該轉(zhuǎn)基因植物的類異戊烯化合物產(chǎn)量高出至少約50%、至少約2倍、至少約5倍、至少約10倍、至少約25倍、至少約50倍或至少約100倍或更高。
本領(lǐng)域熟知將外源性核酸引入植物細(xì)胞的方法。認(rèn)為這種植物細(xì)胞被“轉(zhuǎn)化”,如上所述。合適方法包括病毒感染(如雙鏈dna病毒)、轉(zhuǎn)染、接合、原生質(zhì)體融合、電穿孔、基因槍技術(shù)、磷酸鈣沉淀、直接顯微注射、碳化硅頸須(whisker)技術(shù)、土壤桿菌介導(dǎo)的轉(zhuǎn)化等。方法的選擇通常取決于轉(zhuǎn)化的細(xì)胞類型和發(fā)生轉(zhuǎn)化的環(huán)境(即體外、離體或體內(nèi))。
基于土壤細(xì)菌根癌土壤桿菌(agrobacteriumtumefaciens)的轉(zhuǎn)化方法特別適用于將外源性核酸分子引入維管植物。野生型土壤桿菌含有指導(dǎo)在宿主植物上產(chǎn)生致瘤性冠癭生長的ti(腫瘤誘導(dǎo))質(zhì)粒。將ti質(zhì)粒的腫瘤誘導(dǎo)型t-dna區(qū)轉(zhuǎn)移給植物基因組需要ti質(zhì)粒編碼的毒力基因以及t-dna邊界,它們是勾劃出待轉(zhuǎn)移區(qū)域的一組同向dna重復(fù)。基于土壤桿菌的載體是修飾的ti質(zhì)粒,其中腫瘤誘導(dǎo)功能被待引入植物宿主的感興趣核酸序列所取代。
土壤桿菌介導(dǎo)的轉(zhuǎn)化通常采用共同整合載體,或者優(yōu)選采用雙元載體系統(tǒng),其中ti質(zhì)粒的元件在輔助載體和穿梭載體之間分開,所述輔助載體永久地滯留在土壤桿菌宿主中并且攜帶毒力基因,所述穿梭載體含有以t-dna序列為邊界的感興趣基因。本領(lǐng)域熟知各種雙元載體,并且可購自(例如)克隆太克技術(shù)公司(clontech)(加利福尼亞州帕洛阿爾托)。本領(lǐng)域熟知(例如)將土壤桿菌與培養(yǎng)的植物細(xì)胞或創(chuàng)傷組織如葉組織、根外植體、下胚軸(hypocotyledons)、莖塊或塊莖共同培養(yǎng)的方法。參見例如,glick和thompson(編),methodsinplantmolecularbiologyandbiotechnology(植物分子生物學(xué)和生物技術(shù)的方法),佛羅里達(dá)州伯卡拉頓(bocaraton,fla.):crc出版社(crcpress)(1993)。
土壤桿菌介導(dǎo)的轉(zhuǎn)化可用于產(chǎn)生各種轉(zhuǎn)基因維管植物(wang等,同上,1995)包括至少一種桉樹屬(eucalyptus)和豆科牧草(foragelegumes)如苜蓿(紫花苜蓿);牛角花、白三葉草、鉛筆花屬(stylosanthes)、羅頓豆(lotononisbainessii)和紅豆草。
也可采用微粒介導(dǎo)的轉(zhuǎn)化產(chǎn)生本發(fā)明轉(zhuǎn)基因植物。首先由klein等(nature327:70-73(1987))描述的這種方法依賴于通過氯化鈣、亞精胺或聚乙二醇沉淀涂上所需核酸分子的微粒如金或鎢。用一種裝置如biolisticpd-1000(伯樂公司(biorad);加利福尼亞州賀求斯(herculescalif.))使微粒高速射入被子植物組織中。
將本發(fā)明核酸引入植物的方式應(yīng)能使該核酸能夠通過(例如)體內(nèi)或離體方法進入植物細(xì)胞?!绑w內(nèi)”指通過(例如)浸滲使核酸進入植物活體中。“離體”指在植株外修飾細(xì)胞或外植體,然后使該細(xì)胞或器官再生為植株。已經(jīng)描述了適用于穩(wěn)定轉(zhuǎn)化植物細(xì)胞或建立轉(zhuǎn)基因植物的許多載體,包括weissbach和weissbach(1989)methodsforplantmolecularbiology(植物分子生物學(xué)方法),學(xué)術(shù)出版社;和gelvin等,(1990)plantmolecularbiologymanual(植物分子生物學(xué)手冊),克魯維學(xué)術(shù)出版集團所述的載體。具體例子包括衍生自根癌土壤桿菌的ti質(zhì)粒的載體,以及herrera-estrella等(1983)nature303:209,bevan(1984)nuclacidres.12:8711-8721,klee(1985)bio/technology3:637-642所述的載體?;蛘?,可通過游離dna遞送技術(shù)采用非ti載體將dna轉(zhuǎn)移到植物和細(xì)胞中。采用這些方法時,可產(chǎn)生轉(zhuǎn)基因植物如小麥、水稻(christou(1991)bio/technology9:957-962)和玉米(gordon-kamm(1990)plantcell2:603-618)。采用基因槍進行直接dna遞送技術(shù)時,不成熟的胚胎也可能是良好的單子葉植物靶組織(weeks等(1993)plantphysiol102:1077-1084;vasil(1993)bio/technolo10:667-674;wan和lemeaux(1994)plantphysiol104:37-48;對于土壤桿菌介導(dǎo)的dna轉(zhuǎn)移參見(ishida等(1996)naturebiotech14:745-750)。將dna引入葉綠體的示范性方法是生物射彈轟擊、聚乙二醇轉(zhuǎn)化原生質(zhì)體和顯微注射(danieli等,nat.biotechnol16:345-348,1998;staub等,nat.biotechnol18:333-338,2000;o’neill等,plantj.3:729-738,1993;knoblauch等,nat.biotechnol17:906-909;美國專利5,451,513、5,545,817、5,545,818和5,576,198;國際申請wo95/16783;以及boynton等,methodsinenzymology217:510-536(1993),svab等,proc.natl.acad.sci.usa90:913-917(1993)和mcbride等,proc.natl.acad.sci.usa91:7301-7305(1994))。適用于生物射彈轟擊、聚乙二醇轉(zhuǎn)化原生質(zhì)體和顯微注射方法的任何載體均可用作葉綠體轉(zhuǎn)化的靶向載體。任何雙鏈dna載體均可用作轉(zhuǎn)化載體,尤其是當(dāng)引入方法不采用土壤桿菌時。
可進行遺傳修飾的植物包括谷類、牧草作物、水果、蔬菜、油籽作物、棕櫚、林業(yè)植物和藤本植物。可修飾的植物的具體例子如下:玉米、香蕉、花生、紫花豌豆、向日葵、番茄、蕓苔、煙草、小麥、大麥、燕麥、馬鈴薯、大豆、棉花、康乃馨、高粱、羽扇豆和稻。其它例子包括黃花蒿,或者已知能產(chǎn)生感興趣的類異戊烯化合物的其它植物。
本發(fā)明也提供了轉(zhuǎn)化的植物細(xì)胞,含有轉(zhuǎn)化的植物細(xì)胞的組織、植株和產(chǎn)品。本發(fā)明轉(zhuǎn)化細(xì)胞和含有該細(xì)胞的組織和產(chǎn)品的特征是本發(fā)明核酸整合到基因組中,和該植物細(xì)胞能產(chǎn)生具有萜羥化酶和/或萜氧化酶活性,如倍半萜氧化酶活性的多肽。本發(fā)明重組植物細(xì)胞可作為重組細(xì)胞群體使用,或作為組織、種子、整個植株、莖、果實、葉、根、花、莖、塊莖、谷粒、動物飼料、大片植物等使用。
本發(fā)明也提供了本發(fā)明轉(zhuǎn)基因植物的繁殖材料,所述繁殖材料包括種子、后代植株和無性繁殖材料。
產(chǎn)生類異戊烯化合物的方法
本發(fā)明提供了產(chǎn)生類異戊烯化合物的方法。在一些實施方式中,該方法通常包括用合適培養(yǎng)基培養(yǎng)遺傳修飾的宿主細(xì)胞,其中所述宿主細(xì)胞是用本發(fā)明核酸遺傳修飾的,本發(fā)明核酸包含編碼類異戊烯修飾酶的核苷酸序列。在其它實施方式中,該方法通常包括在有利于產(chǎn)生編碼的類異戊烯修飾酶的條件下維持本發(fā)明轉(zhuǎn)基因植物。產(chǎn)生類異戊烯修飾酶則導(dǎo)致產(chǎn)生類異戊烯化合物。例如,在一些實施方式中,該方法通常包括用合適培養(yǎng)基培養(yǎng)遺傳修飾的宿主細(xì)胞,其中所述宿主細(xì)胞是用本發(fā)明核酸遺傳修飾的,本發(fā)明核酸包含編碼萜氧化酶的核苷酸序列。產(chǎn)生萜氧化酶則導(dǎo)致產(chǎn)生類異戊烯化合物。該方法一般在體外進行,但也考慮到在體內(nèi)產(chǎn)生類異戊烯化合物。在一些實施方式中,該宿主細(xì)胞是真核細(xì)胞,如酵母細(xì)胞。在其它實施方式中,該宿主細(xì)胞是原核細(xì)胞。在一些實施方式中,該宿主細(xì)胞是植物細(xì)胞。在一些實施方式中,在本發(fā)明轉(zhuǎn)基因植物中進行該方法。
細(xì)胞一般采用兩種途徑之一產(chǎn)生類異戊烯或類異戊烯前體(如ipp、二磷酸多異戊烯酯等)。圖13-15用于說明細(xì)胞用以產(chǎn)生類異戊烯化合物或前體如二磷酸多異戊烯酯的途徑。
圖13顯示了類異戊烯途徑,包括用異戊烯基轉(zhuǎn)移酶修飾二磷酸異戊烯酯(ipp)和/或其異構(gòu)體二磷酸二甲基烯丙酯(dmapp),產(chǎn)生二磷酸多異戊烯酯二磷酸牻牛兒酯(gpp)、二磷酸法呢酯(fpp)和二磷酸牻牛兒基牻牛兒酯(ggpp)。gpp和fpp進一步由萜合酶修飾,分別產(chǎn)生單萜和倍半萜;ggpp進一步由萜合酶修飾,形成二萜和類葫蘿卜素。ipp和dmapp由以下兩種途徑中的一種產(chǎn)生:甲羥戊酸(mev)途徑和1-脫氧-d-木酮糖-5-磷酸酯(dxp)途徑。
圖14示意性顯示了mev途徑,其中,乙酰輔酶a通過一系列反應(yīng)轉(zhuǎn)化為ipp。
圖15示意性顯示了dxp途徑,其中,丙酮酸和d-甘油醛-3-磷酸酯通過一系列反應(yīng)轉(zhuǎn)化為ipp和dmapp。除植物細(xì)胞之外的真核細(xì)胞僅利用mev類異戊烯途徑以使乙酰輔酶a(乙酰-coa)轉(zhuǎn)化為ipp,然后異構(gòu)化為dmapp。植物同時利用mev和甲羥戊酸非依賴性、或dxp途徑來合成類異戊烯。除一些例外情況,原核生物利用dxp途徑通過分支點分別產(chǎn)生ipp和dmapp。
在一些實施方式中,用包含編碼倍半萜氧化酶的核苷酸序列的本發(fā)明核酸遺傳修飾宿主細(xì)胞,并且用包含倍半萜的培養(yǎng)基培養(yǎng)宿主細(xì)胞。倍半萜進入細(xì)胞,在細(xì)胞中被倍半萜氧化酶修飾。在許多實施方式中,倍半萜選自紫穗槐二烯、異長葉烯、(-)-α-反式-香檸檬烯、(-)-β-欖香烯、(+)-大根香葉烯a、大根香葉烯b、(+)-γ-古蕓烯、(+)-喇叭烯、十氫二甲基甲乙烯基萘酚(neointermedeol)、(+)-β-蛇床烯和(+)-朱欒倍半萜。在一些實施方式中,倍半萜氧化酶是紫穗槐二烯氧化酶,用含有紫穗槐-4,11-二烯氧化酶的培養(yǎng)基培養(yǎng)宿主細(xì)胞。
在其它實施方式中,還用含有編碼萜合酶的核苷酸序列的核酸遺傳修飾宿主細(xì)胞。因此,例如,用含有編碼萜合酶和類異戊烯修飾酶(如倍半萜氧化酶)的核苷酸序列的一種或多種核酸遺傳修飾宿主細(xì)胞。用合適培養(yǎng)基培養(yǎng)這種宿主細(xì)胞能產(chǎn)生萜合酶和類異戊烯修飾酶(如倍半萜氧化酶)。例如,萜合酶修飾焦磷酸法呢酯,以產(chǎn)生所述倍半萜氧化酶的倍半萜底物。
根據(jù)培養(yǎng)宿主細(xì)胞的培養(yǎng)基和宿主細(xì)胞通過dxp途徑或是甲羥戊酸途徑合成ipp,在一些實施方式中,宿主細(xì)胞還可包含其它遺傳修飾。例如,在一些實施方式中,宿主細(xì)胞是沒有內(nèi)源性甲羥戊酸途徑的宿主細(xì)胞,例如,宿主細(xì)胞是通常不通過甲羥戊酸途徑合成ipp或甲羥戊酸的宿主細(xì)胞。例如,在一些實施方式中,宿主細(xì)胞是通常不通過甲羥戊酸途徑合成ipp的宿主細(xì)胞,用包含編碼甲羥戊酸途徑中兩種或多種酶、ipp異構(gòu)酶、異戊烯基轉(zhuǎn)移酶、萜合酶和類異戊烯修飾酶(如本發(fā)明核酸編碼的類異戊烯修飾酶)的核苷酸序列的一種或多種核酸遺傳修飾宿主細(xì)胞。培養(yǎng)這種宿主細(xì)胞能產(chǎn)生甲羥戊酸途徑酶、ipp異構(gòu)酶、異戊烯基轉(zhuǎn)移酶、萜合酶和類異戊烯修飾酶(如倍半萜氧化酶)。產(chǎn)生甲羥戊酸途徑酶、ipp異構(gòu)酶、異戊烯基轉(zhuǎn)移酶、萜合酶和類異戊烯修飾酶(如倍半萜氧化酶)則導(dǎo)致產(chǎn)生類異戊烯化合物。在許多實施方式中,異戊烯基轉(zhuǎn)移酶是fpp合酶,它能產(chǎn)生本發(fā)明核酸編碼的倍半萜氧化酶的倍半萜底物;產(chǎn)生倍半萜氧化酶則導(dǎo)致氧化宿主細(xì)胞中的倍半萜底物。適合采用編碼甲羥戊酸途徑酶、ipp異構(gòu)酶、異戊烯基轉(zhuǎn)移酶和萜合酶的任何核酸。例如,合適核酸參見例如martin等(2003)同上。
在一些上述實施方式中,用含有編碼兩種或多種甲羥戊酸途徑酶的核苷酸序列的一種或多種核酸遺傳修飾宿主細(xì)胞時,所述兩種或多種甲羥戊酸途徑酶包括mk、pmk和mpd,并在含有甲羥戊酸的培養(yǎng)基中培養(yǎng)宿主細(xì)胞。在其它實施方式中,所述兩種或多種甲羥戊酸途徑酶包括乙酰乙酰coa硫解酶、hmgs、hmgr、mk、pmk和mpd。
在一些實施方式中,宿主細(xì)胞是通常不通過甲羥戊酸途徑合成ipp的宿主細(xì)胞,如上所述遺傳修飾宿主細(xì)胞,宿主細(xì)胞還包含功能損傷的dxp途徑。
在一些實施方式中,用含有編碼細(xì)胞色素p450還原酶(cpr)的核苷酸序列的核酸遺傳修飾宿主細(xì)胞。已知各種cpr核苷酸序列,可采用任何已知的cpr編碼核酸,只要編碼的cpr具有由nadph傳遞電子的活性。在一些實施方式中,cpr編碼核酸編碼能將電子由nadph傳遞給由本發(fā)明類異戊烯修飾酶編碼核酸編碼的類異戊烯修飾酶,如倍半萜氧化酶的cpr。在一些實施方式中,cpr編碼核酸是本發(fā)明cpr核酸。
本發(fā)明方法可用于產(chǎn)生各種類異戊烯化合物,包括但不限于:青蒿酸(如倍半萜底物是紫穗槐-4,11-二烯時)、異長葉烯醇(如底物是異長葉烯時)、(e)-反式-香檸檬-2,12-二烯-14-醇(如底物是(-)-α-反式-香檸檬烯時)、(-)-欖香-1,3,11(13)-三烯-12-醇(如底物是(-)-β-欖香烯時)、大牻牛兒三烯醇(germacra)-1(10),4,11(13)-三烯-12-醇(如底物是(+)-大根香葉烯a時)、大根香葉烯b醇(如底物是大根香葉烯b時)、5,11(13)-愈創(chuàng)木二烯-12-醇(如底物是(+)-γ-古蕓烯時)、喇叭烯醇(如底物是(+)-喇叭烯時)、4β-h-桉葉-11(13)-烯-4,12-二醇(如底物是十氫二甲基甲乙烯基萘酚(neointermedeol)時)、(+)-β-廣木香醇(如底物是(+)-β-蛇床烯等時);和任何上述物質(zhì)的衍生物。
在一些實施方式中,用合適培養(yǎng)基(如luria-bertoni肉湯,任選補充有一種或多種其它物質(zhì),例如誘導(dǎo)物(例如編碼類異戊烯修飾酶的核苷酸序列在誘導(dǎo)型啟動子控制下時)等)培養(yǎng)本發(fā)明遺傳修飾的宿主細(xì)胞;用有機溶劑如十二烷覆蓋培養(yǎng)基,形成有機層。遺傳修飾的宿主細(xì)胞產(chǎn)生的類異戊烯化合物分配到有機層中,由有機層純化該化合物。在一些實施方式中,當(dāng)編碼類異戊烯修飾酶的核苷酸序列操作性連接于誘導(dǎo)型啟動子時,將誘導(dǎo)物加入培養(yǎng)基中;適當(dāng)時間后,由覆蓋在培養(yǎng)基上的有機層分離類異戊烯化合物。
在一些實施方式中,將類異戊烯化合物與有機層中可能存在的其它產(chǎn)物分離開。不難采用(如)標(biāo)準(zhǔn)的色譜方法將類異戊烯化合物與有機層中可能存在的其它產(chǎn)物分離開。
在一些實施方式中,在無細(xì)胞反應(yīng)中用化學(xué)方法進一步修飾本發(fā)明方法合成的類異戊烯化合物。例如,在一些實施方式中,由培養(yǎng)基和/或細(xì)胞裂解物分離青蒿酸,在無細(xì)胞反應(yīng)中用化學(xué)方法進一步修飾青蒿酸,以產(chǎn)生青蒿素。
在一些實施方式中,類異戊烯化合物是純凈的,例如,純度為至少約40%、至少約50%、至少約60%、至少約70%、至少約80%、至少約90%、至少約95%、至少約98%、或高于98%,提到類異戊烯化合物時,“純凈”指不含其它類異戊烯化合物、大分子、污染物等的類異戊烯化合物。
實施例
提出以下實施例,以便向本領(lǐng)域普通技術(shù)人員提供如何制備和使用本發(fā)明的完整公開和描述,但并不旨在限制發(fā)明人所認(rèn)定的發(fā)明范圍,它們也不代表以下實驗是進行的所有或僅有實驗。努力確保所用數(shù)值(如量、溫度等)的準(zhǔn)確性,但應(yīng)該允許一些實驗誤差和偏差。除非另有說明,份數(shù)是重量份數(shù),分子量是重均分子量,溫度是攝氏度,壓力是大氣壓或近大氣壓。可采用標(biāo)準(zhǔn)縮寫,例如:bp,堿基對;kb,千堿基;pl,皮升;s或sec,秒;min,分鐘;h或hr,小時;aa,氨基酸;kb,千堿基;bp,堿基對;nt,核苷酸;i.m.,肌肉內(nèi);i.p.,腹膜內(nèi);s.c.,皮下;等等。
實施例1:類異戊烯修飾酶的克隆和測序
已知能羥化萜的大多數(shù)酶是細(xì)胞色素p450。將萜羥化酶的所有可得氨基酸序列與向日葵和萵苣的細(xì)胞色素p450的氨基酸序列進行比對。這兩種植物屬于菊科(asteraceae),黃花蒿也屬于這一科。類異戊烯修飾酶如cyp71d家族聚集在一起,這表明它們有共同的祖先。設(shè)計簡并式聚合酶鏈反應(yīng)(pcr)引物,這些引物用于擴增菊科cyp71d家族的基因。
克隆cyp71av1(也稱為cyp71d-a4或amo)和cprcdna。通過supersmartpcrcdna合成試劑盒(bd生物科學(xué)公司(bdbioscience))用由黃花蒿富毛狀體(trichome-enriched)細(xì)胞純化的50ng總rna制備cdna庫。由萵苣和向日葵cyp71亞家族的保守氨基酸基序設(shè)計簡并p450引物;[y/q]g[e/d][h/y]wr的引物1(正向)和fiperf的引物2(反向)(表i提供了引物的序列信息)。
采用這些引物和黃花蒿cdna的聚合酶鏈反應(yīng)(pcr)產(chǎn)生1-kbdna片段。所用pcr程序是7個退火溫度為48℃的循環(huán)和27個退火溫度為55℃的循環(huán)。擴增基因片段的推定氨基酸與向日葵(qh_ca_contig1442)和萵苣(qg_ca_contig7108)毗連群的氨基酸相同性分別為85%和88%??梢栽赾gpdb.ucdavis.edu上找到菊科est-數(shù)據(jù)庫。采用由保守性qyehfnki(seqidno:32)和cgdakgma(seqidno:33)基序分別設(shè)計的正向引物(引物3)和反向引物(引物4)分離黃花蒿cpr片段。所用的pcr程序是30個退火溫度為50℃的循環(huán)。用rlm-race試劑盒(安必昂公司(ambion))確定cyp71av1(“cyp71d-a4”)和cpr的5’-和3’-端序列,然后從黃花蒿葉cdna中回收全長cdna。在flag和cmyc標(biāo)記過程中,用pcr擴增cyp71av1和cpr的開放閱讀框并分別連接到pesc-ura(司查塔基公司)的spei和bamhi/sali位點中。在cyp71av1的pcr擴增中,采用引物5和6;在cpr的pcr擴增中,采用引物7和8。所用pcr程序是35個退火溫度為55℃的循環(huán)。對所有克隆進行測序以驗證序列。
植物提取物分析。在混有5.8μm十八烷作為內(nèi)標(biāo)的1ml己烷中劇烈振蕩黃花蒿葉(100-200mg鮮重)2小時。將己烷提取物濃縮至200μl,采用db-xlb柱(0.25mmi.d.x0.25μmx30m,j和w科學(xué)公司(j&wscientific))對1μl樣品進行g(shù)c-ms分析,以確定14個植物樣品的青蒿素含量,如上所述。woerdenbag等(1991)phytochem.anal.,2,215-219。所用的gc爐程序是以5℃/分鐘的升溫速度從100℃至250℃。通過裝有db5柱的gc-fid,用tms-重氮甲烷衍生植物己烷提取物,以確定青蒿酸含量(n=8)。所用的gc爐程序是80℃(保持2分鐘),以20℃/分鐘的升溫速度升溫至140℃,通過以5℃/分鐘的升溫速度升溫至220℃分離產(chǎn)物。青蒿素標(biāo)樣購自密蘇里州圣路易斯的西格馬-奧爾德里奇公司(sigma-aldrich,st.louis,mo)。
合成青蒿醇。將青蒿酸(100.0mg,0.43mmol)溶解于thf(10.0ml),加入lialh4(17.0mg,0.45mmol)。將該不均一混合物保持回流(70℃)15小時。冷卻后,用水3.0ml)和15%naoh水溶液(3.0ml)終止該反應(yīng),攪拌10分鐘,通過硅藻土過濾。分離有機相,用mgso4干燥,用旋轉(zhuǎn)蒸發(fā)器濃縮。用柱色譜(2:1己烷/etoac)純化產(chǎn)物,得到61.0mg(65%產(chǎn)率)無色油狀醇。通過中性氧化鋁的柱色譜(布魯克門(brockman)活性1)進一步去除少量青蒿酸污染物。鑒定數(shù)據(jù)與文獻(xiàn)值一致。
合成青蒿醛。按照文獻(xiàn)報道的方法將青蒿醇氧化成青蒿醛。sharpless等tetrahedronletters17,2503-2506(1976)。氬氣氣氛下在含有rucl2(pph3)3(17.0mg,0.018mmol)和n-甲基嗎啉n-氧化物(60.0mg,0.51mmol)的火焰干燥的10-ml燒瓶中加入丙酮(4.0ml)。通過注射器向該溶液中加入溶解于丙酮(1.0ml)的青蒿醇(55.0mg,0.25mmol)。23℃攪拌該混合物2小時,真空濃縮。用柱色譜(4:1己烷/etoac)純化粗產(chǎn)物,得到32.0mg(59%產(chǎn)率)無色油狀青蒿醛。鑒定數(shù)據(jù)與文獻(xiàn)報道一致。
epy菌株的產(chǎn)生和鑒定
化學(xué)品。十二烷和石竹烯購自密蘇里州圣路易斯的西格馬-奧爾德里奇公司。5-氟乳清酸(5-foa)購自加利弗尼亞州奧倫奇的發(fā)酵研究公司(zymoresearch,orange,ca)。用于配制合成確定(sd)培養(yǎng)基的完全補充混合物購自加利福尼亞州歐文的q生物基因公司(qbiogene,irvine,ca)。所有其它培養(yǎng)基組分均購自西格馬-奧爾德里奇公司或新澤西州富蘭克林湖的貝克頓迪金森公司(becton,dickinson,franklinlakes,nj)。
菌株和培養(yǎng)基。用大腸桿菌菌株dh10b和dh5α進行細(xì)菌轉(zhuǎn)化和質(zhì)粒擴增,以構(gòu)建用于本研究的表達(dá)質(zhì)粒。用含有100mgl-1氨芐青霉素的lb(luria-bertani)培養(yǎng)基37℃培養(yǎng)該菌株,除了用dh5α在含有50mgl-1氨芐青霉素的培養(yǎng)基中培育pδ-ub基質(zhì)粒。
釀酒酵母菌株by4742(brachmann等,yeast14,115-132(1998))是s288c衍生物,將其用作所有酵母菌株的親代菌株。用富ypd培養(yǎng)基培養(yǎng)該菌株。burke等,methodsinyeastgenetics:acoldspringharborlaboratorycoursemanual(酵母遺傳學(xué)方法:冷泉港實驗室教程手冊)(紐約普萊恩維尤的冷泉港實驗室出版社(coldspringharborlaboratorypress,plainview,ny),2000)。用適當(dāng)省去亮氨酸、尿嘧啶、組氨酸和/或甲硫氨酸的sd培養(yǎng)基(burke等,同上)培養(yǎng)工程改造的酵母菌株。為了誘導(dǎo)由gal1啟動子表達(dá)的基因,用2%半乳糖作為唯一碳源培養(yǎng)釀酒酵母菌株。
質(zhì)粒構(gòu)建。為了建立用gal1啟動子表達(dá)ads的質(zhì)粒prs425ads,用引物對9和10(表1)由pads(martin等nat.biotechnol.21:第796-802頁(2003))pcr擴增ads。采用這些引物,將核苷酸序列5'-aaaaca-3'恰好克隆入ads的起始密碼子上游。此共有序列用于有效翻譯ads和本研究所用的其它半乳糖誘導(dǎo)型基因。用spei和hindiii切割擴增產(chǎn)物,并克隆入spei和hindiii消化的prs425gal1中(mumberg等,nucleicacidsresearch22,5767-5768(1994))。
為了整合thmgr的表達(dá)盒,構(gòu)建質(zhì)粒pδ-hmgr。首先,將sacii限制性位點引入prs426gal1(mumberg等,同上)中g(shù)al1啟動子的5’端和cyc1終止子的3’端。為了實現(xiàn)這一目的,用引物對11和12對prs426gal1的啟動子-多克隆位點-終止子盒進行pcr擴增。將擴增產(chǎn)物直接克隆入pvuii消化的prs426gal1中,以構(gòu)建載體prs426-sacii。用引物對13和14由質(zhì)粒prh127-3(donald等,appl.environ.microbiol.63:3341-3344(1997))pcr擴增hmg1的催化結(jié)構(gòu)域。用bamhi和sali切割擴增產(chǎn)物,并克隆入bamhi和xhoi消化的prs426-sacii。用sacii切割prs-hmgr,凝膠提取表達(dá)盒片段并克隆入sacii消化的pδ-ub(lee等,biotechnol.prog.13,368-373(1997))中。
用引物對15和16由質(zhì)粒pbd33pcr擴增upc2的upc2-1等位基因。用bamhi和sali切割擴增產(chǎn)物并克隆入bamhi和xhoi消化的prs426-sacii中,產(chǎn)生質(zhì)粒prs-upc2。為了整合upc2-1,通過用sacii消化prs-upc2和將合適片段移至pδ-ub,以相同方式產(chǎn)生pδ-upc2。
為了用met3啟動子取代erg9啟動子,構(gòu)建質(zhì)粒prs-erg9。質(zhì)粒prh973(gardner等,j.biol.chem.274,31671-31678(1999))含有位于met3啟動子之后的erg9的截短的5'節(jié)段。用apai和clai酶切prh973,并克隆入apai和clai消化的prs403(含有his3選擇性標(biāo)記物)(sikorski等,genetics122,19-27(1989))中。
為了表達(dá)erg20,構(gòu)建質(zhì)粒pδ-erg20。先用sali和xhoi消化質(zhì)粒prs-sacii,產(chǎn)生相容性粘性末端。然后質(zhì)粒自身連接,消除sali和xhoi位點,產(chǎn)生質(zhì)粒prs-sacii-dx。用引物對17和18由by4742的基因組dnapcr擴增erg20。用spei和smai酶切擴增的產(chǎn)物,并克隆入spei和smai消化的prs-sacii-dx。然后用sacii酶切prs-erg20,凝膠抽提表達(dá)盒片段,并克隆入sacii消化的pδ-ub中。
酵母轉(zhuǎn)化和菌株構(gòu)建。釀酒酵母菌株by4742(brachmann等,同上)是s288c的衍生物,將其用作所有釀酒酵母菌株的親代菌株。通過標(biāo)準(zhǔn)的乙酸鋰法轉(zhuǎn)化所有釀酒酵母菌株。gietz,r.d.和woods,r.a.guidetoyeastgeneticsandmolecularandcellbiology(酵母遺傳學(xué)和分子細(xì)胞生物學(xué)的指南),b部分,87-96(圣地亞哥的學(xué)術(shù)出版社公司(academicpressinc,sandiego),2002)。篩選各轉(zhuǎn)化的3-10個菌落,以選擇紫穗槐二烯產(chǎn)量最高的轉(zhuǎn)化子。用質(zhì)粒prs425ads轉(zhuǎn)化菌株by4742并在sd-leu平板上選擇,從而構(gòu)建菌株epy201。用xhoi消化質(zhì)粒pδ-hmgr,然后將dna轉(zhuǎn)化到菌株epy201中。在sd-leu-ura平板上初步選擇后,培養(yǎng)轉(zhuǎn)化子,并接種于含有1gl-15-foa的sd-leu平板上,以選擇ura3標(biāo)記物的缺失。然后,用xhoi-消化的pδ-upc2質(zhì)粒dna轉(zhuǎn)化得到的尿嘧啶營養(yǎng)缺陷型epy208。在sd-leu-ura平板上初步選擇后,培養(yǎng)轉(zhuǎn)化子,并接種于含有1gl-15-foa的sd-leu平板上,以構(gòu)建epy210。用hindii切割質(zhì)粒prs-erg9,以將pmet3-erg9融合物整合到epy208和epy210的erg9基因座上,以分別構(gòu)建epy213和epy225。在sd-leu-his-met平板上選擇這些菌株。然后,用xhoi消化的pδ-hmgr質(zhì)粒dna轉(zhuǎn)化epy213。在sd-leu-ura-his-met平板上初步選擇后,培養(yǎng)轉(zhuǎn)化子,并接種于含有1gl-15-foa的sd-leu-his-met平板上,以構(gòu)建epy219。用xhoi消化的pδ-erg20質(zhì)粒dna轉(zhuǎn)化epy219。在sd-leu-ura-his-met平板上初步選擇后,培養(yǎng)轉(zhuǎn)化子,并接種于含有1gl-15-foa的sd-leu-his-met平板上,以構(gòu)建epy224。
用兩組引物通過pcr分析鑒定prs-erg9的整合。各組引物含有能結(jié)合于插入的dna的一種寡核苷酸和能結(jié)合于圍繞該插入物的基因組dna的一種寡核苷酸。用結(jié)合于gal1啟動子的5'-端和融合基因的3'-端的引物驗證所有其它整合物中的全長插入物。
酵母培養(yǎng)。用貝克曼(beckman)du-640分光光度計測定600nm處的光密度(od600)。為了檢測紫穗槐二烯產(chǎn)量,用感興趣菌株接種含有5mlsd(2%半乳糖)培養(yǎng)基(如上所述適當(dāng)省去某些氨基酸)的培養(yǎng)管。這些接種體在30℃生長至od600為1-2。用這些種子培養(yǎng)物接種含有50mlsd培養(yǎng)基的無擋板的培養(yǎng)瓶(250ml),使od600為0.05。生長6天后測定紫穗槐二烯產(chǎn)量。各培養(yǎng)物中存在1mm甲硫氨酸,以抑制erg9基因座上的pmet3-erg9融合物。所有燒瓶中還含有5ml十二烷。對此十二烷層采樣,用乙酸乙酯稀釋,用gc-ms測定紫穗槐二烯產(chǎn)量。
結(jié)果
在特化的植物細(xì)胞-腺毛中產(chǎn)生青蒿素。從黃花蒿分離腺毛細(xì)胞;由這些細(xì)胞提取rna。采用簡并引物,分離稱為cyp71d-a4的新基因的部分cdna。通過快速擴增cdna末端(race)回收全長基因。cdna編碼區(qū)的核苷酸序列見圖1(seqidno:1);翻譯的氨基酸序列見圖2(seqidno:2)。
在酵母細(xì)胞中表達(dá)全長cyp71d-a4cdna。為了測定紫穗槐二烯氧化酶活性,將cyp71d-a4置于pesc-ura(司查塔基公司)主鏈質(zhì)粒的gal10啟動子的轉(zhuǎn)錄控制下,其中由gal1啟動子表達(dá)黃花蒿的cpr基因(aacpr;圖3;編碼蛋白的氨基酸序列見圖4)。用上述簡并引物pcr和race法由黃花蒿腺毛mrna獲得aacpr基因。
為了進行紫穗槐-4,11-二烯氧化酶活性的體內(nèi)測定,將該質(zhì)粒(p71d-a4/cpr::pesc-ura)和缺少cyp71d-a4基因的對照質(zhì)粒轉(zhuǎn)化到經(jīng)工程改造能產(chǎn)生紫穗槐-4,11-二烯的釀酒酵母細(xì)胞中。簡言之,這些細(xì)胞是攜帶編碼截短的hmgcoa還原酶的整合基因的菌株by4742,該酶在酵母中可溶。這些細(xì)胞攜帶prs425ads,其中密碼子優(yōu)化的ads基因在gal1啟動子控制下。用省去合成亮氨酸和尿嘧啶的培養(yǎng)基培養(yǎng)轉(zhuǎn)化細(xì)胞,用2%半乳糖誘導(dǎo)29小時,用醚提取該培養(yǎng)基。濃縮該提取物,通過裝有exl柱的氣相色譜-質(zhì)譜(gc-ms)分析1μl,其采用的溫度程序為以5℃/分鐘的升溫速度從50℃升溫至250℃。用青蒿酸標(biāo)樣合成青蒿醇和青蒿醛,它們用作標(biāo)準(zhǔn)品。以此方法,用表達(dá)cpr和cyp71d-a4的細(xì)胞檢測到兩個峰,但用僅表達(dá)cpr的對照細(xì)胞無法檢測到兩個峰。通過將保留時間和質(zhì)譜與標(biāo)樣作比較,確定這些峰對應(yīng)于青蒿醇和青蒿醛。未檢測到青蒿酸;由于揮發(fā)性低,估計不經(jīng)衍生就無法用gc檢測到青蒿酸。
進行紫穗槐-4,11-二烯氧化酶活性的體內(nèi)給料實驗,其中將相同的兩個質(zhì)粒分別轉(zhuǎn)化到野生型釀酒酵母菌株yph499中。用50ml2%右旋糖和省去尿嘧啶的培養(yǎng)基培養(yǎng)酵母細(xì)胞,用2%半乳糖誘導(dǎo)24小時。離心收集5ml誘導(dǎo)的酵母細(xì)胞,用含有150μm紫穗槐-4,11-二烯、青蒿醇或青蒿醛的新鮮培養(yǎng)基重懸酵母細(xì)胞。然后于30℃培養(yǎng)酵母細(xì)胞5小時。用醚提取該培養(yǎng)基,然后用n-(叔丁基二甲基甲硅烷基)-n-甲基三氟乙酰胺衍生,以用gc-ms檢測任何青蒿酸。也用類似方法衍生青蒿醇和青蒿酸標(biāo)樣。用gc-ms分析衍生的對照和樣品各1μl。所用溫度程序是以5℃/分鐘的升溫速度從50℃升溫至250℃。
給予細(xì)胞紫穗槐-4,11-二烯時,僅在既表達(dá)cpr又表達(dá)cyp71d-a4的酵母細(xì)胞中檢測到青蒿酸的明顯累積和少量青蒿醇和醛化合物(圖5a)。給予細(xì)胞青蒿醇或青蒿醛時,cpr/cyp71d-a4轉(zhuǎn)化的酵母細(xì)胞的培養(yǎng)基中青蒿酸的相對累積量高于僅用cpr轉(zhuǎn)化的對照菌株(圖5b和5c)。
圖5a-c。以150μm的濃度將紫穗槐二烯(圖5a)和兩種其它青蒿素中間體--青蒿醇(圖5b)和青蒿醛(圖5c)—加入培養(yǎng)基中,該培養(yǎng)基中培養(yǎng)有僅用cpr轉(zhuǎn)化(上方的色譜圖)和用cpr和cyp71d-a4轉(zhuǎn)化(下方的色譜圖)的酵母細(xì)胞,這些酵母細(xì)胞已用2%半乳糖誘導(dǎo)。箭頭表示紫穗槐二烯(1)、青蒿醇(2)、青蒿醛(3)和青蒿酸(4)。用n-(叔丁基二甲基甲硅烷基)-n-甲基三氟乙酰胺衍生后檢測青蒿醇(2)和青蒿酸(4)。星號表示加入培養(yǎng)基的底物。
用青蒿酸標(biāo)樣驗證樣品中是否真實存在衍生的青蒿酸(圖6a和6b)。這些數(shù)據(jù)說明,cyp71d-a4克隆中編碼的細(xì)胞色素p450酶催化第一次羥化,隨后青蒿醇氧化轉(zhuǎn)變?yōu)榍噍锶┖颓噍锶┭趸D(zhuǎn)變?yōu)榍噍锼岷芸赡苁怯蒫yp71d-a4重組酶以及酵母內(nèi)源性氧化活性催化的。
圖6a和6b。將紫穗槐二烯給予cpr/71d-a4轉(zhuǎn)化的酵母細(xì)胞后產(chǎn)生的新化合物的質(zhì)譜和保留時間見圖6a,青蒿酸標(biāo)樣的質(zhì)譜和保留時間見圖6b。使基礎(chǔ)分子量增加114個質(zhì)量單位的衍生反應(yīng)后,用gc-ms檢測產(chǎn)物和標(biāo)樣。
用攜帶cpr(“aacpr”)和amo(“cyp17d-a4”)的pesc-ura(pesc-ura::aacpr/amo)遺傳修飾epy224,從而在工程改造的酵母中由簡單糖如半乳糖從頭合成青蒿酸。將編碼截短的酵母hmgcoa還原酶的構(gòu)建物整合到酵母菌株by4742中兩次。過度表達(dá)轉(zhuǎn)錄因子upc2-1,以提高麥角固醇生物合成途徑中幾種基因的轉(zhuǎn)錄水平。用甲硫氨酸阻抑型啟動子met3下調(diào)鯊烯合酶基因(erg9)。用gal1啟動子過度表達(dá)fpp合酶,也用prs425主鏈中的gal1啟動子過度表達(dá)ads。在含有1.8%半乳糖和0.2%葡萄糖的合成培養(yǎng)基中30℃培養(yǎng)攜帶pesc-ura::aacpr/amo的酵母菌株epy2245天。離心酵母細(xì)胞,用堿性緩沖液(tris緩沖液ph9)洗滌。通過加入hcl將該緩沖液酸化至ph2;用乙酸乙酯萃取酸化的緩沖液。將tms-重氮甲烷和甲醇加入乙酸乙酯組分中,以衍生青蒿酸。用gc-ms檢測甲酯形式的青蒿酸。
圖7a-7c描述了在表達(dá)aacpr和amo的酵母中從頭產(chǎn)生青蒿酸。相反,在僅表達(dá)aacpr的對照酵母菌株中檢測不到青蒿酸。13.62分鐘的新峰(圖7a,峰1)顯示的質(zhì)量碎裂(fragmentation)圖案與來自黃花蒿的真正青蒿酸(圖7b和c)相同。
圖8a–8c描述了體外amo酶試驗。由表達(dá)aacpr或cpr/amo的釀酒酵母yph499分離微粒體。所用底物的色譜峰用星號表示。各酶試驗中,采用10μm紫穗槐二烯(a)、25μm青蒿醇(b)或25μm青蒿醛(c)。衍生醚-萃取組分,用gc-ms以選擇離子模式(m/z:121、189、204、218、220和248)進行分析。酶產(chǎn)物為:1,青蒿醇[保留時間(rt)=13.20];2,青蒿醛(rt=11.79);3,青蒿酸(rt=13.58,以甲酯形式檢測)。
圖9描述了編碼萜羥化酶的稱為71d-b1(用于紫穗槐二烯羥化酶時也稱為“amh”)的cdna克隆的核苷酸序列。
圖10描述了71d-b1(amh)編碼的蛋白質(zhì)的氨基酸序列。
圖11a-c描述了amh克隆(71d-b1)中編碼的重組酶的羥化活性。在過度表達(dá)hmgcoa的酵母中表達(dá)amo時,a圖中16.82分鐘的峰是青蒿酸;在過度表達(dá)hmgcoa的酵母中過度表達(dá)amh和aacpr時,b圖中18.50分鐘的峰是羥化的紫穗槐二烯。羥化的紫穗槐二烯的質(zhì)量碎裂圖案見圖11c。顯示了羥化紫穗槐二烯的母離子(220)的峰,也顯示了倍半萜和萜的其它典型的離子碎裂圖案(如93、119、132、145、159和177)。
圖12描述了編碼萜羥化酶/氧化酶的基因組dna的核苷酸序列。
雖然參照具體實施方式描述了本發(fā)明,但本領(lǐng)域技術(shù)人員應(yīng)理解,可以在不背離本發(fā)明的真實構(gòu)思和范圍的情況下進行各種改變,并可用等同物取代。此外,可進行許多修改以使具體情況、材料、物質(zhì)組成、方法、工藝步驟適應(yīng)本發(fā)明的目的、構(gòu)思和范圍。所有這些修改應(yīng)屬于所附權(quán)利要求書的范圍。
序列表
<110>d.-k.羅(ro,dae-kyun)
k.紐曼(newman,karyn)
e.m.帕若蒂斯(paradise,ericm.)
j.d.基斯林(keasling,jayd.)
m.奧萊特(ouellet,mario)
r.伊切斯(eachus,rachel)
k.霍(ho,kimberly)
t.哈姆(ham,timothy)
<120>編碼類異戊烯修飾酶的多核苷酸和其使用方法
<130>berk-049
<150>60/697,067
<151>2005-07-05
<160>33
<170>fastseqforwindowsversion4.0
<210>1
<211>1488
<212>dna
<213>黃花蒿(artemisiaannua)
<400>1
atgaagagtatactaaaagcaatggcactctcactgaccacttccattgctcttgcaacg60
atccttttgttcgtttacaagttcgctactcgttccaaatccaccaaaaaaagccttcct120
gagccatggcggcttcccattattggtcacatgcatcacttgattggtacaacgccacat180
cgtggggttagggatttagccagaaagtatggatctttgatgcatttacagcttggtgaa240
gttccaacaatcgtggtgtcatctccgaaatgggctaaagagattttgacaacgtacgac300
attacctttgctaacaggcccgagactttaactggtgagattgttttatatcacaatacg360
gatgttgttcttgcaccttatggtgaatactggaggcaattacgtaaaatttgcacattg420
gagcttttgagtgttaagaaagtaaagtcatttcagtcacttcgtgaagaggagtgttgg480
aatttggttcaagagattaaagcttcaggttcagggagaccggttaacctttcagagaat540
gttttcaagttgattgcaacgatacttagtagagccgcatttgggaaagggatcaaggac600
cagaaagagttaacggagattgtgaaagagatactgaggcaaactggtggttttgatgtg660
gcagatatctttccttcaaagaaatttcttcatcatctttcgggcaagagagctcggtta720
actagccttcgcaaaaagatcgataatttaatcgataaccttgtagctgagcatactgtt780
aacacctccagtaaaactaacgagacactcctcgatgttcttttaaggctcaaagacagt840
gctgaattcccattaacatctgataacattaaagccatcattttggatatgtttggagca900
ggcacagacacttcctcatccacaatcgaatgggcgatttcggaactcataaagtgtccg960
aaagcaatggagaaagtacaagcggaattgaggaaagcattgaacggaaaagaaaagatc1020
catgaggaagacattcaagaactaagctacttgaacatggtaatcaaagaaacattgagg1080
ttgcaccctccactacccttggttctgccaagagagtgccgccaaccagtcaatttggct1140
ggatacaacatacccaataagaccaaacttattgtcaacgtctttgcgataaatagggac1200
cctgaatattggaaagacgctgaagctttcatccctgaacgatttgaaaatagttctgca1260
actgtcatgggtgcagaatacgagtatcttccgtttggagctgggagaaggatgtgtcct1320
ggagccgcacttggtttagctaacgtgcagctcccgctcgctaatatactatatcatttc1380
aactggaaactccccaatggtgtgagctatgaccagatcgacatgaccgagagctctgga1440
gccacgatgcaaagaaagactgagttgttactcgttccaagtttctag1488
<210>2
<211>495
<212>prt
<213>黃花蒿(artemisiaannua)
<400>2
metlysserileleulysalametalaleuserleuthrthrserile
151015
alaleualathrileleuleuphevaltyrlysphealathrargser
202530
lysserthrlyslysserleuprogluprotrpargleuproileile
354045
glyhismethishisleuileglythrthrprohisargglyvalarg
505560
aspleualaarglystyrglyserleumethisleuglnleuglyglu
65707580
valprothrilevalvalserserprolystrpalalysgluileleu
859095
thrthrtyraspilethrphealaasnargprogluthrleuthrgly
100105110
gluilevalleutyrhisasnthraspvalvalleualaprotyrgly
115120125
glutyrtrpargglnleuarglysilecysthrleugluleuleuser
130135140
vallyslysvallysserpheglnserleuargglugluglucystrp
145150155160
asnleuvalglngluilelysalaserglyserglyargprovalasn
165170175
leusergluasnvalphelysleuilealathrileleuserargala
180185190
alapheglylysglyilelysaspglnlysgluleuthrgluileval
195200205
lysgluileleuargglnthrglyglypheaspvalalaaspilephe
210215220
proserlyslyspheleuhishisleuserglylysargalaargleu
225230235240
thrserleuarglyslysileaspasnleuileaspasnleuvalala
245250255
gluhisthrvalasnthrserserlysthrasngluthrleuleuasp
260265270
valleuleuargleulysaspseralaglupheproleuthrserasp
275280285
asnilelysalaileileleuaspmetpheglyalaglythraspthr
290295300
serserserthrileglutrpalailesergluleuilelyscyspro
305310315320
lysalametglulysvalglnalagluleuarglysalaleuasngly
325330335
lysglulysilehisglugluaspileglngluleusertyrleuasn
340345350
metvalilelysgluthrleuargleuhisproproleuproleuval
355360365
leuproargglucysargglnprovalasnleualaglytyrasnile
370375380
proasnlysthrlysleuilevalasnvalphealaileasnargasp
385390395400
proglutyrtrplysaspalaglualapheileprogluargpheglu
405410415
asnserseralathrvalmetglyalaglutyrglutyrleuprophe
420425430
glyalaglyargargmetcysproglyalaalaleuglyleualaasn
435440445
valglnleuproleualaasnileleutyrhispheasntrplysleu
450455460
proasnglyvalsertyraspglnileaspmetthrglusersergly
465470475480
alathrmetglnarglysthrgluleuleuleuvalproserphe
485490495
<210>3
<211>2157
<212>dna
<213>黃花蒿(artemisiaannua)
<400>3
atgcaatcaacaacttccgttaagttatctcccttcgatctaatgacggcgttacttaac60
ggcaaggtatcgttcgacacatcaaacacatcggatacgaatattccgttagcggtgttt120
atggagaatcgtgagcttttgatgattttaactacttcggttgcggtgttgatcggatgc180
gttgtggtgcttgtgtggagacggtcgtcgtcggcggcgaagaaagcggcggagtcgccg240
gtgattgttgtgccgaagaaagtgacggaggatgaggttgatgacggacggaagaaagtt300
actgtgttttttggaactcagactggtactgctgaaggttttgctaaggcgcttgttgaa360
gaagctaaagcgcgatatgaaaaggcggtgtttaaagtgattgatttggatgattatgct420
gctgaagatgatgagtatgaggagaagttaaagaaagaatctcttgcttttttcttttta480
gctacgtatggagatggtgagccgacagataatgctgctagattctataaatggtttacc540
gagggtgaagagaaaggtgaatggcttgacaagcttcaatacgcagtgtttggacttggt600
aacagacagtatgagcatttcaacaagattgcgaaggtggtcgatgaaaaacttgtggag660
cagggtgcaaagcgccttgttcctgttggcatgggagacgatgatcaatgtatcgaagac720
gacttcactgcatggaaagagttggtgtggcctgagttggatcaattacttcgtgatgag780
gatgatacatctgttgccactccatacacagctgctgttggagaataccgtgttgtgttc840
catgacaaaccagagacatatgatcaggatcaactgacaaatggccatgctgttcatgat900
gctcaacatccatgcagatccaatgtcgctgtcaaaaaggagctccattcccctctatct960
gaccggtcttgcactcatttggaatttgatatctctaatactggattatcgtatgaaact1020
ggggaccatgttggagtctacgttgagaatctaagtgaagttgtggacgaagctgaaaaa1080
ttaataggtttaccgccgcacacttatttctcagtacatactgataacgaagacgggaca1140
ccacttggtggagcctctttgccacctcctttccctccatgcactttaagaaaagcattg1200
gcttcctatgccgatgttttgagctctcctaaaaagtcagctttgcttgctttagctgct1260
catgctactgattctactgaagctgatagactgaaattttttgcgtctcctgctggaaag1320
gatgaatatgctcagtggatagttgcaagccacagaagtctccttgaggtcatggaggcc1380
ttcccatcagctaagcctccgcttggtgttttttttgcatctgtcgccccacgtttgcag1440
ccgagatactattccatttcttcttccccaaagtttgcgccaaataggattcatgtaact1500
tgtgcattagtgtatgagcaaacaccatcaggccgcgttcacaagggagtctgttcaaca1560
tggatgaagaatgccgtgcctatgacagaaagccaggattgcagttgggccccaatttat1620
gttagaacatccaatttcagacttccttctgatcctaaggtcccagttatcatgattggc1680
ccaggcactggattggctccatttagaggtttccttcaggaaaggttagctcagaaggaa1740
gctgggactgagctcggaacagccatcttattcttcggatgcaggaatcgcaaagtggat1800
ttcatatatgaggacgagcttaataatttcgtggagacgggggctctttccgagcttgtt1860
acggccttctctcgtgaaggtgccactaaggagtacgtgcaacacaagatgactcagaag1920
gcttcggatatctggaatttactctctgagggagcatatttgtatgtttgcggtgatgcc1980
aaaggcatggccaaagatgtacatcggactctgcacactattgtgcaagaacagggatct2040
ctagactcctcaaaggcggagctctacgtgaagaatctacaaatggcaggaagatatctc2100
cgtgatgtatgggtcgacatggaacagaagttgatttccgaagaagacctcgagtaa2157
<210>4
<211>718
<212>prt
<213>黃花蒿(artemisiaannua)
<400>4
metglnserthrthrservallysleuserpropheaspleumetthr
151015
alaleuleuasnglylysvalserpheaspthrserasnthrserasp
202530
thrasnileproleualavalphemetgluasnarggluleuleumet
354045
ileleuthrthrservalalavalleuileglycysvalvalvalleu
505560
valtrpargargserserseralaalalyslysalaalagluserpro
65707580
valilevalvalprolyslysvalthrgluaspgluvalaspaspgly
859095
arglyslysvalthrvalphepheglythrglnthrglythralaglu
100105110
glyphealalysalaleuvalgluglualalysalaargtyrglulys
115120125
alavalphelysvalileaspleuaspasptyralaalagluaspasp
130135140
glutyrgluglulysleulyslysgluserleualaphephepheleu
145150155160
alathrtyrglyaspglygluprothraspasnalaalaargphetyr
165170175
lystrpphethrgluglygluglulysglyglutrpleuasplysleu
180185190
glntyralavalpheglyleuglyasnargglntyrgluhispheasn
195200205
lysilealalysvalvalaspglulysleuvalgluglnglyalalys
210215220
argleuvalprovalglymetglyaspaspaspglncysilegluasp
225230235240
aspphethralatrplysgluleuvaltrpprogluleuaspglnleu
245250255
leuargaspgluaspaspthrservalalathrprotyrthralaala
260265270
valglyglutyrargvalvalphehisasplysprogluthrtyrasp
275280285
glnaspglnleuthrasnglyhisalavalhisaspalaglnhispro
290295300
cysargserasnvalalavallyslysgluleuhisserproleuser
305310315320
aspargsercysthrhisleuglupheaspileserasnthrglyleu
325330335
sertyrgluthrglyasphisvalglyvaltyrvalgluasnleuser
340345350
gluvalvalaspglualaglulysleuileglyleuproprohisthr
355360365
tyrpheservalhisthraspasngluaspglythrproleuglygly
370375380
alaserleupropropropheproprocysthrleuarglysalaleu
385390395400
alasertyralaaspvalleuserserprolyslysseralaleuleu
405410415
alaleualaalahisalathraspserthrglualaaspargleulys
420425430
phephealaserproalaglylysaspglutyralaglntrpileval
435440445
alaserhisargserleuleugluvalmetglualapheproserala
450455460
lysproproleuglyvalphephealaservalalaproargleugln
465470475480
proargtyrtyrserileserserserprolysphealaproasnarg
485490495
ilehisvalthrcysalaleuvaltyrgluglnthrproserglyarg
500505510
valhislysglyvalcysserthrtrpmetlysasnalavalpromet
515520525
thrgluserglnaspcyssertrpalaproiletyrvalargthrser
530535540
asnpheargleuproseraspprolysvalprovalilemetilegly
545550555560
proglythrglyleualapropheargglypheleuglngluargleu
565570575
alaglnlysglualaglythrgluleuglythralaileleuphephe
580585590
glycysargasnarglysvalasppheiletyrgluaspgluleuasn
595600605
asnphevalgluthrglyalaleusergluleuvalthralapheser
610615620
arggluglyalathrlysglutyrvalglnhislysmetthrglnlys
625630635640
alaseraspiletrpasnleuleusergluglyalatyrleutyrval
645650655
cysglyaspalalysglymetalalysaspvalhisargthrleuhis
660665670
thrilevalglngluglnglyserleuaspserserlysalagluleu
675680685
tyrvallysasnleuglnmetalaglyargtyrleuargaspvaltrp
690695700
valaspmetgluglnlysleuileserglugluaspleuglu
705710715
<210>5
<211>1467
<212>dna
<213>黃花蒿(artemisiaannua)
<400>5
atggcactttcactgaccacctccattgctcttgccacgatccttttcttcgtaatttac60
aagttcgctactcgttccaaatccacaaaaaacagccttcctgagccatggcgacttccc120
attattggtcacatgcatcacttgattggtacaataccacatcgtgggcttatggattta180
gccagaaagtatggatctttaatgcatttacagcttggtgaagtttcaacaatcgtggtg240
tcatctccgaaatgggctaaagagattttgacaacgtacgacattgcctttgctaacagg300
ccctggactttggctggtgagattgttgtatatcgcaatacaaatattgctgctgcacct360
tatggtgaatactggaggcgattacgtaaactttgcacatcggagcttatgagtgttaag420
aaagtaaagtcatatcagtcgcttcgtgaagaggagtgttggaatttggttcaagagatt480
aaagcttcaggttcagggataccggttaacctttcagagaacattttcaagttgattgca540
acgatactttgtagagccgcgtttggaaaaggagtcaaggaccagaaggagtgtacggag600
attatgaaagagatgttgagggaagttggtggttttgatgtggcagatatctttccttcg660
aagaaatttcttcatcatctttcaggcaagagagccaggttaactagcattcataagaag720
ctcgataattttatcaataaccttgttgctgagcatactttcaaaacttcaagtaaaact780
gaggagacacttcttgatgttcttctaaggctcaaagatagcgctgaattcccattaaca840
gctgacaatgttaaagccatcattttggatatatttgcagcagggacagacacttcatca900
accacaatcgaatgggcgatttcggaactcataaagtgtccgagagcgatggagaaagta960
caagcagaactgaggaaagcacttaacggaaaagaaaagatccatgaggaagatattcaa1020
ggactaagctacttaaacttggtaatcaaagaaacattaaggttgcaccctccactaccc1080
ttgttgccaagagagtgccgtgaaccagtcaatttggctggatacgacatacccaataag1140
acaagacttattgtcaacgtctttgcgataaatagggacccagaatactggaaagacgct1200
gaaattttcatccccgaacgatttgaaaatagttctacaactctcatgggtgcagaatat1260
gagtatcttccgtttggagctgggagaaggatgtgtcctggagccgcacttggtttagcc1320
aacgtgcagctaccgctcgctaatatactatatcatttcaactggaaactccccaacggt1380
gcgagctatgatcagatcgacatgaccgagaggtttggaatctcggttgaaagaaagact1440
cagttgttactcgtaccaagtttctag1467
<210>6
<211>488
<212>prt
<213>黃花蒿(artemisiaannua)
<400>6
metalaleuserleuthrthrserilealaleualathrileleuphe
151015
phevaliletyrlysphealathrargserlysserthrlysasnser
202530
leuprogluprotrpargleuproileileglyhismethishisleu
354045
ileglythrileprohisargglyleumetaspleualaarglystyr
505560
glyserleumethisleuglnleuglygluvalserthrilevalval
65707580
serserprolystrpalalysgluileleuthrthrtyraspileala
859095
phealaasnargprotrpthrleualaglygluilevalvaltyrarg
100105110
asnthrasnilealaalaalaprotyrglyglutyrtrpargargleu
115120125
arglysleucysthrsergluleumetservallyslysvallysser
130135140
tyrglnserleuargglugluglucystrpasnleuvalglngluile
145150155160
lysalaserglyserglyileprovalasnleusergluasnilephe
165170175
lysleuilealathrileleucysargalaalapheglylysglyval
180185190
lysaspglnlysglucysthrgluilemetlysglumetleuargglu
195200205
valglyglypheaspvalalaaspilepheproserlyslyspheleu
210215220
hishisleuserglylysargalaargleuthrserilehislyslys
225230235240
leuaspasnpheileasnasnleuvalalagluhisthrphelysthr
245250255
serserlysthrglugluthrleuleuaspvalleuleuargleulys
260265270
aspseralaglupheproleuthralaaspasnvallysalaileile
275280285
leuaspilephealaalaglythraspthrserserthrthrileglu
290295300
trpalailesergluleuilelyscysproargalametglulysval
305310315320
glnalagluleuarglysalaleuasnglylysglulysilehisglu
325330335
gluaspileglnglyleusertyrleuasnleuvalilelysgluthr
340345350
leuargleuhisproproleuproleuleuproargglucysargglu
355360365
provalasnleualaglytyraspileproasnlysthrargleuile
370375380
valasnvalphealaileasnargaspproglutyrtrplysaspala
385390395400
gluilepheileprogluargphegluasnserserthrthrleumet
405410415
glyalaglutyrglutyrleupropheglyalaglyargargmetcys
420425430
proglyalaalaleuglyleualaasnvalglnleuproleualaasn
435440445
ileleutyrhispheasntrplysleuproasnglyalasertyrasp
450455460
glnileaspmetthrgluargpheglyileservalgluarglysthr
465470475480
glnleuleuleuvalproserphe
485
<210>7
<211>1038
<212>dna
<213>黃花蒿(artemisiaannua)
<400>7
gcccttcgagccgtatggggattactggcggcaattacgtaaactttgcacattggagct60
tttgagtgctaagaaagtagagtcatatcagtcgcttcgtgaagaggagtgttggaattt120
agttcaagagattaaagcttcaggttcagggataccggttaacctttcagagaatattta180
caagttggttgcaatgatacttagtagagctgcgtttgggaaaagaatcaaggaccataa240
ggagtttacggagcttgtggaacagatgttgagggaacttggtggttttgatgtggcaga300
tatctttccttcgcagaaatttctacatcatatttcgggcaagagatctaggttaactag360
cattcacaaaaagctcgataatttaatcaataaccttgttgctgagcatattgttgaagc420
ctcaagtaaaactaaggagacgctccttgatgttcttctaaggcacaaagatagccttga480
attcccattgacagctgataacgttaaagccatcattttggtatgaattaatccaatata540
ttttttttttcaaaaggccataatagtgttaaacaagcttgaaattttttataactaagt600
acatgcactaactttagtactcgtgaaaatataatgagtcatcataggggttccatgaaa660
tatacaggacatgtttacagcaggcacagacacttcgtcaaccacaatcgaatgggtgat720
ttcggaactcataaagtgtccgagagctatggagaaaatacaagcggaactgaggaaagc780
acttaacggaaaagaaaagatccacgaggaagacatccaagaactaagctacttaaactt840
ggtaatcaaagaaacattaaggttgcaccctccactacccttggttttgccacgagagtg900
ccgtcaaccagtcaatttggctggatatgacatacccaataagaccaaacttattgtcaa960
cgtctttgcgataaatagggaccctgaatactggaaagacgctgaatctttcatcccaga1020
gcgcttcttaactctggt1038
<210>8
<211>6
<212>prt
<213>人工序列
<220>
<223>接頭肽
<400>8
alaalaalaglyglymet
15
<210>9
<211>14
<212>prt
<213>人工序列
<220>
<223>接頭肽
<400>9
alaalaalaglyglymetproproalaalaalaglyglymet
1510
<210>10
<211>6
<212>prt
<213>人工序列
<220>
<223>接頭肽
<400>10
alaalaalaglyglymet
15
<210>11
<211>8
<212>prt
<213>人工序列
<220>
<223>接頭肽
<400>11
proproalaalaalaglyglymet
15
<210>12
<211>4
<212>prt
<213>人工序列
<220>
<223>接頭肽
<400>12
ilegluglyarg
1
<210>13
<211>6
<212>prt
<213>人工序列
<220>
<223>接頭肽
<400>13
glyglylysglyglylys
15
<210>14
<211>25
<212>dna
<213>人工序列
<220>
<223>合成引物
<220>
<221>misc_feature
<222>9,18,20
<223>n=c或t
<220>
<221>misc_feature
<222>11,14,17
<223>n=a,t,c或g
<400>14
tccgaccananggngannantggag25
<210>15
<211>25
<212>dna
<213>人工序列
<220>
<223>合成引物
<220>
<221>misc_feature
<222>(13)...(13)
<223>n=g或t
<220>
<221>misc_feature
<222>(14)...(14)
<223>n=c或t
<220>
<221>misc_feature
<222>(20)...(20)
<223>n=a,g或t
<220>
<221>misc_feature
<222>(23)...(23)
<223>n=a或g
<220>
<221>misc_feature
<222>11,17
<223>n=a,t,c或g
<400>15
tccgaccaaancnntcnggnatnaa25
<210>16
<211>29
<212>dna
<213>人工序列
<220>
<223>合成引物
<220>
<221>misc_feature
<222>(9)...(9)
<223>n=a或g
<220>
<221>misc_feature
<222>(12)...(12)
<223>n=c或t
<220>
<221>misc_feature
<222>(15)...(15)
<223>n=a或g
<220>
<221>misc_feature
<222>(18)...(18)
<223>n=c或t
<220>
<221>misc_feature
<222>(21)...(21)
<223>n=c或t
<220>
<221>misc_feature
<222>(24)...(24)
<223>n=c或t
<220>
<221>misc_feature
<222>(27)...(27)
<223>n=a或g
<400>16
ccagcacantangancanttnaanaanat29
<210>17
<211>29
<212>dna
<213>人工序列
<220>
<223>合成引物
<220>
<221>misc_feature
<222>(15)...(15)
<223>n=c或t
<220>
<221>misc_feature
<222>(21)...(21)
<223>n=a或g
<220>
<221>misc_feature
<222>(27)...(27)
<223>n=a或g
<220>
<221>misc_feature
<222>12,18,24
<223>n=a,t,c或g
<400>17
ccagcagccatnccnttngcntcnccnca29
<210>18
<211>33
<212>dna
<213>人工序列
<220>
<223>合成引物
<400>18
acgtctagaatgaagagtatactaaaagcaatg33
<210>19
<211>34
<212>dna
<213>人工序列
<220>
<223>合成引物
<400>19
acgtctagagcgaaacttggaacgagtaacaact34
<210>20
<211>37
<212>dna
<213>人工序列
<220>
<223>合成引物
<400>20
atggatcctatgcaatcaacaacttccgttaagttat37
<210>21
<211>34
<212>dna
<213>人工序列
<220>
<223>合成引物
<400>21
tatgtcgacccatacatcacggagatatcttcct34
<210>22
<211>32
<212>dna
<213>人工序列
<220>
<223>合成引物
<400>22
ggactagtaaaacaatggccctgaccgaagag32
<210>23
<211>29
<212>dna
<213>人工序列
<220>
<223>合成引物
<400>23
ccaagctttcagatggacatcgggtaaac29
<210>24
<211>29
<212>dna
<213>人工序列
<220>
<223>合成引物
<400>24
ctgccgcggggccgcaaattaaagccttc29
<210>25
<211>29
<212>dna
<213>人工序列
<220>
<223>合成引物
<400>25
ctgccgcggtagtacggattagaagccgc29
<210>26
<211>35
<212>dna
<213>人工序列
<220>
<223>合成引物
<400>26
cgggatccaaaacaatggctgcagaccaattggtg35
<210>27
<211>30
<212>dna
<213>人工序列
<220>
<223>合成引物
<400>27
gcgtcgacttaggatttaatgcaggtgacg30
<210>28
<211>35
<212>dna
<213>人工序列
<220>
<223>合成引物
<400>28
cgggatccaaaacaatgagcgaagtcggtatacag35
<210>29
<211>34
<212>dna
<213>人工序列
<220>
<223>合成引物
<400>29
gcgtcgactcataacgaaaaatcagagaaatttg34
<210>30
<211>37
<212>dna
<213>人工序列
<220>
<223>合成引物
<400>30
ggactagtaaaacaatggcttcagaaaaagaaattag37
<210>31
<211>30
<212>dna
<213>人工序列
<220>
<223>合成引物
<400>31
tcccccgggctatttgcttctcttgtaaac30
<210>32
<211>8
<212>prt
<213>人工序列
<220>
<223>基序
<400>32
glntyrgluhispheasnlysile
15
<210>33
<211>8
<212>prt
<213>人工序列
<220>
<223>基序
<400>33
cysglyaspalalysglymetala
15