相關申請的交叉引用
本申請要求于2014年12月9日提交的美國臨時專利申請no.62/089,511的申請日的優(yōu)先權和權益,其公開內容通過引用并入本文。
發(fā)明領域
本公開的實施方式涉及生產冷杉醇的新方法以及在這種方法中有用的表達載體和宿主細胞。
發(fā)明背景
隨著不斷增長的世界經濟和對更高生活水平的要求,對香料的需求也在增加。然而,由于自然資源和動物保護的限制,動物或植物基香料的供應有限。已嘗試由可再生資源(例如微生物)生產香料或其前體。
龍涎香是珍貴的傳統(tǒng)香料成分,是鯨腸的副產物。降龍涎香醚(ambrox)是龍涎香的替代物,其是通過二萜香紫蘇醇的化學轉化生產的,二萜香紫蘇醇目前是從快樂鼠尾草(clarysage)獲得的。降龍涎香醚也可以由在冷杉和煙草中發(fā)現(xiàn)的相關二萜冷杉醇生成(barrero等人,1993,tetrahedron49:10405-10412)。參見圖1。
人們提出植物中朝向冷杉醇和香紫蘇醇二者的通路均包括兩個步驟。第一步由以下組成:通過ii類二萜合酶(ditps)的活性將類異戊二烯通路分子香葉基香葉基二磷酸(ggpp)轉化為名為賴百當-13-烯-8-醇二磷酸(labda-13-en-8-oldiphosphate,ldpp)的常用中間體。第二步由i類ditps催化。存在幾種類型的i類ditps,每種類型負責生產特定的最終產物。例如,冷杉醇合酶(abs)用于冷杉醇生產,香紫蘇醇合酶(scs)負責香紫蘇醇生產。參見圖2。
參與ggpp朝向香紫蘇醇或ggpp朝向冷杉醇的兩步轉化的酶是植物特異性的,并且可以呈兩種獨立的酶或具有兩個活性位點的單一酶的形式。例如,在通過煙草的冷杉醇生產中(sallaud等人,2012,plantj.,72(1):1-17),煙草的ii類ditps(被sallaud等人稱為ntcps2,被本公開稱為nt-ii類-ditps)和煙草的i類ditps合酶(被本公開稱為煙草的冷杉醇合酶或nt-abs)呈兩種不同蛋白質分子的形式。類似地,在通過快樂鼠尾草的香紫蘇醇生產中(schalk等人,2012,journalofam.chemsoc.134:18900-18903);(caniard等人,2012,bmcplantbiology12:119),快樂鼠尾草的ii類ditps(被schalk等人稱為sslps,被本公開稱為ss-ii類-ditps)和快樂鼠尾草的i類ditps合酶(被本公開稱為快樂鼠尾草的冷杉醇合酶或ss-scs)也呈兩種獨立蛋白質分子的形式。相比之下,在通過冷杉的冷杉醇生產中(zerbe等人,2012,j.biol.chem.287:12121-12131),i類ditps和ii類ditps的亞基都位于一個雙功能i/ii類冷杉醇合酶上(被zerbe等人和本公開稱為abcas)。因此在冷杉中,ggpp在單一雙功能i/ii類冷杉醇合酶存在的情況下被轉化為冷杉醇。參見圖2。
香紫蘇醇和冷杉醇的植物來源被認為是不能依賴的;因此,任一產品的微生物生產方法都具有商業(yè)價值。已經分離并在e.coli中同時表達了來自快樂鼠尾草的ii類ditps和香紫蘇醇合酶基因,在實驗室規(guī)模的發(fā)酵罐中產生了滴度為約1.5克/升的香紫蘇醇。通過同時表達煙草的ii類ditps和冷杉醇合酶基因,或者表達冷杉的單獨i/ii類冷杉醇合酶,已經實現(xiàn)了冷杉醇在e.coli中的可測量生產。但是,基于現(xiàn)有方法的冷杉醇生產量非常低。因此可期望以高得多的滴度生產冷杉醇。
發(fā)明概述
我們現(xiàn)在出乎意料地發(fā)現(xiàn)了一種新方法,所述方法在ii類二萜合酶和雙功能i/ii類冷杉醇合酶的組合存在的情況下,顯著提高了從香葉基香葉基二磷酸(ggpp)的冷杉醇生產率。在一個實施方式中,ii類ditps可以來自煙草或快樂鼠尾草,雙功能i/ii類冷杉醇合酶可以來自冷杉。在另一個實施方式中,上述ii類ditps可以是這樣的多肽,其包含的氨基酸序列與seqidno:1至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少97%或至少99%相同。在另一個實施方式中,上述ii類ditps可以是這樣的多肽,其包含的氨基酸序列與seqidno:2至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少97%、或至少99%相同。在另一個實施方式中,上述雙功能i/ii類冷杉醇合酶可以是這樣的多肽,其包含的氨基酸序列與seqidno:3至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少97%或至少99%相同。
在另一個實施方式中,通過重組宿主細胞表達ii類ditps和雙功能i/ii類冷杉醇合酶的組合。在一個實施方式中,重組細胞是經遺傳修飾的微生物,其被遺傳修飾以表達至少一種選自上述ii類ditps和雙功能i/ii類冷杉醇合酶的外源多肽。在一個實施方式中,宿主細胞包含至少一種編碼一種或多種選自所述ii類ditps和所述雙功能i/ii類冷杉醇合酶的氨基酸序列的核酸。
在一個實施方式中,重組宿主細胞是真菌。在另一個實施方式中,重組宿主細胞是yarrowia真菌。在一個具體實施方式中,重組宿主細胞是yarrowialipolytica。
在本公開的另一方面,本發(fā)明涉及包含ii類二萜合酶和雙功能i/ii類冷杉醇合酶的重組宿主細胞。在一個實施方式中,ii類ditps可以來自煙草或快樂鼠尾草,雙功能i/ii類冷杉醇合酶可以來自冷杉。在另一個實施方式中,上述ii類ditps可以是這樣的多肽,其包含的氨基酸序列與seqidno:1至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少97%或至少99%相同。在另一個實施方式中,上述ii類ditps可以是這樣的多肽,其包含的氨基酸序列與seqidno:2至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少97%、或至少99%相同。在另一個實施方式中,上述雙功能i/ii類冷杉醇合酶可以是這樣的多肽,其包含的氨基酸序列與seqidno:3至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少97%或至少99%相同。
在一個實施方式中,重組宿主細胞是真菌。在另一個實施方式中,重組宿主細胞是yarrowia真菌。在一個具體實施方式中,重組宿主細胞是yarrowialipolytica。
在本公開的另一方面,本發(fā)明涉及表達載體,其包含編碼包含seqidno:1的氨基酸序列的多核苷酸分子和編碼包含seqidno:3的氨基酸序列的多核苷酸分子。
在本公開的另一方面,本發(fā)明涉及表達載體,其包含編碼包含seqidno:2的氨基酸序列的多核苷酸分子和編碼包含seqidno:3的氨基酸序列的多核苷酸分子。
在一個實施方式中,上述多核苷酸分子中的一種或兩種可操作地連接到轉錄控制序列。
序列表概述
使用核苷酸堿基的標準字母縮寫示出了所附序列表中列出的核酸序列。僅示出了每種核酸序列的一條鏈,但互補鏈被理解為通過對所顯示的鏈的任何提及而被包括。在所附序列表中:
seqidno:1是編碼來自nicotianatabacum的ii類二萜合酶的氨基酸序列
mqviitsshrffchhlhqlksptslsaqkaefkkhgprnwlfqtegsllykpvrlncatsdasylgnvneylesdhsknseekdiqvsrtiqmkglteeikhmlnsmedgrlnvlaydtawvsfipnttnngndqrpmfpsclqwiidnqlsdgswgeeivfciydrllntlvcvialtlwntclhkrnkgvmfikenlskletgevenmtsgfelvfptllekaqqldidipydapvlkdiyarrevkltripkdvihtipttvlfsleglrddldwqrllklqmpdgsflispastafafmetndekclaylqnvveksnggarqypfdlvtrlwaidrlqrlgisyyfaeefkellnhvfrywdeengifsgrnsnvsdvddtcmairllrlhgydvspdalnnfkdgdqfvcfrgevdgspthmfnlyrcsqvlfpgekileeaknftynflqqclannrcldkwviakdipgeiwyalefpwyaslprvearyyieqyggaddiwigktlyrmpdvnnnvylqaakldynrcqsqhrfewlimqewfekcnfqqfgiskkyllvsyflaaasifeveksrerlawaksriickmitsyyndeattwttrnsllmefkvshdptrkngnetkeilvlknlrqflrqlseetfedlgkdihhqlqnawetwlvflreeknacqeetellvrtinlsggymthdeilfdadyenlsnltnkvcgklnelqndkvtggskntnieldmqalvklvfgntssninqdikqtffavvktfyysahvseeimnfhiskvlfqqv
seqidno:2是編碼來自salviasclarea的ii類二萜合酶的氨基酸序列
mtsvnlsrapaaiirrrlqlqpefhaecswlkssskhapftlscqirpkqlsqiaelrvtsldasqasekd)slvqtphkvevnekieesieyvqnllmtsgdgrisvspydtavialikdlkgrdapqfpsclewiahhqladgswgdeffciydrilntlacvvalkswnlqsdiiekgvtyikenvhklkganvehrtagfelvvptfmqmatdlgiqglpydhplikeiadtkkqrlkeipkdlvyqmptnllysleglgdlewerllklqsgngsfltspsstaavlmhtkdekclkyienalkncdggaphtypvdifsrlwaidrlqrlgisrffqheikyfldhiesvweetgvfsgrytkfsdiddtsmgvrllkmhgydvdpnvlkhfkqqdgkfscyigqsvesaspmynlyraaqlrfpgeevfeeatkfafnflqemlvkdrlqerwvisdhlfdeiklglkmpwyatlprveaayyldhyagsgdvwigksfyrmpeisndtykelaildfnrcqtqhqlewihmqewydrcslsefgiskrellrsyflaaatifepertqerlllaktrilskmitsfvnisgttlsldynfngldeiissanedqglagtllatfhqlldgfdiytlhqlkhvwsqwfmkvqqgegsggedavllantlnicaglnedvlsnneytalstltnkicnrlaqiqdnkilqvvdgsikdkeleqdmqalvklvlqenggavdrnirhtflsvfktfyydayhddettdlhifkvl
seqidno:3是編碼來自abiesbalsamea的雙功能i/ii類冷杉醇合酶的氨基酸序列
malpvyslkshipittiasakmnytpnkgmitangrsrrirlspnkivacageadrtfpsqslektalfpdqfsekngtpsnftppnrefppsfwnndiinsitashkvqtgdrkriqtliseiknvfnsmgdgetspsaydtawvaripavdgseqpqfpqtlewilqnqlkdgswgeefyflaydrllatlaciitltiwrtgnvqlhkgieffrkqvvrmddeadnhrpsgfeivfpamlneakslgldlpyelpfieqmvkkreaklkmittnvlytiqttllysleglheivdfdkiiklqskdgsflgspastaavfmqtgntkcleflefvlrkfrnhvpsdypldlferlwvvdtverlgidrhfkkeikdaldyvyscwdergigwakdspiadiddtamglrilrlhgynvspdvlktfkdengeffcfmgqtqrgvtdmlnvyrcsqvafpgetimeeaklcterylrnalenadafdkwaikknirgeveyalkypwhrsmprlevrsyignygpndvwlgkslymmpyisnekylelakldfnsvqslhqeeirelvrwckssgftelkftrdrvvetyfavassmfepefstcravytkisvllvilddlydgygspdeiklfseavkrwdlslleqmpdhmkicflglyntvnevaeegrktqghdvlgyirnlweiqlaaftreaewsqgkyvpsfdeyienaqvsigvatillitilfteeddilshidygskflrlasltarlandiktyqeerahgevvsaiqcymkdrpeiteeealkyvygrmvndlaelnseylksnempqnckrlvfdtarvaqlftmegdgltysdtmeikehikkclfepat
seqidno:4是編碼來自nicotianatabacum的冷杉醇合酶基因的氨基酸序列
mvlglrskiiplpdhklgniklgsvtnaichrpcrvrcshstassmeeakeriretfgkielspssydtawvamvpsrysmnqpcfpqcldwilenqredgswglnpshpllvkdslsstlasllalrkwrigdnqvqrglgfiethgwavdnkdqisplgfeiifpcminyaeklnldlpldpnlvnmmlcereltieralknefegnmanveyfaeglgelchwkemmlrqrhngslfdspattaaaliyhqydekcfgylnsilklhdnwvpticptkihsnlflvdalqnlgvdryfktevkrvldeiyrlwlekneeifsdvahcamafrllrmnnyevsseelegfvdqehffttssgklmnhvailelhrasqvaiherkdhildkistwtrnfmeqklldkhipdrskkemefamrkfygtfdrvetrryiesykmdsfkilkaayrssginnidllkfsehdfnlcqtrhkeelqqmkrwftdckleqvglsqqylytsyfiiaailfepeyadarlayakyaiiitavddffdcfickeelqniielverwegystvgfrservrifflalykmveeiaakaetkqgrcvkdhlinlwidmlkcmlveldlwkiksttpsieeylsvacvtigvpcfvltslyllgpklskdviessevsalcnctaavarlindihsykreqaesstnmvsilitqsqgtiseeeairqikemmeskrrellgmvlqnkesqlpqvckdlfwttinaaysihthgdgyrfpeefknhindviykplnqysp
seqidno:5是編碼來自nicotianatabacum的ii類二萜合酶的dna序列,其針對在yarrowialipolytica中表達而進行了優(yōu)化
atgcaggttattattacctcctctcaccgatttttctgccaccaccttcaccagctcaagtcccctacctccctttctgctcagaaggctgagtttaagaagcacggcccccgaaactggcttttccagactgagggctctctcctttacaagcctgtccgactcaactgtgctacttctgatgcttcttaccttggtaacgtgaacgagtaccttgagtctgaccactctaagaactccgaggagaaggatattcaggtttcccgaactatccagatgaagggtcttaccgaggagatcaagcacatgcttaactctatggaggacggacgacttaacgtcctcgcctacgacactgcttgggtttcctttattcctaacactaccaacaacggaaacgatcagcgacctatgtttccctcttgtcttcagtggattattgacaaccagctttctgatggttcttggggagaggagattgttttctgcatttacgaccgactccttaacactctcgtttgtgttattgctctcactctctggaacacttgccttcacaagcgaaacaagggtgtgatgtttatcaaggagaacctttctaagctggagactggtgaggttgagaacatgacttctggttttgagcttgtttttcccactctccttgagaaggcccagcagctcgatattgacattccctacgatgctcctgtcctgaaggatatttacgctcgacgagaggttaagctcacccgaatccctaaggacgttatccacactattcccactaccgttctcttttctcttgagggactccgagatgacctcgactggcagcgactcctgaagctccagatgcctgacggttctttcctgatttcccctgcttccactgcctttgctttcatggagactaacgatgagaagtgtcttgcctaccttcagaacgttgttgagaagtctaacggaggtgcccgacagtaccccttcgaccttgttactcgactttgggccattgatcgactccagcgactcggaatctcttactactttgccgaggagttcaaggagcttctcaaccacgtgttccgatactgggacgaggagaacggaattttctctggacgaaactctaacgtttctgatgttgatgacacttgcatggctatccgacttctccgacttcacggttacgatgtttcccctgacgcccttaacaacttcaaggacggcgaccagttcgtttgcttccgaggtgaggtggacggttctcctacccacatgtttaacctctaccgatgttcccaggttcttttccccggagagaagattcttgaggaggctaagaacttcacttacaacttccttcagcagtgccttgctaacaaccgatgcctcgacaagtgggtcattgctaaggacatccccggcgagatttggtacgctcttgagtttccctggtacgcctcccttccccgagtggaggctcgatactacattgagcagtacggcggagctgacgatatttggattggcaagactctctaccgaatgcccgatgtcaacaacaacgtttaccttcaggctgccaagctcgattacaaccgatgccagtcccagcaccgatttgagtggctgattatgcaggagtggtttgagaagtgcaactttcagcagttcggaatttccaagaagtacctccttgtttcttacttccttgctgccgcttctatttttgaggtcgagaagtcccgagagcgacttgcttgggctaagtctcgaattatctgtaagatgattacttcttactacaacgatgaggccactacctggaccactcgaaactctctccttatggagtttaaggtttctcacgaccctacccgaaagaacggtaacgagactaaggagatccttgttctcaagaaccttcgacagttccttcgacagctttctgaggagactttcgaggaccttggcaaggacatccaccaccagcttcagaacgcttgggagacttggcttgttttccttcgagaggagaagaacgcttgtcaggaggagactgagcttctcgtgcgaactattaacctctctggcggctacatgacccacgatgagattcttttcgatgccgactacgagaacctgtccaaccttaccaacaaggtttgtggcaagctcaacgagcttcagaacgacaaggtcactggcggctctaagaacaccaacattgagcttgacatgcaggctctcgttaagctggtttttggtaacacctcctctaacatcaaccaggacattaagcagactttctttgctgttgtcaagaccttctactactctgcccacgtttctgaggagattatgaactttcacatttccaaggtgctctttcagcaggtctaa
seqidno:6是編碼來自salviasclarea的ii類二萜合酶的dna序列,其針對在yarrowialipolytica中表達而進行了優(yōu)化
atgacttctgttaacctttcccgagcccccgctgccattatccgacgacgacttcagcttcagcctgagtttcacgccgagtgttcttggctgaagtcttcttccaagcacgcccccttcaccctttcctgccagattcgacctaagcagctctcccagattgccgagcttcgagttacttccctcgatgcttcccaggcttccgagaaggacatttcccttgttcagactccccacaaggttgaggttaacgagaagatcgaggagtctatcgagtacgtccagaaccttctcatgacttccggcgacggacgaatttctgtgtccccctacgacaccgctgtgatcgccctgattaaggacctcaagggtcgagatgcccctcagtttccctcttgtcttgagtggattgcccaccaccagcttgctgatggctcttggggcgacgagttcttctgtatttacgaccgaatcctgaacactctcgcttgtgtcgtcgccctgaagtcttggaaccttcagtctgatattattgagaagggtgtgacctacatcaaggagaacgtccacaagctcaagggtgccaacgttgagcaccgaactgccggattcgagcttgtggttcctacctttatgcagatggccactgaccttggcattcagggtcttccctacgatcaccccctcatcaaggagattgctgacactaagaagcagcgactcaaggagattcccaaggatctcgtttaccagatgcctaccaaccttctctactcccttgagggactcggcgaccttgagtgggagcgactcctgaagctccagtccggcaacggctccttcctcacttccccctcctccaccgccgccgtccttatgcacaccaaggacgagaagtgtctgaagtacatcgagaacgccctcaagaactgcgacggaggtgctccccacacttaccctgtcgatattttctctcgactttgggctattgatcgacttcagcgacttggtatttctcgattcttccagcacgagatcaagtacttcctcgatcacatcgagtccgtttgggaggagaccggagttttctctggacgatacactaagttttctgatattgatgacacctctatgggcgttcgacttctcaagatgcacggatacgacgtcgatcccaacgttctcaagcacttcaagcagcaggatggtaagttttcctgctacattggtcagtctgtcgagtctgcctctcctatgtacaacctttaccgagccgcccagcttcgattccctggtgaggaggtttttgaggaggccactaagtttgcctttaacttccttcaggagatgcttgtcaaggatcgacttcaggagcgatgggtgatttccgaccaccttttcgatgagattaagctgggcctcaagatgccttggtacgccacccttccccgagtcgaggccgcttactacctcgatcactacgctggttctggtgatgtttggattggcaagtctttctaccgaatgcctgagatttccaacgatacctacaaggagcttgccattctcgatttcaaccgatgccagactcagcaccagcttgagtggattcacatgcaggagtggtacgaccgatgctctctttccgagttcggcatttccaagcgagagcttctccgatcttactttctcgccgccgctaccattttcgagcctgagcgaactcaggagcgacttctccttgccaagacccgaatcctgtctaagatgattacttcttttgtcaacatttccggtactaccctttctctcgactacaacttcaacggcctcgatgagattatctcctctgccaacgaggatcagggtctggctggtactctcctggctaccttccaccagcttctcgacggattcgatatttacactctccaccagctcaagcacgtttggtcccagtggttcatgaaggtgcagcagggagagggttctggcggcgaggacgccgtgctccttgccaacaccctcaacatctgcgccggcctcaacgaggacgtgctctccaacaacgagtacactgctctgtccaccctcaccaacaagatttgcaaccgactcgcccagatccaggacaacaagattctccaggttgtggacggctccatcaaggataaggagcttgagcaggatatgcaggcccttgtcaagctcgtccttcaggagaacggcggagccgttgaccgaaacatccgacacaccttcctttccgttttcaagactttctactacgatgcctaccacgacgatgagactaccgaccttcacatcttcaaggttctctttcgacccgttgtgtaa
seqidno:7是編碼來自abiesbalsamea的雙功能i/ii類冷杉醇合酶的dna序列,其針對在yarrowialipolytica中表達而進行了優(yōu)化
atggccctgcccgtttactctctcaagtcccacattcccatcactaccatcgcctctgctaagatgaactacacccccaacaagggtatgattaccgccaacggacgatctcgacgaatccgactttctcccaacaagatcgttgcttgtgctggtgaggctgatcgaactttcccctctcagtcccttgagaagaccgctctctttcccgatcagttttctgagaagaacggtactccctctaacttcactccccccaaccgagagtttcccccctctttttggaacaacgatattatcaactctattactgcttctcacaaggttcagactggcgaccgaaagcgaatccagactctcatttctgagattaagaacgtctttaactctatgggcgatggtgagacttctccctctgcttacgacaccgcttgggttgctcgaatccccgccgttgatggctctgagcagccccagtttccccagactcttgagtggattcttcagaaccagctcaaggacggttcttggggtgaggagttctacttccttgcttacgaccgacttctcgctacccttgcctgcattattaccctcaccatttggcgaactggcaacgttcagcttcacaagggcattgagttcttccgaaagcaggttgttcgaatggacgatgaggctgataaccaccgaccctctggttttgagattgtctttcccgctatgcttaacgaggctaagtcccttggtcttgacctgccctacgagcttcccttcattgagcagatggttaagaagcgagaggccaagctcaagatgattaccaccaacgtcctgtacaccattcagactaccctcctttactctctggagggccttcacgagattgttgacttcgataagattatcaagctccagtccaaggacggttctttcctcggctcccccgcttctactgccgctgttttcatgcagactggtaacactaagtgccttgagttccttgagttcgttctccgaaagtttcgaaaccacgtgccctctgactaccccctcgatctctttgagcgactttgggtcgttgacactgttgagcgacttggcattgatcgacacttcaagaaggagatcaaggacgctcttgactacgtgtactcttgttgggacgagcgaggcattggctgggccaaggactctcccatcgccgatattgatgacactgctatgggccttcgaatccttcgactgcacggatacaacgtttcccccgatgttctcaagactttcaaggacgagaacggagagttcttttgcttcatgggtcagactcagcgaggagttaccgacatgcttaacgtttaccgatgttctcaggttgcttttcccggagagactatcatggaggaggccaagctctgtactgagcgatacctgcgaaacgctctggagaacgccgacgcctttgacaagtgggctattaagaagaacattcgaggcgaggtggagtacgctctcaagtacccctggcaccgatctatgccccgactggaggtgcgatcttacattggtaactacggccccaacgatgtctggcttggtaagtccctttacatgatgccctacatttctaacgagaagtaccttgagcttgccaagctggacttcaactctgtgcagtcccttcaccaggaggagattcgagagcttgtccgatggtgtaagtcctctggtttcactgagctgaagttcacccgagatcgagttgttgagacttacttcgctgttgcctcctccatgtttgagcccgagttctctacctgtcgagccgtttacactaagatttccgttctcctcgtcattcttgacgacctttacgatggctacggttctcccgacgagatcaagctgttctccgaggctgtcaagcgatgggatctctcccttcttgagcagatgcccgaccacatgaagatttgcttcctgggtctttacaacactgttaacgaggttgctgaggagggacgaaagactcagggccacgatgttcttggctacattcgaaacctttgggagattcagctcgccgctttcacccgagaggctgagtggtcccagggcaagtacgtgccctctttcgatgagtacattgagaacgcccaggtttctattggagttgctactatcctccttattactattcttttcactgaggaggacgatattctctcccacattgattacggttccaagtttctccgactcgcttctcttaccgctcgacttgccaacgacatcaagacttaccaggaggagcgagcccacggcgaggtggtttccgctattcagtgttacatgaaggaccgacccgagattactgaggaggaggctctcaagtacgtttacggtcgaatggttaacgatctcgccgagcttaactctgagtacctcaagtctaacgagatgccccagaactgcaagcgactggtttttgacactgcccgagttgcccagcttttcactatggagggtgacggcctcacctactctgacactatggagattaaggagcacatcaagaagtgcctctttgagcccgctacctaa
seqidno:8是編碼來自nicotianatabacum的冷杉醇合酶基因的dna序列,其針對在yarrowialipolytica中表達而進行了優(yōu)化
atggttcttggcctgcgatctaagatcattccccttcccgatcacaagctcggaaacatcaagctcggttctgttaccaacgctatttgccaccgaccctgtcgagtccgatgctctcactctactgcttcctctatggaggaggctaaggagcgaatccgagagactttcggaaagattgagctttctccctcctcttacgacactgcttgggttgctatggtcccctctcgatactctatgaaccagccctgttttccccagtgccttgactggattcttgagaaccagcgagaggacggttcttggggcctcaacccctctcacccccttctcgttaaggactccctttcttccactctcgcttctctccttgcccttcgaaagtggcgaattggtgataaccaggtccagcgaggtcttggctttattgagactcacggttgggctgtcgataacaaggatcagatttctccccttggttttgagattatctttccctgcatgattaactacgctgagaagctcaaccttgacctcccccttgaccccaaccttgttaacatgatgctctgcgagcgagagcttaccattgagcgagccctcaagaacgagtttgagggtaacatggctaacgttgagtactttgctgagggactcggtgagctttgtcactggaaggagatgatgcttcgacagcgacacaacggctctctctttgactctcccgccaccactgccgctgcccttatttaccaccagtacgatgagaagtgctttggctacctcaactctatcctcaagctccacgataactgggttcccactatttgccccactaagattcactctaaccttttcctcgttgatgcccttcagaacctcggagttgaccgatactttaagactgaggttaagcgagttctcgatgagatttaccgactttggcttgagaagaacgaggagattttttctgacgttgctcactgtgctatggcttttcgactccttcgaatgaacaactacgaggtttcctctgaggagcttgagggttttgttgaccaggagcacttctttactacctcctctggcaagctcatgaaccacgttgctattctggagcttcaccgagcttctcaggtggctattcacgagcgaaaggaccacattcttgataagatttctacttggactcgaaactttatggagcagaagctccttgacaagcacattcccgaccgatctaagaaggagatggagtttgctatgcgaaagttttacggcactttcgaccgagtggagactcgacgatacatcgagtcttacaagatggactcctttaagattctcaaggccgcttaccgatcttccggtattaacaacattgaccttctcaagttctctgagcacgatttcaacctctgccagacccgacacaaggaggagcttcagcagatgaagcgatggttcaccgattgcaagctggagcaggtcggtctttctcagcagtacctctacacttcttacttcattatcgccgctatcctctttgagcccgagtacgctgatgctcgacttgcttacgctaagtacgccatcattatcactgccgtggacgatttcttcgattgttttatttgcaaggaggagcttcagaacatcatcgagcttgtcgagcgatgggagggatactctaccgtcggattccgatctgagcgagttcgaattttcttccttgccctttacaagatggttgaggagattgctgccaaggccgagactaagcagggtcgatgtgtcaaggatcaccttattaacctttggattgatatgctcaagtgtatgctggttgagcttgacctttggaagattaagtccactaccccctctatcgaggagtacctttctgttgcctgtgttactattggtgttccctgttttgttctcacttctctctaccttctcggacccaagctgtccaaggacgtcattgagtcctctgaggtttccgccctttgcaactgtactgccgctgtcgcccgacttattaacgatattcactcctacaagcgagagcaggctgagtcctctactaacatggtttctatccttatcacccagtcccagggtactatctctgaggaggaggctattcgacagattaaggagatgatggagtctaagcgacgagagcttctcggaatggttctccagaacaaggagtcccagctcccccaggtgtgcaaggacctcttttggactaccatcaacgccgcttactctattcacactcacggcgatggataccgattccccgaggagttcaagaaccacatcaacgatgttatttacaagcccctcaaccagtactccccctaa
附圖簡述
現(xiàn)在參照圖1-3通過示例性方式示出本發(fā)明的實施方式,其中:
圖1顯示:可以通過化學方法將香紫蘇醇和冷杉醇轉化成降龍涎香醚。
圖2顯示了將香葉基香葉基二磷酸在煙草中朝向冷杉醇和在快樂鼠尾草中朝向香紫蘇醇轉化的生物化學通路。a.煙草中朝向冷杉醇和快樂鼠尾草中朝向香紫蘇醇的通路涉及兩種單獨的酶的活性:將香葉基香葉基二磷酸(ggpp)轉化為賴百當-13-烯-8-醇-二磷酸(ldpp)的ii類ditps和將ldpp轉換為最終產物的i類ditps。在煙草中,冷杉醇合酶(nt-abs)(其是i類ditps)將ldpp轉化為冷杉醇。在快樂鼠尾草中,香紫蘇醇合酶(其是另一種i類ditps)將ldpp轉化成香紫蘇醇。b.在冷杉中,通過單一的雙功能i/ii類順式冷杉醇合酶(ab-cas)進行ggpp朝向ldpp和ldpp朝向冷杉醇的兩步轉化。
圖3顯示了產冷杉醇菌株的十二烷覆蓋(dodecaneoverlay)的hplc色譜圖。使用c18柱。流動相為4∶1的甲醇乙醇、0.1%的tfa,并在前三分鐘內加入11%的水,然后是未摻雜的甲醇乙醇持續(xù)14分鐘。在注射之前,將樣品在流動相中以1∶10稀釋。圖3a顯示了商業(yè)冷杉醇參照樣品的冷杉醇峰。圖3b顯示了由轉化體生產的冷杉醇的冷杉醇峰。
發(fā)明詳述
除非本文另有定義,否則本文使用的科學和技術術語具有本領域普通技術人員通常所理解的含義。
術語“ii類二萜合酶”或“ii類ditps”表示能夠催化香葉基香葉基二磷酸轉化為賴百當-13-烯-8-醇二磷酸的酶。ii類二萜合酶可來自多種生物體,例如煙草(nicotiana)或快樂鼠尾草(salvia)。本文實施方式中使用的源自nicotianatabacum和salviasclarea的特異性ii類二萜合酶分別通過另外的符號(例如“nt-ii類-ditps”和“ss-ii類-ditps”)被提及。nt-ii類-ditps的實例是具有氨基酸序列seqidno:1的多肽。ss-ii類-ditps的實例是具有氨基酸序列seqidno:2的多肽
術語“i類二萜合酶”或“i類ditps”表示能夠催化賴百當-13-烯-8-醇二磷酸轉化為冷杉醇或香紫蘇醇的酶。本文實施方式中使用的源自nicotianatabacum的特異性i類二萜合酶通過另外的符號(例如“nt-abs”)被提及。nt-abs的實例是具有氨基酸序列seqidno:4的多肽。
術語“雙功能i/ii類冷杉醇合酶”或“雙功能i/ii類cas”表示能夠催化香葉基香葉基二磷酸轉化為冷杉醇的酶。雙功能i/ii類冷杉醇合酶具有兩個活性位點,分別具有i類二萜合酶和ii類二萜合酶的功能。本文的特定實施方式中使用的源自abiesbalsamea的特異性雙功能i/ii類冷杉醇合酶通過另外的符號(例如“ab-雙功能i/ii類cas”或簡單的ab-cas)被提及。ab-雙功能i/ii類冷杉醇合酶的實例是具有氨基酸序列seqidno:3的多肽。
序列同一性:通過參數(shù)“序列同一性”來描述兩個氨基酸序列之間或兩個核苷酸序列之間的相關性。
為了本公開的目的,兩個氨基酸序列之間的序列同一性程度是使用如emboss程序包(emboss:theeuropeanmolecularbiologyopensoftwaresuite,rice等人,2000,trendsgenet.16:276-277)(優(yōu)選版本3.0.0或更新的版本)的needle程序中所執(zhí)行的needleman-wunsch算法(needleman和wunsch,1970,j.mol.biol.48:443-453)來確定的。所用的任選參數(shù)是:空位開放罰分為10,空位延伸罰分為0.5,和ebl0sum62(bl0sum62的emboss版本)取代矩陣。使用needle標記為“最長同一性”的輸出結果(使用-nobrief選項獲得)作為同一性百分比并且該輸出結果是如下計算的:(相同的殘基×100)/(比對的長度-比對中的空位總數(shù))。
為了本公開的目的,兩個脫氧核糖核苷酸序列之間的序列同一性程度是使用如emboss程序包(emboss:theeuropeanmolecularbiologyopensoftwaresuite,rice等人,2000,如上所述)(優(yōu)選版本3.0.0或更新的版本)的needle程序中所執(zhí)行的needleman-wunsch算法(needleman和wunsch,1970,如上所述)來確定的。所用的任選參數(shù)是:空位開放罰分為10,空位延伸罰分為0.5,和ednafull(ncbinuc4.4的emboss版本)取代矩陣。使用needle標記為“最長同一性”的輸出結果(使用-nobrief選項獲得)作為同一性百分比并且該輸出結果是如下計算的:(相同的脫氧核糖核苷酸×100)/(比對的長度-比對中的空位總數(shù))。
核酸構建體:術語“核酸構建體”意指單鏈或雙鏈核酸分子,其分離自天然存在的基因,或經修飾以自然界中本不存在的方式包含核酸的區(qū)段,或其為合成的。當核酸構建體包含表達本公開的編碼序列所需的控制序列時,術語核酸構建體與術語“表達盒”同義。
控制序列:術語“控制序列”意指用于表達編碼本公開多肽的多核苷酸所需的全部組件。每個控制序列對于編碼所述多肽的多核苷酸可為天然或外來的,或控制序列彼此間可為天然或外來的。所述控制序列包括但不限于前導序列、多聚腺苷酸化序列、前肽序列、啟動子、信號肽序列和轉錄終止子。控制序列至少包括啟動子,以及轉錄和翻譯終止信號。出于引入促進控制序列與編碼多肽的多核苷酸編碼區(qū)連接的特定限制位點的目的,控制序列可與接頭一起提供。
可操作地連接:術語“可操作地連接”意指這樣的構型,其中將控制序列置于相對于多核苷酸的編碼序列適當?shù)奈恢?,以使得控制序列指導編碼序列的表達。
表達:術語“表達”包括涉及多肽產生的任何步驟,包括但不限于轉錄、轉錄后修飾、翻譯、翻譯后修飾和分泌。
表達載體:術語“表達載體”意指線性或環(huán)狀dna分子,其包含編碼多肽的多核苷酸并與提供其表達的額外核苷酸可操作地連接。
宿主細胞:術語“宿主細胞”意指易于用包含本公開多核苷酸的核酸構建體或表達載體轉化、轉染、轉導等的任何細胞類型。術語“宿主細胞”涵蓋親代細胞的任何后代,其由于在復制過程中發(fā)生的突變而與親代細胞不同。
變體:術語“變體”意指具有酶活性的多肽,其在一個或多個(幾個)位置包含改變,即一個或多個(幾個)氨基酸殘基的替換、插入和/或缺失。替換意指用不同氨基酸替代占據(jù)位置的氨基酸,缺失意指去除占據(jù)位置的氨基酸,而插入意指在占據(jù)位置的氨基酸旁邊添加一個或多個氨基酸。在一些實施方式中,上述一個或多個氨基酸是1-3個氨基酸。
在根據(jù)本發(fā)明第一方面的方法的一個實施方式中,在ii類二萜合酶和雙功能i/ii類冷杉醇合酶的組合存在的情況下,由香葉基香葉基二磷酸(ggpp)轉化為冷杉醇。根據(jù)本文實施方式的ii類二萜合酶可以來自天然表達ii類二萜合酶的獨立的酶的任何生物體。在一個實施方式中,ii類二萜合酶來自煙草,或特別地,來自nicotianatabacum。在另一個實施方式中,ii類二萜合酶來自快樂鼠尾草,或特別地,來自salviasclarea。根據(jù)本文實施方式的ii類二萜合酶可包括例如但不限于這樣的多肽,所述多肽包含的氨基酸序列與seqidno:1或seqidno:2具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%的同一性。
根據(jù)本文實施方式的雙功能i/ii類冷杉醇合酶可以來自天然表達具有兩個活性位點的單一酶的任何生物體,所述兩個活性位點分別具有i類二萜合酶活性和ii類二萜合酶活性。在一個實施方式中,雙功能i/ii類冷杉醇合酶來自冷杉,或特別地,來自abiesbalsamea。根據(jù)本文實施方式的雙功能i/ii類冷杉醇合酶可包括例如但不限于這樣的多肽,所述多肽包含的氨基酸序列與seqidno:3具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%的同一性。
在本發(fā)明的一個實施方式中,由重組宿主細胞(例如重組微生物)表達ii類ditps和雙功能i/ii類冷杉醇合酶。因此,本發(fā)明的一個方面的步驟可發(fā)生在宿主細胞內,即所述方法可以至少部分是體內方法。宿主細胞可以是重組體,并且可以是例如經遺傳修飾的微生物。因此,微生物可以被遺傳修飾,即從其天然狀態(tài)被人為地改變,以表達ii類ditps和雙功能i/ii類冷杉醇合酶二者。在一個實施方式中,其表達nt-ii類-ditps和ab-雙功能i/ii類冷杉醇合酶的組合。在另一個實施方式中,其表達ss-ii類-ditps和ab-雙功能i/ii類冷杉醇合酶的組合。優(yōu)選地,酶是外源性的(即修飾之前不存在于細胞中),其使用例如本文所述的微生物學方法引入。此外,在本發(fā)明的方法中,酶可以各自由重組宿主細胞在同一宿主細胞內或在不同的宿主細胞中表達。冷杉醇可以從形成其的宿主細胞分泌。
可以通過本領域技術人員已知適合于該目的的任何方式對宿主細胞進行遺傳修飾。這包括將感興趣的基因,例如一個或多個編碼雙功能i/ii類冷杉醇合酶和ii類ditps酶的基因引入到能夠在宿主細胞內復制的質?;蛘沉;蚱渌磉_載體中。或者,質粒或粘粒dna或質?;蛘沉na的一部分或線性dna序列可以整合到宿主基因組中,例如通過同源重組或隨機整合。為了進行遺傳修飾,可以通過天然攝取或由公知方法(例如電穿孔)介導而將dna引入或轉化到細胞中。遺傳修飾可以涉及在引入的啟動子的控制下表達基因。引入的dna可編碼能夠充當酶或能夠調節(jié)其它基因表達的蛋白質。
這樣的宿主細胞可以包含編碼雙功能i/ii類冷杉醇合酶和ii類ditps的核酸序列。例如,細胞可以包含一種包含seqidno:3的核酸序列和至少一種包含seqidno:1或seqidno:2的核酸序列,或其互補序列,或編碼雙功能i/ii類冷杉醇合酶和ii類ditps(例如本文所述的酶)中的任何酶的功能性變體(其可以是提供功能性變體的片段)的這種多核苷酸的片段。編碼酶的核酸序列可以是外源的,即不是天然存在于宿主細胞中。
因此,本發(fā)明的另一方面提供了重組宿主細胞,例如微生物,其包含為ii類ditps的第一多肽,例如其氨基酸序列與seqidno:1或2至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%相同,并且包含為雙功能i/ii類冷杉醇合酶的第二多肽,例如其氨基酸序列與seqidno:3至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%相同。所述細胞還可以包含為上述任何序列的功能性變體或片段的多肽。
合適的多核苷酸可以通過隨機整合、同源重組被引入細胞中,和/或可以形成包含表達載體的一部分,所述表達載體包含多核苷酸序列seqidno:1和seqidno:3的組合、多核苷酸序列seqidno:1和seqidno:2的組合,或其互補物。這種表達載體形成了本發(fā)明的另一方面。用于構建這種表達載體的合適載體是本領域公知的,并且可以被排列為包含可操作地連接到一個或多個表達控制序列的多核苷酸,以便可用于在宿主細胞(例如如上所述的微生物)中表達所需的酶。例如,啟動子(包括但不限于tef1、hsp和hyp啟動子)可以與內源基因和/或異源基因結合使用以改變ii類ditps和雙功能i/ii類冷杉醇合酶的表達模式。類似地,示例性終止子序列包括但不限于使用yarrowialipolyticaxpr2終止子序列。
在一些實施方式中,本說明書通篇所提及的重組體或經遺傳修飾的宿主細胞可以是選自酵母、真菌(例如yarrowia屬的成員)、原生生物、藻類、細菌和古生菌的任何微生物。細菌可以包括革蘭氏陽性細菌或革蘭氏陰性細菌,包括但不限于escherichia、corynebacterium、streptomyces、bacillus、pseudomonas、paracoccus和rhodococcus屬。在本發(fā)明的某些實施方式中,使用包括但不限于以下屬的酵母或真菌:aspergillusniger、aspergillusterreus、aspergillusnidulans、aspergillusoryzae、neurosporacrassa、blakeslea、candida、cryptococcus、cunninghamella、lipomyces、mortierella、mucor、phycomyces、pythium、rhodosporidium、rhodotorula、trichosporon和yarrowia。在某些具體實施方式中,使用包括但不限于以下種的生物體:blakesleatrispora、candidapulcherrima、c.revkaufi、c.tropicalis、cryptococcuscurvatus、cunninghamellaechinulata、c.elegans、c.japonica、escherichiacoli、fusariumsporotrichioides、f.graminearum、fusariumvenenatum、gibberrellazea、g.fujikuroi、lipomycesstarkeyi、l.lipoferus、mortierellaalpina、m.isabellina、m.ramanniana、m.vinacea、mucorcircinelloides、phycomycesblakesleanus、pythiumirregulare、rhodosporidiumtoruloides、rhodotorulaglutinis、r.gracilis、r.graminis、r.mucilaginosa、r.pinicola、saccharomycescerevisiae、trichosporonpullans、t.cutaneum和yarrowialipolytica。
特別合適的微生物例如包括yarrowialipolytica、escherichiacoli、fusariumvenenatum、gibberrellafujikuroi和saccharomycescerevisiae。
已經針對通過類異戊二烯通路的通量優(yōu)化了yarrowia平臺,并且已經實現(xiàn)了大于10克/升總類胡蘿卜素的生產水平。由于二萜也源自類異戊二烯通路,所以yarrowia非常適合高水平生產冷杉醇。
重組宿主細胞或微生物可用于表達上述酶,然后通過標準方法獲得無細胞提取物,以用于根據(jù)本發(fā)明第一方面的方法中。
本公開的實施方式還包括本文所限定多肽的變體。在本文中使用時,“變體”意指氨基酸序列與其所源自的基礎序列不同的多肽,所述不同為序列內的一個或多個氨基酸被其它氨基酸替換。例如,seqidno:1的變體的氨基酸序列可以與seqidno:1至少約50%、例如至少約55%、60%、65%、70%、75%,80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同。變體和/或片段是功能性變體/片段,這是因為變體序列與具有本文所示出的非變體氨基酸序列的酶具有相似或相同的功能酶活性特征。
例如,seqidno:1的功能性變體具有與seqidno:1相似或相同的ii類ditps特征。一個實例可以是,seqidno:1的功能變體的ggpp朝向ldpp的轉化率可以相同或相似,但所述功能變體也可以提供其它益處。例如,當使用為seqidno:1的功能性變體的酶時,將實現(xiàn)至少約80%、90%、95%、96%、97%、98%、99%或至少約100%的轉化率。
因此,任何上述seqidno氨基酸序列的功能性變體或片段是保持在相同酶類別內(即具有相同ec編號)的任何氨基酸序列。確定酶是否落入特定類別內的方法是本領域技術人員熟知的,本領域技術人員能夠在不使用創(chuàng)造性技能的情況下確定酶類別。合適的方法可以例如從國際生物化學與分子生物學聯(lián)合會獲得。
當氨基酸被具有廣泛相似性質的不同氨基酸替代時,氨基酸替換可以被認為是“保守的”。非保守替換是氨基酸被不同類型的氨基酸取代。
“保守替換”意指氨基酸被同一種類的另一種氨基酸替換,其中種類被定義如下:
氨基酸種類的例子:
非極性:a、v、l、i、p、m、f、w
不帶電荷且為極性:g、s、t、c、y、n、q
酸性:d、e
堿性:k、r、h。
本發(fā)明延伸到用于將ggpp轉化成冷杉醇的ii類ditps和雙功能i/ii類冷杉醇合酶的新組合。從ggpp朝向冷杉醇的轉化率顯著提高是這種新組合的結果。在如實施例3所示的特定實施方式中,與單獨使用雙功能i/ii類冷杉醇合酶相比,將來自nicotianatabacum或salviasclare的ii類ditps與來自abiesbalsamea的雙功能i/ii類冷杉醇合酶組合使用時,觀察到冷杉醇滴度的10倍增加。
上述結果是出乎意料的。本領域通常認識到:由于支架效應,單個雙功能酶相較于具有相同的兩種功能的兩種分離的酶將更有效地催化底物(zerbe等人,2012,j.biol.chem.287:第12121-12131頁)。理由是:雙功能酶中兩種活性的表達更加平衡,且活性保持彼此接近。該觀點得到了本公開中的觀察的證實:與來自a.balsamea的i/ii類雙功能ditps相比,來自nicotianatabacum的i類ditps和ii類ditps的組合產生很少冷杉醇。參見實施例3。
與上述教導相悖,本公開的發(fā)明人創(chuàng)建了含有ii類ditps單功能酶和雙功能i/ii類冷杉醇合酶的轉化體。結果顯示:冷杉醇產生的滴度顯著高于i類ditps和ii類ditps的雙酶體系或單一雙功能i/ii類冷杉醇合酶所產生的滴度。在雙功能i/ii類冷杉醇合酶之外添加ii類ditps酶不僅僅產生累加效應。相反,實現(xiàn)了協(xié)同效應,這是出乎意料的。
以下實施例旨在說明本發(fā)明,而不以任何方式限制其范圍。
實施例
實施例1
構建含有ii類ditps基因、雙功能i/ii類冷杉醇合酶的載體
表1中示出了本公開中構建和使用的質粒。
根據(jù)yarrowia密碼子偏好對abiesbalsamea的雙功能i/ii類冷杉醇合酶基因(ab-cas)進行密碼子優(yōu)化,并從頭合成。在從頭合成期間,在推定的atg起始密碼子的上游緊接著添加序列5’-tgctagccacaaaa,其含有nhei限制性位點和用于實現(xiàn)有效翻譯起始的典型kozak序列。在終止密碼子的下游緊接著添加包含mlui限制性位點的序列acgcgt-3’。使用nhei和mlui切割該序列,然后與用nhei和mlui切割的pmb6655連接以產生pmb6839。seqidno:3中示出由pmb6839的ab-cas基因編碼的所得蛋白質。將nicotiniatabacum的ii類ditps基因(nt-ii類-ditps)克隆到如上所述的表達載體pmb6674中以產生pmb6845。seqidno:2中示出由pmb6845編碼的nt-ii類-ditps基因的蛋白質序列。通過用pvuii和sspi消化來切除pbb6839中的終止子和啟動子以及ab-cas基因,然后克隆到pmb6845的ecorv位點以產生pmb6847,其表達ab-cas基因和nt-ii類-ii-ditps基因以及潮霉素抗性基因hph。
如關于pmb6839所述,合成nicotiniatabacum的冷杉醇合酶基因(nt-abs)并將其克隆到pmb6655中以產生pmb6840。seqidno:4中示出了pmb6840的nt-abs基因的蛋白質序列。通過用pvuii和sspi消化除去pmb6840中的終止子和啟動子以及nt-abs基因,然后克隆到pmb6845的ecorv位點以產生pmb6849,其表達nt-abs基因和nt-ii類-ditps基因以及潮霉素抗性基因hph。
如上所述合成salviasclarea的ii類ditps(ss-ii類-ditps)基因并克隆到pmb6674中以產生pmb6874。seqidno:2中示出了ss-ii類-ditps的蛋白質序列。通過用pvuii和sspi消化來切除pbmb6839的ab-cas基因和表達信號,然后克隆到pmb6874的ecorv位點以產生pmb6879,其表達ab-abs基因和ss-ii類-ditps基因以及潮霉素選擇。
根據(jù)yarrowia密碼子偏好對編碼氨基酸序列seqidno1-4的基因序列進行密碼子優(yōu)化,得到的核酸序列分別為seqidno5-8。
表1.質粒
本文所述的所有基本分子生物學和dna操作程序通常根據(jù)sambrook等人或ausubel等人(j.sambrook,e.f.fritsch,t.maniatis(編).1989.molecularcloning:alaboratorymanual.coldspringharborlaboratorypress:newyork;f.m.ausubel,r.brent,r.e.kingston,d.d.moore,j.g.seidman,j.a.smith,k.struhl(編).1998.currentprotocolsinmolecularbiology.wiley:newyork)進行。
實施例2
構建含有ii類ditps基因和雙功能i/ii類冷杉醇合酶基因的重組宿主細胞
在該實施例中,將含有ii類ditps和雙功能i/ii類冷杉醇合酶基因的載體引入y.lipolytica的宿主菌株中。
將上述載體轉化到y(tǒng).lipolytica菌株(ml7206)中,該菌株之前已經針對提高的通過類異戊二烯通路的通量被優(yōu)化。宿主菌株ml7206是具有以下基因型(matberg9-4789::ura3{hmg-trggscarb})的原養(yǎng)型y.lipolytica菌株。如下構建菌株ml7206:從如美國專利no.7,851,199中所述的mf350和atcc201249開始,引入受組成型啟動子控制的異源基因,外加幾代雜交。編碼鯊烯合酶的erg9基因被替換為具有點突變(f317i)和緊接在終止密碼子之后的ura3基因(隨后通過突變失活)插入的次形態(tài)(hypomorphic)版本。
ggs基因和截短的hmg基因(“hmg-tr”)源自分別對應于天然香葉基香葉基焦磷酸合酶和羥甲基戊二酰輔酶a還原酶基因的yarrowia序列。carb基因源自mucorcircinelloides,其編碼八氫番茄紅素脫氫酶活性,但與下列實施例無關。
實施例3
研究含有ii類ditps基因和雙功能i/ii類cas基因的重組宿主細胞的冷杉醇滴度
在該實施例中,檢驗了實施例2中所述的重組宿主細胞中的冷杉醇產生。
使實施例2中所述的轉化體在搖瓶中在覆蓋有10%體積的十二烷的豐富培養(yǎng)基(ypd)上生長。利用類異戊二烯的先前研究顯示:類異戊二烯產物通常由微生物輸出,并積累在十二烷覆蓋物中。在28℃、200rpm下生長6天后,將十二烷級分從搖瓶中移出,并利用光電二極管陣列檢測器,通過hplc在c18柱上分析。hplc設置由柱溫為16℃的ymcpackproc18rs柱[部件#rs08503-1456wt150x4.6mms3μm]組成,流動相由(400ml甲醇、100ml乙醇和0.1%三氟乙酸)的混合物組成,使用1ml/min的等度流速。含有冷杉醇合酶基因的轉化體在2.90分鐘時產生峰,最佳吸光度為237nm(圖3b)。該峰與購自torontoresearchchemicals的cat.#10760參照冷杉醇標準品一致(圖3a)。
表2.類異戊二烯優(yōu)化的菌株mb7206的轉化體中的冷杉醇產生
如表2所示,將含有來自煙草的ii類ditps基因和i類ditps冷杉醇合酶(abs)基因轉化到y(tǒng)arrowia中導致冷杉醇的生產量非常低。轉化單獨的冷杉的雙功能i/ii類冷杉醇合酶基因(ab-cas)導致冷杉醇的生產量略有提高。出乎意料地,含有冷杉雙功能i/ii類冷杉醇合酶基因(ab-cas)以及煙草ii類di-tps基因或鼠尾草ii類di-tps基因的轉化體產生顯著更高水平的冷杉醇。在含有煙草ii類di-tps基因和ab-cas基因的轉化體中,對于三種不同的培養(yǎng)基組成重復觀察到了這種效果。出乎意料地觀察到:添加來自煙草或鼠尾草的ii類酶能夠顯著超過單獨的冷杉的雙功能i/ii類冷杉醇合酶的活性,特別是考慮到轉化來自煙草的i類ditps冷杉醇合酶基因和ii類ditps導致很少產物這一事實。
序列表
<110>帝斯曼知識產權資產管理有限公司
<120>用于生產冷杉醇的方法
<130>30010-us-psp
<140>tbd
<141>2014-12-09
<160>8
<170>patentinversion3.5
<210>1
<211>802
<212>prt
<213>nicotianatabacum
<400>1
metglnvalileilethrserserhisargphephecyshishisleu
151015
hisglnleulysserprothrserleuseralaglnlysalagluphe
202530
lyslyshisglyproargasntrpleupheglnthrgluglyserleu
354045
leutyrlysprovalargleuasncysalathrseraspalasertyr
505560
leuglyasnvalasnglutyrleugluserasphisserlysasnser
65707580
gluglulysaspileglnvalserargthrileglnmetlysglyleu
859095
thrglugluilelyshismetleuasnsermetgluaspglyargleu
100105110
asnvalleualatyraspthralatrpvalserpheileproasnthr
115120125
thrasnasnglyasnaspglnargprometpheprosercysleugln
130135140
trpileileaspasnglnleuseraspglysertrpglyglugluile
145150155160
valphecysiletyraspargleuleuasnthrleuvalcysvalile
165170175
alaleuthrleutrpasnthrcysleuhislysargasnlysglyval
180185190
metpheilelysgluasnleuserlysleugluthrglygluvalglu
195200205
asnmetthrserglyphegluleuvalpheprothrleuleuglulys
210215220
alaglnglnleuaspileaspileprotyraspalaprovalleulys
225230235240
aspiletyralaargarggluvallysleuthrargileprolysasp
245250255
valilehisthrileprothrthrvalleupheserleugluglyleu
260265270
argaspaspleuasptrpglnargleuleulysleuglnmetproasp
275280285
glyserpheleuileserproalaserthralaphealaphemetglu
290295300
thrasnaspglulyscysleualatyrleuglnasnvalvalglulys
305310315320
serasnglyglyalaargglntyrpropheaspleuvalthrargleu
325330335
trpalaileaspargleuglnargleuglyilesertyrtyrpheala
340345350
glugluphelysgluleuleuasnhisvalpheargtyrtrpaspglu
355360365
gluasnglyilepheserglyargasnserasnvalseraspvalasp
370375380
aspthrcysmetalaileargleuleuargleuhisglytyraspval
385390395400
serproaspalaleuasnasnphelysaspglyaspglnphevalcys
405410415
pheargglygluvalaspglyserprothrhismetpheasnleutyr
420425430
argcysserglnvalleupheproglyglulysileleuglugluala
435440445
lysasnphethrtyrasnpheleuglnglncysleualaasnasnarg
450455460
cysleuasplystrpvalilealalysaspileproglygluiletrp
465470475480
tyralaleuglupheprotrptyralaserleuproargvalgluala
485490495
argtyrtyrilegluglntyrglyglyalaaspaspiletrpilegly
500505510
lysthrleutyrargmetproaspvalasnasnasnvaltyrleugln
515520525
alaalalysleuasptyrasnargcysglnserglnhisargpheglu
530535540
trpleuilemetglnglutrppheglulyscysasnpheglnglnphe
545550555560
glyileserlyslystyrleuleuvalsertyrpheleualaalaala
565570575
serilephegluvalglulysserarggluargleualatrpalalys
580585590
serargileilecyslysmetilethrsertyrtyrasnaspgluala
595600605
thrthrtrpthrthrargasnserleuleumetgluphelysvalser
610615620
hisaspprothrarglysasnglyasngluthrlysgluileleuval
625630635640
leulysasnleuargglnpheleuargglnleuserglugluthrphe
645650655
gluaspleuglylysaspilehishisglnleuglnasnalatrpglu
660665670
thrtrpleuvalpheleuarggluglulysasnalacysglngluglu
675680685
thrgluleuleuvalargthrileasnleuserglyglytyrmetthr
690695700
hisaspgluileleupheaspalaasptyrgluasnleuserasnleu
705710715720
thrasnlysvalcysglylysleuasngluleuglnasnasplysval
725730735
thrglyglyserlysasnthrasnilegluleuaspmetglnalaleu
740745750
vallysleuvalpheglyasnthrserserasnileasnglnaspile
755760765
lysglnthrphephealavalvallysthrphetyrtyrseralahis
770775780
valserglugluilemetasnphehisileserlysvalleuphegln
785790795800
glnval
<210>2
<211>780
<212>prt
<213>salviasclarea
<400>2
metthrservalasnleuserargalaproalaalaileileargarg
151015
argleuglnleuglnprogluphehisalaglucyssertrpleulys
202530
serserserlyshisalaprophethrleusercysglnileargpro
354045
lysglnleuserglnilealagluleuargvalthrserleuaspala
505560
serglnalaserglulysaspileserleuvalglnthrprohislys
65707580
valgluvalasnglulysileglugluserileglutyrvalglnasn
859095
leuleumetthrserglyaspglyargileservalserprotyrasp
100105110
thralavalilealaleuilelysaspleulysglyargaspalapro
115120125
glnpheprosercysleuglutrpilealahishisglnleualaasp
130135140
glysertrpglyaspgluphephecysiletyraspargileleuasn
145150155160
thrleualacysvalvalalaleulyssertrpasnleuglnserasp
165170175
ileileglulysglyvalthrtyrilelysgluasnvalhislysleu
180185190
lysglyalaasnvalgluhisargthralaglyphegluleuvalval
195200205
prothrphemetglnmetalathraspleuglyileglnglyleupro
210215220
tyrasphisproleuilelysgluilealaaspthrlyslysglnarg
225230235240
leulysgluileprolysaspleuvaltyrglnmetprothrasnleu
245250255
leutyrserleugluglyleuglyaspleuglutrpgluargleuleu
260265270
lysleuglnserglyasnglyserpheleuthrserproserserthr
275280285
alaalavalleumethisthrlysaspglulyscysleulystyrile
290295300
gluasnalaleulysasncysaspglyglyalaprohisthrtyrpro
305310315320
valaspilepheserargleutrpalaileaspargleuglnargleu
325330335
glyileserargphepheglnhisgluilelystyrpheleuasphis
340345350
ilegluservaltrpglugluthrglyvalpheserglyargtyrthr
355360365
lyspheseraspileaspaspthrsermetglyvalargleuleulys
370375380
methisglytyraspvalaspproasnvalleulyshisphelysgln
385390395400
glnaspglylysphesercystyrileglyglnservalgluserala
405410415
serpromettyrasnleutyrargalaalaglnleuargpheprogly
420425430
glugluvalphegluglualathrlysphealapheasnpheleugln
435440445
glumetleuvallysaspargleuglngluargtrpvalileserasp
450455460
hisleupheaspgluilelysleuglyleulysmetprotrptyrala
465470475480
thrleuproargvalglualaalatyrtyrleuasphistyralagly
485490495
serglyaspvaltrpileglylysserphetyrargmetprogluile
500505510
serasnaspthrtyrlysgluleualaileleuasppheasnargcys
515520525
glnthrglnhisglnleuglutrpilehismetglnglutrptyrasp
530535540
argcysserleuserglupheglyileserlysarggluleuleuarg
545550555560
sertyrpheleualaalaalathrilephegluprogluargthrgln
565570575
gluargleuleuleualalysthrargileleuserlysmetilethr
580585590
serphevalasnileserglythrthrleuserleuasptyrasnphe
595600605
asnglyleuaspgluileileserseralaasngluaspglnglyleu
610615620
alaglythrleuleualathrphehisglnleuleuaspglypheasp
625630635640
iletyrthrleuhisglnleulyshisvaltrpserglntrpphemet
645650655
lysvalglnglnglygluglyserglyglygluaspalavalleuleu
660665670
alaasnthrleuasnilecysalaglyleuasngluaspvalleuser
675680685
asnasnglutyrthralaleuserthrleuthrasnlysilecysasn
690695700
argleualaglnileglnaspasnlysileleuglnvalvalaspgly
705710715720
serilelysasplysgluleugluglnaspmetglnalaleuvallys
725730735
leuvalleuglngluasnglyglyalavalaspargasnilearghis
740745750
thrpheleuservalphelysthrphetyrtyraspalatyrhisasp
755760765
aspgluthrthraspleuhisilephelysvalleu
770775780
<210>3
<211>867
<212>prt
<213>abiesbalsamea
<400>3
metalaleuprovaltyrserleulysserhisileproilethrthr
151015
ilealaseralalysmetasntyrthrproasnlysglymetilethr
202530
alaasnglyargserargargileargleuserproasnlysileval
354045
alacysalaglyglualaaspargthrpheproserglnserleuglu
505560
lysthralaleupheproaspglnpheserglulysasnglythrpro
65707580
serasnphethrproproasnargglupheproproserphetrpasn
859095
asnaspileileasnserilethralaserhislysvalglnthrgly
100105110
asparglysargileglnthrleuilesergluilelysasnvalphe
115120125
asnsermetglyaspglygluthrserproseralatyraspthrala
130135140
trpvalalaargileproalavalaspglysergluglnproglnphe
145150155160
proglnthrleuglutrpileleuglnasnglnleulysaspglyser
165170175
trpglyglugluphetyrpheleualatyraspargleuleualathr
180185190
leualacysileilethrleuthriletrpargthrglyasnvalgln
195200205
leuhislysglyilegluphephearglysglnvalvalargmetasp
210215220
aspglualaaspasnhisargproserglyphegluilevalphepro
225230235240
alametleuasnglualalysserleuglyleuaspleuprotyrglu
245250255
leupropheilegluglnmetvallyslysargglualalysleulys
260265270
metilethrthrasnvalleutyrthrileglnthrthrleuleutyr
275280285
serleugluglyleuhisgluilevalasppheasplysileilelys
290295300
leuglnserlysaspglyserpheleuglyserproalaserthrala
305310315320
alavalphemetglnthrglyasnthrlyscysleuglupheleuglu
325330335
phevalleuarglyspheargasnhisvalproserasptyrproleu
340345350
aspleuphegluargleutrpvalvalaspthrvalgluargleugly
355360365
ileasparghisphelyslysgluilelysaspalaleuasptyrval
370375380
tyrsercystrpaspgluargglyileglytrpalalysaspserpro
385390395400
ilealaaspileaspaspthralametglyleuargileleuargleu
405410415
hisglytyrasnvalserproaspvalleulysthrphelysaspglu
420425430
asnglygluphephecysphemetglyglnthrglnargglyvalthr
435440445
aspmetleuasnvaltyrargcysserglnvalalapheproglyglu
450455460
thrilemetgluglualalysleucysthrgluargtyrleuargasn
465470475480
alaleugluasnalaaspalapheasplystrpalailelyslysasn
485490495
ileargglygluvalglutyralaleulystyrprotrphisargser
500505510
metproargleugluvalargsertyrileglyasntyrglyproasn
515520525
aspvaltrpleuglylysserleutyrmetmetprotyrileserasn
530535540
glulystyrleugluleualalysleuasppheasnservalglnser
545550555560
leuhisglnglugluilearggluleuvalargtrpcyslysserser
565570575
glyphethrgluleulysphethrargaspargvalvalgluthrtyr
580585590
phealavalalasersermetphegluproglupheserthrcysarg
595600605
alavaltyrthrlysileservalleuleuvalileleuaspaspleu
610615620
tyraspglytyrglyserproaspgluilelysleuphesergluala
625630635640
vallysargtrpaspleuserleuleugluglnmetproasphismet
645650655
lysilecyspheleuglyleutyrasnthrvalasngluvalalaglu
660665670
gluglyarglysthrglnglyhisaspvalleuglytyrileargasn
675680685
leutrpgluileglnleualaalaphethrargglualaglutrpser
690695700
glnglylystyrvalproserpheaspglutyrilegluasnalagln
705710715720
valserileglyvalalathrileleuleuilethrileleuphethr
725730735
glugluaspaspileleuserhisileasptyrglyserlyspheleu
740745750
argleualaserleuthralaargleualaasnaspilelysthrtyr
755760765
glnglugluargalahisglygluvalvalseralaileglncystyr
770775780
metlysaspargprogluilethrglugluglualaleulystyrval
785790795800
tyrglyargmetvalasnaspleualagluleuasnserglutyrleu
805810815
lysserasnglumetproglnasncyslysargleuvalpheaspthr
820825830
alaargvalalaglnleuphethrmetgluglyaspglyleuthrtyr
835840845
seraspthrmetgluilelysgluhisilelyslyscysleupheglu
850855860
proalathr
865
<210>4
<211>792
<212>prt
<213>nicotianatabacum
<400>4
metvalleuglyleuargserlysileileproleuproasphislys
151015
leuglyasnilelysleuglyservalthrasnalailecyshisarg
202530
procysargvalargcysserhisserthralasersermetgluglu
354045
alalysgluargilearggluthrpheglylysilegluleuserpro
505560
sersertyraspthralatrpvalalametvalproserargtyrser
65707580
metasnglnprocyspheproglncysleuasptrpileleugluasn
859095
glnarggluaspglysertrpglyleuasnproserhisproleuleu
100105110
vallysaspserleuserserthrleualaserleuleualaleuarg
115120125
lystrpargileglyaspasnglnvalglnargglyleuglypheile
130135140
gluthrhisglytrpalavalaspasnlysaspglnileserproleu
145150155160
glyphegluileilepheprocysmetileasntyralaglulysleu
165170175
asnleuaspleuproleuaspproasnleuvalasnmetmetleucys
180185190
gluarggluleuthrilegluargalaleulysasnglupheglugly
195200205
asnmetalaasnvalglutyrphealagluglyleuglygluleucys
210215220
histrplysglumetmetleuargglnarghisasnglyserleuphe
225230235240
aspserproalathrthralaalaalaleuiletyrhisglntyrasp
245250255
glulyscyspheglytyrleuasnserileleulysleuhisaspasn
260265270
trpvalprothrilecysprothrlysilehisserasnleupheleu
275280285
valaspalaleuglnasnleuglyvalaspargtyrphelysthrglu
290295300
vallysargvalleuaspgluiletyrargleutrpleuglulysasn
305310315320
glugluilepheseraspvalalahiscysalametalapheargleu
325330335
leuargmetasnasntyrgluvalserserglugluleugluglyphe
340345350
valaspglngluhisphephethrthrserserglylysleumetasn
355360365
hisvalalaileleugluleuhisargalaserglnvalalailehis
370375380
gluarglysasphisileleuasplysileserthrtrpthrargasn
385390395400
phemetgluglnlysleuleuasplyshisileproaspargserlys
405410415
lysglumetgluphealametarglysphetyrglythrpheasparg
420425430
valgluthrargargtyrileglusertyrlysmetaspserphelys
435440445
ileleulysalaalatyrargserserglyileasnasnileaspleu
450455460
leulysphesergluhisasppheasnleucysglnthrarghislys
465470475480
glugluleuglnglnmetlysargtrpphethraspcyslysleuglu
485490495
glnvalglyleuserglnglntyrleutyrthrsertyrpheileile
500505510
alaalaileleuphegluproglutyralaaspalaargleualatyr
515520525
alalystyralaileileilethralavalaspaspphepheaspcys
530535540
pheilecyslysglugluleuglnasnileilegluleuvalgluarg
545550555560
trpgluglytyrserthrvalglypheargsergluargvalargile
565570575
phepheleualaleutyrlysmetvalglugluilealaalalysala
580585590
gluthrlysglnglyargcysvallysasphisleuileasnleutrp
595600605
ileaspmetleulyscysmetleuvalgluleuaspleutrplysile
610615620
lysserthrthrproserilegluglutyrleuservalalacysval
625630635640
thrileglyvalprocysphevalleuthrserleutyrleuleugly
645650655
prolysleuserlysaspvalileglusersergluvalseralaleu
660665670
cysasncysthralaalavalalaargleuileasnaspilehisser
675680685
tyrlysarggluglnalagluserserthrasnmetvalserileleu
690695700
ilethrglnserglnglythrileserglugluglualailearggln
705710715720
ilelysglumetmetgluserlysargarggluleuleuglymetval
725730735
leuglnasnlysgluserglnleuproglnvalcyslysaspleuphe
740745750
trpthrthrileasnalaalatyrserilehisthrhisglyaspgly
755760765
tyrargpheproglugluphelysasnhisileasnaspvaliletyr
770775780
lysproleuasnglntyrserpro
785790
<210>5
<211>2409
<212>dna
<213>yarrowialipolytica
<400>5
atgcaggttattattacctcctctcaccgatttttctgccaccaccttcaccagctcaag60
tcccctacctccctttctgctcagaaggctgagtttaagaagcacggcccccgaaactgg120
cttttccagactgagggctctctcctttacaagcctgtccgactcaactgtgctacttct180
gatgcttcttaccttggtaacgtgaacgagtaccttgagtctgaccactctaagaactcc240
gaggagaaggatattcaggtttcccgaactatccagatgaagggtcttaccgaggagatc300
aagcacatgcttaactctatggaggacggacgacttaacgtcctcgcctacgacactgct360
tgggtttcctttattcctaacactaccaacaacggaaacgatcagcgacctatgtttccc420
tcttgtcttcagtggattattgacaaccagctttctgatggttcttggggagaggagatt480
gttttctgcatttacgaccgactccttaacactctcgtttgtgttattgctctcactctc540
tggaacacttgccttcacaagcgaaacaagggtgtgatgtttatcaaggagaacctttct600
aagctggagactggtgaggttgagaacatgacttctggttttgagcttgtttttcccact660
ctccttgagaaggcccagcagctcgatattgacattccctacgatgctcctgtcctgaag720
gatatttacgctcgacgagaggttaagctcacccgaatccctaaggacgttatccacact780
attcccactaccgttctcttttctcttgagggactccgagatgacctcgactggcagcga840
ctcctgaagctccagatgcctgacggttctttcctgatttcccctgcttccactgccttt900
gctttcatggagactaacgatgagaagtgtcttgcctaccttcagaacgttgttgagaag960
tctaacggaggtgcccgacagtaccccttcgaccttgttactcgactttgggccattgat1020
cgactccagcgactcggaatctcttactactttgccgaggagttcaaggagcttctcaac1080
cacgtgttccgatactgggacgaggagaacggaattttctctggacgaaactctaacgtt1140
tctgatgttgatgacacttgcatggctatccgacttctccgacttcacggttacgatgtt1200
tcccctgacgcccttaacaacttcaaggacggcgaccagttcgtttgcttccgaggtgag1260
gtggacggttctcctacccacatgtttaacctctaccgatgttcccaggttcttttcccc1320
ggagagaagattcttgaggaggctaagaacttcacttacaacttccttcagcagtgcctt1380
gctaacaaccgatgcctcgacaagtgggtcattgctaaggacatccccggcgagatttgg1440
tacgctcttgagtttccctggtacgcctcccttccccgagtggaggctcgatactacatt1500
gagcagtacggcggagctgacgatatttggattggcaagactctctaccgaatgcccgat1560
gtcaacaacaacgtttaccttcaggctgccaagctcgattacaaccgatgccagtcccag1620
caccgatttgagtggctgattatgcaggagtggtttgagaagtgcaactttcagcagttc1680
ggaatttccaagaagtacctccttgtttcttacttccttgctgccgcttctatttttgag1740
gtcgagaagtcccgagagcgacttgcttgggctaagtctcgaattatctgtaagatgatt1800
acttcttactacaacgatgaggccactacctggaccactcgaaactctctccttatggag1860
tttaaggtttctcacgaccctacccgaaagaacggtaacgagactaaggagatccttgtt1920
ctcaagaaccttcgacagttccttcgacagctttctgaggagactttcgaggaccttggc1980
aaggacatccaccaccagcttcagaacgcttgggagacttggcttgttttccttcgagag2040
gagaagaacgcttgtcaggaggagactgagcttctcgtgcgaactattaacctctctggc2100
ggctacatgacccacgatgagattcttttcgatgccgactacgagaacctgtccaacctt2160
accaacaaggtttgtggcaagctcaacgagcttcagaacgacaaggtcactggcggctct2220
aagaacaccaacattgagcttgacatgcaggctctcgttaagctggtttttggtaacacc2280
tcctctaacatcaaccaggacattaagcagactttctttgctgttgtcaagaccttctac2340
tactctgcccacgtttctgaggagattatgaactttcacatttccaaggtgctctttcag2400
caggtctaa2409
<210>6
<211>2358
<212>dna
<213>yarrowialipolytica
<400>6
atgacttctgttaacctttcccgagcccccgctgccattatccgacgacgacttcagctt60
cagcctgagtttcacgccgagtgttcttggctgaagtcttcttccaagcacgcccccttc120
accctttcctgccagattcgacctaagcagctctcccagattgccgagcttcgagttact180
tccctcgatgcttcccaggcttccgagaaggacatttcccttgttcagactccccacaag240
gttgaggttaacgagaagatcgaggagtctatcgagtacgtccagaaccttctcatgact300
tccggcgacggacgaatttctgtgtccccctacgacaccgctgtgatcgccctgattaag360
gacctcaagggtcgagatgcccctcagtttccctcttgtcttgagtggattgcccaccac420
cagcttgctgatggctcttggggcgacgagttcttctgtatttacgaccgaatcctgaac480
actctcgcttgtgtcgtcgccctgaagtcttggaaccttcagtctgatattattgagaag540
ggtgtgacctacatcaaggagaacgtccacaagctcaagggtgccaacgttgagcaccga600
actgccggattcgagcttgtggttcctacctttatgcagatggccactgaccttggcatt660
cagggtcttccctacgatcaccccctcatcaaggagattgctgacactaagaagcagcga720
ctcaaggagattcccaaggatctcgtttaccagatgcctaccaaccttctctactccctt780
gagggactcggcgaccttgagtgggagcgactcctgaagctccagtccggcaacggctcc840
ttcctcacttccccctcctccaccgccgccgtccttatgcacaccaaggacgagaagtgt900
ctgaagtacatcgagaacgccctcaagaactgcgacggaggtgctccccacacttaccct960
gtcgatattttctctcgactttgggctattgatcgacttcagcgacttggtatttctcga1020
ttcttccagcacgagatcaagtacttcctcgatcacatcgagtccgtttgggaggagacc1080
ggagttttctctggacgatacactaagttttctgatattgatgacacctctatgggcgtt1140
cgacttctcaagatgcacggatacgacgtcgatcccaacgttctcaagcacttcaagcag1200
caggatggtaagttttcctgctacattggtcagtctgtcgagtctgcctctcctatgtac1260
aacctttaccgagccgcccagcttcgattccctggtgaggaggtttttgaggaggccact1320
aagtttgcctttaacttccttcaggagatgcttgtcaaggatcgacttcaggagcgatgg1380
gtgatttccgaccaccttttcgatgagattaagctgggcctcaagatgccttggtacgcc1440
acccttccccgagtcgaggccgcttactacctcgatcactacgctggttctggtgatgtt1500
tggattggcaagtctttctaccgaatgcctgagatttccaacgatacctacaaggagctt1560
gccattctcgatttcaaccgatgccagactcagcaccagcttgagtggattcacatgcag1620
gagtggtacgaccgatgctctctttccgagttcggcatttccaagcgagagcttctccga1680
tcttactttctcgccgccgctaccattttcgagcctgagcgaactcaggagcgacttctc1740
cttgccaagacccgaatcctgtctaagatgattacttcttttgtcaacatttccggtact1800
accctttctctcgactacaacttcaacggcctcgatgagattatctcctctgccaacgag1860
gatcagggtctggctggtactctcctggctaccttccaccagcttctcgacggattcgat1920
atttacactctccaccagctcaagcacgtttggtcccagtggttcatgaaggtgcagcag1980
ggagagggttctggcggcgaggacgccgtgctccttgccaacaccctcaacatctgcgcc2040
ggcctcaacgaggacgtgctctccaacaacgagtacactgctctgtccaccctcaccaac2100
aagatttgcaaccgactcgcccagatccaggacaacaagattctccaggttgtggacggc2160
tccatcaaggataaggagcttgagcaggatatgcaggcccttgtcaagctcgtccttcag2220
gagaacggcggagccgttgaccgaaacatccgacacaccttcctttccgttttcaagact2280
ttctactacgatgcctaccacgacgatgagactaccgaccttcacatcttcaaggttctc2340
tttcgacccgttgtgtaa2358
<210>7
<211>2604
<212>dna
<213>yarrowialipolytica
<400>7
atggccctgcccgtttactctctcaagtcccacattcccatcactaccatcgcctctgct60
aagatgaactacacccccaacaagggtatgattaccgccaacggacgatctcgacgaatc120
cgactttctcccaacaagatcgttgcttgtgctggtgaggctgatcgaactttcccctct180
cagtcccttgagaagaccgctctctttcccgatcagttttctgagaagaacggtactccc240
tctaacttcactccccccaaccgagagtttcccccctctttttggaacaacgatattatc300
aactctattactgcttctcacaaggttcagactggcgaccgaaagcgaatccagactctc360
atttctgagattaagaacgtctttaactctatgggcgatggtgagacttctccctctgct420
tacgacaccgcttgggttgctcgaatccccgccgttgatggctctgagcagccccagttt480
ccccagactcttgagtggattcttcagaaccagctcaaggacggttcttggggtgaggag540
ttctacttccttgcttacgaccgacttctcgctacccttgcctgcattattaccctcacc600
atttggcgaactggcaacgttcagcttcacaagggcattgagttcttccgaaagcaggtt660
gttcgaatggacgatgaggctgataaccaccgaccctctggttttgagattgtctttccc720
gctatgcttaacgaggctaagtcccttggtcttgacctgccctacgagcttcccttcatt780
gagcagatggttaagaagcgagaggccaagctcaagatgattaccaccaacgtcctgtac840
accattcagactaccctcctttactctctggagggccttcacgagattgttgacttcgat900
aagattatcaagctccagtccaaggacggttctttcctcggctcccccgcttctactgcc960
gctgttttcatgcagactggtaacactaagtgccttgagttccttgagttcgttctccga1020
aagtttcgaaaccacgtgccctctgactaccccctcgatctctttgagcgactttgggtc1080
gttgacactgttgagcgacttggcattgatcgacacttcaagaaggagatcaaggacgct1140
cttgactacgtgtactcttgttgggacgagcgaggcattggctgggccaaggactctccc1200
atcgccgatattgatgacactgctatgggccttcgaatccttcgactgcacggatacaac1260
gtttcccccgatgttctcaagactttcaaggacgagaacggagagttcttttgcttcatg1320
ggtcagactcagcgaggagttaccgacatgcttaacgtttaccgatgttctcaggttgct1380
tttcccggagagactatcatggaggaggccaagctctgtactgagcgatacctgcgaaac1440
gctctggagaacgccgacgcctttgacaagtgggctattaagaagaacattcgaggcgag1500
gtggagtacgctctcaagtacccctggcaccgatctatgccccgactggaggtgcgatct1560
tacattggtaactacggccccaacgatgtctggcttggtaagtccctttacatgatgccc1620
tacatttctaacgagaagtaccttgagcttgccaagctggacttcaactctgtgcagtcc1680
cttcaccaggaggagattcgagagcttgtccgatggtgtaagtcctctggtttcactgag1740
ctgaagttcacccgagatcgagttgttgagacttacttcgctgttgcctcctccatgttt1800
gagcccgagttctctacctgtcgagccgtttacactaagatttccgttctcctcgtcatt1860
cttgacgacctttacgatggctacggttctcccgacgagatcaagctgttctccgaggct1920
gtcaagcgatgggatctctcccttcttgagcagatgcccgaccacatgaagatttgcttc1980
ctgggtctttacaacactgttaacgaggttgctgaggagggacgaaagactcagggccac2040
gatgttcttggctacattcgaaacctttgggagattcagctcgccgctttcacccgagag2100
gctgagtggtcccagggcaagtacgtgccctctttcgatgagtacattgagaacgcccag2160
gtttctattggagttgctactatcctccttattactattcttttcactgaggaggacgat2220
attctctcccacattgattacggttccaagtttctccgactcgcttctcttaccgctcga2280
cttgccaacgacatcaagacttaccaggaggagcgagcccacggcgaggtggtttccgct2340
attcagtgttacatgaaggaccgacccgagattactgaggaggaggctctcaagtacgtt2400
tacggtcgaatggttaacgatctcgccgagcttaactctgagtacctcaagtctaacgag2460
atgccccagaactgcaagcgactggtttttgacactgcccgagttgcccagcttttcact2520
atggagggtgacggcctcacctactctgacactatggagattaaggagcacatcaagaag2580
tgcctctttgagcccgctacctaa2604
<210>8
<211>2379
<212>dna
<213>yarrowialipolytica
<400>8
atggttcttggcctgcgatctaagatcattccccttcccgatcacaagctcggaaacatc60
aagctcggttctgttaccaacgctatttgccaccgaccctgtcgagtccgatgctctcac120
tctactgcttcctctatggaggaggctaaggagcgaatccgagagactttcggaaagatt180
gagctttctccctcctcttacgacactgcttgggttgctatggtcccctctcgatactct240
atgaaccagccctgttttccccagtgccttgactggattcttgagaaccagcgagaggac300
ggttcttggggcctcaacccctctcacccccttctcgttaaggactccctttcttccact360
ctcgcttctctccttgcccttcgaaagtggcgaattggtgataaccaggtccagcgaggt420
cttggctttattgagactcacggttgggctgtcgataacaaggatcagatttctcccctt480
ggttttgagattatctttccctgcatgattaactacgctgagaagctcaaccttgacctc540
ccccttgaccccaaccttgttaacatgatgctctgcgagcgagagcttaccattgagcga600
gccctcaagaacgagtttgagggtaacatggctaacgttgagtactttgctgagggactc660
ggtgagctttgtcactggaaggagatgatgcttcgacagcgacacaacggctctctcttt720
gactctcccgccaccactgccgctgcccttatttaccaccagtacgatgagaagtgcttt780
ggctacctcaactctatcctcaagctccacgataactgggttcccactatttgccccact840
aagattcactctaaccttttcctcgttgatgcccttcagaacctcggagttgaccgatac900
tttaagactgaggttaagcgagttctcgatgagatttaccgactttggcttgagaagaac960
gaggagattttttctgacgttgctcactgtgctatggcttttcgactccttcgaatgaac1020
aactacgaggtttcctctgaggagcttgagggttttgttgaccaggagcacttctttact1080
acctcctctggcaagctcatgaaccacgttgctattctggagcttcaccgagcttctcag1140
gtggctattcacgagcgaaaggaccacattcttgataagatttctacttggactcgaaac1200
tttatggagcagaagctccttgacaagcacattcccgaccgatctaagaaggagatggag1260
tttgctatgcgaaagttttacggcactttcgaccgagtggagactcgacgatacatcgag1320
tcttacaagatggactcctttaagattctcaaggccgcttaccgatcttccggtattaac1380
aacattgaccttctcaagttctctgagcacgatttcaacctctgccagacccgacacaag1440
gaggagcttcagcagatgaagcgatggttcaccgattgcaagctggagcaggtcggtctt1500
tctcagcagtacctctacacttcttacttcattatcgccgctatcctctttgagcccgag1560
tacgctgatgctcgacttgcttacgctaagtacgccatcattatcactgccgtggacgat1620
ttcttcgattgttttatttgcaaggaggagcttcagaacatcatcgagcttgtcgagcga1680
tgggagggatactctaccgtcggattccgatctgagcgagttcgaattttcttccttgcc1740
ctttacaagatggttgaggagattgctgccaaggccgagactaagcagggtcgatgtgtc1800
aaggatcaccttattaacctttggattgatatgctcaagtgtatgctggttgagcttgac1860
ctttggaagattaagtccactaccccctctatcgaggagtacctttctgttgcctgtgtt1920
actattggtgttccctgttttgttctcacttctctctaccttctcggacccaagctgtcc1980
aaggacgtcattgagtcctctgaggtttccgccctttgcaactgtactgccgctgtcgcc2040
cgacttattaacgatattcactcctacaagcgagagcaggctgagtcctctactaacatg2100
gtttctatccttatcacccagtcccagggtactatctctgaggaggaggctattcgacag2160
attaaggagatgatggagtctaagcgacgagagcttctcggaatggttctccagaacaag2220
gagtcccagctcccccaggtgtgcaaggacctcttttggactaccatcaacgccgcttac2280
tctattcacactcacggcgatggataccgattccccgaggagttcaagaaccacatcaac2340
gatgttatttacaagcccctcaaccagtactccccctaa2379