專利名稱::丹參1-脫氧木酮糖-5-磷酸合成酶基因1及其編碼的蛋白質(zhì)和應(yīng)用的制作方法
技術(shù)領(lǐng)域:
:本發(fā)明屬于生物
技術(shù)領(lǐng)域:
,具體說,是涉及在丹參中表達(dá)的l-脫氧木酮糖-5-磷酸合成酶基因1及其編碼的蛋白質(zhì)和應(yīng)用。
背景技術(shù):
:丹參(&7w'a/w'7n'orr力izaBunge)是我國的一種傳統(tǒng)中藥材?,F(xiàn)代藥理研究表明,丹參對(duì)心血管系統(tǒng)和血液系統(tǒng)的作用十分顯著。以丹參為主的多種復(fù)方制劑如復(fù)方丹參注射液、復(fù)方丹參片、復(fù)方丹參膠囊和復(fù)方丹參滴丸(1997年向美國FDA以治療藥身份申報(bào)的品種)等已被廣泛用于臨床治療心血管疾病、腎病、肝病及抗感染等。但是,由于丹參生長周期較長(2年以上),在傳統(tǒng)的栽培模式下,面臨著品質(zhì)嚴(yán)重退化、生產(chǎn)成本相對(duì)過高等諸多弊端;離體條件下產(chǎn)生的丹參組培苗,其藥用活性成分的含量還遠(yuǎn)達(dá)不到商業(yè)化開發(fā)利用的要求。所以,利用現(xiàn)代基因工程手段將丹參藥用活性成分生物合成途徑中的關(guān)鍵酶基因?qū)氲降⒅?,獲得轉(zhuǎn)基因的發(fā)根、細(xì)胞系或再生植株,并進(jìn)行大規(guī)模的培養(yǎng),是提高丹參中丹參酮的含量和解決丹參藥源問題的最佳途徑之一。丹參酮類化合物(如丹參酮I、丹參酮IIA及隱丹參酮等)屬于二萜化合物,最新研究表明二萜化合物主要是通過l-去氧木糖-5-磷酸(DXP)途徑都來提供關(guān)鍵前體物質(zhì)。1-脫氧木酮糖-5-磷酸合成酶(Deoxyoxylulose-5-phosphatesynthase,DXS)是DXP途徑中的第一步催化酶,也是第一個(gè)關(guān)鍵性的限速酶,能以丙酮酸和3-磷酸甘油醛為前體,在焦磷酸硫胺素存在的情況下,催化生成關(guān)鍵前體5-磷酸脫氧木酮糖(l-deoxy-D-xylulose5-phosphate)(DXP),DXP在再經(jīng)過一系列催化步驟衍變生成丹參酮類化合物。從而為丹參酮的合成提供前體。因此,DXS是丹參酮類化合物代謝工程的首要調(diào)控靶點(diǎn)。提高l-脫氧木酮糖-5-磷酸合成酶l的活性或者含量,可以直接提高丹參中丹參酮的含量。在對(duì)現(xiàn)有文獻(xiàn)的分析中,"ThePlantJournal(植物雜志)2000,22:503-513"報(bào)道了從番茄中分離克隆出l-脫氧木酮糖-5-磷酸合成酶基因,但至今尚未有從我國特有的藥用植物丹參中分離克隆出1-脫氧木酮糖-5-磷酸合成酶基因l的文獻(xiàn)報(bào)道。由于這個(gè)基因編碼的酶對(duì)于丹參丹參酮的合成具有重要影響,因此,這一步是利用基因工程技術(shù)來提高丹參丹參酮合成的重要切入點(diǎn)。
發(fā)明內(nèi)容本發(fā)明所要解決的技術(shù)問題是提供一種丹參1-脫氧木酮糖-5-磷酸合成酶基因1。本發(fā)明的第二個(gè)目的是提供該基因編碼的蛋白質(zhì)。本發(fā)明的目的還在于提供含有該基因的重組載體和宿主細(xì)胞。本發(fā)明的另一個(gè)目的在于提供該基因的用途。本發(fā)明所提供的丹參l-脫氧木酮糖-5-磷酸合成酶基因1(6MIK7),(1)具有SEQIDNo.1所示的核苷酸序列;(2)SEQIDNo.1所示的核苷酸序列添加、取代、插入或缺失一個(gè)或多個(gè)核苷酸的同源序列或者其等位基因及其衍生的核苷酸序列。丹參1-脫氧木酮糖-5-磷酸合成酶基因l編碼的蛋白質(zhì)(SmDXSl),是以下氨基酸序列之一(1)具有SEQIDNo.2所示的氨基酸序列;(2)SEQIDNo.2添加、取代、插入或缺失一個(gè)或多個(gè)氨基酸的同源序列。含有本發(fā)明的丹參1-脫氧木酮糖-5-磷酸合成酶基因1全序列或部分片段的的重組載體,均屬于本發(fā)明的保護(hù)范圍。這些重組載體包括質(zhì)粒和植物表達(dá)載體。含有本發(fā)明的丹參1-脫氧木酮糖-5-磷酸合成酶基因1的宿主細(xì)胞,如含有上述重組載體的宿主細(xì)胞也屬于本發(fā)明的保護(hù)范圍。宿主細(xì)胞選自大腸桿菌細(xì)胞、農(nóng)桿菌細(xì)胞、酵母細(xì)胞、煙草細(xì)胞、丹參細(xì)胞或丹參發(fā)根細(xì)胞。所述宿主細(xì)胞為大腸桿菌細(xì)胞、農(nóng)桿菌細(xì)胞、酵母細(xì)胞、煙草細(xì)胞、丹參細(xì)胞或丹參發(fā)根細(xì)胞。優(yōu)選的宿主細(xì)胞為大腸桿菌細(xì)胞或農(nóng)桿菌細(xì)胞或丹參發(fā)根細(xì)胞。本發(fā)明的丹參l-脫氧木酮糖-5-磷酸合成酶基因l的應(yīng)用,包括用所述重組載體,包括用所述的重組載體,如植物表達(dá)載體轉(zhuǎn)化丹參細(xì)胞;或者用所述含有該基因的農(nóng)桿菌與丹參細(xì)胞共培養(yǎng),得到轉(zhuǎn)基因的丹參發(fā)根系;或者用所述的丹參發(fā)根細(xì)胞再生丹參植株;或者用所述的丹參卜脫氧木酮糖-5-磷酸合成酶基因1遺傳轉(zhuǎn)化獲得轉(zhuǎn)基因丹參植株。本發(fā)明技術(shù)方案中涉及的概念具體內(nèi)容如下本發(fā)明所說的丹參1-脫氧木酮糖-5-磷酸合成酶基因1的DNA分子包括編碼具有丹參l-脫氧木酮糖-5-磷酸合成酶1活性的多肽的核苷酸序列,而且所述的核苷酸序列與SEQIDNO.1中從核苷酸第294-2438位的核苷酸序列有至少70%的同源性;或者所述的核苷酸序列能在40—55t:條件下與SEQIDNO.1中從核苷酸第294-2438的核苷酸序列雜交。較佳地,所述的序列編碼具有SEQIDNO.2所示的氨基酸序列的多肽。更佳地,所述的序列具有SEQIDNO.1中從核苷酸第294-2438位的核苷酸序列。本發(fā)明分離出的丹參l-脫氧木酮糖-5-磷酸合成酶1多肽包括具有SEQIDNO.2氨基酸序列的多肽、或其保守性變異多肽、或其活性片段,或其活性衍生物。較佳地,該多肽是具有SEQIDNO.2序列的多肽。本發(fā)明中的DNA分子包含所述的DNA分子中8-100個(gè)連續(xù)核苷酸。在本發(fā)明中,"分離的"、"純化的"DNA是指,該DNA或片段已從天然狀態(tài)下位于其兩側(cè)的序列中分離出來,還指該DNA或片段己經(jīng)與天然狀態(tài)下伴隨核酸的組分分開,而且已經(jīng)與在細(xì)胞中伴隨其的蛋白質(zhì)分開。本發(fā)明中術(shù)語"丹參l-脫氧木酮糖-5-磷酸合成酶(或多肽)基因1"指編碼具有丹參l-脫氧木酮糖-5-磷酸合成酶1活性的多肽的核苷酸序列,如SEQIDNO.1中第294-2438位核苷酸序列及其簡并序列。該簡并序列是指,位于SEQIDNO.l序列的編碼框第294-2438位核苷酸中,有一個(gè)或多個(gè)密碼子被編碼相同氨基酸的簡并密碼子所取代后而產(chǎn)生的序列。由于密碼子的簡并性,所以與SEQIDNO.1中第294-2438位核苷酸序列同源性低至約70%的簡并序列也能編碼出SEQIDNO.2所述的序列。還包括能在中度嚴(yán)謹(jǐn)條件下,更佳的在高度嚴(yán)謹(jǐn)條件下與SEQIDNO.1中從核苷酸第294-2438位的核苷酸序列雜交的核苷酸序列。還包括與SEQIDNO.1中從核苷酸第294-2438位的核苷酸序列的同源性至少70%,較佳地至少80%,更佳地至少90%,最佳地至少95%的核苷酸序列。還包括能編碼具有與天然的丹參l-脫氧木酮糖-5-磷酸合成酶1相同功能的蛋白的SEQIDNO.1中開放閱讀框序列的變異形式。這些變異形式包括(但并不限于)若干個(gè)(通常為1-90個(gè),較佳地l-60個(gè),更佳地l-20個(gè),最佳地1-10個(gè))核苷酸的缺失、插入和/或取代,以及在5'和/或3'端添加數(shù)個(gè)(通常為60個(gè)以內(nèi),較佳地為30個(gè)以內(nèi),更佳地為10個(gè)以內(nèi),最佳地為5個(gè)以內(nèi))核苷酸。本發(fā)明中術(shù)語"丹參l-脫氧木酮糖-5-磷酸合成酶1或多肽"指具有丹參1-脫氧木酮糖-5-磷酸合成酶1活性的SEQIDNO.2序列的多肽。該術(shù)語還包括具有與天然丹參1-脫氧木酮糖-5-磷酸合成酶1相同功能的SEQIDNO.2序列的變異形式。這些變異形式包括(但并不限于)若干個(gè)(通常為1-50個(gè),較佳地1-30個(gè),更佳地1-20個(gè),最佳地1-10個(gè))氨基酸的缺失、插入和/或取代,以及在C末端和/或N末端添加一個(gè)或數(shù)個(gè)(通常為20個(gè)以內(nèi),較佳地為10個(gè)以內(nèi),更佳地為5個(gè)以內(nèi))氨基酸。例如,在本領(lǐng)域中,用性能相近或相似的氨基酸進(jìn)行取代時(shí),通常不會(huì)改變蛋白質(zhì)的功能。又比如,在C末端和/或N末端添加一個(gè)或數(shù)個(gè)氨基酸通常也不會(huì)改變蛋白質(zhì)的功能。該術(shù)語還包括丹參l-脫氧木酮糖-5-磷酸合成酶1的活性片段和活性衍生物,還包括能夠可操作地連于信號(hào)肽、啟動(dòng)子或者核糖體結(jié)合位點(diǎn)序列所組成的衍生物。本發(fā)明的丹參1-脫氧木酮糖-5-磷酸合成酶1多肽的變異形式包括同源序列、保守性變異體、等位變異體、天然突變體、誘導(dǎo)突變體、在高或低的嚴(yán)謹(jǐn)條件下能與丹參1-脫氧木酮糖-5-磷酸合成酶基因1雜交的DNA所編碼的蛋白、以及利用丹參1-脫氧木酮糖-5-磷酸合成酶1多肽的血清獲得的多肽或蛋白。本發(fā)明中丹參l-脫氧木酮糖-5-磷酸合成酶1保守性變異多肽指與SEQIDNO.2的氨基酸序列相比,有至多10個(gè),較佳地至多8個(gè),更佳地至多5個(gè)氨基酸性質(zhì)相似或相近的氨基酸所替換而形成多肽。這些保守性變異多肽最好根據(jù)表1進(jìn)行替換而產(chǎn)生。表1.保守性變異多肽中的取代殘基最初的殘基代表性的取代優(yōu)選的取代<table>tableseeoriginaldocumentpage6</column></row><table>Arg;Gin;AsnArg6<table>tableseeoriginaldocumentpage7</column></row><table>本發(fā)明還包括丹參l-脫氧木酮糖-5-磷酸合成酶1或多肽的類似物。這些類似物與天然卜脫氧木酮糖-5-磷酸合成酶1多肽的差別可以是氨基酸序列上的差異,也可以是不影響序列的修飾形式上的差異,或者兼而有之。這些多肽包括天然或誘導(dǎo)的遺傳變異體。誘導(dǎo)變異體可以通過各種技術(shù)得到,如通過輻射或暴露于誘變劑而產(chǎn)生隨機(jī)誘變,還可通過定點(diǎn)誘變法或其他已知分子生物學(xué)的技術(shù)。類似物還包括具有不同于天然L-氨基酸的殘基(如D-氨基酸)的類似物,以及具有非天然存在的或合成的氨基酸(如P、Y-氨基酸)的類似物。應(yīng)理解,本發(fā)明的多肽并不限于上述例舉的代表性的多肽。所述修飾(通常不改變一級(jí)結(jié)構(gòu))形式包括體內(nèi)或體外的多肽的化學(xué)衍生形式如乙?;螋然?。修飾還包括糖基化,如那些在多肽的合成和加工中或進(jìn)一步加工步驟中進(jìn)行糖基化修飾而產(chǎn)生的多肽。這種修飾可以通過將多肽暴露于進(jìn)行糖基化的酶(如哺乳動(dòng)物的糖基化酶或去糖基化酶)而完成。修飾形式還包括具有磷酸化氨基酸殘基(如磷酸酪氨酸,磷酸絲氨酸,磷酸蘇氨劇的序列。還包括被修飾從而提高了其蛋白水解性能或優(yōu)化了溶解性能的多肽。在本發(fā)明中,可選用本領(lǐng)域已知的各種載體,如市售的載體,包括質(zhì)粒,粘粒等。在生產(chǎn)本發(fā)明的丹參1-脫氧木酮糖-5-磷酸合成酶1多肽時(shí),可以將丹參1-脫氧木酮糖-5-磷酸合成酶1的核苷酸序列可操作地連于表達(dá)調(diào)控序列,從而形成丹參1_脫氧木酮糖-5-磷酸合成酶1表達(dá)載體。所述"可操作地連于"指這樣一種狀況,即線性DNA序列的某些部分能夠影響同一線性DNA序列其他部分的活性。例如,如果信號(hào)肽DNA作為前體表達(dá)并參與多肽的分泌,那么信號(hào)肽(分泌前導(dǎo)序列)DNA就是可操作地連于多肽DNA;如果啟動(dòng)子控制序列的轉(zhuǎn)錄,那么它是可操作地連于編碼序列;如果核糖體結(jié)合位點(diǎn)被置于能使其翻譯的位置時(shí),那么它是可操作地連于編碼序列。一般,"可操作地連于"意味著相鄰,而對(duì)于分泌前導(dǎo)序列則意味著在閱讀框中相鄰。本發(fā)明中宿主細(xì)胞為原核細(xì)胞或者真核細(xì)胞。常用的原核宿主細(xì)胞包括大腸桿菌;常用的真核宿主細(xì)胞包括酵母細(xì)胞、煙草細(xì)胞和其它植物細(xì)胞。本發(fā)明還可用Northern印跡法技術(shù)分析丹參1_脫氧木酮糖-5-磷酸合成酶1產(chǎn)物的表達(dá),即分析丹參l-脫氧木酮糖-5-磷酸合成酶1的RNA轉(zhuǎn)錄物在細(xì)胞中的存在和數(shù)量。此外,本發(fā)明中可用作探針的核酸分子通常具有丹參l-脫氧木酮糖-5-磷酸合成酶基因1核苷酸編碼序列的8-100個(gè)連續(xù)核苷酸,較佳地具有15-50個(gè)連續(xù)核苷酸。該探針可用于檢測樣品中是否存在編碼丹參l-脫氧木酮糖-5-磷酸合成酶基因1的核酸分子。本發(fā)明涉及檢測樣品中是否存在丹參1-脫氧木酮糖-5-磷酸合成酶基因1核苷酸序列的方法,它包括用上述的探針與樣品進(jìn)行雜交,然后檢測探針是否發(fā)生了結(jié)合。較佳地,該樣品是PCR擴(kuò)增后的產(chǎn)物,其中PCR擴(kuò)增引物對(duì)應(yīng)于丹參l-脫氧木酮糖-5-磷酸合成酶基因l核苷酸編碼序列,并可位于該編碼序列的兩側(cè)或中間。引物長度一般為15-50個(gè)核苷酸。此外,根據(jù)本發(fā)明的丹參l-脫氧木酮糖-5-磷酸合成酶基因l核苷酸序列和氨基酸序列,可以在核酸同源性或表達(dá)蛋白質(zhì)的同源性基礎(chǔ)上,篩選丹參卜脫氧木酮糖-5-磷酸合成酶基因1同源基因或同源蛋白。為了得到與丹參l-脫氧木酮糖-5-磷酸合成酶基因1相關(guān)的丹參cDNAs的點(diǎn)陣,可以用DNA探針篩選丹參cDNA文庫,這些探針是在低嚴(yán)謹(jǐn)條件下,用32P對(duì)丹參1-脫氧木酮糖-5-磷酸合成酶基因1的全部或部分做放射活性標(biāo)記而得的。最適合于篩選的cDNA文庫是來自丹參的文庫。構(gòu)建來自感興趣的細(xì)胞或者組織的cDNA文庫的方法是分子生物學(xué)領(lǐng)域眾所周知的。另外,許多這樣的cDNA文庫也可以購買到,例如購自Clontech,Stratagene,PaloAlto,Cal.。這種篩選方法可以識(shí)別與丹參l-脫氧木酮糖-5_磷酸合成酶基因1的基因家族的核苷酸序列。本發(fā)明的丹參l-脫氧木酮糖-5-磷酸合成酶基因1核苷酸全長序列或其片段通??梢杂肞CR擴(kuò)增法、重組法或人工合成的方法獲得。對(duì)于PCR擴(kuò)增法,可根據(jù)本發(fā)明所公開的有關(guān)核苷酸序列,尤其是開放閱讀框序列來設(shè)計(jì)引物,并用市售的cDNA庫或按本領(lǐng)域技術(shù)人員已知的常規(guī)方法所制備的cDNA庫作為模板,擴(kuò)增而得有關(guān)序列。當(dāng)序列較長時(shí),常常需要進(jìn)行兩次或多次PCR擴(kuò)增,然后再將各次擴(kuò)增出的片段按正確次序拼接在一起。一旦獲得了有關(guān)的序列,就可以用重組法來大批量地獲得有關(guān)序列。這通常是將其克隆入載體,再轉(zhuǎn)入細(xì)胞,然后通過常規(guī)方法從增殖后的宿主細(xì)胞中分離得到有關(guān)序列。此外,還可通過化學(xué)合成將突變引入本發(fā)明蛋白序列中。除了用重組法產(chǎn)生之外,本發(fā)明蛋白的片段還可用固相技術(shù),通過直接合成肽而加以生產(chǎn)(Stewart等人,(1969)Solid-PhasePeptideSynthesis,WHFreemanCo.,SanFrancisco;MerrifieldJ.(1963)J.AmChem.Soc85:2149-2154)。在體外合成蛋白質(zhì)可以用手工或自動(dòng)進(jìn)行。例如,可以用AppliedBiosystems的431A型肽合成儀(FosterCity,CA)來自動(dòng)合成肽。可以分別化學(xué)合成本發(fā)明蛋白的各片段,然后用化學(xué)方法加以連接以產(chǎn)生全長的分子。利用本發(fā)明的丹參1-脫氧木酮糖-5-磷酸合成酶1,通過各種常規(guī)篩選方法,可篩選出與丹參1-脫氧木酮糖-5-磷酸合成酶l發(fā)生相互作用的物質(zhì),或者受體、抑制劑或拮劑等。本發(fā)明提供的1-脫氧木酮糖-5-磷酸合成酶基因1是首次從丹參中克隆制備的,可以通過基因工程技術(shù)用來提高丹參等植物中丹參酮的含量。轉(zhuǎn)基因結(jié)果顯示,丹參1-脫氧木酮糖-5-磷酸合成酶基因1對(duì)促進(jìn)丹參酮含量的提高有明顯作用。具體實(shí)施方式下面結(jié)合具體實(shí)施例,進(jìn)一步闡述本發(fā)明。應(yīng)理解,這些實(shí)施例僅用于說明本發(fā)明而不用于限制本發(fā)明的范圍。此外應(yīng)理解,在閱讀了本發(fā)明講授的內(nèi)容之后,本領(lǐng)域技術(shù)人員可以對(duì)本發(fā)明作各種改動(dòng)或修改,這些等價(jià)形式同樣落于本申請(qǐng)所附權(quán)利要求書所限定的范圍。下列實(shí)施例中未注明具體條件的實(shí)驗(yàn)方法,通常按照常規(guī)條件,例如Sambrook等分子克隆實(shí)驗(yàn)室手冊(cè)(NewYork:ColdSpringHarborLaboratoryPress,1989)中所述的條件,或按照制造廠商所建議的條件。實(shí)施例1(丹參1-脫氧木酮糖-5-磷酸合成酶基因1的克隆)1.組織分離(isolation)丹參植株來源于河南,采取幼嫩根后立即置于液氮中冷凍保存。2.RNA的分離(RNAisolation)取部分組織用研缽研碎,加入盛有裂解液的1.5mLEP管,充分振蕩后,再移入玻璃勻漿器內(nèi)。勻漿后移至1.5mLEP管中,抽提總RNA(TRIzolReagents,GIBCOBRL,USA)。用甲醛變性膠電泳鑒定總RNA質(zhì)量,然后在分光光度計(jì)上測定RNA含量。3.基因的全長克隆(CloningofFull-lengthcDNA)根據(jù)金魚草,薄荷等DXS基因氨基酸保守序列,設(shè)計(jì)簡并引物,利用同源性基因克隆原理,采用Smart-RACE方法(Clonetech試劑盒)進(jìn)行cDNA全長克隆,分三個(gè)階段進(jìn)行(1)5'-RACEPCR(飄+R2)得到DXS1R2'(721bp),回收,連接到T-Easy載體上,用SP6或T7作為通用引物,采用終止物熒光標(biāo)記(Big-Dye,Perkin-Elmer,USA)的方法,在ABI377測序儀(Perkin-Elmer,USA)上進(jìn)行測序。測序結(jié)果用GCG軟件包(Wisconsingro叩,USA)中的BLAST和FASTA軟件搜索已有的數(shù)據(jù)庫(Genebank+EMBL),知其核酸序列及編碼蛋白與已知1-脫氧木酮糖-5-磷酸合成酶基因l(如穿心蓮l-脫氧木酮糖-5-磷酸合成酶基因1等)的同源性很高,故初步認(rèn)為它是一個(gè)1-脫氧木酮糖-5-磷酸合成酶基因1。(2)3'RACE根據(jù)5'RACE結(jié)果,設(shè)計(jì)正向特異引物F2,經(jīng)PCR(UPM+F2)得到DXS1F2,(1890bp)(過程同(1))。回收,連接到T-Easy載體上,用SP6或T7作為通用引物,采用終止物熒光標(biāo)記(Big-Dye,Perkin-Elmer,USA)的方法,在ABI377測序儀(Perkin-Elmer,USA)上進(jìn)行測序。(3)將5'RACE測序結(jié)果與3'RACE測序結(jié)果比序并進(jìn)行拼接,得到全長片段序列信息,并設(shè)計(jì)一對(duì)特異引物進(jìn)行PCR擴(kuò)增l-脫氧木酮糖-5-磷酸合成酶基因1編碼區(qū)(DXS1KF1+DXS1KR1)得到DXS1編碼區(qū)(2145bp)(過程同步驟(l))。BLAST的結(jié)果證明從丹參中新得到的基因確為一個(gè)l-脫氧木酮糖-5-磷酸合成酶基因1。通過組合使用上述3種方法,獲得了候選的丹參DXS1蛋白的全長編碼序列。在拼接得到全長(至少包含完整的開放讀框)的基礎(chǔ)上,進(jìn)一步設(shè)計(jì)引物DXS1F1:5'-GGTTACTGATCTGTCCTCTGTAA-3,(SEQIDNO.3)為正向引物,寡核苷酸DXS1R1:5'-AGACAAGCTGAAGCTAACACTAT-3'(SEQIDNO.4)為反向引物,以總RNA為模板,進(jìn)行RT-PCR擴(kuò)增,F(xiàn)l/R2的PCR條件為94°C5分鐘,隨之以94°C1分鐘、60°C1分鐘和72°C3分鐘進(jìn)行35個(gè)循環(huán),最后以72。C延伸10分鐘。電泳檢測PCR擴(kuò)增產(chǎn)物,獲得擴(kuò)增片段長度為2498bp。然后按常規(guī)方法以PCR擴(kuò)增產(chǎn)物進(jìn)行克隆、測序,獲得SEQIDNO.1所示的序列。實(shí)施例2(丹參1-脫氧木酮糖-5-磷酸合成酶基因1的序列信息與同源性分析)本發(fā)明新的丹參l-脫氧木酮糖-5-磷酸合成酶基因1全長cDNA的長度為2519bp,詳細(xì)序列見SEQIDNO.l,其中開放讀框位于294-2438位核苷酸。根據(jù)全長cDNA推導(dǎo)出l-脫氧木酮糖-5-磷酸合成酶基因1的氨基酸序列,共714個(gè)氨基酸殘基,分子量175.89KD,pi為4.91,詳細(xì)序列見SEQIDNO.2。將丹參l-脫氧木酮糖-5-磷酸合成酶基因1的全長cDNA序列及其編碼蛋白質(zhì)用BLAST程序在Non-redundantGenBank+EMBL+DDBJ+PDB禾口Non-redundantGenBankCDStranslations+PDB+SwissProt+Superdate+PIR數(shù)據(jù)庫中進(jìn)行核苷酸和蛋白質(zhì)同源性檢索,結(jié)果發(fā)現(xiàn)它與穿心蓮DXS基因l(GenBankAccessionNo.AY254390)具有81%的同源性(見表2);在氨基酸水平上,它與穿心蓮DXSl(GenBankAccessionNo.AAP14353)的第1-678位氨基酸殘基有88%的相同性和93%的相似性(見表3)。由上可見,丹參l-脫氧木酮糖-5-磷酸合成酶基因1與穿心蓮l-脫氧木酮糖-5-磷酸合成酶基因1無論從核酸還是蛋白水平上都存在較高的同源性。故可以認(rèn)為丹參1-脫氧木酮糖-5-磷酸合成酶基因1在提高資源植物中丹參酮的含量上也具有促進(jìn)作用。表2.本發(fā)明的丹參DXS1與穿心蓮(Andrographispaniculata)DXS1的核苷酸序列的同源比較(GAP)表368TCAGTGGCTACATGGTG-CAGATCTACCAT-TTCACCCCT-TCTGCAAGAACAGTCAGAT424TCAGTGGCTACATGG-GATAGATCT-GCATCCTCA-CCATACCTGCAAGAACAATCAGGTTAGGMAAGCTCTACAGGAATTTGTGCMCACTGTCTGMAGAGGGGAATACTTCTCACAMGGMMGGTCMGTGGAATTT-TGCATCATTGGCAGMAGAGGAGAATATTTCTCAGA-嵐GCCTCCAACTCCCCTTTTAGACACAATCMCTATCCAATTCACATGMAAACCTCTGAAA—CCTCCAACTCCTCTTTTGGACACTATCGATTACCCMTTCACATGMGAATCTCTQuerySbjctQuerySbjctQuerySbjctQuerySbjctQuerySbjct358425415485474544533602591CCACTMGGAACTGCM-CMCTCGCCGACGA-ACTGCGGTCCGACGTCATCTTCAACGTCCACMAGGMCTG-MGCAGCTTGCTGACGAGCCT-CGATCGGATGTTATCTTCAATGTGTCCMGACTGGGGGTCACCTGGGATCMGCCTTGGTGTGATTGAGCTAACCGTGGCTCTCTCCMGACAGGGGGCCATCTTGGTTCGAGTCTTGGTGTAATTGAGCTAACTGTGGCTAT414484473543532601590661650Query662TCATTACGTGTTCAATGCTCCTCMGATCGAATTCTGTGGGATGTTGGCCACCAGGCTTA721Sbjct651CCATTATGTGTTCMTGCTCCTCAGGATAGAATTCTTTGGGATGTTGGCCATCAGTCTTA710Query722TCCACACAAGATTC-TGACAGGMGM~GAGACAGGATGCCGAGTTTAAGACAGACCGGT779Sbjct711TCCACATAA-AATCTTAACTGGAAGAAGGA-ACATGATGCCAACCTTGAGACAGACAGAT768Query780GGCCTCTCTGG-TTTCACGMGCGGTCTGAGAGCGACTACGACTGCTTTGGCGCCGGTCA838Sbjct769GGGCTTTGTGGCTTT-ACCAAGAGGTCTGAGAGCAACTATGATTGCTTCGGCGCTGGTCA827Query839CAGTTCCACMCTATCTCTGCAGGACTAGGAATGGCTGTGGGGAGGGATCTGAAAGGAAG898Sbjct828CAGTTCGACMCGATTTCTGCAGGGTTAGGAATGGCTGTGGGAAGGGATCTTCAAGGGAG887Query899雄GGA-CMCGTCGTGGCTGTGATAGGCGACGGGGCTATGACAGCTGGTCAGGCCTATG957Sbjct888MAGMTC-ATGTCGTGGCCGTGATAGGGGATGGTGCTATGATAGCCGGCCAGGCTTATG946Query958AGGCMTGMCMTGCTGGCTACCTGGACTCGGACATGATTGTTATTCTCMTGACAATA1017947AAGCMTGMTMTGCTGGCTACCTGGATTCAGACATGATCGTGATTCTTMTGACAACA1006018AGCMGTTTCCTTGCCTACTGCCMTC-TGGATGG-GCCMCTGCTCCCGTGGGAGCCTT1075007MCAGGTTTCCTTACCCACGGCTM-CTTAGATGGCCCCATC-CCTCCAGTAGGAGCCTT1064076GAGCAGTGCTTTGAGTAGGTTGCAGTCGAACCGGCCTCTCAGAGAGCTAAGGGAAGTCGC1135065GAGTAGTGCTTTGAGCAGGCTGCAGTC磁TCGGCCACTCAGAGAACTAAGAGAAGTTGC1124136GAAGGGAGTCACCMGCAGATCGGAGGGCCTATGCACGAGCTT-GCTGCAMAGTCGATG1194125CAAGGGAGTTACCMGCAAATCGGAGGATCGATGCATGAG-TTAGCTGCAMAGTCGATG1183195AGTATGCTCGTGGGCTGATCAGTGGCTCTGGATCMCACTCTTTGAAGAGCTCGGGCTTT1254184MTATGCTCGCGGGCTGATCAGTGGTTCAGGATCMCACTGTTTGAGGAGCTAGGGCTTT1243255ACTACATCGGTCCAGTTGATGGTCACAATC-TTGATGACCTGACAGCGATTCACAGAGAG1313244ATTACATTGGTCCAGTTGATGGCCACAA-CATTGATGATCTGACTGCAATTCTT磁GAA1302314GTCAAGAGTACT嵐ACGACGGGTCCGGTGTTGATCCATGTTGTGACTGAGAAAGGCAGA1373303GTCAAGAGTACCAAGACAACAGGTCCAGTGTCGATCCATGTTGTAACCGAG磁GGCCGA1362374GGATATCCTTATGCAGAGAAAGCTGCAGATAAATACCATGGAGTGACCAAGTTCGATCCA1433363GGATATTCATACGCTGAAAAAGCTGCAGACAMTACCATGGTGTGGCMAGTTTGATCCA1422434GCAACGGGGMGCAGTTTAAATCGAGTGCTCCMCTCAGCCTTACACAACCTACTTTGCT1493423GCMCTGGAAAACAATTCAMTCGAGCACTCCGACTCAGGCTTACACAACCTACTTTGCA1482494GAGGCCCTGATTGCAGMGCTGAAGTAGACAAGGA-TATCGTAGCAATCCATGCAGCAAT1552483GAGGCGTTGATTGCAGAAGCAGAACMGACM-TATTATTGTAGCGATACATGCCGCMT1541553GGGAGGTGGG-A-CGGGTTTGAACCTCTTCCMCGCCGTTTCCCMCGAGGTGTTTCGAT1610542GGGTGG-GGGMCCGGG-TTAAACCTTTTTGATCGTCGTTTCCCAACCAGGTGTTTTGAT1599611GTTGGGATAGCAGAACAGCATGCTGTGACTTTTGCTGCAGGTTTGGCCTGTGAAGGGATC1670600GTTGGGATAGCAGAACAGCATGCTGTAACTTTTGCCGCAGGTTTGGCATGTGAAGGCCTC165912QuerySbjctQusrySbjctQuerySbjctQuerySbjctQuerySbjctQuerySbjctQuerySbjctQuerySbjctQusrySbjctQuerySbjctQuerySbjctQuerySbjctQuerySbjct1671MGCCCTTCTGTGCAATCTACTCATCCTTCTTGCMCGAGGCT-ACGACCAGGTAGTGCA17291660MACCCTTCTGTGCAATCTACTCGTCTTTCTTGCAAAGAG-CTTACGACCAGGTGGTGCA17181730CGACGTGGATTTGCAGAAGCTGCCGGTTAGGTTTGCTATGGACAGAGCCGGCTTGGT-GG17881719CGATGTTGACCTGCAGAAGCTCCCAGTCAGGTTCGCAATGGACAGAGCAGGTTTAGTCGG17781789GAGCGGATGGCCCGACACATTGTGGAGCTTTTGATGTTACAT-TCATGGCATGCCTTCCC18471779G-GCAGACGGACCTACACATTGTGGGGCATTCGACATTACTTAT-ATGGCTTGCCTTCCC18361848MCATGGTGGTGATGGCTCCTTCAGATGAGGCTGAATTGTTTMCATGGTTGCAACTGCT19071837MCATGGTGGTTATGGCTCCTGCAGACGAAGCTGMCTGTTTCACATGGTTGCCACTGCT18961908GCAGCTATAGACGACAGACCAAGCTGCTTCCGTTATCCMGAGGCAACGGTATAGGTGTGl恥71897GCTGCCATTGATGACAGACCGAGCTGTTTCAGATATCCCAGAGGCAACGGGATTGGCGTA19561968GAGTTGCCGCCCGGAAAC嵐GGCAAACCCCTCGAGATTGG-嵐GGGCCGTATACTAAT20261957GAGCTCCCACCTGGAMCAMGGCATACCCCTTGAGATTGGCMAGGGC-GAATACTTCT20152027TGMGGGGAGAGGGTGGCTCT-CTTGGGTTATGGATCAGCAGTTCAGAGCTGTTTGGCTG20852016CGAGGGGGAGAGAGTGGCTCTGCTCGGCT-ATGGMCAGCAGTTCAGAGCTGTATGACTG20742086CAGCTGC-CT—TGGTAG嵐CCCGCGGTTTACAGTTGACAGTAGCCGATGCTCGTTTCT21422075CAGCAGCACTAATGG-AGC—CCCATGGTTTACAGTTGACAGTGGCTGATGCACGCTTCT21312143GTATGCCATTGGATCATGCTCTTATTCGGAGCTTGGCCMA-TCACACGAGGTCTTGATC22012132GCAAGCCGTTGGACCMGGTCTTATCCGCAGGTTAGC-MACTCACATGAAGTCTTGATC21902202ACTGTGGAAGAAGGGTCAATTGGTGGTTTTGGATCTCATGTAGCTCACTTCATGGCCTTG22612191ACTGTCGAAGAAGGGGCTGTCGGTGGCTTTGCAGCTCACGTAGCTCAGTTCATGGCCCTC22502262GATGGCCTCCTTGATGGCAACCTAAAGTGGAGACCA-TTGGTTCTTCCTGATCGATACAT23202251GATGGGCTCCTTGACGGCAMTTAAAGTGGAGGCCACTTG-TTCTTCCTGACCGATACAT23092321CGACCATGGAGCCCCGGTGGATCMCTGATGGMGCAGGACTCACGCCTTCAC-ACATCG23792310CGACCATGGATCCCCGGCAGACCMTTGATGGMGCAGGCCTGACATCT-CACCATATCG23682380CGGCGACTGTCTTT-MTAnCTAGGAMAGCTAGGGAGGCTCTGGMATTATGTCATAG24382369CGGCCACTGT-TTTCAACATACTAGGGMAGCTAGAGAAGCCCTGCAGATTATGTCCTAG2427—AACAACAAACTC-TG磁TA-TAGTGTTAGCTTCA-G2491Sbjct2428GTTGCAAGMG-TGTACATATTTAAGAACATA-TGATGAA-TCCTAGCATGAGCCTCATG2484Query2492CTTGTCT3333a3a3犯38833a333aa2519Sbjct2485AT-GACAAAAAAMAMAAMMAAAAA2511其中Query表示丹參DXSl的核酸序列;Subject表示穿心蓮DXSl的核酸序列(GenBankAccessionNo.AY254390)。結(jié)果在2519個(gè)核苷酸的比對(duì)中兩者有81%的相似性。表3.本發(fā)明的丹參的l-脫氧木酮糖-5-磷酸合成酶基因1與穿心蓮的l-脫氧木酮糖-5-磷酸合成酶基因1氨基酸序列的同源比較(FASTA)表Query37PFCKNSQIRKSSTGICATLSERGEYFSQKPPTPLLDTINYPIHMKNLSTKELQQLADELR96P++++A+L+ERGEYFS+KPPTPLLDTI+YPI腿NLSTKEL+QLADERSbjct14PYLQEQSGKEKV顯FASLAERGEYFSEKPPTPLLDTIDYPI腿NLSTKE國LADEPR73Query97SDVIFNVSKTGGHLGSSLGVIELTVALHYVF匿QDRILWDVGHQAYPHKILTGR證MP156SDVIFNVSKTGGHLGSSLGVIELTVA+HYVFNAPQDRILWDVGHQ+YPHKILTGRR+MPSbjct74SDVIFNVSKTGGHLGSSLGVIELTVAIHYVFNAPQDRIL麗GHQSYPHKILTG,MMP133Query157SLRQTGGLSGFTKRSESDYDCFGAGHSSTTISAGLGMAVGRDLKGRKDNVVAVIGDGAMT216+LRQTGLGFTKRSES+YDCFGAGHSSTTISAGLGMAVGRDL+GRK++VVAVIGDGAMSbjct134TLRQTDGLCGFTKRSESNYDCFGAGHSSTTISAGLGMAVGRDLQGRKNHVVAVIGDGAMI193Query217AGQAYE腦NAGYLDSDMIVILNDN歸SLPTANLDGPTAPVGALSSALSRLQSNRPLRE276AGQAYEAMNNAGYLDSDMIVIL,KQVSLPTANLDGPPVGALSSALSRLQSNRPLRESbjct194AGQAYE鵬NAGYLDSDMIVI腦卿VSLPTANLDGPIPPVGALSSALSRLQSNRPLRE253Query277LREVAKGVTKQIGGPMHELAAKVDEYARGLISGSGSTLFEELGLYYIGPVDGHNLDDLTA336LREVAKGVTKQIGGMHELAAKVDEYARGLISGSGSTLFEELGLYYIGPVDGHN+DDLTASbjct254LREVAKGVTKQIGGSMHELMKVDEYARGLISGSGSTLFEELGLYYIGPVDGHNIDDLTA313<formula>formulaseeoriginaldocumentpage15</formula>其中:Query表示丹參DXS1的氨基酸序列;Subject表示穿心蓮DXS1的氨基酸序列(GenBankAccessionNo.MP14353);相同的氨基酸在兩個(gè)序列之間用氨基酸單字符標(biāo)出。結(jié)果在678個(gè)氨基酸的比對(duì)中,兩者分別有88%的相同性和93%的相似性。實(shí)施例3(丹參l-脫氧木酮糖-5-磷酸合成酶1或多肽在大腸桿菌中進(jìn)行原核表達(dá)及提純)在該實(shí)施例中,將全長的丹參l-脫氧木酮糖-5-磷酸合成酶基因1編碼序列或片段構(gòu)建入商品化的蛋白質(zhì)融合表達(dá)載體之中,以表達(dá)和提純重組蛋白。1、原核表達(dá)載體的構(gòu)建以及轉(zhuǎn)化大腸桿菌根據(jù)丹參DXS1的核苷酸序列,設(shè)計(jì)擴(kuò)增出蛋白編碼區(qū)的引物,并在正反引物上分別引入限制性內(nèi)切酶位點(diǎn)(這根據(jù)選用的pET32a(+)載體而定),以便構(gòu)建表達(dá)載體。以實(shí)施例1中獲得的擴(kuò)增產(chǎn)物為模板,經(jīng)PCR擴(kuò)增后,將丹參DXS基因1在保證閱讀框正確的前提下克隆至pET32a(+)載體(Novagen)。鑒定好的表達(dá)載體利用CaCl2方法轉(zhuǎn)入大腸桿菌BL21,篩選鑒定得到含有pET32a(+)-DXS1表達(dá)載體的工程菌BL21-pET32a(+)-DXSl。2、表達(dá)Trx-DXS1重組蛋白的工程菌的分離鑒定挑取單菌落的BL21-PET32a(+)-DXS1工程菌于3mL含100嗎/mL氨芐青霉素的LB培養(yǎng)基中振搖培養(yǎng)過夜,按l:100的濃度吸取培養(yǎng)液于新的LB培養(yǎng)基(含100pg/mL氨芐青霉素)中培養(yǎng)約3小時(shí),至0De。。達(dá)0.5后,加入IPTG至終濃度lmmol/L繼續(xù)于37。C分別培養(yǎng)0,1,2,3小時(shí)。取培養(yǎng)時(shí)間不同的lmL菌液離心,在細(xì)菌沉淀物中加入裂解液(2XSDS上樣緩沖液50nL,蒸餾水45pL,二巰基乙醇5pL),混懸細(xì)菌沉淀,沸水浴中煮5分鐘,10000rpm離心1分鐘,上清加入12%SDS-PAGE膠中電泳。染色后觀察預(yù)期分子量大小的蛋白量隨IPTG誘導(dǎo)時(shí)間增加而增加的菌株即為表達(dá)Trx-DXSl融合蛋白的工程菌。3、SmDXSl蛋白的提取純化及酶活性測定按上述方法誘導(dǎo)表達(dá)Trx-DXS1融合表達(dá)蛋白的工程菌BL21-pET32a(+)-DXS1,經(jīng)離心沉淀收集菌體,并根據(jù)廠家(Novagen)的說明書以BugBuster試劑和Benzonase核酸酶來純化包涵體。包涵體可用溶解緩沖液(50mMCAPS,pHll.O,0.3%N-lauroylsarcosine)來溶解,再用透析緩沖液(200mMTris-HCl,pH8.5)來透析。然后用組氨酸結(jié)合(His*Bind)樹脂進(jìn)行親和層析,并經(jīng)洗脫緩沖液(1Mimidazole,500mMNaCl,20mMTris-HC1pH7.9)洗脫來收集Trx-SmDXSl融合蛋白。融合蛋白經(jīng)腸激酶20'C酶切16小時(shí)后即可分離獲的SmDXSl的表達(dá)蛋白。得到的表達(dá)蛋白分子量175.89KD,pl為4.91。按Ge等(PlantScience,2005,168:487-491)的方法對(duì)表達(dá)純化的丹參l-脫氧木酮糖-5-磷酸合成酶l進(jìn)行酶活力的測定,結(jié)果表明表達(dá)的蛋白的確具有以丙酮酸和3-磷酸甘油醛為前體,在焦磷酸硫胺素存在的情況下,催化生成5-磷酸脫氧木酮糖的酶活性。實(shí)施例4(丹參l-脫氧木酮糖-5-磷酸合成酶1或多肽在丹參中進(jìn)行真核細(xì)胞表達(dá)及轉(zhuǎn)基因發(fā)根中丹參酮含量測定)含目的基因(丹參l-脫氧木酮糖-5-磷酸合成酶基因1)的表達(dá)載體的構(gòu)建,根據(jù)丹參l-脫氧木酮糖-5-磷酸合成誨基因1的全長序列(SEQIDNO.l),設(shè)計(jì)擴(kuò)增出完整編碼閱讀框的引物,并在上游和下游引物上分別引入限制性內(nèi)切酶位點(diǎn)(這可視選用的載體而定),以便構(gòu)建表達(dá)載體。以實(shí)施例1中獲得的擴(kuò)增產(chǎn)物為模板,經(jīng)PCR擴(kuò)增后,將丹參l-脫氧木酮糖-5-磷酸合成酶基因1的cDNA克隆到雙元表達(dá)載體(如pCAMBIA1304),在保證閱讀框架正確的前提下鑒定好的表達(dá)載體,再將其轉(zhuǎn)入農(nóng)桿菌中,遺傳轉(zhuǎn)化資源植物丹參1)發(fā)根農(nóng)桿菌A4。使用前自冰箱取出,傳代2次,傳代用固體培養(yǎng)基為YEB培養(yǎng)基。菌種在使用前接種于YEB液體培養(yǎng)基中,28'C培養(yǎng)過夜。2)取生長8周左右的丹參無菌嫩葉片。3)經(jīng)過夜培養(yǎng)的菌液,用轉(zhuǎn)化液稀釋為100個(gè)細(xì)菌/mL。取無菌丹參葉片,用無菌的解剖刀劃以"+"字形傷口,放入上述轉(zhuǎn)化中,60rpm/min振蕩培養(yǎng)8h取出,用無菌水沖洗3次,放入含250-500mg/L卡那霉素和不同濃度6-BA(0.5mg/L-3mg/L)的B5培養(yǎng)基中,每2周轉(zhuǎn)移到新鮮培養(yǎng)基中1次,待長出毛狀根后分離毛狀根,轉(zhuǎn)移至含250-500mg/L卡那霉素?zé)o激素的B5培養(yǎng)基中培養(yǎng),轉(zhuǎn)移4-5次直至無細(xì)菌為止,然后再轉(zhuǎn)移至不含卡那霉素的無激素B5培養(yǎng)基中培養(yǎng)。4)把在固體培養(yǎng)基中的毛狀根的繼代培養(yǎng)物,接種于裝有100mL無激素B5,培養(yǎng)基的500mL三角瓶中,培養(yǎng)溫度、光照、轉(zhuǎn)速等培養(yǎng)條件與愈傷組織液體懸浮培養(yǎng)條件相同,培養(yǎng)25天,將毛狀根從培養(yǎng)基上取出放入冷凍干燥機(jī)中進(jìn)行干燥,然后稱重,貯存于-70'C備用。5)含丹參l-脫氧木酮糖-5-磷酸合成酶基因1的轉(zhuǎn)基因丹參發(fā)根的丹參酮含量測定按Ge等(PlantScience,2005)的方法對(duì)表達(dá)丹參l-脫氧木酮糖-5-磷酸合成酶基因l的轉(zhuǎn)基因發(fā)根進(jìn)行丹參酮含量測定。結(jié)果表明,在表達(dá)丹參1-脫氧木酮糖-5-磷酸合成酶基因l的轉(zhuǎn)基因發(fā)根中丹參酮含量比非轉(zhuǎn)基因?qū)φ战M提高1.7倍(P〈0.05),有顯著提高。因此轉(zhuǎn)基因結(jié)果證明,丹參l-脫氧木酮糖-5-磷酸合成酶基因1對(duì)促進(jìn)丹參酮含量的提高有明顯作用,可應(yīng)用于丹參的品質(zhì)改良。核苷酸序列表<110>上海師范大學(xué)<120>丹參l-脫氧木酮糖-5-磷酸合成酶基因1及其編碼的蛋白質(zhì)和應(yīng)用<160>4<170>Patentlnversion3.3<210>1<211>2519<212>DNA<213>丹參(Sa/K/a邁i7〃arr/r/za)<220><221>CDS<222>(294)..(2438)<400>1ggttactgatctgtcctctgUaatgcgccacccataaagcaccaacattttgttccttaacaatccctgcatttaatccattttcacacacacacacacagtggctagtgttcttgagaacctcaagagctggtgcatgaacagaUgtaaagttggtacaatctttgattgtttggagtgaaattttgagctgtctatgetttatgcccatttgcattttctgggagttUAlaLeuCysProPheAlaPheSerGlySerLeu510caaaagcacaccaatttctgctctcagtggctaGinLysHisThrAsnPheCysSerGinTrpLeu2025ccatttcaccccttctgcaagaacagtcagattccatatgcacaaaccaatcc60aagccctcatcattcccatc120gaagttcaaaaacagagccc180tcttttttctgggaaatctg240acacacatacaagatg296Met1gtagetgcagatget344ValAlaAlaAspAla15catggtgcagatcta392HisGlyAlaAspLeu30aggaaaagetctaca440ProPheHisProPheCysLysAsnSerGinlieArgLysSerSerThr354045ggaatttgtgcaacactgtctgaaagaggggaatacttcteacaaaag488GlylieCysAlaThrLeuSerGluArgGlyGluTyrPheSerGinLys50556065cctccaactccccttttagacacaateaactatccaattcacatgaaa536ProProThrProLeuLeuAspThrlieAsnTyrProlieHisMetLys707580aacetctecactaaggaactgcaacaaetcgccgacgaactgeggtec584AsnLeuSerThrLysGluLeuGinGinLeuAlaAspGluLeuArgSer859095gacgtcatettcaacgtgtecaagactgggggtcacctgggateaage632AspValliePheAsnValSerLysThrGlyGlyHisLeuGlySerSer100105110cttggtgtgattgagcUaccgtggetcttcattacgtgttcaatget680LeuGlyVallieGluLeuThrValAlaLeuHisTyrValPheAsnAla115120125cctcaagatcgaattctgtgggatgttggccaccaggettatccacac728ProGinAspArglieLeuTrpAspValGlyHisGinAlaTyrProHis130135140145aagattctgacaggaagaagagacaggatgccgagtttaagacagacc776LyslieLeuThrGlyArgArgAspArgMetProSerLeuArgGinThr150155160ggtggcetctctggtttcacgaageggtctgagagegactacgactgc824GlyGlyLeuSerGlyPheThrLysArgSerGluSerAspTyrAspCys165170175tttggcgccggtcacagttecacaactatetctgcaggaetaggaatg872PheGlyAlaGlyHisSerSerThrThrlieSerAlaGlyLeuGlyMet180185190getgtggggagggatctgaaaggaagaaaggacaacgtcgtggetgtg920AlaValGlyArgAspLeuLysGlyArgLysAspAsnValValAlaVal195200205aUggcgacggggetatgacagetggtcaggcctatgaggcaatgaac968lieGlyAspGlyAlaMetThrAlaGlyGinAlaTyrGluAlaMetAsn210215220225aatgetggctacctggacteggacatgattgttattetcaatgacaat1016AsnAlaGlyTyrLeuAspSerAspMetlieVallieLeuAsnAspAsn230235240aagcaagtttecttgcctactgccaatctggatgggccaactgetccc1064LysGinValSerLeuProThrAlaAsnLeuAspGlyProThrAlaPro245250255gtgggagccttgageagtgetttgagtaggttgcagtegaaceggcct1112ValGlyAlaLeuSerSerAlaLeuSerArgLeuGinSerAsnArgPro260265270etcagagagetaagggaagtcgcgaagggagtcaccaagcagategga1160LeuArgGluLeuArgGluValAlaLysGlyValThrLysGinlieGly275280285gggcctatgcacgagcttgetgcaaaagtcgatgagtatgetcgtggg1208GlyProMetHisGluLeuAlaAlaLysValAspGluTyrAlaArgGly290295300305ctgateagtggctctggateaacaetctttgaagagetcgggctttac1256LeulieSerGlySerGlySerThrLeuPheGluGluLeuGlyLeuTyr310315320tacateggtccagttgatggtcacaatcttgatgacctgacagcgatt1304TyrlieGlyProValAspGlyHisAsnLeuAspAspLeuThrAlalie325330335cacagagaggtcaagagtactaaaacgacgggtccggtgttgatecat1352HisArgGluValLysSerThrLysThrThrGlyProValLeulieHis340345350gttgtgactgagaaaggcagaggatatccttatgcagagaaagetgca1400ValValThrGluLysGlyArgGlyTyrProTyrAlaGluLysAlaAla<table>tableseeoriginaldocumentpage21</column></row><table>515520525gaattgtttaacatggttgcaactgetgcagetaUgacgacagacca1928GluLeuPheAsnMetValAlaThrAlaAlaAlalieAspAspArgPro530535540545agetgcttccgttatccaagaggcaacggtataggtgtggagttgccg1976SerCysPheArgTyrProArgGlyAsnGlylieGlyValGluLeuPro550555560cccggaaacaaaggcaaacccetcgagattggaaagggccgtataeta2024ProGlyAsnLysGlyLysProLeuGlulieGlyLysGlyArglieLeu565570575attgaaggggagagggtggetetcttgggttatggateagcagttcag2072lieGluGlyGluArgValAlaLeuLeuGlyTyrGlySerAlaValGin580585590agetgtttggetgcagetgccttggtagaaacccgcggttUcagttg2120SerCysLeuAlaAlaAlaAlaLeuValGluThrArgGlyLeuGluLeu595600605acagtagccgatgetcgtttctgtatgccattggatcatgetcttatt2168ThrValAlaAspAlaArgPheCysMetProLeuAspHisAlaLeulie610615620625eggagettggccaaateacacgaggtcttgateactgtggaagaaggg2216ArgSerLeuAlaLysSerHisGluValLeulieThrValGluGluGly630635640teaattggtggttttggatctcatgtagetcacttcatggccttggat2264SerlieGlyGlyPheGlySerHisValAlaHisPheMetAlaLeuAsp645650655ggcetccttgatggcaacetaaagtggagaccattggttcttcctgat2312GlyLeuLeuAspGlyAsnLeuLysTrpArgProLeuValLeuProAsp660665670cgatacategaccatggagccccggtggatcaactgatggaagcagga2360ArgTyrlieAspHisGlyAlaProValAspGinLeuMetGluAlaGly675680685etcacgcctteacacategcggcgactgtctttaatattetaggaaaa2408LeuThrProSerHislieAlaAlaThrValPheAsnlieLeuGlyLys690695700705getagggaggetctggaaattatgteatagatcgaagagctgtacaaaaa2458AlaArgGluAlaLeuGlulieMetSer710acaacaaactctgaaatatagtgttagcttcagcttgtctaaaaaaaaaaaaaaaaaaaa2518a2519<210>2<211>714<212>PRT<213>丹參(5"a/邁i'"/orr力/忍)<400>2MetAlaLeuCysProPhe15AlaGinLysHisThrAsn20LeuProPheHisProPhe35ThrGlylieCysAlaThr50LysProProThrProLeu6570LysAsnLeuSerThrLys85SerAspValliePheAsn23AlaPheSerGlySerLeuValAlaAlaAsp1015PheCysSerGinTrpLeuHisGlyAlaAsp2530CysLysAsnSerGinlieArgLysSerSer4045LeuSerGluArgGlyGluTyrPheSerGin5560LeuAspThrlieAsnTyrProlieHisMet7580GluLeuGinGinLeuAlaAspGluLeuArg9095ValSerLysThrGlyGlyHisLeuGlySer100SerLeuGlyVallieGluLeu115GinAspArgGlylieLeu135GlyArg150GlyPhe105ThrValAlaLeuHis120TrpAspValGlyHis140AlaPro130HisLyslieLeuThrGlyArgArgAspArgMetProSerLeu145ThrGly110TyrValPheAsn125GinAlaTyrProMet155ThrLysArgSerGluSerAspLeuSerGlyPheThrLysArg165170CysPheGlyAlaGlyHisSerSerThrThrlieSerAla180185GlyArgAspLeuLysGlyArgLysAspMetAlaVal195GlyAspGlyAlaVallie210AsnAsnAlaGlyTyrLeuAspSerAspMet225AsnLysGinValMet215AspLys200ThrAlaGlyGinAlaTyrGluAlaMetAsn205TyrArgGin160TyrAsp175GlyLeuGly190ValValAlaSer245ProValGlyAlaLeuSerSerAlaLeu230LeuProThrAlaAsnLeuAspGlyProlie235LeuAla220VallieLeuAsnAla260ProLeuArgGluLeuArgGluValAlaLysGlyValArg275ProMetHisGluLeu265AlaAsn250SerArgLeuGinThr255AsnAsp240AlaArgSer270LysGinlieValAlaLysGlyValThr280285AlaAlaLysValAspGluTyrAlaArgAsp300GluGluLeuGlyGlyGlyProMetHisGluLeu290295GlyLeulieSerGlySerGlySerThrLeuPhe305310315TyrTyrlieGlyProValAspGlyHisAsnLeuAspAspLeuThr325330335lieHisArgGluValLysSerThrLysThrThrGlyProValLeuGlu340Lys345Val350Leu320AlalieHisValValThrGluLysGly355LysTyrHisGlyAlaAsp370GinPhe385GluAlaArgGlyTyrProTyrAlaGluLysAla360365ValThrLysPheAspProAlaThrGlyLys375380LysSerSerAlaProThrGinProTyrThrThr395LysAsplieAla390GluAlaLeulieAla405HisAlaAlaMetGlyGlyGly420PheProThrArgCysPheAspGluValAsp410ThrGlyLeuAsnLeuPhe425GlylieAlaGluGin445TyrPheAla楊ValAlalie415GinArgArg430HisAlaValThrArgCysPheAspVal435440AlaAlaGlyLeuAlaCysGluGlylieLysProPheCysAlaThrPheAlaAlaGlyLeuAla450455lieTyrSerSerPheLeuGinArgGlyTyr465470ValAspLeuGinLysLeuProValLys485LeuValGlyAlaAspGlyProThr500CysLeuProAsnLys460AspGinValVal475AlaMetAspArgPheMetAla515LeuPheAsnMetArgPhe490HisCysGlyAlaPheAsp505510ValValMetAlaProSerAspGluHisAsp480AlaGly495ValThrAlaVal535ProMetValValMetAlaPro520525AlaThrAlaAlaAlalieAspAspArgGlu530SerCysPheArgTyrProArgGlyAsnGlylieGlyValProSerCysPheArgTyr545550ProProGlyAsnLysGlyLysProAla540lieGly555lieGlyLysGlyLeuGlu570LeuLeuGlyTyrGlySer585590GinSerCysLeuAlaAlaAlaAlaLeuValGluThrArgGlyLeuGinLys565LeulieGluGlyGluArgValAlaLeuLeuGlyTyrGly580LeuGluLeu560Arglie575AlaVal595600605LeuThrValAlaAspAlaArgPheCysMetProLeuAspHisAlaLeu610615620lieArgSerLeuAlaLysSerHisGluValLeulieThrValGluGlu625630635640GlySerlieGlyGlyPheGlySerHisValAlaHisPheMetAlaLeu645650655AspGlyLeuLeuAspGlyAsnLeuLysTrpArgProLeuValLeuPro660665670AspArgTyrlieAspHisGlyAlaProValAspGluLeuMetGluAla675680685GlyLeuThrProSerHislieAlaAlaThrValPheAsnlieLeuGly690695700LysAlaArgGluAlaLeuGlulieMetSer705710<210>3<211>23<212>■<213>丹參(&/「/a邁/7〃orr力/za)<400>3GGTTACTGATCTGTCCTCTGTAA<210>4<211>23<212>DNA<213>丹參(5"a/Wa邁//〃07"7"力/幼)<400>4AGACAAGCTGAAGCTAACACTAT2權(quán)利要求1.一種丹參1-脫氧木酮糖-5-磷酸合成酶基因1,其特征在于,所述基因是以下核苷酸序列之一(1)具有SEQIDNo.1所示的核苷酸序列;(2)SEQIDNo.1所示的核苷酸序列添加、取代、插入或缺失一個(gè)或多個(gè)核苷酸的同源序列或者其等位基因及其衍生的核苷酸序列。2.權(quán)利要求l所述的丹參l-脫氧木酮糖-5-磷酸合成酶基因l編碼的蛋白質(zhì),其特征在于,所述蛋白質(zhì)具有以下氨基酸序列之一(1)具有SEQIDNo.2所示的氨基酸序列;(2)SEQIDNo.2添加、取代、插入或缺失一個(gè)或多個(gè)氨基酸的同源序列。3.—種重組載體,其特征在于,含有權(quán)利要求1所述的丹參1-脫氧木酮糖-5-磷酸合成酶基因1全序列或部分片段。4.一種宿主細(xì)胞,其特征在于,含有1所述的丹參l-脫氧木酮糖-5-磷酸合成酶基因1全序列或部分片段5.根據(jù)權(quán)利要求4所述的宿主細(xì)胞,其特征在于,所述宿主細(xì)胞為大腸桿菌細(xì)胞、農(nóng)桿菌細(xì)胞、酵母細(xì)胞、煙草細(xì)胞、丹參發(fā)根細(xì)胞或丹參細(xì)胞。6.丹參1-脫氧木酮糖-5-磷酸合成酶基因1應(yīng)用于制備轉(zhuǎn)基因丹參植株。7.丹參l-脫氧木酮糖-5-磷酸合成酶基因1應(yīng)用于制備轉(zhuǎn)基因丹參發(fā)根系。全文摘要本發(fā)明公開了一種丹參1-脫氧木酮糖-5-磷酸合成酶基因1及其編碼的蛋白質(zhì)與用途,填補(bǔ)了從我國傳統(tǒng)名貴中藥材丹參中分離克隆出1-脫氧木酮糖-5-磷酸合成酶基因1的空白。本發(fā)明所提供的1-脫氧木酮糖-5-磷酸合成酶基因1具有SEQIDNo.1所示的核苷酸序列或者添加、取代、插入或缺失一個(gè)或多個(gè)核苷酸的同源序列或其等位基因及其衍生的核苷酸序列。所述基因編碼的蛋白質(zhì)具有SEQIDNo.2所示的氨基酸序列或者添加、取代、插入或缺失一個(gè)或多個(gè)氨基酸的同源序列。本發(fā)明提供的1-脫氧木酮糖-5-磷酸合成酶基因1對(duì)于通過基因過量表達(dá)技術(shù)來提高丹參中丹參酮的含量具有顯著作用,可用于丹參藥材的品質(zhì)改良,具有很好的應(yīng)用前景。文檔編號(hào)C12N1/19GK101250541SQ200810035718公開日2008年8月27日申請(qǐng)日期2008年4月8日優(yōu)先權(quán)日2008年4月8日發(fā)明者周根余,開國銀,林張,敬王,董彥君申請(qǐng)人:上海師范大學(xué)