專利名稱:海芋凝集素蛋白基因及其應(yīng)用的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及植物凝集素蛋白基因的克隆及其應(yīng)用,特別是涉及海芋凝集素蛋白基因的cDNA序列及其編碼的蛋白質(zhì)序列。本發(fā)明進一步涉及海芋凝集素基因在植物抗蟲基因工程的應(yīng)用。
背景技術(shù):
植物凝集素是指含有至少一個非催化結(jié)構(gòu)域的并能可逆結(jié)合到特異單糖或寡糖的植物蛋白。
植物凝集素沒有共同的結(jié)構(gòu)特性。多數(shù)凝集素含共價結(jié)合的糖分子,屬糖蛋白。凝集素分子中糖類的組成與其它糖蛋白相似,主要是甘露糖、N-乙酰氨基葡萄糖、半乳糖、巖藻糖、唾液酸,少量凝集素含有木糖、阿拉伯糖。有些凝集素不含共價結(jié)合的糖。多數(shù)凝集素分子的蛋白質(zhì)部分含有較高的天冬氨酸、絲氨酸和蘇氨酸,占總氨基酸含量的30%,而含硫氨基酸少或甚至完全沒有。凝集素分子量相差很大,從幾萬至數(shù)十萬。很多凝集素有聚集傾向,受溶液pH、溫度等的影響。
植物凝集素是一類具高度特異性糖類結(jié)合活性的蛋白,這是它們區(qū)別所有其它植物蛋白的標志。其糖結(jié)合特異性性有以下幾個特點1,凝集素可以特異結(jié)合的糖類的范圍是非常大的。2,不同結(jié)構(gòu)的凝集素可能識別相同的糖類。植物凝集素的糖結(jié)合特異性主要由結(jié)合位點的三維結(jié)構(gòu)決定。3,大多數(shù)凝集素對寡糖具有更高的親和力。4,多數(shù)凝集素的特異性通常不是針對植物細胞的糖分子,而常常是微生物或害蟲的內(nèi)表面或外表面的聚糖。5,具有較好的穩(wěn)定性。特別是那些參與植物抗性機制的凝集素。它們大多數(shù)不會被動物或昆蟲胃腸的蛋白酶所降解,在很大的pH范圍內(nèi)穩(wěn)定,熱穩(wěn)定性強。
植物凝集素的生理功能主要有1.防御病原體入侵、2.在共生固氮中的作用、3.在細胞粘著中的作用、4.介導(dǎo)胞飲作用、5.在病原菌感染宿主巨噬細胞吞噬中的作用、6.在種子成熟和萌發(fā)過程中發(fā)揮作用、7.抗蟲性。
植物凝集素分布廣泛,高等植物中約有14%含有植物凝集素,在蝶形花科中比例高達43%,禾本科中比例達12%,目前已從豆科、茄科、大戟科、禾本科、百合科、石蒜科等植物中共發(fā)現(xiàn)1000多種植物凝集素,其中豆科植物凝集素達600多種,其種子內(nèi)的植物凝集素含量最高,達種子蛋白質(zhì)總含量的10%左右。
從進化與結(jié)構(gòu)相關(guān)性分類,植物凝集素大致可以分成7個不同的家族1.豆科凝集素;2.單子葉植物甘露糖結(jié)合凝集素,主要存在于石蒜科、天南星科、蘭科、百合科、鳳梨科這五個科中;3.包含Hevin結(jié)構(gòu)域的殼多糖結(jié)合蛋白;4.2型核糖體失活蛋白;5.葫蘆科韌皮部凝集素;6木菠蘿素家族;7莧科凝集素。
海芋凝集素經(jīng)初步實驗結(jié)果表明,對各類蚜蟲、菜粉蝶、菜青蟲等有一定的胃毒作用,其中對豆蚜效果比較好。另外還對豆蚜的生長發(fā)育具有抑制作用和影響生殖作用,并抑制豆蚜蜜露分泌行為。其作用機理可能是海芋凝集素被昆蟲取食后,在消化道內(nèi)與消化液蛋白酶等結(jié)合(蛋白質(zhì)大多含有糖鏈,故凝集素能與其結(jié)合),抑制后者的酶活力,使其不能有效地分解蛋白質(zhì),使昆蟲營養(yǎng)來源受阻,最終引起昆蟲死亡。
植物基因工程運用最新的分子生物學研究進展,和先進的基因工程技術(shù)將相關(guān)的基因,如抗蟲、抗病、抗旱、耐鹽堿等的基因,轉(zhuǎn)導(dǎo)入植物體內(nèi),并使之得以表達。目前成功地將雪花蓮凝集素GNA(Galanthus Nivalisagglutinin)基因轉(zhuǎn)導(dǎo)到煙草、馬鈴薯、水稻、棉花和番茄上,取得了顯著的社會經(jīng)濟效益。
關(guān)于植物凝集素基因的克隆,通過NCBI中的基因數(shù)據(jù)庫(Genbank),可以搜索到388條有關(guān)植物凝集素的基因序列。
海芋中僅克隆出它的蛋白酶抑制劑基因,在本發(fā)明申請之前還沒有海芋凝集素蛋白基因克隆的任何報道。
本發(fā)明目的是從海芋中克隆出凝集素蛋白基因,為海芋凝集素運用到轉(zhuǎn)基因抗蟲作物上,工廠化生產(chǎn),及醫(yī)學研究和相關(guān)運用上提供分子基礎(chǔ)和條件。
發(fā)明內(nèi)容
本發(fā)明提供的海芋凝集素蛋白基因是從海芋組織(植株)中以RACE PCR方法分離得到的,其特征為(1)具有序列表中序列1的核苷酸(cDNA)序列,其中第1~63位堿基為含有啟動子調(diào)控元件和5’端非凝集素翻譯區(qū)的序列,第64~873位堿基為開放讀碼框(ORF),第874~1124位堿基為3’端非凝集素翻譯區(qū)的序列。
(2)編碼序列表中序列2所示的氨基酸多肽序列,該序列由270個氨基酸殘基組成,具有前后二個甘露糖特異結(jié)合的三維功能結(jié)構(gòu)域,一個結(jié)構(gòu)域由Gln(谷氨酰胺Q),Asp(天冬氨酸D),Asn(天冬酰胺N),Val(纈氨酸V),Tyr(酪氨酸Y)五個氨基酸構(gòu)成的。其中構(gòu)成前一個結(jié)構(gòu)域的五個AA的位置分別為Gln51、Asp53、Asn55、Val57、Tyr59,后一個的為Gln170、Asp172、Asn174、Val176、Tyr178。海芋凝集素的生物學特性主要表現(xiàn)為可逆地特異結(jié)合甘露糖,從而使昆蟲產(chǎn)生厭食反應(yīng)導(dǎo)致最終死亡。
(3)具有系列表中序列1的核苷酸序列(cDNA sequence);或與序列1的第64~873位堿基序列中連續(xù)100個堿基以上的區(qū)域有95%以上的同源性,具有編碼與序列2同等的功能蛋白質(zhì)的核苷酸序列。
(4)編碼海芋凝集素前體蛋白的氨基酸多肽序列,該多肽具有序列表中序列2所示的序列;或編碼具有同等功能的由序列2衍生的多肽序列,或其保守性變異多肽,或其活性片段。
據(jù)本發(fā)明提供的海芋凝集素蛋白基因序列信息,序列1,序列2,本領(lǐng)域技術(shù)人員可以通過以下方法輕易地獲得與海芋凝集素蛋白AML等同的基因。
①用AML基因片段為探針篩選海芋的基組文庫獲得;②根據(jù)AML基因序列信息設(shè)計寡核苷酸引物(含簡并性引物),用PCR擴增方法從海芋的基因組獲得;③在AML基因序列的基礎(chǔ)上用基因工程方法改造獲得;④用化學合成的方法獲得。
本發(fā)明所述的術(shù)語AML等同基因,是定義為與AML基因的核苷酸序列或氨基酸序列相比有一個或若干個核苷酸或氨基酸殘基的差異,包括堿基或氨基酸殘基的改變、缺乏、或插入,或與AML基因序列中的連續(xù)100個堿基以上的區(qū)域有95%以上的同源性,且其基因表達產(chǎn)物的功能與AML表達產(chǎn)物的功能相同。
因此,本發(fā)明提供的AML基因還包括AML等同基因,它們?yōu)橄铝泻塑账嵝蛄兄唬蚓幋a下列氨基酸多肽序列之一的核苷酸序列(1)將序列1的核苷酸序列經(jīng)過一個或幾個核苷酸的取代、缺乏或添加,具編碼與序列2等同功能蛋白質(zhì)的衍生核苷酸序列;(2)與序列1的第64~873位堿基序列中連續(xù)100堿基以上的區(qū)域具有95%以上的同源性,且編碼與序列2等同的核苷酸序列;(3)將序列2的氨基酸多肽序列經(jīng)過一個或幾個氨基酸殘基的取代,缺乏或添加,且具有與序列2同等功能的衍生氨基酸多肽序列,或其保守性變異多肽,或其活性片段。
本發(fā)明提供的AML基因具有重要的應(yīng)用價值。應(yīng)用之一是將所述的AML構(gòu)建植物轉(zhuǎn)化載體,用任何一種轉(zhuǎn)化方法將AML基因?qū)朊藁ɑ蚱渌参锛毎?,可獲得能表上所述基因的轉(zhuǎn)基因作物,從而達到抗蟲效果。
本發(fā)明提供的AML基因的另一個應(yīng)用是將該基因轉(zhuǎn)化到表達載體,并使之表達產(chǎn)生相應(yīng)的蛋白,之后將表達蛋白應(yīng)用到農(nóng)業(yè)、醫(yī)學或其它方面。
本發(fā)明可產(chǎn)生巨大的經(jīng)濟、社會效應(yīng)。將本發(fā)明克隆的基因轉(zhuǎn)化到植物中,則可使作物產(chǎn)生明顯的抗蟲作用,特別是對刺吸式口器類害蟲。從而減少農(nóng)藥的施用,減少農(nóng)藥對環(huán)境、生態(tài)及整個人類產(chǎn)生的不良影響。
以下結(jié)合實施例和附圖對本發(fā)明提供的海芋凝集素蛋白基因的克隆過程,基因功能分析,以及應(yīng)用途徑作具體說明。
圖1為AML蛋白基因的5’Race-PCR擴增產(chǎn)物的電泳檢測圖。圖中M表示2000bp的Marker,泳道1為以W4236為引物的5’Race-PCR產(chǎn)物,約為700bp,泳道2為以W4237為引物的5’Race-PCR產(chǎn)物,約為600bp。
W42365’-GCCGTTGCCGTGGGTGTTGGACTGCCA-3’ (27bp)W42375’-TGCCGTCGCCGTAGAGGACCTG-3’ (22bp)
圖2為AML蛋白基因的5’Race-PCR擴增產(chǎn)物與pMD 18-T vector載體重組質(zhì)粒的單雙酶切產(chǎn)物的電泳檢測圖。圖中M表示λ-HindIII digest。
1.1、1.2分別為pUC18空質(zhì)粒用EcoRI、HindIII的單酶切產(chǎn)物、1.3為雙酶切產(chǎn)物2.1、2.2分別為圖4.8中的重組質(zhì)粒1用EcoRI、HindIII的酶切產(chǎn)物2.3為雙酶切產(chǎn)物3.1、3.2分別為圖4.8中的重組質(zhì)粒2用EcoRI、HindIII的酶切產(chǎn)物3.3為雙酶切產(chǎn)物圖3為AML蛋白基因的3’Race-PCR擴增產(chǎn)物的電泳檢測圖。圖中M表示2000bp的Marker,泳道1為以W2989為引物的3’Race-PCR產(chǎn)物,約為600bp,泳道2為以W2986為引物的3’Race-PCR產(chǎn)物,約為770bp,泳道3為以W2987為引物的3’Race-PCR產(chǎn)物,約為800bp。
W29865’-ACTACGCCGCCGTCSTCCATCCGGA-3’ (25bp)(S為G或C)W29875’-TCTACGGCCCATCCGTCTTCAAGA-3’ (24bp)W29895’-TGGCAGTCCAACACCCACGGCAACG-3’ (25bp)圖4為AML蛋白基因的3’Race-PCR擴增產(chǎn)物與pMD 18-T vector載體重組質(zhì)粒的單雙酶切產(chǎn)物的電泳檢測圖。圖中M表示λ-HindIII digest。1.1、1.2分別為pUC18空質(zhì)粒用EcoRI、HindHI的單酶切產(chǎn)物、1.3為雙酶切產(chǎn)物2.1、2.2分別為圖4.7中的重組質(zhì)粒2用EcoRI、HindIII的酶切產(chǎn)物、2.3為雙酶切產(chǎn)物3.1、3.2分別為圖4.7中的重組質(zhì)粒3用EcoRI、HindIII的酶切產(chǎn)物、3.3為雙酶切產(chǎn)物圖5為AML基因全長序列的RACE-PCR產(chǎn)物電泳圖。圖中M表示2000bp的Marker,泳道1、2為以W6045為引物的3’Race-PCR產(chǎn)物的兩個重復(fù),約為1150bp。
W60455’-GATCACGGCGAAGAAGAGGTGT-3’ (22bp)實施例1、海芋凝集素蛋白基因(AML)3’端序列的克隆本發(fā)明用RACE PCR發(fā)克隆AML基因的3’端序列。首先檢索Genbank和相關(guān)文獻,搜索到與海芋近緣的天南星科下的其它三種植物的五種凝集素或類似蛋白的核苷酸序列和氨基酸序列,將五者進行排列分析,找出其中保守性高的三段區(qū)域用來設(shè)計3’RACE PCR必需的基因特異性引物(GSP),然后進行3’RACE PCR擴增獲得3’端序列片段,再將PCR產(chǎn)物直接與pMP 18-T vector載體相連,轉(zhuǎn)化到大腸桿菌感受態(tài)細胞中,通過含AMP的LB平板來進行抗性篩選重組質(zhì)粒,從平板上挑選單菌落搖瓶培養(yǎng),提取重組質(zhì)粒后進行單雙酶切反應(yīng)加電泳檢測,用到的兩種酶分別為E10RI和HindIII,將雙酶切產(chǎn)物中含有目的片段的重組質(zhì)粒進行測序。
2、AML基因5’端序列的克隆本發(fā)明運用RACE PCR法克隆AML基因的5’端序列?;驹砗筒僮鬟^程與3’端RACE PCR相同。但它只在保守性高的二段區(qū)域設(shè)計二條GSP進行反應(yīng)。
3、AML基因的全長序列的獲得和克隆在完成3’和5’測序后,將兩端序列通過中間的重迭部分進行拼接合并,從而獲得全長序列。從5’端起始部分選取22個堿基合成引物,作為克隆全長序列的RACE PCR所需的基因特異性引物。將RACE PCR產(chǎn)物進行電泳檢測,結(jié)果表明長度大小正好和拼接獲得的全長序列相符。
4、由所得的全長cDNA序列,通過用幾種不同的翻譯(工具)軟件如primer premier 5.0、DNA sis V2.5、ExPASy網(wǎng)站中的translate,從cDNA推倒出氨基酸序列。海芋凝集素的氨基酸序列包含270個氨基酸,其中包括前后兩個甘露糖特異結(jié)合的結(jié)構(gòu)域,由Gln(谷氨酰胺),Asp(天冬氨酸),Asn(天冬酰胺),Val(纈氨酸),Tyr(酪氨酸)五個氨基酸組成。
海芋凝集素蛋白基因cDNA and AA sequence電子文件<110>華南農(nóng)業(yè)大學<120>海芋凝集素素cDNA和AA序列<160>2<210>1<211>1124<212>DNA<213>海芋(Alocasia macrorrhiza(L.)Schott)<220>
<221>cDNA sequence<222>(1)...(1124)<220>
<221>CDS<222>(64)...(876)<400>1gatcacggcg aagaagaggt gttagggttt tgaatttagt agctagcagc aaccccattc 60ctc atg gcc aag ctc ctc ctc ttc ctc ctc ccg gcc att ctc ggc ctc ctc gtt cct cgg 120Met Ala Lys Leu Leu Leu Phe Leu Leu Pro Ala Ile Leu Gly Leu Leu Val Pro Arg 19tca gcc acg gca ata ggc atc aac tac ctg ctg tcc gga gaa acc ctg gac acg aac ggc 180Ser Ala Thr Ala Ile Gly Ile Asn Tyr Leu Leu Ser Gly Glu Thr Leu Asp Thr Asn Gly 39cat ctc agg aac ggc aac ttc gac ttg gtc atg cag gag gac tgc aac gcc gtc ctg tac 240His Leu Arg Asn Gly Asn Phe Asp Leu Val Met Gln Glu Asp Cys Asn Ala Val Leu Tyr 59aat ggc ggt tgg cag tcc aac acg gcc aac aga gga cga gac tgc aag ctc tcc ctg acc 300Asn Gly Gly Trp Gln Ser Asn Thr Ala Asn Arg Gly Arg Asp Cys Lys Leu Ser Leu Thr 79gac tac ggc gaa ctc gtc atc aaa aat ggc gac gga tcc act gtc tgg agg agc ggt tcc 360Asp Tyr Gly Glu Leu Val Ile Lys Asn Gly Asp Gly Ser Thr Val Trp Arg Ser Gly Ser 99cag tcc gac aag ggc aag tac gcc gcc gtc gtc cat ccg gat ggg agg ctg gtc gtc tac 420Gln Ser Asp Lys Gly Lys Tyr Ala Ala Val Val His Pro Asp Gly Arg Leu Val Val Tyr 119ggg cca tcc gtc ttt aat att aat ccc tgg gtc ccc ggc ctc aac agc ctg cgg ctc ggc 480Gly Pro Ser Val Phe Asn Ile Asn Pro Trp Val Pro Gly Leu Asn Ser Leu Arg Leu Gly 139aac atc ccc ttc aca agc aac atg ctc ttc tcc gaa caa gtc ctc tac gaa gac ggc agg 540Asn Ile Pro Phe Thr Ser Asn Met Leu Phe Ser Glu Gln Val Leu Tyr Glu Asp Gly Arg 159
ctc acc gcg aag aac cac agg ctc gtc atg cag ggc gac tgc aac ctg gtc cta tac ggt 600Leu Thr Ala Lys Asn His Arg Leu Val Met Gln Gly Asp Cys Asn Leu Val Leu Tyr Gly 179ggc aaa ttc ggc tgg cag tcc aac acc cac ggc aac ggc gag gac tgc ttc gtc agg ctc 660Gly Lys Phe Gly Trp Gln Ser Asn Thr His Gly Asn Gly Glu Asp Cys Phe Val Arg Leu 199aac cac aag ggc gag ctc gtc atc aag cac gac aac ttc agg acc atc tgg agc agc caa 720Asn His Lys Gly Glu Leu Val Ile Lys Asp Asp Asn Phe Arg Thr Ile Trp Ser Ser Gln 219caa aac tcg aat gag ggt gac tac gtc ttc atc ctc cag gac gac ggc ttc ggc gtc atc 780Gln Asn Ser Asn Glu Gly Asp Tyr Val Phe Ile Leu Gln Asp Asp Gly Phe Gly Val Ile 239tac ggc cct gcc atc tgg gcg acc agc tcg aag cgc tcc att gct gcg gag gag aag atg 840Tyr Gly Pro Ala Ile Trp Ala Thr Ser Ser Lys Arg Ser Ile Ala Ala Glu Glu Lys Met 259agc ggc atg gtg cct gag aac gtg gaa gcg aaa taa 876Ser Gly Met Val Pro Glu Asn Val Glu Ala Lys 270agtt ggcaactata tatcttccgc 900ctcgctagaa aaataaatga gcgcatgaca tgttgctcca tgctagctag tttctggacc 960gtaaaataat cgtgtgcagt acgtgcgatt attcgctgtt gtagtctgtc ttcgtcgtag 1020agtgttctta attaagaggc tttcggccgt tgctttcgta gccataggtc tggctttttg 1080ctggtgtaaa atggtccttt gaataaatat ggctaccttg agtt1124<210>2<211>270<212>protein<213>海芋(Alocasia macrorrhiza(L.)Schott)<400>2Met Ala Lys Leu Leu Leu Phe Leu Leu Pro Ala Ile Leu Gly Leu Leu Val Pro Arg 19Ser Ala Thr Ala Ile Gly Ile Asn Tyr Leu Leu Ser Gly Glu Thr Leu Asp Thr Asn Gly 39His Leu Arg Asn Gly Asn Phe Asp Leu Val Met Gln Glu Asp Cys Asn Ala Val Leu Tyr 59Asn Gly Gly Trp Gln Ser Asn Thr Ala Asn Arg Gly Arg Asp Cys Lys Leu Ser Leu Thr 79Asp Tyr Gly Glu Leu Val Ile Lys Asn Gly Asp Gly Ser Thr Val Trp Arg Ser Gly Ser 99Gln Ser Asp Lys Gly Lys Tyr Ala Ala Val Val His Pro Asp Gly Arg Leu Val Val Tyr 119Gly Pro Ser Val Phe Asn Ile Asn Pro Trp Val Pro Gly Leu Asn Ser Leu Arg Leu Gly 139Asn Ile Pro Phe Thr Ser Asn Met Leu Phe Ser Glu Gln Val Leu Tyr Glu Asp Gly Arg 159Leu Thr Ala Lys Asn His Arg Leu Val Met Gln Gly Asp Cys Asn Leu Val Leu Tyr Gly 179Gly Lys Phe Gly Trp Gln Ser Asn Thr His Gly Asn Gly Glu Asp Cys Phe Val Arg Leu 199Asn His Lys Gly Glu Leu Val Ile Lys Asp Asp Asn Phe Arg Thr Ile Trp Ser Ser Gln 219Gln Asn Ser Asn Glu Gly Asp Tyr Val Phe Ile Leu Gln Asp Asp Gly Phe Gly Val Ile 239Tyr Gly Pro Ala Ile Trp Ala Thr Ser Ser Lys Arg Ser Ile Ala Ala Glu Glu Lys Met 259Ser Gly Met Val Pro Glu Asn Val Glu Ala Lys 270
權(quán)利要求
1.一種分離得到的海芋凝集素蛋白基因,其特征在于(1)具有序列表中序列1的核苷酸序列,其中第1~63位堿基為含有啟動子調(diào)控元件和5’端非凝集素翻譯區(qū)的序列,第64~873位堿基為開放讀碼框(ORF),第874~1124位堿基為3’端非凝集素翻譯區(qū)的序列;(2)編碼序列表中序列2所示的氨基酸多肽序列,該序列由270個氨基酸殘基組成,具有前后二個甘露糖特異結(jié)合的三維功能結(jié)構(gòu)域;(3)具有系列表中序列1的核苷酸序列或與序列1的第64~873位堿基序列中連續(xù)100個堿基以上的區(qū)域有95%以上的同源性,具有編碼與序列2同等的功能蛋白質(zhì)的核苷酸序列;(4)編碼海芋凝集素前體蛋白的氨基酸多肽序列,該多肽具有序列表中序列2所示的序列;或編碼具有同等功能的由序列2衍生的多肽序列,或其保守性變異多肽,或其活性片段。
2.根據(jù)權(quán)利要求1所說的基因,其特征在于所編碼的氨基酸多肽序列含有由5個氨基酸殘基重復(fù)單位PPR組成的功能結(jié)構(gòu)域,該結(jié)構(gòu)域由Gln(谷氨酰胺Q),Asp(天冬氨酸D),Asn(天冬酰胺N),Val(纈氨酸V),Tyr(酪氨酸Y)五個氨基酸構(gòu)成的,其中前一個的五個AA位置分別為Gln51、Asp53、Asn55、Val57、Tyr59,后一個為Gln170、Asp172、Asn174、Val176、Tyr178。
3.一種分離得到的海芋凝集素蛋白基因,其特征在于將基因或含有基因的載體轉(zhuǎn)化棉花或其它植物,培養(yǎng)能表述所說基因的轉(zhuǎn)基因作物,從而具有抗蟲作用。
全文摘要
本發(fā)明提供了一個來源于海芋的凝集素蛋白的核苷酸(cDNA)序列及其編碼的氨基酸(AA)多肽序列。該基因?qū)儆诟事短墙Y(jié)合凝集素基因家族的成員,為一個組成型表述的基因。本發(fā)明還涉及用該基因轉(zhuǎn)化棉花或其它植物,將該基因序列運用到醫(yī)學或其它方面。
文檔編號C12N15/29GK1537943SQ0313995
公開日2004年10月20日 申請日期2003年7月28日 優(yōu)先權(quán)日2003年7月28日
發(fā)明者侯學文, 朱亞然, 王捷, 潘科 申請人:華南農(nóng)業(yè)大學