專利名稱:棉花腺苷酸核糖基化作用因子1基因及其啟動子的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種棉花基因組中的ADP-ribosylation factor 1(arf1)基因及其啟動子序列。該基因及其啟動子可在棉花的花蕾、花、纖維及其棉鈴鈴殼中優(yōu)勢表達。該基因及其啟動子可用于棉花生殖器官的發(fā)育、品質(zhì)改良以及外源基因在棉花生殖器官中的特異表達研究。
背景技術(shù):
棉纖維是已知纖維素純度最高的天然資源之一。它成本低廉,產(chǎn)出量大,且具有吸濕、通氣、保暖性好,不帶靜電,手感柔軟等人造纖維難以比擬的優(yōu)點。由于世界紡織工業(yè)加工速度的加快和人民生活水平的提高,對棉纖維品質(zhì)的要求愈來愈高。因此,弄清纖維細胞的表達模式以及可能的生物學(xué)功能,系統(tǒng)闡明棉纖維細胞發(fā)育調(diào)控的分子機理,對充分利用棉花自身基因資源、提高棉花產(chǎn)量、改良纖維品質(zhì)乃至發(fā)展人工棉纖維都具有重要意義(賈士榮,郭三堆,2002,轉(zhuǎn)基因棉花,p265-270)。
雖然棉纖維形成和發(fā)育的過程已經(jīng)基本清楚,但對纖維發(fā)育的分子機理還知之甚少。分離鑒定與棉纖維細胞分化、伸長和次生壁沉淀等過程相關(guān)的基因,了解它們在纖維發(fā)育不同階段的功能及其與纖維品質(zhì)的關(guān)系,可以為利用基因工程方法定向改良纖維品質(zhì)提供依據(jù)。
涉及到棉纖維的分化、發(fā)育過程中的基因有幾千種(賈士榮,郭三堆,2002,轉(zhuǎn)基因棉花,p265-270)。雖然目前已經(jīng)克隆到幾十個棉纖維發(fā)育相關(guān)基因,且多數(shù)是在纖維伸長階段的纖維細胞中特異表達(JhonM E,1992,Proc Natl Acad Sci USA,895769-5773;Jhon M E,1995,Plant Physiol 1071478-1486;Jhon M E,1996,Plant Molecular Biology 30297-306;1999,New YorkFood Products Press,271-292)。但絕大部分基因在棉纖維發(fā)育中的確切功能還不清楚或有待確定,因此,還不能有效地應(yīng)用于纖維品質(zhì)的遺傳改良,棉纖維的轉(zhuǎn)基因改良已有一些成功實例,但由于目標(biāo)基因缺乏,利用分子生物學(xué)方法改良棉纖維的潛力還遠沒有發(fā)揮(賈士榮,郭三堆,2002,轉(zhuǎn)基因棉花,p265-270)。
小G蛋白是一類重要的信號轉(zhuǎn)導(dǎo)蛋白,在真核生物基因的表達調(diào)控中起到重要作用(Terryn N.,MontaguM.V.,1993,The plant Cell,.51761-1769.)。至于在棉纖維發(fā)育過程中的作用,Delmer等人從棉花cDNA文庫中篩選出2個與哺乳動物rac基因高度同源的克隆Rac13和Rac9,其中Rac13在棉纖維發(fā)育過程中優(yōu)勢表達,且于纖維伸長向次生壁增厚的轉(zhuǎn)換期表達量達到最大。Rac13編碼的蛋白可參與調(diào)控細胞骨架形成的信號轉(zhuǎn)導(dǎo)(Delmer D P,Pear J R,1995,Mol Gen Genet,4843-51)。
ADP-ribosylation factor 1(arf1)是屬于Ras小G蛋白超級家族中的ARF亞族,在真核生物中普遍存在并高度保守。人類和植物的arf1基因均可互補于酵母arf1突變株。ARF1是高爾基體/內(nèi)質(zhì)網(wǎng)運輸小泡的重要組成部分和調(diào)控因子,在物質(zhì)運輸系統(tǒng)中起到重要的調(diào)控作用(Lee M H,Min M K,2002,Plant Physiology,129(4)1507-1520)。ARF1在胞內(nèi)細胞膜運輸中起重要作用,尤其是芽生小泡的關(guān)鍵調(diào)控因子。在酵母中對arf1基因進行突變研究,結(jié)果出現(xiàn)了對低溫敏感、生長緩慢、對氟敏感、多種分泌突變等表型(Yahara N,Ueda T,2001,Molecular Biology of the Cell,12,221-238)。在擬南芥細胞中的研究表明arf1在內(nèi)織網(wǎng)和高爾基之間的小泡運輸起重要作用,并且對維持高爾基體的正常形態(tài)結(jié)構(gòu)至關(guān)重要(Takeuchi M,Ueda T,2002,The Plant Journal 31(4)499-515)。另外,Arf1在質(zhì)膜和細胞質(zhì)之間生長素的極性運輸中起到重要作用。目前尚未見到arf1基因參與棉纖維發(fā)育、形成的報道。
有人通過RNA斑點雜交證明在棉花中,ARF1主要在花器官的各種組織中高效表達,而在根、莖、葉等生殖器官中不表達。(候磊等,2002,遺傳學(xué)報,29(4)359-363)。這說明在棉花中ARF1的順式調(diào)控元件具有生殖器官組織特異性。
但到目前為止,國內(nèi)外尚未見到對arf1基因及其啟動子在棉纖維及棉花生殖器官中的研究報道。
發(fā)明內(nèi)容
本發(fā)明的一個目的是提供一種與棉纖維發(fā)育有關(guān)的基因arf1基因。它全長為3609bp(如序列表SEQ ID2所示),具有7個外顯子和6個內(nèi)含子(如圖3所示)。其含有一個1125bp的ORF結(jié)構(gòu)(如序列表SEQ ID3所示)。Northern blot結(jié)果證明,它在棉纖維及棉花生殖器官中呈優(yōu)勢表達,在國內(nèi)外尚未見到有類似報道。
本發(fā)明的另一個目的是提供一種新的棉纖維發(fā)育有關(guān)的啟動子(如序列表SEQ ID1所示),該啟動子DNA序列上具有Initiator、TATA box、CCAA box和GC box等明顯啟動子特征序列(如圖3所示)。Northernblot結(jié)果證明,該啟動子驅(qū)動的arf1基因在棉纖維及棉花生殖器官中優(yōu)勢表達(如圖4所示)。在國內(nèi)外尚未見到有類似報道。
本發(fā)明的再一個目的是提供一種新的棉纖維及棉花生殖器官優(yōu)勢表達的蛋白質(zhì)(如序列表SEQ ID4所示)。Arf1蛋白,它具有181個氨基酸(如序列表SEQ ID4所示)。
本發(fā)明再一個目的是提供一種我們自己獨創(chuàng)的同尾酶反向PCR(isocaudarner inverse PCR,II-PCR)技術(shù),在棉花基因組上連續(xù)步移,獲得了棉花arf1上游1865bp的DNA序列(如圖2所示)。再用我們自己獨創(chuàng)的快速分離目的基因cDNA-5”未知序列和啟動子(rapid isolation of cDNA 5’unknown sequence and promoter,RICUP)的技術(shù),獲得了arf1的全長cDNA序列和啟動子(如圖3所示)。
下面結(jié)合附圖對本發(fā)明做進一步說明附圖表說明
圖1為從棉花基因組中用PCR擴增的arf1基因的4924bp DNA序列的瓊脂糖凝膠電泳圖。
圖2為用反向PCR和同尾酶反向PCR進行染色體步移擴增到棉花arf1基因上游1865bp DNA序列的瓊脂糖凝膠電泳圖及II-PCR流程示意圖。
圖3為棉花arf1基因全長cDNA的步移和啟動子定位過程瓊脂糖凝膠電泳圖及RICUP流程示意圖。
圖4為用Northern blot確定啟動子在棉花生殖器官中高效表達。1、2、3、4、5、6、7分別代表棉花根、莖、葉、蕾、花、鈴殼和纖維中提取的總RNA電泳泳道具體實施方式
實施例1棉花arf1基因上游1865bp DNA序列的分離克隆1 DNA和RNA模板的制備用改良的CTAB法提取陸地棉品種Y18基因組DNA,要求DNA片段大于50Kb,OD260/OD280大于1.8。采用改良的熱硼酸法提取陸地棉品種Y18 7-10dpa纖維總RNA,用于cDNA序列擴增和未知cDNA序列步移。
2用RT-PCR獲取棉花ARF1基因EST序列的3’端全長和相應(yīng)的DNA序列RT-PCR按照TaKaRa RNAPCR引物表
PCR Kit(AMV)Ver.2.1說明書操做。根據(jù)棉花ARF1基因EST序列(GenBank Accession Number BF272643)設(shè)計引物ACF1與Oligo(dT18)組成引物對(見PCR引物表),從棉花7-10dpa纖維總RNA擴出859bp和1295bp兩條特異條帶,經(jīng)測序分析發(fā)現(xiàn),859bp條帶的5’端730bp序列與EST序列完全相同,故此條帶看作是ARF1基因cDNA3’端全長序列(圖2A);并可以將polyA前的核甘酸序列看作arf1基因的轉(zhuǎn)錄終止位點。以polyA前23個核甘酸的反義鏈(ACR1)為下游引物(見PCR引物表),仍以ACF1為上游引物,從棉花基因組中擴增出4124bp特異條帶(圖1A)。序列分析表明該序列為ARF1基因842bp cDNA序列所對應(yīng)的基因組DNA序列。
3用反向PCR和同尾酶反向PCR獲取arf1基因上游1865bp的DNA序列第一次反向PCR步移選用BsrGI、Csp6I、MfeI、SalI、EcoRI等酶消化棉花基因組DNA,環(huán)化后以DIP1和DFP1(見PCR引物表)為引物進行反向PCR步移,結(jié)果僅從Csp6I和MfeI處理的DNA環(huán)化產(chǎn)物中分別擴增716bp和385bp的帶(圖2A),選取前者克隆測序,減去474bp的重疊部分,使序列向5’端步移242bp。第二次反向PCR采用BglII、XbaI、HpaI充分消化基因組DNA,酶解產(chǎn)物環(huán)化后進行反向PCR,結(jié)果均未有特異帶擴增。于是采用II-PCR,首先選用Bgl II充分消化基因組DNA,再利用Bgl II六堿基同尾酶BamH I和Bcl I分別消化Bgl II處理過的基因組DNA,產(chǎn)物環(huán)化后進行反向PCR,分別擴增出497bp和1879bp的條帶(圖2B)。選取較大者克隆測序,減去交疊的256bp序列,再次將序列向前推進1623bp。加上第一次反向PCR步移的242bp,共向前推進了1865bp的DNA序列(圖2C)。
實施例2棉花ARF1基因啟動子的分離1 arf1基因上游1865bp的DNA序列中外顯子的捕獲和cDNA步移引物的設(shè)計在NCBI/GenBank的nr、EST和蛋白數(shù)據(jù)庫中對該序列進行Blast搜索,結(jié)果未發(fā)現(xiàn)有與該序列同源的序列。于是利用DNAStar軟件將DNA全序列譯成三種可能氨基酸序列,對比分析后,將所有大于40個氨基酸的序列作為外顯子可能的位置。在各可能外顯子處設(shè)計用于ARF1基因5’端cDNA步移引物ACF2、ACF3、ACF4、ACF5和ACR2(見PCR引物表)。
2棉花ARF1全長cDNA序列的獲取和替換剪接現(xiàn)象的發(fā)現(xiàn)在用ACF1與Oligo(dT18)組成引物對進行arf1 3’RACE時,從棉花7-10dpa纖維總RNA中擴增到859bp和1295bp兩條特異條帶。經(jīng)進一步分析發(fā)現(xiàn),859bp條帶與部分1295bp條帶完全重疊,后者在5’端比前者多436bp的插入序列。與4124bp基因組DNA對比后發(fā)現(xiàn),436bp恰為第一個內(nèi)含子。當(dāng)其被剪掉時形成859bp的cDNA,若保留則形成1295bp的cDNA(圖2A)。arf1cDNA5’端第一次步移是將ACF2、ACF3和ACF4分別與ACR1組成引物對,從棉花7-10dpa纖維總RNA進行RT-PCR擴增,僅從ACF2和ACR1引物對擴出873bp、949bp和1385bp三條cDNA條帶(圖2B)。測序表明,第一個內(nèi)含子又向5’端延伸76bp,形成512bp的內(nèi)含子。若其被完全剪掉,則形成873bp的cDNA;若僅保留其5’端76bp,則形成949bp的cDNA;若完全保留,則形成1385bp的cDNA。由于ACF3和ACF4兩條引物組合均未有擴增,估計它們可能被設(shè)計在內(nèi)含子中或轉(zhuǎn)錄起始位點之前。對ACF2上游序列分析發(fā)現(xiàn),1629bp處有一個典型的啟動子特征結(jié)構(gòu)Initiator(圖4所示)。故進行第二次步移,以確定其是否為Initiator,即cDNA5’末端。于此處設(shè)計一條上游引物ACF5,以ACR1為下游引物,從棉纖維總RNA中擴增出1008bp、1084bp和1520bp三條cDNA條帶(圖2C)。測序發(fā)現(xiàn),這三條cDNA條帶均是在前次步移所獲片斷的基礎(chǔ)上分別向5’端推進135bp。從而證明1629bp處確為Initiator,同時說明已獲該基因cDNA5’端全長序列。將全長cDNA序列和DNA進行同源比較發(fā)現(xiàn),ARF1含有6個內(nèi)含子和7個外顯子(圖5),其中第一個內(nèi)含子位于5’端非翻譯區(qū)。由于第一個內(nèi)含子存在替換剪接現(xiàn)象,從而形成三種不同的cDNA。進一步分析發(fā)現(xiàn),三種cDNA都有一個546bp含有Kozak序列的完整ORF結(jié)構(gòu)(圖4),編碼182個氨基酸,。利用GenBank的blastp軟件進行蛋白序列查詢,發(fā)現(xiàn)其與多種生物ARF1蛋白具有98%以上同源性。
3 ARF1基因轉(zhuǎn)錄起始位點的確定和啟動子位置的定位通過對Initiator上游序列的分析發(fā)現(xiàn)在-61bp處具有典型的TATA box結(jié)構(gòu),在-98bp和-102bp處具有兩個典型CCAAT box,在-374bp處具有典型的GCbox。對Initiator下游序列的分析發(fā)現(xiàn)起始密碼子ATG位于+752bp處,在起始密碼子ATG和Initiator之間具有大量富含AT序列和回文結(jié)構(gòu)。根據(jù)以上信息可將arf1的轉(zhuǎn)錄起始位點定位在Initiator結(jié)構(gòu)中的保守的A處。并可將ARF1基因的啟動子定位在-1628bp-+751bp之間的位置。由于在啟動子的下游區(qū)域存在替換剪接現(xiàn)象,這表明該啟動子具有復(fù)雜的表達調(diào)控機制。至于決定啟動子表達強度和表達特異性的元件,還需要進一步做區(qū)段缺失的功能鑒定。
實施例3棉花ARF1基因啟動子表達特性分析Northern blot分別從棉花根、莖、葉、蕾、花、纖維和鈴殼中提取總RNA,各取總RNA 15μg,用1.5%的甲酰胺-甲醛瓊脂糖凝膠對RNA進行電泳分級分離,然后按照試劑盒說明書進行轉(zhuǎn)膜、Northern雜交,雜交探針為地高辛標(biāo)記的arf1 cDNA特異片段。結(jié)果表明arf1在棉花的根、莖、葉中表達量很弱,而在蕾、花、纖維和鈴殼中呈顯著優(yōu)勢表達,其中蕾和花中表達量最高(圖4)。
實施例4棉花ARF1基因啟動子功能結(jié)構(gòu)域的分析確定將棉花ARF1基因的啟動子序列構(gòu)建了350bp、896bp、1913bp和2370bp四種啟動子缺失片段,各自的引物對分別是APF1/APR1、APF2/APR1、APF3/APR1和APF3/APR2(見PCR引物表)。其中2370bp片段是位于起始密碼子上游的啟動子全長序列,350bp、896bp、1913bp三種啟動子缺失片段是位于第一個內(nèi)含子之前的序列。將這四種啟動子片段與pBI121植物表達載體上的gus基因融合,然后用花粉管通道技術(shù)將其導(dǎo)入到棉花品種Y18中。用gus染色法對陽性植株的根、莖、葉、蕾、花、纖維和玲殼進行染色,結(jié)果表明2370bp的啟動子區(qū)段在棉花的蕾、花、纖維和玲殼中的表達效果最好。
棉花arf1基因及其啟動子.ST25SEQUENCE LISTING<110>中國農(nóng)業(yè)科學(xué)院生物技術(shù)研究所<120>棉花arf1基因及其啟動子<130>棉花arf1基因及其啟動子<160>4<170>PatentIn version 3.1<210>1<211>2380<212>DNA<213>陸地棉Y18<400>1tgatcacggt tccttttctt ccttctcagc aaaagcctat ggctaacatc aaaatgacca 60ttgatgaatg cagggcaaca gcgaaccagg ttttttattt tgtagggctg caaaatacta 120ctgcaacgat tgcatgtgca ttgaacaatg tactgccagc agccacattt ctcctcgcag 180ccatttgcag gtcccaatgt catattttgg tacttaaatt ctacaaaaaa aaatttgggt 240ttcatctgat aaattgtcga atttgatgtt caatatatag acaagaagct gtggggataa 300agaaagcatc agggcaggct aaggtaatag gtactttggt atgtgttggt ggagctatgt 360tgctgtcatt ttaccatgga cacatcatcg gcataggtga atccagcatt cactggaact 420atgccaataa aatggcaaat tcaagtccca gccctagtgg ttcaaacttc ttcctgggtc 480ctttccttgt aatggccagt gctgttgctt gggcactatg gttcataatc cagggacaaa 540caagcaagag cttcccagct ccttacacaa gcactactct aatgtgcttc atggcgagca 600ttgagtgtac aataatcggc atattttcag accccaagcc atctgcttgg tcattgagct 660ccagcatgag gcttattgca gctctttatg cggtaagcat aacatatatc tatatcgata 720tcgatatcga tatcgatatc gatatcgata tctatatata ttatattatc agtttcgtaa 780tggtttatgt atgatgtatc tttcagggaa ttatatgtaa tgcagtagca ttctgcgtaa 840tgtcatggtg catccagaaa agaggtcctc tctatgtctc agtgttcagc cctttgctgc 900ttgtcattgt ggctattcta agttgggccc tgcttcgtga gaagctatat gtgggaacgt 960acgttcgtac acacattatg ctaaccccta tcaccaaaag ttaaaactcc ttattattaa1020ttaattattt attgggtatt gattaaattg caatgatggg acagtgttgt agggtcactg1080ctgatagttg gtggactgta tgctgtcctg tggggaaaag ataaagagat gaaacagatg1140aaaggcaatg aaaaaggagg aggaggagga gagcaagtag tagtagaaga aggggcagtg1200
棉花arf1基因及其啟動子.ST25gaagtcacta aagctggtga cagagatcat gacttggaga tgcagtcgca gcaaggcggc1260ggcgcccgtg gttaactagg gcgtacggaa tccaaaaaaa ggaatgttaa catatatgta1320tgaatgtaga acgctgctgt gacaccccag cagagtgttt tagtgggttt tattttgttc1380ttggatccag ctgttaaaga gtttttagta tgtttagcta ttattaataa taatctttct1440ttcctcatta caaaacaagg caaagctacc tccaaatttg atgttcctta aaccatattt1500taaatgattg tactttcaat ttggtcatat ccaatgtgat tatatattaa accatcttaa1560aataacttat ataaataccc aaagtgtttg ccccaacata tgttaaaaaa atattagcat1620ccgtacttac tttgaccata attgattaat ttaaagaata aaaaaatctg tgaaaaagac1680gaaggtgatt gggatttcca aaacggcagc gtttggatct aatcaaaggg catcgcaacg1740ttttaagaaa acctaatctg aaatcactca cccccgcctc cagctcctcc aattgcgtaa1800taaatagccc cgaagcccaa ccccttcccc cattgaattt gatattttgt gagtgttaaa1860cattgtttgc ctttcatttc tttctctatt ccttgttgct tcctcggcag cctctcggtt1920tctgagtaat gtattaatct tatctctgtg ttgcttctgc atgtttgcat ttgtttagat1980ttctctgtct aaatagaagt ccttccttgc tttgatttgt gtatgggcct ttctctaatt2040gattccagat ctagatctgg atcttggttt tctttgttct gctttgatct gctcatttca2100ttctatatga tatgatattg ttgctgatgt agatctgttt gtttagattt gtattgcttt2160gcaagatttt ctcaaatgaa attgttttta atgttgttca actctttatt ttggcaatgt2220catgcgtttt taaaatgaaa aatgggggct ttactgtatt tattatgtgt atataatagg2280gtcctatggt ttttgttcct tttttatatg gtatcaattg gatgaataag ttaggattga2340ccacatcttg tatttctggt gtcagcgaag ataaaaaagg 2380<210>2<211>3609<212>DNA<213>陸地棉Y18<400>2atggggctgt cttttgctaa gctgtttagt cgactgtttg ccaagaaaga gatgcgaatt 60cttatggtgg gtcttgatgc tgctggtaag accaccattt tgtacaagct caagctcggt 120gagattgtca ctaccattcc caccattggt atgccccatt ctttattaga tttttccttt 180tttttataca tcttaatgat ttgatcctta atagtgatgc ttatgacaac ctaatgcagg 240ctttaatgtg gagaccgtag aatataagaa cattagcttc actgtttggg atgttggtgg 300tcaggacaag gtaatacaac atttacttta agatttgtgg aacaaaacct taagtattca 360gacttttagc gttatactgt ttttctgggc ctactgtttc atgttaacgt catcttttgc 420catattattt tcctctgcaa ttgaagttac tgtagaactg atagatgtgc ttatggacta 480tcttatgctg attcaatttc atcgtcagca taggatgtaa tcataagcta catctactaa 540tgccactttg tctttcgagg ttttcctttg attgtatgag gaaaggctat ccttgctgtg 600gctgacacat aaaaactgtc ctcttcatct tgcatattcc ttgctattgg aactgttgga 660tgggtttatg gactatctta cgccagttca atttcattgt caacatagga cataatcata 720
棉花arf1基因及其啟動子.ST25agtcacatct actaatgcca cttggatgtg cttatggact atcttatgct gattccattt 780catcattagc atagactact cataagttac atttcctaat gccaccttgt cttttgaggt 840tttcctttga ttgtatgagg gaaggctatc ggctttgtgg ttgttgcata aaaactgccc 900tcttcacctt gtattttcct tgctattaat gtgcttatgg acggtcctgt gctgattaga 960ttgttctcca tcagcacaca acataatcat aagctacatg tacggccacc ttatgttttc1020tgttgtcctc ttcactgaat gaggaagact attcattttg tggcaaacat cacttgccta1080tttatcttta tatttgtttt ctttcatagt agttttttta ccggtcattg ttatgcttac1140taatgctctt tctctgattg gattttcttg tatcaatatg taattgaacc ataatttatt1200ttgatttatt gggtgtgtag ggcaatgttt ctctggtttt ttccttttaa tcaatagtgt1260agagcagctg ttagctgaag tctttacctt ttataaatat taatggtttt atgtttacga1320attacattat agtcgctgct gaaacattat aatttgctat gttatttcat tgttcaattg1380aagttgatat taaaactgtt ggatgtgttt atggactgtc ttacgctgat ttttattcca1440taagaaacat acaaccataa tcataagtta catctactta tgccacctta tctttcaaat1500gtttcctttg aattatactg ggaaaaacta tctgtactgt ggctgccttt aaaaactatg1560ttcttctgcc ttggcagttt tcttgttatt aattgtgctt gtggatggtc ctttgctgct1620gattagattg ttttccatta gctcataaca tgttcataag ctgtttctat aatttgctgt1680gctgtgttat tttattgtgc aatagaagct tatgttgaaa ctgttggatg tgcttcttga1740cggtcttaat catcagcatt taactataac cataagctac atctacttat gccaccttgt1800ctttcaagtt tttcctttga attatacaag gaaaggttat ccgtgctgtg gctgaaaaca1860taaaaactat cttcttcttt cttgtagttt tcttggtatt aattgtgctt atggacggtc1920ctgtgctgat tagattatta tccgtcagca cataacatat tcataagcta catgtactgc1980caccttattt tttttgtttt cctcttaatg aggaatgcta ttcattctgt ggcaaacatc2040acataactat ttattcatgt atttctatat attcatagca cttctattta gtggccattt2100tcagctttta ctaatgccct ttctgagtga atattactat atcatctcat aactgaccct2160tattatatcc tgatttgtta agcatacaga gtaatgcttt gggttctttt ttccccctca2220tatttataag taagtgacct cttagggttt cctccttcaa atcaatgtca taggacaact2280tttagctgaa gattaacctc ttaataaata ttaatggttt tagggttaag ttcattatag2340ttgcaattca taagtttgag tgcttattga cggtcttgtg ctaattagat gttccccttt2400agcacataac ataatcataa gctatattta ataaggctgc cttgtctttc aaatgcttcc2460ttcagctatg ttggaggaat gctatcagca ttgtggcatg catacatttt tgtttgtgtc2520tgcatgcatg ataattgttt ctcgtcattc ttaacttgta agaacttgca acagttttag2580taaatttttt ttgttggttg atatttttgg ttttatttac caatactttt atttgaataa2640gatttaaaca tgtggagttt ggtagcatgt aatgttctga aagcttttat ggacactttc2700agattcgacc tttgtggagg cactacttcc aaaacactca gggtctaatc tttgttgttg2760atagcaatga ccgtgaccgt gtggttgagg ccagggatga gcttcatcgt atgctaaatg2820aggtactaat ttgctttagg catgttgccg agtggtcttt gggacttgga agtacattgt2880ttgaaactgt gatatacttg tcatatgtgt agaaattacg aggctgtgta aattagttga2940
棉花arf1基因及其啟動子.ST25ttattatcat acacatgtaa taaccttttc caatcattat gttacttgtg atatgtgtag3000gacgagctga gggatgctgt gcttcttgtg tttgcaaaca agcaagatct gccgaatgct3060atgaatgctg ctgagattac tgataagctt ggccttcact cccttcgtca gcgccactgg3120tattatgtta ttaactgttt ccctgtttgc ttactactta ttagggtatt tgtttgtttg3180catttgcaaa atgtaatcgc ttgtattcat attcttgtgc gtctctcaca ggtatatcca3240gagtacttgt gccacctctg gcgaagggct gtatgaggga ctggactggc tttccaacaa3300cattgctaac aaggtaggat gagactcaca actcacgtgc atccattttg tggatattgt3360tcagttgtaa cttattgcgt tgcttgtttt gtttccatag ggttgagggt tggttgaatt3420ccagtcatat cttcaggcag ctatccttat tattttctgg ttcctttttt aagttttaca3480ggaaatgtat cagattgtgt tatataatta atatatattc accgtactac tgaaattagg3540catttgcctg ctttgtagat tgatttctca aataattttt ttctatatga tcacctgaac3600tctaattcc3609<210>3<211>1085<212>DNA<213>陸地棉Y18<400>3catccgtact tactttgacc ataattgatt aatttaaaga ataaaaaaat ctgtgaaaaa 60gacgaaggtg attgggattt ccaaaacggc agcgtttgga tctaatcaaa gggcatcgca 120acgttttaag aaaacctaat ctgaaatcac tcacccccgc ctccagctcc tccaattgcg 180taataaatag ccccaaagcc caaccccttc ccccatcgaa tttgatattt gtaagtgtta 240aacattgttt gcctttcatt tctttctcta ttccttgttg cttcttcggc agcctctcgg 300tttctgagta atataaaaaa ggatggggct gtcttttgct aagctgttta gtcgactgtt 360tgccaagaaa gagatgcgaa ttcttatggt gggtcttgat gctgctggta agactaccat 420tttgtacaag ctcaagctcg gtgagattgt cactaccatt cccaccattg gctttaatgt 480ggagaccgta gaatataaga acattagctt cactgtttgg gatgttggtg gtcaggacag 540gattcgacct ttgtggaggc actatttcca aaacactcag gggctaatct ttgttgttga 600tagcaatgac cgtgaccgtg tggttgaggc cagggatgag cttcatcgta tgctaaataa 660ggacgagctg agggatgctg tgcttcttgt gtttgcaaac aagcaagatc tgccgaatgc 720tatgaatgct gctgagatta ctgataagct tggccttcac tcccttcgtc agcgccactg 780gtatatccag agtacttgtg ccacctctgg cgaagggctg tatgagggac tggactggct 840ttccaacaac attgctaaca agggttgagg gttggttgaa ttccagtcat atcttcaggc 900agctatcctt attattttct ggttcctttt ttaagtttta caggaaatgt atcagattgt 960gttatataat taatatatat tcaccgtact actgaaatta ggcatttgcc tgctttgtag1020attgatttct caaataattt ttttctatat gatcacctga actctaattc caaaaaaaaa1080aaaaa1085
棉花arf1基因及其啟動子.ST25<210>4<211>181<212>PRT<213>陸地棉Y18<400>4Met Gly Leu Ser Phe Ala Lys Leu Phe Ser Arg Leu Phe Ala Lys Lys1 5 10 15Glu Met Arg Ile Leu Met Val Gly Leu Asp Ala Ala Gly Lys Thr Thr20 25 30Ile Leu Tyr Lys Leu Lys Leu Gly Glu Ile Val Thr Thr Ile Pro Thr35 40 45Ile Gly Phe Asn Val Glu Thr Val Glu Tyr Lys Asn Ile Ser Phe Thr50 55 60Val Trp Asp Val Gly Gly Gln Asp Arg Ile Arg Pro Leu Trp Arg His65 70 75 80Tyr Phe Gln Asn Thr Gln Gly Leu Ile Phe Val Val Asp Ser Asn Asp85 90 95Arg Asp Arg Val Val Glu Ala Arg Asp Glu Leu His Arg Met Leu Asn100 105 110Lys Asp Glu Leu Arg Asp Ala Val Leu Leu Val Phe Ala Asn Lys Gln115 120 125Asp Leu Pro Asn Ala Met Asn Ala Ala Glu Ile Thr Asp Lys Leu Gly130 135 140Leu His Ser Leu Arg Gln Arg His Trp Tyr Ile Gln Ser Thr Cys Ala145 150 155 160Thr Ser Gly Glu Gly Leu Tyr Glu Gly Leu Asp Trp Leu Ser Asn Asn165 170 175Ile Ala Asn Lys Gly180
權(quán)利要求
1一種啟動子序列,它具有如序列表SEQ ID1所示的核苷酸序列及其功能等同序列。
2按照權(quán)利要求1所述的啟動子,其特征在于能夠驅(qū)動基因在棉花纖維中優(yōu)勢表達,并且在棉花的花蕾、花、鈴殼中也能優(yōu)勢表達。
3一種蛋白質(zhì),它具有如序列表SEQ ID4所示的氨基酸序列及其功能等同序列。
4按照權(quán)利要求3所述的蛋白質(zhì),其特征在于能夠在棉花纖維中優(yōu)勢表達,并且在棉花的花蕾、花、鈴殼中也能優(yōu)勢表達。
5一種編碼權(quán)利要求3所述蛋白質(zhì)的棉花基因組DNA序列及其功能等同序列。
6按照權(quán)利要求5所述的棉花基因組DNA序列SEQ ID2,其特征在于含有5個內(nèi)含子和6個外顯子,它具有如序列表2所示的核苷酸序列。
7一種從真核生物基因組中分離目的基因及其啟動子的方法。
8按照權(quán)利要求7所述的方法,其特征在于利用限制性內(nèi)切酶及其同尾酶切割棉花基因組DNA,使反向PCR能夠應(yīng)用于棉花基因組連續(xù)步移。
全文摘要
本發(fā)明提供了一種棉花基因組中的ARF1基因及其啟動子序列。該基因及其啟動子可在棉花的花蕾、花、纖維及其棉鈴鈴殼中優(yōu)勢表達。該基因及其啟動子可用于棉花生殖器官的發(fā)育、品質(zhì)改良以及外源基因在棉花生殖器官中的特異表達研究。
文檔編號C07H21/04GK1621523SQ20031011379
公開日2005年6月1日 申請日期2003年11月26日 優(yōu)先權(quán)日2003年11月26日
發(fā)明者郭三堆, 任茂智, 張銳 申請人:中國農(nóng)業(yè)科學(xué)院生物技術(shù)研究所