本發(fā)明屬于油菜育種技術領域。具體涉及與芥菜型油菜多室性狀相關的兩室基因BjMc1和三室基因Bjmc1及其應用。本發(fā)明涉及的隱性基因Bjmc1是顯性基因BjMc1的功能缺陷突變體。芥菜型油菜兩室基因BjMc1的克隆、驗證和應用可以加快三室性狀在油菜等作物的新品種的選育中的應用,從而加快油菜高產(chǎn)量新品種的選育。
技術背景:
油菜是世界四大主要油料作物之一,在我國種植已有兩千多年的歷史,在食用油中占有重要的地位,自20世紀90年代以來,我國已成為世界油菜種植面積最大的國家。隨著人們生活水平的提高,對優(yōu)質菜籽油的需要也越來越大,但是我國當前油菜的生產(chǎn)量遠不能滿足大眾的需求。因此提高油菜的產(chǎn)量是當前油菜遺傳改良和育種中的主要目標。對于油菜高產(chǎn)品種的選育,角果是其中最為關鍵的一環(huán)。作為影響油菜產(chǎn)量的直接器官,對于角果性狀的研究顯得極其重要。多室油菜與兩室油菜相比,多室油菜的單株產(chǎn)量要遠高于兩室油菜,這是由于多室油菜與兩室油菜的單株角果數(shù)和千粒重相差不大,但是多室油菜的每角果粒數(shù)要顯著高于兩室油菜(呂澤文,2011)。在當前油菜的遺傳改良中,衡量油菜單位面積產(chǎn)量構成的主要因素有:單位面積有效角果數(shù)、每角果粒數(shù)和千粒重。而增加每角果粒數(shù)和千粒重是新品種培育的重點(祝麗霞,2010)。且當前油菜新品種的發(fā)展趨勢是向著直播、密植和機械化的方向發(fā)展(宋稀等,2010)。所以提高油菜單株產(chǎn)量是培育油菜新品種,實現(xiàn)油菜高產(chǎn)穩(wěn)產(chǎn)的一個必經(jīng)途徑之一。
目前研究發(fā)現(xiàn),在白菜型油菜、芥菜型油菜和甘藍型油菜中均發(fā)現(xiàn)了角果的多室性狀(何余堂等,2003;朱彥濤,2005;趙文路,2007;蒙祖慶和宋豐萍,2012;Paritosh et al.2013;Xiao et al.2013;Xu et al.2014;Fan et al.2014)。一般認為該白菜型多室角果性狀受一對隱性核基因控制(何余堂等,2003;Fan et al.2014),芥菜型油菜的多室性狀是受兩對獨立遺傳的隱性核基因的控制(Choudhary和Solanki,2007;Xiao et al.2013;Xu et al.2014)。目前,僅見控制白菜型油菜的多室基因BrCLV3被克隆(Fan et al.2014),芥菜型油菜和甘藍型油菜未見相關多室基因克隆報道。在三大類型油菜中,甘藍型油菜較其它品種明顯具有抗病、耐寒、耐濕、耐肥,產(chǎn)量高而穩(wěn)定的特點,因此被廣泛種植。盡管甘藍型油菜的多室性狀已經(jīng)被發(fā)現(xiàn),但是甘藍型油菜的多室性狀并不穩(wěn)定,存在嚴重的嵌合現(xiàn)象(即兩室角果和多室角果并存于同一個植株上),而且有關甘藍型油菜多室性狀的分子標記和基因克隆也未有公布,所以將甘藍型油菜的多室性狀應用到育種中培育高產(chǎn)新品種還有很長的路要走。因此,可將白菜型油菜和芥菜型油菜的多室基因導入到甘藍型油菜以獲得新品種。但是,三大類型油菜存在遠緣雜交不親和的現(xiàn)象,難以通過傳統(tǒng)的雜交育種手段來實現(xiàn)高產(chǎn)品種的培育。
目標基因的克隆及通過現(xiàn)代科技手段將目的基因轉移到甘藍型油菜中,成為培育新的高產(chǎn)新品種的新方法。白菜型油菜和甘藍型油菜的多室性狀均存在嵌合現(xiàn)象,不利于新的高產(chǎn)品種的選育。在本發(fā)明中,申請人發(fā)現(xiàn),在芥菜型油菜中,Bjmc1基因控制的三室性狀穩(wěn)定,不存在嵌合現(xiàn)象。因此BjMc1基因和Bjmc1基因的克隆及功能研究對甘藍型油菜高產(chǎn)新品種的培育具有重大的理論意義和實用價值。
技術實現(xiàn)要素:
本發(fā)明的一個目的在于提供了一種與芥菜型油菜多室性狀相關的兩室基因BjMc1,其序列為SEQ ID NO.1所示,編碼的蛋白質為SEQ ID NO.4所示,利用兩室基因BjMc1可以將芥菜型油菜三室品種J163-4的三室角果恢復為兩室角果。
本發(fā)明的另一個目的在于提供了一個芥菜型油菜三室基因Bjmc1,其序列為SEQ ID NO.3所示,編碼的蛋白質為SEQ ID NO.4所示,利用三室基因Bjmc1可增加擬南芥的多室品種的心皮數(shù)目。
本發(fā)明的還有一個目的是提供了一種與芥菜型油菜多室性狀相關的分子標記M1-1引物,所述的引物為:
M1-1L:GCCTTTGATTGGGTCAGAACTC
M1-1F:AACTAACCGTTTGATCGCGAC
M1-1R:CTAACGCGTCCAGGACAAACC。
本發(fā)明的最后一個目的在于提供了一種與芥菜型油菜多室性狀相關的分子標記M1-1引物在油菜多室品種的選育中的應用。
為了達到上述目的,本發(fā)明采取以下技術措施:
申請人通過圖位克隆技術,從芥菜型油菜中分離得到一種能夠將芥菜型油菜三室品種J163-4的三室角果恢復為兩室角果的兩室基因BjMc1(來源于芥菜型油菜兩室品種J248),其核苷酸序列為SEQ ID NO:1所示,編碼的氨基酸序列如序列表SEQ ID NO:2所示;同時分離得到一種芥菜型油菜三室基因Bjmc1(來源于芥菜型油菜三室品種J163-4),其核苷酸序列如序列表SEQ ID NO:3所示。該基因編碼的氨基酸序列如序列表SEQ ID NO:4所示。
基因序列分析發(fā)現(xiàn),芥菜型油菜三室基因Bjmc1的產(chǎn)生是由于在三室油菜中原來的兩室基因BjMc1被一個長度為4961bp的copia-LTR型逆轉錄酶轉座子的插入,從而導致了該基因的轉錄中斷造成的,該copia-LTR型逆轉錄酶轉座子如序列表SEQ ID NO:5所示。
申請人通過兩室基因BjMc1、三室基因Bjmc1以及copia-LTR型逆轉錄酶轉座子的序列開發(fā)分子標記M1-1,所述的分子標記的引物包括:
M1-1L:GCCTTTGATTGGGTCAGAACTC
M1-1F:AACTAACCGTTTGATCGCGAC
M1-1R:CTAACGCGTCCAGGACAAACC。
在本發(fā)明的實施例部分,申請人闡述了顯性基因BjMc1和隱性基因Bjmc1的克隆、功能驗證和分子標記的開發(fā)及應用過程以及這兩個基因的特點。
與現(xiàn)有技術相比,本發(fā)明具有以下優(yōu)點:
本發(fā)明所提供的芥菜型油菜兩室基因BjMc1和三室基因Bjmc1均是首次從芥菜型油菜中克隆所得,可利用本發(fā)明的技術對油菜兩室基因進行基因工程改造來獲得產(chǎn)量較高的三室油菜。本發(fā)明所提供的分子標記M1-1可以分別特異性擴增兩室基因BjMc1和三室基因Bjmc1,運用分子標記進行具備三室性狀的芥菜型油菜的輔助選擇可以克服傳統(tǒng)育種中依靠表型進行選擇的特點,減少育種工作量,縮短育種年限,加快了芥菜型多室油菜育種的進程。
附圖說明
圖1為本發(fā)明鑒定、分離、克隆并驗證芥菜型油菜兩室基因BjMc1和它的基因功能的流程圖。
圖2為覆蓋芥菜型油菜兩室基因BjMc1區(qū)段的物理圖譜。
圖中:a表示BjMc1基因初定位的遺傳圖譜;b表示BjMc1基因精細定位的遺傳圖譜;分子標記下面的數(shù)字表示在近等基因系群體中檢測到的BjMc1位點與分子標記之間發(fā)生重組交換的單株數(shù);c表示細菌人工染色體(bacterial artificial chromosome,BAC)克隆??潭染€表示菌人工染色體(bacterial artificial chromosome,BAC)克隆序列中,候選基因所在的scaffold2的部分序列??潭染€下面的五邊形對應的是相應位置上擬南芥的同源基因,其中,空心五邊形表示候選基因及其對應的擬南芥同源基因。
圖3為芥菜型油菜功能互補測驗過表達載體p35S::BjMc1的構建圖。
圖4為具有J163-4遺傳背景的T0代遺傳轉化芥菜型油菜植株角果表型與J163-4和J248表型的比較。
結果顯示:J163-4遺傳轉化T0代植株攜帶顯性基因BjMc1的候選基因,角果表現(xiàn)為兩室性狀。
圖5為三室基因Bjmc1過表達載體p35S::Bjmc1構建圖。
圖6為擬南芥突變體clv1-1的角果表型和以clv1-1為受體的p35S::Bjmc1載體的轉基因T0代植株AT-TG100角果表型。
圖7為擬南芥突變體clv1-1的角果表型和以clv1-1為受體的p35S::BjMc1載體的轉基因T0代植株AT-TG200角果表型。
圖8為利用分子標記M1-1的引物在芥菜型油菜兩室株系和三室株系及F1的基因組DNA的擴增結果。圖中,P1代表兩室芥菜型油菜J248,P2代表三室芥菜型油菜J163-4,BC5F1代表J248為母本J163-4為父本的回交5代單株,M代表DNA marker(片段大小依次為:5000bp、3000bp、2000bp、1000bp、750bp)。
具體實施方式
以下結合具體實施例,進一步定義本發(fā)明。應理解,這些實施例僅用于說明本發(fā)明而不用于限制本發(fā)明的范圍。下列實施例中未注明具體條件的試驗方法,通常按照常規(guī)條件如《分子克?。簩嶒炇抑改稀?New York:Cold Spring Harbor Laboratory,1989)中所述的條件,或者按照生產(chǎn)廠商提供的操作手冊中建議的條件。
實施例1:
芥菜型油菜兩室基因BjMc1和三室基因Bjmc1序列的獲得:
1.實驗材料
本實驗所用的材料為芥菜型油菜兩室品種J248和芥菜型油菜三室品種J163-4作為親本構建了BC4F1群體進行了芥菜型油菜兩室基因BjMc1的初定位(Xu et al.2014)。在此基礎上,繼續(xù)以近等基因系中的兩室植株為供體親本,三室植株為輪回親本,通過兄妹交后得到近等基因系定位群體。
該近等基因系定位群體是由BC5F1近等基因系(3700個單株)和BC6F1近等基因系(5600個單株)構成。近等基因系的單株DNA提取方法參見:Stewart and Via,1993,14(5):748-749。
2.篩選包含BjMc1基因區(qū)段的BAC克隆
根據(jù)初步定位的結果該基因位于AFLP(Amplified fragment lengthpolymorphism)標記EC14MC14和SCAR(Sequence characterized amplified region)標記SC20之間(Xu et al.2014)。即BjMc1位點位于EC14MC14和SC20之間。利用芥菜型油菜品種紫葉芥的細菌人工染色體(bacterial artificial chromosome,BAC)文庫,本發(fā)明篩選到了一個包含BjMc1基因位點的BAC克隆。用于篩選BAC克隆的引物序列如下:
C1-1正向引物GGAGGAGCGATCACGGATTCAC
C1-1反向引物AGCAAGCCCAAAATCAGCAACA
3.包含目標基因BAC克隆的測序和序列拼接
篩選到的目標克隆83D02利用TruSeq DNA Sample Prep v2Kit(Illumina,San Diego,USA)構建Illumina標準DNA文庫,利用Illumina Hiseq 2000進行測序。測序后的序列過濾低質量、接頭和重復序列后,剩余接近100倍覆蓋率的高質量序列利用SOAPdenovo軟件進行拼接。最終測序結果獲得4個Scaffolds序列,分別為Scaffold1(34kb)、Scaffold2(80kb)、Scaffold3(16kb)和Scaffold4(14kb)(圖2)。用于精細定位的引物多核苷酸序列見表1所示。
表1精細定位的引物多核苷酸序列
注:引物名稱中最后一個英文字母含義分別為:L為正向引物;R為反向引物。
4.精細定位兩室基因BjMc1
為了進一步縮小目標基因區(qū)域的范圍,基于BAC克隆獲得的scaffolds的序列開發(fā)分子標記,發(fā)現(xiàn)有1個SSR分子標記(BSR52)和兩個SCAR(SC40和SC151)分子標記在兩室和三室材料之間表現(xiàn)出多態(tài)性。分析發(fā)現(xiàn),分子標記SC40與目標基因共分離,BSR52和SC151位于目標基因的同一側(圖2)。
預測SC151所位于的Scaffold2的75kb序列(且該序列包含共分離標記SC40所在位點)區(qū)段的開放閱讀框(open reading frame,ORF),并用擬南芥的同源基因進行注釋分析。進一步分析發(fā)現(xiàn),共分離分子標記SC40的位點正好位于擬南芥的心皮發(fā)育相關的基因CLV1(At1g75750)所注釋的ORF上,而且只有這一個基因與心皮發(fā)育相關,所以該ORF被確定為兩室基因BjMc1的候選基因,命名為BjCLV1。
5.候選基因BjCLV1確定為芥菜型油菜的兩室基因BjMc1
本實施例采用改造后含有2×35S啟動子的pCAMBIA2300載體(即將2×35S啟動子逆時針方向插入到植物表達載體pCAMBIA2300的HindⅢ和Pst Ⅰ酶切位點)作為芥菜型油菜轉基因載體。通過分析攜帶候選基因的BAC克隆序列的酶切位點和候選基因的關系,以BC5F1群體中的兩室單株的基因組DNA為模板,利用高保真PCR方法擴增獲得一個3.9kb的片段,該片段不包含Pst Ⅰ和Kpn Ⅰ酶切位點。用于擴增該片段的引物序列如下:
E48-2正向引物:CGATTCACGCTTCCTCAACACATACCTT
E48-2反向引物:ATGGAGATGAGACTTTTGAAAACACACCT。
片段起始端包括基因區(qū)間3154bp的序列和下游非翻譯區(qū)767bp的序列。將擴增片段克隆到pMD18-T載體(購自寶生物工程(大連)有限公司)上,測序結果表明序列完全準確,沒有錯配堿基存在。提取正確克隆的質粒,用Pst Ⅰ和Kpn Ⅰ雙酶切后,回收3.9kb的片段,連接到Pst Ⅰ和Kpn Ⅰ雙酶切的改造后的表達載體pCAMBIA2300上,連接產(chǎn)物轉化大腸桿菌菌株Trans5α(購自全式金公司),在含有50ug/ml卡那霉素的LB培養(yǎng)基上篩選轉化子,挑選單菌落提取質粒,并且通過測序檢測確定核苷酸序列完全正確,成功構建了轉化植株的載體p35S::BjMc1(見圖3)。正確的重組質粒通過凍融法(HOLSTERS M等.1978,Transfection and transformation of Agrobacterium tumefaciens.Mol Gen Cent,183:181-187)導入農(nóng)桿菌菌株GV1301.油菜遺傳轉化在常規(guī)農(nóng)桿菌轉化法(陳葦?shù)龋?006)的基礎上加以改進,轉化芥菜型油菜三室品種J163-4。種子滅菌用75%酒精浸泡3min后,放入無菌水中沖洗1min。然后放入0.1%升汞中浸泡10min后,無菌水沖洗6-7次。將滅菌后的種子播種到種子萌發(fā)培養(yǎng)基上(所述的種子萌發(fā)培養(yǎng)基為:MS基本培養(yǎng)基+7g/L瓊脂粉,pH值為5.9)。于25℃按培養(yǎng)7天。在超凈工作臺內(nèi)將獲得的試管幼苗下胚軸切成1cm左右的小段外植體,接種至含有農(nóng)桿菌(懸浮過夜至對數(shù)生長期)的MS液體培養(yǎng)基(pH值為5.9)侵染10-15min后,吸干液體,于25℃黑暗條件下在共培養(yǎng)基上(所述的共培養(yǎng)基包括:MS培養(yǎng)基+30g/L蔗糖+18g/L甘露醇+1mg/L 2,4-D+0.3mg/L Kinetin+100um/L乙酰丁香酮+6g/L瓊脂粉,pH值為5.9)共培養(yǎng)36h。將外植體轉移到愈傷誘導培養(yǎng)基上(所述的愈傷誘導培養(yǎng)基包括:MS培養(yǎng)基+30g/L蔗糖+18g/L甘露醇+1mg/L 2,4-D+0.3mg/L Kinetin+300mg/L特美汀+50mg/L卡那霉素+0.03uM/L[Ag(NO3)2]3-+6g/L瓊脂粉,pH值為5.9),25℃光照培養(yǎng)12-14d。將外植體轉入不定芽誘導培養(yǎng)基上(所述的不定芽誘導培養(yǎng)基包括:MS培養(yǎng)基+30g/L蔗糖+1.5g/L TDZ+0.1g/L NAA+300mg/L特美汀+50mg/L卡那霉素+5.0mg/L硝酸銀+7g/L瓊脂粉,pH值為5.9),25℃光照培養(yǎng)12-14d。獲得的帶有不定芽點的愈傷組織轉移到不定芽生長培養(yǎng)基中,進行生長培養(yǎng)。還未生長出不定芽點的外植體,則繼續(xù)放到不定芽誘導培養(yǎng)基中進行誘導培養(yǎng),待長出不定芽點后,轉移到不定芽生長培養(yǎng)基中(所述的不定芽生長培養(yǎng)基包括:MS培養(yǎng)基+10g/L葡萄糖+0.25g/L木糖+0.6g/L MES+2.0mg/L反式-Zeatin+0.1mg/L IAA+300mg/L特美汀+25mg/L卡那霉素+6g/L瓊脂粉,pH值為5.9)。每15-20d繼代一次,直至生長成幼苗。當幼苗長至2-3cm高時,將幼苗轉入生根培養(yǎng)基中培養(yǎng)(所述生根培養(yǎng)基包括:MS培養(yǎng)基+10g/L蔗糖+10g/L瓊脂粉,pH值為5.9)。對已生根的小苗進行煉苗,然后按常規(guī)技術移栽到溫室里,進行土培生長。
從獲得陽性植株上提取葉片總DNA(參見:Doyle JJ,Doyle JL.Isolation of plant DNA from fresh tissue.Focus,1990,12:13-15),用引物M1-1L和M1-1R通過PCR進一步鑒定轉化植株。鑒定引物序列如下:
M1-1L:GCCTTTGATTGGGTCAGAACTC
M1-1R:CTAACGCGTCCAGGACAAACC。
在轉基因T0代觀察角果表型,驗證導入的候選基因的功能。結果顯示在27株轉基因T0代植株中,有16株表現(xiàn)為形成兩室角果(見圖4)。將T0代植株自交后收貨T1代種子,將T1代播于溫室中,結角果后調(diào)查角果的表型,并提取葉片總DNA,用引物M1-1L和M1-1R通過PCR鑒定,結果顯示在T1代植株中,所有的陽性苗均表現(xiàn)為兩室角果性狀。PCR擴增的反應體系是:30ng模板DNA,各35ng正向和反向特異引物,1×PCR緩沖液,1UTaq酶,0.15mmol/L dNTPs和2.0mmol/L Mg2+,加ddH2O到總體積為15ul。PCR循環(huán)參數(shù)為94℃(30s)—55℃(30s)—72℃(90s),共35個循環(huán)。1.0%瓊脂凝膠檢測擴增產(chǎn)物。
最終可確定候選基因BjCLV1即為芥菜型油菜的兩室基因BjMc1,其核苷酸序列為SEQ ID NO:1所示,編碼的氨基酸序列如序列表SEQ ID NO:2所示。
另外,利用針對兩室基因BjMc1的序列設計引物M2,使用BC5F1群體中的三室植株的基因組DNA為模板,利用高保真PCR方法擴增,得到三室基因Bjmc1,其核苷酸序列為SEQ ID NO:3所示,編碼的氨基酸序列如序列表SEQ ID NO:4所示。引物序列如下:
M2L:GCCTTTGATTGGGTCAGAACTC
M2R:ATGGAGATGAGACTTTTGAAAACAC。
擴增的片段克隆到pMD18-T載體(購自寶生物工程(大連)有限公司)上進行測序。測序結果表明:三室基因Bjmc1與兩室基因BjMc1的基因結構相比較,Bjmc1在第一個外顯子區(qū)域有一個4961bp(其核苷酸序列為SEQ ID NO:5所示)的轉座子序列插入。
實施例2:
三室基因Bjmc1和兩室基因BjMc1在擬南芥中的遺傳轉化:
1.三室基因Bjmc1在擬南芥中的遺傳轉化
三室基因Bjmc1過表達載體p35S::Bjmc1的骨架選用改造后的pMDC83載體(所述的改造后的pMDC83載體是經(jīng)Sca I酶切后又連接的pMDC83載體),該載體在植物體內(nèi)抗性為潮霉素,在細菌體內(nèi)的抗性為卡那霉素。從BC5F1群體的三室植株基因組DNA中分離目標基因Bjmc1的片段3036bp,其中包括終止密碼子下游687bp的片段。擴增引物為:
HY-4L:ATGGAGATGAGACTTTTGAAAACAC
HY-4R:CTGCAAGACGGACTGAGTTAACA。
克隆片段從逆時針方向插入經(jīng)改造后的pMDC83載體的Xba I-Sac I位點(圖5)?;蚱慰寺〔僮髋c實施例1載體構建一致,得到p35S::Bjmc1載體。
擬南芥的遺傳轉化使用農(nóng)桿菌菌液蘸花,通過花粉管通道侵染的方式(Clough SJ and Bent AF 1998)。使用p35S::Bjmc1載體侵染擬南芥突變體clv1-1,該突變體從The Arabidopsis Information Resource(http://www.arabidopsis.org/)引進。擬南芥clv1-1突變體的角果為4個果瓣。侵染后收獲擬南芥種子,并在含有潮霉素抗性的MS培養(yǎng)基上播種,篩選有抗性的陽性苗。大約14天后,將陽性苗轉移到溫室進行土培,同時觀察轉基因T0代觀察角果表型,驗證導入的候選基因的功能。結果顯示,在62株轉基因陽性苗中,25株的植株上面表現(xiàn)出5個果瓣的角果,即角果在發(fā)育的過程中形成了5個心皮(圖6)。將T0代植株自交后播于溫室中,結角果后調(diào)查角果的表型,并提取葉片總DNA,用引物M2-1L和M2-1R通過PCR進一步鑒定轉化植株。鑒定引物序列如下:
M2-1L:CCACTATCCTTCGCAAGACC
M2-1R:CCGTTGTGACCAGTCATTGAGG。
PCR擴增的反應體系是:30ng模板DNA,各35ng正向和反向特異引物,1×PCR緩沖液,1U Taq酶,0.15mmol/L dNTPs和2.0mmol/L Mg2+,加ddH2O到總體積為15ul。PCR循環(huán)參數(shù)為94℃(30s)—55℃(30s)—72℃(45s),共35個循環(huán)。1.0%瓊脂凝膠檢測擴增產(chǎn)物。能夠擴增出條帶,則為陽性植株。明確在擬南芥clv1-1突變體中過表達Bjmc1基因后獲得的五果瓣角果可以在后代中穩(wěn)定遺傳。
2.兩室基因BjMc1在擬南芥中的遺傳轉化
使用含有p35S::BjMc1載體(即將兩室基因BjMc1從逆時針方向插入經(jīng)改造后的pMDC83載體的Xba I-Sac I位點)的農(nóng)桿菌侵染擬南芥突變體clv1-1,侵染及陽性苗的篩選過程與p35S::Bjmc1載體的篩選過程相同。結果顯示,共獲得32株陽性苗,其中17株的陽性面表現(xiàn)出兩室角果的表型(圖7)。將T0代植株自交后播于溫室中,結角果后調(diào)查角果的表型,并提取葉片總DNA,用引物M1-1L和M1-1R通過PCR進一步鑒定轉化植株,確定在擬南芥clv1-1突變體中過表達BjMc1基因后獲得的兩室表型可以在后代中穩(wěn)定遺傳。
實施例3:
一種與芥菜型油菜多室性狀相關的分子標記M1-1的獲得:
本發(fā)明根據(jù)已獲得的BjMc1基因、Bjmc1基因、copia-LTR逆轉錄酶轉座子序列及其在Bjmc1基因中的插入位點,開發(fā)共分離分子標記M1-1。預期M1-1(包含M1-1L、M1-1F和M1-1R三條引物)在PCR的條件下擴增芥菜型兩室油菜J248和芥菜型三室油菜J163-4的基因組DNA,在J248中擴增出大約1200bp的片段,而在J163-4中擴增出大約250bp的片段。
本發(fā)明利用上述步驟設計的引物進行PCR擴增。PCR的反應體系如下:1×PCR buffer,1.35mM MgCl2,0.08mM dNTPs,1.0U DNA聚合酶(均購自MBI Fermentas,Lithuanin公司),100ng DNA,兩條正向引物M1-1L和M1-1F各加0.5uM,反向引物加1uM,ddH2O補充至終體積20ul。熱循環(huán)參數(shù)為:94℃5min;94℃30sec,55℃30sec,72℃90sec,35個循環(huán);72℃10min,1個循環(huán);4℃保存,反應是在PTC-ALD1244PCR儀上完成。擴增產(chǎn)物在水平電泳槽上1.0%瓊脂糖凝膠電泳檢測。引物對M1-1在芥菜型兩室油菜J248的基因組DNA中擴增出1200bp左右的片段,在芥菜型三室油菜J163-4的基因組DNA中擴增出250bp左右的片段,而在F1植株的基因組DNA中兩個片段均能擴增出來(圖8)。因此該引物M1-1可以作為芥菜型油菜三室性狀的共顯性分子標記。
實施例4.
一種與芥菜型油菜多室性狀相關的分子標記M1-1在有才多室育種中的應用:
BC5F1群體中隨機挑選200個植株,利用共顯性標記M1-1進行分析。結果證明,其中104個單株與親本J248中擴增片段一樣(即利用引物M1-1L、M1-1F和M1-1R擴增有兩個條帶,記為“A帶型”),另外96個單株與親本J163-4中擴增片段一樣(即利用引物M1-1L、M1-1F和M1-1R擴增有一個條帶,記為“B帶型”)(表2)。通過分析表中數(shù)據(jù)可知,凡是M1-1標記進行檢測,檢測結果為“A帶型”的,其角果表型均為兩室性狀,而檢測結果為“B帶型”的其角果表型為三室性狀。這說明在回交群體中該標記是與芥菜型油菜三室性狀共分離的。因此,利用引物對M1-1可在早期有效鑒定出含有兩室性狀的芥菜型油菜單株,并提高了選擇的有效性和準確性。
表2本發(fā)明中芥菜型油菜BC5F1群體中角果性狀考察及M1-1標記檢測結果
SEQUENCE LISTING
<110> 華中農(nóng)業(yè)大學
<120> 與芥菜型油菜多室性狀相關的兩室基因BjMc1和三室基因Bjmc1及其應用
<130> 與芥菜型油菜多室性狀相關的兩室基因BjMc1和三室基因Bjmc1及其應用
<160> 8
<170> PatentIn version 3.1
<210> 1
<211> 3154
<212> DNA
<213> 人工序列
<400> 1
atggagatga gacttttgaa aacacacctt ctgtttctgc atcttcacta cgttatctcg 60
attttgcttc tatgtttctc accatgcttc gcttccactg acatggacca tctcctcaac 120
ctcaaatcct caatgactgg tcacaacgga cacggtctcc acgactgggt tcactccact 180
tctcccacgg ctcactgttc tttctccggc gtctcatgcg acgccgacgc tcgtgttgtc 240
tcactcaacg tctctttcac tcctctgttc ggaaccatct caccggagat tgggatgctg 300
aaccgtttgg tgaatctgac gttagccgcg aataacttct ccggtaggtt gccgctggag 360
atgaagagtc tcacttcact aaaggttctc aacatctcca acaacgtaaa cctcaacgga 420
accttccccg gagagattct cacttccatg gtcgacctcg aagtcctcga cgcctataac 480
aacaacttca ctgggccgtt accgccggag attcccgggc tgaacaagct caaacacctc 540
tctctcggag gaaacttctt caccggagag attcccgaga gttacggaga tatccaaagc 600
ttggagtatc tcggcctcaa cggagccgga ctctccggcg aatctccggc gttcttgtca 660
cgtctcaaga atctcagaga aatgtacgtc ggctacttca acagctacac cggcggcgtt 720
ccgccggagt tcggcgaatt aacgaagcta gaaatcctcg acatggcgag ctgtactctc 780
accggagaga ttccgacgac actgagtaat ctgaaacact tgcacacgct gttcctccac 840
atcaacaact taaccggaaa catcccacca gaactctccg gtttaatcag cttaaaatct 900
ctcgatctat caattaacca gctaaccgga gagattcctc agagcttcat ctctctggga 960
aacatcactc tcatcaacct cttcagaaac aacctccacg ggccgatacc ggagttcatc 1020
ggagaaatgc cgaacctcca agtcttccag gtgtgggaga acaacttcac gttagagtta 1080
ccggcgaata tcggccggaa cgggaatctg aaaaagctcg acgtctctga aaaccatctc 1140
accggactca tccccgtgga tttatgcaga ggtgggaagc tggaggttct ggtactctcc 1200
aacaacttct tcttcggctc catcccggag aagctaggtc aatgcaaatc tctaaacaag 1260
atcagaatcg tcaagaatct cctcaacggg accgttccgg cgggactatt caacttacca 1320
ctcgttacaa tcatcgagct cgcggataac ttcttctccg gggaacttcc tacggagatg 1380
tccggcgacg ttctcgatca tatctaccta tctaacaact ggtttaccgg tttaatccct 1440
ccggctatcg gtaatttcaa aaatctacag gatctgttct tagaccggaa ccggtttagc 1500
gggaatattc cgagagaagt tttcgagctg aagcatctca cgaagatcaa cacgagcgct 1560
aacaacctaa ccggcgatat ccctgactca ttctcgcgat gcacttcctt aatctccgtc 1620
gatctcagcc gtaacagaat cggcggagat atcccgaaag acatccacga cgtgattaac 1680
ttaggaactc tcaatctctc cgggaatcag ctcaccggct cgatcccgat cggaatcggg 1740
aagatgacga gcttaaccac tctcgatctc tccttcaacg acctctccgg gagagtacca 1800
ctcggcggtc agttcctagt cttcaacgac acttccttcg ccggaaaccc ttacctctgc 1860
ctccctcacc acgcctcctg cctaacgcgt ccaggacaaa cctctgatcg catccacgcg 1920
gcgctgttct ctccgtcgag gatcgtcatc acgatcatcg cggcgatcac ggcgttgatc 1980
ctcatcagcg tcgcgatccg tcagatgaac aagaagaaac acgagagatc cctctcgtgg 2040
aagctaaccg ccttccagcg actcgatttc aaggcggaag acgtcctcga gtgccttcaa 2100
gaagagaaca taatcggcaa aggcggagcg gggatcgtct accgcggatc catgccgaac 2160
aacgtagacg tcgcgatcaa acggttagtt ggacgcggaa cggggaggag cgatcacgga 2220
ttcacggcgg agattcagac gttaggaaga atccgccacc gtcatatagt gagactactc 2280
ggatacgtgg cgaacaagga cacgaacctg cttctatacg agtacatgcc taacgggagc 2340
ctcggcgagc ttttgcacgg gtctaaaggc ggtcatcttc agtgggagac gaggcacaga 2400
gtagccgttg aagcggcgaa aggactgtgt tatcttcacc atgactgttc gccgttgatc 2460
ttgcacagag acgttaagtc caataacatt ctcctggact ctgatttcga agcccatgtt 2520
gctgattttg ggcttgctaa gttcttagtg gacggtgctg cttctgagtg tatgtcctca 2580
atagctggct cctacggtta catcgctcca ggttagttta aacgtgtttt atataacaaa 2640
ctatgccatg ttctttaaat gttactgaga ctaatcatat gttagagttt gttgtccgtt 2700
ttattgtcgt atagctgatt actatgattt gtgacacaca aatgaatgtg actttaacaa 2760
ctaaaatatg tactaatcat tgtttgtttt gggtttgata gagtatgcat acactctcaa 2820
agtagacgag aagagtgatg tgtatagctt tggagtggtc ttgttggagc tgatagctgg 2880
gaagaaaccg gttggtgagt ttggggaagg agtggatata gtgaggtggg tgaggaacac 2940
ggagggtgag atacctcagc cttcggatgc agctactgtt gttgcgatcg ttgacccgag 3000
gttgactggt tacccgttga ccagtgtgat tcatgtgttc aagatagcga tgatgtgtgt 3060
ggaggatgag gccgcgtcaa ggcctacgat gagggaagtt gtgcacatgc taactaactc 3120
tcctaagtcc gtgactaact tgatcgcctt ctga 3154
<210> 2
<211> 987
<212> PRT
<213> 人工序列
<400> 2
Met Glu Met Arg Leu Leu Lys Thr His Leu Leu Phe Leu His Leu His
1 5 10 15
Tyr Val Ile Ser Ile Leu Leu Leu Cys Phe Ser Pro Cys Phe Ala Ser
20 25 30
Thr Asp Met Asp His Leu Leu Asn Leu Lys Ser Ser Met Thr Gly His
35 40 45
Asn Gly His Gly Leu His Asp Trp Val His Ser Thr Ser Pro Thr Ala
50 55 60
His Cys Ser Phe Ser Gly Val Ser Cys Asp Ala Asp Ala Arg Val Val
65 70 75 80
Ser Leu Asn Val Ser Phe Thr Pro Leu Phe Gly Thr Ile Ser Pro Glu
85 90 95
Ile Gly Met Leu Asn Arg Leu Val Asn Leu Thr Leu Ala Ala Asn Asn
100 105 110
Phe Ser Gly Arg Leu Pro Leu Glu Met Lys Ser Leu Thr Ser Leu Lys
115 120 125
Val Leu Asn Ile Ser Asn Asn Val Asn Leu Asn Gly Thr Phe Pro Gly
130 135 140
Glu Ile Leu Thr Ser Met Val Asp Leu Glu Val Leu Asp Ala Tyr Asn
145 150 155 160
Asn Asn Phe Thr Gly Pro Leu Pro Pro Glu Ile Pro Gly Leu Asn Lys
165 170 175
Leu Lys His Leu Ser Leu Gly Gly Asn Phe Phe Thr Gly Glu Ile Pro
180 185 190
Glu Ser Tyr Gly Asp Ile Gln Ser Leu Glu Tyr Leu Gly Leu Asn Gly
195 200 205
Ala Gly Leu Ser Gly Glu Ser Pro Ala Phe Leu Ser Arg Leu Lys Asn
210 215 220
Leu Arg Glu Met Tyr Val Gly Tyr Phe Asn Ser Tyr Thr Gly Gly Val
225 230 235 240
Pro Pro Glu Phe Gly Glu Leu Thr Lys Leu Glu Ile Leu Asp Met Ala
245 250 255
Ser Cys Thr Leu Thr Gly Glu Ile Pro Thr Thr Leu Ser Asn Leu Lys
260 265 270
His Leu His Thr Leu Phe Leu His Ile Asn Asn Leu Thr Gly Asn Ile
275 280 285
Pro Pro Glu Leu Ser Gly Leu Ile Ser Leu Lys Ser Leu Asp Leu Ser
290 295 300
Ile Asn Gln Leu Thr Gly Glu Ile Pro Gln Ser Phe Ile Ser Leu Gly
305 310 315 320
Asn Ile Thr Leu Ile Asn Leu Phe Arg Asn Asn Leu His Gly Pro Ile
325 330 335
Pro Glu Phe Ile Gly Glu Met Pro Asn Leu Gln Val Phe Gln Val Trp
340 345 350
Glu Asn Asn Phe Thr Leu Glu Leu Pro Ala Asn Ile Gly Arg Asn Gly
355 360 365
Asn Leu Lys Lys Leu Asp Val Ser Glu Asn His Leu Thr Gly Leu Ile
370 375 380
Pro Val Asp Leu Cys Arg Gly Gly Lys Leu Glu Val Leu Val Leu Ser
385 390 395 400
Asn Asn Phe Phe Phe Gly Ser Ile Pro Glu Lys Leu Gly Gln Cys Lys
405 410 415
Ser Leu Asn Lys Ile Arg Ile Val Lys Asn Leu Leu Asn Gly Thr Val
420 425 430
Pro Ala Gly Leu Phe Asn Leu Pro Leu Val Thr Ile Ile Glu Leu Ala
435 440 445
Asp Asn Phe Phe Ser Gly Glu Leu Pro Thr Glu Met Ser Gly Asp Val
450 455 460
Leu Asp His Ile Tyr Leu Ser Asn Asn Trp Phe Thr Gly Leu Ile Pro
465 470 475 480
Pro Ala Ile Gly Asn Phe Lys Asn Leu Gln Asp Leu Phe Leu Asp Arg
485 490 495
Asn Arg Phe Ser Gly Asn Ile Pro Arg Glu Val Phe Glu Leu Lys His
500 505 510
Leu Thr Lys Ile Asn Thr Ser Ala Asn Asn Leu Thr Gly Asp Ile Pro
515 520 525
Asp Ser Phe Ser Arg Cys Thr Ser Leu Ile Ser Val Asp Leu Ser Arg
530 535 540
Asn Arg Ile Gly Gly Asp Ile Pro Lys Asp Ile His Asp Val Ile Asn
545 550 555 560
Leu Gly Thr Leu Asn Leu Ser Gly Asn Gln Leu Thr Gly Ser Ile Pro
565 570 575
Ile Gly Ile Gly Lys Met Thr Ser Leu Thr Thr Leu Asp Leu Ser Phe
580 585 590
Asn Asp Leu Ser Gly Arg Val Pro Leu Gly Gly Gln Phe Leu Val Phe
595 600 605
Asn Asp Thr Ser Phe Ala Gly Asn Pro Tyr Leu Cys Leu Pro His His
610 615 620
Ala Ser Cys Leu Thr Arg Pro Gly Gln Thr Ser Asp Arg Ile His Ala
625 630 635 640
Ala Leu Phe Ser Pro Ser Arg Ile Val Ile Thr Ile Ile Ala Ala Ile
645 650 655
Thr Ala Leu Ile Leu Ile Ser Val Ala Ile Arg Gln Met Asn Lys Lys
660 665 670
Lys His Glu Arg Ser Leu Ser Trp Lys Leu Thr Ala Phe Gln Arg Leu
675 680 685
Asp Phe Lys Ala Glu Asp Val Leu Glu Cys Leu Gln Glu Glu Asn Ile
690 695 700
Ile Gly Lys Gly Gly Ala Gly Ile Val Tyr Arg Gly Ser Met Pro Asn
705 710 715 720
Asn Val Asp Val Ala Ile Lys Arg Leu Val Gly Arg Gly Thr Gly Arg
725 730 735
Ser Asp His Gly Phe Thr Ala Glu Ile Gln Thr Leu Gly Arg Ile Arg
740 745 750
His Arg His Ile Val Arg Leu Leu Gly Tyr Val Ala Asn Lys Asp Thr
755 760 765
Asn Leu Leu Leu Tyr Glu Tyr Met Pro Asn Gly Ser Leu Gly Glu Leu
770 775 780
Leu His Gly Ser Lys Gly Gly His Leu Gln Trp Glu Thr Arg His Arg
785 790 795 800
Val Ala Val Glu Ala Ala Lys Gly Leu Cys Tyr Leu His His Asp Cys
805 810 815
Ser Pro Leu Ile Leu His Arg Asp Val Lys Ser Asn Asn Ile Leu Leu
820 825 830
Asp Ser Asp Phe Glu Ala His Val Ala Asp Phe Gly Leu Ala Lys Phe
835 840 845
Leu Val Asp Gly Ala Ala Ser Glu Cys Met Ser Ser Ile Ala Gly Ser
850 855 860
Tyr Gly Tyr Ile Ala Pro Glu Tyr Ala Tyr Thr Leu Lys Val Asp Glu
865 870 875 880
Lys Ser Asp Val Tyr Ser Phe Gly Val Val Leu Leu Glu Leu Ile Ala
885 890 895
Gly Lys Lys Pro Val Gly Glu Phe Gly Glu Gly Val Asp Ile Val Arg
900 905 910
Trp Val Arg Asn Thr Glu Gly Glu Ile Pro Gln Pro Ser Asp Ala Ala
915 920 925
Thr Val Val Ala Ile Val Asp Pro Arg Leu Thr Gly Tyr Pro Leu Thr
930 935 940
Ser Val Ile His Val Phe Lys Ile Ala Met Met Cys Val Glu Asp Glu
945 950 955 960
Ala Ala Ser Arg Pro Thr Met Arg Glu Val Val His Met Leu Thr Asn
965 970 975
Ser Pro Lys Ser Val Thr Asn Leu Ile Ala Phe
980 985
<210> 3
<211> 2349
<212> DNA
<213> 人工序列
<400> 3
atggagatga gacttttgaa aacacacctt ctgtttctgc atcttcacta cgttatctcg 60
attttgcttc tatgtttctc accatgcttc gcttccactg acatggacca tctcctcaac 120
ctcaaatcct caatgactgg tcacaacgga cacggtctcc acgactgggt tcactccact 180
tctcccacgg ctcactgttc tttctccggc gtctcatgcg acgccgacgc tcgtgttgtc 240
tcactcaacg tctctttcac tcctctgttc ggaaccatct caccggagat tgggatgctg 300
aaccgtttgg tgaatctgac gttagccgcg aataacttct ccggtaggtt gccgctggag 360
atgaagagtc tcacttcact aaaggttctc aacatctcca acaacgtaaa cctcaacgga 420
accttccccg gagagattct cacttccatg gtcgacctcg aagtcctcga cgcctataac 480
aacaacttca ctgggccgtt accgccggag attcccgggc tgaacaagct caaacacctc 540
tctctcggag gaaacttctt caccggagag attcccgaga gttacggaga tatccaaagc 600
ttggagtatc tcggcctcaa cggagccgga ctctccggcg aatctccggc gttcttgtca 660
cgtctcaaga atctcagaga aatgtacgtc ggctacttca acagctacac cggcggcgtt 720
ccgccggagt tcggcgaatt aacgaagcta gaaatcctcg acatggcgag ctgtactctc 780
accggagaga ttccgacgac actgagtaat ctgaaacact tgcacacgct gttcctccac 840
atcaacaact taaccggaaa catcccacca gaactctccg gtttaatcag cttaaaatct 900
ctcgatctat caattaacca gctaaccgga gagattcctc agagcttcat ctctctggga 960
aacatcactc tcatcaacct cttcagaaac aacctccacg ggccgatacc ggagttcatc 1020
ggagaaatgc cgaacctcca agtcttccag gtgtgggaga acaacttcac gttagagtta 1080
ccggcgaata tcggccggaa cgggaatctg aaaaagctcg acgtctctga aaaccatctc 1140
accggactca tccccgtgga tttatgcaga ggtgggaagc tggaggttct ggtactctcc 1200
aacaacttct tcttcggctc catcccggag aagctaggtc aatgcaaatc tctaaacaag 1260
atcagaatcg tcaagaatct cctcaacggg accgttccgg cgggactatt caacttacca 1320
ctcgttacaa tcatcgagct cgcggataac ttcttctccg gggaacttcc tacggagatg 1380
tccggcgacg ttctcgatca tatctaccta tctaacaact ggtttaccgg tttaatccct 1440
ccggctatcg gtaatttcaa aaatctacag gatctgttct tagaccggaa ccggtttagc 1500
gggaatattc cgagagaagt tttcgagctg aagcatctca cgaagatcaa cacgagcgct 1560
aacaacctaa ccggcgatat ccctgactca ttctcgcgat gcacttcctt aatctccgtc 1620
gatctcagcc gtaacagaat cggcggagat atcccgaaag acatccacga cgtgattaac 1680
ttaggaactc tcaatctctc cgggaatcag ctcaccggct cgatcccgat cggaatcggg 1740
aagatgacga gcttaaccac tctcgatctc tccttcaacg acctctccgg gagagtacca 1800
ctcggcggtc agttcctagt cttcaacgac acttccttcg ccggaaaccc ttacctctgc 1860
ctccctcacc acgcctcctg cctaacgcgt ccaggacaaa cctctgatcg catccacgcg 1920
gcgctgttct ctccgtcgag gatcgtcatc acgatcatcg cggcgatcac ggcgttgatc 1980
ctcatcagcg tcgcgatccg tcagatgaac aagaagaaac acgagagatc cctctcgtgg 2040
aagctaaccg ccttccagcg actcgatttc aaggcggaag acgtcctcga gtgccttcaa 2100
gaagagaaca taatcggcaa aggcggagcg gggatcgtct accgcggatc catgccgaac 2160
aacgtagacg tcgcgatcaa acggttagtt ggacgcggaa cggggaggag cgatcacgga 2220
ttcacggcgg agattcagac gttaggaaga atccgccacc gtcatatagt gagactactc 2280
ggatacgtgg cgaacaagga cacgaacctg cttctatacg agtacatgcc taacgggagc 2340
ctcggctga 2349
<210> 4
<211> 791
<212> PRT
<213> 人工序列
<400> 4
Met Glu Met Arg Leu Leu Lys Thr His Leu Leu Phe Leu His Leu His
1 5 10 15
Tyr Val Ile Ser Ile Leu Leu Leu Cys Phe Ser Pro Cys Phe Ala Ser
20 25 30
Thr Asp Met Asp His Leu Leu Asn Leu Lys Ser Ser Met Thr Gly His
35 40 45
Asn Gly His Gly Leu His Asp Trp Val His Ser Thr Ser Pro Thr Ala
50 55 60
His Cys Ser Phe Ser Gly Val Ser Cys Asp Ala Asp Ala Arg Val Val
65 70 75 80
Ser Leu Asn Val Ser Phe Thr Pro Leu Phe Gly Thr Ile Ser Pro Glu
85 90 95
Ile Gly Met Leu Asn Arg Leu Val Asn Leu Thr Leu Ala Ala Asn Asn
100 105 110
Phe Ser Gly Arg Leu Pro Leu Glu Met Lys Ser Leu Thr Ser Leu Lys
115 120 125
Val Leu Asn Ile Ser Asn Asn Val Asn Leu Asn Gly Thr Phe Pro Gly
130 135 140
Glu Ile Leu Thr Ser Met Val Asp Leu Glu Val Leu Asp Ala Tyr Asn
145 150 155 160
Asn Asn Phe Thr Gly Pro Leu Pro Pro Glu Ile Pro Gly Leu Asn Lys
165 170 175
Leu Lys His Leu Ser Leu Gly Gly Asn Phe Phe Thr Gly Glu Ile Pro
180 185 190
Glu Ser Tyr Gly Asp Ile Gln Ser Leu Glu Tyr Leu Gly Leu Asn Gly
195 200 205
Ala Gly Leu Ser Gly Glu Ser Pro Ala Phe Leu Ser Arg Leu Lys Asn
210 215 220
Leu Arg Glu Met Tyr Val Gly Tyr Phe Asn Ser Tyr Thr Gly Gly Val
225 230 235 240
Pro Pro Glu Phe Gly Glu Leu Thr Lys Leu Glu Ile Leu Asp Met Ala
245 250 255
Ser Cys Thr Leu Thr Gly Glu Ile Pro Thr Thr Leu Ser Asn Leu Lys
260 265 270
His Leu His Thr Leu Phe Leu His Ile Asn Asn Leu Thr Gly Asn Ile
275 280 285
Pro Pro Glu Leu Ser Gly Leu Ile Ser Leu Lys Ser Leu Asp Leu Ser
290 295 300
Ile Asn Gln Leu Thr Gly Glu Ile Pro Gln Ser Phe Ile Ser Leu Gly
305 310 315 320
Asn Ile Thr Leu Ile Asn Leu Phe Arg Asn Asn Leu His Gly Pro Ile
325 330 335
Pro Glu Phe Ile Gly Glu Met Pro Asn Leu Gln Val Phe Gln Val Trp
340 345 350
Glu Asn Asn Phe Thr Leu Glu Leu Pro Ala Asn Ile Gly Arg Asn Gly
355 360 365
Asn Leu Lys Lys Leu Asp Val Ser Glu Asn His Leu Thr Gly Leu Ile
370 375 380
Pro Val Asp Leu Cys Arg Gly Gly Lys Leu Glu Val Leu Val Leu Ser
385 390 395 400
Asn Asn Phe Phe Phe Gly Ser Ile Pro Glu Lys Leu Gly Gln Cys Lys
405 410 415
Ser Leu Asn Lys Ile Arg Ile Val Lys Asn Leu Leu Asn Gly Thr Val
420 425 430
Pro Ala Gly Leu Phe Asn Leu Pro Leu Val Thr Ile Ile Glu Leu Ala
435 440 445
Asp Asn Phe Phe Ser Gly Glu Leu Pro Thr Glu Met Ser Gly Asp Val
450 455 460
Leu Asp His Ile Tyr Leu Ser Asn Asn Trp Phe Thr Gly Leu Ile Pro
465 470 475 480
Pro Ala Ile Gly Asn Phe Lys Asn Leu Gln Asp Leu Phe Leu Asp Arg
485 490 495
Asn Arg Phe Ser Gly Asn Ile Pro Arg Glu Val Phe Glu Leu Lys His
500 505 510
Leu Thr Lys Ile Asn Thr Ser Ala Asn Asn Leu Thr Gly Asp Ile Pro
515 520 525
Asp Ser Phe Ser Arg Cys Thr Ser Leu Ile Ser Val Asp Leu Ser Arg
530 535 540
Asn Arg Ile Gly Gly Asp Ile Pro Lys Asp Ile His Asp Val Ile Asn
545 550 555 560
Leu Gly Thr Leu Asn Leu Ser Gly Asn Gln Leu Thr Gly Ser Ile Pro
565 570 575
Ile Gly Ile Gly Lys Met Thr Ser Leu Thr Thr Leu Asp Leu Ser Phe
580 585 590
Asn Asp Leu Ser Gly Arg Val Pro Leu Gly Gly Gln Phe Leu Val Phe
595 600 605
Asn Asp Thr Ser Phe Ala Gly Asn Pro Tyr Leu Cys Leu Pro His His
610 615 620
Ala Ser Cys Leu Thr Arg Pro Gly Gln Thr Ser Asp Arg Ile His Ala
625 630 635 640
Ala Leu Phe Ser Pro Ser Arg Ile Val Ile Thr Ile Ile Ala Ala Ile
645 650 655
Thr Ala Leu Ile Leu Ile Ser Val Ala Ile Arg Gln Met Asn Lys Lys
660 665 670
Lys His Glu Arg Ser Leu Ser Trp Lys Leu Thr Ala Phe Gln Arg Leu
675 680 685
Asp Phe Lys Ala Glu Asp Val Leu Glu Cys Leu Gln Glu Glu Asn Ile
690 695 700
Ile Gly Lys Gly Gly Ala Gly Ile Val Tyr Arg Gly Ser Met Pro Asn
705 710 715 720
Asn Val Asp Val Ala Ile Lys Arg Leu Val Gly Arg Gly Thr Gly Arg
725 730 735
Ser Asp His Gly Phe Thr Ala Glu Ile Gln Thr Leu Gly Arg Ile Arg
740 745 750
His Arg His Ile Val Arg Leu Leu Gly Tyr Val Ala Asn Lys Asp Thr
755 760 765
Asn Leu Leu Leu Tyr Glu Tyr Met Pro Asn Gly Ser Leu Gly Glu Asn
770 775 780
Lys Arg Arg Gln Arg Glu Phe
785 790
<210> 5
<211> 4961
<212> DNA
<213> 人工序列
<400> 5
tgagaacaag aggagacaga gagaatttta ataaaacttc cttttgtatt cactttctca 60
aaacgtttct ttacaagata atcgagtata tatacaacct caagataaac cctagttccc 120
ttaactttgg accactcaac acgtgtcttc gtcacacaca ctctacacct tgcaaggcat 180
cgtaacggct agacaaagct attccacagt ttactccagc tggtgcattt gtcttcttgt 240
tctgtacttg tacgaactct tcattactct gtttcagagt ttgtctttgg gccagcatac 300
ttccttcagt taatggacca gtcgctgata taccaaggcc catcatggct tgtttactgt 360
catccccccg caaactgatg atgggtggag caccaacact cagtttggct ctgagactct 420
gaaaggaatg gcgtgggaga gatttagtga agatatctgc aagttgcagt gcagaaggaa 480
tgtgctgaac ctccaagaca ccaagagcca cccgctccct aacataatgg taatccgttt 540
caatatgttt ggaccgaccg tgaagaaccg ggtttgctgt aagataaact gcagagaggt 600
tatcacagtg aagaacagcc ggctttggtt gtttgatctt catatcacgc atcacaaacg 660
aaatccatgt taactcagtc cgtcttgcag agctcgatat tcagcctcag tggacgaccg 720
cgagacagtc ggttggcgct ttgccgacca ggagacaatg ttagaaccaa tcatgacaca 780
aaaaccacca gtcgaccgtc ttgtctccct acaccctgcc cagtcactat cactatacgc 840
gacaacatcc aaaccagagt tcttacggaa gtaaatcccc atggatgaag taccacgaag 900
gtagcgaaga acccgcttca acaaatgaaa gtcagcttca gtgggagaat gcattctctg 960
acaaatgaaa ttcacagcaa actgaatgtc gggtcgagtg atagtgagat actgtaactt 1020
cccagcaaga ctccgaaagt agctaggctc agggaacggc cgagtatctt cataaacttg 1080
atcgagtcgc aaagggagag gtgtatgaac aggattacac gcagacatat tggcatggtg 1140
aagaatctct tcagtgtact tggattgaga gaggaaaaga ccagaatctg taatctgagc 1200
ctgaacgccc aagaagtagt gcagattacc caaatctttc atggagaatc ggctactgag 1260
ctcagtgata agggacttga acaaggatgg atttgagcca gtgagaagta tatcatccac 1320
ataaaggagg agaactaatg tgtcgccatt gtgatgataa acaaagagag agggatcagc 1380
tttactgcag acaaagccat actcaagaag gaagttacta aatttatcaa accaagcccg 1440
tggagcttgt tttaaaccgt acagagcctt cttgagagag cacacatgat gaggtttagt 1500
gcaatcttca aagccgggtg gttgtagcat atagactgct tcttgaagat ctccatgaag 1560
gaaagcattt ttaacatcaa gctgagtgat gttccagttc tttgaagcag ctacagcaag 1620
aactatccga atggtagaag tcctaaccac tggactgtat gtctctgtga aatctactcc 1680
ttcttcttga tcaaacccct tagcaactaa ccgcgcttta agtttattga ctgtcccatc 1740
tgcgttaagc ttcactgtaa aaacccatct gcaaccaaga acattcatag tttctgtagc 1800
ttccgttaaa acccaagtgt ggttctgata aatcgagtct agttcatcca acattgcttg 1860
acgccatcca gggtgcgcca aagcttcaga tatagtctgt ggtaaggagg gaatcgtctt 1920
gcttgtgacc agagcgtaac gtggattagg tttgctaata ccagctcgtg atctcgtcat 1980
cataggatga ctaggcgctg ctacgtctgg tgaggcacga ggaggtgatt gagcaacctc 2040
aggaagactt gtggtggata cgtcgccttc agacagctcg aagtcttcct gcccatgatc 2100
agaacgagat ggggttgcaa taggcgtatc ttgacccgtg gtgataggag tatcctgttg 2160
aggatactct gtaacttgag gacactctgt aacttgagaa ggtactgtag gcagatagac 2220
cggaggagct tcaaatgcag taccatcttg ccaagcttta agcaaaccag agttgtgttt 2280
cacaagcaga tgtttatact gtccagtgaa tgggaaggtc tgctcatcga agataacgtg 2340
gcgagagatg taaactcgac ctgttggtgg atgcaaacac ctgtaacctt tgtactgagg 2400
atgataaccg aggaagacac actgtaagga tcggggctcg aacttgtgtt gagcataggg 2460
acgcaagcac ggatagcacg cagagccaaa gattctgaga aatgagtagt ctggtgcttt 2520
actagagaga acctctgaag ggcttttgtt gttcagaaca gaagaaggga tcatgttgct 2580
gatgaagtta gcagagtaga aggcctcaac ccaatattta agaggagtgt gactttgaaa 2640
taacatagaa agacccaatt cagtaagatg tctatgtttt ctctcagcaa taccattttg 2700
ttgaggagtt gaaggacatg aaacaagatg aacaatccct tgatctctga gatgattgcg 2760
aaaccttgtg ctcataaact caccaccccc atcgctctga aagactttca gtttcttgtt 2820
aaactgattt tcgatttgtt tttgaaagac aatgaacaca tcacaaaaat cagacttggc 2880
tttaagaggt attatccatg agtagcgact aaagttgtca acaaagactg cataatactt 2940
gaacccttga actgatacaa ccggagaagg accccacaga tcacaatgta tccgatctat 3000
gggttccttg acactagact ctgaaataaa aaaaggaagc tgactgctct ttcccatctg 3060
gcaaggtcca caaacgggag aaatgctgct cttattgact atgattgcct tgctttgctt 3120
gaggagctga agaatctgga agttcgcgtg cccaagtcgc tgatgccaca ccatatcact 3180
agctgcacac tgacgattgg agaagtaagc cgcaaactcc ttcttctcca gcacatacaa 3240
gcctctattt cgagttccct ttgtcaccac cttctgagca tcgaggtcga tgacatagac 3300
agcattagag tcaaagaaca ccccacaggg gtaatcatca cacagtttgg atacagataa 3360
tagtgatttt tgcattgaag gacagacaag aacatcgttt agaggaaggc tacctgtctc 3420
agtggtgagc gttgtggaac caacgtgggt aatcggaagg aaattgccat ctgccaccat 3480
aacatgctca gaaccattgt atggagtagt gttctgcatc tgagttgtat taggaaccat 3540
gtgagcagtg gcacctgagt cagctatcca ttccctgcca ctaggatcag agactggaaa 3600
agcggacaga gcatgaggaa catcgtcact ctgataagag ttatcaaagc ggttccagca 3660
acgaagagcg gagtggccgg tgcggccaca gatctgacac acagggcgag agttgttgtt 3720
gttattgcca ccaccagagt tgctgacttg ttgagtgaaa cctcttccac gagttgagaa 3780
gccaccacga ccagaatagc caccgcgacc acgagaataa ttattgcttc gtcctctgtt 3840
cgagttgttg tagtaccctc ggtgagtctg gaaagccatg ttgggagtaa catctgatgt 3900
tgcttcatac gactgaagac gagcgtcaaa accagagaca tcagaaatca catcgttcaa 3960
agtcggagga gggattcgag tcatggagct ctgaacgaca gtgataattg gatcatattc 4020
tcttccaagg ccattgataa atgagaagat cttcatggat tcctctatag gcttcccaat 4080
ggagctcaac ttgtcacaaa tggctcgaaa ctcacgacag taggtagtaa agtctttacc 4140
tttcttagtc atcaactgga gagaccgtct gagctcaaac tcacgagcaa tagaactctt 4200
gttgtagttg tcagctaacg ataaccagac atcacgagat gtagatagac catgtactgt 4260
accaaggact tcctcagtaa gtgttccaaa gatccaagaa atgacgagtt gatccgtaca 4320
agtccaagct tcaaagcgag gatttggggc ttgaacgttg acgttgtcga ccacggttgt 4380
gactagctcc ggcggaggtg gaatctgacc agtagcaaag cccaacagct tctgactgcg 4440
aagaagagac tccatttgag tcttccatag gagatagttg ctgtcactca gtttaatggt 4500
aacagaactt gtaatgtgaa cactggtggg aaaagggtat ggatcttgct cagccatgac 4560
agcacctgtt agggttaaat gagctctgat accatgagaa caagaggaga cagagagaat 4620
tttaataaaa cttccttttg tattcacttt ctcaaaacgt ttctttacaa gataatcgag 4680
tatatataca acctcaagat aaaccctagt tcccttaact ttggaccact caacacgtgt 4740
cttcgtcaca cacactctac accttgcaag gcatcgtaac ggctagacaa agctattcca 4800
cagtttactc cagctggtgc atttgtcttc ttgttctgta cttgtacgaa ctcttcatta 4860
ctctgtttca gagtttgtct ttgggccagc atacttcctt cagttaatgg accagtcgct 4920
gatataccaa ggcccatcat ggcttgttta ctgtcatcgg c 4961
<210> 6
<211> 22
<212> DNA
<213> 人工序列
<400> 6
gcctttgatt gggtcagaac tc 22
<210> 7
<211> 21
<212> DNA
<213> 人工序列
<400> 7
aactaaccgt ttgatcgcga c 21
<210> 8
<211> 21
<212> DNA
<213> 人工序列
<400> 8
ctaacgcgtc caggacaaac c 21