本發(fā)明屬于棉花分子育種
技術(shù)領(lǐng)域:
:,具體涉及一種與陸地棉纖維強度相關(guān)的SNP分子標(biāo)記及其檢測和應(yīng)用。
背景技術(shù):
::棉花作為一種主要的纖維作物,在世界經(jīng)濟中占有重要的地位。在全世界廣泛栽培的四個棉種中,陸地棉占據(jù)著最重要的地位,其產(chǎn)量占世界棉花總產(chǎn)量的90%以上。隨著人們對中高檔紡織品需求的增長,對纖維品質(zhì)的要求日益提高,但傳統(tǒng)的育種手段主要是通過表型進行選擇,育種效率低,難以滿足品質(zhì)育種的需要。分子標(biāo)記技術(shù)的發(fā)展使直接選擇數(shù)量性狀的基因型成為了可能。通過構(gòu)建棉花遺傳圖譜進行QTL定位可以使育種者直接選擇纖維品質(zhì)等數(shù)量性狀的基因型,通過利用F2和RIL等作圖群體進行了纖維品質(zhì)QTL定位研究也取得了豐碩的成果。尤其是第三代標(biāo)記技術(shù)SNP標(biāo)記的開發(fā)和應(yīng)用,更可為以后的標(biāo)記輔助育種打下基礎(chǔ)。SNP標(biāo)記是目前最具發(fā)展?jié)摿Φ姆肿訕?biāo)記,因在基因組中數(shù)量多,分布廣且在基因分析過程中不需要根據(jù)片段大小將DNA分帶,適合于大規(guī)模的自動化和數(shù)量龐大的檢測分析,目前已得到廣泛的應(yīng)用在醫(yī)學(xué)和生物等領(lǐng)域。但在棉花中的研究還較少。SNP是生物體最普遍,分布最廣泛的多態(tài)差異。人類HapMap計劃和最近對亞洲人的重測序數(shù)據(jù)顯示在人類基因組中,至少存在三百多萬個SNP多態(tài)位點,平均約每1kb就會有1個SNP(FrazerK.A.,BallingerD.G.etal.Asecondgenerationhumanhaplotypemapofover3.1millionSNPs.Nature,2007,449(7164):851-861;WangJ,WangWetal.ThediploidgenomesequenceofanAsianindividual.Nature,2008,456(7218):60-65);KristenL將SNP標(biāo)記作為判斷染色體重組事件的最小單位(recombinationbin),判斷子代每個bin來源于父母本的情況,得到每個子代的全基因組物理圖譜,從而構(gòu)建出Bin圖譜,用于后續(xù)高精度遺傳連鎖圖譜構(gòu)建和QTL定位(KristenLKump,PeterJBradburyetal.Genome-wideassociationstudyofquantitativeresistancetosouthernleafblightinthemaizenestedassociationmappingpopulation[J].NatureGenetic,2011,43(2):163-168);Yu應(yīng)用全基因組重測序?qū)?41株水稻RILs群體進行低深度測序,以SNP為基礎(chǔ)構(gòu)建Bin圖譜,Bin圖譜具有超高密度,能夠檢測到更多的QTL,同時檢測到的QTL也更加精細(YuH,XieW,WangJ,etal.GainsinQTLdetectionusinganultra-highdensitySNPmapbasedonpopulationsequencingrelativetotraditionalRFLP/SSRmarkers[J].PLoSONE,2011,6(3):e17595);Xu通過對水稻親本9311的高深度測序和128個CSSLs低深度的重測序,構(gòu)建了一張高密度的Bin圖譜,檢測到了768萬個SNP位點,這128個CSSL攜帶了259個染色體代換片段(XuJ,ZhaoQ,DuP,etal.Developinghighthroughputgenotypedchromosomesegmentsubstistutionlinesbasedonpopulationwhole-genomere-sequencinginrice(OryzasativaL.)[J].BMCGenomics,2010(11):625);范術(shù)麗利用由355個陸地棉構(gòu)成的種質(zhì)群體,采用SLAFSEQ測序通過全基因組關(guān)聯(lián)研究(GWAS)進行線性模型(GLM)和混合線性模型(MLM)分析,在群體中共獲得81675個SNP位點,最終確定11個與早熟性狀相關(guān)的SNP有11個,并在3號染色體上定位1個與早熟性狀相關(guān)的候選基因并進行了驗證(Sunetal.IdentificationoffavorableSNPallelesandcandidategenesfortraitsrelatedtoearlymaturityviaGWASinuplandcotton.BMCGenomics,2016(17):687);王曉歌以耐鹽陸地棉品種中9409為材料,通過轉(zhuǎn)錄組數(shù)據(jù)進行SNP,并進行GO和Pathway注釋,從對照和鹽脅迫處理中分別檢測到SNP為12659個和16871個,其中對照特有的SNP為2102個,鹽脅迫后樣品特有SNP為4547個,GO注釋分析發(fā)現(xiàn)檢測到的SNP在分子功能、細胞組分、生物進程富集的比例基本一致,而鹽脅迫后樣品特有SNP在每個分類中的基因比例都明顯大于前三個(Wangetal.MiningandAnalyzingofSNPRelatedtoSalinityStressinTranscriptomeofUploadCotton(GossypiumhirsutumL.).MolecularPlantBreeding,2016,14:1524-1532);Zhu通過陸地棉重組自交系群體構(gòu)建了全基因組SNP連鎖圖譜,找到2618個多態(tài)性SNP標(biāo)記,其中有16個穩(wěn)定的QTLs存在兩個環(huán)境中,12個QTL涉及多性狀,這些QTLs主要分布在5,9,10,14,19,和20號染色體上(LiC,ZhuSJetal.Genome-WideSNPLinkageMappingandQTLAnalysisforFiberQualityandYieldTraitsintheUplandCottonRecombinantInbredLinesPopulation.FrontiersinPlantScience,2016,7(218))。袁有祿利用一個異常棉高強纖維漸滲系7235和陸地棉遺傳標(biāo)準(zhǔn)系TM-1為親本構(gòu)建了F2、F2:3分離群體,鑒定了一個可以在中國的不同棉區(qū)及美國等多個環(huán)境中均能檢測到主效QTL,可解釋30%以上的表型變異(袁有祿等,棉花高品質(zhì)纖維性狀QTLs的分子標(biāo)記篩選及其定位,遺傳學(xué)報,2001,28(12):1151-1161);石玉真以黃河流域廣泛種植的轉(zhuǎn)基因抗蟲棉品種sGK321和sGK9708(中41)為輪回親本,分別與優(yōu)質(zhì)豐產(chǎn)品種太121和高纖維品質(zhì)漸滲種質(zhì)系7235雜交的F1代材料雜交并回交,配置了雜交回交組合兩套,運用與一個已定位的高強纖維QTL緊密連鎖的2個SSR標(biāo)記,這2個標(biāo)記在不同的遺傳背景,經(jīng)過多代雜交、回交和自交后,能夠穩(wěn)定遺傳而且QTL的效應(yīng)穩(wěn)定,并運用此項技術(shù)結(jié)合其它手段進行優(yōu)質(zhì)、抗蟲等基因的聚合育種研究,快速有效地改良現(xiàn)有的陸地棉推廣品種,創(chuàng)造高產(chǎn)、優(yōu)質(zhì)、抗蟲棉花新材料或新品系(石玉真等,與棉花纖維強度連鎖的主效QTL應(yīng)用于棉花分子標(biāo)記輔助育種,分子植物育種,2007,5(4):521-527));孫福鼎以0-153和黃河流域推廣的抗蟲棉品種中棉所41選系sGK9708為親本雜交,通過F2:6的單株選擇,構(gòu)建了一套含有196個系的陸地棉F6:8重組自交系群體,并進行了兩年三點四個環(huán)境(07年安陽、08年安陽、曲周、臨清)的重復(fù)試驗,篩選多環(huán)境穩(wěn)定表達的主效QTLs,采用復(fù)合區(qū)間作圖法檢測到與纖維強度相關(guān)的QTL共7個,采用基于混合線性模型的復(fù)合區(qū)間作圖法檢測與纖維強度相關(guān)的互作QTL2對(孫福鼎等,陸地棉重組自交系群體纖維品質(zhì)及產(chǎn)量性狀遺傳變異分析,棉花學(xué)報,2010,22(4):319-325);Jamshed利用重組自交系(RIL)群體構(gòu)建遺傳圖譜,定位到47個QTL在多個環(huán)境下穩(wěn)定,這些QTL多以聚合群的形式存在,控制兩個或兩個以上的性狀,這些QTL主要集中在4、7、14、25號染色體(Jamshedetal.Identificationofstablequantitativetraitloc(QTLs)forfiberqualitytraitsacrossmultipleenvironmentsinGossypiumhirsutumrecombinantinbredlinepopulation[J].BMCGenomics,2016,17:197);Zhang等通過兩個陸地棉品種0–153和SGK9708構(gòu)建的重組自交系群體利用SLAF序列構(gòu)建了有5521個單核苷酸多態(tài)性標(biāo)記,覆蓋總距離為3259.37cM的高密度遺傳圖譜(Zhangetal.Constructionofahigh-densitygeneticmapbyspecificlocusamplifiedfragmentsequencing(SLAF-seq)anditsapplicationtoQuantitativeTraitLoci(QTL)analysisforbollweightinuplandcotton(Gossypiumhirsutum.).BMCPlantBiology,2016,16:79)??傊琒NP標(biāo)記是目前最具發(fā)展?jié)摿Φ姆肿訕?biāo)記,目前已得到廣泛的應(yīng)用,但在棉花中的應(yīng)用還較少,前人的研究中多數(shù)是利用分離群體如F2、BC1,遺傳背景復(fù)雜,或只在單個環(huán)境下檢測得到的結(jié)果,因此缺乏可靠性和穩(wěn)定性,多環(huán)境穩(wěn)定的QTL少,且有些研究最初的目的只是為了進行目標(biāo)基因的定位。技術(shù)實現(xiàn)要素:本發(fā)明所要解決的技術(shù)問題是:通過篩選出一種與陸地棉纖維強度基因緊密連鎖且在多個環(huán)境下表現(xiàn)穩(wěn)定的SNP分子標(biāo)記,將這些SNP分子標(biāo)記應(yīng)用于棉花纖維品質(zhì)的輔助選擇,可以盡快提高我國棉花品種的纖維品質(zhì)水平。本發(fā)明提供的技術(shù)方案是:一種與陸地棉纖維高強度基因連鎖的SNP標(biāo)記,定位在與纖維強度相關(guān)的8個QTL中,其中有4個在多環(huán)境下檢測穩(wěn)定,這些QTL都位于6號染色體,有3個能夠篩選得到分型較好的SNP標(biāo)記;其中與qFS-chr06-2連鎖的SNP標(biāo)記為CRI-SNP-198773;與qFS-chr06-4連鎖的SNP標(biāo)記為CRI-SNP-198774;與qFS-chr06-7連鎖的SNP標(biāo)記為CRI-SNP-198775、CRI-SNP-198776、CRI-SNP-198777、CRI-SNP-198778、CRI-SNP-198779、CRI-SNP-198780、CRI-SNP-198781、CRI-SNP-198782、CRI-SNP-198783,(其中CRI:CottonResearchInstitute代表中國農(nóng)業(yè)科學(xué)院棉花研究所;SNP代表標(biāo)記類型;數(shù)字代表標(biāo)記開發(fā)順序),所述的SNP分子標(biāo)記在染色體上的位置和突變堿基如下表所示:標(biāo)記名稱SNP位點突變堿基CRI-SNP-19877311830437C/GCRI-SNP-19877415961930G/ACRI-SNP-19877598819023T/CCRI-SNP-19877698819766A/TCRI-SNP-19877798819351G/TCRI-SNP-19877898945368C/TCRI-SNP-19877998946829A/CCRI-SNP-19878098956931T/CCRI-SNP-19878199015203A/TCRI-SNP-19878299050013A/CCRI-SNP-19878399015209T/C本發(fā)明中,QTL命名參考McCouch等(1997)在水稻中的命名規(guī)則,以q+性狀+連鎖群+QTL個數(shù)的形式表示。(McCouchSR,ChoYG,YanoM,etal.ReportonQTLnomenclature,RiceGenetNewslett.,1997,14:11-13),例如qFS-chr06-2表示定位到6號染色體與纖維強度相關(guān)的第二個QTL。本發(fā)明所述的SNP標(biāo)記可通過SNP基因分型實驗有效地區(qū)分不同SNP位點與不同基因型,從而可對不同棉花樣品進行篩選,可篩選出纖維強度高的株系,大大縮短育種周期,提高棉花纖維強度的育種效率。同時,本發(fā)明還提供一種與陸地棉纖維強度的三個QTLqFS-chr06-2、qFS-chr06-4、qFS-chr06-7連鎖的SNP標(biāo)記的篩選方法,包括如下步驟:(1)利用大田推廣的陸地棉栽培品種中棉所41選系SGK9708和具有亞洲棉高強纖維基因的陸地棉優(yōu)異品系0-153為親本構(gòu)建F2和F2:3群體;(2)F2:3群體家系內(nèi)每世代自交,在F2:6世代進行一次單株選擇,再種植兩代到F6:8,把F6:8及以后的世代作為重組自交系群體進行多年多點實驗;(3)提取重組自交系群體和親本的DNA;具體方法參考以下文獻,(宋國立,改良CTAB法快速提取棉花DNA,棉花學(xué)報,1998,10(5):273-275);(4)構(gòu)建連鎖圖譜:對檢測的各樣品基因組DNA進行酶切實驗,對得到的酶切片段(SLAF標(biāo)簽)進行3’端加A處理,連接Dual-index測序接頭,PCR擴增、純化、混樣、切膠選取目的片段,測序,對測序結(jié)果用軟件進行遺傳圖譜的構(gòu)建(ZhangJ,GuoWZ,ZhangTZ.Molecularlinkagemapofal-lotetraploidcotton(GossypiumhirsutumL.×Gossypiumbar-badenseL.)withahaploidpopulation.TheorApplGenet,2002,105:1166–1174);(5)纖維強度QTL定位:進行多環(huán)境穩(wěn)定的纖維強度主效QTLs篩選,可得到上述的3個多環(huán)境穩(wěn)定的纖維強度主效QTLs及其連鎖標(biāo)記。本發(fā)明的有益效果如下:本發(fā)明涉及的與多環(huán)境穩(wěn)定的高強纖維主效基因有關(guān)的位點共有3個(qFS-chr06-2、qFS-chr06-4、qFS-chr06-7),通過篩選與棉花高強纖維主效基因緊密連鎖且在多個環(huán)境下表現(xiàn)穩(wěn)定的SNP標(biāo)記,將這些SNP標(biāo)記應(yīng)用于棉花纖維品質(zhì)的輔助選擇,QTL定位結(jié)果可靠,可以盡快提高我國棉花品種的纖維品質(zhì)水平。qFS-chr06-2能在5個環(huán)境下(2007年安陽、2008年臨清、2008年曲周、2009年安陽、2010年高邑)檢測到,可解釋的表型變異為5.45~12.16%,加性效應(yīng)值為0.57~0.97cN/tex;qFS-chr06-4能在9個環(huán)境下(2007年安陽、2008年曲周、2009年安陽、2009年曲周、2009年阿克蘇、2010年安陽、2010年高邑、2010年鄭州、2013年安陽)檢測到,可解釋的表型變異為5.38~16.34%,加性效應(yīng)值為0.56~1.04cN/tex;qFS-chr06-7能在4個環(huán)境下(2008年安陽、2008年曲周、2009年阿克蘇、2010年鄭州)檢測到,解釋的表型變異為6.50~11.60%,加性效應(yīng)值為-1.02~-0.81cN/tex。本發(fā)明利用重組自交系F6:8(RIL)篩選出穩(wěn)定的纖維強度QTLs及其緊密連鎖的分子標(biāo)記,所述SNP分子標(biāo)記是以棉花穩(wěn)定的RIL群體為材料,通過基因組重測序的方法得到,利用與這些QTL緊密連鎖的分子標(biāo)記篩選出纖維強度得到提高的株系,進行分子標(biāo)記輔助育種選擇,可大大縮短育種周期,提高棉花纖維強度的育種效率。附圖說明圖1是通過基因組重測序得到的總圖距為5197.17cM的遺傳圖譜。圖2是在6號染色體上與強度連鎖的QTLs的位置圖,其中多環(huán)境穩(wěn)定且能篩選到SNP標(biāo)記的有3個,分別為qFS-chr06-2、qFS-chr06-4、qFS-chr06-7。具體實施方式下面通過具體實施方式的詳細描述來進一步闡明本發(fā)明,但并不是對本發(fā)明的限制,僅僅作示例說明。(1)重組自交系F6:8的獲得2007年-2008年的田間種植和DNA的提取請見專利申請公開號:CN101613761A,發(fā)明名稱:與棉花纖維強度主效基因連鎖的SSR標(biāo)記的專利申請文件。2009年分別于河南安陽中國農(nóng)業(yè)科學(xué)院棉花研究所試驗站,中國農(nóng)業(yè)大學(xué)曲周試驗站和新疆阿克蘇德佳科技種業(yè)有限公司試驗站種植親本和F6:10群體。安陽和曲周采用單行區(qū),5米行長,行距分別為0.8m和(0.8+0.5)m,每行20株;新疆采用6行區(qū),2米行長,每行15株。2010年分別于河北高邑原種場,河南安陽中國農(nóng)業(yè)科學(xué)院試驗站和河南鄭州種植親本和F6:11群體,安陽和鄭州采用單行區(qū),行長5m,行距0.8m;高邑采用單行區(qū),行長4m,寬窄行(0.8+0.6)m。上述各個試點都采用不完全隨機區(qū)組設(shè)計,種植兩個重復(fù)。9月中下旬進行田間取樣,按家系收花,取12g左右的纖維樣品進行纖維品質(zhì)的測定。(2)提取重組自交系群體和親本的DNA。(3)選擇以中國農(nóng)業(yè)科學(xué)院棉花研究所提供的棉花四倍體基因組序列為參考基因組進行電子酶切預(yù)測(LiFG,FanGY,LuCR,XiaoGH,ZouCS,KohelRJ,MaZY,ShangHH,MaXF,WuJH,etal.GenomesequenceofcultivatedUplandcotton(GossypiumhirsutumTM-1)providesinsightsintogenomeevolution.NatureBiotechnology,2015,33(5)),最終選擇HaeIII+SspI酶,酶切標(biāo)率為98.61%,共得到495.48Mreads,酶切片段長度在364-414bp的序列定義為SLAF標(biāo)簽。(4)根據(jù)選定的最適酶切方案,對檢測的各樣品基因組DNA進行酶切實驗,對得到的酶切片段(SLAF標(biāo)簽)進行3’端加A處理,連接Dual-index測序街頭,PCR擴增、純化、混樣、切膠選取目的片段,文庫質(zhì)檢合格后用IlluminaHiseqTM2500進行測序。(5)利用Dual-index對測序得到的原始數(shù)據(jù)進行識別,得到各個樣品的reads。通過reads間聚類的方法,在親本和子代中開發(fā)SLAF標(biāo)簽。(6)通過生物信息學(xué)分析,共得到321797個SLAF標(biāo)簽,其中多態(tài)性的SLAF標(biāo)簽共有35300個。(7)對多態(tài)性的SLAF標(biāo)簽進行基因型編碼,基因型編碼規(guī)則為遺傳學(xué)通用的2等位編碼規(guī)則,如某標(biāo)記的親本基因型為aa(父本)和bb(母本),子代基因型ab則表示該樣品在這個標(biāo)記的編碼類型為雜合,其中有一個基因型來自于父本,有一個基因型來自于母本。(8)為保證遺傳圖譜質(zhì)量,SLAF標(biāo)簽按照父母本測序深度10x以下、完整度低于30%、嚴(yán)重偏分離(p-value<0.05)、親本雜合、同時比對到兩套基因組的條件進行過濾,共篩選出的7958個SLAF標(biāo)簽。(9)通過與參考基因組的定位將SLAF標(biāo)簽分為26個連鎖群,計算高質(zhì)量分子標(biāo)簽間的LOD值,通過LOD值進行連鎖分群,對每個連鎖群采用HighMap軟件進行遺傳圖譜的構(gòu)建,通過校正,得到總圖距為5197.17cM的遺傳圖譜(如圖1所示)。其中HighMap軟件由北京百邁克生物科技公司自主研發(fā)。(10)基于SLAF的測序數(shù)據(jù),通過BWA與兩個2倍體棉花的參考基因組比對,得到與親本之間有多態(tài)性的SNP有44583個,通過質(zhì)量過濾后,在圖譜上定位得到10440個SNP標(biāo)記。(11)采用軟件QTLIciMappingV4.0(http://www.isbreeding.net/software/)和軟件WinQTLCart2.5,通過11個環(huán)境(2007年安陽、2008年安陽、2008年臨清、2008年曲周、2009年安陽、2009年曲周、2009年阿克蘇、2010年安陽、2010年高邑、2010年鄭州、2013年安陽)纖維強度性狀的表型數(shù)據(jù)和基因型數(shù)據(jù),進行纖維強度性狀的多環(huán)境QTL定位分析,共得到與強度相關(guān)的QTL共8個,其中多環(huán)境穩(wěn)定且篩選到SNP標(biāo)記的有3個(QTL在染色體上的位置如圖2所示),將這些得到的QTL與SNP標(biāo)記進行關(guān)聯(lián)分析,最終篩選得出與纖維強度分型明顯的SNP標(biāo)記,其中與qFS-chr06-2連鎖的SNP標(biāo)記為CRI-SNP-198773;與qFS-chr06-4連鎖的SNP標(biāo)記為CRI-SNP-198774;與qFS-chr06-7連鎖的SNP標(biāo)記為CRI-SNP-198775、CRI-SNP-198776、CRI-SNP-198777、CRI-SNP-198778、CRI-SNP-198779、CRI-SNP-198780、CRI-SNP-198781、CRI-SNP-198782、CRI-SNP-198783。當(dāng)前第1頁1 2 3 當(dāng)前第1頁1 2 3