專利名稱::用于甘蔗屬復合組的基于微衛(wèi)星的指紋分析系統(tǒng)的制作方法
技術領域:
:本發(fā)明涉及甘蔗屬復合組成員(accession)的分子分析。本發(fā)明涉及甘蔗(^cc/^n^1spp.)的微衛(wèi)星及其側(cè)翼序列、微衛(wèi)星分離的方法、適于使用這些序列進行指紋分析的方法以及可以用于如下應用的方法甘蔗屬復合組成員的鑒定、種質(zhì)收集物的管理、祖先的選擇、品種之間的鑒別、雜交體的鑒定、需要的基因組序列的基因滲入、親子關系的確定、基因和數(shù)量性狀基因座(QTL)的作圖和MAS(標記輔助的選擇)程序的開發(fā)。
背景技術:
:對可再生能源的尋找將甘蔗置于世界農(nóng)作物中的突出的位置。從這種多年生禾本科植物的多汁莖中提取的汁液分別占全球糖和乙西f生產(chǎn)的75%和30%以上(Ming等人,2006,P/""fi^v.27:15-118;Orellana禾口BonalumeNeto,2006,iVfl^5zo^c/mo/.24:232)。隨著全球?qū)τ谝掖嫉男枨蟮脑鲩L,甘蔗種植正在向新的地區(qū)擴展,而且對于更高的田間產(chǎn)量具有持續(xù)的需求(Thomas和Kwong,2001,尸o/—29:1133-1143;Geller等人,2004,五臟g少尸o/一32:1437-1450;Gantz,2005,i^wewaZ^Fwe/A^ws17(27):1-6)。與改良的品種一樣,需要適應新環(huán)境的新品種和改進的栽培技術,以提高糖和生物質(zhì)的產(chǎn)量。在全世界范圍內(nèi)已經(jīng)利用幾個育種程序進行了甘蔗的遺傳改良和用于粗放耕作的品種的開發(fā)(Tew,1987,7Vewr"r/^'esIn:HeinzDJ(編著)5Y^arcawe/m/rove附e"ZArowg/j^Breec^wg)ElsevierPress,Amsterdam:559-592;Machado,2001,6V/g"m3tweFia"'e(y/w^7za"'owa/Z)zVe"or少〃第7版)??傊?,目前通過超過一個世紀的主要基于種質(zhì)交換和育種技術發(fā)展的常規(guī)育種獲得的結(jié)果,已經(jīng)允許農(nóng)作物在熱帶和亞熱帶地區(qū)廣泛地種植,而且在甘蔗和糖產(chǎn)量方面已經(jīng)產(chǎn)生了連年的持續(xù)增長(Hogarth等人,1977,Swg^cawe/mprovemewt/os^ac/n'eve厳她朋t//"Zwre/7my/ec^yIn:ManjitSK(編著)7m/rove附ewf/or2/"Ce她r乂LouisianaStateUniversity,Louisiana:29-55;Miocque和Machado,1977,/■40:9-13;Heinz和Tew,1987,場6"Wza"'owjoracedwms1In:HeinzDJ(編著)iSwgarcawe//w/rovemewf//zrowg/Sreecf/wg,ElsevierPress,Amsterdam:313-342;Matsuoka等人,1999,她Mc(ra膨w^<ieca打a-tie-ac^carIn:Bor6mA(編著)Me/Zzoramew^ocfees/^c^cw/"vac/叫ImprensaUniversitaria,V—sa:205-251;Berding等人,2000,Jdv"wcejz'w/ec/wo/ogy/orwgam2weIn:KeatingBA和WilsonJ(編著)/"&w57've^Mg^cawe^VWwWow.'MeedwgC7^/ewgesZ)e戸d2,,CABIPublishing,UK:141-156;Edm6等人,2005,C,.Sd.45:92-97;Jackson,2005,O,M92:277-290)。甘蔗屬于禾本科(Poaceae)、蜀黍族(tribeAndropogoneae)、甘蔗屬,公認具有6個種熱帶種(q僑d"an/m)、大莖野生種(<S.r06wW謂)、印度種(&Z^erO、中國種(51.wVzewse)、纟田莖野生種^ow^meww)和野生肉質(zhì)花穗種edw/e)。印度種和中國種被認為是熱帶種和細莖野生種之間的天然的雜交體,而熱帶種起源于其發(fā)源地新幾內(nèi)亞巴布亞島(Papua,NewGuinea)中心的大莖野生種的野生群體。如蔗茅屬(五h"w^w)、硬蔗草屬(^/ems/ac/z")、河八王屬(iV^ewgG)和芒屬(McawAi^)的其它屬在種系發(fā)生學上與甘蔗相關,它們一起形成"甘蔗屬復合組"(Daniels和Roach,1987,r"jcowo,aweevo/w"owz'wswgarcaweIn:HeinzDJ(編著)Swg^rcawe7m/rov,ewf萬reed/wg,ElsevierPress,Amsterdam:7-84)。目前的品種是由主要涉及熱帶種、細莖野生種、印度種和中國種這4個種的初始種間雜交產(chǎn)生的雜交體(Irvine,1999,T7^or々少/.98:186-194)。甘蔗雜交體的基因組的主要部分來自富含糖的著名的熱帶種甘蔗(80%),10-15%來自適應環(huán)境應激且耐受病蟲害的鄉(xiāng)間細莖野生種甘蔗,很少一部分是雜交染色體(D'Hont等人,1996,Mo/.G饑G匿t250:405-413;Price,1957,嵐118:146-159;Roach,1969,尸亂MSoc.5"w,C羅rec/mo/.13:901-920)。大部分品種在一定程度上彼此相關,因為它們來自20世紀早期在爪哇(印度尼西亞)和印度進行的同樣的初始雜交。從已知的譜系量化的雜交體的遺傳基礎局限于一小群熱帶種克隆,且^艮少來自其它種(Arcenaux,1967,尸rac./wtSoc./SwgarcaweT^c/mo/.12:844-854;Tew,1987,臉wIn:HeinzDJ(編著)S,廠c騰/,n9ve膨WAroMg7j5re^.wg,ElsevierPress,Amsterdam:559-592)。但是,由于甘蔗屬的多倍性本質(zhì)加上出現(xiàn)于種間雜交體中的非整倍性,通過分子方法評估的遺傳多樣性仍然較高(Jannoo等人,1999,77leor.々p/.99:171-184)。熱帶種的真正克隆具有2n=80(x二10)的基本染色體數(shù),而細莖野生種具有2n=40-128(x4)的染色體數(shù)。由于在甘蔗的早期遺傳改良中發(fā)生的轉(zhuǎn)移過程(nobilisationprocess)(與熱帶種的反復的回交)中出現(xiàn)的非整倍性,雜交體的總?cè)旧w數(shù)可能在100-130之間變化(Bremer,1961,五w;/^"ca10:59-78)。商業(yè)品種的培育可能要花費12-15年才能完成一個周期,新性狀的滲入(introgression)可能需要幾十年時間(Skinner等人,1987,5Wec"oww"/io叔cr"m'a朋dzWz.cmIn:HeinzDJ(編著)5^garc朋e/mprovemeW/Arawg^&ee<i/"g,ElsevierPress,Amsterdam:409-452)。由種間雜交產(chǎn)生的祖先中的等位基因的高度雜合性(heterosigozity)、多倍性和非整倍性以及如田間表現(xiàn)、糖累積、纖維含量和病蟲害耐受性等最重要的性狀的定量遺傳本質(zhì),使得后代的表現(xiàn)非常不可預測(Hogarth,1987,Cewe"cso/5^gorca"eIn:HeinzDJ(纟扁著)Swgarctme/附provemewfArowg7jElsevierPress,Amsterdam:255-271;Grivet和Arruda,2001,C群.O—.腸/.5:122-127;Hoarau等人,2002,7T^orj/7/7/.105:1027-1037;Ming等人,2006,尸/福3,《細.27:15-118;Wei等人,2006,77亂柳/.114:155-164)。需要涉及親代測試的大量的雜交來筌定良好的對,而且篩選計劃包括大的原始群體。為了克服這些瓶頸問題,育種人員已經(jīng)在開發(fā)在品種選擇的幾個階段使用的DNA標記,增加發(fā)現(xiàn)良好的親本的機會,并減少開發(fā)的時間和費用(Butterfield等人,2004,&單《/組70:167-172;Manners等人,2004,尸,o匿力,o/Ae,/她na"'o朋/CVo/5WewceCowgmsivCasu等人,2005,F(xiàn)/e/dCVo/92:137-147;Mclntyre等人,2005,Mo/5廠ee乂16:151-161;Moore,2005,/"f.Swgar/107:27-31;Aitken等人,2006,Z7eor.j/p/.GewC112:1306-1317)。微衛(wèi)星,也稱為簡單序列、簡單序列重復(SSR)、簡單重復DNA序列、短串聯(lián)重復(STR)或簡單序列基序(SSM),是在每種活生物體的基因組的編碼區(qū)和非編碼區(qū)發(fā)現(xiàn)的DNA段(stretches)。它們由許多串聯(lián)重復的短核苷酸基序或重復單位組成。微衛(wèi)星由1-6個串聯(lián)重復的核苷酸單元形成,在基因組染色體拷貝之間其長度變化,且可以通過PCR(聚合酶鏈反應)檢測,并通過不同的色譜方法顯現(xiàn)為由大小不同的擴增DNA片組成的條碼系統(tǒng)。微衛(wèi)星的特征是它們是高度多態(tài)性的。即,每個微衛(wèi)星"基因座,,可能具有許多根據(jù)多倍性的值(染色體拷貝數(shù))而變化較大的"等位"形式。多態(tài)性STR基因座是每種生物體中對于鑒定、親子關系檢測和遺傳學作圖非常有用的標記。多態(tài)性是微衛(wèi)星的一個特征,極大地有助于其在指紋分析中的實用性。最初描述了人類中的樣i衛(wèi)星(Litt和Luty,1989,爿肌G潔t44:397-401),后來描述了如小鼠(Love等人,1990,M/c/.爿"'^i仏18(14):4123-4130)、豬(Johansson等人,1992,丄i/w^Z.83(3):196-198)和牛(Kemp等人,1993,爿mwfl/24:363-365)等其8它哺乳動物種中的微衛(wèi)星。在人類中,微衛(wèi)星的多態(tài)性已被廣泛地用于個體鑒定,例如,在親子關系和法醫(yī)案例中,以及用于與遺傳疾病相關的基因的作圖中。例如,Caskey等人的美國專利第5,364,759號公開了用于法醫(yī)和醫(yī)學目的的人類個體指紋分析的定型分析,以及從DNA數(shù)據(jù)庫鑒定微衛(wèi)星序列的技術。也公開了具有適于包含于DNA序型分析中的特征的存在于人類基因組中的特定三聚和四聚短串聯(lián)重復(STR)。Weber的美國專利第5,582,979號提供了從人類基因組DNA分離的多種具體的序列,其側(cè)面為CA和GT二核苷酸重復,用于利用重復區(qū)域的多態(tài)性的法醫(yī)和親子關系檢測。Perlin的美國專利第5,580,728號公開了使用含有顯示DNA樣品之間多態(tài)性的重復序列的擴增DNA序列的基因型分型方法和自動化系統(tǒng)。該專利描述了使用短串聯(lián)重復(STR)的自動數(shù)據(jù)獲取和解釋技術和基于這樣的聚合酶鏈反應(PCR)擴增的標記建立遺傳圖譜所需的步驟。Buard等人的美國專利第5,573,912號描述了以下方案使用大小分離的限制性內(nèi)切酶消化物從DNA獲得新的短串聯(lián)重復區(qū)域,接著與相同種的基因組DNA雜交,并將雜交譜與使用含有可變串聯(lián)重復區(qū)域的已知探針獲得的雜交譜進行比較。沒有公開直接用于基因型分型的具體序列。Polymeropoulos等人的美國專利第5,369,004號和第5,378,602號公開了適合作為用于醫(yī)學目的和遺傳學作圖的人類DNA重復多態(tài)性檢測的PCR(聚合酶鏈反應)引物的具體序列。Navot等人的美國專利第5,650,277號公開了一種確定微衛(wèi)星中寡核苷酸重復的確切數(shù)目的方法,其中,每個重復長2個或3個核苷酸。該專利沒有記載任何具體引物,而需要以前對于微衛(wèi)星中的重復序列或微衛(wèi)星側(cè)翼序列的確定。微衛(wèi)星已被用于包括水稻、玉米、大豆、大麥和番茄的各種植物的基因組作圖,因而成為制作基因組圖譜的重要工具。Zhao等人,1996,in4PP"ca"o/wo/re/e"'"》ese《wewces//awfgewoweawa/戸、In:PatersonAH(編著)Ma/7/7Z"g尸/aw&,R.G.LandesCo.,NewYork:111-125公開了DNA重復基序在植物基因組作圖中的應用的綜述。除了遺傳學作圖,微衛(wèi)星還可以用于物理作圖。例如,某些類型的重復可以顯示在染色體上的特異性分布(Schmidt和Heslop-Harrison,1996,尸麼.淑/.」c"d,93(16):8761-8765),因而不同的微衛(wèi)星可以用于基因組的不同區(qū)域的物理作圖。微衛(wèi)星也已經(jīng)用于許多農(nóng)作物的指紋分析,以及評估植物栽培品種、亞種之間的遺傳多樣性等。微衛(wèi)星的主要優(yōu)勢在于它們甚至在種內(nèi)和栽培品種之內(nèi)也經(jīng)常是高度多態(tài)性的。另外,微衛(wèi)星的側(cè)翼序列通常是基因座特異性的,因而提供了用于可靠地分離該基因組區(qū)域的特異性引物。微衛(wèi)星在植物鑒定中的應用的例子包括葡萄藤栽培品種鑒定和栽培品種的遺傳關聯(lián)性的評估(Thomas等人,1994P/a^Mo/.25(6):939-949);為了天然種群中的共同親本鑒定野生薯蕷的個體(Terauchi和Konuma,1994,G譜,37(5):794-801);芥菜種質(zhì)的品種鑒定(Bhatia等人,1995,臉"—固^16(9):1750-1754);鷹嘴豆品種的鑒定(Sharma等人,1995,o固's16(9):1755-1761);玉米栽培品種種質(zhì)遺傳分析(Tammino和Tingey,1996,GWzome39(2):277-287);和水稻遺傳多樣性的栽培品種內(nèi)變異的評估(Olufowote等人,1997,G譜膨40(3):370-380)。正在越來越多地使用微衛(wèi)星標記,以通過連鎖分析在植物基因組中定位特異的、經(jīng)濟上有用的基因。例如,通過聚合酶鏈反應(PCR)擴增和微衛(wèi)星多態(tài)性的連鎖分析,利用STR對靠近水稻Rfl基因(一種對于雜交水稻生產(chǎn)不可缺少的育性恢復基因)的微衛(wèi)星標記作圖(Akagi等人,1996,Gewome39(6):1205-1209)。該標記不僅可用于培育育性恢復系和保持系,而且可用于控制雜交水稻種子的純度。微衛(wèi)星是一類如上所述的基于DNA的分子標記,通常在植物改良中用于基因和性狀作圖和隨后的MAS(標記輔助的選擇)程序的開發(fā)(Rakoczy-Trojanowska和Bolibok,2004,CW/Mo/.楊/.丄說9:221-238;Varshney等人,2005,71823:48-55)。由于標記和區(qū)分種群共有的特異性基因組區(qū)域的能力,微衛(wèi)星用作區(qū)分個體的指紋分析系統(tǒng)。在植物育種計劃中,微衛(wèi)星和其它DNA標記已被成功地用于種質(zhì)收集物的鑒定、分類和管理、親本選擇、品種區(qū)別、需要的性狀的'滲入和親子關系的確定(Lee,1995,55:265-344;Eagles等人,2001,Xgnc.版52:1349-1356;Kirst等人,2005,T^mc/.96:161-166),而且經(jīng)UPOV(植物新品種保護協(xié)會)的審查成為用于涉及所有權問題的品種鑒定的支持性鑒別工具(UPOV2005)。UPOV通過被稱為區(qū)別性、均勻性和穩(wěn)定性(DUS)測試的標準化程序評估調(diào)整的描述信息(descriptor)。滿足DUS測試的要求的分子標記在UPOV考慮下,可用于與植物育種人的權利的實施相關的品種鑒定、技術檢驗和必要的推導的考慮因素。甘蔗改良中由種間或?qū)匍g雜交產(chǎn)生的雜交后代在可以用于滲入研究之前,其-驗證是必需的(Lee等人,1998,爿w"A"49:915-921)。甘蔗雜交體鑒定的傳統(tǒng)的形態(tài)學方法是不可靠的,因為難以區(qū)分真正的雜交體與自花授粉后代或由花粉混雜產(chǎn)生的后代。分子標記提供了鑒定真正的雜交體的可靠的方法。甘蔗親本的選擇一般包括潛在候選物的初始測試,其中,通過特定的育種程序的常規(guī)選擇方案評估雙親本雜交或多向雜交產(chǎn)生的少量的后代或家族(Heinz和Tew,1987,場ZnVfc""ow/^ocedwmsIn:HeinzDJ(編著)6Yfgarca"e/m戶廠ovemewf,Anwg/z5reed/"g,ElsevierPress,Amsterdam:313-342)。那些產(chǎn)生優(yōu)良個體的雄性和雌性的成對組合成為證實的親本。然后重復同樣的雜交以產(chǎn)生大量的后代用于品種選擇。在多向雜交中,在第一階段只可證明母本,但可以在發(fā)現(xiàn)正確的父本之前測試幾個雄性。因此,多向雜交在理i侖上具有更高的揭示證實的親本的可能性,而雙親雜交可以常少見且大量地進行,具有顯示優(yōu)良個體的優(yōu)勢。在多向雜交系統(tǒng)中育種人員可以盡快地鑒定所選擇的克隆的父本,這可以減少開發(fā)新品種的時間和花費,而且對于實現(xiàn)改良的程度應當具有明顯的影響(Buteler等人,1997,96:353-361)。確定親子關系的方法非常重要,因為在甘蔗中育種效率非常低;例如,從1970年直到1989年,在巴西的IAA/PlanalSucar育種計劃中,從評估的7.000.000林幼苗中只有不到0.0003%的后代被開發(fā)為商業(yè)品種。甚至在大多數(shù)用于育種計劃的優(yōu)良親本之間進行全部的雜交組合實際上也是不可能的。傳統(tǒng)上,使用只有一個母本和只有一個父本的雙親雜交。經(jīng)常使用的其它策略是開放授粉中只涉及一個母本和8-40個父本的多親本雜交(或多向雜交)。多向雜交方法已被用于甘蔗育種,以使處于幼苗測試階段的后代中代表的雜交組合數(shù)最大化。反對使用多向雜交方法的主要理由是幼苗產(chǎn)生過程中發(fā)生譜系信息的快速丟失。提出了基于微衛(wèi)星的親子關系分析作為鑒定由多向雜交產(chǎn)生的后代的父本的有效方法。在某些例子中,確認母本也是必需的。在雜交之前根據(jù)活花粉的百分比將甘蔗祖先分為父本或母本。通常雄性比雌性具有生存能力更強的花粉,但自花授粉不能被自然的自交不親和性機制完全避免,預期其會發(fā)生,盡管其水平未知。可預知自花授粉產(chǎn)生的后代具有較低的活力,因而高水平的自殖可能影響高水平的家族的性能,掩蓋祖先的育種價值。量化雜交中的自殖水平的標記方法是基于鑒定或不鑒定后代樣品中的父本特異性等位基因(Mclntyre和Jackson,2001,五w;/^"ca117:245-249)。用一組基因座對一定數(shù)量的幼苗進行基因型分型,那些沒有父本特異性等位基因的幼苗被認為是自花授粉的產(chǎn)物。開發(fā)微衛(wèi)星標記的常規(guī)技術是昂貴、耗時的,且一般需要幾個步驟(Cordeiro等人,1999,PtoMo/.腸/.17:225-229)。在專業(yè)文獻中,只有有限數(shù)量的微衛(wèi)星標記可用于甘蔗,另外,這些標記的質(zhì)量不完全適合指紋分析的目的(Aitken等人,2005,T7^or.j/p/.110:789—801;Arro,2005,In:MSThesisGewe"cZ)/vera"j;^4mo/zg"SMgoTcaweC7owest/Wwgrarge/ieg7'ow爿m/7/z,""owPo(ymor//j&m(7Vop,Markersawt/Ped/greeie/a"ows^/ps,LouisianaStateUniversity,Louisiana;Casu等人,2005,i^'e/c/Oo戸92:137-147;Cordeiro,2001,Mo/ecw/ar畫rA:er"stems/orswgan^megerm//oswawa/戸'51In:HenryRJ(編著)尸/awf(7ewo妙/wg-77^Z)濕P/a魄.CABIPublishing,Wallingford:129-146;Cordeiro等人,1999,尸/耐Mo/.腸/.鄉(xiāng).17:225-229;Cordeiro等人,2000,/7朋/155:161-168;Cordeiro等人,2003,P/a"/165:181-189;Garcia等人,2006,7T^or.」p//.112:298-314;Jannoo等人,2001,尸簡.Soc.C匿rec/mo/.24:637-639;Pan等人,2003,48:319-329;Pan等人,2003,尸to^m.ma/G譜meJZ^&acfJZ^^ac/丑ooA:^7《久'43;Pinto等人,2004,47:795-804)。由EST(表達序列標簽)代表的表達的甘蔗基因組已被測序,且成為《效衛(wèi)星標記的豐富的來源(Silva,2001,Mo/.Ao/.24:155-159;Vettore等人,2001,G饑Mo/.5/o/.24:1-7)。開發(fā)穩(wěn)定性足以在標準條件下重現(xiàn)并且區(qū)別個體的分子標記系統(tǒng)已成為甘蔗培育者的一個主要的關注點(Cordeiro,2001,Afo/ecw/armarA:er"We附s/o廠wgarcaweger附/7/wmawa/,'51In:HenryRJ(編著)尸/a"fGe"o妙Z"g-T7zeD編Fzwger戸w"wgo/戶/a魄CABIPublishing,Wallingford:129-146)。發(fā)明概述本發(fā)明公開了用于鑒定、評估和確認來自甘蔗屬復合組、尤其是來自甘蔗屬的種的基因組中存在的、作為表達序列標簽-序列獲得的微衛(wèi)星標記的方法和手段,和這些標記在甘蔗屬復合組成員的指紋分析中的應用。本發(fā)明的一個目的是,提供選擇一套能夠區(qū)分大量甘蔗屬復合組成員的表達序列標簽衍生的微衛(wèi)星標記的方法和手段,所述甘蔗屬復合組成員共有不同水平的家系以(a)建立在用于檢測DNA標記多態(tài)性的兩種常用和普及的技術聚丙烯酰胺凝膠電泳(PAGE)和DNA序列分析儀分析之后用于結(jié)果重現(xiàn)的技術條件;(b)使用標記有權問題的候選支持系統(tǒng)。本發(fā)明也提供了可從甘蔗獲得的分離的微衛(wèi)星序列,以及對于本發(fā)明的微衛(wèi)星序列特異性的側(cè)翼序列。也提供了使用由這些微衛(wèi)星和側(cè)翼序列設計的探針和引物的方法,以及包含這些探針和引物的試劑盒。第一方面,本發(fā)明提供了分離的多核苷酸,其包含至少一種微衛(wèi)星重復和至少兩種相關的側(cè)翼序列。在一種實施方式中,本發(fā)明的分離的多核苷酸包含選自以下的序列(i)SEQIDNO:1-10所示的序列;(ii)與SEQIDNO:1-10所示的序列互補的序列;和(iii)微衛(wèi)星中的重復數(shù)有變化的(i)或(ii)的序列的變體。第二方面,本發(fā)明提供了用于擴增位于甘蔗或相關屬(甘蔗屬復合組)的DNA中的微衛(wèi)星的、包括正向引物和反向引物的引物對。適于聚合酶鏈反應(PCR)擴增微衛(wèi)星的引物對可以選自SEQIDNO:11-30。第三方面,本發(fā)明提供了用于確定甘蔗屬復合組的樣品中的基因型的方法。該方法包括確定甘蔗屬復合組的基因型,并將所述打分結(jié)果與預定的已知樣品的DNA的分析結(jié)果進行比較。使用該方法可以鑒定未知樣品。鑒定方法可以用于種質(zhì)收集物的管理;用于鑒定屬于或不屬于兩種不同的種的不同基因型之間的雜交體;用于鑒定貼錯標簽的通過組織培養(yǎng)程序產(chǎn)生的小植抹樣品;用于鑒定甘蔗地中的植物的品種混合物;用插入基因的特異性引物通過多重標記組鑒定和才企測轉(zhuǎn)基因。第四方面,本發(fā)明提供了希望的基因組序列從甘蔗屬復合組樣品的一個成員向另一個成員滲入的方法。第五方面,本發(fā)明提供了通過利用本發(fā)明的微衛(wèi)星評估祖先之間的遺傳相似性的能力,從甘蔗屬復合組中選擇祖先的方法。第六方面,本發(fā)明提供了在父本和/或母本未知的情況下確定祖先的方法。第七方面,本發(fā)明提供了用于量化在涉及一個或多個甘蔗屬復合組祖先的特定雜交產(chǎn)生的幼苗樣品中的自花授粉的方法。本發(fā)明的第八方面,本文提供了使用可商購的聚合酶鏈反應(PCR)裝置來檢測甘蔗屬復合組的樣品的成員的試劑盒。第九方面,本發(fā)明提供了用于開發(fā)MAS(標記輔助的選擇)程序的與數(shù)量性狀基因座(QTL)的等位基因相關聯(lián)的基因的定位(作圖)方法。附圖簡述圖1顯示簡單序列重復(SSR)指紋識別系統(tǒng)區(qū)分甘蔗屬復合組成員和共有不同水平的親緣關系的相關種的能力,如實施例5所述。圖2顯示簡單序列重復(SSR)指紋識別系統(tǒng)區(qū)分品種RB855002的48個自花授粉的Fl后代的能力,如實施例5所述。圖3顯示多向雜交中親子關系的確定。如實施例7所述,RB966928是母本,有30種可能的父本,29種父本加上也可以作為父本的母本(自花授粉)。發(fā)明詳述本發(fā)明公開了通過在甘蔗屬復合組的基因組中的微衛(wèi)星分析基因型分型和鑒定,檢測和鑒定甘蔗屬復合組成員的方法和手段。本發(fā)明提供了新型的分離的微衛(wèi)星DNA序列和這些微衛(wèi)星側(cè)翼的DNA序列,這些序列可從甘蔗成員獲得。特別地,本發(fā)明提供了(i)SEQIDNO:1-10的分離的多核苷酸序列;和(ii)SEQIDNO:1-10序列的互補序列;和(iii)其變體。第一方面,本發(fā)明提供了分離的多核苷酸,其包含至少一種微衛(wèi)星重復和至少兩種相關的側(cè)翼序列。在一種實施方式中,本發(fā)明的分離的多核苷酸包含選自以下的序列(i)SEQIDNO:1-10所示的序列;(ii)與SEQIDNO:l-10所示的序列互補的序列;和(iii)微衛(wèi)星中的重復數(shù)有變化的(i)或(ii)的序列的變體。15本發(fā)明的分離的多核苷酸序列在以下方面具有實用性(a)甘蔗屬復合組成員的鑒定,(b)DNA多態(tài)性的檢測,(c)基因組作圖,和(d)植物組織、群體、栽培品種、種和種組別之內(nèi)和之間的遺傳變異性的評估。具有單拷貝側(cè)翼序列的分離的微衛(wèi)星重復提供了基因座特異性的標記。側(cè)翼序列可以用來設計基因座特異性的引物,以擴增并檢測植物基因組中微衛(wèi)星序列的存在。甘蔗屬復合組植物DNA可以是基因組DNA或cDNA。一般地,微衛(wèi)星更頻繁地出現(xiàn)于基因組的非編碼區(qū)域,但這不排除分離可能存在于轉(zhuǎn)錄區(qū)域的微衛(wèi)星,如存在于由其衍生的mRNA和cDNA中的微衛(wèi)星,本領域的技術人員熟知該過程。在本發(fā)明中,DNA優(yōu)選地是cDNA。篩查352,122個甘蔗表達序列標簽EST的數(shù)據(jù)庫,搜索具有簡單序列重復(SSR)基序的序列。通過將來自SUCEST計劃(Vettore等人,2001,Mo/.所o/.24:1-7)和已經(jīng)存儲于GenBank的其它來源(Be謂n等人,2006,iVwc/e/cv4"AL34:16-20)的公共可以獲得的序列與個人創(chuàng)建的數(shù)據(jù)庫(www.alellyx.com.br)相結(jié)合,獲得352,122個甘蔗EST序列(讀數(shù))的豐余數(shù)據(jù)庫。使用微衛(wèi)星鑒定軟件,在這種具體的例子中使用MISA軟件,篩查豐余表達序列標簽EST數(shù)據(jù)庫,搜索單一的和復合的簡單序列重復(SSR)基序(Thiel等人,2003,77亂柳/.106:411-422)。將計劃設置為鑒定大小為1(一)、2(二)、3(三)、4(四)、5(五)和6(六)個核苷酸的重復基序。設置基序中的重復單元數(shù)的下限為對于一個核苷酸的基序為至少IO個重復、對于二個核苷酸的基序為6個重復,對于四、五、六個核苷酸的基序為至少5個重復。復合基序被定義為具有被100個或更少的堿基分隔的兩個或多個重復基序的基序。裝配確認的含有簡單序列重復(SSR)的表達序列標簽EST序列的亞凄t才居庫,以形成如Telles和Silva,2001,Afo/.5"/.24:17-23記載的豐余序列的群。根據(jù)簡單序列重復(SSR)基序的類型將群分類。對于基序的每種類型,按照兩種標準分別進行候選標記的選擇具有最大數(shù)目的重復單位數(shù)不同的讀數(shù)的群(計算機模擬的多態(tài)性),和具有含有最大數(shù)目重復單位的讀數(shù)的群(潛在的多態(tài)性)。本發(fā)明的第二方面,提出了用于擴增位于甘蔗屬復合組成員的DNA中的微衛(wèi)星的、包含正向引物和反向引物的引物對。適于聚合酶鏈反應(PCR)擴增微衛(wèi)星的引物對選自SEQIDNO:11-30。借助用于設計聚合酶鏈反應(PCR)引物的程序,如軟件Primer3(Rozen禾口Skaletsky,1998,尸n'mer3owf/ie『『『/orgewe廠a/wse^s1/or6《o/ogz\stprogram附ersIn:KrawetzS.禾口MisenerS.(纟扁著)HumanPress,Totowa:365-382),為每種計算機選擇的群設計引物對。將程序設定為在裝配的共有序列中鑒定解鏈溫度(Tm)為大約64。C、長度分別為19-22個堿基、包含簡單序列重復(SSR)基序側(cè)翼序列(距基序的5'和3'端至少5個堿基)的引物對,并擴增100-250bp的片段。本發(fā)明的第三方面,提出了用于確定甘蔗屬復合組的樣品中的基因型的方法。該方法包括以下步驟(i)從樣品獲得DNA;(ii)擴增選自以下的簡單序列重復(SSR)基因座(i)SEQIDNO:1-10所示的序列;和(ii)與SEQIDNO:l-10所示的序列互補的序列;該擴增4吏用選自以下的DNA中的一套引物(i)SEQIDNO:11-30所示的序列;(ii)與SEQIDNO:11-30所示的序列互補的序列;和(iii)包含SEQIDNO.11-30引物對的SEQIDNO:11-30所示序列的至少6個連續(xù)核苷酸的序列,以形成具有各種大小和標記的擴增產(chǎn)物;(iii)根據(jù)大小分離擴增產(chǎn)物;(iv)對所述分離的結(jié)果打分;和(v)比較所述打分結(jié)果與預先已經(jīng)分析并確定的已知種的DNA的分析結(jié)果。該方法允許鑒定用于將甘蔗屬復合組的樣品與植物來源相關聯(lián)的成員,包括以下步驟(i)用本方法確定所述樣品中的DNA的身份,(ii)用本方法確定已知植物基因型的樣品中的DNA的身份;和(iii)比較兩種樣品的基因型以確定樣品(i)的身份。用于確定甘蔗屬復合組樣品的基因型的鑒定方法可以用于不同的應用,例4口(a)種質(zhì)收集物的管理、分類類似的克隆、排除復本和鑒定貼錯標簽的成員。國際甘蔗技術人員協(xié)會已經(jīng)確認種質(zhì)的指紋分析是一項重要的事項;(b)鑒定屬于或不屬于兩個不同種、屬的不同基因型之間的雜交體;(c)通過鑒定貼錯標簽的由組織培養(yǎng)程序產(chǎn)生的小植抹樣品證實"質(zhì)量控制";(d)鑒定來自甘蔗地證明苗圃的植物的品種混合物;和(e)使用插入基因的特異性引物通過多重標記組鑒定和檢測轉(zhuǎn)基因。第四方面,本發(fā)明提供了希望的基因組序列從甘蔗屬復合組樣品中的一個成員向其它成員滲入的方法,使用標記組在后代中鑒定那些具有來自在雜交中使用的母本和父本的等位基因的雜交體。該方法包括利用以下步驟鑒定母本和父本的等位基因(i)從樣品(例如母本和父本和后代)獲得DNA,(ii)利用選自SEQIDNO.11-30的引物對的DNA中的一套引物擴增簡單序列重復(SSR)基因座,以形成具有各種大小和標記的擴增產(chǎn)物;(iii)根據(jù)大小分離擴增產(chǎn)物;(iv)鑒定父本和母本的專有等位基因(exclusivesalleles);(v)鑒定兼有父本和母本的專有等位基因的后代個體(雜交體個體)。結(jié)果可以用來選擇具有可在即將進行的雜交中使用的、具有希望的滲入基因組序列的雜交體個體。第五方面,本發(fā)明提供了通過利用微衛(wèi)星評估成員之間的遺傳相似性的能力來選擇祖先的方法。該方法包括確定將要用作雜交親本的選擇的一組甘蔗屬復合組樣品的基因型,和借助于特定的遺傳相似性評估軟件(例如,NTSys)進行所述打分結(jié)果的比較。該分析的結(jié)果將會提供成員之間的遺傳相似性的指數(shù),該指數(shù)可以用來推進具有更高的產(chǎn)生改良后代(雜種優(yōu)勢)的可能性的雙親雜交(一個父本和一個母本)。該方法包括利用以下步驟確定選擇的一組甘蔗屬復合組樣品的基因組(i)從樣品(如一組甘蔗成員)獲得DNA,(ii)用選自SEQIDNO.11-30的引物對的DNA中的一套引物擴增簡單序列重復(SSR)基因座,以形成具有各種大小和標記的擴增產(chǎn)物;(iii)根據(jù)大小分離擴增產(chǎn)物;(iv)產(chǎn)生具有打分結(jié)果的微衛(wèi)星二進制數(shù)據(jù);和(v)借助特定的遺傳相似性評估軟件,對含有打分結(jié)果的二進制數(shù)據(jù)進行數(shù)學處理,以產(chǎn)生親本選擇指數(shù)。產(chǎn)生的指數(shù)可以用來選擇將要在雜交中使用的親本。利用甘蔗屬復合組育種群體中的遺傳多樣性的評估產(chǎn)生遺傳距離指數(shù),育種人員使用該指數(shù)可以預測親本的雜種優(yōu)勢和后代的性能(Lima等人,2002,T7^o廠.104:30-38)。4吏用在指紋分析育種群體后產(chǎn)生的微衛(wèi)星二進制數(shù)據(jù)可以容易地計算這些指數(shù),且這些指數(shù)已經(jīng)用來指導親本的選擇。雜種優(yōu)勢的預測使得雜交和待篩選的后代的數(shù)量減少,并且對于開發(fā)新品種的費用和耗時具有直接的影響。預期在重要基因和性狀的作圖以及隨后標記輔助選擇方案的開發(fā)中使用這種微衛(wèi)星組和其它DNA標記將會產(chǎn)生同樣的效應(Mclntyre等人,2005,Mo/.5"W.16:151-161)。第六方面,本發(fā)明提供了在父本和/或母本未知的情況下確定甘蔗屬復合組成員的親子關系的方法。該方法包括確定甘蔗屬復合組(后代)的基因型,并比較所述得分結(jié)果與來自母本和可能的父本成員的DNA的分析結(jié)果。結(jié)果首先比較后代的等位基因和母本的專有等位基因。一旦確認了母本等位基因,后代中的其余等位基因就是父本特異性的。進行搜索以鑒定可能的父本,其具有全部父本特異性的等位基因,且應該是后代的真正的父本。甘蔗屬復合組的基因型的親本鑒定包括以下步驟(i)從成員(例如后代、已知的母本和可能的父本)獲得DNA,(ii)用選自SEQIDNO.11-30的引物對的所述DNA中的一套引物擴增簡單序列重復(SSR)基因座,以形成具有各種大小和標記的擴增產(chǎn)物;(iii)根據(jù)大小分離擴增產(chǎn)物;(iv)鑒定母本和父本特異性的等位基因;和(v)鑒定真正的父本。第七方面,本發(fā)明提供了用于量化由涉及一種或多種祖先的特定雜交產(chǎn)生的甘蔗屬復合組幼苗樣品中的自花授粉的方法。該方法包括確定甘蔗屬復合組的基因型,并比較所述打分結(jié)果與來自親本成員的DNA的分析結(jié)果。該結(jié)果比較后代的等位基因與母本和父本的專有等位基因。確認為不含有父本專有等位基因的后代是自花授粉的產(chǎn)物。通過在幾個后代中進行這樣的分析,可以計算特異性雜交產(chǎn)生的幼苗樣品中的自花授粉百分比。幼苗樣品中的自花授粉的確定包括以下步驟(i)從樣品(例如后代和親本)獲得DNA,(ii)用選自SEQIDNO.11-30的引物對的DNA中的一套引物擴增簡單序列重復(SSR)基因座,以形成具有各種大小和標記的擴增產(chǎn)物;(iii)根據(jù)大小分離擴增產(chǎn)物;(iv)鑒定父本和母本特異性的等位基因;和(v)鑒定只含有母本的專有等位基因的后代。本發(fā)明的第八方面,提供了使用聚合酶鏈反應(PCR)裝置檢測甘蔗屬復合組成員的試劑盒。該試劑盒包括一種或多種適于通過聚合酶鏈反應擴增復合組樣品中的核苷酸序列的引物對,其中,該核苷酸序列包括SEQIDNol-10的序列。優(yōu)選地,該試劑盒包括具有SEQIDNO:11-30的引物對。試劑盒可以利用多重方法。試劑盒可以進一步包括引物、酶、r"《聚合酶,例如,適于通過聚合酶鏈反應進行擴增的鹽和緩沖液。試劑盒也優(yōu)選地包括陽性對照。在試劑盒的某些優(yōu)選的實施方式中,引物包含標記,借此可以檢測到擴增的微衛(wèi)星。在試劑盒的其它優(yōu)選的實施方式中,提供了標記的核酸。可觀察的標記優(yōu)選熒光分子或放射性核苷酸。試劑盒也可包括用于容納這些試劑和/或方便使用的合適的容器和瓶。第九方面,本發(fā)明提供了用于開發(fā)MAS(標記輔助的選擇)程序的基因和數(shù)量性狀基因座(QTL)的定位(作圖)方法。標記輔助的選擇(MAS)基于以下概念可以從緊密連接基因的標記的存在推斷該基因的存在。如果標記和基因相距較遠,那么由于雙重交20叉重組事件,它們一起傳遞給后代個體的可能性會減少。因此,在這樣的選擇中使用標記的先決條件是它們應該緊密地連接感興趣的基因。為了這個目標,遺傳連鎖圖鐠上的區(qū)域(包括感興趣的基因座)的飽和是必需的。飽和是相對項,且飽和度取決于需要圖譜的目的。飽和度是被標記以一定密度覆蓋的基因組的比例,該密度使得標記之間的最大分離不大于幾個厘摩(centimorgan)。定義如本文所用,"微衛(wèi)星"也稱為簡單序列、簡單序列重復(SSR)、簡單重復DNA序列、短串聯(lián)重復(STR)或簡單序列基序(SSM),們由許多串聯(lián)的重復短核苷酸基序或重復單位組成。微衛(wèi)星由1-6個串聯(lián)重復的核苷酸單位形成,在基因組染色體拷貝之間其長度變化。微衛(wèi)星是高度多態(tài)性的。如本文所用,術語"側(cè)翼序列"指與微衛(wèi)星相鄰的非重復的核香酸序列。"獨特側(cè)翼序列"是那些只在基因組內(nèi)的一個位置發(fā)現(xiàn)的側(cè)翼序列。如本文所用,"成員"指組成甘蔗屬復合組的任何種、屬、種間雜交體、屬間雜交體的個體。甘蔗屬復合組是甘蔗屬的所有種,以及與甘蔗在系統(tǒng)發(fā)生學上相關的屬蔗茅屬和芒屬、硬蔗草屬和河八王屬的種。如本文所用,術語"多核苷酸"包括正義鏈和反義鏈的DNA和RNA分子,并包括cDNA、基因組DNA、重組DNA和完全或部分合成的多核苷酸。本發(fā)明提供的所有多核苷酸都是分離的和純化的,這些術語在本領域中普遍使用。如本文所用,術語"引物,,是單鏈寡核苷酸,當置于誘導合成互補的引物延伸產(chǎn)物的條件下時,其能夠作為從特定的序列合成DNA或RNA的起點。"引物對"是兩條引物,包括在待擴增的DNA序列的一個末端與單鏈雜交的引物1和與待擴增的DNA序列的互補鏈的另一個末端雜交的引物2。選擇"引物對"以檢測特定的微衛(wèi)星。選擇每個引物對的每個引物與待擴增的每個特定微衛(wèi)星序列的側(cè)翼序列或側(cè)翼序列的變體的不同鏈互補。盡管引物序列不需要反映天然存在的側(cè)翼序列的準確序列,但是3'末端越接近地反映準確的序列,在退火階段的結(jié)合越好??梢匀鏑askey等人的美國專利第5,364,759號所述,采用不同的標記,以區(qū)分延伸產(chǎn)物。"聚合酶鏈反應"或"PCR"是一項技術,其利用變性、與引物退火和用DNA聚合酶延伸的循環(huán)將靶DNA序列的拷貝數(shù)擴大大約106倍或以上。Mullis等人的美國專利第4,683,195號和Mullis的美國專利第4,683,202號涵蓋了用于擴增核酸的聚合酶鏈反應方法,本文引入這兩篇文獻作為描述該方法的參考。如本文所用,術語"序列的變體,,包括進入微衛(wèi)星的重復數(shù)量具有改變的序列。引物變體異意味著具有堿基缺失、添加或取代,其不改變引物用于擴增微衛(wèi)星的能力。如本文所用,"等位基因"是與DNA的片段有關的遺傳變異,即,占據(jù)同樣的基因座的DNA序列的兩種或多種替代形式之一。"DNA多態(tài)性"是DNA序列中的兩種或多種不同的核苷酸序列共存于同一種間雜交群體中的狀態(tài)。"多態(tài)性信息含量"或"PIC"是存在于基因座中的多態(tài)性的量的量度值(Botstein等人,1980,爿附.丄i/wm.32:314-331)。PIC值的范圍是0-1.0,該值越高表示多態(tài)性程度越大。該量度值一般顯示比其它常用的量度值(例如雜合性)更小的值。對于信息高度豐富(超過大約70%的雜合性)的標記,雜合性和PIC之間的區(qū)別微小。本文使用的所有技術術語是生物化學、分子生物學和農(nóng)學中常用的術語,且可以被本發(fā)明所屬的
技術領域:
的技術人員所理解。這些才支術術語可以在以下文獻中找到Mo/eci//『C/om'"g:丄a6orafoo;Mm認/,第3版,巻1-3,Sambrook和Russel編著,ColdSpringHarborLaboratoryPress,ColdSpringHarbor,N.Y.,2001;Cw/Tewf/Vc^oco/sMo/ecw/a廠Ausubel等人編著,GreenePublishingAssociatesandWiley國Interscience,NewYork,1988(定期更一斤);Short尸ra&co/siVo/oco/sMo/ecw/arAo/ogy,第5版,l畫2巻,Ausubel等人編著,JohnWiley&Sons,Inc:,2002;Gewome」wa/戸、.'^Z/"60rafoA7Mawwa/,1-2巻,Green等人編著,GoldSpringHarborLaboratoryPress,ColdSpringHarbor,N.Y.,1997。涉及植物生物學技術的方法在本文中描述,且在i口MeAocfe尸/awfMo/ecw/arSz'o/ogy.,j丄a60ra^or7CowraeMawwa/,Maliga等人編著,ColdSpringHarborLaboratoryPress,ColdSpringHarbor,N.Y.,1995的方法學^侖述中詳纟田4笛述。伊J^口,在Imiis等人,PC7iVo化co/s:jGw法ZoMeZ/otis^p/z'ca"o叫AcademicPress,SanDiego,1990禾口Dieffenbach牙口Dveksler,Pnwer:^4丄a60ra紐少Mawwa/,第2版,ColdSpringHarborLaboratoryPress,ColdSpringHarbor,N.Y.,2003中描述了使用PCR的各種技術。通過下面的具體的實施例進一步說明本發(fā)明。提供實施例只是為了說明,而非以任何方式限制本發(fā)明的范圍或內(nèi)容。實施例實施例1..:甘蔗微衛(wèi)星重復序列的鑒定甘蔗EST序列的數(shù)據(jù)庫通過將來自SUCEST計劃(Vettore等人,2001,Gew.Mo/.24:l畫7)和已經(jīng)存儲于GenBank的其它來源(Benson等人,2006,A^c/^c/^s.34:16-20)的公共可以獲得的序列與個人創(chuàng)建的數(shù)據(jù)庫(www.alellyx.com.br)相結(jié)合,獲得352,122個甘蔗EST序列(讀數(shù))的豐余數(shù)據(jù)庫。簡單序列重復(SSR)標記的計算機選擇使用用于微衛(wèi)星鑒定軟件,在這種具體的例子中使用MISA軟件(Thid等人,2003,7T^orJ///.G^"W.106:411-422),篩查豐余EST數(shù)據(jù)庫,搜索單一的和復合的簡單序列重復(SSR)基序,該搜索的結(jié)果總結(jié)于表1中。軟件鑒定了36,950個簡單序列重復(SSR)基序,并檢索了33,324個豐余序列(9.46%)。將數(shù)據(jù)庫匯編為79,526個群,其中14,291個包含簡單重復SSR基序(18%)。在這些群中,10,580個(75%)具有單一基序,3,705個具有兩種或多種基序。表2顯示根據(jù)基序的類型分類的36,950個含有SSR的豐余序列的分布。最豐富的單位大小基序是三基序(48%),接著是一基序(32%)和二基序(16%)。在1,414個序列中確認了四、五和六基序,占含有SSR的數(shù)據(jù)庫序列的不到5%。為了選擇用于開發(fā)簡單序列重復(SSR)標記的序列,將36,950個含有SSR的豐余序列與涉及讀數(shù)和群名稱和重復單位大小、數(shù)量和序列的信息一起組織在亞數(shù)據(jù)庫中。首先,根據(jù)重復單位大小對候選簡單序列重復SSR標記的這種亞數(shù)據(jù)庫進行分類,并分為7個讀數(shù)子集(復合、一、二、三、四、五和六基序)。由于我們自己關于這些單位重復在聚丙烯酰胺凝膠電泳(PAGE)和DNA序列分析儀中的低分辨率的經(jīng)驗,具有一和二基序的序列沒有進一步在標記選擇中使用。如下分別處理其余5個讀數(shù)子集。按照群的名稱對每個子集進行分組。對屬于同一群的讀數(shù)的檢查顯示了共有具有相同單位大小和序列的基序,但重復單位數(shù)不同的序列。選用計算機觀察到的這種多態(tài)性作為選擇標準。然后對于具有最大數(shù)目的在重復單位數(shù)方面不同的讀數(shù)的群,將每個子集分類。單獨對于排序最高的群檢查足以設計引物的5'和3'序列,并且選擇63個共有序列進一步表征。第二輪的計算機選擇包括根據(jù)含有具有最大數(shù)目的重復單位的讀數(shù)(因而具有含大量等位基因的可能性)的群對子集進行分類。此時,不能被讀數(shù)較好地代表而且可能在第一輪選擇中遺漏的群被良好地排序。檢查排序最高的群的足夠的5'和3'序列,并且24選擇49個共有序列進一步表征。,選擇總共112個群用于設計引物和進一步由確認程序評估。表3概括了在兩種選擇標準下進行的含有SSR的群的計算機選擇結(jié)果。引物設計借助用于設計聚合酶鏈反應的程序,在該情況下使用軟件Primer3(Rozen禾口Skaletsky,1998,Pn'mer3owZ/je『『『/o廠gewera/z^yers/or6Zo/og&ZprogrammersIn:KrawetzS.和MisenerS.(纟扁著)HumanPress,Totowa:365-382),設計用于每種計算機選擇的群的一對引物。程序設定為鑒定裝配的共有序列中解鏈溫度為大約64。C、長度分別為19-22個堿基、包含SSR基序的側(cè)翼序列(距基序的5'和3'端至少5個堿基)的引物對,并擴增100-250bp的片段。根據(jù)表4,在序列表中描述了這些序列。表l.在甘蔗EST數(shù)據(jù)庫中搜索SSR基序的結(jié)果的總結(jié)單一序列總數(shù)頻率(%)數(shù)據(jù)庫單一序列352,122100%具有SSR的單一序列33,3249.46%鑒定的SSR基序36,95010.49%具有>1基序的單一序列2,9360.83%復合的SSR基序2,3940.68%裝配序列總數(shù)頻率(%)*裝配序列(群)79,526100%具有SSR的裝配序列14,29117.97%(100%)具有1個SSR的裝配序列10,58613.31%(75%)具有2個SSR的裝配序列2,1852.74%(15%)2具有3個SSR的裝配序列7370.93%(5%)具有〉3個SSR的裝配序列7830.98%(5%)*括號中的值指根據(jù)每個序列中基序的數(shù)量,含有SSR的裝配序列的分布。表2.甘蔗EST單一序列數(shù)據(jù)庫中SSR基序根據(jù)單位大小的分布根據(jù)單位大小的基序的類型序列頻率(%)所有類型36,950100%l(一)11,97832.42%2(二)5,84615.82%3(三)17,71247.93%4(四)6441.74%5(五)5271.42%6(六)2430.66%表3.根據(jù)"計算機模擬的多態(tài)性"和"可能的多態(tài)性"標準進行的112個群的選擇基序類型選擇的群選擇標準等位基因數(shù)重復數(shù)復合的125(42%)7(58%)二4533(73%)12(27%)四2914(48%)15(52%)五134(31%)9(69%)137(54%)6(46%)總數(shù)11263(56%)49(44%)表4.微衛(wèi)星和具有序列表中所示的序列的引物之間的關系基因座序列引物F引物RCV22SEQIDNO1SEQIDNO11SEQIDNO12CV29SEQIDNO2SEQIDNO13SEQIDNO14CV37SEQIDNO3SEQIDNO15SEQIDNO16CV38SEQIDNO4SEQIDNO17SEQIDNO18CV60SEQIDNO5SEQIDNO19SEQIDNO20CV78SEQIDNO6SEQIDNO21SEQIDNO22CV79SEQIDNO7SEQIDNO23SEQIDNO24CV94SEQIDNO8SEQIDNO25SEQIDNO26CV104SEQIDNO9SEQIDNO27SEQIDNO28CV106SEQIDNO10SEQIDNO29SEQIDNO30實施例2在計算機驗證之后,用于聚丙烯酰胺凝膠電泳(PAGE)和DNA序列分析儀系統(tǒng)中的甘蔗屬復合組指紋分析的一套含有SSR的基因座的選擇建立具有兩個階段的驗證過程,目標為選擇適于在聚丙烯酰胺凝膠電泳(PAGE)和DNA片段檢測系統(tǒng)中進行甘蔗屬復合組指紋分析的10對引物(基因座)。第一階段(排除)包括使用選擇的所有引物對從4個甘蔗屬復合組成員(Caiana、Q136、RB835054和RB855036,表5)擴增DNA,和在聚丙烯酰胺凝膠電泳(PAGE)中分析片段。觀察序型并根據(jù)關于擴增序型的視覺質(zhì)量(visualquality)(片段在預期大小范圍之內(nèi)并且強度和分辨率足夠打分)、片段的多態(tài)性(至少4個不同大小的片段)和如殘跡(stutters)的PCR(聚合酶鏈反應)偽跡的低發(fā)生率的標準對其打分。在排除候選標記(引物對)之前,進行聚合酶鏈反應和聚丙烯酰胺凝膠電泳(PAGE)3次。數(shù)據(jù)如表6所示??傊?,序型的質(zhì)量不足(聚合酶鏈反應質(zhì)量和偽跡標準)導致57%的候選基因座(64個)被排除,而低多態(tài)性導致25%(28個)被排除。在該驗證階段結(jié)束時選擇代表5種類型的簡單序列重復(SSR)基序的總共20個基因座(18%)。驗證程序的第二階段(分類)包括使用在第一階段預先選擇的20對引物(基因座)從27個甘蔗屬復合組成員(表5)擴增DNA,接著分析。在聚丙烯酰胺凝膠電泳(PAGE)和DNA序列分析儀(使用以熒光染料標記的正向引物)上分析擴增反應產(chǎn)物,根據(jù)3個標準評估并排序PCR(聚合酶鏈反應)反應的質(zhì)量(片段在預期大小范圍之內(nèi)并且強度和分辨率足夠打分);序型的多態(tài)性(具有高PIC值的至少6個不同大小的片段);和如殘跡的PCR偽跡的低發(fā)生率。由27個用于驗證的甘蔗屬復合組成員中的等位基因的總數(shù)和頻率計算每個基因座的PIC值(表7)。所有基因座的多態(tài)性信息含量(PIC)值足夠高(0.774-0.918),因而,序型的視覺質(zhì)量是分類的強制性標準。在已經(jīng)對序型評估和排序之后,選擇前10個基因座,以組成基于簡單序列重復的指紋分析系統(tǒng)。數(shù)據(jù)打分和分析每種成員的等位基因顯現(xiàn)為條帶(聚丙烯酰胺凝膠電泳-PAGE)或峰(DNA序列分析儀),并由至少兩名分析員人工打分為存在(1)或不存在(0)。通過以下公式計算標記的多態(tài)性信息含量(PIG)的值(Weber,1990,G譜肌cs7:524-530;Anderson等人,1993,36:181-186),其中,Pij是基因型(i)中的第j個等位基因的頻率。將打分的等位基因作為離散變量輸入二進制數(shù)據(jù)矩陣(matrix)。使用用于確定遺傳相似性的軟件,尤其是NTSYSpc版本2.20(Rohlf,2002,7VrSy5/c:AA畫enca/r"xo"om;;S"&附,ver.2.2,ExeterPublishingLtd.,Setauket,NY),進行群分析。用Jaccard系凄t評估成員之間的相似性(Sneath和Sokal,1973,7Vwwen'ca///^戸Vz一/esprac"'ceo/w"me"'ca/c/a肌yca"ow,F(xiàn)reeman,SanFrancisco,573p),并且才艮據(jù)用未加4又對組法(unweightedpairgroupmethod)以算術平均數(shù)(UPGMA)計算的評估的相似性描述這些群。使用簡單匹配(SM)系數(shù)(Sokal和Michener,1958,C/m'v.《a"愿歸.38:1409-1438)來計算區(qū)別兩種成員的等位基因數(shù)[(l-SM)x等位基因的總數(shù)=區(qū)別性等位基因的數(shù)目]。使用公式Pid=ZX2計算代表兩個隨機選擇的個體共有相同基因型的可能性的遺傳一致性的概率(Pid),在公式中,x是基因型頻率(Paetkau等人,1995,Mo/.五co/.4:347-358)。通過乘以所涉及的每種基因座的相應Pid值計算基因座組合的Pid。表5.在SSR標記驗證程序的第二階段中進行指紋分析的27個甘蔗成員和相應的直接譜系的列表成員*母本父本Caiana(熱帶種)未知未知Co740P3247P4775IAC86-2210CP52-48Co798Olhuda(熱帶種)未知未知PretaKavangire(熱帶種)未知未知Q136NCo31054N7096RB72454CP53-76未知RB835054RB72454NA56-79RB835486L60-14未知RB855036RB72454SP70-1143RB855453TUC71-7未知RB855536RB72454SP70-1143RB867515RB72454未知RB925345H59-1966未知RB928064SP70-1143未知SIRB835054RB855036S2RB835054RB855036S3RB835054RB855036S4RB835054RB855036S5RB835054RB855036S6RB835054RB855036S7RB835054RB855036S8RB835054RB855036SP80-1842SP71-1088H57-5028SP81-3250CP70-1547SP71-1279SP83-2847HJ5741SP70-1143SP89-1115CP73-1547未知*成員Sl到S8是半近親品種RB835054和RB855036之間雜交產(chǎn)生的Fl后代。表6.顯示在112個候選物中選擇20個基因座的SSR標記驗證程序第一階段的結(jié)果的概括?;蝾愋?基因座數(shù))湘,除標準*選擇的基因座PCR質(zhì)量等位基因數(shù)PCR偽跡總數(shù)復合的(12)5(41%)2(17%)3(25%)2(17%)三(45)23(51%)11(24%)5(11%)6(14%)四(29)13(45%)9(31%)2(7%)5(17%)五(13)3(23%)4(31%)3(23%)3(23%)30六(13)7(53%)2(16%)0(0%)4(31%)總數(shù)(112)51(46%)28(25%)13(11%)20(18%)*根據(jù)PCR質(zhì)量的排除包括未擴增、低擴增和預期大小范圍之外的片段的擴增。PCR偽跡主要指殘跡(stutter)的頻率和強度。等位基因數(shù)指單一形態(tài)的序型或具有少于4個的不同片段的組合序型。表7.顯示為形成甘蔗屬復合組指紋分析系統(tǒng)而選擇的前10個基因座的SSR標記驗證程序第二階段的結(jié)果的概括基因座基序類型分類標準*狀態(tài)分辨率偽跡PIC值CV29四++++++0.91選擇CV38五++++++0.90選擇CV37四++++++0.87選擇CV106二++++++0.83選擇CV104五++++++0.82選擇CV60++++++0.76選擇CV79++++++0.75選擇CV94復合的++++++0.74選擇CV78五+++++0.89選擇CV22四+++++0.80選擇CV133二+++++0.82未選擇CV98二+++++0.80未選擇CV128二+++++0.79未選擇CV80四+++++0.81未選擇CV86四+++++0.80未選擇CV58++++0.89未選擇CV140++++0.84未選擇CV135二++++0.83未選擇CV51二++++0.75未選擇CV23復合的+++0.91未選擇*下面的符號用來評估聚丙烯酰胺凝膠電泳(PAGE)和DNA序列分析儀系統(tǒng)中的偽跡的片段分辨率和強度+(滿意/高)、++(好/中等)和+++(優(yōu)秀/低)。分類標準的重要性次序是分辨率>偽跡>多態(tài)性信息含量PIC值。用在27個用來驗證的成員中觀察到的等位基因數(shù)和頻率計算多態(tài)性信息含量PIC值。實施例3使用選擇的微衛(wèi)星甘蔗標記進行基因型分型才直物材并牛和組織才羊品選擇1,205個甘蔗屬復合組成員和來自于幾個國家和國際育種計劃和種質(zhì)庫的相關種,用于本研究(表8)。自殖(自花授粉)和種間雜交的后代和巴西商業(yè)品種的體外小植物分別由公司的育種站和組織培養(yǎng)設施生產(chǎn)。AlellyxAppliedGenomics(Campinas,SaoPauloBrazil)提供了由愈傷組織再生的轉(zhuǎn)基因植物。位于巴西主產(chǎn)區(qū)(東北和中南部州)的工廠提供了由普通種子甘蔗繁殖的田間生長的植物。為了確保最均質(zhì)的材料,收集組織樣品,并送交由標準化協(xié)議指定的分析。為了避免貼錯標簽并具有跟蹤能力,在用條碼標簽標識的塑料袋或試管中儲存樣品。員和相關的種。DNA提取程序從甘蔗屬復合組和相關種的葉、根和芽中提取總DNA。如下進行大規(guī)模制備。將大約100mg組織粉末(用液態(tài)N2研磨)懸浮于700|uL提取緩沖液中(100mMTris-HClpH8.0、20mMEDTA、2%CTAB、1%PVP40、1.4MNaCl、0.3%2-巰基乙醇、50pg核糖核酸酶A)。充分混合懸浮物,并在65。C溫育30分鐘。用800inL氯仿/異戊醇(24:1)提取總DNA,離心(室溫下,12,000g,10分鐘)后回收上清液(大約600^L),補充60iaL提取溶液(10%CTAB、1.4MNaCl),并充分混合。如上所述提取總DNA,并用450pL異丙醇沉淀。通過離心(室溫下,12,000g,5分鐘)回收DNA之后,用1mL70。/。的乙醇洗滌沉淀物,室溫下干燥,并溶解于100]LiLTE緩沖液(10mMTris-HClpH8.0、lmMEDTA)中。用分光光度計測定DNA濃度,并調(diào)整為標準10ng/pL溶液。為了進行大量樣品的高通量處理,開發(fā)了96樣品平臺,如上所述,略加改進,進行微量制備提取。向96深孔微板(SSI)的孔中引入植物材料(通常為100-200mg嫩葉)。每孔接受200|aL提取緩沖液。向孔中引入具有96個銷釘?shù)慕饘傺b置,用來碾壓植物材料30次。向孔中加入另外的300iuL提取緩沖液,再碾壓植物材料10次。用橡膠蓋密封板,并置于65。C30分鐘,接著加入500pL氯仿/異戊醇(24:1)。將才反振蕩30秒,并在4。C以3,200g離心30分鐘。將上清液(~200inL)轉(zhuǎn)移到另一個深孔4鼓板中,加入20|aL提取溶液,并如上所述用氯仿/異戊醇提取樣品。將上清液(80pL)轉(zhuǎn)移到常規(guī)96孔微板中,加入80jiL異丙醇。密封微板,置于室溫下20分鐘,并通過離心(在4。C下,3,200g,15分鐘)回收總DNA。用150|uL70%的乙醇洗滌沉淀物,室溫下干燥,并溶解于25fiLTE緩沖液中。分光光度計測量顯示典型的30ng/|dL的DNA濃度。聚合酶t連反應PCR擴增在含有2|iLDNA(20ng用于大量制備,60ng用于微量制備)、4反應混合物(50單位/mLTaqDNA聚合酶、400jaMdATP、400juMdCTP、400fiMdGTP、400|iMdTTP、100mMTris-HClpH9.0、100mMNaCl、5mMMgCl2、0.2%IGepal)、0.5jaL的每種引物(10pM)和3pL水的10pL反應液中,進行筒單序列重復(SSR)標記的擴增。用以熒光染料(ABI)標記的正向引物擴增將要在DNA序列分析儀中分析的反應物。如下在設計好程序的循環(huán)變溫器中進行擴增。初次變性在94。C進行5分鐘,94。C30秒、64。C30秒和72。C30秒的35個循環(huán),并在72。C進行60分鐘的最終延伸。片段檢測在聚丙烯酰胺凝膠電泳(PAGE)和自動DNA序列分析儀系統(tǒng)中分析片段。在0.5xTBE緩沖液中用6%聚丙烯酰胺(19:1)和7M尿素制備變性聚丙烯酰胺凝膠(Sambrook等人,1989,Mo/ecw/wC7om'wa丄a6orato^M"wwa/,第2版,ColdSpringHarbourLaboratoryPress,NewYork)。用6pLPCR反應物、3曱酰胺和1fiL加樣緩沖液(曱酰胺、1mMEDTA、0.01%溴酚藍和0.01%二曱苯腈藍)制備樣品,在95°C變性5分鐘,保持在冰上,并加入預熱凝月交的孔中(以120W進行60分鐘)。以90W電泳樣品3小時,并通過銀染色使片段顯現(xiàn)。將凝膠浸沒于固定溶液(10%乙醇、5%乙酸)中10分鐘,用去離子水漂洗,浸沒于預處理溶液(1.5%硝酸)中3分鐘,用去離子水漂洗,浸沒于0.3%硝酸4艮溶液中30分鐘,用去離子水漂洗兩次,浸沒于顯色溶液(283mMNa2C03)中15-30分鐘,或直至片段顯現(xiàn)。通過目視檢查打分,并通過與大小標準25bpLadder(Promega)比較估計片段大小。用具有50cm毛細管陣列、負載有POP7聚合物的ABI3730XLDNA序列分析儀分析用標記的引物擴增的樣品,設定為8.5kV下10秒注射時間,在8.5kV下電泳,烘箱溫度為60°C,運行時間為2小時。用軟件STRand(Hughes,1998,o/f/iet/w/ve^s77_yo/Ca/z/onH'a,Davis,http:〃www.vgl.ucdavis.edu/STRand)顯現(xiàn)由序列分析儀產(chǎn)生的片段數(shù)據(jù)。通過目視^險查進行打分,并通過與大小標準GeneScan500Liz(ABI)比較和與用6-FAM或NED標記的專有大小標準比較來估計片段大小。表8.通過呼號(signcall)(育種計劃)分類的1,205個甘蔗屬復合組品種成員、經(jīng)選擇(CanaVialis程序)的CV克隆和相關種的集合和來源國。符號/種成員的數(shù)目國家B1巴巴多斯(Barbados)CB3巴西cc2哥倫比亞Co5印度CP10美國CV320巴西IAC/IACSP19巴西LCP1美國MZC1古巴NA1阿根廷PAV1巴西PO4巴西PR1波多黎各Q4澳大利亞RB514巴西SP298巴西TUC1阿根廷VAT3巴西甘蔗熱帶種11-甘蔗細莖野生種1一甘蔗印度種1-甘蔗中國種1-甘蔗野生肉質(zhì)花穗種1—-總數(shù)1,2059個國家實施例4在對1,205個甘蔗屬復合組成員和相關種的集合進行基因型分型之后,在指紋分析系統(tǒng)中對等位基因的表征使用DNA序列分析儀檢測系統(tǒng),在10個選擇的基因座處對1,205個甘蔗屬復合組品種成員、經(jīng)選擇(CV程序)的克隆和具有世界范圍的起源且共有不同水平的親緣關系的相關種的集合(表8)進行指紋分析(表9)。鑒定總共150個等位基因(平均每個基因座有15個),借助于兩個不同的大小標準評估其大小?;蜃鵆V38顯示有最大數(shù)目的等位基因(27個),接下來是CV78(25個)。CV29、CV37、CV22、CV79和CV94顯示范圍為14-17個的等位基因,而CV104、CV106和CV60顯示范圍為7-8個的等位基因。指紋分析的群體中等位基因的頻率表明基因座內(nèi)和基因座間的大的變異性。觀察到的多態(tài)性信息含量PIC值(0.77-0.92)與等位基因數(shù)正相關。通過任何具體基因座中的等位基因大小的差異來判斷,選擇的基因座均沒有顯示由其各自的重復單元預測的理想的片段梯酸重復基序,但顯示有2個、3個和5個核苷酸不同的片段。仔細檢查用于引物設計的每種共有序列,顯示幾個位于引物位點和軟件MISA鑒定的簡單序列重復(SSR)基序之間的短單一和二重重復。這樣的短基序在軟件的閾值之內(nèi),但也可以是多態(tài)性的,因而,它們是造成在等位基因階梯中觀察到的缺陷的原因。需要對對應于等位基因的片段進行測序來回答這個問題。然而,盡管自動化片段打分存在困難,但是這些缺陷產(chǎn)生更大的變異性(多態(tài)性),因而增加了每個基因座的區(qū)別能力。不只一次地在指紋分析同樣的成員之后觀察到與某些等位基因有關的一定的不一致性。這些不穩(wěn)定位置在色譜圖中的定位顯示分布于基因座CV37(2)、CV38(4)和CV78(2)中的8個等位基因。關于在同樣的基因座中的其它等位基因,這些等位基因中的大部分具有一貫較低的PCR擴增,且經(jīng)常與通常出現(xiàn)殘跡的位置有關。這種類型的等位基因可以存在于某些基因型中,但會由于PCR反應產(chǎn)量的小的波動而在打分的過程中遺漏。另一方面,在低擴增等位基因位置出現(xiàn)的殘跡經(jīng)常錯誤地被認為是真正的等位基因。由于這些等位基因的易于出錯的性質(zhì),用142個等位基因進一步分析在指紋分析的集合中由基因座組產(chǎn)生的數(shù)據(jù)(沒有考慮8個低擴增等位基因)。表9.在1,205個甘蔗屬復合組品種成員和相關的種的集合中屬于SSR指紋分析系統(tǒng)的等位基因的表征和不穩(wěn)定位置的作圖a37<table>tableseeoriginaldocumentpage38</column></row><table><table>tableseeoriginaldocumentpage39</column></row><table>指紋分析系統(tǒng)區(qū)分甘蔗屬復合組成員的能力利用對具有IO個基因座的1,205個成員集合進行基因型分型之后獲得的二進制數(shù)據(jù)矩陣來評估指紋分析系統(tǒng)的區(qū)分能力。表10顯示每個基因座、所有組合的基因座和區(qū)分具有至少兩處不同的所有成員的基因座最小組合(區(qū)別性等位基因)各自的能力。區(qū)分能力表示為遺傳一致性的概率(Pid,對于基因座或基因座的組合發(fā)現(xiàn)相同基因型的概率),以及對于基因座或基因座的組合,具有獨特基因型的成員的百分比。沒有基因座能夠單獨地區(qū)分所有的成員。所有10個基因座組合起來可以區(qū)分具有至少3個差異的所有的成員。從中搜索能夠區(qū)分具有至少2個差異的集合的最小數(shù)量的基因座的組合。盡管基因座CV78能夠區(qū)分最高比例(60%)的成員,但由于其PCR(聚合酶鏈反應)偽跡(表7),不選擇它與其它基因座構(gòu)成最佳組合。因此,基因座CV38(440/0)、CV29(33%)和CV37(8%)用于此目的,其與良好的打分特性有關的Pid值(IOO億種可能性中有1個一致的基因型)反映了信息最豐富的組合。圖1證明該組合的區(qū)別能力。樹狀圖顯示了屬于指紋分析的集合的54種基因型,其中,21種是全近親(full-sib)的商業(yè)品種和品種RB72454和SP70-1143之間雜交產(chǎn)生的祖先品種,其余的是來自一些其它的外國育種計劃和相關種的某些成員的基因型。在這種具體的成員的子集中,發(fā)現(xiàn)在這兩個個體之間的區(qū)別性等位基因的最小數(shù)量是5個。預期育種計劃中的兩種甘蔗屬復合組基因型之間的遺傳相似性的最極端的例子來自自花授粉雜交的后代。因此,評估指紋分析系統(tǒng)區(qū)分品種RB855002的48個自花授粉雜交的Fl后代群體的能力。測試基因座的所有可能的組合,在這種特別的情況下,7個基因座(CV29、CV37、CV38、CV60、CV79、CV94和CV106)的組合對于區(qū)分所有具有至少2個差異的個體是必需的(圖2)。值得注意的是,當測試3個基因座的最佳組合時(結(jié)果未顯示),獨特基因型的百分比達到87.5%(Pid=0.001),沒有區(qū)分3對基因型?;蜃鵆V106的加入使獨特基因型增至100%(Pid=0.0005),但具有至少1個差異。只在上述的7個基因座的組合中觀察到2個差異(Pid=0.00002)。表IO.在共有不同水平的親緣關系的1,205個甘蔗屬復合組成員和相關種的集合中評估的SSR指紋分析系統(tǒng)的區(qū)分能力*基因座/組合等位基因的平均數(shù)區(qū)別性等位基因的獨特基因型Pid每個基因型區(qū)別性的最小數(shù)量(%)CV787.76.0060.90麓CV386.95,1044.20.003CV297.44.9032.70.003CV375.33,507.90.013CV224.92.807.80.034CV793.52.903.20.062CV603.61.702.10.115CV1064.52.901.80.027CV943.41.501.50.213CV104431.901.00駕所有基因座的組合51.538.931003.4Xio-17最優(yōu)組合1.2X10-7(CV29+CV3719.613.52100+CV38)從該分析中排除低擴增的等位基因?qū)嵤├?指紋分析系統(tǒng)的再現(xiàn)性41為了評估指紋分析系統(tǒng)的再現(xiàn)性,進行了一些實驗,以比較10個選擇的基因座的DNA序列分析儀序型(結(jié)果未顯示)。這些實驗包括從以下樣品來源提取的DNA的擴增i)同一甘蔗基因型的不同組織(葉、芽和根);ii)來自同一基因型但來源于幾個彼此遠離的工廠的葉;iii)來自同一基因型但來自不同發(fā)育階段(植物的齡期)和生命周期(植物甘蔗、第一宿根等)的葉;和iv)由分生組織和愈傷組織產(chǎn)生的體外小植物。在所有情況下,在指紋分析的任何基因座處同一基因型產(chǎn)生的兩種高質(zhì)量序型之間沒有觀察到任何不一致性。在進行的最大再現(xiàn)性實驗中,在基因座CV29、CV37和CV38處指紋分析從30個商業(yè)品種的分生組織培養(yǎng)的小植抹收集的783個葉樣品,而在可比較的序型中沒有觀察到任何不一致性。實施例7多向雜交中的親子關系的確定親本的選擇一般包括潛在的候選者的初始測試,其中,通過特定育種計劃的常規(guī)選擇方案評估雙親或多向雜交產(chǎn)生的少量后代或本。然后進行同樣的雜交以產(chǎn)生大量的后代用于品種選擇。在多向雜交中,在第一階段只可證明母本,但在發(fā)現(xiàn)正確的父本之前,必須測試幾種成對組合。因此,多向雜交在理論上具有更大的顯示證實的親本的機會,而雙親雜交可以常規(guī)且大量地進行,具有更高的顯示優(yōu)良個體的可能性。在多向雜交系統(tǒng)中育種員可以盡快地鑒定所選擇的克隆的父本,這可以減少開發(fā)新品種的時間和費用,對于實現(xiàn)改良的程度(糖、纖維、適應性等)應該具有明顯的影響。本文描述的指紋分析系統(tǒng)已經(jīng)用來為我們的育種計劃所選擇的、來自涉及超過30種雄性祖先的多向雜交的有希望的甘蔗克隆鑒定父本。為人類種群研究和法醫(yī)應用開發(fā)了用來獲得用于建立親子關系的分類答案的方法。該方法包括(i)從具有未知父本、母本和所有假設的雜交涉及的父本的幼苗獲得DNA;(ii)用一套引物擴增樣品中的SSR基因座;(iii)根據(jù)大小分離擴增產(chǎn)物;(iv)對所述分離的結(jié)果打分;(v)比較后代的基因型與母本基因型,減去母本的貢獻,并比較其余的父本配子的貢獻與所有假定的父本基因型。排除不能產(chǎn)生父本配子的貢獻("父本等位基因")的個體,并給剩余的組指定親子關系(Ellstrand,1984,Xm.A^wr.123:819-828)。一旦確認每個克隆的父本,則進行涉及它們和以前已知的母本的雙親雜交,播種產(chǎn)生的種子,將產(chǎn)生的幼苗納入正常的選擇程序。每年重復該方案用指紋分析系統(tǒng)確定第一選擇階段中評估的有希望的克隆的親子關系,在接下來的雜交季節(jié)進行雙親雜交,將這些雜交產(chǎn)生的種子納入下一年的選擇方案。圖3中,RB966928是母本,且有30個可能的父本、29個父本加上母本(自花授粉)。在本文所述的指紋分析系統(tǒng)中分析所有樣品、幼苗、母本和所有的父本,比較后代基因型與母本基因型,減去母本的貢獻,并比較剩余的父本配子的貢獻與所有假定的父本基因型。排除不能產(chǎn)生父本配子的貢獻("父本等位基因")的個體,并給剩余的組指定親子關系。父本RB936071是唯一的具有所有MPA父本等位基因(專有等位基因)的父本。權利要求1.一種分離的多核苷酸,其包含選自以下的序列(i)SEQIDNO1-10所示的序列;和(ii)與SEQIDNO1-10所示的序列互補的序列;(iii)微衛(wèi)星中重復數(shù)有變化的(i)或(ii)序列的變體。2.—種特異性地結(jié)合選自SEQIDNO:l-10的分離的多核苷酸的引物,其中,所述引物包含與SEQIDNO:1-10所示的序列互補的序列中的至少6個連續(xù)核苷酸。3.—種分離的引物,其包含選自以下的序列(i)SEQIDNO:U-30所示的序列;(ii)與SEQIDNO:11-30所示的序列互補的序列;和(iii)包含SEQIDNO:11-30所示的序列的至少6個連續(xù)核苷酸的序列。4.一種用于確定甘蔗屬復合組的樣品中的基因型的方法,包括以下步驟(i)從樣品獲得DNA;(ii)擴增選自以下的簡單序列重復基因座(i)SEQIDNO:1-10所示的序列;和(ii)與SEQIDNO:1-10所示的序列互補的序列;該擴增4吏用選自以下的DNA中的一套引物(i)SEQIDNO:11-30所示的序列;(ii)與SEQIDNO:11-30所示的序列互補的序列;和(iii)包含SEQIDNO:11-30所示序列的至少6個連續(xù)核苷酸的序列,以形成具有各種大小和標記的擴增產(chǎn)物;(iii)根據(jù)大小分離擴增產(chǎn)物;(iv)對分離的結(jié)果打分;和(v)將打分結(jié)果與來自已知種的DNA的分析結(jié)果進行比較。5.—種用于鑒定將甘蔗屬復合組樣品與植物來源相關聯(lián)的成員的方法,包括(i)通過使用權利要求4所述的方法確定樣品中的DNA的身份;和(ii)通過使用權利要求4所述的方法確定已知植物基因型的樣品中的DNA的身份;和(iii)比較兩種樣品的基因型以確定樣品(i)的身份。6.—種用于確定來自甘蔗屬復合組樣品的需要的基因組序列的基因滲入的方法,包括以下步驟(i)從樣品獲得DNA;(ii)用選自SEQIDNO.11-30引物對的DNA中的一套引物擴增簡單序列重復基因座;(iii)根據(jù)大小分離擴增產(chǎn)物;(iv)鑒定父本和母本的專有等位基因;和(v)鑒定兼有父本和母本的專有等位基因的后代個體。7.—種用于選擇甘蔗屬復合組的祖先的方法,包括以下步驟(i)從祖先獲得DNA;(ii)用選自SEQIDNO.11-30引物對的DNA中的一套引物擴增簡單序列重復基因座,以形成具有各種大小和標記的擴增產(chǎn)物;(iii)根據(jù)大小分離擴增產(chǎn)物;(iv)產(chǎn)生具有打分結(jié)果的微衛(wèi)星二進制數(shù)據(jù);和(v)借助于特定遺傳相似性評估軟件,對含有打分結(jié)果的二進制數(shù)據(jù)進行數(shù)學處理,以產(chǎn)生親本選擇指數(shù)。8.—種用于確定甘蔗屬復合組成員的親子關系的方法,包括以下步驟(i)從該成員獲得DNA;(ii)用選自SEQIDNO.11-30引物對的DNA中的一套引物擴增簡單序列重復基因座,以形成具有各種大小和標記的擴增產(chǎn)物;(iii)根據(jù)大小分離擴增產(chǎn)物;(iv)鑒定母本和父本特異性的等位基因;和(v)鑒定真正的父本。9.一種用于量化甘蔗屬復合組的幼苗樣品中的自花授粉的方法,包括以下步驟(i)從成員獲得DNA;(ii)用選自SEQIDNO.11-30引物對的DNA中的一套引物擴增簡單序列重復基因座,以形成具有各種大小和標記的擴增產(chǎn)物;(iii)根據(jù)大小分離擴增產(chǎn)物;(iv)鑒定父本和母本特異性的等位基因;和(v)鑒定只含有母本的專有等位基因的后代。10.—種用于檢測甘蔗屬復合組成員的試劑盒,包括一種或多種適于擴增甘蔗屬復合組的樣品中的核苷酸序列的引物對。11.一種用于檢測多態(tài)性遺傳標記的試劑盒,包括一種或多種適于擴增甘蔗屬復合組的樣品中的核苷酸序列的引物對。12.如權利要求11所述的試劑盒,其中,所述多核苷酸序列包括選自以下的序列(i)SEQIDNO:l-10所示的序列;(ii)與SEQIDNO:1-10所示的序列互補的序列;(iii)SEQIDNO:11-30所示的序列;(iv)與SEQIDNO:11-30所示的序列互補的序列;和(v)包含SEQIDNO:11-30所示的序列的至少6個連續(xù)核苷酸的序列。13.—種用于開發(fā)MAS(標記輔助的選擇)程序的與數(shù)量性狀基因座(QTL)的等位基因相關聯(lián)的基因的定位(作圖)方法。全文摘要本發(fā)明涉及甘蔗的微衛(wèi)星及其側(cè)翼序列、微衛(wèi)星分離的方法、適于使用這些序列進行指紋分析的方法以及可以用于如下應用的方法甘蔗屬復合組成員的鑒定、種質(zhì)收集物的管理、祖先的選擇、品種之間的鑒別、雜交體的鑒定、需要的基因組序列的基因滲入、親子關系的確定、基因和數(shù)量性狀基因座(QTL)的作圖和MAS(標記輔助的選擇)程序的開發(fā)。文檔編號C12N15/29GK101617047SQ200880004444公開日2009年12月30日申請日期2008年1月10日優(yōu)先權日2007年1月12日發(fā)明者S·瑪特斯沃卡,W·小麥克切羅尼申請人:卡納維亞利斯有限公司