專利名稱::植物育種方法植物育種方法與相關(guān)申請(qǐng)的交叉引用本申請(qǐng)是非臨時(shí)實(shí)用專利申請(qǐng),其要求下列臨時(shí)專利申請(qǐng)的優(yōu)先權(quán)和利益2003年5月28日由Smith等人提交的的標(biāo)題為"PlantBreedingMethod"的USS萌474,359,此處引用其全文作為參考,發(fā)明領(lǐng)域本發(fā)明提供了預(yù)測(cè)植物中表型性狀值的方法,所述方法使用笫一植物群體的基因型、表型和家系關(guān)系信息鑒定至少一個(gè)遣傳標(biāo)記和表型性狀之間的關(guān)聯(lián),然后利用所述關(guān)聯(lián)在具有已知標(biāo)記基因型的第二乾群體的成員中預(yù)測(cè)表型性狀值.本發(fā)明也涉及鑒定影響表型性狀的新的等位基因變體的方法.發(fā)明背景選擇育種數(shù)世紀(jì)來已被用于提高或試圖提高植物中具有農(nóng)藝學(xué)和經(jīng)濟(jì)學(xué)利益的表型性狀(例如,產(chǎn)重、谷粒含油百分比等).以其最基本的形式,選擇育種涉及基于一個(gè)或多個(gè)表型性狀選擇作為下一代的親本的個(gè)體.然而,這種表型選擇由于環(huán)境(例如,土壤類型、降雨、溫度變化范圍等)對(duì)表型性狀的影響而變得復(fù)雜,另一個(gè)有關(guān)這種表型選擇的問題是絕大部分目的表型性狀由超過一個(gè)基因座控制.據(jù)估計(jì)在馴化的植物中98X的經(jīng)濟(jì)上重要的表型性狀是數(shù)量性狀(Beavis的USPN6,399,855,標(biāo)題為"QTLmappinginplantbreedingpopulations").基于認(rèn)識(shí)到的影響表型性狀表達(dá)變異性的分離遺傳因子的數(shù)目和量級(jí),這些性狀被分為寡基因或多基因性狀.歷史上,術(shù)語數(shù)量性狀曾被用來描述顯示連續(xù)變異性的表型性狀表達(dá)的變異性,并且其是多基因座相互之間和/或與環(huán)境之間的可能相互作用的凈結(jié)果.為了描述更廣泛的現(xiàn)象,術(shù)語"復(fù)合性狀"曾被用來描述任何不表現(xiàn)經(jīng)典的歸因于單基因座的孟德爾遣傳的性狀(Lander&Schork,Science265:2037(1994))此處通常同義地使用所述兩個(gè)術(shù)語.橫跨基因組的遍在多態(tài)性遣傳標(biāo)記(例如,RFLPs、SNPs等)的發(fā)展使得數(shù)量和分子遣傳學(xué)家可能研究Edwards等人在Genetics115:113(1987)中所謂的數(shù)量性狀基因座(QTL)以及其數(shù)目、量級(jí)和分布。QTL包括在某種程度上控制質(zhì)量和數(shù)量表型性狀的基因,所述性狀在個(gè)體的家系內(nèi)和在個(gè)體的家系群體內(nèi)可以是不連續(xù)或連續(xù)分布的。已發(fā)展了實(shí)驗(yàn)性示例來鑒定和分析QTL(參見,例如,授予Helentjaris等人的USPN5,385,835,標(biāo)題為"Identificationandlocalizationandintrogressionintoplantsofdesiredmultigenictraits,",授予Johnson的USPN5,492,547,標(biāo)題為"Processforpredictingthephenotypictraitofyieldinmaize,"和授予Johnson的USPN5,981,832,標(biāo)題為"Processpredictingthevalueofaphenotypictraitinaplantbreedingprogram").—個(gè)這樣的示例包括將兩個(gè)近交系雜交從而產(chǎn)生Fl單交雜交后代,將F1雜交后代自交從而產(chǎn)生分離F2后代,確定多標(biāo)記基因座的基因型,和在所迷分離后代中估計(jì)一個(gè)至數(shù)個(gè)數(shù)量表型性狀。然后在分離后代中基于基因型值和表型變異性之間的顯著統(tǒng)計(jì)學(xué)關(guān)聯(lián)鑒定QTL.這種實(shí)驗(yàn)性示例是理想的,因?yàn)镕!代的親本系具有已知的連鎖相,后代中所有的分離基因座都是可提供信息的,并且標(biāo)記基因座和影響表型性狀的遣傳基因座之間的連鎖不平衡已被最大化.然而,必須投入相當(dāng)多的資源以確定大量的雜交和/或近交后代的表型性能.因?yàn)檠芯縼碜詢H僅兩個(gè)親本的后代,所以上述實(shí)驗(yàn)只能檢測(cè)性狀基因座(例如,QTL),兩個(gè)親本對(duì)于所述基因座是多態(tài)性的.這套性狀基因座可能只代表目的育種群體(例如,玉米、高梁、大豆、低芥酸芥子等的育種群體)中基因座分離的小部分。通常,這些后代只顯示一個(gè)或少數(shù)表型性狀的變異,所迷性狀是所使用的育種程序中的目的性狀。這意味著可能需要發(fā)展分離群體、為標(biāo)記基因座打分,和在重復(fù)的田間試驗(yàn)中種植并為目的表型性狀打分.此外,用于檢測(cè)QTL的方法對(duì)要鑒定的QTL產(chǎn)生偏倚的估計(jì)(參見,例如,Beavis(1994)"ThepoweranddeceitofQTLexperiments:LessonsfromcomparativeQTLstudies"inWilkinson(ed.)Proc.49thAnn.CornandSorghumRes,Conf.,AmericanSeedTradeAssoc,Chicago,IL,pp250-266).在推斷育種群體內(nèi)遣傳上不同的親本的后代的QTL的鑒定中,引入了另外的不準(zhǔn)確性.此外許多(如果不是全部的話)性狀受到環(huán)境因素的影響,所述環(huán)境因素也可引入不準(zhǔn)確性.本發(fā)明克服了上面提到的困難,例如通過關(guān)聯(lián)分析鑒定有關(guān)QTL的遣傳標(biāo)記,所迷關(guān)聯(lián)分析可容納復(fù)雜的植物群體(其中與雙親群體相比,更多的影響多個(gè)目的性狀表型的基因座預(yù)期會(huì)分離),利用現(xiàn)有的育種程序產(chǎn)生的信息,和任選地解釋環(huán)境效應(yīng),和通過應(yīng)用這些信息來預(yù)測(cè)例如雜交后代的表型.通過閱讀下列內(nèi)容可獲得對(duì)發(fā)明的全面理解.發(fā)明簡(jiǎn)述本發(fā)明提供了用于在植物中預(yù)測(cè)植物表型性狀值的方法.所述方法使用第一植物群體的基因型、表型和家系關(guān)系信息鑒定至少一個(gè)遣傳標(biāo)記和表型性狀之間的關(guān)聯(lián),然后利用所述關(guān)聯(lián)預(yù)測(cè)具有已知標(biāo)記表型的笫二靶群體成員的表型性狀值.本發(fā)明也涉及鑒定影響表型性狀的新的等位基因變體的方法.因此,笫一類一般的實(shí)施方案提供了在靶植物群體中預(yù)測(cè)表型性狀值的方法,在所迷方法中,提供了至少一個(gè)遣傳標(biāo)記和表型性狀之間的關(guān)聯(lián).例如,可提供表型性狀和包含兩個(gè)或更多個(gè)遺傳標(biāo)記的單元型之間的關(guān)聯(lián).在第一植物群體中估計(jì)所迷關(guān)聯(lián),所迷笫一植物群體是已建立的育種群體或其部分。根據(jù)統(tǒng)計(jì)學(xué)模型在笫一植物群體中估計(jì)所述關(guān)聯(lián),所述模型合并笫一植物群體的一套遣傳標(biāo)記的基因型和笫一植物群體中的表型性狀值.所述統(tǒng)計(jì)學(xué)模型也可合并第一植物群體各成員之間的家系關(guān)系。然后提供至少一個(gè)靶植物群體成員的表型性狀值.通過例如利用系謙和遣傳標(biāo)記信息,根據(jù)所述關(guān)聯(lián)和根據(jù)至少一個(gè)與所述表型性狀相關(guān)的遣傳標(biāo)記的至少一個(gè)成員的基因型預(yù)測(cè)所述值.在一類實(shí)施方案中,笫一植物群體包含多個(gè)近交種、單交F1雜種或其組合.例如,笫一植物群體任選地由近交種、單交F1雜種或其組合組成.因?yàn)轶室恢参锶后w的成員是已建立的育種群體的成員,所以各近交種和/或單交Fl雜種的祖先通常是已知的,并且各近交種和/或單交Fl雜種通常是三個(gè)或更多個(gè)建立者中至少一個(gè)的后代.因?yàn)榈谝恢参锶后w的成員通常來自具有多代系譜的已建立的育種群體,所以第一植物群體的成員任選地跨越多個(gè)育種周期(例如,至少3個(gè)、至少4個(gè)、至少5個(gè)、至少7個(gè)或至少9個(gè)育種周期).所述已建立的育種群體其自身通常包含至少3個(gè)建立者(例如,至少10個(gè)建立者、至少50個(gè)建立者、至少IOO個(gè)建立者或至少200個(gè)建立者,例如大約100至200個(gè)建立者)和所迷建立者的后代,其中所述后代的祖先是已知的.第一植物群體基本上可包含任何數(shù)目的成員,例如從大約50至大約5000個(gè).表型性狀可以是例如質(zhì)量性狀、數(shù)量性狀、單基因性狀、多基因性狀等.第一植物群體的表型性狀值可通過例如估計(jì)笫一植物群體成員之間的表型性狀獲得.可在笫一植物群體成員(例如,包含笫一植物群體的近交種和/或單交Fl雜種)中估計(jì)表型.可選擇地,通過在至少一次與至少一個(gè)測(cè)交親本的頂交組合中估計(jì)第一植物群體成員之間的表型性狀來獲得笫一植物群體中的表型性狀值.表型性狀包括但不限于產(chǎn)重、谷粒含水量、谷粒含油量、根抗倒伏性、莖桿抗倒伏性、林高、谷穗高、抗病性、抗蟲性、抗旱性、谷粒蛋白含量、試驗(yàn)重量和穗軸顏色成套的遣傳標(biāo)記基本上可包含任何便利數(shù)目和類型的遣傳標(biāo)記.例如,成套的遣傳標(biāo)記可包含一個(gè)或多個(gè)單核苷酸多態(tài)性(SNP)、多核苷酸多態(tài)性、至少一個(gè)核苷酸插入或缺失(indel)、簡(jiǎn)單序列重復(fù)(SSR)、限制性片段長(zhǎng)度多態(tài)性(RFLP)、隨機(jī)擴(kuò)增多態(tài)DNA(RAPD)標(biāo)記或任意片段長(zhǎng)度多態(tài)性(AFLP).成套遺傳標(biāo)記可包含例如1至50,000個(gè)(或甚至更多個(gè))遣傳標(biāo)記;例如,1至10個(gè)標(biāo)記或500至50,000個(gè)標(biāo)記,可通過實(shí)驗(yàn)確定和/或預(yù)測(cè)第一植物群體的成套遣傳標(biāo)記的基因型.類似地,可通過實(shí)驗(yàn)確定和/或預(yù)測(cè)把植物群體成員的成套遣傳標(biāo)記的基因型.在一類優(yōu)選的實(shí)施方案中,通過使用線性模型、混合線性模型或非線性模型進(jìn)行Bayesian分析,可估計(jì)至少一個(gè)遺傳標(biāo)記和表型性狀之間的關(guān)聯(lián).在一類這樣的優(yōu)選實(shí)施方案中,通過使用線性模型進(jìn)行Bayesian分析來估計(jì)關(guān)聯(lián),所迷Bayesian分析通過可逆的跳躍馬爾可夫鏈(jumpMarkovchain)MonteCarlo算法進(jìn)行.通常,通過計(jì)算機(jī)程序或系統(tǒng)進(jìn)行所迷Bayesian分析.在另一類優(yōu)選的實(shí)施方案中,通過進(jìn)行傳遞不平衡檢驗(yàn)估計(jì)關(guān)聯(lián).把植物群體可包含近交植物、雜交植物或其組合.在一類優(yōu)選的實(shí)施方案中,靶植物群體包含雜交植物,所述雜交植物包含由近交系之間單交產(chǎn)生的Fl后代.這些Fl后代可由例如包含所迷笫一植物群體和/或新近交系的近交后代單交產(chǎn)生.類似地,靶植物群體可包含后生世代,所述后生世代由包括至少一個(gè)笫一植物群體成員的育種雜交產(chǎn)生.至少一個(gè)靶植物群體成員中的表型性狀值可通過多種方法中的任意一個(gè)方法進(jìn)行預(yù)測(cè).例如,對(duì)于簡(jiǎn)單質(zhì)量性狀,可通過發(fā)現(xiàn)于靶植物群體成員中的遣傳標(biāo)記等位基因的鑒定來預(yù)測(cè)表型.在其它例子中,可通過使用最佳線性無偏預(yù)測(cè)方法、多重回歸方法、選擇指數(shù)技術(shù)、脊回歸(ridgeregression)方法、線性最優(yōu)化方法或非線性最優(yōu)化方法預(yù)測(cè)至少一個(gè)靶植物群體成員中的表型性狀值.第一和靶植物群體基本上可包含任何類型的植物.例如,在優(yōu)選種類的實(shí)施方案中,笫一和靶植物群體包含(例如,由下述組成)二倍體植物,包括但不限于雜交作物植物,例如玉米(例如,玉蜀黍(Zea邁ays))、大豆、高梁、小麥、向日葵、水稻、低芥酸芥子、棉花和粟'方法任逸地包括選擇至少一個(gè)具有想要的預(yù)測(cè)的表型性狀值的靶植物群體成員.至少一個(gè)逸擇的目的靶植物群體成員可與至少一種其它植物進(jìn)行育種或自交,以產(chǎn)生例如新的系或具有想要的表型性狀值的雜種.在另一類實(shí)施方案中,方法包括克隆基因(所述基因與至少一個(gè)與所迷表型性狀相關(guān)的遣傳標(biāo)記連鎖),其中所述基因的表達(dá)影響所述表型性狀,和任選地包括構(gòu)建在宿主植物中表達(dá)經(jīng)克隆的基因的轉(zhuǎn)基因植物.另一類一般的實(shí)施方案提供了選擇植物的方法.在所述方法中,提供了至少一個(gè)遣傳標(biāo)記和表型性狀之間的關(guān)聯(lián).在笫一植物群體中估計(jì)所述關(guān)聯(lián),所述笫一植物群體是已建立的育種群體或其部分.根據(jù)統(tǒng)計(jì)學(xué)模型估計(jì)笫一植物群體中的關(guān)聯(lián),所述模型合并笫一植物群體的一套遣傳標(biāo)記的基因型與笫一植物群體中的表型性狀,所述統(tǒng)計(jì)學(xué)模型也可合并笫一植物群體成員之間的家系關(guān)系.然后提供來自一個(gè)或多個(gè)非適應(yīng)系的一個(gè)或多個(gè)植物.就選擇的包含至少一個(gè)與表型性狀相關(guān)的遣傳標(biāo)記的基因型選擇一個(gè)或多個(gè)植物.選擇的基因型任選地包含至少一個(gè)等位基因,所述等位基因是至少一個(gè)與表型性狀相關(guān)的遺傳標(biāo)記的等位基因,所述等位基因是關(guān)于在笫一群體中發(fā)現(xiàn)的遣傳標(biāo)記等位基因而言新的等位基因.新的遺傳標(biāo)記基因型可表明與遣傳標(biāo)記(和與表型性狀)相關(guān)的QTL的新等位基因的存在,為確定該假定的新QTL等位基因是否有利地影響表型性狀,所述方法可包括在具有選擇的基因型的一個(gè)或多個(gè)植物中估計(jì)表型性狀.可選擇至少一個(gè)具有選擇的基因型和想要的表型性狀值的植物.此外,可將至少一個(gè)選擇的具有選棒的基因型和想要的表型性狀值的植物與至少一種其它植物進(jìn)行育種(例如,以引入遺傳標(biāo)記等位基因并因此將假定的新QTL等位基因引入適應(yīng)性生殖質(zhì)中).在一類優(yōu)選的實(shí)施方案中,通過使用線性棋型、混合線性模型或非線性模型進(jìn)行Bayesian分析,可估計(jì)至少一個(gè)遣傳標(biāo)記和表型性狀之間的關(guān)聯(lián).在一類這樣的優(yōu)選實(shí)施方案中,通過使用線性模型進(jìn)行Bayesian分析來估計(jì)關(guān)聯(lián),所述Bayesian分析通過可逆的跳躍馬爾可夫鏈MonteCarlo算法進(jìn)行.在另一類優(yōu)選的實(shí)施方案中,通過進(jìn)行傳遞不平衡檢驗(yàn)估計(jì)關(guān)聯(lián).此處在它們相關(guān)的程度上使用了上述實(shí)施方案中提到的所有各種任選的構(gòu)型和特征,例如第一植物群體和/或已建立的育種群體的組成、表型性狀類型、遣傳標(biāo)記的種類和數(shù)目等.通過任何此處的方法選擇、提供或產(chǎn)生的植物和通過此處任一方法生成的轉(zhuǎn)基因植物形成了發(fā)明的另一特征。也提供了用于實(shí)踐所述方法或其方面的數(shù)字系統(tǒng).包含系統(tǒng)組分、通過所述方法選擇的植物或兩者,和合適的容器、包裝材料、用于實(shí)踐所迷方法的說明書等的試劑盒也是發(fā)明的特征.附困簡(jiǎn)述圖l是概要地說明在已建立的育種群體的部分的例子(或示例性的笫一植物群體)中各近交系和單交雜種之間關(guān)系的系謙.困2提供了一般的系詳玉米育種程序的示意性概覽,困3概括地說明了進(jìn)行Bayesian分析的軟件。困4描繪了按其在1號(hào)染色體上的位置順序排列的511個(gè)標(biāo)記的穗軸顏色的TDT似然比率統(tǒng)計(jì)學(xué)困.定義除非另外定義,否則所有此處所用的技術(shù)和科學(xué)術(shù)語都具有與本發(fā)明相關(guān)的領(lǐng)域內(nèi)技術(shù)人員普遍理解的意思相同的意思,下列定義補(bǔ)充本領(lǐng)域內(nèi)的定義和針對(duì)本申請(qǐng),并且不轉(zhuǎn)嫁于任何相關(guān)或不相關(guān)的案例,例如不轉(zhuǎn)嫁于任何共同擁有的專利或申請(qǐng).盡管任何與此處描述的方法和材料相似或等同的方法和材料可用于檢驗(yàn)本發(fā)明,但此處描述了優(yōu)選的材料和方法.因此,此處所用的術(shù)語只用于描述特定的實(shí)施方案,并且不意味著是限制性的.如本說明書中和附加的權(quán)利要求中所用的,除非上下文清楚地指出,否則單數(shù)形式的"一個(gè)(a)"、"一個(gè)(an)"和"該(the)"包括復(fù)數(shù)形式的所指物.因此,例如"一種蛋白"包括兩種或更多種蛋白;"一個(gè)細(xì)胞"包括細(xì)胞混合物等."等位基因"或"等位基因變體"是基因或遣傳標(biāo)記的任何一個(gè)或多個(gè)可選擇形式.在二倍體細(xì)胞或生物中,給定基因(或標(biāo)記)的兩個(gè)等位基因通常占據(jù)一對(duì)同源染色體上的相應(yīng)基因座.在本發(fā)明的上下文中,術(shù)語"關(guān)聯(lián)"或"與……關(guān)聯(lián)"是指一個(gè)或多個(gè)處于連鎖不平衡的遣傳標(biāo)記等位基因和表型性狀等位基因,即在一種或多種植物的后代中發(fā)現(xiàn)標(biāo)記基因型和性狀表型在一起的頻率高于所述標(biāo)記基因型與性狀表型獨(dú)立分離的頻率."育種周期"描迷了兩個(gè)近交親本和這些親本的近交后代之間的分離.育種周期可包括例如,將兩個(gè)近交系雜交以產(chǎn)生Fl雜種,將Fl雜種自交,并且自交多次以產(chǎn)生近交后代.育種周期任選地包括一次或多次與其中一個(gè)近交親本的回交.也可按照育種周期描述近交和單交Fl雜種之間或兩個(gè)單交Fl雜種之間的分離.為確定單交Fl雜種與近交種的育種周期距離,確定了近交種和各雜種的近交親本之間的育種周期差異;這兩個(gè)數(shù)字中較大的一個(gè)是分離Fl單交雜種和近交種的育種周期的數(shù)字.為確定笫一單交Fl雜種和笫二單交Fl雜種的育種周期距離,將笫一雜種的近交親本與笫二雜種的近交親本的所有可能的組合進(jìn)行相互比較,且兩個(gè)雜種間的育種周期距離與任何一個(gè)這些近交親本組合之間的最大距離相等。"二倍體植物"是指具有兩套染色體的植物,通常各套各來自其兩個(gè)親本."已建立的育種群體"是指通常在育種程序例如商業(yè)育種程序中產(chǎn)生和/或用作親本的植物的集合體.已建立的育種群體的成員通常已進(jìn)行了很好的表征;例如,可能已在例如不同的環(huán)境條件下,在多個(gè)地點(diǎn)和/或不同時(shí)間對(duì)幾個(gè)目的表型性狀進(jìn)行了估計(jì)."F,是指第一子代,即兩個(gè)個(gè)體之間或兩個(gè)近交系之間交配的后代."后生世代"是指通過自交或有性雜交(例如,和其它的R后代,和近交系等)由Fi后代產(chǎn)生的F"Fs和更后的代."建立者"是指包含一個(gè)或多個(gè)等位基因(例如,遣傳標(biāo)記等位基因)的近交或單交F1雜種,在群體例如育種群體的系謙中在整個(gè)建立者的后代中可追蹤到所迷等位基因.例如,在已建立的育種群體中,所述建立者通常(但不必是)最早培育的系.術(shù)語"基因"廣義地是指任何與生物學(xué)功能相關(guān)的核酸.基因通常包括編碼序列和/或表達(dá)這些編碼序列所需要的調(diào)節(jié)序列.依賴于上下文,"遣傳標(biāo)記"是指核苷酸或多核苷酸序列,或是指被多態(tài)性占據(jù)的基因座,所述核苷酸或多核苷酸序列存在于植物基因組中和在目的群體中具有多態(tài)性.在許多其它的例子中,遣傳標(biāo)記包括,例如,SNPs、indels、SSRs、RFLPs、RAPDs和AFLPs,逸傳標(biāo)記可用于例如在染色體上定位基因座,所述基因座含有促進(jìn)表型性狀表達(dá)變異性的等位基因.遣傳標(biāo)記也指與所述基因組序列互補(bǔ)的多核苷酸序列,例如用作探針的核酸序列。"基因型"是指細(xì)胞或生物的基因組成.個(gè)體的"一套遺傳標(biāo)記基因型"由存在于個(gè)體中的一個(gè)或多個(gè)遣傳標(biāo)記基因座的特定等位基因組成,"生殖質(zhì)"是指群體或其它個(gè)體的類群(例如,物種)的基因型全體。生殖質(zhì)也可指植物材料,例如,充當(dāng)各種等位基因庫(kù)的植物類群,"適應(yīng)的生殖質(zhì)"是指經(jīng)證明在例如給定的環(huán)境或地理區(qū)域具有遣傳優(yōu)勢(shì)的植物材料,而"非適應(yīng)的生殖質(zhì)"、"原始生殖質(zhì)"或"外來生殖質(zhì)"是指在給定的環(huán)境或地理區(qū)域具有未知或未經(jīng)證明的遣傳價(jià)值的植物材料;同樣,非適應(yīng)的生殖質(zhì)是指非已建立的育種群體的部分的植物材料和與已建立的育種群體的成員無已知關(guān)系的植物材料."單元型"是指?jìng)€(gè)體從一個(gè)親本遣傳而來的成套的等位基因。因此二倍體個(gè)體具有兩個(gè)單元型.術(shù)語單元型通常更狹義地表示物理連鎖和/或不連鎖的與表型性狀相關(guān)的遣傳標(biāo)記(例如,序列多態(tài)性)."單元型區(qū)"(有時(shí)在文獻(xiàn)中也稱作單元型)是在單個(gè)染色體上物理連鎖的兩個(gè)或更多個(gè)遣傳標(biāo)記群(或其部分).通常,各區(qū)具有少數(shù)共同的單元型,并且可選擇唯一地確定這些單元型中各單元型的遣傳標(biāo)記亞群(即,"單元型標(biāo)記").短語"高通量篩選"是指測(cè)定法,在所述測(cè)定法中所用的方式允許篩選大量的遣傳標(biāo)記(例如,核苷酸序列)、大重的基因型個(gè)體或庫(kù)、或同時(shí)篩選兩者.在本發(fā)明的上下文中,高通量篩選是指對(duì)大量的個(gè)體或庫(kù)基因型的植物基因組核酸序列進(jìn)行篩選以鑒定遣傳標(biāo)記等位基因的存在."雜交"、"雜交植物"、或"雜交后代"是指從遺傳上具有差異的親本產(chǎn)生的個(gè)體(例如遣傳雜合的或絕大部分雜合的個(gè)體).通常,雜種的親本在幾個(gè)重要方面不同.雜種通常比任一個(gè)親本更具活力,但其不能純育.如果兩個(gè)個(gè)體在特定的基因座具有相同的等位基因,如果所述等位基因遣傳自一個(gè)共同的祖先(即,所迷等位基因是相同親本等位基因的拷貝),那么所述等位基因是"血源同一"的.另一可選擇的是所述等位基因是"狀態(tài)同一"(即,所迷等位基因表現(xiàn)出相同,但來源于兩個(gè)不同的等位基因拷貝).血源同一信息可用于連鎖研究;盡管血源同一信息可能特別有用,但血源同一和狀態(tài)同一信息都可用于關(guān)聯(lián)研究,例如此處描述的研究中,植物的"近交系"是指遣傳上純合的或接近純合的群體.例如,近交系可通過幾輪自交獲得.近交系可純育,例如對(duì)于一個(gè)或多個(gè)目的表型性狀而言."近交"、"近交植物"或"近交后代"是指從近交系中取樣的植物."連鎖"是指在相同染色體上不同基因座的等位基因由于其物理鄰近的原因?qū)е乱黄鸱蛛x的頻率高于在其偶然獨(dú)立傳遞時(shí)預(yù)期的頻率的趁勢(shì).短語"連鎖不平衡"(也稱作"等位基因關(guān)聯(lián)")是指一種現(xiàn)象,在所述現(xiàn)象中,在給定的群體中的兩個(gè)或更多個(gè)基因座上的特定等位基因在其從親本到子代分離時(shí)傾向于一起保持在連鎖群中,其頻率比從其單獨(dú)的頻率預(yù)測(cè)的頻率更高.例如,當(dāng)遣傳標(biāo)記等位基因和QTL等位基因一起發(fā)生的頻率高于從單獨(dú)的等位基因頻率預(yù)測(cè)的頻率時(shí),其顯示連鎖不平衡.值得注意的是連鎖是指基因座之間的關(guān)系,而連鎖不平衡是指等位基因之間的關(guān)系."基因座"是指染色體上的位置(例如,基因、遣傳標(biāo)記等),術(shù)語"核酸"包括任何對(duì)應(yīng)于核苷酸鏈的單體單位的物理鏈,包括核苷酸多聚體(例如一般的DNA或RNA多聚體)、PNAs、經(jīng)修飾的寡核苷酸(例如,包含對(duì)生物學(xué)RNA或DNA來說是非典型的堿基的寡核苷酸(例如2,-0-甲基化的寡核苷酸))等.核酸可以是例如單鏈或雙鏈的.除非另外指出,除了任何明確指出的序列外,本發(fā)明的特定核酸序列任選地包含或編碼互補(bǔ)序列."系譜"是指祖先系、個(gè)體或個(gè)體或相關(guān)個(gè)體家族的生殖質(zhì)的記錄.術(shù)語"表型性狀"是指植物的外觀和其它可檢測(cè)特征,所述外觀和特征是由其基因組與環(huán)境相互作用作用造成的.術(shù)語"多數(shù)"是指超過整體一半.例如,群體的多數(shù)超過該群體成員的一半."多核苷酸序列"或"核苷酸序列"是核苷酸的多聚體(例如寡核普酸、DNA、核酸等),或依賴于上下文,是代表核普酸多聚體的特征鏈.根據(jù)任何明確說明的多核苷酸序列,可確定給定的核酸或互補(bǔ)多核苷酸的序列(例如,互補(bǔ)核酸)."植物群體"是指植物的集合體.所述集合體包括至少兩林植物,和可以包括例如,IO抹或更多、50林或更多、IOO林或更多、500抹或更多、IOOO抹或更多、或甚至5000林或更多植物.群體的成員相互之間可以是相關(guān)的和/或不相關(guān)的;例如,植物相互之間可具有已知的系讒關(guān)系.術(shù)語"后代"是指特定植物(自交)或成對(duì)植物(異花傳粉)的后代.所述后代可以是例如F!、F2或任何后代."質(zhì)量性狀"是由一個(gè)或少數(shù)幾個(gè)表現(xiàn)主要表型效應(yīng)的基因控制的表型性狀.因?yàn)檫@個(gè)原因,質(zhì)重性狀通常是簡(jiǎn)單遣傳的,示例包括但不限于花的顏色、穗軸顏色和抗病性例如Northern玉米葉片枯萎病抗性,"數(shù)量性狀"是指可進(jìn)行數(shù)字(即,定量的或量化的)描迷的表型性狀,數(shù)量性狀通常在群體的個(gè)體間表現(xiàn)連續(xù)的變異;即表型性狀的數(shù)值差異是徵小的并且相互之間逐漸轉(zhuǎn)化.通常,植物群體中數(shù)重性狀的頻率分布表現(xiàn)鐘型曲線.數(shù)重性狀通常是基因座與環(huán)境相互作用或多個(gè)基因座(QTL)相互之間和/或與環(huán)境間相互作用的結(jié)果.數(shù)量性狀的示例包括植物的高度和產(chǎn)量.術(shù)語"數(shù)量性狀基因座"("QTL")或術(shù)語"標(biāo)記性狀關(guān)聯(lián)"是指遣傳標(biāo)記和染色體區(qū)域和/或影響目的性狀表型的基因之間的關(guān)聯(lián).通常,例如基于一個(gè)或多個(gè)文獻(xiàn)中公開的方法通過統(tǒng)計(jì)學(xué)確定該關(guān)聯(lián).QTL可以是染色體區(qū)域和/或具有至少兩個(gè)差異地影響表型性狀(數(shù)量性狀或質(zhì)量性狀)表達(dá)的等位基因的基因座,在本發(fā)明的上下文中,短語"有性雜交的"或"有性生殖"是指通過授粉使配子融合以產(chǎn)生種子."有性雜交"或"異花傳粉"是指由另一林植物給一林植物傳粉."自交"是通過自體受粉產(chǎn)生種子,即,花粉和胚珠來自同一抹植物."單交F1雜種"是指由兩個(gè)近交系之間雜交產(chǎn)生的Fi雜種."試驗(yàn)者"是指具有標(biāo)準(zhǔn)表型、已知特征和已確定的性能的系或單林植物."測(cè)交親本"是來自在有性雜交中用作親本的測(cè)交系的植物.通常,測(cè)交親本和與其雜交的植物無關(guān)和與其在遺傳上具有差異,當(dāng)與用于表型估計(jì)的個(gè)體或近交系雜交時(shí),試驗(yàn)者通常用于產(chǎn)生Fl后代。短語"頂交組合"是指將單個(gè)測(cè)交系和多個(gè)系雜交的方法.產(chǎn)生這些雜交的目的是確定雜交后代的表型性能;即,估計(jì)所述多個(gè)系中的每一個(gè)在雜交后代中產(chǎn)生想要的表型的能力,所述雜交后代通過測(cè)交來源于所迷系,"轉(zhuǎn)基因植物"是指通過任何除了有性雜交或自交的方式已導(dǎo)入一個(gè)或多個(gè)外源多核苷酸的植物.下面描述了可實(shí)施該目的的方法的示例,其包括土壌桿菌(Agrobacterium)介導(dǎo)的轉(zhuǎn)化、生物彈射擊(bioUstic)方法、電穿孔、inplanU等技術(shù).轉(zhuǎn)基因植物也可通過已導(dǎo)入外源多核苷酸的轉(zhuǎn)基因植物的有性雜交或自交產(chǎn)生."品種"是指根據(jù)分類學(xué)分類的物種的再分."品種"可與表示個(gè)體類群的術(shù)語"栽培品種"互換使用,所述個(gè)體在遣傳上與物種內(nèi)其它個(gè)體的群體不同.農(nóng)業(yè)品種是能夠在相同的物種中根據(jù)結(jié)構(gòu)特征和/或性能從其它品種區(qū)分的相似植物的類群.此處定義或表征各種其它的術(shù)語。詳述通過使用遣傳連鎖進(jìn)行的關(guān)聯(lián)研究提供了可選擇的鑒定影響目的表型的染色體區(qū)域和/或基因的方法.簡(jiǎn)而言之,雖然連鎖研究試?yán)цb定在一個(gè)或多個(gè)家系中與表型性狀共分離的QTL,但關(guān)聯(lián)研究通常試閨通過鑒定特定等位基因變體來鑒定QTL,所述特定等位基因變體與群體(不一定是雙親家系)中的表型性狀相關(guān).經(jīng)鑒定與性狀相關(guān)的等位基因變體可以是例如遣傳標(biāo)記的等位基因變體,所述變體與功能性變體(影響表型性狀的基因的等位基因)連鎖不平衡,或所迷遣傳標(biāo)記與功能性變體可以是同義的(例如,在編碼區(qū)域中導(dǎo)致被編碼的蛋白活性改變的SNP).連鎖不平衡是在群體中觀察到的現(xiàn)象,在所述群體中在兩個(gè)(或更多個(gè))基因座上的特定等位基因以高于兩個(gè)(或更多個(gè))等位基因頻率的積的頻率共同發(fā)生.例如,假定在基因座B上攜帶等位基因B的染色體上,基因座A發(fā)生突變產(chǎn)生新的等位基因A,.如果基因座A和B之間未發(fā)生重組,那么單元型A,Bn得以保存.如果基因座A和B之間發(fā)生重組,那么單元型未得以保存,最終,隨著連續(xù)多代發(fā)生重組,新等位基因A.將與其它B的等位基因按其相對(duì)頻率的比例發(fā)生(即,最終達(dá)到連鎖平衡),然而,在兩個(gè)群體或基因型雜交的第一分離代中,單元型A,Bn的頻率高于A.等位基因頻率和Bn等位基因頻率的積;即,觀察到連鎖不平衡.在隨機(jī)交配群體中,逼近平衡是重組頻率的函數(shù).對(duì)于未連鎖的基因座,各代中單元型頻率達(dá)到平衡值一半;基因座連鎖越緊密,群體中持續(xù)不平衡的時(shí)間越長(zhǎng).因此利用連鎖不平衡的關(guān)聯(lián)研究可合并過去許多代的重組,從而獲得高分辨率、精細(xì)尺度的基因定位(參見,例如,Xiong和Guo(1997)"Fine-scalemappingofquantitativetraitlociusinghistoricalrecombinations"Genetics145:1201-1218),本領(lǐng)域中已描迷了設(shè)計(jì)和進(jìn)行各種類型的關(guān)聯(lián)研究;參見,例如Rao和Province,eds.,(2001)AdvancesinGeneticsvolume42,GeneticDissectionofComplexTraits:Balding等人,eds.(2001)HandbookofStatisticalGenetics,JohnWileyandSonsLtd.;Borecki和Suarez(2001)"Linkageandassociation:basicconcepts"AdvGenet42i45-66jCardon和Bell(2001)"Associationstudydesignsforcomplexdiseases"NatRevGenet2:91-99j和Risch(2000)"Searchingforgeneticdeterminantsforthenewmillennium"Nature405:847-856,關(guān)聯(lián)研究已用于估計(jì)與表型性狀相關(guān)的候選基因(例如,Thornsberry等人(2001)"Dwarf8polymorphismsassociatewithvariationinfloweringUme"NatureGenetics28:286-289)和進(jìn)行全基因組掃描以鑒定對(duì)表型變異有貢獻(xiàn)的基因(例如,Paunio等人(2001)"Genome-widescaninanationwidestudysampleofschizophreniafamiliesinFinlandrevealssusceptibilitylocionchromosomes2qand5q"HumanMolecularGenetics10:3037-3048和Liu等人(2002)"Geno邊ewidelinkageanalysisofceliacdiseaseinFinnishfamilies"Am.J.Hum.Genet.70:51-59),很明顯,為了使關(guān)聯(lián)研究有力,在目的區(qū)域中必須存在連鎖不平衡(如果不存在連鎖不平衡,那么關(guān)聯(lián)研究只能鑒定其自身是實(shí)際功能性變體的標(biāo)記),因此連鎖不平衡減少的速率(以堿基對(duì)數(shù)目計(jì)算)影響關(guān)聯(lián)研究的分辦率和所需的標(biāo)記數(shù)目,這些考慮可影響例如用于分析的群體的選擇.許多研究已檢查了人中的連鎖不平衡(例如,Reich等人(2001)"Linkagedisequilibriuminthehu邁angenome,,Nature411:199-204和Daly等人,(2001)"High-resolutionhaplotypestructureinthehumangenome"NatureGenetics29:229-232).在植物中也已分析了連鋪不平衡;例如,最近由作者和其它人員進(jìn)行的研究表明在玉米SNP基因座之間的強(qiáng)連鎖不平衡延伸至少500bp(Ching等人(2002)"SNPfrequency,haplotypestructureandlinkagedisequilibriuminelitemaizeinbredlines"BMCGenetics3:19:也參見Remington等人(2001)"Structureoflinkagedisequilibriumandphenotypicassociationsinthemaizegenome"Proc.Natl.Assoc.Sci,98:11479-11484rTenaillon等人(2001)"PatternsofDNAsequencepolymorphismalongchromosome1of邁aize"ProcNatlAcadSciUSA98:9161-9166;和Jannoo等人(1999)"Linkagedisequilibriumamongmodernsugarcanecultivars"TheorAppGenet99:1053-1060),盡管也進(jìn)行了許多涉及人和動(dòng)物的關(guān)聯(lián)研究(參見,例如,Paunio等人(2001)"Genome-widescaninanationwidestudysampleofschizophreniafamiliesiaFinlandrevealssusceptibilitylocionchromosomes2qand5q"HumanMolecularGenetics10:3037-3048',Liu等人(2002)"Genomewidelinkageanalysisofceliac-iseaseinFinnishfamilies"Am.J.Hum.Genet.70:51-59;Terwilliger(2001)"Ontheresolutionandfeasibilityofgenomescanningapproaches"Adv.Genet.42:351-391j和Grupe等人(2001)"Insilicomappingofcomplexdisease—relatedtraitsinmice"Science292:1915-1918),但較少進(jìn)行涉及植物的研究.植物系謙提出了幾個(gè)要求修飾或擴(kuò)展用于人和動(dòng)物的方法的挑戰(zhàn)(參見,例如,Yi和Xu(2001)"Bayesianmappingofquantitativetraitlociundercomplicatedmatingdesigns"Genetics157:1759-1771).例如,用于植物的QTL作困方法可能需要處理自交和有性雜交、作為育種群體建立者的純系近交系和巨大的家系.已經(jīng)提出了用于在植物中進(jìn)行解釋這些因素的關(guān)聯(lián)研究的Bayesian方法,例如,Yi和Xu的(2001)"Bayesianmappingofquantitativetraitlociundercomplicatedmatingdesigns"Genetics157:1759-1771和Bink等人(2002)"MultipleQTLmappinginrelatedplantpopulationsviaapedigree-analysisapproach"Theor.Appl.Genet.104:751-762描述了用于在復(fù)雜的植物群體中進(jìn)行QTL作困的Bayesian方法,這些方法合并復(fù)雜植物群體(例如,笫一植物群體)的基因型、表型和家系系謙信息,使用這樣的復(fù)雜群體提供了大量的益處.例如,不需要產(chǎn)生大量的單交雜種(或來自雙親雜交的大量的分離F2后代等)并確定其表型來進(jìn)行分析;相反地,可從所述育種群體中選擇植物和/或系,其中大重不同類型的后代的表型估計(jì)是育種程序的常規(guī)部分.育種程序通常要估計(jì)大量后代的表型,通常要在兩個(gè)或更多個(gè)地點(diǎn)進(jìn)行重復(fù)估計(jì)(因此提供了有關(guān)環(huán)境影響的數(shù)據(jù)).因?yàn)樾枰喈?dāng)多的時(shí)間和努力來準(zhǔn)確估計(jì)大部分經(jīng)濟(jì)上重要的表型性狀,所以使用作為正在進(jìn)行的育種程序的部分產(chǎn)生的數(shù)據(jù)節(jié)省了大重的時(shí)間和成本以及提供了潛在地更可靠的表型數(shù)據(jù),并因此獲得更好的困.參見,例如,Rafalski(2002)"Applicationsofsinglenucleotidepolymorphismsincropgenetics"Curr-Opin,PlantBio,5-94-100和Rafalski(2002)"Novelgeneticmappingtoolsinplants:SNPsandLD-basedapproaches**PlantSci162:329-333,本發(fā)明提供了使用笫一植物群體(例如,育種群體或其亞群)中植物的遣傳標(biāo)記基因型、表型信息和家系關(guān)系數(shù)據(jù)鑒定至少一個(gè)遣傳標(biāo)記和表型性狀之間關(guān)聯(lián)的方法,例如,使用Bayesian方法,例如上面提及的方法.所述方法包括基于笫二靶植物群體的一個(gè)或多個(gè)成員的一個(gè)或多個(gè)遣傳標(biāo)記的基因型來預(yù)測(cè)其表型性狀值,所述遺傳標(biāo)記與所述性狀相關(guān).所述方法具有很多應(yīng)用,例如,應(yīng)用于在植物(例如,雜交作物植物;類似的方法可用于動(dòng)物)中進(jìn)行的育種程序.例如,所述方法可用于預(yù)測(cè)雜交后代(例如,由給定的具有已知標(biāo)記基因型的成對(duì)近交系雜交產(chǎn)生的(實(shí)際或假設(shè)地)單交雜種)的表型性能.類似地,通過允許預(yù)測(cè)來自雜交的潛在后代的表型性能,所述方法可有助于在一個(gè)或多個(gè)雜交中對(duì)用作親本的植物(例如,近交植物、雜交植物等)的選擇;所述方法允許親本植物的選擇,所述親本植物的子代具有最高的擁有想要的表型的概率.第一類普通的實(shí)施方案提供了在靶植物群體中預(yù)測(cè)表型性狀值的方法.在所述方法中,提供了至少一種遣傳標(biāo)記和表型性狀之間的關(guān)聯(lián).在笫一植物群體中估計(jì)關(guān)聯(lián),所述笫一植物群體是已建立的育種群體或其部分.根據(jù)統(tǒng)計(jì)學(xué)模型估計(jì)笫一植物群體中的關(guān)聯(lián),所述模型合并笫一植物群體的一套遣傳標(biāo)記基因型和第一植物群體中的表型性狀值.然后提供靶植物群體中至少一個(gè)成員的表型性狀值.根據(jù)所述關(guān)聯(lián)和根據(jù)至少一個(gè)與表型性狀相關(guān)的遣傳標(biāo)記的至少一個(gè)成員的基因型預(yù)測(cè)所述值.通過在經(jīng)實(shí)驗(yàn)確定所述值之前預(yù)測(cè)所述值或用預(yù)測(cè)值代替通過實(shí)驗(yàn)確定的值.表型性狀可以是數(shù)量性狀,例如,提供數(shù)重值的性狀.可選擇地,表型性狀可以是質(zhì)量性狀,例如,提供質(zhì)量值的性狀.所迷性狀可通過單個(gè)基因進(jìn)行確定,或其可通過兩個(gè)或更多個(gè)基因進(jìn)行確定.方法任選地包括選擇至少一個(gè)靶植物群體的成員,所迷成員具有想要的預(yù)測(cè)的表型性狀值,和任選地也包括將至少一個(gè)選擇的靶植物群體的成員與至少一個(gè)其它的植物雜交(或自交至少一個(gè)選擇的成員,例如,以建立近交系).笫一植物群體通常包含多個(gè)近交種、單交Fl雜種或其組合.例如,在一類實(shí)施方案中,笫一植物群體包含多個(gè)近交種,在另一類實(shí)施方案中,笫一植物群體包含多個(gè)單交F1雜種.在另一類實(shí)施方案中,笫一植物群體包含多個(gè)近交種和單交F1雜種的組合.笫一植物群體任選地由近交種、單交Fl雜種或其組合組成.近交種可來自相互之間相關(guān)和/或無關(guān)的近交系,而單交F1雜種可通過所述近交系和/或一個(gè)或多個(gè)另外的近交系的單交產(chǎn)生.如所指出的,笫一植物群體的成員可從已存在的、已建立的育種群體(例如,商業(yè)可購(gòu)得的育種群體)取樣.已建立的育種群體的成員通常是相對(duì)少量的建立者的后代,從而通常是高度相關(guān)的,除了建立者之外的各成員的祖先通常是已知的,因此,例如,已建立的育種群體可包含至少三個(gè)建立者和其后代,其中所述后代的祖先是已知的(例如,至少10個(gè)建立者,至少50個(gè)建立者,至少100個(gè)建立者,或至少200個(gè)建立者).例如,已建立的育種群體可包含大約IOO至大約200個(gè)建立者(例如,大約30-40個(gè)雌性建立者和80-150個(gè)雄性建立者)和其已知祖先的后代.育種群體通常跨越許多代和育種周期.例如,已建立的育種群體可跨越3、4、5、6、7、8、9或更多個(gè)育種周期).因此笫一植物群體的成員可具有相同的特征.在一些實(shí)施方案中,第一植物群體的成員可跨越至少3個(gè)育種周期(例如至少4、5、6、7、8或9個(gè)育種周期).在一類示例性實(shí)施方案中,第一植物群體包含多個(gè)近交種、單交F1雜種或其組合,各近交種和/或單交F1雜種的祖先是已知的,并且各近交種和/或單交Fl雜種是3個(gè)或更多個(gè)建立者(例如,10、50或IOO或更個(gè)建立者)中至少一個(gè)的后代。第一群體任選地包含一個(gè)或多個(gè)建立者,例如群體的其它成員所起源的建立者.第一植物群體基本上可包含任何數(shù)目的成員.例如,第一植物群體任逸地包舍大約50至大約5000個(gè)成員(例如,第一植物群體可包含50-5000個(gè)近交種和/或單交Fl雜種).在另外一個(gè)示例中,第一植物群體可包含至少大約50、100、200、500、1000、2000、3000、4000、5000或甚至6000或更多成員.僅作為一個(gè)特定的示例,笫一植物群體可包含大約1000個(gè)近交種和大約3000至5000個(gè)單交雜種.值得注意的是第一植物群體任選地具有上述特征的任何組合.僅作為一個(gè)示例,笫一植物群體可包含50至5000個(gè)成員,包括多個(gè)近交種和/或單交Fl雜種,其各自具有已知的祖先和起源于三個(gè)或更多個(gè)建立者中至少一個(gè).困1是示意性地說明各種近交系和單交雜種之間相互關(guān)系的系謙,所述近交系和單交雜種可包含例如第一植物群體.在困1中,后接數(shù)字的SX表示單交雜種,而其它字母組合表示各種近交系(除了LANC,其表示近交系LNC1所起源的群體).在該困中,建立者包括例如MP1、FP3、FP1、MA1、FP2、MB5、LNC1和DRS.連接兩個(gè)個(gè)體的線表示一個(gè)是另一個(gè)的祖先.例如,將近交系MFP2和MA21雜交,幾代自交之后,產(chǎn)生近交系MA32,(在該示例中,連接MFP2和MA32或MA21和MA32的線表示一個(gè)育種周期的距離),在另一個(gè)實(shí)例中,將近交系F39和MA32雜交產(chǎn)生單交Fl雜種SX34。(在該實(shí)例中,連接F39和SX34或MA32和SX34的線表示少于一個(gè)育種周期的距離).困2示意性地說明示例性商業(yè)可購(gòu)得的植物育種程序,在該實(shí)例中是玉米,例如,從兩個(gè)群體(一個(gè)雄性和一個(gè)雌性)開發(fā)近交系,在頂交和雜交測(cè)試相中,用來自相反群體(TC1和TC2,笫一和笫二年頂交;MET,多環(huán)境測(cè)試)的試驗(yàn)者進(jìn)行頂交.通常,笫一植物群體表現(xiàn)目的表型性狀的變異性(例如,針對(duì)數(shù)童表型性狀的數(shù)量變異性).第一植物群體中的表型性狀值可通過例如估計(jì)笫一植物群體中的成員之間的表型性狀(例如對(duì)所述群體成員之間的數(shù)量表型性狀進(jìn)行定量)獲得.可在包含笫一植物群體的成員(例如,近交種和/或單交F1雜種)中估計(jì)表型.可選擇地,通過在至少一個(gè)與至少一個(gè)測(cè)交親本的頂交組合中估計(jì)笫一植物群體的成員之間的表型性狀可獲得第一植物群體中的表型性狀值(例如,對(duì)于只能在雜種中估計(jì)的表型性狀).表型性狀基本上可以是任何數(shù)量或質(zhì)量表型性狀,例如,農(nóng)藝學(xué)和/或經(jīng)濟(jì)上重要的表型性狀.例如,表型性狀可以選自產(chǎn)重、谷粒含水重、谷粒含油量、根抗倒伏性、莖桿抗倒伏性、林高、谷穗髙、抗病性、抗蟲性、抗旱性、谷粒蛋白含量、試驗(yàn)重量、視覺或美學(xué)外觀和穗軸顏色.這些性狀和用于估計(jì)(例如,定量)所述性狀的技術(shù)在本領(lǐng)域是熟知的.例如,谷粒產(chǎn)量是作物性能的常規(guī)測(cè)量.試驗(yàn)重量是針對(duì)質(zhì)重的測(cè)量.谷粒含水量對(duì)于貯存非常重要,而根和莖桿抗倒伏性影響直立能力(standabiUty)并且在收獲中非常重要.所迷方法類似地可用于其它表型性狀,例如谷粒肌醇六褲酸含量.成套遣傳標(biāo)記基本上可包含任何方便的遣傳標(biāo)記.例如,成套的遣傳標(biāo)記可包含一個(gè)或多個(gè)單核苷酸多態(tài)性(SNP)、多核苷酸多態(tài)性、至少一個(gè)核苷酸的插入或缺失(indel)、簡(jiǎn)單序列重復(fù)(SSR)、限制性片段長(zhǎng)度多態(tài)性(RFLP)、隨機(jī)擴(kuò)增多態(tài)DNA(RAPD)標(biāo)記或任意片段長(zhǎng)度多態(tài)性(AFLP).對(duì)于本領(lǐng)域技術(shù)人員來說很明顯的是所需要的標(biāo)記數(shù)目可以變化,例如依賴于目的植物物種中的連鎖不平衡降低的速率和/或依賴于進(jìn)行的關(guān)聯(lián)分析類型而變化.成套遣傳標(biāo)記可包括例如1至50,000個(gè)標(biāo)記(例如,I至IO,OOO個(gè)標(biāo)記),在一類實(shí)施方案中,成套的遣傳標(biāo)記可以包含大約50至大約2500個(gè)標(biāo)記.例如,成套遺傳標(biāo)記可包含至少大約50、100、250、500、1000、2000或甚至2500或更多個(gè)遺傳標(biāo)記.在某些實(shí)施方案中,成套遣傳標(biāo)記包含1至IO個(gè)標(biāo)記(例如,在候選基因研究中,需要相對(duì)少的標(biāo)記).在其它實(shí)施方案中,成套的遣傳標(biāo)記包含500至50,000個(gè)標(biāo)記(例如,對(duì)于全基因組掃描).第一植物群體中成套的遣傳標(biāo)記的基因型可通過實(shí)驗(yàn)確定、預(yù)測(cè)或其組合。例如,在一類實(shí)施方案中,通過實(shí)驗(yàn)確定存在于植物群體中的各近交種基因型,并預(yù)測(cè)存在于第一植物群體中各單交F1雜種的基因型(例如,通過實(shí)驗(yàn)確定各單交雜種的兩個(gè)近交親本的基因型).基本上可通過任何方便的技術(shù)經(jīng)實(shí)驗(yàn)確定植物基因型.許多用于發(fā)現(xiàn)和/或確定遣傳標(biāo)記基因型的應(yīng)用技術(shù)在本領(lǐng)域是已知的(例如,在下列標(biāo)題為"遣傳標(biāo)記"的部分描迷的技術(shù)).在一類優(yōu)選的實(shí)施方案中,對(duì)來自各近交種的成套DNA片段進(jìn)行測(cè)序以通過實(shí)驗(yàn)確定各近交系的基因型.因?yàn)樾蛄械亩鄳B(tài)性(例如,遺傳標(biāo)記)通常在非編碼區(qū)域(例如,內(nèi)含子和非翻譯區(qū)域)中更普遍,所以在一類實(shí)施方案中,進(jìn)行測(cè)序的成套DNA片段包含一個(gè)或多個(gè)(例如,兩個(gè)或更多個(gè))基因的5'非翻譯區(qū)域和/或3'非翻譯區(qū)域.測(cè)序技術(shù)(例如,PCR擴(kuò)增子直接測(cè)序)是熟知的(參見例如,Ching等人(2002)"SNPfrequency,haplotypestructureandlinkagedisequilibriuminelitemaizeinbredlines"BMCGenetics3:19),在一些實(shí)施方案中,單個(gè)遣傳標(biāo)記與表型性狀相關(guān),而在其它實(shí)施方案中,兩個(gè)或更多個(gè)遺傳標(biāo)記(和/或染色體區(qū)域)與表型性狀相關(guān).因此,在一類實(shí)施方案中,提供包含兩個(gè)或更多個(gè)遣傳標(biāo)記的單元型和表型性狀之間的關(guān)聯(lián).包含單元型的遣傳標(biāo)記可以是不連鎖的(例如,可鑒定兩個(gè)或更多個(gè)影響表型性狀的QTL,各QTL與其中一個(gè)標(biāo)記相關(guān)),或遣傳標(biāo)記可以是物理連鎖的(例如,遺傳標(biāo)記可包含與表型性狀相關(guān)的單元型區(qū),例如SNP單元型標(biāo)記的單元型區(qū)).如所指出的,根據(jù)統(tǒng)計(jì)學(xué)模型估計(jì)第一植物群體中的關(guān)聯(lián),所迷統(tǒng)計(jì)學(xué)模型合并有關(guān)笫一植物群體的基因型和表型信息.通過合并笫一植物群體的成員之間的家系關(guān)系和遣傳標(biāo)記及表型性狀數(shù)據(jù),所述統(tǒng)計(jì)學(xué)模型通常也利用第一群體中植物之間的關(guān)系.通過例如包含確定特定等位基因是來自母本還是父本的標(biāo)志,或通過任何其它允許使用系謙關(guān)系信息追蹤在不同個(gè)體中血源同一的等位基因的方法,所述模型可合并家系關(guān)系.在一類優(yōu)選的實(shí)施方案中,通過使用線性模型、混合線性模型或非線性模型進(jìn)行Bayesian分析,來估計(jì)至少一個(gè)遺傳標(biāo)記和表型性狀之間的關(guān)聯(lián).可通過例如可逆的跳躍馬爾可夫鏈MonteCarlo算法、A方法或特征似然算法(profilelikelihoo"lgorithm)進(jìn)行Bayesian分析.例如,在一類這樣優(yōu)選的實(shí)施方案中,通過使用線性模型進(jìn)行Bayesian分析(通過可逆的跳躍馬爾可夫鏈MonteCarlo算法進(jìn)行的Bayesian分析)來估計(jì)關(guān)聯(lián).通常,估計(jì)關(guān)聯(lián)包括(和/或允許)確定一個(gè)或多個(gè)相關(guān)近交種和雜種的系詳中的至少一個(gè)遺傳標(biāo)記的建立者等位基因的血緣同一信息,和允許在整個(gè)這樣的系讒中追蹤至少一個(gè)遣傳標(biāo)記.通常,通過計(jì)算機(jī)程序或系統(tǒng)進(jìn)行Bayesian分析(例如,通過可逆的跳躍馬爾可夫鏈MonteCarlo算法進(jìn)行的),Bayesian方法、MonteCarlo算法等在本領(lǐng)域是熟知的,用于理解相關(guān)概念的普通文獻(xiàn)包括Gibas和Jambeck(2001)Bioinfor咖ticsComputerSkills,(KReilly,SebasUpol,CA;Pevzner(2000)ComputationalMolecularBiologyandAlgorithmicApproach,TheMITPress,CambridgeMA;Durbin等人(1998)BiologicalSequenceAnalysis:ProbabilisticModelsofProteinsandNucleicAcids,CambridgeUniversityPress,Cambridge,UK;Hinchliffe(1996)ModelingMolecularStructuresJohnWileyandSons,NY,NYj和Rashidi和Buehler(2000)BioinformaticBasics:ApplicationsinBiologicalScienceandMedicineCRCPressUX,BocaRaton,FL,在各種來源中提供了MonteCarlo統(tǒng)計(jì)學(xué)分析的詳細(xì)討論,所述來源包括,例如,Robert等人(1999)MonteCarloStatisticalMethods,Springer-Verlag;Chen等人(2000)MonteCarloMethodsinBayesianComputation,Springer-Verlag;Sobol等人(1994)APrimerfortheMonteCarloMethod,CRCPress,LLC;Manno(1999)IntroductiontotheMonte-CarloMethod,AkademiaiKiado;和Rubinstein(1981)SimulationandtheMonteCarloMethod,JohnWiley&Sons,Inc..有關(guān)這些統(tǒng)計(jì)學(xué)方法的另外的詳細(xì)內(nèi)容參見,例如,Carlin等人(1995)"Bayesian邁odelchoiceviaMarkovchainMonteCarlomethods"J.RoyalStat,Soc.SeriesB,57:473-84',Carlin等人(199""AniterativeMonteCarlomethodfornonconjugateBayesUnanalysis"StatisticsandComputing1:119-28;和Pillardy等人(2001)"Confor邁aticm-familyMonteCarlo:Anewmethodforcrystalstructureprediction"Proc.Natl.Acad.Sci.USA98(22):12351-6.特別地,用于QTL作困(即,用于估計(jì)成套遣傳標(biāo)記和表型性狀之間的關(guān)聯(lián))的Bayesian方法在本領(lǐng)域是已知的.例如,Bink等人(2002)"MultipleQ1Xmappinginrelatedplantpopulationsviaapedigree—analysisapproach"Theor.Appl,Genet.104:751—762以及Yi和Xu(2001)"Bayesianmappingofquantitativetraitlociundercomplicatedmatingdesigns"Genetics157:1759-1771描迷了通過可逆的跳躍馬爾可夫鏈MonteCarlo算法和使用線性模型進(jìn)行的Bayesian分析,并且以其全文在此引用作為參考.例如,Bink等人提出的模型合并了兩抹或更多林植物成套遺傳標(biāo)記的基因型、在所述植物中觀察到的表型性狀值和植物之間的家系關(guān)系(通過使用表明母本或父本來源的分離標(biāo)志,例如,遣傳標(biāo)記和因此連鎖的QTL等位基因的分離標(biāo)志).該模型也包括影響性狀的非遣傳因素(例如,環(huán)境效應(yīng)).Bayesian分析、QTX作困等也描迷于例如,Sorensen和Gianola(2002)Likelihood,BayesianandMCMCmethodsinquantitativegenetics,Springer,NewYork;Jannink和Fernando(2004)"Onthemetropolis-hastingsacceptanceprobabilitytoaddordropaquantitativetraitlocusinmarkovchainmontecarlo—basedbayesiananalyses"Genetics166:641—643;Wu和Jaimink(2004)"OptimalsamplingofapopulationtodetermineQTLlocation,variance,andallelicnumber"TheorApplGenet108:1434—42;Jannink(2003)"Selectiondynamicsandlimitsunderadditive-by-additiveepistaticgeneaction"CropSci43:489-497;H和Xu(2000)"Bayesianmappingofquantitativetraitlociundertheidentity-by-descent-basedvariancecomponentmodel"Genetics156:"1-422;Berry等人(2002)"Assessingprobabilityofancestryusingsimplesequencerepeatprofiles:Applicationsto邁aizehybridsandinbreds"Genetics161:813-824;Berry等人(2003)"Assessingprobabilityofancestryusingsimplesequencerepeatprofiles:Applicationstomaizeinbredlinesandsoybeanvarieties"Genetics165:331-342;以及Jannink和Wu(2003)"EstimatingallelicnumberandidentityinstateofQTLsininterconnectedfamilies"GenetRes81:133-44,可在www.public.iastate.edu/~jjanninlc/Research/Software.htm上公開獲得用于在相互聯(lián)系的群體中進(jìn)行QTL的Bayesian分析的示例性軟件包.在另一類優(yōu)選的實(shí)施方案中,通過進(jìn)行傳遞不平衡檢驗(yàn)來估計(jì)關(guān)聯(lián)(參見,例如,此處的實(shí)施例和參考文獻(xiàn)).在另一類實(shí)施方案中,通過最大似然混合線性或非線性分析來估計(jì)關(guān)聯(lián)(參見,例如,Lynch和Walsh(1998)GeneticAnalysisofQuantitativeTraits,SinauerAssociates,Inc.,SunderlandMA,pp746-755)在另一類實(shí)施方案中,通過人工神經(jīng)網(wǎng)絡(luò)在笫一植物群體中估計(jì)關(guān)聯(lián).該網(wǎng)絡(luò)在本領(lǐng)域中是已知的;參見,例如,Gurney(1999)AnIntroductiontoNeuralNetworks,UCLPress,1GunpowderSquare,UmdonEC4A3DE,UKjBishop(1995)NeuralNetworksforPatternRecognition,OxfordUnivPress;ISBN:0198538642;Ripley,Hjort(1995)PatternRecognitionandNeuralNetworks,CambridgeUniversityPress(Short);和Masters(1993)PracticalNeur&lNetworkRecipesinC++(Book&Diskedition)AcademicPress,靶植物群體基本上可包含任何數(shù)目的成員,所述成員相互之間和與笫一植物群體的成員之間相關(guān)和/或不相關(guān),靶植物群體的成員通常自身不包含第一植物群體.因此,靶植物群體可包含,例如近交植物、雜交植物或其組合.雜交植物可包含,例如,單交雜種、雙雜交雜種、三交雜種后代或基本上任何其它雜種.在一類優(yōu)選的實(shí)施方案中,靶植物群體包含含有由近交系之間單交產(chǎn)生的Fl后代的雜交植物.這些Fl后代可通過例如包含第一植物群體(其中雜種植物不包含笫一植物群體)的近交種之間的單交產(chǎn)生,通過新的近交種之間的單交產(chǎn)生,所迷新的近交種包含優(yōu)選的等位基因(遺傳標(biāo)記和/或QTL等位基因),所述等位基因與用于關(guān)聯(lián)作困分析的近交種血源同一或狀態(tài)同一,或通過其組合產(chǎn)生.類似地,在一類實(shí)施方案中,靶植物群體包含后生世代,所述后生世代由包含至少一個(gè)笫一植物群體的成員的育種雜交產(chǎn)生(即,把植物群體包含至少一個(gè)第一植物群體的成員的F2或更晚期后代).值得注意的是靶植物群體可包含實(shí)際活的植物和/或假定的植物(例如,假定的通過雜交給定的具有已知遣傳標(biāo)記基因型的成對(duì)近交系產(chǎn)生的單交雜種).通常,如果將所述方法用于假定的靶植物群體中時(shí),那么至少一抹真實(shí)的植物(例如,具有最想要的預(yù)測(cè)的表型性狀值的植物)實(shí)際上作為活的植物產(chǎn)生,可通過實(shí)驗(yàn)確定和/或預(yù)測(cè)靶植物群體成員的至少一個(gè)與表型性狀相關(guān)的遣傳標(biāo)記的基因型.因此,在一類實(shí)施方案中,可通過例如高通量的篩選經(jīng)實(shí)驗(yàn)確定至少一個(gè)靶植物群體的成員的至少一個(gè)遺傳標(biāo)記的基罔型.在另一類實(shí)施方案中,預(yù)測(cè)了至少一個(gè)靶植物群體的成員的至少一個(gè)遣傳標(biāo)記的基因型.例如,如果知道其近交親本的基因型,就可預(yù)測(cè)靶群體的單交Fl雜種成員的基因型.例如,通過合并系譜和遣傳標(biāo)記信息(例如,遣傳標(biāo)記基因型和遣傳標(biāo)記等位基因的血源同一和/或狀態(tài)同一信息)兩者的方法可預(yù)測(cè)靶植物群體的至少一個(gè)成員的表型性狀值.在優(yōu)選種類的實(shí)施方案中,使用最佳線性無偏預(yù)測(cè)方法預(yù)測(cè)把植物群體的至少一個(gè)成員的表型性狀值.最佳線性無偏預(yù)測(cè)方法在本領(lǐng)域是已知的;參見,例如Gianola等人(2003)"OnMarker-AssistedPredictionofGeneticValue:BeyondtheRidge7*Genetics163:347-365和Binlc等人(2002)"MultipleQTLmappinginrelatedplantpopulationsviaapedigree—analysisapproach"Theor.Appl.Genet.104:751-762.可選擇地,可使用其它方法預(yù)測(cè)靶植物群體的至少一個(gè)成員中的表型性狀值,例如,多重回歸方法、選擇指數(shù)技術(shù)、脊回歸方法、線性最優(yōu)化方法或非線性最優(yōu)化方法.這些方法是眾所周知的;參見,例如,Johnson,B.E.等人(1988)"Amodelfordeterminingweightsoftraitsinsimultaneousmultitraitselection"CropSci.28:723-728。笫一和靶植物群體基本上可包含任何類型的植物.例如,在優(yōu)選種類的實(shí)施方案中,第一和靶植物群體包含二倍體植物(例如,由二倍體植物組成).如前面指出的,所述方法特別地適用于雜交作物植物,因此,在優(yōu)選的實(shí)施方案中,第一和靶植物群體逸自玉米(例如,玉蜀黍)、大豆、高梁、小麥、向日葵、水稻、低芥酸芥子、綿花和栗.由此處的方法鑒定的QTL(例如,與至少一個(gè)與表型性狀相關(guān)的遺傳標(biāo)記連銷的QTL)可任選地被克隆和表達(dá),例如,以產(chǎn)生具有想要的表型性狀值的轉(zhuǎn)基因植物.因此,在一類實(shí)施方案中,所述方法包括克隆與至少一個(gè)與表型性狀相關(guān)的遣傳標(biāo)記連鎖的基因,其中所迷基因的表達(dá)影響所述表型性狀.所述方法任選地也包括構(gòu)建在宿主植物中表達(dá)克隆的基因的轉(zhuǎn)基因植物。數(shù)字系統(tǒng)一般地,可使用各種自動(dòng)化的系統(tǒng)進(jìn)行一些或所有此處提到的方法步驟.除了實(shí)踐一些或所有此處的方法步驟外,數(shù)字或模擬系統(tǒng)(例如,包含數(shù)字或棋擬計(jì)算機(jī))也可控制各種其它功能,例如用戶可視顯示(例如,以允許用戶觀看方法結(jié)果)和/或輸出特征的控制(例如,以幫助標(biāo)記輔助的選擇或自動(dòng)化田間設(shè)備的控制),例如,通過計(jì)算機(jī)程序或程序(例如,進(jìn)行或幫助進(jìn)行傳遞不平衡檢驗(yàn)、Bayesian分析和/或表型預(yù)測(cè)的程序)任選地(且一般地)進(jìn)行上述方法中的某些方法.因此,本發(fā)明提供了數(shù)字系統(tǒng),例如,計(jì)算機(jī)、計(jì)算機(jī)可閱讀介質(zhì)和/或包含用于進(jìn)行此處的方法的指令(例如,包含在合適的軟件中的)的集成系統(tǒng).例如,如此處所描述的,包含估計(jì)笫一植物群體中至少一個(gè)遺傳標(biāo)記和表型性狀之間的關(guān)聯(lián)和預(yù)測(cè)第二靶植物群體的至少一個(gè)成員中表型性狀值的指令的數(shù)字系統(tǒng),是本發(fā)明的特征.數(shù)字系統(tǒng)也可包括對(duì)應(yīng)于成套遺傳標(biāo)記的植物基因型、表型值和/或家系關(guān)系的信息(數(shù)據(jù)).所迷系統(tǒng)也可幫助用戶根據(jù)此處的方法進(jìn)行標(biāo)記輔助的選擇,或可控制自動(dòng)進(jìn)行選擇、收獲和/或育種方案的田間設(shè)備.標(biāo)準(zhǔn)的臺(tái)式應(yīng)用例如文字處理軟件(例如,MicrosoftWord1"或CorelWordPerfect,和/或數(shù)據(jù)庫(kù)軟件(例如,電子制表軟件例如MicrosoftExcel、CorelQuattroPro"1或數(shù)據(jù)庫(kù)程序例如MicrosoftAccess或Paradox)可適用于本發(fā)明,其中通過輸入裝入數(shù)字系統(tǒng)的存儲(chǔ)器內(nèi)的數(shù)據(jù),和對(duì)所迷數(shù)據(jù)進(jìn)行如此處提到的操作.例如,系統(tǒng)可包括前述的軟件,所述軟件使合適的系謙數(shù)據(jù)、表型信息、表型和系譜之的關(guān)聯(lián)等,例如,與用戶界面(例如,在標(biāo)準(zhǔn)搮作系統(tǒng)例如Windows,Macintosh和LINUX系統(tǒng)中的GUI)結(jié)合使用以進(jìn)行任何此處提到的分析,或簡(jiǎn)單地獲取用于此處的方法中的數(shù)據(jù)(例如,在電子制表軟件中).用于進(jìn)行統(tǒng)計(jì)學(xué)分析的軟件也可包括在數(shù)字系統(tǒng)中,例如,可使用軟件,例如描述于Bink等人(2002)"MultipleQTLmappinginrelatedplantpopulationsviaapedigree—analysisapproach"Theor.A卯l.Genet.104:751-762,或其經(jīng)修飾的版本中的軟件進(jìn)行Bayesian分析.困3示意性地描述了對(duì)復(fù)雜系詳中QTLs進(jìn)行該Bayesian分析的軟件執(zhí)行.系統(tǒng)通常包括,例如數(shù)字計(jì)算機(jī),所述計(jì)算機(jī)具有如下軟件和輸入軟件系統(tǒng)的數(shù)據(jù)集,所述軟件用于進(jìn)行關(guān)聯(lián)分析和/或表型值預(yù)測(cè),或用于進(jìn)行Bayesian分析,例如,通過可逆的跳躍馬爾可夫鏈MonteCarlo算法等進(jìn)行,所述數(shù)據(jù)集包括植物的成套遺傳標(biāo)記的基因型、表型值、家系關(guān)系等.所述計(jì)算機(jī)可以是,例如,PC(Intelx86或Pentium芯片兼容的D0S、TM0S2、T"WIND0WS、"WINDOWSNT、WIND0WS95、WIND0WS98、TMLINUX、Apple-兼容的、MACINTOSH兼容的、PowerPC兼容的或UNIX兼容的(例如,SUN"工作站)機(jī)器)或本領(lǐng)域技術(shù)人員已知的其它商業(yè)上通用的計(jì)算機(jī).根據(jù)此處的方法,通過使用標(biāo)準(zhǔn)的編程語言例如Visualbasic、Fortran、Basic、Java等,本領(lǐng)域技術(shù)人員可編制用于進(jìn)行關(guān)聯(lián)分析和/或表型值預(yù)測(cè)的軟件,任何系統(tǒng)控制器或計(jì)算機(jī)任選地包括監(jiān)視器,所述監(jiān)視器可包括例如,陰極射線管("CRT")顯示器,平板顯示器(例如,活性基質(zhì)液晶顯示器、液晶顯示器)等.計(jì)算機(jī)電路通常裝入包含大量臬成電路芯片例如微處理器、存儲(chǔ)器、接口電路等的盒子中.所迷盒子任選地也包含硬盤驅(qū)動(dòng)器、軟盤驅(qū)動(dòng)器、高容量抽取式驅(qū)動(dòng)器例如可寫CD-ROM和其它普通的外周元件.輸入設(shè)備例如鍵盤或鼠標(biāo)任選地提供來自用戶的輸入和在相關(guān)的計(jì)算機(jī)系統(tǒng)中為用戶提供對(duì)遺傳標(biāo)記基因型、表型值等的選擇.所述計(jì)算機(jī)通常包括合適的軟件,所迷軟件用于接受用戶指令,其形式為用戶輸入指定參數(shù)字段的形式,例如,在GUI中,或預(yù)編程序的指令的形式,例如用于各種不同特定操作的預(yù)編程序的指令,然后軟件將這些指令轉(zhuǎn)化成合適的用于指導(dǎo)系統(tǒng)執(zhí)行任何想要的操作的語言.例如,除了進(jìn)行統(tǒng)計(jì)學(xué)分析外,數(shù)字系統(tǒng)可指導(dǎo)包含某些標(biāo)記的植物的選擇或控制用于根據(jù)此處相關(guān)的方法收獲、選擇、雜交或保存作物的田間機(jī)器.本發(fā)明也可具體化在應(yīng)用特異性集成電路(ASIC)或可編程邏輯設(shè)備(PLD)的電路中.在這種情況下,本發(fā)明被具體化在可用于建立ASIC或PLD的計(jì)算機(jī)可閱讀描述符語言中,本發(fā)明也可被具體化在各種其它數(shù)字設(shè)備,例如PDA、膝上型計(jì)算機(jī)系統(tǒng)、顯示器、困象編輯設(shè)備等的電路或邏輯處理器中.鑒定新的等位基因變體本發(fā)明也提供了可用于姿定新的影響表型性狀的QTL的等位基因變體的方法.可進(jìn)行關(guān)聯(lián)分析以鑒定至少一個(gè)與表型性狀相關(guān)的遣傳標(biāo)記.可在非適應(yīng)的生殖質(zhì)中鑒定新的遣傳標(biāo)記等位基因,并且因此可能是與遣傳標(biāo)記相關(guān)的QTL,然后可將該新的等位基因變體,例如,培育到適應(yīng)的生殖質(zhì)(例如,商業(yè)育種群體)中.因此,一類普通的實(shí)施方案提供了選擇植物的方法.在所迷方法中,提供了至少一個(gè)遣傳標(biāo)記和表型性狀之間的關(guān)聯(lián).在第一植物群體中估計(jì)所述關(guān)聯(lián),所述笫一植物群體是已建立的育種群體或其部分.根據(jù)合并笫一植物群體的一套遺傳標(biāo)記的基因型和所述第一植物群體中的表型性狀值的統(tǒng)計(jì)學(xué)模型在笫一群體中估計(jì)關(guān)聯(lián).所述統(tǒng)計(jì)學(xué)模型也合并所述笫一植物群體的成員之間的家系關(guān)系。然后提供一個(gè)或多個(gè)來自一個(gè)或多個(gè)非適應(yīng)系的植物。就選擇的包含至少一個(gè)與表型性狀相關(guān)的遣傳標(biāo)記的基因型選擇一個(gè)或多個(gè)植物.所選擇的基因型可包含例如,至少一個(gè)與表型性狀相關(guān)的遣傳標(biāo)記的至少一個(gè)等位基因,所述等位基因?qū)τ谠谒缘谝蝗后w中發(fā)現(xiàn)的遣傳標(biāo)記等位基因來說是新的等位基因.一個(gè)或多個(gè)植物的至少一個(gè)遣傳標(biāo)記的基因型通常是通過任何便利的技術(shù)通過實(shí)驗(yàn)進(jìn)行確定的,新的遣傳標(biāo)記基因型可指示與遣傳標(biāo)記(和與表型性狀)相關(guān)的QTL的新等位基因的存在.為確定該假定的新QTL等位基因是否是有利地影響所述表型性狀的基因,所迷方法可包括在一個(gè)或多個(gè)具有所述選擇的基因型的植物中估計(jì)所述表型性狀(例如,對(duì)數(shù)量表型性狀進(jìn)行定量).至少一個(gè)具有所述選擇的基因型和想要的表型性狀值的植物可被選擇出來.此外,可將至少一個(gè)具有所述選擇的基因型和想要的表型性狀值的所選擇的植物與至少一個(gè)其它植物進(jìn)行育種(例如,以將所述遣傳標(biāo)記等位基因?qū)?、從而將假定的新QTL等位基因?qū)脒m應(yīng)的生殖質(zhì)中).笫一植物群體通常包含多個(gè)近交種、單交F1雜種或其組合。例如,在一類實(shí)施方案中,笫一植物群體包含多個(gè)近交種.在另一類實(shí)施方案中,所述第一植物群體包含多個(gè)單交F1雜種.在另一類實(shí)施方案中,所迷笫一植物群體包含多個(gè)近交種和單交F1雜種的組合.第一植物群體任選地由近交種、單交F1雜種或其組合組成.所述近交種相互之間可以是相關(guān)的和/或不相關(guān)的,且所迷單交F1雜種可以從所迷近交系和/或一個(gè)或多個(gè)另外的近交系單交產(chǎn)生.如所提到的,第一植物群體的成員是從已建立的育種群體(例如,商業(yè)育種群體)中取樣的.困l是示意性地說明各種近交系和單交雜種之間的相互關(guān)系的系謙,所述近交系和單交雜種可例如包含第一植物群體.也將已建立的育種群體和/或上述實(shí)施方案提到的第一植物群體的特征應(yīng)用到這些實(shí)施方案中.因此,例如,在一類實(shí)施方案中,所述第一植物群體包含多個(gè)近交種、單交F1雜種或其組合,各近交種和/或單交Fl雜種的祖先是已知的,并且各近交種和/或單交F1雜種是三個(gè)或更多個(gè)建立者(例如,10、50或100個(gè)或更多個(gè)建立者)中至少一個(gè)的后代.類似地,在一些實(shí)施方案中,第一植物群體的成員跨越至少三個(gè)育種周期(例如,至少4、5、6、7、8或9個(gè)育種周期).在一類實(shí)施方案中,所述已建立的育種群體包含至少3個(gè)建立者和其后代(例如,至少10個(gè)建立者、至少50個(gè)建立者、至少100個(gè)建立者、或至少200個(gè)建立者,例如大約100至大約200個(gè)建立者和其后代),其中所述后代的祖先是已知的.所述已建立的育種群體可跨越例如3、4、5、6、7、8、9個(gè)或更多個(gè)育種周期.第一植物群體基本上可包含任何數(shù)目的成員.例如,第一植物群體任選地包舍大約50至大約5000個(gè)成員(例如,第一植物群體可包含50-5000個(gè)近交種和/或單交Fl雜種)。如另一個(gè)示例,第一植物群體可包含至少大約50、100、200、500、1000、2000、3000、4000、5000或甚至6000或更多個(gè)成員.值得注意的是第一植物群體任選地具有上述特征的任何組合組合.僅作為一個(gè)示例,笫一植物群體可包含50至5000個(gè)成員,包括多個(gè)近交種和/或單交Fl雜種,其各自具有已知的祖先和來自三個(gè)或更多個(gè)建立者中至少一個(gè).表型性狀可以是數(shù)重性狀,例如,可提供數(shù)重值的性狀.可選擇地,表型性狀可以是質(zhì)量性狀,例如,可提供質(zhì)量值的性狀,通過單個(gè)基因可確定所述性狀,或其可通過兩個(gè)或更多個(gè)基因確定.通常,第一植物群體表現(xiàn)目的表型性狀的變異性(例如,數(shù)量表型性狀的數(shù)量變異性).笫一植物群體中的表型性狀值可通過例如估計(jì)笫一植物群體成員中的表型性狀來獲得(例如,對(duì)數(shù)量性狀進(jìn)行定量).可在包含第一植物群體的植物(例如,近交種和/或單交雜種)中估計(jì)表型.可選擇地,笫一植物群體中的表型性狀值可通過在至少一個(gè)和至少一個(gè)測(cè)交親本的頂交組合中估計(jì)笫一植物群體的成員中的表型性狀和任選地計(jì)算目的基因型的表型的最佳線性無偏預(yù)測(cè)值來獲得,表型性狀基本上可以是任何數(shù)量或質(zhì)量表型性狀,例如,農(nóng)藝學(xué)和/或經(jīng)濟(jì)上重要的表型性狀.例如,表型性狀可以選自產(chǎn)量、谷粒含水量、谷粒含油量、根抗倒伏性、莖桿抗倒伏性、林高、谷穗高、抗病性、抗蟲性、抗旱性、谷粒蛋白含量、試驗(yàn)重重、視覺和/或美學(xué)外觀和穗軸顏色.這些性狀和用于定量所述性狀的技術(shù)在本領(lǐng)域是熟知的.例如,谷粒產(chǎn)量是作物性能的常規(guī)測(cè)量.試驗(yàn)重重是針對(duì)質(zhì)量的測(cè)量.谷粒含水量對(duì)于貯存非常重要,而根和莖桿抗倒伏性影響直立能力并且在收獲中非常重要.所迷方法類似地可用于其它表型性狀,例如谷粒肌醇六褲酸含量.成套遣傳標(biāo)記基本上可包含任何方便的遣傳標(biāo)記.例如,成套的遺傳標(biāo)記可包含一個(gè)或多個(gè)單核苷酸多態(tài)性(SNP)、多核苷酸多態(tài)性、至少一個(gè)核苷酸的插入或缺失(indel)、簡(jiǎn)單序列重復(fù)(SSR)、限制性片段長(zhǎng)度多態(tài)性(RFLP)、EST序列或用作探針的20-40個(gè)堿基的獨(dú)特核脊酸序列(寡核普酸)、隨機(jī)擴(kuò)增多態(tài)DNA(RAPD)標(biāo)記或任意片段長(zhǎng)度多態(tài)性(AFLP).對(duì)于本領(lǐng)域技術(shù)人員來說很明顯的是所需要的標(biāo)記數(shù)目可以變化,例如依賴于目的植物物種中的連鎖不平衡降低的速率和/或依賴于進(jìn)行的關(guān)聯(lián)分析類型而變化,成套遺傳標(biāo)記可包括例如1至50,000個(gè)標(biāo)記(例如,1至10,000個(gè)標(biāo)記).在一類實(shí)施方案中,成套的遣傳標(biāo)記可以包含大約50至大約2500個(gè)標(biāo)記.例如,成套遣傳標(biāo)記可包含至少大約50、100、250、500、1000、2000或甚至2500或更多個(gè)遣傳標(biāo)記。在某些實(shí)施方案中,成套遣傳標(biāo)記包含1至IO個(gè)標(biāo)記(例如,在候選基因研究中,需要相對(duì)少的標(biāo)記).在其它實(shí)施方案中,成套的遣傳標(biāo)記包舍500至50,000個(gè)標(biāo)記(例如,對(duì)于全基因組掃描).第一植物群體中成套的遣傳標(biāo)記的基因型可通過實(shí)驗(yàn)確定、進(jìn)行預(yù)測(cè)或其組合.例如,在一類實(shí)施方案中,通過實(shí)驗(yàn)確定存在于第一植物群體中的各近交種的基因型,并預(yù)測(cè)存在于笫一植物群體中各F1雜種的基因型(例如,通過實(shí)驗(yàn)確定各單交雜種的兩個(gè)近交親本的基因型).基本上可通過任何方便的技術(shù)經(jīng)實(shí)驗(yàn)確定植物基罔型.許多用于發(fā)現(xiàn)和/或確定遣傳標(biāo)記基因型的應(yīng)用技術(shù)在本領(lǐng)域是已知的(例如,在下列標(biāo)題為"遣傳標(biāo)記"的部分描述的技術(shù)).在一類優(yōu)選的實(shí)施方案中,對(duì)來自各近交種的成套DNA片段進(jìn)行測(cè)序以通過實(shí)驗(yàn)確定各近交系的基因型。因?yàn)樾蛄械亩鄳B(tài)性(例如,遣傳標(biāo)記)通常在非編碼區(qū)域(例如,內(nèi)含子和非翻譯區(qū)域)中更普遍,所以在一類實(shí)施方案中,進(jìn)行測(cè)序的成套DNA片段包含一個(gè)或多個(gè)(例如,兩個(gè)或更多個(gè))基因的5'非翻譯區(qū)域和/或3'非翻譯區(qū)域.如上文所指出的,測(cè)序技術(shù)(例如,PCR擴(kuò)增子直接測(cè)序)是熟知的。在一些實(shí)施方案中,單個(gè)遺傳標(biāo)記與表型性狀相關(guān),而在其它實(shí)施方案中,兩個(gè)或更多個(gè)遣傳標(biāo)記與表型性狀相關(guān).因此,在一類實(shí)施方案中,提供包舍兩個(gè)或更多個(gè)遣傳標(biāo)記的單元型和表型性狀之間的關(guān)聯(lián).包含單元型的遣傳標(biāo)記可以是不連鎖的(例如,可鑒定兩個(gè)或更多個(gè)影響表型性狀的QTL,各QTL與其中一個(gè)標(biāo)記相關(guān)),或遣傳標(biāo)記可以是物理連鎖的(例如,遺傳標(biāo)記可包含與表型性狀相關(guān)的單元型區(qū),例如SNP單元型標(biāo)記的單元型區(qū)).在一類優(yōu)選的實(shí)施方案中,通過使用線性模型、混合線性模型或非線性模型進(jìn)行Bayesian分析,來估計(jì)至少一個(gè)遣傳標(biāo)記和表型性狀之間的關(guān)聯(lián).可通過例如可逆的跳躍馬爾可夫鏈MonteCarlo算法、A方法或特征似然算法進(jìn)行Bayesian分析.例如,在一類這樣優(yōu)選的實(shí)施方案中,通過使用線性模型進(jìn)行Bayesian分析來估計(jì)關(guān)聯(lián),所迷Bayesian分析通過可逆的跳躍馬爾可夫鏈MonteCarlo算法進(jìn)行.通常,通過計(jì)算機(jī)程序或系統(tǒng)進(jìn)行Bayesian分析(例如,通過可逆的跳躍馬爾可夫鏈MonteCarlo算法進(jìn)行的).如上面所提到的,Bayesian方法、MonteCarlo算法等在本領(lǐng)域是已知的.特別地,用于QTL作困(即,用于估計(jì)一套遺傳標(biāo)記和表型性狀之間的關(guān)聯(lián)的)的Bayesian方法是已知的參見,例如Bink等人以及Yi和Xu,兩者同見上文。在另一類優(yōu)選的實(shí)施方案中,通過進(jìn)行傳遞不平衡檢驗(yàn)來估計(jì)關(guān)聯(lián)。在另一類實(shí)施方案中,通過最大似然混合線性或非線性模型分析來估計(jì)關(guān)聯(lián).在另一類實(shí)施方案中,通過人工神經(jīng)網(wǎng)絡(luò)在第一植物群體中估計(jì)關(guān)聯(lián).如所提到的,這種網(wǎng)絡(luò)在本領(lǐng)域是已知的;參見,例如,上面的參考文獻(xiàn).笫一植物群體和一個(gè)或多個(gè)非適應(yīng)系基本上可包含任何種類的植物.例如,在優(yōu)選種類的實(shí)施方案中,笫一植物群體和一個(gè)或多個(gè)非適應(yīng)系包含二倍體植物(例如,由二倍體植物組成)在優(yōu)選的實(shí)施方案中,笫一植物群體和一個(gè)或多個(gè)非適應(yīng)系選自玉米(例如,玉蜀黍〉、大豆、高梁、小麥、向日葵、水稻、低芥酸芥子、綿花和栗.由此處的方法鑒定的QTL(例如,與至少一個(gè)與表型性狀相關(guān)的遣傳標(biāo)記連鎖的QTL)可任選地被克隆和表達(dá),例如,以產(chǎn)生具有想要的表型性狀值的轉(zhuǎn)基因植物.因此,在一類實(shí)施方案中,所述方法包括從具有選擇的基因型和想要的表型性狀值的至少一個(gè)所選擇的植物中克隆基因,所述基因與至少一個(gè)與表型性狀相關(guān)的遣傳標(biāo)記連鎖,其中所述基因的表達(dá)影響所迷表型性狀(即,從非適應(yīng)植物中克隆新QTL等位基因).所述方法任選地也包括構(gòu)建在宿主植物中表達(dá)克隆的基因的轉(zhuǎn)基因植物.此處也可在它們相關(guān)的程度上使用上述實(shí)施方案中提到的所有各種任選的構(gòu)型和特征.植物如通過此處方法的任一方法產(chǎn)生的轉(zhuǎn)基因植物一樣,通過此處的方法的任一方法選擇、提供或產(chǎn)生的植物形成本發(fā)明的另一個(gè)特征.遺傳標(biāo)記在下面的討論中,短語"核酸"、"多核苷酸"、"多核苷酸序列"或"核酸序列"是指脫氧核糖核苷酸或核糖核苷酸和以單鏈或雙鏈形成存在的其多聚體.除非特別指出,所迷術(shù)語包括含有已知的天然核苷酸的類似物的核酸,所迷類似物具有類似于參照核酸的結(jié)合特性.通過其基因組表征個(gè)體的能力歸因于遣傳信息的固有的變異性,通常,遣傳標(biāo)記是基因組的多態(tài)區(qū)域和與這些區(qū)域結(jié)合的互補(bǔ)寡核苷酸,多態(tài)位點(diǎn)通常位于DM的非編碼區(qū)域(例如,5'或3'非翻譯區(qū),基因間區(qū)域等)也在編碼區(qū)域發(fā)現(xiàn)多態(tài)位點(diǎn),其中,例如,核苷酸的改變可以是沉默的并且在編碼的蛋白中不導(dǎo)致氨基酸的替代、導(dǎo)致保守的氨基酸替代或?qū)е路潜J匕被崽娲?如所預(yù)期的,在編碼功能關(guān)鍵的蛋白質(zhì)的區(qū)域中,多態(tài)位點(diǎn)(特別是插入、缺失和導(dǎo)致非保守替代的核苷酸改變)相對(duì)不普遍.通常,特定遣傳標(biāo)記的存在或不存在通過其獨(dú)特的核酸序列鑒定個(gè)體;在其它例子中,遣傳標(biāo)記發(fā)現(xiàn)于所有個(gè)體中,但個(gè)體通過基因組中所述遣傳標(biāo)記所在的位置進(jìn)行鑒定.遺傳變異性的主要原因,和因此遣傳標(biāo)記的主要來源是插入(添加)、缺失、核苷酸替代(點(diǎn)突變)、重組事件和在植物群體中在個(gè)體的基因組內(nèi)的轉(zhuǎn)座因子.作為一個(gè)示例,點(diǎn)突變可由DNA復(fù)制的錯(cuò)誤或?qū)M的損害造成.作為另一個(gè)示例,插入和缺失可由不精確的重組事件造成.在另一個(gè)示例中,變異性可由轉(zhuǎn)座因子(具有自主地或非自主地轉(zhuǎn)移或跳越到基因組中新的位點(diǎn)上的能力的DNA序列)的插入或切除造成。這些DNA序列中可遺傳的改變的凈結(jié)果就是個(gè)體具有不同的序列.包含多態(tài)位點(diǎn)(在個(gè)體之間或在給定的個(gè)體的兩條染色體之間DNA序列不同的位點(diǎn))的區(qū)域可用作遣傳標(biāo)記.可根據(jù)改變的類型(例如,一個(gè)或多個(gè)核苷酸的插入或缺失,或一個(gè)或多個(gè)核苷酸的替代)和/或根據(jù)檢測(cè)改變的方法(例如,RFLP和AFLP可各自由插入、缺失或替代造成)對(duì)遣傳標(biāo)記進(jìn)行分類,各種遣傳標(biāo)記的發(fā)現(xiàn)、檢測(cè)和基因型確定已描述于文獻(xiàn)中.參見,例如,Henry,ed.(2001)PlantGenotyping.TheDNAFingerprintingofPlantsWallingford:CABIPublishing;Phillips和Vasil,eds.(2001)DNA-basedMarkersinPlantsDordrecht:KluwerAcademicPublishers^Pejic等人(1998)"Comparativeanalysisofgeneticsimilarityamong邁aizeinbredlinesdetectedbyRFLPs,RAPDs,SSRsandAFLPs"Theor.App.Genet.97:1248-1255;Bha"ra肌fcki等人(2002)"Insertion—deletionpolymorphismsin3'regionsofmaizegenesoccurfrequentlyandcanbeusedashighlyinformativegeneticmarkers"PlantMol.Biol.48:539-47;Nickerson等人(1997)"PolyPhred:automatingthedetectionandgenotypingofsinglenucleotidesubstitutionsusingfluorescence-basedresequencing"NucleicAcidsRes,25:2745-2751;Underhil1等人(1997)"DetectionofnumerousYchromosomebiallelicpolymorphismsbydenaturinghigh—performanceliquidchromatography"GenomeRes.7:996-1005jShi(2001)"Enablinglarge-scalepharmacogeneticstudiesbyhigh—throughput邁utationdetectionandgenotypingtechnologies"Clin.Chem.47:164-172jKwok(2000)"High-throughputgenotypingassayapproaches"Pharmacogenomics1:95-100;Rafalski等人(2002)"Thegeneticdiversityofcomponentsofryehybrids"CellMolBiolLett7r471-5jChing和Rafalski(2002)"RapidgeneticmappingofestsusingSNPpyrosequencingandindelanalysis"CellMolBiolLett.7:803-10;和Powell等人(1996)"ThecomparisonofRFLP,RAPD,AFLPandSSR(邁icrosatellite)markersforgermplasmanalysis"Mol.Breeding2:225-238,SNPs在DNA序列中個(gè)體在單個(gè)DNA堿基上不同的位點(diǎn)稱作單核苷酸多態(tài)性(SNPs).SNP可由例如點(diǎn)突變?cè)斐?通過許多本領(lǐng)域已知的技術(shù)中的任一個(gè)可發(fā)現(xiàn)SNPs.例如,可通過從幾個(gè)個(gè)體直接測(cè)序DNA片段(例如,通過PCR擴(kuò)増的)來檢測(cè)SNPs(參見,例如Ching等人(2002)"SNPfrequency,haplotypestructureandlinkagedisequilibriuminelitemaizeinbredlines"BMCGenetics3:19).在另一個(gè)示例中,通過可獲得的來源于多個(gè)基罔型的序列(例如,ESTs、STSs)的計(jì)算機(jī)分析可發(fā)現(xiàn)SNPs(參見,例如Marth等人(1999)"Ageneralapproachtosingle-nucleotidepolymorphismdiscovery"NatureGenetics23:452—456和Beutow等人(1999)"ReliableidentificationoflargenumbersofcandidateSNPsfrompublicESTdata"NatureGenetics21:323-325).(Indels,一個(gè)或多個(gè)核苷酸的插入或缺失,也可通過測(cè)序和/或計(jì)算機(jī)分析被發(fā)現(xiàn),例如在SNP發(fā)現(xiàn)的同時(shí)).類似地,通過測(cè)序可確定SNPs的基因型.也可通過各種其它本領(lǐng)域已知的方法(包括高通量方法),例如通過使用DM芯片、等位基因特異性雜交、等位基因特異性PCR和引物延伸技術(shù)確定SNPs的基因型。參見,例如,LUdblad-Toh能量(2000)"Large-scalediscoveryandgenotypingofsingle—nucleotidepolymorphismsinthemouse"NatureGenetics24:381-386;Bhattramakki和Rafalski(2001)"Discoveryandapplicationofsinglenucleotidepolymorphismmarkersinplants"inPlantGenotypingrTheMAFingerprintingofPlants,CABIPublishing;Syvanen(2001)"Accessinggeneticvariation:genotypingsinglenucleotidepolymorphisms"Nat.Rev.Genet.2:930-942;Kuklin等人(1998)"Detectionofsingle-nucleotidepolymorphismswiththeWAVETMDNAfragmentanalysissystem"GeneticTesting1:201-206jGut(2001)"Automationingenotypingsinglenucleotidepolymorphisms"Hum.Mutat.17:475-492;Lemieux(2001)"Plantgenotypingbasedonanalysisofsinglenucleotidepolymorphismsusingmicroarrays"inPlantGenotyping:TheDNAFingerprintingofPlants,CABIPublishing;Edwards和Mogg(2001)"Plantgenotypingbyanalysisofsinglenucleotidepolymorphisms"inPlantGenotyping:TheDNAFingerprin"ngofPlants,CABIPublishing;Ahmadian等人(2000)"Single-nucleotidepolymorphismanalysisbypyrosequencing"Anal.Biochem.280:103-110;Useche等人(2001)"High-throughputidentification,databasestorageandanalysisofSNPsinESTsequences"GenomeInformSerWorkshopGenomeInform12:194-203;Pastinen等人(2000)"Asystemforspecific,high-throughputgenotypingbyallele-specificprimerextensiononmicroarrays"GenomeRes.l(h1031-1042',Hacia(1999)"Determinationofancestralallelesforhumansingle—nucleotidepolymorphismsusinghigh-densityoligonucleotidearrays"NatureGenet.22:164-167j和Chen等人(2000)"Microsphere—basedassayforsingle—nucleotidepolymorphismanalysisusingsinglebasechainextension"GenomeRes.10:549-557,通過類似的方法可發(fā)現(xiàn)和檢測(cè)多核苷酸多態(tài)性.RFLPs如上面所提到的,不同個(gè)體具有不同的基因組DNA序列.因此,當(dāng)用一個(gè)或多個(gè)識(shí)別特異性限制位點(diǎn)的限制性內(nèi)切核酸酶消化這些DNA序列時(shí),一些所得的片段具有不同的長(zhǎng)度.所得的片段就是限制性片段長(zhǎng)度多態(tài)性.短語限制性片段長(zhǎng)度多態(tài)性或RFLPs是指在限制醉位點(diǎn)上固有的不同(例如,由于在靶位點(diǎn)上的堿基突變?cè)斐傻?或在側(cè)翼連接限制酶位點(diǎn)的區(qū)域內(nèi)的添加或缺失,所述添加或缺失導(dǎo)致在通過用相關(guān)的限制酶切割產(chǎn)生的片段的長(zhǎng)度上的不同.點(diǎn)突變導(dǎo)致更長(zhǎng)的片段(如果突變?cè)谙拗莆稽c(diǎn)之內(nèi))或更短的片段(如果突變產(chǎn)生限制位點(diǎn)).插入和轉(zhuǎn)座因子整合導(dǎo)致更長(zhǎng)的片段,而缺失導(dǎo)致更短的片段.最初,通過DNA印跡和雜交進(jìn)行RFLP.目前更通常通過PCR進(jìn)行RFLP分析.成對(duì)的連接包含RFLP區(qū)域的寡核苷酸引物用于擴(kuò)增來自基因組DNA的片段.可直接地分析PCR產(chǎn)物的大小,且如杲片段包舍多態(tài)性限制位點(diǎn),那么可用睞消化PCR產(chǎn)物并且可分析消化產(chǎn)物的大小.用于發(fā)現(xiàn)和確定RFLPs基因型的技術(shù)已在文獻(xiàn)中詳細(xì)地描述.參見,例如,Gauthier等人(2002)"RFLPdiversityandrelationshipsamongtraditionalEuropeanmaizepopulations"Theor.AppLGenet.105:91-99;Ramalingam等人(2003)"Candidatedefensegenesfromrice,barley,andmaizeandtheirassociationwithqualitativeandquantitativeresistanceinrice"MolPlantMicrobeInteract16:14-24;Guo等人(2002)"RestrictionfragmentlengthpolymorphismassessmentoftheheterogeneousnatureofmaizepopulationGT-MAS:gkandfieldevaluationofresistancetoaflatoxinproduction-byAspergillusflavus"JFoodProt65:167-71jPejic等人(1998)"ComparativeanalysisofgeneticsimilarityamongmaizeinbredUnesdetectedbyRFLPs,RAPDs,SSRsandAFLPs"Theor,App.Genet.97:1248-1255j和Powell等人(1996)"ThecomparisonofRFLP,RAPD,AFLPandSSR(microsatellite)markersforgermplas邁analysis"Mol.Breeding2:225-238.RAPDs為鑒定隨機(jī)擴(kuò)增多態(tài)DNAUAPD)標(biāo)記,隨機(jī)選擇寡核苷酸(例如,八核苷酸、十核苷酸).植物基因組DNA的復(fù)雜性高到足以使與寡核苷酸互補(bǔ)的一對(duì)位點(diǎn)可隨機(jī)地以正確的方向存在并且相互之間可以足夠接近以允許PCR擴(kuò)增被該對(duì)位點(diǎn)劃定界限的片段.對(duì)于一些隨機(jī)選擇的寡核苷酸,沒有擴(kuò)增出序列.對(duì)于其它的寡核苷酸,相同長(zhǎng)度的產(chǎn)物產(chǎn)生自不同個(gè)體的基因組DNA.然而,對(duì)于其它的寡核苷酸,在群體中對(duì)于每一個(gè)個(gè)體而言產(chǎn)物長(zhǎng)度都不相同,從而提供了有用的RAPD標(biāo)記.RAPD標(biāo)記已描述于,例如,Pejic等人(1998)"Co邁parativeanalysisofgeneticsimilarityamongmaizeinbredlinesdetectedbyRFLPs,RAPDs,SSRsandAFLPs"Theor.App.Genet.97:1248-1255;和Powell等人(1996)"ThecomparisonofRFLP,RAPD,AFLPandSSR(microsatellite)markersforgermplasmanalysis"Mol.Breeding2:225-238,AFLPs任意片段長(zhǎng)度多態(tài)性(AFLPs)也可用作遣傳標(biāo)記(Vos,P.等人,Nucl.AcidsRes.23:4407(1995)).短語"任意片段長(zhǎng)度多態(tài)性"是指在被限制性內(nèi)切核酸酶切割前或切割后經(jīng)擴(kuò)增的選擇的限制片段。所述擴(kuò)增步驟允許更容易的檢測(cè)特異性限制片段,而不是確定所有限制片段的大小和與已知對(duì)照比較大小。AFLP允許檢測(cè)大t多態(tài)標(biāo)記(參見,同上)和已用于植物的遺傳作困(Becker等人(1995)Mol.Gen.Genet.249:65;和Meksem等人(1995)Mol.Gen.Genet.249:74)和區(qū)別緊密相關(guān)的細(xì)菌物種(Huys等人(1996)Int'1J.SystematicBacteriol.46:572)。SSRs簡(jiǎn)單序列重復(fù)(SSRs)是短的串聯(lián)重復(fù)(例如,二-、三-或四核苷酸串聯(lián)重復(fù))在基因組中SSRs可以以高水平發(fā)生.例如,已報(bào)道在人基因組中二核苷酸重復(fù)發(fā)生多達(dá)50,000次,具有10至60的n(在給定的SSR區(qū)域內(nèi)二核苷酸序列串聯(lián)重復(fù)的次數(shù))變化(Jacob等人(199DCell67:213).在高等植物中也已發(fā)現(xiàn)SSRs;參見,例如Taramino和Tingey(1996)"Simplesequencerepeatsforgermplasmanalysisandmappinginmaize"Geno鵬e39:277-287;Condit和Hubbell(1991)Genome34:66;Peakall等人(1998)"Cross-speciesamplificationofsoybean(Glycinemax)simplesequencerepeats(SSRs)withinthegenusandotherlegumegenera:implicationsforthetransferabilityofSSRsinplants"MolBiolEvol15:1275-87;Morgante等人(1994)"Geneticmappingandvariabilityofsevensoybeansimplesequencerepeatloci"Genome37:763-9;和Zietkiewicz等人(1994)"Genomefingerprintingbysimplesequencerepeat(SSR)-anchoredpolymerasechainreactionamplification"Genomics20:176-83.簡(jiǎn)而言之,可通過例如將引物與植物基因組的保守區(qū)域雜交來產(chǎn)生SSR數(shù)據(jù),所述區(qū)域側(cè)翼連接SSR區(qū)域.然后利用PCR擴(kuò)增引物之間的核苷酸重復(fù).然后對(duì)擴(kuò)增的序列進(jìn)行電泳以確定所述擴(kuò)增片段的大小,并從而確定二、三和四核苷酸重復(fù)的次數(shù),其它標(biāo)記其它檢測(cè)序列多態(tài)性的遣傳標(biāo)記和方法在本領(lǐng)域是已知的并且可用于本發(fā)明的實(shí)踐中,包括,但不限于,單鏈構(gòu)象多態(tài)性(SSCPs)、擴(kuò)増的可變序列、同工酶標(biāo)記、等位基因特異性雜交和自動(dòng)維持序列擴(kuò)増,參見,例如,0rita等人(1989)"Detectionofpolymorphismsofhu邁anDNAbygelelectrophoresisassingle-strandconformationpolymorphisms"Proc.Natl.Acad.Sci.USA86:2766-2770;授予Beavis的USPN6,399,855,標(biāo)題為"QTLmappinginplantbreedingpopulations"j和上述參考文獻(xiàn),在其它研究中,例如,在基因功能研究、影響目的表型、目的性狀的生理學(xué)等的生物化學(xué)途徑的研究中鑒定的候選基因也可在笫一群體和把群體中用作標(biāo)記,單元型區(qū)在給定的染色體上的成套相鄰遣傳標(biāo)記可在區(qū)內(nèi)遺傳.在一些情況下,這種區(qū)的單元型(例如,單元型標(biāo)記,例如,包含代表區(qū)內(nèi)更多多態(tài)性的少數(shù)SNPs的單元型)可比區(qū)內(nèi)單個(gè)遣傳標(biāo)記(例如,單一SNP)的單元型具有更多的信息.參見,例如,Rafalski(2002)"Applicationsofsinglenucleotidepolymorphismsincropgenetics"Curr.Opin.PlantBio,5:94-100和Johnsonet(2001)"Haplotypetaggingfortheidentificationofcommondiseasegenes"Nat.Genet.29:233-237中的單元標(biāo)記描述.分子生物學(xué)技術(shù)在實(shí)踐本發(fā)明過程中,任選地使用許多分子生物學(xué)和重組DNA技術(shù)中的常規(guī)技術(shù).這些技術(shù)是熟知的并且在下述文獻(xiàn)中說明,例如Berger和Kimmel,GuidetoMolecularCloningTechniques,MethodsinEnzymologyvolume152AcademicPress,Inc.,SanDiego,CA("Berger");Sambrook等人,MolecularCloning-ALaboratoryManual(3rdEO,l-3巻,ColdSpringHarborLaboratory,ColdSpringHarbor,NewYork,2000("Sambrook")和CurrentProtocolsinMolecularBiology,F.M.Ausubel等人,eds.,CurrentProtocols,ajointventurebetweenGreenePublishingAssociates,Inc.和JohnWiley£Sons,Inc.,(supplementedthrough2004)("Ausubel")).其它有關(guān)細(xì)胞分離和培養(yǎng)(例如,隨后的核酸分離)的有用參考資料包括,例如,F(xiàn)reshney(1994)CultureofAni邁alCells,aManualofBasicTechnique,thirdedition,Wiley-Liss,NewYork,和在其中引用的參考文獻(xiàn);Payne等人(1992)PlantCellandTissueCultureinLiqudSystemsJohnWiley&Sons,Inc.NewYork,NY;Gamborg和Phillips(Eds.)(1995)PlantCell,TissueandOrganCulture;FundamentalMethodsSpringerLabManual,Springer-Verlag(BerlinHeidelbergNewYork)和Atlas和Parks(Eds.)TheHandbookofMicrobiologicalMedia(1993)CRCPress,BocaRaton,FL。可通過許多熟知的方法獲得寡核苷酸(例如,用作PCR引物,用于遣傳標(biāo)記檢測(cè)方法等)例如,可根據(jù)Beaucage和Caruthers(1981),TetrahedronLetts.,22(20):1859-1862中描述的固相亞鱗酰胺三酯方法化學(xué)地合成寡核苷酸,例如使用商業(yè)可購(gòu)的自動(dòng)化合成儀,例如Needha加-VanDevanter等人在(1984)NucleicAcidsRes.,12:6159-6168中描述的.也可從各種本領(lǐng)域技術(shù)人員已知的商業(yè)來源訂購(gòu)寡核苷酸(包括,例如,標(biāo)記的或經(jīng)修飾的寡核苷酸).有許多寡核苷酸合成服務(wù)的商業(yè)提供商,因此,這是廣泛可獲得的技術(shù).任何核酸都可從任何各種商業(yè)來源訂購(gòu),例如TheMidlandCertifiedReagentCompany(www.mere,com)、TheGreatAmericanGeneCompany(www,genco.com)、ExpressGenInc.(www.expressgen.com)、QIAGEN(http:〃oligos,qiagen.co邁)和許多其它公司.定位克隆定位基因克隆使用至少一個(gè)遣傳標(biāo)記的鄰近在物理上限定克隆的染色體片段,所述片段與使用此處的統(tǒng)計(jì)學(xué)方法確定的QTL連鎖.這些連鎖的核酸的克隆具有多種用途,包括用作在隨后的標(biāo)記輔助的選擇方案中鑒定連鎖的QTLs的遣傳標(biāo)記,和在重組植物中提高想要的特性,其中轉(zhuǎn)基因植物中克隆的序列的表達(dá)影響目的表型性狀.想要克隆的共同連鎖的序列包括可讀框,例如編碼提供觀察到的QTL的分子基礎(chǔ)的蛋白.如果一個(gè)或多個(gè)標(biāo)記與可讀框鄰近,那么其可與給定的DNA克隆雜交,從而鑒定所述可讀框所位于的克隆.如果側(cè)翼連接的標(biāo)記較遠(yuǎn),那么含有所迷可讀框的片段可通過構(gòu)建重疊克隆的重疊群來進(jìn)行鑒定.在某些應(yīng)用中,制備或克隆用于鑒定更遠(yuǎn)地與給定標(biāo)記連鎖的核酸、或分離與此處鑒定的QTLs連鎖或負(fù)責(zé)所述QTL的核酸的大核酸是有利的.要認(rèn)識(shí)到遣傳上與多態(tài)核苷酸連鎖的核酸任選地位于離所述多態(tài)核酸最高達(dá)約50厘摩的位置,盡管精確的距離將依賴于特定染色體區(qū)域的交換頻率而變化.通常距離多態(tài)核苷酸的距離在1-50厘摩的范圍內(nèi),例如通常小于1厘摩、小于大約1-5厘摩、大約1-5、1、5、10、15、20、25、30、35、40、45或50厘摩等,已知許多制備大重組RM和DNA核酸的方法,所述核酸包括重組質(zhì)粒、重組入噬菌體、粘粒、酵母人工染色體(YACs)、Pl人工染色體、細(xì)菌人工染色體(BACs)等,對(duì)作為人工染色體的YACs、BACs、PACs和MACs的一般介紹描述于MonacoftLarin(1994)TrendsBiotechnol.12:280-286,用于制備大核酸的合適的克隆技術(shù)的示例和足以指導(dǎo)本領(lǐng)城技術(shù)人員進(jìn)行許多克隆練習(xí)的說明書也在Berger、Sambrook和Ausubel(同上)中找到,在一個(gè)方面,與遣傳標(biāo)記雜交的核酸被克隆入大核酸例如YACs中,或在克隆自選擇的作物的YAC基因組文庫(kù)中被檢測(cè)到,所述遣傳標(biāo)記與上述方法鑒定的QTLs連鎖.YACs和YAC文庫(kù)的構(gòu)建是已知的.參見,例如,Berger(同上),Ausubel(同上),Burke等人(1987)Science236:806-812,Anand等人(1989)NucleicAcidsRes.17:3425-3433,Anand等人(1990)NucleicAcidsRes.18:1951-1956,和Riley(1990)NucleicAcidsRes.18:2887-2890,已構(gòu)建了包含大豆DNA大片段的YAC文庫(kù)(參見,F(xiàn)unke&Kolchinsky(1994)CRCPress,BocaRaton,Fla.pp.125-308;MarekftShoemaker(1996)SoybeanGenet.Newsl.23..126-129;Danish等人(1997)SoybeanGenet.Newsl.24:196-198).許多其它商業(yè)上重要的作物的YAC文庫(kù)是可獲得的或可使用已知的技術(shù)構(gòu)建.類似地,粘?;蚱渌肿釉泽w例如BAC和Pl構(gòu)建體也用于分離或克隆與遣傳標(biāo)記連鎖的核酸.粘??寺∫彩且阎?參見,例如Ausubel;Ish-Horowitz&Burke(1981)NucleicAcidsRes.9:2989-2998;Murray(1983)LAMBDAII(Hendrix等人,eds.)pp.395-432,ColdSpringHarborLaboratory,N.Y.jFrischauf等人(1983)J.Mol.Biol.170:827-842;和Dunn&Blattner(1987)NucleicAcidsRes.15:2677-2698,以及在其中引用的參考文獻(xiàn),BAC和PI文庫(kù)的構(gòu)建是已知的,參見,例如,Ashworth等人(1995)Anal.Biochem.224:564-571;Wang等人(1994)Genomics24(3):527-534;Kim等人(1994)Genomics22:336-9;Rouquier等人(1994)Anal,Biochem.217:205-9jShizuya等人(1992)Proc.NatlAcad.Sci.USA89:8794-7;Kim等人(1994)Genomics22:336-9;Woo等人(1994)NucleicAcidsRes.22(23):4922-31;Wang等人(1995)Plant3:525-33;Cai(1995)Genomics29(2):"3-25;Schmitt等人(1996)Genomics33:9-20;Kim等人(1996)Genomics34(2):213-8;Ki邊等人(1996)Proc,NatlAcad.Sci.USA13:6297-301;Pusch等人(1996)Gene183(1-2):29-33;和Wang等人(1996)GenomeRes.6(7):612-9.用于擴(kuò)增與此處的多態(tài)核酸連鎖的大核酸的改進(jìn)的體外擴(kuò)增方法概述于Cheng等人(1994)Nature369:684-685以及其中引用的參考文獻(xiàn),此外,任何此處描述的克隆或擴(kuò)增策略可用于建立重疊克隆的重疊群,從而提供了在分子水平上顯示遣傳上連鎖的核酸的物理關(guān)系的重疊核酸.該策略的普通示例發(fā)現(xiàn)于整個(gè)生物測(cè)序項(xiàng)目中,在所述項(xiàng)目中對(duì)重疊克隆進(jìn)行測(cè)序以提供完整的染色體序列.在該過程中,根據(jù)標(biāo)準(zhǔn)的方法(描述于例如上述參考資料中的)制備生物的cDNA或基因組DNA文庫(kù).分離單個(gè)克隆并測(cè)序,將重疊序列信息排序以提供生物的序列,也參見,Tomb等人(1997)Nature388:539-547,其描述了全基因組隨機(jī)測(cè)序和裝配完整的幽門螺桿菌(Helicobacterpylori)基因組序列;Fleisch麵n等人(1995)Science269:496-512,其描述了全基因組隨機(jī)測(cè)序和裝配完整的流感嗜血菌(Haemophilusinfluenzae)基因組;Fraser等人(1995)Science270:397-403,其描述了全基因組隨機(jī)測(cè)序和裝配完整的生殖道枝原體(Mycoplasmagenitalium)基因組;和Bult等人(1996)Science273:1058-1073,其描述了全基因組隨機(jī)測(cè)序和裝配完整的唐氏甲烷球菌(Methanococcusjannaschii)基因組.Hagiwara和Curtis,NucleicAcidsRes.24:2460-2461(1996)開發(fā)了用于從非常大的克隆產(chǎn)生重疊核酸的"長(zhǎng)距離測(cè)序儀"PCR方案,和擴(kuò)增和標(biāo)記重疊核酸形成合適的測(cè)序模板的方法.所述方法可與鳥槍測(cè)序技術(shù)結(jié)合使用以提高通常用于全生物測(cè)序項(xiàng)目的烏槍法的效率.如本發(fā)明所用的,所述技術(shù)可用于鑒定與QTLs以及負(fù)責(zé)QTL表達(dá)的"候選"基因遺傳上連鎖的基因組核酸和對(duì)其進(jìn)行測(cè)序,所迷"候選"基因是由此處的方法鑒定的.如上面提到的,可將包含QTL的等位基因序列克隆和插入轉(zhuǎn)基因植物中.產(chǎn)生轉(zhuǎn)基因植物的方法在本領(lǐng)域是已知的并且在下面進(jìn)行了簡(jiǎn)述.轉(zhuǎn)基因植物來源于與遣傳標(biāo)記和/或由此處統(tǒng)計(jì)學(xué)方法鑒定的QTL連鎖的核酸的核酸可被導(dǎo)入培養(yǎng)物或植物器官(例如,葉、莖、果實(shí)、種子等)中的植物細(xì)胞.通過可操作地將目的核酸連接至啟動(dòng)子,將所述構(gòu)建體整合入表達(dá)栽體并將所述栽體導(dǎo)入合適的宿主細(xì)胞中,可獲得天然的或合成的核酸的表達(dá).一般的栽體(例如,質(zhì)粒)包含轉(zhuǎn)錄和翻譯終止子、轉(zhuǎn)錄和翻譯起始序列和/或用于調(diào)控特定核酸表達(dá)的啟動(dòng)子.所迷栽體任選地包含基因表達(dá)盒,所述表達(dá)盒包含啟動(dòng)子、基因和終止子序列、允許所述表達(dá)盒在真核生物或原核生物或兩者(例如穿梭栽體)中復(fù)制的序列和用于原核和真核系統(tǒng)中的選擇標(biāo)記.栽體適合在真核生物、原核生物或優(yōu)選地在兩者中復(fù)制和整合.參見,例如,Berger;Sambrook;和Ausubel-將QTL等位基因序列克隆入細(xì)菌宿主中細(xì)菌細(xì)胞可用于增加含有本發(fā)明的DNA構(gòu)建體的質(zhì)粒數(shù)目.可通過本領(lǐng)域已知的許多方法的任意一種(例如,電穿孔或氯化鈣)將質(zhì)粒導(dǎo)入細(xì)菌宿主細(xì)胞.培養(yǎng)細(xì)菌,并通過各種本領(lǐng)域已知的方法(參見,例如,Sambrook)分離細(xì)菌內(nèi)的所述質(zhì)粒.此外,用于從細(xì)菌中純化質(zhì)粒的大量試刑盒可商業(yè)獲得(例如,來自Stratagene的StrataClean或來自Qiagen的QIAprepT"),然后進(jìn)一步搮作分離和純化的質(zhì)粒以產(chǎn)生用于轉(zhuǎn)染植物細(xì)胞的其它質(zhì)粒,或整合入根癌土壌桿菌(Agrobacteriumtumefaciens)中以感染植物的質(zhì)粒.可選擇地,可在細(xì)菌例如大腸桿菌(E.coli)中表達(dá)克隆的植物核酸和可分離和純化所得的蛋白.轉(zhuǎn)染植物細(xì)胞重組栽體的制備為在上述技術(shù)中使用分離的序列,制備了適合植物細(xì)胞轉(zhuǎn)化的重組DNA栽體.用于轉(zhuǎn)化多種高等植物物種的技術(shù)是熟知的并且描述于技術(shù)和科學(xué)文獻(xiàn)中,參見,例如,Weising等人(1988)Ann.Rev.Genet.22:421-477.編碼想要的多肽的DNA序列(例如,編碼全長(zhǎng)蛋白的cDNA序列)優(yōu)選地與指導(dǎo)來自基因的序列轉(zhuǎn)錄的轉(zhuǎn)錄和翻譯起始調(diào)節(jié)序列組合.可通過分析與QTL相關(guān)的等位基因的編碼序列上游的5,序列鑒定啟動(dòng)子.啟動(dòng)子序列的序列特征可用于鑒定啟動(dòng)子.已經(jīng)詳盡地研究了控制真核基因表達(dá)的序列.例如,啟動(dòng)子序列元件包括TATA框共有序列(TATAAT),所述序列通常位于轉(zhuǎn)錄起始位點(diǎn)上游20至30個(gè)堿基對(duì)處.在大多數(shù)情況下,TATA框是精確轉(zhuǎn)錄起始所必需的.在植物中,TATA框的更上游,在-80至-100位置,通常存在具有一系列圍繞三核苷酸G(或T)NG的腺噪呤的啟動(dòng)子元件.參見,例如,J.Messing等人(1983)inGeneticEngineeringinPlants,pp.221-227(Kosage,Meredith和Hollaender,eds.)許多用于在植物基因組DNA中鑒定和表征啟動(dòng)子區(qū)域的方法對(duì)于本領(lǐng)域技術(shù)人員來說是熟知的(參見,例如,Jordano等人(1989)PlantCell1:855-866;Bustos等人(1989)PlantCell1:839-854;Green等人(1988)EMB0J.7:4035-4044;Meier等人(1991)PlantCell3:309-316;和Zhang等人(1996)PlantPhysiology110:1069-1079).在本發(fā)明的重組表達(dá)盒的構(gòu)建中,可使用指導(dǎo)基因在再生的植物的所有組織中表達(dá)的植物啟動(dòng)子片段.這類啟動(dòng)子在此處稱作"組成型"啟動(dòng)子并且在大多數(shù)環(huán)境條件下和發(fā)育或細(xì)胞分化狀態(tài)下具有活性.組成型啟動(dòng)子的示例包括花耶菜花葉病毒(CaMV)35S轉(zhuǎn)錄起始區(qū)域、遍在蛋白啟動(dòng)子、來源于根癌土壤桿菌的T-DNA的l,-或2,-啟動(dòng)子,和其它來源于各種本領(lǐng)域技術(shù)人員已知的植物基因的轉(zhuǎn)錄起始區(qū)域.可選擇地,植物啟動(dòng)子可指導(dǎo)本發(fā)明的多核苷酸在特定的組織中表達(dá)(組織特異性啟動(dòng)子)或可在更精確的環(huán)境控制下表達(dá)(誘導(dǎo)型啟動(dòng)子).在發(fā)育控制下的組織特異性啟動(dòng)子的示例包括只在某些組織,例如果實(shí)、種子或花中啟動(dòng)轉(zhuǎn)錄的啟動(dòng)子.例如,來自煙革的組織特異性E8啟動(dòng)子可用于指導(dǎo)基因表達(dá)以使想要的基因產(chǎn)物位于果實(shí)中.其它合適的啟動(dòng)子包括來自編碼胚胎貯存蛋白的基因的啟動(dòng)子.可通過誘導(dǎo)型啟動(dòng)子影響轉(zhuǎn)錄的環(huán)境條件的示例包括厭氣性條件、提高的溫度或光的存在.如果想要正確的多肽表達(dá),則應(yīng)當(dāng)在編碼區(qū)的3,末端包含聚腺苷酰化區(qū)域.聚腺苷?;瘏^(qū)域可來源于天然的基因、來源于多種其它植物基因或來自T-DNA.包含來自本發(fā)明的QTL等位基因的序列(例如,啟動(dòng)子或編碼區(qū))的栽體通常包含賦予植物細(xì)胞可選擇的表型的標(biāo)記基因.例如,所述標(biāo)記可編碼殺生物劑抗性、特別是抗生素抗性(例如對(duì)卡那審素、G418、博來審素、潮審素的抗性)或除草劑抗性(例如對(duì)chlorosluforon或草餒聘的抗性),將核酸導(dǎo)入植物細(xì)胞通過各種常規(guī)技術(shù)可將本發(fā)明的DNA構(gòu)建體導(dǎo)入培養(yǎng)物或植物器官中的植物細(xì)胞.例如,使用例如電穿孔和植物細(xì)胞原生質(zhì)體的顯微注射可直接地將DNA構(gòu)建體導(dǎo)入植物細(xì)胞中,或可使用生物彈射擊方法例如DNA粒子轟擊將DNA構(gòu)建體直接導(dǎo)入植物細(xì)胞.可選^r地,將DNA構(gòu)建體與合適的T-DNA側(cè)翼區(qū)域組合并導(dǎo)入常規(guī)的根癌土壤桿菌宿主栽體.當(dāng)通過用細(xì)菌感染植物細(xì)胞時(shí),根癌土壌桿菌宿主的侵入性功能指導(dǎo)構(gòu)建體和相鄰的標(biāo)記插入植物細(xì)胞DNA中.顯微注射技術(shù)在本領(lǐng)域是已知的并且在科學(xué)和專利文獻(xiàn)中詳細(xì)地描述.使用聚乙二醇沉淀導(dǎo)入DNA構(gòu)建體的方法描述于Paszkowski等人(1984)EMB0J.3:2717.電穿孔技術(shù)描迷于Fromm等人(1985)Proc.Nat'lAcad.Sci.USA82:5824中。生物彈射擊轉(zhuǎn)化技術(shù)描述于Klein等人(1987)Nature327:70-73.根癌土壤桿菌介導(dǎo)的轉(zhuǎn)化技術(shù),包括二元栽體的消除(disarming)和使用,也詳細(xì)地描迷于科學(xué)文獻(xiàn)中.參見例如Horsch等人(1984)Science233:496-498和Fraley等人(1983)Proc.Nat'1Acad.Sei.USA80:4803中,轉(zhuǎn)基因植物的產(chǎn)生可培養(yǎng)經(jīng)轉(zhuǎn)化的植物細(xì)胞(例如,來源于任何上迷轉(zhuǎn)化技術(shù)的植物細(xì)胞)以再生完整的植物,所述完整的植物具有轉(zhuǎn)化的基因型,并從而具有想要的表型.該再生技術(shù)依賴于組織培養(yǎng)生長(zhǎng)培養(yǎng)基中某些植物激素的操作,所述搮作通常依賴于和想要的核普酸序列一起導(dǎo)入的殺生物劑和/或除草劑標(biāo)記,來自培養(yǎng)的原生質(zhì)體的植物再生描述于Evans等人(1983)"ProtoplastsIsolationandCulture"intheHandbookofPlantCellCulture,pp.124-176,Macmi11ianPublishingCompany,N.Y.j和Binding(1985)RegenerationofPlants,PlantProtoplasts,pp.21-73,CRCPress,BocaRaton,也可從植物愈傷組織、外植體、體細(xì)胞胚(例如Dandekar等人(1989)J.TissueCult.Meth.12:145和McGranahan等人(1990)PlantCellRep.8:512)、器官或其部分獲得再生.這些再生技術(shù)通常描述于Uee等人(1987)Ann.Rev.ofPlantPhys.38:467-486,本領(lǐng)域技術(shù)人員認(rèn)識(shí)到在表達(dá)盒穗定地整合入轉(zhuǎn)基因植物中并確定有效后,其可通過有性雜交導(dǎo)入其它植物中.可使用許多標(biāo)準(zhǔn)育種技術(shù)中的任一種,這依賴于要雜交的物種.實(shí)施例下列提供一系列證明確定和利用玉米中穗軸顏色和遣傳標(biāo)記單元型之間的關(guān)聯(lián)的實(shí)施例.要理解此處描述的實(shí)施例和實(shí)施方案是僅用于說明目的并且其各種修飾或改變對(duì)于本領(lǐng)域技術(shù)人員是可以想到的,并且包括在本申請(qǐng)的精神和范圍和所附的權(quán)利要求的范圍之內(nèi).因此,提供下列實(shí)施例說明但不限于請(qǐng)求保護(hù)的本發(fā)明.通過果皮顏色1(Pl)基因部分地確定玉米中的穗軸顏色(例如,紅或白),參見,例如,Neuffer,Coe和Wessler(1997)MutantsofMaize,ColdSpringHarborLaboratoryPress,其第107頁(yè)描述pl-wr,笫363頁(yè)描述所述基因和其作用模式,和笫35頁(yè)描述其圖上的位置.下列實(shí)施例描述穗軸顏色和與pi連鎖的遺傳標(biāo)記之間關(guān)聯(lián)的確定.連鎖圖為產(chǎn)生遣傳標(biāo)記信息,橫跨一套選自多代系譜的近交種(先鋒的已建立的玉米育種群體),對(duì)大量選自EST數(shù)據(jù)庫(kù)的基因座進(jìn)行測(cè)序,基本上如下所述使用這些標(biāo)記產(chǎn)生多點(diǎn)連鎖困.成套的遣傳標(biāo)記包含5741個(gè)單元型(單元型區(qū)),所述單元型通過對(duì)5741個(gè)來自各近交種的EST序列的大約450個(gè)堿基對(duì)進(jìn)行測(cè)序產(chǎn)生。例如,通過對(duì)使用下列引物擴(kuò)增的嵌套式PCR產(chǎn)物進(jìn)行測(cè)序來確定標(biāo)記MZA6914單元型的基因型外部引物taggtgctttgcggaccttg(SEQIDNO:1)和tctgaacagcaaatcgttgttg(SEQIDNO:2),和內(nèi)部引物IDNO:4).成套的的遣傳標(biāo)記也可包括505個(gè)SSR標(biāo)記,所述標(biāo)記的基因型已在B73/Mol7中得以確定并通過作困定位在公開的IBM2圖上.成套的選自已建立的育種群體的近交種包括320個(gè)三生兒(triplet),各三生兒舍有兩個(gè)近交系,而笫三近交系來源于這兩個(gè)系的雜交,其對(duì)應(yīng)于總共大約600個(gè)近交種.使用系謙信息和含有具有不同標(biāo)記等位基因的近交親本的三生兒,通過將標(biāo)記分配到染色體上并將所迷標(biāo)記在染色體上排序產(chǎn)生了包含6246個(gè)標(biāo)記(5741個(gè)單元型和505個(gè)SSRs)的多點(diǎn)連鎖困.(很明顯并不是每一個(gè)三生兒對(duì)每一個(gè)標(biāo)記都能提供信息,例如,如果親本具有相同的標(biāo)記等位基因).所述連鎖困使用公開的IBM2圖(http://www.maizegdb.org)作為骨架.針對(duì)5741個(gè)測(cè)過序的基因座的絕大部分設(shè)計(jì)overgo探針并與物理困詳雜交,從而幫助結(jié)合物理和遺傳困謬和允許對(duì)相鄰太近而不能遣傳作困的標(biāo)記進(jìn)行排序.似然比率TDT測(cè)試用于產(chǎn)生連鎖困謙的近交系的表型數(shù)據(jù)(紅或白色穗軸顏色)已被收集作為先鋒正在進(jìn)行的(Pioneer,songoing)育種程序的部分。使用來自三生兒的第三近交種進(jìn)行關(guān)聯(lián)分析,在所述三生兒中,對(duì)于穗軸顏色而言兩個(gè)親本近交系具有不同的表型(即,一個(gè)紅色親本和一個(gè)白色親本);選自已建立的育種群體、來自這些三生兒的笫三近交種包含第一植物群體.成套的遣傳標(biāo)記在1號(hào)染色體上包含511個(gè)標(biāo)記(488個(gè)單元型和23個(gè)SSRs),其基因型已通過上述測(cè)序得以確定,(所迷分析限于第一染色體,因?yàn)镻l基因座位于1號(hào)染色體上).此外,很明顯并不是每一個(gè)三生兒對(duì)每個(gè)標(biāo)記都提供信息;只有其中兩個(gè)近交親本具有不同標(biāo)記單元型的三生兒提供信息。將遣傳標(biāo)記和表型信息以及第一植物群體中的近交種之間的系謙關(guān)系一起用于TDT分析(參見,例如,Gutin等人UOOl)"Allelicassociationinlargepedigrees"GenetEpidemiol.21Suppl1:S571-575和Spielman等人(1993)"Transmissiontestforlinkagedisequilibrium:Theinsulingeneregionandinsulin-dependentdiabetesmellitus(IDDM)"AmericanJournalofHumanGenetics52:506-516).基于TDT的關(guān)聯(lián)測(cè)試轉(zhuǎn)化成似然比率測(cè)試,所述測(cè)試稱為似然比率TDT測(cè)試(LR-TDT),基于TDT的關(guān)聯(lián)測(cè)試使用可從針對(duì)多個(gè)等位基因的TDT測(cè)試計(jì)算出來的數(shù)據(jù),其中各單元型可具有超過兩個(gè)等位基因(最初由Spielman和Ewens(1996)"TheTDTandotherfamily—basedtestsforlinkagedisequilibriumandassociation"AmericanJournalofHumanGenetics59:983-989提出).我們首先簡(jiǎn)要地描述用于雙等基因標(biāo)記數(shù)據(jù)的測(cè)試,然后將所述方法擴(kuò)展到多個(gè)等位基因數(shù)據(jù)的分析.對(duì)于雙等位基因數(shù)據(jù),我們定義在給定的親本基因型M浙中傳遞等位基因浙而不傳遞等位基因趙的條件概率為-戶(浙,浙lg浙^),和傳遞等位基因趙但不傳遞浙的條件概率為/21-戶(浙,浙lgfu和^的最大似然估計(jì)值分別是+和""/(""+對(duì)于目的標(biāo)記存在fl個(gè)具有提供信息的親本的個(gè)體;這些中的化2遣傳笫一標(biāo)記等位基因和笫二性狀表型,這些中的""遣傳笫二標(biāo)記等位基罔和笫一性狀表型.罔此,將標(biāo)記等位基因從雜合親本傳遞到受影響的子代的對(duì)數(shù)似然函數(shù)為InA-to(&)+1n&,)=to^^.在零假設(shè)時(shí)相應(yīng)的對(duì)數(shù)似然函數(shù)為似然比率測(cè)試統(tǒng)計(jì)學(xué)值為其具有(df表示自由度)的卡方分布.為將上式推廣到多等位基因標(biāo)記數(shù)據(jù),我們假設(shè)針對(duì)各標(biāo)記基因座(在該實(shí)施例中為各標(biāo)記單元型)的i"個(gè)等位基因.我們指定一個(gè)等位基因,妖為浙等位基因.所有其它的等位基因一起作為等位基因浙來處理,并且將其等位基因計(jì)數(shù)合并以使多個(gè)等位基因數(shù)據(jù)轉(zhuǎn)化成i"個(gè)雙等位基因數(shù)據(jù)集.于是針對(duì)f個(gè)等位基因的對(duì)數(shù)似然比率測(cè)試統(tǒng)計(jì)學(xué)值(i^rk)是i個(gè)獨(dú)立的對(duì)數(shù)似然比率測(cè)試(力i;;)的總和上迷多等位基因?qū)?shù)似然比率測(cè)試統(tǒng)計(jì)學(xué)值具有自由度W^-J的漸近卡方分布.閨4困示了針對(duì)511個(gè)按染色體位置順序排列的標(biāo)記的穗軸顏色TDT似然比率統(tǒng)計(jì)學(xué)值.似然曲線(困4)上的水平虛線是在針對(duì)多基因座測(cè)試ab"o7邁的Bonferroni調(diào)整后的閾值或顯著性Zi7;值,其中邁是染色體上標(biāo)記的數(shù)目,且"豕O.01.箭標(biāo)表示pl基因座的位置,給出了關(guān)于上述的多點(diǎn)連鎖閨的困謙位置.表1提供了關(guān)于LR-TDT測(cè)試的類外細(xì)節(jié).對(duì)于幾個(gè)遣傳標(biāo)記單元型(由MZA數(shù)字表示)的每一個(gè),該表顯示樣品的大小(在笫一植物群體中第三近交種的數(shù)目,對(duì)應(yīng)于為特定標(biāo)記提供信息的三生兒的數(shù)目)、自由度(df,等于標(biāo)記單元型數(shù)目減1)、TDT測(cè)試的卡方值、與卡方值相關(guān)的概率、連鎖群(對(duì)應(yīng)于公開的玉米遣傳困詳)和以厘摩為單位的困謙位置(cm,關(guān)于上述的多點(diǎn)連鎖困譜).要注意具有頻率低于5X的遣傳標(biāo)記單元型不包括在所述分析中.例如,對(duì)于MZA6914,三種單元型各具有低于5X的頻率,從而不予考慮,而當(dāng)三種單元型各具有大于5X的頻率時(shí),加予考慮.表i.針對(duì)穗軸顏色的LR-TDT結(jié)果<table>tableseeoriginaldocumentpage55</column></row><table>如閨4和表1中所表明的,在標(biāo)記MZA6914和穗軸顏色之間觀察到高度顯著的關(guān)聯(lián).基于來自物理困謙的信息,MZA6914不是pl基因,但卻是與pl緊密連鎖的序列.應(yīng)用根據(jù)MZA6914和如上所述在近交種笫一群體中確定的穗軸顏色之間的關(guān)聯(lián),在其它植物中基于其MZA6914基因型可預(yù)測(cè)穗軸顏色,并且該信息可用于選擇和培貫想要的表型,例如,具有想要的MZA6914基因型(例如,與白色穗軸相關(guān)的MZA6914單元型)的植物可在授粉前被鑒定并用作白色玉米產(chǎn)品開發(fā)程序中的親本,例如,其中其子代(包含靶植物群體)經(jīng)預(yù)測(cè)具有白色穗軸.例如,在具有白色種子的雜種中,白色穗軸是想要的,因?yàn)榧t色穎片難以去除并且可將不想要的顏色加到產(chǎn)生自種子的玉米片(cornchip)、玉米粉圃餅(tortillas)等中.在授粉前選擇植物可導(dǎo)致在開發(fā)過程中明顯地節(jié)省勞力.因此,在植物授粉前預(yù)測(cè)子代的穗軸顏色表型可增加開發(fā)近交系和/或具有白色穗軸和白色種子的功效.如果想要,在用于在育種程序中選擇親本和預(yù)測(cè)子代表型之前在分離雜交中可答定關(guān)聯(lián).上述的關(guān)聯(lián)分析和表型性狀預(yù)測(cè)的示例使用穗軸顏色,但該類型的分析和預(yù)測(cè)同樣可用于任何質(zhì)重性狀或以單基因?yàn)闂l件的任何簡(jiǎn)單性狀.例如,針對(duì)許多植物疾病的單基因條件性抗性,和在本實(shí)施例中提出的策略可用于預(yù)測(cè)、培育和/或選擇對(duì)這些疾病具有抗性的子代,在MutantsofMaize(同上)提供了許多其它的簡(jiǎn)單性狀的示例.也如此處所提到的,通過使用設(shè)計(jì)用于鑒定與連續(xù)性狀相關(guān)的遺傳區(qū)域的統(tǒng)計(jì)學(xué)分析,可使用相關(guān)的策略確定關(guān)聯(lián)和預(yù)測(cè)具有連續(xù)表型分布和可由多個(gè)基因座控制的性狀的表型.盡管為了闡明和理解的目的,已對(duì)前述的發(fā)明進(jìn)行了一些詳細(xì)的描迷,但通過閱讀該公開容,領(lǐng)域技術(shù)人員清楚可產(chǎn)生各種形式和細(xì)節(jié)上的變化而不背離本發(fā)明的真實(shí)范閨.例如,所有的上述技術(shù)和組合物可以以各種組合使用.所有出版物、專利、專利申請(qǐng)和/或其它本申請(qǐng)中引用的文獻(xiàn)以其全文在此引用作為參考,就如同每一單個(gè)出版物、專利、專利申請(qǐng)和/或其它文獻(xiàn)被單獨(dú)地說明被引用作為參考一樣.權(quán)利要求1.預(yù)測(cè)靶植物群體中表型性狀值的方法,所述方法包括(a)提供至少一個(gè)遺傳標(biāo)記和表型性狀之間的關(guān)聯(lián);其中估計(jì)第一植物群體中的所述關(guān)聯(lián),所述第一植物群體是已建立的育種群體或其部分;其中根據(jù)統(tǒng)計(jì)學(xué)模型估計(jì)第一植物群體中的所述關(guān)聯(lián),所述統(tǒng)計(jì)學(xué)模型合并所述第一植物群體的一套遺傳標(biāo)記的基因型和所述第一植物群體中的表型性狀值;和,(b)提供至少一個(gè)靶植物群體成員的表型性狀值,其中所述提供包括根據(jù)(a)的關(guān)聯(lián)和根據(jù)至少一個(gè)與所述表型性狀相關(guān)的遺傳標(biāo)記的至少一個(gè)成員的基因型預(yù)測(cè)所述值。2.權(quán)利要求l的方法,其中所迷笫一植物群體包含多個(gè)近交種、單交F1雜種或其組合.3.權(quán)利要求2的方法,其中所述笫一植物群體由近交種、單交Fl雜種或其組合組成.4.權(quán)利要求2的方法,其中所述各近交種和/或單交Fl雜種的祖先是已知的,且其中各近交種和/或單交Fl雜種是三個(gè)或更多個(gè)建立者中至少一個(gè)的后代.5.權(quán)利要求1的方法,其中所述已建立的育種群體包含至少三個(gè)建立者和建立者的后代,其中所述后代的祖先是已知的.6.權(quán)利要求5的方法,其中所述已建立的育種群體包含大約100至大約200個(gè)建立者和建立者的后代,其中所迷后代的祖先是已知的,7.權(quán)利要求1的方法,其中所述笫一植物群體的成員跨越至少3個(gè)育種周期.8.權(quán)利要求7的方法,其中所述笫一植物群體的成員跨越至少4個(gè)育種周期.9.權(quán)利要求7的方法,其中所述第一植物群體的成員跨越至少7個(gè)或至少9個(gè)育種周期.10.權(quán)利要求l的方法,其中所述表型性狀是數(shù)量表型性狀.11.權(quán)利要求l的方法,其中所迷表型性狀是質(zhì)量表型性狀.12.權(quán)利要求l的方法,進(jìn)一步包括選擇至少一個(gè)把植物群體的具有想要的表型性狀預(yù)測(cè)值的成員.13.權(quán)利要求12的方法,進(jìn)一步包括將至少一個(gè)選擇的所述靶植物群體的成員與至少一上其它植物進(jìn)行育種,14.權(quán)利要求l的方法,其中所述第一植物群體包含大約50至大約5000個(gè)成員.15.權(quán)利要求1的方法,其中所述笫一植物群體包含多個(gè)近交系.16.權(quán)利要求1的方法,其中所述笫一植物群體包含多個(gè)單交F1雜種.17.權(quán)利要求l的方法,其中所述笫一植物群體包含多個(gè)近交種和單交F1雜種的組合.18.權(quán)利要求l的方法,其中通過在至少一個(gè)與至少一個(gè)測(cè)交親本的頂交組合中估計(jì)所述第一植物群體的成員之間的表型性狀來在所述第一植物群體中獲得表型性狀值.19.權(quán)利要求l的方法,其中所述表型性狀選自產(chǎn)量、谷粒含水重、谷粒含油重、根抗倒伏性、莖桿抗倒伏性、抹高、谷穗高、抗病性、抗蟲性、抗旱性、谷粒蛋白含量、試驗(yàn)重量和穗軸顏色.20.權(quán)利要求l的方法,其中所述成套的遣傳標(biāo)記包含一個(gè)或多個(gè)單核苷酸多態(tài)性(SNP)、多核苷酸多態(tài)性、至少一個(gè)核苷酸插入、至少一個(gè)核苷酸的缺失、簡(jiǎn)單序列重復(fù)(SSR)、限制性片段長(zhǎng)度多態(tài)性(RFLP)、隨機(jī)擴(kuò)增多態(tài)DNA(RAPD)標(biāo)記或任意片段長(zhǎng)度多態(tài)性(AFLP).21.權(quán)利要求1的方法,其中所述成套的遺傳標(biāo)記包含1至10個(gè)標(biāo)記。22.權(quán)利要求1的方法,其中所述成套的遣傳標(biāo)記包含500至50,000個(gè)標(biāo)記.23.權(quán)利要求l的方法,其中通過實(shí)驗(yàn)確定各近交種的基因型和預(yù)測(cè)存在于所迷笫一植物群體中的各單交Fl雜種的基因型來獲得所述笫一植物群體的成套遣傳標(biāo)記的基因型.24.權(quán)利要求23的方法,其中通過實(shí)驗(yàn)確定各近交種的基因型包括對(duì)來自各近交種的成套DNA片段進(jìn)行測(cè)序.25.權(quán)利要求24的方法,其中所述成套DNA片段包含兩個(gè)或更多個(gè)基因的5,非翻譯區(qū)和/或3,非翻譯區(qū)。26.權(quán)利要求l的方法,其中提供至少一個(gè)遣傳標(biāo)記和表型性狀之間的關(guān)聯(lián)包括提供包含兩個(gè)或更多個(gè)遣傳標(biāo)記的單元型和表型性狀之間的關(guān)聯(lián).27.權(quán)利要求l的方法,其中所述統(tǒng)計(jì)學(xué)模型合并所述笫一植物群體的成員之間的家系關(guān)系.28.權(quán)利要求l的方法,其中根據(jù)所迷統(tǒng)計(jì)學(xué)模型估計(jì)關(guān)聯(lián)包含使用線性模型、混合線性模型或非線性模型進(jìn)行Bayesian分析.29.權(quán)利要求28的方法,其中通過可逆的跳躍馬爾可夫鏈MonteCarlo算法、厶方法或特征似然算法進(jìn)行Bayesian分析.30.權(quán)利要求l的方法,其中根據(jù)所述統(tǒng)計(jì)學(xué)模型估計(jì)所述關(guān)聯(lián)包括使用線性模型進(jìn)行Bayesian分析,所述Bayesian分析通過可逆的跳躍馬爾可夫鏈MonteCarlo算法進(jìn)行.31.權(quán)利要求l的方法,其中根據(jù)所述統(tǒng)計(jì)學(xué)模型估計(jì)所述關(guān)聯(lián)包括進(jìn)行傳遞不平衡檢驗(yàn).32.權(quán)利要求1的方法,其中估計(jì)所述關(guān)聯(lián)包括和/或允許確定一個(gè)或多個(gè)相關(guān)近交種和/或單交Fl雜種的系譜中的至少一個(gè)遺傳標(biāo)記的建立者等位基因的血緣同一信息,和允許在整個(gè)這樣的系謙中追蹤至少一個(gè)遣傳標(biāo)記.33.權(quán)利要求l的方法,其中通過實(shí)驗(yàn)確定所迷靶植物群體的至少一個(gè)成員的至少一個(gè)遣傳標(biāo)記的基因型,34.權(quán)利要求33的方法,其中通過高通量篩選經(jīng)實(shí)驗(yàn)確定所述基因型。35.權(quán)利要求l的方法,其中預(yù)測(cè)所述把植物群體的至少一個(gè)成員的至少一個(gè)遣傳標(biāo)記的基因型,36.權(quán)利要求l的方法,其中所迷靶植物群體包含近交植物.37.權(quán)利要求l的方法,其中所迷靶植物群體包含雜交植物.38.權(quán)利要求37的方法,其中所述雜交植物包含從近交系之間單交產(chǎn)生的Fl后代。39.權(quán)利要求38的方法,其中所述F1后代從包含所述第一植物群體的近交種之間的單交產(chǎn)生,所述雜交植物不包含所述笫一植物群體.40.權(quán)利要求l的方法,其中所述靶植物群體包含從包含至少一個(gè)所述笫一植物群體的成員的育種雜交產(chǎn)生的后生世代。41.權(quán)利要求l的方法,其中在所述靶植物群體的至少一個(gè)成員中預(yù)測(cè)表型性狀值包括使用最佳線性無偏預(yù)測(cè)方法預(yù)測(cè)所述值.42.權(quán)利要求l的方法,其中在所述靶植物群體的至少一個(gè)成員中預(yù)測(cè)表型性狀值包括通過使用多重回歸方法、選擇指數(shù)技術(shù)、脊回歸方法、線性最優(yōu)化方法或非線性最優(yōu)化方法預(yù)測(cè)所迷值.43.權(quán)利要求l的方法,其中所述笫一和靶植物群體由二倍體植物組成.44.權(quán)利要求1的方法,其中所述第一和靶植物群體選自玉米、大豆、高梁、小麥、向曰葵、水稻、低芥酸芥子、棉花和粟.45.權(quán)利要求44的方法,其中所述第一和靶植物群體包含玉米,46.權(quán)利要求45的方法,其中所述笫一和靶植物群體包含玉蜀黍.47.權(quán)利要求l的方法,進(jìn)一步包括克隆與至少一個(gè)與表型性狀相關(guān)的遣傳標(biāo)記連鎖的基因,其中所述基因的表達(dá)影響所述表型性狀,48.權(quán)利要求47的方法,進(jìn)一步包括通過在宿主植物中表達(dá)克隆的基因構(gòu)建轉(zhuǎn)基因植物.49.通過權(quán)利要求12的方法選擇的植物.50.通過權(quán)利要求13的育種方法產(chǎn)生的植物.51.通過權(quán)利要求48的方法產(chǎn)生的轉(zhuǎn)基因植物.52.選擇植物的方法,所述方法包括(a)提供至少一個(gè)遺傳標(biāo)記和表型性狀之間的關(guān)聯(lián);其中估計(jì)第一植物群體中的所述關(guān)聯(lián),所述第一植物群體是已建立的育種群體或其部分;其中根據(jù)統(tǒng)計(jì)學(xué)模型估計(jì)第一植物群體中的所述關(guān)聯(lián),所述統(tǒng)計(jì)學(xué)模型合并所述笫一植物群體的一套遺傳標(biāo)記的基因型和所述第一植物群體中的表型性狀值;和,(b)提供一個(gè)或多個(gè)來自一個(gè)或多個(gè)非適應(yīng)系的植物,其中所述提供包括,就選擇的包含至少一個(gè)與表型性狀相關(guān)的遣傳標(biāo)記的基因型選擇一個(gè)或多個(gè)植物.53.權(quán)利要求52的方法,其中所述第一植物群體包含多個(gè)近交種、單交F1雜種或其組合.54.權(quán)利要求53的方法,其中所述第一植物群體由近交種、單交F1雜種或其組合組成。55.權(quán)利要求53的方法,其中所述各近交種和/或單交Fl雜種的祖先是已知的,且其中各近交種和/或單交Fl雜種是三個(gè)或更多個(gè)建立者中至少一個(gè)的后代.56.權(quán)利要求52的方法,其中所述已建立的育種群體包含至少三個(gè)建立者和建立者的后代,其中所述后代的祖先是已知的.57.權(quán)利要求56的方法,其中所述已建立的育種群體包含大約100至大約200個(gè)建立者和建立者的后代,其中所述后代的祖先是已知的.58.權(quán)利要求52的方法,其中所述笫一植物群體的成員跨越至少3個(gè)育種周期.59.權(quán)利要求58的方法,其中所述第一植物群體的成員跨越至少4個(gè)育種周期.60.權(quán)利要求58的方法,其中所述第一植物群體的成員跨越至少7個(gè)或至少9個(gè)育種周期.61.權(quán)利要求52的方法,其中所迷表型性狀是數(shù)量表型性狀,62.權(quán)利要求52的方法,其中所迷表型性狀是質(zhì)量表型性狀,63.權(quán)利要求52的方法,進(jìn)一步包括在一個(gè)或多個(gè)具有所選擇的基因型的植物中估計(jì)所述表型性狀.64.權(quán)利要求63的方法,進(jìn)一步包括選擇至少一個(gè)具有所選擇的基因型和想要的表型性狀值的植物.65.權(quán)利要求64的方法,進(jìn)一步包括將至少一個(gè)選擇的具有所選擇的基因型和想要的表型性狀值的植物與至少一個(gè)其它植物進(jìn)行育種.66.權(quán)利要求52的方法,其中通過在至少一個(gè)與至少一個(gè)測(cè)交親本的頂交組合中估計(jì)所述笫一植物群體的成員之間的表型性狀來在所述第一植物群體中獲得表型性狀值.67.權(quán)利要求52的方法,其中所述表型性狀選自產(chǎn)重、谷粒含水量、谷粒含油量、根抗倒伏性、莖桿抗倒伏性、林高、谷穗高、抗病性、抗蟲性、抗早性、谷粒蛋白含量、試驗(yàn)重量和穗軸顏色.68.權(quán)利要求52的方法,其中所述成套的遣傳標(biāo)記包含一個(gè)或多個(gè)單核苷酸多態(tài)性(SNP)、多核苷酸多態(tài)性、至少一個(gè)核苷酸插入、至少一個(gè)核苷酸的缺失、簡(jiǎn)單序列重復(fù)(SSR)、限制性片段長(zhǎng)度多態(tài)性(RFLP)、隨機(jī)擴(kuò)增多態(tài)DNA(RAPD)標(biāo)記或任意片段長(zhǎng)度多態(tài)性UFLP).69.權(quán)利要求52的方法,其中通過實(shí)驗(yàn)確定各近交種的基因型和預(yù)測(cè)存在于所述笫一植物群體中的各單交Fl雜種的基因型來獲得所述第一植物群體的成套遣傳標(biāo)記的基因型.70.權(quán)利要求69的方法,其中通過實(shí)驗(yàn)確定各近交種的基因型包括對(duì)來自各近交種的成套DNA片段進(jìn)行測(cè)序.71.權(quán)利要求70的方法,其中所述成套DNA片段包含兩個(gè)或更多個(gè)基因的5,非翻譯區(qū)和/或3,非翻譯區(qū).72.權(quán)利要求52的方法,其中提供至少一個(gè)遣傳標(biāo)記和表型性狀之間的關(guān)聯(lián)包括提供包含兩個(gè)或更多個(gè)遣傳標(biāo)記的單元型和表型性狀之間的關(guān)聯(lián).73.權(quán)利要求52的方法,其中所述統(tǒng)計(jì)學(xué)模型合并所述第一植物群體的成員之間的家系關(guān)系.74.權(quán)利要求52的方法,其中根據(jù)所述統(tǒng)計(jì)學(xué)模型估計(jì)關(guān)聯(lián)包含使用線性模型、混合線性模型或非線性模型進(jìn)行Bayesian分析.75.權(quán)利要求74的方法,其中通過可逆的跳躍馬爾可夫鏈MonteCarlo算法、A方法或特征似然算法進(jìn)行Bayesian分析.76.權(quán)利要求52的方法,其中根據(jù)所述統(tǒng)計(jì)學(xué)模型估計(jì)所述關(guān)聯(lián)包括使用線性棋型進(jìn)行Bayesian分析,所迷Bayesian分析通過可逆的跳躍馬爾可夫鏈MonteCarlo算法進(jìn)行.77.權(quán)利要求52的方法,其中根據(jù)所述統(tǒng)計(jì)學(xué)模型估計(jì)所述關(guān)聯(lián)包括進(jìn)行傳遞不平衡檢驗(yàn),78.權(quán)利要求52的方法,其中所迷第一植物群體和一個(gè)或多個(gè)非適應(yīng)系由二倍體植物組成.79.權(quán)利要求52的方法,其中所述第一植物群體和一個(gè)或多個(gè)非適應(yīng)系選自玉米、大豆、髙梁、小麥、向日葵、水稻、低芥酸芥子、棉花和栗.80.權(quán)利要求79的方法,其中所述第一植物群體和一個(gè)或多個(gè)非適應(yīng)系包含玉米.81.權(quán)利要求80的方法,其中所述第一植物群體和一個(gè)或多個(gè)非適應(yīng)系包含玉蜀黍.82.權(quán)利要求64的方法,進(jìn)一步包括從具有選擇的基因型和想要的表型性狀值的至少一個(gè)所選擇的植物中克隆基因,所述基因與至少一個(gè)與表型性狀相關(guān)的遣傳標(biāo)記連鎖,其中所迷基因的表達(dá)影響所述表型性狀。83.權(quán)利要求82的方法,進(jìn)一步包括通過在宿主植物中表達(dá)克隆的基因構(gòu)建轉(zhuǎn)基因植物.84.通過權(quán)利要求52的方法提供的植物.85.通過權(quán)利要求64的方法選擇的植物.86.通過權(quán)利要求65的育種方法產(chǎn)生的植物.87.通過權(quán)利要求83的方法產(chǎn)生的轉(zhuǎn)基因植物.全文摘要提供了用于使用遺傳標(biāo)記基因型(例如,基因序列多樣性信息)提高開發(fā)具有改進(jìn)的表型性能的植物品種(例如,單交雜種)的方法。提供了用于在植物中預(yù)測(cè)表型性狀值的方法。所述方法使用第一植物群體的基因型、表型和任選地家系關(guān)系信息鑒定至少一個(gè)遺傳標(biāo)記和表型性狀之間的關(guān)聯(lián),然后使用所述關(guān)聯(lián)在一個(gè)或多個(gè)具有已知標(biāo)記基因型的第二靶群體的成員中預(yù)測(cè)所述表型性狀值。也提供了用于鑒定影響所述性狀的新等位基因變體的方法。也提供了通過此處方法中的任一種方法選擇的、提供的或產(chǎn)生的植物、通過此處方法中的任一種方法產(chǎn)生的轉(zhuǎn)基因植物和用于進(jìn)行此處方法的數(shù)字系統(tǒng)。文檔編號(hào)A01H1/00GK101410008SQ200480021989公開日2009年4月15日申請(qǐng)日期2004年5月27日優(yōu)先權(quán)日2003年5月28日發(fā)明者A·J·拉法爾斯基,M·庫(kù)珀,O·S·史密斯,R·呂德特克,S·V·廷吉,W·S·尼布爾申請(qǐng)人:先鋒高級(jí)育種國(guó)際公司;納幕爾杜邦公司