專利名稱:玉米多態(tài)性和基因分型的方法
技術(shù)領(lǐng)域:
本發(fā)明公開了玉米多態(tài)性,涉及所述多態(tài)性的核酸分子以及使用 所述多態(tài)性和分子的方法,例如,在基因分型中。
背景技術(shù):
多態(tài)性用作遺傳標(biāo)記,用于農(nóng)業(yè)領(lǐng)域中的基因分型應(yīng)用,例如, 在植物遺傳研究和商業(yè)育種中。參見例如美國專利5,385, 835; 5, 437, 697 ; 5, 385, 835; 5, 492, 547; 5, 746, 023; 5, 962, 764; 5, 981, 832和6, 100, 030,所有這些專利的公開內(nèi)容通過引用并入本 文。DM的高度保守性與極少發(fā)生的穩(wěn)定的多態(tài)性相結(jié)合提供了遺傳 標(biāo)記,這兩者都是可預(yù)測的并且都可以辨別不同的基因型?,F(xiàn)有的遺 傳標(biāo)記種類之一是指示遺傳變異的多種多態(tài)性,包括限制性片段長度 多態(tài)性(RFLPs ),擴增片段長度多態(tài)性(AFLPs ),簡單序列重復(fù)(SSRs ),
6)和插入/缺失多態(tài)性(Indels)。用于植物物 種的遺傳標(biāo)記的數(shù)量是有限的,因此額外的遺傳標(biāo)記的發(fā)現(xiàn)將促進(jìn)基 因分型應(yīng)用,包括標(biāo)記性狀關(guān)聯(lián)研究,基因定位,基因發(fā)現(xiàn),標(biāo)記輔 助選擇和標(biāo)記輔助育種。發(fā)展中的技術(shù)使得一些遺傳標(biāo)記更適于快速 的,大規(guī)模用途。例如,SNP檢測技術(shù)表明SNP是優(yōu)選的遺傳標(biāo)記。
發(fā)明概述
本發(fā)明提供了大量的玉米遺傳標(biāo)記。這些遺傳標(biāo)記包括玉米DNA 基因座,其用于至少兩種玉米品種之間的基因分型應(yīng)用。本發(fā)明的多 態(tài)性玉米基因座包含至少20個連續(xù)的核苷酸,其包括多態(tài)性或與多態(tài) 性相鄰,所述多態(tài)性是本文(例如,表1中)鑒定的多態(tài)性。更具體 地,本發(fā)明的多態(tài)性玉米基因座具有這樣的核苷酸序列,其與包括多 態(tài)性或者與多態(tài)性相鄰的玉米DNA片段的任一條鏈中的相同核苷酸數(shù) 量的序列至少90%,優(yōu)選至少95°/。同一。如在表l中所示,SEQIDN0: 1至SEQIDN0: 10373的核酸序列包含一個或多個多態(tài)性,例如,單 核苷酸多態(tài)性(SNPs)和插入/缺失多態(tài)性(Indels)。
在本發(fā)明的一個方面中,在一個或多個DNA序列的數(shù)據(jù)組中提供 了多態(tài)性玉米基因座,即數(shù)據(jù)組包含高達(dá)限定數(shù)量的不同序列的多態(tài) 性基因座。數(shù)據(jù)組中的限定數(shù)量的多態(tài)性基因座可以少至2個或高達(dá) 1000個以上或更多,例如,5、 10、 25、 40、 75、 100或500個基因座。 此類數(shù)據(jù)組用于大規(guī)模的或包括大量的植物的基因分型應(yīng)用。在本發(fā) 明的一個有用的方面中,多態(tài)性玉米基因座的數(shù)據(jù)組記錄在計算機可 讀介質(zhì)上。
在本發(fā)明的另一個方面中,將本發(fā)明的基因座中的多態(tài)性定位在 玉米基因組上,例如,作為包含兩個或多個多態(tài)性的圖譜位置的玉米 基因組的遺傳圖鐠,如表1中所示,更優(yōu)選如表3中所示。此類遺傳 圖譜在
圖1中說明。遺傳圖譜數(shù)據(jù)還可以記錄在計算機可讀介質(zhì)上。 本發(fā)明的優(yōu)選實施方案提供高密度的多態(tài)性遺傳圖鐠,例如,至少150 個或更多,比如說至少500個或1000個,跨越玉米基因組圖傳的多態(tài)
7性。特別地,有用的遺傳圖語包含在連鎖群上平均距離不多于IO厘摩 (cM)的多態(tài)性。
本發(fā)明還提供了用于鑒定多態(tài)性的核酸分子,此類分子優(yōu)選是寡 核苷酸,其用作用于擴增玉米基因組片段(例如,多態(tài)性基因座)的 PCR引物,和用于在玉米DM中鑒定特定多態(tài)性的存在或缺失的測定 的雜交探針。
通常,用作PCR引物的核酸分子是成對提供的,用于擴增包含至 少 一個多態(tài)性的玉米DNA片段,其中各個分子包含至少15個核苷酸堿 基。引物分子之一的核苷酸序列與多態(tài)性基因座中的玉米DNA片段的 一條鏈中的相同連續(xù)核苷酸數(shù)量的序列優(yōu)選至少90%同一。優(yōu)選地, 引物可以在高嚴(yán)緊條件下與多態(tài)性基因座DNA的鏈雜交。優(yōu)選地,成 對地提供和使用此類引物,所述引物在多態(tài)性基因座中的玉米DNA片 段中的至少一個多態(tài)性的側(cè)翼。
用作雜交探針的核酸分子,用于檢測玉米DM中的多態(tài)性,其可 以針對多種測定進(jìn)行設(shè)計。為測定目的(其中探針意欲于與包括多態(tài) 性的片段雜交),此類分子可以包含至少12個核苷酸堿基和可檢測的 標(biāo)記。核苷酸堿基的序列與本發(fā)明的多態(tài)性基因座中的玉米DNA片段 的任一條鏈中相同連續(xù)核苷酸數(shù)量的序列優(yōu)選至少90%同一,更優(yōu)選 至少95%同一。本發(fā)明優(yōu)選的方面中,可檢測的標(biāo)記是位于所述分子 的一個末端的染料。在更優(yōu)選的方面中,所述分子在其末端包含染料 和染料淬滅劑。就SNP測定而言,成對提供此類分子是有用的,例如, 其中各個分子在5,端具有不同的熒光染料并且除單核苷酸多態(tài)性以
外具有相同的核苷酸序列。
為了測定目的(其中分子設(shè)計為雜交于多態(tài)性鄰近,所述多態(tài)性 通過單堿基延伸檢測,例如,標(biāo)記的雙脫氧核苷酸的單堿基延伸), 此類分子可以在序列中包含至少15個,更優(yōu)選至少16個或17個核苷 酸堿基,所述序列與多態(tài)性玉米DM片段的任一條鏈中的相同連續(xù)核 苷酸數(shù)量的序列至少90%同一,優(yōu)選至少95%同一。
本發(fā)明的另一方面是雜交探針和玉米基因組DM片段的復(fù)合物。
8本發(fā)明另 一方面提供了寡核苷酸組,其包含用于PCR擴增多態(tài)性 玉米DM片段的核酸分子引物對,和用于檢測所述片段中的多態(tài)性的 至少一個檢測核酸分子。此類組以至少2組或高達(dá)1000組或更多,例 如,高達(dá)5、 10、 25、 40、 75、 100或500組的引物對和雜交探針的集 合形式提供。
本發(fā)明的另一方面提供了用于確定多態(tài)性的方法,就真核基因組 中的基因分型應(yīng)用而言,所述多態(tài)性作為標(biāo)記很可能是有用的。此類 方法包括通過分離來自一個物種的至少兩個品種的基因組DM片段的 重復(fù)序列,基于核苷酸序列的大小將分離的基因組DNA片段分開,并 且比較級分中的片段的序列以確定多態(tài)性來構(gòu)建約化表示文庫
(reduced representation 1 ibraries )。更具體地,鑒定基因組DNA 中的多態(tài)性的方法包括用甲基化敏感的核酸內(nèi)切酶消化來自 一個真核 物種的至少兩個品種的總基因組DNA,以提供經(jīng)消化的DM片段的庫
(pool)。對于由更低百分比的5-曱基化胞嘧啶表征的DNA區(qū)域,片 段的平均核苷酸長度更小。此類片段是可分離的,例如,通過凝膠電 泳,基于核苷酸長度。具有少于平均核苷酸長度的DNA級分分離自經(jīng) 消化的DNA庫。比較級分中的DNA序列以鑒定多態(tài)性。與編碼序列相 比,重復(fù)序列更可能包含5-甲基化胞嘧啶,例如在-CG-和-CNG序列片 段中。在該方法優(yōu)選的一個方面中,用甲基化敏感的核酸內(nèi)切酶消化 來自一種作物的至少兩種不同的近交品種的基因組DM,所述核酸內(nèi)
切酶選自由Aci I, Apa I, Age I, Bsr F I, BssH II, Eag I, Eae I, Hha I, HinPl I, Hpa II, Msp I, MspM II, Nar I, Not I, Pst I, Pvu I, Sac II, Sma I, Stu I和Xho I組成的組,以提供一皮物理分 離(例如,通過凝膠電泳)的經(jīng)消化的MA庫。相當(dāng)大小的DM級分 獲得自各個所述品種的經(jīng)消化的DM。將來自相當(dāng)級分的DM分子插 入到載體中以構(gòu)建基因組DNA克隆的約化表示文庫,對其進(jìn)行測序和 比較,以鑒定多態(tài)性。
在可選擇的方法中,通過用核酸內(nèi)切酶消化來自一個真核物種的 至少兩個品種的總基因組DM以提供經(jīng)消化的DNA片段的庫,從而鑒定基因組DNA中的多態(tài)性。將經(jīng)消化的DNA片段在基底上的陣列中進(jìn) 行分離并且與一種或多種經(jīng)標(biāo)記的具有重復(fù)序列元件的寡核苷酸接 觸,所述重復(fù)序列元件表征該物種中的MA。雜交鑒定由重復(fù)序列表 征的DNA片段。針對多態(tài)性,比較不與重復(fù)序列寡核苷酸雜交的DNA 片段的序列。此類方法提供了來自植物的約化表示的基因組DNA的片 段,所述植物具有這樣的基因組DM,其包含具有相對較高水平的甲 基化胞嘧啶的DNA區(qū)和具有相對較低水平的曱基化胞嘧啶的DNA區(qū)。 本發(fā)明的約化表示片段包含來自具有相對較低水平的甲基化胞嘧啶的 DNA區(qū)的基因組DNA,并且在由所述片段的核酸大小表征的級分中提 供,例如,在500至3000bp范圍內(nèi)。
本發(fā)明還提供了使用本發(fā)明的基因座和多態(tài)性的方法,例如,在 基因分型和相關(guān)的應(yīng)用中。本發(fā)明一方面提供了通過比較至少兩種玉 米品系中的DNA序列找出玉米DNA中的多態(tài)性的方法,其中通過使用 多態(tài)性玉米DNA基因座的片段選擇序列。用于比較的DNA序列優(yōu)選與 多態(tài)性基因座的序列至少80%同一。更優(yōu)選地,所述序列與多態(tài)性基 因座相連鎖。
本發(fā)明還提供通過測定來自至少一種玉米品系的組織的DNA或 mRM以鑒定與本發(fā)明的多態(tài)性基因座連鎖的核酸多態(tài)性的存在的基 因分型的方法。在本發(fā)明優(yōu)選方面中,基因分型使用在圖l的遺傳圖 譜中鑒定的多態(tài)性,如通過表3所擴增。在本發(fā)明的另一個優(yōu)選的方 面,基因分型包括針對至少兩個玉米品系鑒定一 個或多個表型性狀以 及確定性狀和多態(tài)性之間的關(guān)聯(lián)(association),例如鑒定和選擇性 狀互補的林系用于育種以提高雜種優(yōu)勢。用于此類基因分型的測定可 以使用足夠的核酸分子以鑒定至少2個和高達(dá)5000個或更多的不同的 多態(tài)性的存在,例如,其中不同多態(tài)性的數(shù)量為5、 10、 25、 40、 75、 100、 500、 1000、 2000、 3000或4000個。
本發(fā)明還提供了通過確定分離自一種或多種玉米植物的核酸分子 的核酸序列中多態(tài)性的存在研究玉米等位基因的方法,其中所述多態(tài) 性與本發(fā)明的多態(tài)性基因座連鎖。
10本發(fā)明還提供了通過鑒定基因組序列中已定位的多態(tài)性的存在定 位玉米基因組序列的方法,其中已定位的多態(tài)性與本發(fā)明的多態(tài)性連 鎖,例如在本發(fā)明的遺傳圖譜中已定位的多態(tài)性。
本發(fā)明還提供了通過選擇具有借助連鎖不平衡而與目的性狀相關(guān) 聯(lián)的多態(tài)性的玉米品系來進(jìn)行玉米育種的方法,其中所述多態(tài)性與本 發(fā)明的多態(tài)性基因座相連鎖。
本發(fā)明還提供了通過鑒定表征玉米植物的一種或多種不同的表型 性狀的組將玉米植物中的表型性狀與基因型相關(guān)聯(lián)的方法。測定來自
至少兩種具有等位基因DNA的玉米植物的組織中的DM或mRM,以鑒 定不同多態(tài)性的組的存在或缺失。鑒定多態(tài)性的組和表型性狀的組之 間的關(guān)聯(lián),其中多態(tài)性的組包括至少一個,更優(yōu)選至少10個,與本發(fā) 明的多態(tài)性基因座連鎖的多態(tài)性,例如,與已定位的多態(tài)性(例如, 如表3中所鑒定的)相連鎖的至少IO個多態(tài)性。在更優(yōu)選的方面中, 在玉米植物的分離群體中(所述的玉米植物具有染色體基因座中的等 位基因DNA)性狀與基因型相關(guān)聯(lián),所述基因型對目的性狀賦予表型 影響,并且其中多態(tài)性定位于此類基因座中,并且其中多態(tài)性之間以 及多態(tài)性和性狀之間的關(guān)聯(lián)程度使得能夠確定多態(tài)性和性狀基因座的 線性次序。在此類方法中,至少5個多態(tài)性與基因座連鎖,允許所述 基因座的不均衡定位。
本發(fā)明還提供了通過鑒定至少 一種多態(tài)性與目的性狀的連鎖,其 中所述多態(tài)性與本發(fā)明的多態(tài)性基因座連鎖,鑒定包含所述基因座的 基因組克隆和鑒定與所述基因座連鎖的基因而鑒定與目的性狀相關(guān)聯(lián) 的基因的方法。在本發(fā)明的一個優(yōu)選的方面,此類關(guān)聯(lián)用于標(biāo)記輔助 育種和/或標(biāo)記輔助選擇。
本發(fā)明進(jìn)一步提供了用于改進(jìn)雜交玉米中的雜種優(yōu)勢的方法。在 此類方法中,開發(fā)大量與本發(fā)明的多態(tài)性基因座連鎖的多態(tài)性和兩個 以上玉米近交系中的性狀之間的關(guān)聯(lián)。選擇具有互補的雜種優(yōu)勢組的 兩種此類近交系用于育種,預(yù)測所述互補的雜種優(yōu)勢組提高雜種優(yōu)勢。
本發(fā)明還提供了通過查詢(interrogating)玉米遺傳圖譜中小于
ii10cM的平均密度上的SNP的集合篩選性狀的方法。與本發(fā)明的多態(tài)性 基因座連鎖的SNP的存在或缺失與此類性狀相關(guān)聯(lián)。在本發(fā)明的另一 個方面,所述多態(tài)性用于鑒定單倍型,所述單倍型是由連鎖不平衡的 至少兩種多態(tài)性表征的基因組DNA的等位基因的片段并且其中所述多 態(tài)性在長度不大于IO厘摩的基因組窗口 (window)中,例如,不大于 8厘摩或者更小的窗口,例如在比如說1至5厘摩范圍內(nèi)。本發(fā)明尤 其有用的方法使用此類多態(tài)性,以鑒定各玉米染色體中 一 系列相鄰的 基因組窗口中的大量單倍型,例如,提供用此類窗口的基本完全的基 因組覆蓋。用足夠大量的和不同的玉米育種群體,能夠在各個窗口中 鑒定大量的單倍型,因此提供能夠與一種或多種性狀相關(guān)聯(lián)的等位基 因DNA以允許聚焦(focused)的標(biāo)記輔助育種。因此,本發(fā)明的玉米
分析的一個方面進(jìn)一步包括針對所述玉米植物群體表征一種或多種性 狀以及將所述性狀與所述等位基因的SNP或Indel多態(tài)性進(jìn)行關(guān)聯(lián)的 步驟,優(yōu)選地,進(jìn)行組織(organized to)以定義單倍型。此類性狀 包括產(chǎn)量,倒伏,成熟期,植林高度和疾病抗性,例如,對玉米孢嚢 線蟲,玉米銹病,褐色莖腐病,摔死癥(sudden death syndrome )等 等的抗性。為了促進(jìn)育種,計算各個性狀的值或性狀組合的值是有用 的,例如,多重性狀指數(shù)(multiple trait index)。分配給多重性 狀指數(shù)中的不同性狀的權(quán)重可以根據(jù)育種的目標(biāo)而改變。例如,如果 產(chǎn)量是關(guān)鍵目標(biāo),產(chǎn)量值的權(quán)重可以為50至80%,成熟期,倒伏,植 林高度或疾病抗性在多重性狀指數(shù)中的權(quán)重可以為較低的百分比。
本發(fā)明的另一個方面提供了基因分型的方法,其進(jìn)一步包括針對 至少兩種玉米品系鑒定一種或多種表型性狀和確定所述性狀和多態(tài)性 之間的關(guān)聯(lián)。
本發(fā)明的另一個方面關(guān)注于經(jīng)選擇的多態(tài)性玉米DNA序列組在玉 米育種中的用途,例如,通過基于其位于多態(tài)性基因座的基因型選擇 玉米品系,所述玉米品系具有經(jīng)選擇的多態(tài)性玉米DNA序列的組中的序列。
本發(fā)明的另一個方面提供對玉米植物進(jìn)行育種的方法,包括步驟
12(a) 針對至少兩種玉米植物的育種群體,鑒定至少兩個高達(dá) IO厘摩的基因組窗口中的至少兩個單倍型的性狀值;
(b) 在所述的育種群體中對兩種玉米植物進(jìn)行育種,以產(chǎn)生后 代種子群體;
(c) 鑒定所述后代種子中的各個所述窗口中的多態(tài)性等位基 因的狀態(tài),以確定所述單倍型的存在;和
(d ) 選擇具有針對所述后代種子中的確定的單倍型而鑒定的 較高性狀值的后代種子。
在育種方法的方面中,針對基本上覆蓋各個染色體全部的各個相 鄰的基因組窗口中的至少兩個單倍型鑒定性狀值。在該方法的另一個 有用的方面,針對各個染色體中高達(dá)IO厘摩的基因組窗口中的單倍型
就較高的產(chǎn)量性狀值選擇后代種子。在本發(fā)明的另一方面,育種方法 關(guān)注于增加的產(chǎn)量,其中性狀值針對產(chǎn)量性狀,其中針對各個窗口中 的單倍型對性狀值進(jìn)行分級,并且其中選擇這樣的后代種子,其在窗 口中的產(chǎn)量性狀值高于所述窗口中的平均產(chǎn)量性狀值。在育種方法的 某些方面中,用表1中鑒定的多態(tài)性定義單倍型或單倍型定義為在DM 序列的組中,所述DNA序列的組包括SEQ IDN0: 1至SEQ ID NO: 10373 的所有DNA序列,或定義為與這些多態(tài)性之一連鎖不平衡。
由標(biāo)記鑒定表征的本發(fā)明的方法可以一使用寡核苷酸引物和寡核苷 酸檢測子(detector )進(jìn)行。因此,本發(fā)明的另一個方面關(guān)注于此類
寡核苷酸,例如與標(biāo)記起作用的寡核苷酸組。更具體地,本發(fā)明提供 分離的核酸分子對,其包含用于擴增玉米DNA以鑒定DNA中多態(tài)性的 存在的寡核苷酸引物,例如包含至少12個連續(xù)核苷酸的寡核苷酸,其 與多態(tài)性玉米DNA基因座的對應(yīng)鏈中相同核苷酸數(shù)量的DM片段末端 至少90%同一,所述多態(tài)性玉米DNA基因座具有與本文中公開的多態(tài) 性玉米DNA序列的子集中的序列(或其互補物)至少90%同一的序列。 更優(yōu)選的,此類寡核苷酸對包含至少15個連續(xù)的核苷酸,或更多,例 如,至少20個連續(xù)的核苷酸。更具體地,當(dāng)打算將與SNP的雜交用于 鑒定玉米DM中的多態(tài)性的標(biāo)記測定時,該組將包含四個寡核苷酸,例如, 一對分離的核酸分子,其用于擴增可以與多態(tài)性側(cè)翼的DNA雜 交的DM,以及一對檢測子核酸分子,其用于檢測擴增的DM的片段 中單核苷酸多態(tài)性中的各個核普酸。在本發(fā)明的優(yōu)選的方面,此類檢 測子核酸分子包含至少12個核苷酸堿基和可檢測的標(biāo)記,或至少15 個核苷酸堿基,并且檢測子核酸分子的序列除所述核苷酸多態(tài)性(例 如SNP或Indel)外與含有多態(tài)性的多態(tài)性玉米DNA基因座的片段的 任一鏈中的相同連續(xù)核苷酸數(shù)量的序列同一且至少95%同一。
附圖簡介
圖1是玉米的遺傳圖譜,其展示本發(fā)明的已定位的多態(tài)性的密度。
圖2是是基因分型測定的對偶圖(allelograra)圖示結(jié)果。 定義本文中使用的一些術(shù)語定義如下
"等位基因"表示位于特定基因座的可選擇的序列;等位基因的 長度可以小到1個核苷酸堿基,但是通常更大。等位基因序列可以是 氨基酸序列或核酸序列。"基因座"是一種短序列,其通常是獨特的 并且通常通過參照點在基因組中的特定位點發(fā)現(xiàn),例如短DM序列, 其是基因,或基因的部分或基因間區(qū)域。本發(fā)明的基因座可以是基因 組中特定位點外的獨特的PCR產(chǎn)物。本發(fā)明的基因座包含一個或多個 多態(tài)性,即在一些個體中存在的可選的等位基因。
"基因型"指位于個體生物體中的一個或多個基因座的等位基因 組成的詳述。就二倍體生物來說,在各個基因座有兩個等位基因;當(dāng) 等位基因相同時,二倍體基因型被稱為純合的,而當(dāng)?shù)任换虿煌瑫r, 被稱為雜合的。"單倍型"表示基因組DNA的等位基因片段,其傾向 于作為一個單位進(jìn)行遺傳;此類單倍型可以由兩種或多種多態(tài)性表征 并且可以由不大于IO厘摩的大小定義,例如不大于8厘摩。隨著更高 的精度,來自更高的密度的多態(tài)性,單倍型可以由l-5厘摩范圍內(nèi)的
14基因組窗口表征。
"共有序列"指構(gòu)建的DNA序列,其鑒定位于基因座的等位基因 中的SNP和Indel多態(tài)性。共有序列可以基于位于基因座的DNA的任 一條鏈并且表述基因座中各個SNP的任一的核苷酸堿基和基因座中所 有Indel的核苷酸堿基。因此,盡管共有序列可能不是實際的DNA序 列的拷貝,共有序列用于精確設(shè)計針對基因座中的實際的多態(tài)性的引 物和探針。
"表型"指細(xì)胞或生物體的可檢測的特征,所述特征是基因表達(dá) 的表現(xiàn)。
"標(biāo)記"指多態(tài)性序列。"多態(tài)性"是序列中個體間的變異,尤 其在DNA序列中。有用的多態(tài)性包括單核苷酸多態(tài)性(SNPs) , DNA 序列中的插入或缺失(Indel)和DM序列的簡單序列重復(fù)(SSRs)。
"標(biāo)記測定"指通過使用特定方法檢測位于特定基因座的多態(tài)性 的方法,例如表型分型(例如種子顏色,花的顏色,或其他直觀地可 檢測的性狀),限制性片段長度多態(tài)性(RFLP),單堿基延伸,電泳, 序列比對,等位基因特異性寡核苷酸雜交(ASO) , RAPID等。優(yōu)選的 標(biāo)記測定包括如美國專利6,013,431中公開的單堿基延伸和如美國專 利5, 538, 848中公開的等位基因分型,其中核酸內(nèi)切酶活性釋放來自 雜交探針的報告染料,兩者公開的內(nèi)容均通過引用并入本文。
"連鎖"涉及雜交中產(chǎn)生配子的類型的相對頻率。例如,如果基 因座A具有基因"A"或"a"而基因座B具有基因"B"或"b,,,并 且具有AABB的親本I和具有aabb的親本B之間的雜交產(chǎn)生四種可能 的配子,其中基因分離為AB、 Ab、 aB和ab??掌谕?null expectation)為獨立均等地分離到四種可能的基因型中的每一種,即 沒有連鎖,配子的1/4將是每一種基因型。配子分離為不同于l/4的 基因型歸因于連鎖。
"連鎖不平衡"在一代的許多個體的群體中配子類型的相對頻率 的背景下進(jìn)行定義。如果等位基因A的頻率是p, a的頻率是p, , B 的頻率是q而b的頻率是q,,則基因型AB預(yù)期的頻率(沒有連鎖不
15平衡)是PQ, Ab是pq, , aB是p, q,而ab是p, q,。預(yù)期頻率的任何偏差都叫做連鎖不平衡。當(dāng)在連鎖不平衡中時兩個基因座稱為"基因連鎖"。
"數(shù)量性狀基因座(QTL)"指這樣的基因座,其在一定程度上數(shù)字化地控制其代表的性狀,所述性狀通常連續(xù)分布。
本發(fā)明的核酸分子或其片段在某些情況下能夠與其他核酸分子雜交。如本文所用的,如果兩種分子能夠形成反平行,雙鏈核酸結(jié)構(gòu),這兩種核酸分子稱為能夠相互雜交。 一種核酸分子稱為另一種核酸分子的"互補物,,,如果它們表現(xiàn)為"完全互補,,,即一條序列中的每個核苷酸與另 一條序列中的其堿基配對伴倡核苷酸互補。兩種分子稱為"最低限度互補",如果它們能夠以足夠的穩(wěn)定性相互雜交,以在至少常規(guī)的"低嚴(yán)緊條件"下允許它們保持相互退火。類似地,分子稱為"互補",如果它們能夠以足夠的穩(wěn)定性相互雜交,以在常規(guī)的"高嚴(yán)緊"條件下允許它們保持互相退火。與其它核酸分子雜交的核酸分子,例如,至少在低嚴(yán)緊條件下,被稱為其他核酸分子的"可雜交同源物(hybridizable cognate )"。常規(guī)的嚴(yán)緊條件由Sambrook等人,Molecular Cloning. A Laboratory Manual, 2nd Ed. , ColdSpring Harbor Press, Cold Spring Harbor, New York (1989) 和Haymes等人,Nucleic Acid Hybridization, A Practical Approach,IRL Press, Washington, DC (1985)描述,其分別通過引用并入本文。因此,允許偏離完全互補,只要此類偏離不完全排除分子形成雙鏈結(jié)構(gòu)的能力。因此,為了使核酸分子用作引物或探針,其只要在序列中足夠互補從在特定的溶液和所用的鹽濃度下能夠形成穩(wěn)定的雙鏈結(jié)構(gòu)。
促進(jìn)DNA雜交的合適的嚴(yán)緊條件,例如,6. Qx氯化鈉/檸檬酸鈉(SSC),在約45。C,然后在50。C用2. OxSSC沖洗,是本領(lǐng)域技術(shù)人員已知的或者可以在Current Protocols inMolecular Biology, JohnWiley & Sons, N. Y. (1989), 6. 3. 1-6. 3. 6 (通過引用并入本文)中找到。例如,沖洗步驟中鹽濃度可以從50。C約2. OxSSC的低嚴(yán)緊性至50。C約0. 2xSSC的高嚴(yán)緊性中選擇。另外,沖洗步驟中的溫度可以從室溫,約22。C的低嚴(yán)緊條件增加到約65。C的高嚴(yán)緊條件。溫度和鹽都可以改變,或者溫度或鹽濃度可以保持恒定而另一個量發(fā)生改變。
在優(yōu)選的實施方案中,本發(fā)明的核酸分子可以特異性與具有如SEQ ID NO: 1至SEQ ID NO: 10373中列出的核酸序列的玉米DNA片段的一條鏈雜交,在中等嚴(yán)緊條件下,例如,約2. OxSSC和約65°C,更優(yōu)選在高嚴(yán)緊條件下,例如0. 2xSSC和約65°C。
本文所用的"序列同一性,,涉及兩個最佳比對的多核苷酸或肽序列貫穿組分(例如核苷酸或氨基酸)的比對的窗口不變的程度。對測試序列和參照序列的比對的片段來說,"同一性分?jǐn)?shù)"是由兩個比對的序列共有的同一組分的數(shù)目除以參照序列片段中組分的總數(shù)目,即完整的參照序列或較小的定義的參照序列的部分。"百分比同一性"是同一性分?jǐn)?shù)的100倍。
優(yōu)選的實施方案的詳述
A.核酸分子一基因座,引物和探針
本發(fā)明的玉米基因座包含DM序列,所述DM序列包含至少20個連續(xù)的核苷酸并且包括或與表1中鑒定的一個或多個多態(tài)性相鄰。此類玉米基因座具有核酸序列,所述核酸序列與玉米DNA片段的任一條鏈中的相同核苷酸數(shù)量的序列具有至少90%序列同一性,更優(yōu)選地至少95%,或?qū)σ恍┑任换騺碚f更優(yōu)選地至少98%,以及在很多情況下至少99°/。序列同一性,所述玉米DNA片段包括或與多態(tài)性相鄰。可以在由SEQ ID NO: 1至SEQ ID NO: 10373組成的組中的序列中發(fā)現(xiàn)此類玉米DM片段的一條鏈的核苷酸序列。借助多態(tài)性的特別的本質(zhì),應(yīng)理解,對至少一些等位基因來說,本身與多態(tài)性沒有同一性。因此,對多態(tài)性序列以外的序列,可以確定序列同一性。更具體地,各個基因座中的多態(tài)性在表l中進(jìn)行鑒定。
對許多基因分型應(yīng)用來說,使用來自 一個以上基因座的多態(tài)性作為標(biāo)記是有用的。因此,本發(fā)明的一個方面提供不同基因座的集合。
17在此類集合中基因座的數(shù)目可以改變,但將是限定的數(shù)量,例如,少
至2或5或10或25個基因座或更多,例如高達(dá)40或75或100或更多個基因座。
本發(fā)明的另一個方面提供核酸分子,其能夠與本發(fā)明的多態(tài)性玉米基因座雜交。在本發(fā)明的一些實施方案中(例如,其提供PCR引物),此類分子包含至少15個核苷酸堿基。用作引物的分子能夠在高嚴(yán)緊條件下與本發(fā)明的多態(tài)性基因座中的DM片段的一條鏈雜交。成對提供用于擴增DNA的引物,即正向引物和反向引物。 一條引物可以與基因座中的DNA的一條鏈互補并且另一條引物可以與基因座中的DNA的另一條鏈互補,即引物的序列與一條鏈中的相同核苷酸數(shù)量的序列優(yōu)選至少90°/。,更優(yōu)選至少95%同一。應(yīng)理解,此類引物可以與遠(yuǎn)離多態(tài)性的基因座中的序列雜交,例如,離多態(tài)性至少5、 10、 20、 50個或高達(dá)約IOO個的核苷酸堿基。本發(fā)明的引物設(shè)計依賴于本領(lǐng)域已知的因素,例如避免或重復(fù)序列。
本發(fā)明的核酸分子的另一個方面是用于多態(tài)性測定的雜交探針。本發(fā)明的一個方面中,此類探針是包含至少12個核苷酸堿基和可檢測的標(biāo)記的寡核苷酸。此類分子的目的是用于雜交,例如在高嚴(yán)緊條件下,與包括或與在多態(tài)性基因座的擴增部分中的目的多態(tài)性相鄰的核苷酸堿基片段中的DNA的一條鏈。此類寡核苷酸優(yōu)選與多態(tài)性基因座中的玉米DNA的一條鏈中的相同核苷酸數(shù)量的片段的序列至少90%,更優(yōu)選至少95%同一。本發(fā)明的優(yōu)選的方面中,雜交探針進(jìn)一步包含熒光標(biāo)記和淬滅子,例如用于使用雜交探針的測定類型(已知如Taqman鄰'J定,可從AB Biosystems獲得)。
對于其中設(shè)計分子用于雜交至多態(tài)性鄰近且通過單堿基延伸(例如,經(jīng)標(biāo)記的雙脫氧核苷酸)檢測的測定來說,此類分子可以在序列中包含至少15個,更優(yōu)選至少16或17個核苷酸堿基,所述序列與多態(tài)性玉米DNA片段的任一條鏈中的相同連續(xù)核苷酸數(shù)量的序列至少90%,優(yōu)選至少95%同一。用于單堿基延伸測定的寡核苷酸可獲自O(shè)rchid Bioystems。此類引物和探針分子通常以用于基因分型測定中的兩條引物和一種或多種探針的組提供。此外,經(jīng)常希望針對大量多態(tài)性進(jìn)行大量基因分型測定。因此,本發(fā)明還提供核酸分子集合,例如,以表征大量多態(tài)性的組提供。
B.識別多態(tài)性
基因組中的多態(tài)性可以通過比較來自不同林系的cDNA序列進(jìn)行確定。雖然通過比較cDNA序列檢測多態(tài)性相對更方便,但cDNA序列的評價沒有提供關(guān)于相應(yīng)的基因組DNA中的內(nèi)含子位置的信息。此外,非編碼序列中的多態(tài)性不能從cDNA鑒定。這是一個缺點,例如,當(dāng)使用cDM來源生的多態(tài)性作為標(biāo)記用于基因組DNA的基因分型時??梢栽O(shè)計更有效的基因分型測定,如果多態(tài)性的范圍包括存在于非編碼獨特序列中的那些多態(tài)性。
對于鑒定和檢測多態(tài)性來說,基因組DNA序列比cDM更有用?;蚪M中的多態(tài)性可以通過比較來自不同林系的基因組DNA序列而確定。然而,較高級的真核細(xì)胞的基因組DNA通常含有大量重復(fù)序列和轉(zhuǎn)化子?;蚪MDNA可以是更有效的序列,如果通過減去或除去重復(fù)序列富集(enrich)編碼/獨特部分。
很多策略可以用于富集編碼/獨特序列。這些例子包括使用對胞嗜啶曱基化敏感的酶,使用切割重復(fù)序列的McrBC核酸內(nèi)切酶,印記(printing)基因組文庫的微陣列,所述微陣列接著與重復(fù)序列探針雜交。
a. 曱基化胞嘧啶敏感的酶
較高級的真核細(xì)胞的DNA傾向于非常高度曱基化,然而其不是均勻甲基化。事實上,重復(fù)序列比編碼序列更高度甲基化。因此,編碼/獨特序列可以通過利用曱基化模式中的這一區(qū)別來進(jìn)行富集。參見美國專利6, 017, 704,定位和評估CG島中的DNA甲基化模式的方法。一些限制性核酸內(nèi)切酶對其識別位點中甲基化胞嗜啶殘基的存在敏
19感。此類甲基化敏感的限制性核酸內(nèi)切酶不能在其識別位點切割,如
果5'-CG-3'重疊或5'-CNG-3'重疊中的胞嘧啶殘基被甲基化。甲基化 敏感的限制性核酸內(nèi)切酶包括4堿基切割酶(cutter): Aci I, Hha I, HinPl I, HpaII和Msp I, 6堿基切割酶Apa I, Age I, Bsr F I, BssH II, Eag I, Eae I, MspM II, Nar I, Pst I, Pvu I, Sac II, Sma I, Stu I和Xho I以及8堿基切割酶Not I。例如,當(dāng)C殘基被甲基 化,Pst I在CTGCAG位點進(jìn)行的DNA切割被抑制。為了富集編碼/獨 特序列,玉米文庫可以從用Pst I (或其他甲基化敏感的酶)消化的 并通過瓊脂糖凝膠電泳大小分離的基因組DNA構(gòu)建。高度甲基化的基 因組區(qū)域(即,具有大量重復(fù)序列的區(qū)域)具有更多的被甲基化的Pst I位點。因此,在Pst I消化期間重復(fù)DNA中的大部分Pst I位點不 能被切割,并且重復(fù)序列傾向于主要由高分子量,未切割的MA組成。 反之,未被高度甲基化的基因組區(qū)域(即包含大量編碼/獨特序列的區(qū) 域)包含大量未甲基化的Pst I位點,在消化期間這些位點被切割, 產(chǎn)生相對較小的片段。當(dāng)經(jīng)消化的DNA經(jīng)過瓊脂糖電泳時,來自高度 甲基化的,非編碼DNA區(qū)的相對較大的片段與來源于編碼/獨特序列的 相對較小的片段分離。編碼區(qū)-富集的DNA片段(通常在500 - 3000bp 之間)可以從凝膠中切除,純化并連接入經(jīng)Pst I消化的載體中,例 如pUC18。連接產(chǎn)物通過電穿孔轉(zhuǎn)化到大量合適的細(xì)菌宿主中,例如 DH10B,以產(chǎn)生對編碼/獨特序列富集的克隆文庫。可以對單獨的克隆 測序以提供插入的編碼區(qū)MA序列。
為了減少任意特定文庫的序列復(fù)雜度,500至10000bp范圍內(nèi)的 DNA可以進(jìn)一步通過從凝膠遞增地切除片段進(jìn)行大小分離。有用的大 小分離的片段范圍包括500-600 bp, 600-700 bp, 700-800 bp, 800-900 bp, 900—1100 bp, 1100-1500 bp, 1500-2000 bp, 2000-2500 bp和2500-3000bp。 一系列大小分離的約化表示文庫通過將來自各個 大小級分的純化的DNA分別連接入載體而構(gòu)建。對來自各個文庫的克 隆的小量樣品(例如約400個克隆)進(jìn)行測序以確定各個特定文庫中 存在的重復(fù)序列的分?jǐn)?shù)。從多種不同玉米品系制備的約化表示文庫的比較表明許多級分含有少于10%重復(fù)序列和一些級分含有多于20% 重復(fù)序列。優(yōu)選的約化表示文庫包含少于20%重復(fù)序列,更優(yōu)選少于 15%重復(fù)序列和更優(yōu)選少于10%重復(fù)序列。通過確定遍及所有大小分 離的約化表示文庫的重復(fù)序列的分?jǐn)?shù),可以選擇具有最小重復(fù)序列分 數(shù)的文庫用于深度測序(通常10000-20000個克隆)。因為獲得序列 的目的是為了檢測多態(tài)性,對兩種玉米品系的代表相同大小級分的等 價文庫測序。對多態(tài)性檢測而言,使用約化表示文庫的另一個優(yōu)點是 其增加了從兩種玉米品系回收等價序列的可能性。只有等價序列可獲 自兩種品系,多態(tài)性才能被檢測。
b. McrBC核酸內(nèi)切酶
可選擇的用于富集編碼區(qū)DNA序列的方法使用McrBC限制性核酸 內(nèi)切酶(endonuclease restriction )。作為對來自謹(jǐn)菌體/病毒的侵 入的外源DNA的防御,大腸桿菌包含核酸內(nèi)切酶,例如,McrBC核酸 內(nèi)切酶,其切割含有甲基化胞嘧啶的DNA??梢允褂眠@一特征富集非 高度甲基化的基因組區(qū)域的DM,例如,假定的編碼區(qū)DNA。約化表示 文庫可以用通過物理剪切或用限制性酶消化切割的基因組DM片段構(gòu) 建。將DNA片段轉(zhuǎn)化到大腸桿菌宿主中,所述大腸桿菌宿主包含McrBC 核酸內(nèi)切酶,例如,大腸桿菌菌林JM107或DH5a。當(dāng)用包含甲基化DNA 區(qū)域的DNA片段轉(zhuǎn)化細(xì)菌宿主時,McrBC核酸內(nèi)切酶將切割插入的DM 并且質(zhì)粒不增殖。當(dāng)用未甲基化的DNA片段轉(zhuǎn)化細(xì)菌宿主時,質(zhì)粒增 殖,并且菌落將在瓊脂平板上生長使得克隆可被測序。對來自用這種 方式產(chǎn)生的文庫的克隆的小量樣品取樣,并且確定重復(fù)序列的分?jǐn)?shù)。 McrBC核酸內(nèi)切酶還可以與曱基化胞嘧啶敏感的核酸內(nèi)切酶一起使 用,以進(jìn)一步減少文庫中不適于測序的重復(fù)序列的分?jǐn)?shù),例如,包含 15%以上的重復(fù)序列的序列。
c. 微陣列約化表示文庫
另 一種用于富集編碼/獨特序列的方法是構(gòu)建約化表示文庫(使用甲基化敏感或非-甲基化敏感的酶),在尼龍膜上印記文庫的微陣列, 并且與由已知存在于文庫中的重復(fù)元件制備的探針雜交。鑒定重復(fù)序 列元件,并且通過僅挑選陰性克隆重排列文庫。上述過程通過隨機挑
選來自約化表示文庫的克隆到384孔平板中并且培養(yǎng)它們來進(jìn)行。微 陣列可以通過以確定模式在支持物上(例如玻璃支持物或尼龍膜)印 記克隆DM制備,所述印記克隆DM來自384孔平板的集合。包含數(shù) 千個不同克隆(例如高達(dá)約25000個克隆或更多)的微陣列的制備是 本領(lǐng)域公知的。參見例如美國專利5, 807, 522,用于制備以高密度點 印的多核苷酸的微陣列的方法??梢詫碜约s化表示文庫的克隆的小 量樣品(如約400個克隆)進(jìn)行測序以鑒定重復(fù)序列元件?;謴?fù) (retrieve)包含重復(fù)序列的克隆,并且將克隆用于制備放射性探針, 所述探針在尼龍陣列上進(jìn)行雜交。放射性同位素標(biāo)記元素包括32P, 33P, 35S, 1251等等,尤其優(yōu)選"P。通過檢測放射性分析雜交的陣列,例如, 使用Fuji Phosphoimager Imaging Screen。在合適的曝光時間后, 陣列影像被讀取為數(shù)字文件,其代表來自各個陣列元件的雜交強度, 所述雜交強度與標(biāo)記的重復(fù)序列的數(shù)量成比例。該放射性影像鑒定陣 列上所有對應(yīng)于重復(fù)序列克隆的克隆,還鑒定384孔平板和各個重復(fù) 序列克隆的孔的位置。利用這些信息,可以從原始平板挑選出所有的 非重復(fù)序列克隆并且將其重新置于一組新的平板上,這些平板不包含 重復(fù)序列克隆。該方法可以用于將約化表示文庫中的重復(fù)序列分?jǐn)?shù)從 約25%降低到約1-2%。
C.檢測多態(tài)性
DNA序列中的多態(tài)性可以通過多種本領(lǐng)域公知的有效方法檢測, 包括在美國專利5,468,613和5,217,863; 5,210,015; 5, 876,930; 6, 030, 787 6,004, 744; 6,013,431; 5, 595, 890; 5, 762, 876; 5,945,283; 5, 468, 613; 6,090, 558; 5, 800, 944和5, 616, 464中公開 的方法,所有的專利通過引用并入本文。例如,DNA序列中的多態(tài)性 可以通過與等位基因-特異性寡核苷酸(ASO)探針雜交來檢測,如在
22美國專利5, 468,613和5, 217, 863中所公開。設(shè)計ASO探針的核苷酸 序列以形成完全匹配的雜交或在可變核苷酸殘基的位點包含錯配堿基 對。匹配的雜交和錯配的雜交之間的區(qū)別基于在雜交或沖洗過程中使 用的條件下雜交的熱穩(wěn)定性上的區(qū)別,通過變性梯度電泳或在錯配位 點的化學(xué)切割分析雜交穩(wěn)定性上的區(qū)別。
美國專利5, 468, 613公開了等位基因特異性寡核苷酸雜交,其中 在核酸序列中的單個或多個核苷酸的變異可以通過如下過程在核酸中 檢測擴增含有核苷酸變異的序列,將其點印在膜上并用標(biāo)記的序列-特異性寡核苷酸探針處理。
DNA核苷酸序列重復(fù)(例如微衛(wèi)星,簡單序列重復(fù)(SSRs)和短 串聯(lián)重復(fù)(STRs))中的長度變異,可以通過如美國專利6, 090,558 中公開的質(zhì)傳法檢測。使用質(zhì)譜法的優(yōu)點包括分析速度(每個樣品數(shù) 秒)和直接質(zhì)量測量準(zhǔn)確度的顯著增加。
靶核酸序列還可以通過如美國專利5, 800, 944中公開的探針連接 方法檢測,其中擴增目的序列并且與探針雜交,然后進(jìn)行連接以檢測 探針的標(biāo)記的部分。
靶核酸序列還可以通過如美國專利5, 616, 464中公開的探針連接 方法檢測,該方法使用至少 一對具有與靼核酸序列的相鄰部分同源的 序列和具有側(cè)鏈的探針,所述側(cè)鏈在所述探針與所述靶核酸序列配對 后非共價性結(jié)合以形成莖(stem)。至少一條側(cè)鏈具有光敏基團(tuán),其 可以與莖的另 一條側(cè)鏈成員形成共價交聯(lián)。
a. 引物堿基延伸測定
優(yōu)選的用于檢測SNP和Indel的方法是標(biāo)記堿基延伸方法,如在 美國專利6, 004, 744; 6,013,431 ; 5, 595:890; 5, 762, 876; 和 5, 945, 283中所公開。此類方法基于引物延伸和可檢測的核苷三磷酸 的摻入。引物設(shè)計為退火到與可變核苷酸緊鄰的序列,在少至一個標(biāo) 記的核苷三磷酸摻入后,可以檢測可變核苷酸。該方法使用三條合成 的寡核苷酸。兩條寡核苷酸用作PCR引物并且與玉米基因組DNA基因
23座的序列互補,所述序列位于包含待測定的多態(tài)性的區(qū)域的側(cè)翼。將
玉米基因組DNA用作模板,在PCR中使用引物寡核苷酸以產(chǎn)生足夠拷 貝的包含多態(tài)性的基因座區(qū)域,以區(qū)別等位基因。擴增包含多態(tài)性的 玉米基因組區(qū)域后,PCR產(chǎn)物與第三條寡核苷酸(稱為延伸引物)混 合,所述第三條寡核苷酸設(shè)計為在DM聚合酶和兩種差別標(biāo)記的雙脫 氧核苷酸三磷酸存在下與擴增的緊鄰多態(tài)性的DNA雜交。如果多態(tài)性 存在于模板上,在單堿基鏈延伸中,經(jīng)標(biāo)記的雙脫氧核苷酸三磷酸之 一可以加入到引物。通過檢測兩種差別標(biāo)記中哪一種加入到延伸引物 中,推斷等位基因的存在。純合樣品使得兩種經(jīng)標(biāo)記的堿基中只有一 種被摻入并且因此兩種標(biāo)記中只有一種被檢測到。雜合樣品存在兩種 等位基因,因此指示兩種標(biāo)記的摻入(摻入到延伸引物的不同分子) 并且因此將檢測到兩種標(biāo)記。
為了設(shè)計用于通過單堿基延伸檢測玉米多態(tài)性的引物,基因座序 列開始是隱藏的,以防止針對與已知玉米重復(fù)元件(例如轉(zhuǎn)座子)匹 配的或具有非常低的序列復(fù)雜度(二或三-核苷酸重復(fù)序列)的位點設(shè) 計三條引物中任一條。針對此類重復(fù)元件設(shè)計的引物導(dǎo)致由多基因座 的擴增或延伸引物針對多位點的退火引起的低特異性的測定。
PCR引物優(yōu)選地設(shè)計為(a)具有最佳的退火溫度,就PCR而言, 在55-60。C范圍內(nèi),(b)具有18-25個堿基的長度,和(c)產(chǎn)生大 小在75-200個堿基對范圍的具有待測定的多態(tài)性的產(chǎn)物,所述待測定 的多態(tài)性離各個引物的3,末端至少25個堿基。必須選擇延伸引物以 含有最小的引物自我互補或引物間互補,否則PCR反應(yīng)的效率和/或特 異性將降低。
延伸引物設(shè)計為退火到緊鄰多態(tài)性,以便退火的延伸引物的3, 末端緊鄰多態(tài)性位點。延伸引物可以位于多態(tài)性的5,側(cè)或3,側(cè);然 而,如果設(shè)計為位于3,側(cè),則延伸引物的序列必須與緊鄰多態(tài)性的 序列的反向互補序列匹配。延伸引物必須不包含自我互補序列,自我 互補序列可以自我退火,或標(biāo)記的ddNTPs的摻入可以由延伸引物的自 我啟動(priming)引起,使得多態(tài)性指導(dǎo)的摻入的結(jié)果不明顯。如果
24緊鄰多態(tài)性位點的序列的性質(zhì)使得不可能設(shè)計完全不自我互補的延伸 引物,則可以通過用脫堿基位點取代延伸引物的一個或兩個堿基,限
制自我退火的程度,只要脫堿基位點沒有插入到最3,的三個位點。
通過多態(tài)性的性質(zhì)確定選擇用于反應(yīng)中的包含物的標(biāo)記的 ddNTP,無論延伸引物是否位于與多態(tài)性的第一個堿基匹配的位點,如 果延伸引物位于多態(tài)性的5,或3,。如果延伸引物位于多態(tài)性的5,, 則ddNTP是多態(tài)性本身的核苷酸。例如,在AG多態(tài)性情況下,ddNTP 將是ddATP-標(biāo)記(1 )和ddGTP-標(biāo)記(2 )。如果延伸引物位于多態(tài)性 位點的3,,則ddNTP是多態(tài)性中包含的堿基的互補堿基;在這個例 子中,是ddTTP-標(biāo)記(1 )和ddCTP-標(biāo)記(2 )。標(biāo)記可以選自多種化 學(xué)部分,包括親和或免疫學(xué)標(biāo)記,熒光染料和質(zhì)量標(biāo)簽。該方法的最 普遍的實施方案中,使用親和和免疫學(xué)標(biāo)記,然后使用適當(dāng)?shù)臋z測試 劑。在這個例子中,可以使用ddATP-FITC和ddGTP-生物素,然后和 偶聯(lián)到辣根過氧化物酶的抗-FITC-抗體(HRP-抗-FITC )和偶聯(lián)到堿性 磷酸酶的鏈霉親和素(AP-鏈霉親和素) 一起溫育。
b. 標(biāo)記的探針降解測定
另一種用于檢測多態(tài)性的優(yōu)選的方法中,SNP和Indel可以通過 在美國專利5'210,015; 5, 876, 930和6, 030, 787中公開的方法檢 測,其中寡核苷酸探針具有共價連接到探針的5,和3,末端的5,焚 光報告染料和3,淬滅染料。當(dāng)探針完整時,報告染料與淬滅染料接 近抑制報告熒光,例如,通過Forster類型的能量轉(zhuǎn)移。PCR期間, 正向和反向引物與位于多態(tài)性側(cè)翼的靶DNA的特異序列雜交。雜交探 針與擴增的PCR產(chǎn)物內(nèi)的包含多態(tài)性的序列雜交。在后續(xù)的PCR循環(huán) 中,具有5, 一3,核酸外切酶活性的DNA聚合酶切割探針并且使報告 染料和淬滅染料分離,導(dǎo)致報告熒光增加。有用的測定可以獲自AB Biosystems如Taqman⑧測定,其在單一反應(yīng)中使用四種合成的寡核苷 酸,該反應(yīng)同時擴增玉米基因組DNA,辨別存在的等位基因,并直接 提供用于辨別和檢測的信號。四種寡核苷酸的兩種用作PCR引物并且
25產(chǎn)生包含待檢測的多態(tài)性的PCR產(chǎn)物。其他兩種寡核苷酸是等位基因 特異性熒光共振能量轉(zhuǎn)移(FRET)探針。FRET探針合并了緊密接近的 熒光基團(tuán)和淬滅分子,以便熒光基團(tuán)的熒光被淬滅。通過FRET寡核苷 酸的降解產(chǎn)生來自FRET探針的信號,以便熒光基團(tuán)從淬滅劑的附近釋 放,并且因此當(dāng)被合適的波長激發(fā)時能夠發(fā)光。在該測定中,使用兩 個具有不同熒光報告染料的FRET探針,其中獨特的染料結(jié)合到寡核苷 酸中,所述寡核苷酸可以以高特異性退火到兩個等位基因中的僅一個。 有用的報告染料包括6-羧基-4, 7, , -四氯熒光素(TET ) , ( VIC ) 和6-羧基熒光素亞磷酰胺(FAM )。有用的淬滅劑是6-羧基-N, N, N, , N' -四甲基羅丹明(TAMRA)。另外,化學(xué)封閉各個FRET探針的3,端,以 便它不能作為PCR引物。測定期間,玉米基因組DNA加入到包含兩種 PCR引物和兩種FRET探針的緩沖液中。還存在第三種熒光基團(tuán)用作參 比(passive reference),例如羅丹明X (R0X),以幫助之后的相 關(guān)熒光值的標(biāo)準(zhǔn)化(校正反應(yīng)組裝中的體積誤差)。開始基因組DM 擴增。在PCR的各個循環(huán)期間,F(xiàn)RET探針以等位基因特異方式退火到 模板DM分子。當(dāng)酶遇到退火的探針的5,末端時,退火的(但不是 非退火的)FRET探針被TAQ DNA聚合酶降解,因此從探針的淬滅劑附 近釋放熒光基團(tuán)。PCR反應(yīng)后,使用熒光確定法檢測兩種熒光劑中每 一種的熒光,和參比的熒光。兩種染料的每一種的熒光的標(biāo)準(zhǔn)化強度 與最初存在于樣品中的各個等位基因的量成比例,并且因此可以推斷 樣品的基因型。
為了設(shè)計用于測定的引物和探針,最初,基因座序列是隱藏的, 以防止針對與已知的玉米重復(fù)元件(例如,轉(zhuǎn)座子)匹配的位點或具 有非常低的序列復(fù)雜度(二-或三-核苷酸重復(fù)序列)的位點設(shè)計三條 引物中的任一條。針對此類重復(fù)元件設(shè)計探針將導(dǎo)致由多個基因座的 擴增或FRET探針針對多個位點的退火引起的低特異性的測定。
PCR引物設(shè)計為(a)具有大小在18-25個堿基范圍的長度和與多 態(tài)性基因座中的序列匹配,(b)具有57-60。C范圍的計算的熔解溫度, 例如,相應(yīng)于52-55。C的最佳的PCR退火溫度,(c)產(chǎn)生包括多態(tài)性
26位點并且具有大小在75-250個堿基對范圍的長度的產(chǎn)物。優(yōu)選PCR 引物定位于基因座,以便多態(tài)性位點離各個PCR引物的3,末端至少 一個堿基。PCR引物必須不包含大范圍的自我互補或引物間互補的區(qū) 域。
FRET探針設(shè)計成跨越多態(tài)性位點的序列,優(yōu)選多態(tài)性位于寡核苷 酸的最3,端的2/3。在優(yōu)選的實施方案中,F(xiàn)RET探針在其3,末端合 并化學(xué)部分,當(dāng)探針退火到模板DNA時,其結(jié)合到DNA小溝,因此, 增強探針-模板復(fù)合物的穩(wěn)定性。探針具有12-17個堿基范圍的長度, 并且具有3, MGB,具有比PCR引物的熔解溫度高5-7。C的計算的熔解 溫度。探針設(shè)計在美國專利5, 538, 848; 6, 084, 102和6, 127, 121中 公開。
D.多態(tài)性用于建立標(biāo)記/性狀關(guān)聯(lián)的用途
本發(fā)明的基因座中的多態(tài)性可以用于標(biāo)記/性狀關(guān)聯(lián),其從群體的 成員的基因型和表型的統(tǒng)計分析推斷得到。這些成員可以是個體生物 (例如,玉米),緊密相關(guān)的個體的家族,近交系,雙單倍體或其他 緊密相關(guān)的個體的組。此類玉米組稱為"品系,,,表示遺傳(descent) 品系。群體可以來自兩種個體或兩種品系(例如,定位群體)之間的 單交或者其可以由具有多種遺傳品系的個體組成。各個個體或品系由 單個或平均性狀表型和位于一個或多個標(biāo)記基因座的基因型表征。
一些類型的統(tǒng)計分析可以用于從表型/基因型數(shù)據(jù)推斷標(biāo)記/性狀 的關(guān)聯(lián),但基本的設(shè)想是檢測標(biāo)記,即,多態(tài)性,對多態(tài)性而言,可 選擇的基因型具有顯著不同的平均表型。例如,如果給定的標(biāo)記基因 座A具有三種可選擇的基因型(AA,Aa和aa),并且如果這三種類型 的個體具有顯著不同的表型,則推斷出基因座A與性狀相關(guān)聯(lián)。表型 上的區(qū)別的顯著性可以通過數(shù)種標(biāo)準(zhǔn)統(tǒng)計檢驗(例如表型的標(biāo)記基因 型的線性回歸或方差分析(AN0VA))進(jìn)行檢驗。商業(yè)上可獲得的通常 用于進(jìn)行這類分析的統(tǒng)計軟件包,包括SAS Enterprise Miner (SAS Institute Inc., Cary, NC) 和Splus (Insightful Corporation.
27Cambridge, MA)。當(dāng)同時檢驗多種標(biāo)記時,在所需的顯著性水平進(jìn)行 <務(wù)正,例如Bonferonni 4交正,以表明關(guān)聯(lián)。
通常,關(guān)聯(lián)研究的目的并不是簡單為了檢測標(biāo)記/性狀關(guān)聯(lián),還為 了評估直接影響性狀(即QTL)的基因相對于標(biāo)記位點的位置。在達(dá) 到這一目的的簡單方法中,在標(biāo)記基因座差值量級之間,在可選的基 因型或差異的顯著性水平之間進(jìn)行比較。性狀基因推斷為最接近這樣 的標(biāo)記,其具有最相關(guān)的基因型差異。在更復(fù)雜的分析中,例如區(qū)間 定位 (interval mapping ) (Lander 和 Botstein, Genetics 121:185-199 (1989),針對QTL位于該位點的可能性檢驗遺傳圖鐠上 的許多位點中的每一個(比如說在lcM區(qū)間)。基因型/表型數(shù)據(jù)用于 計算各個檢驗位點的L0D分值(似然比的對數(shù))。當(dāng)LOD分值超過臨 界閾值時,對QTL定位于遺傳圖譜上的該位置(其落在兩個特異的標(biāo) 記基因座之間)來說存在顯著的證據(jù)。
a. 連鎖不平衡定位和關(guān)聯(lián)研究
用于確定性狀基因位點的另 一種方法是分析群體中的性狀-標(biāo)記 關(guān)聯(lián),所述群體中的個體在性狀和標(biāo)記基因座上都有區(qū)別。 一些標(biāo)記 等位基因可以與這一群體中的一些性狀基因座等位基因相關(guān)聯(lián),由于 群體遺傳過程,例如獨特起源的突變,建立者事件(founder event), 隨機漂變和群體結(jié)構(gòu)。所述關(guān)聯(lián)稱為連鎖不平衡。在連鎖不平衡定位 中,將個體的性狀值與位于標(biāo)記基因座的不同基因型比較。通常地, 顯著的性狀差異表明標(biāo)記基因座和一個或多個性狀基因座之間緊密接
近。如果標(biāo)記密度適當(dāng)高并且連鎖不平衡只在染色體上非常緊密連鎖 的位點之間出現(xiàn),那么可以非常精確地定位性狀基因座。
特定類型的連鎖不平衡定位稱為關(guān)聯(lián)研究。該方法利用候選基因 內(nèi)的標(biāo)記,所述基因被認(rèn)為是功能性地涉及性狀發(fā)生的基因,由于信 息,例如生物化學(xué),生理學(xué),轉(zhuǎn)錄譜和模型生物中的反向遺傳試驗。 在關(guān)聯(lián)研究中,針對與性狀變異的關(guān)聯(lián),檢驗候選基因內(nèi)的標(biāo)記。如 果研究群體中的連鎖不平衡限制于非常緊密連鎖的位點(即在基因內(nèi)
28或在緊鄰基因之間),則正關(guān)聯(lián)提供了幾乎確切的證據(jù)表明候選基因 是性狀基因。
b. 定位克隆(positional cloning)和轉(zhuǎn)基因應(yīng)用 傳統(tǒng)的連鎖定位通常將性狀基因定位于兩個遺傳標(biāo)記之間的區(qū)間
(稱為側(cè)翼標(biāo)記)。當(dāng)該區(qū)間相對小時(比如小于1Mb),通過定位 克隆方法精確鑒定性狀基因是可行的。需要高標(biāo)記密度以充分減小區(qū) 間長度。該方法需要巨大的插入基因組克隆的文庫(例如BAC文庫), 其中插入的是來自目的物種的基因組DM的片段(通常長度為 100-150kb)。通過探針雜交或PCR篩選文庫,以鑒定包含側(cè)翼標(biāo)記序 列的克隆。然后,通過物理定位方法,構(gòu)建連接兩個側(cè)翼克隆的一系 列部分重疊克隆(重疊群)。該方法包括指紋圖鐠,STS內(nèi)容物作圖 和序列標(biāo)簽連接子方法學(xué)。 一旦物理重疊群構(gòu)建完成并測序,則針對 所有的轉(zhuǎn)錄單位搜索序列??梢酝ㄟ^比較突變體和野生型抹系之間的 序列,通過另外的精密標(biāo)度的遺傳定位,和/或通過植物轉(zhuǎn)化過程中的 功能檢測確定相應(yīng)于性狀基因的轉(zhuǎn)錄單位。用該方法鑒定的性狀基因 成為轉(zhuǎn)基因產(chǎn)物開發(fā)的線索Uead)。類似地,通過與候選基因的關(guān) 聯(lián)研究鑒定的性狀基因,成為轉(zhuǎn)基因產(chǎn)物開發(fā)的線索。
c. 標(biāo)記輔助育種和標(biāo)記輔助選擇
當(dāng)性狀基因定位于基因組標(biāo)記附近時,這些標(biāo)記可以用于選擇性 狀的改良值,不需要在每個選擇循環(huán)進(jìn)行表型分析。在標(biāo)記輔助育種 和標(biāo)記輔助選擇中,性狀基因和標(biāo)記之間的關(guān)聯(lián)最初通過遺傳定位分 析建立(如在A. l或A. 2中)。在相同的方法中,確定哪些標(biāo)記等位 基因與有利的性狀等位基因連鎖。然后,在群體中選擇與有利的性狀 等位基因相關(guān)聯(lián)的標(biāo)記等位基因。如果標(biāo)記和性狀基因之間有足夠緊 密的連鎖,該方法將改善性狀值。需要的連鎖程度依賴于選擇的代數(shù), 因為在每一代,都有可能通過重組破壞關(guān)聯(lián)。
29用于開發(fā)新的近交系的雜交的預(yù)測
特定標(biāo)記等位基因和有利的性狀等位基因之間的關(guān)聯(lián)還可以用于 預(yù)測后代的哪些類型可以從給定的雜交中分離。這種預(yù)測可以允許選 擇合適的親本以產(chǎn)生群體,從所述群體中,組裝有利的性狀等位基因
的新的組合以產(chǎn)生新的近交系。例如,如果A品系具有標(biāo)記等位基因, 先前已知該標(biāo)記等位基因與位于基因座1,20和31的有利的性狀等位 基因相關(guān)聯(lián),而B品系具有標(biāo)記等位基因,該標(biāo)記等位基因與位于基 因座15, 27和29的有利的作用相關(guān)聯(lián),那么可以通過AxB雜交和選 擇在所有6個性狀基因座具有有利的等位基因的后代開發(fā)新品系。
d. 雜種預(yù)測
通過在屬于不同"雜種優(yōu)勢組"的兩個優(yōu)良近交系之間進(jìn)行雜交, 產(chǎn)生商業(yè)玉米種子。這些組在遺傳上足夠不同,使得它們之間的雜交 表現(xiàn)出高水平的雜種優(yōu)勢或雜種活力(即相對于親本系增強的性能)。 通過分析好的雜種的標(biāo)記構(gòu)成,可以鑒定位于雄系和雌系中不同基因 座的等位基因的組,所雄系和雌系良好結(jié)合以產(chǎn)生雜種優(yōu)勢。理解了 這些模式,并知道了不同近交系的標(biāo)記構(gòu)成,就可以允許預(yù)測不同品 系對之間的雜種優(yōu)勢水平。這種預(yù)測可減少對應(yīng)雜種優(yōu)勢組的品系用 于測試新的近交系的性能的可能性。
e. 遺傳同一性(Identity by descent)
雜種優(yōu)勢的一種理論預(yù)測,用于產(chǎn)生雜種的雄系和雌系之間遺傳 同一性(IBD)的區(qū)域?qū)⒔档碗s種性能。遺傳同一性可以從不同品系中 的標(biāo)記等位基因模式推斷。如果不可能偶然地獨立發(fā)生,則位于一系 列相鄰基因座的同一的標(biāo)記串可以認(rèn)為是遺傳同一的。雄系和雌系中 的標(biāo)記指紋圖鐠分析可以鑒定IBD區(qū)域。這些區(qū)域的認(rèn)識可以告知雜 種親本的選擇,因為在雜種中避免IBD可能提高性能。這一認(rèn)識還可 以告知育種程序,其中雜交可以設(shè)計為產(chǎn)生顯示較少或沒有IBD的近 交系對(一個雄性和一個雌性)。
30近交系的指紋圖譜是在 一組標(biāo)記基因座處的等位基因的紐合。高 密度指紋圖語可以用于建立和描繪種質(zhì)同 一性,其用于種質(zhì)所有權(quán)保 護(hù)。
遺傳標(biāo)記用于加速轉(zhuǎn)基因滲入到新的遺傳背景(即滲入到不同范 圍的種質(zhì))。筒單基因滲入包括將轉(zhuǎn)基因系與優(yōu)良近交系雜交,然后 將雜種與優(yōu)良(循環(huán)的)親代重復(fù)回交,并針對轉(zhuǎn)基因的維持進(jìn)行選 擇。多個回交代后,通過重組和分離,起始轉(zhuǎn)基因系的遺傳背景逐漸 被優(yōu)良近交系的遺傳背景取代。該過程可以通過選擇來源于循環(huán)親代 的標(biāo)記等位基因進(jìn)行加速。
E.多態(tài)性測定用于定位DNA克隆文庫的用途
本發(fā)明的多態(tài)性和基因座用于與多態(tài)性連鎖的QTL和基因的DM 序列的鑒定和定位。例如,可以用與性狀連鎖的多態(tài)性,查詢BAC或 YAC克隆文庫,以發(fā)現(xiàn)包含特定QTL和與性狀相關(guān)聯(lián)的基因的克隆。 例如,通過與寡核普酸探針雜交鑒定大量的QTL和基因,例如數(shù)百或 數(shù)千的巨大的多基因的序列,所述寡核苷酸探針可以與已定位的和/ 或連鎖的多態(tài)性雜交??梢酝ㄟ^以高密度陣列形式提供克隆序列改善 此類雜交篩選。更優(yōu)選地,通過使用混合策略(pooling strategy) 增強篩選方法,以顯著減少鑒定包含所述多態(tài)性的克隆所必需的雜交 的數(shù)目。當(dāng)多態(tài)性被定位時,該篩選有效地定位克隆。
例如,如杲其中數(shù)千克隆排列在已定義的陣列中,例如,96孔板 中,平板可以任意地在三維上排列,經(jīng)排列的堆積(stack)的孔中分 別包含獨特的DNA克隆。各個堆積中的孔可以表示為行,列和板的三 維陣列中的離散單元。本發(fā)明的一個方面中,堆積和堆積中的平板的 數(shù)目約等于最小化的測定數(shù)。平板的堆積允許構(gòu)建克隆的DM的庫。
對于三維排列的堆積,可以針對(a)各行中的所有單元,(b) 各列中的所有單元,和(c)各板中的所有單元建立克隆的DNA的庫。 用寡核苷酸探針雜交篩選的庫將提供針對 一 列庫, 一行庫和 一板庫的 正向指示,所述寡核苷酸探針與對克隆之一獨特的多態(tài)性雜交,從而
31指示包含靶克隆的孔單元。
在多重堆積的情況下,各個堆積中的所有克隆DNA的額外的庫允許指示具有靶克隆的行-列-板坐標(biāo)的堆積。例如,4608個克隆組排列于48個96-孔板中。48個平板可以排列為8組,每組6個平板堆積,提供6 x 12 x 8三維陣列的單元,即,每個堆積包含6個8行和12列的堆積。對完整的克隆組來說,有36個庫,即6個堆積庫,8行庫,12個列庫和8個堆積庫。因此,為了找到含有與各個已定位的多態(tài)性相關(guān)聯(lián)或連鎖的QTL或基因的克隆,需要最多36個雜交反應(yīng)。
一旦鑒定了克隆,從多態(tài)性基因座設(shè)計的寡核苷酸引物可以用于定位克隆連鎖的QTL和/或基因。
F.計算機可讀介質(zhì)和數(shù)據(jù)庫
本發(fā)明的核酸分子序列可以在多種介質(zhì)中"提供,,,以方便使用,例如,數(shù)據(jù)庫或計算機可讀介質(zhì),其還可以包含描述性注釋,所述注釋的形式使得本領(lǐng)域技術(shù)人員能夠研究或查詢序列并獲得有用的信息。在本發(fā)明的一個實施方案中,可以制備計算機可讀介質(zhì),其包含核酸序列,其中本發(fā)明的基因座和核酸分子的序列的至少10%或更多,例如至少25%,或至少50%或更多。例如,此類數(shù)據(jù)庫或計算機可讀介
的組。此外,此類數(shù)據(jù)庫或計算機可讀介質(zhì)可以包含已定位的或未定位的多態(tài)性或本發(fā)明和遺傳圖鐠的圖或表。
本文所用的"數(shù)據(jù)庫"指可獲取的收集的數(shù)據(jù)的任意表示,包括計算機文件,例如文本文件,數(shù)據(jù)庫文件,電子數(shù)據(jù)表文件和圖像文件,打印的表格(printed tabulat ion )和圖示以及數(shù)字和圖像數(shù)據(jù)組合的組合。在本發(fā)明的優(yōu)選的方面,"數(shù)據(jù)庫,,表示記憶系統(tǒng),其可以存儲計算機可搜索的信息。通常地,優(yōu)選的數(shù)據(jù)庫軟件包括由DB2,Sybase和Oracle提供的數(shù)據(jù)庫軟件。
本文所用的"計算機可讀介質(zhì)"指任何可以通過計算機直接讀取和訪問的介質(zhì)。此類介質(zhì)包括,但不限于磁存儲器,例如軟盤,硬
32盤,存儲介質(zhì)和磁帶;光存儲介質(zhì)例如CD-ROM;電存儲介質(zhì)例如RAM和ROM;和這些種類的混合例如磁/光存儲介質(zhì)。本領(lǐng)域技術(shù)人員很容易知道任何目前已知的計算機可讀介質(zhì)如何可以用于創(chuàng)建包含其上記
錄有本發(fā)明的核苷酸序列的計算機可讀介質(zhì)的產(chǎn)品。
本文所用的"記錄的"、"記錄有,,指在可獲取的數(shù)據(jù)庫或計算機可讀介質(zhì)中存儲信息的方法的結(jié)果。例如,本領(lǐng)域技術(shù)人員可以很容易地采用任意目前已知的方法在計算機可讀介質(zhì)上記錄信息,以產(chǎn)生包含本發(fā)明的已定位的多態(tài)性和其他核苷酸序列信息的介質(zhì)。對本領(lǐng)域技術(shù)人員來說,可利用多種數(shù)據(jù)存儲結(jié)構(gòu)創(chuàng)建計算機可讀介質(zhì),其中數(shù)據(jù)存儲結(jié)構(gòu)的選擇通?;谒x的訪問存儲信息的方法。另外,
多態(tài)性和核苷酸序列信息。
計算機軟件是公眾可獲得的,其使得本領(lǐng)域技術(shù)人員可以訪問計
算機可讀介質(zhì)中提供的序列信息。以下實施例示范軟件(其運行搜索運算法則,例如BLAST運算法則(Altschul等,J. Mol. Biol.215: 403-410 (1990),通過引用并入本文)和Sybase系統(tǒng)中的BLAZE運算法則(Brutlag等人,Comp. Chem. 17:203-207 (1993),通過引用并入本文))如何可以用于鑒定DNA序列,所述DNA序列以高同 一性水平與本發(fā)明的基因座序列同源??梢员容^高同一性的序列,以找到玉米品種的有用的多態(tài)性標(biāo)記。
本發(fā)明進(jìn)一步提供系統(tǒng),特別是基于計算機的系統(tǒng),其包含本文描述的序列信息。此類系統(tǒng)設(shè)計為鑒定本發(fā)明的核酸分子中商業(yè)上重要的序列片段。本文所用的"基于計算機的系統(tǒng)"指用于分析核苷酸序列信息的硬件,軟件和存儲器。本領(lǐng)域技術(shù)人員可以容易地理解任一種當(dāng)前可獲得的基于計算機的系統(tǒng)適用于本發(fā)明。
如上所述,本發(fā)明的基于計算機的系統(tǒng)包含數(shù)據(jù)庫(所述數(shù)據(jù)庫中存儲有本發(fā)明的多態(tài)性標(biāo)記,遺傳圖鐠和/或核酸分子的序列)以及支持和執(zhí)行基因分型應(yīng)用所必需的硬件和軟件。
33實施例1
本實施例舉例說明通過使用對甲基化胞嘧啶殘基敏感的酶以富集
獨特/編碼序列基因組DNA而制備約化表示文庫。
用于制備來自玉米(或其他植物)的基因組DNA的常規(guī)方法適用于構(gòu)建約化表示的數(shù)據(jù)庫。存在商業(yè)可獲得的試劑盒,例如來自Qiagen (Valencia, CA)的"DNeasy Plant Maxi試劑盒"。然而,最大化產(chǎn)量和便利的優(yōu)選方法是用來自Life Technologies (Grand IslandNY)的"Plant DNAzol Reagent "提取DNA。簡言之,冷凍的葉組織用研缽和研桿在液氮中研磨。然后用DNAzol試劑提取研磨的組織。該步驟除去了細(xì)胞蛋白,細(xì)胞壁物質(zhì)和其他碎片。用該試劑提取后,沉淀DNA,沖洗,重懸,并用RNAse處理以除去RNA。再次沉淀DNA,并在合適體積的TE(以便濃度為lMg/ul)中重懸。該基因組DNA預(yù)備用于文庫構(gòu)建。
分別用Pst I限制性核酸內(nèi)切酶消化來自兩種玉米品系的即將針對多態(tài)性檢測進(jìn)行比較的基因組DNA,使DNA片段的末端為粘性末端,該末端可以連接到具有相同限制性位點的質(zhì)粒中。例如,將IOO單位的Pst I加入到20|ig DNA中并在37。C溫育8小時。經(jīng)消化的DNA產(chǎn)物通過在1°/。低熔解溫度瓊脂糖凝膠上電泳分離,以通過大小分離DNA片段。來自兩種玉米品系的經(jīng)消化的DNA并排載于凝膠上(之間用一個泳道作為間隔)。1KB DNA梯度標(biāo)記和lOObp DM梯度標(biāo)記載于兩種玉米DM泳道每一側(cè)。這些標(biāo)記作為經(jīng)消化的玉米DM的大小分離的指導(dǎo)。500-3000bp范圍內(nèi)的片段遞增地從凝膠上切離,以500-600bp、 600-700bp、 700-800bp、 800-900bp、 900-1100bp、1100-1500bp、 1500-2000bp、 2000-2500bp和2500-3000bp的大小級分。各級分中的DM用p-瓊脂糖酶純化并連接入pUC18的Pst I克隆位點。質(zhì)粒連接產(chǎn)物通過電穿孔轉(zhuǎn)化到DH10B大腸桿菌細(xì)菌宿主中,以產(chǎn)生約化表示文庫。例如,約500納克經(jīng)大小選擇的DNA連接到50ng去磷酸化pUC18栽體。
轉(zhuǎn)化通過電穿孔進(jìn)行并且用于約化表示的Pst I文庫的轉(zhuǎn)化效率
34為大約50, 000-300, OOO個轉(zhuǎn)化體每l微升連接產(chǎn)物或1000-6000轉(zhuǎn)化體/ng DNA。
用于評估質(zhì)量的基本測試包括平均插入大小,葉綠體/線粒體DNA含量,和重復(fù)序列分?jǐn)?shù)。
在文庫構(gòu)建過程中,評估文庫的平均插入大小的檢測結(jié)果。測試
每個連接以通過分析10-20克隆/個連接確定平均插入大小。使用標(biāo)準(zhǔn)微制備方法使DM分離自重組克隆,用Pst I消化以從載體中釋放插入物,然后用1%凝膠電泳確定大小(Maule, Molecular Biotechnology9:1 07-126 (1998),其全文通過引用并入本文)。
文庫中的葉綠體/線粒體DNA含量,和重復(fù)序列的百分比通過對小量樣品的克隆(400個)測序,并且對照多種序列數(shù)據(jù)庫交叉核對所獲得的序列而評估。 一些重復(fù)元件在數(shù)據(jù)庫中不存在,但是通??梢酝ㄟ^大量拷貝的相同序列來鑒定。例如,在對400個克隆的組測序后,未被重復(fù)元件數(shù)據(jù)庫過濾,但是在樣品中的存在大于10倍的任何序列被認(rèn)為是重復(fù)元件。
本發(fā)明的玉米約化表示文庫通過插入經(jīng)富集的編碼區(qū)DNA而構(gòu)建,所述DNA來自如下玉米品系B73, M017, LH82和5CM1。
實施例2:
本實施例舉例說明來自實施例1中制備的約化表示文庫中的克隆的玉米基因組DM序列的確定。兩種基本的方法可用于DM測序,鏈終止法(Sanger等人,Proc. Natl. Acad. Sci. USA 74:5463-5467(1977))和化學(xué)降解法(Maxam和Gilbert, Pro" Natl. Acad. Sci.USA 74: 560-564 (1977))。自動化和技術(shù)的進(jìn)步,例如用基于熒光的測序法取代放射性同位素法,減少了 DNA測序所需的精力(Craxton,Methods, 2:20-26 (1991), Ju等人.Proc. Natl. Acad. Sci USA92:4347-4351 (1995)以及Tabor和Richardson, Proc. Natl. Acad.Sci USA 92: 6339-6343 (1995))。自動化測序儀可獲自,例如,AppliedBiosystems, Foster City, California (ABI Prism systems);
35Pharmacia Biotech, Inc., Piscataway, New Jersey (Pharmacia ALF),LI-COR, Inc., Lincoln, Nebraska (Ll-COR 4,000)和Millipore,Bedford, Massachusetts (Millipore BaseStation)。
另外,毛細(xì)管凝膠電泳的進(jìn)步也減少了 DNA測序所需的精力,并且此類進(jìn)步提供了用于DNA樣品測序的快速高效的技術(shù)方案(Swerdlow和Gesteland, Nucleic Acids Res. 75:1415-1419 ( 1990);Smith, Nature 349:812-813 (1991); Luckey等人,Methods Enzymol.218: 154-172 (1993); Lu等人,J. Chromatog. A. 680: 497-501(1994); Carson等人,Anal. Chem. 65:3219- 3226 (1993); H畫g etal.. Anal. Chem. 64:2149-2154 (1992); Kheterpal et al.,Electrophoresis 17: 1852-1859 (1996); Quesada 和 Zhang,Electrophoresis 17:1841-1851 ( 1996); Baba, Yakugaku Zasshi117:265-281 (1997)。
很多測序方法是本領(lǐng)域已知的,包括基于熒光的測序方法學(xué)。這些方法具有分析大量序列數(shù)據(jù)所需的檢測、自動化和儀器化的能力。ABI Prism 377謹(jǐn)觀'J序儀(Applied Biosyst面,F(xiàn)oster City, CA)允許快速電泳和收集數(shù)據(jù)。用這些類型的自動化系統(tǒng),檢測熒光染料標(biāo)記的測序反應(yīng)產(chǎn)物并且將數(shù)據(jù)直接輸入計算機,產(chǎn)生色譜,其隨后進(jìn)行檢查,存儲并用相應(yīng)的軟件程序分析。這些方法對本領(lǐng)域技術(shù)人員來說是已知的并且已被描述和評論(Birren等人.Genome Analysis:Analyzing DNA, 1, Cold Spring Harbor, New York (1999))。
通過獲自CodonCode Corporation, Dedham, MA的PHRED對蹤跡文件的序列堿基判斷和質(zhì)量得分賦值,PHRED由Brent Ewing,等人,"Base-cal 1 ing of automated sequencer traces using phred", 1998,Genome Research, Vol. 8, pages 175- 185 and 186-194描述(其通過引用并入本文)。
完成堿基判定后,通過切除低質(zhì)量末端序列提高序列質(zhì)量。如果得到的序列少于50bp,則將其刪除。刪除總的質(zhì)量低于12. 5的序列。并且,去除污染序列,例如,大腸桿菌BAC和載體序列和亞克隆載體。
36用獲自DoubleTwist Inc. , Oakland, CA的Pangea Clustering and Alignment Tools,通過針對重疊堿基比較序列對,組裝重疊群。使用 如下的高嚴(yán)緊性參數(shù)檢測重疊字大小(word size) = 8;窗口大 小(window size) - 60; 且同一性為93%。用獲自CodonCode Corporation的PHRAP片段組裝程序,使用0. 5或更低的"重復(fù)嚴(yán)緊 性參數(shù),,,重新組裝聚簇。最終的組裝產(chǎn)品包含序列集合,所述序列 包括重疊群序列,其表示重疊聚類序列的共有序列(重疊群)和單堿 基差異序列(其不存在于相關(guān)序列的任何聚簇中(單堿基差異))。 共同地,由DM集合產(chǎn)生的重疊群和單堿基差異序列稱為島。
實施例3
本實施例舉例說明SNP和Indel多態(tài)性的鑒定,通過比較來自至 少兩種單獨的玉米品系的重疊群和單堿基差異序列(如實施例2中制 備)的序列比對。將來自多種玉米品系的序列裝配到具有一種或多種 多態(tài)性(即SNP和/或Indel)的基因座中。候選的多態(tài)性由如下參數(shù) 限制
U)就共有序列而言,重疊群和單堿基差異序列的最小長度為 200個堿基。
(b) 在候選SNP每一側(cè)的15個堿基區(qū)域中,觀察到的堿基的同 一性百分比為75°/ 。
(c) 位于多態(tài)性位點的各個重疊群中的最低BLAST質(zhì)量為35.
(d) 多態(tài)性位點每一側(cè)的15個堿基區(qū)域中最低BLAST質(zhì)量為20. 具有符合條件的多態(tài)性的大量基因座鑒定為具有共有序列,如
SEQ ID NO: 1至SEQ ID NO: 10373所示。各個基因座中的符合條件 的SNP和Indel多態(tài)性鑒定于表1中。更具體地,表l如下鑒定了多 態(tài)性的類型和位置
SEQ-NUM指多態(tài)性玉米DNA基因座的序列號,例如SEQ ID N0。 SEQ-ID指多態(tài)性玉米DM基因座的任意的(arbitrary)識別命
37名。
MUTATION-ID指各個多態(tài)性的任意的識別命名。 START-POS指多態(tài)性玉米DNA基因座的核苷酸序列中多態(tài)性起始 的位置。
END_P0S指多態(tài)性玉米DNA基因座中多態(tài)性終止的位置;對SNP 來說,START-POS和END-POS是相同的。
TYPE指鑒定多態(tài)性為SNP或IND ( Indel )。
ALLELEn和STRAINn指特定等位基因的玉米品種中多態(tài)性的核苷 酸序列。
CHROMOSOME指經(jīng)定位的多態(tài)性的染色體。
POSITION指以cM測量的經(jīng)定位的多態(tài)性與染色體5,末端之間的 距離。
實施例4
本實施例舉例說明了引物堿基延伸用于檢測SNP多態(tài)性的用途, 即用SEQ ID NO: 5378的玉米基因座中的Mutation ID 3972,其在下 面的表2中進(jìn)行更具體地描述。
表2
SEQMUTATIONSTARTENDTYPEALLELE1/SALLELE2/
醒IDPOSPOSTRAIN1STRAIN2
573839716666SNPA/b73C/mol7
57383972126126SNPA/mol7G/b73
57383973149150IND**/mol7TG/b73
57383974338338SNPA/b73G/mol7
擴增少量玉米基因組DNA(例如大約10ng),使用正向和反向PCR 引物,即分別為SEQ ID NO: 10379和SEQ ID NO: 10378,所述引物 設(shè)計為對模板的退火溫度為55°C,所述模板在Mutation ID 3972多 態(tài)性附近的SEQ ID NO: 5738的基因座中,所述多態(tài)性為A/G SNP。
38將PCR產(chǎn)物加入到新的平板中,其中延伸引物SEQ IDN0: 10380共價 連接到GBA平板的反應(yīng)孔的表面。延伸混合物包含DM多聚酶,兩種 不同的標(biāo)記ddNTP,并且加入延伸緩沖液。GBA平板在42。C溫育15分 鐘以允許延伸。通過用合適的緩沖液沖洗,從孔中移除反應(yīng)混合物。 通過用針對各個標(biāo)記的第一和笫二檢測試劑連續(xù)溫育檢測兩種標(biāo)記。 在本實施例中,通過與HRP-抗-FITC溫育,然后沖洗孔,然后在含有 HRP的發(fā)色底物的援沖液中溫育測量ddATP-FITC的摻入。在適合HRP 反應(yīng)產(chǎn)物的波長下,針對各個孔用分光光度法確定反應(yīng)程度。再次沖 洗孔,并且用AP-鏈霉親和素重復(fù)上述步驟,使用AP的發(fā)色底物,以 及在適合AP反應(yīng)產(chǎn)物的波長下的分光光度法。 結(jié)果分析。
從對檢測步驟特異標(biāo)記的反應(yīng)產(chǎn)物測量得到的吸光度,推斷各個 標(biāo)記的ddNTP的摻入程度,并且從這些吸光度與已知的基因型和無模 板對照反應(yīng)的標(biāo)準(zhǔn)進(jìn)行比較的比率,推斷樣品的基因型。在最普通的 實踐中,將各個數(shù)據(jù)點觀察到的吸光度相互對應(yīng)地在散點圖中作圖, 產(chǎn)生"對偶圖"。使用本實施例的單堿基延伸測定的成功的基因分型 測定提供了對偶圖(如圖2中所示),其中數(shù)據(jù)點分為四組純合子 1 (例如,等位基因A),純合子2 (例如,等位基因G),雜合子(每 個樣品包含兩種等位基因),和由無模板對照,或失敗的擴增反應(yīng)或 檢測產(chǎn)生的"無信號"組。
實施例5
本實施例舉例說明了標(biāo)記探針降解測定用于檢測在實例4中測定 的SNP多態(tài)性(即SEQ ID NO: 5738基因座中的Mutation ID 3972 多態(tài)性)的用途。將一些玉米基因組模板DNA (例如約2-20ng)混合 到5ul總體積中,與四種寡核苷酸一起,即正向引物SEQ ID N0: 10376, 反向引物SEQ ID NO: 10377和具有結(jié)合到5,末端的設(shè)計為VIC-TGTGTGAGCTGCTG的VIC報告子的雜交探針(其中探針的寡核苷酸片段 具有SEQ ID NO: 10374 ),以及具有結(jié)合到5,末端的設(shè)計為
39FAM-TTGTGTGGGCTGCT的FAM報告子的雜交探針(其中探針的寡核苷酸 片段具有SEQIDNO: 10375 ),以及包含參比染料R0X的PCR反應(yīng)緩 沖液。PCR反應(yīng)使用6(TC的退火延伸溫度進(jìn)行35個循環(huán)。反應(yīng)后,各 個熒光團(tuán)的熒光和參比的熒光在熒光計中進(jìn)行檢測。用參比的熒光值 使各個熒光團(tuán)的熒光值標(biāo)準(zhǔn)化。經(jīng)標(biāo)準(zhǔn)化的值針對各個樣品相互對應(yīng) 地進(jìn)行作圖以產(chǎn)生對偶圖。使用本實施例的引物和雜交探針的成功的 基因分型測定提供了對偶圖,其數(shù)據(jù)點在清楚可分的組中,如圖2中 所示。
為了證實測定產(chǎn)生了精確的結(jié)果,對代表三種可能的基因型(即 兩種純合子等位基因和一種雜合子樣本)中的每種的已知基因型身份 的大量重復(fù)樣品進(jìn)行新的測定。為了有效的和有用的測定,其必須產(chǎn) 生清楚可分的數(shù)據(jù)點的組,以便三種基因型之一可以賦值給至少90% 的數(shù)據(jù)點,并且可以觀察賦值,以針對至少98%的數(shù)據(jù)點進(jìn)行校正。 在這個驗證步驟之后,對兩種高度近交的個體之間雜交的后代進(jìn)行測 定,以獲得分離數(shù)據(jù),其之后被用于計算多態(tài)性基因座的遺傳圖譜位 置。
實施例6
本實施例舉例說明本發(fā)明的基因座中的多態(tài)性的遺傳圖鐠,所述 圖語基于超過1000個SNP的基因型,針對78個來源于玉米品系B73 和Mo17的雜交的重組近交系(RIL)。所述基因型與針對約80個公開 的在203個RIL上打分的核心SSR和RFLP標(biāo)記的基因型結(jié)合。定位前, 將任何表現(xiàn)出異常分離(對1: l分離比的卡方檢驗,P<0. Ol)的基因 座去除。稍后,可將這些基因座加入到圖謙中,但是不允許它們改變 標(biāo)記次序。
用JoinMap version 2. 0軟件(由Stam, P. "Construction of integrated genetic linkage maps by means of a new computer package: JoinMap, The Plant Journal. 3: 739-744 (1993); Stam, P. 和van Ooijen, J.W. "JoinMap version 2.0: Software for the
40calculation of genetic linkage maps (1995) CPR0-DL0, Wageningen 描述)構(gòu)建圖鐠。JoinMap執(zhí)行加權(quán)最小二乘法以多點定位,其中并 入了來自所有連鎖基因座對(緊鄰或不緊鄰)的信息。用5. 0的LOD 閾值形成連鎖群。SSR和RFLP公開標(biāo)記用于將連鎖群分配給染色體。
在圖譜構(gòu)建前合并染色體內(nèi)的連鎖群。
Haldane的定位功能用于將重組分?jǐn)?shù)轉(zhuǎn)化為圖譜距離。除了成對 的連鎖數(shù)據(jù)以外使用寬標(biāo)準(zhǔn);只去除LOD不大于0. 001或重組分?jǐn)?shù)不 小于0.499的數(shù)據(jù)。為了對基因座排序,我們使用的跳變閾值(jump threshold )為5. 0,三聯(lián)體閾值(triplet threshold )為7. 0和ripple 值為3。在兩輪圖語構(gòu)建中,約38%的基因座(424/1108 )被排序,使 用5. 0的跳變閾值,其阻止往圖鐠添加基因座,如果此類添加導(dǎo)致吻 合度標(biāo)準(zhǔn)跳變大于5.0。將剩余的基因座加入到圖謙中,而不使用該 跳變閾值。這些基因座的添加對初始的424個基因座的圖譜次序和距 離具有可以忽略不計的影響。已定位的SNP多態(tài)性在表3中進(jìn)行鑒定, 其中"Chromosome"和"Position"鑒定以cM測量的由"Mutation ID" 識別的SNP與玉米染色體5'末端的距離。"Public Name"提供了涉及 的公開標(biāo)記的公布的名稱,其不是本發(fā)明的部分。對于在表3中列出 的一些定位的多態(tài)性標(biāo)記,Mutation ID不止一次被列出,其表示定 位基于多次基因分型測定進(jìn)行。多次基因分型測定的圖譜位置通常用 于證實圖譜位置,除圖譜位置有分歧的情況外,例如由于測定的設(shè)計 和操作中的誤差。經(jīng)定位的多態(tài)性的密度和分布在圖1中示出。
用于連鎖諳圖構(gòu)建的基于找到基因座次序以最小化重組事件的總 數(shù)的可選擇的方法,由 J"ansen, J. 等人 "Constructing dense genetic linkage maps", Theor Appl Genet, (in press)描述。該 方法在很多條件下產(chǎn)生最大可能圖譜的接近值。由該方法建立的圖i瞽 與用JoinMap 2. O獲得的圖鐠非常相符。
實施例7
本實施例舉例說明本發(fā)明的使用表1和SEQ ID NO: 1-10373的
41DNA序列中公開的多態(tài)性的方法。
分析具有不同遺傳的玉米的育種群體,使用如實施例5中所示的基 于SEQIDN0: l-10373的序列制備的引物對和探針對(其針對表l中鑒 定的各個多態(tài)性)。緊密連鎖的多態(tài)性鑒定為在跨越玉米基因組的約8 厘摩的相鄰基因組窗口中表征單倍型。代表至少4%群體的單倍型與為 玉米群體的各個成員鑒定的性狀值關(guān)聯(lián),所述性狀值包括針對產(chǎn)量,
成熟期,倒伏,植林高度,抗玉米銹病,耐旱性和低溫萌發(fā)的性狀值。 各個單倍型的性狀值排列在各個8厘摩的窗口中。就各個窗口中的單倍 型的同 一性分析來自群體中的隨機交配的成員的后代種子?;谠谒?述種子中鑒定的單倍型的高性狀值選擇后代種子用于種植。
4權(quán)利要求
1.多態(tài)性玉米DNA基因座,其用于至少兩個玉米品種之間的基因分型其中所述的基因座包含至少20個連續(xù)的核苷酸,其包括或與表1中鑒定的多態(tài)性相鄰;并且其中所述的至少20個連續(xù)的核苷酸的序列與玉米DNA片段的任一條鏈中的相同核苷酸數(shù)量的序列至少90%同一,所述的玉米DNA片段包括或與所述的多態(tài)性相鄰。
2. 用于檢測玉米DNA中的多態(tài)性的分離的核酸分子,其中所述的 核酸分子包含至少12個核苷酸堿基和可檢測的標(biāo)記,并且其中所述的 至少12個核苷酸堿基的序列與包含所述的多態(tài)性的權(quán)利要求1的基因 座中的玉米DM片段的任一條鏈中的相同連續(xù)核苷酸數(shù)量的序列至少 90%同一。
3. 寡核苷酸的組,包含(a) 核酸分子引物對,其中所述引物各自包含至少15個核苷酸 堿基并且其中所述引物對用于根據(jù)權(quán)利要求1的多態(tài)性玉米MA基因座 片段的PCR擴增,其中所述的片段包含多態(tài)性;和(b) 至少一種檢測子核酸分子,其用于檢測所述片段中的多態(tài) 性,其中所述的檢測子核酸包含(1 )至少12個核苷酸堿基和可檢測的標(biāo)記,或 (2)至少15個核苷酸堿基,1的基因座中的玉米DNA片段的任一條鏈中的相同連續(xù)核苷酸數(shù)量的序 列至少95%同一。
4. 一種發(fā)現(xiàn)玉米DNA中的多態(tài)性的方法,包括比較至少兩種玉米 品系中的DM序列,其中所述的序列通過使用權(quán)利要求1的基因座的片 段進(jìn)行選擇。
5. 根據(jù)權(quán)利要求4的方法,其中所述的序列選擇為與所述的基因座 連鎖。
6. —種基因分型的方法,包括測定來自至少一種玉米品系的組織的DNA或mRNA,以鑒定與權(quán)利要求1的基因座連鎖的核酸多態(tài)性的存在。
7. 根據(jù)權(quán)利要求6的基因分型的方法,其中所述的多態(tài)性是表3中 鑒定的已定位的多態(tài)性。
8. 根據(jù)權(quán)利要求6的方法,其進(jìn)一步包括鑒定至少兩種玉米品系的一種或多種表型性狀和確定所述性狀和多態(tài)性之間的關(guān)聯(lián)。
9. 根據(jù)權(quán)利要求6的方法,其中鑒定和選擇具有互補性狀的品系用 于育種,以提高雜種優(yōu)勢。
10. 根據(jù)權(quán)利要求6的方法,其中所述的測定使用足夠的核酸分子 以鑒定至少高達(dá)限定數(shù)量的不同多態(tài)性的存在,其中所述的限定數(shù)量選 自10、 25、 40、 75、 100、 500、 1000、 2000、 3000、 4000和5000。
11. 一種研究玉米等位基因的方法,包括確定分離自一種或多種玉 米植物的核酸分子的核酸序列中的多態(tài)性的存在,其中所述的多態(tài)性與 權(quán)利要求1的基因座連鎖。
12. —種定位玉米基因組序列的方法,包括鑒定所述序列中的已定 位的多態(tài)性的存在,其中所述的已定位的多態(tài)性與權(quán)利要求1的基因座 連鎖。
13. 根據(jù)權(quán)利要求12的方法,其中所述的已定位的多態(tài)性鑒定于表3中。
14. 一種對玉米育種的方法,包括選擇具有多態(tài)性的玉米品系,所 述多態(tài)性通過連鎖不平衡與目的性狀關(guān)聯(lián),其中所述的多態(tài)性與權(quán)利要 求1的基因座連鎖。
15. —種在玉米中將表型性狀與基因型關(guān)聯(lián)的方法,包括(a) 鑒定表征所述玉米植物的一種或多種不同表型性狀的組;(b) 選擇來自至少兩種具有等位基因DM的玉米植物的組織,并且 測定來自所述組織的DNA或mRNA以鑒定不同多態(tài)性的組的存 在或缺失。(c )鑒定所述多態(tài)性的組和所述表型性狀的組之間的關(guān)聯(lián), 其中所述的多態(tài)性的組包含至少一個與權(quán)利要求1的基因座連鎖的多態(tài) 性。
16. 根據(jù)權(quán)利要求15的在玉米中將表型性狀與基因型關(guān)聯(lián)的方法, 其中所述的多態(tài)性的組包含至少10個多態(tài)性,其與表3中鑒定的已定 位的多態(tài)性連鎖。
17. 根據(jù)權(quán)利要求16在玉米中將性狀與基因型關(guān)聯(lián)的方法,其中 玉米植物在分離群體中;其中所述DM是染色體的基因座中的等位基因, 其對目的性狀賦予表型影響并且其中多態(tài)性位于所述基因座中;并且其多態(tài)性和性狀基因座的線性次序。、、 '、 '
18. —種鑒定與目的性狀關(guān)聯(lián)的基因的方法,包括鑒定至少一種多 態(tài)性與所述目的性狀的連鎖,其中所述多態(tài)性與權(quán)利要求1的基因座連 鎖,鑒定包含所述基因座的基因組克隆和鑒定與所述基因座連鎖的基 因。
19. 一種用于在雜種玉米中提高雜種優(yōu)勢的方法,包括(a )在兩種以上的玉米近交系中開發(fā)多種多態(tài)性與性狀之間的關(guān)聯(lián),(b )選擇兩種具有互補的雜種優(yōu)勢組的預(yù)測其提高雜種優(yōu)勢的所 述近交系用于育種,其中所述的多態(tài)性與權(quán)利要求1的基因座連鎖。
20. —種包括篩選性狀的方法,包括(a) 查詢SNP的集合,其中所述的集合在玉米遺傳譜圖中具有少 于10cM的平均密度;和(b) 將所述SNP集合內(nèi)的SNP的存在或缺失與所述性狀關(guān)聯(lián),其 中所述的SNP與權(quán)利要求1的基因座連鎖。
21. 權(quán)利要求20的方法,其中所述的多態(tài)性用于鑒定各個玉米染 色體中的一系列相鄰的長度高達(dá)10厘摩的基因組窗口中的多個單倍型。
22. 權(quán)利要求21的方法,其中性狀值針對各個所述的單倍型進(jìn)行計算。
23. 權(quán)利要求22的方法,其中所述的性狀值鑒定性狀,所述性狀 選自產(chǎn)量,倒伏,成熟期,植抹高度,疾病抗性,或作為多重性狀指數(shù)的性狀組合。
24. —種對玉米植物育種方法,包括步驟(a) 針對至少兩種玉米植物的育種群體鑒定至少兩個高達(dá)10厘 摩的基因組窗口中的至少兩個單倍型的性狀值;(b) 在所述育種群體中對兩種玉米植物育種,以產(chǎn)生后代種子群體;(c )鑒定所述后代種子中的各個所述窗口中的多態(tài)性的等位基因狀態(tài),以確定所述單倍型的存在;(d)選擇具有針對所述后代種子中的確定的單倍型而鑒定的較高 性狀值的后代種子。
25. 權(quán)利要求24的方法,其中對基本覆蓋各個染色體的全部的各 個相鄰的基因組窗口中的至少兩個單倍型鑒定性狀值。
26. 權(quán)利要求25的方法,針對各個染色體中高達(dá)IO厘摩的基因組 窗口中的單倍型就較高的產(chǎn)量性狀值選擇后代種子。
27. 權(quán)利要求25的方法,其中所述的性狀值針對產(chǎn)量性狀并且對 各個窗口中的單倍型排列性狀值;并且其中選擇后代種子,所述的后代 種子在窗口中的產(chǎn)量性狀值高于所述窗口中的平均產(chǎn)量性狀值。
28. 權(quán)利要求25的方法,其中所述單倍型中的所述的多態(tài)性在表1中。
29. 權(quán)利要求25的方法,其中所述單倍型中的所述的多態(tài)性在DNA 序列的組中,所述DM序列的組包含SEQ ID NO: 1至SEQ ID NO: 25043 的所有DNA序列。
全文摘要
多態(tài)性玉米DNA基因座用于至少兩個玉米品種之間的基因分型。所述基因座序列用于設(shè)計檢測玉米DNA中的多態(tài)性的引物和探針寡核苷酸。多態(tài)性用于玉米中的基因分型應(yīng)用。多態(tài)性標(biāo)記用于建立標(biāo)記/性狀關(guān)聯(lián),例如在連鎖不平衡定位和關(guān)聯(lián)研究,定位克隆和轉(zhuǎn)基因應(yīng)用,標(biāo)記輔助育種和標(biāo)記輔助選擇,雜種預(yù)測和遺傳同一性研究中。多態(tài)性標(biāo)記還用于定位DNA克隆的文庫,例如用于與多態(tài)性連鎖的玉米QTL和基因。
文檔編號C07H19/00GK101687898SQ200780030192
公開日2010年3月31日 申請日期2007年8月9日 優(yōu)先權(quán)日2006年8月14日
發(fā)明者A·古普塔, C·勞里, D·比特呂耶, D·約翰遜, J·布爾, M·愛德華茲, S·伊錫頓 申請人:孟山都技術(shù)有限責(zé)任公司