專利名稱:通過表達嘌呤二氫吲哚蛋白修飾谷類籽粒硬度的制作方法
背景技術:
谷類,包括小麥(Triticum aestivum L.em Thell.),是世界上最重要的糧食作物。除了用于飼喂家畜外,在幾乎每一種文化中,谷類籽粒都被磨成面粉。小麥面粉被發(fā)現(xiàn)在世界上廣泛使用但特別在歐洲及北美使用,水稻粉廣泛用于亞洲,高粱粉用于非洲,而玉米粉(或玉米片)用于美洲。
谷類植物籽粒在種間及種內有變化。谷粒結構指核仁(穎果)的結構,也就是說,胚乳在物理上是柔軟還是堅硬。通常地,水稻,高粱,大麥及玉米是堅硬結構的籽粒而燕麥,黑麥及黑小麥是柔軟的。幾乎世界上全部的小麥生產及貿易(分別約550及100mmt每年)以柔軟或者堅硬來鑒定。一般來說,硬質小麥用于制作面包而軟質小麥用于制作餅干,蛋糕及糕點(Morris & Rose,谷粒品質,Chapman & Hall,紐約,NY,3-54頁(1996))。非常堅硬的硬質小麥(T.turgidum)通常用于食用面糊。
除在味道及水吸收方面的不同外,谷粒結構也支配著磨制技術。典型地,谷粒愈硬,磨制時亦需要愈多能量,在磨制過程中淀粉損失越多,磨制后的顆粒大小越大。
一種負責谷粒柔軟的15kDa標記蛋白,稱作friabilin,在軟質小麥水洗后的淀粉(water-washed starch)表面大量存在,在硬質小麥淀粉中小量存在,在堅硬小麥淀粉中(durum wheat starch)不存在(Greenwell& Schofield,谷類化學,63:379-380(1986))。對friabilin N-末端序列分析表明其為兩或更多獨立的多肽組成的混合物(Morris等,谷類科學雜志,21:167-174(1994);和Jolly等,遺傳學理論及應用,86:589-597(1993))。已發(fā)現(xiàn)兩個主要成份多肽與兩個分別稱作嘌呤二氫吲哚A(puro A)及嘌呤二氫吲哚B(puro B)的脂結合蛋白相同(Gantier等,植物分子生物學,25:43-57(1994))。puro A及puroB的轉錄物由染色體5D控制(Giroux & Morris,遺傳學理論及應用,95:857-864(1997))。
puro A及puro B在植物蛋白中是獨特的,因為它們富含色氨酸,親脂的疏水結構域(Blochet等,Gluten proteins 1990,Bushuk & Tkachuk(編),美國谷類化學家協(xié)會,St.Paul,MN,314-325頁(1991);及Wilde等,農業(yè)研究,20:971(1993))。friabilin(puro A及puro B)與淀粉顆粒表面的聯(lián)系明顯地通過極性脂類介導。事實上,膜結構脂類,糖脂及磷脂在水洗淀粉表面的出現(xiàn)與friabilin一樣(Greenblatt等,谷類化學,72:172-176(1995))在軟質小麥淀粉中存在量很高,硬質小麥淀粉中存在數(shù)量低,在堅硬小麥淀粉中不存在。
存在的需求是比通過雜交育種獲得更確定地獲得對谷類植物籽粒結構的修飾。雜交育種時,有可能親本植物是生殖不相容的。也有這種非常真實的可能性,即為產生一種雜交植物,需要大量的水,化肥及大面積土地。通過用改變谷粒結構的核酸序列創(chuàng)造轉基因植物,這些問題就能夠避免。本發(fā)明滿足了這種及其它需要。
發(fā)明簡述本發(fā)明鑒定了在小麥(Triticum aestivum)中作為籽粒柔軟度主要成份的puro A及puro B。本發(fā)明也提供向小麥及其它谷類植物中引入嘌呤二氫吲哚基因(puroindoline gene)及其同源基因修飾谷粒結構的方法。
在一個優(yōu)選的實施方案中,提供一種從至少一個具有硬質結構籽粒的親本植物產生具有更軟結構籽粒的轉基因植物的方法。該方法包括引入一種核酸序列的步驟,核酸序列能在嚴格的條件下與從由SEQ IDNO:1及SEQ ID NO:3組成的組中選擇出的核酸序列雜交,并且可操作地編碼進入親本植物細胞中的嘌呤二氫吲哚蛋白,從含有該核酸序列的細胞產生植株。在一個更優(yōu)選的實施方案中,該植物從由硬質小麥(durum wheat),高粱,水稻,大麥及玉米組成的組中選出。在一個最優(yōu)選的實施方案中,該植物是玉米。在一個優(yōu)選的實施方案中,核酸導入由農桿菌屬(Agrobacterium)感染介導。也是在該實施方案中,嘌呤二氫吲哚蛋白從由puro A及puro B組成的組中選出是優(yōu)選的。
本發(fā)明的另一個實施方案提供了產生具有硬質結構籽粒的轉基因植物的方法,其中該植物來自具有軟結構籽粒的至少一個親本植物。該方法包含引入阻止嘌呤二氫吲哚蛋白或同系物表達進親本植物細胞的核酸序列并從該細胞產生植株的步驟。在該實施方案特別優(yōu)選的方面,此植物從由小麥,黑麥,黑小麥及燕麥組成的組中選出。
在該實施方案的另一個優(yōu)選的方面是向細胞中引入核酸序列并通過可操作地編碼核酶來阻抑puro A或puro B的表達。在一個更優(yōu)選的實施方案中,核酸序列可操作地編碼在嚴格條件下能與SEQ ID NO:1或SEQ ID NO:3互補的核酸序列雜交的反義核酸。依賴于谷類植物,核酸能可操作地編碼一種轉座子。本發(fā)明的另一方面,核酸序列通過農桿菌感染引入植物中。
本發(fā)明的另一個實施方案中,提供了一種產生具有硬質結構籽粒的轉基因植物的方法,其中該植物來源于至少一個具有軟質結構籽粒的親本植物。此方法包含向親本植物細胞中引入核酸序列的步驟,其中,該核酸序列能夠在嚴格的條件下與SEQ ID NO:5所示的核酸序列雜交并且從該細胞產生植株。在一種更優(yōu)選的實施方案中,此植物從由小麥、黑麥、黑小麥及燕麥組成的組中選出。在這個實施方案的一個優(yōu)選方面,核酸序列通過農桿菌屬(Agrobacterium)感染引入植物中。
在另一個實施方案中,提供一種具有軟質結構籽粒的轉基因植物。此植物來源于至少一種具有硬質結構籽粒的親本植物。該植物包含一種可操作地編碼嘌呤二氫吲哚蛋白的核酸序列,其中該核酸序列能在嚴格的條件下與從由SEQ ID NO:1及SEQ ID NO:3組成的組中選出的核酸序列雜交。在一種更優(yōu)選的實施方案中,該植物從由堅硬小麥(durumwheat),高粱,水稻,大麥及玉米組成的組中選出。在一種特別優(yōu)選的實施方案中,該植物是玉米。
在這個實施方案中,嘌呤二氫吲哚(puroindoline)核酸序列通過轉化引入植物并且嘌呤二氫吲哚蛋白從由puro A及puro B組成的組中選出。在一種特別優(yōu)選的實施方案中,轉化通過農桿菌屬感染完成。
在本發(fā)明的又一個實施方案中,提供一種具有硬質結構籽粒的轉基因植物。此植物從至少一種具有軟質結構籽粒且包含一種阻止嘌呤二氫吲哚蛋白表達的核酸序列的親本而得來。在該實施方案的一個特別優(yōu)選的方面,子代植物從由小麥,黑麥,黑小麥及燕麥組成的組中選出。
本實施方案的一個優(yōu)選方面,核酸序列被引入一種小麥細胞中并通過可操作地編碼一種核酶或轉座子以阻止puro A或puro B的表達。然而,此核酸序列可操作地編碼一種能與SEQ ID NO:1或SEQ ID NO:3互補的序列雜交的反義核酸是優(yōu)選的。在一種特別優(yōu)選的實施方案中,核酸序列通過農桿菌屬感染引入植物。
在另一個實施方案中,本發(fā)明提供一種具有硬質籽粒的轉基因植物,它來源于至少一個軟質籽粒的親本。該植物包含在嚴格條件下能與由SEQ ID NO:5組成的組中選出的核酸序列雜交的核酸序列。
圖2A是83硬/軟染色體5D重組體及親本SKCS單谷粒硬度讀數(shù)頻率分布直方圖,“Chinese spring”(CS)及“Chinese spring”替代Cheyenne5D(CS(CNN5D))。讀數(shù)為每兩個位點的兩份的平均數(shù)。親代CS及CS(CNN5D)的值分別為60及79。圖2B圖示反映了SKCS單谷粒相對NIR硬度讀數(shù)。重組體根據(jù)puro B序列類型分類,其中(+)表示柔軟類型親本CS的甘氨酸序列類型,(●)表示堅硬類型親本CS取代的Cheyenne 5D的絲氨酸序列類型。
圖3示淀粉表面friabilin相對數(shù)量,以軟質籽粒親本“CS”的軟/硬重組體對NIR硬度的百分率表示。重組體根據(jù)puro b序列類型分類,其中(+)表示柔軟類型親本CS的甘氨酸序列類型,(●)表示堅硬類型親本CS(CNN5D)的絲氨酸序列類型。
定義除非另有說明,這里所用的所有技術及科學術語都具有本發(fā)明所屬的領域內的技術人員所通常理解的意義。以下文獻給技術人員提供一種用于本發(fā)明中的許多術語的通用定義Singleton等,Dictionary ofMicrobiology and Molecular Biology(微生物學與分子生物學詞典)(第二版,1994年);劍橋科學與技術詞典(Walker編,1988);The Glossaryof Genetics(遺傳學專用詞匯詞典),5Th ED,(第五版),Rieger,R等編,Springer Verlag(1991);以及Hale & Marham,The Harper CollinsDictionary of Biology(1991)(Harper Collins生物學詞典)。象這里所用的,如果沒有以另外的形式特殊說明,以下術語都具有歸屬于所述的意義。
術語“細胞”指植物中的任何細胞,包括但不限于體細胞,配子或胚?!芭摺敝冈陂_始萌發(fā)之前的孢子體植物。胚可以通過有性雜交或自雜交由配子受精而形成?!坝行噪s交”是指一種植物被另外植物受粉的過程?!白越弧笔侵竿ㄟ^自花受粉形成種子,也就是,花粉及胚珠來源于同一植株。術語“回交”指F1代雜種植株與任一親本雜交。典型地,回交用于轉移賦予一種簡單遺傳的,高度可遺傳的性狀基因進入近交系。術語近交系指回歸親本。期望性狀來源是供體親本。供體與回歸親本有性雜交后,具有供體親本期望性狀的F1代雜種植株被選出并與回歸親本或自交系重復雜交(也就是回交)。
胚也能夠由“胚體細胞發(fā)生”及“克隆”形成。體細胞胚發(fā)生指直接或間接地從植物細胞,組織及器官產生胚。間接體細胞胚發(fā)生的特征在于長成一塊愈傷組織并在愈傷組織表面形成胚。直接體細胞胚發(fā)生是指在不干擾愈傷組織階段的條件下,從外植體組織的單一細胞或細胞群形成無性胚。因為從愈傷組織得到的植株易于產生畸形,直接體細胞胚發(fā)生是優(yōu)選的。
短語“籽粒結構”指用于銷售的小麥的主要分類基礎。常用術語,“籽粒”是存在于植物胚珠的胚乳。在小麥中,籽?;蚺呷榻Y構由硬質基因(Hardness gene)的表達來區(qū)分。然而,所有谷類籽粒都能在籽粒結構基礎上分類。在高粱及玉米中,軟柔軟的胚乳由于基因如opaque-2及floury-2突變形成。盡管,這些突變基因的表達是隱性的并導致其它的,有害的表型如對機械及害蟲損傷更大的易感性。
“較軟結構籽?!?Softer textured grain)指通過用Perten SKCS4100(Perten Instruments,Reno,NV)測量;通過如方法39-70所述的近紅外反射分光術(NIR)測量(美國谷類化學家協(xié)會批準方法,第9版,美國谷類化學家協(xié)會,St.Paul,MN(1995));或通過相當技術測量,由后代或轉基因植物產生的籽粒比至少其一個親本產生的籽粒低10個單位。在一個更優(yōu)選的實施方案中,后代或轉基因植物的籽粒比至少其一個親本籽粒低至少20個單位。在一個最優(yōu)選的實施方案中,后代或轉基因植物的籽粒比親本籽粒低至少40個單位。然而,因為籽粒硬度是一種數(shù)量性狀,技術人員將認識到籽粒硬度部分地由后代或轉基因植物及親本植物生長的環(huán)境條件決定。
“較硬結構籽?!?harder textured grain)指通過用上述技術測量,由后代植株產生的籽粒比至少一個后代植物親本產生的籽粒大10個單位。在一個更優(yōu)選的實施方案中,后代或轉基因植物的籽粒比至少一個親本籽粒大至少20個單位。在一個最優(yōu)選的實施方案中,后代或轉基因植物的籽粒比親本籽粒大至少40個單位。
短語“在嚴格的條件下雜交”指由二條單鏈核酸形成雙鏈雙螺旋。雙鏈區(qū)可包括一或二條單鏈核酸的全長,或一單鏈核酸的全部及另一單鏈核酸的亞序列或雙鏈區(qū)域可包括每一核酸的亞序列。一本廣博的用于核酸雜交的通用指南參見Tijssen,生物化學及分子生物學實驗技術-用核酸探針雜交Ⅰ及Ⅱ部分,Elsevier,New York,(1993)。通常地,嚴格條件被選擇為在一確定的離子強度及pH下對特定核酸序列比其熱熔點Tm值低約5℃。Tm是指(在確定離子強度及pH下)有50%目標序列與一完全匹配的探針雜交的溫度。高度嚴格的條件被選擇為對一特異探針等于Tm值。有時術語“Td”被用于定義至少一半的探針從一完全匹配的目標核酸上解離時的溫度。不管怎樣,一種用于判斷Tm或Td的評估技術種類是可以得到的,并概略地在Tijssen,出處同上中描述。典型地,估計在雙螺旋中的G-C堿基對對Tm值的貢獻約為3℃,而A-T堿基對約為2℃,達到約80-100℃的理論最大值。然而,更精確的Tm及Td模型是可以得到并適合的,其中考慮進入G-C累積的相互作用,溶劑影響,所需試驗溫度及其它因素等。在一實施例中,PCR引物被設計為其有約60℃的解離溫度(Td),用公式Td=(((((3×#GC)+(2×# AT))×37)-562)/# bp)-5計算所得;其中#GC,#AT及#bp分別表示包含于退火引物與模板DNA中的G-C堿基對數(shù)量,A-T堿基對數(shù)量,總堿基對數(shù)量。
一種用于具有100個以上互補堿基的互補核酸在濾膜上進行Southern或Northern雜交的嚴格雜交條件的實施例為在42℃下,50%甲醛水溶液(formalin)及1mg(毫克)肝素(heparin)中雜交過夜進行。一種用于這樣核酸的Southern印跡嚴格洗滌條件的例子為在65℃下,用0.2×SSC洗15分鐘(見Sambrook等,分子克隆-實驗室手冊(第2版)1-3卷。冷泉港實驗室,冷泉港出版社,NY(紐約)1989(Sambrook),對SSC緩沖液的描述)。通常在高嚴格洗滌前用低嚴格洗滌條件洗滌以除去背景探針信號。一種低嚴格洗滌條件的實施例為40℃下2×SSC洗滌15分鐘。
通常,信號與干擾的比率是用無關探針在該特定雜交分析中所得信號的2倍或比之更高,說明檢測到了特異雜交。對于高度特異性雜交策略,如等位基因-特異雜交,一種等位基因-特異探針通常與包含多態(tài)性核苷酸的標記核酸(例如,一種基因組核酸或類似物)在高度嚴格條件下雜交。
短語“引入一種核酸序列”指通過重組手段引入核酸序列,包括但不限于,農桿菌屬-介導的轉化,基因槍法(biolistic methods),電穿孔,用于植物技術中,等等。術語“核酸”是與DNA,RNA及多聚核苷酸同義的。這樣一種含有該核酸序列的植物這里指R1代植物。R1代植物也可以通過已被引入該核酸序列植物的克隆,有性雜交或自交產生。
“轉基因植物”是通過重組技術已經引入核酸序列的植物,例如,含有核酸的載體。載體是一種核酸組合物,它能轉導,轉化或感染細胞,由此引起此細胞表達載體-編碼的核酸及任選的不是此細胞天然的蛋白,或者以一種非該細胞天然的方式表達蛋白。載體包括被細胞表達的核酸(通常為RNA或DNA)。載體任選地包括幫助核酸能夠進入細胞的材料,例如,逆轉錄病毒粒子,脂質體,蛋白包被或其它等。載體含有允許它們在細菌或其它非植物有機體中繁殖及選擇的核酸序列。對于載體及分子生物學技術的描述,見Current Protocols in MolecularBiology(分子生物學現(xiàn)代方法),Ausubel等,(編),現(xiàn)代方法,a jointventure between Greene Publishing Associates,Inc.and John Wiley &Sons,Inc.,(全刊及包括1998年增刊)(Ausubel)。
短語“表達盒”指在載體上被轉錄及一啟動子指導該轉錄的一段核酸序列?!皢幼印笔侵笇Ш怂徂D錄的一段核酸控制序列。象這里所用的,一個啟動子包括臨近轉錄起始位點的必需核酸序列,如,就多聚酶Ⅱ類型(polymeraseⅡ)啟動子來說,為一TATA元件。啟動子也任選地包括可以定位于遠離轉錄起點幾千堿基對部位處的遠側增強子或阻遇物元件。啟動子可以或者是同源的,即,自然存在地指導目的核酸表達或異源的,即自然存在地指導從非目的核酸的基因來源的核酸表達。具有異源啟動子序列的融合基因是可取的,例如,用于調節(jié)編碼蛋白的表達。一種“組成型”啟動子是一種在大多數(shù)環(huán)境及發(fā)育條件下,在選擇的有機體組織中有活性的啟動子。一種“可誘導的”啟動子是一種在選擇的有機體中,在環(huán)境及發(fā)育條件調控下的啟動子。
短語“可操作地編碼”指在一種啟動子及一種二級核酸序列間的功能連鎖,其中啟動子序列起動該二級序列相應的RNA的轉錄。
短語“阻止一種嘌呤二氫吲哚蛋白的表達”指一植物細胞中嘌呤二氫吲哚蛋白的合成的抑制。抑制可以或者在轉錄水平,也就是,相應mRNA合成階段,或者翻譯水平,也就是蛋白質合成階段。本發(fā)明的目的,阻止嘌呤二氫吲哚蛋白表達通過引入阻抑mRNA或蛋白質合成的核酸序列來完成。該核酸可編碼阻抑嘌呤二氫吲哚基因表達的mRNA轉錄本并提供一硬質結構籽粒。例如,顯示了反義RNA抑制基因表達,見,如,Sheehy等,美國科學院院報,85:8805-8809(1998),及美國專利4801340號。有義抑制(Sense suppression)也被用于調節(jié)內源基因的表達,見,Napoli等,植物細胞2:279-289(1990)及美國專利5034323號。
反義技術包含從目的嘌呤二氫吲哚基因克隆核酸片段并可操作地連接進入一啟動子下,結果轉錄出RNA反義鏈(或互補鏈)。該構建物接著轉化進入植物,RNA反義鏈由此形成。
通常被引入的核酸片段將是與嘌呤二氫吲哚蛋白基因或需抑制的基因的至少一部分基本相同。然而,該序列不需要完全相同來抑制表達。引入的序列,相對于或初級轉錄物或完全加工的mRNA,也不需是全長。通常地,較高同源性可以用于彌補應用較短序列的不足。此外,引入的序列不需要同樣的內含子或外顯子形式,非編碼片段的同源物可以同樣有效。正常地,在約30或40核苷酸到約2000核苷酸間的序列長度是可以應用的,盡管至少約100核苷酸長度的序列是優(yōu)選的,至少約200核苷酸長度的序列是更優(yōu)選的,至少約500核苷酸長度的序列是特別優(yōu)選的。
起催化作用的RNA分子或核酶也能用于抑制基因表達。設計特異與事實上任何目標RNA配對并在特異位點斷裂磷酸二醋骨架是可能的,由此功能性地滅活目標RNA。在完成這種斷裂中,它是一種真正的酶。反義RNA內包含的核酶序列賦予其RNA-斷裂活性,由此提高構建體的活性。目標RNA特異核酶的一般設計及應用在Haseloff等,自然334:585-591(1988)中已描述。
“轉座子”指具有移動或跳躍到基因組內新的座位去的能力的DNA序列。轉座子需要兩種成份催化轉位的轉座酶及位于轉座子末端保證酶發(fā)揮功能的核苷酸序列。轉座子是既自主又非自主的。自主性轉座子是既能夠轉位又能催化非自主元件轉位的轉座子。自主性轉座子的例子為從玉米中分離出的Ac元件及Spm轉座子,以上所有都已被克隆并在本領域內深入描述,見,如,美國專利4732856號及Gierl等,植物分子生物學13:261-266(1989)。
自主性轉座子包含轉座酶所需序列及在轉座子末端被轉座酶識別的序列(“Ds元件”)。轉座酶所需序列(或轉座酶基因)是末端序列非依賴活化的,也就是,如果末端序列被刪除,轉座酶基因活性仍然保留,并且酶編碼元件可以用于與一非自主性轉座子或Ds元件連接以引發(fā)Ds元件轉位。轉座酶基因在Ts101及Ts105元件中是明顯的。
在轉座酶基因存在時,僅僅存在于非自主元件末端的DNA序列對其轉座活性是需要的。這些末端在這里指“轉座子末端”或“Ds元件”。見,如Coupland等,美國科學院院報86:9385(1989),其中描述了轉座必需的序列。轉座子末端內部的DNA序列是非必需的并且能包含從事實上任何來源的序列,包括外源突變的嘌呤二氫吲哚核酸序列。因此,當轉座子插入一基因組時,正確的核酸序列被切除并被突變序列替換。因為該序列內的突變,植物產生的嘌呤二氫吲哚蛋白將含有一種突變或如果插入一終止密碼將是截短的形式。
術語“后代”指一特別植物(自交)或一對植物(雜交或回交)的后代。后代可以是F1,F2,或任何隨后產生的后代。典型地,雙親是花粉供體及胚珠供體,本發(fā)明中它們通過雜交產生后代植株。雙親也指本發(fā)明中一種雜交植物的F1親本(F2植株)。最終,親本指與本發(fā)明中的雜種植物回交以產生另一種本發(fā)明中的雜種植物的一種回歸親本。
短語“產生一種轉基因植物”指形成一種本發(fā)明中的植物。該植物通過重組技術產生,也就是,克隆,體細胞胚胎發(fā)生或任何其它本領域中技術人員所應用產生植物的技術。
本發(fā)明全過程中所使用的植物的常見名稱指下述屬的植物品種
短語“嘌呤二氫吲哚蛋白”指一類蛋白,包括但不限于“puro A”,或“puro B”。puro A及puro B是富含色氨酸的疏水結構域,它具有親脂性(Bloehet等,Gluten Proteins 1990,Bushak & Tkachuk(編),美國谷類化學家協(xié)會,St.Paul,MN(1991);及Wilde等,農業(yè)研究20:971(1993))。除了在小麥中發(fā)現(xiàn)的嘌呤二氫吲哚蛋白外,用于本發(fā)明中,它也指嘌呤二氫吲哚同源物。同源物指具有同源功能的蛋白質,也就是,影響籽粒結構,例如,來源于燕麥的燕麥蛋白(Avenin)。同源物也指核酸序列或氨基酸序列同源物。
“核酸序列同源物”指脫氧核糖核苷酸或核糖核苷酸及聚合物其中以或者單或雙鏈形式,含有天然核苷酸的已知相似物,它具有與對照核酸相似的結合特性并與天然形成的核苷酸以相似方式新陳代謝。
如果沒有其它指明,特別核酸序列其中也暗含保守地修飾的變異體(例如簡并密碼替換)及互補序列,以及明確指明的序列。特別地,簡并密碼替換可通過產生序列達到,其中一或多個選出的密碼(或全部)第三位置用混合堿基和/或脫氧次黃苷殘基替換(Batzer等,核酸研究19:5081(1991);Ohtsuka等,生物學化學雜志260:2605-2608(1985);及Rossolini等,分子細胞探針8:91-98(1994))。術語核酸與基因,cDNA,及基因編碼的mRNA互換使用。
術語“氨基酸序列同源物”指具有相似氨基酸序列的蛋白質。技術人員會認識到決定性的氨基酸序列位于蛋白質的功能結構域內。這樣,對于一種同源蛋白質具有對全長氨基酸序列不超過40%同源性但在一功能結構域內多于90%同源性是可能的。除了自然形成的氨基酸外,同源物也包括其中一個或多個氨基酸殘基是相應于一種天然形成的氨基酸,以及天然形成的蛋白質的人工化學合成的類似物。
這里所說的氨基酸殘基指或者它們被普遍知道的三字母符號或者是由IUPAC-IUB生物化學命名委員會推薦的單字母符號。核苷酸,同樣地,也稱為被普遍接受的單字母符號。
“保守地修飾的變異體”對氨基酸及核酸序列都適用。對于具體的核酸序列,保守地修飾的變異體指那些編碼相同或基本相同氨基酸序列的核酸,或核酸并不編碼氨基酸序列的那些核酸或指基本上相同的序列。因為遺傳密碼的簡并性,大量功能上相同的核酸編碼任何指定的蛋白質。例如,密碼子GCA,GCC,GCG及GCU都編碼丙氨酸。這樣,在任何丙氨酸被一密碼子確定的位置上,該密碼子可以被改變成任何一個上述的相應密碼子而不改變所編碼的多肽。這樣的核酸突變稱為“沉默突變”,它是一種保守地修飾的變異體。這里編碼一種多肽的任何核酸序列也描述該核酸每一可能的沉默突變。技術人員將認識到核酸上的每一密碼子(除AUG外,它是編碼Met的唯一密碼子)都能被修飾以產生一功能上相同的分子。相應地,一種編碼多肽的核酸的每一沉默突變都暗含在每一所描述的序列中。
至于氨基酸序列,技術人員將認識到對一核酸,肽,多肽的個別替換,缺失或增加或者蛋白序列改變,增加或缺失單一氨基酸或在編碼區(qū)序列中很小百分比的氨基酸是一種“保守地修飾的變異體”,其中改變導致一氨基酸被一化學上相似的氨基酸替換。保守替換提供功能上相似氨基酸為本領域所熟知。
下述六組,每一組含有的氨基酸都可以互相間保守替換1)丙氨酸(A),絲氨酸(S),蘇氨酸(T);
2)天冬氨酸(D),谷氨酸(E);3)天冬酰胺(N),谷氨酰胺(E);4)精氨酸(R),賴氨酸(K);5)異亮氨酸(I),亮氨酸(L),蛋氨酸(M),纈氨酸(V);及6)苯丙氨酸(F),酪氨酸(Y),色氨酸(W)。
(見,如,creighton,蛋白質(1984))。
術語“轉化”指通過分子生物學家所應用的各種技術將核酸引入植物培養(yǎng)物或者植物器官的植物細胞中。例如,核酸可以通過使用諸如電穿孔及顯微注射植物細胞原生質體的技術直接引入植物細胞基因組DNA,或DNA構建物可以用生物導彈方法直接引入植物細胞,如DNA微粒轟擊??蛇x擇地,DNA構建物與適宜的T-DNA側翼區(qū)結合并引入一常見的根癌農桿菌(Agrobacterium tumefaciens)宿主載體中。當細胞被該細菌感染時,根癌農桿菌宿主的毒性功能指導構建物及相鄰標記插入植物細胞DNA中。
顯微注射技術為本領域所熟知并在科學及專利文獻中已有很好的描述。用聚乙二醇沉淀引入DNA構建體在Paszkowski等,EMBO J.3:2717(1984)中已有描述。電穿孔技術在Fromm等,美國科學院院報82:5824(1985)中描述。導彈轉化技術在Klein等,自然327:70-73(1987)中描述。
根癌農桿菌介導的轉化技術,包括雙元載體的卸載和使用,也在科技綜述中有很好的描述。見例如,Horsch等,科學233:496-498(1984)及Fraley等,美國科學院院報80:4803(1983)。發(fā)明詳述本發(fā)明涉及植物嘌呤二氫吲哚基因,尤其是小麥puro A及puro B基因。來源于嘌呤二氫吲哚基因的核酸序列可用于修飾轉基因谷類植物及后代谷類植物的籽粒結構。本發(fā)明的嘌呤二氫吲哚基因可以在通常用于生產淀粉,食品和/或飼料的谷類品種中表達,例如小麥,黑麥,燕麥,玉米等。通過加入嘌呤二氫吲哚基因到谷類植物基因組中,該植物籽粒變得比其親本籽粒結構更柔軟。通過阻抑嘌呤二氫吲哚基因表達,籽粒會比其親本谷類籽粒變得更堅硬。另外,因為籽粒結構的定量特性,引入嘌呤二氫吲哚基因的突變形式影響谷類植物籽粒結構的修飾。
一般地,下述的在植物維持及育種以及重組DNA技術中使用的專門名詞及實驗程序在本領域中廣泛了解并普遍運用。標準的技術用于克隆,DNA及RNA分離,擴增及純化。通常涉及DNA連接酶,DNA多聚酶,限制性內切酶等的酶反應根據(jù)廠商的說明進行。這些技術及其它各種技術一般根據(jù)下述文獻進行Sambrook等,Molecular Cloning-ALaboratory Manual(分子克隆-實驗室手冊),Cold Spring HarborLaboratory(冷泉港實驗室),冷泉港,紐約(1989)及Dodds & Roberts,Experiments in Plant Tissue Culture(植物組織培養(yǎng)實驗)3RD ED,(第三版)Cambridge University Press(劍橋大學出版社)(1995)。Ⅰ.嘌呤二氫吲哚蛋白及基因小麥籽粒結構的不同是由于一個主要基因的表達所引起,該基因鑒定為Hardness(Ha)(Symes,澳大利亞農業(yè)研究雜志16:113-123(1965);及Baker,農作物科學17:960-962(1977)),它定位于染色體5D短臂上(Mattern等,Proceedings of the 4thInternationalWheat Genetics Symposium(第4屆國際小麥遺傳研討會會刊),Missouri大學,Columbia,MO.,第703-707頁(1973)及Law等,用核技術改良種子蛋白(Seed Protein Improvement By Nuclear Techniques),國際原子能機構,奧地利維也納,第483-502頁(1978))。
單一主要基因的存在與小麥(T.aestivum)異源六倍體(2n=6x=42條染色體,基因組AABBDD)的性質是矛盾的,因為許多基因以三份同源體存在,每份來源于一個基因組。Ha等位基因定位于六倍體小麥5A及5B染色體但不表達。由于這一原因,缺少D基因組的堅硬小麥(T.turgidum L.var.durum)(2n=4x=28染色體,基因組AABB)通常比硬質六倍體小麥結構更堅硬。
小麥嘌呤二氫吲哚蛋白是在種子胚乳中發(fā)現(xiàn)的,半胱氨酸及色氨酸豐富的脂結合蛋白。成熟的嘌呤二氫吲哚蛋白A及嘌呤二氫吲哚蛋白B長148個氨基酸,分子量分別為16,792及16,387 Dal(道爾頓)。(Gautier等,植物分子生物25:43(1994))。它們具有55%的氨基酸同源性并表現(xiàn)出很強的堿性,兩蛋白的pI點都大于10。
研究表明嘌呤二氫吲哚A及嘌呤二氫吲哚B必須都表達方能賦予小麥軟質特性。puro B的色氨酸豐富區(qū)一個甘氨酸(Gly)向絲氨酸(Ser)的變化(Gly-46變成Ser-46)已經在兩個硬質小麥品種中報道(Giroux& Morris,遺傳學理論及應用95:857-864(1997))。見SEQ ID NO:5。該序列變化與籽粒硬度緊密連鎖并能減輕脂結合強度。因為甘氨酸向絲氨酸的變化引起的內在疏水性的減弱(Thorgeirsson等,生物化學35:1803-1809(1996))。puro B中的該突變與83染色體5D重組取代體品系的硬籽粒結構間緊密連鎖暗示該蛋白包括在控制籽粒柔軟性中(Giroux & Morris,遺傳學理論及應用95:857-864(1997))。存在于puro B中的變化在兩不同硬質品種中是相同的并在兩軟質參考品種中是缺失的。該變化可以簡單表明在friabilin成份puro B及Ha基因間存在緊密連鎖。
任何已分離的嘌呤二氫吲哚或其同源基因都能在本發(fā)明中應用。使用的特殊的多聚核苷酸不是本發(fā)明的關鍵特征,只要在籽粒結構上實現(xiàn)所需變化。正如上所示,所有嘌呤吲哚蛋白都在Ha座位編碼。在六倍體小麥中,第五組染色體命名為5A、5B及5D。Ha座位發(fā)現(xiàn)于5D染色體上。因為4倍體堅硬小麥(Triticum turgidum)缺失D組染色體,Ha座位是缺失的并且堅硬小麥無一例外地是硬質的。
小麥嘌呤二氫吲哚基因已被克隆并在文獻中描述。例如,puro A及puro B兩者的cDNA都已經從Triticum aestivum半成熟種子cDNA文庫中分離并測序(Gautier等,植物分子生物學25:43(1994))。
其它嘌呤二氫吲哚或其同源基因的分離,包括無功能序列的同源物,可以通過很多技術完成。例如,在背景技術中揭示的以該序列為基礎的寡核苷酸探針,可以用于從cDNA或基因組DNA文庫中分離所需基因。構建基因組文庫,通過隨機斷裂例如用限制性內切酶,產生基因組DNA大片段,并與DNA載體連接以形成能夠包裝進適當載體中的串聯(lián)體。為制備cDNA文庫,從胚乳中分離mRNA,并從該mRNA制備含有嘌呤二氫吲哚基因轉錄本的cDNA文庫。
選擇地,感興趣的核酸可以用擴增技術從核酸樣品中擴增。例如,用多聚酶鏈式反應(PCR)技術從基因組DNA,cDNA,基因組文庫或cDNA文庫中直接擴增嘌呤二氫吲哚基因或相關基因的序列。PCR及其它體外擴增方法也可以是很有用的,例如克隆編碼蛋白的核酸序列用于表達,制備核酸用作探針以檢測樣品中目的mRNA的存在與否,用于核酸測序,或其它目的。對于PCR的綜述見,PCR方法方法及應用指南,Innis等(編),Academic Press,San Diego(1990)。
多聚核苷酸也可以通過所述技術文獻中的已知技術合成。見,如,Carruthers等,Cold Spring Harbor Symp.Quant.Biol.47:411-418(1982),及Adams等,J.Am.Chem.Soc.105:661(1983)。然后,雙鏈DNA片段可以通過或者合成互補鏈并在適當條件下與該鏈一起退火或用一適宜的引物通過用DNA多聚酶加入互補鏈來得到。
如這里所描述的已制備分離的序列可以再被用于修飾嘌呤二氫吲哚基因表達并由此修飾植物籽粒結構。技術人員將認識到該編碼功能性嘌呤二氫吲哚蛋白的核酸序列不需具有與這里揭示的例證基因相同的序列。這樣,編碼嵌合嘌呤二氫吲哚多肽的基因能應用于本發(fā)明中。
如上所示,嘌呤二氫吲哚多肽,象其它蛋白一樣,具有完成不同功能的不同結構域。因此,嘌呤二氫吲哚基因序列不需全長,只要該蛋白的目的功能結構域表達即可。嵌合的嘌呤二氫吲哚多肽可以容易地設計,如用本領域的技術人員所熟知的各種重組DNA技術。例如,該鏈通過氨基酸替代,添加,缺失等在一級結構水平從自然發(fā)生的序列上變化。特別地,半胱氨酸殘基可以添加,缺失或在多肽內移動以實現(xiàn)具有目的特性的修飾的嘌呤二氫吲哚多肽。嵌合多肽也可以通過融合兩或多個嘌呤二氫吲哚基因的編碼序列產生。所有這些修飾可以用于許多聯(lián)合形式中以產生最終修飾的蛋白鏈。Ⅱ.重組構建物的制備在本發(fā)明的一個實施方案中,為修飾植物籽粒結構,制備了含有分離的嘌呤二氫吲哚基因序列及適于轉化植物細胞的重組DNA載體。編碼目的嘌呤二氫吲哚多肽的DNA序列,例如編碼全長蛋白的cDNA或基因組序列,是可方便地用于構建一種能夠引入目的植物中的重組體表達盒。表達盒典型地含有該嘌呤二氫吲哚核酸序列可操作地與啟動子序列及其它轉錄及翻譯起始調控序列連接,這些調控序列將指導在轉化的植物目的組織(如胚乳)中從嘌呤二氫吲哚基因或其反義基因轉錄該序列。
例如,可以使用一種組成型植物啟動子片段,它將指導植物所有組織表達嘌呤二氫吲哚蛋白。這樣的啟動子在大多數(shù)環(huán)境條件和發(fā)育狀態(tài)或細胞分化過程中都是有活性的。組成型啟動子的例子包括花椰菜花葉病毒(CaMV)35S轉錄起始區(qū),來源于根癌農桿菌(Agrobacteriumtumefaciens)T-DNA上的1′-或2′啟動子,以及其它為技術人員所知道的各種植物基因的轉錄起始區(qū)。
選擇地,植物啟動子可以受環(huán)境控制。這里所指的這樣啟動稱作“可誘導的”啟動子。環(huán)境條件通過可誘導啟動子影響轉錄的實例包括病原體侵害,無氧條件或光的存在。
典型地,用于本發(fā)明中構建體的啟動子將是“組織-特異性的”并在發(fā)育控制下的,結果,目的基因僅僅在某一組織中表達,例如胚乳。指導在種子中表達的啟動子,尤其在胚乳中表達的啟動子是特別優(yōu)選的。這樣啟動子的實例包括來源于編碼種子貯藏蛋白基因的啟動子,例如napin,cruciferin,phaseolin等(見美國5,420,034號專利)。其它適用在谷類中表達嘌呤二氫吲哚基因的啟動子包括來源于編碼麥膠蛋白(gliadin)基因,谷類醇溶谷蛋白(prolamines)基因(例如,玉米醇溶蛋白(zein),大麥醇溶蛋白(hordein),黑麥堿(secalin)及燕麥蛋白(avenin))及淀粉生物合成酶基因的啟動子。
來源于嘌呤二氫吲哚基因的內源啟動子在指導嘌呤二氫吲哚基因在種子中表達,尤其胚乳中表達特別有用。這些種子特異性啟動子也能用于指導異源結構基因表達。這樣該啟動子也能用于重組表達盒以驅動任何期望在種子中表達的基因進行表達。這些實例包括編碼對提高種子營養(yǎng)價值有用的蛋白質的基因(例如編碼在脂,蛋白及碳水化合物或淀粉生物合成中涉及的蛋白質的基因)。其它基因,包括那些編碼藥用上有用的化合物的基因,以及編碼植物對真菌或其它種子感染有抵抗作用產物的基因。
嘌呤二氫吲哚基因啟動子也能夠用于起動抑制內源性嘌呤二氫吲哚基因表達的mRNA分子的轉錄。在植物中用重組DNA技術抑制基因表達的手段是為人們所熟知的。例如,反義技術可以方便地使用。見,例如,Sheedy等,美國科學院院報85:8805-8809(1988),及美國專利4,801,340號。催化性RNA分子或核酶也能用于抑制胚乳-特異性基因的表達。設計及運用靶RNA-特異的核酶在Haseloff等,自然334:585-591(1988)中已有描述。在有義方向引入核酸構型(configured)來阻止目標基因轉錄也已證明是一種有效手段。用有義抑制調節(jié)基因表達的一個應用實例見,Napoli等,植物細胞2:279-289(1990)及美國專利5,034,323號,5,231,020號及5,283,184號。
本發(fā)明的嘌呤二氫吲哚啟動子典型地長至少400堿基對,并通常至少約800bp或1000bp。該啟動子長度典型地少于約3500bp,通常少于約2800bp,并經常少于約2000bp。啟動子長度從天然基因翻譯起始密碼子上游計數(shù)。技術人員將認識到應用“大約”來表達核酸片段長度意指包括與這里所述及的長度變化不大且維持所述啟動子功能(也就是,種子-特異基因表達)的各種長度的片段。
確定嘌呤二氫吲哚啟動子,基因組嘌呤二氫吲哚基因克隆的5′部分用于分析啟動子序列的序列特征。例如,啟動子序列元件包括TATA盒共有序列(TATAAT),它通常位于轉錄起始位點上游20到30bp處。在植物中,在TATA盒(TATA box)上游更遠的地方,在-80到-100bp位置處,有一典型的啟動子元件,它有一系列的腺嘌呤(adenine)圍繞G(或T)NG三核苷酸。Messing等,Genetic Engineering in Plants(植物遺傳工程),Kosage等(編),221-227頁(1983)。
在本發(fā)明的表達載體制備中,不是啟動子及嘌呤二氫吲哚基因的序列也優(yōu)選地應用。假如期望正確表達多肽,在嘌呤二氫吲哚基因編碼區(qū)3′末端的多聚腺苷區(qū)域是應該包括的。多聚腺苷區(qū)域能從天然基因中得到,從多種其它植物基因或從T-DNA中得到。
含有嘌呤二氫吲哚基因序列的載體典型地包含賦予植物細胞可選擇表型的標記基因。例如,該標記可編碼除草劑抗性,尤其抗除草劑抗性產物,如,對卡那霉素,G 418,博某霉素(Bleomycin),潮霉素(hygromycin)的抗性或對除草劑的抗性,如對chlorosluforon或膦絲菌素(phosphinothricin)(在bialaphos及Basta中的有效成份)的抗性。Ⅲ.轉基因植物制備在本發(fā)明的一個優(yōu)選實施方案中,本發(fā)明中轉基因植物是谷類植物,包括但不限于,小麥,黑麥,黑小麥,大麥,玉米,高粱及水稻。在一個更優(yōu)選的實施方案中,轉基因植物是小麥,高粱及玉米。在一個最優(yōu)選的實施方案中,轉基因植物是玉米。
以上描述的DNA構建體可以通過一系列傳統(tǒng)技術引入目的宿主植物基因組中。轉化各種高等植物品種的技術是深入了解的并在科學及技術文獻中描述。見,例如,Weising等,遺傳學年鑒22:421-477(1988)。
該DNA構建體可以用生物導彈(biolistic)方法,電穿孔,PEG(聚乙二醇)沉淀,及顯微注射植物細胞原生質體或胚發(fā)生愈傷組織的技術直接引入植物細胞基因組DNA中。選擇地,DNA構建體可以與適宜的T-DNA側翼區(qū)結合并用根癌農桿菌或發(fā)根病農桿菌(A.rhizogenes)載體引入。
微粒轟擊技術在Klein等,自然327:70-73(1987)中已有描述。一種特別優(yōu)選的轉化小麥及其它谷類的方法是轟擊未成熟胚來源的愈傷組織,如Weeks等,植物生理學102:1077-1084(1993)所述。
顯微注射技術為本領域所熟知并在科學及專利文獻中有很好的描述。用聚乙二醇沉淀引入DNA構建體在Paszkowski等,EMBO J.3:2717-2722(1984)中有所描述。電穿孔技術在Fromm等,美國科學院院報82:5824(1985)中描述。
根癌農桿菌介導的轉化技術也在科學文獻中廣泛描述。見,如Horsch等,科學233:496-498(1984),及Fraley等,美國科學院院報80:4803(1983)。盡管農桿菌屬主要于雙子葉植物中有用,某些單子葉植物也能夠被農桿菌屬轉化。例如,水稻的農桿菌屬轉化由Hiei等,植物雜志6:271-282(1994);美國專利5,187,073號;美國專利5,591,616號;Li等,Science in China(中國科學)34:54(1991);及Raineri等,生物/技術8:33(1990)。Xu等通過農桿菌屬感染轉化玉米,大麥,黑小麥及龍須菜(Xu等,Chinese J.Bot.2:81(1990))。
本發(fā)明在小麥及其它谷類中尤其有用。很多轉化谷類的方法已經在文獻中描述。例如,水稻轉化由Toriyama等,生物/技術6:1072-1074(1988),Zhang等,遺傳學理論及應用76:835-840(1988),及Shimamoto等,自然338:274-276(1989)描述。轉基因玉米再生植株在Fromm等,生物/技術8:833-839(1990)及Gordon-Kamm等,植物細胞2:603-618(1990)中描述。相近地,燕麥(Sommers等,生物/技術10:1589-1594(1992)),小麥(Vasil等,生物/技術10:667-674(1992);Weeks等,植物生理學102:1077-1084(1993)),高粱(Casas等,美國國家科學院院報90:11212-11216(1993)),水稻(Li等,植物細胞報道12:250-255(1993)),大麥(Yuechun和Lemoux,植物生理學104:37-48(1994)),和黑麥(Castillo等,生物/技術12:1366-1371(1994))都已通過轟擊(bombardment)轉化成功。
通過上述任何轉化技術獲得的轉化植物細胞都可以通過培養(yǎng)再生成具有轉化的基因型從而具有期望表型的完整植株。這樣的再生技術依賴于在組織生長培養(yǎng)基中加入一定的植物激素,典型地依賴于殺蟲劑(biocide)和/或除草劑(herbicide)標記,它已經與嘌呤二氫吲哚多聚核苷酸序列一起引入植物細胞中。從培養(yǎng)的原生質體再生植株在Evans等,Protoplasts Isolation And Culture,Handbook of Plant Cell Culture,(原生質體分離及培養(yǎng),植物細胞培養(yǎng)手冊),Macmillian PublishingCompany(Macmillia出版公司),New York,124-176,1983;及Binding,Regeneration of Plants,Plant Protoplasts,(植株再生,植物原生質體)CRC Press,Boca Raton,21-73,1985中已有描述。再生植株也可以從植物愈傷組織,外植體,器官或其中一部分得到。這樣的再生技術在Klee等,植物生理學年鑒38:467-486(1987)中概略地予以了描述。
本發(fā)明方法以沒被天然發(fā)現(xiàn)的方式及環(huán)境條件下將嘌呤二氫吲哚多聚核苷酸摻入轉化的植物中特別有用。尤其,嘌呤二氫吲哚蛋白可以非天然植物特征的時間或數(shù)量表達。
技術人員將認識到當表達盒穩(wěn)定地整合進轉基因植物并被確定可操作后,它就可以通過有性雜交引入其它植物中。一種用于轉移期望表型進入植物育種群體的技術是通過回雜。然而,多種標準育種技術的任何一個都能使用,依賴于被雜交的品種。Ⅳ.嘌呤二氫吲哚基因斷裂在本發(fā)明的一個實施方案中,表達嘌呤二氫吲哚基因并具有軟質結構籽粒的植物被轉化,結果是DNA-RNA-蛋白質合成的胞內途徑破壞。嘌呤二氫吲哚蛋白合成的抑制能夠通過多種不同機制實現(xiàn),包括但不限于反義核酸,轉座子,核酶,定點誘變,化學誘變及放射。在一種優(yōu)選的實施方案中,蛋白合成抑制是用反義核酸。
反義技術是基于相對于其正常存在的轉錄逆轉有義核酸并可操作地與啟動子連接。反義核酸可以通過上述方法構建,只要它能夠被轉錄成互補于并可阻斷有義基因產生的RNA的翻譯的RNA。對于反義核酸的綜述,制備反義核酸的方法學以及用它來阻斷RNA的翻譯,見,美國專利5,728,926號,1998年3月17日發(fā)行及美國專利5,695,992號,1997年12月9日發(fā)行。
簡而言之,反義基因通過刪除有義基因雙鏈編碼區(qū)或其功能片段并以相對它用于轉錄的正常存在方式相反方向插入一啟動子下游來產生。優(yōu)選地,一終止子結構將加入該反義基因3′末端。另外,反義基因也能人工合成,尤其當用一有義基因的很小片段斷時。帶有啟動子及終止子序列的反義核酸與一載體相連,并且該載體通過那些技術人員熟知的技術及以上描述的技術引入植物中。
核酶是另一種以核酸為基礎的翻譯抑制物。有兩種不同形式的核酶。第一種是在Tetrahymena thermophila(四膜蟲)(稱為IVS,或L-19 IVS RNA)中天然存在的并廣泛地在Zaug等,科學224:574-578(1984);Zaug和Cech,科學231:470-475(1986);Zaug等,自然324:429-433(1986)及P.C.T申請?zhí)朩O88/04300中描述。這些核酶的活性位點由與目標RNA序列雜交的8bp(8堿基對)組成。核酶,以自由的鳥苷(G)或鳥苷衍生物形式存在,然后斷裂目標RNA。從斷裂形成的RNA片段包含末端5′磷酸基團及3′羥基基團。
第二類核酶在美國專利5,747,335,1998年5月5日發(fā)布中描述。這類核酶包含一個雜交區(qū),該雜交區(qū)含有一或多條由至少與一種目標RNA的部分序列互補的單鏈RNA形成的臂。至少其中一條臂是與能夠斷裂目標RNA并含有至少9個核苷酸的催化區(qū)域相關聯(lián)的。如果雜交區(qū)域包含兩或多條RNA臂,在該臂中的核苷酸數(shù)量應該比9個核苷酸更多。
另一種抑制蛋白合成的技術是向植物基因組中引入一種轉座子。該方法在美國專利5,225,341號中已有描述,該專利發(fā)布于1993年7月6日。簡單地說,插入一種轉座子來破壞感興趣的基因,例如,嘌呤二氫吲哚A(puro A)。目前,最優(yōu)選的轉座子系統(tǒng)為玉米來源的Ac/Ds系統(tǒng),盡管從其它品種中得到的元件也可以使用。許多植物,然而,已知含有轉座子。它們典型地通過從體細胞突變體產生的多樣化來檢測。有關轉座子的綜述可以見于Nevers等,Adv.in Bot.Res.12:103-203(1987)。
所需載體將優(yōu)選地包含一種含有設計用于起動植物中感興趣基因轉錄的表達盒的轉座子。細菌或病毒起源的輔助序列,也典型地被包括在內以允許該載體克隆進入細菌或噬菌體宿主中。
載體也將典型地含有一種輔助的可選擇的標記基因,通過該標記基因可以在培養(yǎng)基中鑒定轉化的植物細胞。通常,標記基因將編碼抗生素抗性蛋白。其它編碼額外功能的輔助DNA序列也可以存在于載體上。例如,就農桿菌屬轉化來說,也將包括T-DNA序列以便于隨后轉移到植物染色體上。
除了以上概述的基于核酸的策略,其它植物中抑制蛋白質合成的方法也為技術人員所熟知。這些方法包括但不限于,化學誘變及放射線照射?;瘜W誘變是使一種化學物質與植物細胞接觸結果使DNA鏈損傷。然后該細胞用其自身的修復機制在下一個準備用于細胞分裂的染色體復制期間退火雙鏈DNA。然而,修復機制經常是不完善的并在雙鏈DNA中發(fā)生錯配。有細胞分裂時,其中之一的子代細胞含有錯配的DNA并因此形成突變。
放射也導致突變。植物細胞優(yōu)選地用X-射線照射,然而,紫外線輻射也引起DNA鏈的斷裂。與化學誘變相似,細胞不完美的修復機制在子代細胞中創(chuàng)造突變。當用這些細胞再生植株,該突變就存在于基因組中并能傳給下一代植物。Ⅴ.植物選擇育種當產生轉基因植物后,選擇隨之的子代以選擇含有賦予一種特異有益性狀的遺傳材料的后代,例如,籽粒結構,是有益的。在選擇開始之前,然而,期望基因組的遺傳圖應該被制作。遺傳圖通過尋找遺傳上互相連鎖(在連鎖群中)的多態(tài)性標記,或與基因連鎖或QTL影響感興趣的表型性狀來制作。標記基因排列進入連鎖群作為該標記將來之用的參考及精確地定位基因或QTL相關標記是有用的。這些QTL′s中的許多具有多個的亞基因座及通過該亞基因座的單倍型。每一種單倍型提供一種在基因座內的不同的等位基因組分,因此,與僅僅一個基因座有兩個等位基因相比,它拓展這些標記基因座的用途到更多的圖譜研究中。A.植物鑒定本發(fā)明的后代及轉基因植物可通過基因型或表型進行鑒定?;蛐头治鍪氰b定特殊遺傳物質的存在或缺失。為鑒定嘌呤二氫吲哚基因是否成功地引入后代植物中,本發(fā)明的親本植物也需進行基因型分析。
表型分析是鑒定表型性狀的缺失或存在。表型性狀是一植物由其遺傳物質及環(huán)境因素互作所確定的物理特性。表型性狀可以是或者簡單的,如孟德爾性狀(Mendelian),或者復雜的,如,數(shù)量性狀。孟德爾性狀是通過帶有顯性基因的雜交植株表現(xiàn)出來的。例如,需要春化作用這一性狀,這種需要(冬性)對于不需要(春性)來說是隱性的。
數(shù)量表型性狀是指后代植株的物理特征介于兩個親本之間的性狀。僅僅為了討論的目的,轉基因植物的親本是基因組供體及嘌呤二氫吲哚基因的供體。一種數(shù)量性狀的一個實例為小麥籽粒結構。
1.DNA分析a.DNA指紋分析通常,“DNA指紋分析”(DNA Fingerprinting)是一個廣義的術語,用于指示那種評估從各種來源分離到的DNA中的序列差異的方法。典型地,DNA指紋分析用于分析及比較不同生物物種來源的DNA。在本發(fā)明的一個優(yōu)選實施方案中,DNA指紋分析用于評價個體之間,尤其是親本,后代及轉基因植株之間的關系。
由指紋分析得到的DNA序列差異稱為DNA多態(tài)性。生物體DNA多態(tài)性存在可以指示這樣一生物體的遺傳起源和作為那種生物體的特征性遺傳標記。這樣的多態(tài)性可由基因組的插入,缺失,和/或突變而產生。
在本領域中已知許多用于DNA指紋分析的方法。限制性片段長度多態(tài)性(RFLP)技術應用限制性內切酶消化DNA之后經過凝膠電泳,對消化的DNA進行大小分離,將大小分離的DNA與一特異性多核苷酸片段(或“多核苷酸探針”)雜交。這里使用的探針是一種用放射性同位素或其它易于鑒定方式標記的生物化學標記。探針用于鑒定DNA,基因,基因產物或蛋白質的特異區(qū)域。因此,一種“多核苷酸探針”是能夠用來鑒定互補核酸序列的核酸分子。多核苷酸探針的序列可能已知,也可能未知。多核苷酸探針結合的限制性片段分子量大小的差異反應了DNA樣品的序列差異,即DNA多態(tài)性。見Tanksley,生物技術7:257-264(1988)。因此,一種“多態(tài)性DNA片段”是具有獨特大小和序列的DNA片段,它以另外一種獨特的分子量大小存在于其它的DNA樣品中或在其它DNA樣品中不存在。
其它產生DNA片段用于指紋分析的方法如使用多聚酶鏈式反應(PCR)擴增特異的DNA序列。見,如,Williams,核酸研究18:6531-6353(1990)(隨機擴增多態(tài)性DNA(RAPD)技術),Heath,核酸研究21:5782-5785(簡單序列重復(SSR)技術)和PCT申請WO93/06239(擴增片段長度多態(tài)性(AFLP)技術)。也見于美國專利4,683,195號及美國專利4,683,202號(討論PCR擴增技術)。
一種有用的分析轉移的遺傳標記存在的技術,RAPD分析被用于本發(fā)明中分析后代植株的基因型信息。RAPD分析在基因組水平上檢測重組事件并在特異且隨機產生的DNA片段的基礎上檢測。由于它不需要如上所述標記的核酸探針或雜交,它可以很快完成。
簡單地說,基因組DNA從親本及后代中分離。每一基因組DNA樣品用一套引物擴增。將擴增產物進行瓊脂糖凝膠電泳來產生DNA圖譜。DNA的瓊脂糖電泳在本領域中是熟知的。如果期望,該PCR引物能被用放射性同位素或熒光團標記以便更好地檢測低濃度的DNA。然而,在擴增過程中通常可以產生足夠的DNA片段,以致于不需要標記,DNA圖譜可以通過溴化乙錠(EB),染色凝膠而觀察到,它也是一種標準方法。
假如泳道中母本DNA圖譜與后代DNA泳道中的圖譜相同,那就是沒有發(fā)生DNA交換,該后代是自花授粉或克隆的結果。如果后代的DNA圖譜與親本DNA圖譜有任何一點不同,則說明基因組發(fā)生了重組。
所有這些PCR為基礎的指紋分析方法導致產生大量特異大小及序列的可復制的DNA片段,它們可通過大小,典型地,通過凝膠電泳分離。通過大小分離的片段的觀察或被直接用一種熒光染料觀察或被標記的多核苷酸探針雜交或被PCR過程中標記的擴增產物(放射性地或熒光性地)并緊接著在凝膠上檢測標記產物來實現(xiàn)。
b.制備及利用標記以檢測多態(tài)性核酸盡管編碼必需蛋白質的DNA序列在不同物種之間高度保守,但有一些DNA區(qū)域是不編碼的或編碼部分不具關鍵功能的蛋白質,因此,絕對保守的核酸序列很難選到。遺傳變異的主要原因是添加,缺失或點突變,存在于植物群體中的個體基因組的重組及可轉座元件。
點突變是典型地造成DNA復制不精確的原因。在減數(shù)分裂形成生殖細胞或有絲分裂產生克隆期間,DNA聚合酶轉換堿基,或者轉換(即一種嘌呤變?yōu)榱硪环N嘌呤或一種嘧啶轉變?yōu)榱硪环N嘧啶)或者顛換(也就是嘌呤轉變?yōu)猷奏ぜ胺粗?。如果DNA聚合酶之外切功能不能對錯配進行校正,這種堿基轉變將被保持。在萌發(fā)或下次細胞分裂(在克隆細胞時)期間,帶有點突變的DNA鏈就成為互補鏈的模板,堿基改變即摻入到基因組中。
可轉座的元件是在基因組中具有轉移或跳躍到新位置能力的DNA序列。本領域中已知的幾個轉座子的實例(見如,F(xiàn)reeling M.,植物生理學年鑒35:277-298(1984);Haring等,植物分子生物學16:449-469(1991);及Walbot,植物分子生物學年鑒43:49-82(1992))。
技術人員能設計用于檢測標記的探針核酸,包括PCR引物探針,等位基因-特異探針,RAPD探針等用于檢測這里所述及的基因座的多態(tài)性核苷酸,以及下面討論的遺傳連鎖序列。適當?shù)目寺〖皽y序技術的實例以及足以指導技術人員通過許多克隆操作的說明可見于Berger &Kimmel,Guide to Molecular Cloning Techniques(分子克隆技術指南),酶學方法第152卷Academic Press,Inc.,San Diego,CA(Berger);Sambrook等,Molecular Cloning-A Laboratory Manual(分子克隆-實驗手冊)(2ND ED)第1-3卷,Cold Spring Harbor Laboratory,ColdSpring Harbor Press,NY(1989),(Sambrook);及分子生物學常用方法,F(xiàn).M.Ansubel等編,常用方法,Current Protocols,a joint venturebetween Greene Publishing Associates,Inc.和John Wiley & Sons,Inc.,(全部及包括1997年增刊)(Ausubel)。提供用于克隆的細菌及噬菌體目錄,如,由ATCC,The ATCC Catalogue of Bacteria andBacteriophage(ATCC細菌及噬菌體目錄),Gherna等(編)(1992)ATCC出版。另外用于測序,克隆和分子生物學其它方面的基本程序及潛在的理論因素也見于Lewin,Genes V(基因V),Oxford UniversityPressInc.,NY(1995)(Lewin);及Watson等,Recombinant DNA(重組DNA),2ND ED(第二版),Scientific American Books(美國科學叢書),NY(1992)。
生物試劑和實驗儀器的制造廠商的產品信息中也提供了已知生物學方法中有用的信息。這樣的制造廠商包括Sigma Chemical Company(Sigma化學公司)(Saint Louis,MO);New England Biolabs(新英格蘭生物實驗室)(Beverly,MA);R & D系統(tǒng)(Minneapolis,MN);Pharmacia LKB生物技術(Piscataway,NJ);Clontech實驗室公司(PaloAlto,CA);Chemgenes公司,(Waltham MA)Aldrich化學公司(Milwaukee,WI);Glen研究公司(Sterling,VA);GIBCO BRL生命技術公司(Gaithersberg,MD);Fluka Chemica-Biochemika Analytika(Fluka Chemie AG,Buchs,Switzerland);Invitrogen(San Diego,CA);Perkin Elmer(Foster City,CA);及Stratagene;以及許多其它為技術人員所知的商業(yè)來源(source)。
本發(fā)明的核酸組合物,無論是DNA,RNA,cDNA,基因組DNA或其類似物,或這些分子的雜合體,均從生物來源中分離或體外合成而得到。本發(fā)明的核酸存在于植物,整個細胞,細胞裂解液或部分純化或基本上很純的形式中。
適合于擴增作為分子探針的序列或產生隨后用于亞克隆的核酸片段的體外擴增技術是已知的。足以指導技術人員通過這樣體外擴增方法的技術實例包括多聚酶鏈式反應(PCR),連接酶鏈式反應(LCR),Qβ復制酶擴增及其它RNA聚合酶介導的技術(例如,NASBA)可見于Berger,Sambrook,及Ausubel以及美國專利4,683,202;PCR ProtocolsA Guide to Methods And Applications(PCR方案,一本方法及應用手冊)(Innis等編),Academic Press Inc.San Diego,CA(1990)(Innis);Arnheim & Levinson(1990年10月1日)C & EN 36-47;Kwoh等,美國國家科學院院報87:1874(1990);Lomell等,臨床化學雜志35:1826(1989);Landegren等,科學241:1077-1080(1988);Van Brunt,生物技術8:291-294(1990);Wu & Wallace,基因4:560(1989);Barringer等,基因89:117(1990),及Sooknanan & Malek,生物技術13:563-564(1995)。改進的體外擴增核酸的克隆方法在Wallace等,美國專利5,426,039中已有描述。技術人員將意識到基本上任何RNA都能轉變成適于限制性內切酶消化,PCR擴增及用反轉錄酶及一種聚合酶測序的雙鏈DNA,見,Ausubel,Sambrook及Berger,全部出處同上。
用作探針的寡核苷酸,例如,在體外擴增方法中,用作基因探針,或作為抑制成份(如核酶)典型地根據(jù)固相亞磷酰胺三醋法化學合成,該方法由Beaucage & Caruthers,Tetrahedron Letts.,22(20):1859-1862(1981)描述,用Needham-VanDevanter等,核酸研究12:6159-6168(1984)中所述的一種自動合成儀合成。寡核苷酸也能通過技術人員已知的各種商業(yè)來源定制和訂購。如果需要,可用天然的丙烯酰胺凝膠電泳或如Pearson & Regnier,染色體雜志255:137-149(1983)所描述的陰離子交換HPLC(高效液相色譜)進行寡核苷酸的純化。合成的寡核苷酸序列可用Maxam & Gilbert,酶學方法65:499-560(1980)中所述的化學降解法進行驗證。
c.探針標記和檢測用于原位檢測,體外擴增(PCR,LCR等),雜交技術(等位基因特異性雜交,原位分析,Southern分析,Northern分析等)或其它任一檢測步驟中的探針,可以用帶有任何可檢測的成份,通過光譜的,化學的,生化的,免疫化學的,電子的,光學的或化學的手段進行標記。本發(fā)明中的有用標記物包括光譜標記物,例如熒光染料(例如,熒光素異硫氰酸鹽,Texos紅,羅丹明,地高辛,生物素等),放射標記物(如,3H,125I,35S,14C,32P,33P,等),酶(例如,辣根過氧化物酶,堿性磷酸酶等)及其它本領域中的技術人員已知的標記物。
一般來說,監(jiān)測探針-目標核酸雜交的檢測器適用于特殊的標記物。典型的檢測器包括分光光度計,光電管及光電二極管,顯微鏡,閃爍計數(shù)器,照相機,膠片等,以及其中不同的組合。適宜的檢測器的實例可以從許多商業(yè)性組織中獲得,這對技術人員是很熟悉的。
由于放射性核苷酸的摻入核酸是直接的,該檢測代表一種優(yōu)選的標記策略。摻入放射性標記物的實例技術包括用一種激酶或磷酸酶進行末端標記,缺口平移(nick translation),使用聚合酶摻入有放射性的核苷酸及其它已知的策略。
熒光標記物也是優(yōu)選的標記物,具有操作時不需要特別小心的優(yōu)點。優(yōu)選的標記物典型地具有下述一或幾個特點高敏感性,高穩(wěn)定性,低背景,低環(huán)境敏感性和高特異性?,F(xiàn)已普遍知道的摻入到本發(fā)明的標記物中的熒光半分子包括但不限于Texas red(德克薩斯紅),羅丹明,和熒光素。具有偶聯(lián)一種元件之功能的單個的熒光復合物在本發(fā)明的儀器或檢測中能夠被較理想地檢測,或者它可被修飾以摻入到這種功能物包括如丹磺酰氯;熒光素如3,6-二羥-9-二芐吡喃醇中。許多熒光標記物都可從公司購買,如SIGMA化學公司(St.Louis,MO),分子探針,R & D系統(tǒng)(Minneapolis,MN),Pharmacia LKB生物技術公司(Piscataway,NJ),Clontech實驗室公司(Palo Alto,CA),Chem基因公司,Aldrich化學公司(Milwaukee,WI),Glen研究公司,GIBCOBRL生物技術公司(Gaithersberg,MD),Fluka Chemica-BiochemikaAnalytika(Fluka Chemie AG,Buchs,Switzerland),及應用生物系統(tǒng)(Applies Biosystems)(Foster City,CA)以及其它為技術人員熟知的商業(yè)來源。
2.形態(tài)學和數(shù)量性狀的研究后代和轉基因植株的外形也被用來鑒定本發(fā)明的植株。籽粒結構的形態(tài)學性狀及嘌呤二氫吲哚蛋白的表達通過產生的后代監(jiān)測。另外,植物高度,穗長(玉米中),葉形等數(shù)量性狀也被監(jiān)測以保證植物品系保持健康。
數(shù)量性狀的資料對鑒定后代雜種優(yōu)勢的表達或抑制是很重要的。為了可信,每一親本和后代的每一個數(shù)量性狀至少要做2份,優(yōu)選20份觀察記錄資料進行變異性分析。然后確定每一各種變異性狀至少5%顯著差異(LSD)的植株的結果及變異系數(shù),并列表。
除后代雜種優(yōu)勢的表達和抑制外,數(shù)量性狀的差異能夠表明遺傳水平的重組,親本及后代的細胞學特征也可用于比較鑒定雜種后代。細胞學分析包括但不限于染色體作圖來檢測雜交后代中是否有親本染色體的存在和原位雜交,如同功酶分析。
熒光原位雜交(FISH)是觀察DNA序列的一個重要技術。該方法與已成為實驗室基因定位研究的常規(guī)方法。例如,F(xiàn)ISH用于將基因定位到特定染色體區(qū)域或確定產生的克隆在染色體上的順序。另外,F(xiàn)ISH也能用于比較親本和后代的染色體。
一類叫做“染色體染料”的FISH探針是可以得到的。該類探針對確定染色體結構非常有用,因為他們或多或少一致地與一給定的染色體的全長雜交。染料用來確定一個細胞的染色體組,結構異常如轉位,及鑒定親本標記染色體的起源。
用于FISH中標記DNA探針的方法有很多,包括非直接法,即利用酶反應將半抗原如生物素或地高辛摻入到DNA中。之后與染色體中期分裂相或分裂間期核進行雜交,通過免疫學方法將熒光標記連到雜交體上。最近,熒光染料可直接摻入探針,不需要中間步驟即可檢測。標準的FISH染料包括熒光素,羅丹明,德克薩斯紅(Texas Red)和CascadeBlue。多重探針FISH分析可利用半抗原或熒光染料標記不同探針來完成。
B.等位基因-特異性雜交(ASH)篩選后代是否具有其親本賦予的特殊序列的一個特別優(yōu)選的技術是等位基因特異性雜交,或“ASH”。該技術的基礎是一短的單鏈寡核苷酸探針與一單鏈目標核酸當它們的堿基完全互補時能夠穩(wěn)定退火。雜交可通過探針上的放射活性或非放射活性標記來檢測(標記探針或其它核酸的方法在下面詳述)。
當在不同基因型中一個DNA片段的堿基組成在一個或幾個核苷酸位點不同時,ASH的標記呈現(xiàn)多態(tài)性。對每種多態(tài)性設計兩個或多個不同的ASH探針,使它們除了多態(tài)性核苷酸外,DNA序列一致。每一探針與一個等位基因序列精確相符以使那些探針能夠區(qū)別于所有的兩者之中的一個等位基因序列。每一探針與目標DNA雜交。通過合適的探針設計和嚴格的條件可以排除雜交中探針和目標DNA之間的單一堿基的錯配,未結合探針會被洗掉。在這種情況下,只有其中一種探針會與一目標樣品雜交,這種樣品是等位基因的純合型或同源型(一種等位基因是通過探針與靶子之間的DNA同源性來判斷的)。兩個等位基因的雜合的或異源的樣品會與兩個探針都雜交。每一等位基因都有一個探針使多態(tài)性成為遺傳上的共顯性從而使它在鑒定接合性(zygosity)時非常有用。另外,當與兩個探針都不發(fā)生雜交時,共顯性的ASH系統(tǒng)很有用,以致于對照實驗可直接鑒定不足夠的目標DNA或出現(xiàn)的新等位基因。
當通過雜交確定只有一個等位基因出現(xiàn)或缺失時,或者用一個探針來發(fā)生雜交時,ASH標記被用作顯性標記。二者之一的等位基因可通過缺乏雜交信號推斷。異源性靶核酸(如多等位基因植物的染色體DNA)通過將包含一個基因組核酸不同多態(tài)性的2個或多個探針與其同時雜交來進行檢測。
一種ASH探針的設計是當堿基對完全互補時,它能與靶核酸形成一穩(wěn)定的雙螺旋。探針與靶之間一個或多個堿基對的錯配阻止雜交的穩(wěn)定。這一過程的許多變化證明這是正確的。探針和靶分子任選地或者是RNA或為變性DNA;靶分子是與探針序列互補的任何長度的核苷酸。探針設計成可與靶DNA任一鏈雜交;探針分子大小的范圍在保證不同嚴格雜交條件下波動。
多聚酶鏈式反應(PCR)(見如,Mullis & Faloona,酶學方法155:335-350(1987)及上述文獻)可允許在相對較小的體積中從低濃度的核酸擴增ASH的靶序列(Koenraadt & Jones,植物病理學82:1354-1358(1992);Iitia等,生物技術17:566-571(1994))。另外,從基因組DNA來的靶序列用限制性內切酶消化,通過凝膠電泳進行大小分離。靶序列結合到膜的表面,或如美國專利5,468,613號所述,將ASH探針序列結合到膜上,典型地會發(fā)生雜交反應。
利用核苷酸等位基因和多態(tài)性,通過PCR擴增基因組DNA的核酸片段,以點雜交的形式將靶DNA轉到膜上,與一標記的寡核苷酸探針雜交,放射后顯影觀察得到ASH數(shù)據(jù)。
在一種變化中,ASH技術被應用到多個多態(tài)性核酸的快速特異檢測的固相分析中。典型地,ASH探針與一固相支持物相連,靶核酸(如基因組核酸)與探針雜交。可用一熒光團標記探針或靶序列或全部標記。當靶序列被標記時,可用結合的熒光來檢測雜交。當探針被標記時,可通過標記物的萃滅來檢測雜交。當探針和靶全部被標記時,可通過檢測由于兩個結合標記物的接近而導致的顏色轉移(color shift)來檢測雜交。一系列標記策略、標記物等,尤其是熒光的應用在前面已有描述。
在一個實施方案中,在一固相支持物合成一種ASH探針陣列。用芯片掩蔽(clip masking)技術和光保護化學有可能產生排列有序的核酸探針。這些排列,如已知的“DNA芯片”或非常大規(guī)模的固定化高分子陣列(“VLSIPSTM”陣列)在兩種大約1平方厘米到幾平方厘米的基質上能夠包括數(shù)萬個確定的探針區(qū)。
固相核酸陣列檢測靶核酸的構建和應用在文獻中已有描述。見,F(xiàn)odor等,科學251:767-777(1991);Sheldon等,臨床化學39(4):718-719(1993);Kozal等,自然醫(yī)學2(7):753-759(1996)及美國專利5,571,639號。也見于PCT/US 95/16155(WO96/17958)。簡而言之,組合策略可合成含有大量探針的陣列用最少數(shù)量的合成步驟來完成。例如,只利用32步化學合成反應有可能合成并附著所有可能的DNA 8聚體聚寡核苷酸(48或65536個可能的組合)。一般地,VLSIPSTM程序提供了一個方法,只用4n個合成步驟在一個陣列中就可產生4n個不同的寡核苷酸探針。
用自動亞磷酰胺化學法和類似于計算機芯片工業(yè)的光抗(photoresist)技術的芯片掩蔽技術在玻璃表面完成寡核苷酸陣列的光-指導的(Light-directed)組合合成。典型地,玻璃表面可用一含有功能團如被光不穩(wěn)定(photolabile)保護基團封閉的羥基基團或胺基基團的硅烷(silane)試劑衍生化。通過照相平版印刷屏蔽的光解被用來選擇性地暴露功能基團,這些功能基團可與5′-光保護的核苷酸亞磷酰胺反應。亞磷酰胺只與那些發(fā)光的位點發(fā)生反應(通過去除光不穩(wěn)定的封閉集團而暴露)。這樣,亞磷酰胺只加在前面步驟中選擇性暴露的區(qū)域上。這些步驟不斷重復,直到理想的序列陣列在固體表面合成出來。不同寡核苷酸類似物在陣列不同位置的組合合成(combinatorial synthesis)是由合成中發(fā)光(illumination)的方式及加入偶聯(lián)劑的順序決定的。用熒光顯微鏡或激光掃描顯微鏡來監(jiān)測靶核酸與陣列的雜交。
除利用現(xiàn)有技術設計、制造(build)和使用探針陣列外,技術人員還可以從專業(yè)的陣列制造商那里定做陣列和陣列閱讀器(array-readingdevices)。
探針的設計受到目的應用的影響將被意識到。例如,當幾個等位基因特異性探針與靶序列相互作用在一個單一陣列進行檢測時,如單一DNA芯片上,較為理想的是所有探針都具有相似的解鏈溫度。因此,探針的長度要調整以便在陣列中的所有探針的解鏈溫度都非常相似(將意識到當不同探針具有不同GC含量時,需要使不同探針具有不同長度以達到一特定的Tm值)。盡管解鏈溫度是探針設計時需要考慮的一個主要方面,還需要考慮其它因素來進一步調整探針的組成(construction)。
C.標記輔助篩選當基因或QTL和一個或多個標記物一起被作圖并發(fā)現(xiàn)連鎖不穩(wěn)定時,有可能利用那些標記物來篩選那些基因或QTL的理想的等位基因-一個稱作標記輔助篩選(MAS)的過程。簡而言之,在一被篩選的植株來源-生物樣品中的相應于標記核酸的一種核酸被檢測。該檢測可采用探針核酸與標記雜交的形式,如利用等位基因-特異性雜交,southern分析,northern分析,原位雜交,隨著標記區(qū)域PCR擴增的引物的雜交等。這里介紹了檢測標記物的各種程序。當在生物樣品中的一特定標記物被鑒定存在(或不存在),該植株被選擇,即,通過選擇育種用其制作后代植物。
MAS在植物和動物育種中的另一用途是通過回交育種輔助恢復回歸親本基因型。用于回歸親本基因型的MAS可與用于使用這些標記的期望遺傳材料的MAS相結合。相應地,有可能利用標記物將QTLs引入具有另外的理想遺傳背景的谷類作物中,利用本發(fā)明的標記物來篩選QTL及其它期望的遺傳背景。
以上所述的任何克隆或擴增策略對產生重疊克隆的連續(xù)序列都是很有用的,因此提供重疊的核酸,該核酸是遺傳上連鎖的核酸在分子水平上表現(xiàn)出的物理位置關系。這一策略的一個普遍的例子是在各個生物測序工程中,對重疊克隆進行測序以提供染色體的全部序列。在該程序中,按照上述文獻中的標準步驟構建生物體的cDNA或基因組DNA文庫。分離單個克隆并測序,將重疊的序列信息排列以提供該生物體的序列。也見Fleischmann等,科學269:496-512(1995)中描述的全部基因組的隨機測序及全部流感嗜血桿菌(Haemophilus influenzae)基因組的排列;Fraser等,科學270:397-403(1995)中描述的完整的Mycoplasmagenitalium基因組的隨機測序及排列;及Bult等,科學273:1058-1073(1996)中描述的Methanococcus jannaschii基因組的隨機測序和排列。Hagiwara & Curtis,核酸研究24(12):2460-2461(1996)中發(fā)展了一種“長距離測序儀”(long distance sequencer)的PCR流程,從非常大的克隆中產生重疊核酸以幫助測序以及一些擴增并標記這些重疊核酸到適當?shù)臏y序模板的方法。這些方法可與鳥槍測序(shotgunsequencing)技術聯(lián)合使用以提高在整個生物體測序工程中主要應用的鳥槍法的效率。
當這些技術應用于本發(fā)明時,對鑒定和測定遺傳上與上述基因座連鎖的基因組核酸序列是很有用的。
Ⅵ.實施例A.植物培養(yǎng)及籽粒硬度測量T.aestivum,“Falcon”及“Heron”品種(Symes等,澳大利亞農業(yè)研究雜志20,971-979(1969))的軟及硬質近似同源品系(NILs)于1995年夏天種植于Lind,WA附近。籽粒硬度用近-遠紅外線反射的(NIR)分光光度計(型號450,Ttchnicon,Tarrytown,NY),以UDY研磨籽粒(方法39-70A;AACC 1995)測量。單谷粒硬度讀數(shù)(SKCS)通過對300粒谷粒樣品的硬度分析獲得,使用Perten 4100型SKCS,按照制造商建議的操作步驟進行(Perten Instruments,Reno,NV)。
按照Law,遺傳學53:487(1996)所述程序從軟質紅小麥“中國春”(Chinese Spring)和硬質紅冬麥品種“Cheyenne”形成83個純合的染色體5D替換系(Substitution lines)。從“Cheyenne”來的puro B的46位是絲氨酸。每個品系均含有20對正常整倍體的“中國春”(CS)染色體和1對重組的“中國春”/“Cheyenne”5D染色體(CS(CNN5D))。“Langdon”硬質,“Langdon”替換系LDN 5D(5B),其中“中國春”5D染色體替換了5B染色體,CS Nulli 5D/Tetra 5A中“中國春”5D染色體被替換成另一拷貝的5A染色體,它們均按常規(guī)培養(yǎng)方式生長在溫室中。表1籽粒結構測定
從表1中可以看出,從硬籽粒品種“Cheyenne”轉移突變puro B蛋白造成后代植物(CS(CNN5D))籽粒比親本品系“中國春”的籽粒明顯堅硬。后代植株的SKCS值為79而親本的SKCS為60。相反地,“Langdon”硬質小麥(durum wheat)中來源于“中國春”的puro A和puro B的表現(xiàn)造成籽粒SKCS值從88降到24;基本上產生了一軟質硬小麥(soft durum wheat)。
如上所述,一些硬質小麥品種缺少puro B絲氨酸突變?!癋alcon”,一個這樣的品種,被選擇用于進一步研究。用“Falcon”做為硬質(hard)等位基因供體,“Heron”做為軟質等位基因供體得到互補的軟及硬質NILs(近同源品系)(Symes,澳大利亞農業(yè)研究雜志16:113-123(1965))。在這套NILs中,當或者“Falcon”或者“Heron”作為回歸親本時,軟和硬質品系都存在。每套NILs由回交7代產生并進行軟質或硬質結構籽粒的篩選。示于
圖1的NILs代表利用或者“Falcon”或者“Heron”作為回歸親本創(chuàng)造的一種硬質及軟質NIL。
檢驗了puro A蛋白的有無與籽粒軟/硬之間的連鎖。44個“Falcon”/“Heron”硬/軟質NILs中的每一個都通過SDS-PAGE(如下所述)分離friabilin成份蛋白進行鑒定并計數(shù)(scoring)puro A蛋白的存在。依照基因組DNA中擴增puro A的能力(如下所述),NILs也進行了puroA基因含量的鑒定。單個品系要被分為無puro A(無效的,null)的“Falcon”型或帶有puro A的“Heron”型。通過兩種不同方法獲得的這些NILs表型籽粒硬度示于圖1,其中指明了puro A類型。還發(fā)現(xiàn)兩種NILs是含有puro A和那些缺少這種蛋白的種子的混合物。對每兩種NILs(AUS 90077及AUS 90254)的10個單獨的谷粒進行了puro A存在的分析。NIL AUS 90077,NIR硬39,十分之六的谷粒含有puro A。NIL AUS 90254,NIR硬度29,顯示十分之七的谷粒含有puro A。依照這兩個NILs的中間硬度值,混合物的百分比十分符合預期的頻率。(軟質NIL平均NIR等于15。硬質NIL平均NIR等于71。預期的NIL 90077等于{(6×15)+(4×71)}/10=37.4。預期的NIL 90254等于{(7×15)+(4×71)}/10=31.8)。每一個這些NILs混合物的觀察百分比可能解釋了它們的某些中同硬度值。結果,在puro A存在及這套遺傳原種(genetic stocks)中的籽粒柔軟性間沒有重組。
B.puro A,puro B及GSP-1 DNA的分離及PCR擴增用Dellaporta等,植物分子生物學報道1:19-21(1983)的方案分離小麥胚乳DNA。設計識別存在于硬質小麥品種“Wanser”及“Cheyenne”中的puro B的絲氨酸序列變化的引物用于擴增13個軟質地小麥和11個硬質地小麥。puro B中的絲氨酸突變是一個氨基酸即46位甘氨酸(GGC)變?yōu)榻z氨酸(AGC)的改變(Gautier等,植物分子生物學25:43-57(1994))。采用這種序列改變來制備甘氨酸或絲氨酸特異的PCR引物(Giroux & Morris,遺傳學理論及應用95:857-864(1997))(SEQ ID NO:9及10)。“硬質”或絲氨酸-特異性3′puroB引物末端帶有T而“軟質”或甘氨酸-特異性引物3′末端帶有C。
用小麥品種Gly-46或Ser-46特異序列SEQ ID NO:9,SEQ IDNO:10及SEQ ID NO:11來擴增puro B序列在其它文獻中也有描述(Giroux & Morris,遺傳學理論及應用95:857-864(1997))。如前述(Gautier等,植物分子生物學25:43-57(1994))用SEQ ID NO:7及SEQ ID NO:8作為引物已完成小麥品種中puro A序列的擴增。每套引物的退火溫度保持在58℃。單個PCR反應重復兩次或多次。
用硬質絲氨酸特異性引物(puro B)檢測到了一大小特異性產物(250bp)用作指示46位絲氨酸的存在。而硬質小麥puro B中甘氨酸到絲氨酸的改變是很普遍的,也發(fā)現(xiàn)了某些例外。大多數(shù)(7/11)硬質小麥顯出一絲氨酸特異的250 bp帶,而4個硬質小麥品種,“Express”,“Butte86”,“Westbred 926”及“Falcon”沒有。四種例外的每一個都顯示出一甘氨酸特異性“軟質”小麥puro B帶。所有13個軟質小麥產生甘氨酸特異性帶而沒有絲氨酸特異性帶。對每一個應用的基因組DNAs的全puro B編碼序列擴增是可能的。
一GSP-1相關克隆,SR 3.1,檢測一種RFLP明顯與籽粒硬度連鎖(Jolly等,美國國家科學院院報93:2408-2413(1996)),然而還沒有轉錄或基因表達分析的報導。我們用“Heron”,“Falcon”進行Northern雜交分析,實驗中用了4個硬/軟質NILs,發(fā)現(xiàn)GSP-1轉錄水平的差異與籽粒硬度不一致。另外,還檢測了從“中國春”及CS(CNN5D)來源的4個單獨的硬質和軟質品系。
另外的基因,稱為GSP-1,已表明與籽粒柔軟性有關(Rahman等,歐洲生物化學雜志223:917-925(1994);及Jolly等,美國國家科學院院報93:2408-2413(1996))。從開花后14天的“中國春”的種子中提取RNA,通過RT-PCR擴增GSP-1探針。該探針用以下引物制備5′引物由DNA序列5′GTAGTGAGCACTACTATTGC3′(SEQ IDNO:11)組成,3′引物為5′-GAGCCTTCCCTCCAAGTGC-3′(SEQID NO:12)的反向互補序列。PCR退火溫度為58℃。
SEQ ID NO:11及SEQ ID NO:12擴增GSP1b的一內部400bp片段(Rahman等,歐洲生物化學雜志223:917-925(1994))。該400 bp片段用作探針,在高嚴格條件下與“Falcon”/“Heron”NILs的總RNA及“中國春”染色體5D替換品系(Giroux & Morris,遺傳學理論及應用95:857-864(1997))雜交。
與“Falcon”/“Heron”NILs一樣,GSP-1轉錄與籽粒硬度無關?!癓angdon”硬質與軟質的雙體替換品系LND-CS DS5D(5B)也都含有GSP-1轉錄物。GSP-1物理上定位于這三組每一個5號同源染色體的短臂(Gill等,遺傳學143:1001-1012(1996))上,其轉錄物不單由5D控制。依據(jù)這些數(shù)據(jù),我們認為在影響籽粒柔軟性方面,GSP-1的直接作用是不可能的。
Northern印跡分析Friabilin成份轉錄物及蛋白分析在4個puro B中不含有甘氨酸到絲氨酸轉變的硬質小麥品種中進行。探針是用上述puro A、puro B和GSP-1引物擴增的核酸序列。RNA分離,northern凝膠印跡的制備,及探測(probing)按前述標準方法進行(Giroux & Morris,遺傳學理論及應用95:857-864(1997))。puro A,puro B及GSP 1探針用隨機引物法制備(Gibco/BRL,生命技術公司Gaithersburg,MD),其特異活性超過1×109cpm/μg DNA。每次northern印跡放射自顯影曝光前在67℃進行2次高嚴格洗滌。
嘌呤二氫吲哚轉錄物水平發(fā)現(xiàn)由染色體5D控制,因為CS Nulli 5D/Tetra 5A mRNA不含有嘌呤二氫吲哚轉錄本而LDN 5D(5B)mRNA含有轉錄本。
含有非-絲氨酸puro B小麥mRNA的Northern印跡表明這四個硬質小麥品種的每一個都不含有任何可檢測到的puro A的轉錄本。每一個硬質小麥基因型的puro B的轉錄水平與軟質小麥基因型的相似。C.Triton-X114可溶蛋白的分離及蛋白電泳Friabilin成份在SDS-PAGE凝膠中被分離為二種明顯的成分(Morris等,谷類科學雜志21:167-174(1994)),鑒定為puro A及puro B。對“中國春”(軟質),“中國春”的二倍體染色體5D替換系,CS-CNN DS5D(硬質)(“Cheyenne”硬質小麥品種作為5D染色體對的供體),“Heron”及“Falcon”進行了friabilin成分的分離。
Triton-X100-可溶性蛋白通過triton-X114的相分配法進行分離(Bordier,生物學化學雜志256:1604-1607(1981))。壓碎的全部谷粒加入1%(v/v)溶解在Tris緩沖鹽溶液(TBS,10mM Tris,150mMNaCl,pH7.5)中的triton-X114,在4℃混合30分鐘,之后短暫離心(10000g,5分鐘),將上清轉移到37℃再離心30分鐘。下層的去污劑相轉移到一個新管再重復相分配。相分配后,去污劑富集相中的蛋白用80%(v/v)丙酮沉淀。沉淀物用丙酮,乙醚洗滌并干燥。加入SDS樣品緩沖液(不加還原劑)調整蛋白上樣量為每道相當于1mg全谷粒。SDS-PAGE按標準方法完成,用13.5%T,2.6%C,及0.75mm厚的SE 600膠(Bio-Rad),凝膠用TCA固定法銀染(Morris等,谷類科學雜志21:167-174(1994))。
仔細檢查帶型發(fā)現(xiàn)上層帶在“Falcon”中是缺失的,很可能是puroA,因為friabilin帶的缺失與puro A轉錄的缺失相對應。該puro A帶在所有軟質小麥如“中國春”和“Heron”及所有puro B絲氨酸型的硬質小麥突變體如“Cheyenne”及硬質“中國春”/“Cheyenne”的雙體替換衍生物,CS-CNN DS5D中是存在的?!癊xpress”,“Butte 86”及“Westbred926”中也缺少相應于puro A的蛋白帶?!癓angdon”硬質缺少任何量的friabilin蛋白,而用“中國春”5D染色體替換“Langdon”5B染色體對的LGD-CSDS 5D(5B)則保持有friabilin及籽粒柔軟性。
D.根癌農桿菌感染介導的puro A及puro B核酸序列的水稻(oryza cativa)轉染上述的puro A及puro B基因用于轉化水稻。利用Li等,植物細胞報道12:250-255(1993)的修改方法將該基因引入易感水稻中。簡要地說,利用潮霉素(hygromycin)構建物pMON 410(來自Monsanto)和一含有感興趣序列的bluescript載體進行共轉化。另外,pB 822的Kpn片段克隆到pTA818載體,pTA818來自于Invitrogen載體pcr1000并含有1kb片段RAPD818。最后構建好的質粒叫做pC822。植株在潮霉素(30mg/L)中篩選,之后用Northern印跡篩選嘌呤二氫吲哚轉錄物的存在。
轉基因植株結種后,可用上述方法對轉化體進行黃單胞菌屬(Xanthomonas)抗性的檢測。
E.經過轟擊法轉化Triticum aestivum12.5μg的每種DNA包裹到金顆粒上用于轟擊進Bobwhite培育品種小麥未成熟胚中,轟擊前,胚胎在含有甘露醇的愈傷組織誘導培養(yǎng)基中培養(yǎng)4小時,轟擊后再培養(yǎng)20小時,除此之外,基本上按照Weeks等,植物生理學102:1077-1084(1993)的方法。依照轉化體在再生的愈傷組織和綠芽階段對1mg/L bialaphos的抗性及再生發(fā)根期對3mg/Lbialaphos的抗性按上文所述的Weeks等的方法對轉化體進行篩選。
所提供的上述實例用以說明本發(fā)明但不限制其范圍。本發(fā)明的其它變異形式對本領域中的普通技術人員將是容易明白的并且包含在附加的權利要求中。這里引用的所有出版物,專利和專利申請都作為參考文獻引用。
序列表SEQ ID:1嘌呤二氫吲哚A的cDNASEQ ID:2嘌呤二氫吲哚A的氨基酸序列 SEQ ID NO:3嘌呤二氫吲哚B的cDNASEQ ID NO:4嘌呤二氫吲哚B的氨基酸序列 SEQ ID NO:5絲氨酸替換的嘌呤二氫吲哚B的cDNASEQ ID NO:6替換的嘌呤二氫吲哚B的氨基酸序列 SEQ ID NO:7 puro A正義鏈引物5′-ATGAAGGCCCTCTTCCTCA-3′SEQ ID NO:8 puro A反義鏈引物5′-TCACCAGTAATAGCCAATAGTG-3′SEQ ID NO:9 puro B正義鏈引物5′-ATGAAGACCTTATTCCTCCTA-3′SEQ ID NO:10 puro B反義鏈5′-TCACCAGTAATAGCCACTAGGGAA-3′SEQ ID NO:11 puro B絲氨酸替代序列的反義鏈5′-CCACCAGTAATAGCCACTAGGGAA-3′SEQ ID NO:11 GSP1正義鏈5′GTAGTGAGCACTACTATTGC 3′SEQ ID NO:12 GSP1反義鏈5′-GAGCCTTCCCTCCAAGTGC-3′
權利要求
1.一種產生具有軟質結構籽粒的轉基因植物的方法,所說的植物來源于至少一個具有硬質結構籽粒的親本植物,所說的方法包含以下步驟將可操作地編碼嘌呤二氫吲哚蛋白的核酸序列引入來源于親本植物的細胞中,其中所說的核酸序列在嚴格條件與從SEQ ID NO:1和SEQID NO:3組成的一組中選出的核酸序列雜交;以及從含有該核酸序列的細胞產生后代植株。
2.權利要求1中的方法,其中后代植物從由硬質小麥,高粱,水稻,大麥和玉米組成的組中選出。
3.權利要求2中的方法,其中的后代植物是玉米。
4.權利要求1中的方法,其中的引入步驟是通過農桿菌屬感染介導的。
5.權利要求1中的方法,其中的嘌呤二氫吲哚蛋白是從由嘌呤二氫吲哚A和嘌呤二氫吲哚B組成的組中選出。
6.一種產生具有硬質結構籽粒的轉基因植物的方法,所說的植物來源于至少一個具有軟質結構籽粒的親本植物,所說的方法包含以下步驟引入阻止嘌呤二氫吲哚蛋白表達的核酸序列進入來源于親本植物的細胞中;以及從該細胞產生植株。
7.方法6中的植物,其中植物是從由小麥、黑麥、黑小麥和蒸麥組成的組中選出。
8.權利要求6中的方法,其中的核酸序列阻止嘌呤二氫吲哚A或嘌呤二氫吲哚B的表達。
9.權利要求6中的方法,其中的核酸序列可操作地編碼一種核酶。
10.權利要求6中的方法,其中核酸序列可操作地編碼一種反義核酸,所說的核酸在嚴格條件下與SEQ ID NO:1或SEQ ID NO:3互補的核酸序列雜交。
11.權利要求6中的方法,其中核酸序列可操作地編碼一種轉座子。
12.權利要求6中的方法,其中引入步驟是由農桿菌屬感染介導的。
13.一種產生具有較硬結構籽粒的轉基因植物的方法,所說的植物來源于至少一個具有軟質結構籽粒的親本植物,所說的方法包含以下步驟將核酸序列引入來源于親本植物的細胞中,所說的核酸序列在嚴格條件下與SEQ ID NO:5中所示的核酸序列雜交;以及從該細胞產生植株。
14.方法13中的植物,其中植物是從由小麥、黑麥、黑小麥和燕麥組成的組中選出。
15.權利要求13中的方法,其中的核酸序列是通過農桿菌屬感染被引入細胞的。
16.來源于至少一種具有硬質結構籽粒的親本植物的具有軟質結構籽粒的轉基因植物,其中所說的植物含有一個可操作地編碼嘌呤二氫吲哚蛋白的核酸序列,其中所說的核酸序列在嚴格條件下與一個從由SEQID NO:1和SEQ ID NO:3組成的組中選出的核酸序列雜交。
17.權利要求16中的植物,從由硬質小麥、高粱、水稻、大麥和玉米組成的組中選出。
18.權利要求17中的后代植物,其中的植物是玉米。
19.權利要求16中的后代植物,其中的嘌呤二氫吲哚蛋白是從由嘌呤二氫吲哚A和嘌呤二氫吲哚B組成的組中選出。
20.權利要求16中的后代植物,其中的核酸序列通過農桿菌感染引入到植物中。
21.來源于至少一個具有軟質籽粒的親本的具有較硬結構籽粒的轉基因植物,包含阻止嘌呤二氫吲哚蛋白表達的核酸序列。
22.權利要求21中的植物是從由小麥、黑麥、黑小麥和燕麥組成的組中選出。
23.權利要求21中的植物,其中的核酸序列阻止嘌呤二氫吲哚A和嘌呤二氫吲哚B的表達。
24.權利要求21中的植物,其中的核酸序列可操作地編碼一種核酶。
25.權利要求21中的植物,其中的核酸序列可操作地編碼一種反義核酸,該核酸與SEQ ID NO:1或SEQ ID NO:3互補的序列雜交。
26.權利要求21中的植物,其中的核酸序列可操作地編碼一種轉座子。
27.權利要求21中的植物,其中的核酸序列是通過農桿菌屬感染被引入到后代植物中的。
28.來源于至少一個具有軟質籽粒的親本的具有硬質結構籽粒的轉基因小麥植物,它含有在嚴格條件下與SEQ ID NO:5所示的序列雜交的核酸序列。
29.權利要求28的后代植物,其中的核酸序列可操作地編碼一種轉座子。
30.權利要求28的后代植物,其中的核酸序列是通過農桿菌屬感染引入到后代植物的。
全文摘要
本發(fā)明提供了生產轉基因植物的方法,當與轉基因植物來源的植物相比時,該轉基因植物修飾了籽粒結構。通過引入賦予籽粒柔軟性的數(shù)量性狀,嘌呤二氫吲哚A(puroindolineA)及嘌呤二氫吲哚B(puroindolineB),賦予轉基因植物修飾的籽粒結構。
文檔編號C12N15/29GK1311817SQ9980905
公開日2001年9月5日 申請日期1999年5月21日 優(yōu)先權日1998年5月22日
發(fā)明者C·F·莫里斯, M·J·基羅克斯 申請人:美國政府農業(yè)部, 研究及發(fā)展協(xié)會有限公司