專利名稱:種子中氨基酸組成的改變的制作方法
背景技術:
以農(nóng)作物為基礎的的制品典型地必須補充特定的氨基酸以便給動物提供對其生長具有關鍵性的必需營養(yǎng)成分。這種補充是必須的,因為一般來說,農(nóng)作物含有低比例的對單胃動物來說是必需的且不能由其合成的一些氨基酸。
農(nóng)作物的種子含有不同類別的種子蛋白質(zhì)。這些種子的氨基酸組成反應了蛋白質(zhì)中占優(yōu)勢的類別的組成。氨基酸局限通常是由于這些占優(yōu)勢的蛋白質(zhì)類別的氨基酸缺陷引起。
在對動物營養(yǎng)必需的氨基酸中,在農(nóng)作物中獲取力有限的那些氨基酸包括甲硫氨酸,賴氨酸和半胱氨酸。例如,在大豆中,7S球蛋白占種子蛋白質(zhì)的大約30%,但僅含0.3%的甲硫氨酸,而Bowman-Birk抑制劑(“BBI”)占種子蛋白質(zhì)的大約1%,但含有大約20%的含硫氨基酸。經(jīng)過育種,突變選擇和/或改變在農(nóng)作物種子中積累的貯存蛋白質(zhì)組成來增加這些氨基酸的水平的嘗試已取得了有限的成功,或伴隨著減產(chǎn)。
例如,盡管含突變轉(zhuǎn)錄因子,(不透明的2),或突變α-玉米醇溶蛋白基因,(粉狀2)的農(nóng)作物種子表現(xiàn)出總的和結合的賴氨酸水平升高,但改變了種子的胚乳結構,對損害和害蟲更敏感。也典型地顯著減產(chǎn)。
增加農(nóng)作物中游離氨基酸水平的另一種方法是修飾植物中的氨基酸生物合成。將編碼催化賴氨酸生物合成途徑獨特的第一反應的反饋調(diào)節(jié)失敏性二氫吡啶二羧酸合成酶(“DHDPS”)基因?qū)胫参镏幸岩疬@些植物的葉和種子中自由賴氨酸水平的增加。然而,這些增加對于明顯增加種子中總氨基酸的含量是不夠的,因為一般來說,種子中游離氨基酸水平僅是總氨基酸成分的一個小部分。
編碼對賴氨酸和蘇氨酸的反饋抑制脫敏的突變細菌天冬氨酸激酶的LysC基因從煙草植物中種子特異性啟動子的表達已導致這些植物的種子中甲硫氨酸和蘇氨酸生物合成的增加。見Karchi等,植物雜志;第3卷;p.721;(1993);本文引用其全文以供參考。然而,lysC基因的表達導致種子中總蘇氨酸或甲硫氨酸的水平僅增加6-7%。因此,種子中l(wèi)ysC基因的表達對這些種子的營養(yǎng)價值只具有輕微的影響,因此仍需要對含lysC轉(zhuǎn)基因種子的食品補充氨基酸,如甲硫氨酸和蘇氨酸。
有其它的分子遺傳學方法可用于提高植物蛋白質(zhì)的氨基酸質(zhì)量。分別涉及植物基因的分子操作和轉(zhuǎn)基因植物的生產(chǎn)。
蛋白質(zhì)序列修飾涉及鑒定編碼主要蛋白質(zhì),優(yōu)選貯存蛋白質(zhì)的基因作為修飾靶以使其含有更多的必需氨基酸的密碼子。本研究的關鍵任務是為了能選擇可進行修飾而不影響該蛋白質(zhì)的總體結構,穩(wěn)定性,功能和其它細胞和功能特征的蛋白質(zhì)區(qū)域。通過相關蛋白質(zhì)種類的序列分析和比較鑒定的多肽的可變區(qū)為這類修飾提供了可能的靶位點。
這些研究表明經(jīng)序列修飾增加種子蛋白質(zhì)中的必需氨基酸殘基是可行的,且選擇合適的靶位點是重要的。
DNA合成技術的形成允許設計和合成編碼具有所需必需氨基酸組成的新蛋白質(zhì)的基因。例如,研究者已合成了編碼由80%必需氨基酸組成的多肽的292個堿基對的DNA序列并將它與胭脂氨酸合成酶(NOS)啟動子一起用于構建嵌合基因。該基因在轉(zhuǎn)基因馬鈴薯塊莖中的表達導致該蛋白質(zhì)以0.02%至0.35%的總植物蛋白質(zhì)水平進行積累。這種低水平的積累可能是由于NOS啟動子較弱和/或該新蛋白質(zhì)的不穩(wěn)定性引起。
植物中微量蛋白質(zhì)可含升高水平的必需氨基酸是有限的。經(jīng)過增強編碼該蛋白質(zhì)的基因的表達,可增加該蛋白質(zhì)的濃度,從而增加該特定必需氨基酸的含量。在這一點上,最近已將10.8-kD的推斷的富含甲硫氨酸的蛋白質(zhì)在大豆種子中當作用于改進大豆蛋白質(zhì)質(zhì)量的較好的候選者。
另外,重組DNA和植物轉(zhuǎn)化技術允許在不同植物種類間接移基因。因此,可將從特定植物中分離的編碼富含必需氨基酸的蛋白質(zhì)的基因?qū)肫渌参镏幸蕴岣咂涞鞍踪|(zhì)質(zhì)量。已鑒定并分離了含異常高水平的必需含硫氨基酸的一些植物蛋白質(zhì)及其基因。它們是用于蛋白質(zhì)改進的首要候選物。
煙草已用作試驗植物以經(jīng)過將含菜豆蛋白啟動子和富硫蛋白巴西堅果蛋白質(zhì)(“BNP”)(18mol%甲硫氨酸和8mol%半胱氨酸)的cDNA的嵌合基因轉(zhuǎn)移進煙草來證實該研究的可行性。氨基酸分析表明轉(zhuǎn)基因種子中甲硫氨酸含量比未轉(zhuǎn)化的種子提高30%。這種相同的嵌合基因也已轉(zhuǎn)移進了經(jīng)濟作物canola中并實現(xiàn)了相似水平的提高。
然而,不利影響是賴氨酸含量減小。另外,BNP已鑒定為主要的食物過敏原。因此使用BNP來提高農(nóng)作物的營養(yǎng)價值既不實用也不需要。
這些發(fā)現(xiàn)表明了一個需要進一步研究的領域。這里指出各研究的優(yōu)缺點也是有用的。盡管蛋白質(zhì)序列修飾和合成基因的方法對于改造和設計具有所需必需氨基酸組成的基因具有靈活性,但其隱患是具有產(chǎn)生未知結構和生物學特征的蛋白產(chǎn)品的可能性。異源和同源基因研究都具有利用天然存在的基因的優(yōu)勢。然而,鑒定編碼富含特定的必需氨基酸的蛋白質(zhì)的基因(如果確實存在的)將是一個艱難的任務。
因此需要改變蛋白質(zhì)類別的比例而不產(chǎn)生有害的副作用。內(nèi)源蛋白質(zhì)非常適合于細胞內(nèi)裝配,靶向和加工。另外,該蛋白質(zhì)組成的改變減小了產(chǎn)生對人或動物健康具有未知危險的可能性,因為所有的蛋白質(zhì)化合物在修飾前已存在于植物中。然而,有些富含必需氨基酸的內(nèi)源蛋白質(zhì),如BBI是非營養(yǎng)性蛋白質(zhì)。
基于上文的描述,存在對鑒定在未修飾的種子中存在相當?shù)偷暮康哂斜匦璋被岷吭黾拥膬?nèi)源性種子貯存蛋白質(zhì)的需要,以便經(jīng)遺傳修飾種子以過度表達編碼這些原生質(zhì)的基因來提高種子的營養(yǎng)價值。該遺傳修飾不應伴隨有害的副作用,如過敏原性,非營養(yǎng)性品質(zhì)或低產(chǎn)。
因此,本發(fā)明的一個目的是提供增加食物營養(yǎng)含量的方法。
本發(fā)明的另一個目的是提供遺傳修飾種子的方法以便增加在未修飾的種子中以相當?shù)土看嬖诘谋匦璋被岬牧俊?br>
本發(fā)明的另一個目的是提供將內(nèi)源蛋白質(zhì)導入種子的方法。
本發(fā)明的另一個目的是提供增加種子中營養(yǎng)成分而無諸如過敏原性,低產(chǎn)或非營養(yǎng)性品質(zhì)的有害副作用的方法。
發(fā)明概述本發(fā)明的方法包括經(jīng)過導入包含編碼種子貯存蛋白質(zhì)的預選的DNA片段的表達盒來轉(zhuǎn)化植物細胞。
本發(fā)明還提供了含有包含啟動子和在該啟動子控制下的編碼包含預選氨基酸的種子貯存蛋白質(zhì)的分離的預選DNA片段的能育轉(zhuǎn)基因大豆植物。
本發(fā)明還提供了包含編碼大豆種子貯存蛋白質(zhì)的預選的DNA片段的分離和純化的DNA分子。
本發(fā)明還提供了能特異性地結合大豆白蛋白的抗體。
本發(fā)明還提供了從種子中分離白蛋白的方法。
附圖的簡要描述
圖1描述了以Edman降解從PVDF印跡分離的蛋白質(zhì)測定的白蛋白1,白蛋白2和白蛋白3的氨基末端序列。
圖2描述了從大豆種子cDNA文庫分離的白蛋白1的cDNA序列(SEQ ID NO1)和白蛋白1的相應的預期氨基酸序列(SEQ ID NO2)。
圖3描述了從大豆種子cDNA文庫分離的白蛋白3的cDNA序列(SEQ ID NO3)和相應的白蛋白3的預期氨基酸序列(SEQ ID NO4)。
圖4描述了包含來自白蛋白1和白蛋白3的序列的嵌合白蛋白的cDNA序列(SEQ ID NO5)和氨基酸序列(SEQ ID NO6)。
圖5稱為白蛋白1/3,描述了白蛋白1,白蛋白3和白蛋白1/3的氨基酸序列的比較。
圖6描述了p4752的質(zhì)粒圖譜。
發(fā)明詳述本發(fā)明提供了遺傳修飾種子以提高種子中至少一種預選的氨基酸的水平從而增加種子營養(yǎng)價值的方法。該方法包含將表達盒導入可再生的植物細胞以產(chǎn)生轉(zhuǎn)化的植物細胞。該表達盒包括有效連接到在植物細胞中有功能的啟動子上的編碼包含預選氨基酸的大豆種子貯存蛋白質(zhì)的預選的DNA片段。
從轉(zhuǎn)化的細胞再生能育的轉(zhuǎn)基因植物,從該植物中分離種子。該種子包含由預選的DNA片段編碼的蛋白質(zhì),且相對于相應未轉(zhuǎn)化的植物種子(例如,未轉(zhuǎn)化的再生對照植物的種子或從轉(zhuǎn)化植物分離的相應的未轉(zhuǎn)化種子)中預選的氨基酸量而言,以足以增加在轉(zhuǎn)化的植物種子中預選氨基酸量的含量產(chǎn)生。
優(yōu)選的是,預選的氨基酸是賴氨酸。更優(yōu)選的是,有另一種預選的氨基酸。還有還更優(yōu)選的是,另一種預選的氨基酸是半胱氨酸或甲硫氨酸。
本發(fā)明優(yōu)選的實施方案是將表達盒導入可再生的大豆細胞中。還有優(yōu)選的是導入包含編碼內(nèi)源性多肽序列的預選的DNA片段的表達盒。
本發(fā)明包含與下文公開的片段具有足夠相似性的片段。一般來說,這種足夠的相似性應包括在白蛋白1的堿基對10到474之間(SEQ IDNO1)白蛋白3的堿基對28到501之間(SEQ ID NO3)和白蛋白1/3的堿基對28和501之間(SEQ ID NO5)至少大約60%的相同性或60%的同源性。優(yōu)選的是,該足夠的相似性應包含至少大約70%的相同性或70%的同源性。更優(yōu)選的是,該足夠的相似性應包括至少大約80%的相同性或80%的同源性。甚至更優(yōu)選的是,該足夠的相似性應包含至少大約90%的相同性或90%的同源性。最優(yōu)選的是,本發(fā)明的片段是具有分別在SEQ ID NO1,SEQ ID NO3和SEQ ID NO5中公開的序列。
本發(fā)明還包含在上述序列中的變異,其中該變異由于定點誘變或本領域中已知的其它機制引起,以增加或減少感興趣的選定氨基酸的水平。例如,定點誘變以增加賴氨酸,甲硫氨酸和/或半胱氨酸的水平和/或減小天冬酰胺和/或谷氨酰胺的水平是優(yōu)選的實施方案。
本發(fā)明還提供了能育的轉(zhuǎn)基因植物。該能育的轉(zhuǎn)基因植物含有包含一個啟動子和位于該啟動子控制下的編碼包含預選氨基酸的種子貯存蛋白質(zhì)的分離的預選DNA片段。該DNA片段表達為種子貯存蛋白質(zhì),使轉(zhuǎn)基因植物種子中預選的種子貯存蛋白質(zhì)氨基酸水平增加到與轉(zhuǎn)基因植物種子區(qū)別僅在于該DNA片段或編碼的種子蛋白質(zhì)在不同啟動子控制下的植物種子中的水平上。該DNA片段通過轉(zhuǎn)基因植物的完全正常的有性循環(huán)傳遞給下一代。
還提供了一種包含編碼大豆種子貯存蛋白質(zhì)的預選的DNA片段的分離和純化的DNA分子。本發(fā)明的最優(yōu)選的實施方案是編碼大豆白蛋白的預選的DNA片段。例如,見Shewry,等;植物細胞;第7卷,第7期;p945-956;(1995);本文引用其全文以供參考。
本發(fā)明還提供了一種表達盒,包含有效連接到在宿主細胞中有功能的啟動子上的編碼大豆種子貯存蛋白質(zhì)的預選的DNA片段。在本發(fā)明的實踐中有用的優(yōu)選的啟動子是允許在種子中選擇性地表達預選的DNA片段以避免與非種子器官中選定DNA片段的表達相關的任何潛在有害效應的那些種子特異性啟動子。
本發(fā)明的其它實施方案包括用編碼種子貯存蛋白質(zhì)的預選的DNA片段轉(zhuǎn)化的植物,植物部分,種子和微生物。優(yōu)選的是,種子貯存蛋白質(zhì)是白蛋白。更優(yōu)選的是,種子貯存蛋白質(zhì)是大豆白蛋白。
本發(fā)明的其它實施方案還包括預選的氨基酸水平升高的嵌合體。
在本發(fā)明優(yōu)選的實施方案中,提供了用于簡單、快速并可靠地生產(chǎn)在所產(chǎn)生的種子中賴氨酸積累增加的轉(zhuǎn)基因大豆植物的方法。在一個更優(yōu)選的實施方案中,除了賴氨酸積累增加外,還出現(xiàn)甲硫氨酸和/或半胱氨酸積累的增加。該方法具有基因型不依賴性,且相對于以前使用的系統(tǒng)顯示出巨大的,不可預料的進步。
本發(fā)明還提供了分離和純化2S白蛋白的方法,包括經(jīng)過白蛋白與碳水化合物樹脂基質(zhì),優(yōu)選葡聚糖樹脂,甚至更優(yōu)選Sephadex G25間的特異性相互作用從污染物中分離白蛋白。由于樹脂的分子篩特性使上述分離和純化的方法是意想不到的。白蛋白與基質(zhì)間的特異性相互作用對于批量處理具有有用的應用。
本文使用的“預選的DNA片段”指編碼大豆種子貯存蛋白質(zhì)的外源性或重組DNA序列或片段,其中,該種子貯存蛋白質(zhì)優(yōu)選不是功能性蛋白酶抑制劑,不是功能性α淀粉酶抑制劑且不是凝集素。
本發(fā)明優(yōu)選的種子貯存蛋白質(zhì)是具有賴氨酸及含硫氨基酸,即甲硫氨酸和/或半胱氨酸含量增加的蛋白質(zhì)。預選的DNA片段和氨基酸的選擇以預選的DNA片段編碼的蛋白質(zhì)的氨基酸組成及該蛋白質(zhì)在種子中積累的能力為基礎。而且,蛋白質(zhì)的氨基酸組成可用諸如編碼該蛋白質(zhì)的預選的DNA片段的定點誘變的方法來進行操作以便引起特定氨基酸的量,即含量增加的蛋白質(zhì)表達。本發(fā)明的一個優(yōu)選的實施方案是預選的DNA片段編碼賴氨酸,和甲硫氨酸和/或半胱氨酸量升高的大豆種子貯存蛋白質(zhì),如編碼大豆白蛋白的預選的DNA片段。由于利用了內(nèi)源性蛋白質(zhì),產(chǎn)生對人和/或動物健康的未知危害的可能性減小。
本文使用的術語“高賴氨酸含量蛋白質(zhì)”指該蛋白質(zhì)具有至少大約7%的賴氨酸,更優(yōu)選至少大約10%的賴氨酸,甚至更優(yōu)選至少大約12%的賴氨酸,最優(yōu)選至少大約13%的賴氨酸。在一個優(yōu)選的實施方案中,高賴氨酸含量蛋白質(zhì)也是高硫含量蛋白質(zhì)。
本文使用的術語“高硫含量蛋白質(zhì)”指該蛋白質(zhì)除賴氨酸外還含有下文所示的水平的甲硫氨酸和/或半胱氨酸。高硫含量蛋白質(zhì)具有至少大約6%的甲硫氨酸和/或半胱氨酸,優(yōu)選至少大約9%的甲硫氨酸和/或半胱氨酸,且更優(yōu)選至少大約11%的甲硫氨酸和/或半胱氨酸。
本文使用的“增加的”或“升高的”轉(zhuǎn)化植物中預選氨基酸的水平或量是比相應的未轉(zhuǎn)化植物的水平或量更大的水平。例如,大豆種子蛋白質(zhì)中平均甲硫氨酸的含量是大約1.4%,大豆種子蛋白質(zhì)中平均半胱氨酸含量是大約1.4%,大豆種子蛋白質(zhì)中平均賴氨酸含量是大約6.0%(George等;農(nóng)業(yè)食品化學雜志;Vol.34;p224;(1991);本文引用其全文以供參考)。因此,具有大約12%的甲硫氨酸和半胱氨酸之和及大約10%賴氨酸的具有SEQ ID NO2的大豆白蛋白1在種子中的表達導致這些種子中甲硫氨酸,半胱氨酸和賴氨酸的水平或量增加。而且,具有大約12%的甲硫氨酸和半胱氨酸之和及大約10%的賴氨酸的具有SEQ ID NO4的大豆白蛋白3在種子中的表達導致這些種子中甲硫氨酸,半胱氨酸和賴氨酸的水平或量增加。以本領域熟知的方法可測定蛋白質(zhì)的氨基酸組成。
在轉(zhuǎn)化的植物中增加量的非賴氨酸的預選的氨基酸比未轉(zhuǎn)化的植物中預選的氨基酸的量優(yōu)選大至少大約15至30%,優(yōu)選至少大約30至50%,且最優(yōu)選大約50至100%。在轉(zhuǎn)化的植物中預選的賴氨酸增加的量比未轉(zhuǎn)化的植物中賴氨酸的量優(yōu)選大至少大約5-10%,更優(yōu)選至少大約10-15%,甚至更優(yōu)選至少大約15-20%,最優(yōu)選至少大約25-50%。
本文使用的“遺傳修飾的植物”指包括經(jīng)轉(zhuǎn)化導入植物基因組的預選的DNA片段的植物。術語“野生型”指未轉(zhuǎn)化的植物,即未經(jīng)導入預選的DNA片段改變基因組的植物。
本文使用的“植物”包括但不限于植物細胞,植物組織和植物種子。對于本發(fā)明,優(yōu)選的植物包括大豆,canola,向日葵,高粱和玉米。更優(yōu)選的植物包括大豆和玉米。最優(yōu)選的植物是大豆。
本文對于編碼蛋白質(zhì)的預選的DNA片段使用的術語“表達”指預選的DNA片段插入該細胞的基因組,使由該預選的DNA片段編碼的產(chǎn)品,例如,諸如白蛋白的富硫蛋白質(zhì)在細胞內(nèi)產(chǎn)生。例如,編碼白蛋白的預選DNA片段的表達產(chǎn)生的新植物在種子中含可提取水平的白蛋白占總蛋白質(zhì)的至少大約3%,優(yōu)選至少大約5%,更優(yōu)選至少大約10%,甚至更優(yōu)選至少大約20%。
可用于本發(fā)明方法的植物類型一般是廣泛地適用于轉(zhuǎn)化技術的具有種子的高等植物類型,包括單子葉和雙子葉植物。來自從轉(zhuǎn)化的植物細胞,植物部分或植物組織再生的植物或從再生的轉(zhuǎn)化植物產(chǎn)生的后代的種子可直接用作飼料或食品,或可進行進一步的加工。在本發(fā)明的實踐中,最優(yōu)選的植物種子選自大豆,canola,向日葵,高粱和玉米。更優(yōu)選的是,植物種子是玉米或大豆的種子,最優(yōu)選的是大豆Glycinemax的種子。根據(jù)本發(fā)明植物的轉(zhuǎn)化可基本上以植物分子生物學領域的技術人員已知的各種方式中的任一種進行。這些方式包括但不限于微粒轟擊,顯微注射,包含部分細胞壁的原生質(zhì)或細胞的電穿孔及土壤桿菌介導的DNA轉(zhuǎn)移。
本文使用的“重組”DNA是從細胞分離,純化或擴增的DNA序列或片段。
本文使用的“分離的”指從細胞物理上分離的或根據(jù)分離的DNA片段的序列在體外合成的。
本文使用的“白蛋白”指種子蛋白質(zhì),其基因編碼在組成上相似于且同源于2S白蛋白種子蛋白質(zhì)家族的肽前體。見Shewry,出處同上;本文引用其全文以供參考。
本文使用的“2S大豆白蛋白”指甘氨酸種子蛋白,其基因編碼的肽前體是白蛋白的類似物。
本發(fā)明提供了以足以減小或避免飼料添加的水平在種子中表達預選氨基酸組成的蛋白質(zhì)。由本發(fā)明的預選的DNA片段編碼的優(yōu)選蛋白質(zhì)是種子貯存蛋白質(zhì)。由于種子貯存蛋白質(zhì)正常情況下在種子中積累,這些蛋白質(zhì)在種子中的過度表達不必克服與細胞中裝配,靶向和加工機制的不相容性。另外,與野生型種子相比誘導過敏反應增強的危險最小。本發(fā)明優(yōu)選的實施方案包括富含賴氨酸及含硫氨基酸的種子貯存蛋白質(zhì)。該蛋白質(zhì)的一個實施例是白蛋白。為了以增加種子中預選氨基酸水平的水平增強預選氨基酸組成的蛋白質(zhì)在種子中的表達,可采用具有種子特異性啟動子的表達盒。
I.用于轉(zhuǎn)化的DNA用于導入植物細胞的編碼種子貯存蛋白質(zhì)的DNA包括從任何來源產(chǎn)生或分離的DNA,可以隨后對其結構,大小和/或功能進行鑒定,經(jīng)化學改變并后來導入植物中。由一種來源“產(chǎn)生”的DNA的例子是鑒定為在給定的生物內(nèi)有用的片段并然后以基本上純的形式合成的DNA序列或片段。從一種來源“分離”的DNA的例子是用化學工具,例如經(jīng)過使用限制性核酸內(nèi)切酶從來源中切割或取出的有用的DNA片段,以便以遺傳工程的方法進一步用于本發(fā)明的操作如擴增。
因此,有用的DNA包括完全合成的DNA,半合成的DNA,從生物學來源分離的DNA及從RNA產(chǎn)生的DNA。從生物學來源分離的DNA或從RNA產(chǎn)生的DNA包括但不限于從植物基因和諸如來自細菌,酵母,動物或病毒的非植物基因得到的DNA或RNA。該DNA或RNA可包括修飾的基因,基因部分或嵌合基因,包括來自相同或不同基因型的基因。術語“嵌合基因”或“嵌合DNA”定義為包含來自在自然條件下不進行DNA重組的種類的至少2個DNA序列或片段的基因或DNA序列或片段,或以在正常情況下在未轉(zhuǎn)化植物的天然基因組中不出現(xiàn)的方法定位或連接的DNA序列或片段。因此,從給定大豆基因型中分離預選的DNA片段并隨后將至少一個預選的DNA片段的拷貝導入相同基因型中是在本發(fā)明的范圍內(nèi)。
本發(fā)明預選的DNA片段可用標準方法鑒定,如富集方案,或針對特定核苷酸或氨基酸序列分離的探針。經(jīng)過獲得和/或篩選從來自特定細胞類型,細胞系,原代細胞或組織的核酸產(chǎn)生的DNA或cDNA文庫可鑒定預選的DNA片段。對編碼全部或部分預選DNA片段的DNA片段的篩選經(jīng)過從基因組或cDNA文庫篩選與來自其它生物的預選DNA片段的探針雜交的噬菌斑或經(jīng)過從cDNA表達文庫篩選與特異性識別預選DNA片段編碼的蛋白質(zhì)的抗體結合的噬菌斑來實現(xiàn)。與來自其它生物的預選DNA片段探針雜交的DNA片段和/或攜帶與抗預選DNA片段編碼的蛋白質(zhì)的抗體具有免疫反應性的DNA片段的噬斑可亞克隆進載體中并測序和/或用作鑒定編碼全部或部分預選DNA片段的其它cDNA或基因組序列的探針。
基因組拷貝的部分或預選DNA片段的拷貝可部分測序和用包括與其它同源基因的DNA序列同源性或比較所編碼的氨基酸序列與已知的蛋白質(zhì)序列的標準方法來鑒定。一旦鑒定了預選DNA片段的部分,可用標準方法獲得預選DNA片段的完全拷貝,包括克隆或使用與預選的DNA片段互補的寡核苷酸引物進行的聚合酶鏈式反應(PCR)。經(jīng)過比較其推斷的氨基酸序列與天然多肽序列的氨基酸序列可證實預選的DNA片段的原分離的全長拷貝的存在。
可用包括但不限于定點誘變的本領域熟知的方法修飾編碼種子貯存蛋白質(zhì)的預選DNA片段來增加該蛋白質(zhì)中特定氨基酸殘基的含量。因此,經(jīng)過對編碼該蛋白質(zhì)的預選DNA片段的核苷酸取代以產(chǎn)生在相應于具有核苷酸取代的密碼子的該蛋白質(zhì)的該位置具有不同氨基酸的蛋白質(zhì)來制備天然存在的蛋白質(zhì)的衍生物。在蛋白質(zhì)中導入多個氨基酸改變可產(chǎn)生明顯富含預選氨基酸的蛋白質(zhì)。
因此,本發(fā)明提供了包含編碼種子貯存蛋白質(zhì)的預選DNA片段的DNA分子。該預選的DNA片段可編碼任意種子貯存蛋白質(zhì)。包括但不限于2S,7S和11S種子貯存蛋白質(zhì),含有或不含對編碼這些蛋白質(zhì)的序列的修飾。技術人員將會認識到可根據(jù)該蛋白質(zhì)的氨基酸組成和其在種子中積累的能力選擇預選DNA片段所編碼的蛋白質(zhì)??蛇x擇對其具有營養(yǎng)價值的氨基酸以產(chǎn)生對植物或植物部分增加了價值的特征。對增加價值的特征所需的氨基酸以及限制內(nèi)源性蛋白質(zhì)合成的來源包括但不限于甲硫氨酸,半胱氨酸和賴氨酸。
還提供了經(jīng)過在種子表達編碼蛋白質(zhì)的預選DNA片段來增加種子中至少一種預選的氨基酸的水平的方法。優(yōu)選的是,預選的氨基酸是賴.氨酸。更優(yōu)選的是,本發(fā)明還包括第二種預選的氨基酸。甚至更優(yōu)選的是,第二種預選的氨基酸是甲硫氨酸或半胱氨酸。預選的DNA片段或多拷貝的預選的DNA片段的表達可增加種子中由預選的DNA片段編碼的蛋白質(zhì)的水平,從而增加了摻入進由預選的DNA片段編碼的蛋白質(zhì)中的預選氨基酸的水平。提供了用于生產(chǎn)包含具有編碼蛋白質(zhì)的預選DNA片段的表達盒的植物培養(yǎng)物,植物組織,植物和種子的方法和組合物。本發(fā)明提供了遺傳改造植物的方法,使植物產(chǎn)生具有至少一種預選的氨基酸的水平增加的種子。使植物和種子將該特征經(jīng)生殖傳遞給其后代。
在優(yōu)選的實施方案中,由預選的DNA片段編碼的蛋白質(zhì)是富含硫的2S種子貯存蛋白質(zhì),如白蛋白。在本發(fā)明更優(yōu)選的實施方案中,預選的DNA片段編碼內(nèi)源性2S大豆白蛋白,以舉例而不是限制的方式,本領域的技術人員將容易預見可用來自其它生物的2S白蛋白基因取代大豆2S白蛋白蛋白質(zhì)。例如,見Coulter等,J.Exp.Bot.;Vol.41;p.1541;(1990);本文引用其全文以供參考。
在本發(fā)明范圍內(nèi)的富含硫的植物蛋白質(zhì)的其它例子包括半胱氨酸而不是甲硫氨酸豐富的植物蛋白質(zhì),如小麥胚乳嘌呤硫素(Mak和Jones;加拿大生化雜志;Vol.22;p.83J;(1976);本文引用其全文以供參考),豌豆低分子量白蛋白(Higgins等,生物化學雜志;Vol.261;p.11124;(1986);本文引用其全文以供參考)。該蛋白質(zhì)還包括富含甲硫氨酸的植物蛋白質(zhì),如來自向日葵種子(Lilley等,在關于植物蛋白質(zhì)在人類食品和動物飼料中的利用的世界會議錄;Applewhite.H(編輯);美國油類化學家協(xié)會;Champaign,IL;pp.497-502;(1989),本文引用其全文以供參考),玉米(Pedersen,等;生物化學雜志,p.261;p.6279;(1986);Kirihara等,基因,Vol;71;p.359;(1988);本文以其全文引用它們以供參考),和水稻(Musumura.等.;植物分子生物學;Vol.12;p.123;(1989);本文引用其全文以供參考)。
表達盒和表達載體根據(jù)本發(fā)明,編碼諸如種子貯存蛋白質(zhì)的蛋白質(zhì)的預選的DNA片段經(jīng)鑒定,分離并與至少一種在諸如植物細胞的宿主細胞中有功能的啟動子組合以提供重組表達盒。可用于與本發(fā)明相聯(lián)的該表達盒的構建根據(jù)本說明書的教導對本領域的技術人員而言是熟知的。例如,見Sambrook等;分子克隆實驗手冊;紐約冷泉港(1989);Gelvin等;植物分子生物學手冊;(1990);植物生物技術 商用前景和問題,Prakash等,編輯,牛津和IBH出版公司;New Delhi.India;(1993);和Heslot等,酵母的分子生物學和遺傳工程;CRC出版社,美國,(1992);本文以其全文引用每一篇作為參考。
啟動子本發(fā)明優(yōu)選的表達盒一般包括但不限于種子特異性啟動子。種子特異性啟動子的例子包括在種子中以高度調(diào)節(jié)的方式表達這些蛋白質(zhì)的種子貯存蛋白質(zhì)的啟動子(Thompson等;BioEssays;Vol.10;p.108;(1989);本文引用其全文以供參考,如,對于雙子葉植物,有菜豆β-菜豆蛋白啟動子,napin啟動子,β-conglycinin啟動子和大豆凝集素啟動子。對于單子葉植物,在本發(fā)明的實踐中有用的啟動子包括但不限于玉米15kD的玉米醇溶蛋白啟動子,22kD玉米醇溶蛋白啟動子,γ-玉米醇溶蛋白啟動子,蠟質(zhì)啟動子,shrunken1啟動子,球蛋白1啟動子,和shrunken2啟動子。然而,在本發(fā)明的實踐中有用的其它啟動子對本領域的技術人員來說是已知的。
II.將DNA傳遞給細胞用常規(guī)可得的方法可將表達盒或載體導入原核或真核細胞中。例如,經(jīng)過包括但不限于土壤桿菌介導的轉(zhuǎn)化,電穿孔,微粒轟擊,顯微注射,感染性病毒或類病毒,使用脂質(zhì)體等的方法,均按熟知的程序可將表達盒或載體導入植物細胞。對轉(zhuǎn)化有用的植物細胞包括在懸浮培養(yǎng)物中培養(yǎng)的細胞,愈傷組織,胚,分生組織,花粉等。使用在表達載體上編碼的可選擇的或可篩選的標記一般可選擇轉(zhuǎn)化的細胞。
使用根癌土壤桿菌的腫瘤誘導(Ti)質(zhì)粒的T-DNA已顯示出可在諸如大豆,煙草,土豆和苜蓿的雙子葉植物中導入和表達外源基因。使用重組DNA技術和細菌遺傳學,可將眾多不同的外源DNA插入土壤桿菌的T-DNA中。經(jīng)含重組Ti質(zhì)粒的細菌感染后,將外源DNA插入植物染色體的宿主中,從而產(chǎn)生遺傳改造的細胞并最終產(chǎn)生遺傳改造的植物。第二種方案是導入根誘導(Ri)質(zhì)粒作為基因載體。
盡管土壤桿菌似乎優(yōu)先感染雙子葉植物,但包括玉米,小麥,水稻,大麥,燕麥,高粱,黍,和黑麥的許多重要農(nóng)作物是單子葉植物且已知不容易對土壤桿菌的轉(zhuǎn)化敏感。然而將來可對Ti質(zhì)粒進行操作以用作單子葉植物的載體。另外,使用Ti質(zhì)粒作模型系統(tǒng),可人工構建用于單子葉植物的轉(zhuǎn)化載體。用人工方法也可將Ti質(zhì)粒導入單子葉植物,如顯微注射,或單子葉植物原生質(zhì)體與含T-區(qū)域的細菌原生質(zhì)球之間的融合,然后,它能整合進植物細胞核DNA中。其它的轉(zhuǎn)化方法對于本領域的技術人員來說是易于獲得的。
III.轉(zhuǎn)化體的再生和分析轉(zhuǎn)化后,再生涉及從轉(zhuǎn)化的細胞獲得完整植株并經(jīng)試驗檢測再生植物中預選的DNA片段或“轉(zhuǎn)基因”的存在。然后測定植物種子中預選氨基酸的水平。根據(jù)植物的類型和基因表達的水平,將預選的DNA片段導入植物能以對補充這些種子中的營養(yǎng)價值有用的量增加預選氨基酸的水平。
從諸如轉(zhuǎn)化的原生質(zhì)體或愈傷組織細胞系的組織培養(yǎng)物中再生植物的技術在本領域中是已知的。例如,見Phillips等;植物細胞組織器官培養(yǎng)物;Vol.1;p.123;(1981);Patterson等;植物科學;Vol.42;P.125;(1985);Wright等;植物細胞報道;Vol.6;p.83;(1987);和Barwale等;Planta;Vol.167;p.473;(1986);本文以其全文引用它們以供參考。合適方法的選擇在本領域的技術范圍內(nèi)。
本文詳細描述的本發(fā)明實踐的實施例具體涉及大豆植物和在雙子葉植物中可操作的表達載體。然而,本發(fā)明也能應用于其它植物。本文使用的表達載體可證實能在許多雙子葉植物的組織培養(yǎng)物及整個植株中的細胞中操作。本文公開的本發(fā)明因此能在雙子葉種類中操作以轉(zhuǎn)化單個的植物細胞并獲得能從轉(zhuǎn)化的植物細胞再生的且表達預選的種子貯存蛋白質(zhì)的雙子葉植物種類的完整植物。
導入的預選DNA片段在轉(zhuǎn)化的植物細胞中表達并穩(wěn)定傳遞(經(jīng)體細胞和生殖)給產(chǎn)生的細胞下一代。載體應能在植物細胞中導入,維持并表達預選的DNA片段。另外,可將載體導入眾多不同的植物細胞中。預選的DNA片段經(jīng)正常有性傳遞傳給后代。
為了證實預選的DNA片段或“轉(zhuǎn)基因”在再生植物或種子或由再生植物產(chǎn)生的后代中的存在,可進行各種試驗。該試驗包括,例如,對本領域的技術人員熟知的“分子生物學”試驗,如Southern和Northern印跡和PCR;“生化”試驗,如經(jīng)免疫學方法(ELISA和Western印跡)或經(jīng)酶功能檢測蛋白質(zhì)產(chǎn)品的存在;植物部分試驗,如葉,種子或根試驗;且也經(jīng)過分析完整再生植物的基因型來進行試驗。
鑒于使用從植物的任意部分分離的DNA可進行DNA分析技術,RNA僅能在特定細胞或組織類型中表達,因此,必須從這些組織中制備用于分析的RNA。PCR技術也可用于檢測和定量從導入的預選DNA片段產(chǎn)生的RNA。在PCR的該應用中,首先必需使用諸如逆轉(zhuǎn)錄酶的酶類將RNA逆轉(zhuǎn)錄成DNA,然后通過使用常規(guī)PCR技術擴增該DNA。在大多數(shù)情況下,PCR技術盡管有用,但不能證實RNA產(chǎn)物的完整性。關于RNA產(chǎn)物的性質(zhì)的進一步的信息可由Northern印跡獲得。該技術證實了RNA種類的存在并給出了關于該RNA完整性的信息。使用斑點或狹線印跡Northern雜交也能測定RNA種類的存在與否。這些技術是Northern印跡的改良且僅證實了RNA種類的存在與否。
盡管Southern印跡和PCR可用于檢測感興趣的預選DNA片段,但它們不提供關于預選的DNA片段是否被表達的信息。經(jīng)過特異性地鑒定導入的預選DNA片段的蛋白質(zhì)產(chǎn)物或評價由其表達所帶來的基因型改良可評價表達。
對于特定蛋白質(zhì)的生產(chǎn)和鑒定的試驗可利用該蛋白質(zhì)的物理化學,結構,功能或其它特征。獨特的物理化學或結構特征允許經(jīng)諸如天然或變性凝膠電泳或等電聚焦的電泳程序或經(jīng)諸如離子交換或凝膠排阻色譜的色譜技術分離和鑒定該蛋白質(zhì)。不同蛋白質(zhì)的獨特結構提供了使用特異性抗體以諸如ELISA試驗的方式檢測其存在的機會。使用組合方案具有更大的特異性,如抗體用于定位已用電泳技術分離的單個基因產(chǎn)物的Western印跡??刹捎闷渌募夹g以絕對證實所感興趣的產(chǎn)物的鑒定,如經(jīng)純化后氨基酸測序來評價。盡管這些是最常用的方法,但也可使用其它方法。
非常常見的是,基因產(chǎn)物的表達經(jīng)評價其表達的基因型結果來測定。這些試驗也可采取任何形式,包括但不限于分析植物化學成份,形態(tài),或生理特征的改變。經(jīng)過表達編碼改變氨基酸組成的貯存蛋白質(zhì)的預選DNA片段可改變化學成份并可經(jīng)氨基酸分析來檢測。
本發(fā)明中有用的育種技術是本領域中熟知的。
本發(fā)明已參考各種具體的和優(yōu)選的實施方案進行了描述且將參考下面詳細的實施例進行進一步的描述。然而,應理解除在實施例和描述中所顯示的外可對本發(fā)明的基本主題進行許多延伸,變化和修飾,它們都在本發(fā)明的實質(zhì)和范圍內(nèi)。
實施例1大豆2S白蛋白的分離和鑒定大豆植物(G.max Merr.)品種在溫室或野外生長。除非另有說明,試劑和實驗設備從Sigma化學公司(St.Louis,MO)或Baxter(McGawPark,IL)獲得。用牛血清白蛋白(Pierce,Rockford,II)作標準根據(jù)Bradford(BioRad蛋白測定,BioRad,Hercules,CA)或改良的Lowry測定(DC蛋白測定,BioRad)估計蛋白質(zhì)的濃度。
本發(fā)明包含下面的步驟a)從大豆粉提取蛋白質(zhì);b)對蛋白質(zhì)提取物進行大小排阻層析;c)收集含白蛋白的級分;d)用白蛋白與樹脂基質(zhì)的特異性相互作用從其它蛋白污染物中分離白蛋白;e)用離子交換層析分離單個白蛋白。
使用Schagger和von Jagow建立的Tris-Tricine緩沖系統(tǒng)進行SDS聚丙烯酰胺凝膠電泳(“PAGE”)。見Schagger,H.和von Jagow,G.,生物化學年鑒,Vol.166,p.368(1987);本文引用其全文以供參考。對常規(guī)目的,多肽的分離在16.5%Mini-Protein II預制小凝膠(80×73mnReady Gels,BioRad,Richmond,CA)中進行,或當需要在2和25kDa之間的分子量范圍內(nèi)對多肽的高分辨時,使用Model V16電泳裝置(Gibco BRL,Gaithersburg,MD)在170×150mm 8-22%聚丙烯酰胺遞度凝膠中進行。經(jīng)過用考馬斯亮藍R250染色檢測蛋白質(zhì)帶。
當表明電泳分離該蛋白質(zhì)后,使用半干燥的電印跡器(SemiPhorTE70,Hoefer,San Francisco,CA)將分離的多肽電轉(zhuǎn)移到聚偏二氟乙烯(PVDF)膜(Immobilon PSQ,Millipore,Bedford,MA)上,如Matsudaira(生物化學雜志,Vol.262;p.10035;(1987);本文引用其全文以供參考)所述。在氨基酸測序前采取一些預防方法以防止N端氨基封閉并減小氨基酸側(cè)鏈的修飾。包括積層凝膠的Tris/Tricine凝膠在蛋白質(zhì)分離前3-7天灌制并4℃密封貯存。剛好在分離前,用0.1%SDS,0.75M Tris/HCl,pH8.45(陽極緩沖液)和0.1%SDS,1M Tris/HCl,pH8.45(陰極緩沖液)在2V/cm下對凝膠進行預電泳15小時。將多肽電轉(zhuǎn)移到PVDF(見上)上并用考馬斯藍染色后,用水充分洗滌印跡并干燥。從膜上小心切下感興趣的多肽帶并4℃貯存于小離心管中備用。經(jīng)過使用依阿華大學蛋白質(zhì)分析實驗室(依阿華市,IA)的應用生物系統(tǒng)477A蛋白質(zhì)測序儀從Immobilon PSQ膜獲得N端序列。
根據(jù)標準程序?qū)eckman 6300分析儀進行氨基酸分析。用過甲酸氧化后以甲硫氨酸砜和磺基丙氨酸來測定甲硫氨酸和半胱氨酸。根據(jù)廠家建議用Novex低范圍IEF蛋白質(zhì)標準品在預制板凝膠(pH效果范圍3.5-6.5,Novex,San Diego CA)上進行蛋白質(zhì)的等電聚焦。
為了測定分離的蛋白質(zhì)是否含有N-連接的聚糖,以修改為用化學發(fā)光(ECL試劑盒,Amersham,Arlington Heights.IL)觀察辣根過氧化物酶活性的Faye和Chrispeels(生化年鑒;Vol.149.p.218;(1985);本文引用其全文以供參考)所述的方法進行對蛋白質(zhì)印跡的伴刀豆球蛋白A-辣根過氧化物酶染色(見上)。
為了用N-糖苷酶F(Boehringer Mannheim,Indianapolis,IN)處理(0.1U/10μl,37℃15小時),蛋白質(zhì)樣品(10μg/10μl)在0.1%SDS,200mM NaCl,20mM Tris/HCl,pH8.5中95℃變性2分鐘,冷卻到4℃,補充1%Triton X-100并在加入酶前室溫培養(yǎng)15分鐘。
富含賴氨酸和富含硫的大豆2S白蛋白的純化和表征表達來自巴西堅果(Bertholletia excelsa)的富含甲硫氨酸的2S種子貯存蛋白質(zhì)的轉(zhuǎn)基因大豆種子顯示出富含硫的內(nèi)源性Bowman-Birk抑制劑水平下降(Kollipara,K.P.和Hymowitz,R.;農(nóng)業(yè)食品雜志;Vol,40;pp.2356-2363;(1992);本文引用其全文以供參考)及未知的14kDa蛋白質(zhì)水平下降。為了測定未知的14kDa蛋白質(zhì)是否是富含甲硫氨酸的種子貯存蛋白質(zhì),電泳分離來自野生型種子和BNP轉(zhuǎn)基因種子的種子蛋白質(zhì)并電轉(zhuǎn)移到PVDF膜上,然后根據(jù)de Lumen和Kho(農(nóng)業(yè)食品化學雜志)Vol.35,p.688;(1987);本文引用其全文以供參考)的方法用碘[14C]乙酸(ICN Radiochemicals,Irvine,CA).pH2.0探測膜。該凝膠印跡的放射自顯影顯示14kDa蛋白質(zhì)是富含甲硫氨酸的蛋白質(zhì)。該蛋白質(zhì)屬于以前由Kho和de Lumen(植物食品人類營養(yǎng);Vol,38;p.287;(1988)本文引用其全文以供參考)用相同技術獲得的含甲硫氨酸肽的家族。
為了純化該蛋白質(zhì),將大豆的成熟于種子(Glycme max)磨成細粉,用已烷(1∶1w/v)提取脫脂并真空干燥。將100g脫脂粉在Waring攪拌器中用400ml 10%DMSO,0.5%正丁醇,100mM KCl,83mM乙酸鈉緩沖液,pH5.2(白蛋白提取緩沖液)4℃勻漿5分鐘。在冰上或在4℃進行下面的步驟。
漿液通過Miracloth(Calbiochem,LaJoUa,CA)過濾并以6000xg離心15分鐘。用0.5%正丁醇,100mMKCl,83mM乙酸鈉緩沖液pH5.2充分透析回收的上清(Spectra/por7,MWCO3500,Baxter,McGaw Park,IL)并用干燥的聚乙二醇(PEG 8000)在透析袋中濃縮到大約100ml。經(jīng)過在6000xg下離心15分鐘并通過0.45μm的膜過濾去掉沉淀的污染球蛋白的蛋白質(zhì)。所得的白蛋白提取物含大約20%的總種子蛋白質(zhì)。用包含野生型種子中大約1-2%總大豆種子蛋白質(zhì)(0.5-1%的種子重量)的14kDa多肽代表5-10%的白蛋白級分。在稀釋的酸性緩沖液中的提取能力將14kDa蛋白質(zhì)分類為白蛋白(Osborne,蔬菜蛋白質(zhì),Longman,G,(編輯),倫敦(1924);本文引用其全文以供參考)。14kDa蛋白質(zhì)在還原條件下在SDS PAGE中解離成兩種多肽,分別大約為10kDa和5kDa,表明在完整蛋白質(zhì)中以二硫鍵連接。
使用以提取緩沖液洗脫的Supperdex 75 Hiload 26/60柱(Pharmacia,Uppsala,Sweden)進一步分離5ml濃縮的白蛋白提取物(濃度大約為20mg/ml)。流速維持在1ml/分,收集4ml級分并以PAGE分析。以大約50%的純度且Kunitz胰蛋白酶抑制劑(KTI)(Kollipara,出處同上)作主要污染物獲得的含推斷的白蛋白的級分(級分33-35,18mg蛋白質(zhì))用Tris HCl(1M)調(diào)到pH8.5并用100ml Sephadex G 25 sf柱(Pharmacia,Uppsala,Sweden)以50mM乙酸鈉pH5.2進行層析,緩沖液流速為1ml/分。
在這些條件下,14kDa蛋白質(zhì)表現(xiàn)出與柱中葡聚糖基質(zhì)的意想不到的相互作用并且以超過95%的純度作為單一峰從其蛋白質(zhì)污染中分離。用巴西堅果的2S白蛋白可觀察到與葡聚糖基質(zhì)相似的特異性相互作用并可用于在單個步驟中對其進行純化。其它白蛋白也具有相似的行為方式。本領域的技術人員已知的其它碳水化合物基質(zhì)同樣可用于該方法。盡管上述色譜步驟已被具體描述,但可用涉及特異性相互作用的其它技術來代替,例如但不限于分批工藝。
上面獲得的推斷的白蛋白級分用20mM Tris/HCl pH8.5透析(Spectra/por7)15小時,并用干燥的PEG 8000在透析袋中濃縮到大約0.5mg/ml蛋白質(zhì)。5mg脫鹽的蛋白質(zhì)通過0.2μm膜濾器過濾并使用在20mM Tris/HCl pH8.5緩沖液中的0-750mM NaCl的梯度建立的MonoQ HR 5/5(Pharmacia,Uppsala,Sweden)柱經(jīng)離子交換色譜進一步分級分離。三個分離的峰以180mM NaCl(命名為白蛋白1),250mMNaCl(命名為白蛋白2)和360mM NaCl(命名為白蛋白3)洗脫。白蛋白3(Al3)似乎是主要的形式,即,在合并的所有3個級分中它含超過90%的蛋白質(zhì),而與Al3相比,發(fā)現(xiàn)白蛋白1(Al1)和白蛋白2(Al2)在大豆種子蛋白質(zhì)中的豐度各少大約20倍。以基于SDS-PAGE的幾乎勻質(zhì)的形式獲得所有3種白蛋白級分。用還原劑2-巰基乙醇處理后,三種白蛋白形式中每一種在SDS PAGE中解離成2個更小的不同長度的多肽,表明在天然蛋白質(zhì)中存在二硫鍵。在各還原的白蛋白中較大的多肽的大小似乎相似(10kDa),而較短的肽似乎具有不同的大小。分別估計Al1小鏈的分子量為4.5kDa,Al2小鏈為4.8kDa,Al3小鏈為5.1kDa。
對電泳分離的Al2大鏈,Al2小鏈,Al3大鏈和Al3短鏈的PVDF印跡進行氨基酸分析(表1)。兩種白蛋白含有預期高含量的甲硫氨酸,另外還含有驚人的高賴氨酸百分數(shù)。盡管似乎兩個白蛋白的氨基酸組成基本相似,但觀察到具有一些氨基酸的一些明顯的區(qū)別。
表1氨基酸組成Al2 Al35kDa11kDa 5kDa11kDa肽摩爾%肽摩爾%肽摩爾%肽摩爾%Cys1.933.382.792.88Asx10.89 8.1717.96 9.47Met3.138.002.358.70Thr1.761.034.103.02Ser9.629.007.057.43Glx21.86 19.39 15.42 21.80Pro0.002.653.673.02Gly14.01 9.435.856.64Ala12.99 10.72 5.2911.10Val0.000.003.630.42Ile6.595.904.464.07Leu5.338.966.848.32Tyr0.380.642.450.00Phe0.760.541.900.31His2.931.113.091.24Lys4.248.116.438.85Arg3.582.966.801.85
用自動Edman降解法在應用生物系統(tǒng)測序儀中從各自電泳肽帶的PVDF印跡測定了所有小鏈和大鏈肽的氨基末端序列。白蛋白1和2的氨基末端序列是相同的。白蛋白3的氨基末端序列與白蛋白1和2的不同。然而,白蛋白3的氨基末端序列與白蛋白1和2的氨基末端序列具有高度的同源性(大約80%)。這些氨基末端序列與在來自狹葉羽扇豆L.的富含硫的2S蛋白質(zhì)羽扇豆球蛋白δ中發(fā)現(xiàn)的序列最密切相關(Gayler,等;植物分子生物學;Vol.15;p.879(1990),本文引用其全文以供參考)。
為了解釋Al肽之間的區(qū)別,用等電聚焦進一步分析白蛋白級分。分別測定了Al1的等電點為pH6.05,Al2為pH5.45,Al3為pH4.95。
由于對Al1和Al3特異性的cDNA編碼用于天冬酰胺連接的N-糖基化的共同序列(見下),分析了結合到含白蛋白部分的伴刀豆球蛋白A。Al1肽不結合伴刀豆球蛋白,N-糖苷酶F處理后在SDS PAGE中無明顯的分子量大小差異。因此,大豆白蛋白的N-糖基化似乎是不可能的。
蛋白質(zhì)測序資料和氨基酸組成結果表明在大豆種子中存在下面明顯尚未描述的富含甲硫氨酸和賴氨酸的白蛋白基因產(chǎn)物,即Al1,Al2和Al3。經(jīng)過假定相同基因產(chǎn)物的不同翻譯后加工事件可解釋N端Al1和Al2氨基酸序列的相似性。
實施例II從大豆種子cDNA文庫分離白蛋白特異性cDNA克隆,RNA分離,cDNA合成和序列分析DNA分離,DNA操作,DNA的放射性標記和雜交基本上按Sambrook等(分子克隆實驗手冊,冷泉港(1989);本文引用其全文以供參考)所述進行。
大豆植物(Glycme max Merr)在溫室或野外生長。收獲發(fā)育,成熟中期的大豆種子并在-80℃冷凍貯存以用作cDNA文庫構建的mRNA來源。
從收集的正在發(fā)育的大豆種子(1-15mm大)分離總RNA。在杵臼中將冷凍種子(1-2g鮮重)研成粉末,根據(jù)Shure等;細胞;Vol.35;p.225-233;(1983)(本文引用其全文以供參考)所述的方法分離RNA。根據(jù)廠家說明書(Pharmacia,Uppsala,Sweden)使用oligo-dTSepharose旋轉(zhuǎn)柱從1mg總RNA分離mRNA。將5μg純化的mRNA用作cDNA合成的模板并根據(jù)廠家說明書(Stratagene,La Jolla,CA)連接進StratageneλZap II載體臂。100ng選定大小的cDNA(>500bp)連接到載體臂上并包裝(Stratagene Gigapack Gold)以產(chǎn)生平均cDNA插入大小為l.2kb的1.2×106pfu的一級文庫。該文庫在大腸桿菌Sure細胞(Stratagene)中擴增以產(chǎn)生2×1010pfu/ml的滴度。
分離200個隨機噬斑并重懸于500μl SM。使用輔助噬菌體R408和大腸桿菌宿主菌株XLl Blue根據(jù)Stratagene推薦的方法從λZAP II載體切下噬菌粒(Bluescript S/K)。單個菌落在2ml含100μg/ml氨芐青霉素的2×YT培養(yǎng)基中生長過夜。以堿裂解和乙醇沉淀分離質(zhì)粒(Sambrook等;出處同上;(1989);本文引用其全文以供參考)。
使用T3引物,經(jīng)過在ABI催化劑8000分子工作站和ABI 1373A測序儀(應用生物系統(tǒng))上進行Taq循環(huán)測序從200個單獨的cDNA克隆中獲得5′序列。人工編輯序列資料以去掉載體序列,產(chǎn)生使用該文庫來自200個隨機挑選的cDNA克隆的DNA序列信息數(shù)據(jù)以利于鑒定和分離編碼充足表達的多肽序列(白蛋白多肽是一個例子)的cDNA克隆。
白蛋白特異性cDNA克隆的鑒定使用FASTA系統(tǒng)(遺傳學計算機組,Wisconsin序列分析軟件裝,第8版)用相應于Al1/2和Al3小和大鏈的氨基末端序列的逆向翻譯的DNA序列檢索cDNA數(shù)據(jù)庫。發(fā)現(xiàn)克隆EST3_38的推斷的氨基酸序列的片段表現(xiàn)出與來自Al1小和大鏈的氨基末端序列精確匹配。發(fā)現(xiàn)克隆EST2_36,克隆EST3_13,克隆EST3_14和克隆EST3_62的推斷的氨基酸序列與獲得的Al3肽的氨基未端序列精確匹配。而且,使用TFASTA系統(tǒng)(遺傳學計算機組)將克隆EST3_38和克隆3_62的推斷的氨基酸序列與Genbank序列數(shù)據(jù)庫進行計算機比較揭示出與來自羽扇豆種子(狹葉羽扇豆)的富含硫的2S蛋白質(zhì)羽扇豆球蛋白δ具有同源性。(Gayler等;出處同上;(1990);本文引用其全文以供參考)。
使用Amersham的Ready引物試劑盒用[32P]dCTP(Amersham)標記來自克隆EST3_38的大約600bp的EcoRI片段和來自克隆EST3_62的大約400bp的EcoRI/SacI片段。標記的片段用于從在λZapII(Stratagene)中的來自發(fā)育中的大豆種子的cDNA文庫篩選15,000的重組噬菌體。在該文庫中的大約3%的克隆與兩種白蛋白探針雜交。
隨機選擇45個白蛋白特異性噬菌體,根據(jù)廠家建議隨后切下相應的噬菌粒并測序。在測序的克隆中,發(fā)現(xiàn)42個是白蛋白3特異性的(7個編碼全長編碼序列)且3個是白蛋白1特異性的(一個編碼全長編碼序列)。
最長的鑒定的Al1和Al3的特異性克隆pAl1_42和pA13-49的插入片段分別對其整體進行測序(圖2和3)且隨后分別以名稱p9330和p9331進入Pioneer質(zhì)粒保藏中心。序列分析清楚地鑒定了這些克隆含編碼N-端信號肽和終止密碼子的全長編碼序列。
白蛋白1由包含于723個堿基對的cDNA(SEQ ID NO1)中的465個堿基對編碼。該cDNA編碼具有155個氨基酸的前體肽原(SEQID NO:2)。該前體肽原包含20個氨基酸的信號肽,大約55個氨基酸的小鏈,大約80個氨基酸的長鏈。成熟白蛋白蛋白質(zhì)包含2個二硫鍵連接的鏈,4-5kDa的小鏈和10kDa的大鏈。至于推斷的氨基酸的氨基酸組成,白蛋白1的序列包括11.8mol%的甲硫氨酸和半胱氨酸,9.6mol%的賴氨酸殘基和12.6mol%的天冬酰胺和谷氨酰胺殘基。
白蛋白3由包含于777個堿基對cDNA(SEQ ID NO3)中的474個堿基對編碼。該cDNA編碼具有158個氨基酸的前體肽原(SEQ IDNO4)。前體肽原包含21個氨基酸信號肽,大約60個氨基酸小鏈和77個氨基酸大鏈。成熟白蛋白3含2個二硫鍵連接的鏈。白蛋白3的推斷的氨基酸組成包括11.6mol%的甲硫氨酸和半胱氨酸殘基,10.2mol%的賴氨酸殘基,和13.2mol%的天冬酰胺和谷氨酰胺殘基。
實施例III為了進一步增加優(yōu)選的氨基酸殘基賴氨酸和甲硫氨酸且為了進一步減少非優(yōu)選的氨基酸殘基天冬酰胺和谷氨酰胺,根據(jù)Al1和Al3的氨基酸序列的GAP序列對比(遺傳學計算機組)(圖5)制備了編碼稱為白蛋1/3(Al1/3)的嵌合白蛋白(SEQ ID NO6)的cDNA。
使用BioRad(Hercules,CA)的Muta-Gene噬菌粒體外誘變試劑盒根據(jù)Kunkel方法(Kunkel,T.A.,美國國家科學院學報,Vol.82;p.488;(1985);本文引用其全文以供參考)按廠家建議以定向寡聚脫氧核糖核苷酸誘變修飾cDNA克隆p9331(pAl3.49)。用5個寡聚脫氧核糖核苷酸引物體外誘變5個連續(xù)的重復進行誘變。引物及其導致cDNA序列的改變在表2中小結。
表2誘變的寡聚脫氧核糖核苷酸引物SEO與編碼的改變的ID Al3前體肽 氨基酸NO寡聚脫氧核糖核苷酸序列 原相關的誘 密碼子變氨基位置7 5′GCTGCCGCAAGCAGCTTAAGGGGGTGAACCTC3′ 36 Gln到Lys8 5′GGAAGAATCAACTACATACGTAAGAAGGAAGGAAAAGACG3′ 80 Arg到Lys81 Asn到Lys9 5′GCTGCACAGAAATGAGCGAGCTTAAGA.GCCCCAAATGCCAGTGC3′105 Arg到Lys10 5′GGAGGAGAAGGAGAAGAAGAAAATGGAGAAGGAGTTCATGAACTTGGC3′ 129 Gln到Glu138 Ile到Met11 5′GCAGGTTTGGGCCCATGATCGGGTGCGACTTGTCCTC3′151 Gln到Gly
基本上僅將在編碼Al3的cDNA的所示位置的氨基酸密碼子改變成在Al1蛋白質(zhì)序列的相同相關位置(GAP序列對比)發(fā)現(xiàn)的編碼優(yōu)選氨基酸的密碼子。因此,所得的氨基酸序列Al1/3稱為嵌合白蛋白。所有的氨基酸殘基改變在認為對其它植物種類的種子相關2S白蛋白的蛋白質(zhì)結構重要的且因此明顯不適于改變的序列區(qū)域進行。然而,由于Al1/3中的氨基酸殘基已存在于Al1或Al3中,當在種子中表達時,嵌合蛋白質(zhì)的結構不可能表現(xiàn)出任何有害影響。白蛋白1/3具有158個氨基酸(圖6)。白蛋白1/3的氨基酸組成包括12.4mol%的甲硫氨酸和半胱氨酸殘基,13.14mol%的賴氨酸殘基,及10.3mol%的天冬酰胺和谷氨酰胺殘基。
實施例IV用高賴氨酸含量和高硫含量的貯存蛋白基因轉(zhuǎn)化Glycine max大豆(Glycine max)種子經(jīng)過暴露于在玻璃鐘罩中形成的氯氣中進行表面滅菌。經(jīng)過向100ml次氯酸鈉(5.25%w/w)中加入3.5ml鹽酸(34-37%w/w)產(chǎn)生氯氣。暴露在體積為大約1立方英寸的容器中16-20小時。表面滅菌的種子室溫貯存于培養(yǎng)皿中。根據(jù)Gamborg等(細胞研究實驗;Vol.50,pp.151-158;(1968);本文引用其全文以供參考)的方法經(jīng)過鋪板于1/10強度的瓊脂固化培養(yǎng)基上使種子發(fā)芽。培養(yǎng)基(具有基礎有機物的B5基礎培養(yǎng)基,Sigma化學公司,目錄號G5893;0.32g/L;蔗糖,0.2%w/v.和2-[N-嗎啉代]乙磺酸(MES),3.0mM)不含植物生長調(diào)節(jié)劑,以16小時的白晝長度和大約20mEm2S1的冷白色熒光照射28℃培養(yǎng)。3或4天后,制備共同培養(yǎng)的種子。去掉種皮并將子葉下伸長的根去掉3-4mm。在一些培養(yǎng)皿中每個放置10個制備的種子。
植物基因表達盒的構建含在云扁豆蛋白調(diào)節(jié)序列控制下的一個拷貝的大豆白蛋白基因的表達盒是二元質(zhì)粒p9127。p9127以定向寡聚脫氧核苷酸誘變的p9330(pAl1_42)開始在幾個步驟中構建,p9330含有Bluescript SK(Stratagene)的質(zhì)粒骨架中的Al1蛋白質(zhì)全長的冷卻序列。誘變按實施例III所述用寡聚脫氧核糖核苷酸1)5′GCACGAGTCATGACCAAGTCACAATTCTC3′(SEQ ID NO12);和2)5′TCCTCCGATGACTGAGTTAACAAAAAAAGTACTAC3′(SEQ ID NO13)進行以便放入RcaI位點且在翻譯起點破壞HindIII位點并且剛好在終止密碼子3′端加入HpaI位點。用限制性核酸內(nèi)切酶RcaI/HpaI消化時,分離出相應于編碼Al1序列全長的472堿基對DNA序列并克隆進p4752(NcoI/HpaI)。p4752(圖6)含云扁豆蛋白5′調(diào)節(jié)序列(即啟動子)的883個堿基對。接著是云扁豆蛋白5′非翻譯區(qū)的84個堿基對。剛好在這些序列的3′端是NcoI位點和HpaI位點以利于以5′→3′方向克隆開架閱讀框,導致由NcoI位點(-CCATGG)產(chǎn)生的密碼子甲硫氨酸起始翻譯成為翻譯起始密碼子。HpaI位點的下游是云扁豆蛋白3′調(diào)節(jié)序列的1230個堿基對。因此p4752含有云扁豆蛋白啟動子云扁豆蛋白終止子。
然后用限制性核酸內(nèi)切酶EcoRI/HindIII消化所得的質(zhì)粒p9069并將云扁豆蛋白啟動子Al1云扁豆蛋白終止子部分插入質(zhì)粒p1830(=pARCl2)的EcoRI/HindIII位點(Prosen等,生物技術:Vol.5;p.966;(1987),本文引用其全文以供參考)。質(zhì)粒p1830是29.5kb的質(zhì)粒,它是土壤桿菌雙重載體系統(tǒng)的一部分且含有嵌合基因胭脂氨酸合成酶/新霉素磷酸轉(zhuǎn)移酶II作為植物細胞的可選擇標記。
將p9069的2.89kb片段插入p1830后所得的質(zhì)粒稱為p9127。質(zhì)粒p9127大約33kb大小且賦予細菌宿主四環(huán)素抗性。
然后以本領域已知的凍/融方法將該質(zhì)粒轉(zhuǎn)化進根癌土壤桿菌LBA4404。二元質(zhì)粒在所得細菌中的存在以Southern印跡分析證實。
根癌土壤桿菌LBA4404/p9127的制備合并在含四環(huán)素1.0mg/ml的基礎A培養(yǎng)基中生長至對數(shù)期的含二元質(zhì)粒p9127的根癌土壤桿菌菌株LBA4404的過夜培養(yǎng)物并在550nm下測光密度。將足夠體積的培養(yǎng)物放入15ml錐形離心管中以便在每管中收集1.0至2.0×1010個細胞的沉淀,其中Q.D.550的1.0=14×109個細胞/ml。沉淀經(jīng)過在6000g下離心10分鐘產(chǎn)生。離心后棄去上清且試管在室溫靜置直至需要接種,但不能超過1小時。
轉(zhuǎn)化批量進行接種,以便用新懸浮的土壤桿菌沉淀處理各種子平板。每次沉淀重懸于20ml接種培養(yǎng)基中。接種培養(yǎng)基由B5鹽(Sigma化學公司),3.2g/l;蔗糖,2.0%w/v6-芐基氨基嘌呤(BAP),44mM吲哚丁酸(IBA),0.5mM乙酸丁香酮(AS),100mM組成且用MES.10mM緩沖至pH5.5。經(jīng)旋轉(zhuǎn)進行重懸。然后將接種物注入含制備的種子的培養(yǎng)皿中,用手術刀片離析子葉節(jié)。這通過苗端以縱切將種子分成兩半保護兩個完整的子葉來實現(xiàn)。將苗端的兩瓣經(jīng)過用手術刀片將在挖出從其各自的子葉上去掉。然后經(jīng)過沿對稱軸重復劃線用手術刀片離析子葉節(jié)。小心不要從外植體到近軸側(cè)完全切下。在大約5分鐘內(nèi)制備了20個外植體,然后不攪拌在室溫下培養(yǎng)30分鐘。在此期間制備其它的平板。30分鐘后將外植體轉(zhuǎn)移進以Gelrite(Merek&Co.,Inc.),0.2%w/v固化的相同培養(yǎng)基的平板上。以近軸側(cè)向上并與培養(yǎng)基表面齊平包埋外植體,在大約20mEm2S1的冰的白色熒光下22℃培養(yǎng)3天。
培養(yǎng)和選擇3天后,將外植體移到液體反選擇培養(yǎng)基中。反選擇培養(yǎng)基由B5 Sales3.2g/l;蔗糖2.0%w/v;BAP,5.0mM;IBA 0.5mM,萬古霉素2.00mg/ml;cefotaxime,500mg/ml組成,并用MES,3mM緩沖至pH5.7。在各平皿中以連續(xù)緩慢旋轉(zhuǎn)攪拌在室溫下洗滌10個外植體4小時。更換4次反選擇培養(yǎng)基。
然后將外植體挑到瓊脂糖固化的選擇培養(yǎng)基上。選擇培養(yǎng)基由B5 Sales,3.2g/l:蔗糖,2.0%w/v,BAP,5.0mM;IBA,0.5mM;硫酸卡那霉素50mg/ml組成并用MES3.0mM緩沖至pH5.7。選擇培養(yǎng)基用Seakem瓊脂糖0.3%w/v固化。外植體包埋于培養(yǎng)基中,近軸側(cè)向下且用16小時的白晝長度和60-80mEm2S1的冷白熒光照射28℃培養(yǎng)。
2周后,在旋轉(zhuǎn)搖床中用液體培養(yǎng)基再洗滌外植體。這次在含硫酸卡那霉素50mg/ml的反選擇培養(yǎng)基中洗滌過夜。第二天將外植體挑到瓊脂糖固化的選擇培養(yǎng)基中。再次將它們包埋于培養(yǎng)基中,近軸側(cè)向下;培養(yǎng)物按前面所述再培養(yǎng)2周。
再生在選擇培養(yǎng)基上生長1個月后,轉(zhuǎn)化的組織變得可見,相對于漂白的不太健康的組織背景,再生組織為綠色扇形面。棄去無綠色扇形面的外植體,將具有綠色扇形面的外植體轉(zhuǎn)移進伸長培養(yǎng)基。伸長培養(yǎng)基由B5 Sales,3.2g/l;蔗糖,2.0%w/v,IBA,3.3mM;赤霉酸,1.7mM;萬古霉素,100mg/ml;cefotaxlne,30mg/ml;和timentm 30mg/ml組成,用MES 3.0mM緩沖至pH5.7。用gelrite,0.2%w/v固化伸長培養(yǎng)基。近軸側(cè)向上包埋它們并按前面所述培養(yǎng)。繼續(xù)在該培養(yǎng)基上培養(yǎng)且每隔2周轉(zhuǎn)移進新鮮平板中。當幼苗長成0.5cm長時,在基部切下它們并放入13×100mm試管的生根培養(yǎng)基中。生根培養(yǎng)基由B5 Sales,3.2g/l;蔗糖,15mg/L尼克酸20mM;焦谷氨酸(PGA),900mg/L和IBA,10mM組成。用MES,3.0mM將其緩沖至pH5.7并用Gelrite 0.2%w/v固化。10天后將幼苗轉(zhuǎn)移到無IBA或PGA的相同培養(yǎng)基中。幼苗生根并在這些試管中在前面所述的相同環(huán)境條件下保持。
當根系統(tǒng)完全形成時,將小植物轉(zhuǎn)移到植物cons的無菌土壤混合物中(ICN生物藥品公司,Irvin,CA,目錄號,26-720和1-02)。溫度,光周期和光線強度保持與前面相同。在這些條件下,再生變成生長旺盛的幾乎正常(盡管較小)的植物。當其根系統(tǒng)又變得充分建立時,切下植物圓錐的一角,使植物在環(huán)境室或溫室中逐漸鍛煉得耐寒。最后將它們栽在土壤混合物中并在溫室中生長至成熟,結出種子。
轉(zhuǎn)基因系統(tǒng)的生長,增加和收獲來自相同品種的未轉(zhuǎn)化的和轉(zhuǎn)化的植物的種子在春天種植并在秋天收獲。各不同的品系分開保持,以1個或多個10.5英尺的排進行生長以達到最大增長。
以本領域熟知的方法可測定特定蛋白質(zhì)的測量水平,包括但不限于酶聯(lián)免疫測定。免疫熒光測定,Western印跡分析和免疫沉淀分析。
以在《AOAC分析的方法》(Hilrich(編輯),國際AOAC;Vol.2;P.1096;(1990);引用其全文以供參考)中所述的方法分析來自轉(zhuǎn)化的和未轉(zhuǎn)化的植物的種子的氨基酸成分。
實施例IV白蛋白特異性抗體的制備對白蛋白多肽特異性的抗體經(jīng)過用含100μg PAGE純化的白蛋白的勻漿的聚丙烯酰胺凝膠片注射雌性新西蘭白兔(Bethyl實驗室,Montgomery,TX)6次來生產(chǎn)。然后動物以2周的間隔抽血。按Harlow等;抗體實驗手冊,冷泉港,NY;(1988);(本文引用其全文以供參考)所述用Affigel 15(BioRad)-固定化的抗原經(jīng)過親和色譜進一步純化該抗體?;旧习碆ioRad的建議用純化的白蛋白3制備親和柱。按Meyer等;細胞生物學雜志;Vol.107;P.163;(1988)(本文引用其全文以供參考)的方法使用來自Amersham(Arlngton Heights,IL)的ECL試劑盒進行對PVDF印跡上的抗原的免疫檢測。
本文以參考文獻引用所有刊物和專利,盡管單獨引用以供參考。本發(fā)明不限于所示和所述的具體細節(jié),因為應明白可做出各種變化和修改而仍在權利要求書所限定的本發(fā)明的實質(zhì)和范圍內(nèi)。
序列描述(1)一般信息(i)申請人(A)地址PIONEER HI-BRED INTERNATIONAL,INC(B)街道Darwin Bldg,7100N.W.62nd Ave.
(C)城市Johnston(D)州 依阿華(E)國家美國(F)郵編50131-1000(ii)本發(fā)明題目種子中氨基酸組成的改變(iii)序列數(shù)13(iv)計算機可讀形式(A)媒體類型軟盤(B)計算機IBM PC兼容(C)操作系統(tǒng)PC-DOS/MS-DOS(D)軟件PatentIn Release#1.0,Version#1.30(v)目前申請資料(A)申請?zhí)朠CT未指定(B)申請日與本文一致(vi)優(yōu)先申請資料(A)申請?zhí)?8/618,911(B)中請日20-MAR-1996(2)SEQ ID NO1的信息(i)序列特征(A)長度723堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲學線性(ii)分子類型cDNA(ix)特征(A)名稱/鍵CDS(B)位置10…474(xi)序列描述SEQ ID NO1GCACGAGAA ATG ACC AAG CTT ACA ATT CTC CTC ATC GCT CTT CTC TTC48Met Thr Lys Leu Thr Ile Leu Leu Tle Ala Leu Leu Phe1 5 10ATC GCC CAC ACC TGC TGC GCC TCC AAA TGG CAA CAG CAC CAG CAA GAG 96Ile Ala His Thr Cys Cys Ala Ser Lys Trp Gln Gln His Gln Gln Glu15 20 25AGC TGC CGC GAG CAG CTC AAG GGG ATC AAC CTC AAC CCC TGT GAG CAC 144Ser Cys Arg Glu Gln Leu Lys Gly Ile Asn Leu Asn Pro Cys Glu His30 35 40 45ATC ATG GAG AAG ATC CAA GCT GGC CGC CGC GGC GAG GAC GGC AGC GAC 192Ile Met Glu Lys Ile Gln Ala Gly Arg Arg Gly Glu Asp Gly Ser Asp50 55 60GAA GAT CAC ATT CTC ATC AGG ACC ATG CCG GGA AGA ATC AAC TAC ATC 240Glu Asp His Ile Leu Ile Arg Thr Met Pro Gly Arg Ile Asn Tyr Ila65 70 75AGG AAG AAG GAA GGA AAA GAA GAA GAA GAA GAA GGA CAC ATG CAG AAG 288Arg Lys Lys Glu Gly Lys Glu Glu Glu Glu Glu Gly His Met Gln Lys80 85 90TGC TGC AGC GAA ATG AGC GAG CTG AAA AGC CCC ATA TGC CAG TGC AAA 336Cys Cys Ser Glu Met Set Glu Leu Lys Ser Pro Ile Cys Gln Cys Lys95 100 105GCG CTA CAG AAG ATA ATG GAT AAC CAG AGC GAG CAA CTG GAG GGG AAG 384Ala Leu Gln Lys Ile Met Asp Asn Gln Ser Glu Gln Leu Glu Gly Lys110 l15 120 125GAG AAG AAG CAG ATG GAG AGA GAG CTC ATG AAC TTG GCT ATT AGG TGC 432Glu Lys Lys Gln Met Glu Arg Glu Leu Met Asn Leu Ala Ile Arg Cys130 135 140AGG TTG GGA CCC ATG ATA GGG TGC GAC TTG TCC TCC GAT GAC 474Arg Leu Gly Pro Met Ile Gly Cys Asp Leu Ser Ser Ser Asp145 150 155TGAAAAAAAA GTACTACTAA CACATATATG TGTTAGTTTA TGCTAGCTAG AAGAACGTAT534AAGCTATCTC CGTATGTTGT ATATTAATAA AAAGATCATC ACTGGTGAAT GGTGATCGTG594TATGTAACGT AGTGGGCAAT GGAAGCACTT AGAGrGTGCT TTGTGGCCTT GCCCTCTGTT554TTGATAACTG AGACTTTTGC GAATACCGTT CGTTTTTCCC TTCAAAAAAA AAAAAAAAAA714AAAAAAAAA723(2)SEQ ID NO2的信息(i)序列特征(A)長度155個氨基酸(B)類型氨基酸(D)拓撲學線性(ii)分子類型蛋白質(zhì)(xi)序列描述SEQ ID NO2Met Thr Lys Leu Thr Ile Leu Leu Ile Ala Leu Leu Phe Ile Ala His1 5 10 15Thr Cys Cys Ala Ser Lys Trp Gln Gln His Gln Gln Glu Ser Cys Arg20 25 30Glu Gln Leu Lys Gly Ile Ash Leu Asn Pro Cys Glu His Ile Met Glu35 40 45Lys Ile Gln Ala Gly Arg Arg Gly Glu Asp Gly Ser Asp Glu Asp His50 55 60Ile Leu Ile Arg Thr Met Pro Gly Arg Ile Asn Tyr Ile Arg Lys Lys65 70 75 80Glu Gly Lys Glu Glu Glu Glu Glu Gly His Met Gln Lys Cys Cys Ser85 90 95Glu Met Ser Glu Leu Lys Ser Pro Ile Cys Gln Cys Lys Ala Leu Gln100 105 110Lys Ile Met Asp Asn Gln Ser Glu Gln Leu Glu Gly Lys Glu Lys Lys115 120 125Gln Met Glu Arg Glu Leu Met Asn Leu Ala Ile Arg Cys Arg Leu Gly130 135 140Pro Met Ile Gly Cys Asp Leu Ser Ser Asp Asp145 150 155(2)SEQ ID NO3的信息(i)序列特征(A)長度777堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲學線性(ii)分子類型cDNA(ix)特征(A)名稱/鍵CDS(B)位置28…501(xi)序列描述SEQ ID NO3:GAGCTCGTGC CGAATCGGCA CGAGAAA ATG ACC AAG TTC ACA ATC CTC CTC51Met Thr Lys Phe Thr Ile Leu Leu160ATC TCT CTT CTC TTC TGC ATC GCC CAC ACT TGC AGC GCC TCC AAA TGG 99Ile Ser Leu Leu Phe Cys Ile Ala His Thr Cys Ser Ald Ser Lys Trpl65 170 175CAG CAC CAG CAA GAT AGC TGC CGC AAG CAG CTC CAG GGG GTG AAC CTC 147Gln His Gln Gln Asp Ser Cys Arg Lys Gln Leu Gln Gly Vdl Asn Leu180 185 190 195ACG CCC TGC GAG AAG CAC ATC ATG GAG AAG ATC CAA GGC CGC GGC GAT 195Thr Pro Cys Glu Lys His Ile Met Glu Lys Ile Gln GLy Arg Gly Asp200 205 210GAC GAT GAT GAT GAT GAC GAC GAC AAT CAC ATT CTC AGG ACC ATG CGG 243Asp Asp Asp Asp Asp Asp Asp Asp Asn His Ile Leu Arg Thr Met Arg215 220 225GGA AGA ATC AAC TAC ATA AGG AGG AAC GAA GGA AAA GAC GAA GAC GAA 291Gly Arg Ile Asn Tyr Ile Arg Arg Asn Glu Gly Lys Asp Glu Asp Glu230 235 240GAA GAA GAA GGA CAC ATG CAG AAG TGC TGC ACA GAA ATG AGC GAG CTG 339Glu Glu Glu Gly His Met Gln Lys Cys Cys Thr Glu Met Ser Glu Leu245 250 255AGA AGC CCC AAA TGC CAG TGC AAA GCG CTG CAG AAG ATA ATG GAG AAC 387Arg Ser Pro Lys Cys Gln Cys Lys Ala Leu Gln Lys Ile Met Glu Asn260 265 270 275CAG AGC GAG GAA CTG GAG GAG AAG CAG AAG AAG AAA ATG GAG AAG GAG 435Gln Ser Glu Glu Leu Glu Glu Lys Gln Lys Lys Lys Met Glu Lys Glu280 285 290CTC ATT AAC TTG GCT ACT ATG TGC AGG TTT GGA CCC ATG ATC CAG TGC 483Leu Ile Asn Leu Ala Thr Met Cys Arg Phe Gly Pro Met Ile Gln Cys295 300 305GAC TTG TCC TCC GAT GAC TAAGAAGTTA AAAGCAATGT TGTCACTTGT 531Asp Leu Ser Ser Asp Asp310ACGTACTAAC ACATGATGTG ATAGTTTATG CTAGCTAGCT ATAACATAAG CTGTCTGTGA591GTGTGTTGTA TATTAATAAA GATCATCACT GGTGAATGGT GATCGTGTAC GTACCCTACT651TAGTAGGCAA TGGAAGCACT TAGAGTGTGC TTTGTGCATG GCCTTGCCTC TGTTTTGAGA711CTTTTGTAAT GTTTTCGAGT TTAAATCTTT GCCTTTGCGG AAAAAAAAAA AAAAAAAAAA771AAAAAA 777(2)SEQ ID NO4的信息(i)序列特征(A)長度158個氨基酸(B)類型氨基酸(D)拓撲學線性(ii)分子類型蛋白質(zhì)(xi)序列描述SEQ ID NO4Met Thr Lys Phe Thr Ile Leu Leu Ile Ser Leu Leu Phe Cys Ile Ala1 5 10 15His Thr Cys Ser Ala Ser Lys Trp Gln His Gln Gln Asp Ser Cys Arg20 25 30Lys Gln Leu Gln Gly Val Asn Leu Thr Pro Cys Glu Lys His Ile Met35 40 45Glu Lys Ile Gln Gly Arg Gly Asp Asp Asp Asp Asp Asp Asp Asp Asp50 55 60Asn His Ile Leu Arg Thr Met Arg Gly Arg Ile Asn Tyr Ile Arg Arg65 70 75 80Asn Glu Gly Lys Asp Glu Asp Glu Glu Glu Glu Gly His Met Gln Lys85 90 95Cys Cys Thr Glu Met Ser Glu Leu Arg Ser Pro Lys Cys Gln Cys Lys100 105 110Ala Leu Gln Lys Ile Met Glu Asn Gln Ser Glu Glu Leu Glu Glu Lys115 120 125Gln Lys Lys Lys Met Glu Lys Glu Leu Ile Asn Leu Ala Thr Met Cys130 135 140Arg Phe Gly Pro Met Ile Gln Cys Asp Leu Ser Ser Asp Asp145 150 155(2)SEQ ID NO5的信息(i)序列特征(A)長度777堿基對
(B)類型 核酸(C)鏈型 單鏈(D)拓撲學線性(ii)分子類型cDNA(ix)特征(A)名稱/鍵 CDS(B)位置28…501(xi)序列描述SEQ ID NO5GAGCTCGTGC CGATCGGCA CGAGAAA ATG ACC AAG TTC ACA ATC CTC CTC 51Met Thr Lys Phe Thr Ile Leu Leu160 165ATC TCT CTT CTC TTC TGC ATC GCC CAC ACT TGC AGC GCC TCC AAA TGG 99Ile Ser Leu Leu Phe Cys Ile Ala His Thr Cys Ser Ala Ser Lys Trp170 175 180CAG CAC CAG CAA GAT AGC TGC CGC AAG CAG CTT AAG GGG GTG AAC CTC 147Gln His Gln Gln Asp Ser Cys Arg Lys Gln Leu Lys Gly Val Asn Leu185 190 195ACG CCC TGC GAG AAG CAC ATC ATG GAG AAG ATC CAA GGC CGC GGC GAT 195Thr Pro Cys Glu Lys His Ile Met Glu Lys Ile Gln Gly Arg Gly Asp200 205 210GAC GAT GAT GAT GAT GAC GAC GAC AAT CAC ATT CTC AGG ACC ATG CGG 245Asp Asp Asp Asp Asp Asp Asp Asp Asn His Ile Leu Arg Thr Met Arg215 220 225 230GGA AGA ATC AAC TAC ATA CGT AAG AAG GAA GGA AAA GAC GAA GAC GAA 291Gly Arg Ile Asn Tyr Ile Arg Lys Lys Glu Gly Lys Asp Glu Asp Glu235 240 245GAA GAA GAA GGA CAG ATG CAG AAG TGC TGC ACA GAA ATG AGC GAG CTT 339Glu Glu Glu Gly Gln Met Gln Lys Cys Cys Thr Glu Met Ser Glu Leu250 255 260AAG AGC CCC AAA TGC CAG TGC AAA GCG CTG CAG AAG ATA ATG GAG AAC 387Lys Ser Pro Lys Cys Gln Cys Lys Ala Leu Gln Lys Ile Met Glu Asn265 270 275CAG AGC GAG GAA CTG GAG GAG AAG GAG AAC AAG AAA ATG GAG AAG GAG 435Gln Ser Glu Glu Leu Glu Glu Lys Glu Asn Lys Lys Met Glu Lys Glu280 285 290CTT ATG AAC TTG GCT ACT ATG TGC AGG TTT GGG CCC ATG ATC GGA TGC 483Leu Met Asn Leu Ala Thr Met Cys Arg Phe Gly Pro Met Ile Gly Cys295 300 305 310GAC TTG TCC TCC GAT GAC TAAGAAGTTA AAAGCAATGT TGTCACTTGT 531Asp Leu Ser Ser Asp Asp315ACGTACTAAC ACATGATGTG ATAGTTTATG CTAGCTAGCT ATAACATAAG CTGTCTCTGA591GTGTGTTGTA TATTAATAAA GATCATCACT GGTGAATGGT GATCGTGTAC GTACCCTACT651TAGTAGGCAA TGGAAGCACT TAGAGTGTGC TTTGTGCATG GCCTTGCCTC TGTTTTGAGA711CTTTTGTAAT GTTTTCGAGT TTAAATCTTT GCCTTTGCGG AAAAAAAAAA AAAAAAAAAA771(2)SEQ ID NO6的信息(i)序列特征(A)長度158個氨基酸(B)類型氨基酸(D)拓撲學線性(ii)分子類型蛋白質(zhì)(xi)序列描述SEQ ID NO6Met Thr Lys Phe Thr Ile Leu Leu Ile Ser Leu Leu Phe Cys Ile Ala1 5 10 15His Thr Cys Ser Ala Ser Lys Trp Gln His Gln GIn Asp Ser Cys Arg20 25 30Lys Gln Leu Lys Gly Val Asn Leu Thr Pro Cys Glu Lys His Ile Met35 40 45Glu Lys Ile Gln Gly Arg Gly Asp Asp Asp Asp Asp Asp Asp Asp Asp50 55 60Asn His Ile Leu Arg Thr Met Arg Gly Arg Ile Asn Tyr Ile Arg Lys65 70 75 80Lys Glu Gly Lys Asp Glu Asp Glu Glu Glu Glu Gly Gln Met Gln Lys85 90 95Cys Cys Thr Glu Met Ser Glu Leu Lys Ser Pro Lys Cys Gln Cys Lys100 105 110Ala Leu Gln Lys Ile Met Glu Asn Gln Ser Glu Glu Leu Glu Glu Lys115 120 125Glu Asn Lys Lys Met Glu Lys Glu Leu Met Asn Leu Ala Thr Met Cys130 135 140Arg Phe Gly Pro Met Ile Gly Cys Asp Leu Ser Ser Asp Asp145 150 155(2)SEQ ID NO:7的信息(i)序列特征(A)長度32堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲學線性(ii)分子類型其它核酸(A)描述/desc=“引物”(xi)序列描述SEQ ID NO7GCTGCCGCAA GCAGCTTAAG GGGGTGAACC TC 32(2)SEQ ID NO:8的信息(i)序列特征
(A)長度40堿基對(B)類型: 核酸(C)鏈型單鏈(D)拓撲學線性(ii)分子類型其它核酸(A)描述/desc=“引物”(xi)序列描述SEQ ID NO8GGAAGAATCA ACTACATACG TAAGAAGGAA GGAAAAGACG40(2)SEQ ID NO9的信息(i)序列特征(A)長度44堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲學線性(ii)分子類型其它核酸(A)描述/desc=“引物”(xi)序列描述SEQ ID NO9GCTGCACAGA AATGAGCGAG CTTAAGAGCC CCAAATGCCA GTGC 44(2)SEQ ID NO10的信息(i)序列特征(A)長度48堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲學線性(ii)分子類型其它核酸(A)描述/desc=“引物”(xi)序列描述SEQ ID NO10GGAGGAGAAG GAGAAGAAGA AAATGGAGAA GGAGTTCATG AACTTGGC 48(2)SEQ ID NO11的信息(i)序列特征(A)長度37堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲學線性(ii)分子類型其它核酸
(A)描述/desc=“引物”(xi)序列描述:SEQ ID NO11GCAGGTTTGG GCCCATGATC GGGTGCGACT TGTCCTC 37(2)SEQ ID NO12的信息(i)序列特征(A)長度29堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲學線性(ii)分子類型其它核酸(A)描述/desc=“引物”(xi)序列描述SEQ ID NO12GCACGAGTCA TGACCAAGTC ACAATTCTC29(2)SEQ ID NO13的信息(i)序列特征(A)長度35堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲學線性(ii)分子類型其它核酸(A)描述/desc=“引物”(xi)序列描述SEQ ID NO13TCCTCCGATG ACTGAGTTAA CAAAAAAAGT ACTAC 3權利要求
1. 一種分離的和純化的DNA分子,包含編碼種子貯存蛋白質(zhì)的預選DNA片段。
2.權利要求1的DNA分子,其中種子貯存蛋白質(zhì)是大豆種子貯存蛋白質(zhì)。
3.權利要求1的DNA分子,其中大豆種子貯存蛋白質(zhì)是白蛋白。
4.權利要求1的DNA分子,其中預選的DNA片段編碼具有SEQID NO2的蛋白質(zhì)。
5.權利要求1的DNA分子,其中預選的DNA片段與SEQ ID NO1堿基對10到474之間具有至少大約(60%)的相同性。
6.權利要求1的DNA分子,其中預選的DNA片段是經(jīng)定點誘變修飾,使所編碼的蛋白質(zhì)的營養(yǎng)質(zhì)量增加的SEQ ID NO1。
7.權利要求1的DNA分子,其中預選的DNA片段編碼具有SEQED NO4的蛋白質(zhì)。
8.利要求1的DNA分子,其中預選的DNA片段與SEQ ID NO3的堿基對28到501之間具有至少大約60%的相同性。
9.權利要求1的DNA分子,其中預選的DNA片段是經(jīng)定點誘變修飾使所編碼的蛋白質(zhì)營養(yǎng)質(zhì)量增加的SEQ ID NO3。
10.權利要求1的DNA分子,其中預選的DNA片段編碼具有SEQID NO5的蛋白質(zhì)。
11.一種表達盒,包含與在宿主植物細胞中有功能的啟動子有效相連的編碼大豆種子貯存蛋白質(zhì)的預選的DNA片段。
12.權利要求11的表達盒,其中該啟動子是種子特異性啟動子。
13.在植物種子中增加預選氨基酸水平的方法,包括a)將包含有效連接到在植物細胞中有功能的啟動子上的編碼包含至少一個預選氨基酸的大豆種子貯存蛋白質(zhì)的預選DNA片段的表達盒導入植物細胞以產(chǎn)生轉(zhuǎn)化的植物細胞;b)從轉(zhuǎn)化的細胞再生轉(zhuǎn)化的植物;c)從再生的轉(zhuǎn)化植物中分離種子,其中該種子包含相對于相應未轉(zhuǎn)化的植物種子中的預選氨基酸量而言以足以增加了轉(zhuǎn)化植物種子中預選氨基酸含量的量的種子貯存蛋白質(zhì)。
14.根據(jù)權利要求13的方法,其中的植物是大豆。
15.根據(jù)權利要求14的方法,其中預選的氨基酸是賴氨酸。
16.根據(jù)權利要求15的方法,其中預選的氨基酸除賴氨酸外還有甲硫氨酸或半胱氨酸。
17.根據(jù)權利要求16的方法,其中種子中賴氨酸的量至少增加大約5-10%。
18.根據(jù)權利要求17的方法,其中種子中甲硫氨酸和半胱氨酸的量至少增加大約15-30%。
19.由權利要求13的方法產(chǎn)生的種子。
20.由權利要求19的種子產(chǎn)生的植物。
21.一種能育的轉(zhuǎn)基因植物,它含有包含一個啟動子且在該啟動子控制下編碼包含至少一種選自甲硫氨酸,半胱氨酸和賴氨酸的預選氨基酸的大豆種子貯存蛋白質(zhì)的分離的預選DNA片段,其中該DNA片段以種子貯存蛋白質(zhì)表達,使轉(zhuǎn)基因植物種子中種子貯存蛋白質(zhì)氨基酸的水平增加到與轉(zhuǎn)基因植物種子的區(qū)別僅在于未人工導入DNA片段的大豆植物種子的水平上,且其中該DNA片段通過轉(zhuǎn)基因植物的完全正常的有性循環(huán)傳遞給下一代。
22.能特異性地結合大豆白蛋白的抗體。
23.權利要求22的抗體,它能特異性地結合具有SEQ ID NO2或SEQ ID NO4的蛋白質(zhì)。
24.由包含于根據(jù)權利要求4的分離的和純化的DNA分子中的預選DNA片段編碼的蛋白質(zhì)。
25.權利要求24的蛋白質(zhì),其特征在于該蛋白質(zhì)具有SEQ IDNO2,SEQ ID NO4或SEQ ID NO5。
26.用于分離和純化2S白蛋白的方法,包含經(jīng)過白蛋白與碳水化合物樹脂基質(zhì)的特異性相互作用從污染的蛋白質(zhì)中分離該白蛋白的步驟。
27.權利要求26的方法,其中的碳水化合物是葡聚糖。
全文摘要
本發(fā)明提供了經(jīng)遺傳修飾增加植物種子中預選的氨基酸的水平,從而增加該種子的營養(yǎng)價值的方法。本發(fā)明在增加植物種子中甲硫氨酸,賴氨酸,和/或半胱氨酸含量中特別有用。另外還提供了編碼大豆白蛋白的分離的內(nèi)源性DNA分子。本發(fā)明還提供了能特異性地結合大豆白蛋白的抗體。本發(fā)明進一步提供了分離和純化2S白蛋白的方法。
文檔編號C07K14/415GK1193355SQ97190511
公開日1998年9月16日 申請日期1997年3月19日 優(yōu)先權日1996年3月20日
發(fā)明者R·朱恩, C·哈斯丁斯, S·考蘭, D·胡 申請人:先鋒高級育種國際公司