專利名稱:修飾植物中酶的活性的制作方法
修飾植物中酶的活性
本發(fā)明針對的是修飾對植物中具體酶的活性。具體而言,本發(fā)明涉及用于在降低、 抑制或基本上抑制植物中一種或多種內源糖基轉移酶的活性,以及通過所述方法獲得的植物細胞和植物。
植物和哺乳動物中的N-糖基化過程有很多方面都是類似的,這些過程一般包括大量的順序酶步驟。然而,植物糖蛋白和哺乳動物糖蛋白的成熟N-聚糖結構之間的關鍵差異在于所述過程的最后步驟中所添加的具體單糖不同。植物產生的蛋白質的成熟N-聚糖鏈一般包含α-1,3-連接的巖藻糖殘基(α (1,3)_巖藻糖)和β _1,2_連接的木糖殘基 (β (I, 2)-木糖),二者在哺乳動物N-聚糖中都不存在。
一般地,N-糖基化以將前體Glc3-Man9-GlcNAc2寡糖添加于糖基化的蛋白質的天冬氨酸殘基而開始,然后在內質網(ER)中由大量酶對其進行順序加工,以三種葡萄糖苷酶開始(葡萄糖苷酶1、葡萄糖苷酶II和葡萄糖苷酶III)并產生Man9-GlcNAc2-Asn N-聚糖。 隨后,甘露糖苷酶I酶將富含甘露糖的Man9-GlcNAc2-Asn N-聚糖剪切為Man5-GlcNAc2-Asn N-聚糖。然后將這種糖基化的蛋白質從ER轉運到順面高爾基網。轉運是通過囊泡和膜融合介導的。ER衍生的囊泡從ER膜上出芽并融合入順面高爾基網。真核細胞中的 Man5-GlcNAc2-Asn N-聚糖隨后在高爾基體中多個區(qū)室內通過大量N-乙酰氨基葡萄糖基轉移酶、甘露糖苷酶和糖基轉移酶的作用而成熟。
在哺乳動物(包括人)中,糖基化過程的最后步驟中,巖藻糖以α-1,6_連接 (α (1,6)_巖藻糖)加至N-聚糖的非還原性末端的鄰近N-乙酰葡萄糖胺殘基上。在植物中,α-1,3-連接(a (1,3)-巖藻糖)中的巖藻糖和β _1,2連接(β (1,2)-木糖)中的木糖被加至N-聚糖。巖藻糖殘基是通過巖藻糖基轉移酶的作用加至N-聚糖鏈的。更具體地,在植物中,ct -1, 3-連接的巖藻糖(α (I, 3)-巖藻糖)是通過α -1, 3_巖藻糖基轉移酶 (α (I, 3)_巖藻糖基轉移酶)添加的;木糖是通過β -1, 2-木糖基轉移酶(β (I, 2)_木糖基轉移酶)以β-1,2-連接(β (1,2)-木 糖)加至三甘露糖基(Man3)核心結構的β_1,4_連接的甘露糖(β (I, 4)-Man)上的。這些碳水化合物在植物產生的蛋白質表面的存在影響到當其被引入動物中時所述蛋白質的免疫原特性。因此不同的糖基化形式為植物產生的蛋白質在哺乳動物(包括人)中的治療用途提出了一個難題,并且可能影響對所述蛋白質的監(jiān)管許可。
蛋白質如可治療性地用于人的蛋白質的重組表達構成轉基因動物的一項重要的應用。人們已經考慮過使用煙草植物用于生產重組蛋白質。然而,煙草植物的基因組非常復雜。例如,煙草(Nicotiana tabacum)是一種異源四倍體物種,被認為是樟子松煙草 (Nicotiana sylvestris)和鸞毛煙草(Nicotiana tomentosiformis)之間種內雜交的雙二倍體,其具有48條染色體。對于每個基因(包括編碼糖基轉移酶的基因)都預期存在多種不同的等位基因和變體。進一步地,煙草具有迄今已知的最大的基因組(約4500萬個堿基對)之一,包含分散在超過70%的“垃圾"DNA中的30,000-50, 000個基因。因此,煙草基因組的大小和復雜度對基因發(fā)現(xiàn)、等位基因和變體鑒別以及具體等位基因或變體的靶向修飾提出了極大的挑戰(zhàn)。
考慮到在植物特別是煙草植物中產生重組蛋白質的潛力,因此需要鑒別在蛋白質糖基化過程中有活性的不同內源糖基轉移酶的方法,和降低、抑制或基本上抑制所述一種或多種所述糖基轉移酶的活性的方法。具體地,可取的是獲得能夠產生蛋白質的植物和植物細胞,所述蛋白質在其N-聚糖中幾乎缺少α-1,3-連接的巖藻糖殘基、β-1 ,2-連接的木糖殘基或二者。因此這些植物產生的蛋白質可具有有利的免疫原特性可以用于人。本發(fā)明的一個目標是解決這些需求。
在本發(fā)明的多種實施方式中,提供了(i)用于鑒別編碼糖基轉移酶的基因序列及其片段,以及這些基因序列的變體和等位基因的方法,(ii)用于修飾這些基因序列的方法, 以及(iii)用于降低、抑制或基本上抑制這些序列編碼的糖基轉移酶的酶活性的方法。還提供了編碼糖基轉移酶及其變體和等位基因的多核苷酸,以及其片段和突變體。本發(fā)明還包含了用于修飾糖基轉移酶基因序列的靶標位點,以及用于在植物細胞中修飾糖基轉移酶基因序列的組合物,例如但不限于,包含鋅指結構域的蛋白質。本發(fā)明還提供了植物細胞或植物用于產生一種或多種異源蛋白質的用途的方法,所述植物細胞或植物包含修飾的糖基轉移酶基因序列,其中一種或多種糖基轉移酶的酶活性得到降低、抑制或基本上抑制。本發(fā)明還提供了植物或植物細胞,特征在于其具有的蛋白質中的N-聚糖基本上缺少以β_1,2-連接的木糖或以α-1,3-連接的巖藻糖,或二者。本發(fā)明還包含可得自本發(fā)明的植物或植物細胞的組合物,其包含一種或多種基本上缺少α -1, 3-連接的巖藻糖殘基或 β -1, 2-連接的木糖殘基或二者的異源蛋白質。
本申請范圍內使用的技術術語和表達一般是以植物生物學相關領域中通常對其應用的意義給出的。所有以下定義適用于本申請的全部內容。詞語“包含”不排除其他成分或步驟,而不定冠詞“一”或“一個”不排除復數(shù)形式。一個單一步驟可能滿足權利要求提出的數(shù)種特征的功能。具體關系到一項屬性或數(shù)值的術語“幾乎”、“大約”、“約”等等分別精確地限定了所述屬性或精確限定了所述值。在給定的數(shù)值化值或范圍的上下文中,術語“大約”指的是給定值或范圍的20%之內、10%之內或5%之內。
如本發(fā)明內所用的,“植物”指的是處于生命周期或發(fā)育的任何階段的任何植物及其后代。
如本發(fā)明內所使用的“植物細胞”指的是植物的結構及生理單位。植物細胞可能為以下形式沒有細胞壁的原生質、分離的單個細胞或培養(yǎng)的細胞,或為更高級的組織單位的一部分,例如但不限于,植物組織、植物器官或整個植物。
如本發(fā)明內使用的,“植物細胞培養(yǎng)物”包括植物細胞的培養(yǎng)物,例如但不限于,原生質、細胞培養(yǎng)物細胞、培養(yǎng)的植物組織中的細胞、外植體細胞及花粉培養(yǎng)物。
如本發(fā)明內使用的,“植物材料”包括可獲自植物的任何固態(tài)、液態(tài)或氣態(tài)組合物, 或其組合,包括植物的葉、莖、根、花或花器部分、果實、花粉、卵細胞、合子、種子、插條、分泌物、提取物、細胞或組織培養(yǎng)物,或任何其他的部分或產物。
如本文所使用的“植物組織”指的是組織形成結構或功能單位的一組植物細胞。植物群內的或培養(yǎng)的植物的任何組織都包括在內。這項術語包括但不限于整個植物、植物器官以及種子。
如本文所使用的,“植物器官”涉及植物的可區(qū)分或已分化部分,如根、莖、葉、花芽或胚?!?br>
本文所使用的術語“多核苷酸”指的是核苷酸的多聚體,可以是未修飾或修飾的脫氧核糖核苷酸(DNA)或核糖核苷酸(RNA)。因此,多核苷酸可以為基因組DNA、互補DNA (cDNA)、mRNA或反義RNA,但不限于此。此外,多核苷酸可以為單鏈或雙鏈DNA、單鏈和雙鏈區(qū)域混合的DNA、包含DNA和RNA的雜交份子、或者單鏈或雙鏈區(qū)域混合的雜交分子。另外, 多核苷酸可由包含DNA、RNA或二者的三鏈區(qū)域組成。多核苷酸可包含一個或多個修飾的堿基,如硫代磷酸酯,也可為肽核酸(PNA)。一般地,本發(fā)明提供的多核苷酸可由分離的或克隆的cDNA片段、基因組DNA、寡核苷酸或單個核苷酸或前述的組合而裝配而成。
術語“核苷酸序列”指的是核苷酸的多聚體的堿基序列,包括但不限于核糖核苷酸和脫氧核糖核苷酸。
如本文使用的,術語“基因序列”指的是編碼多肽或生物學活性RNA的核酸分子或多核苷酸的核苷酸序列,并包括只編碼蛋白質片段的部分編碼序列的核苷酸序列。基因序列還包括對位于編碼序列上游或下游并對基因表達有調控功能的序列,以及基因的內含子序列。
如本文使用的,術語“異源序列”指的是在目的細胞或器官中的具體多核苷酸或多肽的環(huán)境下不會天然發(fā)生的生物學序列。
如本文使用的,術語“異源蛋白質”指的是細胞產生的但在所述細胞中不會天然發(fā)生的蛋白質。例如,植物細胞中所產生的異源蛋白質可以為哺乳動物或人蛋白質。異源蛋白質可在翻譯中或翻譯后修飾中含有共價連接于多肽的寡糖鏈(聚糖)。作為一個非限制性實例,這樣的蛋白質可包含共價連接于蛋白質骨架上天冬氨酸(Asn )的寡糖,所述蛋白質骨架包含至少一個三甘露糖基(Man3)核心結構,并在連接于蛋白質骨架的非還原性末端具有兩個N-乙酰葡萄糖胺(GlcNAc2)殘基(Man3-GlcNAc2-Asn)。具體 而言,異源蛋白質包含至少一個N-聚糖??s寫“GnT”指的是N-乙酰葡萄糖氨基轉移酶;“Man”指的是甘露糖;“Glc” 指的是葡萄糖;“Xyl”指的是木糖;“Fuc”指巖藻糖;而“61(嫩(3”指的是N-乙酰葡萄糖胺。
如本文所使用的,術語“N-糖基化”指的是這樣一個過程,其開始于特定的多萜醇脂連接的前體寡糖D01-PP-GlcNAc2-Man9-Glc3從內質網膜的多萜醇實體向天冬氨酸殘基 (Asn)(其為蛋白質骨架中Asn-Xaa-Ybb-Xaa序列基序的一部分)的游離氨基基團上的轉移,產生Glc3-Man9-GlcNAc2-Asn糖基化蛋白質,其中Xaa可為除脯氨酸之外的任何氨基酸, 而Ybb可為絲氨酸、蘇氨酸或半胱氨酸。
如本文所使用的,術語“N-葡聚糖”指的是連接于多種天冬氨酸殘基的碳水化合物,所述天冬氨酸殘基各自為蛋白質骨架中Asn-Xaa-Ybb-Xaa序列基序的一部分。
如本文所使用的,術語“N-葡聚糖的非還原性末端”指的是連接于蛋白質骨架的天冬氨酸的N-聚糖的一部分。
如本發(fā)明內所使用的,術語“ β -1,2-木糖基轉移酶”(β (1,2)-木糖基轉移酶) 指的是木糖基轉移酶,記為EC2. 4. 2. 38,其將以0-1,2-連接(0 (I, 2)-Xyl)的木糖加至糖蛋白的N-聚糖的三甘露糖基核心結構的β-1,4-連接的甘露糖(β (I, 4)-Man)上。
如本發(fā)明內所使用的,術語“α-1,3_巖藻糖基轉移酶”(α (1,3)_巖藻糖基轉移酶)指的是巖藻糖轉移酶,記為EC2. 4.1. 214,其將以α-1,3-連接(α (1,3)-巖藻糖)的巖藻糖加至N-葡聚糖的非還原性末端的近端N-乙酰葡萄糖胺殘基。
如本發(fā)明內所使用的,“N-乙酰葡萄糖氨基轉移酶I”指的是一種記為EC2. 4.1. 101的酶,其將N-乙酰葡萄糖胺加至Man5-GlcNAc2-Asn寡甘露糖基受體的1_3臂上的甘露糖上。
如本文所使用的,術語“降低”或“降低的”指的是數(shù)量或活性的大約10%-大約99% 的降低,或至少10%、至少20%、至少25%、至少30%、至少40%、至少50%、至少60%、至少70%、至少75%、至少80%、至少90%、至少95%、至少98%或多至100%的降低,例如但不限于酶活性、 轉錄活性以及蛋白質表達。
如本文所使用的,術語“基本上抑制”或“基本上抑制的”指的是數(shù)量或活性的大約 90%-大約100%的降低,或至少90%、至少95%、至少98%或多至100%的降低,例如但不限于酶活性、轉錄活性以及蛋白質表達。
如本文所使用的,術語“抑制”或“抑制的”指的是數(shù)量或活性的大約98%_大約 100%的降低,或至少98%、至少99%、但特別是100%的降低,例如但不限于酶活性、轉錄活性以及蛋白質表達。
如本發(fā)明內使用的“基因組編輯技術”指的是產生生物體基因組中核苷酸序列的改變的方法,例如但不限于,鋅指核酸酶介導的誘變、化學誘變、輻射誘變、“tilling”或大范圍核酸酶介導的誘變。
本發(fā)明的一個目標是在植物中產生適合用作治療劑的異源蛋白質,其中的異源蛋白質缺少一種或多種碳水化合物,否則這些化合物會產生不想要的免疫原特性。不受任何理論的束縛,α-1,3-連接的巖藻糖、β-1,2-連接的木糖或二者在植物或植物細胞中產生的異源蛋白質的N-聚糖上的存在可通過(i )在植物或植物細胞中降低、抑制或基本上抑制本發(fā)明的一種或多種糖基轉移酶的酶活性,或(ii)在植物或植物細胞中抑制或基本上抑制本發(fā)明的一種或多種糖基轉移酶的表達,或(i)和(ii) 二者得到降低或消除。
在一個具體的實施方式中,本發(fā)明的糖基轉移酶為⑴N-乙酰葡萄糖氨基轉移酶,特別是催化將N-乙酰葡萄 糖胺殘基添加至糖蛋白的N-聚糖還原性末端的Man5-GlcNAc2-Asn的1_3臂的甘露糖殘基的N-乙酰葡萄糖氨基轉移酶;產生 GlcNAc-Man5-GlcNAc2-Asn ;(ii)巖藻糖基轉移酶,特別是如下巖藻糖基轉移酶,其催化將以α-1,3-連接的巖藻糖實體添加至N-聚糖,特別是催化將以α-1,3_連接(α (1,3)_連接)的巖藻糖實體添加至糖蛋白的N-聚糖非還原性末端的鄰近N-乙酰葡萄糖胺上,產生例如但不限于,GlcNAc-Man3-Fuc-GlcNAc2-Asn 或 GlcNAc-Man3-Fuc-Xyl-GlcNAc2-Asn 糖蛋白;或(iii)木糖基轉移酶,特別是如下木糖基轉移酶,其催化將以β-1,2-連接的木糖實體添加至N-聚糖,特別是催化將以β-1,2-連接(β (1,2)_連接)的木糖添加至N-聚糖的三甘露糖基核心的β_1,4-連接的甘露糖(β (1,4)_連接)甘露糖,產生例如但不限于, GlcNAc-Man3-Xyl-GlcNAc2-Asn 或 GlcNAc-Man3-Fuc-Xyl-GlcNAc2-Asn 糖蛋白。具體而言,本發(fā)明的糖基轉移酶為煙草糖基轉移酶。特別地,本發(fā)明的糖基轉移酶為煙草或本氏煙草(Nicotiana benthamiana)的糖基轉移酶。
在多種實施方式中,本發(fā)明涉及煙草、向日葵、豌豆、油菜、甜菜、大豆、生菜、萵苣、 卷心菜、西蘭花、花椰菜、苜蓿、浮萍、稻、玉米和胡蘿卜。具體而言,本發(fā)明針對修飾的煙草植物和修飾的煙草細胞、煙草種屬的修飾植物和修飾的細胞,特別是修飾的本氏煙草和煙草植物,以及煙草變種、育種品系和栽培種,或本氏煙草和煙草、煙草變種、育種品系和品種的修飾細胞。
在另一個實施方式中,本發(fā)明提供了遺傳修飾的煙草變種、育種品系或栽培種。可通過本發(fā)明的方法修飾的煙草變種、育種品系和栽培種的非限制性實例包括煙草登記號 PMO16, PM021、PM92、PM102、PM132、PM204、PM205、PM215、PM216 或 PM217 (保藏于 NCMB, Aberdeen, Scotland 或 DAC Mata Fina), P02、BY-64、AS44、RG17、RG8、HB04P、 Basma Xanthi BX 2A、Coker 319、Hicks、McNair 944(MN 944)、Burley 21、K149、Yaka JB 125/3、Kasturi Mawar>NC 297>Coker 371Gold、P02、Wisl.1gil、Simmaba、Turkish Samsun> AA37-1、B13P、BU21x Hoja Parado 系 97 雜交得到的 F4、Samsun NN、Izmir、Xanthi NN、 Karabalgar、Denizli 和 POl0
在一個實施方式中,包含根據(jù)本發(fā)明并在本文中描述的修飾的植物細胞的修飾的 (即遺傳修飾的)煙草植物細胞或煙草植物(包括其后代)還進一步包含(a)至少對第二種 N-乙?;咸前被D移酶的第二編碼序列的修飾或(b)對N-乙酰葡萄糖氨基轉移酶的編碼序列的基因組區(qū)域中至少第三靶標核苷酸序列的修飾或(a)和(b)的組合,使得(i) 修飾的植物細胞中的糖基轉移酶的活性或表達相對于未修飾植物細胞得到降低、抑制或基本上抑制,以及(ii)修飾的植物細胞中產生的蛋白質的N-聚糖上的α-1,3-巖藻糖或 β -1, 2-木糖或二者相對于未修飾植物細胞得到降低。在一個具體的實施方式中,所述第二編碼序列為第一靶標核苷酸序列的等位基因變體,或第三靶標核苷酸序列為第二靶標序列的等位基因變體。
具體而言,本發(fā)明在一個實施方式中涉及修飾的(即遺傳修飾的)煙草植物細胞, 或煙草植物(包括其后代),其包含修飾的植物細胞,其中修飾的植物細胞包含至少對在包含N-乙酰基-葡糖氨基轉移酶的編碼序列的基因組區(qū)域中的第一靶標核苷酸序列的修飾, 使得(i )修飾的植物細胞中的糖基轉移酶的活性或表達相對于未修飾植物細胞得到降低、 抑制或基本上抑制,以及(ii)修飾的植物細胞中產生的蛋白質的N-聚糖上的α-1,3-巖藻糖或β -1, 2-木糖或二者相對于未修飾植物細胞得到降低。
在一個實施方式中,包含根據(jù)本發(fā)明并在本文中描述的修飾的植物細胞的修飾的 (即遺傳修飾的)煙草植物細胞,或煙草植物(包括其后代)進一步包含(a)在β (1,2)_木糖基轉移酶的編碼序列的基因組區(qū)域中包含至少第二靶標核苷酸序列的修飾或(b)在 α (I, 3)_巖藻糖基轉移酶的編碼序列的基因組區(qū)域中包含至少第三靶標核苷酸序列的修飾,或(a)和(b)的組合。在一個實施方式中,包含根據(jù)本發(fā)明并在本文中描述的修飾的植物細胞的修飾的(即遺傳修飾的)煙草植物細胞,或煙草植物(包括其后代)進一步包含第一靶標核苷酸序列、第二靶標核苷酸序列、第三靶標核苷酸序列或前述靶標核苷酸序列中任何兩種或多種的組合的等位基因變體的修飾。
在一個實施方式中,本發(fā)明涉及修飾的(即遺傳修飾的)煙草植物細胞,或煙草植物(包括其后代),其包含根據(jù)本發(fā)明并在本文描述的修飾的植物細胞,其中第一靶標核苷酸序列為
a.與選自 SEQ ID NO: 12、13、40、41、233、256、259、262、265、268、271、274、277、280 的核苷酸序列有至少95%、96%、97%、98%、99%或100%的同一性;
b.與選自 SEQ ID NO:20、21、212、213、219、220、223、227、229、234、257、260、263、 266、269、272、275、278、281 的核苷酸序列有至少 95%、96%、97%、98%、99% 或 100% 的同一性。
在一個實施方式中,本發(fā)明涉及修飾的(即遺傳修飾的)煙草植物細胞,或煙草植物(包括其后代),其包含根據(jù)本發(fā)明并如本文描述的修飾的植物細胞,其中第二靶標核苷酸序列為
a.與選自SEQ ID N0:l、4、5和17的核苷酸序列有至少95%、96%、97%、98%、99%或 100%的同一性;
b.與選自SEQ ID NO: 8和18的核苷酸序列有至少95%、96%、97%、98%、99%或100% 的同一'I"生。
在一個實施方式中,本 發(fā)明涉及修飾的(即遺傳修飾的)煙草植物細胞,或煙草植物(包括其后代),其包含根據(jù)本發(fā)明并如本文描述的修飾的植物細胞,其中第三靶標核苷酸序列為
a.與選自 SEQ ID NO:27、32、37、和47 的核苷酸序列有至少95%、96%、97%、98%、99% 或100%的同一性;
b.與選自 SEQIDN0:28、33、38、和 48 的核苷酸序列有至少 95%、96%、97%、98%、99% 或100%的同一性。
在一個實施方式中,包含根據(jù)本發(fā)明并如本文描述的修飾的植物細胞的修飾的(即遺傳修飾的)煙草植物細胞,或煙草植物(包括其后代)為煙草品種PM132,其種子于2011年I月6日保藏于NCIMBLtd( “達佩斯條約下的國際保藏單位,位于Ferguson Building, Craibstone Estate, Bucksburn, Aberdeen, AB21 9YA, United Kingdom),登記號為NCMB 41802。在另一個實施方式中,包含根據(jù)本發(fā)明的并如本文描述的修飾的植物細胞的修飾的(即遺傳修飾的)煙草植物細胞,或煙草植物(包括其后代),為煙草系PM016,其種子以登記號NCMB 41798保藏;煙草系PM021,其種子以登記號NCMB 41799保藏;煙草系PM092,其種子以登記號NCMB 41800保藏;煙草系PM102,其種子以登記NCMB 41801保藏煙草系PM204,其種子于2011年I月6日以登記號NCMB 41803保藏于NCMB Ltd,煙草系PM205,其種子以登記號NCMB 41804保藏;煙草系PM215,其種子以登記號NCMB 41805 保藏;煙草系PM216,其種子以登記號NCMB 41806保藏;以及煙草系PM217,其種子以登記 NCIMB 41807 保藏。
在本發(fā)明的另一個實施方式中,以登記號NCMB 41802保存的煙草栽培種PM132 包含的靶標核苷酸序列與選自SEQ ID N0:256、259、262、265、268、271、274、277和280的核苷酸序列有至少95%、96%、97%、98%、99%或100%的同一性,其序列用于設計能夠識別并結合于所述位點處或附近的誘變的寡核苷酸,以使得修飾的植物或植物細胞中的所述糖基轉移酶(可選地還有其至少一個等位基因變體)的活性或表達相對于未修飾的植物細胞得到降低、抑制或基本上抑制,且所述修飾植物或植物細胞產生的糖蛋白在其N-聚糖上缺少 α -1, 3-連接的巖藻糖殘基和β -1, 2-連接的木糖殘基。
在一個具體的實施方式中,所述靶標核苷酸序列為如SEQ ID No :256所示的序列。
在另一個具體的實施方式中,所述靶標核苷酸序列為如SEQ ID No:259所示的序列。
在另一個具體的實施方式中,所述靶標核苷酸序列為如SEQ ID No:262所示的序列。
在本發(fā)明的另一個實施方式中,以登記號NCMB 41802保存的煙草栽培種PM132 包含的靶標核苷酸序列與選自SEQ ID NO: 257、260、263、266、269、272、275、278和281的核苷酸序列有至少95%、96%、97%、98%、99%或100%的同一性,其序列被用于設計能夠識別并結合于所述位點處或附近的誘變的寡核苷酸,以使得修飾的植物或植物細胞中的所述糖基轉移酶(可選地還有其至少一個等位基因變體)的活性或表達相對于未修飾的植物細胞得到降低、抑制或基本上抑制,且所述修飾植物或植物細胞產生的糖蛋白在其N-聚糖上缺少 α -1, 3-連接的巖藻糖殘基和β -1, 2-連接的木糖殘基。
在一個具體的實施方式中,所述靶標核苷酸序列為如SEQ ID Νο:257所示的序列。
在另一個具體的實施方式中,所述靶標核苷酸序列為如SEQ ID Νο:260所示的序列。
在另一個具體的實施方式中,所述靶標核苷酸序列為如SEQ ID Νο:263所示的序列。
在特定實施方式中,本發(fā)明涉及根據(jù)本發(fā)明并如本文所描述的修飾的煙草植物的后代,其中所述的后代植物包含至少一種前文限定的修飾,如糖基轉移酶的活性或表達相對于未修飾的植物得到降低、抑制或基本上抑制,以及(ii)所述修飾的植物中產生的蛋白質的N-聚糖上的α -1, 3-巖藻糖或β -1, 2-木糖或二者相對于未修飾的植物是降低的。
在一個實施方式中,包含根據(jù)本發(fā)明并如本文描述的修飾的植物細胞的修飾的 (即遺傳修飾的)煙草植物細胞,或煙草植物(包括其后代)可用于生產異源蛋白質的方法,所述方法包括將包含編碼異源蛋白質的核苷酸序列的表達構建體引入如本文限定的修飾的煙草植物細胞或植物,所述異源蛋白質特別是疫苗抗原、細胞因子、激素、凝血蛋白質、載脂 蛋白、用于人類替代療法的酶、免疫球蛋白或其片段;以及培養(yǎng)包含所述表達構建體的修飾的植物細胞以產生異源蛋白質,以及可選地,由所述植物細胞再生植物并培養(yǎng)所述植物及其后代。
在一個實施方式中,本發(fā)明提供方法用于降低、抑制或基本上抑制涉及植物中蛋白質N-糖基化的一種或多種糖基轉移酶的酶活性。具體地,該方法包括修飾植物或植物細胞中的一種或多種糖基轉移酶的編碼序列,具體而言是其基因組核苷酸序列,可選地,還包括選擇和/或分離修飾的植物細胞,其中一種或多種糖基轉移酶的酶活性或所有糖基轉移酶活性得到降低、抑制或基本上抑制。該方法可選地可包括對糖基轉移酶、其片段或其等位基因或變體的鑒別。
具體而言,本發(fā)明涉及生產能夠產生人源化糖蛋白的煙草植物或植物細胞的方法,該方法包括
(i)修飾煙草植物細胞的基因組
a.包含N-乙酰基葡萄糖氨基轉移酶的編碼序列的基因組區(qū)域中的第一靶標核苷酸序列;或
b. a)的第一靶標核苷酸序列以及包含β (I, 2)_木糖基轉移酶或α (I, 3)_巖藻糖基轉移酶的編碼序列的基因組區(qū)域中的第二靶標核苷酸序列;或
c. a)的第一靶標核苷酸序列;b)的第二靶標核苷酸序列;以及包含β (I, 2)_木糖基轉移酶或α (1,3)_巖藻糖基轉移酶的編碼序列的基因組區(qū)域中的第三靶標核苷酸序列;以及備選地
d.包含(a),(b)或(C)的等位基因變體的基因組區(qū)域中的靶標核苷酸,或前述靶標核苷酸序列中任何兩個或更多個的組合。
(ii)鑒別并可選地選擇包含靶標核苷酸序列的修飾的植物或植物細胞,
其中修飾的植物或植物細胞中的如a)、b)、c)和d)中限定的糖基轉移酶,以及可選地其至少一種等位基因變體的活性或表達相對于未修飾的植物細胞得到降低、抑制或基本上的抑制,且所述修飾植物或植物細胞所產生的糖蛋白的N-聚糖缺少α -1, 3-連接巖藻糖殘基及β-1,2-連接的木糖殘基。
具體而言,本發(fā)明涉及用于生產能夠產生人源化糖蛋白的煙草植物或植物細胞的方法,該方法包括
(i)修飾煙草植物細胞的基因組
a.包含N-乙?;咸烟前被D移酶的編碼序列的基因組區(qū)域中的第一靶標核苷酸序列;或
b. a)的第一靶標核苷酸序列以及編碼N-乙?;咸烟前被D移酶第二靶標核苷酸序列;或
c. a)的第一靶標核苷酸序列和b)的第二靶標核苷酸序列以及包含N-乙?;咸烟前被D移酶的編碼序列的基因組區(qū)域中的第三靶標核苷酸序列;其中第二或第三靶標核苷酸序列,或第二和第三靶標核苷酸序列包含(a)的等位基因變體。
(ii)鑒別及可選地,選擇在靶標核苷酸序列中包含修飾的植物或植物細胞,
其中修飾的植物或植物細胞中的如a)、b)和c)中限定的糖基轉移酶的活性或表達相對于未修飾的植物細胞得到降低、抑制或基本上的抑制,且所述修飾植物或植物細胞所產生的糖蛋白在其N-聚糖缺少α-1,3-連接巖藻糖殘基及β-1,2-連接的木糖殘基。
具體而言,用于生產根據(jù)本發(fā)明并如本文所描述的能夠產生人源化糖蛋白的煙草植物或植物細胞的方法中,對煙草植物或植物細胞的基因組的修飾包括
a.鑒定在煙草植物或植物細胞中的靶標核苷酸序列中且可選地在其至少一種等位基因變體中的靶標位點,
b.基于根據(jù)本發(fā)明的靶標核苷酸序列,設計能夠識別并結合于所述靶標位點處或附近誘變的寡核苷酸,及
c.在使得基因組修飾的條件下,將該誘變的寡核苷酸結合于煙草植物或植物細胞的基因組中的靶標核苷酸序列上。
在一個實施方式中,該誘變的寡核苷酸用于基因組編輯技術,尤其是用于鋅指核酸酶介導的誘變、tilling、同源重組、寡核苷酸定點誘變或大范圍核酸酶介導誘變,或前述技術的組合。
在一個實施方式中,本發(fā)明涉及煙草植物細胞或煙草植物,其包含根據(jù)本發(fā)明且如本文描述的方法產生的修飾的植物細胞。
在本發(fā)明另一個實施方式中,根據(jù)本發(fā)明的修飾為能夠產生人源化糖蛋白的植物為煙草栽培種PM132,其以登記號NCMB 41802保藏。
在本發(fā)明的另一個實施方式中,在煙草栽培種PM132 (以登記號NCMB 41802保藏)中鑒別的并用于設計能夠識別并結合于所述靶標位點處或附近的誘變的寡核苷酸的靶標核苷酸序列與選自SEQ IDN0:256、259、262、265、268、271、274、277和280的核苷酸序列有至少 95%、96%、97%、98%、99% 或 100% 的同一性。
在一個具體的實施方式中,所述靶標核苷酸序列如SEQ ID No:256所示。
在本發(fā)明的另一個實施方式中,在煙草栽培種PM132 (以登記號NCMB 41802保藏)中鑒別的并用于設計能夠識別并結合于所述靶標位點處或附近的誘變的寡核苷酸的靶標核苷酸序列與選自SEQ ID NO: 257、260、263、266、269、272、275、278和281的核苷酸序列有至少 95%、96%、97%、98%、99% 或 100% 的同一性?!?br>
在一個具體的實施方式中,所述靶標核苷酸序列如SEQ ID No:257所示。
在一個實施方式中,包含根據(jù)本發(fā)明并在本文中描述的修飾的植物細胞的修飾的 (即遺傳修飾的)煙草植物細胞或煙草植物(包括其后代)為煙草栽培種PM132 (以登記號 NCIMB 41802保藏),其進一步地(a)在包含β (1,2)-木糖基轉移酶的編碼序列的基因組區(qū)域中包含至少第二靶標核苷酸序列的修飾,其序列分別與選自SEQ ID N0:l、4、5和17及 SEQ ID Ν0:8和18的核苷酸選序列有95%、96%、97%、98%、99%或100%的同一性;或(b)在包含α (1,3)_巖藻糖基轉移酶的編碼序列的基因組區(qū)域中包含至少第三靶標核苷酸序列的修飾,其序列分別與選自SEQ ID N0:27、32、37和47以及SEQ ID NO:28、33、38和48的核苷酸選序列有95%、96%、97%、98%、99%或100%的同一性;或(8)和(b)的組合。
由于煙草基因組的大小和復雜度以及潛在的多種變體和等位基因的存在,需要想出鑒別這些糖基轉移酶的基因序列的策略。根據(jù)本發(fā)明,提供了用于鑒別編碼植物糖基轉移酶的基因序列的方法。在一個具體的實施方式中,本發(fā)明的方法可包括Q)根據(jù)本領域已知方法構建植物基因組DNA文庫,如細菌人工染色體(BAC)基因組DNA文庫,(ii)將多聚核苷酸探針與基因組DNA文庫中的基因組克隆如BAC克隆在允許探針結合于同源核苷酸序列的條件下進行雜交,以及(iii)鑒別雜交于探針的基因組DNA克隆。探針是根據(jù)編碼糖基轉移酶的核苷酸序列或其片段而設計的。包括編碼糖基轉移酶的片段或部分的基因組 DNA克隆的核苷酸序列可根據(jù)本領域已知方法進行測序。
備選地,包含編碼已知的糖基轉移酶的序列的多核苷酸,如在第一種植物中已經鑒別的多核苷酸,可用于篩選第二種植物如煙草植物的外顯子序列集合。與編碼已知糖基轉移酶的多核苷酸有同源性的外顯子序列可用于開發(fā)探針以篩選第二種植物的基因組DNA 文庫如煙草BAC文庫,以鑒別BAC克隆并確定第二種植物的糖基轉移酶的基因組序列。
為幫助鑒別編碼本發(fā)明的糖基轉移酶的基因組序列,將這些基因組核苷酸序列與已知在具體植物器官如葉中表達的外顯子核苷酸序列數(shù)據(jù)庫進行計算機相比較。選擇匹配所需表達譜的基因組核苷酸序列,如葉中表達的基因或只在葉中表達的基因,進行進一步定性。本發(fā)明的該方面將鑒別過程聚焦于相關序列并降低了候選序列的數(shù)量。這樣排除了在具體器官(如葉)中不表達的假基因、失活等位基因或變體。
因此,作為一個非限制性實例,編碼煙草的β_(1,2)_木糖基轉移酶的基因組 DNA序列或其片段可通過使用多核苷酸探針篩選煙草BAC文庫而鑒別。該探針可根據(jù)煙草的β_(1,2)-木糖基轉移酶的外顯子的核苷酸序列而設計,可通過編譯與擬南芥 (Arabidopsis thaliana) β -(1,2)-木糖基轉移酶有同源性的煙草屬序列而裝配。外顯子的表達可通過使用包含煙草外顯子的多核苷酸的微陣列對煙草葉中的其mRNA進行檢測而得到測試。
在另一個非限制性實例中,編碼煙草的α (1,3)_巖藻糖基轉移酶的基因組DNA 序列或其片段可通過使用多核苷酸探針篩選煙草BAC文庫而鑒別。該探針可根據(jù)煙草的α (1,3)_巖藻糖基轉移酶的外顯子的核苷酸序列而設計,可通過鑒別顯示與擬南芥(Arabidopsis thaliana)的α (1,3)-巖藻糖基轉移酶的同源性的煙草屬序列而編譯,并通過使用包含煙草外顯子的多核苷酸的微陣列對其表達進行檢測而得到測試。
用于在植物細胞中鑒別編碼本發(fā)明的糖基轉移酶的基因組DNA序列的備選方法還可用在根據(jù)本發(fā)明的方法中。根據(jù)上文描述的方法,本發(fā)明公開的糖基轉移酶的多核苷酸序列可用于鑒別這些糖基轉移酶和其他相關糖基轉移酶的其他的等位基因。
在本發(fā)明的另一個實施方式中,包含糖基轉移酶的編碼序列的基因組DNA序列或其片段可通過聚合酶鏈式反應(PCR)而鑒定,使用的核酸引物是根據(jù)編碼糖基轉移酶的序列而設計的。具體而言,下文的正向引物和反向引物可組合使用以鑒別本發(fā)明的糖基轉移酶和其他相關糖基轉移酶的其他的等位基因
SEQ ID NO:2的正向引物和SEQ ID NO:3的反向引物;
SEQ ID NO: 10的正向引物和SEQ ID NO: 11的反向引物;
SEQ ID NO: 15的正向引物和SEQ ID NO: 16的反向引物;
SEQ ID NO:23的正向引物和SEQ ID NO:24的反向引物;
SEQ ID NO:25的正向引物和SEQ ID NO:26的反向引物;
SEQ ID NO:30的正向引物和SEQ ID NO:31的反向引物;
SEQ ID NO:35的正向引物和SEQ ID NO:36的反向引物;
SEQ ID NO:45的正向引物和SEQ ID NO:46的反向引物;或0100]SEQIDN0:231的正向引物和SEQIDNO:232的反向引物, 0101]SEQIDNO :236的正向引物和SEQIDNO:237的反向引物,0102]SEQIDNO :238的正向引物和SEQIDNO:239的反向引物,0103]SEQIDNO :240的正向引物和SEQIDNO:241的反向引物,0104]SEQIDNO :242的正向引物和SEQIDNO:243的反向引物,0105]SEQIDNO :244的正向引物和SEQIDNO:245的反向引物,0106]SEQIDNO :246的正向引物和SEQIDNO:247的反向引物;0107]SEQIDNO :248的正向引物和SEQIDNO:249的反向引物;0108]SEQIDNO :250的正向引物和SEQIDN0:251的反向引物;0109]SEQIDNO :252的正向引物和SEQIDNO :253的反向引物,或0110]SEQIDNO :254的正向引物和SEQIDNO :255的反向引物
本發(fā)明提供的引物具有如SEQ ID Ν0:2和SEQ ID NO:3所示的序列,用于擴增疊連群gDNA_cl736055的片段;具有如SEQ ID N0:10和SEQ ID NO: 11所示的序列,用于擴增煙草和本氏煙草的GnT1-B的片段;具有如SEQ ID NO: 15和SEQ ID NO: 16所示的序列,用于擴增疊連群CH0_0F4335xnl3fI的片段;具有如SEQ ID N0:23和SEQ ID N0:24所示的序列,用于擴增煙草和本氏煙草的GnT1-A的片段;具有如SEQ ID N0:25和SEQ ID NO:26 所示的序列,用于擴增疊連群CH0_0F3295xjl7fl的片段;具有如SEQ ID N0:30和SEQ ID NO:31所示的序列,用于擴增疊連群gDNA_cl765694的片段;具有如SEQ ID NO:35和SEQ ID N0:36所示的序列,用于擴增疊連群CH0_0F4881xd22drl的片段;或有如SEQ ID NO:45 和SEQ ID N0:46所示的序列,用于擴增疊連群CH0_0F4886xdllfl的片段;具有如SEQ ID N0:231和SEQ ID NO:232所示的序列,用于擴增疊連群gDNA_cl690982的片段,其含有煙草 N-乙酰葡萄糖氨基轉移酶I內含子-外顯子序列,具有SEQ ID N0:236和SEQ ID N0:237所示的序列,用于擴增煙草PM132的FABIJ1-同源物,具有SEQ ID N0:238和SEQ ID NO:239 所示的序列,用于擴增煙草PM132的CPOGnTI基因組序列,具有SEQ ID NO:240和SEQ ID 勵:241所示的序列,用于擴增煙草?] 132的04080702.1同源物,具有SEQ ID N0:242和SEQ ID NO: 243所示的序列,用于擴增煙草??怂归熑~的GnTI序列,具有SEQ ID NO: 244和SEQ ID NO: 245所示的序列,用于擴增煙草??怂归熑~的GnTI序列,具有SEQ ID NO: 246和SEQ ID NO: 247所示的序列,用于擴增煙草PM132的gDNA,其含有5’UTR及外顯子1_7,具有SEQ ID N0:248和SEQ ID NO:249所示的序列,用于擴增煙草PM132的gDNA,其含有外顯子4 一 13;具有SEQ ID N0:250和SEQ ID NO:251所示的序列,用于擴增煙草PM132的gDNA,其含有及外顯子12-19及3’UTR,具有SEQ ID N0:252和SEQ ID N0:253所示的序列,用于擴增煙草 PM132 的 gDNA,其含有外顯子 12-19 及 3’UTR,具有 SEQ ID NO: 254 和 SEQ ID NO: 255, 用于擴增煙草PM132的gDNA,其含有及外顯子12-19及3’ UTR,
本發(fā)明還包含了多核苷酸,其包含SEQ ID N0:2、3、10、ll、15、16、23、24、25、26、 30、31、35、36、45、或 46、231、232、236、237、238、239、240、241、242、243、244、245、246、247、 248、249、250、251、252、253、254或255中所示的引物之一的核苷酸序列或者大于或等于10 堿基對長的其亞序列。然而,技術人員能夠修飾及修改這些弓丨物、引物序列或引物對,例如通過延長或縮短這些序列或二者的組合或特異的核苷酸交換。
根據(jù)本發(fā)明如上文所描述的方法,本發(fā)明提供了核苷酸序列,其編碼本發(fā)明的糖基轉移酶的至少片段,特別是 SEQ ID N0:l、4、5、7、12、13、14、17、27、32、37、40、41、和 47、 233。在另一個實施方式中,本發(fā)明提供了核苷酸序列,其編碼本發(fā)明的糖基轉移酶的至少片段,特別是 SEQ ID N0:256、259、262、265、268、271、274、277 和 280。在另一個實施方式中,本發(fā)明提供了核苷酸序列,其編碼本發(fā)明的糖基轉移酶的至少片段,特別是SEQ ID N0:18、20、21、22、28、33、38、48、212、213、219、220、223、225、227、229、234。在另一個實施 方式中,本發(fā)明提供了核苷酸序列,其編碼本發(fā)明的糖基轉移酶的至少片段,特別是SEQ ID N0:257、260、263、266、269、272、275、278、281。
本發(fā)明還包含的是與SEQ ID N0:l、4、5、7、12、13、14、17、27、32、37、40、41 和 47、 233 中任何一項的核苷酸序列,與 SEQ ID N0:SEQ ID NO:256、259、262、265、268、271、274、 277 和 280 中任何一項的核苷酸序列,與 SEQ ID NO: 18、20、21、22、28、33、38、48、212、213、 219、220、223、225、227、229、234 中任何一項的核苷酸序列,與 SEQ ID NO:257、260、263、 266、269、272、275、278、281中任何一項的核苷酸序列共享至少90%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性的多核苷酸。本發(fā)明中還包含的是多核苷酸,其具體而言在嚴格的條件下雜交于核酸探針,所述探針包含(i)SEQ ID N0:l、4、5、7、12、13、 14、17、27、32、37、40、41、和47、233 中任何一項的核苷酸序列;或(ii)SEQ ID N0:l、4、5、7、 12、13、14、17、27、32、37、40、41和47,233中任何一項的核苷酸序列的互補序列。
本發(fā)明中還包含的是多核苷酸,其具體而言在嚴格的條件下雜交于核酸探針,所述探針包含(i)SEQ ID N0:256、259、262、265、268、271、274、277 和 280 中任何一項的核苷酸序列,或(ii)SEQ ID NO:SEQ ID NO:256、259、262、265、268、271、274、277 和 280 中任何一項的核苷酸序列的互補序列。
本發(fā)明中還包含的是多核苷酸,其具體而言在嚴格的條件下雜交于核酸探針,所述探針包含(i)SEQ ID N0:257、260、263、266、269、272、275、278、281 中任何一項的核苷酸序列,或(ii)SEQ ID N0:257、260、263、266、269、272、275、278、281 中任何一項的核苷酸序列的互補序列。
本發(fā)明中還包含的是多核苷酸,其具體而言在嚴格的條件下雜交于核酸探針,所述探針包含(i)SEQ ID N0:18、20、21、22、28、33、38、48、212、213、219、220、223、225、227、 229、234 中任何一項的核苷酸序列;或(ii)SEQ ID NO: 18、20、21、22、28、33、38、48、212、 213、219、220、223、225、227、229、234中任何一項的核苷酸序列的互補序列。
本發(fā)明中還包含的是上文所公開的多核苷酸的片段。
本發(fā)明的多核苷酸的片段包括但不限于寡核苷酸或引物,其長度可為至少16個核苷酸。在多種實施方式中,片段長度可為至少20、30、40、50、60、70、80、90、100、200、300、 400、500、1000、1500、2000、2500、3000、3500、4000、4500、5000、6000、7000、8000、9000 或更多的連續(xù)核苷酸。備選地,這些片段可包含編碼本 發(fā)明的糖基轉移酶的大約10、20、25、30、 35、40、45、50、55、60、65、70、75、80、85、90、100、150、200、250、300、350、400、450、500、600、 700、800、900、1000或更多的連續(xù)氨基酸殘基的核苷酸序列。本發(fā)明的多核苷酸片段還可指本發(fā)明的糖基轉移酶的外顯子或內含子,以及這些多核苷酸編碼區(qū)的部分,其編碼功能結構域如酶的信號序列和活性位點。許多這些片段可用作核酸探針用于鑒別本發(fā)明的多核苷酸。
本發(fā)明進一步涉及上文鑒定的本發(fā)明的多核苷酸所編碼的糖基轉移酶,其中所述糖基轉移酶為
a. N-乙酰葡萄糖氨基轉移酶,其氨基酸序列如SEQ ID NO: 214、215、217、218、221、 222、224、228、230、235、258、264、267、270、273、276、279 和 282 所示;
b. β (I, 2)-木糖基轉移酶,其氨基酸序列如SEQ ID NO:9和19所示;
c. α (1,3)-巖藻糖基轉移酶,其氨基酸序列如SEQ ID NO: 29、34、39和49所示;
d.氨基酸序列,其與(i)、(ii)、或(iii)的氨基酸序列有至少95%、96%、97%、98%、 99%的同一性。
在本發(fā)明的一個實施方式中,如本文限定的基因組核苷酸序列被用于在以下序列中鑒別靶標位點,
a.包含N-乙酰基葡萄糖氨基轉移酶的編碼序列的基因組區(qū)域中的第一靶標核苷酸序列;或
b. a)的第一靶標核苷酸序列和包含β (I, 2)_木糖基轉移酶的編碼序列的基因組區(qū)域中的第二靶標核苷酸序列;或
c. a)的第一靶標核苷酸序列和包含α (I, 3)-巖藻糖基轉移酶的編碼序列的基因組區(qū)域中的第三靶標核苷酸序列;或
d. a)、b)和c)的所有靶標核苷酸序列;
以進行修飾使得(i)包含該修飾的植物細胞中的N-乙?;咸烟前被D移酶, 或N-乙?;咸烟前被D移酶和β (1,2)_木糖基轉移酶,或N-乙酰基葡萄糖氨基轉移酶和α (1,3)_巖藻糖基轉移酶或N-乙酰基葡萄糖氨基轉移酶、β (1,2)_木糖基轉移酶、 α (1,3)_巖藻糖基轉移酶以及可選地其至少一種等位基因變體的活性或表達,相對于未修飾的植物細胞得到降低,(ii)包含該修飾的修飾的植物細胞中蛋白質的N-聚糖上的 α -1, 3-巖藻糖或β -1, 2-木糖,或二者相對于未修飾的植物細胞得到降低。
在本發(fā)明的一個實施方式中,如本文限定的基因組核苷酸序列被用于在以下序列中鑒別靶標位點,
a.包含N-乙?;咸烟前被D移酶的編碼序列的基因組區(qū)域中的第一靶標核苷酸序列;或
b. a)的第一靶標核苷酸序列和包含第二種N-乙酰基葡萄糖氨基轉移酶的編碼序列的基因組區(qū)域中的第二靶標核苷酸序列;或
c. a)的第一靶標核苷酸序列和包含第三種N-乙酰基葡萄糖氨基轉移酶的編碼序列的基因組區(qū)域中的第三靶標核苷酸序列;或
d. a)、b)和c)的所有靶標核苷酸序列;
以進行修飾,使得(i)包含該修飾的修飾的植物細胞中的N-乙?;咸烟前被D移酶,或者兩種或更多種N-乙?;咸烟前被D移酶的活性或表達得到降低,和(ii)包含該修飾的修飾的植物細胞中蛋白質的N-聚糖上的α-1,3-巖藻糖或β-1,2-木糖,或二者相對于未修飾的植物細胞得到降低。所述第二或第三核苷酸序列或第二和第三核苷酸序列可為第一核苷酸序列的等位基因變體。
在本發(fā)明一個具體 實施方式中,使用了選擇性結合于如本文所限定的基因組核苷酸序列或編碼序列的非天然鋅指蛋白質,用于產生鋅指核酸酶,其在至少一靶標核苷酸序列中引入雙鏈斷裂。
在另一個實施方式中,本發(fā)明針對本文公開的編碼序列上游和下游的調控區(qū)域, 這些可容易地由本文提供的基因組序列進行確定和分離。這些調控區(qū)域內包括而不限于, 啟動子序列、上游激活子序列以及調制本文鑒別的基因表達的調節(jié)蛋白質的結合位點。
對應于本發(fā)明的糖基轉移酶的基因組DNA序列的RNA1、shRNA (McIntyre和 Fanning(2006), BMC Biotechnology 6:1)、核酶、反義核苷酸序列(如反義DNA或反義 RNA)、siRNA(Hannon(2003),Rna1:A Guide to Gene Silencing, Cold Spring Harbor Laboratory Press, USA),及 PNA 也包括在內。
在具體的實施方式中,本發(fā)明提供四個編碼α-l,3-巖藻糖基轉移酶的基因序列、其片段、變體或等位基因形式;兩個編碼β-1,2-木糖基轉移酶的基因序列、其片段、變體或等位基因形式;以及一個編碼N-乙?;咸烟前被D移酶I的基因序列、其片段、變體或等位基因形式。具體而言,本發(fā)明的糖基轉移酶表達于葉中。
在兩種或多種核酸或蛋白質序列的情況下,術語“同一性百分比”指的是兩種或多種序列或亞序列在比較和比對其最大對應性時,其為相同的或具有特定百分比的氨基酸殘基或核苷酸是相同的,如使用下列序列對比算法之一或通過目測所測量的。術語“同一性”用于本文的核苷酸序列或氨基酸序列的情況下,其描述了兩個序列彼此有至少50%、至少55%、至少60%、具體地為至少70%、至少75%、更具體地為至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少 96%、至少97%、至少98%、至少99%或100%的同一性。
如果兩個要相互比較的序列長度有差異,則序列同一性優(yōu)選地涉及較短序列中與較長序列中核苷酸殘基相同的核苷酸殘基的百分比。如本文所使用的,兩個序列間的同一性百分比為這些序列共有的相同位置數(shù)量的函數(shù)(即,同一性%=相同位置#/位置#x 100),其中考慮到了對兩個序列進行最佳比對需要引入的缺口數(shù)量以及每個缺口的長度。兩個序列之間的序列比較及同一性百分比的確定可使用數(shù)學算法進行,如本文下面所描述的。例如,序列同一'I"生可常規(guī)地使用計算機程序如Bestfit程序(Wisconsin Sequence Analysis Package, Version 8for Unix, Genetics Computer Group, University Research Park, 575Science Drive Madison, WI 53711)而確定。Bestfit 使用了 Smith 和 Waterman 的局部同源性算法(Advances in Applied Mathematics 2 (1981),482-489)以尋找兩個序列間具有最高序列同一性的區(qū)段。在使用Bestfit或其他序列比對程序確定某具體序列與本發(fā)明的參考序列是否有例如95%的同一性時,優(yōu)選地調整這些參數(shù)以使同一性百分比在整個參考序列長度范圍內得到計算,且允許存在參考序列中核苷酸總數(shù)的多至5%的同源缺口。當使用Bestfit時,優(yōu)選地使所述可選參數(shù)處于其預設(“缺省”)值。在比較給定序列和上文描述的本發(fā)明的序列之間出現(xiàn)的偏差可例如由于添加、刪除、置換、插入或重組而造成。優(yōu)選地還可使用程序“fasta20u66”(版本 2. 0u66, September 1998 by William R. Pearson and the University of Virginia;另 JAL ff. R. Pearson (1990), Methods in Enzymology 183, 63-98,附錄實施例及 http://workbench, sdsc. edu/)進行這樣的序列比較。為此目的,可使用“缺省”參數(shù)設置。
如果要通過序列比較來比較的兩個核苷酸序列在同一性上有差異,指的是較短序列和匹配較短序列的較長序列部分。換言之,當進行比較的序列不具有相同的長度時,則同一性程度優(yōu)選地指的是較短序列中與較長序列核苷酸殘基同一的核苷酸殘基百分比或指的是較長序列中與較短序列的核苷酸序列同一的核苷酸百分比。在此情況下,技術人員可容易地確定較長序列中“匹配”較短序列的部分。
與本文描述的核苷酸或氨基酸序列有至少50%、至少55%、至少60%、特別是70%、至少75%、更優(yōu)選地為至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%,或至少99%的同一性的核苷酸或氨基酸可為這些序列的等位基因、衍生物或變體,其優(yōu)選地具有類似的生物學功能。其可為天然發(fā)生的變異如等位基因序列,來自 其他生態(tài)型、變種、物種等的序列或突變。這些突變可能是天然形成的或通過人為的誘變方法產生的,如本發(fā)明中所公開的。進一步地,這些變異可為人工產生的序列。這些等位基因變體可為天然發(fā)生的變體或合成產生的變體或由重組DNA技術產生的變體??衫缤ㄟ^刪除、置換、添加、插入或重組或插入重組產生上述多核苷酸的衍生物。術語“添加”指的是在給定序列的末端添加至少一個核酸殘基或氨基酸,而“插入”指的是將至少一個核酸殘基或氨基酸插入給定序列之內。
兩個核苷酸序列基本上相同的另外一種表示為所述兩個多核苷酸在嚴格條件下相互雜交。詞語“特異性雜交于”指的是當序列存在于復合物混合物(如,總細胞)DNA或RNA 中時,分子在嚴格條件下僅僅結合、復合或雜交于具體核苷酸序列?!盎旧辖Y合”指的是核酸探針和靶標核酸之間的互補雜交,并包含少量的錯配,這是通過降低雜交介質的嚴格性達到的,以對靶標核酸序列進行可取的檢測。
能夠雜交于本文提供的多核苷酸序列的多核苷酸序列可例如分離自植物的基因組DNA文庫或cDNA文庫。具體而言,這些多核苷酸來自植物來源,尤其優(yōu)選地來自煙草屬的植物,特別是本氏煙草或煙草。備選地,這些核苷酸序列可通過遺傳工程或化學合成而制備。
這些能夠雜交的多核苷酸序列可使用本文描述的多核苷酸序列或其部分或反向互補物而鑒別和分離,例如通過根據(jù)標準方法的雜交(見例如,Sambrook and Russell(2001), Molecular Cloning:A Laboratory Manual, CSH Press, Cold Spring Harbor, NY, USA)。包含與所列出的SEQ ID NO中所示的核苷酸序列相同或基本上相同的核苷酸序列或其部分或片段可例如用作雜交探針。用作雜交探針的片段也可為通過通常的合成技術制備的合成片段,其序列與根據(jù)本發(fā)明的核苷酸序列基本上同一。
“嚴格雜交條件”和“嚴格雜交洗滌條件”在核酸雜交實驗如DNA和RNA雜交的情況下為序列依賴性的,在不同的環(huán)境參數(shù)下也有不同。較長序列在較高溫度下特異性地雜交。對核酸雜交的深入指導見于Tijssen(1993)Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization with Nucleic Acid Probes part I chapter 2〃0verview of principles of hybridization and the strategy ofnucleic acid probe assays〃Elsevier, New York。一般地,高度嚴格的雜交和洗漆條件選擇為比限定離子強度和pH下具體序列的熱熔點低大約5°C。通常,在“嚴格條件”下探針會雜交于其靶標亞序列而不雜交于其他序列。
熱解鏈點為(限定離子強度和pH下)50%的靶標序列雜交于完全匹配探針的溫度。 非常嚴格的條件選擇為等于具體探針的解鏈溫度(Tm)。用于Southern或Northern印跡中對于濾紙上具有超過100個互補殘基的互補核酸的雜交的一個嚴格雜交條件的實例為, 使用50%甲醛(含有Img的肝素),在42°C下雜交過夜。高度嚴格洗滌條件的一個實例為以O.15M NaCl在72°C洗滌大約15分鐘。嚴格洗滌條件的一個實例為以O. 2倍的SSC在65°C 下洗滌15分鐘(SSC緩沖液的配制見Sambrook,見下文)。通常在低嚴格洗滌后會進行高度嚴格的洗滌條件,以移除背景探針信號。用于例如超過100個核苷酸的雙鏈的中等嚴格洗滌的實例為I倍的SSC在45 °C下洗滌15分鐘。用于例如超過100個核苷酸的雙鏈的中等嚴格洗滌的實例為4-6倍的SSC在40°C下洗滌15分鐘。對于短探針(例如,大約10-50個核苷酸),嚴格的條件一般涉及的鹽濃度為低于大約1. OM Na離子,一般濃度為大約O. 01-1. OM 的Na離子濃度(或其他鹽),pH為7. 0-8. 3 ,溫度一般至少為大約30°C。嚴格的條件還可通過添加去穩(wěn)定試劑如甲酰胺而達到。通常,在具體的雜交測定中信噪比為不相關探針觀察到的比率的2倍(或更高)表明檢測的是特異性雜交。如果其編碼的蛋白質基本上是同一的,則嚴格條件下不相互結合的核酸還是基本上同一的。例如當使用遺傳密碼允許的最大密碼子簡并性制造出一個的核酸拷貝時會發(fā)生此種情況。
在鑒別出至少編碼本發(fā)明的糖基轉移酶的一個片段的核苷酸序列后,本發(fā)明進一步提供了用于在植物或植物細胞中修飾核苷酸序列的方法,產生的植物或植物細胞顯示糖基轉移酶的酶活性的降低、抑制或基本上的抑制,或顯示了糖基轉移酶表達水平的降低。所述酶活性的降低、抑制或基本上的抑制或者表達水平的變化是相對天然發(fā)生的植物細胞、 未修飾植物細胞或不是用本發(fā)明的方法修飾的植物細胞而言的,其中任何一種都可用作對照。針對這樣的對照的酶活性或表達水平的比較可通過任何本領域已知方法進行。
術語“修飾的植物細胞”或“修飾的植物”在本文與術語“遺傳修飾的植物細胞”或 “遺傳修飾的植物”交換使用,指的是受到人工修飾而在植物細胞基因組內部包含的核苷酸序列中的一個當中含有突變或修飾(這是通過應用本領域已知方法進行的,包括但不限于, 化學誘變或基因組編輯技術,如本文下文中詳述的)的植物細胞以及包含這樣的修飾的植物細胞的植物。
本領域許多已知方法可用于突變本發(fā)明的糖基轉移酶基因的核苷酸序列。向基因序列中隨機引入突變的方法可以為化學誘變,例如但不限于EMS誘變和輻射誘變。向細胞引入靶向突變的方法包括但不限于基因組編輯技術,特別是鋅指核酸酶介導的誘變、 tilling (革巴向基因組中誘導的局部損傷,如McCallum等人,Plant Physiol, June2000, Vo1.123, pp. 439-442 以及 Henikoff 等人,Plant Physiologyl35:630-636 (2004)中所描述的)、同源重組、寡核苷酸定向誘變、以及大范圍核酸介導的誘變。本領域許多已知用于篩選突變的基因序列的方法可用于對突變進行鑒別或確認。
鋅指核酸酶介導的誘變的一般用途在本領域已知,并描述于專利出版物,例如但不限于,W002057293、W002057294、W00041566、W00042219,和 W02005084190,其以全文并入本文作為參考。大范圍核酸酶介導的誘變的一般用途在本領域已知,并描述于專利出版物, 例如但不限于,W096/14408、W02003025183、W02003078619、W02004067736、W02007047859 和 W02009059195,其以全文并入本文作為參考。
因此本發(fā)明的一個方法包括通過應用誘變如化學誘變或放射性誘變,對植物細胞中的編碼本發(fā)明的糖基轉移酶的序列進行修飾。本發(fā)明的另一個方法包括通過應用基因組編輯技術(例如但不限于,鋅指核酸酶介導的誘變)、“tilling”(定向誘導基因組局部突變技術)、同源重組、寡核苷酸定向誘變及大范圍核酸介導的誘變)對編碼本發(fā)明的糖基轉移酶的序列中的靶標位點進行修飾。
考慮到植物細胞中可能有多種有活性的糖基轉移酶、變體和等位基因,為達到酶活性的降低、基本上抑制或完全抑制,包括在植物細胞中修飾超過一種編碼糖基轉移酶的基因序列。在本發(fā)明的優(yōu)選的實施方式中,是通過應用一種或多種本領域已知的基因組編輯技術產生修飾的。本發(fā)明的修飾的植物細胞可使用大量的策略而產生。
在本發(fā)明的一個實施方式中,修飾了植物細胞中編碼第一種糖基轉移酶的第一基因序列或其片段, 隨后鑒別并分離顯示第一種糖基轉移酶活性降低的修飾的植物細胞。然后包含修飾的第一種糖基轉移酶基因的修飾的植物細胞經過誘變,其中修飾了編碼第二種糖基轉移酶的第二基因序列或其片段。隨后鑒別并分離修飾的植物細胞,其顯示第二種糖基轉移酶的活性降低,或糖基轉移酶活性相對于僅攜帶第一種修飾的細胞的進一步降低。 鑒定后可對修飾的植物細胞進行分離。在此階段獲得的修飾的植物細胞包含兩個基因序列中的兩種修飾,所述基因序列編碼了兩種糖基轉移酶,或一種糖基轉移酶的兩種變體或等位基因。
本發(fā)明的修飾的植物細胞或修飾的植物可通過產生與未修飾植物或植物細胞中產生的糖基轉移酶不同分子量的突變糖基轉移酶而得到鑒別。突變的糖基轉移酶可以為在未修飾的植物或植物細胞中產生的糖基轉移酶的截短形式或延長形式,并可用作標記物以幫助鑒別修飾的植物或植物細胞。多肽的截短或延長通常是由于在編碼序列中引入終止密碼子或在閱讀框中引入移碼導致使用了備選的閱讀框中的終止密碼子。
本發(fā)明進一步提供了修飾的植物細胞經歷編碼其他糖基轉移酶的基因或糖基轉移酶的其他變體或等位基因的一輪或多輪連續(xù)修飾,例如編碼糖基轉移酶的第三、第四、第五、第六、第七或第八基因序列或者其變體或等位基因。預期的是受到修飾的第一基因序列編碼本發(fā)明的糖基轉移酶,例如但不限于β_1,2-木糖基轉移酶、α-1,3_巖藻糖基轉移酶或N-乙酰葡萄糖氨基轉移酶。編碼糖基轉移酶的第二、第三、第四、第五、第六、第七或第八基因或其等位基因各自獨立地可編碼β_1,2-木糖基轉移酶、α-1,3-巖藻糖基轉移酶或N-乙酰葡萄糖氨基轉移酶。所述修飾的植物細胞顯示了降低的酶活性或者酶活性的抑制或基本上抑制,其可包含一個、兩個、三個、四個、五個、六個、七個、八個或更多的分別編碼了本發(fā)明的一種糖基轉移酶的修飾的基因序列,其中所述糖基轉移酶各自獨立地為 β -1, 2-木糖基轉移酶、α -1, 3-巖藻糖基轉移酶或N-乙酰葡萄糖氨基轉移酶。
因此,本發(fā)明提供了修飾的植物細胞,其包含兩個或更多個修飾的β-1, 2-木糖基轉移酶基因組DNA序列、兩個或更多個修飾的α -1, 3-巖藻糖基轉移酶基因組DNA序列、 或者兩個或更多個修飾的N-乙酰葡萄糖氨基轉移酶基因組DNA序列。包含一個或更多個修飾的β -1, 2-木糖基轉移酶基因組DNA序列和一個或更多個修飾的N-乙酰葡萄糖氨 基轉移酶基因組DNA序列的修飾的植物細胞也包括在內。還提供了包含一個或更多個修飾的 α -1, 3-巖藻糖基轉移酶基因組DNA序列和一個或更多個修飾的N-乙酰葡萄糖氨基轉移酶基因組DNA序列的修飾的植物細胞。還包括的是包含一個或更多個修飾的α-1,3-巖藻糖基轉移酶基因組DNA序列和一個或更多個修飾的β -1, 2-木糖基轉移酶基因組DNA序列的修飾的植物細胞。
另一種用于產生包含超過一個修飾的糖基轉移酶基因序列的修飾植物或植物細胞的策略包括將兩種不同的植物進行雜交,其中所述兩種植物中每種都包含一個或更多個不同的修飾的糖基轉移酶基因序列。用于雜交的修飾的植物可通過上文描述的本發(fā)明的方法而產生。
用于如上文描述的雜交或基因組修飾的修飾植物或植物細胞可通過以下特征而鑒別或選擇(i) 一種或多種糖基轉移酶的活性降低或不可檢測;(ii) 一種或多種糖基轉移酶的表達降低或不可檢測;(iii)植物蛋白質或異源蛋白質的N-聚糖上的α-1,3_連接果糖β -1, 2-連接的木糖或二者的水平降低或不可檢測;或(iv)修飾植物或植物細胞中的高甘露糖型N-聚糖的增加或累積。
在本發(fā)明的一個實施方式中,修飾的植物或修飾的植物細胞可通過鋅指核酸酶介導的誘變而產生。鋅指DNA-結合結構域或基序由大約30個氨基酸構成,其折疊成一種 β β α結構,其中的α-螺旋插入DNA雙螺旋中。如本發(fā)明中所使用的,術語“ α -螺旋” 指的是一種蛋白質二級結構中的基序,其為右手或左手卷曲,其中氨基酸的每個N-H基團的氫鍵都結合于相對于第一個氨基酸為-4位置的氨基酸的C=O基團上。如本文所使用的, “β_桶”指的是一種蛋白質二級結構中的基序,其包含兩條β_鏈,其中第一條鏈與第二條鏈以氫鍵相連而形成閉合結構。如本文所使用的,“β β α結構”指的是蛋白質中的一種結構,其由包含兩條反向平行的β鏈的桶以及一個α-螺旋構成。如本發(fā)明中所使用的,術語“鋅指DNA-結合結構域”指的是一種蛋白質結構域,其包含了鋅離子并能夠結合于特定的三堿基對DNA序列。如本文所使用的,術語“非天然鋅指DNA-結合結構域”指的是在包含要修飾的DNA的細胞或生物體中不產生的鋅指DNA-結合結構域。
鋅指DNA-結合結構域或基序中結合于靶標DNA中的三堿基對序列的關鍵氨基酸為相對α -螺旋起始氨基酸-1、+1、+2、+3、+4、+5和+6。可修飾相對鋅指DNA-結合結構域或基序的α -螺旋起始的氨基酸-1、+1、+2、+3、+4、+5和+6而同時維持β -桶骨架以產生結合于不同的三堿基對序列的新的DNA-結合結構域或基序。這樣的新DNA-結合結構域可以為非天然發(fā)生的鋅指DNA-結合結構域。除了由相對^-螺旋起始點位置為_1、+1、+2、+3、+4、+5和+6的氨基酸識別的三堿基對序列外,這些氨基酸中有一些還與三堿基對序列識別位點之外的一個堿基對相互作用。通過組合兩種、三種、四種、五種、六種或更多鋅指 DNA-結合結構域或基序,可產生特異性結合于更長的DNA序列的鋅指蛋白質。例如,包含兩個鋅指DNA-結合結構域或基序的鋅指蛋白質可識別特異的六堿基對序列,而包含四個鋅指DNA-結合結構域或基序的鋅指蛋白質可識別特異的十二堿基對序列。鋅指蛋白質可包含兩種或多種天然鋅指DNA-結合結構域或基序,或兩種或多種通過截短或延長或結合特定選擇方法(例如但不限于噬菌體展示選擇、細菌雙雜交選擇或細菌單雜交選擇)的定點誘變的衍生自天然或野生型鋅指蛋白質非天然鋅指DNA-結合結構域或基序或天然和非天然鋅指DNA-結合結構域的任何組合。如本文上下文中所使用的,“截短”指的是含有少于天然鋅指蛋白質中所見的鋅指DNA-結合結構域或基序的完全數(shù)量的鋅指蛋白質。如本文上下文中所使用的,“延長”指的是含有多于天然鋅指蛋白質中所見的鋅指DNA-結合結構域或基序的全部數(shù)量的鋅指蛋白質。本領域已知的用于選擇基因組序列之內的鋅指蛋白質的多核苷酸技術可用于本發(fā)明。用于構建結合于這種多核苷酸序列的非天然鋅指蛋白質的方法也對本領域技術人員已知,并可用于本發(fā)明。
在本發(fā)明一個具體實施方式
中,包含本發(fā)明的糖基轉移酶的部分或全部編碼序列的基因組DNA序列是通過鋅指核酸酶介導的誘變修飾的。對所述基因組DNA序列搜尋用于鋅指蛋白質結合的獨特位點。備選地,對所述基因組DNA序列搜尋用于鋅指蛋白質結合的兩個獨特位點,其中兩個位點在相反的鏈上并相互閉合。所述兩個鋅指蛋白質靶標位點可相 距0、1、2、3、4、5、6或更多堿基對。所述鋅指蛋白質靶標位點可在糖基轉移酶基因序列的編碼序列或控制糖基轉移酶表達的調控元件中,例如但不限于糖基轉移酶基因的啟動子區(qū)域。具體而言,所述一種或兩種鋅指蛋白質為非天然鋅指蛋白質。
因此,本發(fā)明提供結合于本發(fā)明的糖基轉移酶的鋅指蛋白質,例如但不限于, β -1, 2-木糖基轉移酶或其片段、α -1, 3-巖藻糖基轉移酶或其片段、N-乙酰葡萄糖氨基轉移酶或其片段。在一個優(yōu)選的實施方式中,鋅指蛋白質結合于本發(fā)明的煙草的糖基轉移酶。
預期的是用于通過鋅指核酸酶介導誘變來突變編碼本發(fā)明的糖基轉移酶的基因序列如基因組DNA序列的方法可選地包括以下一個或多個步驟(i)提供至少兩種選擇性結合于基因序列中不同靶標位點的鋅指蛋白質;(ii)構建兩種表達構建物,其各自編碼了包含步驟(i)中的兩種不同非天然鋅指蛋白質之一的不同鋅指核酸酶,以及可操作地連接于在植物細胞中可操作的表達對照序列的核酸酶;(iii)將所述兩種表達構建物引入其中產生所述兩種不同鋅指核酸酶的植物細胞,這樣在植物細胞基因組的基因組DNA序列中或在至少一個所述靶標位點處或附近引入雙鏈斷裂。所述兩種表達構建物向植物細胞的引入可同時或順序完成,其可選地包括對攝取了第一種構建物的細胞的選擇。
如本文所使用的,雙鏈斷裂(DSB)指的是DNA或RNA的兩條鏈上都有斷裂。雙鏈斷裂可發(fā)生在基因組DNA序列上的位點處,其從一個靶標位點去除不超過5堿基對-1500堿基對,特別是不超過5堿基對-200堿基對,特別是不超過5堿基對-20堿基對。雙鏈斷裂可促進非同源末端連接,導致基因組DNA序列中的靶標位點處或附近產生突變。如本文所使用的,“非同源末端連接(NHEJ)”指的是一種修復機制,其通過直接連接修復雙鏈斷裂而不需要同源模板,因此可在雙鏈斷裂發(fā)生前對序列有誘變性。
所述方法可選地可進一步包含步驟(iv)將至少包含雙鏈斷裂上游核苷酸序列的第一同源區(qū)域和雙鏈斷裂上游核苷酸序列的第二同源序列的多核苷酸引入所述植物細胞。 所述多核苷酸可包含的核苷酸序列對應于含有異源核苷酸序列的刪除或插入的糖基轉移酶基因序列。因此,該多核苷酸可促進靶標位點處或附近的同源重組,導致同源序列插入基因組或基因組DNA序列從基因組刪除。在植物細胞中所得的基因組DNA序列可包含破壞所表達的突變體糖基轉移酶的酶活性的突變、早期翻譯終止密碼子或干擾前體-mRNA成為 mRNA的適當加工過程的序列基序,導致基因表達降低或失活。用于通過突變編碼蛋白質的基因而破壞蛋白質合成的方法對本領域技術人員已知。
根據(jù)本發(fā)明的鋅指核酸酶可通過制造第一種多核苷酸(其編碼結合于涉及N-糖基化的基因的基因序列的鋅指蛋白質,例如但不限于本發(fā)明的糖基轉移酶)和第二種多核苷酸(其編碼非特異性內切核酸酶,例如但不限于IIS型內切核酸酶)的融合物而構建。IIS 型內切核酸酶為具有分開的識別結構域和內切核酸酶裂解結構域的限制性內切酶,其中酶在識別位點以外的位點裂解DNA。IIS型內切核酸酶的非限制性實例為Aarl、BaeI, CdiI, Drdll、Ecil、Fok1、Faul、Gdill、Hgal、Ksp6321、MboI1、Pflll081、Rlel081、RleAI, Sap I, TspDTI或UbaPI,但不限于此。
用于涉及和構建融合蛋白質的方法,用于從IIS型內切核酸酶的序列識別結構域選擇和分離內切核酸酶結構域的方法,用于設計和構建包含鋅指蛋白質和內切核酸酶的融合蛋白質的鋅指核酸酶的方法在本領域已知,并可用于本發(fā)明。在一個具體的實施方式中, 鋅指核酸酶的核酸酶結構域為FokI的核酸酶結構域。鋅指蛋白質和FokI的核酸酶之間的融合蛋白質可包含間隔子,其由兩個堿基構成,或備選地,所述間隔子可由三個、四個、五個、六個或更多堿基對構成。在一個方面,本發(fā)明提供了具有七個堿基對間隔子的融合蛋白質,使得第一鋅指核酸酶的內切核酸酶在與第二鋅指核酸酶接觸時二聚化,其中構成所述鋅指核酸酶的這兩種鋅指蛋白質可結合于靶標DNA序列的上游和下游。在二聚化時,鋅指核酸酶可在靶標核苷酸序列上引入雙鏈斷裂,隨后可發(fā)生非同源末端連接或與具有與雙鏈斷裂兩端包圍的序列有同源性的外源核苷酸發(fā)生同源重組。
在另一個實施方式中,本發(fā)明提供了包含鋅指蛋白質以及增強子蛋白質的融合蛋白質,形成鋅指激活子。鋅指激 活子可用于在植物細胞中上調或激活靶標基因的轉錄,例如但不限于,參與植物細胞中N-糖基化的基因,包括步驟(i)根據(jù)本發(fā)明的方法工程改造結合于啟動子或可操作性連接于靶標基因的編碼序列的序列之內的鋅指蛋白質,(i i )制造所述鋅指蛋白質和轉錄激活子之間的融合蛋白質,(iii)制造包含編碼在植物細胞中有活性的啟動子的控制下的所述鋅指激活子的多核苷酸序列的表達載體,(iv)將所述基因構建物引入植物細胞,以及(V)培養(yǎng)所述植物細胞并使鋅指激活子進行表達,以及(vi)鑒定靶標基因表達增加的植物細胞。用于本發(fā)明的靶標基因為編碼蛋白質的基因或調控本發(fā)明的糖基轉移酶表達的核酸。
在另一個實施方式中,本發(fā)明提供了包含鋅指蛋白質以及基因抑制子的融合蛋白質,形成鋅指抑制子。鋅指抑制子可用于在植物細胞中下調或抑制靶標基因的轉錄,例如但不限于,參與植物細胞中N-糖基化的基因,包括步驟(i)根據(jù)本發(fā)明的方法工程改造結合于啟動子或可操作性連接于靶標基因的編碼序列的序列之內的鋅指蛋白質,和(ii )制造所述鋅指蛋白質和轉錄抑制子之間的融合蛋白質,(iii)開發(fā)包含編碼在植物細胞中有活性的啟動子的控制下的所述鋅指抑制子的多核苷酸序列的基因構建物,和(iv)根據(jù)本發(fā)明的方法將所述基因構建物引入植物細胞,以及(V)使鋅指激活子進行表達,以及(Vi)鑒定靶標基因轉錄降低的植物細胞。鋅指抑制子可用于在植物細胞中降低本發(fā)明的糖基轉移酶的表達水平。
在另一個實施方式中,本發(fā)明提供了包含鋅指蛋白質以及甲基化酶的融合蛋白質,形成鋅指甲基化酶。所述鋅指甲基化酶可用于下調或抑制參與植物細胞中N-糖基化的基因表達,是通過對所述參與N-糖基化的基因啟動子區(qū)域內的區(qū)域進行甲基化,例如但不限于本發(fā)明的糖基轉移酶,包括步驟(i )根據(jù)本發(fā)明的方法工程改造能夠結合于參與N-糖基化的基因啟動子內區(qū)域的鋅指蛋白質,(ii)制造所述鋅指蛋白質和甲基化酶之間的融合蛋白質,以及(iii)根據(jù)本發(fā)明的方法開發(fā)包含編碼在植物細胞中有活性的啟動子的控制下的所述鋅指甲基化酶的多核苷酸序列的基因構建物,(iv)根據(jù)本發(fā)明的方法將所述基因構建物引入植物細胞,以及(V)使鋅指甲基化酶進行表達,以及(vi)鑒定植物細胞中本發(fā)明的糖基轉移酶表達降低或幾乎無表達的植物細胞。
在本發(fā)明的多種實施方式中,可根據(jù)本發(fā)明的方法選擇結合于本發(fā)明的糖基轉移酶的調控序列的鋅指蛋白質。所述糖基轉移酶可為參與植物N-糖基化的糖基轉移酶,例如但不限于,N-乙酰葡萄糖氨基轉移酶、木糖基轉移酶或巖藻糖基轉移酶,或更具體地為, N-乙酰葡萄糖氨基轉移酶1、β-1,2-木糖基轉移酶或α-1,3-巖藻糖基轉移酶。更具體地,參與植物中N-糖基化的基因調控序列可包含轉錄起始位點、起始密碼子、外顯子區(qū)域、 外顯子-內含子邊界、終止子或終止密碼子。該鋅指蛋白質可融合于核酸酶、激活子或抑制子蛋白質。
在本發(fā)明的多種實施方式中,鋅指核酸酶在本發(fā)明的糖基轉移酶的基因組DNA序列的調控區(qū)域、編碼區(qū)或非編碼區(qū)引入雙鏈斷裂,并導致所述糖基轉移酶表達水平的降低、 抑制或基本上抑制,或所述糖基轉移酶活性的降低、抑制或基本上抑制。
根據(jù)本發(fā)明的用于降低、抑制或基本上抑制植物細胞中內源糖基轉移酶的活性的方法可包括選擇修飾的細胞,其具有降低、抑制或基本上抑制的糖基轉移酶活性。
在另一個實施方式中,本發(fā)明包括本發(fā)明的基因序列或其片段用于在所述序列中鑒別靶標位點以修飾植物細胞中糖基轉移酶表達的方法,使得(i)所述糖基轉移酶的活性得到降低、抑制或基本上抑制植物細胞中一種或多種蛋白質的N-聚糖上的 α -1, 3-巖藻糖或β -1, 2-木糖水平得到降低。為鑒別本發(fā)明基因序列上的這種靶標位點, 提供了計算機程序以允許對一段輸入查詢序列篩選出由固定長度間隔子序列分開的兩條固定長度的亞串DNA基序的發(fā)生率,使用了用于選擇鋅指蛋白質結合的兩個靶標位點(其在參考DNA數(shù)據(jù)庫內發(fā)生給定次數(shù),并由限定數(shù)量的核苷酸(本文稱為間隔子序列)分開) 的DNA數(shù)據(jù)庫內部的后綴陣列。所述基因序列可為基因組DNA或cDNA序列,例如但不限于 α -1, 3-巖藻糖基轉移酶、β -1, 2-木糖基轉移酶或N-乙酰葡萄糖氨基轉移酶的基因組DNA 或cDNA序列。具體而言,基因序列為煙草種屬的基因序列,例如但不限于煙草。在本文的一個具體實施方式
中,DNA數(shù)據(jù)庫為煙草DNA數(shù)據(jù)庫。
具體而言,所述計算機程序可用于搜索本發(fā)明的煙草基因序列以尋找兩個鋅指蛋白質結合位點,其中每種鋅指蛋白質包含四個鋅指DNA結合結構域,其所述兩個鋅指蛋白質結合位點由0、1、2或3個堿基對分開。在本發(fā)明的其他實施方式中,所述計算機程序可用于預測兩種鋅指蛋白質的靶標位點用于設計一對鋅指核酸酶。在本發(fā)明的其他實施方式中,所述計算機程序被用于預測大范圍核酸酶的靶標位點。本發(fā)明中還包括的是本發(fā)明的基因序列中存在的靶標位點,如由上文描述的計算機程序預測的那些,以及其用于修飾植物或植物細胞中基因序列的用途,這些是通過本發(fā)明描述的或本領域已知的基因組標記技術進行的。
在本發(fā)明的多種實施方式中,將表達構建物(其包含可操作地連接于在植物細胞中有效的表達控制序列的編碼序列)引入植物細胞以促進異源蛋白質的表達?!翱刹僮鞯剡B接”指的是一種連接,其中控制序列和要表達的DNA序列以能夠允許轉錄以及轉錄物翻譯的方式連接排列在一起。在一個具體的實施方式中,表達構建物被用于產生非天然鋅指蛋白質、鋅指核酸酶、鋅指抑制子、鋅指激活子。在本發(fā)明的其他實施方式中,表達構建物是用來產生有商業(yè)意義的異源蛋白質的,例如哺乳動物或人蛋白質。預期的是被修飾的植物細胞或者在染色體DNA上整合有表達構建物,或在染色體外攜帶有表達構建物。還預期的是,用于產生異源蛋白質的修飾植物細胞或者在染色體DNA穩(wěn)定整合了包含異源蛋白質編碼序列的重組轉錄單元,或者在一段有限的時間內在染色體外攜帶有所述重組轉錄單元。
包含在植物和植物細胞中有活性的調控元件的表達構建物是已知的,其可含有植物病毒啟動子和終止子序列,例如但不限于,花椰菜花葉病毒35S啟動子和終止子序列、質體藍素的啟動子和終止子序列;或泛素的的啟動子和終止子區(qū)域。在本發(fā)明的具體實施方式
中,可克隆第一種鋅指核酸酶的編碼序列使其受到一種啟動子和終止子序列的控制,并克隆第二種鋅指核酸酶使其受到第二種啟動子和終止子序列的調控,這二者都在植物細胞中有活性。兩種鋅指核酸酶的表達構建物還可都受到相同啟動子和終止子序列的控制,且可將這兩種鋅指核酸酶的編碼序列置于一個載體或分開的載體上。
如本文所使用的,“轉化”指的是多核苷酸向生物體中的轉移,例如但不限于,轉移至植物細胞。含有轉化的多核苷酸的宿主生物體被稱為“轉基因”生物體。植物轉化方法的實例包括但不限于,農癌桿菌介導的轉化(De Blaere等人,Meth. Enzymol. 143:277 (1987)) 以及粒子加速的或“基因槍”轉化技術(Klein等人,Nature, London327:70-73 (1987) ;US 4,945,050)。
因此,已知的許多植物細胞轉化操作流程和許多用于將所述外源DNA引入植物細胞的方法允許在外源DNA中包含 的基因進行表達。用于將表達構建物引入植物細胞的載體可為二元載體并可通過根癌農桿菌(Agrobacterium tumefaciens)轉化引入植物細胞。根癌農桿菌轉化系統(tǒng)對本領域技術人員已知。用于感染和轉染植物細胞的根癌農桿菌菌株是已知的??珊线m地用于本發(fā)明目的的根癌農桿菌菌株為GV3101或Agl0、Agll、LBA4404,或任何其他Ach5或C58衍生的根癌農桿菌菌株,其能夠感染植物細胞并將T-DNA轉移至植物細胞核的菌株。
在一個非限制性實例中,農癌桿菌-介導的轉化可如下進行可使用本領域中描述的標準方法將包含用于兩種鋅指核酸酶表達(其成為一對,靶向煙草糖基轉移酶基因組基因序列)的表達盒的植物表達載體,如二元載體引入根癌農桿菌菌株??蓪⒅亟M根癌農桿菌菌株在含有適當抗生素的液體培養(yǎng)基中培養(yǎng)過夜,可通過離心、棄去上清并重懸于新鮮培養(yǎng)基而收集細胞(根據(jù) Murashige&Skoog(1962,PhysiolPlant 15(3) :473-497))??筛鶕?jù)標準方法(見Horsch等人,1985)轉化無菌培養(yǎng)的煙草植物的葉植體,并在含根據(jù) Murashige&Skoog (1962)的培養(yǎng)基的皮氏培養(yǎng)皿中于本領域描述的適當條件下進行兩天的共培育。在兩天的共培育后,可將外植體置于含有適當量卡那霉素的選擇性培養(yǎng)基中進行選擇,其還補充含有抗生素萬古霉素和頭孢噻肟,以及萘乙酸和芐基腺嘌呤激素??蓪⑺龆d體引入根癌農桿菌菌株。備選地,可將所述二元載體弓I入其他根癌農桿菌菌株或由其衍生的適合于植物葉植體(尤其是煙草葉外植體)轉化的菌株。備選地,外植體可為苗、下胚軸或莖組織或任何其他適合轉化的組織。包含表達盒的二元載體的引入是經由根癌農桿菌菌株的轉染而進行的。
備選地,所述的引入可使用粒子轟擊或本領域技術人員已知的任何備選的植物轉化方法進行。例如,使用粒子槍或基因槍粒子輸送系統(tǒng)可將外源DNA加至鎢顆?;蚪痤w粒上,并使用Helios PDS 1000/He基因槍粒子輸送系統(tǒng)將其引入植物細胞。
作為一個非限制性實例,轉染植物細胞后對植物的再生和選擇可在本發(fā)明的范圍內進行,如下可根據(jù)本領域描述的標準方法(見例如,Horsch等人,1985,Science 227:1229)使如本文上述方法轉染后獲得的轉基因植物細胞再生出芽和苗株??衫缤ㄟ^使用 PowerPlant DNA 分離試劑盒(Mo Bio Laboratories Inc.,Carlsbad, CA, USA)從芽和苗株中分離基因組DNA??墒褂盟龌蛐蛄懈鶕?jù)本領域描述的標準方法擴增包含靶標區(qū)域的DNA片段。對于本領域技術人員清楚的是,例如所列出的SEQ ID NO中限定的引物對可用于擴增包含靶標區(qū)域的片段。然后使用標準測序操作流程對PCR產物進行整體測序,并可通過與起始序列比較鑒別祀標位點如鋅指核酸酶祀標位點處或附近的突變或修飾情況。
根據(jù)本發(fā)明的基因組核苷酸序列的修飾可按如下方法鑒定在靶向糖基轉移酶編碼區(qū)用于植物細胞中修飾后,可對由修飾細胞獲得的mRNA而合成的cDNA進行克隆和測序以確認修飾的存在。對于本領域技術人員清楚的是,任何能導致各自序列的開放閱讀框破壞的刪除可對功能性酶的生物合成有不利影響。
本發(fā)明的每種糖基轉移酶的活性可使用酶測定而測量。本發(fā)明的糖基轉移酶的活性可為但不限于, 將N-乙酰葡萄糖胺添加至Man5-GlcNAc2-Asn寡甘露糖基受體的1-3臂的甘露糖上;將巖藻糖實體以α-1,3-連接添加至N-聚糖上,特別是將巖藻糖以α -1,3-連接添加至糖蛋白的N-聚糖非還原性末端的鄰近N-乙酰葡萄糖胺上; 或將木糖實體以β_1,2-連接添加至N-聚糖上,特別是將木糖以β(1,2)_連接添加至N-聚糖的三甘露糖基核心結構的β (1,4)-連接甘露糖上。糖基轉移酶可分離自植物,例如通過從植物細胞中分離富含糖基轉移酶的微體(microsome)。酶活性可使用酶測定法以及特異性底物和供體分子進行測量,例如用UDP-[14C]_木糖作為供體,用 GlcNAc^ -l-2-Man-a 1-3-[Man-a 1-6]Man-β _0_ (CH2) 8_C00H3 或 GlcNAc β-1-2-Man-α1-3-OilcNAc-β1-2-Man- α 1-6) Man-β l_4GlcNAc-^ 1-4 (Fuc-α 1-6) GlcNAc-1gG 糖肽作為受體用于測量β_1,2-木糖基轉移酶活性。
具體而言,微體可在早花期階段分離自成熟的、發(fā)育完全的植物(特別是煙草植物)的新鮮的植物葉子,方法如下移除中脈,將葉子切成小片并在預冷的不銹鋼瓦林混碎機中進行均質化,其中含有微體分離緩沖液,其含有例如250mM山梨醇、5mM Tris、2mM DTT 和7. 5mM EDTA;使用IM的Mes (2-(N-嗎啉代)乙磺酸溶液將pH設置為7. 8。加入蛋白酶抑制劑混合物或混合液,例如Complete Mini (Roche Diagnostics)。使用煙草葉子鮮重的冰冷的微體分離緩沖液。過濾通過尼龍布并使用Sorvall SS34轉頭于4°C下以12,OOOg 離心IOmin以移除碎片和葉材料。將含有微體的上清轉移至新的離心管中并在CentriconT-2070超速離心機中用固定角轉頭Centrikon TFT 55. 38在4 °C下以100,OOOg離心 60min。在不含EDTA的微體分離緩沖液中重懸含有微體的沉淀,其中已經加入了甘油(終濃度為4%)。該方法可用于測量β_1,2-木糖基轉移酶(β (1,2)_木糖基轉移酶)活性。
作為一個非限制性實例,編碼β-1,2_木糖基轉移酶(β (1,2)_木糖基轉移酶) 的基因,活性可按如下方法確定可將cDNA序列克隆于哺乳動物表達載體并電穿孔轉化至正常條件下內源糖蛋白的N-聚糖上不含β-1,2-木糖(β (1,2)_木糖)的哺乳動物細胞中。通過用識別N-聚糖上β-1,2-木糖(β (1,2)_木糖)的抗體如特異性地與結合于蛋白質N-聚糖的木糖殘基交叉反應的兔源抗辣根過氧化物酶抗體(如貨號AS07267,Agrisera AB( VSnilSs,Sweden))對細胞染色觀察到互補現(xiàn)象。備選地,木糖基轉移酶的酶測定可用在合適的缺少木糖基轉移酶活性的宿主系統(tǒng)中表達β_1,2-木糖基轉移酶(β (1,2)_木糖基轉移酶)cDNA時獲得的重組蛋白質進行。木糖基轉移酶測定可在如下反應混合物中進行,包含IOmM的二甲胂酸緩沖液(pH7. 2)、4mM ATP、20mM MnCl2, O. 4%Triton X_100、0.1mM UDP-[14C]-木糖和 ImMGlcNAc β -1-2-Man-α 1-3-[Man-α 1-6]Man-β -O-(CH2) 8_C00H3,使用 GlcNAc β -1-2-Man-α 1-3-(GlcNAc-β1-2-Man-α 1-6) Man-β l-4GlcNAc-^ 1-4 (Fuc-α 1-6) GlcNAc-1gG 糖肽作為受體。
為促進從植物或植物細胞中對本發(fā)明的修飾的糖基轉移酶或目的異源蛋白質的分離,許多本領域已知的技術和純化形式都可使用。作為一個非限制性實例,His標簽、GST 和麥芽糖結合蛋白質為具有易得的親和柱(其可結合于柱上并洗脫下來)的那些肽。因此, 當肽為N-端His標簽如六組氨酸(His. sub. 6tag)時,可使用包含金屬螯合樹脂的基質純化異源蛋白質,基質如鎳氮基三乙酸(N1-NTA)、鎳亞氨基二乙酸(N1-1DA)及含鈷樹脂(鈷樹脂)(見例如,Steinert等人(1997) QIAGEN News 4:11-15)。當肽為GST時,可使用包含谷胱甘肽瓊脂糖微珠(Sigma或Pharmacia Biotech)的基質純化異源蛋白質;其中蛋白質片段為麥芽糖結合蛋白質(MBP),可使用包含以直鏈淀粉衍生化的瓊脂糖樹脂的基質純化修飾的糖基轉移酶或異源蛋白質。
其他可結合于本發(fā)明的修飾的糖基轉移酶或目的異源蛋白質的分子的非限制性實例可選自適體(Klussmann(2006),The Aptamer Handbook:Functional Oligonucleotides and their applications, ffiley-VCH, USA)> 抗體((Howard and Bethell (2000)Basic Methods in Antibody Production and Characterization, Crc. Pr.1nc)> (Hansson, Immunotechnology 4 (1999),237-252;Henning, Hum Gene Ther. 13(2000),1427-1439))、親和體、凝集素、三聯(lián)素(Phylos Inc. , Lexington, Massachu setts, USA;Xu, Chem. Biol. 9 (2002),933)、anticalin (EPB11017814)等等。
在本發(fā)明的多種實施方式中,本發(fā)明提供了修飾的植物、修飾的植物組織、來自修飾植物的植物材料、修飾的植物細胞或者來自修飾植物的修飾的植物組織或植物組合物, 其包含的在N-聚糖上的異源蛋白質具有降低水平或不可檢測水平的α -1, 3-連接巖藻糖、 β-1-2-連接的木糖,或二者。在其他實施方式中,本發(fā)明提供了修飾的植物、修飾的植物組織、來自修飾植物的植物材料、修飾的植物細胞或者來自修飾植物的修飾的植物組織或植物組合物,其顯示了降低的糖基轉移酶活性或基本上沒有此活性。本發(fā)明的修飾植物可包含修飾的細胞和未修飾的細胞。并不需要本發(fā)明的修飾的植物中每個細胞都包含修飾。
可通過本領域已知技術富集、分離或純化所述異源蛋白質。因此,本發(fā)明提供了富集有異源蛋白質的植物組合物,或相對于所述異源蛋白質在所述植物或植物細胞中發(fā)生的濃度包含較高濃度的異源蛋白質的植物組合物。還提供了藥用或化妝品組合物,其包含獲自包含在連接于異源蛋白質的N-聚糖上降低或不可檢測的水平的α -1, 3-連接巖藻糖和 /或β -1,2-連接的木糖的植物細胞特別是煙草屬細胞的異源蛋白質,以及載體,如藥用可接受載體。
可表達于修飾的植物細胞的異源蛋白質可為用于疫苗的抗原,包括但不限于病原體蛋白質、病毒蛋白質、細菌蛋白質、原蟲蛋白質、線蟲蛋白質;酶類,包括但不限于用于治療人類疾病的酶、用于工業(yè)用途的酶;細胞因子;細胞因子受體片段;血液蛋白質;激素;激素受體片段、脂蛋白;抗體或抗體片段。
術語“抗體”和“多個抗體”指的是單克隆抗體、多特異性抗體、人抗體、人源化抗體、駱騎化抗體、嵌合抗體、單鏈Fvs (scFv)、單鏈抗體、單結構域抗體、Fab片段、F(ab’ )片段、二硫鍵連接Fvs (SdFv)以及上述任何類型的表位結合片段。具體而言,抗體包括免疫球蛋白分子和免疫球蛋白分子的免疫學活性片段,即,含有抗原結合位點的分子。免疫球蛋白分子可為任何類型(例如IgG、IgE、IgM、IgD、IgA和IgY)、類別(例如IgGU IgG2、IgG3、 IgG4、IgAl 和 IgA2)或亞類。
在本發(fā)明的特異性實施方式中,本發(fā)明提供了產生異源蛋白質的方法,其包含的 N-聚糖含有降低或不可檢測水平的α-1,3_巖藻糖或β-1,2_木糖或二者。所述方法包括在本發(fā)明的修飾的植物細胞中表達包含異源蛋白質的編碼序列的多核苷酸以產生異源蛋白質。該方法可包含步驟(i)將包含異源蛋白質編碼序列的多核苷酸引入本發(fā)明的修飾的植物細胞;(ii)使所述多核苷酸進行表達以在修飾的植物細胞中產生異源蛋白質,可選地還包括(iii)將異源蛋白質從所述修飾的植物細胞中分離。該方法可進一步包括對包含含有異源蛋白質編碼序列的多核苷酸的修飾的植物細胞進行培養(yǎng)。該方法可選地包括以下步驟,將包含含有異源蛋白質編碼序列的多核苷酸的修飾的植物細胞培育成植物組織、植物器官或植物,并培養(yǎng)或種植所述植物組織、植物器官或植物。該植物細胞可為在無菌條件下生長于水溶液培養(yǎng)基的細胞培養(yǎng)物中的細胞,或單子葉植物細胞,例如但不限于高粱、玉米、小麥、大米、小米 、大麥或浮萍,或雙子葉植物如向日葵、豌豆、油菜、甜菜、大豆、生菜、萵苣、卷心菜、甘藍、花椰菜、苜蓿、胡蘿卜和煙草。根據(jù)本發(fā)明的煙草細胞可為煙草屬植物細胞,尤其是選自本氏煙草或煙草、煙草變種、育種品系和栽培種的植物細胞或本氏煙草和煙草煙草變種、育種品系和栽培種的細胞的修飾的細胞。
在另一個實施方式中,本發(fā)明提供了煙草變種、育種品系或栽培種的遺傳修飾的細胞??赏ㄟ^本發(fā)明的方法修飾的煙草變種、育種品系或栽培種的非限制性實例包括登記號為 PM016、PM021、PM92、PM102、PM132、PM204、PM205、PM215、PM216 或 PM217 的煙草 (其保藏于 NCIMB, Aberdeen、Scotland)或 DAC Mata Fina, P02、BY-64、AS44、RG17、RG8、 HB04P、Basma Xanthi BX 2A、Coker 319、Hicks、McNair 944(MN 944)、Burley 21、K149、Yaka JB125/3,Kasturi Mawar.NC 297,Coker 371Gold、P02、\¥isli a、 Simmaba、Turkish Samsun、AA37_l、B13P、BU21x Hoja Parado 系 97 雜交的 F4、Samsun NN、Izmir、Xanthi NN、 Karabalgarλ Denizli 和 POl0
本發(fā)明的藥用組合物優(yōu)選地包含藥用可接受載體。通過“藥用可接受載體”,指的是非毒性的固體、半固體或液體填充劑、稀釋劑、膠囊材料或任何類型的制劑輔料。如本文所使用的,術語“腸道外的”指的是施用的方式,其包括靜脈內、肌內、腹膜內、胸骨內、皮下和關節(jié)內注射和灌注。載體可為腸道外載體,更具體地為與受用者血液等滲的溶液。這種載體媒介物的實例包括水、生理鹽水、林格氏溶液和葡萄糖溶液。非水溶液的媒介物如固定油和油酸乙酯,以及脂質體也在本文使用。所述載體合適地含有少量的添加劑如增強等離子性和化學穩(wěn)定性的物質。這些材料在所采用的劑量和濃度下對受用者無毒,包括緩沖液如磷酸、檸檬酸、月桂酸、乙酸和其他有機酸或其鹽類;抗氧化劑如抗壞血酸;低分子量(低于大約10個殘基)的(多)肽、例如多聚精氨酸或三肽;蛋白質如血清白蛋白、明膠、或免疫球蛋白;親水多聚物如聚乙烯基吡咯烷酮;氨基酸、如甘氨酸、谷氨酸、天冬氨酸、或精氨酸; 單糖、二糖、以及其他碳水化合物(包括纖維素或其衍生物)、葡萄糖、甘露糖、或糊精;螯合劑如EDTA ;糖醇如甘露糖醇或山梨糖醇;平衡離子如鈉;和/或非離子表面活性劑、如聚山梨酯、泊洛沙姆或PEG。
在本發(fā)明的優(yōu)選的實施方式中,提供了用于降低植物細胞的糖基轉移酶活性的方法,包括修飾植物細胞基因組中的基因組核苷酸序列,其中基因組核苷酸序列包括以下的編碼序列N-乙酰葡萄糖氨基轉移酶,特別是N-乙?;咸烟前被D移酶I ;巖藻糖基轉移酶,特別是α -1, 3-巖藻糖基轉移酶;或木糖基轉移酶,特別是β -1, 2-木糖基轉移酶; 或前述蛋白質的片段。在一個具體的實施方式中,本發(fā)明提供了降低植物細胞中糖基轉移酶活性的方法,包括修飾植物細胞基因組中的基因組核苷酸序列,其中基因組核苷酸序列包含(i)核苷酸序列,其由如 SEQ ID N0:l、4、5、7、12、13、14、17、27、32、37、40、41 或 47 所示的核苷酸序列組成;(ii)核苷酸序列,其與SEQ ID N0:l、4、5、7、12、13、14、17、27、32、37、 40,41或47中所示的核苷酸序列有至少95%、特別是至少98%、特 別是至少99%的同一性; (iii)核苷酸序列,其允許有(i)或(ii)中的核苷酸序列或其互補物組成的多核苷酸探針 (具體而言在嚴格條件下)進行雜交。本發(fā)明的方法進一步包括鑒別及可選地,選擇修飾的植物細胞,其中修飾的植物細胞中的糖基轉移酶(其基因組核苷酸序列已經得到修飾)的活性或修飾的植物細胞中總糖基轉移酶活性相對于未修飾植物細胞是降低的。這種用于降低植物細胞的糖基轉移酶活性的方法可應用于向日葵、豌豆、油菜、甜菜、大豆、生菜、萵苣、卷心菜、西蘭花、花椰菜、苜蓿、浮萍、水稻、玉米、紅蘿卜、或煙草的細胞。具體而言,其中的糖基轉移酶活性有降低的植物細胞為煙草種屬的細胞,特別是本氏煙草或煙草,或其栽培種。
本發(fā)明的以下實施方式為非限制性的,其包括在本文內是為了闡明本發(fā)明的各個方面。在具體實施方式
中,本發(fā)明進一步提供的方法還包括步驟(a)在植物細胞的基因組中鑒別包含糖基轉移酶的編碼序列的基因組核苷酸序列或其片段;具體而言,所述基因組核苷酸序列可通過使用至少一對選自以下的寡核苷酸進行聚合酶鏈式反應而鑒別正向引物SEQ ID N0:2及反向引物SEQ ID N0:3;正向引物SEQ ID NO: 10及反向引物SEQ ID NO: 11 ;正向引物SEQ ID NO: 15及反向引物SEQ ID NO: 16 ;正向引物SEQ ID N0:23及反向引物SEQ ID N0:24 ;正向引物SEQ ID NO:25及反向引物SEQ ID NO:26 ;正向引物SEQ ID N0:30及反向引物SEQ ID NO:31;正向引物SEQ ID NO:35及反向引物SEQ ID N0:36;正向引物SEQ ID N0:45及反向引物SEQ ID N0:46 ;或正向引物SEQ ID NO: 231及反向引物SEQ ID NO:232 ;以及(b)在所述基因組核苷酸序列中鑒別靶標位點,用于進行修飾使得在所述植物細胞中糖基轉移酶的活性或表達相對未修飾植物細胞得到降低。
在另一個實施方式中,本發(fā)明提供了分離的多核苷酸,其包含的核苷酸序列由如SEQ ID N0:l、4、5、7、12、13、14、17、27、32、37、40、41 或 47 所示的核苷酸序列構成;提供了核苷酸序列,其與 SEQ ID N0:l、4、5、7、12、13、14、17、27、32、37、40、41 或 47 所示的核苷酸序列有至少95%、特別是至少98%,特別是至少99%的同一性;或提供了核苷酸序列,其允許由(i)或(ii)的核苷酸序列或其互補物組成的多核苷酸探針(具體而言在嚴格條件下)與所述分離的多核苷酸進行雜交。還提供了本發(fā)明的基因組核苷酸序列的用途,用于鑒別基因組核苷酸序列中的靶標位點進行修飾,使得(i)包含該修飾的修飾的植物細胞中的糖基轉移酶的活性或表達相對未修飾植物細胞是降低的,或(ii)包含該修飾的修飾的植物細胞中蛋白質的N-聚糖上的α-1,3-巖藻糖或β-1,2-木糖或二者相對于未修飾植物細胞是降低的。本發(fā)明還提供了用于降低植物細胞中糖基轉移酶的活性的方法,包括,鑒別基因組核苷酸序列中的靶標位點進行修飾,使得(i)包含該修飾的修飾的植物細胞中的糖基轉移酶的活性或表達相對未修飾植物細胞是降低的,或(ii)包含該修飾的修飾的植物細胞中蛋白質的N-聚糖上的α-1,3-巖藻糖或β-1,2-木糖或二者相對于未修飾植物細胞是降低的。
本發(fā)明還提供了用于修飾植物細胞的方法,其中植物細胞的基因組是通過鋅指核酸酶介導的誘變而修飾,包括(a)鑒別并制造至少兩種非天然鋅指蛋白質,其選擇性結合于不同靶標位點用于在基因組核苷酸序列中進行修飾;(b)在植物細胞中表達至少兩種融合蛋白質,其各自包含核酸酶以及所述至少兩種非天然鋅指蛋白質中的一種,這樣可在植物基因組核苷酸序列中引入雙鏈斷裂,特別是在基因組核苷酸序列的靶標位點處或附近發(fā)生斷裂;以及可選地(C)將包含含有與雙鏈斷裂上游序列的第一同源區(qū)域以及與雙鏈斷裂下游序列的第二有同源區(qū)域的核苷酸序列的多核苷酸引入植物細胞,使得所述多核苷酸與基因組中DNA發(fā)生重組。本發(fā)明還包括的是植物細胞,其包含一種或多種包含了編碼一種或多種所述融合蛋白質的表達構建物。
本發(fā)明還提供了修飾的植物細胞或包含所述修飾的植物細胞的植物,其中的修飾的植物細胞在編碼糖基轉移酶或其片段的基因組核苷酸序列中包含至少一種修飾,特別是 SEQ ID N0:l、4、5、7、12、13、14、17、27、32、37、40、41、47、233 或 SEQ ID NO:256、259、262、 265、268、271、274、277、280 或 SEQ ID NO:257、260、263、266、269、272、275、278、281 中所示的任何基因組核苷酸序列、或在上述序列的任何組合中,且其中(i)所述修飾的植物細胞的總的糖基轉移酶活性或其基因組核苷酸序列已經得到修飾的糖基轉移酶的活性或表達相對于未修飾植物細胞是降低的,或(ii)所述修飾的植物細胞中產生的蛋白質的N-聚糖上的α-1,3-巖藻糖或β-1,2-木糖或二者相對于未修飾植物細胞是降低的。
本發(fā)明還提供了用于產生異源蛋白質的方法,所述方法包括將包含編碼異源蛋白質的核苷酸序列的表達構建物引入修飾的植物細胞,所述異源蛋白質特別是疫苗抗原、細胞因子、激素、凝血蛋白質、免疫球蛋白或其片段,所述植物細胞在如SEQ ID N0:l、4、5、7、 12、13、14、17、27、32、37、40、41 或 47、233 或在 SEQ ID NO: 18、20、21、22、28、33、38、48、212、 213、219、220、223、225、227、229、234;或在SEQ ID NO:256、259、262、265、268、271、274、277 和280、或在SEQ ID Ν0:257、260、263、266、269、272、275、278、281 所示的基因組核苷酸序列中或在上述序列的任何組合中包含修飾;以及培養(yǎng)包含表達構建物的修飾的植物細胞以產生異源蛋白質,并且可選地,從植物細胞再生植物,并種植該植物及其后代。本發(fā)明還提供了用于產生異源蛋白質的方法,所述方法包括在能產生所述異源蛋白質的條件下培養(yǎng)修飾的植物細胞,其包含(i)SEQ ID N0:l、4、5、7、12、13、14、17、27、32、37、40、41 或 47、233 或在 SEQ IDN0:18、20、21、22、28、33、38、48、212、213、219、220、223、225、227、229、234;或 SEQ ID N0:256、259、262、265、268、271、274、277 和 280、或 SEQ ID NO:257、260、263、266、269、272、 275、278、281中所示的基因組核苷酸序列中至少一個中的修飾;(ii)包含編碼異源蛋白質的核苷酸序列的表達構建物,所述異源蛋白質特別是疫苗抗原、細胞因子、激素、凝血蛋白質、免疫球蛋白或其片段。本發(fā)明的方法還包括從修飾的植物細胞或包含修飾的植物細胞的修飾的植物中富集或分離所述異源蛋白質的步驟。本發(fā)明還包括的是包含異源蛋白質的植物組合物,所述異源蛋白質可獲自包含修飾的植物細胞(其在如SEQ ID N0:l、4、5、7、 12、13、14、17、27、32、37、40、41 或 47、233 或在 SEQ ID NO: 18、20、21、22、28、33、38、48、212、 213、219、220、223、225、227、229、234;或在SEQ ID NO:256、259、262、265、268、271、274、277 和 280 中、或在 SEQ ID N0:257、260、263、266、269、272、275、278、281 中所示的基因組核苷酸序列或在上述序列的任何組合中包含修飾)的植物,其中所述異源蛋白質相對于未修飾的植物細胞中所產生的異源蛋白質其的N-聚糖上的α-1,3-巖藻糖或β-1,2-木糖或二者是降低的。
在詳述和實施例中,提到了以下序列,其列于序列列表中
SEQ ID NO:1:疊連群 gDNA_cl736055 核苷酸序列
SEQ ID NO: 2:NGSG10043正向引物的核苷酸序列,適合用于擴增疊連群gDNA_ C1736055的片段,含有煙草屬β-1,2-木糖基轉移酶(β (1,2)-木糖基轉移酶)內含子-外顯子序列。
SEQ ID NO: 3:NGSG10043反向引物的核苷酸序列,適合用于擴增疊連群gDNA_ C1736055的片段, 含有煙草屬β-1,2-木糖基轉移酶(β (1,2)-木糖基轉移酶)內含子-外顯子序列。
SEQ ID N0:4:NtPMI_BAC_TAK0MI_6的核苷酸序列(含有煙草β_1,2_木糖基轉移酶(β (1,2)_木糖基轉移酶)基因變體I)的1-6,000堿基對。
SEQ ID N0:5:NtPM1-BAC-TAK0MI_6 的 β_1,2_木糖基轉移酶(β (1,2)-木糖基轉移酶)變體I的編碼片段的基因組核苷酸序列
SEQ ID Ν0:6: β-1,2-木糖基轉移酶(β (1,2)-木糖基轉移酶)基因變體I上游的NtPM1-BAC-TAK0MI_6的啟動子區(qū)域核苷酸序列
SEQ ID N0:7:NtPM1-BAC_TAK0MI_6 片段的核苷酸序列,其為由引物組 NGSG10043 所擴增并用于鑒別NtPM1-BAC-TAK0MI_6
SEQ ID NO: 8:煙草β-1,2-木糖基轉移酶(β (1,2)_木糖基轉移酶)基因變體I 的cDNA序列ο
SEQ ID N0:9:煙草β-1,2_木糖基轉移酶(β (1,2)_木糖基轉移酶)蛋白質變體 I的氨基酸序列
SEQ ID Ν0:10:擴增煙草和本氏煙草的片段GnT1-B的引物序列Big3FN
SEQ ID N0:11:擴增煙草和本氏煙草的片段GnT1-B的引物序列Big3RN
SEQ ID NO: 12:煙草片段GnT1-B的3504bp的基因組片段的核苷酸序列
SEQ ID NO: 13:煙草片段GnT1-B的2283bp的基因組片段的核苷酸序列
SEQ ID NO: 14:本氏煙草片段GnT1-B的3765bp的基因組片段的核苷酸序列
SEQ ID NO: 15:NGSG10046正向引物的核苷酸序列,適合用于擴增疊連群CH0_ 0F4335xnl3fl的片段,含有煙草屬β_1,2_木糖基轉移酶(β (1,2)-木糖基轉移酶)內含子-外顯子序列。
SEQ ID NO: 16:NGSG10046反向引物的核苷酸序列,適合用于擴增疊連群CH0_ 0F4335xnl3fl的片段,含有煙草屬β_1,2_木糖基轉移酶(β (1,2)-木糖基轉移酶)內含子-外顯子序列。
SEQ ID NO: 17:NtPMI_BAC_SANIKI_l (含有煙草 β _1,2_ 木糖基轉移酶 (β (I, 2)-木糖基轉移酶)基因變體2)的核苷酸序列的15,921-23,200堿基對。
SEQ ID NO: 18:煙草β_1,2_木糖基轉移酶(β (1,2)-木糖基轉移酶)基因變體 2的cDNA序列
SEQ ID NO: 19:煙草β _1,2_木糖基轉移酶(β (1,2)_木糖基轉移酶)蛋白質變體2的氨基酸序列。
SEQIDNO:20:煙草片段GnT1-B的部分cDNA序列變體I
SEQIDN0:21:煙草片段GnT1-B的部分cDNA序列變體I
SEQIDNO:22:本氏煙草片段GnT1-B的部分cDNA序列變體I
SEQIDNO:23:擴增煙草和本氏煙草的片段GnT1-A的引物序列BiglFN。
SEQIDN0:24:擴增煙草和本氏煙草的片段GnT1-A的引物序列BigIRN。
SEQIDNO: 25:NGSG10041正向引物的核苷酸序列,適合用于擴增疊連群CHO0F3295xjl7fl的片段,含有煙草屬α-1,3_巖藻糖基轉移酶(α (1,3)-巖藻糖基轉移酶內含子-外顯子序列。
SEQ ID NO: 26:NGSG10041反向引物的核苷酸序列,適合用于擴增疊連群CH0_ 0F3295xjl7fl的片段,含有 煙草屬α-1,3_巖藻糖基轉移酶(α (1,3)-巖藻糖基轉移酶內含子-外顯子序列。
SEQ ID NO: 27: NtPM1-BAC-FETILA_9 (含有煙草 α -1,3_ 巖藻糖基轉移酶 (a (I, 3)-巖藻糖基轉移酶)基因變體I)的核苷酸序列的2,961-10,160堿基對。
SEQ ID NO: 28:煙草α-1,3_巖藻糖基轉移酶(α (1,3)-巖藻糖基轉移酶)基因變體I的cDNA序列。
SEQ ID NO: 29:煙草α-1,3_巖藻糖基轉移酶(α (1,3)-巖藻糖基轉移酶)蛋白質變體I的氨基酸序列。
SEQ ID NO: 30:NGSG10032正向引物的核苷酸序列,適合用于擴增疊連群gDNA_ c 1765694的片段,含有煙草屬α -1,3_巖藻糖基轉移酶(α (I, 3)-巖藻糖基轉移酶內含子-外顯子序列。
SEQ ID NO: 31 :NGSG10032反向引物的核苷酸序列,適合用于擴增疊連群 gDNA_1765694的片段,含有煙草屬α-1,3_巖藻糖基轉移酶(α (1,3)-巖藻糖基轉移酶內含子-外顯子序列。
SEQ ID NO: 32: NtPM1-BAC-JUMAKE_4 (含有煙草 α -1,3_ 巖藻糖基轉移酶 (α (I, 3)-巖藻糖基轉移酶)基因變體2)的核苷酸序列的1,041-7,738堿基對。
SEQ ID NO: 33:煙草α-1,3_巖藻糖基轉移酶(α (1,3)-巖藻糖基轉移酶)基因變體2的部分cDNA序列。
SEQ ID NO: 34:煙草α-1,3_巖藻糖基轉移酶(α (1,3)-巖藻糖基轉移酶)基因變體2的部分氨基酸序列。
SEQ ID NO: 35:NGSG10034正向引物的核苷酸序列,適合用于擴增疊連群CH0_ 0F4881xd22rl的片段,含有煙草屬α-1,3_巖藻糖基轉移酶(α (1,3)-巖藻糖基轉移酶內含子-外顯子序列。
SEQ ID NO: 36:NGSG10034反向引物的核苷酸序列,適合用于擴增疊連群CH0_ 0F4881xd22rl的片段,含有煙草屬α-1,3_巖藻糖基轉移酶(α (1,3)-巖藻糖基轉移酶內含子-外顯子序列。
SEQ ID NO: 37:NtPM1-BAC-JEJ0L0_22 (包含部分煙草 α-1,3_ 巖藻糖基轉移酶 (a (I, 3)-巖藻糖基轉移酶)基因變體3)的核苷酸序列的19,001-23, 871堿基對。
SEQ ID NO: 38:煙草α-1,3_巖藻糖基轉移酶(α (1,3)-巖藻糖基轉移酶)基因變體3的部分cDNA序列。
SEQ ID NO: 39:煙草α-1,3_巖藻糖基轉移酶(α (1,3)-巖藻糖基轉移酶)蛋白質變體3的部分氨基酸序列。
SEQ ID NO:40:煙草片段GnT1-A的3152bp的基因組片段的核苷酸序列。
SEQ ID NO:41:煙草片段GnT1-A的3140bp的基因組片段的核苷酸序列。
SEQ ID N0:42:用于大范圍核酸酶介導的誘變的、SEQ ID N0:5的外顯子2中獨特的22bp的靶向序列
SEQ ID NO:43:代表SEQ ID NO:42左半部分的回文形式的第一衍生靶標。
SEQ ID N0:44:代表SEQ ID NO:42右半部分的回文形式的第二衍生靶標。
SEQ ID NO:45:NGSG10035正向引物的核苷酸序列,適合用于擴增疊連群CH0_ 0F4486xellfl的片段,含有煙草屬α-1,3_巖藻糖基轉移酶(α (1,3)-巖藻糖基轉移酶內含子-外顯子序列。
SEQ ID NO:46:NGSG10035反向引物的核苷酸序列,適合用于擴增疊連群CH0_ 0F4486xellfl的片段,含有煙草屬α-1,3_巖藻糖基轉移酶(α (1,3)-巖藻糖基轉移酶內含子-外顯子序列。
SEQ ID NO: 47: NtPM1-BAC-JUD0SU_1 (含有煙草 α -1,3_ 巖藻糖基轉移酶 (a (I, 3)-巖藻糖基轉移酶)基因變體4)的核苷酸序列的1-11,000堿基對。
SEQ ID NO: 48:煙草α-1,3_巖藻糖基轉移酶(α (1,3)-巖藻糖基轉移酶)基因變體4的部分cDNA序列。
SEQ ID NO: 49:煙草α-1,3_巖藻糖基轉移酶(α (1,3)-巖藻糖基轉移酶)蛋白質變體4的部分氨基酸序列。
SEQ ID NO:50:實施例1中在煙草基因組數(shù)據(jù)庫中有4次命中的SEQ ID NO:5的 15堿基對輸出核苷酸序列。
SEQ ID NO:51:實施例1中在煙草基因組數(shù)據(jù)庫中有5次命中的SEQ ID NO:5的 15堿基對輸出核苷酸序列。
SEQ ID NO:52:實施例1中在煙草基因組數(shù)據(jù)庫中有5次命中的SEQ ID NO:5的 15堿基對輸出核苷酸序列。
SEQ ID NO:53:實施例1中在煙草基因組數(shù)據(jù)庫中有5次命中的SEQ ID NO:5的15堿基對輸出核苷酸序列。
SEQ ID NO:54:實施侈 15堿基對輸出核苷酸序列。
SEQ ID NO:55:實施侈 15堿基對輸出核苷酸序列。
SEQ ID NO:56:實施侈 15堿基對輸出核苷酸序列。
SEQ ID NO:57:實施侈 15堿基對輸出核苷酸序列。
SEQ ID NO:58:實施侈 15堿基對輸出核苷酸序列。
SEQ ID NO:59:實施侈 15堿基對輸出核苷酸序列。
SEQ ID NO:60:實施侈 15堿基對輸出核苷酸序列。
SEQ ID NO:61:實施侈 15堿基對輸出核苷酸序列。
SEQ ID NO:62:實施侈 15堿基對輸出核苷酸序列。
SEQ ID NO:63:實施侈列以及煙草基因組序列拼接。
SEQ ID NO:64:實施侈列以及煙草基因組序列拼接。
SEQ ID NO:65:實施侈列以及煙草基因組序列拼接。
SEQ ID NO:66:實施侈列以及煙草基因組序列拼接。
SEQ ID NO:67:實施侈列以及煙草基因組序列拼接。
SEQ ID NO:68:實施侈列以及煙草基因組序列拼接。
SEQ ID NO:69:實施侈列以及煙草基因組序列拼接。
SEQ ID NO:70:實施侈列以及煙草基因組序列拼接。
SEQ ID NO:71:實施侈列以及煙草基因組序列拼接。
SEQ ID NO:72:實施侈列以及煙草基因組序列拼接。I中在煙草基因組數(shù)據(jù)庫中有5次命中的SEQ ID NO:5的I中在煙草基因組數(shù)據(jù)庫中有5次命中的SEQ ID NO:5的I中在煙草基因組數(shù)據(jù)庫中有4次命中的SEQ ID NO:5的I中在煙草基因組數(shù)據(jù)庫中有3次命中的SEQ ID NO:5的I中在煙草基因組數(shù)據(jù)庫中有4次命中的SEQ ID NO:5的I中在煙草基因組數(shù)據(jù)庫中有3次命中的SEQ ID NO:5的I中在煙草基因組數(shù)據(jù)庫中有4次命中的SEQ ID NO:5的I中在煙草基因組數(shù)據(jù)庫中有4次命中的SEQ ID NO:5的I中在煙草基因組數(shù)據(jù)庫中有5次命中的SEQ ID NO:5的I中用SEQ ID NO: 5的O次命中的閾值運行的24堿基對序I中用SEQ ID NO: 5的O次命中的閾值運行的24堿基對序I中用SEQ ID NO: 5的O次命中的閾值運行的24堿基對序I中用SEQ ID NO: 5的O次命中的閾值運行的24堿基對序I中用SEQ ID NO: 5的O次命中的閾值運行的24堿基對序I中用SEQ ID NO: 5的O次命中的閾值運行的24堿基對序I中用SEQ ID NO: 5的O次命中的閾值運行的24堿基對序I中用SEQ ID NO: 5的O次命中的閾值運行的24堿基對序I中用SEQ ID NO: 5的O次命中的閾值運行的24堿基對序I中用SEQ ID NO: 5的O次命中的閾值運行的24堿基對序
SEQ ID NO:73:實施例1 中用 SEQ 列以及煙草基因組序列拼接。
SEQ ID NO:74:實施例1 中用 SEQ 列以及煙草基因組序列拼接。
SEQ ID NO:75:實施例1 中用 SEQ 列以及煙草基因組序列拼接。
SEQ ID NO:76:實施例1 中用 SEQ 列以及煙草基因組序列拼接。
SEQ ID NO:77:實施例1 中用 SEQ 列以及煙草基因組序列拼接。
SEQ ID NO:78:實施例1 中用 SEQ 列以及煙草基因組序列拼接。
SEQ ID NO:79:實施例1 中用 SEQ 列以及煙草基因組序列拼接。
SEQ ID NO:80:實施例1 中用 SEQ 列以及煙草基因組序列拼接。
SEQ ID NO:81:實施例1 中用 SEQ 列以及煙草基因組序列拼接。
SEQ ID NO:82:實施例1 中用 SEQ 列以及煙草基因組序列拼接。
SEQ ID NO:83:實施例1 中用 SEQ 列以及煙草基因組序列拼接。
SEQ ID NO:84:實施例1 中用 SEQ 列以及煙草基因組序列拼接。
SEQ ID NO:85:實施例1 中用 SEQ 列以及煙草基因組序列拼接。
SEQ ID NO:86:實施例1 中用 SEQ 列以及煙草基因組序列拼接。
SEQ ID NO:87:實施例1 中用 SEQ 列以及煙草基因組序列拼接。
SEQ ID NO:88:實施例1 中用 SEQ 列以及煙草基因組序列拼接。
SEQ ID NO:89:實施例1 中用 SEQ 列以及煙草基因組序列拼接。
SEQ ID NO:90:實施例1 中用 SEQ 列以及煙草基因組序列拼接。
SEQ ID NO:91:實施例1 中用 SEQ 列以及煙草基因組序列拼接。
SEQ ID NO:92:實施例1 中用 SEQD NO: 5的O次命中的閾值運行的24堿基對序 D NO: 5的O次命中的閾值運行的24堿基對序 D NO: 5的O次命中的閾值運行的24堿基對序 D NO: 5的O次命中的閾值運行的24堿基對序 D NO: 5的O次命中的閾值運行的24堿基對序 D NO: 5的O次命中的閾值運行的24堿基對序 D NO: 5的O次命中的閾值運行的24堿基對序 D NO: 5的O次命中的閾值運行的24堿基對序 D NO: 5的O次命中的閾值運行的24堿基對序 D NO: 5的O次命中的閾值運行的24堿基對序 D NO: 5的O次命中的閾值運行的24堿基對序 D NO: 5的O次命中的閾值運行的24堿基對序 D NO: 5的O次命中的閾值運行的24堿基對序 D NO: 5的O次命中的閾值運行的24堿基對序 D NO: 5的O次命中的閾值運行的24堿基對序 D NO: 5的O次命中的閾值運行的24堿基對序 D NO: 5的O次命中的閾值運行的24堿基對序 D NO: 5的O次命中的閾值運行的24堿基對序 D NO: 5的O次命中的閾值運行的24堿基對序 D NO: 5的O次命中的閾值運行的24堿基對序列以及煙草基因組序列拼接。
SEQ ID NO:93:實施例1 中用 SEQ 列以及煙草基因組序列拼接。
SEQ ID NO:94:實施例1 中用 SEQ 列以及煙草基因組序列拼接。
SEQ ID NO:95:實施例1 中用 SEQ 列以及煙草基因組序列拼接。
SEQ ID NO:96:實施例1 中用 SEQ 列以及煙草基因組序列拼接。
SEQ ID NO:97:實施例1 中用 SEQ 列以及煙草基因組序列拼接。
SEQ ID NO:98:實施例1 中用 SEQ 列以及煙草基因組序列拼接。
SEQ ID NO:99:實施例列以及煙草基因組序列拼接。
SEQ ID NO: 100:實施例序列以及煙草基因組序列拼接。
SEQ ID NO: 101:實施例序列以及煙草基因組序列拼接。
SEQ ID NO: 102:實施例序列以及煙草基因組序列拼接。
SEQ ID NO: 103:實施例序列以及煙草基因組序列拼接。
SEQ ID NO: 104:實施例序列以及煙草基因組序列拼接。
SEQ ID NO: 105:實施例序列以及煙草基因組序列拼接。
SEQ ID NO: 106:實施例序列以及煙草基因組序列拼接。
SEQ ID NO: 107:實施例序列以及煙草基因組序列拼接。
SEQ ID NO: 108:實施例序列以及煙草基因組序列拼接。
SEQ ID NO: 109:實施例序列以及煙草基因組序列拼接。
SEQ ID NO: 110:實施例序列以及煙草基因組序列拼接。
SEQ ID NO: 111:實施例序列以及煙草基因組序列拼接。ID NO: 5的O次命中的閾值運行的24堿基對序的O次命中的閾值運行的24堿基對序的O次命中的閾值運行的24堿基對序的O次命中的閾值運行的24堿基對序的O次命中的閾值運行的24堿基對序的O次命中的閾值運行的24堿基對序的O次命中的閾值運行的24堿基對序的O次命中的閾值運行的24堿基對次命中的閾值運行的24堿基對次命中的閾值運行的24堿基對次命中的閾值運行的24堿基對次命中的閾值運行的24堿基對次命中的閾值運行的24堿基對次命中的閾值運行的24堿基對次命中的閾值運行的24堿基對次命中的閾值運行的24堿基對次命中的閾值運行的24堿基對次命中的閾值運行的24堿基對次命中的閾值運行的24堿基對ID NO:5ID NO:5ID NO:5ID NO:5ID NO:5I 中用 SEQ ID NO:5I 中用 SEQ ID NO:5I 中用 SEQ ID NO:5 的 OI 中用 SEQ ID NO:5 的 OI 中用 SEQ ID NO:5 的 OI 中用 SEQ ID NO:5 的 OI 中用 SEQ ID NO:5 的 OI 中用 SEQ ID NO:5 的 OI 中用 SEQ ID NO:5 的 OI 中用 SEQ ID NO:5 的 OI 中用 SEQ ID NO:5 的 OI 中用 SEQ ID NO:5 的 OI 中用 SEQ ID NO:5 的 O
SEQ ID NO: 112:實施例1 中用 SEQ 序列以及煙草基因組序列拼接。
SEQ ID NO: 113:實施例1 中用 SEQ 序列以及煙草基因組序列拼接。
SEQ ID NO: 114:實施例1 中用 SEQ 序列以及煙草基因組序列拼接。
SEQ ID NO: 115:實施例1 中用 SEQ 序列以及煙草基因組序列拼接。
SEQ ID NO: 116:實施例1 中用 SEQ 序列以及煙草基因組序列拼接。
SEQ ID NO: 117:實施例1 中用 SEQ 序列以及煙草基因組序列拼接。
SEQ ID NO: 118:實施例1 中用 SEQ 序列以及煙草基因組序列拼接。
SEQ ID NO: 119:實施例1 中用 SEQ 序列以及煙草基因組序列拼接。
SEQ ID NO: 120:實施例1 中用 SEQ 序列以及煙草基因組序列拼接。
SEQ ID NO: 121:實施例1 中用 SEQ 序列以及煙草基因組序列拼接。
SEQ ID NO: 122:實施例1 中用 SEQ 序列以及煙草基因組序列拼接。
SEQ ID NO: 123:實施例1 中用 SEQ 序列以及煙草基因組序列拼接。
SEQ ID NO: 124:實施例1 中用 SEQ 序列以及煙草基因組序列拼接。
SEQ ID NO: 125:實施例1 中用 SEQ 序列以及煙草基因組序列拼接。
SEQ ID NO: 126:實施例1 中用 SEQ 序列以及煙草基因組序列拼接。
SEQ ID NO: 127:實施例1 中用 SEQ 序列以及煙草基因組序列拼接。
SEQ ID NO: 128:實施例1 中用 SEQ 序列以及煙草基因組序列拼接。
SEQ ID NO: 129:實施例1 中用 SEQ 序列以及煙草基因組序列拼接。
SEQ ID NO: 130:實施例1 中用 SEQ 序列以及煙草基因組序列拼接。
SEQ ID NO: 131:實施例1 中用 SEQD N0:5的O次命中的閾值運行的24堿基對 D N0:5的O次命中的閾值運行的24堿基對 D N0:5的O次命中的閾值運行的24堿基對 D N0:5的O次命中的閾值運行的24堿基對 D N0:5的O次命中的閾值運行的24堿基對 D N0:5的O次命中的閾值運行的24堿基對 D N0:5的O次命中的閾值運行的24堿基對 D N0:5的O次命中的閾值運行的24堿基對 D N0:5的O次命中的閾值運行的24堿基對 D N0:5的O次命中的閾值運行的24堿基對 D N0:5的O次命中的閾值運行的24堿基對 D N0:5的O次命中的閾值運行的24堿基對 D N0:5的O次命中的閾值運行的24堿基對 D N0:5的O次命中的閾值運行的24堿基對 D N0:5的O次命中的閾值運行的24堿基對 D N0:5的O次命中的閾值運行的24堿基對 D N0:5的O次命中的閾值運行的24堿基對 D N0:5的O次命中的閾值運行的24堿基對 D N0:5的O次命中的閾值運行的24堿基對 D N0:5的O次命中的閾值運行的24堿基對序列以及煙草基因組序列拼接。
SEQ ID NO: 132:實施例序列以及煙草基因組序列拼接。
SEQ ID NO: 133:實施例序列以及煙草基因組序列拼接。
SEQ ID NO: 134:實施例序列以及煙草基因組序列拼接。
SEQ ID NO: 135:實施例序列以及煙草基因組序列拼接。
SEQ ID NO: 136:實施例序列以及煙草基因組序列拼接。
SEQ ID NO: 137:實施例序列以及煙草基因組序列拼接。
SEQ ID NO: 138:實施例序列以及煙草基因組序列拼接。
SEQ ID NO: 139:實施例序列以及煙草基因組序列拼接。
SEQ ID NO: 140:實施例序列以及煙草基因組序列拼接。
SEQ ID NO: 141:實施例序列以及煙草基因組序列拼接。
SEQ ID NO: 142:實施例序列以及煙草基因組序列拼接。
SEQ ID NO: 143:實施例序列以及煙草基因組序列拼接。
SEQ ID NO: 144:實施例序列以及煙草基因組序列拼接。
SEQ ID NO: 145:實施例序列以及煙草基因組序列拼接。
SEQ ID NO: 146:實施例序列以及煙草基因組序列拼接。
SEQ ID NO: 147:實施例序列以及煙草基因組序列拼接。
SEQ ID NO: 148:實施例序列以及煙草基因組序列拼接。
SEQ ID NO: 149:實施例序列以及煙草基因組序列拼接。
SEQ ID NO: 150:實施例序列以及煙草基因組序列拼接。中用SEQ中用SEQ中用SEQ中用SEQ中用SEQ中用SEQ中用SEQ中用SEQ中用SEQ中用SEQ中用SEQ中用SEQ中用SEQ中用SEQ中用SEQ中用SEQ中用SEQ中用SEQ中用SEQD N0:5的O次命中的閾值運行的24堿基對D N0:5的O次命中的閾值運行的24堿基對D N0:5的O次命中的閾值運行的24堿基對D N0:5的O次命中的閾值運行的24堿基對D N0:5的O次命中的閾值運行的24堿基對D N0:5的O次命中的閾值運行的24堿基對D N0:5的O次命中的閾值運行的24堿基對D N0:5的O次命中的閾值運行的24堿基對D N0:5的O次命中的閾值運行的24堿基對D N0:5的O次命中的閾值運行的24堿基對D N0:5的O次命中的閾值運行的24堿基對D N0:5的O次命中的閾值運行的24堿基對D N0:5的O次命中的閾值運行的24堿基對D N0:5的O次命中的閾值運行的24堿基對D N0:5的O次命中的閾值運行的24堿基對D N0:5的O次命中的閾值運行的24堿基對D N0:5的O次命中的閾值運行的24堿基對D N0:5的O次命中的閾值運行的24堿基對D N0:5的O次命中的閾值運行的24堿基對
SEQ ID NO: 151:實施例1 中用 SEQ 序列以及煙草基因組序列拼接。
SEQ ID NO: 152:實施例1 中用 SEQ 序列以及煙草基因組序列拼接。
SEQ ID NO: 153:實施例1 中用 SEQ 序列以及煙草基因組序列拼接。
SEQ ID NO: 154:實施例1 中用 SEQ 序列以及煙草基因組序列拼接。
SEQ ID NO: 155:實施例1 中用 SEQ 序列以及煙草基因組序列拼接。
SEQ ID NO: 156:實施例1 中用 SEQ 序列以及煙草基因組序列拼接。
SEQ ID NO: 157:實施例1 中用 SEQ 序列以及煙草基因組序列拼接。
SEQ ID NO: 158:實施例1 中用 SEQ 序列以及煙草基因組序列拼接。
SEQ ID NO: 159:實施例1 中用 SEQ 序列以及煙草基因組序列拼接。
SEQ ID NO: 160:實施例1 中用 SEQ 序列以及煙草基因組序列拼接。
SEQ ID NO: 161:實施例1 中用 SEQ 序列以及煙草基因組序列拼接。
SEQ ID NO: 162:實施例1 中用 SEQ 序列以及煙草基因組序列拼接。
SEQ ID NO: 163:實施例1 中用 SEQ 序列以及煙草基因組序列拼接。
SEQ ID NO: 164:實施例1 中用 SEQ 序列以及煙草基因組序列拼接。
SEQ ID NO: 165:實施例1 中用 SEQ 序列以及煙草基因組序列拼接。
SEQ ID NO: 166:實施例1 中用 SEQ 序列以及煙草基因組序列拼接。
SEQ ID NO: 167:實施例1 中用 SEQ 序列以及煙草基因組序列拼接。
SEQ ID NO: 168:實施例1 中用 SEQ 序列以及煙草基因組序列拼接。
SEQ ID NO: 169:實施例1 中用 SEQ 序列以及煙草基因組序列拼接。
SEQ ID NO: 170:實施例1 中用 SEQ40D N0:5的O次命中的閾值運行的24堿基對 D N0:5的O次命中的閾值運行的24堿基對 D N0:5的O次命中的閾值運行的24堿基對 D N0:5的O次命中的閾值運行的24堿基對 D N0:5的O次命中的閾值運行的24堿基對 D N0:5的O次命中的閾值運行的24堿基對 D N0:5的O次命中的閾值運行的24堿基對 D N0:5的O次命中的閾值運行的24堿基對 D N0:5的O次命中的閾值運行的24堿基對 D N0:5的O次命中的閾值運行的24堿基對 D N0:5的O次命中的閾值運行的24堿基對 D N0:5的O次命中的閾值運行的24堿基對 D N0:5的O次命中的閾值運行的24堿基對 D N0:5的O次命中的閾值運行的24堿基對 D N0:5的O次命中的閾值運行的24堿基對 D N0:5的O次命中的閾值運行的24堿基對 D N0:5的O次命中的閾值運行的24堿基對 D N0:5的O次命中的閾值運行的24堿基對 D N0:5的O次命中的閾值運行的24堿基對 D N0:5的O次命中的閾值運行的24堿基對序列以及煙草基因組序列拼接。
SEQ ID NO: 171:實施例序列以及煙草基因組序列拼接。
SEQ ID NO: 172:實施例序列以及煙草基因組序列拼接。
SEQ ID NO: 173:實施例序列以及煙草基因組序列拼接。
SEQ ID NO: 174:實施例序列以及煙草基因組序列拼接。
SEQ ID NO: 175:實施例序列以及煙草基因組序列拼接。
SEQ ID NO: 176:實施例序列以及煙草基因組序列拼接。
SEQ ID NO: 177:實施例序列以及煙草基因組序列拼接。
SEQ ID NO: 178:實施例序列以及煙草基因組序列拼接。
SEQ ID NO: 179:實施例序列以及煙草基因組序列拼接。
SEQ ID NO: 180:實施例序列以及煙草基因組序列拼接。
SEQ ID NO: 181:實施例序列以及煙草基因組序列拼接。
SEQ ID NO: 182:實施例序列以及煙草基因組序列拼接。
SEQ ID NO: 183:實施例序列以及煙草基因組序列拼接。
SEQ ID NO: 184:實施例序列以及煙草基因組序列拼接。
SEQ ID NO: 185:實施例序列以及煙草基因組序列拼接。
SEQ ID NO: 186:實施例序列以及煙草基因組序列拼接。
SEQ ID NO: 187:實施例序列以及煙草基因組序列拼接。
SEQ ID NO: 188:實施例序列以及煙草基因組序列拼接。
SEQ ID NO: 189:實施例序列以及煙草基因組序列拼接。中用SEQ ID N0:5的O次命中的閾值運行的24堿基對中用SEQ ID N0:5的O次命中的閾值運行的24堿基對中用SEQ ID N0:5的O次命中的閾值運行的24堿基對中用SEQ ID N0:5的O次命中的閾值運行的24堿基對中用SEQ ID N0:5的O次命中的閾值運行的24堿基對中用SEQ ID N0:5的O次命中的閾值運行的24堿基對中用SEQ ID N0:5的O次命中的閾值運行的24堿基對中用SEQ ID N0:5的O次命中的閾值運行的24堿基對中用SEQ ID N0:5的O次命中的閾值運行的24堿基對中用SEQ ID N0:5的O次命中的閾值運行的24堿基對中用SEQ ID N0:5的O次命中的閾值運行的24堿基對中用SEQ ID N0:5的O次命中的閾值運行的24堿基對中用SEQ ID N0:5的O次命中的閾值運行的24堿基對中用SEQ ID N0:5的O次命中的閾值運行的24堿基對中用SEQ ID N0:5的O次命中的閾值運行的24堿基對中用SEQ ID N0:5的O次命中的閾值運行的24堿基對中用SEQ ID N0:5的O次命中的閾值運行的24堿基對中用SEQ ID N0:5的O次命中的閾值運行的24堿基對中用SEQ ID N0:5的O次命中的閾值運行的24堿基對
SEQ ID NO: 190:實施例1 中用 SEQ 序列以及煙草基因組序列拼接。
SEQ ID NO: 191:實施例1 中用 SEQ 序列以及煙草基因組序列拼接。
SEQ ID NO: 192:實施例1 中用 SEQ 序列以及煙草基因組序列拼接。
SEQ ID NO: 193:實施例1 中用 SEQ 序列以及煙草基因組序列拼接。
SEQ ID NO: 194:實施例1 中用 SEQ 序列以及煙草基因組序列拼接。
SEQ ID NO: 195:實施例1 中用 SEQ 序列以及煙草基因組序列拼接。
SEQ ID NO: 196:實施例1 中用 SEQ 序列以及煙草基因組序列拼接。
SEQ ID NO: 197:實施例1 中用 SEQ 序列以及煙草基因組序列拼接。
SEQ ID NO: 198:實施例1 中用 SEQ 序列以及煙草基因組序列拼接。
SEQ ID NO: 199:實施例1 中用 SEQ 序列以及煙草基因組序列拼接。
SEQ ID NO:200:實施例1 中用 SEQ 序列以及煙草基因組序列拼接。
SEQ ID NO:201:實施例1 中用 SEQ 序列以及煙草基因組序列拼接。
SEQ ID NO:202:實施例1 中用 SEQ 序列以及煙草基因組序列拼接。
SEQ ID NO:203:實施例1 中用 SEQ 序列以及煙草基因組序列拼接。
SEQ ID NO:204:實施例1 中用 SEQ 序列以及煙草基因組序列拼接。
SEQ ID NO:205:實施例1 中用 SEQ 序列以及煙草基因組序列拼接。
SEQ ID NO:206:實施例1 中用 SEQ 序列以及煙草基因組序列拼接。
SEQ ID NO:207:實施例1 中用 SEQ 序列以及煙草基因組序列拼接。
SEQ ID NO:208:實施例1 中用 SEQ 序列以及煙草基因組序列拼接。
SEQ ID NO:209:實施例1 中用 SEQ42D N0:5的O次命中的閾值運行的24堿基對 D N0:5的O次命中的閾值運行的24堿基對 D N0:5的O次命中的閾值運行的24堿基對 D N0:5的O次命中的閾值運行的24堿基對 D N0:5的O次命中的閾值運行的24堿基對 D N0:5的O次命中的閾值運行的24堿基對 D N0:5的O次命中的閾值運行的24堿基對 D N0:5的O次命中的閾值運行的24堿基對 D N0:5的O次命中的閾值運行的24堿基對 D N0:5的O次命中的閾值運行的24堿基對 D N0:5的O次命中的閾值運行的24堿基對 D N0:5的O次命中的閾值運行的24堿基對 D N0:5的O次命中的閾值運行的24堿基對 D N0:5的O次命中的閾值運行的24堿基對 D N0:5的O次命中的閾值運行的24堿基對 D N0:5的O次命中的閾值運行的24堿基對 D N0:5的O次命中的閾值運行的24堿基對 D N0:5的O次命中的閾值運行的24堿基對 D N0:5的O次命中的閾值運行的24堿基對 D N0:5的O次命中的閾值運行的24堿基對序列以及煙草基因組序列拼接。
SEQ ID N0:210:實施例1中用SEQ ID NO:5的O次命中的閾值運行的24堿基對序列以及煙草基因組序列拼接。
SEQ ID NO:211:實施例1中用SEQ ID N0:5的O次命中的閾值運行的24堿基對序列以及煙草基因組序列拼接。煙草片段GnT1-A變體I的部分cDNA序列。煙草片段GnT1-A變體I的部分cDNA序列。煙草片段GnT1-B cDNA變體I的部分氨基酸序列。煙草片段GnT1-B cDNA變體I的部分氨基酸序列。本氏煙草片段GnT1-B cDNA變體I的部分氨基酸序列。煙草片段GnT1-A cDNA變體I的部分氨基酸序列。煙草片段GnT1-A cDNA變體I的部分氨基酸序列。煙草片段GnT1-B變體2的部分cDNA序列。煙草片段GnT1-A變體3的部分cDNA序 列。煙草片段GnT1-B cDNA變體2的部分氨基酸序列。煙草片段GnT1-B cDNA變體3的部分氨基酸序列。煙草片段GnT1-B的部分cDNA序列變體2 煙草片段GnT1-B的cDNA序列變體2的部分氨基酸序列。本氏煙草片段GnT1-B的部分cDNA序列變體2。本氏煙草片段GnT1-B的cDNA序列變體2的部分氨基酸序列。煙草片段GnT1-A變體2的部分cDNA序列。煙草片段GnT1-A cDNA變體2的部分氨基酸序列。煙草片段GnT1-A變體2的部分cDNA序列。煙草片段GnT1-A cDNA變體2的部分氨基酸序列。:NGSG12045正向引物的核苷酸序列,適合于擴增疊連群gDNA_ C1690982的片段,包含煙草N-乙酰葡萄糖氨基轉移酶I的內含子-外顯子序列。
SEQ ID NO: 232:NGSG12045反向引物的核苷酸序列,適合于擴增疊連群gDNA_ C1690982的片段,包含煙草N-乙酰葡萄糖氨基轉移酶I的內含子-外顯子序列。
SEQ ID NO: 233: NtPM1-BAC-FABI JI_1 (包含煙草N-乙酰葡萄糖氨基轉移酶I基因變體2)的核苷酸序列的1-15,000堿基對。
SEQIDN0:212:
SEQIDN0:213:
SEQIDN0:214:
SEQIDN0:215:
SEQIDN0:216:
SEQIDN0:217:
SEQIDN0:218:
SEQIDN0:219:
SEQIDNO :220:
SEQIDN0:221:
SEQIDNO :222:
SEQIDNO :223:
SEQIDNO :224:
SEQIDNO :225:
SEQIDNO :226:
SEQIDNO :227:
SEQIDNO :228:
SEQIDNO :229:
SEQIDNO :230:
SEQIDN0:231
SEQID
SEQID
SEQID
SEQID
SEQID列。
SEQID列。
SEQIDID NO:239: CPO-反向引物序列,用于擴增煙草PM132的CPO GnTI基因組序ID N0:240:CAC80702. 1_正向引物序列,用于擴增煙草PM132的CAC80702.同源物O
SEQIDN0:241:CAC80702. 1_反向引物序列,用于擴增煙草PM132的CAC80702.1同源物O
SEQIDNO:242:FABIJ1-1同源物正向引物序列,用于擴增煙草??怂归熑~的GnTI序列。
SEQIDNO:243:FABIJ1-1同源物反向引物序列,用于擴增煙草希克斯闊葉的GnTI序列。
SEQIDNO:244:FABIJ1-1同源物正向引物序列,用于擴增煙草??怂归熑~的GnTI序列。
SEQIDNO:245:FABIJ1-1同源物反向引物序列,用于擴增煙草??怂归熑~的GnTI序列。
SEQIDNO:246:PC181F引物序列,用于擴增煙草PM132中含有5’ UTR及外顯子1-7 的 gDNA ο
SEQIDNO:247:PC190R引物序列,用于擴增煙草PM132中含有5’ UTR及外顯子 1-7 的 gDNA ο
SEQIDNO:248:PC191F引物序列,用于擴增煙草PM132中含有外顯子4-13的gDNA ο
SEQIDNO:249:PC192R引物序列,用于擴增煙草PM132中含有外顯子4-13的gDNA ο
SEQIDNO:250:PC193F引物序列,用于擴增煙草PM132中含有外顯子2-19及3,UTR 的 gDNA ο
SEQIDN0:251:PC187R引物序列,用于擴增煙草PM132中含有外顯子12-19及3,UTR 的 gDNA ο
SEQIDNO :252:PC193F引物序列,用于擴增煙草PM132中含有外顯子12-19及3,UTR 的 gDNA ο
SEQIDNO :253:PC188R引物序列,用于擴增煙草PM132中含有外顯子12-19及3UTR 的 gDNA
SEQIDNO :254:PC193F引物序列,用于擴增煙草PM132中含有外顯子12-19及3,UTR 的 gDNA ο
SEQIDNO :255:PC189R引物序列,用于擴增煙草PM132中含有外顯子12-19及3,UTR 的 gDNA
SEQIDNO :256:煙草PM132的基因組FABIJI同源物的核苷酸序列。
SEQIDNO :257:煙草PM132的FABIJI同源物的編碼序列的核苷酸序列。
SEQIDNO :258:煙草PM132的FABIJI同源物的氨基酸序列。
SEQIDNO :259:煙草PM132的基因組CPO-gDNA的核苷酸序列。
SEQIDNO :260:煙草PM132CP0基因的預測編碼區(qū)的核苷酸序列。
SEQIDNO:261:煙草PM132CP0基因的編碼區(qū)的預測氨基酸序列。
SEQIDNO :262:煙草PM132CAC80702.1同源物的核苷酸序列。
SEQIDNO :263:煙草PM132CAC80702.1同源物的編碼區(qū)核苷酸序列。
SEQID
SEQID
SEQID
SEQID
SEQID
SEQID
SEQID
SEQID
SEQID
SEQID
SEQID
SEQID
SEQID
SEQID
SEQID
SEQID
SEQID
SEQID
SEQIDNO:264:煙草PM132CAC80702.1同源物的預測氨基酸序列。 NO: 265:煙草PM132的GnTI疊連群1#5的核苷酸序列。NO:266:GnTI編碼區(qū)疊連群1#5的預測核苷酸序列。NO: 267:煙草PM132的GnTI疊連群1#5的預測氨基酸序列。 NO: 268:煙草PM132的GnTI疊連群1#8的核苷酸序列。NO:269:GnTI編碼區(qū)疊連群1#8的預測核苷酸序列。NO: 270:煙草PM132的GnTI疊連群1#8的預測氨基酸序列。 NO: 271:煙草PM132的GnTI疊連群1#9的核苷酸序列。NO:272:GnTI編碼區(qū)疊連群1#9的預測核苷酸序列。NO: 273:煙草PM1329的GnTI疊連群1#的預測氨基酸序列 NO: 274:煙草PM132的GnTI T10702的核苷酸序列。NO:275:GnTI編碼區(qū)T10702的預測核苷酸序列。NO:276:煙草PM132的GnTI T10702的預測氨基酸序列。NO: 277:煙草PM132的GnTI疊連群1#6的核苷酸序列。NO:278:GnTI編碼區(qū)疊連群1#6的預測核苷酸序列。NO: 279:煙草PM132的GnTI疊連群1#6的預測氨基酸序列。 NO: 280:煙草PM132的GnTI疊連群1#2的核苷酸序列。 N0:281:GnTI編碼區(qū)疊連群1#2的預測核苷酸序列。NO: 282:煙草PM132的GnTI疊連群1#2的預測氨基酸序列。實施例
提供以下實施例作為解釋而不是用于限制。除非另有指出,本發(fā)明采用的是分子生物學、植物生物學及植物育種的常規(guī)技術和方法。
實施例1:鑒別煙草β (I, 2)-木糖基轉移酶變體I的基因組序列
此實施例闡明了如何鑒別煙草的β-1,2_木糖基轉移酶(β (1,2)_木糖基轉移酶)的基因組核苷酸序列。
煙草BAC文庫。按如下方法制備細菌人工染色體(BAC)文庫從溫室生長的煙草希克斯闊葉變種植物的葉中分離細胞核。根據(jù)標準操作流程將高分子量DNA從核中分離, 并用BamHI和HindIII進行部分消化,將其克隆至BAC載體pINDIG05的BamHI或HindIII 位點。獲得了超過320,000個克隆,平均插入長度為135兆堿基對,這覆蓋了大約9. 7倍的煙草基因組。
煙草基因組序列拼接。提交大量隨機挑取的BAC克隆用Sanger法測序,產生超過 1,780,000個原始序列,平均長度為550堿基對。通過使用大腸埃希氏菌Mcr+菌株用于轉化和分離低甲基化DNA的方式進行甲基過濾。使用CELERA基因組拼接程序拼接所有序列, 生成超過800,000個序列,其包含超過200,000個疊連群及596,970個單一序列。疊連群的大小為120-15,300堿基對之間,平均長度為1,100堿基對。
煙草外顯子陣列的開發(fā)與分析。通過組合并比較公共煙草EST數(shù)據(jù)以及獲自BAC 測序的甲基過濾序列得到272,342個外顯子。對每個外顯子設計了四個25聚體的寡核苷酸,用于構建煙草外顯子陣列。外顯子陣列是使用標準操作流程通過Affymetrix(SantaClara, USA)創(chuàng)造的。在這272,432個外顯子中,有^ (11)個被鑒定為與公共數(shù)據(jù)庫注釋的β-1,2-木糖基轉移酶(β (1,2)_木糖基轉移酶)基因序列具有同源性。這11個外顯子屬于6個疊連群。使用標準雜交操作流程及分析工具,發(fā)現(xiàn)這11個外顯子中有十(10)個在煙草葉組織中有活性。選擇顯示了最高表達值的疊連群,gDNA_cl736055,用于引物設計以鑒別BAC克隆而獲得全長的基因組DNA序列。SEQ ID NO:1為疊連群gDNA_c1736055的全長序列。
引物設計。使用Primer3 (Rozen 和 Skaletsky, 2000)為疊連群 gDNA_cl736055 設計了引物對NGSG10043,是以這樣的方式設計的,兩條引物形成一對,位于在外顯子非編碼序列邊界周圍,計算的產物長度為250-500堿基對。NGSG10043是按如下方法設計的將引物SEQ ID勵:2作圖于80應_(31736055的不翻譯部分,位于正鏈的推定起始密碼子之前,而引物SEQ ID N0:3位于所述序列的預測外顯子部分以增加特異性。將包含SEQ ID N0:2和 SEQ ID N0:3的引物對NGSG10043用于篩選BAC文庫。此項策略可用于區(qū)分基因組中存在的不同的多種變體和等位基因。
篩選BAC文庫。DNA分離自BAC克隆,后者以三維的方式匯集而促進對與特定序列有同源性的個體克隆進行鑒別。使用PCR及標準BAC篩選步驟及引物對NGSG10043篩選完全 BAC文庫,鑒別給出預測片段大小的單一克隆。選擇了一個BAC克隆,NtPM1-BAC-TAK0MI_6, 用于進一步分析,并使用454測序法在基因組測序儀FLX System (Roche Diagnostics Corporation)上對純化的NtPMI_BAC_TAK0MI_6的DNA進行測序。使用Newbler拼接程序(454 Life Sciences, Branford, USA)拼接所有的原始 NtPMI_BAC_TAK0MI_6 序列,并用 TAIR和Uniprot入口進行注釋,由此鑒別出了一個28,936堿基對的疊連群257B4-疊連群 00006,其包含與擬南芥β-1,2-木糖基轉移酶(AT5G55500.1; TAIR登記基因2173891)同源的序列。SEQ ID勵:4公開了財 10-84^八1(010_6的6,000堿基對的片段,其包含負鏈上大約3,465 堿基對的片段(顯示了與擬南芥基因AT5G55500.1 (SEQ ID Ν0:5)的同源性) 以及預測基因(SEQ ID NO: 6)的推定終止密碼子后的1,430堿基對的片段以及推定起始密碼子之前的1,140堿基對的片段。使用引物組NGSG10043擴增的NtPMI_BAC_TAK0MI_6的 358堿基對的片段如SEQ ID N0:7所示。
β (I, 2)_木糖基轉移酶基因序列的鑒別。使用預測真核基因組序列的基因搜尋程序 Augustus (University of G6ttingen,Gottillgeil, Germany)和 FgeneSH (Softberry Inc. , Mount Kisco,USA)對顯示與擬南芥β-1,2-木糖基轉移酶(β (1,2)-木糖基轉移酶) 基因序列有同源性的NtPM1-BAC-TAK0MI_6的6,000堿基對的基因組序列進行進一步注釋。 兩個基因搜尋程序對已知煙草基因進行第一次訓練。進一步通過與已知的β (1,2)_木糖基轉移酶cDNA和氨基酸序列進行比較手動注釋與顯示了與擬南芥AT5G55500.1同源的 3,430堿基對片段重疊的預測的FgeneSH和Augustus基因。SEQ ID N0:8公開了與SEQ ID N0:5相關的cDNA序列。SEQ ID N0:8包括1,572堿基對,包括了終止密碼子,其編碼了 523 個氨基酸的多肽(SEQ ID N0:9)。
煙草β-1,2_木糖基轉移酶(β (1,2)_木糖基轉移酶)基因結構。通過比較基因組DNA序列SEQ ID NO: 5和β-1,2-木糖基轉移酶(β (1,2)-木糖基轉移酶)cDNA序列SEQ ID N0:8,可得出結論該基因組基因編碼序列包含三個負鏈上的外顯子(跨度為SEQ ID NO: 4的負鏈上的4,894-大約4,196 (起始密碼子-外顯子I),大約2,899—2,750 (外顯子2)即大約2,152-1,430 (外顯子3-終止密碼子))及兩個插入的內含子。
實施例2:鑒別煙草β-12-木糖基轉移酶(β (I,2)_木糖基轉移酶)變體2
煙草的β -1, 2-木糖基轉移酶(β (I, 2)-木糖基轉移酶)基因變體2是如實施例1中描述的方法鑒別的,但分別使用的是基于CH0_0F4335xnl3fl的引物對NGSG10046 (SEQ ID NO: 15 和 16)。SEQ ID NO: 12 表示 NtPM1-BAC-GEJUJ0_2(含有煙草 β_1,2_ 木糖基轉移酶(β (1,2)_木糖基轉移酶)基因變體2)的核苷酸序列的60,001-65,698堿基對。SEQ ID NO: 13表示煙草β-1,2-木糖基轉移酶(β (1,2)_木糖基轉移酶)基因變體2的cDNA序列。 SEQ ID勵:17表示財卩]\0-84(-34犯1(1_1(含有煙草β_1,2_木糖基轉移酶(β (1,2)-木糖基轉移酶)基因變體2)的核苷酸序列的15,921-23,200堿基對。SEQ ID NO: 18表示煙草 β-1,2-木糖基轉移酶(β (1,2)_木糖基轉移酶)基因變體2的cDNA序列。SEQ ID NO: 19 表示煙草β-1,2-木糖基轉移酶(β (1,2)_木糖基轉移酶)蛋白質變體2的氨基酸序列。
實施例3:鑒別煙草α-1,3_巖藻糖基轉移酶(α (1,3)-巖藻糖基轉移酶)變體 I至4
基本上用實施例1中描述的方法鑒別出煙草的四個α-1,3_巖藻糖基轉移酶 (α (l,3)-巖藻糖基轉移酶)基因變體,使用了引物對NGSG10032(SEQ ID SEQ ID NO:30和 31),NGSG10034(SEQ ID NO:35 和 36),NGSG10035(SEQ ID N0:45 和 46)和 NGSG10041(SEQ ID N0:25 和 26)。SEQ ID NO:27 表示 NtPMI_BAC_FETILA_9 (含有煙草 α-1,3_ 巖藻糖基轉移酶(α (1,3)_巖藻糖基轉移酶)基因變體I)的核苷酸序列的2,961-10,160堿基對, SEQ ID NO:28表示α-1,3-巖藻糖基轉移酶(α (1,3)-巖藻糖基轉移酶)基因變體I的 cDNA序列,而SEQ ID Ν0:29為α _1,3_巖藻糖基轉移酶(α (1,3)-巖藻糖基轉移酶)蛋白質變體I的氨基酸序列。SEQ ID NO: 32表示NtPM1-BAC-JUMAKE_4 (含有煙草α-l, 3-巖藻糖基轉移酶(α (1,3)_巖藻糖基轉移酶)基因變體2)的核苷酸序列的1,041-7,738堿基對,SEQ ID NO: 33為α-1,3_巖藻糖基轉移酶(α (1,3)-巖 藻糖基轉移酶)基因變體2 的部分cDNA序列,而SEQ ID NO: 34為α-1,3_巖藻糖基轉移酶(α (1,3)-巖藻糖基轉移酶)蛋白質變體2的部分氨基酸序列。SEQ ID NO:37表示NtPM1-BAC-JEJ0L0_22 (包含部分煙草α-1,3_巖藻糖基轉移酶(α (1,3)_巖藻糖基轉移酶)基因變體3)的核苷酸序列的 19,001-23,871堿基對,SEQ ID NO: 38為α-1,3-巖藻糖基轉移酶(α (1,3)-巖藻糖基轉移酶)基因變體3的部分cDNA序列,而SEQ ID NO: 39為α (1,3)-巖藻糖基轉移酶蛋白質變體3的部分氨基酸序列。SEQ ID NO: 47表示NtPM1-BAC-JUD0SU_1(包含煙草α-l, 3-巖藻糖基轉移酶(α (1,3)_巖藻糖基轉移酶)基因變體4)的核苷酸序列的1-11,000堿基對,SEQ ID NO: 48為α-1,3_巖藻糖基轉移酶(α (1,3)-巖藻糖基轉移酶)基因變體4的部分cDNA序列,而SEQ ID NO:49為α-1,3_巖藻糖基轉移酶(α (1,3)-巖藻糖基轉移酶) 蛋白質變體4的部分氨基酸序列。
實施例4:用于選擇鋅指核酸酶靶標位點的搜索操作流程
此實施例闡明了如何搜索給定基因的基因組核苷酸序列以比較給定基因組數(shù)據(jù)庫而篩選給定基因序列內獨特靶標位點的發(fā)生率,這樣可開發(fā)修飾所述基因表達的工具。 通過本發(fā)明的方法鑒別的祀標位點(包括下文公開的位點),包括序列基序以及任何這些位點或基序用于修飾植物如煙草中對應基因序列的用途都在本發(fā)明范圍內。
搜索算法。開發(fā)了一項計算機程序以允許對一段輸入查詢(靶標)核苷酸序列篩選由固定間隔子大小序列分開的兩條固定長度的亞串DNA基序的發(fā)生率,使用了 DNA 數(shù)據(jù)庫內的后綴陣列,如實施例1中的煙草基因組序列的拼接。所述后綴陣列的構建及搜索使用了 開放資源 libdivsufsort library-2. O. O (http: //code, google, com/p/ libdivsufsort/),其將任何輸入串直接轉換為Burrows-Wheeler轉化串。該程序掃描全長的輸入(靶標)核苷酸序列并返回所有在選定DNA數(shù)據(jù)庫中發(fā)生少于選定次數(shù)的亞串組合。
選擇靶標位點用于對查詢序列進行鋅指核酸酶介導的誘變。鋅指DNA結合結構域識別一段三堿基的核苷酸序列。鋅指核酸酶包含的鋅指蛋白質包含一個、兩個、三個、四個、 五個、六個或更多鋅指DNA結合結構域,以及非特異性核酸酶,IIS型限制性內切酶。鋅指核酸酶可用于向靶標序列中引入雙鏈斷裂。為引入雙鏈斷裂,需要一對鋅指核酸酶,其中之一結合于靶標序列的正(上)鏈而另一個結合于相同的靶標序列的負(下)鏈,相隔0、1、2、 3、4、5、6或更多的核苷酸。通過對所述兩個固定長度亞串DNA基序的每個使用3次重復,可使用該程序鑒別由給定間隔子長度隔開的兩個鋅指蛋白質靶標位點。
程序輸入
1.靶標查詢DNA序列
2.要搜索的DNA數(shù)據(jù)庫
3.第一個亞串DNA基序的固定大小
4.間隔子的固定大小
5.第二個亞串DNA基序的固定大小
6.在所選擇的程序輸入2的DNA數(shù)據(jù)庫中的程序輸入3和5 (其由程序輸入4隔開)的組合發(fā)生率的閾值數(shù)量
程序輸出
1. 一列核苷酸序列,以及對于每個序列的其在DNA數(shù)據(jù)庫中發(fā)生的次數(shù),最大值為程序輸入6的閾值。
實施例5:在煙草β-1,2_木糖基轉移酶(β (1,2)_木糖基轉移酶)變體I核苷酸序列內選擇靶標位點,其具有固定的6堿基對的第一和第二個亞串、固定的3堿基對的間隔子以及在煙草基因組序列拼接中最大閾值為5次命中。
程序輸入
1.煙草β-1,2_木糖基轉移酶(β (1,2)_木糖基轉移酶)SEQ ID NO: 5作為靶標查詢DNA序列
2.實施例1的煙草基因組序列拼接物作為要搜索的DNA數(shù)據(jù)庫
3.固定的6堿基對的第一亞串DNA基序
4.固定的3堿基對的間隔子
5.固定的6堿基對的第二亞串DNA基序
6.在所選擇的有5次命中的程序輸入2的DNA數(shù)據(jù)庫中的程序輸入3和5 (其由程序輸入4隔開)的組合發(fā)生率的最大閾值數(shù)量
程序輸出
ACCGTA NNN GGCGAC (SEQ ID NO:50):4 次命中
CCGTAT NNN GCGACG(SEQ ID NO:51):5 次命中
TATCCG NNN ACGGCG(SEQ ID NO:52) :5 次命中
GCGAGGNNNGTGCTA(SEQIDNO:53)5次命中
TCTCGTNNNGGCGAG(SEQIDNO:54)5次命中
CGGTTANNNGTAGGA(SEQIDNO:55)5次命中
AGTTAGNNNGCGCCG(SEQIDNO:56)4次命中
CGTGGCNNNCAGGGT(SEQIDNO:57)3次命中
CCTTACNNNACGTCT(SEQIDNO:58)4次命中
GGCCATNNNGGGGGC(SEQIDNO:59)3次命中
GCCATANNNGGGGCG(SEQIDNO:60)4次命中
GCACGGNNNTCCGAG(SEQIDΝ0:61)4次命中
GCGAATNNNGGCGCC(SEQIDNO:62)5次命中
此實施例闡明了對于給定的靶標序列SEQ ID N0:5(其包含β (I, 2)-木糖基轉移酶的完全基因組序列,從ATG起始密碼子到TAA終止密碼子,并含有兩個外顯子和兩個內含子)的任何鋅指核酸酶對(其中每個鋅指蛋白質包含兩個固定的6堿基對長的DNA結合結構域,以及3堿基對的固定的插入間隔子序列)會靶向煙草基因組內部的至少三個其他位點。 此實施例還闡明了,在煙草基因組中只有13對發(fā)生次數(shù)小于或等于5,而其他對都超過5 次。
實施例6 :選擇靶標位點用于對煙草β-1,2_木糖基轉移酶(β (1,2)_木糖基轉移酶)變體I的編碼序列 的外顯子2片段進行鋅指核酸酶基因組編輯
此實施例闡明
1.如何對一列用于對SEQ ID NO: 5的煙草β _1,2_木糖基轉移酶(β (1,2)_木糖基轉移酶)變體I的外顯子2進行鋅指介導的誘變的靶標位點進行編譯
2.如何對一對用于設計兩種形成一對以誘變編碼序列的鋅指核酸酶的靶標位點進行選擇
3.如何使用程序的輸出開發(fā)一對鋅指核酸酶
程序輸入
1. SEQ ID NO:5的2,750-2,899堿基對(負鏈為編碼序列)的外顯子2片段作為靶標查詢DNA序列
2.實施例1的煙草基因組序列拼接物作為要搜索的DNA數(shù)據(jù)庫
3.固定的12堿基對的第一亞串DNA基序
4.固定的O堿基對的間隔子
5.固定的12堿基對的第二亞串DNA基序
6.在所選的DNA數(shù)據(jù)庫中發(fā)生I次的最大閾值數(shù)
程序輸出
在煙草基因組數(shù)據(jù)庫中運行程序生成的具有最大I次發(fā)生的閾值的所有為外顯子2設計的12-0-12的24個堿基對序列如下,其中第一個數(shù)字表示第一亞串的固定長度, 第二個數(shù)字為間隔子的固定長度,而第三個數(shù)字為第二亞串的固定長度,都為上文的輸入設置)
TTTTCATTTCAG TGGATTGAGGAG(SEQ ID NO:63) :O 次命中
TTTCATTTCAGT GGATTGAGGAGC(SEQ ID NO:64) :O 次命中
TTCATTTCAGTGGATTGAGGAGCCSEQIDNO :65)0次命中
TCATTTCAGTGGATTGAGGAGCCGSEQIDNO :66)0次命中
CATTTCAGTGGATTGAGGAGCCGTSEQIDNO :67)0次命中
ATTTCAGTGGATTGAGGAGCCGTCSEQIDNO :68)0次命中
TTTCAGTGGATTGAGGAGCCGTCASEQIDNO :69)0次命中
TTCAGTGGATTGAGGAGCCGTCACSEQIDNO :70)0次命中
TCAGTGGATTGAGGAGCCGTCACTSEQIDN0:71)0次命中
CAGTGGATTGAGGAGCCGTCACTTSEQIDNO :72)0次命中
AGTGGATTGAGGAGCCGTCACTTTSEQIDNO :73)0次命中
GTGGATTGAGGAGCCGTCACTTTTSEQIDNO :74)0次命中
TGGATTGAGGAGCCGTCACTTTTGSEQIDNO :75)0次命中
GGATTGAGGAGCCGTCACTTTTGASEQIDNO :76)0次命中
GATTGAGGAGCCGTCACTTTTGATSEQIDNO :77)0次命中
ATTGAGGAGCCGTCACTTTTGATTSEQIDNO :78)0次命中
TTGAGGAGCCGTCACTTTTGATTASEQIDNO :79)0次命中
TGAGGAGCCGTCACTTTTGATTACSEQIDNO :80)0次命中
GAGGAGCCGTCACTTTTGATTACASEQIDN0:81)0次命中
AGGAGCCGTCACTTTTGATTACACSEQIDNO :82)0次命中
GGAGCCGTCACTTTTGATTACACGSEQIDNO :83)0次命中
GAGCCGTCACTTTTGATTACACGASEQIDNO :84)0次命中
AGCCGTCACTTTTGATTACACGATSEQIDNO :85)0次命中
GCCGTCACTTTTGATTACACGATTSEQIDNO :86)0次命中
CCGTCACTTTTGATTACACGATTTSEQIDNO :87)0次命中
CGTCACTTTTGATTACACGATTTGSEQIDNO :88)0次命中
GTCACTTTTGATTACACGATTTGASEQIDNO :89)0次命中
TCACTTTTGATTACACGATTTGAGSEQIDNO :90)0次命中
CACTTTTGATTACACGATTTGAGTSEQIDN0:91)0次命中
ACTTTTGATTACACGATTTGAGTASEQIDNO :92)0次命中
CTTTTGATTACACGATTTGAGTATSEQIDNO :93)0次命中
TTTTGATTACACGATTTGAGTATGSEQIDNO :94)0次命中
TTTGATTACACGATTTGAGTATGCSEQIDNO :95)0次命中
TTGATTACACGATTTGAGTATGCASEQIDNO :96)0次命中
TGATTACACGATTTGAGTATGCAASEQIDNO :97)0次命中
GATTACACGATTTGAGTATGCAAASEQIDNO :98)0次命中
ATTACACGATTTGAGTATGCAAACSEQIDNO :99)0次命中
TTACACGATTTGAGTATGCAAACCSEQIDNO:100):0次命中
TACACGATTTGAGTATGCAAACCTSEQIDNO:101):0次命中
ACACGATTTGAGTATGCAAACCTTSEQIDNO:102):0次命中
CACGATTTGAGTATGCAAACCTTTSEQIDNO:103):0次命中
權利要求
1.遺傳修飾的煙草植物細胞或包含所述修飾的植物細胞的煙草植物,其中修飾的植物細胞包含至少對在包含N-乙?;?葡糖氨基轉移酶的編碼序列的基因組區(qū)域中的第一靶標核苷酸序列的修飾,這使得(i)修飾的植物細胞中的糖基轉移酶的活性或表達相對于未修飾的植物細胞是降低的,且(ii)修飾的植物細胞中產生的蛋白質的N-聚糖上的α -1, 3-巖藻糖或β -1, 2-木糖或二者相對于未修飾的植物細胞是降低的。
2.權利要求1的修飾的煙草植物細胞或煙草植物,其另外包含(a)至少對包含β (1,2)_木糖基轉移酶的編碼序列的基因組區(qū)域中的第二靶標核苷酸序列的修飾,或(b)至少對包含α (1,3)_巖藻糖基轉移酶的編碼序列的基因組區(qū)域中的第三靶標核苷酸序列的修飾,或(a)和(b)的組合。
3.權利要求1的修飾的煙草植物細胞或煙草植物,其進一步包含在第一靶標核苷酸序列、第二靶標核苷酸序列、第三靶標核苷酸序列或任何兩個或更多個前述靶標核苷酸序列的組合的等位基因變體中的修飾。
4.前述權利要求中任何一項的修飾的煙草植物細胞或煙草植物,其中第一靶標核苷酸序列為a.與選自SEQ ID N0:12、13、40、41、233、256、259、262、265、268、271、274、277、280 的核苷酸序列有至少70%、特別是至少80%、特別是至少90%的同一性;b.與選自SEQ ID N0:20、21、212、213、219、220、223、227、229、234、257、260、263、266、269、272、275、278、281的核苷酸序列有至少95%、特別是至少98%、特別是至少99%的同一性。
5.根據(jù)權利要求2-4中任何一項的修飾的煙草植物細胞或煙草植物,其中第二靶標核苷酸序列為a.與選自SEQID NO: 1、4、5、和17的核苷酸序列有至少70%、特別是至少80%、特別是至少90%的同一性;b.與選自SEQID N0:8和18的核苷酸序列有至少95%、特別是至少98%、特別是至少99%的同一性。
6.根據(jù)權利要求2-5中任何一項的修飾的煙草植物細胞或煙草植物,其中第三靶標核苷酸序列為a.與選自SEQID NO:27、32、37和47的核苷酸序列有至少70%、特別是至少80%、特別是至少90%的同一性;b.與選自SEQID NO:28、33、38和48的核苷酸序列有至少95%、特別是至少98%、特別是至少99%的同一性。
7.根據(jù)前述權利要求中任何一項的修飾的煙草植物細胞或煙草植物,其中植物為煙草栽培種PM132,其以登記號NCMB 41802保藏。
8.根據(jù)前述權利要求中任何一項的修飾的煙草植物的后代,其中所述后代植物包含如前述權利要求中任何一項中所限定的修飾中的至少一種,其中糖基轉移酶的活性或表達相對于未修飾的植物是降低的且Qi)修飾的植物中產生的蛋白質的N-聚糖上的α-1,3-巖藻糖或β -1, 2-木糖或二者相對于未修飾的植物細胞是降低的。
9.用于產生異源蛋白質的方法,所述方法包括將包含編碼異源蛋白質的核苷酸序列的表達構建物引入權利要求1-8中任何一項所限定的修飾的煙草植物細胞或植物中,所述異源蛋白質特別是疫苗抗原、細胞因子、激素、凝血蛋白質、載脂蛋白、用于人類替代療法的酶、免疫球蛋白或其片段;以及培養(yǎng)包含所述表達構建體的修飾的植物細胞以產生異源蛋白質,以及可選地,由所述植物細胞再生植物并培養(yǎng)所述植物及其后代。
10.核苷酸,其包含的核苷酸序列編碼a.N-乙酰葡萄糖氨基轉移酶或其片段,其核苷酸序列(i)選自SEQ ID 勵12、13、40、41、233、256、259、262、265、268、271、274、277 和 280;(ii)選自SEQ ID N0:20、21、212、213、219、220、223、227、229、234、257、260、263、266、269、272、275、278 和 281 ;(iii)與(i)或(ii)的核苷酸序列有至少95%、特別是至少98%、特別是至少99%的同一 I"生;(iv)允許由或(iii)的核苷酸序列或其互補物組成的多核苷酸探針進行雜交,特別是在嚴格條件下;b.β (1,2)_木糖基轉移酶或其片段,其核苷酸序列(i)選自SEQ ID N0:l、4、5、7 和 17 ;(ii)選自SEQ ID NO:8 和 18 ;(iii)與(i)或(ii)的核苷酸序列有至少95%、特別是至少98%、特別是至少99%的同一 I"生;(iv)允許由或(iii)的核苷酸序列或其互補物組成的多核苷酸探針進行雜交,特別是在嚴格條件下;C. α (1,3)_巖藻糖基轉移酶或其片段,其核苷酸序列(i)選自SEQ ID N0:27、32、37 和 47;(ii)選自SEQ ID N0:28、33、38 和 48;(iii)與(i)或(ii)的核苷酸序列有至少95%、特別是至少98%、特別是至少99%的同一 I"生;(iv)允許由或(iii)的核苷酸序列或其互補物組成的多核苷酸探針進行雜交,特別是在嚴格條件下。
11.由權利要求10的多核苷酸編碼的糖基轉移酶,其中所述糖基轉移酶為a.氨基酸序列如SEQ ID N0:214、215、217、218、221、222、224、228、230、235、258、264、267、270、273、276、279和282所示的N-乙酰葡萄糖氨基轉移酶;b.氨基酸序列如SEQID NO:9和19所示的β (I, 2)-木糖基轉移酶;c.氨基酸序列如SEQID N0:29、34、39和49所示的α (1,3)-巖藻糖基轉移酶;d.與或(iii)的氨基酸序列有至少95%、特別是至少98%、特別是至少99%的同一性的氨基酸序列。
12.權利要求10中限定的基因組核苷酸序列的用途,用于在以下序列中鑒定靶標位點a.包含N-乙酰葡萄糖氨基轉移酶的編碼序列的基因組區(qū)域中的第一靶標核苷酸序列;或b.a)的第一靶標核苷酸序列以及包含β(1,2)_木糖基轉移酶的編碼序列的基因組區(qū)域中的第二靶標核苷酸序列;或c.a)的第一靶標核苷酸序列以及包含α(1,3)_巖藻糖基轉移酶的編碼序列的基因組區(qū)域中的第三靶標核苷酸序列;d.a)、b)和c)的所有靶標核苷酸序列;進行修飾,使得(i)包含所述修飾的植物細胞中的N-乙酰氨基葡萄糖基轉移酶、或者N-乙酰葡萄糖氨基轉移酶和β (1,2)_木糖基轉移酶、或者N-乙酰葡萄糖氨基轉移酶和α (1,3)_巖藻糖基轉移酶或者N-乙酰氨基葡萄糖基轉移酶、β (1,2)_木糖基轉移酶和α (I, 3)-巖藻糖基轉移酶,以及可選地其至少一種等位基因變體的活性或表達相對于未修飾的植物細胞是降低的,并且(ii)包含所述修飾的植物細胞中的蛋白質的N-聚糖上的α -1, 3-巖藻糖或β -1, 2-木糖或二者相對于未修飾的植物細胞是降低的。
13.選擇性結合于權利要求10中限定的基因組核苷酸序列或編碼序列的非天然鋅指蛋白質的用途,用于產生在至少一靶標核苷酸序列中引入雙鏈斷裂的鋅指核酸酶。
14.包含異源蛋白質的植物組合物,可獲自包含由如權利要求1-8中任何一項限定的修飾的植物細胞,其中異源蛋白質的N-聚糖上的α-1,3-巖藻糖或β-1,2-木糖或二者相對于未修飾的植物細胞中的產生那些是降低的。
15.用于產生包含能夠產生人源化糖蛋白的修飾的植物細胞的煙草植物細胞或煙草植物的方法,所述方法包括(i)在煙草植物細胞的基因組中修飾a.包含N-乙酰葡萄糖氨基轉移酶的編碼序列的基因組區(qū)域中的第一靶標核苷酸序列;或b.a)的第一靶標核苷酸序列以及包含β (I, 2)_木糖基轉移酶或α (I, 3)_巖藻糖基轉移酶的編碼序列的基因組區(qū)域中的第二靶標核苷酸序列;或c.a)的第一靶標核苷酸序列以及b)的第二靶標核苷酸序列以及包含β (1,2)_木糖基轉移酶或α (1,3)_巖藻糖基轉移酶的編碼序列的基因組區(qū)域中的第三靶標核苷酸序列;以及可選的d.包含(a)、(b)或(C)的等位基因變體的基因組區(qū)域中的靶標序列,或前述靶標序列中任何兩種或多種的組合。(ii)鑒別及可選地,選擇在靶標核苷酸序列中包含所述修飾的植物或植物細胞,其中修飾的植物或植物細胞中的如a)、b)、c)和d)中限定的糖基轉移酶的活性或表達以及可選地其至少一種等位基因變體的活性或表達相對于未修飾的植物細胞是降低的,而由所述修飾的植物或植物細胞產生的糖蛋白在其N-聚糖上缺少α -1, 3-連接巖藻糖殘基及β-1,2-連接的木糖殘基。
16.權利要求15的方法,其中靶標核苷酸序列包含如權利要求10中所限定的核苷酸序列。
17.前述權利要求中任何一項的方法,其中植物為煙草栽培種ΡΜ132,其以登記號NCIMB 41802 保藏。
18.前述權利要求中任何一項的方法,其中對煙草植物或植物細胞的基因組的修飾包括a.在煙草植物或植物細胞的靶標核苷酸序列以及可選地在其至少一種等位基因變體中鑒定靶標位點,b.基于如權利要求10中限定的核苷酸序列設計能夠識別并結合于所述靶標位點處或鄰近的誘變的寡核苷酸,以及c.在使得基因組被修飾的條件下將誘變的寡核苷酸結合于煙草植物或植物細胞的基因組中的靶標核苷酸序列上。
19.權利要求18的方法,其中誘變的寡核苷酸用于基因組編輯技術,特別是用于鋅指核酸酶介導的誘變、tilling、同源重組、寡核苷酸定點誘變或大范圍核酸酶介導的誘變,或前述技術的組合。
全文摘要
本發(fā)明針對的是在植物中靶向基因和基因組、修飾酶活性及蛋白質表達。具體而言,本發(fā)明涉及用于降低植物細胞中一種或多種內源糖基轉移酶如N-乙酰葡萄糖氨基轉移酶、β(1,2)-木糖基轉移酶及α(1,3)-巖藻糖基轉移酶的活性的方法,并涉及由所述方法獲得的植物。
文檔編號C12N15/82GK103025866SQ201180023755
公開日2013年4月3日 申請日期2011年3月22日 優(yōu)先權日2010年3月22日
發(fā)明者K·K·奧伊施, D·E·A·佛洛拉克, P·坎帕尼, C·M·波齊, J·卡蒂諾特, N·J·謝羅, N·V·伊萬諾夫 申請人:菲利普莫里斯生產公司