,例如,SMART(Schultz等(1998)Proc. 化tl.Acad.Sci.USA95,5857-5864;Letunic等(2002)NucleicAcidsRes30,242-244), Inte;rP;ro(Mulder等,(2003)Nucl.Acids.Res.31,315-318),Prosite化ucher和 Bairoch(1994),用于自動序列闡釋的生物分子序列基序和其功能的一般輪廓特征。(In) ISMB-94 ;第二屆分子生物學(xué)智能系統(tǒng)的國際大會的會議記錄。AltmanR.,化UtlagD., KarpP.,LathropR.,SearlsD.,Eds.,pp53-61,AAAIPress,MenloPark郵1〇 等,Nucl. Acids.Res. 32:D1:M-D137,(2004)),或Pfam度ateman等,NucleicAcidsResearch30(1): 276-280(2002))。用于計算機(jī)分析蛋白質(zhì)序列的一組工具在ExPASy蛋白質(zhì)組服務(wù)器中是 可用的(SwissInstituteofBioinformaticsKasteiger等,ExPASy:用于深度蛋白質(zhì)知識 和分析的蛋白質(zhì)組服務(wù)器,NucleicAcidsRes. 31:3784-3788(2003))??墒褂贸R?guī)技術(shù), 比如通過序列比對來鑒定結(jié)構(gòu)域或基序也。
[0060] 為了本發(fā)明的目的,"轉(zhuǎn)基因的"、"轉(zhuǎn)基因"或"重組"意思是例如,核酸序列、表達(dá) 盒、基因構(gòu)建體或載體包括和/或由核酸序列組成或生物體用根據(jù)本發(fā)明的核酸序列、表 達(dá)盒或載體轉(zhuǎn)化,所有的那些構(gòu)建體通過重組方法產(chǎn)生,其中:(a)編碼蛋白質(zhì)的核酸序列 用于本發(fā)明的方法,或化)遺傳控制序列(一條或多條)可操作地連接根據(jù)本發(fā)明的核酸 序列,例如啟動子,或(c)a)和b)不在它們的天然遺傳環(huán)境中或已經(jīng)通過重組方法修飾。 修飾可為,例如置換、添加、缺失、倒置或插入一個或多個核巧酸殘基的形式。天然遺傳環(huán)境 理解為意思是在起始植物中的天然基因組或染色體基因座或存在于基因組文庫中。在基因 組文庫的情況下,優(yōu)選地至少部分保持核酸序列的天然遺傳環(huán)境。環(huán)境在核酸序列至少一 側(cè)的側(cè)翼并且序列長度為約50bp,優(yōu)選地為約5(K)bp。天然存在的表達(dá)盒-例如天然存在 的核酸序列的天然啟動子與編碼用于如上定義的本發(fā)明方法的多膚的相應(yīng)的核酸序列組 合-當(dāng)該表達(dá)盒通過非天然合成的("人工方法比如,例如,誘變處理修飾時變成轉(zhuǎn)基因 表達(dá)盒。適當(dāng)?shù)姆椒枋鲈冢鏤S5,565,350(通過參考并入)或胖000/15815(通過參 考并入)中。
[0061] 為了本發(fā)明的目的,轉(zhuǎn)基因植物因此理解為包括其中在本發(fā)明的方法中使用的核 酸不在它們植物的所述基因組的的天然基因座的那些植物,并且因此核酸同源或異源表達(dá) 是可能的。但是,如所提到的,轉(zhuǎn)基因也意思是,盡管根據(jù)本發(fā)明的或在本發(fā)明的方法中使 用的核酸在它們植物基因組的天然位置,相對于天然序列,序列已經(jīng)被修飾,和/或天然序 列的調(diào)節(jié)序列已經(jīng)被修飾。轉(zhuǎn)基因優(yōu)選地理解為意思是根據(jù)本發(fā)明的核酸在基因組的非天 然基因座的表達(dá),其中核酸發(fā)生同源的或,優(yōu)選地,異源表達(dá)。
[0062] 如本文所使用,術(shù)語"引入"、或"轉(zhuǎn)化"指本文包括外源性多核巧酸轉(zhuǎn)化至宿主細(xì) 胞,無論用于轉(zhuǎn)化的方法如何。能夠隨后克隆繁殖的植物組織,無論通過器官發(fā)生或胚芽發(fā) 生,可用本發(fā)明的遺傳構(gòu)建體轉(zhuǎn)化并且從其再生完整植物。取決于可用的克隆繁殖系統(tǒng),和 最適于待轉(zhuǎn)化的具體物種,選擇的具體組織不同。示例性組織祀包括葉盤、花粉、胚芽、子 葉、下胚軸、雌配子體、愈傷組織、存在的分生組織(例如,頂端分生組織、蔽芽和根分生組 織),和誘導(dǎo)分生組織(例如,子葉分生組織和下胚軸分生組織)。多核巧酸可瞬時或穩(wěn)定引 入宿主細(xì)胞并且可W保持為非整合形式,例如,質(zhì)粒??蛇x地,其可整合至宿主基因組。所 得轉(zhuǎn)化植物細(xì)胞可然后用于W本領(lǐng)域熟知的方式再生轉(zhuǎn)化植物。
[0063] 外源基因轉(zhuǎn)移至植物的基因組稱為轉(zhuǎn)化。
[0064] 植物物種的轉(zhuǎn)化現(xiàn)在是相當(dāng)常規(guī)的技術(shù)。有利地,任何數(shù)個轉(zhuǎn)化方法可用于將感 興趣的基因引入適當(dāng)?shù)淖嫦燃?xì)胞。為從植物組織或植物細(xì)胞轉(zhuǎn)化和再生植物描述的方法可 用于瞬時或穩(wěn)定轉(zhuǎn)化。轉(zhuǎn)化方法包括使用脂質(zhì)體、電穿孔和增加游離DNA吸收的化學(xué)品、 DNA直接注入植物、粒子槍轟擊,和使用病毒或花粉和微投射的轉(zhuǎn)化。轉(zhuǎn)基因植物,包括轉(zhuǎn) 基因作物植物優(yōu)選地經(jīng)±壤桿菌介導(dǎo)的轉(zhuǎn)化產(chǎn)生。有利的轉(zhuǎn)化方法是在植物學(xué)中的轉(zhuǎn)化 (Sajib等,PlantCellTiss.OrganCult. (2008)95,333-:34)。
[0065] 通常,轉(zhuǎn)化之后,選擇存在由與感興趣的基因一起轉(zhuǎn)化,植物可表達(dá)的基因編碼的 一個或多個標(biāo)記物的植物細(xì)胞或細(xì)胞組,其后將轉(zhuǎn)化材料再生至完整植物。為了選擇轉(zhuǎn)化 的植物,轉(zhuǎn)化的獲得的植物材料通常經(jīng)受選擇性條件,從而轉(zhuǎn)化的植物可與未轉(zhuǎn)化的植物 不同。例如,可種植W上述方式獲得的種子,并且在初始生長階段之后,通過噴霧經(jīng)受適當(dāng) 的選擇。進(jìn)一步可能性由如果需要,在消毒之后,在使用適當(dāng)?shù)倪x擇試劑的瓊脂平板上的種 子生長組成,從而僅僅轉(zhuǎn)化的種子可生長為植物??蛇x地,用存在的選擇標(biāo)記比如上述那些 篩選轉(zhuǎn)化的植物。
[0066] 在DNA轉(zhuǎn)移和再生之后,也可評估推定轉(zhuǎn)化的植物,例如使用Southern分析,感 興趣的基因的存在、拷貝數(shù)和/或基因組組織。可選地或另外,可使用Nodhern和/或 Western分析監(jiān)測新引入的DNA的表達(dá)水平,兩種技術(shù)是本領(lǐng)域技術(shù)人員熟知的。
[0067] 產(chǎn)生的轉(zhuǎn)化植物可通過各種方式繁殖,比如通過克隆繁殖或經(jīng)典繁殖技術(shù)。例如, 第一代(或Tl)轉(zhuǎn)化植物可自授粉的并且可選擇純合子第二代(或T2)轉(zhuǎn)化株,和T2植物 可然后進(jìn)一步通過經(jīng)典繁殖技術(shù)繁殖。產(chǎn)生的轉(zhuǎn)化生物體可采用各種形式。例如,它們可 W是轉(zhuǎn)化細(xì)胞和非轉(zhuǎn)化細(xì)胞的嵌合體;克隆轉(zhuǎn)化株(例如,包含表達(dá)盒的所有細(xì)胞轉(zhuǎn)化); 轉(zhuǎn)化的和未轉(zhuǎn)化的組織的嫁接體(例如,植物中,嫁接至未轉(zhuǎn)化的接穗的轉(zhuǎn)化根莖)。
[0068] 如本文所使用,術(shù)語"增加的表達(dá)"或"過表達(dá)"指比初始野生型表達(dá)水平更多的 任何形式的表達(dá)。
[0069] 本領(lǐng)域充分記載了用于增加基因或基因產(chǎn)物表達(dá)的方法并且包括,例如,通過適 當(dāng)?shù)膯幼域?qū)動的過表達(dá)、使用轉(zhuǎn)錄增強(qiáng)子或翻譯增強(qiáng)子。用作啟動子或增強(qiáng)子元件的分 離的核酸可在非異源形式的多核巧酸的適當(dāng)位置(通常上游)引入,W便上調(diào)編碼感興趣 多膚的核酸的表達(dá)。例如,可通過突變、缺失和/或置換在體內(nèi)改變內(nèi)源啟動子(見,Kmiec, US5, 565, 350 ;Zarling等W093/22443),或分離的啟動子可WW適當(dāng)?shù)亩ㄏ蚝团c本發(fā)明基 因適當(dāng)?shù)木嚯x引入植物細(xì)胞,W便控制基因的表達(dá)。
[0070] 如果期望多膚表達(dá),一般期望在多核巧酸編碼區(qū)域的3'端包括多腺巧酸化區(qū)域。 多腺巧酸化區(qū)域可源自天然基因、各種其他植物基因或T-DNA。待添加的3'端序列可源自, 例如,姻脂氨酸合酶或章魚堿合酶基因,或可選地源自另一植物基因,或次優(yōu)選地源自任何 其他真核基因。
[0071] 內(nèi)含子序列也可添加至5'非翻譯區(qū)扣TR)或部分編碼序列的編碼序列,W增加積 聚在胞質(zhì)溶膠中成熟的信使的量。已經(jīng)顯示,在植物和動物表達(dá)構(gòu)建體的轉(zhuǎn)錄單元中包括 可拼接的內(nèi)含子增加在HiRNA和蛋白質(zhì)水平的基因表達(dá)至1000倍度UChman和Berg(1988) Mol.Cellbiol.8:4395-4405;Callis等(1987)GenesDev1:1183-1200)。當(dāng)布置在轉(zhuǎn) 錄單元的5'端附近時,運(yùn)樣的內(nèi)含子增強(qiáng)基因表達(dá)通常是最大的。玉米內(nèi)含子A化I-S內(nèi) 含子1、2和6,化onze-1內(nèi)含子的使用是本領(lǐng)域已知的。對于一般的信息見:TheMaize Hanclbook,116 章,Rreeling和Wa化ot,Eds.,Springer,N.Y. (1994)。
[0072] 為了測定兩個氨基酸序列或兩個核酸序列的同一性百分?jǐn)?shù),可為了最佳比較目的 而比對序列(例如,可在第一和第二氨基酸或核酸序列的之一或二者都引入空隙,W為了 最佳比對,并且為了比較目的可忽略不同的序列)。為了比較目的,比對的參考序列的長度 可W是參考序列的長度的至少95%??扇缓蟊容^相應(yīng)的氨基酸位置或核巧酸位置的氨基酸 殘基或核巧。當(dāng)?shù)谝恍蛄兄械奈恢帽坏诙蛄兄邢鄳?yīng)位置的相同氨基酸殘基或核巧酸占據(jù) 時,分子在該位置是相同的(如本文所使用,氨基酸或核酸"同一性"與氨基酸或核酸"同源 性"相同)。兩條序列之間的同一性百分?jǐn)?shù)是序列共享的相同位置數(shù)量的函數(shù),考慮需要為 了兩條序列的最佳比對引入空隙的數(shù)量,和空隙的長度。
[0073] 序列的比較和兩條序列之間的同一性百分?jǐn)?shù)的測定可使用數(shù)學(xué)算法完成。在一 種實(shí)施方式中,兩條氨基酸序列之間的同一'性百分?jǐn)?shù)可使用化edleman和Wunsch化Mol.Biol. 48:444-453(1970))算法測定,其已經(jīng)并入GCG軟件包裝的GAP程序(在http:// WWW.gcg.com可用),使用Blosum62矩陣或PAM250矩陣,和空隙權(quán)重為16、14、12、10、8、6 或4和長度權(quán)重為1、2、3、4、5或6。在仍另一優(yōu)選的實(shí)施方式中,兩條核巧酸序列之間的 同一性百分?jǐn)?shù)可使用GCG軟件包裝中的GAP程序(在http://www.gcg.com可用)測定, 使用NWSgap化a.CMP矩陣并且空隙權(quán)重為40、50、60、70或80和長度權(quán)重為1、2、3、4、5或 6。在另一實(shí)施方式中,兩條氨基酸或核巧酸序列之間的同一性百分?jǐn)?shù)可使用E.Meyers和 W.Miller(Comput)A卵 1.Biosci. 4:11-17 (1988))測定,其已經(jīng)并入ALIGN程序(版本 2. 0 或2.OU),使用PAM120權(quán)重殘基表,空隙長度罰分為12和空隙罰分為4。
[0074] 可用于測定兩條序列之間同一性的示例性計算機(jī)程序包括但不限于BLAST程序 套裝,例如,BLASTN、BLASTX和TBLASTX,BLASTP和TBLASTN,在WWW.ncbi.nlm.nih.gov/BLAST是公眾可用的。
[00巧]當(dāng)評估給定的核酸序列相對于GenBankDNA序列和其他公開數(shù)據(jù)庫的核酸序列 時,通常使用BLASTN程序進(jìn)行序列捜索。對于針對GenBank蛋白質(zhì)序列和其他公開數(shù)據(jù)庫 中的氨基酸序列捜索在所有閱讀框中翻譯的核酸序列,優(yōu)選BLASTX程序。
[0076] 為了測定兩條或更多條序列之間的"%同一性",使用例如CLUSTAL-W程序優(yōu)選的 進(jìn)行選擇序列的比對比對。
[0077] 如所闡釋,本發(fā)明的一種實(shí)施方式是編碼植物長葫黃麻和圓果種黃麻的WUSCHEL 相關(guān)的同源框4多膚的分離的多核巧酸,其包括和/或由分別如SEQIDNO2和SEQIDNO 5中闡釋的核巧酸序列組成。相應(yīng)地,由核巧酸序列編碼的各自的WUSC肥L相關(guān)的同源框4 多膚具有SEQIDNO3和SEQIDNO