亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

植物氨基酸生物合成酶的制作方法

文檔序號:452794閱讀:945來源:國知局
專利名稱:植物氨基酸生物合成酶的制作方法
技術(shù)領(lǐng)域
本發(fā)明屬于植物分子生物學(xué)領(lǐng)域。更具體地講,本發(fā)明涉及編碼參與植物和種子中氨基酸生物合成的酶的核酸片段。
背景技術(shù)
包括人在內(nèi)的許多脊椎動物缺乏產(chǎn)生多種氨基酸的能力,因此,需要將這些氨基酸預(yù)先添加到食物中。這些氨基酸被稱為必需氨基酸。源于很多谷物的人類食品和動物飼料缺乏必需氨基酸,如賴氨酸,含硫氨基酸甲硫氨酸和半胱氨酸,蘇氨酸和色氨酸,例如,在玉米(Zea mays L.)中,賴氨酸是限制很多動物飲食需求的主要的限制氨基酸,大豆(Glycine max L.)粉被用作玉米基動物飼料的添加劑,主要是補(bǔ)充賴氨酸。因此,無論提高玉米或大豆的賴氨酸含量都可降低或消除向混合谷物飼料中添加通過微生物發(fā)酵生產(chǎn)的賴氨酸的必要性。另外,對于許多動物的飲食要求來說,在玉米中,含硫的氨基酸是緊隨賴氨酸和色氨酸之后的第三個主要的限制氨基酸。將富含賴氨酸和色氨酸的大豆粉用于補(bǔ)充動物飼料中的玉米,受到大豆的低含硫氨基酸的局限。因此,無論提高玉米或大豆的含硫氨基酸的含量,都能提高其混合物的營養(yǎng)質(zhì)量,并降低通過添加更昂貴的甲硫氨酸進(jìn)一步補(bǔ)充的必要性。
賴氨酸、蘇氨酸、甲硫氨酸、半胱氨酸和異亮氨酸是源于天冬氨酸的氨基酸。該家族每一個成員的生物合成的調(diào)控是相互聯(lián)系的(參見

圖1)。提高人類食品和動物飼料的營養(yǎng)質(zhì)量的一個途徑,是通過生物合成途徑的遺傳工程提高特定游離氨基酸的生產(chǎn)和積累。改變該途徑中酶的活性,可導(dǎo)致賴氨酸、蘇氨酸、甲硫氨酸、半胱氨酸和異亮氨酸的含量改變。不過,可以得到的編碼能在植物中,特別是在玉米、大豆和小麥中調(diào)控該途徑的酶的基因很少。
導(dǎo)致賴氨酸、蘇氨酸、甲硫氨酸、半胱氨酸和異亮氨酸生物合成的途徑的組構(gòu)表明,特別是在玉米、大豆、小麥和其它作物中編碼蘇氨酸合酶、二氫吡啶二羧酸還原酶、二氨基庚二酸差向異構(gòu)酶、蘇氨酸脫氨酶和S-腺苷甲硫氨酸合酶的基因的超量表達(dá)或表達(dá)的減弱,可被用于改變這些氨基酸在人類食品和動物飼料中的含量。因此,編碼所述酶的全部或部分的核酸序列的獲得有利于開發(fā)在營養(yǎng)方面改善了的作物。
發(fā)明概述本發(fā)明涉及編碼參與氨基酸生物合成的植物酶的分離的核酸片段。具體地講,本發(fā)明涉及編碼能催化由天冬氨酸生物合成賴氨酸、蘇氨酸、甲硫氨酸、半胱氨酸和異亮氨酸的步驟的下列植物酶的分離的核酸片段二氫吡啶二羧酸還原酶、二氨基庚二酸差向異構(gòu)酶、蘇氨酸合酶、蘇氨酸脫氨酶和S-腺苷甲硫氨酸合酶。另外,本發(fā)明涉及互補(bǔ)于編碼所列舉的植物生物合成酶的核酸片段的核酸片段。
在另一個實施方案中,本發(fā)明涉及編碼上文所列舉的氨基酸生物合成酶的嵌合基因,或涉及包括互補(bǔ)于編碼所述酶的核酸片段的核酸片段的嵌合基因,所述核酸片段可操作地連接于合適的調(diào)控序列上,其中,該嵌合基因的表達(dá)會導(dǎo)致其所編碼的酶在轉(zhuǎn)化的宿主細(xì)胞中的產(chǎn)量相對在未轉(zhuǎn)化過的宿主細(xì)胞中的產(chǎn)量發(fā)生改變(即提高或降低)。
在另一個實施方案中,本發(fā)明涉及一種轉(zhuǎn)化的宿主細(xì)胞,在該細(xì)胞的基因組中包括一個可操作地連接于合適的調(diào)控序列上的編碼植物氨基酸生物合成酶的嵌合基因,所述酶選自下列一組二氫吡啶二羧酸還原酶、二氨基庚二酸差向異構(gòu)酶、蘇氨酸合酶、蘇氨酸脫氨酶和S-腺苷甲硫氨酸合酶。所述嵌合基因的表達(dá)會導(dǎo)致該生物合成酶在轉(zhuǎn)化的宿主細(xì)胞中的產(chǎn)量的改變。所述轉(zhuǎn)化的宿主細(xì)胞可源于真核或原核生物,并且包括源于高等植物和微生物的細(xì)胞。本發(fā)明還包括由高等植物的轉(zhuǎn)化的宿主細(xì)胞產(chǎn)生的轉(zhuǎn)化的植物,和源于所述轉(zhuǎn)化的植物的種子。
本發(fā)明的另一個實施方案涉及一種改變一種生物合成酶在轉(zhuǎn)化過的宿主細(xì)胞中的表達(dá)水平的方法,該方法包括a)用一個嵌合基因轉(zhuǎn)化宿主細(xì)胞,該嵌合基因包括編碼選自二氫吡啶二羧酸還原酶、二氨基庚二酸差向異構(gòu)酶、蘇氨酸合酶、蘇氨酸脫氨酶和S-腺苷甲硫氨酸合酶的植物生物合成酶的核酸片段,該核酸片段可操作地連接于合適的調(diào)控序列上;和b)在適于表達(dá)所述嵌合基因的條件下生長所述轉(zhuǎn)化的宿主細(xì)胞,其中,所述嵌合基因的表達(dá)會導(dǎo)致在所述轉(zhuǎn)化的宿主細(xì)胞中所述生物合成酶的產(chǎn)量的改變。
本發(fā)明的另一個實施方案涉及用于獲得編碼植物二氫吡啶二羧酸還原酶、二氨基庚二酸差向異構(gòu)酶、蘇氨酸合酶、蘇氨酸脫氨酶和S-腺苷甲硫氨酸合酶的全部或接近全部氨基酸序列的核酸片段的方法。
本發(fā)明的另一個實施方案是一種用于評價至少一種化合物的抑制選自二氫吡啶二羧酸還原酶、二氨基庚二酸差向異構(gòu)酶、蘇氨酸合酶、蘇氨酸脫氨酶和S-腺苷甲硫氨酸合酶的植物生物合成酶的活性的能力的方法,該方法包括以下步驟(a)用一個嵌合基因轉(zhuǎn)化宿主細(xì)胞,該嵌合基因包括編碼選自二氫吡啶二羧酸還原酶、二氨基庚二酸差向異構(gòu)酶、蘇氨酸合酶、蘇氨酸脫氨酶和S-腺苷甲硫氨酸合酶的植物生物合成酶的核酸片段,該核酸片段可操作地連接于合適的調(diào)控序列上;(b)在適于表達(dá)所述嵌合基因的條件下生長所述轉(zhuǎn)化的宿主細(xì)胞,其中,該嵌合基因的表達(dá)會導(dǎo)致在所述轉(zhuǎn)化的宿主細(xì)胞中產(chǎn)生所述生物合成酶;(c)可任選地純化由所述轉(zhuǎn)化的宿主細(xì)胞表達(dá)的生物合成酶;(d)用一種待測試的化合物處理所述生物合成酶;和(e)比較用測試化合物處理過的所述生物合成酶的活性和未處理過的生物合成酶的活性,以便篩選具有抑制活性潛力的化合物。
附圖的簡要說明和序列說明通過以下詳細(xì)說明,以及附圖和序列說明,可以更完整地理解本發(fā)明,所述附圖和序列說明構(gòu)成本申請的一部分。
圖1表示氨基酸的天冬氨酸家族的生物合成途徑。使用了以下縮略語AK=天冬氨酸激酶;ASADH=天冬氨酸半醛脫氫酶;DHDPS=二氫吡啶二羧酸合酶;DHDPR=二氫吡啶二羧酸還原酶;DAPEP=二氨基庚二酸差向異構(gòu)酶;DAPDC=二氨基庚二酸脫羧酶;HDH=高絲氨酸脫氫酶;HK=高絲氨酸激酶;TH=蘇氨酸合酶;TD=蘇氨酸脫氨酶;CγS=胱硫醚γ-合酶;CβL-胱硫醚β-裂合酶;MS=甲硫氨酸合酶;CS=半胱氨酸合酶;和SAMS=S-腺苷甲硫氨酸合酶。
圖2表示本文所披露的編碼二氫吡啶二羧酸還原酶(序列2和4)和在DDBJ保藏號D90899中所提供集胞藻二氫吡啶二羧酸還原酶序列(序列5)的氨基酸序列片段的多項比較。
圖3表示本文所披露的編碼二氨基庚二酸差向異構(gòu)酶(序列7、9、11和13)和在DDBJ保藏號D90917中所提供集胞藻二氨基庚二酸差向異構(gòu)酶序列(序列14)的氨基酸序列片段的多項比較。
圖4表示本文所披露的編碼蘇氨酸合酶(序列16、18、20、22、24、和26)和在GenBank保藏號L41666中所提供擬南芥(Arabidopsisthaliana)蘇氨酸合酶序列(序列27)的氨基酸序列片段的多項比較。
圖5表示本文所披露的編碼蘇氨酸脫氨酶(序列29、31和33)和在GenBank保藏號U40630中所提供Brukholderia capacia蘇氨酸合酶序列(序列34)的氨基酸序列片段的多項比較。
圖6表示本文所披露的玉米S-腺苷甲硫氨酸合酶(序列35)和在EMBL保藏號Z26867中所提供的水稻(Oryza sativa)S-腺苷甲硫氨酸合酶核苷酸序列(序列37)的核苷酸序列比較。
圖7表示本文所披露的大豆S-腺苷甲硫氨酸合酶(序列38)和在EMBL保藏號Z24741中所提供的番茄(Lycopersicon esculentum)S-腺苷甲硫氨酸合酶核苷酸序列(序列40)的核苷酸序列比較。
圖8表示本文所披露的小麥S-腺苷甲硫氨酸合酶(序列41)和在DDBJ保藏號D63835中所提供的大麥(Hordeum vulgare)S-腺苷甲硫氨酸合酶核苷酸序列(序列43)的核苷酸序列比較。
氨基酸序列比較是用獲自LASARGENE生物信息學(xué)計算機(jī)程序組的Megalign程序(DNASTAR公司,Madison,WI)的Clustal比較方法(Higgins,D.G.和Sharp,P.M.(1989)CABIOS5151-153)進(jìn)行的。
下面的序列說明和本文所附的序列表符合在37C.F.R.§1.821-1.825中所規(guī)定的專利申請中核苷酸和/或氨基酸序列說明的有關(guān)規(guī)定。
序列1是編碼玉米二氫吡啶二羧酸還原酶的核苷酸序列,該核苷酸序列包括克隆csiln.pk0042.a3上的整個cDNA插入片段。
序列2是源于序列1的核苷酸序列的一部分玉米二氫吡啶二羧酸還原酶的推定的氨基酸序列。
序列3是編碼稻二氫吡啶二羧酸還原酶的核苷酸序列,該核苷酸序列包括克隆rls2.pk0017.d3上的一部分cDNA插入片段。
序列4是源于序列3的核苷酸序列的一部分稻二氫吡啶二羧酸還原酶的推定的氨基酸序列。
序列5是完整的集胞藻二氫吡啶二羧酸還原酶DDBJ保藏號D90899的氨基酸序列。
序列6是編碼玉米二氨基庚二酸差向異構(gòu)酶的核苷酸序列,該核苷酸序列含有克隆chp2.pk0008.h4上的整個cDNA插入片段。
序列7是源于序列6的核苷酸序列的一部分玉米二氨基庚二酸差向異構(gòu)酶的推定的氨基酸序列。
序列8是編碼稻二氨基庚二酸差向異構(gòu)酶的核苷酸序列,該核苷酸序列包括克隆rls48.pk0036.h10上的一部分cDNA插入片段。
序列9是源于序列8的核苷酸序列的一部分稻二氨基庚二酸差向異構(gòu)酶的推定的氨基酸序列。
序列10是編碼大豆二氨基庚二酸差向異構(gòu)酶的核苷酸序列,該核苷酸序列包括由sfll.pk0031.h3、sgslc.pk002.k12部分構(gòu)成的重疊群,和源于克隆se2.pk0005.fl、ses8w.pk0010.h11的完整cDNA插入片段。
序列11是源于序列10的核苷酸序列的大豆二氨基庚二酸差向異構(gòu)酶的推定氨基酸序列。
序列12是編碼小麥二氨基庚二酸差向異構(gòu)酶的核苷酸序列,該核苷酸序列包括克隆wlm24.pk0030.g4上的一部分cDNA插入片段。
序列13是源于序列12的核苷酸序列的一部分小麥二氨基庚二酸差向異構(gòu)酶的推定的氨基酸序列。
序列14是包括整個集胞藻二氨基庚二酸差向異構(gòu)酶DDBJ保藏號D90917的核苷酸序列。
序列15是編碼玉米蘇氨酸合酶的核苷酸序列,該核苷酸序列包括克隆cc2.pk0031.c9上的完整cDNA插入片段。
序列16是源于序列15的核苷酸序列的一部分玉米蘇氨酸合酶的推定的氨基酸序列。
序列17是編碼玉米蘇氨酸合酶的核苷酸序列,該核苷酸序列包括克隆cs1.pk0058.g5上的cDNA插入片段的一部分。
序列18是源于序列17的核苷酸序列的一部分玉米蘇氨酸合酶的推定的氨基酸序列。
序列19是編碼稻蘇氨酸合酶的核苷酸序列,該核苷酸序列包括克隆rls72.pk0018.e7上的cDNA插入片段的一部分。
序列20是源于序列19的核苷酸序列的一部分稻蘇氨酸合酶的推定的氨基酸序列。
序列21是編碼大豆蘇氨酸合酶的核苷酸序列,該核苷酸序列包括克隆sel.06a03上的cDNA插入片段的一部分。
序列22是源于序列21的核苷酸序列的一部分大豆蘇氨酸合酶的推定的氨基酸序列。
序列23是編碼大豆蘇氨酸合酶的核苷酸序列,該核苷酸序列包括克隆srl.pk0003.f6上的完整cDNA插入片段。
序列24是源于序列23的核苷酸序列的一部分大豆蘇氨酸合酶的推定的氨基酸序列。
序列25是編碼小麥蘇氨酸合酶的核苷酸序列,該核苷酸序列包括克隆wrl.pk0085.h2上的cDNA插入片段的一部分。
序列26是源于序列25的核苷酸序列的小麥蘇氨酸合酶的一部分的推定氨基酸序列。
序列27是存在于GenBank保藏號L41666中的擬南芥蘇氨酸合酶的完整氨基酸序列。
序列28是編碼玉米蘇氨酸脫氨酶的核苷酸序列,該核苷酸序列包括克隆cenl.pk0064.f4上的完整cDNA插入片段。
序列29是源于序列28的核苷酸序列的玉米蘇氨酸脫氨酶的一部分的推定氨基酸序列。
序列30是編碼大豆蘇氨酸脫氨酶的核苷酸序列,該核苷酸序列包括克隆sfl1.pk0055.h7上的cDNA插入片段的一部分。
序列31是源于序列30的核苷酸序列的大豆蘇氨酸脫氨酶的一部分的推定氨基酸序列。
序列32是編碼大豆蘇氨酸脫氨酶的核苷酸序列,該核苷酸序列包括克隆sre.pk0044.f3上的完整cDNA插入片段。
序列33是源于序列32的核苷酸序列的大豆蘇氨酸脫氨酶的一部分的推定氨基酸序列。
序列34是存在于GenBank保藏號U49630中的Brukholderiacapacia蘇氨酸脫氨酶的完整氨基酸序列。
序列35是編碼完整玉米S-腺苷甲硫氨酸合酶的核苷酸序列,該序列包括克隆cc3.mn002.d2上的完整cDNA插入片段。
序列36是源于序列35的核苷酸序列的玉米S-腺苷甲硫氨酸合酶的推定氨基酸序列。
序列37是存在于EMBL保藏號Z26867中的稻S-腺苷甲硫氨酸合酶的完整氨基酸序列。
序列38是編碼完整大豆S-腺苷甲硫氨酸合酶的克隆s2.12b06上的完整cDNA插入片段的核苷酸序列。
序列39是源于序列38的核苷酸序列的完整大豆S-腺苷甲硫氨酸合酶的推定氨基酸序列。
序列40是存在于EMBL保藏號Z24741中的番茄S-腺苷甲硫氨酸合酶的完整核苷酸序列。
序列41是編碼小麥S-腺苷甲硫氨酸合酶的一部分的核苷酸序列,該核苷酸序列包括由克隆wre1.pk0002.c12、wle1n.pk0070.b8、wkm1c.pk0003.g4、wlk1.pk0028.d3、wre1n.pk170.d8、wrl.pk0086.d5、wrl.pk0103.h8和wre1n.pk0082.b2上的cDNA插入片段部分構(gòu)成的重疊群。
序列42是源于序列41的核苷酸序列的小麥S-腺苷甲硫氨酸合酶的推定氨基酸序列。
序列43是存在于DDBJ保藏號D63835中的大麥S-腺苷甲硫氨酸合酶的完整核苷酸序列。
所述序列說明包括用于核苷酸序列特征的一個字母密碼,和用于氨基酸的三字母密碼,其定義與披露于核酸研究133021-3030(1985)和披露于生物化學(xué)雜志219(№2);345-373(1984)中的IUPAC-IYUB標(biāo)準(zhǔn)一致,以上文獻(xiàn)被收作本文的參考文獻(xiàn)。用于核苷酸和氨基酸序列資料的符號和形式符合37C.F.R.§1.822中的規(guī)定。
發(fā)明詳述在本說明書的正文中,將使用多個術(shù)語,在本文中,“分離的核酸片段”是單鏈或雙鏈RNA或DNA聚合物,它可任選地含有合成的、非天然的、或改變過的核苷酸堿基。DNA聚合物形式的分離的核酸片段可以包括一個或幾個cDNA、基因組DNA或合成DNA片段。在本文中,“重疊群”是指構(gòu)成一個連續(xù)的核苷酸序列的重疊核酸序列的組合。例如,可以對若干DNA序列進(jìn)行比較和排列,以便鑒定共有的或重疊的片段。然后可以將單個序列組合成一個連續(xù)的核苷酸序列。
在本文中,“大體上相同”是指這樣的核苷酸片段,其中,一個或幾個核苷酸堿基的改變會導(dǎo)致一個或幾個氨基酸的取代,但不會影響由該DNA編碼的蛋白的功能特性?!按篌w上相同”還指這樣的核酸片段,其中,一個或幾個核苷酸堿基的改變不會通過反義或共抑制技術(shù)影響該核酸片段介導(dǎo)基因表達(dá)改變的能力?!按篌w上相同”還指通過反義或共抑制技術(shù)修飾本發(fā)明的核酸片段,如缺失或插入一個或幾個大體上不會影響所產(chǎn)生的轉(zhuǎn)錄物的功能特性即介導(dǎo)基因表達(dá)改變的能力的核苷酸,或改變所產(chǎn)生的蛋白分子的功能特性。因此,可以理解成本發(fā)明包括除特定示例性序列之外的序列。
例如,在本領(lǐng)域中,眾所周知的是,基因表達(dá)的反義抑制和共抑制可以使用不足于表現(xiàn)一個基因的完整編碼區(qū)的核酸片段實現(xiàn),并可以通過與待抑制的基因相比沒有100%的同一性的核酸片段實現(xiàn)。而且,眾所周知的是,基因的改變可以在特定位點產(chǎn)生在化學(xué)上等同的氨基酸,而不會影響其編碼蛋白的功能特性。因此,編碼氨基酸丙氨酸(一種疏水性氨基酸)的密碼子可以被編碼諸如甘氨酸的其它疏水性較低的殘基的密碼子取代,或被編碼諸如纈氨酸、亮氨酸、或異亮氨酸的疏水性較高的殘基的密碼子取代。類似地,會導(dǎo)致由一種帶負(fù)電荷的殘基取代另一種帶負(fù)電荷的殘基,如由天冬氨酸取代谷氨酸,或一種帶正電荷的殘基取代另一種的正電荷的殘基,如由賴氨酸取代精氨酸的變化還可以預(yù)期產(chǎn)生功能性等同產(chǎn)物。會導(dǎo)致蛋白分子的N-末端和C-末端部分的變化的核苷酸改變也有可能不會改變該蛋白的活性。上面所提出的每一種修飾都屬于本領(lǐng)域的常規(guī)技術(shù),正如所述編碼產(chǎn)物的生物學(xué)活性的保留的確定。而且,技術(shù)人員可以理解的是,本發(fā)明所包括的大體上相同的序列還可以通過其在嚴(yán)格條件下(0.1×SSC,0.1%SDS,65℃)與本文所披露的序列雜交的能力限定。本發(fā)明的優(yōu)選大體上相同的核酸片段是這樣的核酸片段其DNA序列與本文所披露的核酸片段的DNA序列具有80%的同一性。更優(yōu)選的核酸片段與本文所披露的核酸片段的DNA序列具有90%的同一性。最優(yōu)選的核酸片段與本文所披露的核酸片段的DNA序列具有95%的同一性。所述Clustal多項比較算法(Higgins,D.G.Sharp,P.M.(1989)CABIOS 5151-153)使用10的GAP PENALTY和10的GAP LENGTHPENALTY。
氨基酸或核苷酸序列的“主要部分”包括一種多肽的足夠的氨基酸序列或一個基因的足夠的核苷酸序列,以便能夠由本領(lǐng)域技術(shù)人員通過人工方法評價所述序列或通過計算機(jī)自動化序列比較方法對所述多肽或基因進(jìn)行推定性鑒定,并使用諸如BLAST(基礎(chǔ)位點排列檢索工具;Altschul,S.F.等,(1993)分子生物學(xué)雜志215403-410;還可參見www.ncbi.nlm.nih.gov/BLAST/)的算法鑒定。一般,為了推定性鑒定一個多肽或核酸序列與已知蛋白或基因的同一性,需要10個或10個以上連續(xù)的氨基酸,或30個或30個以上的核苷酸。而且,對核苷酸序列來說,可將包括20-30個連續(xù)核苷酸的基因特異性寡核苷酸探針用于基因鑒定的序列依賴型方法(例如,Southern雜交)和分離(例如,細(xì)菌菌落或噬菌體噬斑的原位雜交)。另外,可將12-15個堿基的短的寡核苷酸用作PCR的擴(kuò)增引物,以便獲得包括該引物的特定核酸片段。因此,核酸序列的“主要部分”包括足于對含有該序列的核酸片段進(jìn)行特定鑒定和/或分離的該序列的足夠部分。本說明書披露了編碼一種或幾種特定植物蛋白的部分或全部氨基酸和核苷酸序列。獲得了本文所披露的序列的技術(shù)人員,可將所披露的序列的全部或主要部分用于本領(lǐng)域技術(shù)人員所公知的目的。因此,本發(fā)明包括在所附序列表中所披露的完整序列,還包括如上文定義的這些序列的主要部分。
“密碼子簡并性”是指遺傳密碼的趨異,核苷酸序列可以變化,而不會影響編碼多肽的氨基酸序列。因此,本發(fā)明涉及編碼在序列2、4、7、9、11、13、16、18、20、22、24、26、29、31、和33中示出的氨基酸生物合成酶的氨基酸序列的全部或主要部分的所有核酸片段。技術(shù)人員十分了解在使用核苷酸密碼子表示特定氨基酸時,由特定宿主細(xì)胞表現(xiàn)的“密碼子偏倚”。因此,為了改善在宿主細(xì)胞中的表達(dá)而合成一個基因時,需要對該基因進(jìn)行設(shè)計,以便其密碼子使用頻率接近該宿主細(xì)胞的優(yōu)選密碼子使用頻率。
“合成基因”可以由寡核苷酸結(jié)構(gòu)模塊組建,所述模塊是用本領(lǐng)域技術(shù)人員公知的方法化學(xué)合成的。連接所述結(jié)構(gòu)模塊,并退火,以便形成基因片段,然后對其進(jìn)行酶促組合,以便構(gòu)建完整基因。與DNA序列相關(guān)的“化學(xué)合成”是指其元件核苷酸是在體外組裝的。DNA的人工化學(xué)合成可以用已成型的方法完成,或者可以用多種市售儀器中的一種進(jìn)行自動化學(xué)合成。因此,可以根據(jù)為了反映有關(guān)宿主細(xì)胞的密碼子偏倚而進(jìn)行的核苷酸序列優(yōu)化對所述基因進(jìn)行修飾,以便優(yōu)化基因表達(dá)。技術(shù)人員可以理解,如果密碼子使用偏向該宿主偏好的密碼子,基因表達(dá)有可能成功。優(yōu)選密碼子的確定可基于源于所述宿主細(xì)胞的基因的篩選,所述基因的序列資料是已知的。
“基因”是指能表達(dá)一種特定蛋白的核酸片段,包括位于編碼序列之前的調(diào)控序列(5’非編碼序列)和位于編碼序列之后的調(diào)控序列(3’非編碼序列)?!疤烊换颉笔侵柑烊淮嬖诘木哂衅渥陨淼恼{(diào)控序列的基因。“嵌合基因”是指所有非天然基因,它包括在自然界中并非同時出現(xiàn)的調(diào)控序列和編碼序列。因此,嵌合基因可以包括源于不同來源的調(diào)控序列和編碼序列,或者調(diào)控序列和編碼序列源于相同來源,但其排列方式不同于天然狀態(tài)。
“內(nèi)源基因”是指存在于一種生物的基因組中的天然位點上的天然基因?!巴庠椿颉笔侵刚G闆r下不存在于宿主生物中的基因,而是通過基因轉(zhuǎn)移方法將其導(dǎo)入該宿主生物中。外源基因可以包括插入非天然生物中的天然基因或嵌合基因。“轉(zhuǎn)基因”是指通過轉(zhuǎn)化方法導(dǎo)入基因組中的基因。
“編碼序列”是指編碼一種特定氨基酸序列的DNA序列?!罢{(diào)控序列”是指位于一個編碼序列的上游(5’非編碼序列)、內(nèi)部、或下游(3’非編碼序列)的核苷酸序列,它能影響相關(guān)編碼序列的轉(zhuǎn)錄、RNA加工或穩(wěn)定性、或翻譯。調(diào)控序列可以包括啟動子、翻譯前導(dǎo)序列、內(nèi)含子、和聚腺苷酸化識別序列。
“啟動子”是指能夠控制編碼序列或功能性RNA表達(dá)的DNA序列。編碼序列位于啟動子序列的3’末端。所述啟動子序列包括接近的和較遠(yuǎn)的上游因子,較遠(yuǎn)的上游因子通常被稱作增強(qiáng)子。因此,“增強(qiáng)子”是能夠促進(jìn)啟動子活性的DNA序列,并可以是該啟動子的天然因子,或者是被插入的異源因子,以便增強(qiáng)啟動子的水平或組織特異性。啟動子可以其整體形式源于天然基因,或者由源于天然存在的不同啟動子的不同因子組成,或者甚至包括合成DNA片段,本領(lǐng)域技術(shù)人員可以理解的是,不同啟動子可以指導(dǎo)一個基因在不同類型組織或細(xì)胞中表達(dá),或者在發(fā)育的不同時期表達(dá),或者根據(jù)不同的環(huán)境條件表達(dá)。能導(dǎo)致一個基因在大部分時間里在大多數(shù)細(xì)胞類型中表達(dá)的啟動子通常被稱為“組成型啟動子”??捎糜谥参锛?xì)胞中的各種類型的新型啟動子正被不斷地發(fā)現(xiàn);在Okamuro和Goldberg(1989)(植物生物化學(xué)151-82)編譯的文章中披露了多種例子。還可以理解的是,由于在大多數(shù)情況下,調(diào)控序列的實際邊界并未完全確定,不同長度的DNA片段可能具有相同的啟動子活性。
“翻譯前導(dǎo)序列”是指位于一個基因的啟動子序列和編碼序列之間的DNA序列。翻譯前導(dǎo)序列存在于翻譯起始序列上游的充分加工過的mRNA中。翻譯前導(dǎo)序列可以影響初級轉(zhuǎn)錄物向mRNA的加工,mRNA穩(wěn)定性或翻譯效率。翻譯前導(dǎo)序列的例子業(yè)已被披露(Turner,R.和Foster,G.D.(1995)分子生物技術(shù)3225)。
“3’非編碼序列”是指位于編碼序列下游的DNA序列,它包括聚腺苷酸化識別序列和編碼能夠影響mRNA加工或基因表達(dá)的調(diào)控信號的其它序列。所述聚腺苷酸化信號的特征通常是能影響在mRNA前體的3’末端添加聚腺苷酸尾。Ingelbrecht等披露了不同3’非編碼序列的使用(1989,植物細(xì)胞1671-680)。
“RNA轉(zhuǎn)錄物”是指由RNA聚合酶催化的DNA序列的轉(zhuǎn)錄所產(chǎn)生的產(chǎn)物。當(dāng)RNA轉(zhuǎn)錄物是所述DNA序列的完整的互補(bǔ)拷貝時,它被稱為初級轉(zhuǎn)錄物,或者它可以是源于所述初級轉(zhuǎn)錄物的轉(zhuǎn)錄后加工的RNA序列,并被稱為成熟RNA?!靶攀筊NA(mRNA)”是指不具有內(nèi)含子、并且能被細(xì)胞翻譯成蛋白的RNA?!癱DNA”是指源于mRNA并互補(bǔ)于mRNA的雙鏈DNA。“有義RNA”是指包括mRNA的RNA轉(zhuǎn)錄物,因此可以被細(xì)胞翻譯成蛋白?!胺戳xRNA”是指互補(bǔ)于靶初級轉(zhuǎn)錄物或mRNA的全部或部分的RNA轉(zhuǎn)錄物,它能抑制靶基因的表達(dá)(US5,107,065)。反義RNA的互補(bǔ)性可以是針對特定基因轉(zhuǎn)錄物的任何部分,即5’非編碼序列、3’非編碼序列、內(nèi)含子、或編碼序列。“功能性RNA”是指反義RNA,核酶RNA、或者尚未翻譯的對細(xì)胞加工具有影響的其它RNA。
“可操作地連接”是指核酸序列與單一核酸片段的連接,使其中一個的功能受到另一個的影響。例如,當(dāng)一個啟動子能夠影響其編碼序列的表達(dá)時該啟動子與該編碼序列是可操作地連接的(即該編碼序列受該啟動子的轉(zhuǎn)錄控制)。編碼序列可以沿有義或反義取向連接于調(diào)控序列上。
本文所說的“表達(dá)”一詞是指源于本發(fā)明核酸片段的有義(mRNA)或反義RNA的轉(zhuǎn)錄和穩(wěn)定積累。表達(dá)也可以指mRNA翻譯成多肽?!胺戳x抑制”是指產(chǎn)生能夠抑制靶蛋白表達(dá)的反義RNA轉(zhuǎn)錄物?!俺勘磉_(dá)”是指一種基因在轉(zhuǎn)基因生物中的產(chǎn)量超過了在正?;蚍寝D(zhuǎn)化生物中的產(chǎn)量?!肮惨种啤笔侵改軌蛞种葡嗤幕虼篌w上相同的外源或內(nèi)源基因表達(dá)的有義RNA轉(zhuǎn)錄物的產(chǎn)生(US5,231,020)。
“改變了的水平”是指在轉(zhuǎn)基因生物中產(chǎn)生的基因產(chǎn)物的數(shù)量或比例不同于正?;蚍寝D(zhuǎn)化生物中的數(shù)量或比例。
“成熟”蛋白是指翻譯后加工過的多肽;即業(yè)已除去了存在于初級翻譯產(chǎn)物上的前肽或原肽的多肽?!扒绑w蛋白”是指mRNA翻譯的初級產(chǎn)物;即仍然存在前肽和原肽。前肽和原肽可以是胞內(nèi)定位的信號,但并非局限于此。
“葉綠體轉(zhuǎn)運肽”是與一種蛋白一起翻譯的氨基酸序列,它可以將所述蛋白引導(dǎo)到葉綠體中或存在于產(chǎn)生該蛋白的細(xì)胞中的其它類型質(zhì)體中?!叭~綠體轉(zhuǎn)運序列”是指編碼葉綠體轉(zhuǎn)運肽的核苷酸序列?!靶盘栯摹笔桥c一種蛋白一起翻譯的氨基酸序列,它可將該蛋白引導(dǎo)至其分泌系統(tǒng)(Chrispeels,J.J.,(1991)植物生理學(xué)植物分子生物學(xué)年度綜述4221-53)。如果所述蛋白將被引導(dǎo)至液泡,還可以增加一個液泡定向信號(同上),或者如果將被引導(dǎo)至內(nèi)質(zhì)網(wǎng),可以添加內(nèi)質(zhì)網(wǎng)保留信號(同上)。如果所述蛋白將被引導(dǎo)至細(xì)胞核,所存在的所有信號肽都應(yīng)當(dāng)被除去,并代之以包括一個細(xì)胞核定位信號(Raikhel(1992)植物生理學(xué)1001627-1632)。
“轉(zhuǎn)化”是指將一個核酸片段轉(zhuǎn)移到一種宿主生物的基因組中,導(dǎo)致遺傳學(xué)上的穩(wěn)定遺傳。含有轉(zhuǎn)化的核酸片段的宿主生物被稱作“轉(zhuǎn)基因”生物。植物轉(zhuǎn)化的例子包括農(nóng)桿菌屬介導(dǎo)的轉(zhuǎn)化(DeBlaere等(1987)酶學(xué)方法143277)和粒子加速或“基因槍”轉(zhuǎn)化技術(shù)(Klein等(1987)自然(倫敦)32770-73;US4,945,050)。本發(fā)明所使用的標(biāo)準(zhǔn)重組DNA和分子克隆技術(shù)是本領(lǐng)域中眾所周知的,并且在Sambrook,J.,F(xiàn)ritsch,E.F.和Maniatis,T.的著述中有更詳細(xì)的說明(分子克隆實驗室手冊;冷泉港實驗室出版社冷泉港,1989,以下稱之為“Maniatis”)。
通過利用本領(lǐng)域技術(shù)人員熟知的BLAST算法將隨機(jī)植物cDNA序列與含有核苷酸和蛋白序列的公開數(shù)據(jù)庫進(jìn)行比較,業(yè)已分離并鑒定了編碼幾種植物氨基酸生物合成酶的至少一部分的核酸片段。表1中給出了本文所披露的氨基酸生物合成酶,以及包括編碼這些酶的核酸片段的cDNA克隆的名稱。
表1氨基酸生物合成酶酶 克隆植物二氫吡啶二羧酸還原酶 csl.pk0083.b10玉米rls2.pk0017.d3稻二氨基庚二酸差向異構(gòu)酶chp2.pk0008.h4玉米rls48.pk0036.h10 稻se2.pk0005.f1 大豆ses8w.pk0010.f11 大豆sfl1.pk0031.h3大豆sgs1c.pk002.k12 大豆wlm24.pk0030.g4 小麥蘇氨酸合酶cc2.pk0031.c9 玉米csl.pk0058.g5 玉米rls72.pk0018.e7 稻sel.06a03 大豆srl.pk0003.f6 大豆wrl.pk0085.h2 小麥蘇氨酸脫氨酶 cen1.pk0064.f4玉米sfl1.pk0055.h7大豆sre.pk0044.f3 大豆S-腺苷甲硫氨酸合酶cc3.mn0002.d2 玉米se2.12b06 大豆
wrel.pk0002.c12小麥wle1n.pk0070.b8小麥wkm1c.pk0003.g4小麥wlk1.pk0028.d3 小麥wreln.pk170.d8 小麥wrl.pk0086.d5 小麥wrl.pk0103.h8 小麥wreln.pk0082.b2小麥可將本發(fā)明的核酸片段用于分離編碼源于相同或其它植物種的同源酶的cDNA和基因。用序列依賴型方法分離同源基因在本領(lǐng)域中是眾所周知的。序列依賴型方法的例子包括,但不限于核酸雜交方法,以及由各種核酸擴(kuò)增技術(shù)應(yīng)用所披露的的DNA和RNA擴(kuò)增方法(例如聚合酶鏈?zhǔn)椒磻?yīng),連接酶鏈?zhǔn)椒磻?yīng))。
例如,編碼其它氨基酸生物合成酶的基因無論是cDNA或基因組DNA都可以用本發(fā)明的核酸片段的全部或一部分作為DNA雜交探針篩選源于任何希望的植物的文庫而直接分離,可以采用本領(lǐng)域技術(shù)人員所熟知的方法。所使用的特定寡核苷酸探針可以通過本領(lǐng)域公知方法(Maniatis)設(shè)計并合成。另外,可以用本領(lǐng)域技術(shù)人員公知的方法將其完整序列用于直接合成DNA探針,如隨機(jī)引物DNA標(biāo)記,缺口翻譯,或末端標(biāo)記技術(shù),或使用現(xiàn)有體外轉(zhuǎn)錄系統(tǒng)的RNA探針。另外,可以設(shè)計特定引物并將其用于擴(kuò)增本發(fā)明序列的一部分或完整長度??梢栽跀U(kuò)增反應(yīng)期間直接標(biāo)記所得到的擴(kuò)增產(chǎn)物,或者在擴(kuò)增反應(yīng)之后進(jìn)行標(biāo)記,并用作探針在適當(dāng)嚴(yán)格性的條件下分離完整長度cDNA或基因組片段。
另外,可將本發(fā)明核酸片段的兩個短的片段用于聚合酶鏈?zhǔn)椒磻?yīng)方法中,用于擴(kuò)增編碼源于DNA或RNA的同源基因的較長的核酸片段。所述聚合酶鏈?zhǔn)椒磻?yīng)還可以在克隆的核酸片段的文庫上進(jìn)行,其中,一個引物的序列源于本發(fā)明的核酸片段,而另一個引物的序列利用了聚腺苷酸尾在編碼植物基因的mRNA前體的3’末端的存在。另外,所述第二引物序列可以基于源于克隆載體的序列。例如,技術(shù)人員可以按照RACE方法(Frohman等(1988)PNAS USA858998)制備cDNA,利用PCR擴(kuò)增位于所述轉(zhuǎn)錄物的單一點和其3’或5’末端之間的片段的拷貝。可以由本發(fā)明序列設(shè)計沿3’和5’方向取向的引物。利用市售3’RACE或5’RACE系統(tǒng)(BRL)可以分離特定的3’或5’cDNA片段(Ohara等(1989)PNAS USA865673;Loh等(1989)科學(xué)243217)??梢詫⑼ㄟ^3’和5’RACE方法制備的產(chǎn)物進(jìn)行組合,以便制備完整長度的cDNA(Frohman,M.A.和Martin,G.R.(1989)技術(shù)1165)。
獲得本發(fā)明核苷酸和推定氨基酸序列有利于免疫篩選cDNA表達(dá)文庫??梢院铣纱肀景l(fā)明氨基酸序列一部分的合成肽??梢杂眠@種肽免疫動物,以便產(chǎn)生對含有所述氨基酸序列的肽或蛋白有專一性的多克隆或單克隆抗體。然后可將這些抗體用于篩選cDNA表達(dá)文庫,以便分離感興趣的完整長度cDNA克隆(Lerner,R.A.(1984)免疫學(xué)進(jìn)展361Maniatis)。
可將本發(fā)明的核酸片段用于制備轉(zhuǎn)基因植物,其中,所披露的生物合成酶能以高于或低于正常含量的量存在,或存在于正常情況下不存在它們的細(xì)胞類型或發(fā)育階段。它所具有的作用是改變游離氨基酸在所述細(xì)胞中的含量。
本發(fā)明生物合成酶的超量表達(dá)可以通過首先構(gòu)建嵌合基因而實現(xiàn),其中,該嵌合基因的編碼區(qū)可操作地連接于能夠指導(dǎo)一個基因在需要的組織中、在需要的發(fā)育階段表達(dá)的啟動子上。為方便起見,所述嵌合基因可以包括源于相同基因的啟動子序列和翻譯前導(dǎo)序列。還可以提供編碼轉(zhuǎn)錄終止信號的3’非編碼序列。本發(fā)明嵌合基因還可以包括一個或幾個內(nèi)含子,以便促進(jìn)基因的表達(dá)。
然后可以構(gòu)建包括本發(fā)明嵌合基因的質(zhì)粒載體。質(zhì)粒載體的選擇取決于將被用于轉(zhuǎn)化宿主植物的方法。技術(shù)人員十分了解,所述遺傳因子必須存在于所述質(zhì)粒載體上,以便能夠成功地轉(zhuǎn)化、篩選和繁殖含有所述嵌合基因的宿主細(xì)胞。技術(shù)人員還可以理解,不同的獨立的轉(zhuǎn)化過程會導(dǎo)致表達(dá)水平和方式的不同(Jones等(1985)EMBO雜志42411-2418;De Almeida等(1989)分子和普通遺傳學(xué)21878-86),因此,必須篩選多種過程,以便獲得具有所需要的表達(dá)水平和方式的品系。所述篩選可以通過DNA的Southern分析、mRNA表達(dá)的Northern分析、蛋白表達(dá)的Western分析、或表型分析而實現(xiàn)。
對某些用途來說,將本發(fā)明的生物合成酶引導(dǎo)至不同的細(xì)胞區(qū)室或者促進(jìn)其從細(xì)胞中分泌可能是有用的。因此,設(shè)想上述嵌合基因可以通過改變編碼酶的編碼序列而進(jìn)一步改進(jìn),通過添加合適的細(xì)胞內(nèi)靶序列,如轉(zhuǎn)運序列(Keegstra,K.(1989)細(xì)胞56247-253),信號序列或編碼內(nèi)質(zhì)網(wǎng)定位的序列(Chrispeels,J.J.(1991)植物生理學(xué)植物分子生物學(xué)年度綜述4221-53),或細(xì)胞核定位信號(Raikhel,N.(1992)植物生理學(xué)1001627-1632)和/或除去已經(jīng)存在的靶序列。盡管所引用的參考文獻(xiàn)給出了所述每一種信號的例子,但其所給出的例子并非窮舉,并且,將來可能發(fā)現(xiàn)更多的有用定向信號。
在某些場合下,可能需要在植物中減弱或消除編碼本發(fā)明生物合成酶的基因的表達(dá)。為了實現(xiàn)這一目的,可以通過將編碼所述酶的基因或基因片段連接到植物啟動子序列上構(gòu)建被設(shè)計用于共抑制本發(fā)明生物合成酶的嵌合基因。另外,可以通過將所述基因或基因片段沿反向取向連接于植物啟動子序列上,構(gòu)建為了表達(dá)本發(fā)明核酸片段的全部或部分的反義RNA而設(shè)計的嵌合基因??梢酝ㄟ^轉(zhuǎn)化將共抑制或反義嵌合基因?qū)胫参镏?,其中,相關(guān)內(nèi)源基因的表達(dá)被減弱或消除。
本發(fā)明的氨基酸生物合成酶(或所述酶的部分)可以在異源宿主細(xì)胞中產(chǎn)生,特別是在微生物宿主的細(xì)胞中產(chǎn)生,并可用于通過本領(lǐng)域技術(shù)人員熟知的方法制備所述酶的抗體。所述抗體可用于在細(xì)胞中原位檢測所述酶或在細(xì)胞提取物中體外檢測所述酶。用于生產(chǎn)本發(fā)明氨基酸生物合成酶的優(yōu)選異源宿主細(xì)胞是微生物宿主。含有指導(dǎo)外源蛋白高水平表達(dá)的調(diào)控序列的微生物表達(dá)系統(tǒng)和表達(dá)載體為本領(lǐng)域技術(shù)人員所熟知。上述任何表達(dá)系統(tǒng)均可用于構(gòu)建用于生產(chǎn)本發(fā)明氨基酸生物合成酶的嵌合基因。然后可以通過轉(zhuǎn)化將這種嵌合基因?qū)牒线m的微生物中,以便高水平表達(dá)所述酶。提供了用于在細(xì)菌宿主中高水平表達(dá)本發(fā)明氨基酸生物合成酶的載體的例子(例11)。
另外,還可將本發(fā)明的植物氨基酸生物合成酶用作靶子,以便有利于設(shè)計和/或鑒定可被用作除草劑的所述酶的抑制劑。之所以希望這樣,是因為本文所披露的酶能夠催化導(dǎo)致幾種必需氨基酸產(chǎn)生的途徑中的各個步驟。因此,抑制本文所披露的一種或幾種酶的活性,可導(dǎo)致足于抑制植物生長的氨基酸生物合成的抑制。因此,本發(fā)明的植物氨基酸生物合成酶可能適合于新型除草劑的發(fā)現(xiàn)和設(shè)計。
還可將本發(fā)明核酸片段的全部或主要部分用作探針對有關(guān)基因進(jìn)行遺傳學(xué)和物理作圖,所述探針是這些基因的一部分并且作為與這些基因連鎖的性狀的標(biāo)記。所述信息還可被用于植物育種,以便育成具有需要的表型的品系。例如,本發(fā)明的核酸片段可被用作限制片段長度多態(tài)性(RLFP)標(biāo)記。可以用本發(fā)明的核酸片段檢測限制性消化過的植物基因組DNA的Southern印跡(Maniatis)。然后可以用諸如MapMaker的計算機(jī)程序(Lander等(1987)基因組1174-181)對所得到的帶形進(jìn)行遺傳學(xué)分析,以便構(gòu)建一個遺傳圖譜。另外,還可將本發(fā)明的核酸片段用于檢測含有代表特定遺傳學(xué)雜交的親代和子代的一組個體的限制性內(nèi)切處理過的基因組DNA的Southern印跡。注意到了所述DNA多態(tài)性的分離,并將其用于計算本發(fā)明核酸序列在預(yù)先用該群體獲得的遺傳圖譜中的位置(Botstein,D.等(1980)美國人類遺傳學(xué)雜志32314-331)。
源于植物基因的探針的生產(chǎn)以及在遺傳作圖上的應(yīng)用由R.Bernatzky,R.Tanksley,S.D.(1986)披露于植物分子生物學(xué)報導(dǎo)4(1)37-41中。有眾多的出版物披露了用上述方法或這些方法的改進(jìn)方法對特定cDNA克隆進(jìn)行遺傳作圖。例如,可將F2雜交群體、回交群體、隨機(jī)交配的群體、近同基因型品系、以及其它類型的個體用于作圖。所述方法為本領(lǐng)域技術(shù)人員所熟知。
還可將源于本發(fā)明核酸序列的核酸探針用于物理作圖(即,將序列定位在物理圖譜上;參見Hoheisel,J.D.等,非哺乳動物基因組分析實踐指南,學(xué)術(shù)出版社1996,pp.319-346,以及該文所引用的參考文獻(xiàn))。
在另一種實施方案中,還可將源于本發(fā)明核酸序列的核酸探針用于直接熒光原位雜交(FISH)作圖(Trask,B.J.(1991)TrendsGenet.7149-154)。盡管現(xiàn)有的FISH作圖方法傾向于使用大的克隆(數(shù)個-數(shù)百個KB;參見Laan,M.等(1995)基因組研究513-20),靈敏性的提高使得可以使用較短的探針進(jìn)行FISH作圖。
可以用本發(fā)明的核酸序列進(jìn)行多種基于核酸擴(kuò)增的遺傳學(xué)和物理作圖方法。其例子包括等位基因特異性擴(kuò)增(Kazazian,H.H.(1989)實驗室臨床醫(yī)學(xué)雜志114(2)95-96),PCR擴(kuò)增片段的多態(tài)性(CAPS;Sheffield,V.C.等(1993)基因組16325-332),等位基因特異性連接(Landegren,U.等(1988)科學(xué)2411077-1080),核苷酸延伸反應(yīng)(Sokolov,B.P.(1990)核酸研究183671),輻射雜交作圖(Walter,M.A.等(1997)自然遺傳學(xué)722-28)和Happy作圖(Dear,P.H.和Cook,P.R.(1989)核酸研究176795-6807)。對上述方法而言,將一個核酸片段的序列用于設(shè)計和生產(chǎn)用于擴(kuò)增反應(yīng)或用于引物延伸反應(yīng)的引物對。所述引物的設(shè)計為本領(lǐng)域技術(shù)人員所熟知。在采用基于PCR遺傳作圖的方法中,可能需要鑒定作圖雜交親本在相當(dāng)于本發(fā)明核酸序列部位的DNA序列差別,不過,對于一般的作圖方法來說這不是必須的。
可以鑒定本發(fā)明cDNA克隆的功能性突變表型的喪失,這一目的是通過定向基因破壞方法或通過鑒定在所有可能的基因上攜帶突變的玉米群體中所含的基因中的特定突變型而實現(xiàn)(Ballinger和Benzer(1989)Proc.Natl.Acad.Sci.USA869402;Koes等(1995)Proc.Natl.Acad.Sci.USA928149;Bensen等(1995)植物細(xì)胞775)。后一種方法可以用兩種方式實現(xiàn)。首先,可將本發(fā)明核酸片段的短的片段與一個突變標(biāo)記序列引物一起用于對由一個植物群體制備的DNA進(jìn)行聚合酶鏈?zhǔn)椒磻?yīng),在所述群體中業(yè)已導(dǎo)入了增變轉(zhuǎn)座子或某些其它能導(dǎo)致突變的DNA因子(參見Bensen,同上)。由所述引物進(jìn)行的特定DNA的擴(kuò)增表明,所述突變標(biāo)記因子插入了編碼二氫吡啶二羧酸還原酶、二氨基庚二酸差向異構(gòu)酶、蘇氨酸合酶、蘇氨酸脫氨酶或S-腺苷甲硫氨酸合酶的植物基因上或接近該基因。另外,還可將本發(fā)明的核酸片段用作雜交探針與由所述突變?nèi)后w制備的PCR擴(kuò)增產(chǎn)物進(jìn)行雜交,所述擴(kuò)增產(chǎn)物是用所述突變標(biāo)記序列引物與任意基因組位點引物,如用于限制酶位點錨定合成接頭引物一起制備的。采用任一種方法都可以鑒定并獲得在編碼二氫吡啶二羧酸還原酶、二氨基庚二酸差向異構(gòu)酶、蘇氨酸合酶、蘇氨酸脫氨酶或S-腺苷甲硫氨酸合酶的內(nèi)源基因上含有突變的植物,然后可將這種突變型植物用于確定或證實所述二氫吡啶二羧酸還原酶、二氨基庚二酸差向異構(gòu)酶、蘇氨酸合酶、蘇氨酸脫氨酶和S-腺苷甲硫氨酸合酶基因產(chǎn)物的天然功能。
實施例在以下實施例中,將對本發(fā)明作進(jìn)一步說明,其中,所有的份數(shù)和百分比都是以重量計,溫度是攝氏度,除非另有說明。應(yīng)當(dāng)理解的是,這些實施例盡管表示本發(fā)明的優(yōu)選實施方案,但僅僅是以說明形式給出的。通過以上說明和這些實施例,本領(lǐng)域技術(shù)人員可以明白本發(fā)明的實質(zhì)特征,并可以在不超出本發(fā)明的構(gòu)思和范圍的前提下對本發(fā)明作出各種改變和改進(jìn),使其適應(yīng)各種用途和條件。
例1cDNA文庫的組成;cDNA克隆的分離和測序制備代表源于玉米、稻、大豆和小麥的各種組織的mRNA的cDNA文庫。所述文庫的特征如下。
表2源于玉米和大豆組織的cDNA文庫文庫 組織 克隆cc2玉米愈傷組織,部分分化過的,繼代cc2.pk0031.c9之后2周cc3玉米愈傷組織,成熟體細(xì)胞胚胎cc3.mn0002.d2cen1 授粉12天之后的玉米胚乳 cen1.pk0064.f4chp2 玉米葉,11日齡植株 chp2.pk0008.h4cs15周齡植株的葉鞘 cs1.pk0058.g5csi1n 玉米長須* csi1n.pk0042.a3rls2 萌發(fā)之后15天的稻葉,感染rls2.pk0017.d3Magaporthe griesea菌株4360-R-67(AVR2-YAMO)之后2小時;易感rls48 萌發(fā)之后15天的稻葉,感染rls48.pk0036.h10Magaporthe griesea菌株4360-R-67(AVR2-YAMO)之后48小時;易感rls72 萌發(fā)之后15天的稻葉,感染rls72.pk0018.e7Magaporthe griesea菌株4360-R-67(AVR2-YAMO)之后72小時;易感s2 大豆種子,開花之后19天s2.12b06se1開花之后7天的大豆胚胎 se1.06a03se2開花之后10天的大豆胚胎se2.pk0005.f1ses8w 繼代之后8周的成熟大豆胚胎 ses8w.pk0010.h11sfl1 大豆未成熟花 sfl1.pk0055.h7sfl1.pk0031.h3sgs1c 萌發(fā)之后4小時的大豆種子 sgs1c.pk002.k12sr1來自11日齡幼苗的大豆根sr1.pk0003.f6sre萌發(fā)之后伸長4-5天的大豆根 sre.pk0044.f3wkm1c 在22℃下發(fā)芽55小時的小麥種子 wkm1c.pk0003.g4wle1n 來自7日齡黃化幼苗的小麥葉*wle1n.pk0070.b8wlk1 用殺真菌劑處理之后1小時的小 wlk1.pk0028.d3麥幼苗**wlm24 接種禾白粉菌小麥亞種之后24小時的 wlm24.pk0030.g4小麥幼苗wr1來自7日齡幼苗的小麥根 wr1.pk0085.h2wr1.pk0086.d5wr1.pk0103.h8wre1 來自7日齡黃化幼苗的小麥根 wre1.pk0002.c12wre1n 來自7日齡黃化幼苗的小麥根*wre1n.pk0082.b2wre1n.pk170.d8*大體上按披露于US5,482,845中的方法對這些文庫進(jìn)行歸一化**使用6-碘基-2-丙氧基-3-丙基-4(3H)-喹唑酮;使用該化合物的合成和方法披露于USSN08/545,827中,該專利被收作本文的參考文獻(xiàn)。
按照生產(chǎn)商的方法(Stratagene克隆系統(tǒng),La Jolla,CA)在Uni-ZAPTMXR載體中制備cDNA文庫。按照Stratagene提供的方法將所述Uni-ZAPTMXR文庫轉(zhuǎn)成質(zhì)粒文庫。在轉(zhuǎn)變時,cDNA插入片段包含在質(zhì)粒載體pBluescript上。通過聚合酶鏈?zhǔn)椒磻?yīng)擴(kuò)增源于隨機(jī)挑選的含有重組pBluescript質(zhì)粒的細(xì)菌菌落的cDNA插入片段,擴(kuò)增時使用對所述插入cDNA序列旁側(cè)的載體序列專一的引物,或由培養(yǎng)的細(xì)菌細(xì)胞制備質(zhì)粒DNA。用染料引物測序反應(yīng)對擴(kuò)增的插入DNA或質(zhì)粒DNA進(jìn)行測序,以制備部分cDNA序列(表達(dá)的序列標(biāo)記或“ESTs”;參見Adams,M.D.等(1991)科學(xué)2521651)。用一臺Perkin Elmer Model 377熒光測序儀分析所得到的ESTs。
例2cDNA克隆的鑒定和特征分析通過實施BLAST(基礎(chǔ)定位排列檢索工具Altschul,S.F.(1993)分子生物學(xué)雜志215403-410;還可參見www.acb.nlm.nih.gov/BLAST/)鑒定編碼植物氨基酸生物合成酶的ESTs,所述BLAST是檢索與包含在BLAST“nr”數(shù)據(jù)庫中的序列的相似性(包括所有非豐裕GenBank CDS翻譯,源于Brookhaven蛋白數(shù)據(jù)庫的三維結(jié)構(gòu)的序列,SWISS-PROT蛋白序列數(shù)據(jù)庫的最新版,EMBL,和DDBJ數(shù)據(jù)庫)。用由國家生物技術(shù)信息中心(NCBI)提供的BLASTN算法,分析在例1中獲得的cDNA序列與包含在“nr”數(shù)據(jù)庫中的所有可公開獲得的DNA序列的相似性。以所有讀框的形式翻譯所述DNA序列,并用由NCBI提供的BLASTX算法(Gish,W.和States,D.J.(1993)自然遺傳學(xué)3266-272)比較與包含在“nr”數(shù)據(jù)庫中的所有可公開獲得的DNA序列的相似性。為方便起見,通過BLAST計算隨機(jī)觀察的一段cDNA序列與包含在檢索的數(shù)據(jù)庫中的序列的P-值(可能性),在這里以“pLog”值形式給出的,它表示所報導(dǎo)的P-值的對數(shù)的負(fù)數(shù)。因此,pLog值越大,所述cDNA序列與“BLAST目標(biāo)”代表同源蛋白的可能性越大。
例3鑒定編碼與二氫吡啶二羧酸還原酶同源的多肽的cDNA克隆用來自克隆csiln.pk0042.a3和rls2.pk0017.d3的核苷酸序列進(jìn)行的BLASTX檢索揭示了由所述cDNA編碼的蛋白與集胞藻二氫吡啶二羧酸還原酶(DDBJ保藏號D90899)的相似性。csiln.pk0042.a3和rls2.pk0017.d3的BLAST pLog值分別為12.60和11.68。
測定了克隆csiln.pk0042.a3中的完整cDNA插入片段的序列,并示于序列1中;該cDNA的推定氨基酸序列示于序列2中。通過BLASTP評價在序列2中示出的氨基酸序列,得到相對集胞藻二氫吡啶二羧酸還原酶序列的pLog值為36.72。來自克隆rls2.pk0017.d3的一部分cDNA插入片段的序列示于序列3中,該cDNA的推定氨基酸序列示于序列4中。圖2表示在序列2中示出的氨基酸序列與集胞藻二氫吡啶二羧酸還原酶序列(序列5)的比較,序列2與集胞藻二氫吡啶二羧酸還原酶序列(序列5)的同一性為40%。序列比較是通過Clustal排列法進(jìn)行的(Higgins,D.G.和Sharp,P.M.(1989)CABIOS5151-153),使用LASARGENE生物信息計算機(jī)程序組的Megalign程序(DNASTAR公司,Madison,WI)。通過Jotun Hein方法(Hein.J.J.(1990)酶學(xué)方法1836262-645)用LASARGENE生物信息計算機(jī)程序組的Megalign程序(DNASTAR公司,Madison,WI)計算序列同一性百分比。
序列比較和BLAST評級和概率表明,本發(fā)明核酸片段編碼一種接近完整的玉米二氫吡啶二羧酸還原酶,和一部分稻二氫吡啶二羧酸還原酶。所述序列表示編碼二氫吡啶二羧酸還原酶的第一種植物序列。
例4鑒定編碼二氨基庚二酸差向異構(gòu)酶的cDNA克隆用源于克隆chp2.pk0008.h4,rls48.pk0036.h10,wlm24.pk0030.g4的,和由克隆se2.pk0005.f1,ses8w.pk0010.h11,sfl1.pk0031.h3和sgslc.pk002.k12組成的重疊群序列進(jìn)行BLASTX檢索,揭示由所述cDNA編碼的蛋白與源于集胞藻的二氨基庚二酸差向異構(gòu)酶(DDBJ保藏號D90917)的相似性。所述每一個ESTs的BLAST的結(jié)果示于表3中表3編碼與二氨基庚二酸差向異構(gòu)酶同源的多肽的克隆的BLAST結(jié)果克隆 BLAST Plog值DDBJ D90917chp2.pk0008.h459.16rls48.pk0036.h10 40.82重疊群 98.30se2.pk0005.f1ses8w.pk0010.h11sfl12.pk0031.h3sgs1c.pk002.k12wlm24.pk0030.g4 23.46
測定插入克隆chp2.pk0008.h4上的完整cDNA序列,并示于序列6中;該cDNA的推定氨基酸序列示于序列7中。通過BLASTP評價示于序列7中的氨基酸序列,得到相對集胞藻序列的pLog值為75.66。源于克隆rls48.pk0036.h10的一部分cDNA插入片段的序列示于序列8中,該cDNA的推定氨基酸序列示于序列9中。測定由克隆se2.pk0005.f1,ses8w.pk0010.h11,sfl1.pk0031.h3和sgslc.pk002.k12組成的重疊群的核苷酸序列,并示于序列10中;該cDNA的推定氨基酸序列示于序列11中。通過BLASTP評價示于序列11中的氨基酸序列,得到相對集胞藻序列的pLog值為98.57。源于克隆wlm24.pk0030.g4的一部分cDNA插入片段的序列示于序列12中,該cDNA的推定氨基酸序列示于序列13中。圖3中示出了序列7、9、11、和13中所示氨基酸序列與集胞藻序列(序列14)的比較。表4中的數(shù)據(jù)表示序列7、9、11和13所示氨基酸序列與集胞藻序列的同一性百分比。
表4由編碼與二氨基庚二酸差向異構(gòu)酶同源的多肽的cDNA克隆的核苷酸序列推定的氨基酸序列的同一性百分比克隆 序列號 與DDBJ D90917(序列16)的同一性百分比chp2.pk0008.h4 7 59rls48.pk0036.h10 9 74重疊群 11 72se2.pk0005.f1ses8w.pk0010.h11sfl12.pk0031.h3sgs1c.pk002.k12wlm24.pk0030.g4 13 65通過Clustal方法(Higgins,D.G.和Sharp,P.M.(1989)CABIOS5151-153)進(jìn)行序列比較,使用LASARGENE生物信息計算機(jī)程序組的Megalign程序(DNASTAR公司,Madison,WI)。通過Jotun Hein方法(Hein.J.J.(1990)酶學(xué)方法1836262-645)用LASARGENE生物信息計算機(jī)程序組的Megalign程序(DNASTAR公司,Madison,WI)計算序列同一性百分比。
序列比較和BLAST評級和概率表明,本發(fā)明核酸片段編碼一種接近完整的玉米二氨基庚二酸差向異構(gòu)酶(chp2.pk0008.h4),稻二氨基庚二酸差向異構(gòu)酶的一部分(rls48.pk0036.h10),和完整的大豆二氨基庚二酸差向異構(gòu)酶(se2.pk0005.f1,ses8w.pk0010.h11,sfl1.pk0031.h3,和sgslc.pk002.k12),以及小麥二氨基庚二酸差向異構(gòu)酶的一部分(wlm24.pk0030。g4)。以上序列表示編碼二氨基庚二酸差向異構(gòu)酶的第一種植物序列。
例5鑒定編碼蘇氨酸合酶的cDNA克隆用源于克隆cc2.pk0031.c9,csl.pk0058.g5,rls72.pk0018.e7,sel.06a03,srl.pk0003.f6和wrl.pk0085.h2的EST序列進(jìn)行的BLASTX檢索揭示了由所述cDNA編碼的蛋白與源于擬南芥的蘇氨酸合酶(GenBank保藏號L41666)的同一性。所述每一種ESTs的BLAST結(jié)果示于表5中表5編碼與蘇氨酸合酶同源的多肽的克隆的BLAST結(jié)果BLAST pLog評級克隆 L41666cc2.pk0031.c956.19csl.pk0058.g58.00rls72.pk0018.e7 29.47sel.06a0334.15srl.pk0003.f621.13wrl.pk00851.h2 29.47測定插入克隆cc2.pk0031.c9中的完整cDNA的序列,并示于序列15中,該cDNA的推定氨基酸序列示于序列16中。通過BLASTP評價示于序列16中的氨基酸序列,得到相對擬南芥序列的pLog值為166.11。相對dbest的BLAST表明了源于cc2.pk0031.c9的核苷酸520至684與玉米EST的核苷酸1至162(GenBank保藏號T18847)的同一性。在序列17中示出了源于克隆csl.pk0058.g5的一部分cDNA插入片段的序列;該cDNA的推定氨基酸序列示于序列18中。源于克隆rls72.pk0018.e7的一部分cDNA插入片段的序列示于序列19中;該cDNA的推定氨基酸序列示于序列20中。源于克隆sel.06a03的一部分cDNA插入片段的序列示于序列21中;該cDNA的推定氨基酸序列示于序列22中。測定插入克隆slr.pk0003.f6中的完整cDNA的序列并示于序列23中;該cDNA的推定氨基酸序列示于序列24中。通過BLASTP評價示于序列24中的氨基酸序列,得到相對擬南芥序列的pLog值為275.06。源于克隆wrl.pk0085.h2的一部分cDNA插入片段的序列示于序列25中;該cDNA的推定氨基酸序列示于序列26中。圖4表示序列16、18、20、22、24、和26所示氨基酸序列與擬南芥序列的比較。表6的數(shù)據(jù)表示序列16、18、20、22、24、和26所示氨基酸序列與擬南芥序列(序列27)的同一性百分比計算值。
表6編碼與蘇氨酸合酶同源的多肽的cDNA克隆的核苷酸序列推定的氨基酸序列的同一性百分比與L41666(序列29)克隆 序列號的百分同源性cc2.pk0031.c916 81.0csl.pk0058.g518 81.0rls72.pk0018.e7 20 55.3sel.06a0322 80.0srl.pk0003.f624 84.4wrl.pk0085.h226 50.4通過Clustal方法(Higgins,D.G.和Sharp,P.M.(1989)CABIOS5151-153)進(jìn)行序列比較,使用LASARGENE生物信息計算機(jī)程序組的Megalign程序(DNASTAR公司,Madison,WI)。通過Jotun Hein方法(Hein.J.J.(1990)酶學(xué)方法1836262-645)用LASARGENE生物信息計算機(jī)程序組的Megalign程序(DNASTAR公司,Madison,WI)計算序列同一性百分比。
序列比較和BLAST評級和概率表明,本發(fā)明核酸片段編碼一種玉米蘇氨酸合酶的部分(cc2.pk0031.c9和csl48.pk0058.g5),稻蘇氨酸合酶的一部分(rls72.pk0018.e7),大豆蘇氨酸合酶的部分(sel.06a03和srl.pk0003.f6),和小麥蘇氨酸合酶的一部分(wrl.pk0085.h2)。以上序列表示編碼蘇氨酸合酶的第一種玉米、稻、大豆和小麥序列。
例6鑒定編碼蘇氨酸脫氨酶的cDNA克隆用源于克隆cenl.pk0064.f4的EST序列進(jìn)行的BLASTX檢索,揭示了由所述cDNA編碼的蛋白與源于Brukholderia capacia的蘇氨酸脫氨酶(GenBank保藏號U40630;pLog=31.38)的同一性。用源于克隆sfl1.pk0055.h7和sre.pk0044.f3的EST序列進(jìn)行的BLASTX檢索,揭示了由所述cDNA編碼的蛋白與源于馬鈴薯(Solanumtuberosum)和Brukholderia capacia的蘇氨酸脫氨酶(分別為EMBL保藏號X67846和GenBank保藏號U40630)的同一性。sfl1. pk0055.h7的BLAST pLog值為36.55和31.79,而sre.pk0044.f3的BLAST pLog值為19.47和14.51。
測定插入克隆cenl.pk0064.f4中的完整cDNA的序列,并示于序列28中;該cDNA的推定氨基酸序列示于序列29中。通過BLASTP評價示于序列29中的氨基酸序列,得到相對Brukholderia capacia序列的pLog值為134.85。sfl1.pk0055.h7的一部分cDNA插入片段的序列示于序列30中;該cDNA的推定氨基酸序列示于序列31中。測定插入克隆sre.pk0044.f3中的完整cDNA的序列,并示于序列32中;該cDNA的推定氨基酸序列示于序列33中。通過BLASTP評價示于序列33中的氨基酸序列,得到相對馬鈴薯序列的pLog值為19.24,相對Brukholderia capacia蘇氨酸脫氨酶序列的pLog值為15.19。圖5表示序列29、31、和33所示氨基酸序列與Brukholderiacapacia(序列34)序列的比較。表7的數(shù)據(jù)表示序列29、31和33、35所示氨基酸序列與Brukholderia capacia序列的同一性百分比計算值。
表7由編碼與蘇氨酸脫氨酶同源的多肽的cDNA克隆的核苷酸序列推定的氨基酸序列的同一性百分比與U40630(序列36)克隆序列號 的百分同源性cen1.pk0064.f429 61.0sfl.pk0055.h7 31 47.9sre.pk0044.f3 33 46.0通過Clustal方法(Higgins,D.G.和Sharp,P.M.(1989)CABIOS5151-153)進(jìn)行序列比較,使用LASARGENE生物信息計算機(jī)程序組的Megalign程序(DNASTAR公司,Madison,WI)。通過Jotun Hein方法(Hein.J.J.(1990)酶學(xué)方法1836262-645)用LASARGENE生物信息計算機(jī)程序組的Megalign程序(DNASTAR公司,Madison,WI)計算序列同一性百分比。
序列比較和BLAST評級和概率表明,本發(fā)明核酸片段編碼一種接近完整的玉米蘇氨酸脫氨酶(cenl.pk0064.f4)和大豆蘇氨酸脫氨酶的部分(sfl.pk0055.h7和sre.pk0044.f3)。以上序列表示編碼蘇氨酸脫氨酶的第一種玉米和大豆序列。
例7鑒定編碼S-腺苷甲硫氨酸合酶的cDNA克隆用源于克隆cc3.mn0002.d2的核苷酸序列進(jìn)行的BLASTX檢索揭示了由所述cDNA編碼的蛋白與源于稻的S-腺苷甲硫氨酸合酶(EMBL保藏號Z26867;pLog=99.03)的同一性。測定插入克隆cc3.mn0002.d2中的完整cDNA的序列,并示于序列35中;該cDNA的推定氨基酸序列示于序列36中。通過BLASTN評價示于序列35中的核苷酸序列,得到相對稻序列的pLog值大于200。圖6表示序列35所示核苷酸序列與稻序列(序列37)的比較。序列35所示核苷酸序列在1216個核苷酸的長度上與稻S-腺苷甲硫氨酸合酶核苷酸序列的同一性為88%。
用源于克隆s2.12b06的核苷酸序列進(jìn)行的BLASTX檢索揭示了由所述cDNA編碼的蛋白與源于番茄的S-腺苷甲硫氨酸合酶(EMBL保藏號Z24741;pLog=62.62)的同一性。測定插入克隆s2.12b06中的完整cDNA的序列,并示于序列38中;該cDNA的推定氨基酸序列示于序列39中。通過BLASTN評價示于序列38中的核苷酸序列,得到相對番茄序列的pLog值大于200。圖7表示序列38所示核苷酸序列與番茄序列(序列40)的比較。序列38所示核苷酸序列在1210個核苷酸的長度上與番茄序列的同一性為82%。
用由克隆wrel.pk0002.c12,wle1n.pk0070.b8,wkm1c.pk0003.g4,wlk1.pk0028.d3.wre1n.pk170.d8,wrl.pk0086.d5,wrl.pk0103.h8和wre1n.pk0082.b2組成的重疊群的核苷酸序列進(jìn)行的BLASTX檢索,揭示了由該重疊群編碼的蛋白與源于大麥的S-腺苷甲硫氨酸合酶(DDBJ保藏號D63835)的相似性,其pLog值大于200。由克隆wrel.pk0002.c12,wle1n.pk0070.b8,wkm1c.pk0003.g4,wlk1.pk0028.d3.wre1n.pk170.d8,wrl.pk0086.d5,wrl.pk0103.h8和wreln.pk0082.b2組成的重疊群的氨基酸序列示于序列41中;該cDNA的推定氨基酸序列示于序列42中。圖8表示序列41所示核苷酸序列與大麥序列(序列43)的比較。序列41與大麥序列的同一性為92%。
序列比較和BLAST評級和概率表明,本發(fā)明核酸片段編碼完整的或接近完整的玉米、大豆、或小麥S-腺苷甲硫氨酸合酶。以上序列表示編碼S-腺苷甲硫氨酸合酶的第一種玉米、大豆或小麥序列。
例8嵌合基因在單子葉植物細(xì)胞中的表達(dá)可以構(gòu)建一個嵌合基因,該嵌合基因包括一個編碼一種氨基酸生物合成酶的cDNA,該cDNA相對位于該cDNA片段5’末端的玉米27kD玉米醇溶蛋白啟動子,以及位于該cDNA片段3’末端的10kD玉米醇溶蛋白3’末端為有義方向,該基因的cDNA片段可以通過用合適的寡核苷酸引物在合適實驗條件下由所述cDNA克隆的聚合酶鏈?zhǔn)椒磻?yīng)(PCR)而制備。可將克隆位點(NcoI或SmaI)插入所述寡核苷酸,以便將所述DNA片段以下述方法插入消化過的載體pML103時,該DNA片段呈正確取向。然后用限制酶NcoI和SmaI消化擴(kuò)增的DNA,并在0.7%的低熔點瓊脂糖凝膠上,在40mM Tris-乙酸,pH8.5,1mM EDTA中分離??蓪⒑线m的帶從所述凝膠上切除,在68℃下熔化,并與質(zhì)粒pML103的4.9kb NcoI-SmaI片段合并。質(zhì)粒pML103業(yè)已根據(jù)布達(dá)佩斯條約的規(guī)定保藏在ATCC(美國典型培養(yǎng)物保藏中心10801University Boulevard,Manassas,VA20110-2209),保藏號為ATCC97366。源于pMLl03的DNA片段含有一個玉米27kD玉米醇溶蛋白基因的1.05kb SalI-NcoI啟動子片段,以及一個源于載體pGem9Zf(+)(Promega)上的玉米10kD玉米醇溶蛋白基因的3’末端的0.96kbSmaI-SalI片段??梢源篌w上按所公開的方法(Maniatis)在15℃下連接載體和插入DNA過夜。然后將連接的DNA用于轉(zhuǎn)化大腸桿菌XL1-Blue(Epicurian Coli XL-1-BlueTM;Stratagene)。可以通過對質(zhì)粒DNA進(jìn)行限制酶消化篩選細(xì)菌轉(zhuǎn)化體,并利用雙脫氧鏈?zhǔn)浇K止方法進(jìn)行有限的核苷酸序列分析(SequenaseTMDNA測序試劑盒;美國生物化學(xué))。所得到的質(zhì)粒結(jié)構(gòu)包括一個沿5’→3’方向編碼的嵌合基因,玉米27kD玉米醇溶蛋白啟動子,編碼一種植物氨基酸生物合成酶的cDNA片段和10kD玉米醇溶蛋白3’區(qū)。
然后可以通過以下方法將上述嵌合基因?qū)胗衩准?xì)胞。從來自近交玉米系H99和LH132的雜交種的發(fā)育中的穎果中解剖未成熟的玉米胚。在所述胚授粉以后10-11天其長度為1.0-1.5mm時將其分離。然后將該胚的軸線一側(cè)朝下地放置,并與瓊脂糖固化的N6培養(yǎng)基接觸(Chu等(1975)Sci.Sin.Peking18659-668)。在27℃下將所述胚保持在黑暗中。易碎的胚胎愈傷組織包括未分化的細(xì)胞團(tuán),該細(xì)胞團(tuán)包括生長在胚柄結(jié)構(gòu)上的體細(xì)胞原胚狀體和胚狀體,所述胚柄結(jié)構(gòu)是由上述未成熟胚胎的小盾片繁殖。從所述原始外殖體上分離的胚胎愈傷組織可以在N6培養(yǎng)基上培養(yǎng),并每隔2-3周在該培養(yǎng)基上繼代培養(yǎng)。
可將質(zhì)粒p35S/Ac(獲自Peter Eckes博士,Hoechst公司,法蘭克福,德國)用于轉(zhuǎn)化實驗,以便提供一種選擇標(biāo)記。該質(zhì)粒含有編碼磷絲菌素乙酰轉(zhuǎn)移酶(PAT)的Pat基因(參見歐洲專利申請0242236)。酶PAT可產(chǎn)生對諸如磷絲菌素的除草性谷氨酰氨合成酶抑制劑產(chǎn)生抗性。p35S/A中的pat基因是受源于花椰菜花葉病毒的35S啟動子(Odell等(1985)自然313810-812),和源于根癌農(nóng)桿菌(Agrobacterium tumefaciens)的Ti質(zhì)粒的T-DNA的胭脂氨酸合酶基因的3’區(qū)的控制。
可以利用粒子轟擊方法(Klein等(1987)自然32770-73)將基因轉(zhuǎn)入愈傷組織培養(yǎng)細(xì)胞。根據(jù)該方法,采用以下技術(shù)用DNA涂敷金粒子(直徑1μm)。將10μg質(zhì)粒DNA加入50μL金粒子的懸浮液中(60mg/mL)。將CaCl2(50μL的2.5M溶液)和亞精胺游離堿(20μL的1.0M溶液)加入所述顆粒中。在添加上述溶液時對所述懸浮液進(jìn)行渦旋攪拌。10分鐘以后,對所述試管進(jìn)行簡單地離心(15,000rpm,5秒鐘),并除去上清液。將所述顆粒重新懸浮在200μL無水乙醇中,再次離心,并除去上清液。再次進(jìn)行乙醇漂洗,并將顆粒以30μL的終體積重新懸浮在乙醇中??蓪⑺鐾坑蠨NA的金粒子等分試樣(5μL)放置在KaptonTM飛盤(Bio-Rad實驗室)的中央。然后用BiolisticTMPDS1000/He(Bio-Rad儀器,Hercules CA)加速所述離子,使其進(jìn)入玉米組織,所使用的氦壓力為1000psi,間隙距離為0.5cm,飛行距離為1.0cm。
為了進(jìn)行轟擊,將所述胚胎組織放置在置于瓊脂糖固化的N6培養(yǎng)基上的濾紙上。將所述組織排成一薄層,并覆蓋一個直徑大約為5cm的圓形部位。將裝有所述組織的培養(yǎng)皿放置在PDS-1000/He室中,距離終止屏大約8cm。然后將所述室中的空氣抽真空至28英寸汞柱的真空度。用一個爆裂膜通過氦沖擊波對所述大載體進(jìn)行加速,所述爆裂膜會在沖擊管中的氯壓力達(dá)到1000psi時爆裂。
在轟擊之后7天,可將所述組織轉(zhuǎn)移到含有g(shù)luphosinate(2mg/l)并缺少酪蛋白或脯氨酸的N6培養(yǎng)基中。所述組織在該培養(yǎng)基上繼續(xù)緩慢生長。再過2周以后,可將該組織轉(zhuǎn)移到含有g(shù)luphosinate的新鮮N6培養(yǎng)基上。6周之后,可以在某些含有添加了glufosinate的培養(yǎng)基的平板上鑒定到直徑大約為1cm的活躍生長的愈傷組織部位。這些愈傷組織在繼代到選擇培養(yǎng)基上之后可繼續(xù)生長。
在將組織簇首次轉(zhuǎn)移到添加了0.2mg/l的2,4-D的N6培養(yǎng)基上之后由所述轉(zhuǎn)基因愈傷組織再生了植株。2周之后,可將該組織轉(zhuǎn)移到再生培養(yǎng)基上(Fromm等(1990)生物/技術(shù)8833-839)。
例9嵌合基因在雙子葉植物細(xì)胞中的表達(dá)可將一種種子特異性表達(dá)框用于在轉(zhuǎn)化的大豆中表達(dá)本發(fā)明的氨基酸生物合成酶,所述表達(dá)框包括編碼源于菜豆(Phaseolusvulgaris)的種子儲藏蛋白菜豆蛋白的β亞基的基因的啟動子和轉(zhuǎn)錄終止子(Doyle等(1986)生物化學(xué)雜志2619228-9238)。所述菜豆蛋白表達(dá)框包括翻譯起始密碼子上游(5’)的大約500個核苷酸,和菜豆蛋白翻譯終止密碼子下游(3’)的大約1650個核苷酸。在所述5’和3’區(qū)之間是特殊的限制性內(nèi)切酶位點NcoI(該位點包括ATG翻譯起始密碼子),SamI,KpnI和XbaI。整個表達(dá)框的旁側(cè)是HandIII位點。
可以用合適的寡核苷酸引物通過所述cDNA克隆的聚合酶鏈?zhǔn)椒磻?yīng)(PCR)制備該基因的cDNA片段??蓪⒖寺∥稽c插入所述寡核苷酸,以便當(dāng)該DNA片段被插入表達(dá)載體時提供正確取向。然后進(jìn)行擴(kuò)增,并將分離的片段插入攜帶所述種子表達(dá)框的pUC18載體。
已知植物氨基酸生物合成酶定位于葉綠體中。因此,對于缺乏葉綠體定向信號的那些酶(或者代表本發(fā)明氨基酸生物合成酶的一部分的多肽)來說,待插入表達(dá)載體的DNA片段可以通過用編碼葉綠體定向信號的引物進(jìn)行的PCR合成。例如,可以使用相當(dāng)于大豆的核酮糖1,5-二磷酸羧化酶小亞基的cts的葉綠體轉(zhuǎn)運序列(Berry-Lowe等(1982)分子應(yīng)用遺傳學(xué)雜志1483-498)。
然后可以用含有編碼一種植物氨基酸生物合成酶的序列的表達(dá)載體轉(zhuǎn)化大豆胚胎。為了誘導(dǎo)體細(xì)胞胚胎,可以在光照或黑暗中,在26℃下,在合適的瓊脂培養(yǎng)基中培養(yǎng)從大豆品種A2872的作過表面消毒的未成熟種子解剖的3-5mm長的子葉培養(yǎng)6-10周。然后切除能產(chǎn)生二級胚胎的體細(xì)胞胚,并將其放入合適的液體培養(yǎng)基中。反復(fù)篩選以早期球形期胚胎繁殖的體細(xì)胞胚胎簇,然后按下述方法維持其懸浮液。
可將大豆胚胎懸浮培養(yǎng)物保持在35ml的液體培養(yǎng)基中,該培養(yǎng)物被放置在以150rpm轉(zhuǎn)動的搖床上,在26℃下培養(yǎng),并給予16∶8小時日照/黑暗的熒光燈照射。通過將大約35mg的組織接種到35ml的液體培養(yǎng)基中,每隔2周對培養(yǎng)物進(jìn)行繼代。
然后可以通過粒子槍轟擊方法轉(zhuǎn)化大豆胚胎懸浮培養(yǎng)物(Kline等(1987)自然(倫敦)327.70,US4,945,050)??蓪u PontBiolisticTMPDS1000/HE儀(氦retrofit)用于上述轉(zhuǎn)化。
可用于促進(jìn)大豆轉(zhuǎn)化的選擇標(biāo)記基因是一種嵌合基因,該嵌合基因包括源于花椰菜花葉病毒的35S啟動子(Odell等(1985)自然313810-812),源于質(zhì)粒pJR225的潮霉素磷酸轉(zhuǎn)移酶基因(源于大腸桿菌;Gritz等(1983)基因25179-188)以及源于根癌農(nóng)桿菌Ti質(zhì)粒的T DNA的胭脂氨酸合酶基因的3’區(qū)。所述種子表達(dá)框包括菜豆蛋白5’區(qū),編碼所述生物合成酶的片段和菜豆蛋白3’區(qū)可以作為限制性片段分離。然后可將該片段插入攜帶所述標(biāo)記基因的載體上的單一限制性位點。
向50μl的60mg/ml的1μm金粒子懸浮液中添加(按順序)5μl DNA(1μg/μl),20μl亞精胺(0.1M),和50μl CaCl2(2.5M)。然后攪拌所述粒子制劑3分鐘,在微型離心機(jī)中離心10秒鐘,并除去上清液。然后用400μl 70%乙醇洗滌涂有DNA的粒子,并重新懸浮在40μl無水乙醇中。然后對DNA/粒子懸浮液進(jìn)行3次超聲波處理,每次1秒鐘。然后將涂有DNA的金粒子放入每一個大型載體盤上。
將大約300-400mg的2周齡懸浮培養(yǎng)物放入一個空的65×15mm的培養(yǎng)皿中,并用移液管從所述組織中除去殘余液體。對每一個轉(zhuǎn)化實驗來說,通常要對大約5-10個組織培養(yǎng)皿進(jìn)行轟擊。將膜的破裂壓力設(shè)定為1100psi,并將所述室抽真空到28英寸汞柱的真空度。將所述組織放置在距離固定網(wǎng)大約3.5英寸處,并轟擊3次。在轟擊之后,可將所述組織分成一半,并放置在所述液體中,按上述方法培養(yǎng)。
在轟擊之后5-7天,用新鮮培養(yǎng)基更換所述液體培養(yǎng)基,并在轟擊之后11-12天,用含有50mg/ml潮霉素的新鮮培養(yǎng)基更換。這種選擇培養(yǎng)基可以每周更新1次。在轟擊之后7-8周,可以觀察到從未轉(zhuǎn)化的、壞死的胚胎簇上生長出的綠色的轉(zhuǎn)化組織。除去分離的綠色組織,并接種到單個燒瓶中,以便生長出新的、克隆繁殖的、轉(zhuǎn)化過的胚胎懸浮培養(yǎng)物。新的品系可以作為獨立的轉(zhuǎn)化過程進(jìn)行處理。然后可以對這些懸浮液進(jìn)行繼代,并作為未成熟胚胎簇維持,或通過使單個的體細(xì)胞胚胎成熟和萌發(fā)再生完整植株。
例10分析轉(zhuǎn)化植株的種子的氨基酸含量為了分析所述嵌合基因在種子中的表達(dá),以及表達(dá)對該種子中所述氨基酸含量的影響,可以用本領(lǐng)域技術(shù)人員熟知的多種合適方法中的任一種制備種子粉。如果需要的話,所述種子粉可以通過己烷萃取的方法進(jìn)行部分或完全脫脂??梢杂伤龇N子粉制備蛋白提取物,并分析酶活性?;蛘咄ㄟ^本領(lǐng)域技術(shù)人員熟知的方法免疫測試所有表達(dá)的酶的存在。為了測定所述種子的游離氨基酸組成,可以從所述種子粉中提取游離氨基酸,并通過本領(lǐng)域熟知的方法進(jìn)行分析(Bieleski等(1966)分析生物化學(xué)17278-293)。然后可以利用任何市售氨基酸分析儀測定氨基酸組成。為了測定所述種子的總的氨基酸組成,可以對含有蛋白結(jié)合的以及游離的氨基酸的粉進(jìn)行酸解,以便釋放出蛋白結(jié)合的氨基酸,然后可以用市售氨基酸分析儀測定其組成。這樣可以鑒定并繁殖能表達(dá)本發(fā)明氨基酸生物合成酶并且與野生型種子相比具有改變了的賴氨酸、蘇氨酸、甲硫氨酸、半胱氨酸和/或異亮氨酸含量的種子。
為了測定所述種子的游離氨基酸組成,可以用1.0mL混合比例為12v/5v/3v的甲醇/氯仿/水(MCW)在室溫下從8-10mg的種子粉中萃取游離氨基酸。對所述混合物進(jìn)行渦旋攪拌,并在eppendorf微量離心機(jī)中離心大約3分鐘,傾出大約0.8mL上清液,向該上清液中加入0.2mL氯仿,接著再加入0.3mL水。對所述混合物進(jìn)行渦旋攪拌,并在eppendorf微量離心機(jī)中離心大約3分鐘,然后可以除去大約1.0mL上部水相,并在一臺Savant Speed Vac濃縮儀上干燥。然后在6N HCl、.04%β-巰基乙醇中,在氮氣下,在110-120℃下水解所述樣品24小時,然后用一臺Beckman Model 6300氨基酸分析儀對10%的所述樣品進(jìn)行分析。使用柱后茚三酮檢測。然后以賴氨酸、蘇氨酸、甲硫氨酸、半胱氨酸和/或異亮氨酸與亮氨酸比例的形式比較所述種子中相對游離氨基酸含量,因此將亮氨酸用作內(nèi)標(biāo)。
例11在微生物細(xì)胞中表達(dá)嵌合基因可將編碼本發(fā)明植物氨基酸生物合成酶的cDNA插入T7大腸桿菌表達(dá)載體pET24d(Novagen)中??梢赃m當(dāng)消化含有cDNA的質(zhì)粒DNA,以釋放出編碼所述酶的核酸片段。然后可以在1%的NuSieve GTGTM低熔點瓊脂糖凝膠(FMC)上純化所述片段。緩沖液和瓊脂糖中含有10μg/ml溴化乙錠,以便顯示所述DNA片段。然后可以按照生產(chǎn)商的說明通過用GELaseTM(Epicentre技術(shù))消化從所述瓊脂糖純化所述片段,乙醇沉淀,干燥,并重新懸浮在20μl水中??梢杂肨4 DNA連接酶(新英格蘭生物實驗室,Beverly,MA)將合適的寡核苷酸接頭連接到所述片段上。可以用低熔點瓊脂糖按上述方法從過量的接頭中純化含有連接的接頭的片段。用堿性磷酸酶(NEB)對載體pET24d進(jìn)行消化、脫磷酸化,并如上所述用苯酚/氯仿脫蛋白。然后可以在16℃下連接所制備的載體pET24d和片段15小時,接著轉(zhuǎn)化到DH5電感受態(tài)細(xì)胞(GIBCO BRL)中??梢栽诤?×YT培養(yǎng)基和50μg/ml卡那霉素的瓊脂平皿上篩選轉(zhuǎn)化體。然后通過限制酶分析篩選含有編碼所述酶的基因的轉(zhuǎn)化體相對pET24dT7啟動子的正確取向。
可將相對所述T7啟動子呈正確取向的克隆轉(zhuǎn)化到BL21(DE3)感受態(tài)細(xì)胞(Novagen)中,并在含有50μg/ml卡那霉素的2×YT瓊脂皿上選擇??梢宰層稍撧D(zhuǎn)化結(jié)構(gòu)產(chǎn)生的菌落在含有50μg/ml卡那霉素的2×YT培養(yǎng)基中在30℃下生長過夜。然后用新鮮培養(yǎng)基將所述培養(yǎng)物稀釋2倍,讓其再生長1小時,并通過以1mM終濃度添加異丙基-硫代半乳糖吡喃糖苷進(jìn)行誘導(dǎo)。3小時后通過離心收集細(xì)胞,并重新懸浮在50μl含有0.1mM DTT和0.2mM苯基甲基磺酰氟的50mM Tris-HCl(pH8.0)中。然后可以加入少量1mm的玻璃珠,并用一臺微探針超聲處理器對所述混合物進(jìn)行三次超聲處理,每次大約5秒中。然后對所述混合物進(jìn)行離心,并測定上清液中的蛋白濃度。通過SDS-聚丙烯酰胺凝膠電泳從所述培養(yǎng)物的可溶組分中分離1μg蛋白。可以觀察凝膠上以預(yù)期的分子量遷移的蛋白帶。
例12評價化合物抑制植物氨基酸生物合成酶的活性的能力可以用本領(lǐng)域技術(shù)人員熟知的多種方法生產(chǎn)本文所披露的植物氨基酸生物合成酶。所述方法包括,但不限于由例6所述的在細(xì)菌中表達(dá),或在真核細(xì)胞培養(yǎng)物、植物中表達(dá),并將病毒表達(dá)系統(tǒng)用于適當(dāng)?shù)馗腥具^的生物或細(xì)胞系中。本發(fā)明的酶可以作為成熟蛋白分別表達(dá),或者可以在大腸桿菌或其它合適表達(dá)背景中共表達(dá)。另外,無論是分別表達(dá)或是同時表達(dá),本發(fā)明的酶可以在活體內(nèi)出現(xiàn)的蛋白的成熟形式表達(dá),或作為通過共價結(jié)合與多種酶、蛋白或親合標(biāo)記結(jié)合的融合蛋白。常見的融合蛋白配偶體包括谷胱甘肽S-轉(zhuǎn)移酶(“GST”)、硫氧還蛋白(“Trx”)、麥芽糖結(jié)合蛋白、和C-或N-末端6組氨酸多肽(“(His)6”)。可以通過工程方法使所述融合蛋白在其融合點上具有一個蛋白酶識別位點,以便可以通過蛋白酶消化將融合配偶體分離,產(chǎn)生完整的成熟酶。所述蛋白酶的例子包括凝血酶、腸激酶和Xa因子。不過,可以使用能特異裂解連接所述融合蛋白和所述生物合成酶的肽的任何蛋白酶。
如果需要純化本發(fā)明酶的話,可以使用蛋白純化技術(shù)領(lǐng)域技術(shù)人員所熟知的多種分離技術(shù)中的任一種。所述方法的例子包括,但不限于勻漿、過濾、離心、熱變性、硫酸銨沉淀、脫鹽、pH沉淀、離子交換層析、疏水相互作用層析和親合層析,其中,所述親合配體是一種底物、底物類似物或抑制劑。當(dāng)所述酶是以融合蛋白形式表達(dá)的時,所述純化方法可以包括使用對連接在所述表達(dá)的酶上的融合蛋白標(biāo)記專一的親合樹脂,或含有對所述酶專一的配體的親合樹脂。例如,一種酶可以作為連接于硫氧還蛋白的C-末端的融合蛋白表達(dá)。另外,可將(His)6肽通過工程方法插入融合硫氧還蛋白的N-末端,以便提供親合純化的額外機(jī)會。可以通過將合適的配體與諸如Sepharose-4B的任何合適的樹脂上合成其它合適的親合樹脂。在另一種實施方案中,可以用二硫蘇糖醇洗脫硫氧還蛋白融合蛋白,不過,洗脫還可以用其它試劑實現(xiàn),這種試劑能通過相互作用將硫氧還蛋白從所述樹脂上排出。所述試劑包括β-巰基乙醇或其它還原性硫醇。如果需要,可以通過上述傳統(tǒng)方法對洗脫的融合蛋白進(jìn)行進(jìn)一步純化。硫氧還蛋白融合蛋白和所述生物合成酶的蛋白裂解可以在所述融合蛋白純化之后進(jìn)行,或者該蛋白仍然結(jié)合在ThioBondTM親合樹脂或其它樹脂上的情況下實現(xiàn)。
可將單獨的或融合蛋白形式的粗制的、部分純化的或純化的酶用于分析,以便評價化合物抑制本文所披露的植物氨基酸生物合成酶的酶促活性的能力。分析可以在能產(chǎn)生最佳酶促活性的眾所周知的實驗條件下進(jìn)行。對很多這種類型的酶進(jìn)行分析的例子可以參見酶學(xué)方法第五卷(Colowick和Kaplan著)學(xué)術(shù)出版社,紐約或酶學(xué)方法第17卷(Tabor和Tabor著)學(xué)術(shù)出版社,紐約。具體例子可以參見以下參考文獻(xiàn),其中的每一份參考文獻(xiàn)均被收作本文的參考文獻(xiàn)二氫吡啶二羧酸還原酶可以用披露于以下文獻(xiàn)中的方法分析Farkas等(1965)生物與化學(xué)雜志2404717-4722,或Cremer等(1988)普通微生物學(xué)雜志1343221-3229;二氨基庚二酸差向異構(gòu)酶可以用披露于以下著作(1962)中的方法進(jìn)行酶學(xué)方法第五卷(Colowick和Kaplan編)858-864,學(xué)術(shù)出版社,紐約;蘇氨酸合酶的分析可以用披露于以下文獻(xiàn)中的方法進(jìn)行Giovanelli等(1984)植物生理學(xué)76285-292或Curien等(1996)FEBS通訊39085-90;蘇氨酸脫氨酶可以用披露于以下文獻(xiàn)中的方法進(jìn)行Tomova等(1968)生物化學(xué)(USSR)33200-208或Dougall(1970)植物化學(xué)9959-964;而S-腺苷甲硫氨酸合酶的分析可以披露于以下文獻(xiàn)中的方法進(jìn)行Mudd(1960)生物化學(xué)生物生理學(xué)學(xué)報38354-255或Boerjan(1994)植物細(xì)胞61401-1414。
序列表(1)一般資料(i)申請人(A)收件人E.I.DU PONT DE NEMOURS AND COMPANY(B)街道1007 MARKET STREET(C)城市WILMINGTON(D)州DELAWARE(E)國家美國(F)郵編19898(G)電話302-992-4926(H)傳真302-773-0164(I)電傳6717325(ii)發(fā)明名稱植物氨基酸生物合成酶(iii)序列數(shù)43(iv)計算機(jī)可讀形式(A)媒體類型3.5寸盤(B)計算機(jī)IBM PC兼容(C)操作系統(tǒng)微軟windows95(D)軟件微軟word7.0A版(v)當(dāng)前申請數(shù)據(jù)(A)申請?zhí)?B)申請日(C)分類號(vi)在先申請數(shù)據(jù)(A)申請?zhí)?0/048,771(B)申請日1997年6月6日(vii)律師/代理人資料(A)姓名MAJARIAN,WILLIAM R.
(B)注冊號41,173(C)資料/文件號BB-1087(2)序列1資料(i)序列特征
(A)長度908個堿基對(B)類型核酸(C)鏈型單(D)拓?fù)浣Y(jié)構(gòu)線形(ii)分子類型cDNA(vii)直接來源(B)克隆csiln.pk0042.a3(xi)序列描述序列1ACGCGGGACA GATAAGTGGC ATGGACGAGC CGCTGGAGAT CCCTGTGCTG AACGACCTCA 60CCATGGTTCT GGGCTCCATA GCGCAGTCGA GAGCAACCGG CGTGGTGGTC GACTTCAGCG 120AGCCTTCAGC TGTTTACGAC AATGTCAAGC AGGCAGCGGC GTTTGGTCTG AGCAGCGTCG 180TCTACGTTCC GAAAATCGAG CTAGAGACAG TGACTGAACT GTCAGCGTTC TGCGAGAAGG 240CAAGCGGCTG CTTGGTTGCG CCAACGCTGT CGATTGGGTC CGTGCTCCTT CAGCAAGCGG 300CTATACAGGC CTCGTTCCAC TACAGCAACG TTGAGATTGT GGAATCGAGA CCAAACCCAT 360CGGATCTTCC ATCGCAAGAT GCAATCCAGA TTGCAAACAA CATATCAGAC CTTGGTCAGA 420TATACAACAG GGAAGATATG GATTCCAGCA GTCCAGCCAG AGGCCAGCTG CTCGGGGAAG 480ACGGAGTGCG CGTGCACAGC ATGGTTCTCC CTGGTCTCGT CTCCAGCACG TCGATCAACT 540TCTCTGGCCC AGGAGAGATG TACACCTTAC GGCATGACGT TGCGAATGTT CAGTGCCTGA 600TGCCAGGACT GATCCTGGCG ATACGGAAGG TGGTGCGGTT CAAGAACTTG ATTTATGGGC 660TAGAGAAGTT CTTGTAGTGA ACAACAAACA ACCAATGCAA AACATCGACA GGCAACAGGC 720AAGGCAGATA TCATCTGACG TCGCAACAAC CAAAACGACA GAGATTTGGA AAATAAAGGC 780TGCACAGAAG ACGTCTGGGG TTTTGTGTGC ACCAGGCTGC GCAGAGAACG TCTGTCATTT 840TGTGTGCACC ACTACGGCAC TACCTGCTGA GCGCGATTTT TATAAAAAAG GCATGGGAGG 900GAGATCAT 908(2)序列2資料(i)序列特征(A)長度224個氨基酸(B)類型氨基酸(C)鏈型不相關(guān)(D)拓?fù)浣Y(jié)構(gòu)線形(ii)分子類型肽
(vii)直接來源(B)克隆csiln.pk0042.a3(xi)序列描述序列2Ala Gly Gln Ile Ser Gly Met Asp Glu Pro Leu Glu Ile Pro Val Leu1 5 10 15Asn Asp Leu Thr Met Val Leu Gly Ser Ile Ala Gln Ser Arg Ala Thr20 25 30Gly Val Val Val Asp Phe Ser Glu Pro Ser Ala Val Tyr Asp Asn Val35 40 45Lys Gln Ala Ala Ala Phe Gly Leu Ser Ser Val Val Tyr Val Pro Lys50 55 60Ile Glu Leu Glu Thr Val Thr Glu Leu Ser Ala Phe Cys Glu Lys Ala65 70 75 80Ser Gly Cys Leu Val Ala Pro Thr Leu Ser Ile Gly Ser Val Leu Leu85 90 95Gln Gln Ala Ala Ile Gln Ala Ser Phe His Tyr Ser Asn Val Glu Ile100 105 110Val Glu Ser Arg Pro Asn Pro Ser Asp Leu Pro Ser Gln Asp Ala Ile115 120 125Gln Ile Ala Asn Asn Ile Ser Asp Leu Gly Gln Ile Tyr Asn Arg Glu130 135 140Asp Met Asp Ser Ser Ser Pro Ala Arg Gly Gln Leu Leu Gly Glu Asp145 150 155 160Gly Val Arg Val His Ser Met Val Leu Pro Gly Leu Val Ser Ser Thr165 170 175Ser Ile Asn Phe Ser Gly Pro Gly Glu Met Tyr Thr Leu Arg His Asp180 185 190Val Ala Asn Val Gln Cys Leu Met Pro Gly Leu Ile Leu Ala Ile Arg195 200 205Lys Val Val Arg Phe Lys Asn Leu Ile Tyr Gly Leu Glu Lys Phe Leu210 215 220(2)序列3資料(i)序列特征(A)長度339個堿基對(B)類型核酸(C)鏈型單(D)拓?fù)浣Y(jié)構(gòu)線形(ii)分子類型cDNA(vii)直接來源
(B)克隆rls2.pk0017.d3(xi)序列描述序列3AAGATTGGCA GGAGAAATGC AGCAAAGGTC CTCTGCTCAA CGCAGATGCC GCCATCTCAG 60AGCACAATCA AGGTTGTTAT CATTGGGGCG ACAAAAGAGA TTGGAAGAAC GGCAATAGCG120GCAGTAAGTA AAGCAAGGGG AATGGAGCTT GCAGGGGCCA TAGATTCTCA GTGTATAGGC180CTAGATGCAG GAGAGATAAG TGGCATGGGA AGAACCCTGG AAATTCCGGT GCTCAATGAT240CTCACAATGG TTCTGGGCTC AATTGCACAA ACCAGAGCAA CTGGAGTGGT GGTTGATTTT300AGTGAACCTT CAACTGTTTA TGATAATGTC AAACAGGCA 339(2)序列4資料(i)序列特征(A)長度113個氨基酸(B)類型氨基酸(C)鏈型不相關(guān)(D)拓?fù)浣Y(jié)構(gòu)線形(ii)分子類型肽(vii)直接來源(B)克隆rls2.pk0017.d3(xi)序列描述序列4Lys Ile Gly Arg Arg Asn Ala Ala Lys Val Leu Cys Ser Thr Gln Met1 5 10 15Pro Pro Ser Gln Ser Thr Ile Lys Val Val Ile Ile Gly Ala Thr Lys20 25 30Glu Ile Gly Arg Thr Ala Ile Ala Ala Val Ser Lys Ala Arg Gly Met35 40 45Glu Leu Ala Gly Ala Ile Asp Ser Gln Cys Ile Gly Leu Asp Ala Gly50 55 60Glu Ile Ser Gly Met Gly Arg Thr Leu Glu Ile Pro Val Leu Asn Asp65 70 75 80Leu Thr Met Val Leu Gly Ser Ile Ala Gln Thr Arg Ala Thr Gly Val85 90 95Val Val Asp Phe Ser Glu Pro Ser Thr Val Tyr Asp Asn Val Lys Gln100 105 110Ala(2)序列5資料(i)序列特征(A)長度275個氨基酸(B)類型氨基酸(C)鏈型不相關(guān)(D)拓?fù)浣Y(jié)構(gòu)線形(ii)分子類型肽(vii)原始來源(A)生物集胞藻(xi)序列描述序列5Met Ala Asn Gln Asp Leu Ile Pro Val Val Val Asn Gly Ala Ala Gly1 5 10 15Lys Met Gly Arg Glu Val Ile Lys Ala Val Ala Gln Ala Pro Asp Leu20 25 30Gln Leu Val Gly Ala Val Asp His Asn Pro Ser Leu Gln Gly Gln Asp35 40 45Ile Gly Glu Val Val Gly Ile Ala Pro Leu Glu Val Pro Val Leu Ala50 55 60Asp Leu Gln Ser Val Leu Val Leu Ala Thr Gln Glu Lys Ile Gln Gly65 70 75 80Val Met val Asp Phe Thr His Pro Ser Gly Val Tyr Asp Asn Val Arg85 90 95Ser Ala Ile Ala Tyr Gly Val Arg Pro Val Val Gly Thr Thr Gly Leu100 105 110Ser Glu Gln Gln Ile Gln Asp Leu Gly Asp Phe Ala Glu Lys Ala Ser115 120 125Thr Gly Cys Leu Ile Ala Pro Asn Phe Ala Ile Gly Val Leu Leu Met130 135 140Gln Gln Ala Ala Val Gln Ala Cys Gln Tyr Phe Asp His Val Glu Ile145 150 155 160Ile Glu Leu His His Asn Gln Lys Ala Asp Ala Pro Ser Gly Thr Ala165 170 175Ile Lys Thr Ala Gln Met Leu Ala Glu Met Gly Lys Thr Phe Asn Pro180 185 190Pro Ala Val Glu Glu Lys Glu Thr Ile Ala Gly Ala Lys Gly Gly Leu195 200 205Gly Pro Gly Gln Ile Pro Ile His Ser Ile Arg Leu Pro Gly Leu Ile210 215 220Ala His Gln Glu Val Leu Phe Gly Ser Pro Gly Gln Leu Tyr Thr Ile225 230 235 240Arg His Asp Thr Thr Asp Arg Ala Cys Tyr Met Pro Gly Val Leu Leu245 250 255Gly Ile Arg Lys Val Val Glu Leu Lys Gly Leu Val Tyr Gly Leu Glu260 265 270Lys Leu Leu275(2)序列6資料(i)序列特征(A)長度1012個堿基對(B)類型核酸(C)鏈型單(D)拓?fù)浣Y(jié)構(gòu)線形(ii)分子類型cDNA(vii)直接來源(B)克隆chp2.pk0008.h4(xi)序列描述序列6TATTGCCAGA GATGTGTGGT AATGGAGTCC GTTGCTTCGC TCGGTTTATA GCCGAGATTG 60AAAATCTGCA GGGGACAAAT AGATTCACTA TTCATACTGG TGCTGGAAAG ATCGTTCCTG 120AAATACAAAG TGATGGGCAG GTAAAGGTTG ATATGGGCGA GCCTATCCTT TCTGGACTAG 180ACATCCCCAC AAAACTGCTA GCTACCAAGA ACAAAGCTGT TGTTCAAGCT GAATTGGCAG 240TTGAGGGCTT AACATGGCAT GTCACATGTG TTAGCATGGG AAACCCTCAC TGTGTCACAT 300TTGGTGCAAA TGAGTTAAAG GTATTGCAGG TCGACGATTT AAAACTTAGC GAAATTGGGC 360CTAAATTTGA GCATCATGAA ATGTTTCCTG CTCGCACAAA CACAGAATTC GTACAGGTTT 420TGTCTCGCTC ACACCTCAAA ATGCGGGTCT GGGAACGTGG TGCTGGAGCA ACTCTTGCCT 480GTGGTACTGG TGCTTGTGCA GTGGTTGTTG CAGCTGTTCT TGAGGGTCGA GCTGAGCGGA 540AATGTGTAGT TGATTTGCCT GGCGGGCCAT TGGAAATTGA GTGGAGGGAG GATGACAATC 600ATGTTTACAT GACTGGTCCT GCAGAGGTCG TCTTTTATGG ATCTGTTGTT CACTAGGTAC 660TGGGGACCAA GATAGAAGGG TTGGCTGCCA CTCAGAGCTT GTGAGATTGG TTATAGTATC 720CATGAAACAG AGTGTTCTGG TACCAGTACA CTTGTTCAGA TATTCTTAAT TATGATTGCT 780TGATTTGGGT AGCMGTAGAG GCTTCGTTTT GAAGCATTCT AGTGTTCMCC TTTTGTACTC 840CTTTAGTTTG TCAGGTTTGA ACACTACATG GGTAACATGT CYTTCCCACC ATTTTCYGTT 900TCTTTTCTTT GTAAGTGAAC GCCAATGCAG TTTTAGTATT GTTTTCTATA GATTTGTCTT 960GATGCACTGG GCTTACTACT TATTTTCTGG TATGAATGCT GCCTATTTCC TG 1012(2)序列7資料(i)序列特征(A)長度217個氨基酸(B)類型氨基酸(C)鏈型不相關(guān)(D)拓?fù)浣Y(jié)構(gòu)線形(ii)分子類型肽(vii)直接來源(B)克隆chp2.pk0008.h4(xi)序列描述序列7Leu Pro Glu Met Cys Gly Asn Gly Val Arg Cys Phe Ala Arg Phe Ile1 5 10 15Ala Glu Ile Glu Asn Leu Gln Gly Thr Asn Arg Phe Thr Ile His Thr20 25 30Gly Ala Gly Lys Ile Val Pro Glu Ile Gln Ser Asp Gly Gln Val Lys35 40 45Val Asp Met Gly Glu Pro Ile Leu Ser Gly Leu Asp Ile Pro Thr Lys50 55 60Leu Leu Ala Thr Lys Asn Lys Ala Val Val Gln Ala Glu Leu Ala Val65 70 75 80Glu Gly Leu Thr Trp His Val Thr Cys Val Ser Met Gly Asn Pro His85 90 95Cys Val Thr Phe Gly Ala Asn Glu Leu Lys Val Leu Gln Val Asp Asp100 105 110Leu Lys Leu Ser Glu Ile Gly Pro Lys Phe Glu His His Glu Met Phe115 120 125Pro Ala Arg Thr Asn Thr Glu Phe Val Gln Val Leu Ser Arg Ser His130 135 140Leu Lys Met Arg Val Trp Glu Arg Gly Ala Gly Ala Thr Leu Ala Cys145 150 155 160Gly Thr Gly Ala Cys Ala Val Val Val Ala Ala Val Leu Glu Gly Arg165 170 175Ala Glu Arg Lys Cys Val Val Asp Leu Pro Gly Gly Pro Leu Glu Ile180 185 190Glu Trp Arg Glu Asp Asp Asn His Val Tyr Met Thr Gly Pro Ala Glu195 200 205Val Val Phe Tyr Gly Ser Val Val His210 215(2)序列8資料(i)序列特征(A)長度481個堿基對(B)類型核酸(C)鏈型單(D)拓?fù)浣Y(jié)構(gòu)線形(ii)分子類型cDNA(vii)直接來源(B)克隆rls48.pk0036.h10(xi)序列描述序列8TGTATCCGGC GCCGACGGTG TGATCTTCGT CATGCCGGGG GTCAATGGCG CGGACTACAC 60CATGAGGATC TTCAACTCGG ACGGCAGTGA GCCGGAGATG TGTGGCAATG GAGTCCGTTG 120CTTTGCCCGG TTTATAGCTG AGCTTGAAAA CCTACAGGGA ACACATAGCT TCAAAATTCA 180CACTGGCGCT GGGCTAATCA TTCCTGAAAT ACAAAATGAT GGCAAGGTAA AGGTTGATAT 240GGGCCAGCCC ATTCTCTCTG GACCAGATAT TCCAACAAAA CTGCCATCCA CCAAGAATGA 300AGCCGTTGTC CAAGCTGATT TGGGCAGTTG ATGGCTCAAC ATGGCAAGTA ACCTGTGTTA 360GCATGGGCAA TCCACATTGT GTCACATTTG GCACAAAGGA GCTCAAGGTT TTGCATGTTG 420ATGATTAAAG CTTAATGATA TTGGGGCCTA AATTCAGCAT CATGAAATGT TCCTGCCCCA 480C 481(2)序列9資料(i)序列特征(A)長度85個氨基酸(B)類型氨基酸(C)鏈型不相關(guān)(D)拓?fù)浣Y(jié)構(gòu)線形(ii)分子類型肽(vii)直接來源(B)克隆rls48.pk0036.h10(xi)序列描述序列9Val Ser Gly Ala Asp Gly Val Ile Phe Val Met Pro Gly Val Asn Gly1 5 10 15Ala Asp Tyr Thr Met Arg Ile Phe Asn Ser Asp Gly Ser Glu Pro Glu20 25 30Met Cys Gly Asn Gly Val Arg Cys Phe Ala Arg Phe Ile Ala Glu Leu35 40 45Glu Asn Leu Gln Gly Thr His Ser Phe Lys Ile His Thr Gly Ala Gly50 55 60Leu Ile Ile Pro Glu Ile Gln Asn Asp Gly Lys Val Lys Val Asp Met65 70 75 80Gly Gln Pro Ile Leu85(2)序列10資料(i)序列特征(A)長度1301個堿基對(B)類型核酸(C)鏈型單(D)拓?fù)浣Y(jié)構(gòu)線形(ii)分子類型cDNA(xi)序列描述序列10ATCCCTTATT AAGCAGGGGT TTCGCGGCGC GAGACGGTGA CACTGGCAGA GTGGAATTTC 60CGCCGCCATT CGAAGCTACA GCGATGGCCA TAACCGCCAC CATTTCCGTT CCCCTCACAT 120CCCCCAGTCG CCGCACTCTC ACCTCCGTCA ATAGCCTCTC TCCCCTTTCT ACCCGATCCA 180CTTTGCCCAC ACCGCAACGC ACTTTCAAAT ACCCTAATTC GCGCCTCGTC GTGTCTTCCA 240TGAGCACCGA AACAGCCGTC AAAACTTCAT CCGCCTCCTT CCTCAACCGC AAGGAGTCCG 300GCTTCCTCCA TTTCGCCAAG TACCACGGCC TCGGAAACGA CTTCGTTTTG ATTGACAATA 360GAGACTCCTC CGAGCCCAAG ATCAGTGCTG AGAAAGCGGT GCAACTGTGT GATCGGAACT 420TCGGCGTTGG AGCTGACGGA GTTATCTTTG TCTTGCCTGG CATCAGTGGC ACCGATTATA 480CCATGAGGAT TTTTAACTCT GATGGTAGTG AGCCTGAGAT GTGTGGCAAT GGAGTTCGAT 540GCTTTGCCAA ATTTGTTTCT CAGCTTGAGA ATTTACATGG GAGGCATAGT TTTACCATTC 600ATACTGGTGC TGGTCTGATT ATTCCTGAAG TCTTGGAGGA TGGAAATGTC AGAGTTGATA 660TGGGGGAGCC AGTTCTTAAA GCCTTGGATG TGCCTACTAA ATTACCTGCA AATAAGGATA 720ATGCTGTTGT TAAATCACAG CTAGTTGTAG ATGGAGTTAT TTGGCATGTG ACCTGTGTTA 780GCATGGGGAA TCCACACTGT GTAACTTTCA GTAGAGAAGG AAGCCAGAAT TTGCTTGTTG 840ATGAATTGAA GCTAGCAGAA ATTGGGCCAA AATTTGAACA TCATGAGGTG TTCCCTGCAC 900GAACTAACAC AGAGTTTGTG CAAGTATTAT CTAACTCTCA CTTGAAAATG CGTGTTTGGG 960AGCGGGGAGC AGGAGCAACC CTAGCCTGTG GAACTGGAGC TTGTGCTACT GTTGTTGCAG 1020CAGTTCTTGA GGGTCGTGCT GGGAGGAATT GCACGGTTGA TCTACCTGGA GGGCCTCTTC 1080AGATTGAGTG GAGGGAGGAA GATAATCATG TTTATATGAC AGGCTCAGCC GATGTAGTTT 1140ATTATGGTTC TTTGCCCCTT TGATATGTTG CCCCCATTGT TAAACCCAAT ATGGAATTAG 1200GAATTGGTGA ATAATATTTG TATGAGAGGT GGACTTTCTG CTTGTTCCTA ATATTTTGCC 1260ACGTCTTTAT AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA A 1301(2)序列11資料(i)序列特征(A)長度359個氨基酸(B)類型氨基酸(C)鏈型不相關(guān)(D)拓?fù)浣Y(jié)構(gòu)線形(ii)分子類型肽(xi)序列描述序列11Met Ala Ile Thr Ala Thr Ile Ser Val Pro Leu Thr Ser Pro Ser Arg1 5 10 15Arg Thr Leu Thr Ser Val Asn Ser Leu Ser Pro Leu Ser Thr Arg Ser20 25 30Thr Leu Pro Thr Pro Gln Arg Thr Phe Lys Tyr Pro Asn Ser Arg Leu35 40 45Val Val Ser Ser Met Ser Thr Glu Thr Ala Val Lys Thr Ser Ser Ala50 55 60Ser Phe Leu Asn Arg Lys Glu Ser Gly Phe Leu His Phe Ala Lys Tyr65 70 75 80His Gly Leu Gly Asn Asp Phe Val Leu Ile Asp Asn Arg Asp Ser Ser85 90 95Glu Pro Lys Ile Ser Ala Glu Lys Ala Val Gln Leu Cys Asp Arg Asn100 105 110Phe Gly Val Gly Ala Asp Gly Val Ile Phe Val Leu Pro Gly Ile Ser115 120 125Gly Thr Asp Tyr Thr Met Arg Ile Phe Asn Ser Asp Gly Ser Glu Pro130 135 140Glu Met Cys Gly Asn Gly Val Arg Cys Phe Ala Lys Phe Val Ser Gln145 150 155 160Leu Glu Asn Leu His Gly Arg His Ser Phe Thr Ile His Thr Gly Ala165 170 175Gly Leu Ile Ile Pro Glu Val Leu Glu Asp Gly Asn Val Arg Val Asp180 185 190Met Gly Glu Pro Val Leu Lys Ala Leu Asp Val Pro Thr Lys Leu Pro195 200 205Ala Asn Lys Asp Asn Ala Val Val Lys Ser Gln Leu Val Val Asp Gly210 215 220Val Ile Trp His Val Thr Cys Val Ser Met Gly Asn Pro His Cys Val225 230 235 240Thr Phe Ser Arg Glu Gly Ser Gln Asn Leu Leu Val Asp Glu Leu Lys245 250 255Leu Ala Glu Ile Gly Pro Lys Phe Glu His His Glu Val Phe Pro Ala260 265 270Arg Thr Asn Thr Glu Phe Val Gln Val Leu Ser Asn Ser His Leu Lys275 280 285Met Arg Val Trp Glu Arg Gly Ala Gly Ala Thr Leu Ala Cys Gly Thr290 295 300Gly Ala Cys Ala Thr Val Val Ala Ala Val Leu Glu Gly Arg Ala Gly305 310 315 320Arg Asn Cys Thr Val Asp Leu Pro Gly Gly Pro Leu Gln Ile Glu Trp325 330 335Arg Glu Glu Asp Asn His Val Tyr Met Thr Gly Ser Ala Asp Val Val340 345 350Tyr Tyr Gly Ser Leu Pro Leu355(2)序列12資料(i)序列特征(A)長度602個堿基對(B)類型核酸(C)鏈型單(D)拓?fù)浣Y(jié)構(gòu)線形(ii)分子類型cDNA(vii)直接來源(B)克隆wlm24.pk0030.g4(xi)序列描述序列12CTCCACCGCC CCCTCCTCGG GCGGTCGCCT CCTCCGTCCG TTCTGTGGGA ATCCGCGCCC60CCGCCGCGCC GTCGCCTCGA TGGCCGTGTC CGCTCCCAAG TCGCCAGCCG CCGCCTCGTT 120CCTCGAGCGC CGCGAGTCCG AGCGCGCGCT CCACTTCGTG AAGTACCAGG GCCTCGGCAA 180CGACTTCATA ATGGTCGACA ACAGGGATTC GGCCGTACCG AAGGTGACAC CGGAGGAGGC 240GGCGAAGCTA TGCGACCGAA ACTTTGGGTA TTGGGTGCTG ATGGCGTCAT CTTCGTCCTG 300CCGGGGGTCA ACGGCGCGGA CTACACTATG AGGATATTCA ACTCCGATGG CAGCAACCGG 360AATGTNTGGN ATGGATTCGT TGCTTGCTCG CTTTATACGG AGTTGAAATC TACANGGAAA 420CATACTTCAA AACAANAGGG GGCTGGATTA ATATCCTGAA ATANANACAT GNAAGTTANG 480TNATATGGGC AACAATCTTA TGGCANATTT CANAAAATGC ATCACAAGAT AACTTNTAAA 540ACGATTGAAT TAGGCAANAG AANTACCGTT ATAGGAACCC ATGAANCTTG TNAAATTAAG 600GT 602(2)序列13資料(i)序列特征(A)長度80個氨基酸(B)類型氨基酸(C)鏈型不相關(guān)(D)拓?fù)浣Y(jié)構(gòu)線形(ii)分子類型肽(vii)直接來源(B)克隆wlm24.pk0030.g4(xi)序列描述序列13Ala Leu His Phe Val Lys Tyr Gln Gly Leu Gly Asn Asp Phe Ile Met1 5 10 15Val Asp Asn Arg Asp Ser Ala Val Pro Lys Val Thr Pro Glu Glu Ala20 25 30Ala Lys Leu Cys Asp Arg Asn Phe Gly Xaa Gly Ala Asp Gly Val Ile35 40 45Phe Val Leu Pro Gly Val Asn Gly Ala Asp Tyr Thr Met Arg Ile Phe50 55 60Asn Ser Asp Gly Ser Asn Arg Asn Val Trp Xaa Gly Phe Val Ala Cys65 70 75 80(2)序列14資料(i)序列特征(A)長度279個氨基酸(B)類型氨基酸(C)鏈型不相關(guān)(D)拓?fù)浣Y(jié)構(gòu)線形(ii)分子類型肽(vii)原始來源(A)生物集胞藻(xi)序列描述序列14Met Ala Leu Ser Phe Ser Lys Tyr His Gly Leu Gly Asn Asp Phe Ile1 5 10 15Leu Val Asp Asn Arg Gln Ser Thr Glu Pro Cys Leu Thr Pro Asp Gln20 25 30Ala Gln Gln Leu Cys Asp Arg His Phe Gly Ile Gly Ala Asp Gly Val35 40 45Ile Phe Ala Leu Pro Gly Gln Gly Gly Thr Asp Tyr Thr Met Arg Ile50 55 60Phe Asn Ser Asp Gly Ser Glu Pro Glu Met Cys Gly Asn Gly Ile Arg65 70 75 80Cys Leu Ala Lys Phe Leu Ala Asp Leu Glu Gly Val Glu Glu Lys Thr85 90 95Tyr Arg Ile His Thr Leu Ala Gly Val Ile Thr Pro Gln Leu Leu Ala100 105 110Asp Gly Gln Val Lys Val Asp Met Gly Glu Pro Gln Leu Leu Ala Glu115 120 125Leu Ile Pro Thr Thr Leu Ala Pro Ala Gly Glu Lys Val Val Asp Leu130 135 140Pro Leu Ala Val Ala Gly Gln Thr Trp Ala Val Thr Cys Val Ser Met145 150 155 160Gly Asn Pro His Cys Leu Thr Phe Val Asp Asp Val Asp Ser Leu Asn165 170 175Leu Thr Glu Ile Gly Pro Leu Phe Glu His His Pro Gln Phe Ser Gln180 185 190Arg Thr Asn Thr Glu Phe Ile Gln Val Leu Gly Ser Asp Arg Leu Lys195 200 205Met Arg Val Trp Glu Arg Gly Ala Gly Ile Thr Leu Ala Cys Gly Thr210 215 220Gly Ala Cys Ala Thr Val Val Ala Ala Val Leu Thr Gly Arg Gly Asp225 230 235 240Arg Arg Cys Thr Val Glu Leu Pro Gly Gly Asn Leu Glu Ile Glu Trp245 250 255Ser Ala Gln Asp Asn Arg Leu Tyr Met Thr Gly Pro Ala Gln Arg Val260 265 270Phe Ser Gly Gln Ala Glu Ile275(2)序列15資料(i)序列特征(A)長度1160個堿基對(B)類型核酸(C)鏈型單(D)拓?fù)浣Y(jié)構(gòu)線形(ii)分子類型cDNA(vii)直接來源(B)克隆cc2.pk0031.c9(xi)序列描述序列15GTCGGCTGCG CGTCCACGGG AGACACCTCC GCCGCGCTCT CGGCCTACTG CGCAGCCGCG 60GGAATCCCCG CCATCGTGTT CCTGCCAGCG GACCGCATCT CGCTGCAGCA GCTCATCCAG120CCGATCGCCA ACGGCGCCAC CGTGCTCTCT CTAGACACTG ATTTTGATGG CTGCATGCGG180CTCATTCGCG AGGTCACTGC AGAGCTGCCA ATCTACCTTG CCAATTCGCT CAACCCGCTC240CGCCTTGAGG GGCAGAAGAC AGCGGCCATC GAGATATTGC AGCAGTTCAA TTGGCAGGTG300CCAGATTGGG TCATTGTTCC AGGAGGCAAT CTTGGGAATA TCTATGCATT CTACAAGGGG360TTTGAGATGT GCCGCGTTCT TGGACTTGTT GATCGCGTGC CACGGCTTGT CTGCGCACAG420GCTGCAAATG CAAATCCATT GTACCGGTAC TACAAGTCAG GTTGGACTGA GTTTGAGCCA480CAAACTGCCG AGACTACATT TGCATCTGCG ATACAGATTG GTGATCCTGT ATCTGTTGAC540CGTGCGGTGG TCGCGCTGAA GGCCACTGAC GGTATTGTGG AGGAGGCTAC AGAGGAGGAG600CTAATGGATG CAACGGCGCT TGCTGACCGC ACTGGGATGT TTGCTTGCCC ACATACTGGG660GTTGCACTTG CTGCTTTGTT TAAGCTTCAG GGTCAGCGTA TAATTGGCCC TAATGACCGC720ACTGTGGTTG TTAGCACAGC TCATGGGCTG AAGTTCACGC AGTCAAAGAT TGACTACCAT780GACAAAAACA TCAAAGACAT GGTTTGCCAG TATGCTAATC CACCGATCAG TGTGAAGGCT840GACTTTGGTT CTGTGATGGA TGTTCTCCAG AAAAATCTCA ATGGTAAGAT ATAAAGTTAT900ATGATTAATT AACCCTCCAA ACTGTTTTTT TTTGTTTTTT CGTTCCAGGA ATTTTATTCC 960TGAGTCTTTC AACTTTGTTT GGTGAACATG GTATGGTGCT AAAATCTAGA CCTAATACCT1020TGTAGTACTA GTTCTGGAGG CTCTTTTGGT TGTAGGTCGA AGTGGATAGA GCTGTTCCTT1080GTACTTTATC TGTTTCATGT AATATGAATA ATAAATTATG GTCTAAATAT TTGAATAAAA1140AATCGTTTGG AATGACCCAC1160(2)序列16資料(i)序列特征(A)長度297個氨基酸(B)類型氨基酸(C)鏈型不相關(guān)(D)拓?fù)浣Y(jié)構(gòu)線形(ii)分子類型肽(vii)直接來源(B)克隆cc2.pk0031.c9(xi)序列描述序列16Val Gly Cys Ala Ser Thr Gly Asp Thr Ser Ala Ala Leu Ser Ala Tyr1 5 10 15Cys Ala Ala Ala Gly Ile Pro Ala Ile Val Phe Leu Pro Ala Asp Arg20 25 30Ile Ser Leu Gln Gln Leu Ile Gln Pro Ile Ala Asn Gly Ala Thr Val35 40 45Leu Ser Leu Asp Thr Asp Phe Asp Gly Cys Met Arg Leu Ile Arg Glu50 55 60Val Thr Ala Glu Leu Pro Ile Tyr Leu Ala Asn Ser Leu Asn Pro Leu65 70 75 80Arg Leu Glu Gly Gln Lys Thr Ala Ala Ile Glu Ile Leu Gln Gln Phe85 90 95Asn Trp Gln Val Pro Asp Trp Val Ile Val Pro Gly Gly Asn Leu Gly100 105 110Asn Ile Tyr Ala Phe Tyr Lys Gly Phe Glu Met Cys Arg Val Leu Gly115 120 125Leu Val Asp Arg Val Pro Arg Leu Val Cys Ala Gln Ala Ala Asn Ala130 135 140Asn Pro Leu Tyr Arg Tyr Tyr Lys Ser Gly Trp Thr Glu Phe Glu Pro145 150 155 160Gln Thr Ala Glu Thr Thr Phe Ala Ser Ala Ile Gln Ile Gly Asp Pro165 170 175Val Ser Val Asp Arg Ala Val Val Ala Leu Lys Ala Thr Asp Gly Ile180 185 190Val Glu Glu Ala Thr Glu Glu Glu Leu Met Asp Ala Thr Ala Leu Ala195 200 205Asp Arg Thr Gly Met Phe Ala Cys Pro His Thr Gly Val Ala Leu Ala210 215 220Ala Leu Phe Lys Leu Gln Gly Gln Arg Ile Ile Gly Pro Asn Asp Arg225 230 235 240Thr Val Val Val Ser Thr Ala His Gly Leu Lys Phe Thr Gln Ser Lys245 250 255Ile Asp Tyr His Asp Lys Asn Ile Lys Asp Met Val Cys Gln Tyr Ala260 265 270Asn Pro Pro Ile Ser Val Lys Ala Asp Phe Gly Ser Val Met Asp Val275 280 285Leu Gln Lys Asn Leu Asn Gly Lys Ile290 295(2)序列17資料(i)序列特征(A)長度325個堿基對(B)類型核酸(C)鏈型單(D)拓?fù)浣Y(jié)構(gòu)線形(ii)分子類型cDNA(vii)直接來源(B)克隆csl.pk0058.g5(xi)序列描述序列17ATGGCTTGCA AGTACTCCAA CCCGCCTGTG AGCGTGAAGG CTGACTTTGG CGCCGTGATG 60GATGTGCTGA AGAAGAGGCT CAAGGGCAAG CTCTGAGCGC CTGTGCCTGG CTAATGCAAT 120CAACTGATTG GAATGCAGTG GTTTCGTCGG TATCGGGGGG TCTTTTAGGC TTCAGAAATT 180CTGTCTGGGT TAGACTATTT GTTTGTGGAG TTTAGCAGGA GAATGGCTAT CTCTCCTGCA 240AGACTGGCGC TCTTTCTTGT GCTACGAATG TGTTACCATG GATAATAAGT GTAGTCGCTG 300TCGGATTGAA TAATCAAAAA AAAAN325(2)序列18資料(i)序列特征(A)長度31個氨基酸(B)類型氨基酸(C)鏈型不相關(guān)(D)拓?fù)浣Y(jié)構(gòu)線形(ii)分子類型肽(vii)直接來源(B)克隆csl.pk0058.g5(xi)序列描述序列18Met Ala Cys Lys Tyr Ser Asn Pro Pro Val Ser Val Lys Ala Asp Phe1 5 10 15Gly Ala Val Met Asp Val Leu Lys Lys Arg Leu Lys Gly Lys Leu20 25 30(2)序列19資料(i)序列特征(A)長度528個堿基對(B)類型核酸(C)鏈型單(D)拓?fù)浣Y(jié)構(gòu)線形(ii)分子類型cDNA(vii)直接來源(B)克隆rls72.pk0018.e7(xi)序列描述序列19ACACCCAACA CGCAGACTTG ACAGATTCTG CTACTACAAA TCCTGCATAT TTAACAGCGC 60TGCAACTCGA CGATGGAGAA CGGTGCTGCA ACCAACGGGG CGTCGGAGAA GTCGCACTCT120CCTTCACAGA CCTACCTCTC CACAAGGGGA GACGATTATG GGCTCTCATT CGAGACCGTC180GTCCTCAAAG GTCTTGCGGC TGACGGGGGT CTTTTCCTGC CCGAGGAAGT GCCCGCGGCA240ACCGAGTGGC AAAGCTGGAA AGACCTGCCC TACACCGAGC TTGCCGTCAA GGTTCTCAGC300TTGTACATCT CCCCCGCCGA GGTGCCGACG GAAGACCTCA GGGCGCTCGT CGAGCGCAGC360TACTCGACCT TCCGATCCAA GGAGGTTGTG CCGCTGGTGA AGCTGGAGGA CAACCTTCAC 420CTGCTGGAGC TATTCCACGG CCCCAACTAC TCGTTCAAGG ACTGCGCGCT GCAATTCCTT 480GGTAACCTCN TCGAGTACTT TTGACTCNCA AGAACAAGGG AAAGGAGG528(2)序列20資料(i)序列特征(A)長度143個氨基酸(B)類型氨基酸(C)鏈型不相關(guān)(D)拓?fù)浣Y(jié)構(gòu)線形(ii)分子類型肽(vii)直接來源(B)克隆rls72.pk0018.e7(xi)序列描述序列20Met Glu Asn Gly Ala Ala Thr Asn Gly Ala Ser Glu Lys Ser His Ser1 5 10 15Pro Ser Gln Thr Tyr Leu Ser Thr Arg Gly Asp Asp Tyr Gly Leu Ser20 25 30Phe Glu Thr Val Val Leu Lys Gly Leu Ala Ala Asp Gly Gly Leu Phe35 40 45Leu Pro Glu Glu Val Pro Ala Ala Thr Glu Trp Gln Ser Trp Lys Asp50 55 60Leu Pro Tyr Thr Glu Leu Ala Val Lys Val Leu Ser Leu Tyr Ile Ser65 70 75 80Pro Ala Glu Val Pro Thr Glu Asp Leu Arg Ala Leu Val Glu Arg Ser85 90 95Tyr Ser Thr Phe Arg Ser Lys Glu Val Val Pro Leu Val Lys Leu Glu100 105 110Asp Asn Leu His Leu Leu Glu Leu Phe His Gly Pro Asn Tyr Ser Phe115 120 125Lys Asp Cys Ala Leu Gln Phe Leu Gly Asn Leu Xaa Glu Tyr Phe130 135 140(2)序列21資料(i)序列特征(A)長度571個堿基對
(B)類型核酸(C)鏈型單(D)拓?fù)浣Y(jié)構(gòu)線形(ii)分子類型cDNA(vii)直接來源(B)克隆sel.06a03(xi)序列描述序列21GGATGCAATG GTGCAGGCTG ATTCCACTGG AATGTTCATA TGTCCACACA CTGGGGTGGC60TCTGGCGGCG CTTATTAAGC TGAGGAATCG TGGGGTTATC GGTGCCGGTG AGAGGGTTGT 120GGTGGTGAGC ACTGCACATG GATTGAAGTT TGCACAGAGC AAGATTGATT ATCATTCTGG 180GCTCATTCCT GGAATGGGCC GCTATGCTAA CCCGCTGGTT TCGGTTAAGG CGGATTTTGG 240ATCGGTCATG GATGTTCTCA AGGATTCTTG CACAACAAGT CCCCCGACTT TAACAAGTCT 300TGACGTTGCC AAGTAAGTTT TAGTTCGGGG TTTTTTCTGA TTAAAGATGT TTTTAAACAT 360GTTTGTGTNC ACTTTCGGTC GTTATTATGG ATTTGTAAGA TTGGGCCCAA GTATTCGAGG 420GTTTGATTTC AAACAACATG CTTCTGGTGA CGCAATGCAA ATTTCGGNGC ATAACATCAT 480TGTCGAAGAT GGATCNCGAC CGATGAAACT GTGTGGCAAG TAATGAGAAG AAAATAGGGC 540ACTTGTACAG AGATTTNAAA GNTTAATTTC N 571(2)序列22資料(i)序列特征(A)長度104個氨基酸(B)類型氨基酸(C)鏈型不相關(guān)(D)拓?fù)浣Y(jié)構(gòu)線形(ii)分子類型肽(vii)直接來源(B)克隆sel.06a03(xi)序列描述序列22Asp Ala Met Val Gln Ala Asp Ser Thr Gly Met Phe Ile Cys Pro His1 5 10 15Thr Gly Val Ala Leu Ala Ala Leu Ile Lys Leu Arg Asn Arg Gly Val20 25 30Ile Gly Ala Gly Glu Arg Val Val Val Val Ser Thr Ala His Gly Leu35 40 45Lys Phe Ala Gln Ser Lys Ile Asp Tyr His Ser Gly Leu Ile Pro Gly50 55 60Met Gly Arg Tyr Ala Asn Pro Leu Val Ser Val Lys Ala Asp Phe Gly65 70 75 80Ser Val Met Asp Val Leu Lys Asp Ser Cys Thr Thr Ser Pro Pro Thr85 90 95Leu Thr Ser Leu Asp Val Ala Lys100(2)序列23資料(i)序列特征(A)長度2191個堿基對(B)類型核酸(C)鏈型單(D)拓?fù)浣Y(jié)構(gòu)線形(ii)分子類型cDNA(vii)直接來源(B)克隆srl.pk0003.f6(xi)序列描述序列23GCTTCCTCTT CTCTGTTTCA GTCTCTCCCT TTCTCTCTCC AAACCTCTAA ACCCTACGCG60CCTCCCAAAC CCGCCGCCCA CTTCGTTGTC CGCGCCCAAT CCCCCCTCAC TCAGAACAAC 120AACTCCTCCT CCAAGCATCG CCGCCCCGCC GACGAGAACA TCCGCGACGA GGCCCGCCGC 180ATCAATGCGC CCCACGACCA CCACCTCTTC TCGGCCAAGT ACGTCCCCTT CAACGCCGAC 240TCCTCCTCCT CCTCCTCCAC GGAGTCCTAC TCGCTCGACG AGATCGTCTA CCGCTCCCAA 300TCCGGCGGCC TCCTGGACGT CCAGCACGAC ATGGATGCCC TCAAGCGTTT CGACGGCGAG 360TACTGGCGCA ACCTCTTCGA CTCGCGCGTG GGCAAAACCA CCTGGCCTTA CGGCTCCGGC 420GTCTGGAGCA AAAAAGAATG GGTCCTCCCC GAGATCCACG ACGACGATAT CGTCTCCGCC 480TTCGAGGGTA ACTCCAACCT CTTCTGGGCC GAGCGTTTCG GCAAACAGTT CCTCGGCATG 540AACGATTTGT GGGTCAAACA CTGCGGAATC AGCCACACGG GCAGCTTCAA GGATCTCGGC600ATGACCGTCC TCGTCAGCCA GGTCAATCGC TTGAGAAAAA TGAACCGCCC CGTCGTCGGT660GTTGGTTGCG CCTCCACCGG TGACACATCG GCCGCTTTAT CCGCCTATTG CGCTTCCGCT720GCCATTCCTT CCATTGTGTT TTTGCCTGCT AATAAAATCT CTCTTGCCCA ACTTGTTCAG780CCTATTGCCA ATGGAGCCTT TGTGTTGAGT ATCGACACTG ATTTTGATGG TTGCATGCAG840TTGATCAGAG AAGTCACTGC TGAATTGCCT ATTTATTTGG CTAACTCTCT CAACAGTTTG900AAGTTGGAAG GGCAGAAAAC TGCTGCTATT GAGATTCTGC AGCAGTTTGA TTGGCAGGTT960CCTGATTGGG TCATTGTGCC TGGAAGCAAC CTTGGCAACA TTTATGCCTT TTACAAAGGG 1020TTTAAGATGT TTCAAGAGCT TGGGCTTGTG GATAAGATTC CAAGGCTTGT TTGTGCTCAG 1080GCTGCCAATG CTGATCCTTT GTATTTGTAC TTTAAATCCG GGTGGAAGGA GTTTAAGCCT 1140GTGAAGTCGA GCACTACATT TGCTTCTGCC ATTCAAATTG GTGATCCTGT TTCCATTGAC 1200AGGGCGGTTC ACGCGCTAAA GAGTTGCGAT GGGATTGTGG AGGAGGCCAC GGAGGAGGAG 1260TTGATGGATG CTACAGCGCA GGCGGATTCT ACTGGGATGT TTATTTGCCC CCACACCGGG 1320GTTGCTTTAA CTGCATTGTT TAAGCTCAGG AACAGCGGGG TTATTAAGGC CACTGATAGG 1380ACTGTGGTGG TTAGCACTGC TCATGGCTTG AAGTTCACTC AGTCCAAGAT TGATTACCAT 1440TCTAAGGACA TCAAGGACAT GGCTTGCCGC TATGCTAACC CGCCCATGCA AGTGAAGGCA 1500GACTTTGGCT CGGTTATGGA TGTTTTGAAG ACGTATTTGC AGAGTAAGGC TCATTAGGTT 1560AGCATTGCAA GTTTTGCTCC TCCTGAGTTT GCTCATTATT TACTTACTTT TAGGCACTAC 1620TGCTGTATTG TCTTTTCTAT GAGCTAGGTT TGAGTGTTGT AATAATTTGC TTGCTGCATT 1680ATGTATGCCG TCTAGTGTTC CATATTGGGC ATCATCCTTA GTATTTGTTG TAGATTTTCT 1740TTGCTGAGCA TTTGATATAA TAGCTCAAGT AGGAAAATGA ATTGGGTACT ATGAGGAATG 1800CATATCATTG GCTTGTTATT ACTGGATTCC AGACCACCCC AAAAGAAAAT AATTCCAAAA 1860AATATAATTA GAACAAATTT CGTCCTTGTT ATGCTGTTGG CATTAAGCTC AGTGTGGGTA 1920TTACCAAGCA ACTCGAAATC AAGAGAAAAA AAAATTGACA GCAAAGGAGC TGCATTGTTG 1980GACTGAGTCA CATCACTTCA TTGCTATGTC GTCATATTTC GTTGAATTAC GGGAAGGCAG 2040CATGCACAGC AATATGCAGC GATTAACTGA AGCCACACCG CACACATTGA AGTAGTAGTC 2100AATTTAGACA CTCCATCTTG TACTTTCTAC AAAAATGAAT TTTTCTTAGC CATTAAGTAT 2160AATATTTTAT TCTAAAAAAA AAAAAAAAAA A 2191(2)序列24資料(i)序列特征(A)長度518個氨基酸(B)類型氨基酸
(C)鏈型不相關(guān)(D)拓?fù)浣Y(jié)構(gòu)線形(ii)分子類型肽(vii)直接來源(B)克隆srl.pk0003.f6(xi)序列描述序列24Ala Ser Ser Ser Leu Phe Gln Ser Leu Pro Phe Ser Leu Gln Thr Ser1 5 10 15Lys Pro Tyr Ala Pro Pro Lys Pro Ala Ala His Phe Val Val Arg Ala20 25 30Gln Ser Pro Leu Thr Gln Asn Asn Asn Ser Ser Ser Lys His Arg Arg35 40 45Pro Ala Asp Glu Asn Ile Arg Asp Glu Ala Arg Arg Ile Asn Ala Pro50 55 60His Asp His His Leu Phe Ser Ala Lys Tyr Val Pro Phe Asn Ala Asp65 70 75 80Ser Ser Ser Ser Ser Ser Thr Glu Ser Tyr Ser Leu Asp Glu Ile Val85 90 95Tyr Arg Ser Gln Ser Gly Gly Leu Leu Asp Val Gln His Asp Met Asp100 105 110Ala Leu Lys Arg Phe Asp Gly Glu Tyr Trp Arg Asn Leu Phe Asp Ser115 120 125Arg Val Gly Lys Thr Thr Trp Pro Tyr Gly Ser Gly Val Trp Ser Lys130 135 140Lys Glu Trp Val Leu Pro Glu Ile His Asp Asp Asp Ile Val Ser Ala145 150 155 160Phe Glu Gly Asn Ser Asn Leu Phe Trp Ala Glu Arg Phe Gly Lys Gln165 170 175Phe Leu Gly Met Asn Asp Leu Trp Val Lys His Cys Gly Ile Ser His180 185 190Thr Gly Ser Phe Lys Asp Leu Gly Met Thr Val Leu Val Ser Gln Val195 200 205Asn Arg Leu Arg Lys Met Asn Arg Pro Val Val Gly Val Gly Cys Ala210 215 220Ser Thr Gly Asp Thr Ser Ala Ala Leu Ser Ala Tyr Cys Ala Ser Ala225 230 235 240Ala Ile Pro Ser Ile Val Phe Leu Pro Ala Asn Lys Ile Ser Leu Ala245 250 255Gln Leu Val Gln Pro Ile Ala Asn Gly Ala Phe Val Leu Ser Ile Asp260 265 270Thr Asp Phe Asp Gly Cys Met Gln Leu Ile Arg Glu Val Thr Ala Glu275 280 285Leu Pro Ile Tyr Leu Ala Asn Ser Leu Asn Ser Leu Lys Leu Glu Gly290 295 300Gln Lys Thr Ala Ala Ile Glu Ile Leu Gln Gln Phe Asp Trp Gln Val305 310 315 320Pro Asp Trp Val Ile Val Pro Gly Ser Asn Leu Gly Asn Ile Tyr Ala325 330 335Phe Tyr Lys Gly Phe Lys Met Phe Gln Glu Leu Gly Leu Val Asp Lys340 345 350Ile Pro Arg Leu Val Cys Ala Gln Ala Ala Asn Ala Asp Pro Leu Tyr355 360 365Leu Tyr Phe Lys Ser Gly Trp Lys Glu Phe Lys Pro Val Lys Ser Ser370 375 380Thr Thr Phe Ala Ser Ala Ile Gln Ile Gly Asp Pro Val Ser Ile Asp385 390 395 400Arg Ala Val His Ala Leu Lys Ser Cys Asp Gly Ile Val Glu Glu Ala405 410 415Thr Glu Glu Glu Leu Met Asp Ala Thr Ala Gln Ala Asp Ser Thr Gly420 425 430Met Phe Ile Cys Pro His Thr Gly Val Ala Leu Thr Ala Leu Phe Lys435 440 445Leu Arg Asn Ser Gly Val Ile Lys Ala Thr Asp Arg Thr Val Val Val450 455 460Ser Thr Ala His Gly Leu Lys Phe Thr Gln Ser Lys Ile Asp Tyr His465 470 475 480Ser Lys Asp Ile Lys Asp Met Ala Cys Arg Tyr Ala Asn Pro Pro Met485 490 495Gln Val Lys Ala Asp Phe Gly Ser Val Met Asp Val Leu Lys Thr Tyr500 505 510Leu Gln Ser Lys Ala His515(2)序列25資料(i)序列特征(A)長度643個堿基對(B)類型核酸(C)鏈型單(D)拓?fù)浣Y(jié)構(gòu)線形(ii)分子類型cDNA(vii)直接來源(B)克隆wrl.pk0085.h2(xi)序列描述序列25GCTCATCCAG CCCATCGCCA ACGGCGCCAC GGTGCTCTCG CTTGACACGG ATTTCGACGG 60ATGCATGCGG CTTATCAGGG AGGTGACAGC TGAGCTGCCC ATATACCTCG CAAACTCACT120CAACTCGCTT CCGGCTGGAG GGGCAGAAGA CTGCAGCCAT CCGAGATATT GCAACANTCA180ATTGGCAGGT GCCCGGACTG GGTCACATCC CAAGGAGGCA ATCTGGGGGA ACATTTTATG240CTTTCCTACA AGGATTTNAA TTTCCGTGTC CTTNGCTAGT TGATTNCCTT CCNACTCCTT300GTTANTNCAA NAGGCCGCCA ACGCAAACCC ACTGTACCCG TACTACAATC CTGGGGTGAC360TGATTTCCAT CCACTTGNTT GCCGGGACAA TTTNCATCCN GCAACAATTT GGGGATTCCA420TATCNATTAC CNTCGGTTTT TTCNCCCTNA AAGGACNNAT GATTNTCCNA GGAACTCCNN480AGGNGGATCA AGGATCCAAA GGCTTTCTAC TCACTGGAAN TTGCTTCCCA ANACGGGGTT540CACTNCCGCC CGTTAAACCC NTGACAAGTA TAATGGACAA CACNCCGGGG TNTATNACAA600CGGCAANTTN AAANCAAGTT NATCATTAGA ACNGGAANTT NCC 643(2)序列26資料(i)序列特征(A)長度84個氨基酸(B)類型氨基酸(C)鏈型不相關(guān)(D)拓?fù)浣Y(jié)構(gòu)線形(ii)分子類型肽(vii)直接來源(B)克隆wrl.pk0085.h2(xi)序列描述序列26Leu Ile Gln Pro Ile Ala Asn Gly Ala Thr Val Leu Ser Leu Asp Thr1 5 10 15Asp Phe Asp Gly Cys Met Arg Leu Ile Arg Glu Val Thr Ala Glu Leu20 25 30Pro Ile Tyr Leu Ala Asn Ser Leu Asn Ser Leu Xaa Leu Glu Gly Gln35 40 45Lys Thr Ala Ala Ile Arg Asp Ile Ala Thr Xaa Asn Trp Gln Val Pro50 55 60Gly Leu Gly His Ile Pro Arg Arg Gln Ser Xaa Thr Phe Tyr Ala Phe65 70 75 80Leu Gln Gly Phe(2)序列27資料(i)序列特征(A)長度525個氨基酸(B)類型氨基酸(C)鏈型不相關(guān)(D)拓?fù)浣Y(jié)構(gòu)線形(ii)分子類型肽(vii)原始來源(A)生物 擬南芥(xi)序列描述序列27Leu Ser Ser Cys Leu Phe Asn Ala Ser Val Ser Ser Leu Asn Pro Lys1 5 10 15Gln Asp Pro Ile Arg Arg His Arg Ser Thr Ser Leu Leu Arg His Arg20 25 30Pro Val Val Ile Ser Cys Thr Ala Asp Gly Asn Asn Ile Lys Ala Pro35 40 45Ile Glu Thr Ala Val Lys Pro Pro His Arg Thr Glu Asp Asn Ile Arg50 55 60Asp Glu Ala Arg Arg Asn Arg Ser Asn Ala Val Asn Pro Phe Ser Ala65 70 75 80Lys Tyr Val Pro Phe Asn Ala Ala Pro Gly Ser Thr Glu Ser Tyr Ser85 90 95Leu Asp Glu Ile Val Tyr Arg Ser Arg Ser Gly Gly Leu Leu Asp Val100 105 110Glu His Asp Met Glu Ala Leu Lys Arg Phe Asp Gly Ala Tyr Trp Arg115 120 125Asp Leu Phe Asp Ser Arg Val Gly Lys Ser Thr Trp Pro Tyr Gly Ser130 135 140Gly Val Trp Ser Lys Lys Glu Trp Val Leu Pro Glu Ile Asp Asp Asp145 150 155 160Asp Ile Val Ser Ala Phe Glu Gly Asn Ser Asn Leu Phe Trp Ala Glu165 170 175Arg Phe Gly Lys Gln Phe Leu Gly Met Asn Asp Leu Trp Val Lys His180 185 190Cys Gly Ile Ser His Thr Gly Ser Phe Lys Asp Leu Gly Met Thr Val195 200 205Leu Val Ser Gln Val Asn Arg Leu Arg Lys Met Lys Arg Pro Val Val210 215 220Gly Val Gly Cys Ala Ser Thr Gly Asp Thr Ser Ala Ala Leu Ser Ala225 230 235 240Tyr Cys Ala Ser Ala Gly Ile Pro Ser Ile Val Phe Leu Pro Ala Asn245 250 255Lys Ile Ser Met Ala Gln Leu Val Gln Pro Ile Ala Asn Gly Ala Phe260 265 270Val Leu Ser Ile Asp Thr Asp Phe Asp Gly Cys Met Lys Leu Ile Arg275 280 285Glu Ile Thr Ala Glu Leu Pro Ile Tyr Leu Ala Asn Ser Leu Asn Ser290 295 300Leu Arg Leu Glu Gly Gln Lys Thr Ala Ala Ile Glu Ile Leu Gln Gln305 310 315 320Phe Asp Trp Gln Val Pro Asp Trp Val Ile Val Pro Gly Gly Asn Leu325 330 335Gly Asn Ile Tyr Ala Phe Tyr Lys Gly Phe Lys Met Cys Gln Glu Leu340 345 350Gly Leu Val Asp Arg Ile Pro Arg Met Val Cys Ala Gln Ala Ala Asn355 360 365Ala Asn Pro Leu Tyr Leu His Tyr Lys Ser Gly Trp Lys Asp Phe Lys370 375 380Pro Met Thr Ala Ser Thr Thr Phe Ala Ser Ala Ile Gln Ile Gly Asp385 390 395 400Pro Val Ser Ile Asp Arg Ala Val Tyr Ala Leu Lys Lys Cys Asn Gly405 410 415Ile Val Glu Glu Ala Thr Glu Glu Glu Leu Met Asp Ala Met Ala Gln420 425 430Ala Asp Ser Thr Gly Met Phe Ile Cys Pro His Thr Gly Val Ala Leu435 440 445Thr Ala Leu Phe Lys Leu Arg Asn Gln Gly Val Ile Ala Pro Thr Asp450 455 460Arg Thr Val Val Val Ser Thr Ala His Gly Leu Lys Phe Thr Gln Ser465 470 475 480Lys Ile Asp Tyr His Ser Asn Ala Ile Pro Asp Met Ala Cys Arg Phe485 490 495Ser Asn Pro Pro Val Asp Val Lys Ala Asp Phe Gly Ala Val Met Asp500 505 510Val Leu Lys Ser Tyr Leu Gly Ser Asn Thr Leu Thr Ser515 520 525(2)序列28資料(i)序列特征(A)長度1478個堿基對(B)類型核酸
(C)鏈型單(D)拓?fù)浣Y(jié)構(gòu)線形(ii)分子類型cDNA(vii)直接來源(B)克隆cenl.pk0064.f4(xi)序列描述序列28CAACAGTGGT CCTTGAGGGG GACTCATATG ATGAAGCTCA GTCATATGCA AAATTGCGTT60GCCAGCAGGA AGGCCGCACA TTTGTACCTC CTTTTGACCA TCCTGATGTC ATCACTGGAC 120AAGGAACTAT CGGCATGGAA ATTGTTAGGC AGCTGCAAGG TCCACTGCAT GCAATATTTG 180TACCTGTTGG AGGTGGTGGA TTAATTGCTG GAATTGCTGC CTATGTAAAA CGGGTTCGCC 240CAGAGGTGAA AATAATTGGA GTGGAACCCT CAGATGCAAA TGCAATGGCA TTATCCTTGT 300GTCATGGTAA GAGGGTCATG TTGGAGCATG TTGGTGGGTT TGCTGATGGT GTAGCTGTCA 360AAGCTGTTGG GGAAGAAACA TTTCGCCTGT GCAGAGAGCT AGTAGATGGC ATTGTTATGG 420TCAGTCGAGA TGCTATTTGT GCTTCAATAA AGGATATGTT TGAGGAGAAA AGAAGTATCC 480TTGAACCTGC TGGTGCCCTT GCATTGGCTG GGGCTGAAGC CTACTGCAAA TACTATAACT 540TGAAAGGAGA AACTGTGGTT GCAATAACTA GTGGGGCAAA TATGAACTTT GATCGACTTA 600GACTAGTAAC CGAGCTAGCT GATGTTGGCC GAAAACGGGA AGCAGTGTTA GCTACATTTC 660TGCCAGAGCG GCAGGGAAGC TTCAAAAAAT TCACAGAATT GGTTGGCAGG ATGAATATTA 720CTGAATTCAA ATACAGATAC GATTCTAATG CAAAAGATGC CCTTGTTCTT TACAGTGTTG 780GCATCTACAC TGACAATGAG CTTGGAGCAA TGATGGATCG CATGGAATCT GCGAAACTGA 840GGACTGTTAA CCTTACTGAC AATGATTTGG CAAAGGACCA CCTTAGATAC TTTATTGGAG 900GAAGATCAGA AATAAAAGAT GAACTGGTTT ACCGGTTCAT TTTCCCGGAA AGGCCTGGGG 960CCCTTATGAA ATTTTTGGAC ACGTTTAGTC CTCGTTGGAA CATCAGCCTT TTCCATTACC 1020GTGCACAGGG TGAAGCTGGA GCAAATGTAT TAGTTGGTAT ACAAGTGCCG CCAGCAGAAT 1080TTGATGAATT CAAGAGTCAT GCCAACAATC TTGGGTACGA GTACATGTCA GAGCACAACA 1140ATGAGATATA CCGGTTGCTG TTGCGTGACC CAAAGGTCTA ATGTATATGC CTTTGCTCCC 1200ATAATAAGTT GGTGACACTT TTCAAGGAAG ATTTTGCTCC AAGGTAGAAG TTGCGAGTTT 1260CTTCAAGTTG AAATGAAGCC ATCACCAAAT GTAGCTTCGG TGTGCCATCT GTTTACTCAG 1320TTAGATCATG TAGTGTATCA GTTGTGTATC TTTGTTGTTG TGCTTCGTGA TCTCAATTTA 1380TTGCTTTGTG CACCTAGAGG TTGTCAAATA ATGATAACCG ATATGTTATC TAAATATCTA 1440ATAATGATTA TGTGATTGTG ATTAAAAAGG GGGGGCCC 1478(2)序列29資料(i)序列特征(A)長度392個氨基酸(B)類型氨基酸(C)鏈型不相關(guān)(D)拓?fù)浣Y(jié)構(gòu)線形(ii)分子類型肽(vii)直接來源(B)克隆cenl.pk0064.f4(xi)序列描述序列29Thr Val Val Leu Glu Gly Asp Ser Tyr Asp Glu Ala Gln Ser Tyr Ala1 5 10 15Lys Leu Arg Cys Gln Gln Glu Gly Arg Thr Phe Val Pro Pro Phe Asp20 25 30His Pro Asp Val Ile Thr Gly Gln Gly Thr Ile Gly Met Glu Ile Val35 40 45Arg Gln Leu Gln Gly Pro Leu His Ala Ile Phe Val Pro Val Gly Gly50 55 60Gly Gly Leu Ile Ala Gly Ile Ala Ala Tyr Val Lys Arg Val Arg Pro65 70 75 80Glu Val Lys Ile Ile Gly Val Glu Pro Ser Asp Ala Asn Ala Met Ala85 90 95Leu Ser Leu Cys His Gly Lys Arg Val Met Leu Glu His Val Gly Gly100 105 110Phe Ala Asp Gly Val Ala Val Lys Ala Val Gly Glu Glu Thr Phe Arg115 120 125Leu Cys Arg Glu Leu Val Asp Gly Ile Val Met Val Ser Arg Asp Ala130 135 140Ile Cys Ala Ser Ile Lys Asp Met Phe Glu Glu Lys Arg Ser Ile Leu145 150 155 160Glu Pro Ala Gly Ala Leu Ala Leu Ala Gly Ala Glu Ala Tyr Cys Lys165 170 175Tyr Tyr Asn Leu Lys Gly Glu Thr Val Val Ala Ile Thr Ser Gly Ala180 185 190Asn Met Asn Phe Asp Arg Leu Arg Leu Val Thr Gly Leu Ala Asp Val195 200 205Gly Arg Lys Arg Glu Ala Val Leu Ala Thr Phe Leu Pro Glu Arg Gln210 215 220Gly Ser Phe Lys Lys Phe Thr Glu Leu Val Gly Arg Met Asn Ile Thr225 230 235 240Glu Phe Lys Tyr Arg Tyr Asp Ser Asn Ala Lys Asp Ala Leu Val Leu245 250 255Tyr Ser Val Gly Ile Tyr Thr Asp Asn Glu Leu Gly Ala Met Met Asp260 265 270Arg Met Glu Ser Ala Lys Leu Arg Thr Val Asn Leu Thr Asp Asn Asp275 280 285Leu Ala Lys Asp His Leu Arg Tyr Phe Ile Gly Gly Arg Ser Glu Ile290 295 300Lys Asp Glu Leu Val Tyr Arg Phe Ile Phe Pro Glu Arg Pro Gly Ala305 310 315 320Leu Met Lys Phe Leu Asp Thr Phe Ser Pro Arg Trp Asn Ile Ser Leu325 330 335Phe His Tyr Arg Ala Gln Gly Glu Ala Gly Ala Asn Val Leu Val Gly340 345 350Ile Gln Val Pro Pro Ala Glu Phe Asp Glu Phe Lys Ser His Ala Asn355 360 365Asn Leu Gly Tyr Glu Tyr Met Ser Glu His Asn Asn Glu Ile Tyr Arg370 375 380Leu Leu Leu Arg Asp Pro Lys Val385 390(2)序列30資料(i)序列特征(A)長度728個堿基對(B)類型核酸(C)鏈型單(D)拓?fù)浣Y(jié)構(gòu)線形(ii)分子類型cDNA(vii)直接來源(B)克隆sfl1.pk0055.h7(xi)序列描述序列30AAAATATTGT AGCAATAACC AGTGGAGCAA ACATGAATTT TGATAAACTT CGGGTTGTAA60CTGAACTTGC TAATGTTGGT CGTAAACAAG AGGCTGTGCT GGCAACTGTT ATGGCAGAGG 120AGCCTGGCAG TTTCAAACAA TTTTGTGAAT TGGTGGGGCA GATGAACATA ACAGAATTCA 180AATACAGATA TAACTCAAAT GAGAAGGCAG TTGTCCTTTA CAGTGTTGGG GTTCACACAA 240TCTCCGAACT AAGAGCAATG CAGGAGAGGA TGGAATCTTC TCAGCTCAAA ACTTACAATC 300TCACAGAAAG TGACTTGGTG AAAGACCACT TGCGTTACTT GATGGGAGGC CGATCAAACG 360TTCAGAATGA GGTCTTTGTC GTCTCACCTT TCCAAGAAAG ACTGGTGCTT TGATGAAATT 420TTTGGACCCT TCAGTCCACG TTGGGATATT AGTTTATCCA TTACCGAGGG GAGGTGAAAC 480TGGAGCAAAC TGCTAGTTGG NTACAGGTAC CAAAATGAGA TAGATGAGTC CATGATCGTG 540CTAACAAACT GGATATGATT ATAAGTGGNA ATATGTGATG NCTCAGCTCA ATCNCGATGG 600GGNTTAAGCA CTGCATATGG GNATTAGGGG NAGNTACANT TAAATTCACG GCCTCAAGNT 660AAGCATANTN TAGGAACTAG CTTTACAGGG GGCTACNANT TAACCGNGTA TTTTTTTTGA 720GATGANNG728(2)序列31資料(i)序列特征(A)長度152個氨基酸(B)類型氨基酸(C)鏈型不相關(guān)(D)拓?fù)浣Y(jié)構(gòu)線形(ii)分子類型肽(vii)直接來源(B)克隆sfl1.pk0055.h7(xi)序列描述序列31Asn Ile Val Ala Ile Thr Ser Gly Ala Asn Met Asn Phe Asp Lys Leu1 5 10 15Arg Val Val Thr Glu Leu Ala Asn Val Gly Arg Lys Gln Glu Ala Val20 25 30Leu Ala Thr Val Met Ala Glu Glu Pro Gly Ser Phe Lys Gln Phe Cys35 40 45Glu Leu Val Gly Gln Met Asn Ile Thr Glu Phe Lys Tyr Arg Tyr Asn50 55 60Ser Asn Glu Lys Ala Val Val Leu Tyr Ser Val Gly Val His Thr Ile65 70 75 80Ser Glu Leu Arg Ala Met Gln Glu Arg Met Glu Ser Ser Gln Leu Lys85 90 95Thr Tyr Asn Leu Thr Glu Ser Asp Leu Val Lys Asp His Leu Arg Tyr100 105 110Leu Met Gly Gly Arg Ser Asn Val Gln Asn Glu Val Phe Val Val Ser115 120 125Pro Xaa Pro Arg Lys Thr Gly Ala Leu Met Lys Phe Leu Asp Xaa Phe130 135 140Ser Pro Arg Trp Asp Ile Ser Leu145 150(2)序列32資料(i)序列特征(A)長度572個堿基對(B)類型核酸(C)鏈型單(D)拓?fù)浣Y(jié)構(gòu)線形(ii)分子類型cDNA(vii)直接來源(B)克隆sre.pk0044.f3(xi)序列描述序列32AAAGACCTGG TGCTTTGATG AAATTTTTGG ACCCCTTCAG TCCACGTTGG AATATCAGTT 60TATTCCATTA CCGAGGGGAG GGTGAAACTG GAGCAAATGT GCTAGTTGGA ATACAGGTAC 120CCAAAAGTGA GATGGATGAG TTCCACGATC GTGCCAACAA ACTTGGATAT GATTATAAAG 180TGGTGAATAA TGATGATGAC TTCCAGCTTC TAATGCACTG ATGATGGTTT TAGGCACTTG 240CCATTATTGT GTATTTTAGT CAACAAGTTT GCCATATTTA ATATTTCCAC GGTCGTTTCT 300AAAAGTTGGA TGGGGAAAAA AGGTGGAAAG GAAGTGGCCT TCAGACATGT CATTAGTTGA 360TTAGAGGAAC AACTAGTTCT TTTTACCTAA TGCGGCGTCT TATTACATTT TTTATAATCT 420GTAATTTATG TTTTTTTGTT GTTGTTAACA TTGGAATCTT ATAATGTTGT TGGCTGGTCT 480TTTGTGTCTG TAATATAAGT GTCTTCAAAA GGTTGTTTGC TAAATTTCAG CAGCCTAAAA 540AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AA 572(2)序列33資料(i)序列特征(A)長度72個氨基酸(B)類型氨基酸(C)鏈型不相關(guān)(D)拓?fù)浣Y(jié)構(gòu)線形(ii)分子類型肽(vii)直接來源(B)克隆sre.pk0044.f3(xi)序列描述序列33Arg Pro Gly Ala Leu Met Lys Phe Leu Asp Pro Phe Ser Pro Arg Trp1 5 10 15Asn Ile Ser Leu Phe His Tyr Arg Gly Glu Gly Glu Thr Gly Ala Asn20 25 30Val Leu Val Gly Ile Gln Val Pro Lys Ser Glu Met Asp Glu Phe His35 40 45Asp Arg Ala Asn Lys Leu Gly Tyr Asp Tyr Lys Val Val Asn Asn Asp50 55 60Asp Asp Phe Gln Leu Leu Met His65 70(2)序列34資料(i)序列特征(A)長度507個氨基酸(B)類型氨基酸(C)鏈型不相關(guān)(D)拓?fù)浣Y(jié)構(gòu)線形(ii)分子類型肽(vii)原始來源(A)生物Brukholderia capacia(xi)序列描述序列34Met Ala Ser His Asp Tyr Leu Lys Lys Ile Leu Thr Ala Arg Val Tyr1 5 l0 15Asp Val Ala Phe Glu Thr Glu Leu Glu Pro Ala Arg Asn Leu Ser Ala20 25 30Arg Leu Arg Asn Pro Val Tyr Leu Lys Arg Glu Asp Asn Gln Pro Val35 40 45Phe Ser Phe Lys Leu Arg Gly Ala Tyr Asn Lys Met Ala His Ile Pro50 55 60Ala Asp Ala Leu Ala Arg Gly Val Ile Thr Ala Ser Ala Gly Asn His65 70 75 80Ala Gln Gly Val Ala Phe Ser Ala Ala Arg Met Gly Val Lys Ala Val85 90 95Ile Val Val Pro Val Thr Thr Pro Gln Val Lys Val Asp Ala Val Arg100 105 110Ala His Gly Gly Pro Gly Val Glu Val Ile Gln Ala Gly Glu Ser Tyr115 120 125Ser Asp Ala Tyr Ala His Ala Leu Lys Val Gln Glu Glu Arg Gly Leu130 135 140Thr Phe Val His Pro Phe Asp Asp Pro Tyr Val Ile Ala Gly Gln Gly145 150 155 160Thr Ile Ala Met Glu Ile Leu Arg Gln His Gln Gly Pro Ile His Ala165 170 175Ile Phe Val Pro Ile Gly Gly Gly Gly Leu Ala Ala Gly Val Ala Ala180 185 190Tyr Val Lys Ala Val Arg Pro Glu Ile Lys Val Ile Gly Val Gln Ala195 200 205Glu Asp Ser Cys Ala Met Ala Gln Ser Leu Gln Ala Gly Lys Arg Val210 215 220Glu Leu Ala Glu Val Gly Leu Phe Ala Asp Gly Thr Ala Val Lys Leu225 230 235 240Val Gly Glu Glu Thr Phe Arg Leu Cys Lys Glu Tyr Leu Asp Gly Val245 250 255Val Thr Val Asp Thr Asp Ala Leu Cys Ala Ala Ile Lys Asp Val Phe260 265 270Gln Asp Thr Arg Ser Val Leu Glu Pro Ser Gly Ala Leu Ala Val Ala275 280 285Gly Ala Lys Leu Tyr Ala Glu Arg Glu Gly Ile Glu Asn Gln Thr Leu290 295 300Val Ala Val Thr Ser Gly Ala Asn Met Asn Phe Asp Arg Met Arg Phe305 310 315 320Val Ala Glu Arg Ala Glu Val Gly Glu Ala Arg Glu Ala Val Phe Ala325 330 335Val Thr Ile Pro Glu Glu Arg Gly Ser Phe Lys Arg Phe Cys Ser Leu340 345 350Val Gly Asp Arg Asn Val Thr Glu Phe Asn Tyr Arg Ile Ala Asp Ala355 360 365Gln Ser Ala His Ile Phe Val Gly Val Gln Ile Arg Arg Arg Gly Glu370 375 380Ser Ala Asp Ile Ala Ala Asn Phe Glu Ser His Gly Phe Lys Thr Ala385 390 395 400Asp Leu Thr His Asp Glu Leu Ser Lys Glu His Ile Arg Tyr Met Val405 410 415Gly Gly Arg Ser Pro Leu Ala Leu Asp Glu Arg Leu Phe Arg Phe Glu420 425 430Phe Pro Glu Arg Pro Gly Ala Leu Met Lys Phe Leu Ser Ser Met Ala435 440 445Pro Asp Trp Asn Ile Ser Leu Phe His Tyr Arg Asn Gln Gly Ala Asp450 455 460Tyr Ser Ser Ile Leu Val Gly Leu Gln Val Pro Gln Ala Asp His Ala465 470 475 480Glu Phe Glu Arg Phe Leu Ala Ala Leu Gly Tyr Pro Tyr Val Glu Glu485 490 495Ser Ala Asn Pro Ala Tyr Arg Leu Phe Leu Ser500 505(2)序列35資料(i)序列特征(A)長度1582個堿基對(B)類型核酸(C)鏈型單(D)拓?fù)浣Y(jié)構(gòu)線形(ii)分子類型cDNA(vii)直接來源(B)克隆cc3.mn0002.d2(xi)序列描述序列35ACGAGACGAG TCCCCTCCCC CCACCTCGCC TCACCCAACC GGAACGAACA AGTTACCATC60TCATCCCAAC CCCGCCTCGA CCGGATCTCG TCGGACTCGG ATCCGCCCGA CCACCCCGCG 120CCGCCGCAGA TCAAAGAAGA TGGCAGCTCT CGACACCTTC CTCTTCACCT CGGAGTCTGT 180GAACGAGGGA CACCCTGACA AGCTCTGCGA CCAGGTCTCA GATGCCGTTC TTGACGCTTG 240CCTTGCTGAG GACCCTGACA GCAAGGTTGC TTGTGAGACC TGCACCAAGA CCAACATGGT 300CATGGTCTTT GGTGAGATCA CCACCAAGGC CAATGTCGAC TACGAGAAGA TTGTCAGGGA 360GACCTGCCGC AACATTGGTT TTGTGTCAAA CGATGTCGGG CTTGACGCTG ACCACTGCAA 420GGTGCTCGTG AACATTGAGC AGCAGTCCCC TGATATTGCT CAGGGTGTGC ATGGCCACTT 480CACCAAGCGC CCCGAGGAGA TTGGAGCTGG TGACCAGGGA CACATGTTCG GGTATGCGAC 540CGATGAGACC CCTGAGTTGA TGCCCCTCAG CCATGTCCTT GCCACCAAGC TAGGTGCTCG 600TCTCACCGAG GTCCGCAAGA ACGGAACCTG CCCCTGGCTC AGGCCTGATG GGAAGACCCA 660GGTGACAGTC GAGTACCGCA ATGAGGGTGG TGCCATGGTC CCCATCCGTG TCCACACCGT 720CCTCATCTCC ACCCAGCACG ACGAGACAGT GACCAATGAT GAGATCGCTG CTGACCTGAA780GGAGCATGTC ATCAAGCCTA TCATCCCTGA GCAGTACCTT GACGAGAAGA CCATCTTCCA840CCTTAACCCA TCCGGCCGCT TTGTCATTGG TGGACCTCAC GGCGATGCTG GCCTCACTGG900CCGCAAGATC ATCATTGACA CCTACGGTGG CTGGGGAGCC CATGGCGGTG GCGCTTTCTC960CGGCAAGGAC CCAACCAAGG TTGACCGCAG CGGAGCCTAT GTCGCGAGGC AGGCTGCCAA 1020GAGCATCGTC GCCAGCGGCC TTGCTCGCCG CGCCATCGTC CAGGTGTCCT ACGCCATCGG 1080CGTGCCCGAG CCTCTCTCCG TGTTTGTCGA CACGTACGGC ACCGGCGCGA TCCCCGACAA 1140GGAGATCCTC AAGATTGTCA AGGAGAACTT CGATTTCAGG CCTGGCATGA TTATCATCAA 1200CCTTGACCTC AAGAAAGGCG GCAACGGGCG CTACCTCAAG ACGGCAGCCT ACGGCCACTT 1260CGGAAGGGAC GACCCTGACT TCACCTGGGA GGTGGTGAAG CCACTCAAGT CGGAGAAACC 1320TTCTGCCTAA GGCGGCCTTT TTTTCAGTAA GAAGCTTTTG GTGGTCTGCT GTGCTTAATC 1380ATGCTTTTAT ATGGCTTCTA CATGTTGTGG TTCTTTCTTG ATCTGCACCG CGCTTATCGT 1440TTGTGTTGTA CTGCCCTAAT AAGTGGTGCT TATGAGGACT GTTTCTGGTT TTGCTGCTTA 1500TGTTGTAATG CTTTGAAACA ATGAAAGAAG CTACAGGCCA CAGCTATTTT GAGAAGTAAT 1560GGAACCTCGT GCCGTTTTGA TT1582(2)序列36資料(i)序列特征(A)長度396個氨基酸(B)類型氨基酸(C)鏈型不相關(guān)(D)拓?fù)浣Y(jié)構(gòu)線形(ii)分子類型肽(vii)直接來源(B)克隆cc3.mn0002.d2(xi)序列描述序列36Met Ala Ala Leu Asp Thr Phe Leu Phe Thr Ser Glu Ser Val Asn Glu1 5 10 15Gly His Pro Asp Lys Leu Cys Asp Gln Val Ser Asp Ala Val Leu Asp20 25 30Ala Cys Leu Ala Glu Asp Pro Asp Ser Lys Val Ala Cys Glu Thr Cys35 40 45Thr Lys Thr Asn Met Val Met Val Phe Gly Glu Ile Thr Thr Lys Ala50 55 60Asn Val Asp Tyr Glu Lys Ile Val Arg Glu Thr Cys Arg Asn Ile Gly65 70 75 80Phe Val Ser Asn Asp Val Gly Leu Asp Ala Asp His Cys Lys Val Leu85 90 95Val Asn Ile Glu Gln Gln Ser Pro Asp Ile Ala Gln Gly Val His Glyl00 105 110His Phe Thr Lys Arg Pro Glu Glu Ile Gly Ala Gly Asp Gln Gly His115 120 125Met Phe Gly Tyr Ala Thr Asp Glu Thr Pro Glu Leu Met Pro Leu Ser130 135 140His Val Leu Ala Thr Lys Leu Gly Ala Arg Leu Thr Glu Val Arg Lys145 150 155 160Asn Gly Thr Cys Pro Trp Leu Arg Pro Asp Gly Lys Thr Gln Val Thr165 170 175Val Glu Tyr Arg Asn Glu Gly Gly Ala Met Val Pro Ile Arg Val His180 185 190Thr Val Leu Ile Ser Thr Gln His Asp Glu Thr Val Thr Asn Asp Glu195 200 205Ile Ala Ala Asp Leu Lys Glu His Val Ile Lys Pro Ile Ile Pro Glu210 215 220Gln Tyr Leu Asp Glu Lys Thr Ile Phe His Leu Asn Pro Ser Gly Arg225 230 235 240Phe Val Ile Gly Gly Pro His Gly Asp Ala Gly Leu Thr Gly Arg Lys245 250 255Ile Ile Ile Asp Thr Tyr Gly Gly Trp Gly Ala His Gly Gly Gly Ala260 265 270Phe Ser Gly Lys Asp Pro Thr Lys Val Asp Arg Ser Gly Ala Tyr Val275 280 285Ala Arg Gln Ala Ala Lys Ser Ile Val Ala Ser Gly Leu Ala Arg Arg290 295 300Ala Ile Val Gln Val Ser Tyr Ala Ile Gly Val Pro Glu Pro Leu Ser305 310 315 320Val Phe Val Asp Thr Tyr Gly Thr Gly Ala Ile Pro Asp Lys Glu Ile325 330 335Leu Lys Ile Val Lys Glu Asn Phe Asp Phe Arg Pro Gly Met Ile Ile340 345 350Ile Asn Leu Asp Leu Lys Lys Gly Gly Asn Gly Arg Tyr Leu Lys Thr355 360 365Ala Ala Tyr Gly His Phe Gly Arg Asp Asp Pro Asp Phe Thr Trp Glu370 375 380Val Val Lys Pro Leu Lys Ser Glu Lys Pro Ser Ala385 390 395(2)序列37資料(i)序列特征(A)長度2183個堿基對(B)類型核酸(C)鏈型單(D)拓?fù)浣Y(jié)構(gòu)線形(ii)分子類型cDNA(vii)原始來源(A)生物水稻(xi)序列描述序列37GAATTCTTAT AAATGAACGG AAAATGGAAA AAAAAATTGA TTGGTGCCAC TTCAAAGTTA 60AATATGCCAA GACGAATTGA TATGTTTCTG CTGTTGTTTT ATGCTCTTGA TTAGTTGATG120CGCATGTTCA ATGATTTATG ATGTTTGTCT TTGTGGAAAG ATTACATGTA AAGAGTATAG180TAGAACCCCT AAAAGCTAGC CAGCGATTTC GCTCTTTTTT TCCAGGTCTC CATGATATGT240TTACCCCTAA AAGTGGTATA TTTATGTGAT AGTTACAATA CATAGTGGAC CACGATTGAT300TATGCGTTTA TGCTGATTCC GGCAGAAAAT TGTTAGATTC CTTGTGCTCT ATACCTGCTT360GTTGCGCTTG TAGAGAATAT TACAAATACC TAACACTTGC CCAAGGAACT TAGGAACTTA420GTCAACTCTT TGTAGGGACA ACTATTTTAG CCCAAAATTG TGGTCTTGTC AGGTGCCAAC480AAAACAGCAT CTTGGCGTAC ATAAGCTATA TAGAGGATTA AAAGGAATGT TTTGTTCCTT540GCTACTGTTT TTTTAACCTG TTTACTCAGG ACAAATTTTG TTGCATAAAC CATTTGTTCT600AGGGATCAGT ATTGTCCTCT CAGTGTGTTA TGTAAGCATT TCCAGAAATC AATTGTCGCT660ATCAGCTTCC CTCACATTAG CTATCACTTA TACCCCTTTT TTTCTCATAG GCTCACCATG720TCCATTTTAT TCATGATATT TCTTTGTCTA AAGTATGTGA AATACCATTT TATGCAGATA780GGAGAAGATG GCCGCACTTG ATACCTTCCT CTTTACCTCG GAGTCTGTGA ACGAGGGCCA840CCCTGACAAG CTCTGCGACC AAGTCTCAGA TGCTGTGCTT GATGCCTGCC TCGCCGAGGA900CCCTGACAGC AAGGTCGCTT GTGAGACCTG CACCAAGACA AACATGGTCA TGGTCTTTGG960TGAGATCACC ACCAAGGCTA ACGTTGACTA TGAGAAGATT GTCAGGGAGA CATGCCGTAA 1020CATCGGTTTT GTGTCAGCTG ATGTCGGTCT CGATGCTGAC CACTGCAAGG TGCTTGTGAA 1080CATCGAGCAG CAGTCCCCTG ACATTGCACA GGGTGTGCAC GGGCACTTCA CCAAGCGCCC 1140TGAGGAGATT GGTGCTGGTG ACCAGGGACA CATGTTTGGA TATGCAACTG ATGAGACCCC 1200TGAGTTGATG CCCCTCAGCC ATGTCCTTGC TACCAAGCTT GGCGCTCGTC TTACGGAGGT 1260TCGCAAGAAT GGGACCTGCG CATGGCTCAG GCCTGACGGG AAGACCCAAG TGACTGTTGA 1320GTACCGCAAT GAGAGCGGTG CCAGGGTCCC TGTCCGTGTC CACACCGTCC TCATCTCTAC 1380CCAGCATGAT GAGACAGTCA CCAACGATGA GATTGCTGCT GACCTGAAGG AGCATGTCAT 1440CAAGCCTGTC ATTCCCGAGC AGTACCTTGA TGAGAAGACA ATCTTCCATC TTAACCCATC 1500TGGTCGCTTC GTCATTGGCG GACCTCATGG TGATGCTGGT CTCACTGGCC GGAAGATCAT 1560CATTGACACT TATGGTGGCT GGGGAGCTCA CGGTGGTGGT GCCTTCTCTG GCAAGGACCC 1620AACCAAGGTT GACCGCAGTG GAGCATACGT CGCAAGGCAA GCTGCCAAGA GCATTGTTGC 1680TAGTGGCCTT GCTCGCCGCT GCATTGTCCA AGTATCATAC GCCATCGGTG TCCCAGAGCC 1740ACTGTCCGTA TTCGTCGACA CATACGGCAC TGGCAGGATC CCTGACAAGG AGATCCTCAA 1800GATTGTGAAG GAGAACTTCG ACTTCAGGCC TGGCATGATC ATCATCAACC TTGACCTCAA 1860GAAAGGCGGC AACGGACGCT ACCTCAAGAC GGCGGCTTAC GGTCACTTCG GAAGGGACGA 1920CCCAGACTTC ACCTGGGAGG TGGTGAAGCC CCTCAAGTGG GAGAAGCCTT CTGCCTAAAA 1980GCTCCCTTTC GGAGGCTTTT GCTCTGTCCC ATTATGGTGT TTTGTTTCCT CGCTGCTCAG 2040CATTGTGATT CTTAACCTGC CCCCCGCTGC CATTTATGCC CATGCACGCT ACTTTCCTAA 2100TAATAAGTAC TTATAAGGGT ATTGTGTTTG AATATTTTAC CTAGAGGAGG AGGAGGATTT 2160GTTATCTGTT ATTGCTTAAG CTT 2183(2)序列38資料(i)序列特征(A)長度1485個堿基對(B)類型核酸(C)鏈型單(D)拓?fù)浣Y(jié)構(gòu)線形(ii)分子類型cDNA(vii)直接來源(B)克隆s2.12b06(xi)序列描述序列38AGCCAAGCCC CACTCAACCA CCACACCACT CTCTCTGCTC TTCTTCTACC TTTCAAGTTT 60TTAAAGTATT AAGATGGCAG AGACATTCCT ATTTACCTCA GAGTCAGTGA ACGAGGGACA 120CCCTGACAAG CTCTGCGACC AAATCTCCGA TGCTGTCCTC GACGCTTGCC TTGAACAGGA 180CCCAGACAGC AAGGTTGCCT GCGAAACATG CACCAAGACC AACTTGGTCA TGGTCTTCGG 240AGAGATCACC ACCAAGGCCA ACGTTGACTA CGAGAAGATC GTGCGTGACA CCTGCAGGAA 300CATCGGCTTC GTCTCAAACG ATGTGGGACT TGATGCTGAC AACTGCAAGG TCCTTGTAAA 360CATTGAGCAG CAGAGCCCTG ATATTGCCCA GGGTGTGCAC GGCCACCTTA CCAAAAGACC 420CGAGGAAATC GGTGCTGGAG ACCAGGGTCA CATGTTTGGC TATGCCACGG ACGAAACCCC 480AGAATTGATG CCATTGAGTC ATGTTCTTGC AACTAAACTC GGTGCTCGTC TCACCGAGGT 540TCGCAAGAAC GGAACCTGCC CATGGTTGAG GCCTGATGGG AAAACCCAAG TGACTGTTGA 600GTATTACAAT GACAACGGTG CCATGGTTCC AGTTCGTGTC CACACTGTGC TTATCTCCAC 660CCAACATGAT GAGACTGTGA CCAACGACGA AATTGCAGCT GACCTCAAGG AGCATGTGAT 720CAAGCCGGTG ATCCCGGAGA AGTACCTTGA TGAGAAGACC ATTTTCCACT TGAACCCCTC 780TGGCCGTTTT GTCATTGGAG GTCCTCACGG TGATGCTGGT CTCACCGGCC GCAAGATCAT 840CATCGATACT TACGGAGGAT GGGGTGCTCA TGGTGGTGGT GCTTTCTCCG GGAAGGATCC 900CACCAAGGTT GATAGGAGTG GTGCTTACAT TGTGAGACAG GCTGCTAAGA GCATTGTGGC 960AAGTGGACTA GCCAGAAGGT GCATTGTGCA AGTGTCTTAT GCCATTGGTG TGCCCGAGCC 1020TTTGTCTGTC TTTGTTGACA CCTATGGCAC CGGGAAGATC CATGATAAGG AGATTCTCAA 1080CATTGTGAAG GAGAACTTTG ATTTCAGGCC CGGTATGATC TCCATCAACC TTGATCTCAA 1140GAGGGGTGGG AATAACAGGT TCTTGAAGAC TGCTGCATAT GGACACTTCG GCAGAGAGGA 1200CCCTGACTTC ACATGGGAAG TGGTCAAGCC CCTCAAGTGG GAGAAGGCCT AAGGCCATTC 1260ATTCCACTGC AATGTGCTGG GAGTTTTTTA GCGTTGCCCT TATAATGTCT ATTATCCATA 1320ACTTTCCACG TCCCTTGCTC TGTGTTTTTC TCTCGTCGTC CTCCTCCTAT TTTGTTTCTC 1380CTGCCTTTCA TTTGTAATTT TTTACATGAT CAACTAAAAA ATGTACTCTC TGTTTTCCGA 1440CCATTGTGTC TCTTAATATC AGTATCAAAA AGAATGTTCC AAGTT 1485(2)序列39資料(i)序列特征(A)長度392個氨基酸(B)類型氨基酸(C)鏈型不相關(guān)(D)拓?fù)浣Y(jié)構(gòu)線形(ii)分子類型肽(vii)直接來源(B)克隆s2.12b06(xi)序列描述序列39Met Ala Glu Thr Phe Leu Phe Thr Ser Glu Ser Val Asn Glu Gly His1 5 10 15Pro Asp Lys Leu Cys Asp Gln Ile Ser Asp Ala Val Leu Asp Ala Cys20 25 30Leu Glu Gln Asp Pro Asp Ser Lys Val Ala Cys Glu Thr Cys Thr Lys35 40 45Thr Asn Leu Val Met Val Phe Gly Glu Ile Thr Thr Lys Ala Asn Val50 55 60Asp Tyr Glu Lys Ile Val Arg Asp Thr Cys Arg Asn Ile Gly Phe Val65 70 75 80Ser Asn Asp Val Gly Leu Asp Ala Asp Asn Cys Lys Val Leu Val Asn85 90 95Ile Glu Gln Gln Ser Pro Asp Ile Ala Gln Gly Val His Gly His Leu100 105 110Thr Lys Arg Pro Glu Glu Ile Gly Ala Gly Asp Gln Gly His Met Phe115 120 125Gly Tyr Ala Thr Asp Glu Thr Pro Glu Leu Met Pro Leu Ser His Val130 135 140Leu Ala Thr Lys Leu Gly Ala Arg Leu Thr Glu Val Arg Lys Asn Gly145 150 155 160Thr Cys Pro Trp Leu Arg Pro Asp Gly Lys Thr Gln Val Thr Val Glu165 170 175Tyr Tyr Asn Asp Asn Gly Ala Met Val Pro Val Arg Val His Thr Val180 185 190Leu Ile Ser Thr Gln His Asp Glu Thr Val Thr Asn Asp Glu Ile Ala195 200 205Ala Asp Leu Lys Glu His Val Ile Lys Pro Val Ile Pro Glu Lys Tyr210 215 220Leu Asp Glu Lys Thr Ile Phe His Leu Asn Pro Ser Gly Arg Phe Val225 230 235 240Ile Gly Gly Pro His Gly Asp Ala Gly Leu Thr Gly Arg Lys Ile Ile245 250 255Ile Asp Thr Tyr Gly Gly Trp Gly Ala His Gly Gly Gly Ala Phe Ser260 265 270Gly Lys Asp Pro Thr Lys Val Asp Arg Ser Gly Ala Tyr Ile Val Arg275 280 285Gln Ala Ala Lys Ser Ile Val Ala Ser Gly Leu Ala Arg Arg Cys Ile290 295 300Val Gln Val Ser Tyr Ala Ile Gly Val Pro Glu Pro Leu Ser Val Phe305 310 315 320Val Asp Thr Tyr Gly Thr Gly Lys Ile His Asp Lys Glu Ile Leu Asn325 330 335Ile Val Lys Glu Asn Phe Asp Phe Arg Pro Gly Met Ile Ser Ile Asn340 345 350Leu Asp Leu Lys Arg Gly Gly Asn Asn Arg Phe Leu Lys Thr Ala Ala355 360 365Tyr Gly His Phe Gly Arg Glu Asp Pro Asp Phe Thr Trp Glu Val Val370 375 380Lys Pro Leu Lys Trp Glu Lys Ala385 390(2)序列40資料(i)序列特征(A)長度1479個堿基對(B)類型核酸(C)鏈型單(D)拓?fù)浣Y(jié)構(gòu)線形(ii)分子類型cDNA(vii)原始來源(A)生物番茄(xi)序列描述序列40GAATTCCTAC AAAGAGGTTA TTTCTCTCAA GGGGTAAAAA GATTGCCCCT TTTCGACATT 60TATAATCCTC TTTTTCTCTT TGTTCGCCGT TGGGTTCTTC ACTTTCCTGT TTCTTGAGAA 120TGGAAACTTT CTTATTCACC TCCGAGTCTG TGAACGAGGG TCACCCAGAC AAGCTCTGTG 180ATCAGATCTC TGATGCAGTT CTTGATGCCT GCCTTGAGCA AGATCCCGAG AGCAAAGTTG 240CATGTGAAAC TTGCACCAAG ACCAACTTGG TCATGGTCTT TGGTGAGATC ACAACCAAGG 300CTATTGTAGA CTATGAGAAG ATTGTGCGTG ACACATGCCG TAATATTGGA TTTGTTTCTG 360ATGATGTTGG TCTTGATGCT GACAACTGCA AGGTCCTTGT TTACATTGAG CAGCAAAGTC 420CTGATATTGC TCAAGGTGTC CACGGCCATC TGACCAAACG CCCCGAGGAG ATTGGTGCTG 480GTGACCAGGG CCACATGTTT GGCTATGCAA CAGATGAGAC CCCTGAATTA ATGCCTCTCA 540GTCACGTGCT TGCAACTAAA CTTGGTGCCC GTCTTACAGA AGTCCGCAAG AATGGCACCT 600GCGCCTGGTT GAGGCCTGAT GGCAAGACCC AAGTTACTGT TGAGTATAGC AATGACAATG 660GTGCCATGGT TCCAATTAGG GTACACACTG TTCTTATCTC CACCCAACAC GATGAGACCG 720TTACCAATGA TGAGATTGCC CGCGACCTTA AGGAGCATGT CATCAAACCA GTCATCCCAG 780AGAAGTACCT TGATGAGAAT ACTATTTTCC ACCTTAACCC ATCTGGCCGA TTCGTTATTG 840GTGGACCTCA TGGTGATGCT GGTCTCACTG GTCGTAAAAT CATCATCGAC ACTTATGGTG900GTTGGGGTGC TCATGGTGGT GGTGCTTTCT CGGGCAAAGA CCCAACCAAG GTCGACAGGA960GTGGTGCATA CATTGTAAGG CAGGCTGCAA AGAGTATCGT AGCTAGTGGA CTTGCTCGTA 1020GATGCATCGT GCAGGTATCT TATGCCATCG GTGTGCCTGA GCCATTGTCT GTATTCGTTG 1080ACACCTATGG CACTGGAAAG ATCCCTGACA GGGAAATTTT GAAGATCGTT AAGGAGAACT 1140TTGACTTCAG ACCTGGAATG ATGTCCATTA ACTTGGATTT GAAGAGGGGT GGCAATAGAA 1200GATTCTTGAA AACTGCTGCC TATGGTCACT TTGGACGTGA TGACCCCGAT TTCACATGGG 1260AAGTTGTCAA GCCCCTCAAG TGGGAAAAGC CCCAAGACTA ATAAGTGCTT GCCTATGTTT 1320TTGTTCTTTG TTGTTTGCTT GTGGCTTTAG AATCTCCCCC GTGTTTGCTT GTTTGTCTTT 1380GTATTTTCTC TTTTGACCCT TTATTTTGTT ATTGTCCTGT TTCCATTGTG TTGGATGGAT 1440ATCTTAGGCC TTGGAATATT AAGGAAAGAA AAGGAATTC 1479(2)序列41資料(i)序列特征(A)長度1380個堿基對(B)類型核酸(C)鏈型單(D)拓?fù)浣Y(jié)構(gòu)線形(ii)分子類型cDNA(xi)序列描述序列41CCCTCCCTTC GGTTCATCGG CCTCCCGATC GAGCAGTAGA AGCAGCGCAA GGGCATCGCT60AGCACTAAAG AAATGGCAGC CGAGACGTTC CTCTTCACGT CCGAGTCTGT GAACGAGGGC 120CATCCCGACA AGCTCTGTGA CCAAGTCTCC GACGCCGTCT TGGATGCCTG CTTGGCCCAG 180GATGCCGACA GCAAGGTCGC CTGCGAGACC GTCACCAAGA CCAACATGGT CATGGTCTTG 240GGCGAGATCA CCACCAAGGC CACCGTCGAC TATGAGAAGA TCGTGCGTGA CACCTGCCGC 300AACATCGGTT TCATCTCTGA TGACGTTGGT CTCGACGCCG ACCGTTGCAA RGTGCTCGTC 360AACATCGAGC AGCAGTCCCC TGACATTGCC CAGGGTGTTC ATGGACACTT CACCAAGCGT 420CCCGAAGAAG TCGGCGCCGG TGACCAGGGC ATCATGTTCG GCTATGCCAC CGATGAGACC 480CCTGAGCTGA TGCCCCTCAA GCACGTGCTT GCCACCAAGC TYGGAGCTCG CCTCACSGAG 540GTCCGCAAGA ATGGCACCTG CGCCTGGGTC AGGCCTGACG GAAAGACCCA GGTCACAGTC 600GAGTACCTAA ACGAGGATGG TGCCATGGTA CCTGTTCGTG TGCACACCGT CCTCATCTCC 660ACCCAGCACG ACGAGACCGT CACCAACGAC GAGATTGCTG CGGACCTCAA GGAGCATGTC 720ATCAAGCCGG TGATCCCCGC AAAGTACCTC GATGAGAACA CCATCTTCCA CCTGAACCCG 780TCTGGCCGCT TCGTCATCGG CGGCCCCCAC GGTGACGCCG GTCTCACCGG CCGCAAGATC 840ATCATCGACA CCTATGGTGG CTGGGGAGCC CACGGCGGCG GTGCCTTCTC TGGCAAGGAC 900CCAACCAAGG TCGACCGYAG TGGCGCCTAC ATTGCCAGGC ARGCCGCCAA GAGCATCATC 960GCCAGCGGCC TCGCACGCCG CTGCATTGTG CAGATCTCAT ACGCCATCGG TGTGCCTGAG 1020CCTTTGTCTG TGTTCGTCGA CTCCTACGGC ACCGGCAAGA TCCCCGACAG GGAGATCCTC 1080AAGCTCGTGA AGGAGAACTT TGACTTCAGG CCCGGGATGA TCAGCATCAA CCTGGACTTG 1140AAGAAAGGTG GAAACAGGTT CATCAAGACC GCTGCTTACG GTCACTTTGG CCGTGATGAT 1200GCCGACTTCA CCTGGGAGGT GGTGAAGCCC CTCAAGTTCG ACAAGGCATC TGCCTAAGAG 1260CATGGCATTC TCTTGGTCTG CCGCCTCTCA AGTTCGTCAA GACGGGATCA TGTTGCTCCT 1320GGGAAGTGGG AAGAAGCATT AGACATTGAA GCGACGCTCT ACACTGGTCT TGTTGTATGG 1380(2)序列42資料(i)序列特征(A)長度394個氨基酸(B)類型氨基酸(C)鏈型不相關(guān)(D)拓?fù)浣Y(jié)構(gòu)線形(ii)分子類型肽(xi)序列描述序列42Met Ala Ala Glu Thr Phe Leu Phe Thr Ser Glu Ser Val Asn Glu Gly1 5 10 15His Pro Asp Lys Leu Cys Asp Gln Val Ser Asp Ala Val Leu Asp Ala20 25 30Cys Leu Ala Gln Asp Ala Asp Ser Lys Val Ala Cys Glu Thr Val Thr35 40 45Lys Thr Asn Met Val Met Val Leu Gly Glu Ile Thr Thr Lys Ala Thr50 55 60Val Asp Tyr Glu Lys Ile Val Arg Asp Thr Cys Arg Asn Ile Gly Phe65 70 75 80Ile Ser Asp Asp Val Gly Leu Asp Ala Asp Arg Cys Lys Val Leu Val85 90 95Asn Ile Glu Gln Gln Ser Pro Asp Ile Ala Gln Gly Val His Gly His100 105 110Phe Thr Lys Arg Pro Glu Glu Val Gly Ala Gly Asp Gln Gly Ile Met115 120 125Phe Gly Tyr Ala Thr Asp Glu Thr Pro Glu Leu Met Pro Leu Lys His130 135 140Val Leu Ala Thr Lys Leu Gly Ala Arg Leu Thr Glu Val Arg Lys Asn145 150 155 160Gly Thr Cys Ala Trp Val Arg Pro Asp Gly Lys Thr Gln Val Thr Val165 170 175Glu Tyr Leu Asn Glu Asp Gly Ala Met Val Pro Val Arg Val His Thr180 185 190Val Leu Ile Ser Thr Gln His Asp Glu Thr Val Thr Asn Asp Glu Ile195 200 205Ala Ala Asp Leu Lys Glu His Val Ile Lys Pro Val Ile Pro Ala Lys210 215 220Tyr Leu Asp Glu Asn Thr Ile Phe His Leu Asn Pro Ser Gly Arg Phe225 230 235 240Val Ile Gly Gly Pro His Gly Asp Ala Gly Leu Thr Gly Arg Lys Ile245 250 255Ile Ile Asp Thr Tyr Gly Gly Trp Gly Ala His Gly Gly Gly Ala Phe260 265 270Ser Gly Lys Asp Pro Thr Lys Val Asp Arg Ser Gly Ala Tyr Ile Ala275 280 285Arg Gln Ala Ala Lys Ser Ile Ile Ala Ser Gly Leu Ala Arg Arg Cys290 295 300Ile Val Gln Ile Ser Tyr Ala Ile Gly Val Pro Glu Pro Leu Ser Val305 310 315 320Phe Val Asp Ser Tyr Gly Thr Gly Lys Ile Pro Asp Arg Glu Ile Leu325 330 335Lys Leu Val Lys Glu Asn Phe Asp Phe Arg Pro Gly Met Ile Ser Ile340 345 350Asn Leu Asp Leu Lys Lys Gly Gly Asn Arg Phe Ile Lys Thr Ala Ala355 360 365Tyr Gly His Phe Gly Arg Asp Asp Ala Asp Phe Thr Trp Glu Val Val370 375 380Lys Pro Leu Lys Phe Asp Lys Ala Ser Ala385 390(2)序列43資料(i)序列特征(A)長度1353個堿基對(B)類型核酸(C)鏈型單(D)拓?fù)浣Y(jié)構(gòu)線形(ii)分子類型cDNA(vii)原始來源(A)生物大麥(xi)序列描述序列43GAATTCCGGA TAGCATCAGC ACAACTGCAC GAGAGCATCT CTACCACCAA AGAAATGGCG 60GCCGAGACGT TCCTCTTCAC GTCCGAGTCC GTGAACGAGG GCCATCCCGA CAAGCTGTGC120GACCAGGTCT CTGACGCCGT CTTGGACGCC TGCTTGGCCC AGGATCCTGA CAGCAAGGTT180GCTTGCGAGA CCTGCACCAA GACCAACATG GTCATGGTCT TCGGCGAGAT CACCACCAAG240GCCACCGTTG ACTATGAGAA GATTGTGCGC GACACCTGCC GTGACATCGG CTTCATCTCT300GACGACGTCG GTCTCGATGC CGACCATTGC AAGGTGCTCG TCAACATCGA GCAGCAATCC360CCTGACATTG CCCAGGGTGT TCACGGACAC TTCACCAAGC GTCCAGAAGA GGTCGGCGCC420GGTGACCAGG GCATCATGTT TGGCTACGCC ACTGATGAGA CCCCTGAGCT GATGCCCCTC480ACCCACATGC TTGCCACCAA GCTCGGAGCT CGCCTCACCG AGGTCCGCAA GAATGGCACC540TGCGCCTGGC TCAGGCCTGA TGGAAAGACC CAGGTCACCA TTGAGTACCT AAACGAGGGT600GGTGCCATGG TGCCCGTTCG TGTGCACACC GTCCTCATCT CCACCCAGCA TGATGAGACC660GTCACCAACG ATGAGATCGC TGCAGACCTC AAGGAGCATG TCATCAAGCC GGTGATTCCC720GGGAAGTACC TCGATGAGAA CACCATCTTC CACCTGAACC CATCGGGCCG CTTTGTCATC780GGTGGCCCTC ACGGCGATGC CGGTCTCACC GCCCGCAAGA TCATCATCGA CACCTATGGT840GGCTGGGGAG CCCACGGCGG CGGTGCCTTC TCTGGCAAGG ACCCTACCAA GGTCGACCGC900AGTGGCGCCT ACATTGCCAG GCAGGCTGCC AAGAGCATCA TCGCCAGCGG CCTCGCACGC960CGGTGCATTG TGCAGATCTC ATATGCCATC GGTGTACCTG AGCCTTTGTC TGTGTTCGTC 1020GACTCCTACG GCACTGGCAA GATCCCTGAC AGGGAGATCC TCAAGCTCGT GAAGGAGAAC 1080TTTGACTTCA GACCCGGGAT GATCACGATC AACCTCGACT TGAAGAAAGG TGGAAACAGG 1140TTCATCAAGA CAGCTGCTTA CGGTCACTTT GGCCGCGATG ATGCTGACTT CACCTGGGAG 1200GTGGTGAAGC CCCTCAAGTT CGACAAGGCA TCTGCTTAAG AAGAAGACAT CACATTGAGG 1260GTTCTTCTTG GTCTGATGCC TCTCAAGTTC GGCAAGGCGG GATCCTTTTG CTCCTCGGAA 1320GTAAGAAGAA GCATTCAACA TCGCCCGGAA TTC135權(quán)利要求
1.一種編碼植物二氫吡啶二羧酸還原酶的全部或主要部分的分離的核酸片段,包括選自下列一組的一員(a)一種編碼選自序列2和4的一員所示氨基酸序列的全部或主要部分的分離的核酸片段;(b)一種分離的核酸片段,該片段大體上類似于一種編碼選自序列2和4的一員所示氨基酸序列的全部或主要部分的分離的核酸片段;和(c)一種互補(bǔ)于(a)或(b)的分離的核酸片段。
2.一種如權(quán)利要求1的分離的核酸片段,其中,所述片段的核苷酸序列包括選自序列1和3的一員所示的全部或一部分。
3.一種嵌合基因,包括可操作地連接于合適調(diào)控序列上的權(quán)利要求1所述的核酸片段。
4.一種含有權(quán)利要求3的嵌合基因的轉(zhuǎn)化宿主細(xì)胞。
5.一種二氫吡啶二羧酸還原酶多肽,包括選自序列2和4的一員所示氨基酸序列的全部或主要部分。
6.一種編碼植物二氨基庚二酸差向異構(gòu)酶的全部或主要部分的分離的核酸片段,包括選自下列一組的一員(a)一種編碼選自序列7、9、11、和13的一員所示氨基酸序列的全部或主要部分的分離的核酸片段;(b)一種分離的核酸片段,該片段大體上類似于一種編碼選自序列7、9、11、和13的一員所示氨基酸序列的全部或主要部分的分離的核酸片段;和(c)一種互補(bǔ)于(a)或(b)的分離的核酸片段。
7.一種如權(quán)利要求6的分離的核酸片段,其中,所述片段的核苷酸序列包括選自序列6、8、10、和12的一員所示的全部或一部分。
8.一種嵌合基因,包括可操作地連接于合適調(diào)控序列上的權(quán)利要求6所述的核酸片段。
9.一種含有權(quán)利要求8的嵌合基因的轉(zhuǎn)化宿主細(xì)胞。
10.一種二氨基庚二酸差向異構(gòu)酶多肽,包括選自序列7、9、11、和13的一員所示氨基酸序列的全部或主要部分。
11.一種編碼植物蘇氨酸合酶的全部或主要部分的分離的核酸片段,包括選自下列一組的一員(a)一種編碼選自序列16和18的一員所示氨基酸序列的全部或主要部分的分離的核酸片段;(b)一種分離的核酸片段,該片段大體上類似于一種編碼選自序列16和18的一員所示氨基酸序列的全部或主要部分的分離的核酸片段;和(c)一種互補(bǔ)于(a)或(b)的分離的核酸片段。
12.一種如權(quán)利要求11的分離的核酸片段,其中,所述片段的核苷酸序列包括選自序列15和17的一員所示序列的全部或一部分。
13.一種嵌合基因,包括可操作地連接于合適調(diào)控序列上的權(quán)利要求11所述的核酸片段。
14.一種含有權(quán)利要求13的嵌合基因的轉(zhuǎn)化宿主細(xì)胞。
15.一種蘇氨酸合酶多肽,包括選自序列16和18的一員所示氨基酸序列的全部或主要部分。
16.一種編碼植物蘇氨酸合酶的全部或主要部分的分離的核酸片段,包括選自下列一組的一員(a)一種分離的核酸片段,編碼序列20所示氨基酸序列的全部或主要部分;(b)一種分離的核酸片段,該片段大體上類似于編碼序列20所示氨基酸序列的全部或主要部分的分離的核酸片段;和(c)一種互補(bǔ)于(a)或(b)的分離的核酸片段。
17.一種如權(quán)利要求16的分離的核酸片段,其中,所述片段的核苷酸序列包括序列19所示序列的全部或一部分。
18.一種嵌合基因,包括可操作地連接于合適調(diào)控序列上的權(quán)利要求16所述的核酸片段。
19.一種含有權(quán)利要求18的嵌合基因的轉(zhuǎn)化宿主細(xì)胞。
20.一種蘇氨酸合酶多肽,包括序列20所示氨基酸序列的全部或主要部分。
21.一種編碼植物蘇氨酸合酶的全部或主要部分的分離的核酸片段,包括選自下列一組的一員(a)一種編碼選自序列22和24的一員所示氨基酸序列的全部或主要部分的分離的核酸片段;(b)一種分離的核酸片段,該片段大體上類似于一種編碼選自序列22和24的一員所示氨基酸序列的全部或主要部分的分離的核酸片段;和(c)一種互補(bǔ)于(a)或(b)的分離的核酸片段。
22.一種如權(quán)利要求21的分離的核酸片段,其中,所述片段的核苷酸序列包括選自序列21和23的一員所示序列的全部或一部分。
23.一種嵌合基因,包括可操作地連接于合適調(diào)控序列上的權(quán)利要求21所述的核酸片段。
24.一種含有權(quán)利要求23的嵌合基因的轉(zhuǎn)化宿主細(xì)胞。
25.一種蘇氨酸合酶多肽,包括選自序列22和24的一員所示氨基酸序列的全部或主要部分。
26.一種編碼植物蘇氨酸合酶的全部或主要部分的分離的核酸片段,包括選自下列一組的一員(a)一種分離的核酸片段,編碼序列26所示氨基酸序列的全部或主要部分;(b)一種分離的核酸片段,該片段大體上類似于編碼序列26所示氨基酸序列的全部或主要部分;和(c)一種互補(bǔ)于(a)或(b)的分離的核酸片段。
27.一種如權(quán)利要求26的分離的核酸片段,其中,所述片段的核苷酸序列包括序列25所示序列的全部或一部分。
28.一種嵌合基因,包括可操作地連接于合適調(diào)控序列上的權(quán)利要求26所述的核酸片段。
29.一種含有權(quán)利要求28的嵌合基因的轉(zhuǎn)化宿主細(xì)胞。
30.一種蘇氨酸合酶多肽,包括序列26所示氨基酸序列的全部或主要部分。
31.一種植物編碼蘇氨酸脫氨酶的全部或主要部分的分離的核酸片段,包括選自下列一組的一員(a)一種分離的核酸片段,編碼序列29所示氨基酸序列的全部或主要部分;(b)一種分離的核酸片段,該片段大體上類似于編碼序列29所示氨基酸序列的全部或主要部分的分離核酸片段;和(c)一種互補(bǔ)于(a)或(b)的分離的核酸片段。
32.一種如權(quán)利要求31的分離的核酸片段,其中,所述片段的核苷酸序列包括序列28所示序列的全部或一部分。
33.一種嵌合基因,包括可操作地連接于合適調(diào)控序列上的權(quán)利要求31所述的核酸片段。
34.一種含有權(quán)利要求33的嵌合基因的轉(zhuǎn)化宿主細(xì)胞。
35.一種蘇氨酸脫氨酶多肽,包括序列29所示氨基酸序列的全部或主要部分。
36.一種編碼植物蘇氨酸脫氨酶的全部或主要部分的分離的核酸片段,包括選自下列一組的一員(a)一種編碼選自序列31和33的一員所示氨基酸序列的全部或主要部分的分離的核酸片段;(b)一種分離的核酸片段,該片段大體上類似于一種編碼選自序列31和33的一員所示氨基酸序列的全部或主要部分的分離的核酸片段;和(c)一種互補(bǔ)于(a)或(b)的分離的核酸片段。
37.一種如權(quán)利要求36的分離的核酸片段,其中,所述片段的核苷酸序列包括選自序列30和32的一員所示序列的全部或一部分。
38.一種嵌合基因,包括可操作地連接于合適調(diào)控序列上的權(quán)利要求36所述的核酸片段。
39.一種含有權(quán)利要求38的嵌合基因的轉(zhuǎn)化宿主細(xì)胞。
40.一種蘇氨酸脫氨酶多肽,包括選自序列31和33的一員所示氨基酸序列的全部或主要部分。
41.一種編碼植物S-腺苷甲硫氨酸合酶的全部或主要部分的分離的核酸片段,其中,所述片段的核苷酸序列包括序列35所示序列的全部或一部分。
42.一種嵌合基因,包括可操作地連接于合適調(diào)控序列上的權(quán)利要求41所述的核酸片段。
43.一種含有權(quán)利要求42的嵌合基因的轉(zhuǎn)化宿主細(xì)胞。
44.一種編碼植物S-腺苷甲硫氨酸合酶的全部或主要部分的分離的核酸片段,其中,所述片段的核苷酸序列包括序列38所示序列的全部或一部分。
45.一種嵌合基因,包括可操作地連接于合適調(diào)控序列上的權(quán)利要求44所述的核酸片段。
46.一種含有權(quán)利要求45的嵌合基因的轉(zhuǎn)化宿主細(xì)胞。
47.一種編碼植物S-腺苷甲硫氨酸合酶的全部或主要部分的分離的核酸片段,其中,所述片段的核苷酸序列包括序列41所示序列的全部或一部分。
48.一種嵌合基因,包括可操作地連接于合適調(diào)控序列上的權(quán)利要求47所述的核酸片段。
49.一種含有權(quán)利要求48的嵌合基因的轉(zhuǎn)化宿主細(xì)胞。
50.一種改變植物氨基酸生物合成酶在宿主細(xì)胞中的表達(dá)水平的方法,包括(a)用權(quán)利要求3、8、13、18、23、28、33、38、42、45、和48中任一個所述的嵌合基因轉(zhuǎn)化一種宿主細(xì)胞;和(b)在適于所述嵌合基因表達(dá)的條件下生長在步驟(a)中生產(chǎn)的轉(zhuǎn)化的宿主細(xì)胞;其中,所述嵌合基因的表達(dá)會導(dǎo)致所述轉(zhuǎn)化的宿主細(xì)胞中一種植物氨基酸生物合成酶產(chǎn)量的改變。
51.一種獲得編碼編碼植物氨基酸生物合成酶的氨基酸序列的全部或主要部分的核酸片段的方法,包括(a)用權(quán)利要求1、6、11、16、21、26、31、36、41、44、和47中任一項的核酸片段檢測cDNA或基因組文庫;(b)鑒定能與權(quán)利要求1、6、11、16、21、26、31、36、41、44、和47中任一項的核酸片段雜交的DNA克??;(c)分離在步驟(b)中鑒定的DNA克??;和(d)對包括在步驟(c)分離的克隆的cDNA或基因組片段進(jìn)行測序;其中,所述測序的核酸片段編碼所述編碼植物氨基酸生物合成酶的氨基酸序列的全部或主要部分。
52.一種獲得編碼一種植物氨基酸生物合成酶氨基酸序列的一部分的核酸片段的方法,包括(a)合成一種寡核苷酸引物,該引物相應(yīng)于序列1、3、6、8、10、12、15、17、19、21、23、25、28、30、32、35、38、和41中任一個所示序列的一部分;和(b)使用步驟(a)的寡核苷酸引物和代表所述克隆載體的序列的引物擴(kuò)增存在于一種克隆載體上的cDNA插入片段;其中,所述擴(kuò)增的核酸片段編碼一種植物氨基酸生物合成酶的氨基酸序列的一部分。
53.如權(quán)利要求51的方法的產(chǎn)物。
54.如權(quán)利要求52的方法的產(chǎn)物。
55.一種用于評價至少一種化合物抑制一種植物生物合成酶的活性的能力的方法,所述酶選自二氫吡啶二羧酸還原酶、二氨基庚二酸差向異構(gòu)酶、蘇氨酸合酶、蘇氨酸脫氨酶和S-腺苷甲硫氨酸合酶,所述方法包括以下步驟(a)用一種嵌合基因轉(zhuǎn)化一種宿主細(xì)胞,所述嵌合基因包括編碼選自二氫吡啶二羧酸還原酶、二氨基庚二酸差向異構(gòu)酶、蘇氨酸合酶、蘇氨酸脫氨酶和S-腺苷甲硫氨酸合酶的一種植物生物合成酶的核酸片段,該核酸片段可操作地連接于合適的調(diào)控序列上;(b)在適于表達(dá)所述嵌合基因的條件下生長所述轉(zhuǎn)化的宿主細(xì)胞,其中,所述嵌合基因的表達(dá)會導(dǎo)致在所述轉(zhuǎn)化的宿主細(xì)胞中由所述可操作地連接的核酸片段編碼的生物合成酶的產(chǎn)生;(c)可任選地純化所述轉(zhuǎn)化的宿主細(xì)胞表達(dá)的生物合成酶;(d)用一種待測試的化合物處理所述生物合成酶;和(e)將用一種測試化合物處理過的生物合成酶的活性與未處理過的生物合成酶的活性加以比較,以便選擇具有潛在的抑制活性的化合物。
全文摘要
本發(fā)明涉及一種編碼一種植物酶的分離的核酸片段,所述酶能催化由天冬氨酸生物合成賴氨酸、蘇氨酸、甲硫氨酸、半胱氨酸和異亮氨酸的步驟,所述酶是選自下列一組的一員:二氫吡啶二羧酸還原酶、二氨基庚二酸差向異構(gòu)酶、蘇氨酸合酶、蘇氨酸脫氨酶和S-腺苷甲硫氨酸合酶。本發(fā)明還涉及編碼所述酶的全部或部分的有義或反義取向嵌合基因的構(gòu)建,其中,該嵌合基因的表達(dá)會導(dǎo)致在轉(zhuǎn)化的宿主細(xì)胞中產(chǎn)生改變了含量的酶。
文檔編號C12N9/90GK1259170SQ98805878
公開日2000年7月5日 申請日期1998年6月5日 優(yōu)先權(quán)日1997年6月6日
發(fā)明者S·C·法爾科, S·M·阿倫, J·A·拉法爾斯基, W·D·希茨, A·J·金尼, L·M·阿貝爾, C·J·托爾佩 申請人:納幕爾杜邦公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1