亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

生物素的制備方法

文檔序號:454217閱讀:1243來源:國知局
專利名稱:生物素的制備方法
技術(shù)領(lǐng)域
本發(fā)明與一種基因構(gòu)建物有關(guān),該基因構(gòu)建物含有下列基因具有序列號1的S-腺苷甲硫氨酸合成酶基因;分別具有序列號3、序列號5和序列號7的生物素生物合成基因bioS1、bioS2和/或bioS3;以及在適當(dāng)場合,至少一種選自bioA、bioB、bioF、bioC、bioD、bioH、bioP、bioW、bioX、bioY或bioR的生物素合成基因序列。此外,本發(fā)明與含有這種基因構(gòu)建物的生物和應(yīng)用這種基團(tuán)構(gòu)建制備生物素有關(guān)。本發(fā)明還與制備生物素的方法有關(guān)。
作為輔酶,生物素(維生素H)在酶催化的羧化和脫羧化反應(yīng)中起重要作用。因此,生物素是活細(xì)胞中的一種不可缺少的成分。幾乎所有的動物以及某些微生物必需從外部攝取生物素,因為它們本身不能合成生物素。所以,生物素對這類有機(jī)體而言,是一種必需維生素。相反,細(xì)菌、酵母和植物自身能從生物素前體合成生物素(Brown等生物技術(shù)和遺傳工程評論(Biotechno1.Genet.Eng Rev)9,1991295-326,DeMoll E.,Escherichia coli and Salmonella,eds.Neidhardt,F(xiàn).C.et al,ASM Press,Washington DC,USA,1996704-708,ISBN1-55581-084-5)。
有人已對細(xì)菌,尤其革藍(lán)氏陰性的大腸(埃希氏桿菌和革藍(lán)氏陽性的圓形芽胞桿菌體內(nèi)的生物素合成進(jìn)行了研究(Brown等,生物技術(shù)和基因工程評論(Biotechnol.Genet.Eng Rev)9,1991295~326)。庚二酰輔酶A(PmCoA)來源于脂肪酸合成,迄今是最早知道的大腸桿菌的中間產(chǎn)物(DeMoll E.大腸桿菌和圓形芽胞桿菌(Escherichiacoland Salmonella)eds.Neidhardt F.C.et al.ASM Press,Washington DC,USA,1996704-708,ISBN 1-55581-084-5,1996)。直到現(xiàn)在,在大腸桿菌中這種生物素前體得以合成的途徑,在很大程度上仍然是未知的(Lemoine等,分子微生物學(xué)(Mol.Microbiol.19.1996645~647)。bioC和bioH已被確認(rèn)為是二種基因,其相應(yīng)的蛋白負(fù)責(zé)Pm-CoA的合成。這種基因產(chǎn)物即BioH和BioH的酶功能至今尚不清楚(Lemoine等分子微生物學(xué)(Mol Microbiol)19,1996645~647;DeMoll E.大腸桿菌和圓形芽胞桿菌(Escherichia coliand Salmonella)eds.Neidhardt F.C.et al.ASM Press,Washington DC,USA,1996704-708,ISBN -55581-084-5)。經(jīng)過4個酶步驟,Pm-CoA轉(zhuǎn)化為生物素。第一步,BioF把Pm-CoA和丙氨酸縮合,形成7-酮-8-氨基壬酸(KAPA)。然后BioA把KAPA轉(zhuǎn)化為7,8二氨基壬酸(DAPA)。在ATP依賴的羧化反應(yīng)后,下一個步驟產(chǎn)生去巰基生物素(DTB),這一過程由BioD催化。在最后一個步驟中,DTB轉(zhuǎn)化為生物素。在DTB轉(zhuǎn)化為生物素過程中所涉及的化學(xué)機(jī)制和酶機(jī)制日前只是部分地了解和弄清楚。
迄今為止,只有細(xì)菌和植物細(xì)胞提取物中由DTB轉(zhuǎn)化為生物素的特性已得到描述(WO94/8023、EP-B-0 449 724,Sanyal等,生物化學(xué)與生物物理檔案(Arch.Biochem.Biophys vol 326,No 1,199648-56和生物化學(xué)(Biochemistry)33,19943625-3631,Baldet等歐洲生物化學(xué)雜志(Europ J.Biochem)1,1993479-485,Wéjean等生化反應(yīng)物物理進(jìn)展通訊(Biochem,Biophys.Res.Comun vol 217,No.3,19951231~1237,Ohshiro等,生物科學(xué)生物技術(shù)和生物化學(xué)(Biosci.Biotechnol.Biochem)58(9),19941738-1741)。
體外試驗證明,低分子量生化成分如NADPH,半胱氨酸,硫胺素,F(xiàn)e2+,天門冬酰胺,絲氨酸,果糖1,6-二磷酸和S-腺苷甲硫氨酸能刺激生物素的合成(Ohshiro等,生物科學(xué)生物技術(shù)和生物化學(xué)(Biosci.Biotechnol.Biochem)58,9,19941738-1741,Birch等,生物學(xué)和化學(xué)雜志(J.Biol Chem)270,32,199519158-19165,Ifuku等,生物科學(xué)生物技術(shù)和生物化學(xué)(Biosci.Biotechnol.Biochem)59,2,1995185~189,Sanyal等,生物化學(xué)與生物物理檔案(Arch BiochemBiophys)326,1,199648-56)。
除這些低分子量生化成分外,現(xiàn)已確認(rèn),某些蛋白質(zhì)在BioB存在下,也可刺激從DTB合成生物素。這些蛋白是黃素氧化還原蛋白和黃素氧化還原蛋白NADPH還原酶(Birch等,生物學(xué)和化學(xué)雜志(J.BiolChem)270,32,199519158~19165,Ifuk等生物科學(xué)生物技術(shù)和生物化學(xué)(Biosci.Biotechnol.Biochem)59,2,1995185~189,Sanyal等,生物化學(xué)與生物物理檔案(Arch Biochem Biophys)326,1,199648-56)。能刺激生物素合成的其他蛋白還有基因bioS1和bioS2,在專利申請?zhí)枮?97.31274.8(優(yōu)先權(quán)97.7.22)的德國專利申請中對此加以闡述。
關(guān)于生物素分子中硫的來源,得到不同的研究結(jié)果。對整體細(xì)胞抽提物中生物素合成的研究表明,在35S-標(biāo)記的半胱氨酸存在下,放射性可插入生物素分子中;采用35S-標(biāo)記的甲硫氨酸或S-腺苷甲硫氨酸時,要證明硫插入生物素分子中是不可能的(Ifuku等,生物科學(xué)生物技術(shù)和生物化學(xué)(Biosci.Biotechnol.Biochem)59,2,1995184~189,Birch等,生物學(xué)和化學(xué)雜志(J.Biol Cehm)270,32,199519158~19165)。
編碼所述蛋白的基因,即bioF,bioA,BioD和bioB被編碼于大腸桿菌雙向操縱子上,該操縱子位于大腸桿菌染色體上約17分鐘處λ連接部位和B基因座之間(Berlyn等,19961715~1902。該操縱子上還編碼有二個基因,其中之一即bioC,已經(jīng)報道在pm-CoA的合成中具有功能,而到目前為止,確定位于BioA下游的(DNA)可譯框架具有何種功能還是不可能的(WO 94/8023,Otsuka等,生物學(xué)和化學(xué)雜志(J.Biol Chem).263,198819577~19585)。在圓形芽胞桿菌,枯草桿菌,Syneccocystis sp(Brown等,生物技術(shù)和基因工程評論(Biotechnol Genet.Eng.Rev)9,1991295~326,Bower等,細(xì)菌學(xué)雜志(J Bacteriol)175,19964122-4130,Kaneko等,DNARes,3,3,1996109~136),在古細(xì)菌如甲烷球菌,酵母如啤酒酵母菌(Zhang等,生物化學(xué)生物物理評論(Arch Biochem Biophys)309,1,199429~35)或植物如擬南芥(Arabidopsis thaliana)(Baldet等,C.R.Acad.Sci.Ⅲ,Sci Vie.319,2,199699~106)中都已經(jīng)發(fā)現(xiàn)大腸桿菌蛋白BioF,BioA,BioD和BioB的高度保守的同系物。
在迄今為止已研究的二種革蘭氏陽性微生物中,Pm-CoA的合成看來以與大腸桿菌不同的方式進(jìn)行。發(fā)現(xiàn)BioH和BioC的任何同系物是不可能的(Brown等,生物技術(shù)遺傳工程評論(Biotechnol Genet.Eng.Rev)9,1991295~326)。
生物素是一種具有三個手性中心的光學(xué)上活性物質(zhì)。迄今只是從經(jīng)濟(jì)上用昂貴的多步驟化學(xué)合成法制備生物素。
作為這種化學(xué)合成法的替代方法,人們已作出許多努力建立一種微生物發(fā)酵法制備生物素。在已經(jīng)轉(zhuǎn)化了克隆多拷貝質(zhì)粒上的生物素操縱子的基因的微生物中已成功地增加了生物素的合成。采用選擇birA變異體的方法,來增量調(diào)節(jié)生物素基因表達(dá),進(jìn)一步提高生物素合成(Pai.C.H.細(xì)菌學(xué)雜志(J.Bacteriol)112,19721280~1287)。把這二種方法結(jié)合起來,即在調(diào)控功能不良的菌株(EP-B-0236429)中表達(dá)質(zhì)粒編碼的生物合成基因,生物素的合成產(chǎn)量還可進(jìn)一步提高。在這種情況下,生物素操縱子或仍處于其天然雙向啟動子(EP-B-0 236 429)的控制下,或在外來啟動子(WO 94/08023)的控制下。
到目前為止,這種一直在應(yīng)用的生產(chǎn)生物素的大腸桿菌發(fā)酵法尚未取得任何經(jīng)濟(jì)上適當(dāng)?shù)漠a(chǎn)率。
本發(fā)明的目的之一是要建立一種工業(yè)化的,生物素合成產(chǎn)率盡可能高的發(fā)酵法來生產(chǎn)生物素。
我們發(fā)現(xiàn),采用根據(jù)本發(fā)明生產(chǎn)生物素的方法,這一目的能夠達(dá)到,在該法中,把S-腺苷甲硫氨酸合成酶即SAM合成酶,具有序列號1的為例,至少一個生物索生物合成基因bioS1,bioS2或bioS3分別具有序列號3,5和7的序列及其功能性變異體,類似物或衍生物,在原核生物或真核生物宿主中表達(dá)合成生物素,將此生物進(jìn)行培養(yǎng),從其生物量分離出所合成的生物素后,或純化該生物素后,這種生物素可直接應(yīng)用。
根據(jù)本發(fā)明的該方法中所用的基因,即SAM合成酶(其序列為序列號1)以及生物素生物合成基因bioS1,bioS2或bioS3(其序列為序列號分別為3,5和7),在訪問號碼分別為P04384(metk)、U29581(bioS1)、P39171(bioS2)和D90811(bioS3)下,貯存于SwissProt數(shù)據(jù)庫中。在該數(shù)據(jù)庫中,大腸桿菌Metk的許多同系物都有描述。這些同系物包括這樣一些生物其他真細(xì)菌(如H.influenzae,枯草桿菌);真核生物(例如,酵母啤酒酵母菌;植物P.deltoides;節(jié)肢動物D.melanogaster;哺乳動物R.norvegicus)。
用下面的方法可使生物素生物合成的產(chǎn)率顯著增高在原核生物或真核生物宿主中表達(dá)一個或多個其序列為序列號1的SAM合成酶基因及其功能性變異體、類似物或衍生物,與至少一個生物素合成基因bioS1,bioS2或bioS3(其序列為序列號分別為No 3,No 5和No 7)及其功能性變異體,類似物或衍生物中的結(jié)合。SAM合成酶基因與bioS1的結(jié)合優(yōu)先用于表達(dá)。至少還有一種選自bioA、bioB、bioF、bioC、bioD、bioH、bioP、bioW、bioX、bioY和bioR的生物素基因在同一時間有效地被表達(dá),以進(jìn)一步提高生物素的合成產(chǎn)率。與沒有這些基因的對照相比,這些基因的表達(dá)可使生物素的合成量至少增加2倍,最好時增加3倍多。
本發(fā)明的生物素制備法中所用的基因,即核苷酸序列序列號為1的SAM合成酶基因,核苷酸序列序列號為3的bioS1基因,核苷酸序列序列號為5的bioS2和核苷酸序列序列號為7的bioS3——這4種核苷酸序列編碼的氨基酸序列分別賦予序列號2、序列號4、序列號6和序列號8,或這些基因的等位變種,可以在分離并作(核苷酸)序列分析后獲得。這些變種分別被命名為序列號1變種,序列號3變種,序列號5變種和序列號7變種,這些變種在氨基酸水平上顯示30%~100%的同源性,優(yōu)選50%~100%同源性,特別優(yōu)選80%~100%同源性。特別是這些等位變種包含有功能的變種,后者可通過將核苷酸從序列號1、序列號3、序列號5和序列號7中所描述的核苷酸序列中刪除、插入或替代而獲得,但酶活性仍然保持。
此外,這些變種也可被理解為某些基因如O-乙酰絲氨酸磺基水解酶A,O-乙酰絲氨酸磺基水解酶B和β-胱硫醚酶(見Flint等,生物學(xué)和化學(xué)雜志(J Biol Chem)vol 271,199616053~16067),或nifs及其原核生物和真核生物同系物——例如從Klebsiella,念珠菌屬,酵母或Caenorhabditis提取,可以推測它們是在生物素的合成中具有bioS1,bioS2或bioS3的酶活性——的有功能的同等物。
序列號1、序列號3、序列號5和序列號7的具功能的類似物可理解為-舉例-其原核生物或真核生物同系物,例如細(xì)菌、霉菌、植物、動物和人同系物。此外,這些類似物也可理解為截短的核苷酸序列,或來源于編碼的或非編碼的DNA序列的單鏈DNA或RNA。
這些衍生物可理解為-舉例-啟動子變種。定位于已知核苷酸序列上游的啟動子可通過一個或數(shù)個核苷酸的替代,或插入,或刪除而加以改變,但不會損害這些啟動子的功能性或活性。此外,可通過改變啟動子的核苷酸序列提高啟動子的活性,或者(原來的)啟動子能完全被活性更高的啟動子,包括來源于不同種類生物的啟動子所代替。
這些衍生物也可理解為是這樣的變種其起始密碼子上游-1~-30區(qū)域的核苷酸序列已經(jīng)改變,從而基因的表達(dá)和/或蛋白質(zhì)的表達(dá)得到增加。改變SD片段序列這種影響更為明顯。
在本發(fā)明的生物素制備法中,所有各種革蘭氏陰性和革蘭氏陽性細(xì)菌原則上都適用于用作原核生物的宿主生物。以舉例的方式可能提到的革蘭氏陰性細(xì)菌有腸道(無芽胞)桿菌科如大腸埃希氏桿菌屬,氣桿菌屬,腸桿菌屬,枸櫞酸桿菌屬(citrobacter),志賀氏桿菌族,克雷白氏桿菌屬,沙雷氏菌屬,歐文氏菌屬或沙門氏菌屬;假單胞菌科,如假單胞菌屬,黃單胞桿菌屬,Burkholderia屬,葡萄糖酸桿菌屬,亞硝化單胞菌屬,硝化菌屬,甲烷單毛桿菌屬,叢毛單胞菌(Comamonas)屬,纖維(單胞)菌屬,或醋酸桿菌屬;定氮菌科,如定氮菌屬,氮桿菌屬,Beijerinckia屬或Derxia屬;奈瑟氏菌科,如摩拉克氏菌屬,不動桿菌屬(Acinetobacter),Kingella屬,奈瑟氏菌屬或Branhamella屬;根瘤菌科,如根瘤菌屬,或植物肥大病菌屬,或革蘭氏陰性發(fā)酵桿菌屬,色素桿菌屬或產(chǎn)黃菌屬。以舉例的方式提到的革蘭氏陽性細(xì)菌有可形成內(nèi)孢子的革蘭氏陽性的需氧菌或厭氧菌,例如,芽胞桿菌屬,孢子乳(酸)桿菌屬(Sporolactobaccillus)或梭狀芽胞桿菌屬;棒狀形成菌例如,節(jié)桿菌屬(Arthrobacter),纖維(單胞)菌屬,Curtobacterium,棒狀桿菌屬,短桿菌屬,細(xì)纖菌或庫爾特氏桿菌屬;放線菌目,例如,分枝桿菌屬,紅球菌屬,鏈霉菌屬,或諾卡氏菌屬;乳酸桿菌科,例如,乳酸桿菌屬,或乳酸球菌屬(Lactococus),或革蘭氏陽性球菌,例如微球菌屬,或葡萄球菌屬。
在本發(fā)明的生物素制備法中,優(yōu)先選擇使用下列細(xì)菌埃希氏桿菌屬,枸櫞酸桿菌屬,沙雷氏菌屬,克雷白氏桿菌屬,沙門氏菌屬,假單胞菌屬,叢毛單胞菌屬(Comamonas),不動桿菌屬(Acinetobacter),定氮菌屬,色素桿菌屬,芽胞桿菌屬,梭狀芽胞桿菌屬,節(jié)桿菌屬,棒狀桿菌屬,短桿菌屬,乳酸球菌屬,乳酸桿菌屬,鏈霉菌屬,根瘤菌屬,土壤桿菌屬,葡萄球菌屬。特別優(yōu)先選擇下列菌屬和菌種大腸埃希氏桿菌;枸櫞酸桿菌屬;弗氏檸檬酸桿菌;沙雷氏菌屬粘質(zhì)沙雷氏菌;沙門氏菌屬鼠傷寒沙門氏菌;假單胞菌屬門多隆假單胞菌,綠膿桿菌,可變假單胞菌,綠針假單胞菌,螢光假單胞菌;叢毛單胞菌屬食酸叢毛單胞菌(食酸假單胞菌),睪丸酮叢毛單胞菌;不動桿菌屬乙酸鈣不動桿菌;定氮菌屬維涅蘭德固氮菌;色素桿菌屬青紫色素桿菌;芽胞桿菌屬枯草芽胞桿菌,球形芽胞桿菌,立體嗜熱桿菌,地衣型芽胞桿菌,液化性淀粉桿菌,巨大芽胞桿菌,蠟樣芽胞桿菌,蘇云金芽胞桿菌;節(jié)桿菌屬檸檬節(jié)桿菌,石臘節(jié)桿菌;棒桿菌屬谷氨酸棒桿菌,Corynebacterium Primorioxydans,Corynebacterium sp.,短桿菌屬酮戊二酸短桿菌,擴(kuò)展短桿菌,Brevibacterium sp.,鏈霉菌屬淺青紫鏈霉菌;根瘤菌屬豌豆根瘤菌;土壤桿菌屬根瘤土壤桿菌(根瘤農(nóng)桿菌)。尤其優(yōu)先利用那些已經(jīng)顯示天然生物素生成增多的菌株。
近年來,所列出的上述菌屬在分類學(xué)上的位置已經(jīng)發(fā)生很大變化,而且隨著不正確的菌屬和菌種命名得到糾正,還會不斷變化。因為在細(xì)菌分類系統(tǒng)內(nèi),上述的屬的分類學(xué)重新組合——這種分類學(xué)重新組合過去常常是所要求的——,除上述的那些以外的科、屬和種也適用于本發(fā)明的生物素制備方法。
所有能夠合成生物素的生物,如霉菌,酵母,植物或植物細(xì)胞,原則上都適于作為本發(fā)明的生物素制備方法中的真核生物的宿主生物??梢詢?yōu)先提出的酵母有紅酵母,Yarrowia,擲孢酵母屬(Sporobolomyces),酵母屬(Saccharomyces),或裂殖酵母屬。特別優(yōu)先選擇下列菌屬和菌株深紅酵母,紅酵母,牧草紅酵母;YarrowiaLipolylica,赭色擲孢酵母,Sporobolomyces Shibatanus,釀酒酵母。
特別是所有植物都可作為宿主生物使用,優(yōu)先選擇那些在動物營養(yǎng)和人營養(yǎng)方面起重要作用的植物,例如,谷類,小麥,大麥,黑麥,馬鈴薯,豌豆,豆,向日葵,棕櫚,小米,芝麻,椰子內(nèi)核,或油菜。像Arabidopsis thaliana或Lavendula vera這樣的植物也是適用的。特別優(yōu)先選擇的是植物細(xì)胞培養(yǎng)物,植物原生質(zhì)體或愈傷組織培養(yǎng)物。
能將生物素分泌到培養(yǎng)基中,以及非必需的又已經(jīng)顯示生物素天然合成增加的、像細(xì)菌、霉菌、酵母這樣一類微生物或植物細(xì)胞,應(yīng)用于本發(fā)明的生物素生產(chǎn)方法中是有優(yōu)點的。占優(yōu)勢的是,這些生物在其生物素生物合成的調(diào)控方面也是有缺陷的,即這種合成或者不受調(diào)控,或者受調(diào)控到非常弱的程度。這種調(diào)控缺陷導(dǎo)致這些生物已經(jīng)具有使生物素生物合成產(chǎn)率明顯增加的能力。例如,已知大腸桿菌的這樣一種調(diào)控缺陷是以birA缺陷突變體形式存在,而且作為一種能被外部影響因素的誘導(dǎo)缺陷型(例如作為一種溫度可誘導(dǎo)的缺陷),這種缺陷應(yīng)優(yōu)先存在于細(xì)胞中。不顯示任何天然生物素產(chǎn)生能力的生物,一旦它們已用生物素基因作轉(zhuǎn)化處理,原則上也是可采用的。
為了從整體上進(jìn)一步提高生物素生物合成產(chǎn)率,本發(fā)明的生物素生產(chǎn)方法中還應(yīng)至少包含一種有用的選自bioA、bioB、bioF、bioC、bioD、bioH、bioP、bioW、bioX、bioY和bioR的生物素基因。可取的是,能刺激生物素合成的那些基因也可以與核苷酸序列號1、序列號3、序列號5和序列號7及其組合物組合的方式存在于細(xì)胞中,刺激生物素合成的基因的例子有黃素氧還蛋白基因和黃素氧還蛋白還原酶基因。這一附加的基因,或這些附加的基因,像具有序列號1、序列號3、序列號5或序列號7或它們的組合物的基因一樣,能夠以一個或多個拷貝存在于細(xì)胞中。它們能定位于與序列號1、序列號3、序列號5或序列號7一樣的載體上,或者定位于不同的載體上,或者被整合到染色體中去。序列號1、序列號3、序列號5和/或序列號7也可以一起定位于一個載體或不同的載體上,或者一起插入基因組中。
按照本發(fā)明,基因構(gòu)建物應(yīng)被理解為是SAM合成酶基因序列號1的基因序列,是生物素合成基因序列號3、序列號5和/或序列號7以及它們的具功能的變種、類似物或衍生物的基因序列,為了增強(qiáng)基因表達(dá)這一目的,這些基因序列在功能上被連接到一個或多個調(diào)控信號。除了這些新的調(diào)控序列以外,這些基因序列的天然調(diào)控還是可以存在于實際的結(jié)構(gòu)基因的上游,而且在適當(dāng)?shù)膱龊希梢园l(fā)生遺傳改變,這樣天然調(diào)控就被關(guān)閉,基因表達(dá)從而得以增強(qiáng)。但是,這種基因構(gòu)建物也可以更簡單的方式組裝,即,沒有附加的調(diào)控信號插入序列號1、序列號3、序列號5和/或序列號7的上游,而且其天然啟動子以及其調(diào)控并不除去。實際上,使天然調(diào)控序列發(fā)生突變,這樣生物素引起的調(diào)控就不再發(fā)生,從而增加基因表達(dá)。序列號1、序列號3、序列號5和/或序列號7可處于一個啟動子的調(diào)控下,或處于不同的啟動子的調(diào)控下。此外,可利用的調(diào)控成分也可以在DNA序列的3'端插入。具有序列號1、序列號3、序列號5或序列號7的基因也可以一種或多種拷貝存在于本發(fā)明的基因構(gòu)建物中。
例如,可利用于本發(fā)明的方法的調(diào)控序列包括這樣一些革蘭氏陰性菌的啟動子,如cos-,tac-,trp-,tet-,trp-tet-,lpp-,lac-,lpp-lac-,lacIq-,T7-,T5-,T3-,gal-,trc-,ara-,SP6-,λ-PR-或λ-PL-啟動子。進(jìn)一步可利用的調(diào)控序列存在于——舉例——革蘭氏陽性啟動子amy和SPO2,酵母啟動子ADCl,MFα,AC,P-60,CYCl,GAPDH或真菌啟動子CaMV/35S,SSU,OCS,lib4,usp,STLS1,B33或nos,或遍在蛋白啟動子或菜豆蛋白啟動子中。
像上面提及的啟動子一樣,所有天然啟動子與它們的調(diào)控序列一起,原則上都可供本發(fā)明的方法使用。此外,合成的啟動子也是可使用的。
選自bioA、bioB、bioF、bioC、bioD、bioH、bioP、bioW、bioX、bioY和bioR的其他生物素基因可以一個或多個拷貝形式存在于基因構(gòu)建物中,這些基因可以有自己的啟動子,不然的話可處于序列號1、序列號3、序列號5或序列號7諸序列中一個序列的啟動子的調(diào)控之下,或處于所有這些序列的啟動子的調(diào)控之下。
為了在前面提到的宿主生物中表達(dá),把該基因構(gòu)建物便利地插入到宿主特異的載體中,這種載體使得該基因在宿主中達(dá)到最佳表達(dá)成為可能。這些載體為本領(lǐng)域人員所熟知,并能從——舉例——“無性繁殖載體”(Pouwels PH等編,Elsevier,Amsterdam-New York-Oxford,1985,ISBN 0 444 904018)一書中得到確認(rèn)。除質(zhì)粒外,這些載體也被理解為本領(lǐng)域技術(shù)人員所知的所有其他載體,例如,噬菌體,病毒,轉(zhuǎn)座子,IS因子,噬粒,柯斯質(zhì)粒,線形或環(huán)形DNA。這些載體可在宿主生物中自動復(fù)制,或由染色體復(fù)制。
表達(dá)系統(tǒng)應(yīng)被理解為是前面以舉例的方式提及的宿主生物與適于這些生物的載體(例如質(zhì)粒、病毒或噬菌體)的組合,例如,含有RNA多聚酶/啟動子系統(tǒng)、噬菌體λ或Mu或其他溫和噬菌體和/或其他可利用的調(diào)控序列的質(zhì)粒。
術(shù)語表達(dá)系統(tǒng)應(yīng)優(yōu)先理解為是大腸埃希氏桿菌及其質(zhì)粒的結(jié)合,噬菌體和附屬啟動子的結(jié)合,以及棒狀桿菌及其質(zhì)粒和啟動子的結(jié)合。
根據(jù)本發(fā)明,3'和/或5'端調(diào)控序列也適于有效地表達(dá)序列號1、序列號3、序列號5和/或序列號7。
這些調(diào)控序列被打算用來使生物素基因,以及使生物素蛋白特異表達(dá)成為可能。這就意味著,取決于宿主生物(種類),在誘導(dǎo)后只有一種基因得到表達(dá)或過表達(dá),或意味著這種基因立即表達(dá)或過表達(dá)。
在這種情況下,這些調(diào)控序列或調(diào)控因子可優(yōu)選正面影響生物素基因表達(dá),從而增高合成產(chǎn)率。例如,通過采用強(qiáng)轉(zhuǎn)錄信號(如啟動子和/或增強(qiáng)子)的方法,這些調(diào)控成分能夠在轉(zhuǎn)錄水平上有效地得到增強(qiáng)。但是,通過改善mRNA的穩(wěn)定性來增強(qiáng)轉(zhuǎn)譯也是可能的。
增強(qiáng)子應(yīng)被理解為——舉例——通過改善RNA多聚酶和DNA之間相互作用而引起生物素表達(dá)增強(qiáng)的DNA序列。
采用經(jīng)典的致突變方法,例如UV照射,或用化學(xué)致突變劑處理,和/或用特異的致突變方法,如定點突變、刪除、插入和/或替代,通過改變相應(yīng)的基因序列,或其同系物的序列,就能實現(xiàn)從序列號1、序列號3、序列號5和序列號7衍生的蛋白質(zhì)(見序列號2、序列號4、序列號6和序列號8)和其酶活性的增高(與起始酶相比較而言)。除所述的基因擴(kuò)增法以外,通過消除阻遏酶生物合成的因子,和/或合成活性酶而不是無活性酶,也能實現(xiàn)酶活性的增高。
本發(fā)明的生物素生產(chǎn)方法,通過采用下列生物素基因,有效地提高由DTB到生物素的轉(zhuǎn)化率,從而有效地提高生物素的總產(chǎn)率具有序列號1、序列號3、序列號5和序列號7的生物素基因;具有序列號1和序列號5,或序列號1和序列號7的基因的組合,優(yōu)選具有序列號1和序列號3的基因的組合,把該組合基因借助于其載體和/或借助于染色體克隆,導(dǎo)入生物體中。
在本發(fā)明的方法中,把含有序列號1、序列號3、序列號5和/或序列號7的微生物置于能使這些生物生長的培養(yǎng)質(zhì)中繁殖。這種培養(yǎng)基可以是合成的培養(yǎng)基,也可以是天然培養(yǎng)基。使用本領(lǐng)域技術(shù)人員所熟知并適合于這種微生物的培養(yǎng)基。為了使這種微生物生長,所采用的培養(yǎng)基含有碳源,氮源,無機(jī)鹽以及在適當(dāng)?shù)膱龊?,含有少量維生素和微量元素。
可利用的碳源的舉例有糖類如單糖、雙糖或多糖,例如葡萄糖、果糖、甘露糖,木糖,半乳糖,核糖、山梨糖、核酮糖,乳糖,麥芽糖,蔗糖,棉子糖,淀粉或纖維素;復(fù)合糖來源如糖蜜;糖磷酸酯如果糖1,6-二磷酸;糖醇如甘露醇;多元醇如甘油;醇類如甲醇或乙醇;羧酸如枸櫞酸,乳酸或醋酸;脂肪如大豆油、菜子油;氨基酸如谷氨酸或天門冬氨酸;或氨基糖,這些可同時用作一種氮源。
可利用的氮源有有機(jī)氮化合物或無機(jī)氮化合物,或含有這些化合物的材料。舉例;氨鹽如NH4Cl或(NH4)2SO4,硝酸鹽或尿素;或復(fù)合氮源如玉米漿浸出液,Brewer's酵母自溶物,大豆花,小麥面筋,酵母提取物,肉提取物,干酪素水解物,或者酵母蛋白或馬鈴薯蛋白,這些常常也可以同時用作一種氮源。
無機(jī)鹽的例子有鈣鹽、鎂鹽、鈉鹽、錳鹽、鉀鹽、鋅鹽、銅鹽和鐵鹽。將要特別被提及的這些鹽的陰離子有氯離子、硫酸根離子和磷酸根離子。在本發(fā)明的方法中提高生物素產(chǎn)率的一個重要因素是Fe2+或Fe3+鹽和/或鉀鹽加到生產(chǎn)培養(yǎng)基中。
在適當(dāng)?shù)膱龊?,其他生長要素如維生素或生長促進(jìn)劑,例如核黃素,硫胺素,葉酸,尼克酸,泛酸鹽或吡哆醛;氨基酸如丙氨酸,半胱氨酸,門冬酰胺,天門冬氨酸,谷氨酰胺,絲氨酸,甲硫氨酸或賴氨酸;羧酸如枸櫞酸,甲酸,庚二酸或乳酸,或像二巰基丙醇這樣的物質(zhì),被加進(jìn)營養(yǎng)培養(yǎng)基中。
為了穩(wěn)定細(xì)胞中含生物素基因的載體,在適當(dāng)?shù)膱龊希咕匾部梢约拥脚囵B(yǎng)基中。
上述營養(yǎng)成份混合的比例取決于發(fā)酵的性質(zhì),并根據(jù)不同情況制定。各種培養(yǎng)基成份在已經(jīng)分開或集中消毒(如果有必要)后,可在發(fā)酵開始時全部投入,否則在發(fā)酵期間,根據(jù)需要,陸續(xù)投放。
培養(yǎng)條件如此安排是為了生物體在最佳條件下生長,獲得盡可能高的產(chǎn)率。優(yōu)選的培養(yǎng)條件為15℃~40℃。溫度25℃~37℃之間尤其適宜。pH值優(yōu)選地保持在3~9的范圍內(nèi)。一般來說,溫育周期8~240h,優(yōu)選的溫育周期8~120h是足夠的。在這一時間段內(nèi),培養(yǎng)基中積聚的生物素量最多,而且(或)在細(xì)胞破壞后可以收獲。
根據(jù)本發(fā)明的生產(chǎn)生物素的這一方法,可以連續(xù)進(jìn)行,或分批進(jìn)行,或以分批給料的方式進(jìn)行。如果要從已用這些生物素基因轉(zhuǎn)化的植物細(xì)胞中再生全部植物(細(xì)胞),根據(jù)本發(fā)明的這一方法,它們可以完全正常地生長和繁殖。
實施例1.S-腺苷甲硫氨酸合成酶基因(序列號1)的克隆以大腸桿菌DNA基因組為出發(fā)材料,用二種特異的衍生于大腸桿菌基因組的寡核苷酸,通過多聚酶鏈反應(yīng)(PCA),使編碼SAM合成酶的基因(metk)從大腸桿菌染色體得到擴(kuò)增。把已用這種方法擴(kuò)增的DNA純化,用限制酶Acc65Ⅰ消化后插入載體,該載體已用相同的酶作過切割,并能使該基因在大腸桿菌株中過表達(dá)。借助于二種寡核苷酸中的一種,將最佳的翻譯信號提供給該基因構(gòu)建物。
a)、用于從大腸桿菌染色體擴(kuò)增metk基因的寡核苷酸的產(chǎn)生emtk作為表達(dá)盒由核糖核蛋白體結(jié)合位點、編碼序列的起始密碼子和二種限制酶識別位點之間的終止密碼子組成,擴(kuò)增Metk。選擇Acc65Ⅰ識別序列用于這二種識別位點。用核苷酸Pmetk1(5'-GCGGTACCAGGTGATATTAAATATGGCAAAAC-3')和Pmetk2(5'-CGGGTACCGATTACTTCAGACCGGCAGC-3')擴(kuò)增并克隆metk基因。
b)PCA操作條件從大腸桿菌W3110提取的染色體DNA 0.5μg用作模板。寡核苷酸Pmetk1和Pmetk2在各自濃度為15pMol條件下使用。dNTPs的濃度為200μM。2.5U Pwo DNA多聚酶(德國Boehringer Mannbeim公司)(置于廠家提供的反應(yīng)緩沖液中)用作多聚酶。PCA反應(yīng)體積為100μl。
擴(kuò)增DNA置于94℃2min作變性處理,然后將寡核苷酸置55℃ 30S作退火處理。在72℃ 75S條件下發(fā)生延伸。PCA反應(yīng)進(jìn)行30個循環(huán)。
所產(chǎn)生的約1145個堿性對的DNA產(chǎn)物加以純化并用Acc65Ⅰ在適當(dāng)?shù)木彌_中液中作消化處理。
c)在表達(dá)載體中metk的克隆用Acc65Ⅰ消化2μg載體pHS1(構(gòu)建方法在專利申請DE197.31274.8,優(yōu)先權(quán)22.7.97,舉例1,14~17頁有敘述),并用Shrimp堿性磷酸酯(SAP)(Boehringer Mannheim公司)作去磷?;幚怼T赟AP已作過變性處理后采用快速DAN連接試劑盒,按照廠家的使用說明書,以1∶3克分子比,把載體和片段連接起來。將連接混合物轉(zhuǎn)化到大腸桿菌XL-1-blue株中,借助質(zhì)粒制備和限制作用分析鑒定陽性克隆。采用限制消化和序列分析鑒定pHS1中metk片段的正確定向。產(chǎn)生的基因構(gòu)建物稱為pHSI metk(

圖1)。pHS1 metk的核苷酸序列在序列號9中給出。序列號10顯示從metk編碼區(qū)域推斷出來的氨基酸序列。
2.質(zhì)粒pHBbio14和pHS1bioS1的構(gòu)建質(zhì)粒pHBbio14和pHS1 bioS1的構(gòu)建已作過構(gòu)建(DE 197.31274.8,優(yōu)先權(quán)22.7.97,實施例1,2和5),3.pHS1 metk bioS1的構(gòu)建質(zhì)粒pHS1 bioS1〔序列號11(DE 197.31274.8,優(yōu)先權(quán)22.7.97)和序列號12顯示由bioS1編碼區(qū)域推斷出來的氨基酸序列〕和pHS1metk(序列號9)用質(zhì)粒制備法(Boehringer)加以純化。采用Acc65Ⅰ消化法將攜帶pHS1基因的片段從pHS1 metk分離出來。pHS1 bioS1用Acc65I加以消化并用Shrimp堿性磷酸酶(SAP)(BoehringerMannheim公司)作去磷?;幚怼8鶕?jù)廠家的說明書,將SAP作變性處理后,用快速DNA連接試劑盒,按照廠家的說明書,以1∶3的克分子比,把載體和metk片段加以連接。把連接混合物轉(zhuǎn)化到大腸桿菌XL-1-blue株中。用質(zhì)粒制備和限制作用分析鑒定陽性克隆。采用限制消化和序列分析法鑒定pHS1 metk中metk片段的正確方向。產(chǎn)生的基因構(gòu)建物稱為pHS1 metk bioS1(圖2)。pHS1 metkbioS1的核苷酸序列在序列號13中列出。序列號14顯示從metk編碼區(qū)域推導(dǎo)出來的氨基酸序列。序列號15顯示從bioS1編碼區(qū)域推斷出來的氨基酸序列。
4.通過過表達(dá)metk、bioS1以及metk與bioS1的組合,提高生物素產(chǎn)率。
采用在利福霉素平板上鋪板的方法,將自發(fā)的利福霉素抗性菌落從BM4086株中分離(Ketner和Campbell,分子生物學(xué)雜志(J.Molec.Biology)1975,9613)。從這些抗性株中的一種菌株中制備PI胞溶產(chǎn)物。用PI胞溶產(chǎn)物轉(zhuǎn)導(dǎo)W3110株,接著用利福霉素選擇克隆。產(chǎn)生的菌株采用CaCl2法以質(zhì)粒pHBbiol4作轉(zhuǎn)化處理(Maniatis等,分子克隆(Molecular Cloning),cold Spring Harbour LaboratoryPress 1989),并在含100μg氨芐青霉素/ml的LB(瓊脂)上生長。經(jīng)過分離和轉(zhuǎn)化處理的菌株(LU5560)在各自情況下采用CaCl2法,以質(zhì)粒pHS1,pHS1 metk,pHS1 bioS1或pHS1 metk bioS1作轉(zhuǎn)化處理,并在含氨芐青霉素(100μg/ml)和卡那霉素(25μg/ml)LB瓊脂上進(jìn)行選擇。
在各自情況下,從每一轉(zhuǎn)化菌株選取的一個菌落接種到含適量抗菌素的DYT培養(yǎng)基中,溫育12h。該過夜培養(yǎng)基(=ONC)用于接種10mlTB培養(yǎng)基培養(yǎng)物(Sambrook,J.Fritsch,E.F.Maniatis,T.2nd ed.CordSpring Harbor Laboratory Press.,1989 ISBN 0-87969-373-8),該培養(yǎng)基含甘油(30g/L)和適量的抗菌素。在存在質(zhì)粒pHS1,pHS1 metk,pHS1 bioS1和pHS1 metk bioS1的情況下,為了分別誘導(dǎo)metk和bioS1基因的表達(dá)或誘導(dǎo)這二種基因結(jié)合物的表達(dá),在培養(yǎng)基中同時加入1mM IPTG和0.5%阿拉伯糖。24h后,用離心法從培養(yǎng)物上清液中分離出菌細(xì)胞。采用使用鏈霉親合素的競爭性ELISA法測定上清液中生物素濃度。這種測定的結(jié)果列于表Ⅰ。
表Ⅰ生物素濃度的測定
序列明細(xì)表(1)一般資料(ⅰ)申請者(A)名稱BASF Aktiengesellschaft(B)街道Karl Bosch Strasse(C)城市Ludwigshafen(D)聯(lián)邦州Rheinland-Pfalz(E)國家德國(F)郵編67056(ⅱ)專利申請名稱生物素的制備方法(ⅲ)序列圖數(shù)目15個(ⅳ)計算機(jī)可讀方式(A)介質(zhì)類型軟盤(B)計算機(jī)IBMPC兼容機(jī)(C)操作系統(tǒng)PC-DOS/MS-DOS(D)軟件PatentIn Release#1.0,Version#1.25(EPO)(2)序列號1的資料(ⅰ)序列特征(A)長度1155個堿基對(B)類型核苷酸(C)STRANDEDNESSSingle(D)拓?fù)鋵W(xué)線性(ⅱ)分子類型DNA(基因組)(ⅲ)假設(shè)的無(ⅲ)反義無(ⅵ)起始來源(B)菌株大腸桿菌(ⅶ)直接來源(B)克隆metk(ⅸ)特征(A)名稱/索引CDS(B)定位1..1155
(ⅹⅰ)序列描述序列號1atg gca aaa cac ctt ttt acg tcc gag tcc gtc tct gaa ggg cat cct 48Met Ala Lys His Leu Phe Thr Ser Glu Ser Val Ser Glu Gly His Pro1 5 10 15gac aaa att gct gac caa att tct gat gcc gtt tta gac gcg atc ctc 96Asp Lys Ile Ala Asp Gln Ile Ser Asp Ala Val Leu Asp Ala Ile Leu20 25 30gaa cag gat ccg aaa gca cgc gtt gct tgc gaa acc tac gta aaa acc 144Glu Gln Asp Pro Lys Ala Arg Val Ala Cys Glu Thr Tyr Val Lys Thr35 40 45ggc atg gtt tta gtt ggc ggc gaa atc acc acc agc gcc tgg gta gac 192Gly Met Val Leu Val Gly Gly Glu Ile Thr Thr Ser Ala Trp Val Asp50 55 60atc gaa gag atc acc cgt aac acc gtt cgc gaa att ggc tat gtg cat 240Ile Glu Glu Ile Thr Arg Asn Thr Val Arg Glu Ile Gly Tyr Val His65 70 75 80tcc gac atg ggc ttt gac gct aac tcc tgt gcg gtt ctg agc gct atc 288Ser Asp Met Gly Phe Asp Ala Asn Ser Cys Ala Val Leu Ser Ala Ile85 90 95ggc aaa cag tct cct gac atc aac cag ggc gtt gac cgt gcc gat ccg 336Gly Lys Gln Ser Pro Asp Ile Asn Gln Gly Val Asp Arg Ala Asp Pro100 105 110ctg gaa cag ggc gcg ggt gac cag ggt ctg atg ttt ggc tac gca act 384Leu Glu Gln Gly Ala Gly Asp Gln Gly Leu Met Phe Gly Tyr Ala Thr115 120 125aat gaa acc gac gtg ctg atg cca gca cct atc acc tat gca cac cgt 432Asn Glu Thr Asp Val Leu Met Pro Ala Pro Ile Thr Tyr Ala His Arg130 135 140ctg gta cag cgt cag gct gaa gtg cgt aaa aac ggc act ctg ccg tgg 480Leu Val Gln Arg Gln Ala Glu Val Arg Lys Ash Gly Thr Leu Pro Trp145 150 155 160ctg cgc ccg gac gcg aaa agc cag gtg act ttt cag tat gac gac ggc 528Leu Arg Pro Asp Ala Lys Ser Gln Val Thr Phe Gln Tyr Asp Asp Gly165 170 175aaa atc gtt ggt atc gat gct gtc gtg ctt tcc act cag cac tct gaa 576Lys Ile Val Gly Ile Asp Ala Val Val Leu Ser Thr Gln His Ser Glu180 185 190gag atc gac cag aaa tcg ctg caa gaa gcg gta atg gaa gag atc atc 624Glu Ile Asp Gln Lys Ser Leu Gln Glu Ala Val Met Glu Glu Ile Ile195 200 205aag cca att ctg ccc gct gaa tgg ctg act tct gcc acc aaa ttc ttc 672Lys Pro Ile Leu Pro Ala Glu Trp Leu Thr Ser Ala Thr Lys Phe Phe210 215 220atc aac ccg acc ggt cgt ttc gtt atc ggt ggc cca atg ggt gac tgc 720Ile Asn Pro Thr Gly Arg Phe Val Ile Gly Gly Pro Met Gly Asp Cys225 230 235 240ggt ctg act ggt cgt aaa att atc gtt gat acc tac ggc ggc atg gcg 768Gly Leu Thr Gly Arg Lys Ile Ile Val Asp Thr Tyr Gly Gly Met Ala245 250 255cgt cac ggt ggc ggt gca ttc tct ggt aaa gat cca tca aaa gtg gac 816Arg His Gly Gly Gly Ala Phe Ser Gly Lys Asp Pro Ser Lys Val Asp260 265 270cgt tcc gca gcc tac gca gca cgt tat gtc gcg aaa aac atc gtt gct 864Arg Ser Ala Ala Tyr Ala Ala Arg Tyr val Ala Lys Asn Ile Val Ala275 280 285gct ggc ctg gcc gat cgt tgt gaa att cag gtt tcc tac gca atc ggc 912Ala Gly Leu Ala Asp Arg Cys Glu Ile Gln Val Ser Tyr Ala Ile Gly290 295 300gtg gct gaa ccg acc tcc atc atg gta gaa act ttc ggt act gag aaa 960Val Ala Glu Pro Thr Ser Ile Met Val Glu Thr Phe Gly Thr Glu Lys305 310 315 320gtg cct tct gaa caa ctg acc ctg ctg gta cgt gag ttc ttc gac ctg 1008Val Pro Ser Glu Gln Leu Thr Leu Leu Val Arg Glu Phe Phe Asp Leu325 330 335cgc cca tac ggt ctg att cag atg ctg gat ctg ctg cac ccg atc tac 1056Arg Pro Tyr Gly Leu Ile Gln Met Leu Asp Leu Leu His Pro Ile Tyr340 345 350aaa gaa acc gca gca tac ggt cac ttt ggt cgt gaa cat ttc ccg tgg 1104Lys Glu Thr Ala Ala Tyr Gly His Phe Gly Arg Glu His Phe Pro Trp355 360 365gaa aaa acc gac aaa gcg cag ctg ctg cgc gat gct gcc ggt ctg aag 1152Glu Lys Thr Asp Lys Ala Gln Leu Leu Arg Asp Ala Ala Gly Leu Lys370 375 380taa 1155385(2)序列號2的資料(ⅰ)序列特性(A)長度384個氨基酸(B)類型氨基酸(D)拓?fù)鋵W(xué)線性(ⅱ)分子類型蛋白質(zhì)(ⅵ)序列描述序列號2Met Ala Lys His Leu Phe Thr Ser Glu Ser Val Ser Glu Gly His Pro1 5 10 15Asp Lys Ile Ala Asp Gln Ile Ser Asp Ala val Leu Asp Ala Ile Leu20 25 30Glu Gln Asp Pro Lys Ala Arg Val Ala Cys Glu Thr Tyr Val Lys Thr35 40 45Gly Met Val Leu Val Gly Gly Glu Ile Thr Thr Ser Ala Trp Val Asp50 55 60Ile Glu Glu Ile Thr Arg Asn Thr Val Arg Glu Ile Gly Tyr Val His65 70 75 80Ser Asp Met Gly Phe Asp Ala Asn Ser Cys Ala Val Leu Ser Ala Ile85 90 95Gly Lys Gln Ser Pro Asp Ile Asn Gln Gly Val Asp Arg Ala Asp Pro100 105 110Leu Glu Gln Gly Ala Gly Asp Gln Gly Leu Met Phe Gly Tyr Ala Thr115 120 125Asn Glu Thr Asp Val Leu Met Pro Ala Pro Ile Thr Tyr Ala His Arg130 135 140Leu Val Gln Arg Gln Ala Glu Val Arg Lys Asn Gly Thr Leu Pro Trp145 150 155 160Leu Arg Pro Asp Ala Lys Ser Gln Val Thr Phe Gln Tyr Asp Asp Gly165 170 175Lys Ile Val Gly Ile Asp Ala Val Val Leu Ser Thr Gln His Ser Glu180 185 190Glu Ile Asp Gln Lys Ser Leu Gln Glu Ala Val Met Glu Glu Ile Ile195 200 205Lys Pro Ile Leu Pro Ala Glu Trp Leu Thr Ser Ala Thr Lys Phe Phe210 215 220Ile Asn Pro Thr Gly Arg Phe Val Ile Gly Gly Pro Met Gly Asp Cys225 230 235 240Gly Leu Thr Gly Arg Lys Ile Ile Val Asp Thr Tyr Gly Gly Met Ala245 250 255Arg His Gly Gly Gly Ala Phe Ser Gly Lys Asp Pro Ser Lys Val Asp260 265 270Arg Ser Ala Ala Tyr Ala Ala Arg Tyr Val Ala Lys Asn Ile Val Ala275 280 285Ala Gly Leu Ala Asp Arg Cys Glu Ile Gln Val Ser Tyr Ala Ile Gly290 295 300Val Ala Glu Pro Thr Ser Ile Met Val Glu Thr Phe Giy Thr Glu Lys305 310 315 320Val Pro Ser Glu Gln Leu Thr Leu Leu Val Arg Glu Phe Phe Asp Leu325 330 335Arg Pro Tyr Gly Leu Ile Gln Met Leu Asp Leu Leu His Pro Ile Tyr340 345 350Lys Glu Thr Ala Ala Tyr Gly His Phe Gly Arg Glu His Phe Pro Trp355 360 365Glu Lys Thr Asp Lys Ala Gln Leu Leu Arg Asp Ala Ala Gly Leu Lys370 375 380(2)序列號3的資料(ⅰ)序列特性(A)長度1206個堿基對(B)類型核苷酸(C)STRANDEDNESSSingle(D)拓?fù)鋵W(xué)線性(ⅱ)分子類型基因組(ⅲ)假設(shè)的無(ⅲ)反義的無(ⅵ)起始來源(B)菌株大腸桿菌(ⅵ)直接來源(B)克隆bioSl(ⅸ)特征(A)名稱/索引CDS(B)定位1..1206(ⅹⅰ)序列描述序列號3atg aac gtt ttt aat ccc gcg cag ttt cgc gcc cag ttt ccc gca cta 48Met Asn Val Phe Asn Pro Ala Gln Phe Arg Ala Gln Phe Pro Ala Leu1 5 10 15cag gat gcg ggc gtc tat ctc gac agc gcc gcg acc gcg ctt aaa cct 96Gln Asp Ala Gly Val Tyr Leu Asp Ser Ala Ala Thr Ala Leu Lys Pro20 25 30gaa gcc gtg gtt gaa gcc acc caa cag ttt tac agt ctg agc gcc gga 144Glu Ala Val Val Glu Ala Thr Gln Gln Phe Tyr Ser Leu Ser Ala Gly35 40 45aac gtc cat cgc agc cag ttt gcc gaa gcc caa cgc ctg acc gcg cgt 192Asn Val His Arg Ser Gln Phe Ala Glu Ala Gln Arg Leu Thr Ala Arg50 55 60tat gaa gct gca cga gag aaa gtg gcg caa tta ctg aat gca ccg gat 240Tyr Glu Ala Ala Arg Glu Lys Val Ala Gln Leu Leu Asn Ala Pro Asp65 70 75 80gat aaa act atc gtc tgg acg cgc ggc acc act gaa tcc atc aac atg 288Asp Lys Thr Ile Val Trp Thr Arg Gly Thr Thr Glu Ser Ile Asn Met85 90 95gtg gca caa tgc tat gcg cgt ccg cgt ctg caa ccg ggc gat gag att 336Val Ala Gln Cys Tyr Ala Arg Pro Arg Leu Gln Pro Gly Asp Glu Ile100 105 110att gtc agc gtg gca gaa cac cac gcc aac ctc gtc ccc tgg ctg atg 384Ile Val Ser Val Ala Glu His His Ala Asn Leu Val Pro Trp Leu Met115 120 125gtc gcc caa caa act gga gcc aaa gtg gtg aaa ttg ccg ctt aat gcg 432Val Ala Gln Gln Thr Gly Ala Lys Val Val Lys Leu Pro Leu Asn Ala130 135 140cag cga ctg ccg gat gtc gat ttg ttg cca gaa ctg att act ccc cgt 480Gln Arg Leu Pro Asp Val Asp Leu Leu Pro Glu Leu Ile Thr Pro Arg145 150 155 160agt cgg att ctg gcg ttg ggt cag atg tcg aac gtt act ggc ggt tgc 528Ser Arg Ile Leu Ala Leu Gly Gln Met Ser Asn Val Thr Gly Gly Cys165 170 175ccg gat ctg gcg cga gcg att acc ttt gct cat tca gcc ggg atg gtg 576Pro Asp Leu Ala Arg Ala Ile Thr Phe Ala His Ser Ala Gly Met Val180 185 190gtg atg gtt gat ggt gct cag ggg gca gtg cat ttc ccc gcg gat gtt 624Val Met Val Asp Gly Ala Gln Gly Ala Val His Phe Pro Ala Asp Val195 200 205cag caa ctg gat att gat ttc tat gct ttt tca ggt cac aaa ctg tat 672Gln Gln Leu Asp Ile Asp Phe Tyr Ala Phe Ser Gly His Lys Leu Tyr210 215 220ggc ccg aca ggt atc ggc gtg ctg tat ggt aaa tca gaa ctg ctg gag 720Gly Pro Thr Gly Ile Gly Val Leu Tyr Gly Lys Ser Glu Leu Leu Gln225 230 235 240gcg atg tcg ccc tgg ctg ggc ggc ggc aaa atg gtt cac gaa gtg agt 768Ala Met Ser Pro Trp Leu Gly Gly Gly Lys Met Val His Glu Val Ser245 250 255ttt gac ggc ttc acg act caa tct gcg ccg tgg aaa ctg gaa gct gga 816Phe Asp Gly Phe Thr Thr Gln Ser Ala Pro Trp Lys Leu Glu Ala Gly260 265 270acg cca aat gtc gct ggt gtc ata gga tta agc gcg gcg ctg gaa tgg 864Thr Pro Asn Val Ala Gly Val Ile Gly Leu Ser Ala Ala Leu Glu Trp275 280 285ctg gca gat tac gat atc aac cag gcc gaa agc tgg agc cgt agc tta 912Leu Ala Asp Tyr Asp Ile Asn Gln Ala Glu Ser Trp Ser Arg Ser Leu290 295 300gca acg ctg gcg gaa gat gcg ctg gcg aaa cgt ccc ggc ttt cgt tca 960Ala Thr Leu Ala Glu Asp Ala Leu Ala Lys Arg Pro Gly Phe Arg Ser305 310 315 320ttc cgc tgc cag gat tcc agc ctg ctg gcc ttt gat ttt gct ggc gtt 1008Phe Arg Cys Gln Asp Ser Ser Leu Leu Ala Phe Asp Phe Ala Gly Val325 330 335cat cat agc gat atg gtg acg ctg ctg gcg gag tac ggt att gcc ctg 1056His His Ser Asp Met Val Thr Leu Leu Ala Glu Tyr Gly Ile Ala Leu340 345 350cgg gcc ggg cag cat tgc gct cag ccg cta ctg gca gaa tta ggc gta 1104Arg Ala Gly Gln His Cys Ala Gln Pro Leu Leu Ala Glu Leu Gly Val355 360 365acc ggc aca ctg cgc gcc tct ttt gcg cca tat aat aca aag agt gat 1152Thr Gly Thr Leu Arg Ala Ser Phe Ala Pro Tyr Asn Thr Lys Ser Asp370 375 380gtg gat gcg ctg gtg aat gcc gtt gac cgc gcg ctg gaa tta ttg gtg 1200Val Asp Ala Leu Val Asn Ala Val Asp Arg Ala Leu Glu Leu Leu Val385 390 395 400gat taa 1206Asp(2)序列號4的資料(ⅰ)序列特性(A)長度401個氨基酸(B)類型氨基酸(D)拓?fù)鋵W(xué)線性(ⅱ)分子類型蛋白質(zhì)(ⅹⅰ)序列描述序列號4Met Asn Val Phe Asn Pro Ala Gln Phe Arg Ala Gln Phe Pro Ala Leu1 5 10 15Gln Asp Ala Gly Val Tyr Leu Asp Ser Ala Ala Thr Ala Leu Lys Pro20 25 30Glu Ala Val Val Glu Ala Thr Gln Gln Phe Tyr Ser Leu Ser Ala Gly35 40 45Asn Val His Arg Ser Gln Phe Ala Glu Ala Gln Arg Leu Thr Ala Arg50 55 60Tyr Glu Ala Ala Arg Glu Lys Val Ala Gln Leu Leu Asn Ala Pro Asp65 70 75 80Asp Lys Thr Ile Val Trp Thr Arg Gly Thr Thr Glu Ser Ile Asn Met85 90 95Val Ala Gln Cys Tyr Ala Arg Pro Arg Leu Gln Pro Gly Asp Glu Ile100 105 110Ile Val Ser Val Ala Glu His His Ala Asn Leu Val Pro Trp Leu Met115 120 125Val Ala Gln Gln Thr Gly Ala Lys Val Val Lys Leu Pro Leu Asn Ala130 135 140Gln Arg Leu Pro Asp Val Asp Leu Leu Pro Glu Leu Ile Thr Pro Arg145 150 155 160Ser Arg Ile Leu Ala Leu Gly Gln Met Ser Asn Val Thr Gly Gly Cys165 170 175Pro Asp Leu Ala Arg Ala Ile Thr Phe Ala His Ser Ala Gly Met Val180 185 190Val Met Val Asp Gly Ala Gln Gly Ala Val His Phe Pro Ala Asp Val195 200 205Gln Gln Leu Asp Ile Asp Phe Tyr Ala Phe Ser Gly His Lys Leu Tyr210 215 220Gly Pro Thr Gly Ile Gly Val Leu Tyr Gly Lys Ser Glu Leu Leu Glu225 230 235 240Ala Met Ser Pro Trp Leu Gly Gly Gly Lys Met Val His Glu Val Ser245 250 255Phe Asp Gly Phe Thr Thr Gln Ser Ala Pro Trp Lys Leu Glu Ala Gly260 265 270Thr Pro Asn Val Ala Gly Val Ile Gly Leu Ser Ala Ala Leu Glu Trp275 280 285Leu Ala Asp Tyr Asp Ile Asn Gln Ala Glu Ser Trp Ser Arg Ser Leu290 295 300Ala Thr Leu Ala Glu Asp Ala Leu Ala Lys Arg Pro Gly Phe Arg Ser305 310 315 320Phe Arg Cys Gln Asp Ser Ser Leu Leu Ala Phe Asp Phe Ala Gly Val325 330 335His His Ser Asp Met Val Thr Leu Leu Ala Glu Tyr Gly Ile Ala Leu340 345 350Arg Ala Gly Gln His Cys Ala Gln Pro Leu Leu Ala Glu Leu Gly Val355 360 365Thr Gly Thr Leu Arg Ala Ser Phe Ala Pro Tyr Asn Thr Lys Ser Asp370 375 380Val Asp Ala Leu Val Asn Ala Val Asp Arg Ala Leu Glu Leu Leu Val385 390 395 400Asp(2)序列號5的資料(ⅰ)序列特性(A)長度1215個堿基對(B)類型核苷酸(C)STRANDEDNESSSingle(D)拓?fù)鋵W(xué)線性(ⅱ)分子類型DNA(基因組)(ⅲ)假設(shè)的無(ⅲ)反義的無(ⅵ)起始來源(B)菌株大腸桿菌(ⅶ)直接來源(B)克隆bioS2(ⅸ)特征
(B)名稱/索引CDS(B)定位1..1215(ⅹⅰ)序列描述序列號5atg aaa tta ccg att tat ctc gac tac tcc gca acc acg ccg gtg gac 48Met Lys Leu Pro Ile Tyr Leu Asp Tyr Ser Ala Thr Thr Pro Val Asp1 5 10 15ccg cgt gtt gcc gag aaa atg atg cag ttt atg acg atg gac gga acc96Pro Arg Val Ala Glu Lys Met Met Gln Phe Met Thr Met Asp Gly Thr20 25 30ttt ggt aac ccg gcc tcc cgt tct cac cgt ttc ggc tgg cag gct gaa 144Phe Gly Asn Pro Ala Ser Arg Ser His Arg Phe Gly Trp Gln Ala Glu35 40 45gaa gcg gta gat atc gcc cgt aat cag att gcc gat ctg gtc ggc gct 192Glu Ala Val Asp Ile Ala Arg Asn Gln Ile Ala Asp Leu Val Gly Ala50 55 60gat ccg cgt gaa atc gtc ttt acc tct ggt gca acc gaa tct gac aac 240Asp Pro Arg Glu Ile Val Phe Thr Ser Gly Ala Thr Glu Ser Asp Asn65 70 75 80ctg gcg atc aaa ggt gca gcc aac ttt tat cag aaa aaa ggc aag cac 288Leu Ala Ile Lys Gly Ala Ala Asn Phe Tyr Gln Lys Lys Gly Lys His85 90 95atc arc acc agc aaa acc gaa cac aaa gcg gta ctg gat acc tgc cgt 336Ile Ile Thr Ser Lys Thr Glu His Lys Ala Val Leu Asp Thr Cys Arg100 105 110cag ctg gag cgc gaa ggt ttt gaa gtc acc tac ctg gca ccg cag cgt 384Gln Leu Glu Arg Glu Gly Phe Glu Val Thr Tyr Leu Ala Pro Gln Arg115 120 125aac ggc att atc gac ctg aaa gaa ctt gaa gca gcg atg cgt gac gac 432Asn Gly Ile Ile Asp Leu Lys Glu Leu Glu Ala Ala Met Arg Asp Asp130 135 140acc atc ctc gtg tcc atc atg cac gta aat aac gaa atc ggc gtg gtg 480Thr Ile Leu Val Ser Ile Met His Val Asn Asn Glu Ile Gly VaI Val145 150 155 160cag gat atc gcg gct atc ggc gaa atg tgc cgt gct cgt ggc att atc 528Gln Asp Ile Ala Ala Ile Gly Glu Met Cys Arg Ala Arg Gly Ile Ile165 170 175tat cac gtt gat gca acc cag agc gtg ggt aaa ctg cct atc gac ctg 576Tyr His Val Asp Ala Thr Gln Ser Val Gly Lys Leu Pro Ile Asp Leu180 185 190agc cag ttg aaa gtt gac ctg atg tct ttc tcc ggt cac aaa atc tat 624ser Gln Leu Lys Val Asp Leu Met Ser Phe Ser Gly His Lys Ile Tyr195 200 205ggc ccg aaa ggt atc ggt gcg ctg tat gta cgt cgt aaa ccg cgc gta 672Gly Pro Lys Gly Ile Gly Ala Leu Tyr Val Arg Arg Lys Pro Arg Val210 215 220cgc atc gaa gcg caa atg cac ggc ggc ggt cac gag cgc ggt atg cgt 720Arg Ile Glu Ala Gln Met His Gly Gly Gly His Glu Arg Gly Met Arg225 230 235 240tcc ggc act ctg cct gtt cac cag atc gtc gga atg ggc gag gcc tat 768Ser Gly Thr Leu Pro Val His Gln Ile Val Gly Met Gly Glu Ala Tyr245 250 255cgc atc gca aaa gaa gag atg gcg acc gag atg gaa cgt ctg cgc ggc 816Arg Ile Ala Lys Glu Glu Met Ala Thr Glu Met Glu Arg Leu Arg Gly260 265 270ctg cgt aac cgt ctg tgg aac ggc atc aaa gat atc gaa gaa gtt tac 864Leu Arg Asn Arg Leu Trp Asn Gly Ile Lys Asp Ile Glu Glu Val Tyr275 280 285ctg aac ggt gac ctg gaa cac ggt gcg ccg aac att ctc aac gtc agc 912Leu Asn Gly Asp Leu Glu His Gly Ala Pro Asn Ile Leu Asn Val Ser290 295 300ttc aac tac gtt gaa ggt gag tcg ctg att atg gcg ctg aaa gac ctc 960Phe Asn Tyr Val Glu Gly Glu Ser Leu Ile Met Ala Leu Lys Asp Leu305 310 315 320gca gtt tct tca ggt tcc gcc tgt acg tca gca agc ctc gaa ccg tcc 1008Ala Val Ser Ser Gly Ser Ala Cys Thr Ser Ala Ser Leu Glu Pro Ser325 330 335tac gtg ctg cgc gcg ctg ggg ctg aac gac gag ctg gca cat agc tct 1056Tyr Val Leu Arg Ala Leu Gly Leu Asn Asp Glu Leu Ala His Ser Ser340 345 350atc cgt ttc tct tta ggt cgt ttt act act gaa gaa gag atc gac tac 1104Ile Arg Phe Ser Leu Gly Arg Phe Thr Thr Glu Glu Glu Ile Asp Tyr355 360 365acc atc gag tta gtt cgt aaa tcc atc ggt cgt ctg cgt gac ctt tct 1152Thr Ile Glu Leu Val Arg Lys Ser Ile Gly Arg Leu Arg Asp Leu Ser370 375 380ccg ctg tgg gaa atg tac aag cag ggc gtg gat ctg aac agc atc gaa 1200Pro Leu Trp Glu Met Tyr Lys Gln Gly Val Asp Leu Asn Ser Ile Glu385 390 395 400tgg gct cat cat taa 1215Trp Ala His His405(2)序列號6的資料(ⅰ)序列特性(A)長度404個氨基酸(B)類型氨基酸(D)拓?fù)鋵W(xué)線性(ⅱ)分子類型蛋白質(zhì)(ⅹⅰ)序列描述序列號6Met Lys Leu Pro Ile Tyr Leu Asp Tyr Ser Ala Thr Thr Pro Val Asp1 5 10 15Pro Arg Val Ala Glu Lys Met Met Gln Phe Met Thr Met Asp Gly Thr20 25 30Phe Gly Asn Pro Ala Ser Arg Ser His Arg Phe Gly Trp Gln Ala Glu35 40 45Glu Ala Val Asp Ile Ala Arg Asn Gln Ile Ala Asp Leu Val Gly Ala50 55 60Asp Pro Arg Glu Ile Val Phe Thr Ser Gly Ala Thr Glu Ser Asp Asn65 70 75 80Leu Ala Ile Lys Gly Ala Ala Asn Phe Tyr Gln Lys Lys Gly Lys His85 90 95Ile Ile Thr Ser Lys Thr Glu His Lys Ala Val Leu Asp Thr Cys Arg100 105 110Gln Leu Glu Arg Glu Gly Phe Glu Val Thr Tyr Leu Ala Pro Gln Arg115 120 125Asn Gly Ile Ile Asp Leu Lys Glu Leu Glu Ala Ala Met Arg Asp Asp130 135 140Thr Ile Leu Val Ser Ile Met His Val Asn Asn Glu Ile Gly Val Val145 150 155 160Gln Asp Ile Ala Ala Ile Gly Glu Met Cys Arg Ala Arg Gly Ile Ile165 170 175Tyr His Val Asp Ala Thr Gln Ser Val Gly Lys Leu Pro Ila Asp Leu180 185 190Ser Gln Leu Lys Val Asp Leu Met Ser Phe Ser Gly His Lys Ile Tyr195 200 205Gly Pro Lys Gly Ile Gly Ala Leu Tyr Val Arg Arg Lys Pro Arg Val210 215 220Arg Ile Glu Ala Gln Met His Gly Gly Gly His Glu Arg Gly Met Arg225 230 235 240Ser Gly Thr Leu Pro Val His Gln Ile Val Gly Met G1y Glu Ala Tyr245 250 255Arg Ile Ala Lys Glu Glu Met Ala Thr Glu Met Glu Arg Leu Arg Gly260 265 270Leu Arg Asn Arg Leu Trp Asn Gly Ile Lys Asp Ile Glu Glu Val Tyr275 280 285Leu Asn Gly Asp Leu Glu His Gly Ala Pro Asn Ile Leu Asn Val Ser290 295 300Phe Asn Tyr Val Glu Gly Glu Ser Leu Ile Met Ala Leu Lys Asp Leu305 310 315 320Ala Val Ser Ser Gly Ser Ala Cys Thr Ser Ala Ser Leu Glu Pro Ser325 330 335Tyr Val Leu Arg Ala Leu Gly Leu Asn Asp Glu Leu Ala His Ser Ser340 345 350Ile Arg Phe Ser Leu Gly Arg Phe Thr Thr Glu Glu Glu Ile Asp Tyr355 360 365Thr Ile Glu Leu Val Arg Lys Ser Ile Gly Arg Leu Arg Asp Leu Ser370 375 380Pro Leu Trp Glu Met Tyr Lys Gln Gly Val Asp Leu Asn Ser Ile Glu385 390 395 400Trp Ala His His(2)序列號7的資料(ⅰ)序列特性(A)長度1221個堿基對(B)類型核苷酸(C)STRANDEDNESSSingle(D)拓?fù)鋵W(xué)線性(ⅱ)分子類型DNA(基因組)(ⅲ)假設(shè)的無(ⅲ)反義的無(ⅵ)起始來源(B)菌株大腸桿菌(ⅶ)直接來源(B)克隆bioS3(ⅸ)特征(C)名稱/索引CDS(B)定位1..1221(ⅹⅰ)序列描述序列號7atg att ttt tcc gtc gac aaa gtg cgg gcc gac ttt ccg gtg ctt tcg 48Met Ile Phe Ser Val Asp Lys Val Arg Ala Asp Phe Pro Val Leu Ser1 5 10 15cgt gag gta aac ggt ttg ccg ctg gct tat ctc gac agc gcc gcc agt 96Arg Glu Val Asn Gly Leu Pro Leu Ala Tyr Leu Asp Ser Ala Ala Ser20 25 30gcg cag aaa ccg agc cag gtg att gac gcc gag gcc gag ttt tat cgt 144Ala Gln Lys Pro Ser Gln Val Ile Asp Ala Glu Ala Glu Phe Tyr Arg35 40 45cat ggc tac gcg gcg gtg cat cgt ggt att cat acc tta agc gcc cag 192His Gly Tyr Ala Ala Val His Arg Gly Ile His Thr Leu Ser Ala Gln50 55 60gcg acc gag aaa atg gag aac gtg cgc aag cgg gca tcg ctg ttt att 240Ala Thr Glu Lys Met Glu Asn Val Arg Lys Arg Ala Ser Leu Phe Ile65 70 75 80aat gcc cgt tcg gcg gaa gag ctg gtg ttc gtc cgc ggc acg acg gaa288Asn Ala Arg Ser Ala Glu Glu Leu Val Phe Val Arg Gly Thr Thr Glu85 90 95ggg atc aat ctg gtc gcc aat agc tgg ggc aac agc aac gtg cgg gcg 336Gly Ile Asn Leu Val Ala Asn Ser Trp Gly Asn Ser Asn Val Arg Ala100 105 110ggc gat aac atc atc atc agt cag atg gag cac cac gct aac att gtt 384Gly Asp Asn Ile Ile Ile Ser Gln Met Glu His His Ala Asn Ile Val115 120 125ccc tgg cag atg ctt tgc gca cgc gtt ggc gca gag ctg cgt gtg atc 432Pro Trp Gln Met Leu Cys Ala Arg Val Gly Ala Glu Leu Arg Val Ile130 135 140ccg ctc aat ccc gat ggt acg ttg caa ctg gag acg ctg cct acg ctg 480Pro Leu Asn Pro Asp Gly Thr Leu Gln Leu Glu Thr Leu Pro Thr Leu145 150 155 160ttt gat gag aaa act cgc ctg ctg gca att act cat gtc tcc aac gtg 528Phe Asp Glu Lys Thr Arg Leu Leu Ala Ile Thr His Val Ser Asn Val165 170 175ctt ggc aca gaa aat cca ctg gcg gaa atg atc acg ctt gcg cac cag 576Leu Gly Thr Glu Asn Pro Leu Ala Glu Met Ile Thr Leu Ala His Gln180 185 190cat ggc gca aaa gtg ctg gtg gat ggc gct cag gcg gtg atg cat cat 624His Gly Ala Lys Val Leu Val Asp Gly Ala Gln Ala Val Met His His195 200 205ccg gtg gat gtt cag gcg ctg gat tgc gac ttt tac gtg ttc tcc ggg 672Pro Val Asp Val Gln Ala Leu Asp Cys Asp Phe Tyr Val Phe Ser Gly210 215 220cat aaa ctg tat ggc ccc acc gga att ggc att ctt tat gtg aaa gaa 720His Lys Leu Tyr Gly Pro Thr Gly Ile Gly Ile Leu Tyr Val Lys Glu225 230 235 240gcc ttg ttg cag gag atg ccg ccg tgg gaa ggg ggc ggt tct atg atc 768Ala Leu Leu Gln Glu Met Pro Pro Trp Glu Gly Gly Gly Ser Met Ile245 250 255gcc acc gtc agc ctg agt gaa ggc act acc tgg acc aaa gca cca tgg 816Ala Thr Val Ser Leu Ser Glu Gly Thr Thr Trp Thr Lys Ala Pro Trp260 265 270cgg ttt gaa gcc ggt aca ccc aat acc ggg ggc atc att ggt ctt ggc 864Arg Phe Glu Ala Gly Thr Pro Asn Thr Gly Gly Ile Ile Gly Leu Gly275 280 285gcg gcg ctg gag tat gtt tcg gcg ctg ggg ctt aat aac ata gcc gag 912Ala Ala Leu Glu Tyr Val Ser Ala Leu Gly Leu Ash Ash Ile Ala Glu290 295 300tat gaa cag aat ctg atg cat tat gcg cta tca cag ctg gaa tct gta 960Tyr Glu Gln Asn Leu Met His Tyr Ala Leu Ser Gln Leu Glu Ser Val305 310 315 320ccg gat ctc act ctc tat ggc cca caa aac agg ctt ggc gtt att gct 1008Pro Asp Leu Thr Leu Tyr Gly Pro Gln Asn Arg Leu Gly Val Ile Ala325 330 335ttt aat ctc ggt aaa cac cac gcc tat gat gtt ggc agt ttt ctc gat 1056Phe Asn Leu Gly Lys His His Ala Tyr Asp Val Gly Ser Phe Leu Asp340 345 350aat tac ggc att gct gtg cgt acc gga cat cac tgc gca atg cca ttg 1104Asn Tyr Gly Ile Ala Val Arg Thr Gly His His Cys Ala Met Pro Leu355 360 365atg gcc tat tac aac gtc cct gcg atg tgt cgg gcg tcg ctg gcc atg 1152Met Ala Tyr Tyr Asn Val Pro Ala Met Cys Arg Ala Ser Leu Ala Met370 375 380tat aac acc cat gaa gaa gtg gat cgt ctg gtg acc ggc ctg caa cgt 1200Tyr Asn Thr His Glu Glu Val Asp Arg Leu Val Thr Gly Leu Gln Arg385 390 395 400att cac cgt ttg ctg gga taa 1221Ile His Arg Leu Leu Gly(2)序列號8的資料(ⅰ)序列特性(A)長度406個氨基酸(B)類型氨基酸(D)拓?fù)鋵W(xué)線性(ⅱ)分子類型蛋白質(zhì)(ⅹⅰ)序列描述序列號8Met Ile Phe Ser Val Asp Lys Val Arg Ala Asp Phe Pro Val Leu Ser1 5 10 15Arg Glu Val Asn Gly Leu Pro Leu Ala Tyr Leu Asp Ser Ala Ala Ser20 25 30Ala Gln Lys Pro Ser Gln Val Ile Asp Ala Glu Ala Glu Phe Tyr Arg35 40 45His Gly Tyr Ala Ala Val His Arg Gly Ile His Thr Leu Ser Ala Gln50 55 60Ala Thr Glu Lys Met Glu Asn Val Arg Lys Arg Ala Ser Leu Phe Ile65 70 75 80Asn Ala Arg Ser Ala Glu Glu Leu Val Phe Val Arg Gly Thr Thr Glu85 90 95Gly Ile Asn Leu Val Ala Asn Ser Trp Gly Asn Ser Asn Val Arg Ala100 105 110Gly Asp Asn Ile Ile Ile Ser Gln Met Glu His His Ala Asn Ile Val115 120 125Pro Trp Gln Met Leu Cys Ala Arg Val Gly Ala Glu Leu Arg Val Ile130 135 140Pro Leu Asn Pro Asp Gly Thr Leu Gln Leu Glu Thr Leu Pro Thr Leu145 150 155 160Phe Asp Glu Lys Thr Arg Leu Leu Ala Ile Thr His Val Ser Asn Val165 170 175Leu Gly Thr Glu Asn Pro Leu Ala Glu Met Ile Thr Leu Ala His Gln180 185 190His Gly Ala Lys Val Leu Val Asp Gly Ala Gln Ala Val Met His His195 200 205Pro Val Asp Val Gln Ala Leu Asp Cys Asp Phe Tyr Val Phe Ser Gly210 215 220His Lys Leu Tyr Gly Pro Thr Gly Ile Gly Ile Leu Tyr Val Lys Glu225 230 235 240Ala Leu Leu Gln Glu Met Pro Pro Trp Glu Gly Gly Gly Ser Met Ile245 250 255Ala Thr Val Ser Leu Ser Glu Gly Thr Thr Trp Thr Lys Ala Pro Trp260 265 270Arg Phe Glu Ala Gly Thr Pro Asn Thr Gly Gly Ile Ile Gly Leu Gly275 280 285Ala Ala Leu Glu Tyr Val Ser Ala Leu Gly Leu Asn Asn Ile Ala Glu290 295 300Tyr Glu Gln Asn Leu Met His Tyr Ala Leu Ser Gln Leu Glu Ser Val305 310 315 320Pro Asp Leu Thr Leu Tyr Gly Pro Gln Asn Arg Leu G1y Val Ile Ala325 330 335Phe Asn Leu Gly Lys His His Ala Tyr Asp Val Gly Ser Phe Leu Asp340 345 350Asn Tyr Gly Ile Ala Val Arg Thr Gly His His Cys Ala Met Pro Leu355 360 365Met Ala Tyr Tyr Asn Val Pro Ala Met Cys Arg Ala Ser Leu Ala Met370 375 380Tyr Asn Thr His Glu Glu Val Asp Arg Leu Val Thr Gly Leu Gln Arg385 390 395 400Ile His Arg Leu Leu Gly405(2)序列號9的資料(ⅰ)序列特性(A)長度3720個堿基對(B)類型核苷酸(C)STRANDEDNESSSingle(D)拓?fù)鋵W(xué)線性(ⅱ)分子類型DNA(基因組)(ⅲ)假設(shè)的無(ⅲ)反義的無(ⅶ)直接來源(B)克隆pHS1 metk(ⅸ)特征(D)名稱/索引CDS(B)定位530..1684(ⅹⅰ)序列描述序列號9gacgtctgtg tggaattgtg agcggataac aatttcacac agggccctcg gacaccgagg 60agaatgtcaa gaggcgaaca cacaacgtct tggagcgcca gaggaggaac gagctaaaac 120ggagcttttt tgccctgcgt gaccagatcc cggagttgga aaacaatgaa aaggccccca 180aggtagttat ccttaaaaaa gccacagcat acatcctgtc cgtccaagca gaggagcaaa 240agctcatttc tgaagaggac ttgttgcgga aacgacgaga acagttgaaa cacaaacttg 300aacagctacg gaactcttgt gcgtaaggaa aagtaaggaa aacgattcct tctaacagaa 360atgtcctgag caatcaccta tgaactgtcg actcgagata gcatttttat ccataagatt 420agccgatcct aaggtttaca attgtgagcg ctcacaatta tgatagattc aattgtgagc 480ggataacaat ttcacacacg ctagcggtac caaagaggag aaattaact atg gca aaa 538Met Ala Lys1cac ctt ttt acg tcc gag tcc gtc tct gaa ggg cat cct gac aaa att 586His Leu Phe Thr Ser Glu Ser Val Ser Glu Gly His Pro Asp Lys Ile5 10 15gct gac caa att tct gat gcc gtt tta gac gcg atc ctc gaa cag gat 634Ala Asp Gln Ile Ser Asp Ala Val Leu Asp Ala Ile Leu Glu Gln Asp20 25 30 35ccg aaa gca cgc gtt gct tgc gaa acc tac gta aaa acc ggc atg gtt 682Pro Lys Ala Arg Val Ala Cys Glu Thr Tyr Val Lys Thr Gly Met Val40 45 50tta gtt ggc ggc gaa atc acc acc agc gcc tgg gta gac atc gaa gag 730Leu Val Gly Gly Glu Ile Thr Thr Ser Ala Trp Val Asp Ile Glu Glu55 60 65arc acc cgt aac acc gtt cgc gaa att ggc tat gtg cat tcc gac atg 778Ile Thr Arg Asn Thr Val Arg Glu Ile Gly Tyr Val His Ser Asp Met70 75 80ggc ttt gac gct aac tcc tgt gcg gtt ctg agc gct atc ggc aaa cag 826Gly Phe Asp Ala Asn Ser Cys Ala Val Leu Ser Ala Ile Gly Lys Gln85 90 95tct cct gac atc aac cag ggc gtt gac cgt gcc gat ccg ctg gaa cag 874Ser Pro Asp Ile Asn Gln Gly Val Asp Arg Ala Asp Pro Leu Glu Gln100 105 110 115ggc gcg ggt gac cag ggt ctg atg ttt ggc tac gca act aat gaa acc 922Gly Ala Gly Asp Gln Gly Leu Met Phe Gly Tyr Ala Thr Asn Glu Thr120 125 130gac gtg ctg atg cca gca cct atc acc tat gca cac cgt ctg gta cag970Asp Val Leu Met Pro Ala Pro Ile Thr Tyr Ala His Arg Leu Val Gln135 140 145cgt cag gct gaa gtg cgt aaa aac ggc act ctg ccg tgg ctg cgc ccg 1018Arg Gln Ala Glu Val Arg Lys Asn Gly Thr Leu Pro Trp Leu Arg Pro150 155 160gac gcg aaa agc cag gtg act ttt cag tat gac gac ggc aaa atc gtt 1066Asp Ala Lys Ser Gln Val Thr Phe Gln Tyr Asp Asp Gly Lys Ile Val165 170 175ggt atc gat gct gtc gtg ctt tcc act cag cac tct gaa gag atc gac 1114Gly Ile Asp Ala Val Val Leu Ser Thr Gln His Ser Glu Glu Ile Asp180 185 190 195cag aaa tcg ctg caa gaa gcg gta atg gaa gag atc atc aag cca att 1162Gln Lys Ser Leu Gln Glu Ala Val Met Glu Glu Ile Ile Lys Pro Ile200 205 210ctg ccc gct gaa tgg ctg act tct gcc acc aaa ttc ttc atc aac ccg 1210Leu Pro Ala Glu Trp Leu Thr Ser Ala Thr Lys Phe Phe Ile Asn Pro215 220 225acc ggt cgt ttc gtt atc ggt ggc cca atg ggt gac tgc ggt ctg act 1258Thr Gly Arg Phe Val Ile Gly Gly Pro Met Gly Asp Cys Gly Leu Thr230 235 240ggt cgt aaa att atc gtt gat acc tac ggc ggc atg gcg cgt cac ggt 1306Gly Arg Lys Ile Ile Val Asp Thr Tyr Gly Gly Met Ala Arg His Gly245 250 255ggc ggt gca ttc tct ggt aaa gat cca tca aaa gtg gac cgt tcc gca 1354Gly Gly Ala Phe Ser Gly Lys Asp Pro Ser Lys Val Asp Arg Ser Ala260 265 270 275gcc tac gca gca cgt tat gtc gcg aaa aac atc gtt gct gct ggc ctg 1402Ala Tyr Ala Ala Arg Tyr Val Ala Lys Asn Ile Val Ala Ala Gly Leu280 285 290gcc gat cgt tgt gaa att cag gtt tcc tac gca atc ggc gtg gct gaa 1450Ala Asp Arg Cys Glu Ile Gln Val Ser Tyr Ala Ile Gly Val Ala Glu295 300 305ccg acc tcc atc atg gta gaa act ttc ggt act gag aaa gtg cct tct 1498Pro Thr Ser Ile Met Val Glu Thr Phe Gly Thr Glu Lys Val Pro Ser310 315 320gaa caa ctg acc ctg ctg gta cgt gag ttc ttc gac ctg cgc cca tac 1546Glu Gln Leu Thr Leu Leu Val Arg Glu Phe Phe Asp Leu Arg Pro Tyr325 330 335ggt ctg att cag atg ctg gat ctg ctg cac ccg atc tac aaa gaa acc 1594Gly Leu Ile Gln Met Leu Asp Leu Leu His Pro Ile Tyr Lys Glu Thr340 345 350 355gca gca tac ggt cac ttt ggt cgt gaa cat ttc ccg tgg gaa aaa acc 1642Ala Ala Tyr Gly His Phe Gly Arg Glu His Phe Pro Trp Glu Lys Thr360 365 370gac aaa gcg cag ctg ctg cgc gat gct gcc ggt ctg aag taa1684Asp Lys Ala Gln Leu Leu Arg Asp Ala Ala Gly Leu Lys375 380 385tcggtaccgc ttgatatcga attcctgcag cccgggggat cccatggtac gcgtgctaga 1744ggcatcaaat aaaacgaaag gctcagtcga aagactgggc ctttcgtttt atctgttgtt 1804tgtcggtgaa cgctctcctg agtaggacaa atccgccgcc ctagacctag gggatatatt 1864ccgcttcctc gctcactgac tcgctacgct cggtcgttcg actgcggcga gcggaaatgg 1924cttacgaacg gggcggagat ttcctggaag atgccaggaa gatacttaac agggaagtga 1984gagggccgcg gcaaagccgt ttttccatag gctccgcccc cctgacaagc atcacgaaat 2044ctgacgctca aatcagtggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc 2104ccctggcggc tccctcgtgc gctctcctgt tcctgccttt cggtttaccg gtgtcattcc 2164gctgttatgg ccgcgtttgt ctcattccac gcctgacact cagttccggg taggcagttc 2224gctccaagct ggactgtatg cacgaacccc ccgttcagtc cgaccgctgc gccttatccg 2284gtaactatcg tcttgagtcc aacccggaaa gacatgcaaa agcaccactg gcagcagcca 2344ctggtaattg atttagagga gttagtcttg aagtcatgcg ccggttaagg ctaaactgaa 2404aggacaagtt ttggtgactg cgctcctcca agccagttac ctcggttcaa agagttggta 2464gctcagagaa ccttcgaaaa accgccctgc aaggcggttt tttcgttttc agagcaagag 2524attacgcgca gaccaaaacg atctcaagaa gatcatctta ttaatcagat aaaatatttc 2584tagatttcag tgcaatttat ctcttcaaat gtagcacctg aagtcagccc catacgatat 2644aagttgttac tagtgcttgg attctcacca ataaaaaacg cccggcggca accgagcgtt 2704ctgaacaaat ccagatggag ttctgaggtc attactggat ctatcaacag gagtccaagc 2764gagctctcga accccagagt cccgctcaga agaactcgtc aagaaggcga tagaaggcga 2824tgcgctgcga atcgggagcg gcgataccgt aaagcacgag gaagcggtca gcccattcgc 2884cgccaagctc ttcagcaata tcacgggtag ccaacgctat gtcctgatag cggtccgcca 2944cacccagccg gccacagtcg atgaatccag aaaagcggcc attttccacc atgatattcg 3004gcaagcaggc atcgccatgg gtcacgacga gatcctcgcc gtcgggcatg cgcgccttga 3064gcctggcgaa cagttcggct ggcgcgagcc cctgatgctc ttcgtccaga tcatcctgat 3124cgacaagacc ggcttccatc cgagtacgtg ctcgctcgat gcgatgtttc gcttggtggt 3184cgaatgggca ggtagccgga tcaagcgtat gcagccgccg cattgcatca gccatgatgg 3244atactttctc ggcaggagca aggtgagatg acaggagatc ctgccccggc acttcgccca 3304atagcagcca gtcccttccc gcttcagtga caacgtcgag cacagctgcg caaggaacgc 3364ccgtcgtggc cagccacgat agccgcgctg cctcgtcctg cagttcattc agggcaccgg 3424acaggtcggt cttgacaaaa agaaccgggc gcccctgcgc tgacagccgg aacacggcgg 3484catcagagca gccgattgtc tggtgtgccc agtcatagcc gaatagcctc tccacccaag 3544cggccggaga acctgcgtgc aatccatctt gttcaatcat gcgaaacgat cctcatcctg 3604tctcttgatc agatcttgat cccctgcgcc atcagatcct tggcggcaag aaagccatcc 3664agtttacttt gcagggcttc ccaaccttac cagagggcgc cccagctggc aattcc 3720(2)序列號10的資料(ⅰ)序列特性(A)長度384個氨基酸(B)類型氨基酸(D)拓?fù)鋵W(xué)線性(ⅱ)分子類型蛋白質(zhì)(ⅹⅰ)序列描述序列號10Met Ala Lys His Leu Phe Thr Ser Glu Ser Val Ser Glu Gly His Pro1 5 10 15Asp Lys Ile Ala Asp Gln Ile Ser Asp Ala Val Leu Asp Ala Ile Leu20 25 30Glu Gln Asp Pro Lys Ala Arg Val Ala Cys Glu Thr Tyr val Lys Thr35 40 45Gly Met Val Leu Val Gly Gly Glu Ile Thr Thr Ser Ala Trp Val Asp50 55 60Ile Glu Glu Ile Thr Arg Asn Thr Val Arg Glu Ile Gly Tyr Val His65 70 75 80Ser Asp Met Gly Phe Asp Ala Asn Ser Cys Ala Val Leu Ser Ala Ile85 90 95Gly Lys Gln Ser Pro Asp Ile Asn Gln Gly Val Asp Arg Ala Asp Pro100 105 110Leu Glu Gln Gly Ala Gly Asp Gln Gly Leu Met Phe Gly Tyr Ala Thr115 120 125Asn Glu Thr Asp Val Leu Met Pro Ala Pro Ile Thr Tyr Ala His Arg130 135 140Leu Val Gln Arg Gln Ala Glu Val Arg Lys Asn Gly Thr Leu Pro Trp145 150 155 160Leu Arg Pro Asp Ala Lys Ser Gln Val Thr Phe Gln Tyr Asp Asp Gly165 170 175Lys Ile Val Gly Ile Asp Ala Val Val Leu Ser Thr Gln His Ser Glu180 185 190Glu Ile Asp Gln Lys Ser Leu Gln Glu Ala Val Met Glu Glu Ile Ile195 200 205Lys Pro Ile Leu Pro Ala Glu Trp Leu Thr Ser Ala Thr Lys Phe Phe210 215 220Ile Asn Pro Thr Gly Arg Phe Val Ile Gly Gly Pro Met Gly Asp Cys225 230 235 240Gly Leu Thr Gly Arg Lys Ile Ile Val Asp Thr Tyr Gly Gly Met Ala245 250 255Arg His Gly Gly Gly Ala Phe Ser Gly Lys Asp Pro Ser Lys Val Asp260 265 270Arg Ser Ala Ala Tyr Ala Ala Arg Tyr Val Ala Lys Asn Ile Val Ala275 280 285Ala Gly Leu Ala Asp Arg Cys Glu Ile Gln Val Ser Tyr Ala Ile Gly290 295 300Val Ala Glu Pro Thr Ser Ile Met Val Glu Thr Phe Gly Thr Glu Lys305 310 315 320Val Pro Ser Glu Gln Leu Thr Leu Leu Val Arg Glu Phe Phe Asp Leu325 330 335Arg Pro Tyr Gly Leu Ile Gln Met Leu Asp Leu Leu His Pro Ile Tyr340 345 350Lys Glu Thr Ala Ala Tyr Gly His Phe Gly Arg Glu His Phe Pro Trp355 360 365Glu Lys Thr Asp Lys Ala Gln Leu Leu Arg Asp Ala Ala Gly Leu Lys370 375 380(2)序列號11的資料(ⅰ)序列特性(A)長度3794個堿基對(B)類型核苷酸(C)鏈絞合單鏈(D)拓?fù)鋵W(xué)循環(huán)(ⅱ)分子類型DNA(基因組)(ⅲ)假設(shè)的無(ⅲ)反義的無(ⅶ)直接來源(B)克隆pHSl bioSl(ⅸ)特征(E)名稱/索引CDS(B)定位601..1806(ⅹⅰ)序列描述序列號11gacgtctgtg tggaattgtg agcggataac aatttcacac agggccctcg gacaccgagg 60agaatgtcaa gaggcgaaca cacaacgtct tggagcgcca gaggaggaac gagctaaaac 120ggagcttttt tgccctgcgt gaccagatcc cggagttgga aaacaatgaa aaggccccca 180aggtagttat ccttaaaaaa gccacagcat acatcctgtc cgtccaagca gaggagcaaa 240agctcatttc tgaagaggac ttgttgcgga aacgacgaga acagttgaaa cacaaacttg 300aacagctacg gaactcttgt gcgtaaggaa aagtaaggaa aacgattcct tctaacagaa 360atgtcctgag caatcaccta tgaactgtcg actcgagata gcatttttat ccataagatt 420agccgatcct aaggtttaca attgtgagcg ctcacaatta tgatagattc aattgtgagc 480ggataacaat ttcacacacg ctagcggtac cgggcccccc ctcgaggtcg acggtatcga 540taagcttgat atcgaattcc tgcagcccgg gggatcccat ggtacgcgtc gaggagtacc 600atg aac gtt ttt aat ccc gcg cag ttt cgc gcc cag ttt ccc gca cta 648Met Asn Val Phe Asn Pro Ala Gln Phe Arg Ala Gln Phe Pro Ala Leu1 5 10 15cag gat gcg ggc gtc tat ctc gac agc gcc gcg acc gcg ctt aaa cct 696Gln Asp Ala Gly Val Tyr Leu Asp Ser Ala Ala Thr Ala Leu Lys Pro20 25 30gaa gcc gtg gtt gaa gcc acc caa cag ttt tac agt ctg agc gcc gga 744Glu Ala Val Val Glu Ala Thr Gln Gln Phe Tyr Ser Leu Ser Ala Gly35 40 45aac gtc cat cgc agc cag ttt gcc gaa gcc caa cgc ctg acc gcg cgt 792Asn Val His Arg Ser Gln Phe Ala Glu Ala Gln Arg Leu Thr Ala Arg50 55 60tat gaa gct gca cga gag aaa gtg gcg caa tta ctg aat gca ccg gat 840Tyr Glu Ala Ala Arg Glu Lys Val Ala Gln Leu Leu Asn Ala Pro Asp65 70 75 80gat aaa act atc gtc tgg acg cgc ggc acc act gaa tcc atc aac atg 888Asp Lys Thr Ile Val Trp Thr Arg Gly Thr Thr Glu Ser Ile Asn Met85 90 95gtg gca caa tgc tat gcg cgt ccg cgt ctg caa ccg ggc gat gag att 936Val Ala Gln Cys Tyr Ala Arg Pro Arg Leu Gln Pro Gly Asp Glu Ile100 105 110att gtc agc gtg gca gaa cac cac gcc aac ctc gtc ccc tgg ctg atg 984Ile Val Ser Val Ala Glu His His Ala Asn Leu Val Pro Trp Leu Met115 120 125gtc gcc caa caa act gga gcc aaa gtg gtg aaa ttg ccg ctt aat gcg 1032Val Ala Gln Gln Thr Gly Ala Lys Val Val Lys Leu Pro Leu Asn Ala130 135 140cag cga ctg ccg gat gtc gat ttg ttg cca gaa ctg att act ccc cgt 1080Gln Arg Leu Pro Asp Val Asp Leu Leu Pro Glu Leu Ile Thr Pro Arg145 150 155 160agt cgg att ctg gcg ttg ggt cag atg tcg aac gtt act ggc ggt tgc 1128Ser Arg Ile Leu Ala Leu Gly Gln Met Ser Asn Val Thr Gly Gly Cys165 170 175ccg gat ctg gcg cga gcg att acc ttt gct cat tca gcc ggg atg gtg 1176Pro Asp Leu Ala Arg Ala Ile Thr Phe Ala His Ser Ala Gly Met Val180 185 190gtg atg gtt gat ggt gct cag ggg gca gtg cat ttc ccc gcg gat gtt 1224Val Met Val Asp Gly Ala Gln Gly Ala Val His Phe Pro Ala Asp Val195 200 205cag caa ctg gat att gat ttc tat gct ttt tca ggt cac aaa ctg tat 1272Gln Gln Leu Asp Ile Asp Phe Tyr Ala Phe Ser Gly His Lys Leu Tyr210 215 220ggc ccg aca ggt atc ggc gtg ctg tat ggt aaa tca gaa ctg ctg gag 1320Gly Pro Thr Gly Ile Gly Val Leu Tyr Gly Lys Ser Glu Leu Leu Glu225 230 235 240gcg atg tcg ccc tgg ctg ggc ggc ggc aaa atg gtt cac gaa gtg agt 1368Ala Met Ser Pro Trp Leu Gly Gly Gly Lys Met Val His Glu Val Ser245 250 255ttt gac ggc ttc acg act caa tct gcg ccg tgg aaa ctg gaa gct gga 1416Phe Asp Gly Phe Thr Thr Gln Ser Ala Pro Trp Lys Leu Glu Ala Gly260 265 270acg cca aat gtc gct ggt gtc ata gga tta agc gcg gcg ctg gaa tgg 1464Thr Pro Asn Val Ala Gly Val Ile Gly Leu Ser Ala Ala Leu Glu Trp275 280 285ctg gca gat tac gat atc aac cag gcc gaa agc tgg agc cgt agc tta 1512Leu Ala Asp Tyr Asp Ile Asn Gln Ala Glu Ser Trp Ser Arg Ser Leu290 295 300gca acg ctg gcg gaa gat gcg ctg gcg aaa cgt ccc ggc ttt cgt tca 1560Ala Thr Leu Ala Glu Asp Ala Leu Ala Lys Arg Pro Gly Phe Arg Ser305 310 315 320ttc cgc tgc cag gat tcc agc ctg ctg gcc ttt gat ttt gct ggc gtt 1608Phe Arg Cys Gln Asp Ser Ser Leu Leu Ala Phe Asp Phe Ala Gly Val325 330 335cat cat agc gat atg gtg acg ctg ctg gcg gag tac ggt att gcc ctg 1656His His Ser Asp Met Val Thr Leu Leu Ala Glu Tyr Gly Ile Ala Leu340 345 350cgg gcc ggg cag cat tgc gct cag ccg cta ctg gca gaa tta ggc gta 1704Arg Ala Gly Gln His Cys Ala Gln Pro Leu Leu Ala Glu Leu G1y Val355 360 365acc ggc aca ctg cgc gcc tct ttt gcg cca tat aat aca aag agt gat 1752Thr Gly Thr Leu Arg Ala Ser Phe Ala Pro Tyr Asn Thr Lys Ser Asp370 375 380gtg gat gcg ctg gtg aat gcc gtt gac cgc gcg ctg gaa tta ttg gtg 1800Val Asp Ala Leu Val Asn Ala Val Asp Arg Ala Leu Glu Leu Leu Val385 390 395 400gat taa acgcgtgcta gaggcatcaa ataaaacgaa aggctcagtc gaaagactgg1856Aspgcctttcgtt ttatctgttg tttgtcggtg aacgctctcc tgagtaggac aaatccgccg 1916ccctagacct aggggatata ttccgcttcc tcgctcactg actcgctacg ctcggtcgtt 1976cgactgcggc gagcggaaat ggcttacgaa cggggcggag atttcctgga agatgccagg 2036aagatactta acagggaagt gagagggccg cggcaaagcc gtttttccat aggctccgcc 2096cccctgacaa gcatcacgaa atctgacgct caaatcagtg gtggcgaaac ccgacaggac 2156tataaagata ccaggcgttt ccccctggcg gctccctcgt gcgctctcct gttcctgcct 2216ttcggtttac cggtgtcatt ccgctgttat ggccgcgttt gtctcattcc acgcctgaca 2276ctcagttccg ggtaggcagt tcgctccaag ctggactgta tgcacgaacc ccccgttcag 2336tccgaccgct gcgccttatc cggtaactat cgtcttgagt ccaacccgga aagacatgca 2396aaagcaccac tggcagcagc cactggtaat tgatttagag gagttagtct tgaagtcatg 2456cgccggttaa ggctaaactg aaaggacaag ttttggtgac tgcgctcctc caagccagtt 2516acctcggttc aaagagttgg tagctcagag aaccttcgaa aaaccgccct gcaaggcggt 2576tttttcgttt tcagagcaag agattacgcg cagaccaaaa cgatctcaag aagatcatct 2636tattaatcag ataaaatatt tctagatttc agtgcaattt atctcttcaa atgtagcacc 2696tgaagtcagc cccatacgat ataagttgtt actagtgctt ggattctcac caataaaaaa 2756cgcccggcgg caaccgagcg ttctgaacaa atccagatgg agttctgagg tcattactgg 2816atctatcaac aggagtccaa gcgagctctc gaaccccaga gtcccgctca gaagaactcg 2876tcaagaaggc gatagaaggc gatgcgctgc gaatcgggag cggcgatacc gtaaagcacg 2936aggaagcggt cagcccattc gccgccaagc tcttcagcaa tatcacgggt agccaacgct 2996atgtcctgat agcggtccgc cacacccagc cggccacagt cgatgaatcc agaaaagcgg 3056ccattttcca ccatgatatt cggcaagcag gcatcgccat gggtcacgac gagatcctcg 3116ccgtcgggca tgcgcgcctt gagcctggcg aacagttcgg ctggcgcgag cccctgatgc 3176tcttcgtcca gatcatcctg atcgacaaga ccggcttcca tccgagtacg tgctcgctcg 3236atgcgatgtt tcgcttggtg gtcgaatggg caggtagccg gatcaagcgt atgcagccgc 3296cgcattgcat cagccatgat ggatactttc tcggcaggag caaggtgaga tgacaggaga 3356tcctgccccg gcacttcgcc caatagcagc cagtcccttc ccgcttcagt gacaacgtcg 3416agcacagctg cgcaaggaac gcccgtcgtg gccagccacg atagccgcgc tgcctcgtcc 3476tgcagttcat tcagggcacc ggacaggtcg gtcttgacaa aaagaaccgg gcgcccctgc 3536gctgacagcc ggaacacggc ggcatcagag cagccgattg tctgttgtgc ccagtcatag 3596ccgaatagcc tctccaccca agcggccgga gaacctgcgt gcaatccatc ttgttcaatc 3656atgcgaaacg atcctcatcc tgtctcttga tcagatcttg atcccctgcg ccatcagatc 3716cttggcggca agaaagccat ccagtttact ttgcagggct tcccaacctt accagagggc 3776gccccagctg gcaattcc 3794(2)序列號12的資料(ⅰ)序列特性(A)長度401個氨基酸(B)類型氨基酸(D)拓?fù)鋵W(xué)線性(ⅱ)分子類型蛋白質(zhì)(ⅹⅰ)序列描述序列號12Met Asn Val Phe Asn Pro Ala Gln Phe Arg Ala Gln Phe Pro Ala Leu1 5 10 15Gln Asp Ala Gly Val Tyr Leu Asp Ser Ala Ala Thr Ala Leu Lys Pro20 25 30Glu Ala Val Val Glu Ala Thr Gln Gln Phe Tyr Ser Leu Ser Ala Gly35 40 45Asn Val His Arg Ser Gln Phe Ala Glu Ala Gln Arg Leu Thr Ala Arg50 55 60Tyr Glu Ala Ala Arg Glu Lys Val Ala Gln Leu Leu Asn Ala Pro Asp65 70 75 80Asp Lys Thr Ile Val Trp Thr Arg Gly Thr Thr Glu Ser Ile Asn Met85 90 95Val Ala Gln Cys Tyr Ala Arg Pro Arg Leu Gln Pro Gly Asp Glu Ile100 105 110Ile Val Ser Val Ala Glu His His Ala Asn Leu Val Pro Trp Leu Met115 120 125Val Ala Gln Gln Thr Gly Ala Lys Val Val Lys Leu Pro Leu Asn Ala130 135 140Gln Arg Leu Pro Asp Val Asp Leu Leu Pro Glu Leu Ile Thr Pro Arg145 150 155 160Ser Arg Ile Leu Ala Leu Gly Gln Met Ser Asn Val Thr Gly Gly Cys165 170 175Pro Asp Leu Ala Arg Ala Ile Thr Phe Ala His Ser Ala Gly Met Val180 185 190Val Met Val Asp Gly Ala Gln Gly Ala Val His Phe Pro Ala Asp Val195 200 205Gln Gln Leu Asp Ile Asp Phe Tyr Ala Phe Ser Gly His Lys Leu Tyr210 215 220Gly Pro Thr Gly Ile Gly Val Leu Tyr Gly Lys Ser Glu Leu Leu Glu225 230 235 240Ala Met Ser Pro Trp Leu Gly Gly Gly Lys Met Val His Glu Val Ser245 250 255Phe Asp Gly Phe Thr Thr Gln Ser Ala Pro Trp Lys Leu Glu Ala Gly260 265 270Thr Pro Asn Val Ala Gly Val Ile Gly Leu Ser Ala Ala Leu Glu Trp275 280 285Leu Ala Asp Tyr Asp Ile Asn Gln Ala Glu Ser Trp Ser Arg Ser Leu290 295 300Ala Thr Leu Ala Glu Asp Ala Leu Ala Lys Arg Pro Gly Phe Arg Ser305 310 315 320Phe Arg Cys Gln Asp Ser Ser Leu Leu Ala Phe Asp Phe Ala Gly Val325 330 335His His Ser Asp Met Val Thr Leu Leu Ala Glu Tyr Gly Ile Ala Leu340 345 350Arg Ala Gly Gln His Cys Ala Gln Pro Leu Leu Ala Glu Leu Gly Val355 360 365Thr Gly Thr Leu Arg Ala Ser Phe Ala Pro Tyr Asn Thr Lys Ser Asp370 375 380Val Asp Ala Leu Val Asn Ala Val Asp Arg Ala Leu Glu Leu Leu Val385 390 395 400Asp(2)序列號13的資料(ⅰ)序列特性(A)長度4975個堿基對(B)類型核苷酸(C)鏈絞合單鏈(D)拓?fù)鋵W(xué)循環(huán)(ⅱ)分子類型DNA(基因組)(ⅲ)假設(shè)的無(ⅲ)反義的無(ⅶ)直接來源(B)克隆pHS1 metk bioS1(ⅸ)特征(F)名稱/索引CDS(B)定位1782..1684(ⅹⅰ)序列描述序列號13gacgtctgtg tggaattgtg agcggataac aatttcacac agggccctcg gacaccgagg 60agaatgtcaa gaggcgaaca cacaacgtct tggagcgcca gaggaggaac gagctaaaac 120ggagcttttt tgccctgcgt gaccagatcc cggagttgga aaacaatgaa aaggccccca 180aggtagttat ccttaaaaaa gccacagcat acatcctgtc cgtccaagca gaggagcaaa 240agctcatttc tgaagaggac ttgttgcgga aacgacgaga acagttgaaa cacaaacttg 300aacagctacg gaactcttgt gcgtaaggaa aagtaaggaa aacgattcct tctaacagaa 360atgtcctgag caatcaccta tgaactgtcg actcgagata gcatttttat ccataagatt 420agccgatcct aaggtttaca attgtgagcg ctcacaatta tgatagattc aattgtgagc 480ggataacaat ttcacacacg ctagcggtac caaagaggag aaattaact atg gca aaa 538Met Ala Lys1cac ctt ttt acg tcc gag tcc gtc tct gaa ggg cat cct gac aaa att 586His Leu Phe Thr Ser Glu Ser Val Ser Glu Gly His Pro Asp Lys Ile5 10 15gct gac caa att tct gat gcc gtt tta gac gcg atc ctc gaa cag gat 634Ala Asp Gln Ile Ser Asp Ala Val Leu Asp Ala Ile Leu Glu Gln Asp20 25 30 35ccg aaa gca cgc gtt gct tgc gaa acc tac gta aaa acc ggc atg gtt 682Pro Lys Ala Arg Val Ala Cys Glu Thr Tyr Val Lys Thr Gly Met Val40 45 50tta gtt ggc ggc gaa atc acc acc agc gcc tgg gta gac atc gaa gag 730Leu Val Gly Gly Glu Ile Thr Thr Ser Ala Trp Val Asp Ile Glu Glu55 60 65atc acc cgt aac acc gtt cgc gaa att ggc tat gtg cat tcc gac atg 778Ile Thr Arg Asn Thr Val Arg Glu Ile Gly Tyr Val His Ser Asp Met70 75 80ggc ttt gac gct aac tcc tgt gcg gtt ctg agc gct atc ggc aaa cag 826Gly Phe Asp Ala Asn Ser Cys Ala Val Leu Ser Ala Ile Gly Lys Gln85 90 95tct cct gac atc aac cag ggc gtt gac cgt gcc gat ccg ctg gaa cag 874Ser Pro Asp Ile Asn Gln Gly Val Asp Arg Ala Asp Pro Leu Glu Gln100 105 110 115ggc gcg ggt gac cag ggt ctg atg ttt ggc tac gca act aat gaa acc 922Gly Ala Gly Asp Gln Gly Leu Met Phe Gly Tyr Ala Thr Asn Glu Thr120 125 130gac gtg ctg atg cca gca cct atc acc tat gca cac cgt ctg gta cag 970Asp Val Leu Met Pro Ala Pro Ile Thr Tyr Ala His Arg Leu Val Gln135 140 145cgt cag gct gaa gtg cgt aaa aac ggc act ctg ccg tgg ctg cgc ccg 1018Arg Gln Ala Glu Val Arg Lys Asn Gly Thr Leu Pro Trp Leu Arg Pro150 155 160gac gcg aaa agc cag gtg act ttt cag tat gac gac ggc aaa atc gtt 1066Asp Ala Lys Ser Gln Val Thr Phe Gln Tyr Asp Asp Gly Lys Ile Val165 170 175ggt atc gat gct gtc gtg ctt tcc act cag cac tct gaa gag atc gac 1114Gly Ile Asp Ala Val Val Leu Ser Thr Gln His Ser Glu Glu Ile Asp180 185 190 195cag aaa tcg ctg caa gaa gcg gta atg gaa gag atc atc aag cca att 1162Gln Lys Ser Leu Gln Glu Ala Val Met Glu Glu Ile Ile Lys Pro Ile200 205 210ctg ccc gct gaa tgg ctg act tct gcc acc aaa ttc ttc atc aac ccg 1210Leu Pro Ala Glu Trp Leu Thr Ser Ala Thr Lys Phe Phe Ile Asn Pro215 220 225acc ggt cgt ttc gtt atc ggt ggc cca atg ggt gac tgc ggt ctg act 1258Thr Gly Arg Phe Val Ile Gly Gly Pro Met Gly Asp Cys Gly Leu Thr230 235 240ggt cgt aaa att atc gtt gat acc tac ggc ggc atg gcg cgt cac ggt 1306Gly Arg Lys Ile Ile Val Asp Thr Tyr Gly Gly Met Ala Arg His Gly245 250 255ggc ggt gca ttc tct ggt aaa gat cca tca aaa gtg gac cgt tcc gca 1354Gly Gly Ala Phe Ser Gly Lys Asp Pro Ser Lys Val Asp Arg Ser Ala260 265 270 275gcc tac gca gca cgt tat gtc gcg aaa aac atc gtt gct gct ggc ctg 1402Ala Tyr Ala Ala Arg Tyr Val Ala Lys Asn Ile Val Ala Ala Gly Leu280 285 290gcc gat cgt tgt gaa att cag gtt tcc tac gca atc ggc gtg gct gaa 1450Ala Asp Arg Cys Glu Ile Gln Val Ser Tyr Ala Ile Gly Val Ala Glu295 300 305ccg acc tcc atc atg gta gaa act ttc ggt act gag aaa gtg cct tct 1498Pro Thr Ser Ile Met Val Glu Thr Phe Gly Thr Glu Lys Val Pro Ser310 315 320gaa caa ctg acc ctg ctg gta cgt gag ttc ttc gac ctg cgc cca tac 1546Glu Gln Leu Thr Leu Leu Val Arg Glu Phe Phe Asp Leu Arg Pro Tyr325 330 335ggt ctg att cag atg ctg gat ctg ctg cac ccg atc tac aaa gaa acc 1594Gly Leu Ile Gln Met Leu Asp Leu Leu His Pro Ile Tyr Lys Glu Thr340 345 350 355gca gca tac ggt cac ttt ggt cgt gaa cat ttc ccg tgg gaa aaa acc 1642Ala Ala Tyr Gly His Phe Gly Arg Glu His Phe Pro Trp Glu Lys Thr360 365 370gac aaa gcg cag ctg ctg cgc gat gct gcc ggt ctg aag taa1684Asp Lys Ala Gln Leu Leu Arg Asp Ala Ala Gly Leu Lys375 380 385tcggtaccgg gccccccctc gaggtcgacg gtatcgataa gcttgatatc gaattcctgc 1744agcccggggg atcccatggt acgcgtcgag gagtacc atg aac gtt ttt aat ccc 1799Met Asn Val Phe Asn Pro390gcg cag ttt cgc gcc cag ttt ccc gca cta cag gat gcg ggc gtc tat 1847Ala Gln Phe Arg Ala Gln Phe Pro Ala Leu Gln Asp Ala Gly Val Tyr395 400 405ctc gac agc gcc gcg acc gcg ctt aaa cct gaa gcc gtg gtt gaa gcc 1895Leu Asp Ser Ala Ala Thr Ala Leu Lys Pro Glu Ala Val Val Glu Ala410 415 420acc caa cag ttt tac agt ctg agc gcc gga aac gtc cat cgc agc cag 1943Thr Gln Gln Phe Tyr Ser Leu Ser Ala Gly Asn Val His Arg Ser Gln425 430 435ttt gcc gaa gcc caa cgc ctg acc gcg cgt tat gaa gct gca cga gag 1991Phe Ala Glu Ala Gln Arg Leu Thr Ala Arg Tyr Glu Ala Ala Arg Glu440 445 450 455aaa gtg gcg caa tta ctg aat gca ccg gat gat aaa act atc gtc tgg 2039Lys Val Ala Gln Leu Leu Asn Ala Pro Asp Asp Lys Thr Ile Val Trp460 465 470acg cgc ggc acc act gaa tcc atc aac atg gtg gca caa tgc tat gcg 2087Thr Arg Gly Thr Thr Glu Ser Ile Asn Met Val Ala Gln Cys Tyr Ala475 480 485cgt ccg cgt ctg caa ccg ggc gat gag att att gtc agc gtg gca gaa 2135Arg Pro Arg Leu Gln Pro Gly Asp Glu Ile Ile Val Ser Val Ala Glu490 495 500cac cac gcc aac ctc gtc ccc tgg ctg atg gtc gcc caa caa act gga 2183His His Ala Asn Leu Val Pro Trp Leu Met Val Ala Gln Gln Thr Gly505 510 515gcc aaa gtg gtg aaa ttg ccg ctt aat gcg cag cga ctg ccg gat gtc 2231Ala Lys Val Val Lys Leu Pro Leu Asn Ala Gln Arg Leu Pro Asp Val520 525 530 535gat ttg ttg cca gaa ctg att act ccc cgt agt cgg att ctg gcg ttg 2279Asp Leu Leu Pro Glu Leu Ile Thr Pro Arg Ser Arg Ile Leu Ala Leu540 545 550ggt cag atg tcg aac gtt act ggc ggt tgc ccg gat ctg gcg cga gcg 2327Gly Gln Met Ser Asn Val Thr Gly Gly Cys Pro Asp Leu Ala Arg Ala555 560 565att acc ttt gct cat tca gcc ggg atg gtg gtg atg gtt gat ggt gct 2375Ile Thr Phe Ala His Ser Ala Gly Met Val Val Met Val Asp Gly Ala570 575 580cag ggg gca gtg cat ttc ccc gcg gat gtt cag caa ctg gat att gat 2423Gln Gly Ala Val His Phe Pro Ala Asp Val Gln Gln Leu Asp Ile Asp585 590 595ttc tat gct ttt tca ggt cac aaa ctg tat ggc ccg aca ggt atc ggc 2471Phe Tyr Ala Phe Ser Gly His Lys Leu Tyr Gly Pro Thr Gly Ile Gly600 605 610 615gtg ctg tat ggt aaa tca gaa ctg ctg gag gcg atg tcg ccc tgg ctg 2519Val Leu Tyr Gly Lys Ser Glu Leu Leu Glu Ala Met Ser Pro Trp Leu620 625 630ggc ggc ggc aaa atg gtt cac gaa gtg agt ttt gac ggc ttc acg act 2567Gly Gly Gly Lys Met Val His Glu Val Ser Phe Asp Gly Phe Thr Thr635 640 645caa tct gcg ccg tgg aaa ctg gaa gct gga acg cca aat gtc gct ggt 2615Gln Ser Ala Pro Trp Lys Leu Glu Ala Gly Thr Pro Asn Val Ala Gly650 655 660gtc ata gga tta agc gcg gcg ctg gaa tgg ctg gca gat tac gat atc 2663Val Ile Gly Leu Ser Ala Ala Leu Glu Trp Leu Ala Asp Tyr Asp Ile665 670 675aac cag gcc gaa agc tgg agc cgt agc tta gca acg ctg gcg gaa gat 2711Asn Gln Ala Glu Ser Trp Ser Arg Ser Leu Ala Thr Leu Ala Glu Asp680 685 690 695gcg ctg gcg aaa cgt ccc ggc ttt cgt tca ttc cgc tgc cag gat tcc 2759Ala Leu Ala Lys Arg Pro Gly Phe Arg Ser Phe Arg Cys Gln Asp Ser700 705 710agc ctg ctg gcc ttt gat ttt gct ggc gtt cat cat agc gat atg gtg 2807Ser Leu Leu Ala Phe Asp Phe Ala Gly Val His His Ser Asp Met Val715 720 725acg ctg ctg gcg gag tac ggt att gcc ctg cgg gcc ggg cag cat tgc 2855Thr Leu Leu Ala Glu Tyr Gly Ile Ala Leu Arg Ala Gly Gln His Cys730 735 740gct cag ccg cta ctg gca gaa tta ggc gta acc ggc aca ctg cgc gcc 2903Ala Gln Pro Leu Leu Ala Glu Leu Gly Val Thr Gly Thr Leu Arg Ala745 750 755tct ttt gcg cca tat aat aca aag agt gat gtg gat gcg ctg gtg aat 2951Ser Phe Ala Pro Tyr Asn Thr Lys Ser Asp Val Asp Ala Leu Val Asn760 765 770 775gcc gtt gac cgc gcg ctg gaa tta ttg gtg gat taa acgcgtgcta 2997Ala Val Asp Arg Ala Leu Glu Leu Leu Val Asp780 785gaggcatcaa ataaaacgaa aggctcagtc gaaagactgg gcctttcgtt ttatctgttg 3057tttgtcggtg aacgctctcc tgagtaggac aaatccgccg ccctagacct aggggatata 3117ttccgcttcc tcgctcactg actcgctacg ctcggtcgtt cgactgcggc gagcggaaat 3177ggcttacgaa cggggcggag atttcctgga agatgccagg aagatactta acagggaagt 3237gagagggccg cggcaaagcc gtttttccat aggctccgcc cccctgacaa gcatcacgaa 3297atctgacgct caaatcagtg gtggcgaaac ccgacaggac tataaagata ccaggcgttt 3357ccccctggcg gctccctcgt gcgctctcct gttcctgcct ttcggtttac cggtgtcatt 3417ccgctgttat ggccgcgttt gtctcattcc acgcctgaca ctcagttccg ggtaggcagt 3477tcgctccaag ctggactgta tgcacgaacc ccccgttcag tccgaccgct gcgccttatc 3537cggtaactat cgtcttgagt ccaacccgga aagacatgca aaagcaccac tggcagcagc 3597cactggtaat tgatttagag gagttagtct tgaagtcatg cgccggttaa ggctaaactg 3657aaaggacaag ttttggtgac tgcgctcctc caagccagtt acctcggttc aaagagttgg 3717tagctcagag aaccttcgaa aaaccgccct gcaaggcggt tttttcgttt tcagagcaag 3777agattacgcg cagaccaaaa cgatctcaag aagatcatct tattaatcag ataaaatatt 3837tctagatttc agtgcaattt atctcttcaa atgtagcacc tgaagtcagc cccatacgat 3897ataagttgtt actagtgctt ggattctcac caataaaaaa cgcccggcgg caaccgagcg 3957ttctgaacaa atccagatgg agttctgagg tcattactgg atctatcasc aggagtccaa 4017gcgagctctc gaaccccaga gtcccgctca gaagaactcg tcaagaaggc gatagaaggc 4077gatgcgctgc gaatcgggag cggcgatacc gtaaagcacg aggaagcggt cagcccattc 4137gccgccaagc tcttcagcaa tatcacgggt agccaacgct atgtcctgat agcggtccgc 4197cacacccagc cggccacagt cgatgaatcc agaaaagcgg ccattttcca ccatgatatt 4257cggcaagcag gcatcgccat gggtcacgac gagatcctcg ccgtcgggca tgcgcgcctt 4317gagcctggcg aacagttcgg ctggcgcgag cccctgatgc tcttcgtcca gatcatcctg 4377atcgacaaga ccggcttcca tccgagtacg tgctcgctcg atgcgatgtt tcgcttggtg 4437gtcgaatggg caggtagccg gatcaagcgt atgcagccgc cgcattgcat cagccatgat 4497ggatactttc tcggcaggag caaggtgaga tgacaggaga tcctgccccg gcacttcgcc 4557caatagcagc cagtcccttc ccgcttcagt gacaacgtcg agcacagctg cgcaaggaac 4617gcccgtcgtg gccagccacg atagccgcgc tgcctcgtcc tgcagttcat tcagggcacc 4677ggacaggtcg gtcttgacaa aaagaaccgg gcgcccctgc gctgacagcc ggaacacggc 4737ggcatcagag cagccgattg tctgttgtgc ccagtcatag ccgaatagcc tctccaccca 4797agcggccgga gaacctgcgt gcaatccatc ttgttcaatc atgcgaaacg atcctcatcc 4857tgtctcttga tcagatcttg atcccctgcg ccatcagatc cttggcggca agaaagccat 4917ccagtttact ttgcagggct tcccaacctt accagagggc gccccagctg gcaattcc 4975(2)序列號14的資料(ⅰ)序列特性(A)長度384個氨基酸(B)類型氨基酸(D)拓?fù)鋵W(xué)線性(ⅱ)分子類型蛋白質(zhì)(ⅹⅰ)序列描述序列號14Met Ala Lys His Leu Phe Thr Ser Glu Ser Val Ser Glu Gly His Pro1 5 10 15Asp Lys Ile Ala Asp Gln Ile Ser Asp Ala Val Leu Asp Ala Ile Leu20 25 30Glu Gln Asp Pro Lys Ala Arg Val Ala Cys Glu Thr Tyr Val Lys Thr35 40 45Gly Met Val Leu Val Gly Gly Glu Ile Thr Thr Ser Ala Trp Val Asp50 55 60Ile Glu Glu Ile Thr Arg Asn Thr Val Arg Glu Ile Gly Tyr Val His65 70 75 80Ser Asp Met Gly Phe Asp Ala Asn Ser Cys Ala Val Leu Ser Ala Ile85 90 95Gly Lys Gln Ser Pro Asp Ile Asn Gln Gly Val Asp Arg Ala Asp Pro100 105 110Leu Glu Gln Gly Ala Gly Asp Gln Gly Leu Met Phe Gly Tyr Ala Thr115 120 125Asn Glu Thr Asp Val Leu Met Pro Ala Pro Ile Thr Tyr Ala His Arg130 135 140Leu Val Gln Arg Gln Ala Glu Val Arg Lys Asn Gly Thr Leu Pro Trp145 150 155 160Leu Arg Pro Asp Ala Lys Ser Gln Val Thr Phe Gln Tyr Asp Asp Gly165 170 175Lys Ile Val Gly Ile Asp Ala Val Val Leu Ser Thr Gln His Ser Glu180 185 190Glu Ile Asp Gln Lys Ser Leu Gln Glu Ala Val Met Glu Glu Ile Ile195 200 205Lys Pro Ile Leu Pro Ala Glu Trp Leu Thr Ser Ala Thr Lys Phe Phe210 215 220Ile Asn Pro Thr Gly Arg Phe Val Ile Gly Gly Pro Met Gly Asp Cys225 230 235 240Gly Leu Thr Gly Arg Lys Ile Ile Val Asp Thr Tyr Gly Gly Met Ala245 250 255Arg His Gly Gly Gly Ala Phe Ser Gly Lys Asp Pro Ser Lys Val Asp260 265 270Arg Ser Ala Ala Tyr Ala Ala Arg Tyr Val Ala Lys Asn Ile Val Ala275 280 285Ala Gly Leu Ala Asp Arg Cys Glu Ile Gln Val Ser Tyr Ala Ile Gly290 295 300Val Ala Glu Pro Thr Ser Ile Met Val Glu Thr Phe Gly Thr Glu Lys305 310 315 320Val Pro Ser Glu Gln Leu Thr Leu Leu Val Arg Glu Phe Phe Asp Leu325 330 335Arg Pro Tyr Gly Leu Ile Gln Met Leu Asp Leu Leu His Pro Ile Tyr340 345 350Lys Glu Thr Ala Ala Tyr Gly His Phe Gly Arg Glu His Phe Pro Trp355 360 365Glu Lys Thr Asp Lys Ala Gln Leu Leu Arg Asp Ala Ala Gly Leu Lys370 375 380(2)序列號15的資料(ⅰ)序列特性(A)長度401個氨基酸(B)類型氨基酸(D)拓?fù)鋵W(xué)線性(ⅱ)分子類型蛋白質(zhì)(ⅹⅰ)序列描述序列號15Met Asn Val Phe Asn Pro Ala Gln Phe Arg Ala Gln Phe Pro Ala Leu1 5 10 15Gln Asp Ala Gly Val Tyr Leu Asp Ser Ala Ala Thr Ala Leu Lys Pro20 25 30Glu Ala Val Val Glu Ala Thr Gln Gln Phe Tyr Ser Leu Ser Ala Gly35 40 45Asn Val His Arg Ser Gln Phe Ala Glu Ala Gln Arg Leu Thr Ala Arg50 55 60Tyr Glu Ala Ala Arg Glu Lys Val Ala Gln Leu Leu Asn Ala Pro Asp65 70 75 80Asp Lys Thr Ile Val Trp Thr Arg Gly Thr Thr Glu Ser Ile Asn Met85 90 95Val Ala Gln Cys Tyr Ala Arg Pro Arg Leu Gln Pro Gly Asp Glu Ile100 105 110Ile Val Ser Val Ala Glu His His Ala Asn Leu Val Pro Trp Leu Met115 120 125Val Ala Gln Gln Thr Gly Ala Lys Val Val Lys Leu Pro Leu Asn Ala130 135 140Gln Arg Leu Pro Asp Val Asp Leu Leu Pro Glu Leu Ile Thr Pro Arg145 150 155 160Ser Arg Ile Leu Ala Leu Gly Gln Met Ser Asn Val Thr Gly Gly Cys165 170 175Pro Asp Leu Ala Arg Ala Ile Thr Phe Ala His Ser Ala Gly Met Val180 185 190Val Met Val Asp Gly Ala Gln Gly Ala Val His Phe Pro Ala Asp Val195 200 205Gln Gln Leu Asp Ile Asp Phe Tyr Ala Phe Ser Gly His Lys Leu Tyr210 215 220Gly Pro Thr Gly Ile Gly Val Leu Tyr Gly Lys Ser Glu Leu Leu Glu225 230 235 240Ala Met Ser Pro Trp Leu Gly Gly Gly Lys Met Val His Glu Val Ser245 250 255Phe Asp Gly Phe Thr Thr Gln Ser Ala Pro Trp Lys Leu Glu Ala Gly260 265 270Thr Pro Asn Val Ala Gly Val Ile Gly Leu Ser Ala Ala Leu Glu Trp275 280 285Leu Ala Asp Tyr Asp Ile Asn Gln Ala Glu Ser Trp Ser Arg Ser Leu290 295 300Ala Thr Leu Ala Glu Asp Ala Leu Ala Lys Arg Pro Gly Phe Arg Ser305 310 315 320Phe Arg Cys Gln Asp Ser Ser Leu Leu Ala Phe Asp Phe Ala Gly Val325 330 335His His Ser Asp Met Val Thr Leu Leu Ala Glu Tyr Gly Ile Ala Leu340 345 350Arg Ala Gly Gln His Cys Ala Gln Pro Leu Leu Ala Glu Leu Gly Val355 360 365Thr Gly Thr Leu Arg Ala Ser Phe Ala Pro Tyr Asn Thr Lys Ser Asp370 375 380Val Asp Ala Leu Val Asn Ala Val Asp Arg Ala Leu Glu Leu Leu Val385 390 395 400Asp氨基酸縮寫Gly甘氨酸;Ala丙氨酸;Val纈氨酸;Leu亮氨酸;Ile異亮氨酸;Pro脯氨酸;phe苯丙氨酸;Tyr酪氨酸;Trp色氨酸;Ser絲氨酸;Thr蘇氨酸;Cys半胱氨酸;Met甲硫氨酸;Asp天門冬氨酸;Glu谷氨酸;Asn天冬酰胺;Gln谷氨酰胺;Lys賴氨酸;Arg精氨酸;His組氨酸。
權(quán)利要求
1.生產(chǎn)生物素的方法,其中具有序列號1的S-腺苷甲硫氨酸合成酶基因和具有序列號3、序列號5和序列號7的生物素生物合成基因bioS1、bioS2或bioS3中的至少一種基因及其它們的變種、類似物或衍生物在能合成生物素的原核或真核宿主生物中表達(dá),培養(yǎng)這種生物,所合成的生物素在從生物量分離后,或在生物素純化后可以直接應(yīng)用。
2.權(quán)利要求1的方法,其中具有序列號1、序列號3、序列號5和序列號7的基因的變體是這樣一些基因從權(quán)利要求1的核苷酸序列推斷的氨基酸水平上,它們顯示30~100%的同源性,并能夠?qū)崿F(xiàn)生物素合成增加。
3.權(quán)利要求1和2中的方法,其中從下列菌株中所選擇的生物用作宿主生物埃希氏桿菌屬、枸櫞酸桿菌屬、沙雷氏菌屬、克雷白桿菌屬,沙門氏菌屬、假單胞菌屬,Comamonas,Acinetobacter,定氮菌屬,色素桿菌屬、芽胞桿菌屬,梭狀芽胞桿菌屬,節(jié)桿菌屬,棒狀桿菌屬,短桿菌屬,乳酸球菌屬,乳酸桿菌屬,鏈霉菌屬,根瘤菌屬,農(nóng)桿菌屬,葡萄球菌屬,紅酵母屬,擲孢酵母屬,Yarrowia,裂殖酵母菌或酵母屬。
4.權(quán)利要求1-3任一的方法,其中一種調(diào)節(jié)缺陷的生物素突變株用作宿主生物。
5.權(quán)利要求1~4之任一的方法,其中如在權(quán)利要求1的具有序列號1、序列號3、序列號5和序列號7的基因的至少一個拷貝在原核的或真核的宿主生物中表達(dá),這種表達(dá)或單獨(dú)進(jìn)行,或與選自bioA、bioB、bioF、bioC、bioD、bioH、bioP、bioW、bioX、bioY或bioR的至少一種生物素基因的一個或多個拷貝一起進(jìn)行。
6.權(quán)利要求1~5之任一個的方法,其中權(quán)利要求1的具有序列號1、序列號3、序列號5和序列號7的基因的至少一個拷貝在原核的或真核的宿主生物中表達(dá),這種表達(dá)或單獨(dú)進(jìn)行,或與在同一載體或不同載體之上,選自bioA、bioB、bioF、bioC、bioD、bioH、bioP、bioW、bioX、bioY或bioR的至少一種生物素基因的一個或多個拷貝一起進(jìn)行。
7.一種基因構(gòu)建物,該基因構(gòu)建物包含具有序列號1的S-腺苷甲硫氨酸合成基因、具有序列號3、序列號5和序列號7的bioS1、bioS2或bioS3三種生物素生物合成基因中至少一種基因,以及這些基因的有功能的變體、類似物或衍生物,以提高基因表達(dá)和/或進(jìn)行有功能的蛋白質(zhì)表達(dá)和/或關(guān)閉這些基因的天然調(diào)節(jié),該基因構(gòu)建物與一種或多種調(diào)節(jié)信號有效連接。
8.權(quán)利要求7的基因構(gòu)建物,該基因構(gòu)建物已被插入適宜于在原核的或真核的宿主生物中表達(dá)該基因的載體。
9.權(quán)利要求7或8的基因構(gòu)建物,其中具有序列號1、序列號3、序列號5和序列號7的諸基因以及它們的有功能的變體,類似物或衍生物在該基因構(gòu)建物中以幾個拷貝存在。
10.權(quán)利要求7~9之一的基因構(gòu)建物,其中具有序列號1的S-腺苷甲硫氨酸合成酶基因,具有序列號3、序列號5和序列號7的bioS1、bioS2或bioS3三種生物素生物合成基因中至少一種基因,以及這些基因的有功能的變體,類似物或衍生物,如權(quán)利要求7中所述,與選自bioA、bioB、bioF、bioC、bioD、bioH、bioP、bioW、bioX、bioY或bioR的至少一種生物素基因的一個或多個拷貝一起,存在于該基因構(gòu)建物或載體中。
11.一種含有權(quán)利要求7~10之一的基因構(gòu)建物的生物。
12.權(quán)利要求1的序列在生產(chǎn)生物素中的用途。
13.具有序列號7的bioS3基因,或其有功能的變體、類似物或衍生物單獨(dú)應(yīng)用于,或與選自S-腺苷甲硫氨酸合成酶基因,bioS1、bioS2、bioA、bioB、bioF、bioC、bioD、bioH、bioP、bioW、bioX、bioY或bioR的至少一種基因聯(lián)合在生產(chǎn)生物素中的用途。
14.權(quán)利要求7~10之一的基因構(gòu)建物在生產(chǎn)生物素中的用途。
全文摘要
本發(fā)明與一種基因構(gòu)建物有關(guān),該基因構(gòu)建物包含下列基因:一種具有序列號1的S-腺苷甲硫氨酸合成酶基因;分別具有序列號3、序列號5和序列號7的生物素生物合成基因bioS1、bioS2和/或bioS3;以及在適當(dāng)場合,至少一種選自bioA、bioB、bioF、bioC、bioD、bioH、bioP、bioW、bioX、bioY或bioR的生物素合成基因序列。此外,本發(fā)明與含有這種基因構(gòu)建物的生物和應(yīng)用這種基團(tuán)構(gòu)建制備生物素有關(guān)。本發(fā)明還與制備生物素的方法有關(guān)。
文檔編號C12N1/15GK1291232SQ99803153
公開日2001年4月11日 申請日期1999年2月17日 優(yōu)先權(quán)日1998年2月19日
發(fā)明者H·施勒德爾 申請人:Basf公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1