專利名稱::生物素生物合成基因Ⅱ的制作方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及利用基因工程有機(jī)體通過發(fā)酵產(chǎn)生生物素的方法。生物素是動(dòng)物、植物和微生物營養(yǎng)的必需維生素之一,而且對(duì)于醫(yī)藥或者是食品添加劑也是十分重要的。充分研究了大腸桿菌的生物素生物合成,并且闡明生物素是從pimelyl輔酶A經(jīng)7-酮基-8-氨基壬酸(KAPA)、7,8-二氨基壬酸(DAPA)和脫硫生物素(DTB)合成的[大腸桿菌和沙門氏菌,細(xì)胞和分子生物學(xué),544,(1987)]。在大腸桿菌[生物化學(xué)雜志,263,19577,(1988)]和圓形芽孢桿菌上(美國專利5096823)和生物素的生物合成相關(guān)的遺傳信息分析已有很好的進(jìn)展。至少知道了這個(gè)生物合成途徑包括的四種酶。這四種酶是由bioA、bioB、bioD和bioF基因編碼。bioF基因編碼催化把pimelyl輔酶A轉(zhuǎn)化為KAPA的KAPA合成酶。bioA基因編碼把KAPA轉(zhuǎn)化成為DAPA的DAPA轉(zhuǎn)氨酶。bioD基因編碼把DAPA轉(zhuǎn)化成為DTB的DTB合成酶。bioB基因編碼把DTB轉(zhuǎn)化成為生物素的生物素合酶。同時(shí)也報(bào)告了在大腸桿菌中參與pimelyl輔酶A合成的bioC和bioH基因。進(jìn)行了許多發(fā)酵產(chǎn)生生物素的研究。利用了大腸桿菌(日本專利公開149091/1986和日本專利公開155081/1987)、圓形芽孢桿菌(日本專利公開180174/1991)、粘質(zhì)沙雷氏菌(日本專利公開27980/1990)和Brevibacteriumflavum(日本專利公開240489/1991)。但是由于它們的生產(chǎn)力低,這些方法還不適合用于工業(yè)生產(chǎn)過程。此外,大量的DTB(生物素前體)在這些細(xì)菌的發(fā)酵中積累。因此,已經(jīng)假定生物素生物合成的最后步驟(從DTB到生物素)是一個(gè)限速步驟。另一方面,發(fā)現(xiàn)屬于庫爾特氏桿菌屬的細(xì)菌菌株產(chǎn)生DBT和少量的生物素。而且通過對(duì)生物素抗代謝物酸酶素(ACM)的抗性、5-(2-噻吩基)-頡草酸(TVA)和α-甲基脫硫生物素(MeDTB)的抗性的選擇,從庫爾特氏桿菌屬的野生型菌株中分離出產(chǎn)生大量生物素的突變體。然而,鑒于仍然低的生物素值,最好是運(yùn)用基因工程提高這種突變體的生物素產(chǎn)量。因此本發(fā)明涉及攜帶和Kurthiasp.生物素生物合成相關(guān)的基因的染色體DNA片段。此分離的染色體DNA片段攜帶bioA,bioB,bioC,bioD,bioF,bioFII,bioH和bioHII等8個(gè)基因和轉(zhuǎn)錄調(diào)節(jié)序列。bioFII基因編碼bioF基因產(chǎn)物的酶。本發(fā)明還涉及Kurthiasp.菌株,其中至少擴(kuò)增了一個(gè)參與生物素生物合成的基因,同時(shí)也涉及通過基因工程Kurthiasp.菌株產(chǎn)生生物素的方法。雖然以上提及的DNA片段可以具有各種起源,但優(yōu)選的是利用屬于庫爾特氏桿菌屬的菌株。這些菌株的特定例子包括,例如,Kurthiasp.538-6(DSM9454)和通過選擇對(duì)生物素抗代謝物的抗性的突變菌株,如Kurthiasp.538-KA26(DSM10609)。一般地說,本發(fā)明針對(duì)編碼以SEDIDNO.2、4、6、8、10、12、14或16為代表的多肽和這些多肽的包含一個(gè)或多個(gè)氨基酸殘基的加成、插入、缺失和/或取代的功能性衍生物的DNA序列,以及包含一個(gè)或多個(gè)這些DNA序列的載體,其中所說的DNA序列和啟動(dòng)子序列功能性地連接。本發(fā)明的另一個(gè)目的是研究由以上所限定的一個(gè)或多個(gè)DNA序列或載體轉(zhuǎn)化的細(xì)胞和產(chǎn)生生物素的方法(包括在培養(yǎng)基中培養(yǎng)以上限定的細(xì)胞和用本領(lǐng)域公知的方法從培養(yǎng)基中分離最后產(chǎn)生的生物素),并且具體地說,這種方法是在pH值5至9,優(yōu)選的是6至8下,于10℃至45℃,優(yōu)選的是25℃至30℃的溫度范圍內(nèi)將培養(yǎng)進(jìn)行1至10天,優(yōu)選的是2至7天。最后本發(fā)明的目的也在于研究制備藥學(xué)、食品或飼料組合物的方法,這種方法的特征在于把通過這些方法獲得的生物素與一種或多種通常使用的添加劑混合,本領(lǐng)域的技術(shù)人員熟知這種方法。分離攜帶編碼參與這些細(xì)菌菌株進(jìn)行生物素生物合成的酶之基因的DNA片段的詳盡的方法在以下的部分進(jìn)行描述。因此通過已知的苯酚法可以把DNA從Kurthiasp.538-KA26提取出來。然后,用SauSAI部分消化這種DNA,并將其連接到用BamHI消化的pBR322;以構(gòu)建一個(gè)Kurthiasp.538-KA26的基因文庫。用以上獲得的基因文庫轉(zhuǎn)化缺乏生物合成能力的生物素營養(yǎng)缺陷型突變體,以產(chǎn)生生物素的,選擇表現(xiàn)為生物素原養(yǎng)型的轉(zhuǎn)化體。在生物素營養(yǎng)缺陷型突變體中選擇的轉(zhuǎn)化體具有基因組的DNA片段(這種DNA片斷補(bǔ)充了缺失的基因)。大腸桿菌R875(bioB-)、R877(bioD)、BM7086(bioH)和R878(bioC)(細(xì)菌學(xué)雜志,112,830-839,(1972),和細(xì)菌學(xué)雜志,143,789-800,(1980))都能用作生物素素營養(yǎng)缺陷型突變體。按照常規(guī)的方法,例如感受態(tài)細(xì)胞法,進(jìn)行這些大腸桿菌菌株的轉(zhuǎn)化[分子克隆,冷泉港實(shí)驗(yàn)室出版社,252,(1982)]。在本發(fā)明中,通過以上所描述的方法獲得了補(bǔ)充大腸桿菌bioB缺失突變體的雜交質(zhì)粒。獲得的雜交質(zhì)粒命名pKB100。pKB100攜帶一個(gè)Kurthiasp.538-KA26的5.58Kb基因組DNA片段的質(zhì)粒pBR322相對(duì)應(yīng),它的限制切割圖譜如圖1和圖2所示。通過以上所述的方法也獲得了命名為pKB200的補(bǔ)充大腸桿菌的bioD缺失突變體的雜交質(zhì)粒。PKB200和Kurthiasp.538-KA26的攜帶一個(gè)7.87Kb基因組DNA片段的質(zhì)粒pBR322相對(duì)應(yīng),它的限制切割圖譜如圖1和圖3所示。pKB200中的基因組DNA片段和pKB100的插入片段完全重疊,并且攜帶4bioF、bioB、bioD、ORF1和ORF2基因和如圖9-A所示的Kurthiasp.538-KA26的一部分bioA基因。通過常規(guī)的方法(如菌落雜交)利用在pKB200中一部分基因組DNA片段作為探針,能夠分離Kurthiasp.538-KA26的整個(gè)bioA基因。用限制性內(nèi)切酶如HindIII消化Kurthiasp.538-KA26的總DNA,并且用相同的限制性內(nèi)切酶切割的質(zhì)粒載體連接。然后,大腸桿菌用攜帶Kurthiasp.538-KA26的基因組DNA片段的雜交質(zhì)粒轉(zhuǎn)化以構(gòu)建基因組文庫。pUC19[TakaraShuzo公司(Higashiira,Higashinotohin,Shimogyo-Mu,Kyoto-shi,日本)]和大腸桿菌JM109(TakaraShuzo公司)都能分別用作載體與大腸桿菌菌株。通過菌落雜交獲得了命名為pKB300的攜帶Kurthiasp.538-KA26的8.44Kb基因組DNA片段的雜交質(zhì)粒,它的限制切割圖譜如圖1所示。在pKB300中的攜帶參與Kurthiasp.538-KA26的生物素生物合成的兩個(gè)基因簇的基因組DNA片段如圖9-A所示。一個(gè)族由ORF1、bioD和bioA基因組成。另一個(gè)族由ORF2、bioF和bioB基因組成。bioD和bioA基因的核苷酸序列分別顯示在SEQIDNO.1和SEQIDNO.3中。推測(cè)的bioD和bioA基因的氨基酸序列產(chǎn)物分別顯示在SEQIDNO.2和SEQIDNO.4中。編碼236個(gè)氨基酸殘基的多肽(分子量為26,642)。bioA基因編碼一個(gè)460個(gè)氨基酸殘基的多肽(分子量為51,731)。ORF1基因編碼一個(gè)194個(gè)氨基酸殘基的多肽(分子量為21,516),但是此基因的產(chǎn)物的生物功能還不清楚。BioF和bioB基因的氨基酸序列分別顯示在SEQIDNO.5和SEQIDNO.7中。推測(cè)的BioF和bioB基因產(chǎn)物的氨基酸序列分別顯示在SEQIDNO.6和SEQIDNO.8中。bioF基因編碼一個(gè)387個(gè)氨基酸殘基的多肽(分子量為42,619)。bioB基因編碼一個(gè)338個(gè)氨基酸殘基的多肽(分子量為37,438)。ORF2基因編碼一個(gè)63個(gè)氨基酸殘基的多肽(分子量為7,447),但是此基因產(chǎn)物的生物功能還不清楚。在bioA和bioB基因的下游發(fā)現(xiàn)作為轉(zhuǎn)錄終止區(qū)信號(hào)的反向重復(fù)序列。發(fā)現(xiàn)在ORF1和ORF2基因之間有兩個(gè)在兩個(gè)方向開始轉(zhuǎn)錄的轉(zhuǎn)錄啟動(dòng)子序列(如圖10所示)。而且,在每種啟動(dòng)子序列和翻譯起始密碼子之間有兩個(gè)命名為Box1和Box2、參與轉(zhuǎn)錄負(fù)調(diào)節(jié)的反向重復(fù)序列。另外,通過以上描述的相同方式得到了補(bǔ)充大腸桿菌生物素營養(yǎng)缺陷型突變體的兩個(gè)雜交質(zhì)粒。命名為pKH100的雜交質(zhì)粒補(bǔ)充bioH缺失突變體,命名為pKC100的雜交質(zhì)粒補(bǔ)體bioC突變體。pKH100(圖4和圖5)有一個(gè)Kurthiasp.538-KA26的1.91Kb的基因組DNA片段,其攜帶在圖9-B中所示的由bioH和ORF3基因組成的的基因簇。bioH基因的核苷酸序列和這種基因產(chǎn)物的推測(cè)的氨基酸序列分別顯示在SEQIDNO.9和SEQIDNO.10中。bioH基因編碼一個(gè)267個(gè)氨基酸殘基的多肽(分子量為29,423)。ORF3基因編碼一個(gè)86個(gè)氨基酸殘基的多肽(分子量為9,995),但是這種基因產(chǎn)物的生物功能還不知道。如圖11所示在bioH基因的上游發(fā)現(xiàn)一個(gè)啟動(dòng)子序列,在ORF3基因的下游有作為轉(zhuǎn)錄終止子的反向重復(fù)序列。因?yàn)樵趩?dòng)子區(qū)域沒有如Box1和Box2的反向重復(fù)序列,所以可以預(yù)見這些基因的表達(dá)是不被調(diào)節(jié)的。另一方面,pKC100攜帶Kurthiasp.538-KA26的6.76Kb基因組DNA片段(如圖6和圖7所示)。在pKC100中的基因組DNA片段攜帶一個(gè)由bioFII、bioHII和bioC基因組成的基因簇,如圖9-C所示。bioHII和bioFII基因分別為bioH和bioF基因編碼酶的基因,因?yàn)閎ioHII和bioFII基因分別補(bǔ)充了大腸桿菌的bioH缺失和bioFII缺失突變體。bioHII、bioFII和bioC基因的核苷酸序列分別顯示在SEQIDNo.11、SEQIDNO.13和SEQIDNO.15中。推測(cè)的bioHII、bioFII和bioC基因產(chǎn)物的氨基酸序列分別顯示在SEQIDNO.12、SEQIDNO.14和SEQIDNO.16中。BioFII基因編碼一個(gè)398個(gè)氨基酸殘基的多肽(分子量為44,776)。BioHII基因編碼一個(gè)248個(gè)氨基酸殘基的多肽(分子量為28,629)。BioC基因編碼一個(gè)276個(gè)氨基酸殘基的多肽(分子量為31,599)。如圖12所示在bioFII基因的上游發(fā)現(xiàn)一個(gè)啟動(dòng)子序列,在啟動(dòng)子區(qū)域有一個(gè)命名為Box3的反向重復(fù)序列上。這些基因的轉(zhuǎn)錄終止在位于bioC基因下游的反向重復(fù)序列,因?yàn)锽ox3的核苷酸序列和Box1和Box2的核苷酸序列非常類似,所以估計(jì)這些基因表達(dá)的調(diào)節(jié)和bioA和bioB基因簇的相同。更不用說,從以上基因分離出的核苷酸序列和氨基酸的序列在某些情況下可以人工改變,例如,起始密碼子GTG或TTG可以轉(zhuǎn)化成為ATG密碼子。因此,本發(fā)明也直接針對(duì)本發(fā)明的多肽的功能性衍生物。在本發(fā)明的氨基酸序列的基礎(chǔ)上通過添加、插入、缺失和/或取代一個(gè)或多個(gè)這些序列的氨基酸殘基來限定這些功能性衍生物(其中的這些衍生物還具有和本發(fā)明的相應(yīng)的多肽相同類型的酶活性)。利用本領(lǐng)域公知的分析方法或本文以下的描述來測(cè)定其活性。也將以通過本領(lǐng)域公知的化學(xué)肽合成方法或在本文所公開的DNA序列基礎(chǔ)上的重組方式(由Sambrook等公開的、本領(lǐng)域?公知的方法)(分子克隆,冷泉港實(shí)驗(yàn)室出版社,紐約,美國,第二版1989)合成這些功能性衍生物。本領(lǐng)域已知在蛋白質(zhì)和多肽中一般不改變?cè)摲肿拥幕钚缘陌被嶙兓?,并且,例如由H.Neurath和R.L.HILL在“蛋白質(zhì)”中描述過(Academix出版社,紐約,1979,尤其參見14頁圖6)。最普遍發(fā)生的變化是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、AZa/Thr、Ser/Asn、AlaNal、Ser/Gly、Thy/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Nal、Ala/Glu和Asp/Gly以及相反的變化。進(jìn)而,本發(fā)明不僅直接針對(duì)于如在序列表中公開的DNA序列以及它們的互補(bǔ)鏈,而且也直接針對(duì)于那些包括以下的序列,即在標(biāo)準(zhǔn)的條件下同以上DNA序列或其片段雜交的DNA序列、和由于遺傳密碼的退化在標(biāo)準(zhǔn)的條件下不能和以上序列雜交但其的確編碼具有相同的氨基酸序列多肽的DNA序列。在此文中雜交的″標(biāo)準(zhǔn)條件″意味著本領(lǐng)域技術(shù)人員檢測(cè)特異性的雜交信號(hào)普遍使用的條件,和如Sambrook等(同上)描述的條件或者優(yōu)選地稱為嚴(yán)格雜交和非嚴(yán)格的洗滌條件或者本領(lǐng)域技術(shù)人員公知的更優(yōu)選地稱為嚴(yán)格雜交和非嚴(yán)格洗滌條件及Sambrook等(同上)描述的條件。源于本發(fā)明的DNA序列,因?yàn)樗鼈兒瓦@些DNA序列(參見上文)雜交或者能通過使用以這些DNA序列為基礎(chǔ)設(shè)計(jì)的引物利用聚合酶鏈反應(yīng)構(gòu)建而成,所以可以通過PCR反應(yīng)以及位點(diǎn)直接誘變[參見Smith,Ann.V.Genet.19,423(1985)]或者如在EP747483中描述的合成方法或者通過Sambrook等(同上)中描述的分子克隆常用的方法來制備。至于用于本發(fā)明的表達(dá)和/或DNA序列擴(kuò)增的宿主菌株,任何微生物都可以利用,例如在EP635572中鑒別出來的,但更優(yōu)選的是利用屬于庫爾特氏桿菌屬的菌株,尤其是Kurthiasp.538-6(DSMNO.9454)4和Kurthiasp.538-51F9(DSMNO.10610)。為了獲得高生物素生產(chǎn)力的轉(zhuǎn)化體,在這些宿主細(xì)胞中有效的啟動(dòng)子控制下利用了本發(fā)明的DNA序列。本發(fā)明的DNA序列能通過攜帶這些DNA序列的質(zhì)粒轉(zhuǎn)化以引入宿主細(xì)胞或者整合到宿主細(xì)胞的染色體上。當(dāng)Kurthiasp.538-51F9用作宿主細(xì)胞時(shí),Kurthiasp.538-51F9可以用從以上Kurthiasp.菌株中分離出來的攜帶至少一個(gè)參與生物素生物合成的基因之雜交質(zhì)粒來轉(zhuǎn)化。至于用作雜交質(zhì)粒的載體質(zhì)粒,pUB110[細(xì)菌學(xué)雜志,154,1184-1194,(1983)]、pHP13(mol.Gen.Genet.,209,335-342,1987)或在Kurthiasp.菌株中其它的包含復(fù)制起點(diǎn)的功能質(zhì)粒都可以使用。至于在Kurthiasp.中用作擴(kuò)增和/或表達(dá)的DNA序列,本發(fā)明的任何DNA序列都能加以利用,但是與編碼生物素合酶的bioB基因相應(yīng)的DNA序列是優(yōu)選的。這種雜交質(zhì)粒的實(shí)施例是在圖14中所示的pYK114。在這種質(zhì)粒中,bioB基因處于bioH基因的啟動(dòng)子調(diào)節(jié)下并且攜帶pUB110的復(fù)制起點(diǎn)??梢岳猛ㄟ^原生質(zhì)體轉(zhuǎn)化方法獲得的以上所述的pYK114轉(zhuǎn)化Kurthiasp.538-51F9[用于芽孢桿菌屬的分子生物方法,150,(1990)]。然而,由于Kurthiasp.538-51F9從原生質(zhì)體的再生效率很低,這種菌株的轉(zhuǎn)化效率十分低。因此,優(yōu)選的是利用具有由原生質(zhì)體再生效率高的菌株,如本發(fā)明的實(shí)施例14中所描述的方法制備的Kurthiasp.538-51F9-RG21。本發(fā)明也提供了通過培養(yǎng)所獲得的轉(zhuǎn)化體、分離和純化產(chǎn)生的生物素來生產(chǎn)生物素的方法。利用本領(lǐng)域公知的方法培養(yǎng)本發(fā)明的轉(zhuǎn)化體??梢岳冒赏奶荚?、可消化的氮源、無機(jī)鹽和其它的轉(zhuǎn)化體的生長所必需的營養(yǎng)的培養(yǎng)基。至于碳源,如葡萄糖、果糖、乳糖、半乳糖、蔗糖、麥芽糖、淀粉、糊精或者甘油都可以使用。至于氮源,如胨、大豆粉、玉米漿、肉膏、銨硫酸鹽、硝酸銨、尿素或者以上各種的混合物都可以使用。并且,至于無機(jī)鹽,硫酸鹽,鹽酸硫胺素或者鈣、鎂、鋅、錳、鈷和鐵的磷酸鹽都可以使用。如果需要的話,可以添加常規(guī)的營養(yǎng)成分或者消泡劑(如動(dòng)物油、植物油或者礦物油)。如果所獲得的轉(zhuǎn)化體具有抗生素抗性標(biāo)記,各自的抗生素應(yīng)該補(bǔ)充到培養(yǎng)基中。培養(yǎng)基的pH值可以在5至9之間,優(yōu)選的為6-8。培養(yǎng)溫度可以是10℃-45℃,優(yōu)選的是25℃-30℃。培養(yǎng)時(shí)間為是1至10天,優(yōu)選地2至7天。通過本領(lǐng)域公知的方法很容易地回收以上所述條件下產(chǎn)生的生物素。因此,例如,在固體材料從溶液中除去之后,把在濾液中的生物素吸附在活性碳上,然后洗脫,用離子交換樹脂進(jìn)一步純化。另外,把濾液直接用離子交換樹脂純化,在洗脫之后,把所要求的產(chǎn)物從酒精和水的混合物中重結(jié)晶出來。在引用下面的實(shí)施例詳細(xì)地解釋本發(fā)明之前,給出附圖的簡要描述圖.1pKB100、pKB200和PKB300的限制性圖譜。圖.2pKB100的結(jié)構(gòu)。圖.3pKB200的結(jié)構(gòu)。圖.4pKH100、pKH101和pKH102的限制性圖譜和互補(bǔ)結(jié)果。圖.5pKH100的結(jié)構(gòu)。圖.6pKC100、pKC101和pKC102的限制性圖譜。圖.7pKC100的結(jié)構(gòu)。圖.8由pKB100、pKB200和pKB300衍生的質(zhì)粒的結(jié)構(gòu)。圖.9參與Kurthiasp.538-KA26生物素生物合成的基因簇基因結(jié)構(gòu)。圖.10Kurthiasp.538-KA26中ORF1和ORF2基因之間的核苷酸序列。圖.11bioH基因簇啟動(dòng)子區(qū)的核苷酸序列。圖.12bioFII基因簇啟動(dòng)子區(qū)的核苷酸序列。圖.13穿梭載體pYK1的構(gòu)建體。圖.14bioB表達(dá)質(zhì)粒pYK114的構(gòu)建體。實(shí)施例實(shí)施例1克隆Kurthiasp.538-KA26的bioB和bioF基因。1.基因組文庫的制備。把Kurthiasp.538-KA26(DSMNO.10609)的酸霉素抗性菌株培養(yǎng)在100ml的營養(yǎng)肉湯中(KyokutoSeiyakuCO;Honcho31,Nihonbashi,Chuoh-Ku,東京,日本),在30℃培養(yǎng)過夜,通過離心回收細(xì)菌細(xì)胞。利用酚提取法[基因熔合試驗(yàn),冷泉港實(shí)驗(yàn)室,137-138,(1984)]從細(xì)菌細(xì)胞提取總DNA,獲得了1.9mg的總DNA。將總DNA(10μg)用1.2單位的SauSAI在37℃下部分地消化1小時(shí)以產(chǎn)生大約10kb長的片段。通過凝膠電泳獲得了5-15KbDNA片段。將載體pBR322(TakaraShuzo公司)用BamHI完全消化,然后利用堿性磷酸酶處理以避免自身連接。利用DNA連接試劑盒(TakaraShuzo公司)按照廠商的說明,用切割的pBR322連接DNA片段。利用感受態(tài)細(xì)胞法[分子克隆,冷泉港實(shí)驗(yàn)室,252-253,(1982)]把連接混合物轉(zhuǎn)移到大腸桿菌JM109(TakaraShuzo公司)中,在瓊脂平面LB培養(yǎng)基(1%Bacto-胰胨、0.5%Bacto-酵母抽提物、0.5%NaCl、pH7.5)上選擇對(duì)氨芐青霉素(100μg/ml)具有抗性的菌株。大約獲得了5000個(gè)具有基因組DNA片段的克隆體,把它們作為基因文庫。把Kurthiasp.538-KA26的基因組文庫中氨芐青霉素抗性的菌株,在包含100μg/ml氨芐青霉素的50mlLB培養(yǎng)基中37℃培養(yǎng)過夜,通過離心收集細(xì)菌細(xì)胞。利用堿變性方法[分子克隆,冷泉港實(shí)驗(yàn)室,90-91,(1982)]從細(xì)菌細(xì)胞中提取質(zhì)粒DNA。2.從基因文庫選擇攜帶bioB基因的克隆。利用感受態(tài)細(xì)胞法把質(zhì)粒DNA轉(zhuǎn)移到大腸桿菌的沒有生物素合成酶活性的bioB缺失突變體R875(J.Bacteriol.112,830-839,1972)。轉(zhuǎn)化的大腸桿菌R875細(xì)胞用0.85%NaCl洗滌兩次,并且平板接種在含有100μg/ml氨芐青霉素的100M9CT培養(yǎng)基(0.6%NaH2PO4、0.3%KH2PO4、0.1%NH4Cl、2mMMgSO4、0.1mMCaCl2、0.2%葡萄糖、0.6%無維生素的酪蛋白氨基酸、1μg/mlthiamin)中,把此平板在37℃下培養(yǎng)40小時(shí)。獲得了具有生物素原養(yǎng)型表型的轉(zhuǎn)化體。把轉(zhuǎn)化體培養(yǎng)在含有100μg/ml氨芐青霉素的LB培養(yǎng)基上,從細(xì)胞中提取雜交質(zhì)粒。此雜交質(zhì)粒攜帶5.58Kb的插入片斷,并命名為pKB100。限制性圖譜如圖1和圖2所示。3.用pKB100補(bǔ)充大腸桿菌生物素缺失突變體。利用感受態(tài)細(xì)胞法把pKB100轉(zhuǎn)移到大腸桿菌R875(bioB-)、W602(bioA-)、R878(bioC-)、R877(bioD-)、R874(bioF-)或BM7086(bioH-)[細(xì)菌學(xué)雜志,112,830-839,(1972),和細(xì)菌學(xué)雜志,143,789-800,(1980)]的生物素缺失突變體中。轉(zhuǎn)化的突變體用0.85%NaCl洗滌三次,并在包含100μg/ml氨芐青霉素和0.1ng/ml生物素的M9CT瓊脂培養(yǎng)基中平板接種,把平板在37℃培養(yǎng)過夜。把平板上的菌落復(fù)制在具有100μg/ml氨芐青霉素、存在或缺乏0.1ng/ml生物素的M9CT瓊脂平板中,把平板在37℃培養(yǎng)24小時(shí)以完成互補(bǔ)作用分析。如表1所示,pKB100不僅能補(bǔ)充bioB突變體,而且能補(bǔ)充bioF突變體。相反,bioA、bioC、bioD和bioH突變體不能由pKB100補(bǔ)充。從這個(gè)結(jié)果中可以確認(rèn)pKB100攜帶Kurthiasp.538-KA26的bioB和bioF基因。表1</tables></tables>實(shí)施例2攜帶Kurthiasp.538-KA26的bioD基因的雜交質(zhì)粒之分離。1.攜帶bioD基因的雜交質(zhì)粒之分離。把實(shí)施例1-1中的Kurthiasp.538-KA26的基因文庫轉(zhuǎn)移到大腸桿菌bioD缺失突變體R877中,以和實(shí)施例1-2中所描述的相同方式選擇具有氨芐青霉素抗性和生物素原養(yǎng)型表型的轉(zhuǎn)化體。把轉(zhuǎn)化體在具有100μg/ml氨芐青霉素的LB培養(yǎng)基中37℃下培養(yǎng)過夜。然后通過離心收集細(xì)菌細(xì)胞。利用堿變性方法從細(xì)胞中提取質(zhì)粒DNA。雜交質(zhì)粒具有7.87Kb插入DNA片段,把它命名為pKB200。利用各種限制性核酸內(nèi)切酶(HindIII、NcoI、EcoRI、BglII、SalI和PstI)分析pKB200的切割模型,并把它和pKB100的相比較。限制性核酸內(nèi)切酶分析表明兩個(gè)雜交質(zhì)粒有完全相同的切割位點(diǎn),并且1.5KbDNA片段延伸到pKB100左側(cè),0.8Kb片段延伸到pKB200的右側(cè)(圖1和圖3)。2.用pKB200補(bǔ)充大腸桿菌生物素缺失突變體。把pKB200轉(zhuǎn)移到大腸桿菌R875(bioB-)、W602(bioA-)、R878(bioC-)、R877(bioD-)、R874(bioF-)或BM7086(bioH-)的生物素缺失突變體中。利用實(shí)施例1-3中所描述的方法進(jìn)行互補(bǔ)作用分析。pKB200補(bǔ)充bioD和bioB突變體,但是不能補(bǔ)充bioA、bioC、bioF和bioH突變體。盡管pKB200在整個(gè)長度的pKB100上重疊,但是它不能補(bǔ)充bioF突變體。實(shí)施例3攜帶Kurthiasp.538-KA26bioH基因的雜交質(zhì)粒的分離。1.攜帶bioH基因的雜交質(zhì)粒之分離。把實(shí)施例1-1中的Kurthiasp.538-KA26的基因文庫轉(zhuǎn)移到大腸桿菌bioH缺失突變體BM7086中,以和實(shí)施例1-2中所描述的相同方式選擇具有bioH克隆的轉(zhuǎn)化體,利用堿變性方法從轉(zhuǎn)化體細(xì)胞中提取雜交質(zhì)粒,并利用限制性核酸內(nèi)切酶分析雜交質(zhì)粒。雜交質(zhì)粒具有1.91Kb的插入DNA片段,把它命名為pKH100。由于以上所利用的基因文庫具有5-15Kb基因組DNA片段,所以可以認(rèn)為在大腸桿菌菌株中pKH100易受到修飾(如缺失)。pKH100的限制性圖譜如圖4和圖5所示。pKH100的斷裂模式與pKB100和pKB200斷裂模式是完全不同的。因此,pKH100攜帶了不同于pKB100和pKB200的Kurthia染色體的DNA片段。2.用pKB200補(bǔ)充大腸桿菌的生物素缺失突變體。利用實(shí)施例1-3中所描述的方法進(jìn)行互補(bǔ)作用分析。把pKH100轉(zhuǎn)移到大腸桿菌R875(bioB-)、W602(bioA-)、R878(bioC-)、R877(bioD-)、R874(bioF-)或BM7086(bioH-)的生物素缺失突變體中。pKH200只補(bǔ)充bioH和bioB突變體,但是不能補(bǔ)充bioB、bioA、bioC、bioD和bioF突變體(如表1所示)。這樣,pKH100只攜帶了bioH基因。實(shí)施例4攜帶Kurthiasp.538-KA26bioC基因的雜交質(zhì)粒的分離。1.攜帶bioC基因的雜交質(zhì)粒的分離。把實(shí)施例1-1中的Kurthiasp.538-KA26的基因文庫轉(zhuǎn)移到大腸桿菌bioD缺失突變體R878中,以和實(shí)施例1-2中所描述的相同的方式選擇生物素原養(yǎng)型的、具有bioC克隆的轉(zhuǎn)化體,利用堿變性方法從轉(zhuǎn)化體細(xì)胞中提取雜交質(zhì)粒,并利用限制性核酸內(nèi)切酶分析雜交質(zhì)粒。雜交質(zhì)粒具有一個(gè)6.76Kb的插入DNA片段,把它命名為pKC100。pKC100的限制性圖譜如圖6和圖7所示。pKC100的斷裂模式與pKB100、pKB200和pKH100的斷裂模式是完全不同的。因此,pKC100攜帶了不同于pKB100、pKB100和pKH100的Kurthia染色體區(qū)域。2.用pKC100補(bǔ)充大腸桿菌的生物素缺失突變體。利用實(shí)施例1-3中所描述的方法進(jìn)行互補(bǔ)作用分析。把pKC100轉(zhuǎn)移到大腸桿菌R875(bioB-)、W602(bioA-)、R878(bioC-)、R877(bioD-)、R874(bioF-)或BM7086(bioH-)的生物素缺失突變體中。PKC100補(bǔ)充如表1所示的bioC、bioF和bioH突變體。由于在pKC100中插入的DNA片段不同于pKB100和pKH100中的插入片斷,所以pKC100不僅攜帶了bioC基因,而且攜帶了bioF基因產(chǎn)物(KAPA合成酶)和bioH基因產(chǎn)物的同工酶基因。實(shí)施例5攜帶Kurthiasp.538-KA26bioA基因的雜交質(zhì)粒的分離。1.pKB200中染色體DNA左區(qū)的分離。通過雜交方法,我們從Kurthiasp.538-KA26染色體DNA中分離出pKB200的染色體DNA左區(qū)。Kurthiasp.538-KA26的總DNA用HindIII完全消化并且進(jìn)行瓊脂糖凝膠電泳。在凝膠上的DNA片段變性后按照廠商介紹的方法轉(zhuǎn)移到尼龍膜(Hybond-N,Amersham)上。用NcoI完全消化pKB200,通過瓊脂糖凝膠電泳分離出2.1Kb的NcoI片段(圖1)。通過多引物DNA標(biāo)記系統(tǒng)(Amersham)用32P標(biāo)記NcoI片段并且把它作為雜交探針。利用“快速雜交緩沖液”(Amersham)按照廠商的說明在上面制備的膜上進(jìn)行雜交。探針同大約8.5Kb的HindIII片段強(qiáng)烈雜交。為了分離出8.5Kb的片段,整個(gè)Kurthiasp.538-KA26的DNA用HindLII完全消化,通過瓊脂糖凝膠電泳獲得7.5-9.5Kb的DNA片段。pUC19(TakaraShuzo公司)載體質(zhì)粒用HindIII完全消化,并且用堿性磷酸酶處理以免自身連接。7.5-9.5KbDNA片段用切開的pUC19通過DNA連接試劑盒(TakaraShuzo公司)連接,利用感受態(tài)細(xì)胞法把反應(yīng)混合物轉(zhuǎn)移到大腸桿菌JM109中。獲得大約1,000個(gè)攜帶這些基因組DNA片段的單獨(dú)克隆體,并把它作為基因文庫。按照Maniatis等描述的方案利用菌落雜交的方法進(jìn)行選擇[分子克隆,冷泉港實(shí)驗(yàn)室,312-328,(1982)]。在瓊脂平板上生長的菌落轉(zhuǎn)移到尼龍膜上(Hybond-N,Amersham),并用堿裂解。變性的DNA固定在膜上。把以上描述制備的32P標(biāo)記的NcoI片段作為雜交探針,利用“快速雜交緩沖液”(Amersham)按照廠商的說明進(jìn)行雜交。獲得和探針DNA雜交的三個(gè)菌落,用堿變性方法提取這些菌落中的雜交質(zhì)粒。利用限制性內(nèi)切酶(BamHI、HindIII、NcoI、EcoRI、BglII、SalI和PstI)進(jìn)行結(jié)構(gòu)分析。所有三個(gè)雜交質(zhì)粒都有8.44Kb插入的DNA片段,三個(gè)雜交質(zhì)粒都具有完全相同的斷裂模式。這些結(jié)果表明它們是相同的。這個(gè)雜交質(zhì)粒命名為pKB300。pKB300的限制性圖譜如圖1所示。在pKB300中大約一半長度的基因組DNA片段和pKB200的重疊。2.用pKB300補(bǔ)充大腸桿菌的bioA缺失突變體。利用實(shí)施例1-3中所描述的方法對(duì)帶有pKB300的大腸桿菌W602(bioA-)進(jìn)行互補(bǔ)作用分析。由于pKB3100補(bǔ)充bioA突變體(表1),所以pKB300攜帶了Kurthiasp.的bioA基因。實(shí)施例6Kurthiasp.538-KA26的bioA、B、D和F基因的亞克隆。1.雜交質(zhì)粒pKB103和pKB104的構(gòu)建。用HindIII完全消化pKB100,分離出一個(gè)3.3Kb的HindIII片段。把3.3Kb片段通過DNA連接試劑盒連接到用HindIII切開的載體pUC18(TakaraShuzo公司)上以構(gòu)建雜交質(zhì)粒pKB103和pKB104。在pKB103和pKB104中,把3.3Kb片段相對(duì)于pUC18乳糖基因的啟動(dòng)子-操縱基因以兩個(gè)方向插入。它們的限制性圖譜如圖8所示。利用實(shí)施例1-3中所描述的相同方法用pKB103和pKB104進(jìn)行大腸桿菌(R875或R874)互補(bǔ)作用分析。pKB103和pKB104補(bǔ)充bioB和bioF突變體(表2)。2.pKB200衍生物的構(gòu)建。由于pKB200補(bǔ)充bioD突變體,并覆蓋攜帶bioB和bioF基因之全長的pKB100,構(gòu)建了pKB200的一系列缺失突變體以精確定位bioB、bioD和bioF。把pKB200的4.0Kb的SalI-HindIII片段插入到pUC18和pUC19的SalI和HindIII位點(diǎn)以得到pKB221和pKB222,在pKB221和pKB222中SalI-HindIII片段以兩種方向存在。用NruI完全消化pKB200,通過瓊脂糖凝膠電泳分離出一個(gè)7.5Kb的NruI片段,利用DNA連接試劑盒重新環(huán)化此NruI片段。用NruI完全消化pKB200,通過凝膠電泳分離出一個(gè)4.8Kb的NruI片段并把它在兩個(gè)方向上克隆到pUC18的HindIII位點(diǎn)中以產(chǎn)生pKB224和pKB225。用NcoI部分消化pKB200,通過瓊脂糖凝膠電泳分離出一個(gè)3.1Kb的NcoI片段,利用DNA聚合酶I(TakaraShuzo公司)克列諾片段使NcoI片段的末端成為平端并且和HindIII接頭(TakaraShuzo公司)連接。利用HindIII處理得到3.1Kb的HindIII片段并且把它在兩個(gè)方向上克隆到pUC1S的HindIII位點(diǎn)上,從而得到pKB228和pKB229。以相同的方式,通過用克列諾片段處理pKB200的2.1KbNcoI片段的兩個(gè)末端并附加HindIII接頭,將該片斷轉(zhuǎn)移到HindIII位點(diǎn)上。然后把獲得的HindIII片段在兩個(gè)方向插入到pUC19的HindIII位點(diǎn)中,從而得到pKB230和pKB231。通過把pKB230的1.6KbHindIII-NruI片段分別插入到pUC19和pUC18的HindIII和SmaI位點(diǎn)中,產(chǎn)生pKB234和pKB235。pKB200衍生物的限性圖譜如圖8所示3.用pKB200衍生物對(duì)大腸桿菌的生物素缺失突變體的互補(bǔ)作用分析。利用實(shí)施例1-3中描述的相同方式用pKB200衍生物進(jìn)行互補(bǔ)作用分析。表2總結(jié)了把互補(bǔ)作用結(jié)果。bioB缺失突變體由pKB221、pKB222、pKB224和pKB225補(bǔ)充,但不能由pKB223、pKB228、pIB229、pKB230、pKB231、pKB234和pKB235補(bǔ)充。bioF缺失突變體能由pKB223、pKB224、pKB225、pKB228和pKB229補(bǔ)充,但不能由pKB221、pKB222、pKB230、pKB231、pKB234和pKB235補(bǔ)充。另一方面,bioD缺失突變體能由pKB223、pKB224和pKB225補(bǔ)充,但不能由KB221和pKB222補(bǔ)充。連同pKB103和pKB104的互補(bǔ)作用分析,這些結(jié)果表明bioF基因存在于pKB103的第一個(gè)NruI位點(diǎn)左邊,而bioB基因定位在左側(cè)帶有短重疊區(qū)的相同NruL位點(diǎn)上,結(jié)果還表明bioD基因存在于pKB200左邊至多1.5個(gè)Kb的區(qū)域中,這樣,pKB100和pKB200的各種衍生物的互補(bǔ)作用結(jié)果表明bioD、bioF和bioB基因依次位于pKB200的HindIII位點(diǎn)左邊的4.4Kb區(qū)域中。4.雜交質(zhì)粒pKB361的構(gòu)建。為確定bioA基因的位置,構(gòu)建了pKB300的衍生物。通過把一個(gè)pKB300的2.8KbBamHI-SalI片段插入到pUC19的BamHI和SalI位點(diǎn)中產(chǎn)生pKB361(圖8)。把pKB361轉(zhuǎn)移到大腸桿菌(W602)的bioA缺失突變體中,利用實(shí)施例1-3中描述的相同的方式進(jìn)行互補(bǔ)作用分析。bioA突變體能由pKB361補(bǔ)充,這表明bioA基因位于pKB300的BamHI和SaLI位點(diǎn)之間的2.8Kb區(qū)域內(nèi)。表2</tables>實(shí)施例7Kurthiasp.538-KA26的bioH基因的亞克隆。1.雜交質(zhì)粒pKH101和pKH102的構(gòu)建。用BamHI完全消化pKH100,利用DNA連接試劑盒重新環(huán)化以產(chǎn)生從pKH100中缺失了0.75KbBamHI片段的pKH101(圖4)。在pKH100中,通過用HindIII處理接著用DNA連接試劑盒重新環(huán)化構(gòu)建pKH102。pKH10缺乏pKH100的1.07KbHindIII片段(圖4)。利用實(shí)施例1-3中所描述的方法用pKH101和pKH102對(duì)大腸桿菌bioH突變體(R878)進(jìn)行互補(bǔ)作用分析。pKH101補(bǔ)充bioH突變體,但pKH102不能(圖4)。結(jié)果表明bioH基因位于pKH100的BamHI位點(diǎn)的左邊區(qū)域(1.16Kb)。實(shí)施例8Kurthiasp.538-KA26的bioC基因的亞克隆。用BamHI完全消化pKC100,通過凝膠電泳分離出1.81KbBamHI片段。把BamHI片段連接到經(jīng)DNA連接試劑盒用BamHI和克列諾片段處理的pBR322中。最后,得到了以兩個(gè)方向插入的BamHI片段的pKC101和pKC102(圖6)。把pKC101和pKC102轉(zhuǎn)化到大腸桿菌bioC突變體R878中,以與實(shí)施例1-3中相同的方式進(jìn)行互補(bǔ)作用分析。bioC突變體與pKC101和pKC102互補(bǔ),因此確認(rèn)bioC基因,位于1.81KbBamHI片段中。實(shí)施例9在pKB100、pKB200和pKB300上插入的DNA片段的核苷酸序列。為了分析pKB100、pKB200和pKB300的插入的DNA片段的核苷酸序列,重復(fù)相互的若干subclones利用pUC18、pUC19、M13mp18和M13mp19(TakaraShuzo公司)構(gòu)建了一些相互重疊的亞克隆,并且利用Kilo-測(cè)序缺失試劑盒(TakaraShuzo公司)獲得了一系列亞克隆缺失衍生物。然后,利用雙脫氧鏈終止法進(jìn)行缺失衍生物的核苷酸序列分析(利用7-deaza-dGTP測(cè)序酶版2.0DNA測(cè)序試劑盒,美國生物化學(xué)公司)。利用軟件開發(fā)公司的計(jì)算機(jī)程序(GENETYX)分析結(jié)果。這種序列的計(jì)算機(jī)分析揭示了克隆的DNA片段有能力編碼六種開放讀框(ORF)。這種基因操縱子有進(jìn)行雙向編碼的兩個(gè)基因簇(圖9-A)。在左邊基因簇中的第一個(gè)ORF開始于TTG密碼子(之前是和圓形芽孢桿菌16SrRNA的3′末端同源的核糖體結(jié)合位點(diǎn)(RBS)),且編碼具有21,516分子量的194個(gè)氨基酸殘基的蛋白質(zhì)。不可能通過互補(bǔ)作用分析來確定基因產(chǎn)物的功能,因此,這個(gè)ORF命名為ORF1。在左邊基因簇中的第二個(gè)ORF核苷酸序列如SEQIDNO.1所示。此基因編碼一個(gè)分子量為26,642,具有236個(gè)氨基酸殘基的蛋白質(zhì)。這種基因產(chǎn)物推測(cè)的氨基酸序列在SEQIDNO.2中所示。在ATG起始密碼子的上游發(fā)現(xiàn)推定的RBS。互補(bǔ)作用分析(實(shí)施例6-3)表明此ORF是bioD基因。在左邊基因簇的第三ORF具有推定的ATG起始密碼子上游RBS,這個(gè)基因的核苷酸序列如SEQIDNO.3所示。此基因編碼分子量為51,731具有460個(gè)氨基酸殘基的蛋白質(zhì)。這種基因產(chǎn)物推測(cè)的氨基酸序列在SEQIDNO.4中所示。確認(rèn)此ORF與bioA基因(實(shí)施例6-3)相對(duì)應(yīng)。發(fā)現(xiàn)反向重復(fù)序列位于終止密碼子大約3bp的下游。這種結(jié)構(gòu)可能作為一個(gè)轉(zhuǎn)錄終止區(qū)。在右邊基因簇中的第一個(gè)ORF(命名為ORF2)開始于ATG密碼子,前面是推定的RBS。此基因產(chǎn)物是由63個(gè)氨基酸殘基組成的蛋白質(zhì),其計(jì)算的分子量為7,447。我們不能通過互補(bǔ)作用分析和氨基酸序列同源搜索來鑒別這種基因產(chǎn)物的功能。因此,此ORF命名為ORF2。在右邊基因簇中的第二個(gè)ORF的核苷酸序列如在SEQIDNO.5中所示。此這基因中有三個(gè)潛在的ATG起始密碼子,其分別于第一個(gè)、第二十五個(gè)和第三十二個(gè)氨基酸殘基相對(duì)應(yīng)?;パa(bǔ)作用分析(實(shí)施例6-3)表明此ORF和bioF基因相對(duì)應(yīng)。這種基因產(chǎn)物推測(cè)的氨基酸序列在SEQIDNO.6中所示。推測(cè)的具有387個(gè)氨基酸殘基蛋白質(zhì)的分子量經(jīng)計(jì)算為42,619,其開始于第一個(gè)起始密碼子。在右邊基因簇中的第三個(gè)ORF的核苷酸序列如SEQIDNO.7中所示。此基因有三個(gè)潛在的ATG起始密碼子、兩個(gè)ATG密碼子(第一個(gè)和第十八個(gè)氨基酸殘基)和一個(gè)GTG密碼子(第十二個(gè)氨基酸殘基)。這種基因產(chǎn)物推測(cè)的氨基酸序列如SEQIDNO.8中所示。推測(cè)的具有338個(gè)氨基酸殘基的從第一起始密碼子翻譯的蛋白質(zhì)分子量經(jīng)計(jì)算為37,438。互補(bǔ)作用分析(實(shí)施例6-3)表明此ORF和bioB基因相對(duì)應(yīng)。終止密碼子16bp下游的反向重復(fù)序列的存在表明其具有轉(zhuǎn)錄終止區(qū)的性質(zhì)。有兩個(gè)可能的啟動(dòng)子序列面對(duì)面地形成ORF1和ORF2之間的啟動(dòng)子,如SEQIDNO.10中所示。轉(zhuǎn)錄向左進(jìn)行進(jìn)入到ORF1、bioD和bioA基因簇,向右進(jìn)入到ORF2、bioF和bioB基因簇。此外,兩個(gè)轉(zhuǎn)錄終止區(qū)定位在bioA和bioB基因的終止密碼子的下游。因此,在兩個(gè)方向中的轉(zhuǎn)錄產(chǎn)生兩個(gè)不同的mRNA。我們發(fā)現(xiàn)反向重復(fù)序列的兩個(gè)組分(Box1和Box2)位于ORF1和ORF2基因的開始位點(diǎn)之間(圖10)。Box1和Box2的所有的同源部分是82.5%。,比較Box1或Box2與大腸桿菌生物素操縱子[自然,276,689-694,(1978)]的操縱區(qū),表明具有高水平的保守性(它們有54.6%的同源性)。大腸桿菌的生物素操縱區(qū)的反向重復(fù)序列之間的相似性表明Box1和Box1一定通過生物素參與生物素合成的負(fù)調(diào)節(jié)。實(shí)施例10pKH100插入的DNA片段之核苷酸序列。以實(shí)施例9中描述同樣的方式對(duì)pKH100的插入DNA片段之核苷酸序列進(jìn)行分析。在插入的DNA片段上發(fā)現(xiàn)一個(gè)包含兩個(gè)ORFs的基因簇(圖9-B)。此外,已經(jīng)證明了一部分載體質(zhì)粒pBR322和插入的DNA片段缺失了。在SEQIDNO.中所示的第ORF編碼一個(gè)267個(gè)氨基酸殘基、計(jì)算的分子量為29,423的蛋白質(zhì)。推測(cè)的這種基因產(chǎn)物的氨基酸序列如SEQIDNO.10所示。一個(gè)推定的RBS定位在ATG起始密碼子6bp上游。如實(shí)施例7所示,互補(bǔ)作用分析表明此ORF和bioH基因相對(duì)應(yīng)。在bioH基因的下游發(fā)現(xiàn)帶有潛在RBS的第二個(gè)ORF。此ORF編碼一個(gè)86個(gè)氨基酸殘基分子量為9,955的蛋白質(zhì)。這個(gè)由ORF編碼的蛋白質(zhì)與大腸桿菌和圓形芽孢桿菌的生物素基因產(chǎn)物沒有同源性。把這個(gè)ORF命名為ORF3。如圖11中所示,在bioH基因的起始密碼子的上游發(fā)現(xiàn)一種可能的啟動(dòng)子序列。由于在bioH基因的5′非編碼區(qū)沒有發(fā)現(xiàn)如Box1和Box2的反向重復(fù)序列,所以這個(gè)基因簇的轉(zhuǎn)錄一定不受調(diào)節(jié)。此外,有一個(gè)反向重復(fù)序列和ORF3的終止密碼子相重疊。由于這種結(jié)構(gòu)能作為轉(zhuǎn)錄終止區(qū),所以推定的bioH啟動(dòng)子將允許bioH和ORF3基因的轉(zhuǎn)錄。實(shí)施例11pKC100的插入DNA片段的核苷酸序列。用在實(shí)施例9中描述的相同方式對(duì)pKC100插入的DNA片段之核苷酸序列進(jìn)行分析。在插入的DNA片段上發(fā)現(xiàn)由三個(gè)ORF組成的基因簇(圖9-C)。第三個(gè)ORF具有起始密碼子的推定的RBS上游,這個(gè)基因的核苷酸序列如SEQIDNO.15所示。此基因編碼一個(gè)有276個(gè)氨基酸殘基、計(jì)算分子量為31,599的蛋白質(zhì)。推測(cè)的這種基因產(chǎn)物的氨基酸序列如SEQIDNO.16所示。在實(shí)施例8中所示的互補(bǔ)作用分析表明這個(gè)ORF與bioC基因相對(duì)應(yīng)。在SEQIDNO.11所示的第一個(gè)ORF編碼一個(gè)分子量為44,776具有398個(gè)氨基酸殘基的蛋白質(zhì)。推定的RBS定位在起始密碼子的上游。在SEQIDNO.12中顯示的此推測(cè)的基因產(chǎn)物的氨基酸序列和實(shí)施例9中的Kurthiasp.538-KA26的bioF基因產(chǎn)物的氨基酸序列有43.0%同源性。此外,pKC100補(bǔ)充實(shí)施例4所示的大腸桿菌bioF突變體。因此,結(jié)論認(rèn)為這個(gè)ORF為bioF基因產(chǎn)物的同工酶的基因,即KAPA合成酶。因此,把這個(gè)ORF命名為bioFII基因。在SEQIDNO.13所示的第二個(gè)ORF3具有起始密碼子的上游推定的RBS。此基因編碼分子量為28,629的具有248氨基酸殘基的蛋白質(zhì)。在SEQIDNO.14中所示的此基因產(chǎn)物的推測(cè)的氨基酸序列和在實(shí)施例10中Kurthiasp.538-KA26的bioH基因產(chǎn)物的氨基酸序列有24.2%同源性。在實(shí)施例4中所示,pKC100也補(bǔ)充大腸桿菌bioH突變體。這些結(jié)果表明此ORF是bioH基因產(chǎn)物的同工酶基因,因此,此ORF命名為bioHII基因。在圖12中所示的bioFII基因的起始密碼子上游發(fā)現(xiàn)一種可能的啟動(dòng)子序列。反向重復(fù)序列定位在啟動(dòng)子序列和bioFII基因的RBS之間。把此命名為Box3的這個(gè)反向重復(fù)序列與定位在ORF1和ORF2基因之間的Box1和Box2相比較(實(shí)施例9)。Box1、Box2和Box3互相之間特別類似(Box1和Box3具有80.0%同源性,Box2和Box3有77.5%同源性)。因此,bioC基因簇一定受和bioA簇及bioB簇相同的負(fù)控制調(diào)節(jié)。此外,在bioC基因的終止密碼子下游具有的一個(gè)254bp的反向重復(fù)序列。認(rèn)為這種結(jié)構(gòu)是作為轉(zhuǎn)錄終止區(qū)。實(shí)施例12大腸桿菌和Kurthiasp.菌株穿梭載體的構(gòu)建。利用圖13所示的方法構(gòu)建了大腸桿菌和Kurthiasp.的穿梭載體。用EcoRI和PvuII完全消化金黃色葡萄球菌質(zhì)粒pUB110(芽孢桿菌屬基因貯存中心;俄亥俄州立大學(xué),生物化學(xué)部,484西十二大街,哥倫布,俄亥俄,43210,美國)。利用瓊脂糖凝膠電泳分離出一個(gè)包含Kurthiasp.的復(fù)制起點(diǎn)和卡那霉素抗性基因的3.5KbEcoRI-PvuII片段。用EcoRI和DraI完全消化pUC19,同時(shí)通過瓊脂糖凝膠電泳分離出具有大腸桿菌的復(fù)制起點(diǎn)的1.2KbEcoRI-DraI片段。然后,把這些片段利用DNA連接試劑盒進(jìn)行連接以產(chǎn)生穿梭載體pYK1。pYK1能在大腸桿菌和Kurthiasp.中復(fù)制,由pYK1轉(zhuǎn)化的大腸桿菌或Kurthiasp.表現(xiàn)為卡那霉素抗性。實(shí)施例13Kurthiasp.的bioB基因的表達(dá)質(zhì)粒構(gòu)建。通過圖14所示的方法構(gòu)建了pYK114(其中KurthiabioH基因啟動(dòng)子的下游插入了KurthiabioB基因)。用BanII完全消化實(shí)施例7的pKH101,利用DNA聚合酶的克列諾片段使BanII片段的末端成為平端。然后,BanII片段用EcoRI處理,通過瓊脂糖凝膠電泳分離出包含bioH啟動(dòng)子的0.6KbEcoRI平端片段。用KpnI完全消化實(shí)施例6中的pKB104,通過利用克列諾片段處理將KpnI末端轉(zhuǎn)化成平端。在用HindIII消化之后,通過瓊脂糖電泳分離出1.3Kb攜帶bioB基因的平端HindIII片段。利用EcoRI和HindIII消化的pYK1連接平端EcoRI和平端HindIII片段以構(gòu)建pYK114。bioB基因在pYK114的bioH啟動(dòng)子控制下進(jìn)行結(jié)構(gòu)表達(dá)。實(shí)施例14分離具有高轉(zhuǎn)化效率的Kurthiasp.538-51F9的衍生菌株。在28℃50mlTripticase大豆肉湯(BectonDickinson)中培養(yǎng)Kurthiasp.538-51F9(DSMNo.10610),一直培養(yǎng)到在600nm下(OD600)具有1.0光密度。通過離心收集生長的細(xì)胞并且于OD60016下在SMM中懸浮(0.5M蔗糖、0.02M順丁烯二酸鈉、0.02MMgCl26H2O)。然后把溶菌酶(Sigma)加入到200μg/ml的細(xì)胞懸液中,把懸液在30℃培養(yǎng)90分鐘以形成原生質(zhì)體。原生質(zhì)體用SMM洗滌兩次后,把它們懸浮在0.5mlSMM中。把1.5mlPEG溶液(SMM中有30%w/v的聚乙二醇4000)加入到原生質(zhì)體懸液中,此懸液在冰上培養(yǎng)2分鐘。然后加入6ml的SMM,并且通過離心收集原生質(zhì)體。把收集的原生質(zhì)體培養(yǎng)物懸浮在SMM,并且在30℃培養(yǎng)90分鐘。把含有0.6%瓊脂糖(Sigma,VII型)的DM3培養(yǎng)基(0.5M琥珀酸鈉pH7.3、0.5%W/V酪蛋白氨基酸、0.5%W/V酵母抽提物、0.3%W/VKH2PO4、0.7%w/vK2HPO4、0.5%W/V葡萄糖、0.02MMgCl26H2O、0.01%W/V牛血清蛋白)加入到原生質(zhì)體懸液中,然后把懸液擱置在DM3培養(yǎng)基瓊脂平板上。把平板在30℃培養(yǎng)3天。在DM3平板上總共獲得了新生的65個(gè)菌落。用實(shí)施例12的pYK1研究再生的菌株轉(zhuǎn)化效率。結(jié)果,選擇了40個(gè)菌株,并把它們?cè)?0℃50mlTripticase大豆肉湯中培養(yǎng),直到OD600為1.0。通過離心收集生長的細(xì)胞并把它們?cè)贠D60016下懸浮在SMM中。然后通過以上所描述的方法用溶菌酶處理細(xì)胞獲得原生質(zhì)體。把原生質(zhì)體培養(yǎng)物懸浮在0.5ml的SMM中,并且把pYK1(1μg)加入到原生質(zhì)體懸液中。在加入1.5ml的PEG溶液后,懸浮液在冰上培養(yǎng)2分鐘。再加入6ml的SMM,然后通過離心收集原生質(zhì)體。此后,把原生質(zhì)體懸浮在SMM中,并且在30℃培養(yǎng)90分鐘。把含有0.6%瓊脂糖的DM3培養(yǎng)基加入到原生質(zhì)體懸液中,然后把懸液擱置在DM3培養(yǎng)基瓊脂平板上。把平板在30℃培養(yǎng)3天。收集包括在平板上新生菌落的DM3-瓊脂糖,并且把它擴(kuò)散在含有5μg/ml卡那霉素的營養(yǎng)肉湯瓊脂平板上來選擇轉(zhuǎn)化體。把平板在30℃培養(yǎng)過夜。最后,得到了具有高轉(zhuǎn)化效率特征(每μgDNA有2,000個(gè)轉(zhuǎn)化體)的衍生菌株--Kurthiasp.538-51F9-RG21。實(shí)施例15Kurthiasp.538-51F9-RG21中的bioB基因之?dāng)U增。1.Kurthiasp.538-51F9-RG21的轉(zhuǎn)化。如實(shí)施例13中所描述的,構(gòu)建Kurthia菌株bioB基因的表達(dá)質(zhì)粒--pYK114。用pYK114和實(shí)施例14中描述的轉(zhuǎn)化載體質(zhì)粒pYK1轉(zhuǎn)化Kurthiasp.538-51F9-RG21。把攜帶pYK1或是pYK114的Kurthiasp.538-51F9-RG21分別命名為Kurthiasp.538-51F9-RG21(pYK1)或Kurthiasp.538-51F9-RG21(pYK114)。2.通過發(fā)酵產(chǎn)生生物素。把Kurthiasp.538-51F9-RG21(pYK1)和Kurthiasp.538-51F9-RG21(pYK114)接種在含有5μg/ml卡那霉素的50ml的產(chǎn)物培養(yǎng)基中(6%甘油、5.5%protense蛋白胨、0.1%KH2PO4、0.05%MgSO47H2O、0.05%FeSO47H2O、0.001%MnSO45H2O;pH值為7.0)。把Kurthiasp.538-51F9-RG21接種在50ml的產(chǎn)物培養(yǎng)基中作為對(duì)照。培養(yǎng)物在28℃培養(yǎng)120小時(shí)。在培養(yǎng)之后,把2ml培養(yǎng)肉湯離心以除去細(xì)菌細(xì)胞得到上清液。通過微生物測(cè)定方法利用Lactobacillusplantarum(ATCC8014)測(cè)定上清液中的生物素產(chǎn)物。所產(chǎn)生的生物素量列于表3。表3序列表(1)SEQIDNO.1序列長度711個(gè)堿基對(duì)序列類型核酸鏈型雙鏈拓?fù)浣Y(jié)構(gòu)線性分子類型基因組DNA起始來源生物Kurthiasp.菌株538-KA25特征特征關(guān)鍵詞CDS位置1..708定義方法E序列描述ATGGGTCAAGCCTACTTTATAACCGGAACTGGCACGGATATCGGAAAAACCGTCGCCACG60AGTTTACTCTATATGTCTCTTCAAACAATGGGAAAAAGCGTCACAATATTTAAGCCGTTT120CAAACAGGATTGATTCACGAAACGAATACATACCCTGACATCTCTTGGTTTGAGCAGGAA180CTTGGTGTAAAGGCACCTGGGTTTTACATGCTTGAACCCGAAACATCTCCACACTTAGCT240ATAAAATTAACAGGGCAACAAATCGACGAGCAAAAGGTCGTGGAACGAGTTCACGAACTC300GAACAAATGTATGACATCGTGTTAGTCGAGGGCGCTGGGGGATTGGCCGTACCACTCATT360GAACGAGCGAACAGTTTCTATATGACAACCGATTTAATTAGAGATTGCAACATGCCAGTC420ATTTTCGTTTCTACAAGCGGTTTAGGATCGATTCATAATGTCATAACTACGCATTCGTAT480GCCAAATTGCATGATATTAGCGTTAAAACTATTTTATATAACCATTATCGGCCCGACGAT540GAAATTCATCGTGACAATATCCTAACCGTTGAAAAGCTCACAGGACTCGCTGACCTCGCC600TGCATACCAACATTTGTCGACGTAAGAAAAGATCTGAGAGTCTACATACTTGATTTACTT660AGTAATCATGAATTTACTCAACAACTAAAAGAGGTGTTCAAGAATGAATAG711(1)SEQIDNO.2序列長度236個(gè)殘基序列類型氨基酸拓?fù)浣Y(jié)構(gòu)線性分子類型多肽起始來源生物Kurthiasp.菌株538-KA26特征定義方法E序列描述MetGlyGlnAlaTyrPheIleThrGlyThrGlyThrAspIleGly151015LysThrValAlaThrSerLeuLeuTyrMetSerLeuGlnThrMet202530GlyLysSerValThrIlePheLysProPheGlnThrGlyLeuIle354045HisGluThrAsnThrTyrProAspIleSerTrpPheGluGlnGlu505560LeuGlyValLysAlaProGlyPheTyrMetLeuGluProGluThr657075SerProHisLeuAlaIleLysLeuThrGlyGlnGlnIleAspGlu808590GlnLysValValGluArgValHisGluLeuGluGlnMetTyrAsp95100105IleValLeuValGluGlyAlaGlyGlyLeuAlaValProLeuIle110115120GluArgAlaAsnSerPheTyrMetThrThrAspLeuIleArgAsp125130135CysAsnMetProValIlePheValSerThrSerGlyLeuGlySer140145150IleHisAsnValIleThrThrHisSerTyrAlaLysLeuHisAsp155160165IleSerValLysThrIleLeuTyrAsnHisTyrArgProAspAsp170175180GluIleHisArgAspAsnIleLeuThrValGluLysLeuThrGly185190195LeuAlaAspLeuAlaCysIleProThrPheValAspValArgLys200205210AspLeuArgValTyrIleLeuAspLeuLeuSerAsnHisGluPhe215220225ThrGlnGlnLeuLysGluValPheLysAsnGlu230235(3)SEQIDNO.3序列長度1383個(gè)堿基對(duì)序列類型核酸鏈型雙鏈拓?fù)浣Y(jié)構(gòu)線性分子類型基因組DNA起始來源生物Kurthiasp.菌株538-KA26特征特征關(guān)鍵詞CDS位置1..1380定義方法E序列描述ATGAATAGTCATGACTTAGAAAAGTGGGATAAGGAATATGTATGGCATCCGTTTACACAA60ATGAAAACGTATCGAGAAAGTAAACCGCTAATCATTGAACGCGGGGAAGGGAGCTACCTT120TTTGACATAGAAGGCAATCGGTACTTGGACGGTTATGCTTCATTATGGGTCAACGTACAT180GGCCATAATGAACCAGAGCTAAACAACGCTCTCATTGAACAAGTTGAAAAAGTCGCACAC240TCAACACTACTAGGATCTGCAAATGTACCATCCATATTACTGGCTAAGAAATTAGCAGAG300ATTACTCCTGGTCATTTATCGAAAGTCTTTTACTCGGACACTGGATCAGCTGCTGTAGAA360ATCTCCCTTAAAGTCGCTTATCAATATTGGAAAAATATCGATCCTGTAAAGTATCAACAT420AAAAATAAATTTGTCTCCCTGAACGAGGCGTACCACGGTGATACAGTTGGAGCAGTGAGT480GTCGGCGGAATGGATTTATTCCATAGAATCTTTAAACCACTACTATTTGAACGGATTCCA540ACTCCTTCTCCTTATACATATCGCATGGCTAAACACGGGGATCAAGAAGCAGTGAAAAAC600TATTGTATTGATGAGCTGGAAAAGTTGCTTCAAGACCAAGCAGAGGAAATTGCAGGATTG660ATTATCGAACCGCTTGTTCAAGGAGCAGCAGGCATCATTACCCACCCTCCTGGCTTTTTA720AAAGCGGTCGAACAATTGTGCAAGAAGTACAATATATTATTGATTTGTGACGAAGTAGCG780GTAGGATTTGGTCGCACCGGTACATTATTTGCCTGTGAACAAGAAGATGTCGTCCCTGAT840ATTATGTGTATCGGTAAAGGAATTACTGGCGGCTATATGCCTCTGGCGGCCACTATCATG900AACGAACAAATCTTTAATTCTTTTTTAGGAGAGCCCGATGAACATAAAACCTTCTATCAC960GGCCACACCTACACAGGGAATCAACTAGCCTGTGCCCTGGCGCTGAAGAATATCGAACTA1020ATAGAAAGACGAGATCTCGTCAAAGACATCCAGAAGAAATCCAAGCAGCTATCTGAAAAA1080CTGCAATCGCTATATGAACTCCCGATTGTCGGTGATATCCGCCAGCGCGGCCTCATGATT1140GGAATAGAAATCGTTAAAGATCGCCAAACAAAAGAACCGTTCACAATCCAAGAAAATATC1200GTTTCAAGCATCATCCAAAACGCTCGGGAAAATGGCCTGATCATTCGGGAACTTGGCCCT1260GTCATCACAATGATGCCCATTCTTTCCATGTCAGAAAAGGAACTGAATACTATGGTCGAA1320ACTGTCTACCGTTCGATACAGGACGTTTCTGTGCACAACGGATTAATCCCAGCAGCAAAC1380TGA1383(4)SEQIDNO.4序列長度460個(gè)殘基序列類型氨基酸拓?fù)浣Y(jié)構(gòu)線性分子類型多肽起始來源生物Kurthiasp.菌株538-KA26特征定義方法E序列描述MetAsnSerHisAspLeuGluLysTrpAspLysGluTyrValTrp151015HisProPheThrGlnMetLysThrTyrArgGluSerLysProLeu202530IleIleGluArgGlyGluGlySerTyrLeuPheAspIleGluGly354045AsnArgTyrLeuAspGlyTyrAlaSerLeuTrpValAsnValHis505560GlyHisAsnGluProGluLeuAsnAsnAlaLeuIleGluGlnVal657075GluLysValAlaHisSerThrLeuLeuGlySerAlaAsnValPro808590SerIleLeuLeuAlaLysLysLeuAlaGluIleThrProGlyHis95100105LeuSerLysValPheTyrSerAspThrGlySerAlaAlaValGlu110115120IleSerLeuLysValAlaTyrGlnTyrTrpLysAsnIleAspPro125130135ValLysTyrGlnHisLysAsnLysPheValSerLeuAsnGluAla140145150TyrHisGlyAspThrValGlyAlaValSerValGlyGlyMetAsp155160165LeuPheHisArgIlePheLysProLeuLeuPheGluArgIlePro170175180ThrProSerProTyrThrTyrArgMetAlaLysHisGlyAspGln185190195GluAlaValLysAsnTyrCysIleAspGluLeuGluLysLeuLeu200205210GlnAspGlnAlaGluGluIleAlaGlyLeuIleIleGluProLeu215220225ValGlnGlyAlaAlaGlyIleIleThrHisProProGlyPheLeu230235240LysAlaValGluGlnLeuCysLysLysTyrAsnIleLeuLeuIle245250255CysAspGluValAlaValGlyPheGlyArgThrGlyThrLeuPhe260265270AlaCysGluGlnGluAspValValProAspIleMetCysIleGly275280285LysGlyIleThrGlyGlyTyrMetProLeuAlaAlaThrIleMet290295300AsnGluGlnIlePheAsnSerPheLeuGlyGluProAspGluHis305310315LysThrPheTyrHisGlyHisThrTyrThrGlyAsnGlnLeuAla320325330CysAlaLeuAlaLeuLysAsnIleGluLeuIleGluArgArgAsp335340345LeuValLysAspIleGlnLysLysSerLysGlnLeuSerGluLys350355360LeuGlnSerLeuTyrGluLeuProIleValGlyAspIleArgGln365370375ArgGlyLeuMetIleGlyIleGluIleValLysAspArgGlnThr380385390LysGluProPheThrIleGlnGluAsnIleValSerSerIleIle395400405GlnAsnAlaArgGluAsnGlyLeuIleIleArgGluLeuGlyPro410415420ValIleThrMetMetProIleLeuSerMetSerGluLysGluLeu425430435AsnThrMetValGluThrValTyrArgSerIleGlnAspValSer440445450ValHisAsnGlyLeuIleProAlaAlaAsn455460(5)SEQIDNO.5序列長度1164個(gè)堿基對(duì)序列類型核酸鏈型雙鏈拓?fù)浣Y(jié)構(gòu)線性分子類型基因組DNA起始來源生物Kurthiasp.菌株538-KA26特征特征關(guān)鍵詞CDS位置1..1161定義方法E序列描述ATGATTTGGGAGAAGGAACTAGAAAAGATTAAAGAAGGAGGGCTTTACAGACAACTCCAA60ACCGTTGAAACAATGAGCGATCAAGGGTATGCCATGGTGAACGGAAAAAAAATGATGATG120TTTGCCTCCAATAATTACTTAGGGATTGCCAATGATCAACGATTAATTGAGGCTTCTGTC180CAAGCGACTCAAAGATTTGGTACGGGTTCTACTGGTTCACGATTAACCACTGGCAATACA240ATTGTCCATGAAAAACTAGAGAAAAGACTTGCAGAGTTTAAGCAAACGGATGCAGCGATA300GTATTAAACACAGGGTATATGGCTAACATAGCAGCGTTAACGACCCTTGTTGGTAGTGAC360GATCTCATTTTATCCGATGAGATGAATCATGCCAGTATTATTGATGGCTGCCGTTTATCA420CGTGCGGAAACTATCATTTATCGTCATGCTGATTTACTTGACTTGGAAATGAAACTCCAG480ATTAATACCCGCTACAGGAAAAGAATAATTGTAACGGATGGCGTCTTTTCGATGGATGGT540GATATTGCGCCATTGCCAGGTATTGTCGAACTTGCCAAGCGTTATGATGCACTTGTTATG600GTGGATGACGCACATGCGACGGGTGTTTTAGGTAAAGACGGAAGGGGAACTTCTGAACAT660TTTGGACTGAAGGGGAAGATAGATATCGAGATGGGGACACTCTCCAAAGCTGTTGGTGCA720GAAGGAGGGTATATCGCTGGAAGCAGGTCTTTAGTTGACTATGTCTTAAATCGAGCCAGA780CCGTTTGTCTTCTCTACCGCCTTATCAGCAGGAGTAGTAGCAAGTGCACTTACAGCAGTC840GATATCATTCAATCAGAACCTGAACGCAGAGTACGCATTCGAGCCATGAGCCAGCGTCTT900TATAATGAATTAACCTCCCTTGGCTACACAGTTTCGGGGGGAGAAACTCCGATTCTTGCC960ATTATTTGCGGAGAACCGGAACAGGCCATGTTCCTTTCGAAAGAATTACATAAGCACGGA1020ATTTATGCACCAGCTATCCGTTCGCCAACGGTACCTCTTGGAACTTCGCGCATTCGACTT1080ACGTTAATGGCGACACATCAAGAAGAACAAATGAATCATGTTATCGACGTGTTCAGAACA1140ATCCTTACCAATAGATACAAATAG1164(6)SEQIDNO.6序列長度387個(gè)殘基序列類型氨基酸拓?fù)浣Y(jié)構(gòu)線性分子類型多肽起始來源生物Kurthiasp.菌株538-KA26特征定義方法E序列描述MetIleTrpGluLysGluLeuGluLysIleLysGluGlyGlyLeu151015TyrArgGlnLeuGlnThrValGluThrMetSerAspGlnGlyTyr202530AlaMetValAsnGlyLysLysMetMetMetPheAlaSerAsnAsn354045TyrLeuGlyIleAlaAsnAspGlnArgLeuIleGluAlaSerVal505560GlnAlaThrGlnArgPheGlyThrGlySerThrGlySerArgLeu657075ThrThrGlyAsnThrIleValHisGluLysLeuGluLysArgLeu808590AlaGluPheLysGlnThrAspAlaAlaIleValLeuAsnThrGly95100105TyrMetAlaAsnIleAlaAlaLeuThrThrLeuValGlySerAsp110115120AspLeuIleLeuSerAspGluMetAsnHisAlaSerIleIleAsp125130135GlyCysArgLeuSerArgAlaGluThrIleIleTyrArgHisAla140145150AspLeuLeuAspLeuGluMetLysLeuGlnIleAsnThrArgTyr155160165ArgLysArgIleIleValThrAspGlyValPheSerMetAspGly170175180AspIleAlaProLeuProGlyIleValGluLeuAlaLysArgTyr185190195AspAlaLeuValMetValAspAspAlaHisAlaThrGlyValLeu200205210GlyLysAspGlyArgGlyThrSerGluHisPheGlyLeuLysGly215220225LysIleAspIleGluMetGlyThrLeuSerLysAlaValGlyAla230235240GluGlyGlyTyrIleAlaGlySerArgSerLeuValAspTyrVal245250255LeuAsnArgAlaArgProPheValPheSerThrAlaLeuSerAla260265270GlyValValAlaSerAlaLeuThrAlaValAspIleIleGlnSer275280285GluProGluArgArgValArgIleArgAlaMetSerGlnArgLeu290295300TyrAsnGluLeuThrSerLeuGlyTyrThrValSerGlyGlyGlu305310315ThrProIleLeuAlaIleIleCysGlyGluProGluGlnAlaMet320325330PheLeuSerLysGluLeuHisLysHisGlyIleTyrAlaProAla335340345IleArgSerProThrValProLeuGlyThrSerArgIleArgLeu350355360ThrLeuMetAlaThrHisGlnGluGluGlnMetAsnHisValIle365370375AspValPheArgThrIleLeuThrAsnArgTyrLys380385(7)SEQIDNO.7序列長度1017個(gè)堿基對(duì)序列類型核酸鏈型雙鏈拓?fù)浣Y(jié)構(gòu)線性分子類型基因組DNA起始來源生物Kurthiasp.菌株538-KA26特征特征keyCDS位置1..1014定義方法E菌株538-KA26序列描述ATGAGAAAAGAGGGATTAGGTTTGGAAACATTGGTGAAAAAGGATTGGAAGATGCTAGCG60GAAAACGTAATCAAAGGATATAAAGTAACAGCGGAAGAAGCACTTGCTATTGTACAAGCA120CCTGACAACGAGGTTTTAGAGATTTTGAATGCAGCTTTCCTTATTCGTCAGCACTATTAT180GGAAAAAAGGTTAAATTGAATATGATCATTAATACGAAGTCAGGTCTATGTCCTGAAGAT240TGTGGCTATTGTTCGCAGTCAATCGTGTCGGAAGCTCCTATCGATAAATATGCTTGGCTG300ACCAAAGAGAAGATTGTTGAAGGTGCTCAAGAATCAATTCGTCGCAAAGCTGGCACGTAT360TGTATCGTTGCTTCTGGCCGTCGTCCGACCAATAGGGAAATTGATCATGTCATTGAAGCT420GTGAAAGAAATTCGCGAGACAACGGATCTTAAAATATGCTGCTGTCTAGGTTTCTTAAAT480GAAACGCATGCCAGTAAGCTAGCTGAAGCTGGGGTTCATCGCTACAAGCACAACTTAAAT540ACATCTCAAGATAATTATAAGAATATTACATCCACACATACTTATGAGGACCGTGTAGAT600ACAGTCGAAGCTGTAAAAGAGGCCGGAATGTCTCCATGCTCGGGTGCCATTTTTGGTATG660AATGAGTCTAATGAAGAAGCAGTAGAGATTGCCCTATCCCTACGCAGTCTTGACGCGGAT720TCTATTCCTTGTAATTTCCTCAATGCGATTGACGGTACACCACTTGAGGGAACTTCCGAG780TTGACTCCAACTAAATGTTTGAAATTAATTTCGATGATGAGATTTGTTAATCCAAGTAAG840GAAATCCGTCTTGCTGGAGGTCGCGAGGTGAACCTCCGTTCCATGCAACCCATGGCACTT900TATGCAGCCAATTCTATCTTCGTCGGCGATTATCTAACAACAGCTGGACAAGAACCTACG960GCGGATTGGGGCATTATCGAAGACCTTGGTTTTGAAATTGAAGAATGCGCTCTTTAA1017(8)SEQIDNO.8序列長度338個(gè)殘基序列類型氨基酸拓?fù)浣Y(jié)構(gòu)線性分子類型多肽起始來源生物Kurthiasp.菌株538-KA26特征定義方法E序列描述MetArgLysGluGlyLeuGlyLeuGluThrLeuValLysLysAsp151015TrpLysMetLeuAlaGluAsnValIleLysGlyTyrLysValThr202530AlaGluGluAlaLeuAlaIleValGlnAlaProAspAsnGluVal354045LeuGluIleLeuAsnAlaAlaPheLeuIleArgGlnHisTyrTyr505560GlyLysLysValLysLeuAsnMetIleIleAsnThrLysSerGly657075LeuCysProGluAspCysGlyTyrCysSerGlnSerIleValSer808590GluAlaProIleAspLysTyrAlaTrpLeuThrLysGluLysIle95100105ValGluGlyAlaGlnGluSerIleArgArgLysAlaGlyThrTyr110115120CysIleValAlaSerGlyArgArgProThrAsnArgGluIleAsp125130135HisValIleGluAlaValLysGluIleArgGluThrThrAspLeu140145150LysIleCysCysCysLeuGlyPheLeuAsnGluThrHisAlaSer155160165LysLeuAlaGluAlaGlyValHisArgTyrLysHisAsnLeuAsn170175180ThrSerGlnAspAsnTyrLysAsnIleThrSerThrHisThrTyr185190195GluAspArgValAspThrValGluAlaValLysGluAlaGlyMet200205210SerProCysSerGlyAlaIlePheGlyMetAsnGluSerAsnGlu215220225GluAlaValGluIleAlaLeuSerLeuArgSerLeuAspAlaAsp230235240SerIleProCysAsnPheLeuAsnAlaIleAspGlyThrProLeu245250255GluGlyThrSerGluLeuThrProThrLysCysLeuLysLeuIle260265270SerMetMetArgPheValAsnProSerLysGluIleArgLeuAla275280285GlyGlyArgGluValAsnLeuArgSerMetGlnProMetAlaLeu290295300TyrAlaAlaAsnSerIlePheValGlyAspTyrLeuThrThrAla305310315GlyGlnGluProThrAlaAspTrpGlyIleIleGluAspLeuGly320325330PheGluIleGluGluCysAlaLeu335(9)SEQIDNO.9序列長度804個(gè)堿基對(duì)序列類型核酸鏈型雙鏈拓?fù)浣Y(jié)構(gòu)線性分子類型基因組DNA起始來源生物Kurthiasp.菌株538-KA26特征特征關(guān)鍵詞CDS位置1..801定義方法E序列描述ATGCCATTCGTAAATCATGACAATGAAAGCCTTTACTATGAGGTTCACGGACAAGGTGAT60CCTTTATTGTTGATTATGGGGCTCGGCTATAACTCTTTATCCTGGCATAGAACGGTGCCC120ACTTTAGCTAAGCGCTTTAAAGTAATCGTTTTTGATAATCGTGGTGTTGGTAAGAGCAGT180AAGCCTGAACAGCCATATTCTATTGAAATGATGGCTGAGGATGCAAGAGCGGTCCTTGAT240GCTGTTTCGGTTGACTCAGCACATGTATATGGGATTTCAATGGGTGGAATGATTGCCCAA300AGGCTGGCAATCACATATCCAGAACGTGTTCGTTCTCTTGTTCTAGGTTGTACCACTGCG360GGTGGTACTACTCATATTCAACCTTCTCCAGAAATATCTACTTTAATGGTATCTCGAGCC420TCCCTTACAGGTTCTCCAAGGGATAATGCCTGGTTAGCGGCACCAATAGTTTATAGTCAA480GCTTTTATTGAGAAGCACCCTGAATTAATTCAGGAAGATATCCAAAAGCGAATAGAAATC540ATTACTCCGCCAAGCGCCTATCTGTCTCAACTACAAGCTTGTCTAACTCATGATACATCC600AATGAACTTGATAAAATAAACATACCAACATTGATTATACACGGTGATGCAGATAATTTG660GTTCCATATGAAAACGGTAAAATGTTAGCTGAACGTATTCAGGGTTCTCAGTTTCACACC720GTATCCTGTGCTGGCCACATTTATTTAACAGAAGCAGCTAAGGAAGCAAATGACAAAGTT780ATACAGTTTCTAGCTCATCTATAA804(10)SEQIDNO.10序列長度267個(gè)殘基序列類型氨基酸拓?fù)浣Y(jié)構(gòu)線性分子類型多肽起始來源生物Kurthiasp.菌株538-KA26特征定義方法E序列描述MetProPheValAsnHisAspAsnGluSerLeuTyrTyrGluVal151015HisGlyGlnGlyAspProLeuLeuLeuIleMetGlyLeuGlyTyr202530AsnSerLeuSerTrpHisArgThrValProThrLeuAlaLysArg354045PheLysValIleValPheAspAsnArgGlyValGlyLysSerSer505560LysProGluGlnProTyrSerIleGluMetMetAlaGluAspAla657075ArgAlaValLeuAspAlaValSerValAspSerAlaHisValTyr808590GlyIleSerMetGlyGlyMetIleAlaGlnArgLeuAlaIleThr95100105TyrProGluArgValArgSerLeuValLeuGlyCysThrThrAla110115120GlyGlyThrThrHisIleGlnProSerProGluIleSerThrLeu125130135MetValSerArgAlaSerLeuThrGlySerProArgAspAsnAla140145150TrpLeuAlaAlaProIleValTyrSerGlnAlaPheIleGluLys155160165HisProGluLeuIleGlnGluAspIleGlnLysArgIleGluIle170175180IleThrProProSerAlaTyrLeuSerGlnLeuGlnAlaCysLeu185190195ThrHisAspThrSerAsnGluLeuAspLysIleAsnIleProThr200205210LeuIleIleHisGlyAspAlaAspAsnLeuValProTyrGluAsn215220225GlyLysMetLeuAlaGluArgIleGlnGlySerGlnPheHisThr230235240ValSerCysAlaGlyHisIleTyrLeuThrGluAlaAlaLysGlu245250255AlaAsnAspLysValIleGlnPheLeuAlaHisLeu260265(11)SEQIDNO.11序列長度1197個(gè)堿基對(duì)序列類型核酸鏈型雙鏈拓?fù)浣Y(jié)構(gòu)線性分子類型基因組DNA起始來源生物Kurthiasp.菌株538-KA26特征特征關(guān)鍵詞CDS位置1..1194定義方法E序列描述ATGCACAGTGAAAAACAATTACCTTGTTGGGAAGAAAAAATTAAGAAAGAACTGGCTTAT60TTAGAAGAGATATCGCAAAAACGTGAACTCGTTTCAACGGAATTCGCCGAGCAGCCATGG120CTTATGATCAACGGGTGCAAGATGCTAAATCTAGCTTCTAATAACTATTTAGGATATGCA180GGGGATGAGCGGCTGAAAAAGGCTATGGTAGATGCAGTACATACATATGGTGCAGGAGCG240ACGGCTTCACGTTTAATTATTGGCAATCACCCTCTTTACGAGCAAGCAGAACAAGCTCTT300GTCAATTGGAAGAAAGCCGAAGCAGGACTCATTATTAACAGTGGATATAACGCGAACCTT360GGAATTATCTCCACCTTGCTGTCCCGTAACGATATTATTTATAGCGATAAATTGAATCAT420GCAAGCATTGTCGATGGAGCTCTCTTAAGCCGTGCAAAGCATCTACGCTATCGTCATAAT480GATTTAGATCATTTAGAAGCATTATTGAAAAAATCATCGATGGAAGCACGTAAATTAATT540GTGACGGATACGGTCTTCAGCATGGACGGTGACTTTGCTTATCTTGAAGACCTTGTTCGG600TTAAAAGAACGTTATAACGCTATGTTAATGACAGATGAAGCACACGGAAGCGGCATCTAC660GGTAAAAACGGTGAAGGTTATGCCGGTCATCTCCATCTTCAAAATAAAATAGATATCCAA720ATGGGAACATTCAGTAAAGCGCTCGGTTCATTCGGGGCCTATGTCGTCGGGAAAAAATGG780CTCATCGACTATTTAAAAAATCGCATGCGCGGATTCATATATTCAACTGCACTCCCCCCG840GCCATACTCGGTGCTATGAAAACAGCGATAGAACTTGTACAGCAAGAACCAGAACGCCGC900TCACTGCTCCAAACACATTCAGAACACTTTAGAGAAGAACTCACATATTACGGGTTTAAT960ATTTGTGGAAGTCGATCACAAATTGTTCCTATCGTCATCGGGGAAAACGAAAAAGCGATG1020GAATTTGCCACACGTTTGCAGAAAGAAGGAATTGCAGCTATTGCTGTCAGGCCGCCGACC1080GTTCCTGAAAATGAGGCGAGAATCCGTTTTACTGTAACAGCTCTCCACGATAAAAAAGAT1140CTTGATTGGGCAGTTGAAAAAGTTTCGATCATTGGAAAAGAAATGGGTGTTATTTAA1197(12)SEQIDNO.12序列長度398個(gè)殘基序列類型氨基酸拓?fù)浣Y(jié)構(gòu)線性分子類型多肽起始來源生物Kurthiasp.菌株538-KA26特征定義方法E序列描述MetHisSerGluLysGlnLeuProCysTrpGluGluLysIleLys151015LysGluLeuAlaTyrLeuGluGluIleSerGlnLysArgGluLeu202530ValSerThrGluPheAlaGluGlnProTrpLeuMetIleAsnGly354045CysLysMetLeuAsnLeuAlaSerAsnAsnTyrLeuGlyTyrAla505560GlyAspGluArgLeuLysLysAlaMetValAspAlaValHisThr657075TyrGlyAlaGlyAlaThrAlaSerArgLeuIleIleGlyAsnHis808590ProLeuTyrGluGlnAlaGluGlnAlaLeuValAsnTrpLysLys95100105AlaGluAlaGlyLeuIleIleAsnSerGlyTyrAsnAlaAsnLeu110115120GlyIleIleSerThrLeuLeuSerArgAsnAspIleIleTyrSer125130135AspLysLeuAsnHisAlaSerIleValAspGlyAlaLeuLeuSer140145150ArgAlaLysHisLeuArgTyrArgHisAsnAspLeuAspHisLeu155160165GluAlaLeuLeuLysLysSerSerMetGluAlaArgLysLeuIle170175180ValThrAspThrValPheSerMetAspGlyAspPheAlaTyrLeu185190195GluAspLeuValArgLeuLysGluArgTyrAsnAlaMetLeuMet200205210ThrAspGluAlaHisGlySerGlyIleTyrGlyLysAsnGlyGlu215220225GlyTyrAlaGlyHisLeuHisLeuGlnAsnLysIleAspIleGln230235240MetGlyThrPheSerLysAlaLeuGlySerPheGlyAlaTyrVal245250255ValGlyLysLysTrpLeuIleAspTyrLeuLysAsnArgMetArg260265270GlyPheIleTyrSerThrAlaLeuProProAlaIleLeuGlyAla275280285MetLysThrAlaIleGluLeuValGlnGlnGluProGluArgArg290295300SerLeuLeuGlnThrHisSerGluHisPheArgGluGluLeuThr305310315TyrTyrGlyPheAsnIleCysGlySerArgSerGlnIleValPro320325330IleValIleGlyGluAsnGluLysAlaMetGluPheAlaThrArg335340345LeuGlnLysGluGlyIleAlaAlaIleAlaValArgProProThr350355360ValProGluAsnGluAlaArgIleArgPheThrValThrAlaLeu365370375HisAspLysLysAspLeuAspTrpAlaValGluLysValSerIle380385390IleGlyLysGluMetGlyValIle395(13)SEQIDNO.13序列長度747個(gè)堿基對(duì)序列類型核酸鏈型雙鏈拓?fù)浣Y(jié)構(gòu)線性分子類型基因組DNA起始來源生物Kurthiasp.菌株538-KA26特征特征關(guān)鍵詞CDS位置1..744定義方法E序列描述ATGAAACAGCCGAATTTAGTCATGCTTCCTGGCTGGGGAATGGAAAAAGATGCGTTTCAA60CCGTTAATCAAACCGCTGTCAGAAGTATTTCACCTCTCATTCATAGAATGGAGAGATATG120AAAACACTAAATGACTTTGAAGAACGAGTCATAGACACAATCGCTTCTATTGATGGTCCT180GTTTTTTTACTTGGCTGGTCATTAGGATCTCTATTATCACTTGAACTTGTAAGTTCGTAT240CGAGAAAAAATAAAAGGTTTTATACTAATTGGCGCAACAAGTCGTTTTACCACAGGAGAT300AATTATTCATTTGGCTGGGATCCACGAATGGTCGAGCGCATGAAGAAACAACTGCAGCGC360AATAAAGAGAAGACTTTGACTTCTTTCTATGAAGCAATGTTTTCCGAAGCTGAAAAAGAA420GAAGGTTTTTATCATCAATTCATCACGACAATTCAAAGCGAGTTTCATGGGGATGACGTA480TTTTCGCTTCTTATAGGTTTGGATTATTTACTTCAGAAAGATGTTAGAGTAAAGCTCGAC540CAGATTGAAACTCCCATTTTATTGATCCATGGGAGAGAAGACAAAATTTGTCCACTCGAA600GCCTCATCTTTCATTAAAGAAAATCTGGGTGGGAAAGCCGAGGTTCATATTATCGAAGGC660GCTGGTCATATTCCATTTTTCACAAAACCACAGGAATGTGTGCAGCTTATAAAAACATTT720ATTCAAAAGGAGTACATTCATGATTGA747(14)SEQIDNO.14序列長度248個(gè)殘基序列類型氨基酸鏈型雙鏈拓?fù)浣Y(jié)構(gòu)線性分子類型多肽起始來源生物Kurthiasp.菌株538-KA26特征定義方法E序列描述MetLysGlnProAsnLeuValMetLeuProGlyTrpGlyMetGlu151015LysAspAlaPheGlnProLeuIleLysProLeuSerGluValPhe202530HisLeuSerPheIleGluTrpArgAspMetLysThrLeuAsnAsp354045PheGluGluArgValIleAspThrIleAlaSerIleAspGlyPro505560ValPheLeuLeuGlyTrpSerLeuGlySerLeuLeuSerLeuGlu657075LeuValSerSerTyrArgGluLysIleLysGlyPheIleLeuIle808590GlyAlaThrSerArgPheThrThrGlyAspAsnTyrSerPheGly95100105TrpAspProArgMetValGluArgMetLysLysGlnLeuGlnArg110115120AsnLysGluLysThrLeuThrSerPheTyrGluAlaMetPheSer125130135GluAlaGluLysGluGluGlyPheTyrHisGlnPheIleThrThr140145150IleGlnSerGluPheHisGlyAspAspValPheSerLeuLeuIle155160165GlyLeuAspTyrLeuLeuGlnLysAspValArgValLysLeuAsp170175180GlnIleGluThrProIleLeuLeuIleHisGlyArgGluAspLys185190195IleCysProLeuGluAlaSerSerPheIleLysGluAsnLeuGly200205210GlyLysAlaGluValHisIleIleGluGlyAlaGlyHisIlePro215220225PhePheThrLysProGlnGluCysValGlnLeuIleLysThrPhe230235240IleGlnLysGluTyrIleHisAsp245(15)SEQIDNO.15序列長度831個(gè)堿基對(duì)序列類型核酸鏈型雙鏈拓?fù)浣Y(jié)構(gòu)線性分子類型基因組DNA起始來源生物Kurthiasp.菌株538-KA26特征特征關(guān)鍵詞CDS位置1..828定義方法E序列描述ATGATTGATAAACAATTGTTAAGTAAGCGATTCAGTGAACATGCGAAAACATATGATGCA60TATGCCAATGTTCAAAAAAACATGGCGAAACAATTAGTGGATTTGCTCCCTCAAAAAAAC120AGCAAACAAAGAATTAACATCCTTGAAATTGGCTGCGGTACTGGTTACTTAACCAGGTTA180CTCGTTAATACATTTCCTAATGCTTCTATTACCGCTGTTGATTTAGCACCAGGGATGGTT240GAAGTGGCGAAAGGAATAACAATGGAAGACCGTGTTACTTTTTTATGTGCTGATATCGAA300GAAATGACGCTTAATGAAAATTACGACTTAATTATTTCTAATGCAACGTTTCAATGGCTG360AATAATCTTCCTGGAACCATTGAACAATTGTTTACACGATTAACGCCTGAAGGAAACCTG420ATATTTTCAACGTTTGGAATTAAAACCTTTCAAGAGCTTCATATGTCCTATGAACATGCG480AAAGAAAAGCTTCAACTTTCAATTGATAGTTCACCAGGCCAACTGTTTTACGCTCTAGAA540GAATTATCCCAAATTTGTGAAGAAGCAATCCCTTTTTCATCAGCATTTCCATTAGAGATA600ACAAAAATAGAAAAGCTTGAACTAGAGTACTTTCAGACAGTACGTGAATTTTTCACTTCA660ATTAAAAAGATTGGTGCAGCTAACAGCAACAAAGAAAACTACTGCCAGCGCCCTTCTTTT720TTTCGAGAGTTAATCAACATATACGAAACAAAATACCAAGATGAATCAGGTGTGAAGGCA780ACCTATCACTGTTTGTTTTTTAAGATAATAAAACATGCCCCCCTACCCTAA831(16)SEQIDNO.16序列長度276個(gè)殘基序列類型氨基酸拓?fù)浣Y(jié)構(gòu)線性分子類型多肽起始來源生物Kurthiasp.菌株:538-KA26特征定義方法E序列描述MetIleAspLysGlnLeuLeuSerLysArgPheSerGluHisAla151015LysThrTyrAspAlaTyrAlaAsnValGlnLysAsnMetAlaLys202530GlnLeuValAspLeuLeuProGlnLysAsnSerLysGlnArgIle354045AsnIleLeuGluIleGlyCysGlyThrGlyTyrLeuThrArgLeu505560LeuValAsnThrPheProAsnAlaSerIleThrAlaValAspLeu657075AlaProGlyMetValGluValAlaLysGlyIleThrMetGluAsp808590ArgValThrPheLeuCysAlaAspIleGluGluMetThrLeuAsn95100105GluAsnTyrAspLeuIleIleSerAsnAlaThrPheGlnTrpLeu110115120AsnAsnLeuProGlyThrIleGluGlnLeuPheThrArgLeuThr125130135ProGluGlyAsnLeuIlePheSerThrPheGlyIleLysThrPhe140145150GlnGluLeuHisMetSerTyrGluHisAlaLysGluLysLeuGln155160165LeuSerIleAspSerSerProGlyGlnLeuPheTyrAlaLeuGlu170175180GluLeuSerGlnIleCysGluGluAlaIleProPheSerSerAla185190195PheProLeuGluIleThrLysIleGluLysLeuGluLeuGluTyr200205210PheGlnThrValArgGluPhePheThrSerIleLysLysIleGly215220225AlaAlaAsnSerAsnLysGluAsnTyrCysGlnArgProSerPhe230235240PheArgGluLeuIleAsnIleTyrGluThrLysTyrGlnAspGlu245250255SerGlyValLysAlaThrTyrHisCysLeuPhePheLysIleIle260265270LysHisAlaProLeuPro27權(quán)利要求1.一種DNA序列,該序列編碼以SEQIDN0.2、4、6、8、10、12、14或16為代表的多肽和包含一個(gè)或多個(gè)氨基酸殘基的添加、插入、缺失和/或取代的所述多肽的功能性衍生物。2.一種載體,該載體包含如權(quán)利要求1所限定的一個(gè)或多個(gè)DNA序列。3.權(quán)利要求2所限定的載體,其中所說的DNA序列與啟動(dòng)子序列功能性地連接。4.一種細(xì)胞,該細(xì)胞是由一種或多種權(quán)利要求1的DNA序列或權(quán)利要求2或3所限定的載體轉(zhuǎn)化的細(xì)胞。5.一種產(chǎn)生生物素的方法,該方法包括在培養(yǎng)基中培養(yǎng)權(quán)利要求4所限定的細(xì)胞和利用本領(lǐng)域公知的方法從培養(yǎng)基中分離形成的生物素。6.權(quán)利要求5的方法,其中所說的培養(yǎng)在pH值5至9,優(yōu)選的是6至8下,于10℃至45℃,優(yōu)選的是25℃至30℃的溫度范圍內(nèi)進(jìn)行1至10天,優(yōu)選的是2至7天。7.一種制備食品或飼料組合物的方法,其特征在于把用權(quán)利要求5或6的方法獲得的生物素與一種或多種通常應(yīng)用的添加劑混合。全文摘要本發(fā)明涉及利用基因工程生物體通過發(fā)酵產(chǎn)生生物素的方法、DNA序列以及用于這種方法的載體。文檔編號(hào)A23K1/16GK1178834SQ97119679公開日1998年4月15日申請(qǐng)日期1997年9月26日優(yōu)先權(quán)日1996年9月27日發(fā)明者古市泰宏,星野達(dá)雄,木村均,喜安達(dá)也,長橋喜惠申請(qǐng)人:弗·哈夫曼-拉羅切有限公司