相關(guān)申請(qǐng)的交叉引用本申請(qǐng)要求于2015年2月19日提交、目前未決的美國(guó)臨時(shí)專(zhuān)利申請(qǐng)序列號(hào)62/118,382的優(yōu)先權(quán)。序列表的引用命名為“nb40178wopct-sequence-listing.txt”的文本文件序列表的電子提交的內(nèi)容創(chuàng)建于2015年2月17日,并且大小為27kb,將其以全文通過(guò)引用特此結(jié)合。發(fā)明領(lǐng)域本發(fā)明總體上涉及具有遺傳改變的細(xì)菌細(xì)胞,以及制造和使用此類(lèi)細(xì)胞的方法,該遺傳改變導(dǎo)致感興趣的蛋白質(zhì)的增加的表達(dá)。本發(fā)明的方面包括革蘭氏陽(yáng)性微生物(例如芽孢桿菌屬物種),這些微生物具有導(dǎo)致感興趣的蛋白質(zhì)表達(dá)增強(qiáng)的遺傳改變。
背景技術(shù):
:遺傳工程已經(jīng)允許改進(jìn)在食品發(fā)酵中用作工業(yè)生物反應(yīng)器和細(xì)胞工廠的微生物。包括多個(gè)芽孢桿菌屬物種的革蘭氏陽(yáng)性生物體被用于產(chǎn)生大量有用的蛋白質(zhì)和代謝產(chǎn)物(參見(jiàn),例如,zukowski,“productionofcommerciallyvaluableproducts[有商業(yè)價(jià)值的產(chǎn)品的生產(chǎn)]”,在doi和mcglouglin主編的biologyofbacilli:applicationstoindustry[桿菌生物學(xué):工業(yè)應(yīng)用]中,巴特沃思-海涅曼出版公司(butterworth-heinemann),斯通哈姆,馬薩諸塞州,第311-337頁(yè),[1992])。工業(yè)中使用的常見(jiàn)芽孢桿菌屬物種包括但不限于地衣芽孢桿菌、解淀粉芽孢桿菌和枯草芽孢桿菌。除了在一般工業(yè)環(huán)境(例如,除了其他用途之外,用于洗滌劑、生物質(zhì)燃料生產(chǎn)的酶)中使用這些微生物,由于這些微生物的gras(通常被認(rèn)為是安全的)狀態(tài),這些芽孢桿菌屬物種的菌株是用于生產(chǎn)用于食品和制藥工業(yè)的蛋白質(zhì)的天然候選物。在革蘭氏陽(yáng)性生物體中產(chǎn)生的蛋白質(zhì)的實(shí)例包括但不限于酶,例如淀粉酶、中性蛋白酶、堿性(或絲氨酸)蛋白酶和支鏈淀粉酶。盡管對(duì)細(xì)菌宿主細(xì)胞中蛋白質(zhì)的生產(chǎn)的理解有所進(jìn)展,但是仍然需要開(kāi)發(fā)新的表達(dá)增加水平的感興趣的蛋白質(zhì)的重組菌株。發(fā)明簡(jiǎn)述在某些實(shí)施例中,本發(fā)明涉及重組(即,遺傳修飾的)細(xì)菌(宿主)細(xì)胞,以及其用于增加編碼感興趣的蛋白質(zhì)的感興趣的基因表達(dá)的方法。在一些其他實(shí)施例中,本發(fā)明涉及在本披露的重組(修飾的)細(xì)菌宿主細(xì)胞中一種或多種感興趣的蛋白質(zhì)的增加的生產(chǎn)。在仍然其他實(shí)施例中,本發(fā)明涉及修飾用于表達(dá)和/或產(chǎn)生一種或多種感興趣的蛋白質(zhì)的細(xì)菌宿主細(xì)胞的方法。在某些其他實(shí)施例中,本發(fā)明涉及本文所闡述的令人驚奇且意想不到的結(jié)果,其表明使用與感興趣的基因可操作地組合的某些強(qiáng)5’utr會(huì)導(dǎo)致感興趣的蛋白質(zhì)的更高表達(dá)。因此,在某些實(shí)施例中,本發(fā)明涉及dna分子,這些dna分子在5'至3'方向上包含5'非翻譯區(qū)(5'utr)和感興趣的異源基因的編碼區(qū)。在其他實(shí)施例中,本發(fā)明涉及一種dna分子,該dna分子在5'至3'方向上包含5'非翻譯區(qū)(5'utr)和感興趣的異源基因的編碼區(qū),其中該5’utr衍生自來(lái)自芽孢桿菌屬物種的apre蛋白酶基因。在其他實(shí)施例中,該5’utr衍生自來(lái)自枯草芽孢桿菌的apre基因。因此,在某些實(shí)施例中,用于在表達(dá)感興趣的基因中使用的本披露的5’utr衍生自枯草芽孢桿菌apre-5’utr。在某些其他實(shí)施例中,用于在表達(dá)感興趣的基因中使用的本披露的5'utr衍生自枯草芽孢桿菌apre-5'utr,其包含seqidno:2、seqidno:9、seqidno:10或seqidno:17所示的核苷酸序列。在某些其他實(shí)施例中,本披露的5'utr包含與seqidno:2、seqidno:9、seqidno:10或seqidno:17所示的核酸序列具有至少90%序列同一性的核苷酸序列。在另一個(gè)實(shí)施例中,本發(fā)明涉及包含任何上述dna序列的載體。在另一個(gè)實(shí)施例中,本發(fā)明涉及包含載體的宿主細(xì)胞,該載體包含任何上述披露的dna序列。在另一個(gè)方面中,宿主細(xì)胞屬于芽孢桿菌屬物種。在另一個(gè)方面中,該芽孢桿菌屬物種選自下組,該組由以下各項(xiàng)組成:地衣芽孢桿菌、遲緩芽孢桿菌、枯草芽孢桿菌、解淀粉芽孢桿菌、短芽孢桿菌、嗜熱脂肪芽孢桿菌、嗜堿芽孢桿菌、凝結(jié)芽孢桿菌、環(huán)狀芽孢桿菌、短小芽胞桿菌、燦爛芽胞桿菌、克勞氏芽孢桿菌、巨大芽孢桿菌和蘇云金芽孢桿菌。在另一個(gè)方面中,芽孢桿菌屬菌株是枯草芽孢桿菌菌株。在另一個(gè)方面中,芽孢桿菌屬菌株是地衣芽孢桿菌菌株。在一個(gè)方面中,感興趣的基因編碼一種酶。在另一個(gè)方面中,該酶選自下組,該組由以下各項(xiàng)組成:?;D(zhuǎn)移酶、α-淀粉酶、β-淀粉酶、α-半乳糖苷酶、阿拉伯糖苷酶、芳基酯酶、β-半乳糖苷酶、角叉菜膠酶、過(guò)氧化氫酶、纖維二糖水解酶、纖維素酶、軟骨素酶、角質(zhì)酶、內(nèi)切-β-1,4-葡聚糖酶、內(nèi)切-β-甘露聚糖酶、酯酶、外切-甘露聚糖酶、半乳聚糖酶、葡糖淀粉酶、半纖維素酶、透明質(zhì)酸酶、角蛋白酶、漆酶、乳糖酶、木質(zhì)素酶、脂肪酶、脂肪氧合酶、甘露聚糖酶、氧化酶、果膠酸裂解酶、果膠乙酰酯酶、果膠酶、戊聚糖酶、過(guò)氧化物酶、過(guò)水解酶、酚氧化酶、磷酸酶、磷脂酶、植酸酶、多半乳糖醛酸酶、蛋白酶、支鏈淀粉酶、還原酶、鼠李糖半乳糖醛酸酶、β-葡聚糖酶、鞣酸酶、轉(zhuǎn)谷氨酰胺酶、木聚糖乙酰酯酶、木聚糖酶、木葡聚糖酶和木糖苷酶。在本披露的某些其他實(shí)施例中,dna分子包含與實(shí)例1,seqidno:3(即:seqidno:3是lat表達(dá)盒,其包含地衣芽孢桿菌α-淀粉酶(lat)基因,其具有天然lat啟動(dòng)子、天然lat5'utr、天然lat信號(hào)肽序列和天然lat轉(zhuǎn)錄終止子)中所示的核酸序列具有90%序列同一性的序列。在其他實(shí)施例中,dna分子包含與實(shí)例2,seqidno:11(即:seqidno:11包含可操作地與bacillusderamificans支鏈淀粉酶(pul)連接的seqidno:2的apre-5’utr,其中支鏈淀粉酶的n-末端104個(gè)氨基酸已被缺失,在本文中稱(chēng)為“pulm104”)所示的核酸序列具有90%序列同一性的序列。在其他實(shí)施例中,dna分子包含與實(shí)例3,seqidno:12(即,seqidno:12在5'至3'方向上包含:可操作地與apre-5'utr(seqidno:2)組合的rrnip2啟動(dòng)子(seqidno:20),該apre-5'utr與全長(zhǎng)latorf(即,編碼lat信號(hào)肽和成熟lat多肽)可操作地組合)所示的核酸序列具有90%序列同一性的序列。在某些其他實(shí)施例中,dna分子包含與實(shí)例3,seqidno:13(即,seqidno:13在5'至3'方向上包括:與apre-5'utr(seqidno:2)可操作地組合的rrnip2啟動(dòng)子(seqidno:20),該apre-5'utr與lat信號(hào)肽可操作地組合,該lat信號(hào)肽與編碼pulm104的orf可操作地組合)所示的核酸序列具有90%序列同一性的序列。在某些其他實(shí)施例中,dna分子包含與實(shí)例4,seqidno:14(即,seqidno:14在5'至3'方向上包含:與apre-5’utr(seqidno:2)可操作地組合的lat啟動(dòng)子,該apre-5’utr與lat信號(hào)肽可操作地組合,該lat信號(hào)肽與編碼成熟amys變體多肽的orf可操作地組合)所示的核酸序列具有90%序列同一性的序列。在某些其他實(shí)施例中,dna分子包含與實(shí)例4,seqidno:15(即,seqidno:15在5'至3'方向上包含:與apre-5’utr(seqidno:9;又稱(chēng)為“v2apre-5’utr”)可操作地組合的lat啟動(dòng)子,該apre-5’utr與lat信號(hào)肽可操作地組合,該lat信號(hào)肽與編碼成熟amys變體多肽的orf可操作地組合)所示的核酸序列具有90%序列同一性的序列。在又另一個(gè)實(shí)施例中,dna分子包含與實(shí)例4,seqidno:16(即,seqidno:16在5'至3'方向上包含:與apre-5’utr(seqidno:10;又稱(chēng)為“v3apre-5’utr”)可操作地組合的lat啟動(dòng)子,該apre-5’utr與lat信號(hào)肽可操作地組合,該lat信號(hào)肽與編碼成熟amys變體多肽的orf可操作地組合)所示的核酸序列具有90%序列同一性的序列。在具體的實(shí)施例中,dna分子包含seqidno:11的核酸序列。在其他實(shí)施例中,本發(fā)明涉及用于增加感興趣的蛋白質(zhì)在芽孢桿菌屬細(xì)菌中的表達(dá)的方法,該方法包括:使轉(zhuǎn)化的芽孢桿菌屬細(xì)菌在合適的培養(yǎng)基中生長(zhǎng)以表達(dá)該感興趣的蛋白質(zhì),其中將該芽孢桿菌屬細(xì)菌用包含表達(dá)盒的載體進(jìn)行轉(zhuǎn)化,該表達(dá)盒包含編碼感興趣的蛋白質(zhì)的dna和來(lái)自芽孢桿菌屬細(xì)菌的apre蛋白酶基因的5’utr,其中與來(lái)自用不包含apre5’utr的表達(dá)盒轉(zhuǎn)化的芽孢桿菌屬細(xì)菌的感興趣的蛋白質(zhì)的表達(dá)相比,該感興趣的蛋白質(zhì)的表達(dá)增加了。在另外的方面中,從培養(yǎng)基中回收感興趣的蛋白質(zhì)。在一個(gè)方面中,感興趣的蛋白質(zhì)在細(xì)胞外分泌。在另一個(gè)方面中,感興趣的蛋白質(zhì)在細(xì)胞內(nèi)積聚。在另一個(gè)方面中,dna分子包括來(lái)自枯草芽孢桿菌的apre5'utr。在另一個(gè)方面中,dna分子進(jìn)一步包含來(lái)自核糖體rna基因的啟動(dòng)子。在另一個(gè)方面中,核糖體rna基因啟動(dòng)子選自下組,該組由以下各項(xiàng)組成:p1rrnb、p1rrni、p2rrni、p1rrne、p2rrne和p3rrne。在另一個(gè)方面中,dna分子還包含來(lái)自核糖體蛋白質(zhì)基因的啟動(dòng)子。在另一個(gè)方面中,核糖體蛋白質(zhì)基因啟動(dòng)子選自下組,該組由以下各項(xiàng)組成:rpsd、p1rpsj、p2rpsj和σ因子啟動(dòng)子rpod。在另一個(gè)方面中,啟動(dòng)子包含來(lái)自lat基因的啟動(dòng)子。在某些實(shí)施例中,感興趣的蛋白質(zhì)是同源蛋白質(zhì)。在某些實(shí)施例中,感興趣的蛋白質(zhì)是異源蛋白質(zhì)。在某些實(shí)施例中,感興趣的蛋白質(zhì)是酶。在某些實(shí)施例中,該酶選自下組,該組由以下各項(xiàng)組成:?;D(zhuǎn)移酶、α-淀粉酶、β-淀粉酶、α-半乳糖苷酶、阿拉伯糖苷酶、芳基酯酶、β-半乳糖苷酶、角叉菜膠酶、過(guò)氧化氫酶、纖維二糖水解酶、纖維素酶、軟骨素酶、角質(zhì)酶、內(nèi)切-β-1,4-葡聚糖酶、內(nèi)切-β-甘露聚糖酶、酯酶、外切-甘露聚糖酶、半乳聚糖酶、葡糖淀粉酶、半纖維素酶、透明質(zhì)酸酶、角蛋白酶、漆酶、乳糖酶、木質(zhì)素酶、脂肪酶、脂肪氧合酶、甘露聚糖酶、氧化酶、果膠酸裂解酶、果膠乙酰酯酶、果膠酶、戊聚糖酶、過(guò)氧化物酶、酚氧化酶、磷酸酶、磷脂酶、植酸酶、多半乳糖醛酸酶、蛋白酶、支鏈淀粉酶、還原酶、鼠李糖半乳糖醛酸酶、β-葡聚糖酶、鞣酸酶、轉(zhuǎn)谷氨酰胺酶、木聚糖乙酰酯酶、木聚糖酶、木葡聚糖酶和木糖苷酶。在某些實(shí)施例中,該方法進(jìn)一步包括回收感興趣的蛋白質(zhì)。在某些實(shí)施例中,該方法進(jìn)一步包括在由經(jīng)改變的革蘭氏陽(yáng)性細(xì)菌細(xì)胞表達(dá)感興趣的蛋白質(zhì)的條件下培養(yǎng)經(jīng)改變的革蘭氏陽(yáng)性細(xì)菌細(xì)胞。在某些實(shí)施例中,該方法進(jìn)一步包括回收感興趣的蛋白質(zhì)。本發(fā)明的方面包括通過(guò)上述方法生產(chǎn)的經(jīng)改變的革蘭氏陽(yáng)性細(xì)菌細(xì)胞。附圖簡(jiǎn)述圖1是質(zhì)粒picath-latori1。圖2是載體phplt-blich-int-盒的圖譜。圖3是載體pkb360-apre-wt-amys變體的圖譜。發(fā)明詳述在詳細(xì)地描述本發(fā)明的組合物和方法之前,為了清楚起見(jiàn)定義以下術(shù)語(yǔ)。未定義的術(shù)語(yǔ)和縮寫(xiě)應(yīng)當(dāng)符合本領(lǐng)域中所使用的常規(guī)含義。除非本文另有定義,否則本文所使用的全部科技術(shù)語(yǔ)都具有如本領(lǐng)域普通技術(shù)人員通常理解的相同含義。除非另有說(shuō)明,本披露的實(shí)踐涉及通常用于分子生物學(xué)、蛋白質(zhì)工程和微生物學(xué)的常規(guī)技術(shù)。盡管與本文所述方法和材料類(lèi)似或等同的任何方法和材料可用于本披露的實(shí)踐,但是本文描述了一些合適的方法和材料。通過(guò)參考作為一個(gè)整體的說(shuō)明書(shū),更全面地描述下面即將定義的術(shù)語(yǔ)。除非上下文另有明確指示,如本文所使用的,單數(shù)“一個(gè)/一種”(a/an)和“該/所述”(the)包括復(fù)數(shù)。除非另有說(shuō)明,否則核酸序列從左至右以5'至3'取向?qū)懗?;并且氨基酸序列從左至右以氨基至羧基取向?qū)懗觥?yīng)當(dāng)理解的是,在沒(méi)有相反的指示的情況下,本披露不限于本文所述的具體方法、方案和試劑。在本說(shuō)明書(shū)全文中給出的每一最大數(shù)值限度旨在包括每一較低數(shù)值限度,如同此類(lèi)較低數(shù)值限度在本文中明確寫(xiě)出一樣。在本說(shuō)明書(shū)全文中給出的每一最小數(shù)值限度將包括每一較高數(shù)值限度,如同此類(lèi)較高數(shù)值限度在本文中明確寫(xiě)出一樣。在本說(shuō)明書(shū)全文中給出的每一數(shù)值范圍將包括落入此類(lèi)較寬數(shù)值范圍內(nèi)的每一較窄數(shù)值范圍,如同此類(lèi)較窄數(shù)值范圍在本文中全部明確寫(xiě)出一樣。如本文所使用的,關(guān)于數(shù)值,術(shù)語(yǔ)“約”是指數(shù)值的+/-0.5的范圍,除非術(shù)語(yǔ)在上下文中另有具體定義。例如,短語(yǔ)“約6的ph值”是指ph值為從5.5至6.5,除非ph值另有具體定義。除非另有定義,本文使用的所有技術(shù)和科學(xué)術(shù)語(yǔ)具有與本發(fā)明組合物和方法所屬領(lǐng)域的普通技術(shù)人員通常理解的相同含義。雖然類(lèi)似于或等同于本文描述的那些的任何方法和材料也可以用于本發(fā)明組合物和方法的實(shí)踐或測(cè)試中,但現(xiàn)在將對(duì)代表性示例方法和材料進(jìn)行描述。在本說(shuō)明書(shū)中引用的所有公開(kāi)物和專(zhuān)利都通過(guò)引用結(jié)合在此,就好像每個(gè)單獨(dú)的公開(kāi)物或?qū)@痪唧w地并單獨(dú)地指示為通過(guò)引用結(jié)合,并且通過(guò)引用結(jié)合在此從而結(jié)合引用的公開(kāi)物來(lái)披露和描述這些方法和/或材料。任何公開(kāi)物的引用內(nèi)容是針對(duì)其在申請(qǐng)日之前的披露,并且不能理解為承認(rèn)因?yàn)橄惹鞍l(fā)明而本發(fā)明組合物和方法不能獲得比這些公開(kāi)物更早的申請(qǐng)日。此外,所提供的公開(kāi)日期可能與實(shí)際公開(kāi)日期不同,實(shí)際公開(kāi)日期可能需要獨(dú)立地證實(shí)。a.定義如本文所使用的,“宿主細(xì)胞”是指具有作為新引入的核酸序列的宿主或表達(dá)載體的能力的細(xì)胞。在本發(fā)明的某些實(shí)施例中,宿主細(xì)胞是細(xì)菌細(xì)胞,例如革蘭氏陽(yáng)性宿主細(xì)胞芽孢桿菌屬細(xì)胞。如本文所使用的,“芽孢桿菌屬”或“芽孢桿菌屬物種”包括如本領(lǐng)域技術(shù)人員已知的“芽孢桿菌”屬內(nèi)的所有物種,包括但不限于:枯草芽孢桿菌、地衣芽孢桿菌、遲緩芽胞桿菌、短芽孢桿菌、嗜熱脂肪芽胞桿菌、嗜堿芽孢桿菌、解淀粉芽孢桿菌、克勞氏芽孢桿菌、耐鹽芽孢桿菌、巨大芽孢桿菌、凝結(jié)芽孢桿菌、環(huán)狀芽孢桿菌、燦爛芽胞桿菌和蘇云金芽孢桿菌。我們意識(shí)到芽孢桿菌屬在不斷進(jìn)行分類(lèi)學(xué)重組。因此,該屬旨在包括已重新分類(lèi)的物種,包括但不限于:例如嗜熱脂肪芽孢桿菌(b.stearothermophilus)(現(xiàn)在稱(chēng)為“嗜熱脂肪土芽孢桿菌(geobacillusstearothermophilus)”)的此類(lèi)生物體。在氧氣的存在下,抗性內(nèi)生孢子的產(chǎn)生被認(rèn)為是芽孢桿菌屬的定義性特性,盡管這個(gè)特征也適用于最近命名的脂環(huán)酸芽孢桿菌屬、雙芽孢桿菌屬(amphibacillus)、硫胺素芽孢桿菌屬(aneurinibacillus)、厭氧芽孢桿菌屬(anoxybacillus)、短芽孢桿菌屬、線性桿菌屬(filobacillus)、薄壁芽孢桿菌屬(gracilibacillus)、喜鹽芽孢桿菌屬(halobacillus)、類(lèi)芽孢桿菌屬、需鹽芽孢桿菌屬(salibacillus)、耐熱芽孢桿菌屬(thermobacillus)、脲芽胞桿菌屬(ureibacillus)和枝芽孢桿菌屬(virgibacillus)。如本文所使用的,“核酸”是指核苷酸或多核苷酸序列及其片段或部分,以及可能是雙鏈或單鏈的基因組或合成來(lái)源的dna、cdna和rna,無(wú)論是代表有義鏈還是反義鏈。應(yīng)當(dāng)理解,由于遺傳密碼的簡(jiǎn)并性,許多核苷酸序列可以編碼給定的蛋白質(zhì)。如本文所使用的,術(shù)語(yǔ)“載體”是指可以在細(xì)胞中復(fù)制并且可以攜帶新基因或dna片段到細(xì)胞中的任何核酸。因此,該術(shù)語(yǔ)是指設(shè)計(jì)用于在不同宿主細(xì)胞之間轉(zhuǎn)移的核酸構(gòu)建體?!氨磉_(dá)載體”是指具有在外來(lái)細(xì)胞中整合并表達(dá)異源dna片段的能力的載體。許多原核和真核表達(dá)載體是可商購(gòu)的?!鞍邢蜉d體”是包含與其轉(zhuǎn)化的宿主細(xì)胞的染色體中的區(qū)域同源的多核苷酸序列并且可以驅(qū)動(dòng)該區(qū)域的同源重組的載體。靶向載體用于通過(guò)同源重組將突變引入細(xì)胞染色體。在一些實(shí)施例中,靶向載體包含其他非同源序列,例如添加到末端(即,填充序列或側(cè)翼序列)。末端可以閉合,這樣使得靶向載體形成閉環(huán),例如像,插入載體中。合適載體的選擇和/或構(gòu)建是在本領(lǐng)域技術(shù)人員的知識(shí)范圍中的。如本文所使用的,術(shù)語(yǔ)“質(zhì)?!笔侵赣米鬏d體的環(huán)狀雙鏈(ds)dna構(gòu)建體,并且其在許多細(xì)菌和真核生物中形成染色體外自我復(fù)制遺傳因子。在一些實(shí)施例中,質(zhì)??梢圆⑷胨拗骷?xì)胞的基因組中。如本文所定義的,術(shù)語(yǔ)“l(fā)at淀粉酶”是指地衣芽孢桿菌α-淀粉酶“amyl”,因此這些術(shù)語(yǔ)可以互換使用。“純化的”或“分離的”或“富集的”意指生物分子(例如,多肽或多核苷酸)通過(guò)將其與它在自然界中相關(guān)聯(lián)的天然存在的成分中的一些或所有分離而被從其天然狀態(tài)改變。這種分離或純化可以通過(guò)本領(lǐng)域公認(rèn)的分離技術(shù)如離子交換層析、親和層析、疏水分離、透析、蛋白酶處理、硫酸銨沉淀或其他蛋白質(zhì)鹽沉淀、離心、尺寸排阻層析、過(guò)濾、微量過(guò)濾、凝膠電泳或梯度分離進(jìn)行,以去除最終組合物中所不希望的全細(xì)胞、細(xì)胞碎片、雜質(zhì)、外來(lái)蛋白質(zhì)或酶。隨后可以進(jìn)一步向純化或分離的生物分子組合物中添加成分,該成分提供了額外的益處,例如是活化劑、抗抑制劑、期望的離子、控制ph的化合物或其他酶或化學(xué)品。如本文所使用的,當(dāng)提及感興趣的生物分子(例如,感興趣的蛋白質(zhì))的表達(dá)時(shí),術(shù)語(yǔ)“增強(qiáng)”、“改進(jìn)”和“增加”在本文中可互換使用,以表明生物分子的表達(dá)高于在相應(yīng)的宿主菌株(例如,野生型和/或親本菌株)中的表達(dá)水平,該相應(yīng)的宿主菌株根據(jù)本文的教導(dǎo)未被改變,但已經(jīng)在基本上相同的生長(zhǎng)條件下生長(zhǎng)。如本文所使用的,當(dāng)應(yīng)用于蛋白質(zhì)時(shí),術(shù)語(yǔ)“表達(dá)”是指基于基因的核酸序列產(chǎn)生蛋白質(zhì)并且因此包括轉(zhuǎn)錄和翻譯兩者的過(guò)程。如本文所使用的,在將多核苷酸引入細(xì)胞中的上下文中,術(shù)語(yǔ)“引入”是指適合于將多核苷酸轉(zhuǎn)移到細(xì)胞中的任何方法。這種引入方法包括但不限于原生質(zhì)體融合、轉(zhuǎn)染、轉(zhuǎn)化、綴合和轉(zhuǎn)導(dǎo)(參見(jiàn)例如ferrari等人,“genetics[遺傳學(xué)]”,在hardwood等人所編的bacillus[芽孢桿菌]中,普萊南出版公司(plenumpublishingcorp.),第57-72頁(yè),[1989])。如本文所使用的,術(shù)語(yǔ)“轉(zhuǎn)化的”和“穩(wěn)定轉(zhuǎn)化的”是指通過(guò)人為干預(yù)被引入多核苷酸序列的細(xì)胞。多核苷酸可以整合到細(xì)胞的基因組中,或作為保持至少兩代的附加型質(zhì)粒存在。如本文所使用的,術(shù)語(yǔ)“可選擇的標(biāo)志物”或“選擇性標(biāo)志物”是指能夠在宿主細(xì)胞中表達(dá)的核酸(例如,基因),其允許容易地選擇包含該核酸的那些宿主。這些可選擇的標(biāo)志物的實(shí)例包括但不限于抗微生物劑。因此,術(shù)語(yǔ)“可選擇的標(biāo)志物”是指提供宿主細(xì)胞已經(jīng)攝取了感興趣的輸入dna,或者已經(jīng)發(fā)生了一些其他反應(yīng)的指示。通常,可選擇的標(biāo)志物是賦予宿主細(xì)胞抗微生物抗性或代謝優(yōu)勢(shì)的基因,以允許在轉(zhuǎn)化期間將包含外源dna的細(xì)胞與未接受任何外源序列的細(xì)胞區(qū)分開(kāi)來(lái)。根據(jù)本發(fā)明有用的其他標(biāo)志物包括但不限于營(yíng)養(yǎng)缺陷型標(biāo)志物,如色氨酸;和檢測(cè)標(biāo)志物,如β-半乳糖苷酶。如本文所使用的,術(shù)語(yǔ)“啟動(dòng)子”是指用于引導(dǎo)下游基因轉(zhuǎn)錄的核酸序列。在實(shí)施例中,啟動(dòng)子適用于正在表達(dá)靶基因的宿主細(xì)胞。啟動(dòng)子與其他轉(zhuǎn)錄和翻譯調(diào)控核酸序列(也稱(chēng)為“控制序列”)一起是表達(dá)給定的基因所必須的。通常,轉(zhuǎn)錄和翻譯調(diào)控序列包括但不限于啟動(dòng)子序列、核糖體結(jié)合位點(diǎn)、轉(zhuǎn)錄起始和終止序列、翻譯起始和終止序列、以及增強(qiáng)子或激活子序列。如本文所使用的,“功能附接”或“可操作地連接”意指具有已知或所期望活性的調(diào)節(jié)區(qū)域或功能結(jié)構(gòu)域(如啟動(dòng)子、終止子、信號(hào)序列或增強(qiáng)子區(qū)域)按這樣一種方式附接于或連接于靶標(biāo)(例如,基因或多肽),以允許調(diào)節(jié)區(qū)域或功能結(jié)構(gòu)域根據(jù)其已知或期望的活性來(lái)控制該靶標(biāo)的表達(dá)、分泌或功能。當(dāng)用于描述重組細(xì)胞時(shí),術(shù)語(yǔ)“遺傳改變”或“遺傳變化”意味著與親本細(xì)胞相比,細(xì)胞具有至少一個(gè)遺傳差異。一個(gè)或多個(gè)遺傳差異可以是染色體突變(例如,插入、缺失、取代、倒位、用一個(gè)染色體區(qū)域替代另一個(gè)染色體區(qū)域(例如用異源啟動(dòng)子替代染色體啟動(dòng)子)等)和/或引入染色體外多核苷酸(例如,質(zhì)粒)。在一些實(shí)施例中,可以將染色體外多核苷酸整合到宿主細(xì)胞染色體中,以產(chǎn)生穩(wěn)定轉(zhuǎn)染子/轉(zhuǎn)化子?;虻摹笆Щ睢币馕吨虻谋磉_(dá)或其編碼的生物分子的活性被阻斷,或不能發(fā)揮其已知的功能。滅活可以通過(guò)任何合適的手段發(fā)生,例如通過(guò)如上所述的遺傳改變。在一個(gè)實(shí)施例中,滅活基因的表達(dá)產(chǎn)物是具有蛋白質(zhì)的生物活性相應(yīng)變化的截短蛋白質(zhì)。在一些實(shí)施例中,通過(guò)缺失實(shí)現(xiàn)失活。在一些實(shí)施例中,通過(guò)同源重組缺失靶向缺失的區(qū)域(例如,基因)。例如,使用包括具有選擇性標(biāo)志物的輸入序列的dna構(gòu)建體,該選擇性標(biāo)志物在每側(cè)側(cè)翼有與靶向缺失的區(qū)域同源的序列(其中該序列在本文中稱(chēng)為“同源盒”)。dna構(gòu)建體與宿主染色體的同源序列對(duì)齊,并且在雙重交叉事件中,將靶向缺失的區(qū)域從宿主染色體上切除?!安迦搿被颉疤砑印笔桥c天然存在的或親本的序列相比分別導(dǎo)致添加一個(gè)或多個(gè)核苷酸或氨基酸殘基的核苷酸或氨基酸序列的改變。如本文所使用的,“取代”由一或多個(gè)核苷酸或氨基酸分別被不同的核苷酸或氨基酸替代產(chǎn)生。使基因突變的方法是本領(lǐng)域熟知的,并且包括但不限于位點(diǎn)定向突變、隨機(jī)突變的產(chǎn)生、和缺口雙鏈體方法(參見(jiàn)例如,美國(guó)專(zhuān)利4,760,025;moring等人,biotech.[生物技術(shù)],2:646[1984];和kramer等人,nucleicacidsres.[核酸研究],12:9441[1984])。如本文所使用的,“同源基因”是指來(lái)自不同的、但通常相關(guān)的物種的一對(duì)或多個(gè)基因,這些基因彼此對(duì)應(yīng)并且彼此相同或非常相似。該術(shù)語(yǔ)涵蓋通過(guò)物種形成(即,新物種的發(fā)育)(例如,直系同源基因)分離的基因、以及通過(guò)遺傳重復(fù)分離的基因(例如,旁系同源基因)。如本文所使用的,“直向同源物”和“直向同源基因”是指通過(guò)物種形成從共同祖先基因(即,同源基因)演化的不同物種中的基因。通常,直系同源物在進(jìn)化過(guò)程中保持相同的功能。直系同源物的鑒定可用于新測(cè)序基因組中基因功能的可靠預(yù)測(cè)。如本文所使用的,“旁系同源物”和“旁系同源基因”是指與基因組內(nèi)重復(fù)相關(guān)的基因。雖然直系同源物在進(jìn)化過(guò)程中保持相同的功能,但旁系同源物發(fā)展新功能,即使一些功能通常與原始功能相關(guān)。旁系同源基因的實(shí)例包括但不限于編碼胰蛋白酶、胰凝乳蛋白酶、彈性蛋白酶、和凝血酶的基因,上述酶都是絲氨酸蛋白酶并且在同一物種內(nèi)一起發(fā)生。如本文所使用的,“同源性”是指序列相似性或同一性,同一性優(yōu)先。使用本領(lǐng)域已知的標(biāo)準(zhǔn)技術(shù)來(lái)確定這種同源性(參見(jiàn),例如,smith和waterman,adv.appl.math.[應(yīng)用數(shù)學(xué)進(jìn)展],2:482[1981];needleman和wunsch,j.mol.biol.[分子生物學(xué)雜志],48:443[1970];pearson和lipman,proc.natl.acad.sci.usa[美國(guó)科學(xué)院院刊],85:2444[1988];程序如在wisconsingenetics[威斯康星州遺傳學(xué)]軟件包中的gap、bestfit、fasta和tfasta(geneticscomputergroup[遺傳學(xué)計(jì)算機(jī)集團(tuán)],威斯康星州麥迪遜);和devereux等人,nucl.acidres.[核酸研究],12:387-395[1984])。如本文所使用的,“類(lèi)似的序列”是其中基因的功能基本上與指定來(lái)自枯草芽孢桿菌菌株168的基因相同的序列。另外,類(lèi)似的基因與枯草芽孢桿菌菌株168基因的序列包括至少60%、65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性??商娲兀?lèi)似的序列具有在枯草芽孢桿菌168區(qū)域中發(fā)現(xiàn)的在70%至100%之間的基因的對(duì)齊和/或在與枯草芽孢桿菌168染色體中的基因?qū)R的區(qū)域中發(fā)現(xiàn)的至少在5至10個(gè)之間的基因。在另外的實(shí)施例中,多于一個(gè)上述性質(zhì)適用于該序列。類(lèi)似的序列由已知的序列比對(duì)方法確定。通常使用的比對(duì)方法是blast,盡管如上下文所示,存在也可用于比對(duì)序列的其他方法。有用的算法的一個(gè)實(shí)例是pileup。pileup使用漸進(jìn)的、兩兩比對(duì)創(chuàng)建了來(lái)自一組相關(guān)序列的多個(gè)序列比對(duì)。它還可以標(biāo)繪顯示用于創(chuàng)建該比對(duì)的聚類(lèi)關(guān)系的一個(gè)樹(shù)。pileup使用feng和doolittle的漸進(jìn)比對(duì)方法的簡(jiǎn)化方法(feng和doolittle,j.mol.evol.[分子進(jìn)化雜志],35:351-360[1987])。該方法類(lèi)似于higgins和sharp(higgins和sharp,cabios5:151-153[1989])描述的方法。有用的pileup參數(shù)包括為3.00的默認(rèn)空位權(quán)重,為0.10的默認(rèn)空位長(zhǎng)度權(quán)重,以及加權(quán)的末端空位。有用的算法的另一個(gè)實(shí)例是由altschul等人描述的blast算法(altschul等人,j.mol.biol.[分子生物學(xué)雜志],215:403-410[1990];和karlin等人,proc.natl.acad.sci.[美國(guó)國(guó)家科學(xué)院院刊],90:5873-5787[1993])。特別有用的blast程序是wu-blast-2程序(參見(jiàn),altschul等人,meth.enzymol.[酶學(xué)方法],266:460-480[1996])。wu-blast-2使用若干個(gè)搜索參數(shù),其中大部分設(shè)置為默認(rèn)值。可調(diào)參數(shù)設(shè)置為以下值:重疊跨度=1,重疊分?jǐn)?shù)=0.125,字閾值(t)=11。hsps和hsps2參數(shù)是動(dòng)態(tài)值,并且由程序本身根據(jù)特定序列的組成以及具體數(shù)據(jù)庫(kù)的組成針對(duì)所搜索的感興趣的序列是哪個(gè)來(lái)建立。然而,可以調(diào)整這些值以增加靈敏度。氨基酸序列同一性值%由匹配的相同殘基數(shù)除以比對(duì)區(qū)域中“較長(zhǎng)”序列的殘基總數(shù)來(lái)確定?!拜^長(zhǎng)”序列是在比對(duì)區(qū)域中具有最多實(shí)際殘基的序列(通過(guò)wu-blast-2引入以最大化比對(duì)得分的空位被忽略)。如本文所使用的,相對(duì)于本文鑒定的氨基酸或核苷酸序列,“序列同一性百分比(%)”被定義為在比對(duì)序列并引入空位(必要的話)以實(shí)現(xiàn)最大百分比序列同一性之后,并且不考慮作為序列同一性的一部分的任何保守取代,候選序列中與感興趣的序列中的氨基酸殘基或核苷酸相同的氨基酸殘基或核苷酸的百分比?!巴滴铩?或“同源物”)是指與主題氨基酸序列和主題核苷酸序列具有特定程度的同一性的實(shí)體。使用常規(guī)序列比對(duì)工具(例如,clustal、blast等等),同源序列可以包括與主題序列具有至少60%、65%、70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或甚至99%同一性的氨基酸序列。通常,除非另有說(shuō)明,同系物將包括與受試氨基酸序列相同的活性位點(diǎn)殘基。進(jìn)行序列比對(duì)并且確定序列同一性的方法是本領(lǐng)域技術(shù)人員已知的,可以在不進(jìn)行過(guò)多實(shí)驗(yàn)的情況下實(shí)施,并且可以明確地獲得同一性值的計(jì)算。參見(jiàn),例如,ausubel等人編輯的(1995)currentprotocolsinmolecularbiology[現(xiàn)代分子生物學(xué)實(shí)驗(yàn)技術(shù)],第19章(格林出版與威利交叉科學(xué)出版社(greenepublishingandwiley-interscience),紐約);以及align程序(dayhoff(1978),在atlasofproteinsequenceandstructure5:suppl.3[蛋白質(zhì)序列和結(jié)構(gòu)圖集5:增刊3]中(國(guó)家生物醫(yī)學(xué)研究基金會(huì)(nationalbiomedicalresearchfoundation),華盛頓)。許多算法可用于比對(duì)序列并確定序列同一性,并且包括,例如,needleman等人(1970)j.mol.biol.[分子生物學(xué)雜志]48:443的同源性比對(duì)算法;smith等人(1981)adv.appl.math.[應(yīng)用數(shù)學(xué)進(jìn)展]2:482的局部同源性算法;pearson等人(1988)proc.natl.acad.sci.[美國(guó)科學(xué)院院刊]85:2444的相似性捜索方法;smith-waterman算法(meth.mol.biol.[分子生物學(xué)方法]70:173-187(1997));和blastp、blastn和blastx算法(參見(jiàn)altschul等人(1990)j.mol.biol.[分子生物學(xué)雜志]215:403-410)。使用這些算法的計(jì)算機(jī)化程序也是可用的,并且包括但不限于:align或megalign(dnastar)軟件,或wu-blast-2(altschul等人,meth.enzymol.[酶學(xué)方法],266:460-480(1996));或可在遺傳學(xué)計(jì)算機(jī)組(gcg)包,版本8,麥迪遜,威斯康星州,美國(guó)中獲得的gap、bestfit、blast、fasta、和tfasta;以及智能遺傳學(xué)(intelligenetics),山景城,加利福尼亞州的pc/基因程序中的clustal。本領(lǐng)域的技術(shù)人員可以確定用于測(cè)量比對(duì)的適當(dāng)參數(shù),包括在進(jìn)行比較的序列的整個(gè)長(zhǎng)度上實(shí)現(xiàn)最大比對(duì)所需的算法。優(yōu)選地,使用由程序確定的默認(rèn)參數(shù)來(lái)確定序列同一性。具體來(lái)說(shuō),序列同一性可以通過(guò)使用具有默認(rèn)參數(shù)的clustalw(thompsonj.d.等人(1994),nucleicacidsres.[核酸研究]22:4673-4680)來(lái)確定。如本文所使用的,術(shù)語(yǔ)“雜交”是指通過(guò)堿基配對(duì)將核酸鏈與互補(bǔ)鏈連接的過(guò)程,如本領(lǐng)域已知的。如果兩個(gè)序列在中至高嚴(yán)格雜交和洗滌條件下彼此特異性雜交,則認(rèn)為核酸序列可與參考核酸序列“選擇性雜交”。雜交條件是基于結(jié)合復(fù)合物或探針的核酸的解鏈溫度(tm)。例如,“最大嚴(yán)格”通常發(fā)生在約tm-5℃(低于探針的tm5°);“高嚴(yán)格”發(fā)生在低于tm約5℃-10℃;“中等嚴(yán)格”發(fā)生在低于探針的tm約10℃-20℃;并且“低嚴(yán)格”發(fā)生在低于tm約20℃-25℃。在功能上,最大嚴(yán)格條件可以用于鑒定與雜交探針具有嚴(yán)格同一性或近乎嚴(yán)格同一性的序列;而中等或低嚴(yán)格雜交可用于鑒定或檢測(cè)多核苷酸序列同系物。中等和高嚴(yán)格雜交條件是本領(lǐng)域公知的。高嚴(yán)格條件的實(shí)例包括在約42℃下在50%甲酰胺,5xssc,5x登哈特溶液,0.5%sds和100μg/ml變性載體dna中進(jìn)行的雜交,隨后在室溫下在2xssc和0.5%sds中洗滌兩次,并在42℃下在0.1xssc和0.5%sds中再洗滌兩次。中嚴(yán)格條件的實(shí)例包括在37℃下在包括20%甲酰胺,5×ssc(150mmnacl,15mm檸檬酸三鈉),50mm磷酸鈉(ph7.6),5×登哈特溶液,10%葡聚糖硫酸鹽和20mg/ml變性剪切的鮭魚(yú)精子dna的溶液中過(guò)夜孵育,然后在約37℃-50℃下以1xssc洗滌濾器來(lái)進(jìn)行。如果需要,本領(lǐng)域技術(shù)人員知道如何調(diào)節(jié)溫度、離子強(qiáng)度等以適應(yīng)因素如探針長(zhǎng)度等等。當(dāng)用于提及生物組分或組合物(例如,細(xì)胞、核酸、多肽/酶、載體等)時(shí),術(shù)語(yǔ)“重組體”表示該生物組分或組成物處于自然界中未發(fā)現(xiàn)的狀態(tài)。換句話說(shuō),生物組分或組合物已經(jīng)通過(guò)人類(lèi)干預(yù)從其天然狀態(tài)進(jìn)行了修飾。例如,重組細(xì)胞涵蓋表達(dá)在其天然親本(即,非重組)細(xì)胞中未發(fā)現(xiàn)的一個(gè)或多個(gè)基因的細(xì)胞,表達(dá)與其天然親本細(xì)胞不同的量的一個(gè)或多個(gè)天然基因的細(xì)胞,和/或在不同于其天然親本細(xì)胞的條件下表達(dá)一個(gè)或多個(gè)天然基因的細(xì)胞。重組核酸可以與天然序列相差一個(gè)或多個(gè)核苷酸,可操作地連接到異源序列(例如,異源啟動(dòng)子,編碼非天然或變體信號(hào)序列的序列等),沒(méi)有內(nèi)含子序列,和/或處于分離形式。重組多肽/酶可以與天然序列相差一個(gè)或多個(gè)氨基酸,可以與異源序列融合,可能被截短或具有氨基酸的內(nèi)部缺失,能以在天然細(xì)胞中未發(fā)現(xiàn)的方式表達(dá)(例如,來(lái)自由于細(xì)胞中存在編碼多肽的表達(dá)載體而過(guò)表達(dá)該多肽的重組細(xì)胞),和/或處于分離形式。需要強(qiáng)調(diào)的是,在一些實(shí)施例中,重組多核苷酸或多肽/酶具有與其野生型對(duì)應(yīng)物相同但處于非天然形式(例如,分離或富集形式)的序列。如本文所使用的,術(shù)語(yǔ)“靶序列”是指宿主細(xì)胞中編碼如下序列的dna序列:其中希望將輸入序列插入宿主細(xì)胞基因組中。在一些實(shí)施例中,靶序列編碼功能性野生型基因或操縱子,而在其他實(shí)施例中,靶序列編碼功能性突變基因或操縱子、或非功能基因或操縱子。如本文所使用的,“側(cè)翼序列”是指正在討論的序列的上游或下游的任何序列(例如,針對(duì)基因a-b-c,基因b以a和c基因序列為側(cè)翼)。在一個(gè)實(shí)施例中,輸入序列每側(cè)側(cè)翼有同源盒。在另一個(gè)實(shí)施例中,輸入序列和同源盒包括在每側(cè)側(cè)翼有填充序列的單元。在一些實(shí)施例中,側(cè)翼序列僅存在于單側(cè)(3’或5’),但在實(shí)施例中,序列的每側(cè)均有側(cè)翼序列。每個(gè)同源盒的序列與芽孢桿菌屬染色體中的序列同源。這些序列指導(dǎo)在芽孢桿菌屬染色體中,新構(gòu)建體被整合,并且部分芽孢桿菌屬染色體將被輸入序列替代。在一個(gè)實(shí)施例中,選擇性標(biāo)志物的5’和3’端側(cè)翼有包含失活染色體區(qū)段的部分的多核苷酸序列。在一些實(shí)施例中,側(cè)翼序列僅存在于單側(cè)(3’或5’),而在實(shí)施例中,其存在于所側(cè)翼序列的每側(cè)。如本文所使用的,術(shù)語(yǔ)“可擴(kuò)增標(biāo)志物”、“可擴(kuò)增基因”、和“擴(kuò)增載體”是指基因或編碼基因的載體,其允許在適當(dāng)生長(zhǎng)條件下擴(kuò)增該基因。在大多數(shù)擴(kuò)增技術(shù)中通過(guò)酶的選擇實(shí)現(xiàn)“模板特異性”。擴(kuò)增酶是在使用它們的條件下僅在核酸的不均勻混合物中處理核酸的特定序列的酶。例如,在qβ復(fù)制酶的情況下,mdv-1rna是復(fù)制酶的特異性模板(參見(jiàn)例如,kacian等人,proc.natl.acad.sci.usa[美國(guó)國(guó)家科學(xué)院院刊]69:3038[1972])。其他核酸不被該擴(kuò)增酶復(fù)制。類(lèi)似地,在t7rna聚合酶的情況下,該擴(kuò)增酶對(duì)其自身的啟動(dòng)子具有嚴(yán)格的特異性(參見(jiàn)chamberlin等人,nature[自然],228:227[1970])。在t4dna連接酶的情況下,該酶將不連接兩個(gè)寡核苷酸或多核苷酸,其中寡核苷酸或多核苷酸底物與連接接合處的模板之間存在錯(cuò)配(參見(jiàn)wu和wallace,genomics[基因組學(xué)],4:560[1989])。最后,發(fā)現(xiàn)taq和pfu聚合酶由于其在高溫下起作用的能力而對(duì)引物限制并由此限定的序列顯示出高特異性;高溫導(dǎo)致有利于與靶序列引物雜交而不與非靶序列雜交的熱力學(xué)條件。如本文所使用的,術(shù)語(yǔ)“可擴(kuò)增核酸”是指可以通過(guò)任何擴(kuò)增方法擴(kuò)增的核酸。預(yù)期“可擴(kuò)增核酸”通常將包含“樣本模板”。如本文所使用的,術(shù)語(yǔ)“樣品模板”是指源自樣品的核酸,將該樣品對(duì)“靶標(biāo)”的存在進(jìn)行分析(下文所定義)。相比之下,“背景模板”用于提及除樣品模板之外的核酸,其可以存在或不存在于樣品中。背景模板通常是無(wú)意中存在的。它可能是遺留(carryover)的結(jié)果,或者它可能是因?yàn)樵噲D從樣品中純化掉的核酸污染物的存在導(dǎo)致的。例如,來(lái)自生物體的而非待檢測(cè)那些的核酸可作為背景存在于測(cè)試樣品中。如本文所使用的,術(shù)語(yǔ)“引物”是指當(dāng)置于以下條件下能作為合成起始點(diǎn)的寡核苷酸,無(wú)論是純化的限制性消化物中天然存在的還是經(jīng)合成而產(chǎn)生的:其中誘導(dǎo)與核酸鏈互補(bǔ)的引物延伸產(chǎn)物的合成(即,在核苷酸和誘導(dǎo)劑例如dna聚合酶存在下并在合適的溫度和ph下)。引物優(yōu)選是單鏈,用于最大效率的擴(kuò)增,但是可替代地可以是雙鏈。如果是雙鏈,引物首先經(jīng)過(guò)處理以分離其雙鏈,然后再用于制備延伸產(chǎn)物。優(yōu)選地,引物是寡脫氧核糖核苷酸。引物必須足夠長(zhǎng),以在誘導(dǎo)劑存在下引發(fā)延伸產(chǎn)物的合成。引物的準(zhǔn)確長(zhǎng)度將取決于多個(gè)因素,包括溫度、引物來(lái)源和方法的使用。如本文所使用的,術(shù)語(yǔ)“探針”是指能與另一感興趣的寡核苷酸雜交的寡核苷酸(即核苷酸序列),無(wú)論是在純化的限制性消化中天然存在還是以合成,重組或通過(guò)pcr擴(kuò)增產(chǎn)生的。探針可以是單鏈或雙鏈的。探針可用于檢測(cè)、鑒定和分離特定基因序列。預(yù)期的是,本發(fā)明所用的任何探針都將用任何“報(bào)道分子”標(biāo)記,這樣使得在任何檢測(cè)系統(tǒng)中都可檢測(cè),所述檢測(cè)系統(tǒng)包括但不限于酶(例如elisa、以及基于酶的組織化學(xué)測(cè)定)系統(tǒng)、熒光系統(tǒng)、放射性系統(tǒng)、和發(fā)光系統(tǒng)。本發(fā)明并不旨在限于任何具體的檢測(cè)系統(tǒng)或標(biāo)記。如本文所使用的,術(shù)語(yǔ)“靶”當(dāng)用于提及聚合酶鏈?zhǔn)椒磻?yīng)時(shí),是指由用于聚合酶鏈?zhǔn)椒磻?yīng)的引物所界定的核酸區(qū)域。因此,試圖從其他核酸序列分選“靶標(biāo)”?!皡^(qū)段”被定義為靶序列內(nèi)的核酸區(qū)域。如本文所使用的,術(shù)語(yǔ)“聚合酶鏈?zhǔn)椒磻?yīng)”(“pcr”)(尤其)是指通過(guò)引用并入本文的美國(guó)專(zhuān)利號(hào)4,683,195、4,683,202和4,965,188的方法,其包括用于在不進(jìn)行克隆或純化的情況下增加基因組dna混合物中靶序列的區(qū)段濃度的方法。如本文所使用的,“遺傳改變的宿主菌株”(例如,遺傳改變的芽孢桿菌屬菌株)是指遺傳工程化的宿主細(xì)胞,也稱(chēng)為重組宿主細(xì)胞。在一些實(shí)施例中,與在基本上相同的生長(zhǎng)條件下生長(zhǎng)的相應(yīng)未經(jīng)改變的宿主菌株中相同感興趣的蛋白質(zhì)的表達(dá)和/或產(chǎn)生相比,遺傳改變的宿主細(xì)胞具有增強(qiáng)的(增加的)感興趣的蛋白質(zhì)的表達(dá)。在一些實(shí)施例中,經(jīng)改變的菌株是經(jīng)遺傳工程化的具有一個(gè)或多個(gè)缺失的固有染色體區(qū)或其片段的芽孢桿菌屬物種,其中與在基本上相同的生長(zhǎng)條件下生長(zhǎng)的相應(yīng)的未經(jīng)改變的芽孢桿菌屬宿主菌株相比,感興趣的蛋白質(zhì)具有增強(qiáng)的表達(dá)或產(chǎn)生水平。如本文所使用的,“相應(yīng)的未經(jīng)改變的芽孢桿菌菌株”等是宿主菌株(例如,原始(親本)和/或野生型菌株),該菌株不具有指示的遺傳改變。如本文所使用的,術(shù)語(yǔ)“染色體整合”是指將輸入序列引入宿主細(xì)胞(例如,芽孢桿菌屬)的染色體的過(guò)程。轉(zhuǎn)化dna的同源區(qū)域與染色體的同源區(qū)域?qū)R。隨后,在雙交換(即同源重組)中,同源盒之間的序列被輸入序列替代。在本發(fā)明的一些實(shí)施例中,dna構(gòu)建體的滅活染色體區(qū)段的同源段與芽孢桿菌屬染色體的固有染色體區(qū)域的側(cè)翼同源區(qū)域?qū)R。隨后,在雙交換(即同源重組)中,通過(guò)dna構(gòu)建體缺失固有染色體區(qū)域?!巴粗亟M”意指在相同或幾乎相同核苷酸序列位點(diǎn)處的兩個(gè)dna分子或配對(duì)染色體之間的dna片段的交換。在一個(gè)實(shí)施例中,染色體整合是同源重組。如本文所使用的“同源序列”意指,當(dāng)最佳比對(duì)用于比較時(shí),與另一個(gè)核酸或多肽序列具有100%、99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、88%、85%、80%、75%、或70%序列同一性的核酸或多肽序列。在一些實(shí)施例中,同源序列具有85%至100%之間的序列同一性,而在其他實(shí)施例中,存在在90%至100%之間的序列同一性,并且在更多實(shí)施例中,存在95%和100%的序列同一性。如本文所使用的,“氨基酸”是指肽或蛋白質(zhì)序列或其部分。術(shù)語(yǔ)“蛋白質(zhì)”、“肽”和“多肽”可互換使用。如本文所使用的,“感興趣的蛋白質(zhì)”和“感興趣的多肽”是指期望和/或被評(píng)估的蛋白質(zhì)/多肽。在一些實(shí)施例中,感興趣的蛋白質(zhì)是細(xì)胞內(nèi)的,而在其他實(shí)施例中,其是分泌的多肽。具體地,多肽包括酶,這些酶包括但不限于選自以下各項(xiàng)的那些:淀粉分解酶、蛋白水解酶、纖維素分解酶、氧化還原酶和植物細(xì)胞壁降解酶。更具體地,這些酶包括,但不限于:?;D(zhuǎn)移酶、α-淀粉酶、β-淀粉酶、α-半乳糖苷酶、阿拉伯糖苷酶、芳基酯酶、β-半乳糖苷酶、角叉菜膠酶、過(guò)氧化氫酶、纖維二糖水解酶、纖維素酶、軟骨素酶、角質(zhì)酶、內(nèi)切-β-1,4-葡聚糖酶、內(nèi)切-β-甘露聚糖酶、酯酶、外切-甘露聚糖酶、半乳聚糖酶、葡糖淀粉酶、半纖維素酶、透明質(zhì)酸酶、角蛋白酶、漆酶、乳糖酶、木質(zhì)素酶、脂肪酶、脂肪氧合酶、甘露聚糖酶、氧化酶、果膠酸裂解酶、果膠乙酰酯酶、果膠酶、戊聚糖酶、過(guò)氧化物酶、酚氧化酶、磷酸酶、磷脂酶、植酸酶、多半乳糖醛酸酶、蛋白酶、支鏈淀粉酶、還原酶、鼠李糖半乳糖醛酸酶、β-葡聚糖酶、鞣酸酶、轉(zhuǎn)谷氨酰胺酶、木聚糖乙酰酯酶、木聚糖酶、木葡聚糖酶和木糖苷酶。在一些實(shí)施例中,感興趣的蛋白質(zhì)是與信號(hào)肽融合的分泌多肽(即,待分泌的蛋白質(zhì)上的氨基末端延伸)。幾乎所有分泌的蛋白質(zhì)都使用氨基末端蛋白質(zhì)延伸,其在前體蛋白質(zhì)穿過(guò)膜的靶向和易位中起關(guān)鍵作用。在膜轉(zhuǎn)移期間或之后可以通過(guò)信號(hào)肽酶水解去除該延伸。在本發(fā)明的一些實(shí)施例中,感興趣的多肽或蛋白質(zhì)選自激素、抗體、生長(zhǎng)因子、受體等。涵蓋本發(fā)明的激素包括但不限于:卵泡刺激素、黃體生成激素、促皮質(zhì)素釋放因子、生長(zhǎng)激素抑制素、促性腺激素、加壓素、催產(chǎn)素、促紅細(xì)胞生成素、胰島素等。生長(zhǎng)因子包括但不限于:血小板衍生生長(zhǎng)因子、胰島素樣生長(zhǎng)因子、表皮生長(zhǎng)因子、神經(jīng)生長(zhǎng)因子、成纖維細(xì)胞生長(zhǎng)因子、轉(zhuǎn)化生長(zhǎng)因子、細(xì)胞因子如白介素(例如,il-1至il-13)、干擾素、集落刺激因子等。抗體包括但不限于:直接從需要產(chǎn)生抗體的任何物種獲得的免疫球蛋白。此外,本發(fā)明涵蓋修飾的抗體。多克隆和單克隆抗體也由本發(fā)明所涵蓋。在具體實(shí)施例中,抗體是人抗體。如本文所使用的,多肽的“衍生物”或“變體”意指一種多肽,該多肽通過(guò)以下方式來(lái)自前體多肽(例如,天然多肽):向c-和n-末端之一或二者添加一個(gè)或多個(gè)氨基酸,在氨基酸序列的不同位點(diǎn)的一個(gè)或多個(gè)處取代一個(gè)或多個(gè)氨基酸,在多肽的一端或兩端處或在氨基酸序列的一個(gè)或多個(gè)位點(diǎn)處缺失一個(gè)或多個(gè)氨基酸,在氨基酸序列的一個(gè)或多個(gè)位點(diǎn)處插入一個(gè)或多個(gè)氨基酸,以及其任何組合。多肽的衍生物或變體的制備能以任何方便的方式實(shí)現(xiàn),例如通過(guò)修飾編碼天然多肽的dna序列,將該dna序列轉(zhuǎn)化到合適的宿主中,以及修飾的dna序列的表達(dá)以形成衍生物/變體多肽。衍生物或變體進(jìn)一步包括經(jīng)化學(xué)修飾的多肽。如本文所使用的,術(shù)語(yǔ)“異源蛋白質(zhì)”是指在天然存在于宿主細(xì)胞中的蛋白質(zhì)或多肽。在一些實(shí)施例中,編碼蛋白質(zhì)的基因是天然存在的基因,而在其他實(shí)施例中,可以使用突變的和/或合成的基因。在一些實(shí)施例中,編碼異源蛋白質(zhì)的dna與本質(zhì)上是異源的5'utr連接,這意味著5'utr和編碼感興趣的蛋白質(zhì)的dna來(lái)自不同的基因或不同的生物體。因此,術(shù)語(yǔ)異源的以其最廣泛的意義使用,即兩個(gè)元件不是來(lái)自相同的來(lái)源(例如,物種、細(xì)胞、核酸等)。如本文所使用的,“同源蛋白質(zhì)”是指天然的或天然存在于細(xì)胞中的蛋白質(zhì)或多肽。在實(shí)施例中,細(xì)胞是革蘭氏陽(yáng)性細(xì)胞,而在具體實(shí)施例中,細(xì)胞是芽孢桿菌屬宿主細(xì)胞。在替代性實(shí)施例中,同源蛋白質(zhì)是由其他生物體產(chǎn)生的天然蛋白質(zhì),包括但不限于大腸桿菌。本發(fā)明涵蓋通過(guò)重組dna技術(shù)產(chǎn)生同源蛋白質(zhì)的宿主細(xì)胞。b.非翻譯區(qū)(utr)非翻譯區(qū)或“utr”是mrna的序列或通常未被翻譯的相應(yīng)dna。utr可以在mrna的5'或3'端。5’非翻譯區(qū)(5'utr)(也稱(chēng)為前導(dǎo)序列或前導(dǎo)rna)是起始密碼子上游的mrna的區(qū)域。該區(qū)域?qū)τ谕ㄟ^(guò)病毒、原核生物和真核生物中的機(jī)制的分化的轉(zhuǎn)錄物的翻譯的調(diào)節(jié)很重要。雖然稱(chēng)為非翻譯的,但是其5'utr或其一部分有時(shí)被翻譯成蛋白質(zhì)產(chǎn)物。該產(chǎn)物然后可以調(diào)節(jié)mrna的主要編碼序列的翻譯。然而,在許多其他生物體中,5'utr是非翻譯的,而不能形成復(fù)雜的二級(jí)結(jié)構(gòu)以調(diào)節(jié)翻譯。相應(yīng)的dna序列也通常稱(chēng)為5'或3'utr序列。5'utr可以在轉(zhuǎn)錄起始位點(diǎn)開(kāi)始,并且可以在翻譯起始位點(diǎn)或編碼區(qū)的第一個(gè)密碼子處或附近結(jié)束。5'utr的長(zhǎng)度從3-10個(gè)核苷酸到數(shù)千個(gè)核苷酸變化。5'utr通常含有核糖體結(jié)合位點(diǎn)、順式作用調(diào)節(jié)元件以及其他調(diào)控元件。來(lái)自芽孢桿菌的各種基因含有5'utr。來(lái)自地衣芽孢桿菌的lat(α淀粉酶)基因包括以下5'utr:gtttcacattgaaaggggaggagaatc(seqidno:8),而來(lái)自枯草芽孢桿菌的apre基因包括以下5'utr:gacagaatagtcttttaagtaagtctactctgaatttttttaaaaggagagggtaaaga(seqidno:2)。hambraeus等人已經(jīng)表明來(lái)自枯草芽孢桿菌的apre基因的、58個(gè)核苷酸的長(zhǎng)前導(dǎo)序列(5'utr)是mrna穩(wěn)定性的決定因素(hambraeus等人,microbiology[微生物學(xué)](2002)148:1795-1803)。他們表明,該區(qū)域在5'端形成莖-環(huán)結(jié)構(gòu),并與完整的核糖體結(jié)合位點(diǎn)(rbs)一起導(dǎo)致mrna的穩(wěn)定性增強(qiáng)。然而,hambraeus等人沒(méi)有研究也沒(méi)有教導(dǎo),也不建議,而且此外沒(méi)有意識(shí)到并且因此不會(huì)使本領(lǐng)域技術(shù)人員有動(dòng)機(jī)想到在表達(dá)載體中使用強(qiáng)的5'utr可能導(dǎo)致感興趣的蛋白質(zhì)的更高表達(dá)。諸位發(fā)明人現(xiàn)在發(fā)現(xiàn),表達(dá)載體中的強(qiáng)5'utr確實(shí)導(dǎo)致在修飾的宿主細(xì)胞中更高的感興趣的蛋白質(zhì)的表達(dá)。c.啟動(dòng)子具體地,用于細(xì)菌宿主細(xì)胞的合適的啟動(dòng)子的實(shí)施例包括但不限于例如pamye、pamyq、pamyl、ppsts、psacb、pspac、papre、pveg、phpaii啟動(dòng)子,嗜熱脂肪芽孢桿菌麥芽糖淀粉酶基因的啟動(dòng)子、解淀粉芽孢桿菌(ban)淀粉酶基因的啟動(dòng)子、枯草芽孢桿菌堿性蛋白酶基因的啟動(dòng)子、克勞氏芽孢桿菌堿性蛋白酶基因的啟動(dòng)子、短小芽孢桿菌木糖苷酶基因的啟動(dòng)子、蘇云金芽孢桿菌cryiiia的啟動(dòng)子、和地衣芽孢桿菌α-淀粉酶基因的啟動(dòng)子。另外的啟動(dòng)子包括但不限于a4啟動(dòng)子,以及噬菌體λpr或pl啟動(dòng)子,以及大腸桿菌lac、trp或tac啟動(dòng)子。另外,已經(jīng)發(fā)現(xiàn)核糖體蛋白質(zhì)和rna啟動(dòng)子可用于異源蛋白質(zhì)的生產(chǎn)(參見(jiàn)例如wo2013/086219,其公開(kāi)內(nèi)容通過(guò)引用整體并入本文)??紤]了以下啟動(dòng)子。表2-1:顯示了rpsd、rpsj和rpod(p1)的啟動(dòng)子序列。-35和-10序列以粗體顯示,且每個(gè)啟動(dòng)子加了下劃線。對(duì)于rpsj,兩個(gè)啟動(dòng)子可用(p1和p2)。rpsjp1的-35和-10序列是rpsjp2序列的-35和-10序列的上游(即5')。當(dāng)使用核糖體啟動(dòng)子時(shí),編碼異源感興趣的蛋白質(zhì)的核酸序列的意想不到的高水平的表達(dá)具有若干益處。在一個(gè)實(shí)施例中,當(dāng)與來(lái)自其天然啟動(dòng)子的感興趣的編碼序列的表達(dá)相比時(shí),用核糖體啟動(dòng)子表達(dá)感興趣的編碼序列允許增加感興趣的編碼序列的表達(dá)水平。增加的表達(dá)水平對(duì)于不穩(wěn)定的轉(zhuǎn)錄物特別有用。在另一個(gè)實(shí)施例中,用核糖體啟動(dòng)子表達(dá)感興趣的編碼序列允許在不擴(kuò)增含有核糖體啟動(dòng)子的表達(dá)構(gòu)建體的情況下增加感興趣的編碼序列的表達(dá)水平。當(dāng)使用本領(lǐng)域的其他表達(dá)構(gòu)建體時(shí),為了達(dá)到感興趣的編碼序列的高表達(dá)水平,通常需要擴(kuò)增表達(dá)構(gòu)建體。然而,用本文所述的核糖體啟動(dòng)子獲得的表達(dá)水平足夠高,使得表達(dá)構(gòu)建體的擴(kuò)增可能不是必需的(但可用于獲得甚至更高表達(dá)的感興趣的蛋白質(zhì))。這提供了若干益處。首先,宿主菌株更穩(wěn)定,因?yàn)樗拗骶瓴粫?huì)經(jīng)歷擴(kuò)增的表達(dá)構(gòu)建體的丟失。此外,如果表達(dá)構(gòu)建體不需要擴(kuò)增,那么菌株構(gòu)建更有效。因此,節(jié)省了時(shí)間、金錢(qián)和材料。d.感興趣的編碼序列本發(fā)明所涵蓋的啟動(dòng)子可操作地連接到編碼感興趣的蛋白質(zhì)的核酸(即感興趣的編碼序列)。由編碼序列編碼的多肽可以是酶、激素、生長(zhǎng)因子、細(xì)胞因子、抗生素或其部分、受體或其部分、報(bào)告基因(例如,綠色熒光蛋白)或其他次級(jí)代謝物。在一些實(shí)施例中,酶是蛋白酶、纖維素酶、半纖維素酶、木聚糖酶、淀粉酶、葡糖淀粉酶、角質(zhì)酶、植酸酶、漆酶、脂肪酶、異構(gòu)酶、酯酶、甘露聚糖酶、糖酶、水解酶、氧化酶、通透酶、支鏈淀粉酶、還原酶、差向異構(gòu)酶、互變異構(gòu)酶、轉(zhuǎn)移酶、激酶、磷酸酶,或來(lái)源于細(xì)菌或真菌的類(lèi)似物。在其他實(shí)施例中,酶是蛋白酶,例如絲氨酸、金屬、硫醇或酸性蛋白酶。在一些實(shí)施例中,蛋白酶將是絲氨酸蛋白酶(例如,枯草桿菌蛋白酶)。絲氨酸蛋白酶描述于markland等人,(1983)honne-seyler'szphysiol.chem,364:1537-1540;drenth,j.等人,(1972),eur.j.biochem.[歐洲生物化學(xué)雜志],26:177-181;美國(guó)專(zhuān)利號(hào)4,760,025(re34,606)、5,182,204和6,312,936和ep0323,299中。堿性蛋白酶的實(shí)例包括枯草桿菌蛋白酶,特別是衍生自芽孢桿菌屬的那些(例如,枯草桿菌蛋白酶遲緩、枯草桿菌蛋白酶解淀粉、枯草桿菌蛋白酶嘉士伯(carlsberg)、枯草桿菌蛋白酶309、枯草桿菌蛋白酶147和枯草桿菌蛋白酶168)??梢杂糜诒景l(fā)明的蛋白酶也描述在例如美國(guó)專(zhuān)利公開(kāi)號(hào)2010/0152088和國(guó)際公開(kāi)號(hào)wo2010/056635中。在kmkalisz,“microbialproteinases[微生物蛋白酶]”,advancesinbiochemicalengineeringandbiotechnology[生化工程和生物技術(shù)進(jìn)展],a.fiecht主編,1988年中公開(kāi)了測(cè)定蛋白水解活性的方法。在其他實(shí)施例中,酶是淀粉酶,例如衍生自芽孢桿菌的淀粉酶(如地衣芽孢桿菌lat淀粉酶)、衍生自土芽孢桿菌屬的淀粉酶(如嗜熱脂肪土芽孢桿菌)或木霉屬的淀粉酶(如里氏木霉)。細(xì)菌和真菌淀粉酶描述于例如美國(guó)專(zhuān)利號(hào)8,058,033、美國(guó)專(zhuān)利公開(kāi)號(hào)2010/0015686、美國(guó)專(zhuān)利公開(kāi)號(hào)2009/0314286、英國(guó)申請(qǐng)?zhí)?011513.7和國(guó)際申請(qǐng)?zhí)杙ct/ib2011/053018中。這些參考文獻(xiàn)的每一個(gè)的說(shuō)明書(shū)全部?jī)?nèi)容通過(guò)引用并入本文。在其他實(shí)施例中,酶是木聚糖酶。在某些實(shí)施例中,木聚糖酶衍生自木霉屬(如里氏木霉)。細(xì)菌和真菌木聚糖酶描述于例如國(guó)際公開(kāi)號(hào)wo2001/027252和美國(guó)專(zhuān)利號(hào)7,718,411中。這些參考文獻(xiàn)的每一個(gè)的說(shuō)明書(shū)全部?jī)?nèi)容通過(guò)引用并入本文。在其他實(shí)施例中,酶是植酸酶。在某些實(shí)施例中,植酸酶衍生自檸檬酸桿菌屬(如弗氏檸檬酸桿菌)或大腸桿菌。在其他實(shí)施例中,植酸酶可以是布丘氏菌屬植酸酶如鄉(xiāng)間布丘菌植酸酶。植酸酶描述于例如國(guó)際公開(kāi)號(hào)wo2006/043178、wo2006/038062、wo2008/097619、wo2009/129489、wo2006/038128、wo2008/092901、wo2009/129489和wo2010/122532中。這些參考文獻(xiàn)的每一個(gè)的說(shuō)明書(shū)全部?jī)?nèi)容通過(guò)引用并入本文。在一些實(shí)施例中,酶是纖維素酶。纖維素酶是水解纖維素中β-d-糖苷鍵的酶。纖維素分解酶?jìng)鹘y(tǒng)上分為三大類(lèi):內(nèi)切葡聚糖酶、外切葡聚糖酶或纖維二糖水解酶和β-葡糖苷酶(knowles,j.等人,tibtech,5:255-261(1987))。許多纖維素酶已經(jīng)在科學(xué)文獻(xiàn)中有描述,這是本領(lǐng)域技術(shù)人員所熟知的。在一些實(shí)施例中,激素是卵泡刺激素、黃體生成激素、促皮質(zhì)素釋放因子、生長(zhǎng)激素抑制素、促性腺激素、加壓素、催產(chǎn)素、促紅細(xì)胞生成素、胰島素等。在一些實(shí)施例中,生長(zhǎng)因子(生長(zhǎng)因子是結(jié)合細(xì)胞表面上的受體并以活化細(xì)胞增殖和/或分化為主要結(jié)果的蛋白質(zhì))包括血小板衍生生長(zhǎng)因子、表皮生長(zhǎng)因子、神經(jīng)生長(zhǎng)因子、成纖維細(xì)胞生長(zhǎng)因子、胰島素樣生長(zhǎng)因子、轉(zhuǎn)化生長(zhǎng)因子等。在一些實(shí)施例中,生長(zhǎng)因子是細(xì)胞因子。細(xì)胞因子包括但不限于集落刺激因子、白介素(il-1(α和β),il-2至il-13)和干擾素(α、β和γ)。在一些實(shí)施例中,抗體包括但不限于來(lái)自任何需要大量產(chǎn)生的物種的免疫球蛋白,特別優(yōu)選的是抗體是人抗體。免疫球蛋白可以來(lái)自任何類(lèi)別,即g、a、m、e或d。編碼序列對(duì)宿主細(xì)胞而言可以是天然的或異源的。此外,編碼序列可以編碼全長(zhǎng)蛋白質(zhì)或全長(zhǎng)蛋白質(zhì)的截短形式。本發(fā)明不限于特定的編碼序列,而是涵蓋與本發(fā)明的啟動(dòng)子可操作地連接的大量編碼序列。e.信號(hào)序列在一些實(shí)施例中,特別是當(dāng)感興趣的編碼序列編碼胞外酶(例如纖維素酶、蛋白酶或淀粉降解酶)時(shí),信號(hào)序列可以連接到編碼序列的n端部分。該信號(hào)可用于促進(jìn)dna序列的分泌。信號(hào)序列對(duì)宿主生物而言可以是內(nèi)源的或外源的。信號(hào)序列可以是通常與編碼的多肽相關(guān)聯(lián)的信號(hào)序列。在一些實(shí)施例中,可以如國(guó)際專(zhuān)利公開(kāi)號(hào)wo2011/014278和wo2010/123754中所述經(jīng)改變或修改信號(hào)序列,其說(shuō)明書(shū)通過(guò)引用整體并入本文。在一些實(shí)施例中,信號(hào)序列包括來(lái)自鏈霉菌屬纖維素酶基因的信號(hào)序列。在一個(gè)實(shí)施例中,優(yōu)選的信號(hào)序列是變鉛青鏈霉菌纖維素酶,cela(bently等人,(2002)nature[自然],417:141-147)。然而,本領(lǐng)域技術(shù)人員知道許多信號(hào)肽(例如地衣芽孢桿菌淀粉酶信號(hào)肽),這些信號(hào)肽可以根據(jù)要在宿主生物中表達(dá)和分泌的蛋白質(zhì)來(lái)使用。f.dna構(gòu)建體和載體包含感興趣的編碼區(qū)的本發(fā)明的核酸構(gòu)建體可以通過(guò)已建立的標(biāo)準(zhǔn)方法來(lái)合成制備,例如由beaucage和caruthers(1981)tetrahedronletters[四面體快報(bào)],22:1859-1869,或由matthes等人,(1984)embojournal[歐洲分子生物學(xué)組織雜志],3:801-805描述的亞磷酰胺方法。核酸構(gòu)建體可以是混合的合成和基因組來(lái)源,并且可以通過(guò)連接合成或基因組dna的片段來(lái)制備。也可以通過(guò)聚合酶鏈?zhǔn)椒磻?yīng)使用特異性引物來(lái)制備核酸構(gòu)建體,例如美國(guó)專(zhuān)利號(hào)4,683,202或saiki等人,在science[科學(xué)]239(1988),487-491中所述??梢詫⒈景l(fā)明的dna構(gòu)建體插入載體(例如表達(dá)載體)中。適合于在真菌、酵母和細(xì)菌中克隆、轉(zhuǎn)化和表達(dá)多肽的各種載體是本領(lǐng)域技術(shù)人員已知的。通常,載體或盒將包含本發(fā)明的啟動(dòng)子,任選地包含信號(hào)序列、感興趣的編碼區(qū)和終止子序列。在優(yōu)選的實(shí)施例中,載體將包括位于信號(hào)序列和終止子序列之間的一個(gè)或多個(gè)克隆位點(diǎn)。g.轉(zhuǎn)化本發(fā)明的載體將被轉(zhuǎn)化到宿主細(xì)胞中。一般轉(zhuǎn)化技術(shù)是本領(lǐng)域已知的(ausubel等人,1994,currentprotocolsinmolecularbiology[現(xiàn)代分子生物學(xué)實(shí)驗(yàn)技術(shù)]和campbell等人,1989,curr.genet[現(xiàn)代遺傳學(xué)],16:53-56)。這些一般技術(shù)中的一些包括但不限于使用顆?;蚧驑?基因槍法),在轉(zhuǎn)化過(guò)程之前絲狀真菌細(xì)胞壁的透化(例如,通過(guò)使用高濃度的堿,例如0.05m至0.4mcacl2或乙酸鋰),原生質(zhì)體融合,電穿孔或農(nóng)桿菌介導(dǎo)的轉(zhuǎn)化(美國(guó)專(zhuān)利號(hào)6,255,115)并且用聚乙二醇和cacl.sub.2處理原生質(zhì)體或原生質(zhì)球的方法描述于campbell等人(1989),curr.genet.[現(xiàn)代遺傳學(xué)],16:53-56,1989和penttila,m.等人,(1988)gene[基因],63:11-22。brigidi、derossi、bertarini、riccardi和matteuzzi,(1990),于femsmicrobiol.lett.[歐洲微生物學(xué)會(huì)聯(lián)合會(huì)微生物學(xué)快報(bào)],55:135-138中公開(kāi)了細(xì)菌的轉(zhuǎn)化和表達(dá)方法。在ferrari等人的美國(guó)專(zhuān)利號(hào)5,264,366中提供了用于蛋白酶缺失的芽孢桿菌菌株的優(yōu)選的一般轉(zhuǎn)化和表達(dá)方案。鏈霉菌中的轉(zhuǎn)化和表達(dá)可以在hopwood等人,geneticmanipulationofstreptomyces:alaboratorymanual[鏈霉菌的遺傳操作:實(shí)驗(yàn)室手冊(cè)](1985)johninnisfoundation[約翰·英尼斯基金會(huì)],英國(guó)諾維奇中找到。在其他實(shí)施例中,曲霉屬和木霉屬中的轉(zhuǎn)化和表達(dá)見(jiàn)描述于例如美國(guó)專(zhuān)利號(hào)5,364,770;美國(guó)專(zhuān)利號(hào)6,022,725;和nevalainen等人,1992,themolecularbiologyoftrichodermaanditsapplicationtotheexpressionofbothhomologousandheterologousgenes[木霉及其在同源和異源基因的表達(dá)中應(yīng)用的分子生物學(xué)],molecularindustrialmycology[分子工業(yè)真菌學(xué)],leon和berka主編,馬塞爾德克爾公司,第129-148頁(yè)中。h.宿主細(xì)胞可根據(jù)本發(fā)明使用的宿主細(xì)胞包括細(xì)菌和真菌細(xì)胞。優(yōu)選的真菌宿主細(xì)胞包括絲狀真菌細(xì)胞,例如曲霉屬和木霉屬細(xì)胞。優(yōu)選的細(xì)菌宿主細(xì)胞包括革蘭氏陽(yáng)性和革蘭氏陰性細(xì)胞,包括芽孢桿菌、分支桿菌、放線菌和鏈霉菌屬細(xì)胞。宿主細(xì)胞還包括但不限于:大腸桿菌、假單胞菌屬(例如,銅綠假單胞菌和產(chǎn)堿假單胞菌)、鏈霉菌屬(例如,變色青鏈霉菌)、枯草芽孢桿菌、地衣芽孢桿菌、遲緩芽孢桿菌、短芽孢桿菌、嗜熱脂肪芽孢桿菌、嗜堿芽孢桿菌、解淀粉芽孢桿菌、凝結(jié)芽孢桿菌、環(huán)狀芽孢桿菌、燦爛芽胞桿菌、巨大芽孢桿菌、和蘇云金芽孢桿菌。i.細(xì)胞培養(yǎng)可以在常規(guī)營(yíng)養(yǎng)培養(yǎng)基中培養(yǎng)宿主細(xì)胞和轉(zhuǎn)化細(xì)胞。用于轉(zhuǎn)化的宿主細(xì)胞的培養(yǎng)基可以適當(dāng)?shù)匦揎椧约せ顔?dòng)子并選擇轉(zhuǎn)化體。特定培養(yǎng)條件(如溫度、ph等)可以是用于選擇用于表達(dá)的宿主細(xì)胞的那些條件,并且對(duì)于本領(lǐng)域技術(shù)人員將是顯而易見(jiàn)的。此外,優(yōu)選的培養(yǎng)條件可以在諸如sambrook,(1982)同上,kieser,t、mj.bibb、mj.buttner、kfchater、和dahopwood(2000),practicalstreptomycesgenetics[實(shí)用鏈霉菌屬遺傳學(xué)],johninnesfoundation[約翰·內(nèi)斯基金會(huì)],英國(guó)諾維奇,harwood等人,(1990),molecularbiologicalmethodsforbacillus[芽孢桿菌的分子生物學(xué)方法],約翰威利公司和/或來(lái)自美國(guó)典型培養(yǎng)物保藏中心(atcc,“http://www.atcc.org/”))的科學(xué)文獻(xiàn)中找到。真菌宿主細(xì)胞(如木霉屬細(xì)胞)的穩(wěn)定轉(zhuǎn)化體通常可以通過(guò)其較快的生長(zhǎng)速度或者在固體培養(yǎng)基上形成具有光滑而不是粗糙輪廓的圓形菌落來(lái)與不穩(wěn)定轉(zhuǎn)化體區(qū)分開(kāi)來(lái)。j.表達(dá)多肽的回收可以通過(guò)常規(guī)方法從培養(yǎng)基中回收由轉(zhuǎn)化的宿主細(xì)胞產(chǎn)生的多肽,包括通過(guò)離心或過(guò)濾從培養(yǎng)基中分離宿主細(xì)胞,或者如果需要,破壞細(xì)胞并從細(xì)胞部分和碎片中除去上清液。通常經(jīng)過(guò)澄清后,上清液或?yàn)V液的蛋白質(zhì)組分通過(guò)鹽(例如硫酸銨)沉淀。然后沉淀的蛋白質(zhì)被溶解,并且可以通過(guò)各種色譜法進(jìn)行純化,例如離子交換色譜法、凝膠過(guò)濾色譜法、親和色譜法和其他本領(lǐng)域公認(rèn)的程序。k.構(gòu)建體組裝在一個(gè)一般的實(shí)施例中,本發(fā)明涉及在體外組裝dna構(gòu)建體,然后將這種構(gòu)建體直接克隆到感受態(tài)宿主細(xì)胞(例如,芽孢桿菌宿主細(xì)胞)中,使得構(gòu)建體整合到宿主基因組中。例如,在一些實(shí)施例中,使用pcr融合和/或連接在體外組裝dna構(gòu)建體。在優(yōu)選的實(shí)施例中,dna構(gòu)建體是非質(zhì)粒dna構(gòu)建體。在另一個(gè)實(shí)施例中,dna構(gòu)建體包含其中已引入突變的dna。然后將該構(gòu)建體用于轉(zhuǎn)化宿主細(xì)胞。在這方面,優(yōu)選使用宿主細(xì)胞(例如,芽孢桿菌)的高度感受態(tài)的突變體來(lái)促進(jìn)構(gòu)建體直接克隆到細(xì)胞中。例如,攜帶在木糖誘導(dǎo)型啟動(dòng)子(pxyl-comk)控制下的ocmk基因的芽孢桿菌可以以非常高的效率被可靠地轉(zhuǎn)化,如本文所述。可以使用本領(lǐng)域已知的任何合適的方法來(lái)轉(zhuǎn)化細(xì)胞。在轉(zhuǎn)化前可將dna構(gòu)建體插入載體(即,質(zhì)粒)中。在一些優(yōu)選的實(shí)施例中,使用適當(dāng)?shù)南拗泼?即,不破壞dna構(gòu)建體的限制酶)來(lái)切割環(huán)狀質(zhì)粒。因此,在一些實(shí)施例中,環(huán)形質(zhì)??捎糜诒景l(fā)明。然而,在替代性實(shí)施例中,使用線性質(zhì)粒。在一些實(shí)施例中,在不存在質(zhì)粒dna的情況下使用dna構(gòu)建體(即,pcr產(chǎn)物)。為了進(jìn)一步說(shuō)明本發(fā)明及其優(yōu)點(diǎn),給出以下具體實(shí)例是為了說(shuō)明本發(fā)明而提供的,不應(yīng)以任何方式解釋為限制本發(fā)明的范圍。無(wú)論dna構(gòu)建體是否并入到載體中或者在質(zhì)粒dna的不存在下使用,將其用于轉(zhuǎn)化微生物。據(jù)預(yù)期,任何合適的轉(zhuǎn)化方法將用于本發(fā)明。在實(shí)施例中,將dna構(gòu)建體的至少一個(gè)拷貝整合到宿主芽孢桿菌染色體中。在一些實(shí)施例中,使用本發(fā)明的一種或多種dna構(gòu)建體轉(zhuǎn)化宿主細(xì)胞。實(shí)驗(yàn)提供以下實(shí)例以便證實(shí)和進(jìn)一步說(shuō)明本發(fā)明的某些實(shí)施例和方面,而不應(yīng)被解釋為限制其范圍。在下面的實(shí)驗(yàn)披露中,應(yīng)用以下縮寫(xiě)中的某些:℃(攝氏度);rpm(每分鐘轉(zhuǎn)數(shù));μg(微克);mg(毫克);μl(微升);ml(毫升);mm(毫摩爾);μm(微摩爾);sec(秒);min(s)(分鐘);hr(s)(小時(shí));od280(在280nm處的光密度);od600(在600nm處的光密度);pcr(聚合酶鏈反應(yīng));rt-pcr(逆轉(zhuǎn)錄pcr);sds(十二烷基硫酸鈉);abs(吸光度)。實(shí)例1通過(guò)apre5'utr改善地衣芽孢桿菌α-淀粉酶(lat)的產(chǎn)量將包含具有天然lat啟動(dòng)子、lat5’utr、lat信號(hào)肽序列和lat轉(zhuǎn)錄終止子的地衣芽孢桿菌α-淀粉酶(lat)基因的表達(dá)構(gòu)建體克隆進(jìn)us7968691中描述的picath載體的xhol位點(diǎn)上。lat表達(dá)盒(xhoi片段)顯示在seqidno:1中。lat前體基因用斜體顯示,而lat5'utr以粗體顯示(seqidno:1)。將picath-latori1質(zhì)粒(見(jiàn)圖1)轉(zhuǎn)化到地衣芽孢桿菌菌株bml780的基因組中,如美國(guó)專(zhuān)利號(hào)7,968,691所述。切除后,擴(kuò)增表達(dá)盒至50ppm氯霉素被證明是lat5'utr菌株中l(wèi)at產(chǎn)生的最佳選擇。通過(guò)融合pcr技術(shù),將picath-latori1中的lat5'utr替換為枯草芽孢桿菌apre5'utr。在5’端具有另外的鳥(niǎo)嘌呤的枯草芽孢桿菌apre5’utr的核苷酸序列如seqidno:2所示。gacagaatagtcttttaagtaagtctactctgaatttttttaaaaggagagggtaaaga帶有apre5'utr(xhoi-noti片段)的lat表達(dá)盒顯示于seqidno:3中。lat前體基因用斜體字顯示,而apre-5'utr以粗體顯示:含有與apre-5'utr融合的lat(即地衣芽孢桿菌amyl)基因的picath質(zhì)粒被轉(zhuǎn)化并整合到如上所述的菌株bml780的基因組中。切除后,擴(kuò)增至25ppm的氯霉素被證明是在apre-5'utr菌株lat生產(chǎn)中的最佳選擇。通過(guò)在生產(chǎn)培養(yǎng)基(每升:10g淀粉、10g大豆胨、10g大豆粉、20g葡萄糖、3.6g尿素、0.75gcacl2.2h2o、21.75gk2hpo4、17gkh2po4、mops緩沖液,微量營(yíng)養(yǎng)素;ph為6.8)中生長(zhǎng)兩種菌株來(lái)比較通過(guò)菌株bml780-lat-cap50(lat5'utr)的lat生產(chǎn)和bml780-[apre-5’utr]-lat-cap25(apre5’utr)的生產(chǎn)。在infors孵育器(37℃,300rpm)中生長(zhǎng)68小時(shí)后,根據(jù)供應(yīng)商(梅格澤姆國(guó)際公司(megazymeinternational),愛(ài)爾蘭)的指示,使用梅格澤姆公司(megazyme)α-淀粉酶測(cè)定試劑盒,使用ceralpha作為底物測(cè)定上清液中的lat活性?;钚缘南鄬?duì)數(shù)量(即生產(chǎn)率)如表3所示。表3在lat5'utr菌株中對(duì)比在apre5’utr菌株中l(wèi)at的產(chǎn)生lat5'utrapre5'utrlatα淀粉酶100119實(shí)例2通過(guò)apre5’utr提高支鏈淀粉酶pulm104的產(chǎn)量pulm104是bacillusderamificans支鏈淀粉酶,其n-端104個(gè)氨基酸已被缺失。產(chǎn)生pulm104的地衣芽孢桿菌菌株的構(gòu)建在us8354101中作了描述。us8354101中描述的最佳生產(chǎn)菌株是bml780-pulm104-ori1-cap75,其含有amyl(lat)5'utr。該amyl(lat)5'utr被如下列的apre5'utr替換。首先,質(zhì)粒phplt-blich-int-盒由dna2.0inc.[dna2.0公司](美國(guó)加利福尼亞州門(mén)洛帕克)合成地構(gòu)建。該質(zhì)粒的設(shè)計(jì)基于載體phplt(us5871550)、載體picath(us8354101)和來(lái)自枯草芽孢桿菌的apre5'utr、utrv2或utrv3(下表列出序列)。載體phplt-blich-int-盒的圖譜示于圖2中。5'apreutr-pulm104表達(dá)盒的dna序列如下所示(5'utr加了下劃線)(seqidno:11):ctcgaggcttttcttttggaagaaaatatagggaaaatggtacttgttaaaaattcggaatatttatacaatatcatatgacagaatagtcttttaagtaagtctactctgaatttttttaaaaggagagggtaaagaatgaaacaacaaaaacggctttacgcccgattgctgacgctgttatttgcgctcatcttcttgctgcctcattctgcagcttcagcagctgctaaaccggcagtcagcaacgcttatctggatgccagcaaccaagtcctggtcaaactgagccaaccgctgacacttggagaaggagcgagcggatttacggtccatgatgacacggcgaacaaagatatcccggtcacgagcgttaaagatgctagcctgggccaagatgtcacagcagttctggcgggcacgtttcaacatatctttggcggatcagattgggcaccggataatcacagcacgctgctgaaaaaagtcacgaacaacctgtatcagtttagcggagatctgccggaaggcaactatcaatataaagtcgccctgaacgatagctggaacaatccgagctatccgagcgataacatcaatctgacagtcccggcaggcggagcacatgtcacgtttagctatatcccgagcacacatgccgtctatgacacgatcaacaacccgaacgccgatcttcaagtcgaaagcggcgtcaaaacggatctggtcacagtcacattgggagaagatccggatgtcagccatacactgagcatccaaacggatggctatcaagcgaaacaagtcatcccgagaaacgtcctgaacagcagccagtattattatagcggcgatgatctgggcaacacgtatacacaaaaagcgacgacgtttaaagtttgggcgccgacaagcacacaagtcaacgtcctgctgtatgattcagcaacaggcagcgtcacaaaaatcgtcccgatgacagcatcaggacatggagtctgggaagcgacggtcaaccaaaacctggaaaactggtattatatgtatgaagtcacgggccaaggatcaacaagaacagcggtcgatccgtatgctacagcaatcgccccgaatggaacaagaggcatgatcgtcgatctggcaaaaacagacccggcaggctggaatagcgataaacatatcacgccgaaaaacatcgaagatgaagtcatctatgaaatggacgtccgggattttagcatcgatccgaacagcggcatgaaaaacaaaggcaaatatctggcgctgacggaaaaaggaacaaaaggcccggataacgtcaaaacaggcatcgatagcctgaaacaactgggcatcacacatgtccaactgatgccggtctttgctagcaatagcgtcgatgaaacggacccgacacaagataactggggctatgacccgagaaattatgatgtcccggaaggccaatatgccacgaacgccaatggaaacgcccggatcaaagaatttaaagaaatggtcctgagccttcatagagaacatatcggcgtcaacatggacgtcgtctataaccatacgtttgccacacagatcagcgactttgataaaatcgtgccggaatattattatcggacggatgacgccggcaattatacgaatggcagcggcacaggaaatgaaatcgccgccgaaagaccgatggtccagaaatttatcatcgacagccttaaatattgggtcaacgaatatcatatcgacggctttcgctttgatctgatggcgctgctgggcaaagatacaatgagcaaagcggcgagcgaacttcatgctatcaatccgggcatcgctctttatggagaaccgtggacaggaggaacatcagcactgccggatgatcaactgctgacaaaaggcgcccaaaaaggaatgggagtcgccgtctttaacgacaacctgagaaatgccctggatggcaacgtttttgatagcagcgcccaaggatttgctacaggagcgacaggactgacagatgccatcaaaaatggcgtcgaaggcagcatcaacgattttacaagcagcccgggagagacgatcaattatgtcacgagccatgacaactatacgctgtgggacaaaatcgctctgagcaacccgaatgatagcgaagcggaccggatcaaaatggatgaactggcacaagcagtcgtcatgacatcacaaggcgtcccgtttatgcaaggcggagaagaaatgctgagaacgaaaggcggcaacgacaacagctataatgccggcgatgccgtcaatgaatttgactggagccggaaagcacaatatccggacgtctttaactattattcaggacttatccatctgagactggaccatccggcgtttagaatgacgacggcgaacgaaatcaacagccatcttcagtttctgaacagcccggaaaatacggtcgcctatgaactgacggaccatgtgaacaaagacaaatggggcaacatcatcgtcgtttataacccgaacaaaacggtcgccacaatcaatcttccgagcggcaaatgggcaatcaatgccacaagcggcaaagttggagaaagcacactgggacaagcagaaggatcagtccaagtcccgggaatcagcatgatgatccttcatcaagaagtcagcccggaccacggcaaaaaataagttaacagaggacggatttcctgaaggaaatccgtttttttattttaagcttggagacaaggtaaaggataaaacagctgcggccgc(seqidno:11)接下來(lái),使用phplt-blich-int-盒(1ng/μl)作為模板,用引物pulm104-載體-rv(cggtttagcagctgcgctagctgcagaatgaggc(seqidno:4))和pulm104-載體-fw(cggcaaaaaatgaaagcttctcgaggttaacagagg(seqidno:5))進(jìn)行pcr。使用bml780-pulm104-ori1-cap75的細(xì)胞材料作為模板,用引物pulm104-assbl.-fw(cagctagcgcagctgctaaaccggcagtcagcaac(seqidno:6))和pulm104-assbl.-rv(cgagaagctttcatttttgccgtggtccgggctg(seqidno:7))進(jìn)行第二次pcr。兩種pcr均按照nebq5標(biāo)準(zhǔn)方案進(jìn)行,26個(gè)循環(huán)。將柱狀純化的pulm104片段首先用hindiii(neb)完全水解,然后通過(guò)nhei(neb)部分水解。載體片段也進(jìn)行柱純化,并用nhei和hindiii完全水解。再次純化載體和pulm104水解混合物,然后使用rochet4快速連接試劑盒(#11635379001)進(jìn)行連接。在rca擴(kuò)增(來(lái)自gehealthcarelifesciences[通用電氣醫(yī)療集團(tuán)生命科學(xué)部]的templiphidna擴(kuò)增試劑盒)后,將rca產(chǎn)物轉(zhuǎn)化為活性枯草芽孢桿菌細(xì)胞,鋪在含有5ppm氯霉素和10ppm新霉素的心輸液瓊脂(difco)上,并在37℃下孵育過(guò)夜。第二天,在具有5ppm氯霉素和10ppm新霉素的新鮮心臟輸液瓊脂平板上重復(fù)地將來(lái)自轉(zhuǎn)化板的24cfu的復(fù)制,并孵育過(guò)夜。第二天早晨,用含有在100mm的naacph5中的0.1%azcl-支鏈淀粉的1%瓊脂覆蓋板。將板在37℃下孵育3小時(shí),從復(fù)制板中挑取陽(yáng)性(支鏈淀粉酶陽(yáng)性),并在含有5ppm氯霉素和10ppm新霉素的10mltsb中生長(zhǎng)。將2ml培養(yǎng)物用于制備質(zhì)粒dna,并將30μldna制備物用noti和apai進(jìn)行水解。從凝膠中純化含有5'-重復(fù)-cath-pulm104表達(dá)盒的4kb片段,并自連接(t4連接酶roche),擴(kuò)增rca并轉(zhuǎn)化進(jìn)地衣芽孢桿菌菌株bml780中。在選擇含有7.5ppm氯霉素的心輸液瓊脂后,如上所述,使用azcl-支鏈淀粉覆蓋法檢查轉(zhuǎn)化體的支鏈淀粉酶活性。通過(guò)dna測(cè)序(baseclear,荷蘭)證實(shí)了4個(gè)支鏈淀粉酶陽(yáng)性克隆中表達(dá)盒的序列。如us8354101中所述擴(kuò)增表達(dá)盒。對(duì)于在apre5’utr菌株中支鏈淀粉酶的生產(chǎn),擴(kuò)增至25ppm的氯霉素被證明是最佳的,并且bml780-[apre-5’utr]-pulm104-ori1-cap25菌株被用于進(jìn)一步的研究中。通過(guò)在生產(chǎn)培養(yǎng)基中生長(zhǎng)兩種菌株來(lái)比較通過(guò)菌株bml780-pulm104-ori1-cap75(lat5'utr)的pulm104的生產(chǎn)與bml780-[apre5'utr]-pulm104-ori1-cap25(apre5'utr)的生產(chǎn)(參見(jiàn)實(shí)例1)。在infors孵化器(300ppm,37℃)生長(zhǎng)68小時(shí)后,根據(jù)供應(yīng)商(梅格澤姆國(guó)際公司(megazymeinternational),愛(ài)爾蘭)的說(shuō)明,用梅格澤姆公司(megazyme)支鏈淀粉酶測(cè)定法,使用紅色支鏈淀粉作為底物測(cè)定上清液中的支鏈淀粉酶活性?;钚缘南鄬?duì)數(shù)量(即生產(chǎn)率)如表4所示。5'apreutr的版本2和3表現(xiàn)出可比較的蛋白質(zhì)產(chǎn)量。表4在lat5'utr菌株中對(duì)比在apre5'utr菌株中pulm104的生產(chǎn)lat5'utrapre5'utrpulm104100129實(shí)例3利用具有核糖體rna啟動(dòng)子的apre5'utr的感興趣的蛋白質(zhì)的改善的生產(chǎn)將包含核糖體rna啟動(dòng)子(例如,p1rrnb、p1rrni、p2rrni、p1rrne、p2rrne或p3rrne)或核糖體蛋白質(zhì)啟動(dòng)子(例如,prpsd、p1rpsj、p2rpsj)或σ因子啟動(dòng)子(例如prpod)、apre5'utr、如本文所述的合適的信號(hào)序列(例如,lat、apre、cbh1、鏈霉菌纖維素酶基因信號(hào)序列)、本文所述的合適的感興趣的基因和轉(zhuǎn)錄終止子的表達(dá)構(gòu)建體克隆到合適的載體(例如,picath)的合適的限制性位點(diǎn)(例如,xhoi)。表達(dá)盒示于seqidno:12和13中。將含有感興趣的基因的質(zhì)粒載體轉(zhuǎn)化并整合到合適的細(xì)菌菌株的基因組中(例如,如上所述的菌株bml780)。通過(guò)在生產(chǎn)培養(yǎng)基(每升:10g淀粉、10g大豆胨、10g大豆粉、20g葡萄糖、3.6g尿素、0.75gcacl2.2h2o、21.75gk2hpo4、17gkh2po4、mops緩沖液,微量營(yíng)養(yǎng)素;ph為6.8)中培養(yǎng)菌株來(lái)比較通過(guò)細(xì)菌菌株的感興趣的蛋白質(zhì)的生產(chǎn)和各種對(duì)照菌株。在infors培養(yǎng)箱(37℃,300rpm)中生長(zhǎng)68小時(shí)后,測(cè)定上清液中的蛋白質(zhì)活性。該rrnip2啟動(dòng)子(來(lái)自枯草芽孢桿菌)顯示為小寫(xiě)字母。該apre5'utr以黑體和下劃線顯示。成熟的編碼鏈用斜體顯示。終止密碼子以粗體顯示。具有轉(zhuǎn)錄終止子的序列加下劃線。rrnip2啟動(dòng)子-apre5'utr-lat信號(hào)肽-成熟lat表達(dá)構(gòu)建體如下所示(seqidno:12):rrnip2啟動(dòng)子-apre5'utr-lat信號(hào)肽-成熟pulm104表達(dá)構(gòu)建體如下所示(seqidno:13):實(shí)例4使用apre5’utr和其變體的嗜熱脂肪土芽孢桿菌淀粉酶變體的改善的生產(chǎn)在標(biāo)準(zhǔn)地衣芽孢桿菌整合載體,含有l(wèi)at(地衣芽孢桿菌amyl)啟動(dòng)子下游嗜熱脂肪土芽孢桿菌(amys)變體基因的pkb360-cath中,lat5'-utr序列由apre-wt5'-utr和apre-v2-5'-utr或apre-v3-5'-utr替代(參見(jiàn)圖3的通用質(zhì)粒圖譜)。表達(dá)盒的序列如下所示。lat啟動(dòng)子以小寫(xiě)字母顯示,該apre5'utr在粗體和下劃線顯示,lat信號(hào)肽以小寫(xiě)字母和下劃線顯示,amys變體的成熟鏈?zhǔn)怯眯斌w顯示,終止密碼子是以粗體顯示,具有轉(zhuǎn)錄終止子的序列是以下劃線顯示。lat啟動(dòng)子-apre5'utr-lat信號(hào)肽-成熟amys變體(seqidno:14):lat啟動(dòng)子-v2_5'utr-lat信號(hào)肽-成熟amys變體(seqidno:15):lat啟動(dòng)子-v3_5'utr-lat信號(hào)肽-成熟amys變體(seqidno:16)轉(zhuǎn)化后,將質(zhì)粒整合到地衣芽孢桿菌染色體的cat位點(diǎn)上。隨后,通過(guò)切除載體序列獲得‘環(huán)出’菌株,僅將整合到染色體中的cat-lat-5'-utr-amys變體表達(dá)盒除外。然后通過(guò)使菌株逐漸增加氯霉素濃度來(lái)擴(kuò)增表達(dá)盒(cap5、cap25、cap50、cap75μ克/毫升)中。測(cè)定分泌的淀粉酶活性,如表5所示。表5此外,在擴(kuò)增后測(cè)量表達(dá)盒的拷貝數(shù),并與淀粉酶產(chǎn)生比較,并且總結(jié)在表6中。表6相對(duì)分泌淀粉酶活性和表達(dá)盒的拷貝數(shù)因此,可以看出,包含apre5'utr或其變體的表達(dá)盒需要較低量的氯霉素濃度以實(shí)現(xiàn)與lat5'utr相當(dāng)?shù)牡矸勖干a(chǎn)和分泌。換句話說(shuō),需要較少的擴(kuò)增來(lái)實(shí)現(xiàn)更高的表達(dá)效價(jià)。雖然前述組合物和方法已經(jīng)通過(guò)說(shuō)明和實(shí)例的方式出于清楚理解的目的在一些細(xì)節(jié)方面進(jìn)行了描述,但是對(duì)于本領(lǐng)域的普通技術(shù)人員而言根據(jù)本文的傳授內(nèi)容顯而易見(jiàn)的是可以對(duì)其進(jìn)行某些改變和修改而不偏離所附權(quán)利要求的精神或范圍。因此,前面僅僅舉例說(shuō)明了本發(fā)明組合物和方法的原理。將了解的是本領(lǐng)域技術(shù)人員將能夠設(shè)計(jì)不同的安排,這些不同的安排雖然沒(méi)有在此明確地描述或顯示,但體現(xiàn)本發(fā)明組合物和方法的原理并且被包括在其精神和范圍之內(nèi)。此外,本文敘述的所有實(shí)例和條件性語(yǔ)言主要旨在幫助讀者理解諸位發(fā)明人所貢獻(xiàn)的本發(fā)明的組合物和方法的原理和概念以推動(dòng)本領(lǐng)域發(fā)展,并且將被視為而不限于這些具體敘述的實(shí)例和條件。此外,本文中敘述本發(fā)明組合物和方法的原理、方面、以及實(shí)施例的所有陳述連同其具體實(shí)例旨在涵蓋其結(jié)構(gòu)和功能等效物兩者。另外,預(yù)期此類(lèi)等效物包括當(dāng)前已知的等效物以及將來(lái)開(kāi)發(fā)的等效物兩者,即不論結(jié)構(gòu)如何而執(zhí)行相同功能的任何開(kāi)發(fā)的要素。因此,本發(fā)明的組合物和方法的范圍不是旨在受限于本文顯示和描述的示例性實(shí)施例。當(dāng)前第1頁(yè)12