具有纖維二糖水解酶活性的多肽和編碼該多肽的多核苷酸的制作方法【專利摘要】本發(fā)明涉及具有纖維二糖水解酶活性的分離的多肽,催化域,和糖結(jié)合域,以及編碼所述多肽、催化域或糖結(jié)合域的分離的多核苷酸。本發(fā)明還涉及包含所述多核苷酸的核酸構(gòu)建體、載體和宿主細(xì)胞,以及用于產(chǎn)生和使用所述多肽、催化域或糖結(jié)合域的方法。【專利說明】具有纖維二糖水解酶活性的多肽和編碼該多肽的多核苷酸[0001]對(duì)于在聯(lián)邦資助的研究和開發(fā)下完成的發(fā)明的權(quán)利的聲明[0002]本發(fā)明是在由美國(guó)能源部授予的合作協(xié)議(CooperativeAgreement)DE-FC36-08G018080下以政府支持完成的。政府在本發(fā)明中具有一定權(quán)利。[0003]涉及序列表[0004]本申請(qǐng)包含計(jì)算機(jī)可讀形式的序列表,其通過提述并入本文。[0005]發(fā)明背景【
技術(shù)領(lǐng)域:
】[0006]本發(fā)明涉及具有纖維二糖水解酶活性的多肽,催化域,和糖結(jié)合域,和編碼所述多肽,催化域,和糖結(jié)合域的多核苷酸。本發(fā)明亦涉及包含所述多核苷酸的核酸構(gòu)建體、載體和宿主細(xì)胞,以及產(chǎn)生和使用所述多肽,催化域,和糖結(jié)合域的方法?!?br>背景技術(shù):
】[0007]纖維素是簡(jiǎn)單糖葡萄糖通過β-1,4-鍵共價(jià)連接的聚合物。許多微生物產(chǎn)生水解連接的葡聚糖的酶。這些酶包括內(nèi)切葡聚糖酶、纖維二糖水解酶和葡糖苷酶。內(nèi)切葡聚糖酶在隨機(jī)位置消化纖維素聚合物,使其暴露于纖維二糖水解酶攻擊(attack)。纖維二糖水解酶從纖維素聚合物的末端順序地釋放纖維二糖的分子。纖維二糖是水溶性的β-1,4-連接的葡萄糖二聚體。β-葡糖苷酶將纖維二糖水解成葡萄糖。[0008]將含木素纖維素原料(lignocellulosicfeedstock)轉(zhuǎn)化為乙醇具有以下優(yōu)勢(shì):大量原料現(xiàn)成可用,避免燃燒或填埋材料的合意性和乙醇燃料的清潔性。木材、農(nóng)業(yè)殘余物、草本作物和城市固體廢物被認(rèn)為是用于乙醇生產(chǎn)的原料。這些材料主要由纖維素、半纖維素和木質(zhì)素組成。一旦木素纖維素轉(zhuǎn)化為可發(fā)酵的糖如葡萄糖,所述可發(fā)酵的糖可容易地由酵母發(fā)酵為乙醇。[0009]UNIPR0T:Q5B2Q4公開了來自構(gòu)巢裸孢殼(Emericellanidulans)的可能的纖維二糖水解酶A蛋白。W02008140749公開了嗜熱毀絲霉(Myceliophthorathermophila)纖維二糖水解酶I。W02003070939-A1公開了毛革蓋菌(Coriolushirsutus)纖維二糖水解酶I蛋白。UNIPR0T:Q692I2公開了來自嗜熱毛殼菌嗜熱變種(Chaetomiumthermophilumvar.thermophilum)的CBHI外切葡聚糖酶。[0010]在本領(lǐng)域存在對(duì)供用于纖維素材料的水解的新的具有纖維二糖水解酶活性的多肽的需求。[0011]本發(fā)明提供了具有纖維二糖水解酶活性的多肽和編碼所述多肽的多核苷酸?!?br/>發(fā)明內(nèi)容】[0012]本發(fā)明涉及具有纖維二糖水解酶活性的分離的多肽,其選自下組:[0013](a)多肽,其與SEQIDN0:2的成熟多肽具有至少70%序列同一性,多肽,其與SEQIDN0:4的成熟多肽具有至少88%序列同一性,多肽,其與SEQIDN0:6的成熟多肽具有至少66%序列同一性,或多肽,其與SEQIDN0:8的成熟多肽具有至少81%序列同一性;[0014](b)多肽,其由多核苷酸編碼,所述多核苷酸在中等嚴(yán)格條件、中等-高嚴(yán)格條件、高嚴(yán)格條件、或非常高嚴(yán)格條件下與以下雜交:(i)SEQIDNO:1的成熟多肽編碼序列,SEQIDN0:3的成熟多肽編碼序列,SEQIDN0:5的成熟多肽編碼序列,或SEQIDN0:7的成熟多肽編碼序列,(ii)SEQIDNO:1的cDNA序列,SEQIDNO:3的cDNA序列,SEQIDNO:5的cDNA序列,或SEQIDN0:7的cDNA序列,或(iii)⑴或(ii)的全長(zhǎng)互補(bǔ)物。[0015](C)多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:1或其cDNA序列的成熟多肽編碼序列具有至少70%序列同一性;多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDN0:3或其cDNA序列的成熟多肽編碼序列具有至少88%序列同一性;多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:5或其cDNA序列的成熟多肽編碼序列具有至少66%序列同一性;多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDN0:7或其cDNA序列的成熟多肽編碼序列具有至少81%序列同一性;[0016](d)SEQIDNO:2的成熟多肽,SEQIDNO:4的成熟多肽,SEQIDNO:6的成熟多肽,或SEQIDN0:8的成熟多肽在一個(gè)或多個(gè)(例如幾個(gè))位置包含取代、缺失和/或插入的變體;和[0017](e)(a)、(b)、(c)或(d)的多肽具有纖維二糖水解酶活性的片段。[0018]本發(fā)明亦涉及分離的多肽,所述分離的多肽包含催化域,所述催化域選自下組:[0019](a)催化域,其與SEQIDN0:2的氨基酸18至458具有至少70%序列同一性;催化域,其與SEQIDNO:4的氨基酸21至450具有至少88%序列同一性;催化域,其與SEQIDN0:6的氨基酸22至457具有至少66%序列同一性;或催化域,其與SEQIDN0:8的氨基酸21至461具有至少81%序列同一性;[0020](b)催化域,其由多核苷酸編碼,所述多核苷酸在中等嚴(yán)格條件、中等-高嚴(yán)格條件、高嚴(yán)格條件、或非常高嚴(yán)格條件下與以下雜交:(i)SEQIDNO:1的核苷酸52至1454,SEQIDNO:3的核苷酸61至1733,SEQIDNO:5的核苷酸64至1782,或SEQIDNO:7的核苷酸52至1460,(ii)其cDNA序列,或(iii)⑴或(ii)的全長(zhǎng)互補(bǔ)物;[0021](c)催化域,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:1的核苷酸52至1454具有至少70%序列同一性;催化域,其由多核苷酸編碼,所述多核苷酸與SEQIDN0:3的核苷酸61至1733具有至少88%序列同一性;催化域,其由多核苷酸編碼,所述多核苷酸與SEQIDN0:5的核苷酸64至1782具有至少66%序列同一性;或催化域,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:7的核苷酸52至1460具有至少81%序列同一性;[0022](d)SEQIDNO:2的氨基酸18至458,SEQIDNO:4的氨基酸21至450,SEQIDNO:6的氨基酸22至457,或SEQIDNO:8的氨基酸21至461在一個(gè)或多個(gè)(例如幾個(gè))位置包含取代、缺失和/或插入的變體;和[0023](e)(a)、(b)、(C)、或(d)的催化域具有纖維二糖水解酶活性的變體。[0024]本發(fā)明亦涉及分離的多肽,所述分離的多肽包含糖結(jié)合域,所述糖結(jié)合域選自下組:[0025](a)糖結(jié)合域,其與SEQIDNO:8的氨基酸486至521具有至少81%序列同一性;[0026](b)糖結(jié)合域,其由多核苷酸編碼,所述多核苷酸在中等嚴(yán)格條件、中等-高嚴(yán)格條件、高嚴(yán)格條件、或非常高嚴(yán)格條件下與以下雜交:(i)SEQIDN0:7的核苷酸1533至1640,(ii)其cDNA序列,或(iii)⑴或(ii)的全長(zhǎng)互補(bǔ)物;[0027](c)糖結(jié)合域,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:7或其cDNA序列的核苷酸1533至1640具有至少81%序列同一性;[0028](d)SEQIDNO:8的氨基酸486至521在一個(gè)或多個(gè)(或幾個(gè))位置包含取代、缺失和/或插入的變體;和[0029](e)(a)、(b)、(C)、或⑷的糖結(jié)合域具有糖結(jié)合活性的變體。[0030]本發(fā)明亦涉及編碼本發(fā)明的多肽的分離的多核苷酸,包含所述多核苷酸的核酸構(gòu)建體、重組表達(dá)載體、和重組宿主細(xì)胞;和產(chǎn)生所述多肽的方法。[0031]本發(fā)明亦涉及降解或轉(zhuǎn)化纖維素材料的工藝,其包括:在本發(fā)明的具有纖維二糖水解酶活性的多肽的存在下用酶組合物處理纖維素材料。在一個(gè)方面,所述方法還包括回收經(jīng)降解或轉(zhuǎn)化的纖維素材料。[0032]本發(fā)明亦涉及產(chǎn)生發(fā)酵產(chǎn)物的工藝,其包括:(a)在本發(fā)明的具有纖維二糖水解酶活性的多肽的存在下用酶組合物糖化纖維素材料;(b)用一種或多種(例如幾種)發(fā)酵微生物發(fā)酵經(jīng)糖化的纖維素材料以產(chǎn)生發(fā)酵產(chǎn)物;和(C)從發(fā)酵回收該發(fā)酵產(chǎn)物。[0033]本發(fā)明亦涉及發(fā)酵纖維素材料的工藝,其包括用一種或多種(例如幾種)發(fā)酵微生物發(fā)酵所述纖維素材料,其中所述纖維素材料在本發(fā)明具有纖維二糖水解酶活性的多肽的存在下用酶組合物糖化。在一個(gè)方面,所述纖維素材料的發(fā)酵產(chǎn)生發(fā)酵產(chǎn)物。在另一個(gè)方面,上述方法進(jìn)一步包括從發(fā)酵回收發(fā)酵產(chǎn)物。[0034]本發(fā)明亦涉及編碼信號(hào)肽的多核苷酸,所述信號(hào)肽包含或組成為(consistof)SEQIDNO:2的氨基酸1至17,SEQIDNO:4的氨基酸1至20,SEQIDNO:6的氨基酸1至21,或SEQIDN0:8的氨基酸1至17,其可操作地連接于編碼蛋白的基因;包含所述多核苷酸的核酸構(gòu)建體、表達(dá)載體和重組宿主細(xì)胞;和產(chǎn)生蛋白的方法。【專利附圖】【附圖說明】[0035]圖1顯示編碼具有纖維二糖水解酶活性的樟絨枝霉(Malbrancheacinnamomea)多肽的基因的基因組DNA序列(SEQIDNO:1)和推導(dǎo)的氨基酸序列(SEQIDNO:2)。[0036]圖2顯示編碼具有纖維二糖水解酶活性的嗜熱棒囊殼(Corynascusthermophilus)多肽的基因的基因組DNA序列(SEQIDN0:3)和推導(dǎo)的氨基酸序列(SEQIDNO:4)〇[0037]圖3顯示編碼具有纖維二糖水解酶活性的嗜熱棒囊殼多肽的基因的基因組DNA序列(SEQIDNO:5)和推導(dǎo)的氨基酸序列(SEQIDNO:6)。[0038]圖4顯示編碼具有纖維二糖水解酶活性的嗜熱棒囊殼多肽的基因的基因組DNA序列(SEQIDNO:7)和推導(dǎo)的氨基酸序列(SEQIDNO:8)。[0039]圖5顯示pGH7_ZY582279_485的限制性圖譜。[0040]圖6顯示pGH7_Mf7339的限制性圖譜。[0041]圖7顯示pGH7_Mf6627的限制性圖譜。[0042]圖8顯示pGH7_Mf0261的限制性圖譜。[0043]定義[0044]乙酰木聚糖酯酶:術(shù)語(yǔ)"乙酰木聚糖酯酶"意指羧基酯酶(EC3.I.1.72),其催化乙?;鶑木酆夏揪厶恰⒁阴;咎?、乙?;咸烟恰⒁宜酑t-萘酯(alpha-napthylacetate)和乙酸對(duì)硝基苯酯(p-nitrophenylacetate)的水解。就本發(fā)明而言,乙酰木聚糖酯酶活性是使用含有0.01%TWEEN?20(聚氧乙烯山梨聚糖單月桂酸酯)的50mM乙酸鈉pH5.0中的0.5mM乙酸對(duì)硝基苯酯作為底物確定的。一個(gè)單位的乙酰木聚糖酯酶定義為能夠在pH5,25°C每分鐘釋放1微摩爾對(duì)硝基苯酚陰離子(p-nitrophenolateanion)的酶量。[0045]等位變體(allelicvariant):術(shù)語(yǔ)"等位變體"意指占據(jù)相同染色體基因座的基因的任何兩種或更多種可選形式。等位變異通過突變天然地發(fā)生,并且可導(dǎo)致種群內(nèi)的多態(tài)性。基因突變可以是沉默的(在編碼的多肽中無變化)或可以編碼具有改變的氨基酸序列的多肽。多肽的等位變體是由基因的等位變體編碼的多肽。[0046]a-L-阿拉伯呋喃糖苷酶:術(shù)語(yǔ)"a-L-阿拉伯呋喃糖苷酶"意指a-L-阿拉伯呋喃糖苷阿拉伯呋喃水解酶(EC3.2.1.55),其催化對(duì)a-L-阿拉伯糖苷中的末端非還原性a-L-阿拉伯呋喃糖苷殘基的水解。該酶對(duì)a-L-阿拉伯呋喃糖苷、含有(1,3)_和/或(1,5)_鍵的α-L-阿拉伯聚糖、阿拉伯木聚糖和阿拉伯半乳聚糖起作用。α-L-阿拉伯呋喃糖苷酶也稱為阿拉伯糖苷酶、α-阿拉伯糖苷酶、a-L-阿拉伯糖苷酶、α-阿拉伯呋喃糖苷酶、多糖a-L-阿拉伯呋喃糖苷酶、a-L-阿拉伯呋喃糖苷水解酶、L-阿拉伯糖苷酶或a-L-阿拉伯聚糖酶。就本發(fā)明而言,a-L-阿拉伯呋喃糖苷酶活性是使用總體積200μ1中的每ml的IOOmM乙酸鈉ρΗ5中5mg的中等粘度小麥阿拉伯木聚糖(MegazymeInternationalIreland,Ltd.,Bray,Co.Wicklow,Ireland)在40°C進(jìn)行30分鐘,接著通過ΑΜΓΝΕΧ?HPX-87H柱層析(Bio-RadLaboratories,Inc.,Hercules,CA,USA)的阿拉伯糖分析來確定的。[0047]α-葡糖醛酸糖苷酶:術(shù)語(yǔ)"α-葡糖醛酸糖苷酶"意指a-D-葡糖苷酸葡糖醛酸水解酶(alpha-D-glucosiduronateglucuronohydrolase)(EC3.2.1.139),其催化a-D-葡糖醛酸糖苷水解為D-葡糖醛酸和醇。就本發(fā)明而言,α-葡糖醛酸糖苷酶活性是根據(jù)deVries,1998,J.Bacteriol.180:243-249確定的。一個(gè)單位的α-葡糖醒酸糖苷酶等于能夠在pH5,40°C每分鐘釋放1微摩爾葡糖醛酸或4-0-甲基葡糖醛酸的酶量。[0048]β-葡糖苷酶:術(shù)語(yǔ)"β-葡糖苷酶"意指β-D-葡糖苷葡糖水解酶(beta-D-glucosideglucohydrolase)(Ε.C.No.3.2.1.21),其催化末端非還原β-D-葡萄糖殘基的水解,并釋放β-D-葡萄糖。就本發(fā)明而言,β-葡糖苷酶根據(jù)Venturi等,2002,Extracellularbeta-D-glucosidasefromChaetomiumthermophilumvar.coprophiIum!production,purificationandsomebiochemicalproperties,J.BasicMicrobiol.42:55-66的方法使用對(duì)硝基苯基-β-D-葡糖吡喃糖苷作為底物確定。一個(gè)單位的β-葡糖苷酶定義為在25°C,ρΗ4.8,在含有0.01%TWEEN?20的50mM檸檬酸鈉中從作為底物的ImM對(duì)硝基苯基-β-D-葡糖吡喃糖苷每分鐘產(chǎn)生1.0微摩爾對(duì)硝基苯酚陰離子。[0049]β-木糖苷酶:術(shù)語(yǔ)"β-木糖苷酶"意指β-D-木糖苷木糖水解酶(β-D-xylosidexylohydrolase)(E.C.3·2.I.37),其催化短β(I-4)木寡糖(xylooligosaccharide)的外水解以從非還原端去除連續(xù)的D-木糖殘基。就本發(fā)明而言,一個(gè)單位的β-木糖苷酶定義為在40°C,ρΗ5在含有0.01%TWEEN?20的IOOmM檸檬酸鈉中從作為底物的ImM對(duì)硝基苯基-β-D-木糖苷每分鐘產(chǎn)生1.0微摩爾對(duì)硝基苯酚陰離子。[0050]糖結(jié)合域:術(shù)語(yǔ)"糖結(jié)合域"意指介導(dǎo)酶對(duì)糖底物的無定形區(qū)的結(jié)合的酶的區(qū)域。糖結(jié)合域(CBD),亦稱為糖結(jié)合模塊,通常見于酶的N末端或C末端。[0051]催化域:術(shù)語(yǔ)"催化域"意指含有酶的催化機(jī)構(gòu)(catalyticmachinery)的酶的區(qū)域。[0052]cDNA:術(shù)語(yǔ)"cDNA"意指能夠通過反轉(zhuǎn)錄從得自真核或原核細(xì)胞的成熟的、已剪接的mRNA分子制備得到的DNA分子。cDNA缺少通常存在于相應(yīng)基因組DNA中的內(nèi)含子序列。最初的(initial)初級(jí)RNA轉(zhuǎn)錄物是mRNA的前體,其通過一系列的步驟加工包括剪接,然后作為成熟的已剪接的mRNA出現(xiàn)。[0053]纖維二糖水解酶:術(shù)語(yǔ)"纖維二糖水解酶"意指1,4-β-D-葡聚糖纖維二糖水解酶(1,4-beta-D-glucancellobiohydrolase)(Ε.C.3.2.1.91和Ε.C.3.2.1.176),其催化纖維素、纖維寡糖,或任何包含β-1,4-連接的葡萄糖的聚合物中的1,4-β-D-糖苷鍵的水解,從鏈的還原端(纖維二糖水解酶I)或非還原端(纖維二糖水解酶II)釋放纖維二糖(Teeri,1997,Crystallinecellulosedegradation:Newinsightintothefunctionofcellobiohydrolases,TrendsinBiotechnologyl5:160-167;Teeri等,1998,Trichodermareeseicellobiohydrolases:whysoefficientoncrystallinecellulose?,Biochem.Soc.Trans.26:173-178)〇根據(jù)Lever等,1972,Anal.Biochem.47:273-279;vanTilbeurgh等,1982,FEBSLettersl49:152-156;vanTilbeurgh和Claeyssens,1985,FEBSLettersl87:283-288;以及Tomme等,1988,Eur.J.Biochem.170:575-581描述的方法確定纖維二糖水解酶活性。在本發(fā)明中,Tomme等的方法可用于確定纖維二糖水解酶活性?;蛘撸w維二糖水解酶活性可使用微晶纖維素根據(jù)本發(fā)明實(shí)施例15中所述的步驟來確定。[0054]本發(fā)明的多肽具有SEQIDNO:2的成熟多肽,SEQIDNO:4的成熟多肽,SEQIDN0:6的成熟多肽,或SEQIDN0:8的成熟多肽的纖維二糖水解酶活性的至少20%,例如至少40%,至少50%,至少60%,至少70%,至少80%,至少90%,至少95%,或至少100%。[0055]纖維素分解酶或纖維素酶:術(shù)語(yǔ)"纖維素分解酶"或"纖維素酶"意指一種或多種(例如幾種)水解纖維素材料的酶。此類酶包括內(nèi)切葡聚糖酶,纖維二糖水解酶,β_葡糖苷酶,或其組合。測(cè)量纖維素分解活性的兩種基本方法包括:(1)測(cè)量總纖維素分解活性,和(2)測(cè)量單獨(dú)的纖維素分解活性(內(nèi)切葡聚糖酶、纖維二糖水解酶和β-葡糖苷酶),如Zhang等,Outlookforcellulaseimprovement:Screeningandselectionstrategies,2006,BiotechnologyAdvances24:452_481所綜述的??偫w維素分解活性通常是使用不溶性底物來測(cè)定的,所述底物包括Whatmanl號(hào)濾紙、微晶纖維素、細(xì)菌纖維素、藻類纖維素、棉花、經(jīng)預(yù)處理的木素纖維素等。最常見的總纖維素分解活性測(cè)定法是使用Whatmanl號(hào)濾紙作為底物的濾紙測(cè)定法。該測(cè)定法是由InternationalUnionofPureandAppliedChemistry(IUPAC)(Ghose,1987,Measurementofcellulaseactivities,PureAppl.Chem.59:257-68)確立的。[0056]就本發(fā)明而言,纖維素分解酶活性通過測(cè)量在下述條件下由纖維素分解酶進(jìn)行的纖維素材料水解相比于未添加纖維素分解酶蛋白的對(duì)照水解的增加來確定:l_5〇mg的纖維素分解酶蛋白/g的PCS中纖維素(或其它經(jīng)預(yù)處理的纖維素材料)在合適的溫度,例如50°C、55°C或60°C進(jìn)行3-7日。通常條件為:1ml反應(yīng)液,經(jīng)洗滌或未洗滌的PCS,5%不溶性固形物,50mM乙酸鈉pH5,ImMMnSO4,50°C、55°C或60°C,72小時(shí),通過AMINEX?HPX-87H柱(Bio-RadLaboratories,Inc.,Hercules,CA,USA)進(jìn)行糖分析。[0057]纖維素材料:術(shù)語(yǔ)"纖維素材料"意指包含纖維素的任何材料。生物質(zhì)的初生細(xì)胞壁(primarycellwall)中的主要多糖是纖維素,其次最豐富的是半纖維素,而第三是果膠。次生細(xì)胞壁(secondarycellwall)在細(xì)胞停止生長(zhǎng)后產(chǎn)生,其同樣含有多糖并通過共價(jià)交聯(lián)至半纖維素的聚合木質(zhì)素而加強(qiáng)。纖維素是脫水纖維二糖的均聚物,因此是直鏈β-(l-4)-D-葡聚糖,而半纖維素包括多種化合物,例如木聚糖、木葡聚糖(xyloglucan)、阿拉伯木聚糖和甘露聚糖,形成具有多種多樣的取代基的復(fù)雜分支結(jié)構(gòu)。盡管纖維素通常是多形的,但存在于植物組織中的纖維素主要是平行葡聚糖鏈的不溶晶體基質(zhì)。半纖維素通常與纖維素以及其它半纖維素以氫鍵相連,其幫助穩(wěn)定細(xì)胞壁基質(zhì)。[0058]纖維素通常見于例如植物的莖、葉、殼、皮和穗軸,或樹的葉、枝和木材。纖維素材料可以是,但不限于,農(nóng)業(yè)殘余物、草本材料(包括能源作物)、城市固體廢物、紙漿與造紙廠殘余物、廢紙和木材(包括林業(yè)殘余物)(參見,例如,Wiselogel等,1995,于HandbookonBioethanol(CharlesE.Wyman編),ρρ·105-118,Taylor&Francis,WashingtonD.C.;Wyman,1994,BioresourceTechnology50:3-16;Lynd,1990,AppliedBiochemistryandBiotechnology24/25:695_719;Mosier等,1999,RecentProgressinBioconversionofLignocellulosicsj于AdvancesinBiochemicalEngineering/Biotechnology,T.Scheper主編,Volume65,pp.23-40,Springer-Verlag,NewYork)。在本文中應(yīng)理解的是,纖維素可以是木素纖維素的形式,木素纖維素是一種植物細(xì)胞壁材料,包含木質(zhì)素、纖維素和半纖維素的混合基質(zhì)。在一個(gè)優(yōu)選的方面,纖維素材料是任何生物質(zhì)材料。在另一個(gè)優(yōu)選的方面,所述纖維素材料是木素纖維素,其包含纖維素、半纖維素和木質(zhì)素。[0059]在一個(gè)方面,纖維素材料是農(nóng)業(yè)殘余物。在另一個(gè)方面,纖維素材料是草本材料(包括能源作物)。在另一個(gè)方面,纖維素材料是城市固體廢物。在另一個(gè)方面,纖維素材料是紙漿和造紙廠殘余物。在另一個(gè)方面,纖維素材料是廢紙。在另一個(gè)方面,纖維素材料是木材(包括林業(yè)殘余物)。[0060]在另一個(gè)方面,纖維素材料是蘆竹(arundo)。在另一個(gè)方面,纖維素材料是蔗渣。在另一個(gè)方面,纖維素材料是竹子。在另一個(gè)方面,纖維素材料是玉米穗軸。在另一個(gè)方面,纖維素材料是玉米纖維。在另一個(gè)方面,纖維素材料是玉米秸桿。在另一個(gè)方面,纖維素材料是芒草屬。在另一個(gè)方面,纖維素材料是橙皮。在另一個(gè)方面,纖維素材料是稻桿。在另一個(gè)方面,纖維素材料是柳枝稷(switchgrass)。在另一個(gè)方面,纖維素材料是麥桿。[0061]在另一個(gè)方面,纖維素材料是白楊。在另一個(gè)方面,纖維素材料是桉樹。在另一個(gè)方面,纖維素材料是揪樹(fir)。在另一個(gè)方面,纖維素材料是松樹。在另一個(gè)方面,纖維素材料是楊樹。在另一個(gè)方面,纖維素材料是云杉。在另一個(gè)方面,纖維素材料是柳樹。[0062]在另一個(gè)方面,纖維素材料是藻類纖維素。在另一個(gè)方面,纖維素材料是細(xì)菌纖維素。在另一個(gè)方面,纖維素材料是棉絨(cottonIinter)。在另一個(gè)方面,纖維素材料是濾紙。在另一個(gè)方面,纖維素材料是微晶纖維素。在另一個(gè)方面,纖維素材料是磷酸處理的纖維素。[0063]在另一個(gè)方面,纖維素材料是水生生物質(zhì)。如用于本文中,"水生生物質(zhì)"意指在水生環(huán)境中由光合作用過程產(chǎn)生的生物質(zhì)。水生生物質(zhì)可為藻類、挺水植物(emergentplant)、浮葉植物(floating-leafplant)或沉水植物(submergedplant)。[0064]纖維素材料可以按原樣(asis)使用或進(jìn)行預(yù)處理,預(yù)處理使用本領(lǐng)域已知的常規(guī)方法,如本文所述。在一個(gè)優(yōu)選的方面,預(yù)處理纖維素材料。[0065]編碼序列:術(shù)語(yǔ)"編碼序列"意指直接指定多肽的氨基酸序列的多核苷酸。編碼序列的邊界通常由開放閱讀框決定,所述開放閱讀框以起始密碼子如ATG、GTG或TTG開始,并且以終止密碼子如TAA、TAG或TGA結(jié)束。編碼序列可以是基因組DNA、cDNA、合成DNA或其組合。[0066]調(diào)控序列(controlsequence):術(shù)語(yǔ)"調(diào)控序列"意指對(duì)編碼本發(fā)明的成熟多肽的多核苷酸表達(dá)是必需的核酸序列。各個(gè)調(diào)控序列對(duì)于編碼所述成熟多肽的多核苷酸可以是天然的(即,來自同一基因)或外源的(即,來自不同基因),或各個(gè)調(diào)控序列對(duì)于彼此可以是天然的或外源的。這些調(diào)控序列包括但不限于前導(dǎo)序列、聚腺苷酸化序列、前肽序列、啟動(dòng)子、信號(hào)肽序列和轉(zhuǎn)錄終止子。至少,調(diào)控序列包括啟動(dòng)子和轉(zhuǎn)錄和翻譯的終止信號(hào)。調(diào)控序列可以配備用于引入特異性限制位點(diǎn)的接頭,所述特異性限制位點(diǎn)促進(jìn)調(diào)控序列與編碼多肽的多核苷酸編碼區(qū)的連接。[0067]內(nèi)切葡聚糖酶:術(shù)語(yǔ)"內(nèi)切葡聚糖酶"意指內(nèi)切-1,4-(1,3;l,4)-i3_D-葡聚糖葡聚糖水解酶(end〇-l,4-β-D-glucan4_glucanohydrolase)(E.C.3.2.1.4),其催化纖維素、纖維素衍生物(例如羧甲基纖維素和羥乙基纖維素)、地衣淀粉(Iichenin)中的1,4-β-D-糖苷鍵、混合的β-1,3葡聚糖例如谷類β-D-葡聚糖或木葡聚糖和含有纖維素組分的其它植物材料中的β-1,4鍵的內(nèi)水解(endohydrolysis)。內(nèi)切葡聚糖酶活性可通過測(cè)量底物粘度的減少或由還原糖測(cè)定法(Zhang等,2006,BiotechnologyAdvances24:452_481)確定的還原端增加來確定。就本發(fā)明而言,根據(jù)Ghose,1987,PureandAppl.Chem.59:257-268的方法,在pH5,40°C使用羧甲基纖維素(CMC)作為底物來確定內(nèi)切葡聚糖酶活性。[0068]表達(dá):術(shù)語(yǔ)"表達(dá)"包括涉及多肽產(chǎn)生的任何步驟,其包括但不限于轉(zhuǎn)錄、轉(zhuǎn)錄后修飾、翻譯、翻譯后修飾和分泌。[0069]表達(dá)載體:術(shù)語(yǔ)"表達(dá)載體"意指線性的或環(huán)狀的DNA分子,其包含編碼多肽的多核苷酸,并且所述多核苷酸與提供用于其表達(dá)的調(diào)控序列可操作地連接。[0070]家族61糖苷水解酶:術(shù)語(yǔ)"家族61糖苷水解酶"或"家族GH61"或"GH61"在本文中定義為根據(jù)HenrissatB.,1991,Aclassificationofglycosylhydrolasesbasedonamino-acidsequencesimilarities,Biochem.J.280:309-316,及HenrissatB.和BairochA.,1996,Updatingthesequence-basedclassificationofglycosylhydrolases,Biochem.J.316:695-696屬于糖苷水解酶家族61的多肽。該家族中的酶原先基于在一個(gè)家族成員測(cè)量到的非常弱的內(nèi)切-1,4-β-D葡聚糖酶活性而歸類為糖苷水解酶家族。這些酶的結(jié)構(gòu)和作用模式是非經(jīng)典的,且它們無法視為真正的(bonafide)糖苷酶。然而,基于當(dāng)與纖維素酶或纖維素酶的混合物一同使用時(shí),其增強(qiáng)木素纖維素分解的能力,它們被保留在CAZy分類中。[0071]阿魏酸酯酶:術(shù)語(yǔ)"阿魏酸酯酶(feruloylesterase)"意指4-輕基-3-甲氧基肉桂酰-糖水解酶(EC3.I.1.73),其催化4-羥基-3-甲氧基肉桂酰(阿魏酰)基團(tuán)從酯化的糖(其在"天然生物質(zhì)"底物中通常為阿拉伯糖)的水解,以產(chǎn)生阿魏酸(4-羥基-3-甲氧基肉桂酸)。阿魏酸酯酶也稱作阿魏酸酯酶(ferulicacidesterase)、輕基肉桂?;ッ?、FAE-III、肉桂酸酯水解酶、FAEA、cinnAE、FAE-I或FAE-II。就本發(fā)明而言,阿魏酸酯酶活性是使用50mM乙酸鈉pH5.O中的0.5mM阿魏酸對(duì)硝基苯酯作為底物確定的。一個(gè)單位的阿魏酸酯酶等于能夠在pH5,25°C每分鐘釋放1微摩爾對(duì)硝基苯酚陰離子的酶量。[0072]片段:術(shù)語(yǔ)"片段"意指從成熟多肽或域的氨基和/或羧基末端缺失一個(gè)或多個(gè)(例如幾個(gè))氨基酸的多肽或催化域或糖結(jié)合域;其中所述片段具有纖維二糖水解酶活性或糖結(jié)合活性。在一個(gè)方面,片段含有SEQIDNO:2的至少375個(gè)氨基酸殘基,例如至少397個(gè)氨基酸殘基,或至少419個(gè)氨基酸殘基。在另一個(gè)方面,片段含有SEQIDNO:4的至少364個(gè)氨基酸殘基,例如至少386個(gè)氨基酸殘基或至少408個(gè)氨基酸殘基。在另一個(gè)方面,片段含有SEQIDN0:6的至少370個(gè)氨基酸殘基,例如至少392個(gè)氨基酸殘基或至少414個(gè)氨基酸殘基。在另一個(gè)方面,片段含有SEQIDNO:8的至少429個(gè)氨基酸殘基,例如至少454個(gè)氨基酸殘基或至少479個(gè)氨基酸殘基。[0073]半纖維素分解酶或半纖維素酶:術(shù)語(yǔ)"半纖維素分解酶"或"半纖維素酶"意指一種或多種(例如幾種)水解半纖維素材料的酶。參見,例如ShallomD.和ShohamY.Microbialhemicellulases.CurrentOpinionInMicrobiology,2003,6(3):219-228)〇半纖維素酶是植物生物質(zhì)降解中的關(guān)鍵成分。半纖維素酶的實(shí)例包括但不限于乙酰甘露聚糖酯酶、乙酰木聚糖酯酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、香豆酸酯酶、阿魏酸酯酶、半乳糖苷酶、葡糖醛酸糖苷酶、葡糖醛酸酯酶、甘露聚糖酶、甘露糖苷酶、木聚糖酶和木糖苷酶。這些酶的底物,半纖維素是支化和直鏈多糖的混雜集團(tuán),這些多糖通過氫鍵鍵合于植物細(xì)胞壁中的纖維素微纖維,將其交聯(lián)為魯棒(robust)的網(wǎng)絡(luò)。半纖維素亦共價(jià)地附于木質(zhì)素,與纖維素一同形成高度復(fù)雜的結(jié)構(gòu)。半纖維素的多變的結(jié)構(gòu)和組織形式需要許多酶的協(xié)同作用使其完全降解。半纖維素酶的催化模塊為水解糖苷鍵的糖苷水解酶(GH),或水解乙酸或阿魏酸側(cè)基的酯連接的糖酯酶(CE)。這些催化模塊,基于其一級(jí)結(jié)構(gòu)的同源性,可指派為GH和CE家族。一些家族,具有總體上類似的折疊,可進(jìn)一步歸類為宗族(clan),以字母標(biāo)記(例如,GH-A)。最具信息性和最新的這些和其他糖活性酶的分類可在Carbohydrate-ActiveEnzymes(CAZy)數(shù)據(jù)庫(kù)獲得。半纖維素分解酶活性可根據(jù)Ghose和Bisaria,1987,Pure&Appl.Chem.59:1739-1752在合適的溫度,例如50°C、55°C或60°C,和pH,例如5.0或5.5進(jìn)行測(cè)量。[0074]高嚴(yán)格條件:術(shù)語(yǔ)"高嚴(yán)格條件"意指對(duì)于長(zhǎng)度至少100個(gè)核苷酸的探針,在42°C,在5XSSPE、0.3%SDS、200微克/ml已剪切并且變性的鮭精DNA和50%的甲酰胺中,根據(jù)標(biāo)準(zhǔn)的Southern印跡法進(jìn)行預(yù)雜交和雜交12至24小時(shí)。使用2XSSC、0.2%SDS在65°C將載體材料最終洗滌三次,每次15分鐘。[0075]宿主細(xì)胞:術(shù)語(yǔ)"宿主細(xì)胞"意指適合于使用包含本發(fā)明多核苷酸的核酸構(gòu)建體或表達(dá)載體進(jìn)行轉(zhuǎn)化、轉(zhuǎn)染、轉(zhuǎn)導(dǎo)等的細(xì)胞類型。術(shù)語(yǔ)"宿主細(xì)胞"涵蓋親本細(xì)胞的任何由于在復(fù)制中發(fā)生的突變而不同于親本細(xì)胞的后代。[0076]分離的:術(shù)語(yǔ)"分離的"意指以不在自然界出現(xiàn)的形式或環(huán)境存在的物質(zhì)。分離的物質(zhì)的非限定性實(shí)例包括(1)任何非天然存在的物質(zhì),(2)任何至少部分地與一種或多種或全部與其天然伴隨的天然存在的成分脫離的物質(zhì),包括但不限于任何酶、變體、核酸、蛋白質(zhì)、肽或輔因子;(3)任何相對(duì)于自然界中所見的該物質(zhì)而言經(jīng)過了人工修飾的物質(zhì);或(4)任何通過相對(duì)于與其天然伴隨的其他組分增加該物質(zhì)的量(例如,在宿主細(xì)胞中的重組產(chǎn)生;編碼該物質(zhì)的基因的多拷貝;以及使用比與編碼該物質(zhì)的基因天然伴隨的啟動(dòng)子更強(qiáng)的啟動(dòng)子)而修飾的物質(zhì)。[0077]低嚴(yán)格條件:術(shù)語(yǔ)"低嚴(yán)格條件"意指對(duì)于長(zhǎng)度至少100個(gè)核苷酸的探針,在42°C,在5XSSPE、0.3%SDS、200微克/ml已剪切并且變性的鮭精DNA和25%的甲酰胺中,根據(jù)標(biāo)準(zhǔn)的Southern印跡法進(jìn)行預(yù)雜交和雜交12至24小時(shí)。使用2XSSC、0.2%SDS在50°C將載體材料最終洗滌三次,每次15分鐘。[0078]成熟多肽:術(shù)語(yǔ)"成熟多肽"意指以其在翻譯和任何翻譯后修飾之后的最終形式存在的多肽,所述修飾例如N-末端加工、C-末端截短、糖基化、磷酸化等。在一個(gè)方面,根據(jù)預(yù)測(cè)SEQIDN0:2(P249XX)的氨基酸1至17是信號(hào)肽的SignalP程序(Nielsen等,1997,ProteinEngineeringlO:1-6),成熟多膚是SEQIDN0:2的氨基酸18至458。在另一個(gè)方面,根據(jù)預(yù)測(cè)SEQIDN0:4(P24NX2)的氨基酸1至20是信號(hào)肽的SignalP程序,成熟多肽是SEQIDN0:4的氨基酸21至450。在另一個(gè)方面,根據(jù)預(yù)測(cè)SEQIDN0:6(P24FVN)的氨基酸1至21是信號(hào)肽的SignalP程序(Nielsen等,1997,ProteinEngineeringl0:l-6),成熟多肽是SEQIDN0:6的氨基酸22至457。在另一個(gè)方面,根據(jù)預(yù)測(cè)SEQIDNO:8(P24FUQ)的氨基酸1至17是信號(hào)肽的SignalP程序,成熟多肽是SEQIDNO:8的氨基酸18至521。[0079]本領(lǐng)域中已知宿主細(xì)胞可產(chǎn)生有相同多肽表達(dá)的兩種或更多種不同成熟多肽(即,具有不同的C-端和/或N-端氨基酸)的混合物。本領(lǐng)域中亦已知不同的宿主細(xì)胞以不同方式加工多肽,并因此,一個(gè)表達(dá)多肽的的宿主細(xì)胞與表達(dá)相同多肽的另一個(gè)宿主細(xì)胞相比,可產(chǎn)生不同的成熟多肽(例如具有不同的C-端和/或N-端氨基酸)。[0080]成熟多肽編碼序列:術(shù)語(yǔ)"成熟多肽編碼序列"意指編碼具有纖維二糖水解酶活性的成熟多肽的多核苷酸。在一個(gè)方面,根據(jù)預(yù)測(cè)SEQIDNO:1的核苷酸1至51編碼信號(hào)肽的SignalP程序(Nielsen等,1997,見上),成熟多肽編碼序列是SEQIDNO:1或其cDNA序列的核苷酸52至1454。在另一個(gè)方面,根據(jù)預(yù)測(cè)SEQIDN0:3的核苷酸1至60編碼信號(hào)肽的SignalP程序,成熟多肽編碼序列是SEQIDNO:3或其cDNA序列的核苷酸61至1733。在另一個(gè)方面,根據(jù)預(yù)測(cè)SEQIDNO:5的核苷酸1至63編碼信號(hào)肽的SignalP程序(Nielsen等,1997,見上),成熟多肽編碼序列是SEQIDNO:5或其cDNA序列的核苷酸64至1782。在另一個(gè)方面,根據(jù)預(yù)測(cè)SEQIDNO:7的核苷酸1至51編碼信號(hào)肽的SignalP程序,成熟多肽編碼序列是SEQIDNO:7或其cDNA序列的核苷酸52至1640。[0081]中等嚴(yán)格條件:術(shù)語(yǔ)"中等嚴(yán)格條件"意指對(duì)于長(zhǎng)度至少100個(gè)核苷酸的探針,在42°C,在5XSSPE、0.3%SDS、200微克/ml已剪切并且變性的鮭精DNA和35%的甲酰胺中,根據(jù)標(biāo)準(zhǔn)的Southern印跡法進(jìn)行預(yù)雜交和雜交12至24小時(shí)。使用2XSSC、0.2%SDS在55°C將載體材料最終洗滌三次,每次15分鐘。[0082]中等-高嚴(yán)格條件:術(shù)語(yǔ)"中等-高嚴(yán)格條件"意指對(duì)于長(zhǎng)度至少100個(gè)核苷酸的探針,在42°C,在5XSSPE、0.3%SDS、200微克/ml已剪切并且變性的鮭精DNA和35%的甲酰胺中,根據(jù)標(biāo)準(zhǔn)的Southern印跡法進(jìn)行預(yù)雜交和雜交12至24小時(shí)。使用2XSSC、0.2%SDS在60°C將載體材料最終洗滌三次,每次15分鐘。[0083]核酸構(gòu)建體:術(shù)語(yǔ)"核酸構(gòu)建體"意指單鏈或雙鏈的核酸分子,其分離自天然存在的基因,或其經(jīng)修飾以本來不存在于(nototherwiseexist)自然界中的方式含有核酸的區(qū)段,或其為合成的,其包含一個(gè)或多個(gè)調(diào)控序列。[0084]可操作地連接:術(shù)語(yǔ)"可操作地連接"意指這樣的構(gòu)型,其中將調(diào)控序列置于相對(duì)于多核苷酸的編碼序列的適當(dāng)位置,使得調(diào)控序列指導(dǎo)編碼序列的表達(dá)。[0085]具有纖維素分解增強(qiáng)活性的多肽:術(shù)語(yǔ)"具有纖維素分解增強(qiáng)的多肽"意指催化具有纖維素分解活性的酶對(duì)纖維素材料的水解的增強(qiáng)的GH61多肽。就本發(fā)明而言,通過測(cè)量來自由纖維素分解酶在下述條件下與對(duì)照水解相比較水解纖維素材料的還原糖增加或纖維二糖與葡萄糖的總量增加來確定纖維素分解增強(qiáng)活性:l-5〇mg總蛋白/g預(yù)處理的玉米秸桿(PCS)中纖維素,其中總蛋白包含50-99.5%w/w的纖維素分解酶蛋白,及0.5-50%w/w的具有纖維素分解增強(qiáng)活性的GH61多肽的蛋白質(zhì),在合適的溫度,例如50°C、55°C或60°C和合適的pH,如4-9,例如5.0或5.5歷時(shí)1-7天,對(duì)照水解使用等量的總蛋白加載量而無纖維素分解增強(qiáng)活性(l-50mg纖維素分解蛋白/gPCS中纖維素)進(jìn)行。在一個(gè)優(yōu)選的方面,使用在總蛋白重量的2-3%的米曲霉β-葡糖苷酶(根據(jù)WO02/095014在米曲霉中重組產(chǎn)生)或者總蛋白質(zhì)量的2-3%的煙曲霉β-葡糖苷酶(如WO2002/095014所述在米曲霉中重組產(chǎn)生)的纖維素酶蛋白加載量存在下的CELLUCLAST?1.5L(N〇v〇zymeSA/S,Bagsvaerd,Denmark)的混合物作為纖維素分解活性的來源。[0086]具有纖維素分解增強(qiáng)活性的GH61多肽通過降低達(dá)到相同水解水平所需的纖維素分解酶的量而增強(qiáng)由具有纖維素分解活性的酶催化的纖維素材料的水解,優(yōu)選降低至少1.01倍,例如至少1.05倍,至少1.10倍,至少1.25倍,至少1.5倍,至少2倍,至少3倍,至少4倍,至少5倍,至少10倍,或至少20倍。[0087]預(yù)處理的玉米秸桿:術(shù)語(yǔ)"PCS"或"預(yù)處理的玉米秸桿"意指通過用熱和稀硫酸處理、堿預(yù)處理或中性預(yù)處理的源自玉米秸桿的纖維素材料。[0088]序列同一性:參數(shù)"序列同一性"描述兩個(gè)氨基酸序列之間或兩個(gè)核苷酸序列之間的相關(guān)性。[0089]就本發(fā)明而言,兩個(gè)氨基酸序列之間的序列同一性程度使用如EMBOSS軟件包(EMBOSS:TheEuropeanMolecularBiologyOpenSoftwareSuite,Rice等,2000,TrendsGenet.16:276-277),優(yōu)選3.0.0、5.0.0版或更高版本的Needle程序中所執(zhí)行的Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48:443-453)來測(cè)定。使用的參數(shù)為缺口打開罰分(gapopenpenalty)10,缺口延伸罰分(gapextensionpenalty)(λ5和EBL0SUM62(BL0SUM62的EMBOSS版)取代矩陣。使用Needle標(biāo)記為"最高同一I"生(longestidentity)"的輸出結(jié)果(使用-nobrief選項(xiàng)獲得)作為同一丨生百分比,并計(jì)算如下:[0090](同樣的殘基X100V(比對(duì)長(zhǎng)度一比對(duì)中缺口的總數(shù))[0091]就本發(fā)明而言,兩個(gè)核苷酸序列之間的序列同一性程度使用如EMBOSS軟件包(EMBOSS:TheEuropeanMolecularBiologyOpenSoftwareSuite,Rice等,2000,見上文),優(yōu)選5.0.0版或更高版本的Needle程序中所執(zhí)行的Needleman-Wunsch算法(Needleman和Wunsch,1970,見上文)來測(cè)定。使用的參數(shù)為缺口打開罰分10,缺口延伸罰分0.5和EDNAFULL(NCBINUC4.4的EMBOSS版)取代矩陣。使用Needle標(biāo)記為"最高同一性"的輸出結(jié)果(使用-nobrief選項(xiàng)獲得)作為同一性百分比,并計(jì)算如下:[0092](同樣的脫氧核糖核苷酸X100V(比對(duì)長(zhǎng)度一比對(duì)中缺口的總數(shù))[0093]亞序列:術(shù)語(yǔ)"亞序列(subsequence)"意指從成熟多肽編碼序列或域的5'和/或3'端缺失一個(gè)或多個(gè)(例如幾個(gè))核苷酸的多核苷酸;其中所述亞序列編碼具有纖維二糖水解酶活性或糖結(jié)合活性的片段。在一個(gè)方面,亞序列含有SEQIDNO:1的至少1125個(gè)核苷酸,例如至少1191個(gè)核苷酸,或至少1257個(gè)核苷酸。在另一個(gè)方面,亞序列含有SEQIDNO:3的至少1092個(gè)核苷酸,例如至少1158個(gè)核苷酸或至少1224個(gè)核苷酸。在一個(gè)方面,亞序列含有SEQIDNO:5的至少1110個(gè)核苷酸,例如至少1176個(gè)核苷酸或至少1242個(gè)核苷酸。在另一個(gè)方面,亞序列含有SEQIDNO:7的至少1287個(gè)核苷酸,例如至少1362個(gè)核苷酸或至少1437個(gè)核苷酸。[0094]變體:術(shù)語(yǔ)"變體"意指在一個(gè)或多個(gè)(例如幾個(gè))位置包含改變,即取代、插入和/或缺失的具有纖維二糖水解酶活性的多肽。取代意指將占據(jù)某位置的氨基酸用不同的氨基酸替代;缺失意指去除占據(jù)某位置的氨基酸;而插入意指在鄰接并緊接著占據(jù)某位置的氨基酸之后添加氨基酸。[0095]非常高嚴(yán)格條件:術(shù)語(yǔ)"非常高嚴(yán)格條件"意指對(duì)于長(zhǎng)度至少100個(gè)核苷酸的探針,在42°C,在5XSSPE、0.3%SDS、200微克/ml已剪切并且變性的鮭精DNA和50%的甲酰胺中,根據(jù)標(biāo)準(zhǔn)的Southern印跡法進(jìn)行預(yù)雜交和雜交12至24小時(shí)。使用2XSSC、0.2%SDS在70°C將載體材料最終洗滌三次,每次15分鐘。[0096]非常低嚴(yán)格條件:術(shù)語(yǔ)"非常低嚴(yán)格條件"意指對(duì)于長(zhǎng)度至少100個(gè)核苷酸的探針,在42°C,在5XSSPE、0.3%SDS、200微克/ml已剪切并且變性的鮭精DNA和25%的甲酰胺中,根據(jù)標(biāo)準(zhǔn)的Southern印跡法進(jìn)行預(yù)雜交和雜交12至24小時(shí)。使用2XSSC、0.2%SDS在45°C將載體材料最終洗滌三次,每次15分鐘。[0097]含木聚糖材料:術(shù)語(yǔ)"含木聚糖材料"意指任何包含含有β-(1-4)連接的木糖殘基骨架的植物細(xì)胞壁多糖的材料。陸生植物的木聚糖是具有β-(1-4)-吡喃木糖骨架的雜聚物,其具有短的糖鏈分支。它們包含D-葡糖醛酸或其4-0-甲基醚,L-阿拉伯糖和/或多種包含D-木糖、L-阿拉伯糖、D-或L-半乳糖和D-葡萄糖的寡糖。木聚糖類型的多糖可分為均木聚糖(homoxylan)和雜木聚糖(heteroxylan),后者包括葡糖醒酸木聚糖,(阿拉伯)葡糖醛酸木聚糖,(葡糖醛酸)阿拉伯木聚糖,阿拉伯木聚糖和復(fù)合雜木聚糖。參見,例如Ebringerova等,2005,Adv.Polym.Sci.186:1-67。[0098]在本發(fā)明的工藝中,可使用任何含有木聚糖的材料。在一個(gè)優(yōu)選的方面,所述含木聚糖材料是木素纖維素。[0099]木聚糖降解活性或木聚糖分解活性:術(shù)語(yǔ)"木聚糖降解活性"或"木聚糖分解活性"意指水解含木聚糖材料的生物學(xué)活性。兩種測(cè)定木聚糖分解活性的基礎(chǔ)方法包括:(1)測(cè)定總木聚糖分解活性,和(2)測(cè)定單獨(dú)的木聚糖分解活性(例如內(nèi)切木聚糖酶、β_木糖苷酶、阿拉伯呋喃糖苷酶、α-葡糖醛酸糖苷酶、乙酰木聚糖酯酶、阿魏酸酯酶和α-葡糖醛酸酯酶(α-glucuronylesterase))。最近在木聚糖分解酶測(cè)定法的進(jìn)展總結(jié)于幾個(gè)公開文獻(xiàn)中,包括Biely和Puchard,2006,Recentprogressintheassaysofxylanolyticenzymes,JournaloftheScienceofFood和Agriculture86(11):1636-1647;Spanikova和Biely,2006,Glucuronoylesterase-NovelcarbohydrateesteraseproducedbySchizophyllumcommune,FEBSLetters580(19):4597-4601;Herrmann,Vrsanska,Jurickova,Hirsch,Biely,和Kubicek,1997,Thebeta-D-xylosidaseofTrichodermareeseiisamultifunctionalbeta-D-xylanxylohydrolase,BiochemicalJournal321:375-381〇[0100]總木聚糖降解活性可通過確定從多種類型的木聚糖形成的還原糖來測(cè)量,所述木聚糖包括例如燕麥小麥(oatspelt)、山毛櫸木(beechwood)和落葉松木(Iarchwood)木聚糖,或者可通過光度法確定從多種共價(jià)染色的木聚糖釋放出的染色的木聚糖片段來測(cè)量。最常見的總木聚糖分解活性測(cè)定法基于從多聚的4-0-甲基葡糖醛酸木聚糖產(chǎn)生還原糖,如Bailey,Biely,Poutanen,1992,Interlaboratorytestingofmethodsforassayofxylanaseactivity,JournalofBiotechnology23(3):257-270中所述。木聚糖酶活性亦可用〇.2%AZCL-阿拉伯木聚糖作為底物在37°C在0.01%TRITON?X-100(4-(l,1,3,3-四甲基丁基)苯基-聚乙二醇)和200mM磷酸鈉緩沖液pH6中來確定。一個(gè)單位的木聚糖酶活性定義為在37°C,pH6在200mM磷酸鈉pH6緩沖液中從作為底物的0.2%AZCL-阿拉伯木聚糖每分鐘產(chǎn)生I.0微摩爾天青蛋白(azurine)。[0101]就本發(fā)明而言,木聚糖降解活性是通過測(cè)量由木聚糖降解酶在下述通常條件下造成的樺木木聚糖(SigmaChemicalCo.,Inc.,St.Louis,MO,USA)水解的增加來確定的:Iml反應(yīng),5mg/ml底物(總固形物),5mg木聚糖分解蛋白質(zhì)/g底物,50mM乙酸鈉,pH5,50°C,24小時(shí),如Lever,1972,Anewreactionforcolorimetricdeterminationofcarbohydrates,Anal.Biochem47:273-279所述使用對(duì)輕基苯甲酸醜餅(PHBAH)測(cè)定法進(jìn)行糖分析。[0102]木聚糖酶:術(shù)語(yǔ)"木聚糖酶"意指1,4-β-D-木聚糖-木糖水解酶(1,4_β-D-xylan-xylohydrolase)(Ε.C.3.2.L8),其催化木聚糖中1,4_β-D-木糖苷鍵的內(nèi)水解。就本發(fā)明而言,木聚糖酶活性使用〇.2%AZCL-阿拉伯木聚糖作為底物在37°C在0.01%TRITON?X-100和200mM乙酸鈉緩沖液,pH6中確定。一個(gè)單位的木聚糖酶活性定義為在37°C在200mM磷酸鈉pH6緩沖液中從作為底物的0.2%AZCL-阿拉伯木聚糖每分鐘產(chǎn)生1.0微摩爾天青蛋白。[0103]發(fā)明詳述[0104]具有纖維二糖水解酶活性的多肽[0105]在一個(gè)實(shí)施方案中,本發(fā)明涉及分離的多肽,其與SEQIDNO:2的成熟多肽具有至少70%,例如至少75%,至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性;所述多肽具有纖維二糖水解酶活性。在一個(gè)實(shí)施方案中,本發(fā)明涉及分離的多肽,其與SEQIDNO:4的成熟多肽具有至少88%,例如至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性;所述多肽具有纖維二糖水解酶活性。在一個(gè)實(shí)施方案中,本發(fā)明涉及分離的多肽,其與SEQIDNO:6的成熟多肽具有至少66%,例如至少68%,至少70%,至少75%,至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性;所述多肽具有纖維二糖水解酶活性。在一個(gè)實(shí)施方案中,本發(fā)明涉及分離的多肽,其與SEQIDN0:8的成熟多肽具有至少81%,例如至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性;所述多肽具有纖維二糖水解酶活性。在一個(gè)方面,所述多肽與SEQIDNO:2的成熟多肽,SEQIDNO:4的成熟多肽,SEQIDN0:6的成熟多肽,或SEQIDN0:8的成熟多肽相差最多達(dá)10個(gè)氨基酸,例如1、2、3、4、5、6、7、8、9或10個(gè)氨基酸。[0106]本發(fā)明的多肽優(yōu)選包含或組成為SEQIDN0:2,SEQIDN0:4,SEQIDN0:6,或SEQIDN0:8的氨基酸序列或其等位變體;或?yàn)槠渚哂欣w維二糖水解酶活性的片段。在另一個(gè)方面,所述多肽包含或組成為SEQIDNO:2的成熟多肽,SEQIDNO:4的成熟多肽,SEQIDNO:6的成熟多肽,或SEQIDNO:8的成熟多肽。在另一個(gè)方面,所述多肽包含或組成為SEQIDNO:2的氨基酸18至458,SEQIDNO:4的氨基酸21至450,SEQIDNO:6的氨基酸22至457,或SEQIDNO:8的氨基酸18至521。[0107]在另一個(gè)實(shí)施方案中,本發(fā)明涉及具有纖維二糖水解酶活性的分離的多肽,其由多核苷酸編碼,所述多核苷酸在非常低嚴(yán)格條件,低嚴(yán)格條件,中等嚴(yán)格條件,中等-高嚴(yán)格條件,高嚴(yán)格條件,或非常高嚴(yán)格條件下與以下雜交:(i)SEQIDN0:1的成熟多肽編碼序列,SEQIDN0:3的成熟多肽編碼序列,SEQIDN0:5的成熟多肽編碼序列,或SEQIDN0:7的成熟多肽編碼序列,(ii)SEQIDN0:1的cDNA序列,SEQIDN0:3的cDNA序列,SEQIDN0:5的cDNA序列,或SEQIDN0:7的cDNA序列,或(iii)⑴或(ii)的全長(zhǎng)互補(bǔ)物(Sambrook等,1989,MolecularCloning,ALaboratoryManual,第2版,ColdSpringHarbor,NewYork)〇[0108]可利用SEQIDNO:1,SEQIDNO:3,SEQIDNO:5,或SEQIDNO:7的多核苷酸或其亞序列,以及SEQIDN0:2,SEQIDN0:4,SEQIDN0:6,或SEQIDN0:8的多肽或其片段設(shè)計(jì)核酸探針,以根據(jù)本領(lǐng)域內(nèi)公知的方法從不同屬或種的菌株鑒定和克隆編碼具有纖維二糖水解酶活性的多肽的DNA。具體而言,根據(jù)標(biāo)準(zhǔn)的Southern印跡方法,可將這些探針用于與感興趣的細(xì)胞的基因組DNA或cDNA雜交,以鑒定和從其中分離相應(yīng)的基因。這些探針可明顯短于完整序列,但長(zhǎng)度上應(yīng)為至少15,例如至少25,至少35,或至少70個(gè)核苷酸。優(yōu)選地,所述核酸探針是至少100個(gè)核苷酸的長(zhǎng)度,例如,至少200個(gè)核苷酸,至少300個(gè)核苷酸,至少400個(gè)核苷酸,至少500個(gè)核苷酸,至少600個(gè)核苷酸,至少700個(gè)核苷酸,至少800個(gè)核苷酸,或至少900個(gè)核苷酸的長(zhǎng)度。DNA和RNA探針二者均可使用。通常將探針標(biāo)記以探測(cè)相應(yīng)的基因(例如,用3午、311、353、生物素或抗生物素蛋白(&"虹11)標(biāo)記)。這些探針涵蓋于本發(fā)明中。[0109]可從由這樣的其它菌株制備的基因組DNA或cDNA文庫(kù)中篩選與上述探針雜交并且編碼具有纖維二糖水解酶活性的多肽的DNA??梢酝ㄟ^瓊脂糖或聚丙烯酰胺凝膠電泳,或通過其它分離技術(shù)分離來自這些其它菌株的基因組或其它DNA。可以將來自文庫(kù)的DNA或分離的DNA轉(zhuǎn)移至硝化纖維素(nitrocellulose)或其它合適的載體材料并且固定于其上。為了鑒定與SEQIDN0:1,SEQIDN0:3,SEQIDN0:5,或SEQIDN0:7,或其成熟多肽編碼序列,或其亞序列雜交的克隆或DNA,將所述載體材料用在Sounthern印跡中。[0110]就本發(fā)明而言,雜交表示多核苷酸在非常低至非常高的嚴(yán)格條件下與標(biāo)記的核酸探針雜交,所述核酸探針對(duì)應(yīng)于:(i)SEQIDN0:1,SEQIDN0:3,SEQIDN0:5,或SEQIDN0:7,(ii)SEQIDN0:1的成熟多肽編碼序列,SEQIDN0:3的成熟多肽編碼序列,SEQIDNO:5的成熟多肽編碼序列,或SEQIDNO:7的成熟多肽編碼序列,(iii)SEQIDNO:1的cDNA序列,SEQIDNO:3的cDNA序列,SEQIDNO:5的cDNA序列,或SEQIDNO:7的cDNA序列,(iv)它們的全長(zhǎng)互補(bǔ)物,或(V)它們的亞序列??墒褂美鏧射線膠片(X-rayfilm)或其他任何本領(lǐng)域中已知的檢測(cè)手段檢測(cè)在這些條件下與核酸探針雜交的分子。[0111]在一個(gè)方面,所述核酸探針是編碼SEQIDNO:2,SEQIDNO:4,SEQIDNO:6,或SEQIDN0:8的多肽或其成熟多肽,或它們的片段的多核苷酸。在另一個(gè)方面,所述核酸探針是SEQIDNO:1,SEQIDNO:3,SEQIDNO:5,或SEQIDNO:7;或SEQIDNO:1的成熟多肽編碼序列,SEQIDNO:3的成熟多肽編碼序列,SEQIDNO:5的成熟多肽編碼序列,或SEQIDNO:7的成熟多肽編碼序列;或SEQIDNO:1的cDNA序列,SEQIDNO:3的cDNA序列,SEQIDNO:5的cDNA序列,或SEQIDNO:7的cDNA序列。[0112]在另一個(gè)實(shí)施方案中,本發(fā)明涉及具有纖維二糖水解酶活性的分離的多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:1或其cDNA序列的成熟多肽編碼序列具有至少70%,例如至少72%,至少75%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性;具有纖維二糖水解酶活性的分離的多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:3或其cDNA序列的成熟多肽編碼序列具有至少88%,例如至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性;具有纖維二糖水解酶活性的分離的多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:5或其cDNA序列的成熟多肽編碼序列具有至少66%,例如至少68%,至少70%,至少75%,至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性;具有纖維二糖水解酶活性的分離的多肽,其由多核苷酸編碼,所述多核苷酸與或SEQIDN0:7或其cDNA序列的成熟多肽編碼序列具有至少81%,例如至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性。[0113]在另一個(gè)實(shí)施方案中,本發(fā)明涉及SEQIDN0:2的成熟多肽,SEQIDN0:4的成熟多肽,SEQIDNO:6的成熟多肽,或SEQIDNO:8的成熟多肽在一個(gè)或多個(gè)(例如幾個(gè))位置包含取代、缺失和/或插入的變體。在一個(gè)方面,導(dǎo)入SEQIDNO:2的成熟多肽,SEQIDN0:4的成熟多肽,SEQIDN0:6的成熟多肽,或SEQIDN0:8的成熟多肽的氨基酸取代、缺失和/或插入的數(shù)量是多至10個(gè),例如1、2、3、4、5、6、7、8、9或10個(gè)。氨基酸改變可以是次要性的,即保守的氨基酸取代或插入,其不顯著影響蛋白質(zhì)的折疊和/或活性;通常為1至大約30個(gè)氨基酸的小缺失;小的氨基或羧基末端延伸,例如氨基末端甲硫氨酸殘基;至多大約20-25個(gè)殘基的小接頭肽;或通過改變凈電荷或其它功能來促進(jìn)純化的小延伸,如多組氨酸序列(polyhistidinetract)、抗原表位(antigenicepitope)或結(jié)合域(bindingdomain)〇[0114]保守取代的實(shí)例是在以下組之內(nèi):堿性氨基酸組(精氨酸、賴氨酸和組氨酸)、酸性氨基酸組(谷氨酸和天冬氨酸)、極性氨基酸組(谷氨酰胺和天冬酰胺)、疏水氨基酸組(亮氨酸、異亮氨酸和纈氨酸)、芳族氨基酸組(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸組(甘氨酸、丙氨酸、絲氨酸、蘇氨酸和甲硫氨酸)。通常不改變比活性(specificactivity)的氨基酸取代是本領(lǐng)域已知的,并且由例如H.Neurath和R.L.Hill,1979,于TheProteins,AcademicPress,NewYork中描述。最普遍發(fā)生的交換是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu和Asp/Gly〇[0115]或者,氨基酸改變具有導(dǎo)致多肽的物理化學(xué)特性改變的性質(zhì)。例如,氨基酸改變可改善多肽的熱穩(wěn)定性,改變底物特異性,改變最適PH等。[0116]可以根據(jù)本領(lǐng)域已知的方法,例如定位誘變或丙氨酸分區(qū)誘變法(Cunningham和Wells,1989,Science244:1081-1085)來鑒定親本多肽中的必需氨基酸。在后一技術(shù)中,將單一丙氨酸突變引入到分子中的每個(gè)殘基,并且測(cè)試所得到的突變分子是否具有纖維二糖水解酶活性,以鑒定對(duì)于所述分子的活性關(guān)鍵的氨基酸殘基。另參見Hilton等,1996,J.Biol.Chem.271:4699-4708。酶的活性部位或其它的生物相互作用也可以通過對(duì)結(jié)構(gòu)的物理分析,結(jié)合針對(duì)推定的接觸位點(diǎn)氨基酸的突變來確定,結(jié)構(gòu)通過以下這些技術(shù)來測(cè)定:如核磁共振、晶體學(xué)、電子衍射或光親和標(biāo)記。參見例如deVos等,1992,Science255:306-312;Smith等,1992,J.Mol.Biol.224:899-904;Wlodaver等,1992,FEBSLett.309:59-64。也可以從與相關(guān)多肽的同一性分析來推斷必需氨基酸的身份。[0117]可使用已知的誘變、重組和/或改組方法,然后進(jìn)行相關(guān)的篩選過程,如由Reidhaar-Olson和Sauer,1988,Science241:53_57;Bowie和Sauer,1989,Proc.Natl.Acad.Sci.USA86:2152-2156;W095/17413;或者WO95/22625所公開的那些,進(jìn)行一個(gè)或多個(gè)氨基酸取代、缺失和/或插入并加以測(cè)試。其他可使用的方法包括易錯(cuò)PCR、噬菌體展示(例如Lowman等,1991,Biochemistry30:10832-10837;美國(guó)專利號(hào)5,223,409;W092/06204)和區(qū)域定向誘變(region-directedmutagenesis)(Derbyshire等,1986,Gene46:145;等,1988,DNA7:127)。[0118]誘變/改組方法可與高通量、自動(dòng)篩選方法組合以檢測(cè)由宿主細(xì)胞表達(dá)的經(jīng)克隆、誘變的多肽的活性(Ness等,1999,NatureBiotechnologyl7:893-896)。編碼活性多肽的經(jīng)誘變的DNA分子可自宿主細(xì)胞回收并使用本領(lǐng)域標(biāo)準(zhǔn)方法迅速測(cè)序。這些方法允許快速確定多肽中單個(gè)氨基酸殘基的重要性。[0119]所述多肽可為雜合多肽,其中一個(gè)多肽的區(qū)域融合于另一個(gè)多肽的區(qū)域的N端或C端。[0120]所述多肽可為融合多肽或可切開的融合多肽,其中另一個(gè)多肽融合于本發(fā)明的多肽的N端或C端。通過將編碼另一個(gè)多肽的多核苷酸融合于本發(fā)明的多核苷酸來產(chǎn)生融合多肽。產(chǎn)生融合多肽的技術(shù)是本領(lǐng)域已知的,并包括連接編碼多肽的編碼序列以使它們符合讀框(inframe),并且使融合多肽的表達(dá)在相同啟動(dòng)子和終止子的控制下。融合蛋白亦可使用內(nèi)蛋白(intein)技術(shù)構(gòu)建,其中融合物在翻譯后產(chǎn)生(Cooper等,1993,EMBOJ.12:2575-2583;Dawson等,1994,Science266:776-779)。[0121]融合多肽還可以在兩個(gè)多肽之間包含切割位點(diǎn)。在分泌融合多肽時(shí),所述位點(diǎn)就被切開,釋放所述兩個(gè)多肽。切開位點(diǎn)的實(shí)例包括,但不限于,公開于Martin等,2003,J.Ind.Microbiol.Biotechnol.3:568-76;Svetina等,2000,J.Biotechnol.76:245-251;Rasmussen_Wilson等,1997,Appl.Environ.Microbiol.63:3488-3493;Ward等,1995,Biotechnology13:498-503;和Contreras等,1991,Biotechnology9:378_381;Eaton等,1986,Biochem.25:505-512);ColIins-Racie等,1995,Biotechnology13:982-987;Carter等,1989,Proteins:Structure,F(xiàn)unction,andGenetics6:240_248;以及Stevens,2003,DrugDiscoveryWorld4:35_48中的位點(diǎn)。[0122]具有纖維二糖水解酶活性的多肽的來源[0123]本發(fā)明的具有纖維二糖水解酶活性的多肽可以獲得自任何屬的微生物。就本發(fā)明而言,用于本文與給定的來源有關(guān)的術(shù)語(yǔ)"獲得自",意思應(yīng)為由多核苷酸編碼的多肽由所述來源產(chǎn)生,或由其中插入了來自所述來源的多核苷酸的菌株產(chǎn)生。在一個(gè)方面,從給定來源獲得的多肽是胞外分泌的。[0124]所述多肽可為真菌多肽。在一個(gè)方面,所述多肽是絨枝霉屬(Malbranchea)多肽。在另一個(gè)方面,所述多肽是樟絨枝霉(Malbrancheacinnamomea)多肽。在另一個(gè)方面,所述多肽是棒囊殼屬(Corynascus)多肽。在另一個(gè)方面,所述多肽是嗜熱棒囊殼(Corynascusthermophilus)多月太。[0125]可理解的是對(duì)于前述的種,本發(fā)明包含完全和不完全階段(perfectandimperfectstates),和其它分類學(xué)的等同物(equivalent),例如無性型(anamorph),而無論它們已知的種名。本領(lǐng)域技術(shù)人員將容易地識(shí)別適合的等同物的身份。[0126]這些種的菌株在許多培養(yǎng)物保藏中心對(duì)于公眾能夠容易地取得,所述保藏中心諸如美國(guó)典型培養(yǎng)物保藏中心(theAmericanTypeCultureCollection)(ATCC)、德意志微生物和細(xì)胞培養(yǎng)物保藏中心(DeutscheSammlungvonMikroorganismenundZellkulturenGmbH)(DSMZ)、真菌菌種保藏中心(CentraalbureauVoorSchimmelcultures)(CBS)和農(nóng)業(yè)研究機(jī)構(gòu)專利培養(yǎng)物保藏中心北區(qū)研究中心(AgriculturalResearchServicePatentCultureCollection,NorthernRegionalResearchCenter)(NRRL)〇[0127]可以利用上述的探針從其它來源,包括從自然界(例如,土壤、堆肥、水等)分離的微生物或直接獲得自自然材料(例如,土壤、堆肥、水等)的DNA樣品,鑒定并獲得所述多肽。用于直接從天然生境(habitat)分離微生物和DNA的技術(shù)是本領(lǐng)域內(nèi)公知的。隨后可通過類似地篩選另一種微生物的基因組DNA或cDNA文庫(kù)或混合的DNA樣品來得到編碼所述多肽的多核苷酸。一旦用探針檢測(cè)到編碼多肽的多核苷酸,就可以使用本領(lǐng)域普通技術(shù)人員已知的技術(shù)將所述多核苷酸分離或克?。▍⒁?,例如,Sambrook等,1989,見上文)。[0128]催化域[0129]在一個(gè)實(shí)施方案中,本發(fā)明亦涉及催化域,其與SEQIDN0:2的氨基酸18至458具有至少70%,例如至少72%,至少75%,至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性;涉及催化域,其與SEQIDN0:4的氨基酸21至450具有至少88%,例如至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性;涉及催化域,其與SEQIDNO:6的氨基酸22至457具有至少66%,例如至少68%,至少70%,至少75%,至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性;涉及催化域,其與SEQIDNO:8的氨基酸21至461具有至少81%,例如至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性。在一個(gè)方面,所述催化域包含氨基酸序列,所述氨基酸序列與SEQIDNO:2的氨基酸18至458,SEQIDNO:4的氨基酸21至450,SEQIDNO:6的氨基酸22至457,SEQIDNO:8的氨基酸21至461相差最多達(dá)10個(gè),例如,1、2、3、4、5、6、7、8、9或10個(gè)氨基酸。[0130]所述催化域優(yōu)選包含或組成為SEQIDNO:2的氨基酸18至458,SEQIDNO:4的氨基酸21至450,SEQIDNO:6的氨基酸22至457,SEQIDNO:8的氨基酸21至461;或其等位變體,或?yàn)槠渚哂欣w維二糖水解酶活性的片段。[0131]在另一個(gè)實(shí)施方案中,本發(fā)明亦涉及催化域,其由多核苷酸編碼,所述多核苷酸在中等嚴(yán)格條件,中等-高嚴(yán)格條件,高嚴(yán)格條件,或非常高嚴(yán)格條件(如上文定義)下與以下雜交:(i)SEQIDNO:1的核苷酸52至1454,SEQIDNO:3的核苷酸61至1733,SEQIDNO:5的核苷酸64至14782,或SEQIDNO:7的核苷酸52至1460,(ii)其cDNA序列,或(iii)(i)或(ii)的全長(zhǎng)互補(bǔ)物(Sambrook等,1989,見上文)。[0132]在另一個(gè)實(shí)施方案中,本發(fā)明亦涉及催化域,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:1的核苷酸52至1454,或其cDNA序列具有至少70%,例如至少72%,至少75%,至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性。在另一個(gè)實(shí)施方案中,本發(fā)明亦涉及催化域,其由多核苷酸編碼,所述多核苷酸與SEQIDN0:3的核苷酸61至1733,或其cDNA序列具有至少88%,例如至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性。在另一個(gè)實(shí)施方案中,本發(fā)明亦涉及催化域,其由多核苷酸編碼,所述多核苷酸與SEQIDN0:5的核苷酸64至1782,或其cDNA序列具有至少66%,例如至少68%,至少70%,至少75%,至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性。在另一個(gè)實(shí)施方案中,本發(fā)明亦涉及催化域,其由多核苷酸編碼,所述多核苷酸與SEQIDN0:7的核苷酸52至1460,或其cDNA序列具有至少81%,例如至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一I"生。[0133]編碼所述催化域的多核苷酸優(yōu)選包含或組成為SEQIDNO:1的核苷酸52至1454,SEQIDNO:3的核苷酸61至1733,SEQIDNO:5的核苷酸64至1782,或SEQIDNO:7的核苷酸52至1460。[0134]在另一個(gè)實(shí)施方案中,本發(fā)明亦涉及SEQIDNO:2的氨基酸18至458,SEQIDNO:4的氨基酸21至450,SEQIDNO:6的氨基酸22至457,SEQIDNO:8的氨基酸21至461在一個(gè)或多個(gè)(例如幾個(gè))位置包含取代、缺失和/或插入的催化域變體。在一個(gè)方面,引入SEQIDNO:2的氨基酸18至458,SEQIDNO:4的氨基酸21至450,SEQIDNO:6的氨基酸22至457,SEQIDNO:8的氨基酸21至461的序列的氨基酸取代、缺失和/或插入數(shù)為多至10,例如1、2、3、4、5、6、7、8、9或10。[0135]糖結(jié)合域[0136]在一個(gè)實(shí)施方案中,本發(fā)明亦涉及糖結(jié)合域,其與SEQIDN0:8的氨基酸486至521具有至少81%,例如至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性。在一個(gè)方面,所述糖結(jié)合域包含氨基酸序列,所述氨基酸序列與SEQIDN0:8的氨基酸486至521相差多至10個(gè),例如,1、2、3、4、5、6、7、8、9或10個(gè)氨基酸。[0137]所述糖結(jié)合域優(yōu)選包含或組成為SEQIDNO:8的氨基酸486至521;或其等位變體,或?yàn)槠渚哂刑墙Y(jié)合活性的片段。[0138]在另一個(gè)實(shí)施方案中,本發(fā)明亦涉及糖結(jié)合域,其由多核苷酸編碼,所述多核苷酸在中等嚴(yán)格條件,中等-高嚴(yán)格條件,高嚴(yán)格條件,或非常高嚴(yán)格條件(如上文定義)下與以下雜交:⑴SEQIDNO:7的核苷酸1533至1640,(ii)其cDNA序列,或(iii)⑴或(ii)的全長(zhǎng)互補(bǔ)物(Sambrook等,1989,見上文)。[0139]在另一個(gè)實(shí)施方案中,本發(fā)明亦涉及糖結(jié)合域,其由多核苷酸編碼,所述多核苷酸與SEQIDN0:7的核苷酸1533至1640具有至少81%,例如至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一I"生。[0140]編碼所述糖結(jié)合域的多核苷酸優(yōu)選包含或組成為SEQIDNO:7的核苷酸1533至1640。[0141]在另一個(gè)實(shí)施方案中,本發(fā)明亦涉及SEQIDNO:6的氨基酸494至529在一個(gè)或多個(gè)(例如幾個(gè))位置包含取代、缺失和/或插入的催化域變體。在一個(gè)方面,引入SEQIDN0:6的氨基酸494至529的序列的氨基酸取代、缺失和/或插入數(shù)為多至10,例如1、2、3、4、5、6、7、8、9或10。[0142]可操作連接的催化域與糖結(jié)合域可來自水解酶、異構(gòu)酶、連接酶、裂合酶、氧還酶或轉(zhuǎn)移酶,例如氨肽酶、淀粉酶、糖酶、羧肽酶、過氧化氫酶、纖維二糖水解酶、纖維素酶、殼多糖酶、角質(zhì)酶、環(huán)糊精糖基轉(zhuǎn)移酶、脫氧核糖核酸酶、內(nèi)切葡聚糖酶、酯酶、α-半乳糖苷酶、半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、轉(zhuǎn)化酶、漆酶、脂肪酶、甘露糖苷酶、變聚糖酶、氧化酶、果膠分解酶、過氧化物酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、轉(zhuǎn)谷氨酰胺酶、木聚糖酶或β_木糖苷酶。編碼催化域的多肽可從任何原核、真核或其它來源獲得。[0143]多核苷酸[0144]本發(fā)明亦涉及編碼如本文中所述的本發(fā)明的多肽,催化域,或糖結(jié)合域的分離的多核苷酸。[0145]用于分離或克隆多核苷酸的技術(shù)在本領(lǐng)域中是已知的,并包括從基因組DNA或cDNA,或其組合分離。可通過例如使用熟知的聚合酶鏈?zhǔn)椒磻?yīng)(PCR)或表達(dá)文庫(kù)的抗體篩選來檢測(cè)具有共有結(jié)構(gòu)特性的克隆DNA片段,從而實(shí)現(xiàn)從這種基因組DNA克隆多核苷酸。參見,例如,Innis等,1990,PCR:AGuidetoMethodsandApplication,AcademicPress,NewYork??梢允褂闷渌怂釘U(kuò)增方法,如連接酶鏈?zhǔn)椒磻?yīng)(LCR)、連接活化轉(zhuǎn)錄(ligatedactivatedtranscription;LAT)和基于多核苷酸的擴(kuò)增(NASBA)??梢詮腗albrancheaorCorynascus的菌株,或相關(guān)生物體克隆所述多核苷酸,因此,例如可為所述多核苷酸的多肽編碼區(qū)的等位基因變體或種間變體(speciesvariant)。[0146]修飾編碼本發(fā)明多肽的多核苷酸對(duì)于合成與所述多肽基本上相似的多肽而言可能是必需的。術(shù)語(yǔ)與所述多肽"基本上相似"指多肽的非天然存在的形式。這些多肽可能以一些工程改造的方式而不同于從其天然來源分離的多肽,例如,比活性、熱穩(wěn)定性、最適pH等方面不同的變體??梢栽谧鳛镾EQIDNO:1的成熟多肽序列,SEQIDN0:3的成熟多肽序列,SEQIDNO:5的成熟多肽序列,或SEQIDNO:7的成熟多肽序列,或其cDNA序列,或其亞序列呈現(xiàn)的多核苷酸的基礎(chǔ)上和/或通過引入如下核苷酸取代:所述取代不導(dǎo)致多肽氨基酸序列的改變,但是符合意欲產(chǎn)生酶的宿主生物體的密碼子用法;或者通過導(dǎo)入可產(chǎn)生不同的氨基酸序列的核苷酸取代來構(gòu)建變體。關(guān)于核苷酸取代的概述,參見,例如,F(xiàn)ord等,1991,ProteinExpressionandPurification〗:95-107。[0147]核酸構(gòu)建體[0148]本發(fā)明還涉及包含本發(fā)明的多核苷酸的核酸構(gòu)建體,所述多核苷酸與一個(gè)或多個(gè)(例如幾個(gè))調(diào)控序列可操作地連接,所述調(diào)控序列在合適的宿主細(xì)胞中在與該調(diào)控序列相容的條件下指導(dǎo)編碼序列的表達(dá)。[0149]可以用許多方式操作所述多核苷酸以便于多肽的表達(dá)。取決于表達(dá)載體,在將多核苷酸插入載體之前對(duì)其進(jìn)行操作可能是理想的或必需的。使用重組DNA方法修飾多核苷酸的技術(shù)是本領(lǐng)域熟知的。[0150]調(diào)控序列可為啟動(dòng)子,其由用于表達(dá)編碼本發(fā)明的多肽的多核苷酸的宿主細(xì)胞所識(shí)別的多核苷酸。啟動(dòng)子含有介導(dǎo)多肽的表達(dá)的轉(zhuǎn)錄調(diào)控序列。啟動(dòng)子可以是在宿主細(xì)胞中顯示轉(zhuǎn)錄活性的任何多核苷酸,包括突變的、截短的和雜合的啟動(dòng)子,并且可以從編碼與宿主細(xì)胞同源或異源的胞外或胞內(nèi)多肽的基因獲得。[0151]用于在細(xì)菌宿主細(xì)胞中指導(dǎo)本發(fā)明的核酸構(gòu)建體轉(zhuǎn)錄的合適啟動(dòng)子的實(shí)例是從下述獲得的啟動(dòng)子:解淀粉芽孢桿菌α-淀粉酶基因(amyQ)、地衣芽孢桿菌α-淀粉酶基因(amyL)、地衣芽孢桿菌青霉素酶基因(penP)、嗜熱脂肪芽孢桿菌產(chǎn)麥芽淀粉酶基因(amyM)、枯草芽孢桿菌果聚糖鹿糖酶基因(sacB)、枯草芽孢桿菌xylA和xylB基因、蘇云金芽抱桿菌cryIIIA基因(Agaisse和Lereclus,1994,MolecularMicrobiologyl3:97-107)、大腸桿菌Iac操縱子、大腸桿菌trc啟動(dòng)子(Egon等,1988,Gene69:301-315)、天藍(lán)鏈霉菌瓊脂糖酶基因(dagA)和原核β-內(nèi)酰胺酶基因(Villa-Kamaroff等,1978,ProceedingsoftheNationalAcademyofSciencesUSA75:3727-3731),以及tac啟動(dòng)子(DeBoer等,1983,Proc.Natl.Acad.Sci.USA80:21-25)。另外的啟動(dòng)子在"Usefulproteinsfromrecombinantbacteria"于Gilbert等,1980,ScientificAmerican,242:74-94中;和在Sambrook等,1989,見上文中描述。串聯(lián)啟動(dòng)子的實(shí)例公開于WO99/43835。[0152]用于指導(dǎo)本發(fā)明的核酸構(gòu)建體在絲狀真菌宿主細(xì)胞中轉(zhuǎn)錄的合適啟動(dòng)子的實(shí)例是從下列酶的基因獲得的啟動(dòng)子:構(gòu)巢曲霉乙酰胺酶、黑曲霉中性α-淀粉酶、黑曲霉酸穩(wěn)定性α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、米曲霉TAKA淀粉酶、米曲霉堿性蛋白酶、米曲霉丙糖磷酸異構(gòu)酶、尖鐮孢胰蛋白酶樣蛋白酶(W096/00787)、鑲片鐮孢淀粉葡糖苷酶(W000/56900)、鑲片鐮孢Daria(W000/56900)、鑲片鐮孢Quinn(W000/56900)、曼赫根毛霉(Rhizomucormiehei)脂肪酶、曼赫根毛霉天冬氨酸蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纖維二糖水解酶I、里氏木霉纖維二糖水解酶II、里氏木霉內(nèi)切葡聚糖酶I、里氏木霉內(nèi)切葡聚糖酶II、里氏木霉內(nèi)切葡聚糖酶III、里氏木霉內(nèi)切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶Π、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶、里氏木霉翻譯延伸因子,以及NA2_tpi啟動(dòng)子(一種修飾的啟動(dòng)子,其來自在曲霉屬中性α-淀粉酶基因,其中未翻譯的前導(dǎo)序列由曲霉屬丙糖磷酸異構(gòu)酶的基因的未翻譯的前導(dǎo)序列所替代;非限制性實(shí)例包括修飾的啟動(dòng)子,其來自黑曲霉中性α-淀粉酶的基因,其中未翻譯的前導(dǎo)序列由構(gòu)巢曲霉或米曲霉丙糖磷酸異構(gòu)酶的基因的未翻譯的前導(dǎo)序列所替代);和它們的突變的、截短的和雜合的啟動(dòng)子。其它啟動(dòng)子描述于美國(guó)專利號(hào)6,011,147。[0153]在酵母宿主中,有用的啟動(dòng)子從如下的基因獲得:釀酒酵母烯醇化酶(ΕΝ0-1)、釀酒酵母半乳糖激酶(GALl)、釀酒酵母醇脫氫酶/甘油醛-3-磷酸脫氫酶(ADH1,ADH2/GAP)、釀酒酵母丙糖磷酸異構(gòu)酶(TPI)、釀酒酵母金屬硫蛋白(CUPl)和釀酒酵母3-磷酸甘油酸激酶。對(duì)于酵母宿主細(xì)胞其它有用的啟動(dòng)子由Romanos等,1992,Yeast8:423-488描述。[0154]調(diào)控序列也可以是轉(zhuǎn)錄終止子,其由宿主細(xì)胞識(shí)別以終止轉(zhuǎn)錄。所述終止子與編碼所述多肽的多核苷酸的3'末端可操作地連接。在本發(fā)明中,可使用在宿主細(xì)胞中有功能的任何終止子。[0155]對(duì)于細(xì)菌宿主細(xì)胞優(yōu)選的終止子從如下的基因獲得:克勞氏芽孢桿菌堿性蛋白酶(aprH)、地衣芽孢桿菌α-淀粉酶(amyL)和大腸桿菌核糖體RNA(rrnB)。[0156]對(duì)于絲狀真菌宿主細(xì)胞優(yōu)選的終止子從如下酶的基因獲得:構(gòu)巢曲霉乙酰胺酶、構(gòu)巢曲霉鄰氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶、尖鐮孢胰蛋白酶樣蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纖維二糖水解酶I、里氏木霉纖維二糖水解酶II、里氏木霉內(nèi)切葡聚糖酶I、里氏木霉內(nèi)切葡聚糖酶II、里氏木霉內(nèi)切葡聚糖酶III、里氏木霉內(nèi)切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶和里氏木霉翻譯延伸因子。[0157]對(duì)于酵母宿主細(xì)胞優(yōu)選的終止子從如下酶的基因獲得:釀酒酵母烯醇化酶、釀酒酵母細(xì)胞色素C(CYCl)和釀酒酵母甘油醛-3-磷酸脫氫酶。對(duì)于酵母宿主細(xì)胞其它有用的終止子由Romanos等,1992,見上文描述。[0158]調(diào)控序列還可以是啟動(dòng)子下游和基因的編碼序列上游的mRNA穩(wěn)定化區(qū),其增加所述基因的表達(dá)。[0159]合適的mRNA穩(wěn)定化區(qū)的實(shí)例從如下的基因獲得:蘇云金芽孢桿菌cryIIIA基因(W094/25612)和枯草芽孢桿菌SP82基因(Hue等,1995,JournalofBacteriologyl77:3465-3471)〇[0160]調(diào)控序列還可以是合適的前導(dǎo)序列,其為對(duì)于宿主細(xì)胞的翻譯重要的mRNA非翻譯區(qū)。前導(dǎo)序列可操作地連接于編碼多肽的多核苷酸的5'-末端??墒褂迷谒拗骷?xì)胞中有功能的任何前導(dǎo)序列。[0161]對(duì)于絲狀真菌宿主細(xì)胞優(yōu)選的前導(dǎo)序列從如下酶的基因獲得:米曲霉TAKA淀粉酶和構(gòu)巢曲霉丙糖磷酸異構(gòu)酶。[0162]對(duì)于酵母宿主細(xì)胞合適的前導(dǎo)序列從如下酶的基因獲得:釀酒酵母烯醇化酶(EN0-1)、釀酒酵母3-磷酸甘油酸激酶、釀酒酵母α因子和釀酒酵母醇脫氫酶/甘油醛-3-磷酸脫氫酶(ADH2/GAP)。[0163]調(diào)控序列也可以是聚腺苷酸化序列,其是與多核苷酸的3'末端可操作地連接的序列,并且在轉(zhuǎn)錄時(shí),宿主細(xì)胞將其識(shí)別為將聚腺苷殘基添加至轉(zhuǎn)錄的mRNA的信號(hào)??墒褂迷谒拗骷?xì)胞中有功能的任何聚腺苷酸化序列。[0164]對(duì)于絲狀真菌宿主細(xì)胞優(yōu)選的聚腺苷酸化序列從如下酶的基因獲得:構(gòu)巢曲霉鄰氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶和尖鐮孢胰蛋白酶樣蛋白酶。[0165]對(duì)于酵母宿主細(xì)胞有用的聚腺苷酸化序列由Guo和Sherman,1995,Mol.CellularBioh15:5983-5990描述。[0166]調(diào)控序列還可以是信號(hào)肽編碼區(qū),其編碼與多肽的N端相連的信號(hào)肽,并指導(dǎo)所述多肽進(jìn)入細(xì)胞分泌途徑。多核苷酸的編碼序列5'端可固有地包含信號(hào)肽編碼序列,其與編碼所述多肽的編碼序列的區(qū)段一起天然地連接在翻譯閱讀框中?;蛘撸幋a序列5'端可含有對(duì)于所述編碼序列外源的信號(hào)肽編碼序列。當(dāng)編碼序列天然不含有信號(hào)肽編碼序列時(shí),外源信號(hào)肽編碼序列可能是必需的?;蛘?,可直接用外源信號(hào)肽編碼序列取代天然信號(hào)肽編碼序列以增強(qiáng)多肽的分泌。然而,可使用指導(dǎo)表達(dá)的多肽進(jìn)入宿主細(xì)胞的分泌途徑的任何信號(hào)膚編碼序列。[0167]對(duì)于細(xì)菌宿主細(xì)胞有效的信號(hào)肽編碼序列是從如下酶的基因獲得的信號(hào)肽編碼序列:芽孢桿菌屬NCIB11837產(chǎn)麥芽糖淀粉酶、地衣芽孢桿菌枯草桿菌蛋白酶(subtilisin)、地衣芽孢桿菌β-內(nèi)酰胺酶、嗜熱脂肪芽孢桿菌α-淀粉酶、嗜熱脂肪芽孢桿菌中性蛋白酶(nprT,nprS,nprM)和枯草芽孢桿菌prsA。另外的信號(hào)肽由Simonen和Palva,1993,MicrobiologicalReviews57:109-137描述。[0168]對(duì)于絲狀真菌宿主細(xì)胞有效的信號(hào)肽編碼序列是從如下酶的基因獲得的信號(hào)肽編碼序列:黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米曲霉TAKA淀粉酶、特異腐質(zhì)霉纖維素酶、特異腐質(zhì)霉內(nèi)切葡聚糖酶V、疏棉狀腐質(zhì)霉脂肪酶和曼赫根毛霉天冬氨酸蛋白酶。[0169]對(duì)于酵母宿主細(xì)胞有用的信號(hào)肽從釀酒酵母α因子和釀酒酵母轉(zhuǎn)化酶的基因獲得。其它有用的信號(hào)肽編碼序列由Romanos等,1992,見上文描述。[0170]調(diào)控序列還可以是前肽編碼序列,其編碼位于多肽N端的前肽。所得多肽稱為酶原(proenzyme)或前多肽(propolypeptide)(或在某些情況下稱為酶原(zymogen))。前多肽通常是無活性的,并且能夠通過前肽的催化或自催化切割從前多肽轉(zhuǎn)化為活性多肽。可以從枯草芽孢桿菌堿性蛋白酶(aprE)、枯草芽孢桿菌中性蛋白酶(nprT)、嗜熱毀絲霉漆酶(W095/33836)、曼赫根毛霉天冬氨酸蛋白酶和釀酒酵母α因子的基因獲得前肽編碼序列。[0171]當(dāng)信號(hào)肽和前肽序列二者均存在時(shí),將前肽序列置于緊接著(nextto)多肽的N端,并且將信號(hào)肽序列置于緊接著前肽序列的N端。[0172]同樣理想的是添加調(diào)節(jié)序列,其相對(duì)于宿主細(xì)胞的生長(zhǎng)來調(diào)節(jié)多肽的表達(dá)。調(diào)節(jié)序列的實(shí)例是引起基因表達(dá)響應(yīng)化學(xué)或物理刺激物,包括調(diào)節(jié)化合物的存在而開啟或關(guān)閉的那些系統(tǒng)。原核系統(tǒng)中的調(diào)節(jié)序列包括lac、tac和trp操縱基因系統(tǒng)。在酵母中,可使用ADH2系統(tǒng)或GALl系統(tǒng)。在絲狀真菌中,可以使用黑曲霉葡糖淀粉酶啟動(dòng)子、米曲霉TAKAα-淀粉酶啟動(dòng)子和米曲霉葡糖淀粉酶啟動(dòng)子、里氏木霉纖維二糖水解酶I啟動(dòng)子和里氏木霉纖維二糖水解酶II啟動(dòng)子。調(diào)節(jié)序列的其它實(shí)例是那些允許基因擴(kuò)增的序列。在真核系統(tǒng)中,這些調(diào)節(jié)序列包括在氨甲蝶呤(methotrexate)存在下擴(kuò)增的二氫葉酸還原酶基因,和以重金屬(withheavymetal)擴(kuò)增的金屬硫蛋白基因。在這些情況下,編碼多肽的多核苷酸將與調(diào)節(jié)序列可操作地連接。[0173]表達(dá)載體[0174]本發(fā)明還涉及重組表達(dá)載體,所述重組表達(dá)載體包含本發(fā)明的多核苷酸、啟動(dòng)子和轉(zhuǎn)錄和翻譯終止信號(hào)。多種核苷酸和調(diào)控序列可以結(jié)合在一起以產(chǎn)生重組表達(dá)載體,所述表達(dá)載體可以包括一個(gè)或多個(gè)(例如幾個(gè))方便的限制位點(diǎn)以允許在這些位點(diǎn)插入或取代編碼多肽的多核苷酸?;蛘?,可以通過在適當(dāng)?shù)挠糜诒磉_(dá)的載體中插入包含所述多核苷酸的核酸構(gòu)建體或多核苷酸來表達(dá)所述多核苷酸。在制備表達(dá)載體的過程中,將編碼序列置于載體中,從而將該編碼序列與適當(dāng)?shù)恼{(diào)控序列可操作地連接以供表達(dá)。[0175]重組表達(dá)載體可以是任何能夠方便地進(jìn)行重組DNA步驟,并且能夠產(chǎn)生多核苷酸的表達(dá)的載體(例如,質(zhì)?;虿《荆?。載體的選擇將通常依賴于載體與將引入該載體的宿主細(xì)胞的相容性。載體可以是線狀或閉合環(huán)狀質(zhì)粒。[0176]載體可以是自主復(fù)制載體,S卩,作為染色體外實(shí)體(entity)存在的載體,其復(fù)制獨(dú)立于染色體復(fù)制,例如,質(zhì)粒、染色體外元件、微型染色體(minichromosome)或人工染色體。載體可以含有任何用于確保自我復(fù)制的手段(means)。或者,載體可以是一種當(dāng)被引入宿主細(xì)胞中時(shí),整合到基因組中并且與整合了該載體的染色體一起復(fù)制的載體。此外,可以使用單獨(dú)的載體或質(zhì)?;騼蓚€(gè)或更多個(gè)載體或質(zhì)粒,其共同含有待引入宿主細(xì)胞基因組的完整0嫩(1:〇丨310嫩),或可以使用轉(zhuǎn)座子(1:四118口〇8〇11)。[0177]所述載體優(yōu)選地含有一個(gè)或多個(gè)(例如幾個(gè))選擇性標(biāo)記,以便于容易地選擇經(jīng)轉(zhuǎn)化、轉(zhuǎn)染、轉(zhuǎn)導(dǎo)等的細(xì)胞。選擇性標(biāo)記是這樣的基因,其產(chǎn)物提供殺生物劑或病毒抗性、對(duì)重金屬的抗性、對(duì)營(yíng)養(yǎng)缺陷型的原養(yǎng)性(prototrophytoauxotrophs)等。[0178]細(xì)菌選擇性標(biāo)記的實(shí)例是地衣芽孢桿菌或枯草芽孢桿菌dal基因,或賦予抗生素抗性的標(biāo)記,所述抗生素抗性例如氨芐青霉素、氯霉素、卡那霉素、新霉素、壯觀霉素或四環(huán)素抗性。對(duì)于酵母宿主細(xì)胞合適的標(biāo)記包括但不限于ADE2、HIS3、LEU2、LYS2、MET3、TRPl和URA3。用于絲狀真菌宿主細(xì)胞的選擇性標(biāo)記包括但不限于adeA(磷酸核糖氨基咪唑琥珀羧酉先胺合酶,phosphoribosylaminoimidazole-succinocarboxamidesynthase)、adeB(憐酸核糖氨基咪唑合酶,phosphoribosyl-aminoimidazolesynthase)、amdS(乙醜胺酶)、argB(鳥氨酸氨甲?;D(zhuǎn)移酶)、bar(草銨膦(phosphinothricin)乙酰轉(zhuǎn)移酶)、hph(潮霉素磷酸轉(zhuǎn)移酶)、niaD(硝酸還原酶)(nitratereductase)、pyrG(乳清酸核苷-5'-磷酸脫羧酶)(〇rotidine-5'-phosphatedecarboxylase)、sC(硫酸腺苷醜轉(zhuǎn)移酶)和trpC(鄰氨基苯甲酸合酶(anthranilatesynthase))以及它們的等同物。優(yōu)選用在曲霉屬細(xì)胞中的是構(gòu)巢曲霉或米曲霉amdS和pyrG基因和吸水鏈霉菌(Streptomyceshygroscopicus)bar基因。優(yōu)選用于木霉屬細(xì)胞的是adeA、adeB、amdS、hph和pyrG基因。[0179]選擇性標(biāo)記可為WO2010/039889中所述的雙重選擇性標(biāo)記系統(tǒng)。在一個(gè)方面,所述雙重選擇性標(biāo)記是hph-tk雙重選擇性標(biāo)記系統(tǒng)。[0180]所述載體優(yōu)選含有允許載體整合入宿主細(xì)胞基因組或載體在細(xì)胞中獨(dú)立于基因組的自主復(fù)制的元件。[0181]為了整合入宿主細(xì)胞基因組,載體可依賴編碼多肽的多核苷酸的序列或用于通過同源或非同源重組整合入基因組的任何其它載體元件?;蛘?,載體可以含有用于指導(dǎo)通過同源重組整合入宿主細(xì)胞基因組染色體中的精確位置的額外的多核苷酸。為了增加在精確位置整合的可能性,整合元件應(yīng)含有足夠數(shù)量的與相應(yīng)的目標(biāo)序列具有高度序列同一性的核酸,如100至10,〇〇〇堿基對(duì),400至10,000堿基對(duì),和800至10,000堿基對(duì),以提高同源重組的概率。整合元件可為任何與宿主細(xì)胞基因組中的目標(biāo)序列同源的序列。此外,整合元件可為非編碼或編碼的多核苷酸。另一方面,可以將載體通過非同源重組整合到宿主細(xì)胞的基因組中。[0182]為了自主復(fù)制,載體可以還包含復(fù)制起點(diǎn),其使載體能夠在所述的宿主細(xì)胞中自主地復(fù)制。復(fù)制起點(diǎn)可以是在細(xì)胞中發(fā)揮功能的介導(dǎo)自主復(fù)制的任何質(zhì)粒復(fù)制子(replicator)。術(shù)語(yǔ)"復(fù)制起點(diǎn)"或"質(zhì)粒復(fù)制子"意指能夠使質(zhì)?;蜉d體體內(nèi)復(fù)制的多核苷酸。[0183]細(xì)菌復(fù)制起點(diǎn)的實(shí)例是允許在大腸桿菌中復(fù)制的質(zhì)粒pBR322、pUC19、pACYC177和PACYC184的復(fù)制起點(diǎn),和允許在芽孢桿菌屬中復(fù)制的質(zhì)粒pUBllO、pE194、pTA1060和ρΑΜβ1的復(fù)制起點(diǎn)。[0184]用于酵母宿主細(xì)胞中的復(fù)制起點(diǎn)的實(shí)例是2微米復(fù)制起點(diǎn),ARS1,ARS4,ARSl和CEN3的組合,和ARS4和CEN6的組合。[0185]在絲狀真菌細(xì)胞中有用的復(fù)制起點(diǎn)的實(shí)例是AMAl和ANSI(Gems等,1991,Gene98:61-67;Cullen等,1987,NucleicAcidsRes.15:9163-9175;W000/24883)。分離AMl基因和構(gòu)建包含該基因的質(zhì)?;蜉d體能夠根據(jù)公開于WO00/24883中的方法完成。[0186]可以將多于一個(gè)拷貝的本發(fā)明的多核苷酸插入宿主細(xì)胞以增加多肽的產(chǎn)生。多核苷酸拷貝數(shù)的增加可通過如下方法獲得:將至少一個(gè)額外拷貝的序列整合入宿主細(xì)胞基因組,或?qū)⒖蓴U(kuò)增的選擇性標(biāo)記基因包括于多核苷酸,其中可通過在合適的選擇劑(selectableagent)存在下培養(yǎng)細(xì)胞來選擇含有選擇性標(biāo)記基因的擴(kuò)增拷貝,且由此含有多核苷酸的額外拷貝的細(xì)胞。[0187]用于連接上述元件以構(gòu)建本發(fā)明的重組表達(dá)載體的方法是本領(lǐng)域技術(shù)人員熟知的(參見,例如,Sambrook等,1989,見上文)。[0188]宿主細(xì)胞[0189]本發(fā)明還涉及重組宿主細(xì)胞,其包含本發(fā)明的多核苷酸可操作地連接于一個(gè)或多個(gè)(例如幾個(gè))指導(dǎo)本發(fā)明多肽的產(chǎn)生的調(diào)控序列。將包含多核苷酸的構(gòu)建體或載體引入宿主細(xì)胞,使所述構(gòu)建體或載體如前所述作為染色體整合體或者作為自我復(fù)制的染色體外載體維持。術(shù)語(yǔ)"宿主細(xì)胞"包括親本細(xì)胞的任何由于復(fù)制過程中發(fā)生的突變而不同于親本細(xì)胞的后代。宿主細(xì)胞的選擇將在很大程度上依賴于編碼多肽的基因及其來源。[0190]宿主細(xì)胞可以是在本發(fā)明的多肽的重組產(chǎn)生中有用的任何細(xì)胞,例如,原核或真核細(xì)胞。[0191]原核宿主細(xì)胞可以是任何革蘭氏陽(yáng)性或革蘭氏陰性細(xì)菌。革蘭氏陽(yáng)性細(xì)菌包括但不限于,芽孢桿菌屬、梭菌屬、腸球菌屬、地芽孢桿菌屬、乳桿菌屬、乳球菌屬、海洋芽孢桿菌屬、葡萄球菌屬、鏈球菌屬和鏈霉菌屬。革蘭氏陰性細(xì)菌包括但不限于,彎曲桿菌屬、大腸桿菌、黃桿菌屬、梭桿菌屬、螺桿菌屬、泥桿菌屬、奈瑟氏菌屬、假單胞菌屬、沙門氏菌屬和脲原體屬。[0192]細(xì)菌宿主細(xì)胞可以是任何芽孢桿菌屬細(xì)胞,包括但不限于嗜堿芽孢桿菌、解淀粉芽孢桿菌、短芽孢桿菌、環(huán)狀芽孢桿菌、克勞氏芽孢桿菌、凝結(jié)芽孢桿菌、堅(jiān)強(qiáng)芽孢桿菌、燦爛芽孢桿菌、遲緩芽孢桿菌、地衣芽孢桿菌、巨大芽孢桿菌、短小芽孢桿菌、嗜熱脂肪芽孢桿菌、枯草芽孢桿菌和蘇云金芽孢桿菌細(xì)胞。[0193]細(xì)菌宿主細(xì)胞還可以是任何鏈球菌屬細(xì)胞,包括但不限于,似馬鏈球菌、釀膿鏈球菌、乳房鏈球菌和馬鏈球菌獸瘟亞種細(xì)胞。[0194]細(xì)菌宿主細(xì)胞還可以是任何鏈霉菌屬細(xì)胞,包括但不限于,不產(chǎn)色鏈霉菌、除蟲鏈霉菌、天藍(lán)鏈霉菌、灰色鏈霉菌和淺青紫鏈霉菌細(xì)胞。[0195]可通過如下方法實(shí)現(xiàn)將DNA引入到芽孢桿菌屬細(xì)胞:原生質(zhì)體轉(zhuǎn)化(參見,例如,Chang和Cohen,1979,Mol.Gen.Genet.168:111-115),感受態(tài)細(xì)胞轉(zhuǎn)化(參見,例如,Young和Spizizen,1961,J.Bacteriol.81:823-829或Dubnau和Davidoff-Abelson,1971,J.Mol.Biol.56:209-221),電穿孔(參見,例如,Shigekawa和Dower,1988,Biotechniques6:742-751)或接合(參見,例如,Koehler和Thorne,1987,J.Bacteriol.169:5771-5278)。可通過如下方法實(shí)現(xiàn)將DNA引入到大腸桿菌細(xì)胞:原生質(zhì)體轉(zhuǎn)化(參見,例如,Hanahan,1983,J.Mol.Biol.166:557-580)或電穿孔(參見,例如,Dower等,1988,NucleicAcidsRes.16:6127-6145)。可通過如下方法實(shí)現(xiàn)將DNA引入到鏈霉菌屬細(xì)胞:原生質(zhì)體轉(zhuǎn)化,電穿孔(參見,例如,Gong等,2004,FoliaMicrobiol.(Praha)49:399-405),接合(參見,例如,Mazodier等,1989,J.Bacteriol.171:3583-3585),或轉(zhuǎn)導(dǎo)(參見,例如,Burke等,2001,Proc.Natl.Acad.Sci.USA98:6289-6294)??赏ㄟ^如下方法實(shí)現(xiàn)將DNA引入到假單胞菌屬細(xì)胞:電穿孔(參見,例如,Choi等,2006,J.Microbiol.Methods64:391-397)或接合(參見,例如,Pinedo和Smets,2005,Appl.Environ.Microbiol.71:51-57)??赏ㄟ^如下方法實(shí)現(xiàn)將DNA引入到鏈球菌屬細(xì)胞:天然感受態(tài)(naturalcompetence)(參見,例如,Perry和Kuramitsu,1981,Infect.Tmmun.32:1295-1297),原生質(zhì)體轉(zhuǎn)化(參見,例如,Catt和Jollick,1991,Microbios.68:189-207),電穿孔(參見,例如,Buckley等,1999,Appl.Environ.Microbiol.65:3800-3804)或接合(參見,例如,Clewell,1981,Microbiol.Rev.45:409-436)。然而,可使用本領(lǐng)域已知的將DNA引入宿主細(xì)胞的任何方法。[0196]宿主細(xì)胞還可為真核生物,如哺乳動(dòng)物、昆蟲、植物或真菌細(xì)胞。[0197]宿主細(xì)胞可為真菌細(xì)胞。"真菌"用在本文包括以下門:子囊菌門(Ascomycota)、擔(dān)子菌門(Basidiomycota)、壺菌門(Chytridiomycota)和接合菌門(Zygomycota)以及卵菌門(Oomycota)和所有有絲分裂抱子真菌(mitosporicfungi)(如由Hawksworth等,于AinsworthandBisby,sDictionaryofTheFungi,第8版,1995,CABInternational,UniversityPress,Cambridge,UK中所定義)。[0198]真菌宿主細(xì)胞可為酵母細(xì)胞。"酵母"用在本文包括產(chǎn)子囊酵母(ascosporogenousyeast)(內(nèi)抱霉目(Endomycetales))、產(chǎn)擔(dān)子酵母(basidiosporogenousyeast)和屬于半知菌類(FungiImperfecti)(芽孢綱(Blastomycetes))的酵母。由于酵母的分類在未來可能改變,就本發(fā)明而言,將酵母定義為如BiologyandActivitiesofYeast(Skinner,Passmore,和Davenport編,Soc.App.Bacteriol.SymposiumSeriesNo.9,1980)中所述。[0199]酵母宿主細(xì)胞可為假絲酵母屬、漢遜酵母屬(Hansenula)、克魯維酵母屬、畢赤酵母屬、酵母屬、裂殖酵母屬或西洋蓍霉屬細(xì)胞,如乳酸克魯維酵母(Kluyveromyceslactis)、卡爾酵母、釀酒酵母、糖化酵母、道格拉氏酵母、克魯弗酵母、諾地酵母、卵形酵母、或解脂西洋蓍霉(YarrowiaIipolytica)細(xì)胞。[0200]真菌宿主細(xì)胞可為絲狀真菌細(xì)胞。"絲狀真菌"包括真菌門(Eumycota)和卵菌門的亞門(如由Hawksworth等,1995,見上文,所定義)的所有絲狀形式。絲狀真菌通常的特征在于由殼多糖(chitin)、纖維素、葡聚糖、殼聚糖(chitosan)、甘露聚糖和其它復(fù)雜多糖構(gòu)成的菌絲體壁。通過菌絲延伸進(jìn)行營(yíng)養(yǎng)生長(zhǎng),而碳分解代謝是專性需氧的。相反,酵母例如釀酒酵母的營(yíng)養(yǎng)生長(zhǎng)通過單細(xì)胞菌體的出芽生殖(budding)進(jìn)行,而碳分解代謝可以是發(fā)酵性的。[0201]絲狀真菌宿主細(xì)胞可為枝頂孢霉屬、曲霉屬、短梗霉屬、煙管霉屬(Bjerkandera)、擬錯(cuò)菌屬、金孢子菌屬、鬼傘屬(Coprinus)、革蓋菌屬(Coriolus)、隱球菌屬、Filibasidium、鐮孢屬、腐質(zhì)霉屬、梨孢菌屬、毛霉屬、毀絲霉屬、新考瑪脂霉屬、脈孢菌屬、擬青霉屬、青霉屬、平革菌屬(Phanerochaete)、射脈菌屬(Phlebia)、瘤胃壺菌屬、側(cè)耳屬(Pleurotus)、裂裙菌屬、踝節(jié)菌屬、嗜熱子囊菌屬、梭孢霉屬、彎頸霉屬、栓菌屬(Trametes)或木霉屬細(xì)胞。[0202]例如,絲狀真菌宿主細(xì)胞可為泡盛曲霉、煙曲霉、臭曲霉、日本曲霉、構(gòu)巢曲霉、黑曲霉、米曲霉、黑刺煙管菌(Bjerkanderaadusta)、干擬錯(cuò)菌(Ceriporiopsisaneirina)、Ceriporiopsiscaregiea、Ceriporiopsisgilvescens、Ceriporiopsispannocinta、Ceriporiopsisrivulosa、Ceriporiopsissubrufa、蟲擬錯(cuò)菌(Ceriporiopsissubvermispora)λChrysosporiuminops、嗜角質(zhì)金抱子菌、Chrysosporiumlucknowense、Chrysosporiummerdarium、毯金抱子菌、Chrysosporiumqueenslandicum、熱帶金抱子菌、Chrysosporiumzonatum、灰蓋鬼傘(Coprinuscinereus)、毛革蓋菌(Coriolushirsutus)、桿孢狀鐮孢、禾谷鐮孢、庫(kù)威鐮孢、大刀鐮孢、禾本科鐮孢、禾赤鐮孢、異孢鐮孢、合歡木鐮孢、尖鐮孢、多枝鐮孢、粉紅鐮孢、接骨木鐮孢、膚色鐮孢、擬分枝孢鐮孢、硫色鐮孢、圓鐮孢、擬絲孢鐮孢、鑲片鐮孢、特異腐質(zhì)霉、疏棉狀腐質(zhì)霉、米黑毛霉、嗜熱毀絲霉、粗糙脈孢菌、產(chǎn)紫青霉、黃孢平革菌(Phanerochaetechrysosporium)、福射射脈菌(Phlebiaradiata)、刺序側(cè)耳(Pleurotuseryngii)、土生梭孢霉、長(zhǎng)絨毛栓菌(Trametesvillosa)、變色栓菌(Trametesversicolor)、哈茨木霉、康寧木霉、長(zhǎng)枝木霉、里氏木霉或綠色木霉細(xì)胞。[0203]可以將真菌細(xì)胞通過涉及原生質(zhì)體形成、原生質(zhì)體轉(zhuǎn)化和細(xì)胞壁再生的方法以本身公知的方式轉(zhuǎn)化。用于轉(zhuǎn)化曲霉屬和木霉屬宿主細(xì)胞的合適方法在EP238023和Yelton等,1984,Proc.Natl.Acad.Sci.USA81:1470-1474以及Christensen等,1988,Bio/Technology6:1419-1422中描述。用于轉(zhuǎn)化鐮孢屬菌種的合適方法由Malardier等,1989,Gene78:147-156和WO96/00787描述??梢允褂糜扇缦挛墨I(xiàn)描述的方法轉(zhuǎn)化酵母:Becker和Guarente,于Abelson,J.N.和Simon,M.I.編,GuidetoYeastGeneticsandMolecularBiology,MethodsinEnzymology,Volumel94,ppl82-187,AcademicPress,Inc.,NewYork;Ito等,1983,J.Bacteriol.153:163;和Hinnen等,1978,Proc.Natl.Acad.Sci.USA75:1920。[0204]產(chǎn)生方法[0205]本發(fā)明還涉及用于產(chǎn)生本發(fā)明多肽的方法,其包括:(a)在有助于產(chǎn)生多肽的條件下培養(yǎng)細(xì)胞,所述細(xì)胞以其野生型形式產(chǎn)生所述多肽;和任選地(b)回收所述多肽。在一個(gè)方面,所述細(xì)胞是絨枝霉屬細(xì)胞。在另一個(gè)方面,所述細(xì)胞是樟絨枝霉細(xì)胞。在另一個(gè)方面,所述細(xì)胞是棒囊殼屬細(xì)胞。在另一個(gè)方面,所述細(xì)胞是嗜熱棒囊殼細(xì)胞。在另一個(gè)方面,所述細(xì)胞是嗜熱棒囊殼NN000308細(xì)胞。[0206]本發(fā)明還涉及用于產(chǎn)生本發(fā)明的多肽的方法,其包括:(a)在有助于產(chǎn)生多肽的條件下培養(yǎng)本發(fā)明的重組宿主細(xì)胞;和任選地(b)回收所述多肽。[0207]所述宿主細(xì)胞使用本領(lǐng)域已知的方法在適合于產(chǎn)生所述多肽的營(yíng)養(yǎng)培養(yǎng)基中培養(yǎng)。例如,可以通過在合適培養(yǎng)基中和允許表達(dá)和/或分離所述多肽的條件下的搖瓶培養(yǎng),或?qū)嶒?yàn)室或工業(yè)發(fā)酵罐中的小規(guī)模或大規(guī)模發(fā)酵(包括連續(xù)、分批、補(bǔ)料分批或固態(tài)發(fā)酵)來培養(yǎng)細(xì)胞。使用本領(lǐng)域已知的方法在合適的營(yíng)養(yǎng)培養(yǎng)基中進(jìn)行培養(yǎng),所述營(yíng)養(yǎng)培養(yǎng)基包含碳源和氮源和無機(jī)鹽。合適的培養(yǎng)基能夠從商業(yè)供應(yīng)商獲得或可以根據(jù)公開的組成制備(例如,在美國(guó)典型培養(yǎng)物保藏中心的目錄中)。如果多肽分泌到營(yíng)養(yǎng)培養(yǎng)基中,該多肽可以從所述培養(yǎng)基中直接回收。如果多肽不分泌,其可以從細(xì)胞裂解物(lysate)回收。[0208]可以使用本領(lǐng)域已知的對(duì)于所述多肽特異性的方法來檢測(cè)多肽。這些檢測(cè)方法包括但不限于特異性抗體的使用、酶產(chǎn)物的形成或酶底物的消失。例如,酶測(cè)定法(enzymeassay)可用于確定多肽的活性。[0209]多肽可以使用本領(lǐng)域已知的方法回收。例如,多肽可以通過常規(guī)方法從營(yíng)養(yǎng)培養(yǎng)基中回收,所述常規(guī)方法包括但不限于收集、離心、過濾、提取、噴霧干燥、蒸發(fā)或沉淀。在一個(gè)方面,回收了包含多肽的全發(fā)酵液。[0210]多肽可以通過多種本領(lǐng)域已知的方法純化以獲得基本上純的多肽,所述方法包括但不限于層析(例如,離子交換、親和、疏水、層析聚焦和大小排阻)、電泳方法(例如,制備型(preparative)等電聚焦)、差示溶解度(例如,硫酸銨沉淀)、SDS-PAGE或提?。▍⒁?,例如,ProteinPurification,Janson和Ryden編,VCHPublishers,NewYork,1989)。[0211]在另一個(gè)方面,不回收多肽,而是使用表達(dá)所述多肽的本發(fā)明的宿主細(xì)胞作為所述多肽的來源。[0212]植物[0213]本發(fā)明還涉及分離的植物,例如,轉(zhuǎn)基因植物、植物部分或植物細(xì)胞,其包含本發(fā)明的多核苷酸,從而以可回收的量表達(dá)和產(chǎn)生所述多肽或域。多肽或域可從植物或植物部分回收。或者,可以按原樣(assuch)將含有該多肽或域的植物或植物部分用于改進(jìn)食品或飼料的質(zhì)量,例如,改進(jìn)營(yíng)養(yǎng)價(jià)值、適口性(palatability)和流變性質(zhì)(rheologicalproperties),或用于破壞抗?fàn)I養(yǎng)因子。[0214]轉(zhuǎn)基因植物可以是雙子葉的(雙子葉植物)或單子葉的(單子葉植物)。單子葉植物的實(shí)例是草(grasses),如草地早熟禾(meadowgrass)(藍(lán)草(bluegrass),早熟禾屬(Poa));飼用牧草(foragegrass)如羊茅屬(Festuca)、黑麥草屬(Lolium);寒地型牧草(temperategrass),如Agrostis(翦股穎屬);和谷類,例如,小麥、燕麥、黑麥、大麥、稻(rice)、高粱和玉蜀黍(maize)(玉米)。[0215]雙子葉植物的實(shí)例是煙草(tobacco),豆類(legumes),如羽扇豆(lupins),馬鈴薯,糖甜菜(sugarbeet),豌豆,豆(bean)和大豆(soybean)和十字花科的(cruciferous)植物(十字花科(familyBrassicaceae)),如花椰菜(cauliflower),油菜桿(rapeseed)和緊密相關(guān)的模型生物體擬南芥(Arabidopsisthaliana)。[0216]植物部分的實(shí)例是莖(stem)、愈傷組織(callus)、葉(leaf)、根(root)、果實(shí)(fruit)、種子(seed)和塊莖(tuber),以及包含這些部分的獨(dú)立組織,例如,表皮(epidermis)、葉肉(mesophyll)、薄壁組織(parenchyme)、維管組織(vasculartissue)、分生組織(meristem)。具體的植物細(xì)胞區(qū)室(compartments),如葉綠體(chloroplast)、質(zhì)外體(apoplast)、線粒體(mitochondria)、液泡(vacuole)、過氧化物酶體(peroxisome)和細(xì)胞質(zhì)(cytoplasm)也被認(rèn)為是植物部分。此外,任何植物細(xì)胞,無論什么組織來源,都被認(rèn)為是植物部分。同樣地,植物部分,如被分離用來促進(jìn)本發(fā)明的應(yīng)用的具體組織和細(xì)胞也被認(rèn)為是植物部分,例如胚(embryo)、胚乳(endosperm)、糊粉(aleurone)和種皮(seedcoat)。[0217]同樣包含于本發(fā)明范圍內(nèi)的還有這些植物、植物部分和植物細(xì)胞的后代。[0218]表達(dá)多肽或域的轉(zhuǎn)基因植物或植物細(xì)胞可以依照本領(lǐng)域已知方法構(gòu)建。簡(jiǎn)而言之,通過如下方法構(gòu)建所述植物或植物細(xì)胞:將編碼多肽或域的一個(gè)或多個(gè)表達(dá)構(gòu)建體導(dǎo)入植物宿主基因組或葉綠體基因組,并且將所得的經(jīng)修飾的植物或植物細(xì)胞繁殖為轉(zhuǎn)基因植物或植物細(xì)胞。[0219]表達(dá)構(gòu)建體便利地是包含編碼多肽或域的多核苷酸的核酸構(gòu)建體,所述多核苷酸與在選擇的植物或植物部分中表達(dá)該多核苷酸所需的適當(dāng)?shù)恼{(diào)節(jié)序列可操作地連接。此夕卜,表達(dá)構(gòu)建體可以包含對(duì)于鑒定植物細(xì)胞有用的選擇性標(biāo)記,在所述植物細(xì)胞中整合了表達(dá)構(gòu)建體和將該構(gòu)建體引入到所述植物中所必需的DNA序列(后者依賴于使用的DNA引入方法)。[0220]調(diào)節(jié)序列的選擇,例如啟動(dòng)子和終止子序列和任選地信號(hào)或轉(zhuǎn)運(yùn)序列的選擇,舉例來說,基于期望何時(shí)、何處以及如何表達(dá)多肽或域而確定。例如,編碼多肽或域的基因的表達(dá)可以是組成型的或誘導(dǎo)型的,或可以是發(fā)育、階段或組織特異性的,并且基因產(chǎn)物可以祀向特定的組織或植物部分如種子或葉。調(diào)節(jié)序列由例如Tague等,1988,PlantPhysiology86:506所述。[0221]對(duì)于組成性表達(dá),可以使用35S_CaMV、玉米泛素1或稻肌動(dòng)蛋白1啟動(dòng)子(Franck等,1980,Cell21:285-294,Christensen等,1992,PlantMo.Biol.18:675-689;Zhang等,1991,PlantCell3:1155-1165)。器官特異性啟動(dòng)子可以是例如來自貯藏庫(kù)組織(storagesinktissue)例如種子、馬鈴薯塊莖和果實(shí)的啟動(dòng)子(Edwards和Coruzzi,1990,Ann.Rev.Genet.24:275-303),或來自代謝庫(kù)組織(metabolicsinktissue)例如分生組織的啟動(dòng)子(Ito等,1994,PlantMol.Biol.24:863-878),種子特異性啟動(dòng)子諸如來自稻的谷蛋白(glutelin)、醇溶蛋白(prolamin)、球蛋白(globulin)或白蛋白(albumin)啟動(dòng)子(Wu等,1998,PlantCellPhysiol.39:885_889),來自豆球蛋白(legumin)B4和蠶豆(Viciafaba)的未知的種子蛋白基因的蠶豆啟動(dòng)子(Conrad等,1998,J.PlantPhysiol.152:708-711)、來自種子油體蛋白(oilbodyprotein)的啟動(dòng)子(Chen等,1998,PlantCellPhysiol.39:935-941),來自歐洲油菜(Brassicanapus)的藏蛋白napA啟動(dòng)子,或本【
技術(shù)領(lǐng)域:
】公知的任何其他種子特異性的啟動(dòng)子,例如,在WO91/14772中所描述的。此外,啟動(dòng)子可為葉特異性的啟動(dòng)子,如來自稻或番爺?shù)膔bcs啟動(dòng)子(Kyozuka等,1993,PlantPhysiol.102:991-1000),小球藻病毒(chlorellavirus)腺噪呤甲基轉(zhuǎn)移酶(adeninemethyltransferase)基因啟動(dòng)子(Mitra和Higgins,1994,PlantMol.Biol.26:85-93),來自稻的aldP基因啟動(dòng)子(Kagaya等,1995,Mol.Gen.Genet.248:668-674),或傷口誘導(dǎo)的啟動(dòng)子,如馬鈴薯pin2啟動(dòng)子(Xu等,1993,PlantMol.Biol.22:573-588)。同樣地,所述啟動(dòng)子可通過非生物的處理誘導(dǎo),所述非生物的處理諸如溫度、干旱或鹽度變化,或通過外源施加的激活所述啟動(dòng)子的物質(zhì)誘導(dǎo),例如乙醇、雌激素(oestrogens)、植物激素(planthormones)如乙烯、脫落酸(abscisicacid)和赤霉酸(gibberellicacid),和重金屬。[0222]啟動(dòng)子增強(qiáng)子元件也可以用于實(shí)現(xiàn)多肽或域在植物中的較高表達(dá)。例如,啟動(dòng)子增強(qiáng)子元件可以是內(nèi)含子,其置于啟動(dòng)子和編碼多肽或域的多核苷酸之間。例如Xu等,1993,見上,公開了使用稻肌動(dòng)蛋白1基因的第一內(nèi)含子以增強(qiáng)表達(dá)。[0223]選擇性標(biāo)記基因和表達(dá)構(gòu)建體的任何其它部分可以選自本領(lǐng)域內(nèi)可用的那些。[0224]將核酸構(gòu)建體根據(jù)本領(lǐng)域已知的常規(guī)技術(shù)導(dǎo)入植物基因組,所述常規(guī)技術(shù)包括土壤桿菌屬(Agrobacterium)介導(dǎo)的轉(zhuǎn)化、病毒介導(dǎo)的轉(zhuǎn)化、顯微注射(microinjection)、粒子轟擊、生物射彈轉(zhuǎn)化和電穿孔(Gasser等,1990,Science244:1293;Potrykus,1990,Bio/Technology8:535;Shimamoto等,I989,Nature338:2>74)。[0225]根癌土壤桿菌(Agrobacteriumtumefaciens)介導(dǎo)的基因轉(zhuǎn)移(genetransfer),是一種產(chǎn)生轉(zhuǎn)基因雙子葉植物(其綜述,參見Hooykas和Schilperoort,1992,PlantMol.Biol.19:15-38),和用于轉(zhuǎn)化單子葉植物的方法,雖然對(duì)于這些植物可使用其他的轉(zhuǎn)化方法。一種產(chǎn)生轉(zhuǎn)基因單子葉植物的方法是用粒子(用轉(zhuǎn)化DNA涂覆的微觀的金或鶴粒子)轟擊胚愈傷組織(embryoniccalIi)或發(fā)育中的胚(developingembryos)(Christou,1992,PlantJ.2:275-281;Shimamoto,1994,Curr.Opin.Biotechnol.5:158-162;Vasil等,1992,Bio/TechnologylO:667-674)。轉(zhuǎn)化單子葉植物的一種替代方法是基于原生質(zhì)體轉(zhuǎn)化,如由Omirulleh等,1993,PlantMol.Biol.21:415-428所描述的。其它轉(zhuǎn)化方法包括描述于美國(guó)專利號(hào)6,395,966和7,151,204中的那些(兩者均通過提述以其整體并入本文)。[0226]轉(zhuǎn)化之后,根據(jù)本領(lǐng)域熟知的方法選擇具有導(dǎo)入的表達(dá)構(gòu)建體的轉(zhuǎn)化體并且再生成為完整植物。通常設(shè)計(jì)轉(zhuǎn)化方法用于通過如下方法在再生期間或在后續(xù)世代中選擇性消除選擇基因:例如,使用帶有兩個(gè)獨(dú)立的T-DNA構(gòu)建體的共轉(zhuǎn)化或通過特異性重組酶位點(diǎn)特異性地切除選擇基因。[0227]除了直接用本發(fā)明的構(gòu)建體直接轉(zhuǎn)化具體植物基因型之外,還可通過將具有構(gòu)建體的植物與缺乏該構(gòu)建體的第二植物雜交來制備轉(zhuǎn)基因植物。舉例而言,可將編碼多肽或域的構(gòu)建體通過雜交而引入特定植物品種,而根本無需直接轉(zhuǎn)化該給定品種的植物。因此,本發(fā)明不僅涵蓋從依照本發(fā)明經(jīng)轉(zhuǎn)化的細(xì)胞直接再生的植物,還包括此類植物的后代(progeny)。如用于本文的,后代可指依照本發(fā)明制備的親本植物任何世代的后裔(offspring)。此種后代可包含依據(jù)本發(fā)明制備的DNA構(gòu)建體。雜交導(dǎo)致轉(zhuǎn)基因通過將起始種系供體植物種系交叉授粉而引入植物種系。此類步驟的非限制性實(shí)例描述于美國(guó)專利號(hào)7,151,204。[0228]植物通過回交轉(zhuǎn)化方法生成。舉例而言,該植物包括稱作回交轉(zhuǎn)化的基因型、種系、近交體(inbred)或雜交體(hybrid)的植物。[0229]可使用遺傳標(biāo)記以協(xié)助本發(fā)明的一種或多種轉(zhuǎn)基因從一個(gè)遺傳背景基因滲入(introgression)至另一個(gè)。標(biāo)記協(xié)助的選擇提供了相對(duì)于常規(guī)育種的優(yōu)勢(shì),在于其可用于避免由表型變異導(dǎo)致的錯(cuò)誤。進(jìn)一步,遺傳標(biāo)記可在特定雜交的個(gè)體后代中提供有關(guān)良種種質(zhì)相對(duì)程度的數(shù)據(jù)。舉例而言,當(dāng)本不(otherwise)具有非農(nóng)藝學(xué)所需的遺傳背景但具有所需性狀的植物與良種親本雜交時(shí),可使用遺傳標(biāo)記來選擇不僅具有目標(biāo)性狀,還具有相對(duì)較大比例的所需種質(zhì)的后代。以此方式,使一種或多種性狀基因滲入特定遺傳背景所需的世代數(shù)得到最小化。[0230]本發(fā)明亦涉及產(chǎn)生本發(fā)明的多肽或域的方法,其包括:(a)在有助于產(chǎn)生所述多肽或域的條件下培養(yǎng)轉(zhuǎn)基因植物或植物細(xì)胞,所述植物或植物細(xì)胞包含編碼多肽或域的多核苷酸;和任選地(b)回收所述多肽或域。[0231]去除或減少纖維二糖水解酶活性[0232]本發(fā)明還涉及用于產(chǎn)生親本細(xì)胞突變體的方法,其包括破壞或缺失編碼本發(fā)明的多肽的多核苷酸或其部分,所述方法導(dǎo)致在相同條件下培養(yǎng)時(shí),與親本細(xì)胞相比突變的細(xì)胞產(chǎn)生較少的所述多肽。[0233]可以使用本領(lǐng)域熟知的方法(例如,插入、破壞、替代或缺失)通過減少或消除多核苷酸的表達(dá)來構(gòu)建突變細(xì)胞。在一個(gè)優(yōu)選的方面,所述多核苷酸是失活的。待修飾或失活的多核苷酸可以是,例如,編碼區(qū)或其對(duì)活性關(guān)鍵的部分,或表達(dá)編碼區(qū)所需的調(diào)節(jié)元件。這種調(diào)節(jié)或調(diào)控序列的實(shí)例可以是啟動(dòng)子序列或其功能部分,即,足以影響多核苷酸表達(dá)的部分。用于可能的修飾的其它調(diào)控序列包括但不限于前導(dǎo)序列、聚腺苷酸化序列、前肽序列、信號(hào)肽序列、轉(zhuǎn)錄終止子和轉(zhuǎn)錄激活子。[0234]可以通過向親本細(xì)胞施以誘變,并且選擇其中已將多核苷酸的表達(dá)減少或消除的突變細(xì)胞來進(jìn)行多核苷酸的修飾或失活。誘變可能是特異性的或隨機(jī)的,可以通過例如使用合適的物理或化學(xué)誘變劑進(jìn)行,通過使用合適的寡核苷酸進(jìn)行,或通過將所述DNA序列進(jìn)行PCR產(chǎn)生的誘變。此外,可以通過使用這些誘變劑的任何組合來進(jìn)行誘變。[0235]適合于本發(fā)明目的的物理或化學(xué)誘變劑的實(shí)例包括紫外線(UV)照射、羥胺、N-甲基-Ν'-硝基-N-亞硝基胍(MNNG)、0-甲基羥胺、亞硝酸、乙基甲烷磺酸酯(ethylmethanesulphonate)(EMS)、亞硫酸氫鈉、甲酸和核苷酸類似物。[0236]當(dāng)使用這些試劑時(shí),通常通過如下方法來進(jìn)行所述誘變:在合適條件下存在選定的誘變劑時(shí)溫育待誘變的親本細(xì)胞,并篩選和/或選擇顯示基因表達(dá)減少的或無基因表達(dá)的突變體細(xì)胞。[0237]多核苷酸的修飾或失活也可以通過插入、取代或缺失基因中的一個(gè)或多個(gè)核苷酸或其轉(zhuǎn)錄或翻譯所需的調(diào)控元件實(shí)現(xiàn)。例如,可以插入或去除核苷酸從而導(dǎo)致引入終止密碼子,去除起始密碼子,或改變開讀框。按照本領(lǐng)域已知的方法通過定位誘變或PCR產(chǎn)生的誘變可以實(shí)現(xiàn)這種修飾或失活。盡管在理論上所述修飾可以在體內(nèi)進(jìn)行,即,直接在表達(dá)待修飾的多核苷酸的細(xì)胞上進(jìn)行,但優(yōu)選如下面所示例的那樣在體外進(jìn)行所述修飾。[0238]消除或減少多核苷酸表達(dá)的便利方式的例子有基于基因取代,基因缺失,或基因破壞的技術(shù)。例如,在基因破壞方法中,將相應(yīng)于內(nèi)源多核苷酸的核酸序列在體外進(jìn)行誘變以產(chǎn)生缺陷性的核酸序列,然后將其轉(zhuǎn)化入親本細(xì)胞中以產(chǎn)生缺陷基因。通過同源重組,所述缺陷性核酸序列替代了內(nèi)源性多核苷酸??赡芾硐氲氖撬鋈毕菪远嗪塑账徇€編碼標(biāo)記,其可用于選擇其中多核苷酸被修飾或破壞的轉(zhuǎn)化子。在一個(gè)方面,用可選擇的標(biāo)記(如本文所述的那些)來破壞所述多核苷酸。[0239]本發(fā)明亦涉及在細(xì)胞中抑制具有纖維二糖水解酶活性的多肽的表達(dá)的方法,其包括向細(xì)胞施用或在細(xì)胞中表達(dá)雙鏈RNA(dsRNA)分子,其中所述dsRNA包含本發(fā)明的多核苷酸的亞序列。在一個(gè)優(yōu)選的方面,所述dsRNA長(zhǎng)度為約15、16、17、18、19、20、21、22、23、24、25或更多個(gè)雙鏈體核苷酸。[0240]所述dsRNA優(yōu)選為小干擾RNA(siRNA)或微RNA(miRNA)。在一個(gè)優(yōu)選的方面,所述dsRNA是用于抑制轉(zhuǎn)錄的小干擾RNA。在另一個(gè)優(yōu)選的方面,所述dsRNA是用于抑制翻譯的微RNA。[0241]本發(fā)明亦涉及這樣的雙鏈RNA(dsRNA)分子,其包含SEQIDNO:1的成熟多肽編碼序列,SEQIDNO:3的成熟多肽編碼序列,SEQIDNO:5的成熟多肽編碼序列,或SEQIDN0:7的成熟多肽編碼序列的一部分,以供在細(xì)胞中抑制所述多肽的表達(dá)。盡管本發(fā)明并不受任何具體作用機(jī)制的限制,但所述dsRNA可進(jìn)入細(xì)胞并導(dǎo)致類似或相同序列的單鏈RNA(ssRNA),包括內(nèi)源mRNA的降解。當(dāng)細(xì)胞暴露于dsRNA時(shí),來自同源基因的mRNA通過稱為RNA干擾(RNAi)的過程受選擇性降解。[0242]本發(fā)明的dsRNA可用于基因沉默。在一個(gè)方面,本發(fā)明提供了使用本發(fā)明的dsRNAi選擇性降解RNA的方法。該方法可在體外、離體或體內(nèi)實(shí)施。在一個(gè)方面,所述dsRNA分子可用于在細(xì)胞、器官或動(dòng)物中生成功能喪失的突變。用于制備和使用dsRNA分子選擇性降解RNA的方法是本領(lǐng)域中公知的,參見,例如美國(guó)專利號(hào)6,489,127;6,506,559;6,511,824;和6,515,109。[0243]本發(fā)明進(jìn)一步涉及親本細(xì)胞的突變體細(xì)胞,其包含編碼多肽的多核苷酸或其調(diào)控序列的破壞或缺失或編碼所述多肽的基因的沉默,這導(dǎo)致與親本細(xì)胞相比突變體細(xì)胞產(chǎn)生更少的多肽或不產(chǎn)生多肽。[0244]多肽缺陷型突變細(xì)胞作為表達(dá)天然和異源多肽的宿主細(xì)胞特別有用。所以,本發(fā)明進(jìn)一步涉及生產(chǎn)天然或異源多肽的方法,其包括:(a)在有助于生產(chǎn)多肽的條件下培養(yǎng)突變細(xì)胞;和任選地(b)回收所述多肽。術(shù)語(yǔ)"異源多肽"意指對(duì)宿主細(xì)胞不是天然的多肽,例如,天然蛋白的變體。宿主細(xì)胞可包含超過一個(gè)拷貝的編碼所述天然或異源多肽的多核苷酸。[0245]用于培養(yǎng)和純化感興趣的產(chǎn)物的方法可以通過本領(lǐng)域已知的方法進(jìn)行。[0246]本發(fā)明用于產(chǎn)生基本上無纖維二糖水解酶活性的產(chǎn)物的方法在真核多肽,特別是真菌蛋白質(zhì)例如酶的產(chǎn)生中是特別令人有興趣的。纖維二糖水解酶活性缺陷細(xì)胞也可以用于表達(dá)在制藥上有意義的異源蛋白質(zhì)例如激素、生長(zhǎng)因子、受體等。術(shù)語(yǔ)"真核多肽"不僅包括天然多肽,也包括通過氨基酸取代、缺失或添加或其它這樣的修飾而被修飾以增強(qiáng)了活性、熱穩(wěn)定性、pH耐受性等的多肽,例如酶。[0247]在其他方面,本發(fā)明涉及基本上無纖維二糖水解酶活性的蛋白質(zhì)產(chǎn)物,其通過本發(fā)明的方法產(chǎn)生。[0248]發(fā)酵液配制物或細(xì)胞組合物[0249]本發(fā)明亦涉及發(fā)酵液配制物和細(xì)胞組合物,其包含本發(fā)明的多肽。所述發(fā)酵液產(chǎn)物進(jìn)一步包含用于發(fā)酵工藝的其它成分,例如細(xì)胞(包括含有編碼本發(fā)明的多肽的基因的宿主細(xì)胞,其用于產(chǎn)生感興趣的多肽),細(xì)胞碎片,生物質(zhì),發(fā)酵培養(yǎng)基和/或發(fā)酵產(chǎn)物。在一些實(shí)施方案中,所述組合物是含有機(jī)酸的已殺滅細(xì)胞的全培養(yǎng)液,已被殺滅的細(xì)胞和/或細(xì)胞碎片,以及培養(yǎng)基。[0250]術(shù)語(yǔ)"發(fā)酵液"用于本文中指由細(xì)胞發(fā)酵產(chǎn)生、不經(jīng)歷或僅經(jīng)歷最低限的回收和/或純化的制備物。舉例而言,當(dāng)將微生物培養(yǎng)物生長(zhǎng)至飽和,在限制碳的條件下溫育以允許蛋白合成(例如由宿主細(xì)胞表達(dá)酶),并分泌入細(xì)胞培養(yǎng)基時(shí),產(chǎn)生發(fā)酵液。所述發(fā)酵液可含有在發(fā)酵終止時(shí)得到的發(fā)酵材料的未分級(jí)或分級(jí)的內(nèi)含物。通常而言,發(fā)酵液是未分級(jí)的,并包含去除(例如通過離心)微生物細(xì)胞(例如絲狀真菌細(xì)胞)之后存在的用過的培養(yǎng)基以及細(xì)胞碎片。在一些實(shí)施方案中,所述發(fā)酵液含有用過的細(xì)胞培養(yǎng)基,胞外酶,和能成活的和/或不能成活的(viableand/ornonviable)微生物細(xì)胞。[0251]在一個(gè)實(shí)施方案中,所述發(fā)酵液配制物和細(xì)胞組合物包含第一有機(jī)酸組分和第二有機(jī)酸組分,所述第一有機(jī)酸組分包含至少一種1-5碳的有機(jī)酸和/或其鹽,而所述第二有機(jī)酸組分包含至少一種6個(gè)或更多個(gè)碳的有機(jī)酸和/或其鹽。在一個(gè)具體實(shí)施方案中,所述第一有機(jī)酸組分是乙酸、甲酸、丙酸、它們的鹽,或前述兩種或更多種的混合物,而所述第二有機(jī)酸組分是苯甲酸、環(huán)己烷羧酸、4-甲基戊酸、苯乙酸、它們的鹽,或前述兩種或更多種的混合物。[0252]在一個(gè)方面,所述組合物含有有機(jī)酸,并任選地進(jìn)一步含有已被殺滅的細(xì)胞和/或細(xì)胞碎片。在一個(gè)實(shí)施方案中,從已殺滅細(xì)胞的全培養(yǎng)液中移除所述已被殺滅的細(xì)胞和/或細(xì)胞碎片以提供不含這些組分的組合物。[0253]所述發(fā)酵液配制物或細(xì)胞組合物可進(jìn)一步包含防腐劑和/或抗微生物(例如抑菌)劑,包括但不限于山梨醇、氯化鈉、山梨酸鉀和其它本領(lǐng)域中已知的。[0254]所述發(fā)酵液配制物或細(xì)胞組合物可進(jìn)一步包含多種酶活性,如一種或多種(例如幾種)選自下組的酶:纖維素酶、具有纖維素分解增強(qiáng)活性的GH61多肽、半纖維素酶、酯酶、棒曲霉素、漆酶、木質(zhì)素分解酶、果膠酶、過氧化物酶、蛋白酶和膨脹素。所述發(fā)酵液配制物或細(xì)胞組合物亦可包含一種或多種(例如幾種)選自下組的酶:水解酶、異構(gòu)酶、連接酶、裂合酶、氧還酶或轉(zhuǎn)移酶,例如α-半乳糖苷酶、α-葡糖苷酶、氨肽酶、淀粉酶、β-半乳糖苷酶、β-葡糖苷酶、β-木糖苷酶、糖酶、羧肽酶、過氧化氫酶、纖維二糖水解酶、纖維素酶、殼多糖酶、角質(zhì)酶、環(huán)糊精糖基轉(zhuǎn)移酶、脫氧核糖核酸酶、內(nèi)切葡聚糖酶、酯酶、葡糖淀粉酶、轉(zhuǎn)化酶、漆酶、脂肪酶、甘露糖苷酶、變聚糖酶、氧化酶、果膠分解酶、過氧化物酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、轉(zhuǎn)谷氨酰胺酶或木聚糖酶。[0255]所述已殺滅細(xì)胞的全培養(yǎng)液或組合物可含有在發(fā)酵終止時(shí)得到的發(fā)酵材料的未分級(jí)內(nèi)含物。通常而言,所述已殺滅細(xì)胞的全培養(yǎng)液或組合物含有在將微生物細(xì)胞(例如絲狀真菌細(xì)胞)生長(zhǎng)至飽和,并在限制碳的條件下溫育以允許蛋白合成(例如,表達(dá)纖維素酶和葡糖苷酶)之后存在用過的培養(yǎng)基以及細(xì)胞碎片。在一些實(shí)施方案中,所述已殺滅細(xì)胞的全培養(yǎng)液或組合物含有用過的細(xì)胞培養(yǎng)基,胞外酶,和已被殺滅的絲狀真菌細(xì)胞。在一些實(shí)施方案中,在已殺滅細(xì)胞的全培養(yǎng)液或組合物中存在的微生物細(xì)胞可使用本領(lǐng)域中已知的方法滲透和/或裂解。[0256]如本文中所述的全培養(yǎng)液或細(xì)胞組合物通常為液體,但可含有不溶性組分,如已被殺滅的細(xì)胞、細(xì)胞碎片、培養(yǎng)基組分和/或不溶性酶。在一些實(shí)施方案中,可去除不溶性組分以提供澄清的液體組合物。[0257]本發(fā)明的全培養(yǎng)液配制物和細(xì)胞組合物可通過WO90/15861或WO2010/096673中描述的方法來產(chǎn)生。[0258]下文給出了本發(fā)明的組合物的優(yōu)選用途的實(shí)施例。所述組合物的劑量和組合物使用的其它條件可基于本領(lǐng)域已知方法決定。[0259]酶組合物[0260]本發(fā)明還涉及包含本發(fā)明的多肽的組合物。優(yōu)選地,所述組合物是富集了此種多肽的。術(shù)語(yǔ)"富集了"表明所述組合物的纖維二糖水解酶活性以例如至少1.1的富集因子增加。[0261]所述組合物可包含本發(fā)明的多肽作為主要酶組分,例如單組分組合物?;蛘?,所述組合物可包含多種酶活性,如選自下組的一種或多種(例如幾種)酶:纖維素酶、具有纖維素分解增強(qiáng)活性的GH61多肽、半纖維素酶、酯酶、棒曲霉素、漆酶、木質(zhì)素分解酶、果膠酶、過氧化物酶、蛋白酶和膨脹素。所述發(fā)組合物亦可包含一種或多種(例如幾種)選自下組的酶:水解酶,異構(gòu)酶,連接酶,裂合酶,氧還酶或轉(zhuǎn)移酶,例如α-半乳糖苷酶、α-葡糖苷酶、氨肽酶、淀粉酶、半乳糖苷酶、葡糖苷酶、糖酶、羧肽酶、過氧化氫酶、纖維二糖水解酶、纖維素酶、殼多糖酶、角質(zhì)酶、環(huán)糊精糖基轉(zhuǎn)移酶、脫氧核糖核酸酶、內(nèi)切葡聚糖酶、酯酶、葡糖淀粉酶、轉(zhuǎn)化酶、漆酶、脂肪酶、甘露糖苷酶、變聚糖酶、氧化酶、果膠分解酶、過氧化物酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、轉(zhuǎn)谷氨酰胺酶、或木聚糖酶。所述組合物可依照本領(lǐng)域中已知的方法制備,并可為液體或干組合物的形式。所述組合物可依照本領(lǐng)域中已知的方法穩(wěn)定化。[0262]下文中給出本發(fā)明的組合物的優(yōu)選用途的實(shí)例。組合物的劑量和組合物使用的其它條件可給予本領(lǐng)域已知的方法來確定。[0263]用途[0264]本發(fā)明還涉及下述使用具有纖維二糖水解酶活性的多肽或其組合物的工藝。[0265]本發(fā)明還涉及降解或轉(zhuǎn)化纖維素材料的方法,其包括:在本發(fā)明的具有纖維二糖水解酶活性的多肽的存在下,用酶組合物處理纖維素材料。在一個(gè)方面,所述工藝進(jìn)一步包括回收已降解或轉(zhuǎn)化的纖維素材料。所述纖維素材料的降解或轉(zhuǎn)化的可溶性產(chǎn)物可從不溶性纖維素材料使用本領(lǐng)域已知的方法分離,如例如離心、過濾或重力沉降。[0266]本發(fā)明還涉及產(chǎn)生發(fā)酵產(chǎn)物的工藝,其包括:(a)在本發(fā)明的具有纖維二糖水解酶酶活性的多肽的存在下,用酶組合物糖化纖維素材料;(b)用一種或多種(例如幾種)發(fā)酵微生物發(fā)酵經(jīng)糖化的纖維素材料以產(chǎn)生發(fā)酵產(chǎn)物;和(c)從發(fā)酵回收發(fā)酵產(chǎn)物。[0267]本發(fā)明還涉及發(fā)酵纖維素材料的工藝,其包括:用一種或多種(例如幾種)發(fā)酵微生物發(fā)酵纖維素材料,其中所述纖維素材料是在本發(fā)明的具有纖維二糖水解酶活性的多肽的存在下用酶組合物糖化的。在一個(gè)方面,纖維素材料的發(fā)酵產(chǎn)生發(fā)酵產(chǎn)物。在另一個(gè)方面,所述工藝還包括從發(fā)酵回收發(fā)酵產(chǎn)物。[0268]本發(fā)明的工藝可以用于將纖維素材料糖化成可發(fā)酵糖,并且將可發(fā)酵糖轉(zhuǎn)化成很多有用的發(fā)酵產(chǎn)物,例如燃料、飲用乙醇和/或平臺(tái)化學(xué)品(platformchemical)(例如酸、醇、酮、氣體等)。從纖維素材料產(chǎn)生期望的發(fā)酵產(chǎn)物通常涉及預(yù)處理、酶水解(糖化)和發(fā)酵。[0269]根據(jù)本發(fā)明的纖維素材料的處理可以使用本領(lǐng)域的常規(guī)方法完成。此外,本發(fā)明的工藝可使用經(jīng)配置以依照發(fā)明操作的任何常規(guī)生物質(zhì)加工設(shè)備進(jìn)行。[0270]水解(糖化)和發(fā)酵,分別的或同時(shí)的,包括但不限于,分離的水解和發(fā)酵(SHF)、同時(shí)糖化和發(fā)酵(SSF)、同時(shí)糖化和共發(fā)酵(SSCF)、混合的水解和發(fā)酵(HHF)、分離的水解和共發(fā)酵(SHCF)、混合的水解和共發(fā)酵(HHCF),和直接微生物轉(zhuǎn)化(DMC),有時(shí)也稱為聯(lián)合生物加工(consolidatedbioprocessing,CBP)。SHF使用分離的處理步驟以首先將纖維素材料酶水解為可發(fā)酵糖,例如,葡萄糖,纖維二糖和戊糖單體,然后將可發(fā)酵糖發(fā)酵成為乙醇。在SSF中,纖維素材料的酶水解和糖變?yōu)橐掖嫉陌l(fā)酵組合在一個(gè)步驟中(Philippidis,G.P.,1996,Cellulosebioconversiontechnology,于HandbookonBioethanol:ProductionandUtilization,Wyman,C.E編,Taylor&Francis,Washington,DC,179-212)。SSCF包括多種糖的共發(fā)酵(Sheehan,J.和Himmel,Μ.,1999,Enzymes,energyandtheenvironment:AstrategicperspectiveontheU.S.DepartmentofEnergy'sresearchanddevelopmentactivitiesforbioethanol,Biotechnol.Prog.15:817-827)。HHF在同時(shí)糖化和水解步驟之外,還包括單獨(dú)的水解步驟,所述各步驟可以在同一個(gè)反應(yīng)器中進(jìn)行。HHF過程中的步驟可以在不同的溫度進(jìn)行,S卩,高溫酶法糖化,然后在發(fā)酵菌株能夠耐受的較低溫度進(jìn)行SSF。DMC在一個(gè)或多個(gè)(例如幾個(gè))步驟中組合了所有三個(gè)過程(酶產(chǎn)生、水解和發(fā)酵),其中使用相同的生物體產(chǎn)生用于將纖維素材料轉(zhuǎn)化成可發(fā)酵糖并將可發(fā)酵糖轉(zhuǎn)化成終產(chǎn)物的酶(LyndL.R.,Weimer,P.J.,vanZyl,W.Η.,和Pretorius,I.S.,2002,Microbialcelluloseutilization!Fundamentalsandbiotechnology,Microbiol.Mol.Biol.Reviews66:506_577)。在本文可以理解的是,任何本領(lǐng)域中已知的方法,包括預(yù)處理、酶水解(糖化)、發(fā)酵,或它們的組合,都可用于實(shí)施本發(fā)明的工藝。[0271]常規(guī)設(shè)備可包括補(bǔ)料分批式攪拌反應(yīng)器、分批式攪拌反應(yīng)器、具有超濾的連續(xù)流攪拌反應(yīng)器和/或連續(xù)活塞流柱式反應(yīng)器(FernandadeCastilhosCorazza,FldivioFariadeMoraes,GisellaMariaZanin和IvoNeitzel,2003,Optimalcontrolinfed-batchreactorforthecellobiosehydrolysis,ActaScientiarum.Technology25:33-38;Gusakov,A.V.和Sinitsyn,A.P.,1985,Kineticsoftheenzymatichydrolysisofcellulose:I.Amathematicalmodelforabatchreactorprocess,Enz.Microb.Technol.7:346-352)、研磨反應(yīng)器(Ryu,S.Κ·和Lee,J.Μ·,1983,Bioconversionofwastecellulosebyusinganattritionbioreactor,Biotechnol.Bioeng.25:53-65),或者具有由電磁場(chǎng)引起的強(qiáng)烈攪拌的反應(yīng)器(Gusakov,A.V.,Sinitsyn,A.P.,Davydkin,I.Y.,DavydkinjV.Y.,Protasj0.V.,1996,Enhancementofenzymaticcellulosehydrolysisusinganoveltypeofbioreactorwithintensivestirringinducedbyelectromagneticfield,Appl.Biochem.Biotechnol.56:141-153)。其它反應(yīng)器類型包括:流化床、升流層(upflowblanket)、固定化和用于水解和/或發(fā)酵的擠出機(jī)型的反應(yīng)器。[0272]預(yù)處理。在本發(fā)明的工藝的實(shí)施中,可以使用本領(lǐng)域已知的任何預(yù)處理過程破壞植物細(xì)胞壁的纖維素材料組分(Chandra等,2007,Substratepretreatment:Thekeytoeffectiveenzymatichydrolysisoflignocellulosics?Adv.Biochem.Engin./Biotechnol.108:67-93;Galbe和Zacchi,2007,Pretreatmentoflignocellulosicmaterialsforefficientbioethanolproduction,Adv.Biochem.Engin./Biotechnol.108:41-65;Hendriks和Zeeman,2009,Pretreatmentstoenhancethedigestibilityoflignocellulosicbiomass,BioresourceTechnol.100:10-18;Mosier等,2005,Featuresofpromisingtechnologiesforpretreatmentoflignocellulosicbiomass,BioresourceTechnol.96:673-686;Taherzadeh和Karimi,2008,Pretreatmentoflignocellulosicwastestoimproveethanolandbiogasproduction:Areview,Int.J.ofMol.Sci.9:1621-1651;Yang和Wyman,2008,Pretreatment:thekeytounlockinglow-costcellulosicethanol,BiofuelsBioproductsandBiorefining-Biofpr.2:26-40)〇[0273]纖維素材料也可以在預(yù)處理之前使用本領(lǐng)域中已知的方法進(jìn)行粒度減小、篩分、預(yù)浸泡、潤(rùn)濕、洗漆和/或調(diào)理(conditioning)。[0274]常規(guī)的預(yù)處理包括但不限于,蒸汽預(yù)處理(伴隨或不伴隨爆破)、稀酸預(yù)處理、熱水預(yù)處理、堿預(yù)處理、石灰預(yù)處理、濕氧化、濕爆破、氨纖維爆破、有機(jī)溶劑預(yù)處理和生物預(yù)處理。其它預(yù)處理包括氨滲濾、超聲、電穿孔、微波、超臨界CO2、超臨界H20、臭氧、離子性液體和Y輻射預(yù)處理。[0275]可以在水解和/或發(fā)酵之前預(yù)處理纖維素材料。預(yù)處理優(yōu)選在水解前進(jìn)行?;蛘撸A(yù)處理可以與酶水解同時(shí)進(jìn)行以釋放可發(fā)酵糖,如葡萄糖、木糖和/或纖維二糖。在大多數(shù)情況下,預(yù)處理步驟本身使一些生物質(zhì)轉(zhuǎn)化成可發(fā)酵糖(甚至在不存在酶的情況下)。[0276]蒸汽預(yù)處理。在蒸汽預(yù)處理中,加熱纖維素材料以破壞植物細(xì)胞壁成分,包括木質(zhì)素、半纖維素和纖維素,使纖維素和其它級(jí)分,例如半纖維素,能夠被酶觸及。將纖維素材料經(jīng)過或通過反應(yīng)容器,其中注入蒸汽以增加溫度至需要的溫度和壓力,并且在其中保持期望的反應(yīng)時(shí)間。蒸汽預(yù)處理優(yōu)選在140_250°C,例如160-200°C,或170-190°C進(jìn)行,其中最優(yōu)的溫度范圍依賴于化學(xué)催化劑的添加。蒸汽預(yù)處理的停留時(shí)間優(yōu)選1-60分鐘,例如1-30分鐘,1-20分鐘,3-12分鐘,或4-10分鐘,其中最優(yōu)的停留時(shí)間依賴于溫度范圍和化學(xué)催化劑的添加。蒸汽預(yù)處理允許相對(duì)較高的固形物加載量,以至于纖維素材料在預(yù)處理過程中通常僅僅變得潮濕。蒸汽預(yù)處理經(jīng)常與預(yù)處理后的物質(zhì)的爆破放料(explosivedischarge)組合,這稱為蒸汽爆破,即,快速閃變至大氣壓和物質(zhì)的湍流,以通過破碎增加可接觸的表面積(Duff和Murray,1996,BioresourceTechnology855:1-33;Galbe和Zacchi,2002,Appl.Microbiol.Biotechnol·59:618-628;美國(guó)專利申請(qǐng)No.20020164730)。在蒸汽預(yù)處理過程中,半纖維素乙?;鶊F(tuán)被切開,并且得到的酸自催化半纖維素部分水解成為單糖和寡糖。木質(zhì)素僅以有限的程度被去除。[0277]化學(xué)預(yù)處理:術(shù)語(yǔ)"化學(xué)處理"指能促進(jìn)纖維素、半纖維素和/或木質(zhì)素分離和/或釋放的任何化學(xué)處理。此種預(yù)處理可將晶體纖維素轉(zhuǎn)化為無定形纖維素。合適的化學(xué)預(yù)處理工藝的實(shí)例包括例如稀酸預(yù)處理、石灰預(yù)處理、濕氧化、氨纖維/冷凍爆破(AFEX)、氨滲濾(APR)、離子性液體和有機(jī)溶劑預(yù)處理。[0278]經(jīng)常在蒸汽預(yù)處理之前加入催化劑如H2SO4或SO2(通常(λ3至5%w/w),其可減少時(shí)間,降低溫度,增加回收率,并改進(jìn)酶水解(Ballesteros等,2006,AppLBiochem.Biotechnol.129-132:496-508;Varga等,2004,Appl.Biochem.Biotechnol.113-116:509-523;Sassner等.,2006,EnzymeMicrob.Technol.39:756-762)。在稀酸預(yù)處理中,將纖維素材料與稀酸(通常是H2SO4)和水混合以形成漿料,由蒸汽加熱至期望的溫度,并在一段停留時(shí)間后閃變至大氣壓??梢杂煤芏喾磻?yīng)器設(shè)計(jì)形式進(jìn)行稀酸預(yù)處理,例如,活塞流反應(yīng)器、逆流反應(yīng)器或連續(xù)逆流收縮床反應(yīng)器(Duff和Murray,1996,supra;Schell等,2004,BioresourceTechnol.91:179-188;Lee等,1999,Adv.Biochem.Eng.Biotechnol.65:93-115)。[0279]還可以使用堿性條件下的幾種預(yù)處理方法。這些堿預(yù)處理包括,但不限于,氫氧化鈉、石灰、濕氧化、氨滲濾(APR)和氨纖維/冷凍爆破(AFEX)。[0280]用氧化鈣或氫氧化鈣在85_150°C的溫度進(jìn)行石灰預(yù)處理,停留時(shí)間從1小時(shí)到幾天(Wyman等,2005,BioresourceTechnol.96:1959-1966;Mosier等,2005,BioresourceTechnol.96:673-686)。WO2006/110891、WO2006/110899、TO2006/110900和WO2006/110901公開了使用氨的預(yù)處理方法。[0281]濕氧化是一種熱預(yù)處理,通常在180-200°C進(jìn)行5-15分鐘,加入氧化劑如過氧化氫或過壓氧(Schmidt和Thomsen,1998,BioresourceTechnol.64:139-151;Palonen等,2004,Appl.Biochem.Biotechnol.117:1-17;Varga等,2004,Biotechnol.Bioeng.88:567-574;Martin等,2006,J.Chem.Technol.Biotechnol.81:1669-1677)。預(yù)處理以優(yōu)選1-40%干物質(zhì),例如2-30%干物質(zhì),或5-20%干物質(zhì)進(jìn)行,并且經(jīng)常通過加入堿如碳酸鈉來增加初始pH。[0282]濕氧化預(yù)處理方法的修改方法,稱為濕爆破(濕氧化和蒸汽爆破的組合),能夠處理高達(dá)30%的干物質(zhì)。在濕爆破中,在預(yù)處理過程中,在一定的停留時(shí)間后引入氧化劑。然后通過閃變至大氣壓而結(jié)束預(yù)處理(W02006/032282)。[0283]氨纖維爆破(AFEX)涉及在中等溫度如90_150°C和高壓如17_20bar,用液氨或氨氣將纖維素材料處理5-10分鐘,其中干物質(zhì)含量可以高達(dá)60%(Gollapalli等,2002,Appl.Biochem.Biotechnol.98:23-35;Chundawat等,2007,Biotechnol.Bioeng.96:219-231;A1izadeh等,2005,Appl.Biochem.Biotechnol.121:1133-1141;Teymouri等,2005,BioresourceTechnol.96:2014-2018)。在AFEX預(yù)處理過程中,纖維素和半纖維素保持相對(duì)完整。木質(zhì)素-糖復(fù)合物被切開。[0284]有機(jī)溶劑預(yù)處理通過用含水乙醇(40-60%乙醇)在160_200°C提取30-60分鐘而將纖維素材料去木質(zhì)素化(Pan等,2005,Biotechnol.Bioeng.90:473-481;Pan等,2006,Biotechnol.Bioeng.94:851-861;Kurabi等,2005,Appl.Biochem.Biotechnol.121:219-230)。經(jīng)常加入硫酸作為催化劑。在有機(jī)溶劑預(yù)處理中,大部分半纖維素和木質(zhì)素得以去除。[0285]合適的預(yù)處理方法的其他實(shí)例如Schell等,2003,Appl.BiochemandBiotechn.Vol.105-108:69-85,和Mosier等,2005,BioresourceTechnology96:673-686,和美國(guó)公開申請(qǐng)2002/0164730所述。[0286]在一個(gè)方面,化學(xué)預(yù)處理優(yōu)選作為稀酸處理,并且更優(yōu)選作為連續(xù)稀酸處理進(jìn)行。酸通常是硫酸,但也可以使用其它酸,如乙酸、檸檬酸、硝酸、磷酸、酒石酸、琥珀酸、氯化氫或其混合物。弱酸(mildacid)處理在優(yōu)選1-5,例如1-4,或1-2.5的pH范圍進(jìn)行。在一個(gè)方面,酸濃度在優(yōu)選〇.01至IOwt%酸,例如0.05至5wt%酸或0.1至2wt%酸的范圍。將酸與纖維素材料接觸,并在優(yōu)選140-200°C,例如165-190°C范圍的溫度保持1至60分鐘的時(shí)間。[0287]在另一個(gè)方面,預(yù)處理發(fā)生在含水漿料中。在優(yōu)選的方面,在預(yù)處理過程中纖維素材料以優(yōu)選10_80wt%,例如20-70wt%或30-60wt%,如約40wt%的量存在。預(yù)處理的纖維素材料可以不洗滌或者使用本領(lǐng)域任何已知的方法洗滌,例如,用水洗滌。[0288]機(jī)械預(yù)處理或物理預(yù)處理:術(shù)語(yǔ)"機(jī)械預(yù)處理"或"物理預(yù)處理"指任何促進(jìn)顆粒大小減少的預(yù)處理。舉例而言,此種預(yù)處理可涉及各種類型的研磨(grinding)或磨制(milling)(例如,干磨、濕磨或振動(dòng)球磨)。[0289]纖維素材料可經(jīng)物理(機(jī)械)和化學(xué)預(yù)處理二者。機(jī)械或物理預(yù)處理可與下述偶聯(lián):汽蒸/蒸汽爆破、水熱解(hydrothermolysis)、稀酸或弱酸處理、高溫、高壓處理、福射(例如微波輻射),或其組合。在一個(gè)方面,高壓指優(yōu)選約100至約400psi,例如約150至約250psi的范圍的壓強(qiáng)。在另一個(gè)方面,高溫指約100至300°C,例如約140至約200°C范圍的溫度。在一個(gè)優(yōu)選的方面,機(jī)械或物理預(yù)處理在使用利用如上所定義的高溫和高壓的蒸汽槍水解器系統(tǒng)(例如來自SundsDefibratorAB,Sweden的SundsHydrolyzer)的分批過程中進(jìn)行。所述物理和化學(xué)預(yù)處理可視需要順序進(jìn)行或同時(shí)進(jìn)行。[0290]因此,在一個(gè)優(yōu)選的方面,對(duì)纖維素材料進(jìn)行物理(機(jī)械)或化學(xué)預(yù)處理,或者它們的任何組合,以促進(jìn)纖維素、半纖維素和/或木質(zhì)素的分離和/或釋放。[0291]生物預(yù)處理:術(shù)語(yǔ)"生物預(yù)處理"指可以促進(jìn)纖維素、半纖維素和/或木質(zhì)素從纖維素材料分離和/或釋放的任何生物預(yù)處理。生物預(yù)處理技術(shù)可以包括應(yīng)用溶解木質(zhì)素的微生物和/或酶(參見,例如,Hsu,Τ·-Α·,1996,Pretreatmentofbiomass,于HandbookonBioethanol:ProductionandUtilization,Wyman,C.E編,Taylor&Francis,Washington,DC,179-212;Ghosh和Singh,1993,Physicochemicalandbiologicaltreatmentsforenzymatic/microbialconversionoflignocellulosicbiomass,Adv.Appl.Microbiol.39:295-333;McMillan,J.D.,1994,Pretreatinglignocellulosicbiomass:areview,于EnzymaticConversionofBiomassforFuelsProduction,Himmel,M.E.,Baker,J.0.,和Overend,R.P.,編,ACSSymposiumSeries566,AmericanChemicalSociety,Washington,DC,第15章;Gong,C.S.,Cao,N.J.,Du,J.,和Tsao,G.T.,1999,Ethanolproductionfromrenewableresources,于AdvancesinBiochemicalEngineering/Biotechnology,Scheper,T.,編,Springer-VerlagBerlinHeidelberg,Germany,65:207-241;01sson和Hahn-HagerdaI,1996,Fermentationoflignocellulosichydrolysatesforethanolproduction,Enz.Microb.Tech.18:312-331;和Vallander和Eriksson,1990,Productionofethanolfromlignocellulosicmaterials:Stateoftheart,Adv.Biochem.Eng./Biotechnol.42:63-95)〇[0292]趣化。在水解步驟中,將纖維素材料,例如經(jīng)預(yù)處理的纖維素材料水解以將纖維素和半纖維素分解成可發(fā)酵糖,如葡萄糖、纖維二糖、木糖、木酮糖、阿拉伯糖、甘露糖、半乳糖和/或可溶的寡糖。水解利用酶組合物在本發(fā)明具有纖維二糖水解酶活性的多肽的存在下如本文中所述酶促進(jìn)行。組合物的酶組分還可以同時(shí)或順序加入。[0293]酶水解優(yōu)選在容易由本領(lǐng)域技術(shù)人員確定的條件下,在合適的含水環(huán)境中進(jìn)行。在一個(gè)方面,水解在適于酶組分的活性,即對(duì)于酶組分最佳的條件下進(jìn)行。水解可以以補(bǔ)料分批或連續(xù)的過程進(jìn)行,在連續(xù)過程中將纖維素材料逐漸補(bǔ)入,例如,補(bǔ)入含酶的水解溶液中。[0294]糖化通常在攪拌釜反應(yīng)器或發(fā)酵罐中在受控的pH、溫度和混合條件下進(jìn)行。合適的處理時(shí)間、溫度和pH條件可以由本領(lǐng)域技術(shù)人員容易地確定。例如,糖化可持續(xù)長(zhǎng)達(dá)200小時(shí),但是通常進(jìn)行優(yōu)選約12至約120小時(shí),例如約16至約72小時(shí),或約24至約48小時(shí)。溫度在優(yōu)選約25°C至約70°C,例如約30°C至約65°C,約40°C至約60°C,或約50°C至55°C的范圍。pH在優(yōu)選約3至約8,例如約3.5至約7,約4至約6,或約5.0至約5.5的范圍。干固形物含量在優(yōu)選約5至約50wt%,例如約10至約40wt%,或約20至約30wt%的范圍。[0295]酶組合物可包含任何可用于降解纖維素材料的蛋白。[0296]在一個(gè)方面,所述酶組合物包含或還包含一種或多種(例如幾種)選自下組的蛋白/多肽:纖維素酶、具有纖維素分解增強(qiáng)活性的GH61多肽,半纖維素酶、酯酶、棒曲霉素、漆酶、木質(zhì)素分解酶、果膠酶、過氧化物酶、蛋白酶和膨脹素。在另一個(gè)方面,所述纖維素酶為優(yōu)選一種或多種(例如幾種)選自下組的酶:內(nèi)切葡聚糖酶、纖維二糖水解酶和β-葡糖苷酶。在另一個(gè)方面,所述半纖維素酶為優(yōu)選一種或多種(例如幾種)選自下組的酶:乙酰甘露聚糖酯酶、乙酰木聚糖酯酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、香豆酸酯酶、阿魏酸酯酶、半乳糖苷酶、葡糖醛酸糖苷酶、葡糖醛酸酯酶、甘露聚糖酶、甘露糖苷酶、木聚糖酶和木糖苷酶。[0297]在另一個(gè)方面,所述酶組合物包含一種或多種(例如幾種)纖維素分解酶。在另一個(gè)方面,所述酶組合物包含或進(jìn)一步包含一種或多種(例如幾種)半纖維素分解酶。在另一個(gè)方面,所述酶組合物包含一種或多種(例如幾種)纖維素分解酶和一種或多種(例如幾種)半纖維素分解酶。在另一個(gè)方面,所述酶組合物包含一種或多種(例如幾種)選自下組的酶:纖維素分解酶和半纖維素分解酶。在另一個(gè)方面,所述酶組合物包含內(nèi)切葡聚糖酶。在另一個(gè)方面,所述酶組合物包含纖維二糖水解酶。在另一個(gè)方面,所述酶組合物包含β_葡糖苷酶。在另一個(gè)方面,所述酶組合物包含具有纖維素分解增強(qiáng)活性的多肽。在另一個(gè)方面,所述酶組合物包含內(nèi)切葡聚糖酶和具有纖維素分解增強(qiáng)活性的多肽。在另一個(gè)方面,所述酶組合物包含纖維二糖水解酶和具有纖維素分解增強(qiáng)活性的多肽。在另一個(gè)方面,所述酶組合物包含β_葡糖苷酶和具有纖維素分解增強(qiáng)活性的多肽。在另一個(gè)方面,所述酶組合物包含內(nèi)切葡聚糖酶和纖維二糖水解酶。在另一個(gè)方面,所述酶組合物包含內(nèi)切葡聚糖酶和β-葡糖苷酶。在另一個(gè)方面,所述酶組合物包含纖維二糖水解酶和β-葡糖苷酶。在另一個(gè)方面,所述酶組合物包含內(nèi)切葡聚糖酶、纖維二糖水解酶和具有纖維素分解增強(qiáng)活性的多肽。在另一個(gè)方面,所述酶組合物包含內(nèi)切葡聚糖酶、β-葡糖苷酶和具有纖維素分解增強(qiáng)活性的多肽。在另一個(gè)方面,所述酶組合物包含纖維二糖水解酶、β-葡糖苷酶和具有纖維素分解增強(qiáng)活性的多肽。在另一個(gè)方面,所述酶組合物包含內(nèi)切葡聚糖酶、纖維二糖水解酶和β-葡糖苷酶。在另一個(gè)方面,所述酶組合物包含內(nèi)切葡聚糖酶、纖維二糖水解酶、β-葡糖苷酶和具有纖維素分解增強(qiáng)活性的多肽。[0298]在另一個(gè)方面,所述酶組合物包含乙酰甘露聚糖酯酶。在另一個(gè)方面,所述酶組合物包含乙酰木聚糖酯酶。在另一個(gè)方面,所述酶組合物包含阿拉伯聚糖酶(例如a-L-阿拉伯聚糖酶)。在另一個(gè)方面,所述酶組合物包含阿拉伯呋喃糖苷酶(例如a-L-阿拉伯呋喃糖苷酶)。在另一個(gè)方面,所述酶組合物包含香豆酸酯酶。在另一個(gè)方面,所述酶組合物包含阿魏酸酯酶。在另一個(gè)方面,所述酶組合物包含半乳糖苷酶(例如α-半乳糖苷酶和/或半乳糖苷酶)。在另一個(gè)方面,所述酶組合物包含葡糖醛酸糖苷酶(例如a-D-葡糖醛酸糖苷酶)。在另一個(gè)方面,所述酶組合物包含葡糖醛酸酯酶。在另一個(gè)方面,所述酶組合物包含甘露聚糖酶。在另一個(gè)方面,所述酶組合物包含甘露糖苷酶(例如β-甘露糖苷酶)。在另一個(gè)方面,所述酶組合物包含木聚糖酶。在一個(gè)優(yōu)選的方面,所述木聚糖酶是家族10木聚糖酶。在另一個(gè)方面,所述酶組合物包含木糖苷酶(例如β-木糖苷酶)。[0299]在另一個(gè)方面,所述酶組合物包含酯酶。在另一個(gè)方面,所述酶組合物包含棒曲霉素。在另一個(gè)方面,所述酶組合物包含漆酶。在另一個(gè)方面,所述酶組合物包含木質(zhì)素分解酶。在另一個(gè)優(yōu)選的方面,所述木質(zhì)素分解酶是錳過氧化物酶。在另一個(gè)優(yōu)選的方面,所述木質(zhì)素分解酶是木質(zhì)素過氧化物酶。在另一個(gè)優(yōu)選的方面,所述木質(zhì)素分解酶是產(chǎn)生H2O2的酶。在另一個(gè)方面,所述酶組合物包含果膠酶。在另一個(gè)方面,所述酶組合物包含過氧化物酶。在另一個(gè)方面,所述酶組合物包含蛋白酶。在另一個(gè)方面,所述酶組合物包含膨脹素。[0300]在本發(fā)明的工藝中,酶可在糖化,糖化和發(fā)酵,或發(fā)酵之前或過程中添加。[0301]所述酶組合物的一種或多種(例如幾種)組分可為野生型蛋白、重組蛋白或野生型蛋白和重組蛋白的組合。舉例而言,一種或多種(例如幾種)組分可為細(xì)胞的天然蛋白,其用作宿主細(xì)胞以重組表達(dá)酶組合物的一種或多種(例如幾種)其他組分??蓪⒚附M合物的一種或多種(例如幾種)組分作為單獨(dú)組分產(chǎn)生,然后將其組合以形成酶組合物。所述酶組合物可為多組分和單組分蛋白制備物的組合。[0302]用于本發(fā)明工藝中的酶可為任何適用的形式,例如發(fā)酵液配制物,細(xì)胞組合物,含或不含細(xì)胞碎片的細(xì)胞裂解液,半純化或純化的酶制備物,或作為酶的來源的宿主細(xì)胞。所述酶組合物可為干粉或顆粒,無粉塵的顆粒,液體,穩(wěn)定化液體或穩(wěn)定化受保護(hù)的酶。液體酶制備物可根據(jù)確立的工藝,例如通過添加穩(wěn)定劑如糖、糖醇或其他多元醇,和/或乳酸或其他有機(jī)酸來穩(wěn)定化。[0303]具有纖維二糖水解酶活性的酶和多肽的最適量取決于幾個(gè)因素,其包括但不限于,纖維素分解和/或半纖維素分解酶組分的混合物、纖維素材料、纖維素材料的濃度、纖維素材料的預(yù)處理、溫度、時(shí)間、PH和包括發(fā)酵生物體(例如,同時(shí)糖化和發(fā)酵的酵母)。[0304]在一個(gè)方面,纖維素分解酶或半纖維素分解酶對(duì)于纖維素材料的有效量是約0.5至約50mg,例如約0.5至約40mg,約0.5至約25mg,約0.75至約20mg,約0.75至約15mg,約0·5至約IOmg,或約2·5至約IOmg每g纖維素材料。[0305]在另一個(gè)方面,具有纖維二糖水解酶活性的多肽對(duì)于纖維素材料的有效量是約0·01至約50.Omg,例如約0·01至約40mg,約0·01至約30mg,約0·01至約20mg,約0·01至約10mg,約0·01至約5mg,約0·025至約I.5mg,約0·05至約I.25mg,約0·075至約I.25mg,約0.1至約I.25mg,約0.15至約I.25mg,或約0.25至約I.Omg每g纖維素材料。[0306]在另一個(gè)方面,具有纖維二糖水解酶活性的多肽對(duì)于纖維素分解酶或半纖維素分解酶的有效量是約005至約I.0g,例如約0·01至約I.0g,約0·15至約0·75g,約0·15至約0.5g,約0.1至約0.5g,約0.1至約0.25g,或約0.05至約0.2g每g纖維素分解酶或半纖維素分解酶。[0307]具有纖維素分解酶活性或半纖維素分解酶活性的多肽,以及其它可用于纖維素材料的降解的蛋白/多肽,例如具有纖維素分解增強(qiáng)活性的GH61多肽(在本文中統(tǒng)稱為具有酶活性的多肽)可源自或獲得自任何合適的來源,包括細(xì)菌、真菌、酵母、植物或哺乳動(dòng)物來源。術(shù)語(yǔ)"獲得"在本文中還意指該酶可在宿主生物中使用本文中所述的方法重組產(chǎn)生,其中經(jīng)重組產(chǎn)生的酶對(duì)于宿主生物是天然的或外源的,或具有修飾的氨基酸序列,例如,具有一個(gè)或多個(gè)(例如幾個(gè))缺失、插入和/或取代的氨基酸,即重組產(chǎn)生的酶,其是天然氨基酸序列的片段和/或突變體或是通過本領(lǐng)域已知的氨基酸改組方法產(chǎn)生的酶。天然酶的含義中涵蓋的是天然變體,而外來酶的含義中涵蓋的是重組(如通過定位誘變或重排)獲得的變體。[0308]具有酶活性的多肽可以是細(xì)菌多肽。例如,所述多肽可以是革蘭氏陽(yáng)性細(xì)菌多肽如芽孢桿菌屬(Bacillus)、鏈球菌屬(Streptococcus)、鏈霉菌屬(Streptomyces)、葡萄球菌屬(Staphylococcus)、腸球菌屬(Enterococcus)、乳桿菌屬(Lactobacillus)、乳球菌屬(Lactococcus)、梭菌屬(Clostridium)、地芽孢桿菌屬(Geobacillus)、熱解纖維素菌屬(Caldicellulosiruptor)、熱酸菌屬(Acidothermus)、Thermobifidia或海洋芽抱桿菌屬(Oceanobacillus)多肽,所述多肽具有酶活性;或革蘭氏陰性細(xì)菌多肽,如大腸桿菌、假單胞菌屬(Pseudomonas)、沙門氏菌屬(Salmonella)、彎曲桿菌屬(Campylobacter)、螺桿菌屬(Helicobacter)、黃桿菌屬(Flavobacterium)、梭桿菌屬(Fusobacterium)、泥桿菌屬(Ilyobacter)、奈瑟氏菌屬(Neisseria)或脲原體屬(Ureaplasma)多肽,所述多肽具有酶活性。[0309]在一個(gè)方面,所述多肽是具有酶活性的嗜堿芽孢桿菌、解淀粉芽孢桿菌、短芽孢桿菌、環(huán)狀芽孢桿菌、克勞氏芽孢桿菌、凝結(jié)芽孢桿菌、堅(jiān)強(qiáng)芽孢桿菌、燦爛芽孢桿菌、遲緩芽孢桿菌、地衣芽孢桿菌、巨大芽孢桿菌、短小芽孢桿菌、嗜熱脂肪芽孢桿菌、枯草芽孢桿菌或蘇云金芽孢桿菌多肽。[0310]在另一個(gè)優(yōu)選的方面,所述多肽是具有酶活性的似馬鏈球菌、釀膿鏈球菌、乳房鏈球菌或馬鏈球菌獸瘟亞種多肽。[0311]在另一個(gè)優(yōu)選的方面,所述多肽是具有酶活性的不產(chǎn)色鏈霉菌、除蟲鏈霉菌、天藍(lán)鏈霉菌、灰色鏈霉菌或淺青紫鏈霉菌多肽。[0312]具有酶活性的多肽也可以是真菌多肽,并且更優(yōu)選酵母多肽如假絲酵母屬、克魯維酵母屬、畢赤酵母屬、酵母屬、裂殖酵母屬或西洋蓍霉屬多肽,其具有酶活性;或更優(yōu)選絲狀真菌多肽如枝頂孢霉屬、傘菌屬、鏈格孢屬、曲霉屬、短梗霉屬、Botryospaeria、擬錯(cuò)菌屬、Chaetomidium、金抱子菌屬、Claviceps、Cochliobolus、鬼傘屬、Coptotermes、棒囊殼屬、隱叢赤殼菌屬、隱球菌屬、色二孢屬、黑耳屬、Filibasidium、鐮孢屬、赤霉屬、全鞭毛蟲屬、腐質(zhì)霉屬、耙齒菌屬、蘑燕屬、Leptospaeria、梨孢菌屬、Melanocarpus、多孔菌屬、毛霉屬、毀絲霉屬、新考瑪脂霉屬、脈孢菌屬、擬青霉屬、青霉屬、平革菌屬、瘤胃壺菌屬、Poitrasia、假黑盤菌屬、Pseudotrichonympha、根毛霉屬、裂裙菌屬、柱頂孢屬、踝節(jié)菌屬、嗜熱子囊菌屬、梭孢霉屬、彎頸霉屬、木霉屬、長(zhǎng)毛盤菌屬、輪枝孢屬、包腳菇屬或炭角菌屬多肽,其具有酶活性。[0313]在一個(gè)方面,所述多肽是具有酶活性的卡爾酵母、釀酒酵母、糖化酵母、道格拉氏酵母、克魯弗酵母、諾地酵母或卵形酵母多肽。[0314]在另一個(gè)方面,所述多肽是具有酶活性的解纖維枝頂孢霉、棘孢曲霉、泡盛曲霉、煙曲霉、臭曲霉、日本曲霉、構(gòu)巢曲霉、黑曲霉、米曲霉、嗜角質(zhì)金孢子菌、Chrysosporiumlucknowense、熱帶金抱子菌、Chrysosporiummerdarium、Chrysosporiuminops、租金抱子菌、Chrysosporiumqueenslandicum、Chrysosporiumzonatum、桿抱狀鎌抱、禾谷鎌抱、庫(kù)威鐮孢、大刀鐮孢、禾本科鐮孢、禾赤鐮孢、異孢鐮孢、合歡木鐮孢、尖鐮孢、多枝鐮孢、粉紅鐮孢、接骨木鐮孢、膚色鐮孢、擬分枝孢鐮孢、硫色鐮孢、圓鐮孢、擬絲孢鐮孢、鑲片鐮孢、灰腐質(zhì)霉、特異腐質(zhì)霉、疏棉狀腐質(zhì)霉、白耙齒菌、米黑毛霉、嗜熱毀絲霉、粗糙脈孢菌、繩狀青霉、產(chǎn)紫青霉、黃抱平革菌、Thielaviaachromatica、Thielaviaalbomyces、Thielaviaalbopilosa、澳洲梭孢霉、Thielaviafimeti、小孢梭孢霉、卵孢梭孢霉、Thielaviaperuviana、瘤孢梭孢霉、毛梭孢霉、Thielaviasubthermophila、土生梭孢霉、哈茨木霉、康寧木霉、長(zhǎng)枝木霉、里氏木霉、綠色木霉或褐孢長(zhǎng)毛盤菌(Trichophaeasaccata)多肽。[0315]還可以使用具有酶活性的多肽的經(jīng)化學(xué)修飾或蛋白質(zhì)工程改造的突變體。[0316]所述組合物的一種或多種(例如幾種)組分可以是重組組分,亦即,通過克隆編碼所述單獨(dú)組分的DNA序列并隨后用該DNA序列轉(zhuǎn)化細(xì)胞并在宿主中表達(dá)(參見,例如,W091/17243和W091/17244)而產(chǎn)生的。所述宿主優(yōu)選是異源宿主(酶對(duì)宿主是外源的),但該宿主在一定條件下也可以是同源宿主(酶對(duì)宿主是天然的)。單組分纖維素分解蛋白還可以通過從發(fā)酵液中提純這樣的蛋白質(zhì)來制備。[0317]在一個(gè)方面,所述一種或多種(例如幾種)纖維素分解酶包含商業(yè)性纖維素分解酶制備物。適用于本發(fā)明的商業(yè)的纖維素分解酶制備物的實(shí)例包括,例如,CELLIC?Ctec(NovozymesA/S)、CELLIC?CTec2(NovozymesA/S)、CELLIC?CTec3(NovozymesA/S),CELLUCLAST?(NovozymesA/S),N0V0ZYM?188(NovozymesA/S)、CELLUZYME?(NovozymesA/S)、CEREFLO?(NovozymesA/S)和ULTRAFLO?(NovozymesA/S),ACCELERASE?(GenencorInt·)、LAMINEXtm(GenencorInt·)、SPEZYME?CP(GenencorInt·),F(xiàn)ILTRASE?NL(DSM)、METHAPLUS?S/L100(DSM),R0HAMENT?7069W(R6hmGmbH),F(xiàn)IBREZYME?LDI(DyadicInternational,Inc.)>FIBREZYME?LBR(DyadicInternational,Inc.)或VISCOSTAR?150L(DyadicInternational,Inc.)。所述纖維素酶酶以固形物的約0.001至約5.Owt%,例如固形物的約0·025至約4.Owt%,或固體的約0·005至約2.Owt%的有效量添加。[0318]可以用于本發(fā)明的工藝的細(xì)菌內(nèi)切葡聚糖酶的實(shí)例包括但不僅限于,解纖維熱酸菌(Acidothermuscellulolyticus)內(nèi)切葡聚糖酶(TO91/05039;W093/15186;美國(guó)專利5,275,944;W096/02551;美國(guó)專利5,536,655,WO00/70031,WO05/093050);Thermobifidafusca內(nèi)切葡聚糖酶III(W005/093050);和Thermobifidafusca內(nèi)切葡聚糖酶V(TO05/093050)。[0319]可以用于本發(fā)明的真菌內(nèi)切葡聚糖酶的實(shí)例包括但不僅限于,里氏木霉內(nèi)切葡聚糖酶KPenttila等,1986,Gene45:253-263,里氏木霉Cel7B內(nèi)切葡聚糖酶I(GENBANK?登錄號(hào)M15665);里氏木霉內(nèi)切葡聚糖酶II(Saloheimo等,1988,Gene63:11-22),里氏木霉Cel5A內(nèi)切葡聚糖酶II(GENBANK?登錄號(hào)M19373);里氏木霉內(nèi)切葡聚糖酶III(Okada等,1988,Appl.Environ.Microbiol.64:555-563;GENBANK?登錄號(hào)AB003694);里氏木霉內(nèi)切葡聚糖酶V(Saloheimo等,1994,MolecularMicrobiology13:219-228;GENBANK?登錄號(hào)233381);棘抱曲霉內(nèi)切葡聚糖酶(0〇:1等,1990,池(316;^六(^(181^8631'(31118:5884);川地曲霉(Aspergilluskawachii)內(nèi)切葡聚糖酶(Sakamoto等,1995,CurrentGenetics27:435-439);胡蘿卜軟腐歐文氏菌(Erwiniacarotovara)內(nèi)切葡聚糖酶(Saarilahti等,1990,Gene90:9-14);尖鐮孢內(nèi)切葡聚糖酶(GENBANK?登錄號(hào)L29381);灰腐質(zhì)霉thermoidea變種內(nèi)切葡聚糖酶(GENBANK?登錄號(hào)AB003107);Melanocarpusalbomyces內(nèi)切葡聚糖酶(GENBANK?登錄號(hào)MAL515703);粗糙脈孢菌內(nèi)切葡聚糖酶(GENBANK?登錄號(hào)XM_324477);特異腐質(zhì)霉內(nèi)切葡聚糖酶V;嗜熱毀絲霉CBSl17.65內(nèi)切葡聚糖酶;擔(dān)子菌綱(basidi〇myCete)CBS495.95內(nèi)切葡聚糖酶;擔(dān)子菌綱CBS494.95內(nèi)切葡聚糖酶;土生梭孢霉NRRL8126CEL6B內(nèi)切葡聚糖酶;土生梭孢霉NRRL8126CEL6C內(nèi)切葡聚糖酶;土生梭孢霉NRRL8126CEL7C內(nèi)切葡聚糖酶;土生梭孢霉NRRL8126CEL7E內(nèi)切葡聚糖酶;土生梭孢霉NRRL8126CEL7F內(nèi)切葡聚糖酶;CladorrhinumfoecundissimumATCC62373CEL7A內(nèi)切葡聚糖酶;以及里氏木霉菌株No.VTT-D-80133內(nèi)切葡聚糖酶(GENBANK?登錄號(hào)Ml5665)。[0320]可用于本發(fā)明的纖維二糖水解酶的實(shí)例包括但不僅限于,棘孢曲霉纖維二糖水解酶II(W02011/059740),嗜熱毛殼菌(Chaetomiumthermophilum)纖維二糖水解酶I,嗜熱毛殼菌纖維二糖水解酶II,特異腐質(zhì)霉纖維二糖水解酶I,嗜熱毀絲霉纖維二糖水解酶II,(W02009/042871),Thielaviahyrcanie纖維二糖水解酶II(W02010/141325),土生梭孢霉纖維二糖水解酶Π(CEL6A,WO2006/074435),里氏木霉纖維二糖水解酶I,里氏木霉纖維二糖水解酶Π,以及褐孢長(zhǎng)毛盤菌纖維二糖水解酶II(W02010/057086)。[0321]可用于本發(fā)明的β-葡糖苷酶的實(shí)例包括但不僅限于來自棘孢曲霉(Kawaguchi等,1996,Genel73:287-288)、煙曲霉(TO2005/047499)、黑曲霉(Dan等,2000,J.Biol.Chem.275:4973-4980)、米曲霉(TO2002/095014)、巴西青霉IBT20888(TO2007/019442和WO2010/088387)、土生梭孢霉(W02011/035029)和褐孢長(zhǎng)毛盤菌(W02007/019442)的β-葡糖苷酶。[0322]所述葡糖苷酶可以是融合蛋白。在一個(gè)方面,所述葡糖苷酶是WO米曲霉β-葡糖苷酶變體BG融合蛋白(W02008/057637)或米曲霉β-葡糖苷酶融合蛋白(2008/057637)。[0323]其它可用的內(nèi)切葡聚糖酶、纖維二糖水解酶和葡糖苷酶公開于使用根據(jù)HenrissatΒ.,1991,Aclassificationofglycosylhydrolasesbasedonamino-acidsequencesimilarities,Biochem.J.280:309-316和HenrissatB.和BairochA.,1996,Updatingthesequence-basedclassificationofglycosylhydrolases,Biochem.J.316:695-696的分類的許多糖基水解酶家族中。[0324]其它可用于本發(fā)明的纖維素分解酶描述于WO98/13465、WO98/015619、WO98/015633、WO99/06574、WO99/10481、WO99/025847、WO99/031255、WO2002/101078、WO2003/027306,WO2003/052054,WO2003/052055,WO2003/052056,WO2003/052057,WO2003/052118,WO2004/016760,WO2004/043980,WO2004/048592,WO2005/001065,WO2005/028636,WO2005/093050,WO2005/093073,WO2006/074005,WO2006/117432,WO2007/071818、WO2007/071820、WO2008/008070、WO2008/008793、美國(guó)專利No.5,457,046、美國(guó)專利No.5,648,263和美國(guó)專利No.5,686,593。[0325]在本發(fā)明的方法中,可使用任何具有纖維素分解增強(qiáng)活性的GH61多肽作為酶組合物的組分。[0326]在第一個(gè)方面,所述具有纖維素分解增強(qiáng)活性的GH61多肽包含下述基序:[0327][ILMV]-P-X(4,5)-G-X-Y-[ILMV]-X-R-X-[EQ]-X(4)-[HNQ](SEQIDN0:29或SEQIDN0:30)和[FW]-[TF]-K-[AIV],[0328]其中X為任意氨基酸,X(4,5)為在4或5個(gè)連續(xù)位置上的任意氨基酸,而X(4)是在4個(gè)連續(xù)位置上的任意氨基酸。[0329]包含上述所示的基序的分離的多肽可還包含:[0330]H-X(l,2)-G-P-X(3)-[YW]-[AILMV](SEQIDN0:31或SEQIDN0:32),[0331][EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV](SEQIDN0:33),或[0332]H-X(l,2)-G-P-X(3)-[YW]-[AILMV](SEQIDN0:31或SEQIDN0:32)和[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV](SEQIDN0:33),[0333]其中X為任意氨基酸,X(1,2)為在I個(gè)位置或2個(gè)連續(xù)位置上的任意氨基酸,X(3)為3個(gè)連續(xù)位置上的任意氨基酸,而X(2)為2個(gè)連續(xù)位置上的任意氨基酸。在上述基序中,采用公認(rèn)的IUPAC單字母氨基酸縮寫。[0334]在一個(gè)優(yōu)選的方面,所述具有纖維素分解增強(qiáng)活性的分離的GH61多肽還包含H-X(1,2)-G-P-X(3)-[YW]-[AILMV](SEQIDN0:31或SEQIDN0:32)。在另一個(gè)優(yōu)選的方面,具有纖維素分解增強(qiáng)活性的分離的GH61多肽還包含[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV](SEQIDN0:33)。在另一個(gè)優(yōu)選的方面,具有纖維素分解增強(qiáng)活性的分離的GH61多肽還包含H-X(1,2)-G-P-X(3)-[YW]-[AILMV](SEQIDN0:31或SEQIDN0:32)和[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV](SEQIDN0:33)。[0335]在第二個(gè)方面,所述具有纖維素分解增強(qiáng)活性的分離的多肽包含下述基序:[0336][ILMV]-P-x(4,5)-G-x-Y-[ILMV]-x-R-x-[EQ]-x(3)-A-[HNQ](SEQIDN0:34或SEQIDNO:35),[0337]其中x為任意氨基酸,x(4,5)為在4或5個(gè)連續(xù)位置上的任意氨基酸,而x(3)為3個(gè)連續(xù)位置上的任意氨基酸。在上述基序中,采用公認(rèn)的IUPAC單字母氨基酸縮寫。[0338]可用于本發(fā)明的工藝的具有纖維素分解增強(qiáng)活性的GH61多肽的實(shí)例包括但不限于來自土生梭孢霉(W02005/074647,WO2008/148131和WO2011/035027);桔橙熱子囊菌(W02005/074656和WO2010/065830),里氏木霉(W02007/089290),嗜熱毀絲霉(TO2009/085935,TO2009/085859,TO2009/085864,TO2009/085868),煙曲霉(WO2010/138754)的GH61多肽,來自嗜松青霉(WO2011/005867),嗜熱子囊菌菌種(W02011/039319),青霉屬菌種(W02011/041397),和甲殼嗜熱子囊菌(Thermoascuscrustaceous)的GH61多肽(W02011/041504)。[0339]在一個(gè)方面,所述具有纖維素分解增強(qiáng)活性的GH61多肽在WO2008/151043中所述的可溶性活化二價(jià)金屬陽(yáng)離子,例如錳或銅的存在下使用。[0340]在另一個(gè)方面,所述具有纖維素分解增強(qiáng)活性的GH61多肽在二氧化合物、二環(huán)化合物、雜環(huán)化合物、含氮化合物、醌化合物、含硫化合物、或從經(jīng)預(yù)處理的纖維素材料如經(jīng)預(yù)處理的玉米秸桿(PCS)獲得的液劑的存在下使用。[0341]所述二氧化合物可包括任何含有兩個(gè)或更多氧原子的合適化合物。在一些方面,所述二氧化合物含有如本文中所述的取代的芳基模塊(moiety)。所述二氧化合物可包括一個(gè)或多個(gè)(例如幾個(gè))羥基和/或羥基衍生物,但亦包括缺乏羥基和羥基衍生物的取代的芳基模塊。二氧化合物的非限定性實(shí)例包括鄰苯二酚或兒茶酚;咖啡酸;3,4-二羥基苯甲酸;4-叔丁基-5-甲氧基-1,2-苯二酚;連苯三酚;沒食子酸;甲基-3,4,5-三羥基苯甲酸;2,3,4-三羥基二苯甲酮;2,6-二甲氧基苯酚;芥子酸;3,5-二羥基苯甲酸;4-氯-1,2-苯二酚;4-硝基-1,2-苯二酚;縣酸;沒食子酸乙酯;輕乙酸甲酯;二羥基延胡索酸;2-丁炔-1,4-二醇;克酮酸;1,3-丙二醇;酒石酸;2,4-戊二醇;3-乙氧基-1,2-丙二醇;2,4,4'-三羥基二苯甲酮;順-2-丁烯-1,4-二醇;3,4-二羥基-3-環(huán)丁烯-1,2-二酮;二羥基丙酮;乙酰丙烯醛(acroleinacetal);甲基-4-羥基苯甲酸;4-羥基苯甲酸;和甲基-3,5-二甲氧基-4-羥基苯甲酸;或它們的鹽或溶劑合物(solvate)。[0342]所述二環(huán)化合物可包括任何如本文中所述的合適的取代稠環(huán)系統(tǒng)。所述化合物可包含一個(gè)或多個(gè)(例如幾個(gè))另外的環(huán),且除非另行說明,不限于具體的環(huán)數(shù)。在一個(gè)方面,所述二環(huán)化合物是類黃酮。在另一個(gè)方面,所述二環(huán)化合物是任選取代的異類黃酮(isoflavonoid)。在另一個(gè)方面,所述二環(huán)化合物是任選取代的花色#離子(flavyliumion),如任選取代的花色素或任選取代的花色苷,或其衍生物。二環(huán)化合物的非限定性實(shí)例包括表兒茶素(epicatechin);槲皮素(quercetin);楊梅黃酮(myricetin);黃杉素(taxifolin);山奈酚(kaempferol);桑素(morin);金合歡素(acacetin);柚皮素(naringenin);異鼠李黃素(isorhamnetin)菜苷配基(apigenin);花青素(cyanidin);花色素苷(cyanin);kuromanin;花青素鼠李葡糖苷(keracyanin);或它們的鹽或溶劑合物。[0343]所述雜環(huán)化合物可為任何合適的化合物,如本文中所述的任選取代的包含雜原子的芳環(huán)或非芳環(huán)。在一個(gè)方面,所述雜環(huán)是包含任選取代的雜環(huán)烷基模塊或任選取代的雜芳基模塊的化合物。在另一個(gè)方面,所述任選取代的雜環(huán)烷基模塊或任選取代的雜芳基模塊是任選取代的五元雜環(huán)烷基或任選取代的五元雜芳基模塊。在另一個(gè)方面,任選取代的雜環(huán)烷基或任選取代的雜芳基模塊是選自如下的任選取代的模塊:吡唑基、呋喃基、咪唑基、異噁唑基、噁二唑基、噁唑基、吡咯基、吡啶基、嘧啶基、噠嗪基、噻唑基、三唑基、噻吩基(thienyl)、二氫噻吩-批唑基(dihydrothieno-pyrazolyl)、硫諱基、咔唑基、苯并咪唑基、苯并噻吩基(benzothienyl)、苯并呋喃基、吲哚基、喹啉基、苯并三唑基、苯并噻唑基、苯并P惡唑基(benzooxazolyl)、苯并咪唑基、異喹啉基、異Π引哚基、Π丫陡基、苯并異P惡唑基(benzoisazolyl)、二甲基乙內(nèi)酰脲、吡嗪基、四氫呋喃基、吡咯啉基、吡咯烷基、嗎啉基、卩引哚基、二氮雜環(huán)庚三烯基(diazepinyl)、氮雜環(huán)庚三烯基(azepinyl)、硫雜環(huán)庚三烯基(thiepinyl)、哌陡基和氧雜環(huán)庚三烯基(oxepinyl)。在另一個(gè)方面所述任選取代的雜環(huán)烷基模塊或任選取代的雜芳基模塊是任選取代的呋喃基。雜環(huán)化合物的非限定性實(shí)例包括(1,2-二羥乙基)-3,4-二氫呋喃-2(5H)-酮;4-羥基-5-甲基-3-呋喃酮;5-羥基-2(5H)_呋喃酮;[1,2-二羥乙基]呋喃-2,3,4(5H)-三酮;α-羥基-γ-丁內(nèi)酯;核糖酸γ-內(nèi)酯;己醒糖酸γ-內(nèi)酯(aldohexuronicaldohexuronicacidy-lactone);葡糖酸S-內(nèi)酯;4-羥基香豆素;二氫苯并呋喃;5-(羥甲基)糠醛;糠偶姻(furoin);2(5H)_呋喃酮;5,6-二氫-2H-吡喃-2-酮;和5,6-二氫-4-羥基-6-甲基-2H-吡喃-2-酮;或它們的鹽或溶劑合物。[0344]所述含氮化合物可為任何具有一個(gè)或多個(gè)氮原子的合適化合物。在一個(gè)方面,所述含氮化合物包含胺、亞胺、羥胺或氧化亞氮(nitroxide)模塊。含氮化合物的非限定性實(shí)例包括丙酮肟;紫尿酸;吡啶-2-醛肟;2-氨基苯酚;1,2-苯二胺;2,2,6,6-四甲基-1-哌啶基氧(piperidinyloxy);5,6,7,8-四氫生物蝶呤;6,7-二甲基-5,6,7,8-四氫蝶呤;和馬來酰胺酸;或它們的鹽或溶劑合物。[0345]所述醌化合物可為任何本文中所述的包含醌模塊的合適的化合物。醌化合物的非限定性實(shí)例包括1,4-苯醌;1,4-萘醌;2-羥基-1,4-萘醌;2,3-二甲氧基-5-甲基-1,4-苯醌或輔酶Qtl;2,3,5,6-四甲基-1,4-苯醌或四甲基對(duì)苯醌;1,4-二羥基蒽醌;3-羥基-1-甲基-5,6-二氫吲哚二酮或腎上腺色素;4-叔丁基-5-甲氧基-1,2-苯醌;批咯并喹啉醌(pyrroloquinolinequinone);或它們的鹽或溶劑合物。[0346]所述含硫化合物可為任何包含一個(gè)或多個(gè)硫原子的合適的化合物。在一個(gè)方面,所述含硫化合物包含選自如下的模塊:亞硫酰,硫醚,亞磺酰,磺酰,硫酰胺(sulfamide),磺酰胺(sulfonamide),磺酸和磺酸酯。含硫化合物的非限定性實(shí)例包括乙硫醇;2-丙硫醇;2-丙烯-1-硫醇;2-巰基乙磺酸;苯硫醇;苯-1,2-二硫醇;半胱氨酸;甲硫氨酸;谷胱甘肽;胱氨酸;或它們的鹽或溶劑合物。[0347]在一個(gè)方面,此種如上所述的化合物對(duì)纖維素材料的有效量,以對(duì)纖維素糖單元的摩爾比例計(jì),為約KT6至約10,例如約KT6至約7.5,約KT6至約5,約KT6至約2.5,約KT6至約1,約KT5至約1,約KT5至約KT1,約KT4至約KT1,約KT3至約KT1,或約KT3至約10'在另一個(gè)方面,如上所述的化合物的有效量為約0.1μM至約1M,例如約0.5μM至約0.75Μ,約0.75μM至約0.5Μ,約1μM至約0.25Μ,約1μM至約0.1Μ,約5μM至約50mM,約10μM至約25mM,約50μM至約25mM,約10μM至約IOmM,約5μM至約5mM,或約0·ImM至約ImM。[0348]術(shù)語(yǔ)"液劑(liquor)"意指在本文中所述的條件下,通過處理漿料中的木素纖維素和/或半纖維素材料,或其單糖例如木糖、阿拉伯糖、甘露糖等,所產(chǎn)生的溶液相,即水相、有機(jī)相或其組合,及其可溶性內(nèi)含物。用于GH61多肽的纖維素分解增強(qiáng)的液劑可通過,任選在催化劑例如酸的存在下,任選在有機(jī)溶劑的存在下,且任選與對(duì)所述材料的物理破壞相組合來藉由施加熱和/或壓力來處理纖維素材料或半纖維素材料(或原料),然后將溶液與殘余固體分離來產(chǎn)生。此類條件決定了在借助纖維素酶制備物水解纖維素材料的過程中通過液劑和GH61多肽的組合可獲得的纖維素分解增強(qiáng)的程度。所述液劑可使用本領(lǐng)域中的標(biāo)準(zhǔn)方法如過濾、沉積或離心從經(jīng)處理的材料分離。[0349]在一個(gè)方面,所述液劑對(duì)纖維素的有效量為約KT6至約IOg每g纖維素,例如約KT6至約7.5g,約KT6至約5,約KT6至約2.5g,約KT6至約Ig,約KT5至約Ig,約KT5至約10、,約KT4至約10、,約KT3至約10、,或約KT3至約l(T2g每g纖維素。[0350]在一個(gè)方面,所述一種或多種(例如幾種)半纖維素分解酶包含商業(yè)性半纖維素分解酶制備物。適用于本發(fā)明的商業(yè)性半纖維素分解酶制備物的實(shí)例包括,例如SHEARZYME?(NovozymesA/S)、CELLIC?HTec(NovozymesA/S)、CELLIC?HTec2(NovozymesA/S)>CE^LLIG?HTecG⑴ovozymesA/S)、YISGO^YMEXS)(NovozymesA/S)、ULTRAFLO?(NovozymesA/S)、PULPZYME?HC(NovozymesA/S)、TV1ULTIFECT?Xylanase(Genencor)、ACCE.L.LERASE?XY(Genencor)>AGGELLEiRASEl·?XG(Genencor)、EGOPULP?T)(-200A(ABEnzymes)、HSP6000Xylanase(DSM)、DEP0L?333P(BiocatalystsLimit,Wales,UK)、DEP0LTM740L(BiocatalystsLimit,Wales,UK)和DEP0LTM762P(BiocatalystsLimit,Wales,UK)〇[0351]可用于本發(fā)明工藝的木聚糖酶的實(shí)例包括但不限于來自棘孢曲霉(Aspergillusaculeatus)(GeneSeqP:AAR63790;W094/21785)、煙曲霉(Aspergillusfumigatus)(TO2006/078256)、嗜松青霉(WO2011/041405)、青霉屬菌種(WO2010/126772)、土生梭孢霉(Thielaviaterrestris)NRRL8126(W02009/079210)和褐孢長(zhǎng)毛盤菌GHlO(W)2011/057083)的木聚糖酶。[0352]可用于本發(fā)明工藝的木糖苷酶的實(shí)例包括但不限于來自粗糙脈孢菌(Neurosporacrassa)(SwissProt登錄號(hào)Q7S0W4)、里氏木霉(Trichodermareesei)(UniProtKB/TrEMBL登錄號(hào)Q92458)和埃默森踩節(jié)菌(Talaromycesemersonii)(SwissProt登錄號(hào)Q8X212)的β-木糖苷酶。[0353]可用于本發(fā)明工藝的乙酰木聚糖酯酶的實(shí)例包括但不限于來自棘孢曲霉(W02010/108918)、球毛殼菌(Chaetomiumglobosum)(Uniprot登錄號(hào)Q2GWX4)、細(xì)_毛殼菌(Chaetomiumgracile)(GeneSeqP登錄號(hào)AAB82I24)、特異腐質(zhì)霉(Humicolainsolens)DSM1800(W02009/073709)、紅褐肉座菌(Hypocreajecorina)(W02005/001036)、嗜熱毀絲霉(W〇2010/014880)、粗糙脈孢菌(UniProt登錄號(hào)q7s259)、穎枯殼針孢(Phaeosphaerianodorum)(Uniprot登錄號(hào)Q0UHJ1)和土生梭孢霉NRRL8126(W02009/042846)的乙酰木聚糖酯酶。[0354]可用于本發(fā)明工藝的阿魏酸酯酶的實(shí)例包括但不限于來自特異腐質(zhì)霉DSM1800(W02009/076122)、費(fèi)希新薩托菌(Neosartoryafischer)(UniProt登錄號(hào)A1D9T4)、粗糙脈孢菌(UniProt登錄號(hào)Q9HGR3)、橘灰青霉(W02009/127729)和土生梭孢霉(W02010/053838和WO2010/065448)的阿魏酸酯酶。[0355]可用于本發(fā)明工藝的阿拉伯呋喃糖苷酶的實(shí)例包括但不限于來自黑曲霉(Aspergillusniger)(GeneSeqP登錄號(hào)AAR94170)、特異腐質(zhì)霉(Humicolainsolens)DSM1800(TO2006/114094和WO2009/073383)和Egiganteus(TO2006/114094)的阿拉伯呋喃糖苷酶。[0356]可用于本發(fā)明方法的α-葡糖醛酸糖苷酶的實(shí)例包括但不限于來自棒曲霉(Aspergillusclavatus)(UniProt登錄號(hào)alccl2)、煙曲霉(SwissProt登錄號(hào)Q4WW45)、黑曲霉(Uniprot登錄號(hào)Q96WX9)、土曲霉(Aspergillusterreus)(SwissProt登錄號(hào)Q0CJP9)、特異腐質(zhì)霉(W02010/014706)、橘灰青霉(W02009/068565)、埃默森踝節(jié)菌(UniProt登錄號(hào)Q8X211)和里氏木霉(Uniprot登錄號(hào)Q99024)的α-葡糖醒酸糖苷酶。[0357]用于本發(fā)明工藝的具有酶活性的多肽可通過在含有合適碳源和氮源和無機(jī)鹽的營(yíng)養(yǎng)培養(yǎng)基上,使用本領(lǐng)域已知方法(參見,例如Bennett,J.W.和LaSure,L.(編),MoreGeneManipulationsinFungi,AcademicPress,CA,1991)發(fā)酵上述指出的微生物菌株來產(chǎn)生。合適的培養(yǎng)基可從供應(yīng)商獲得,或可根據(jù)已公開的組成制備(例如美國(guó)典型培養(yǎng)物保藏中心的目錄)。適于生長(zhǎng)和酶產(chǎn)生的溫度范圍和其他條件在本領(lǐng)域是已知的(參見,例如Bailey,J.E.和Ollis,D.F.,BiochemicalEngineeringFundamentals,McGraw-HillBookCompany,NY,1986)。[0358]所述發(fā)酵可以是任何導(dǎo)致酶或蛋白表達(dá)或分離的培養(yǎng)細(xì)胞的方法。因此,發(fā)酵可以理解為包括在合適的培養(yǎng)基中并在允許所述酶得以表達(dá)或分離的條件下進(jìn)行的搖瓶培養(yǎng),或在實(shí)驗(yàn)室或工業(yè)發(fā)酵罐中的小-或大規(guī)模發(fā)酵(包括連續(xù)、分批、補(bǔ)料分批或固態(tài)發(fā)酵)。通過上述方法產(chǎn)生的所得的酶可從發(fā)酵培養(yǎng)基回收并通過常規(guī)方法純化。[0359]發(fā)酵??赏ㄟ^一種或多種(例如幾種)能將糖直接或間接發(fā)酵成所需發(fā)酵產(chǎn)物的發(fā)酵微生物發(fā)酵自經(jīng)水解的纖維素材料獲得的可發(fā)酵糖。"發(fā)酵"或"發(fā)酵方法"指任何發(fā)酵方法或任何包含發(fā)酵步驟的方法。發(fā)酵方法還包括用于消費(fèi)品醇工業(yè)(例如,啤酒和葡萄酒)、乳品業(yè)(例如,發(fā)酵乳產(chǎn)品)、皮革業(yè)和煙草業(yè)的發(fā)酵方法。發(fā)酵條件依賴于期望的發(fā)酵產(chǎn)物和發(fā)酵生物體,并且能由本領(lǐng)域的技術(shù)人員容易地確定。[0360]在發(fā)酵步驟中,作為預(yù)處理和酶水解步驟的結(jié)果從纖維素材料釋放的糖,通過發(fā)酵生物體(如酵母)發(fā)酵成為產(chǎn)物,例如,乙醇。如本文中所述,水解(糖化)和發(fā)酵可以是單獨(dú)或同時(shí)的。[0361]在實(shí)施本發(fā)明的發(fā)酵步驟中可以使用任何合適的經(jīng)水解的纖維素材料。通常根據(jù)所需發(fā)酵產(chǎn)品(即,要從發(fā)酵獲得的物質(zhì))和使用的方法來選擇所述材料,如本領(lǐng)域中所公知的。[0362]術(shù)語(yǔ)"發(fā)酵培養(yǎng)基"在本文中可理解為指加入發(fā)酵微生物之前的培養(yǎng)基,如,由糖化過程產(chǎn)生的培養(yǎng)基,以及同時(shí)糖化和發(fā)酵方法(SSF)中使用的培養(yǎng)基。[0363]"發(fā)酵微生物"指適用于理想的發(fā)酵方法產(chǎn)生發(fā)酵產(chǎn)物的任何微生物,包括細(xì)菌和真菌生物體。發(fā)酵生物體可以是己糖和/或戊糖發(fā)酵生物體,或它們的組合。己糖和戊糖發(fā)酵生物體在本領(lǐng)域均是公知的。合適的發(fā)酵微生物能將糖(如葡萄糖、木糖、木酮糖、阿拉伯糖、麥芽糖、甘露糖、半乳糖和/或寡糖)直接或間接地發(fā)酵(即,轉(zhuǎn)化)成所需的發(fā)酵產(chǎn)品??僧a(chǎn)生乙醇的細(xì)菌和真菌發(fā)酵生物體的實(shí)例如Lin等,2006,Appl.Microbiol.Biotechnol.69:627-642所述。[0364]能發(fā)酵己糖的發(fā)酵微生物的實(shí)例包括細(xì)菌和真菌生物體,如酵母。優(yōu)選的酵母包括假絲酵母屬、克魯維酵母屬和酵母屬,例如Candidasonorensis、馬克斯克魯維酵母和釀酒酵母的菌株。[0365]以其天然狀態(tài)能發(fā)酵戊糖的發(fā)酵生物體的實(shí)例包括細(xì)菌和真菌生物體,如一些酵母。優(yōu)選的木糖發(fā)酵酵母包括假絲酵母屬,優(yōu)選休哈塔假絲酵母(Candidasheatae)或Candidasonorensis;和畢赤酵母屬,優(yōu)選樹干畢赤酵母(Pichiastipitis)的菌株,如樹干畢赤酵母CBS5773的菌株。優(yōu)選的戊糖發(fā)酵酵母包括管囊酵母屬(Pachysolen),優(yōu)選嗜縣管囊酵母(Pachysolentannophilus)的菌株。不能夠發(fā)酵戊糖如木糖和阿拉伯糖的生物可通過本領(lǐng)域已知方法遺傳修飾而發(fā)酵戊糖。[0366]能有效地將己糖和戊糖發(fā)酵成乙醇的細(xì)菌包括,例如,凝結(jié)芽孢桿菌(Bacilluscoagulans)、丙酮丁醇梭菌(Clostridiumacetobutylicum)、熱纖維梭菌(Clostridiumthermocellum)、Clostridiumphytofermentans、地芽抱桿菌屬菌種、解糖熱厭氧桿菌(Thermoanaerobactersaccharolyticum)和運(yùn)動(dòng)發(fā)酵單胞菌(Zymomonasmobilis)(Philippidis,1996,見上文)。[0367]其它發(fā)酵生物包括芽孢桿菌屬,如凝結(jié)芽孢桿菌;假絲酵母屬,如Candidasonorensis、C.methanosorbosa、迪丹斯假絲酵母(Candidadiddensii)、近平滑假絲酵母(Candidaparapsilosis)、C.naedodendra、C.blankii、C.entomophilia、蕓薹假絲酵母(C.brassicae)、假熱帶假絲酵母(Candidapseudotropicalis)、博伊丁假絲酵母(Candidaboidinii)、產(chǎn)I元假絲酵母(Candidautilis)和休哈塔假絲酵母(C.scehatae);梭菌屬,如丙酮丁醇梭菌、熱纖維梭菌和C.phytofermentans;大腸桿菌,特別是經(jīng)遺傳修飾促進(jìn)乙醇產(chǎn)生的大腸桿菌菌株;地芽孢桿菌屬菌種;漢遜酵母屬,如異常漢遜酵母(Hansenulaanomala);克雷伯氏菌屬(Klebsiella),如產(chǎn)酸克雷伯氏菌(Klebsiellaoxytoca);克魯維酵母屬,如馬克斯克魯維酵母、乳酸克魯維酵母(K.lactis)、K.thermotolerans和脆壁克魯維酵母;裂殖酵母屬,如粟酒裂殖酵母(S.pombe);熱厭氧桿菌屬(Thermoanaerobacter),如解糖熱厭氧桿菌,和發(fā)酵單胞菌屬(Zymomonas),如運(yùn)動(dòng)發(fā)酵單胞菌的菌株。[0368]在一個(gè)優(yōu)選的方面,酵母是酒香酵母屬(Bretannomyces)。在一個(gè)更優(yōu)選的方面,酵母是克勞森酒香酵母(Bretannomycesclausenii)。在另一個(gè)更優(yōu)選的方面,酵母是假絲酵母。在另一個(gè)更優(yōu)選的方面,酵母是Candidasonorensis。在另一個(gè)更優(yōu)選的方面,酵母是博伊丁假絲酵母。在另一個(gè)更優(yōu)選的方面,酵母是Candidablankii。在另一個(gè)更優(yōu)選的方面,酵母是蕓薹假絲酵母。在另一個(gè)更優(yōu)選的方面,酵母是迪丹斯假絲酵母。在另一個(gè)更優(yōu)選的方面,酵母是Candidaentomophiliia。在另一個(gè)更優(yōu)選的方面,酵母是假熱帶假絲酵母。在另一個(gè)更優(yōu)選的方面,酵母是休哈塔假絲酵母。在另一個(gè)更優(yōu)選的方面,酵母是產(chǎn)朊假絲酵母。在另一個(gè)優(yōu)選的方面,酵母是棒孢酵母屬(Clavispora)。在另一個(gè)更優(yōu)選的方面,酵母是葡萄牙棒孢酵母(ClavisporaIusitaniae)。在另一個(gè)更優(yōu)選的方面,酵母是仙人掌棒孢酵母(Clavisporaopuntiae)。在另一個(gè)優(yōu)選的方面,酵母是克魯維酵母。在另一個(gè)更優(yōu)選的方面,酵母是脆壁克魯維酵母。在另一個(gè)更優(yōu)選的方面,酵母是馬克斯克魯維酵母。在另一個(gè)更優(yōu)選的方面,酵母是Kluyveromycesthermotolerans。在另一個(gè)優(yōu)選的方面,酵母是管囊酵母屬(Pachysolen)。在另一個(gè)更優(yōu)選的方面,酵母是嗜鞣管囊酵母。在另一個(gè)優(yōu)選的方面,酵母是畢赤酵母。在另一個(gè)更優(yōu)選的方面,酵母是樹干畢赤酵母。在另一個(gè)優(yōu)選的方面,酵母是酵母屬菌種。在另一個(gè)優(yōu)選的方面,酵母是釀酒酵母。在另一個(gè)更優(yōu)選的方面,酵母是糖化酵母(Saccharomycesdistaticus)。在另一個(gè)更優(yōu)選的方面,酵母是葡萄汁酵母(Saccharomycesuvarum)。[0369]在一個(gè)優(yōu)選的方面,細(xì)菌是芽孢桿菌屬。在一個(gè)更優(yōu)選的方面,細(xì)菌是凝結(jié)芽孢桿菌。在另一個(gè)更優(yōu)選的方面,細(xì)菌是梭菌屬。在另一個(gè)更優(yōu)選的方面,細(xì)菌是丙酮丁醇梭菌。在另一個(gè)更優(yōu)選的方面,細(xì)菌是Clostridiumphytofermentans。在另一個(gè)更優(yōu)選的方面,細(xì)菌是熱纖維梭菌。在另一個(gè)更優(yōu)選的方面,細(xì)菌是地芽孢桿菌屬菌種。在另一個(gè)更優(yōu)選的方面,細(xì)菌是熱厭氧桿菌屬。在另一個(gè)更優(yōu)選的方面,細(xì)菌是解糖熱厭氧桿菌。在另一個(gè)更優(yōu)選的方面,細(xì)菌是發(fā)酵單胞菌屬。在另一個(gè)更優(yōu)選的方面,細(xì)菌是運(yùn)動(dòng)發(fā)酵單胞菌。[0370]商業(yè)上可得到的適合乙醇產(chǎn)生的酵母包括,例如BioFERMtmAFT和XR(NABC-NorthAmericanBioproductsCorporation,GA,USA),ETHANOLREDtm酵母(RedStar/Lesaffre,USA)、FALITM(Fleischmann'sYeast,BurnsPhilpFoodInc.,USA),FERMIOL?(DSMSpecialties),GERTSTRAND?(GertStrandAB,Sweden)以及SUPERSTART?和THERMOSACC?新鮮酵母(EthanolTechnology,WI,USA)。[0371]在一個(gè)優(yōu)選的方面,發(fā)酵微生物已經(jīng)經(jīng)過遺傳修飾從而提供發(fā)酵戊糖的能力,如利用木糖、利用阿拉伯糖和共同利用木糖和阿拉伯糖的微生物。[0372]已經(jīng)通過將異源基因克隆入多種發(fā)酵微生物構(gòu)建了能將己糖和戊糖轉(zhuǎn)化成乙醇(共發(fā)酵)的生物體(Chen和Ho,I"3,CloningandimprovingtheexpressionofPichiastipitisxylosereductasegeneinSaccharomycescerevisiae,AppLBiochem.BiotechnoI.39-40:135-147;Ho等,1998,GeneticallyengineeredSaccharomycesyeastcapableofeffectivelycofermentingglucoseandxylose,Appl.Environ.Microbiol.64:1852-1859;Kotter和Ciriacy,1993,XylosefermentationbySaccharomycescerevisiae,Appl.Microbiol.Biotechnol.38:776-783;Walfridsson等,1995,Xylose-metabolizingSaccharomycescerevisiaestrainsoverexpressingtheTKLlandTALlgenesencodingthepentosephosphatepathwayenzymestransketolaseandtransaldolase,Appl.Environ.Microbiol.61:4184-4190;Kuyper等,2004,MinimalmetabolicengineeringofSaccharomycescerevisiaeforefficientanaerobicxylosefermentation:aproofofprinciple,F(xiàn)EMSYeastResearch4:655-664;Beall等,1991,ParametricstudiesofethanolproductionfromxyloseandothersugarsbyrecombinantEscherichiacoli,Biotech.Bioeng.38:296-303;Ingram等,1998,Metabolicengineeringofbacteriaforethanolproduction,Biotechnol.Bioeng.58:204-214;Zhang等,1995,MetabolicengineeringofapentosemetabolismpathwayinethanologenicZymomonasmobilis,Science267:240-243;Deanda等,1996,Developmentofanarabinose-fermentingZymomonasmobilisstrainbymetabolicpathwayengineering,Appl.Environ.Microbiol.62:4465-4470;W02003/062430,xyloseisomerase)〇[0373]在一個(gè)優(yōu)選的方面,經(jīng)過遺傳修飾的發(fā)酵微生物是Candidasonorensi。在另一個(gè)優(yōu)選的方面,經(jīng)過遺傳修飾的發(fā)酵微生物是大腸桿菌。在另一個(gè)優(yōu)選的方面,經(jīng)過遺傳修飾的發(fā)酵微生物是產(chǎn)酸克雷伯氏菌。在另一個(gè)優(yōu)選的方面,所述經(jīng)遺傳修飾的發(fā)酵微生物是馬克斯克魯維酵母。在另一個(gè)優(yōu)選的方面,所述經(jīng)遺傳修飾的發(fā)酵微生物是釀酒酵母。在另一個(gè)優(yōu)選的方面,經(jīng)過遺傳修飾的發(fā)酵微生物是運(yùn)動(dòng)發(fā)酵單胞菌。[0374]本領(lǐng)域中公知的是,上述生物體還能用于產(chǎn)生其它物質(zhì),如本文所述。[0375]通常向降解的纖維素材料或水解物加入發(fā)酵微生物,并進(jìn)行約8至約96小時(shí),例如約24至約60小時(shí)發(fā)酵。溫度通常為約26°C至約60°C,例如約32°C或50°C,并且在約PH3至約pH8,例如約pH4-5、6或7。[0376]在一個(gè)方面,對(duì)降解的纖維素材料施用酵母和/或另一種微生物,并進(jìn)行約12至約96小時(shí),如通常為24-60小時(shí)發(fā)酵。在另一個(gè)方面,溫度優(yōu)選為約20°C至約60°C,例如約25°C至約50°C,并且約32°C至約50°C,約32°C至約50°C,并且pH通常為約pH3至約pH7,例如約PH4至約pH7。然而,一些發(fā)酵生物體例如細(xì)菌,具有更高的最適發(fā)酵溫度。酵母或另一種微生物優(yōu)選以約1〇5-1〇12,優(yōu)選約IO7-IOltl,特別是約2xl08活細(xì)胞計(jì)數(shù)每ml發(fā)酵液的量施用。關(guān)于使用酵母進(jìn)行發(fā)酵的進(jìn)一步指導(dǎo)可見于例如"TheAlcoholTextbook"(K.Jacques,T.P.Lyons和D.R.Kelsall編,NottinghamUniversityPress,UnitedKingdoml999),其通過提述并入本文。[0377]發(fā)酵刺激劑可以與本文所述的任何方法組合使用,以進(jìn)一步改進(jìn)發(fā)酵工藝,特別是改進(jìn)發(fā)酵微生物的性能,如,速率增加和乙醇得率。"發(fā)酵刺激劑"指用于發(fā)酵微生物(特別是酵母)生長(zhǎng)的刺激劑。優(yōu)選的用于生長(zhǎng)的發(fā)酵刺激劑包括維生素和礦物質(zhì)。維生素的實(shí)例包括多種維生素、生物素、泛酸(鹽)、煙酸、內(nèi)消旋肌醇(meso-inositol)、硫胺素、吡哆醇(pyridoxine)、對(duì)氨基苯甲酸、葉酸、核黃素和維生素A、B、C、D和E。參見,例如,Alfenore等,ImprovingethanolproductionandviabilityofSaccharomycescerevisiaebyavitaminfeedingstrategyduringfed-batchprocess,Springer-Verlag(2002),其通過提述并入本文。礦物質(zhì)的實(shí)例包括能夠提供營(yíng)養(yǎng)物的礦物質(zhì)和礦物質(zhì)鹽,所述營(yíng)養(yǎng)物包括P、K、Mg、S、Ca、Fe、Zn、Mn和Cu。[0378]發(fā)酵產(chǎn)物:發(fā)酵產(chǎn)物可以是源自發(fā)酵的任何物質(zhì)。發(fā)酵產(chǎn)物可以是,不限于,醇(例如,阿拉伯醇、正丁醇、異丁醇、乙醇、甘油、甲醇、乙二醇、1,3-丙二醇(丙二醇)、丁二醇、丙三醇、山梨醇和木糖醇);烷烴(例如戊烷、己烷、庚烷、辛烷、壬烷、癸烷、i^一烷和十二烷);環(huán)烷烴(例如環(huán)戊烷、環(huán)己烷、環(huán)庚烷、和環(huán)辛烷);烯烴(例如戊烯、己烯、庚烯和辛烯);氨基酸(例如,天冬氨酸、谷氨酸、甘氨酸、賴氨酸、絲氨酸和蘇氨酸);氣體(例如,甲烷、氫氣(H2)、二氧化碳(CO2)和一氧化碳(CO));異戊二烯;酮(例如,丙酮);有機(jī)酸(例如,乙酸、醋酮酸、己二酸、抗壞血酸、檸檬酸、2,5-二酮-D-葡糖酸、甲酸、反丁烯二酸、葡糖二酸、葡糖酸、葡糖醛酸、戊二酸、3-羥基丙酸、衣康酸、乳酸、蘋果酸、丙二酸、草酸、草酰乙酸、丙酸、琥珀酸和木糖酸);和聚酮化合物。發(fā)酵產(chǎn)物還可以是作為高價(jià)值產(chǎn)品的蛋白質(zhì)。[0379]在一個(gè)優(yōu)選的方面,發(fā)酵產(chǎn)物是醇??衫斫獾氖牵g(shù)語(yǔ)"醇"包括包含一個(gè)或多個(gè)羥基基團(tuán)的物質(zhì)。在更優(yōu)選的方面,所述醇是正丁醇。在另一個(gè)更優(yōu)選的方面,所述醇是異丁醇。在另一個(gè)更優(yōu)選的方面,所述醇是乙醇。在另一個(gè)更優(yōu)選的方面,所述醇是甲醇。在另一個(gè)更優(yōu)選的方面,所述醇是阿拉伯糖醇。在另一個(gè)更優(yōu)選的方面,所述醇是丁二醇。在另一個(gè)更優(yōu)選的方面,所述醇是乙二醇。在另一個(gè)更優(yōu)選的方面,所述醇是丙三醇(glycerin)。在另一個(gè)更優(yōu)選的方面,所述醇是甘油(glycerol)。在另一個(gè)更優(yōu)選的方面,所述醇是1,3-丙二醇。在另一個(gè)更優(yōu)選的方面,所述醇是山梨醇。在另一個(gè)更優(yōu)選的方面,所述醇是木糖醇。參見,例如,Gong,C.S.,Cao,N.J.,Du,J.,和Tsao,G.T.,1999,Ethanolproductionfromrenewableresources,于AdvancesinBiochemicalEngineering/Biotechnology,Scheper,T.編,Springer-VerlagBerlinHeidelberg,Germany,65:207-241;Silveira,M.M·,和Jonas,R·,2002,Thebiotechnologicalproductionofsorbitol,Appl.Microbiol.Biotechnol.59:400-408;Nigam,P.和Singh,D.,1995,Processesforfermentativeproductionofxylitol-asugarsubstitute,ProcessBiochemistry30(2):117-124;Ezeji,T.C.,Qureshi,N.和Blaschek,H.P.,2003,Productionofacetone,butanolandethanolbyClostridiumbeijerinckiiBAlOlandinsiturecoverybygasstripping,WorldJournalofMicrobiologyandBiotechnologyl9(6):595-603。[0380]在另一個(gè)優(yōu)選的方面,所述發(fā)酵產(chǎn)物是烷烴。所述烷烴是未支化或支化的烷烴。在另一個(gè)更優(yōu)選的方面,所述烷烴是戊烷。在另一個(gè)更優(yōu)選的方面,所述烷烴是己烷。在另一個(gè)更優(yōu)選的方面,所述烷烴是庚烷。在另一個(gè)更優(yōu)選的方面,所述烷烴是辛烷。在另一個(gè)更優(yōu)選的方面,所述烷烴是壬烷。在另一個(gè)更優(yōu)選的方面,所述烷烴是癸烷。在另一個(gè)更優(yōu)選的方面,所述烷烴是十一烷。在另一個(gè)更優(yōu)選的方面,所述烷烴是十二烷。[0381]在另一個(gè)優(yōu)選的方面,所述發(fā)酵產(chǎn)物是環(huán)烷烴。在另一個(gè)更優(yōu)選的方面,所述環(huán)烷烴是環(huán)戊烷。在另一個(gè)更優(yōu)選的方面,所述環(huán)烷烴是環(huán)己烷。在另一個(gè)更優(yōu)選的方面,所述環(huán)烷烴是環(huán)庚烷。在另一個(gè)更優(yōu)選的方面,所述環(huán)烷烴是環(huán)辛烷。[0382]在另一個(gè)優(yōu)選的方面,所述發(fā)酵產(chǎn)物是烯烴。所述烯烴可為未支化或支化的烯烴。在另一個(gè)更優(yōu)選的方面,所述烯烴是戊烯。在另一個(gè)更優(yōu)選的方面,所述烯烴是己烯。在另一個(gè)更優(yōu)選的方面,所述烯烴是庚烯。在另一個(gè)更優(yōu)選的方面,所述烯烴是辛烯。[0383]在另一個(gè)優(yōu)選的方面,所述發(fā)酵產(chǎn)物是氨基酸。在另一個(gè)更優(yōu)選的方面,所述有機(jī)酸是天冬氨酸。在另一個(gè)更優(yōu)選的方面,所述氨基酸是谷氨酸。在另一個(gè)更優(yōu)選的方面,所述氨基酸是甘氨酸。在另一個(gè)更優(yōu)選的方面,所述氨基酸是賴氨酸。在另一個(gè)更優(yōu)選的方面,所述氨基酸是絲氨酸。在另一個(gè)更優(yōu)選的方面,所述氨基酸是蘇氨酸。參見,例如,Richard,A.和Margaritis,A·,2004,Empiricalmodelingofbatchfermentationkineticsforpoly(glutamicacid)productionandothermicrobialbiopolymers,BiotechnologyandBioengineering87(4):501_515〇[0384]在另一個(gè)優(yōu)選的方面,所述物質(zhì)是氣體。在另一個(gè)更優(yōu)選的方面,所述氣體是甲烷。在另一個(gè)更優(yōu)選的方面,所述氣體是H2。在另一個(gè)更優(yōu)選的方面,所述氣體是CO2。在另一個(gè)更優(yōu)選的方面,所述氣體是C0。參見,例如,Kataoka,N.,A.Miyaj和Κ·Kiriyama,1997,Studiesonhydrogenproductionbycontinuousculturesystemofhydrogen-producinganaerobicbacteria,WaterScienceandTechnology36(6-7):41-47;和Gunaseelan,V.N.,于BiomassandBioenergyjVol.13(1-2),pp83-114,1997,Anaerobicdigestionofbiomassformethaneproduction:Areview。[0385]在另一個(gè)優(yōu)選的方面,所述發(fā)酵產(chǎn)物是異戊二烯。[0386]在另一個(gè)優(yōu)選的方面,所述發(fā)酵產(chǎn)物是酮。應(yīng)理解的是,術(shù)語(yǔ)"酮"涵蓋了含有一個(gè)或多個(gè)酮模塊的酮。在另一個(gè)更優(yōu)選的方面,所述酮是丙酮。參見,例如Qureshi和Blaschek,2003,見上文。[0387]在另一個(gè)優(yōu)選的方面,所述發(fā)酵產(chǎn)物是有機(jī)酸。在另一個(gè)更優(yōu)選的方面,所述有機(jī)酸是乙酸。在另一個(gè)更優(yōu)選的方面,所述有機(jī)酸是醋酮酸。在另一個(gè)更優(yōu)選的方面,所述有機(jī)酸是己二酸。在另一個(gè)更優(yōu)選的方面,所述有機(jī)酸是抗壞血酸。在另一個(gè)更優(yōu)選的方面,所述有機(jī)酸是朽1檬酸。在另一個(gè)更優(yōu)選的方面,所述有機(jī)酸是2,5-二酮-D-葡糖酸。在另一個(gè)更優(yōu)選的方面,所述有機(jī)酸是甲酸。在另一個(gè)更優(yōu)選的方面,所述有機(jī)酸是反丁烯二酸。在另一個(gè)更優(yōu)選的方面,所述有機(jī)酸是葡糖二酸。在另一個(gè)更優(yōu)選的方面,所述有機(jī)酸是葡糖酸。在另一個(gè)更優(yōu)選的方面,所述有機(jī)酸是葡糖醛酸。在另一個(gè)更優(yōu)選的方面,所述有機(jī)酸是戊二酸。在另一個(gè)優(yōu)選的方面,所述有機(jī)酸是3-羥基丙酸。在另一個(gè)更優(yōu)選的方面,所述有機(jī)酸是衣康酸。在另一個(gè)更優(yōu)選的方面,所述有機(jī)酸是乳酸。在另一個(gè)更優(yōu)選的方面,所述有機(jī)酸是蘋果酸。在另一個(gè)更優(yōu)選的方面,所述有機(jī)酸是丙二酸。在另一個(gè)更優(yōu)選的方面,所述有機(jī)酸是草酸。在另一個(gè)更優(yōu)選的方面,所述有機(jī)酸是丙酸。在另一個(gè)更優(yōu)選的方面,所述有機(jī)酸是琥珀酸。在另一個(gè)更優(yōu)選的方面,所述有機(jī)酸是木糖酸。參見,例如,Chen,R.和Lee,Y.Y.,1997,Membrane-mediatedextractivefermentationforlacticacidproductionfromcellulosicbiomass,Appl.Biochem.Biotechnol.63-65:435-448。[0388]在另一個(gè)優(yōu)選的方面,所述物質(zhì)是聚酮化合物。[0389]Μ--可以使用本領(lǐng)域已知的任何方法,任選地從發(fā)酵培養(yǎng)基回收發(fā)酵產(chǎn)物,所述方法包括,但不限于,層析、電泳方法、差示溶解度、蒸餾或提取。例如,通過常規(guī)蒸餾方法從發(fā)酵的纖維素材料分離并純化醇??梢垣@得純度高達(dá)約96vol.%的乙醇,其能用作,例如,燃料乙醇、飲用乙醇(即,可飲用的中性含酒精飲料),或工業(yè)乙醇。[0390]信號(hào)肽[0391]本發(fā)明還涉及編碼信號(hào)肽的分離的多核苷酸,所述信號(hào)肽包含或組成為SEQIDN0:2的氨基酸1至17,SEQIDN0:4的氨基酸1至20,SEQIDN0:6的氨基酸1至21,或SEQIDN0:8的氨基酸1至17。所述多核苷酸可進(jìn)一步包含編碼蛋白的基因,其可操作地連接于信號(hào)肽。所述蛋白優(yōu)選對(duì)于所述信號(hào)肽是外源的。在一個(gè)方面,編碼所述信號(hào)肽的多核苷酸是SEQIDNO:1的核苷酸1至51。在另一個(gè)方面,編碼所述信號(hào)肽的多核苷酸是SEQIDNO:3的核苷酸1至60。在另一個(gè)方面,編碼所述信號(hào)肽的多核苷酸是SEQIDNO:5的核苷酸1至63。在另一個(gè)方面,編碼所述信號(hào)肽的多核苷酸是SEQIDNO:7的核苷酸1至51。[0392]本發(fā)明還涉及包含此種多核苷酸的核酸構(gòu)建體、表達(dá)載體和重組宿主細(xì)胞。[0393]本發(fā)明還涉及用于產(chǎn)生蛋白質(zhì)的方法,包括:(a)培養(yǎng)包含可操作連接的此種多核苷酸與編碼所述蛋白的基因的重組宿主細(xì)胞;和任選地(b)回收所述蛋白質(zhì)。[0394]所述蛋白質(zhì)對(duì)于宿主細(xì)胞可以是天然的或異源的。術(shù)語(yǔ)"蛋白質(zhì)"在本文的意思不是指特定長(zhǎng)度的編碼產(chǎn)物,并且因此涵蓋肽、寡肽和多肽。術(shù)語(yǔ)"蛋白質(zhì)"還涵蓋經(jīng)組合以形成編碼產(chǎn)物的兩種以上多肽。所述蛋白質(zhì)還包括雜合多肽和融合多肽。[0395]優(yōu)選蛋白質(zhì)是激素、酶、受體或其部分、抗體或其部分,或報(bào)告蛋白(reporter)。例如,所述蛋白質(zhì)可為水解酶、異構(gòu)酶、連接酶、裂合酶(lyase)、氧化還原酶或轉(zhuǎn)移酶,例如α-半乳糖苷酶、α-葡糖苷酶、氨肽酶、淀粉酶、β-半乳糖苷酶、β-葡糖苷酶、β-木糖苷酶、糖酶、羧肽酶、過氧化氫酶、纖維二糖水解酶、纖維素酶、殼多糖酶、角質(zhì)酶、環(huán)糊精糖基轉(zhuǎn)移酶、脫氧核糖核酸酶、內(nèi)切葡聚糖酶、酯酶、葡糖淀粉酶、轉(zhuǎn)化酶、漆酶、脂肪酶、甘露糖苷酶、變聚糖酶(mutanase)、氧化酶、果膠分解酶、過氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、轉(zhuǎn)谷氨酰胺酶、或木聚糖酶。[0396]基因可以從任何原核、真核或其它來源獲得。[0397]通過以下實(shí)施例進(jìn)一步對(duì)本發(fā)明進(jìn)行描述,但不應(yīng)將其理解為對(duì)本發(fā)明范圍的限制。實(shí)施例[0398]菌株[0399]真菌菌株NN044758通過在45°C用PDA培養(yǎng)基進(jìn)行的稀釋平板方法分離自從中國(guó)收集的土壤樣品。然后將其通過將單個(gè)分生孢子轉(zhuǎn)移至YG瓊脂平板上來純化。基于形態(tài)學(xué)特征和ITSrDNA序列二者將菌株NN044758鑒定為樟絨枝霉。[0400]真菌菌株NN000308購(gòu)自真菌菌種保藏中心(CentraalbureauVoorSchimmelcultures),命名為CBS174.70?;谛螒B(tài)學(xué)特征和ITSrDNA序列二者將菌株NN000308鑒定為嗜熱棒囊殼(之前鑒定為嗜熱梭孢殼(Thielaviathermophila),同種異名弗格斯毀絲霉(Myceliophthorafergusii))。[0401]培養(yǎng)基[0402]PDA培養(yǎng)基由39克的馬鈴薯右旋糖瓊脂和去離子水加至1升構(gòu)成。[0403]YG瓊脂平板由5.Og的酵母提取物,10.Og的葡萄糖,20.Og的瓊脂,和去離子水加至1升構(gòu)成。[0404]YPG培養(yǎng)基由去離子水中的0.4%的酵母提取物,0.1%的KH2PO4,0.05%的MgSO4·7H20,和1.5%葡萄糖構(gòu)成。[0405]YPM培養(yǎng)基由去離子水中的1%的酵母提取物,2%的蛋白胨,和2%的麥芽糖構(gòu)成。[0406]基本培養(yǎng)基平板由342g的蔗糖,20ml的鹽溶液,20g的瓊脂,和去離子水加至1升構(gòu)成。鹽溶液由2.6%KC1,2.6%MgSO4·7H20,7.6%KH2PO4,2ppmNa2B4O7·IOH2O,20ppmCuSO4·5H20,40ppmFeSO4·7H20,40ppmMnSO4·2H20,40ppmNa2MoO4·2H20,和400ppmZnSO4·7H20構(gòu)成。[0407]實(shí)施例I:棒續(xù)枝霉基因組DNA提取[0408]將樟絨枝霉菌株NN044758接種于PDA平板上并在45°C避光溫育3日。將數(shù)個(gè)菌絲體-PDA栓接種入含有IOOml的YPG培養(yǎng)基的500ml搖瓶。將瓶在45°C在160rpm振蕩下溫育3日。菌絲體通過經(jīng)由MIRACLOTH?(Calbiochem,LaJolla,CA,USA)過濾來收集并在液氮下凍結(jié)。將凍結(jié)的菌絲體通過研缽和件磨碎至細(xì)微粉末,并使用Large-ScaleColumnFungalDNAout(BAOMANBIOTECHNOLOGY,Shanghai,China)依照生產(chǎn)商的指不分離基因組DNA。[0409]實(shí)施例2:基因組測(cè)序、匯編和注釋[0410]將提取的基因組DNA樣品遞送至BeijingGenomeInstitute(BGI,Shenzhen,China)以供使用ILLUMINA?GA2System(Illumina,Inc.,SanDiego,CA,USA)的基因組測(cè)序。將粗讀取在BGI使用SOAPdenovo程序(Li等,2010,GenomeResearch20(2):265-72)進(jìn)行匯編。將匯編的序列使用標(biāo)準(zhǔn)生物信息學(xué)方法進(jìn)行分析以供基因鑒定和功能預(yù)測(cè)。使用geneID(Parra等,2000,GenomeResearchlO(4):511-515)進(jìn)行基因預(yù)測(cè)。使用Blastall版本2·2·10(Altschul等,1990,J.Mol.Biol.215(3):403-410,NationalCenterforBiotechnologyInformation(NCBI),Bethesda,MD,USA)和HMMER版本2.I.I(NationalCenterforBiotechnologyInformation(NCBI),Bethesda,MD,USA)基于結(jié)構(gòu)同源性預(yù)測(cè)功能。GH7家族纖維二糖水解酶多肽通過Blast結(jié)果的分析直接鑒定出。使用Agene程序(Munch和Krogh,2006,BMCBioinformatics7:263)和SignalP程序(Nielsen等,1997,ProteinEngineeringlO:1-6)鑒定起始密碼子。進(jìn)一步使用SignalP程序預(yù)測(cè)信號(hào)肽。使用Pepstats(Rice等,2000,TrendsGenet.16(6):276-277)預(yù)測(cè)推導(dǎo)的氨基酸序列的等電點(diǎn)和分子量。[0411]實(shí)施例3:編碼具有纖維二糖水解酶(CBH)活性的多肽的樟絨枝霉基因組序列的表征[0412]樟絨枝霉多肽編碼序列的基因組DNA序列(SEQIDNO:1)和推導(dǎo)的氨基酸序列(SEQIDN0:2)示于圖1。編碼序列為1457bp,包含終止密碼子,其由80bp(核苷酸613至692)的一個(gè)內(nèi)含子中斷。不含內(nèi)含子和終止密碼子的成熟多肽編碼序列的G+C含量為52.38%。編碼的預(yù)測(cè)的蛋白是458個(gè)氨基酸。使用SignalP程序(Nielsen等,1997,ProteinEngineeringlO:1-6),預(yù)測(cè)了17個(gè)殘基的信號(hào)肽。預(yù)測(cè)的成熟蛋白含有441個(gè)氨基酸,具有47890.24道爾頓的預(yù)測(cè)的分子量和4.12的預(yù)測(cè)的等電點(diǎn)。通過將氨基酸序列使用BLAST與所有CAZY定義的亞家族模塊亞序列比對(duì)(Cantarel等,2009,NucleicAcidsRes.37:D233-238),其中使用亞家族內(nèi)單個(gè)最顯著的比對(duì)來預(yù)測(cè)GH7域,預(yù)測(cè)出纖維二糖水解酶催化域?yàn)榘被?8至458。[0413]使用Needleman和Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48:443-453)以10的缺口開放罰分、0.5的缺口延伸罰分和EBL0SUM62矩陣確定了氨基酸序列的比較性逐對(duì)全局比對(duì)。比對(duì)顯示編碼纖維二糖水解酶多肽的樟絨枝霉編碼序列的氨基酸序列的成熟部分與來自構(gòu)巢裸孢殼的纖維二糖水解酶A的推導(dǎo)的氨基酸序列(登錄號(hào):UNIPR0T:Q5B2Q4)具有69.23%同一性。[0414]實(shí)施例4:從基因組DNA克隆樟絨枝霉GH7纖維二糖水解酶(CBH)基因[0415]選擇CH7CBH基因GH7_ZY582279_485進(jìn)行克隆。[0416]基于從基因組測(cè)序獲得的DNA信息(SEQIDNO:1)設(shè)計(jì)了下表1所示的寡核苷酸引物以從樟絨枝霉NN044758的基因組DNA擴(kuò)增CBH基因。引物由Invitrogen,Beijing,China合成。[0417]表1:引物[0418]【權(quán)利要求】1.一種具有纖維二糖水解酶活性的分離的多肽,其選自下組:(a)多肽,其與SEQIDN0:2的成熟多肽具有至少70%,例如至少72%,至少74%,至少75%,至少77%,至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性;多肽,其與SEQIDNO:4的成熟多肽具有至少88%,例如至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性;多肽,其與SEQIDNO:6的成熟多肽具有至少66%,例如至少68%,至少70%,至少75%,至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性;多肽,其與SEQIDN0:8的成熟多肽具有至少81%,例如至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性;(b)多肽,其由多核苷酸編碼,所述多核苷酸在至少中等嚴(yán)格條件下與以下雜交:(i)SEQIDNO:1的成熟多肽編碼序列,SEQIDNO:3的成熟多肽編碼序列,SEQIDNO:5的成熟多肽編碼序列,或SEQIDN0:7的成熟多肽編碼序列,(ii)SEQIDN0:1的cDNA序列,SEQIDN0:3的cDNA序列,SEQIDN0:5的cDNA序列,或SEQIDN0:7的cDNA序列,或(iii)(i)或(ii)的全長(zhǎng)互補(bǔ)物;(c)多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:1或其cDNA序列的成熟多肽編碼序列具有至少70%,例如至少72%,至少74%,至少75%,至少77%,至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性;多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDN0:3或其cDNA序列的成熟多肽編碼序列具有至少88%,例如至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性;多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:5或其cDNA序列的成熟多肽編碼序列具有至少66%,例如至少68%,至少70%,至少75%,至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性;多肽,其由多核苷酸編碼,所述多核苷酸與或SEQIDN0:7或其cDNA序列的成熟多肽編碼序列具有至少81%,例如至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性;(d)SEQIDNO:2的成熟多肽,SEQIDNO:4的成熟多肽,SEQIDNO:6的成熟多肽,或SEQIDN0:8的成熟多肽在一個(gè)或多個(gè)(例如幾個(gè))位置包含取代、缺失和/或插入的變體;和(e)(a)、(b)、(c)或(d)的多肽具有纖維二糖水解酶活性的片段。2.權(quán)利要求1的多肽,其包含或組成為SEQIDN0:2,SEQIDN0:4,SEQIDN0:6,或SEQIDNO:8;或包含或組成為SEQIDNO:2的成熟多肽,SEQIDNO:4的成熟多肽,SEQIDN0:6的成熟多肽,或SEQIDN0:8的成熟多肽。3.-種分離的多肽,其包含催化域,所述催化域選自下組:(a)催化域,其與SEQIDNO:2的氨基酸18至458具有至少70%,例如至少72%,至少74%,至少75%,至少77%,至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性;催化域,其與SEQIDN0:4的氨基酸21至450具有至少88%,例如至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性;催化域,其與SEQIDN0:6的氨基酸22至457具有至少66%,例如至少68%,至少70%,至少75%,至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性;催化域,其與SEQIDN0:8的氨基酸21至461具有至少81%,例如至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性;(b)催化域,其由多核苷酸編碼,所述多核苷酸在中等、中等-高、高、或非常高嚴(yán)格條件下與以下雜交:(i)SEQIDN0:1的核苷酸52至1454,SEQIDN0:3的核苷酸61至1733,5£010勵(lì):5的核苷酸64至1782,或5£010勵(lì):7的核苷酸52至1460,(^)其〇0嫩序列,或(iii)(i)或(ii)的全長(zhǎng)互補(bǔ)物;(c)催化域,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:1的核苷酸52至1454,或其cDNA序列具有至少70%,例如至少72%,至少74%,至少75%,至少77%,至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性;或催化域,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:3的核苷酸61至1733,或其cDNA序列具有至少88%,例如至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性;催化域,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:5的核苷酸64至1782,或其cDNA序列具有至少66%,例如至少68%,至少70%,至少75%,至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性;或催化域,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:7的核苷酸52至1460,或其cDNA序列具有至少81%,例如至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性;(d)SEQIDNO:2的氨基酸18至458,SEQIDNO:4的氨基酸21至450,SEQIDNO:6的氨基酸22至457,或SEQIDNO:8的氨基酸21至461在一個(gè)或多個(gè)位置包含取代、缺失和/或插入的變體;和(e)(a)、(b)、(c)、或(d)的催化域具有纖維二糖水解酶活性的變體。4.一種分離的多肽,其包含糖結(jié)合域,所述糖結(jié)合域選自下組:(a)糖結(jié)合域,其與SEQIDN0:8的氨基酸486至521具有至少81%,例如至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性;(b)糖結(jié)合域,其由多核苷酸編碼,所述多核苷酸在中等、中等-高、高、或非常高嚴(yán)格條件下與以下雜交:(i)SEQIDN0:7的核苷酸1533至1640,(ii)其cDNA序列,或(iii)(i)或(ii)的全長(zhǎng)互補(bǔ)物;(c)糖結(jié)合域,其由多核苷酸編碼,所述多核苷酸與SEQIDN0:7的核苷酸1533至1640或其cDNA序列具有至少81%,例如至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性;(d)SEQIDNO:8的氨基酸486至521在一個(gè)或多個(gè)位置包含取代、缺失和/或插入的變體;和(e)(a)、(b)、(c)、或⑷具有糖結(jié)合活性的片段。5.-種組合物,其包含權(quán)利要求1-4任一項(xiàng)的多肽。6.-種分離的多核苷酸,其編碼權(quán)利要求1-4任一項(xiàng)的多肽。7.-種重組宿主細(xì)胞,其包含權(quán)利要求6的多核苷酸,所述多核苷酸可操作地連接于一個(gè)或多個(gè)指導(dǎo)所述多肽的產(chǎn)生的調(diào)控序列。8.-種產(chǎn)生權(quán)利要求1-4任一項(xiàng)的多肽的方法,其包括:(a)在有助于所述多肽產(chǎn)生的條件下培養(yǎng)細(xì)胞,所述細(xì)胞以其野生型形式產(chǎn)生所述多肽;和任選地(b)回收所述多肽。9.一種產(chǎn)生具有纖維二糖水解酶活性的多肽的方法,其包括:(a)在有助于所述多肽產(chǎn)生的條件下培養(yǎng)權(quán)利要求7的宿主細(xì)胞;和任選地(b)回收所述多肽。10.-種轉(zhuǎn)基因植物、植物部分或植物細(xì)胞,其用編碼權(quán)利要求1-4任一項(xiàng)的多肽的多核苷酸轉(zhuǎn)化。11.一種產(chǎn)生具有纖維二糖水解酶活性的多肽的方法,其包括:(a)在有助于所述多肽產(chǎn)生的條件下培養(yǎng)權(quán)利要求10的轉(zhuǎn)基因植物或植物細(xì)胞;和任選地(b)回收所述多肽。12.-種產(chǎn)生親本細(xì)胞的突變體的方法,所述方法包括使編碼權(quán)利要求1-4任一項(xiàng)的多肽的多核苷酸失活,導(dǎo)致突變體與親本細(xì)胞相比產(chǎn)生更少的所述多肽。13.-種分離的多核苷酸,其編碼信號(hào)肽,所述信號(hào)肽包含或組成為SEQIDN0:2的氨基酸1至17,SEQIDN0:4的氨基酸1至20,SEQIDN0:6的氨基酸1至21,或SEQIDN0:8的氨基酸1至17。14.一種產(chǎn)生蛋白質(zhì)的方法,其包括:(a)在有助于所述蛋白質(zhì)產(chǎn)生的條件下培養(yǎng)重組宿主細(xì)胞,所述重組宿主細(xì)胞包含與權(quán)利要求13的多核苷酸可操作連接的編碼蛋白質(zhì)的基因,其中所述基因?qū)τ诰幋a信號(hào)肽的多核苷酸而言是外源的;和任選地(b)回收所述多肽。15.-種全培養(yǎng)液配制物或細(xì)胞培養(yǎng)組合物,其包含權(quán)利要求1-4任一項(xiàng)的多肽。16.-種降解或轉(zhuǎn)化纖維素材料的方法,其包括:在權(quán)利要求1-4任一項(xiàng)的具有纖維二糖水解酶活性的多肽存在下用酶組合物處理纖維素材料。17.-種產(chǎn)生發(fā)酵產(chǎn)物的方法,其包括:(a)在權(quán)利要求1-4任一項(xiàng)的具有纖維二糖水解酶活性的多肽存在下,用酶組合物糖化纖維素材料;(b)用一種或多種發(fā)酵微生物發(fā)酵經(jīng)糖化的纖維素材料以產(chǎn)生發(fā)酵產(chǎn)物;和(c)從所述發(fā)酵中回收所述發(fā)酵產(chǎn)物。18.-種發(fā)酵纖維素材料的方法,其包括:用一種或多種發(fā)酵微生物發(fā)酵纖維素材料,其中所述纖維素材料是在權(quán)利要求1-4任一項(xiàng)的具有纖維二糖水解酶活性的多肽的存在下用酶組合物糖化的。【文檔編號(hào)】C12N1/15GK104350148SQ201280067149【公開日】2015年2月11日申請(qǐng)日期:2012年11月15日優(yōu)先權(quán)日:2011年11月15日【發(fā)明者】湯嵐,段俊欣,張羽,劉曄申請(qǐng)人:諾維信股份有限公司