
相關(guān)申請的交叉引用本申請涉及并要求于2014年10月27日提交的美國臨時(shí)專利申請序列號62/069,120的優(yōu)先權(quán)權(quán)益,該美國臨時(shí)專利申請的全部披露內(nèi)容通過引用結(jié)合在此。本發(fā)明組合物和方法涉及可從禾生小叢殼獲得的β-葡糖苷酶多肽、編碼β-葡糖苷酶多肽的多核苷酸、及其制造和使用方法。例如,包含β-葡糖苷酶多肽的配制品和組合物可以用于降解或水解木質(zhì)纖維素生物質(zhì)。以電子方式提交的序列表的引用與本申請一起以電子方式提交的處于ascii文本文件形式的序列表的內(nèi)容(名稱:nb40751wopct_sequencelisting_st25.txt;大?。?8,606字節(jié),以及創(chuàng)建日期:2015年10月22日)通過引用以其全文結(jié)合在此。
背景技術(shù):
:纖維素和半纖維素是通過光合作用產(chǎn)生的最豐富的植物材料。它們可以被許多微生物(例如,細(xì)菌、酵母和真菌)降解和用作能源,這些微生物產(chǎn)生能夠?qū)⒕酆衔锏孜锼獬蓡误w糖的細(xì)胞外酶(阿羅(aro)等人,生物化學(xué)雜志(j.biol.chem.),276:24309-24314,2001)。由于不可再生資源方法的局限性,纖維素成為主要可再生能源的潛力巨大(克利須那神(krishna)等人,生物資源技術(shù)(bioresourcetech.),77:193-196,2001)。通過生物過程有效利用纖維素是克服食物、飼料和燃料短缺的一種方法(大宮(ohmiya)等人,生物技術(shù)與基因工程評論(biotechnol.gen.engineerrev.),14:365-414,1997)。纖維素酶是水解纖維素(包括β-1,4-葡聚糖或β-d-糖苷鍵)從而導(dǎo)致形成葡萄糖、纖維二糖、纖維寡糖等的酶。纖維素酶傳統(tǒng)上分為三大類:內(nèi)切葡聚糖酶(ec3.2.1.4)(“eg”),外切葡聚糖酶或纖維二糖水解酶(ec3.2.1.91)(“cbh”)和β-葡糖苷酶([β]-d-葡糖苷葡糖水解酶;ec3.2.1.21)(“bg”)(諾爾斯(knowles)等人,tibtech5:255-261,1987;和斯庫萊茵(schulein),酶學(xué)方法(methodsenzymol.),160:234-243,1988)。內(nèi)切葡聚糖酶主要作用于纖維素纖維的無定形部分,而纖維二糖水解酶也能夠降解結(jié)晶纖維素(內(nèi)維爾萊恩(nevalainen)和彭蒂萊(penttila),真菌門(mycota),303-319,1995)。因此,纖維素酶體系中的纖維二糖水解酶的存在是高效溶解結(jié)晶纖維素所必需的(蘇爾內(nèi)基(suurnakki)等人,纖維素(cellulose),7:189-209,2000)。β-葡糖苷酶用于從纖維二糖、纖維寡糖和其他葡糖苷釋放d-葡萄糖單元(弗里爾(freer),生物化學(xué)雜志(j.biol.chem.),268:9337-9342,1993)。已知纖維素酶由大量細(xì)菌、酵母和真菌產(chǎn)生。某些真菌產(chǎn)生能夠降解結(jié)晶形式纖維素的完整纖維素酶系統(tǒng)。這些真菌可以被發(fā)酵以生產(chǎn)纖維素酶或纖維素酶混合物組。還可以將相同的真菌和其他真菌工程化,以生產(chǎn)或過度生產(chǎn)某些纖維素酶,從而得到包括不同類型或比例的纖維素酶的纖維素酶混合物。還可以將真菌工程化,這樣使得它們通過發(fā)酵大量生產(chǎn)各種纖維素酶。絲狀真菌發(fā)揮特殊作用,因?yàn)樵S多酵母,如釀酒酵母,缺乏以其天然狀態(tài)水解纖維素的能力(參見,例如,伍德(wood)等人,酶學(xué)方法(methodsinenzymology),160:87-116,1988)。cbh、eg和bg的真菌纖維素酶分類可以進(jìn)一步擴(kuò)大,以在每個(gè)分類中包括多個(gè)組分。例如,已經(jīng)從包括里氏木霉(又稱為紅褐肉座菌(hypocreajecorina))的各種真菌來源分離出多種cbh、eg和bg,這些真菌來源包含以下已知基因:兩種cbh,即,cbhi(“cbh1”)和cbhii(“cbh2”),至少8種eg,即,egi、egii、egiii、egiv、egv、egvi、egvii和egviii,以及至少五種bg,即,bg1、bg2、bg3、bg4、bg5和bg7(福爾曼(foreman)等人(2003),生物化學(xué)雜志(j.biol.chem.)278(34):31988-31997)。egiv、egvi和egviii也具有木葡聚糖酶活性。為了高效地將結(jié)晶纖維素轉(zhuǎn)化為葡萄糖,需要包括來自每個(gè)cbh、eg和bg分類的組分的完整纖維素酶系統(tǒng),其中分離的組分在水解結(jié)晶纖維素方面效果較差((filho)等人,加拿大微生物學(xué)雜志(can.j.microbiol.),42:1-5,1996)。內(nèi)切-1,4-β-葡聚糖酶(eg)和外切纖維二糖水解酶(cbh)催化纖維素水解為纖維寡糖(纖維二糖為主要成分),而β-葡糖苷酶(bgl)將寡糖轉(zhuǎn)化為葡萄糖。在來自不同分類的纖維素酶組分之間已經(jīng)觀察到了協(xié)同關(guān)系。具體而言,eg型纖維素酶和cbh型纖維素酶協(xié)同相互作用以高效降解纖維素。β-葡糖苷酶起著從纖維寡糖如纖維二糖釋放出葡萄糖的重要的作用,該β-葡糖苷酶對用于將糖發(fā)酵成乙醇的微生物,例如像酵母是有毒的;并且該β-葡糖苷酶還抑制內(nèi)切葡聚糖酶和纖維二糖水解酶的活性,使得它們當(dāng)進(jìn)一步水解結(jié)晶纖維素時(shí)而無效。鑒于β-葡糖苷酶在纖維素材料的降解或轉(zhuǎn)化中發(fā)揮的重要作用,具有改進(jìn)的水解纖維素原料的效力或能力的β-葡糖苷酶同系物的發(fā)現(xiàn)、表征、制備和應(yīng)用是所期望和有利的。概述可從禾生小叢殼獲得的β-葡糖苷酶及其用途纖維素的酶水解仍然是從材料的木質(zhì)纖維素生物質(zhì)原料進(jìn)行生物生產(chǎn)的主要限制步驟之一,該木質(zhì)纖維素生物質(zhì)原料可以是纖維素糖和/或下游產(chǎn)物。β-葡糖苷酶在催化該過程的最后一步,即從抑制的纖維二糖中釋放出葡萄糖中發(fā)揮重要作用,并且因此其活性和效力直接有助于酶木質(zhì)纖維素生物質(zhì)轉(zhuǎn)化的總體效力,并且從而有利于使用酶溶液的成本。因此,對于尋找、制造和使用新的和更有效的β-葡糖苷酶受到很大關(guān)注。雖然已知多種β-葡糖苷酶,包括來自里氏木霉或紅褐肉座菌的β-葡糖苷酶bgl1、bgl3、bgl5、bgl7等(克羅克瓦(korotkova)o.g.等人,生物化學(xué)(biochemistry)74:569-577(2009);肖夫(chauve),m.等人,生物燃料技術(shù)(biotechnol.biofuels)3:3-3(2010)),來自灰腐質(zhì)霉高溫變種的β-葡糖苷酶(納西門托(nascimento),c.v.等人,微生物學(xué)雜志(j.microbiol.)48,53-62(2010));來自多粉側(cè)孢霉(sporotrichumpulverulentum)的β-葡糖苷酶(德什潘德(deshpande)v.等人,酶學(xué)方法(methodsenzymol.),160:415-424(1988));米曲霉的β-葡糖苷酶(福田(fukuda)t.等人,應(yīng)用微生物學(xué)和生物技術(shù)(appl.microbiol.biotechnol.)76:1027-1033(2007)),來自嗜熱籃狀菌cbs236.58的β-葡糖苷酶(納克哈拉特(nakkharat)p.等人,生物技術(shù)雜志(j.biotechnol.),123:304-313(2006)),來自埃默森籃狀菌的β-葡糖苷酶(默里(murray)p.等人,蛋白表達(dá)與純化(proteinexpr.purif.)38:248-257(2004)),但到目前為止,里氏木霉β-葡糖苷酶bgl1和黑曲霉β-葡糖苷酶sp188被認(rèn)為是進(jìn)行其他β-葡糖苷酶的活性和性能評估的基準(zhǔn)β-葡糖苷酶。據(jù)報(bào)道,里氏木霉bgl1比黑曲霉β-葡糖苷酶sp188具有更高的比活性,但前者可能分泌不良,而后者對葡萄糖抑制更敏感(肖夫(chauve),m.等人,生物燃料技術(shù)(biotechnol.biofuels),3(1):3(2010))。本發(fā)明組合物和方法的一個(gè)方面是應(yīng)用或使用從真菌物種禾生小叢殼(無性型禾生刺盤孢)分離的高活性β-葡糖苷酶來水解木質(zhì)纖維素生物質(zhì)底物。通過刺盤孢屬測序項(xiàng)目,哈佛大學(xué)和麻省理工學(xué)院博德研究所(http://www.broadinstitute.org/)對禾生小叢殼的基因組,玉蜀黍的抗炭疽莖腐病和葉枯病的致病物進(jìn)行了測序。在此描述的seqidno:2的序列由美國國家生物技術(shù)信息中心,美國國家醫(yī)學(xué)圖書館(ncbi)公布,登錄號為efq32803.1,并被指定為gh3家族β-葡糖苷酶。該酶以前沒有以重組形式制備,或者包含在用于水解木質(zhì)纖維素生物質(zhì)底物的酶組合物中。它或包括這種酶的組合物也沒有以這種底物的酶水解的合適方法應(yīng)用于木質(zhì)纖維素生物質(zhì)底物。此外,禾生小叢殼的β-葡糖苷酶以前未被工程化微生物表達(dá)。它也沒有與一種或多種纖維素酶基因和/或一種或多種半纖維素酶基因共表達(dá)。借助于遺傳工具庫,在合適的微生物(這些微生物通過多年發(fā)展成為異源蛋白質(zhì)和酶的高度有效的和高效的生產(chǎn)者)中的表達(dá)使得有可能以比當(dāng)它們在非工程化微生物內(nèi)表達(dá)時(shí),或當(dāng)它們在植物中表達(dá)時(shí)更大的量表達(dá)這些有用的β-葡糖苷酶。分類為β-葡糖苷酶的酶不僅在其起源方面而且還在其對木質(zhì)纖維素底物的活性方面是不同的,盡管大多數(shù)(如果不是全部)β-葡糖苷酶可以在合適的條件下催化纖維二糖水解。例如,一些不僅對纖維二糖具有活性,而且還對長鏈寡糖也具有活性,而其他的則更專門地僅對纖維二糖具有活性。即使對于具有相似底物偏好的那些β-葡糖苷酶,一些具有酶動(dòng)力學(xué)特征,這些酶動(dòng)力學(xué)特征使其具有更高的催化活性和高效性,并且因此在工業(yè)應(yīng)用中更有用,其中酶催化水解最多不能長于幾天。此外,沒有將能夠轉(zhuǎn)化從木質(zhì)纖維素生物質(zhì)的酶水解獲得的纖維素糖的發(fā)酵微生物或產(chǎn)乙醇(ethanologen)微生物工程化,以從禾生小叢殼表達(dá)β-葡糖苷酶,如在此的ggr3a多肽。β-葡糖苷酶在產(chǎn)乙醇微生物中的表達(dá)提供了從剩余的沒有被酶糖化完全轉(zhuǎn)化的纖維二糖進(jìn)一步釋放d-葡萄糖的重要機(jī)會(huì),其中由此產(chǎn)生的d-葡萄糖可以立即被消耗或由產(chǎn)乙醇微生物及時(shí)發(fā)酵。本發(fā)明組合物和方法的一個(gè)方面涉及從禾生小叢殼衍生的糖基水解酶家族3的β-葡糖苷酶多肽(在此稱為“ggr3a”或“ggr3a多肽”),編碼該β-葡糖苷酶多肽的核酸,包含該β-葡糖苷酶多肽的組合物,以及生產(chǎn)該β-葡糖苷酶多肽和包含其的組合物并將它們應(yīng)用于水解或?qū)⒛举|(zhì)纖維素生物質(zhì)轉(zhuǎn)化成可溶性、可發(fā)酵糖的方法。然后可以將這些可發(fā)酵糖轉(zhuǎn)化為纖維素乙醇、燃料及其他生物化學(xué)品和有用的產(chǎn)品。在某些實(shí)施例中,與已知的高保真β-葡糖苷酶的基準(zhǔn)里氏木霉bgl1相比,ggr3aβ-葡糖苷酶多肽具有更高的β-葡糖苷酶活性和/或表現(xiàn)出增加的水解給定的木質(zhì)纖維素生物質(zhì)底物的能力。(肖夫(chauve),m.等人,生物燃料技術(shù)(biotechnol.biofuels),3(1):3(2010))。在一些實(shí)施例中,將ggr3a多肽與酶組合物中的一種或多種其他纖維素酶一起或在其存在下進(jìn)行應(yīng)用以水解或分解合適的生物質(zhì)底物。一種或多種其他纖維素酶可以是例如其他β-葡糖苷酶、纖維二糖水解酶和/或內(nèi)切葡聚糖酶。例如,該酶組合物可以包含ggr3a多肽、纖維二糖水解酶、和內(nèi)切葡聚糖酶。在一些實(shí)施例中,將ggr3a多肽與酶組合物中的一種或多種半纖維素酶一起或在其存在下進(jìn)行應(yīng)用。一種或多種半纖維素酶可以是例如木聚糖酶,β-木糖苷酶和/或l-阿拉伯呋喃糖苷酶。在另外的實(shí)施例中,將ggr3a多肽與酶組合物中的一種或多種纖維素酶和一種或多種半纖維素酶一起或在其存在下進(jìn)行應(yīng)用。例如,酶組合物包含ggr3a多肽,不包含或包含一種或兩種其他β-葡糖苷酶,一種或多種纖維二糖水解酶,一種或多種內(nèi)切葡聚糖酶;任選地不包含或包含一種或多種木聚糖酶,不包含或包含一種或多種β-木糖苷酶,以及不包含或包含一種或多種l-阿拉伯呋喃糖苷酶。在某些實(shí)施例中,將ggr3a多肽或包括該ggr3a多肽的組合物在產(chǎn)乙醇微生物存在下應(yīng)用于木質(zhì)纖維素生物質(zhì)底物或部分水解的木質(zhì)纖維素生物質(zhì)底物,該產(chǎn)乙醇微生物能夠代謝由木質(zhì)纖維素生物質(zhì)底物的酶水解產(chǎn)生的可溶性可發(fā)酵糖,并將這類糖轉(zhuǎn)化為乙醇、生物化學(xué)品或其他有用的材料。這種過程可以是嚴(yán)格順序的過程,由此水解步驟在發(fā)酵步驟之前進(jìn)行。可替代地,這樣的過程可以是混合過程,由此水解步驟首先開始,但持續(xù)與在稍后開始的發(fā)酵步驟重疊的一段時(shí)間。在另一替代方案中,這種過程可以是同時(shí)水解和發(fā)酵過程,由此在由酶水解產(chǎn)生的糖由產(chǎn)乙醇微生物發(fā)酵的同時(shí)發(fā)生生物質(zhì)底物的酶水解。例如,ggr3a多肽可以是酶組合物的一部分,有助于酶水解過程并且有助于從寡糖如纖維二糖釋放d-葡萄糖。在某些實(shí)施例中,ggr3a多肽可以被遺傳工程化以在產(chǎn)乙醇微生物中表達(dá),這樣使得該產(chǎn)乙醇微生物表達(dá)和/或分泌這樣的β-葡糖苷酶活性。此外,ggr3a多肽可以是水解酶組合物的一部分,而同時(shí)還由產(chǎn)乙醇微生物表達(dá)和/或分泌,由此通過使用水解酶組合物水解木質(zhì)纖維素生物質(zhì)底物產(chǎn)生的可溶性可發(fā)酵糖通過還表達(dá)和/或分泌ggr3a多肽的產(chǎn)乙醇微生物被代謝和/或轉(zhuǎn)化成乙醇。水解酶組合物除了一種或多種其他纖維素酶和/或一種或多種半纖維素酶之外可以包含ggr3a多肽。可以將產(chǎn)乙醇微生物工程化,這樣使得它表達(dá)ggr3a多肽、一種或多種其他纖維素酶、一種或多種其他半纖維素酶、或這些酶的組合。β-葡糖苷酶中的一種或多種可以位于水解酶組合物中并由產(chǎn)乙醇微生物表達(dá)和/或分泌。例如,可以使用包含ggr3a多肽的酶組合物來實(shí)現(xiàn)木質(zhì)纖維素生物質(zhì)底物的水解,并且然后可以用工程化以表達(dá)和/或分泌ggr3a多肽的微生物發(fā)酵由水解生成的糖??商娲兀谝沪?葡糖苷酶的酶組合物參與水解步驟,并且與第一β-葡糖苷酶不同的第二β-葡糖苷酶由產(chǎn)乙醇微生物表達(dá)和/或分泌。例如,可以使用包含里氏木霉bgl1的水解酶組合物來實(shí)現(xiàn)木質(zhì)纖維素生物質(zhì)底物的水解,并且由水解產(chǎn)生的可發(fā)酵糖由表達(dá)和/或分泌ggr3a多肽的產(chǎn)乙醇微生物發(fā)酵,反之亦然。如在此所證實(shí)的,ggr3a多肽和包含ggr3a多肽的組合物在發(fā)生木質(zhì)纖維素生物質(zhì)的糖化和降解的條件下具有改進(jìn)的效力。當(dāng)將水解給定的生物質(zhì)底物的性能與包含里氏木霉的bgl1的另外可比較的酶組合物的性能進(jìn)行比較時(shí),顯示出包含ggr3a多肽的酶組合物的改進(jìn)的效力。在某些實(shí)施例中,改進(jìn)或增加的β-葡糖苷酶活性反映在ggr3a多肽的改進(jìn)或增加的纖維二糖酶活性中,該改進(jìn)或增加是使用纖維二糖作為底物,例如在約30℃至約65℃的溫度(例如,約35℃至約60℃、約40℃至約55℃、約45℃至約55℃、約48℃至約52℃、約40℃、約45℃、約50℃、約55℃等)下測量的。在一些實(shí)施例中,當(dāng)β-葡糖苷酶多肽用于水解磷酸溶脹纖維素(pasc)(例如,使用瓦爾賽斯(walseth),美國紙漿與造紙工業(yè)技術(shù)協(xié)會(huì)(tappi)1971,35:228和伍德(wood),生物化學(xué)雜志(biochem.j.)1971,121:353-362的改編方案,如此預(yù)處理的avicel)時(shí),觀察到ggr3a多肽與里氏木霉bgl1相比改進(jìn)的β-葡糖苷酶活性。在一些實(shí)施例中,當(dāng)β-葡糖苷酶多肽用于水解稀氨預(yù)處理玉米秸稈(例如,國際公開專利申請:wo2006110891、wo2006110899、wo2006110900、wo2006110901、和wo2006110902;美國專利號7,998,713、7,932,063中所述的玉米秸稈)時(shí),觀察到ggr3a多肽與里氏木霉bgl1相比改進(jìn)的β-葡糖苷酶活性。在一些方面,ggr3a多肽和/或按照原樣應(yīng)用于酶組合物中或應(yīng)用于水解木質(zhì)纖維素生物質(zhì)底物的方法中的ggr3a多肽是(a)衍生自禾生小叢殼、可從其獲得、或由其生產(chǎn)的;(b)一種重組多肽,該重組多肽包含與seqidno:2的氨基酸序列具有至少75%(例如,至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%)同一性的氨基酸序列;(c)一種重組多肽,該重組多肽包含與seqidno:3的催化結(jié)構(gòu)域(即,氨基酸殘基20-876)具有至少75%(例如,至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%)同一性的氨基酸序列;(d)一種重組多肽,該重組多肽包含與seqidno:3的氨基酸序列的成熟形式(即,seqidno:2的氨基酸殘基20-876)具有至少75%(例如,至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%)同一性的氨基酸序列;或(e)(a)、(b)、(c)或(d)的具有β-葡糖苷酶活性的片段。在某些實(shí)施例中,提供了具有β-葡糖苷酶活性的變體多肽,該變體多肽包括seqidno:2或seqidno:3的一個(gè)或多個(gè)氨基酸殘基的取代、缺失和/或插入。在一些方面,ggr3a多肽和/或按照原樣應(yīng)用于酶組合物中或應(yīng)用于水解木質(zhì)纖維素生物質(zhì)底物的方法中的ggr3a多肽是(a)由核酸序列編碼的多肽,該核酸序列與seqidno:1具有至少75%(例如,至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)序列同一性,或(b)在中嚴(yán)格條件、高嚴(yán)格條件或非常高嚴(yán)格條件下與seqidno:1或seqidno:1的具有至少100個(gè)連續(xù)核苷酸的子序列、或與其互補(bǔ)序列雜交的多肽,其中該多肽具有β-葡糖苷酶活性。在一些實(shí)施例中,ggr3a多肽和/或按照原樣應(yīng)用于組合物中或應(yīng)用于水解木質(zhì)纖維素生物質(zhì)底物的方法中的ggr3a多肽是由于遺傳密碼的簡并性在中嚴(yán)格條件、高嚴(yán)格條件或非常高嚴(yán)格條件下不與seqidno:1或seqidno:1的具有至少100個(gè)連續(xù)核苷酸的子序列、或與其互補(bǔ)序列雜交,但是仍然編碼多肽,該多肽具有β-葡糖苷酶活性并且包括與seqidno:2的氨基酸序列或seqidno:3的成熟的β-葡糖苷酶序列具有至少75%(例如,至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)同一性的氨基酸序列。該核酸序列可以是合成的,并且不一定衍生自禾生小叢殼,但該核酸序列編碼具有β-葡糖苷酶活性的多肽,并且包括與seqidno:2或與seqidno:3具有至少75%同一性的氨基酸序列。在一些優(yōu)選的實(shí)施例中,與野生型里氏木霉bgl1(seqidno:4的)或包括里氏木霉bgl1的酶組合物的β-葡糖苷酶活性相比,ggr3a多肽或包含ggr3a多肽的組合物具有改進(jìn)的β-葡糖苷酶活性。例如,如使用纖維二糖水解測定所測量的,本文組合物和方法的ggr3a多肽的β-葡糖苷酶活性比里氏木霉bgl1的β-葡糖苷酶活性高出至少約10%(例如,高出至少約10%、高出至少約20%、高出至少約30%、高出至少約40%、高出至少約50%、高出至少約60%、高出至少約70%、高出至少約80%、高出至少約85%,例如像高出至少87%)。在此實(shí)例3中描述了該纖維二糖水解測定。在一些實(shí)施例中,本文組合物和方法的ggr3a多肽具有顯著增加的(例如,高出至少約10%、高出至少約20%、高出至少約30%、高出至少約40%、高出至少約50%、高出至少約60%、高出至少約70%、高出至少約80%、高出至少約85%,例如像高出至少87%)纖維二糖水解活性。在某些方面,與野生型里氏木霉bgl1的(seqidno:4的)水解木質(zhì)纖維素生物質(zhì)底物的性能相比,ggr3a多肽和包含本發(fā)明的ggr3a多肽的組合物具有改進(jìn)的水解木質(zhì)纖維素生物質(zhì)底物的性能。在一些實(shí)施例中,與在相同糖化條件下從以某種方法預(yù)處理的相同生物質(zhì)由里氏木霉bgl1或包括里氏木霉bgl1的同一的酶組合物生產(chǎn)的葡萄糖水平相比,通過從以相同方法預(yù)處理的給定的木質(zhì)纖維素生物質(zhì)底物生產(chǎn)更大量的葡萄糖可以觀察到ggr3a多肽或包含ggr3a多肽的組合物的改進(jìn)的水解性能。例如,當(dāng)使用0-10mg(例如,約1mg、約2mg、約3mg、約4mg、約5mg、約6mg、約7mg、約8mg、約9mg、約10mg)的β-葡糖苷酶(ggr3a多肽或里氏木霉bgl1)來水解生物質(zhì)底物中的1g葡聚糖時(shí),由ggr3a多肽或由包含ggr3a多肽的酶組合物生產(chǎn)的葡萄糖的量比由里氏木霉bgl1或否則包括里氏木霉bgl1的同一的酶組合物(而不是ggr3a多肽)生產(chǎn)的葡萄糖的量多出至少約5%(例如,至少約5%、至少約10%、至少約15%、至少約20%、或至少約25%)。在一些方面,與在相同糖化條件下從以某種方法預(yù)處理的相同生物質(zhì)通過里氏木霉bgl1或否則包括里氏木霉bgl1的同一的酶組合物的葡聚糖轉(zhuǎn)化%水平相比,通過從以相同方法預(yù)處理的給定的木質(zhì)纖維素生物質(zhì)底物的增加的葡聚糖轉(zhuǎn)化%可以觀察到ggr3a多肽或包含ggr3a多肽的組合物的改進(jìn)的水解性能。例如,當(dāng)使用0-10mg(例如,約1mg、約2mg、約3mg、約4mg、約5mg、約6mg、約7mg、約8mg、約9mg、約10mg)的β-葡糖苷酶(ggr3a多肽或里氏木霉bgl1)來水解生物質(zhì)底物中的1g葡聚糖時(shí),通過ggr3a多肽或包含ggr3a多肽的酶組合物的葡聚糖轉(zhuǎn)化%比由里氏木霉bgl1或否則包括里氏木霉bgl1的同一的酶組合物(而不是ggr3a多肽)的葡聚糖轉(zhuǎn)化%高出至少約5%(例如,至少約5%、至少約10%、或至少約15%)。在另外的方面,與當(dāng)在相同糖化條件下通過里氏木霉bgl1或否則包括里氏木霉bgl1的同一的組合物水解相同生物質(zhì)底物時(shí)纖維二糖的殘余量相比,通過從水解以某些方式預(yù)處理的給定的木質(zhì)纖維素生物質(zhì)底物,在產(chǎn)物混合物中的較高纖維二糖酶活性和/或降低的殘余纖維二糖的量可以觀察到ggr3a多肽和包含ggr3a多肽的組合物的改進(jìn)的水解性能。例如,通過ggr3a多肽或包含ggr3a多肽的組合物從以某種方法預(yù)處理的給定的生物質(zhì)底物的水解生產(chǎn)的產(chǎn)物混合物中的殘余纖維二糖的量比在相同糖化條件下通過里氏木霉bgl1或否則通過包含里氏木霉bgl1的同一的酶組合物從以相同方法預(yù)處理的相同生物質(zhì)底物的水解生產(chǎn)的產(chǎn)物混合物中所生產(chǎn)的殘余纖維二糖的量少至少約5%(例如,至少約5%、至少約10%、至少約15%、或甚至至少約20%)。這是當(dāng)使用0-10mgβ-葡糖苷酶(例如,約1mg、約2mg、約3mg、約4mg、約5mg、約6mg、約7mg、約8mg、約9mg、約10mg)β-葡糖苷酶(例如,ggr3a多肽或里氏木霉bgl1)來水解生物質(zhì)底物中1g葡聚糖時(shí)的情況。本發(fā)明組合物和方法的方面包括一種組合物,該組合物包含如以上詳述的重組ggr3a多肽和木質(zhì)纖維素生物質(zhì)。合適的木質(zhì)纖維素生物質(zhì)可以例如衍生自農(nóng)作物,食物或飼料生產(chǎn)的副產(chǎn)物,木質(zhì)纖維素廢物,植物殘?bào)w,包括例如草渣、或廢紙或廢紙產(chǎn)物。在某些實(shí)施例中,木質(zhì)纖維素生物質(zhì)已經(jīng)經(jīng)受一個(gè)或多個(gè)預(yù)處理步驟,以使得木聚糖、半纖維素、纖維素和/或木質(zhì)素材料更可及酶或易受酶的影響,并且因此更易于進(jìn)行酶水解。合適的預(yù)處理方法可以是例如在反應(yīng)器中使生物質(zhì)材料經(jīng)受包括強(qiáng)酸和金屬鹽的稀溶液的催化劑。參見,例如,美國專利號6,660,506、6,423,145??商娲?,合適的預(yù)處理可以是例如美國專利號5,536,325中所述的多步驟過程。在某些實(shí)施例中,根據(jù)美國專利號6,409,841的披露內(nèi)容,可以使用約0.4%至約2%的強(qiáng)酸使生物質(zhì)材料經(jīng)受一級或多級的稀酸水解。預(yù)處理方法的另外的實(shí)施例可以包括以下各項(xiàng)中所描述的那些,例如:美國專利號5,705,369;古爾德(gould),生物技術(shù)和生物工程(biotech.&bioengr.),26:46-52(1984);特謝拉(teixeira)等人,應(yīng)用生物化學(xué)與生物技術(shù)(appl.biochem&biotech.),77-79:19-34(1999);國際公開專利申請wo2004/081185;或美國專利公開號20070031918,或國際公開專利申請wo06110901。本發(fā)明還涉及編碼具有β-葡糖苷酶活性的多肽的分離的多核苷酸,其中該分離的多核苷酸選自:(1)一種編碼多肽的多核苷酸,該多肽包含與seqidno:2或與seqidno:3具有至少75%(例如,至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%)同一性的氨基酸序列;(2)一種多核苷酸,該多核苷酸與seqidno:1具有至少75%(例如,至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%)同一性,或在中嚴(yán)格條件、高嚴(yán)格條件或非常高嚴(yán)格條件下與seqidno:1、或與其互補(bǔ)序列雜交。本發(fā)明組合物和方法的方面包括使用編碼重組多肽的分離的核酸序列制備或生產(chǎn)具有β-葡糖苷酶活性的ggr3a多肽的方法,該重組多肽包含與seqidno:2的氨基酸序列或成熟序列seqidno:3的氨基酸序列具有至少75%同一性(例如,至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%)的氨基酸序列。在一些實(shí)施例中,多肽進(jìn)一步包括天然或非天然信號肽,這樣使得所生產(chǎn)的ggr3a多肽由宿主生物體分泌,例如,信號肽包括與seqidno:11(里氏木霉bgl1的信號序列)具有至少90%同一性的序列。在某些實(shí)施例中,分離的核酸包括與seqidno:1具有至少75%(例如,至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%)同一性的序列。在某些實(shí)施例中,該分離的核酸進(jìn)一步包括編碼信號肽序列的核酸序列。在某些實(shí)施例中,信號肽序列可以是選自seqidno:11-40的信號肽序列。在某些具體實(shí)施例中,使用編碼seqidno:11的信號肽序列的核酸序列來表達(dá)里氏木霉中的ggr3a多肽。本發(fā)明組合物和方法的方面包括一種表達(dá)載體,該表達(dá)載體包括如上所述的與調(diào)節(jié)序列可操作組合的分離的核酸。本發(fā)明組合物和方法的方面包括一種宿主細(xì)胞,該宿主細(xì)胞包括該表達(dá)載體。在某些實(shí)施例中,該宿主細(xì)胞是細(xì)菌細(xì)胞或真菌細(xì)胞。在某些實(shí)施例中,包含表達(dá)載體的宿主細(xì)胞是能夠代謝由木質(zhì)纖維素生物質(zhì)的水解產(chǎn)生的可溶性糖的產(chǎn)乙醇微生物,其中水解是化學(xué)和/或酶過程的結(jié)果。本發(fā)明組合物和方法的方面包括一種組合物,該組合物包含上述宿主細(xì)胞和培養(yǎng)基。本發(fā)明組合物和方法的方面包括生產(chǎn)ggr3a多肽的方法,該方法包括:在合適的條件下,在培養(yǎng)基中培養(yǎng)上述宿主細(xì)胞以產(chǎn)生β-葡糖苷酶。本發(fā)明組合物和方法的方面包括一種組合物,該組合物包含根據(jù)如上所述的用于生產(chǎn)β-葡糖苷酶的方法生產(chǎn)的培養(yǎng)基的上清液中的ggr3a多肽。在一些方面,本發(fā)明涉及核酸構(gòu)建體、重組表達(dá)載體、包括編碼具有β-葡糖苷酶活性的多肽的多核苷酸的工程化宿主細(xì)胞,如上文和在此所述。在另外的方面,本發(fā)明涉及使用核酸構(gòu)建體、重組表達(dá)載體和/或工程化宿主細(xì)胞制備或生產(chǎn)本發(fā)明的β-葡糖苷酶多肽或包含此類β-葡糖苷酶多肽的組合物的方法。具體而言,例如,本發(fā)明涉及一種核酸構(gòu)建體(該核酸構(gòu)建體包含與β-葡糖苷酶的成熟序列(該成熟序列與seqidno:2或seqidno:3的成熟序列具有至少75%同一性,或由與seqidno:1具有至少75%同一性的多核苷酸編碼)可操作地連接的合適的信號肽)、分離的多核苷酸、核酸構(gòu)建體、重組表達(dá)載體、或包含這種核酸構(gòu)建體的工程化宿主細(xì)胞。在一些實(shí)施例中,信號肽和β-葡糖苷酶序列衍生自不同的微生物。還提供了表達(dá)載體,該表達(dá)載體包含與調(diào)節(jié)序列可操作組合的分離的核酸。另外,提供了包含表達(dá)載體的宿主細(xì)胞。在仍另外的實(shí)施例中,提供了包含宿主細(xì)胞和培養(yǎng)基的組合物。在一些實(shí)施例中,宿主細(xì)胞是細(xì)菌細(xì)胞或真菌細(xì)胞。在某些實(shí)施例中,宿主細(xì)胞是產(chǎn)乙醇微生物,其能夠代謝從水解木質(zhì)纖維素生物質(zhì)底物產(chǎn)生的可溶性糖,其中水解可以通過化學(xué)水解或酶水解或這些過程的組合來進(jìn)行,而宿主細(xì)胞還能夠表達(dá)異源酶。在一些實(shí)施例中,宿主細(xì)胞是釀酒酵母或運(yùn)動(dòng)發(fā)酵單胞菌細(xì)胞,其不僅能夠表達(dá)異源多肽,如本發(fā)明的ggr3a多肽,而且能夠?qū)⑻前l(fā)酵成乙醇和/或下游產(chǎn)物。在某些具體實(shí)施例中,表達(dá)β-葡糖苷酶的釀酒酵母細(xì)胞或運(yùn)動(dòng)發(fā)酵單胞菌細(xì)胞能夠由包含一種或多種β-葡糖苷酶的酶組合物發(fā)酵從木質(zhì)纖維素生物質(zhì)生產(chǎn)的糖。包含一種或多種β-葡糖苷酶的酶組合物可以包含相同的β-葡糖苷酶或可以包含一種或多種不同的β-葡糖苷酶。在某些實(shí)施例中,包含一種或多種β-葡糖苷酶的酶組合物可以是由工程化宿主細(xì)胞產(chǎn)生的酶混合物,該工程化宿主細(xì)胞可以是細(xì)菌或真菌細(xì)胞。當(dāng)釀酒酵母或運(yùn)動(dòng)發(fā)酵單胞菌細(xì)胞表達(dá)本披露的ggr3a多肽時(shí),可以表達(dá)但不分泌ggr3a多肽。因此,必須將該纖維二糖引入或“轉(zhuǎn)運(yùn)”到這種宿主細(xì)胞中,以便β-葡糖苷酶ggr3a多肽催化d-葡萄糖的釋放。因此,在某些實(shí)施例中,將酵母釀酒酵母或運(yùn)動(dòng)發(fā)酵單胞菌細(xì)胞用除了編碼ggr3a多肽的基因之外的纖維二糖轉(zhuǎn)運(yùn)蛋白基因轉(zhuǎn)化。纖維二糖轉(zhuǎn)運(yùn)蛋白和β-葡糖苷酶已經(jīng)在釀酒酵母中表達(dá),這樣使得所得微生物能夠發(fā)酵纖維二糖,例如在哈(ha)等人,美國國家科學(xué)院院刊(pnas),108(2):504-509(2011)中。另一種纖維二糖轉(zhuǎn)運(yùn)蛋白已經(jīng)在畢赤屬酵母中表達(dá),例如在公開的美國專利申請?zhí)?0110262983中。已經(jīng)將纖維二糖轉(zhuǎn)運(yùn)蛋白引入大腸桿菌中,例如在謝卡爾(sekar)等人,應(yīng)用環(huán)境微生物學(xué)(appliedenvironmentalmicrobiology),78(5):1611-1614(2012)中。在另外的實(shí)施例中,ggr3a多肽由宿主細(xì)胞異源表達(dá)。例如,ggr3a多肽由不是禾生小叢殼的工程化微生物表達(dá)。在一些實(shí)施例中,ggr3a多肽與一種或多種不同的纖維素酶基因共表達(dá)。在一些實(shí)施例中,ggr3a多肽與一種或多種半纖維素酶基因共表達(dá)。在一些方面,提供了包括前述段落所述重組ggr3a多肽的組合物和制備此類組合物的方法。在一些實(shí)施例中,組合物進(jìn)一步包含一種或多種其他纖維素酶,由此該一種或多種其他纖維素酶與ggr3a多肽一起由宿主細(xì)胞共表達(dá)。例如,一種或多種其他纖維素酶可以選自無或一種或多種其他β-葡糖苷酶、一種或多種纖維二糖水解酶、和/或一種或多種內(nèi)切葡聚糖酶。此類其他β-葡糖苷酶、纖維二糖水解酶和/或內(nèi)切葡聚糖酶(如果存在)可以通過單個(gè)宿主細(xì)胞與ggr3a多肽共表達(dá)。兩種或更多種纖維素酶中的至少兩種可以彼此異源或衍生自不同的生物體。例如,組合物可以包含兩種β-葡糖苷酶,其中第一β-葡糖苷酶是ggr3a多肽,并且第二β-葡糖苷酶不是衍生自禾生小叢殼菌株。例如,組合物可以包含不是衍生自禾生小叢殼的至少一種纖維二糖水解酶、一種內(nèi)切葡聚糖酶或一種β-葡糖苷酶。在一些實(shí)施例中,纖維素酶中的一種或多種對宿主細(xì)胞而言是內(nèi)源的,但是以不同于天然存在于宿主細(xì)胞中的那種水平過表達(dá)或表達(dá)。例如,纖維素酶中的一種或多種可以是里氏木霉cbh1和/或cbh2,其對里氏木霉宿主細(xì)胞而言是天然的,但cbh1和cbh2之一或兩者在里氏木霉細(xì)胞中與ggr3a多肽共表達(dá)時(shí)都被過表達(dá)或低表達(dá)。在某些實(shí)施例中,包含重組ggr3a多肽的組合物可以進(jìn)一步包含一種或多種半纖維素酶,由此該一種或多種半纖維素酶與ggr3a多肽一起由宿主細(xì)胞共表達(dá)。例如,一種或多種半纖維素酶可以選自一種或多種木聚糖酶、一種或多種β-木糖苷酶和/或一種或多種l-阿拉伯呋喃糖苷酶。此類其他木聚糖酶、β-木糖苷酶和l-阿拉伯呋喃糖苷酶(如果存在)可以通過單個(gè)宿主細(xì)胞與ggr3a多肽共同表達(dá)。在一些實(shí)施例中,組合物可以包含不是衍生自禾生小叢殼的至少一種β-木糖苷酶、木聚糖酶或阿拉伯呋喃糖苷酶。在另外的方面,包含重組ggr3a多肽的組合物可進(jìn)一步包含一種或多種其他纖維素酶和一種或多種半纖維素酶,由此該一種或多種纖維素酶和/或一種或多種半纖維素酶與ggr3a多肽一起通過宿主細(xì)胞共表達(dá)。例如,除了相同宿主細(xì)胞中的其他非纖維素酶非半纖維素酶或蛋白質(zhì)以外,ggr3a多肽可以與一種或多種其他β-葡糖苷酶、一種或多種纖維二糖水解酶、一種或多種內(nèi)切葡聚糖酶、一種或多種內(nèi)切木聚糖酶、一種或多種β-木糖苷酶和一種或多種l-阿拉伯呋喃糖苷酶共表達(dá)。因此,本發(fā)明組合物和方法的方面包括一種組合物,該組合物包含上述的宿主細(xì)胞和培養(yǎng)基,該上述的宿主細(xì)胞除了ggr3a多肽以外還共表達(dá)多種酶。因此,本發(fā)明組合物和方法的方面包括生產(chǎn)含ggr3a的酶組合物的方法,該方法包括:在合適的條件下培養(yǎng)宿主細(xì)胞(該宿主細(xì)胞在培養(yǎng)基中共同表達(dá)如上所述的多種酶與ggr3a多肽),以生產(chǎn)ggr3a和其他酶。還提供了包含ggr3a多肽和根據(jù)在此方法在培養(yǎng)基的上清液中產(chǎn)生的其他酶的組合物。培養(yǎng)基的這種上清液可以原樣使用,最少或不經(jīng)后期處理,該后期處理通??梢园ㄟ^濾以除去細(xì)胞碎片、細(xì)胞殺死程序和/或超濾或其他步驟以富集或濃縮其中的酶。這些上清液在此中稱為“全肉湯”或“全纖維素酶肉湯”。在另外的方面,本發(fā)明涉及在適于降解或轉(zhuǎn)化纖維素材料并適于從纖維素材料生產(chǎn)底物的條件下應(yīng)用或使用如上所述的組合物的方法。在另外的方面,提供了將纖維素材料降解或轉(zhuǎn)化成可發(fā)酵糖的方法,該方法包括:將纖維素材料(優(yōu)選已經(jīng)經(jīng)受一個(gè)或多個(gè)預(yù)處理步驟的纖維素材料)與ggr3a多肽或包括前述段落之一所述的此類多肽的組合物接觸,以產(chǎn)生可發(fā)酵糖。這些以及ggr3a組合物和方法的其他方面將從以下描述中變得顯而易見。附圖簡述圖1描繪了pentr/d-topo-bgl1(943/942)質(zhì)粒的圖譜。圖2描繪了ptrex3g943/942質(zhì)粒的圖譜。圖3描繪了pttt-pyr2質(zhì)粒(seqidno:41)的圖譜。圖4描繪了pttt-pyr2-ggr3a質(zhì)粒(seqidno:42)的圖譜。圖5描繪了psc11質(zhì)粒的圖譜。圖6描繪了pzc11質(zhì)粒的圖譜。圖7是ggr3a與里氏木霉bgl1(各自在spezymecp酶背景下,基于pasc底物)的劑量曲線的比較。左小圖描繪了不同酶劑量下的葡萄糖產(chǎn)量,而右小圖則描繪了在不同酶劑量下殘余的纖維二糖濃度。圖8是ggr3a與里氏木霉bgl1的纖維二糖水解動(dòng)力學(xué)的比較,如根據(jù)實(shí)例8基于100mm纖維二糖底物所測量的。圖9a-9b描繪了ggr3a與里氏木霉bgl1(各自在spezymecp酶背景下,基于whpcs底物)的劑量曲線的比較。圖9a描繪了基于從底物獲得的葡萄糖的劑量曲線。圖9b描繪了殘余的纖維二糖濃度。詳細(xì)說明在此描述了與屬于來自禾生小叢殼的糖基水解酶家族3的重組β-葡糖苷酶ggr3a相關(guān)的組合物和方法。本發(fā)明組合物和方法部分地基于如下觀察,當(dāng)組合物用于水解木質(zhì)纖維素生物質(zhì)材料或原料時(shí),重組ggr3a多肽比例如里氏木霉的已知基準(zhǔn)高保真β-葡糖苷酶bgl1具有更高的纖維素酶活性并且作為酶組合物的組分更穩(wěn)健。ggr3a多肽的這些特征使得它們或其變體適用于許多過程,包括例如適用于木質(zhì)纖維素生物質(zhì)原料的轉(zhuǎn)化或水解。在更詳細(xì)地描述本發(fā)明組合物和方法之前,應(yīng)當(dāng)理解,本發(fā)明組合物和方法不限于所描述的具體實(shí)施例,因此當(dāng)然可以變化。還應(yīng)當(dāng)理解,在此使用的術(shù)語僅是出于描述具體實(shí)施例的目的,并且不旨在進(jìn)行限制,因?yàn)楸景l(fā)明組合物和方法的范圍將僅由所附權(quán)利要求書限制。在提供了一系列值的情況下,應(yīng)理解每個(gè)中間值為到下限的十分之一單位(除非上下文清晰地另外指示),該范圍的上限與下限之間以及在該陳述范圍內(nèi)的任何其他陳述的或中間值均被涵蓋在本發(fā)明的組合物和方法之內(nèi)。這些較小范圍的上限和下限可以被獨(dú)立地包括在所述較小的范圍內(nèi),并且也被涵蓋在本發(fā)明的組合物和方法之內(nèi),服從所陳述范圍中任何特別排除的限值。在所陳述的范圍包括一個(gè)或者全部兩個(gè)限值的情況下,排除那些包括的限值的任一個(gè)或者全部兩個(gè)的范圍也包括在本發(fā)明的組合物和方法中。本文提供了某些范圍,其中數(shù)值前面是術(shù)語“約”。術(shù)語“約”在本文中用于為其后面的確切數(shù)字以及與該術(shù)語后面的數(shù)字接近或近似的數(shù)字提供文字支持。在確定數(shù)字是否接近或近似于具體敘述的數(shù)字時(shí),接近或近似的未列舉的數(shù)字可以是在呈現(xiàn)其的上下文中提供具體敘述的數(shù)字的實(shí)質(zhì)性等值的數(shù)字。例如,關(guān)于數(shù)值,術(shù)語“約”是指數(shù)值的-10%至+10%的范圍,除非術(shù)語在上下文中另有具體定義。在另一個(gè)實(shí)例中,短語“約6的ph值”是指ph值為從5.4至6.6,除非ph值另有具體定義。本文提供的標(biāo)題并非對本發(fā)明的組合物和方法的各個(gè)方面或?qū)嵤├M(jìn)行限制,這些方面或?qū)嵤├赏ㄟ^將說明書作為一個(gè)整體來參考而得到。因此,將說明書作為一個(gè)整體參考時(shí),下面即將定義的術(shù)語被定義得更全面。將本文件分為若干部分以便于閱讀;然而,讀者將理解,在一個(gè)部分中進(jìn)行的陳述可能適用于其他部分。以這種方式,用于本披露的不同部分的標(biāo)題不應(yīng)被解釋為限制。除非另有定義,本文使用的所有技術(shù)和科學(xué)術(shù)語具有與本發(fā)明組合物和方法所屬領(lǐng)域的普通技術(shù)人員通常理解的相同含義。雖然類似于或等同于本文描述的那些的任何方法和材料也可以用于本發(fā)明組合物和方法的實(shí)踐或測試中,但現(xiàn)在將對代表性示例方法和材料進(jìn)行描述。在本說明書中引用的所有公開物和專利都通過引用結(jié)合在此,就好像每個(gè)單獨(dú)的公開物或?qū)@痪唧w地并單獨(dú)地指示為通過引用結(jié)合,并且通過引用結(jié)合在此從而結(jié)合引用的公開物來披露和描述這些方法和/或材料。任何公開物的引用內(nèi)容是針對其在申請日之前的披露,并且不能理解為承認(rèn)因?yàn)橄惹鞍l(fā)明而本發(fā)明組合物和方法不能獲得比這些公開物更早的申請日。此外,所提供的公開日期可能與實(shí)際公開日期不同,實(shí)際公開日期可能需要獨(dú)立地證實(shí)。根據(jù)該詳細(xì)說明,適用以下縮寫和定義。應(yīng)當(dāng)注意單數(shù)形式“一個(gè)/一種(a/an)”和“該(the)”包括復(fù)數(shù)個(gè)指示物,除非上下文中清楚地另外指出。因此,例如提及“酶”包括多個(gè)這樣的酶,并且提及“劑量”包括提及一個(gè)或多個(gè)劑量以及本領(lǐng)域技術(shù)人員已知的其等效物,等等。進(jìn)一步注意的是,權(quán)利要求書可以撰寫以排除任何可選擇的要素。因此,該陳述意在作為使用與權(quán)利要求要素的敘述有關(guān)的排他性術(shù)語例如“單獨(dú)”、“僅”等或利用“否定型”限定的前提基礎(chǔ)。術(shù)語“重組”當(dāng)用于提及主題細(xì)胞、核酸、多肽/酶或載體時(shí),表明受試者已經(jīng)從其天然狀態(tài)被修飾。因此,例如,重組細(xì)胞表達(dá)在天然(非重組)形式的細(xì)胞中未發(fā)現(xiàn)的基因,或以不同于自然界發(fā)現(xiàn)的水平或在不同于自然界發(fā)現(xiàn)的條件下表達(dá)天然基因。重組核酸可以通過一個(gè)或多個(gè)核苷酸與天然序列不同,和/或可操作地連接到異源序列(例如異源啟動(dòng)子)、允許在表達(dá)載體中分泌等的信號序列。重組多肽/酶可以通過一個(gè)或多個(gè)氨基酸與天然序列不同,和/或與異源序列融合。包含編碼β-葡糖苷酶的核酸的載體是例如重組載體。進(jìn)一步注意到,如本文使用的術(shù)語“基本上由……組成”是指一種組合物,其中該術(shù)語之后的一種或多種組分在存在其他已知的一種或多種組分的情況下為總體組合物的以重量計(jì)小于30%的總量,并且不會(huì)有助于或干擾一種或多種組分的作用或活性。進(jìn)一步注意到,如本文所使用的術(shù)語“包括”意指包括但不限于在術(shù)語“包括”之后的一種或多種組分。在術(shù)語“包含”之后的組分是必需的或強(qiáng)制性的,但是包含一種或多種組分的組合物可以進(jìn)一步包括其他非強(qiáng)制性或可選擇的一種或多種組分。還要注意的是,如本文所使用的術(shù)語“由……組成”意指包括且限于術(shù)語“由……組成”之后的一種或多種組分。因此,術(shù)語“由……組成”之后的一種或多種組分是必需的或強(qiáng)制性的,且組合物中不存在一種或多種其他組分。如將對于本領(lǐng)域技術(shù)人員顯而易見的是,在閱讀本披露時(shí),本文描述和展示的單獨(dú)實(shí)施例中的每一個(gè)具有離散的組分和特征,這些組分和特征可以在不偏離本文所述的本發(fā)明組合物和方法的范圍或精神的情況下容易地與任何其他幾個(gè)實(shí)施例的任何一個(gè)的特征分離或組合??梢园凑账鶖⑹龅氖录捻樞蚧虬凑者壿嬌峡尚械娜魏纹渌樞騺磉M(jìn)行任何敘述的方法?!唉?葡糖苷酶”是指e.c.3.2.1.21的β-d-葡萄糖苷葡糖水解酶。因此,術(shù)語“β-葡糖苷酶活性”是指催化β-d-葡萄糖或纖維二糖水解以釋放d-葡萄糖的能力。β-葡糖苷酶活性可以使用纖維二糖酶測定來確定,例如,如本披露的實(shí)例2c所述,該纖維二糖酶測量酶催化纖維二糖底物的水解以產(chǎn)生d-葡萄糖的能力。如在此所用,“ggr3a”或“ggr3a多肽”是指屬于糖基水解酶家族3的衍生自禾生小叢殼(及其變體)的β-葡糖苷酶(例如,重組β-葡糖苷酶),當(dāng)與基準(zhǔn)β-葡糖苷酶(具有seqidno:4的氨基酸序列的野生型里氏木霉bgl1多肽)相比,該β-葡糖苷酶具有改進(jìn)的水解木質(zhì)纖維素生物質(zhì)底物的性能。根據(jù)本發(fā)明組合物和方法的方面,ggr3a多肽包含具有seqidno:2中所描繪氨基酸序列的那些,以及與seqidno:2的氨基酸序列、或與seqidno:2的成熟序列、或與seqidno:2的長度上具有至少100個(gè)殘基的片段具有至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性的衍生物或變體多肽,其中該ggr3a多肽不僅具有β-葡糖苷酶活性并且能夠催化纖維二糖轉(zhuǎn)化為d-葡萄糖,而且比里氏木霉bgl1具有更高的β-葡糖苷酶活性并且具有更高的催化纖維二糖轉(zhuǎn)化為d-葡萄糖的能力。在本披露的組合物和方法中使用的ggr3a多肽將具有seqidno:2的氨基酸序列的多肽的、或由seqidno:2的殘基20至876組成的多肽的、或成熟序列seqidno:3的至少5%,至少10%,優(yōu)選地至20%,更優(yōu)選地至少30%,以及更優(yōu)選地至少40%,更優(yōu)選地至少50%,甚至更優(yōu)選地至少60%,以及優(yōu)選至少70%,更優(yōu)選地至少90%,甚至更優(yōu)選地至少100%或更多的β-葡糖苷酶活性?!凹易?糖基水解酶”或“gh3”是指根據(jù)亨利薩特(henrissat),生物化學(xué)雜志(biochem.j.)280:309-316(1991)和亨利薩特(henrissat)&卡伊洛克(cairoch),生物化學(xué)雜志(biochem.j.),316:695-696(1996)的分類落入糖基水解酶家族3的定義的多肽。將根據(jù)在此所述的本發(fā)明組合物和方法的ggr3a多肽分離或純化。純化或分離意指通過將ggr3a與它在自然界中相關(guān)聯(lián)的天然存在的成分中的一些或所有分離,將ggr3a多肽自其自然狀態(tài)進(jìn)行改變。這種分離或純化可以通過本領(lǐng)域公認(rèn)的分離技術(shù)如離子交換層析、親和層析、疏水分離、透析、蛋白酶處理、硫酸銨沉淀或其他蛋白質(zhì)鹽沉淀、離心、尺寸排阻層析、過濾、微量過濾、凝膠電泳或梯度分離進(jìn)行,以去除最終組合物中所不希望的全細(xì)胞、細(xì)胞碎片、雜質(zhì)、外來蛋白質(zhì)或酶。隨后可以進(jìn)一步向含ggr3a的組合物中添加成分,該成分提供了額外的益處,例如是活化劑、抗抑制劑、期望的離子、控制ph的化合物或其他酶或化學(xué)品。如在此所用,“微生物”是指細(xì)菌、真菌、病毒、原生動(dòng)物和其他微生物或微觀生物體。如在此所用,多肽的“衍生物”或“變體”意指一種多肽,該多肽通過以下方式衍生自前體多肽(例如,天然多肽):向c-和n-末端之一或二者添加一個(gè)或多個(gè)氨基酸,在氨基酸序列的不同位點(diǎn)的一個(gè)或多個(gè)處取代一個(gè)或多個(gè)氨基酸,在多肽的一端或兩端處或在氨基酸序列的一個(gè)或多個(gè)位點(diǎn)處缺失一個(gè)或多個(gè)氨基酸,或在氨基酸序列的一個(gè)或多個(gè)位點(diǎn)處插入一個(gè)或多個(gè)氨基酸。ggr3a衍生物或變體的制備可以以任何方便的方式實(shí)現(xiàn),例如通過修飾編碼天然多肽的dna序列,將該dna序列轉(zhuǎn)化到合適的宿主中,以及修飾的dna序列的表達(dá)以形成衍生物/變體ggr3a。衍生物或變體進(jìn)一步包括經(jīng)化學(xué)修飾的ggr3a多肽,例如糖基化或以其他方式改變ggr3a多肽的特征。雖然ggr3a的衍生物和變體涵蓋在本發(fā)明組合物和方法中,但是在相同的木質(zhì)纖維素生物質(zhì)底物水解條件下,當(dāng)與seqidno:4的野生型里氏木霉bgl1的β-葡糖苷酶活性相比,此類衍生物和變體將展現(xiàn)出改進(jìn)的β-葡糖苷酶活性。在某些方面,本文組合物和方法的ggr3a多肽還可以涵蓋具有β-葡糖苷酶活性的多肽或多肽片段的功能片段,該功能片段衍生自親本多肽,該親本多肽可以是包括seqidno:2或由其組成的全長多肽,或包括seqidno:3或由其組成的成熟序列。功能多肽可能在n-末端區(qū)域或c-末端區(qū)域或兩個(gè)區(qū)域都被截短以產(chǎn)生親本多肽的片段。出于本披露的目的,功能片段必須具有親本多肽的β-葡糖苷酶活性的至少20%,更優(yōu)選地至少30%、40%、50%,或優(yōu)選地至少60%、70%、80%,或甚至更優(yōu)選地至少90%。在某些方面,ggr3a衍生物/變體與seqidno:2的氨基酸序列、或與成熟序列seqidno:3將在任何位置具有從75%至99%(或更多)的氨基酸序列同一性,例如與seqidno:2的氨基酸序列或與成熟序列seqidno:3具有75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%氨基酸序列同一性。在一些實(shí)施例中,氨基酸取代是使用l-氨基酸的“保守氨基酸取代”,其中一個(gè)氨基酸被另一種生物上相似的氨基酸替代。保守性氨基酸取代是保留所取代的氨基酸的總電荷、疏水性/親水性和/或空間位阻的那些取代。保守取代的實(shí)例是以下基團(tuán)之間的那些:gly/ala、val/ile/leu、lys/arg、asn/gln、glu/asp、ser/cys/thr、和phe/trp/tyr。衍生物可以例如相差少至1至10個(gè)氨基酸殘基,如6-10,少至5,少至4,少至3,少至2,或甚至少至1個(gè)氨基酸殘基。在一些實(shí)施例中,ggr3a衍生物可以具有n-末端和/或c-末端缺失,其中除了缺失的一個(gè)或多個(gè)末端部分之外,ggr3a衍生物與seqidno:2或seqidno:3中的連續(xù)子區(qū)域同一。如在此所用,相對于在此鑒定的氨基酸或核苷酸序列,“序列同一性百分比(%)”被定義為在比對序列并引入空位(必要的話)以實(shí)現(xiàn)最大百分比序列同一性之后,并且不考慮作為序列同一性的一部分的任何保守取代,候選序列中與ggr3a序列中的氨基酸殘基或核苷酸同一的氨基酸殘基或核苷酸的百分比。“同系物”應(yīng)意指與受試氨基酸序列和受試核苷酸序列具有特定程度的同一性的實(shí)體。使用常規(guī)序列比對工具(例如,clustal、blast等等)取得同源序列,該同源序列包括與受試序列具有至少75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或甚至99%同一性的氨基酸序列。通常,除非另有說明,同系物將包括與受試氨基酸序列相同的活性位點(diǎn)殘基。進(jìn)行序列比對并且確定序列同一性的方法是本領(lǐng)域技術(shù)人員已知的,可以在不進(jìn)行過多實(shí)驗(yàn)的情況下實(shí)施,并且可以明確地獲得同一性值的計(jì)算。參見,例如,奧蘇貝爾(f.m.ausubel)等人編輯(1995)現(xiàn)代分子生物學(xué)實(shí)驗(yàn)技術(shù)(currentprotocolsinmolecularbiology),第19章(格林出版與威利交叉科學(xué)出版社(greenepublishingandwiley-interscience),紐約);以及align程序(戴浩夫(dayhoff)(1978),在蛋白質(zhì)序列和結(jié)構(gòu)圖集5:增刊3(atlasofproteinsequenceandstructure5:suppl.3)中(國家生物醫(yī)學(xué)研究基金會(huì)(nationalbiomedicalresearchfoundation),華盛頓)。許多算法可用于比對序列并確定序列同一性,并且包括,例如,尼德爾曼(needleman)等人(1970)分子生物學(xué)雜志(j.mol.biol.)48:443的同源性比對算法;史密斯(smith)等人(1981)應(yīng)用數(shù)學(xué)進(jìn)展(adv.appl.math.)2:482的局部同源性算法;皮爾森(pearson)等人(1988)美國科學(xué)院院刊(proc.natl.acad.sci.)85:2444的相似性捜索方法;史密斯-沃特曼(smith-waterman)算法(分子生物學(xué)方法(meth.mol.biol.)70:173-187(1997));和blastp、blastn、和blastx算法(參見阿特休爾(altschul)等人(1990)分子生物學(xué)雜志(j.mol.biol.)215:403-410)。使用這些算法的計(jì)算機(jī)化程序也是可用的,并且包括但不限于:align或megalign(dnastar)軟件,或wu-blast-2(阿特休爾(altschul)等人,酶學(xué)方法(meth.enzym.),266:460-480(1996));或可在遺傳學(xué)計(jì)算機(jī)組(gcg)包,版本8,麥迪遜,威斯康星州,美國中獲得的gap、bestfit、blast、fasta和tfasta;以及智能遺傳學(xué)(intelligenetics),山景城,加利福尼亞州的pc/基因程序中的clustal。本領(lǐng)域的技術(shù)人員可以確定用于測量比對的適當(dāng)參數(shù),包括在進(jìn)行比較的序列的整個(gè)長度上實(shí)現(xiàn)最大比對所需的算法。優(yōu)選地,使用由程序確定的默認(rèn)參數(shù)來確定序列同一性。具體來說,序列同一性可以通過使用具有默認(rèn)參數(shù)的clustalw(湯普森(thompson)j.d.等人(1994)核酸研究(nucleicacidsres.)22:4673-4680)來確定,這些默認(rèn)參數(shù)即:空位開放罰分:10.0空位延伸罰分:0.05蛋白質(zhì)重量矩陣:blosum系列dna重量矩陣:iub延遲發(fā)散序列%:40空位分隔距離:8dna轉(zhuǎn)換重量:0.50列表親水殘基:gpsndqekr使用負(fù)性矩陣:關(guān)切換特殊殘基罰分:開切換親水罰分:開切換結(jié)束空位分隔罰分關(guān)如在此所用,“表達(dá)載體”意指包括dna序列的dna構(gòu)建體,該dna序列可操作地連接到能夠影響dna在合適宿主中表達(dá)的合適的控制序列。這樣的控制序列可以包括影響轉(zhuǎn)錄的啟動(dòng)子,控制轉(zhuǎn)錄的任選的操縱子序列,編碼mrna上適當(dāng)?shù)暮颂求w結(jié)合位點(diǎn)的序列,以及控制轉(zhuǎn)錄和翻譯終止的序列。不同的細(xì)胞類型可以與不同的表達(dá)載體一起使用。在枯草芽孢桿菌中使用的載體的示例性啟動(dòng)子是apre啟動(dòng)子;在變鉛青鏈霉菌中使用的示例性啟動(dòng)子是a4啟動(dòng)子(來自黑曲霉);在大腸桿菌中使用的示例性啟動(dòng)子是lac啟動(dòng)子,在釀酒酵母中使用的示例性啟動(dòng)子是pgk1,在黑曲霉中使用的示例性啟動(dòng)子是glaa,并且用于里氏木霉的示例性啟動(dòng)子是cbhi。載體可以是質(zhì)粒、噬菌體顆粒,或簡單地是潛在的基因組插入物。一旦轉(zhuǎn)化到合適的宿主中,載體可以獨(dú)立于宿主基因組復(fù)制并起作用,或者可以在合適的條件下整合到基因組本身中。在本說明書中,質(zhì)粒和載體有時(shí)可互換使用。然而,本發(fā)明組合物和方法旨在包括發(fā)揮等效功能并且本領(lǐng)域已知或?qū)⒊蔀橐阎钠渌问降谋磉_(dá)載體。因此,可以在表達(dá)在此所述的dna序列中使用多種宿主/表達(dá)載體組合。例如,有用的表達(dá)載體可以由染色體、非染色體和合成dna序列的區(qū)段組成,如sv40的各種已知衍生物和已知的細(xì)菌質(zhì)粒,例如來自大腸桿菌的質(zhì)粒,這些質(zhì)粒包括cole1、pcr1、pbr322、pmb9、puc19及其衍生物,更廣泛的宿主范圍質(zhì)粒,例如rp4,噬菌體dna,例如噬菌體λ的多種衍生物,例如nm989,和其他dna噬菌體,例如m13和絲狀單鏈dna噬菌體,酵母質(zhì)粒如2μ質(zhì)?;蚱溲苌铮捎糜谡婧思?xì)胞的載體,如可用于動(dòng)物細(xì)胞的載體和衍生自質(zhì)粒和噬菌體dna的組合的載體,如經(jīng)修飾以使用噬菌體dna或其他表達(dá)控制序列的質(zhì)粒。使用本發(fā)明組合物和方法的表達(dá)載體的表達(dá)技術(shù)是本領(lǐng)域已知的,并且通常描述于例如薩姆布魯克(sambrook)等人,分子克?。簩?shí)驗(yàn)室手冊,第二版(molecularcloning:alaboratorymanual,secondedition),冷泉港實(shí)驗(yàn)室出版社(1989)中。通常,經(jīng)整合事件通過直接插入特定物種的基因組,將包含在此所述的dna序列的此類表達(dá)載體轉(zhuǎn)化到單細(xì)胞宿主中(參見,例如,班尼特(bennett)和拉熱(lasure),真菌中的更多基因操縱(moregenemanipulationsinfungi),學(xué)術(shù)出版社,圣迭哥,第70-76頁(1991)以及其中引用的描述了在真菌宿主中靶向的基因組插入物的文章)。如在此所用,“宿主菌株”或“宿主細(xì)胞”意指根據(jù)本發(fā)明組合物和方法,對于包含dna的表達(dá)載體而言合適的宿主。在本發(fā)明組合物和方法中有用的宿主細(xì)胞通常是原核或真核宿主,包括可以實(shí)現(xiàn)表達(dá)的任何可轉(zhuǎn)化的微生物。具體來說,宿主菌株可以是枯草芽孢桿菌、變鉛青鏈霉菌、大腸桿菌、里氏木霉、釀酒酵母或黑曲霉。在某些實(shí)施例中,宿主細(xì)胞可以是產(chǎn)乙醇微生物,其可以是例如酵母如釀酒酵母或產(chǎn)乙醇細(xì)菌如運(yùn)動(dòng)發(fā)酵單胞菌。當(dāng)使用釀酒酵母或運(yùn)動(dòng)發(fā)酵單胞菌作為宿主細(xì)胞時(shí),并且如果β-葡糖苷酶基因不能從宿主細(xì)胞中分泌而是在細(xì)胞內(nèi)表達(dá),則可將纖維二糖轉(zhuǎn)運(yùn)蛋白基因?qū)胨拗骷?xì)胞中,以便允許細(xì)胞內(nèi)表達(dá)的β-葡糖苷酶作用于纖維二糖底物并釋放葡萄糖,然后該葡萄糖隨后或立即由微生物代謝并轉(zhuǎn)化成乙醇。用使用重組dna技術(shù)構(gòu)建的載體轉(zhuǎn)化或轉(zhuǎn)染宿主細(xì)胞。這種轉(zhuǎn)化的宿主細(xì)胞能夠進(jìn)行如下中的一種或兩種:復(fù)制編碼ggr3a(及其衍生物或變體(突變體))的載體并且表達(dá)所希望的肽產(chǎn)物。在某些實(shí)施例中,根據(jù)本發(fā)明組合物和方法,“宿主細(xì)胞”意指從木霉屬物種的細(xì)胞產(chǎn)生的細(xì)胞和原生質(zhì)體。關(guān)于細(xì)胞使用的術(shù)語“轉(zhuǎn)化”,“穩(wěn)定轉(zhuǎn)化”和“轉(zhuǎn)基因”意指細(xì)胞包含整合到其基因組中或作為通過多代維系的附加體的非天然(例如異源)核酸序列。在將核酸序列插入細(xì)胞的背景下,術(shù)語“引入”意指本領(lǐng)域已知的“轉(zhuǎn)染”、“轉(zhuǎn)化”或“轉(zhuǎn)導(dǎo)”?!八拗骶辍被颉八拗骷?xì)胞”是已經(jīng)引入了表達(dá)載體、噬菌體、病毒或其他dna構(gòu)建體,包括編碼感興趣多肽(例如,β-葡糖苷酶)的多核苷酸的生物體。示例性的宿主菌株是能夠表達(dá)感興趣的多肽的微生物細(xì)胞(例如,細(xì)菌、絲狀真菌和酵母)。術(shù)語“宿主細(xì)胞”包括從細(xì)胞產(chǎn)生的原生質(zhì)體。關(guān)于多核苷酸或多肽的術(shù)語“異源”是指不是天然存在于宿主細(xì)胞中的多核苷酸或多肽。關(guān)于多核苷酸或多肽的術(shù)語“內(nèi)源”是指天然存在于宿主細(xì)胞中的多核苷酸或多肽。術(shù)語“表達(dá)”是指基于核酸序列產(chǎn)生多肽的過程。該過程包括轉(zhuǎn)錄和翻譯。因此,在一些實(shí)施例中,將木質(zhì)纖維素生物質(zhì)底物轉(zhuǎn)化為乙醇的過程可以包括兩種β-葡糖苷酶活性。例如,在糖化或水解步驟期間可以將第一β-葡糖苷酶活性應(yīng)用于木質(zhì)纖維素生物質(zhì)底物,并且第二β-葡糖苷酶活性可以作為產(chǎn)乙醇微生物的一部分應(yīng)用于發(fā)酵步驟,在該發(fā)酵步驟期間由糖化或水解步驟產(chǎn)生的單體糖或可發(fā)酵糖被代謝。在一些實(shí)施例中,第一和第二β-葡糖苷酶活性可以由相同的β-葡糖苷酶多肽的存在產(chǎn)生。例如,糖化中的第一β-葡糖苷酶活性可能是由本發(fā)明的ggr3a多肽的存在引起的,而發(fā)酵階段中的第二β-葡糖苷酶活性可能是由產(chǎn)乙醇微生物表達(dá)不同的β-葡糖苷酶引起的。在另一個(gè)實(shí)例中,第一和第二β-葡糖苷酶活性可以由糖化或水解步驟和發(fā)酵步驟中相同多肽的存在引起。例如,在一些實(shí)施例中,本發(fā)明的相同的ggr3a多肽可以為水解或糖化步驟和發(fā)酵步驟二者提供β-葡糖苷酶活性。在某些其他實(shí)施例中,將木質(zhì)纖維素生物質(zhì)底物轉(zhuǎn)化為乙醇的過程可以包括兩種β-葡糖苷酶活性,而糖化或水解步驟和發(fā)酵步驟同時(shí)發(fā)生,例如在同一罐中。兩種或多種β-葡糖苷酶多肽可能有助于β-葡糖苷酶活性,其中一種可能是本發(fā)明的ggr3a多肽。在某些另外的實(shí)施例中,將木質(zhì)纖維素生物質(zhì)轉(zhuǎn)化為乙醇的過程可以包括單一的β-葡糖苷酶活性,而糖化或水解步驟或發(fā)酵步驟(但不是兩個(gè)步驟都)涉及β-葡糖苷酶的參與。例如,本發(fā)明的ggr3a多肽或包含ggr3a多肽的組合物可在糖化步驟中使用。在另一個(gè)實(shí)例中,用于水解木質(zhì)纖維素生物質(zhì)底物的酶組合物不包括β-葡糖苷酶活性,而產(chǎn)乙醇微生物表達(dá)β-葡糖苷酶多肽,例如本發(fā)明的ggr3a多肽。如在此所用,“信號序列”意指與多肽的n末端部分結(jié)合的氨基酸序列,該氨基酸序列有助于成熟形式的多肽在細(xì)胞外部的分泌。信號序列的定義是功能序列。細(xì)胞外多肽的成熟形式缺乏在分泌過程中被切除的信號序列。雖然ggr3a的天然信號序列可以在本發(fā)明組合物和方法的方面中使用,但也可以使用其他非天然信號序列(例如,seqidno:11)。當(dāng)提及本文的多肽時(shí),術(shù)語“成熟”意指在翻譯和任何翻譯后修飾后處于其最終形式的多肽。例如,本發(fā)明的ggr3a多肽具有一種或多種成熟形式,這些成熟形式中至少一種具有seqidno:3的氨基酸序列。本發(fā)明的β-葡糖苷酶多肽可以稱為“前體”,“未成熟”或“全長”,在這種情況下,它們包括信號序列;或者可以稱為“成熟”,在這種情況下,它們?nèi)狈π盘栃蛄?。成熟形式的多肽通常是最有用的。除非另有說明,在此使用的氨基酸殘基編號是指相應(yīng)淀粉酶多肽的成熟形式。只要所得多肽保留β-葡糖苷酶活性,本發(fā)明的β-葡糖苷酶多肽也可被截短以除去n或c-末端。本發(fā)明的β-葡糖苷酶多肽也可以是“嵌合”或“雜合”多肽,因?yàn)樗ㄖ辽僖徊糠值谝沪?葡糖苷酶多肽,和至少一部分第二β-葡糖苷酶多肽(這樣的嵌合β-葡糖苷酶多肽可以例如使用已知技術(shù)從第一和第二β-葡糖苷酶衍生,這些技術(shù)涉及在每個(gè)β-葡糖苷酶上的結(jié)構(gòu)域交換)。本發(fā)明的β-葡糖苷酶多肽可進(jìn)一步包括異源信號序列,即允許跟蹤或純化等的表位。當(dāng)術(shù)語“異源”用于指用于表達(dá)感興趣的多肽的信號序列時(shí),這意味著信號序列例如作為感興趣的多肽衍生自不同微生物。用于表達(dá)本文ggr3a多肽的合適的異源信號序列的實(shí)例可以是例如來自里氏木霉的那些,例如像seqidno:11、12、13、14或15中的任一種。如在此所用,“功能附接”或“可操作地連接”意指具有已知或所期望活性的調(diào)節(jié)區(qū)域或功能結(jié)構(gòu)域(如啟動(dòng)子、終止子、信號序列或增強(qiáng)子區(qū))按這樣一種方式附接于或連接于靶標(biāo)(例如,基因或多肽),以允許調(diào)節(jié)區(qū)域或功能結(jié)構(gòu)域根據(jù)其已知或期望的活性來控制該靶標(biāo)的表達(dá)、分泌或功能。如在此所用,術(shù)語“多肽”和“酶”可互換使用,是指包括通過肽鍵連接的氨基酸殘基的任何長度的聚合物。在此使用氨基酸殘基的常規(guī)單字母或三字母密碼。聚合物可以是線性的或支化的,它可以包含修飾的氨基酸,并且它可以被非氨基酸中斷。該術(shù)語還涵蓋已經(jīng)自然地或通過干預(yù)被修飾的氨基酸聚合物;這些修飾是例如,二硫鍵形成、糖基化、脂化、乙?;?、磷酸化或任何其他操縱或修飾,例如與標(biāo)記組分軛合。定義中還包括例如含有一個(gè)或多個(gè)氨基酸類似物(包括例如非天然氨基酸等)以及本領(lǐng)域已知的其他修飾的多肽。如在此所用,“野生型”和“天然”基因、酶、或菌株是自然界中發(fā)現(xiàn)的那些。關(guān)于多肽,術(shù)語“野生型”、“親本”或“參考”是指在一個(gè)或多個(gè)氨基酸位置處不包含人為取代、插入或缺失的天然存在的多肽。類似地,關(guān)于多核苷酸,術(shù)語“野生型”,“親本”或“參考”是指不包含人為核苷變化的天然存在的多核苷酸。然而,編碼野生型、親本或參考多肽的多核苷酸不限于天然存在的多核苷酸,而是涵蓋編碼野生型、親本或參考多肽的任何多核苷酸。如在此所用,“變體多肽”是指通過取代、添加或缺失一個(gè)或多個(gè)氨基酸,通常通過重組dna技術(shù)衍生自親本(或參考)多肽的多肽。變體多肽可以與親本多肽相差少量氨基酸殘基。它們可以通過其與親本多肽的伯氨基酸序列同源性/同一性的水平來定義。適當(dāng)?shù)兀凅w多肽與親本多肽具有至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或甚至至少99%氨基酸序列同一性。如在此所用,“變體多核苷酸”編碼變體多肽,與親本多核苷酸具有特定程度的同源性/同一性,或在嚴(yán)格條件下與親本多核苷酸或其補(bǔ)體雜交。適當(dāng)?shù)兀凅w多核苷酸與親本多核苷酸或親本多核苷酸的補(bǔ)體具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或甚至至少99%的核苷酸序列同一性。用于確定同一性百分比的方法是本領(lǐng)域已知的并且如上所述。術(shù)語“衍生自”涵蓋術(shù)語“源自”、“從...獲得”、“可從...獲得”、“從...分離”和“從...產(chǎn)生”,并且通常表示一個(gè)指定的材料在另一個(gè)指定的材料中找到其起源或具有可以參考另一指定材料來描述的特征。如在此所用,術(shù)語“雜交條件”是指進(jìn)行雜交反應(yīng)的條件。這些條件通常根據(jù)雜交在其下測量的條件的“嚴(yán)格”度來分類。嚴(yán)格度可以是基于例如結(jié)合復(fù)合物或探針的核酸的解鏈溫度(tm)。例如,“最大嚴(yán)格”通常發(fā)生在約tm-5℃(低于探針的tm5℃);“高嚴(yán)格”發(fā)生在低于tm約5℃-10℃;“中等嚴(yán)格”發(fā)生在低于探針的tm約10℃-20℃;并且“低嚴(yán)格”發(fā)生在低于tm約20℃-25℃。可替代地,或另外,雜交條件可以基于雜交的鹽或離子強(qiáng)度條件,和/或基于在一個(gè)或多個(gè)嚴(yán)格洗滌,例如:6xssc=非常低嚴(yán)格;3xssc=低至中嚴(yán)格;1xssc=中嚴(yán)格;以及0.5xssc=高嚴(yán)格。在功能上,最大嚴(yán)格條件可以用于鑒定與雜交探針具有嚴(yán)格同一性或近乎嚴(yán)格同一性的核酸序列;而高嚴(yán)格條件用于鑒定與探針具有約80%或更高序列同一性的核酸序列。對于需要高選擇性的應(yīng)用,通常希望使用相對嚴(yán)格的條件來形成雜交體(例如,使用相對較低的鹽和/或高溫條件)。如在此所用,術(shù)語“雜交”是指通過堿基配對將核酸鏈與互補(bǔ)鏈連接的過程,如本領(lǐng)域已知的。更具體來說,“雜交”是指在印跡雜交技術(shù)和pcr技術(shù)期間發(fā)生的,一條核酸與互補(bǔ)鏈形成雙鏈體,即堿基對的過程。如果兩個(gè)序列在中至高嚴(yán)格雜交和洗滌條件下彼此特異性雜交,則認(rèn)為核酸序列可與參考核酸序列“選擇性雜交”。雜交條件是基于結(jié)合復(fù)合物或探針的核酸的解鏈溫度(tm)。例如,“最大嚴(yán)格”通常發(fā)生在約tm-5℃(低于探針的tm5°);“高嚴(yán)格”在低于tm約5℃-10℃;“中等嚴(yán)格”在低于探針的tm約10℃-20℃;以及“高嚴(yán)格”在低于tm約20℃-25℃。在功能上,最大嚴(yán)格條件可以用于鑒定與雜交探針具有嚴(yán)格同一性或近乎嚴(yán)格同一性的序列;而中等或低嚴(yán)格雜交可用于鑒定或檢測多核苷酸序列同系物。中等和高嚴(yán)格雜交條件是本領(lǐng)域公知的。例如,中等嚴(yán)格雜交可以在37℃下在包括20%甲酰胺,5xssc(150mmnacl,15mm檸檬酸三鈉),50mm磷酸鈉(ph7.6),5x登哈特溶液,10%葡聚糖硫酸鹽和20mg/ml變性剪切的鮭魚精子dna的溶液中過夜孵育,然后在約37℃-50℃下以1xssc洗滌濾器來進(jìn)行。高嚴(yán)格雜交條件可以是在65℃和0.1xssc(其中1xssc=0.15mnacl,0.015m檸檬酸鈉,ph7.0)下的雜交。可替代地,高度嚴(yán)格雜交條件可以在約42℃下在50%甲酰胺,5xssc,5x登哈特溶液,0.5%sds和100μg/ml變性載體dna中進(jìn)行,隨后在室溫下在2xssc和0.5%sds中洗滌兩次,并在42℃下在0.1xssc和0.5%sds中再洗滌兩次。并且非常高的嚴(yán)格雜交條件可能是在68℃和0.1xssc下的雜交。如果需要,本領(lǐng)域技術(shù)人員知道如何調(diào)節(jié)溫度、離子強(qiáng)度等以適應(yīng)因素如探針長度等等。與seqidno:1的核苷酸和其同一的補(bǔ)體之間形成的雙鏈體相比,編碼變體β-葡糖苷酶的核酸可以具有降低1℃-3℃或更多的tm。在至少兩種核酸或多肽的背景下,“基本相似”或“基本上同一”意指多核苷酸或多肽包含與親本或參照序列具有至少約90%,至少約91%、至少約92%、至少約93%、至少約94%、至少約95%、至少約96%、至少約97%、至少約98%、或甚至至少約99%同一性的序列,或不包括只是為了規(guī)避本說明書而不添加功能的氨基酸取代、插入、缺失或修飾。如在此所用,“表達(dá)載體”是指包含編碼特定多肽的dna序列的dna構(gòu)建體,并且可操作地連接到能夠在合適的宿主中實(shí)現(xiàn)多肽表達(dá)的合適的控制序列。這樣的控制序列可以包括影響轉(zhuǎn)錄的啟動(dòng)子,控制這種轉(zhuǎn)錄的可選擇的操縱子序列,編碼適合的mrna核糖體結(jié)合位點(diǎn)的序列和/或控制轉(zhuǎn)錄和翻譯終止的序列的序列。載體可以是質(zhì)粒、噬菌體顆?;驖撛诘幕蚪M插入物。一旦轉(zhuǎn)化到合適的宿主中,載體可以獨(dú)立于宿主基因組復(fù)制并起作用,或者在某些情況下可以整合到宿主基因組中。術(shù)語“重組”是指如通過以下各項(xiàng)被修飾以改變其序列或表達(dá)特征的遺傳材料(即核酸、它們編碼的多肽、以及包含此類多核苷酸的載體和細(xì)胞):使編碼序列突變以產(chǎn)生改變的多肽,將編碼序列融合到另一基因的編碼序列,將基因置于不同啟動(dòng)子的控制下,在異源生物體中表達(dá)基因,以降低或升高的水平表達(dá)基因,以與其天然表達(dá)譜不同的方式有條件地或組成地表達(dá)基因,等等。通常,基于此的重組核酸、多肽和細(xì)胞已被人為操縱,這樣使得它們與自然界中發(fā)現(xiàn)的相關(guān)的核酸、多肽和細(xì)胞不同一?!靶盘栃蛄小笔侵概c多肽的n末端部分結(jié)合的并且有利于成熟形式的多肽從細(xì)胞中分泌的氨基酸序列。細(xì)胞外多肽的成熟形式缺乏在分泌過程中被切除的信號序列。術(shù)語“選擇性標(biāo)志物”或“可選擇的標(biāo)志物”是指能夠在宿主細(xì)胞中表達(dá)的基因,該基因允許容易地選擇包含導(dǎo)入的核酸或載體的那些宿主??蛇x擇的標(biāo)志物的實(shí)例包括但不限于在宿主細(xì)胞上賦予代謝優(yōu)勢(例如營養(yǎng)優(yōu)勢)的抗微生物物質(zhì)(例如,潮霉素、博來霉素、或氯霉素)和/或基因。術(shù)語“調(diào)節(jié)元件”是指控制核酸序列的表達(dá)的一些方面的遺傳元件。例如,啟動(dòng)子是有利于可操作地連接的編碼區(qū)的轉(zhuǎn)錄的起始的調(diào)節(jié)元件。另外的調(diào)節(jié)元件包括剪接信號、聚腺苷酸化信號和終止信號。如在此所用,“宿主細(xì)胞”通常是用本領(lǐng)域已知的重組dna技術(shù)構(gòu)建的載體轉(zhuǎn)化或轉(zhuǎn)染的原核或真核宿主的細(xì)胞。轉(zhuǎn)化的宿主細(xì)胞能夠復(fù)制編碼多肽變體的載體或表達(dá)所希望的多肽變體。在編碼預(yù)成型或形成(pro-form)多肽變體的載體的情況下,當(dāng)表達(dá)時(shí),這些變體通常從宿主細(xì)胞分泌到宿主細(xì)胞培養(yǎng)基中。在將核酸序列插入細(xì)胞的背景下,術(shù)語“引入”是指轉(zhuǎn)化、轉(zhuǎn)導(dǎo)或轉(zhuǎn)染。轉(zhuǎn)化手段包括本領(lǐng)域已知的原生質(zhì)體轉(zhuǎn)化、氯化鈣沉淀、電穿孔、裸dna等等。(參見,常(chang)和科恩(cohen)分子遺傳學(xué)和基因組(mol.gen.genet.)168:111-115,1979;史密斯(smith)等人,應(yīng)用與環(huán)境微生物學(xué)(appl.env.microbiol.)51:634,1986;和法拉利(ferrari)等人,在哈伍德,芽孢桿菌屬(bacillus),普萊南出版公司,第57-72頁數(shù),1989中的評論文章)?!叭诤稀倍嚯男蛄型ㄟ^兩個(gè)受試多肽序列之間的肽鍵連接,即可操作地連接。術(shù)語“絲狀真菌”是指所有絲狀形式的真菌亞門,特別是子囊菌亞門物種。“產(chǎn)乙醇微生物微生物”是指具有將糖或寡糖轉(zhuǎn)化為乙醇的能力的微生物。其他技術(shù)和科學(xué)術(shù)語具有與本披露所屬領(lǐng)域的普通技術(shù)人員通常理解的相同的含義(參見,例如,辛格爾頓(singleton)和塞恩思伯里(sainsbury),微生物學(xué)和分子生物學(xué)詞典(dictionaryofmicrobiologyandmolecularbiology),第2版,約翰·威利父子出版公司,紐約州1994;和黑爾(hale)和邁爾哈姆(marham),哈伯科林斯生物學(xué)詞典(theharpercollinsdictionaryofbiology),哈珀永久出版社,紐約州1991)。β-葡糖苷酶多肽、多核苷酸、載體和宿主細(xì)胞ggr3a多肽在一方面,本發(fā)明組合物和方法提供具有β-葡糖苷酶活性的重組ggr3aβ-葡糖苷酶多肽、其片段或其變體。從禾生小叢殼中分離重組β-葡糖苷酶多肽的實(shí)例。成熟的ggr3a多肽具有如seqidno:3所示的氨基酸序列。(預(yù)測的信號序列如seqidno:45所示。)類似的,基本上相似的ggr3a多肽可以在自然界中存在,例如存在于禾生小叢殼的其他菌株或分離物中。這些和其他重組ggr3a多肽涵蓋在本發(fā)明組合物和方法中。在一些實(shí)施例中,重組ggr3a多肽是與示例性ggr3a多肽具有特定程度的氨基酸序列同一性(例如,與seqidno:2的氨基酸序列或與成熟序列seqidno:3具有至少少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或甚至至少99%序列同一性)的變體ggr3a多肽。如在此所述,序列同一性可以通過氨基酸序列比對例如,使用程序例如blast、align、或clustal來確定。在某些實(shí)施例中,重組ggr3a多肽是在微生物中,例如,在細(xì)菌或真菌宿主生物體中重組生產(chǎn)的,而在其他實(shí)施例中,ggr3a多肽是合成產(chǎn)生的,或者是從天然來源(例如,禾生小叢殼)純化的。在某些實(shí)施例中,重組ggr3a多肽包括不實(shí)質(zhì)上影響多肽的結(jié)構(gòu)和/或功能的取代。這些取代的實(shí)例是保守突變,如表i所概述的。表1.氨基酸取代涉及天然存在的氨基酸的取代通常通過使編碼重組ggr3a多肽的核酸突變,然后在生物體中表達(dá)變體多肽來制備。涉及非天然存在的氨基酸的取代或?qū)Π被岬幕瘜W(xué)修飾通常通過在由生物體合成后化學(xué)修飾ggr3a多肽來制備。在一些實(shí)施例中,變體重組ggr3a多肽與seqidno:2或seqidno:3基本同一,這意味著它們不包括不實(shí)質(zhì)上影響多肽結(jié)構(gòu)、功能或表達(dá)的氨基酸取代、插入或缺失。這樣的變體重組ggr3a多肽將包括被設(shè)計(jì)為規(guī)避本說明書的那些。在一些實(shí)施例中,變體重組ggr3a多肽、包括這些變體的組合物和方法與seqidno:2或seqidno:3不實(shí)質(zhì)上相同,而是包括氨基酸取代、插入或缺失,在某些情況下,這些氨基酸取代、插入或缺失實(shí)質(zhì)上影響本文多肽的結(jié)構(gòu)、功能或表達(dá),這樣使得可以實(shí)現(xiàn)與seqidno:2或seqidno:3的多肽的特征相比改進(jìn)的特征,這些特征包括例如:改進(jìn)的對水解木質(zhì)纖維素底物的比活性、改進(jìn)的在所需宿主生物體中的表達(dá)、改進(jìn)的熱穩(wěn)定性、ph穩(wěn)定性等。在一些實(shí)施例中,重組ggr3a多肽(包括其變體)具有β-葡糖苷酶活性??梢允褂迷诖怂龅臏y定,例如實(shí)例2中所述的那些,或通過本領(lǐng)域已知的其他測定確定和測量β-葡糖苷酶活性。重組ggr3a多肽包括保留β-葡糖苷酶活性的“全長”ggr3a多肽的片段。優(yōu)選地,那些功能片段(即,保留β-葡糖苷酶活性的片段)長度為至少100個(gè)氨基酸殘基(例如,至少100個(gè)氨基酸殘基、至少120個(gè)氨基酸殘基、至少140個(gè)氨基酸殘基、至少160個(gè)氨基酸殘基、至少180個(gè)氨基酸殘基、至少200個(gè)氨基酸殘基、至少250個(gè)氨基酸殘基、至少3000個(gè)氨基酸殘基、至少350個(gè)氨基酸殘基、至少400個(gè)氨基酸殘基、至少450個(gè)氨基酸殘基、至少500個(gè)氨基酸殘基、或至少600個(gè)氨基酸殘基的長度或更長)。這樣的片段適當(dāng)?shù)乇A羧L前體多肽或全長成熟多肽的活性位點(diǎn),但可以具有非關(guān)鍵氨基酸殘基的缺失??梢允褂迷诖怂龅臏y定,例如實(shí)例2中所述的那些,或通過本領(lǐng)域已知的其他測定容易地確定片段的活性。在一些實(shí)施例中,ggr3a氨基酸序列和衍生物作為n-和/或c-末端融合蛋白產(chǎn)生,例如,以幫助提取、檢測和/或純化ggr3a多肽和/或向ggr3a多肽添加功能性質(zhì)。融合蛋白伴侶的實(shí)例包括但不限于:谷胱甘肽-s-轉(zhuǎn)移酶(gst)、6xhis、gal4(dna結(jié)合和/或轉(zhuǎn)錄激活結(jié)構(gòu)域)、flag-、myc-標(biāo)簽或本領(lǐng)域技術(shù)人員已知的其他標(biāo)簽。在一些實(shí)施例中,在融合蛋白伴侶和感興趣的多肽序列之間提供蛋白水解切割位點(diǎn)以允許去除融合序列。適當(dāng)?shù)?,融合蛋白不阻礙重組ggr3a多肽的活性。在一些實(shí)施例中,重組ggr3a多肽與包括前導(dǎo)肽、前肽、結(jié)合結(jié)構(gòu)域和/或催化結(jié)構(gòu)域的功能結(jié)構(gòu)域融合。融合蛋白任選地通過接頭序列與重組ggr3a多肽連接,該接頭序列連接ggr3a多肽和融合結(jié)構(gòu)域,而不實(shí)質(zhì)上影響任一組分的性質(zhì)。該接頭任選地在功能上有助于預(yù)期的應(yīng)用。本披露提供被工程化以表達(dá)本披露的一種或多種ggr3a多肽的宿主細(xì)胞。合適的宿主細(xì)胞包括任何微生物的細(xì)胞(例如,細(xì)菌、原生生物、藻類、真菌(例如酵母或絲狀真菌)或其他微生物的細(xì)胞),并且優(yōu)選地是細(xì)菌、酵母、或絲狀真菌的細(xì)胞。細(xì)菌屬的合適的宿主細(xì)胞包括但不限于:埃希氏菌屬、芽孢桿菌屬、乳酸桿菌屬、假單胞菌屬和鏈霉菌屬的細(xì)胞。細(xì)菌物種的合適細(xì)胞包括但不限于:大腸桿菌、枯草芽孢桿菌、地衣芽孢桿菌、短乳酸桿菌、銅綠假單胞菌和變鉛青鏈霉菌的細(xì)胞。酵母屬的合適的宿主細(xì)胞包括但不限于:酵母菌屬、裂殖酵母屬、假絲酵母屬、漢遜酵母屬、畢赤酵母屬、克魯維酵母屬和法夫酵母屬的細(xì)胞。酵母物種的合適細(xì)胞包括但不限于:釀酒酵母、粟酒裂殖酵母、白色念珠菌、多形漢遜酵母、巴斯德畢赤酵母、加拿大畢赤酵母、馬克思克魯維酵母和紅法夫酵母的細(xì)胞。絲狀真菌的合適的宿主細(xì)胞包括所有絲狀形式的真菌亞門細(xì)胞。絲狀真菌屬的適當(dāng)細(xì)胞包括但不限于:支頂孢屬、曲霉屬、短梗霉屬、煙管菌屬、擬蠟菌屬、金孢屬、鬼傘屬、革蓋菌屬、棒囊殼屬、毛殼菌屬、隱球菌屬、線黑粉菌屬、鐮刀菌屬、赤霉菌屬、腐質(zhì)霉屬、梨孢菌屬(magnaporthe)、毛霉屬、毀絲霉屬、毛霉屬、新美鞭菌屬、脈孢菌屬、擬青霉屬、青霉菌屬、平革菌屬、射脈菌屬、瘤胃壺菌屬、側(cè)耳屬、柱頂孢屬、裂褶菌屬、孢子絲菌屬、籃狀菌屬、嗜熱子囊菌屬、梭孢殼霉屬、彎頸霉屬、栓菌屬、和木霉屬的細(xì)胞。絲狀真菌物種的合適細(xì)胞包括但不限于:泡盛曲霉、煙曲霉、臭曲霉、日本曲霉、構(gòu)巢曲霉、黑曲霉、米曲霉、盧克諾文思金孢子菌(chrysosporiumlucknowense)、桿孢狀鐮孢菌(fusariumbactridioides)、谷類鐮孢菌(fusariumcerealis)、克地鐮孢菌(fusariumcrookwellense)、黃色鐮孢菌(fusariumculmorum)、禾谷鐮孢菌(fusariumgraminearum)、禾赤鐮孢菌(fusariumgraminum)、異孢鐮孢菌(fusariumheterosporum)、合歡木鐮孢菌(fusariumnegundi)、尖孢鐮孢菌、多枝鐮孢菌、粉紅鐮孢菌、接骨木鐮孢菌、膚色鐮孢菌、擬枝孢鐮孢菌、硫色鐮孢菌、圓鐮孢菌、擬絲孢鐮孢菌、鑲片鐮孢菌、黑刺煙管菌、干擬蠟菌(ceriporiopsisaneirina)、干擬蠟菌、卡內(nèi)基擬蠟菌(ceriporiopsiscaregiea)、淺黃擬蠟孔菌(ceriporiopsisgilvescens)、潘諾希塔擬蠟菌(ceriporiopsispannocinta)、環(huán)帶擬蠟菌(ceriporiopsisrivulosa)、微紅擬蠟菌(ceriporiopsissubrufa)、蟲擬蠟菌、灰蓋鬼傘、毛革蓋菌、特異腐質(zhì)霉、柔毛腐質(zhì)霉、米黑毛霉、嗜熱毀絲霉、粗壯脈紋孢菌、間型脈孢菌、產(chǎn)紫青霉菌、變灰青霉菌、離生青霉菌(penicilliumsolitum)、繩狀青霉菌(penicilliumfuniculosum)、黃孢原毛平革菌(phanerochaetechrysosporium)、射脈菌(phlebiaradiate)、刺芹側(cè)耳、黃籃狀菌(talaromycesflavus)、土生梭孢霉、長絨毛栓菌、變色栓菌、哈茨木霉、康寧木霉、長枝木霉、里氏木霉、和綠色木霉的細(xì)胞。將核酸轉(zhuǎn)化成這些生物體的方法是本領(lǐng)域已知的。例如,用于轉(zhuǎn)化曲霉屬宿主細(xì)胞的合適方法描述于ep238023中。在一些實(shí)施例中,將重組ggr3a多肽與信號肽融合以例如促進(jìn)重組ggr3a多肽的細(xì)胞外分泌。例如,在某些實(shí)施例中,信號肽由選自seqidno:11-40的序列編碼。在具體實(shí)施例中,重組ggr3a多肽在異源生物體中作為分泌的多肽進(jìn)行表達(dá)。因此,本文組合物和方法涵蓋在異源生物體中用于表達(dá)作為分泌的多肽的ggr3a多肽的方法。在一些實(shí)施例中,重組ggr3a多肽在細(xì)胞內(nèi)在異源生物體中表達(dá),例如當(dāng)異源生物體是產(chǎn)乙醇微生物如釀酒酵母或運(yùn)動(dòng)發(fā)酵單胞菌時(shí)。在這些情況下,可以使用遺傳工程工具將纖維二糖轉(zhuǎn)運(yùn)蛋白基因引入生物體中,以使ggr3a多肽作用于生物體內(nèi)的纖維二糖底物以將纖維二糖轉(zhuǎn)化為d-葡萄糖,然后將該d-葡萄糖通過有機(jī)體代謝或轉(zhuǎn)化為乙醇。本披露還提供了包括上述核酸的表達(dá)盒和/或載體。適當(dāng)?shù)兀幋a本披露的ggr3a多肽的核酸可操作地連接于啟動(dòng)子。啟動(dòng)子是本領(lǐng)域公知的。在宿主細(xì)胞中起作用的任何啟動(dòng)子可用于β-葡糖苷酶和/或本披露的任何其他核酸的表達(dá)??捎糜隍?qū)動(dòng)β-葡糖苷酶核酸和/或本發(fā)明的任何其他核酸在各種宿主細(xì)胞中的表達(dá)的起始控制區(qū)或啟動(dòng)子是眾多的并且是本領(lǐng)域技術(shù)人員熟悉的(參見,例如,wo2004/033646及其中引用的參考文獻(xiàn))??梢允褂脦缀跞魏文軌蝌?qū)動(dòng)這些核酸的啟動(dòng)子。具體來說,在需要在絲狀真菌宿主中重組表達(dá)時(shí),啟動(dòng)子可以是絲狀真菌啟動(dòng)子。核酸可以例如在異源啟動(dòng)子的控制下。核酸也可以在組成型或誘導(dǎo)型啟動(dòng)子的控制下表達(dá)??梢允褂玫膯?dòng)子的實(shí)例包括但不限于:纖維素酶啟動(dòng)子、木聚糖酶啟動(dòng)子、1818啟動(dòng)子(以前通過對木霉屬進(jìn)行est基因作圖被鑒定為高度表達(dá)的蛋白質(zhì))。例如,啟動(dòng)子可以適當(dāng)?shù)厥抢w維二糖水解酶、內(nèi)切葡聚糖酶或β-葡糖苷酶啟動(dòng)子。特別合適的啟動(dòng)子可以是例如里氏木霉纖維二糖水解酶、內(nèi)切葡聚糖酶或β-葡糖苷酶啟動(dòng)子。例如,啟動(dòng)子是纖維二糖水解酶i(cbh1)啟動(dòng)子。啟動(dòng)子的非限制性實(shí)例包括cbh1、cbh2、egl1、egl2、egl3、egl4、egl5、pki1、gpd1、xyn1、或xyn2啟動(dòng)子。啟動(dòng)子的另外的非限制性實(shí)例包括里氏木霉cbh1、cbh2、egl1、egl2、egl3、egl4、egl5、pki1、gpd1、xyn1、或xyn2啟動(dòng)子。編碼本文ggr3a多肽的核酸序列可以包括在載體中。在一些方面,載體包含在表達(dá)控制序列控制下編碼ggr3a多肽的核酸序列。在一些方面,表達(dá)控制序列是天然表達(dá)控制序列。在一些方面,表達(dá)控制序列是非天然表達(dá)控制序列。在一些方面,載體包含選擇性標(biāo)志物或可選擇的標(biāo)志物。在一些方面,將編碼ggr3a多肽的核酸序列整合到宿主細(xì)胞的沒有可選擇的標(biāo)志物的染色體中。合適的載體是與所用宿主細(xì)胞相容的那些。合適的載體可以衍生自例如細(xì)菌、病毒(如噬菌體t7或m-13衍生的噬菌體)、粘粒、酵母或植物。合適的載體可以低、中或高拷貝數(shù)維持在宿主細(xì)胞中。用于獲得和使用這些載體的方案是本領(lǐng)域技術(shù)人員已知的(參見,例如,薩姆布魯克(sambrook)等人,分子克?。簩?shí)驗(yàn)室手冊(molecularcloning:alaboratorymanual),第2版,冷泉港,1989)。在一些方面,表達(dá)載體還包括終止序列。終止控制區(qū)域也可以衍生自對宿主細(xì)胞而言天然的各種基因。在一些方面,終止序列和啟動(dòng)子序列來自相同的來源??梢允褂脴?biāo)準(zhǔn)技術(shù),將編碼ggr3a多肽的核酸序列并入載體,如表達(dá)載體中(薩姆布魯克(sambrook)等人,分子克?。簩?shí)驗(yàn)室手冊(molecularcloning:alaboratorymanual),冷泉港,1982)。在一些方面,可能需要以遠(yuǎn)高于目前在天然存在的細(xì)胞中發(fā)現(xiàn)的水平過表達(dá)ggr3a多肽和/或本披露中描述的任何其他核酸中的一種或多種。在一些實(shí)施例中,可能需要以遠(yuǎn)低于目前在天然存在的細(xì)胞中發(fā)現(xiàn)的水平低表達(dá)(例如,突變、鈍化或缺失)內(nèi)源β-葡糖苷酶和/或本披露中所述的任何其他核酸中的一種或多種。ggr3a多核苷酸在此描述的組合物和方法的另一方面是編碼具有β-葡糖苷酶活性的重組ggr3a多肽(包括其變體和片段)的多核苷酸或核酸序列。在一些實(shí)施例中,在表達(dá)載體的背景下提供多核苷酸,用于指導(dǎo)ggr3a多肽在異源生物體(如在此鑒定的異源生物體)中表達(dá)。編碼重組ggr3a多肽的多核苷酸可以與調(diào)節(jié)元件(例如啟動(dòng)子、終止子、增強(qiáng)子等等)可操作地連接以幫助表達(dá)所編碼的多肽。編碼重組ggr3a多肽的多核苷酸序列的實(shí)例具有seqidno:1的核苷酸序列。類似的,包括基本上同一的、編碼重組ggr3a多肽和變體的多核苷酸可以在自然界中存在,例如在其他菌種或禾生小叢殼或小叢殼屬物種的分離物中存在。鑒于遺傳密碼的簡并性,應(yīng)當(dāng)理解,具有不同核苷酸序列的多核苷酸可以編碼相同的ggr3a多肽、變體或片段。在一些實(shí)施例中,編碼重組ggr3a多肽的多核苷酸與編碼ggr3a多肽的示例性多核苷酸具有特定程度的氨基酸序列同一性,例如,與seqidno:2的氨基酸序列具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或甚至至少99%的序列同一性。如在此所述,同源性可以通過氨基酸序列比對例如,使用程序例如blast、align、或clustal來確定。在一些實(shí)施例中,編碼重組ggr3a多肽的多核苷酸在用于引導(dǎo)重組ggr3a多肽的細(xì)胞外分泌的信號肽的編碼序列的后面(即,下游)框內(nèi)融合。如在此所述,術(shù)語“異源”當(dāng)用于指用于表達(dá)感興趣的多肽的信號序列時(shí),意指信號序列和感興趣的多肽來自不同的生物體。異源信號序列包括例如來自其他真菌纖維素酶基因的那些,例如像seqidno:11的里氏木霉bgl1的信號序列??梢栽谶m用于表達(dá)重組ggr3a多肽、或適用于在將表達(dá)載體引入合適的宿主細(xì)胞之前繁殖表達(dá)載體的異源宿主細(xì)胞中提供表達(dá)載體。在一些實(shí)施例中,編碼重組ggr3a多肽的多核苷酸在指定的雜交條件下與seqidno:1的多核苷酸(或與其補(bǔ)體)雜交。條件的實(shí)例是在此所述的中等嚴(yán)格、高嚴(yán)格和極高的嚴(yán)格條件。ggr3a多核苷酸可以是天然存在的或合成的(即人造的),并且可以被密碼子優(yōu)化以用于在不同的宿主中表達(dá)、突變以引入克隆位點(diǎn)、或以其他方式改變以添加功能。ggr3a載體和宿主細(xì)胞為了生產(chǎn)所披露的重組ggr3a多肽,編碼多肽的dna可以從公開的序列經(jīng)化學(xué)合成、或者可以直接從具有該基因的宿主細(xì)胞(例如通過cdna文庫篩選或pcr擴(kuò)增)獲得。在一些實(shí)施例中,通過標(biāo)準(zhǔn)分子克隆技術(shù)將ggr3a多核苷酸包含在表達(dá)盒中和/或克隆到合適的表達(dá)載體中。這種表達(dá)盒或載體包含輔助轉(zhuǎn)錄起始和終止的序列(例如啟動(dòng)子和終止子),并且通常還可以包含一個(gè)或多個(gè)可選擇的標(biāo)志物。將表達(dá)盒或載體導(dǎo)入合適的表達(dá)宿主細(xì)胞中,該表達(dá)宿主細(xì)胞隨后表達(dá)相應(yīng)的ggr3a多核苷酸。合適的表達(dá)宿主可以是細(xì)菌或真菌微生物。細(xì)菌表達(dá)宿主可以是例如埃希氏菌屬(例如,大腸桿菌)、假單胞菌屬(例如,熒光假單胞菌或施氏假單胞菌)、變形桿菌屬(例如,奇異變形桿菌)、羅爾斯通氏菌屬(例如,富養(yǎng)羅爾斯通氏菌)、鏈霉菌屬、葡萄球菌屬(例如,肉葡萄球菌)、乳球菌屬(例如,乳酸乳球菌)、或芽孢桿菌屬(例如,枯草芽孢桿菌、巨大芽孢桿菌、地衣芽孢桿菌等)。真菌表達(dá)宿主可以是例如酵母,其也可以用作產(chǎn)乙醇微生物。酵母表達(dá)宿主可以是例如釀酒酵母、粟酒裂殖酵母、亞羅解脂酵母、多形漢遜酵母、乳酸克魯維酵母或巴斯德畢赤酵母。真菌表達(dá)宿主也可以是例如絲狀真菌宿主,包括黑曲霉、盧克諾文思金孢子菌、嗜熱毀絲霉、曲霉屬(例如,米曲霉、黑曲霉、構(gòu)巢曲霉)或里氏木霉。還適合的是哺乳動(dòng)物表達(dá)宿主如小鼠(例如,ns0)、中國倉鼠卵巢(cho)或幼倉鼠腎(bhk)細(xì)胞系。其他真核宿主如昆蟲細(xì)胞或病毒表達(dá)系統(tǒng)(例如噬菌體如m13、t7噬菌體或λ或病毒如桿狀病毒)也適用于生產(chǎn)ggr3a多肽。在特定感興趣的宿主中與分泌的蛋白質(zhì)相關(guān)的啟動(dòng)子和/或信號序列是在該宿主或其他宿主中用于異源生產(chǎn)和分泌ggr3a多肽的候選物。例如,在絲狀真菌系統(tǒng)中,驅(qū)動(dòng)纖維二糖水解酶i(cbh1)、葡糖淀粉酶a(glaa)、taka-淀粉酶(amya)、木聚糖酶(exla)、gpd-啟動(dòng)子cbh1、cbhll、內(nèi)切葡聚糖酶基因eg1-eg5、cel61b、cel74a、gpd啟動(dòng)子、pgk1、pki1、ef-1α、tef1、cdna1和hex1的基因的啟動(dòng)子是合適的,并且可以衍生自許多不同的生物體(例如,黑曲霉、里氏木霉、米曲霉、泡盛曲霉、構(gòu)巢曲霉)。在一些實(shí)施例中,ggr3a多核苷酸與編碼合適的同源或異源信號序列的多核苷酸重組結(jié)合,導(dǎo)致重組ggr3a多肽分泌到細(xì)胞外(或周質(zhì))空間中,從而允許直接檢測細(xì)胞上清液(或周質(zhì)空間或裂解物)中的酶活性。大腸桿菌、其他革蘭氏陰性細(xì)菌和本領(lǐng)域已知的其他生物體的合適的信號序列包括驅(qū)動(dòng)hlya、dsba、pbp、phoa、pelb、ompa、ompt或m13噬菌體gill基因的表達(dá)的那些。對于枯草芽孢桿菌、革蘭氏陽性生物體和本領(lǐng)域已知的其他生物體,合適的信號序列進(jìn)一步包括驅(qū)動(dòng)apre、nprb、mpr、amya、amye、blac、sacb的表達(dá)的那些,并且針對釀酒酵母或其他酵母,包括殺傷毒素、bar1、suc2、交配因子α、inu1a或ggplp信號序列。信號序列可以通過許多信號肽酶切割,從而將其從剩余的所表達(dá)的蛋白質(zhì)中除去。真菌表達(dá)信號序列可以是選自例如在此的seqidno:13-37的真菌表達(dá)信號序列。酵母菌表達(dá)信號序列可以是選自例如seqidno:36-38的酵母菌表達(dá)信號序列??赡苓m用于在運(yùn)動(dòng)發(fā)酵單胞菌中表達(dá)本發(fā)明的ggr3a多肽的信號序列可以包括例如選自seqidno:39-40的信號序列(分別由seqidno:43-44編碼;林格(linger)j.g等人,應(yīng)用與環(huán)境微生物學(xué)(appl.environ.microbiol.)76(19):6360-6369(2010))。在一些實(shí)施例中,重組ggr3a多肽單獨(dú)或作為與位于n-或c-末端的其他肽、標(biāo)簽或蛋白質(zhì)(例如,6xhis、ha或flag標(biāo)簽)的融合物來表達(dá)。合適的融合物包括促進(jìn)親和純化或檢測的標(biāo)簽、肽或蛋白質(zhì)(例如,6xhis、ha、幾丁質(zhì)結(jié)合蛋白質(zhì)、硫氧還蛋白或flag標(biāo)簽)以及促進(jìn)靶β-葡糖苷酶表達(dá)、分泌或加工的標(biāo)簽。合適的加工位點(diǎn)包括用于體內(nèi)或體外切割的腸激酶、ste13、kex2或其他蛋白酶切割位點(diǎn)。通過多種轉(zhuǎn)化方法將ggr3a多核苷酸引入表達(dá)宿主細(xì)胞中,這些方法包括但不限于:電穿孔、脂質(zhì)輔助轉(zhuǎn)化或轉(zhuǎn)染(“脂轉(zhuǎn)染”)、化學(xué)介導(dǎo)的轉(zhuǎn)染(例如cacl和/或cap)、乙酸鋰介導(dǎo)的轉(zhuǎn)化(例如,宿主細(xì)胞原生質(zhì)體的)、生物射彈“基因槍”轉(zhuǎn)化、peg介導(dǎo)的轉(zhuǎn)化(例如,宿主細(xì)胞原生質(zhì)體的)、原生質(zhì)體融合(例如,使用細(xì)菌或真核原生質(zhì)體)、脂質(zhì)體介導(dǎo)的轉(zhuǎn)化、根癌土壤桿菌、腺病毒或其他病毒或噬菌體轉(zhuǎn)化或轉(zhuǎn)導(dǎo)。細(xì)胞培養(yǎng)基通常,在適用于生產(chǎn)在此所述的ggr3a多肽的細(xì)胞培養(yǎng)基中培養(yǎng)微生物。該培養(yǎng)是使用本領(lǐng)域中已知的程序和變型,在一種適合營養(yǎng)培養(yǎng)基中發(fā)生的,該培養(yǎng)基包含碳和氮來源及無機(jī)鹽。合適的培養(yǎng)基、溫度范圍和用于生長和纖維素酶生產(chǎn)的其他條件是本領(lǐng)域已知的。作為非限制性實(shí)例,通過里氏木霉生產(chǎn)纖維素酶的典型溫度范圍為24℃至37℃,例如在25℃至30℃之間。細(xì)胞培養(yǎng)條件適用于真菌培養(yǎng)物的維持和生長的材料和方法是本領(lǐng)域公知的。在一些方面,在允許表達(dá)由插入宿主細(xì)胞的核酸編碼的一種或多種β-葡糖苷酶多肽的條件下,在培養(yǎng)基中培養(yǎng)細(xì)胞。標(biāo)準(zhǔn)細(xì)胞培養(yǎng)條件可用于培養(yǎng)細(xì)胞。在一些方面,使細(xì)胞生長并維持在適當(dāng)?shù)臏囟取怏w混合物、和ph下。在一些方面,使細(xì)胞在適當(dāng)?shù)募?xì)胞培養(yǎng)基中生長。ggr3a的活性在此披露的重組ggr3a多肽具有β-葡糖苷酶活性或水解纖維二糖并從其釋放d-葡萄糖的能力。在相同的糖化條件下,在此披露的ggr3a多肽可能比里氏木霉的基準(zhǔn)高保真β-葡糖苷酶bgl1具有更高的β-葡糖苷酶活性和改進(jìn)的或增加的從纖維二糖釋放d-葡萄糖的能力。在一些實(shí)施例中,本文ggr3a多肽可能比黑曲霉的另一種基準(zhǔn)β-葡糖苷酶b-gluy具有更高的β-葡糖苷酶活性和/或改進(jìn)的或增加的從纖維二糖釋放d-葡萄糖的能力。與里氏木霉bgl1相比,在此披露的重組ggr3a多肽可以顯著改進(jìn)或增加,例如,高出至少約20%、更優(yōu)選地高出至少約25%、優(yōu)選地高出至少約30%、更優(yōu)選地高出至少約35%、優(yōu)選地高出至少40%、甚至優(yōu)選地高出至少約45%、優(yōu)選地高出至少約50%、更優(yōu)選地高出至少約55%、并且最優(yōu)選地高出至少約60%的纖維二糖酶活性,該纖維二糖酶活性測量了酶催化纖維二糖水解,釋放d-葡萄糖的能力。在一些實(shí)施例中,重組ggr3a多肽具有約1/2、約1/3、約1/4、約1/5、或甚至約1/6的催化纖維二糖水解、釋放d-葡萄糖的能力。如實(shí)例6所示,與里氏木霉bgl1相比,重組ggr3a多肽產(chǎn)生更多的葡萄糖,同時(shí)從磷酸溶脹纖維素底物獲得較低水平的殘余纖維二糖(但相似量的總可溶性糖),導(dǎo)致在相同底物到可溶性糖的相似程度的生物質(zhì)水解/轉(zhuǎn)化所需的cp(杰能科國際公司(genencor))的背景纖維素酶混合物上的總體較低蛋白質(zhì)劑量。如實(shí)例7所示,與里氏木霉bgl1相比,重組ggr3a多肽如在緩沖液中所測量具有較低的表觀tm。如實(shí)例8所示,將重組ggr3a多肽與里氏木霉bgl1針對纖維二糖水解動(dòng)力學(xué)進(jìn)行比較。發(fā)現(xiàn)重組ggr3a多肽比里氏木霉bgl1對高溫糖化應(yīng)激的耐受性顯著更低。如實(shí)例9所示,與里氏木霉bgl1相比,重組ggr3a多肽還產(chǎn)生更多的葡萄糖,同時(shí)從稀酸預(yù)處理的玉米秸稈底物獲得較低水平的殘余纖維二糖(但相似量的總可溶性糖),導(dǎo)致在相同底物到可溶性糖的相似程度的生物質(zhì)水解/轉(zhuǎn)化所需的cp(杰能科國際公司(genencor))的背景纖維素酶混合物上的總體較低蛋白質(zhì)劑量。包含重組β-葡糖苷酶ggr3a多肽的組合物本披露提供了富含重組ggr3a多肽的工程化酶組合物(例如纖維素酶組合物)或發(fā)酵液。在一些方面,組合物是纖維素酶組合物。纖維素酶組合物可以是例如絲狀真菌纖維素酶組合物,如木霉屬纖維素酶組合物。在一些方面,組合物是包含編碼一種或多種纖維素酶多肽的一種或多種核酸的細(xì)胞。在一些方面,組合物是包含纖維素酶活性的發(fā)酵液,其中該肉湯能夠?qū)⑸镔|(zhì)樣品中存在的按重量計(jì)大于約50%的纖維素轉(zhuǎn)化為糖。如在此所用的,術(shù)語“發(fā)酵液”和“全肉湯”是指通過在發(fā)酵后不發(fā)生或幾乎不進(jìn)行回收和/或純化的工程化微生物發(fā)酵而生產(chǎn)的酶制劑。發(fā)酵液可以是絲狀真菌的發(fā)酵液,例如木霉屬、腐質(zhì)霉屬、鐮孢霉屬、曲霉屬、脈孢菌屬、青霉屬、頭孢霉屬、綿霉屬、柄孢殼菌屬、內(nèi)座殼屬、毛霉屬、旋孢腔菌屬、梨孢霉屬、毀絲霉屬或金孢子菌屬發(fā)酵液。具體而言,發(fā)酵液可以是例如木霉屬物種如里氏木霉、或青霉屬物種如繩狀青霉菌的發(fā)酵液中的一種。發(fā)酵液也可以適當(dāng)?shù)厥菬o細(xì)胞發(fā)酵液。在一個(gè)方面,本發(fā)明的任何纖維素酶、細(xì)胞或發(fā)酵液組合物可進(jìn)一步包含一種或多種半纖維素酶。在一些方面,全肉湯組合物在里氏木霉或其工程化菌株中表達(dá)。在一些方面,全肉湯在里氏木霉的整合菌株中表達(dá),其中包含ggr3a多肽的許多纖維素酶已經(jīng)整合到里氏木霉宿主細(xì)胞的基因組中。在一些方面,已經(jīng)缺失了在整合的里氏木霉菌株中表達(dá)的多肽的一種或多種組分。在一些方面,全肉湯組合物在黑曲霉或其工程化菌株中表達(dá)??商娲?,重組ggr3a多肽可以在細(xì)胞內(nèi)表達(dá)。任選地,在細(xì)胞內(nèi)表達(dá)酶變體或使用信號序列如上述那些分泌到周質(zhì)空間中之后,可以使用透化或裂解步驟將重組ggr3a多肽釋放到上清液中。膜屏障的破壞是受機(jī)械手段如超聲波、壓力處理(弗氏壓碎器)、空泡化使用的影響,或受膜消化酶如溶菌酶或酶混合物使用的影響。該實(shí)施例的變型包括在細(xì)胞內(nèi)在產(chǎn)乙醇微生物中表達(dá)重組ggr3a多肽。例如,可以通過遺傳工程將纖維二糖轉(zhuǎn)運(yùn)體引入到相同的產(chǎn)乙醇微生物中,這樣使得由木質(zhì)纖維素生物質(zhì)的水解產(chǎn)生的纖維二糖可以轉(zhuǎn)運(yùn)到產(chǎn)乙醇生物體中,并且可以在其中水解并轉(zhuǎn)化成d-葡萄糖,該d-葡萄糖進(jìn)而可以通過該產(chǎn)乙醇生物體來代謝。在一些方面,使用合適的無細(xì)胞表達(dá)系統(tǒng)來表達(dá)編碼重組ggr3a多肽的多核苷酸。在無細(xì)胞系統(tǒng)中,感興趣的多核苷酸通常在啟動(dòng)子的幫助下轉(zhuǎn)錄,但形成環(huán)狀表達(dá)載體的連接是任選的。在一些實(shí)施例中,rna是經(jīng)外源添加的或無需轉(zhuǎn)錄而生成的并且在無細(xì)胞系統(tǒng)中翻譯。使用ggr3a多肽水解木質(zhì)纖維素生物質(zhì)底物在一些方面,在此提供了用于將木質(zhì)纖維素生物質(zhì)轉(zhuǎn)化為糖的方法,該方法包括將生物質(zhì)底物與在此披露的包含ggr3a多肽的組合物以有效將生物質(zhì)底物轉(zhuǎn)化為可發(fā)酵糖的量接觸。在一些方面,該方法進(jìn)一步包括用酸和/或堿和/或機(jī)械或其他物理手段預(yù)處理生物質(zhì)。在一些方面,酸包括磷酸。在一些方面,堿包括氫氧化鈉或氨。在一些方面,機(jī)械手段可以包括例如將木質(zhì)纖維素生物質(zhì)物理分解成更小的物理形式的拉、擠壓、破碎、研磨和其他手段。其他物理手段也可以包括例如使用蒸汽或其他加壓的煙霧或水汽來“松動(dòng)”木質(zhì)纖維素生物質(zhì),以便增加酶對纖維素和半纖維素的可及性。在某些實(shí)施例中,預(yù)處理的方法還可以涉及能夠分解木質(zhì)纖維素生物質(zhì)底物的木質(zhì)素的酶,這樣使得生物質(zhì)水解酶組合物的酶對生物質(zhì)的纖維素和半纖維素的可及性增加。生物質(zhì):本披露提供了使用包含ggr3a多肽的本披露的酶組合物用于生物質(zhì)糖化的方法和過程。如在此所用,術(shù)語“生物質(zhì)”是指包含纖維素和/或半纖維素(任選地還包含木質(zhì)纖維素生物質(zhì)材料中的木質(zhì)素)的任何組合物。如在此所用,生物質(zhì)包括但不限于:種子、谷物、塊莖、植物廢物(例如像棕櫚樹的空果串、或棕櫚纖維廢物)、或食品加工或工業(yè)加工的副產(chǎn)物(例如,莖)、玉米(包括例如穗軸、秸稈等等)、草(包括例如印度草,如黃假高粱;或柳枝稷,例如黍?qū)傥锓N,如柳枝稷)、多年生長而有節(jié)的莖的植物(canes)(例如,蘆竹)、木材(包括例如,木片,加工廢料)、紙、紙漿和再生紙(包括例如,報(bào)紙、打印機(jī)紙等等)。其他生物質(zhì)材料包括但不限于:馬鈴薯、大豆(例如,油菜籽)、大麥、黑麥、燕麥、小麥、甜菜、和蔗渣。因此,本披露提供了糖化的方法,該方法包括將包含生物質(zhì)材料的組合物(例如包含木聚糖、半纖維素、纖維素和/或可發(fā)酵糖的材料)與本披露的ggr3a多肽、或由本披露的核酸或多核苷酸編碼的ggr3a多肽、或包含ggr3a多肽的纖維素酶或非天然存在的半纖維素酶組合物中的任一種、或本披露的制造產(chǎn)品接觸。通過例如像微生物發(fā)酵和/或化學(xué)合成的方法,糖化的生物質(zhì)(例如,由本披露的酶加工的纖維素材料)可以制成許多基于生物的產(chǎn)物。如在此所用,“微生物發(fā)酵”是指在合適的條件下生長和收獲發(fā)酵微生物的過程。發(fā)酵微生物可以是適合用于生產(chǎn)基于生物的產(chǎn)物的所需發(fā)酵方法中的任何微生物。合適的發(fā)酵微生物包括但不限于:絲狀真菌、酵母和細(xì)菌。糖化生物質(zhì)可以例如通過發(fā)酵和/或化學(xué)合成制成燃料(例如,生物燃料如生物乙醇、生物丁醇、生物甲醇、生物丙醇、生物柴油、噴氣燃料等等)。糖化生物質(zhì)可以例如通過發(fā)酵和/或化學(xué)合成制成大宗化學(xué)品(例如抗壞血酸、異戊二烯、1,3-丙二醇)、脂質(zhì)、氨基酸、多肽和酶。預(yù)處理:在由糖化產(chǎn)生的可發(fā)酵糖的糖化或酶水解和/或發(fā)酵之前,生物質(zhì)(例如,木質(zhì)纖維素材料)優(yōu)選經(jīng)受一個(gè)或多個(gè)預(yù)處理步驟,以使木聚糖、半纖維素、纖維素和/或木質(zhì)素材料更易于或易受酶組合物(例如,包含ggr3a多肽的本發(fā)明的酶組合物)中酶的影響,并且因此更易于被酶和/或酶組合物水解。在一些方面,合適的預(yù)處理方法可以涉及在反應(yīng)器中使生物質(zhì)材料經(jīng)受包括強(qiáng)酸和金屬鹽的稀溶液的催化。生物質(zhì)材料可以例如是原料或干材料。這種預(yù)處理可以降低纖維素水解的活化能或溫度,最終允許獲得較高產(chǎn)量的可發(fā)酵糖。參見,例如,美國專利號6,660,506;6,423,145。在一些方面,合適的預(yù)處理方法可以涉及在選擇的溫度和壓力下在水性介質(zhì)中使生物質(zhì)材料經(jīng)受第一水解步驟,以首先實(shí)現(xiàn)半纖維素的解聚,而不會(huì)使纖維素大量解聚成葡萄糖。該步驟產(chǎn)生漿液,其中液體水相包含由半纖維素解聚得到的溶解的單糖,并且固相包含纖維素和木質(zhì)素。然后在允許大部分纖維素解聚的條件下使?jié){液經(jīng)受第二水解步驟,產(chǎn)生包含纖維素的溶解/可溶解聚產(chǎn)物的液體水相。參見,例如美國專利號5,536,325。在另外的方面,合適的預(yù)處理方法可以涉及使用約0.4%至約2%的強(qiáng)酸通過一級或多級稀酸水解來處理生物質(zhì)材料;隨后用堿性去木質(zhì)作用處理酸水解的材料處理未反應(yīng)的固體木質(zhì)纖維素組分。參見,例如美國專利號6,409,841。在又另外的方面,合適的預(yù)處理方法可以涉及在預(yù)水解反應(yīng)器中預(yù)水解生物質(zhì)(例如,木質(zhì)纖維素材料);向固體木質(zhì)纖維素材料中添加酸性液體以制備混合物;將混合物加熱至反應(yīng)溫度;將反應(yīng)溫度維持一段時(shí)間,以足以將木質(zhì)纖維素材料分餾成包含來自木質(zhì)纖維素材料的至少約20%木質(zhì)素的溶解部分,和包含纖維素的固體部分;將溶解部分與固體餾分分離,并在反應(yīng)溫度或接近反應(yīng)溫度時(shí)除去溶解部分;并回收溶解部分。固體餾分中的纖維素更易于進(jìn)行酶消化。參見,例如美國專利號5,705,369。在該方面的變型中,預(yù)水解可以替代地或進(jìn)一步涉及使用例如能夠分解木質(zhì)纖維素生物質(zhì)材料的木質(zhì)素的酶進(jìn)行預(yù)水解。在又另外的方面,合適的預(yù)處理可能涉及過氧化氫h2o2的使用。參見,古爾德(gould),1984,生物技術(shù)和生物工程(biotech,andbioengr.)26:46-52。在其他方面,預(yù)處理還可以包括以非常低的濃度使生物質(zhì)材料與化學(xué)計(jì)量的氫氧化鈉和氫氧化銨接觸。參見,泰克賽拉(teixeira)等人,1999,應(yīng)用生物化學(xué)與生物技術(shù)(appl.biochem.andbiotech.)77-79:19-34。在一些實(shí)施例中,預(yù)處理可以包括在適度溫度、壓力和ph下使木素纖維素與約9至約14的ph的化學(xué)品(例如堿,如碳酸鈉或氫氧化鉀)接觸。參見,公開的國際申請wo2004/081185。例如,在優(yōu)選的預(yù)處理方法中使用氨。這種預(yù)處理方法包括在高固體條件下使生物質(zhì)材料經(jīng)受低氨濃度。參見,例如,美國專利公開號20070031918和公開的國際申請wo06110901。糖化過程在一些方面,在此提供了糖化過程,該過程包括用包含多肽的酶組合物處理生物質(zhì),其中該多肽具有β-葡糖苷酶活性,并且其中該過程導(dǎo)致至少約50wt.%(例如,至少約55wt.%、60wt.%、65wt.%、70wt.%、75wt.%、或80wt.%)的生物質(zhì)轉(zhuǎn)化為可發(fā)酵糖。在一些方面,該生物質(zhì)包含木質(zhì)素。在一些方面,該生物質(zhì)包含纖維素。在一些方面,該生物質(zhì)包含半纖維素。在一些方面,包含纖維素的生物質(zhì)進(jìn)一步包含木聚糖、半乳聚糖或阿拉伯聚糖中的一種或多種。在一些方面,該生物質(zhì)可以是但不限于:種子、谷物、塊莖、植物廢物(例如,來自棕櫚樹的空果串、或棕櫚纖維廢物)、或食品加工或工業(yè)加工的副產(chǎn)物(例如,莖)、玉米(包括例如穗軸、秸稈等等)、草(包括例如印度草,如黃假高粱;或柳枝稷,例如黍?qū)傥锓N,如柳枝稷)、多年生長而有節(jié)的莖的植物(例如,蘆竹)、木材(包括例如,木片,加工廢料)、紙、紙漿和再生紙(包括例如,報(bào)紙、打印機(jī)紙等等),馬鈴薯、大豆(例如,油菜籽)、大麥、黑麥,燕麥、小麥、甜菜、和蔗渣。在一些方面,包括生物質(zhì)的材料在用多肽處理之前經(jīng)受一種或多種預(yù)處理方法/步驟。在一些方面,糖化或酶水解進(jìn)一步包括用包含本發(fā)明的ggr3a多肽的酶組合物處理生物質(zhì)。除了ggr3a多肽之外,酶組合物可以例如包含一種或多種其他纖維素酶??商娲兀附M合物可以包含一種或多種其他半纖維素酶。在某些實(shí)施例中,酶組合物包含本發(fā)明的ggr3a多肽、一種或多種其他纖維素酶、一種或多種半纖維素酶。在一些實(shí)施例中,酶組合物是全肉湯組合物。在一些方面,提供了一種糖化過程,該糖化過程包括用包含多肽的組合物處理木質(zhì)纖維素生物質(zhì)材料,其中該多肽與seqidno:2具有至少約75%(例如,至少約75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%)序列同一性,并且其中該過程導(dǎo)致按重量計(jì)至少約50%(例如,至少約55%、60%、65%、70%、75%、80%、85%、或90%)的生物質(zhì)轉(zhuǎn)化為可發(fā)酵糖。在一些方面,木質(zhì)纖維素生物質(zhì)材料已經(jīng)經(jīng)受如在此所述的一種或多種預(yù)處理方法/步驟。本發(fā)明組合物和方法的其他方面和實(shí)施例將從前面的描述和以下實(shí)例中顯而易見。實(shí)例提供以下實(shí)例以證明和說明本披露的某些優(yōu)選實(shí)施例和方面,并且不應(yīng)被解釋為限制性的。實(shí)例1基準(zhǔn)里氏木霉bgl1和禾生小叢殼ggr3a的基因表達(dá)的克隆和表達(dá)a.里氏木霉bgl1表達(dá)載體的構(gòu)建將天然的里氏木霉β-葡糖苷酶基因bgl1的n末端部分進(jìn)行密碼子優(yōu)化(dna2.0,門洛帕克,加利福尼亞州)。該合成部分包含該酶編碼區(qū)的前447個(gè)堿基。然后使用引物sk943和sk941(下文)通過pcr擴(kuò)增此片段。使用引物sk940和sk942(下文),從提取自里氏木霉菌株rl-p37(璽爾-奈斯(sheir-neiss,g)等人,應(yīng)用微生物學(xué)和生物技術(shù)(appl.microbiol.biotechnol.)1984,20:46-53)的基因組dna樣品pcr擴(kuò)增天然bgl1基因的剩余區(qū)域。在融合pcr反應(yīng)中,使用引物sk943和sk942,將bgl1基因的兩個(gè)pcr片段融合在一起:正向引物sk943:(5’-caccatgagatatagaacagctgccgct-3’)(seqidno:5)反向引物sk941:(5’-cgaccgccctgcggagtcttgcccagtggtcccgcgacag-3’)(seqidno:6)正向引物(sk940):(5’-ctgtcgcgggaccactgggcaagactccgcagggcggtcg-3’)(seqidno:7)反向引物(sk942):(5’-cctacgctaccgacagagtg-3’)(seqidno:8)將得到的融合pcr片段克隆到入門載體pentrtm/d-并轉(zhuǎn)化到大腸桿菌onetop10化學(xué)感受態(tài)細(xì)胞(英杰公司(invitrogen)),得到中間載體pentrtopo-bgl1(943/942)(圖1)。確定插入的dna的核苷酸序列。使用lr克隆酶反應(yīng),將具有正確bgl1序列的pentr-943/942載體與ptrex3g重組(參見英杰公司(invitrogen)概述的方案)。將lr克隆酶反應(yīng)混合物轉(zhuǎn)化到大腸桿菌onetop10化學(xué)感受態(tài)細(xì)胞(英杰公司(invitrogen))中,得到表達(dá)載體ptrex3g943/942(圖2)。該載體還包含編碼乙酰胺酶的、作為里氏木霉轉(zhuǎn)化的可選擇的標(biāo)志物的構(gòu)巢曲霉amds基因。用引物sk745和sk771對表達(dá)盒進(jìn)行pcr擴(kuò)增,以產(chǎn)生用于轉(zhuǎn)化的產(chǎn)物。正向引物sk771:(5’-gtctagactggaaacgcaac-3’)(seqidno:9)反向引物sk745:(5’-gagttgtgaagtcggtaatcc-3’)(seqidno:10)b.ggr3a表達(dá)載體的構(gòu)建通過bionexus合成β-葡糖苷酶基因ggr3a的開放閱讀框,并使用gateway技術(shù)將其克隆到pttt-pyr2載體(圖3,seqidno:41)中。ggr3a編碼序列側(cè)翼為cbhi啟動(dòng)子和cbhi終止子,以乙酰胺酶(amds)作為選擇標(biāo)志物。得到的載體ptt-pyr2-ggr3a(圖4,seqidno:42)用于木霉屬的轉(zhuǎn)化?;趙o2010/141779,用表達(dá)載體或表達(dá)盒的pcr產(chǎn)物轉(zhuǎn)化缺失了10個(gè)背景活性(δ(cbh1、cbh2、egl1、egl2、egl3、egl4、egl5、egl6、man1、bgl1)的里氏木霉菌株。通過具有如下所述輕微修飾的peg介導(dǎo)的原生質(zhì)體方法進(jìn)行轉(zhuǎn)化。對于原生質(zhì)體制備,孢子在24℃下在木霉屬基本培養(yǎng)基mm中以150rpm振蕩生長16-24小時(shí),該木霉屬基本培養(yǎng)基包含20g/l葡萄糖、15g/lkh2po4(ph4.5)、5g/l(nh4)2so4、0.6g/lmgso4x7h2o、0.6g/lcacl2x2h2o、1ml的1000x里氏木霉微量元素溶液(包含5g/lfeso4x7h2o、1.4g/lznso4x7h2o、1.6g/lmnso4xh2o、3.7g/lcocl2x6h2o)。通過離心收獲發(fā)芽孢子,并用50mg/ml的glucanexg200(諾維信公司(novozymesag))溶液處理以溶解真菌細(xì)胞壁。根據(jù)潘提拉等人,基因(gene)61(1987)155-164描述的方法進(jìn)一步制備原生質(zhì)體。將在200μl總?cè)萘恐邪s1μg的dna和1-5x107原生質(zhì)體的轉(zhuǎn)化混合物各自用2ml25%peg溶液進(jìn)行處理,用2體積的1.2m山梨糖醇/10mmtris(ph7.5)、10mmcacl2進(jìn)行稀釋,與包含5mm尿苷和20mm乙酰胺的3%選擇性頂層瓊脂糖mm混合。將所得混合物倒入包含尿苷和乙酰胺的2%選擇性瓊脂糖板上。將板在28℃下進(jìn)一步孵育7天,然后將單個(gè)轉(zhuǎn)化體挑選到包含尿苷和乙酰胺的新鮮mm板上。使用來自獨(dú)立克隆的孢子在搖瓶的發(fā)酵培養(yǎng)基中接種。發(fā)酵培養(yǎng)基為在250ml湯姆森超產(chǎn)量燒瓶(湯姆森儀器有限公司(thomsoninstrumentco.),歐申賽德,加利福尼亞州)中的36ml定義的肉湯,該肉湯包含葡萄糖/槐糖和2g/l尿苷,如甘氨酸基本培養(yǎng)基(6.0g/l甘氨酸;4.7g/l(nh4)2so4;5.0g/lkh2po4;1.0g/lmgso4·7h2o;33.0g/lpipps;ph5.5),后無菌添加作為碳源的約2%葡萄糖/槐糖混合物,10ml/l的100g/l的cacl2,2.5ml/l的里氏木霉微量元素(400x):175g/l無水檸檬酸;200g/lfeso4·7h2o;16g/lznso4·7h2o;3.2g/lcuso4·5h2o;1.4g/lmnso4·h2o;0.8g/lh3bo3。c.酵母穿梭載體psc11(預(yù)示)的構(gòu)建可以根據(jù)圖5的載體圖譜構(gòu)建酵母穿梭載體。該載體可用于在釀酒酵母中細(xì)胞內(nèi)表達(dá)ggr3a多肽。纖維二糖轉(zhuǎn)運(yùn)蛋白可以使用已知方法,如哈(ha)等人,美國國家科學(xué)院院刊(pnas),108(2):504-509(2011)中描述的那些,以相同的穿梭載體或各自的載體引入釀酒酵母中。可以使用酵母ez-轉(zhuǎn)化試劑盒進(jìn)行表達(dá)盒的轉(zhuǎn)化。可以使用包含20g/l纖維二糖的ysc培養(yǎng)基來選擇轉(zhuǎn)化體。將表達(dá)盒成功引入酵母中可以通過具有特異性引物的菌落pcr來證實(shí)。酵母菌株可以根據(jù)已知的方法和方案進(jìn)行培養(yǎng)。例如,可以將它們在具有20g/l葡萄糖的yp培養(yǎng)基(10g/l酵母提取物,20g/l細(xì)菌蛋白胨)中在30℃下進(jìn)行培養(yǎng)。為了使用氨基酸營養(yǎng)缺陷型標(biāo)志物選擇轉(zhuǎn)化體,可以使用酵母合成完全(ysc)培養(yǎng)基,該培養(yǎng)基包含6.7g/l酵母含氮堿加上20g/l葡萄糖、20g/l瓊脂、和csm-leu-trp-ura以提供核苷酸和氨基酸。d.運(yùn)動(dòng)發(fā)酵單胞菌整合載體pzc11(預(yù)示)的構(gòu)建可以根據(jù)圖6的載體圖譜構(gòu)建運(yùn)動(dòng)發(fā)酵單胞菌整合載體pzc11。該載體可用于在運(yùn)動(dòng)發(fā)酵單胞菌中細(xì)胞內(nèi)表達(dá)ggr3a多肽??梢允褂脤⒗w維二糖轉(zhuǎn)運(yùn)蛋白引入細(xì)菌細(xì)胞的已知方法,例如像由(sekar)等人,應(yīng)用與環(huán)境微生物學(xué)(appl.environ.microbiol.)(2011年12月22日)所述的那些將這些纖維二糖轉(zhuǎn)運(yùn)蛋白引入運(yùn)動(dòng)發(fā)酵單胞菌的相同整合載體或各自載體中??梢允褂枚喾N已知方法,例如通過pcr使用為此目的專門設(shè)計(jì)的確認(rèn)引物證實(shí)整合載體連同纖維二糖轉(zhuǎn)運(yùn)蛋白基因的成功引入。根據(jù)已知方法,例如像,美國專利號7,741,119中所述的那些培養(yǎng)并發(fā)酵運(yùn)動(dòng)發(fā)酵單胞菌菌株。實(shí)例2方法a.通過uplc進(jìn)行的蛋白質(zhì)濃度測量使用安捷倫(agilent)hplc1290無限系統(tǒng)用沃特斯(waters)acquityuplcc4beh300柱(1.7μm,1x50mm)進(jìn)行蛋白質(zhì)定量。使用六分鐘程序,采用在0.5min內(nèi)從5%至33%乙腈(西格瑪-奧德里奇(sigma-aldrich))的初始梯度,隨后在4.5min內(nèi)從33%至48%的梯度,并且然后采用分級梯度至90%乙腈。使用基于純化的里氏木霉bgl1的蛋白質(zhì)標(biāo)準(zhǔn)曲線來使ggr3a多肽量化。b.里氏木霉bgl1和ggr3a的純化里氏木霉bgl1在六基因缺失的里氏木霉宿主菌株的發(fā)酵液中過表達(dá)并從其中純化(參見,例如,公開的國際專利申請公開號wo2010/141779中的說明書)。將濃縮的肉湯加載到g25sec柱(ge醫(yī)療集團(tuán)生物科學(xué)公司(gehealthcarebio-science))上,并與50mm乙酸鈉(ph5.0)進(jìn)行緩沖液交換。將經(jīng)緩沖液交換的里氏木霉bgl1加載到裝有氨基芐基-s-吡喃葡萄糖基瓊脂糖親和基質(zhì)的25ml柱上。用在50mm乙酸鈉(ph5.0)中的250mm氯化鈉大量洗滌后,用50mm乙酸鈉和250mm氯化鈉(ph5.0)中的100mm葡萄糖洗脫結(jié)合餾分。合并檢測到氯-硝基-苯基葡糖苷(cnpg)活性為陽性的洗脫餾分并濃縮。在sds-page上對應(yīng)于里氏木霉bgl1的mw的并且通過質(zhì)譜確認(rèn)的單個(gè)條帶驗(yàn)證了洗脫的bgl1的純度。通過在280nm處的吸光度確定最終母液濃度為2.2mg/ml。如上所述,ggr3a由里氏木霉表達(dá),并從發(fā)酵液中純化。將ggr3a的肉湯用50mm乙酸鈉(ph5.5)稀釋10倍,然后與硫酸銨混合以達(dá)到1m的硫酸銨濃度。將該樣品應(yīng)用于平衡的(用50mm乙酸鈉(ph5.5),1m硫酸銨緩沖液平衡的)苯基瓊脂糖柱(ge醫(yī)療公司(gehealthcare)pn17-1086-01),并用相同的緩沖液洗滌。使用從50mm乙酸鈉(ph5.5)、1m硫酸銨緩沖液、至50mm乙酸鈉(ph5.5)緩沖液的梯度洗脫靶蛋白。然后將蛋白質(zhì)合并并脫鹽至10mmtris(ph8.0)緩沖液中,然后將其應(yīng)用到平衡的(用10mmtris(ph8.0)緩沖液平衡的)resourceq柱(ge醫(yī)療公司(gehealthcare)pn17-0947-01)中。一旦應(yīng)用就用10mmtris(ph8.0)緩沖液洗滌,然后用10mmtris(ph8.0)至50mm乙酸鈉(ph5)和1m氯化鈉緩沖液的梯度洗脫靶蛋白。然后將包含ggr3a的餾分合并,濃縮并緩沖液交換為50mmmes(ph6.0)、100mm氯化鈉緩沖液進(jìn)行測試。使用在280納米處的吸光度測量來確定總蛋白質(zhì)濃度。c.用于葡萄糖確定的abts測定在相同緩沖液中制備一系列葡萄糖標(biāo)準(zhǔn)溶液作為酶樣品。在添加到abts測定之前,將葡萄糖標(biāo)準(zhǔn)品添加到等體積的甘氨酸淬滅緩沖液中。在水中制備包含以下各項(xiàng)的abts母液:2.88mg/ml的2,2'-聯(lián)氮基-雙(3-乙基苯并噻唑-6-磺酸)二銨鹽(abts)、0.11u/ml的辣根過氧化物酶(hrp)和1.05u/ml的葡萄糖氧化酶(oxygohp5000l,美國丹尼斯科公司(daniscous,inc))。將abts儲(chǔ)存溶液的九十五(95)μl移液到三個(gè)單獨(dú)的costar平底微量滴定板的孔中。將來自淬滅的纖維二糖活性板的五(5)μl移液到包含abts溶液的反應(yīng)板中。將板裝載在分光光度計(jì)中,在405nm的吸光度下進(jìn)行3分鐘的動(dòng)力學(xué)讀數(shù),采用9秒的讀取間隔和60秒的延遲。在動(dòng)力學(xué)孵育之前添加快速的5秒振蕩步驟以進(jìn)行混合并消除孔中的任何氣泡。使用每個(gè)板上包含的葡萄糖標(biāo)準(zhǔn)曲線分析所有abts反應(yīng),以計(jì)算葡萄糖產(chǎn)量。d.磷酸溶脹纖維素(pasc)的制備使用瓦爾賽斯(walseth),美國紙漿與造紙工業(yè)技術(shù)協(xié)會(huì)(tappi)1971,35:228和伍德(wood),生物化學(xué)雜志(biochem.j.)1971,121:353-362的改編方案由從avicel制備磷酸溶脹纖維素(pasc)。簡而言之,avicelph-101溶解在濃磷酸中,然后使用冷去離子水沉淀。收集纖維素并用更多的水洗滌以中和ph。將其在50mm乙酸鈉(ph5)中稀釋至1%固體。e.稀酸預(yù)處理的玉米秸稈底物(whpcs)的制備由美國國家可再生能源實(shí)驗(yàn)室(nrel,戈?duì)柕?,科羅拉多州)根據(jù)謝爾(schell)等人,應(yīng)用生物化學(xué)與生物技術(shù)(japplbiochembiotechnol),105:69-86,2003中描述的方法制備稀酸預(yù)處理的玉米秸稈。通過將20gwhpcs(32.7%固體)與40ml的50mm乙酸鈉緩沖液(ph5.0)組合來稀釋底物。將液體以少量等分試樣添加,并用手?jǐn)嚢枰猿浞趾喜?。添加六?60)μl的5%疊氮化鈉作為抗微生物劑。覆蓋底物并使其在室溫下輕輕攪拌過夜以平衡。然后用1m氫氧化鈉溶液將底物的ph調(diào)節(jié)至ph5。最終固體含量為10.2%。實(shí)例3纖維二糖(或纖維三糖或槐糖)水解測定基于高斯(ghose),t.k.純粹與應(yīng)用化學(xué)(pure&appliedchemistry),1987,59(2),257-268的方法,在50℃下,確定纖維二糖(或纖維三糖或槐糖)水解活性。在測定緩沖液(50mm檸檬酸鈉緩沖液(ph5.3)+0.005%tween-80)中制備8.33mm纖維二糖(或纖維三糖或槐糖)母液。測定在96孔微量滴定板格式中進(jìn)行。將纖維二糖母液(90μl)移液入costar平底微量滴定板。制備酶稀釋系列并移液(10μl)到一式三份的、含纖維二糖溶液的反應(yīng)板中。將板用鋁密封件(nunc)密封,并在振蕩(1150rpm,iems培養(yǎng)箱)下在50℃下孵育30分鐘。將反應(yīng)板用100ul的100mm甘氨酸緩沖液在ph10.0下淬滅。使用abts測定確定葡萄糖濃度。纖維二糖單元(如高斯(ghose)中所述推導(dǎo)的)定義為0.0926除以在測定條件下釋放0.1mg葡萄糖所需的酶的量。確定纖維二糖酶測定的標(biāo)準(zhǔn)誤差為10%。在五個(gè)酶稀釋水平一式三份進(jìn)行纖維二糖活性測定,以產(chǎn)生劑量曲線。在數(shù)據(jù)的雙倒數(shù)作圖中建立小于15%并大于85%葡萄糖產(chǎn)量的截止值導(dǎo)致所有測試的酶的r2值大于0.99的線性關(guān)系。通過將里氏木霉bgl1(對照)線的斜率除以樣品的斜率計(jì)算給定樣品的性能指數(shù)(pi)。纖維三糖和槐糖pi是基于酶的單一濃度,該單一濃度通過使用將所有酶置于不可逆的纖維二糖劑量/反應(yīng)曲線的線性部分中的常見稀釋而獲得。這些pi被計(jì)算為(該變體的比活性)/(里氏木霉bgl1的比活性),其中(比活性)為(底物轉(zhuǎn)化成產(chǎn)物的摩爾%)/(uplc確定的變體濃度)。ggr3a相對于bgl1的pi針對纖維二糖、纖維三糖和槐糖為>1,表明針對所有3種底物的更高活性(表2)。表2里氏木霉bgl1ggr3a纖維二糖pi,相對于bgl115.5纖維三糖pi,相對于bgl112.9槐糖pi,相對于bgl111.7實(shí)例4纖維二糖熱活性測定在40℃、50℃、60℃和69℃下進(jìn)行纖維二糖測定(如以上實(shí)例3中所述),并使用abts測定確定葡萄糖。通過將abts反應(yīng)的vmax轉(zhuǎn)化為mm葡萄糖,除以葡萄糖的理論產(chǎn)量來確定產(chǎn)量百分比。通過將產(chǎn)量百分比除以反應(yīng)中的酶的ppm來確定單位產(chǎn)量。在所有測試的溫度下,通過ggr3a進(jìn)行的纖維二糖水解大于trbgl1。兩種β-葡糖苷酶之間的活性差在50℃下最大并且在69℃下最小(表3)。表3里氏木霉bgl1ggr3a相對于bgl1,在40℃下的纖維二糖活性13.5相對于bgl1,在50℃下的纖維二糖活性13.6相對于bgl1,在60℃下的纖維二糖活性12.8相對于bgl1,在69℃下的纖維二糖活性11.8實(shí)例5纖維二糖殘余活性(熱應(yīng)激)為了制備應(yīng)激板,將適量的酶分配到biorad硬殼96孔pcr板中并用硅膠墊密封。將板置于熱循環(huán)儀中,該熱循環(huán)儀程序設(shè)定為65℃持續(xù)3分鐘,然后緩降至25℃。在纖維二糖活性測定(在此實(shí)例3中所述)中,與未應(yīng)激酶樣品平行測定應(yīng)激酶樣品,以確定熱應(yīng)激后的殘余活性。結(jié)果表明,在這些條件下,與里氏木霉bgl1的57.4%殘余活性相比,ggr3a具有42.8%的殘余活性,并且其與較低的表觀tm一致。(如在實(shí)例7中)。這種高溫應(yīng)激的明顯較低的耐受性使得如在此所述的木質(zhì)纖維素生物質(zhì)底物的水解需要較低劑量的ggr3a是相當(dāng)令人驚訝的。實(shí)例6pasc活性劑量反應(yīng)基于mg蛋白/g葡聚糖,將純化的酶裝載到底物中。在50mm乙酸鈉緩沖液(ph5.0)中制造酶稀釋物。在測定板中,對于每個(gè)孔,將一百五十(150)μl的0.5%固體的冷pasc添加到20μl的酶溶液中。測定中的最終固體水平為0.44%。用鋁封板機(jī)覆蓋這些板,劇烈混合1min,并且置于英諾華(innova)培養(yǎng)箱/振蕩器中,在50℃、200rpm下持續(xù)2小時(shí)。將反應(yīng)用100μl100mm甘氨酸(ph10)淬滅并轉(zhuǎn)移至密理博(millipore)濾板。將濾板夾在安捷倫(agilent)hplc板的頂部并離心5分鐘以收集離心分離液。然后將二十(20)μl離心分離液添加到在安捷倫(agilent)hplc板中的100μl密理博(millipore)水中。通過hplc測量可溶性糖。將葡聚糖轉(zhuǎn)化百分比定義為(mg葡萄糖+mg纖維二糖)/mg底物中的纖維素。結(jié)果顯示于圖7中。實(shí)例7表觀tm測量將純化的酶樣品在50mm乙酸鈉緩沖液(ph5.0)中稀釋至100ppm。將sypro橙色染料在相同緩沖液中稀釋1000倍。將二十五(25)μl的100ppm酶和8μl稀釋的sypro橙色(英杰分子探針公司(invitrogenmolecularprobes),#s6650)添加到lightcycler48096-孔板中。將板短暫旋轉(zhuǎn)以將所有液體帶到孔的底部,并且然后在臺式搖床上混合。該板在lightcycler480(羅氏(roche))中運(yùn)行。程序以在37℃下預(yù)溫育5分鐘開始,并且升溫速率為4.4℃/s。熔解曲線目標(biāo)為97℃,升溫速率為0.2℃/s。選擇檢測格式“氟硼熒(bodipy)”(熒光498-580nm),并且采集模式是連續(xù)的。結(jié)果在下表4中示出。表4gh3純化的表觀tmtrbgl1y77.87℃ggr3ay68.62℃實(shí)例8纖維二糖水解動(dòng)力學(xué)將純化的里氏木霉bgl1和ggr3a稀釋至相同的起始纖維二糖酶活性,并且然后連續(xù)稀釋8次。制備100mm纖維二糖溶液并添加到三個(gè)非結(jié)合測定板的頂行(costar#3641)。然后將底物在微量滴定板上連續(xù)稀釋,得到8種不同的底物濃度。然后將五十(50)μl酶溶液添加到測定板中的50μl底物溶液中。覆蓋測定板并置于英諾華(innova)44培養(yǎng)箱/振蕩器中,在50℃和200rpm下(1)持續(xù)30分鐘(2)60分鐘或(3)90分鐘。將每個(gè)板用100μl100mm甘氨酸(ph10)緩沖液淬滅。使用略作修改的abts測定(在96孔mtp中的100μlabts+10μl樣品)測量葡萄糖濃度、混合、并置于酶標(biāo)儀中持續(xù)5分鐘。在420nm下進(jìn)行動(dòng)力學(xué)讀數(shù)。結(jié)果繪制在圖8中。這些圖的縱坐標(biāo)是所釋放的葡萄糖并且被縮放到最大可檢測到的葡萄糖。橫坐標(biāo)是酶濃度和培養(yǎng)時(shí)間的乘積。使用該橫坐標(biāo)允許在同一圖上直接比較兩種酶的所有時(shí)間點(diǎn)和劑量值。對于反應(yīng)中使用的每個(gè)纖維二糖濃度,示出了單獨(dú)的圖。包含β-葡糖苷酶里氏木霉bgl1的反應(yīng)用實(shí)心圓表示,包含ggr3a的反應(yīng)為實(shí)例9稀酸預(yù)處理的玉米秸稈的糖化(whpcs)純化的β-葡糖苷酶將里氏木霉bgl1和ggr3a以1%的總蛋白質(zhì)與cp纖維素酶混合物(杰能科國際公司(genencor))共混。將酶混合物以從0-20mg蛋白質(zhì)/g葡聚糖進(jìn)行給藥,并用于在50℃下在96孔mtp(nunc,#269787)中糖化50mm乙酸鹽緩沖液(ph5.0)和7%固體中的whpcs持續(xù)2天。每種酶共混物具有4次測定重復(fù)。使用具有1mleppendorf吸頭的中繼移液管將底物添加到測定板中。將三十(30)μl酶溶液以10%固體/孔添加到70mg底物中,最終總固體為7%。用鋁封板機(jī)(e&k科學(xué)(e&kscientific)#ek-46909)覆蓋這些板,混合1分鐘,并且置于英諾華(innova)44培養(yǎng)箱/振蕩器(新不倫瑞克科技(newbrunswickscientific))中,在50℃、200rpm下持續(xù)2天。將反應(yīng)用100μl100mm甘氨酸(ph10)淬滅,并將其使用多通道移液管轉(zhuǎn)移至過濾板(密理博(millipore),#mahvn4550)。將濾板夾在hplc板的頂部(安捷倫(agilent),#5042-1385),并在離心機(jī)中旋轉(zhuǎn)5min以過濾。將十(10)μl上清液添加到在安捷倫(agilent)hplc板中的100μl密理博(millipore)水中。通過hplc測量可溶性糖。將葡聚糖轉(zhuǎn)化百分比定義為(mg葡萄糖+mg纖維二糖)/mg底物中的纖維素。在圖9a-9b中描繪了結(jié)果。ggr3a比里氏木霉bgl1產(chǎn)生更多的葡萄糖并且具有更少的殘余纖維二糖,導(dǎo)致將相同底物水解至大約相同程度所需的總蛋白質(zhì)劑量減少1.4倍。當(dāng)前第1頁12