專利名稱::具有纖維二糖水解酶活性的多肽和編碼該多肽的多核苷酸的制作方法
技術領域:
:本發(fā)明涉及具有纖維ニ糖水解酶活性的多肽和編碼所述多肽的多核苷酸。本發(fā)明還涉及包含所述多核苷酸的核酸構建體、載體和宿主細胞,以及產生和使用所述多肽的方法。相關領域描述纖維素是單糖葡萄糖通過β-1,4-鍵連接的聚合物。許多微生物產生水解β-連接的葡聚糖的酶。這些酶包括內切葡聚糖酶、纖維ニ糖水解酶和葡糖苷酶。內切葡聚糖酶在隨機位置消化纖維素聚合物,將其打開(openingit)以受到纖維ニ糖水解酶攻擊(attack)。纖維ニ糖水解酶繼而從纖維素聚合物的末端釋放纖維ニ糖的分子。纖維ニ糖是水溶性的β-1,4-連接的葡萄糖ニ聚體。β-葡糖苷酶將纖維ニ糖水解成葡萄糖。將含木素纖維素原料(lignocellulosicfeedstock)轉化為こ醇具有以下優(yōu)勢大量原料現(xiàn)成可用,避免燃燒或填埋材料的合意性和こ醇燃料的清潔性。木材、農業(yè)殘余物、草本作物和城市固體廢物被認為是用于こ醇生產的原料。這些材料主要由纖維素、半纖維素和木質素組成。一旦將纖維素轉化成葡萄糖,葡萄糖將容易地由酵母發(fā)酵成こ醇。WO2008/095033公開了ー種真菌糖基水解酶。在本領域中,改善酶法降解木素纖維素原料的能力會是有利的。本發(fā)明提供了具有纖維ニ糖水解酶活性的多肽和編碼該多肽的多核苷酸。發(fā)明概述本發(fā)明涉及具有纖維ニ糖水解酶活性的分離的多肽,其選自下組(a)多肽,其包含氨基酸序列,所述氨基酸序列與SEQIDNO2的成熟多肽具有至少99%同一性;(b)多肽,其由多核苷酸編碼,所述多核苷酸包含核苷酸序列,所述核苷酸序列與SEQIDNO1的成熟多肽編碼序列具有至少99%同一性;(d)多肽,其包含SEQIDNO:2的成熟多肽,或其具有纖維ニ糖水解酶活性的片段。本發(fā)明還涉及編碼本發(fā)明多肽的分離的多核苷酸;包含所述多核苷酸的核酸構建體、重組表達載體和重組宿主細胞;和產生所述多肽的方法。本發(fā)明還涉及降解或轉化纖維素材料的方法,包括在本發(fā)明的多肽的存在下用酶組合物處理纖維素材料。本發(fā)明還涉及產生發(fā)酵產物的方法,包括(a)在本發(fā)明的多肽的存在下用酶組合物糖化纖維素材料;(b)用一種或多種發(fā)酵微生物發(fā)酵經糖化的纖維素材料以產生發(fā)酵產物;和(C)從發(fā)酵回收所述發(fā)酵產物。本發(fā)明還涉及發(fā)酵纖維素材料的方法,包括用一種或多種發(fā)酵微生物發(fā)酵纖維素材料,其中所述纖維素材料是在本發(fā)明的多肽的存在下用酶組合物糖化的。本發(fā)明還涉及編碼信號肽的多核苷酸,所述信號肽包含SEQIDNO:2的氨基酸I至18或由SEQIDNO2的氨基酸I至18組成,所述信號肽可操作地連接于編碼蛋白的基因;涉及包含所述多核苷酸的核酸構建體、表達載體和重組宿主細胞;并涉及產生蛋白質的方法。附圖簡述圖IA和IB顯示棘孢曲霉(Aspergillusaculeatus)菌株NN000525(IAM2445)GH6纖維ニ糖水解酶基因的cDNA序列和推定的氨基酸序列(分別為SEQIDNO1和2)。圖2顯示在經預處理的玉米秸桿的水解中用棘孢曲霉纖維ニ糖水解酶20%替代(按蛋白計)里氏木霉(Trichodermareesei)纖維素分解蛋白制備物(以2mg姆g纖維素加載)的結果。圖3顯示pXYG1051-P6XY的限制圖譜。圖4顯示pCR2.1-P6XY的限制圖譜。定義纖維ニ糖水解酶術語“纖維ニ糖水解酶”意指1,4-β-D-葡聚糖纖維ニ糖水解酶(I,4-beta-D-glucancellobiohydrolase)(E.C.No.3.2.I.91),其催化纖維素、纖維素寡糖,或任何包含β-I,4-連接的葡萄糖的聚合物中的I,4-β-D-糖苷鍵的水解,從鏈的還原或非還原末端釋放纖維ニ糖(Teeri,1997,CrystallinecellulosedegradationNewinsightintothefunctionofcellobiohydrolases,TrendsinBiotecnnology15160-167;Teeri等,1998,Trichodermareeseicellobiohydrolaseswhysoefncientoncrystallinecellulose,Biochem.Soc.Trans.26:173-178)。就本發(fā)明而言,根據(jù)Lever等,1972,Anal.Biochem.47:273-279;vanTilbeurgh等,1982,FEBSLetters,149152-156;vanTilbeurgh和Claeyssens,1985,FEBSLetters,187:283-288;以及Tomme等,1988,Eur.J.Biochem.170:575-581;以及vanTilbeurgh等,1985,Eur.J.Biochem.148329-334描述的方法確定纖維ニ糖水解酶活性。可采用Lever等的方法來評價玉米秸桿中的纖維素水解,而vanTilbeurgh等和Tomme等的方法可用于確定對4-甲基傘形基-β-D-乳糖卩比喃糖苷(4-methylumbelliferyl-β-D-lactopyranoside)的纖維ニ糖水解酶I活性。纖維素分解酶或纖維素酶術語“纖維素分解酶”或“纖維素酶”意指ー種或多種(幾種)水解纖維素材料的酶。此類酶包括內切葡聚糖酶、纖維ニ糖水解酶、β_葡糖苷酶或其組合。測量纖維素分解活性的兩種基本方法包括(I)測量總纖維素分解活性,和(2)測量單獨的纖維素分解活性(內切葡聚糖酶、纖維ニ糖水解酶和β_葡糖苷酶),如Zhang等,OutlookforcellulaseimprovementScreeningandselectionstrategies,2006,BiotechnologyAdvances24:452-481所綜述的??偫w維素分解活性通常是使用不溶性底物來測定的,所述底物包括WhatmanNo.I濾紙、微晶纖維素、細菌纖維素、藻類纖維素、棉花、經預處理的木素纖維素等。最常見的總纖維素分解活性測定法是使用WhatmanNo.I濾紙作為底物的濾紙測定法。該測定法是由InternationalUnionofPureandAppliedChemistry(IUPAC)(Ghose,1987,Measurementofcellulaseactivities,PureAppI.Chem.59:257-68)確立的。就本發(fā)明而言,纖維素分解酶活性通過測量在下述條件下由纖維素分解酶進行的纖維素材料水解的增加來確定l_20mg的纖維素分解酶蛋白/g的PCS中纖維素在50°C進行3-7日,與未添加纖維素分解酶蛋白的對照水解相比較。典型條件為1ml反應液,經洗滌或未洗滌的PCS,5%不溶性固形物,50mMこ酸鈉pH5,ImMMnSO4,50°C,72小時,通過AMINEXHPX-87H柱(Bio-RadLaboratories,Inc.,Hercules,CA,USA)進行糖分析。內切葡聚糖酶:術語“內切葡聚糖酶”意指內切-1,4_(1,3;l,4)-i3_D-葡聚糖4-葡聚糖水解酶(endo-1,4-β-D-glucan4-glucanohydrolase)(E.C.3.2.I.4),其催化纖維素、纖維素衍生物(例如羧甲基纖維素和羥こ基纖維素)、地衣淀粉(Iichenin)中的I,4-β-D-糖苷鍵、混合的β-I,3葡聚糖例如谷類β-D-葡聚糖或木葡聚糖和含有纖維素組分的其它植物材料中的β_1,4鍵的內水解(endohydrolysis)。內切葡聚糖酶活性可通過測量底物粘度的減少或由還原糖測定法(Zhang等,2006,BiotechnologyAdvances24:452-481)確定的還原端增加來確定。就本發(fā)明而言,根據(jù)Ghose,1987,PureandAppI.Chem.59:257-268的方法,在pH5,40°C,使用羧甲基纖維素(CMC)作為底物來確定內切葡聚糖酶活性。β-葡糖苷酶術語“β-葡糖苷酶”意指β-D-葡糖苷葡糖水解酶(beta-D-glucosideglucohydrolase)(E.C.No.3.2.I.21),其催化末端非還原β-D-葡萄糖殘基的水解,并釋放β-D-葡萄糖。就本發(fā)明而言,葡糖苷酶活性是根據(jù)由Venturi_,2002,Extracellularbeta-D-glucosidasefromChaetomiumthermophilumvar.coprophilum:production,purificationandsomebiochemicalproperties,J.BasicMicrobiol.42:55-66所述的基本步驟確定的。一單位的β-葡糖苷酶定義為在25°C,pH4.8從作為底物的ImM對硝基苯基-β-D-葡糖吡喃糖苷在含有O.01%TWEEN20的50mM檸檬酸鈉中每分鐘產生I.O微摩爾的對硝基苯酚陰離子。具有纖維素分解增強活性的多肽術語“具有纖維素分解增強活性的多肽”意指使具有纖維素分解活性的酶對纖維素材料的水解增強的GH61多肽。就本發(fā)明而言,通過測量由纖維素分解酶在下述條件下水解纖維素材料所導致的還原糖増加或纖維ニ糖與葡萄糖的總量增加來確定纖維素分解增強活性l_50mg總蛋白/gPCS中纖維素,其中總蛋白包含50-99.5%w/w的纖維素分解酶蛋白,及O.5-50%w/w的具有纖維素分解增強活性的GH61多肽的蛋白質,在50°C歷時1-7天,與用等量的總蛋白加載量而無纖維素分解增強活性(l-50mg纖維素分解蛋白/gPCS中纖維素)所進行的對照水解相比。在一個優(yōu)選的方面,使用在總蛋白重量的2-3%的米曲霉(Aspergillusoryzae)β-葡糖苷酶(根據(jù)W002/095014在米曲霉中重組產生)或者總蛋白重量的2-3%的煙曲霉(Aspergillusfumigatus)β-葡糖苷酶(如WO2002/095014所述在米曲霉中重組產生)的纖維素酶蛋白加載量存在下的CELLUCLASTI·5L(NovozymesA/S,Bagsvaerd,Denmark)的混合物作為纖維素分解活性的來源。具有纖維素分解增強活性的GH61多肽通過降低達到相同水解程度所需的纖維素分解酶的量而增強由具有纖維素分解活性的酶催化的纖維素材料的水解,優(yōu)選降低至少I.Ol倍,更優(yōu)選至少I.05倍,更優(yōu)選至少I.10倍,更優(yōu)選至少I.25倍,更優(yōu)選至少I.5倍,更優(yōu)選至少2倍,更優(yōu)選至少3倍,更優(yōu)選至少4倍,更優(yōu)選至少5倍,甚至更優(yōu)選至少10倍,并且最優(yōu)選至少20倍。家族61糖苷水解酶術語“家族61糖苷水解酶”或“家族GH61”或“GH61”意指根據(jù)HenrissatB.,1991,Aclassificationofglycosylhydrolasesbasedonammo-acidsequencesimilarities,Biochem.J.280:309-316,及HenrissatΒ·,和BairochA.,1996,Updatingthesequence-basedclassificationofglycosylhydrolases,Biochem.J.316:695-696屬于糖苷水解酶家族61的多肽。半纖維素分解酶或半纖維素酶術語“半纖維素分解酶”或“半纖維素酶”意指ー種或多種(幾種)水解半纖維素材料的酶。參見,例如Shallom,D.和Shoham,Y.Microbialhemicellulases.CurrentOpinionInMicrobiology,2003,6(3):219-228)。半纖維素酶是植物生物質降解中的關鍵成分。半纖維素酶的實例包括但不限于こ酰甘露聚糖酯酶、こ酰木聚糖酯酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、香豆酸酯酶、阿魏酸酯酶、半乳糖苷酶、葡糖醛酸糖苷酶、葡糖醛酸酯酶、甘露聚糖酶、甘露糖苷酶、木聚糖酶和木糖苷酶。這些酶的底物,即半纖維素,是支化和直鏈多糖的混雜集團,這些多糖通過氫鍵鍵合于植物細胞壁中的纖維素微纖維,將其交聯(lián)為魯棒(robust)的網絡。半纖維素亦共價地附于木質素,與纖維素一同形成高度復雜的結構。半纖維素的可變的結構和組織形式需要許多酶的協(xié)同作用使其完全降解。半纖維素酶的催化模塊為水解糖苷鍵的糖苷水解酶(GH),或水解こ酸或阿魏酸側基酯連接的糖酯酶(CE)。這些催化模塊,基于其ー級結構的同源性,可指定為以數(shù)字標記的GH和CE家族。ー些家族,具有總體上類似的折疊,可進ー步歸類為宗族(clan),以字母標記(例如,GH-A)。最具信息性和最新的這些和其他糖活性酶的分類可在Carbohydrate-ActiveEnzymes(CAZy)數(shù)據(jù)庫獲得。半纖維素分解酶活性可根據(jù)Ghose和Bisaria,1987,Pure&Appl.Chem.59:1739-1752測量。木聚糖降解活性或木聚糖分解活性術語“木聚糖降解活性”或“木聚糖分解活性”意指水解含木聚糖材料的生物學活性。兩種測定木聚糖分解活性的基礎方法包括(I)測定總木聚糖分解活性,和(2)測定單獨的木聚糖分解活性(例如,內切木聚糖酶、β-木糖苷酶、阿拉伯呋喃糖苷酶、α-葡糖醛酸糖苷酶、こ酰木聚糖酯酶、阿魏酸酯酶和α-葡糖醛酸酯酶(a-glucuronylesterase))。最近在木聚糖分解酶測定法的進展總結于幾個公開文獻中,包括Biely和Puchard,Recentprogressintheassaysofxylanolyticenzymes,2006,JournaloftheScienceofFoodandAgriculture86(11):1636-1647;Spanikova和Biely,2006,Glucuronoylesterase-NovelcarbohydrateesteraseproducedbySchizophyilumcommune,FEBSLetters580(19):4597-4601;Herrmann,Vrsanska,Jurickova,Hirsch,Biely和Kubicek,1997,Thebeta-D-xylosidaseofTrichodermareeseiisamultifunctionalbeta—D—xylanxylohydrolase,BiochemicalJournal321375-381o總木聚糖降解活性可通過確定從多種類型的木聚糖形成的還原糖來測量,所述木聚糖包括例如燕麥小麥(oatspelt)、山毛櫸木(beechwood)和落葉松木(Iarchwood)木聚糖,或者可通過光度法確定從多種共價染色的木聚糖釋放出的染色的木聚糖片段來測量。最常見的總木聚糖分解活性測定法基于從多聚的4-0-甲基葡糖醛酸木聚糖產生還原糖,如Bailey,Biely,Poutanen,1992,Interlaboratorytestingotmethodsforassayotxylanaseactivity,JournalofBiotechnology23(3):257-270中所述。木聚糖酶活性亦可用O.2%AZCL-阿拉伯木聚糖作為底物在O.01%TRHONX-100和200mM磷酸鈉緩沖液pH6在37°C中確定。一単位的木聚糖酶活性定義為在37°C,pH6從作為底物的O.2%AZCL阿拉伯木聚糖在200mM磷酸鈉pH6緩沖液中每分鐘產生I.O微摩爾的天青精。就本發(fā)明而言,木聚糖降解活性是通過測量由木聚糖降解酶在下述典型條件下造成的樺木木聚糖(SigmaChemicalCo.,Inc.,St.Louis,MO,USA)水解的增加來確定的1ml反應,5mg/ml底物(總固形物),5mg木聚糖分解蛋白/g底物,50mMこ酸鈉,pH5,50°C,24小時,如Lever,1972,Anewreactionforcolorimetriedeterminationofcarbohydrates,Anal.Biochem47:273-279所述使用對羥基苯甲酸酰肼(PHBAH)測定法進行糖分析。木聚糖酶術語“木聚糖酶”意指催化木聚糖中l(wèi),4-i3_D-木糖苷連接的內水解的I,4-β-D-木聚糖-木糖水解酶(E.C.3.2.I.8)。就本發(fā)明而言,木聚糖酶活性是使用O.2%AZCL-阿拉伯木聚糖作為底物在37°C在O.01%TRHONX-100和200mM磷酸鈉緩沖液pH6中進行確定的。一個單位的木聚糖酶活性定義為在37°C,pH6從200mM磷酸鈉pH6緩沖液中的O.2%AZCL-阿拉伯木聚糖作為底物每分鐘產生I.O微摩爾的天青精(azurine)。β-木糖苷酶術語“β-木糖苷酶”意指β-D木糖苷木糖水解酶(β-D-xylosidexylohydrolase)(E.C.3.2.I.37),其催化短β(I—4)木寡糖(xylooIigosaccharide)的外水解以從非還原端去除連續(xù)的D-木糖殘基。就本發(fā)明而言,一個單位的β_木糖苷酶定義為在40°C,pH5從ImM對硝基苯基-β-D-木糖苷作為底物在含有O.01%TWEEN20的IOOmM檸檬酸鈉中每分鐘產生I.O微摩爾對硝基苯酚陰離子。こ酰木聚糖酯酶術語“こ酰木聚糖酯酶”意指羧基酯酶(EC3.I.I.72),其催化こ?;鶑木酆夏揪厶?、こ酰化木糖、こ酰化葡萄糖、こ酸α-萘酯(alpha-napthylacetate)和こ酸對硝基苯酯(p-nitrophenylacetate)的水解。就本發(fā)明而言,こ酰木聚糖酯酶活性是使用O.5mMこ酸對硝基苯酯作為底物,在含有O.01%TWEEN20的50mM乙酸鈉pH5.O中確定的。一個單位的こ酰木聚糖酯酶定義為能夠在pH5,25°C每分鐘釋放I微摩爾對硝基苯酹陰離子(p-nitrophenolateanion)的酶量。阿魏酸酯酶術語“阿魏酸酯酶(feruloylesterase)”意指4_輕基-3-甲氧基肉桂酰-糖水解酶(EC3.I.I.73),其催化4-羥基-3-甲氧基肉桂酰(阿魏酰)基團從酯化的糖(其在“天然”底物中通常為阿拉伯糖)的水解,以產生阿魏酸(4-羥基-3-甲氧基肉桂酸)。阿魏酸酯酶也稱作阿魏酸酯酶(ferulicacidesterase)、輕基肉桂酰酯酶(hydroxycinnamoylesterase)>FAE-III>肉桂酸酯水解酶、FAEA、cinnAE、FAE_I或FAE-II。就本發(fā)明而言,阿魏酸酯酶是使用50mMこ酸鈉pH5.O中的O.5mM阿魏酸對硝基苯酯作為底物確定的。一個單位的阿魏酸酯酶等于能夠在pH5,25°C每分鐘釋放出I微摩爾對硝基苯酚陰離子的酶量。α-葡糖醛酸糖苷酶術語“α-葡糖醛酸糖苷酶”意指a_D_葡糖苷酸葡糖醛酸水解酶(alpha-D-glucosiduronateglucuronohydrolase)(EC3.2.I.139),其催化a-D-葡糖醛酸糖苷水解為D-葡糖醛酸和醇。就本發(fā)明而言,α-葡糖醛酸糖苷酶活性是根據(jù)deVries,1998,J.Bacteriol.180:243-249確定的。一個單位的α-葡糖醒酸糖苷酶等于能夠在pH5,40°C每分鐘釋放出I微摩爾葡糖醛酸或4-0-甲基葡糖醛酸的酶量。a-L-阿拉伯呋喃糖苷酶術語“a_L_阿拉伯呋喃糖苷酶活性”意指a_L_阿拉伯呋喃糖苷阿拉伯呋喃水解酶(EC3.2.I.55),其催化對a-L-阿拉伯糖苷中的末端非還原性a-L-阿拉伯呋喃糖苷殘基的水解。該酶對a-L-阿拉伯呋喃糖苷、含有(1,3)_和/或(1,5)_鍵的a-L-阿拉伯聚糖、阿拉伯木聚糖和阿拉伯半乳聚糖起作用。α-L-阿拉伯呋喃糖苷酶也稱為阿拉伯糖苷酶、α-阿拉伯糖苷酶、Ci-L-阿拉伯糖苷酶、α-阿拉伯呋喃糖苷酶、多糖a-L-阿拉伯呋喃糖苷酶、a-L-阿拉伯呋喃糖苷水解酶、L-阿拉伯糖苷酶或a-L-阿拉伯聚糖酶。就本發(fā)明而言,a-L-阿拉伯呋喃糖苷酶活性是使用總體積200μI中的姆ml的IOOmMこ酸鈉pH5中5mg的中等粘度小麥阿拉伯木聚糖(MegazymeInternationalIreland,Ltd.,Bray,Co.Wicklow,Ireland)在4CTC進行30分鐘,接著通過AMINEXHPX-87H柱層析(Bio-RadLaboratories,Inc.,Hercules,CA,USA)的阿拉伯糖分析來確定的。纖維素材料術語“纖維素材料”意指包含纖維素的任何材料。生物質的初生細胞壁(primarycellwall)中的主要多糖是纖維素,其次最豐富的是半纖維素,而第三是果膠。次生細胞壁(secondarycellwall)在細胞停止生長后產生,其同樣含有多糖并通過共價交聯(lián)至半纖維素的聚合木質素而加強。纖維素是脫水纖維ニ糖的均聚物,并且因此是直鏈i3-(l_4)-D-葡聚糖,而半纖維素包括多種化合物,例如木聚糖、木葡聚糖(xyloglucan)、阿拉伯木聚糖和甘露聚糖,具有系列取代基的復雜分支結構。盡管通常是多形的,存在于植物組織中的纖維素主要是平行葡聚糖鏈的不溶晶體基質。半纖維素通常與纖維素以及其它半纖維素以氫鍵鍵合,其幫助穩(wěn)定細胞壁基質。纖維素通常見于例如植物的莖、葉、殼、皮和穗軸,或樹的葉、枝和木材。纖維素材料可以是,但不限于,草本材料、農業(yè)殘余物、林業(yè)殘余物、城市固體廢物、廢紙和紙漿與造紙廠殘余物(參見,例如,Wiselogel等,1995,于HandbookonBioethanol(CharlesE.Wyman編),pp.105-118,Taylor&Francis,WashingtonD.C.;Wyman,1994,BioresourceTechnology50:3-16;Lynd,1990,AppliedBiochemistryandBiotechnology24/25695-719;Mosier等,,1999,RecentProgressinBioconversionofLignoceIlulosics,于AdvancesinBiochemicalEngineering/Biotechno丄ogy,T.Scheper主編,Volume65,pp.23-40,Springer-Verlag,NewYork)。在本文中應理解的是,纖維素可以是任何形式的木素纖維素,在混合基質中包含木質素、纖維素和半纖維素的植物細胞壁材料。在一個優(yōu)選的方面,纖維素材料是木素纖維素,其包含纖維素、半纖維素和木質素。在ー個方面,纖維素材料是草本材料。在另ー個方面,纖維素材料是農業(yè)殘余物。在另ー個方面,纖維素材料是林業(yè)殘余物。在另ー個方面,纖維素材料是城市固體廢物。在另ー個方面,纖維素材料是廢紙。在另ー個方面,纖維素材料是紙漿和造紙廠殘余物。在另ー個方面,纖維素材料是玉米秸桿。在另ー個方面,纖維素材料是玉米纖維。在另ー個方面,纖維素材料是玉米穗軸。在另ー個方面,纖維素材料是橙皮。在另ー個方面,纖維素材料是稻桿。在另ー個方面,纖維素材料是麥桿。在另ー個方面,纖維素材料是柳枝稷(switchgrass)。在另ー個方面,纖維素材料是芒草屬(miscanthus)。在另ー個方面,纖維素材料是甘蔗渣。在另ー個方面,纖維素材料是微晶纖維素。在另ー個方面,纖維素材料是細菌纖維素。在另ー個方面,纖維素材料是藻類纖維素。在另ー個方面,纖維素材料是棉線頭(cottonlinter)。在另ー個方面,纖維素材料是無定形的磷酸處理的纖維素。在另ー個方面,纖維素材料是濾紙。纖維素材料可以按原樣(asis)使用或進行預處理,使用本領域已知的常規(guī)方法,如本文所述。在一個優(yōu)選的方面,預處理纖維素材料。預處理的玉米秸桿術語“PCS”或“預處理的玉米秸桿”意指通過用熱和稀硫酸處理的源自玉米秸桿的纖維素材料。含木聚糖材料術語“含木聚糖材料”意指任何包含含有β-(1-4)連接木糖殘基骨架的植物細胞壁多糖的材料。陸生植物的木聚糖是具有(14)-D-吡喃木糖骨架(其由短糖鏈分支)的雜聚物。其包含D-葡糖醛酸或其4-0-甲基醚、L-阿拉伯糖和/或多種寡糖,由D-木糖、L-阿拉伯糖,D-或L-半乳糖和D-葡萄糖組成。木聚糖類型的多糖可分為同木聚糖(homoxylan)和雜木聚糖(heteroxylan),其包括葡糖醒酸木聚糖,(阿拉伯)葡糖醛酸木聚糖,(葡糖醛酸)阿拉伯木聚糖,阿拉伯木聚糖和復合雜木聚糖(complexheteroxylan)。參見例如Ebringerova等,2005,Adv.Polym.Sci.186:1_67。在本發(fā)明的方法中,可使用任何含木聚糖材料。在一個優(yōu)選的方面,所述含木聚糖材料是木素纖維素。分離的或純化的術語“分離的”和“純化的”意指從與其天然相關的至少ー種組分移出的多肽或多核苷酸。舉例而言,多肽如通過SDS-PAGE測定的,可為至少1%純,例如至少5%純,至少10%純,至少20%純,至少40%純,至少60%純,至少80%純,至少90%純,或至少95%純,而多核苷酸如通過瓊脂糖電泳測定的,可為至少I%純,例如至少5%純,至少10%純,至少20%純,至少40%純,至少60%純,至少80%純,至少90%純,或至少95%純。成熟多肽術語“成熟多肽”意指以其在翻譯和任何翻譯后修飾之后的最終形式存在的多肽,所述修飾例如N-末端加工、C-末端截短、糖基化、磷酸化等。在ー個方面,根據(jù)預測SEQIDNO2的氨基酸I至18是信號肽的SignalP程序(Nielsen等,1997,ProteinEngineering10:1-6),成熟多肽是SEQIDNO:2的氨基酸19至469。本領域中已知宿主細胞可產生兩種或更多種由相同多核苷酸表達的不同成熟多肽(即,具有不同的C端和/或N端氨基酸)的混合物。成熟多肽編碼序列術語“成熟多肽編碼序列”意指編碼具有纖維ニ糖水解酶活性的成熟多肽的多核苷酸。在ー個方面,根據(jù)預測SEQIDNO1的核苷酸I至54編碼信號肽的SignalP程序(Nielsen等,1997,見上),成熟多肽編碼序列是SEQIDN0:1的核苷酸55至1407。在另ー個方面,成熟多肽編碼序列是SEQIDNO:I的核苷酸55至1407的基因組DNA序列。序列同一性參數(shù)“序列同一性”描述兩個氨基酸序列之間或兩個核苷酸序列之間的相關性。就本發(fā)明而言,兩個氨基酸序列之間的序列同一性程度使用如EMBOSS軟件包(EMBOSS:TheEuropeanMolecularBiologyOpenSoftwareSuite,Rice等,2000,TrendsGenet.16:276-277),優(yōu)選3.0.0版或更高版本的Needle程序中所執(zhí)行的Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48:443-453)來測定。使用的可選參數(shù)為缺ロ開放罰分(gapopenpenalty)10,缺ロ延伸罰分(gapextensionpenalty)O.5和EBL0SUM62(BL0SUM62的EMBOSS版)取代矩陣。使用Needle標記為“最高同一'注(longestidentity)”的輸出結果(使用-nobrief選項獲得)作為百分比同一'I"生,并計算如下(同樣的殘基X100)バ比對長度-比對中缺ロ的總數(shù))就本發(fā)明而言,兩個脫氧核苷酸序列之間的序列同一性程度使用如EMBOSS軟件包(EMBOSS:TheEuropeanMolecularBiologyOpenSoftwareSuite,Rice等,2000,見上文),優(yōu)選3.0.0版或更高版本的Needle程序中所執(zhí)行的Needleman-Wunsch算法(Needleman和Wunsch,1970,見上文)來測定。使用的可選參數(shù)為缺ロ開放罰分10,缺ロ延伸罰分0.5和EDNAFULL(NCBINUC4.4的EMBOSS版)取代矩陣。使用Needle標記為“最高同一性”的輸出結果(使用-nobrief選項獲得)作為百分比同一性,并計算如下(同樣的脫氧核糖核苷酸X100)バ比對長度-比對中缺ロ的總數(shù))片段術語“片段”意指從成熟多肽的氨基和/或羧基末端缺失ー個或多個(幾個)氨基酸的多肽;其中所述片段具有纖維ニ糖水解酶活性。在ー個方面,片段含有至少390個氨基酸殘基,例如至少410個氨基酸殘基,或至少430個氨基酸殘基。亞序列術語“亞序列(subsequence)”意指從成熟多肽編碼序列的5’和/或3’端缺失ー個或多個(幾個)核苷酸的多核苷酸;其中所述亞序列編碼具有纖維ニ糖水解酶活性的片段。在ー個方面,亞序列含有至少1170個核苷酸,例如至少1230個核苷酸,或至少1290個核苷酸。等位變體(allelicvariant):術語“等位變體”在本文中表示占據(jù)相同染色體基因座的基因的任何兩種或更多種可選形式。等位變異通過突變天然地發(fā)生,并且可導致種群內的多態(tài)性。基因突變可以是沉默的(在編碼的多肽中無變化)或可以編碼具有改變的氨基酸序列的多肽。多肽的等位變體是由基因的等位變體編碼的多肽。編碼序列術語“編碼序列”意指直接指定多肽氨基酸序列的多核苷酸。編碼序列的邊界通常由開讀框決定,所述開讀框通常以ATG起始密碼子或其他起始密碼子例如GTG和TTG開始,并且以終止密碼子例如TAA、TAG和TGA結束。編碼序列可以是DNA、cDNA、合成的或重組的多核苷酸。cDNA:術語“cDNA”意指能夠通過反轉錄從得自真核細胞的成熟的、已剪接的mRNA分子制備的DNA分子。cDNA缺少通常存在于相應基因組DNA中的內含子序列。起始的(initial)、初級的RNA轉錄物是mRNA的前體,其通過一系列的包括剪接的步驟加工然后作為成熟的已剪接的mRNA出現(xiàn)。核酸構建體術語“核酸構建體”意指單鏈或雙鏈的核酸分子,其分離自天然存在的基因,或受修飾以本來不存在于(nototherwiseexist)自然界中的方式含有核酸的區(qū)段,或其為合成的。當所述核酸構建體含有表達本發(fā)明的編碼序列所需的調控序列時,術語核酸構建體與術語“表達盒”同義。調控序列(controlsequence):術語“調控序列”意指對編碼本發(fā)明多肽的多核苷酸表達是必需的所有成分。各個調控序列對于編碼所述多肽的多核苷酸可以是天然的或外源的,或各個調控序列對于彼此可以是天然的或外源的。這些調控序列包括但不限于前導序列、聚腺苷酸化序列、前肽序列、啟動子、信號肽序列和轉錄終止子。最少的情況,調控序列包括啟動子和轉錄和翻譯的終止信號。調控序列可以和用于引入特異性限制位點的接頭一起提供,所述特異性限制位點促進調控序列與編碼多肽的多核苷酸編碼區(qū)的連接。可操作地連接術語“可操作地連接”意指這樣的構型,其中將調控序列置于相對于多核苷酸的編碼序列的適當位置,使得調控序列指導編碼序列的表達。表達術語“表達”包括涉及多肽產生的任何步驟,其包括但不限于轉錄、轉錄后修飾、翻譯、翻譯后修飾和分泌。表達載體術語“表達載體”意指線性的或環(huán)狀的DNA分子,其包含編碼多肽的多核苷酸,并且所述多核苷酸與提供用于其表達的額外核苷酸可操作地連接。宿主細胞“宿主細胞”意指任何細胞類型,所述細胞類型對于使用包含本發(fā)明多核苷酸的核酸構建體或表達載體的轉化、轉染、轉導等是易感的(susceptible)。術語“宿主細胞”涵蓋親本細胞的任何后代,所述后代由于在復制中發(fā)生的突變而不同于親本細胞。變體術語“變體”意指具有纖維ニ糖水解酶活性的多肽,其包含改變,即在ー個或多個(幾個)位置的取代、插入和/或缺失ー個或多個(幾個)氨基酸殘基。取代意指用別的氨基酸取代占據(jù)某位置的氨基酸;缺失意指去除占據(jù)某位置的氨基酸;而插入意指鄰接于占據(jù)某位置的氨基酸添加ー個或多個(幾個)氨基酸,例如1-5個氨基酸。發(fā)明詳述具有纖維ニ糖水解酶活性的多肽本發(fā)明涉及具有纖維ニ糖水解酶活性的分離的多肽,所述多肽選自下組(a)多肽,其包含氨基酸序列,所述氨基酸序列與SEQIDNO2的成熟多肽具有至少99%同一性;(b)多肽,其由多核苷酸編碼,所述多核苷酸包含核苷酸序列,所述核苷酸序列與SEQIDNO1的成熟多肽編碼序列具有至少99%同一性;(d)多肽,其包含SEQIDNO:2的成熟多肽,或其具有纖維ニ糖水解酶活性的片段。本發(fā)明涉及分離的多肽,所述分離的多肽與SEQIDNO:2具有至少99%,例如100%的序列同一性,其具有纖維ニ糖水解酶活性。在ー個方面,所述多肽與SEQIDNO2的成熟多肽相差不超過十個氨基酸,例如相差五個氨基酸,相差四個氨基酸,相差三個氨基酸,相差兩個氨基酸,和相差一個氨基酸。本發(fā)明的多肽優(yōu)選包含SEQIDNO:2的氨基酸序列或其等位變體;或由SEQIDNO2的氨基酸序列或其等位變體組成;或為其具有纖維ニ糖水解酶活性的片段。在另ー個方面,所述多肽包含SEQIDNO:2的成熟多肽,或由SEQIDNO:2的成熟多肽組成。在另ー個優(yōu)選方面,所述多肽包含SEQIDNO:2的氨基酸19至469,或由SEQIDNO2的氨基酸19至469組成。本發(fā)明還涉及具有纖維ニ糖水解酶活性的分離的多肽,所述分離的多肽由多核苷酸編碼,所述多核苷酸在非常高嚴格條件下與以下雜交(i)SEQIDN0:1的成熟多肽編碼序列,(ii)SEQIDNO1的成熟多肽編碼序列的基因組DNA序列,或(iii)(i)或(ii)的全長互補鏈(J.Sambrook,E.F.Fritsch,和T.Maniatis,1989,MolecularCloning,ALaboratoryManual,弟2版,ColdSpringHarbor,NewYork)。SEQIDNO:1的多核苷酸或其亞序列,以及SEQIDNO2的氨基酸序列或其片段,可用于設計核酸探針,以根據(jù)本領域內公知的方法從不同屬或種的菌株鑒定和克隆編碼具有纖維ニ糖水解酶活性的多肽的DNA。具體而言,根據(jù)標準的Southern印跡方法,可將這些探針用于與感興趣的屬或種的基因組DNA或cDNA雜交,以鑒定和分離其中相應的基因。這些探針可明顯短于完整序列,但長度上應為至少14,例如至少25,至少35,或至少70個核苷酸。優(yōu)選地,所述核酸探針是至少100個核苷酸的長度,例如,至少200個核苷酸,至少300個核苷酸,至少400個核苷酸,至少500個,至少600個核苷酸,至少700個核苷酸,至少800個核苷酸,或至少900個核苷酸的長度。DNA和RNA探針二者均可使用。通常將探針標記以探測相應的基因(例如,用32P、3H、35S、生物素或抗生物素蛋白(avidin)標記)。這些探針涵蓋于本發(fā)明中??蓮挠蛇@些其它株(strain)制備的基因組DNA或cDNA文庫中篩選DNA,所述DNA與上述探針雜交并且編碼具有纖維ニ糖水解酶活性的多肽??梢酝ㄟ^瓊脂糖或聚丙烯酰胺凝膠電泳,或通過其它分離技術分離來自這些其它株的基因組或其它DNA??梢詫碜晕膸斓腄NA或分離的DNA轉移至硝化纖維素(nitrocellulose)或其它合適的載體材料并且固定于其上。為了鑒定與SEQIDNO:I或其亞序列同源的克隆或DNA,將所述載體材料優(yōu)選用在Sounthern印跡中。就本發(fā)明而言,雜交表示多核苷酸在非常低至非常高的嚴格條件下與標記的核酸探針雜交,所述核酸探針對應于SEQIDN01;SEQIDNO:1的成熟多肽編碼序列;SEQIDNO1的成熟多肽編碼序列的基因組DNA序列;其全長互補鏈;或它們的亞序列??墒褂美鏧射線片(X-rayfilm)檢測在這些條件下與核酸探針雜交的分子。在ー個方面,核酸探針是SEQIDNO:1的成熟多肽編碼序列或其基因組DNA序列。在另ー個方面,核酸探針是編碼SEQIDNO:2或其成熟多肽的多核苷酸。在另ー個方面,核酸探針是SEQIDNO:I或其基因組DNA序列。在另ー個方面,核酸探針是包含在大腸桿菌(E.coli)DSM22994中的質粒pCR2.1-P6XY中含有的多核苷酸,其中所述多核苷酸序列編碼具有纖維ニ糖水解酶活性的多肽。在另ー個方面,核酸探針是包含在大腸桿菌DSM22994中的質粒pCR2.1-P6XY中含有的成熟多肽編碼區(qū)。對于長度至少100個核苷酸的長探針,將非常低至非常高的嚴格條件定義為在42°C,在5XSSPE、0.3%SDS,200微克/ml已剪切并且變性的鮭精DNA中,并且對于非常低和低嚴格性為25%的甲酰胺、對于中和中-高嚴格性為35%的甲酰胺、或對于高和非常高嚴格性為50%的甲酰胺,根據(jù)標準的Southern印跡法進行預雜交和雜交最佳12至24小時。使用2XSSC、0.2%SDS在45°C(非常低嚴格性),在50°C(低嚴格性),在55°C(中嚴格性),在60°C(中-高嚴格性),在65°C(高嚴格性),和在70°C(非常高嚴格性)將載體材料最終洗滌三次,每次15分鐘。對于長度大約15個核苷酸至大約70個核苷酸的短探針,將嚴格條件定義為在比使用根據(jù)Bolton和McCarthy計算法(1962,Proc.Natl.Acad.Sci.USA48:1390)計算的Tni低大約5°C至大約10°C,在O.9MNaCl,O.09MTris-HClpH7.6,6mMEDTA,O.5%NP-40,1XDenhardt溶液,ImM焦憐酸鈉(sodiumpyrophosphate),ImM憐酸ニ氫鈉(sodiummonobasicphosphate),0.ImMATP和0.2mg姆ml的酵母RNA中,根據(jù)標準的Southern印跡步驟進行預雜交和雜交最佳12至24小時。將所述載體材料在6XSSC加0.I%SDS中最終洗滌一次15分鐘,并用6XSSC在比計算的Tm低5°C至I(TC的溫度洗滌兩次,每次15分鐘。本發(fā)明還涉及由多核苷酸編碼的具有纖維ニ糖水解酶活性的分離的多肽,所述多核苷酸與SEQIDNO:1的成熟多肽編碼序列或其基因組DNA序列具有至少99%,例如100%的序列同一性。本發(fā)明還涉及SEQIDNO2的成熟多肽或其同源序列的包含取代、缺失和/或插入ー個或多個(幾個)氨基酸的變體。優(yōu)選地,氨基酸改變對性質是較不重要的(ofaminornature),即保守的氨基酸取代或插入,其不顯著影響蛋白質的折疊和/或活性;通常為I至大約30個氨基酸的小缺失;小的氨基或羧基末端延伸,如氨基末端甲硫氨酸殘基;多至大約20-25個殘基的小接頭肽;或通過改變凈電荷或其它功能來促進純化的小延イ申,如多組氨酸序列(polyhistidinetract)、抗原表位(antigenicepitope)或結合域(bindingdomainノ。保守取代的實例是在以下組之內堿性氨基酸組(精氨酸、賴氨酸和組氨酸)、酸性氨基酸組(谷氨酸和天冬氨酸)、極性氨基酸組(谷氨酰胺和天冬酰胺)、疏水性氨基酸組(亮氨酸、異亮氨酸和纈氨酸)、芳族氨基酸組(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸組(甘氨酸、丙氨酸、絲氨酸、蘇氨酸和甲硫氨酸)。通常不改變比活性(specificactivity)的氨基酸取代是本領域已知的,并且由例如H.Neuratt^PR.L.Hill,1979,于TheProteins,AcademicPress,NewYork中描述。最普遍發(fā)生的交換是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu和Asp/Gly??晒┻x擇的是,氨基酸改變具有這樣的性質使多肽的物理化學性質改變。例如,氨基酸改變可改進多肽的熱穩(wěn)定性,改變底物特異性,改變最適PH等。能夠根據(jù)本領域已知的方法,例如定位誘變或丙氨酸分區(qū)誘變法(Cunningham和Wells,1989,Science244=1081-1085)來鑒定親本多肽中的必需氨基酸。在后ー技術中,將單ー丙氨酸突變引入到分子中的每個殘基,并且測試所得突變分子的纖維ニ糖水解酶活性以鑒定對于所述分子的活性關鍵的氨基酸殘基。同樣參見Hilton等,1996,J.Biol.Chem.271=4699-47080酶的活性部位或其它的生物相互作用也能夠通過結構的物理分析而測定,如通過以下這些技術如核磁共振、晶體學、電子衍射或光親和標記,連同推定的接觸位點氨基酸的突變來測定。參見例如deVos等,1992,Science255:306-312;Smith等,1992,J.Mol.Biol.224:899-904;fflodaver等,1992,F(xiàn)EBSLett.309:59_64。必需氨基酸的身份(identity)也能夠從與多肽的同一'丨生分析來推斷,所述多肽與親本多肽相關。能夠使用已知的誘變、重組和/或改組(shuffling)方法,然后是有關的篩選方法,例如那些由Reidhaar-Olson和Sauer,1988,Science241:53-57;Bowie和Sauer,1989,Proc.Natl.Acad.Sci.USA86:2152-2156;W095/17413;或W095/22625公開的那些方法來進行并測試單個或多個氨基酸取代、缺失和/或插入。能夠使用的其它方法包括易錯PCR、噬菌體展示(例如,Lowman等,1991,Biochemistry30:10832-10837;美國專利No.5,223,409;W092/06204)和區(qū)域定向的誘變(Derbyshire等,1986,Gene46:145;Ner等,1988,DNA7:127)。誘變/改組方法能夠與高通量、自動化的篩選方法組合以檢測由宿主細胞表達的克隆的、誘變的多肽的活性(Ness等,1999,NatureBiotechnology17:893-896)。能夠從宿主細胞回收編碼活性多肽的誘變的DNA分子,并且使用本領域內標準方法快速測序。這些方法允許快速測定多肽中單個氨基酸殘基的重要性。SEQIDNO:2的成熟多肽的氨基酸取代、缺失和/或插入的總數(shù)不多于10,例如1,2,3,4,5,6,7,8或9。所述多肽可為雜合多肽,其中一種多肽的一部分融合于另ー種多肽的一部分的N端或C端。所述多肽可為融合多肽或可切割的融合多肽,其中另ー種多肽融合于本發(fā)明多肽的N端或C端。通過將編碼另ー個多肽的多核苷酸融合于本發(fā)明的多核苷酸來產生融合的多肽。產生融合多肽的技術是本領域已知的,并包括連接編碼多肽的編碼序列以使它們在閱讀框中,并且使融合多肽的表達在相同啟動子和終止子的控制下。融合蛋白亦可使用內蛋白(intein)技術構建,其中融合物在翻譯后產生(Cooper等,1993,EMBOJ.122575-2583;Dawson等,1994,Science266:776-779)。融合多肽還可以包含在兩個多肽之間的切割位點。一旦分泌了融合多肽,就切割所述位點,釋放所述兩個多肽。切割位點的實例包括,但不限于,公開于Martin等,2003,J.Ind.Microbiol.Biotechnol.3:568-76;Svetina等,2000,J.Biotechnol.76:245-251;Rasmussen-Wilson等,1997,Appl.Environ.Microbiol.63:3488-3493;ffard等,1995,Biotechnology13:498-503;和Contreras等,1991,Biotechnology9:378-381;Eaton等,1986,Biochem.25:505-512);Collins-Racie等,1995,Biotechnology13:982-987;Carter等,1989,Proteins!Structure,Function,andGenetics6:240-248;以及Stevens,2003,DrugDiscoveryWorld4:35-48中的位點。具有纖維ニ糖水解酶活性的多肽的來源本發(fā)明的具有纖維ニ糖水解酶活性的多肽可以獲得自任何屬的微生物。就本發(fā)明而言,用于本文與給定的來源有關的術語“獲得自”,意思應為多核苷酸編碼的多肽由所述來源產生,或由其中插入了來自所述來源的多核苷酸的菌株產生。在ー個方面,獲得自給定來源的多肽是胞外分泌的。所述多肽可以是細菌多肽。例如,所述多肽可以是具有纖維ニ糖水解酶活性的革蘭氏陽性細菌多肽例如芽孢桿菌屬(Bacillus)、梭菌屬(Clostridium)、腸球菌屬(Enterococcus)、地芽抱桿菌屬(Geobacillus)、乳桿菌屬(Lactobacillus)、乳球菌屬(Lactococcus)、海洋芽抱桿菌屬(Oceanobacillus)、葡萄球菌屬(Staphylococcus)、鏈球菌屬(Streptococcus)、或鏈霉菌屬(Streptomyces)多肽;或革蘭氏陰性細菌多肽,如彎曲桿菌屬(Campylobacter)、大腸桿菌(E.coli)、黃桿菌屬(Flavobacterium)、梭桿菌屬(Fusobacterium)、螺桿菌屬(Helicobacter)、泥桿菌屬(Ilyobacter)、奈瑟氏菌屬(Neisseria)、假單胞菌屬(Pseudomonas)、沙門氏菌屬(Salmonella)或脲原體屬(Ureaplasma)多妝。在ー個方面,所述多肽是嗜堿芽孢桿菌(Bacillusalkalophilus)、解淀粉芽孢桿菌(Bacillusamyloliquefaciens)、短芽抱桿菌(Bacillusbrevis)、環(huán)狀芽抱桿菌(Bacilluscirculans)、克勞氏芽抱桿菌(Bacillusclausii)、凝結芽抱桿菌(Bacilluscoagulans)、堅強芽抱桿菌(Bacillusfirmus)、燦爛芽抱桿菌(Bacilluslautus)、遲緩芽抱桿菌(Bacilluslentus)、地衣芽抱桿菌(Bacilluslicheniformis)、巨大芽抱桿菌(Bacillusmegaterium)、短小芽孢桿菌(Bacilluspumilus)、嗜熱脂肪芽孢桿菌(Bacillusstearothermophilus)、枯草芽抱桿菌(Bacillussubtilis)或蘇云金芽抱桿菌(Bacillusthuringiensis)多月太。在另ー個方面,所述多肽是似馬鏈球菌(Streptococcusequisimilis)、釀膿鏈球菌(Streptococcuspyogenes)、乳房鏈球菌(Streptococcusuberis)或馬鏈球菌獸痕亞種(streptococcusequisubsp.Zooepidemicus)多月太。在另ー個方面,所述多肽是不產色鏈霉菌(Streptomycesachromogenes)、除蟲鏈霉囷(Streptomycesavermitilis)、天藍鏈毒菌(Streptomycescoelicolor)、灰色鏈霉-囷(Streptomycesgriseus)或淺青紫鏈霉菌(Streptomyceslividans)多月太。所述多肽也可以是真菌多肽。例如,所述多肽可為酵母多肽如假絲酵母屬(Candida)、克魯維酵母屬(Kluyveromyces)、畢赤酵母屬(Pichia)、酵母屬(Saccharomyces)、裂通酵母屬(Schizosaccharomyces)或西洋蓄霉屬(Yarrowia)多肽;或絲狀真菌多肽如枝頂孢霉屬(Acremonium)、傘菌屬(Agaricus)、鏈格孢屬(Aiternaria)、曲4)(AspergiiIusノ、失_0^更4jS(Aureobasidium)、Botryospaeria、宇以錯菌屬(Ceriporiopsis)、毛嗪殼屬(Chaetomidium)、金抱子菌屬(Chrysosporium)、Claviceps、Cochliobolus、鬼傘屬(Coprinopsisノ、&^0七61'11168、棒_冗屬(Corynascus)、隱叢赤殼菌屬(Cryphonectria)、隱球菌屬(Cryptococcus)、色ニ孢屬(Diplodia)、黑耳屬(Exidia)、Filibasidium、f廉抱屬(Fusarium)、赤霉屬(Gibberella)、全鞭毛蟲屬(Holomastigotoides)、腐質霉屬(Humicola)、把齒菌屬(Irpex)、蘑燕屬(Lentinula)、Leptospaeria、梨抱菌屬(Magnaporthe;、Melanocarpus、多孑し菌屬(Meripilus)、毛霉屬(Mucor)、毀絲霉屬(Myceliophthora)、新考瑪脂霉屬(Neocallimastix)、脈孢菌屬(Neurospora)、擬青霉屬(Paecilomyces)、青霉屬(Penicillium)、平革菌屬(Phanerochaete)、瘤胃壺菌屬(Piromyces)、Poitrasia、假黑盤菌屬(Pseudoplectania)、Pseudotrichonympha、根毛霉屬(Rhizomucor)、裂糟菌屬(Schizophyllum)、柱頂抱屬(Scytalidium)、踝節(jié)菌屬(Talaromyces)、嗜熱子囊菌屬(Thermoascus)、梭孢殼屬(Thielavia)、彎頸霉屬(Tolypocladium)、木霉屬(Trichoderma)、長毛盤菌屬(Trichophaea)、輪枝孢屬(Verticillium)、包腳燕屬(Volvariella)或炭角菌屬(Xylaria)多肽。在另ー個方面,所述多肽是卡爾酵母(Saccharomycescarlsbergensis)、釀酒酵母(Saccharomycescerevisiae)、糖化酵母(Saccharomycesdiastaticus)、道格拉氏酵母(Saccharomycesdouglasii)、克魯弗酵母(Saccharomyceskluyveri)、諾地酵母(saccharomycesnorbensisノ或卵形酵母(saccharomycesoviformisノ多太。在另ー個優(yōu)選的方面,所述多肽是解纖維枝頂孢霉(Acremoniumcellulolyticus)、棘抱曲霉(Aspergillusaculeatus)、泡盛曲霉(Aspergillusawamori)、臭曲4(Aspergillusfoetidusノ、煙曲4(Aspergillusfumigatus)、日本曲霉(Aspergillusjaponicus)、構巢曲霉(Aspergillusnidulans)、黑曲霉(Aspergillusniger)(Aspergillusoryzaeノ、Chrysosporiuminops、P魯用質金抱卞菌(Chrysosporiumkeratinophilum)、しhrysosporiumlucknowense、しhrysosporium(Cnrysosporiumpannicoiaノ、Chrysosporiumqueenslandicum、熱帶金抱子菌(Chrysosporiumtropicum)、Chrysosporiumzonatum、桿抱狀·廉抱(Fusariumbactridioides)、禾谷卒廉抱(Fusariumcerealisノ、庫威卒廉抱(Fusariumcrookwellense)、大刀·廉包(Fusariumculmorum)、木本科·廉抱(Fusariumgraminearum)、木赤·廉抱(Fusariumgraminum)、異包·廉抱(Fusariumheterosporum)、合歡木·廉抱(Fusariumnegundi)、尖·廉抱(Fusariumoxysporum)、多枝·廉抱(Fusariumreticuiatum)、粉紅廉抱(Fusariumroseum)、接骨木·廉抱(Fusariumsambucinum)、膚色·廉抱(Fusariumsarcochroum)、擬分權抱廉抱(Fusariumsporotrichioides;、硫色·廉抱(Fusariumsuiphureum)、|s]卒廉抱(Fusariumtorulosumノ、擬絲抱卒廉包(Fusariumtrichothecioides)、壤片廉抱(Fusariumvenenatum)、灰腐質霉(Humicolagrisea)、特異腐質霉(Humicolainsolens)、疏棉狀腐質霉(Humicolalanuginosa)、白把齒菌(Irpexlacteus)、米黑毛霉(Mucormiehei)、嗜熱毀絲霉(Myceliophthorathermophila)、粗糖脈抱菌(Neurosporacrassa)、繩狀肯*(Penicilliumfuniculosum)、產紫青秦(Penicilliumpurpurogenum)、黃抱平革菌(Phanerochaetechrysosporium)、無色梭抱殼(Thielaviaachromatica)、Thielaviaalbomyces、Thielaviaalbopiiosa、澳洲梭抱冗(Thielaviaaustraleinsis)、Thielaviafimeti、小抱梭抱殼(Thielaviamicrospora)、卵抱梭抱殼(Thielaviaovispora)ΛThielaviaperuviana、毛梭抱冗(Thielaviasetosa)、瘤抱梭抱(Thielaviaspededonium)、Thielaviasubthermophila、土生梭抱霉(Thielaviaterrestris)、哈茨木霉(Trichodermaharzianum)、康寧木霉(Trichodermakoningii)、長枝木霉(TrichodermaIongiorachiatumノ、里氏木4(Trichodermareesei)或綠色木霉urichodermaviride)多肽。在另ー個方面,所述多肽是具有纖維ニ糖水解酶活性的棘孢曲霉多肽。在另ー個方面,所述多肽是具有纖維ニ糖水解酶活性的棘孢曲霉IAM2445多肽,例如包含SEQIDN02的成熟多肽的多肽??衫斫獾氖菍τ谇笆龅姆N,本發(fā)明包含完全和不完全階段(perfectandimperfectstates),和其它分類學的等同物(equivalent),例如無性型(anamorph),而無論它們已知的種名。本領域技術人員將容易地識別適合的等同物的身份。這些種的菌株在許多培養(yǎng)物保藏中心對于公眾能夠容易地取得,所述保藏中心諸如美國典型培養(yǎng)物保藏中心(theAmericanTypeCultureCollection)(ATCC)、德意志微生物和細胞培養(yǎng)物保藏中心(DeutscheSammlungvonMikroorganismenundZellkulturenGmbH)(DSMZ)、真菌菌種保藏中心(CentraalbureauVoorSchimmelcultures)(CBS)和農業(yè)研究機構專利培養(yǎng)物保藏中心北區(qū)研究中心(AgriculturalResearcnServicePatentCultureCollection,NorthernRegiona丄ResearchCenter)(NRRL)??梢允褂蒙鲜龅奶结槒钠渌鼇碓?,包括從自然界(例如,土壌、堆肥、水等)分離的微生物鑒定和獲得所述多肽。用于從天然生境(habitat)分離微生物的技術是本領域內公知的。隨后可通過相似地篩選另ー種微生物的基因組DNA或cDNA文庫或混合的DNA樣品來獲得編碼所述多肽的多核苷酸。一旦用所述探針檢測到編碼多肽的多核苷酸,就能夠使用本領域普通技術人員熟知的技術將所述多核苷酸分離或克隆(參見,例如,Sambrook等,1989,見上文)。多核苷酸本發(fā)明還涉及編碼本發(fā)明多肽的分離的多核苷酸。用于分離或克隆編碼多肽的多核苷酸的技術是本領域內已知的,包括從基因組DNA分離,從cDNA制備,或其組合??赏ㄟ^例如使用熟知的聚合酶鏈式反應(PCR)或表達文庫的抗體篩選來檢測具有共有結構特性的克隆DNA片段,從而實現(xiàn)從這種基因組DNA克隆多核苷酸。參見,例如,Innis等,1990,PCR:AGuidetoMethodsandApplication,AcademicPress,NewYork??梢允褂闷渌怂釘U增方法,如連接酶鏈式反應(LCR)、連接活化轉錄(ligatedactivatedtranscription;LAT)和基于多核苷酸的擴增(NASBA)??梢詮那箤倬?,或相關生物體克隆所述多核苷酸,并且因此可為例如所述多核苷酸的多肽編碼區(qū)的等位基因變體或種變體(speciesvariant)。本發(fā)明還涉及包含下述多核苷酸或由下述多核苷酸組成的分離的多核苷酸,所述多核苷酸與SEQIDNO:1的成熟多肽編碼序列或其基因組DNA序列具有至少99%,例如100%的序列同一性程度,其編碼具有纖維ニ糖水解酶活性的多肽。修飾編碼本發(fā)明多肽的多核苷酸對于合成與所述多肽基本上相似的多肽可為必需的。術語與所述多肽“基本上相似”指多肽的非天然存在的形式。這些多肽可能以ー些エ程改造的方式而不同于從其天然來源分離的多肽,例如,比活性、熱穩(wěn)定性、最適PH等方面不同的變體??梢栽谧鳛镾EQIDNO:I的成熟多肽編碼序列或其基因組DNA序列存在的多核苷酸,例如其亞序列的基礎上,和/或通過引入如下核苷酸取代來構建變體所述取代不導致多肽氨基酸序列的改變,但是符合意欲產生酶的宿主生物體的密碼子選擇;或者所述取代可產生不同的氨基酸序列。關于核苷酸取代的概述,參見,例如,F(xiàn)ord等,1991,ProteinExpressionandPurification2:95_107。本發(fā)明還涉及編碼本發(fā)明多肽的分離的多核苷酸,所述分離的多核苷酸在非常低嚴格條件、低嚴格條件、中等嚴格條件、中-高嚴格條件、高嚴格條件或非常高嚴格條件下與以下雜交(i)SEQIDNO:I的成熟多肽編碼序列,(ii)包含于SEQIDNO:1的成熟多肽編碼序列的基因組DNA序列,或(iii)(i)或(ii)的全長互補鏈;或它們的等位變體和亞序列(Sambrook等,1989,見上文),如本文所定義的。在ー個方面,所述多核苷酸包含SEQIDNO:1,SEQIDNO:I的成熟多肽編碼序列,或大腸桿菌DSM22994中所含的質粒pCR2.1-P6XY中包含的序列,或編碼SEQIDNO2具有纖維ニ糖水解酶活性的片段的SEQIDNO1亞序列,如SEQIDNO1核苷酸55至1407的多核苷酸,或者所述多核苷酸由SEQIDNO1,SEQIDNO:I的成熟多肽編碼序列,或大腸桿菌DSM22994中所含的質粒pCR2.1-P6XY中包含的序列,或編碼SEQIDNO:2具有纖維ニ糖水解酶活性的片段的SEQIDNO1亞序列,如SEQIDNO1核苷酸55至1407的多核苷酸組成。核酸構建體本發(fā)明還涉及包含本發(fā)明的多核苷酸的核酸構建體,所述多核苷酸與ー個或多個(幾個)調控序列可操作地連接,所述調控序列在合適的宿主細胞中在與該調控序列相容的條件下指導編碼序列的表達??梢杂迷S多方式操作所述多核苷酸以提供多肽的表達。依賴于表達載體,在將多核苷酸插入載體之前對其進行操作可能是理想的或必需的。使用重組DNA方法修飾多核苷酸的技術是本領域熟知的。調控序列可為啟動子序列,其是由用于表達編碼本發(fā)明多肽的多核苷酸的宿主細胞所識別的多核苷酸。啟動子序列含有介導多肽的表達的轉錄調控序列。啟動子可以是在所選的宿主細胞中顯示轉錄活性的任何多核苷酸,包括突變的、截短的和雜合的啟動子,并且可以從編碼與宿主細胞同源或異源的胞外或胞內多肽的基因獲得。用于在細菌宿主細胞中指導本發(fā)明的核酸構建體轉錄的合適啟動子的實例是從下述獲得的啟動子解淀粉芽孢桿菌α-淀粉酶基因(amyQ)、地衣芽孢桿菌α-淀粉酶基因(amyL)、地衣芽孢桿菌青霉素酶基因(penP)、嗜熱脂肪芽孢桿菌產麥芽淀粉酶基因(amyM)、枯草芽孢桿菌果聚糖蔗糖酶基因(sacB)、枯草芽孢桿菌xylA和xylB基因、大腸桿菌Iac操縱子、天藍鏈霉菌瓊脂糖酶基因(dagA)和原核β-內酰胺酶基因(Villa-Kamaroff等,1978,ProceedingsoftheNationalAcademyofSciencesUSA75:3727-3731),以及tac啟動子(DeBoer等,1983,Proc.Natl.Acad.Sci.USA80:2ト25)。另夕卜的啟動子在"Usefulproteinsfromrecombinantbacteria"于Gilbert等,1980,ScientificAmerican,242:74-94中;和在Sambrook等,1989,見上文中描述。用于指導本發(fā)明的核酸構建體在絲狀真菌宿主細胞中轉錄的合適啟動子的實例是從下列酶的基因獲得的啟動子構巢曲霉こ酰胺酶、黑曲霉中性α-淀粉酶、黑曲霉酸穩(wěn)定性α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、米曲霉TAKA淀粉酶、米曲霉堿性蛋白酶、米曲霉丙糖磷酸異構酶、尖錸孢胰蛋白酶樣蛋白酶(W096/00787)、鑲片錸孢淀粉葡糖苷酶(W000/56900)、鑲片錸孢Daria(W000/56900)、鑲片錸孢Quinn(W000/56900)、曼赫根毛霉(Rhizomucormiehei)脂肪酶、曼赫根毛霉天冬氨酸蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纖維ニ糖水解酶I、里氏木霉纖維ニ糖水解酶II、里氏木霉內切葡聚糖酶I、里氏木霉內切葡聚糖酶II、里氏木霉內切葡聚糖酶III、里氏木霉內切葡聚糖酶IV、里氏木霉內切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉β-木糖苷酶,以及NA2_tpi啟動子(一種修飾的啟動子,其來自在曲霉屬中編碼中性α-淀粉酶的基因,其中未翻譯的前導序列由在曲霉屬(Aspergilli)中編碼丙糖磷酸異構酶的基因的未翻譯的前導序列所替代;非限制性實例包括修飾的啟動子,其來自在黑曲霉中編碼中性α-淀粉酶的基因,其中未翻譯的前導序列由在構巢曲霉或米曲霉中編碼丙糖磷酸異構酶的基因的未翻譯的前導序列所替代);和它們的突變的、截短的和雜合的啟動子。在酵母宿主中,有用的啟動子從如下酶的基因獲得釀酒酵母烯醇化酶(ΕΝ0-1)、釀酒酵母半乳糖激酶(GALl)、釀酒酵母醇脫氫酶/甘油醛-3-磷酸脫氫酶(ADH1,ADH2/GAP)、釀酒酵母丙糖磷酸異構酶(TPI)、釀酒酵母金屬硫蛋白(CUPl)和釀酒酵母3-磷酸甘油酸激酶。對于酵母宿主細胞其它有用的啟動子由Romanos等,1992,Yeast8:423-488描述。調控序列也可以是合適的轉錄終止子序列,其由宿主細胞識別以終止轉錄。所述終止子序列與編碼所述多肽的多核苷酸的3’末端可操作地連接??梢詫⒃谒x宿主細胞中有功能的任何終止子用在本發(fā)明中。對于絲狀真菌宿主細胞優(yōu)選的終止子從如下酶的基因獲得構巢曲霉鄰氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶和尖錸孢胰蛋白酶樣蛋白酶。對于酵母宿主細胞優(yōu)選的終止子從如下酶的基因獲得釀酒酵母烯醇化酶、釀酒酵母細胞色素C(CYCl)和釀酒酵母甘油醛-3-磷酸脫氫酶。對于酵母宿主細胞其它有用的終止子由Romanos等,1992,見上文描述。調控序列還可以是合適的前導序列,當被轉錄時其為對于宿主細胞的翻譯重要的mRNA非翻譯區(qū)。前導序列可操作地連接于編碼多肽的多核苷酸的5’-末端??墒褂迷谒x宿主細胞中有功能的任何前導序列。對于絲狀真菌宿主細胞優(yōu)選的前導序列從如下酶的基因獲得米曲霉TAKA淀粉酶和構巢曲霉丙糖磷酸異構酶。對于酵母宿主細胞合適的前導序列從如下酶的基因獲得釀酒酵母烯醇化酶(EN0-1)、釀酒酵母3-磷酸甘油酸激酶、釀酒酵母α因子和釀酒酵母醇脫氫酶/甘油醛-3-磷酸脫氫酶(ADH2/GAP)。調控序列也可以是聚腺苷酸化序列,其是與多核苷酸的3’末端可操作地連接的序列,并且在轉錄時,宿主細胞將其識別為將聚腺苷殘基添加至轉錄的mRNA的信號??墒褂迷谒x宿主細胞中有功能的任何聚腺苷酸化序列。對于絲狀真菌宿主細胞優(yōu)選的聚腺苷酸化序列從如下酶的基因獲得米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、構巢曲霉鄰氨基苯甲酸合酶、尖錸孢胰蛋白酶樣蛋白酶和黑曲霉α-葡糖苷酶。對于酵母宿主細胞有用的聚腺苷酸化序列由Guo和Sherman,1995,Mol.CellularBiol.15:5983-5990描述。調控序列還可以是信號肽編碼區(qū),其編碼與多肽的N端相連的信號肽,并且指導所述多肽進入細胞分泌途徑。多核苷酸的編碼序列5’端可固有地包含信號肽編碼序列,其與編碼所述多肽的編碼序列的區(qū)段一起天然地連接在翻譯閱讀框中??晒┻x擇的是,編碼序列5’端可含有對于所述編碼序列異源的信號肽編碼序列。異源信號肽編碼序列在編碼序列不天然地含有信號肽編碼序列時可為必需的?;蛘?,外源信號肽編碼序列可以簡單地取代天然信號肽編碼序列以增強多肽的分泌。然而,可使用指導表達的多肽進入所選宿主細胞的分泌途徑的任何信號肽編碼序列。對于細菌宿主細胞有效的信號肽編碼序列是從如下酶的基因獲得的信號肽編碼序列芽孢桿菌屬NCIB11837產麥芽糖淀粉酶、地衣芽孢桿菌枯草桿菌蛋白酶(subtilisin)、地衣芽孢桿菌內酰胺酶、嗜熱脂肪芽孢桿菌α-淀粉酶、嗜熱脂肪芽孢桿菌中性蛋白酶(nprT,nprS,nprM)和枯草芽孢桿菌prsA。另外的信號肽由Simonen和Palva,1993,MicrobiologicalReviews57:109-137描述。對于絲狀真菌宿主細胞有效的信號肽編碼序列是從如下酶的基因獲得的信號肽編碼序列黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米曲霉TAKA淀粉酶、特異腐質霉纖維素酶、特異腐質霉內切葡聚糖酶V、疏棉狀腐質霉脂肪酶和曼赫根毛霉天冬氨酸蛋白酶。對于酵母宿主細胞有用的信號肽從釀酒酵母α因子和釀酒酵母轉化酶的基因獲得。其它有用的信號肽編碼序列由Romanos等,1992,見上文描述。調控序列還可以是前肽編碼序列,其編碼位于多肽N端的前肽。所得多肽稱為酶原(proenzyme)或前多肽(propolypeptide)(或在某些情況下稱為酶原(zymogen))。前多肽通常是無活性的,并且能夠通過前肽的催化或自催化切割從前多肽轉化為活性多肽。可以從枯草芽孢桿菌堿性蛋白酶(aprE)、枯草芽孢桿菌中性蛋白酶(nprT)、嗜熱毀絲霉漆酶(WO95/33836)、曼赫根毛霉天冬氨酸蛋白酶和釀酒酵母α因子的基因獲得前肽編碼序列。當信號肽和前肽序列二者均出現(xiàn)在多肽的N端吋,將前肽序列置于緊接著(nextto)多肽N端,并且將信號肽序列置于緊接著前肽序列的N端。同樣理想的是添加調節(jié)序列,其允許相對于宿主細胞的生長來調節(jié)多肽的表達。調節(jié)系統(tǒng)的實例是引起基因表達響應化學或物理刺激物,包括調節(jié)化合物的存在而開啟或關閉的那些系統(tǒng)。原核系統(tǒng)中的調節(jié)系統(tǒng)包括lac、tac和trp操縱基因系統(tǒng)。在酵母中,可使用ADH2系統(tǒng)或GALl系統(tǒng)。在絲狀真菌中,可以使用黑曲霉葡糖淀粉酶啟動子、米曲霉TAKAα-淀粉酶啟動子和米曲霉葡糖淀粉酶啟動子。調節(jié)序列的其它實例是那些允許基因擴增的序列。在真核系統(tǒng)中,這些調節(jié)序列包括在氨甲蝶呤(methotrexate)存在下擴增的ニ氫葉酸還原酶基因,和以重金屬(withheavymetal)擴增的金屬硫蛋白基因。在這些情況下,編碼多肽的多核苷酸將與調節(jié)序列可操作地連接。表達載體本發(fā)明還涉及重組表達載體,所述重組表達載體包含本發(fā)明的多核苷酸、啟動子和轉錄和翻譯終止信號。多種核苷酸和調控序列可以結合在一起以產生重組表達載體,所述表達載體可以包括ー個或多個(幾個)方便的限制位點以允許在這些位點插入或取代編碼多肽的多核苷酸??晒┻x擇的是,可以通過在適當?shù)挠糜诒磉_的載體中插入包含所述序列的多核苷酸或核酸構建體來表達所述多核苷酸。在制備表達載體的過程中,將編碼序列置于載體中,從而將該編碼序列與適當?shù)谋磉_調控序列可操作地連接。重組表達載體可以是任何載體(例如,質?;虿《?,其能夠方便地進行重組DNA步驟,并且能夠產生多核苷酸的表達。載體的選擇將通常依賴于載體與將引入該載體的宿主細胞的相容性。載體可以是線狀或閉合環(huán)狀質粒。載體可以是自主復制載體,即,作為染色體外實體(entity)存在的載體,其復制獨立于染色體復制,例如,質粒、染色體外元件、微型染色體(minichromosome)或人工染色體。載體可以含有任何用于確保自復制的手段(means)。或者,載體可以是ー種當被引入宿主細胞中時,整合到基因組中并且與整合了該載體的染色體一起復制的載體。此外,可以使用単獨的載體或質?;騼蓚€或更多個載體或質粒,其共同含有待引入宿主細胞基因組的完整DNA(totalDNA),或可以使用轉座子(transposon)。所述載體優(yōu)選地含有ー個或多個(幾個)選擇性標記,其允許簡單選擇經轉化、轉染、轉導等的細胞。選擇性標記是基因,其產物提供殺生物劑或病毒抗性、對重金屬的抗性、對營養(yǎng)缺陷型的原養(yǎng)性(prototrophytoauxotrophs)等。細菌選擇性標記的實例是來自枯草芽孢桿菌或地衣芽孢桿菌的dal基因,或賦予抗生素抗性的標記,所述抗生素抗性例如氨芐青霉素、氯霉素、卡那霉素或四環(huán)素抗性。對于酵母宿主細胞合適的標記是ADE2、HIS3、LEU2、LYS2、MET3、TRPI和URA3。用于絲狀真菌宿主細胞的選擇性標記包括但不限于amdS(こ酰胺酶)、argB(鳥氨酸氨甲酰基轉移酶)、bar(草銨膦(phosphinothricin)こ酰轉移酶)、hph(潮霉素磷酸轉移酶)、niaD(硝酸還原酶)(nitratereductase)、pyrG(乳清酸核苷_5’_憐酸脫羧酶)(orotidine_5’-phosphatedecarboxylase)>sC(硫酸腺苷酸轉移酶)和trpC(鄰氨基苯甲酸合酶(anthranilatesynthase))以及它們的等同物。優(yōu)選用在曲霉屬細胞中的是構巢曲霉或米曲霉的amdS和pyrG基因和吸水鏈霉菌(Streptomyceshygroscopicus)的bar基因。所述載體優(yōu)選含有元件,其允許載體整合入宿主細胞基因組或載體在細胞中獨立于基因組的自主復制。為了整合入宿主細胞基因組,載體可依賴編碼多肽的多核苷酸的序列或用于通過同源或非同源重組整合入基因組的任何其它載體元件。或者,載體可以含有額外的多核苷酸,用于指導通過同源重組整合入宿主細胞基因組染色體中的精確位置。為了增加在精確位置整合的可能性,整合元件應含有足夠數(shù)量的核酸,如100至10,000堿基對,400至10,000堿基對,和800至10,000堿基對,其與相應的目標序列具有高度序列同一性以增強同源重組的概率。整合元件可以是任何序列,其與宿主細胞基因組中的目標序列同源。此夕卜,整合元件可以是非編碼或編碼的多核苷酸。另ー方面,可以將載體通過非同源重組整合到宿主細胞的基因組中。為了自主復制,載體可以進一歩包含復制起點,其使載體能夠在所述的宿主細胞中自主地復制。復制起點可以是介導自主復制的任何質粒復制子(replicator),其在細胞中發(fā)揮功能。術語“復制起點”或“質粒復制子”意指能夠使質?;蜉d體體內復制的多核苷酸。細菌復制起點的實例是允許在大腸桿菌中復制的質粒pBR322、pUC19、pACYC177和pACYC184的復制起點,和允許在芽孢桿菌屬中復制的質粒pUBllO、pE194、pTA1060和ρΑΜβI的復制起點。用于酵母宿主細胞中的復制起點的實例是2微米復制起點,ARSl,ARS4,ARSl和CEN3的組合,和ARS4和CEN6的組合。在絲狀真菌細胞中有用的復制起點的實例是AMAl和ANSI(Gems等,1991,Gene98:61-67;Cullen等,1987,NucleicAcidsRes.15:9163-9175;W000/24883)。分離AMAl基因和構建包含該基因的質粒或載體能夠根據(jù)公開于WO00/24883中的方法完成??梢詫⒍嘤讴`個拷貝的本發(fā)明的多核苷酸插入宿主細胞以増加多肽的產生。多核苷酸拷貝數(shù)的増加可通過如下方法獲得將至少一個額外拷貝的序列整合入宿主細胞基因組,或將可擴增的選擇性標記基因包括于多核苷酸,其中可通過在合適的選擇劑(selectableagent)存在下培養(yǎng)細胞來選擇含有選擇性標記基因的擴增拷貝,且由此含有多核苷酸的額外拷貝的細胞。用于連接上述元件以構建本發(fā)明的重組表達載體的方法是本領域技術人員熟知的(參見,例如,Sambrook等,1989,見上文)。宿主細胞本發(fā)明還涉及重組宿主細胞,其包含本發(fā)明的多核苷酸可操作地連接于一個或多個(幾個)指導本發(fā)明多肽的產生的調控序列。將包含多核苷酸的構建體或載體導入宿主細胞,使所述構建體或載體如前所述作為染色體整合體或者作為自復制的染色體外載體維持。術語“宿主細胞”包括親本細胞的任何后代,其由于復制過程中發(fā)生的突變而不同于親本細胞。宿主細胞的選擇將在很大程度上依賴于編碼多肽的基因及其來源。宿主細胞可以是在本發(fā)明的多肽的重組產生中有用的任何細胞,例如,原核或真核細胞。原核宿主細胞可以是任何革蘭氏陽性或革蘭氏陰性細菌。革蘭氏陽性細菌包括但不限干,芽孢桿菌屬、梭菌屬、腸球菌屬、地芽孢桿菌屬、乳桿菌屬、乳球菌屬、海洋芽孢桿菌屬、葡萄球菌屬、鏈球菌屬和鏈霉菌屬。革蘭氏陰性細菌包括但不限于,彎曲桿菌屬、大腸桿菌、黃桿菌屬、梭桿菌屬、螺桿菌屬、泥桿菌屬、奈瑟氏菌屬、假單胞菌屬、沙門氏菌屬和脲原體屬。細菌宿主細胞可以是任何芽孢桿菌屬細胞,包括但不限于嗜堿芽孢桿菌、解淀粉芽孢桿菌、短芽孢桿菌、環(huán)狀芽孢桿菌、克勞氏芽孢桿菌、凝結芽孢桿菌、堅強芽孢桿菌、燦爛芽孢桿菌、遲緩芽孢桿菌、地衣芽孢桿菌、巨大芽孢桿菌、短小芽孢桿菌、嗜熱脂肪芽孢桿菌、枯草芽孢桿菌和蘇云金芽孢桿菌細胞。細菌宿主細胞還可以是任何鏈球菌屬細胞,包括但不限于,似馬鏈球菌、釀膿鏈球菌、乳房鏈球菌(Streptococcusuberis)和馬鏈球菌獸痕亞種細胞。細菌宿主細胞還可以是任何鏈霉菌屬細胞,包括但不限于,不產色鏈霉菌、除蟲鏈霉菌、天藍鏈霉菌、灰色鏈霉菌和淺青紫鏈霉菌細胞??赏ㄟ^如下方法實現(xiàn)將DNA引入到芽孢桿菌屬細胞例如原生質體轉化(參見,例如,Chang和Cohen,1979,Mol.Gen.Genet.168:111-115),使用感受態(tài)細胞(參見,例如,Young和Spizizen,1961,J.Bacteriol.81:823-829或Dubnau和Davidoff-Abelson,1971,J.Mol.Biol.56:209-221),電穿孔(參見,例如,Shigekawa和Dower,1988,Biotechniques6:742-751)或接合(參見,例如,Koehler和Thorne,1987,J.Bacteriol.169:577ト5278)??赏ㄟ^如下方法實現(xiàn)將DNA引入到大腸桿菌細胞例如原生質體轉化(參見,例如,Hanahan,1983,J.Mol.Biol.166:557-580)或電穿孔(參見,例如,Dower等,1988,NucleicAcidsRes.16:6127-6145)??赏ㄟ^如下方法實現(xiàn)將DNA引入到鏈霉菌屬細胞例如原生質體轉化和電穿孔(參見,例如,Gong等,2004,FoliaMicrobiol.(Praha)49:399-405),接合(參見,例如,Mazodier等,1989,J.Bacteriol.171=3583-3585),或轉導(參見,例如,Burke等,2001,Proc.Natl.Acad.Sci.USA98:6289-6294)??赏ㄟ^如下方法實現(xiàn)將DNA引入到假單胞菌屬細胞例如電穿孔(參見,例如,Choi等,2006,J.Microbiol.Methods64:391-397)或接合(參見,例如,Pinedo和Smets,2005,Appl.Environ.Microbiol.7151-57)??赏ㄟ^如下方法實現(xiàn)將DNA引入到鏈球菌屬細胞例如天然感受態(tài)(naturalcompetence)(參見,例如,Perry和Kuramitsu,1981,Infect.Tmmun.32:1295-1297),原生質體轉化(參見,例如,Catt和Jollick,1991,Microbios.68:189-207),電穿孔(參見,例如,Buckley等,1999,Appl.Environ.Microbiol.65:3800-3804)或接合(參見,例如,Clewell,1981,Microbiol.Rev.45:409-436)。然而,可以使用本領域已知的將DNA引入宿主細胞的任何方法。宿主細胞還可以是真核生物,如哺乳動物、昆蟲、植物或真菌細胞。宿主細胞可為真菌細胞。“真菌”用在本文包括以下門子囊菌門(Ascomycota)、擔子菌門(Basidiomycota)、壺菌門(Chytridiomycota)和接合菌門(Zygomycota)(如由Hawksworth等,于AinsworthandBisbyjsDictionaryofTheFungi,第8版,I995,CABInternational,UniversityPress,Cambridge,UK中所定義)以及卵菌門(Oomycota)(如Hawksworth等,1995,見上,171頁中所引用),和所有有絲分裂孢子真菌(mitosporicfungi)(Hawksworth等,I"5,見上文)。真菌宿主細胞可為酵母細胞。“酵母”用在本文包括產子囊酵母(ascospOTogenousyeast)(內抱霉目(Endomycetales))、產擔子酵母(basidiosporogenousyeast)和屬于半知菌類(FungiImperfecti)(芽孢綱(Blastomycetes))的酵母。由于酵母的分類在未來可能改變,就本發(fā)明而言,將酵母定義為如BiologyandActivitiesofYeast(Skinner,F.A.,Passmore,S.M.,和Davenport,R.R.編,Soc.App.Bacteriol.SymposiumSeriesNo.9,1980)中所述。酵母宿主細胞可為假絲酵母屬、漢遜酵母屬(Hansenula)、克魯維酵母屬、畢赤酵母屬、酵母屬、裂埴酵母屬或西洋蓍霉屬細胞,如乳酸克魯維酵母(Kluyveromyceslactis)、卡爾酵母、釀酒酵母、糖化酵母、道格拉氏酵母、克魯弗酵母、諾地酵母、卵形酵母、或解脂西洋蓍霉(YarrowiaIipolytica)細胞。真菌宿主細胞可為絲狀真菌細胞?!敖z狀真菌”包括真菌門(Eumycota)和卵菌門的亞門(如由Hawksworth等,1995,見上文,所定義)的所有絲狀形式。絲狀真菌通常的特征在于由殼多糖(chitin)、纖維素、葡聚糖、殼聚糖(chitosan)、甘露聚糖和其它復雜多糖組成的菌絲體壁。通過菌絲延伸進行營養(yǎng)生長,而碳分解代謝是專性需氧的。相反,酵母例如釀酒酵母的營養(yǎng)生長通過單細胞菌體的出芽生殖(budding)進行,而碳分解代謝可以是發(fā)酵的。絲狀真菌宿主細胞可為枝頂孢霉屬、曲霉屬、短梗霉屬、煙管霉屬(Bjerkandera)、擬臘菌屬、金孢子菌屬、鬼傘屬(Coprinus)、革蓋菌屬(Coriolus)、隱球菌屬、FiIibasidium、錸孢屬、腐質霉屬、梨孢菌屬、毛霉屬、毀絲霉屬、新考瑪脂霉屬、脈孢菌屬、擬青霉屬、青霉屬、平革菌屬(Phanerochaete)、射脈菌屬(Phlebia)、瘤胃壺菌屬、側耳屬(Pleurotus)、裂裙菌屬、踝節(jié)菌屬、嗜熱子囊菌屬、梭孢殼屬、彎頸霉屬、栓菌屬(Trametes)或木霉屬細胞。例如,絲狀真菌宿主細胞可為泡盛曲霉、煙曲霉、臭曲霉、日本曲霉、構巢曲霉、黑曲霉、米曲霉、黑刺煙管菌(Bjerkanderaadusta)、干擬臘菌(Ceriporiopsisaneirina)、しeriporiopsiscaregiea、しeriporiopsisgilvescens、しeriporiopsispannocinta、Ceriporiopsisrivulosa、Ceriporiopsissubrufa、蟲擬錯菌(Ceriporiopsissubvermispora)、Chrysosporiuminops、嗜角質金抱子菌、Chrysosporiumlucknowense、Chrysosporiummeraarium、租金:r包于菌、Chrysosporiumqueenslandicum、熱帝金抱子菌、Chrysosporiumzonatum、灰蓋鬼傘(Coprinuscinereusノ、毛革蓋菌(Coriolushirsutus)、桿孢狀錸孢、禾谷錸孢、庫威錸孢、大刀錸孢、禾本科錸孢、禾赤錸孢、異孢錸孢、合歡木錸孢、尖錸孢、多枝錸孢、粉紅錸孢、接骨木錸孢、膚色錸孢、擬分枝孢錸孢、硫色錸抱、圓鐮孢、擬絲孢鐮孢、鑲片鐮孢、特異腐質霉、疏棉狀腐質霉、米黑毛霉、嗜熱毀絲霉、粗糙脈孢菌、產紫青霉、黃孢平革菌(Phanerochaetechrysosporium)、福射射脈菌(Phlebiaradiata)、剌序側耳(Pleurotuseryngii)、土生梭孢霉、長域毛栓菌(Trametesvillosa)、變色栓菌(Trametesversicolor)、哈茨木霉、康寧木霉、長枝木霉、里氏木霉或綠色木霉細胞??梢詫⒄婢毎ㄟ^涉及原生質體形成、原生質體轉化和細胞壁再生的方法以本身公知的方式轉化。用于轉化曲霉屬和木霉屬宿主細胞的合適方法在EP238023,Yelton等,1984,Proc.Natl.Acad.Sci.USA81:1470-1474,和Christensen等,1988,Bio/Technology6:1419-1422中描述。用于轉化錸孢屬菌種的合適方法由Malardier等,1989,Gene78:147-156和WO96/00787描述??梢允褂糜扇缦挛墨I描述的方法轉化酵母Becker和Guarente,于AbeIson,J.N.和Simon,M.I.編,GuidetoYeastGeneticsandMolecularBiology,MethodsinEnzymology,Volumel94,pp182—187,AcademicPress,Inc.,NewYork;Ito等,1983,J.Bacteriol.153:163;和Hinnen等,1978,Proc.Natl.Acad.Sci.USA751920o產生方法本發(fā)明還涉及用于產生本發(fā)明多肽的方法,其包括(a)在有助于產生所述多肽的條件下培養(yǎng)細胞,所述細胞以其野生型形式產生所述多肽;和(b)回收所述多肽。在ー個優(yōu)選的方面,所述細胞是曲霉屬的細胞。在ー個更優(yōu)選的方面,所述細胞是棘孢曲霉。在一個最優(yōu)選的方面,所述細胞是棘孢曲霉IAM2445。本發(fā)明還涉及用于產生本發(fā)明的多肽的方法,其包括(a)在有助于產生所述多肽的條件下培養(yǎng)本發(fā)明的重組宿主細胞;和(b)回收所述多肽。使用本領域熟知的方法在適合于產生所述多肽的營養(yǎng)培養(yǎng)基中培養(yǎng)細胞。例如,可以通過在合適培養(yǎng)基中和允許表達和/或分離所述多肽的條件下進行的搖瓶培養(yǎng),和實驗室或エ業(yè)發(fā)酵罐中的小規(guī)?;虼笠?guī)模發(fā)酵(包括連續(xù)、分批、補料分批或固態(tài)發(fā)酵)來培養(yǎng)細胞。使用本領域已知的方法在合適的營養(yǎng)培養(yǎng)基中進行培養(yǎng),所述營養(yǎng)培養(yǎng)基包含碳源和氮源和無機鹽。合適的培養(yǎng)基能夠從商業(yè)供應商獲得或可以根據(jù)公開的組成制備(例如,在美國典型培養(yǎng)物保藏中心的目錄中)。如果多肽分泌到營養(yǎng)培養(yǎng)基中,該多肽能夠從所述培養(yǎng)基中直接回收。如果多肽不分泌,則其能夠從細胞裂解物(lysate)回收??梢允褂帽绢I域已知的對于所述多肽是特異性的方法來檢測多肽。這些檢測方法可包括特異性抗體的使用、酶產物的形成或酶底物的消失。例如,酶試驗(enzymeassay)可用于測定多肽的活性。多肽可以使用本領域已知的方法回收。例如,多肽可以通過常規(guī)方法從營養(yǎng)培養(yǎng)基中回收,所述常規(guī)方法包括但不限于離心、過濾、提取、噴霧干燥、蒸發(fā)或沉淀。多肽可以通過多種本領域已知的方法純化以獲得基本上純的多肽,所述方法包括但不限于層析(例如,離子交換、親和、疏水、層析聚焦和大小排阻)、電泳方法(例如,制備型(preparative)等電聚焦)、差示溶解度(例如,硫酸銨沉淀)、SDS_PAGE或提取(參見,例如,ProteinPurification,J._C.Janson和LarsRyden編,VCHPublishers,NewYork,1989)。在可選的方面,不回收多肽,而將表達所述多肽的本發(fā)明宿主細胞作為多肽的來源。植物本發(fā)明還涉及分離的植物,例如,轉基因植物、植物部分或植物細胞,其包含本發(fā)明的分離的多核苷酸,從而以可回收的量表達和產生所述多肽。多肽可從植物或植物部分回收。或者,同樣可以將含有所述多肽的植物或植物部分用于改進食品或飼料的質量,例如,改進營養(yǎng)價值、適ロ性(palatability)和流變性質(rheologicalproperties),或用于破壞抗營養(yǎng)因子。轉基因植物可以是雙子葉的(雙子葉植物)或單子葉的(單子葉植物)。單子葉植物的實例是草(grasses),如草地早熟禾(meadowgrass)(藍草(bluegrass),早熟禾屬(Poa));飼用牧草(foragegrass)如羊茅屬(Festuca)、黑麥草屬(Lolium);寒地型牧草(temperategrass),如Agrostis(翦股穎屬);和谷類,例如,小麥、燕麥、黑麥、大麥、稻(rice)、高粱和玉蜀黍(maize)(玉米)。雙子葉植物的實例是煙草(tobacco),豆類(legumes),如羽扇豆(lupins),馬鈴薯,糖甜菜(sugarbeet),豌豆,豆(bean)和大豆(soybean)和十字花科的(cruciferous)植物(十字花科(familyBrassicaceae)),如花椰菜(cauliflower),油菜桿(rapeseed)和緊密相關的模型生物體擬南芥(Arabidopsisthaliana)。植物部分的實例是莖(stem)、愈傷組織(callus)、葉(leaf)、根(root)、果實(fruit)、種子(seed)和塊莖(tuber),以及包含這些部分的獨立組織,例如,表皮(epidermis)、葉肉(mesophyll)、薄壁組織(parenchyme)、維管組織(vasculartissue)、分生組織(meristem)。具體的植物細胞區(qū)室(compartments),如葉綠體(chloroplast)、質外體(apoplast)、線粒體(mitochondria)、液泡(vacuole)、過氧化物酶體(peroxisome)和細胞質(cytoplasm)也被認為是植物部分。此外,任何植物細胞,無論什么組織來源,都被認為是植物部分。同樣地,植物部分,如分離以促進本發(fā)明的應用的具體組織和細胞也被認為是植物部分,例如胚(embryo)、胚乳(endosperm)、糊粉(aleurone)和種皮(seedcoat)。同樣包含于本發(fā)明范圍內的還有這些植物、植物部分和植物細胞的后代。表達多肽的轉基因植物或植物細胞可以依照本領域已知方法構建。簡而言之,通過如下方法構建所述植物或植物細胞將編碼多肽的ー個或多個(幾個)表達構建體并入植物宿主基因組或葉綠體基因組,并且將所得的修飾植物或植物細胞繁殖為轉基因植物或植物細胞。表達構建體便利地是包含編碼多肽的多核苷酸的核酸構建體,所述多核苷酸與在選擇的植物或植物部分中表達該多核苷酸所需的適當?shù)恼{節(jié)序列可操作地連接。此外,表達構建體可以包含對于鑒定宿主細胞有用的選擇性標記,在所述宿主細胞中整合了表達構建體和將該構建體引入到所述植物中所必需的DNA序列(后者依賴于使用的DNA引入方法)。調節(jié)序列的選擇,例如啟動子和終止子序列和任選地信號或轉運序列的選擇,舉例來說,基于期望何時、何處以及如何表達多肽而確定。例如,編碼多肽的基因的表達可以是組成型的或誘導型的,或可以是發(fā)育、階段或組織特異性的,并且基因產物可以靶向特定的組織或植物部分例如種子或葉。調節(jié)序列由例如Tague等,1988,PlantPhysiology86:506所述。對于組成性表達,可以使用35S_CaMV、玉米泛素I和稻肌動蛋白I啟動子(Franck等,1980,Cell21:285_294,Christensen等,1992,PlantMo.Biol.18:675-689;Zhang等,1991,PlantCell3:1155-1165)。器官特異性啟動子可以是例如來自貯藏庫組織(storagesinktissue)例如種子、馬鈴薯塊莖和果實的啟動子(Edwards和Coruzzi,1990,Ann.Rev.Genet.24:275-303),或來自代謝庫組織(metabolicsinktissue)例如分生組織的啟動子(Ito等,1994,PlantMol.Biol.24:863-878),種子特異性啟動子諸如來自稻的谷蛋白(glutelin)、醇溶蛋白(prolamin)、球蛋白(globulin)或白蛋白(albumin)啟動子(Wu等,1998,PlantCellPhysiol.39:885-889),來自豆球蛋白(Iegumin)B4和香豆(Viciafaba)的未知的種子蛋白基因的蠶豆啟動子(Conrad等,1998,J.ofPlantPhysiol.152708-711)、來自種子油體蛋白(oilbodyprotein)的啟動子(Chen等,1998,PlantCellPhysiol.39:935-941),來自歐洲油菜(Brassicanapus)的忙藏蛋白napA啟動子,或本
技術領域:
公知的任何其他種子特異性的啟動子,例如,在WO91/14772中所描述的。此外,啟動子可為葉特異性的啟動子,如來自稻或番爺?shù)膔bcs啟動子(Kyozuka等,1993,PlantPhysiology102:991-1000),小球藻病春(chlorellavirus)腺嘿呤甲基轉移酶(adeninemethyltransferase)基因啟動子(Mitra和Higgins,1994,PlantMol.Biol.26:85-93),來自稻的aldP基因啟動子(Kagaya等,1995,Mol.Gen.genet.248:668-674),或傷ロ誘導的啟動子,如馬鈴薯pin2啟動子(Xu等,1993,PlantMol.Biol.22:573-588)。同樣地,所述啟動子可通過非生物的處理誘導,所述非生物的處理諸如溫度、干旱或鹽度變化,或通過外源施加的激活所述啟動子的物質誘導,例如こ醇、雌激素(oestrogens)、植物激素(planthormones)如こ稀、脫落酸(abscisicacid)和赤霉酸(gibberellicacid),和重金屬。啟動子增強子元件也可以用于實現(xiàn)多肽在植物中的較高表達。例如,啟動子增強子元件可以是內含子,其置于啟動子和編碼多肽的多核苷酸之間。例如Xu等,1993,見上,公開了使用稻肌動蛋白I基因的第一內含子以增強表達。選擇性標記基因和表達構建體的任何其它部分可以選自本領域內可用的那些。將核酸構建體根據(jù)本領域已知的常規(guī)技術并入植物基因組,所述常規(guī)技術包括土壤桿菌屬(Agrobacterium)介導的轉化、病毒介導的轉化、顯微注射(microinjection)、粒子轟擊、生物射彈轉化和電穿孔(Gasser等,1990,Science244:1293;Potrykus,1990,Bio/Technology8:535;Shimamoto等,1989,Nature338:274)。目前,根癌土壤桿菌(Agrobacteriumtumefaciens)介導的基因轉移(genetransfer),是產生轉基因雙子葉植物的優(yōu)選方法(為了參考,見Hooykas和Schilperoort,1992,PlantMol.Biol.19:15-38),而且它也可以用于轉化單子葉植物,雖然對于這些植物其他的轉化方法是常用的。目前,產生轉基因單子葉植物的優(yōu)選的方法,是用粒子(用轉化DNA涂覆的微觀的金或鶴粒子)轟擊胚愈傷組織(embryoniccalli)或發(fā)育中的胚(developingembryos)(Christou,1992,PlantJ.2:275-281;Shimamoto,1994,CurrentOpin.Biotech.5:158-162;Vasil等,1992,Bio/Technology10:667-674)。轉化單子葉植物的可供選擇的方法是基于原生質體轉化,如由Omirulleh等,1993,PlantMol.Biol.21:415-428所描述的。其他用于依照本公開使用的轉化方法包括那些描述于美國專利6,395,966和7,151,204的那些(兩者均通過全文提述并入本文)。轉化之后,根據(jù)本領域熟知的方法選擇具有并入的表達構建體的轉化體并且再生成為完整植物。通常設計轉化方法用于通過如下方法在再生期間或在后續(xù)世代中選擇性消除選擇基因例如,使用帶有兩個獨立的T-DNA構建體的共轉化或通過特異性重組酶位點特異性地切除選擇基因。除了用根據(jù)本發(fā)明制備的構建體直接轉化具體植物基因型之外,還可通過將具有所述構建體的植物與缺乏該構建體的第二植物雜交來制備轉基因植物。舉例而言,可將編碼多肽的構建體通過雜交而引入特定植物品種,而根本無需直接轉化該給定品種的植物。因此,本發(fā)明不僅涵蓋從依照本發(fā)明經轉化的細胞直接再生的植物,還包括此類植物的后代(progeny)。如用于本文,后代可指依照本發(fā)明制備的親本植物任何世代的后裔(offspring)。此種后代可包含依據(jù)本發(fā)明制備的DNA構建體,或依據(jù)本發(fā)明制備的DNA構建體的一部分。雜交導致轉基因通過將起始種系與供體植物種系交叉授粉而引入植物種系。此類步驟的非限制性實例進一歩闡述于美國專利7,151,204號。植物可通過回交轉化方法生成。舉例而言,植物包括稱作回交轉化的基因型、種系、近交體(inbred)或雜交體(hybrid)的植物??墒褂眠z傳標記以協(xié)助本發(fā)明的ー種或多種轉基因從ー個遺傳背景基因滲入(introgression)至另ー個。標記協(xié)助的選擇提供了相對于常規(guī)育種的優(yōu)勢,在于其可用于避免由表型變異導致的錯誤。進ー步,遺傳標記可在特定雜交的個體后代中提供有關良種種質相對程度的數(shù)據(jù)。舉例而言,當具有所需性狀但除此之外(otherwise)具有非農藝學所需的遺傳背景的植物與良種親本雜交時,可使用遺傳標記來選擇不僅具有該目標性狀,還具有相對較大比例所需種質的后代。以此方式,使ー種或多種性狀基因滲入特定遺傳背景所需的世代數(shù)得到最小化。本發(fā)明還涉及產生本發(fā)明多肽的方法,包括(a)在有助于產生所述多肽的條件下培養(yǎng)包含編碼所述多肽的多核苷酸的轉基因植物或植物細胞;和(b)回收所述多肽。去除或減少纖維ニ糖水解酶活性本發(fā)明還涉及用于產生親本細胞突變體的方法,其包括破壞或缺失編碼本發(fā)明的多肽的多核苷酸或其部分,所述方法導致在相同條件下培養(yǎng)時,與親本細胞相比突變的細胞產生較少的所述多肽??梢允褂帽绢I域熟知的方法(例如,插入、破壞、替代或缺失)通過減少或消除多核苷酸的表達來構建突變體細胞。在一個優(yōu)選的方面,所述多核苷酸是失活的。待修飾或失活的多核苷酸可以是,例如,編碼區(qū)或其對活性關鍵的部分,或表達編碼區(qū)所需的調節(jié)元件。這種調節(jié)或調控序列的實例可以是啟動子序列或其功能部分,即,足以影響多核苷酸表達的部分。用于可能的修飾的其它調控序列包括但不限于前導序列、聚腺苷酸化序列、前肽序列、信號肽序列、轉錄終止子和轉錄激活子。可以通過向親本細胞施以誘變,并且選擇其中已將多核苷酸的表達減少或消除的突變體細胞來進行多核苷酸的修飾或失活。誘變可能是特異性的或隨機的,可以通過例如使用合適的物理或化學誘變劑進行,通過使用合適的寡核苷酸進行,或通過將所述DNA序列進行PCR產生的誘變。此外,可以通過使用這些誘變劑的任何組合來進行誘變。適合于本發(fā)明目的的物理或化學誘變劑的實例包括紫外線(UV)照射、羥胺、N-甲基-N'-硝基-N-亞硝基胍(MNNG)、0-甲基羥胺、亞硝酸、こ基甲烷磺酸酯(ethylmethanesulphonate)(EMS)、亞硫酸氫鈉、甲酸和核苷酸類似物。當使用這些試劑時,通常通過如下方法來進行所述誘變在合適條件下存在優(yōu)選的誘變劑時溫育待誘變的親本細胞,并篩選和/或選擇顯示基因表達減少的或無基因表達的突變體細胞。通過導入、取代或去除基因中的ー個或多個(幾個)核苷酸或其轉錄或翻譯所需的調節(jié)元件可以實現(xiàn)所述多核苷酸的修飾或失活。例如,可以插入或去除核苷酸從而導致引入終止密碼子,去除起始密碼子,或改變開放閱讀框。按照本領域已知的方法通過定位誘變或PCR產生的誘變可以實現(xiàn)這種修飾或失活。盡管在理論上所述修飾可以在體內進行,即,直接在表達待修飾的多核苷酸的細胞上進行,但優(yōu)選如下面所示例的那樣在體外進行所述修飾。消除或減少多核苷酸表達的便利方式的例子是基于基因取代,基因缺失,或基因破壞的技術。例如,在基因破壞方法中,將相應于內源多核苷酸的核酸序列在體外進行誘變以產生缺陷性的核酸序列,然后將其轉化入親本細胞中以產生缺陷基因。通過同源重組,所述缺陷性核酸序列替代了內源性多核苷酸??赡芾硐氲氖撬鋈毕菪远嗪塑账徇€編碼標記,其可用于選擇其中多核苷酸被修飾或破壞的轉化體。在特別優(yōu)選的方面,用選擇性標記(如本文所述的那些)來破壞所述多核苷酸。本發(fā)明還涉及在細胞中抑制具有纖維ニ糖水解酶活性的多肽的表達的方法,包括對細胞施用或在細胞中表達雙鏈RNA(dsRNA)分子,其中所述dsRNA包含本發(fā)明的多核苷酸的亞序列。在一個優(yōu)選的方面,所述dsRNA長度為約15、16、17、18、19、20、21、22、23、24、25或更多個雙鏈體核苷酸。所述dsRNA優(yōu)選為小干擾RNA(siRNA)或微RNA(miRNA)。在一個優(yōu)選的方面,所述dsRNA是供抑制轉錄的小干擾RNA(siRNA)。在另ー個優(yōu)選的方面,所述dsRNA是供抑制翻譯的微RNA(miRNA)。本發(fā)明還涉及這樣的雙鏈RNA(dsRNA)分子,其包含SEQIDNO:I的成熟多肽編碼序列的一部分,以供在細胞中抑制所述多肽的表達。盡管本發(fā)明并不限于任何具體的作用機制,但dsRNA可進入細胞并導致類似或相同序列的單鏈RNA(ssRNA)包括內源mRNA的降解。當細胞暴露于dsRNA時,來自同源基因的mRNA通過稱作RNA干擾(RNAi)的過程受選擇性降解。本發(fā)明的dsRNA可用于基因沉默。在ー個方面,本發(fā)明提供了使用本發(fā)明的dsRNAi選擇性降解RNA的方法。該過程可在體外、離體或體內實施。在ー個方面,所述dsRNA分子可用于在細胞、器官或動物中生成功能缺失(loss-of-function)的突變。用于制備和使用dsRNA分子以選擇性降解RNA的方法在本領域是公知的;參見,例如美國專利6,489,127,6,506,559,6,511,824和6,515,109號。本發(fā)明進一歩涉及親本細胞的突變體細胞,其包含編碼多肽的多核苷酸或其調控序列的破壞或缺失,或沉默的編碼該多肽的基因,這導致與親本細胞相比突變體細胞產生更少的多肽或不產生多肽。多肽缺陷型突變體細胞作為表達天然和異源多肽的宿主細胞特別有用。所以,本發(fā)明進ー步涉及生產天然或異源多肽的方法,其包括(a)在有助于產生所述多肽的條件下培養(yǎng)突變體細胞;和(b)回收所述多肽。術語“異源多肽”意指對宿主細胞不是天然的多肽,例如天然蛋白質的變體。宿主細胞可包含多于ー個拷貝的編碼天然或異源多肽的多核苷酸。用于培養(yǎng)和純化感興趣的產物的方法可以通過本領域已知的方法進行。本發(fā)明用于產生基本上無纖維ニ糖水解酶的產物的方法在真核多肽,特別是真菌蛋白質例如酶的產生中是特別令人有興趣的。纖維ニ糖水解酶-缺陷細胞也可以用于表達在制藥上感興趣的異源蛋白質例如激素、生長因子、受體等。術語“真核多肽”不僅包括天然多肽,也包括多肽例如酶,其通過氨基酸取代、缺失或添加或其它這樣的修飾而被修飾以增強活性、熱穩(wěn)定性、PH耐受性等。在另外的方面,本發(fā)明涉及通過本發(fā)明方法產生的基本上無纖維ニ糖水解酶活性的蛋白質產物。組合物本發(fā)明還涉及包含本發(fā)明的多肽的組合物。所述組合物可以包含本發(fā)明的多肽作為主要酶成分,例如,單成分組合物。或者,所述組合物可以包含多種酶活性,如ー種或多種(幾種)選自下組的酶纖維素酶、具有纖維素分解增強活性的GH61多肽、半纖維素酶、棒曲霉素、酯酶、漆酶、木質素分解酶、果膠酶、過氧化物酶、蛋白酶和膨脹素??梢砸勒毡绢I域內已知的方法制備多肽組合物,并且可以是液體或干組合物的形式。例如,所述多肽組合物可以是顆粒(granulate)或微粒(microgranulate)的形式??梢砸勒毡绢I域內已知方法使納入所述組合物中的多肽穩(wěn)定化。下面給出本發(fā)明的多肽組合物的優(yōu)選用途。本發(fā)明的多肽組合物的劑量和其他使用所述組合物的條件可基于本領域已知方法來確定。用途本發(fā)明還涉及下述使用多肽或其組合物的方法。本發(fā)明還涉及降解或轉化纖維素材料的方法,包括在本發(fā)明的多肽的存在下用酶組合物處理纖維素材料。在ー個方面,上述方法還包括回收經降解或轉化的纖維素材料。纖維素材料的降解或轉化的可溶性產物可從不溶性纖維素材料使用本領域中公知的技術如例如離心、過濾和重力沉降來分離。本發(fā)明還涉及產生發(fā)酵產物的方法,其包括(a)在存在本發(fā)明的多肽的條件下,用酶組合物糖化纖維素材料;(b)用ー種或多種(幾種)發(fā)酵微生物發(fā)酵經糖化的纖維素材料以產生發(fā)酵產物;和(C)從發(fā)酵回收發(fā)酵產物。本發(fā)明還涉及發(fā)酵纖維素材料的方法,其包括用ー種或多種(幾種)發(fā)酵微生物發(fā)酵纖維素材料,其中在存在多肽的條件下,用酶組合物糖化纖維素材料。在ー個方面,纖維素材料的發(fā)酵產生發(fā)酵產物。在另ー個方面,所述方法進ー步包括從發(fā)酵回收發(fā)酵產物。根據(jù)本發(fā)明的纖維素材料的處理可以使用本領域的常規(guī)過程完成。此外,本發(fā)明的方法能使用經配置以依照發(fā)明操作的任何常規(guī)生物質處理設備進行。水解(糖化)和發(fā)酵,分別或同時,包括但不限于,分開的水解和發(fā)酵(SHF)、同步糖化和發(fā)酵(SSF)、同步糖化和共發(fā)酵(SSCF)、混合的水解和發(fā)酵(HHF)、分開的水解和共發(fā)酵(SHCF)、混合的水解和共發(fā)酵(HHCF),和直接微生物轉化(DMC)。SHF使用分開的處理步驟以首先將纖維素材料酶水解為可發(fā)酵糖,例如,葡萄糖,纖維ニ糖、纖維三糖和戊糖,然后將可發(fā)酵糖發(fā)酵成為こ醇。在SSF中,纖維素材料的酶水解和糖變?yōu)椁炒嫉陌l(fā)酵組合在一個步驟中(Philippidis,G.P.,1996,Cellulosebioconversiontechnology,亍HandbookonBioethanol!ProductionandUtilization,Wyman,C.E編,Taylor&Francis,Washington,DC,179-212)。SSCF包括多種糖的共發(fā)酵(Sheehan,J.,和Himmel,Μ.,1999,Enzymes,energyandtheenvironmentAstrategicperspectiveontheU.S.DepartmentofEnergy’sresearchanddevelopmentactivitiesforbioethanol,Biotechnol.Prog.15:817-827)。HHF在同步糖化和水解步驟之外,還涉及單獨的水解步驟,所述步驟可以在同一個反應器中進行。HHF過程中的步驟可以在不同的溫度進行,S卩,高溫酶糖化,然后在發(fā)酵菌株能夠耐受的較低溫度進行SSF。DMC在ー個或多個(幾個)步驟中組合了所有三個過程(酶產生、水解和發(fā)酵),其中使用相同的生物體產生用于將纖維素材料轉化成可發(fā)酵糖并將可發(fā)酵糖轉化成終產物的酶(Lynd,L.R.,Weimer,P.J.,vanZyl,W.H.,和Pretorius,I.S.,2002,Microbialcelluloseutilization!Fundamentalsandbiotechnology,Microbiol.Mol.Biol.Reviews66:506-577)。在本文可以理解的是,本領域中任何已知的方法,包括預處理、酶水解(糖化)、發(fā)酵,或它們的組合,可用于實施本發(fā)明的方法。常規(guī)設備包括補料分批攪拌反應器、分批攪拌反應器、具有超濾的連續(xù)流攪拌反應器和/或連續(xù)活塞流柱式反應器(FernandadeCastilhosCorazza,FlavioFariadeMoraes,GisellaMariaZanin和IvoNeitzel,2003,Optimalcontrolinfed-batchreactorforthecellobiosehydrolysis,ActaScientiarum.Technology25:33-38;Gusakov,A.V.,和Sinitsyn,A.P.,1985,KineticsoftheenzymatichydrolysisofcelluloseI.Amathematicalmodelforabatchreactorprocess,Enz.Microb.Technol.7:346-352)、研磨反應器(Ryu,S.K.,和Lee,J.M.,1983,Bioconversionofwastecellulosebyusinganattritionbioreactor,Biotechnol.Bioeng.25:53-65),或者具有由電磁場引起的強烈攪拌的反應器(Gusakov,A.V.,Sinitsyn,A.P.,Davydkin,I.Y.,Davydkin,V.Y.,Protas,0.V.,1996,Enhancementofenzymaticcellulosehydrolysisusinganoveltypeofbioreactorwithintensivestirringinducedbyelectromagneticfield,Appl.Biochem.Biotechnol.56:14ト153)。其它反應器類型包括流化床、升流層(upflowblanket)、固定化和擠出機型反應器以供水解和/或發(fā)酵。預處理。在本發(fā)明的方法的實施中,可以使用本領域已知的任何預處理過程破壞植物細胞壁的纖維素材料組分(Chandra等,2007,SubstratepretreatmentThekeytoefiectiveenzymaticnydroiysisof丄ignocellulosicsΑαν.Biochem.Engm./Biotechnol.108:67-93;Galbe和Zacchi,2007,Pretreatmentoflignocellulosicmaterialsforefiicientbioethanolproduction,Adv.Biochem.Engin./Biotechnol.108:41-65;Hendriks和Zeeman,2009,Pretreatmentstoenhancethedigestibilityoflignocellulosicbiomass,BioresourceTechnol.100:10-18;Mosier等,2005,F(xiàn)eaturesofpromisingtechnologiesforpretreatmentoflignocellulosicbiomass,BioresourceTechnol.96:673-686;Taherzadeh和Karimi,2008,PretreatmentoflignocellulosicwastestoimproveethanolandbiogasproductionAreview,Int.J.ofMol.Sci.9:1621-1651;Yang和Wyman,2008,Pretreatment:thekeytounlockinglow-costcellulosicethanol,BiofuelsBioproductsandBiorefining-Biofpr.2:26-40)。纖維素材料也可以在預處理之前使用本領域中已知的方法進行粒度減小、預浸泡、潤濕、洗滌和/或調節(jié)。常規(guī)的預處理包括但不限干,蒸汽預處理(伴隨或不伴隨爆炸)、稀酸預處理、熱水預處理、堿性預處理、石灰預處理、濕氧化、濕爆炸、氨纖維爆炸、有機溶劑預處理和生物預處理。其它預處理包括氨滲濾、超聲、電穿孔、微波、超臨界CO2、超臨界H20、臭氧和Y輻射預處理??梢栽谒夂?或發(fā)酵之前預處理纖維素材料。預處理優(yōu)選在水解前進行?;蛘?,預處理可以與酶水解同時進行以釋放可發(fā)酵糖,如葡萄糖、木糖和/或纖維ニ糖。在大多數(shù)情況下,預處理步驟本身使一些纖維素材料轉化成可發(fā)酵糖(甚至在不存在酶的情況下)。蒸汽預處理在蒸汽預處理中,加熱纖維素材料以破壞植物細胞壁成分,包括木質素、半纖維素和纖維素,使酶可接觸纖維素和其它部分,例如,半纖維素。使纖維素材料通過或穿過反應容器,其中注入蒸汽以增加溫度至需要的溫度和壓力,并且在其中保持期望的反應時間。蒸汽預處理優(yōu)選在140-230°C,更優(yōu)選160-200°C,并且最優(yōu)選170_190°C進行,其中最優(yōu)的溫度范圍依賴于任何化學催化劑的添加。蒸汽預處理的停留時間優(yōu)選1-15分鐘,更優(yōu)選3-12分鐘,并且最優(yōu)選4-10分鐘,其中最優(yōu)的停留時間依賴于溫度范圍和任何化學催化劑的添加。蒸汽預處理允許相對較高的固體加載量,使纖維素材料在預處理過程中通常僅僅變得潮濕。蒸汽預處理經常與預處理后的物質的爆炸放料(explosivedischarge)組合,這稱為蒸汽瀑炸,即,快速閃變至大氣壓和物質的瑞流,以通過破碎增加可接觸的表面積(Duff和Murray,1996,BioresourceTechnology8551-33;Galbe和Zacchi,2002,Appl.Microbiol.Biotechnol.59:618-628;美國專利申請No.20020164730)。在蒸汽預處理過程中,切割半纖維素こ?;鶊F,并且得到的酸自催化半纖維素部分水解成單糖和寡糖。去除木質素僅至有限的程度。經常在蒸汽預處理之前加入催化劑如H2SO4或SO2(通常0.3至3%w/w),其可減少時間,降低溫度,增加回收率,并改進酶水解(Ballesteros等,2006,Appl.Biochem.Biotechnol.129-132:496-508;Varga等,2004,Appl.Biochem.Biotechnol.113-116509-523;Sassner等·,2006,EnzymeMicrob.Technol.39:756-762)?;瘜W預處理術語“化學處理”指促進纖維素、半纖維素和/或木質素分離和/或釋放的任何化學預處理。合適的化學預處理過程的實例包括例如稀酸預處理、石灰預處理、濕氧化、氨纖維/冷凍爆炸(AFEX)、氨滲濾(APR)和有機溶劑預處理。在稀酸預處理中,將纖維素材料與稀酸(通常是H2SO4)和水混合以形成漿料,由蒸汽加熱至期望的溫度,并在一段停留時間后閃變至大氣壓??梢杂煤芏喾磻髟O計進行稀酸預處理,例如,活塞流式反應器、逆流反應器或連續(xù)逆流收縮床反應器(Duff和Murray,1996,supra;Schell等,2004,BioresourceTechnol.91179-188;Lee等,1999,Adv.Biochem.Eng.Biotechnol.65:93-115)。還可以使用堿性條件下的幾種預處理方法。這些堿預處理包括,但不限于,石灰預處理、濕氧化、氨滲濾(APR)和氨纖維/冷凍爆炸(AFEX)。用碳酸鈣、氫氧化鈉或氨,在85_150°C的低溫進行石灰預處理,停留時間從I小時到幾天(Wyman等,2005,BioresourceTechnol.961959-1966;Mosier等,2005,BioresourceTechnol.96:673-686)。WO2006/11089UW02006/110899,WO2006/110900和WO2006/110901公開了使用氨的預處理方法。濕法氧化是熱預處理,通常在180-200°C進行5_15分鐘,加入氧化劑如過氧化氫或過壓氧(Schmidt和Thomsen,1998,BioresourceTechnol.64139-151;Palonen等,2004,Appl.Biochem.Biotechnol.117:1-17;Varga等,2004,Biotechnol.Bioeng.88567-574;Martin等,2006,J.Chem.Technol.Biotechnol.81:1669-1677)。預處理以優(yōu)選1-40%干物質,更優(yōu)選2-30%干物質,并且最優(yōu)性5-20%干物質進行,并且由于加入堿如碳酸鈉,初始PH經常會増加。濕法氧化預處理方法的修改方法,稱為濕爆炸(濕氧化和蒸汽爆炸的組合),能夠處理高達30%的干物質。在濕爆炸中,在預處理過程中,在一定的停留時間后引入氧化劑。然后通過閃變至大氣壓而結束預處理(W02006/032282)。氨纖維爆炸(AFEX)涉及在溫和溫度如90_100で和高壓如17_20bar,用液體或氣體氨將纖維素材料處理5-10分鐘,其中干物質含量可以高達60%(Gollapalli等,2002,Appl.Biochem.Biotechnol.98:23-35;Chundawat等,2007,Biotechnol.Bioeng.96219-231;Alizadeh等,2005,Appl.Biochem.Biotechnol.1211133-1141;Teymouri等,2005,BioresourceTechnol.96:2014-2018)。AFEX預處理導致纖維素解聚,和半纖維素的部分水解。木質素-糖復合物得到切割。有機溶劑預處理通過用含水こ醇(40-60%こ醇)在160_200°C提取30-60分鐘而將纖維素材料去木質素化(Pan等,2005,Biotechnol.Bioeng.90:473-481;Pan等,2006,Biotechnol.Bioeng.94:851-861;Kurabi等,2005,Appl.Biochem.Biotechnol.121219-230)。經常加入硫酸作為催化劑。在有機溶劑預處理中,去除大部分半纖維素。合適的預處理方法的其他實例如Schell等,2003,Appl.BiochemandBiotechn.Vol.105-108:69-85,和Mosier等,2005,BioresourceTechnology96:673-686,和美國已公開的申請2002/0164730所述。在ー個方面,化學預處理優(yōu)選作為酸處理,并且更優(yōu)選作為連續(xù)稀酸和/或弱酸(mildacid)處理進行。酸通常是硫酸,但也可以使用其它酸,如こ酸、檸檬酸、硝酸、磷酸、酒石酸、琥珀酸、氯化氫或其混合物。弱酸處理在優(yōu)選1-5,更優(yōu)選1-4,并且最優(yōu)選1-3的pH范圍內進行。在ー個方面,酸濃度在優(yōu)選0.01至20wt%酸,更優(yōu)選0.05至10wt%酸,甚至更優(yōu)選0.I至5wt%酸,并且最優(yōu)選0.2至2.Owt%酸的范圍內。酸與纖維素材料接觸,并在優(yōu)選160-220°C,和更優(yōu)選165-195°C范圍內的溫度保持數(shù)秒到數(shù)分鐘,例如I秒-60分鐘的時間。在另ー個方面,預處理作為氨纖維爆炸步驟(AFEX預處理步驟)進行。在另ー個方面,預處理發(fā)生在含水漿料中。在優(yōu)選的方面,在預處理過程中纖維素材料以優(yōu)選10-80wt%,更優(yōu)選20-70wt%,并且最優(yōu)性30-60wt%,如約50wt%的量存在。預處理的纖維素材料可以不洗滌或者使用本領域任何已知的方法洗滌,例如,用水洗滌。機械預處理術語“機械預處理”指各種類型的磨制(grinding)或粉碎(milling)(例如,干磨、濕磨或振動球磨)。物理預處理術語“物理預處理”指促進纖維素、半纖維素和/或木質素從纖維素材料分離和/或釋放的任何預處理。例如,物理預處理可涉及輻射(例如,微波輻射)、汽蒸/蒸汽瀑炸、水熱解(hydrothermolysis)和它們的組合。物理預處理可以涉及高壓和/或高溫(蒸汽爆炸)。在ー個方面,高壓指范圍在優(yōu)選約300至約600psi,更優(yōu)選約350至約550psi,并且最優(yōu)選約400至約500psi,如約450psi的壓力。在另ー個方面,高溫指范圍在約100至約300°C,優(yōu)選約140至約235°C的溫度。在一個優(yōu)選的方面,機械預處理在使用如上所定義的高溫和高壓的分批過程、蒸汽槍水解器系統(tǒng),例如來自SundsDefibratorAB,Sweden的SundsHydrolyzer中進行。組合的物理和化學預處理可以對纖維素材料進行物理和化學預處理。例如,預處理步驟可以涉及稀酸或弱酸處理和高的溫度和/或壓カ處理。根據(jù)需要,可以順序或同時進行物理和化學預處理。還可以包括機械預處理。因此,在一個優(yōu)選的方面,對纖維素材料進行機械、化學或物理預處理,或者它們的任意組合,以促進纖維素、半纖維素和/或木質素的分離和/或釋放。生物預處理術語“生物預處理”指促進纖維素、半纖維素和/或木質素從纖維素材料分離和/或釋放的任何生物預處理。生物預處理技術可以包括應用溶解木質素的微生物(參見,例如,Hsu,T.-A.,1996,Pretreatmentofbiomass,于HandbookonBioetganolProductionandUtilization,Wyman,C.E編,Taylor&Francis,Washington,DC,179-212;Ghosh和Singh,1993,Physicochemicalandbiologicaltreatmentsforenzymatic/microbialconversionoflignocellulosicbiomass,Adv.Appl.Microbiol.39:295-333;McMillan,J.D.,1994,Pretreatinglignocellulosicbiomassareview,于EnzymaticConversionofBiomassforFuelsProduction,Himmel,M.E.,Baker,J.0.,和Overend,R.P.,編,ACSSymposiumSeries566,AmericanChemicalSociety,Washington,DC,第15章;Gong,C.S.,Cao,N.J.,Du,J.,和Tsao,G.T.,1999,Ethanolproductionfromrenewableresources,于AdvancesinBiochemicalEngineering/Biotechnology,Scheper,T.,編,Springer-VerlagBerlinHeidelberg,Germany,65:207-241;01sson和Hahn-Hagerdal,1996,Fermentationoflignocellulosichydrolysatesforethanolproduction,Enz.Microb.Tech.18:312-331;和Vallander和Eriksson,1990,ProductionofethanolfromlignocellulosicmaterialsStateoftheart,Adv.Biochem.Eng./Biotechnol.42:63-95)。趣化。在水解(也稱作糖化)步驟中,將纖維素材料(例如經預處理的)水解以將纖維素或亦將半纖維素分解成可發(fā)酵糖,如葡萄糖、纖維ニ糖、木糖、木酮糖、阿拉伯糖、甘露糖、半乳糖和/或可溶的寡糖。水解由酶組合物以酶法在具有纖維ニ糖水解酶活性的多肽的存在下進行。組合物的酶和蛋白組分可以順序加入。酶水解優(yōu)選在易于由本領域技術人員確定的條件下,在合適的含水環(huán)境中進行。在一個優(yōu)選的方面,水解在適于酶的活性,即對于酶最優(yōu)的條件下進行。水解可以以補料分批或連續(xù)的過程進行,其中將經預處理的纖維素材料(底物)逐漸補入,例如,含酶的水解溶液中。糖化通常在攪拌釜反應器或發(fā)酵罐中,在受控的pH、溫度和混合條件下進行。合適的處理時間、溫度和PH條件可以由本領域技術人員容易地確定。例如,糖化可以持續(xù)長達200小時,但是通常優(yōu)選進行約12至約96小時,更優(yōu)選約16至約72小時,并且最優(yōu)選約24至約48小吋。溫度的范圍優(yōu)選約25°C至約70°C,更優(yōu)選約30°C至約65°C,并且更優(yōu)選約40°C至約60°C,特別是約50°C。pH的范圍優(yōu)選約3至約8,更優(yōu)選約3.5至約7,并且最優(yōu)選約4至約6,特別是約pH5。干燥固體含量優(yōu)選約5至約50wt%,更優(yōu)選約10至約40wt%,并且最優(yōu)選約20至約30wt%。具有纖維ニ糖水解酶活性的酶和多肽的最適量取決于幾個因素,其包括但不限于,組分纖維素分解酶的混合物、纖維素底物、纖維素底物的濃度、纖維素底物的預處理、溫度、時間、pH和包括發(fā)酵生物體(例如,同步糖化和發(fā)酵的酵母)。在ー個方面,纖維素分解或半纖維素分解酶蛋白對于纖維素材料的有效量是約O.5至約50mg,優(yōu)選約O.5至約40mg,更優(yōu)選約O.5至約25mg,更優(yōu)選約O.75至約20mg,更優(yōu)選約O.75至約15mg,甚至更優(yōu)選約O.5至約IOmg,并且最優(yōu)選約2.5至約IOmg姆g纖維素材料。在另ー個方面,具有纖維ニ糖水解酶活性的多肽對于纖維素材料的有效量是約O.01至約50.Omg,優(yōu)選約O.01至約40mg,更優(yōu)選約O.01至約30mg,更優(yōu)選約O.01至約20mg,更優(yōu)選約O.01至約IOmg,更優(yōu)選約O.01至約5mg,更優(yōu)選約O.025至約I.5mg,更優(yōu)選約O.05至約I.25mg,更優(yōu)選約O.075至約I.25mg,更優(yōu)選約O.I至約I.25mg,甚至更優(yōu)選約O.15至約I.25mg,并且最優(yōu)選約O.25至約I.Omg姆g纖維素材料。在另ー個方面,具有纖維ニ糖水解酶活性的多肽對于纖維素分解酶蛋白的有效量是約O.005至約I.Og,優(yōu)選約O.01至約I.Og,更優(yōu)選約O.15至約O.75g,更優(yōu)選約O.15至約O.5g,更優(yōu)選約O.I至約O.5g,甚至更優(yōu)選約O.I至約O.5g,并且最優(yōu)選約O.05至約O.2g每g纖維素分解酶蛋白。酶組合物可包含任何可用于降解或轉化纖維素材料的蛋白。在ー個方面,酶組合物包含或進ー步包含ー種或多種(幾種)選自下組的酶纖維素酶、具有纖維素分解增強活性的GH61多肽,半纖維素酶,棒曲霉素(expansin),酯酶,漆酶,木質素分解酶(ligninolyticenzyme),果膠酶,過氧化物酶,蛋白酶和膨脹素。在另ー個方面,所述纖維素酶優(yōu)選為ー種或多種(幾種)選自下組的酶內切葡聚糖酶,纖維ニ糖水解酶和葡糖苷酶。在另ー個方面,所述半纖維素酶優(yōu)選為ー種或多種(幾種)選自下組的酶こ酰甘露聚糖酯酶、こ酰木聚糖酯酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、香豆酸酯酶、阿魏酸酯酶、半乳糖苷酶、葡糖醛酸糖苷酶、葡糖醛酸酯酶、甘露聚糖酶、甘露糖苷酶、木聚糖酶和木糖苷酶。在另ー個方面,酶組合物包含ー種或多種(幾種)纖維素分解酶。在另ー個方面,酶組合物包含或進ー步包含ー種或多種(幾種)半纖維素分解酶。在另ー個方面,酶組合物包含ー種或多種(幾種)纖維素分解酶和ー種或多種(幾種)半纖維素分解酶。在另ー個方面,酶組合物包含ー種或多種(幾種)選自下組的酶纖維素分解酶和半纖維素分解酶。在另ー個方面,酶組合物包含內切葡聚糖酶。在另ー個方面,酶組合物包含纖維ニ糖水解酶。在另ー個方面,酶組合物包含葡糖苷酶。在另ー個方面,酶組合物包含具有纖維素分解增強活性的多肽。在另ー個方面,酶組合物包含內切葡聚糖酶和具有纖維素分解增強活性的多肽。在另ー個方面,酶組合物包含纖維ニ糖水解酶和具有纖維素分解增強活性的多肽。在另ー個方面,酶組合物包含β-葡糖苷酶和具有纖維素分解增強活性的多肽。在另ー個方面,酶組合物包含內切葡聚糖酶和纖維ニ糖水解酶。在另ー個方面,酶組合物包含內切葡聚糖酶和葡糖苷酶。在另ー個方面,酶組合物包含纖維ニ糖水解酶和葡糖苷酶。在另ー個方面,酶組合物包含內切葡聚糖酶,纖維ニ糖水解酶,和具有纖維素分解增強活性的多肽。在另ー個方面,酶組合物包含內切葡聚糖酶,β_葡糖苷酶,和具有纖維素分解增強活性的多肽。在另ー個方面,酶組合物包含纖維ニ糖水解酶,β_葡糖苷酶,和具有纖維素分解增強活性的多肽。在另ー個方面,酶組合物包含內切葡聚糖酶,纖維ニ糖水解酶,和β-葡糖苷酶,和具有纖維素分解增強活性的多肽。在另ー個方面,酶組合物包含こ酰甘露聚糖酯酶。在另ー個方面,酶組合物包含こ酰木聚糖酯酶。在另ー個方面酶組合物包含阿拉伯聚糖酶(例如a-L-阿拉伯聚糖酶)。在另ー個方面,酶組合物包含阿拉伯呋喃糖苷酶(例如a-L-阿拉伯呋喃糖苷酶)。在另ー個方面,酶組合物包含香豆酸酯酶。在另ー個方面,酶組合物包含阿魏酸酯酶。在另ー個方面,酶組合物包含半乳糖苷酶(例如,α-半乳糖苷酶和/或β-半乳糖苷酶)。在另ー個方面,酶組合物包含葡糖醛酸糖苷酶(例如,a-D-葡糖醛酸糖苷酶)。在另ー個方面,酶組合物包含葡糖醛酸酯酶。在另ー個方面,酶組合物包含甘露聚糖酶。在另ー個方面,酶組合物包含甘露糖苷酶(例如β-甘露糖苷酶)。在另ー個方面,酶組合物包含木聚糖酶。在一個優(yōu)選的方面,所述木聚糖酶為家族10木聚糖酶。在另ー個方面,酶組合物包含木糖苷酶。在另ー個方面,酶組合物包含棒曲霉素。在另ー個方面,酶組合物包含酯酶。在另ー個方面,酶組合物包含漆酶。在另ー個方面,酶組合物包含木質素分解酶。在一個優(yōu)選的方面,所述木質素分解酶是錳過氧化物酶。在另ー個優(yōu)選的方面,所述木質素分解酶是木質素過氧化物酶。在另ー個優(yōu)選的方面,所述木質素分解酶是H2O2產生酶。在另ー個方面,酶組合物包含果膠酶。在另ー個方面,酶組合物包含過氧化物酶。在另ー個方面,酶組合物包含蛋白酶。在另ー個方面,酶組合物包含膨脹素。在本發(fā)明的方法中,酶可在發(fā)酵之前或過程中添加,例如,在糖化過程中或在發(fā)酵微生物繁殖過程中或之后添加。所述酶組合物的ー種或多種(幾種)組分可為野生型蛋白、重組蛋白或野生型蛋白和重組蛋白的組合。舉例而言,ー種或多種(幾種)組分可為細胞的天然蛋白,其用作宿主細胞以重組表達酶組合物的ー種或多種(幾種)其他組分。酶組合物的ー種或多種(幾種)組分可作為單組分產生,然后將其組合以形成酶組合物。所述酶組合物可為多組分和單組分蛋白制備物的組合。用于本發(fā)明方法中的酶可為任何適用的形式,如例如去除或未去除細胞的粗發(fā)酵液,含或不含細胞碎片的細胞裂解物,半純化或純化的酶制備物,或宿主細胞,作為酶的來源。所述酶組合物可為干粉或顆粒,無粉塵的顆粒,液體,穩(wěn)定化液體或穩(wěn)定化受保護的酶。液體酶制備物可根據(jù)確立的エ藝,例如通過添加穩(wěn)定劑如糖、糖醇或其他多元醇,和/或乳酸或其他有機酸來穩(wěn)定化。酶可源自或獲得自任何合適的來源,包括細菌、真菌、酵母、植物或哺乳動物來源。術語“獲得”在本文中意指該酶可從天然產生該酶作為天然酶的生物分離。術語“獲得”在本文中還意指該酶可在宿主生物中使用本文中所述的方法重組產生,其中經重組產生的酶對于宿主生物是天然的或異源的,或具有修飾的氨基酸序列,例如,具有ー個或多個(幾個)缺失、插入和/或取代的氨基酸,即重組產生的酶,其為天然氨基酸序列的片段和/或突變體或通過本領域已知的氨基酸改組方法產生的酶。天然酶的含義中涵蓋的是天然變體,而外來酶的含義中涵蓋的是重組(如通過定位誘變或改組)獲得的變體。具有酶活性的多肽可以是細菌多肽。例如,所述多肽可以是具有酶活性的革蘭氏陽性細菌多肽如芽孢桿菌屬、鏈球菌屬、鏈霉菌屬、葡萄球菌屬、腸球菌屬、乳桿菌屬、乳球菌屬、梭菌屬、地芽孢桿菌屬或海洋芽孢桿菌屬多肽;或具有酶活性的革蘭氏陰性細菌多肽,如大腸桿菌、假單胞菌屬、沙門氏菌屬、彎曲桿菌屬、螺桿菌屬、黃桿菌屬、梭桿菌屬、泥桿菌屬、奈瑟氏菌屬或脲原體屬多肽。在一個優(yōu)選的方面,所述多肽是具有酶活性的嗜堿芽孢桿菌、解淀粉芽孢桿菌、短芽孢桿菌、環(huán)狀芽孢桿菌、克勞氏芽孢桿菌、凝結芽孢桿菌、堅強芽孢桿菌、燦爛芽孢桿菌、遲緩芽孢桿菌、地衣芽孢桿菌、巨大芽孢桿菌、短小芽孢桿菌、嗜熱脂肪芽孢桿菌、枯草芽孢桿菌或蘇云金芽孢桿菌多肽。在另ー個優(yōu)選的方面,所述多肽是具有酶活性的似馬鏈球菌、釀膿鏈球菌、乳房鏈球菌或馬鏈球菌獸瘟亞種多肽。在另ー個優(yōu)選的方面,所述多肽是具有酶活性的不產色鏈霉菌、除蟲鏈霉菌、天藍鏈霉菌、灰色鏈霉菌或淺青紫鏈霉菌多肽。具有酶活性的多肽也可以是真菌多肽,并且更優(yōu)選具有酶活性的酵母多肽如假絲酵母屬、克魯維酵母屬、畢赤酵母屬、酵母屬、裂殖酵母屬或西洋蓍霉屬多肽;或更優(yōu)選具有酶活性的絲狀真菌多肽如枝頂孢霉屬、傘菌屬、鏈格孢屬、曲霉屬、短梗霉屬、Botryospaeria、擬臘菌屬、Chaetomidium、金抱子菌屬、Claviceps、Cochliobolus、鬼傘屬、Coptotermes、棒囊殼屬、隱叢赤殼菌屬、隱球菌屬、色ニ孢屬、黑耳屬、Filibasidium、錸孢屬、赤霉屬、全鞭毛蟲屬、腐質霉屬、IE齒菌屬、蘑燕屬、Leptospaeria、梨孢菌屬、Melanocarpus、多孔菌屬、毛霉屬、毀絲霉屬、新考瑪脂霉屬、脈孢菌屬、擬青霉屬、青霉屬、平革菌屬、瘤胃壺菌屬、Poitrasia、假黑盤菌屬、Pseudotrichonympha、根毛霉屬、裂裙菌屬、柱頂孢屬、踝節(jié)菌屬、嗜熱子囊菌屬、梭孢殼屬、彎頸霉屬、木霉屬、長毛盤菌屬、輪枝孢屬、包腳菇屬或炭角菌屬多肽。在一個優(yōu)選的方面,所述多肽是具有酶活性的卡爾酵母、釀酒酵母、糖化酵母、道格拉氏酵母、克魯弗酵母、諾地酵母或卵形酵母多肽。在另ー個優(yōu)選的方面,所述多肽是具有酶活性的解纖維枝頂孢霉、棘孢曲霉、泡盛曲霉、煙曲霉、臭曲霉、日本曲霉、構巢曲霉、黑曲霉、米曲霉、嗜角質金孢子菌、Chrysosporiumlucknowense、熱金包于菌、しhrysosporiummerdarium、しnrysosporiuminops、租金抱子鹵、Chrysosporiumqueenslandicum、Chrysosporiumzonatum、桿抱狀錸孢、禾谷錸孢、庫威錸孢、大刀錸孢、禾本科錸孢、禾赤錸孢、異孢錸孢、合歡木錸孢、尖錸孢、多枝錸孢、粉紅錸孢、接骨木錸孢、膚色錸孢、擬分枝孢錸孢、硫色錸孢、圓錸孢、擬絲孢錸孢、鑲片錸孢、灰腐質霉、特異腐質霉、疏棉狀腐質霉、白耙齒菌、米黑毛霉、嗜熱毀絲霉、粗糙脈孢菌、繩狀青霉、產紫青霉、黃孢平革菌、Thielaviaachromatica、Thielaviaalbomyces、Thielaviaalbopilosa、澳洲梭抱殼、Thielaviafimeti、小抱梭抱殼、卵抱梭抱殼、Thielaviaperuviana、瘤抱梭抱殼、毛梭抱殼、Thielaviasubthermophila、土生梭孢霉、哈茨木霉、康寧木霉、長枝木霉、里氏木霉、綠色木霉或Trichophaeasaccata多肽。還可以使用具有酶活性的多肽經化學修飾或蛋白質工程改造的突變體。所述酶組合物的ー種或多種(幾種)組分可以是重組組分,亦即,通過克隆編碼所述單獨組分的DNA序列并隨后用該DNA序列轉化細胞并在宿主中表達(參見,例如,W091/17243和W091/17244)產生。所述宿主優(yōu)選是異源宿主(酶對宿主是異源的),但該宿主在一定條件下也可以是同源宿主(酶對宿主是天然的)。單組分纖維素分解酶還可以通過從發(fā)酵液中提純這樣的蛋白質來制備。在ー個方面,所述ー種或多種(幾種)纖維素分解酶包括商業(yè)性纖維素分解酶制備物。適用于本發(fā)明的商業(yè)的纖維素分解蛋白制備物的實例包括,例如,CELLICCtec(NovozymesA/S)、CELLICCTec2(NovozymesA/S)、CELLUCLAST(NovozymesA/S)、NOVOZYM188(NovozymesA/S)、CELLUZYME(NovozymesA/S)、CEREFLO(NovozymesA/S)和ULTRAFLO(NovozymesA/S),ACCELERASE(GenencorInt.)、LAMINEX(GenencorInt.)、SPEZYMECP(GenencorInt.),ROHAMENT7069W(:R0hmGmbH),F(xiàn)IBREZYMELDI(DyadicInternational,Inc.)>FIBREZYMELBR(DyadicInternational,Inc.)或VISCOSTAR150L(DyadicInternational,Inc·)。所述纖維素酶以固體的約0.001到約5.0wt%,更優(yōu)選固體的約O.025到約4.Owt%,且最優(yōu)選固體的約O.005到約2.Owt%的有效量添加。可以用于本發(fā)明的方法的細菌內切葡聚糖酶的實例包括但不僅限于,解纖維熱酸菌(Acidothermuscellulolyticus)內切葡聚糖酶(W091/05039;W093/15186;美國專利5,275,944;W096/02551;美國專利5,536,655,W000/70031,WO05/093050);Thermobifidafusca內切葡聚糖酶III(W005/093050);和thermobifidafusca內切葡聚糖酶V(W005/093050)。可以用于本發(fā)明的真菌內切葡聚糖酶的實例包括但不僅限于,里氏木霉內切葡聚糖酶I(Penttila等,1986,Gene45=253-263;里氏木霉Cel7B內切葡聚糖酶I,GENBANK登錄號M15665,SEQIDNO4);里氏木霉內切葡聚糖酶II(Saloheimo等,1988,Gene63:11-22;里氏木霉Cel5A,GENBANK登錄號M19373,SEQIDNO6);里氏木霉內切葡聚糖酶III(Okada等,1988,Appl.Environ.Microciol.64:555-563;GENBANK登錄號AB003694;SEQIDNO:8);以及里氏木霉內切葡聚糖酶V(Saloheimo等,1994,MolecularMicrobiologyl3:219-228;GENBANK登錄號Z33381;SEQIDNO:10);棘孢曲霉內切葡聚糖酶(Ooi等,1990,NucleicAcidsResearch18:5884);川地曲霉(Aspergilluskawachii)內切葡聚糖酶(Sakamoto等,1995,CurrentGenetics27:435-439);胡蘿卜軟腐歐文氏菌(Erwiniacarotovara)內切葡聚糖酶(Saarilahti等,1990,Gene90:9_14);尖錸孢內切葡聚糖酶(GENBANK登錄號L29381);灰腐質霉thermoidea變種內切葡聚糖酶(GENBANK登錄號AB003107);Melanocarpusalbomyces內切葡聚糖酶(GENBANK登錄號MAL515703);粗糙脈孢菌內切葡聚糖酶(GENBANK登錄號XM_324477);特異腐質霉內切葡聚糖酶V(SEQIDNO12);嗜熱毀絲霉CBS117.65內切葡聚糖酶(SEQIDNO14);擔子菌綱(basidiomycete)CBS495.95內切葡聚糖酶(SEQIDNO16);擔子菌綱CBS494.95內切葡聚糖酶(SEQIDNO18);土生梭孢霉NRRL8126CEL6B內切葡聚糖酶(SEQIDNO20);土生梭孢霉NRRL8126CEL6C內切葡聚糖酶(SEQIDNO22);土生梭孢霉NRRL8126CEL7C內切葡聚糖酶(SEQIDNO24);土生梭孢霉NRRL8126CEL7E內切葡聚糖酶(SEQIDNO26);土生梭孢霉NRRL8126CEL7F內切葡聚糖酶(SEQIDNO28);CladorrhinumfoecundissimumATCC62373CEL7A內切葡聚糖酶(SEQIDNO:30);以及里氏木霉菌株VTT-D-80133內切葡聚糖酶(SEQIDNO:32;GENBANK登錄號M15665)。上述SEQIDNO:4、SEQIDN0:6、SEQIDN0:8、SEQIDNO:10、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO:22、SEQIDNO:24、SEQIDNO:24、SEQIDNO26,SEQIDNO:28、SEQIDNO:30和SEQIDNO:32的內切葡聚糖酶分別由SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:11、SEQIDNO:13、SEQIDNO15、SEQIDNO:17、SEQIDNO:19、SEQIDNO:21、SEQIDNO:23、SEQIDNO:23、SEQIDNO25,SEQIDNO27,SEQIDNO29,SEQIDNO:31的成熟多肽編碼序列編碼。可用于本發(fā)明的纖維ニ糖水解酶的示例包括但不僅限于,里氏木霉纖維ニ糖水解酶I(SEQIDNO34);里氏木霉纖維ニ糖水解酶II(SEQIDNO36);特異腐質霉纖維ニ糖水解酶I(SEQIDNO:38)、嗜熱毀絲霉纖維ニ糖水解酶II(SEQIDNO:40和SEQIDNO:42)、土生梭孢霉纖維ニ糖水解酶II(CEL6A)(SEQIDN0:44)、嗜熱毛殼菌(Chaetomium七1^1110111111111)纖維ニ糖水解酶1姊0IDNO46)以及嗜熱毛殼菌纖維ニ糖水解酶II(SEQIDNO:48)、煙曲霉纖維ニ糖水解酶I(SEQIDNO50)和煙曲霉纖維ニ糖水解酶II(SEQIDNO52)。上述SEQIDNO:34、SEQIDNO:36、SEQIDNO:38、SEQIDNO:40、SEQIDNO42、SEQIDNO44,SEQIDNO46,SEQIDNO48,SEQIDNO50和SEQIDNO52的纖維ニ糖水解酶分別由SEQIDNO:33、SEQIDNO:35、SEQIDNO:37、SEQIDNO:39、SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:47、SEQIDNO49和SEQIDNO51的成熟多肽編碼序列編碼??捎糜诒景l(fā)明的葡糖苷酶的實例包括但不僅限于米曲霉葡糖苷酶(SEQIDNO54);煙曲霉β-葡糖苷酶(SEQIDNO56);巴西青霉(PenicilliumbrasiIianum)IBT20888β-葡糖苷酶(SEQIDNO:58);黑曲霉β-葡糖苷酶(SEQIDNO:60);以及棘孢曲霉葡糖苷酶(SEQIDΝ0:62)。上述SEQIDNO54,SEQIDNO56,SEQIDNO:58、SEQIDNO:60、SEQIDNO62的β-葡糖苷酶分別由SEQIDNO:53、SEQIDNO:55、SEQIDNO:57、SEQIDNO59和SEQIDNO61的成熟多肽編碼序列編碼??捎糜诒景l(fā)明的其他β-葡糖苷酶的實例包括SEQIDNO:64的米曲霉β-葡糖苷酶變體融合蛋白或SEQIDΝ0:66的米曲霉β-葡糖苷酶融合蛋白。SEQIDNO:64和SEQIDNO66的β-葡糖苷酶融合蛋白分別由SEQIDNO63和SEQIDNO65編碼。米曲霉β-葡糖苷酶可根據(jù)WO2002/095014獲取。具有β-葡糖苷酶活性的煙曲霉多肽可根據(jù)WO2005/047499獲取。巴西青霉β-葡糖苷酶可根據(jù)W02007/019442獲取。黑曲霉β-葡糖苷酶可根據(jù)Dan等,2000,J.Biol.Chem.275:4973-4980獲取。棘孢曲霉β-葡糖苷酶可根據(jù)Kawaguchi等,1996,Gene173=287-288獲取。其它可用的內切葡聚糖酶、纖維ニ糖水解酶和葡糖苷酶使用根據(jù)HenrissatB·,1991,Aclassmcationofgiycosylhydrolasesbasedonammo-acidsequencesimilarities,Biochem.J.280:309-316和HenrissatB.和BairochA.,1996,Updatingthesequence-basedclassificationofglycosylhydrolases,Biochem.J.316:695-696的分類公開于許多糖基水解酶家族中。其它可用于本發(fā)明的纖維素分解酶描述于EP495,257、EP531,315、EP531,372、WO89/09259、WO94/07998、TO95/24471、TO96/11262、W096/29397、WO96/034108、WO97/14804、WO98/08940、WO98/012307、W098/13465、WO98/015619、WO98/015633、WO98/028411、WO99/06574、WO99/10481、WO99/025846、WO99/025847、WO99/031255、W02000/009707,WO2002/050245、WO2002/0076792、WO2002/101078、W02003/027306、WO2003/052054、WO2003/052055、WO2003/052056、W02003/052057、WO2003/052118、WO2004/016760、WO2004/043980、W02004/048592、WO2005/001065、WO2005/028636、WO2005/093050、W02005/093073、WO2006/074005、WO2006/117432、WO2007/071818、W02007/071820、WO2008/008070、WO2008/008793、美國專利No.4,435,307、美國專利No.5,457,046、美國專利No.5,648,263、美國專利No.5,686,593、美國專利No.5,691,178、美國專利No.5,763,254以及美國專利No.5,776,757。在本發(fā)明的方法中,可使用任何具有纖維素分解增強活性的GH61多肽。在ー個方面,所述具有纖維素分解增強活性的多肽包含下述基序[ILMV]-P-X(4,5)-G-X-Y-[ILMV]-X-R-X-[EQ]-X(4)-[HNQ]和[Fff]-[TF]-K-[AIV],其中X為任意氨基酸,X(4,5)為在4或5個連續(xù)位置的任意氨基酸,而X(4)是在4個連續(xù)位置的任意氨基酸。包含上述所示的基序的多肽可進一歩包含H-X(l,2)-G-P-X(3)-[Yff]-[AILMV],[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV],或H-X(l,2)-G-P-X(3)-[Yff]-[AILMV]和[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV],其中X為任意氨基酸,X(1,2)為在I個位置或2個連續(xù)位置的任意氨基酸,X(3)為3個連續(xù)位置的任意氨基酸,而X(2)為2個連續(xù)位置的任意氨基酸。在上述基序中,采用公認的IUPAC單字母氨基酸縮寫。在一個優(yōu)選的方面,所述具有纖維素分解增強活性的多肽進一歩包含H-X(l,2)-G-P-X(3)-[Yff]-[AILMV]。在另ー個優(yōu)選的方面,具有纖維素分解增強活性的分離的多肽進ー步包含[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV]。在另ー個優(yōu)選的方面,具有纖維素分解增強活性的多肽進ー步包含H-X(I,2)-G-P-X(3)-[Yff]-[AILMV]和[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV]。在第二個方面,所述具有纖維素分解增強活性的多肽包含下述基序[ILMV]-P-X(4,5)-G-x-Y-[ILMV]-x-R-x-[EQ]-χ(3)~Α~[HNQ],其中χ為任意氨基酸,χ(4,5)為在4或5個連續(xù)位置的任意氨基酸,而χ(3)為3個連續(xù)位置的任意氨基酸。在上述基序中,采用公認的IUPAC單字母氨基酸縮寫。在第三個方面,具有纖維素分解增強活性的多肽包含與SEQIDNO:68,SEQIDNO70,SEQIDNO:72,SEQIDNO:74,SEQIDNO:76,SEQIDNO:78,SEQIDNO:80,SEQIDNO82,SEQIDNO:84,SEQIDNO:86,SEQIDNO:88,SEQIDNO:90,SEQIDNO:92,SEQIDNO94,SEQIDNO96,SEQIDNO98,SEQIDNO100,SEQIDNO102,SEQIDNO:104,SEQIDNO:106,SEQIDNO:108,SEQIDNO:110,SEQIDNO:112,SEQIDNO:114,SEQIDNO:116,SEQIDNO:118,SEQIDNO:120,SEQIDNO:122,SEQIDNO:124,SEQIDNO:126,SEQIDNO:128,或SEQIDNO:130的成熟多肽具有至少60%,例如至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,或至少95%,至少96%,至少97%,至少98%,至少99%,或至少100%的同一性程度的氨基酸序列。在第四個方面,具有纖維素分解增強活性的多肽由多核苷酸編碼,所述多核苷酸與在至少非常低嚴格條件,優(yōu)選至少低嚴格條件,更優(yōu)選至少中等嚴格條件,更優(yōu)選至少中-高嚴格條件,甚至更優(yōu)選至少高嚴格條件,并且最優(yōu)選至少非常高嚴格條件下,與以下雜交(i)SEQIDNO67,SEQIDNO69,SEQIDNO71,SEQIDNO73,SEQIDNO75,SEQIDNO77,SEQIDNO:79,SEQIDNO:81,SEQIDNO:83,SEQIDNO:85,SEQIDNO:87,SEQIDNO89,SEQIDNO:91,SEQIDNO:93,SEQIDNO:95,SEQIDNO:97,SEQIDNO99,SEQIDNO101,SEQIDNO103,SEQIDNO105,SEQIDNO107,SEQIDNO109,SEQIDNO111,SEQIDNO113,SEQIDNO115,SEQIDNO117,SEQIDNO119,SEQIDNO:121,SEQIDNO:123,SEQIDNO:125,SEQIDNO:127,或SEQIDNO:129的成熟多肽編碼序列,(ii)包含于SEQIDNO:73,SEQIDNO:75,SEQIDNO:77,或SEQIDNO81的成熟多肽編碼序列中的cDNA序列,或包含SEQIDNO67,SEQIDNO69,SEQIDNO71,SEQIDNO79,SEQIDNO:83,SEQIDNO:85,SEQIDNO:87,SEQIDNO:89,SEQIDNO:91,SEQIDNO93,SEQIDNO95,SEQIDNO97,SEQIDNO99,SEQIDNO101,SEQIDNO103,SEQIDNO105,SEQIDNO107,SEQIDNO109,SEQIDNO:111,SEQIDNO113,SEQIDNO115,SEQIDNO117,SEQIDNO119,SEQIDNO121,SEQIDNO:123,SEQIDNO:125,SEQIDNO:127,或SEQIDNO:129的成熟多肽編碼序列的基因組DNA序列,(iii)⑴或(ii)的亞序列,或(iv)(i)、(ii)或(iii)的全長互補鏈(J.Sambrook,E.F.Fritsch和T.Maniatus,1989,見上)。SEQIDNO:67,SEQIDNO:69,SEQIDNO:71,SEQIDNO:73,SEQIDNO75,SEQIDNO:77,SEQIDNO:79,SEQIDNO:81,SEQIDNO:83,SEQIDNO85,SEQIDNO:87,SEQIDNO:89,SEQIDNO:91,SEQIDNO:93,SEQIDNO:95,SEQIDNO97,SEQIDNO:99,SEQIDNO:101,SEQIDNO:103,SEQIDNO:105,SEQIDNO:107,SEQIDNO:109,SEQIDNO:111,SEQIDNO:113,SEQIDNO:115,SEQIDNO:117,SEQIDNO119,SEQIDNO:121,SEQIDNO:123,SEQIDNO:125,SEQIDNO:127或SEQIDNO129的成熟多肽編碼序列的亞序列含有至少100個連續(xù)核苷酸序列,或優(yōu)選至少200個連續(xù)核苷酸序列。而且,所述亞序列可編碼具有纖維素分解增強活性的多肽片段。在第五個方面,具有纖維素分解增強活性的多肽由多核苷酸編碼,所述多核苷酸包含核苷酸序列,或由核苷酸序列組成,所述核苷酸序列與SEQIDNO67,SEQIDNO:69,SEQIDNO71,SEQIDNO:73,SEQIDNO:75,SEQIDNO:77,SEQIDNO:79,SEQIDNO81,SEQIDNO:83,SEQIDNO:85,SEQIDNO:87,SEQIDNO:89,SEQIDNO:91,SEQIDNO93,SEQIDNO95,SEQIDNO97,SEQIDNO99,SEQIDNO101,SEQIDNO103,SEQIDNO105,SEQIDNO:107,SEQIDNO:109,SEQIDNO:111,SEQIDNO:113,SEQIDNO:115,SEQIDNO:117,SEQIDNO:119,SEQIDNO:121,SEQIDNO:123,SEQIDNO:125,SEQIDN0:127,或SEQIDNO:129的成熟多肽編碼序列具有優(yōu)選至少60%,更優(yōu)選至少65%,更優(yōu)選至少70%,更優(yōu)選至少75%,更優(yōu)選至少80%,更優(yōu)選至少85%,甚至更優(yōu)選至少90%,最優(yōu)選至少91%,至少92%,至少93%,至少94%,或至少95%,并且甚至最優(yōu)選至少96%,至少97%,至少98%,至少99%,或至少100%的同一性程度。在第六個方面,具有纖維素分解增強活性的多肽是包含SEQIDNO:68,SEQIDNO70,SEQIDNO:72,SEQIDNO:74,SEQIDNO:76,SEQIDNO:78,SEQIDNO:80,SEQIDNO82,SEQIDNO:84,SEQIDNO:86,SEQIDNO:88,SEQIDNO:90,SEQIDNO:92,SEQIDNO94,SEQIDNO96,SEQIDNO98,SEQIDNO100,SEQIDNO102,SEQIDNO:104,SEQIDNO:106,SEQIDNO:108,SEQIDNO:110,SEQIDNO:112,SEQIDNO:114,SEQIDNO:116,SEQIDNO:118,SEQIDNO:120,SEQIDNO:122,SEQIDNO:124,SEQIDNO126,SEQIDNO:128,或SEQIDNO:130的成熟多肽;或其同源序列的ー個或多個(幾個)氨基酸的取代、缺失和/或插入的人工變體。優(yōu)選地,氨基酸改變對性質是較不重要的,即保守的氨基酸取代或插入,其不顯著影響蛋白質的折疊和/或活性;通常為I至大約30個氨基酸的小缺失;小的氨基或羧基末端延伸,例如氨基末端甲硫氨酸殘基;多至大約20-25個殘基的小接頭肽;或通過改變凈電荷或其它功能來促進純化的小延伸,如多組氨酸序列、抗原表位或結合域。保守取代的實例是在以下組之內堿性氨基酸組(精氨酸、賴氨酸和組氨酸)、酸性氨基酸組(谷氨酸和天冬氨酸)、極性氨基酸組(谷氨酰胺和天冬酰胺)、疏水氨基酸組(亮氨酸、異亮氨酸和纈氨酸)、芳族氨基酸組(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸組(甘氨酸、丙氨酸、絲氨酸、蘇氨酸和甲硫氨酸)。通常不改變比活性的氨基酸取代是本領域已知的,并且由例如H.Neurath和R.L.Hill,1979,于TheProteins,AcademicPress,NewYork中描述。最普遍發(fā)生的交換是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/IIe、Leu/Val、Ala/Glu和Asp/Gly?;蛘?,氨基酸改變具有這樣的性質以使多肽的物理化學性質改變。例如,氨基酸改變可改進多肽的熱穩(wěn)定性,改變底物特異性,改變最適PH等。能夠根據(jù)本領域已知的方法,例如定位誘變或丙氨酸分區(qū)誘變法(Cunningham和Wells,1989,Science244=1081-1085)來鑒定親本多肽中的必需氨基酸。在后ー技術中,將單ー丙氨酸突變引入到分子中的每個殘基,并且測試所得突變分子的纖維素分解增強活性以鑒定對于所述分子的活性關鍵的氨基酸殘基。同樣參見Hilton等,1996,J.Biol.Chem.271=4699-47080酶的活性部位或其它的生物相互作用也能夠通過結構的物理分析而測定,如通過以下這些技木如核磁共振、晶體學、電子衍射或光親和標記,連同推定的接觸位點氨基酸的突變來測定。參見例如deVos等,1992,Science255:306-312;Smith等,1992,J.Mol.Biol.224:899-904;fflodaver等,1992,F(xiàn)EBSLett.309:59_64。必需氨基酸的同一性也能夠從與多肽的同一性分析來推斷,所述多肽與親本多肽相關。能夠使用已知的誘變、重組和/或改組(shuffling)方法,然后是有關的篩選方法,例如由Reidhaar-Olson和Sauer,1988,Science241:53-57;Bowie和Sauer,1989,Proc.Natl.Acad.Sci.USA86:2152-2156;W095/17413;或WO95/22625公開的那些方法來進行并測試單個或多個氨基酸取代、缺失和/或插入。能夠使用的其它方法包括易錯PCR、噬菌體展示(例如,Lowman等,1991,Biochemistry30:10832-10837;美國專利號5,223,409;W092/06204)和區(qū)域定向的誘變(Derbyshire等,1986,Gene46:145;Ner等,1988,DNA7:127)。誘變/改組方法能夠與高通量、自動化的篩選方法組合以檢測由宿主細胞表達的克隆的、誘變的多肽的活性(Ness等,1999,NatureBiotechnology17:893-896)。能夠從宿主細胞回收編碼活性多肽的誘變的DNA分子,并且使用本領域內標準方法快速測序。這些方法允許快速測定多肽中單個氨基酸殘基的重要性。SEQIDNO68,SEQIDNO70,SEQIDNO72,SEQIDNO74,SEQIDNO76,SEQIDNO78,SEQIDNO:80,SEQIDNO:82,SEQIDNO:84,SEQIDNO:86,SEQIDNO:88,SEQIDNO90,SEQIDNO:92,SEQIDNO:94,SEQIDNO:96,SEQIDNO:98,SEQIDNO100,SEQIDNO:102,SEQIDNO:104,SEQIDNO:106,SEQIDNO:108,SEQIDNO:110,SEQIDNO:112,SEQIDNO:114,SEQIDNO:116,SEQIDNO:118,SEQIDNO:120,SEQIDNO122,SEQIDNO:124,SEQIDNO:126,SEQIDNO:128,或SEQIDNO:130的成熟多肽中的氨基酸取代、缺失和/或插入的總數(shù)不多于4,例如I、2、3或4。在ー個方面,所述ー個或多個(幾個)半纖維素分解酶包含商業(yè)性半纖維素分解酶制備物。適用于本發(fā)明的商業(yè)性半纖維素分解酶制備物的實例包括,例如SHEARZYME(NovozymesA/S)、CELLICHTec(NovozymesA/S)、CELLICHTec2(NovozymesA/S)>VTSCOZYMF(R)(NovozymesA/S)、ULTRAFLO(NovozymesA/S)、PULPZYMEHC(NovozymesA/S)、MULTIFECTXylanase(Genencor)、ECOPULPTX-200A(ABEnzymes)、HSP6000Xylanase(DSM),DEPOL333P(BiocatalystsLimit,Wales,UK)、DEPOL740L.(BiocatalystsLimit,Wales,UK)和DEPOL762P(BiocatalystsLimit,Wales,UK)??捎糜诒景l(fā)明方法的木聚糖酶的實例包括但不限于棘孢曲霉木聚糖酶(GeneSeqPAAR63790;W094/21785)、煙曲霉木聚糖酶(W02006/078256;xyl3SEQIDNO:131[DNA序列]和SEQIDNO:132[推定的氨基酸序列])和土生梭孢霉NRRL8126木聚糖酶(W02009/079210)??捎糜诒景l(fā)明方法的木糖苷酶的實例包括但不限于里氏木霉木糖苷酶(UniProtKB/TrEMBL登錄號Q92458;SEQIDNO:133[DNA序列]和SEQIDNO:134[推定的氨基酸序列]),埃默森踝節(jié)菌(Talaromycesemersonii)(SwissProt登錄號Q8X212)和粗糙脈孢菌(SwissProt登錄號Q7S0W4)。可用于本發(fā)明方法的こ酰木聚糖酯酶的實例包括但不限于紅褐肉座菌(Hypocreajecorina)こ酰木聚糖酯酶(W02005/001036)、粗糙脈孢菌こ酰木聚糖酯酶(UniProt登錄號q7s259)、土生梭孢霉NRRL8126こ酰木聚糖酯酶(W02009/042846)、球毛殼菌(Chaetomiumglobosum)こ酰木聚糖酯酶(Uniprot登錄號Q2GWX4)、細麗毛殼菌(Chaetomiumgracile)こ酰木聚糖酯酶(GeneSeqP登錄號AAB82124)、穎枯殼針孢(Phaeosphaerianodorum)こ酰木聚糖酯酶(Uniprot登錄號Q0UHJ1)和特異腐質霉(Humicolainsolens)DSM1800こ酰木聚糖酯酶(W02009/073709)??捎糜诒景l(fā)明方法的阿魏酸酯酶的實例包括但不限于特異腐質霉DSM1800阿魏酸酯酶(W02009/076122)、粗糙脈孢菌阿魏酸酯酶(UniProt登錄號Q9HGR3)和費希新薩托菌(Neosartoryafischer)阿魏酸酯酶(UniProt登錄號A1D9T4)??捎糜诒景l(fā)明方法的阿拉伯呋喃糖苷酶的實例包括但不限于特異腐質霉DSM1800阿拉伯呋喃糖苷酶(W02009/073383)和黑曲霉阿拉伯呋喃糖苷酶(GeneSeqP登錄號AAR94170)??捎糜诒景l(fā)明方法的α-葡糖醛酸糖苷酶的實例包括但不限于棒曲霉(Aspergillusclavatus)α-葡糖醒酸糖苷酶(UniProt登錄號alccl2)、里氏木霉α-葡糖醒酸糖苷酶(Uniprot登錄號Q99024)、埃默森踝節(jié)菌α-葡糖醒酸糖苷酶(UniProt登錄號Q8X211)、黑曲霉α-葡糖醒酸糖苷酶(Uniprot登錄號Q96WX9)、土曲霉(Aspergillusterreus)α-葡糖醒酸糖苷酶(SwissProt登錄號Q0CJP9)和煙曲霉α-葡糖醒酸糖苷酶(SwissProt登錄號Q4WW45)。用于本發(fā)明方法的酶和蛋白可通過使用本領域已知方法(參見,例如Bennett,J.W.和LaSure,L.(編),MoreGeneManipulationsinFungi,AcademicPress,CA,1991),在含有合適碳源和氮源和無機鹽的營養(yǎng)培養(yǎng)基上發(fā)酵上述指出的微生物菌株來產生。合適的培養(yǎng)基可從供應商獲得,或可根據(jù)已公開的組成制備(例如美國典型培養(yǎng)物保藏中心的目錄)。適于生長和酶產生的溫度范圍和其他條件在本領域是已知的(參見,例如Bailey,J.E.和Ollis,D.F.,BiochemicalEngineeringFundamentals,McGraw-Hil丄BookCompany,NY,1986)。所述發(fā)酵可以是任何導致酶表達或分離的培養(yǎng)細胞的方法。因此,發(fā)酵可以理解為包括在合適的培養(yǎng)基中并在允許所述酶得以表達或分離的條件下進行的搖瓶培養(yǎng),或在實驗室或エ業(yè)發(fā)酵罐中的小-或大規(guī)模發(fā)酵(包括連續(xù)、分批、補料分批或固態(tài)發(fā)酵)。通過上述方法產生的所得的酶可從發(fā)酵培養(yǎng)基回收并通過常規(guī)方法純化。發(fā)璧。可通過ー種或多種(幾種)能將糖直接或間接發(fā)酵成所需發(fā)酵產物的發(fā)酵微生物發(fā)酵自經水解的纖維素材料獲得的可發(fā)酵糖?!鞍l(fā)酵”或“發(fā)酵方法”指任何發(fā)酵方法或包含發(fā)酵步驟的任何方法。發(fā)酵方法還包括用于消費品醇エ業(yè)(例如,啤酒和葡萄酒)、乳品業(yè)(例如,發(fā)酵乳制品)、皮革業(yè)和煙草業(yè)的發(fā)酵方法。發(fā)酵條件依賴于期望的發(fā)酵產物和發(fā)酵生物體,并且能由本領域的技術人員容易地確定。在發(fā)酵步驟中,作為預處理和酶水解步驟的結果從纖維素材料釋放的糖,通過發(fā)酵生物體(如酵母)發(fā)酵成為產物,例如,こ醇。如上所述,水解(糖化)和發(fā)酵可以是分開的或同時的。在本發(fā)明的發(fā)酵步驟中可以使用任何合適的經水解的纖維素材料。通常根據(jù)所需的發(fā)酵產品(即,要從發(fā)酵獲得的物質)和使用的方法來選擇所述材料,如本領域中所公知的。術語“發(fā)酵培養(yǎng)基”在本文中可理解為指加入發(fā)酵微生物之前的培養(yǎng)基,如,由糖化過程產生的培養(yǎng)基,以及同步的糖化和發(fā)酵方法(SSF)中使用的培養(yǎng)基?!鞍l(fā)酵微生物”指適用于理想的發(fā)酵方法產生發(fā)酵產物的任何微生物,包括細菌和真菌生物體。發(fā)酵生物體可以是C6和/或C5發(fā)酵生物體,或它們的組合。C6和C5發(fā)酵生物體均在本領域公知。合適的發(fā)酵微生物能將糖(如葡萄糖、木糖、木酮糖、阿拉伯糖、麥芽糖、甘露糖、半乳糖或寡糖)直接或間接地發(fā)酵(即,轉化)成所需的發(fā)酵產品。產生こ醇的細菌和真菌發(fā)酵生物體的實例如Lin等,2006,Appl.Microbiol.Biotechnol.69:627-642所述。能發(fā)酵C6糖的發(fā)酵微生物的實例包括細菌和真菌生物體,如酵母。優(yōu)選的酵母包括酵母屬菌種,優(yōu)選釀酒酵母。能發(fā)酵C5糖的發(fā)酵生物體的實例包括細菌和真菌生物體,如ー些酵母。優(yōu)選的C5發(fā)酵酵母包括畢赤酵母屬,優(yōu)選樹干畢赤酵母(Pichiastipitis)的菌株,如樹干畢赤酵母CBS5773;假絲酵母屬,優(yōu)選博伊丁假絲酵母(Candidaboidinii)、蕓薹假絲酵母(Candidabrassicae)、休哈塔假絲酵母(Candidasheatae)、迪丹斯假絲酵母(Candidadiddensii)、假熱帶假絲酵母(Candidapseudotropicalis)或產朊假絲酵母(Candidautilis)的菌株。其它發(fā)酵生物體包括發(fā)酵單胞菌屬(Zymomonas),如運動發(fā)酵單胞菌(Zymomonasmobilis);漢遜酵母屬,如異常漢遜酵母(Hansenulaanomala);克魯維酵母屬,如脆壁克魯維酵母;裂殖酵母屬,如粟酒裂殖酵母(S.pombe);大腸桿菌,特別是已經經過遺傳修飾而改進こ醇產量的大腸桿菌菌株;梭菌屬(Clostridium),如丙酮丁醇梭菌(Clostridiumacetobutylicum),熱纖維梭菌(Chlostridiumthermocellum),和Chlostridiumphytofermentans;地芽抱桿菌屬菌種(Geobacillussp.);熱厭氧桿菌屬(Thermoanaerobacter),如角軍糖熱厭ノ氧桿鹵(ThermoanaerobactersaccharoIyticum);和芽孢桿菌屬(Bacillus),如凝結芽孢桿菌(Bacilluscoagulans)。在一個優(yōu)選的方面,酵母是酵母屬菌種。在ー個更優(yōu)選的方面,酵母是釀酒酵母。在另一個更優(yōu)選的方面,酵母是糖化酵母(Saccharomycesdistaticus)。在另一個更優(yōu)選的方面,酵母是葡萄汁酵母(Saccharomycesuvarum)。在另ー個優(yōu)選的方面,酵母是克魯維酵母屬。在另ー個更優(yōu)選的方面,酵母是馬克斯克魯維酵母(Kluyveromycesmarxianus)。在另ー個更優(yōu)選的方面,酵母是脆壁克魯維酵母。在另ー個優(yōu)選的方面,酵母是假絲酵母屬。在另ー個更優(yōu)選的方面,酵母是博伊丁假絲酵母。在另ー個更優(yōu)選的方面,酵母是蕓薹假絲酵母。在另ー個更優(yōu)選的方面,酵母是迪丹斯假絲酵母。在另ー個更優(yōu)選的方面,酵母是假熱帶假絲酵母。在另ー個更優(yōu)選的方面,酵母是產朊假絲酵母。在另ー個優(yōu)選的方面,酵母是棒孢酵母屬(Clavispora)。在另ー個更優(yōu)選的方面,酵母是葡萄牙棒孢酵母(ClavisporaIusitaniae)。在另ー個更優(yōu)選的方面,酵母是仙人掌棒孢酵母(Clavisporaopuntiae)。在另一個優(yōu)選的方面,酵母是管囊酵母屬(Pachysolen)。在另ー個更優(yōu)選的方面,酵母是嗜鞋管囊酵母(Pachysolentannophilus)。在另ー個優(yōu)選的方面,酵母是畢赤酵母屬。在另ー個更優(yōu)選的方面,酵母是樹干畢赤酵母。在另ー個優(yōu)選的方面,酵母是酒香酵母屬(Bretannomyces)。在另ー個更優(yōu)選的方面,酵母是克勞森酒香(Bretannomycesclausenii)(Philippidis,G.P.,1996,Cellulosebioconversiontechnology,τ*HandbookonBioethanolProductionandUtilization,Wyman,C.E.編,Taylor&Francis,Washington,DC,179-212)。能有效地將己糖和戊糖發(fā)酵成こ醇的細菌包括,例如,運動發(fā)酵單胞菌和丙酮丁醇梭菌,熱纖維梭菌,Chlostridiumphytofermentans,地芽孢桿菌屬菌種,解糖熱厭氧桿菌和凝結芽孢桿菌(Philippidis,1996,見上文)。在一個優(yōu)選的方面,細菌是發(fā)酵單胞菌屬。在更優(yōu)選的方面,細菌是運動發(fā)酵單胞菌。在另ー個優(yōu)選的方面,細菌是梭菌屬。在另ー個更優(yōu)選的方面,細菌是熱纖維梭菌。商業(yè)上可得到的適合こ醇產生的酵母包括,例如ETHANOLRED酵母(RedStar/Lesaffre,USA)、FALI(Fleischmann,sYeast,USA)、SUPERSTART和THERMOSACC新鮮酵母(EthanolTechnology,WI,USA),BIOFERMAFT和XR(NABC_NorthAmericanBioproductsCorporation,GA,USA)>GERTSTRAND(GertStrandAB,Sweden)和FERMI0L(DSMSpecialties)。在一個優(yōu)選的方面,發(fā)酵微生物已經經過遺傳修飾,提供發(fā)酵戊糖的能力,如利用木糖、利用阿拉伯糖和共同利用木糖和阿拉伯糖的微生物。通過將異源基因克隆入多種發(fā)酵微生物已經構建了能將己糖和戊糖轉化成こ醇(共發(fā)酵)的生物體(Chen和Ho,1993,CloningandimprovingtheexpressionofPichiastipitisxylosereductasegeneinSaccharomycescerevisiae,Appl.Biochem.Biotechnol.39-40135-147;Ho等,1998,GeneticallyengineeredSaccharomycesyeastcapableofeffectivelycofermentingglucoseandxylose,Appl.Environ.Microbiol.641852-1859;Kotter和Ciriacy,1993,XylosefermentationbySaccharomycescerevisiae,Appl.Microbiol.Biotechnol.38:776-783;ffalfridsson等,1995,Xylose-metabolizingSaccharomycescerevisiaestrainsoverexpressingtheTKLlandTALIgenesencodingthepentosephosphatepathwayenzymestransketolaseandtransaldolase,Appl.Environ.Microbiol.61:4184-4190;Kuyper等,2004,MinimalmetabolicengineeringofSaccharomycescerevisiaeforefficientanaerobicxylosefermentationaproofofprinciple,FEMSYeastResearch4655—664!Beall4,1991,ParametricstudiesofethanolproductionfromxyloseandothersugarsbyrecombinantEscherichiacoll,Biotech.Bioeng.38:296-303;Ingram等,1998,Metabolicengineeringofbacteriaforethanolproduction,Biotechnol.Bioeng.58:204-214;Zhang等,1995,MetabolicengineeringofapentosemetabolismpathwayinethanologenicZymomonasmobilis,Science267:240-243;Deanda等,1996,Developmentofanarabmose-fermentingZymomonasmobilisstrainbymetabolicpathwayengineering,Appl.Environ.Microbiol.62:4465-4470;W02003/062430,xyloseisomerase)。在一個優(yōu)選的方面,經過遺傳修飾的發(fā)酵微生物是釀酒酵母。在另ー個優(yōu)選的方面,經過遺傳修飾的發(fā)酵微生物是運動發(fā)酵單胞菌。在另ー個優(yōu)選的方面,經過遺傳修飾的發(fā)酵微生物是大腸桿菌。在另ー個優(yōu)選的方面,經過遺傳修飾的發(fā)酵微生物是產酸克雷伯氏菌(Klebsiellaoxytoca)。在另ー個優(yōu)選的方面,所述經遺傳修飾的發(fā)酵微生物是克魯維酵母菌種。本領域中公知的是,上述生物體還能用于產生其它物質,如本文所述。通常向降解的木素纖維素或水解物加入發(fā)酵微生物,并進行約8至約96小時,如約24至約60小時發(fā)酵。溫度通常為約26°C至約60°C,特別是約32°C或50°C,并且在約pH3至約pH8,如約pH4-5、6或7。在一個優(yōu)選的方面,對降解的纖維素材料施用酵母和/或另ー種微生物,并進行約12至約96小時,如通常為24-60小時發(fā)酵。在一個優(yōu)選的方面,溫度優(yōu)選為約20°C至約60°C,更優(yōu)選約25°C至約50°C,并且最優(yōu)選約32°C至約50°C,特別是約32°C或50°C,并且pH通常為約pH3至約pH7,優(yōu)選約pH4_7。然而,一些發(fā)酵生物體例如細菌,具有更高的最適發(fā)酵溫度。酵母或另ー種微生物優(yōu)選以約IO5-IO12,優(yōu)選約IO7-IOltl,特別是約2xl08活細胞計數(shù)每ml發(fā)酵液的量施用。關于使用酵母進行發(fā)酵的進一歩指導可以在例如“TheAlcoholTextbook,,(K.Jacques,T.P.Lyons和D.R.Kelsall編,NottinghamUniversityPress,UnitedKingdom1999)中找到,其通過提述并入本文。對于こ醇生產,在發(fā)酵后蒸餾發(fā)酵的漿料以提取こ醇。根據(jù)本發(fā)明的方法獲得的こ醇可以用作,例如燃料こ醇;飲料こ醇,即,中性飲料酒,或エ業(yè)こ醇。發(fā)酵刺激劑可以與本文所述的任何方法組合使用,以進ー步改進發(fā)酵エ藝,而且特定地,改進發(fā)酵微生物的性能,如,速率増加和こ醇得率?!鞍l(fā)酵刺激剤”指用于發(fā)酵微生物(特別是酵母)生長的刺激剤。優(yōu)選的用于生長的發(fā)酵刺激劑包括維生素和礦物質。維生素的實例包括多種維生素、生物素、泛酸(鹽)、煙酸、內消旋肌醇(meso-inositol)、硫胺素、卩比唆醇(pyridoxine)、對氨基苯甲酸、葉酸、核黃素和維生素A、B、C、D^PE。參見,例如,Alfenore等,ImprovingethanolproductionandviabilityofSaccharomycescerevisiaebyavitaminfeedingstrategyduringfed—barchprocess,Springer-Verlag(2002),其通過提述并入本文。礦物質的實例包括能夠提供營養(yǎng)物的礦物質和礦物質鹽,所述營養(yǎng)物包括P、K、Mg、S、Ca、Fe、Zn、Mn和Cu。發(fā)酵產物發(fā)酵產物可以是源自發(fā)酵的任何物質。發(fā)酵產物可以是,不限于,醇(例如,阿拉伯醇、丁醇、こ醇、甘油、甲醇、1,3_丙ニ醇、山梨醇和木糖醇);有機酸(例如,こ酸、醋酮酸、己ニ酸、抗壞血酸、檸檬酸、2,5-ニ酮-D-葡糖酸、甲酸、反丁烯ニ酸、葡糖ニ酸、葡糖酸、葡糖醛酸、戊ニ酸、3-羥基丙酸、衣康酸、乳酸、蘋果酸、丙ニ酸、草酸、草酰こ酸、丙酸、琥珀酸和木糖酸);酮(例如,丙酮);氨基酸(例如,天冬氨酸、谷氨酸、甘氨酸、賴氨酸、絲氨酸和蘇氨酸);和氣體(例如,甲烷、氫氣(H2)、ニ氧化碳(CO2)和一氧化碳(CO))。發(fā)酵產物還可以是作為高價值產品的蛋白質。在一個優(yōu)選的方面,發(fā)酵產物是醇??衫斫獾氖?,術語“醇”包括包含ー個或多個羥基基團的物質。在更優(yōu)選的方面,所述醇是阿拉伯醇。在另ー個更優(yōu)選的方面,所述醇是丁醇。在另ー個更優(yōu)選的方面,所述醇是こ醇。在另ー個更優(yōu)選的方面,所述醇是甘油。在另ー個更優(yōu)選的方面,所述醇是甲醇。在另ー個更優(yōu)選的方面,所述醇是1,3_丙ニ醇。在另一個更優(yōu)選的方面,所述醇是山梨醇。在另ー個更優(yōu)選的方面,所述醇是木糖醇。參見,例如,Gong,C.b.,Cao,N.J.,Du,J.,和Tsao,G.Γ.,1999,Ethanolproductionfromrenewableresources,于AdvancesinBiochemicalEngineering/Biotechnology,Scheper,T.編,Springer-VerlagBerlinHeidelberg,Germany,65:207-241;Silveira,M.M.,和Jonas,R.,2002,Thebiotechnologicalproductionofsorbitol,Appl.Microbiol.Biotechnol.59:400-408;Nigam,P.,和Singh,D.,1995,Processesforfermentativeproductionofxylitol-asugarsubstitute,ProcessBiochemistry30(2):117-124;Ezeji,T.C.,Qureshi,N.和Blaschek,H.P.,2003,Productionofacetone,butanolandethanolbyClostridiumbeijerincknBAlOlandinsiturecoverybygasstripping,WorldJournalofMicrobiologyandBiotechnology19(6):595_603o在另ー個優(yōu)選的方面,所述發(fā)酵產物是有機酸。在另ー個更優(yōu)選的方面,所述有機酸是こ酸。在另ー個更優(yōu)選的方面,所述有機酸是醋酮酸。在另ー個更優(yōu)選的方面,所述有機酸是己ニ酸。在另ー個更優(yōu)選的方面,所述有機酸是抗壞血酸。在另ー個更優(yōu)選的方面,所述有機酸是朽1檬酸。在另ー個更優(yōu)選的方面,所述有機酸是2,5-ニ酮-D-葡糖酸。在另ー個更優(yōu)選的方面,所述有機酸是甲酸。在另ー個更優(yōu)選的方面,所述有機酸是反丁烯ニ酸。在另ー個更優(yōu)選的方面,所述有機酸是葡糖ニ酸。在另ー個更優(yōu)選的方面,所述有機酸是葡糖酸。在另ー個更優(yōu)選的方面,所述有機酸是葡糖醛酸。在另ー個更優(yōu)選的方面,所述有機酸是戊ニ酸。在另ー個優(yōu)選的方面,所述有機酸是3-羥基丙酸。在另ー個更優(yōu)選的方面,所述有機酸是衣康酸。在另ー個更優(yōu)選的方面,所述有機酸是乳酸。在另ー個更優(yōu)選的方面,所述有機酸是蘋果酸。在另ー個更優(yōu)選的方面,所述有機酸是丙ニ酸。在另ー個更優(yōu)選的方面,所述有機酸是草酸。在另ー個更優(yōu)選的方面,所述有機酸是丙酸。在另ー個更優(yōu)選的方面,所述有機酸是琥珀酸。在另ー個更優(yōu)選的方面,所述有機酸是木糖酸。參見,例如,Chen,R.,和Lee,·Y.,1997,Membrane-mediatedextractivetermentationforlacticacidproductionfromcellulosicbiomass,Appl.Biochem.Biotechnol.63—65:435_448。在另ー個優(yōu)選的方面,所述發(fā)酵產物是酮??衫斫獾氖切g語“酮”涵蓋含有一個或多個酮基的物質。在另ー個更優(yōu)選的方面,所述酮是丙酮。參見,例如,Qureshi和Blaschek,2003,見上文。在另ー個優(yōu)選的方面,所述發(fā)酵產物是氨基酸。在另ー個更優(yōu)選的方面,所述有機酸是天冬氨酸。在另ー個更優(yōu)選的方面,所述氨基酸是谷氨酸。在另ー個更優(yōu)選的方面,所述氨基酸是甘氨酸。在另ー個更優(yōu)選的方面,所述氨基酸是賴氨酸。在另ー個更優(yōu)選的方面,所述氨基酸是絲氨酸。在另ー個更優(yōu)選的方面,所述氨基酸是蘇氨酸。參見,例如,Richard,A.,和Margaritis,A.,2004,Empiricalmodelingofbatchfermentationkineticsforpoly(glutamicacid)productionandothermicrooialbiopolymers,BiotechnologyandBioengineering87(4):501_515o在另ー個優(yōu)選的方面,所述發(fā)酵產物是氣體。在另ー個更優(yōu)選的方面,所述氣體是甲烷。在另ー個更優(yōu)選的方面,所述氣體是H2。在另ー個更優(yōu)選的方面,所述氣體是C02。在另ー個更優(yōu)選的方面,所述氣體是CO。參見,例如,Kataoka,N.,A.Miya,和K.Kiriyama,1997,Studiesonhydrogenproductionbycontinuousculturesystemofhydrogen-producinganaerobicbacteria,WaterScienceandTechnology36(6-7)41-47;和GunaseelanV.N.于BiomassandBioenergy,Vol.13(1-2),pp.83-114,1997,AnaerobicdigestionofoiomassformethaneproductionAreview。通|??梢允褂帽绢I域已知的任何方法,任選地從發(fā)酵培養(yǎng)基回收發(fā)酵產物,所述方法包括,但不限于,層析、電泳方法、差示溶解度、蒸餾或提取。例如,通過常規(guī)蒸餾方法從發(fā)酵的纖維素材料分離并純化醇??梢垣@得純度高達約96ν01%的こ醇,其能用作,例如,燃料こ醇、飲用こ醇,即,中性飲料酒,或エ業(yè)こ醇。信號肽本發(fā)明還涉及編碼信號肽的分離的多核苷酸,所述信號肽包含SEQIDNO2的氨基酸I到18或由SEQIDNO2的氨基酸I到18組成。所述多核苷酸還可包含編碼蛋白質的基因,其可操作地連接于所述信號肽和/或前肽。所述蛋白質優(yōu)選對于所述信號肽是外源的。在ー個方面,所述信號肽的多核苷酸是SEQIDNO:1的I至54。本發(fā)明還涉及包含此種多核苷酸的核酸構建體、表達載體和重組宿主細胞。本發(fā)明還涉及產生蛋白質的方法,包括(a)培養(yǎng)包含此種多核苷酸的重組宿主細胞;和(b)回收所述蛋白質。所述蛋白質對于宿主細胞可以是天然的或異源的。術語“蛋白質”在本文的意思不是指特定長度的編碼產物,并且因此涵蓋肽、寡肽和多肽。術語“蛋白質”還包含組合以形成編碼產物的兩種或更多種多肽。所述蛋白質還包括雜合多肽和融合多肽。優(yōu)選地,所述蛋白質是激素或其變體、酶、受體或其部分、抗體或其部分,或報道蛋白(reporter)。例如,所述蛋白質可為氧化還原酶、轉移酶、水解酶、裂合酶(lyase)、異構酶或連接酶,如氨肽酶、淀粉酶、糖酶、羧肽酶、過氧化氫酶、纖維素酶、殼多糖酶、角質酶、環(huán)糊精糖基轉移酶、脫氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、轉化酶、漆酶、另外的脂肪酶、甘露糖苷酶、變聚糖酶(mutanase)、氧化酶、果膠分解酶、過氧化物酶、肌醇六磷酸酶、多酹氧化酶、蛋白水解酶、核糖核酸酶、轉谷氨酰胺酶或木聚糖酶?;蚩梢詮娜魏卧恕⒄婧嘶蚱渌鼇碓传@得。通過以下實施例進ー步對本發(fā)明進行描述,但不應將其理解為對本發(fā)明范圍的限制。實施例作為緩沖液和底物使用的化學品是至少試劑等級的商業(yè)產品。菌株棘抱曲霉菌株NN000525(IAM2445,IAMCultureCollection,InstituteofMolecularandCellularBiosciences,TheUniversityofTokyo)用作具有纖維ニ糖水解酶活性的GH6多肽的來源。米曲霉JaL355菌株(W02005/070962)用于表達具有纖維ニ糖水解酶活性的棘孢曲霉GH6多肽。培養(yǎng)基搖瓶培養(yǎng)基組成為15g的葡萄糖,4g的K2HPO4,Ig的NaCl,0.2g的MgSO4·7Η20,2g的MES游離酸,Ig的細菌用蛋白胨,5g的酵母提取物,2.5g的檸檬酸,0.2g的CaCl2·2H20,5g的NH4NO3,Iml的痕量元素溶液,和去離子水加至I升。痕量元素溶液組成為1.2g的FeSO4·7Η20,IOg的ZnSO4*7H20,0.7g的MnSO4·Η20,0.4g的CuSO4·5Η20,0·4g的Na2B4O7·IOH20,0.8g的Na2MoO2·2H20,和去離子水加至I升。PDA平板組成為39克的馬鈴薯右旋糖瓊脂,和去離子水加至I升。NNCYP-PCS培養(yǎng)基組成為lg的NaCl,5g的NH4NO3,2g的MES水合物,2.75g的檸檬酸,O.2g的CaCl2·H2O,5g的細菌蛋白胨,5g的酵母提取物,0.2g的MgSO4·7H20,4g的K2HPO4,ImlCOVE痕量金屬溶液,2g的右旋糖,5%w/vPCS(稀酸預處理的玉米秸桿,pH5),和去離子水加至I升。COVE痕量金屬溶液組成為0.04g的Na2B4O7·IOH20,0.4g的CuSO4·5H20,1.2g的FeSO4·7H20,0.7g的MnSO4·H20,0.8g的Na2MoO4·2H20,IOg的ZnSO4·7H20),和去離子水加至I升。LB平板組成為10g的胰蛋白胨,5g的酵母提取物,IOg的氯化鈉,15g的瓊脂,和去離子水加至I升。YP培養(yǎng)基組成為10g的酵母提取物,20g的細菌用蛋白胨,和去離子水加至I升。YPM培養(yǎng)基組成為IOg的酵母提取物,20g的細菌用蛋白胨,20g的麥芽糖,和去離子水加至I升。實施例I:野生型棘孢曲霉的生長將棘孢曲霉菌株NN000525使用兩個來自PDA平板的栓(plug)接種入500ml搖瓶中的IOOml的搖瓶培養(yǎng)基,并在45°C在定軌振蕩器上以200rpm溫育48小吋。使用五十ml的搖瓶培養(yǎng)基接種2升發(fā)酵容器。發(fā)酵批次培養(yǎng)基組成為5g的酵母提取物,176g的粉末狀纖維素,2g的葡萄糖,Ig的NaCl,Ig的細菌用蛋白胨,4g的K2HPO4,0.2g的CaCl2·2H20,0.2g的MgSO4·7Η20,2·5g的檸檬酸,5g的NH4NO3,1.8ml的消泡劑,Iml的痕量元素溶液,和去離子水至I升。發(fā)酵補料包含水和消泡劑。將總共1.8升的發(fā)酵批次培養(yǎng)基添加至兩升玻璃夾套發(fā)酵器(ApplikonBiotechnology,Schiedam,Netherlands)。將發(fā)酵補料培養(yǎng)基以4g/l/hr的速率添加72小時的時間。將發(fā)酵容器維持在45°C的溫度,并使用Applikon1030控制系統(tǒng)(ApplikonBiotechnology,Schiedam,Netherlands)將pH控制在5.6+/-0.I的設定點。將空氣以Ivvm的速率添加至容器,并由以1100至1300rpm旋轉的Rushton葉輪攪拌培養(yǎng)液。在發(fā)酵終止時,從容器收獲全培養(yǎng)液,并以3000xg離心以去除生物質。實施例2:從野生型棘孢曲霉全培養(yǎng)液純化天然Cel6A纖維ニ糖水解酶將實施例I中獲得的收獲的棘孢曲霉培養(yǎng)液在500ml瓶中在4°C以13,OOOxg離心20分鐘,然后使用O.22μm聚醚砜膜(Millipore,Bedford,MA,USA)滅菌過濾。濃縮過濾的培養(yǎng)液,并將其用20mMTris-HClpH8.5使用配置有IOkDa聚醚砜膜的切線流濃縮器(PallFiltron,Northborough,MA,USA)以大約20psi緩沖液交換。為了減少色素的量,將濃縮物施于用20mMTris-HClpH8.5平衡的60mlQSEPHAR0SEBigBead柱(GEHealthcare,Piscataway,NJ,USA),并用含有O至600mMNaCl的平衡緩沖液逐步洗脫。將流過物和洗脫物級分在用GELCODEBlueStainReagent(ThermoFisherScientific,Waltham,MA,USA)染色的8-16%CRITERIONSDS-PAGE凝膠(Bio-RadLaboratories,Inc.,Hercules,CA,USA)上檢查。如通過70kDa條帶(對應于Cel6A纖維ニ糖水解酶的表觀分子量)的存在判斷,所述洗脫物級分含有棘孢曲霉Cel6A纖維ニ糖水解酶。使用Amicon超濾裝置(Millipore,Bedford,MA,USA;10kDa聚醚諷膜,40psi,4°C)濃縮洗脫物級分,并脫鹽(HIPREP26/10脫鹽柱,GEHealthcare,Piscataway,NJ,USA)Λ20mMTris-HClpH8.5。將脫鹽的物質加載于用20mMTris-HClpH8.5平衡的MONOQ柱(HR16/10,GEHealthcare,Piscataway,NJ,USA)上。將結合的蛋白用20mMTris-HClpH8.5中OMNaCl至600mMNaCl的鹽梯度(20個柱體積)洗脫。通過如上所述的8-16%SDS-PAGE凝膠檢查級分,并掲示了棘孢曲霉Cel6A纖維ニ糖水解酶在大約50mMNaCl處洗脫。匯集含有Ce16A纖維ニ糖水解酶級分,并與等體積的含3.4M硫酸銨的20mMTris-HClpH7.5(終濃度為I.7M硫酸銨)混合。過濾樣品(O.2μM注射器式濾器(syringefilter),聚醚砜膜,Whatman,Maidstone,UnitedKingdom)以去除顆粒物質,然后將其加載于用20mMTris-HClpH7.5中的I.7M硫酸銨平衡的20mlSOURCE15PHE柱(GEHealthcare,Piscataway,NJ,USA)結合的蛋白用20mMTris-HClpH7.5中的1·7Μ硫酸銨至OM硫酸銨的減少的鹽梯度(15個柱體積)洗脫。如上所述通過8-16%SDS-PAGE凝膠電泳分析級分,其掲示了Cel6A纖維ニ糖水解酶在梯度最末端洗脫(大約50mM硫酸銨)。如通過SDS-PAGE判斷,所述棘孢曲霉Cel6A纖維ニ糖水解酶為超過90%純。使用BCAProteinAssayKit(ThermoFisherScientific,Waltham,MA,USA)確定蛋白濃度,其中使用牛血清白蛋白作為蛋白標樣。實施例3:棘孢曲霉家族6纖維ニ糖水解酶對PCS水解的作用在U.S.DepartmentofEnergyNationalRenewableEnergyLaooratorパ美國能源部可回收能源國家實驗室,NREL)使用1.4wt%硫酸在165°C和107psi預處理玉米秸桿8分鐘。預處理的玉米秸桿中的水不溶性固形物含有57.5%纖維素,4.6%半纖維素和28.4%木質素。通過兩階段硫酸水解,接著通過使用NRELStandardAnalyticalProcedure#002的高效液相層析分析糖來確定纖維素和半纖維素。在用硫酸水解纖維素和半纖維素級分之后,使用NRELStandardAnalyticalProcedure#003以重量分析法確定木質素。在使用之前,磨制預處理的玉米秸桿,并用水洗滌。經磨制、洗滌、預處理的玉米秸桿(起始干重32.35%)通過在CosmosICMG40濕式多用途研磨器(wetmulti-utilitygrinder)(EssEmmCorporation,TamilNadu,India)中磨制,然后用去離子水反復洗漆,并傾去上清級分。發(fā)現(xiàn)經磨制、水洗的預處理的玉米秸桿的干重為7.114%。就其增強由里氏木霉纖維素分解蛋白組合物(表達橙橘嗜熱子囊菌GH6IA和米曲霉葡糖苷酶融合物的里氏木霉培養(yǎng)液,PCT/US2008/065417)水解PCS的能力衡量棘孢曲霉纖維ニ糖水解酶。使用2.2ml深孔板(Axygen,UnionCity,CA,USA)在I.Oml的總反應體積中進行PCS的水解。水解用50mg的PCS每ml的含有ImM硫酸錳的50mMこ酸鈉pH5.O緩沖液和2mg的里氏木霉纖維素分解蛋白制備物每克纖維素或用棘孢曲霉纖維ニ糖水解酶替代20%(按蛋白計)里氏木霉纖維素分解蛋白制備物(I.6mg的里氏木霉纖維素分解蛋白組合物每克纖維素和0.4mg每種酶每g纖維素)的固定蛋白加載量進行。水解測定在50°C三次重復進行72小時。在水解之后,用0.45μmMultiscreen96孔過濾板(Millipore,Bedford,MA,USA)過濾樣品,并如下所述就糖含量分析濾過物。當不立即使用時,將過濾的糖等分試樣凍結于20°C。在65°C用含0.05%w/w苯甲酸的0.005MH2SO4以0.6ml每分鐘的流速從4.6x250mmAMINEXHPX-87H柱(Bio-RadLaboratories,Inc.,Hercules,CA,USA)洗脫之后,用通過從根據(jù)純糖樣品校正的折光率檢測(CHEMSTATION,AGILENT1100HPLC,AgilentTechnologies,SantaClara,CA,USA)獲得的葡萄糖和纖維ニ糖信號的積分而進行的定量來測量稀釋于0.005MH2SO4的樣品的糖濃度。將所得的當量用于計算對于每個反應纖維素轉化的百分比。使用下式計算纖維素轉化的程度%轉化=[葡萄糖轉化+1.053x(纖維ニ糖轉化)]/[(葡萄糖濃度+1.053x限制消化中的(纖維ニ糖濃度)]。對于纖維ニ糖的I.053的系數(shù)考慮了當纖維ニ糖轉化為葡萄糖時質量的増加。將五十mg的里氏木霉纖維素分解蛋白制備物用于限制消化。圖2中所示的結果說明用棘孢曲霉纖維ニ糖水解酶20%替代(按蛋白計)里氏木霉纖維素分解蛋白制備物(以2mg每g纖維素加載)使72小時水解產率改善了3.4%?;蛘?,用棘孢曲霉Cel6A纖維ニ糖水解酶20%替代里氏木霉纖維素分解蛋白制備物(以2mg每g纖維素加載)的百分比轉化率等于2.15mg的里氏木霉纖維素分解蛋白制備物每g纖維素的加載量(I.08倍改善)。實施例4:棘孢曲霉家族6纖維ニ糖水解酶的鑒定供肽測序的多肽凝膠內消化使用MULTIPROBEIILiquidHandlingRobot(PerkinElmerLifeandAnalyticalSciences,Boston,MA,USA)進行凝膠內消化。用剃刀刀片切出實施例2中所述的70kDa蛋白凝膠條帯,并用IOOmM碳酸氫銨pH8.O中的50μI的IOmMニ硫蘇糖醇(DTT)還原30分鐘。在還原之后,用IOOmM碳酸氫銨pH8.O中的50μI的55mM碘こ酰胺烷化凝膠塊20分鐘。允許干燥的凝膠塊在25μI的含有6ng測序級胰蛋白酶(Promega,Madison,WI,USA)姆μI的50mM碳酸氫銨pH8.O的胰蛋白酶消化溶液中在室溫溶脹30分鐘,接著在40°C進行8小時消化。每ー個上述反應步驟之后用合適的溶液遵循生產商的標準實驗方案進行多次洗滌和預洗滌。將五十μI的こ腈用于在反應之間將凝膠塊脫水,并在步驟之間將凝膠塊風干。將肽用HPLC級水中的1%甲酸/2%こ腈提取兩次。將肽提取溶液轉移至冷卻至10-15°C并用96孔板蓋(PerkinElmerLifeandAnalyticalSciences,Boston,MA,USA)覆蓋(以防止蒸發(fā))的96孔襯邊的(skirted)PCR型平板(ABGene,Rochester,NY,USA)。將平板進一步儲藏于4°C直至進行質譜法分析。蛋白鑒定對于通過串聯(lián)質譜法進行的從頭開始的肽測序,使用Q-T0FMICR0(WatersMicromassMSTechnologies,Milford,MA,USA),一種混合正交四極飛行時間瘋I普儀(hybridorthogonalquadrupoletime-of-flightmassspectrometer)以供LC/MS/MS分析。將Q-TOFMICRO使用MASSLYNX軟件版本4·I(WatersMicromassMSTechnologies,Milford,MA,USA)進行完全微處理器控制。Q-TOFMICRO配置有NANOACQUITYUPLC(WatersCorp,MiIford,MA,USA)以供使樣品濃縮和脫鹽。將樣品加載于配置在注射回路中的捕獲柱(180ymIDX20mm,5μmSYMMETRYC18)(WatersCorp,Milford,MA,USA),并使用ニ兀溶劑管理泵(binarysolventmanagerpump)用水中的O.I%甲酸以15μI每分鐘洗滌I分鐘。將肽在IOOymIDx100mm,C18,L7μm,ΒΕΗ130C18納米流融合毛細管柱(WatersCorp,Milford,MA,USA)上以400nl姆分鐘的流速分離。在30分鐘期間施加O.I%甲酸中I%至85%こ腈的逐步洗脫梯度。在214nm監(jiān)視柱洗脫液,并將其通過配置有納米噴霧界面的電噴霧離子源導入Q-TOFMICRO。從m/z400至1990的質量范圍以觀測掃描模式(surveyscanmode)并將標準從MS切換為MS/MS獲得數(shù)據(jù),以包括大于10.O計數(shù)每秒的離子強度和+2、+3和+4的荷電狀態(tài)。可獲得多至6個共同洗脫的物種的分析譜,以及I.9秒的掃描時間和0.I秒的掃描間時間。通常使用45伏特的錐電壓(conevoltage),并將碰撞能量編程為根據(jù)洗脫肽的質量和荷電狀態(tài)而變化,并在10-60伏的范圍內。將獲得的譜以自動方式合并、平滑化并中央化(center),并生成峰列表。針對選定的數(shù)據(jù)庫使用R0TEINLYNXGLOBALSERVER2.3軟件(WatersMicromassMSTechnologies,Milford,MA,USA)和PEAKSStudio版本4.5(SPl)(BioinformaticSolutionsInc.,Waterloo,Ontario,Canada)檢索峰列表。衡量來自PR0TEINLYNXGLOBALSERVER和PEAKSStudio檢索的結果,并進一步通過衡量每種感興趣的離子的MS/MS譜來分析未鑒定的蛋白,并且通過鑒定I和b離子系列并將質量差與合適的氨基酸匹配來確定從頭開始的序列。對于凝膠內消化的70kDa多肽凝膠條帶,從幾種多重荷電的離子獲得了肽序列。雙重荷電的胰蛋白酶消化的404.233m/z肽離子序列確定為Phe_[Ile/Leu]-Val-Asp-Thr-Gly-Arg(SEQIDNO:2的氨基酸370至376)。另ー個雙重荷電的月夷蛋白酶消化的419.2206m/z肽離子序列確定為Ala-Tyr-[Ile/Leu]-Asp-Ser-[IIe/Leu]-Arg(SEQIDNO:2的氨基酸221至227)。另ー個雙重荷電的胰蛋白酶消化的486.313m/z妝離子序列確定為[Ile/Leu]-Val-Thr-Asn-[Ile/Leu]-Asn-Val-Ala-Lys(SEQIDNO:2的氨基酸250至258)。另ー個雙重荷電的胰蛋白酶消化的514.793m/z肽離子序列確定為Ala-Asn-[Ile/Leu]-Tyr-Ala-Ser-Val-Ty;r-Lys(SEQIDNO2的氛基酸304至312)。另ー個雙重荷電的胰蛋白酶消化的575.817m/z肽離子序列確定為Ser-[Ile/Leu]-Ala-Asn-Asn-Gly-Val-Ala-Asn-Tyr-Lys(SEQIDNO:2的氨基酸210至220)。另一個雙重荷電的胰蛋白酶消化的666.3743的肽確定為Val-Pro-Ser-Phe-Val-Trp-Leu-Asp-Val-Ala-Ala-Lys(SEQIDNO:2的氨基酸152至163)。另ー個雙重荷電的胰蛋白酶消化的669.881m/z妝離子確定為Val-Pro-Thr-Met-Ala-Th;r-Ty;r-[Ile/Leu]-Ala-Asp-[Ile/Leu]-Lys(SEQIDNO:2的氨基酸164至175)。無法分辨[Ile/Leu],因為它們具有相等的質量。實施例5:制備棘孢曲霉菌株NN000525菌絲體以供cDNA文庫產生將棘孢曲霉菌株NN000525接種于PDA平板上,并在黑暗中在37°C溫育4日。將幾個菌絲體-PDA栓接種入含有150ml的NNCYP-PCS培養(yǎng)基的500ml搖瓶。將燒瓶在26°C以120rpm振蕩溫育4日。收集來自固體培養(yǎng)基的菌絲體,并凍結于液氮,然后儲藏于_80°C冷凍箱直至使用。實施例6:棘孢曲霉菌株NN000525RNA分離將凍結的菌絲體轉移至液氮預冷卻的杵和研缽,并用少量烘烤的石英砂研磨至細粉。通過用TRIZOLLS(InvitrogenCorp.,Carlsbad,CA,USA)提取,接著用氯仿提取三次,并用O.7v/v異丙醇沉淀來從粉末狀菌絲體制備總RNA。將總RNA沉淀重新溶解于不含RNA酶的水,并儲藏于_80°C冷凍箱直至使用。實施例7:棘孢曲霉菌株NN000525cDNA的構建使用SMARTPCRcDNASynthesisKit(Clontech,Saint-Germain-en-Laye,France)根據(jù)生產商的LDPCRcDNA擴增實驗方案合成雙鏈cDNA。實施例8:編碼棘孢曲霉菌株NN000525GH6多肽的cDNA的分離使用SMARTIIA寡核苷酸(Clontech,Saint-Germain-en-Laye,France)和下述簡并引物(TAGCopenhagen,Denmark),使用PCR來擴增含有5’端的cDNA引物#578:5,-GAGCAGTCTCGGTCGGGNADRTTRTA-3’(SEQIDNO:135)引物#580:5,-GCCGTCGGACTCGCCNCCNGGYTT-3’(SEQIDNO:136)擴增反應組成為1μI的棘孢曲霉菌株ΝΝ000525SMARTcDNA,12.5μI的2ΧREDDYMIXPCRBuffer(ThermoFisherScientificInc.,Waltham,MA,USA),IμI的SMARTIIA寡核苷酸,9.5μI的H20,和1μI的引物#578或引物#580之一的5μM溶液。將擴增反應物在PTC-200DNAENGINEThermalCycler(MJResearchInc.,Waltham,MA,USA)中溫育,程序如下1個循環(huán),在94°C進行2分鐘,和35個循環(huán),每循環(huán)在94°C進行15分鐘和在60°C進行I分鐘。通過使用TAE緩沖液(40mMTris堿-20mMこ酸鈉-ImMEDTAニ鈉)并用SYBRSafeDNA凝膠染料(InvitrogenCorp.,Carlsbad,CA,USA)染色的1%瓊脂糖凝膠電泳分離0.9kbPCR反應產物和I.3kbPCR反應產物。以EAGLEEYEImagingSystem(Stratagene,LaJolla,CA,USA)和DARKREADERTransilluminator(ClareChemicalResearch,Dolores,CO,USA)的協(xié)助顯影DNA條帶。從凝膠切出0.9和I.3kbDNA條帶,并使用GFXPCRDNA和GelBandPurificationKit(GEHealthcareLifeSciences,Piscataway,NJ,USA)根據(jù)生產商的指示純化。用#578引物對0.9kb條帶進行測序,并使用#580引物對I.3kb片段進行測序。使用CDSIII寡核苷酸(Clontech,Saint-Germain-en-Laye,France)以及下述引物之一(TAGCopenhagen,Denmark)擴增cDNA的3’端引物#601:5,-CTCCTACACCCAGGGCAACA-3,(SEQIDNO:137)引物#602:5,-CGATTGGTGCAACGTCATCA-3’(SEQIDNO:138)擴增反應物組成為1μI的棘孢曲霉菌株ΝΝ000525SMARTcDNA,12.5μI的2ΧREDDYMIXPCRBuffer,9.5μI的H2O,和IμI的引物#601或引物602的5μM溶液。將擴增反應在PTC-200DNAENGINEThermalCycler中溫育,程序為I個循環(huán),在94°C進行2分鐘;和35個循環(huán),每循環(huán)在94°C進行15秒和60°C進行I分鐘。通過使用TAE緩沖液并用SYBRSafeDNA凝膠染料染色的I%瓊脂糖凝膠電泳分離O.6kbPCR反應產物和O.4kbpPCR反應產物。以EAGLEEYEImagingSystem和DARKREADERTransilluminator的協(xié)助顯影DNA條帶。從凝膠切出O.6和O.4kbDNA條帶,并使用GFXPCRDNA和GelBandPurificationKit根據(jù)生產商的指示純化。使用引物#602對兩個片段進行測序。實施例9:編碼具有纖維ニ糖水解酶活性的家族GH6多肽的棘孢曲霉菌株NN000525cDNA序列的表征編碼具有纖維ニ糖水解酶活性的棘孢曲霉GH6多肽的cDNA的核苷酸序列(SEQIDNO1)和推定的氨基酸序列(SEQIDNO2)示于圖IA和1B。開讀框為1407bp,包括終止密碼子,并編碼469個氨基酸的多肽。全長編碼序列和成熟編碼序列的%G+C含量分別為61.9%和62.0%。使用SignalP軟件程序(Nielsen等,1997,ProteinEngineering10:1-6),預測了18個殘基的信號肽。預測的成熟蛋白含有451個氨基酸,具有47kDa的分子量。用Interproscan程序(Mulder等,2OO7,NucleicAcidsRes.35D224-D228)分析具有纖維ニ糖水解酶活性的GH6多肽的推定的氨基酸序列顯示GH6多肽含有糖基水解酶家族6(InterPro登錄號IPR001524)的序列特征。該序列特征見于成熟多肽的大約殘基90至451(Pfam登錄號PF01341)。Interproscan程序分析亦掲示了CBMl纖維素結合域(InterPro登錄號IPR000254)。該序列特征見于成熟多肽的大約殘基4至37((Pfam登錄號PF01341)。使用如EMBOSS的Needle程序中執(zhí)行的Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48:443-453),以缺ロ開放罰分為10,缺ロ延伸罰分為O.5和EBL0SUM62矩陣,確定了氨基酸序列的比較性逐對全局比對。該比對顯示棘孢曲霉GH6成熟多肽的推定的氨基酸序列與真菌家族6糖基水解酶蛋白(GeneSeqP登錄號ASR94299)的推定的氨基酸序列具有98%同一性(排除間隔)。實施例10:編碼棘孢曲霉菌株NN000525GH6多肽的cDNA的克隆基于cDNA序列,設計了如下所示的寡核苷酸引物以從棘孢曲霉菌株NN000525的cDNA擴增GH6基因引物#6O9:5'-taagaattcacCATGCGTTATACATTGTCTCTCGCA3/(SEQIDNO:139)引物#608:5’-TATGCGGCCGCYTARAANGCNGGRTTNGCRTT-3’(SEQIDNO:140)擴增反應物組成為1μI的棘孢曲霉菌株NN000525SMARTcDNA,12.5μI的2ΧREDDYMIXPCRBuffer,IμI的5μM引物#609,1μI的5μM引物#608,和9.5μI的H2O0將擴增反應在PTC-200DNAENGINEThermalCycler中溫育,程序如下I個循環(huán),在94°C進行2分鐘;和35個循環(huán),每循環(huán)在94°C進行15秒和60°C進行I.5分鐘。通過使用TAE緩沖液并用SYBRSafeDNA凝膠染料染色的I%瓊脂糖凝膠電泳分離I.4kbPCR反應產物。以EAGLEEYEImagingSystem和DARKREADERTransilluminator的協(xié)助顯影DNA條帶。從凝膠切出I.4kbDNA條帶,并使用GFXPCRDNA和GelBandPurificationKit根據(jù)生產商的指不純化。將所述I.4kb片段用EcoRI和NotI切割,并使用GFXPCRDNA和GelBandPurificationKit根據(jù)生產商的指示純化。然后將切割的I.4kb片段通過使用T4連接酶(Promega,Madison,WI,USA)根據(jù)生產商的指示連接入EcoRI-NotI切割的pXYG1051(W02005/080559)進行定向克隆。將連接混合物根據(jù)生產商的指示轉化入大腸桿菌T0P10F感受態(tài)細胞(InvitrogenCorp.,Carlsbad,CA,USA)。將轉化混合物鋪板于補充100μg姆ml的氨節(jié)青霉素的LB平板上。從幾個轉化體制備質粒小量制備,并測序。選擇了具有正確棘孢曲霉GH6編碼序列的ー個質粒。將該質粒命名為pXYG1051-P6XY(圖3)。表達載體pXYG1051含有與pCaHj483(公開于TO98/00529的實施例4)相同的來源于黑曲霉的中性淀粉酶II(NA2)啟動子,和終止子元件。此外,PXYG1051具有來源于pUC18的序列以供在大腸桿菌中選擇和繁殖,以及來源于?05¥82(公開于美國專利號5,958,727的實施例4)的序列以供在曲霉屬中通過米曲霉的PyrG基因促進的選擇和表達,所述基因編碼乳清苷脫羧酶,并用于補足PyrG突變的曲霉屬菌株。將通過引物#609和#608PCR擴增的I.4kb片段亦通過使用標準分子生物學技術連接入用EcoRI和NotI消化的pCR2.1(Invitrogen,Carlsbad,CA,USA)以生成pCR2.1-P6XY(圖4)來進行克隆。pCR2.1-P6XY中的棘孢曲霉GH6多肽基因插入物通過Sanger測序確定為編碼與pXYG1051_P6XY中相同的多肽序列,但在對應于引物#608的擺動堿基幾個位置有變化(SEQIDNO:141)。這些變化可通過定位誘變容易地修正。將含有pCR2.1-P6XY的大腸桿菌NN059164于2009年10月I日保藏于德意志微生物和細胞培養(yǎng)物1中·1じ、(DeutscheSammlungvonMiKroorganismenundZeiikulturenGmbH(DSM)),分配保藏號DSM22994。實施例11:在米曲霉中產生具有纖維ニ糖水解酶活性的重組棘孢曲霉GH6多肽如WO98/00529中所述將表達質粒pXYG1051-P6XY轉化入米曲霉JaL355。在將其在PDA平板上進行孢子形成之前,將轉化體在選擇平板上藉由單分生孢子純化。由轉化體產生棘孢曲霉GH6多肽由在26°C在含2%麥芽糊精的YP培養(yǎng)基中Iml96深孔靜止培養(yǎng)的培養(yǎng)上清來分析。在NUPAGE10%Bis-TrisSDS-PAGE(Invitrogen,Carlsbad,CA,USA)上通過考馬斯藍染色來驗證表達。選擇ー個轉化體進行進一歩研究,并命名為米曲霉86.10。對于更大規(guī)模的生產,將米曲霉86.10孢子鋪板于PDA平板上,并在37°C溫育五天。將匯合的孢子平板用5ml的O.01%TWEEN20洗滌兩次以將收集的孢子數(shù)最大化。然后使用孢子懸液接種二十五個含有IOOml的YPM培養(yǎng)基的500ml燒瓶。將培養(yǎng)在30°C以85rpm的恒速振蕩溫育。在接種后第四日,藉由通過I.6μm、I.2μm和O.7μm的Whatman玻璃微纖維過濾器的三層過濾來收集培養(yǎng)液。來自該轉化體的新鮮培養(yǎng)液產生大約70kDa的GH6蛋白的條帶。實施例12:重組棘孢曲霉Cel6A纖維ニ糖水解酶的純化將一升的收獲的培養(yǎng)液(實施例11)使用O.22μm聚醚砜膜(Millipore,Bedford,MA,USA)滅菌過濾。將硫酸銨添加至經過濾的培養(yǎng)液至2M硫酸銨作為終濃度,并施于70mlPHENYLSEPHAROSEFastFlow柱(GEHealthcare,Piscataway,NJ,USA)。用3柱體積2M硫酸銨,然后用5柱體積IM硫酸銨洗滌柱。用20mMHEPESpH7.O中IM硫酸銨至OM硫酸銨的減少鹽梯度(2柱體積)洗脫結合的蛋白。通過使用用INSTANTBLUEStain(ExpedeonProteinSolutions,Cambridge,UK)染色的4-20%NUPAGEBis/Tris,SDS-PAGE凝膠(InvitrogenCorporation,Carlsbad,CA,USA)的SDS-PAGE分析級分。將如通過對應于Cel6A纖維ニ糖水解酶的表觀分子量的65-70kDa條帶的存在判斷的含有棘孢曲霉Cel6A纖維ニ糖水解酶的洗脫物級分收集并脫鹽(500mlSEPHADEXG_25Medium柱,GEHealthcare,Piscataway,NJ,USA)入20mMHEPESpH7.5。將脫鹽的材料施于用20mMHEPESpH7.5平衡的20mlSOURCE15Q柱(GEHealthcare,Piscataway,NJ,USA)。用50mMHEPESpH7·5中OMNaCl至500mMNaCl的鹽梯度(10柱體積)洗脫結合的蛋白。通過使用用INSTANTBLUEStain染色的4-20%NUPAGEBis/Tris,SDS-PAGE凝膠的SDS-PAGE檢查流過物和洗脫物級分。流過物級分含有棘孢曲霉Cel6A纖維ニ糖水解酶,并對其濃縮(VIVASPIN20,IOkDa膜,SartoriusbtedimBiotechb.A.,Auoagne,Franceノ。如通過SDS-PAGE判斷,棘孢曲霉Cel6A纖維ニ糖水解酶為大于90%純。蛋白濃度通過在280nm的吸光度使用I.54(ml)(cm-1)(mg—1)的消光系數(shù)確定。實施例13:重組棘孢曲霉Cel6A纖維ニ糖水解酶對PCS水解的作用在U.S.DepartmentofEnergyNationalRenewableEnergyLaboratory(NREL)使用0.048g硫酸/g干生物質在190°C和25%w/w預處理玉米稻桿大約I分鐘。預處理的玉米秸桿中的水不溶性固形物含有52%纖維素,3.6%半纖維素和29.8%木質素。通過兩階段硫酸水解,接著通過使用NRELStandardAnalyticalProcedure#002的高效液相層析分析糖來確定纖維素和半纖維素。在用硫酸水解纖維素和半纖維素級分之后,使用NRELStandardAnalyticalProcedure#003以重量分析法確定木質素。使用MultiUtilityGrinder(iNNoConceptsInc.,Roswell,GA,USA)研磨預處理的玉米稻桿,并通過配置有450μm濾網(Retsch,Inc.Newtown,PA,USA)的SieveShakerAS200篩選,并在本文中命名為GS-PCS。對根據(jù)實施例12純化的重組棘孢曲霉纖維ニ糖水解酶就其增強由CELLICCtec(可從NovozymesA/S,Bagsvaerd,Denmark獲得的纖維素水解蛋白組合物)水解GS-PCS的能力進行衡量。蛋白濃度通過BCA試劑Kit(Pierce,Rockford,IL,USA)確定。GS-PCS的水解在96孔板中以I.Oml的總反應體積進行。水解用50mg的GS-PCS每ml的含有ImM硫酸錳的50mMこ酸鈉pH5.O緩沖液和3mg的CELLICCtec每克的纖維素和0.6mg的棘孢曲霉纖維ニ糖水解酶每克纖維素以3.6mg蛋白每g纖維素的總加載量進行。水解測定在50°C—式兩份進行72小時。在水解之后,將樣品用0.45μmMultiscreen96孔過濾板(Millipore,Bedford,MA,USA)過濾,在5mMH2SO4中稀釋2倍,并如下所述通過HPLC分析。糖濃度在由含O.05w/w苯甲酸的O.005MH2SO4以O.6ml每分鐘的流速在65°C從4.6x250mmAMINEXHPX-87H柱洗脫之后使用折光率檢測來測量。水解數(shù)據(jù)表示為轉化為葡萄糖的總纖維素的%。纖維素轉化為還原糖的程度使用下式計算轉化(%)=RS(mg,ml)*100*162/(纖維素—*180)=RS(mg/ml)*100バ纖維素(mg/ml)*l.111)在該式中,RS為以葡萄糖當量測量的溶液中還原糖的濃度(mg/ml),而系數(shù)I.111反映了纖維素變?yōu)槠咸烟寝D化中的重量増加。結果說明以O.6mg/g纖維素的棘孢曲霉GH6纖維ニ糖水解酶和以3mg/g纖維素的CELLICCtec在72小時之后產生了64.7%的纖維素轉化,而CELLICCtec本身以3.Omg/g纖維素產生了58.6%的纖維素轉化,CELLICCtec本身以3.6mg/g纖維素產生了66.8%的纖維素轉化,而棘孢曲霉GH6纖維ニ糖水解酶自身以O.6mg/g纖維素產生I%的纖維素轉化。棘孢曲霉GH6纖維ニ糖水解酶在50°C,pH5.O在GS-PCS水解中對CELLICCtec具有協(xié)同效應。實施例13:棘孢曲霉GH6纖維ニ糖水解酶的表征比活件將磷酸溶脹的纖維素(PASC)溶解于含O.01%TWEEN20的50mMこ酸鈉pH5至2.Ig每升。將酶在相同緩沖液中稀釋至一定稀釋范圍。向190μI的PASC溶液添加10μI的每種酶稀釋。將反應在50°C溫育30分鐘,然后用50μI的O.5Μ氫氧化鈉停止反應,接著以800xg離心5分鐘。去除上清,并根據(jù)Lever,1973,Biochem.Med.7:274-287使用對羥基苯甲酸酰肼(PHBAH)測量還原糖。包括了酶對照試劑對照和底物對照。對于4-硝基苯酚鹽產生測量在405nm處的吸光度。棘孢曲霉GH6纖維ニ糖水解酶對PASC的比活性確定為I.6IU/mg。熱穩(wěn)定件將棘抱曲霉GH6纖維ニ糖水解酶在含有O.01%TWEEN20的50mMこ酸鈉pH5中稀釋至Img每ml,然后在50°C溫育3日和60°C溫育3小時和24小吋。將相同的樣品儲藏于4°C以充當対照。在溫育之后,如上所述使用給出小于5%轉化的一個酶加載量來測量樣品對PASC的活性。將樣品在4°C的活性標準化為100%,然后將其他樣品在其他溫育條件的活性與4°C活性相比較。棘孢曲霉GH6纖維ニ糖水解酶的熱穩(wěn)定性如下所/Jnο權利要求1.ー種具有纖維ニ糖水解酶活性的分離的多肽,其選自下組(a)多肽,其包含氨基酸序列,所述氨基酸序列與SEQIDNO:2的成熟多肽具有至少99%同一性;(b)多肽,其由多核苷酸編碼,所述多核苷酸包含核苷酸序列,所述核苷酸序列與SEQIDNO1的成熟多肽編碼序列具有至少99%同一性;(d)多肽,其包含SEQIDNO2的成熟多肽。2.權利要求I的多肽,其由多核苷酸編碼,所述多核苷酸包含于質粒PCR2.1-P6XY,所述質粒包含于大腸桿菌DSM22994。3.—種分離的多核苷酸,其包含核苷酸序列,所述核苷酸序列編碼權利要求I或2的多肽。4.一種重組宿主細胞,其包含權利要求3的多核苷酸,所述多核苷酸可操作地連接于ー種或多種(幾種)指導具有纖維ニ糖水解酶活性的多肽的產生的調控序列。5.—種產生權利要求I或2的多肽的方法,包括(a)培養(yǎng)細胞,其在有助于所述多肽產生的條件下以其野生型形式產生所述多肽;和(b)回收所述多肽。6.—種產生權利要求I或2的多肽的方法,包括(a)在有助于所述多肽產生的條件下培養(yǎng)包含核酸構建體的宿主細胞,所述核酸構建體包含編碼所述多肽的多核苷酸;和(b)回收所述多肽。7.—種產生親本細胞的突變體的方法,包括破壞或缺失編碼權利要求I或2的多肽或其部分的多核苷酸,其導致與親本細胞相比較產生較少所述多肽的突變體。8.—種產生權利要求I或2的多肽的方法,包括(a)在有助于所述多肽產生的條件下培養(yǎng)轉基因植物或植物細胞,其包含編碼所述多肽的多核苷酸;和(b)回收所述多肽。9.ー種轉基因植物、植物部分或植物細胞,其用編碼權利要求I或2的多肽的多核苷酸轉化。10.一種雙鏈抑制性RNA(dsRNA)分子,其包含權利要求3的多核苷酸的亞序列,其中任選地所述dsRNA為siRNA或miRNA分子。11.ー種抑制細胞中具有纖維ニ糖水解酶活性的多肽的表達的方法,包括對細胞施用或在細胞中表達權利要求10的雙鏈抑制性RNA(dsRNA)分子。12.—種分離的多核苷酸,其編碼信號肽,所述信號肽包含SEQIDNO2的氨基酸I至18,或由SEQIDNO2的氨基酸I至18組成。13.—種產生蛋白的方法,包括(a)在有助于所述蛋白產生的條件下,培養(yǎng)重組宿主細胞,所述細胞包含編碼所述蛋白的基因,所述基因可操作地連接于權利要求12的多核苷酸,其中所述基因對所述多核苷酸是外源的;和(b)回收所述蛋白。14.一種組合物,其包含權利要求I或2的多肽。15.—種降解或轉化纖維素材料的方法,包括在權利要求I或2的多肽的存在下用酶組合物處理所述纖維素材料。16.權利要求15的方法,進ー步包括回收經降解的纖維素材料。17.—種產生發(fā)酵產物的方法,包括(a)在權利要求I或2的多肽的存在下用酶組合物糖化纖維素材料;(b)用一種或多種發(fā)酵微生物發(fā)酵經糖化的纖維素材料以產生發(fā)酵產物;和(C)從發(fā)酵回收所述發(fā)酵產物。18.ー種發(fā)酵纖維素材料的方法,包括用一種或多種發(fā)酵微生物發(fā)酵纖維素材料,其中所述纖維素材料是在權利要求I或2的多肽的存在下用酶組合物糖化的。19.權利要求18的方法,其中所述纖維素材料的發(fā)酵產生發(fā)酵產物。20.權利要求19任ー項的方法,進ー步包括從發(fā)酵回收所述發(fā)酵產物。全文摘要本發(fā)明涉及具有纖維二糖水解酶活性的分離的多肽和編碼所述多肽的分離的多核苷酸。本發(fā)明還涉及包含所述多核苷酸的核酸構建體、載體和宿主細胞,以及產生和使用所述多肽的方法。文檔編號C12N15/80GK102666847SQ201080049011公開日2012年9月12日申請日期2010年10月28日優(yōu)先權日2009年10月29日發(fā)明者E.阿巴特,K.布朗,N.斯波德斯伯格申請人:諾維信公司,諾維信股份有限公司