專利名稱:阿拉伯糖呋喃糖苷酶的制作方法
專利說明阿拉伯糖呋喃糖苷酶 發(fā)明領(lǐng)域 本發(fā)明涉及具有α-L-阿拉伯糖呋喃糖苷酶活性的分離多肽和編碼該多肽的分離核酸序列。本發(fā)明也涉及含該核酸序列的核酸構(gòu)建體、載體、宿主細(xì)胞,以及產(chǎn)生和使用該多肽的方法。
背景技術(shù):
阿拉伯糖呋喃糖苷酶能水解α-L-阿拉伯糖苷中的末端非還原性α-L-阿拉伯糖呋喃糖苷殘基,并分類為EC 3.2.1.55。已從多種生物體,包括絲狀真菌中分離了阿拉伯糖呋喃糖苷酶。然而,已知幾乎沒有α-阿拉伯糖呋喃糖苷酶能從雙取代木糖中釋放阿拉伯糖。已經(jīng)描述了一種來自青春雙歧桿菌(Bifidobacterium adolescentis)的胞內(nèi)酶能從雙取代木糖的C3(也就是內(nèi)部)釋放阿拉伯糖(Van Laere,1997,Appl.Microbiol.Biotechnol,47,231-235和Vanden Broek,2005,Applied Microbiology and Biotechnology)。已從大麥分離了對單取代和末端雙取代木糖有活性的酶,但其對內(nèi)部雙取代木糖幾乎沒有活性(Ferre,2000,Eur.J.Biochem.,267,6633-6641)。來自里氏木霉(Trichodermareesei)的酶可能對末端雙取代殘基有活性(觀察到對3,5-二-O-α-L-阿拉伯糖呋喃糖基-α-L-阿拉伯糖呋喃糖苷(3,5-di-O-alpha-Larabinofuranosyl-alpha-L-arabinofuranoside)的活性),但其對具有內(nèi)部C3取代阿拉伯糖的寡底物卻沒有活性(Nogawa,1999,Appl.Environ.Microbiol.,65,3964-3968)。
與全長現(xiàn)有技術(shù)序列比較顯示,SEQ ID NO2所示成熟氨基酸序列與球毛殼菌(Chaetomium globosum)氨基酸序列有72%同源性,其相應(yīng)SEQ IDNO1 DNA序列與相應(yīng)球毛殼菌DNA序列有73%同源性。SEQ ID NO2所示序列與雙歧桿菌屬(Bifidobacterium sp.)的細(xì)菌GH43 α-L-阿拉伯糖呋喃糖苷酶之間的同源性是25%。SEQ ID NO4所示成熟氨基酸序列與黑曲霉(Aspergillus niger)阿拉伯糖呋喃糖苷酶有38%同源性。
發(fā)明概述 本發(fā)明的發(fā)明人分離了來自絲狀真菌特異腐質(zhì)霉(Humicola insolens)(SEQ ID NO2)和巨多孔菌(Meripilus giganteus)(SEQ ID NO4)菌株的α-L-阿拉伯糖呋喃糖苷酶。本發(fā)明的發(fā)明人也分離了編碼新α-L-阿拉伯糖呋喃糖苷酶的基因。該酶是細(xì)胞外的。來自特異腐質(zhì)霉的α-L-阿拉伯糖呋喃糖苷酶屬于GH43家族,來自巨多孔菌的α-L-阿拉伯糖呋喃糖苷酶屬于GH51家族。
來自特異腐質(zhì)霉的α-L-阿拉伯糖呋喃糖苷酶能從雙取代木糖釋放阿拉伯糖,即該α-L-阿拉伯糖呋喃糖苷酶對具有連接至C2和C3的阿拉伯糖的小麥阿拉伯糖木聚糖(arabinoxylan)的木糖單元有活性。對雙取代木糖的活性在將阿拉伯糖木聚糖完全水解為單糖時,例如從生物質(zhì)(biomass)產(chǎn)生乙醇中是必要的。
因此,在第一方面,本發(fā)明提供了源自真菌的阿拉伯糖呋喃糖苷酶,優(yōu)選腐質(zhì)霉屬(Humicola)內(nèi)的菌種,所述阿拉伯糖呋喃糖苷酶能從雙取代木糖釋放阿拉伯糖。
因此,在第二方面,本發(fā)明提供了阿拉伯糖呋喃糖苷酶,其為a)具有SEQ ID NO2所示成熟肽氨基酸序列的多肽,或者可從其通過一個或多個氨基酸的取代、缺失和/或插入而獲得的多肽;b)下述i)或ii)所定義的多肽的類似物,其i)與所述多肽有至少80%同源性,ii)為所述多肽的等位基因變體(allelic variant),c)由核酸序列編碼的多肽,所述核酸序列在高嚴(yán)緊條件下與編碼成熟多肽的SEQ ID NO2核酸序列互補(bǔ)鏈或其具有至少100個核苷酸的亞序列雜交。
因此,在第三方面,本發(fā)明提供了阿拉伯糖呋喃糖苷酶,其為a)具有SEQ ID NO4所示成熟肽氨基酸序列的多肽,或可從其通過一個或多個氨基酸的取代、缺失和/或插入而獲得的多肽;b)下述i)或ii)所定義的多肽的類似物,其i)與所述多肽有至少60%同源性,ii)為所述多肽的等位基因變體,c)由核酸序列編碼的多肽,所述核酸序列在高嚴(yán)緊條件下與編碼成熟多肽的SEQ ID NO2核酸序列互補(bǔ)鏈或其具有至少100個核苷酸的亞序列雜交。
在第四方面,本發(fā)明提供了核酸序列,其包含編碼第一或第二方面的阿拉伯糖呋喃糖苷酶的核酸序列。
在第五方面,本發(fā)明提供了核酸序列,其包括a)DNA序列,其編碼SEQ ID NO2和SEQ ID NO4所示任一阿拉伯糖呋喃糖苷酶,b)DNA序列類似物,其i)與所述任一DNA序列有至少80%同源性,或ii)與所述任一DNA序列互補(bǔ)鏈或其具有至少100個核苷酸的亞序列在高嚴(yán)緊條件下雜交,或iii)為其等位基因變體,或者c)a)或b)的互補(bǔ)鏈。
在第六方面,本發(fā)明提供了核酸序列,其與SEQ ID NO1和SEQ ID NO3所示任一DNA序列有至少80%同源性,或者a)與所述任一DNA序列互補(bǔ)鏈或其具有至少100個核苷酸的亞序列在高嚴(yán)緊條件下雜交的核酸序列,b)為其等位基因變體的核酸序列,或c)a)或b)互補(bǔ)鏈。
在第七方面,本發(fā)明提供了核酸構(gòu)建體,其包含與一個或多個調(diào)控序列可操作連接的第二、第三、第四方面的核酸序列,所述調(diào)控序列能指導(dǎo)阿拉伯糖呋喃糖苷酶在合適表達(dá)宿主中表達(dá)。
在第八方面,本發(fā)明提供了重組表達(dá)載體,其包含第六方面所述核酸構(gòu)建體。
在第九方面,本發(fā)明提供了重組宿主細(xì)胞,其包含第六方面所述核酸構(gòu)建體。
在第九方面,本發(fā)明提供了產(chǎn)生阿拉伯糖呋喃糖苷酶的方法,其包括在有利于產(chǎn)生阿拉伯糖呋喃糖苷酶的條件下培養(yǎng)第九方面的宿主細(xì)胞,和回收阿拉伯糖呋喃糖苷酶。
在第十方面,本發(fā)明提供了包含第一、第二方面的阿拉伯糖呋喃糖苷酶的組合物。
在其它方面,本發(fā)明提供了第一、第二方面的阿拉伯糖呋喃糖苷酶的用途。
附圖簡述
圖1A-C顯示了阿拉伯糖木聚糖聚合物。
圖1A顯示了完整的阿拉伯糖木聚糖。
圖1B顯示了雙取代的阿拉伯糖木聚糖。
圖1C顯示了單取代的阿拉伯糖木聚糖。
圖2A-C顯示了阿拉伯糖木糖寡糖(arabinoxylo-oligosaccharides)。
圖2A顯示了連接于內(nèi)部C-3上的阿拉伯糖基。
圖2B顯示了連接于末端C-3上的阿拉伯糖基。
圖2C顯示了連接于內(nèi)部C-2上的阿拉伯糖基。
發(fā)明詳述 在本發(fā)明第二方面的具體實(shí)施方式
中,分離多肽具有的氨基酸序列與SEQ ID NO2的氨基酸1-558所示氨基酸序列有至少80%同一性。在本發(fā)明感興趣的具體實(shí)施方式
中,多肽與SEQ ID NO2的氨基酸1-558所示氨基酸序列有至少75%,至少85%,至少90%,至少95%,至少96%,至少97%,至少98%,或至少99%同一性。
在本發(fā)明第三方面具體實(shí)施方式
中,分離多肽具有的氨基酸序列與SEQID NO4的氨基酸1-643所示氨基酸序列有至少50%同一性。在本發(fā)明感興趣的具體實(shí)施方式
中,多肽與SEQ ID NO4的氨基酸1-643所示氨基酸序列有至少60%,至少70%,至少80%,至少85%,至少90%,至少95%,至少96%,至少97%,至少98%,或至少99%同一性。
在優(yōu)選具體實(shí)施方式
中,分離多肽具有的氨基酸序列與SEQ ID NO2的氨基酸1-558和SEQ ID NO4的氨基酸1-643所示任一氨基酸序列,相差五個氨基酸,例如相差四個氨基酸,如相差三個氨基酸,相差兩個氨基酸,或相差一個氨基酸。
在本發(fā)明第二方面具體實(shí)施方式
中,分離多肽是能從雙取代的木糖釋放阿拉伯糖的α-L-阿拉伯糖呋喃糖苷酶,例如,所述α-L-阿拉伯糖呋喃糖苷酶對具有連接于C2和C3的阿拉伯糖的小麥阿拉伯糖木聚糖的木糖單元有活性。
序列比對和同源性計算可通過本領(lǐng)域已知的計算機(jī)程序,例如GCG程序包中所提供的GAP來適當(dāng)確定(Program Manual for the Wisconsin Package,Version 8,August 1994,Genetics Computer Group,575 Science Drive,Madison,Wisconsin,USA 53711)(Needleman,S.B.and Wunsch,C.D.,(1970),Journal ofMolecular Biology,48,443-453)。氨基酸序列比較采用下列設(shè)定GAP產(chǎn)生罰分(GAP creation penalty)3.0,GAP延伸罰分0.1。用于同源性測定的氨基酸序列相關(guān)部分為成熟多肽,即不含信號肽。
優(yōu)選地,本發(fā)明多肽包含SEQ ID NO2的氨基酸1-558和SEQ ID NO4的氨基酸1-643所示的任一氨基酸序列,其等位基因變體,或其有阿拉伯糖呋喃糖苷酶活性的片段。很顯然,本發(fā)明多肽也可以由SEQ ID NO2的氨基酸1-558和SEQ ID NO4的氨基酸1-643所示任一氨基酸序列組成。
等位基因變體意味著占據(jù)相同染色體基因座的基因的任意兩種或多種可選形式。等位基因變體通過突變天然產(chǎn)生,并且可導(dǎo)致群體內(nèi)的多態(tài)性。基因突變可以是沉默突變(編碼多肽沒有改變),也可以編碼具有改變的氨基酸序列的多肽。多肽的等位基因變體是由基因的等位變體所編碼的多肽。
在本發(fā)明具體實(shí)施方式
中,分離多肽由下列核酸序列編碼,所述核酸序列在低嚴(yán)緊條件下,優(yōu)選在中嚴(yán)緊條件下,更優(yōu)選在高嚴(yán)緊條件下與(i)SEQID NO1的核苷酸1-1677和SEQ ID NO3的核苷酸46-1974所示任一核酸序列的互補(bǔ)鏈,或(ii)至少100個核苷酸的(i)的亞序列雜交(J.Sambrook,E.F.Fritsch,and T.Maniatus,1989,Molecular Cloning,A Laboratory Manual,2dedition,Cold Spring Harbor,New York)。
SEQ ID NO1的核苷酸1-1677和SEQ ID NO3的核苷酸46-1974所示任一核酸序列互補(bǔ)鏈的亞序列,可為至少100個核苷酸或優(yōu)選至少200個核苷酸。此外,亞序列應(yīng)該編碼具有阿拉伯糖呋喃糖苷酶活性的多肽片段。多肽也可以是具有阿拉伯糖呋喃糖苷酶活性的多肽的等位基因變體或片段。
多肽變體具體包含一個或多個氨基酸的取代、缺失和/或插入。在特定具體實(shí)施方式
中,多肽是具體多肽的熱穩(wěn)定變體。
變體多肽的氨基酸序列可與SEQ ID NO2的氨基酸1-558或SEQ IDNO4的氨基酸1-643的具體氨基酸序列,因插入或缺失一個或多個氨基酸殘基和/或用不同氨基酸殘基取代一個或多個氨基酸殘基而不同。優(yōu)選地,氨基酸改變是次要特性的改變,即不顯著影響蛋白折疊和/或活性的保守氨基酸取代;小的缺失,通常是1至約30個氨基酸;小的氨基或羧基末端延伸,例如氨基末端甲硫氨酸殘基;多至約20-25殘基的小接頭肽;或者通過改變凈電荷或其它功能有利于純化的小延伸,例如聚組氨酸簇(poly-histidine tract)、抗原表位或結(jié)合域。
保守取代的實(shí)例是下列組內(nèi)的取代堿性氨基酸組(精氨酸,賴氨酸和組氨酸),酸性氨基酸組(谷氨酸和天冬氨酸),極性氨基酸組(谷氨酰氨和天冬酰氨),疏水性氨基酸組(亮氨酸,異亮氨酸和纈氨酸),芳香氨基酸組(苯丙氨酸,色氨酸和酪氨酸)以及小氨基酸組(甘氨酸,丙氨酸,絲氨酸,蘇氨酸和甲硫氨酸)。通常不改變特異活性(specific activity)的氨基酸取代是本領(lǐng)域已知的,并例如由H.Neurath and R.L.Hill,1979,In,The Proteins,Academic Press,NewYork描述。最通常發(fā)生的交換是Ala/Ser,Val/Ile,Asp/Glu,Thr/Ser,Ala/Gly,Ala/Thr,Ser/Asn,Ala/Val,Ser/Gly,Tyr/Phe,Ala/Pro,Lys/Arg,Asp/Asn,Leu/Ile,Leu/Val,Ala/Glu和Asp/Gly及它們反過來交換。
本文所指多肽可以包含指定的氨基酸序列,或者它們也可以是其等位基因變體;或其具有相關(guān)酶活性的片段。在一個具體實(shí)施方式
中,多肽包含指定的氨基酸序列或其等位基因變體;或其具有相關(guān)酶活性的片段。在另一具體實(shí)施方式
中,多肽由指定的氨基酸序列或其等位基因變體或其具有相關(guān)酶活性的片段所組成。
指定的氨基酸序列片段是從該氨基酸序列的氨基和/或羧基末端缺失一個或多個氨基酸的多肽。在一個具體實(shí)施方式
中,所述片段包含至少60個氨基酸殘基,或至少68個,或至少70個,或至少75個,或至少100個,或至少150個,或至少160個,或至少170個,或至少180個,或至少190個,或至少200個,或至少210個,或至少220個,或至少240個,或至少260個,或至少280個,或至少300個,或至少310個,或至少320個,或至少330個,或至少334個,或至少350個,或至少375個,或至少400個,或至少425個,或至少430個氨基酸殘基。
等位基因變體意味著占據(jù)相同染色體基因座的基因的任意兩種或多種可選形式。等位基因變體通過突變自然產(chǎn)生,并且可導(dǎo)致群體內(nèi)的多態(tài)性?;蛲蛔兛梢允浅聊蛔?編碼多肽沒有改變),也可以編碼具有改變的氨基酸序列的多肽。多肽的等位基因變體是由基因的等位變體所編碼的多肽。
成熟多肽或成熟氨基酸序列是指將潛在信號肽部分切去后剩下的那部分氨基酸序列。類似地,基因的成熟多肽編碼部分是指相應(yīng)于成熟多肽的那部分基因。
SEQ ID NO1和SEQ ID NO3任一的核酸序列或其亞序列,以及SEQ IDNO2和SEQ ID NO3任一的氨基酸序列或其片段,可用于按照本領(lǐng)域已知方法設(shè)計核酸探針,以從不同屬或種的菌株鑒定和克隆DNA,所述DNA編碼具有阿拉伯糖呋喃糖苷酶活性的多肽。特別地,這些探針能夠用于根據(jù)標(biāo)準(zhǔn)Southern印跡方法與感興趣的屬或種的基因組或cDNA雜交,以鑒定和分離其中的相應(yīng)基因。這些探針可比全長序列短許多,但其長度應(yīng)當(dāng)是至少15,優(yōu)選至少25,更優(yōu)選至少35個核苷酸。也可以使用較長探針。DNA和RNA探針均可使用。通常將探針標(biāo)記以檢測相應(yīng)基因(例如32P,3H,35S,生物素,或抗生物素蛋白)。這些探針包括在本發(fā)明中。
因此,從其它類似生物體制備的基因組DNA或cDNA文庫,可用于篩選與上述探針雜交并且編碼具有阿拉伯糖呋喃糖苷酶活性的多肽的DNA。這些其它生物體的基因組或其它DNA,可以通過瓊脂糖或聚丙烯酰氨凝膠電泳分離,或通過本領(lǐng)域技術(shù)人員已知的其它分離技術(shù)分離。可將來自文庫的DNA或分離DNA轉(zhuǎn)移到并固定至硝化纖維素或其它合適載體材料上。為了鑒定與SEQ ID NO1或SEQ ID NO3或其亞序列同源的克隆或DNA,將載體材料用于Southern印跡。就本發(fā)明而言,雜交顯示核酸序列與SEQ ID NO1和SEQ ID NO3、其互補(bǔ)鏈或其亞序列任一所示核酸序列相應(yīng)的標(biāo)記核酸探針在低至高嚴(yán)緊條件下雜交。在這些條件下與核酸探針雜交的分子用X-射線片來檢測。
在另一感興趣具體實(shí)施方式
中,核酸探針是編碼SEQ ID NO2和SEQ IDNO4任一的(成熟)多肽,或其亞序列的核酸序列。在第三感興趣的具體實(shí)施方式
中,核酸探針是SEQ ID NO1和SEQ ID NO3中的任意一個。在第四感興趣的具體實(shí)施方式
中,核酸探針是SEQ ID NO1和SEQ ID NO3成熟多肽編碼區(qū)中的任意一個。
對于長度至少100個核苷酸的長探針,將低嚴(yán)緊性條件至高嚴(yán)緊性條件定義為,在42℃,在5×SSPE、0.3%SDS、200μg/ml已剪切和變性的鮭精DNA,對于低嚴(yán)緊性25%甲酰胺,對于中嚴(yán)緊性35%甲酰胺,或?qū)τ诟邍?yán)緊性50%甲酰胺中,根據(jù)標(biāo)準(zhǔn)的Southern印跡方法進(jìn)行預(yù)雜交和雜交。
對于長度至少100個核苷酸的長探針,將載體材料最終用2×SSC,0.2%SDS,優(yōu)選至少在50℃(低嚴(yán)緊性),更優(yōu)選至少在55℃(中嚴(yán)緊性),甚至更優(yōu)選至少在65℃(高嚴(yán)緊性)洗滌三次,每次15分鐘。
對于長度大約15個核苷酸至大約70個核苷酸的短探針,將嚴(yán)緊性條件定義為在比用Bolton和McCarthy的計算法(1962,Proceedings of the NationalAcademy of Sciences USA 481390)計算得出的Tm低5℃至10℃,在0.9MNaCl,0.09M Tris-HCl pH7.6,6mM EDTA,0.5%NP-40,1×登哈特溶液(Denhardt′s solution),1mM焦磷酸鈉(sodium pyrophosphate),1mM磷酸二氫鈉(sodium monobasic phosphate),0.1mM ATP和每ml 0.2mg的酵母RNA中,根據(jù)標(biāo)準(zhǔn)的Southern印跡方法進(jìn)行預(yù)雜交、雜交和雜交后洗滌(washingpost-hybridization)。
對于長度大約15個核苷酸至大約70個核苷酸的短探針,將載體材料在6×SSC加0.1%SDS中洗滌一次15分鐘,并用6×SSC在低于計算的Tm 5℃至10℃洗滌兩次,每次15分鐘。
如上所述,本發(fā)明多肽可以是具有SEQ ID NO2和SEQ ID NO4任一氨基酸序列的多肽,或其成熟多肽,其中一個或多個氨基酸被另一(其它)氨基酸所取代,其中一個或多個氨基酸缺失,和/或其中一個或多個氨基酸插入。
優(yōu)選地,氨基酸改變是次要特性的改變,即不顯著影響蛋白折疊和/或活性的保守氨基酸取代;小的缺失,通常為1至約30個氨基酸;小的氨基或羧基末端延伸,例如氨基末端甲硫氨酸殘基;多至約20-25殘基的小接頭肽;或者通過改變凈電荷或其它功能而有利于純化的小延伸,例如聚組氨酸簇、抗原表位或結(jié)合域。
保守取代的實(shí)例是下列組內(nèi)的取代堿性氨基酸組(精氨酸,賴氨酸和組氨酸),酸性氨基酸組(谷氨酸和天冬氨酸),極性氨基酸組(谷氨酰氨和天冬酰氨),疏水性氨基酸組(亮氨酸,異亮氨酸和纈氨酸),芳香氨基酸組(苯丙氨酸,色氨酸和酪氨酸)以及小氨基酸組(甘氨酸,丙氨酸,絲氨酸,蘇氨酸和甲硫氨酸)。通常不改變特異活性的氨基酸取代是本領(lǐng)域已知的,并例如由H .Neurathand R.L.Hill,1979,In,The Proteins,Academic Press,New York描述。最通常發(fā)生的交換是Ala/Ser,Val/Ile,Asp/Glu,Thr/Ser,Ala/Gly,Ala/Thr,Ser/Asn,Ala/Val,Ser/Gly,Tyr/Phe,Ala/Pro,Lys/Arg,Asp/Asn,Leu/Ile,Leu/Val,Ala/Glu和Asp/Gly及它們反過來交換。
通常而言,優(yōu)選本發(fā)明多肽具有的阿拉伯糖呋喃糖苷酶活性是具有SEQID NO2的氨基酸1-558和SEQ ID NO·4的氨基酸1-643任一所示氨基酸序列的多肽的至少20%。特別優(yōu)選的多肽具有的阿拉伯糖呋喃糖苷酶活性是具有SEQ ID NO2的氨基酸1-558和SEQ ID NO4的氨基酸1-643所示任一氨基酸序列的多肽的至少30%,例如至少40%,例如至少50%,優(yōu)選至少60%,如至少70%,例如至少80%,更優(yōu)選至少90%,或至少95%。
本發(fā)明多肽可從任何屬的微生物得到。就本發(fā)明而言,本文所用術(shù)語“從...中得到”連同給出的來源,可指由核酸序列編碼的多肽通過所述來源或通過細(xì)胞產(chǎn)生,其中所述細(xì)胞已經(jīng)插入來自所述來源的核酸序列。在優(yōu)選的實(shí)施方案中,多肽是分泌到細(xì)胞外的。
本發(fā)明多肽可為真菌多肽,更優(yōu)選絲狀真菌多肽,例如枝頂孢霉屬(Acremonium)、曲霉屬(Aspergillus)、短梗霉屬(Aureobasidium)、隱球菌屬(Cryptococcus)、絲梗霉屬(Filibasidium)、鐮孢屬(Fusarium)、腐質(zhì)霉屬(Humicola)、梨孢菌屬(Magnaporthe)、多孔菌屬(Meripilus)、毛霉屬(Mucor)、毀絲霉屬(Myceliophthora)、新考瑪脂霉屬(Neocallimastix)、脈孢菌屬(Neurospora)、擬青霉屬(Paecilomyces)、青霉屬(Penicillium)、瘤胃壺菌屬(Piromyces)、裂殖菌屬(Schizophyllum)、踝節(jié)菌屬(Talaromyces)、嗜熱子囊菌屬(Thermoascus)、梭孢殼屬(Thielavia)、彎頸霉屬(Tolypocladium)或木霉屬(Trichoderma)多肽。
在另一優(yōu)選實(shí)施方案中,多肽是棘孢曲霉(Aspergillus aculeatus),泡盛曲霉(Aspergillus awamori),臭曲霉(Aspergillus foetidus),日本曲霉(Aspergillusjaponicus),構(gòu)巢曲霉(Aspergillus nidulans),黑曲霉(Aspergillus niger),米曲霉(Aspergillus oryzae),桿孢狀鐮孢(Fusarium bactridioides),禾谷鐮孢(Fusariumcerealis),庫威鐮孢(Fusarium crookwellense),大刀鐮孢(Fusarium culmorum),禾本科鐮孢(Fusarium graminearum),禾赤鐮孢(Fusarium graminum),異孢鐮孢(Fusarium heterosporum),合歡木鐮孢(Fusarium negundi),尖孢鐮孢(Fusarium oxysporum),多枝鐮孢(Fusarium reticulatum),粉紅鐮孢(Fusariumroseum),接骨木鐮孢(Fusarium sambucinum),膚色鐮孢(Fusariumsarcochroum),擬分枝孢鐮孢(Fusarium sporotrichioides),硫色鐮孢(Fusariumsulphureum),圓鐮孢(Fusarium torulosum),擬絲孢鐮孢(Fusariumtrichothecioides),鑲片鐮孢(Fusarium venenatum),特異腐質(zhì)霉(Humicolainsolens),疏棉狀腐質(zhì)霉(Humicola lanuginosa),巨多孔菌(Meripilus giganteus).米赫毛霉(Mucor miehei),嗜熱毀絲霉(Myceliophthora thermophila),粗糙脈孢菌(Neurospora crassa),產(chǎn)紫青霉(Penicillium purpurogenum),哈茨木霉(Trichoderma harzianum),康寧木霉(Trichoderma koningii),長枝木霉(Trichoderma longibrachiatum),里氏木霉(Trichoderma reesei),或綠色木霉(Trichoderma viride)多肽。
在本發(fā)明優(yōu)選的實(shí)施方案中,本發(fā)明多肽源自子囊菌門(Ascomycota)菌株,例如腐質(zhì)霉屬(Humicola),如疏棉狀腐質(zhì)霉、棕黑腐質(zhì)霉(H.fuscoatra)、灰色腐質(zhì)霉(H.grisea)、藤黃腐質(zhì)霉(H.lutea)、黑腐質(zhì)霉(H.nigrescens)、以及特別是特異腐質(zhì)霉,或者是源自擔(dān)子菌門(Basidiomycota)菌株,例如多孔菌屬(Meripilus),如巨多孔菌。
可以理解,對于上述菌種,本發(fā)明包括其完全階段和不完全階段以及其他分類學(xué)上的等同物,例如無性型,而不管它們的已知種名。本領(lǐng)域的技術(shù)人員將容易地辨別適當(dāng)?shù)韧锏耐恍浴?br>
這些菌種的菌株容易地被公眾在許多培養(yǎng)物保藏中心獲得,諸如美國典型培養(yǎng)物保藏中心(the American Type Culture Collection)(ATCC)、德國微生物和細(xì)胞培養(yǎng)物保藏中心(Deutsche Sammlung von Mikroorganismen undZellkulturen GmbH)(DSM)、荷蘭微生物保藏中心(Centraalbureau VoorSchimmelcultures)(CBS)和美國農(nóng)業(yè)研究菌種保藏中心(Agricultural ResearchService Patent Culture Collection,Northern Regional Research Center)(NRRL)。
在本發(fā)明特別優(yōu)選實(shí)施方式中,本發(fā)明多肽源自WO9117243中所記載的特異腐質(zhì)霉菌株,其根據(jù)布達(dá)佩斯條約規(guī)定于1980年4月14日以DSM號1800保藏于德國微生物和細(xì)胞培養(yǎng)物保藏中心(DSM,Deutsche Sammlung vonMikroorganismen und Zellkulturen)
德國。
在本發(fā)明第二特別優(yōu)選的實(shí)施方式中,本發(fā)明多肽源自巨多孔菌特定菌株,該菌株在荷蘭微生物保藏中心(CBS),Uppsalalaan 8,3584 CT Utrecht,TheNetherlands(或者,P.O.Box 85167,3508 AD Utrecht,The Netherlands)具有登錄號CBS 521.95。
此外,用上述探針可從其它資源,包括從自然界(例如土壤、堆肥、水等)分離的微生物來鑒定和獲得這些多肽。從自然環(huán)境分離微生物的技術(shù)是本領(lǐng)域眾所周知的。然后通過類似地篩選其它微生物基因組或cDNA文庫來獲得核酸序列。一旦用探針檢測到編碼多肽的核酸序列,該序列就可用本領(lǐng)域普通技術(shù)人員已知的技術(shù)分離或克隆(參見例如,Sambrook等,1989,見前文)。
由本發(fā)明核酸序列編碼的多肽也包括另一多肽融合在該多肽或其片段N-末端或C-末端的融合多肽或可切割融合多肽。融合多肽可通過將編碼另一多肽的核酸序列(或其部分)融合于本發(fā)明核酸序列(或其部分)來制備。制備融合多肽的技術(shù)是本領(lǐng)域已知的,包括將編碼多肽的編碼序列連接以使它們位于框中,并且使融合多肽的表達(dá)在相同啟動子和終止子的控制下。
核酸序列 本發(fā)明也涉及編碼本發(fā)明多肽的分離核酸序列。
在一個感興趣的實(shí)施方式中,核酸序列與SEQ ID NO1的核苷酸1-1677和SEQ ID NO2的核苷酸46-1974所示任一核酸序列有至少80%同一性。優(yōu)選地,核酸序列與SEQ ID NO1的核苷酸1-1677和SEQ ID NO2的核苷酸46-1974所示任一核酸序列有至少至少85%,至少90%,至少95%,至少96%,至少97%,至少98%,或至少99%同一性。在本發(fā)明另一感興趣的實(shí)施方式中,核酸序列包含SEQ ID NO1的核苷酸1-1677所示氨基酸序列,其等位基因變體,或其能編碼本發(fā)明多肽的片段中的任何一種。顯然,核酸序列可由SEQ ID NO1的核苷酸1-1677和SEQ ID NO3的核苷酸46-1974所示的任一氨基酸序列所組成。
本發(fā)明也包括核酸序列,其編碼具有SEQ ID NO2或SEQ ID NO4任一氨基酸序列的多肽或其成熟多肽,由于遺傳密碼簡并性,所述核酸序列不同于SEQ ID NO1或SEQ ID NO3序列。本發(fā)明也涉及SEQ ID NO1或SEQ IDNO3的亞序列,所述亞序列編碼SEQ ID NO2或SEQ ID NO4具有阿拉伯糖呋喃糖苷酶活性的片段。SEQ ID NO1或SEQ ID NO3的亞序列是SEQ IDNO1的核苷酸1-1677或SEQ ID NO3的核苷酸46-1974包含的核酸序列,只是從5′和/或3′端缺失一個或多個核苷酸。
本發(fā)明也涉及編碼本發(fā)明多肽的分離核酸序列,所述核酸序列在低嚴(yán)緊條件下,優(yōu)選在中嚴(yán)緊條件下,更優(yōu)選在高嚴(yán)緊條件下,與(i)SEQ ID NO1核苷酸1-1677和SEQ ID NO3的核苷酸46-1974所示任一核酸序列的互補(bǔ)鏈,或(ii)(i)的至少100個核苷酸的亞序列雜交。本發(fā)明也涉及(i),(ii),和(iii)的互補(bǔ)鏈。
用于分離或克隆編碼多肽的核酸序列的技術(shù)是本領(lǐng)域已知的,包括從基因組DNA分離、從cDNA制備或兩者組合。將本發(fā)明核酸序列從這種基因組DNA克隆,可能通過例如使用熟知的聚合酶鏈?zhǔn)椒磻?yīng)(PCR)或篩選表達(dá)文庫的抗體以檢測具有共有結(jié)構(gòu)特征的克隆DNA片段的來實(shí)現(xiàn)。參見,例如,Innis et al.,1990,PCRA Guide to Methods and Application,Academic Press,New York。也可使用其它核酸擴(kuò)增法,例如連接酶鏈?zhǔn)椒磻?yīng)(ligase chainreaction,LCR),連接激活轉(zhuǎn)錄(ligated activated transcription,LAT)和基于核酸序列的擴(kuò)增(nucleic acid sequence-based amplification,NASBA)。核酸序列可從特異腐質(zhì)霉菌株或巨多孔菌菌株,或者其它或相關(guān)生物體克隆,例如,可以是該核酸序列多肽編碼區(qū)的等位基因變體或種屬變體(species variant)。
分離核酸序列,例如能夠通過在遺傳工程中使用的標(biāo)準(zhǔn)克隆方法獲得,該方法將核酸序列從其天然位置重新定位至將其再生的不同位點(diǎn)。該克隆方法可涉及將包含編碼多肽的核酸序列的期望核酸片段剪切和分離,將所述片段插入至載體分子,以及將重組載體整合至其中核酸序列的多拷貝或克隆將會復(fù)制的宿主細(xì)胞。核酸序列可以是基因組,cDNA,RNA,半合成,或合成來源的,或它們的任意組合。
就本發(fā)明而言,兩核酸序列之間的同一性程度如上所述確定。
對于合成與所述多肽基本相似的多肽而言,修飾本發(fā)明多肽的編碼核酸序列是必需的。術(shù)語與所述多肽“基本相似”是指多肽的非天然存在形式。這些多肽可與從天然來源分離的多肽在某些工程方式上不同,例如在比活、熱穩(wěn)定性、最適pH等方面不同的變體。變體序列可基于SEQ ID NO1多肽編碼部分所示核酸序列,例如其亞序列來構(gòu)建,和/或通過引入核苷酸取代來構(gòu)建,所述核苷酸取代不產(chǎn)生由核酸序列編碼多肽的其它氨基酸序列,但符合用于產(chǎn)生所述酶的宿主生物體的密碼子選擇,或通過引入可產(chǎn)生不同氨基酸序列的核苷酸取代來構(gòu)建。對于核苷酸取代的概括描述,參見例如Ford et al.,1991,Protein Expression and Purification 295-107。
本領(lǐng)域技術(shù)人員顯而易見,這些取代可在分子功能的關(guān)鍵區(qū)外進(jìn)行而仍將產(chǎn)生活性多肽。對于由本發(fā)明的分離核酸序列編碼的多肽活性必需的氨基酸殘基(因此優(yōu)選不對所述殘基進(jìn)行取代),可通過本領(lǐng)域已知方法來鑒定,例如定位誘變(site-directed mutagenesis)或丙氨酸分區(qū)誘變(alanine-scanningmutagenesis)(參見例如,Cunningham and Wells,1989,Science 2441081-1085)。在后一技術(shù)中,在分子中每個帶正電荷的殘基處引入突變,然后測試所得突變分子的阿拉伯糖呋喃糖苷酶活性以鑒定對于所述分子活性關(guān)鍵的氨基酸殘基。底物-酶相互作用的位點(diǎn)也可通過三維結(jié)構(gòu)分析來確定,例如通過諸如核磁共振分析、結(jié)晶學(xué)或光親和標(biāo)記技術(shù)來確定(參見例如,de Vos et al.,1992,Science 255306-312;Smith et al.,1992,Journal of Molecular Biology 224899-904;Wlodaver et al.,1992,F(xiàn)EBS Letters 30959-64)。
核酸構(gòu)建體 本發(fā)明也涉及包含本發(fā)明核酸序列的核酸構(gòu)建體,所述本發(fā)明核酸序列與一個或多個調(diào)控序列可操作連接,所述調(diào)控序列能指導(dǎo)所述多肽在合適宿主細(xì)胞中的表達(dá)。
可以各種方式操作編碼本發(fā)明多肽的分離核酸序列以提供所述多肽的表達(dá)。核酸序列插入載體之前的操作可能是期望的或必需的,這取決于表達(dá)載體。用重組DNA方法修飾核酸序列的技術(shù)是本領(lǐng)域眾所周知的。
調(diào)控序列包括對本發(fā)明多肽表達(dá)必需或有益的所有元件。每一調(diào)控序列對于編碼多肽的核酸序列可以是天然或異源的。這樣的調(diào)控序列包括,但不限于前導(dǎo)序列,聚腺苷酸化序列,前肽序列,啟動子,信號肽序列,和轉(zhuǎn)錄終止子。最低限度,調(diào)控序列包括啟動子,以及轉(zhuǎn)錄和翻譯的終止信號。調(diào)控序列可與接頭一起提供,以引入有利于調(diào)控序列與編碼多肽的核酸序列編碼區(qū)連接的特定限制位點(diǎn)。
調(diào)控序列可以是合適的啟動子序列——被宿主細(xì)胞識別用于核酸序列表達(dá)的核酸序列。啟動子序列包含介導(dǎo)多肽表達(dá)的轉(zhuǎn)錄調(diào)控序列。啟動子可以是在所選擇宿主細(xì)胞中顯示轉(zhuǎn)錄活性的任何核酸序列,包括突變、截短和雜合啟動子,并可獲自與宿主細(xì)胞同源或異源的編碼胞外或胞內(nèi)多肽的基因。
指導(dǎo)本發(fā)明核酸構(gòu)建體轉(zhuǎn)錄,特別是在細(xì)菌宿主細(xì)胞中轉(zhuǎn)錄的合適啟動子的實(shí)例,為獲自大腸桿菌(E.coli)lac操縱子,天藍(lán)色鏈霉菌(Streptomycescoelicolor)瓊脂酶基因(dagA),枯草芽孢桿菌(Bacillus subtilis)果聚糖蔗糖酶基因(sacB),地衣芽孢桿菌(Bacillus licheniformis)α-淀粉酶基因(amyL),嗜熱脂肪芽孢桿菌(Bacillus stearothermophilus)產(chǎn)麥芽糖淀粉酶基因(amyM),解淀粉芽孢桿菌(Bacillus amyloliquefaciens)α-淀粉酶基因(amyQ),地衣芽孢桿菌青霉素酶基因(penP),枯草芽孢桿菌xylA和xylB基因,和原核β-內(nèi)酰胺酶基因的啟動子(Villa-Kamaroff et al.,1978,Proceedings of the National Academy ofSciences USA 753727-3731),以及tac啟動子(DeBoer et al.,1983,Proceedingsof the National Academy of Sciences USA 8021-25)。更多的啟動子在″Usefulproteins from recombinant bacteria″in Scientific American,1980,24274-94;andin Sambrook et al.,1989,見前文,中有記載。
指導(dǎo)本發(fā)明核酸構(gòu)建體在絲狀真菌宿主細(xì)胞中轉(zhuǎn)錄的合適啟動子實(shí)例,為獲自下列酶的基因的啟動子米曲霉TAKA淀粉酶、曼赫根毛霉(Rhizomucormiehei)天冬氨酸蛋白酶、黑曲霉中性α-淀粉酶、黑曲霉酸穩(wěn)定性α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、曼赫根毛霉脂肪酶、米曲霉堿性蛋白酶、米曲霉磷酸丙糖異構(gòu)酶、構(gòu)巢曲霉乙酰胺酶、和尖孢鐮孢胰蛋白酶樣蛋白酶(WO 96/00787),以及NA2-tpi啟動子(來自黑曲霉中性α-淀粉酶和米曲霉磷酸丙糖異構(gòu)酶基因的雜合啟動子);及其突變、截短和雜合的啟動子。
在酵母宿主中,有用的啟動子從下列酶的基因中得到釀酒酵母(Saccharomyces cerevisiae)烯醇酶(enolase)(ENO-1)、釀酒酵母半乳糖激酶(galactokinase)(GAL1)、釀酒酵母醇脫氫酶(alcohol dehydrogenase)/3-磷酸甘油醛脫氫酶(glyceraldehyde-3-phosphate dehydrogenase)(ADH2/GAP)、和釀酒酵母3-磷酸甘油酸激酶(3-phosphoglycerate kinase)。酵母宿主細(xì)胞的其他有用的啟動子在Romanos et al.,1992,Yeast 8423-488中描述。
所述調(diào)控序列也可為合適的轉(zhuǎn)錄終止序列,即由宿主細(xì)胞識別以終止轉(zhuǎn)錄的序列。所述終止序列可操作地與編碼多肽的核酸序列3’端連接。任何在所選宿主細(xì)胞中有功能的終止子都可用于本發(fā)明。
絲狀真菌宿主細(xì)胞的優(yōu)選終止子得自如下酶的基因米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、構(gòu)巢曲霉鄰氨基苯甲酸合酶(anthranilate synthase)、黑曲霉α-葡萄糖苷酶(alpha-glucosidase)和尖孢鐮孢胰蛋白酶樣蛋白酶。
對于酵母宿主細(xì)胞優(yōu)選的終止子得自如下酶的基因釀酒酵母烯醇酶、釀酒酵母細(xì)胞色素C(cytochrome C)(CYC1)和釀酒酵母3-磷酸甘油醛脫氫酶。酵母宿主細(xì)胞的其他有用終止子在前述Romanos et al.,1992中描述。
所述調(diào)控序列也可為合適的前導(dǎo)序列,即對宿主細(xì)胞翻譯重要的mRNA非翻譯區(qū)。所述前導(dǎo)序列可操作地與編碼多肽的核酸序列5’端連接。任何在所選宿主細(xì)胞中有功能的前導(dǎo)序列都可用于本發(fā)明。
對于絲狀真菌宿主細(xì)胞優(yōu)選的前導(dǎo)序列得自米曲霉TAKA淀粉酶和構(gòu)巢曲霉磷酸丙糖異構(gòu)酶的基因。
對于酵母宿主細(xì)胞合適的前導(dǎo)序列得自如下酶的基因釀酒酵母烯醇酶(ENO-1)、釀酒酵母3-磷酸甘油酸激酶、釀酒酵母α-因子和釀酒酵母醇脫氫酶/3-磷酸甘油醛脫氫酶(ADH2/GAP)。
所述調(diào)控序列也可為聚腺苷酸化序列,即可操作地與核酸序列3’端連接的序列,而且在轉(zhuǎn)錄時,其被宿主細(xì)胞識別為將聚腺苷殘基添加于轉(zhuǎn)錄mRNA的信號。任何在所選宿主細(xì)胞中有功能的聚腺苷酸化序列都可用于本發(fā)明。
對于絲狀真菌宿主細(xì)胞優(yōu)選的聚腺苷酸化序列得自如下酶的基因米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、構(gòu)巢曲霉鄰氨基苯甲酸合酶、尖孢鐮孢胰蛋白酶樣蛋白酶和黑曲霉α-葡萄糖苷酶。
對于酵母宿主細(xì)胞有用的聚腺苷酸化序列在Guo and Sherman,1995,Molecular Cellular Biology 155983-5990中描述。
所述調(diào)控序列也可為信號肽編碼區(qū),所述信號肽編碼區(qū)編碼與多肽氨基末端連接的氨基酸序列,并且指導(dǎo)所編碼的多肽進(jìn)入細(xì)胞的分泌途徑。所述核酸序列的編碼序列5′端,可固有包含信號肽編碼區(qū),所述信號肽編碼區(qū)與編碼分泌多肽的編碼區(qū)的區(qū)段以符合翻譯可讀框的方式天然連接??商鎿Q地,編碼序列5′端可包含編碼序列外源的信號肽編碼區(qū)。當(dāng)編碼序列天然不含信號肽編碼區(qū)時,可能需要外源信號肽編碼區(qū)。可替換地,外源信號肽編碼區(qū)可簡單替換天然信號肽編碼區(qū),以增強(qiáng)多肽的分泌。然而,任何指導(dǎo)表達(dá)多肽進(jìn)入所選宿主細(xì)胞分泌途徑的信號肽編碼區(qū)都可用于本發(fā)明。
對于細(xì)菌宿主細(xì)胞有效的信號肽編碼區(qū)是得自如下酶的基因的信號肽編碼區(qū)芽孢桿菌屬(Bacillus)NCIB 11837產(chǎn)麥芽糖淀粉酶、嗜熱脂肪芽孢桿菌α-淀粉酶、地衣芽孢桿菌枯草桿菌蛋白酶、地衣芽孢桿菌β-內(nèi)酰胺酶、嗜熱脂肪芽孢桿菌中性蛋白酶基因(nprT,nprS,nprM)和枯草芽孢桿菌prsA。更多的信號肽由Simonen和Palva,1993,Microbiological Reviews 57109-137描述。
對于絲狀真菌宿主細(xì)胞有效的信號肽編碼區(qū)是得自如下酶的基因的信號肽編碼區(qū)米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、曼赫根毛霉天冬氨酸蛋白酶、特異腐質(zhì)霉纖維素酶和疏棉狀腐質(zhì)霉脂肪酶。
對于酵母宿主細(xì)胞有用的信號肽得自釀酒酵母α-因子(alpha-factor)和釀酒酵母轉(zhuǎn)化酶(invertase)的基因。其他有用的信號肽編碼區(qū)由Romanos et al.,1992描述,見前文。
所述調(diào)控序列也可為前肽編碼區(qū),所述前肽編碼區(qū)編碼位于多肽氨基末端的氨基酸序列。所得多肽稱為前酶(proenzyme)或前多肽(propolypeptide)(或有些情況下稱為酶原(zymogen))。前多肽通常是無活性的,并可通過從前多肽催化或自催化切割前肽來轉(zhuǎn)化為成熟活性多肽。前肽編碼區(qū)可得自如下酶的基因枯草芽孢桿菌堿性蛋白酶(aprE),枯草芽孢桿菌中性蛋白酶(nprT)、釀酒酵母α-因子、曼赫根毛霉天冬氨酸蛋白酶和嗜熱毀絲霉漆酶(laccase)(WO95/33836)。
當(dāng)信號肽區(qū)和前肽區(qū)都存在于多肽氨基末端時,前肽區(qū)位于緊接著多肽的氨基末端,而信號肽區(qū)位于緊接著前肽區(qū)的氨基末端。
可能也期望添加允許調(diào)節(jié)與宿主細(xì)胞生長相關(guān)的多肽表達(dá)的調(diào)節(jié)序列。調(diào)節(jié)系統(tǒng)的實(shí)例是那些響應(yīng)化學(xué)或物理刺激,包括在調(diào)節(jié)化合物存在的情況下,使所述基因表達(dá)開啟或關(guān)閉的調(diào)節(jié)系統(tǒng)。在原核系統(tǒng)中,調(diào)節(jié)系統(tǒng)包括lac,tac,和trp操縱基因系統(tǒng)。在酵母中,可采用ADH2系統(tǒng)或GAL1系統(tǒng)。在絲狀真菌中,TAKAα-淀粉酶啟動子、黑曲霉葡糖淀粉酶啟動子和米曲霉葡糖淀粉酶啟動子可用作調(diào)節(jié)序列。調(diào)節(jié)序列的其他實(shí)例是那些允許基因擴(kuò)增的調(diào)節(jié)序列。在真核系統(tǒng)中,這些包括在甲氨喋呤(methotrexate)存在下擴(kuò)增的二氫葉酸還原酶(dihydrofolate reductase)基因,和在重金屬存在下擴(kuò)增的金屬硫蛋白(metallothionein)基因。在這些情況下,編碼多肽的核酸序列可操作地與調(diào)節(jié)序列連接。
表達(dá)載體 本發(fā)明也涉及包含本發(fā)明核酸序列、啟動子以及轉(zhuǎn)錄和翻譯終止信號的重組表達(dá)載體??蓪⑸鲜龆喾N核酸和調(diào)控序列連接在一起以產(chǎn)生重組表達(dá)載體,所述重組表達(dá)載體可包括一個或多個方便的限制酶切位點(diǎn),以允許編碼多肽的核酸序列在這些位點(diǎn)上的插入或取代??商鎿Q地,本發(fā)明核酸序列可通過將所述核酸序列或含該序列的核酸構(gòu)建體插入至合適的表達(dá)載體來進(jìn)行表達(dá)。在構(gòu)建所述表達(dá)載體的過程中,編碼序列位于所述載體中以使編碼序列與合適的表達(dá)調(diào)控序列可操作地連接。
重組表達(dá)載體可為能夠方便地進(jìn)行重組DNA方法并且能夠使核酸序列表達(dá)的任何載體(例如,質(zhì)?;虿《?。載體的選擇通常取決于載體與該載體將導(dǎo)入的宿主細(xì)胞之間的相容性。載體可為線性或閉合環(huán)狀質(zhì)粒。
載體可為自主復(fù)制載體,即作為染色體外實(shí)體存在、其復(fù)制不依賴于染色體復(fù)制的載體,例如質(zhì)粒、染色體外元件(element)、微型染色體(minichromosome)或人工染色體。載體可包含確保自復(fù)制的任何元件??商鎿Q地,載體是當(dāng)其導(dǎo)入宿主細(xì)胞時,其整合入基因組并與所整合染色體一起復(fù)制的載體。此外,可采用單載體或質(zhì)粒,或者兩個或更多個載體或質(zhì)粒,或者轉(zhuǎn)座子(transposon),所述兩個或更多個載體或質(zhì)粒一起含有待導(dǎo)入宿主細(xì)胞基因組的總DNA。
本發(fā)明載體優(yōu)選包含一個或多個允許容易選擇轉(zhuǎn)化細(xì)胞的可選擇標(biāo)記??蛇x擇標(biāo)記為基因,該基因的產(chǎn)物提供殺生物劑或病毒抗性、對重金屬的抗性、對營養(yǎng)缺陷型的原養(yǎng)等。細(xì)菌選擇標(biāo)記的實(shí)例為來自枯草芽孢桿菌或地衣芽孢桿菌的dal基因,或賦予抗生素抗性,例如氨芐青霉素、卡那霉素、氯霉素或四環(huán)素抗性的標(biāo)記。對于酵母宿主細(xì)胞合適的標(biāo)記為ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于絲狀真菌宿主細(xì)胞的可選擇標(biāo)記,包括但不限于amdS(乙酰胺酶)、argB(鳥氨酸氨甲?;D(zhuǎn)移酶(ornithinecarbamoyltransferase))、bar(膦絲菌素乙?;D(zhuǎn)移酶(phosphinothricinacetyltransferase))、hygB(潮霉素磷酸轉(zhuǎn)移酶(hygromycin phosphotransferase))、niaD(硝酸鹽還原酶(nitrate reductase))、pyrG(乳清酸核苷-5’-磷酸脫羧酶(orotidine-5′-phosphate decarboxylase))、sC(硫酸腺苷?;D(zhuǎn)移酶(sulfateadenyltransferase))、trpC(鄰氨基苯甲酸合酶),以及其等同物。優(yōu)選用于曲霉屬細(xì)胞的標(biāo)記是構(gòu)巢曲霉或米曲霉的amdS和pyrG基因以及吸水鏈霉菌(Streptomyces hygroscopicus)的bar基因。
本發(fā)明載體優(yōu)選含有元件,所述元件允許載體穩(wěn)定整合入宿主細(xì)胞基因組或允許所述載體在細(xì)胞中獨(dú)立于基因組自主復(fù)制。
為了整合入宿主細(xì)胞基因組,載體可依賴于編碼多肽的核酸序列或通過同源或非同源重組將載體穩(wěn)定整合至基因組的任何其它載體元件??商鎿Q地,所述載體可包含指導(dǎo)通過同源重組整合入宿主細(xì)胞基因組的額外核酸序列。所述額外核酸序列使載體能在染色體精確位置整合入宿主細(xì)胞基因組。為了提高精確位置整合可能性,整合元件應(yīng)優(yōu)選含有足夠數(shù)量的核酸,如100-1,500個堿基對,優(yōu)選400-1,500個堿基對,最優(yōu)選800-1,500個堿基對,所述核酸與相應(yīng)靶序列高度同源,以增加同源重組的可能性。整合元件可以為與宿主細(xì)胞基因組中靶序列同源的任何序列。
此外,整合元件可為非編碼或編碼核酸序列。另一方面,載體可通過非同源重組整合入宿主細(xì)胞的基因組。
為了自我復(fù)制,載體可進(jìn)一步包含使載體能在所述宿主細(xì)胞中自主復(fù)制的復(fù)制起點(diǎn)。細(xì)菌復(fù)制起點(diǎn)的實(shí)例為允許在大腸桿菌中復(fù)制的質(zhì)粒pBR322,pUC19,pACYC177,和pACYC184的復(fù)制起點(diǎn),和允許在芽孢桿菌屬中復(fù)制的質(zhì)粒pUB110,pE194,pTA1060,和pAMβ1的復(fù)制起點(diǎn)。酵母宿主細(xì)胞中使用的復(fù)制起點(diǎn)實(shí)例為2 micron復(fù)制起點(diǎn)、ARS1、ARS4、ARS1與CEN3的組合、以及ARS4與CEN6的組合。復(fù)制起點(diǎn)可為具有突變的復(fù)制起點(diǎn),所述突變使其功能在宿主細(xì)胞中是溫度敏感的(參見例如,Ehrlich,1978,Proceedings of the National Academy of Sciences USA 751433)。
可將多于一個拷貝的本發(fā)明核酸序列插入宿主細(xì)胞以增加基因產(chǎn)物的產(chǎn)生。核酸序列拷貝數(shù)的增加可通過將序列的至少一個額外拷貝整合入宿主細(xì)胞基因組而獲得,或者通過將帶有核酸序列的可擴(kuò)增選擇標(biāo)記基因包括在其中而獲得,其中含有選擇標(biāo)記基因的擴(kuò)增拷貝的細(xì)胞(并因而核酸序列的額外拷貝),可在合適的選擇劑存在下通過培養(yǎng)細(xì)胞來選擇。
用于連接上述元件以構(gòu)建本發(fā)明重組表達(dá)載體的方法是本領(lǐng)域技術(shù)人員所熟知的(參見例如,Sambrook et al.,1989,見前文)。
宿主細(xì)胞 本發(fā)明也涉及包含本發(fā)明核酸序列的重組宿主細(xì)胞,所述重組宿主細(xì)胞可有利地用于多肽的重組生產(chǎn)。
將包含本發(fā)明核酸序列的載體引入宿主細(xì)胞,以使所述載體作為染色體整合體保留,或作為自復(fù)制的染色體外載體保留,如前文所述。宿主細(xì)胞的選擇在很大程度上取決于編碼所述多肽的基因及其來源。
宿主細(xì)胞可為單細(xì)胞微生物,例如原核生物,或非單細(xì)胞微生物,例如真核生物。
有用的單細(xì)胞為細(xì)菌細(xì)胞,例如革蘭氏陽性細(xì)菌,包括但不限于芽孢桿菌屬細(xì)胞,例如嗜堿芽孢桿菌(Bacillus alkalophilus),解淀粉芽孢桿菌,短芽孢桿菌(Bacillus brevis),環(huán)狀芽胞桿菌(Bacillus circulans),克勞氏芽孢桿菌(Bacillus clausii),凝結(jié)芽孢桿菌(Bacillus coagulans),燦爛芽孢桿菌(Bacilluslautus),遲緩芽孢桿菌(Bacillus lentus),地衣芽孢桿菌(Bacillus licheniformis),巨大芽孢桿菌(Bacillus megaterium),嗜熱脂肪芽孢桿菌(Bacillusstearothermophilus),枯草芽孢桿菌(Bacillus subtilis),和蘇云金芽孢桿菌(Bacillus thuringiensis);或者鏈霉菌屬細(xì)胞,例如淺青紫鏈霉菌(Streptomyceslividans)或鼠灰鏈霉菌(Streptomyces murinus);或者革蘭氏陰性細(xì)菌,例如大腸桿菌和假單胞菌屬菌種(Pseudomonas sp.)。在優(yōu)選的實(shí)施方式中,細(xì)菌宿主細(xì)胞為遲緩芽孢桿菌、地衣芽孢桿菌、嗜熱脂肪芽孢桿菌或枯草芽孢桿菌細(xì)胞。在另一優(yōu)選實(shí)施方式中,芽孢桿菌屬細(xì)胞是嗜堿的芽孢桿菌。
將載體導(dǎo)入細(xì)菌宿主細(xì)胞可通過,例如原生質(zhì)體轉(zhuǎn)化(參見例如,Changand Cohen,1979,Molecular General Genetics 168111-115)、使用感受態(tài)細(xì)胞(參見例如,Young and Spizizin,1961,Journal of Bacteriology 81823-829,或Dubnau and Davidoff-Abelson,1971,Journal of Molecular Biology 56209-221)、電穿孔(參見例如,Shigekawa and Dower,1988,Biotechniques 6742-751)、或接合(參見例如,Koehler and Thorne,1987,Journal of Bacteriology1695771-5278)來實(shí)現(xiàn)。
所述宿主細(xì)胞可為真核生物,例如哺乳動物、昆蟲、植物或真菌細(xì)胞。在優(yōu)選的實(shí)施方式中,宿主細(xì)胞為真菌細(xì)胞。本文所用“真菌”包括子囊菌門(Ascomycota),擔(dān)子菌門(Basidiomycota),壺菌門(Chytridiomycota)和接合菌門(Zygomycota)(如Hawksworth et al.,In,Ainsworth and Bisby’s Dictionary ofThe Fungi,8th edition,1995,CAB International,University Press,Cambridge,UK中所定義),以及卵菌門(Oomycota)(如在Hawksworth et al.,1995,見前文,171頁所引用的)和所有有絲分裂孢子真菌(Hawksworth et al.,1995,見前文)。
在更優(yōu)選的實(shí)施方案中,所述真菌宿主細(xì)胞是酵母細(xì)胞。本文所用“酵母”,包括產(chǎn)子囊酵母(ascosporogenous yeast)(內(nèi)孢霉目(Endomycetales))、產(chǎn)擔(dān)子酵母(basidiosporogenous yeast)和屬于半知菌類(Fungi Imperfecti)(芽孢綱(Blastomycetes))的酵母。由于酵母的分類在將來可能變化,所以就本發(fā)明而言,將酵母定義為如Biology and Activities of Yeast(Skinner,F(xiàn).A.,Passmore,S.M.和Davenport,R.R.,eds,Soc.App.Bacteriol.Symposium Series No.9,1980)中所描述的。
在甚至更優(yōu)選的實(shí)施方案中,所述的酵母宿主細(xì)胞是假絲酵母屬(Candida)、漢遜酵母屬(Hansenula)、克魯維酵母屬(Kluyveromyces)、畢赤酵母屬(Pichia)、酵母屬(Saccharomyces)、裂殖酵母屬(Schizosaccharomyces)或西洋蓍霉(Yarrowia)細(xì)胞。
在最優(yōu)選的實(shí)施方案中,所述酵母宿主細(xì)胞是卡爾酵母(Saccharomycescarlsbergensis)、釀酒酵母(Saccharomyces cerevisiae)、糖化酵母(Saccharomycesdiastaticus)、道格拉氏酵母(Saccharomyces douglasii)、克魯弗酵母(Saccharomyces kluyveri)、諾地酵母(Saccharomyces norbensis)或卵形酵母(Saccharomyces oviformis)細(xì)胞。在另一最優(yōu)選實(shí)施方案中,所述酵母宿主細(xì)胞是乳酸克魯維酵母(Kluyveromyces lactis)細(xì)胞。在另一最優(yōu)選實(shí)施方案中,所述酵母宿主細(xì)胞是Yarrowia lipolytica細(xì)胞。
在另一更優(yōu)選的實(shí)施方案中,所述真菌宿主細(xì)胞是絲狀真菌細(xì)胞?!敖z狀真菌”包括所有絲狀形式的真菌(Eumycota)和卵菌(Oomycota)亞門(如由Hawksworth et al.,1995,見前文所定義的)。所述絲狀真菌的特征在于由殼多糖(chitin)、纖維素、葡聚糖(glucan)、脫乙酰殼多糖(chitosan)、甘露聚糖(mannan)和其它復(fù)雜多糖(complex polysaccharides)所組成的菌絲體壁(mycelial wall)。營養(yǎng)生長(vegetative growth)通過菌絲延長(hyphal elongation)來進(jìn)行,并且碳分解代謝(carbon catabolism)是專性需氧的(obligately aerobic)。與此相反,酵母,諸如釀酒酵母的營養(yǎng)生長,則是通過單細(xì)胞菌體的芽殖(budding)進(jìn)行,并且碳分解代謝可以是發(fā)酵的(fermentative)。
在甚至更優(yōu)選的實(shí)施方案中,絲狀真菌宿主細(xì)胞是,但不限于,枝頂孢霉屬、曲霉屬、鐮孢屬、腐質(zhì)霉屬、毛霉屬、毀絲霉屬、脈孢菌屬、青霉屬、梭孢殼屬、彎頸霉屬或木霉屬的菌種的細(xì)胞。
在最優(yōu)選的實(shí)施方案中,絲狀真菌宿主細(xì)胞是泡盛曲霉、臭曲霉、日本曲霉、構(gòu)巢曲霉、黑曲霉或米曲霉細(xì)胞。在另一最優(yōu)選的實(shí)施方案中,絲狀真菌宿主細(xì)胞是桿孢狀鐮孢、禾谷鐮孢、庫威鐮孢、大刀鐮孢、禾本科鐮孢、禾赤鐮孢、異孢鐮孢、合歡木鐮孢、尖孢鐮孢、多枝鐮孢、粉紅鐮孢、接骨木鐮孢、膚色鐮孢、擬分枝孢鐮孢、硫色鐮孢、圓鐮孢、擬絲孢鐮孢或鑲片鐮孢細(xì)胞。在甚至最優(yōu)選的實(shí)施方案中,絲狀真菌親本細(xì)胞是鑲片鐮孢(Nirenberg sp.nov.)細(xì)胞。在另一最優(yōu)選的實(shí)施方案中,絲狀真菌宿主細(xì)胞是特異腐質(zhì)霉、疏棉狀腐質(zhì)霉、米黑毛霉、嗜熱毀絲霉、粗糙脈孢菌、產(chǎn)紫青霉、土生梭孢霉、哈茨木霉、康寧木霉、長枝木霉、里氏木霉或綠色木霉細(xì)胞。
真菌細(xì)胞可通過下列方法、以本身已知手段進(jìn)行轉(zhuǎn)化,所述方法涉及原生質(zhì)體形成、原生質(zhì)體轉(zhuǎn)化和細(xì)胞壁再生。曲霉屬(Aspergillus)宿主細(xì)胞轉(zhuǎn)化的合適方法在EP 238 023和Yelton et al.,1984,Proceedings of the NationalAcademy of Sciences USA 811470-1474中描述。轉(zhuǎn)化鐮孢屬(Fusarium)菌種的合適方法,由Malardier et al.,1989,Gene 78147-156和WO 96/00787描述。酵母可使用Becker and Guarente,In Abelson,J.N.and Simon,M.I.,editors,Guide to Yeast Genetics and Molecular Biology,Methods in Enzymology,Volume194,pp 182-187,Academic Press,Inc.,New York;Ito et al.,1983,Journal ofBacteriology 153163;和Hinnen et al.,1978,Proceedings of the NationalAcademy of Sciences USA 751920中描述的方法進(jìn)行轉(zhuǎn)化。
生產(chǎn)方法 本發(fā)明也涉及產(chǎn)生本發(fā)明多肽的方法,所述方法包括(a)培養(yǎng)腐質(zhì)霉屬(Humicola)或多孔菌屬(Meripilus)菌株,以產(chǎn)生含多肽的上清液;和(b)回收多肽。優(yōu)選地,菌株為特異腐質(zhì)霉菌種菌株或巨多孔菌菌種菌株。
本發(fā)明也涉及產(chǎn)生本發(fā)明多肽的方法,所述方法包括(a)在適于產(chǎn)生多肽的條件下培養(yǎng)如上所述的重組宿主細(xì)胞,和(b)從細(xì)胞和/或培養(yǎng)基回收多肽。
在本發(fā)明生產(chǎn)方法中,用本領(lǐng)域已知的方法,將細(xì)胞培養(yǎng)在適于多肽產(chǎn)生的營養(yǎng)培養(yǎng)基中。例如,所述細(xì)胞可通過搖瓶培養(yǎng)、在實(shí)驗(yàn)室或工業(yè)發(fā)酵罐中小規(guī)?;虼笠?guī)模發(fā)酵培養(yǎng)(包括連續(xù)的、分批的、補(bǔ)料分批的或固態(tài)發(fā)酵),在合適培養(yǎng)基中并在允許所述多肽表達(dá)和/或分離的條件下進(jìn)行。所述培養(yǎng)用本領(lǐng)域已知方法,在含碳源、氮源和無機(jī)鹽的合適營養(yǎng)培養(yǎng)基中進(jìn)行。合適的培養(yǎng)基可從商業(yè)供應(yīng)者獲得或按公開組成(例如,在美國典型培養(yǎng)物保藏中心(American Type Culture Collection)的目錄中)制備。如果所述多肽分泌至營養(yǎng)培養(yǎng)基,那么所述多肽能直接從培養(yǎng)基回收。如果所述多肽不分泌,那么其能從細(xì)胞裂解物回收。
多肽可用對于多肽特異性的本領(lǐng)域已知方法進(jìn)行檢測。這些檢測方法可包括特異性抗體的使用、酶產(chǎn)物的形成或酶底物的消失。例如,酶分析(enzymeassay)可用于測定本文所述多肽的活性。
所得多肽可通過本領(lǐng)域已知方法進(jìn)行回收。例如,多肽可用常規(guī)方法從營養(yǎng)培養(yǎng)基回收,所述常規(guī)方法包括但不限于離心、過濾、提取、噴霧干燥、蒸發(fā)或沉淀。
本發(fā)明多肽也可通過本領(lǐng)域已知的多種方法進(jìn)行純化,所述方法包括但不限于層析(例如離子交換、親和、疏水、色譜焦聚、和大小排阻)、電泳方法(例如制備等電聚焦(preparative isoelectric focusing))、溶解度差異(例如硫酸銨沉淀)、SDS-PAGE、或提取(參見例如,Protein Purification,J.-C.Janson和LarsRyden,editors,VCH Publishers,New York,1989)。
在植物中表達(dá)酶 可將編碼目標(biāo)多肽,如本發(fā)明阿拉伯糖呋喃糖苷酶的DNA序列,如下所述,在轉(zhuǎn)基因植物中轉(zhuǎn)化和表達(dá)。
轉(zhuǎn)基因植物可為雙子葉(dicotyledonous)或單子葉(monocotyledonous),簡寫為雙子葉(dicot)或單子葉(monocot)。單子葉植物實(shí)例為草,例如草地早熟禾(meadow grass)(藍(lán)草(blue grass),禾本科(Poa)),牧草(forage grass)例如羊茅屬(Festuca)、黑麥草屬(Lolium),溫帶草例如剪股穎屬(Agrostis),以及谷類,例如小麥,燕麥,黑麥,大麥,水稻,高粱和玉米。
雙子葉植物實(shí)例為煙草,豆類例如羽扇豆,馬鈴薯,糖甜菜,豌豆,菜豆,大豆,以及十字花科植物(十字花科(Brassicaceae family))例如花椰菜、油菜以及緊密相關(guān)的模型生物擬南芥(Arabidopsis thaliana)。
植物部分的實(shí)例為莖,愈傷組織,葉,根,果實(shí),種子,塊莖以及包含這些部分的獨(dú)立組織,例如表皮、葉肉、薄壁組織、維管組織、分生組織。在本上下文中,特定植物細(xì)胞區(qū)室,例如葉綠體(chloroplast),質(zhì)外體(apoplast),線粒體(mitochondria),液泡(vacuole),過氧物酶體(peroxisome)和細(xì)胞質(zhì),也都認(rèn)為是植物部分。此外,任何植物細(xì)胞,無論其組織來源,都認(rèn)為是植物部分。類似地,植物部分,如有利于本發(fā)明利用而分離的特定組織和細(xì)胞,也都認(rèn)為是植物部分,例如胚(embryo),胚乳(endosperm),糊粉(aleurone)和種皮(seed coat)。
本發(fā)明范圍也包括這些植物、植物部分和植物細(xì)胞的子代。
表達(dá)目標(biāo)多肽的轉(zhuǎn)基因植物或植物細(xì)胞可按本領(lǐng)域的已知方法構(gòu)建。簡言之,所述植物或植物細(xì)胞通過如下方法來構(gòu)建將編碼目標(biāo)多肽的一個或多個表達(dá)構(gòu)建體整合至植物宿主基因組,并將所得的修飾植物或植物細(xì)胞繁殖成轉(zhuǎn)基因植物或植物細(xì)胞。
方便的是,表達(dá)構(gòu)建體為DNA構(gòu)建體,所述DNA構(gòu)建體包含編碼目標(biāo)多肽的基因,所述基因與該基因在所選植物或植物部分中表達(dá)所需的合適調(diào)節(jié)序列操作性連接在一起。此外,表達(dá)構(gòu)建體可包含用于鑒定已整合表達(dá)構(gòu)建體的宿主細(xì)胞的選擇標(biāo)記和將構(gòu)建體導(dǎo)入所述植物所必需的DNA序列(后者取決于所用的DNA導(dǎo)入方法)。
調(diào)節(jié)序列,如啟動子和終止子序列以及可選地信號或轉(zhuǎn)運(yùn)序列的選擇,基于例如預(yù)期酶表達(dá)的時間、地點(diǎn)及方式來確定。例如,編碼本發(fā)明酶的基因的表達(dá)可為組成型或誘導(dǎo)型,或者表達(dá)可以是發(fā)育、階段或組織特異性的,并且基因產(chǎn)物可靶向特定細(xì)胞區(qū)室、組織或植物部分,例如種子或葉。調(diào)節(jié)序列,例如由Tague et al,Plant,Phys.,86,506,1988描述。
就35S-CaMV組成型表達(dá)而言,可使用玉米泛素1和水稻肌動蛋白1啟動子(Franck et al.1980.Cell 21285-294,Christensen AH,Sharrock RA andQuail 1992.Maize polyubiquitin genesstructure,thermal perturbation ofexpression and transcript splicing,and promoter activity following transfer toprotoplasts by electroporation.Plant Mo.Biol.18,675-689.;Zhang W,McElroy D.and Wu R 1991,Analysis of rice Actl 5’region activity in transgenic rice plants.Plant Cell 3,1155-1165)。器官特異性啟動子可以是例如,來自貯存匯集組織(storage sink tissue)如種子、馬鈴薯塊莖、和果實(shí)的啟動子(Edwards&Coruzzi,1990.Annu.Rev.Genet.24275-303),或來自代謝匯集組織如分生組織的啟動子(Ito et al.,1994.Plant Mol.Biol.24863-878),種子特異性啟動子,如來自水稻的谷蛋白、醇溶谷蛋白、球蛋白或白蛋白啟動子(Wu et al.,Plant and CellPhysiology Vol.39,No.8 pp.885-889(1998)),來自豆球蛋白B4的蠶豆(Viciafaba)啟動子和來自Conrad U.et al,Journal of Plant Physiology Vol.152,No.6pp.708-711(1998)所述的蠶豆的未知種子蛋白基因,來自油籽體蛋白的啟動子(Chen et al.,Plant and cell physiology vol.39,No.9 pp.935-941(1998),來自歐洲油菜(Brassica napus)的貯存蛋白napA啟動子,或者本領(lǐng)域已知的任何其它種子特異性啟動子,例如在WO 91/14772中所描述的。此外,啟動子也可以是葉特異性啟動子,例如來自水稻或番茄的rbcs啟動子(Kyozuka et al.,PlantPhysiology Vol.102,No.3 pp.991-1000(1993),小球藻病毒腺嘌呤甲基轉(zhuǎn)移酶基因啟動子(Mitra,A.and Higgins,D W,Plant Molecular Biology Vol.26,No.1pp.85-93(1994),或來自水稻的aldP基因啟動子(Kagaya et al.,Molecular andGeneral Genetics Vol.248,No.6 pp.668-674(1995),或傷口誘導(dǎo)啟動子如馬鈴薯pin2啟動子(Xu et al,Plant Molecular Biology Vol.22,No.4 pp.573-588(1993)。類似地,啟動子可通過非生物處理例如溫度、干旱或鹽度改變來誘導(dǎo),或者由激活啟動子的外源施加的物質(zhì),例如乙醇,雌激素,植物激素如乙烯、脫落酸和赤霉酸以及重金屬所誘導(dǎo)。
啟動子增強(qiáng)元件在植物中可用于取得酶的較高表達(dá)。例如,啟動子增強(qiáng)元件可為位于啟動子與編碼酶的核苷酸序列之間的內(nèi)含子。例如,Xu et al.(前文已引用)公開了利用水稻肌動蛋白1基因的第一內(nèi)含子來增強(qiáng)表達(dá)。
選擇標(biāo)記基因和表達(dá)構(gòu)建體的任何其它部分可由本領(lǐng)域可用的那些來選擇。
用本領(lǐng)域已知的常規(guī)技術(shù)將DNA構(gòu)建體整合至植物基因組,所述常規(guī)技術(shù)包括農(nóng)桿菌(Agrobacterium)-介導(dǎo)的轉(zhuǎn)化,病毒-介導(dǎo)的轉(zhuǎn)化,微注射(microinjection),粒子轟擊,生物射彈轉(zhuǎn)化,以及電穿孔(Gasser等,Science,244,1293;Potrykus,Bio/Techn.8,535,1990;Shimamoto等,Nature,338,274,1989)。
目前,根癌農(nóng)桿菌(Agrobacterium tumefaciens)介導(dǎo)的基因轉(zhuǎn)移是用于產(chǎn)生轉(zhuǎn)基因雙子葉植物的優(yōu)選方法(參見綜述Hooykas&Schilperoort,1992.Plant Mol.Biol.1915-38),并且其也能用于轉(zhuǎn)化單子葉植物,盡管對單子葉植物通常使用其它轉(zhuǎn)化方法。目前,用于產(chǎn)生轉(zhuǎn)基因單子葉植物的優(yōu)選方法除了農(nóng)桿菌(Agrobacterium)法以外,還有胚愈傷組織或發(fā)育胚的粒子轟擊(用轉(zhuǎn)化DNA涂覆的精細(xì)金(microscopic gold)或鎢顆粒)(Christou,1992.Plant J.2275-281;Shimamoto,1994.Curr.Opin.Biotechnol.5158-162;Vasil et al.,1992.Bio/Technology 10667-674)。轉(zhuǎn)化單子葉植物的可選方法,基于如OmirullehS,et al.,Plant Molecular biology Vol.21,No.3 pp.415-428(1993)所述的原生質(zhì)體轉(zhuǎn)化來進(jìn)行。
轉(zhuǎn)化后,根據(jù)本領(lǐng)域熟知方法選擇整合有表達(dá)構(gòu)建體的轉(zhuǎn)化體并將其再生成全植株。通常,將轉(zhuǎn)化方法設(shè)計成通過利用例如兩種獨(dú)立T-DNA構(gòu)建體的共轉(zhuǎn)化或利用特異性重組酶位點(diǎn)特異性切除選擇基因在再生期間或在后代中選擇性地消除選擇基因。
阿拉伯糖呋喃糖苷酶的用途 本發(fā)明也涉及本發(fā)明多肽即阿拉伯糖呋喃糖苷酶,在各種工業(yè)應(yīng)用中的用途,例如在生物質(zhì)轉(zhuǎn)化,例如從含纖維素生物質(zhì)生產(chǎn)燃料乙醇、從淀粉生產(chǎn)燃料和/或飲用乙醇中、在糖化用于啤酒生產(chǎn)中、在用于面包制備的生面團(tuán)中或在動物飼料產(chǎn)品制備中的用途。
本發(fā)明進(jìn)一步提供將含阿拉伯糖木聚糖的底物和/或生物質(zhì)與能夠從雙取代木糖中釋放阿拉伯糖的阿拉伯糖呋喃糖苷酶進(jìn)行接觸的方法。優(yōu)選地,α-L-阿拉伯糖呋喃糖苷酶是GH43阿拉伯糖呋喃糖苷酶。GH43α-L-阿拉伯糖呋喃糖苷酶優(yōu)選源自細(xì)菌、真菌或植物來源。優(yōu)選地,含阿拉伯糖木聚糖的底物和/或生物質(zhì)選自下列材料草本和/或木本能量作物,農(nóng)業(yè)食品和飼料作物,動物飼料產(chǎn)品,塊莖,根,莖,豆類,木薯外皮(cassava peel),可可豆莢(cocoa pod),稻皮和/或稻殼,來自米糠的稻麩(rice bran),穗軸,稻草,谷粒種皮和/或種殼,壓榨甘蔗桿,甜菜渣,刺槐豆粕(locust bean pulp),蔬菜或水果渣(pomace),谷物或整粒農(nóng)作物廢棄物,麥桿(straw),秸稈,葉,玉米麩皮,殼,穗軸,外皮(rind),殼(shell),豆莢(pod),木材廢棄物,樹皮,刨花(shavings),鋸屑(sawdust),木漿,紙漿液,廢紙,紙板,建筑和廢墟(demolition)木頭廢棄物,工業(yè)或城市廢水固體物或淤泥,肥料,釀造和/或發(fā)酵工藝副產(chǎn)品,濕蒸餾酒糟(wet distillers grain),干蒸餾酒糟(dried distillers grain),酒糟(spentgrain),酒糟(vinasse)和甘蔗渣(bagasse)。
本發(fā)明也涉及包含本發(fā)明的多肽即阿拉伯糖呋喃糖苷酶的組合物,以及該組合物的用途。
材料與方法 阿拉伯糖和木糖從Merck(Darmstadt,Germany)購買。水溶性和水不溶性小麥阿拉伯糖木聚糖獲自Megazyme(Bray,County Wicklow,Ireland)。
酶 將α-L-阿拉伯糖呋喃糖苷酶用基本分子技術(shù)克隆(Sambrook et al.,1989,Molecular Cloning,A Laboratory Manual,2d edition,Cold Spring Harbor,NewYork,Christgau et al.1995,Curr.Genet.27,135-141,Ausubel et al.,2003,Curr.Prot.Mol.Biol.,John Wiley&Sons,Cambridge,USA,)。
Van Laere et al.(1997) and Van den Broek et al.(2005)中的青春雙歧桿菌α-L-阿拉伯糖呋喃糖苷酶獲自Megazyme(Ireland)。
棘孢曲霉和疏棉狀嗜熱絲孢菌(Thermomyces lanuginosus)分別產(chǎn)生的單組分內(nèi)-1,4-β-木聚糖酶制劑Shearzyme(GH10)和Pentopan Mono(GH11),從Novozymes A/S(
Denmark)商業(yè)獲得。
制備特異的(specific)阿拉伯糖木聚糖聚合物和寡糖 通過如下方法制備雙取代阿拉伯糖木聚糖將pH6.0 0.1M醋酸緩沖液(100mL)中的可溶性小麥阿拉伯糖木聚糖(1g)與每千克水溶性小麥阿拉伯糖木聚糖中0.167g來自巨多孔菌(GH51)的α-L-阿拉伯糖呋喃糖苷酶在30℃溫育48小時。通過如下方法制備單取代阿拉伯糖木聚糖將pH6.0 0.1M醋酸緩沖液(42mL)中的水溶性小麥阿拉伯糖木聚糖(1g)與每千克水溶性小麥阿拉伯糖木聚糖中0.147g來自特異腐質(zhì)霉(GH43)的α-L-阿拉伯糖呋喃糖苷酶在30℃溫育48小時。為了終止酶反應(yīng),將混合物加熱至100℃ 10min。通過添加乙醇(126ml)來沉淀阿拉伯糖木聚糖聚合物。將所述沉淀過濾(Miracloth)并且真空干燥。
通過如下方法制備含有連接于末端(1→3)的阿拉伯糖基的寡糖將pH6.00.1 M醋酸緩沖液(100mL)中的水不溶性小麥阿拉伯糖木聚糖(1g)與每千克水不溶性小麥阿拉伯糖木聚糖中6.67g Shearzyme(木聚糖酶GH10)在30℃溫育2小時。通過如下方法制備含有連接于內(nèi)部(1→3)的阿拉伯糖基的寡糖將pH6.0 0.1 M醋酸緩沖液(100mL)中的水不溶性小麥阿拉伯糖木聚糖(1g)與每公斤水不溶性小麥阿拉伯糖木聚糖中0.03g Pentopan Mono(木聚糖酶GH11)在30℃溫育2小時。通過如下方法制備含有連接于內(nèi)部(1→2)的阿拉伯糖基的寡糖將pH6.0,0.1 M醋酸緩沖液(100mL)中的水不溶性小麥阿拉伯糖木聚糖(1g)與每公斤水不溶性小麥阿拉伯糖木聚糖中0.03g Pentopan Mono(木聚糖酶GH11)和每公斤水溶性小麥阿拉伯糖木聚糖中來自特異腐質(zhì)霉的α-L-阿拉伯糖呋喃糖苷酶(GH43)在30℃溫育2小時。為了終止酶反應(yīng),將混合物加熱至100℃ 10min。將阿拉伯糖木糖寡糖在旋轉(zhuǎn)蒸發(fā)器上濃縮并且用1H-NMR評價。
對α-L-阿拉伯糖呋喃糖苷酶活性的活性分析 可使用5mM p-硝基苯基α-L-阿拉伯糖呋喃糖苷作為底物,如Poutanen etal.(Appl.Microbiol.Biotechnol.1988,28,425-432)所述,評估α-L-阿拉伯糖呋喃糖苷酶活性。反應(yīng)可在50mM檸檬酸緩沖液中、于pH6.0 40℃進(jìn)行,整個反應(yīng)時間為30min。通過加入0.5ml 1M碳酸鈉來終止反應(yīng),并在405nm檢測所釋放的對-硝基苯酚?;钚砸訳/ml表示。
對C2-和C3-雙取代木聚糖的活性分析 將中粘度水溶性小麥阿拉伯糖木聚糖(Megazyme,Bray,Ireland)用來自巨多孔菌的GH51α-阿拉伯糖呋喃糖苷酶(SEQ ID NO2)處理,以除去連接于阿拉伯糖木聚糖的C(O)-3阿拉伯糖的單個α-阿拉伯糖呋喃糖基取代基,從而產(chǎn)生具有連接于木糖殘基的C(O)-2,3的阿拉伯糖呋喃糖基取代基的雙取代阿拉伯糖木聚糖底物。將該底物透析并且冷凍干燥。
制備雙取代阿拉伯糖木聚糖0.1%溶液,并通過在eppendorf管中混合0.1ml酶,0.9ml緩沖液(0.12M琥珀酸,pH6.0)和1.0ml底物溶液來檢測α-阿拉伯糖呋喃糖苷酶活性。將eppendorf管在60℃振蕩溫育1小時。釋放的阿拉伯糖的量可通過HPAEC(高效陰離子交換層析)測量。
HPAEC 將水解物(10μl)施加至裝有Dionex CarboPacTM PA1保護(hù)柱(4×250mm)(Dionex Corporation,Sunnyvale,CA,USA)與CarboPacTM PA1預(yù)柱(4×50mm)組合的Dionex BioLC系統(tǒng)。用10mM KOH將單糖等度(isocratically)分離15min,流速1mL·min-1??稍诿}沖安培檢測模式中用脈沖電化學(xué)檢測儀檢測單糖。電極電壓設(shè)計為+0.1V(t=0-0.4秒)至-2.0V(t=0.41-0.42秒)至0.6V(t=0.43秒)并且最終-0.1V(t=0.44-0.50秒),同時整合t=0.2-0.4秒所獲信號。將阿拉伯糖和木糖混合物(各成分濃度0.0025-0.1g·L-1)用作標(biāo)準(zhǔn)。
1H-NMR分析 將所有降解產(chǎn)物從99.9%D2O凍干兩次并再溶解于99.9%D2O中。將某些水解物透析(光譜/Por膜分子量截止1000)以在光譜分析之前除去游離阿拉伯糖。在以400MHz操作并裝備有4-核自動切換探針的Varian Mercury-VX檢測儀中在30℃記錄1H-NMR光譜。收集128-512掃描數(shù)據(jù),并且將 HDO信號用作參照信號(4.67ppm)。
實(shí)施例 實(shí)施例1 小麥阿拉伯糖木聚糖分別包含作為連接于內(nèi)部木糖3-位(A)的單取代基的阿拉伯糖呋喃糖苷,和連接在雙取代木糖的3-位(B)和2-位(C)的阿拉伯糖呋喃糖苷。產(chǎn)生每種僅含所述三種類型阿拉伯糖呋喃糖苷連接之一的底物。阿拉伯糖呋喃糖苷酶對這些底物的活性用1H NMR研究。
表1.α-L-阿拉伯糖呋喃糖苷酶活性的來源、家族及分子量
表2.在pH6,40℃溫育2小時,對所選阿拉伯糖木聚糖聚合物的活性
xx表示多于75%水解,x(x)表示50-75%水解,x表示25-50%水解,(x)表示5-25%水解。-表示未檢測到水解。
實(shí)施例2 將可溶小麥阿拉伯糖木聚糖與每千克DM中0.1g來自特異腐質(zhì)霉(GH43),青春雙歧桿菌(GH43),特異腐質(zhì)霉(GH51)和巨多孔菌(GH51)的α-L-阿拉伯糖呋喃糖苷酶的酶蛋白溫育24小時。檢測釋放的阿拉伯糖。結(jié)果以mg阿拉伯糖/g水溶性小麥阿拉伯糖木聚糖,作為三次檢測的平均值表示,平均值偏差系數(shù)<6.4。
表3.用α-L-阿拉伯糖呋喃糖苷酶處理從可溶性小麥阿拉伯糖木聚糖釋放的阿拉伯糖
實(shí)施例3 可將阿拉伯糖呋喃糖苷酶用在動物飼料組合物中以增加可消化性(digestibility)。玉米阿拉伯糖木聚糖大部分(heavily)用阿拉伯糖雙取代。為了促進(jìn)木聚糖降解,盡可能多地除去阿拉伯糖取代基是有利的。在體外消化系統(tǒng)中,對基于玉米的飼料中阿拉伯糖木聚糖的體外降解進(jìn)行研究 在體外消化系統(tǒng)中對基于玉米的飼料中阿拉伯糖木聚糖的體外降解進(jìn)行了研究,所述飼料補(bǔ)充有來自特異腐質(zhì)霉的GH51阿拉伯糖呋喃糖苷酶和源自疏棉狀嗜熱絲孢菌的商業(yè)木聚糖酶。
體外消化系統(tǒng)的條件 底物800mg粉碎并預(yù)混合的30∶70大豆粉/玉米飼料(corn diet) pHpH5,4和3(胃)和4.0(過渡階段),接著是小腸階段pH6.8 胃蛋白酶3000U/g飼料 胰酶制劑 8mg/g飼料 溫度40℃ 重復(fù)數(shù)4 酶劑量阿拉伯糖呋喃糖苷酶和木聚糖酶分別為50和67mg EP/kg 飼料 將樣品用80%乙醇沉淀,離心并棄去上清液。將沉淀(pellet)在80%乙醇中洗滌,離心并棄去上清液。將沉淀溶解在乙酸緩沖液(pH5)中,在進(jìn)行食物纖維(dietary fibre)分析前將淀粉除去。
表4.體外消化后殘留的總非淀粉多糖殘基中阿拉伯糖和木糖的含量
未共享相同字母標(biāo)引的各列平均值具有不同的統(tǒng)計學(xué)顯著性(P<0.05)。
序列表
<110>諾維信公司(Novozymes A/S)
<120>阿拉伯糖呋喃糖苷酶(Arabinofuranosidases)
<130>10814.204-W0
<160>4
<170>PatentIn version 3.3
<210>1
<211>1677
<212>DNA
<213>特異腐質(zhì)霉(Humicola insolens)
<220>
<221>CDS
<222>(1)..(1677)
<220>
<221>信號肽
<222>(1)..(54)
<400>1
atg cta ggc ttg aag gtc ttg tgt ctc tcc gcc gtc gtg ggg acg gcg48
Met Leu Gly Leu Lys Val Leu Cys Leu Ser Ala Val Val Gly Thr Ala
1 5 10 15
gtc tct gtg ccg cac gcg ggc aat ctt ccc cgt cag gcc agc act ttc96
Val Ser Val Pro His Ala Gly Asn Leu Pro Arg Gln Ala Ser Thr Phe
20 25 30
acc aac ccc gtg ctt tgg gaa gat cac cca gat ctc gaa gtg ttc cgc 144
Thr Asn Pro Val Leu Trp Glu Asp His Pro Asp Leu Glu Val Phe Arg
35 40 45
gtc ggc tca gta ttc tac tac tcc tcg tcc acc ttc gcc tac tcc ccc 192
Val Gly Ser Val Phe Tyr Tyr Ser Ser Ser Thr Phe Ala Tyr Ser Pro
50 55 60
ggc gcg ccc gtc ctc aag tcc tac gac ctc gtc cac tgg acg ccc gtc 240
Gly Ala Pro Val Leu Lys Ser Tyr Asp Leu Val His Trp Thr Pro Val
65 70 75 80
acc cat tcc gtg ccg cgt ctc aac ttc ggc tcc aac tac gac ctc ccc 288
Thr His Ser Val Pro Arg Leu Asn Phe Gly Ser Asn Tyr Asp Leu Pro
85 90 95
agc ggc acc ccg ggc gcc tac gtc aag ggc atc tgg gcc tca acc ctc 336
Ser Gly Thr Pro Gly Ala Tyr Val Lys Gly Ile Trp Ala Ser Thr Leu
100 105 110
cgc tac cgc cgc tcc aat gac cgc ttc tac tgg tac ggc tgc gtc gaa 384
Arg Tyr Arg Arg Ser Asn Asp Arg Phe Tyr Trp Tyr Gly Cys Val Glu
115 120 125
ggg aga acc tac ctc tgg acc agc ccg ggc ggt aac gcg ctc gcc aac 432
Gly Arg Thr Tyr Leu Trp Thr Ser Pro Gly Gly Asn Ala Leu Ala Asn
130 135 140
aac ggc gag gtg ccc ccc tcg gca tgg aac tgg cag cac acc gcc acc 480
Asn Gly Glu Val Pro Pro Ser Ala Trp Asn Trp Gln His Thr Ala Thr
145 150 155 160
atc gac aac tgc tac tac gac gcc ggc ctg ctc atc gac gac gac gac 528
Ile Asp Asn Gys Tyr Tyr Asp Ala Gly Leu Leu Ile Asp Asp Asp Asp
165 170 175
acc atg tac atc gcg tac ggc aac ccg acc atc aac gtc gcg cag ctc 576
Thr Met Tyr Ile Ala Tyr Gly Asn Pro Thr Ile Asn Val Ala Gln Leu
180 185 190
tcc ccc gac ggc acc cgc cag gtg cgc gtg cag cag cgc gtc tac gcg 624
Ser Pro Asp Gly Thr Arg Gln Val Arg Val Gln Gln Arg Val Tyr Ala
195 200 205
cac ccg cag ggc cag acg gtc gag ggc gcg cgc atg tac aag atc cgc 672
His Pro Gln Gly Gln Thr Val Glu Gly Ala Arg Met Tyr Lys Ile Arg
210 215 220
ggc aac tac tac atc ctg gtg acc cgc ccc gcc gac gca gag tac gtg 720
Gly Asn Tyr Tyr Ile Leu Val Thr Arg Pro Ala Asp Ala Glu Tyr Val
225 230 235 240
ctg cgg tcg acg acg ggg tcg ccg ttc ggc ccg tac gag gcg cgc acg 768
Leu Arg Ser Thr Thr Gly Ser Pro Phe Gly Pro Tyr Glu Ala Arg Thr
245 250 255
ctg gtg tcg cgg atc cag ggc ccg ctg gcc aac gcc ggg ttc gcg cac 816
Leu Val Ser Arg Ile Gln Gly Pro Leu Ala Asn Ala Gly Phe Ala His
260 265 270
cag ggc ggc atc gtc gac gcg ccg gat ggg acg tgg cac tac gtc gcg 864
Gln Gly Gly Ile Val Asp Ala Pro Asp Gly Thr Trp His Tyr Val Ala
275 280 285
ttc atg gat gcg tat ccc ggc gga cgc atc ccc gtg gtg gcg ccg ctg 912
Phe Met Asp Ala Tyr Pro Gly Gly Arg Ile Pro Val Val Ala Pro Leu
290 295 300
cgg tgg acg gcg gat ggg tgg ccc gag gtg gtc acg gat tcg caa ggg 960
Arg Trp Thr Ala Asp Gly Trp Pro Glu Val Val Thr Asp Ser Gln Gly
305 310 315 320
agg tgg ggg acg agc tat ccc att cca gtt cgc gga gca aag aac gcg 1008
Arg Trp Gly Thr Ser Tyr Pro Ile Pro Val Arg Gly Ala Lys Asn Ala
325 330 335
acg gag ggg ctg gcg agc acg gat ctg gac gag ttc cgc ggg acg agg 1056
Thr Glu Gly Leu Ala Ser Thr Asp Leu Asp Glu Phe Arg Gly Thr Arg
340 345 350
ttc agc gag cat tgg gag tgg aat cat aac ccg gac acg agc aag ttt 1104
Phe Ser Glu His Trp Glu Trp Asn His Asn Pro Asp Thr Ser Lys Phe
355 360 365
acg ttg ctg ggc ggt aac gag ggc ggg ctc atc ctc cgg aca gcg acc 1152
Thr Leu Leu Gly Gly Asn Glu Gly Gly Leu Ile Leu Arg Thr Ala Thr
370 375 380
gtg acg ggg gat ttg ttt gcc gca agg aat acg ctc acg agg agg atc 1200
Val Thr Gly Asp Leu Phe Ala Ala Arg Asn Thr Leu Thr Arg Arg Ile
385 390 395 400
gcg gga ccc aag gcc agt gga atc ttc cgg ctg gat gtg cgc ggg atg 1248
Ala Gly Pro Lys Ala Ser Gly Ile Phe Arg Leu Asp Val Arg Gly Met
405 410 415
cgc gac ggt gac cgg gcc ggc gcc gtg ctg ttc cgg gat cgt gcg gcg 1296
Arg Asp Gly Asp Arg Ala Gly Ala Val Leu Phe Arg Asp Arg Ala Ala
420 425 430
tac atc ggg gtg tgg aag cag ggc aac gag gcg cgg att gtc atg gtg 1344
Tyr Ile Gly Val Trp Lys Gln Gly Asn Glu Ala Arg Ile Val Met Val
435 440 445
gac gac ctg cgg ttg aac gag gat ggt tgg agg acg gcg tcc acc ggc 1392
Asp Asp Leu Arg Leu Asn Glu Asp Gly Trp Arg Thr Ala Ser Thr Gly
450 455 460
aga gtg gcc gcc aac ggt ccg gtg atc gac acg aac gct cag cag gat 1440
Arg Val Ala Ala Asn Gly Pro Val Ile Asp Thr Asn Ala Gln Gln Asp
465 470 475 480
atc tgg ctg cga att gat gcg gac atc aca ccg gcg ttt ggg acg aac 1488
Ile Trp Leu Arg Ile Asp Ala Asp Ile Thr Pro Ala Phe Gly Thr Asn
485 490 495
acg gag cgc acg acg acg ttc tac tac agt att gat ggt ggg agg acg 1536
Thr Glu Arg Thr Thr Thr Phe Tyr Tyr Ser Ile Asp Gly Gly Arg Thr
500 505 510
tat acc agg ctg ggc cct gcc ttt gcg atg acc aat tct tgg aga tac 1584
Tyr Thr Arg Leu Gly Pro Ala Phe Ala Met Thr Asn Ser Trp Arg Tyr
515 520 525
ttc acc gga tac cgg ttt gga gtg ttc aac ttt tcg acc aag agt ctt 1632
Phe Thr Gly Tyr Arg Phe Gly Val Phe Asn Phe Ser Thr Lys Ser Leu
530 535 540
gga ggt gag gtg aag gtt aag ggg ttc aag atg aac atg atc tag 1677
Gly Gly Glu Val Lys Val Lys Gly Phe Lys Met Asn Met Ile
545 550 555
<210>2
<211>558
<212>PRT
<213>特異腐質(zhì)霉(Humicola insolens)
<400>2
Met Leu Gly Leu Lys Val Leu Cys Leu Ser Ala Val Val Gly Thr Ala
1 5 10 15
Val Ser Val Pro His Ala Gly Asn Leu Pro Arg Gln Ala Ser Thr Phe
20 25 30
Thr Asn Pro Val Leu Trp Glu Asp His Pro Asp Leu Glu Val Phe Arg
35 40 45
Val Gly Ser Val Phe Tyr Tyr Ser Ser Ser Thr Phe Ala Tyr Ser Pro
50 55 60
Gly Ala Pro Val Leu Lys Ser Tyr Asp Leu Val His Trp Thr Pro Val
65 70 75 80
Thr His Ser Val Pro Arg Leu Asn Phe Gly Ser Asn Tyr Asp Leu Pro
85 90 95
Ser Gly Thr Pro Gly Ala Tyr Val Lys Gly Ile Trp Ala Ser Thr Leu
100 105 110
Arg Tyr Arg Arg Ser Asn Asp Arg Phe Tyr Trp Tyr Gly Cys Val Glu
115 120 125
Gly Arg Thr Tyr Leu Trp Thr Ser Pro Gly Gly Asn Ala Leu Ala Asn
130 135 140
Asn Gly Glu Val Pro Pro Ser Ala Trp Asn Trp Gln His Thr Ala Thr
145 150 155 160
Ile Asp Asn Cys Tyr Tyr Asp Ala Gly Leu Leu Ile Asp Asp Asp Asp
165 170 175
Thr Met Tyr Ile Ala Tyr Gly Asn Pro Thr Ile Asn Val Ala Gln Leu
180 185 190
Ser Pro Asp Gly Thr Arg Gln Val Arg Val Gln Gln Arg Val Tyr Ala
195 200 205
His Pro Gln Gly Gln Thr Val Glu Gly Ala Arg Met Tyr Lys Ile Arg
210 215 220
Gly Asn Tyr Tyr Ile Leu Val Thr Arg Pro Ala Asp Ala Glu Tyr Val
225 230 235 240
Leu Arg Ser Thr Thr Gly Ser Pro Phe Gly Pro Tyr Glu Ala Arg Thr
245 250 255
Leu Val Ser Arg Ile Gln Gly Pro Leu Ala Asn Ala Gly Phe Ala His
260 265 270
Gln Gly Gly Ile Val Asp Ala Pro Asp Gly Thr Trp His Tyr Val Ala
275 280 285
Phe Met Asp Ala Tyr Pro Gly Gly Arg Ile Pro Val Val Ala Pro Leu
290 295 300
Arg Trp Thr Ala Asp Gly Trp Pro Glu Val Val Thr Asp Ser Gln Gly
305 310 315 320
Arg Trp Gly Thr Ser Tyr Pro Ile Pro Val Arg Gly Ala Lys Asn Ala
325 330 335
Thr Glu Gly Leu Ala Ser Thr Asp Leu Asp Glu Phe Arg Gly Thr Arg
340 345 350
Phe Ser Glu His Trp Glu Trp Asn His Asn Pro Asp Thr Ser Lys Phe
355 360 365
Thr Leu Leu Gly Gly Asn Glu Gly Gly Leu Ile Leu Arg Thr Ala Thr
370 375 380
Val Thr Gly Asp Leu Phe Ala Ala Arg Asn Thr Leu Thr Arg Arg Ile
385 390 395 400
Ala Gly Pro Lys Ala Ser Gly Ile Phe Arg Leu Asp Val Arg Gly Met
405 410 415
Arg Asp Gly Asp Arg Ala Gly Ala Val Leu Phe Arg Asp Arg Ala Ala
420 425 430
Tyr Ile Gly Val Trp Lys Gln Gly Asn Glu Ala Arg Ile Val Met Val
435 440 445
Asp Asp Leu Arg Leu Asn Glu Asp Gly Trp Arg Thr Ala Ser Thr Gly
450 455 460
Arg Val Ala Ala Asn Gly Pro Val Ile Asp Thr Asn Ala Gln Gln Asp
465 470 475 480
Ile Trp Leu Arg Ile Asp Ala Asp Ile Thr Pro Ala Phe Gly Thr Asn
485 490 495
Thr Glu Arg Thr Thr Thr Phe Tyr Tyr Ser Ile Asp Gly Gly Arg Thr
500 505 510
Tyr Thr Arg Leu Gly Pro Ala Phe Ala Met Thr Asn Ser Trp Arg Tyr
515 520 525
Phe Thr Gly Tyr Arg Phe Gly Val Phe Asn Phe Ser Thr Lys Ser Leu
530 535 540
Gly Gly Glu Val Lys Val Lys Gly Phe Lys Met Asn Met Ile
545 550 555
<210>3
<211>2200
<212>DNA
<213>巨多孔菌(Miripilus giganteus)
<220>
<221>CDS
<222>(46)..(1974)
<220>
<221>信號肽
<222>(46)..(94)
<400>3
actagtaacg gccgccagtg tgctggaaag ggctcgctcg acacg atg aag ctg ctt57
Met Lys Leu Leu
1
ttc ttg ctc ggg gcc ttc gtt gcg caa tgt ctc gcg gtc aca gtg acc 105
Phe Leu Leu Gly Ala Phe Val Ala Gln Cys Leu Ala Val Thr Val Thr
5 10 15 20
gtt aac aag aac cct agt cac acg gta ccg tcc acg ctc tat ggc ctg 153
Val Asn Lys Asn Pro Ser His Thr Val Pro Ser Thr Leu Tyr Gly Leu
25 30 35
atg ttt gag gac atc aac cat agc ggt gat ggc ggc ctg tac gcg gag 201
Met Phe Glu Asp Ile Asn His Ser Gly Asp Gly Gly Leu Tyr Ala Glu
40 45 50
ttg ttg caa aac agg gct ttc caa cag gtt acc ccg aac acg gcc gct 249
Leu Leu Gln Asn Arg Ala Phe Gln Gln Val Thr Pro Asn Thr Ala Ala
55 60 65
gca ctc gct gca tgg cat ccc atc agc aat gcg aag ctg gcc gta ata 297
Ala Leu Ala Ala Trp His Pro Ile Ser Asn Ala Lys Leu Ala Val Ile
70 75 80
caa gac cca tct cct gtc tcc aat gca ttg ccg aat tcc ctt caa ttc 345
Gln Asp Pro Ser Pro Val Ser Asn Ala Leu Pro Asn Ser Leu Gln Phe
85 90 95 100
tcc gtg ccc agt gga tcg agc ggc agg gtc ggc ttt acc aac gag ggt 393
Ser Val Pro Ser Gly Ser Ser Gly Arg Val Gly Phe Thr Asn Glu Gly
105 110 115
ttc tgg gga atc aaa gtc gat tcc act tgg acg tac aaa gcc tcg ctc 441
Phe Trp Gly Ile Lys Val Asp Ser Thr Trp Thr Tyr Lys Ala Ser Leu
120 125 130
ttc ttc cgc ttc ccc aca tcg tcg tcc ttc tcg gga gcg ctc acc gtt 489
Phe Phe Arg Phe Pro Thr Ser Ser Ser Phe Ser Gly Ala Leu Thr Val
135 140 145
ggg ctg cag acg aac gcc ggg aga gtg ctg gca cag aac tcc acg cag 537
Gly Leu Gln Thr Asn Ala Gly Arg Val Leu Ala Gln Asn Ser Thr Gln
150 155 160
atc cgc ggg acg acc acg aag tgg acg cag atc aac ctg gag ctc cac 585
ILe Arg Gly Thr Thr Thr Lys Trp Thr Gln Ile Asn Leu Glu Leu His
165 170 175 180
cct acc gcc tct gcc ccc gac gtc agc aac agc ttc ttt gtc acg att 633
Pro Thr Ala Ser Ala Pro Asp Val Ser Asn Ser Phe Phe Val Thr Ile
185 190 195
gac ggg gcc gct ggc gcc ggt cag acg atc aac ttc gcc atg ttc tcg 681
Asp Gly Ala Ala Gly Ala Gly Gln Thr Ile Asn Phe Ala Met Phe Ser
200 205 210
ctc ttc cct ccc acg ttc aag aac agg ccg aat ggg ctg cgc gct gac 729
Leu Phe Pro Pro Thr Phe Lys Asn Arg Pro Asn Gly Leu Arg Ala Asp
215 220 225
atc gcc gag act ctg gcc gag atg ggc ccg tcc ttt ttc cgc ttc cca 777
Ile Ala Glu Thr Leu Ala Glu Met Gly Pro Ser Phe Phe Arg Phe Pro
230 235 240
ggt ggg aac aac ctg gag ggc caa acg acg gcg acg agg tgg cag tgg 825
Gly Gly Asn Asn Leu Glu Gly Gln Thr Thr Ala Thr Arg Trp Gln Trp
245 250 255 260
aat gct acc gtc ggc tcg ctg ctg gac cgc ccc ggc cgg gtg ggc gac 873
Asn Ala Thr Val Gly Ser Leu Leu Asp Arg Pro Gly Arg Val Gly Asp
265 270 275
tgg gga tac gtg aac acg gac ggt cta ggt ctt ctg gag tat ctc cag 921
Trp Gly Tyr Val Asn Thr Asp Gly Leu Gly Leu Leu Glu Tyr Leu Gln
280 285 290
ttc ttc gaa gat acg ggc atg gag ccg atc atg gcg gtc tgg gca ggc 969
Phe Phe Glu Asp Thr Gly Met Glu Pro Ile Met Ala Val Trp Ala Gly
295 300 305
tat tct ctc ggc ggc aca agc ctt gct gag aac cag ctc gca ccg tac1017
Tyr Ser Leu Gly Gly Thr Ser Leu Ala Glu Asn Gln Leu Ala Pro Tyr
310 315 320
ata cag caa gcg ata gat cag att aac ttt gtc atc ggg gac cct gca1065
Ile Gln Gln Ala Ile Asp Gln Ile Asn Phe Val Ile Gly Asp Pro Ala
325 330 335 340
aag agt gca cct gcg gcg ctc cgt gct tcc ctg ggc cac cca gag ccc1113
Lys Ser Ala Pro Ala Ala Leu Arg Ala Ser Leu Gly His Pro Glu Pro
345 350 355
ttc acg ctc cgc ttc gtg gaa gtg gga aac gag gac ttc ttc gcg gcg1161
Phe Thr Leu Arg Phe Val Glu Val Gly Asn Glu Asp Phe Phe Ala Ala
360 365 370
ggc tcg tac cca tac cgc tgg cac gac ttc gtt acc gca ctt cag gcg1209
Gly Ser Tyr Pro Tyr Arg Trp His Asp Phe Val Thr Ala Leu Gln Ala
375 380 385
caa ttc ccc cag atc aga ttc atc gcg acc acc aac gcc tgg aac ccg1257
Gln Phe Pro Gln Ile Arg Phe Ile Ala Thr Thr Asn Ala Trp Asn Pro
390 395 400
gtt ctg tcc ccc gtc ccg cag tcg tat gat gta cac gtc tat cag aca1305
Val Leu Ser Pro Val Pro Gln Ser Tyr Asp Val His Val Tyr Gln Thr
405 410 415 420
ccg acc tgg ttc tac caa aat gct ttc tac tac gac ggc ttc cag cgc1353
Pro Thr Trp Phe Tyr Gln Asn Ala Phe Tyr Tyr Asp Gly Phe Gln Arg
425 430 435
aac ggc acc aca tac ttt gag ggg gag tac gcc gcc atc tcc acc aac1401
Asn Gly Thr Thr Tyr Phe Glu Gly Glu Tyr Ala Ala Ile Ser Thr Asn
440 445 450
gcg aac gat ttg ttc ggt act gtt gcc gac ggt cgc ttg gcg ttc cct1449
Ala Asn Asp Leu Phe Gly Thr Val Ala Asp Gly Arg Leu Ala Phe Pro
455 460 465
aca gtg caa agt gct acc ggg gag gcc gca ttc atg acc ggc ttg gag1497
Thr Val Gln Ser Ala Thr Gly Glu Ala Ala Phe Met Thr Gly Leu Glu
470 475 480
cgc aac agc gac atc gtc ttc gcc gcg tcc tac gca cct ctg ctg cag1545
Arg Asn Ser Asp Ile Val Phe Ala Ala Ser Tyr Ala Pro Leu Leu Gln
485 490 495 500
cac gtc aac tcc act caa tgg acc ccc gac ctg gtt tcc tac gac gcc1593
His Val Asn Ser Thr Gln Trp Thr Pro Asp Leu Val Ser Tyr Asp Ala
505 510 515
ggc tcc gtt att aag tcg acg agc ttc ttc gcc cag aag ctg ttc gcc1641
Gly Ser Val Ile Lys Ser Thr Ser Phe Phe Ala Gln Lys Leu Phe Ala
520 525 530
ttg aac aag ggc gac caa tac ctc ccg agc acg ctc ccg acc aac ggt1689
Leu Asn Lys Gly Asp Gln Tyr Leu Pro Ser Thr Leu Pro Thr Asn Gly
535 540 545
ggc acg ctg cac tgg agc atc act cgg gcc tct agc tcc ggc aag acg1737
Gly Thr Leu His Trp Ser Ile Thr Arg Ala Ser Ser Ser Gly Lys Thr
550 555 560
ttc atc aag atc gcg aac gcc ggc agc tca gcg cag agc ctc acc ttc1785
Phe Ile Lys Ile Ala Asn Ala Gly Ser Ser Ala Gln Ser Leu Thr Phe
565 570 575 580
cag ctg acc cag ttc aac tcg gtc tcc agc acc gga acg ctc cag gtc1833
Gln Leu Thr Gln Phe Asn Ser Val Ser Ser Thr Gly Thr Leu Gln Val
585 590 595
ctc acc gga ccg gag acc gcc agc aac acg cct gag gcg ccg cag gcc1881
Leu Thr Gly Pro Glu Thr Ala Ser Ash Thr Pro Glu Ala Pro Gln Ala
600 605 610
atc gtt ccc aag acg agc acg atc ggc acc ggc aag act ttc acg tac1929
Ile Val Pro Lys Thr Ser Thr Ile Gly Thr Gly Lys Thr Phe Thr Tyr
615 620 625
aac gct ccc gca ttc agc gtc agt gtc atc acc gtc acc acg aac1974
Asn Ala Pro Ala Phe Ser Val Ser Val Ile Thr Val Thr Thr Asn
630 635 640
tgaacgaaga agcacaacgc agcacgagga ccagaggacg gcgcggatgc gagactgccg 2034
agataccatt gccgcgaagg ggtgcagtgg tgccgtaact cgcaaggggg aacgggatcg 2094
tccgaatcgg atgggtgtgg attaggttgc gtcttcactg tttactaggc ggtgtatgcg 2154
agcgtagcta gtgcggtcct attgtaattt tgtgaggtct atctcc 2200
<210>4
<211>643
<212>PRT
<213>巨多孔菌(Miripilus giganteus)
<400>4
Met Lys Leu Leu Phe Leu Leu Gly Ala Phe Val Ala Gln Cys Leu Ala
1 5 10 15
Val Thr Val Thr Val Asn Lys Asn Pro Ser His Thr Val Pro Ser Thr
20 25 30
Leu Tyr Gly Leu Met Phe Glu Asp Ile Asn His Ser Gly Asp Gly Gly
35 40 45
Leu Tyr Ala Glu Leu Leu Gln Asn Arg Ala Phe Gln Gln Val Thr Pro
50 55 60
Asn Thr Ala Ala Ala Leu Ala Ala Trp His Pro Ile Ser Asn Ala Lys
65 70 75 80
Leu Ala Val Ile Gln Asp Pro Ser Pro Val Ser Asn Ala Leu Pro Asn
85 90 95
Ser Leu Gln Phe Ser Val Pro Ser Gly Ser Ser Gly Arg Val Gly Phe
100 105 110
Thr Asn Glu Gly Phe Trp Gly Ile Lys Val Asp Ser Thr Trp Thr Tyr
115 120 125
Lys Ala Ser Leu Phe Phe Arg Phe Pro Thr Ser Ser Ser Phe Ser Gly
130 135 140
Ala Leu Thr Val Gly Leu Gln Thr Asn Ala Gly Arg Val Leu Ala Gln
145 150 155 160
Ash Ser Thr Gln Ile Arg Gly Thr Thr Thr Lys Trp Thr Gln Ile Asn
165 170 175
Leu Glu Leu His Pro Thr Ala Ser Ala Pro Asp Val Ser Asn Ser Phe
180 185 190
Phe Val Thr Ile Asp Gly Ala Ala Gly Ala Gly Gln Thr Ile Asn Phe
195 200 205
Ala Met Phe Ser Leu Phe Pro Pro Thr Phe Lys Asn Arg Pro Asn Gly
210 215 220
Leu Arg Ala Asp Ile Ala Glu Thr Leu Ala Glu Met Gly Pro Ser Phe
225 230 235 240
Phe Arg Phe Pro Gly Gly Asn Asn Leu Glu Gly Gln Thr Thr Ala Thr
245 250 255
Arg Trp Gln Trp Asn Ala Thr Val Gly Ser Leu Leu Asp Arg Pro Gly
260 265 270
Arg Val Gly Asp Trp Gly Tyr Val Asn Thr Asp Gly Leu Gly Leu Leu
275 280 285
Glu Tyr Leu Gln Phe Phe Glu Asp Thr Gly Met Glu Pro Ile Met Ala
290 295 300
Val Trp Ala Gly Tyr Ser Leu Gly Gly Thr Ser Leu Ala Glu Asn Gln
305 310 315 320
Leu Ala Pro Tyr Ile Gln Gln Ala Ile Asp Gln Ile ASn Phe Val Ile
325 330 335
Gly Asp Pro Ala Lys Ser Ala Pro Ala Ala Leu Arg Ala Ser Leu Gly
340 345 350
His Pro Glu Pro Phe Thr Leu Arg Phe Val Glu Val Gly Asn Glu Asp
355 360 365
Phe Phe Ala Ala Gly Ser Tyr Pro Tyr Arg Trp His Asp Phe Val Thr
370 375 380
Ala Leu Gln Ala Gln Phe Pro Gln Ile Arg Phe Ile Ala Thr Thr Asn
385 390 395 400
Ala Trp Asn Pro Val Leu Ser Pro Val Pro Gln Ser Tyr Asp Val His
405 410 415
Val Tyr Gln Thr Pro Thr Trp Phe Tyr Gln Asn Ala Phe Tyr Tyr Asp
420 425 430
Gly Phe Gln Arg Asn Gly Thr Thr Tyr Phe Glu Gly Glu Tyr Ala Ala
435 440 445
Ile Ser Thr Asn Ala Asn Asp Leu Phe Gly Thr Val Ala Asp Gly Arg
450 455 460
Leu Ala Phe Pro Thr Val Gln Ser Ala Thr Gly Glu Ala Ala Phe Met
465 470 475 480
Thr Gly Leu Glu Arg Asn Ser Asp Ile Val Phe Ala Ala Ser Tyr Ala
485 490 495
Pro Leu Leu Gln His Val Asn Ser Thr Gln Trp Thr Pro Asp Leu Val
500 505 510
Ser Tyr Asp Ala Gly Ser Val Ile Lys Ser Thr Ser Phe Phe Ala Gln
515 520 525
Lys Leu Phe Ala Leu Asn Lys Gly Asp Gln Tyr Leu Pro Ser Thr Leu
530 535 540
Pro Thr Asn Gly Gly Thr Leu His Trp Ser Ile Thr Arg Ala Ser Ser
545 550 555 560
Ser Gly Lys Thr Phe Ile Lys Ile Ala Asn Ala Gly Ser Ser Ala Gln
565 570 575
Ser Leu Thr Phe Gln Leu Thr Gln Phe Asn Ser Val Ser Ser Thr Gly
580 585 590
Thr Leu Gln Val Leu Thr Gly Pro Glu Thr Ala Ser Asn Thr Pro Glu
595 600 605
Ala Pro Gln Ala Ile Val Pro Lys Thr Ser Thr Ile Gly Thr Gly Lys
610 615 620
Thr Phe Thr Tyr Asn Ala Pro Ala Phe Ser Val Ser Val Ile Thr Val
625 630 635 640
Thr Thr Asn
權(quán)利要求
1.一種能從雙取代木聚糖釋放阿拉伯糖的阿拉伯糖呋喃糖苷酶,所述阿拉伯糖呋喃糖苷酶源自真菌。
2.一種阿拉伯糖呋喃糖苷酶,其為
a)具有SEQ ID NO2所示成熟肽氨基酸序列的多肽,或者能夠從其通過取代、缺失和/或插入一個或多個氨基酸而獲得的多肽;
b)(i)或(ii)中定義的多肽類似物,其
i)與所述多肽有至少80%同源性,
ii)為所述多肽的等位基因變體,
c)由核酸序列編碼的多肽,所述核酸序列與編碼成熟多肽的SEQ ID NO2的核酸序列互補(bǔ)鏈或其至少100個核苷酸的亞序列在高嚴(yán)緊條件下雜交。
3.一種阿拉伯糖呋喃糖苷酶,其為
a)具有SEQ ID NO4所示成熟肽氨基酸序列的多肽,或者能夠從其通過取代、缺失和/或插入一個或多個氨基酸而獲得的多肽;
b)(i)或(ii)中定義的多肽類似物,其
i)與所述多肽有至少60%同源性,
ii)為所述多肽的等位基因變體,
c)由核酸序列編碼的多肽,所述核酸序列與編碼成熟多肽的SEQ ID NO2的核酸序列的互補(bǔ)鏈或其至少100個核苷酸的亞序列在高嚴(yán)緊條件下雜交。
4.權(quán)利要求1-3中任一項(xiàng)所述的阿拉伯糖呋喃糖苷酶,其對于腐質(zhì)霉屬菌株,優(yōu)選特異腐質(zhì)霉,或者多孔菌屬菌株,優(yōu)選巨多孔菌是天然的。
5.核酸序列,其包含編碼權(quán)利要求1-4任一項(xiàng)所述的阿拉伯糖呋喃糖苷酶的核酸序列。
6.核酸序列,其包括
a)DNA序列,其編碼SEQ ID NO2和SEQ ID NO4所示任一阿拉伯糖呋喃糖苷酶,
b)DNA序列類似物,其
i)與任一所述DNA序列具有至少80%同源性,或
ii)與所述DNA序列互補(bǔ)鏈或其具有至少100個核苷酸的亞序列在高嚴(yán)緊條件下雜交;
iii)為其等位基因變體,或
c)a)或b)的互補(bǔ)鏈。
7.權(quán)利要求6所述的核酸序列,其中多肽為含下列氨基酸序列的人工變體,所述氨基酸序列相對SEQ ID NO2的氨基酸1-558,有一處或多處截短,和/或氨基酸的至少一個取代、缺失和/或插入。
8.核酸序列,其與SEQ ID NO1和SEQ ID NO3任一所示DNA序列具有至少80%同源性,或者
a)與任一所述DNA序列的互補(bǔ)鏈或其具有至少100個核苷酸的亞序列在高嚴(yán)緊條件下雜交,
b)為其等位基因變體,或
c)a)或b)的互補(bǔ)鏈。
9.權(quán)利要求8所述的核酸序列,其中多肽為含下列氨基酸序列的人工變體,所述氨基酸序列相對SEQ ID NO4的氨基酸1-643,有一處或多處截短,和/或氨基酸的至少一個取代、缺失和/或插入。
10.一種核酸構(gòu)建體,其包含權(quán)利要求5-9任一的核酸序列,所述核酸序列與在合適表達(dá)宿主中能指導(dǎo)阿拉伯糖呋喃糖苷酶表達(dá)的一種或多種調(diào)控序列可操作地連接。
11.包含權(quán)利要求10的核酸構(gòu)建體的重組表達(dá)載體。
12.包含權(quán)利要求11的表達(dá)載體的重組宿主細(xì)胞。
13.產(chǎn)生阿拉伯糖呋喃糖苷酶的方法,其包括在利于產(chǎn)生阿拉伯糖呋喃糖苷酶的條件下培養(yǎng)權(quán)利要求12的宿主細(xì)胞,和回收阿拉伯糖呋喃糖苷酶。
14.包含根據(jù)權(quán)利要求1-4中任一項(xiàng)的阿拉伯糖呋喃糖苷酶的組合物。
15.根據(jù)權(quán)利要求1-4中任一項(xiàng)的阿拉伯糖呋喃糖苷酶在生面團(tuán)中的用途。
16.根據(jù)權(quán)利要求1-4中任一項(xiàng)的阿拉伯糖呋喃糖苷酶在乙醇工藝中的用途。
17.根據(jù)權(quán)利要求1或4中任一項(xiàng)的阿拉伯糖呋喃糖苷酶在糖化工藝中的用途。
18.根據(jù)權(quán)利要求1或4中任一項(xiàng)的阿拉伯糖呋喃糖苷酶在生產(chǎn)飼料產(chǎn)品的工藝中的用途。
全文摘要
本發(fā)明涉及具有α-L-阿拉伯糖呋喃糖苷酶活性的分離多肽和編碼該多肽的分離核酸序列。本發(fā)明也涉及含所述核酸序列的核酸構(gòu)建體、載體和宿主細(xì)胞,以及產(chǎn)生和使用該多肽的方法。
文檔編號C12N9/24GK101166822SQ200680014246
公開日2008年4月23日 申請日期2006年4月25日 優(yōu)先權(quán)日2005年4月26日
發(fā)明者漢尼·R·索倫森, 克里斯特爾·T·喬爾根森, 拉斯·H·克里斯坦森, 克里斯琴·I·喬爾根森, 卡斯滕·H·漢森, 萊尼·V·科福德 申請人:諾維信公司