專利名稱:具有α-葡糖苷酶活性的多肽及編碼其的多核苷酸的制作方法
背景技術(shù):
發(fā)明領(lǐng)域本發(fā)明涉及具有α-葡糖苷酶活性的分離多肽和編碼該多肽的分離多核苷酸。本發(fā)明也涉及包括該多核苷酸的核酸構(gòu)建體、載體、和宿主細(xì)胞,以及生產(chǎn)和使用該多肽的方法。
相關(guān)技術(shù)的說(shuō)明若干酶涉及淀粉的降解。該酶包括α-淀粉酶、β-淀粉酶、淀粉葡萄糖苷酶、支鏈淀粉酶、淀粉異構(gòu)酶、α-葡糖苷酶、和環(huán)糊精糖基轉(zhuǎn)移酶。
α-葡糖苷酶(EC 3.2.1.20)水解多種底物中的末端、非還原的α-1,4-鍵葡萄糖殘基,釋放葡萄糖。它們快速降解二糖和寡聚糖,而如果有多糖的話,多糖被慢慢地受到侵襲。麥芽糖、麥芽糖衍生物、蔗糖、芳基-α-葡糖苷、和烷基-α-糖苷能夠充當(dāng)?shù)孜铩?br>
來(lái)自煙曲霉的α-葡糖苷酶的純化和特性已經(jīng)由Rudick and Elbein,1974,Archives of Biochemistry and Biophysics 161281-290進(jìn)行描述。
已經(jīng)報(bào)道其他的絲狀真菌生產(chǎn)α-葡糖苷酶,例如黃曲霉(Aspergillusflavus)(Olutiola,1981,Mycologia 731130)、構(gòu)巢曲霉(Kato et al.,2002,Appl.Environ.Microbiol.681250-1256)、黑曲霉(Rudick et al.,1979,Archives ofBiochemistry and Biophysics 193509)、米曲霉(Leibowitz and Mechlinski,1926,Hoppe-Seyler’s Zeitschrift für Physiologische Chemie 15464),Mucorjavanicus(Yamasaki et al.,1978,Berichte des Ohara Instituts fürLandwirtschaftliche Biologie 17123),Mucor racemosus(Yamasaki et al.,1977,Agricultural and Biological Chemistry 411553),Mucor rouxii(Flores-Carreonand Ruiz-Herrera,1972,Biochemica et Biophysica Acta 258496)、產(chǎn)紫青霉(Yamasaki et al.,1976,Agricultural and Biological Chemistry 40669),和Penicillium oxalicum(Yamasaki et al.,1977,Agricultural and BiologicalChemistry 411451)。
α-葡糖苷酶可與其他的淀粉降解酶,例如α-淀粉酶組合使用,以在其中需要轉(zhuǎn)化為可發(fā)酵糖的工業(yè)應(yīng)用中獲得完全的淀粉水解。因此,本領(lǐng)域中需要具有改善特性,例如最適pH、最適溫度和耐熱的備選α-葡糖苷酶。
本發(fā)明的目的是提供具有α-葡糖苷酶活性的多肽和編碼該多肽的多核苷酸。
發(fā)明概述本發(fā)明涉及具有α-葡糖苷酶活性的分離多肽,其選自(a)具有與SEQ ID NO2的第15至881位氨基酸或SEQ ID NO4的第30至967位氨基酸有至少75%同一性,或與SEQ ID NO6的第20至988位氨基酸有至少85%同一性的氨基酸序列的多肽;(b)由在中等嚴(yán)謹(jǐn)條件下與(i)SEQ ID NO1的第43至2643位核苷酸或SEQ ID NO3的第146至3013位核苷酸,(ii)包含在SEQ ID NO1的第43至2643位核苷酸或SEQ ID NO3的第146至3013位核苷酸中的cDNA序列,或(iii)(i)或(ii)的互補(bǔ)鏈雜交,或在高嚴(yán)謹(jǐn)條件下與(i)SEQ IDNO5的第58至3164位核苷酸,(ii)包含在SEQ ID NO5的第58至3164位核苷酸中的cDNA序列,或(iii)(i)或(ii)的互補(bǔ)鏈雜交的核苷酸序列編碼的多肽;以及(c)包括SEQ ID NO2的第15至881位氨基酸、SEQ ID NO4的第30至967位氨基酸、或SEQ ID NO6的第20至988位氨基酸的一個(gè)或多個(gè)氨基酸的保守取代、缺失、和/或插入的變體。
本發(fā)明也涉及編碼具有α-葡糖苷酶活性的多肽的分離多核苷酸,其選自(a)編碼具有與SEQ ID NO2的第15至881位氨基酸或SEQ ID NO4的第30至967位氨基酸有至少75%同一性,或與SEQ ID NO6的第20至988位氨基酸有至少85%同一性的氨基酸序列的多肽的多核苷酸;(b)與SEQ ID NO1的第43至2643位核苷酸或SEQ ID NO3的第146至3013位核苷酸有至少75%同一性或與SEQ ID NO5的第58至3164位核苷酸有至少85%同一性的多核苷酸;和(c)在中等嚴(yán)謹(jǐn)條件下與(i)SEQ ID NO1的第43至2643位核苷酸或SEQ ID NO3的第146至3013位核苷酸,(ii)包含在SEQ ID NO1的第43至2643位核苷酸或SEQ ID NO3的第146至3013位核苷酸中的cDNA序列,或(iii)(i)或(ii)的互補(bǔ)鏈雜交,或在高嚴(yán)謹(jǐn)條件下與(i)SEQ IDNO5的第58至3164位核苷酸,(ii)包含在SEQ ID NO5的第58至3164位核苷酸中的cDNA序列,或(iii)(i)或(ii)的互補(bǔ)鏈雜交的多核苷酸。
本發(fā)明也涉及包括該多核苷酸的核酸構(gòu)建體、重組表達(dá)載體,和重組的宿主細(xì)胞。
本發(fā)明也涉及生產(chǎn)這種具有α-葡糖苷酶活性的多肽的方法,包括(a)在有助于生產(chǎn)該多肽的條件下培養(yǎng)包括包含編碼該多肽的多核苷酸的核酸構(gòu)建體的宿主細(xì)胞;以及(b)回收該多肽。
本發(fā)明也涉及使用α-葡糖苷酶的方法。
本發(fā)明進(jìn)一步涉及包括編碼蛋白質(zhì)的基因的核酸構(gòu)建體,其中所述基因與編碼信號(hào)肽的核苷酸序列可操作連接,其中該核苷酸序列由SEQ IDNO1的第1至42位核苷酸、SEQ ID NO3的第1至145位核苷酸、或SEQID NO5的第1至57位核苷酸組成,其中該基因?qū)τ谠摵塑账嵝蛄惺峭庠吹摹?br>
附圖簡(jiǎn)述
圖1顯示煙曲霉α-葡糖苷酶(Agl1)的基因組DNA序列和推導(dǎo)的氨基酸序列(分別為SEQ ID NOs1和2)。
圖2顯示煙曲霉α-葡糖苷酶(Agl2)的基因組DNA序列和推導(dǎo)的氨基酸序列(分別為SEQ ID NOs3和4)。
圖3顯示煙曲霉α-葡糖苷酶(Agl3)的基因組DNA序列和推導(dǎo)的氨基酸序列(分別為SEQ ID NOs5和6)。
圖4顯示pAlLo1的限制圖譜。
圖5顯示pBM121b的限制圖譜。
圖6顯示pBM120a的限制圖譜。
圖7顯示pSMO216的限制圖譜。
圖8顯示pHyGe011的限制圖譜。
圖9顯示pJSF9b的限制圖譜。
圖10顯示純化的煙曲霉Agl1α-葡糖苷酶于37℃在50mM乙酸鹽緩沖液/50mM磷酸鹽緩沖液中活性的pH依賴性。
圖11顯示在0.05M乙酸鈉,pH 5.0中于不同溫度培養(yǎng)5分鐘后純化的煙曲霉Agl1α-葡糖苷酶的熱穩(wěn)定性。
圖12顯示純化的煙曲霉Agl1α-葡糖苷酶在50mM乙酸鈉,pH 5.0中活性的溫度依賴性。
圖13顯示純化的煙曲霉Agl3α-葡糖苷酶于37℃在50mM乙酸鹽緩沖液/50mM磷酸鹽緩沖液中活性的pH-依賴性。
圖14顯示純化的煙曲霉Agl3α-葡糖苷酶在50mM乙酸鈉,pH 5.0中在不同溫度培養(yǎng)5分鐘后的熱穩(wěn)定性。
圖15顯示純化的煙曲霉Agl3α-葡糖苷酶在50mM乙酸鈉,pH 5.0中活性的溫度依賴性。
定義α-葡糖苷酶活性術(shù)語(yǔ)“α-葡糖苷酶活性”在此定義為α-D-葡糖苷葡萄糖水解酶活性(E.C.3.2.1.20),其催化末端、非還原的1,4-連接的α-D-葡萄糖殘基的外切水解,伴隨α-D-葡萄糖的釋放。酶活性的天然底物包括例如,麥芽糖、麥芽三糖、麥芽四糖、麥芽五糖、淀粉(可溶的)、直鏈淀粉、支鏈淀粉、異麥芽糖、曲二糖、蔗糖、黑曲霉糖、松二糖、松三糖、和糖原。為了本發(fā)明的目的,α-葡糖苷酶活性以麥芽糖作為底物在0.1M乙酸鈉緩沖液,pH 4.3,于25℃測(cè)定。一個(gè)單位的α-葡糖苷酶活性定義為在乙酸鈉緩沖液中在25℃,pH 4.3每分鐘從作為底物的麥芽糖產(chǎn)生1.0μmole的葡萄糖。
本發(fā)明的多肽具有由SEQ ID NO2的第15至881位氨基酸、SEQ IDNO4的第30至967位氨基酸、或SEQ ID NO6的第20至988位氨基酸所示的氨基酸序列組成的多肽的至少20%,優(yōu)選40%,更優(yōu)選至少50%,更優(yōu)選至少60%,更優(yōu)選至少70%,更優(yōu)選至少80%,更優(yōu)選至少90%,最優(yōu)選至少95%,以及最優(yōu)選至少100%的α-葡糖苷酶活性。
分離的多肽術(shù)語(yǔ)“分離的多肽”如在此使用的,是指通過SDS-PAGE所測(cè)定的為至少20%純、優(yōu)選至少40%純、更優(yōu)選至少60%純、更優(yōu)選至少80%純、最優(yōu)選至少90%純、以及最優(yōu)選至少95%純。
基本上純的多肽術(shù)語(yǔ)“基本上純的多肽”在此表示按重量計(jì)包含至多10%、優(yōu)選至多8%、更優(yōu)選至多6%、更優(yōu)選至多5%、更優(yōu)選至多4%、更優(yōu)選至多3%、更優(yōu)選至多2%、最優(yōu)選至多1%、以及最優(yōu)選至多0.5%的與其天然或重組締合的其他多肽物質(zhì)的多肽制品。因此優(yōu)選基本上純的多肽是按重量計(jì)以至少92%純、優(yōu)選至少94%純、更優(yōu)選至少95%純、更優(yōu)選至少96%純、更優(yōu)選至少96%純、更優(yōu)選至少97%純、更優(yōu)選至少98%純、更優(yōu)選至少99%、最優(yōu)選至少99.5%純、以及最優(yōu)選100%純的總多肽物質(zhì)存在于制品中。
本發(fā)明的多肽優(yōu)選是基本上純的形式。特別地,優(yōu)選該多肽是“本質(zhì)上純的形式”,即,該多肽制品基本上不含與其天然或重組締合的其他多肽物質(zhì)。這可通過例如借助于眾所周知的重組方法或經(jīng)典的純化方法制備多肽來(lái)實(shí)現(xiàn)。
在此術(shù)語(yǔ)“基本上純的多肽”和術(shù)語(yǔ)“分離的多肽”以及“分離形式的多肽”同義。
同一性兩個(gè)氨基酸序列之間或兩個(gè)核苷酸序列之間的關(guān)系是通過參數(shù)“同一性”來(lái)描述的。
為了本發(fā)明的目的,兩個(gè)氨基酸序列之間同一性的程度通過Clustal方法(Higgins,1989,CABIOS 5151-153),利用LASERGENETMMEGALIGNTM軟件(DNASTAR,Inc.,Madison,WI)來(lái)確定,其中使用同一性表格和下列多個(gè)排列參數(shù)缺口罰分為10,缺口長(zhǎng)度罰分為10。成對(duì)排列參數(shù)是Ktuple=1,gap penalty=3,windows=5,和diagonals=5。
為了本發(fā)明的目的,兩個(gè)核苷酸序列之間同一性的程度通過Wilbur-Lipman方法(Wilbur and Lipman,1983,Proceedings of the NationalAcademy of Science USA 80726-730),利用LASERGENETMMEGALIGNTM軟件(DNASTAR,Inc.,Madison,WI)來(lái)確定,其中使用同一性表格和下列多個(gè)排列參數(shù)缺口罰分為10和缺口長(zhǎng)度罰分為10。成對(duì)排列參數(shù)是Ktuple=3,gap penalty=3,和windows=20。
多肽片段術(shù)語(yǔ)“多肽片段”在此定義為從氨基酸序列或其同系物的氨基和/或羧基末端缺失一個(gè)或多個(gè)氨基酸的多肽,其中該片段具有α-葡糖苷酶活性。在優(yōu)選的方面,片段包含SEQ ID NO2或其同系物的至少770個(gè)氨基酸殘基,更優(yōu)選至少800個(gè)氨基酸殘基,以及最優(yōu)選至少830個(gè)氨基酸殘基。在另外優(yōu)選的方面,片段包含SEQ ID NO4或其同系物的至少820個(gè)氨基酸殘基,更優(yōu)選至少860個(gè)氨基酸殘基,以及最優(yōu)選至少900個(gè)氨基酸殘基。在另外優(yōu)選的方面,片段包含SEQ ID NO6或其同系物的至少820個(gè)氨基酸殘基,更優(yōu)選至少860個(gè)氨基酸殘基,以及最優(yōu)選至少900個(gè)氨基酸殘基。
等位變體術(shù)語(yǔ)“等位變體”在此表示占據(jù)相同染色體位點(diǎn)的基因的任何兩個(gè)或多個(gè)備選形式。等位變化通過突變天然產(chǎn)生,并且可能導(dǎo)致種群內(nèi)的多態(tài)性?;蛲蛔兛赡苁浅聊?在編碼的多肽中無(wú)變化)或可能編碼具有改變的氨基酸序列的多肽。多肽的等位變體是由基因的等位變體編碼的多肽。
分離的多核苷酸術(shù)語(yǔ)“分離的多核苷酸”如在此使用的,是指通過瓊脂糖電泳所測(cè)定的為至少20%純、優(yōu)選至少40%純、更優(yōu)選至少60%純、更優(yōu)選至少80%純、最優(yōu)選至少90%純、以及最優(yōu)選至少95%純。
基本上純的多核苷酸術(shù)語(yǔ)“基本上純的多核苷酸”如在此使用的,是指不含其他外來(lái)的或不需要的核苷酸,并且為適用于遺傳工程化蛋白質(zhì)生產(chǎn)系統(tǒng)的形式的多核苷酸制品。因此,基本上純的多核苷酸按重量計(jì)包含至多10%、優(yōu)選至多8%、更優(yōu)選至多6%、更優(yōu)選至多5%、更優(yōu)選至多4%、更優(yōu)選至多3%、更優(yōu)選至多2%、最優(yōu)選至多1%、以及最優(yōu)選至多0.5%的與其天然或重組締合的其他多核苷酸物質(zhì)。然而基本上純的多核苷酸可包括天然存在的5’和3’非翻譯區(qū),例如啟動(dòng)子和終止子。優(yōu)選基本上純的多核苷酸按重量計(jì)算是至少90%純,優(yōu)選至少92%純,更優(yōu)選至少94%純,更優(yōu)選至少95%純,更優(yōu)選至少96%純,更優(yōu)選至少97%純,更優(yōu)選至少98%純,最優(yōu)選至少99%,以及更優(yōu)選至少99.5%純。本發(fā)明的多核苷酸優(yōu)選是基本上純的形式。特別地,優(yōu)選在此公開的多核苷酸是“本質(zhì)上純的形式”(essentially),即,該多核苷酸制品基本上不含與其天然或重組締合的其他多核苷酸物質(zhì)。在此術(shù)語(yǔ)“基本上純的多核苷酸”和術(shù)語(yǔ)“分離的多核苷酸”以及“分離形式的多核苷酸”同義。多核苷酸可以是基因組、cDNA、RNA、半合成的、合成的起源,或其任何組合。
亞序列術(shù)語(yǔ)“亞序列”在此定義為從多核苷酸或其同系物的5′和/或3′端缺失一個(gè)或多個(gè)核苷酸的核苷酸序列,其中該亞序列編碼具有α-葡糖苷酶活性的多肽片段。在優(yōu)選的方面,亞序列包含SEQ ID NO1或其同系物的至少2310個(gè)核苷酸,更優(yōu)選至少2400個(gè)核苷酸,以及最優(yōu)選至少2490個(gè)核苷酸。在另外優(yōu)選的方面,亞序列包含SEQ ID NO3或其同系物的至少2460個(gè)核苷酸,更優(yōu)選至少2580個(gè)核苷酸,以及最優(yōu)選至少2700個(gè)核苷酸。在另外優(yōu)選的方面,亞序列包含SEQ ID NO5或其同系物的至少2460個(gè)核苷酸,更優(yōu)選至少2580個(gè)核苷酸,以及最優(yōu)選至少2700個(gè)核苷酸。
cDNA術(shù)語(yǔ)″cDNA″在此定義為可通過從真核細(xì)胞獲得的成熟、拼接、mRNA分子逆轉(zhuǎn)錄制備的DNA分子。cDNA缺乏通常存在于相應(yīng)的基因組DNA中的內(nèi)含子序列。起始的、初級(jí)RNA轉(zhuǎn)錄本是在作為成熟拼接的mRNA出現(xiàn)前通過一系列步驟加工的mRNA前體。這些步驟包括通過稱為拼接的過程除去內(nèi)含子序列。來(lái)源于mRNA的cDNA因此缺乏任何內(nèi)含子序列。
核酸構(gòu)建體術(shù)語(yǔ)″核酸構(gòu)建體″如在此使用的,是指分離自天然存在的基因或已經(jīng)被改變而以不會(huì)另外天然存在的方式包含核酸節(jié)段的單鏈-或雙鏈的核酸分子。當(dāng)核酸構(gòu)建體包含為表達(dá)本發(fā)明的編碼序列所需要的調(diào)控序列時(shí),術(shù)語(yǔ)核酸構(gòu)建體和術(shù)語(yǔ)“表達(dá)盒”同義。
調(diào)控序列術(shù)語(yǔ)“調(diào)控序列”在此定義為包括為表達(dá)編碼本發(fā)明多肽的多核苷酸所必需或有益的所有組分。每個(gè)調(diào)控序列對(duì)于編碼該多肽的核苷酸序列可能是天然的或彼此是天然或外來(lái)的。這種調(diào)控序列包括但不限于前導(dǎo)序列、多腺苷酸化序列、前肽序列、啟動(dòng)子、信號(hào)肽序列、和轉(zhuǎn)錄終止子。至少該調(diào)控序列包括啟動(dòng)子、和轉(zhuǎn)錄和翻譯終止信號(hào)。調(diào)控序列可能為了導(dǎo)入促進(jìn)調(diào)控序列與編碼多肽的核苷酸序列編碼區(qū)連接的特異限制性位點(diǎn)的目的而擁有連接子。
可操作連接的術(shù)語(yǔ)“可操作連接的”在此表示其中調(diào)控序列被置于相對(duì)于多核苷酸序列的編碼序列適當(dāng)?shù)奈恢枚沟迷撜{(diào)控序列指導(dǎo)多肽編碼序列的表達(dá)的構(gòu)型。
編碼序列當(dāng)在此使用時(shí),術(shù)語(yǔ)“編碼序列”是指直接確定其蛋白質(zhì)產(chǎn)物的氨基酸序列的核苷酸序列。編碼序列的邊界通常由開放閱讀框來(lái)確定,其通常從ATG起始密碼子或備選的起始密碼子,例如GTG和TTG開始,并且以例如TAA、TAG和TGA的終止密碼子結(jié)束。編碼序列可以是DNA、cDNA或重組的核苷酸序列。
表達(dá)術(shù)語(yǔ)“表達(dá)”包括涉及多肽生產(chǎn)的任何步驟,包括但不限于轉(zhuǎn)錄、轉(zhuǎn)錄后修飾、翻譯、翻譯后修飾、和分泌。
表達(dá)載體術(shù)語(yǔ)“表達(dá)載體”在此定義為包括編碼本發(fā)明多肽的多核苷酸,并且其與保證其表達(dá)的附加核苷酸可操作連接的線性或環(huán)狀DNA分子。
宿主細(xì)胞術(shù)語(yǔ)″宿主細(xì)胞″如在此使用的,包括對(duì)用包括本發(fā)明多核苷酸的核酸構(gòu)建體或表達(dá)載體轉(zhuǎn)化、轉(zhuǎn)染、轉(zhuǎn)導(dǎo)等易感的任何細(xì)胞類型。
修飾術(shù)語(yǔ)“修飾”在此是指由SEQ ID NO2的第15至881位氨基酸、SEQ ID NO4的第30至967位氨基酸、或SEQ ID NO6的第20至988位氨基酸、或其同源序列組成的多肽的任何化學(xué)修飾,以及編碼那個(gè)多肽的DNA的遺傳操作。修飾可以是取代、缺失和/或插入一個(gè)或多個(gè)氨基酸以及置換一個(gè)或多個(gè)氨基酸側(cè)鏈。
人工變體當(dāng)在此使用時(shí),術(shù)語(yǔ)“人工變體”是指由表達(dá)SEQ ID NO1、SEQ ID NO3、或SEQ ID NO5的修飾核苷酸序列的生物體產(chǎn)生的具有α-葡糖苷酶活性的多肽。修飾的核苷酸序列是通過改變?cè)赟EQ ID NO1、SEQID NO3、或SEQ ID NO5中公開的核苷酸序列的人為介入獲得的。
發(fā)明詳述具有α-葡糖苷酶活性的多肽在第一個(gè)方面,本發(fā)明涉及具有與SEQ ID NO2的第15至881位氨基酸或SEQ ID NO4的第30至967位氨基酸(即,成熟多肽)有至少75%,優(yōu)選至少80%,更優(yōu)選至少85%,更優(yōu)選至少90%,最優(yōu)選至少95%,以及最優(yōu)選至少97%的同一性程度的氨基酸序列,且具有α-葡糖苷酶活性的分離多肽,或與SEQ ID NO6的第20至988位氨基酸(即,成熟多肽)有至少85%,優(yōu)選至少90%,更優(yōu)選至少95%,以及最優(yōu)選至少97%的氨基酸序列,且具有α-葡糖苷酶活性的分離多肽(在下文中為″同源多肽″)。在優(yōu)選的方面,同源多肽具有與SEQ ID NO2的第15至881位氨基酸,SEQID NO4的第30至967位氨基酸,或SEQ ID NO6的第20至988位氨基酸相差10個(gè)氨基酸,優(yōu)選相差5個(gè)氨基酸,更優(yōu)選相差4個(gè)氨基酸,更優(yōu)選相差3個(gè)氨基酸,最優(yōu)選相差2個(gè)氨基酸,以及最優(yōu)選相差1個(gè)氨基酸的氨基酸序列。
本發(fā)明的多肽優(yōu)選包括SEQ ID NO2的氨基酸序列,或其等位變體;或具有α-葡糖苷酶活性的其片段。在優(yōu)選的方面,多肽包括SEQ ID NO2的氨基酸序列。在另外優(yōu)選的方面,多肽包括SEQ ID NO2的第15至881位氨基酸,或其等位變體;或具有α-葡糖苷酶活性的其片段。在另外優(yōu)選的方面,多肽包括SEQ ID NO2的第15至881位氨基酸。在另外優(yōu)選的方面,多肽由SEQ ID NO2的氨基酸序列或其等位變體;或具有α-葡糖苷酶活性的其片段組成。在另外優(yōu)選的方面,多肽由SEQ ID NO2的氨基酸序列組成。在另外優(yōu)選的方面,多肽由SEQ ID NO2的第15至881位氨基酸或其等位變體;或具有α-葡糖苷酶活性的其片段組成。在另外優(yōu)選的方面,多肽由SEQ ID NO2的第15至881位氨基酸組成。
本發(fā)明的多肽優(yōu)選包括SEQ ID NO4的氨基酸序列,或其等位變體;或具有α-葡糖苷酶活性的其片段。在優(yōu)選的方面,多肽包括SEQ ID NO4的氨基酸序列。在另外優(yōu)選的方面,多肽包括SEQ ID NO4的第30至967位氨基酸,或其等位變體;或具有α-葡糖苷酶活性的其片段。在另外優(yōu)選的方面,多肽包括SEQ ID NO4的第30至967位氨基酸。在另外優(yōu)選的方面,多肽由SEQ ID NO4的氨基酸序列或其等位變體;或具有α-葡糖苷酶活性的其片段組成。在另外優(yōu)選的方面,多肽由SEQ ID NO4的氨基酸序列組成。在另外優(yōu)選的方面,多肽由SEQ ID NO4的第30至967位氨基酸或其等位變體;或具有α-葡糖苷酶活性的其片段組成。在另外優(yōu)選的方面,多肽由SEQ ID NO4的第30至967位氨基酸組成。
本發(fā)明的多肽優(yōu)選包括SEQ ID NO6的氨基酸序列,或其等位變體;具有α-葡糖苷酶活性的其片段。在優(yōu)選的方面,多肽包括SEQ ID NO6的氨基酸序列。在另外優(yōu)選的方面,多肽包括SEQ ID NO6的第20至988位氨基酸,或其等位變體;或具有α-葡糖苷酶活性的其片段。在另外優(yōu)選的方面,多肽包括SEQ ID NO6的第20至988位氨基酸。在另外優(yōu)選的方面,多肽由SEQ ID NO6的氨基酸序列或其等位變體;或具有α-葡糖苷酶活性的其片段組成。在另外優(yōu)選的方面,多肽由SEQ ID NO6的氨基酸序列組成。在另外優(yōu)選的方面,多肽由SEQ ID NO6的第20至988位氨基酸或其等位變體;或具有α-葡糖苷酶活性的其片段組成。在另外優(yōu)選的方面,多肽由SEQ ID NO6的第20至988位氨基酸組成。
在第二個(gè)方面,本發(fā)明涉及由在極低嚴(yán)謹(jǐn)條件,優(yōu)選低嚴(yán)謹(jǐn)條件,更優(yōu)選中等嚴(yán)謹(jǐn)條件,更優(yōu)選中-高嚴(yán)謹(jǐn)條件,更優(yōu)選高嚴(yán)謹(jǐn)條件,以及最優(yōu)選極高嚴(yán)謹(jǐn)條件下與(i)SEQ ID NO1的第43至2643位核苷酸、SEQID NO3的第146至3013位核苷酸,或SEQ ID NO5的第58至3164位核苷酸,(ii)包含在SEQ ID NO1的第43至2643位核苷酸、SEQ ID NO3的第146至3013位核苷酸、或SEQ ID NO5的第58至3164位核苷酸中的cDNA序列,或(iii)(i)或(ii)的亞序列,或(iv)(i)、(ii)或(iii)的互補(bǔ)鏈(J.Sambrook,E.F.Fritsch,and T.Maniatus,1989,Molecular Cloning,ALaboratory Manual,2d edition,Cold Spring Harbor,New York)雜交的多核苷酸編碼的具有α-葡糖苷酶活性的分離多肽。SEQ ID NO1的亞序列包含至少100個(gè)連續(xù)的核苷酸或優(yōu)選至少200個(gè)連續(xù)的核苷酸。此外,該亞序列可編碼具有α-葡糖苷酶活性的多肽片段。
SEQ ID NO1、SEQ ID NO3、或SEQ ID NO5的核苷酸序列;或其亞序列,以及SEQ ID NO2、SEQ ID NO4、或SEQ ID NO6的氨基酸序列;或其片段,可用于設(shè)計(jì)核酸探針來(lái)根據(jù)本領(lǐng)域已知的方法從不同種屬的菌株鑒定和克隆編碼具有α-葡糖苷酶活性的多肽的DNA。特別地,這種探針可用于按照標(biāo)準(zhǔn)的Southern印跡方法與感興趣種屬的基因組或cDNA雜交,以鑒定和分離其中相應(yīng)的基因。這種探針可能比起完整的序列來(lái)是相當(dāng)短的,但應(yīng)該是至少14,優(yōu)選至少25,更優(yōu)選至少35,以及最優(yōu)選至少70個(gè)核苷酸長(zhǎng)度。然而優(yōu)選該核酸探針是至少100個(gè)核苷酸長(zhǎng)度。例如,核酸探針可以是至少200個(gè)核苷酸,優(yōu)選至少300個(gè)核苷酸,更優(yōu)選至少400個(gè)核苷酸,或最優(yōu)選至少500個(gè)核苷酸長(zhǎng)度。即使可能使用較長(zhǎng)的探針,例如是至少600個(gè)核苷酸,至少優(yōu)選至少700個(gè)核苷酸,更優(yōu)選至少800個(gè)核苷酸,或最優(yōu)選至少900個(gè)核苷酸長(zhǎng)度的核酸探針。DNA和RNA探針都能被使用。該探針一般被標(biāo)記來(lái)用于檢測(cè)相應(yīng)的基因(例如,使用32P,3H,35S,生物素,或抗生物素蛋白)。這種探針包括在本發(fā)明中。
從這種其他生物體制備的基因組DNA或cDNA文庫(kù)因此可能用于篩選與上述探針雜交和編碼具有α-葡糖苷酶活性的多肽的DNA。來(lái)自這種其他生物體的基因組或其他DNA可通過瓊脂糖或聚丙烯酰胺凝膠電泳,或其他的分離技術(shù)來(lái)區(qū)分。來(lái)自文庫(kù)的DNA或分離的DNA可被轉(zhuǎn)移和固定至硝化纖維或其他合適的載體材料上。為了鑒定與SEQ ID NO1、SEQ ID NO3、或SEQ ID NO5,或其亞序列同源的克隆或DNA,該載體材料被用于Southern印跡。
為了本發(fā)明的目的,雜交表明該核苷酸序列與相應(yīng)于SEQ ID NO1、SEQ ID NO3、或SEQ ID NO5所示的核苷酸序列,其互補(bǔ)鏈,或其亞序列的標(biāo)記核酸探針在極低至極高嚴(yán)謹(jǐn)條件下雜交。在這些條件下與該核酸探針雜交的分子可利用X光膠片檢測(cè)。
在優(yōu)選的方面,該核酸探針是SEQ ID NO1的第43至2643位核苷酸。在另外優(yōu)選的方面,該核酸探針是編碼SEQ ID NO2的多肽,或其亞序列的多核苷酸序列。在另外優(yōu)選的方面,該核酸探針是SEQ ID NO1。在另外優(yōu)選的方面,該核酸探針是SEQ ID NO1的成熟多肽編碼區(qū)。在另外優(yōu)選的方面,該核酸探針是包含在質(zhì)粒pSMO216中的多核苷酸序列,而該質(zhì)粒包含在大腸桿菌NRRL B-30751中,其中多核苷酸序列編碼具有α-葡糖苷酶活性的多肽。在另外優(yōu)選的方面,該核酸探針是包含在質(zhì)粒pSMO216中的成熟多肽編碼區(qū),其中該質(zhì)粒包含在大腸桿菌NRRL B-30751中。
在另外優(yōu)選的方面,該核酸探針是SEQ ID NO3的第146至3013位核苷酸。在另外優(yōu)選的方面,該核酸探針是編碼SEQ ID NO4的多肽,或其亞序列的多核苷酸序列。在另外優(yōu)選的方面,該核酸探針是SEQ ID NO3。在另外優(yōu)選的方面,該核酸探針是SEQ ID NO3的成熟多肽編碼區(qū)。在另外優(yōu)選的方面,該核酸探針是包含在質(zhì)粒pHyGe011中的多核苷酸序列,而該質(zhì)粒包含在大腸桿菌NRRL B-30750中,其中其多核苷酸序列編碼具有α-葡糖苷酶活性的多肽。在另外優(yōu)選的方面,該核酸探針是包含在質(zhì)粒pHyGe011中的成熟多肽編碼區(qū),其中該質(zhì)粒包含在大腸桿菌NRRL B-30750中。
在另外優(yōu)選的方面,該核酸探針是SEQ ID NO5的第58至3164位核苷酸。在另外優(yōu)選的方面,該核酸探針是編碼SEQ ID NO6的多肽,或其亞序列的多核苷酸序列。在另外優(yōu)選的方面,該核酸探針是SEQ ID NO5。在另外優(yōu)選的方面,該核酸探針是SEQ ID NO5的成熟多肽編碼區(qū)。在另外優(yōu)選的方面,該核酸探針是包含在質(zhì)粒pJSF9b中的多核苷酸序列,而該質(zhì)粒包含在大腸桿菌NRRL B-30856中,其中其多核苷酸序列編碼具有α-葡糖苷酶活性的多肽。在另外優(yōu)選的方面,該核酸探針是包含在質(zhì)粒pJSF9b中的成熟多肽編碼區(qū),其中該質(zhì)粒包含在大腸桿菌NRRL B-30856中。
對(duì)于至少100個(gè)核苷酸長(zhǎng)度的長(zhǎng)探針,極低至極高嚴(yán)謹(jǐn)條件定義為在42℃在5X SSPE,0.3%SDS,200μg/ml剪切和變性的鮭魚精DNA中預(yù)雜交和雜交,并且對(duì)于極低和低嚴(yán)謹(jǐn)為25%甲酰胺,對(duì)于中等和中-高嚴(yán)謹(jǐn)為25%甲酰胺,對(duì)于高和極高嚴(yán)謹(jǐn)為50%甲酰胺,按照標(biāo)準(zhǔn)的Southern印跡方法,12至24小時(shí)最佳。
對(duì)于至少100個(gè)核苷酸長(zhǎng)度的長(zhǎng)探針,載體材料最后利用2X SSC,0.2%SDS優(yōu)選至少在45℃(極低嚴(yán)謹(jǐn)),更優(yōu)選至少在50℃(低嚴(yán)謹(jǐn)),更優(yōu)選至少在55℃(中等嚴(yán)謹(jǐn)),更優(yōu)選至少在60℃(中-高嚴(yán)謹(jǐn)),更優(yōu)選至少在65℃(高嚴(yán)謹(jǐn)),以及最優(yōu)選至少在70℃(極高嚴(yán)謹(jǐn))洗滌3次,每次15分鐘。
對(duì)于大約15個(gè)核苷酸至大約70個(gè)核苷酸長(zhǎng)度的短探針,嚴(yán)謹(jǐn)條件定義為在低于利用Bolton和McCarthy(1962,Proceedings of the NationalAcademy of Sciences USA 481390)所述的算法計(jì)算的Tm大約5℃至大約10℃,在0.9M NaCl,0.09M Tris-HCl pH 7.6,6mM EDTA,0.5%NP-40,1XDenhardt′s溶液,1mM焦磷酸鈉,1mM一元(monobasic)磷酸鈉,0.1mMATP,和每ml 0.2mg酵母RNA,按照標(biāo)準(zhǔn)的Southern印跡方法進(jìn)行預(yù)雜交、雜交、和雜交后洗滌。
對(duì)于大約15個(gè)核苷酸至大約70個(gè)核苷酸長(zhǎng)度的短探針,載體材料在低于計(jì)算的Tm5℃至10℃,在6X SCC加0.1%SDS中洗滌15分鐘一次,并利用6X SSC洗滌2次,每次15分鐘。
在包含鹽的雜交條件下,有效的Tm是控制探針和成功雜交的濾過結(jié)合DNA之間所需要的同一性程度的溫度。有效的Tm可利用確定2個(gè)DNAs在各種嚴(yán)謹(jǐn)條件下雜交所需要的同一性程度的下列公式來(lái)確定。
在第三個(gè)方面,本發(fā)明涉及具有下列物理化學(xué)特性的具有α-葡糖苷酶活性的分離多肽在50mM乙酸鹽緩沖液/50mM磷酸鹽緩沖液中,在37℃,最適pH在大約3.5至大約4.5的范圍內(nèi),優(yōu)選大約3.8至大約4.5,更優(yōu)選大約4.0至大約4.5,最優(yōu)選大約4.0至大約4.3,以及最優(yōu)選大約pH 4.1;在50mM乙酸鈉pH 5.0中最適溫度在大約60℃至大約63℃的范圍內(nèi);以及在50mM乙酸鈉pH 5.0中5分鐘,熱穩(wěn)定性達(dá)到大約67℃至大約70℃(大約80%剩余活性)。在優(yōu)選的方面,具有α-葡糖苷酶活性的分離多肽在50mM乙酸鈉pH 5.0中5分鐘具有達(dá)到大約67℃(大約80%剩余活性)的熱穩(wěn)定性。在另外優(yōu)選的方面,具有α-葡糖苷酶活性的分離多肽在50mM乙酸鈉pH 5.0中5分鐘具有達(dá)到大約70℃(大約80%剩余活性)的熱穩(wěn)定性。
在第四個(gè)方面,本發(fā)明涉及包括SEQ ID NO2、SEQ ID NO4、或SEQID NO6;或其成熟多肽的一個(gè)或多個(gè)氨基酸的保守取代、缺失、和/或插入的人工變體。優(yōu)選地,氨基酸變化具有次要的特性,也就是說(shuō)不顯著影響蛋白質(zhì)的折疊和/或活性的保守氨基酸取代或插入;一般為1個(gè)至大約30個(gè)氨基酸的小的缺失;小的氨基或羧基末端延伸,例如氨基端甲硫氨酸殘基;最多大約20-25個(gè)殘基的小接頭肽;或通過變化凈電荷或另外的功能,例如聚組氨酸區(qū)、抗原表位或結(jié)合結(jié)構(gòu)域的促進(jìn)純化的小的延伸。
保守取代的實(shí)例在堿性氨基酸(精氨酸、賴氨酸和組氨酸)、酸性氨基酸(谷氨酸和天冬氨酸)、極性氨基酸(谷氨酰胺和天門冬酰胺)、疏水性氨基酸(亮氨酸、異亮氨酸和纈氨酸)、芳香族氨基酸(苯基丙氨酸、色氨酸和酪氨酸)、和小的氨基酸(甘氨酸、丙氨酸、絲氨酸、蘇氨酸和甲硫氨酸)組的范圍之內(nèi)。通常不改變特異活性的氨基酸取代是本領(lǐng)域已知的,并且通過例如H.Neurath and R.L.Hill,1979,In,The Proteins,Academic Press,New York有描述。最通常發(fā)生的互換是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu、和Asp/Gly。
除20個(gè)標(biāo)準(zhǔn)氨基酸之外,非標(biāo)準(zhǔn)的氨基酸(例如4-羥脯氨酸、6-N-甲基賴氨酸、2-氨基異丁酸、異纈氨酸、和α-甲基絲氨酸)可能被野生型多肽的氨基酸殘基替代。有限數(shù)目的非保守氨基酸,不由遺傳密碼編碼的氨基酸和非天然的氨基酸可被氨基酸殘基替代?!胺翘烊坏陌被帷逡呀?jīng)在蛋白質(zhì)合成后被修飾,和/或在其側(cè)鏈具有不同于標(biāo)準(zhǔn)氨基酸的化學(xué)結(jié)構(gòu)。非天然的氨基酸可被化學(xué)合成,優(yōu)選是可商業(yè)購(gòu)買的,以及包括六氫吡啶羧酸、噻唑烷羧酸、脫氫脯氨酸、3-和4-甲基脯氨酸、和3,3-二甲基脯氨酸。
備選地,氨基酸變化具有該多肽的理化性質(zhì)被改變的這種特性。例如,氨基酸變化可能改善多肽的熱穩(wěn)定性,改變底物特異性,變化最適pH等等。
親本多肽中的必需氨基酸可根據(jù)本領(lǐng)域已知的方法來(lái)鑒定,例如定點(diǎn)誘變或丙氨酸掃描誘變(Cunningham and Wells,1989,Science 2441081-1085)。在后者的技術(shù)中,單個(gè)的丙氨酸突變被導(dǎo)入分子的每個(gè)殘基,測(cè)試所得到的突變分子的生物活性(即,α-葡糖苷酶活性)以鑒定對(duì)該分子的活性至關(guān)重要的氨基酸殘基。也參見,Hilton et al.,1996,J.Biol.Chem.2714699-4708。酶的活性部位或其他的生物學(xué)相互作用還可通過結(jié)構(gòu)的物理分析來(lái)確定,如通過例如核磁共振、結(jié)晶學(xué)、電子衍射、或光親和標(biāo)記的技術(shù)結(jié)合假定的接觸位點(diǎn)氨基酸的突變來(lái)測(cè)定。參見例如,de Vos et al.,1992,Science 255306-312;Smith et al.,1992,J.Mol.Biol.224899-904;Wlodaveret al.,1992,F(xiàn)EBS Lett.30959-64。必需氨基酸的同一性還可從與本發(fā)明所述多肽相關(guān)的多肽的同一性分析來(lái)推斷。
可利用已知的誘變、重組、和/或改組方法,繼之以適當(dāng)?shù)暮Y選程序產(chǎn)生和測(cè)試單個(gè)或多個(gè)氨基酸取代,例如由Reidhaar-Olson和Sauer,1988,Science 24153-57;Bowie and Sauer,1989,Proc.Natl.Acad. Sci.USA 862152-2156;WO 95/17413;or WO 95/22625所描述的。能被使用的其他方法包括易錯(cuò)PCR、噬菌體展示(例如Lowman et al.,1991,Biochem.3010832-10837;美國(guó)專利號(hào)5,223,409;WO 92/06204),和定區(qū)域誘變(Derbyshire et al.,1986,Gene 46145;Ner et al.,1988,DNA 7127).
誘變/改組方法可與高通量、自動(dòng)篩選方法結(jié)合以檢測(cè)由宿主細(xì)胞表達(dá)的克隆、誘變多肽的活性。編碼活性多肽的誘變DNA分子可從宿主細(xì)胞回收并且利用本領(lǐng)域的標(biāo)準(zhǔn)方法快速測(cè)序。這些方法容許快速測(cè)定感興趣多肽中個(gè)別氨基酸殘基的重要性,并且可被應(yīng)用于未知結(jié)構(gòu)的多肽。
SEQ ID NO2的第15至881位氨基酸、SEQ ID NO4的第30至967位氨基酸、或SEQ ID NO6的第20至988位氨基酸的氨基酸取代、缺失和/或插入的總數(shù)是10,優(yōu)選9,更優(yōu)選8,更優(yōu)選7,更優(yōu)選至多6,更優(yōu)選至多5,更優(yōu)選4,更優(yōu)選3,最優(yōu)選2,以及最優(yōu)選1。
具有α-葡糖苷酶活性的多肽的來(lái)源本發(fā)明的多肽可獲得自任何屬的微生物。為了本發(fā)明的目的,如在此使用的術(shù)語(yǔ)“獲得自”結(jié)合給定的來(lái)源應(yīng)指由核苷酸序列編碼的多肽是通過該來(lái)源或通過其中已經(jīng)被插入來(lái)自該來(lái)源的核苷酸序列的細(xì)胞生產(chǎn)的。在優(yōu)選的方面,獲得自給定來(lái)源的多肽是細(xì)胞外分泌的。
本發(fā)明的多肽可以是細(xì)菌多肽。例如,多肽可以是革蘭氏陽(yáng)性細(xì)菌的多肽,例如芽孢桿菌屬多肽,例如,嗜堿芽孢桿菌(Bacillus alkalophilus)、解淀粉芽孢桿菌(Bacillus amyloliquefaciens)、短芽孢桿菌(Bacillus brevis)、環(huán)狀芽孢桿菌(Bacillus circulans)、凝結(jié)芽孢桿菌(Bacillus coagulans)、燦爛芽孢桿菌(Bacillus lautus)、遲緩芽孢桿菌(Bacillus lentus)、地衣芽孢桿菌(Bacillus licheniformis)、巨大芽孢桿菌(Bacillus megaterium)、嗜熱脂肪芽孢桿菌(Bacillus stearothermophilus)、枯草芽孢桿菌(Bacillus subtilis)、或蘇云金芽孢桿菌(Bacillus thuringiensis)多肽;或鏈霉菌屬(Streptomyces)多肽,例如,淺青紫鏈霉菌(Streptomyces lividans)或鼠灰鏈霉菌(Streptomyces murinus)多肽;或革蘭氏陰性細(xì)菌多肽,例如,大腸桿菌或假單胞菌屬(Pseudomonas)多肽。
本發(fā)明的多肽也可以是真菌多肽,并且更優(yōu)選酵母多肽,例如假絲酵母(Candida)、克魯維氏酵母(Kluyveromyces)、畢赤氏酵母(Pichia)、糖酵母(Saccharomyces)、裂殖酵母(Schizosaccharomyces)、或耶氏酵母(Yarrowia)多肽;或更優(yōu)選絲狀真菌多肽,例如枝頂孢屬(Acremonium)、曲霉屬(Aspergillus)、短梗霉屬(Aureobasidium)、隱球酵母屬(Cryptococcus)、Filibasidium、鐮孢屬(Fusarium)、腐殖菌屬(Humicol)、稻瘟霉屬(Magnaporthe)、毛霉屬(Mucor)、毀絲霉屬(Myceliophthora)、Neocallimastix、脈孢菌屬(Neurospora)、擬青霉屬(Paecilomyces)、青霉屬(Penicillium)、Piromyces、裂褶菌屬(Schizophyllum)、踝節(jié)菌屬(Talaromyces)、熱子囊菌屬(Thermoascus)、草根霉屬(Thielavia)、彎勁霉屬(Tolypocladium)、或木霉屬(Trichoderma)多肽。
在優(yōu)選的方面,多肽是具有α-葡糖苷酶活性的卡爾斯伯酵母(Saccharomyces carlsbergensis)、釀酒酵母(Saccharomyces cerevisiae)、糖化酵母(Saccharomyces diastaticus)、Saccharomyces douglasii、克魯維酵母(Saccharomyces kluyveri)、諾地糖酵母(Saccharomyces norbensis)、或卵形糖酵母(Saccharomyces oviformis)多肽。
在另外優(yōu)選的方面,多肽是具有α-葡糖苷酶活性的棘孢曲霉(Aspergillus aculeatus,)、泡盛曲霉(Aspergillus awamori)、煙曲霉(Aspergillusfumigatus)、臭曲霉(Aspergillus foetidus)、日本曲霉(Aspergillus japonicus)、構(gòu)巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillus niger)、米曲霉(Aspergillusoryzae)、桿孢狀鐮孢(Fusarium bactridioides)、Fusarium cerealis、Fusariumcrookwellense,大刀鐮孢(Fusarium culmorum)、禾谷鐮孢(Fusariumgraminearum)、禾赤鐮孢(Fusarium graminum)、異孢鐮孢(Fusariumheterosporum)、合歡木鐮孢(Fusarium negundi)、尖孢鐮孢(Fusariumoxysporum)、多枝鐮孢(Fusarium reticulatum)、粉紅鐮孢(Fusarium roseum)、接骨木鐮孢(Fusarium sambucinum)、膚色鐮孢(Fusarium sarcochroum)、擬分枝孢鐮孢(Fusarium sporotrichioides)、硫色鐮孢(Fusarium sulphureum)、Fusarium torulosum、Fusarium trichothecioides、Fusarium venenatum、Humicola insolens、Humicola lanuginosa、米赫毛霉(Mucor miehei)、嗜熱毀絲霉(Myceliophthora thermophila)、粗糙鏈孢霉(Neurospora crassa)、或產(chǎn)紫青霉(Penicillium purpurogenum)、哈茨木霉(Trichoderma harzianum)、康寧氏木霉(Trichoderma koningii)、Trichoderma longibrachiatum、里氏木霉(Trichoderma reesei)、或綠色木霉(Trichoderma viride)多肽。
在更優(yōu)選的方面,多肽是煙曲霉多肽,例如,SEQ ID NO2、SEQ IDNO4、或SEQ ID NO6的多肽、或其成熟多肽。
可以理解對(duì)于上述種屬,本發(fā)明包括完全的和不完全的狀態(tài),及其他分類學(xué)上的等價(jià)物,例如無(wú)性型,無(wú)論它們已知的種屬名稱。本領(lǐng)域的技術(shù)人員將容易地識(shí)別合適等價(jià)物的同一性。
這些種屬的菌株可在許多菌種保藏處由公眾容易地獲得,例如美國(guó)典型培養(yǎng)物保藏中心(ATCC)、德國(guó)微生物保藏中心(Deutsche Sammlung vonMikroorganismen und Zellkulturen GmbH)(DSM)、真菌菌種保藏中心(Centraalbureau Voor Schimmelcultures)(CBS)、和農(nóng)業(yè)研究機(jī)構(gòu)保藏中心(Agricultural Research Service Patent Culture Collection,Northern RegionalResearch Center)(NRRL)。
此外,這種多肽可利用上述探針從其他來(lái)源,包括分離自自然界(例如土壤、堆肥、水等)的微生物鑒定和獲得。用于從天然生境分離微生物的技術(shù)是本領(lǐng)域已知的。然后多核苷酸可通過類似地篩選別的微生物的基因組或cDNA文庫(kù)來(lái)獲得。一旦已經(jīng)用探針檢測(cè)到編碼多肽的多核苷酸序列,該多核苷酸可通過利用本領(lǐng)域普通技術(shù)人員已知的技術(shù)分離或克隆(參見例如,Sambrook et al.,1989,同上文)。
本發(fā)明的多肽也包括融合多肽或可切割的融合多肽,其中另外的多肽融合在該多肽或其片段的N-末端或C-末端。融合的多肽通過將編碼另外多肽的核苷酸序列(或其部分)融合至本發(fā)明的核苷酸序列(或其部分)來(lái)產(chǎn)生。用于生產(chǎn)融合多肽的技術(shù)是本領(lǐng)域已知的,包括連接編碼多肽的編碼序列以使得它們處于框內(nèi)并且該融合多肽的表達(dá)在相同啟動(dòng)子和終止子的控制之下。
多核苷酸本發(fā)明也涉及具有編碼本發(fā)明多肽的核苷酸序列的分離多核苷酸。
在優(yōu)選的方面,該核苷酸序列如SEQ ID NO1所示。在另外更優(yōu)選的方面,該核苷酸序列是包含在質(zhì)粒pSMO216中的序列,其中該質(zhì)粒包含在大腸桿菌NRRL B-30751中。在另外優(yōu)選的方面,該核苷酸序列是SEQ IDNO1的成熟多肽編碼區(qū)。在另外更優(yōu)選的方面,該核苷酸序列是包含在質(zhì)粒pSMO216中的成熟多肽編碼區(qū),其中該質(zhì)粒包含在大腸桿菌NRRL B-30751中。本發(fā)明也包括編碼具有SEQ ID NO2或其成熟多肽的氨基酸序列的多肽的核苷酸序列,其由于遺傳密碼的簡(jiǎn)并性而不同于SEQ ID NO1。本發(fā)明也涉及編碼具有α-葡糖苷酶活性的SEQ ID NO2片段的SEQ ID NO1的亞序列。
在另外優(yōu)選的方面,該核苷酸序列如SEQ ID NO3所示。在另外更優(yōu)選的方面,該核苷酸序列是包含在質(zhì)粒pHyGe011中的序列,其中該質(zhì)粒包含在大腸桿菌NRRL B-30750中。在另外優(yōu)選的方面,該核苷酸序列是SEQ ID NO3的成熟多肽編碼區(qū)。在另外更優(yōu)選的方面,該核苷酸序列是包含在質(zhì)粒pHyGe011中的成熟多肽編碼區(qū),其中該質(zhì)粒包含在大腸桿菌NRRL B-30750中。本發(fā)明也包括編碼具有SEQ ID NO4或其成熟多肽的氨基酸序列的多肽的核苷酸序列,其由于遺傳密碼的簡(jiǎn)并性而不同于SEQID NO3。本發(fā)明也涉及編碼具有α-葡糖苷酶活性的SEQ ID NO4片段的SEQ ID NO3的亞序列。
在另外優(yōu)選的方面,該核苷酸序列如SEQ ID NO5所示。在另外更優(yōu)選的方面,該核苷酸序列是包含在質(zhì)粒pJSF9b中的序列,其中該質(zhì)粒包含在大腸桿菌NRRL B-30856中。在另外優(yōu)選的方面,該核苷酸序列是SEQID NO5的成熟多肽編碼區(qū)。在另外更優(yōu)選的方面,該核苷酸序列是包含在質(zhì)粒pJSF9b中的成熟多肽編碼區(qū),其中該質(zhì)粒包含在大腸桿菌NRRL B-30856中。本發(fā)明也包括編碼具有SEQ ID NO6或其成熟多肽的氨基酸序列的多肽的核苷酸序列,其由于遺傳密碼的簡(jiǎn)并性而不同于SEQ ID NO5。本發(fā)明也涉及編碼具有α-葡糖苷酶活性的SEQ ID NO6片段的SEQ ID NO5的亞序列。
本發(fā)明也涉及在SEQ ID NO1的成熟多肽編碼序列中包括至少一個(gè)突變的突變多核苷酸,其中該突變的核苷酸序列編碼由SEQ ID NO2的第15至881位氨基酸組成的多肽。
本發(fā)明也涉及在SEQ ID NO3的成熟多肽編碼序列中包括至少一個(gè)突變的突變多核苷酸,其中該突變的核苷酸序列編碼由SEQ ID NO4的第30至967位氨基酸組成的多肽。
本發(fā)明也涉及在SEQ ID NO5的成熟多肽編碼序列中包括至少一個(gè)突變的突變多核苷酸,其中該突變的核苷酸序列編碼由SEQ ID NO6的第20至988位氨基酸組成的多肽。
用于分離或克隆編碼多肽的多核苷酸的技術(shù)是本領(lǐng)域已知的,并且包括從基因組DNA分離,從cDNA制備,或其組合。來(lái)自這種基因組DNA的本發(fā)明多核苷酸的克隆可例如通過利用已知的聚合酶鏈?zhǔn)椒磻?yīng)(PCR)或表達(dá)文庫(kù)的抗體篩選以檢測(cè)具有共用結(jié)構(gòu)特點(diǎn)的克隆DNA片段來(lái)實(shí)現(xiàn)。參見例如,Innis et al.,1990,PCRA Guide to Methods and Application,AcademicPress,New York??墒褂闷渌暮怂釘U(kuò)增方法,例如連接酶鏈?zhǔn)椒磻?yīng)(LCR)、連接活化的轉(zhuǎn)錄(LAT)和基于核苷酸序列的擴(kuò)增(NASBA)。該多核苷酸可能克隆自曲霉屬的細(xì)胞,或另外的或相關(guān)的生物體,因此例如可能是編碼核苷酸序列區(qū)域的多肽的等位或種屬變體。
本發(fā)明也涉及具有與SEQ ID NO1的成熟多肽編碼序列(即,第142至2943位核苷酸)有至少75%,優(yōu)選至少80%,更優(yōu)選至少85%,更優(yōu)選至少90%,更優(yōu)選至少95%,以及最優(yōu)選至少97%同一性程度,編碼活性多肽的核苷酸序列的多核苷酸。
本發(fā)明也涉及具有與SEQ ID NO3的成熟多肽編碼序列(即,第142至2943位核苷酸)有至少75%,優(yōu)選至少80%,更優(yōu)選至少85%,更優(yōu)選至少90%,更優(yōu)選至少95%,以及最優(yōu)選至少97%同一性程度,編碼活性多肽的核苷酸序列的多核苷酸。
本發(fā)明也涉及具有與SEQ ID NO5的成熟多肽編碼序列(即,第142至2943位核苷酸)有至少75%,優(yōu)選至少80%,更優(yōu)選至少85%,更優(yōu)選至少90%,更優(yōu)選至少95%,以及最優(yōu)選至少97%同一性程度,編碼活性多肽的核苷酸序列的多核苷酸。
編碼本發(fā)明多肽的核苷酸序列的改變可能是為合成基本上類似于該多肽的多肽所必需的。術(shù)語(yǔ)與多肽“基本上相似的”是指非天然存在形式的多肽。這些多肽可能以一些工程化的方式不同于分離自其天然來(lái)源的多肽,例如特異活性、熱穩(wěn)定性、最適pH等有不同的人工變體。變體序列可根據(jù)如SEQ ID NO1、SEQ ID NO3、或SEQ ID NO5的多肽編碼區(qū),例如其亞序列存在的核苷酸序列,和/或通過導(dǎo)入不產(chǎn)生由該核苷酸序列編碼的多肽另外氨基酸序列,但其相應(yīng)于為生產(chǎn)酶而設(shè)計(jì)的的宿主生物體的密碼子利用率的核苷酸取代,或通過導(dǎo)入可能產(chǎn)生不同氨基酸序列的核苷酸取代來(lái)構(gòu)建。參見例如,F(xiàn)ord et al.,1991,Protein Expression and Purification 295-107對(duì)于核苷酸取代的概述。
對(duì)本領(lǐng)域的技術(shù)人員顯而易見的是這種取代可在對(duì)該分子功能至關(guān)重要的區(qū)域外產(chǎn)生并且仍然生成活性多肽。對(duì)由本發(fā)明的分離多核苷酸編碼的多肽,并且因此優(yōu)選沒有經(jīng)受取代的多肽的活性所必需的氨基酸殘基可根據(jù)本領(lǐng)域已知的方法來(lái)鑒定,例如定點(diǎn)誘變或丙氨酸掃描誘變(參見例如,Cunningham and Wells,1989,Science 2441081-1085)。在后者的技術(shù)中,在分子中的每個(gè)帶陽(yáng)電荷的殘基導(dǎo)入突變,并且測(cè)試所得到的突變分子的α-葡糖苷酶活性以鑒定對(duì)該分子活性至關(guān)重要的氨基酸殘基。底物酶相互作用的位點(diǎn)還可通過分析立體結(jié)構(gòu)來(lái)確定,如通過例如核磁共振分析、結(jié)晶學(xué)或光親合標(biāo)記的技術(shù)來(lái)測(cè)定(參見例如,de Vos et al.,1992,Science 255306-312;Smith et al.,1992,Journal of Molecular Biology 224899-904;Wlodaver et al.,1992,F(xiàn)EBS Letters 30959-64)。
本發(fā)明也涉及編碼本發(fā)明多肽的分離多核苷酸,其如在此定義的,在極低嚴(yán)謹(jǐn)條件,優(yōu)選低嚴(yán)謹(jǐn)條件,更優(yōu)選中等嚴(yán)謹(jǐn)條件,更優(yōu)選中-高嚴(yán)謹(jǐn)條件,更優(yōu)選高嚴(yán)謹(jǐn)條件,以及最優(yōu)選極高嚴(yán)謹(jǐn)條件下與(i)SEQ ID NO1的第43至2643位核苷酸、SEQ ID NO3的第146至3013位核苷酸,或SEQID NO5的第58至3164位核苷酸,(ii)包含在SEQ ID NO1的第43至2643位核苷酸、SEQ ID NO3的第146至3013位核苷酸、或SEQ ID NO5的第58至3164位核苷酸中的cDNA序列,或(iii)(i)或(ii)的互補(bǔ)鏈,或其等位變體和亞序列(Sambrook et al.,1989,同上文)雜交。
本發(fā)明也涉及通過(a)將DNA群在極低、低、中、中-高、高、或極高嚴(yán)謹(jǐn)條件下與(i)SEQ ID NO1的第43至2643位核苷酸、SEQ ID NO3的第146至3013位核苷酸,或SEQ ID NO5的第58至3164位核苷酸,(ii)包含在SEQ ID NO1的第43至2643位核苷酸、SEQ ID NO3的第146至3013位核苷酸、或SEQ ID NO5的第58至3164位核苷酸中的cDNA序列,或(iii)(i)或(ii)的互補(bǔ)鏈雜交;以及(b)分離編碼具有α-葡糖苷酶活性的多肽的雜交多核苷酸來(lái)獲得的分離多核苷酸。
核酸構(gòu)建體本發(fā)明也涉及包括與指導(dǎo)編碼序列在合適的宿主細(xì)胞中在與該調(diào)控序列相適合的條件下表達(dá)的一個(gè)或多個(gè)調(diào)控序列可操作連接的本發(fā)明分離多核苷酸的核酸構(gòu)建體。
編碼本發(fā)明多肽的分離多核苷酸可以多種方式被操作以保證該多肽的表達(dá)。在其插入載體之前該多核苷酸序列的操作可能根據(jù)該表達(dá)載體而是合乎需要或必需的。利用重組DNA方法來(lái)改變多核苷酸序列的技術(shù)是本領(lǐng)域已知的。
調(diào)控序列可以是合適的啟動(dòng)子序列,由用于表達(dá)編碼本發(fā)明多肽的多核苷酸的宿主細(xì)胞識(shí)別的核苷酸序列。啟動(dòng)子序列包含介導(dǎo)多肽表達(dá)的轉(zhuǎn)錄調(diào)控序列。啟動(dòng)子可以是在所選擇的宿主細(xì)胞中顯示轉(zhuǎn)錄活性的任何核苷酸序列,包括突變的、截短的、和雜合啟動(dòng)子,并且可從編碼與該宿主細(xì)胞同源或異源的胞外或胞內(nèi)多肽的基因獲得。
用于指導(dǎo)本發(fā)明的核酸構(gòu)建體,特別是在細(xì)菌宿主細(xì)胞中轉(zhuǎn)錄的合適啟動(dòng)子的實(shí)例是從大腸桿菌lac操縱子、天藍(lán)色鏈霉菌(Streptomycescoelicolor)瓊脂糖酶基因(dagA)、枯草芽胞桿菌果聚糖蔗糖酶基因(sacB)、地衣芽孢桿菌α-淀粉酶基因(amyL)、嗜熱脂肪芽孢桿菌生麥芽糖淀粉酶基因(amyM)、解淀粉芽孢桿菌α-淀粉酶基因(amyQ)、地衣芽孢桿菌青霉素酶基因(penP)、枯草芽胞桿菌xylA和xylB基因、和原核β-內(nèi)酰胺酶基因獲得的啟動(dòng)子(Villa-Kamaroff et al.,1978,Proceedings of the National Academy ofSciences USA 753727-3731),以及tac啟動(dòng)子(DeBoer et al.,1983,Proceedings of the National Academy of Sciences USA 8021-25)。進(jìn)一步的啟動(dòng)子在Scientific American,1980,24274-94中的″Useful proteins fromrecombinant bacteria″和Sambrook et al.,1989,同上文中有描述。
用于指導(dǎo)本發(fā)明的核酸構(gòu)建體在絲狀真菌宿主細(xì)胞中轉(zhuǎn)錄的合適啟動(dòng)子的實(shí)例是從米曲霉TAKA淀粉酶、米黑根毛霉天冬氨酸蛋白酶、黑曲霉中性α-淀粉酶、黑曲霉酸穩(wěn)定的α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、米黑根毛霉脂肪酶、米曲霉堿性蛋白酶、米曲霉磷酸丙糖異構(gòu)酶、構(gòu)巢曲霉乙酰胺酶、Fusarium venenatum淀粉葡萄糖苷酶(WO 00/56900)、Fusarium venenatum Daria(WO 00/56900)、Fusarium venenatum Quinn(WO00/56900)、尖孢鐮孢胰蛋白酶-樣蛋白酶(WO 96/00787)、里氏木霉β-葡糖苷酶、里氏木霉纖維二糖水解酶I、里氏木霉葡聚糖內(nèi)切酶I、里氏木霉葡聚糖內(nèi)切酶II、里氏木霉葡聚糖內(nèi)切酶III、里氏木霉葡聚糖內(nèi)切酶IV、里氏木霉葡聚糖內(nèi)切酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉β-木糖苷酶的基因獲得的啟動(dòng)子,以及NA2-tpi啟動(dòng)子(來(lái)自黑曲霉中性α-淀粉酶和米曲霉磷酸丙糖異構(gòu)酶基因的啟動(dòng)子雜合體);及其突變的、截短的、和雜合的啟動(dòng)子。
在酵母宿主中,有用的啟動(dòng)子獲得自釀酒酵母烯醇酶(ENO-1)、釀酒酵母半乳糖激酶(GAL1)、釀酒酵母乙醇脫氫酶/甘油醛-3-磷酸脫氫酶(ADH1,ADH2/GAP)、釀酒酵母磷酸丙糖異構(gòu)酶(TPI)、釀酒酵母金屬金屬硫蛋白(metallothionine)(CUP1)、和釀酒酵母3-磷酸甘油酸(phosphorglycerate)激酶的基因。用于酵母宿主細(xì)胞的其他有用啟動(dòng)子由Romanos et al.,1992,Yeast 8423-488描述。
調(diào)控序列也可以是合適的轉(zhuǎn)錄終止子序列,由宿主細(xì)胞識(shí)別以終止轉(zhuǎn)錄的序列。終止子序列與編碼該多肽的核苷酸序列的3’末端可操作連接。在選擇的宿主細(xì)胞中有功能的任何終止子都可用于本發(fā)明。
用于絲狀真菌宿主細(xì)胞的優(yōu)選終止子獲得自米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、構(gòu)巢曲霉鄰氨基苯甲酸合酶、黑曲霉α-葡糖苷酶、和尖鐮孢胰蛋白酶-樣蛋白酶的基因。
用于酵母宿主細(xì)胞的優(yōu)選終止子獲得自釀酒酵母烯醇酶、釀酒酵母細(xì)胞色素C(CYC1)、和釀酒酵母甘油醛-3-磷酸脫氫酶的基因。用于酵母宿主細(xì)胞的其他有用終止子由Romanos et al.,1992,同上文描述。
調(diào)控序列也可以是合適的前導(dǎo)序列,對(duì)宿主細(xì)胞翻譯重要的mRNA的非翻譯區(qū)。前導(dǎo)序列與編碼該多肽的核苷酸序列的5’末端可操作連接。在選擇的宿主細(xì)胞中有功能的任何終止子都可用于本發(fā)明。
用于絲狀真菌宿主細(xì)胞的優(yōu)選前導(dǎo)序列獲得自米曲霉TAKA淀粉酶和構(gòu)巢曲霉磷酸丙糖異構(gòu)酶的基因.
用于酵母宿主細(xì)胞的合適的前導(dǎo)序列獲得自釀酒酵母烯醇酶(ENO-1)、釀酒酵母3-磷酸甘油酸激酶、釀酒酵母α-因子,和釀酒酵母乙醇脫氫酶/甘油醛-3-磷酸脫氫酶(ADH2/GAP)的基因。
調(diào)控序列也可以是多腺苷酸化序列,與核苷酸序列的3’末端可操作連接,并且當(dāng)轉(zhuǎn)錄時(shí),由宿主細(xì)胞識(shí)別為向轉(zhuǎn)錄的mRNA添加多腺苷殘基的信號(hào)的序列。在選擇的宿主細(xì)胞中有功能的任何多腺苷序列都可用于本發(fā)明。
用于絲狀真菌宿主細(xì)胞的優(yōu)選多腺苷酸化序列獲得自米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、構(gòu)巢曲霉鄰氨基苯甲酸合酶、尖鐮孢胰蛋白酶-樣蛋白酶,和黑曲霉α-葡糖苷酶的基因。
用于酵母宿主細(xì)胞的有用多腺苷酸化序列由Guo和Sherman,1995,Molecular Cellular Biology 155983-5990描述。
調(diào)控序列也可以是編碼與多肽的氨基末端連接的氨基酸序列并且指導(dǎo)該編碼的多肽進(jìn)入細(xì)胞分泌途徑的信號(hào)肽編碼區(qū)。核苷酸序列編碼序列的5’端可固有地包含天然連接具有編碼分泌多肽的編碼區(qū)節(jié)段的翻譯閱讀框的信號(hào)肽編碼區(qū)。備選地,編碼序列的5’端可包含與該編碼區(qū)外源的信號(hào)肽編碼區(qū)。當(dāng)編碼序列非天然地包含信號(hào)肽編碼區(qū)時(shí),可能需要外來(lái)的信號(hào)肽編碼區(qū)。備選地,外來(lái)的信號(hào)肽編碼區(qū)可簡(jiǎn)單地替換天然的信號(hào)肽編碼區(qū)以增強(qiáng)多肽的分泌。然而指導(dǎo)表達(dá)的多肽進(jìn)入選擇的宿主細(xì)胞的分泌途徑的任何信號(hào)肽編碼區(qū)都可用于本發(fā)明。
用于細(xì)菌宿主細(xì)胞的有效信號(hào)肽編碼區(qū)是從芽孢桿菌NCIB 11837生麥芽糖淀粉酶、嗜熱脂肪芽孢桿菌α-淀粉酶、地衣芽孢桿菌枯草桿菌蛋白酶、地衣芽孢桿菌β-內(nèi)酰胺酶、嗜熱脂肪芽孢桿菌中性蛋白酶(nprT,nprS,nprM)、和枯草芽胞桿菌prsA的基因獲得的信號(hào)肽編碼區(qū)。進(jìn)一步的信號(hào)肽由Simonen和Palva,1993,Microbiological Reviews 57109-137描述。
用于絲狀真菌宿主細(xì)胞的有效信號(hào)肽編碼區(qū)是從米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米黑根毛霉天冬氨酸蛋白酶、Humicola insolens纖維素酶、和Humicola lanuginosa脂肪酶的基因獲得的信號(hào)肽編碼區(qū)。
在優(yōu)選的方面,該信號(hào)肽編碼區(qū)是編碼SEQ ID NO2的第1至14位氨基酸的SEQ ID NO1的第1至42位核苷酸。
在另外優(yōu)選的方面,該信號(hào)肽編碼區(qū)是編碼SEQ ID NO4的第1至29位氨基酸的SEQ ID NO3的第1至145位核苷酸。
在另外優(yōu)選的方面,該信號(hào)肽編碼區(qū)是編碼SEQ ID NO6的第1至19位氨基酸的SEQ ID NO5的第1至57位核苷酸。
用于酵母宿主細(xì)胞的有用信號(hào)肽獲得自釀酒酵母α-因子和釀酒酵母轉(zhuǎn)化酶的基因。其他有用的信號(hào)肽編碼區(qū)由Romanos et al.,1992,同上文描述。
調(diào)控序列也可以是編碼位于多肽氨基端的氨基酸序列的前肽編碼區(qū)。所得到的多肽被稱為前酶或前多肽(或有時(shí)候?yàn)槊冈?。前多肽通常是無(wú)活性的并且可通過前肽從前多肽的催化或自催化裂解而被轉(zhuǎn)化為成熟的活性多肽。前肽編碼區(qū)可獲得自枯草芽胞桿菌堿性蛋白酶(aprE)、枯草芽胞桿菌中性蛋白酶(nprT)、釀酒酵母α-因子、米黑根毛霉天冬氨酸蛋白酶、和嗜熱毀絲霉漆酶(WO 95/33836)的基因。
當(dāng)信號(hào)肽和前肽區(qū)都存在于多肽的氨基端時(shí),前肽區(qū)緊鄰多肽的氨基端而信號(hào)肽區(qū)緊鄰前肽區(qū)的氨基端。
可能也需要添加容許調(diào)節(jié)多肽相對(duì)于宿主細(xì)胞生長(zhǎng)而表達(dá)的調(diào)節(jié)序列。調(diào)節(jié)系統(tǒng)的實(shí)例是導(dǎo)致基因表達(dá)根據(jù)化學(xué)或物理的刺激,包括存在調(diào)節(jié)化合物而打開或關(guān)閉的調(diào)節(jié)系統(tǒng)。原核系統(tǒng)中的調(diào)節(jié)系統(tǒng)包括lac、tac、和trp操縱子系統(tǒng)。在酵母中,可使用ADH2系統(tǒng)或GAL1系統(tǒng)。在絲狀真菌中,TAKAα-淀粉酶啟動(dòng)子、黑曲霉葡糖淀粉酶啟動(dòng)子、和米曲霉葡糖淀粉酶啟動(dòng)子可用作調(diào)控序列。調(diào)節(jié)序列的其他實(shí)例是容許基因擴(kuò)增的調(diào)節(jié)序列。在真核系統(tǒng)中,這些包括在存在氨甲蝶呤時(shí)擴(kuò)增的二氫葉酸還原酶基因,和伴隨重金屬擴(kuò)增的金屬硫蛋白基因。在這些情況下,編碼多肽的核苷酸序列與調(diào)節(jié)序列可操作連接。
表達(dá)載體本發(fā)明也涉及包括本發(fā)明多核苷酸、啟動(dòng)子、和轉(zhuǎn)錄及翻譯終止信號(hào)的重組表達(dá)載體。上述的各種核酸和調(diào)控序列可被連接在一起以產(chǎn)生可能包括一個(gè)或多個(gè)容許在這種位點(diǎn)插入或置換編碼多肽的核苷酸序列的方便限制性位點(diǎn)的重組表達(dá)載體。備選地,本發(fā)明的核苷酸序列可通過插入核苷酸序列或包括進(jìn)入適當(dāng)表達(dá)載體的序列的核酸構(gòu)建體而被表達(dá)。在制造表達(dá)載體時(shí),編碼序列位于載體中以使得該編碼序列可操作地連接用于表達(dá)的適當(dāng)調(diào)控序列。
重組表達(dá)載體可以是能夠方便地經(jīng)受重組DNA方法并且可導(dǎo)致感興趣的核苷酸序列表達(dá)的任何載體(例如,質(zhì)?;虿《?。載體的選擇一般取決于載體與其中被導(dǎo)入該載體的宿主細(xì)胞的相容性。該載體可以是線性或閉合的環(huán)形質(zhì)粒。
載體可以是自主復(fù)制的載體,即,作為染色體外實(shí)體存在,其復(fù)制不依賴于染色體復(fù)制的載體,例如質(zhì)粒、染色體外元件、微型染色體、或人工染色體。載體可包含用于保證自我復(fù)制的任何方式。備選地,載體可以是當(dāng)被導(dǎo)入宿主細(xì)胞時(shí),整合到基因組中并且與其已經(jīng)被整合進(jìn)入的染色體一起復(fù)制的載體。此外,可使用一起包含將被導(dǎo)入宿主細(xì)胞基因組的總DNA的單個(gè)載體或質(zhì)?;騼蓚€(gè)或多個(gè)載體或質(zhì)粒,或轉(zhuǎn)座子。
本發(fā)明的載體優(yōu)選包含一個(gè)或多個(gè)容許容易選擇轉(zhuǎn)化細(xì)胞的可選擇標(biāo)記??蛇x擇的標(biāo)記是基因,其產(chǎn)物提供對(duì)殺生物劑或病毒的抗性、對(duì)重金屬的抗性、原養(yǎng)型至營(yíng)養(yǎng)缺陷型(prototrophy to auxotrophs)等。
細(xì)菌的可選擇標(biāo)記的實(shí)例是來(lái)自枯草芽胞桿菌或地衣芽孢桿菌的dal基因,或賦予例如氨芐青霉素、卡那霉素、氯霉素、或四環(huán)素抗性的抗生素抗性的標(biāo)記。用于酵母宿主細(xì)胞的合適標(biāo)記是ADE2,HIS3,LEU2,LYS2,MET3,TRP1,和URA3。用于絲狀真菌宿主細(xì)胞的可選擇標(biāo)記包括但不限于,amdS(乙酰胺酶)、argB(鳥氨酸氨甲?;D(zhuǎn)移酶)、bar(phosphinothricin轉(zhuǎn)乙酰酶)、hph(潮霉素磷酸轉(zhuǎn)移酶)、niaD(硝酸還原酶)、pyrG(乳清苷-5’-磷酸酯脫羧酶)、sC(硫酸腺苷轉(zhuǎn)移酶)、和trpC(鄰氨基苯甲酸合酶),及其等同物。優(yōu)選用于曲霉屬細(xì)胞的是構(gòu)巢曲霉或米曲霉的amdS和pyrG基因,和吸水鏈霉菌的bar基因。
本發(fā)明的載體優(yōu)選包含容許該載體整合進(jìn)入宿主細(xì)胞基因組或該載體在細(xì)胞中獨(dú)立于基因組自主復(fù)制的元件。
對(duì)于整合進(jìn)入宿主細(xì)胞基因組,載體可依賴于編碼多肽的多核苷酸序列或用于通過同源或非同源重組使該載體整合進(jìn)入基因組的載體的任何其他元件。備選地,該載體可包含通過同源重組在染色體的準(zhǔn)確位置直接整合進(jìn)入宿主細(xì)胞基因組的附加核苷酸序列。為了增加在準(zhǔn)確位置整合的可能性,該整合元件應(yīng)優(yōu)選包含足夠數(shù)目的核酸,例如100至10,000個(gè)堿基對(duì)、優(yōu)選400至10,000個(gè)堿基對(duì),以及最優(yōu)選800至10,000個(gè)堿基對(duì),其與相應(yīng)的靶序列具有高度同一性以增強(qiáng)同源重組的概率。該整合元件可以是與宿主細(xì)胞基因組中靶序列同源的任何序列。此外,該整合元件可以是非編碼或編碼的核苷酸序列。另一方面,載體可通過非同源重組被整合進(jìn)入宿主細(xì)胞的基因組。
對(duì)于自主復(fù)制,該載體可進(jìn)一步包括能夠使載體在所述的宿主細(xì)胞中自主復(fù)制的復(fù)制原點(diǎn)。復(fù)制原點(diǎn)可以是在細(xì)胞中起作用的調(diào)節(jié)自主復(fù)制的任何質(zhì)粒復(fù)制子。術(shù)語(yǔ)“復(fù)制原點(diǎn)”或“質(zhì)粒復(fù)制子”在此定義為使質(zhì)?;蜉d體能夠體內(nèi)復(fù)制的核苷酸序列。
細(xì)菌的復(fù)制原點(diǎn)的實(shí)例是容許在大腸桿菌中復(fù)制的質(zhì)粒pBR322,pUC19,pACYC177,和pACYC184,和容許在芽孢桿菌中復(fù)制的質(zhì)粒pUB110,pE194,pTA1060,和pAMβ1的復(fù)制原點(diǎn)。
用于酵母宿主細(xì)胞的復(fù)制原點(diǎn)的實(shí)例是2微粒(micro)復(fù)制原點(diǎn)、ARS1,ARS4、ARS1和CEN3的組合、和ARS4和CEN6的組合。
用于絲狀真菌細(xì)胞的復(fù)制原點(diǎn)的實(shí)例是AMA1和ANS1(Gems et al.,1991,Gene 9861-67;Cullen et al.,1987,Nucleic Acids Research 159163-9175;WO 00/24883)。AMA1基因的分離和包括該基因的質(zhì)?;蜉d體的構(gòu)建可根據(jù)WO 00/24883中公開的方法來(lái)實(shí)現(xiàn)。
一個(gè)以上拷貝的本發(fā)明的多核苷酸可被插入宿主細(xì)胞以增加該基因產(chǎn)物的產(chǎn)量。多核苷酸拷貝數(shù)的增加可通過將至少一個(gè)附加拷貝的多核苷酸整合進(jìn)入宿主細(xì)胞基因組或通過包括可擴(kuò)增的選擇標(biāo)記基因和該多核苷酸來(lái)獲得,其中包含擴(kuò)增拷貝的選擇標(biāo)記多核苷酸并且由此包含附加拷貝多核苷酸的細(xì)胞可通過在存在適當(dāng)?shù)倪x擇劑時(shí)培養(yǎng)該細(xì)胞來(lái)篩選。
用于連接上述元件以構(gòu)建本發(fā)明的重組表達(dá)載體的方法對(duì)于本領(lǐng)域的技術(shù)人員來(lái)說(shuō)是已知的(參見例如,Sambrook et al.,1989,同上文)。
宿主細(xì)胞本發(fā)明也涉及包括被有利地用于重組生產(chǎn)多肽的本發(fā)明多核苷酸的重組宿主細(xì)胞。包括本發(fā)明多核苷酸的載體被導(dǎo)入宿主細(xì)胞以使得該載體如早先說(shuō)明的作為染色體的組成部分或作為染色體外的自我復(fù)制載體來(lái)維持。術(shù)語(yǔ)″宿主細(xì)胞″包括由于在復(fù)制期間發(fā)生突變而與親本細(xì)胞不相同的親本細(xì)胞任何后代。宿主細(xì)胞的選擇在很大程度上取決于編碼多肽的基因及其來(lái)源。
宿主細(xì)胞可以是單細(xì)胞微生物,例如原核生物,或非單細(xì)胞微生物,例如真核生物。
有用的單細(xì)胞微生物是細(xì)菌細(xì)胞,例如革蘭氏陽(yáng)性細(xì)菌,包括但不限于,芽孢桿菌細(xì)胞,例如,嗜堿芽胞桿菌、解淀粉芽胞桿菌、短芽孢桿菌、環(huán)狀芽孢桿菌、Bacillus clausii、凝結(jié)芽孢桿菌、燦爛芽胞桿菌、遲緩芽胞桿菌、地衣芽孢桿菌、巨大芽孢桿菌、嗜熱脂肪芽孢桿菌、枯草芽胞桿菌、和蘇云金桿菌;或鏈霉菌細(xì)胞,例如,淺青紫鏈霉菌和鼠灰鏈霉菌,或革蘭氏陰性細(xì)菌,例如大腸桿菌和假單胞菌屬。在優(yōu)選的方面,細(xì)菌宿主細(xì)胞是遲緩芽胞桿菌、地衣芽孢桿菌、嗜熱脂肪芽孢桿菌、或枯草芽胞桿菌細(xì)胞。在另外優(yōu)選的方面,芽胞桿菌細(xì)胞是嗜堿的芽胞桿菌。
將載體導(dǎo)入細(xì)菌宿主細(xì)胞可例如通過原生質(zhì)體轉(zhuǎn)化(參見例如,Changand Cohen,1979,Molecular General Genetics 168111-115),利用感受態(tài)細(xì)胞(參見例如,Young and Spizizen,1961,Journal of Bacteriology 81823-829,或Dubnau and Davidoff-Abelson,1971,Journal of Molecular Biology 56209-221)、電穿孔(參見例如,Shigekawa and Dower,1988,Biotechniques 6742-751)、或接合(參見例如,Koehler and Thorne,1987,Journal ofBacteriology 1695771-5278)來(lái)實(shí)現(xiàn)。
宿主細(xì)胞也可以是真核生物,例如哺乳動(dòng)物、昆蟲、植物或真菌細(xì)胞。
在優(yōu)選的方面,宿主細(xì)胞是真菌細(xì)胞。如在此使用的“真菌”包括子囊菌門(Ascomycota)、擔(dān)子菌門(Basidiomycota)、壺菌門(Chytridiomycota)、和接合菌門(Zygomycota)(如Hawksworth et al.,In,Ainsworth and Bisby’sDictionary of The Fungi,8th edition,1995,CAB International,University Press,Cambridge,UK所描述的),以及卵菌門(如在Hawksworth et al.,1995,supra,page 171中所引用的)和所有的mitosporic真菌(Hawksworth et al.,1995,supra)。
在更優(yōu)選的方面,宿主細(xì)胞是酵母細(xì)胞。如在此使用的“酵母”包括產(chǎn)子囊酵母(內(nèi)孢霉目)(Endomycetales)、產(chǎn)生擔(dān)子孢子酵母(basidiosporogenousyeast)、和屬于半知菌類(芽生菌)(the Fungi Imperfecti(Blastomycetes))的酵母。因?yàn)榻湍傅姆诸惪赡茉趯?lái)有變化,為了本發(fā)明的目的,酵母應(yīng)定義為在Biology and Activities of Yeast(Skinner,F(xiàn).A.,Passmore,S.M.,andDavenport,R.R.,eds,Soc.App.Bacteriol.Symposium Series No.9,1980)中所說(shuō)明的。
在更優(yōu)選的方面,酵母宿主細(xì)胞是假絲酵母、漢遜氏酵母(Hansenula)、克魯維氏酵母、畢赤氏酵母、糖酵母、裂殖酵母(Schizosaccharomyces)、或耶氏酵母(Yarrowia)細(xì)胞。
在最優(yōu)選的方面,酵母宿主細(xì)胞是卡爾斯伯酵母(Saccharomycescarlsbergensis)、釀酒酵母、Saccharomyces diastaticus、Saccharomycesdouglasii、克魯弗糖酵母(Saccharomyces kluyveri)、諾地糖酵母(Saccharomyces norbensis)、或卵形糖酵母(Saccharomyces oviformis)細(xì)胞。在另外的最優(yōu)選方面,酵母宿主細(xì)胞是乳酸克魯維氏酵母(Kluyveromyces lactis)細(xì)胞。在另外的最優(yōu)選方面,酵母宿主細(xì)胞是Yarrowia lipolytica細(xì)胞。
在另外的更優(yōu)選方面,真菌宿主細(xì)胞是絲狀真菌細(xì)胞?!敖z狀真菌”包括真菌(Eumycota)亞門和卵菌門(Oomycota)的全部絲狀體(如Hawksworth et al.,1995,同上文所描述的)。絲狀真菌通常的特征在于菌絲的壁由幾丁質(zhì)、纖維素、葡聚糖、殼聚糖(chitosan)、甘露聚糖、及其他復(fù)合多糖組成。營(yíng)養(yǎng)生長(zhǎng)是通過菌絲的伸長(zhǎng),而碳分解代謝是專性需氧的。相比之下,例如釀酒酵母的酵母營(yíng)養(yǎng)生長(zhǎng)是通過單細(xì)胞葉狀體的出芽,而碳分解代謝可能是發(fā)酵性的。
在更優(yōu)選的方面,絲狀的真菌宿主細(xì)胞是支頂孢屬(Acremonium)、曲霉屬、短梗霉屬(Aureobasidium)、Bjerkandera,Ceriporiopsis,鬼傘屬(Coprinus)、Coriolus,隱球酵母屬(Cryptococcus)、Filibasidium,鐮孢屬、腐殖菌屬、Magnaporthe、毛霉屬、毀絲霉屬、Neocallimastix,脈孢菌屬、擬青霉屬(Paecilomyces)、青霉屬、Phanerochaete,Phlebia,Piromyces,側(cè)耳屬(Pleurotus)、裂褶菌屬(Schizophyllum)、Talaromyces,Thermoascus,草根霉屬、Tolypocladium,Trametes,或木霉屬(Trichoderma)細(xì)胞。
在最優(yōu)選的方面,絲狀真菌宿主細(xì)胞是泡盛曲霉、煙曲霉、臭曲霉、日本曲霉、構(gòu)巢曲霉、黑曲霉、或米曲霉細(xì)胞細(xì)胞。在另外的最優(yōu)選方面,絲狀的真菌宿主細(xì)胞是桿孢狀鐮孢、Fusarium cerealis,F(xiàn)usariumcrookwellense,大刀鐮孢、禾谷鐮孢、禾赤鐮孢、異孢鐮孢、合歡木鐮孢、尖孢鐮孢、多枝鐮孢、粉紅鐮孢、接骨木鐮孢、膚色鐮孢、擬分枝孢鐮孢、硫色鐮孢、Fusarium torulosum,F(xiàn)usarium trichothecioides,或Fusariumvenenatum細(xì)胞。在另外的最優(yōu)選方面,絲狀的真菌宿主細(xì)胞是Bjerkanderaadusta,Ceriporiopsis aneirina,Ceriporiopsis aneirina,Ceriporiopsis caregiea,Ceriporiopsis gilvescens,Ceriporiopsis pannocinta,Ceriporiopsis rivulosa,Ceriporiopsis subrufa,Ceriporiopsis subvermispora,灰蓋鬼傘(Corioluscinereus)、Coriolus hirsutus,Humicola insolens,Humicola lanuginosa,米赫毛霉(Mucor miehei)、嗜熱毀絲霉(Myceliophthora thermophila)、粗糙鏈孢霉(Neurospora crassa)、產(chǎn)紫青霉(Penicillium purpurogenum)、Phanerochaetechrysosporium,Phlebia radiata,Pleurotus eryngii,Thielavia terrestris,Trametesvillosa,Trametes versicolor,哈茨木霉(Trichoderma harzianum)、康寧氏木霉、Trichoderma longibrachiatum,里氏木霉(Trichoderma reesei)、或綠色木霉(Trichoderma viride)細(xì)胞。
真菌細(xì)胞可通過涉及原生質(zhì)體形成、原生質(zhì)體轉(zhuǎn)化、和細(xì)胞壁再生的本質(zhì)上已知的方法而被轉(zhuǎn)化。用于轉(zhuǎn)化曲霉和木霉宿主細(xì)胞的合適方法在EP 238 023和Yelton et al.,1984,Proceedings of the National Academy ofSciences USA 811470-1474中有描述。用于轉(zhuǎn)化鐮孢種屬的合適方法由Malardier et al.,1989,Gene 78147-156,and WO 96/00787描述。酵母可利用由Becker和Guarente,In Abelson,J.N.and Simon,M.I.,editors,Guide to YeastGenetics and Molecular Biology,Methods in Enzymology,Volume 194,pp182-187,Academic Press,Inc.,New York;Ito et al.,1983,Journal ofBacteriology 153163;and Hinnen et al.,1978,Proceedings of the NationalAcademy of Sciences USA 751920描述的方法轉(zhuǎn)化。
生產(chǎn)方法本發(fā)明也涉及生產(chǎn)本發(fā)明多肽的方法,包括(a)培養(yǎng)在其野生型形式時(shí)在有助于生產(chǎn)多肽的條件下能夠生產(chǎn)多肽的細(xì)胞;以及(b)回收多肽。優(yōu)選地,該細(xì)胞屬于曲霉屬,以及更優(yōu)選為煙曲霉。
本發(fā)明也涉及生產(chǎn)本發(fā)明多肽的方法,包括(a)在有助于生產(chǎn)多肽的條件下培養(yǎng)宿主細(xì)胞;以及(b)回收多肽。
本發(fā)明也涉及生產(chǎn)本發(fā)明多肽的方法,包括(a)在有助于生產(chǎn)多肽的條件下培養(yǎng)宿主細(xì)胞,其中該宿主細(xì)胞包括在SEQ ID NO1、SEQ ID NO3、或SEQ ID NO5的成熟多肽編碼區(qū)中具有至少一個(gè)突變的突變多核苷酸,其中該突變的核苷酸序列分別編碼由SEQ ID NO2的第15至881位氨基酸、SEQ ID NO4的第30至967位氨基酸、或SEQ ID NO6的第20至988位氨基酸組成的多肽,以及(b)回收多肽。
在本發(fā)明的生產(chǎn)方法中,細(xì)胞利用本領(lǐng)域已知的方法在適于生產(chǎn)多肽的培養(yǎng)基中培養(yǎng)。例如,細(xì)胞可通過在實(shí)驗(yàn)室或工業(yè)發(fā)酵罐中進(jìn)行的搖瓶載培、和小規(guī)模的或大規(guī)模的發(fā)酵(包括連續(xù)的、分批的、分批補(bǔ)料、或固態(tài)發(fā)酵),在合適的培養(yǎng)基和容許該多肽表達(dá)和/或分離的條件下進(jìn)行培養(yǎng)。培養(yǎng)發(fā)生在利用本領(lǐng)域已知的方法包括碳和氮源和無(wú)機(jī)鹽的合適培養(yǎng)基中。合適的培養(yǎng)基可獲得自商業(yè)供應(yīng)者或可根據(jù)公開的組合物(例如,在美國(guó)典型物培養(yǎng)中心的目錄中)來(lái)制備。如果該多肽分泌進(jìn)入培養(yǎng)基,該多肽可從培養(yǎng)基直接回收。如果該多肽不是分泌的,它可從細(xì)胞裂解物回收。
多肽可利用本領(lǐng)域已知的特異于該多肽的方法來(lái)檢測(cè)。這些檢測(cè)方法可包括特異抗體的使用,酶產(chǎn)物的形成,或酶底物的消失。例如,酶活性測(cè)定可如在此說(shuō)明的用來(lái)測(cè)定多肽的活性。
所得到的多肽可利用本領(lǐng)域已知的方法來(lái)回收。例如,多肽可通過常規(guī)方法,包括但不限于離心、過濾、萃取、噴霧干燥、蒸發(fā)、或沉淀而從培養(yǎng)基回收。
本發(fā)明的多肽可通過本領(lǐng)域已知的多種方法來(lái)純化,包括但不限于,色譜法(例如,離子交換、親合性、疏水性的、色譜聚焦、和大小排阻),電泳方法(例如,制備型等電位焦距)、差異溶解度(例如,硫酸銨沉淀)、SDS-PAGE、或萃取(extraction)(參見例如,Protein Purification,J.-C.Jansonand Lars Ryden,editors,VCH Publishers,New York,1989)。
植物本發(fā)明也涉及已經(jīng)用編碼本發(fā)明具有α-葡糖苷酶活性的多肽的核苷酸序列轉(zhuǎn)化,以使得表達(dá)和生產(chǎn)可回收數(shù)量的多肽的轉(zhuǎn)基因植物、植物部分、或植物細(xì)胞。多肽可從植物或植物部分回收。備選地,包含重組多肽地植物或植物部分可用于改善食品或飼料的質(zhì)量,例如改善營(yíng)養(yǎng)價(jià)值、適口性(palatability)、和流變(rheological)性質(zhì),或用于破壞抗?fàn)I養(yǎng)因子。
轉(zhuǎn)基因的植物可以是雙子葉(雙子葉植物)或單子葉植物(單子葉植物)。單子葉植物的實(shí)例是草類(grasses),例如草地早熟禾(meadow grass)(藍(lán)草(blue grass),早熟禾屬(Poa)),飼用牧草(forage grass),例如羊茅屬(Festuca)、黑麥草屬(Lolium)、寒地型牧草(temperate grass),例如Agrostis,和谷類,例如小麥、燕麥、黑麥、大麥、稻、高粱和玉米(玉蜀黍)。
雙子葉植物的實(shí)例是煙草、豆莢,例如羽扇豆(lupin)、馬鈴薯、甜菜(sugarbeet)、豌豆、菜豆和大豆,和十字花科植物(十字花科(Brassicaceae)科),例如花椰菜、油菜籽(rape seed)、和緊密相關(guān)的模型生物擬南芥(Arabidopsisthaliana)。
植物部分的實(shí)例是莖、愈傷組織、葉、根、果實(shí)、種子、和塊莖,以及包括這些部分的個(gè)別組織,例如表皮、葉肉、薄壁組織parenchyme、維管組織、分生組織。特異的植物細(xì)胞隔室,例如葉綠體、質(zhì)外體、線粒體、液泡、過氧化物酶體和細(xì)胞質(zhì)也被認(rèn)為是植物部分。此外,任何植物細(xì)胞,無(wú)論什么組織起源,被認(rèn)為是植物部分。同樣地,例如促進(jìn)本發(fā)明應(yīng)用的特異組織和分離細(xì)胞的植物部分也被認(rèn)為是植物部分,例如胚胎、胚乳、糊粉粒和種皮。
也包括在本發(fā)明范疇內(nèi)的是這種植物、植物部分、和植物細(xì)胞的后代。
表達(dá)本發(fā)明多肽的轉(zhuǎn)基因植物或植物細(xì)胞可根據(jù)本領(lǐng)域已知的方法來(lái)構(gòu)建。簡(jiǎn)言之,植物或植物細(xì)胞通過將編碼本發(fā)明多肽的一個(gè)或多個(gè)表達(dá)構(gòu)建體整合進(jìn)入植物宿主基因組或葉綠體基因組并且繁殖所得到的改變植物或植物細(xì)胞成為轉(zhuǎn)基因的植物或植物細(xì)胞來(lái)構(gòu)建。
表達(dá)構(gòu)建體便利地是包括可操作地連接有為在選擇的植物或植物部分中表達(dá)該核苷酸序列所需要的合適調(diào)節(jié)序列的編碼本發(fā)明多肽的多核苷酸的核酸構(gòu)建體。此外,該表達(dá)構(gòu)建體可包括用于鑒定其中已經(jīng)整合有該表達(dá)構(gòu)建體的宿主細(xì)胞和為將該構(gòu)建體導(dǎo)入所述植物所必需的DNA序列的選擇標(biāo)記(后者依賴于所使用的DNA導(dǎo)入方法)。
調(diào)節(jié)序列,例如啟動(dòng)子和終止子序列以及任選地信號(hào)或轉(zhuǎn)運(yùn)序列的選擇根據(jù)例如需要何時(shí)、何處以及如何表達(dá)該多肽來(lái)確定。例如,編碼本發(fā)明多肽的基因的表達(dá)可以是組成性的或可誘導(dǎo)的,或可以是發(fā)育、階段或組織特異的,以及該基因產(chǎn)物可以被靶向特異的組織或植物部分,例如種子或葉片。調(diào)節(jié)序列由例如Tague et al.,1988,Plant Physiology 86506來(lái)描述。
對(duì)于組成性的表達(dá),可使用35S-CaMV、玉米泛素1、和水稻肌動(dòng)蛋白1啟動(dòng)子(Franck et al.,1980,Cell 21285-294,Christensen et al.,1992,PlantMo.Biol.18675-689;Zhang et al.,1991,Plant Cell 31155-1165)。器官特異性啟動(dòng)子可以是例如來(lái)自儲(chǔ)存庫(kù)(sink)組織,例如種子、馬鈴薯塊莖和果實(shí)的啟動(dòng)子(Edwards & Coruzzi,1990,Ann.Rev.Genet.24275-303),或來(lái)自代謝庫(kù)組織,例如分生組織的啟動(dòng)子(Ito et al.,1994,Plant Mol.Biol.24863-878),種子特異的啟動(dòng)子,例如來(lái)自水稻的谷蛋白、醇溶谷蛋白、球蛋白、或白蛋白啟動(dòng)子(Wu et al.,1998,Plant and Cell Physiology 39885-889)、來(lái)自豆球蛋白B4和來(lái)自蠶豆(Vicia faba)的未知種子蛋白質(zhì)基因的的蠶豆啟動(dòng)子(Conrad et al.,1998,Journal of Plant Physiology 152708-711)、來(lái)自植物油體蛋白質(zhì)的啟動(dòng)子(Chen et al.,1998,Plant and Cell Physiology 39935-941)、來(lái)自歐洲油菜(Brassica napus)的貯藏蛋白napA啟動(dòng)子,或本領(lǐng)域已知的任何其他種子特異性啟動(dòng)子,例如如如WO 91/14772所描述的。此外,啟動(dòng)子可以是葉特異的啟動(dòng)子,例如來(lái)自水稻或番茄的rbcs啟動(dòng)子(Kyozuka et al.,1993,Plant Physiology 102991-1000、小球藻病毒腺嘌呤甲基轉(zhuǎn)移酶基因啟動(dòng)子(Mitra and Higgins,1994,Plant Molecular Biology 2685-93)、來(lái)自水稻的aldP基因啟動(dòng)子(Kagaya et al.,1995,Molecular andGeneral Genetics 248668-674)、或創(chuàng)傷可誘導(dǎo)的啟動(dòng)子,例如馬鈴薯pin2啟動(dòng)子(Xu et al.,1993,Plant Molecular Biology 22573-588)。同樣地,啟動(dòng)子可通過非生物的處理來(lái)誘導(dǎo),例如溫度、干旱、或鹽度變化,或通過活化啟動(dòng)子的外部施加的物質(zhì)來(lái)誘導(dǎo),例如乙醇、雌激素、植物激素,例如乙烯、脫落酸、和赤霉酸、和重金屬。
啟動(dòng)子增強(qiáng)子元件也可用于在植物中獲得本發(fā)明多肽的更高表達(dá)。例如,啟動(dòng)子增強(qiáng)子元件可以是置于啟動(dòng)子和編碼本發(fā)明多肽的核苷酸序列之間的內(nèi)含子。例如,Xu et al.,1993,同上文,公開了使用水稻肌動(dòng)蛋白1基因的第一個(gè)內(nèi)含子增強(qiáng)表達(dá)。
表達(dá)構(gòu)建體的選擇標(biāo)記基因和任何其他部分可從本領(lǐng)域可得到的那些來(lái)選擇。
核酸構(gòu)建體根據(jù)本領(lǐng)域已知的傳統(tǒng)方法被整合進(jìn)入植物基因組,包括土壤桿菌介導(dǎo)的轉(zhuǎn)化、病毒介導(dǎo)的轉(zhuǎn)化、微注射、粒子轟擊、生物導(dǎo)彈轉(zhuǎn)化、和電穿孔(Gasser et al.,1990,Science 2441293;Potrykus,1990,Bio/Technology 8535;Shimamoto et al.,1989,Nature 338274)。
目前,根癌土壤桿菌介導(dǎo)的基因轉(zhuǎn)移是用于產(chǎn)生轉(zhuǎn)基因雙子葉植物的選擇方法(至于綜述,參見Hooykas and Schilperoort,1992,Plant MolecularBiology 1915-38)并且還可用于轉(zhuǎn)化單子葉植物,盡管其他的轉(zhuǎn)化方法經(jīng)常被用于這些植物。目前,用于產(chǎn)生轉(zhuǎn)基因單子葉植物的選擇方法是胚胎愈傷組織或發(fā)育胚胎的粒子轟擊(涂有轉(zhuǎn)化DNA的顯微黃金或鎢顆粒)(Christou,1992,Plant Journal 2275-281;Shimamoto,1994,CurrentOpinion Biotechnology 5158-162;Vasil et al.,1992,Bio/Technology 10667-674)。用于轉(zhuǎn)化單子葉植物的備選方法是基于如由Omirulleh et al.,1993,Plant Molecular Biology 21415-428描述的原生質(zhì)體轉(zhuǎn)化。
轉(zhuǎn)化后,選擇已經(jīng)整合有表達(dá)構(gòu)建體的轉(zhuǎn)化體,并且根據(jù)本領(lǐng)域已知的方法使之再生成為完整植株。轉(zhuǎn)化過程經(jīng)常被設(shè)計(jì)用于在再生期間或在隨后的生成中利用例如用兩個(gè)單獨(dú)的T-DNA構(gòu)建體共同轉(zhuǎn)化或通過特異重組酶的選擇基因的位點(diǎn)特異切除來(lái)選擇性消除選擇基因。
本發(fā)明也涉及生產(chǎn)本發(fā)明多肽的方法,包括(a)在有助于生產(chǎn)多肽的條件下培養(yǎng)包括編碼本發(fā)明具有α-葡糖苷酶活性的多肽的多核苷酸的轉(zhuǎn)基因植物或植物細(xì)胞;以及(b)回收多肽。
α-葡糖苷酶活性的去除或減少本發(fā)明也涉及生產(chǎn)親本細(xì)胞突變體的方法,其包括使編碼本發(fā)明多肽的多核苷酸序列,或其部分?jǐn)嗔鸦蛉笔?,這導(dǎo)致當(dāng)在相同條件下培養(yǎng)時(shí)該突變細(xì)胞比所述親本細(xì)胞產(chǎn)生較少的該多肽。
突變細(xì)胞可利用本領(lǐng)域已知方法通過減少或消除編碼本發(fā)明多肽的核苷酸序列表達(dá)來(lái)構(gòu)建,例如插入、斷裂、置換、或缺失。待改變或失活的核苷酸序列可以是例如對(duì)活性必要的編碼區(qū)或其部分,或?yàn)楸磉_(dá)編碼區(qū)所需要的調(diào)節(jié)元件。這種調(diào)節(jié)或調(diào)控序列的實(shí)例可以是啟動(dòng)子序列或其功能部分,即足以影響核苷酸序列表達(dá)的部分。用于可能的改變的其他調(diào)控序列包括但不限于前導(dǎo)序列、多腺苷酸化序列、前肽序列、信號(hào)肽序列、轉(zhuǎn)錄終止子和轉(zhuǎn)錄活化子。
核苷酸序列的改變或失活可通過使親本細(xì)胞經(jīng)受誘變并且篩選其中核苷酸序列的表達(dá)已經(jīng)被減少或消除的突變細(xì)胞來(lái)進(jìn)行??赡苁翘禺惢螂S機(jī)的誘變可例如通過利用合適的物理或化學(xué)誘變處理劑,通過利用合適的寡聚核苷酸,或通過使DNA序列經(jīng)受PCR產(chǎn)生的誘變來(lái)進(jìn)行。此外,誘變可通過利用這些誘變處理劑的任何組合來(lái)進(jìn)行。
適于本目的的物理或化學(xué)誘變處理劑的實(shí)例包括紫外線(UV)照射、羥胺、N-甲基-N′-硝基-N-亞硝基胍(MNNG)、O-甲基羥胺、亞硝酸、乙基磺酸甲烷(EMS)、亞硫酸氫鈉(sodium bisulphite)、蟻酸、和核苷酸類似物。
當(dāng)使用這種試劑時(shí),誘變一般通過在存在選擇的誘變處理劑時(shí)在適宜條件下培養(yǎng)待誘變處理的親本細(xì)胞,以及篩選和/或選擇顯示減少或不表達(dá)基因的突變細(xì)胞來(lái)進(jìn)行。
核苷酸序列的改變或失活可通過導(dǎo)入、取代、或除去基因或?yàn)槠滢D(zhuǎn)錄或翻譯需要的調(diào)節(jié)元件中的一個(gè)或多個(gè)核苷酸來(lái)實(shí)現(xiàn)。例如,核苷酸可被插入或除去以使得導(dǎo)致形成終止密碼子的導(dǎo)入、起始密碼子的除去、或開放讀框的變化。這種改變或失活可通過定點(diǎn)誘變或?qū)е抡T變的PCR根據(jù)本領(lǐng)域已知的方法來(lái)實(shí)現(xiàn)。盡管原則上,改變可在體內(nèi)進(jìn)行,即直接在表達(dá)待改變核苷酸序列的細(xì)胞上進(jìn)行,優(yōu)選如下列例證的在體外進(jìn)行改變。
消除或減少細(xì)胞表達(dá)核苷酸序列的便利方式的實(shí)例是基于基因置換、基因缺失或基因斷裂的技術(shù)。例如,在基因斷裂方法中,體外誘變處理相應(yīng)于內(nèi)源核苷酸序列的核酸序列以產(chǎn)生然后被轉(zhuǎn)化進(jìn)入親本細(xì)胞以產(chǎn)生有缺陷基因的缺陷性核酸序列。通過同源重組,有缺陷的核酸序列替換內(nèi)源的核苷酸序列??赡苄枰腥毕莸暮塑账嵝蛄幸簿幋a可用來(lái)選擇其中該核苷酸序列已經(jīng)被改變或破壞轉(zhuǎn)化體的標(biāo)記。在特別優(yōu)選的實(shí)施方案中,核苷酸序列用可選擇的標(biāo)記,例如在此描述的那些來(lái)斷裂。
備選地,核苷酸序列的改變或失活可通過利用與該核苷酸序列互補(bǔ)的序列建立的反義技術(shù)來(lái)進(jìn)行。更具體地說(shuō),通過細(xì)胞表達(dá)核苷酸序列可通過導(dǎo)入與在細(xì)胞中轉(zhuǎn)錄并且能夠與在細(xì)胞中產(chǎn)生的mRNA雜交的基因的核苷酸序列互補(bǔ)的序列來(lái)減少或消除。在容許互補(bǔ)的反義核苷酸序列與mRNA雜交的條件下,翻譯的蛋白質(zhì)的數(shù)量因此被減少或消除。
本發(fā)明進(jìn)一步涉及包括斷裂或缺失編碼多肽的核苷酸序列或其調(diào)控序列的親本細(xì)胞的突變細(xì)胞,這導(dǎo)致該突變細(xì)胞比親本細(xì)胞產(chǎn)生較少的多肽。
如此產(chǎn)生的有缺陷多肽的突變細(xì)胞作為用于表達(dá)同源和/或異源多肽的宿主細(xì)胞是特別有用的。因此,本發(fā)明進(jìn)一步涉及生產(chǎn)同源或異源多肽的方法,包括(a)在有助于生產(chǎn)多肽的條件下培養(yǎng)突變細(xì)胞;以及(b)回收多肽。術(shù)語(yǔ)″異源的多肽″在此定義為對(duì)于宿主細(xì)胞不是天然的多肽,其中已經(jīng)產(chǎn)生改變以變化天然序列的天然蛋白質(zhì),或其表達(dá)由于通過重組DNA技術(shù)操作該宿主細(xì)胞而定量改變的天然蛋白質(zhì)。
在進(jìn)一步的方面,本發(fā)明涉及通過發(fā)酵生產(chǎn)本發(fā)明多肽以及感興趣的蛋白質(zhì)產(chǎn)物的細(xì)胞生產(chǎn)基本上不含α-葡糖苷酶活性的蛋白質(zhì)產(chǎn)物的方法,其中在發(fā)酵已經(jīng)完成之前、期間、或之后向發(fā)酵肉湯加入能夠抑制α-葡糖苷酶活性的有效量試劑,從發(fā)酵肉湯回收感興趣的產(chǎn)物,以及任選地使回收產(chǎn)物經(jīng)受進(jìn)一步純化。
在進(jìn)一步的方面,本發(fā)明涉及通過在容許產(chǎn)物表達(dá)的條件下培養(yǎng)細(xì)胞,使所得到的培養(yǎng)肉湯經(jīng)受組合的pH和溫度處理以使得基本上減少α-葡糖苷酶活性,以及從培養(yǎng)肉湯回收產(chǎn)物來(lái)生產(chǎn)基本上不含α-葡糖苷酶活性的蛋白質(zhì)產(chǎn)物的方法。備選地,組合的pH和溫度處理可對(duì)培養(yǎng)肉湯回收的酶制劑進(jìn)行。組合的pH和溫度處理可任選地用于與α-葡糖苷酶抑制劑的處理組合。
根據(jù)本發(fā)明的這個(gè)方面,有可能除去至少60%,優(yōu)選至少75%,更優(yōu)選至少85%,更優(yōu)選至少95%,和最優(yōu)選至少99%的α-葡糖苷酶活性。α-葡糖苷酶活性的完全去除可通過利用這個(gè)方法來(lái)獲得。
組合的pH和溫度處理優(yōu)選在4-5的pH范圍內(nèi)和70-80℃的溫度范圍內(nèi)進(jìn)行足夠的時(shí)段以達(dá)到預(yù)期效果,其中一般30至60分鐘是足夠的。
用于培養(yǎng)和純化感興趣產(chǎn)物的方法可通過本領(lǐng)域已知的方法來(lái)進(jìn)行。
用于生產(chǎn)基本上不含α-葡糖苷酶的產(chǎn)物的本發(fā)明方法在真核多肽的生產(chǎn),特別是真菌蛋白質(zhì),例如酶的生產(chǎn)中具有特殊的意義。酶可選自例如,淀粉分解酶、脂肪分解酶、蛋白水解酶、細(xì)胞裂解酶、氧化還原酶、或植物細(xì)胞壁降解酶。這種酶的實(shí)例包括氨肽酶、淀粉酶、淀粉葡萄糖苷酶、糖酶、羧肽酶、過氧化氫酶、纖維素酶、殼多糖酶、角質(zhì)酶、環(huán)糊精糖基轉(zhuǎn)移酶、脫氧核糖核酸酶、酯酶、半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、葡萄糖氧化酶、葡糖苷酶、鹵素過氧化物酶、半纖維素酶、轉(zhuǎn)化酶、異構(gòu)酶、漆酶、連接酶、脂肪酶、裂解酶、甘露糖苷酶、氧化酶,果膠裂解酶、過氧化物酶、肌醇六磷酸酶、酚氧化酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、轉(zhuǎn)移酶、轉(zhuǎn)谷氨酰胺酶、或木聚糖酶。α-葡糖苷酶有缺陷的細(xì)胞也可用于表達(dá)有藥物學(xué)重要性的異源蛋白質(zhì),例如激素、生長(zhǎng)因素、受體等等。
可以理解術(shù)語(yǔ)″真核的多肽″不僅包括天然的多肽,而且包括已經(jīng)通過氨基酸取代、缺失或添加改變,或增強(qiáng)活性、熱穩(wěn)定性、pH耐受性等等的其他這種改變的多肽,例如酶。
在進(jìn)一步的方面,本發(fā)明涉及通過本發(fā)明方法生產(chǎn)的基本上沒有α-葡糖苷酶活性的蛋白質(zhì)產(chǎn)物。
組合物本發(fā)明也涉及生產(chǎn)包括本發(fā)明多肽的組合物的方法。優(yōu)選地,該組合物在這種多肽中富集。術(shù)語(yǔ)″富集的″表明組合物的α-葡糖苷酶活性已經(jīng)被增加,例如濃縮因子為1.1。
組合物可包括作為主要酶促成分的本發(fā)明多肽,例如單組分組合物。備選地,組合物可包括多種酶促活性,例如氨肽酶、淀粉酶、糖酶、羧肽酶、過氧化氫酶、纖維素酶、殼多糖酶、角質(zhì)酶、環(huán)糊精糖基轉(zhuǎn)移酶、脫氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、鹵素過氧化酶、轉(zhuǎn)化酶、漆酶、脂肪酶、甘露糖苷酶、氧化酶、果膠裂解酶、肽谷氨酰胺酶、過氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、轉(zhuǎn)谷氨酰胺酶、或木聚糖酶。附加的酶可由屬于曲霉屬,優(yōu)選棘孢曲霉(Aspergillus aculeatus)、泡盛曲霉、煙曲霉、臭曲霉、日本曲霉、構(gòu)巢曲霉、黑曲霉、或米曲霉;鐮孢屬,優(yōu)選桿孢狀鐮孢、Fusarium cerealis,F(xiàn)usarium crookwellense,大刀鐮孢、禾谷鐮孢、禾赤鐮孢、異孢鐮孢、合歡木鐮孢、尖孢鐮孢、多枝鐮孢、粉紅鐮孢、接骨木鐮孢、膚色鐮孢、硫色鐮孢、Fusarium toruloseum,F(xiàn)usariumtrichothecioides,或Fusarium venenatum;腐殖菌屬,優(yōu)選Humicola insolens或Humicola lanuginosa;或木霉屬,優(yōu)選哈茨木霉、康寧氏木霉、Trichodermalongibrachiatum,里氏木霉或綠色木霉的微生物來(lái)生產(chǎn)。
多肽組合物可根據(jù)本領(lǐng)域已知的方法來(lái)制備并且可以是液體或干燥組合物的形式。例如,多肽組合物可以是顆粒狀或微顆粒的形式。被包括入組合物的多肽可根據(jù)本領(lǐng)域已知的方法被穩(wěn)定。
如下給出本發(fā)明多肽組合物的優(yōu)選使用的實(shí)施例。本發(fā)明多肽組合物的劑量以及使用該組合物的其他條件可根據(jù)本領(lǐng)域已知的方法來(lái)確定。
用途本發(fā)明也指向利用具有α-葡糖苷酶活性的多肽的方法。
本發(fā)明的多肽可根據(jù)DE 2944483用于從谷粒生產(chǎn)醇類。
本發(fā)明的多肽也可根據(jù)WO 2002/55652(公開的美國(guó)專利申請(qǐng)20040101591)用于生產(chǎn)發(fā)酵的麥芽飲料,例如(低-熱值)啤酒。具有增強(qiáng)充氣味道和富有口感的發(fā)酵麥芽飲料可通過在制造發(fā)酵麥芽飲料的過程中的麥芽汁生產(chǎn)過程的熱處理之前加入具有α-葡糖苷酶活性的多肽來(lái)生產(chǎn)??芍圃斓蜔嶂档钠【疲渲性卺勗炱【频陌l(fā)酵過程中加入具有α-葡糖苷酶活性的多肽。乙酸的產(chǎn)生可通過在高比重釀造啤酒的發(fā)酵過程中加入具有α-葡糖苷酶活性的多肽而減少。
在啤酒制造中,來(lái)源于包括麥芽的成分的淀粉由水解酶(例如,α-淀粉酶、β-淀粉酶)水解,并且生產(chǎn)出可發(fā)酵糖,例如葡萄糖、麥芽糖、啤酒酵母可代謝的麥芽三糖,大于麥芽四糖的寡聚糖、以及糊精。然后可發(fā)酵糖由啤酒酵母(或其他酵母)代謝并且被轉(zhuǎn)化為啤酒的各種組分,例如醇類。大于麥芽四糖的寡聚糖和糊精可保持在啤酒中而不被代謝并且可參與充填飲料的味道和使其富有口感。
在優(yōu)選的方面,該方法涉及生產(chǎn)發(fā)酵的麥芽飲料,其中本發(fā)明的具有α-葡糖苷酶活性的多肽在制造發(fā)酵麥芽飲料的麥芽汁生產(chǎn)過程中熱處理麥芽汁之前被加入。在另外更優(yōu)選的方面,使用的具有α-葡糖苷酶活性的多肽的數(shù)量是每當(dāng)量的麥芽50-400ppm。在另外優(yōu)選的方面,具有α-葡糖苷酶活性的多肽與碾碎的麥芽同時(shí)加入。在另外優(yōu)選的方面,具有α-葡糖苷酶活性的多肽在麥芽汁生產(chǎn)過程中的熱處理之前被加入麥芽漿。在另外優(yōu)選的方面,具有α-葡糖苷酶活性的多肽包括在發(fā)麥芽過程中。在另外優(yōu)選的方面,只有麥芽被用作組分。在另外優(yōu)選的方面,麥芽和添加劑被用作糖組分。
在另外優(yōu)選的方面,該方法涉及生產(chǎn)一啤酒,其中本發(fā)明的具有α-葡糖苷酶活性的多肽在啤酒釀造中被加入發(fā)酵過程。在更優(yōu)選的方面,啤酒是低熱值的啤酒或輕淡啤酒(light beer)。在另外優(yōu)選的方面,加入具有α-葡糖苷酶活性的多肽減少了乙酸的產(chǎn)生。在另外更優(yōu)選的方面,原麥汁抽出物的濃度超過10并且不超過30重量%。在另外更優(yōu)選的方面,使用的具有α-葡糖苷酶活性的多肽的數(shù)量是每當(dāng)量的麥芽50-400ppm。
信號(hào)肽本發(fā)明也涉及包括與核苷酸序列可操作連接的編碼蛋白質(zhì)的基因的核酸構(gòu)建體,其中該核苷酸序列由SEQ ID NO1的第1至42位核苷酸、SEQID NO3的第1至145位核苷酸、或SEQ ID NO5的第1至57位核苷酸組成,其分別編碼由SEQ ID NO2的第1至14位氨基酸、SEQ ID NO4的第1至29位氨基酸、或SEQ ID NO6的第1至19位氨基酸組成的信號(hào)肽,其中該基因相對(duì)于該核苷酸序列是外來(lái)的。
本發(fā)明也涉及包括這種核酸構(gòu)建體的重組表達(dá)載體,和重組的宿主細(xì)胞。
本發(fā)明也涉及生產(chǎn)蛋白質(zhì)的方法,包括(a)在適于生產(chǎn)蛋白質(zhì)的條件下培養(yǎng)這種重組宿主細(xì)胞;以及(b)回收該蛋白質(zhì)。
蛋白質(zhì)對(duì)于宿主細(xì)胞可能是天然的或異源的。術(shù)語(yǔ)“蛋白質(zhì)”在此不意味著是指特定長(zhǎng)度的編碼產(chǎn)物,并且因此包括肽、寡肽、和蛋白質(zhì)。術(shù)語(yǔ)“蛋白質(zhì)”也包括組合形成編碼產(chǎn)物的兩個(gè)或多個(gè)多肽。該蛋白質(zhì)也包括其中包括獲得自至少兩個(gè)不同蛋白質(zhì)的部分或完全多肽序列的組合的混合多肽,其中一個(gè)或多個(gè)對(duì)于宿主細(xì)胞可以是異源的或天然的。蛋白質(zhì)進(jìn)一步包括上述蛋白質(zhì)和雜合蛋白的天然存在的等位和工程化變體。
優(yōu)選地,該蛋白質(zhì)是激素或其變體、酶、受體或其部分、抗體或其部分、或報(bào)告子。在更優(yōu)選的方面,該蛋白質(zhì)氧化還原酶、轉(zhuǎn)移酶、水解酶、裂解酶、異構(gòu)酶、或連接酶。在更優(yōu)選的方面,蛋白質(zhì)是氨肽酶、淀粉酶、糖酶、羧肽酶、過氧化氫酶、纖維素酶、殼多糖酶、角質(zhì)酶、環(huán)糊精糖基轉(zhuǎn)移酶、脫氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、轉(zhuǎn)化酶、漆酶、脂肪酶、甘露糖苷酶、mutanase、氧化酶、果膠裂解酶、過氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、轉(zhuǎn)谷氨酰胺酶或木聚糖酶。
基因可從任何原核、真核或其他的來(lái)源獲得。
本發(fā)明通過不應(yīng)被理解為限制本發(fā)明范圍的下列實(shí)施例進(jìn)一步加以描述。
實(shí)施例材料用作緩沖液和底物的化學(xué)品是至少試劑級(jí)的商業(yè)產(chǎn)品。
菌株米曲霉BECh2菌株(Δalp,Δamy,CPA-,KA-,Δnp1)被用于表達(dá)煙曲霉α-葡糖苷酶。煙曲霉PaHa34被用作α-葡糖苷酶的來(lái)源。
培養(yǎng)基馬鈴薯葡萄糖培養(yǎng)基的組成為每升24克馬鈴薯葡萄糖肉湯(broth)。
Cove平板的組成為每升342.3g蔗糖,20ml Cove鹽溶液,10ml 1M乙酰胺,10ml 1.5M CsCl2,和25g Noble瓊脂。
Cove鹽溶液的組成為每升26g KCl,26g MgSO4·7H2O,76g KH2PO4,和50ml COVE痕量金屬溶液。
Cove痕量金屬溶液的組成為每升0.04g Na2B4O7·10H2O,0.4gCuSO4·5H2O,1.2g FeSO4·7H2O,0.7g MnSO4·H2O,0.8g Na2MoO2·2H2O,和10g ZnSO4·7H2O。
MY25培養(yǎng)基的組成為每升25g麥芽糖糊精,2g MgSO4·7H2O,10gKH2PO4,2g檸檬酸,2g K2SO4,2g尿素,10g酵母提取物,和1.5ml AMG痕量金屬溶液,調(diào)節(jié)至pH6。
AMG痕量金屬溶液的組成為每升14.3g ZnSO4·7H2O,2.5gCuSO4·5H2O,0.5g NiCl2·6H2O,13.8g FeSO4·7H2O,8.5g MnSO4·H2O,和3g檸檬酸。
LB培養(yǎng)基的組成為每升10g胰蛋白胨,5g酵母提取物,和5g NaCl。
2X YT培養(yǎng)基的組成為每升16g胰蛋白胨,10g酵母提取物,和5gNaCl。2X YT平板的組成為每升16g胰蛋白胨,10g酵母提取物,5g NaCl和15g Noble瓊脂。
SOC培養(yǎng)基的組成為每升20g胰蛋白胨,5g酵母提取物,2ml 5MNaCl,和2.5ml 1M KCl。
TAE緩沖液的組成為40mM Tris堿,20mM乙酸鈉,和1mM EDTA二鈉pH7.2。
實(shí)施例1煙曲霉基因組序列中α-葡糖苷酶基因的鑒定利用查詢來(lái)自構(gòu)巢曲霉的α-葡糖苷酶蛋白質(zhì)序列來(lái)進(jìn)行(登錄號(hào)Q9UV08)煙曲霉部分基因組序列的(The Institute for Genomic Research,Rockville,MD)tfasty檢索(Pearson,W.R.,1999,in Bioinformatics Methods andProtocols,S.Misener and S.A.Krawetz,ed.,pp.185-219)?;谂c詢問序列在氨基酸水平的相似性,幾個(gè)基因被鑒定為假定的同系物。與詢問序列在氨基酸水平具有34.9、51.4和77.5%同一性的大約3000bp的3個(gè)基因組區(qū)域被鑒定出來(lái)。
實(shí)施例2煙曲霉基因組DNA提取煙曲霉于37℃和240rpm生長(zhǎng)在帶擋板搖瓶中的250ml馬鈴薯葡萄糖培養(yǎng)基中。通過過濾收獲菌絲體,在TE(10mM Tris-1mM EDTA)中洗滌兩次,并且在液氮下冷凍。通過研缽和杵棒研磨冷凍的菌絲體為細(xì)粉末,將其重懸在含有10mM Tris,100mM EDTA,1%Triton X-100,0.5M 胍-HCl,和200mM NaCl的pH 8.0緩沖液中。加入無(wú)Dnase的RNase A至濃度為20mg/升,并且裂解物在37℃孵育30分鐘。通過離心除去細(xì)胞碎屑,并利用Qiagen Maxi 500柱(QIAGEN Inc.,Valencia,CA)分離DNA。該柱在用30mlQC洗滌的10ml QBT中平衡,并用15ml QF(所有緩沖液來(lái)自QIAGEN Inc.,Valencia,CA)洗提。DNA在異丙醇中沉淀,70%乙醇中洗滌,并通過離心回收。該DNA重懸在TE緩沖液中。
實(shí)施例3pAlLo1表達(dá)載體的構(gòu)建表達(dá)載體pAlLo1通過改變包括來(lái)自黑曲霉中性α-淀粉酶和米曲霉磷酸丙糖異構(gòu)酶基因啟動(dòng)子的雜合體(NA2-tpi啟動(dòng)子)、黑曲霉淀粉葡萄糖苷酶終止子序列(AMG終止子)、和構(gòu)巢曲霉乙酰胺酶基因(amdS)的pBANe6(美國(guó)專利號(hào)6,461,837)來(lái)構(gòu)建。全部的誘變步驟如所描述的通過使用Big-DyeTM終止劑化學(xué)的測(cè)序來(lái)驗(yàn)證。pBANe6的改變首先通過定點(diǎn)誘變從amdS選擇標(biāo)記消除在第2051、2722和3397bp位置的3個(gè)Nco I限制位點(diǎn)來(lái)進(jìn)行。全部的變化被設(shè)計(jì)成是“沉默的”,使得amdS基因產(chǎn)物的實(shí)際蛋白質(zhì)序列沒有改變。這3個(gè)位點(diǎn)的去除用GeneEditorTM體外定點(diǎn)誘變?cè)噭┖?Promega,Madison,WI)根據(jù)制造商的指導(dǎo),利用下列引物同時(shí)進(jìn)行(加下劃線的核苷酸表示變化的堿基)AMDS3NcoMut(2050)5’-GTGCCCCATGATACGCCTCCGG-3’(SEQID NO7)AMDS2NcoMut(2721)5’-GAGTCGTATTTCCAAGGCTCCTGACC-3’(SEQ ID NO8)AMDS1NcoMut (3396)5’-GGAGGCCATGAAGTGGACCAACGG-3’(SEQ ID NO9)包括全部3個(gè)預(yù)期的序列變化的質(zhì)粒隨后利用QuickChangeTM定點(diǎn)誘變?cè)噭┖?Stratagene,La Jolla,CA)經(jīng)受定點(diǎn)誘變,以消除在第1643位置的AMG終止子末端的Nco I限制位點(diǎn)。下列引物(加下劃線的核苷酸表示變化的堿基)被用于誘變誘變AMG終止子序列的上游引物5’-CACCGTGAAAGCCATGCTCTTTCCTTCGTGTAGAAGACCAGACAG-3’(SEQ ID NO10)誘變AMG終止子序列的下游引物5’-CTGGTCTTCTACACGAAGGAAAGAGCATGGCTTTCACGGTGTCTG-3’(SEQ ID NO11)pBANe6改變的最后步驟是利用QuickChangeTM定點(diǎn)誘變?cè)噭┖泻拖铝幸?加下劃線的核苷酸表示變化的堿基)在多接頭的起始添加新的Nco I限制位點(diǎn)以產(chǎn)生pAlLo1(圖4)。
誘變NA2-tpi啟動(dòng)子的上游引物5’-CTATATACACAACTGGATTTACCATGGGCCCGCGGCCGCAGATC-3’(SEQ ID NO12)誘變NA2-tpi啟動(dòng)子的下游引物5’-GATCTGCGGCCGCGGGCCCATGGTAAATCCAGTTGTGTATATAG-3’(SEQ ID NO13)實(shí)施例4pBM120a表達(dá)載體的構(gòu)建構(gòu)建質(zhì)粒pBM120a以獲得含有用于在曲霉種屬中驅(qū)動(dòng)基因表達(dá)的雙NA2(NA2-NA2-tpi)啟動(dòng)子,并含有用于在大腸桿菌中進(jìn)行選擇的氨芐青霉素抗性基因的質(zhì)粒。
設(shè)計(jì)引物來(lái)從pJaL721(WO 03/008575)PCR擴(kuò)增雙NA2啟動(dòng)子。加入限制性酶切位點(diǎn)Sal I和Nco I(加下劃線)用于將雙啟動(dòng)子克隆進(jìn)入曲霉表達(dá)質(zhì)粒pAlLo1。
5’-GTCGACATGGTGTTTTGATCATTTTA-3’(SEQ ID NO14)5’-CCATGGCCAGTTGTGTATATAGAGGA-3’(SEQ ID NO15)利用Expand High Fidelity PCR系統(tǒng)(Roche Diagnostics,Mannheim,Germany)通過PCR擴(kuò)增感興趣的片段。PCR擴(kuò)增反應(yīng)混合物包含1μl的每μl 0.09μg pJaL721,1μl的各個(gè)引物(50pmol/μl),5μl具有15mM MgCl2的10X PCR緩沖液,1μl的dNTP混合物(每種為10mM),37.25μl水,和0.75μl(3.5U/μl)DNA聚合酶混合物。Eppendorf Mastercycler熱循環(huán)儀(Hamburg,Germany)被用于擴(kuò)增片段,其設(shè)置如下1個(gè)循環(huán)的94℃,2分鐘;10個(gè)循環(huán)的94℃,15秒,55℃,30秒,72℃,1.25分鐘;15個(gè)循環(huán)的94℃,15秒,55℃,30秒,72℃,1.25分鐘,在每個(gè)順序的循環(huán)加5秒延伸;1個(gè)循環(huán)的72℃,7分鐘;和10℃保存。將10微升的這個(gè)PCR反應(yīng)物與1μl 10X DNA加樣染料(25%丙三醇,10mM Tris pH 7.0,10mM EDTA,0.025%溴酚藍(lán),0.025%二甲苯藍(lán))混合,并在1.0%(w/v)瓊脂糖凝膠上利用40mM Tris堿-20mM乙酸鈉-1mM EDTA二鈉(TAE)緩沖液進(jìn)行電泳。在Nucleotech凝膠觀察系統(tǒng)(Nucleotech,San Mateo,CA)上用紫外線觀察到1128bp的PCR產(chǎn)物。根據(jù)制造商的指導(dǎo)該P(yáng)CR產(chǎn)物被直接連接進(jìn)入pPC2.1-TOPO(Invitrogen,Carlsbad,CA)。將1μl體積的新鮮PCR產(chǎn)物,3μl雙蒸水和1μl TOPO克隆載體用吸液器混合并在工作臺(tái)頂部孵育5分鐘。
孵育后,2μl的混合物被用于轉(zhuǎn)化OneShot感受態(tài)大腸桿菌細(xì)胞(Invitrogen,Carlsbad,CA)。將2μl體積的連接混合物加入大腸桿菌細(xì)胞并在冰上培養(yǎng)5分鐘。隨后,該細(xì)胞在42℃熱休克30秒,并置于冰上2分鐘。將250μl體積的SOC培養(yǎng)基加入這些細(xì)胞,并且該混合物在370℃和250rpm培養(yǎng)1小時(shí)。培養(yǎng)后,該集落被涂布到補(bǔ)充有每ml 100μg氨芐青霉素的2XYT平板上,并在37℃培養(yǎng)過夜來(lái)選擇質(zhì)粒。生長(zhǎng)在該平板上的8個(gè)集落用無(wú)菌牙簽挑取,并于37℃,250rpm,在含有補(bǔ)充有每ml 100μg氨芐青霉素的3ml LB培養(yǎng)基的15ml Falcon管中生長(zhǎng)過夜。利用BioRobot 9600(QIAGEN Inc.,Valencia,CA)分離質(zhì)粒。
4μl體積所得到的質(zhì)粒小提物用Eco RI消化。消化反應(yīng)物通過如先前對(duì)于PCR反應(yīng)物所描述的瓊脂糖凝膠色譜法和UV分析加以分析。含有插入的分離質(zhì)粒利用1μl質(zhì)粒模板,1.6ng M13引物(正向或反向)(MWGBiotech;High Point;NC),和6μl水來(lái)測(cè)序。DNA測(cè)序用Applied BiosystemsModel 377測(cè)序儀XL,利用染料終止劑進(jìn)行。所得到的質(zhì)粒被命名為pBM121b(圖5)。
5μl體積的pBM121b用Sal I和Nco I消化。消化反應(yīng)物通過如上所述的瓊脂糖凝膠電泳分析,連接至載體先前已經(jīng)用Sal I和Nco I切割的pAlLo1。所得到的表達(dá)質(zhì)粒被命名為pBM120a(圖6)。
實(shí)施例5煙曲霉α-葡糖苷酶基因agl1的克隆設(shè)計(jì)如下所示的2個(gè)合成的寡聚核苷酸引物以從實(shí)施例2中制備的基因組DNA PCR擴(kuò)增編碼α-葡糖苷酶基因的命名為agl1的煙曲霉基因。
正向引物5′-TACACAACTGGCC -3′(SEQID NO16)反向引物5′-GTCACCTCTAGTTAATTA -3′(SEQ IDNO17)黑體字表示編碼序列。添加其余的序列用于克隆位點(diǎn)。
通過PCR,利用Expand High Fidelity PCR系統(tǒng)擴(kuò)增感興趣的片段。50皮摩爾的上述每一引物被用于包含200ng煙曲霉基因組DNA的PCR反應(yīng)。PCR擴(kuò)增反應(yīng)混合物也包含具有1.5mM MgCl2的1X PCR緩沖液,1μldNTP混合物(分別為10mM),和0.75μl(3.5U/μl)DNA聚合酶混合物(Roche Diagnostics,Mannheim,Germany),終體積為50μl。EppendorfMastercycler熱循環(huán)儀被用于擴(kuò)增片段,設(shè)置如下1個(gè)循環(huán)的94℃,2分鐘;10個(gè)循環(huán)的94℃,15秒,58.1℃,30秒,72℃,2分5秒;15個(gè)循環(huán)的94℃,15秒,58.1℃,30秒,和72℃,2分5秒,在每個(gè)順序的循環(huán)加5秒延伸;1個(gè)循環(huán)的72℃,7分鐘;以及10℃保持。
反應(yīng)產(chǎn)物在1.0%瓊脂糖凝膠上利用TAE緩沖液分離,從凝膠切下大約3.0kb的產(chǎn)物條帶并利用QIAquick凝膠提取試劑盒(QIAGEN Inc.,Valencia,CA),根據(jù)制造商的指導(dǎo)進(jìn)行純化。
然后該片段利用InFusion克隆試劑盒(BD Biosciences,Palo Alto,CA)克隆進(jìn)入pBM120a。載體用Nco I和Pac I消化。消化載體和PCR片段如先前描述的通過凝膠電泳和QIAquick凝膠提取純化。基因片段和消化的載體在產(chǎn)生其中α-葡糖苷酶基因的轉(zhuǎn)錄處于串聯(lián)的NA2-tpi啟動(dòng)子調(diào)控之下的表達(dá)質(zhì)粒pSMO216mu的反應(yīng)中被連接在一起。連接反應(yīng)(20μl)的組成為1XInFusion緩沖液(BD Biosciences,Palo Alto,CA),1X BSA(BD Biosciences,Palo Alto,CA),1μl Infusion酶(1∶10稀釋)(BD Biosciences,Palo Alto,CA),40ng用Nco I和Pac I消化的pBM120a,和25ng煙曲霉α-葡糖苷酶純化PCR產(chǎn)物。反應(yīng)物在室溫下孵育30分鐘。2μl反應(yīng)物被用于轉(zhuǎn)化E.coli One shot感受態(tài)細(xì)胞(Invitrogen Life Technologies,Carlsbad,CA)。含有pSMO216mu的大腸桿菌轉(zhuǎn)化體通過限制性消化來(lái)檢測(cè),并且質(zhì)粒DNA利用BioRobot9600來(lái)制備。
實(shí)施例6編碼α-葡糖苷酶agl1基因的煙曲霉基因組序列的表征來(lái)自pSMO216mu煙曲霉α-葡糖苷酶agl1基因的DNA測(cè)序用Perkin-Elmer Applied Biosystems Model 377 XL Automated DNA測(cè)序儀(Perkin-Elmer/Applied Biosystems,Inc.,F(xiàn)oster City,CA),利用染料終止劑化學(xué)(Giesecke et al.,1992,Journal of Virology Methods 3847-60)和引物步行策略來(lái)進(jìn)行。核對(duì)核苷酸序列數(shù)據(jù)的質(zhì)量,并且將所有的序列借助PHRED/PHRAP軟件(University of Washington,Seattle,WA)彼此進(jìn)行比較。
pSMO216mu的序列分析顯示與預(yù)測(cè)的序列有1個(gè)堿基對(duì)的變化。DNA序列至蛋白質(zhì)的翻譯導(dǎo)致在第367位置1個(gè)氨基酸的變化。定點(diǎn)誘變被用于變化該氨基酸回復(fù)到預(yù)測(cè)的序列。
實(shí)施例7煙曲霉α-葡糖苷酶agl1基因的定點(diǎn)誘變?yōu)榱烁淖兊?67位置的氨基酸突變,設(shè)計(jì)下列所示的合成寡聚核苷酸引物利用QuikChange定點(diǎn)誘變?cè)噭┖?Stratagene,La Jolla,CA)來(lái)PCR擴(kuò)增煙曲霉α-葡糖苷酶agl1基因5′-GCATGGAGCAGGGCATCTTCCTGCAGACTC-3′(SEQ ID NO18)5′-GAGTCTGCAGGAAGATGCCCTGCTCCATGC-3′(SEQ ID NO19)100納克的上述每一引物被用于含有10ng pSMO216mu,1XQuikChange反應(yīng)緩沖液(Stratagene,La Jolla,CA),3μl QuikSolution(Stratagene,La Jolla,CA),1μl 10mM dATP,dTTP,dGTP和dCTP混合物,和1μl 2.5U/μl Pfu Ultra酶(Stratagene,La Jolla,CA)的PCR反應(yīng)物,終體積為50μl。使用Eppendorf Mastercycler熱循環(huán)儀,設(shè)置如下1個(gè)循環(huán)的95℃,1分鐘;30個(gè)循環(huán)的95℃,1分鐘,55℃,1分鐘,和65℃,14分鐘。然后熱休克進(jìn)行至10℃保溫循環(huán)。將1微升Dpn I直接加入擴(kuò)增反應(yīng)物,并在37℃孵育1小時(shí)。2μl體積的Dpn I消化反應(yīng)物被用于轉(zhuǎn)化大腸桿菌XL10-Gold超感受態(tài)細(xì)胞(Stratagene,La Jolla,CA)。含有質(zhì)粒pSMO216的大腸桿菌轉(zhuǎn)化體通過限制性消化來(lái)檢測(cè)并且質(zhì)粒DNA利用BioRobot 9600來(lái)制備。序列分析驗(yàn)證了質(zhì)粒pSMO216中所產(chǎn)生的bp變化(圖7)。
含有pSMO216的大腸桿菌XL10-Gold超感受態(tài)細(xì)胞以NRRL B-30751保藏在農(nóng)業(yè)研究機(jī)構(gòu)保藏中心,1815 University Street,Peoria,Illinois,61604,保藏日期為2004年6月17日。
根據(jù)tfasty輸出構(gòu)建序列的基因模型并且與來(lái)自米曲霉的同源基因排列對(duì)比。核苷酸序列(SEQ ID NO1)和推導(dǎo)的氨基酸序列(SEQ ID NO2)顯示在圖1中。該基因組片段編碼881個(gè)氨基酸的多肽,其被49bp(第211至260位核苷酸)、52bp(第820至872位核苷酸)、54bp(第1063至1117位核苷酸)、51bp(第1135至1186位核苷酸)、49bp(第1592至1643位核苷酸)、和51bp(第1702至1753位核苷酸)的6個(gè)內(nèi)含子打斷。agl1基因的%G+C含量是57.4%。利用SignalP軟件程序(Nielsen et al.,1997,Protein Engineering 101-6),預(yù)測(cè)出14個(gè)殘基的信號(hào)肽。預(yù)測(cè)的成熟蛋白質(zhì)包含分子量為98.8kDa的867個(gè)氨基酸。
α-葡糖苷酶序列的比較排列利用Clustal W方法(Higgins,1989,CABIOS5151-153),利用LASERGENETMMEGALIGNTM軟件(DNASTAR,Inc.,Madison,WI)來(lái)測(cè)定,其中使用同一性表格和下列多個(gè)排列參數(shù)缺口罰分為(gap penalty)10,缺口長(zhǎng)度罰分為10。成對(duì)排列參數(shù)是Ktuple=1,gappenalty=3,windows=5,和diagonals=5。排列顯示煙曲霉α-葡糖苷酶(Agl1)的推導(dǎo)的氨基酸序列與構(gòu)巢曲霉α-葡糖苷酶(EMBL AB057788)的推導(dǎo)的氨基酸序列共享67%的同一性。
實(shí)施例8煙曲霉α-葡糖苷酶agl1基因在米曲霉BECh2中的表達(dá)米曲霉BECh2原生質(zhì)體根據(jù)Christensen et al.,1988,Bio/Technology 61419-1422的方法來(lái)制備??偟?μg pSMO216被用于轉(zhuǎn)化米曲霉BECh2。
使用pSMO216的米曲霉BECh2的轉(zhuǎn)化產(chǎn)生了20個(gè)轉(zhuǎn)化體。該20個(gè)轉(zhuǎn)化體被轉(zhuǎn)移到單獨(dú)的Cove平板。20個(gè)轉(zhuǎn)化體的孢子收集在4ml 0.01%Tween 20中,200μl孢子懸浮液分別被接種到在125ml塑料搖瓶中的25mlMY25培養(yǎng)基中,并在34℃,250rpm培養(yǎng)。接種后3和5天,如下所述測(cè)定培養(yǎng)物上清液的α-葡糖苷酶活性。
100μl培養(yǎng)物上清液在0.1M乙酸鈉緩沖液pH 4.3中稀釋。獲得自Novozymes A/S,Bagsvrd,Denmark的AMG標(biāo)準(zhǔn)物利用2-倍步驟稀釋,在0.1M乙酸鈉緩沖液pH 4.3中起始為0.033AGU/ml濃度,并且終止為0.0042AGU/ml濃度。100微升20mg/ml麥芽糖溶液被加入各個(gè)孔,然后在25℃孵育180分鐘。孵育步驟一結(jié)束,將200μl 0.06N NaOH溶液加入各個(gè)孔以淬滅該反應(yīng)。從各個(gè)孔轉(zhuǎn)移出總的30μl淬滅反應(yīng)物,并置于新的96-孔平板中,然后向各個(gè)孔加入200μl液狀葡萄糖(氧化酶)試劑(PointeScientific,Inc,Lincoln Park,Michigan,USA),在室溫下孵育18分鐘。孵育一結(jié)束,利用Spectra Max 349(Molecular Devices,Sunnyvale,CA)測(cè)量該96-孔平板在505nm處的吸光率。樣品濃度通過從形成的標(biāo)準(zhǔn)曲線的外推法來(lái)確定。存在于培養(yǎng)基中的葡萄糖含量通過沒有加入麥芽糖的液狀葡萄糖試劑來(lái)獨(dú)立測(cè)量樣品肉湯中的葡萄糖而標(biāo)準(zhǔn)化。從來(lái)自其中加入麥芽糖底物的試劑的值減去吸光率。
測(cè)定結(jié)果證明大約一半的轉(zhuǎn)化體表達(dá)α-葡糖苷酶活性。命名為米曲霉SMO17的1個(gè)轉(zhuǎn)化體如上所述在MY25培養(yǎng)基中培養(yǎng)以提供用于純化和表征的酶。
實(shí)施例9煙曲霉α-葡糖苷酶agl2基因的克隆設(shè)計(jì)如下所示的2個(gè)合成的寡聚核苷酸引物以從實(shí)施例2中制備的基因組DNA PCR擴(kuò)增編碼α-葡糖苷酶的命名為agl2的煙曲霉基因。
正向引物5’-ACACAACTGGCC -3’(SEQ ID NO20)反向引物5’-AGTCACCTCTAGTTAATTAA -3’(SEQID NO21)黑體字表示編碼序列。添加其余的序列用于克隆位點(diǎn)。
感興趣的片段通過PCR利用Expand High Fidelity PCR系統(tǒng)來(lái)擴(kuò)增。50皮摩爾的上述每一引物被用于包含200ng煙曲霉基因組DNA的PCR反應(yīng)。PCR擴(kuò)增反應(yīng)混合物也包含具有1.5mM MgCl2的1X PCR緩沖液,1μldNTP混合物(各自為10mM),和0.75μl(3.5U/μl)DNA聚合酶混合物,終體積為50μl。Eppendorf Mastercycler熱循環(huán)儀被用于擴(kuò)增片段,設(shè)置如下1個(gè)循環(huán)的94℃,2分鐘;10個(gè)循環(huán)的94℃,15秒,58.1℃,30秒,72℃,2分5秒;15個(gè)循環(huán)的94℃,15秒,58.1℃,30秒,72℃,2分5秒,在各個(gè)順序循環(huán)加5秒延伸;1個(gè)循環(huán)的72℃,7分鐘以及10℃保持。
反應(yīng)產(chǎn)物在1.0%瓊脂糖凝膠上利用TAE緩沖液分離,從凝膠切下大約3.0kb的產(chǎn)物條帶并利用QIAquick凝膠提取試劑盒,根據(jù)制造商的指導(dǎo)純化。
然后該片段被克隆進(jìn)入pCR2.1-TOPO載體(Invitrogen LifeTechnologies,Carlsbad,CA)。該基因片段通過PCR Clean Up Kit(QIAGENInc.,Valencia,CA)純化。該片段和pCR2.1-TOPO載體通過產(chǎn)生質(zhì)粒pHyGe011mu,利用由制造商制定的條件連接。2μl反應(yīng)物被用于轉(zhuǎn)化E.coliOne Shot感受態(tài)細(xì)胞。含有質(zhì)粒pHyGe011mu的大腸桿菌轉(zhuǎn)化體通過限制性消化來(lái)檢測(cè)并且質(zhì)粒DNA利用BioRobot 9600來(lái)制備。
實(shí)施例10編碼α-葡糖苷酶agl2基因的煙曲霉基因組序列的表征來(lái)自pHyGe011mu的煙曲霉α-葡糖苷酶agl2基因的DNA測(cè)序用Perkin-Elmer Applied Biosystems Model 377 XL Automated DNA測(cè)序儀(Perkin-Elmer/Applied Biosystems,Inc.,F(xiàn)oster City,CA),利用染料終止劑化學(xué)(Giesecke et al.,1992,Journal of Virology Methods 3847-60)和引物步行策略進(jìn)行。核對(duì)核苷酸序列數(shù)據(jù)的質(zhì)量,并且將所有的序列借助PHRED/PHRAP software(University of Washington,Seattle,WA)彼此進(jìn)行比較。
pHyGe011mu的序列分析顯示與預(yù)測(cè)的序列有7個(gè)堿基對(duì)的變化。DNA序列至蛋白質(zhì)的翻譯在第140、530和941位產(chǎn)生3個(gè)氨基酸變化。定點(diǎn)誘變被用于變化該氨基酸回復(fù)到預(yù)測(cè)的序列。
實(shí)施例11煙曲霉α-葡糖苷酶agl2基因的定點(diǎn)誘變?yōu)榱烁淖冊(cè)诘?40、530和941位的3個(gè)氨基酸突變,設(shè)計(jì)下列所示的3個(gè)合成的寡聚核苷酸引物利用QuikChange定點(diǎn)誘變?cè)噭┖衼?lái)PCR擴(kuò)增包含5個(gè)堿基對(duì)變化的煙曲霉α-葡糖苷酶agl2基因。
5’-CGCGCAGCTCCAGACTCCAGGAAAGAAATCAC-3’(SEQ ID NO22)5’-GTACTTGAACAAGCCGGTCCACCATTTGATTG-3’(SEQ ID NO23)5’-GCCTGCCTGCTGGGCGTGATACTCCAAGGGTG-3’(SEQ ID NO24)100納克的上述各個(gè)引物被用于含有100ng pHyGe011mu,1XQuikChange反應(yīng)緩沖液,0.75μl QuikSolution,1μl dATP,dTTP,dGTP和dCTP的10mM混合物,1μl QuikChange Multi酶混合物的PCR反應(yīng),終體積為50μl。伴隨下列設(shè)置使用Eppendorf Mastercycler熱循環(huán)儀1個(gè)循環(huán)的95℃,1分鐘;30個(gè)循環(huán)的95℃,1分鐘,55℃,1分鐘,和65℃,14分鐘。熱休克進(jìn)行至10℃保溫循環(huán)。1微升Dpn I被直接加入擴(kuò)增反應(yīng)物,并在37℃孵育1小時(shí)。2μl體積的Dpn I消化反應(yīng)物被用于轉(zhuǎn)化E.coliXL10-Gold超感受態(tài)細(xì)胞。含有質(zhì)粒pHyGe011的大腸桿菌轉(zhuǎn)化體通過限制性消化來(lái)檢測(cè)并且質(zhì)粒DNA利用BioRobot 9600來(lái)制備。序列分析檢驗(yàn)在質(zhì)粒pHyGe011中產(chǎn)生的bp變化(圖8)。
含有質(zhì)粒pHyGe011的E.coli XL10-Gold以NRRL B-30750保藏在農(nóng)業(yè)研究機(jī)構(gòu)保藏中心,1815 University Street,Peoria,Illinois,61604,保藏日期為2004年6月10日。
根據(jù)tfasty輸出構(gòu)建序列的基因模型并且與來(lái)自米曲霉的同源基因排列對(duì)比。核苷酸序列(SEQ ID NO3)和推導(dǎo)的氨基酸序列(SEQ ID NO4)顯示在圖2中。該基因組片段編碼被58(第85至142位核苷酸)和54bp(第899至952位核苷酸)的2個(gè)內(nèi)含子打斷的967個(gè)氨基酸的多肽。該基因的%G+C含量是51.2%。利用SignalP軟件程序(Nielsen et al.,1997,Protein Engineering 101-6),預(yù)測(cè)出29個(gè)殘基的信號(hào)肽。預(yù)測(cè)的成熟蛋白質(zhì)包含分子量為106.5kDa的938個(gè)氨基酸。
α-葡糖苷酶序列的比較性排列利用Clustal W方法(Higgins,1989,CABIOS 5151-153),利用LASERGENETMMEGALIGNTM軟件(DNASTAR,Inc.,Madison,WI)來(lái)確定,其中使用同一性表格和下列多個(gè)排列參數(shù)缺口罰分為10并且缺口長(zhǎng)度罰分為10。成對(duì)排列參數(shù)是Ktuple=1,gap penalty=3,windows=5,和diagonals=5。排列顯示煙曲霉α-葡糖苷酶(Agl2)的推導(dǎo)的氨基酸序列與來(lái)自粗糙鏈孢霉的推定α-葡糖苷酶的推導(dǎo)氨基酸序列(登錄號(hào)SWALL Q8NIY3)共享71%同一性。
實(shí)施例12用于煙曲霉α-葡糖苷酶agl2基因的米曲霉表達(dá)載體的構(gòu)建煙曲霉α-葡糖苷酶agl2基因被克隆進(jìn)入表達(dá)載體pBM120a?;蚱瓮ㄟ^用Nco I和Pac I消化從pHyGe011釋放出來(lái),然后如先前描述的通過凝膠電泳和QIAquick凝膠純化來(lái)進(jìn)行純化。pBM120a載體用Nco I和Pac I消化。基因片段和消化的載體利用快速DNA連接試劑盒(BoehringerMannheim,Germany)連接在一起,產(chǎn)生其中煙曲霉α-葡糖苷酶基因的轉(zhuǎn)錄處于串連的NA2-tpi啟動(dòng)子調(diào)控之下的表達(dá)質(zhì)粒pHyGe002。5微升的反應(yīng)物被用于轉(zhuǎn)化E.coli XL 1-Blue亞克隆級(jí)感受態(tài)細(xì)胞(Stratagene,La Jolla,CA)。含有pHyGe002質(zhì)粒的大腸桿菌轉(zhuǎn)化體通過限制性消化來(lái)檢測(cè)并且質(zhì)粒DNA利用BioRobot 9600來(lái)制備。
實(shí)施例13煙曲霉α-葡糖苷酶agl2基因在米曲霉BECh2中的表達(dá)米曲霉BECh2原生質(zhì)體根據(jù)Christensen et al.,1988,同上文的方法來(lái)制備??偟?.3μg pHyGe002被用于轉(zhuǎn)化米曲霉BECh2。
用pHyGe002轉(zhuǎn)化米曲霉BECh2產(chǎn)生24個(gè)轉(zhuǎn)化體。該24個(gè)轉(zhuǎn)化體被轉(zhuǎn)移到單獨(dú)的Cove平板。24個(gè)轉(zhuǎn)化體的孢子收集在4ml 0.01%Tween 20中,200μl孢子懸浮液分別被接種到在125ml塑料搖瓶中的25ml MY25培養(yǎng)基中,且在34℃,250rpm培養(yǎng)。接種后3和5天,如實(shí)施例8所描述的測(cè)定培養(yǎng)物上清液的α-葡糖苷酶活性。
測(cè)定結(jié)果證明大約一半的轉(zhuǎn)化體表達(dá)α-葡糖苷酶活性。
實(shí)施例14煙曲霉α-葡糖苷酶agl3基因的克隆設(shè)計(jì)如下所示的2個(gè)合成的寡聚核苷酸引物來(lái)從實(shí)施例2中制備的基因組DNA PCR擴(kuò)增編碼α-葡糖苷酶的命名為agl3的煙曲霉基因。
正向引物5′-TACACAACTGGCC -3′(SEQ ID NO25)反向引物5′-GTCACCTCTAGTTAATTA -3′(SEQ ID NO26)黑體字表示編碼序列。添加其余的序列用于克隆位點(diǎn)。
感興趣的片段通過PCR利用Expand High Fidelity PCR系統(tǒng)來(lái)擴(kuò)增。50皮摩爾的上述每一引物被用于包含200ng煙曲霉基因組DNA的PCR反應(yīng)。PCR擴(kuò)增反應(yīng)混合物也包含具有1.5mM MgCl2的1X PCR緩沖液,1μldNTP混合物(各自為10mM),和0.75μl(3.5U/μl)DNA聚合酶混合物(Roche Diagnostics,Mannheim,Germany),終體積為50μl。EppendorfMastercycler熱循環(huán)儀被用于擴(kuò)增片段,設(shè)置如下1個(gè)循環(huán)的94℃,2分鐘;10個(gè)循環(huán)的94℃,15秒,60℃,30秒,72℃,2分30秒;20個(gè)循環(huán)的94℃,15秒,60℃,30秒,和72℃,2分30秒,在每個(gè)順序循環(huán)加5秒延伸;1個(gè)循環(huán)的72℃,7分鐘;和10℃保持。
反應(yīng)產(chǎn)物在1.0%瓊脂糖凝膠上利用TAE緩沖液分離,從凝膠切下大約3.15kb的產(chǎn)物條帶并利用QIAquick凝膠提取試劑盒,根據(jù)制造商的指導(dǎo)純化。
然后該片段利用InFusion克隆試劑盒克隆進(jìn)入pBM120a。該載體用NcoI和Pac I消化。消化的載體和PCR片段都通過凝膠電泳和QIAquick凝膠提取如先前描述的進(jìn)行純化?;蚱魏拖妮d體在產(chǎn)生其中α-葡糖苷酶基因轉(zhuǎn)錄被置于串聯(lián)的NA2-tpi啟動(dòng)子調(diào)控下的表達(dá)質(zhì)粒pJSF9b(圖9)的反應(yīng)中連接在一起。連接反應(yīng)(20μl)的組成為1X InFusion緩沖液,1X BSA(BD Biosciences,Palo Alto,CA),1μl Infusion酶(diluted 1∶10),90ng用Nco I和Pac I消化的pBM120a,和84ng煙曲霉α-葡糖苷酶的純化PCR產(chǎn)物。反應(yīng)在室溫下孵育30分鐘。1.5μl的反應(yīng)物根據(jù)制造商的指導(dǎo)用于轉(zhuǎn)化E.coliSolopac Gold超感受態(tài)細(xì)胞(Stratagene,La Jolla,CA)。含有pJSF9b的大腸桿菌轉(zhuǎn)化體通過限制性消化來(lái)檢測(cè)并且質(zhì)粒DNA利用BioRobot 9600來(lái)制備。
實(shí)施例15編碼α-葡糖苷酶agl3基因的煙曲霉基因組序列的表征來(lái)自pJSF9b的煙曲霉α-葡糖苷酶agl3基因的DNA測(cè)序用Perkin-ElmerApplied Biosystems Model 377 XL Automated DNA測(cè)序儀(Perkin-Elmer/Applied Biosystems,Inc.,F(xiàn)oster City,CA),利用染料終止劑化學(xué)(Giesecke et al.,1992,Journal of Virology Methods 3847-60)和引物步行策略來(lái)進(jìn)行。核對(duì)核苷酸序列數(shù)據(jù)的質(zhì)量,并且將所有的序列借助PHRED/PHRAP軟件(University of Washington,Seattle,WA)彼此進(jìn)行比較。pJSF9b的序列分析證實(shí)該克隆包含α-葡糖苷酶。
含有質(zhì)粒pJSF9b的E.coli XL10-Gold以NRRL B-30856保藏在農(nóng)業(yè)研究機(jī)構(gòu)保藏中心,1815 University Street,Peoria,Illinois,61604,保藏日期為2005年6月23日。
核苷酸序列(SEQ ID NO5)和推導(dǎo)的氨基酸序列(SEQ ID NO6)顯示在圖3中。該基因組片段編碼被766bp(第700至765位核苷酸)、61bp(第1174至1235位核苷酸)、和70bp(第1407至1477位核苷酸)的3個(gè)內(nèi)含子打斷的988個(gè)氨基酸的多肽。該基因的%G+C含量是56.4%。利用SignalP軟件程序(Nielsen et al.,1997,supra),預(yù)測(cè)出19個(gè)殘基的信號(hào)肽。預(yù)測(cè)的成熟蛋白質(zhì)包含分子量為108.6kDa的969個(gè)氨基酸。
α-葡糖苷酶序列的比較性排列利用Clustal W方法(Higgins,1989,CABIOS 5151-153),利用LASERGENETMMEGALIGNTM軟件(DNASTAR,Inc.,Madison,WI)來(lái)確定,其中使用同一性表格和下列多個(gè)排列參數(shù)缺口罰分為10和缺口長(zhǎng)度罰分為10。成對(duì)排列參數(shù)是Ktuple=1,gap penalty=3,windows=5,和diagonals=5。排列顯示煙曲霉α-葡糖苷酶(Agl3)的推導(dǎo)的氨基酸序列與來(lái)自米曲霉的α-葡糖苷酶的推導(dǎo)的氨基酸序列(登錄號(hào)Swissprot Q12558)共享81%同一性。
實(shí)施例16煙曲霉α-葡糖苷酶agl3基因在米曲霉BECh2中的表達(dá)米曲霉BECh2原生質(zhì)體根據(jù)Christensen et al.,1988,同上文的方法來(lái)制備??偟?.3μg pJSF9b被用于轉(zhuǎn)化米曲霉BECh2。
用pJSF9b轉(zhuǎn)化米曲霉BECh2產(chǎn)生20個(gè)轉(zhuǎn)化體。該20個(gè)轉(zhuǎn)化體被轉(zhuǎn)移到單獨(dú)的Cove平板。轉(zhuǎn)化體的孢子收集在4ml 0.01%Tween 20中,200μl孢子懸浮液分別被接種到在125ml塑料搖瓶中的25ml MY25培養(yǎng)基中,并且在34℃,250rpm培養(yǎng)。接種后3和5天后,如實(shí)施例8所描述的測(cè)定培養(yǎng)物上清液的α-葡糖苷酶活性。
測(cè)定結(jié)果證明大約一半的轉(zhuǎn)化體表達(dá)α-葡糖苷酶活性。命名為米曲霉SMO24的1個(gè)轉(zhuǎn)化體如上所述在MY25培養(yǎng)基中培養(yǎng)以提供用于純化和表征的酶。
實(shí)施例17煙曲霉Agl1α-葡糖苷酶的純化如實(shí)施例8中所描述,在米曲霉BECH2中表達(dá)的煙曲霉Agl1α-葡糖苷酶利用如下所述的方案進(jìn)行純化。
α-葡糖苷酶活性利用麥芽糖作為底物來(lái)測(cè)量。麥芽糖(1.1%;375μl)在37℃水浴中孵育5分鐘。將稀釋在含有0.01%Triton-X100的50mM乙酸鈉pH 5.0中的等分酶樣品(25μl)與底物混合。孵育10分鐘后通過加入100μl1M Tris溶液并且立即煮沸3分鐘來(lái)終止反應(yīng)。
蛋白質(zhì)濃度利用BCA蛋白質(zhì)測(cè)定試劑盒(Pierce,Rockford,IL),根據(jù)其“微平板方法”來(lái)測(cè)定。
來(lái)自餾分和匯集部份的樣品的SDS-PAGE分析通過以1∶1比率混合樣品和Laemmli樣品緩沖液(Bio-Rad,Hercules,CA)來(lái)進(jìn)行。煮沸2分鐘后,樣品伴隨10-15μl分子質(zhì)量標(biāo)記(Precision Plus Protein Standards,Bio-Rad,Hercules,CA)被加載到8-16%SDS-PAGE凝膠(Bio-Rad,Hercules,CA)上。凝膠在1X Tris-Glycine-SDS電泳緩沖液(Bio-Rad,Hercules,CA)中于200V泳動(dòng)1小時(shí)。然后凝膠用水漂洗3次,每次5分鐘,并用Bio-Safe考馬斯染色劑染色(Bio-Rad,Hercules,CA)1小時(shí),然后用水脫色超過1小時(shí)。
搖瓶培養(yǎng)物(MY25培養(yǎng)基)在1000xg離心并移出上清液。上清液利用Stericup0.22μm真空濾器(Millipore,Billerica,MA)過濾。
該上清液包含相當(dāng)大量的淡褐色色素。為了除去色素,將105ml上清液(用100mM Tris pH 8.5稀釋2.5-倍)加載到用0.1M Tris pH 8.5預(yù)平衡的含有Q-Sepharose Big Beads樹脂(Amersham Biosciences,Uppsala,Sweden)的30X 2.5cm柱上。α-葡糖苷酶用0.1M乙酸鈉pH 4.0緩沖液洗滌來(lái)洗提而不分餾。收集“洗凈”(wash out)溶液(300ml)并測(cè)定α-葡糖苷酶活性。回收百分之五十九的α-葡糖苷酶活性。剩余的大部分淡褐色色素結(jié)合Q-Sepharose。Q-Sepharose柱的乙酸鈉洗滌步驟后,將0.5mM的絲氨酸蛋白酶抑制劑,PMSF加入溶液以免潛在的蛋白水解。濃縮這個(gè)溶液并且利用攪拌的250ml超濾細(xì)胞(Amicon,Beverly,MA)再緩沖(100mM Tris pH 8.5)。
然后來(lái)自Q-Sepharose柱步驟的α-葡糖苷酶被加載到用50mM Tris pH8.5預(yù)平衡的Mono Q 16/10柱上(Pharmacia Biotech AB,Uppsala,Sweden)。該酶利用在50mM Tris pH 8.5中的0至0.55M NaCl 20柱容積梯度來(lái)洗提。收集10ml餾分,測(cè)定α-葡糖苷酶活性,并根據(jù)特異活性和純度(SDS-PAGE)匯集。
來(lái)自Mono Q柱步驟的α-葡糖苷酶最后被加載到用50mM乙酸鹽,pH4.5預(yù)平衡的Mono S 16/10柱上(Pharmacia Biotech AB,Uppsala,Sweden)。該α-葡糖苷酶利用在50mM乙酸鹽,pH 4.5中的0至0.5M NaCl 20柱容積梯度來(lái)洗提。收集10ml餾分,測(cè)定α-葡糖苷酶活性,并且根據(jù)純度(SDS-PAGE)匯集。
純化概括在下列表1中。
表1.煙曲霉Agl1α-葡糖苷酶的純化
實(shí)施例18煙曲霉Agl3α-葡糖苷酶的純化如實(shí)施例16中所描述的,在米曲霉BECH2中表達(dá)的煙曲霉Agl3α-葡糖苷酶利用如下所述的方案純化。
α-葡糖苷酶活性如實(shí)施例17中所描述的測(cè)量。蛋白質(zhì)濃度如實(shí)施例17所描述的測(cè)定。SDS-PAGE分析如實(shí)施例17所描述的進(jìn)行。
搖瓶培養(yǎng)物(MY25培養(yǎng)基)在1000xg離心,并移出上清液。上清液利用Millipore 0.22μm Stericup真空濾器過濾。
該上清液包含相當(dāng)大量的淡褐色色素。為了除去色素,將250毫升的上清液(用100mM Tris pH 8.5稀釋2.5-倍)加載到用0.1M Tris pH 8.5預(yù)平衡的含有Q-Sepharose Big Beads樹脂的30×2.5cm柱上。α-葡糖苷酶用0.1M乙酸鈉pH 4.0緩沖液洗滌來(lái)洗提而不分餾。收集“洗凈”溶液(300ml)并用于測(cè)定α-葡糖苷酶活性?;厥瞻俜种说摩?葡糖苷酶活性。剩余的大部分淡褐色色素結(jié)合Q-Sepharose。Q-Sepharose柱的乙酸鈉洗滌步驟后,將0.5mM的絲氨酸蛋白酶抑制劑,PMSF加入溶液以免潛在的蛋白水解。濃縮這個(gè)溶液并且利用攪拌的250ml Amicon超濾細(xì)胞再緩沖(100mMTris pH 8.5)。
然后來(lái)自Q-Sepharose柱步驟的α-葡糖苷酶被加載到用50mM Tris pH8.5預(yù)平衡的Mono Q 16/10柱上。該酶利用在50mM Tris pH 8.5中的0至0.5M NaCl 20柱容積梯度洗提。收集10ml餾分,測(cè)定α-葡糖苷酶活性,并根據(jù)特異活性和純度(SDS-PAGE)匯集。
最后來(lái)自MonoQ柱步驟的α-葡糖苷酶被加載到用1.7M(NH4)2SO4-50mM Tris pH 8.5預(yù)平衡的Phenyl Sepharose HR 16/10柱上(Pharmacia BiotechAB,Uppsala,Sweden)。α-葡糖苷酶用1.7M(NH4)2SO4-50mM Tris pH 8.5至50mM Tris pH 8.5的20柱容積梯度洗提。收集10ml餾分,測(cè)定α-葡糖苷酶活性,并根據(jù)純度(SDS-PAGE)匯集。
純化概括在下列表2中。
表2.煙曲霉Agl3α-葡糖苷酶的純化
實(shí)施例19煙曲霉α-葡糖苷酶的表征SDS-PAGE分析.純化的煙曲霉Agl1和Agl3α-葡糖苷酶如上所述通過SDS-PAGE加以分析。盡管成熟Agl1α-葡糖苷酶的預(yù)測(cè)分子量是98.8kDa,SDS-PAGE結(jié)果顯示大約40和60kDa的2個(gè)條帶。同時(shí)成熟Agl3α-葡糖苷酶的預(yù)測(cè)分子量是108.6kDa,SDS-PAGE結(jié)果顯示大約110kDa的1個(gè)條帶。
MALDI-TOF MS分析.如下所述40和60kDa條帶的MALDI-TOFMS分析顯示它們來(lái)自Agl1α-葡糖苷酶,并且110kDa條帶來(lái)自Agl3α-葡糖苷酶。
MultiPROBE II Liquid Handeling Robot(PerkinElmer Life andAnalytical Sciences,Boston,MA)被用于進(jìn)行凝膠內(nèi)消化。從SDS-PAGE凝膠切下在純化的煙曲霉Agl1中觀察到的40和60kDa條帶和來(lái)自Agl3α-葡糖苷酶的110kDa條帶。該凝膠條帶用50μl在碳酸氫銨pH 8.0中的10mMDTT 100mM還原30分鐘。還原后,凝膠塊用50μl在100mM碳酸氫銨pH8.0緩沖液中的55mM碘乙酰胺烷基化20分鐘。容許干凝膠塊在組成為每μl 6ng測(cè)序級(jí)胰蛋白酶(Princeton Separations,Adelphia,NJ)的50mM碳酸氫銨pH 8緩沖液的胰蛋白酶消化溶液中于室溫下膨脹30分鐘,然后在40℃消化8小時(shí)。描述的每一反應(yīng)步驟按照制造商的標(biāo)準(zhǔn)方案繼之以用合適的溶液進(jìn)行多次洗滌和預(yù)洗滌。50μl乙腈被用于在反應(yīng)之間使凝膠脫水,并且在步驟之間凝膠塊被空氣干燥。肽用在HPLC級(jí)水中的1%甲酸/2%乙腈提取2次,每次30分鐘。肽提取溶液被轉(zhuǎn)移至已經(jīng)冷卻至10-15℃的96孔帶邊的PCR型平板(ABGene,Rochester,NY)中,并用96孔平板蓋(PerkinElmer Life and Analytical Sciences,Boston,MA)覆蓋以防止蒸發(fā)。平板進(jìn)一步儲(chǔ)存在4℃直到能夠進(jìn)行質(zhì)譜分析。
40和60kDa蛋白質(zhì)條帶和110kDa條帶如上所述用胰蛋白酶進(jìn)行凝膠內(nèi)消化?;厥盏碾耐ㄟ^用于蛋白質(zhì)驗(yàn)證的肽質(zhì)量指紋分析來(lái)進(jìn)行研究。使用MaldiTM-LR飛行時(shí)間質(zhì)譜儀(Waters MicromassMS Technologies,Milford,MA)。再結(jié)晶的α-氰基-4-羥基肉桂酸通過用100%乙腈(E.M.Science,Gibbstown,NJ)洗滌毫克數(shù)量的α-氰基-4-羥基肉桂酸(SigmaChemical Co.,St.Louis,MO)并且充分混合以及離心至形成基質(zhì)顆粒來(lái)制備。除去并丟棄乙腈溶液。加入HPLC級(jí)水(Fisher Chemicals,F(xiàn)airlawn,NJ,),然后緩慢加入氫氧化銨(J.T.Baker,Phillipsburg,NJ)直到幾乎所有的顆粒溶解。丟棄未溶解的顆粒。將濃縮的HCl水(Fisher Chemicals,F(xiàn)airlawn,NJ,)緩慢加入基質(zhì)溶液直到大量基質(zhì)已經(jīng)再結(jié)晶。結(jié)晶基質(zhì)通過過濾被移出,并用0.1M HCl洗滌若干次且容許其完全干燥。最后的基質(zhì)溶液由在50%乙腈/50%含水0.1%TFA中的10mg/ml再結(jié)晶α-氰基-4-羥基肉桂酸溶液組成。將1μl獲得自蛋白質(zhì)凝膠內(nèi)消化的肽提取溶液與1μl再結(jié)晶的基質(zhì)溶液混合并且在不銹鋼的MALDI-TOF靶平板(Waters MicromassMSTechnologies,Milford,MA)上打點(diǎn)干燥。質(zhì)譜儀利用+15kV的加速電壓,2535伏特的脈沖電壓,和2000伏特的reflectron電壓以reflectron和陽(yáng)離子模式運(yùn)作。數(shù)據(jù)采集質(zhì)量范圍設(shè)置為640至3000m/z。使用由1μl 200fmols/μlACTH(Adenocorticotrophic Hormone Clip 18-39 MW=2,465.1989)(SigmaChemical Co,St.Louis,MO)和1μl再結(jié)晶的基質(zhì)溶液組成的鎖定質(zhì)量校準(zhǔn)標(biāo)準(zhǔn)用于內(nèi)標(biāo)準(zhǔn)并且打點(diǎn)至鄰近的鎖定質(zhì)量目標(biāo)孔。數(shù)據(jù)采集利用Windows NT控制的微處理器工作站,利用Masslynx 4.0質(zhì)譜分析法軟件(Waters MicromassMS Technologies,Milford,MA)進(jìn)行。使獲得的光譜組合、平滑和中心化,并且產(chǎn)生肽離子質(zhì)量的峰值列表。這個(gè)峰值列表利用ProteinLynxTMGlobal Server 2.05軟件(Waters MicromassMS Technologies,Milford,MA)針對(duì)數(shù)據(jù)庫(kù)進(jìn)行檢索。
來(lái)自肽質(zhì)量指紋分析的結(jié)果表明驗(yàn)證40和60kDa蛋白質(zhì)條帶為煙曲霉Agl1α-葡糖苷酶,而驗(yàn)證110kDa蛋白質(zhì)條帶為煙曲霉Agl3α-葡糖苷酶。
最適pH.利用上述的活性測(cè)定,在50mM乙酸鹽緩沖液/50mM磷酸鹽緩沖液,于37℃在不同的pH值測(cè)量純化的煙曲霉Agl1和Agl3α-葡糖苷酶的特異活性。
如圖10所示Agl1α-葡糖苷酶在pH 4.1具有酸性最適pH活性。如圖13所示Agl3α-葡糖苷酶在pH 4.0-4.5范圍內(nèi)具有酸性最適pH活性。
熱穩(wěn)定性.純化的煙曲霉Agl1和Agl3α-葡糖苷酶的熱穩(wěn)定性通過將每一α-葡糖苷酶在50mM乙酸鈉pH5.0水浴中,于選擇的溫度孵育5分鐘來(lái)確定。作為底物的麥芽糖(1.1%;375μl)在水浴中于37℃孵育5分鐘。將等分的酶樣品與底物混合,并在37℃測(cè)量特異活性。
如圖11所示,煙曲霉Agl1α-葡糖苷酶達(dá)到大約70℃仍具有優(yōu)良的熱穩(wěn)定性(大約80%殘余)。該酶于這個(gè)溫度在50mM乙酸鹽緩沖液pH 5.0中5分鐘后只喪失22%活性,而在100℃喪失全部活性。
如圖14所示,煙曲霉Agl3α-葡糖苷酶達(dá)到大約67℃仍具有優(yōu)良的熱穩(wěn)定性(大約80%殘余)。該酶于70℃在50mM乙酸鹽緩沖液pH 5.0中5分鐘后只喪失33%活性,而在100℃喪失全部活性。
最適溫度.純化的煙曲霉Agl1和Agl3α-葡糖苷酶的特異活性在50mM乙酸鈉pH 5.0中于不同的溫度值加以測(cè)量。將作為底物的麥芽糖(1.1%;375μl)于選擇的溫度在水浴中孵育5分鐘。將在含有0.01%Triton-X100的50mM乙酸鈉pH 5.0稀釋的等分酶樣品(25μl)與底物混合。該反應(yīng)在相同溫度孵育10分鐘后通過加入1M Tris溶液(100μl)并且立即煮沸3分鐘來(lái)終止。
如圖12所示,Agl1酶的最適溫度是大約63℃。如圖15所示,Agl3酶的最適溫度是大約60℃。
動(dòng)力學(xué)參數(shù).測(cè)定麥芽糖被純化的煙曲霉Agl1和Agl3α葡糖苷酶特異水解的動(dòng)力學(xué)參數(shù)。
裝備有CarboPac PA10 4×250mm柱和ED50電化學(xué)檢測(cè)器(Sunnyvale,CA)的Dionex BioLC HPLC裝置被用于定量檢測(cè)來(lái)自麥芽糖水解的葡萄糖。氫氧化鈉溶液(200mM)被用作液相。這個(gè)方法提供在大約0.01mM葡萄糖水平的精確測(cè)定。校準(zhǔn)曲線在0mM和1.2mM葡萄糖之間是線性的。
孵育混合物在37℃包含在0.19-4.61mM范圍內(nèi)的10ml麥芽糖溶液。酶促反應(yīng)通過加入10μl α-葡糖苷酶溶液來(lái)起始。酶促反應(yīng)通過將1ml等分樣品置于沸水中2.5分鐘然后置于冰至少30分鐘來(lái)終止。
kcat的值利用煙曲霉α-葡糖苷酶Agl1和Agl3的分別為98.8kDa和108.6kDa的分子質(zhì)量來(lái)計(jì)算。
通常被用來(lái)確定動(dòng)力學(xué)參數(shù)的倒數(shù)曲線圖對(duì)于每個(gè)酶都不是線性的。在升高的麥芽糖濃度,水解反應(yīng)的速度(葡萄糖的累積)顯著降低。這個(gè)效應(yīng)對(duì)于煙曲霉Agl1α-葡糖苷酶是特別顯著的,其中從0.58mM麥芽糖開始觀察到降低的反應(yīng)速度。
麥芽糖的α-葡糖苷酶-催化水解中觀察到的速度降低可能是由底物抑制所引起的(Segel,I.H.Enzyme Kinetics.Behavior and Analysis of RapidEquilibrium and Steady-State Enzyme Systems.1975,John Wiley & Sons),或備選地可能是轉(zhuǎn)糖基反應(yīng)中葡萄糖的競(jìng)爭(zhēng)性利用的結(jié)果。隨著麥芽糖濃度增加,它成為葡萄糖分子的接受體。葡萄糖和麥芽糖之間的轉(zhuǎn)糖基反應(yīng)導(dǎo)致產(chǎn)生潘糖(6-O-α-D-葡糖基麥芽糖)。產(chǎn)生麥芽糖和異麥芽糖的2個(gè)葡萄糖分子之間相互作用的概率由于在“初速度”狀態(tài)下麥芽糖的低濃度而是很低的。CarboPac PA10柱容許從寡聚糖分離葡萄糖,但不區(qū)分麥芽糖和潘糖。
從曲線圖評(píng)估α-葡糖苷酶的動(dòng)力學(xué)參數(shù)。在pH 5.0和37℃,煙曲霉Agl1α-葡糖苷酶的Km是0.04mM,kcat是48s-1(底物范圍為0.12mM-0.41mM)。在pH 5.0和37℃,煙曲霉Agl3的Km是0.34mM,kcat是237s-1(底物范圍為0.14mM-0.55mM)。
如上所指出,該底物范圍并不總是最佳的。同時(shí)檢測(cè)極限不容許應(yīng)用更低的底物濃度。兩個(gè)α-葡糖苷酶證明了可能歸因于轉(zhuǎn)糖基作用活性的強(qiáng)烈的“底物抑制”。
實(shí)施例20煙曲霉Agl2α-葡糖苷酶的純化如實(shí)施例13中描述的在米曲霉BECH2中表達(dá)的煙曲霉Agl2α-葡糖苷酶利用如下所述的方案純化。
α-葡糖苷酶活性如實(shí)施例17中所描述的進(jìn)行測(cè)量。蛋白質(zhì)濃度如實(shí)施例17所描述的測(cè)定。SDS-PAGE分析如實(shí)施例17所描述的進(jìn)行。
搖瓶培養(yǎng)物(MY25培養(yǎng)基)在1000xg離心并移出上清液。上清液利用Millipore 0.22μm Stericup真空濾器過濾。
上清液用100mM Tris稀釋,pH調(diào)節(jié)至8.5。該稀釋的上清液包含淡褐色色素。為了除去色素,250毫升的上清液(用100mM Tris pH 8.5稀釋2.5-倍)被加載到用0.1M Tris pH 8.5預(yù)平衡的含有Q-Sepharose Big Beads樹脂(Amersham Biosciences,Uppsala,Sweden)的30×2.5cm柱上(PharmaciaBiotech AB,Uppsala,Sweden)。α-葡糖苷酶用0.1M乙酸鈉pH 4.0緩沖液洗滌來(lái)洗提而不分餾。收集“洗凈”溶液(300ml)并測(cè)定α-葡糖苷酶活性?;厥瞻俜种攀摩?葡糖苷酶活性。剩余的大部分淡褐色色素結(jié)合Q-Sepharose。Q-Sepharose柱的乙酸鈉洗滌步驟后,將0.5mM的絲氨酸蛋白酶抑制劑,PMSF加入溶液以免潛在的蛋白水解。濃縮這個(gè)溶液并且利用攪拌的250ml超濾細(xì)胞(Amicon,Beverly,MA)再緩沖(100mM Tris pH 8.5)。
然后來(lái)自Q-Sepharose柱步驟的α-葡糖苷酶被加載到用50mM Tris pH8.5預(yù)平衡的Mono Q 16/10柱上。該酶利用在50mM Tris pH 8.5中的0至0.5M NaCl 20柱容積梯度洗提。收集10ml餾分,測(cè)定α-葡糖苷酶活性,并根據(jù)特異活性和純度匯集(SDS-PAGE)。
純化概括在下列表3中。
表3.煙曲霉Agl2α-葡糖苷酶的純化
純化的制品在SDS-PAGE上產(chǎn)生分子量為33、36、75、和105kDa的4個(gè)條帶。根據(jù)煙曲霉Agl3α-葡糖苷酶的預(yù)測(cè)質(zhì)量,105kDa的條帶相應(yīng)于α-葡糖苷酶。
生物材料的保藏下列生物材料已經(jīng)根據(jù)布達(dá)佩斯條約保藏在農(nóng)業(yè)研究機(jī)構(gòu)保藏中心,1815 University Street,Peoria,Illinois,61604,并且給出下列保藏號(hào)保藏物 保藏號(hào) 保藏日期大腸桿菌XL 10-Gold(pSMO216) NRRL B-307512004年6月17日大腸桿菌XL 10-Gold(pHyGe011) NRRL B-307502004年6月10日大腸桿菌XL 10-Gold(pJSF9b) NRRL B-308562005年6月23日該菌株于下述條件下保藏確保在本專利申請(qǐng)未決期間,由專利與商標(biāo)委員依據(jù)37C.F.R.§1.14和35U.S.C.§122授權(quán)的人能夠獲得該培養(yǎng)物。該保藏物為所保藏菌株的基本上純的培養(yǎng)物。在提交了該申請(qǐng)的副本,或其后續(xù)文本的國(guó)家,依據(jù)該外國(guó)專利法律的要求,可以獲得該保藏物。然而,應(yīng)當(dāng)理解,保藏物的獲得并不構(gòu)成對(duì)實(shí)施本發(fā)明的許可,實(shí)施本發(fā)明是對(duì)政府行為所授予的專利權(quán)的侵犯。
本文所描述和要求保護(hù)的發(fā)明并不限于由本文公開的具體實(shí)施方案的范圍,因?yàn)檫@些實(shí)施方案旨在例證說(shuō)明本發(fā)明的若干方面。任何等同的實(shí)施方案都將在本發(fā)明的范圍之內(nèi)。事實(shí)上,除了本文所顯示和描述的那些之外,由在前描述對(duì)于本領(lǐng)域技術(shù)人員來(lái)說(shuō)本發(fā)明的各種改進(jìn)將是顯而易見的。這些改進(jìn)也將落入隨附的權(quán)利要求的范圍之內(nèi)。在出現(xiàn)抵觸的情況下,以包括定義的本說(shuō)明書的公開來(lái)調(diào)控。
本文引用了多種參考文獻(xiàn),將其全部?jī)?nèi)容并入作為參考。
關(guān)于微生物保藏的說(shuō)明(細(xì)則13之二)
關(guān)于微生物保藏的說(shuō)明(細(xì)則13之二)
關(guān)于微生物保藏的說(shuō)明(細(xì)則13之二)
序列表<110>諾維信股份有限公司(Novozymes,Inc.)<120>具有α-葡糖苷酶活性的多肽及編碼其的多核苷酸<130>10655.204-WO<150>60/585,336<151>2005-06-29<160>26<170>PatentIn version 3.2<210>1<211>2954<212>DNA<213>煙曲霉(Aspergillus fumigatus)<400>1atgttgagat cgctgctact tcttgcgccc cttgtgggcg ctgccgtgat cggcgccagg 60gaccacagcc aggagtgtcc tggttacaag gccaccaata ttagagaggg tcgcgattcc 120ttaacggcgg atttgacctt ggccggtaaa ccgtgcaaca cttacggcac cgacttgaag 180aatctgaaac tccttgttga gtaccagacc ggtacgtttt cagcgttaaa cggctatgat 240tgtagcttac ttctttctag ataaacgcct ccatgttaag atctatgacg ccgatgagga 300ggtttaccaa gtccccgagt cggttctccc tcgcgtggat ggcaaaggtg gatcgagcaa 360gaagtcggcg ctcaagttcg actatcaggc gaatccgttc tctttcaagg tcaagagagg 420cggcgaggtg ctcttcgaca cctccggttc gaatctgatc ttccagtcgc agtacctgag 480cctccgcacc tggttgcccg aggatcctaa tctctacggt cttggcgagc acacggattc 540tcttcgtctg gagaccacca actacacgcg tactctgtgg aaccgtgacg cgtatgctat 600tcctgagaag accaacctgt acggcactca tcccgtgtac tatgaccacc gtggccaaca 660cggcacccac ggtgtcttct tgctgaactc caacggcatg gacattaaga tcgacaagac 720caaggatggc aagcagtact tagagtacaa cactctggga ggtgtctttg acttttactt 780ctttaccggt gccaccccca aggatgccag catcgagtat gcgaaagtcg tcggtcttcc 840cgctatgcag tcctactgga cgttcggtgt acgtttccct gattcgatct gcggtccttc 900cggctaactc ttgtcgtcta gttccaccaa tgcagatacg gctatcgtga tgtctttgag 960gtcgccgagg ttgtctacaa ctacagccag gcgaagattc cactggagac catgtggacc 1020gacattgact acatggacag acgtcgggtg ttcactcttg acccggagcg attcccgctc 1080gagaagatgc gtgagttggt gtcatatctt cacaaccaca accaacacta catcgtcatg 1140
gttgacccgg ccgtcagcgt gagcggtaag tttacctttc caagtatgga gggggtgggt1200gcatattgac aaatgatcag acaacgttgg ctacaatgat ggcatggagc agggcatctt1260cctgcagact caaaacggta gcctctacaa gggtaagcct tacctaaaag tactaatgac1320acccagaata ttgaccctat acaggtgccg tctggcctgg tgtgactgcg tatcctgact1380ggttccaccc tgacatccaa aagtactgga acgaccagtt tgccaaattc ttcgacccca1440agaccggcgt cgacatcgac ggtctgtgga tcgatatgaa cgaggccgcc aacttctgcc1500cttacccttg cagtgatccc gagggctacg ctagggataa cgacctgcct cccgccgctc1560cccccgttcg gcccagcaac ccgcgcccgt tgcccggatt ccctggtgat ttccagccct1620catcctcgtc gaagcgctcc accaagggat ctaaagttgg actgcctaat cgtgacctga1680tcaaccctcc gtacatgatc cgtaatgaag ctggctcgct cagcaacaag accatcaaca1740ccgatatcat tcatgctggt gagggatatg ccgagtatga cactcacaac ctttatggta1800ccagtaagta ggcatccctc tgaatgacgg ggacagtcta acattcaaag tgatgagttc1860cgcttctcgc aatgccatgc aacaccgccg ccctggggtg cggccattgg tcatcactcg1920cagcacgtat gctggtgctg gcgcccacgt tggacactgg tcggtgtgca tccatctagt1980acctgcgaac tcttatactg acacttgaca ggctcggtga caacatctcc gagtggagca2040agtaccgcat ctccatctcg cagatgcttg cgtttgcctc gatgttccag gtgcctatga2100tcggatcaga cgtctgcggg ttcggcggca acaccaccga ggagctctgc gctcgctggg2160cgcgtctcgg agccttctac accttcttcc gcaaccacaa tgaaatcacc ggtatcccgc2220aggagttcta ccgctggccc accgttgccg agtccgctcg caaggccatc gacatccgct2280acaggctgct tgactacatc tacacagcct tccaccggca gacccagacc ggcgagccct2340tcctgcagcc catgttctac ctctatccca aggacaagga caccttcagc aaccagctgc2400agttcttcta cggtgacgcc atcctggtca gccctgtcac cgacgggagc cagacttcag2460ttgacgcata cttccccgat gatatcttct acgattggca cacgggcgcc gccctacgcg2520gccgcggagc caacgtcacc ctcagcaaca tcgacgtgac tgagatcccc atccacatcc2580gcggcggcag catcatcccc gtccggtccg agtccgccat gaccaccacc gagctgcgca2640agaagggctt cgagctcatc atcgccccag ggcttgatgg gactgcctcg ggcagtttgt2700atctcgacga cggcgactcc atcgagccgc gcgcgaccct cgagctggag ttcacgtacc2760gcaagggcca tctccaggtg aagggcaagt tcggtttccg cacggaggtc aagatcaacg2820ccgtcaccct gcttggccag tctgcgcctg cctccaagtc tgcagacgtg gcctcccttg2880
actctggccg ccaggcagtg accatcaaga cgagcctgga tctgactggt ccttccgaga2940ttgacctcgg ctag 2954<210>2<211>880<212>PRT<213>煙曲霉<400>2Met Leu Arg Ser Leu Leu Leu Leu Ala Pro Leu Val Gly Ala Ala Val1 5 10 15Ile Gly Ala Arg Asp His Ser Gln Glu Cys Pro Gly Tyr Lys Ala Thr20 25 30Asn Ile Arg Glu Gly Arg Asp Ser Leu Thr Ala Asp Leu Thr Leu Ala35 40 45Gly Lys Pro Cys Asn Thr Tyr Gly Thr Asp Leu Lys Asn Leu Lys Leu50 55 60Leu Val Glu Tyr Gln Thr Asp Lys Arg Leu His Val Lys Ile Tyr Asp65 70 75 80Ala Asp Glu Glu Val Tyr Gln Val Pro Glu Ser Val Leu Pro Arg Val85 90 95Asp Gly Lys Gly Gly Ser Ser Lys Lys Ser Ala Leu Lys Phe Asp Tyr100 105 110Gln Ala Asn Pro Phe Ser Phe Lys Val Lys Arg Gly Gly Glu Val Leu115 120 125Phe Asp Thr Ser Gly Ser Asn Leu Ile Phe Gln Ser Gln Tyr Leu Ser130 135 140Leu Arg Thr Trp Leu Pro Glu Asp Pro Asn Leu Tyr Gly Leu Gly Glu145 150 155 160His Thr Asp Ser Leu Arg Leu Glu Thr Thr Asn Tyr Thr Arg Thr Leu165 170 175Trp Asn Arg Asp Ala Tyr Ala Ile Pro Glu Lys Thr Asn Leu Tyr Gly180 185 190Thr His Pro Val Tyr Tyr Asp His Arg Gly Gln His Gly Thr His Gly195 200 205Val Phe Leu Leu Asn Ser Asn Gly Met Asp Ile Lys Ile Asp Lys Thr210 215 220Lys Asp Gly Lys Gln Tyr Leu Glu Tyr Asn Thr Leu Gly Gly Val Phe225 230 235 240Asp Phe Tyr Phe Phe Thr Gly Ala Thr Pro Lys Asp Ala Ser Ile Glu245 250 255
Tyr Ala Lys Val Val Gly Leu Pro Ala Met Gln Ser Tyr Trp Thr Phe260 265 270Gly Phe His Gln Cys Arg Tyr Gly Tyr Arg Asp Val Phe Glu Val Ala275 280 285Glu Val Val Tyr Asn Tyr Ser Gln Ala Lys Ile Pro Leu Glu Thr Met290 295 300Trp Thr Asp Ile Asp Tyr Met Asp Arg Arg Arg Val Phe Thr Leu Asp305 310 315 320Pro Glu Arg Phe Pro Leu Glu Lys Met Arg Glu Leu Val Ser Tyr Leu325 330 335His Asn His Asn Gln His Tyr Ile Val Met Val Asp Pro Ala Val Ser340 345 350Val Ser Asp Asn Val Gly Tyr Asn Asp Gly Met Glu Gln Gly Ile Phe355 360 365Leu Gln Thr Gln Asn Gly Ser Leu Tyr Lys Gly Ala Val Trp Pro Gly370 375 380Val Thr Ala Tyr Pro Asp Trp Phe His Pro Asp Ile Gln Lys Tyr Trp385 390 395 400Asn Asp Gln Phe Ala Lys Phe Phe Asp Pro Lys Thr Gly Val Asp Ile405 410 415Asp Gly Leu Trp Ile Asp Met Asn Glu Ala Ala Asn Phe Cys Pro Tyr420 425 430Pro Cys Ser Asp Pro Glu Gly Tyr Ala Arg Asp Asn Asp Leu Pro Pro435 440 445Ala Ala Pro Pro Val Arg Pro Ser Asn Pro Arg Pro Leu Pro Gly Phe450 455 460Pro Gly Asp Phe Gln Pro Ser Ser Ser Ser Lys Arg Ser Thr Lys Gly465 470 475 480Ser Lys Val Gly Leu Pro Asn Arg Asp Leu Ile Asn Pro Pro Tyr Met485 490 495Ile Arg Asn Glu Ala Gly Ser Leu Ser Asn Lys Thr Ile Asn Thr Asp500 505 510Ile Ile His Ala Gly Glu Gly Tyr Ala Glu Tyr Asp Thr His Asn Leu515 520 525Tyr Gly Thr Met Ser Ser Ala Ser Arg Asn Ala Met Gln His Arg Arg530 535 540Pro Gly Val Arg Pro Leu Val Ile Thr Arg Ser Thr Tyr Ala Gly Ala545 550 555 560Gly Ala His Val Gly His Trp Leu Gly Asp Asn Ile Ser Glu Trp Ser
565 570 575Lys Tyr Arg Ile Ser Ile Ser Gln Met Leu Ala Phe Ala Ser Met Phe580 585 590Gln Val Pro Met Ile Gly Ser Asp Val Cys Gly Phe Gly Gly Asn Thr595 600 605Thr Glu Glu Leu Cys Ala Arg Trp Ala Arg Leu Gly Ala Phe Tyr Thr610 615 620Phe Phe Arg Asn His Asn Glu Ile Thr Gly Ile Pro Gln Glu Phe Tyr625 630 635 640Arg Trp Pro Thr Val Ala Glu Ser Ala Arg Lys Ala Ile Asp Ile Arg645 650 655Tyr Arg Leu Leu Asp Tyr Ile Tyr Thr Ala Phe His Arg Gln Thr Gln660 665 670Thr Gly Glu Pro Phe Leu Gln Pro Met Phe Tyr Leu Tyr Pro Lys Asp675 680 685Lys Asp Thr Phe Ser Asn Gln Leu Gln Phe Phe Tyr Gly Asp Ala Ile690 695 700Leu Val Ser Pro Val Thr Asp Gly Ser Gln Thr Ser Val Asp Ala Tyr705 710 715 720Phe Pro Asp Asp Ile Phe Tyr Asp Trp His Thr Gly Ala Ala Leu Arg725 730 735Gly Arg Gly Ala Asn Val Thr Leu Ser Asn Ile Asp Val Thr Glu Ile740 745 750Pro Ile His Ile Arg Gly Gly Ser Ile Ile Pro Val Arg Ser Glu Ser755 760 765Ala Met Thr Thr Thr Glu Leu Arg Lys Lys Gly Phe Glu Leu Ile Ile770 775 780Ala Pro Gly Leu Asp Gly Thr Ala Ser Gly Ser Leu Tyr Leu Asp Asp785 790 795 800Gly Asp Ser Ile Glu Pro Arg Ala Thr Leu Glu Leu Glu Phe Thr Tyr805 810 815Arg Lys Gly His Leu Gln Val Lys Gly Lys Phe Gly Phe Arg Thr Glu820 825 830Val Lys Ile Asn Ala Val Thr Leu Leu Gly Gln Ser Ala Pro Ala Ser835 840 845Lys Ser Ala Asp Val Ala Ser Leu Asp Ser Gly Arg Gln Ala Val Thr850 855 860Ile Lys Thr Ser Leu Asp Leu Thr Gly Pro Ser Glu Ile Asp Leu Gly865 870 875 880
<210>3<211>3016<212>DNA<213>煙曲霉<400>3atggcccgga gcagctcgtc tctctccaga tggacgctat tgctcgcgtt ggttgtcatt 60ctcgggtgtc ttgttgtacc cggaggtgag ctctatgcgc tcaacttaat ccaatagtaa 120cgccatctga ccaagtctgc cagttactgt gaagcatgag aacttcaaga aatgctctca 180atcgggtttt tgtaagcgaa accgagcttt tgcagatgac gtctccgccc aaggcgcgtc 240ttggatttca ccatatgaac tcgatccctc ctcaattcac ttcaaagatg gccaactgca 300agggacaatt ctcaagtcca tatctgccaa tgagaaagtc aagctgccac ttgtgatttc 360tttcctggag tctggagctg cgcgcatcgt ggtcgacgaa gagaagcgga tgaagggcga 420aattgacctc cgacataaca gccaagtgcg caaagagcga tacaatgaag cagagcaatg 480ggcactggtt ggtggtttgg aatcgagcaa aactgccgct gtggacacag aatccgagac 540tggattcaca aaggtacttt acgggccgga taacaagttt caggcaatca ttcgccatgc 600gccgttcagc gttgattttc agcgcgatgg ccagagccat gtccgagtga atcacaaggg 660cttcctcaac gtggaacact ggcggccaaa ggtggatgtg gcagagggtg acagtgttca 720ggaaaaatcg atacctcagc aagatgaaag cacttggtgg gaggaaactt ttggtgggaa 780caccgactcc aagccaaaag gtcccgaaag tatcggcctg gacatcacat tccctggcta 840cagccatgtt tttgggattc cagagcatgc cgactcgatg tctctgaagg aaaccaggta 900ggtgttacat gtccctgccc ctctagagac gcaaagctga tcagtttgaa ggggcggtga 960tggaaatcat gcggaacctt atcgcatgta caatacggac gtctttgaat atgaactcaa 1020cagtcccatg acgctctatg gggccattcc gttcatgcag gctcacaaga aggactctac 1080tgtgggtgtc ttctggctga acgctgcgga gacctgggtc gacatcgtca agtcgaaatc 1140ctcgcccgac cctctttctc ttggagtagg ttcgaagaca gacacccaaa ctcattggtt 1200ttccgagtcg ggacgtattg atttgtttgt cttcttgggc cccactccgc aagagatcag 1260caaaacatac ggtgaactta ccggctacac tcaattacct caacagttcg ctatcgctta 1320ccaccagtgt cgttggaact atgtcacgga cgaggatgtc aaggaagttg atcgcaagtt 1380tgacaagtat cagatccctt acgatgtgat ttggcttgac attgagtaca cggatgaccg 1440gaagtacttt acctgggacc ctctgagttt tcctgacccg aagggtatgg aagagcagct l500tgatgactcc gagcgcaaac tcgttgtgat cattgacccg cacattaaaa acaaggaagg 1560
atactccatc tctgaagagc tgaagggcaa ggatctggct attaagaaca agggcgggga 1620gacctacgac ggctggtgtt ggcctggttc atctcactgg gtggactgct tcaatcccga 1680agcaatcaaa tggtggaccg gcttgttcaa gtacgacaaa ttcaagggca cccagccaaa 1740cgtctttatt tggaatgaca tgaatgagcc ctctgtcttc aatggaccgg aaaccactat 1800gcccaaagac aatatccact atggcaactg ggaacaccgc gacgtgcata atgtcaacgg 1860actgaccttt atcaacgcaa catacaatgc cttactggag cggaagaaag gcgtggttcg 1920tcggcccttc gtcttgaccc gatcattcta cgccggggct caacgggtat ctgctatgtg 1980gacgggagac aatcaagcca cctgggaaca tctggccgca tccttgccta tggtattgaa 2040taacggcatt gccgggttcc cgtttgccgg tgccgatgtt ggcgggtttt tccagaaccc 2100aagcaaggaa cttttgaccc ggtggtatca ggccggcatt tggtatccct tcttccgtgc 2160ccatgcgcac attgacactc gcagacgaga gccctacttg atcgctgagc cattcaggtc 2220gatcatatcc caggctatcc gtctgagata tcaactgctg cctgcatggt acactgcttt 2280tcatgaagct tcggtgaatg gaatgcctat tgttcggccc cagtattatg tccacccggc 2340ggacgaacaa ggctttgcca ttgatgacca actctacctt ggatctactg gcctgctggc 2400caaacctgtg gttgtggagg gtgccaccac tacagatatc tacatcgctg acgatgagaa 2460gtactacgat tactatgatt ttactgtcta ccaaggagcg ggcaggagac atacggtgcc 2520ttcccccatt gagaaggtcc cattgttgat gcaaggaggt catattatcc ctcgcaagga 2580ccgcgcacgt cgtagcagcg ggctgatgag atgggatcct tatacacttg tgatcgtcct 2640cgacaagaac gggaaggccg aaggcacact ctatgttgat gatggggagt cgttcaacta 2700ccagcagggt gcatacatac accgtcgctt caaatttgaa aaatctaccc ttttgtcgga 2760agacatcggc accaagggtt cgaagacagc cgaatacctg aagagcatga cgaatgtgcg 2820ggttcaaaag gtggttgttg tcgacgctcc caaggagtgg cagggaagga cgtctgtgac 2880cgtcatcgaa gacggtgcaa agatggcttc taccgcaccc ttggagtatc acgcccagca 2940ggcaggcaag gctgcgtatg ctgtcgtgaa gaaacccgat gttggcattg gaaagacatg 3000gaagattgaa ttctaa 3016<210>4<211>967<212>PRT<213>煙曲霉<400>4Met Ala Arg Ser Ser Ser Ser Leu Ser Arg Trp Thr Leu Leu Leu Ala
1 5 10 15Leu Val Val Ile Leu Gly Cys Leu Val Val Pro Gly Val Thr Val Lys20 25 30His Glu Asn Phe Lys Lys Cys Ser Gln Ser Gly Phe Cys Lys Arg Asn35 40 45Arg Ala Phe Ala Asp Asp Val Ser Ala Gln Gly Ala Ser Trp Ile Ser50 55 60Pro Tyr Glu Leu Asp Pro Ser Ser Ile His Phe Lys Asp Gly Gln Leu65 70 75 80Gln Gly Thr Ile Leu Lys Ser Ile Ser Ala Asn Glu Lys Val Lys Leu85 90 95Pro Leu Val Ile Ser Phe Leu Glu Ser Gly Ala Ala Arg Ile Val Val100 105 110Asp Glu Glu Lys Arg Met Lys Gly Glu Ile Asp Leu Arg His Asn Ser115 120 125Gln Val Arg Lys Glu Arg Tyr Asn Glu Ala Glu Gln Trp Ala Leu Val130 135 140Gly Gly Leu Glu Ser Ser Lys Thr Ala Ala Val Asp Thr Glu Ser Glu145 150 155 160Thr Gly Phe Thr Lys Val Leu Tyr Gly Pro Asp Asn Lys Phe Gln Ala165 170 175Ile Ile Arg His Ala Pro Phe Ser Val Asp Phe Gln Arg Asp Gly Gln180 185 190Ser His Val Arg Val Asn His Lys Gly Phe Leu Asn Val Glu His Trp195 200 205Arg Pro Lys Val Asp Val Ala Glu Gly Asp Ser Val Gln Glu Lys Ser210 215 220Ile Pro Gln Gln Asp Glu Ser Thr Trp Trp Glu Glu Thr Phe Gly Gly225 230 235 240Asn Thr Asp Ser Lys Pro Lys Gly Pro Glu Ser Ile Gly Leu Asp Ile245 250 255Thr Phe Pro Gly Tyr Ser His Val Phe Gly Ile Pro Glu His Ala Asp260 265 270Ser Met Ser Leu Lys Glu Thr Arg Gly Gly Asp Gly Asn His Ala Glu275 280 285Pro Tyr Arg Met Tyr Asn Thr Asp Val Phe Glu Tyr Glu Leu Asn Ser290 295 300Pro Met Thr Leu Tyr Gly Ala Ile Pro Phe Met Gln Ala His Lys Lys305 310 315 320
Asp Ser Thr Val Gly Val Phe Trp Leu Asn Ala Ala Glu Thr Trp Val325 330 335Asp Ile Val Lys Ser Lys Ser Ser Pro Asp Pro Leu Ser Leu Gly Val340 345 350Gly Ser Lys Thr Asp Thr Gln Thr His Trp Phe Ser Glu Ser Gly Arg355 360 365Ile Asp Leu Phe Val Phe Leu Gly Pro Thr Pro Gln Glu Ile Ser Lys370 375 380Thr Tyr Gly Glu Leu Thr Gly Tyr Thr Gln Leu Pro Gln Gln Phe Ala385 390 395 400Ile Ala Tyr His Gln Cys Arg Trp Asn Tyr Val Thr Asp Glu Asp Val405 410 415Lys Glu Val Asp Arg Lys Phe Asp Lys Tyr Gln Ile Pro Tyr Asp Val420 425 430Ile Trp Leu Asp Ile Glu Tyr Thr Asp Asp Arg Lys Tyr Phe Thr Trp435 440 445Asp Pro Leu Ser Phe Pro Asp Pro Lys Gly Met Glu Glu Gln Leu Asp450 455 460Asp Ser Glu Arg Lys Leu Val Val Ile Ile Asp Pro His Ile Lys Asn465 470 475 480Lys Glu Gly Tyr Ser Ile Ser Glu Glu Leu Lys Gly Lys Asp Leu Ala485 490 495Ile Lys Asn Lys Gly Gly Glu Thr Tyr Asp Gly Trp Cys Trp Pro Gly500 505 510Ser Ser His Trp Val Asp Cys Phe Asn Pro Glu Ala Ile Lys Trp Trp515 520 525Thr Gly Leu Phe Lys Tyr Asp Lys Phe Lys Gly Thr Gln Pro Asn Val530 535 540Phe Ile Trp Asn Asp Met Asn Glu Pro Ser Val Phe Asn Gly Pro Glu545 550 555 560Thr Thr Met Pro Lys Asp Asn Ile His Tyr Gly Asn Trp Glu His Arg565 570 575Asp Val His Asn Val Asn Gly Leu Thr Phe Ile Asn Ala Thr Tyr Asn580 585 590Ala Leu Leu Glu Arg Lys Lys Gly Val Val Arg Arg Pro Phe Val Leu595 600 605Thr Arg Ser Phe Tyr Ala Gly Ala Gln Arg Val Ser Ala Met Trp Thr610 615 620Gly Asp Asn Gln Ala Thr Trp Glu His Leu Ala Ala Ser Leu Pro Met625 630 635 640
Val Leu Asn Asn Gly Ile Ala Gly Phe Pro Phe Ala Gly Ala Asp Val645 650 655Gly Gly Phe Phe Gln Asn Pro Ser Lys Glu Leu Leu Thr Arg Trp Tyr660 665 670Gln Ala Gly Ile Trp Tyr Pro Phe Phe Arg Ala His Ala His Ile Asp675 680 685Thr Arg Arg Arg Glu Pro Tyr Leu Ile Ala Glu Pro Phe Arg Ser Ile690 695 700Ile Ser Gln Ala Ile Arg Leu Arg Tyr Gln Leu Leu Pro Ala Trp Tyr705 710 715 720Thr Ala Phe His Glu Ala Ser Val Asn Gly Met Pro Ile Val Arg Pro725 730 735Gln Tyr Tyr Val His Pro Ala Asp Glu Gln Gly Phe Ala Ile Asp Asp740 745 750Gln Leu Tyr Leu Gly Ser Thr Gly Leu Leu Ala Lys Pro Val Val Val755 760 765Glu Gly Ala Thr Thr Thr Asp Ile Tyr Ile Ala Asp Asp Glu Lys Tyr770 775 780Tyr Asp Tyr Tyr Asp Phe Thr Val Tyr Gln Gly Ala Gly Arg Arg His785 790 795 800Thr Val Pro Ser Pro Ile Glu Lys Val Pro Leu Leu Met Gln Gly Gly805 810 815His Ile Ile Pro Arg Lys Asp Arg Ala Arg Arg Ser Ser Gly Leu Met820 825 830Arg Trp Asp Pro Tyr Thr Leu Val Ile Val Leu Asp Lys Asn Gly Lys835 840 845Ala Glu Gly Thr Leu Tyr Val Asp Asp Gly Glu Ser Phe Asn Tyr Gln850 855 860Gln Gly Ala Tyr Ile His Arg Arg Phe Lys Phe Glu Lys Ser Thr Leu865 870 875 880Leu Ser Glu Asp Ile Gly Thr Lys Gly Ser Lys Thr Ala Glu Tyr Leu885 890 895Lys Ser Met Thr Asn Val Arg Val Gln Lys Val Val Val Val Asp Ala900 905 910Pro Lys Glu Trp Gln Gly Arg Thr Ser Val Thr Val Ile Glu Asp Gly915 920 925Ala Lys Met Ala Ser Thr Ala Pro Leu Glu Tyr His Ala Gln Gln Ala930 935 940Gly Lys Ala Ala Tyr Ala Val Val Lys Lys Pro Asp Val Gly Ile Gly
945 950 955 960Lys Thr Trp Lys Ile Glu Phe965<210>5<211>3167<212>DNA<213>煙曲霉<400>5atggccagcg tcctgggcct cgtcgccagt gcctggctcc tccccacggc ctatggcgca 60agccattcgc ttgcgcctag cacgtccgca acctcagcac aggcgcaata cactttacca 120tcttctattg acgttggcgc tcacttgatc gccaacatcg acgatcccct tgccgtcgac 180gcgcagtctg tgtgtccggg ctacacagcc tcagatgtgc accagacatc ccatggtttc 240accgctaacc tacagctcgc gggtgaccca tgcaacgtgt acgggacaga cgttgattcg 300ctgtctctga cagtggatta tttggccaag gaccgcctga atatccaagt tgttcctacc 360cacgtggatg cctccaacgc ttcttggtac ctcctctcgg aagatttggt gccccgggct 420catggccctg gcgtgtccgc ctctcaaagc gactttgaag tgaagtggtc caacgagcct 480tctttcaacc tcaaggtcat tcgcaaggct actggagacg tcctcttcga taccgagggc 540tctgtcttgg tctttgagaa ccagtttatc gagtttgtct cttcgttgcc tgagggttac 600aacctgtacg ggctgggaga gcgcatggcc cagctgcggc tcttgagaaa cgcgaccctg 660accacctatg cagcggatgt gggagacccg attgataggt atgttgctgg ccatggttga 720aatctaatgt acgaagtcga caagcttaca atcggctctc cacagcaaca tctatggaca 780gcatccgttc tacctcgaca ctcgatacta caccaaaggc gcgaatgggt cctactcgct 840tgtcaacgcc gacgaggcgg acttgtcgga ggatcatgaa tcattctccc acggtgtctt 900tctgagaaac gctcatggtc aggaagttct cctgcagccc cgcaacatta cctggcgcac 960aattggtggt agcatcgatc tgactttcta ctccggtccc acgcaagcgg acgtcacaaa 1020gagctaccag ctctccacta ttggacttcc tgcaatgcag cagtacagcg cccttggata 1080ccaccaatgc cgctggggct accagaattg gtctcagctc gaggaagtag tcaacaactt 1140tgagcgattt gagattcctc tggaatacat ctggtcagtc gggtttctga gtttctacat 1200attgtcctag tttcttttat ttaccttcct tccaggagcg acatcgatta catgcttggc 1260taccgggact ttgagaatga tcccgaacgg ttctcctacg atgaaggcga ggaatttctg 1320aacaaactgc acaagtcggg acgacactgg gttcctatcg ttgactcggc aatctatatt 1380cccaaccccg acaatgcatt ggatgcgtaa gtccttatta tcttatcctc cttgtgagat 1440
ggtcaagttc aagttctcac gaaagtgtga actccaggta cgagccttat gctcgcgggg1500caaaggatga cgtttttatc aagaaccctg atggcaccct ctacatcggt gcagtgtggc1560cgggctttac tgtcttcccc gattggcaca accccaaggc atttgactac tgggccaacg1620aactcgtcat ctggtcaaag aaggttgcgt tcgatggcat ctggattgat atgagcgaag1680tatcctcttt ctgcgtgggc agctgtggaa caggaaagct acatctgaat ccggttcacc1740caccattcca gcttcccggt gaacctggca atgtcggcta cgactacccc gaggccttca1800acgtgacgaa ctctaccgaa gcggcctctg cctccgccgc ctctgccagt caggcttcgg1860ctgcttctgc tacccaagcc gccacgacgt caacatctac atcgtatctg cggacgacgc1920ccacgccggg cgtccgcgac gtcaactacc ctccatatgt gattaatcat gttcaggagg1980gccatgacct tgccgtgcac gccatttctc ccaactccac ccatgtggac ggcgtccagg2040aatacgatgt tcacagtctg tggggccacc agatcctcaa tgctacctac tacggactgc2100gccaggtctt cactgagaag cgacctttca tcattggccg gtctaccttt gctggctcgg2160gcaagtgggc cggtcactgg ggcggtgata acaactccaa atgggggtcc atgttcctgt2220ccatctcgca gggtctgtcg ttctcgctat tcggtattcc catgttcggc gtggatacat2280gcggtttcaa cggcaacact gacgaggagc tttgcagccg gtggatgcag ctgtcggcct2340tcttcccctt ctaccgcaac cacaatgtcc ttgcggctat cccccaggaa ccctaccgct2400gggcctctgt cgcccaagcc tccaaggccg ctatgaagat ccgctattcc ctcctacctt2460acttctacac tcttttccac caggcccaca ccaccggctc taccgtcatg cgcgctctcg2520cctgggagtt ccccacggac ccgtccctcg ccgccgtcga cactcagttc atggtcggcc2580cttccatcat ggtcgtcccc gtgcttgagc ccctcgccga taccgtcaag ggcgtgttcc2640caggcgtcgg caaaggcgaa gtctggtacg actggtacac ccagaccgcc gtggacgcca2700aacccggcgt caacgccacc attcccgcac cgctgggcca cattcccgtc tatgtccgtg2760gaggcagcat cctgcccatg caggagcccg ccctcacgac cagagacgcc cgtaacactc2820cctggtctct actcgtcgct ctgagtggca accagactgc cttgggctcg ctgtatcttg2880acgacggaag cagcctcaac ccgtcccgca ctctcgatgt cgacttccag gctacagcct2940cgagcatcaa ggtctcggtc aagggtacct gggaggagaa gaaccgcctg gataaggtga3000ctgtcctcgg cgtgactgag aagccttctg ctgtgacgtt caacggccgc aacgtccacc3060ctggctcagt gcactacaat actaccacca aggtgctgtc tgtgcaggga ttgcacagca3120tgactcccca tggcgcctgg gctggacact ggattctgaa atggtag 3167
<210>6<211>988<212>PRT<213>煙曲霉<400>6Met Ala Ser Val Leu Gly Leu Val Ala Ser Ala Trp Leu Leu Pro Thr1 5 10 15Ala Tyr Gly Ala Ser His Ser Leu Ala Pro Ser Thr Ser Ala Thr Ser20 25 30Ala Gln Ala Gln Tyr Thr Leu Pro Ser Ser Ile Asp Val Gly Ala His35 40 45Leu Ile Ala Asn Ile Asp Asp Pro Leu Ala Val Asp Ala Gln Ser Val50 55 60Cys Pro Gly Tyr Thr Ala Ser Asp Val His Gln Thr Ser His Gly Phe65 70 75 80Thr Ala Asn Leu Gln Leu Ala Gly Asp Pro Cys Asn Val Tyr Gly Thr85 90 95Asp Val Asp Ser Leu Ser Leu Thr Val Asp Tyr Leu Ala Lys Asp Arg100 105 110Leu Asn Ile Gln Val Val Pro Thr His Val Asp Ala Ser Asn Ala Ser115 120 125Trp Tyr Leu Leu Ser Glu Asp Leu Val Pro Arg Ala His Gly Pro Gly130 135 140Val Ser Ala Ser Gln Ser Asp Phe Glu Val Lys Trp Ser Asn Glu Pro145 150 155 160Ser Phe Asn Leu Lys Val Ile Arg Lys Ala Thr Gly Asp Val Leu Phe165 170 175Asp Thr Glu Gly Ser Val Leu Val Phe Glu Asn Gln Phe Ile Glu Phe180 185 190Val Ser Ser Leu Pro Glu Gly Tyr Asn Leu Tyr Gly Leu Gly Glu Arg195 200 205Met Ala Gln Leu Arg Leu Leu Arg Asn Ala Thr Leu Thr Thr Tyr Ala210 215 220Ala Asp Val Gly Asp Pro Ile Asp Arg Asn Ile Tyr Gly Gln His Pro225 230 235 240Phe Tyr Leu Asp Thr Arg Tyr Tyr Thr Lys Gly Ala Asn Gly Ser Tyr245 250 255Ser Leu Val Asn Ala Asp Glu Ala Asp Leu Ser Glu Asp His Glu Ser260 265 270
Phe Ser His Gly Val Phe Leu Arg Asn Ala His Gly Gln Glu Val Leu275 280 285Leu Gln Pro Arg Asn Ile Thr Trp Arg Thr Ile Gly Gly Ser Ile Asp290 295 300Leu Thr Phe Tyr Ser Gly Pro Thr Gln Ala Asp Val Thr Lys Ser Tyr305 310 315 320Gln Leu Ser Thr Ile Gly Leu Pro Ala Met Gln Gln Tyr Ser Ala Leu325 330 335Gly Tyr His Gln Cys Arg Trp Gly Tyr Gln Asn Trp Ser Gln Leu Glu340 345 350Glu Val Val Asn Asn Phe Glu Arg Phe Glu Ile Pro Leu Glu Tyr Ile355 360 365Trp Ser Asp Ile Asp Tyr Met Leu Gly Tyr Arg Asp Phe Glu Asn Asp370 375 380Pro Glu Arg Phe Ser Tyr Asp Glu Gly Glu Glu Phe Leu Asn Lys Leu385 390 395 400His Lys Ser Gly Arg His Trp Val Pro Ile Val Asp Ser Ala Ile Tyr405 410 415Ile Pro Asn Pro Asp Asn Ala Leu Asp Ala Tyr Glu Pro Tyr Ala Arg420 425 430Gly Ala Lys Asp Asp Val Phe Ile Lys Asn Pro Asp Gly Thr Leu Tyr435 440 445Ile Gly Ala Val Trp Pro Gly Phe Thr Val Phe Pro Asp Trp His Asn450 455 460Pro Lys Ala Phe Asp Tyr Trp Ala Asn Glu Leu Val Ile Trp Ser Lys465 470 475 480Lys Val Ala Phe Asp Gly Ile Trp Ile Asp Met Ser Glu Val Ser Ser485 490 495Phe Cys Val Gly Ser Cys Gly Thr Gly Lys Leu His Leu Asn Pro Val500 505 510His Pro Pro Phe Gln Leu Pro Gly Glu Pro Gly Asn Val Gly Tyr Asp515 520 525Tyr Pro Glu Ala Phe Asn Val Thr Asn Ser Thr Glu Ala Ala Ser Ala530 535 540Ser Ala Ala Ser Ala Ser Gln Ala Ser Ala Ala Ser Ala Thr Gln Ala545 550 555 560Ala Thr Thr Ser Thr Ser Thr Ser Tyr Leu Arg Thr Thr Pro Thr Pro565 570 575Gly Val Arg Asp Val Asn Tyr Pro Pro Tyr Val Ile Asn His Val Gln580 585 590
Glu Gly His Asp Leu Ala Val His Ala Ile Ser Pro Asn Ser Thr His595 600 605Val Asp Gly Val Gln Glu Tyr Asp Val His Ser Leu Trp Gly His Gln610 615 620Ile Leu Asn Ala Thr Tyr Tyr Gly Leu Arg Gln Val Phe Thr Glu Lys625 630 635 640Arg Pro Phe Ile Ile Gly Arg Ser Thr Phe Ala Gly Ser Gly Lys Trp645 650 655Ala Gly His Trp Gly Gly Asp Asn Asn Ser Lys Trp Gly Ser Met Phe660 665 670Leu Ser Ile Ser Gln Gly Leu Ser Phe Ser Leu Phe Gly Ile Pro Met675 680 685Phe Gly Val Asp Thr Cys Gly Phe Asn Gly Asn Thr Asp Glu Glu Leu690 695 700Cys Ser Arg Trp Met Gln Leu Ser Ala Phe Phe Pro Phe Tyr Arg Asn705 710 715 720His Asn Val Leu Ala Ala Ile Pro Gln Glu Pro Tyr Arg Trp Ala Ser725 730 735Val Ala Gln Ala Ser Lys Ala Ala Met Lys Ile Arg Tyr Ser Leu Leu740 745 750Pro Tyr Phe Tyr Thr Leu Phe His Gln Ala His Thr Thr Gly Ser Thr755 760 765Val Met Arg Ala Leu Ala Trp Glu Phe Pro Thr Asp Pro Ser Leu Ala770 775 780Ala Val Asp Thr Gln Phe Met Val Gly Pro Ser Ile Met Val Val Pro785 790 795 800Val Leu Glu Pro Leu Ala Asp Thr Val Lys Gly Val Phe Pro Gly Val805 810 815Gly Lys Gly Glu Val Trp Tyr Asp Trp Tyr Thr Gln Thr Ala Val Asp820 825 830Ala Lys Pro Gly Val Asn Ala Thr Ile Pro Ala Pro Leu Gly His Ile835 840 845Pro Val Tyr Val Arg Gly Gly Ser Ile Leu Pro Met Gln Glu Pro Ala850 855 860Leu Thr Thr Arg Asp Ala Arg Asn Thr Pro Trp Ser Leu Leu Val Ala865 870 875 880Leu Ser Gly Asn Gln Thr Ala Leu Gly Ser Leu Tyr Leu Asp Asp Gly885 890 895Ser Ser Leu Asn Pro Ser Arg Thr Leu Asp Val Asp Phe Gln Ala Thr
900 905 910Ala Ser Ser Ile Lys Val Ser Val Lys Gly Thr Trp Glu Glu Lys Asn915 920 925Arg Leu Asp Lys Val Thr Val Leu Gly Val Thr Glu Lys Pro Ser Ala930 935 940Val Thr Phe Asn Gly Arg Asn Val His Pro Gly Ser Val His Tyr Asn945 950 955 960Thr Thr Thr Lys Val Leu Ser Val Gln Gly Leu His Ser Met Thr Pro965 970 975His Gly Ala Trp Ala Gly His Trp Ile Leu Lys Trp980 985<210>7<211>22<212>DNA<213>黑曲霉<400>7gtgccccatg atacgcctcc gg 22<210>8<211>26<212>DNA<213>黑曲霉<400>8gagtcgtatt tccaaggctc ctgacc 26<210>9<211>24<212>DNA<213>黑曲霉<400>9ggaggccatg aagtggacca acgg 24<210>10<211>45<212>DNA<213>黑曲霉<400>10caccgtgaaa gccatgctct ttccttcgtg tagaagacca gacag45<210>11<211>45<212>DNA<213>黑曲霉
<400>11ctggtcttct acacgaagga aagagcatgg ctttcacggt gtctg 45<210>12<211>44<212>DNA<213>黑曲霉<400>12ctatatacac aactggattt accatgggcc cgcggccgca gatc44<210>13<211>44<212>DNA<213>黑曲霉<400>13gatctgcggc cgcgggccca tggtaaatcc agttgtgtat atag44<210>14<211>26<212>DNA<213>黑曲霉<400>14gtcgacatgg tgttttgatc atttta26<210>15<211>26<212>DNA<213>黑曲霉<400>15ccatggccag ttgtgtatat agagga26<210>16<211>29<212>DNA<213>煙曲霉<400>16tacacaactg gccatgttga gatcgctgc 29<210>17<211>39<212>DNA<213>煙曲霉<400>17gtcacctcta gttaattaac tagctgaggt caatctcgg 39<210>18
<211>30<212>DNA<213>煙曲霉<400>18gcatggagca gggcatcttc ctgcagactc 30<210>19<211>30<212>DNA<213>煙曲霉<400>19gagtctgcag gaagatgccc tgctccatgc 30<210>20<211>32<212>DNA<213>煙曲霉<400>20acacaactgg ccatggcccg gagcagctcg tc32<210>21<211>40<212>DNA<213>煙曲霉<400>21agtcacctct agttaattaa ttagaattca atcttccatg40<210>22<211>32<212>DNA<213>煙曲霉<400>22cgcgcagctc cagactccag gaaagaaatc ac32<210>23<211>32<212>DNA<213>煙曲霉<400>23gtacttgaac aagccggtcc accatttgat tg32<210>24<211>32<212>DNA<213>煙曲霉<400>24
gcctgcctgc tgggcgtgat actccaaggg tg32<210>25<211>39<212>DNA<213>煙曲霉<400>25tacacaactg gccatggcca gcgtcctggg cctcgtcgc 39<210>26<211>43<212>DNA<213>煙曲霉<400>26gtcacctcta gttaattaac taccatttca gaatccagtg tcc4權(quán)利要求
1.具有α-葡糖苷酶活性的分離多肽,選自(a)具有與SEQ ID NO2的第15至881位氨基酸或SEQ ID NO4的第30至967位氨基酸有至少75%同一性,或與SEQ ID NO6的第20至988位氨基酸有至少85%同一性的氨基酸序列的多肽;(b)由在中等嚴(yán)謹(jǐn)條件下與(i)SEQ ID NO1的第43至2643位核苷酸或SEQ ID NO3的第146至3013位核苷酸,(ii)包含在SEQ ID NO1的第43至2643位核苷酸或SEQ ID NO3的第146至3013位核苷酸中的cDNA序列,或(iii)(i)或(ii)的互補(bǔ)鏈雜交,或在高嚴(yán)謹(jǐn)條件下與(i)SEQ IDNO5的第58至3164位核苷酸,(ii)包含在SEQ ID NO5的第58至3164位核苷酸中的cDNA序列,或(iii)(i)或(ii)的互補(bǔ)鏈雜交的多核苷酸編碼的多肽;以及(c)包括SEQ ID NO2的第15至881位氨基酸、SEQ ID NO4的第30至967位氨基酸、或SEQ ID NO6的第20至988位氨基酸的一個(gè)或多個(gè)氨基酸的保守取代、缺失、和/或插入的變體。
2.權(quán)利要求1的多肽,具有與SEQ ID NO2的第15至881位氨基酸或SEQ ID NO4的第30至967位氨基酸有至少75%同一性的氨基酸序列。
3.權(quán)利要求2的多肽,具有與SEQ ID NO2的第15至881位氨基酸或SEQ ID NO4的第30至967位氨基酸有至少80%同一性的氨基酸序列。
4.權(quán)利要求3的多肽,具有與SEQ ID NO2的第15至881位氨基酸或SEQ ID NO4的第30至967位氨基酸有至少85%同一性的氨基酸序列。
5.權(quán)利要求4的多肽,具有與SEQ ID NO2的第15至881位氨基酸或SEQ ID NO4的第30至967位氨基酸有至少90%同一性的氨基酸序列。
6.權(quán)利要求5的多肽,具有與SEQ ID NO2的第15至881位氨基酸或SEQ ID NO4的第30至967位氨基酸有至少95%同一性的氨基酸序列。
7.權(quán)利要求6的多肽,具有與SEQ ID NO2的第15至881位氨基酸或SEQ ID NO4的第30至967位氨基酸有至少97%同一性的氨基酸序列。
8.權(quán)利要求3的多肽,具有與SEQ ID NO6的第20至988位氨基酸有至少85%同一性的氨基酸序列。
9.權(quán)利要求4的多肽,具有與SEQ ID NO6的第20至988位氨基酸有至少90%同一性的氨基酸序列。
10.權(quán)利要求5的多肽,具有與SEQ ID NO6的第20至988位氨基酸有至少95%同一性的氨基酸序列。
11.權(quán)利要求6的多肽,具有與SEQ ID NO6的第20至988位氨基酸有至少97%同一性的氨基酸序列。
12.權(quán)利要求1-11中任何一項(xiàng)的多肽,包括SEQ ID NO2、SEQ IDNO4、或SEQ ID NO6的氨基酸序列。
13.權(quán)利要求1-12中任何一項(xiàng)的多肽,其由SEQ ID NO2、SEQ IDNO4、或SEQ ID NO6;或其具有α-葡糖苷酶活性的片段組成。
14.權(quán)利要求13的多肽,其由SEQ ID NO2、SEQ ID NO4、或SEQ IDNO6組成。
15.權(quán)利要求14的多肽,其由SEQ ID NO2的第15至881位氨基酸、SEQ ID NO4的第30至967位氨基酸、或SEQ ID NO6的第20至988位氨基酸組成。
16.權(quán)利要求1的多肽,其由在中等嚴(yán)謹(jǐn)條件下與(i)SEQ ID NO1的第43至2643位核苷酸或SEQ ID NO3的第146至3013位核苷酸,(ii)包含在SEQ ID NO1的第43至2643位核苷酸或SEQ ID NO3的第146至3013位核苷酸中的cDNA序列,或(iii)(i)或(ii)的互補(bǔ)鏈雜交的多核苷酸編碼。
17.權(quán)利要求1的多肽,其由在中等-高嚴(yán)謹(jǐn)條件下與(i)SEQ ID NO1的第43至2643位核苷酸或SEQ ID NO3的第146至3013位核苷酸,(ii)包含在SEQ ID NO1的第43至2643位核苷酸或SEQ ID NO3的第146至3013位核苷酸中的cDNA序列,或(iii)(i)或(ii)的互補(bǔ)鏈雜交的多核苷酸編碼。
18.權(quán)利要求1的多肽,其由在高嚴(yán)謹(jǐn)條件下與(i)SEQ ID NO1的第43至2643位核苷酸、SEQ ID NO3的第146至3013位核苷酸,或SEQ ID NO5的第58至3164位核苷酸,(ii)包含在SEQ ID NO1的第43至2643位核苷酸、SEQ ID NO3的第146至3013位核苷酸、或SEQ ID NO5的第58至3164位核苷酸中的cDNA序列,或(iii)(i)或(ii)的互補(bǔ)鏈雜交的多核苷酸編碼。
19.權(quán)利要求1的多肽,其中該多肽是包括SEQ ID NO2的第15至881位氨基酸、SEQ ID NO4的第30至967位氨基酸、或SEQ ID NO6的第20至988位氨基酸的一個(gè)或多個(gè)氨基酸的保守取代、缺失、和/或插入的變體。
20.權(quán)利要求1的多肽,其由包含在包含于大腸桿菌NRRL B-30751中的質(zhì)粒pSMO216、包含于大腸桿菌NRRL B-30750中的質(zhì)粒pHyGe011、或包含于大腸桿菌NRRL B-30856中的質(zhì)粒pJSF9b中的多核苷酸編碼。
21.包括編碼權(quán)利要求1-20中任何一項(xiàng)多肽的核苷酸序列的分離多核苷酸。
22.權(quán)利要求21或22的分離多核苷酸,其在SEQ ID NO1、SEQ IDNO3、或SEQ ID NO5的成熟多肽編碼序列中具有至少一個(gè)突變,其中該突變的核苷酸序列編碼分別由SEQ ID NO2的第15至881位氨基酸、SEQ IDNO4的第30至967位氨基酸、或SEQ ID NO6的第20至988位氨基酸組成的多肽。
23.包括與指導(dǎo)多肽在表達(dá)宿主中生產(chǎn)的一個(gè)或多個(gè)調(diào)控序列可操作連接的權(quán)利要求21或22的多核苷酸的核酸構(gòu)建體。
24.包括權(quán)利要求23的核酸構(gòu)建體的重組表達(dá)載體。
25.包括權(quán)利要求23的核酸構(gòu)建體的重組宿主細(xì)胞。
26.生產(chǎn)權(quán)利要求1-20中任何一項(xiàng)多肽的方法,包括(a)在有助于生產(chǎn)該多肽的條件下培養(yǎng)在其野生型形態(tài)時(shí)能夠生產(chǎn)多肽的細(xì)胞;以及(b)回收該多肽。
27.生產(chǎn)權(quán)利要求1-20中任何一項(xiàng)多肽的方法,包括(a)在有助于生產(chǎn)該多肽的條件下培養(yǎng)包括含有編碼該多肽的核苷酸序列的核酸構(gòu)建體的宿主細(xì)胞;以及(b)回收該多肽。
28.生產(chǎn)親本細(xì)胞突變體的方法,其包括使編碼權(quán)利要求1-20中任何一項(xiàng)多肽的核苷酸序列破壞或缺失,這導(dǎo)致該突變體比所述親本細(xì)胞產(chǎn)生較少的該多肽。
29.通過權(quán)利要求28的方法生產(chǎn)的突變體細(xì)胞。
30.權(quán)利要求29的突變體細(xì)胞,其進(jìn)一步包括編碼天然或異源蛋白質(zhì)的基因。
31.生產(chǎn)蛋白質(zhì)的方法,包括(a)在有助于生產(chǎn)該蛋白質(zhì)的條件下培養(yǎng)權(quán)利要求30的突變體細(xì)胞;以及(b)回收該蛋白質(zhì)。
32.通過(a)使DNA群在中等嚴(yán)謹(jǐn)條件下與(i)SEQ ID NO1的第43至2643位核苷酸或SEQ ID NO3的第146至3013位核苷酸,(ii)包含在SEQID NO1的第43至2643位核苷酸或SEQ ID NO3的第146至3013位核苷酸中的cDNA序列,或(iii)(i)或(ii)的互補(bǔ)鏈雜交;以及(b)分離編碼具有α-葡糖苷酶活性的多肽的該雜交多核苷酸來(lái)獲得的分離多核苷酸。
33.權(quán)利要求32的分離多核苷酸,其通過(a)使DNA群在中等-高嚴(yán)謹(jǐn)條件下與(i)SEQ ID NO1的第43至2643位核苷酸或SEQ ID NO3的第146至3013位核苷酸,(ii)包含在SEQ ID NO1的第43至2643位核苷酸或SEQ IDNO3的第146至3013核苷酸中的cDNA序列,或(iii)(i)或(ii)的互補(bǔ)鏈雜交;以及(b)分離編碼具有α-葡糖苷酶活性的多肽的該雜交多核苷酸來(lái)獲得。
34.權(quán)利要求33的分離多核苷酸,其通過(a)使DNA群在高嚴(yán)謹(jǐn)條件下與(i)SEQ ID NO1的第43至2643位核苷酸或SEQ ID NO3的第146至3013位核苷酸,(ii)包含在SEQ ID NO1的第43至2643位核苷酸或SEQ IDNO3的第146至3013核苷酸中的cDNA序列,或(iii)(i)或(ii)的互補(bǔ)鏈雜交;以及(b)分離編碼具有α-葡糖苷酶活性的多肽的該雜交多核苷酸來(lái)獲得。
35.通過(a)使DNA群在高嚴(yán)謹(jǐn)條件下與(i)SEQ ID NO5的第58至3164位核苷酸,(ii)包含在SEQ ID NO5的第58至3164位核苷酸中的cDNA序列,或(iii)(i)或(ii)的互補(bǔ)鏈雜交;以及(b)分離編碼具有α-葡糖苷酶活性的多肽的該雜交多核苷酸來(lái)獲得的分離多核苷酸。
36.生產(chǎn)具有突變核苷酸序列的多核苷酸的方法,包括(a)將至少一個(gè)突變導(dǎo)入SEQ ID NO1、SEQ ID NO3、或SEQ ID NO5的成熟多肽編碼序列,其中該突變的核苷酸序列編碼由SEQ ID NO2的第15至881位氨基酸、SEQ ID NO4的第30至967位氨基酸、或SEQ ID NO6的第20至988位氨基酸組成的多肽;以及(b)回收包括該突變核苷酸序列的多核苷酸。
37.通過權(quán)利要求36的方法產(chǎn)生的突變多核苷酸。
38.生產(chǎn)多肽的方法,包括(a)在有助于生產(chǎn)該多肽的條件下培養(yǎng)包括編碼該多肽的權(quán)利要求37的突變多核苷酸的細(xì)胞;以及(b)回收該多肽。
39.包括編碼蛋白質(zhì)的基因的核酸構(gòu)建體,所述基因與編碼由SEQ IDNO1的第1至42位核苷酸、SEQ ID NO3的第1至145位核苷酸、或SEQ IDNO5的第1至57位核苷酸組成的信號(hào)肽的核苷酸序列可操作連接,其中該基因?qū)τ谠摵塑账嵝蛄惺峭庠吹摹?br>
40.包括權(quán)利要求39的核酸構(gòu)建體的重組表達(dá)載體。
41.包括權(quán)利要求39的核酸構(gòu)建體的重組宿主細(xì)胞。
42.生產(chǎn)蛋白質(zhì)的方法,包括(a)在有助于生產(chǎn)該蛋白的條件下培養(yǎng)權(quán)利要求41的重組宿主細(xì)胞;以及(b)回收該蛋白。
43.生產(chǎn)權(quán)利要求1-20中任何一項(xiàng)多肽的方法,包括(a)在有助于生產(chǎn)該多肽的條件下培養(yǎng)包括多核苷酸的轉(zhuǎn)基因植物或植物細(xì)胞,所述多核苷酸編碼具有本發(fā)明的α-葡糖苷酶活性多肽;以及(b)回收該多肽。
44.轉(zhuǎn)基因的植物、植物部分或植物細(xì)胞,其已經(jīng)用編碼權(quán)利要求1-20中任何一項(xiàng)多肽的多核苷酸轉(zhuǎn)化。
45.生產(chǎn)發(fā)酵的麥芽飲料的方法,其中在麥芽汁生產(chǎn)過程中的麥芽汁熱處理之前,添加權(quán)利要求1-20中任一項(xiàng)具有α-葡糖苷酶活性的多肽來(lái)用于制造發(fā)酵的麥芽飲料。
46.用于生產(chǎn)啤酒的方法,其中權(quán)利要求1-20中任一項(xiàng)具有α-葡糖苷酶活性的多肽在啤酒釀造中被添加入發(fā)酵過程。
全文摘要
本發(fā)明涉及具有α-葡糖苷酶活性的分離多肽和編碼該多肽的分離多核苷酸。本發(fā)明也涉及包括該多核苷酸的核酸構(gòu)建體、載體、和宿主細(xì)胞,以及生產(chǎn)和使用該多肽的方法。
文檔編號(hào)C12N15/00GK101031643SQ200580029141
公開日2007年9月5日 申請(qǐng)日期2005年6月29日 優(yōu)先權(quán)日2004年6月29日
發(fā)明者蘇珊娜·奧塔尼, 戈海燕, 保羅·哈里斯, 戴比·亞弗, 亞歷山大·布林科夫斯基 申請(qǐng)人:諾維信股份有限公司