專利名稱:用于生成氮雜環(huán)丁酮的還原酶多肽的制作方法
用于生成氮雜環(huán)丁酮的還原酶多肽相關申請的交叉引用本申請根據(jù)35U.S.C. § 119(e)要求于2007年10月1日提交的申請序列第 60/976,555號的利益,該申請的內(nèi)容以引用方式并入本文。序列表、表格或計算機程序的引用以文件名376247-022. txt通過EFS-Web以計算機可讀形式(CRF)根據(jù)37C. F.R. §1.821隨本申請同時提交的序列表以引用方式整體并入本文。序列表的電子備份于 2008年10月1日生成,文件大小為150千字節(jié)。背景屬于酮還原酶(KRED)或羰基還原酶類(EC 1. 1. 1. 184)的酶對于從相應的前體立 體異構(gòu)酮底物或相應的外消旋的醛底物中合成旋光的醇有用。典型的,KRED將酮和醛底物 轉(zhuǎn)化為相應的醇產(chǎn)物,但是也可催化逆反應,將醇底物氧化為相應的酮/醛產(chǎn)物。用如KRED 的酶對酮和醛的還原以及醇的氧化需要輔因子,最常見的為還原的煙酰胺腺嘌呤二核苷酸 (NADH)或還原的煙酰胺腺嘌呤二核苷酸磷酸(NADPH),以及用于氧化反應的煙酰胺腺嘌呤 二核苷酸(NAD)或煙酰胺腺嘌呤二核苷酸磷酸(NADP)。NADH和NADPH作為電子供體,而 NAD和NADP作為電子受體。經(jīng)常觀察到酮還原酶和醇脫氫酶接受磷酸化的或非磷酸化的輔 因子(以其氧化的或還原的狀態(tài))。KRED酶可在廣泛范圍內(nèi)的細菌和酵母中發(fā)現(xiàn)(綜述參見Kraus和Waldman, Enzyme catalysis in organic synthesis (有機合成中的酶催化)第 1&2 卷,VCH Weinheim 1995 ;Faber, K. , Biotransformations in organicchemistry (有機化學中 的生物轉(zhuǎn)化),第 4 版,Springer, Berlin HeidelbergNew York. 2000 ;Hummel 和 Kula, 1989,Eur. J. Biochem. 184 :1_13)。報道了一些KRED基因和酶序列,例如,木蘭假絲 酵母(Candida magnoliae) (Genbank 登錄號 JC7338 ;GI 11360538)、近平滑假絲酵 母(Candidaparapsilosis) (Genbank 登錄號 BAA24528. 1 ;GI :2815409)、赭色擲孢酵母 (Sporobolomyces salmonicolor) (Genbank 登錄號 AF160799 ;GL6539734)。為了回避生成關鍵化合物的許多化學合成的步驟,酮還原酶增加地應用于不同 酮和醛底物至手性醇產(chǎn)物的酶促轉(zhuǎn)化。這些應用可將表達酮還原酶的完整細胞應用于生 物催化的酮還原,或者在完整細胞中多種酮還原酶的存在不利地影響所需產(chǎn)物的立體純 度和產(chǎn)量的情況下,采用純化的酶。對于體外應用,將諸如葡萄糖脫氫酶(GDH)、甲酸脫 氫酶等的輔因子(NADH或NADPH)再生酶與酮還原酶聯(lián)合使用。使用酮還原酶產(chǎn)生有用 的化合物的例子包括4-氯乙酰乙酸酯類的不對稱還原(Zhou,J. Am. Chem. Soc. 1983105 5925-5926 ;Santaniello, J. Chem. Res. (S) 1984 :132_133 ;美國專利第 5,559,03 號;美 國專利第5,700,670號和美國專利第5,891,685號)、二氧羧酸類的還原(例如,美國 專利第6,399,339號)、(S)氯_5_羥基-3-氧己酸叔丁酯的還原(例如,美國專利第 6,645,746號和WO 01/40450)、基于吡咯并三嗪的化合物的還原(例如,美國專利申請第 2006/0286646號)、取代的苯乙酮的還原(例如,美國專利第6,800, 477號);和四氫噻吩 酮(ketothiolane)的還原(W0 2005/054491)。
鑒別其它可用于將不同的酮底物轉(zhuǎn)化至相應的手性醇化合物的酮還原酶是需要 的。概述本公開提供具有還原2-苯甲酰氨基甲基-3-氧丁酸甲酯的外消旋混合物(“底 物")至2S,3R-2-苯甲酰氨基甲基-3-羥基丁酸甲酯(“產(chǎn)物")的能力的酮還原酶多 肽、編碼該多肽的多核苷酸和該多肽的使用方法?;衔?S,3R-2-苯甲酰氨基甲基-3-羥 基丁酸甲酯為合成(2R,3R)-3-((R)-l-(叔丁基二甲基甲硅烷氧基)乙基)-4_氧氮雜 環(huán)丁-2-基乙酸酯(〃氮雜環(huán)丁酮(azetidinone);乙?;醯s環(huán)丁酮";CAS登記號 76855-69-1)的中間體,其為用于生產(chǎn)不同的碳雜青霉烯類抗生素的中間體(倒數(shù)第二個 中間體)??蓮?S,3R-2-苯甲酰氨基甲基-3-羥基丁酸甲酯合成的碳雜青霉烯類抗生素包 括但不局限于亞胺培南、美洛培南、多利培南、厄他培南、比阿培南、帕尼培南和與沙納霉素 類似的其它化合物。與自然存在的從克菲爾乳桿菌(Lactobacillus kefir, “ L. kefir"; SEQ ID NO :4)、短乳桿菌(Lactobacillusbrevis,“ L. brevis" ;SEQ ID NO :2)或小乳 桿菌(Lactobacillus minor, “ L. minor" ;SEQ ID NO 86)中得到的野生型酮還原酶相 比,本公開的工程酮還原酶多肽在還原或轉(zhuǎn)化特定的底物至相應的手性醇產(chǎn)物上具有改善 的性質(zhì)。在一些實施方式中,工程酮還原酶多肽與諸如SEQ ID NO :48的另外的工程酮還原 酶多肽相比具有改善的性質(zhì)。在一些實施方式中,與序列為SEQ ID NO :4、2和86的野生型克菲爾乳桿菌KRED、 短乳桿菌KRED或小乳桿菌KRED相對比,所述酮還原酶多肽至少具有以下特征殘基202為 纈氨酸或亮氨酸。在一些實施方式中,與序列SEQ ID NO :4、2或86相對比,本公開的酮還 原酶具有以下特征中的至少兩個(1)對應于94位(也就是X94)的殘基為脂肪族或極性殘 基,(2)對應于199位(也就是X199)的殘基為脂肪族,極性或受限殘基,和(3)對應于202 位(也就是X202)的殘基為纈氨酸或亮氨酸。在一些實施方式中,與序列SEQ ID NO :4、2 或86相對比,所述多肽具有至少以下特征(1)對應于X94位的殘基為極性殘基,(2)對應 于X199位的殘基為脂肪族、受限或極性殘基,和(3)對應于X202位的殘基為纈氨酸或亮氨 酸。除以上所述特征外,所述酮還原酶與序列SEQ ID NO :2、4或86相比可在其它殘 基位置處含有一個或多個殘基差異。在一些實施方式中,本文所述的酮還原酶多肽包含與 基于SEQ ID而2、4或86的參考序列相比具有至少約85%、86%、87%、88%、89%、90%、 91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性的氨基酸序列,所述參 考序列具有以下特征對應于X94的殘基為脂肪族或極性殘基,尤其是丙氨酸或蘇氨酸;對 應于X199的殘基為脂肪族、受限或極性殘基,尤其是丙氨酸、組氨酸或天冬酰胺;并且對應 于X202的殘基為纈氨酸或亮氨酸;條件是所述酮還原酶的氨基酸序列具有至少前面的特 征,也就是說,對應于X94的殘基為脂肪族或極性殘基;對應于X199的殘基為脂肪族、受限 或極性殘基;并且對應于X202的殘基為纈氨酸或亮氨酸。在一些實施方式中,例如當改善的性質(zhì)來自單個殘基差異或特定的殘基差異的組 合時,與參考序列相比,所述工程酮還原酶可任選地包括在多肽其它位置處的一個或多個 殘基差異。在一些實施方式中,殘基差異包含保守突變。在一些實施方式中,可引入在其它 殘基位置處的另外的殘基差異以產(chǎn)生在酶性質(zhì)上的進一步的改善。這些改善可進一步提高對于確定的底物的酶促活性,但也可包括在立體選擇性、熱穩(wěn)定性、溶劑穩(wěn)定性上的提高和 /或降低的產(chǎn)物抑制。詳述中提供了可產(chǎn)生一種或多種改善的酶性質(zhì)的不同的殘基差異。 在一些實施方式中,改善的酮還原酶多肽包含對應于列于SEQ ID N0:83、SEQ ID NO :84或 SEQ ID NO :87的序列式(或其區(qū)域,例如殘基90-211)的氨基酸序列。SEQ ID NO :84為 基于野生型克菲爾乳桿菌酮還原酶(SEQ ID NO 4)的氨基酸序列;SEQ ID N0:83為基于野 生型短乳桿菌酮還原酶(SEQ ID NO 2)的氨基酸序列;以及SEQ ID NO :87為基于野生型 小乳桿菌酮還原酶(SEQ ID NO 86)的氨基酸序列。SEQ IDNO :83、84和87的序列式詳細 說明對應于X94的殘基為脂肪族或極性殘基;對應于X199的殘基為脂肪族、受限或極性殘 基;并且對應于X202的殘基為纈氨酸或亮氨酸。如在詳述中提供的,所述序列式進一步詳 細說明在其它殘基位置的特征。在一些實施方式中,所述工程酮還原酶多肽可具有與野生型酮還原酶相比提高的 將底物還原至產(chǎn)物的酶促活性。酶促活性的改善可通過采用標準的酶測定法比較所述酮還 原酶與野生型酮還原酶的比活而測定。改善的量可在相應的野生型或參考酮還原酶的酶促 活性的1.5倍(times)(或倍(fold))至多達2倍、5倍、10倍、20倍、25倍、50倍、75倍、100 倍或更高的范圍內(nèi)。在特定的實施方式中,工程酮還原酶顯示比野生型或參考酮還原酶的 酶促活性至少高1. 5倍、2倍、3倍、4倍、5倍、10倍、25倍、50倍、100倍、500倍或1000倍的 改善的酶促活性。酶促活性的改善也包括在立體選擇性、立體專一性、熱穩(wěn)定性、溶劑穩(wěn)定 性上的提高或降低的產(chǎn)物抑制。在一些實施方式中,本發(fā)明的酮還原酶多肽與SEQ ID NO :4、SEQ IDNO 48和/或 SEQ ID NO :66相比,在酶促活性速率上,也就是其將底物轉(zhuǎn)化為產(chǎn)物的速率上有改善。在 一些實施方式中,所述酮還原酶多肽能夠以比SEQ ID NO :4或SEQ ID N0:90的速率高至少 5倍、10倍、25倍、50倍、75倍、100倍、150倍、200倍、250倍、300倍、500倍或1000倍的速 率將底物轉(zhuǎn)化為產(chǎn)物。在一些實施方式中,所述酮還原酶多肽能夠以至少約85 %的立體異構(gòu)體過量百分 比或比野生型克菲爾乳桿菌KRED(SEQ ID NO 4)高的立體異構(gòu)體過量百分比,將底物2-苯 甲酰氨基甲基-3-氧丁酸甲酯轉(zhuǎn)化為產(chǎn)物2S,3R-2-苯甲酰氨基甲基-3-羥基丁酸甲酯。 具有此性質(zhì)的示例性的多肽包括但不局限于包含相應于SEQ ID NO :6、8、10、12、14、16、18、 20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60 和 62 的氨基酸序 列的多肽。在一些實施方式中,所述酮還原酶多肽能夠以至少約60-89%的立體異構(gòu)體過量 百分比以及以比具有SEQ ID NO :48的氨基酸序列的多肽可達到的速率高至少約1-15倍 的速率,將底物2-苯甲酰氨基甲基-3-氧丁酸甲酯轉(zhuǎn)化為產(chǎn)物2S,3R-2-苯甲酰氨基甲 基-3-羥基丁酸甲酯。具有此性質(zhì)的示例性的多肽包括但不局限于包含相應于SEQ ID NO 6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、46、50、52、54、56、58、60 和 62的氨基酸序列的多肽。因為具有SEQ ID NO :48的氨基酸序列的參考多肽能夠以一定速 率(例如,在50% IPA,pH 8中,用約10g/L KRED在20小時內(nèi)將lg/L底物100%轉(zhuǎn)化)和 相比于野生型(SEQID NO 4)的改善的立體選擇性將底物轉(zhuǎn)化為產(chǎn)物,與SEQ ID NO :48相 比改善的本文所述的多肽與野生型相比也有改善。在一些實施方式中,所述酮還原酶多肽能夠以至少約90-94%的立體異構(gòu)體過量百分比,將底物2-苯甲酰氨基甲基-3-氧丁酸甲酯轉(zhuǎn)化為產(chǎn)物2S,3R-2_苯甲酰氨基甲 基-3-羥基丁酸甲酯。具有此性質(zhì)的示例性的多肽包括但不局限于包含相應于SEQ ID NO 6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、40、42、50、52、56、58、60 和 62 的氨基
酸序列的多肽。在一些實施方式中,所述酮還原酶多肽能夠以至少約95-99%的立體異構(gòu)體過量 百分比,將底物2-苯甲酰氨基甲基-3-氧丁酸甲酯轉(zhuǎn)化為產(chǎn)物2S,3R-2-苯甲酰氨基甲 基-3-羥基丁酸甲酯。具有此性質(zhì)的示例性的多肽包括但不局限于包含相應于SEQ ID NO 6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、42、50、52、56、58、60 和 62 的氨基酸序列 的多肽。在一些實施方式中,所述酮還原酶多肽能夠以至少約99%的立體異構(gòu)體過量百分 比,將底物2-苯甲酰氨基甲基-3-氧丁酸甲酯轉(zhuǎn)化為產(chǎn)物2S,3R-2-苯甲酰氨基甲基-3-羥 基丁酸甲酯。具有此性質(zhì)的示例性的多肽包括但不局限于包含相應于SEQ ID N0:6、8、10、 12、14、20、22、24、30、32、34、60和62的氨基酸序列的多肽。在一些實施方式中,所述酮還原酶多肽能夠以比具有SEQ ID N0:48的氨基酸序列 的多肽可達到的速率高至少約15-30倍的速率,將底物2-苯甲酰氨基甲基-3-氧丁酸甲酯 轉(zhuǎn)化為產(chǎn)物2S,3R-2-苯甲酰氨基甲基-3-羥基丁酸甲酯。具有此性質(zhì)的示例性的多肽包 括但不局限于包含相應于 SEQ IDNO :6、8、10、12、14、20、22、24、26、28、30、32、34、50、60 和 62的氨基酸序列的多肽。在一些實施方式中,所述酮還原酶多肽能夠以比具有SEQ ID NO :48的氨基酸序列 的多肽可達到的速率高至少約30-40倍的速率,將底物2-苯甲酰氨基甲基-3-氧丁酸甲酯 轉(zhuǎn)化為產(chǎn)物2S,3R-2-苯甲酰氨基甲基-3-羥基丁酸甲酯。具有此性質(zhì)的示例性的多肽包 括但不局限于包含相應于SEQ IDNO :6、8、10、12、14、20、22、24、26、30、34、60和62的氨基酸 序列的多肽。在一些實施方式中,所述酮還原酶多肽能夠以比具有SEQ ID N0:48的氨基酸序列 的多肽可達到的速率高至少約40-50倍的速率,將底物2-苯甲酰氨基甲基-3-氧丁酸甲酯 轉(zhuǎn)化為產(chǎn)物2S,3R-2-苯甲酰氨基甲基-3-羥基丁酸甲酯。具有此性質(zhì)的示例性的多肽包 括但不局限于包含相應于SEQ IDNO :6、8、10、12、14、22和60的氨基酸序列的多肽。在一些實施方式中,所述酮還原酶多肽能夠以比具有SEQ ID N0:48的氨基酸序列 的多肽可達到的速率高至少約50倍的速率,將底物2-苯甲酰氨基甲基-3-氧丁酸甲酯轉(zhuǎn) 化為產(chǎn)物2S,3R-2-苯甲酰氨基甲基-3-羥基丁酸甲酯。具有此性質(zhì)的示例性的多肽包括 但不局限于包含相應于SEQ IDNO :6、8、10和12的氨基酸序列的多肽。在一些實施方式中,所述酮還原酶多肽能夠以比具有SEQ ID N0:48的氨基酸序列 的多肽可達到的速率高至少約50倍的速率以及至少99%的立體異構(gòu)體過量,將底物2-苯 甲酰氨基甲基-3-氧丁酸甲酯轉(zhuǎn)化為產(chǎn)物2S,3R-2-苯甲酰氨基甲基-3-羥基丁酸甲酯。具 有所述性質(zhì)的示例性的多肽包括但不局限于包含相應于SEQ ID N0:6、8、10和12的氨基酸 序列的多肽。在一些實施方式中,本發(fā)明提供能夠在40°C熱處理21小時后保持其將底物2-苯 甲酰氨基甲基-3-氧丁酸甲酯轉(zhuǎn)化為產(chǎn)物2S,3R-2-苯甲酰氨基甲基-3-羥基丁酸甲酯的 能力的酮還原酶多肽。具有此性質(zhì)的示例性的多肽包括但不局限于包含相應于SEQ ID NO6、10和44的氨基酸序列的多肽。在另一方面,本公開進一步提供可將底物2-苯甲酰氨基甲基-3-氧丁酸甲酯轉(zhuǎn) 化為產(chǎn)物2R,3R-2-苯甲酰氨基甲基-3-羥基丁酸甲酯的酮還原酶多肽。在一些實施方 式中,這些酮還原酶能夠以至少約85%的立體異構(gòu)體過量百分比將底物2-苯甲酰氨基甲 基-3-氧丁酸甲酯轉(zhuǎn)化為產(chǎn)物2R,3R-2-苯甲酰氨基甲基-3-羥基丁酸甲酯。示例性的多 肽包括但不局限于包含相應于SEQ ID N0:68、72、74、76、78和82的氨基酸序列的多肽。在一些實施方式中,2R,3R選擇性酮還原酶多肽能夠以比具有SEQ IDNO :66的氨 基酸序列的多肽可達到的速率高至少約1倍的速率,將底物2-苯甲酰氨基甲基-3-氧丁酸 甲酯轉(zhuǎn)化為產(chǎn)物2R,3R-2-苯甲酰氨基甲基-3-羥基丁酸甲酯。具有此性質(zhì)的示例性的多 肽包括但不局限于包含相應于SEQID NO 64、68、70、72、74、76、78、80和82的氨基酸序列的 多肽。因為具有SEQ ID NO :66的氨基酸序列的多肽能夠以一定的立體異構(gòu)體過量百分比 和高于野生型克菲爾乳桿菌KRED (SEQ ID NO 4)的速率將底物2-苯甲酰氨基甲基-3-氧 丁酸甲酯轉(zhuǎn)化為產(chǎn)物2R,3R-2-苯甲酰氨基甲基-3-羥基丁酸甲酯,與SEQ ID N0:66相比 有改善的任何多肽也相對于野生型克菲爾乳桿菌KRED有改善。在一些實施方式中,所述2R,2R選擇性酮還原酶多肽能夠以比具有SEQ ID NO: 66的氨基酸序列的多肽可達到的速率高至少約1-2倍的速率,將底物2-苯甲酰氨基甲 基-3-氧丁酸甲酯,轉(zhuǎn)化為產(chǎn)物,2R,3R-2-苯甲酰氨基甲基-3-羥基丁酸甲酯。具有此性質(zhì) 的示例性的多肽包括但不局限于包含相應于SEQ ID NO :64、68、70、72、74、76、78和80的氨 基酸序列的多肽。在一些實施方式中,所述2R,2R選擇性酮還原酶多肽能夠以比具有SEQ ID NO 66 的氨基酸序列的多肽可達到的速率高至少約5倍的速率,將底物2-苯甲酰氨基甲基-3-氧 丁酸甲酯轉(zhuǎn)化為產(chǎn)物2R,3R-2-苯甲酰氨基甲基-3-羥基丁酸甲酯。具有此性質(zhì)的示例性的 多肽包括但不局限于包含相應于SEQ ID NO :64、70、72、76、78和80的氨基酸序列的多肽。在一些實施方式中,所述2R,2R選擇性酮還原酶多肽能夠以高于具有SEQ ID NO 66的氨基酸序列的多肽可達到的速率高至少約5倍的速率以及至少85%的立體異構(gòu)體過 量,將底物2-苯甲酰氨基甲基-3-氧丁酸甲酯轉(zhuǎn)化為產(chǎn)物2R,3R-2-苯甲酰氨基甲基-3-羥 基丁酸甲酯。具有此性質(zhì)的示例性的多肽包括但不局限于包含相應于SEQ ID N0:72和78 的氨基酸序列的多肽。另一方面,本公開提供編碼本文所述的工程酮還原酶的多核苷酸或在高度嚴格條 件下與此多核苷酸雜交的多核苷酸。所述多核苷酸可包括可用于編碼的工程酮還原酶表達 的啟動子或其它調(diào)節(jié)元件,并且可應用為特定需要的表達系統(tǒng)而優(yōu)化的密碼子。示例性的 多核苷酸包括但不局限于 SEQID NO :5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、 37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79 和 81。示例性 的多核苷酸也包括編碼相應于SEQ ID NO :83、84和87的序列式的多肽的多核苷酸。在另一方面,本公開提供包含本文所述的多核苷酸和/或表達載體的宿主細胞。 宿主細胞可為克菲爾乳桿菌或短乳桿菌或小乳桿菌,或者它們可為不同的生物體。所述宿 主細胞可用于本文所述的工程酮還原酶的表達和分離,或者可選擇地,它們可直接用于底 物至立體異構(gòu)產(chǎn)物的轉(zhuǎn)化。無論用完整細胞、細胞提取物還是純化的酮還原酶進行所述方法,可使用單一的酮還原酶,或者可選擇地,可使用兩種或更多種酮還原酶的混合物。如上所示,在一些實施方式中,本文所述的酮還原酶能夠催化具結(jié)構(gòu)式(I)的化 合物2-苯甲酰氨基甲基-3-氧丁酸甲酯(“底物”)中的酮基 至相應的具結(jié)構(gòu)式(II)的立體異構(gòu)醇產(chǎn)物2S,3R-2_苯甲酰氨基甲基-3-羥基丁
(“產(chǎn)物”)的還原反應
酸甲酯
在一些實施方式中,本文所述的酮還原酶能夠催化具結(jié)構(gòu)式(I)的化合物中的酮 基至相應的具結(jié)構(gòu)式(III)的立體異構(gòu)醇產(chǎn)物2R,3R-2-苯甲酰氨基甲基-3-羥基丁酸甲 酯(也可稱為”產(chǎn)物”)的還原反應 相應地,在一些實施方式中,本文提供的是還原具結(jié)構(gòu)式(I)的底物至具結(jié)構(gòu)式 (II)或結(jié)構(gòu)式(III)的醇產(chǎn)物的方法,所述方法包括在適合于還原或轉(zhuǎn)化底物至具結(jié)構(gòu)式 (II)或結(jié)構(gòu)式(III)的產(chǎn)物的反應條件下,將底物與本公開的酮還原酶多肽接觸或孵育。在一些實施方式中,具結(jié)構(gòu)式(II)的產(chǎn)物2S,3R-2_苯甲酰氨基甲基-3-羥基丁 酸甲酯可用于合成中間體或碳雜青霉烯類化合物,如方案3所示 方案3。相應地,在一些實施方式中,本公開的酮還原酶可用于合成具結(jié)構(gòu)式(IVa)的中 間體的方法, 其中R1為H或羥基保護基團,并且Rltl為鹵素(如,Cl)或-OAc (Ac為乙酸 (acetate))。相應地,在合成具結(jié)構(gòu)式(IVa)的中間體的方法中,方法中的步驟包括在適合 于還原或轉(zhuǎn)化底物至具式(II)的產(chǎn)物的反應條件下,將具式(I)的底物與本公開的酮還原 酶接觸或反應。在一些實施方式中,本公開的酮還原酶可用于具結(jié)構(gòu)式(VI)的中間體的合成 其中R2為H或C1-C4烴基(alkyl)(如,-CH3) ;R3為H或羥基保護基團;R4為H、羧 基保護基團、氨基(ammonia group)、堿金屬或堿土金屬;并且X為OH或離去基團。示例性 的離去基團包括但不局限于-OP(O) (OR')或0S(02)R〃,其中R'和R"可為C1-C6烴基、 C1-C6烷芳基、芳香基、全氟代C1-C6烴基。相應地,在一些實施方式中,在合成具式(VI)的 中間體的方法中,方法中的步驟包括在適合于還原或轉(zhuǎn)化底物至具式(II)的產(chǎn)物的反應 條件下,將具式(I)的底物與本公開的酮還原酶接觸或反應。在一些實施方式中,本公開的酮還原酶可用于合成具結(jié)構(gòu)式(V)的基于碳雜青霉 烯的治療化合物或其溶劑化物、水合物、鹽和前藥的過程 其中R2為H或-CH3 ;R5可為不同的取代基,取代基包括但不局限于,取代或未取代 的烴基、取代或未取代的芳香基、取代或未取代的雜烴基(heteroalkyl)、取代或未取代的 雜環(huán)烴基以及取代或未取代的雜芳香基烴基;并且R6為H、或諸如可水解的酯基團的前體 基團(progroup)。相應地,在合成具結(jié)構(gòu)式(V)的化合物的方法中,方法中的步驟可包括在 適合于還原或轉(zhuǎn)化底物至具式(II)的產(chǎn)物的反應條件下,將具式(I)的底物與本公開的酮還原酶接觸或反應。具結(jié)構(gòu)式(V)的示例性碳雜青霉烯包括但不局限于亞胺培南、美洛培 南、多利培南、厄他培南、比阿培南和帕尼培南。在一些實施方式中,本公開進一步提供酮還原酶在合成硫培南化合物的方法和用 于硫培南合成的中間體上的應用。附圖簡述
圖1說明酮還原酶(KRED)在將具式(I)的底物化合物轉(zhuǎn)化至相應的具式(II)的 產(chǎn)物中的作用。該還原應用本發(fā)明的KRED和諸如NADPH的輔因子。使用異丙醇(IPA)將 NADP+轉(zhuǎn)化/再循環(huán)至NADPH。詳述1. 1 定義如本文所用,以下術(shù)語意在具有如下含義。“酮還原酶”和"KRED"在本文可互換使用,指具有將羰基還原為其相應的醇的酶 促能力的多肽。更確切地,本發(fā)明的酮還原酶多肽能夠立體選擇性地還原具上述分子式(I) 的化合物至相應的具上述分子式(II)的產(chǎn)物。所述多肽典型地使用輔因子還原的煙酰胺 腺嘌呤二核苷酸(NADH)或還原的煙酰胺腺嘌呤二核苷酸磷酸(NADPH)作為還原劑。如本 文所用的酮還原酶包括自然存在的(野生型)酮還原酶以及通過人工操作產(chǎn)生的非自然存 在的工程多肽?!熬幋a序列"指核酸(例如,基因)中編碼蛋白質(zhì)氨基酸序列的部分?!匀淮嬖诘?或〃野牛型"指在自然中發(fā)現(xiàn)的形式。例如,自然存在的或野生 型多肽或多核苷酸序列為存在于生物體中的序列,該序列可從自然的來源中分離,并且沒 有通過人工操作被特意地修飾。當用于涉及如細胞、核酸或多肽時,“重組"指已經(jīng)以不會存在于自然中的方式 被修飾、或和自然形式相同但是從合成材料和/或通過使用重組技術(shù)操作的方式產(chǎn)生或衍 生的材料,或相應于該材料的自然的或天然形式的材料。非限制性例子包括但不限于,表達 在細胞的天然(非重組的)形式中未發(fā)現(xiàn)的基因或表達以不同的水平另外表達的天然基因 的重組細胞?!蛄型患俜直?和〃同源件百分比"在此可互換使用,指多核苷酸之間和 多肽之間的比較,并且通過在比較窗口中比較兩個最優(yōu)地比對的序列確定,其中比較窗口 中的多核苷酸和多肽的部分可包含相對于參考序列(其不包含添加或缺失)的添加或缺失 (也就是間隔)以最優(yōu)地比對兩個序列。所述百分比可通過確定兩序列中發(fā)生的相同的核 苷酸堿基或氨基酸殘基的位置的數(shù)目以得到匹配位置的數(shù)目,將匹配位置的數(shù)目除以比較 窗口中位置的總數(shù),并且將結(jié)果乘以100以得到序列同一性百分比而計算??蛇x擇地,所述 百分比可通過確定兩序列中發(fā)生的相同的核苷酸堿基或氨基酸殘基或與缺口比對的核苷 酸堿基或氨基酸殘基的位置的數(shù)目以得到匹配位置的數(shù)目,將匹配位置的數(shù)目除以比較窗 口中位置的總數(shù),并且將結(jié)果乘以100以得到序列同一性百分比而計算。本領域中技術(shù)人 員明白有許多可用的已確立的算法來比對兩序列。用于比較的序列的最優(yōu)比對可,比如,通 過 Smith 和 Waterman,1981,Adv. App 1. Math. 2 482 的局部同源性算法、通過 Needleman 和 Wunsch,1970,J. Mol. Biol. 48 443 的同源性比對算法、通過 Pearson 和 Lipman,1988, Proc. Natl. Acad. ScL USA 85 :2444的搜索相似性方法,通過這些算法的計算機化實施(GCGWisconsin軟件包中GAP、BESTFIT、FASTA和TFASTA)或通過目測檢查來進行(通常參見, CurrentProtocols in Molecular Biology (分子生物學最新實驗設計),F(xiàn). Μ. Ausubel 等編 輯,Current Protocols,Greene Publishing Associates,Inc.禾口John Wiley &Sons,Inc. 聯(lián)合出版,(1995增刊)(Ausubel))。適合確定序列同一性和序列相似性百分比的算法的例 子為 BLAST 和 BLAST 2. O 算法,分別闡述于 Altschul 等,1990,J. Mol. Biol. 215 403-410 和 Altschul 等,1977,NucleicAcids Res. 3389-3402。進行 BLAST 分析的軟件在美國國家 (National Center for Biotechnology Information) N^X^^AJf 放。該算法包括首先通過鑒別查詢序列中長度W的短字(short word)來鑒別高得分序列 對(HSP),當與數(shù)據(jù)庫序列中相同長度的字比對時,所述短字匹配或符合一些正值閾值得分 T0 T指鄰近字得分閾值(Altschul等,如上)。這些起始相鄰字匹配字串(word hits)作 為起始搜索的種子以發(fā)現(xiàn)包含它們的更長的HSP。所述字匹配字串繼而沿每個序列的兩個 方向延伸,直至累積比對得分不能被增加。對核苷酸序列,累積得分使用參數(shù)M(匹配的殘 基對的獎勵得分;總是> 0)和N(不匹配的殘基的懲罰得分;總是< 0)計算。對氨基酸序 列,使用得分矩陣計算累積得分。當出現(xiàn)以下情況時,每個方向上的字匹配字串的延伸被終 止累計比對得分從其最大到達值降低量X ;累積得分由于一個或多個負得分殘基比對的 累積而變至零或更低;或者到達任一序列的末端。BLAST算法參數(shù)W、T和X確定比對的敏感 性和速度。BLASTN程序(用于核苷酸序列)使用以下作為缺省值字長(W)為11,期望值 (E)為10,M = 5,N = -4,以及兩個鏈的比較。對于氨基酸序列,BLASTP程序使用以下作為 缺省值字長(W)為3,期望值(E)為10和BL0SUM62得分矩陣(見Henikoff和Henikoff, 1989,Proc NatlAcad Sci USA89 10915)。示例性的序列比對和%序列同一性的確定可應 用GCGWisconsin軟件包(Accelrys,Madison WI)中BESTFIT或GAP程序,使用提供的缺省 參數(shù)?!皡⒖夹蛄?指用于作為序列比較的基礎的確定序列。參考序列可為更長序列的 子集,例如,全長基因或多肽序列的區(qū)段。通常,參考序列為至少20個核苷酸或氨基酸殘基 長度、至少25個殘基長度、至少50個殘基長度或核酸或多肽的全長。因為兩個多核苷酸或 多肽可各自(1)包含兩個序列之間相似的序列(也就是完整序列的一部分),和(2)還可包 含兩個序列之間不同的序列,所以兩個(或更多個)多核苷酸或多肽之間的比較典型地通 過在"比較窗口"中比較兩個多核苷酸的序列以鑒定和比較序列相似性的局部區(qū)域而完 成。在一些實施方式中,“參考序列”可基于一級氨基酸序列,其中參考序列為在一級 序列上有一個或多個改變的序列。例如,“基于SEQ ID NO :4的在相應于X202的殘基具 有亮氨酸或纈氨酸的參考序列"指其中在SEQID N0:4的X202處的相應殘基已變化為亮氨 酸或纈氨酸的參考序列?!氨容^窗口"指至少約20個連續(xù)的核苷酸位置或氨基酸殘基的概念區(qū)段,其中 序列可與至少20個連續(xù)的核苷酸或氨基酸的參考序列相比較,并且其中比較窗口中的序 列部分可包含與參考序列(其不包含添加或缺失)相比百分之二十或更少的添加或缺失 (也就是缺口)以用于兩序列的最優(yōu)比對。比較窗口可長于20個連續(xù)的殘基,并且包括任 選地30、40、50、100或更長的窗口。‘’大體同一性"指與至少20個殘基位置的比較窗口、經(jīng)常在至少30-50個殘基的窗口中與參考序列比較,具有至少80%序列同一性、至少85%序列同一性和89%至95%序 列同一性、更通常地至少99%序列同一性的多核苷酸或多肽序列,其中序列同一性百分比 通過在比較窗口將參考序列與包括參考序列的總計20%或更少的缺失或添加的序列進行 比較而計算。在應用于多肽的特定的實施方式中,術(shù)語"大體同一性"意思是當例如通過 程序GAP或BESTFIT使用缺省的缺口權(quán)重進行最優(yōu)比對時,兩個多肽序列共享至少80%序 列同一性、優(yōu)選地至少89 %序列同一性、至少95 %序列同一性或更高(例如,99 %序列同一 性)。優(yōu)選地,不相同的殘基位置具有保守的氨基酸取代。在用于指定的氨基酸或多核苷酸序列的編號的情況下,“相應干"、“參考干" 或"相對干"指當指定的氨基酸或多核苷酸序列與參考序列相比較時特定的參考序列殘 基的編號。換句話說,指定聚合物的殘基編號或殘基位置為對于參考序列而不是對于指定 氨基酸或多核苷酸序列中殘基的實際的編號位置而指定的。例如,指定的氨基酸序列,如工 程酮還原酶的氨基酸序列,可通過引入缺口以使兩序列之間的殘基匹配最優(yōu)而與參考序列 比對。在這些情況下,盡管存在缺口,指定氨基酸或多核苷酸序列的編號是相對于與之比對 的參考序列而指定的?!傲Ⅲw詵擇件"指在化學或酶促反應中一種立體異構(gòu)體相對于另一種的優(yōu)先形 成。立體選擇性可為部分的,其中一種立體異構(gòu)體相對于另一種為有利的,或者可為完全 的,其中只形成一種立體異構(gòu)體。當立體異構(gòu)體為對映異構(gòu)體時,立體選擇性稱為對映選 擇性,即一種對應異構(gòu)體在兩者總和中的分數(shù)(典型地報道為百分比)。在本領域內(nèi)該分 數(shù)(典型地為百分比)通??蛇x擇地報道為根據(jù)下式從中計算的對映異構(gòu)體過量(e.e.) [主要對映異構(gòu)體_次要對映異構(gòu)體]/ [主要對映異構(gòu)體+次要對映異構(gòu)體]。當立體異 構(gòu)體為非對映異構(gòu)體時,立體選擇性稱為非對映選擇性,即一種非對映異構(gòu)體在兩種非對 映異構(gòu)體混合物中的分數(shù)(典型地報道為百分比),通常可選擇地報道為非對映異構(gòu)體過 量(d.e.)。對映異構(gòu)體過量和非對映異構(gòu)體過量為立體異構(gòu)體過量的類型?!案叨攘Ⅲw選擇性"指能夠以至少約85%立體異構(gòu)體過量將底物轉(zhuǎn)化或還原為 相應的具有化學式(II)或(III)的產(chǎn)物的酮還原酶多肽?!傲Ⅲw專一件"指在化學或酶促反應中一種立體異構(gòu)體相對另一種的優(yōu)先轉(zhuǎn)化。 立體專一性可為部分的,其中一種立體異構(gòu)體的轉(zhuǎn)化相對于另一種為有利的,或者可為完 全的,其中只轉(zhuǎn)化成一種立體異構(gòu)體。“化學詵擇件"指在化學或酶促反應中一種產(chǎn)物相對于另一種的優(yōu)先形成。“改善的酶性質(zhì)"指與參考酮還原酶相比展現(xiàn)出在任何酶性質(zhì)上的改善的酮還 原酶多肽。對于本文所述的工程酮還原酶多肽,比較通常是針對野生型酮還原酶,盡管在一 些實施方式中,參考酮還原酶可為另外的改善的工程酮還原酶。期望改善的酶性質(zhì)包括但 不局限于酶促活性(其可以底物的轉(zhuǎn)化百分比形式表達)、熱穩(wěn)定性、溶劑穩(wěn)定性、PH活性 譜(profile)、輔因子需求、對抑制劑(例如,產(chǎn)物抑制)的不應性、立體專一性和立體選擇 性(包括對映選擇性)?!霸鰪姷拿复倩罴?指工程酮還原酶多肽的改善的性質(zhì),其可用與參考酮還原酶 相比,比活(例如,所產(chǎn)生的產(chǎn)物/時間/蛋白重量)的提高或底物至產(chǎn)物的轉(zhuǎn)化百分率 (例如,使用一定量的KRED,在一定時間段內(nèi)起始量的底物至產(chǎn)物的轉(zhuǎn)化百分比)的提高 來表示。實施例提供示例性的確定酶活性的方法。包括經(jīng)典的酶性質(zhì)Km、Vmax或k。at的關于酶活性的任何性質(zhì)可被影響,其變化可導致增強的酶促活性。酶活性的改善可為從相應 野生型酮還原酶的酶促活性的約1.5倍,至超過自然存在的酮還原酶或酮還原酶多肽衍生 自的另外的工程酮還原酶的酶促活性達2倍、5倍、10倍、20倍、25倍、50倍、75倍、100倍 或更高。在特定的實施方式中,工程酮還原酶表現(xiàn)高于母酮還原酶活性的在1. 5至50倍、 1. 5至100倍范圍內(nèi)的改善的酶促活性。技術(shù)人員理解,任何酶的活性為擴散限制性的,使 得催化轉(zhuǎn)換速率不能超過包括任何需要的輔因子的底物的擴散速率。擴散極限的理論最大 值,或k。at/Km,通常為約IO8至IO9 (M-1S-1)。因此,酮還原酶的酶活性的任何改善會存在與酮 還原酶作用的底物的擴散速率相關的上限。酮還原酶的活性可通過用于測量酮還原酶的任 一種標準的測定法來測定,如伴隨酮至醇的還原由NADPH的氧化產(chǎn)生的NADPH的吸光度或 熒光的降低,或通過偶聯(lián)的測定法中所產(chǎn)生的產(chǎn)物。酶活性的比較通過確定的酶制品、在設 定條件下的確定的測定法和一種或多種確定的底物而完成的,如在此進一步詳細闡述。通 常,當比較裂解物時,確定細胞數(shù)目和被測定的蛋白的量,同時使用相同的表達系統(tǒng)和相同 的宿主細胞以使宿主細胞產(chǎn)生的以及裂解物中存在的酶量上的變化最小?!绑w‘指底物至相應產(chǎn)物的酶促還原?!稗D(zhuǎn)化百分比"指一定時間段特定的條 件下被還原為產(chǎn)物的底物的百分比。因此,酮還原酶多肽的"酶促活性"或"活性"可表 示為底物至產(chǎn)物的“轉(zhuǎn)化百分比”?!盁岱€(wěn)定"指與未處理的酶相比,在暴露于高溫(例如40-80°C) 一段時間(例如 0. 5-24小時)后保持相似的活性(例如大于60%至80% )的酮還原酶多肽。“溶劑穩(wěn)定"指與未處理的酶相比,在暴露于不同濃度(例如5-99%)的溶劑 (異丙醇、四氫呋喃、2-甲基四氫呋喃、丙酮、甲苯、乙酸丁酯、甲基叔丁醚等)中一段時間 (例如0. 5-24小時)后保持相似的活性(大于例如60%至80% )的酮還原酶多肽。“ pH穩(wěn)定"指與未處理的酶相比,在暴露于高或低PH (例如,4. 5-6或8至12) — 段時間(例如0. 5-24小時)后保持相似的活性(大于例如60%至80%)的酮還原酶多肽?!盁岷腿軇┓€(wěn)定"指既熱穩(wěn)定也溶劑穩(wěn)定的酮還原酶多肽。在工程酮還原酶的上下文中,如本文所用的"衍牛自“鑒定工程化所基于的起始 的酮還原酶和/或編碼所述酮還原酶的基因。例如,SEQ ID NO :60的工程酮還原酶是通過 在多代期間人工進化編碼SEQ ID NO :4的克菲爾乳桿菌酮還原酶的基因得到的。因此,所 述工程酮還原酶〃衍生自〃 SEQ ID NO :4的野生型酮還原酶?!坝H水性氨基酸或殘基"指具有表現(xiàn)出根據(jù)Eisenberg等,1984,J.Mol. Biol. 179 125-142的標準化的一致疏水性等級小于0的疏水性的側(cè)鏈的氨基酸或殘 基。遺傳編碼的親水性氨基酸包括 L-Thr (T)、L-Ser (S)、L-His (H)、L-Glu (E)、L-Asn (N)、 L-Gln (Q)、L-Asp (D)、L-Lys (K)禾口 L-Arg (R)?!八嵝园被峄驓埢?指當氨基酸包含在肽或多肽中時,含有表現(xiàn)出小于約6的 PK值的側(cè)鏈的親水性氨基酸或殘基。酸性氨基酸典型地在生理PH下由于失去氫離子而具 有帶負電荷的側(cè)鏈。遺傳編碼的酸性氨基酸包括L-Glu (E)和L-Asp (D)。“堿件氨基酸或殘基"指當氨基酸包含在肽或多肽中時,含有表現(xiàn)出大于約6的 PK值的側(cè)鏈的親水性氨基酸或殘基。堿性氨基酸典型地在生理PH下由于締合水合氫離子 而具有帶正電荷的側(cè)鏈。遺傳編碼的堿性氨基酸包括L-Arg(R)和L-Lys(K)?!皹O件氨基酸或殘基"指含在生理pH下不帶電荷的側(cè)鏈、但是該側(cè)鏈含有其中兩個原子共同共享的電子對更靠近維持原子之一的至少一個鍵的親水性氨基酸或殘基。遺 傳編碼的極性氨基酸包括L-Asn (N)、L-Gln (Q)、L-Ser (S)和L-Thr (T)?!笆杷被峄驓埢?指含有表現(xiàn)出根據(jù)Eisenberg等,1984,T. Mol. Biol. 179 125-142的標準化的一致疏水性等級的大于O的疏水性的側(cè)鏈的氨基酸或殘 基。遺傳編碼的疏水性氨基酸包括 L-Pro (P)、L-Ile (I)、L-Phe (F)、L-Val (V)、L-Leu (L)、 L-Trp (W)、L-Met (M)、L-Ala (A)和 L-Tyr (Y)。“芳香族氨基酸或殘基"指具有包括至少一個芳香環(huán)或雜芳香環(huán)的側(cè)鏈的親 水性或疏水性氨基酸或殘基。遺傳編碼的芳香族氨基酸包括L-Phe(F)、L-Tyr(Y)和 L-Trp (W)。盡管由于L-His(H)雜芳香氮原子的pKa,L-His (H)有時被劃分為堿性殘基或由 于側(cè)鏈中包括雜芳香環(huán)而劃分為芳香族殘基,在此組氨酸被劃分為親水性殘基或作為“受 限殘基”(見下)?!薨被峄驓埢?指具有受限幾何學的氨基酸或殘基。在此,受限殘基包括 L-pro(P)和L-his(H)。組氨酸因為其具有相對小的咪唑環(huán)而具有受限的幾何學。脯氨酸 因為它也含有五元環(huán)而具有受限的幾何學?!菢O件氨基酸或殘基"指含有在生理pH下不帶電荷的側(cè)鏈、并且該側(cè)鏈含有 其中兩個原子共同共享的電子對通常為兩個原子中的每一個等同維持的鍵(也就是說, 側(cè)鏈不是極性的)的疏水性氨基酸或殘基。遺傳編碼的非極性氨基酸包括L-Gly(G)、 L-Leu (L)、L-Val (V)、L-Ile (I)、L-Met (M)和 L-Ala (A)。“脂肪族氨基酸或殘基"指具有脂肪族烴側(cè)鏈的疏水性氨基酸或殘基。遺傳編碼 的脂肪族氨基酸包括 L-Ala (A)、L-Val (V)、L-Leu (L)和 L-Ile (I)?!鞍腚装彼?或L-Cys(C)為罕見的,原因是其可與其它L-Cys(C)氨基酸或其它 含硫烷基或含巰基的氨基酸形成二硫鍵?!鞍腚装彼針託埢?包括半胱氨酸和含有可用于 形成二硫鍵的巰基部分的其它氨基酸。L-Cys (C)(以及具有含-SH的側(cè)鏈的其它氨基酸) 以還原的游離-SH或氧化的二硫鍵形式存在于肽中的能力影響L-Cys(C)是否對肽貢獻凈 疏水性或親水性特征。雖然L-Cys (C)表現(xiàn)出根據(jù)Eisenberg (Eisenberg等人,1984,如上) 的標準化的一致性等級為0. 29的疏水性,但應理解的是,對于本公開的目的L-Cys (C)被劃 分在其自身特有的組中?!靶“被峄驓埢?指具有包括其三個或更少碳原子和/或雜原子(不包括 α -碳和氫)的側(cè)鏈的氨基酸或殘基。根據(jù)以上定義,小氨基酸或殘基可進一步劃分為脂肪 族、非極性、極性或酸性小氨基酸或殘基。遺傳編碼的小氨基酸包括L-Ala(A)、L-Val (V)、 L-Cys (C)、L-Asn (N)、L-Ser (S)、L-Thr (T)和 L-Asp (D)。“含羥基的氨基酸或殘基"指含有羥基(-0Η)部分的氨基酸。遺傳編碼的含羥基 的氨基酸包括 L-Ser (S)、L-Thr (T)和 L-Tyr (Y)。“保立"氨基酸取代或突變指含有相似側(cè)鏈的殘基的可交換性,并且因此典型地 包括多肽中的氨基酸被存在于相同或相似的氨基酸定義類別中的氨基酸所取代。然而如本 文所用,在一些實施方式中,如果保守突變可代替地為從脂肪族殘基至脂肪族殘基、非極性 殘基至非極性殘基、極性殘基至極性殘基、酸性殘基至酸性殘基、堿性殘基至堿性殘基、芳 香族殘基至芳香族殘基或受限殘基至受限殘基的取代,則保守突變不包括從親水性殘基至 親水性殘基、疏水性殘基至疏水性殘基、含羥基殘基至含羥基殘基、或小殘基至小殘基的取代。此外,如本文所用,A、V、L或I可被保守的突變?yōu)榱硪恢咀鍤埢蛘吡硪环菢O性殘 基。下表顯示示例性的保守取代。表 1 “非保守取代"指多肽中的氨基酸被具有明顯不同的側(cè)鏈性質(zhì)的氨基酸取代或 突變。非保守取代可使用在以上所列定義組之間而不是之內(nèi)的氨基酸。在一個實施方式中, 非保守突變影響(a)取代區(qū)域內(nèi)的肽主鏈的結(jié)構(gòu)(例如,脯氨酸取代甘氨酸)(b)電荷或疏 水性,或(c)側(cè)鏈的體積(bulk)?!竿ㄟ^從參考多肽中移除一個或多個氨基酸而對多肽的修飾。缺失可包 含移除1個或多個氨基酸、2個或更多氨基酸、5個或更多氨基酸、10個或更多氨基酸、15個 或更多氨基酸或20個或更多氨基酸、多達構(gòu)成所述多肽的氨基酸總數(shù)的10%、多達構(gòu)成所 述多肽的氨基酸總數(shù)的20%、或多達構(gòu)成所述多肽的氨基酸總數(shù)的30%,同時保留酶促活 性和/或保留工程酮還原酶的改善的性質(zhì)。缺失可針對多肽的內(nèi)部部分和/或末端部分。 在不同的實施方式中,缺失可包含連續(xù)的區(qū)段或可為不連續(xù)的。‘‘ MA“指通過從參考多肽添加一個或多個氨基酸的多肽的修飾。在一些實施方 式中,改善的工程酮還原酶包含插入一個或多個氨基酸至自然存在的酮還原酶多肽以及插 入一個或多個氨基酸至其它的改善的酮還原酶多肽中。插入可為在多肽內(nèi)部部分,或至羧 基或氨基末端。如本文所用的插入包括本領域內(nèi)已知的融合蛋白。插入可為連續(xù)的氨基酸 區(qū)段或被自然存在的多肽中的一個或多個氨基酸隔開。如本文所用的"丑段"指具有氨基末端和/或羧基末端缺失、但是其中保留的氨 基酸序列與序列相應的位置相同的多肽。片段可為至少14個氨基酸長、至少20個氨基酸 長、至少50個氨基酸長或更長,并且多達全長酮還原酶多肽的70 %、80 %、90 %、95 %、98 %和99%,例如SEQ ID NO :2、4或86的多肽?!胺蛛x的多fe"指與自然伴隨其的其它雜質(zhì)大體分開的多肽,所述雜質(zhì)例如蛋白 質(zhì)、脂類和多核苷酸。術(shù)語包括從其自然存在的環(huán)境或表達系統(tǒng)(例如,宿主細胞或體外合 成)中移出或純化的多肽。改善的酮還原酶可在細胞內(nèi)存在,在細胞培養(yǎng)基中存在,或以不 同的諸如裂解物或分離的制品形式制備。如此,在一些實施方式中,改善的酮還原酶可為分 離的多肽?!按篌w鈍的多fe"指其中多肽種類為存在的主導的種類(也就是說,基于摩爾或 質(zhì)量,其比組合物中任何其它單獨的大分子種類更豐富)的組合物,并且當目標種類以摩 爾或%質(zhì)量表示構(gòu)成存在的大分子種類的至少約50%時,該組合物通常為大體純化的組合 物。通常,大體純的酮還原酶組合物將包含以摩爾或%質(zhì)量表示,存在于組合物中的所有大 分子種類的約60%或更多、約70%或更多、約80%或更多、約90%或更多、約95%或更多以 及約98%或更多。在一些實施方式中,目標種類被純化至基本同質(zhì)(也就是說,組合物中的 雜質(zhì)種類通過常規(guī)的檢測方法無法檢測出),其中該組合物基本上由單一的大分子種類組 成。溶劑種類、小分子(< 500道爾頓)以及基本離子種類不認為是大分子種類。在一些 實施方式中,分離的改善的酮還原酶多肽是大體純的多肽組合物。如本文所用的"嚴格雜交"指核酸雜交體(hybrid)穩(wěn)定的條件。如本領域內(nèi)技 術(shù)人員已知的,雜交體的穩(wěn)定性反映在雜交體的解鏈溫度(Tm)。通常,雜交體的穩(wěn)定性為 離子強度、溫度、G/C含量和促溶劑(chaotropic agent)的存在的函數(shù)。多核苷酸的Tm值 可用預測解鏈溫度的已知方法來計算(見如,Baldino等人,Methods Enzymology 168 761-777 ;Bolton 等人,1962,Proc. Natl. Acad. Sci. USA 48 1390 ;Bresslauer 等人,1986, Proc. Natl. Acad. SciUSA 83 :8893_8897 ;Freier 等人,1986,Proc. Natl. Acad. Sci USA83 9373-9377 ;Kierzek 等人,Biochemistry 25 7840-7846 ;Rychlik 等人,1990,Nucleic Acids Res 18 :6409_6412 (勘誤,1991,Nucleic Acids Res 19:698) ;Sambrook 等人,如 上);Suggs 等人,1981,于 Developmental Biology UsingPurified Genes (應用純化的基 因的發(fā)育生物學)(Brown等人編輯),683-693頁,Academic Press ;以及Wetmur,1991,Crit Rev Biochem MoI Biol26 :227_259。所有出版物以引用方式并入本文)。在一些實施方式 中,所述多核苷酸編碼本文公開的多肽,并且在確定的條件下,如適度嚴格或高度嚴格的條 件下,與編碼本公開的工程酮還原酶的序列的互補序列雜交?!半s交嚴格件"指在核酸雜交中的雜交條件,諸如清洗條件。通常,雜交反應在較 低的嚴格性條件下進行,之后進行變化的但是較高的嚴格性的清洗。術(shù)語"適度嚴格的雜 交“指允許目標-DNA結(jié)合與該目標DNA具有約60 %同一性、優(yōu)選地約75 %同一性、約85 % 同一性、與靶標多核苷酸具有高于約90%同一性的互補核酸的條件。示例性的適度嚴格條 件為等同于在42 °C下50%甲酰胺、5x Denhart' s溶液、5xSSPE、0. 2% SDS中雜交,之后在 42°C下0. 2xSSPE、0. 2% SDS中清洗的條件?!案叨葒栏裥噪s交〃通常指比在確定的多核苷 酸序列的溶液條件下確定的熱解鏈溫度Tm低約10°C或更少的條件。在一些實施方式中,高 度嚴格性狀態(tài)指只允許在65°C下0.018M NaCl中形成穩(wěn)定雜交體的那些核酸序列雜交的 條件(也就是說,如果雜交在65°C下0. 018M NaCl中不穩(wěn)定,其將在高度嚴格性狀態(tài)下不穩(wěn) 定,如本文所述的)。可以提供高度嚴格性條件,例如通過在等同于在42°C下50%甲酰胺、 5x Denhart ‘ s 溶液、5x SSPE、0. 2% SDS 中雜交,之后在 65°C下 0. Ix SSPE 和 0. 1 % SDS 中清洗的條件。另一個高度嚴格性條件為在等同于在65°C下含0. (w v)SDS的5X SSC 中雜交并且在65°C下含0.1% SDS的0. Ix SSC中清洗。其它的高度嚴格性雜交的條件,以 及適度嚴格性條件,在以上引用的參考文獻中闡述?!帮@遯"多核苷酸指通過實驗室技術(shù)引入宿主細胞的任何多核苷酸,并且包括通 過實驗室操作從宿主細胞中移出、經(jīng)受實驗室操作然后重新引入至宿主細胞中的多核苷 酸。“密碼子優(yōu)化"指編碼蛋白質(zhì)的多核苷酸的密碼子至特定的生物體中優(yōu)先使 用的那些密碼子的變化,以使得編碼的蛋白質(zhì)在感興趣的生物體中有效率地表達。盡 管基因遺傳密碼具簡并性,即大多數(shù)氨基酸由稱為"同義"(“synonyms “)或"同 義"(“synonymous同義")密碼子的幾個密碼子代表,但是眾所周知,特定生物體密碼子 的使用是非隨機的和對于特定的密碼子三聯(lián)體有偏好的。這種密碼子使用偏倚性可在特定 的基因、共同功能或祖先起源的基因、相對于低拷貝數(shù)蛋白質(zhì)高度表達的蛋白質(zhì)以及生物 體基因組的聚集蛋白質(zhì)編碼區(qū)中更高。在一些實施方式中,編碼酮還原酶的多核苷酸可為 從選擇用于表達的宿主生物體中的最佳化生產(chǎn)而進行密碼子優(yōu)化?!畠?yōu)詵、最佳的、高密碼子使用偏倚件密碼子"可交換地指在蛋白編碼區(qū)中的使 用頻率高于編碼相同的氨基酸的其他密碼子的密碼子。優(yōu)選的密碼子可根據(jù)在單個基因、 具有共同功能或起源的一組基因、高度表達的基因中的密碼子使用,在整個生物體的聚集 蛋白質(zhì)編碼區(qū)域的密碼子頻率,在相關生物體的聚集蛋白質(zhì)編碼區(qū)域的密碼子頻率,或其 組合來確定。隨基因表達水平而頻率增加的密碼子通常為用于表達的最佳密碼子。確定特 定的生物體中的密碼子頻率(例如,密碼子使用,相對的同義密碼子使用)以及在密碼子偏 愛性的方法為公知的,包括多變量分析,例如,使用聚類分析或?qū)治觯约坝糜诨蛑?的密石馬子的有效數(shù)目(參見 GCGCodonPreference, Genetics Computer Group Wisconsin Package ;Codonff, John Peden, University of Nottingham ;Mclnerney, J.0,1998, Bioinformaticsl4 :372_73 ;Stenico 等人,1994,Nucleic Acids Res. 222437-46 ;Wright, F.,1990,Gene 87 23-29) 0密碼子使用表對越來越多的生物體可用(參見例如,Wada等 人,1992,Nucleic Acids Res. 20 :2111-2118 ;Nakamura 等人,2000,Nucl. Acids Res. 28 292 ;Duret,等人,如上;Henaut 禾口 Danchin, “ Escherichia coliand Salmonella,“(“ 大腸埃希氏菌和沙門氏菌")1996,Neidhardt等人編輯,ASM Press, Washington D. C., 2047-2066頁。獲得密碼子使用的數(shù)據(jù)源可依賴于可以編碼蛋白質(zhì)的任何可用的核苷酸序 列。這些數(shù)據(jù)集包括實際上已知為編碼表達的蛋白質(zhì)(例如,完整蛋白質(zhì)編碼序列-CDS)、 表達序列標簽(ESTS)或基因組序列的預測編碼區(qū)域的核酸序列(參見例如,Mount, D., Bioinformatics =Sequence and Genome Analysis (生物信息學序列禾口基因組分析), 第 8 章,Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N. Y. ,2001 ; Uberbacher, Ε. C, 1996, Methods Enzymo 1. 266 259-281 ;Tiwari 等)κ, 1997, Comput. App 1. Biosci. 13 263-270)?!翱刂菩蛄?在此定義為包括對本公開的多肽的表達為必需的或有利的所有組 分。每種控制序列可為編碼多肽的核苷酸序列的天然或外來的序列。所述控制序列包括但 不局限于前導序列、聚腺苷酸序列、前肽序列、啟動子、信號肽序列和轉(zhuǎn)錄終止子?!翱刹僮鞯剡B接的"在此定義為一種構(gòu)型,控制序列被以該構(gòu)型置于相對于感興趣的多核苷酸合適的位置(也就是,處于功能性關系)使得控制序列指向或調(diào)節(jié)感興趣的 多核苷酸和/或多肽的表達?!皢幼有蛄小盀榭杀挥糜诒磉_感興趣的多核苷酸的宿主細胞識別的核苷酸序 列,例如編碼序列??刂菩蛄锌砂线m的啟動子序列。啟動子序列包括轉(zhuǎn)錄控制序列,該 序列介導目標多核苷酸的表達。啟動子可為在選擇的宿主細胞中表現(xiàn)轉(zhuǎn)錄活性的任何核苷 酸序列,包括突變的、截斷的和雜合(hybrid)的啟動子,并且可從對宿主細胞同源的或異 源的編碼細胞外或細胞內(nèi)的多肽的基因中獲得。1.2酮還原酶在一個方面,本公開提供可以將2-苯甲酰氨基甲基-3-氧丁酸甲酯的外消旋混 合物(“底物”)立體選擇性地還原或轉(zhuǎn)化至2S,3R-2-苯甲酰氨基甲基-3-羥基丁酸甲酯 (〃 2S,3R產(chǎn)物〃)的工程酮還原酶(〃 KRED")。當與從克菲爾乳桿菌(SEQ ID NO :4)、 短乳桿菌(SEQ ID NO 2)或小乳桿菌(SEQ IDNO 86)中得到的自然存在的野生型KRED酶 或與其它工程酮還原酶相比時,這些酮還原酶多肽(也在此描述為"2S,3R選擇性酮還原 酶")具有將2-苯甲酰氨基甲基-3-氧丁酸甲酯還原或轉(zhuǎn)化至2S,3R-2-苯甲酰氨基甲 基-3-羥基丁酸甲酯的改善的性質(zhì)。在一些實施方式中,與野生型或另外的工程多肽如SEQ ID NO :64相比,改善的性 質(zhì)為就將底物2-苯甲酰氨基甲基-3-氧丁酸甲酯還原或轉(zhuǎn)化為2S,3R-2-苯甲酰氨基甲 基-3-羥基丁酸甲酯的立體選擇性的增加而言,也就是說,在此,產(chǎn)物的立體異構(gòu)體過量的 增加。在一些實施方式中,酮還原酶多肽的改善的性質(zhì)為就其將更多百分比的底物轉(zhuǎn)化或 還原至產(chǎn)物的能力而言。在一些實施方式中,酮還原酶多肽的改善的性質(zhì)為就其轉(zhuǎn)化底物 至產(chǎn)物的速率而言,這可通過其可使用相比于野生型或其它參考序列更少的改善的多肽以 還原或轉(zhuǎn)化相同量的產(chǎn)物的能力而證明。在一些實施方式中,酮還原酶多肽的改善的性質(zhì) 為就其穩(wěn)定性或熱穩(wěn)定性而言。在一些實施方式中,酮還原酶多肽具有多于一種改善的性 質(zhì),如增強的立體選擇性和改善的酶促活性。本公開進一步提供能夠?qū)?-苯甲酰氨基甲基-3-氧丁酸甲酯的外消旋混合物(" 底物〃)立體選擇性地還原或轉(zhuǎn)化為2R,3R-2-苯甲酰氨基甲基-3-羥基丁酸甲酯(“2R, 3R產(chǎn)物”)的工程酮還原酶。與產(chǎn)生2S,3R產(chǎn)物的工程多肽相似,能夠產(chǎn)生2R,3R產(chǎn)物的 工程酮還原酶(也在此描述為2R,3R選擇性酮還原酶)與野生型多肽或另外的工程多肽如 SEQ ID NO :66相比,具有改善的性質(zhì)。在一些實施方式中,改善的性質(zhì)為就將底物2-苯甲 酰氨基甲基-3-氧丁酸甲酯還原或轉(zhuǎn)化為2R,3R-2-苯甲酰氨基甲基-3-羥基丁酸甲酯的 立體選擇性而言。在一些實施方式中,改善的性質(zhì)為就其將底物還原至2R,3R產(chǎn)物的酶促 活性而言。在一些實施方式中,酮還原酶多肽的改善的性質(zhì)為就其穩(wěn)定性或熱穩(wěn)定性而言。 在一些實施方式中,酮還原酶多肽具有多于一種改善的性質(zhì),如增強的立體選擇性和改善 的酶促活性。如下所詳述,可轉(zhuǎn)化底物至2S,3R產(chǎn)物的酮還原酶多肽包含其中相應于SEQ ID NO :2、4或86中的X202的殘基為纈氨酸或亮氨酸的氨基酸序列。在一些實施方式中,酮還 原酶多肽包含其中相應于SEQ ID NO :2、4或86中的X94的殘基為脂肪族或極性殘基,尤其 是丙氨酸或蘇氨酸;并且相應于SEQ ID NO :2、4或86中的X202的殘基為纈氨酸或亮氨酸 的氨基酸序列。在一些實施方式中,2S,3R選擇性酮還原酶多肽包含相應于SEQID NO :2、4或86中的X94的殘基為脂肪族或極性殘基,尤其是丙氨酸或蘇氨酸;相應于SEQ ID NO :2、 4或86中的X199的殘基為受限、極性或脂肪族殘基,尤其是組氨酸、天冬酰胺或丙氨酸;并 且相應于SEQ ID NO :2、4或86中的X202的殘基為纈氨酸或亮氨酸的氨基酸序列。如上所見,本公開中酮還原酶可參考克菲爾乳桿菌、短乳桿菌或小乳桿菌中自然 存在的酮還原酶(也稱為"ADH"或"醇脫氫酶")或另外的工程酮還原酶的氨基酸序列 而描述。照此,氨基酸殘基位置是從開始于起始的蛋氨酸(M)殘基(也就是,M代表殘基位置 1)的酮還原酶決定,盡管本領域內(nèi)技術(shù)人員理解,該起始蛋氨酸殘基可通過生物加工機制 移除,例如在宿主細胞中或體外翻譯系統(tǒng)中,以產(chǎn)生缺乏起始蛋氨酸殘基的成熟蛋白質(zhì)。氨 基酸序列中存在的特定的氨基酸或氨基酸變化的氨基酸殘基位置在此用術(shù)語"Xn"或" 位置η"描述,其中η指殘基位置。在相同殘基位置的氨基酸殘基在酮還原酶中不同時,不 同的殘基可由"Γ表示,排列為"克菲爾乳桿菌殘基/短乳桿菌殘基/小乳桿菌"。參考 序列例如SEQ ID NO 2和SEQ IDNO 4和SEQ ID NO 86的野生型酮還原酶中的氨基酸殘 基被不同的氨基酸殘基替換的取代突變,可由符號"一“表示。在此,在一些實施方式中, 突變有時可表達為突變“至”氨基酸類型。例如,SEQ ID NO :4中殘基199可突變"至"極 性殘基。但是短語"至"的使用不排除從一個類型中的一個氨基酸至此類型中另外的氨基 酸的突變。例如,SEQ ID NO :4中殘基199為脂肪族殘基亮氨酸,但是其可突變?yōu)椴煌闹?肪族殘基,例如,突變可為"L199A" (199 —Α)突變。克菲爾乳桿菌、短乳桿菌或小乳桿 菌中自然存在酮還原酶(也稱為"ADH"或"醇脫氫酶")的氨基酸序列可從已知的編碼 酮還原酶活性的多核苷酸(例如,克菲爾乳桿菌Genbank登錄號AAP94029GI =33112056或 SEQ ID NO :3 ;短乳桿菌Genbank登錄號 CAD66648GL28400789 或 SEQ ID NO 1 ;和小乳桿菌 SEQ ID NO 86)中獲得。在一些實施方式中,本文的酮還原酶多肽可具有對于參考序列(例如,自然存在 的多肽或工程多肽)的許多修飾以產(chǎn)生改善的酮還原酶性質(zhì)。如本文所用,“修飾"包括 氨基酸取代、缺失和插入。可將任何一種修飾或修飾的組合的引入至自然存在的或工程多 肽中以產(chǎn)生工程酶。在這樣的實施方式中,氨基酸序列的修飾數(shù)目可包含一個或多個氨基 酸、2個或更多氨基酸、3個或更多氨基酸、4個或更多氨基酸、5個或更多氨基酸、6個或更多 氨基酸、8個或更多氨基酸、10個或更多氨基酸、15個或更多氨基酸、或20個或更多氨基酸、 多達氨基酸總數(shù)的10%、多達參考多肽序列氨基酸總數(shù)的15%、多達參考多肽序列氨基酸 總數(shù)的20%或多達參考多肽序列氨基酸總數(shù)的30%。在一些實施方式中,產(chǎn)生改善的酮還 原酶性質(zhì)的自然存在的多肽或工程多肽的修飾的數(shù)目可包含從約1-2、1-3、1-4、1-5、1-6、 1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或約1-40個對參考序列的修飾。在一些實施方式中,修飾的數(shù)目可為1、2、3、4、5、6、7、8、9、 10、11、12、14、15、16、18、20、22、24、26、30、35或約40個氨基酸殘基。修飾可包含插入、缺 失、取代或其組合。在一些實施方式中,修飾包含對參考序列的氨基酸取代。可產(chǎn)生改善的酮還原酶 性質(zhì)的取代可在一個或多個氨基酸、2個或更多氨基酸、3個或更多氨基酸、4個或更多氨基 酸、5個或更多氨基酸、6個或更多氨基酸、8個或更多氨基酸、10個或更多氨基酸、15個或 更多氨基酸或20個或更多氨基酸、多達參考酶氨基酸總數(shù)的10%、多達參考酶氨基酸總 數(shù)的15%、多達參考酶氨基酸總數(shù)的20%或多達參考酶氨基酸總數(shù)的30%。在一些實施方式中,產(chǎn)生改善的酮還原酶性質(zhì)的自然存在的多肽或工程多肽的取代的數(shù)目可包含從約 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、 1-24、1-26、1-30、1-35或約1_40個對參考序列的取代。在一些實施方式中,修飾的數(shù)目可 為 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或約 40 個氨基酸殘基。在一些實施方式中,改善的酮還原酶多肽包含與基于SEQ ID N0:2、4或86的參 考序列具有至少約 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、 97 %、98 %或99 %或更高的同一性的氨基酸序列,所述參考序列在相應于X202的殘基為亮 氨酸或纈氨酸,條件是該酮還原酶多肽具有其中相應于X202的殘基為亮氨酸或纈氨酸的 氨基酸序列。在一些實施方式中,相應于X202的殘基為亮氨酸。在一些實施方式中,相比較 于參考氨基酸序列,所述酮還原酶多肽可含有在其它殘基位置上的一個或多個殘基差異。 所述差異包括不同的修飾,例如取代、缺失和插入。所述取代可為非保守取代、保守取代或 非保守和保守取代的組合。在一些實施方式中,與參考序列相比,酮還原酶可任選地含有在 其它氨基酸殘基上的約 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、 1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或約 1-40 個殘基差異。在一些實施方式中, 與參考序列相比,差異的數(shù)目可為在其它氨基酸殘基上的1、2、3、4、5、6、7、8、9、10、11、12、 14、15、16、18、20、22、24、26、30、35或約40個殘基差異。在一些實施方式中,參考序列為SEQ ID NO :48。在一些實施方式中,改善的酮還原酶多肽包含與基于SEQ ID N0:2、4或86的參 考序列具有至少約 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、 97%、98%或99%或更高的同一性的氨基酸序列,所述參考序列具有以下特征相應于X94 的殘基為脂肪族或極性殘基,尤其是丙氨酸或蘇氨酸;并且相應于X202的殘基為纈氨酸或 亮氨酸;條件是該酮還原酶多肽具有包含至少先前的特征的氨基酸序列(也就是說,相應 于X94的殘基為脂肪族或極性殘基;并且相應于X202的殘基為纈氨酸或亮氨酸)。在一些 實施方式中,酮還原酶具有其中相應于X94的殘基為極性殘基;并且相應于X202的殘基為 纈氨酸或亮氨酸的氨基酸序列。在一些實施方式中,酮還原酶具有其中相應于X94的殘基 為蘇氨酸并且相應于X202的殘基為纈氨酸或亮氨酸的氨基酸序列。在一些實施方式中, 與參考序列相比,這些酮還原酶多肽可任選地含有在其它氨基酸殘基處的約1-2、1-3、1-4、 1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、 1-30、1-35或約1-40個殘基差異。在一些實施方式中,與參考序列相比,差異的數(shù)目可為在 其它氨基酸殘基處的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或 約40個殘基差異。在一些實施方式中,參考序列為SEQ ID NO: 26或28。在一些實施方式中,改善的酮還原酶多肽包含與基于SEQ ID NO :2、4或86的參 考序列具有至少約 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、 97%、98%或99%或更高的同一性的氨基酸序列,所述參考序列具有以下特征相應于X94 的殘基為脂肪族或極性殘基,尤其是丙氨酸或蘇氨酸;相應于X199的殘基為脂肪族、受限 或極性殘基,尤其是丙氨酸、天冬酰胺或組氨酸;并且相應于X202的殘基為纈氨酸或亮氨 酸;條件是該酮還原酶多肽具有包含至少先前的特征的氨基酸序列(也就是說,相應于X94 的殘基為脂肪族或極性殘基;相應于X199的殘基為脂肪族、受限或極性殘基;并且相應于些實施方式中,相應于X94的殘基為極性殘基;相應 于X199的殘基為脂肪族、受限或極性殘基;并且相應于X202的殘基為纈氨酸或亮氨酸。在 一些實施方式中,酮還原酶具有以下氨基酸序列,其中相應于X94的殘基為蘇氨酸;相應于 X199的殘基為丙氨酸、天冬酰胺或組氨酸;并且相應于X202的殘基為纈氨酸或亮氨酸。在 一些實施方式中,與參考氨基酸序列相比,所述酮還原酶多肽可含有在其它殘基位置上的 一個或多個殘基差異。所述差異包括不同的修飾,例如取代、缺失和插入。所述取代可為非 保守取代、保守取代或非保守和保守取代的組合。在一些實施方式中,與參考序列相比,酮 還原酶可任選地具有在其它氨基酸殘基處的約1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、 1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或約 1-40 個殘基差 異。在一些實施方式中,與參考序列相比,差異的數(shù)目可為在其它氨基酸殘基處的1、2、3、4、 5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或約 40 個殘基差異。在一些實施 方式中,參考序列為SEQ ID N0:22、24或30。鑒于以上,所述2S,3R選擇性酮還原酶可用關于相應于X94、X199和X202的殘基 的不同的組合的特征而描述。例如,以相應于X94和X202的殘基的特征為特征的2S,3R選 擇性多肽涉及在此所提供的對特定殘基位置的組合的描述。類似地,以相應于X94、X199和 X202的殘基的特征為特征的2S,3R選擇性多肽涉及在此所提供的對特定殘基位置的組合 的描述。如下文進一步描述的,與參考序列相比,這些酮還原酶可含有在氨基酸序列中的一 個或多個另外的特征。在一些實施方式中,2S,3R選擇性酮還原酶多肽包含基于如列于SEQID NO :83、SEQ ID N0:84或SEQ ID NO :87的序列式(或其區(qū)域,如殘基90-211)的氨基酸序列。SEQ ID NO :84為基于克菲爾乳桿菌酮還原酶(SEQID NO 4)的野生型氨基酸序列,SEQ ID NO 83 為基于短乳桿菌酮還原酶(SEQ ID NO 2)的野生型氨基酸序列,并且SEQ ID N0:87為基于 小乳桿菌酮還原酶(SEQ ID NO 86)的野生型氨基酸序列。SEQ ID NO :83、84或87詳細說 明相應于X94的殘基為脂肪族或極性殘基;相應于X199的殘基為脂肪族、受限或極性殘基; 并且相應于X202的殘基為纈氨酸或亮氨酸。所述序列式進一步詳細說明不同的其它殘基 位置的特征,如下所述。在一些實施方式中,包含基于SEQ ID NO :83、84或87的序列式或其區(qū)域如殘基 90-211的氨基酸序列,具有相應于如此所述的X94、X199和X202的殘基的不同組合的特定 的特征的改善的酮還原酶,可含有選自如下的一個或多個另外的特征相應于X2的殘基為 極性、非極性或脂肪族殘基;相應于X4的殘基為堿性殘基或半胱氨酸;相應于Xll的殘基 為非極性的、脂肪族、或芳香族殘基;相應于X40的殘基為受限或堿性殘基;相應于X80的 殘基為非極性、脂肪族或極性殘基;相應于X86的殘基為非極性、脂肪族或極性殘基;相應 于X96的殘基為極性、芳香族、非極性或脂肪族殘基;相應于X105的殘基為非極性的、脂肪 族、堿性或酸性殘基;相應于X129的殘基為非極性或極性殘基;相應于X147的殘基為芳香 族、非極性或脂肪族殘基;相應于X153的殘基為極性、非極性或脂肪族殘基;相應于X190 的殘基為芳香族或受限殘基;相應于X195的殘基為非極性或脂肪族殘基;相應于X196的 殘基為非極性或脂肪族殘基;相應于X206的殘基為非極性或芳香族殘基;相應于X226的 殘基為非極性或脂肪族殘基;相應于X248為非極性或堿性殘基;相應于X249為芳香族殘 基。在一些實施方式中,氨基酸序列可含有至少所述特征中的兩個、三個、四個、五個、六個或更多。在一些實施方式中,相比較于SEQ ID NO :2、4或86的參考序列,包含基于SEQ ID N0:83、84或87的序列式(或其區(qū)域)的氨基酸序列的多肽可另外地含有在未被以上X 標明的殘基位置處的一個或多個殘基差異。在一些實施方式中,差異可為在不被以上X限 定的其它氨基酸殘基位置的 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、 1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或約 1-40 個殘基差異。在一些實施方 式中,差異的數(shù)目可為其它氨基酸殘基位置上的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、 18、20、22、24、26、30、35或約40個殘基差異。在一些實施方式中,所述差異包含保守突變。在一些實施方式中,包含基于SEQ ID NO :83、84或87的序列式或其區(qū)域如殘基 90-211的氨基酸序列可具有相比較于SEQ ID NO :2、4或86的氨基酸序列的一個或多個保 守突變。示例性的保守突變包括例如但是不局限于以下的氨基酸置換將相應于X21的殘 基纈氨酸(V)置換為另一個脂肪族殘基,例如,異亮氨酸;將相應于X78的殘基谷氨酸(E) 置換為另一個酸性殘基,例如,天冬氨酸;將相應于X145的殘基谷氨酸(E)置換為另一個 酸性殘基,例如,天冬氨酸;將相應于X153的殘基亮氨酸(L)置換為另一個脂肪族殘基,例 如,丙氨酸;將相應于X195的殘基亮氨酸(L)置換為另一個脂肪族殘基,例如,纈氨酸;將 相應于X196的殘基置換為另一個脂肪族殘基,例如,亮氨酸;將相應于X226的殘基異亮氨 酸(I)置換為另一個脂肪族殘基,例如,纈氨酸。在一些實施方式中,包含基于SEQ ID NO :83、84或87的序列式或其區(qū)域如殘基 90-211的氨基酸序列,具有相應于如此所述的X94、X199和X202的殘基的不同組合的特 定的特征的改善的酮還原酶,可含有選自如下的一個或多個另外的特征相應于X2的殘基 為絲氨酸、蘇氨酸、谷氨酰胺或天冬酰胺、甘氨酸、蛋氨酸、丙氨酸、纈氨酸、亮氨酸或異亮氨 酸,尤其為絲氨酸、蘇氨酸或丙氨酸;相應于X4的殘基為精氨酸、賴氨酸或半胱氨酸,尤其 為精氨酸或半胱氨酸;相應于Xll的殘基為甘氨酸、蛋氨酸、丙氨酸、纈氨酸、亮氨酸、異亮 氨酸、酪氨酸、苯丙氨酸或色氨酸,尤其為異亮氨酸、亮氨酸或苯丙氨酸;相應于X40的殘 基為脯氨酸、組氨酸、精氨酸或賴氨酸,尤其為組氨酸或精氨酸;相應于X80的殘基為甘氨 酸、蛋氨酸、丙氨酸、纈氨酸、亮氨酸、異亮氨酸、絲氨酸、蘇氨酸、谷氨酰胺或天冬酰胺,尤其 為丙氨酸或蘇氨酸;相應于X86的殘基為絲氨酸、蘇氨酸、谷氨酰胺、天冬酰胺、甘氨酸、蛋 氨酸、丙氨酸、纈氨酸、亮氨酸或異亮氨酸,尤其為蘇氨酸或異亮氨酸;相應于X96的殘基為 絲氨酸、蘇氨酸、谷氨酰胺、天冬酰胺、甘氨酸、蛋氨酸、丙氨酸、纈氨酸、亮氨酸、異亮氨酸、 酪氨酸、苯丙氨酸或色氨酸,尤其為絲氨酸、天冬酰胺、纈氨酸或苯丙氨酸;相應于X105的 殘基為甘氨酸、蛋氨酸、丙氨酸、纈氨酸、亮氨酸、異亮氨酸、精氨酸、賴氨酸、天冬氨酸或谷 氨酸,尤其為谷氨酸、賴氨酸、丙氨酸或甘氨酸;相應于X129的殘基為甘氨酸、蛋氨酸、丙氨 酸、纈氨酸、亮氨酸、異亮氨酸、絲氨酸、蘇氨酸、谷氨酰胺或天冬酰胺,尤其為蛋氨酸或蘇氨 酸;相應于X147的殘基為酪氨酸、苯丙氨酸、色氨酸、甘氨酸、蛋氨酸、丙氨酸、纈氨酸、亮氨 酸或異亮氨酸,尤其為苯丙氨酸、蛋氨酸或亮氨酸;相應于X153的殘基為絲氨酸、蘇氨酸、 谷氨酰胺、天冬酰胺、甘氨酸、蛋氨酸、丙氨酸、纈氨酸、亮氨酸或異亮氨酸,尤其為亮氨酸、 丙氨酸或絲氨酸;相應于X190的殘基為酪氨酸、苯丙氨酸、色氨酸、組氨酸或脯氨酸,尤其 為酪氨酸、組氨酸或脯氨酸;相應于X195的殘基為甘氨酸、蛋氨酸、丙氨酸、纈氨酸、亮氨 酸或異亮氨酸,尤其為亮氨酸或纈氨酸;相應于X196的殘基為甘氨酸、蛋氨酸、丙氨酸、纈 氨酸、亮氨酸或異亮氨酸,尤其為亮氨酸;相應于X206的殘基為甘氨酸、蛋氨酸、丙氨酸、纈氨酸、亮氨酸、異亮氨酸、酪氨酸、苯丙氨酸或色氨酸,尤其為蛋氨酸或苯丙氨酸;相應于 X226的殘基為甘氨酸、蛋氨酸、丙氨酸、纈氨酸、亮氨酸或異亮氨酸,尤其為異亮氨酸或纈氨 酸;相應于X248的殘基為甘氨酸、蛋氨酸、丙氨酸、纈氨酸、亮氨酸、異亮氨酸、賴氨酸或精 氨酸,尤其為甘氨酸、賴氨酸或精氨酸;并且相應于X249的殘基為酪氨酸、苯丙氨酸或色氨 酸,尤其為酪氨酸或色氨酸。在一些實施方式中,氨基酸序列可含有所述特征中的至少兩 個、三個、四個、五個、六個或更多。在一些實施方式中,相比較于SEQ ID N0:2、4或86的 參考序列,包含基于SEQ ID NO :83、84或87的序列式(或其區(qū)域)的氨基酸序列的所述 多肽可另外地含有在未被以上X標明的殘基位置的一個或多個殘基差異。在一些實施方式 中,差異可為在不被以上X限定的其它氨基酸殘基位置的1-2、1-3、1-4、1-5、1-6、1-7、1-8、 1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或約 1-40 個殘基差異。在一些實施方式中,差異的數(shù)目可為在其它氨基酸殘基位置上的1、2、3、4、5、 6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或約 40 個殘基差異。在一些實施方 式中,所述差異包含保守突變。在一些實施方式中,包含基于SEQ ID NO :83、84或87的序列式或其區(qū)域如殘基 90-211的氨基酸序列,具有相應于如此所述的X94、X199和X202的殘基的不同組合的特定 的特征的改善的酮還原酶,可另外地含有以下特征的一個或多個或至少全部相應于X40 的殘基為受限或堿性殘基,尤其為精氨酸;相應于X147的殘基為芳香族、非極性或脂肪族 殘基,尤其為蛋氨酸或亮氨酸。在一些實施方式中,酮還原酶多肽除以上特征外還可含有 以下特征中的一個或多個相應于X96的殘基為極性、芳香族、非極性或脂肪族殘基,尤其 為苯丙氨酸或纈氨酸;相應于X195的殘基為非極性或脂肪族殘基,尤其為纈氨酸;相應于 X196的殘基為非極性或脂肪族殘基,尤其為亮氨酸;相應于X226的殘基為非極性或脂肪 族殘基,尤其為纈氨酸;相應于X248為非極性或堿性殘基,尤其為精氨酸或賴氨酸;而且相 應于X249為芳香族殘基,尤其為色氨酸。在一些實施方式中,酮還原酶多肽除以上特征外 還可含有以下的特征中的一個或多個相應于X2的殘基為極性、非極性或脂肪族殘基,尤 其為丙氨酸;相應于X4的殘基為堿性殘基或半胱氨酸,尤其為半胱氨酸;相應于Xll的殘 基為非極性、脂肪族、或芳香族殘基,尤其為苯丙氨酸;相應于X80的殘基為非極性、脂肪族 或極性殘基,尤其為蘇氨酸;相應于X86的殘基為非極性、脂肪族或極性殘基,尤其為異亮 氨酸;相應于X105的殘基為非極性的、脂肪族、堿性或酸性的殘基,尤其為甘氨酸;相應于 X129的殘基為非極性或極性殘基,尤其為蘇氨酸;相應于X153的殘基為極性、非極性或脂 肪族殘基,尤其為丙氨酸;相應于X190的殘基為芳香族或受限殘基,尤其為組氨酸或脯氨 酸;以及相應于X206的殘基為非極性或芳香族殘基,尤其為苯丙氨酸。如對技術(shù)人員明顯 的,前述的特征的不同組合可用于形成本公開的酮還原酶。在一些實施方式中,包含基于SEQ ID NO :83、84或87的序列式或其區(qū)域如殘基 90-211的氨基酸序列,具有相應于如此所述的X94、X199和X202的殘基的不同組合的特定 的特征的改善的酮還原酶,可另外地含有如下的特征中的一個或多個或至少全部相應于 X40的殘基為受限或堿性殘基,尤其為精氨酸;并且相應于X147的殘基為芳香族、非極性或 脂肪族殘基,尤其為蛋氨酸或亮氨酸。在一些實施方式中,與參考序列SEQ IDN0:2、4或86 相比,酮還原酶多肽可另外地含有在其它氨基酸殘基位置上的1-2、1-3、1-4、1-5、1-6、1-7、 1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或約
301-40個殘基差異。在一些實施方式中,差異的數(shù)目可為在其它氨基酸殘基上的1、2、3、4、5、 6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或約 40 個殘基差異。在一些實施方 式中,差異包含保守突變。在一些實施方式中,酮還原酶多肽包含與基于SEQ ID N0:2、4或 86的、具有以上特征的參考序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、 93 %、94 %、95 %、96 %、97 %、98 %或99 %的同一性的氨基酸序列,條件是所述酮還原酶含 有具有至少以上特征的氨基酸序列。在一些實施方式中,包含基于SEQ ID NO :83、84或87的序列式或其區(qū)域如殘基 90-211的氨基酸序列,具有相應于X94、X199和X202的殘基的不同組合的特定的特征的改 善的酮還原酶,可另外地含有一個或多個或至少所有如下的特征相應于X96的殘基為極 性、芳香族、非極性或脂肪族殘基,尤其為纈氨酸或苯丙氨酸;并且相應于X147的殘基為芳 香族、非極性或脂肪族殘基,尤其為蛋氨酸或亮氨酸。在一些實施方式中,與參考序列SEQ ID NO :2、4或86相比,酮還原酶多肽可另外地含有在其它氨基酸殘基位置處的1_2、1_3、 1-4、1-5、1-6、1-7、1-8、1-9、1-10、卜11、1-12、卜14、1-15、1-16、1-18、1-20、1-22、1-24、 1-26、1-30、1-35或約1_40個殘基差異。在一些實施方式中,差異的數(shù)目可為在其它氨基 酸殘基上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或約40 個殘 基差異。在一些實施方式中,差異包含保守突變。在一些實施方式中,酮還原酶多肽包含與 基于SEQ ID N0:2、4或86的、具有以上特征的參考序列具有至少85%、86%、87%、88%、 89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或 99% 的同一性的氨基酸序列, 條件是所述酮還原酶含有具有至少以上特征的氨基酸序列。在一些實施方式中,包含基于SEQ ID NO :83、84或87的序列式或其區(qū)域如殘基 90-211的氨基酸序列,具有相應于X94、X199和X202的殘基的不同組合的特定的特征的改 善的酮還原酶,可另外地含有一個或多個或至少所有如下的特征相應于X40的殘基為受 限或堿性殘基,尤其為精氨酸;相應于X96的殘基為極性、芳香族、非極性或脂肪族殘基,尤 其為纈氨酸或苯丙氨酸;并且相應于X147的殘基為芳香族、非極性或脂肪族殘基,尤其為 蛋氨酸或亮氨酸。在一些實施方式中,與SEQ ID NO :2、4或86的參考序列相比較,酮還原 酶多肽可另外地含有在其它氨基酸殘基位置的1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、 1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或約 1-40 個殘基差 異。在一些實施方式中,差異的數(shù)目可為在其它氨基酸殘基上的1、2、3、4、5、6、7、8、9、10、 11、12、14、15、16、18、20、22、24、26、30、35或約40個殘基差異。在一些實施方式中,差異包 含保守突變。在一些實施方式中,酮還原酶多肽包含與基于SEQ ID N0:2、4或86的、具有 以上特征的參考序列具有至少 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、 95 %、96 %、97 %、98 %或99 %的同一性的氨基酸序列,條件是所述酮還原酶含有具有至少 以上特征的氨基酸序列。在一些實施方式中,包含基于SEQ ID NO :83、84或87的序列式或其區(qū)域如殘基 90-211的氨基酸序列,具有相應于X94、X199和X202的殘基的不同組合的特定的特征的 改善的酮還原酶,可另外地含有一個或多個或至少所有如下的特征相應于X96的殘基為 極性、芳香族、非極性或脂肪族殘基,尤其為纈氨酸或苯丙氨酸;相應于X147的殘基為芳香 族、非極性或脂肪族殘基,尤其為蛋氨酸或亮氨酸;相應于X195的殘基為非極性或脂肪族 殘基,尤其為纈氨酸;并且相應于X196的殘基為非極性或脂肪族殘基,尤其為亮氨酸。在一些實施方式中,與參考序列SEQ ID NO :2、4或86相比,酮還原酶多肽可另外地含有在其 它氨基酸殘基位置上的 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、 1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或約 1-40 個殘基差異。在一些實施方式中, 差異的數(shù)目可為在其它氨基酸殘基上的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、 22、24、26、30、35或約40個殘基差異。在一些實施方式中,差異包含保守突變。在一些實 施方式中,酮還原酶多肽包含與基于SEQ ID NO :2、4或86的、具有以上特征的參考序列具 有至少 85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%^; 99 %的同一性的氨基酸序列,條件是所述酮還原酶含有具有至少以上特征的氨基酸序列。在一些實施方式中,包含基于SEQ ID NO :83、84或87的序列式或其區(qū)域如殘基 90-211的氨基酸序列,具有相應于如此所述的X94、X199和X202的殘基的不同組合的特定 的特征的改善的酮還原酶,進一步包括至少以下的另外的特征相應于X2的殘基為極性、 非極性或脂肪族殘基,尤其為丙氨酸。在一些實施方式中,與參考序列SEQ ID N0:2、4或86 相比,酮還原酶多肽可另外地含有在其它氨基酸殘基位置上的1-2、1-3、1-4、1-5、1-6、1-7、 1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或約 1-40個殘基差異。在一些實施方式中,差異的數(shù)目可為在其它氨基酸殘基上的1、2、3、4、5、 6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或約 40 個殘基差異。在一些實施方 式中,差異包含保守突變。在一些實施方式中,酮還原酶多肽包含與基于SEQ ID N0:2、4或 86的、具有以上特征的參考序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、 93%、94%、95%、96%、97%、98%或99%的同一性的氨基酸序列,條件是所述酮還原酶含 有具有至少以上特征的氨基酸序列。在一些實施方式中,包含基于SEQ ID NO :83、84或87的序列式或其區(qū)域如殘基 90-211的氨基酸序列,具有相應于如此所述的X94、X199和X202的殘基的不同組合的特 定的特征的改善的酮還原酶,進一步包括至少以下的另外的特征相應于X4的殘基為半胱 氨酸或堿性殘基,尤其為半胱氨酸。在一些實施方式中,與參考序列SEQ ID N0:2、4或86 相比,酮還原酶多肽可另外地含有在其它氨基酸殘基位置上的1-2、1-3、1-4、1-5、1-6、1-7、 1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或約 1-40個殘基差異。在一些實施方式中,差異的數(shù)目可為在其它氨基酸殘基上的殘基差異1、 2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或約 40 個。在一些實施方 式中,差異包含保守突變。在一些實施方式中,酮還原酶多肽包含與基于SEQ ID N0:2、4或 86的、具有以上特征的參考序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、 93%、94%、95%、96%、97%、98%或99%的同一性的氨基酸序列,條件是所述酮還原酶含 有具有至少以上特征的氨基酸序列。在一些實施方式中,包含基于SEQ ID NO :83、84或87的序列式或其區(qū)域如殘基 90-211,的氨基酸序列,具有相應于如此所述的X94、X199和X202的殘基的不同組合的特定 的特征的改善的酮還原酶,進一步包括至少以下的另外的特征相應于Xll的殘基為非極 性的、脂肪族、或芳香族殘基,尤其為苯丙氨酸。在一些實施方式中,與參考序列SEQ ID NO 2、4或86相比,酮還原酶多肽可另外地含有在其它氨基酸殘基位置上的1-2、1-3、1-4、1_5、 1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、 1-35或約1-40個殘基差異。在一些實施方式中,差異的數(shù)目可為在其它氨基酸殘基上的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或約 40 個殘基差異。在
一些實施方式中,差異包含保守突變。在一些實施方式中,酮還原酶多肽包含與基于SEQ ID NO :2、4或86的、具有以上特征的參考序列具有至少85%、86%、87%、88%、89%、90%、 91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性的氨基酸序列,條件是所述 酮還原酶含有具有至少以上特征的氨基酸序列。在一些實施方式中,包含基于SEQ ID NO :83、84或87的序列式或其區(qū)域如殘基 90-211的氨基酸序列,具有相應于如此所述的X94、X199和X202的殘基的不同組合的特定 的特征的改善的酮還原酶,進一步包括至少以下的另外的特征相應于X40的殘基為受限 或堿性殘基,尤其為精氨酸。在一些實施方式中,與參考序列SEQ ID N0:2、4或86相比, 酮還原酶多肽可另外地含有在其它氨基酸殘基位置上的1-2、1-3、1-4、1-5、1-6、1-7、1-8、 1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或約 1-40 個殘基差異。在一些實施方式中,差異的數(shù)目可為在其它氨基酸殘基上的1、2、3、4、5、6、7、 8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或約 40 個殘基差異。在一些實施方式中, 差異包含保守突變。在一些實施方式中,酮還原酶多肽包含與基于SEQ ID N0:2、4或86的、 具有以上特征的參考序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、 94%、95%、96%、97%、98%或99%的同一性的氨基酸序列,條件是所述酮還原酶含有具有 至少以上特征的氨基酸序列。在一些實施方式中,包含基于SEQ ID NO :83、84或87的序列式或其區(qū)域如殘基 90-211的氨基酸序列,具有相應于如此所述的X94、X199和X202的殘基的不同組合的特定 的特征的改善的酮還原酶,進一步包括至少以下的另外的特征相應于X80的殘基為非極 性、脂肪族或極性殘基,尤其為蘇氨酸。在一些實施方式中,與參考序列SEQ ID N0:2、4或 86相比,酮還原酶多肽可另外地含有在其它氨基酸殘基位置上的1-2、1-3、1-4、1-5、1-6、 1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或約1-40個殘基差異。在一些實施方式中,差異的數(shù)目可為在其它氨基酸殘基上的1、2、3、 4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或約 40 個殘基差異。在一些實 施方式中,差異包含保守突變。在一些實施方式中,酮還原酶多肽包含與基于SEQ ID NO
2、4或86的、具有以上特征的參考序列具有至少85%、86%、87%、88%、89%、90%、91%、 92%、93%、94%、95%、96%、97%、98%或99%的同一性的氨基酸序列,條件是所述酮還原 酶含有具有至少以上特征的氨基酸序列。在一些實施方式中,包含基于SEQ ID NO :83、84或87的序列式中或其區(qū)域如殘基 90-211的氨基酸序列,具有相應于如此所述的X94、X199和X202的殘基的不同組合的特定 的特征的改善的酮還原酶,進一步包括至少以下的另外的特征相應于X86的殘基為非極 性、脂肪族或極性殘基,尤其為異亮氨酸。在一些實施方式中,與參考序列SEQ ID N0:2、4或 86相比,酮還原酶多肽可另外地含有在其它氨基酸殘基位置上的1-2、1-3、1-4、1-5、1-6、 1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或約1-40個殘基差異。在一些實施方式中,差異的數(shù)目可為在其它氨基酸殘基上的1、2、3、 4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或約 40 個殘基差異。在一些實 施方式中,差異包含保守突變。在一些實施方式中,酮還原酶多肽包含與基于SEQ ID NO 2、4或86的、具有以上特征的參考序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性的氨基酸序列,條件是所述酮還原 酶含有具有至少以上特征的氨基酸序列。在一些實施方式中,包含基于SEQ ID NO :83、84或87的序列式或其區(qū)域如殘基 90-211的氨基酸序列,具有相應于如此所述的X94、X199和X202的殘基的不同組合的特 定的特征的改善的酮還原酶,進一步包括至少以下的另外的特征相應于X96的殘基為極 性、芳香族、非極性或脂肪族殘基,尤其為苯丙氨酸或纈氨酸。在一些實施方式中,與參考 序列SEQ IDNO :2、4或86相比,酮還原酶多肽可另外地含有在其它氨基酸殘基位置上的 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、 1-24、1-26、1-30、1-35或約1_40個殘基差異。在一些實施方式中,差異的數(shù)目可為在其它 氨基酸殘基上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或約 40 個殘基差異。在一些實施方式中,差異包含保守突變。在一些實施方式中,酮還原酶多肽 包含與基于SEQ ID N0:2、4或86的、具有以上特征的參考序列具有至少85%、86%、87%、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或 99% 的同一性的氨基酸 序列,條件是所述酮還原酶含有具有至少以上特征的氨基酸序列。在一些實施方式中,包含基于SEQ ID NO :83、84或87的序列式或其區(qū)域如殘基 90-211的氨基酸序列,具有相應于如此所述的X94、X199和X202的殘基的不同組合的特定 的特征的改善的酮還原酶,進一步包括至少以下的另外的特征相應于X105的殘基為非極 性的、脂肪族、堿性或酸性的殘基,尤其為甘氨酸。在一些實施方式中,與參考序列SEQ ID NO :2、4或86相比,酮還原酶多肽可另外地含有在其它氨基酸殘基位置上的1-2、1-3、1-4、 1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、 1-30、1-35或約1-40個殘基差異。在一些實施方式中,差異的數(shù)目可為在其它氨基酸殘基 上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或約 40 個殘基差 異。在一些實施方式中,差異包含保守突變。在一些實施方式中,酮還原酶多肽包含與基于 SEQ ID N0:2、4或86的、具有以上特征的參考序列具有至少85%、86%、87%、88%、89%、 90%、91%、92%、93%、94%、95%、96%、97%、98%或 99% 的同一性的氨基酸序列,條件是 所述酮還原酶含有具有至少以上特征的氨基酸序列。在一些實施方式中,包含基于SEQ ID NO :83、84或87的序列式或其區(qū)域如殘基 90-211的氨基酸序列,具有相應于如此所述的X94、X199和X202的殘基的不同組合的特定 的特征的改善的酮還原酶,進一步包括至少以下的另外的特征相應于X129的殘基為非極 性或極性殘基,尤其為蘇氨酸。在一些實施方式中,與參考序列SEQ ID N0:2、4或86相比, 酮還原酶多肽可另外地含有在其它氨基酸殘基位置上的1-2、1-3、1-4、1-5、1-6、1-7、1-8、 1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或約 1-40 個殘基差異。在一些實施方式中,差異的數(shù)目可為在其它氨基酸殘基上的1、2、3、4、5、6、7、 8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或約 40 個殘基差異。在一些實施方式中, 差異包含保守突變。在一些實施方式中,酮還原酶多肽包含與基于SEQ ID N0:2、4或86的、 具有以上特征的參考序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、 94%、95%、96%、97%、98%或99%的同一性的氨基酸序列,條件是所述酮還原酶含有具有 至少以上特征的氨基酸序列。在一些實施方式中,包含基于SEQ ID NO :83、84或87的序列式或其區(qū)域如殘基
3490-211的氨基酸序列,具有相應于如此所述的X94、X199和X202的殘基的不同組合的特定 的特征的改善的酮還原酶,進一步包括至少以下的另外的特征相應于X147的殘基為芳香 族、非極性或脂肪族殘基,尤其為蛋氨酸或亮氨酸。在一些實施方式中,與參考序列SEQ ID NO :2、4或86相比,酮還原酶多肽可另外地含有在其它氨基酸殘基位置上的1-2、1-3、1-4、 1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、 1-30、1-35或約1-40個殘基差異。在一些實施方式中,差異的數(shù)目可為在其它氨基酸殘基 上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或約 40 個殘基差 異。在一些實施方式中,差異包含保守突變。在一些實施方式中,酮還原酶多肽包含與基于 SEQ ID N0:2、4或86的、具有以上特征的參考序列具有至少85%、86%、87%、88%、89%、 90%、91%、92%、93%、94%、95%、96%、97%、98%或 99% 的同一性的氨基酸序列,條件是 所述酮還原酶含有具有至少以上特征的氨基酸序列。在一些實施方式中,包含基于SEQ ID NO :83、84或87的序列式或其區(qū)域如殘基 90-211的氨基酸序列,具有相應于如此所述的X94、X199和X202的殘基的不同組合的特 定的特征的改善的酮還原酶,進一步包括至少以下的另外的特征相應于X153的殘基為極 性、非極性或脂肪族殘基,尤其為丙氨酸或絲氨酸。在一些實施方式中,與參考序列SEQ ID NO :2、4或86相比,酮還原酶多肽可另外地含有在其它氨基酸殘基位置上的1-2、1-3、1-4、 1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、 1-30、1-35或約1-40個殘基差異。在一些實施方式中,差異的數(shù)目可為在其它氨基酸殘基 上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或約 40 個殘基差 異。在一些實施方式中,差異包含保守突變。在一些實施方式中,酮還原酶多肽包含與基于 SEQ ID NO :2、4或86的、具有以上特征的參考序列具有至少85%、86%、87%、88%、89%、 90%、91%、 92%、93%、94%、95%、96%、97%、98%或 99% 的同一性的氨基酸序列,條件是 所述酮還原酶含有具有至少以上特征的氨基酸序列。在一些實施方式中,包含基于SEQ ID NO :83、84或87的序列式或其區(qū)域如殘基 90-211的氨基酸序列,具有相應于如此所述的X94、X199和X202的殘基的不同組合的特定 的特征的改善的酮還原酶,進一步包括至少以下的另外的特征相應于X190的殘基為芳香 族或受限殘基,尤其為組氨酸或脯氨酸。在一些實施方式中,與參考序列SEQ ID N0:2、4或 86相比,酮還原酶多肽可另外地含有在其它氨基酸殘基位置上的1-2、1-3、1-4、1-5、1-6、 1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或約1-40個殘基差異。在一些實施方式中,差異的數(shù)目可為在其它氨基酸殘基上的1、2、3、 4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或約 40 個殘基差異。在一些實 施方式中,差異包含保守突變。在一些實施方式中,酮還原酶多肽包含與基于SEQ ID NO 2、4或86的、具有以上特征的參考序列具有至少85%、86%、87%、88%、89%、90%、91%、 92%、93%、94%、95%、96%、97%、98%或99%的同一性的氨基酸序列,條件是所述酮還原 酶含有具有至少以上特征的氨基酸序列。在一些實施方式中,包含基于SEQ ID NO :83、84或87的序列式或其區(qū)域如殘基 90-211的氨基酸序列,具有相應于如此所述的X94、X199和X202的殘基的不同組合的特 定的特征的改善的酮還原酶,進一步包括至少以下的另外的特征相應于X195的殘基為非 極性或脂肪族殘基,尤其為纈氨酸。在一些實施方式中,與參考序列SEQ ID N0:2、4或86相比,酮還原酶多肽可另外地含有在其它氨基酸殘基位置上的1-2、1-3、1-4、1-5、1-6、1-7、 1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或約 1-40個殘基差異。在一些實施方式中,差異的數(shù)目可為其它氨基酸殘基上的1、2、3、4、5、6、 7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或約 40 個殘基差異。在一些實施方式 中,差異包含保守突變。在一些實施方式中,酮還原酶多肽包含與基于SEQ ID N0:2、4或 86的、具有以上特征的參考序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、 93%、94%、95%、96%、97%、98%或99%的同一性的氨基酸序列,條件是所述酮還原酶含 有具有至少以上特征的氨基酸序列。在一些實施方式中,包含基于SEQ ID NO :83、84或87的序列式或其區(qū)域如殘基 90-211的氨基酸序列,具有相應于如此所述的X94、X199和X202的殘基的不同組合的特 定的特征的改善的酮還原酶,進一步包括至少以下的另外的特征相應于X196的殘基為非 極性或脂肪族殘基,尤其為亮氨酸。在一些實施方式中,與參考序列SEQ ID N0:2、4或86 相比,酮還原酶多肽可另外地含有在其它氨基酸殘基位置上的1-2、1-3、1-4、1-5、1-6、1-7、 1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或約 1-40個殘基差異。在一些實施方式中,差異的數(shù)目可為在其它氨基酸殘基上的1、2、3、4、5、 6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或約 40 個殘基差異。在一些實施方 式中,差異包含保守突變。在一些實施方式中,酮還原酶多肽包含與基于SEQ ID N0:2、4或 86的、具有以上特征的參考序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、 93%、94%、95%、96%、97%、98%或99%的同一性的氨基酸序列,條件是所述酮還原酶含 有具有至少以上特征的氨基酸序列。在一些實施方式中,包含基于SEQ ID NO :83、84或87的序列式或其區(qū)域如殘基 90-211的氨基酸序列,具有相應于如此所述的X94、X199和X202的殘基的不同組合的特定 的特征的改善的酮還原酶,進一步包括至少以下的另外的特征相應于X206的殘基為非極 性或芳香族殘基,尤其為苯丙氨酸。在一些實施方式中,與參考序列SEQ ID N0:2、4或86 相比,酮還原酶多肽可另外地含有在其它氨基酸殘基位置上的1-2、1-3、1-4、1-5、1-6、1-7、 1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或約 1-40個殘基差異。在一些實施方式中,差異的數(shù)目可為在其它氨基酸殘基上的1、2、3、4、5、 6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或約 40 個殘基差異。在一些實施方 式中,差異包含保守突變。在一些實施方式中,酮還原酶多肽包含與基于SEQ ID N0:2、4或 86的、具有以上特征的參考序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、 93 %、94 %、95 %、96 %、97 %、98 %或99 %的同一性的氨基酸序列,條件是所述酮還原酶含 有具有至少以上特征的氨基酸序列。在一些實施方式中,包含基于SEQ ID NO :83、84或87的序列式或其區(qū)域如殘基 90-211的氨基酸序列,具有相應于如此所述的X94、X199和X202的殘基的不同組合的特 定的特征的改善的酮還原酶,進一步包括至少以下的另外的特征相應于X226的殘基為非 極性或脂肪族殘基,尤其為纈氨酸。在一些實施方式中,與參考序列SEQ ID N0:2、4或86 相比,酮還原酶多肽可另外地含有在其它氨基酸殘基位置上的1-2、1-3、1-4、1-5、1-6、1-7、 1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或約 1-40個殘基差異。在一些實施方式中,差異的數(shù)目可為在其它氨基酸殘基上的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或約 40 個殘基差異。在一些實施方
式中,差異包含保守突變。在一些實施方式中,酮還原酶多肽包含與基于SEQ ID N0:2、4或 86的、具有以上特征的參考序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、 93%、94%、95%、96%、97%、98%或99%的同一性的氨基酸序列,條件是所述酮還原酶含 有具有至少以上特征的氨基酸序列。在一些實施方式中,包含基于SEQ ID NO :83、84或87的序列式或其區(qū)域如殘基 90-211的氨基酸序列,具有相應于如此所述的X94、X199和X202的殘基的不同組合的特 定的特征的改善的酮還原酶,進一步包括至少以下的另外的特征相應于X248為非極性或 堿性殘基,尤其為賴氨酸或精氨酸。在一些實施方式中,與參考序列SEQ ID N0:2、4或86 相比,酮還原酶多肽可另外地含有在其它氨基酸殘基位置上的1-2、1-3、1-4、1-5、1-6、1-7、 1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或約 1-40個殘基差異。在一些實施方式中,差異的數(shù)目可為在其它氨基酸殘基上的1、2、3、4、5、 6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或約 40 個殘基差異。在一些實施方 式中,差異包含保守突變。在一些實施方式中,酮還原酶多肽包含與基于SEQ ID N0:2、4或 86的、具有以上特征的參考序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、 93 %、94%、95%、96 %、97 %、98 %或99%的同一性的氨基酸序列,條件是所述酮還原酶含 有具有至少以上特征的氨基酸序列。在一些實施方式中,包含基于SEQ ID NO :83、84或87的序列式或其區(qū)域如殘基 90-211的氨基酸序列,具有相應于如此所述的X94、X199和X202的殘基的不同組合的特 定的特征的改善的酮還原酶,進一步包括至少以下的另外的特征相應于X249為芳香族殘 基,尤其為色氨酸。在一些實施方式中,與參考序列SEQ ID NO :2、4或86相比,酮還原酶 多肽可另外地含有在其它氨基酸殘基位置上的1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、 1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或約 1-40 個殘基差 異。在一些實施方式中,差異的數(shù)目可為在其它氨基酸殘基上的1、2、3、4、5、6、7、8、9、10、 11、12、14、15、16、18、20、22、24、26、30、35或約40個殘基差異。在一些實施方式中,差異包 含保守突變。在一些實施方式中,酮還原酶多肽包含與基于SEQ ID N0:2、4或86的、具有 以上特征的參考序列具有至少 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、 95 %、96 %、97 %、98 %或99 %的同一性的氨基酸序列,條件是所述酮還原酶含有具有至少 以上特征的氨基酸序列。在一些實施方式中,包含基于SEQ ID NO :83、84或87的序列式或其區(qū)域如殘基 90-211的氨基酸序列,具有相應于如此所述的X94、X199和X202的殘基的不同組合的特定 的特征的改善的酮還原酶,可含有另外地一個或多個或至少所有如下的特征相應于X40 的殘基為受限或堿性殘基,尤其為精氨酸;相應于X147的殘基為芳香族、非極性或脂肪族 殘基,尤其為蛋氨酸或亮氨酸。在一些實施方式中,酮還原酶多肽除以上特征外還可含有一 個或多個以下的特征相應于X96的殘基為極性、芳香族、非極性或脂肪族殘基,尤其為纈 氨酸;相應于X195的殘基為非極性或脂肪族殘基,尤其為纈氨酸;相應于X196的殘基為非 極性或脂肪族殘基,尤其為亮氨酸;相應于X226的殘基為非極性或脂肪族殘基,尤其為纈 氨酸;相應于X248為非極性或堿性殘基,尤其為精氨酸或賴氨酸;而且相應于X249為芳香 族殘基,尤其為色氨酸。在一些實施方式中,酮還原酶多肽除以上特征外還可含有一個或多個以下的特征相應于X2的殘基為極性、非極性或脂肪族殘基;相應于X4的殘基為堿性 殘基或半胱氨酸;相應于Xll的殘基為非極性的、脂肪族、或芳香族殘基;相應于X80的殘 基為非極性、脂肪族或極性殘基;相應于X86的殘基為非極性、脂肪族或極性殘基;相應于 X105的殘基為非極性的、脂肪族、堿性或酸性的殘基;相應于X129的殘基為非極性或極性 殘基;相應于X153的殘基為極性、非極性或脂肪族殘基;相應于X190的殘基為芳香族或受 限殘基;以及相應于X206的殘基為非極性或芳香族殘基。如技術(shù)人員理解的,前述的特征 的不同組合可用于形成本公開中酮還原酶。在一些實施方式中,包含基于SEQ ID NO :83、84或87的序列式或其區(qū)域如殘基 90-211的氨基酸序列,具有相應于如此所述的X202的殘基(也就是,纈氨酸或亮氨酸)的 特定的特征的改善的酮還原酶,進一步包括至少以下的另外的特征相應于X153的殘基為 極性、非極性或脂肪族殘基,尤其為丙氨酸或絲氨酸。在一些實施方式中,與具有以上特征 的參考序列SEQ ID NO :2、4或86相比,酮還原酶多肽可另外地含有在其它氨基酸殘基位 置的 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、 1-22、1-24、1-26、1-30、1-35 或約 1-40 個殘基差異(例如,SEQ ID NO :46、52 或 54)。在一 些實施方式中,差異的數(shù)目可為在其它氨基酸殘基上的1、2、3、4、5、6、7、8、9、10、11、12、14、 15、16、18、20、22、24、26、30、35或約40個殘基差異。在一些實施方式中,酮還原酶多肽包含 與基于SEQ ID NO :2、4或86的、具有以上特征的參考序列具有至少85%、86%、87%、88%、 89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或 99% 同一性的氨基酸序列(例 如,SEQID NO :46、52或54),條件是所述酮還原酶含有具有至少以上特征的氨基酸序列。在一些實施方式中,包含基于SEQ ID NO :83、84或87的序列式或其區(qū)域如殘基 90-211的氨基酸序列,具有相應于如此所述的X202的殘基的特定的特征的改善的酮還原 酶,進一步包括至少以下的另外的特征相應于X147的殘基為芳香族、非極性或脂肪族殘 基,尤其為蛋氨酸。在一些實施方式中,與具有以上特征的參考序列SEQ ID N0:2、4或86相 比,酮還原酶多肽可另外地含有在其它氨基酸殘基位置的1-2、1-3、1-4、1-5、1-6、1-7、1-8、 1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或約 1-40 個殘基差異(例如,SEQ ID N0:44)。在一些實施方式中,差異的數(shù)目可為在其它氨基酸殘 基上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或約40 個殘基差 異。在一些實施方式中,酮還原酶多肽包含與基于SEQ IDNO :2、4或86的、具有以上特征的 參考序列具有至少 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、 97%、98%或99%同一性的氨基酸序列(例如,SEQ ID NO :44),條件是所述酮還原酶含有 具有至少以上特征的氨基酸序列。在一些實施方式中,包含基于SEQ ID NO :83、84或87的序列式或其區(qū)域如殘基 90-211的氨基酸序列,具有相應于如此所述的X202的殘基的特定的特征的改善的酮還原 酶,進一步包括至少以下的另外的特征相應于X80的殘基為非極性、脂肪族或極性殘基, 尤其為蘇氨酸;并且相應于X153的殘基為極性、非極性或脂肪族殘基,尤其為丙氨酸或絲 氨酸。在一些實施方式中,與具有以上特征的參考序列SEQ ID N0:2、4或86相比,酮還原 酶多肽可另外地含有在其它氨基酸殘基位置的1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、 1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或約 1-40 個殘基差 異(例如,SEQ ID N0:18)。在一些實施方式中,差異的數(shù)目可為在其它氨基酸殘基上的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或約 40 個殘基差異。在一
些實施方式中,酮還原酶多肽包含與基于SEQID NO :2、4或86的、具有以上特征的參考序列 具有至少 85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98% 或99%同一性的氨基酸序列(例如,SEQ ID NO: 18),條件是所述酮還原酶含有具有至少以 上特征的氨基酸序列。在一些實施方式中,包含基于SEQ ID NO :83、84或87的序列式或其區(qū)域如殘基 90-211的氨基酸序列,具有相應于如此所述的X94和X202的殘基的特定的特征的改善的酮 還原酶,進一步包括至少以下的另外的特征相應于X96的殘基為極性、芳香族、非極性或 脂肪族殘基,尤其為苯丙氨酸。在一些實施方式中,與具有以上特征的參考序列SEQ ID NO 2、4或86相比,酮還原酶多肽可另外地含有在其它氨基酸殘基位置的1-2、1-3、1-4、1_5、 1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、 1-35或約1-40個殘基差異(例如,SEQ IDN0:16)。在一些實施方式中,差異的數(shù)目可為在 其它氨基酸殘基上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或 約40個殘基差異。在一些實施方式中,酮還原酶多肽包含與基于SEQ ID N0:2、4或86的、 具有以上特征的參考序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、 94%、95%、96%、97%、98%或99%同一性的氨基酸序列(例如,SEQ ID N0:16),條件是所 述酮還原酶含有具有至少以上特征的氨基酸序列。在一些實施方式中,包含基于SEQ ID NO :83、84或87的序列式或其區(qū)域如殘基 90-211的氨基酸序列,具有相應于如此所述的X199和X202的殘基的特定的特征的改善的 酮還原酶,進一步包括至少以下的另外的特征相應于X153的殘基為極性、非極性或脂肪 族殘基,尤其為丙氨酸或絲氨酸。在一些實施方式中,與具有以上特征的參考序列SEQ ID NO :2、4或86相比,酮還原酶多肽可另外地含有在其它氨基酸殘基位置的1-2、1-3、1-4、 1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、 1-30、1-35或約1-40個殘基差異(例如,SEQ IDNO :42、50、56)。在一些實施方式中,差異的 數(shù)目可為在其它氨基酸殘基上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、 26、30、35或約40個殘基差異。在一些實施方式中,酮還原酶多肽包含與基于SEQ ID NO: 2、4或86的、具有以上特征的參考序列具有至少85%、86%、87%、88%、89%、90%、91%、 92%、93%、94%、95%、96%、97%、98% 或 99% 同一性的氨基酸序列(例如,SEQ ID NO: 42,50,56),條件是所述酮還原酶含有具有至少以上特征的氨基酸序列。在一些實施方式中,包含基于SEQ ID NO :83、84或87的序列式或其區(qū)域如殘基 90-211的氨基酸序列,具有相應于如此所述的X94、X199和X202的殘基的特定的特征的改 善的酮還原酶,進一步包括至少以下的另外的特征相應于X40的殘基為受限或堿性殘基, 尤其為精氨酸。在一些實施方式中,與具有以上特征的參考序列SEQ ID N0:2、4或86相 比,酮還原酶多肽可另外地含有在其它氨基酸殘基位置的1-2、1-3、1-4、1-5、1-6、1-7、1-8、 1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或約 1-40 個殘基差異(例如,SEQ ID N0:12)。在一些實施方式中,差異的數(shù)目可為在其它氨基酸殘 基上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或約40 個殘基差 異。在一些實施方式中,酮還原酶多肽包含與基于SEQ IDNO :2、4或86的、具有以上特征的 參考序列具有至少 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的氨基酸序列(例如,SEQ ID NO 12),條件是所述酮還原酶含有 具有至少以上特征的氨基酸序列。在一些實施方式中,包含基于SEQ ID NO :83、84或87的序列式或其區(qū)域如殘基 90-211的氨基酸序列,具有相應于如此所述的X94、X199和X202的殘基的特定的特征的改 善的酮還原酶,進一步包括至少以下的另外的特征相應于X147的殘基為芳香族、非極性 或脂肪族殘基,尤其為蛋氨酸或亮氨酸。在一些實施方式中,與具有以上特征的參考序列 SEQ IDNO :2、4或86相比,酮還原酶多肽可另外地含有在其它氨基酸殘基位置的1_2、1_3、 1-4、1-5、1-6、1-7、1-8、1-9、1-10U-11、1-12U-14、1-15U-16、1-18U_20、1-22、1-24、 1-26、1-30、1-35或約1-40個殘基差異(例如,SEQ ID NO :6)。在一些實施方式中,差異的 數(shù)目可為在其它氨基酸殘基上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、 26、30、35或約40個殘基差異。在一些實施方式中,酮還原酶多肽包含與基于SEQ ID NO: 2、4或86的、具有以上特征的參考序列具有至少85%、86%、87%、88%、89%、90%、91%、 92%、93%、94%、95%、96%、97%、98% 或 99% 同一性的氨基酸序列(例如,SEQ ID NO: 6),條件是所述酮還原酶含有具有至少以上特征的氨基酸序列。在一些實施方式中,包含基于SEQ ID NO :83、84或87的序列式或其區(qū)域如殘基 90-211的氨基酸序列,具有相應于如此所述的X94、X199和X202的殘基的特定的特征的改 善的酮還原酶,進一步包括至少以下的另外的特征相應于X153的殘基為極性、非極性或 脂肪族殘基,尤其為丙氨酸或絲氨酸。在一些實施方式中,與具有以上特征的參考序列SEQ IDNO :2、4或86相比,酮還原酶多肽可另外地含有在其它氨基酸殘基位置的1_2、1_3、1_4、 1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、 1-30、1-35或約1-40個殘基差異(例如,SEQ ID NO 34或36)。在一些實施方式中,差異的 數(shù)目可為在其它氨基酸殘基上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、 26、30、35或約40個殘基差異。在一些實施方式中,酮還原酶多肽包含與基于SEQ ID NO 2、4或86的、具有以上特征的參考序列具有至少85 %、86%、87%、88 %、89%、90 %、91 %、 92%、93%、94%、95%、96%、97%、98%或 99% 同一性的氨基酸序列(例如,SEQ IDNO 34 或36),條件是所述酮還原酶含有具有至少以上特征的氨基酸序列。在一些實施方式中,包含基于SEQ ID NO :83、84或87的序列式或其區(qū)域如殘基 90-211的氨基酸序列,具有相應于如此所述的X94、X199和X202的殘基的特定的特征的 改善的酮還原酶,進一步包括至少以下的另外的特征相應于X40的殘基為受限或堿性殘 基,尤其為精氨酸;相應于X147的殘基為芳香族、非極性或脂肪族殘基,尤其為蛋氨酸或亮 氨酸。在一些實施方式中,與具有以上特征的參考序列SEQ ID N0:2、4或86相比,酮還原 酶多肽可另外地含有在其它氨基酸殘基位置的1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、 1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或約 1-40 個殘基差 異(例如,SEQ ID N0:10)。在一些實施方式中,差異的數(shù)目可為在其它氨基酸殘基上的1、 2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或約 40 個殘基差異。在一 些實施方式中,酮還原酶多肽包含與基于SEQID NO :2、4或86的、具有以上特征的參考序列 具有至少 85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98% 或99%同一性的氨基酸序列(例如,SEQ ID NO: 10),條件是所述酮還原酶含有具有至少以 上特征的氨基酸序列。
在一些實施方式中,包含基于SEQ ID NO :83、84或87的序列式或其區(qū)域如殘基 90-211的氨基酸序列,具有相應于如此所述的X94、X199和X202的殘基的特定的特征的改 善的酮還原酶,進一步包括至少以下的另外的特征相應于X105的殘基為非極性的、脂肪 族、堿性或酸性的殘基,尤其為甘氨酸;相應于X153的殘基為極性、非極性或脂肪族殘基, 尤其為丙氨酸;以及相應于X206的殘基為非極性或芳香族殘基,尤其為苯丙氨酸。在一些 實施方式中,與具有以上特征的參考序列SEQ ID NO :2、4或86相比,酮還原酶多肽可另外 地含有在其它氨基酸殘基位置的 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、 1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或約 1-40 個殘基差異(例如,SEQ IDNO :38)。在一些實施方式中,差異的數(shù)目可為在其它氨基酸殘基上的1、2、3、4、5、6、7、8、 9、10、11、12、14、15、16、18、20、22、24、26、30、35或約40個殘基差異。在一些實施方式中,酮 還原酶多肽包含與基于SEQ ID NO :2、4或86的、具有以上特征的參考序列具有至少85%、 86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%^; 99% 同一性 的氨基酸序列(例如,SEQ ID NO :38),條件是所述酮還原酶含有具有至少以上特征的氨基 酸序列。在一些實施方式中,包含基于SEQ ID NO :83、84或87的序列式或其區(qū)域如殘基 90-211的氨基酸序列,具有相應于如此所述的X94、X199和X202的殘基的特定的特征的改 善的酮還原酶,進一步包括至少以下的另外的特征相應于X96的殘基為極性、芳香族、非 極性或脂肪族殘基,尤其為絲氨酸、纈氨酸或苯丙氨酸;相應于X129的殘基為非極性或極 性殘基,尤其為蘇氨酸;以及相應于X206的殘基為非極性或芳香族殘基,尤其為苯丙氨酸。 在一些實施方式中,與具有以上特征的參考序列SEQ ID NO :2、4或86相比,酮還原酶多肽 可另外地含有在其它氨基酸殘基位置的1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、 1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或約 1-40 個殘基差異(例 如,SEQ ID N0:40)。在一些實施方式中,差異的數(shù)目可為在其它氨基酸殘基上的1、2、3、 4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或約 40 個殘基差異。在一些實 施方式中,酮還原酶多肽包含與基于SEQ ID NO :2、4或86的、具有以上特征的參考序列具 有至少 85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%^; 99%同一性的氨基酸序列(例如,SEQ ID NO :40),條件是所述酮還原酶含有具有至少以上 特征的氨基酸序列。在一些實施方式中,本公開的改善的酮還原酶包含具有相應于SEQ IDN0:83、84 或87的序列式中的殘基90-211的區(qū)域或結(jié)構(gòu)域的氨基酸序列,其中相應于X202的殘基 為纈氨酸或亮氨酸。在一些實施方式中,與基于SEQ ID NO :2、4或86的參考序列的相應 的結(jié)構(gòu)域相比,相應于殘基90-211的區(qū)域或結(jié)構(gòu)域可另外地含有在其它氨基酸殘基位置 上的 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18 或 1-20 個殘基差異。在一些實施方式中,差異的數(shù)目可為1、2、3、4、5、6、7、8、9、10、11、12、14、15、 16、18或約20個殘基差異。在一些實施方式中,差異包含保守突變。在一些實施方式中, 酮還原酶多肽包含具有與相應于基于SEQ ID N0:2、4或86的在X202的殘基上具有以上特 征的參考序列的殘基90-211的結(jié)構(gòu)域或區(qū)域具有至少85%、86%、87%、88%、89%、90%、 91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性的結(jié)構(gòu)域或區(qū)域的氨基酸序 列(例如,SEQ ID NO :40),條件是所述酮還原酶的結(jié)構(gòu)域或區(qū)域包含具有至少以上特征的氨基酸序列。在一些實施方式中,本公開的改善的酮還原酶包含相應于SEQ IDNO :83、84或87 的序列式中的殘基90-211的區(qū)域或結(jié)構(gòu)域的氨基酸序列,其中的區(qū)域或結(jié)構(gòu)域具有以下 特征相應于X94的殘基為脂肪族或極性殘基,尤其為丙氨酸或蘇氨酸;并且相應于X202 的殘基為纈氨酸或亮氨酸。在一些實施方式中,酮還原酶具有相應于X94的殘基為極性殘 基并且相應于X202的殘基為纈氨酸或亮氨酸的氨基酸序列。在一些實施方式中,酮還原酶 具有相應于X94的殘基為蘇氨酸并且相應于X202的殘基為纈氨酸或亮氨酸的氨基酸序列。 在一些實施方式中,與基于SEQ ID NO :2、4或86的參考序列的相應的結(jié)構(gòu)域相比,相應于 殘基90-211的區(qū)域或結(jié)構(gòu)域可另外地含有在其它氨基酸殘基位置上的1-2、1-3、1-4、1-5、 1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18 或 1-20 個殘基差異。在一些實 施方式中,差異的數(shù)目可為1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18或約20個殘基差 異。在一些實施方式中,差異包含保守突變。在一些實施方式中,酮還原酶多肽包含具有與 相應于基于SEQ ID NO :2、4或86的具有以上特征的參考序列的殘基90-211的結(jié)構(gòu)域或 區(qū)域具有至少 85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%, 98%或99%的同一性的結(jié)構(gòu)域或區(qū)域的氨基酸序列(例如,SEQ ID NO :40),條件是所述酮 還原酶的結(jié)構(gòu)域或區(qū)域包含具有至少以上特征的氨基酸序列。在一些實施方式中,本公開的改善的酮還原酶包含相應于SEQ IDNO :83、84或87 的序列式中的殘基90-211的區(qū)域或結(jié)構(gòu)域的氨基酸序列,其具有以下特征相應于X94的 殘基為脂肪族或極性殘基,尤其為丙氨酸或蘇氨酸;相應于X199的殘基為脂肪族、受限或 極性殘基,尤其為丙氨酸、天冬酰胺或組氨酸;以及相應于X202的殘基為纈氨酸或亮氨酸。 在一些實施方式中,相應于X94的殘基為極性殘基;相應于X199的殘基為脂肪族、受限或 極性殘基;以及相應于X202的殘基為纈氨酸或亮氨酸。在一些實施方式中,酮還原酶具有 其中相應于X94的殘基為蘇氨酸;相應于X199的殘基為丙氨酸、天冬酰胺或組氨酸;以及 相應于X202的殘基為纈氨酸或亮氨酸的氨基酸序列。在一些實施方式中,與基于SEQ ID NO :2、4或86的參考序列的相應的結(jié)構(gòu)域相比,相應于殘基90-211的區(qū)域或結(jié)構(gòu)域可另外 地含有在其它氨基酸殘基位置上的 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、 1-14、1-15、1-16、1-18或1-20個殘基差異。在一些實施方式中,差異的數(shù)目可為1、2、3、4、 5、6、7、8、9、10、11、12、14、15、16、18或約20個殘基差異。在一些實施方式中,差異包含保守 突變。在一些實施方式中,酮還原酶多肽包含具有與相應于基于SEQ ID N0:2、4或86的、 具有以上特征的參考序列的殘基90-211的結(jié)構(gòu)域或區(qū)域具有至少85%、86%、87%、88%、 89%、90%、91%、92%、93%、94%、95%、96%、97%、98% 或 99% 的同一性的結(jié)構(gòu)域或區(qū) 域的氨基酸序列,條件是所述酮還原酶的結(jié)構(gòu)域或區(qū)域包含具有至少以上特征的氨基酸序 列。在一些實施方式中,包含相應于SEQ ID NO :83、84或87的序列式中的殘基90-211 的結(jié)構(gòu)域或區(qū)域,并具有如此所述的相應于殘基X94、X199和X202的各種殘基組合的特定 的特征的酮還原酶多肽,可在結(jié)構(gòu)域或區(qū)域中進一步包括選自以下的一個或多個特征相 應于X96的殘基為極性、芳香族、非極性或脂肪族殘基;相應于X105的殘基為非極性、脂肪 族、堿性或酸性殘基;相應于X129的殘基為非極性或極性殘基;相應于X147的殘基為芳香 族、非極性或脂肪族殘基;相應于X153的殘基為極性、非極性或脂肪族殘基;相應于X190的殘基為芳香族或受限殘基;相應于X195的殘基為非極性或脂肪族殘基;相應于X196的 殘基為非極性或脂肪族殘基;以及相應于X206的殘基為非極性或芳香族殘基。在一些實施 方式中,與基于SEQ ID NO :2、4或86的參考序列的相應的結(jié)構(gòu)域相比,相應于殘基90-211 的區(qū)域或結(jié)構(gòu)域可另外地含有在未被以上X標明的其它氨基酸殘基位置的約1-2、1-3、 1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18 或 1-20 個殘基差異。 在一些實施方式中,差異的數(shù)目可為在結(jié)構(gòu)域內(nèi)的其它氨基酸殘基上的1、2、3、4、5、6、7、8、 9、10、11、12、14、15、16、18或約20個殘基差異。在一些實施方式中,差異包含保守突變。在一些實施方式中,包含具有如上所述的相應于SEQ ID NO :83、84或87的序列式 中的殘基90-211的結(jié)構(gòu)域或區(qū)域的酮還原酶多肽,可具有與SEQ ID NO :2、4或86的相應 結(jié)構(gòu)域的氨基酸序列相比在結(jié)構(gòu)域或區(qū)域中的一個或多個保守突變。所述保守突變的例子 包括氨基酸置換例如但是不局限于將相應于X145的殘基谷氨酸(E)置換為另一個酸性殘 基,例如,天冬氨酸;將相應于X153的殘基亮氨酸(L)置換為另一個脂肪族殘基,例如,丙氨 酸;將相應于X195的殘基亮氨酸(L)的殘基置換為另一個脂肪族殘基,例如,纈氨酸;以及 將相應于X196的殘基置換為另一個脂肪族殘基,例如,亮氨酸。在一些實施方式中,包含相應于SEQ ID NO :83、84或87的序列式中的殘基90-211 的結(jié)構(gòu)域或區(qū)域,并具有如此所述的相應于殘基X94、X199和X202的各種殘基組合的特定 的特征的酮還原酶多肽,可在結(jié)構(gòu)域或區(qū)域中進一步包括選自以下的一個或多個特征相 應于X96的殘基為絲氨酸、蘇氨酸、谷氨酰胺、天冬酰胺、甘氨酸、蛋氨酸、丙氨酸、纈氨酸、 亮氨酸、異亮氨酸、酪氨酸、苯丙氨酸或色氨酸,尤其為天冬酰胺、絲氨酸、纈氨酸或苯丙氨 酸;相應于X105的殘基為甘氨酸、蛋氨酸、丙氨酸、纈氨酸、亮氨酸、異亮氨酸、精氨酸、賴氨 酸、天冬氨酸或谷氨酸,尤其為谷氨酸、賴氨酸、丙氨酸或甘氨酸;相應于X129的殘基為甘 氨酸、蛋氨酸、丙氨酸、纈氨酸、亮氨酸、異亮氨酸、絲氨酸、蘇氨酸、谷氨酰胺或天冬酰胺,尤 其為蛋氨酸或蘇氨酸;相應于X147的殘基為酪氨酸、苯丙氨酸、色氨酸、甘氨酸、蛋氨酸、丙 氨酸、纈氨酸、亮氨酸或異亮氨酸,尤其為苯丙氨酸、蛋氨酸或亮氨酸;相應于X153的殘基 為絲氨酸、蘇氨酸、谷氨酰胺、天冬酰胺、甘氨酸、蛋氨酸、丙氨酸、纈氨酸、亮氨酸或異亮氨 酸,尤其為亮氨酸、丙氨酸或絲氨酸;相應于X190的殘基為酪氨酸、苯丙氨酸、色氨酸、組氨 酸或脯氨酸,尤其為酪氨酸、組氨酸或脯氨酸;相應于X195的殘基為甘氨酸、蛋氨酸、丙氨 酸、纈氨酸、亮氨酸或異亮氨酸,尤其為亮氨酸或纈氨酸;相應于X196的殘基為甘氨酸、蛋 氨酸、丙氨酸、纈氨酸、亮氨酸或異亮氨酸,尤其為亮氨酸;相應于X206的殘基為甘氨酸、蛋 氨酸、丙氨酸、纈氨酸、亮氨酸、異亮氨酸、酪氨酸、苯丙氨酸或色氨酸,尤其為蛋氨酸或苯丙 氨酸。在一些實施方式中,與基于SEQ ID NO :2、4或86的參考序列的相應的結(jié)構(gòu)域相比,相 應于殘基90-211的區(qū)域或結(jié)構(gòu)域可另外地含有在未被以上X標明的其它氨基酸殘基位置 的約 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18 或 1-20 個殘基差異。在一些實施方式中,差異的數(shù)目可為在結(jié)構(gòu)域內(nèi)的其它氨基酸殘基上的1、2、 3、4、5、6、7、8、9、10、11、12、14、15、16、18或約20個殘基差異。在一些實施方式中,差異包含 保守突變。在一些實施方式中,包含相應于SEQ ID NO :83、84或87的序列式中的殘基90-211 的結(jié)構(gòu)域或區(qū)域,并具有如此所述的相應于殘基X94、X199和X202的各種殘基組合的特定 的特征的酮還原酶多肽,可在結(jié)構(gòu)域或區(qū)域中進一步包括以下特征相應于X147的殘基為芳香族、非極性或脂肪族殘基,尤其為蛋氨酸或亮氨酸。在一些實施方式中,與基于SEQ ID N0:2、4或86的參考序列的相應的結(jié)構(gòu)域相比,相應于殘基90-211的區(qū)域或結(jié)構(gòu)域可另 外地含有在其它氨基酸殘基位置上的約1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、 1-12、1-14、1-15、1-16、1-18或1-20個殘基差異。在一些實施方式中,差異的數(shù)目可為1、 2、3、4、5、6、7、8、9、10、11、12、14、15、16、18或約20個殘基差異。在一些實施方式中,差異包 含保守突變。在一些實施方式中,酮還原酶多肽包含具有與相應于基于SEQ ID N0:2、4或 86的具有以上特征的參考序列的殘基90-211的結(jié)構(gòu)域或區(qū)域具有至少85%、86%、87%、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或 99% 的同一性的結(jié)構(gòu)域 或區(qū)域的氨基酸序列,條件是所述酮還原酶的結(jié)構(gòu)域或區(qū)域包含具有至少以上特征的氨基 酸序列。在一些實施方式中,包含相應于SEQ ID NO :83、84或87的序列式中的殘基90-211 的結(jié)構(gòu)域或區(qū)域,并具有如此所述的相應于殘基X94、X199和X202的各種殘基組合的特定 的特征的酮還原酶多肽,可在結(jié)構(gòu)域或區(qū)域中進一步包括以下特征相應于X96的殘基為 極性、芳香族、非極性或脂肪族殘基,尤其為纈氨酸或苯丙氨酸;并且相應于X147的殘基為 芳香族、非極性或脂肪族殘基,尤其為蛋氨酸或亮氨酸。在一些實施方式中,與基于SEQ ID N0:2、4或86的參考序列的相應的結(jié)構(gòu)域相比,相應于殘基90-211的區(qū)域或結(jié)構(gòu)域可另 外地含在其它氨基酸殘基位置上的 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、 1-14、1-15、1-16、1-18或1-20個殘基差異。在一些實施方式中,差異的數(shù)目可為1、2、3、4、 5、6、7、8、9、10、11、12、14、15、16、18或約20個殘基差異。在一些實施方式中,差異包含保守 突變。在一些實施方式中,酮還原酶多肽包含具有與相應于基于SEQ ID NO :2、4或86的、 具有以上特征的參考序列的殘基90-211的結(jié)構(gòu)域或區(qū)域具有至少85%、86%、87%、88%、 89%、90%、91%、92%、93%、94%、95%、96%、97%、98% 或 99% 的同一性的結(jié)構(gòu)域或區(qū) 域的氨基酸序列,條件是所述酮還原酶的結(jié)構(gòu)域或區(qū)域包含至少具有以上特征的氨基酸序 列。在一些實施方式中,酮還原酶多肽可進一步包含相應于SEQ IDNO :83、84或87的 序列式中的殘基1-89的結(jié)構(gòu)域或區(qū)域,其中所述結(jié)構(gòu)域或區(qū)域可具有以下特征中的一個 或多個相應于X2的殘基為極性、非極性或脂肪族殘基;相應于X4的殘基為堿性殘基或半 胱氨酸;相應于Xll的殘基為非極性、脂肪族、或芳香族殘基;相應于X40的殘基為受限或 堿性殘基;相應于X80的殘基為非極性、脂肪族或極性殘基;并且相應于X86的殘基為非極 性、脂肪族或極性殘基。在一些實施方式中,包含相應于SEQ ID N0:83、84或87的序列式 的殘基1-89的區(qū)域或結(jié)構(gòu)域的多肽可另外地具有與參考序列SEQ ID N0:2、4或86相比較 在未用以上X標明的殘基位置上的一個或多個殘基差異。在一些實施方式中,與參考序列 SEQ ID NO :2、4或86相比,差異可為在未被以上X標明的其它氨基酸殘基位置的1-2、1-3、 1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15 或 1-16 個殘基差異。在一些實施 方式中,差異的數(shù)目可為在其它氨基酸殘基位置上的1、2、3、4、5、6、7、8、9、10、11、12、14、15 或16個殘基差異。在一些實施方式中,差異包含保守突變。在一些實施方式中,酮還原酶多肽可進一步包含相應于SEQ IDNO :83、84或87的 序列式中的殘基1-89的結(jié)構(gòu)域或區(qū)域,其中所述結(jié)構(gòu)域或區(qū)域可具有以下特征中的一個 或多個相應于X2的殘基為絲氨酸、蘇氨酸、谷氨酰胺或天冬酰胺、甘氨酸、蛋氨酸、丙氨酸、纈氨酸、亮氨酸或異亮氨酸,尤其為絲氨酸、蘇氨酸或丙氨酸;相應于X4的殘基為精氨 酸或賴氨酸或半胱氨酸,尤其為精氨酸或半胱氨酸;相應于Xll的殘基為甘氨酸、蛋氨酸、 丙氨酸、纈氨酸、亮氨酸、異亮氨酸、酪氨酸、苯丙氨酸或色氨酸,尤其為異亮氨酸、亮氨酸或 苯丙氨酸;相應于X40的殘基為脯氨酸、組氨酸、精氨酸或賴氨酸,尤其為組氨酸或精氨酸; 相應于X80的殘基為甘氨酸、蛋氨酸、丙氨酸、纈氨酸、亮氨酸、異亮氨酸、絲氨酸、蘇氨酸、 谷氨酰胺或天冬酰胺,尤其為丙氨酸或蘇氨酸;并且相應于X86的殘基為絲氨酸、蘇氨酸、 谷氨酰胺、天冬酰胺、甘氨酸、蛋氨酸、丙氨酸、纈氨酸、亮氨酸或異亮氨酸,尤其為蘇氨酸或 異亮氨酸。在一些實施方式中,包含相應于SEQ ID NO :83、84或87的序列式的殘基1_89 的區(qū)域或結(jié)構(gòu)域的多肽可另外地具有與參考序列SEQ ID NO :2、4或86相比較在未用以上X 標明的殘基位置上的一個或多個殘基差異。在一些實施方式中,與參考序列SEQ ID NO :2、 4或86相比,差異可為在未被以上X標明的其它氨基酸殘基位置的1-2、1-3、1-4、1-5、1-6、 1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15或1-16個殘基差異。在一些實施方式中,差異的 數(shù)目可為在其它氨基酸殘基位置上的1、2、3、4、5、6、7、8、9、10、11、12、14、15或16個殘基差 異。在一些實施方式中,差異包含保守突變。在一些實施方式中,酮還原酶多肽可進一步包含相應于SEQ IDNO :83、84或87的 序列式中的殘基1-89的結(jié)構(gòu)域或區(qū)域,其中所述結(jié)構(gòu)域或區(qū)域可具有至少以下特征相應 于X40的殘基為受限或堿性殘基,尤其為精氨酸。在一些實施方式中,包含相應于SEQ ID NO :111、112或139的序列式的殘基1_89的區(qū)域或結(jié)構(gòu)域的多肽可另外地具有與參考序列 SEQ ID NO :2、4或114相比較在其它殘基位置上的一個或多個殘基差異。在一些實施方式 中,與基于SEQ ID NO :2、4或86的參考序列的相應區(qū)域或結(jié)構(gòu)域相比,相應于殘基1-89 的區(qū)域或結(jié)構(gòu)域可另外地含有在其它氨基酸殘基位置的1-2、1-3、1-4、1-5、1-6、1-7、1-8、 1-9、1-10、1-11、1-12、1-14、1-15或1-16個殘基差異。在一些實施方式中,差異的數(shù)目可 為在結(jié)構(gòu)域中其它氨基酸殘基的1、2、3、4、5、6、7、8、9、10、11、12、14、15或16個殘基差異。 在一些實施方式中,差異包含保守突變。在一些實施方式中,酮還原酶區(qū)域或結(jié)構(gòu)域包含具 有至少以上特征的氨基酸序列,并且其中所述氨基酸序列與相應于基于SEQ ID N0:2、4或 86的具有以上特征的參考序列的殘基1-89的氨基酸序列具有至少85 %、86 %、87 %、88 %、 89%,90%,91%,92%,93%,94%,95%,96%,97%,98%^; 99%的同一性。在一些實施方式中,酮還原酶多肽可進一步包含相應于SEQ IDNO :83、84或87的 序列式中的殘基212-252的結(jié)構(gòu)域或區(qū)域,其中結(jié)構(gòu)域或區(qū)域可具有以下特征中的一個或 多個相應于X226的殘基為非極性或脂肪族殘基;相應于X248為非極性或堿性殘基;并且 相應于X249為芳香族殘基。在一些實施方式中,包含相應于SEQ ID NO :83、84或87的序 列式的殘基212-252的區(qū)域或結(jié)構(gòu)域的多肽可另外地具有與參考序列SEQ IDNO :2、4或86 相比較在未用以上X標明的殘基位置上一個或多個殘基差異。在一些實施方式中,與參考 序列SEQ ID NO :2、4或86相比,差異可為在未被以上X標明的其它氨基酸殘基位置的1-2、 1-3、1-4、1-5、1-6、1-7、1-8、1-9或1-10個殘基差異。在一些實施方式中,差異的數(shù)目可為 在其它氨基酸殘基位置的1、2、3、4、5、6、7、8、9或10個殘基差異。在一些實施方式中,差異 包含保守突變。在一些實施方式中,酮還原酶多肽可進一步包含相應于SEQ IDNO :83、84或87的 序列式中殘基212-252的結(jié)構(gòu)域或區(qū)域,其中所述結(jié)構(gòu)域或區(qū)域可具有以下特征中的一個或多個相應于X226的殘基為甘氨酸、蛋氨酸、丙氨酸、纈氨酸、亮氨酸或異亮氨酸,尤其為 纈氨酸;相應于X248的殘基為甘氨酸、蛋氨酸、丙氨酸、纈氨酸、亮氨酸、異亮氨酸、賴氨酸 或精氨酸,尤其為甘氨酸、賴氨酸或精氨酸;并且相應于X249的殘基為酪氨酸、苯丙氨酸或 色氨酸,尤其為酪氨酸或色氨酸。在一些實施方式中,包含相應于SEQ ID N0:83、84或87 的序列式的殘基212-252的區(qū)域或結(jié)構(gòu)域的多肽可另外地具有與參考序列SEQ ID NO :2、4 或86相比較在未用以上X標明的殘基位置上一個或多個殘基差異。在一些實施方式中,與 參考序列SEQ ID NO :2、4或86相比,差異可為在未被以上X標明的其它氨基酸殘基位置的 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9或1_10個殘基差異。在一些實施方式中,差異的數(shù)目 可為在其它氨基酸殘基位置的1、2、3、4、5、6、7、8、9或10個殘基差異。在一些實施方式中, 差異包含保守突變。在一些實施方式中,酮還原酶多肽可進一步包含相應于SEQ IDNO :83、84或87的 序列式中的殘基212-252的結(jié)構(gòu)域或區(qū)域,其中結(jié)構(gòu)域或區(qū)域具有至少以下特征相應于 X226的殘基為非極性或脂肪族殘基,尤其為纈氨酸。在一些實施方式中,包含相應于SEQ ID NO :83、84或87的序列式的殘基212-252的區(qū)域或結(jié)構(gòu)域的多肽可另外地具有與具有以上 特征的參考序列SEQ ID NO :2、4或86相比較在其它殘基位置上的一個或多個殘基差異。在 一些實施方式中,與基于SEQ ID NO :2、4或86的參考序列的相應結(jié)構(gòu)域相比,相應于殘基 212-252的區(qū)域或結(jié)構(gòu)域可另外地含有在其它氨基酸殘基位置的1-2、1-3、1-4、1-5、1-6、 1-7、1-8、1-9或1-10個殘基差異。在一些實施方式中,差異的數(shù)目可為在結(jié)構(gòu)域中其它氨 基酸殘基的1、2、3、4、5、6、7、8、9或10個殘基差異。在一些實施方式中,差異包含保守突 變。在一些實施方式中,酮還原酶的區(qū)域或結(jié)構(gòu)域包含具有至少以上特征的氨基酸序列,并 且其中所述氨基酸序列與相應于基于SEQ ID NO :2、4或86的具有以上特征的參考序列的 殘基212-252的氨基酸序列相比具有至少85%,86%,87%,88%,89%,90%,91%,92%, 93%、94%、95%、96%、97%、98%或 99% 同一性。下表2提供示例性的2S,3R選擇性酮還原酶,SEQ ID NO :1_62,以及其相應的活 性。除非另行標明,以下序列為衍生自野生型克菲爾乳桿菌酮還原酶序列(SEQ ID N0:3和 4)。在下表2中,每行列出兩個SEQ ID N0,其中奇數(shù)指編碼由偶數(shù)提供的氨基酸序列的核 苷酸序列。列出突變數(shù)的列為與SEQ ID NO :4的克菲爾乳桿菌KRED氨基酸序列相比較的 氨基酸取代的數(shù)目,并且具體的取代列于"自克菲爾乳桿菌的突變"列中。在活性列中,一 個"+"相當于與具有SEQ ID NO :48的氨基酸序列的多肽的轉(zhuǎn)化底物至具式(II)的產(chǎn)物 的能力相比1-15倍的提高。兩個加號〃 ++"表明多肽與SEQID NO :48相比約為15至30倍 的改善。三個加號〃 +++〃表明多肽與SEQ IDNO :48相比約為30至40倍的改善。四個加 號"++++〃表明多肽與SEQ IDNO :48相比約為40至50倍的改善,而且五個加號〃 +++++" 表明多肽與SEQID NO :48相比約為高于50倍的改善。穩(wěn)定性列中"+"號表明多肽能夠 在40°C熱處理21小時后保持轉(zhuǎn)化底物至具式(II)的產(chǎn)物的酶促活性。對于選擇性列,單 個加號"+"表明多肽能夠以約60-89%的立體異構(gòu)體過量轉(zhuǎn)化底物至具式(II)的產(chǎn)物; 兩個加號"++"表明多肽能夠以約90-94%的立體異構(gòu)體過量轉(zhuǎn)化底物至具式(II)的產(chǎn) 物;三個加號"+++〃表明多肽能夠以約95-99%的立體異構(gòu)體過量轉(zhuǎn)化底物至具式(II) 的產(chǎn)物;而且四個加號標記"++++"表明多肽能夠以高于約99%的立體異構(gòu)體過量轉(zhuǎn)化 底物至具式(II)的產(chǎn)物。相應地,在一些實施方式中,2S,3R選擇性酮還原酶可包含相應于SEQ IDNO :6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、 52、54、56、58、60 或 62 的序列。表2 在一些實施方式中,改善的2S,3R選擇性酮還原酶包含與基于SEQ IDNO :6、8、 10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60 或 62 的參考序列具有至少約 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、 95%、96%、97%、98%或99%同一性的氨基酸序列,條件是所述酮還原酶的氨基酸序列具 有至少以下特征相應于X94的殘基為脂肪族或極性殘基,尤其為丙氨酸或蘇氨酸;對應 于X199的殘基為脂肪族、受限或極性殘基,尤其為丙氨酸、組氨酸或天冬酰胺;并且相應于 X202的殘基為纈氨酸或亮氨酸。在一些實施方式中,與參考序列相比,酮還原酶多肽可另 外地含有在其它氨基酸殘基位置的 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、 1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35 或約 1-40 個殘基差異。在一些實 施方式中,差異的數(shù)目可為在其它氨基酸殘基上的1、2、3、4、5、6、7、8、9、10、11、12、14、15、 16、18、20、22、24、26、30、35或約40個殘基差異。在一些實施方式中,差異包含保守突變。在一些實施方式中,改善的2S,3R選擇性酮還原酶包含與基于SEQ IDNO :6、8、 10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60 或 62 的參考序列具有至少約 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、 95 %、96 %、97%、98 %或99 %同一性的氨基酸序列,條件是所述酮還原酶的氨基酸序列與 SEQ ID NO :2或4或86相比包含表2中所列的任一多肽序列含有的任何一組突變。在 一些實施方式中,與參考序列相比,酮還原酶多肽可另外地含有在其它氨基酸殘基位置的 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、 1-24、1-25、1-30、1-35或約1_40個殘基差異。在一些實施方式中,差異的數(shù)目可為在其它 氨基酸殘基上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或約 40 個殘基差異。在一些實施方式中,差異包含保守突變。在一些實施方式中,酮還原酶多肽能夠以至少約85 %的立體異構(gòu)體過量百分比或 以高于野生型克菲爾乳桿菌KRED (SEQ ID NO :4)的立體異構(gòu)體過量百分比,將底物2-苯 甲酰氨基甲基-3-氧丁酸甲酯,轉(zhuǎn)化為產(chǎn)物2S,3R-2-苯甲酰氨基甲基-3-羥基丁酸甲酯。 可用的示例性的多肽包括但不局限于包含相應于SEQ ID NO :6、8、10、12、14、16、18、20、22、 24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60 或 62 的氨基酸序列的多 肽。在一些實施方式中,酮還原酶多肽能夠以至少約60-89%的立體異構(gòu)體過量百分 比并以比具有SEQ ID NO 48的氨基酸序列的多肽可達到的速率高至少約1_15倍的速率, 將底物2-苯甲酰氨基甲基-3-氧丁酸甲酯轉(zhuǎn)化為產(chǎn)物2S,3R-2-苯甲酰氨基甲基-3-羥基丁酸甲酯。可用的示例性的多肽包括但不局限于包含相應于SEQ ID N0:6、8、10、12、14、 16、18、20、22、24、26、28、30、32、34、36、38、40、42、46、50、52、54、56、58、60 或 62 的氨基酸序 列的多肽。因為具有SEQ ID NO :48的氨基酸序列的多肽能夠以一定速率(例如,在50% IPA, pH8中,用約10g/L KRED在20小時內(nèi)將lg/L底物100%轉(zhuǎn)化)和與野生型(SEQ ID NO 4)相比較改善的立體選擇性將底物轉(zhuǎn)化為產(chǎn)物,所以與SEQ ID NO :48相比改善的本文 所述的多肽也比野生型改善。在一些實施方式中,所述酮還原酶多肽能夠以至少約90-94%的立體異構(gòu)體過量 百分比,將底物2-苯甲酰氨基甲基-3-氧丁酸甲酯轉(zhuǎn)化為產(chǎn)物2S,3R-2-苯甲酰氨基甲 基-3-羥基丁酸甲酯??捎玫氖纠缘亩嚯陌ǖ痪窒抻诎鄳赟EQ ID N0:6、8、 10、12、14、16、18、20、22、24、26、28、30、32、34、36、40、42、50、52、56、58、60 或 62 的氨基酸序 列的多肽。在一些實施方式中,所述酮還原酶多肽能夠以至少約95-99%的立體異構(gòu)體過量 百分比,將底物2-苯甲酰氨基甲基-3-氧丁酸甲酯,轉(zhuǎn)化為產(chǎn)物2S,3R-2-苯甲酰氨基甲 基-3-羥基丁酸甲酯??捎玫氖纠缘亩嚯陌ǖ痪窒抻诎鄳赟EQ ID N0:6、8、 10、12、14、16、18、20、22、24、26、28、30、32、34、42、50、52、56、58、60 或 62 的氨基酸序列的多肽。在一些實施方式中,所述酮還原酶多肽能夠以至少約99%的立體異構(gòu)體過量百分 比將底物2-苯甲酰氨基甲基-3-氧丁酸甲酯轉(zhuǎn)化為產(chǎn)物2S,3R-2-苯甲酰氨基甲基-3-羥 基丁酸甲酯。可用的示例性的多肽包括但不局限于包含相應于SEQ ID N0:6、8、10、12、14、 20、22、24、30、32、34、60或62的氨基酸序列的多肽。在一些實施方式中,所述酮還原酶多肽能夠以比具有SEQ ID N0:48的氨基酸序列 的多肽可達到的速率高至少約15-30倍的速率,將底物2-苯甲酰氨基甲基-3-氧丁酸甲酯 轉(zhuǎn)化為產(chǎn)物2S,3R-2-苯甲酰氨基甲基-3-羥基丁酸甲酯。可用的示例性的多肽包括但不 局限于包含相應于 SEQ ID NO :6、8、10、12、14、20、22、24、26、28、30、32、34、50、60 或 62 的氨 基酸序列的多肽。在一些實施方式中,所述酮還原酶多肽能夠以比具有SEQ ID N0:48的氨基酸序列 的多肽可達到的速率高至少約30-40倍的速率,將底物2-苯甲酰氨基甲基-3-氧丁酸甲酯 轉(zhuǎn)化為產(chǎn)物2S,3R-2-苯甲酰氨基甲基-3-羥基丁酸甲酯??捎玫氖纠缘亩嚯陌ǖ?局限于包含相應于SEQ IDNO :6、8、10、12、14、20、22、24、26、30、34、60或62的氨基酸序列的
多肽。 在一些實施方式中,所述酮還原酶多肽能夠以比具有SEQ ID N0:48的氨基酸序列 的多肽可達到的速率高至少約40-50倍的速率,將底物2-苯甲酰氨基甲基-3-氧丁酸甲酯 轉(zhuǎn)化為產(chǎn)物2S,3R-2-苯甲酰氨基甲基-3-羥基丁酸甲酯。可用的示例性的多肽包括但不 局限于包含相應于SEQ ID N0:6、8、10、12、14、22或60的氨基酸序列的多肽。在一些實施方式中,所述酮還原酶多肽能夠以比具有SEQ ID N0:48的氨基酸序列 的多肽可達到的速率高至少約50倍的速率,將底物2-苯甲酰氨基甲基-3-氧丁酸甲酯轉(zhuǎn) 化為產(chǎn)物2S,3R-2-苯甲酰氨基甲基-3-羥基丁酸甲酯??捎玫氖纠缘亩嚯陌ǖ痪?限于包含相應于SEQ ID NO :6、8、10或12的氨基酸序列的多肽。在一些實施方式中,所述酮還原酶多肽能夠相比具有SEQ ID N0:48的氨基酸序列的多肽可達到的速率高至少約50倍的速率并且以至少99%的立體異構(gòu)體過量百分比,將 底物2-苯甲酰氨基甲基-3-氧丁酸甲酯轉(zhuǎn)化為產(chǎn)物2S,3R-2-苯甲酰氨基甲基-3-羥基丁 酸甲酯??捎玫氖纠缘亩嚯陌ǖ痪窒抻诎鄳赟EQ ID N0:6、8、10和12的氨基 酸序列的多肽。在一些實施方式中,所述酮還原酶多肽能夠在40°C熱處理21小時后將底物2-苯 甲酰氨基甲基-3-氧丁酸甲酯轉(zhuǎn)化為產(chǎn)物2S,3R-2-苯甲酰氨基甲基-3-羥基丁酸甲酯???用的示例性的多肽包括但不局限于包含相應于SEQID NO :6、10或44的氨基酸序列的多肽。如上所示,在一些實施方式中,所述酮還原酶能夠立體選擇性地將具式(I)的底 物還原或轉(zhuǎn)化為具式(III)的產(chǎn)物。下表3提供示例性的2R,3R特異性酮還原酶SEQ ID NO 63-82,以及其相應的活性。除非另行標明,以下序列衍生自野生型克菲爾乳桿菌酮還原酶 序列(SEQ ID N0:3和4)。在下表3中,每行列出兩個SEQ ID N0,其中奇數(shù)指編碼由偶數(shù) 提供的氨基酸序列的核苷酸序列。列出突變數(shù)的列為與SEQ ID NO :4的克菲爾乳桿菌KRED 氨基酸序列相比較的氨基酸取代的數(shù)目,并且列"序列-編碼突變"列出與SEQ ID NO 4 相比較的取代。在活性列中,一個"+"相當于與具有SEQ ID NO :66的氨基酸序列的多肽 的轉(zhuǎn)化底物至具式(III)的產(chǎn)物的能力相比約1倍的提高。兩個加號"++"表明多肽與 SEQ ID NO 66相比約為1至2倍的改善。三個加號〃 +++〃表明多肽與SEQ ID NO 66相 比約為5倍的改善。對于選擇性列,單個加號"+"表明多肽能夠以小于約85%的立體異 構(gòu)體過量轉(zhuǎn)化底物至具式(III)的產(chǎn)物;兩個加號"++"表明多肽能夠以大于約85%的立 體異構(gòu)體過量轉(zhuǎn)化底物至具式(III)的產(chǎn)物。相應地,在一些實施方式中,2S,3R選擇性酮 還原酶可包含相應于SEQ ID NO :64、66、68、70、72、74、76、78、80或82的序列。表3 序列和相應活性改善的列表 在一些實施方式中,改善的2R,3R選擇性酮還原酶包含與基于SEQ IDNO :64、66、 68、70、72、74、76、78、80 或 82 的參考序列具有至少約 85 %、86 %、87 %、88 %、89 %、90 %、 91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的氨基酸序列,條件是所述酮 還原酶的氨基酸序列與SEQ ID NO :2或4或86相比包含表3中所列的任一多肽序列含有的 任何一組突變。在一些實施方式中,與參考序列相比,酮還原酶多肽可另外地含有在其它氨 基酸殘基位置的 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、 1-18、1-20、1-22、1-24、1-25、1-30、1-35或約1-40個殘基差異。在一些實施方式中,差異的 數(shù)目可為在其它氨基酸殘基上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、 26、30、35或約40個殘基差異。在一些實施方式中,差異包含保守突變。在一些實施方式中,所述2R,3R選擇性酮還原酶多肽能夠以至少約85%的立體異 構(gòu)體過量百分比,將底物2-苯甲酰氨基甲基-3-氧丁酸甲酯轉(zhuǎn)化為產(chǎn)物2R,3R-2-苯甲酰 氨基甲基-3-羥基丁酸甲酯??捎玫氖纠缘亩嚯陌ǖ痪窒抻诎鄳赟EQ ID NO 68、72、74、76、78或82的氨基酸序列的多肽。在一些實施方式中,所述2R,3R選擇性酮還原酶多肽能夠以比具有SEQ ID NO 66 的氨基酸序列的多肽可達到的速率高至少約1倍的速率,將底物2-苯甲酰氨基甲基-3-氧 丁酸甲酯轉(zhuǎn)化為產(chǎn)物2R,3R-2-苯甲酰氨基甲基-3-羥基丁酸甲酯。可用的示例性的多肽 包括但不局限于包含相應于SEQID NO 64、68、70、72、74、76、78、80或82的氨基酸序列的多 肽。因為具有SEQ ID NO :66的氨基酸序列的多肽能夠以高于野生型克菲爾乳桿菌KRED(SEQID NO 4)的立體異構(gòu)體過量以及速率,將底物2-苯甲酰氨基甲基-3-氧丁酸甲酯轉(zhuǎn)化為 產(chǎn)物2R,3R-2-苯甲酰氨基甲基-3-羥基丁酸甲酯,所以比SEQ ID NO :66改善的任何多肽 也比野生型克菲爾乳桿菌KRED改善。在一些實施方式中,所述2R,3R選擇性酮還原酶多肽能夠以比具有SEQ ID NO: 66的氨基酸序列的多肽可達到的速率高至少約1-2倍的速率,將底物2-苯甲酰氨基甲 基-3-氧丁酸甲酯轉(zhuǎn)化為產(chǎn)物2R,3R-2-苯甲酰氨基甲基-3-羥基丁酸甲酯??捎玫氖纠?性的多肽包括但不局限于包含相應于SEQ ID NO :64、68、70、72、74、76、78或80的氨基酸序 列的多肽。在一些實施方式中,所述2R,3R選擇性酮還原酶多肽能夠以比具有SEQ ID NO 66 的氨基酸序列的多肽可達到的速率高至少約5倍的速率,將底物2-苯甲酰氨基甲基-3-氧 丁酸甲酯轉(zhuǎn)化為產(chǎn)物2R,3R-2-苯甲酰氨基甲基-3-羥基丁酸甲酯??捎玫氖纠缘亩嚯?包括但不局限于包含相應于SEQID NO :64、70、72、76、78或80的氨基酸序列的多肽。在一些實施方式中,所述2R,3R選擇性酮還原酶多肽能夠以比具有SEQ ID NO 66 的氨基酸序列的多肽可達到的速率高至少約5倍的速率以及至少約85%的立體異構(gòu)體過 量百分比,將底物2-苯甲酰氨基甲基-3-氧丁酸甲酯轉(zhuǎn)化為產(chǎn)物2R,3R-2-苯甲酰氨基甲 基-3-羥基丁酸甲酯??捎玫氖纠缘亩嚯陌ǖ痪窒抻诎鄳赟EQ ID N0:72或 78的氨基酸序列的多肽。在一些實施方式中,本公開的2S,3R選擇性酮還原酶多肽可包含與SEQ ID NO 2 或SEQ ID NO :4或SEQ ID NO :86 (或其區(qū)域或結(jié)構(gòu)域,諸如殘基90-211)具有至少約85%、 86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或 99% 同一性 的氨基酸序列,條件是相應于SEQ ID NO 2或SEQ ID NO 4或SEQ ID NO 86的殘基X202 的殘基為纈氨酸或亮氨酸,相應于SEQ ID NO :2或4或86的殘基94的殘基為蘇氨酸,并且 相應于SEQ ID NO :2或4或86的殘基199的殘基為組氨酸,并且所述2S,3R選擇性酮還原 酶多肽另外地具有以下取代中的一個或多個,以使得所述多肽相比于野生型克菲爾乳桿菌 酮還原酶或另外的工程酮還原酶(例如SEQ ID NO 48)為進一步改善的(就立體選擇性、酶 促活性和 / 或熱穩(wěn)定性而言)2 — A ;4 — C ;11 — F ;40 — H ;80 — T ;86 — I ;96 — F,V ; 105 — G ;129 — T ; 147 — M,L ;153 — A,S ;195 — V ; 196 — L ;206 — F ;226 — V ;248 — K ; 和 249 — W0在一些實施方式中,本文所述的2S,3R酮還原酶多肽可包含與SEQ IDNO :2、4或 86 (或其區(qū)域或結(jié)構(gòu)域,諸如殘基90-211)具有至少約85 %、86 %、87%、88 %、89%、90 %、 91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的氨基酸序列,條件是相應于 SEQ ID NO :2、4或86的殘基202的殘基為纈氨酸或亮氨酸,相應于SEQ ID N0:2、4或86 的殘基94的殘基為蘇氨酸,以及相應于SEQ ID NO :2、4或86的殘基199的殘基為組氨酸, 并且所述2S,3R酮還原酶多肽另外地具有以下取代中的一個或多個,以使得所述多肽相比 于野生型克菲爾乳桿菌酮還原酶或另外的工程酮還原酶(例如SEQ ID NO 48)為進一步改 善的(就立體選擇性、酶促活性和/或熱穩(wěn)定性而言)40 — H ;和147 — L,M0本領域技術(shù)人員會明白,除非另行標明,以上確定的氨基酸類別中的一些類別并 非互相排斥的。因此,具有表現(xiàn)兩種或更多的物理化學性質(zhì)的側(cè)鏈的氨基酸可包含在多個 類別中。任何氨基酸或殘基的合適的分類對于本領域?qū)I(yè)人員是明顯的,尤其是按照在此提供的詳細公開。在一些實施方式中,改善的工程酮還原酶包括自然存在的酮還原酶多肽的缺失或 其它工程酮還原酶多肽的缺失。在一些實施方式中,本文所述的每個改善的工程酮還原酶 可包含本文所述的多肽的缺失。因此,對于本公開中酮還原酶多肽的每個實施方式,缺失可 包含一個或多個氨基酸、2個或更多個氨基酸,3個或更多個氨基酸、4個或更多個氨基酸、5 個或更多個氨基酸、6個或更多個氨基酸、8個或更多個氨基酸、10個或更多個氨基酸、15個 或更多個氨基酸、或20個或更多個氨基酸、多達酮還原酶多肽氨基酸總數(shù)的10%、多達酮 還原酶多肽氨基酸總數(shù)的10%、多達酮還原酶多肽氨基酸總數(shù)的20%、或多達酮還原酶多 肽氨基酸總數(shù)的30%,只要保持酮還原酶活性的功能活性。在一些實施方式中,缺失可包含 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、 1-24、1-25、1-30、1-35或約1_40個氨基酸殘基。在一些實施方式中,缺失的數(shù)目可為1、2、 3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或約 40 個氨基酸。在一些實 施方式中,缺失可包括1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、18或20個氨基酸殘基 的缺失。如本文所述的,本公開的酮還原酶多肽可為融合多肽的形式,其中酮還原酶多肽 融合至其它多肽,例如,諸如但不局限于,抗體標簽(例如,myc表位)、純化序列(例如,組 氨酸標簽)和細胞定位信號(例如,分泌信號)。因此,酮還原酶多肽可以與其它多肽融合 或不融合而使用。本文所述的多肽不局限于遺傳編碼的氨基酸。除了遺傳編碼的氨基酸,本文所 述的多肽可以整體或部分包括自然存在的和/或合成的非編碼氨基酸。本文所述的多肽 可包含的某些通常遇見的非編碼氨基酸包括但不局限于遺傳編碼氨基酸的D-立體異 構(gòu)體;2,3_ 二氨基丙酸(Dpr) ;α-氨基異丁酸(Aib) ; ε-氨基己酸(Aha) ;δ-氨基戊 酸(Ava) ;N-甲基甘氨酸或肌氨酸(MeGly或Sar);鳥氨酸(Orn);瓜氨酸(Cit);叔丁基 丙氨酸(Bua);叔丁基甘氨酸(Bug) ;N-甲基異亮氨酸(MeIle);苯基甘氨酸(Phg);環(huán)己 基丙氨酸(Cha);正亮氨酸(Nle);萘基丙氨酸(Nal) ;2_氯苯丙氨酸(Ocf) ;3_氯苯丙氨 酸(Mcf) ;4-氯苯丙氨酸(Pcf) ;2-氟苯丙氨酸(Off) ;3-氟苯丙氨酸(Mff) ;4-氟苯丙氨 酸(Pff) ;2-溴苯丙氨酸(Obf) ;3-溴苯丙氨酸(Mbf) ;4-溴苯丙氨酸(Pbf) ;2-甲基苯 丙氨酸(Omf) ;3-甲基苯丙氨酸(Mmf) ;4-甲基苯丙氨酸(Pmf) ;2-硝基苯丙氨酸(Onf); 3-硝基苯丙氨酸(Mnf) ;4-硝基苯丙氨酸(Pnf) ;2-氰基苯丙氨酸(Ocf) ;3-氰基苯丙氨酸 (Mcf) ;4-氰基苯丙氨酸(Pcf) ;2-三氟甲基苯丙氨酸(Otf) ;3-三氟甲基苯丙氨酸(Mtf); 4_三氟甲基苯丙氨酸(Ptf) ;4-氨基苯丙氨酸(Paf) ;4-碘苯丙氨酸(Pif) ;4-氨甲基苯 丙氨酸(Pamf) ;2,4-二氯苯丙氨酸(Opef) ;3,4-二氯苯丙氨酸(Mpcf) ;2,4-二氟苯丙氨 酸(Opff) ;3,4-二氯苯丙氨酸(Mpff);吡啶-2-基丙氨酸(2pAla);吡啶_3_基丙氨酸 (3pAla);吡啶-4-基丙氨酸(4pAla);萘基丙氨酸(InAla);萘_2_基丙氨酸(2nAla); 噻唑基丙氨酸(taAla);苯并噻吩基丙氨酸(bAla);噻吩基丙氨酸(tAla);呋喃基丙氨酸 (fAla);高苯丙氨酸(hPhe);高酪氨酸(hTyr);高色氨酸(hTrp);五氟苯丙氨酸(5ff);苯 乙烯丙氨酸(styrylkalanine) (sAla);蒽基丙氨酸(authrylalanine, aAla) ;3,3-二苯 丙氨酸(Dfa) ;3-氨基-5-苯基戊酸(Afp);青霉胺(Pen) ; 1,2,3,4-四氫異喹啉-3-羧 酸(Tic) ; β-2-噻吩基丙氨酸(Thi);蛋氨酸亞砜(Mso) ;N(W)-硝基精氨酸(nArg);高賴氨酸(hLys);膦酰甲基苯丙氨酸(pmPhe);磷酸絲氨酸(pSer);磷酸蘇氨酸(pThr);高天 冬氨酸(Msp);高谷氨酸(hGlu) ; 1-氨基環(huán)戊-(2或3)-烯-4羧酸;2-哌啶酸(PA),氮 雜環(huán)丁基-3-羧酸(ACA) ;1-氨基環(huán)戊基-3-羧酸;烯丙基甘氨酸(aOly);炔丙基甘氨酸 (PgGly);高丙氨酸(hAla);正纈氨酸(nVal);高亮氨酸(hLeu),高纈氨酸(hVal);高異亮 氨酸(homoisolencine, hlle);高精氨酸(hArg) ;N-乙?;嚢彼?AcLys) ;2,4_ 二氨基 丁酸(Dbu) ;2,3_ 二氨基丁酸(Dab) ;N-甲基纈氨酸(MeVal);高半胱氨酸(hCys);高絲氨 酸(hSer);羥基脯氨酸(Hyp)和高脯氨酸(hPro)??砂诒疚乃龅亩嚯闹械牧硗獾姆?編碼氨基酸對本領域技術(shù)人員將是顯而易見的(參見例如,F(xiàn)asman, 1989, CRC Practical Handbook of Biochemistry and Molecular Biology (CRC 生物化學和分子生物學實踐手 冊),CRC Press, Boca Raton,F(xiàn)L,第3_70頁以及其中所引用的文獻中提供的各種氨基酸, 其全部以引用的形式并入本文)。這些氨基酸可為L-或D-構(gòu)型的。本領域技術(shù)人員將理解,含有側(cè)鏈保護基團的氨基酸或殘基也可構(gòu)成本文所述的 多肽。在此情況下屬于芳香族類別的此類保護的氨基酸的非限制性的例子包括但不局限于 (保護基團列于括號中)=Arg (tos)、Cys (甲芐基)、Cys (硝基吡啶亞磺酰基)、Glu ( δ -芐 基酯)、Gln (占噸基)、Asn (N- δ -占噸基)、His (bom)、His (芐基)、His (tos)、Lys (fmoc)、 Lys (tos)、Ser (0_ 芐基)、Thr (0-芐基)和 Tyr (0-芐基)??砂诒疚乃龅亩嚯闹械臉?gòu)象受限的非編碼氨基酸包括但不局限于N-甲基 氨基酸(L-構(gòu)型);1_氨基環(huán)戊_(2或3)-烯-4-羧酸;哌可酸;吖丁啶-3-羧酸;高脯氨 酸(hPro);和1-氨基環(huán)戊烷-3-羧酸。如上文所述,引入至自然存在的多肽以產(chǎn)生工程酮還原酶的各種修飾可針對酶的 特定的性質(zhì)。1. 3編碼工程酮還原酶的多核苷酸在另一方面,本公開提供編碼工程酮還原酶的多核苷酸。多核苷酸可與控制基因 表達的一種或多種異源調(diào)控序列可操作地連接以產(chǎn)生能夠表達多肽的重組多核苷酸。包含 編碼工程酮還原酶的異源多核苷酸的表達構(gòu)建體可被引入合適的宿主細胞以表達相應的 酮還原酶多肽。因為對相應于不同氨基酸的密碼子的認識,蛋白質(zhì)序列的可用性提供對于能夠編 碼所述蛋白序列的所有多核苷酸的描述。其中相同氨基酸由可選擇的或同義密碼子編碼 的遺傳密碼的簡并性允許產(chǎn)生極大數(shù)目的核酸,所有這些核酸編碼本發(fā)明的改善的酮還原 酶。因此,確定特殊的氨基酸序列后,本領域的技術(shù)人員可以以一種不改變蛋白質(zhì)的氨基酸 序列的方式通過僅僅修飾一個或多個密碼子的序列來產(chǎn)生任何數(shù)目的不同的核酸。在這點 上,本公開尤其涵蓋可通過基于可能的密碼子選擇而選取組合來制備的多核苷酸的每一種 可能的改變,并且對于本文公開的任何多肽,包括表1中呈現(xiàn)的氨基酸序列,所有這些改變 被認為具體地公開。在不同的實施方式中,密碼子被優(yōu)選地選擇以適應在其中產(chǎn)生蛋白的宿主細胞。 例如,細菌中使用的優(yōu)選密碼子被用于在細菌中表達基因;酵母中使用的優(yōu)選密碼子被用 于在酵母中的表達;而且哺乳動物中使用的優(yōu)選密碼子被用于在哺乳動物細胞中的表達。 當作例子,SEQ ID NO :1的多核苷酸已經(jīng)為在大腸埃希氏菌(E.coli)中的表達而進行密碼 子優(yōu)化,但仍編碼克菲爾乳桿菌的自然存在的酮還原酶。
在某些實施方式中,不是所有的密碼子需要被取代以優(yōu)化酮還原酶的密碼子使 用,因為自然序列將包含優(yōu)選的密碼子而且因為優(yōu)選的密碼子的使用可能不被所有的氨基 酸殘基需要。因此,編碼酮還原酶的密碼子優(yōu)化的多核苷酸可包含位于全長編碼區(qū)的約 40%,50%,60%,70%,80%或高于90%的密碼子位置的優(yōu)選的密碼子。在一些實施方式中,所述多核苷酸包含編碼酮還原酶多肽的核苷酸序列,所述酮 還原酶多肽具有與本文所述的任何參考工程酮還原酶具有至少約80%、85%、86%、87%、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或 99%或更多的序列同一 性的氨基酸序列。相應地,在一些實施方式中,所述多核苷酸編碼與基于SEQ ID N0:2、4 或 86 的參考序列具有至少約 80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、 94%,95%,96%,97%,98 %、99 %或更多同一性的氨基酸序列,所述參考序列具有以下特 征相應于位置X94的殘基為脂肪族或極性殘基,尤其是丙氨酸或蘇氨酸;相應于X199的 殘基為脂肪族、受限或極性殘基,尤其是丙氨酸、組氨酸或天冬酰胺;并且相應于X202的殘 基為纈氨酸或亮氨酸,條件是所編碼的酮還原酶多肽含有具有前述特征的氨基酸序列,也 就是說,相應于位置X94的殘基為脂肪族或極性殘基;相應于X199的殘基為脂肪族、受限或 極性殘基;并且相應于X202的殘基為纈氨酸或亮氨酸。在一些實施方式中,所述多核苷酸 編碼具有以下氨基酸序列的酮還原酶其中相應于X94的殘基為蘇氨酸;相應于X199的殘 基為丙氨酸、組氨酸或天冬酰胺;并且相應于X202的殘基為纈氨酸或亮氨酸。在一些實施 方式中,所述多核苷酸編碼相應于 SEQ ID NO :6、8、10、12、16、18、20、22、24、26、28、30、32、 34、36、38、40、42、44、46、48、50、52、54、56 或 58 的氨基酸序列。在一些實施方式中,所述多核苷酸包含編碼酮還原酶多肽的核苷酸序列,所述酮 還原酶多肽具有與包含相應于SEQ ID NO :14、60或62的氨基酸的多肽具有至少約80%、 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98% 或 99% 或 更高的序列同一性的氨基酸序列。在一些實施方式中,所述多核苷酸包含編碼酮還原酶多肽的核苷酸序列,所述酮 還原酶多肽具有與包含相應于SEQ ID NO :64、66、68、70、72、74、76、78、80或82的氨基酸 序列的多肽具有至少約 80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、 95%、96%、97%、98%或99%或更高的序列同一性的氨基酸序列。在一些實施方式中,編碼酮還原酶的多核苷酸選自SEQ ID NO :5、7、9、11、13、15、 17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、 67、69、71、73、75、77、79或81。在一些實施方式中,所述多核苷酸能夠在高度嚴格的條件 下與包含 SEQ ID NO :5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、 45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79 或 81 的多核苷酸雜交,其中 高度嚴格性雜交的多核苷酸編碼能夠?qū)⒕呤?I)的底物立體選擇性地還原或轉(zhuǎn)化為具式 (II)的產(chǎn)物,或者將具式(I)的底物立體選擇性地還原或轉(zhuǎn)化為具式(III)的產(chǎn)物的酮還 原酶。在一些實施方式中,所述多核苷酸編碼本文所述的多核苷酸,但是在核苷酸水平 上與編碼工程酮還原酶的參考多核苷酸具有約80%或更高的序列同一性,約85%、86%、 87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98% 或 99% 或更高的序列 同一性。在一些實施方式中,所述參考多核苷酸選自SEQ ID NO :5、7、9、11、13、15、17、19、
5621、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、 71、73、75、77、79 或 81??刹捎酶鞣N方法處理編碼改善的酮還原酶多肽的分離的多核苷酸以提供所述多 肽的表達。取決于表達載體,在插入載體前對分離的多核苷酸的操作可為需要的或必需的。 使用重組DNA方法修飾多核苷酸和核酸序列的技術(shù)在本領域是公知的。在Sambrook等人, 2001,Molecular Cloning =ALaboratory Manual (分子克隆實驗室手冊),第 3 版,Cold Spring HarborLaboratory Press ;禾口Current Protocols in Molecular Biology(分子生 物學最新實驗設計),Ausubel. F.編輯,Greene Pub. Associates,1998,更新至2006,中提 供指導。對于細菌宿主細胞,用于引導本公開的核酸構(gòu)建體的轉(zhuǎn)錄的合適啟動子包括從大 腸埃希氏菌Iac操縱子、大腸埃希氏菌trp操縱子、噬菌體λ、天藍色鏈霉菌(Str印tomyces coelicolor)瓊脂水解酶基因(dagA)、枯草芽孢桿菌(Bacillus subtilis)果聚糖蔗 糖酶基因(sacB)、地衣芽孢桿菌(Bacilluslicheniformis) α-淀粉酶基因(amyL)、嗜 熱脂肪芽孢桿菌(BacillusstearothermophiIus)麥芽淀粉酶基因(amyM)、解淀粉芽孢 桿菌(Bacillusamyloliquefaciens) α-淀粉酶基因(amyQ)、地衣芽孢桿菌青霉素酶基 因(penP)、枯草芽孢桿菌xylA和xylB基因和原核的β -內(nèi)酰胺酶基因中獲得的啟動子 (Villa-Kamaroff 等人,1978,Proc. Natl Acad. Sci. USA 75 :3727_3731)、以及 tac 啟動 子(DeBoer 等人,1983,Proc. Natl Acad. Sci. USA80 :21_25)。另外的啟動子在"Useful proteins from recombinant bacteria(來自重組細菌的有用蛋白質(zhì))〃 ,Scientific American, 1980,242 74-94 ;以及在 Sambrook 等人,如上,中闡述。對于絲狀真菌宿主細胞,用于引導本公開的核酸構(gòu)建體的轉(zhuǎn)錄的合適啟動子包括 從米曲霉(Aspergillus oryzae)TAKA淀粉酶、米赫根毛霉(Rhizomucor miehei)天冬氨酸 蛋白酶、黑曲霉(Aspergillus niger)中性α-淀粉酶、黑曲霉酸穩(wěn)定α-淀粉酶、黑曲霉 或泡盛曲霉(Aspergillus awamori)葡萄糖淀粉酶(glaA)、米赫根毛霉脂肪酶、米曲霉堿 性蛋白酶、米曲霉磷酸丙糖異構(gòu)酶、構(gòu)巢曲霉(Aspergillus nidulans)乙酰胺酶、和尖孢鐮 刀菌(Fusarium oxysporum)胰蛋白酶樣蛋白酶(W096/00787)的基因中獲得的啟動子,以 及NA2_tpi啟動子(來自黑曲霉中性α-淀粉酶和米曲霉磷酸丙糖異構(gòu)酶基因的啟動子的 雜合體),以及其突變的、截短的和雜合的啟動子。在酵母宿主中,有用的啟動子可來自釀酒酵母(Saccharomycescerevisiae)烯醇 化酶(ENO-I)、釀酒酵母半乳糖激酶(GALl),釀酒酵母醇脫氫酶/甘油醛-3-磷酸脫氫酶 (ADH2/GAP)和釀酒酵母3-磷酸甘油酸激酶的基因中。用于酵母宿主細胞的其他有用的啟 動子在 Romanos 等人,1992,Yeast 8 :423_488 中闡述。控制序列也可是合適的轉(zhuǎn)錄終止子序列,轉(zhuǎn)錄終止子序列是被宿主細胞識別以終 止轉(zhuǎn)錄的序列。終止子序列可操作地連接在編碼多肽的核酸序列的3'端。在所選宿主細 胞中起作用的任何終止子可用于本發(fā)明中。例如,用于絲狀真菌宿主細胞的示例性的轉(zhuǎn)錄終止子可從米曲霉TAKA淀粉酶、黑 曲霉葡萄糖淀粉酶、構(gòu)巢曲霉鄰氨基苯甲酸合酶、黑曲霉α-葡糖苷酶和尖孢鐮刀菌胰蛋 白酶樣蛋白酶的基因中獲得。用于酵母宿主細胞的示例性的終止子可從釀酒酵母烯醇化酶,釀酒酵母細胞色素C(CYCl)和釀酒酵母甘油醛-3-磷酸脫氫酶的基因中獲得。用于酵母宿主細胞的其他有用 的終止子在Romanos等人,1992,如上,中闡述。控制序列也可為合適的前導序列,前導序列是對宿主細胞的翻譯重要的mRNA的 非翻譯區(qū)。前導序列可操作地連接在編碼多肽的核酸序列的5'端??墒褂迷谒x宿主細 胞中起作用的任何前導序列。用于絲狀真菌宿主細胞的示例性的前導序列可從米曲霉TAKA 淀粉酶和構(gòu)巢曲霉磷酸丙糖異構(gòu)酶的基因中獲得。用于酵母宿主細胞的合適的前導序列可 從釀酒酵母烯醇化酶(ENO-I),釀酒酵母3-磷酸甘油酸激酶,釀酒酵母α -因子以及釀酒酵 母醇脫氫酶/甘油醛-3-磷酸脫氫酶(ADH2/GAP)的基因中獲得??刂菩蛄幸部墒蔷巯佘账峄蛄?,聚腺苷酸化序列是可操作地連接于核酸序列 的3'端的序列,當轉(zhuǎn)錄時,其被宿主細胞識別為將多聚腺苷酸殘基添加到轉(zhuǎn)錄的mRNA的 信號。在所選宿主細胞中起作用的任何聚腺苷酸化序列可用于本發(fā)明中。用于絲狀真菌 宿主細胞的示例性的聚腺苷酸化序列可從米曲霉TAKA淀粉酶、黑曲霉葡萄糖淀粉酶、構(gòu)巢 曲霉鄰氨基苯甲酸合酶、尖孢鐮刀菌胰蛋白酶樣蛋白酶和黑曲霉α-葡糖苷酶的基因中取 得。用于酵母宿主細胞的有用的聚腺苷酸化序列在Guo和Sherman,1995,M0lCell Bio 15: 5983-5990 中闡述??刂菩蛄幸部蔀榫幋a連接于多肽氨基端的氨基酸序列并且引導編碼的多肽進入 細胞的分泌途徑的信號肽編碼區(qū)。核酸序列的編碼序列的5'端可固有地包含以翻譯閱讀 框與編碼分泌性多肽的編碼區(qū)的區(qū)段自然連接的信號肽編碼區(qū)??蛇x擇地,編碼序列的5' 端可包含對編碼序列為外源的信號肽編碼區(qū)。在編碼序列并非自然地包含信號肽編碼區(qū)的 情況下,外源的信號肽編碼區(qū)可為需要的??蛇x擇地,外源的信號肽編碼區(qū)可簡單地置換自然的信號肽編碼區(qū)以提高多肽的 分泌。然而,將表達的多肽引導至選擇的宿主細胞的分泌途徑的任何信號肽編碼區(qū)可用于 本發(fā)明中。用于細菌宿主細胞的有效信號肽編碼區(qū)為從芽孢桿菌(Bacillus)NC1B11837麥 芽淀粉酶、嗜熱脂肪芽孢桿菌α-淀粉酶,地衣芽孢桿菌枯草桿菌蛋白酶、地衣芽孢桿菌 β -內(nèi)酰胺酶、嗜熱脂肪芽孢桿菌中性蛋白酶(nprT,nprS, nprM)和枯草芽孢桿菌prsA的 基因中獲得的信號肽編碼區(qū)。另外的信號肽在Simonen和Palva,1993,Microbiol Rev 57 109-137中描述。用于絲狀真菌宿主細胞的有效的信號肽編碼區(qū)可為從米曲霉TAKA淀粉酶、黑曲 霉中性淀粉酶、黑曲霉葡萄糖淀粉酶、米赫根毛霉天冬氨酸蛋白酶、特異質(zhì)腐霉(Humicola insolens)纖維素酶和柔毛腐質(zhì)霉(Humicolalanuginosa)脂肪酶的基因中獲得的信號肽 編碼區(qū)用于酵母宿主細胞的有用的信號肽可從釀酒酵母α -因子和釀酒酵母轉(zhuǎn)化酶的 基因中獲得。其他有用的信號肽編碼區(qū)在Romanos等人,1992,如上,中闡述??刂菩蛄幸部蔀榫幋a位于多肽氨基端的氨基酸序列的前肽編碼區(qū)。生成的多肽稱 為原酶(proenzyme)或多肽原(或在一些情況下,酶原)。多肽原通常無活性并且可通過從 多肽原中催化裂解或自催化裂解前肽而轉(zhuǎn)化為成熟的活性多肽。前肽編碼區(qū)可從枯草芽孢 桿菌堿性蛋白酶(aprE)、枯草芽孢桿菌中性蛋白酶(nprT)、釀酒酵母α -因子、米赫根毛霉 天冬氨酸蛋白酶和嗜熱毀絲霉(Myceliophthora thermophila)乳糖酶(WO 95/33836)的基因中獲得。當信號肽和前肽區(qū)域二者都存在于多肽氨基端時,前肽區(qū)域位于與多肽的氨基端 相鄰的位置,并且信號肽區(qū)域位于與前肽區(qū)域的氨基末端相鄰的位置??赡苓€需要增加調(diào)控序列,其允許相對于宿主細胞的生長來調(diào)控多肽的表達。調(diào) 控系統(tǒng)的例子是導致基因表達因應答化學的或物理的刺激而開和關的那些系統(tǒng),所述刺激 包括調(diào)控化合物的存在。在原核宿主細胞中,合適的調(diào)控序列包括lac、tac和trp操縱子 系統(tǒng)。在酵母宿主細胞中,合適的調(diào)控系統(tǒng)包括,例如ADH2系統(tǒng)或GALl系統(tǒng)。在絲狀真菌 中,合適的調(diào)控序列包括TAKAa-淀粉酶啟動子、黑曲霉葡萄糖淀粉酶啟動子和米曲霉葡 萄糖淀粉酶啟動子。調(diào)控序列的其他的例子為允許基因擴增的那些序列。在真核系統(tǒng)中,調(diào)控序列包 括在甲氨喋呤存在下擴增的二氫葉酸還原酶基因,以及使用重金屬擴增的金屬硫蛋白基 因。在這些例子中,編碼本發(fā)明的KRED多肽的核酸序列被可操作地連接在調(diào)控序列上。因此,在另一個實施方式中,本公開也涉及重組的表達載體,該重組的表達載體包 含編碼工程酮還原酶多肽或其變體的多核苷酸,以及取決于他們將要引入的宿主的類型, 一個或多個表達調(diào)控區(qū)域,諸如啟動子和終止子,復制起點等。以上所述的不同的核苷酸和 控制序列可被連接在一起以產(chǎn)生表達載體,該表達載體可包括一個或多個方便的限制性位 點以允許編碼多肽的氨基酸序列在此位點的插入或取代。可選擇地,本公開的核酸序列可 通過將核酸序列或包含該序列的核酸構(gòu)建體插入至合適的表達載體中表達。在產(chǎn)生表達 載體中,編碼序列位于載體中以使編碼序列被可操作地連接于用于表達的合適的控制序列 上。重組表達載體可為任何載體(例如,質(zhì)?;虿《?,其可方便地應用于重組DNA步 驟中并且可帶來多核苷酸序列的表達。載體的選擇典型地由載體和將要引入載體的宿主細 胞的相容性決定。載體可為線性的或閉合環(huán)狀質(zhì)粒。表達載體可為自主復制的載體,也就是說,作為染色體外實體存在,其復制不依賴 于染色體的復制,例如,質(zhì)粒、染色體外元件、微型染色體或人工染色體。載體可包含保證自 我復制的任何部件(means)。可選擇地,載體可為當引入宿主細胞時并入基因組并且與其所 整合的染色體一起復制的載體。此外,可應用單獨載體或質(zhì)粒,或一起包括要被引入宿主細 胞基因組的總DNA的兩個或更多的載體或質(zhì)粒,或轉(zhuǎn)座子。本發(fā)明的表達載體優(yōu)選地包含一個或多個可選標記物,該標記物允許容易地選擇 轉(zhuǎn)化細胞??蛇x標記物為其產(chǎn)物提供殺蟲劑耐受性或病毒耐受性、重金屬耐受性、營養(yǎng)缺陷 型的原養(yǎng)型以及類似性質(zhì)的基因。細菌可選標記物的例子為來自枯草芽孢桿菌或地衣芽孢 桿菌的dal基因,或帶來諸如氨芐西林、卡那霉素、氯霉素(實施例1)或四環(huán)素耐受性的抗 生素耐受性的標記物。用于酵母宿主細胞的合適的標記物為ADE2、HIS3、LEU2、LYS2、MET3、 TRPl 禾口 URA3。用于絲狀真菌宿主細胞的可選標記物包括但不局限于amdS (乙酰胺酶)、argB (鳥 氨酸氨甲酰基轉(zhuǎn)移酶)、bar (草胺膦(phosphinothricin)乙?;D(zhuǎn)移酶)、hph (潮霉素磷 酸轉(zhuǎn)移酶)、niaD (硝酸還原酶),pyrG (乳清酸核苷_5 ‘-磷酸脫羧酶)、sC (硫酸腺苷轉(zhuǎn) 移酶)和trpC(鄰氨基苯甲酸合酶),以及其等同物。應用于曲霉屬的細胞的實施方式包括 構(gòu)巢曲霉或米曲霉的amdS和pyrG基因以及吸水鏈霉菌(Sti^ptomyces hygroscopicus)的bar基因。本發(fā)明的表達載體優(yōu)選地包含允許將載體整合至宿主細胞基因組中或載體在細 胞中不依賴于基因組而自主復制的元件。對于整合到宿主細胞基因組,載體可依賴編碼多 肽的核酸序列或載體的任何其他元件以通過同源的或非同源的重組將載體整合入基因組??蛇x擇地,表達載體可包含用于引導通過同源的重組整合至宿主細胞的基因組的 另外的核酸序列。所述另外的核酸序列使載體在染色體的精確位置被整合至宿主細胞基 因組成為可能。為提高整合至精確的位置的可能性,整合的元件可優(yōu)選地含有足夠數(shù)目的 核酸,例如100至10,000個堿基對、優(yōu)選地400至10,000個堿基對、以及最優(yōu)選地800至 10,000個堿基對,所述堿基對與相應的靶標序列高度同源以提高同源重組的概率。整合元 件可為與宿主細胞基因組中靶標序列同源的任何序列。此外,整合元件可為非編碼的或編 碼的核酸序列。另一方面,載體可通過非同源的重組整合至宿主細胞基因組中。對于自主復制,載體還可包含允許載體在相關的宿主細胞內(nèi)自主復制的復制起 點。細菌的復制起點的例子是P15A ori (如圖5中所示質(zhì)粒)或允許在大腸希埃氏菌中復 制的質(zhì)粒pBR322、pUC19、pACYC177(該質(zhì)粒具有P15A ori)或pACYC184的復制起點,以及 允許在芽胞桿菌中復制的pUB110、pE194、pTA1060或ρΑΜβ 1的復制起點。用于酵母宿主細 胞中的復制起點的例子為2微米的復制起點、ARSl、ARS4、ARSl和CEN3的組合,以及ARS4 和CEN6的組合。復制起點可為具有使其在宿主細胞內(nèi)溫度敏感地起作用的突變的復制起 點(參見例如,Ehrlich,1978,Proc Natl AcadScL USA 75:1433)。本發(fā)明的核酸序列的多于一個拷貝可插入宿主細胞中以提高基因產(chǎn)物的產(chǎn)量。核 酸序列的拷貝數(shù)的增加可通將序列的至少一個額外拷貝整合至宿主細胞基因組中或通過 隨核酸序列包括可擴增的可選標記物基因獲得,其中包含可選標記物基因的擴增的拷貝并 因此包含核酸序列的另外的拷貝的細胞,可被選擇用于在合適的可選試劑的存在下培養(yǎng)細 胞。用于本發(fā)明的許多表達載體為市售的。合適的市售表達載體包括來自 Sigma-Aldrich Chemicals, St. Louis MO.的 p3xFLAGTM ,其包括 CMV 啟動子和用于在哺 乳動物宿主細胞中表達的hGH聚腺苷酸化位點以及pBR322復制起點和用于在大腸希埃氏 菌中擴增的氨芐西林耐受性標記物。其他的合適的表達載體為pBluescriptll SK(-)和 pBK-CMV,由 Stratagene,LaJoIIa CA 出售,以及衍生自 pBR322 (Gibco BRL)、pUC(Gibco BRL)、pREP4、pCEP4 (Invitrogen)或 pPoly (Lathe 等人,1987,Gene 57:193-201)的質(zhì)粒。1. 4表達酮還原酶多肽的宿主細胞在另一方面,本公開提供包含編碼本公開的改善的酮還原酶多肽的多核苷酸的宿 主細胞,所述多核苷酸被可操作地連接至一個或多個控制序列以在宿主細胞中表達酮還原 酶。用于表達由本發(fā)明的表達載體編碼的KRED多肽的宿主細胞在本領域是公知的,并且 包括但不局限于諸如大腸埃希氏菌、克菲爾乳桿菌、短乳桿菌、鏈霉菌屬和鼠傷寒沙門氏菌 (Salmonella typhimurium)細胞的細菌細胞;諸如酵母細胞{例如,釀酒酵母或巴斯德畢 赤氏酵母(Pichia pastoris) (ATCC登錄號201178))的真菌細胞;諸如果蠅S2以及灰翅夜 蛾(Spodoptera) Sf9細胞的昆蟲細胞;諸如CH0、C0S、BHK、293和Bowes黑色素瘤細胞的動 物細胞;以及植物細胞。上述宿主細胞的合適的培養(yǎng)基以及生長條件在本領域內(nèi)是公知的。用于表達酮還原酶的多核苷酸可通過在本領域內(nèi)已知的各種方法引入細胞。技術(shù)
60包括但不限于,電穿孔、生物射彈粒子轟擊、脂質(zhì)體介導的轉(zhuǎn)染、氯化鈣轉(zhuǎn)染以及原生質(zhì)體 融合。將多核苷酸引入細胞的不同方法對于本領域技術(shù)人員是明顯的。示例性的宿主細胞為大腸希埃氏菌W3110 (Escherichia coli W3110)。表達載體 通過將編碼改善的酮還原酶的多核苷酸可操作地連接到質(zhì)粒PCK110900中以與在IacI阻 抑物控制下的Iac啟動子可操作地連接而產(chǎn)生。表達載體也包含P15a復制起點以及氯霉 素耐受性基因。大腸希埃氏菌W3110中包含所述多核苷酸的細胞可通過使所述細胞經(jīng)受氯 霉素的選擇而分離。1. 5生成工程酮還原酶多肽的方法在一些實施方式中,為生成本發(fā)明的改善的KRED多核苷酸和多肽,自然存在的催 化還原反應的酮還原酶為從克菲爾乳桿菌、短乳桿菌或小乳桿菌中取得(或衍生)。在一些 實施方式中,母多核苷酸序列被密碼子優(yōu)化以提高酮還原酶在特定的宿主細胞中表達的密 碼子。作為例證,編碼克菲爾乳桿菌野生型KRED多肽的母多核苷酸序列為從基于Genbank 數(shù)據(jù)庫中可獲得的克菲爾乳桿菌KRED的已知多肽序列(Genbank登錄號AAP94029 GI: 33112056)制備的寡核苷酸而構(gòu)建的。母多核苷酸序列(指定為SEQ ID NO=D為在大腸 埃希氏菌中表達的密碼子優(yōu)化,并且將所述密碼子-優(yōu)化的多核苷酸克隆至表達載體,將 酮還原酶基因的表達置于Iac啟動子和IacI阻抑物基因的控制下。鑒定在大腸埃希氏菌 中表達活性的酮還原酶的克隆并且測序基因以證實其身份(identity)。指定的序列(SEQ IDNO 1)為用于作為從克菲爾乳桿菌酮還原酶進化而來的工程酮還原酶的大多數(shù)實驗和 文庫構(gòu)建的起始點。工程酮還原酶可通過使編碼自然存在的酮還原酶的多核苷酸經(jīng)受如上討論的 誘變和/或定向進化方法而得到。示例性的定向進化技術(shù)為誘變和/或DNA改組,如在 Stemmer,1994, Proc Natl Acad Sci USA91 10747-10751 ;WO 95/22625 ;WO 97/0078 ;WO 97/35966 ;WO 98/27230 ;WO 00/42651 ;WO 01/75767 和美國專利第 6,537,746 號中所描 述。可用的其他定向進化程序包括但不限于交錯延伸過程(staggered extensionprocess, StEP),體外重組(Zhao 等人,1998,Nat. Biotechnol. 16 :258_261),誘變 PCR(Caldwell 等 人,1994,PCR Methods Appl. 3 :S136_S140),以及盒式突變(Black 等人,1996,Proc Natl Acad Sci USA 93 :3525_3529)。篩選誘變處理后獲得的克隆中具有所需要的改善的酶性質(zhì)的工程酮還原酶。從 表達庫中測量酶促活性可應用監(jiān)控當NADH或NADPH轉(zhuǎn)化至NAD+或NADP+時NADH或NADPH 濃度的降低的速率(通過吸光度或熒光的降低)的標準生物化學技術(shù)來進行。(例如參見 實施例7。)在這個反應中,因為酮還原酶將酮底物還原為相應的羥基基團,酮還原酶消耗 (氧化)NADH或NADPH。如通過吸光度或熒光的降低測量的每單位時間NADH或NADPH濃度 的降低的速率表明在固定量的裂解物(或從中產(chǎn)生的凍干的粉末)中的KRED多肽的相對 的(酶促)活性。在需要的改善的酶性質(zhì)為熱穩(wěn)定性時,酶活性可在將酶制品經(jīng)受確定的 溫度和測量在熱處理后余下的酶促活性的量之后測量到。然后包含編碼酮還原酶的多核苷 酸的克隆被分離,被測序以確定核苷酸序列的改變(如果有),并且用于在宿主細胞中表達 酶。當工程多肽的序列為已知時,編碼酶的多核苷酸可根據(jù)已知的合成方法通過標準 的固相方法制備。在一些實施方式中,高達100個堿基的片段可單獨地合成,然后連接(例如,通過酶促或化學的連接方法或聚合酶介導的方法)以形成任何需要的連續(xù)序列。例如, 本發(fā)明的多核苷酸和寡聚核苷酸可通過化學合成制備,使用,例如,描述于Beaucage等人, 1981, TetLett 22 1859-69的經(jīng)典的亞磷酰胺方法,或描述于Matthes等人,1984,EMBO J. 3 801-05的方法,例如,如在自動化合成方法中典型地實踐的。根據(jù)亞磷酰胺方法,寡核 苷酸在例如,在自動化DNA合成儀中合成、純化、退火、連接以及克隆至合適的載體中。另 外,基本上任何核酸可從任何各種市售來源獲得,例如The Midland Certified Reagent Company, Midland, TX、The Great American Gene Company, Ramona, CA> ExpressGenInc. Chicago, IL、Operon Technologies Inc. , Alameda, CA 禾口許多其他公司。表達在宿主細胞中的工程酮還原酶可從細胞或培養(yǎng)基中回收,使用蛋白質(zhì)純化的 公知技術(shù)的任一種或多種,包括但不限于溶菌酶處理、超聲、過濾、鹽析、超速離心和色譜。 用于從諸如大腸埃希氏菌的細菌中裂解和高效提取蛋白質(zhì)的適合溶液是以St. Louis MO的 Sigma-Aldrich的商標名CelLytic B 可商業(yè)地獲得的。分離酮還原酶多肽的色譜技術(shù),包括但不限于反相色譜、高效液相色譜、離子交換 色譜、凝膠電泳和親和色譜。純化特定的酶的條件會部分依賴于諸如凈電荷、疏水性、親水 性、分子量、分子形狀等因素,而且對本領域的技術(shù)人員將是顯而易見的。在一些實施方式中,親和技術(shù)可用于分離改善的酮還原酶。對于親和色譜純化, 可應用特異性結(jié)合酮還原酶多肽的任何抗體。對于抗體的產(chǎn)生,不同宿主動物,包括但不 局限于兔、小鼠、大鼠等,可通過注射工程多肽免疫。通過側(cè)鏈功能基團或附加在側(cè)鏈功 能基團上的接頭的方法,多肽可附加在合適的載體諸如BSA上。依賴于宿主物種,不同的 佐劑可用于提高免疫應答,包括但不局限于弗氏(完全和不完全),諸如氫氧化鋁的礦物 質(zhì)膠,諸如溶血卵磷脂、普朗尼克多元醇、多聚陰離子、肽、油乳劑、匙孔血藍蛋白,二硝基 酚的表面活性物質(zhì),以及諸如BCG(bacilli CalmetteGuerin,卡介苗)和短小棒狀桿菌 (Corynebacterium parvum)的■作用的入齊LU1. 6使用工程酮還原酶的方法以及用其制備的化合物在一些實施方式中,本文所述的酮還原酶能夠催化具結(jié)構(gòu)式(I)的化合物2-苯甲 酰氨基甲基-3-氧丁酸甲酯(“底物”)的酮基 至相應的具結(jié)構(gòu)式(II)的立體異構(gòu)醇產(chǎn)物,2S,3R-2_苯甲酰氨基甲基-3-羥基丁 酸甲酯(“產(chǎn)物”)的還原反應 在一些實施方式中,具式(I)的底物為外消旋混合物,如式(Ia)所示, 并且2S,3R選擇性酮還原酶可用于還原或轉(zhuǎn)化下面的方案1所示的反應中的外消 旋底物以制備具式(II)的產(chǎn)物 方案1相應地,在一些實施方式中,本公開中酮還原酶可用于以至少約60%的立體異構(gòu) 體過量將具結(jié)構(gòu)式(I)的底物立體選擇性地還原為具結(jié)構(gòu)式(II)的相應產(chǎn)物的方法,該方 法包括在適合于將所述底物還原或轉(zhuǎn)化為具式(II)的產(chǎn)物的反應條件下將具式(I)或式 (Ia)的底物與本公開的2S,3R選擇性酮還原酶多肽接觸或培養(yǎng)。在本方法的一些實施方式 中,式(II)的產(chǎn)物以至少約85%的立體異構(gòu)體過量具生成。在本方法的一些實施方式中, 2S,3R選擇性酮還原酶多肽與野生型克菲爾乳桿菌、短乳桿菌或小乳桿菌KRED序列SEQ ID No :4、2和86相比,具有至少以下特征殘基202為纈氨酸或亮氨酸。在一些實施方式中, 2S,3R選擇性酮還原酶多肽與野生型克菲爾乳桿菌、短乳桿菌或小乳桿菌KRED序列SEQ ID No :4、2和86相比,具有至少以下特征(1)相應于X94的殘基為脂肪族或極性殘基;(2)相 應于X199的殘基為脂肪族、受限或極性殘基;并且(3)相應于X202的殘基為纈氨酸或亮氨 酸。在一些實施方式中,2S,3R選擇性酮還原酶多肽與野生型克菲爾乳桿菌、短乳桿菌或小 乳桿菌KRED序列SEQ ID No :4、2和86相比,具有至少以下特征(1)相應于94的殘基為 極性殘基,(2)相應于199的殘基為受限殘基,并且(3)相應于X202的殘基為纈氨酸或亮 氨酸。在將底物轉(zhuǎn)化為具結(jié)構(gòu)式(II)的產(chǎn)物的方法的一些實施方式中,以至少約 60-89%的立體異構(gòu)體過量百分比和比具有SEQ ID NO :48的氨基酸序列的多肽能夠達到的 速率高至少約1-15倍的速率將底物轉(zhuǎn)化為產(chǎn)物??捎迷谒龇椒ㄖ械氖纠缘亩嚯陌?但不局限于包含相應于 SEQ ID NO :6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、 38、40、42、46、50、52、54、56、58、60 和 62 的氨基酸序列的多肽。在將底物轉(zhuǎn)化為具結(jié)構(gòu)式(II)的產(chǎn)物的方法的一些實施方式中,以至少約 90-94%的立體異構(gòu)體過量百分比將底物轉(zhuǎn)化為產(chǎn)物??捎迷谒龇椒ㄖ械氖纠缘亩嚯?包括但不局限于包含相應于SEQ ID NO :6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、 36、40、42、50、52、56、58、60和62的氨基酸序列的多肽。
在一些實施方式中,具式⑴的底物為外消旋的混合物,如結(jié)構(gòu)式(Ia)中所示,并 且2R,3R選擇性酮還原酶可用于還原或轉(zhuǎn)化如下面的方案3中所示的外消旋的底物以制備 具式(III)的產(chǎn)物 方案2在將底物轉(zhuǎn)化為具結(jié)構(gòu)式(III)的產(chǎn)物的方法的一些實施方式中,以至少約85% 的立體異構(gòu)體過量百分比將底物轉(zhuǎn)化為產(chǎn)物??捎糜诒痉椒ㄖ械氖纠缘亩嚯陌ǖ痪?限于包含相應于SEQ ID N0:68、72、74、76、78和82的氨基酸序列的多肽。在將底物轉(zhuǎn)化為具結(jié)構(gòu)式(III)的產(chǎn)物的方法的一些實施方式中,以比具有SEQ ID NO 66的氨基酸序列的多肽能夠達到的速率高至少約1倍的速率將底物轉(zhuǎn)化為產(chǎn)物。 可用于本方法中的示例性的多肽包括但不局限于包含相應于SEQ ID N0:64、68、70、72、74、 76、78、80和82的氨基酸序列的多肽。在一些實施方式中,本文所述的酮還原酶可用于合成碳雜青霉烯的方法,該方法 包括如下所示(方案3)的一般過程, 方案 3 在將底物轉(zhuǎn)化為具結(jié)構(gòu)式(II)的產(chǎn)物的方法的一些實施方式中,以至少約 95-99%的立體異構(gòu)體過量百分比將底物轉(zhuǎn)化為產(chǎn)物??捎迷谒龇椒ㄖ械氖纠缘亩嚯?包括但不局限于包含相應于SEQ ID NO :6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、 42、50、52、56、58、60和62的氨基酸序列的多肽。在一些實施方式中,本文所述的酮還原酶能夠催化具結(jié)構(gòu)式(I)的化合物的酮基 基團至具結(jié)構(gòu)式(III)的相應的立體異構(gòu)醇產(chǎn)物2R,3R-2-苯甲酰氨基甲基-3-羥基丁酸 甲酯,(其也可稱為”產(chǎn)物”)的還原反應
其中KRED可為本發(fā)明的酮還原酶多肽中的任何一種。具通式(V)的碳雜青霉烯 在下面進一步詳細描述。對于不同基于碳雜青霉烯的治療劑的合成,一種重要的中間體為 具結(jié)構(gòu)式(IVa)的化合物,
(IVa)其中R1為H或羥基保護基團,而且Rltl為鹵素(例如,Cl)或-OAc (Ac為乙酸)。 不同的羥基保護基團在本領域內(nèi)為公知,并且包括,舉例但不局限于,甲硅烷基醚(例如, 叔丁基二甲基甲硅烷基)以及取代的二甲苯醚(參見,Green和Wuts,Protective Groups in Organic Synthesis (有機合成中的保護基團),Wiley_Interscience,New York,1999)。 相應地,在合成具結(jié)構(gòu)式(IVa)的中間體的方法中,方法中的步驟包括在適合于將底物還 原或轉(zhuǎn)化為具式(II)的產(chǎn)物的反應條件下將具式(I)的底物與本公開的酮還原酶接觸 或反應。其中Riq為-OAc的具式(IVa)的中間體的合成描述于Tetrahedron Lett. 23 2293(1982) ;Tetrahedron Lett. 39 2399(1983) ;Tetrahedron Lett. 39 2505(1983); EP0290385 ;的EP0369691 ;所有參考文獻以引用方式并入本文。在一些實施方式中,其中Riq 為-OAc的具式(IVa)的中間體可如方案4中所示合成 方案4在方案4中,方法包括(a)在適合于將底物還原為具式(II)的產(chǎn)物的反應條 件下將底物與本公開的2S,3R選擇性酮還原酶多肽接觸或反應以將具式(I)的底物還原 為具式(II)的產(chǎn)物;(b)移除基團-C(O)C6H5以形成化合物(VI) ; (c)通過與三苯基膦和N-叔丁基-2-苯并噻唑基亞磺酰胺反應將具式(VI)的化合物轉(zhuǎn)化為具式(VII)的β-內(nèi) 酰胺(參見例如,Tetrahedron Lett. 1995,36 (21) 3703) ; (d)與叔丁基二甲基氯硅烷 (TBDMS-Cl)反應以形成具式(VIII)的化合物;以及(e)在過乙酸和釕存在下乙酰氧基化 具式(VIII)的化合物以形成具式(IV)的中間體(參見例如,Murahashi等人,1990,J. Am. Chem. Soc. 112(21) :7820_7822)。在一些實施方式中,在基于碳雜青霉烯的治療劑的合成中的另外一個中間體為具 結(jié)構(gòu)式(IX)的中間體 其中R2為II或C1-C4烴基(例如,-CH3);R3為II或羥基保護基團;R4為II、羥基保護基團、氨基、堿金屬或堿土金屬;而且X為OH或離去基團。示例性的離去基團包括但不 局限于-OP(O) (OR')或OS(02)R",其中R'和R"可為C1-C6烴基、C1-C6烷芳基、芳香 基、全氟代C1-C6烴基。R4的保護基團可為但不局限于芐基、對硝基甲苯基以及甲氧基甲 基。具結(jié)構(gòu)式(IX)的中間體和其合成的描述提供于不同的參考文獻中,例如,美國專利第 5,317,016號;美國專利第4,933,333號;和WO 0236594 ;其公開以引用的形式并入本文。 相應地,在一些實施方式中,在合成具式(IX)的中間體的方法中,方法中的步驟包括在適 合于將底物還原或轉(zhuǎn)化為具式(II)的產(chǎn)物的反應條件下將具式(I)的底物與本公開的酮 還原酶接觸或反應。在一些實施方式中,本公開中酮還原酶可用于基于碳雜青霉烯的具結(jié)構(gòu)式(V)的 治療劑化合物或其溶劑化物、水合物、鹽和前藥的合成過程 其中R2為H或-CH3 ;R5可為不同的取代基,包括但不局限于,取代的或未取代的烴 基、取代的或未取代的芳香基、取代的或未取代的雜烴基、取代的或未取代的雜環(huán)烴基、以 及取代的或未取代的雜芳香基烴基;而且R6為H或諸如可水解的酯基團的前體基團。如本 文所用,前體基團指當用于屏蔽活性藥物的功能基團以形成前體部分時將藥物轉(zhuǎn)化為前藥 的保護基團的類型。前體基團典型地通過在特定的使用條件下可切斷的鍵而附加在藥物的 功能基團上。因此,前體基團為在特定的使用條件下切斷以釋放功能基團的前體部分的一 部分。羧基基團可被屏蔽為酯(包括甲硅烷基酯和硫酯)、酰胺或酰胼前體部分,其可在體內(nèi)水解以提供羧基基團。合適的前體基團以及其相應的前體部分的其他特定的例子對于本 領域內(nèi)技術(shù)人員是明顯的。相應地,在合成具結(jié)構(gòu)式(V)的化合物的方法中,方法中的步 驟可包括在適合于將底物還原或轉(zhuǎn)化為具式(II)的產(chǎn)物的反應條件下將具式(I)的底物 與本公開的酮還原酶接觸或反應。基于碳雜青霉烯的不同治療劑化合物的合成描述于包 括但不局限于美國專利第 4,925,836 ;5,317,016 號;WO 02/036594 ;W02004/067532 ;和 WO 2007/104221 ;其公開以引用方式并入本文。在一些實施方式中,本公開中酮還原酶可用于合成具有下列結(jié)構(gòu)(X)的亞胺培南
或其溶劑化物、水合物、前藥和鹽的合成
CO2H(X)亞胺培南具有廣譜的抗需氧和厭氧革蘭氏陽性或陰性細菌的活性。亞胺培南對于 銅綠假單胞菌(Pseudomonas aeruginosa)禾口腸球菌禾中(Enterococcusspecies)尤其有效。 相應地,在合成具結(jié)構(gòu)式(X)的亞胺培南的方法中,方法中的步驟可包括在適合于將底物 還原或轉(zhuǎn)化為具式(II)的產(chǎn)物的反應條件下將具式(I)的底物與本公開的酮還原酶接觸 或反應。從具結(jié)構(gòu)式(VI)的中間體制備亞胺培南的程序描述于WO 0236594,在此以引用的 方式并入本文。在一些實施方式中,本公開的酮還原酶可用于具有結(jié)構(gòu)式(XI)的多利培南或其 溶劑化物、水合物或鹽的合成
H V0
CO2H(XI)多利培南具有與亞胺培南或厄他培南相似的抗革蘭氏陽性球菌的譜系和能力,并 且具有與美洛培南相似的抗革蘭氏陰性菌的活性。相應地,在合成具結(jié)構(gòu)式(XI)的多利培 南的方法中,方法中的步驟可包括在適合于將底物還原或轉(zhuǎn)化為具式(II)的產(chǎn)物的反應 條件下將具式(I)的底物與本公開的酮還原酶接觸或反應。從具式(VI)的中間體制備多 利培南的過程描述于美國專利第5,317,016號,在此以引用的方式并入本文。在一些實施方式中,本公開的酮還原酶可用于具有結(jié)構(gòu)式(XII)的美洛培南或其
溶劑化物、水合物、前藥和鹽的合成 美洛培南被確認用于諸如闌尾炎和腹膜炎的腹內(nèi)感染的治療;細菌性腦膜炎的治 療;以及由可疑生物體導致的皮膚和皮膚結(jié)構(gòu)感染的治療。相應地,在合成具結(jié)構(gòu)式(XII) 的美洛培南的方法中,方法中的步驟包括在適合于將底物還原或轉(zhuǎn)化為具式(II)的產(chǎn)物 的反應條件下將具式(I)的底物與本公開的酮還原酶接觸或反應。制備美洛培南的過程描 述于WO 2007/104221,在此以引用的方式并入本文。在一些實施方式中,本公開的酮還原酶可用于具有結(jié)構(gòu)式(XIII)的厄他培南或
其溶劑化物、水合物、前藥和鹽的合成
(XIII)厄他培南可有效地抗革蘭氏陰性細菌,但是對抗MRSA、氨芐西林-耐受性腸球菌, 銅綠假單胞菌或不動桿菌種(Acinetobacter species)無活性。厄他培南還對抗厭氧細菌 有臨床有效活性。厄他培南主要用于抗超廣譜的產(chǎn)生內(nèi)酰胺酶(ESBL)和產(chǎn)生高水平 的AmpC的革蘭氏陰性細菌。相應地,在合成具式(XIII)的厄他培南的方法中,方法中的步 驟包括在適合于將底物還原或轉(zhuǎn)化為具式(II)的產(chǎn)物的反應條件下將具式(I)的底物與 本公開的酮還原酶接觸或反應。制備厄他培南的過程描述于美國專利第5,478,820號和美 國專利第7,342,005號,在此以引用的方式并入本文。在一些實施方式中,本公開的酮還原酶可用于具有結(jié)構(gòu)式(XIV)的比阿培南或其
溶劑化物、水合物、前藥或鹽的合成
(XIV)比阿培南為對于廣泛范圍的革蘭氏陽性和革蘭氏陰性細菌具有抗細菌活性的非 腸道的碳雜青霉烯,并且能夠抗人類腎臟脫氫肽酶-I (DHP-I)。比阿培南也顯示抗厭氧細菌 的體外活性。相應地,在合成具式(XIV)的比阿培南的方法中,方法中的步驟包括在適合于 將底物還原或轉(zhuǎn)化為具式(II)的產(chǎn)物的反應條件下將具式(I)的底物與本公開的酮還原 酶接觸或反應。從中間體(IVa)制備比阿培南的過程描述于美國專利第4,925,836號,在 此以引用的方式并入本文。在一些實施方式中,本公開的酮還原酶可用于具有結(jié)構(gòu)式(XII)的帕尼培南或其 溶劑化物、水合物和鹽的合成
(XV) 相應地,在合成具式(XV)的帕尼培南的方法中,方法中的步驟包括在適合于將 底物還原或轉(zhuǎn)化為具式(II)的產(chǎn)物的反應條件下將具式(I)的底物與本公開的酮還原 酶接觸或反應。從具式(II)的中間體得到的帕尼培南描述于Miyadera等人,1983,J Antibiotic (Tokyo) 36 (8) :1034_1039 ;以及 Hirai 等人,1999,J. Synth Org. Chem. 57 (5) 382-386,在此以引用的方式并入本文。在一些實施方式中,本公開的酮還原酶可用于具式(XVI)的硫培南化合物的合成
方法
(XVI) 其中R6為H或前體基團,而且R8可為取代的或未取代的烴基;取代的或未取代的 芳香基,取代的或未取代的雜烴基,取代的或未取代的雜環(huán)烴基,以及取代的或未取代的雜 芳香基烴基,或-SR9,其中R9可為如R8所述的取代基。他用于生物活性硫培南治療劑化合 物中的R8的其取代基在本領域是公知的,其中一些進一步描述如下。硫培南的描述可在不限于以下的文獻中發(fā)現(xiàn)美國專利第3,951,954號;美國專利第4,234,579號;美國專利第 4,287,181號;美國專利第4,452,796號;美國專利第4,343,693號;美國專利第4,348,264 號;美國專利第4,416,891號;美國專利第4,457,924號;美國專利第5,013,729號;美國 專利第 5,506, 225 ;Volkmann 等人,1992,J. Org. Chem. 57 :4352_4361 ;以及 Volkmann 和 O' Neill, 1991, Strategies andTactics in Organic Synthesis (有機合成中的手段和策 略),第13卷,485-534頁;其公開以引用的方式并入本文。相應地,在合成具結(jié)構(gòu)式(XVI) 的硫培南的方法中,方法中的步驟包括在適合于將底物還原或轉(zhuǎn)化為具式(II)的產(chǎn)物的 反應條件下將式(I)的底物與本公開的酮還原酶接觸或反應。在一些實施方式中,本公開的酮還原酶可用于具式(XVII)的硫培南或其溶劑化 物、水合物、前藥和鹽的合成方法 其中R6為H或前體基團。相應地,在合成具式(XVII)的化合物的方法中,方法 中的步驟包括在適合于將底物還原或轉(zhuǎn)化為具式(II)的產(chǎn)物的反應條件下將具式(I)的 底物與本公開的酮還原酶接觸或反應。具式(XVII)的硫培南的合成過程描述于美國專利 第5,013,729號。R6的不同的前體基團描述于美國申請公布2008/0009474,美國申請公布 2008/0125408 ;以及 Wujcik 等人,2008,Rapid Commun· Mass Spectrom. 22 :3195_3206 ;其 公開內(nèi)容在此以引用的方式并入本文。在一些實施方式中,本公開的酮還原酶可用于具有結(jié)構(gòu)式(XVIII)的硫培南或其
溶劑化物、水合物、前藥和鹽的合成方法 其中R6為H或前體基團。相應地,在合成具式(XVIII)的帕尼培南的方法中,方法 中的步驟包括在適合于將底物還原或轉(zhuǎn)化為具式(II)的產(chǎn)物的反應條件下將具式(I)的 底物與本公開的酮還原酶接觸或反應。具式(XVIII)的硫培南的合成過程描述于美國專利 第 5,506,225 號和 WO 2007/039885。可用在此公開的酮還原酶合成的另一硫培南化合物為具式(XIX)的硫培南 相應地,在合成具式(XIX)的化合物或其溶劑化物、水合物、前藥和鹽的方法中, 方法中的步驟包括在適合于將底物還原或轉(zhuǎn)化為具式(II)的產(chǎn)物的反應條件下將具式 (I)的底物與本公開的酮還原酶接觸或反應。具結(jié)構(gòu)式(XIX)的利替培南描述于美國專利 第 4,482,565 號。在一些實施方式中,本公開的酮還原酶可用于具有結(jié)構(gòu)式(XX)的硫培南或其溶 劑化物、水合物、前藥和鹽的合成方法 相應地,在合成具式(XX)的化合物的方法中,方法中的步驟包括在適合于將底物 還原或轉(zhuǎn)化為具式(II)的產(chǎn)物的反應條件下將具式(I)的底物與本公開的酮還原酶接觸 或反應。具結(jié)構(gòu)式(XX)的化合物描述于EP1336612;在此以引用的方式并入本文。在一些實施方式中,本公開的酮還原酶可用于具有結(jié)構(gòu)式(XXI)的化合物或其溶 劑化物、水合物、前藥和鹽的合成方法 相應地,在合成具式(XXI)的化合物的方法中,方法中的步驟包括在適合于將底 物還原或轉(zhuǎn)化為具式(II)的產(chǎn)物的反應條件下將具式(I)的底物與本公開的酮還原酶接 觸或反應。具結(jié)構(gòu)式(XXI)的化合物描述于JP2002114788;在此以引用的方式并入本文。在一些實施方式中,本公開的酮還原酶可用于具有結(jié)構(gòu)式(XXII)的硫培南或其
溶劑化物、水合物、前藥和鹽的合成方法
(XXII)相應地,在合成具式(XXII)的化合物的方法中,方法中的步驟包括在適合于將底 物還原或轉(zhuǎn)化為具式(II)的產(chǎn)物的反應條件下將具式(I)的底物與本公開的酮還原酶 接觸或反應。具結(jié)構(gòu)式(XXII)的化合物描述于美國專利第6,924,279號和美國專利第 7,034,150號,其公開內(nèi)容在此以引用的方式并入本文。在一些實施方式中,本公開的酮還原酶可用于具有結(jié)構(gòu)式(XXIII)的硫培南或其 溶劑化物、水合物、前藥和鹽的合成方法 相應地,在合成具式(XXIII)的化合物的方法中,方法中的步驟包括在適合于將 底物還原或轉(zhuǎn)化為具式(II)的產(chǎn)物的反應條件下將具式(I)的底物與本公開的酮還原酶 接觸或反應。具結(jié)構(gòu)式(XXIII)的化合物描述于W02008/047909和美國專利第5,659,043 號,其公開內(nèi)容在此以引用的方式并入本文。在一些實施方式中,本公開的酮還原酶可作為與酮還原酶作用的底物和/或與由 酮還原酶反應產(chǎn)生的產(chǎn)物的組合物存在,例如反應組合物。相應地,在一些實施方式中,組 合物可含有本公開的2S,3R選擇性酮還原酶和具結(jié)構(gòu)式(I)的底物。在一些實施方式中, 組合物可含有本公開的2S,3R選擇性酮還原酶和具結(jié)構(gòu)式(II)的產(chǎn)物。在一些實施方式 中,組合物可含有本公開的2S,3R選擇性酮還原酶、具式(I)的底物以及具式(II)的產(chǎn)物。在一些實施方式中,組合物可含有本公開的2R,3R選擇性酮還原酶和具結(jié)構(gòu)式 (I)的底物。在一些實施方式中,組合物可含有本發(fā)明的2R,3R選擇性酮還原酶和具結(jié)構(gòu)式 (III)的產(chǎn)物。在一些實施方式中,組合物可含有本公開的2R,3R選擇性酮還原酶、式(I) 的底物以及具式(III)的產(chǎn)物。因為酮還原酶反應可在存在輔因子(NADH或NADPH)再生系統(tǒng)下進行,反應條件可 進一步包括輔因子再生系統(tǒng)的要素,其在以下進一步具體闡述。相應地,在一些實施方式 中,前述的酮還原酶組合物還可包括含有葡萄糖脫氫酶和葡萄糖;甲酸脫氫酶和甲酸;或 異丙醇和仲醇脫氫酶的輔因子再生系統(tǒng)。在一些實施方式中,所述仲醇脫氫酶為工程酮還 原酶??捎糜谳o因子再循環(huán)的其他酶和底物在本領域內(nèi)技術(shù)人員中是公知的。
(XXIII)
如本領域技術(shù)人員所知的,酮還原酶催化的還原反應典型地需要輔因子。由本文 所述的工程酮還原酶催化的還原反應還典型地需要輔因子,盡管工程酮還原酶的許多實施 方式需要比由野生型酮還原酶催化的反應少得多的輔因子。如本文所用,術(shù)語"輔因子" 指與酮還原酶聯(lián)合操作的非蛋白質(zhì)化合物。適用于本文所述的工程酮還原酶的輔因子包括 但不局限于NADP+(煙酰胺腺嘌呤二核苷酸磷酸),NADPH(NADP+的還原形式)、NAD+(煙酰胺 腺嘌呤二核苷酸)和NADH(NAD+的還原形式)。通常,還原形式的輔因子被加入反應混合物 中。還原的NAD(P)H形式可任選地使用輔因子再生系統(tǒng)從氧化的NAD(P)+形式中再生。術(shù)語〃輔因子再生系統(tǒng)〃指參與將氧化形式輔因子還原(例如,NADP+至NADPH) 的反應的一組反應物。由酮還原酶催化酮基底物還原而氧化的輔因子可被輔因子再生系統(tǒng) 再生為還原形式。輔因子再生系統(tǒng)包含為還原氫等同物的來源和能夠還原輔因子的氧化形 式的化學計量的還原物。輔因子再生系統(tǒng)也可包含催化還原劑對氧化形式的輔因子的還原 的催化劑,例如酶催化劑。從NAD+或NADP+中分別再生NADH或NADPH的輔因子再生系統(tǒng)在 本領域內(nèi)是公知的,并且可用于本文所述的方法??墒褂玫暮线m的示例性的輔因子再生系統(tǒng)包括但不局限于葡萄糖和葡萄糖脫氫 酶,甲酸和甲酸脫氫酶,葡萄糖6-磷酸和葡萄糖-6-磷酸脫氫酶,仲醇(例如,異丙醇)和 仲醇脫氫酶,亞磷酸鹽和亞磷酸鹽脫氫酶,分子氫和氫化酶,以及類似系統(tǒng)。這些系統(tǒng)可與 作為輔因子的NADP+/NADPH或NAD+/NADH聯(lián)合使用。使用氫化酶的電化學再生也可用作輔 因子再生系統(tǒng)。參見例如,美國專利第5,538,867和6,495,023號,二者以引用形式并入本 文。包含金屬催化劑和還原試劑(例如,分子氫或甲酸)的化學輔因子再生系統(tǒng)也適用。參 見例如,PCT公布WO 2000/053731,在此以引用的方式并入本文。術(shù)語〃葡萄糖脫氫酶〃和〃⑶H"在此可交換使用,指催化D-葡萄糖和NAD+或 NADP+分別至葡萄糖酸和NADH或NADPH的NAD+或NADP+-依賴酶。如下反應式(1),描述葡 萄糖脫氫酶催化的NAD+或NADP+被葡萄糖還原。
0) 葡萄糖 + NAD(P)+ + H2O -- 葡萄糖酸 + NAD(P)H + H+適用于本文所述的方法的實踐的葡萄糖脫氫酶包括自然存在的葡萄糖脫氫酶以 及非自然存在的葡萄糖脫氫酶。自然存在的葡萄糖脫氫酶編碼基因在文獻中有報道。例如, 枯草芽孢桿菌61297⑶H基因在大腸埃希氏菌中表達,并且據(jù)報道顯示與在天然宿主中產(chǎn) 生的酶相同的物理化學的性質(zhì)(Vasantha等人,1983,Proc. Natl. Acad. ScL USA 80 785)。 相應于Genbank登錄號M12276的枯草芽孢桿菌GDH基因的基因序列,報道于Lampel等人, 1986,J. Bacteriol. 166 =238-243,并且作為Genbank登錄號D50453以校正的形式報道于 Yamane等人,1996,Microbiologyl42 :3047_3056。自然存在的⑶H基因也包括編碼來自以 下的那些基因蠟狀芽胞桿菌(B. cereus)ATCC 14579 (Nature, 2003,423 :87_91 ;Genbank 登錄號 AEO17013)以及來自巨大芽孢桿菌(B. megaterium) (Eur. J. Biochem.,1988,174 485-490,Genbank 登錄號 X12370 J. Ferment. Bioeng.,1990,70 :363_369,Genbank 登錄 號GI216270)。來自芽胞桿菌種的葡萄糖脫氫酶在PCT公布W02005/018579中提供為SEQ ID NO 10和12 (分別由PCT公布中相應于SEQ ID NO :9和11的多核苷酸序列編碼),其公 開內(nèi)容在此以引用的方式并入本文。非自然存在的葡萄糖脫氫酶可通過已知的方法產(chǎn)生,諸如,例如誘變、定向進化和類似方法。具有適當活性的GDH酶,無論是自然存在的還是非自然存在的,可使用描述 于PCT公布WO 2005/018579的實施例4中的測定法容易地確定,其公開內(nèi)容在此以引用 的方式并入本文。示例性的非自然存在的葡萄糖脫氫酶在PCT公布WO 2005/018579中提 供為SEQ IDNO :62、64、66、68、122、124和126。編碼他們的多核苷酸序列在PCT公布WO 2005/018579中分別提供為SEQ ID NO :61、63、65、67、121、123和125。所有這些序列在此 以引用的形式并入本文。適用于本文所述的酮還原酶催化還原反應的另外的非自然存在的 葡萄糖脫氫酶提供于美國申請公布第2005/0095619和2005/0153417號,其公開內(nèi)容在此 以引用的方式并入本文。應用于本文所述的酮還原酶催化的還原反應的葡萄糖脫氫酶可在描述于PCT公 布WO 2005/018579的實施例4中的測定法中顯示至少約10 μ mol/min/mg和有時至少約 102μ mol/min/mg 或約 IO3 μ mol/min/mg、多達約 IO4 μ mol/min/mg 或更高的活性。本文所述的酮還原酶催化的還原反應通常發(fā)生于溶劑中。合適的溶劑包括水、有 機溶劑(例如,乙酸乙酯、乙酸丁酯、1-辛醇、庚烷、辛烷、甲基叔丁基醚(MTBE)、甲苯及類似 有機溶劑)、離子液體(例如,1-乙基4-甲基咪唑鐺四氟硼酸、1-丁基-3-甲基咪唑鐺四氟 硼酸、1-丁基-3-甲基咪唑六氟磷酸及類似離子液體)。在一些實施方式中,使用包括水和 水性共溶劑系統(tǒng)的水性溶劑。示例性的水性共溶劑系統(tǒng)包含水和一種或多種有機溶劑。通常,選擇水性共溶劑 系統(tǒng)的有機溶劑組分以便其不完全使酮還原酶失活。通過用在候選溶劑系統(tǒng)中的感興趣的 確定的底物并應用諸如本文所述的酶活性測定法而測量工程酮還原酶的活性,合適的共溶 劑系統(tǒng)可被容易地確定。水性共溶劑系統(tǒng)中的有機溶劑可與水性組分混溶,提供單一的液相,或可與水性 組分部分混溶或不混溶,提供雙液相。通常,當應用水性共溶劑系統(tǒng)時,其選用為水分散 于有機溶劑中,或者相反的兩相。通常,當使用水性共溶劑系統(tǒng)時,需要選擇可易于與水相 分離的有機溶劑。通常,共溶劑系統(tǒng)中水和有機溶劑的比率典型地在從約90 10到約 10 90 (ν/ν)有機溶劑比水的范圍內(nèi),以及在80 20和20 80 (ν/ν)有機溶劑比水之 間。共溶劑系統(tǒng)可在加入反應混合物之前提前形成,或可在反應容器中原位形成。水性溶液(水或水性共溶劑系統(tǒng))可為ρΗ-緩沖的或非緩沖的。通常,還原可在 PH約10或更低、通常在從約5至約10的范圍內(nèi)發(fā)生。在一些實施方式中,還原在ρΗ約9 或更低、通常在從約5至約9的范圍內(nèi)發(fā)生。在一些實施方式中,還原可在ρΗ約8或更低、 經(jīng)常在從約5至約8的范圍內(nèi)發(fā)生、以及通常在從約6至約8的范圍內(nèi)發(fā)生。還原可在ρΗ 約7. 8或更低,或7. 5或更低下發(fā)生??蛇x擇地,還原可在中性ρΗ,也就是約7下發(fā)生。在還原反應的過程中,反應混合物的ρΗ可改變。反應混合物的ρΗ可通過在反應 過程中加入酸或堿保持在需要的PH或在需要的ρΗ范圍內(nèi)。可選擇地,ρΗ可使用包含緩沖 液的水性溶液控制。保持需要的PH范圍的合適的緩沖液在本領域內(nèi)是公知的,包括,例如, 磷酸緩沖液、三乙醇胺緩沖液和類似緩沖液。也可使用緩沖液和酸或堿的組合。當應用葡萄糖/葡萄糖脫氫酶輔因子再生系統(tǒng)時,如果產(chǎn)生的葡萄糖酸不以別的 方式中和,如在反應式(3)中所示的葡萄糖酸(pKa = 3.6)的共同產(chǎn)生引起反應混合物的 PH下降。反應混合物的ρΗ可通過標準的緩沖技術(shù)保持在需要的水平,其中緩沖液中和葡萄 糖酸直至所提供的緩沖容量,或通過在轉(zhuǎn)化過程的同時加入堿。也可用加入緩沖液和加入堿的組合。保持所需PH范圍的適當?shù)木彌_液如上所述。中和葡萄糖酸的合適的堿為有機 堿例如胺、醇鹽和類似有機堿,以及無機堿,例如氫氧化物鹽(例如,NaOH)、碳酸鹽(例如, NaHCO3)、碳酸氫鹽(例如,K2CO3)、堿性磷酸鹽(例如,K2HPO4, Na3PO4)及類似無機堿。在轉(zhuǎn) 化過程中同時加入堿可在監(jiān)測反應混合物PH的同時手工完成,或更方便地通過使用自動 滴定器作為PH固定器(pHstat)。部分緩沖容量和堿加入的組合可用于過程控制。當堿加入用于中和在酮還原酶催化的還原反應中釋放的葡萄糖酸時,轉(zhuǎn)化的發(fā)展 可通過保持PH而加入的堿的量來監(jiān)控。典型地,在還原過程中加入非緩沖的或部分緩沖的 反應混合物的堿以水性溶液加入。在一些實施方式中,輔因子再生系統(tǒng)可包含甲酸脫氫酶。術(shù)語〃甲酸脫氫酶〃 和‘‘FDH“在此可交換使用,指分別催化甲酸和NAD+或NADP+至二氧化碳和NADH或NADPH的 轉(zhuǎn)化的NAD+或NADP+-依賴酶。適用于本文所述的酮還原酶催化的還原反應的輔因子再生系 統(tǒng)包括自然存在的甲酸脫氫酶以及非自然存在的甲酸脫氫酶。甲酸脫氫酶包括那些PCT公 布 W02005/018579 中相應于 SEQ ID NO 70 (假單胞菌種(Pseudomonas sp.))和 72(博伊丁 假絲酵母(Candida boidinii))的甲酸脫氫酶,分別由相應于PCT公布WO 2005/018579中 SEQ ID NO :69和71的多核苷酸序列編碼,其公開內(nèi)容在此以引用的方式并入本文。應用于 本文所述的方法的甲酸脫氫酶,無論是自然存在的或非自然存在的,可在描述于PCT公布 W02005/018579的實施例4中的測定法中顯示至少約1 μ mol/min/mg,有時至少約10 μ mol/ min/mg,或至少約IO2 μ mol/min/mg,多達約IO3 μ mol/min/mg或更高的活性。如本文所用,術(shù)語"甲酸"(formate)指甲酸陰離子(HC02_)、甲酸(HCO2H)及其 混合物。甲酸可以鹽的形式提供,典型地為堿金屬鹽或銨鹽(例如,HCO2Na, KHCO2NH4及類 似物),以甲酸的形式提供,典型地為水性甲酸,或其混合物。甲酸為中等酸。在其PKa(在 水中pKa = 3. 7)的幾個pH單位之間的水性溶液中,甲酸以HC02_和HCO2H在平衡濃度下存 在。在PH值高于約pH4時,甲酸以HC02_優(yōu)勢存在。當甲酸提供為甲酸時,反應混合物典型 地被緩沖或通過加入堿以提供需要的PH,典型地為約pH5或更高減少酸化。中和甲酸的合 適的堿包括但不局限于諸如胺、醇鹽和類似有機堿的有機堿,以及無機堿,例如氫氧化物鹽 (例如,NaOH)、碳酸鹽(例如,NaHCO3)、碳酸氫鹽(例如,K2C03)、堿性磷酸鹽(例如,K2HPO4, Na3PO4),以及類似物。對于大于約pH5的pH值,其中甲酸以HC02_優(yōu)勢存在,如下反應式(2),描述甲酸 鹽脫氫酶_催化的NAD+或NADP+被甲酸的還原。 當甲酸和甲酸脫氫酶用做輔因子再生系統(tǒng)時,反應混合物的pH可通過標準的緩 沖技術(shù)保持在需要的水平,其中緩沖液釋放質(zhì)子直至所提供的緩沖容量,或者通過在轉(zhuǎn)化 的過程的同時加入酸。在反應過程中加入以保持PH的合適的酸包括諸如羧酸、磺酸、膦酸 和類似物的有機酸,諸如氫鹵酸(例如氫氯酸)、硫酸、磷酸及類似酸的礦物質(zhì)酸,酸式鹽, 例如二氫磷酸鹽(例如,KH2PO4)、硫酸氫鹽(例如,NaHSO4)和類似酸式鹽。一些實施方式 應用甲酸,其中維持溶液的甲酸濃度和PH。當加入酸應用于在使用甲酸/甲酸脫氫酶輔因子再生系統(tǒng)的還原反應中以保持 PH時,轉(zhuǎn)化的進展可通過保持pH而加入的酸的量來監(jiān)測。典型地,在轉(zhuǎn)化過程中加入未緩沖的或部分緩沖的反應混合物的酸以水性溶液加入。術(shù)語〃仲醇脫氫酶〃和〃 sADH"在此可交換使用,指分別催化仲醇和NAD+或 NADP+至酮和NADH或NADPH的還原的NAD+或NADP+-依賴酶。如下反應式(3),描述NAD+或 NADP+被仲醇還原,圖示為異丙醇。 適用于本文所述的酮還原酶催化的還原反應的輔因子再生系統(tǒng)的仲醇脫氫酶包 括自然存在的仲醇脫氫酶以及非自然存在的仲醇脫氫酶。自然存在的仲醇脫氫酶包括來自 布氏嗜熱厭氧菌(Thermoanerobium brockii),紅平紅球菌(Rhodococcus etythropolis)、 克菲爾乳桿菌和短乳桿菌的已知的醇脫氫酶,而非自然存在的仲醇脫氫酶包括衍生自其中 的工程醇脫氫酶。應用于本文所述的方法的仲醇脫氫酶,無論是自然存在的或非自然存在 的,可顯示至少約lymol/min/mg,有時至少約10 μ mol/min/mg,或至少約102ymol/min/ mg,多達約IO3 μ mol/min/mg或更高的活性。合適的仲醇包括低級仲烷醇和芳香基烴基甲醇。低級仲醇的例子包括異丙醇、 2_ 丁醇、3-甲基-2-丁醇、3-戊醇、3,3-二甲基-2-丁醇和類似低級仲醇。在一個實施方 式中,仲醇為異丙醇。合適的芳香基烴基甲醇包括未取代的和取代的1-芳香基乙醇。當仲醇和仲醇脫氫酶應用為輔因子再生系統(tǒng)時,產(chǎn)生的NAD+或NADP+被采用仲醇 脫氫酶的仲醇至酮的偶聯(lián)氧化所還原。一些工程酮還原酶也具有將仲醇還原劑脫氫的活 性。在一些使用仲醇作為還原劑的實施方式中,工程酮還原酶和仲醇脫氫酶為相同的酶。在應用輔因子再生系統(tǒng)實現(xiàn)本文所述的酮還原酶催化的還原反應的實施方式中, 可最初提供氧化的或還原形式的輔因子。如上所述,輔因子再生系統(tǒng)將氧化的輔因子轉(zhuǎn)化 為其還原形式,然后其還原形式用于酮還原酶底物的還原在一些實施方式中,不使用輔因子再生系統(tǒng)。對于不使用輔因子再生系統(tǒng)進行的 還原反應,輔因子以還原形式加入反應混合物。在一些實施方式中,當所述過程使用宿主生物體的完整細胞進行時,完整細胞可 自然地提供輔因子。可選擇地或組合地,細胞可自然地或重組地提供葡萄糖脫氫酶。在進行本文所述的立體選擇性還原反應時,工程酮還原酶,以及包含任選的輔因 子再生系統(tǒng)的任何酶,可以純化的酶、用編碼所述酶的基因轉(zhuǎn)化的完整細胞、和/或細胞提 取物和/或所述細胞的裂解物的形式加入反應混合物中。編碼工程酮還原酶以及任選地輔 因子再生酶的基因可分別轉(zhuǎn)化入宿主細胞或一起轉(zhuǎn)化入相同的宿主細胞。例如,在一些實 施方式中,可轉(zhuǎn)化編碼工程酮還原酶的基因進入一組宿主細胞,并且可轉(zhuǎn)化編碼輔因子再 生酶的基因進入另外一組宿主細胞。兩組轉(zhuǎn)化的宿主細胞可以完整細胞的形式,或其衍生 的裂解物或提取物的形式一起用于反應混合物。在其他實施方式中,宿主細胞可被用編碼 工程酮還原酶和輔因子再生酶的基因轉(zhuǎn)化。轉(zhuǎn)化了編碼工程酮還原酶和/或任選的輔因子再生酶的完整細胞,或其細胞提取 物和/或裂解物可以各種不同的形式應用,包括固體(例如,凍干的、噴霧干燥的以及類似 固體)或半固體(例如,粗糊狀物)。細胞提取物或細胞裂解物可通過沉淀(硫酸銨、聚乙烯亞胺、熱處理或類似處理)部分純化,之后在低壓凍干前進行除鹽程序(例如,超濾、透析及類似程序)。任何細胞制品 可通過使用已知的交聯(lián)劑如,例如戊二醛交聯(lián)或固定到固相(例如,Eupergit C及類似固 相)而被穩(wěn)定。固體反應物(例如,酶、鹽等)可以各種不同的形式提供給反應,包括粉末(例如, 低壓凍干的、噴霧干燥的以及類似的粉末)、溶液、乳劑、懸浮液及類似形式。反應物可使用 為本領域普通技術(shù)人員共知的方法和儀器容易地凍干或噴霧干燥。例如,蛋白質(zhì)溶液可以 小量冷凍于-80°C,然后加入至預冷卻的凍干艙內(nèi),之后應用真空。在從樣品中移除水之后, 在釋放真空和回收凍干的樣品之前,典型地將溫度升高至4°C持續(xù)2小時。用于還原反應的反應物的量會根據(jù)所需產(chǎn)物的量以及伴隨著所應用的酮還原酶 底物的量而改變。以下指南可用于確定使用的酮還原酶、輔因子和任選的輔因子再生系統(tǒng) 的量。通常,酮底物可采用約20至300克/升的濃度,使用從約50mg至約5g酮還原酶以 及約IOmg至約150mg輔因子。本領域的普通技術(shù)人員會容易地理解如何改變這些量以使 其適用于所需要的產(chǎn)率水平和生產(chǎn)規(guī)模。任選的輔因子再生系統(tǒng)的合適的量可基于應用輔 因子和/或酮還原酶的量通過常規(guī)實驗而容易地確定。通常,使用超過酮還原酶底物等摩 爾水平的反應物(例如,葡萄糖、甲酸、異丙醇)以達到本質(zhì)上完全或接近完全的對酮還原 酶底物的轉(zhuǎn)化。加入反應物的順序不是嚴格的。反應物可同時一起加入至溶劑中(例如,單相溶 劑、雙相水性共溶劑系統(tǒng)和類似溶劑),或者可選擇地,一些反應物可分別加入,以及在不同 的時間點將一些反應物一起加入。例如,輔因子再生系統(tǒng)、輔因子、酮還原酶和酮還原酶底 物可首先加入溶劑中。為了當使用水性共溶劑系統(tǒng)時的改善的混合效率,輔因子再生系統(tǒng)、酮還原酶和 輔因子可首先加入和混合入水相。然后可加入和混合有機相,然后加入酮還原酶底物。可 選擇地,酮還原酶底物可在加入水相之前在有機相中預混合。進行本文所述的酮還原酶催化的還原反應的合適的條件包括可易于通過常規(guī)的 實驗優(yōu)化的許多條件,所述常規(guī)實驗包括但不局限于,在實驗PH和溫度下將工程酮還原酶 與底物接觸,使用在本文所提供的實施例所述的方法檢測產(chǎn)物。酮還原酶催化的反應典型地在從約15°C至約75°C范圍的溫度下進行。對于一些 實施方式,反應在約20°C至約55°C范圍的溫度下進行。在另外的實施方式中,反應在約 20°C至約45°C范圍的溫度下進行。反應也可在環(huán)境(ambient)條件下進行。通常允許還原反應進行至獲得基本完全或接近完全的底物還原。底物至產(chǎn)物的還 原可使用已知的方法通過檢測底物和/或產(chǎn)物監(jiān)控。合適的方法包括氣相色譜、HPLC及類 似方法。反應混合物中產(chǎn)生的醇還原產(chǎn)物的轉(zhuǎn)化產(chǎn)率通常高于約50%,也可高于約60%, 也可高于約70 %,也可高于約80 %,也可高于約90 %,以及經(jīng)常高于約97 %。
實施例本公開的不同的特征和實施方式示例于以下有代表性的實施例中,其意為例證性 的而不是限制性的。實施例1 酮還原酶粉末的生產(chǎn);搖瓶程序含有具有感興趣的酮還原酶基因的質(zhì)粒的大腸埃希氏菌的單個微生物菌落接種于盛有包含30μ g/ml氯霉素和葡萄糖的50ml胰蛋白酶肉湯(Tryptic broth) (12g/ L細菌用胰蛋白胨、24g/L酵母提取物、4ml/L甘油、65mM磷酸鉀,pH 7.0)的250ml錐形瓶 (Erlenmeyer flask)中。在孵育器中培養(yǎng)細胞過夜(至少16hrs),30°C,250rpm振搖。培 養(yǎng)物在盛有包含ImM MgS04、30y g/ml氯霉素的250ml Terrific肉湯的1升燒瓶中稀釋至 在600nm下光密度(0D600)為0. 2,并且允許其在30°C下培養(yǎng)。酮還原酶基因的表達在培養(yǎng) 物的0D600為0.6至0.8時由ImM IPTG誘導,并且孵育過夜(至少16小時)。通過離心收 集細胞(5000rpm,15分鐘,4°C )并且棄去上清液。細胞沉淀物在等體積的冷(4°C ) IOOmM 三乙醇胺(氯化物)緩沖液,pH 7. 0(在ADH-LK和ADH-LB和從其中衍生的工程酮還原酶 的情況下包括ImM MgS04)中重懸浮,通過如上離心收集。清洗的細胞在12ml冷三乙醇胺 (氯化物)緩沖液中重懸浮,并且在保持4°C下通過12000psi下的弗氏細胞壓碎器兩次。細 胞碎片通過離心移除(9000rpm,45分鐘,4°C)。收集澄清的裂解物上清液并儲存于-20°C。 凍干冷凍的澄清的裂解物產(chǎn)生粗酮還原酶的干燥粉末。實施例2 酮還原酶的生產(chǎn);發(fā)酵程序。在充氣攪動的15L發(fā)酵罐中,使含有0. 88g/L硫酸銨、0. 98g/L檸檬酸鈉、12. 5g/L 三水磷酸氫二鉀、6. 25g/L磷酸二氫鉀、6. 2g/L Tastone-154酵母提取物、0. 083g/L檸檬酸 鐵銨和8. 3ml/L的微量元素溶液的6. OL生長培養(yǎng)基達到30°C的溫度,所述微量元素溶液 包含2g/L 二水氯化鈣、2. 2g/L七水硫酸鋅、0. 5g/L 一水硫酸錳、lg/L七水硫酸亞酮、0. Ig/ L七水鉬酸銨和0. 02g/L十水四硼酸鈉。在如實施例3所述的搖瓶中培養(yǎng)至起始0D600為 0. 5至2. 0的包含感興趣的酮還原酶基因的質(zhì)粒的指數(shù)生長后期的大腸埃希氏菌W3110培 養(yǎng)物接種至發(fā)酵罐。發(fā)酵罐在500-1500rpm下攪動,并且空氣以1. 0-15. OL/min提供至發(fā) 酵容器以保持溶解氧水平在30%飽和或更高。培養(yǎng)物的pH通過加入20% ν/ν氫氧化銨控 制在7. 0。通過加入含500g/L結(jié)晶葡萄糖(cerelose)、12g/L氯化銨和10. 4g/L七水硫酸 鎂的料液維持培養(yǎng)物的生長。在培養(yǎng)物達到0D600為50后,通過加入異丙基- β -D-硫代 半乳糖苷(IPTG)至終濃度ImM以誘導酮還原酶的表達。培養(yǎng)物繼續(xù)生長另外14小時。然 后將培養(yǎng)物冷卻至4°C并保持在4°C直至收集。用Sorval RC 12BP離心機在4°C以5000G 離心40分鐘收集細胞。收集的細胞直接用于下述下游的回收步驟,或儲存于4°C至此類使 用。以每個體積的濕細胞糊狀物重懸于2體積的IOOmM三乙醇胺(氯化物)緩沖液pH 6. 8中,在4°C下重懸浮細胞沉淀物。通過使用12000psig的壓力,使懸浮液通過裝有兩級 均化閥(two-stage homogenizing valve)裝置的勻漿器,從細胞中釋放細胞內(nèi)酮還原酶。 細胞勻漿在破壞后被迅速冷卻至4°C。10% w/v聚乙烯亞胺溶液,pH 7. 2,加入裂解物中至 終濃度0. 5% w/v并且攪拌30分鐘。通過用標準實驗室離心機在5000G下離心30分鐘使 產(chǎn)生的懸浮液澄清。傾出澄清的上清液并使用具有截留分子量為30Kd的纖維素超濾膜濃 縮10倍。將最終濃縮物分散于淺容器中,在-20°C下冷凍并且低凍干為粉末。酮還原酶粉 末儲存于_80°C。實施例3 檢測2-苯甲酰氨基甲基-3-羥基丁酸甲酯立體異構(gòu)體的分析方法對于常規(guī)分析,2-苯甲酰氨基甲基-3-氧丁酸甲酯的2個立體異構(gòu)體以及2-苯甲 酰氨基甲基-3-羥基丁酸甲酯的4個立體異構(gòu)體通過正相手性HPLC分離,使用Chiralpak IA 柱(4. 6 X 150mm(Chiral technologies, cat#80324);等度(92%庚燒,8% 乙醇);40°C ;1. 5mL/min流速;樣品量=IOyL ;檢測254nm下的UV吸光度)。保留時間2S,3R-立體異 構(gòu)體6. 8min.,2R, 3S-非對映異構(gòu)體8. lmin, 2R, 3R-立體異構(gòu)體9. 3min, 2S, 3S-非對映 異構(gòu)體10. Imin.,底物立體異構(gòu)體11. 6和13. 5min。實施例4 鑒定對于異丙醇(IPA)有活性的變體的高通量NADPH熒光初篩。通過定向進化獲得并且包含進化的酮還原酶基因的質(zhì)粒文庫被轉(zhuǎn)化入大腸埃希 氏菌,并在包含葡萄糖和30 μ g/mL氯霉素的Luria-Bertani (LB)肉湯培養(yǎng)基上涂板。 在30°C孵育至少16小時后,使用Q-bot 自動菌落挑選儀(Genetix USA, Inc.,Beaverton, OR)將菌落挑選至包含180 μ LLuria-Bertani (LB)、1 %葡萄糖、30 μ g/mL氯霉素(CAM)和 2mM MgSO4的96-孔淺孔微量滴定板。在30°C下以200rpm搖動培養(yǎng)細胞。然后將20 μ L該 培養(yǎng)物轉(zhuǎn)移至含有380 μ L Terrific肉湯(TB)、2mM MgSO4和30 μ g/mL CAM的96-深孔板 中。在30°C以250rpm搖動孵育深孔板2. 5至3小時后(OD6J). 6-0. 8),通過終濃度為ImM 的異丙基硫代半乳糖苷(IPTG)誘導細胞培養(yǎng)物的重組基因表達。然后在30°C以250rpm搖 動培養(yǎng)平板15-23小時。通過離心沉淀細胞,重懸浮于400 μ L裂解緩沖液中并且通過在室溫至少搖動1小 時裂解細胞。該裂解緩沖液含有IOOmM三乙醇胺(硫酸鹽)緩沖液,pH 7.0-7.2,lmg/mL溶 菌酶和200 μ g/mL硫酸多粘菌素B和2mM MgS04。然后平板在4°C以4000RPM用離心機旋 轉(zhuǎn)10分鐘,澄澈的上清液(澄清的上清液)用于熒光測定法。在96-孔黑色微量滴定板中,20 μ 1的裂解物(在IOOmM三乙醇胺(硫酸鹽)緩沖 液,ρΗ7· 0中10倍稀釋)加入至由IOOmM三乙醇胺(硫酸鹽)緩沖液,pH 7. 0,ImM MgSO4, lg/L NADP和50%異丙醇組成的180 μ 1測定混合物中,并通過在Flexstation (Molecular Devices, USA)中330nm激發(fā)后445nm處的NADPH的熒光的增加測量反應進程。實施例5:使用用于輔因子再循環(huán)的異丙醇進行的對2-苯甲酰氨基甲基-3-氧丁 酸甲酯的酮還原酶活性的高通量HPLC測定法。如實施例4中所述制備裂解物。通過轉(zhuǎn)移檢測量的細胞裂解物至Costar深孔板 (cat#3961)的孔中測量酮還原酶活性。向50 μ L溶于IOOmM三乙醇胺(硫酸鹽)緩沖液 pH7. 0的3mg/ml Na-NADP、150 μ L溶于IPA中的3. 3mg/ml 2-苯甲酰氨基甲基-3-氧丁酸甲 酯中,加入IOOyL澄清的裂解物。將平板用鋁/聚丙烯薄片熱封口帶(Velocity ll(Menlo Park, CA),Cat#06643-001)熱封口,在室溫下?lián)u動培養(yǎng)24小時。反應結(jié)束時,向每個孔加 入990 μ L MTBE,重新將平板封口并搖動20分鐘。通過離心(4000rpm,5分鐘,4°C )分離有 機相和水相,并且將200 μ L有機層轉(zhuǎn)移至新的淺孔96-孔板中以使用實施例3中所述方法 分析。實施例6 較高底物濃度下使用用于輔因子再循環(huán)的異丙醇進行的對2-苯甲酰氨 基甲基-3-氧丁酸甲酯的酮還原酶活性的高通量HPLC測定法。在96-孔微量滴定板的孔中加入10 μ L溶于IOOmM三乙醇胺(硫酸鹽)緩沖液 ρΗ7. 0 的 0. 6mg/ml Na-NADP、150 μ L 溶于 IPA 的 100mg/ml 2-苯甲酰氨基甲基-3-氧丁 酸乙酯、10 μ L澄清的裂解物和130 μ 1 IOOmM TEA。將平板熱封口,在室溫下?lián)u動培養(yǎng)24 小時。反應結(jié)束時,向每個孔加入990 μ L ΜΤΒΕ,重新將平板封口并搖動20分鐘。通過離 心(4000rpm,5分鐘,4°C)將分離有機相和水相中,并且將200 μ L有機層轉(zhuǎn)移至新的淺孔 96-孔板中以使用實施例3中所述方法分析。
該實施例描述用于鑒定對于2-苯甲酰氨基甲基-3-氧丁酸甲酯的立體選擇性還 原有改善的KRED變體的方法。實施例7 =ADH-LK變體對于2_苯甲酰氨基甲基_3_氧丁酸甲酯的還原的評估
如實施例5所描述地評估幾個ADH-LK變體對2_苯甲酰氨基甲基_3_氧丁酸甲酯 的立體選擇性還原。樣品如在實施例3中描述地進行分析。表4列出相應于酮還原酶的SEQ ID N0,從ADH-LK的氨基酸突變的數(shù)目、轉(zhuǎn)化百分 比和所需要的(2S,3R)_立體異構(gòu)體百分比。表 4 A + > 30%轉(zhuǎn)化,++ > 60%轉(zhuǎn)化;B+ > 95% (2S,3R)異構(gòu)體。具有SEQ ID No. 90的ADH-LK變體用于進一步進化用于(2S,3R) _2_苯甲酰氨基 甲基-3-羥基丁酸甲酯的生成的有效的KRED。相似地,主要生成(2R,3R)立體異構(gòu)體、與 ADH-LK相比包含10個突變、具有SEQ ID No. 94的ADH-LK變體用于進一步進化用于(2R, 3R)-2-苯甲酰氨基甲基-3-羥基丁酸甲酯的生成的有效的KRED。本實施例顯示ADH-LK的變體可用于2_苯甲酰氨基甲基_3_氧丁酸甲酯的立體選 擇性還原。產(chǎn)生了 SEQ ID No. 90和94的新變體,其中移除了 BglI位點。相應的新序列分 別為 SEQ ID No. 48 和 SEQ ID No. 66。實施例8 衍生自ADH-LK的進一步的工程酮還原酶對2_苯甲酰氨基甲基_3_氧 丁酸甲酯至(2S,3R) -2-苯甲酰氨基甲基-3-羥基丁酸甲酯的還原。以實施例6中所述方法評估衍生自具有SEQ-ID No. 48的ADH-LK變體的改善的酮 還原酶的增加的活性和(2S,3R)-立體選擇性。
a+ 高于具 SEQ ID No. 48 的 KRED 的活性 1-15 倍;++ 高于具 SEQ IDNo. 48 的 KRED 的活性15-30倍;+++ 高于具SEQ ID No. 48的KRED的活性30-40倍;++++ 高于具SEQ ID No. 48的KRED的活性40-50倍;+++++ 高于具SEQ ID No. 48的KRED的活性> 50倍,b+ 在40°C預孵育21小時后保持活性,
c+ 60-89% (2S,3R)_產(chǎn)物;++ 90-94% (2S,3R)-產(chǎn)物;+++ 95-99% (2S,3R)_產(chǎn) 物;++++:> 99% (2S,3R)-產(chǎn)物.實施例9 衍生自ADH-LK的工程酮還原酶對2_苯甲酰氨基甲基_3_氧丁酸甲酯 至(2R,3R)-2-苯甲酰氨基甲基-3-羥基丁酸甲酯的還原。以實施例6中所述方法評估衍生自具有SEQ-ID No. 66的ADH-LK變體的改善的酮 還原酶的增加的活性和(2R,3R)-立體選擇性。
a+ 高于具 SEQ ID No. 66 的 KRED 的活性 1 倍;++ 高于具 SEQ ID No. 66 的 KRED 的活性1-2倍;+++ 高于具SEQ ID No. 66的KRED的活性> 2倍;
b+ < 85% (2R,3R)_ 產(chǎn)物;++:> 85% (2R,3R)_ 產(chǎn)物.實施例10 :(2S,3R)-2_苯甲酰氨基甲基-3-羥基丁酸甲酯的制備規(guī)模的生產(chǎn)。將2-苯甲酰氨基甲基-3-酮基丁酸甲酯(25g)、異丙醇(37.5ml)和0. IM三乙 醇胺(氯化物)/0. 04M MgSO4緩沖液pH7. 2(30ml)裝入250ml的具頂部攪拌器(overhead stirrer)的3-頸燒瓶。攪拌反應混合物并使用油浴調(diào)節(jié)溫度至37°C。加入0. 5ml 19g/L NADP-Na之后加入2. 5ml 30g/L SEQ ID No. 10KRED使反應開始;兩種都為在0. IM三乙醇 胺(氯化物)/0.04M MgSO4緩沖液pH7. 2中的溶液。通過在反應過程中取出5 μ 1等份,用 Iml乙腈稀釋,用0. 25 μ m注射器過濾器過濾并且按實施例3中所述分析以監(jiān)控反應進程。 當轉(zhuǎn)化超過96%時,加飽和的氯化鈉水溶液(12. 5ml)至反應混合物中,之后加入40ml乙酸 乙酯。反應混合物繼續(xù)攪拌15分鐘,然后在真空下過濾通過Celite墊(5g置于多孔玻璃 過濾器中)。用20ml乙酸乙酯清洗濾餅,分離濾液的兩相。有機層用20ml水清洗三次并用 旋轉(zhuǎn)蒸發(fā)儀濃縮至恒定重量的油狀物。移除乙酸乙酯后,加入甲苯(IOml)并真空蒸餾。得 到為含 10%甲苯的油狀物的(2S,3R)-2-苯甲酰氨基甲基-3-羥基丁酸甲酯(26.47g), 由 1H-WR-CDCl3 確定。對于所有的目的,本申請中引用的所有出版物、專利、專利申請和其他文件通過弓I 用整體并入本文,如同對于所有的目的,單獨地指明每一個單獨的出版物、專利、專利申請 或其他文件通過引用方式并入本文。
權(quán)利要求
一種酮還原酶多肽,能夠以至少約60%的立體異構(gòu)體過量百分比將底物2-苯甲酰氨基甲基-3-氧丁酸甲酯轉(zhuǎn)化為產(chǎn)物2S,3R-2-苯甲酰氨基甲基-3-羥基丁酸甲酯。
2.如權(quán)利要求1所述的多肽,其包含與基于SEQID NO :2或4或86的參考序列具有至 少約85%同一性的氨基酸序列,所述參考序列具有以下特征相應于X94的殘基為蘇氨酸; 相應于X199的殘基為組氨酸以及相應于X202的殘基為纈氨酸或亮氨酸;條件是所述酮還 原酶多肽具有其中相應于X94的殘基為脂肪族或極性殘基;相應于X199的殘基為脂肪族、 受限或極性殘基;并且相應于X202的殘基為纈氨酸或亮氨酸的氨基酸序列。
3.如權(quán)利要求2所述的多肽,所述多肽中相應于X94的殘基為蘇氨酸。
4.如權(quán)利要求2所述的多肽,所述多肽中相應于X199的殘基為丙氨酸、組氨酸或天冬 酰胺。
5.如權(quán)利要求2所述的多肽,所述多肽中相應于X94的殘基為極性殘基;相應于X199 的殘基為脂肪族、受限或極性殘基;并且相應于X202的殘基為纈氨酸或亮氨酸。
6.如權(quán)利要求2所述的多肽,所述多肽中相應于X94的殘基為蘇氨酸;相應于X199的 殘基為丙氨酸、組氨酸或天冬酰胺;并且相應于X202的殘基為纈氨酸或亮氨酸。
7.如權(quán)利要求2至6中任一項所述的多肽,其中所述酮還原酶的氨基酸序列另外具有 以下特征中的一個或多個相應于X2的殘基為極性、非極性或脂肪族殘基;相應于X4的殘基為堿性殘基或半胱氨酸;相應于XII的殘基為非極性、脂肪族、或芳香族殘基;相應于X40的殘基為受限或堿性殘基;相應于X80的殘基為非極性、脂肪族或極性殘基;相應于X86的殘基為非極性、脂肪族或極性殘基;相應于X96的殘基為極性、芳香族、非極性或脂肪族殘基;相應于X105的殘基為非極性、脂肪族、堿性或酸性殘基;相應于X129的殘基為非極性或極性殘基;相應于X147的殘基為芳香族、非極性或脂肪族殘基;相應于X153的殘基為極性、非極性或脂肪族殘基;相應于X190的殘基為芳香族或受限殘基;相應于X195的殘基為非極性或脂肪族殘基;相應于X196的殘基為非極性或脂肪族殘基;相應于X206的殘基為非極性或芳香族殘基;相應于X226的殘基為非極性或脂肪族殘基;相應于X248為非極性或堿性殘基;相應于X249為芳香族殘基;并且其中與所述參考序列相比,任選地所述氨基酸序列在其他氨基酸殘基位置處具有一個 或多個殘基差異。
8.如權(quán)利要求2至6中任一項所述的多肽,其中所述酮還原酶的氨基酸序列另外具有 以下特征中的一個或多個相應于X2的殘基為丙氨酸;相應于X4的殘基為半胱氨酸; 相應于XII的殘基為苯丙氨酸; 相應于X40的殘基為精氨酸; 相應于X80的殘基為蘇氨酸; 相應于X86的殘基為異亮氨酸; 相應于X96的殘基為纈氨酸或苯丙氨酸; 相應于X105的殘基為甘氨酸; 相應于X129的殘基為蘇氨酸; 相應于X147的殘基為蛋氨酸或亮氨酸; 相應于X153的殘基為丙氨酸或絲氨酸; 相應于X190的殘基為組氨酸或脯氨酸; 相應于X195的殘基為纈氨酸; 相應于X196的殘基為亮氨酸; 相應于X206的殘基為苯丙氨酸; 相應于X226的殘基為纈氨酸; 相應于X248的殘基為賴氨酸或精氨酸; 相應于X249的殘基為色氨酸;其中與所述參考序列相比,任選地所述氨基酸序列在其他氨基酸殘基位置處具有一個 或多個殘基差異。
9.如權(quán)利要求7所述的多肽,其中所述酮還原酶的氨基酸序列另外具有以下特征中的 一個或多個相應于X40的殘基為受限或堿性殘基;并且 相應于X147的殘基為芳香族、非極性或脂肪族殘基。
10.如權(quán)利要求9所述的多肽,其中所述酮還原酶的氨基酸序列另外具有以下特征中 的一個或多個相應于X96的殘基為極性、芳香族、非極性或脂肪族殘基;相應于X195的殘基為非極性或脂肪族殘基;相應于X196的殘基為非極性或脂肪族殘基;相應于X226的殘基為非極性或脂肪族殘基;相應于X248的殘基為非極性或堿性殘基;相應于X249的殘基為芳香族殘基。
11.如權(quán)利要求9或10所述的多肽,其中所述酮還原酶的氨基酸序列另外具有以下特 征中的一個或多個相應于X2的殘基為極性、非極性或脂肪族殘基; 相應于X4的殘基為堿性殘基或半胱氨酸; 相應于XII的殘基為非極性、脂肪族或芳香族殘基; 相應于X80的殘基為非極性、脂肪族或極性殘基; 相應于X86的殘基為非極性、脂肪族或極性殘基; 相應于X105的殘基為非極性、脂肪族、堿性或酸性殘基;相應于X129的殘基為非極性或極性殘基; 相應于X153的殘基為極性、非極性或脂肪族殘基; 相應于X190的殘基為芳香族或受限殘基; 相應于X206的殘基為非極性或芳香族殘基。
12.如權(quán)利要求7所述的多肽,其中所述酮還原酶的氨基酸序列具有以下另外的特征 相應于X40的殘基為受限或堿性殘基;并且相應于X147的殘基為芳香族、非極性或脂肪族殘基;并且其中與所述參考序列相比,任選地所述氨基酸序列在其他氨基酸殘基位置處具有一個 或多個殘基差異。
13.如權(quán)利要求7所述的多肽,其中所述酮還原酶的氨基酸序列具有以下另外的特征 相應于X40的殘基為受限或堿性殘基;相應于X96的殘基為極性、芳香族、非極性或脂肪族殘基; 相應于X 147的殘基為芳香族、非極性或脂肪族殘基;其中與所述參考序列相比,任選地所述氨基酸序列在其他氨基酸殘基位置處具有一個 或多個殘基差異。
14.如權(quán)利要求7所述的多肽,其中所述酮還原酶的氨基酸序列具有以下另外的特征 相應于X96的殘基為極性、芳香族、非極性或脂肪族殘基;相應于X147的殘基為芳香族、非極性或脂肪族殘基; 相應于X195的殘基為非極性或脂肪族殘基; 相應于X196的殘基為非極性或脂肪族殘基;并且其中與所述參考序列相比,任選地所述氨基酸序列在其他氨基酸殘基位置處具有一個 或多個殘基差異。
15.如權(quán)利要求7所述的多肽,其中所述酮還原酶的氨基酸序列具有以下另外的特征 相應于X40的殘基為精氨酸。
16.如權(quán)利要求7所述的多肽,其中所述酮還原酶的氨基酸序列具有以下另外的特征 相應于X147的殘基為蛋氨酸或亮氨酸。
17.如權(quán)利要求7所述的多肽,其中所述酮還原酶的氨基酸序列具有以下另外的特征 相應于X40的殘基為精氨酸;并且相應于X147的殘基為蛋氨酸或亮氨酸。
18.如權(quán)利要求1所述的多肽,其中所述酮還原酶多肽包含具有以下氨基酸序列的區(qū) 域或結(jié)構(gòu)域所述氨基酸序列與基于SEQ ID NO :2、4或86的參考序列的殘基90至211具有 至少85%同一性,所述參考序列具有以下特征相應于X94的殘基為蘇氨酸;相應于X199 的殘基為組氨酸;并且相應于X202的殘基為纈氨酸或亮氨酸;條件是所述酮還原酶的結(jié)構(gòu) 域或區(qū)域具有其中相應于X94的殘基為脂肪族或極性殘基;相應于X199的殘基為脂肪族、 受限或極性殘基;并且相應于X202的殘基為亮氨酸或纈氨酸的氨基酸序列。
19.如權(quán)利要求18所述的多肽,其中所述酮還原酶的結(jié)構(gòu)域或區(qū)域包含其中相應于 X94的殘基為蘇氨酸的氨基酸序列。
20.如權(quán)利要求18所述的多肽,其中所述酮還原酶的結(jié)構(gòu)域或區(qū)域包含其中相應于 X199的殘基為丙氨酸、組氨酸或天冬酰胺的氨基酸序列。
21.如權(quán)利要求18所述的多肽,其中所述酮還原酶的結(jié)構(gòu)域或區(qū)域包含其中相應于X94的殘基為極性殘基;相應于X199的殘基為脂肪族、受限或極性殘基;并且相應于X202 的殘基為纈氨酸或亮氨酸的氨基酸序列。
22.如權(quán)利要求18所述的多肽,其中所述酮還原酶的結(jié)構(gòu)域或區(qū)域包含其中相應于 X94的殘基為蘇氨酸;相應于X199的殘基為丙氨酸、組氨酸或天冬酰胺;并且相應于X202 的殘基為纈氨酸或亮氨酸的氨基酸序列。
23.如權(quán)利要求18至21中任一項所述的多肽,其中相應于殘基90-211的所述酮還原 酶的結(jié)構(gòu)域或區(qū)域另外具有以下特征中的一個或多個相應于X96的殘基為極性、芳香族、非極性或脂肪族殘基; 相應于X105的殘基為非極性、脂肪族、堿性或酸性殘基; 相應于X129的殘基為非極性或極性殘基; 相應于X147的殘基為芳香族、非極性或脂肪族殘基; 相應于X153的殘基為極性、非極性或脂肪族殘基; 相應于X190的殘基為芳香族或受限殘基; 相應于X195的殘基為非極性或脂肪族殘基; 相應于X196的殘基為非極性或脂肪族殘基; 相應于X206的殘基為非極性或芳香族殘基;其中與所述參考序列相比,所述氨基酸序列可在相應于殘基90-211的結(jié)構(gòu)域中的其 他氨基酸殘基位置處任選地具有一個或多個殘基差異。
24.如權(quán)利要求18至21中任一項所述的多肽,其中相應于殘基90-211的所述酮還原 酶的結(jié)構(gòu)域或區(qū)域另外具有以下特征中的一個或多個相應于X96的殘基為纈氨酸或苯丙氨酸; 相應于X105的殘基為甘氨酸; 相應于X129的殘基為蘇氨酸; 相應于X147的殘基為蛋氨酸或亮氨酸; 相應于X153的殘基為丙氨酸或絲氨酸; 相應于X190的殘基為組氨酸或脯氨酸; 相應于X195的殘基為纈氨酸; 相應于X196的殘基為亮氨酸; 相應于X206的殘基為苯丙氨酸;其中與所述參考序列相比,所述氨基酸序列可在相應于殘基90-211的結(jié)構(gòu)域中的其 他氨基酸殘基位置處任選地具有一個或多個殘基差異。
25.如權(quán)利要求18所述的多肽,其中相應于殘基90-211的所述酮還原酶的結(jié)構(gòu)域或區(qū) 域另外具有以下特征相應于X147的殘基為芳香族、非極性或脂肪族殘基;并且其中與所述參考序列相比,任選地所述氨基酸序列在其他氨基酸殘基位置處具有一個 或多個殘基差異。
26.如權(quán)利要求18所述的多肽,其中相應于殘基90-211的所述酮還原酶的結(jié)構(gòu)域或區(qū) 域另外具有以下特征相應于X96的殘基為極性、芳香族、非極性或脂肪族殘基;相應于X147的殘基為芳香族、非極性或脂肪族殘基;并且其中與所述參考序列相比,任選地所述氨基酸序列在其他氨基酸殘基位置處具有一個 或多個殘基差異。
27.如權(quán)利要求18所述的多肽,其中相應于殘基90-211的所述酮還原酶的結(jié)構(gòu)域或區(qū) 域另外具有以下特征相應于X96的殘基為極性、芳香族、非極性或脂肪族殘基;相應于X147的殘基為芳香族、非極性或脂肪族殘基;相應于X195的殘基為非極性或脂肪族殘基;相應于X196的殘基為非極性或脂肪族殘基;其中與所述參考序列相比,任選地所述氨基酸序列在其他氨基酸殘基位置處具有一個 或多個殘基差異。
28.如權(quán)利要求1所述的多肽,其包含相應于SEQID NO :6、8、10、12、14、16、18、20、22、 24、26、28、30、32、34、36、38、40、42、46、50、52、54、56、58、60 和 62 的氨基酸序列。
29.如權(quán)利要求1所述的多肽,其能夠以至少約90%的立體異構(gòu)體過量百分比將所述 底物轉(zhuǎn)化為所述產(chǎn)物。
30.如權(quán)利要求29所述的多肽,其包含相應于SEQID NO :6、8、10、12、14、16、18、20、 22、24、26、28、30、32、34、36、40、42、50、52、56、58、60 或 62 的氨基酸序列。
31.如權(quán)利要求1所述的多肽,其能夠以至少約95%的立體異構(gòu)體過量百分比將所述 底物轉(zhuǎn)化為所述產(chǎn)物。
32.如權(quán)利要求31所述的多肽,其包含相應于SEQID NO :6、8、10、12、14、16、18、20、 22、24、26、28、30、32、34、42、50、52、56、58、60 或 62 的氨基酸序列。
33.如權(quán)利要求1所述的多肽,其能夠以至少約99%的立體異構(gòu)體過量百分比將所述 底物轉(zhuǎn)化為所述產(chǎn)物。
34.如權(quán)利要求33所述的多肽,其包含相應于SEQID NO :6、8、10、12、14、20、22、24、 30、32、34、60和62的氨基酸序列。
35.如權(quán)利要求1所述的多肽,其能夠以比參考多肽SEQID NO :48高至少15倍的速 率將所述底物轉(zhuǎn)化為所述產(chǎn)物。
36.如權(quán)利要求35所述的多肽,其包含相應于SEQID NO :6、8、10、12、14、20、22、24、 26、28、30、32、34、50、60 和 62 的氨基酸序列。
37.如權(quán)利要求1所述的多肽,其能夠以比參考多肽SEQID NO :48高至少30倍的速 率將所述底物轉(zhuǎn)化為所述產(chǎn)物。
38.如權(quán)利要求37所述的多肽,其包含相應于SEQID NO :6、8、10、12、14、20、22、24、 26、30、34、60和62的氨基酸序列。
39.如權(quán)利要求1所述的多肽,其能夠以比參考多肽SEQID NO :48高至少40倍的速 率將所述底物轉(zhuǎn)化為所述產(chǎn)物。
40.如權(quán)利要求39所述的多肽,其包含相應于SEQID NO :6、8、10、12、14、22和60的 氨基酸序列。
41.如權(quán)利要求1所述的多肽,其能夠以比參考多肽SEQID NO :48高至少50倍的速 率將所述底物轉(zhuǎn)化為所述產(chǎn)物。
42.如權(quán)利要求42所述的多肽,其包含相應于SEQID NO :6、8、10和12的氨基酸序列。
43.一種酮還原酶多肽,能夠以至少約85%的立體異構(gòu)體過量百分比將底物2-苯甲酰 氨基甲基-3-氧丁酸甲酯轉(zhuǎn)化為產(chǎn)物2R,3R-2-苯甲酰氨基甲基-3-羥基丁酸甲酯。
44.如權(quán)利要求43所述的多肽,其包含相應于SEQID NO :68、72、74、76、78和82的氨基酸序列。
45.一種多核苷酸,編碼根據(jù)權(quán)利要求1-44中任一項所述的多肽。
46.如權(quán)利要求45所述的多核苷酸,其為相應于SEQID NO :5、7、9、11、13、15、17、19、 21、23、25、27、29、31、33、35、37、39、41、45、49、51、53、55、57、59 或 61 的序列。
47.一種多核苷酸,編碼根據(jù)權(quán)利要求43或44所述的多肽。
48.如權(quán)利要求47所述的多核苷酸,其為相應于SEQID NO :67、71、73、75、77或81的序列。
49.一種表達載體,包含與適用于引導宿主細胞中的表達的控制序列可操作地連接的 如權(quán)利要求44或47所述的多核苷酸。
50.如權(quán)利要求49所述的表達載體,其中所述控制序列包含啟動子。
51.如權(quán)利要求50所述的表達載體,其中所述啟動子包含大腸埃希氏菌啟動子。
52.如權(quán)利要求50所述的表達載體,其中所述控制序列包含分泌信號。
53.一種宿主細胞,包含如權(quán)利要求49所述的表達載體。
54.如權(quán)利要求53所述的宿主細胞,其為大腸埃希氏菌。
55.一種組合物,包含如權(quán)利要求1-42中任一項所述的酮還原酶和具式(I)的化合物 2_苯甲酰氨基甲基-3-氧丁酸甲酯或具式(II)的化合物2S,3R-2-苯甲酰氨基甲基-3-羥 基丁酸甲酯。
56.如權(quán)利要求55所述的組合物,其中底物為具式(I)的化合物和具式(II)的化合物。
57.如權(quán)利要求55所述的組合物,還包含輔因子再生系統(tǒng)。
58.如權(quán)利要求57所述的組合物,其中所述輔因子再生系統(tǒng)包括葡萄糖脫氫酶和葡萄 糖;甲酸脫氫酶和甲酸;或異丙醇和仲醇脫氫酶。
59.一種將具式(I)的底物2-苯甲酰氨基甲基-3-氧丁酸甲酯還原為具式(II)的產(chǎn) 物2S,3R-2-苯甲酰氨基甲基-3-羥基丁酸甲酯的方法,所述方法包括在適合將所述底物還 原為具式(II)的產(chǎn)物的反應條件下,將所述底物與如權(quán)利要求1-44中任一項所述的酮還 原酶多肽接觸或孵育。
60.如權(quán)利要求59所述的方法,其中所述產(chǎn)物以高于約99%的立體異構(gòu)體過量存在。
61.如權(quán)利要求59所述的方法,其使用表達所述酮還原酶的完整細胞、或所述細胞的 提取物或裂解物進行。
62.如權(quán)利要求59所述的方法,其中所述酮還原酶是分離和/或純化的,并且還原反應 在所述酮還原酶的輔因子和任選地所述輔因子的再生系統(tǒng)的存在下進行。
63.如權(quán)利要求59所述的方法,其中所述輔因子再生系統(tǒng)包括葡萄糖脫氫酶和葡萄 糖;甲酸脫氫酶和甲酸;或異丙醇和仲醇脫氫酶。
64.如權(quán)利要求63所述的方法,其中所述仲醇脫氫酶為所述酮還原酶。
65.一種合成具式(IVa)的中間體的方法, 其中R1為H或羥基保護基團,并且Rltl為鹵素或-OAc,其中Ac為乙酸, 所述方法中的步驟包括在適合于將具式(I)的底物還原或轉(zhuǎn)化為具式(II)的產(chǎn)物的 反應條件下,將所述底物與本公開的酮還原酶接觸或反應。 66. 一種合成具結(jié)構(gòu)式(IX)的中間體的方法, 其中R2為H或C1-C4烴基(例如,-CH3) ;R3為H或羥基保護基團;R4為H、羧基保護基 團、氨基、堿金屬或堿土金屬;并且X為OH或離去基團,所述方法中的步驟包括所述方法中的步驟包括在適合于將具式(I)的底物還原或轉(zhuǎn) 化為具式(II)的產(chǎn)物的反應條件下,將所述底物與本公開的酮還原酶接觸或反應。 67. 一種合成具結(jié)構(gòu)式(V)的碳雜青霉烯或其溶劑化物、水合物、鹽和前藥的方法 其中R2為H或-CH3 ;R5選自取代的或未取代的烴基、取代的或未取代的芳香基、取代的 或未取代的雜烴基、取代的或未取代的雜環(huán)烴基、以及取代的或未取代的雜芳香基烴基;并 且R6為H或前體基團,所述方法中的步驟包括所述方法中的步驟包括在適合于將具式(I)的底物還原或轉(zhuǎn) 化為具式(II)的產(chǎn)物的反應條件下,將所述底物與本公開的酮還原酶接觸或反應。 68.如權(quán)利要求67所述的方法,其中所述碳雜青霉烯具有結(jié)構(gòu)式(X)
69.如權(quán)利要求67所述的方法,其中所述碳雜青霉烯具有結(jié)構(gòu)式(XI)
70.如權(quán)利要求67所述的方法,其中所述碳雜青霉烯具有結(jié)構(gòu)式(XII)
71.如權(quán)利要求67所述的方法,其中所述碳雜青霉烯具有結(jié)構(gòu)式(XIII)
全文摘要
本公開提供具有與自然存在的野生型酮還原酶相比具有改善的性質(zhì)的工程酮還原酶。本文還提供了編碼工程酮還原酶的多核苷酸、能夠表達工程酮還原酶的宿主細胞以及應用工程酮還原酶合成各種手性化合物的方法。
文檔編號C12P17/00GK101883846SQ200880118571
公開日2010年11月10日 申請日期2008年10月1日 優(yōu)先權(quán)日2007年10月1日
發(fā)明者奧諾拉托·坎帕皮阿諾, 拉瑪·沃蘭德里, 波蒂·博勒普, 艾米麗·穆德弗 申請人:科德克希思公司