專利名稱::用于制備立體異構(gòu)純的他汀類及其合成中間體的組合物和方法
技術(shù)領(lǐng)域:
:本公開內(nèi)容涉及用于立體選擇性還原羥基氧代酯(hydroxyoxoester)如5_輕基_3-氧代-己酸酯以生成立體異構(gòu)純的對應(yīng)順式二羥基酯的組合物和方法。更具體地,本公開內(nèi)容涉及與衍生它們的野生型酮還原酶相比具有改進(jìn)性質(zhì)的非天然存在的工程酮還原酶(engineeredketoreductase)、編碼所述工程酮還原酶的多核香酸、包含此類多核芬酸的宿主細(xì)胞、-使用所述工程酮還原酶合成多種立體異構(gòu)純的化合物的方法以及由所述方法合成的立體異構(gòu)純的化合物。2.序列表、表或計(jì)算機(jī)程序的引用依據(jù)37C.F.R.§§1.821(c)和1.821(e)隨本文同時(shí)提交的序列表的全部內(nèi)容通過引用并入本文。3.背景立體異構(gòu)純的順式3,5-二羥基己酸酯是用于合成降膽固醇他汀類(statins)的關(guān)^t的手性中間體,所述他汀類如阿托伐他汀4丐(以商標(biāo)名稱L1PIT0R⑧由Pfizer,Inc.銷售)、羅蘇伐他汀4丐(以商標(biāo)名稱CRESTOR⑧由AstraZeneca,Ltd.銷售)和匹伐他汀(以商標(biāo)名稱Lipalo由KowaCompanyLtd.和NissanChemicalIndustries在日本銷售)。盡管已知制備這些手性中間體的多種方法,包括還原對應(yīng)的5-羥基-3-氧代己酸酯的化學(xué)法和酶法,但是這些方法具有重大缺點(diǎn),使它們難以成為用于商品規(guī)模合成的理想方法。鑒于這些關(guān)鍵的手性中間體在合成降膽固醇他汀類中的重要性,高度期望用于以經(jīng)濟(jì)和高效的方法合成這些化合物的組合物和方法。4.概述如上文提及,根據(jù)下述結(jié)構(gòu)式(IIa)的立體異構(gòu)純的順式3,5-二羥基己酸酯是合成降膽固醇他汀類(包括但不限于阿托伐他汀、羅蘇伐他汀和匹伐他汀)的關(guān)鍵中間體<formula>formulaseeoriginaldocumentpage14</formula>其中X選自卣素(例如氯和溴)、氰基和-OR其中W是氫或保護(hù)基團(tuán),且Ri選自(C2-C12)烴基、(C6-C10)芳基和(C7-C12)芳基烴基。這些關(guān)鍵的手性中間體通常通過還原根據(jù)結(jié)構(gòu)式(Ia)的對應(yīng)的對映體純的5-羥基-3-氧代己酸酯而合成<formula>formulaseeoriginaldocumentpage14</formula>所述還原是在結(jié)構(gòu)式(IIa)(見上)的順式二羥基酯非對映體以超過結(jié)構(gòu)式(IIb)的對應(yīng)反式二羥基酯非對映體的非對映體過量獲得的條件下進(jìn)行的<formula>formulaseeoriginaldocumentpage14</formula>最近,已經(jīng)鑒定可用于進(jìn)行這種對映選擇性還原的某些酮還原酶(參見例如美國專利第6,645,746號和WO01/40450)。本發(fā)明人發(fā)現(xiàn)能催化上述對映選擇性還原的酮還原酶可使用實(shí)驗(yàn)室進(jìn)化技術(shù)如DNA改組而被工程化,以產(chǎn)生與獲自酉良酒酵母(Sacc/wraw少cMcewvw/ae)的天然存在的野生型酮還原酶相比具有改進(jìn)性質(zhì)的非天然存在的工程酮還原酶。進(jìn)一步地,本公開內(nèi)容還提供了分離的天然存在的酮還原酶,其包括本文所公開的工程酮還原酶的突變集合中的任何一種突變。因此,包括此類突變集合的此類天然存在的酮還原酶可用于本文所公開的任何一種工藝、試劑盒、反應(yīng)混合物等等。改進(jìn)的性質(zhì)可涉及野生型酮還原酶的不同方面。例如,所述改進(jìn)的性質(zhì)可包括酶在立體選擇性還原反應(yīng)條件下的穩(wěn)定性、酮還原酶的酶活性、和/或?qū)σ种?例如產(chǎn)物抑制)的敏感性。因此,在一個方面中,本公開內(nèi)容提供了與獲自釀酒酵母的天然存在的野生型酮還原酶相比具有改進(jìn)性質(zhì)的工程(或分離的天然存在的變體)酮還原酶。所述工程酮還原酶可具有單種改進(jìn)的性質(zhì),或者它們可具有任何組合的兩種或多種改進(jìn)的性質(zhì)。在一些方面中,所述工程酮還原酶可包括與野生型酮還原酶氨基酸序列具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的氨基酸序列,條件是所述工程氨基酸序列包括足以提供改進(jìn)性質(zhì)的一種或多種突變。在一些實(shí)施方案中,所述工程酮還原酶與野生型酮還原酶相比具有增加的酶活性。酶活性的改進(jìn)可通過使用標(biāo)準(zhǔn)酶測定比較工程酮還原酶的比活性與野生型酮還原酶的比活性來測量。改進(jìn)的量的范圍可從對應(yīng)的野生型酮還原酶的酶活性的1.5倍到多至2倍、5倍、10倍、20倍、25倍、50倍、75倍、100倍、150倍、200倍、250倍、300倍或更多倍酶活性。在特定的實(shí)施方案中,所述工程酮還原酶顯示出為比野生型酮還原酶的酶活性大1.5至50倍、1.5至100倍、1.5至150倍、1.5至200倍、1.5至250倍或1.5至300倍的范圍內(nèi)的改進(jìn)的酶活性。酶活性的改進(jìn)還包括立體選擇性增加或產(chǎn)物抑制減少。在一些實(shí)施方案中,所述工程酮還原酶與野生型酮還原酶相比顯示改進(jìn)的熱穩(wěn)定性。熱穩(wěn)定性的改進(jìn)可通過比較所述工程酮還原酶在指定的溫度下溫育指定的時(shí)間段后保留的酶活性程度與對應(yīng)的野生型酶在類似的條件下保留的酶活性程度而測量。本文所述的工程酮還原酶可通過利用包括各種誘變和重組技術(shù)的標(biāo)準(zhǔn)實(shí)驗(yàn)室技術(shù),誘變編碼酵母(&7cc/wra/^ce,力的天然存在的野生型酮還原酶的基因而獲得。在一些實(shí)施方案中,本文所述的工程酮還原酶具有與衍生它們的野生型酮還原酶的氨基酸序列對應(yīng)的序列且包括導(dǎo)致酶性質(zhì)改進(jìn)的一種或多種氨基酸突變。在一些實(shí)施方案中,所述突變是全面改進(jìn)一種或多種酶性質(zhì)的突變的選定組合。在一些實(shí)施方案中,如當(dāng)改進(jìn)性質(zhì)來自單個突變或突變的特定組合時(shí),所述工程酮還原酶可任選地包括在多肽序列內(nèi)的其他殘基位置的一種或多種保守性突變。在一些實(shí)施方案中,所述酮還原酶包括與SEQIDNO:2對應(yīng)、或與SEQIDNO:2具有至少約90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的氨基酸序列,并且其中所述氨基酸序列包括相對SEQIDNO:2在下述殘基位置之一的至少一種突變6、27、31、36、48、63、65、86、125、152、160、165、194、214、218、234、248、250、263、290、296、297、301和307。在一個實(shí)施方案中,在上述位置之一的至少一種突變必須是與野生型SEQIDNO:2序列相比的非保守性突變。在一些實(shí)施方案中,所述酮還原酶包括與SEQIDNO:2對應(yīng)、或與SEQIDNO:2具有至少約90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的氨基酸序列,并且其中所述氨基酸序列包括在第63位的芳香族殘基。在一個實(shí)施方案中,所述芳香族殘基是色氨酸。在一些實(shí)施方案中,所述酮還原酶具有與序列表中所列出的氨基酸序列的任何一個具有至少約80、85、90、91、92、93、94、95、96、97、98或99%同一性的氨基酸序列,條件是所述氨基酸序列與野生型序列(SEQIDNO:2)不同。在一些實(shí)施方案中,所述酮還原酶具有與序列表中所列出的氨基酸序列的任何一個有同一性并包括一種或多種保守性突變(包括例如1、2、3、1-5、1-10、l-20或更多種保守性突變)的氨基酸序列。在一些實(shí)施方案中,所述酮還原酶包括與SEQIDNO:2對應(yīng)、或與SEQIDNO:2具有至少約90、91、92、93、94、95、96、97、98或99%同一性,并且包括下列特征的一種或多種的氨基酸序列X6是極性或酸性氨基酸殘基;X27是脂肪族或堿性氨基酸殘基;X31是包含羥基的或脂肪族氨基酸殘基;X^是小氨基酸殘基;X"是堿性氨基酸殘基;X63是疏水性或芳香族氨基酸;X"是包含羥基的或小氨基酸殘基;X86是脂肪族或疏水性氨基酸殘基;X125是脂肪族或芳香族氨基酸殘基;《52是堿性氨基酸殘基;X,是包含羥基的或小氨基酸殘基;X165是極性或酸性氨基酸殘基;X^是芳香族氨基酸或極性親水性氨基酸殘基;X^是極性親水性氨基酸殘基;X,是包含羥基的氨基酸殘基;X234是極性親水性氨基酸殘基;X248是脂肪族氨基酸殘基;X,是堿性氨基酸殘基;X263是酸性或極性氨基酸殘基;X,是酸性氨基酸殘基;X296是脂肪族氨基酸殘基;X,是芳香族氨基酸殘基;X3Q1是脂肪族或包含羥基的或酸性或親水性或堿性氨基酸殘基;和X,是芳香族、極性或包含羥基的氨基酸殘基。在一個實(shí)施方案中,所述酮還原酶包括所有上述特征。在一個實(shí)施方案中,所述酮還原酶包括至少一種特征以使至少一種殘基與SEQIDNO:2相比是突變的。在一個實(shí)施方案中,所述酮還原酶包括至少一種特征以使至少一種殘基與SEQIDNO:2相比是非保守性突變的。在一些實(shí)施方案中,所述酮還原酶包括與SEQIDNO:2對應(yīng)、或與SEQIDNO:2具有至少約90、91、92、93、94、95、96、97、98或99%同一性,并且包括下列特征的一種或多種的氨基酸序列乂6是極性或酸性氨基酸殘基;X27是脂肪族或堿性氨基酸殘基;X31是包含羥基的或脂肪族氨基酸殘基;X^是小氨基酸殘基;X"是堿性氨基酸殘基;X"是芳香族氨基酸;X"是包含羥基的或小氨基酸殘基;X86是脂肪族或疏水性氨基酸殘基;X125是脂肪族或芳香族氨基酸殘基;X^是堿性氨基酸殘基;X,是包含羥基的或小氨基酸殘基;X165是極性或酸性氨基酸殘基;乂194是芳香族氨基酸或極性親水性氨基酸殘基;X214是極性親水性氨基酸殘基;X,是包含羥基的氨基酸殘基;乂234是極性親水性氨基酸殘基;X,是脂肪族氨基酸殘基;乂250是堿性氨基酸殘基;X263是酸性或極性氨基酸殘基;X,是酸性氨基酸殘基;X296是脂肪族氨基酸殘基;X,是芳香族氨基酸殘基;X3Q1是脂肪族或包含幾基的或酸性或親水性或堿性氨基酸殘基;和X,是芳香族、極性或包含羥基的氨基酸殘基。在一個實(shí)施方案中,所述酮還原酶包括所有上述特征。在一個實(shí)施方案中,所述酮還原酶包括至少一種特征以使至少一種殘基與SEQIDNO:2相比是突變的。在一個實(shí)施方案中,所述酮還原酶包括至少一種特征以使至少一種殘基與SEQIDNO:2相比是非保守性突變的。在一些實(shí)施方案中,所述酮還原酶包括與SEQIDNO:2的酮還原酶相比具有改進(jìn)的活性并且具有下述氨基酸序列的酮還原酶,所述氨基酸序列與圖3的野生型序列酮還原酶(SEQIDNO:2)對應(yīng)并包括選自以下的一種或多種突變R27A、R27K、N31S、A36V、Y48H、163W、R65G、R65S、L86I、F125L、K152R、A160T、Y194C、A218T、V248I、K250R、E290D、L296V、Y297W、Y297F、L301K、L301R、L301A、L301S、L301E、L301P、L301Q、L301V、L301T、L301Y、L301D、Y307H、Y307N和Y307S。在一些實(shí)施方案中,此類改進(jìn)的工程酮還原酶包括與SEQIDNO:2具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的氨基酸序列,條件是所述氨基酸序列包括至少一種或多種上文列出的突變(在一些實(shí)施方案中,至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或更多種突變)。在一些實(shí)施方案中,所述工程酮還原酶包括具有改進(jìn)的酶穩(wěn)定性并具有下述氨基酸序列的酮還原酶,所述氨基酸序列與圖3的野生型序列(SEQIDNO:2)對應(yīng)并包括選自以下的一種或多種突變E44D、I46L、155V、156V、A60T、163V、L76M、G103S、L106I、D114G、L12U、Q144R、S148T、N158H、Q223H、I237G、I237N、1237R、S239T、V253A。在一些實(shí)施方案中,所述工程酮還原酶包括具有改進(jìn)的酶活性和改進(jìn)的酶穩(wěn)定性的組合并且具有下述氨基酸序列的酮還原酶,所述氨基酸序列與圖3的野生型序列(SEQIDNO:2)對應(yīng)并包括選自以下的一種或多種突變Q6E、N31P、A160S、Q165E、Q214H、Q214R、E234Q、Q263E。在一個實(shí)施方案中,所述酮還原酶包括所有這些突變。在一些實(shí)施方案中,所述工程酮還原酶包括具有改進(jìn)的酶活性和/或改進(jìn)的酶穩(wěn)定性的組合并且具有下述氨基酸序列的酮還原酶,所述氨基酸序列與圖3的野生型序列(SEQIDNO:2)對應(yīng)并包括選自以下的一種或多種突變N40Y、V43L、K51E、158V、E62Q、A73P、K79R、K152Q、K169E、F185I、Q189H、G192D、H200L、D201G、K215E、K215M、K216R、D221V、S233C、1237D、K250E、1265V、L287R、K304R、Q310R、K311E、V312S、V312E。此類工程酮還原酶的具體示例性實(shí)施方案包括SEQIDNO:16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252、254、256、258、260、262、266、268、270、272、274、276、278、280、282、284、286、288、290、292、294、296、298、300、302、304、306、308、310、312、314、316、318、320、322、324、326、328、330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364評口366。在一些實(shí)施方案中,所述工程酮還原酶具有與表1所列出的氨基酸序列具有至少約80、85、90、91、92、93、94、95、96、97、98或99%同一性的氨基酸序列。在一些實(shí)施方案中,所述酮還原酶包括與SEQIDNO:316或318具有至少約95、96、97、98或99%同一性的氨基酸序列。在一個實(shí)施方案中,所述酮還原酶包括SEQIDNO:316或318的氨基酸序列,但是所述氨基酸序列在與SEQIDNO:2相比未突變的殘基處具有一種或多種保守性突變(包括l、2、3、4、5、6、7、8、9、IO或更多種)。在另一個方面中,本公開內(nèi)容提供了編碼本文所述的工程酮還原酶的多核苷酸或在高嚴(yán)格條件下與此類多核苷酸雜交的多核苷酸。所述多核苷酸可包括用于表達(dá)被編碼的工程酮還原酶的啟動子和其他調(diào)節(jié)元件,并可利用針對具體期望的表達(dá)系統(tǒng)優(yōu)化的密碼子。在又一個方面中,本公開內(nèi)容提供了包括本文所述的多核苷酸和/或表達(dá)載體的宿主細(xì)胞。所述宿主細(xì)胞可以是所述工程酮還原酶源自的釀酒酵母,或者它們可以是不同的生物體。所述宿主細(xì)胞可用于表達(dá)和分離本文所述的工程酮還原酶,或者可選4奪地,它們可用于下文進(jìn)一步描述的各種方法。所述酮還原酶可用于以高產(chǎn)率和高立體選擇性程度將結(jié)構(gòu)式(Ia)的羥基氧代酯對映體還原為其對應(yīng)的順式二羥基物(dihydroxys)。在一個方面中,所述酮還原酶以純化的或分離的形式使用。在另一個方面中,使用來自表達(dá)所述酶的細(xì)胞的提取物。因此,在另一個方面中,本公開內(nèi)容提供了制備根據(jù)結(jié)構(gòu)式(IIa)的順式二羥基酯的方法<formula>formulaseeoriginaldocumentpage21</formula>其中X和W如前文所定義。所述方法通常包括選擇性還原根據(jù)結(jié)構(gòu)式(Ia)的羥基氧代酯對映體<formula>formulaseeoriginaldocumentpage21</formula>其中X和R1如對結(jié)構(gòu)式(IIa)所定義,所述還原使用本文所述的工程酮還原酶。所述方法可使用表達(dá)工程酮還原酶的全細(xì)胞(如本文所述的宿主細(xì)胞)、這類細(xì)胞的提取物或溶解產(chǎn)物、或純化的工程酮還原酶來進(jìn)行。如熟練的技術(shù)人員所理解,上文示例的還原反應(yīng)通常需要輔因子(通常為NADH或NADPH)和用于再生輔因子的系統(tǒng)(如葡萄糖和葡萄糖脫氫酶)。因?yàn)榧?xì)胞通常提供了此類輔因子和輔因子再生系統(tǒng),所以在使用全細(xì)胞細(xì)胞提取物或細(xì)胞溶解產(chǎn)物的實(shí)施方案中,加入此類輔因子和輔因子再生系統(tǒng)可以是不必要的。在使用純化的工程酮還原酶的實(shí)施方案中,此類輔因子和任選地此類輔因子再生系統(tǒng)通常與羥基氧代酯底物和酮還原酶一起被添加到反應(yīng)介質(zhì)中。如工程酮還原酶一樣,包括輔因子再生系統(tǒng)的任何酶均可以以此類細(xì)胞的提耳又物或溶解產(chǎn)物的形式、或作為純化的酶添加于反應(yīng)混合物。在使用細(xì)胞提取物或細(xì)胞溶解產(chǎn)物的實(shí)施方案中,用于產(chǎn)生所迷提取物或溶解產(chǎn)物的細(xì)胞可被工程化為表達(dá)包括單獨(dú)或與工程酮還原酶一起的輔因子再生系統(tǒng)的酶。在使用全細(xì)胞的實(shí)施方案中,所述細(xì)胞可被工程化為表達(dá)同時(shí)包括輔因子再生系統(tǒng)和工程酮還原酶的酶。不論用全細(xì)胞、細(xì)胞提取物還是用純化的酮還原酶進(jìn)行所述方法,可使用單個酮還原酶,或可選地,可使用兩種或多種酮還原酶的混合物。本文所述的酮還原酶對結(jié)構(gòu)式(Ia)的對映體具有高特異性并且以高產(chǎn)率和高立體選擇性程度催化上述的還原反應(yīng)。根據(jù)所用的特定工程酮還原酶,可容易地實(shí)現(xiàn)約80至99.9%范圍的產(chǎn)率,其中非對映體過量("d.e")299.5%。例如,已經(jīng)發(fā)現(xiàn)本公開內(nèi)容的工程酮還原酶可用于將結(jié)構(gòu)式(Ia)(見上)的5-羥基氧代酯對映體立體選擇性地還原為對應(yīng)的結(jié)構(gòu)式(IIa)的順式二羥基物,其中產(chǎn)率范圍為90至99.9%并且立體選擇性程度為299.7%。在很多實(shí)施方案中,可實(shí)現(xiàn)^99.8%、99.9%、99.91%、99.92%、99.93%、99.94%、99.5%、99.96%、99.97%、99.98%且甚至99.99%d.e.的非對映選擇性。實(shí)際上,如下文與圖6和7結(jié)合更詳細(xì)地論述,使用SEQIDNO:316的工程酮還原酶由以結(jié)構(gòu)式(Ia)的對映體〉99。/。純的起始底物獲得的未純化的粗還原產(chǎn)物是以結(jié)構(gòu)式(IIa)的順式非對映體〉99.99%純的。因?yàn)楸疚乃龅墓こ掏€原酶具有如此高的立體選擇性,所以獲得的結(jié)構(gòu)式(IIa)的順式二羥基酯可以以大致立體化學(xué)純的形式回收,而不需要于所述反應(yīng)的高產(chǎn)率和高立體選擇性,因此如果結(jié)構(gòu)式(I)的羥基氧代酯底物是以結(jié)構(gòu)式(Ia)的對映體大致純的,那么特定的結(jié)構(gòu)式(IIa)的順式二羥基酯非對映體可在不純化的情況下以大致純的或純的非對映體從反應(yīng)介質(zhì)中回收。結(jié)構(gòu)式(IIa)的手性二幾基酯可用作合成降膽固醇他汀類的起始物質(zhì),所述降膽固醇他汀類包括但不限于阿托伐他汀、羅蘇伐他汀和匹伐他汀。很多這些方法的關(guān)鍵步驟是保護(hù)結(jié)構(gòu)式(IIa)的順式二羥基酯的羥基基團(tuán),產(chǎn)生根據(jù)結(jié)構(gòu)式CIIIa:i的受保護(hù)的順式二羥基酯or2or2o(ma)X^A^A0R1其中X和Ri如前文對結(jié)構(gòu)式(IIa)所定義,并且每個W是保護(hù)基團(tuán)或者可選地,兩個W基團(tuán)可一起形成取代的或未取代的亞烴基橋。在一些實(shí)施方案中,所述受保護(hù)的順式二羥基酯是根據(jù)結(jié)構(gòu)式(IVa)的化合物r3xr4其中X和R1如前文對結(jié)構(gòu)式(IIa)所定義,并且R3和R4各自彼此獨(dú)立地選自氫、(Cl-C12)烴基、(C6-C10)芳基和(C7-C12)芳基烴基,或可選地,R3與R4—起形成(C4-C10)環(huán)烴基或雜環(huán)烴基。在特定的實(shí)施方案中,R3與W各為甲基。在一些實(shí)施方案中,所述受保護(hù)的順式二羥基酯是根據(jù)結(jié)構(gòu)式(Va)的化合物<formula>formulaseeoriginaldocumentpage23</formula>其中X和Ri如前文對結(jié)構(gòu)式(Ila)所定義,并且RS選自(C1-C12)烴基、(C6-C10)芳基和(C7-C12)芳基烴基。在一些實(shí)施方案中,RS是苯基。由于本文所述的工程酮還原酶的立體選擇性,它們可用于合成根據(jù)結(jié)構(gòu)式(llla)、(IVa)和(Va)的受保護(hù)的順式二羥基酯的立體異構(gòu)純的制品。所述方法通常包括使用如本文所述的工程酮還原酶對映選擇性地還原根據(jù)結(jié)構(gòu)式(Ia)(見上)的羥基氧代酯對映體,以產(chǎn)生包括根據(jù)結(jié)構(gòu)式(IIa)(見上)的順式二羥基酯的第一反應(yīng)產(chǎn)物,以及保護(hù)順式二羥基酯的羥基基團(tuán)以產(chǎn)生結(jié)構(gòu)式(IIIa)的受保護(hù)的順式二羥基酯。由于所述工程酮還原酶的高立體選擇性,結(jié)構(gòu)式(nia)的受保護(hù)的順式二羥基酯可在不進(jìn)行手性分離的情況下以大致立體化學(xué)純的或純的非對映體回收,即基本上不含對應(yīng)的反式非對映體和任何其他非對映體。所述順式二羥基酯和/或受保護(hù)的順式二羥基酯可用作合成降膽固醇他汀類的已知方法的反應(yīng)物。用于制備示例性他汀類的示例性合成途徑如圖8、9和10所示。因此,在另一個方面中,本公開內(nèi)容提供了制備他汀類的大致立體異構(gòu)純的制品的方法,所述他汀類如,例如阿托伐他汀、羅蘇伐他汀和匹伐他汀。所述方法通常包括(i)用本文所述的工程酮還原酶還原大致對映體純的根據(jù)結(jié)構(gòu)式(Ia)的羥基氧代酯對映體OH00其中W和X如前文所定義,以產(chǎn)生包括大致非對映體純的根據(jù)結(jié)構(gòu)式(IIa)的順式二羥基酯的第一反應(yīng)產(chǎn)物<formula>formulaseeoriginaldocumentpage24</formula>其中X和W如對結(jié)構(gòu)式(Ia)所定義;以及(ii)此后使用結(jié)構(gòu)式(IIa)的順式二羥基酯以合成他汀類。因?yàn)楸疚乃龅墓こ掏€原酶以高對映選擇性程度催化步驟(i)的還原,所以結(jié)構(gòu)式(IIa)的順式二羥基酯可用于合成具有高度立體異構(gòu)體純度的他汀類,所述合成使用在接近室溫下進(jìn)行的反應(yīng),并且不需要手性分離。實(shí)際上,還原反應(yīng)的高度立體選擇性允許以高產(chǎn)率容易且經(jīng)濟(jì)地制備%d.e.在羥基氧代酯起始底物。/。e.e.的約90至99.99%內(nèi)的他汀類。5.附圖筒述圖1示例了酮還原酶和卣代醇脫卣素酶(halohydrogendehalogenases)在將4-卣素-3-氧代丁酸烴基酯轉(zhuǎn)化為用于合成他汀類的各種中間體中的作用。圖2示例了用于從3,5-二羥基-6-卣代己酸叔丁酯合成(6R)-(2-氰乙基)-2,2二曱基-1,3-二噁烷叔丁酉旨(t-butyl(6R)-(2-cyanoethyl)-2,2dimethyl-l,3-dioxane)的各種途徑。圖3提供了由來自釀酒酵母的JW〃24w;基因(Genbank登錄號NP—010159.1;GI:6320079)編碼的酮還原酶的野生型序列(SEQIDNO:2)。圖4提供了來自釀酒酵母的酮還原酶的氨基酸序列,其中標(biāo)記的殘基可3皮修飾以生成具有改進(jìn)的酮還原酶性質(zhì)的工程多肽。圖5提供了質(zhì)粒pCK110900的示例,其中克隆的酮還原酶基因可操作地連接至處于lacl抑制子控制下的lac啟動子以表達(dá)工程酮還原酶。圖6顯示了實(shí)施例27的6-氰基-(3R,5R)-二羥基己酸叔丁酯樣品(由本文所述的方法的實(shí)施方案制備的樣品)(上圖)和由商品化晶體(6R)-(2-氰乙基)-2,2-二曱基-1,3-二噁烷-(4R)-乙酸叔丁酯制備的樣品(下圖)的LC艇S艇S色鐠圖。圖7顯示了實(shí)施例28的(6R)-(2-氰乙基)-2,2二曱基-l,3-二噁烷-(4R)-乙酸叔丁酯樣品(由本發(fā)明的方法制備的樣品)和商品化晶體樣品的GC/MS色譜圖。圖8示例了羅蘇伐他汀的合成流程;R表示H或合適的保護(hù)基團(tuán)。圖9示例了匹伐他汀的合成流程;R表示H或合適的保護(hù)基團(tuán)。圖IO示例了阿托伐他汀的合成流程;R表示H或合適的保護(hù)基團(tuán)。6.詳述6.1定義如本文所用,下列術(shù)語意在具有下列含義"烴基(alkvD"單獨(dú)或作為另一個取代基的部分是指通過從母體烷烴(alkane)、烯烴(alkene)或炔烴的單個碳原子消除一個氫原子而得到的具有規(guī)定數(shù)目的碳原子(即Cl-C6是指1至6個碳原子)的飽和或不飽和的支鏈、直鏈或環(huán)狀一價(jià)烴基。典型的烴基基團(tuán)包括但不限于甲基;乙基類如乙烷基、乙烯基、乙炔基;丙基類如丙烷-l-基、丙烷-2-基、環(huán)丙烷-l-基、丙墨l陽烯-l-基、丙_1_歸_2-基、丙-2-烯-l-基、環(huán)丙-l-歸-l-基;環(huán)丙-2-烯-l-基、丙-l-炔-l-基、丙-2-炔-l-基等;丁基類如丁烷-l-基、丁烷-2-基、2-甲基-丙烷-l-基、2-甲基-丙烷-2-基、環(huán)丁烷-l-基、丁-l陽烯誦l-基、丁-l-烯誦2-基、2-甲基-丙-l-烯-l-基、丁—2-烯誦l-基、丁-2-歸-2-基、丁-l,3-二烯-l-基、丁-1,3-二烯-2-基、環(huán)丁-l-蹄-l-基、環(huán)丁-l-烯-3-基、環(huán)丁-l,3-二烯-l-基、丁-l-炔_1_基、丁_1_炔_3-基、丁_3-炔-1-基等;及類似烴基。在意指特定的飽和度時(shí),使用名稱"烷基(alkanyl)"、"烯基(alkenyl)"和/或"炔基",如下文所定義。"低級烴基"是指含有1至6個碳原子的烴基基團(tuán)。"烷基"單獨(dú)或作為另一個取代基的部分是指通過從母體烷烴的單個碳原子消除一個氫原子而得到的飽和的支鏈、直鏈或環(huán)狀烴基。典型的烷基基團(tuán)包括但不限于曱烷基;乙烷基;丙烷基類如丙烷-l-基、丙烷-2-基(異丙基)、環(huán)丙烷-l-基等;丁烷基類如丁烷-l-基、丁烷-2-基(仲丁基)、2-甲基-丙烷-l-基(異丁基)、2-甲基-丙烷-2-基(叔丁基)、環(huán)丁烷-l-基等;及類似烷基。"烯基"單獨(dú)或作為另一個取代基的部分是指通過從母體烯烴的單個碳原子消除一個氫原子而得到的具有至少一個碳碳雙鍵的不飽和的支鏈、直鏈或環(huán)狀烴基。所述基團(tuán)可以是關(guān)于雙鍵的順式或反式構(gòu)象。典型的烯基基團(tuán)包括但不限于乙烯基;丙烯基類如丙-l-烯-l-基、丙-l-烯-2-基、丙-2-烯-l-基、丙-2-烯-2-基、環(huán)丙-l-烯-l-基;環(huán)丙-2-烯-l-基;丁烯基類如丁-l-烯-l-基、丁-l隱烯-2隱基、2-甲基-丙-l-烯-l-基、丁-2-烯-l-基、丁畫2-烯-2隱基、丁-l,3-二烯-l-基、丁-l,3-二蜂-2-基、環(huán)丁-l-烯-l-基、環(huán)丁-l-烯-3-基、環(huán)丁-l,3-二烯-l-基等;及類似烯基。"炔基"單獨(dú)或作為另一個取代基的部分是指通過從母體炔烴的單個碳原子消除一個氬原子而得到的具有至少一個碳碳三鍵的不飽和的支鏈、直鏈或環(huán)狀烴基。典型的炔基基團(tuán)包括但不限于乙炔基;丙炔基類如丙-l-炔-l-基、丙-2-炔-l-基等;丁炔基類如丁-l-炔-l-基、丁-l-炔-3-基、丁-3-炔-l-基等;及類似炔基。"烴基二基(Alkyldiyl)"單獨(dú)或作為另一個取代基的部分是指通過從母體烷烴、烯烴或炔烴的兩個不同的碳原子各消除一個氬原子或通過從母體烷烴、棒烴或炔烴的單個碳原子消除兩個氫原子而得到的具有規(guī)定數(shù)目的碳原子(即Cl-C6表示1至6個碳原子)的飽和或不飽和的支鏈、直鏈或環(huán)狀二價(jià)烴基。兩個一價(jià)基團(tuán)中心或二價(jià)基團(tuán)中心的每個化合價(jià)可與相同或不同的原子形成鍵。典型的烴基二基基團(tuán)包括但不限于甲烷二基(methandiyl);乙基二基類(ethyldiyls)如乙烷-l,l-二基、乙烷-l,2-二基、乙烯-l,l-二基、乙烯-l,2-二基;丙基二基類(propyldiyls)如丙烷-l,l-二基、丙烷-l,2-二基、丙烷-2,2-二基、丙烷-l,3-二基、環(huán)丙烷-l,l-二基、環(huán)丙烷-1,2-二基、丙-l畫烯-l,l-二基、丙-l-烯-l,2-二基、丙-2-烯-l,2-二基、丙陽1-烯-1,3-二基、環(huán)丙-l-烯-l,2-二基、環(huán)丙-2-烯-l,2-二基、環(huán)丙-2-烯-l,l-二基、丙-l-炔-l,3-二基等;丁基二基類(butyldiyls)如丁烷-l,l-二基、丁烷-l,2-二基、丁烷畫l,3-二基、丁烷-l,4-二基、丁烷-2,2-二基、2-甲基-丙烷-l,l-二基、2-甲基-丙烷-l,2-二基、環(huán)丁烷-l,l-二基;環(huán)丁烷-l,2-二基、環(huán)丁烷-l,3-二基、丁-卜烯-1,l-二基、丁-l-烯-l,2-二基、丁-l-烯-l,3-二基、丁-l-烯-1,4-二基、2-甲基-丙-l-烯-l,l-二基、2-亞甲烷基(methanylkiene)-丙烷-l,l-二基、丁-1,3-二雄-l,l-二基、丁-l,3-二烯-l,2-二基、丁-l,3-二烯-l,3-二基、丁-1,3-二烯-1,4-二基、環(huán)丁-l-烯-l,2-二基、環(huán)丁-l-烯-l,3-二基、環(huán)丁-2-烯-l,2-二基、環(huán)丁畫l,3-二烯-l,2-二基、環(huán)丁-l,3-二烯-l,3-二基、丁-l-炔-l,3-二基、丁-1-炔陽1,4-二基、丁-l,3-二炔-l,4-二基等;及類似烴基二基。在意指特定的飽和度時(shí),使用名稱烷基二基(alkanyldiyl)、烯基二基(alkenyldiyl)和/或炔基二基(alkynyldiyl)。在特別意指兩個化合價(jià)在同一碳原子上時(shí),使用名稱"亞烴基(alkylidene)"。"低級烴基二基,,是含有1至6個碳原子的烴基二基基團(tuán)。在一些實(shí)施方案中,所述烴基二基基團(tuán)是飽和的非環(huán)烷基二基基團(tuán),其中所述基團(tuán)中心是在末端碳上,如甲烷二基(橋亞甲烷基(methano));乙烷-1,2-二基(橋亞乙烷基(ethano));丙烷-l,3-二基(橋亞丙烷基(propano));丁烷-1,4-二基(橋亞丁烷基(butano));及類似飽和的非環(huán)烷基二基(也被稱為亞烴基(alkylene),如下文所定義)。"亞烴基"單獨(dú)或作為另一個取代基的部分是指通過從直鏈母體烷烴、烯烴或炔烴的兩端碳原子中的每個消除一個氫原子而得到的具有兩個末端一價(jià)基團(tuán)中心的直鏈飽和或不飽和的烴基二基基團(tuán)。特定亞烴基中的雙鍵或三鍵(如果存在)的位次在方形括號中顯示。典型的亞烴基基團(tuán)包括但不限于亞甲基(橋亞甲基);亞乙基類如橋亞乙烷基、橋亞乙烯基、橋亞乙炔基;亞丙基類如橋亞丙烷基、橋亞丙[l]烯基、橋亞丙[1,2]二烯基、橋亞丙[l]炔基等;亞丁基類如橋亞丁烷基、橋亞丁[l]烯基、橋亞丁[2]烯基、橋亞丁[1,3]二烯基、橋亞丁[l]炔基、橋亞丁[2]炔基、橋亞丁[1,3]二炔基等;及類似基團(tuán)。在意指特定的飽和度時(shí),使用名稱橋亞烷基(alkano)、橋亞烯基(alkeno)和/或橋亞炔基(alkyno)。在一些實(shí)施方案中,亞烴基基團(tuán)是(C1-C6)或(C1-C3)亞烴基。在一些實(shí)施方案中,所述亞烴基基團(tuán)是直鏈飽和的橋亞烷基基團(tuán),如橋亞曱烷基、橋亞乙烷基、橋亞丙烷基、橋亞丁烷基及類似橋亞烷基。"環(huán)烴基"單獨(dú)或作為另一個取代基的部分是指"烴基,,基團(tuán)的環(huán)狀形式。典型的環(huán)烴基基團(tuán)包括但不限于環(huán)丙基;環(huán)丁基類如環(huán)丁烷基和環(huán)丁烯基;環(huán)戊基類如環(huán)戊烷基和環(huán)戊烯基;環(huán)己基類如環(huán)己烷基和環(huán)己烯基;及類似環(huán)烴基。"母體芳香族環(huán)系統(tǒng)"是指具有共扼71電子系統(tǒng)的不飽和的環(huán)或多環(huán)系統(tǒng)。特別包括在"母體芳香族環(huán)系統(tǒng)"的定義中的有稠環(huán)系統(tǒng),其中一個或多個環(huán)是芳香族的并且一個或多個環(huán)是飽和或不飽和的,所述稠環(huán)系統(tǒng)如例如藥、茚滿、茚、非那烯(phenalene)、四氫化萘等。典型的母體芳香族環(huán)系統(tǒng)包括但不限于醋蒽烯、苊烯、醋菲烯、蒽、奧、苯、屈(chrysene)、蔻、熒蒽、芴、并六苯、己芬、己搭秌(hexalene)、引達(dá)省(indacene)、對稱引達(dá)省、茚滿、茚、萘、并乂、苯(octacene)、辛芬(octaphene)、辛才荅烯(octalene)、卵苯、戊-2,4-二烯、并五苯、并環(huán)戊二烯、戊芬(pentaphene)、茈、非那烯、菲、茵、七曜烯(pleiadene)、芘、吡蒽(pyranthrene)、玉紅省(mbicene)、四氮化萘、三亞苯、三亞萘及類似母體芳香族環(huán)系統(tǒng)。"芳基"單獨(dú)或作為另一個取代基的部分是指通過從母體芳香族環(huán)系統(tǒng)的單個碳原子消除一個氬原子而得到的具有規(guī)定數(shù)目的碳原子(即C6-C10表示5至15個碳原子)的一價(jià)芳香族烴基。典型的芳基基團(tuán)包括但不限于由以下衍生的基團(tuán)醋蒽烯、苊烯、醋菲烯、蒽、奧、苯、屈、蔻、熒蒽、芴、并六苯、己芬、己搭烯、不對稱引達(dá)省、對稱引達(dá)省、茚滿、茚、萘、并八笨、辛芬、辛搭烯、卵笨、戊-2,4-二烯、并五笨、并環(huán)戊二烯、戊芬、芘、非那烯、菲、茵、七曜烯、芘、吡蒽、玉紅省、三亞苯、三亞萘及類似母體芳香族環(huán)系統(tǒng)、和其各種氫異構(gòu)體。在一些實(shí)施方案中,所述芳基基團(tuán)是(C6-C10)。特定的實(shí)例是苯基和萘基。"芳基烴基,,單獨(dú)或作為另一個取代基的部分是指其中與碳原子(通常末端或A^碳原子)連接的一個氫原子被芳基基團(tuán)取代的非環(huán)狀烴基基團(tuán)。典型的芳基烴基基團(tuán)包括但不限于芐基、2-苯乙烷-l-基、2-苯乙烯-l-基、萘甲基、2-萘乙烷-l-基、2-萘乙烯-l-基、萘并芐基、2-萘并苯乙烷-l-基及類似芳烴基。在意指特定的飽和或不飽和的烴基部分時(shí),使用名稱芳基烷基、芳基烯基(arylakenyl)和/或芳基炔基。在一些實(shí)施方案中,所述芳基烴基基團(tuán)是(C7-C12)芳基烴基。在特定的實(shí)施方案中,所述芳基烴基基團(tuán)的烷基、烯基或炔基部分是(C1-C2)并且所述芳基部分是(C6-C10)。本文可互換使用的"酮還原酶"和"KRED"是指能夠?qū)τ尺x擇性地還原5-鞋基-3-氧代己酸酯對映體的3-氧代基團(tuán)以產(chǎn)生對應(yīng)的順式3,5-二羥基己酸酯的多肽。所述多肽通常利用輔因子還原型煙酰胺腺噪呤二核香酸(NADH)或還原型煙酰胺腺噪呤二核普酸磷酸(NADPH)作為還原劑。如本文所用的酮還原酶包括天然存在的(野生型)酮還原酶和由人纟喿作產(chǎn)生的非天然存在的工程多肽。"編碼序列"是指編碼蛋白質(zhì)的氨基酸序列的核酸部分(例如基因)。"天然存在的"或"野生型"是指在自然界中發(fā)現(xiàn)的形式。例如,天然存在的或野生型多肽或多核香酸序列是可從自然來源中分離并且未通過人操作有意修飾的存在于生物體中的序列。"重組體"在用于指例如細(xì)胞、核酸或多肽時(shí),指已用未存在于自然界的方式進(jìn)行改進(jìn)的材料、或者與所述材料的自然或天然形式對應(yīng)的材料,或者與之相同但是由合成材料和/或通過使用重組技術(shù)的操作生成或衍生的材料、或者與所迷材料的自然或天然形式對應(yīng)的材料。非限制性實(shí)例包括表達(dá)未在細(xì)胞的天然(非重組)形式中發(fā)現(xiàn)的基因或表達(dá)另外地以不同水平表達(dá)的天然基因的重組細(xì)胞以及其他重組體。本文可互換使用的"序列同一性的百分比"和"同源性百分比"是指多核苷酸之間和多肽之間的比較,并且通過在比較窗(comparisonwindow)中比較兩個最佳比對的序列來確定,其中所述多核普酸或多肽序列在比較窗中的部分與用于兩個序列的最佳比對的參考序列(其不包括添加或缺失)相比可包括添加或缺失(即缺口)。所述百分比可通過以下來計(jì)算確定相同的核酸堿基或氨基酸殘基出現(xiàn)于兩個序列的位置數(shù)以得出匹配位置數(shù),然后用所述匹配位置數(shù)除以比較窗中的位置總數(shù)并將結(jié)果乘以100以得出序列同一性的百分比??蛇x地,所述百分比可通過以下來計(jì)算確定相同的核酸堿基或氨基酸殘基出現(xiàn)于兩個序列或者核酸堿基或氨基酸殘基與缺口比對的位置數(shù)以得出匹配位置數(shù),然后用所述匹配位置數(shù)除以比較窗中的位置總數(shù)并將結(jié)果乘以100以得出序列同一性的百分比。本領(lǐng)域技術(shù)人員理解有;f艮多可用于比對兩個序列的成熟算法。例如用于比較的序列最佳比對可通過Smith和Waterman,1981,爿dv.X/^/.Af"仇2:482的局部同源性算法、通過Needleman和Wunsch,1970,J./Ifr/.S,》/.48:443的同源性比對算法、通過Pearson和Lipman,1988,尸rac.&/.腦85:2444的相似性搜索方法、通過計(jì)算機(jī)化實(shí)現(xiàn)這些算法(GCGWisconsin軟件包中的GAP、BESTFIT、FASTA和TFASTA)或者通過視覺檢查(通常參見Cwre"/尸ratoco/sA/o/ecw/w說o/ogy(分子生物學(xué)最新方案),F(xiàn).M.Ausubel等人編,CurrentProtocols(最新方案),GreenePublishingAssociates,Inc.和JohnWiley&Sons,Inc.之間的聯(lián)合投資(1995增補(bǔ))(Ausubel))進(jìn)行。適合于確定百分比序列同一性和序列相似性的算法的實(shí)例是BLAST和BLAST2.0算法,它們分別在Altschul等人,1990,丄Mo/,tfw/.215:403-410和Altschul等人,1977,M/c'/ezc'y4c,^i&3389-3402中描述。用于進(jìn)行BLAST分析的軟件可通過美國國家生物技術(shù)信息中心網(wǎng)站公開得到。這種算法包括首先通過識別查詢序列中長度W的短字來識別高分值序列對(HSP),所述短字當(dāng)與數(shù)據(jù)庫序列中相等長度的字比對時(shí)匹配或滿足某些正閾值分值T。T被稱為鄰近字分值闊值(Altschul等人,見上)。這些初始的鄰近字匹配字串(hit)用作啟動搜索以發(fā)現(xiàn)包含它們的更長HSP的種子(seed)。然后沿著每個序列以兩個方向延伸字匹配字串,直至不可增加累積比對分值。對于核苷酸序列,累積分值使用參數(shù)M(匹配殘基對的獎分值;總是〉0)和N(錯配殘基的罰分值;總是<0)來計(jì)算。對于氨基酸序列,使用分值矩陣計(jì)算累積分值。當(dāng)出現(xiàn)以下情況時(shí),則字匹配字串在每個方向的延伸停止累積比對分值從其最大達(dá)到值減少X量;由于一個或多個負(fù)分值殘基比對的累積,所以累積分值變?yōu)榱慊蛄阋韵?;或者到達(dá)任一個序列的末端。BLAST算法參數(shù)W、T和X確定比對的敏感性和速度。BLASTN程序(對于核普酸序列)默認(rèn)使用字長(W)ll、期望值(E)10、M=5、N二4和兩鏈的比較。對于氨基酸序列,BLASTP程序默認(rèn)使用字長(W)3、期望值(E)IO和BLOSUM62分值矩陣(參見Henikoff和Henikoff,1989,A^/爿caJ〔/&489:10915)。序列比對和%序列同一性的示例性確定可應(yīng)用GCGWisconsin軟件包(Accelrys,MadisonWI)中的BESTFIT或GAP程序,并使用所提供的默認(rèn)參數(shù)。"參考序列"是指用作序列比較基礎(chǔ)的確定序列。參考序列可以是較大序列的子集,例如全長基因或多肽序列的區(qū)段。一般來說,參考序列是至少20個核苷酸或氨基酸殘基長、至少25個殘基長、至少50個殘基長、或者核酸或多肽的全長。由于兩個多核苷酸或多肽可各自(l)包括在所述兩個序列之間相似的序列(即全序列的一部分)、并且(2)可進(jìn)一步包括在所述兩個序列之間差異的序列,因此兩個(或更多個)多核苷酸或多肽之間的序列比較通常通過在"比較窗"內(nèi)比較兩個多核苷酸的序列以鑒定和比較局部區(qū)域的序列相似性而進(jìn)行。"比較窗"是指至少約20個鄰接的核苷酸位置或氨基酸殘基的概念性區(qū)段,其中序列可與至少20個鄰接的核苷酸或氨基酸的參考序列比較并且其中比較窗中的序列部分與參考序列(其不包括添加或缺失)相比可包括20%或更少的添加或缺失(即缺口)以達(dá)到所述兩個序列的最佳比對。所述比專交窗可比20個鄰接的殘基更長,并且包括任選地30、40、50、100個或更長的窗。"大致的同一性"是指在至少20個殘基位置的比較窗內(nèi)、通常在至少30-50個殘基的窗內(nèi)與參考序列相比具有至少80%序列同一性、至少85%同一性和89至95%序列同一性、更通常至少99%序列同一性的多核苦酸或多肽序列,其中所述序列同一性的百分比通過在比較窗內(nèi)比較參考序列與包括總計(jì)為參考序列的20%或更少的缺失或添加的序列來計(jì)算。在應(yīng)用于多肽的特定實(shí)施方案中,術(shù)語"大致的同一性"表示兩個多肽序列當(dāng)進(jìn)行最佳比對(如通過程序GAP或BESTFIT,使用默認(rèn)缺口權(quán)重)時(shí),共有至少80%序列同一性、優(yōu)選至少89%序列同一性、至少95%序列同一性或更多(例如99%序列同一性)。優(yōu)選地,不相同的殘基位置的不同在于保守性氨基酸置換。"立體選擇性"是指一個立體異構(gòu)體與另一個立體異構(gòu)體相比在化學(xué)反應(yīng)或酶反應(yīng)中的優(yōu)先形成。立體選擇性可以是部分的,其中一個立體異構(gòu)體的生成與另一個相比是有利的,或者其可以是完全的,其中僅生成一個立體異構(gòu)體。當(dāng)這些立體異構(gòu)體是對映體時(shí),立體選擇性稱作對映選擇性,即一個對映體在兩者總數(shù)中的分?jǐn)?shù)(通常報(bào)道成百分比)。它在本領(lǐng)域一般報(bào)道(通常為百分比)成根據(jù)式[主要對映體-次要對映體]/[主要對映體+次要對映體]從中計(jì)算的對映體過量。當(dāng)立體異構(gòu)體為非對映異構(gòu)體時(shí),立體選擇性被稱為非對映選擇性,即一個非對映體在與其他非對映體的總數(shù)中的分?jǐn)?shù)(通常報(bào)道成百分比)。在本公開內(nèi)容的環(huán)境中,非對映選擇性是指轉(zhuǎn)化成結(jié)構(gòu)式IIa的順式二羥基酯(與式lib的反式二羥基酯相反)的結(jié)構(gòu)式(Ia)的羥基氧代酯的分?jǐn)?shù)(通常報(bào)道成百分比)。它還可報(bào)道(通常為百分比)成根據(jù)式[順式IIa-反式lib]/[順式IIa+反式IIb]從中計(jì)算的非對映體過量。6.2酮還原酶本公開內(nèi)容提供了能對映選擇性地還原5-羥基-3-氧代己酸酯對映體的3-氧代基團(tuán)以產(chǎn)生對應(yīng)的順式3,5-二羥基己酸酯,并且當(dāng)與獲自釀酒酵母的天然存在的野生型KRED酶相比時(shí)具有至少一種改進(jìn)性質(zhì)的工程酮還原酶("KRED")。如上所述,由酮還原酶產(chǎn)生的立體異構(gòu)純的順式3,5-二羥基己酸酯可用作合成數(shù)個降膽固醇他汀類的中間體。各種酶性質(zhì)的改進(jìn)可促進(jìn)這些工程酮還原酶在這種中間體化合物的大規(guī)4莫生產(chǎn)中的使用。酶性質(zhì)的任何數(shù)量的改進(jìn)如酶活性、熱穩(wěn)定性和減少的輔因子需求都可用于所述的應(yīng)用。具有改進(jìn)性質(zhì)的酮還原酶可通過使編碼釀酒酵母的酮還原酶的遺傳物質(zhì)突變并鑒定表達(dá)具有期望性質(zhì)的工程酶的多核苷酸而獲得。這些非天然存在的酮還原酶可通過各種眾所周知的技術(shù)如體外誘變或定向進(jìn)化而產(chǎn)生。在一些實(shí)施方案中,定向進(jìn)化是用于產(chǎn)生工程酶的有吸引力的方法,因?yàn)槠湎鄬θ菀自谡麄€編碼多肽的全基因產(chǎn)生突變以及提供采用先前變異的多核苷酸并且使它們經(jīng)受另外誘變和/或重組的循環(huán)以獲得所選酶性質(zhì)的進(jìn)一步改進(jìn)的能力。使全基因經(jīng)受誘變可減少由于將變化限制在基因的有限區(qū)域而產(chǎn)生的偏好性。它還可增強(qiáng)在不同的酶性質(zhì)方面受到影響的酶的產(chǎn)生,因?yàn)槊傅倪h(yuǎn)間隔部分可在酶功能的各種方面中起作用。用于本文目的的誘變和定向進(jìn)化技術(shù)在以下文獻(xiàn)中詳細(xì)描述Ling等人,1997,"ApproachestoDNAmutagenesis:anoverview(DNAi秀變方法綜述)"j"a/.6/oc/7t'肌254(2):157-78;Dale等人,1996,"Oligonucleotide-directedrandommutagenesisusingthephosphorothioatemethod("f吏用石克^石粦酸酉旨方〉'去6々寡才亥苷酸指導(dǎo)的隨機(jī)i秀變)"A/W/2^Zs'A^/.fi/o/.57:369-74;Smith,1985,"Invitromutagenesis(體外諸變),,y4朋.ev.19:423-462;Botstein等人,1985,"Strategiesandapplicationsofinvitromutagenesis(體夕卜i秀變的策略和應(yīng)用)"&,e"ce229:1193-1201;Carter,1986,"Site-directedmutagenesis(定點(diǎn)誘變)"237:1-7;Kramer等人,1984,"PointMismatchRepair(點(diǎn)錯配修復(fù))"Ce〃,38:879-887;Wells等人,1985,"Cassettemutagenesis:anefficientmethodforgenerationofmultiplemutationsatdefinedsites(盒式i秀變用于在確定位點(diǎn)產(chǎn)生多重突變的有效方法)"34:315-323;Minshull等人,1999,"Proteinevolutionbymolecularbreeding(經(jīng)分子育種的蛋白進(jìn)化)"CmrOp/"C/e,"B/。/3:284-290;Christians等人,1999,"DirectedevolutionofthymidinekinaseforAZTphosphorylationusingDNAfamilyshuffhng(使用DNA家族改組的用于AZT磷酸化的胸苷激酶的定向進(jìn)化)"AtowS,oec/217:259-264;Crameri等人,1998,"DNAshufflingofafamilyofgenesfromdiversespeciesacceleratesdirectedevolution(只十來自不同物種的基因的家族的DNA改組加速了定向進(jìn)化)"Nature391:288-291;Crameri等人,1997,"MolecularevolutionofanarsenatedetoxificationpathwaybyDNAshuffling(通過DNA改組的砷酸鹽解毒途徑的定向進(jìn)化)"A^mw所otec/15:436-438;Zhang等人,1997,"DirectedevolutionofaneffectivefructosidasefromagalactosidasebyDNAshufflingandscreening(通過DNA改組和篩選的從半乳糖苷酶向有效的果糖苷酶的定向進(jìn)化)"iVocWW/爿cac/〔/&494:45-4-4509;Crameri等人,1996,"ImprovedgreenfluorescentproteinbymolecularevolutionusingDNAshuffling(通過葉吏用DNA改纟且的分子進(jìn)j匕文進(jìn)綠色熒光蛋白)"Mft/re萬/otec/14:315-319;Stemmer,1994,"RapidevolutionofaproteininvitrobyDNAshuffling(通過DNA改纟且的蛋白的體外快速進(jìn)化)"TVWwre370:389-391;Stemmer,1994,"DNAshufflingbyrandomfragmentationandreassembly:Invitrorecombinationformolecularevolution(通過隨機(jī)斷裂和重新組裝的DNA改組用于分子進(jìn)化的體外重組),,PracAto/A^/S"[/&491:10747-10751;WO95/22625;WO97/0078;WO97/35966;WO98/27230;WO00/42651;WO01/75767和美國專利6,537,746。所有出版物通過引用并入本文。編碼釀酒酵母的天然存在的酮還原酶的天然存在的多核苷酸可從已知編碼酮還原酶活性的分離的多核苷酸(Genbank登錄號NP—010159GI:6320079)獲得??蛇x地,編碼天然存在的酮還原酶的多核苷酸可基于已報(bào)道的編碼釀酒酵母酮還原酶的基因的多核苷酸序列通過本領(lǐng)域已知的多核苷酸合成方法來合成。在各種實(shí)施方案中,如下文進(jìn)一步描述,編碼酮還原酶的天然存在的多核苷酸可被密碼子優(yōu)化成用于表達(dá)所述酶的特異性宿主細(xì)胞優(yōu)選的密碼子。例如參見實(shí)施例1。編碼天然存在的或野生型酮還原酶的母體或參考多核苷酸經(jīng)受誘變過程(如隨機(jī)誘變和重組)以引入突變到所述多核苷酸中。表達(dá)并翻譯所述突變的多核苷酸,從而產(chǎn)生對所述多肽修飾的工程酮還原酶。如本文所用,"修飾"包括氨基酸置換、缺失和插入??蓪⑷魏我环N修飾或修飾的組合引入到天然存在的酶學(xué)活性多肽以產(chǎn)生工程酶,然后通過各種方法篩選所述工程酶以鑒定具有特異性酶性質(zhì)的期望改進(jìn)的多肽和對應(yīng)的多核苷酸。編碼具有改進(jìn)性質(zhì)的工程酮還原酶的多核苷酸可經(jīng)受另外回合的誘變處理以產(chǎn)生期望的酶性質(zhì)進(jìn)一步改進(jìn)的多肽。如本文所用,具有"改進(jìn)的酶性質(zhì)"的酮還原酶是指與參考酮還原酶相比顯示任何酶性質(zhì)的改進(jìn)的酮還原酶。對于本文所述的工程酮還原酶,通常進(jìn)行與野生型釀酒酵母酮還原酶(SEQDNO:2)的比較,盡管在一些實(shí)施方案中,所述參考酮還原酶可以是另一個改進(jìn)的工程酮還原酶。期望改進(jìn)的酶性質(zhì)包括但不限于酶活性、熱穩(wěn)定性、pH活性特性、輔因子需求、對抑制劑(例如產(chǎn)物抑制)的不應(yīng)性(refractoriness)、立體特異性和立體選擇性。如本文工程酮還原酶的環(huán)境所用,"源自"識別起源酮還原酶、和/或工程所基于的編碼這種酮還原酶的基因。例如,SEQIDNO:80的工程酮還原酶是通過多代人工進(jìn)化編碼SEQIDNO:2的釀酒酵母酮還原酶的基因而獲得的。因此,這種工程酮還原酶"源自"SEQIDNO:2的野生型酮還原酶。盡管不希望受任何操作理論的限制,但是認(rèn)為酶性質(zhì)的改進(jìn)來源于多肽鏈中的修飾引進(jìn),所述修飾引進(jìn)有效擾亂所述酶的結(jié)構(gòu)功能和/或其與另一個分子(例如底物)的相互作用。多肽的某些區(qū)域,例如參與催化和底物結(jié)合結(jié)構(gòu)域的氨基酸可對酶活性是決定性的,以致對這些區(qū)域的小干擾可對酶功能具有重大的影響。某些氨基酸殘基可處在維持酶的二級或三級結(jié)構(gòu)的重要位置,因此當(dāng)被修飾時(shí),也產(chǎn)生酶性質(zhì)的顯著變化。另一方面,多肽的某些區(qū)域可具有整體結(jié)構(gòu)作用或形成較少參與酶功能的關(guān)鍵性方面的酶部分(例如連接a螺旋的肽環(huán)),因而僅當(dāng)此區(qū)域中已積聚了很多置換時(shí),才對酶功能產(chǎn)生可測量的影響。因此,在一些實(shí)施方案中,產(chǎn)生改進(jìn)的酮還原酶性質(zhì)的天然存在的多肽的修飾數(shù)目可包括1個或更多個氨基酸、2個或更多個氨基酸、5個或更多個氨基酸、IO個或更多個氨基酸、或者20個或更多個氨基酸、高至參考酶序列氨基酸總數(shù)的10%、高至氨基酸總數(shù)的20%或者高至氨基酸總數(shù)的30%。因?yàn)榧夹g(shù)的性質(zhì),所以基因進(jìn)化方法如DNA誘變和重組偏好氨基酸置換的修飾。因此,在各種實(shí)施方案中,酶性質(zhì)的改進(jìn)可來源于1個氨基酸殘基、2個或更多個氨基酸殘基、5個或更多個氨基酸殘基、IO個或更多個氨基酸殘基、15個或更多個氨基酸殘基、20個或更多個氨基酸殘基、高至組成參考酶序列的氨基酸總數(shù)的10%、高至氨基酸總數(shù)的20%或者高至氨基酸總數(shù)的30%的置換。如對熟練的技術(shù)人員來說明顯的是,對大量具有改進(jìn)酶性質(zhì)的工程酮還原酶的氨基酸置換分析顯示置換在酮還原酶多肽的某些氨基酸殘基重現(xiàn)以及偏好某些類型的氨基酸。置換在多肽內(nèi)的某些確定位置的這種重現(xiàn)可反映氨基酸殘基對特定酶性質(zhì)的影響和其被連續(xù)施加的特定的改進(jìn)酶性質(zhì)的選擇所保留。可對置換的重現(xiàn)以及置換的氨基酸的類型的偏好分組來描述可允許產(chǎn)生改進(jìn)酶性質(zhì)的置換的類型。通常地,遺傳編碼的氨基酸根據(jù)它們的側(cè)鏈性質(zhì)可分成以下種類"親水性氨基酸或殘基"是指4艮據(jù)Eisenberg等人,1984,丄A/o/.說o/.179:125-142的標(biāo)準(zhǔn)化的一致性疏水性標(biāo)度(scale),具有顯示疏水性小于零的側(cè)鏈的氨基酸或殘基。遺傳編碼的親水性氨基酸包括L-Thr(T)、L-Ser(S)、L-His(H)、L-Glu(E)、L-Asn(N)、L陽Gln(Q)、L-Asp(D)、L-Lys(K)和L-Arg(R)。"酸性氨基酸或殘基"是指當(dāng)氨基酸包含于肽或多肽中時(shí),具有顯示pK值小于約6的側(cè)鏈的親水性氨基酸或殘基。在生理pH下,酸性氨基酸通常由于氫離子的喪失而具有荷負(fù)電的側(cè)鏈。遺傳編碼的酸性氨基酸包括L-Glu(E)和L畫Asp(D)。"堿性氨基酸或殘基"是指當(dāng)氨基酸包含于肽或多肽中時(shí),具有顯示pK值大于約6的側(cè)鏈的親水性氨基酸或殘基。在生理pH下,堿性氨基酸通常由于與水合氬離子的締合而具有荷正電的側(cè)鏈。遺傳編碼的堿性氨基酸包括L-His(H)、L-Arg(R)和L-Lys(K)。"極性氨基酸或殘基"是指具有在生理pH下不荷電的側(cè)鏈的親水性氨基酸或殘基,但是所述側(cè)鏈具有至少一個鍵,其中兩個原子共享的電子對與原子中的一個結(jié)合得更緊密。遺傳編碼的極性氨基酸包括L-Asn(N)、L-Gln(Q)、L-Ser(S)和L曙Thr(T)。"疏水性氨基酸或殘基"是指根據(jù)Eisenberg等人,1984,J.M/.Sw/.179:125-142的標(biāo)準(zhǔn)化的一致性疏水性標(biāo)度,具有顯示疏水性大于零的側(cè)鏈的氨基酸或殘基。遺傳編碼的疏水性氨基酸包括L-Pro(P)、L-Ile(I)、L誦Phe(F)、L-Val(V)、L-Leu(L)、L-Trp(W)、L-Met(M)、L畫Ala(A)和L-Tyr(Y)。"芳香族氨基酸或殘基"是指具有包括至少一個芳香族或雜芳香族環(huán)的側(cè)鏈的親水性或疏水性氨基酸或殘基。遺傳編碼的芳香族氨基酸包括L-Phe(F)、L-Tyr(Y)和L-Trp(W)。盡管L-His(H)由于其雜芳香族氮原子的pKa而在上文被歸類為堿性殘基,但是由于其側(cè)鏈包括雜芳香族環(huán),所以其還可歸類為芳香族殘基。"非極性氨基酸或殘基"是指具有在生理pH下不荷電的側(cè)鏈的疏水性氨基酸或殘基,但是所述側(cè)鏈具有由兩個原子共享的電子對一般與兩個原子中的每個都平等結(jié)合的鍵(即側(cè)鏈為非極性)。遺傳編碼的非極性氨基酸包括L-Leu(L)、L-Val(V)、L隱Ile(I)、L匿Met(M)和L-Ala(A)。"脂肪族氨基酸或殘基"是指具有脂肪族烴側(cè)鏈的疏水性氨基酸或殘基。遺傳編碼的脂肪族氨基酸包括L-Ala(A)、L-Val(V)、L-Leu(L)和L-Ile(I)。氨基酸L-Cys(C)是與眾不同的,因?yàn)樗膳c其他L-Cys(C)氨基酸或其他含硫烷基或巰基的氨基酸形成二硫鍵。"半胱氨酸樣殘基"包括半胱氨酸和含有可用于形成二硫鍵的巰基部分的其他氨基酸。L-Cys(C)(和具有含-SH的側(cè)鏈的其他氨基酸)以還原型自由-SH或氧化型二為M建的形式存在于肽中的能力影響L-Cys(C)是否向肽貢獻(xiàn)凈疏水性或親水性特征。雖然根據(jù)Eisenberg(Eisenberg等人,1984,見上)的標(biāo)準(zhǔn)化的一致性標(biāo)度L-Cys(C)顯示0.29的疏水性,但是應(yīng)理解,對于本公開內(nèi)容的目的,L-Cys(C)被分類為極性親水性氨基酸,盡管上文定義了一般分類。氨基酸Gly(G)也是與眾不同的,原因是它在其a-碳上沒有側(cè)鏈,因而向特定的肽序列貢獻(xiàn)僅一個肽鍵。此外,由于側(cè)鏈的缺乏,它是具有非手性a-碳的僅有的遺傳編碼的氨基酸。盡管根據(jù)Eisenberg(Eisenberg等人,1984,見上)的標(biāo)準(zhǔn)化的一致性標(biāo)度Gly(G)顯示0.48的疏水性,但是對于本發(fā)明的目的,Gly被分類為脂肪族氨基酸或殘基。"小氨基酸或殘基"是指具有由總數(shù)為3個或更少個碳和/或雜原子(除a-碳和氫)組成的側(cè)鏈的氨基酸或殘基。根據(jù)上述定義,小氨基酸或殘基可被進(jìn)一步分類成脂肪族、非極性、極性或酸性小氨基酸或殘基。遺傳編碼的小氨基酸包括Gly、L誦Ala(A)、L-Val(V)、L-Cys(C)、L-Asn(N)、L-Ser(S)、L-Thr(T)和L-Asp(D)。"包含羥基的氨基酸或殘基"是指含羥基(-OH)部分的氨基酸。遺傳編碼的包含羥基的氨基酸包括L-Ser(S)、L-Thr(T)和L-Tyr(Y)。如本領(lǐng)域技術(shù)人員所理解,上文定義的分類不互相排斥。實(shí)際上,小氨基酸的所述類別包括除芳香族類別之外的所有其他所述類別的氨基酸。因此,具有顯示兩種或更多種物理-化學(xué)性質(zhì)的側(cè)鏈的氨基酸可被包括在多個類別中。作為具體的實(shí)例,具有包括可電離的雜原子的雜芳香族部分的氨基酸側(cè)鏈如His可顯示芳香族性質(zhì)和堿性性質(zhì)兩種性質(zhì),并且因此可被包括在芳香族類別和堿性類別兩者中。任何氨基酸或殘基的合適分類對本領(lǐng)域技術(shù)人員來說是明顯的,尤其根據(jù)本文所提供的詳細(xì)公開內(nèi)容。在一些實(shí)施方案中,工程酮還原酶中的置換可以是保守性置換。術(shù)語"保守性氨基酸置換"是指具有相似側(cè)鏈的殘基的可互換性,因此通常包括用位于相同或相似定義類別內(nèi)的氨基酸置換多肽中的氨基酸。例如但不限于,具有脂肪族側(cè)鏈的氨基酸可被另一種脂肪族氨基酸如丙氨酸、纈氨酸、亮氨酸、異亮氨酸和蛋氨酸置換;具有羥基側(cè)鏈的氨基酸被另一種具有羥基側(cè)鏈的氨基酸如絲氨酸和蘇氨酸置換;具有芳香族側(cè)鏈的氨基酸^^另一種具有芳香族側(cè)鏈的氨基酸如苯丙氨酸、酪氨酸、色氨酸和組氨酸置換;具有堿性側(cè)鏈的氨基酸被另一種具有堿性側(cè)鏈的氨基酸如賴氨酸、精氨酸和組氨酸置換;具有酸性側(cè)鏈的氨基酸被另一種具有酸性側(cè)鏈的氨基酸如門冬氨酸和谷氨酸置換;以及疏水性或親水性氨基酸分別被另一種疏水性或親水性氨基酸置換。在一些實(shí)施方案中,工程酮還原酶中的置換可以是保守性置換。術(shù)語"保守性氨基酸置換,,是指具有相似側(cè)鏈的殘基的可互換性,因此通常包括用位于相同或相似氨基酸定義類別內(nèi)的氨基酸置換多肽中的氨基酸。例如但不限于,具有脂肪族側(cè)鏈的氨基酸可被另一種脂肪族氨基酸如丙氨酸、纈氨酸、亮氨酸、異亮氨酸和蛋氨酸置換;具有羥基側(cè)鏈的氨基酸被另一種具有羥基側(cè)鏈的氨基酸如絲氨酸和蘇氨酸置換;具有芳香族側(cè)鏈的氨基酸被另一種具有芳香族側(cè)鏈的氨基酸如苯丙氨酸、酪氨酸、色氨酸和組氨酸置換;具有堿性側(cè)鏈的氨基酸被另一種具有堿性側(cè)鏈的氨基酸如賴氨酸、精氨酸和組氨酸置換;具有酸性側(cè)鏈的氨基酸被另一種具有酸性側(cè)鏈的氨基酸如門冬氨酸或谷氨酸置換;以及疏水性或親水性氨基酸分別被另一種疏水性或親水性氨基酸置換。在各種實(shí)施方案中,用于產(chǎn)生改進(jìn)的酮還原酶的置換可包括保守性置換、非保守性置換以及保守性和非保守性置換的組合。在一些實(shí)施方案中,改進(jìn)的工程酮還原酶包括天然存在的酮還原酶多肽的缺失以及其他改進(jìn)的酮還原酶多肽的缺失。術(shù)語"缺失"是指通過從參考多肽中消除一個或多個氨基酸的多肽修飾。缺失可包括消除1個或多個氨基酸、2個或更多個氨基酸、5個或更多個氨基酸、IO個或更多個氨基酸、15個或更多個氨基酸、或者20個或更多個氨基酸、高至組成參考酶的氨基酸總數(shù)的10%、或者高至氨基酸總數(shù)的20%,同時(shí)保留酶活性和/或保留工程酮還原酶的改進(jìn)性質(zhì)。缺失可涉及多肽的內(nèi)在部分和/或末端部分。在各種實(shí)施方案中,缺失可包括連續(xù)的區(qū)段或可以是不連續(xù)的。在其他的實(shí)施方案中,改進(jìn)的工程酮還原酶包括一個或多個氨基酸向天然存在的酮還原酶多肽的插入以及一個或多個氨基酸向其他改進(jìn)的酮還原酶多肽的插入。插入可在多肽的內(nèi)在部分或者羧基端或氨基端。本文所用的插入包括本領(lǐng)域已知的融合蛋白。所述插入可以是氨基酸的連續(xù)區(qū)段或被天然存在的多肽中的一個或多個tt酸分開。如上文所述,引入到天然存在的多肽以產(chǎn)生工程酮還原酶的各種修飾可針對所述酶的特異性質(zhì)。因此,在一些實(shí)施方案中,所述工程酮還原酶多肽的改進(jìn)性質(zhì)是增加的酶活性,通常表現(xiàn)為與參考酮還原酶(即天然存在的酮還原酶)相比比活性(例如生成的產(chǎn)物/時(shí)間/蛋白重量)的增加。測定酶活性的示例性方法在實(shí)施例中提供。涉及酶活性的任何性質(zhì)均可^f皮影響,所述性質(zhì)包括經(jīng)典酶性質(zhì)《M、J^似或Aw,它們的變化可導(dǎo)致酶活性的增加。酶活性的改進(jìn)可/人對應(yīng)的野生型酮還原酶的酶活性的約1.5倍到比SEQIDNO:2的天然存在的酮還原酶的酶活性多至2倍、5倍、10倍、20倍、25倍、50倍、75倍、100倍、150倍、200倍、250倍、300倍或更多倍。在特定的實(shí)施方案中,所述工程酮還原酶顯示比野生型酮還原酶的酶活性大1.5至50倍、1.5至100倍、i.5至150倍、1.5至200倍、1.5至250倍、或1.5至300倍范圍內(nèi)的改進(jìn)的酶活性。熟練的技術(shù)人員應(yīng)理解,任何酶的活性都受擴(kuò)散限制以使催化轉(zhuǎn)換速率(turnoverrate)不超過底物(包括任何需要的輔因子)的擴(kuò)散速率。擴(kuò)散限值的理論最大值或一般為約108至109(M"s")。因此,酮還原酶的酶活性的任何改進(jìn)具有與酮還原酶所作用的底物的擴(kuò)散速率有關(guān)的上限。酮還原酶活性可通過用于測量酮還原酶的標(biāo)準(zhǔn)測定中的任何一種(如NADPH的吸光度或熒光由于其伴隨酮還原成對應(yīng)的醇的氧化作用而減少)或通過在偶l關(guān)測定中生成的產(chǎn)物來測量。如本文進(jìn)一步詳細(xì)描述,酶活性的比較是在設(shè)定條件下使用酶的確定制品和確定的測定進(jìn)行的。一般來說,當(dāng)比4交溶解產(chǎn)物時(shí),確定細(xì)胞數(shù)和所測蛋白的量,并使用相同的表達(dá)系統(tǒng)和相同的宿主細(xì)胞以使由宿主細(xì)胞生成和存在于溶解產(chǎn)物中的酶的量的差異降至最小。在一些實(shí)施方案中,具有改進(jìn)的酶活性的工程酮還原酶包括源于SEQIDNO:2的釀酒酵母酮還原酶的工程多肽。在一些實(shí)施方案中,所述工程酮還原酶包括與SEQIDNO:2具有至少約90、91、92、93、94、95、96、97、98或99%同一性的氨基酸序列??蒦皮修飾以產(chǎn)生具有改進(jìn)酶活性的工程多肽的氨基酸殘基在圖4中示出,其中Xn表示修飾的氨基酸殘基。在一些實(shí)施方案中,SEQIDNO:2的一個或多個天然存在的氨基酸(amino)殘基可進(jìn)行如下置換X6是極性或酸性氨基酸殘基;X27是脂肪族或堿性氨基酸殘基;X31是包含羥基的或脂肪族氨基酸殘基;X"是小氨基酸殘基;X"是堿性氨基酸殘基;X63是疏水性或芳香族氨基酸;X65是包含羥基的或小氨基酸殘基;X86是脂肪族或疏水性氨基酸殘基;X125是脂肪族或芳香族氨基酸殘基;乂152是堿性氨基酸殘基;X,是包含羥基的或小氨基酸殘基;X165是極性或酸性氨基酸殘基;乂194是芳香族氨基酸或極性親水性氨基酸殘基;X214是極性親水性氨基酸殘基;X,是包含羥基的氨基酸殘基;X234是極性親水性氨基酸殘基;X,是脂肪族氨基酸殘基;X,是堿性氨基酸殘基;X263是酸性或極性氨基酸殘基;X,是酸性氨基酸殘基;X,是脂肪族氨基酸殘基;X,是芳香族氨基酸殘基;X訓(xùn)是脂肪族、包含羥基的、酸性、親水性或堿性氨基酸殘基;和/或X,是芳香族、極性或包含羥基的氨基酸殘基。在一些實(shí)施方案中,所述酮還原酶具有所有這些殘基特征。在一些實(shí)施方案中,所述酮還原酶具有這些殘基特征中的一種或多種。在一些實(shí)施方案中,這些殘基位置中的至少一種不包括是關(guān)于SEQIDNO:2的保守性突變的置換。在一些實(shí)施方案中,X"是芳香族殘基。在一些實(shí)施方案中,X"是色氨酸。在一些實(shí)施方案中,在其他位置的殘基可以是關(guān)于SEQIDNO:2的保守性突變。在一些實(shí)施方案中,SEQIDNO:2的酮還原酶的氨基酸殘基可用一種或多種如下的特定氨基酸置換X6是E;X"是A或K;X31是S或P;乂36是V;X"是H;XM是W;X65是G或S;X秘是I;X"5是L;X,R;X柳是T或S;X,E;X,是C;X"4是R或H;X,是T;X,Q;X,是I;X,是R;X,是V或D;X,是I;X,是F或W;X則是R、K、A、V、S、T、Y、D、E、P或Q;和/或乂307是11、N或S。在一些實(shí)施方案中,具有改進(jìn)酶活性的工程酮還原酶具有上文所指出的氨基酸殘基的子集的置換。因此,在一些實(shí)施方案中,所述氨基酸置換可發(fā)生于以下氨基酸位置中的一種或多種X27、X31、X36、X48、X63、X65、X6x125x152X160X194X218X248X250X290X296X297X301禾口X3G7,其中用于置換的氨基酸殘基按上文所述進(jìn)行選擇。在一些實(shí)施方案中,所述工程酮還原酶包括選自以下的一種或多種突變R27A、R27K、N31S、A36V、Y48H、163W、R65G、R65S、L861、F125L、K152R、A160T、Y194C、A218T、V248I、K250R、E290D、L296V、Y297W、Y297F、L301K、L301R、L301A、L301S、L301E、L301P、L301Q、L301V、L301T、L301Y、L301D、Y307H、Y307N和Y307S。本文還顯示,發(fā)現(xiàn)其置換使得酮還原酶具有改進(jìn)性質(zhì)的各種氨基酸殘基位置在所述酮還原酶的某些區(qū)段群集(cluster),這允許所述區(qū)段的靶向修飾。因此,在一些實(shí)施方案中,酮還原酶多肽的選定區(qū)段可進(jìn)行修飾。對于SEQIDNO:2參考序列,影響酮還原酶酶活性的區(qū)段包括氨基酸殘基27至36、40至65、103至125、144至169、233至265和/或287至312所表示的那些區(qū)段以及其他區(qū)段??尚揎椩诿總€區(qū)段或區(qū)段的組合內(nèi)的一個或多個氨基酸殘基。在一些實(shí)施方案中,用于置換的對應(yīng)氨基酸序列和位置包括X27WYKX31EETDX36X40SLX43X44QX46VX48ALX5'LPGX55X56HX58DX60AX62X63YX65X103LDX106ALKKMGTX114YVDLYLX121HSPX125X144LYKX148GKAX152NIGVSX158FX160VEDLX165RILX169X233X234KYX237KX239EAQnLRWX248TX250RGX253LPVTTSSKPX263RX265;和X290HEPLRX296X297WNKX301YGKYNX307AAX310X311X312其中xn指示氨基酸置換的位置。在一些實(shí)施方案中,具有改進(jìn)酶活性的工程酮還原酶具有選自表1所列舉的氨基酸序列的氨基酸序列表l<table>tableseeoriginaldocumentpage44</column></row><table><table>tableseeoriginaldocumentpage45</column></row><table>表l<table>tableseeoriginaldocumentpage46</column></row><table>表l<table>tableseeoriginaldocumentpage47</column></row><table>表l<table>tableseeoriginaldocumentpage48</column></row><table><table>tableseeoriginaldocumentpage49</column></row><table>表l<table>tableseeoriginaldocumentpage50</column></row><table>表l<table>tableseeoriginaldocumentpage51</column></row><table><table>tableseeoriginaldocumentpage52</column></row><table><table>tableseeoriginaldocumentpage53</column></row><table><table>tableseeoriginaldocumentpage54</column></row><table>表l<table>tableseeoriginaldocumentpage55</column></row><table>表l<table>tableseeoriginaldocumentpage56</column></row><table>*=150-500%seqidno:2的酶活性**=500-900%seqidno:2的酶活性***=900-1600%seqidno:2的酶活性****=大于1600%seqidno:2的酶活性+=變體在所指出的溫度下熱處理16小時(shí)后保留殘基活性nd=未測定在其他的實(shí)施方案中,所述工程酮還原酶包括與工程酶所源自的天然存在的酮還原酶相比具有改進(jìn)的熱穩(wěn)定性的酮還原酶。熱穩(wěn)定酶如在用于大規(guī)模生產(chǎn)的高底物濃度的條件下允許與底物進(jìn)行更長時(shí)間的溫育,并且還使所需酶的量降至最低。具有"改進(jìn)的熱穩(wěn)定性"的酶是指當(dāng)在規(guī)定的測定條件下暴露于設(shè)定溫度或一組溫度時(shí),展示了與參考酶的失活抗性相比增加的失活抗性的酶。許多方法可用于測量酶熱穩(wěn)定性。酶可在一組標(biāo)準(zhǔn)的測定條件(例如離子強(qiáng)度、pH、蛋白濃度等)下于各種溫度處理達(dá)規(guī)定的時(shí)段。半失活溫度(即在熱處理達(dá)規(guī)定的時(shí)間后50%失活發(fā)生的溫度)用于比較酶的熱穩(wěn)定性。測定熱穩(wěn)定性的另一種方法是在設(shè)定溫度下處理酶并且測量剩余的酶活性量。將剩余的酶活性量與在相似或相同條件下制備的天然存在的酶的剩余活性進(jìn)行比較。用于分析熱穩(wěn)定性的有用溫度包括用于進(jìn)行反應(yīng)(如在大規(guī)^莫反應(yīng)中)的反應(yīng)溫度和/或用于選擇工程酶的改進(jìn)的熱穩(wěn)定性的溫度。例如,所述工程酶可在約30。C或以上、約35。C或以上、40。C或以上、45。C或以上、50。C或以上、55。C或以上、至約65。C的溫度下具有與參考酶(例如天然存在的酶)相比改進(jìn)的熱穩(wěn)定性。在一些實(shí)施方案中,所述酶可具有改進(jìn)的熱穩(wěn)定性,其中所述工程酶與參考酶相比保留約10%或更多的活性、約15%或更多的活性、約20%或更多的活性、約30%或更多的活性、約50%或更多的活性、約70%或更多的活性、約90%或更多的活性。在處理?xiàng)l件下,酶活性顯示熱穩(wěn)定性增強(qiáng)的時(shí)間可包括約5小時(shí)或更多、約6小時(shí)或更多、約12小時(shí)或更多、約18小時(shí)或更多、約24小時(shí)或更多、約36小時(shí)或更多、約48小時(shí)或更多、約72小時(shí)或更多。底物在熱處理期間可存在或不存在,盡管已知在某些情況下底物的存在穩(wěn)定酶結(jié)構(gòu)。在其他的實(shí)施方案中,酶的熱穩(wěn)定性可通過測定蛋白折疊穩(wěn)定性,如通過用量熱術(shù)或圓二色性法(circulardichorism)檢測蛋白解折疊來測量。例如,為了測定工程酮還原酶和天然存在的酮還原酶的熱穩(wěn)定性,可使用CD特征在不同溫度下的變化。酶的解折疊速率常數(shù)的阿累尼烏斯(Arrhenius)曲線圖通過使用溫度躍遷(例如從酶有活性的溫度到酶無活性的溫度)和測量蛋白結(jié)構(gòu)的變化來產(chǎn)生??杀容^失活溫度下解折疊反應(yīng)的一級速率常數(shù)、活化焓以及穩(wěn)態(tài)和過渡態(tài)之間的活化自由能。通常地,活化自由能隨著酶熱穩(wěn)定性的增加而增加。用于測定熱穩(wěn)定性的其他方法對熟練的技術(shù)人員來說是明顯的。在一些實(shí)施方案中,所述改進(jìn)的熱穩(wěn)定性可與酮還原酶的其他性質(zhì)分開,而在其他的實(shí)施方案中,所述熱穩(wěn)定性是與另一種改進(jìn)的性質(zhì)一起觀察到的。在一些實(shí)施方案中,包括具有改進(jìn)的熱穩(wěn)定性的工程酮還原酶的酮還原酶源于SEQIDNO:2的釀酒酵母酮還原酶。在一些實(shí)施方案中,具有改進(jìn)的熱穩(wěn)定性的工程酮還原酶在pH7.0于37至50。C的溫度范圍下處理16小時(shí)后,保留約20%或更多的酶活性。相比之下,SEQIDN0:2的天然存在的酮還原酶在pH7.0于37。C的溫度下溫育16小時(shí)后,僅保留5-10%的其活性,而當(dāng)在相同的條件于更高的溫度下溫育時(shí),則基本上沒有保留活性。57在一些實(shí)施方案中,具有改進(jìn)熱穩(wěn)定性的工程酮還原酶包括與SEQIDN0:2對應(yīng)的氨基酸序列并且包括下述置換的一種或多種X6是極性或酸性氨基酸殘基;X31是包含羥基的或脂肪族氨基酸殘基;X"是酸性氨基酸殘基;X"是脂肪族氨基酸殘基;X"是脂肪族氨基酸殘基;乂56是脂肪族氨基酸;X^是包含羥基的或小氨基酸;X63是疏水性或芳香族氨基酸;x76是氨基酸殘基M;X,是包含羥基的氨基酸殘基;X賜是脂肪族氨基酸殘基;乂114是小氨基酸殘基;X121是疏水性或脂肪族氨基酸殘基;X144是親水性或^減性氨基酸殘基;乂148是包含羥基的氨基酸殘基;義58是芳香族氨基酸殘基;X,是包含羥基的或小氨基酸殘基;X165是極性或酸性氨基酸殘基;X169是脂肪族或堿性氨基酸殘基;X185是芳香族或脂肪族氨基酸殘基;X,是芳香族氨基酸或極性親水性氨基酸殘基;X,是極性氨基酸殘基;X214是芳香族或堿性氨基酸殘基;乂223是芳香族氨基酸殘基;X234是極性親水性氨基酸殘基;乂237是親水性或小氨基酸殘基;X,是包含羥基的氨基酸殘基;X^是脂肪族氨基酸殘基;和/或X263是酸性或極性氨基酸殘基。在一些實(shí)施方案中,X^是芳香族殘基。在一些實(shí)施方案中,X"是色氨酸。在一些實(shí)施方案中,所述酮還原酶在除上文所列出的那些位置之外的其他位置包括一種或多種保守性突變。在一些實(shí)施方案中,具有改進(jìn)熱穩(wěn)定性的工程酮還原酶包括與SEQIDNO:2對應(yīng)的氨基酸序列并且包括下述置換的一種或多種X"是P;X"是D;X恥是L;X"是V;X,T;X63是V;X6是M;X朋是S;X則是I;X,G;xm是I或M;X,R;X"8是T;X"s是H;X勵是S;X,E;X^是R或H;乂223是^1、R或G;X"7是N、G、R或Q;X,是T;和/或X253是A。在一些實(shí)施方案中,具有改進(jìn)熱穩(wěn)定性的工程酮還原酶具有上文所指出的氨基酸殘基的子集的置換。因此,在一些實(shí)施方案中,所述氨基酸置換可發(fā)生于以下氨基酸位置中的一種或多種X44、X46、X55、X56、X6Q、X63X76X103X106XmXmX144X148X158X223X237X239和X253,其中用于置換的氨基酸殘基按上文所述進(jìn)行選擇。在一些實(shí)施方案中,具有改進(jìn)熱穩(wěn)定性的工程酮還原酶與SEQIDNO:2相比包括下述突變的一種或多種E44D、I46L、I55V、I56V、A60T、I63V、L76M、G103S、L106I、D114G、L121I、Q144R、S148T、N158H、Q223H、I237G、I237N、I237R、S239T和V253A。如對具有改進(jìn)酶活性的工程酮還原酶觀察到的,也發(fā)現(xiàn)其置換使得工程酮還原酶具有改進(jìn)的熱穩(wěn)定性的各種氨基酸殘基位置在SEQIDNO:2的酮還原酶的某些區(qū)段群集,這允許靶向修飾。導(dǎo)致熱穩(wěn)定性改進(jìn)的置換與發(fā)生在具有改進(jìn)酶活性的工程酶中的那些置換重疊,盡管有些不重疊。因此,在一些實(shí)施方案中,酮還原酶多肽的選定區(qū)段可進(jìn)行修飾以產(chǎn)生具有改進(jìn)熱穩(wěn)定性的工程酮還原酶。對于SEQIDNO:2參考序列,影響酮還原酶酶活性的區(qū)革殳包括氨基酸殘基27至36、40至65、103至125、144至169、233至265和287至312所表示的那些區(qū)段以及其他區(qū)段。在一些實(shí)施方案中,影響酮還原酶酶活性的區(qū)段包括氨基酸殘基27-32、60-65、90-93、120-125、157-159、208-211和293-306所表示的那些區(qū)段以及其他區(qū)段。可修飾在每個區(qū)段或區(qū)段的組合內(nèi)的一個或多個氨基酸殘基。在一些實(shí)施方案中,用于置換的對應(yīng)氨基酸序列和位置包括X27WYKX31EETDX36X40SLX43X44QX46VX48ALX51LPGX55X56HX58DX6。AX62X63YX65X103LDX〗06ALKKMGTX114YVDLYLX121HSPX125X144LYKX148GKAX152NTGVSX158FX160VEDLX165RTLX169X233X234KYX237KX239EAQIILRWX248TX250RGX253LPVTTSSKPX263RX265;和X290HEP1JOC296X297WNKX3()1YGKYNX3()7AAX31GX311X312其中xn指示氨基酸置換的位置。保守性置換和非保守性置換兩者都可在如所指出的區(qū)段中進(jìn)行。在一些實(shí)施方案中,改進(jìn)的性質(zhì)可以是性質(zhì)的組合,例如改進(jìn)的酶活性和改進(jìn)的熱穩(wěn)定性。在一些實(shí)施方案中,所述工程酮還原酶包括具有改進(jìn)的酶活性和改進(jìn)的酶穩(wěn)定性的組合、具有與SEQIDNO:2的酮還原酶的野生型序列對應(yīng)的氨基酸序列并且包括選自以下的一種或多種突變的酮還原酶Q6E、N31P、A160S、Q165E、Q214H、Q214R、E234Q、Q263E。在一些實(shí)施方案中,所述工程酮還原酶包括具有改進(jìn)的酶活性和/或穩(wěn)定性的組合、具有與SEQIDNO:2的酮還原酶的野生型序列對應(yīng)的氨基酸序列并且包括選自以下的一種或多種突變的酮還原酶N40Y、V43L、K51E、158V、E62Q、A73P、K79R、K152Q、K169E、F腦、Q189H、G192D、H200L、D201G、K215E、K215M、K216R、D221V、S233C、1237D、K250E、1265V、L287R、K304R、Q310R、K311E、V312S、V312E。應(yīng)理解,所述工程酮還原酶并不限于通過誘變或其他基因進(jìn)化技術(shù)直接鑒定的那些,而且還包括改進(jìn)的工程酮還原酶多肽的變體或類似物。本61文所用的術(shù)語"變體"或"類似物"是指由具有酮還原酶活性并保留或未保留所述改進(jìn)的性質(zhì)的區(qū)段組成并且與工程酮還原酶的部分具有大致同一性的多肽。在一些實(shí)施方案中,類似物多肽包括關(guān)于工程序列的一種或多種氨基酸殘基的保守性氨基酸置換或添加或缺失。類似物通常為至少酶學(xué)活性的片段并且通常和SEQIDNO:2的全長天然存在的參考多肽一樣長(例如312個氨基酸殘基)。在一些實(shí)施方案中,所述工程酮還原酶多肽的變體或類似物可包括與參考工程酮還原酶或工程酮還原酶的酶學(xué)活性的片段具有約70%或更多的氨基酸同一性、約80%或更多的氨基酸同一性、約90%或更多的氨基酸同一性、約95%或更多的氨基酸同一性、約97%或更多的氨基酸同一性、約98%或更多的氨基酸同一性、或者約99%或更多的氨基酸同一性的酶學(xué)活性的酮還原酶多肽。在一些實(shí)施方案中,所述參考工程酮還原酶選自表1中所列舉的氨基酸序列。改進(jìn)的酮還原酶的示例性參考序列是SEQIDNO:314。在一些實(shí)施方案中,所述工程酮還原酶多肽的變體或類似物可包括與SEQIDNO:314或SEQIDNO:314的酶學(xué)活性的片段具有約95.5%或更多氨基酸同一性、約97%或更多氨基酸同一性、約98%或更多氨基酸同一性、或者約99%或更多氨基酸同一性的酶學(xué)活性的酮還原酶多肽。改進(jìn)的酮還原酶的另一個示例性參考序列是SEQIDNO:316。在一些實(shí)施方案中,所述工程酮還原酶多肽的變體或類似物可包括與SEQIDNO:316或SEQIDNO:316的酶學(xué)活性的片段具有約95.5%或更多氨基酸同一性、約97%或更多氨基酸同一性、約98%或更多氨基酸同一性、或者約99%或更多氨基酸同一性的酶學(xué)活性的酮還原酶多肽。改進(jìn)的酮還原酶的另一個示例性參考序列是SEQIDNO:318。在一些實(shí)施方案中,所述工程酮還原酶多肽的變體或類似物可包括與SEQIDNO:318或SEQIDNO:318的酶學(xué)活性的片段具有約95.5%或更多氨基酸同一性、約97%或更多氨基酸同一性、約98%或更多氨基酸同一性、或者約99%或更多氨基酸同一性的酶學(xué)活性的酮還原酶多肽。改進(jìn)的酮還原酶的另一個示例性參考序列是SEQIDNO:376。在一些實(shí)施方案中,所述工程酮還原酶多肽的變體或類似物可包括與SEQIDNO:376或SEQIDNO:376的酶學(xué)活性的片段具有約95.5%或更多氨基酸同一性、約97%或更多氨基酸同一性、約98%或更多氨基酸同一性、或者約99%或更多氨基酸同一性的酶學(xué)活性的酮還原酶多肽。在一些實(shí)施方案中,所述改進(jìn)的酮還原酶多肽區(qū)段可被缺失以產(chǎn)生多肽片段。本文所用的術(shù)語"片段"是指具有氨基末端和/或羧基末端缺失,但是其中剩余的氨基酸序列與序列中的對應(yīng)位置具有同一性的多肽。片段可以是至少14個氨基酸長、至少20個氨基酸長、至少50個氨基酸長或更長,且可多達(dá)SEQIDNO:2的全長天然存在酮還原酶多肽的70%、80%、90%、95%、98%和99%。改進(jìn)的酮還原酶可存在于細(xì)胞內(nèi),存在于細(xì)胞基質(zhì)中或以各種形式如溶解產(chǎn)物或分離的制品來制備。因此,在一些實(shí)施方案中,所述改進(jìn)的酮還原酶可以是分離的多肽。術(shù)語"分離的多肽"是指與天然伴隨它的其他污染物(例如蛋白、脂質(zhì)和多核苷酸)大致分離的多肽。所述術(shù)語包括已從其天然存在的環(huán)境或表達(dá)系統(tǒng)(例如宿主細(xì)胞或體外合成)中取出(remove)或純化的多肽。在一些實(shí)施方案中,所迷分離的改進(jìn)酮還原酶多肽是大致純的多肽組合物。術(shù)語"大致純的多肽"是指其中多肽種類是存在的主要種類(即在摩爾或重量基礎(chǔ)上它比組合物中的其他任何單獨(dú)的大分子種類更多)的組合物,并且當(dāng)目標(biāo)種類包括至少約50%的存在的大分子種類摩爾或%重量時(shí),其通常是大致純化的組合物。一般來說,大致純的酮還原酶組合物將包括約60%或更多、約70%或更多、約80%或更多、約90%或更多、約95%或更在一些實(shí)施方案中,目標(biāo)種類被純化至基本均一性(homogendty)(即通過常規(guī)檢測法在組合物中不能檢測出污染物種類),其中所述組合物大致由單一大分子種類組成。溶劑種類、小分子(<500道爾頓)和元素離子種類不被視為大分子種類。6.3編碼工程酮還原酶的多核苷酸在另一個方面中,本公開內(nèi)容提供了編碼工程酮還原酶的多核苷酸。所述多核香酸可與一種或多種控制基因表達(dá)的異源調(diào)節(jié)序列可操作地連接,以產(chǎn)生能表達(dá)多肽的重組多核苷酸。包含編碼工程酮還原酶的異源多核苷酸的表達(dá)構(gòu)建體可#皮引入到適合的宿主細(xì)胞以表達(dá)對應(yīng)的酮還原酶多肽。術(shù)語"異源"多核苷酸是指通過實(shí)驗(yàn)室技術(shù)引入到宿主細(xì)胞的任何多核苷酸,并且包括從宿主細(xì)胞中移除、進(jìn)行實(shí)驗(yàn)室操作然后再引入到宿主細(xì)胞的多核苷酸。由于對與各種氨基酸對應(yīng)的密碼子的認(rèn)識,因此蛋白序列的可用性提供了能編碼主題(subject)的所有多核苷酸的描述。遺傳密碼的簡并性(即相同的氨基酸被替代密碼子或同義密碼子編碼)允許制備非常多的核酸,所有這些核酸均編碼本文所公開的改進(jìn)酮還原酶。因此,鑒定了特定的氨基酸序列后,本領(lǐng)域技術(shù)人員能夠通過以不改變蛋白質(zhì)的氨基酸序列的方法簡單地修飾所述序列的一個或多個密碼子而制備任何數(shù)目的不同核酸。在這點(diǎn)上,本公開內(nèi)容明確預(yù)期了可通過選擇基于可能的密碼子選擇的組合而制備的每種和每個可能的多核苷酸變體,并且對于本文所公開的任何多肽(包括表l中所提供的氨基酸序列),所有這些變體均應(yīng)視為明確公開。在一些實(shí)施方案中,編碼酮還原酶的多核苷酸可進(jìn)行密碼子優(yōu)化以實(shí)現(xiàn)從選擇用于表達(dá)的宿主生物體的最佳制備。術(shù)語"密碼子優(yōu)化"是指編碼蛋白多核普酸的密碼子變化為特定生物體中優(yōu)先使用的那些密碼子以使所編碼的蛋白在感興趣的生物體中有效地表達(dá)。盡管遺傳密碼具有簡并性,大多數(shù)氨基酸由幾個密碼子(稱為"同義(synonym)"密碼子或"同義的(synonymous)"密碼子)表示,但是眾所周知,特定生物體的密碼子使用是非隨機(jī)的并且偏好特定的密碼子三聯(lián)體。關(guān)于給定的基因、具有共同功能或祖先起源的基因、與低拷貝數(shù)蛋白比較的高表達(dá)蛋白和生物體基因組的聚集蛋白編碼區(qū),這種密碼子使用偏好性(codonusagebias)可以更高。術(shù)語"優(yōu)選"、"最佳"或"高密碼子使用偏好性"密碼子可互換地指在蛋白編碼區(qū)中以比編碼相同氨基酸的其他密碼子更高的頻率使用的密碼子。優(yōu)選密碼子的確定可與單個基因、具有共同功能或起源的一組基因、高表達(dá)基因的密碼子使用,整個生物體的聚集蛋白編碼區(qū)中的密碼子頻率、相關(guān)生物體的聚集蛋白編碼區(qū)的密碼子頻率,或其組合有關(guān)。頻率隨基因表達(dá)水平增加的密碼子通常是用于表達(dá)的最佳密碼子。已知多種方法用于測定特定生物體中的密碼子頻率(例如密碼子使用、相對同義密碼子使用)和密碼子喜好,所述方法包括多變量分析(multivariatanalysis)如使用聚類分析或?qū)?yīng)分析、以及基因中使用的密碼子的有效數(shù)量(參見GCGCodonPreference,GeneticsComputerGroupWisconsinPackage;CodonW,JohnPeden,UniversityofNottingham;Mclnerney,丄O,1998,Bioinformatics14:372-73;Stenico等人,1994,7Vwc/e,c乂c,tfc222437-46;Wright,F.,1990,G匿87:23-29)。具有可用的密碼子使用表的生物體的列表在不斷增加(參見例如,Wada等人,1992,M/c/e/cvlc,A尺m.20:2111-2118;Nakamura等人,2000,M/d'.必L28:292;Duret等人,見上;Henaut和Danchin,"五sc/^n.c//"co//朋dS"/"w股〃《大腸桿菌和沙門氏菌)"1996,Neidhardt等人編,ASMPress,WashingtonD.C.,第2047-2066頁)。用于獲得密碼子使用的數(shù)據(jù)源T土么E_乂</Trr^rrmA厶厶占tH入上A4^#jeA々£,1AW4'厶If傳^丄:c&r^>Lp口J'H^々夕之JP~n,丌JN匕,w二j'工-qwy,r^""EJw又/^r"j。^^"^r^人i/^術(shù)力im、_j~O知編碼表達(dá)蛋白的核酸序列(例如完全蛋白編碼序列-CDS)、表達(dá)序列標(biāo)簽(ESTS)或基因組序列的預(yù)測編碼區(qū)(參見例如Mount,D.,說(^/bm7加c&'Se,e"ce爿,/,w(生物信息學(xué)序列和基因組分析),第8章,ColdSpringHarborLaboratoryPress,ColdSpringHarbor,N.Y.,2001;Uberbacher,E.C,1996,M"WW"z拜o/.266:259-281;Tiwari等人,1997,C確戸f.說wcz..13:263-270)。在各種實(shí)施方案中,優(yōu)選選擇適合在其中制備蛋白質(zhì)的宿主細(xì)胞的密碼子。例如,細(xì)菌中使用的優(yōu)選密碼子用于在細(xì)菌中表達(dá)基因;酵母中使用的優(yōu)選密碼子用于酵母中的表達(dá);并且哺乳動物中使用的優(yōu)選密碼子用于哺乳動物細(xì)胞中的表達(dá)。例如,SEQIDNO:1的多核苷酸已進(jìn)行密碼子優(yōu)化以用于大腸桿菌中的表達(dá),但是在其他的方面其編碼釀酒酵母的天然存在的酮還原酶。在某些實(shí)施方案中,因?yàn)樘烊恍蛄袑▋?yōu)選的密碼子并且因?yàn)椴皇撬邪被釟埢夹枰褂脙?yōu)選密碼子,所以不需要替換所有密碼子以優(yōu)化酮還原酶的密碼子使用。因此,密碼子優(yōu)化的編碼酮還原酶的多核普酸65可在約40%、50%、60%、70%、80%或大于90%的全長編碼區(qū)的密碼子位置包含優(yōu)選的密碼子。在所述實(shí)施方案中,編碼工程酮還原酶的多核苷酸源于釀酒酵母基因。在一些實(shí)施方案中,編碼工程酮還原酶的多核苷酸選自SEQIDNO:15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、6][、63、65、67、69、71、73、75、77、79、81、83;、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243、245、247、249、251、253、255、257、259、261、263、265、267、269、271、273、275、277、279、281、283、285、287、289、291、293、295、297、299、301、303、305、307、309、311、313、315、317、319、321、323、325、327、329、331、333、335、337、339、341、343、345、347、349、351、353、355、357、359、361、363和365這些多核普酸編碼由表l中列出的氨基酸序列表示的對應(yīng)多肽,所述對應(yīng)多肽是通過使大腸桿菌密碼子優(yōu)化的酵母少w基因經(jīng)受本文所述的定向基因進(jìn)化技術(shù)而衍生的。在其他的實(shí)施方案中,所述多核苦酸包括與編碼具有改進(jìn)酶性質(zhì)的工程酮還原酶或具有改進(jìn)性質(zhì)的工程酮還原酶的片段的參考多核苷酸在核苷酸水平具有約80%或更多序列同一性、約85%或更多序列同一性、約90%或更多序列同一性、約95%或更多序列同一性、約98%或更多序列同一性或者99%或更多序列同一性的多核苷酸。在一些實(shí)施方案中,所述參考多核苷酸選自由以下表示的多核苷酸序列SEDIDN0:15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、m、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243、245、247、249、251、253、255、257、259、261、263、265、267、269、271、273、275、277、279、281、283、285、287、289、291、293、295、297、299、301、303、305、307、309、311、313、315、317、319、321、323、325、327、329、331、333、335、337、339、341、343、345、347、349、351、353、355、357、359、361、363禾口365。在一些實(shí)施方案中,所述多核苷酸編碼酶學(xué)活性的酮還原酶并且在^L定條件如中等嚴(yán)格或高嚴(yán)格條件下與編碼本公開內(nèi)容的工程酮還原酶的序列的互補(bǔ)序列雜交。短語"嚴(yán)格雜交"在本文用于指核酸雜交體(hybrid)具有穩(wěn)定性的條件。如本領(lǐng)域技術(shù)人員已知,雜交體的穩(wěn)定性用雜交體的解鏈溫度(D反映。一般而言,雜交體的穩(wěn)定性是離子強(qiáng)度、溫度、G/C含量和離液劑存在的函數(shù)。多核苷酸的^值可使用用于預(yù)測解鏈溫度的已知方法來計(jì)算(參見例如Baldino等人,M"/kA五"矽wo/og少168:761-777;Bolton等人,1962,Prac.Ato/.Sc.[/&448:1390;Bresslauer等人,1986,7VW/.y4cad〖/&483:8893-8897;Freier等人,1986,Prac.A^/.爿cad7&483:9373-9377;Kierzek等人,^oc/7e附"',^25:7840-7846;Rychlik等人,1990,7Vwc/e,cy4"A18:6409-6412(勘誤,1991,7VMc/e/cy4"cfeifey19:698);Sambrook等人,見上);Suggs等人,1981,/;eve/c^附ewto/5w/ogyPiOT力et/Gewes(使用純化的基因的發(fā)育生物學(xué))(Brown等人編),第683-693頁,AcademicPress;和Wetmur,1991,QvY5wc/ze附A/o/說o/26:227-259。所有出版物通過引用并入本文)。一般來說,雜交反應(yīng)在較低嚴(yán)格性的條件下進(jìn)行,隨后不同但更高的嚴(yán)格性的洗滌。通常地,提及的"雜交嚴(yán)格性"與此類洗滌條件有關(guān)。術(shù)語"中等嚴(yán)格雜交"是指允許靶-DNA結(jié)合與靶DNA具有約60%同一性、優(yōu)選約75%同一性、約85%同一性;與靶-多核苷酸具有大于約90%同一性的互補(bǔ)的核酸的條件。示例性的中等嚴(yán)格條件是等同于在42。C于50%甲酰胺、5xDenhart溶液、5xSSPE、0.2。/。SDS中雜交、之后在42。C于0.2xSSPE、0.2%SDS中洗滌的條件。對于確定多核苷酸序列,術(shù)語"高嚴(yán)格性雜交"通常是指比在溶液(solutkm)條件下測定的熱解鏈溫度4低約l(TC或更少的條件。在一些實(shí)施方案中,高嚴(yán)格性條件是指僅允許在65。C于0.018MNaCl中形成穩(wěn)定雜交體的那些核酸序列的雜交的條件(即,如果雜交體在65。C下于0.018MNaCl中不穩(wěn)定,那么它在高嚴(yán)格性條件下也將不穩(wěn)定,如本文所預(yù)期)。例如,高嚴(yán)格性條件可通過在等同于42。C下50%甲酰胺、5xDenhart溶液、5xSSPE、0.2%SDS的條件下雜交、之后在65。C于0.1xSSPE和0.1。/。SDS中洗滌來提供。其他高嚴(yán)格性雜交條件以及中等嚴(yán)格條件在上文引用的參考文獻(xiàn)中描述。編碼改進(jìn)酮還原酶多肽的分離的多核香酸可以多種方法操作以提供所述多肽的表達(dá)。根據(jù)表達(dá)載體,可需要或必須在將所述分離的多核苷酸插入到載體之前對其進(jìn)行操作。利用重組DNA方法修飾多核苷酸和核酸序列的技術(shù)在本領(lǐng)域中是眾所周知的。指導(dǎo)在以下中提供Sambrook等人,2001,Afo/ecw/wC/o"z'"g:X丄aZ^raitor少'M朋w"/(分子克隆實(shí)驗(yàn)手冊),第3片反,ColdSpringHarborLaboratoryPress;禾口CwrewfiVofoco/sA^o/ecw/arfi/o/ogy(分子生物學(xué)最新方案),Ausubel.F.編,GreenePub.Associates,1998,2006更新版。術(shù)語"控制序列"在本文定義為包括對本公開內(nèi)容多肽的表達(dá)必要的或有利的所有組件(component)。每種控制序列對于編碼所述多肽的核酸序列可以是天然的或外源的。這些控制序列包括但不限于前導(dǎo)區(qū)、多聚腺苷化序列、前肽序列、啟動子、信號肽序列和轉(zhuǎn)錄終止子。在最低限度下,所述控制序列包括啟動子以及轉(zhuǎn)錄和翻譯停止信號。所述控制序列可與連接體(linker)—起提供,這是為了引入特定的限制位點(diǎn)以促進(jìn)控制序列與編碼多肽的核酸序列的編碼區(qū)的連接。術(shù)語"可操作地連接"在本文定義為其中控制序列適當(dāng)?shù)刂糜谙鄬τ贒NA序列的編碼序列的位置以使所述控制序列指導(dǎo)多核香酸和/或多肽的68表達(dá)的結(jié)構(gòu)(configuration)。所述控制序列可以是適當(dāng)?shù)膯幼有蛄小?啟動子序列,,是由宿主細(xì)胞識別的用于表達(dá)編碼區(qū)的核酸序列。啟動子序列包含轉(zhuǎn)錄控制序列,所述轉(zhuǎn)錄控制序列介導(dǎo)多肽的表達(dá)。啟動子可以是在選擇的宿主細(xì)胞中顯示轉(zhuǎn)錄活性的任何核酸序列(包括突變體、截短的和雜合啟動子),并且可從編碼與宿主細(xì)胞同源或者異源的細(xì)胞外或細(xì)胞內(nèi)多肽的基因得到。對于細(xì)菌宿主細(xì)胞,用于指導(dǎo)本公開內(nèi)容的核酸構(gòu)建體的轉(zhuǎn)錄的合適啟動子包括從以下獲得的啟動子大腸桿菌乳糖操縱子、天藍(lán)色鏈霉菌(&r^^w少t^oe/;'co/c)瓊脂糖酶基因(dagA)、枯草芽孢桿菌(Z""〃m,v幼/)/,7w)果聚糖蔗糖酶基因(sacB)、地衣芽孢桿菌(6"c/〃w/,'c/7ew/on"w)a-淀粉酶基因(amyL)、嗜熱脂肪芽孢桿菌(B"c,〃船Weara/^ra7,/H7^)麥芽糖淀粉酶基因(amyM)、解淀粉芽孢桿菌CSac/〃waw少/o/ww/^ze朋)a-淀粉酶基因(amyQ)、地衣芽孢桿菌青霉素酶基因(penP)、枯草芽孢桿菌xylA和xylB基因和原核P-內(nèi)酰胺酶基因(Villa-Kamaroff等人,1978,tV^/A'tK/.75:3727-373l)和tac啟動子(DeBoer等人,1983,7V^/爿c^/.f/&480:21-25)。更多的啟動子在以下文獻(xiàn)中描述"Usefulproteinsfromrecombinantbacteria(重纟且纟曰菌的有用蛋白質(zhì))",Sa.ew"力、c乂附e/7.caw,1980,242:74-94;和Sambrook等人,見上。對于絲狀真菌宿主細(xì)胞,用于指導(dǎo)本公開內(nèi)容的核酸構(gòu)建體的轉(zhuǎn)錄的合適啟動子包括從以下獲得的啟動子米曲霉(A^^g/Z/M,vw""e)TAKA淀粉酶、米黑根毛霉(W//:z朋rac0rw/e/ze,)天冬氨酸蛋白酶、黑曲霉(A^e/^〃ww'取。中性a-淀粉酶、黑曲霉酸穩(wěn)定型a-淀粉酶、黑曲霉或泡盛曲霉(A^erg/〃wsawa/wwv)葡萄糖淀粉酶(glaA)、米黑根毛霉脂肪酶、米曲霉堿性蛋白酶、米曲霉丙糖磷酸異構(gòu)酶、構(gòu)巢曲霉(A^wgz〃Mw/Jw/"m')乙酰胺酶和尖孢鐮刀菌CFkv"nw/woxj:^wraw)胰蛋白酶樣蛋白酶(WO96/00787)的基因以及NA2-tpi啟動子(來自黑曲霉中性a-淀粉酶基因和米曲霉丙糖磷酸異構(gòu)酶基因的啟動子的雜合體)及其突變體、截短的和雜合啟動子。在酵母宿主中,有用的啟動子可來自釀酒酵母烯醇酶(ENO-l)、釀酒酵母半乳糖激酶(GAL1)、釀酒酵母醇脫氫酶/甘油醛-3-石粦酸脫氫酶(ADH2/GAP)和酸酒酵母3-磷酸甘油酸激酶的基因。用于酵母宿主細(xì)胞的其他有用的啟動子由Romanos等人,1992,Raw8:423-488描述。止轉(zhuǎn)錄的序列。終止序列可操作地連接至編碼多肽的核酸序列的3'末端。在選擇的宿主細(xì)胞中是功能性的任何終止子均可用于本發(fā)明。例如,用于絲狀真菌宿主細(xì)胞的示例性轉(zhuǎn)錄終止子可由以下基因獲得米曲霉TAKA淀粉酶、黑曲霉葡萄糖淀粉酶、構(gòu)巢曲霉鄰氨基苯曱酸合成酶、黑曲霉a-葡萄糖苷酶和尖孢鐮刀菌胰蛋白酶樣蛋白酶。用于酵母宿主細(xì)胞的示例性終止子可從釀酒酵母烯醇酶、釀酒酵母細(xì)胞色素C(CYCl)和釀酒酵母甘油醛-3-磷酸脫氫酶的基因獲得。用于酵母宿主細(xì)胞的其他有用終止子由Romanos等人,1992(見上)描述。所述控制序列還可以是合適的前導(dǎo)序列,即對經(jīng)由宿主細(xì)胞翻譯重要的mRNA的非翻譯區(qū)。所述前導(dǎo)序列可操作地連接至編碼多肽的核酸序列的5,末端??墒褂迷谶x擇的宿主細(xì)胞中是功能性的任何前導(dǎo)序列。用于絲狀真菌宿主細(xì)胞的示例性前導(dǎo)區(qū)從米曲霉TAKA淀粉酶和構(gòu)巢曲霉丙糖磷酸異構(gòu)酶的基因獲得。用于酵母宿主細(xì)胞的合適前導(dǎo)區(qū)從釀酒酵母烯醇酶(ENO-l)、釀酒酵母3-磷酸甘油酸激酶、釀酒酵母a-因子和釀酒酵母醇脫氬酶/甘油醛-3-磷酸脫氪酶(ADH2/GAP)的基因獲得。所述控制序列還可以是多聚腺苷化序列,即可操作地連接至核酸序列的3'末端的序列,當(dāng)所述序列被轉(zhuǎn)錄時(shí),它^支宿主細(xì)胞識別為向轉(zhuǎn)錄的mRNA添加多聚腺苷酸殘基的信號。在選擇的宿主細(xì)胞中是功能性的任何多聚腺苷化序列均可用于本發(fā)明。用于絲狀真菌宿主細(xì)胞的示例性多聚腺苷化序列可來自米曲霉TAKA淀粉酶、黑曲霉葡萄糖淀粉酶、構(gòu)巢曲霉鄰氨基笨曱酸合成酶、尖孢^^、刀菌胰蛋白酶樣蛋白酶和黑曲霉a-葡萄糖苷酶的基因。用于酵母宿主細(xì)胞的有用多聚腺苷化序列由Guo和Sherman,1995,Mo/Ce〃腸15:5983-5990描述。所述控制序列還可以是編碼連接至多肽的氨基末端的氨基酸序列并且指導(dǎo)編碼的多肽進(jìn)入細(xì)胞分泌途徑的信號肽編碼區(qū)。所述核酸序列的編碼序列的5,端可內(nèi)在地包含按翻譯閱讀框與編碼分泌多肽的編碼區(qū)的區(qū)段天然連接的信號肽編碼區(qū)??蛇x地,所述編碼序列的5'端可包括對所述編碼序列是外源性的信號肽編碼區(qū)。當(dāng)所述編碼序列未天然包含信號肽編碼區(qū)時(shí),外源性信號肽編碼區(qū)可以是必需的??蛇x地,所述外源性信號肽編碼區(qū)可簡單地替換天然的信號肽編碼區(qū)以增強(qiáng)多肽的分泌。然而,指導(dǎo)表達(dá)多肽進(jìn)入選擇的宿主細(xì)胞的分泌途徑的任何信號肽編碼區(qū)均可用于本發(fā)明。用于細(xì)菌宿主細(xì)胞的有效信號肽編碼區(qū)是從NaB11837芽孢桿菌麥芽糖淀粉酶、嗜熱脂肪芽孢桿菌a-淀粉酶、地衣芽孢桿菌枯草桿菌蛋白酶、地衣芽孢桿菌P-內(nèi)酰胺酶、嗜熱脂肪芽孢桿菌中性蛋白酶(叩rT、nprS、nprM)和枯草芽孢桿菌prsA的基因獲得的信號肽編碼區(qū)。進(jìn)一步的信號肽由Simonen和Palva,1993,M,cra&o/iev57:109-137描述。用于絲狀真菌宿主細(xì)胞的有效信號肽編碼區(qū)可以是從米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡萄糖淀粉酶、米黑根毛霉天冬氨酸蛋白酶、特異腐質(zhì)霉(歷朋/co/"wwo/em')纖維素酶和柔毛腐質(zhì)霉(7/ww/co/"/朋wg/nasa)脂肪酶的基因獲得的信號肽編碼區(qū)。用于酵母宿主細(xì)胞的有用信號肽可來自釀酒酵母a-因子和釀酒酵母轉(zhuǎn)化酶的基因。其他有用的信號肽編碼區(qū)由Romanos等人,1992,見上描述。所述控制序列還可以是編碼位于多肽氨基端的氨基酸序列的前肽編碼區(qū)。所得的多肽^皮稱為酶原(proenzyme)或多肽原(或在某些情況下為酶原(zymogen))。多肽原通常是無活性的并可通過前肽從多肽原中的催化或自身催化切割轉(zhuǎn)化為成熟的活性多肽。所述前肽編碼區(qū)可從枯草芽孢桿菌堿性蛋白酶(aprE)、枯草芽孢桿菌中性蛋白酶(叩rT)、釀酒酵母a-因子、米黑根毛霉天冬氨酸蛋白酶和嗜熱毀絲霉(^/>^//0/7/7^^",/^mc^/2,7")乳糖酶的基因獲得(WO95/33836)。當(dāng)信號肽和前肽區(qū)都存在于多肽的氨基端時(shí),前肽區(qū)位于鄰近多肽的氨基端,而信號肽區(qū)位于鄰近前肽區(qū)的氨基端。還可期望添加調(diào)節(jié)序列,所述調(diào)節(jié)序列允許相對宿主細(xì)胞的生長調(diào)節(jié)多肽表達(dá)。調(diào)節(jié)系統(tǒng)的實(shí)例是響應(yīng)于包括調(diào)節(jié)化合物的存在的化學(xué)或物理刺激而引起基因的表達(dá)開啟或關(guān)閉的那些調(diào)節(jié)系統(tǒng)。在原核宿主細(xì)胞中,適合的調(diào)節(jié)序列包括lac、tac和trp操縱基因系統(tǒng)。在酵母宿主細(xì)胞中,適合的調(diào)節(jié)系統(tǒng)包括如ADH2系統(tǒng)或GAL1系統(tǒng)。在絲狀真菌中,適合的調(diào)節(jié)序列包括TAKAa-淀粉酶啟動子、黑曲霉葡萄糖淀粉酶啟動子和米曲霉葡萄糖淀粉酶啟動子。調(diào)節(jié)序列的其他實(shí)例是允許基因擴(kuò)增的那些。在真核系統(tǒng)中,這些包括在甲氨喋呤的存在下擴(kuò)增的二氫葉酸鹽還原酶基因和在重金屬存在下擴(kuò)增的金屬硫蛋白基因。在這些情況下,編碼本發(fā)明的KRED多肽的核酸序列與所述調(diào)節(jié)序列可操作地連接。因此,在另一個方面中,本公開內(nèi)容還涉及包括編碼改進(jìn)的酮還原酶多肽的多核香酸或其變體和一種或多種表達(dá)調(diào)節(jié)區(qū)如啟動子和終止子、復(fù)制起點(diǎn)等的重組表達(dá)載體,具體取決于引入載體的宿主的類型。上述的各種核酸和控制序列可連接在一起以產(chǎn)生重組表達(dá)載體,所述重組表達(dá)載體可包括一個或多個方便的限制位點(diǎn)以允許在這些位點(diǎn)插入或置換編碼多肽的核酸序列。可選地,本公開內(nèi)容的核酸序列可通過將所述核酸序列或包括所述序列的核酸構(gòu)建體插入到適合的表達(dá)載體來表達(dá)。在構(gòu)建所述表達(dá)載體中,所述編碼序列位于載體中以使所述編碼序列與適合的表達(dá)控制序列可操作地連接。所迷重組表達(dá)載體可以是任何載體(例如質(zhì)粒或病毒),其可方便地進(jìn)行重組DNA程序,并可引起多核苦酸序列的表達(dá)。載體的選擇通常將取決于載體與引入所述載體的宿主細(xì)胞的相容性。所述載體可以是線性或閉合環(huán)狀質(zhì)粒。所述表達(dá)載體可以是自主復(fù)制載體,即作為染色體外實(shí)體存在的載體,例如質(zhì)粒、染色體外元件、微型染色體或人工染色體,所迷載體的復(fù)制不依賴于染色體復(fù)制。所述載體可包括任何保證自身復(fù)制的部件(means)??蛇x地,所述載體可以是在被引入到宿主細(xì)胞時(shí),整合到基因組中并且與整合其的染色體一起復(fù)制的載體。此外,可使用一起包括引入到所述宿主細(xì)胞的基因組中的總DNA的單一載體或質(zhì)?;蛘邇蓚€或更多個載體或質(zhì)?;蜣D(zhuǎn)座子(transposes)。本發(fā)明的表達(dá)載體優(yōu)選包含一種或多種選擇標(biāo)記基因,其允許轉(zhuǎn)化細(xì)胞的容易選擇。選擇標(biāo)記基因是其產(chǎn)物提供殺生物劑或病毒抗性、對重金屬的抗性、營養(yǎng)缺陷體的原養(yǎng)型及類似性質(zhì)的基因。細(xì)菌選擇標(biāo)記基因的實(shí)例是枯草芽孢桿菌或地衣芽孢桿菌的^/基因,或賦予抗生素抗性如氨千西林、卡那霉素、氯霉素(實(shí)施例l)或四環(huán)素抗性的標(biāo)記基因。用于酵母宿主細(xì)』包適合的才示i己基因是ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于絲狀真菌宿主細(xì)胞的選擇標(biāo)記基因包括但不限于amdS(乙酰胺酶)、argB(鳥氨酸氨曱酰轉(zhuǎn)移酶)、bar(草胺膦乙酰轉(zhuǎn)移酶)、hph(潮霉素磷酸轉(zhuǎn)移酶)、niaD(硝酸還原酶)、pyrG(乳清酸核苷-5,-磷酸脫羧酶)、sC(硫酸腺苷酰轉(zhuǎn)移酶(sulfateadenyltransferase))和trpC(鄰氨基苯曱酸合成酶)、及其等效物。用于曲霉細(xì)胞的實(shí)施方案包括構(gòu)巢曲霉或米曲霉的amdS和pyrG基因牙口吸7K鏈霉菌(5^e/to/wycw//少'grasco/^cw5)的bar基因。本發(fā)明的表達(dá)載體優(yōu)選包括允許所述載體整合至宿主細(xì)胞基因組或所述載體在細(xì)胞中不依賴于基因組而自主復(fù)制的元件。對于整合至宿主細(xì)胞基因組的情況,所迷載體可依賴于編碼所述多肽的核酸序列或載體的任何其他元件而通過同源或非同源重組將所述載體整合到基因組中??蛇x地,所述表達(dá)載體可包括用于指導(dǎo)通過同源重組整合至宿主細(xì)胞基因組的另外核酸序列。所述另外核酸序列使所述載體以在染色體中的精確位置整合到宿主細(xì)胞基因組中。為了增加在精確位置整合的可能性,整合元件應(yīng)優(yōu)選包含足夠數(shù)目的核酸如100至10,000個堿基對、優(yōu)選400至10,000個堿基對、且最優(yōu)選800至10,000個堿基對,所述核酸與對應(yīng)的靶序列具有高度同源性以增加同源重組的可能性。所述整合元件可以是與宿主細(xì)胞的基因組中的輩巴序列具有同源性的任何序列。此外,所述整合元件可以是非編碼的或編碼的核酸序列。另一方面,所述載體可通過非同源重組整合到宿主細(xì)胞的基因組中。對于自主復(fù)制的情況,所述載體可進(jìn)一步包括在使所述載體在相關(guān)宿主細(xì)胞中自主復(fù)制的復(fù)制起點(diǎn)。細(xì)菌復(fù)制起點(diǎn)的實(shí)例是P15Aori(如圖5的質(zhì)粒所示)、或允許在大腸桿菌中復(fù)制的質(zhì)粒pBR322、pUC19、pACYC177(所述質(zhì)粒具有P15Aori)或pACYC184的復(fù)制起點(diǎn)以及允許在芽孢桿菌中復(fù)制的pUB110、pE194、pTA1060或pAM.P.1的復(fù)制起點(diǎn)。用于酵母宿主細(xì)胞的復(fù)制起點(diǎn)的實(shí)例是2微米復(fù)制起點(diǎn)、ARS1、ARS4、ARS1和CEN3的組合以及ARS4和CEN6的組合。所述復(fù)制起點(diǎn)可以是具有突變的復(fù)制起點(diǎn),所述突變使其在宿主細(xì)胞中的功能具有溫度敏感性(參見例如Ehrlich,1978,戶racAto/Ayk/S".OSL475:1433)。本發(fā)明的核酸序列的多于一個拷貝可插入到宿主細(xì)胞中以增加基因產(chǎn)物的產(chǎn)生。核酸序列的拷貝數(shù)的增加可通過整合序列的至少一個附加拷貝到宿主細(xì)胞基因組中或通過隨核酸序列包括可擴(kuò)增的選擇標(biāo)記基因(如果細(xì)胞包含選擇標(biāo)記基因的擴(kuò)增拷貝,則可通過在適合的選擇劑的存在下培養(yǎng)所述細(xì)胞來選擇核酸序列的附加拷貝)來獲得。用于本發(fā)明的很多表達(dá)載體是商業(yè)上可得的。適合的商業(yè)表達(dá)載體包括來自Sigma-AldrichChemicals,St.LouisMO.的p3xFLAGTM丁M表達(dá)載體,它包括用于在哺乳動物宿主細(xì)胞中表達(dá)的CMV啟動子和hGH多聚腺芬化位點(diǎn)以及用于在大腸桿菌中擴(kuò)增的pBR322復(fù)制起點(diǎn)和氨千西林抗性標(biāo)記基因。其他適合的表達(dá)載體是從Stratagene,LaJoIIaCA商業(yè)上可得的pBluescriptIISK(-)和pBK-CMV以及衍生自pBR322(GibcoBRL)、pUC(GibcoBRL)、pREP4、pCEP4(Invitrogen)或pPoly的質(zhì)粒(Lathe等人,1987,G朋e57:193-201)。6.4用于表達(dá)酮還原酶多肽的宿主細(xì)胞在另一個方面中,本公開內(nèi)容提供了包括編碼本公開內(nèi)容的改進(jìn)酮還原酶多肽的多核苷酸的宿主細(xì)胞,所述多核苷酸與用于在宿主細(xì)胞中表達(dá)酮還原酶的一個或多個控制序列可操作地連接。用于表達(dá)由本發(fā)明的表達(dá)載體編碼的KRED多肽的宿主細(xì)胞在本領(lǐng)域中眾所周知,并包括但不限于細(xì)菌纟田月包如大腸桿菌、鏈霉菌(S/np/o附y(tǒng)ce力和鼠傷寒沙門氏菌(S"/m朋e〃"(yp/2/wMhwm)細(xì)胞;真菌細(xì)胞如酵母細(xì)胞(例如釀酒酵母或畢赤酵母(尸c//"(ATCC登錄號201178));昆蟲細(xì)胞如杲蠅(Drosophila)S2和夜蛾(Spodoptera)Sf9細(xì)胞;動物細(xì)胞如CHO、COS、BHK、293和Bowes黑素瘤細(xì)胞;和植物細(xì)胞。上述宿主細(xì)胞的適合的培養(yǎng)基和生長條件在本領(lǐng)域中眾所周知。用于表達(dá)酮還原酶的多核苷酸可通過本領(lǐng)域中已知的各種方法引入到細(xì)胞。汰術(shù)包括電穿孔、生物射彈粒子轟擊(biolisticparticlebombardment),脂質(zhì)體介導(dǎo)的轉(zhuǎn)染、氯化鈣轉(zhuǎn)染和原生質(zhì)融合以及其他技術(shù)。用于將多核苷酸引入到細(xì)胞中的各種方法對熟練的技術(shù)人員來說是明顯的。示例性宿主細(xì)胞是如實(shí)施例1所述的大腸桿菌W3110。所述表達(dá)載體通過將編碼改進(jìn)酮還原酶的多核苷酸可操作地連接到質(zhì)粒pCK110900中,而將所述質(zhì)粒可操作地連接到處于/"cI抑制子控制下的/"c啟動子來構(gòu)建。所述表達(dá)載體還包含P15a復(fù)制起點(diǎn)和氯霉素抗性基因。在大腸桿菌W3110中包含主題多核苷酸的細(xì)胞通過使所述細(xì)胞經(jīng)歷氯霉素選擇而分離。6.5產(chǎn)生工程酮還原酶多肽的方法為了制備本公開內(nèi)容的改進(jìn)KRED多核苷酸和多肽,從釀酒酵母中獲得了催化還原反應(yīng)的天然存在的酮還原酶。在一些實(shí)施方案中,對母體多核苷酸序列進(jìn)行密碼子優(yōu)化以增強(qiáng)酮還原酶在特定宿主細(xì)胞中的表達(dá)。作為例證,基于Genbank數(shù)據(jù)庫中可得的釀酒酵母KRED序列(>/)的已知多肽序列(NP—010159;GI:6320079)從由42個核苷酸組成的寡核苷酸構(gòu)建了編碼釀酒酵母的野生型KRED多肽(yd/)的母體多核苷酸序列。對所述母體多核苷酸序列(指定為SEQIDNO:1)進(jìn)行密碼子優(yōu)化以在大腸桿菌中表達(dá),將所述密碼子優(yōu)化的多核苷酸克隆到表達(dá)載體pCKl10900的克隆位點(diǎn)(如圖5中所述),將所述酮還原酶基因的表達(dá)置于lac啟動子和lacl抑制子基因的控制下。所述表達(dá)載體還包含P15A復(fù)制起點(diǎn)和氯霉素抗性基因。鑒定在大腸桿菌W3110中表達(dá)活性酮還原酶的克隆并且測序所述基因以證實(shí)它們的同一性。命名為ydlC的序列(SEQIDNO:1)是用作所有試驗(yàn)和從釀酒酵母酮還原酶進(jìn)化而來的工程酮還原酶的文庫構(gòu)建的起始點(diǎn)的母體序列。所述工程酮還原酶可通過使編碼天然存在的酮還原酶的多核苷酸經(jīng)歷誘變和/或定向進(jìn)化方法而獲得。示例性定向進(jìn)化技術(shù)是誘變和/或DNA改組,如Stemmer,1994,尸rac爿cad&/U&491:10747-10751;WO95/22625;WO97/0078;WO97/35966;WO98/27230;WO00/42651;WO01/75767和美國專利6,537,746中所述??墒褂玫钠渌ㄏ蜻M(jìn)化程序包4舌交4昔延伸過牙呈(staggeredextensionprocess)(StEP)、體夕卜重纟且(Zhao等人,1998,W饑S,ofec/mo/.16:258-261)、誘變PCR(Caldwell等人,1994,PCKM"/o<*jpp/.3:S136-S140)和盒式誘變(Black等人,1996,PracMf/爿c"d[/&493:3525-3529)以及其他程序。對誘變處理后獲得的克隆進(jìn)行篩選以得到具有期望的改進(jìn)酶性質(zhì)的工程酮還原酶。從表達(dá)文庫測量酶活性可使用監(jiān)控NADH或NADPH濃度的減少率(通過吸光度或熒光的減少)(因?yàn)樗D(zhuǎn)化成了NAD+或NADP+)的標(biāo)準(zhǔn)生物化學(xué)技術(shù)來進(jìn)行。在此反應(yīng)中,當(dāng)酮還原酶將酮底物還原成對應(yīng)的輕基時(shí),NADH或NADPH被所述酮還原酶消耗(氧化)。如由吸光度或熒光的減少所測量的,每單位時(shí)間NADH或NADPH濃度的減少率表明固定量的溶解產(chǎn)物(或由此制備的凍千粉末)中KRED多肽的相對(酶)活性。實(shí)施例11公開了酮還原酶活性的示例性生物化學(xué)測定。當(dāng)期望的改進(jìn)酶性質(zhì)為熱穩(wěn)定性時(shí),如在實(shí)施例12中,酶活性可在使酶制品經(jīng)受規(guī)定的溫度并且測量熱處理后剩余的酶活性的量之后來測量。然后分離包含編碼酮還原酶的多核苷酸的克隆,對所述克隆進(jìn)行測序以鑒定核苷酸序列變化(如果有),并使用所述克隆在宿主細(xì)胞中表達(dá)所述酶。當(dāng)已知工程多肽的序列時(shí),編碼所述酶的多核普酸可根據(jù)已知的合成方法通過標(biāo)準(zhǔn)固相方法來制備。在一些實(shí)施方案中,可單獨(dú)合成多達(dá)約100個堿基的片段,然后連接(例如通過酶或化學(xué)連接(litigation)方法或聚合酶介導(dǎo)的方法)所述片段以形成任何期望的連續(xù)序列。例如,本發(fā)明的多核香酸和寡核香酸可使用以下方法通過化學(xué)合成來制備例如由Beaucage等人,1981,7&丄e"22:1859-69描述的經(jīng)典亞磷酰胺法或由Matthes等人,1984,五A/S(9J.3:801-05描述的方法(例如它通常在自動合成方法中實(shí)施)。根據(jù)所述亞磷酰胺法,在DNA自動合成儀中合成寡核苷酸并將其純化、退火、連接并克隆至適合載體中。此外,幾乎任何核酸均可從多種商業(yè)來源的任一種獲得,所述商業(yè)來源如TheMidlandCertifiedReagentCompany,Midland,TX、TheGreatAmericanGeneCompany,Ramona,CA、ExpressGenInc.Chicago,IL、OperonTechnologiesInc.,Alameda,CA及4艮多其他商業(yè)來源。在宿主細(xì)胞中表達(dá)的工程酮還原酶可使用任何一種或多種的眾所周知的蛋白純化技術(shù)從細(xì)胞和/或培養(yǎng)基回收,所述蛋白純化技術(shù)包括溶菌酶處理、超聲、過濾、鹽析、超速離心和色譜法以及其他方法。合適的細(xì)胞裂解液和蛋白質(zhì)從細(xì)菌如大腸桿菌中的高效提取液是以St.LouisMO的Sigma-Aldrich的商標(biāo)名稱CelLyticBTM/人商業(yè)上可獲得的。分離酮還原酶多肽的色譜技術(shù)包括反相色譜法、高效液相色譜法、離子交換色語法、凝膠電泳和親合色語法以及其他方法。純化具體酶的條件部分取決于如凈電荷、疏水性、親水性、分子量、分子形狀等的因素并且對本領(lǐng)域技術(shù)人員來說是明顯的。在一些實(shí)施方案中,可使用親合技術(shù)分離改進(jìn)的酮還原酶。對于親合色譜法純化,可使用特異性結(jié)合酮還原酶多肽的任何抗體。對于抗體的制備,包括但不限于兔、小鼠、大鼠等的各種宿主動物可通過用化合物注射來免疫。所述化合物可借助于側(cè)鏈官能團(tuán)或連接至側(cè)鏈官能團(tuán)的連接體與合適的載體如BSA連接。取決于宿主種類,多種佐劑可用于增加免疫應(yīng)答,所述佐劑包括但不限于弗氏佐劑(完全和不完全)、礦物凝膠如氫氧化鋁、表面活性物質(zhì)如溶血卵磷脂、普盧蘭尼克(pluronic)多元醇、聚陰離子、肽、油乳劑、匙孔血藍(lán)蛋白、二硝基苯酚和潛在有用的人佐劑如BCG(卡介苗(bacilliCalmetteGuerin))和短小棒狀桿菌(Corynebacteriumparvum)。從細(xì)胞溶解產(chǎn)物中回收KRED多肽以應(yīng)用于化學(xué)過程中的示例性過程在實(shí)施例2中公開。6.6使用工程酮還原酶的方法及由其制備的化合物本文所述的工程酮還原酶催化根據(jù)結(jié)構(gòu)式(Ia)的5-羥基-3-氧代己酸酯對映體的還原,以產(chǎn)生對應(yīng)的順式3,5-二鞋基己酸酯化合物,<formula>formulaseeoriginaldocumentpage77</formula>其中X和R/如前文所定義。如熟練的技術(shù)人員應(yīng)認(rèn)識到的,在結(jié)構(gòu)式(I)化合物的5-位上的碳是手性的。因此,所述化合物可以以兩種不同的對映體形式存在上文結(jié)構(gòu)式(Ia)的對映體和結(jié)構(gòu)式(Ib)的對映體(entantiomer):<formula>formulaseeoriginaldocumentpage78</formula>熟練的技術(shù)人員還應(yīng)認(rèn)識到,當(dāng)在3-位的氧代基團(tuán)被還原成擇基時(shí),所得的3,5-二羥基酯的3-位碳原子也是手性的。因此,結(jié)構(gòu)式(Ia)和(Ib)的對映體的每一個都可產(chǎn)生兩種不同的還原產(chǎn)物順式非對映體和反式非對映體。經(jīng)還原對映體(Ia)而產(chǎn)生的順式和反式非對映體分別如下文化合物(IIa)和(IIb)示例,而經(jīng)還原對映體(Ib)而產(chǎn)生的那些分別如化合物(IIc)和(IId)示例(IIa)(lib)<formula>formulaseeoriginaldocumentpage78</formula>有關(guān)3-碳的絕對構(gòu)型在上面結(jié)構(gòu)圖中示例。有關(guān)5-碳的絕對構(gòu)型的A-或S-命名將依賴于X的特征性(identity)。當(dāng)X是氰基時(shí),5-碳在結(jié)構(gòu)(Ia)、(IIa)和(IIb)中命名為而在結(jié)構(gòu)(Ib)、(IIc)和(IId)中命名為S-。當(dāng)X是卣素或羥基時(shí),5-碳在結(jié)構(gòu)(Ia)、(IIa)和(IIb)中命名為而在結(jié)構(gòu)(Ib)、(lie)和(IId)中命名為i-。這取決于命名W或S的慣例,其在X=氰基和X=鹵素或羥基之間顛倒。在一些實(shí)施方案中,底物(Ia)具有高對映純度(enantiopurity),基本上不含(Ib)。在一些實(shí)施方案中,所述還原反應(yīng)也具有高度的非對映選擇性,產(chǎn)生非對映體純度^99.95%的結(jié)構(gòu)式(IIa)的順式非對映體,即^).05%的結(jié)構(gòu)式(1Ib)的反式非對映體(即^99.9。/。非對映體過量)。本文所述的工程酮還原酶的很多實(shí)施方案顯示甚至更高的立體選擇性。例如,在用表2中引用的工程酮還原酶進(jìn)行的6-氰基-(5R)-羥基-3-氧代己酸叔丁酯(結(jié)構(gòu)式(Ia),X=CN,R^叔丁基)的反應(yīng)中,觀察到299.99%的6-氰基-(3R,5R)-二羥基己酸酉旨(結(jié)構(gòu)式(IIa),X=CN,R^叔丁基)非對映選擇性。因此,非對映選擇性還原范圍299.9%、299.91%、299.92%、299.93%、299.94%、^99.95%、299.96%、299.97%、$99.98%和甚至299.99%的非對映選擇還原可用本文所述的工程酮還原酶容易實(shí)現(xiàn)。在由本文所述的工程酮還原酶催化的還原反應(yīng)中觀察到的高度的非對映選擇性使得不需進(jìn)行手性分離或分離步驟就能夠產(chǎn)生大致非對映體純的(即基本上不含所有其他非對映體)的結(jié)構(gòu)式(IIa)的順式3,5-二羥基己酸酯的制品。因?yàn)槔酶叨葘τ臣兊?-羥基-3-氧代己酸酯(Ia)起始物該反應(yīng)可以以高產(chǎn)率進(jìn)行,所以本公開內(nèi)容在需要最低限度的純化或不需純化下就能夠制備大致非對映體純的結(jié)構(gòu)式(IIa)的順式3,5-二羥基己酸酯。與本公開內(nèi)容相反,現(xiàn)有的還原方法(例如美國專利6,596,879)生成3-4y。(IIb)(X:CN,R^叔丁基),其是油,然后將其反應(yīng)以形成(6-氰甲基-2,2-二甲基-l,3-二噁烷-4-乙酸叔丁酯)(XK:N,R^叔丁基,R3、114=甲基)即一種結(jié)晶化合物。在現(xiàn)有的已知方法中,通過結(jié)晶降低(IIb)的含量而提高純度,這導(dǎo)致(IIa)的產(chǎn)率損失。用本文所述的工程酮還原酶獲得的高非對映體純度的還原產(chǎn)物在圖6中示例,圖6比較了從商業(yè)上可得的結(jié)晶(6R)-氰甲基-2,2-二曱基-l,3-二噁烷-(4R》乙酸叔丁酯(結(jié)構(gòu)式(IVa),X=CN,R^叔丁基,R3、R4=甲基)(Aldrich,St.Louis,MO)制備的6-氰乙基-(3R,5R)-二羥基己酸叔丁西旨(結(jié)構(gòu)式(IIa),X=CN,R^叔丁基)的LC/MS/MS色譜圖與使用本公開內(nèi)容的工程酮還原酶從6-氰基-(5R)-羥基-3-氧代己酸叔丁酉旨(結(jié)構(gòu)式(Ia),X=CN,R^叔丁基)制備的粗6-氰基-(3R,5R)-二幾基己酸叔丁酯油的LC/MS/MS色譜圖。如在圖6中示例,與從商業(yè)上可得的包含少于約0.1。/。的不期望的(3S,5R)非對映體(IIb)的結(jié)晶(6R)-氰甲基-2,2-二甲基-l,3-二噁烷-(4R)-乙酸叔丁酯制備的(6R)-氰乙基-3,5-二羥基己酸叔丁酯樣品相比,使用本公開內(nèi)容的工程酮還原酶制備的粗6-氰基-(3R,5R)-二羥基己酸叔丁酯油包含可能不超過0.005%的不期望(3S,5R)非對映體。同樣地,觀察到了(6R)-氰曱基-2,2-二甲基-l,3-二噁烷-(4R)-乙酸叔丁酯的非對映體純度的顯著差異(參見實(shí)施例28和圖7)。比較商業(yè)上可獲得的結(jié)晶TBIN((4R,順)-l,l-二曱基-6-氰曱基-2,2-二甲基-l,3-二噁烷-4-乙酸酯))和由使用本發(fā)明的工程酮還原酶制備的粗C7二醇制備的粗的、提取的但未結(jié)晶的TBIN的立體異構(gòu)體純度的GC/MS色譜圖在圖7中示例。同樣地,由使用本公開內(nèi)容的方法制備的C7二醇生成的阿托伐他汀的非對映體純度大于目前商業(yè)上制品中存在的阿托伐他汀的非對映體純度(例如Lipitor丸劑存在0.03%阿托伐他汀非對映體)。如本文所用,當(dāng)特定的立體異構(gòu)體與存在于化合物的任何其他立體異構(gòu)體相比以過量存在時(shí),該化合物即"富集"該立體異構(gòu)體。富集特定立體異構(gòu)體的化合物通常包括至少約60%、70%、80%、90%或甚至更多的指定立體異構(gòu)體。如下文將更詳細(xì)地論述的,特定立體異構(gòu)體的富集的量可在一些實(shí)施方案中,不期望的立體異構(gòu)體的量可少于10%,例如少于9%、少于8%、少于7%、少于6%、少于5%、少于4%、少于3%、少于2%、少于1%或甚至少于0.9%、0.8%、0.7%、0.6%、0.5%、0.4%、0.2%或0.1%。包含至少約99.5%或更多的期望立體異構(gòu)體的立體異構(gòu)富集的化合物在本文稱作"大致純的"立體異構(gòu)體。在一些實(shí)施方案中,以特定的立體異構(gòu)體大致純的化合物包含大于99.6%、99.7°/。、99.8%、99.9°/0、99.91%、99.92%、99.93%、99.94%、99.95%、99.96%、99.97%、99.98%或甚至99.99%的所迷特定立體異構(gòu)體。包含^99.99%的期望立體異構(gòu)體的立體異構(gòu)富集的化合物在本文稱作"純"立體異構(gòu)體。知的常規(guī)分析方法來測定或確認(rèn)。用于評價(jià)本文所述的合成中間體的非對映異構(gòu)體純度的高靈敏LC/MS和GC/MS法在實(shí)施例5-7中提供。用于測定阿托伐他汀的非對映體純度的方法在Erttirk等人,2003,J尸/wnw說cwec^麗/.33(5):1017-23中給出。如本領(lǐng)域技術(shù)人員已知,酮還原酶催化的還原反應(yīng)通常需要輔因子。由本文所述的工程酮還原酶催化的還原反應(yīng)也通常需要輔因子,盡管工程酮還原酶的很多實(shí)施方案需要比野生型酮還原酶催化的反應(yīng)少得多的輔因子。如本文所用,術(shù)語"輔因子"是指與酮還原酶組合起作用的非蛋白化合物。適于與本文所述的工程酮還原酶使用的輔因子包括但不限于NADP+(煙酰胺腺嘌呤二核香酸磷酸)、NADPH(NADP+的還原形式)、NAD+(煙酰胺腺。票呤二核苷酸)和NADH(NAD+的還原形式)。下面的反應(yīng)式(l)示例了利用NADH或NADPH作為輔因子的酮還原酶("KRED")催化的還原反應(yīng)的實(shí)施方案,NADH或NADPH通過命名NAD(P)H表示為替代物<formula>formulaseeoriginaldocumentpage81</formula>如示例,將輔因子的還原形式加至反應(yīng)混合物中。還原型NAD(P)H形式可使用輔因子再生系統(tǒng)任選地從氧化型NAD(P)+形式再生。術(shù)語"輔因子再生系統(tǒng)"是指參與還原輔因子的氧化型形式(例如NADP+至NADPH)的反應(yīng)的一組反應(yīng)物。通過5-羥基-3-氧代己酸酯的酮還原酶催化還原而氧化的輔因子經(jīng)由輔因子再生系統(tǒng)以還原形式再生。輔因子再生系統(tǒng)包括是還原氫等價(jià)物的來源并能還原輔因子的氧化形式的化學(xué)計(jì)量的還原劑。所述輔因子再生系統(tǒng)可進(jìn)一步包括催化還原劑還原輔因子氧化形式的催化劑,例如酶催化劑d分別從NAD+或NADP+再生NADH或NADPH的輔因子再生系統(tǒng)為本領(lǐng)域已知,并可用于本文所述的方法??墒褂玫暮线m的示例性輔因子再生系統(tǒng)包括但不限于葡萄糖和葡萄糖脫氫酶、甲酸(formate)和甲酸脫氫酶、葡萄糖-6-磷酸和葡萄糖-6-磷酸脫氬酶、仲醇(例如異丙醇)和仲醇脫氬酶、亞磷酸酯和亞磷酸酯脫氫酶、分子氫和氫化酶及類似輔因子再生系統(tǒng)。這些系統(tǒng)可與作為輔因子的NADP+/NADPH或NAD+/NADH組合使用。使用氫化酶的電化學(xué)再生也可用作輔因子再生系統(tǒng)。參見,例如美國專利第5,538,867和6,495,023號,其均通過引用并入本文。包括金屬催化劑和還原劑(例如分子氫或甲酸)的化學(xué)輔因子再生系統(tǒng)也是適合的。參見,例如PCT公布WO2000/053731,其通過引用并入本文。術(shù)語"葡萄糖脫氫酶"和"GDH"在本文可互換使用,是指催化D-葡萄糖和NAD+或NADP+分別轉(zhuǎn)化成葡萄糖酸和NADH或NADPH的NAD+或NADP+依賴性酶。下面的反應(yīng)式(2)描述了通過葡萄糖脫氫酶催化的葡萄糖還原NAD+或NADP+。GDH(2)葡萄糖+NAD(P廣+H2〇-葡萄糖酸+NAD<P)H+H+適用于實(shí)施本文所述方法的葡萄糖脫氫酶包括天然存在的葡萄糖脫氫酶和非天然存在的葡萄糖脫氬酶兩者。天然存在的葡萄糖脫氫酶的編碼基因已在文獻(xiàn)中報(bào)道。例如,枯草芽孢桿菌61297GDH基因在大腸桿菌中表達(dá),并才艮道它顯示與在其天然宿主中生成的酶相同的理化性質(zhì)(Vasantha等人,1983,Prac.扁.Am/.Sc,'."&480:785)。對應(yīng)于Genbank登錄號M12276的枯草芽孢桿菌GDH基因的基因序列由Lampel等人,1986,/Sacter/o/.166:238-243才良道,并由Yamane等人,1996,A^cra&》/og>'142:3047-3056作為Genbank登錄號D50453以校正的形式報(bào)道。天然存在的GDH基因還包括編碼來自蠟狀芽孢桿菌(S.ce^M')ATCC14579(A^we,2003,423:87-91;Genbank登錄號AE017013)和巨大芽孢桿菌(S.wegater,ww)J.說od/ew.,1988,174:485-490,Genbank登錄號X12370;丄Fe廠附e"/.1990,70:363-369,Genbank登錄號GI216270)的GDH的那些基因。芽孢桿菌(So"Lvw.)的葡萄糖脫氫酶在PCT公布WO2005/018579中的多核苷酸序列編碼)提供,其公開內(nèi)容通過引用并入本文。非天然存在的葡萄糖脫氫酶可使用已知的方法如誘變、定向進(jìn)化及類似方法來產(chǎn)生。具有合適活性的GDH酶(不管是天然存在還是非天然存在)可使用PCT公布WO2005/018579(其公開內(nèi)容通過引用并入本文)的實(shí)施例4中描述的測定來容易地鑒定。示例性非天然存在的葡萄糖脫氫酶以SEQIDNO:62、64、66、68、122、124和126在PCT公布WO2005/018579中提供。編碼它們的多核苷酸序列分別以SEQIDNO:61、63、65、67、121、123和125在PCT公布WO2005/018579中提供。所有這些序列都通過引用并入本文。適用于本文公開的酮還原酶催化的還原反應(yīng)的另外的非天然存在葡萄糖脫氫酶在美國申請公布號2005/0095619和2005/0153417中提供,其公開內(nèi)容通過引用并入本文。用于本文所述的酮還原酶催化的還原反應(yīng)的葡萄糖脫氫酶可在PCT公布WO2005/018579的實(shí)施例4描述的測定中顯示至少約10pmol/分鐘/mg、有時(shí)至少約102(xmol/分鐘/mg或約103pmol/分鐘/mg、約104jimol/分鐘/mg或更高的活性。當(dāng)葡萄糖和葡萄糖脫氫酶用作輔因子再生系統(tǒng)時(shí),由于5-羥基-3-氧代己酸酯底物被工程酮還原酶和NADH或NADPH還原,故所得的NAD+或NADP+通過用葡萄糖脫氫酶將葡萄糖偶聯(lián)氧化成葡萄糖酸而還原。凈反應(yīng)由反應(yīng)式(3)描述,反應(yīng)式(3)是反應(yīng)式(1)和(2)的總和ohooohohon、Xv^A^A^A。r,+葡萄糖kred,X^^A^A^Aqr,+葡萄糖酸、?gdhnad(p)h本文所述的酮還原酶催化的還原反應(yīng)一般在溶劑中進(jìn)行。適合的溶劑包括水、有機(jī)溶劑(例如乙酸乙酯、乙酸丁酯、l-辛醇(octacnol)、庚烷、辛烷、甲基叔丁醚(MTBE)、甲苯及類似有機(jī)溶劑)、離子液體(例如1-乙基-4-甲基咪唑四氟硼酸鹽、l-丁基-3-甲基咪唑四氟硼酸鹽,l-丁基-3-曱基咪唑六氟磷酸鹽及類似離子液體)。在一些實(shí)施方案中,可使用包括水和水性共,容劑系統(tǒng)的水性;容劑(aqueoussolvent)。示例性的水性共溶劑系統(tǒng)具有水和一種或多種有機(jī)溶劑。一般來說,選擇水性共溶劑系統(tǒng)的有機(jī)溶劑組分以使它不完全使酮還原酶失活。合適的共溶劑系統(tǒng)可通過利用酶活性測定(如在實(shí)施例中描述的那些測定),在候選溶劑系統(tǒng)中用感興趣的5-羥基-3-氧代己酸酯測量特定工程酮還原酶的酶活性而容易地鑒定。水性共溶劑系統(tǒng)的有機(jī)溶劑組分可與水性組分混溶而提供單一液相,或可與水性組分部分混溶或不相混溶而提供兩種液相。一般來i兌,當(dāng)使用水性共溶劑系統(tǒng)時(shí),選擇它是雙相性的,其中水分散在有機(jī)溶劑中,或者相反。一般來說,當(dāng)利用水性共溶劑系統(tǒng)時(shí),期望選擇可從水相容易分離的有機(jī)溶劑。一般來說,水與有機(jī)溶劑在共溶劑系統(tǒng)中的比率通常范圍為約90:10至約10:90(v/v)有機(jī)溶劑比水、以及80:20至20:80(v/v)之間有機(jī)溶劑比水。所述共溶劑系統(tǒng)可在加入到反應(yīng)混合物前預(yù)先形成,或它可在反應(yīng)容器中原位形成。水性溶劑(水或水性共溶劑系統(tǒng))可以是pH緩沖的或無緩沖的。將5-羥基_3-氧代己酸酯還原為對應(yīng)的3,5-二羥基己酸酯可在約5或5以上的pH進(jìn)行。一^:來說,所述還原在約10或10以下的pH下、通常在約5至約10的范圍中進(jìn)行。在一些實(shí)施方案中,所述還原在約9或9以下的pH下、通常在約5至約9的范圍中進(jìn)行。在一些實(shí)施方案中,所述還原在約8或8以下的pH下、經(jīng)常在約5至約8的范圍中、并且通常在約6至約8的范圍中進(jìn)行。所述還原還可在約7.8或7.8以下、或者7.5或7.5以下的pH下進(jìn)行??蛇x地,所述還原可在中性pH即約7下進(jìn)行。在還原反應(yīng)的過程期間,反應(yīng)混合物的pH可變化。反應(yīng)混合物的pH可通過在反應(yīng)過程期間加入酸或堿而維持在期望的pH或在期望的pH范圍內(nèi)??蛇x地,pH可通過使用包括緩沖液的水性溶劑來控制。維持期望的pH范圍的合適緩沖液在本領(lǐng)域中已知,并包括例如磷酸鹽緩沖液、三乙醇胺緩沖液及類似緩沖液。還可使用緩沖與酸或堿添加的組合。當(dāng)使用葡萄糖/葡萄糖脫氫酶輔因子再生系統(tǒng)時(shí),如果不以別的方式中和所得的水性葡萄糖酸,那么如反應(yīng)式(3)中表示的葡萄糖酸(pKa二3.6)的共同產(chǎn)生(co-production)導(dǎo)致反應(yīng)混合物的pH下降。反應(yīng)混合物的pH可通過標(biāo)準(zhǔn)緩沖技術(shù)(其中緩沖液中和葡萄糖酸直到所提供的緩沖容量)或者通過在轉(zhuǎn)化過程同時(shí)發(fā)生的堿添加而維持在期望的水平。也可使用緩沖和堿添加的組合。維持期望的pH范圍的適合緩沖液如上迷。用于中和葡萄糖酸的合適堿是有機(jī)堿如胺、醇鹽及類似有機(jī)堿,和無機(jī)堿如氬氧化鹽(例如NaOH)、碳酸鹽(例如NaHC03)、碳酸氫鹽(例如K2C03)、堿性磷酸鹽(例>K2HP04、Na3P04)及類似無機(jī)堿。與轉(zhuǎn)化過程同時(shí)發(fā)生的堿添加可在監(jiān)控反應(yīng)混合物pH的同時(shí)手動進(jìn)行,或者更方便地通過使用自動滴定器作為恒pH器(pHstat)來進(jìn)行。部分緩沖容量和堿添加的組合也可用于過程控制。在當(dāng)通過緩沖或通過在轉(zhuǎn)化過程內(nèi)添加堿維持pH的此類還原反應(yīng)中,水性葡萄糖酸鹽而不是水性葡萄糖酸是全過程的產(chǎn)物。例如,反應(yīng)式(4)表示當(dāng)在反應(yīng)過程內(nèi)加入水性氫氧化鈉(忖3++0圧)以維持初始pH低于約5或5以上的全過程。<formula>formulaseeoriginaldocumentpage85</formula>(4)x^^A^^^A^Aqri+葡萄糖+(Na++OH-),,,^e,一x^^A^JL^Aqr,+(Na-+葡糖酸根-)<formula>formulaseeoriginaldocumentpage85</formula>當(dāng)使用堿添加以中和酮還原酶催化的還原反應(yīng)期間釋放的葡萄糖酸時(shí),轉(zhuǎn)化進(jìn)程可通過維持pH所添加的堿的量來監(jiān)控。通常地,在還原過程內(nèi)向無緩沖或部分緩沖的反應(yīng)混合物添加的堿是以水性溶液添加的。在一些實(shí)施方案中,當(dāng)所述過程使用宿主生物體的全細(xì)胞來進(jìn)行時(shí),全細(xì)胞可天然地提供輔因子??蛇x地或組合地,所述細(xì)胞可天然或重組地提供葡萄糖脫氫酶。術(shù)語"甲酸脫氫酶"和"FDH"在本文可互換使用,是指催化甲酸和NAD+或NADP+分別轉(zhuǎn)化成二氧化碳和NADH或NADPH的NAD+或NADP+依賴性酶。適于在本文所述的酮還原酶催化還原反應(yīng)中作為輔因子再生系統(tǒng)使用的曱酸脫氬酶包括天然存在的甲酸脫氫酶和非天然存在的甲酸脫氫酶兩者。甲酸脫氫酶包括對應(yīng)于PCT公布WO2005/018579的SEQIDNO:70(假單胞菌(i^ewofow朋os'平》和72(假絲酵母(C朋tfe/a^/cZ/"/0)的那些甲酸脫氬酶,其分別由對應(yīng)于PCT公布2005/018579的SEQIDNO:69和71的多核普酸序列編碼,所述PCT公布的公開內(nèi)容通過引用并入本文。在本文所述方法中所用的甲酸脫氬酶(不管是天然存在或非天然存在的)可顯示至少約1nmol/分鐘/mg、有時(shí)至少約10(xmol/分鐘/mg或至少約102nmol/分鐘/mg、直到約103pmol/分鐘/mg或更高的活性,并如本文所用,術(shù)語"曱酸"是指曱酸陰離子(HC(V)、甲酸(HC02H)、及其混合物。甲酸可以以鹽(通常堿或銨鹽的形式,例如,HC02Na、KHC02NH4及類似形式)、以曱酸(通常水性甲酸)或其混合物的形式提供。曱酸是中度酸。在位于其pKa(水中pKa二3.7)的若千個pH單位內(nèi)的水性溶液中,甲酸以平衡濃度下的HC02—和HC02H兩者存在。在高于約pH4的pH值下,甲酸主要以HC(V存在。當(dāng)甲S交(formate)以甲酸(formicadd)提供時(shí),通常通過添加堿對反應(yīng)混合物進(jìn)行緩沖或使其酸性下降以提供期望的pH—通常為約pH5或5以上。用于中和甲酸的合適堿包括但不限于有機(jī)堿如胺、醇鹽及類似有機(jī)堿,和無機(jī)堿如氫氧化鹽(例如NaOH)、碳酸鹽(例如NaHCCb)、碳酸氫鹽(例如K2C03)、堿式磷酸鹽(例如K2HP04、Na3P04)及類似無纟幾石威。對于高于約pH5的pH值,在此pH值下甲酸主要以HC02—存在,下面的反應(yīng)式(5)描述了通過甲酸脫氫酶催化的曱酸對NAD+或NADP+的還原。(5)HC02-+NAD(P)+--C02+NAD(P)H當(dāng)甲酸和甲酸脫氳酶用作輔因子再生系統(tǒng)時(shí),5-羥基-3-氧代己酸酯被酮還原酶和NADH或NADPH還原,所得的NAD+或NADP+通過由甲酸脫氬酶將曱酸偶聯(lián)氧化成二氧化碳而得以還原。凈反應(yīng)的實(shí)施方案由反應(yīng)式(6)描述,反應(yīng)式(6)是反應(yīng)式(1)和(5)的總和^>H99OHOHOxJLJLJl匿D(6)a^\^\_/\or1+hc02-+h+-^x^^^v^or1+c02、FDHNAD(P)H反應(yīng)式(6)顯示,當(dāng)在pH高于約pH5的水性溶液中將甲酸/曱酸脫氫酶輔因子再生系統(tǒng)用于5-羥基-3-氧代己酸酯的還原時(shí),溶液中的質(zhì)子被消耗并且如果未以其他方式緩沖或再酸化反應(yīng)混合物,那么反應(yīng)使得反應(yīng)混合物的pH升高。反應(yīng)混合物的pH可通過標(biāo)準(zhǔn)緩沖技術(shù)(其中所述緩沖液釋放質(zhì)子直到所提供的緩沖容量)或者通過在轉(zhuǎn)化過程同時(shí)發(fā)生的酸添加而維持在期望的水平。維持pH而在反應(yīng)過程期間添加的合適酸包括有機(jī)酸如羧酸、磺酸、磷酸及類似有機(jī)酸,礦物酸如氫卣酸(如鹽酸)、硫酸、石粦酸及類似礦物酸,酸性鹽如二氫磷酸鹽(例如KH2P04)、;充酸氫鹽(例如NaHS04)及類似酸性鹽。一些實(shí)施方案利用甲酸,其中甲酸濃度和溶液的pH都得以維持。例如,反應(yīng)式(7)表示當(dāng)在反應(yīng)過程內(nèi)添加甲酸(HC02H)以維持起始pH高于約pH5的全過程。盡管甲酸在反應(yīng)混合物中主要以HC(V存在,但是HC02濃度得以維持而凈轉(zhuǎn)化消耗添加的甲酸。<formula>formulaseeoriginaldocumentpage87</formula>當(dāng)在使用曱酸/甲酸脫氫酶輔因子再生系統(tǒng)的還原反應(yīng)期間應(yīng)用酸添加來維持pH時(shí),轉(zhuǎn)化的進(jìn)程可通過維持pH所添加的酸的量來監(jiān)控。通常地,在轉(zhuǎn)化過程中向無緩沖或部分緩沖的反應(yīng)混合物添加的酸是以水性溶液添力口的。術(shù)語"仲醇脫氫酶"和"sADH"在本文可互換使用,是指催化仲醇和NAD+或NADP+分別轉(zhuǎn)化為酮和NADH或NADPH的NAD+或NADP+依賴性酶。下面的反應(yīng)式(8)描述了NAD+或NADP+經(jīng)仲醇的還原,通過異丙醇示例。<formula>formulaseeoriginaldocumentpage87</formula>適于在本文所述的酮還原酶催化的還原反應(yīng)中作為輔因子再生系統(tǒng)使用的仲醇脫氫酶包括天然存在的仲醇脫氫酶和非天然存在的仲醇脫氫酶兩者。天然存在的仲醇脫氫酶包括來自布氏熱厭氧菌(77enwc^wera/)iww6racA:/0、紅平紅3求菌(i/2ot/ococo/5'e(yAra/wfo)、克菲爾乳酸桿菌(丄acto6w'〃wAe/z力')和短乳桿菌(丄wto/)""'〃wZ)"v/a')的已知醇脫氫酶,而非天然存在的仲醇脫氫酶包括由其衍生的工程醇脫氫酶。用于本文所述方法的仲醇脫氫酶(不管是天然存在或非天然存在的)可顯示至少約1^mo1/分鐘/mg、有時(shí)至少約10pmol/分鐘/mg或至少約1(^pmol/分鐘/mg、直到約103夂imol/分鐘/mg或更高的活性。合適的仲醇包括低級仲鏈烷醇和芳基-烴基甲醇(carbinol)。低級仲醇的實(shí)例包括異丙醇、2-丁醇、3-曱基-2-丁醇、2-戊醇、3-戊醇、3,3-二甲基-2-丁醇、及類似低級仲醇。在一個實(shí)施方案中,所述仲醇是異丙醇。合適的芳基-烴基甲醇包括未取代的和取代的1-芳基乙醇。當(dāng)仲醇和仲醇脫氫酶用作輔因子再生系統(tǒng)時(shí),由于5-鞋基-3-氧代己酸酯底物被工程酮還原酶和NADH或NADPH還原,因此所得的NAD+或NADP+通過由仲醇脫氫酶將仲醇偶聯(lián)氧化成酮而被還原。凈反應(yīng)由用異丙醇示例的反應(yīng)式(9)描述,反應(yīng)式(9)是反應(yīng)式(1)和(8)的總和<formula>formulaseeoriginaldocumentpage88</formula>熟練的技術(shù)人員應(yīng)理解,酮和醇分別到對應(yīng)的醇和酮的此反應(yīng)是可逆的,并將達(dá)到平衡。發(fā)明人發(fā)現(xiàn)正向反應(yīng)是熱力學(xué)上有利的,并僅需要中等過量的異丙醇即可在平衡時(shí)獲得3-氧代己酸酯到期望的3,5-二羥基己酸酯的高轉(zhuǎn)化。通常地,向反應(yīng)提供的仲醇與3-氧代己酸酯的摩爾比在1至20的范圍內(nèi)。在一些實(shí)施方案中,此摩爾比為1至10、1至5或1至2。某些工程酮還原酶還具有使仲醇還原劑脫氬的活性。在一些使用仲醇作為還原劑的實(shí)施方案中,工程酮還原酶和仲醇脫氫酶是同一種酶。在使用輔因子再生系統(tǒng)進(jìn)行本文所述酮還原酶催化還原反應(yīng)的實(shí)施方案時(shí),最初可提供氧化型或還原型形式的輔因子。如上所述,所述輔因子再生系統(tǒng)將氧化型輔因子轉(zhuǎn)化成其還原型形式,然后所述還原型形式用于將酮還原酶底物(即5-羥基-3-氧代己酸酯)還原成對應(yīng)的3,5-二羥基己酸酯。在一些實(shí)施方案中,不使用輔因子再生系統(tǒng)。對于不使用輔因子再生系統(tǒng)而進(jìn)行的還原反應(yīng),輔因子以還原型形式加入到反應(yīng)混合物。在進(jìn)行本文所述的對映選"l奪性還原反應(yīng)中,工程酮還原酶和包括任選的輔因子再生系統(tǒng)的任何酶可以以純化酶、用編碼所述酶的基因轉(zhuǎn)化的全細(xì)胞和/或這些細(xì)胞的細(xì)胞提取物和/或溶解產(chǎn)物的形式被添加到反應(yīng)混合物。編碼工程酮還原酶和任選的輔因子再生酶的基因可分別轉(zhuǎn)化入宿主細(xì)胞或一起轉(zhuǎn)化入相同的宿主細(xì)胞。例如,在一些實(shí)施方案中,一組宿主細(xì)胞可用編碼工程酮還原酶的基因轉(zhuǎn)化,而另一組可用編碼輔因子再生酶的基因轉(zhuǎn)化。兩組轉(zhuǎn)化的細(xì)胞可在反應(yīng)混合物中以全細(xì)胞的形式或以由此衍生的溶解產(chǎn)物或提取物的形式一起利用。在其他的實(shí)施方案中,宿主細(xì)胞可用編碼工程酮還原酶和輔因子再生酶的基因轉(zhuǎn)化。用編碼工程酮還原酶和/或任選的輔因子再生酶或其細(xì)胞^是取物和/或溶解產(chǎn)物的基因轉(zhuǎn)化的全細(xì)胞可以多種不同的形式使用,所述形式包括固體(例如凍干、噴霧干燥及類似形式)或半固體(例如粗制糊劑)。所述細(xì)胞提取物或細(xì)胞溶解產(chǎn)物可通過沉淀(硫酸銨、聚乙烯亞胺)、熱處理或類似方法、隨后在冷凍千燥前進(jìn)行脫鹽程序(例如超濾、透析及類似方法)而部分純化。任何細(xì)胞制品可通過使用已知交聯(lián)劑如戊二醛進(jìn)行交聯(lián)或固定至固相(例如EupergitC及類似固相)而得以穩(wěn)定。固體反應(yīng)物(例如酶、鹽等)可以以多種不同形式供應(yīng)到反應(yīng),所述形式包括粉末(例如凍干、噴霧干燥及類似千燥)、溶液、乳劑、懸浮液及類似形式。所述反應(yīng)物可使用對本領(lǐng)域普通技術(shù)人員來說已知的方法和裝置而容易地凍干或噴霧干燥。例如,蛋白溶液可以以小的等份在-80。C下冷凍,接著將其加入到預(yù)冷的冷凍干燥室,隨后應(yīng)用真空。在從樣品中去除水后,但在釋放真空和回收凍千樣品之前,通常將溫度升溫至4'C保持兩小時(shí)。用于還原反應(yīng)的反應(yīng)物的量一^^艮據(jù)期望的3,5-二羥基己酸酯的量和伴隨所用的酮還原酶底物的量而變化。下述準(zhǔn)則可用于確定使用的酮還原酶、輔因子和任選地輔因子再生系統(tǒng)的量。一般來說,5-幾基-3-氧代-己酸酯底物以約20至300克/升的濃度應(yīng)用,用約50mg至約5g酮還原酶和約10mg至約150mg的輔因子。本領(lǐng)域普通技術(shù)人員將容易理解如何改變這些量以使其滿足生產(chǎn)能力和生產(chǎn)規(guī)模的期望水平。任選的輔因子再生系統(tǒng)的合適量可基于所用的輔因子和/或酮還原酶的量經(jīng)由常規(guī)實(shí)驗(yàn)來容易地測定。一般來說,還原劑(例如葡萄糖、甲酸、異丙醇)以高于酮還原酶底物的等摩爾水平的水平利用以基本上實(shí)現(xiàn)酮還原酶底物的完全或接近完全的轉(zhuǎn)化。添加反應(yīng)物的次序不是關(guān)鍵的。反應(yīng)物可同時(shí)一起添加到溶劑(例如單相溶劑、雙相水性共溶劑系統(tǒng)及類似溶劑),或可選地,一些反應(yīng)物可單獨(dú)添加,并且一些反應(yīng)物可在不同的時(shí)間點(diǎn)一起添加。例如,可首先將輔因子再生系統(tǒng)、輔因子、酮還原酶和酮還原酶底物添加到溶劑。當(dāng)使用水性共溶劑系統(tǒng)時(shí),為了提高混合效率,則可首先添加并混合輔因子再生系統(tǒng)、酮還原酶和輔因子到水相。然后添加并混合有機(jī)相,隨后添加酮還原酶底物??蛇x地,酮還原酶底物可在添加到水相之前于有機(jī)相中預(yù)混合。用于進(jìn)行本文所述的酮還原酶催化還原反應(yīng)的適合條件包括可通過常規(guī)試驗(yàn)容易優(yōu)化的多種條件,所述常規(guī)試驗(yàn)包括但不限于在實(shí)驗(yàn)pH和溫度下使工程酮還原酶和底物接觸然后檢測產(chǎn)物(例如使用本文提供的實(shí)施例中所述的方法)。酮還原酶催化的還原通常在范圍為約15。C至約75。C的溫度下進(jìn)行。對于某些實(shí)施方案,所述反應(yīng)在范圍為約2(TC至約55。C的溫度下進(jìn)行。在其他的實(shí)施方案中,它在范圍為約20。C至約45。C的溫度下進(jìn)行。所述反應(yīng)還可在室溫條件下進(jìn)行。一般允許所述還原反應(yīng)進(jìn)行,直到獲得底物的大致完全或接近完全還原。底物到產(chǎn)物的還原可使用已知方法通過檢測底物和/或產(chǎn)物來監(jiān)控。適合的方法包括氣體色譜法、HPLC及類似方法。在反應(yīng)混合物中產(chǎn)生的3,5-二羥基己酸酯還原產(chǎn)物的轉(zhuǎn)化率一般大于約50%,還可大于約60%,還可大于約70%,還可大于約80。/。,還可大于90%,并且通常大于約97%。3,5-二羥基己酸酯還原產(chǎn)物可從反應(yīng)混合物中回收,并使用本領(lǐng)域技術(shù)人員已知的方法來任選地進(jìn)一步純化。適合的方法在美國專利6,001,615、6,472,544、6,596,879和6,645,746中描述,所述專利的公開內(nèi)容通過引用并入本文。另外的適合方法在下述實(shí)施例中提供。如前文論述,5-幾基-3-氧代己酸酯對映體(Ia)的酮還原酶催化的還原在3,5-二羥基己酸酯產(chǎn)物的3-位產(chǎn)生新的立體性碳。還如前文論述,在用本文所述的工程酮還原酶進(jìn)行的反應(yīng)中,還原產(chǎn)物以在3-位的高程度的順式立體選擇性產(chǎn)生因此,使用本文所述的工程酮還原酶產(chǎn)生的3,5-二羥基己酸酯為手性的和非外消旋的。如上所述,本文所述的酮還原酶反應(yīng)通常產(chǎn)生根據(jù)結(jié)構(gòu)式(IIa)的手性的順式3,5-二羥基己酸酯,它具有至少約99.5%、通常至少約99.9%且代表性地至少約99.95%的非對映體純度。實(shí)施例示例了提供非對映體純度299.993%的6-氰基-(3R,5R)-二羥基己酸叔丁酯的實(shí)施方案。已經(jīng)發(fā)現(xiàn)本文所述的某些底物在臨床上重要的降膽固醇他汀藥物的合成中特別有用。此類化合物包括其中如本之定義的R'是低級烴基(在一些實(shí)施方案中是叔丁基)、并且X選自氯、氰基和羥基和OR"的那些化合物。因此,根據(jù)本文所述的(Ia)、(IIa)、(nia)、(IVa)和(Va)結(jié)構(gòu)式的化合物的一些實(shí)施方案包括其中R/是低級烴基或叔丁基和/或X選自氯、氰基和幾基的那些化合物。在X是-OR6,其中R6是保護(hù)基團(tuán)的根據(jù)(Ia)、(IIa),(IIIa)、(IVa)和(Va)結(jié)構(gòu)式的化合物的實(shí)施方案中,所述基團(tuán)實(shí)際上可以是已知用于在有機(jī)合成期間保護(hù)羥基的任何保護(hù)基團(tuán)。特定保護(hù)基團(tuán)的特征性將取決于各種合成反應(yīng)條件,并可被本領(lǐng)域技術(shù)人員容易選擇用于特定情況。適合的示例寸生寸呆護(hù)基團(tuán)在Greene&Wuts,"ProtectiveGroupsinOrganicSynthesis(有才幾合成中的保護(hù)基團(tuán))"笫3版,l"9,JohnWiley&Sons,NY(參見例如第17-200頁)中描述。在一些實(shí)施方案中,所述保護(hù)基團(tuán)選自醚保護(hù)基團(tuán)(例如千基、叔丁基、四氫吡喃基、曱氧乙氧甲基、曱氧甲基等)、甲硅烷基醚保護(hù)基團(tuán)(例如三甲基甲硅烷基、三乙基甲硅烷基、叔丁基二曱基曱硅烷基、三苯基曱硅烷基等)、酯保護(hù)基團(tuán)(例如苯甲酸酯、烴基化物(alkylate)、卣代烴基化物等)、碳酸酯保護(hù)基團(tuán)(例如烴基甲基(methy)、甲氧甲基、烴基2,2,2,-三氯乙基、烯丙基烯丙基碳酸酯、烴基千基等)和磺酸酯保護(hù)基團(tuán)(例如磺酸烯丙酯(allylsulfonate)、甲磺酸酯、磺酸千酯(benzylsulfonate)、甲苯磺酸酯等)。結(jié)構(gòu)式(Ia)的5-幾基-3-氧代己酸酯對映體可使用本領(lǐng)域眾所周知的標(biāo)準(zhǔn)方法來制備。適合的示例性方法在美國專利第6,399,339號(對于其中X二Cl和R^^k丁基的特定實(shí)施例,參見實(shí)施例1);美國專利第5,155,251號及在其中引用的各種參考文獻(xiàn)(X^CN、R^叔丁基)、日本專利公布第1723728號(X^C1、R^叔丁基)和PCT公布WO2005/018579(X=C1或CN、R^叔丁基)中描述,所述專利和公布的公開內(nèi)容通過引用并入本文。圖1提供了說明用于以對映體純的形式和以外消旋混合物來合成底物的示例性方法的圖(國際公布第WO2003/070733和WO2004/113314號)。由本文所述的工程酮還原酶催化的還原反應(yīng)生成的順式3,5-二羥基己酸酯可用作合成臨床上重要的降膽固醇他汀藥物如阿托伐他汀、羅蘇伐他汀和匹伐他汀的起始物。合成這些他汀類的關(guān)鍵中間體是結(jié)構(gòu)式(IIIa)或(1Va)的受保護(hù)的順式3,5-二羥基己酸面旨(見上)。用于合成此類受保護(hù)的酯的方法是眾所周知的。在結(jié)構(gòu)式(IIIa)化合物中的W取代基表示未橋接的保護(hù)基團(tuán)的實(shí)施方案中,所述保護(hù)基團(tuán)可選自上述的那些保護(hù)基團(tuán)。包括這些保護(hù)基團(tuán)的化合物可按例如Greene&Wuts,"ProtectiveGroupsinOrganicSynthesis(有機(jī)合成中的保護(hù)基團(tuán))"第3版,1999,JohnWiley&Sons,NY(參見例如第17-200頁)中的描述來合成。所用的實(shí)際方法將取決于保護(hù)基團(tuán)的特征性。R2基團(tuán)合在一起以形成任選地取代的亞烴基橋的實(shí)施方案可使用美國專利第5,097,045號(X二氰基)、美國專利第6,472,544號(乂=鹵素或OH)和美國專利第6,344,569號(X二卣素或CN)中描述的方法從順式3,5-二羥基己酸酯合成,所迷專利的公開內(nèi)容通過引用并入本文。包括這些保護(hù)基團(tuán)的4匕合物可才姿例如Greene&Wuts,"ProtectiveGroupsinOrganicSynthesis(有機(jī)合成中的保護(hù)基團(tuán))"第3版,1999,JohnWiley&Sons,NY(參見例如第201-245頁)中的描述來合成。作為特定的實(shí)例,其中X是氰基的根據(jù)結(jié)構(gòu)式(IVa)的化合物可通過用縮醛形成試劑處理對應(yīng)的(3R,5R)-6-氰基-3,5-二羥基己酸酯來制備,如美國專利第6,344,569號第7欄第30行至第8欄第40行所述,其公開內(nèi)容通過引用并入本文。作為另一個特定的實(shí)例,其中X是卣素的根據(jù)結(jié)構(gòu)式(IVa)的化合物可通過用縮醛形成試劑處理對應(yīng)的(3R,5S)-6-鹵素-3,5-二羥基己酸酯來制備,如美國專利第6,344,569號第9欄第21行至第10欄第34行所述,其公開內(nèi)容通過引用并入本文。作為又一個實(shí)施例,其中X是氰基的根據(jù)結(jié)構(gòu)式(IVa)的化合物可通過用氰化試劑處理所述氯類似物(按上述制備)來制備,如美國專利第6,344,569號第11欄笫17行至第12欄第5行所述,其公開內(nèi)容通過引用并入本文。在一些實(shí)施方案中,受保護(hù)的順式3,5-二羥基己酸酯的112基團(tuán)合在一起可形成-BR、的環(huán)狀硼酸酯保護(hù)基團(tuán),其中R5選自(C1-C12)烴基、(C6-C10)芳基和(C7-C12)芳基烴基。在特定的實(shí)施方案中,RS是苯基。具有基于環(huán)狀硼酸酯的保護(hù)基團(tuán)的化合物可按例如Greene&Wuts,"ProtectiveGroupsinOrganicSynthesis(有機(jī)合成中的保護(hù)基團(tuán))"第3版,l999,JohnWiley&Sons,NY(參見例如第243-245頁)中的描述來合成。示例性的苯基硼酸酯保護(hù)的順式3,5-二羥基己酸酯在美國專利第6,867,306號中描述,其通過引用并入本文。這些和其他反應(yīng)的示例性實(shí)施方案在圖2中說明。從(3R,5R)-6-氰基-3,5-二羥基己酸叔丁酯合成(411,61^-6-氰甲基-2,2-二甲基-1,3-二噁烷-4-乙酸叔丁酯和從(3R,5S)-6-氯-3,5-二羥基己酸叔丁酯合成(4R,6S)-6-氯甲基-2,2-二甲基-1,3-二噁烷-4-乙酸叔丁酯的特定方法分別在美國專利第6,344,569號的實(shí)施例2和3中描述,所述專利的公開內(nèi)容通過引用并入本文。從(4R,6S)-6-氯甲基-2,2-二曱基-1,3-二噁烷-4-乙酸叔丁酯合成(4R,6R)-6-氰甲基-2,2-二甲基-l,3-二噁烷-4-乙酸叔丁酯的特定方法在美國專利第6,344,569號的實(shí)施例3中描述,所述專利的公開內(nèi)容通過引用并入本文。結(jié)構(gòu)式(IIa)、(llla)、(IVa)和(Va)的受保護(hù)的和未受保護(hù)的順式二羥基酯可使用本領(lǐng)域眾所周知的方法用于合成降膽固醇他汀類以及包括1,3-順式二羥基部分的其他有用化合物。例如,使用(3R,5R)-6-氰基-3,5-二羥基己酸叔丁酯合成阿托伐他汀的方法在美國專利第6,596,879號(尤其參見第14欄第22-58行的實(shí)施例2)和美國專利第5,097,045號中描述,所述專利的公開內(nèi)容通過引用并入本文。使用(3R,5S)-6-氯-3,5-二羥基己酸叔丁酯合成羅蘇伐他汀的方法分別在美國專利第5,278,313號和美國專利第6,472,544號中描述,所述專利的公開內(nèi)容通過引用并入本文。使用(3R,5S,6)-三羥基己酸叔丁酯合成羅蘇伐他汀的方法在PCT申請?bào)蔠O01/85975號中描述,所述申請的公開內(nèi)容通過引用并入本文。使用由本文方法所生成的化合物合成其他他汀類對熟練的技術(shù)人員來說將是明顯的。7.實(shí)施例本公開內(nèi)容的各種特征和實(shí)施方案在下列代表性實(shí)施例中說明,所述實(shí)施例旨在說明,而非限制。在下列描述中,無論哪里使用葡萄糖脫氫酶(GDH),它均是可從JulichChiralSolutions,Jiilich,Germany獲得的GDH-CDX901。7.1實(shí)施例1:野生型酮還原酶基因獲得和表達(dá)載體的構(gòu)建編碼釀酒酵母酮還原酶的^/〃Ww/基因(Genbank登錄號NP一010159.1;GI:6320079),根據(jù)由所述1W〃Ww/基因編碼的酮還原酶("YDL")的氨基酸序列(SEQIDNO:2)進(jìn)行密碼子優(yōu)化(SEQIDNO:l)以在大腸桿菌中表達(dá)。所述基因使用由42個核苷酸組成的寡核香酸合成,并被克隆至表達(dá)載體pCKl10900(如圖5所述)的/"c啟動子的控制下。所述表達(dá)載體還包括P15a復(fù)制起點(diǎn)和氯霉素抗性基因。所得的質(zhì)粒使用標(biāo)準(zhǔn)方法轉(zhuǎn)化到大腸桿菌W3110中。選擇幾個克隆用于測序推定的KRED編碼基因。鑒定具有期望的設(shè)計(jì)序列的基因,并將其用作開發(fā)編碼工程酮還原酶的基因的起始材料。此實(shí)施例示例了可從中產(chǎn)生編碼工程酮還原酶的基因的編碼野生型酮還原酶YDL的重組多核香酸的獲得,及適于此類工程的表達(dá)載體和宿主細(xì)』包。編碼本公開內(nèi)容的工程酮還原酶的多核苷酸以類似方式克隆至載體pCK110900以在大腸桿菌W3110中表達(dá)。7.2實(shí)施例2:酮還原酶粉末的制備;搖瓶程序?qū)哂兴信d趣的酮還原酶基因的質(zhì)粒的大腸桿菌的單個微生物菌落接種于含有30pg/ml氯霉素和1%葡萄糖的50mlLuriaBertani肉湯。細(xì)胞在3(TC培養(yǎng)箱中于250rpm振搖生長過夜(至少16小時(shí))。在1升燒瓶中將培養(yǎng)物用250ml極品肉湯(TerrificBroth)(12g/L細(xì)菌用胰蛋白胨、24g/L酵母提取物、4ml/L甘油、65mMpH7.0磷酸鉀、lmMMgS04、30叱/ml氯霉素)稀釋到600nm光學(xué)密度(006。())為0.2,并允許其在30。C下生長。當(dāng)培養(yǎng)物的OD,為0.6至0.8時(shí),用]mMIPTG誘導(dǎo)酮還原酶基因的表達(dá),并溫育過夜(至少16小時(shí))。通過離心(5000rpm,15分鐘,4°C)收集細(xì)胞并棄去上清液。細(xì)胞沉淀物(pellet)用相等體積冷的(4。C)100mMpH7.0三乙醇胺(氯化物)緩沖液重懸,并通過如上離心收集。洗滌的細(xì)胞在兩倍體積冷的三乙醇胺(氯化物)緩沖液中重懸,并以12000psi通過弗氏壓碎器兩次同時(shí)保持在4。C。細(xì)胞碎片通過離心(9000rpm,45分鐘,4°C)去除。收集澄清的溶解產(chǎn)物上清液并在-20。C下貯藏。冷凍干燥凍結(jié)的、澄清的溶解產(chǎn)物提供了粗制酮還原酶的干燥粉末。此實(shí)施例示例了適用于測試酶性質(zhì)的酮還原酶粉末的生成。7.3實(shí)施例3:6-氰基-(5i)-輕基-3-氧代己S交叔丁酯的制備將120mL無水四氫呋喃和75mL(540mmol)二異丙胺加至在氮?dú)夥障虏⒔?20。C千冰/丙酮浴中的裝有添加漏斗(additionfunnel)和PTFE包衣的磁性攪拌棒的1L三頸燒瓶。攪拌溶液并冷卻至-20。C,然后在45分鐘內(nèi)逐滴加入于己烷中的200mL(500mmol)2.5M正丁基鋰,得到淺黃色溶液。另外30分鐘后,在25分鐘內(nèi)于攪拌下逐滴加入70mL(520mmol)乙酸^又丁酯,使溶液變得混濁。在-20。C下保持另外1小時(shí)后,在35分鐘內(nèi)于攪拌下逐滴加入22.0g4-氰基-(3R)-羥基丁酸乙酯(^99.90/。e.e.,140mmol)在30mL無水四氬吠喃中的溶液,得到淺黃色溶液。將所述溶液在-20。C下保持另外1小時(shí),然后在30分鐘內(nèi)經(jīng)由導(dǎo)管轉(zhuǎn)移到浸沒于水浴卜5匸)中的攪拌的350mL1M4寧檬酸和250mL甲苯的雙相混合物的液面下。在此猝滅過程中,將混合物的溫度保持在5-10。C。在結(jié)束后,分離相,得到淺黃色有機(jī)相(上)和pH6的橙黃色水相(下)。分離水相,并用250mL曱苯萃取。合并的有機(jī)相用100mL1NHC1洗滌,隨后3x100mL蒸餾水洗滌。最后得到31.7g黃色油。油的'H-NMR顯示6-氰基-(5R)-羥基-3-氧代己酸叔丁酯、3-氧代丁酸叔丁酯和4-氰基-(3R)-羥基丁酸叔丁酯以1.00:0.27:0.14摩爾比存在,對應(yīng)于77%(重量百分比)6-氰基-(5R)-羥基-3-氧代己酸叔丁酯(如杲?jīng)]有其他組分存在)。實(shí)際重量百分比可能略微更低,但并未進(jìn)行更準(zhǔn)確地測量。77%(重量百分比)的31.7g油對應(yīng)于根據(jù)4-氰基-3R-羥基丁酸乙酯的77%摩爾收率(理論收率-31.8g)。如此和類似制備的粗6-氰基-(5R)-羥基-3-氧代己酸^k丁酯(通常具有范圍從60至75%(重量百分比)的純度,3-氧代丁酸叔丁酯和4-氰基-(3R)-羥基丁酸叔丁酯的平衡)用于下列實(shí)施例,除了當(dāng)指定純化的底物時(shí)之外。用于實(shí)施例的6-氰基-(5R)-羥基-3-氧代己酸叔丁酯的指定量是指未對其實(shí)際組成作校正的粗制品的量。7.4實(shí)施例4:底物特異性和轉(zhuǎn)化的LC/MS/MS測定開發(fā)了LC/MS/MS方法以分析6-氰基-(5R)-羥基-3-氧代己S吏^i丁酯到6-氰基-(3R,5R)-二羥基己酸叔丁酯的轉(zhuǎn)化以及粗底物(實(shí)施例4)中3-氧代丁酸叔丁酯到3-羥基丁酸叔丁酯的可能轉(zhuǎn)化儀器Agilentl1OO(配有WatersMicromassQuattroPremierLC/MS/MS)柱AgilentSBC18(50mmx4.6mm,5pm)流動相50%的0.25%(體積百分比)乙酸水溶液,50%乙腈流速1.0mL/分鐘背壓60巴溫度室溫注射5pL,~0.1mg/ml,于甲醇或其他可水混溶的溶劑中。保留時(shí)間6-氰基-(3R,5R)-二羥基己酸叔丁酯1.0分鐘6-氰基-(5R)-羥基-3-氧代己酸叔丁酯1.3分鐘3-幾基丁酸叔丁酯1.5分鐘3-氧代丁酸叔丁酯2.1分鐘離子化/檢測APC1+,使用躍遷MH+>MH-56(損失叔丁烯)在0.1mg/ml時(shí),6-氰基-(3R,5R)-二羥基己S史叔丁酯到6-氰基-(5R)-羥基-3-氧代己S吏叔丁酯底物的響應(yīng)比通常為0.84。未對3-氧代丁酸叔丁酯和3-幾基丁酸叔丁酯的MS/MS躍遷進(jìn)行優(yōu)化。7.5實(shí)施例5通過LC/MS/MS對6-氰基-3,(5R)-二羥基己酸叔丁酯的非對映體分析開發(fā)了LC/MS/MS方法以分離和分析6-氰基-3,(5R)-二羥基己酸叔丁酯的(3R,5R)和(3S,5R)非對映體。LC條件提供了非對映體的基線分辨率。從0.0001至1.0mg/ml的響應(yīng)為線性,檢測限低于0.0001mg/ml。儀器AgilentllOO(配有WatersMicromassQuattroPremierLC/MS/MS)柱AgilentSBC8(50mmx4.6mm,5jxm)流動相等度65%的0.25%乙酸水溶液,35%乙腈流速l.OmL/分鐘溫^/室溫保留時(shí)間(3S,5R)12.77分鐘:(3R,5R)13.67分鐘離子化/檢測APCI+,使用躍遷MH+〉MH-S6(損失叔丁烯)7.6實(shí)施例6:通過氣體色譜法對(6R)-氰甲基-2,2-二曱基-l,3-二噁烷-4-乙酸4又丁酯的非對映體分析開發(fā)了GC/MS方法以分離和分析(6R)-氰甲基-2,2-二甲基-l,3-二噁烷-4-乙酸酯((6R)-cyanomethyl-2,2-dimethyl-l,3-dk)xane-4陽acetate)的(4R,6R)和(4S,6R)非對映體柱HP5MS(0,25mm內(nèi)徑,25pmdf,30m)載氣氦,9.44psi,0.7mL/分鐘。烘箱6CTC1分鐘,接著15。C/分鐘到280°C,然后在280。C保持2分鐘保留時(shí)間(4S,6R)11.44分鐘;(4R,6R)11.55分鐘檢測總離子計(jì)數(shù)7.7實(shí)施例7:6-氰基-3,(5R)-二羥基己酸叔丁酯經(jīng)由衍生成(6R)-氰甲基-2,2-二甲基-1,3-二噁烷-4-乙酸叔丁酯的非對映體分析向包含6-氰基-3,(5R)-二羥基己酸叔丁酯的30mg樣品加入1mL乙酸乙酯、2002,2-二甲氧基丙烷和20甲磺酸。將所述混合物在室溫下攪拌20分鐘。加入200pL飽和碳酸氫鈉水溶液后,上面乙酸乙酯層的樣品通過實(shí)施例6的方法來分才斤。6-氰基-3,(5R)-二羥基己酸叔丁酯的(3R,5R)和(3S,5R)非對映體中的每個都在這些條件下進(jìn)行了定量衍生。因此,6-氰基-3,(5R)-二羥基己酸叔丁酯的3,(5R)非對映體組分對應(yīng)于分析的(6R)-氰曱基-2,2-二曱基-l,3-二噁烷-4-乙酸酯衍生物的4,(6R)非對映體組分。7.8實(shí)施例8:評價(jià)野生型酮還原酶YDL還原6-氰基-(5R)-羥基-3-氧代己酸叔丁酯的活性向950^LpH7.0的100mM三乙醇胺(氯化物)緩沖液、200異丙醇、9mg6-氰基-(5R)-羥基-3-氧代己酸叔丁酯和8mgNAD(P)H的反應(yīng)混合物中加入包含酮還原酶YDL的15mg酮還原酶粉末。將所述反應(yīng)混合物在室溫下攪拌24小時(shí),然后用1mL乙酸乙酯萃取。離心后,分離有機(jī)相并通過旋轉(zhuǎn)蒸發(fā)去除溶劑以保留非揮發(fā)性油。通過實(shí)施例4的方法分析所述非揮發(fā)性油的6-氛基-(5R)-羥基-3-氧代己酸叔丁酯以及通過實(shí)施例7的方法得到的產(chǎn)物的非對映體組分6-氰基-(3,5R)-二羥基己酸叔丁酯(如果存在)的轉(zhuǎn)化。分析顯示了6-氰基-(5R)-羥基-3-氧代己酸叔丁酯的85%轉(zhuǎn)化生成具有〉99%d.e.的6-氰基-(3R,5R)-二羥基己酸叔丁酯。此實(shí)施例示例了野生型酮還原酶YDL作為改進(jìn)5-羥基-3-氧代己酸酯對映體的3-氧代基團(tuán)還原產(chǎn)生對應(yīng)的順式3,5-二羥基己酸酯的性質(zhì)的工程候選物的鑒定。7.9實(shí)施例9:使用用于輔因子再生的葡萄糖和葡萄糖脫氫酶評價(jià)野生型酮還原酶YDL還原6-氰基-(5R)-羥基-3-氧代己酸叔丁酯的活性。向1mLpH7.0的100mM三乙醇胺(氯化物)緩沖液、100pL乙酸丁酯、20mg6-氰基-(5R)-羥基-3-氧代己酸叔丁酉旨、1mgNAD(P)+和35mg葡萄糖的反應(yīng)混合物加入3mg葡萄糖脫氫酶粉末和包含酮還原酶YDL的20mg酮還原酶粉末。將所述反應(yīng)混合物在室溫下攪拌22小時(shí),然后用lmL乙酸乙酯萃取。離心后,分離有機(jī)相并經(jīng)旋轉(zhuǎn)蒸發(fā)去除溶劑以保留非揮發(fā)性油。通過實(shí)施例4方法分析所述非揮發(fā)性油的6-氰基-(5R)-羥基-3-氧代己酸叔丁酯以及通過實(shí)施例5方法得到的產(chǎn)物的非對映體組分6-氰基-(3,511)-二羥基己酸叔丁酯(如果存在)的轉(zhuǎn)化。分析顯示了6-氰基-(5R)-羥基-3-氧代己酸叔丁酯的92.6%轉(zhuǎn)化生成具有〉99.9%d.e.的6-氰基-(3R,5R)-二幾基己酸叔丁酯。此實(shí)施例示例了當(dāng)與輔因子再生系統(tǒng)(葡萄糖和葡萄糖脫氫酶)組合使用時(shí)野生型酮還原酶YDL的活性和非對映選擇性的評價(jià)。7.10實(shí)施例10:評價(jià)野生型酮還原酶YDL在還原粗6-氰基-(5R)-羥基-3-氧代己酸叔丁酯的反應(yīng)中的底物和輔因子特異性野生型酮還原酶YDL粉末對經(jīng)NADH和NADPH還原(《>5-羥基-3-氧代己酸叔丁酯和3-氧代丁S交叔丁酯的特異性通過測量反應(yīng)混合物中340nm下NAD(P)吸光度的增加來評價(jià),所述反應(yīng)混合物包含在總體積1mL的100mMpH7.2三乙醇胺(氯化物)緩沖液中的3mg/mL純化的(A)-5-羥基-3-氧代己酸叔丁酯或13mM3-氧代丁酸叔丁酯和0.2-0.3mMNADH或NADPH。酮還原酶YDL粉末對通過NADPH但不是通過NADH還原(/)-5-輕基-3-氧代己酸叔丁酯具有活性。相對于(W)-5-羥基-3-氧代己酸叔丁酯的活性而言,酮還原酶YDL粉末僅顯示通過NADPH還原3-氧代丁酸#又丁酯的非常低的活性。7.11實(shí)施例11:用于對6-氰基-(5R)-羥基-3-氧代己酸叔丁酯的酮還原酶活性的高通量測定A.高通量NAD(P)H熒光測定使用Q-bot機(jī)器人菌落挑取器(GenetixUSA,Inc.,Beaverton,OR)將文庫菌落挑取到包含180LimaBertani肉湯(LB)、1%葡萄糖和30pg/mL氯霉素(CAM)的96孔淺孔微量滴定板中。于30。C在250rpm振搖下使細(xì)胞生長過夜。然后將13此培養(yǎng)物轉(zhuǎn)移到包含400極品肉湯(TB)和30昭/mLCAM的96深孔板中。于30。C在250rpm振搖下將深孔板溫育2.5至3小時(shí)(0060。0.6-0.8)后,細(xì)胞培養(yǎng)物的重組基因表達(dá)通過終濃度1mM異丙基硫代半乳糖苷(IPTG)誘導(dǎo)。然后于30。C在250rpm振搖下將板溫育過夜。細(xì)胞經(jīng)離心沉淀,在300至400裂解緩沖液中重懸并通過在室溫下振搖至少2小時(shí)而裂解。所述裂解緩沖液包含pH7.0-7.2的100mM三乙醇胺(氯化物)緩沖液、1mg/mL溶菌酶和500嗎/mL多粘菌素B硫酸鹽。通過將測定量的所述裂解混合物轉(zhuǎn)移到包含pH7-7.2的100mM三乙醇胺(氯化物)緩沖液、0.2-0.3mMNAD(P)H、2至3mg/mL6-氰基-(5R)-羥基-3-氧代己酸叔丁酯、0至2mg/ml6-氰基-(3R,5R)-二羥基-己酸叔丁酯、0至600mM葡萄糖和0至600mM葡萄糖酸鈉的測定混合物的微量滴定板的孔中,測量酮還原酶活性。反應(yīng)通過測量在440nm下NAD(P)H的熒光發(fā)射的下降作為時(shí)間的函數(shù)來監(jiān)控。結(jié)果以NAD(P)H的相對熒光單位(RFU)對時(shí)間繪制曲線,并且曲線的斜率(RFU/分鐘)用于測定反應(yīng)速率。B.底物特異性和轉(zhuǎn)化的中等通量LC/MS/MS測定為確定熒光測定中所測量的NAD(P)H消耗歸因于6-氰基-(5R)-羥基-3-氧代-己酸叔丁酯底物到6-氰基-(3R,5R)-二鞋基己酸叔丁酯產(chǎn)物的轉(zhuǎn)化或歸因于粗底物中的3-氧代丁酸叔丁酯到3-羥基丁酸叔丁酯的還原的程度,將顯示所感興趣的NAD(P)H消耗活性的反應(yīng)混合物固定到更少的96孔微量滴定板中并用乙酸乙酯萃取。分離的乙酸乙酯提取物用乙腈/水(l/l)稀釋,并通過實(shí)施例4的LC艇S/MS方法來分析。7.12實(shí)施例12:更穩(wěn)定的工程酮還原酶的高通量篩選包括在實(shí)施例11A中所制備并鑒定的工程酮還原酶的裂解混合物在范圍為37。C至50。C的溫度下溫育至少16小時(shí)。然后在室溫下通過實(shí)施例4的程序測量溫育后在裂解混合物中剩余的酮還原酶活性。溫育后剩余的酮還原酶活性與對應(yīng)的未溫育裂解混合物活性的比率(0至1)用作裂解混合物中工程酮還原酶的穩(wěn)定性的量度。7.13實(shí)施例13:用于6-氰基-(5R)-羥基-3-氧代己酸叔丁酯到6-氰基-(31^,511)-二羥基己酸叔丁酯的還原的源自野生型YDL的工程酮還原酶的改進(jìn)活性。向配置有PTFE包衣的磁性攪拌棒和pH電極(與自動滴定器連接,以根據(jù)需要經(jīng)飼管向容器中pH控制地添加堿)的25mL三頸容器中注入19mLpH7的100mM三乙醇胺(氯化物)緩沖液、3.0g葡萄糖、包括表2指定量的由表2中的SEQIDNO.指定的酮還原酶的酮還原酶粉末、13mg葡萄糖脫氫酶粉末、1.0mgNaNADP和最后3g6-氰基-(5R)-羥基-3-氧代己酸叔丁酯。在22。C下攪拌所述反應(yīng)混合物。自動滴定器通過添加4NNaOH使pH保持在7,對所述添加進(jìn)行連續(xù)記錄。反應(yīng)進(jìn)程通過堿的速率和累積添加以及對反應(yīng)混合物的定期取樣(以用實(shí)施例4的方法進(jìn)行提取和分析)來監(jiān)控。在表2所指定的反應(yīng)時(shí)間后,用兩份10mL乙酸乙酯萃取反應(yīng)混合物兩次。將合并的有機(jī)提取物通過一薄層硅藻土過濾,并通過在真空下旋轉(zhuǎn)蒸發(fā)去除溶劑。通過實(shí)施例5的方法對殘留的油的非對映體分析顯示表2報(bào)道的每個此類反應(yīng)的產(chǎn)物6-氰基-(3R,5R)-二羥基己酸叔丁酯具有〉99.99%的非對映純度(未檢測出其他非對映體)。表2給出了與酮還原酶4分末對應(yīng)的SEQIDNO.、乂人野生型酮還原酶YDL的氨基酸突變的個數(shù)、所用的酮還原酶粉末的量、反應(yīng)時(shí)間以及在該反應(yīng)時(shí)間內(nèi)達(dá)到的6-氰基-(5R)-羥基-3-氧代己酸叔丁酯到6-氰基-(3R,5R》二羥基己酸叔丁酯的轉(zhuǎn)化。通過比較表2中的酮還原酶量、反應(yīng)時(shí)間和轉(zhuǎn)化,此實(shí)施例示例了與酮還原酶YDL相比,提供改進(jìn)活性的源自野生型酮還原酶YDL的工程酮還原醉。表2:源自YDL的工程酮還原酶的活性<table>tableseeoriginaldocumentpage102</column></row><table>7.14實(shí)施例14:用于6-氰基-(5R)-羥基-3-氧代己酸叔丁酯到6-氰基《3R,5R)-二羥基己酸叔丁酯的還原的源自野生型YDL的工程酮還原酶的改進(jìn)穩(wěn)定性。向配置有PTFE包衣的磁性攪拌棒和pH電極(與自動滴定器連接,以根據(jù)需要經(jīng)伺管向容器中pH控制地添加堿)的25mL三頸容器中注入20mLpH7的100mM三乙醇胺(氯化物)緩沖液、0.5g葡萄糖、表3指定的量的酮還原酶粉末、8mg葡萄糖脫氫酶、2.0mgNaNADP和最后0.3g6-氰基-(5R)-羥基-3-氧代己酸叔丁酯D在表3指定的溫度下攪拌所述反應(yīng)混合物。自動滴定器通過添加4NNaOH使pH保持在7,對所述添加進(jìn)行連續(xù)記錄。反應(yīng)進(jìn)程通過石咸的速率和累積添加以及對反應(yīng)混合物的定期取樣(以用實(shí)施例4的方法進(jìn)行提取和分析)來監(jiān)控。在22小時(shí)后,用兩份10mL乙酸乙酯萃取反應(yīng)混合物兩次。將合并的有機(jī)提取物通過一薄層硅藻土過濾,并通過在真空下旋轉(zhuǎn)蒸發(fā)去除溶劑。通過實(shí)施例5的方法對殘留的油的分析顯示表3報(bào)道的每個此類反應(yīng)的產(chǎn)物6-氰基-(3R,5R)-二鞋基己酸叔丁酯具有>99.99%非對映純度(未檢測出其他非對映體)。表3給出了與酮還原酶4分末對應(yīng)的SEQIDNO.、從野生型酮還原酶YDL的氛基酸突變的個數(shù)、所用的酮還原酶粉末的量、反應(yīng)溫度以及在指定的累積反應(yīng)時(shí)間達(dá)到的6-氰基-(5R)-羥基-3-氧代己酸叔丁酯到6-氰基《3R,5R)-二羥基己酸叔丁酯的轉(zhuǎn)化。<table>tableseeoriginaldocumentpage103</column></row><table>通過比較表3中的酮還原酶量、反應(yīng)時(shí)間和轉(zhuǎn)化,此實(shí)施例示例了與YDL相比,提供改進(jìn)穩(wěn)定性的源自野生型酮還原酶YDL的工程酮還原酶。盡管在22匸的反應(yīng)中YDL保留活性并且在22小時(shí)反應(yīng)達(dá)到75%的轉(zhuǎn)化,但是在30。C的反應(yīng)中,YDL在3小時(shí)內(nèi)失去所有活性,僅達(dá)到25%的轉(zhuǎn)化。具有氨基酸序列SEQIDNO.156的工程酮還原酶的穩(wěn)定性部分得以改進(jìn);它在30。C下保留超過3小時(shí),但是在17小時(shí)內(nèi)失去所有活性,達(dá)到78%的轉(zhuǎn)化。具有氨基酸序列SEQIDNO.312的工程酮還原酶在3(TC下保留活性超過17小時(shí)并且在22小時(shí)內(nèi)達(dá)到基本上完全的轉(zhuǎn)化。7.15實(shí)施例15:用于6-氯-(5S)-羥基-3-氧代己酸叔丁酯到6-氯-(3R,5S)-二羥基己酸叔丁酯的還原的源自野生型YDL的工程酮還原酶的改進(jìn)活性和非對映選擇性。向配置有PTFE包衣的磁性攪拌棒和pH電極(與自動滴定器連接,以根據(jù)需要經(jīng)飼管向容器中pH控制地添加堿)的50mL三頸容器中注入21mLpH7的100mM三乙醇胺(氯化物)緩沖液、0.5g葡萄糖、含有包含由表4中的SEQIDNO.指定的酮還原酶的10mg酮還原酶粉末的2mL相同緩沖液、10mg葡萄糖脫氫酶粉末、2.0mgNAD或NaNADP、和最后0.3g6-氯-(5S)-羥基-3-氧代己酸叔丁酯。在22。C下攪拌所述反應(yīng)混合物。自動滴定器通過添加4NNaOH使pH保持在6.9,對所述添加進(jìn)行連續(xù)記錄。反應(yīng)進(jìn)程通過堿的速率和累積添加以及對反應(yīng)混合物的定期取樣(用實(shí)施例4的方法進(jìn)行提取和分析)來監(jiān)控。在表4指定的反應(yīng)時(shí)間后,用兩份10mL乙酸乙酯萃取反應(yīng)混合物兩次。將合并的有機(jī)提取液通過硅藻土過濾,并通過在真空下旋轉(zhuǎn)蒸發(fā)去除溶劑以得到0.2g殘留的油。殘留油中的6-氯-(3R,5S)-二羥基己酸叔丁酯產(chǎn)物的非對映純度通過實(shí)施例7的方法來確定。(3R,5S)-二醇是順式非對映體(用于標(biāo)記5-位R或S的慣例在6-氰曱基和6-氯甲基之間顛倒)。表4給出了與酮還原酶粉末對應(yīng)的SEQIDNO.、從野生型酮還原酶YDL的氨基酸突變的個數(shù)、所用的酮還原酶粉末的量、所用的輔因子、反應(yīng)時(shí)間、6-氯-(5S)-羥基-3-氧代己酸叔丁酯的轉(zhuǎn)化以及6-氯-(3R,5S)-二羥基己酸叔丁酯產(chǎn)物的非對映純度。此實(shí)施例示例了與酮還原酶YDL相比提供改進(jìn)活性和改進(jìn)非對映選擇性的源自野生型酮還原酶YDL的工程酮還原酶以及此類工程酮還原酶用于制備6-氯-(3R,5S)-二羥基己酸叔丁酯的用途。表4:YDL和源自YDL的工程酮還原酶產(chǎn)生6-氯-(3R,5S)-二鞋基己酸叔丁酯的活性和立體選擇性<table>tableseeoriginaldocumentpage104</column></row><table>7.16實(shí)施例16:使用用于輔因子再生的異丙醇和仲醇脫氬酶通過工程酮還原酶的6-氰基-(5R)-羥基-3-氧代己酸叔丁酯到6-氰基-(3R,5R)-二羥基己酸叔丁酯的還原。向包含2mMMgS04的2mLpH7.2的100mM三乙醇胺(氯化物)緩沖液、360mg6-氰基-(5R)-羥基-3-氧代己S交叔丁酯和200pL異丙醇的反應(yīng)混合物中加入包含具有SEQIDNO.330的氨基酸序列的工程酮還原酶的30mg酮還原酶粉末、包含源自ADH-LK且具有使異丙醇氧化成丙酮的活性的工程仲醇脫氬酶的仲醇脫氫酶粉末以及5mgNaNADP。在室溫下將所述反應(yīng)混合物攪拌1小時(shí),然后用1mL乙酸乙酯萃取。離心后,分離有機(jī)相并通過旋轉(zhuǎn)蒸發(fā)去除溶劑以保留非揮發(fā)性油。通過實(shí)施例4和7的方法分析非揮發(fā)性油。6-氰基-(5R)-羥基-3-氧代己酸叔丁酯被100%轉(zhuǎn)化成具有>99.9%d.e.(=>99.95°/0非對映選擇性)的6-氰基-(3R,5R)-二輕基己酸叔丁酯。此實(shí)施例示例了使用與包含仲醇(異丙醇)和仲醇脫氫酶的輔因子再生系統(tǒng)組合的工程酮還原酶還原5-羥基-3-氧代己酸酯的對映體的3-氧代基團(tuán)產(chǎn)生對應(yīng)的順式3,5-二羥基己酸酯。7.17實(shí)施例17:6-氰基-(3R,5R)-二羥基己酸叔丁酯(結(jié)構(gòu)式IIa的化合物)的制備。向配置有PTFE包衣的磁性攪拌棒和pH電極(與自動滴定器連接,以根據(jù)需要經(jīng)飼管向燒瓶中pH控制地添加堿)的100mL三頸燒瓶中注入19mLpH7的lOOmM三乙醇胺(氯化物)緩沖液、8.68g葡萄糖、包含具有氨基酸序列SEQIDNO.316的工程酮還原酶的100mg酮還原酶4分末、40mg葡萄糖脫氫酶粉末、6mgNaNADP和最后12g6-氰基-(5R)-羥基-3-氧代己酸叔丁酯。在22。C下攪拌所述反應(yīng)混合物。自動滴定器通過添加4NNaOH使pH保持在6.9,對所述添加進(jìn)行連續(xù)記錄。在22小時(shí)后,消耗了8.9ml4NNaOH,并且通過實(shí)施例4的方法分析的樣品提取物顯示了>99%的轉(zhuǎn)化。將反應(yīng)混合物通過硅藻土過濾,并經(jīng)由硅藻土加入20mL乙酸乙酯。分離水相,并用20mL乙酸乙酯萃取。通過在真空下旋轉(zhuǎn)蒸發(fā)從合并的有機(jī)提取物中去除溶劑,以獲得9.80g粗6-氰基-(3R,5R)-二羥基己酸叔丁酯的油。此實(shí)施例示例了通過本發(fā)明方法使用工程酮還原酶制備和回收順式3,5-二輕基己酸酯。7.18實(shí)施例18:(6R)-氰甲基-2,2-二甲基-l,3-二噁烷-(4R)-乙酸叔丁酯(結(jié)構(gòu)式IVa的化合物)的制備。向于實(shí)施例17中獲得的9.80粗6-氰基-(3R,5R)-二羥基己酸叔丁酯加入26mL2,2-二曱氧基丙烷和260曱磺酸。在22。C下將所迷反應(yīng)混合物攪拌2小時(shí)。加入25mL5%(半飽和)碳酸氫鈉水溶液后,水相的pH為7.5。用52mL庚烷萃取混合物,并用25mL5%碳酸氫鈉水溶液萃取分離的有機(jī)相。通過在真空下旋轉(zhuǎn)蒸發(fā)從有機(jī)相中去除溶劑。在溫和加熱(45。C)下將殘留物溶于70mL庚烷,冷卻并在室溫下保持30分鐘,然后冷卻,保持在0。C以完成結(jié)晶。過濾和干燥獲得8.1g為微黃色固體的(6R)-氰甲基-2,2-二甲基-l,3-二噁烷-(4R)-乙酸叔丁酯。通過實(shí)施例6方法的分析顯示了97.8%(面積比)的純度并且無可檢測的(4S,6R)非對映體。此實(shí)施例示例了從通過本發(fā)明方法制備的順式3,5-二鞋基己酸酯來制備和回收受保護(hù)的順式二鞋基己酸酯。7.19實(shí)施例19:6-氰基-(3R,5R)-二羥基己酸叔丁酯的制備。向配置有PTFE包衣的磁性攪拌棒、添加漏斗和pH電極(與自動滴定器連接,以根據(jù)需要經(jīng)飼管向燒瓶中pH控制地添加堿)的加套3L三頸燒瓶注入6.36g三乙醇胺和427mL水。通過加入3,85g濃鹽酸將溶液的pH調(diào)整至6.9。加入195gD-葡萄糖、0.90g葡萄糖脫氫酶粉末、包含具有氨基酸序列SEQIDNO.316的工程酮還原酶的2.25g酮還原酶粉末以及0.135NaNADP。在22°C的攪拌并且自動滴定器準(zhǔn)備根據(jù)需要提供4NNaOH下,從添加漏斗中加入270g6-氰基-(5R)-羥基-3-氧代己酸叔丁酯。自動滴定器通過添加4NNaOH使pH保持在6.9,對所述添加進(jìn)行連續(xù)記錄。在22小時(shí)后,消耗196.7ml4NNaOH,并且通過實(shí)施例4的方法分析的樣品提取物顯示了>99%的轉(zhuǎn)化。加入450mL乙酸乙酯并將混合物通過硅藻土過濾。分離水相并用450mL乙酸乙酯萃取。通過在真空下旋轉(zhuǎn)蒸發(fā)從合并的有機(jī)提取物中去除溶劑,以獲得232g粗6-氰基-(3R,5R)-二羥基己酸叔丁酯的油。此實(shí)施例示例了通過本發(fā)明的方法使用工程酮還原酶更大規(guī)^^莫地制備和回收順式3,5-二羥基己酸酯。7.20實(shí)施例20:6-氰基-(5S)-羥基-3-氧代己酸叔丁酯的還原。根據(jù)與實(shí)施例3中所述的4-氰基-(3S)-羥基丁酸乙酯的R-對映體的制備類似的程序,由4-氰基-(3S)-羥基丁酸乙酯(98%e,e.)制備6-氰基-5-羥基-3-氧代己酸叔丁酯的S-對映體。向配置有PTFE包衣的磁性攪拌棒和pH電極(與自動滴定器連接,以根據(jù)需要經(jīng)飼管向容器中pH控制地添加堿)的25mL三頸容器中注入20mLpH7的100mM三乙醇胺(氯化物)緩沖液、1.80g葡萄糖、9mg葡萄糖脫氫酶粉末、包含具有氨基酸序列SEQIDNO.316的工程酮還原酶的30mg酮還原酶粉末、2.5mgNaNADP和最后3g6-氰基-(5S)-羥基-3-氧代己酸叔丁酯。在22。C下攪拌所述反應(yīng)混合物。自動滴定器通過添加4NNaOH使pH保持在7,對所述添加進(jìn)行連續(xù)記錄。反應(yīng)進(jìn)程通過堿的速率和累積添加以及對反應(yīng)混合物的定期耳又樣(用實(shí)施例4的方法進(jìn)行4是取和分析)來監(jiān)控。在38小時(shí)后,轉(zhuǎn)化為47%。用10mL乙酸乙酯萃取反應(yīng)物兩次。將合并的有機(jī)提取物通過硅藻土過濾,并通過在真空下旋轉(zhuǎn)蒸發(fā)去除溶劑以保留油。粗6-氰曱基-2,2-二甲基-l,3-二噁烷-4-乙S交叔丁酯從所述油(實(shí)施例7)中獲得并通過實(shí)施例6的方法來分析,顯示了95.3°/。d.e.的(4R,6S)非對映體,對應(yīng)于還原反應(yīng)的二醇產(chǎn)物的((3R,5S)非對映體。(注(4R,6S)非對映體具有與其(4S,6R)對映體相同的保留時(shí)間并且(4S,6S)非對映體具有與其(4R,6R)對映體相同的保留時(shí)間)。當(dāng)此實(shí)施例的工程酮還原酶用于還原6-氰基-5-羥基-3-氧代己酸叔丁酯的R對映體時(shí),它以基本上完全的非對映選擇性提供了順式(3R,5R)二醇(參見實(shí)施例13、14以及圖6和圖7)。此實(shí)施例示例了當(dāng)用于還原6-氰基_5-羥基-3-氧代己酸叔丁酯的5S-對映體時(shí),它還具有3R選擇性。7.21實(shí)施例21:6-氰基-5-羥基-3-氧代己酸叔丁酯的對映體的97%5R、3%5S混合物的還原(94%e.e.)。此程序與前述實(shí)施例相同,除了將2.91g6-氰基-(5R)-羥基-3-氧代己酸叔丁酯和0.09g6-氰基-(5S)-羥基-3-氧代己酸叔丁酯加入反應(yīng)。反應(yīng)在20小時(shí)時(shí)達(dá)到97%的轉(zhuǎn)化,此后如在前述實(shí)施例中所述回收產(chǎn)物油。粗(4,6)-6-氰曱基-2,2-二曱基-1,3-二噁烷-4-乙酸叔丁酯從所述油(實(shí)施例7)中獲得并通過實(shí)施例6的方法經(jīng)GC/MS來分析,顯示了99.73%的(4R,6R)非對映體(對應(yīng)于二醇的順式-(3R,5R)非對映體)和0.27。/。的(4R,6S)非對映體(對應(yīng)于二醇的(3R,5S)非對映體)的混合物(即99.46%d.e.)。與前述實(shí)施例組合,此實(shí)施例示例了對還原6-氰基-5-鞋基-3-氧代己酸叔丁酯的R-對映體比S-對映體具有立體特異性的工程酮還原酶。(3R,5)-二醇的5-位(和由其衍生的(4R,6)-二噁烷的6-位)的立體純度與5-羥基-3-氧代己酸酯底物的立體純度相比有了實(shí)質(zhì)性提升(99.46。/。d.e.對94%e.e.)。工程酮還原酶與少于十分之一的加入到反應(yīng)中的3%S-底物反應(yīng),而與基本上所有的97%R-底物反應(yīng)。因此,當(dāng)5-鞋基-3-氧代己酸酯底物具有較低立體純度時(shí),本公開內(nèi)容的工程酮還原酶可在順式-3,5-二羥基己酸酯產(chǎn)物中提供更高程度的立體純度。進(jìn)一步地,當(dāng)從3-羥基丁酸酯制備5-羥基-3-氧代己酸酯底物(如在實(shí)施例3中示例)時(shí),可從較低立體純度的3-幾基丁酸酯中凈獲得順式-3,5-二鞋基己酸酯產(chǎn)物的更高程度的立體純度。7.22實(shí)施例22:由本發(fā)明方法制備的6-氰基-(3R,5R)-二羥基己酸叔丁酯的非對映純度通過實(shí)施例17的方法制備粗6-氰基-(3R,5R)-二羥基己酸叔丁酯的油。將所述油樣品以1.0mg/mL用于水中的9%乙腈溶解,并通過實(shí)施例5的LC/MS/MS方法來分析。色譜圖以放大的刻度示于圖6(上欄)。沒有檢測出高于0.005%的6-氰基-(3R,5R)-二羥基己酸^i丁酯的非對映體。為了比較,6-氰基-(3R,5R)-二羥基己酸叔丁酯的溶液由得自商業(yè)來源(Aldrich目錄#53,901-5)的結(jié)晶(6R)-(2-氰乙基)-2,2-二甲基-l,3-二噁烷-(4R)-乙酸叔丁酯制備,所述結(jié)晶包含0.1。/。(4S,6R)非對映體(通過實(shí)施例6的方法來分析;參見實(shí)施例23)。將250mg商品化(6R)-(2-氰乙基)-2,2-二甲基-l,3-二噁烷-(4R)-乙酸叔丁酯懸浮于包含2001NHCl的2mL1:1甲醇水中。將所述混合物在室溫下攪拌16小時(shí)。加入500pL飽和的碳酸氫鈉水溶液和5mL乙酸乙酯。分離有機(jī)相并通過在真空下旋轉(zhuǎn)蒸發(fā)去除溶劑以得到187mg為微黃色油的6-氰基-(3R,5R)-二羥基-己酸叔丁酯。將這種油的樣品以1.0mg/mL用于水中的9%乙腈溶解并也通過實(shí)施例5的LC/MS/MS方法來分析。色語圖以放大的刻度示于圖6(下欄)。該色鐠圖顯示得自商品化(6R)-(2-氰乙基)-2,2-二曱基-l,3-二噁烷-(4R)-乙酸叔丁酯中0.P/。的(4S,6R)非對映體的6-氰基-3,5-二羥基己酸叔丁酯的0.1。/。(3S,5R)非對映體的峰。通過比較圖6的上色鐠圖和下色譜圖,此實(shí)施例示例了提供大致非對映體純的順式3,5-二幾基己酸酯化合物的本發(fā)明工藝。7.23實(shí)施例23:通過本發(fā)明方法制備的未結(jié)晶的(611)-(2-氰乙基)-2,2-二甲基-1,3-二噁烷-(4R)-乙酸叔丁酯的非對映純度。將由實(shí)施例3中〉99.9%e.e.的4-氰基-(3R)-羥基丁酸乙酯制備的粗6-氰基-(511)-羥基-3-氧代己酸叔丁酯轉(zhuǎn)化成(611)-(2-氰乙基)-2,2-二甲基-1,3-二噁烷-(4R)-乙酸叔丁酯,后者在結(jié)晶前通過GC/MS分析非對映純度。向配置有PTFE包衣的磁性攪拌棒和pH電極(與自動滴定器連接,以根據(jù)需要經(jīng)飼管向燒瓶中pH控制地添加堿)的100mL三頸燒瓶中注入18mLpH7.0的100mM三乙醇胺(氯化物)緩沖液、12g粗6-氰基-(5R)-羥基-3-氧代己酸叔丁酯和7.99g葡萄糖。將溶液的pH用0.26mL4NNaOH重新調(diào)整至7.0。加入包括含有具有氨基酸序列SEQIDNO.316的工程酮還原酶的200mg酮還原酶粉末、15mg葡萄糖脫氫酶粉末和5mgNaNADP的lmL相同緩沖液,并在22。C下攪拌所述反應(yīng)混合物。自動滴定器通過添加4NNaOH使pH保持在6.9,對所述添加進(jìn)行連續(xù)記錄。在4.6小時(shí)后加入另外15mg葡萄糖脫氫酶粉末和1g葡萄糖,并且在7小時(shí)后加入另外15mg葡萄糖脫氫酶粉末和1.5mgNaNADP??偣?2小時(shí)后,消耗了9.04ml4NNaOH,通過實(shí)施例4的方法分析的樣品提取物顯示了99.3%的轉(zhuǎn)化。將2.5g硅藻土加至反應(yīng)混合物中,然后用50mL乙酸乙酯萃取反應(yīng)混合物三次。通過在真空下旋轉(zhuǎn)蒸發(fā)從合并的有機(jī)提取物中去除溶劑以獲得10.40g粗6-氰基-(3R,5R)-二羥基己酸叔丁酯的油。向所述粗6-氰基-(3R,5R)-二羥基己酸叔丁酯加入22mL2,2-二曱氧基丙烷和100甲磺酸。在室溫下攪拌混合物2小時(shí)。在添加5mL飽和碳酸氫鈉水溶液后,水相的pH為8.0。用60mL己烷萃取所述混合物,并通過在真空下旋轉(zhuǎn)蒸發(fā)從提取物中去除溶劑以獲得包括(6R)-(2-氰乙基)-2,2-二甲基-1,3-二噁烷-(411)-乙酸叔丁酯的金色油。將所述油的樣品以5mg/mL溶解于乙酸乙酯,通過下述GC/MS方法對其進(jìn)行分析柱HP5MS(0.25mm內(nèi)徑,25jxmdf,30m)載氣氦,9.44psi,0.7mL/分鐘烘箱50°Cl分鐘,接著30。C/分鐘到220°C,然后在22(TC保持3分鐘保留時(shí)間(4S,6R)7,9分鐘;(4R,6R)8.0分鐘檢測單離子監(jiān)控,m/zl98。GC/MS分析顯示了(611)-(2-氰乙基)-2,2-二曱基-1,3-二噁烷-(411)-乙酸叔丁酯油是大致非對映體純的。為了比較,將商業(yè)上獲得的(Aldrich,目錄號53,901-5)樣品即結(jié)晶(6R)-(2-氰乙基)-2,2-二甲基-l,3-二噁烷-(4R)-乙酸叔丁酯以5mg/mL溶解于乙酸乙酯,并同樣地分析,顯示了0.10。/o的(4S,6R)非對映體。圖7顯示了所述油和所述結(jié)晶(611)-(2-氰乙基)-2,2-二甲基-1,3-二噁烷-(41^)-乙酸叔丁酯的重疊GC/MS色譜圖。然后將所述油溶解于17mL50。C的己烷,并將溶液冷卻至0。C以結(jié)晶。過濾和空氣千燥獲得98.7%(面積比)化學(xué)純度的8.1g結(jié)晶(6R)-(2-氰乙基)-2,2-二曱基-1,3-二噁烷-(4R》乙酸叔丁酯。此實(shí)施例示例了提供大致非對映體純的受保護(hù)的順式3,5-二羥基己酸酯化合物而不需任何非對映體純化(例如通過結(jié)晶)的本發(fā)明工藝。7.24實(shí)施例24:(6R)-(2-氨乙基)-2,2-二甲基-l,3-二噁烷-(4R)-乙酸叔丁酯(式V)的制備。使用美國專利第5,003,080號第49欄第16-43行中公開的方法將如在實(shí)施例18和23中制備的(6R)-(2-氰乙基)-2,2-二甲基-l,3-二噁烷-(4R)-乙酸叔丁酯轉(zhuǎn)化成標(biāo)題化合物,所述專利通過引用并入本文。具體地說,在50psi和40°C下在振蕩器中用0.5g蘭尼鎳#30和氫氣處理于100mL用氣態(tài)氨飽和的甲醇中的5.63g(0.048mol)(6R)-(2-氰乙基)-2,2-二曱基-l,3-二噁烷-(411)-乙酸叔丁酯的溶液。16小時(shí)后,薄層色譜法表明沒有起始腈存在。將懸浮液冷卻,通過助濾劑過濾并濃縮成油。此粗油通過石圭膠快速色i普法(用30:20:1(乙酸乙酯甲醇?xì)溲趸@)作為洗脫劑)純化以得到4.93g標(biāo)題化合物式V(98.2%(面積比))的(6R)-(2-氨乙基)-2,2-二甲基-l,3-二噁烷-(4R)-乙酸叔丁酯的澄清的油,其具有可接受的IR、NMR、C-NMR和MS譜。7.25實(shí)施例25:(6R)-[2[2-(氟苯基)-5-(-(l-曱基乙基)-3-苯基-4-[(苯氨基)羰基]-lH-吡咯-l-基]乙基]-2,2-二甲基-l,3-二噁烷-(4R)-乙酸叔丁酯(式VI)的制備。使用美國專利第5,003,080號第49欄第43-60行中公開的方法將如在實(shí)施例24中制備的(6R)-(2-氨乙基)-2,2-二曱基-l,3-二噁烷-(4R)-乙酸叔丁酯轉(zhuǎn)化成標(biāo)題化合物,所述專利通過引用并入本文。具體地說,將于50mL庚烷甲苯(9:1)中的1.36%(4.97mol)(6R)-(2-氨乙基)-2,2-二甲基-l,3-二噁烷-(4R)-乙酸叔丁酉旨(式IV)和1.60g(3.83mol)(士)-4-氟-a-[2-甲基-l-氧代丙基]卞氧代-N,P-二苯基苯丁酰胺(為[R-(R,,R,)]、[R-(R,,S,)]、[S-(R,,R,)]和[S-R,,S,)]異構(gòu)體的混合物)(式V)的溶液在回流下加熱24小時(shí)。將溶液輕微冷卻并加入15mL2-丙醇。使混合物冷卻至25。C并過濾以得到1.86標(biāo)題化合物式VI的(6R)-[2[2-(氟苯基)-5-(-(l-甲基乙基)-3-苯基-4-[(苯氨基)羰基卜lH-吡咯-l-基]乙基]-2,2-二甲基-l,3-二噁烷-(4R)-乙酸叔丁酯的黃色固體,其具有可接受的NMR光譜。7.26實(shí)施例26:(2R-反式)-5-(4-氟苯基)-2-(l-曱基乙基)-N,4-二苯基-1-[2-(四氫-4-羥基-6-氧代-2H-吡喃-2-基)乙基]-1&吡咯-3-曱酰胺(也稱為阿托伐他汀內(nèi)酯)(式VII)的制備。使用美國專利第5,003,080號第50欄第4-30行中公開的方法將如在實(shí)施例25中制備的(6RH2[2-(氟苯基)-5-(-(l-甲基乙基)-3-苯基-4-[(苯氨基)-羰基]-lH-吡咯-l-基]乙基]-2,2-二甲基-l,3-二噁烷-(4R)-乙酸叔丁酯轉(zhuǎn)化成標(biāo)題化合物,所述專利通過引用并入本文。具體地說,將4.37g(6.68mol)的(6RH2[2-(氟苯基)-5-(-(l-甲基乙基)-3-苯基-4-[(笨氨基)羰基]-lH-p比咯-l-基]乙基]-2,2-二甲基-l,3-二噁烷-(4R)-乙酸叔丁酯溶解于200mL四氫呋喃并加入15mL10%鹽酸溶液,將溶液攪拌15小時(shí)。向此溶液中加入氫氧化鈉(3.6g)并將混合物攪拌30小時(shí)。通過添加150mL水、90mL己烷并分離層來終止反應(yīng)。用稀鹽酸溶液酸化水層,攪拌3小時(shí)并用150mL乙酸乙酯萃取。將i滴濃鹽酸加至乙酸乙酯溶液中并使溶液靜置18小時(shí)。真空濃縮所迷溶液,將濃縮液再'溶解于50mL乙酸乙酯中并用1滴濃鹽酸處理。將溶液攪拌2小時(shí),真空濃縮并溶解于3.0mL甲苯中。分兩批分離標(biāo)題化合物,即式VII的(2R-反式-5-(4-氟苯基)-2-(l-曱基-乙基)-N,4-二苯基-1-[2-(四氫-4-羥基-6-氧代-211-吡喃-2-基)乙基-111-吡咯-3-甲酰胺(3.01g),其也稱為阿托伐他汀內(nèi)酯。7.27實(shí)施例27:式VITI的[R-(R、R"]-2-(4-氟苯基H3-5-二羥基-5-(卜甲基乙基)-3-苯基-4-[(苯M)羰基]-lH-吡咯-l-庚酸鈣鹽(2:l)的制備。使用1999年10月19日公布的標(biāo)題為"Crystalline[R-(R*,R*)]-2-(4-fluorophenyl)-|3,S-dihydroxy-5-(l-methylethyl)-3-phenyl-4-[(phenylamino)carbonyl]-lH-pyrrole-1-heptanoicacidhemicalciumsalt(atorvastatin)"(結(jié)晶[R-(R氣R"]-2-(4-氟苯基)-P,S-二羥基-5-(l-甲基乙基)-3-苯基-4-[(苯氨基)羰基]-lH-吡咯-l-庚酸半鈣鹽(阿托伐他汀))的美國專利5,969,156的實(shí)施例1A或IB中公開的方法將如在實(shí)施例26中制備的(2R-反式)-5-(4-氟苯基)-2-(1-曱基乙基)-N,4-二苯基-l-[2-(四氫-4-羥基-6-氧代-2H-吡喃-2-基)乙基]-lH-吡咯-3-甲酰胺轉(zhuǎn)化成式vm的標(biāo)題化合物,所述專利的實(shí)施例通過引用并入本文。標(biāo)題化合物以通用名稱阿托伐他汀半鈣鹽和商標(biāo)名稱LIPITOI^而眾所周知。從實(shí)施例31的內(nèi)酯制備所述鈣鹽在美國專利5,273,995的實(shí)施例10中公開,所述專利通過引用并入本文。i.鈉鹽具體地說,將來自實(shí)施例20的1摩爾內(nèi)酯(540.6g)溶解于5L甲醇中。溶解后,加入1LH20。在攪拌的同時(shí),加入0.98當(dāng)量NaOH并且通過HPLC進(jìn)行反應(yīng)直到剩余2%或更少的二醇酸的內(nèi)酯和甲酯。不使用過量的NaOH,因?yàn)樵陔S后的步驟中添加CaCl2時(shí)可形成Ca(OH)2。水解內(nèi)酯,即可形成[R-(R、R"]-2-(4-氟苯基)-卩-5-二羥基-5-(l-甲基乙基)-3-苯基-4-[(苯氨基)羰基]-lH-吡咯-l-庚酸鈉鹽(阿托伐他汀鈉鹽)。ii.鈣鹽在水解完成后,加入10LH20,然后用EtOAc/己烷的1:1混合物洗滌至少兩次。每次洗滌應(yīng)包含10L各自的EtOAc/己烷。如果鈉鹽是純的,則加入15L甲醇。如果它不純和/或含有顏色,則加入100gG-60活性炭,攪拌2小時(shí),通過supercel過濾,然后用15LMeOH洗滌。通過HPLC對反應(yīng)混合物進(jìn)行重量/體積%以確定甲醇水溶液中阿托伐他汀鈉鹽的精確量。將1當(dāng)量或略過量的CaCl2'2H20(73.5g)溶解于20LH20中。將CaCl2溶液和所述甲醇水溶液都加熱至60°C。在強(qiáng)烈攪拌下將CaCl2溶液緩慢地加至60。C阿托伐他汀鈉鹽的曱醇水溶液。在添加結(jié)束后,將混合物緩慢冷卻至15。C并過濾沉淀的式Vin的鈣鹽。用5LH20洗滌濾餅。在真空烘箱中于5(TC下千燥。得自干燥濾餅的鈣鹽可通過溶解于4LEtOAc(50。C)而再結(jié)晶,通過Supercel⑧過濾,用1LEtOAc(50。C)洗滌濾液,然后將3L非極性溶劑如己烷加至50。CEtOAc溶液中。然后將所得的式VIII晶體空氣千燥或加熱千燥。7.28實(shí)施例28:酮還原酶的制備;發(fā)酵程序。在15L充氣式攪拌發(fā)酵罐中,將包含0.88g/L硫酸銨、0.98g/L檸檬酸鈉;12.5g/L三水磷酸氫二鉀、6.25g/L磷酸二氬鉀、6.2g/LTastone-154酵母提取物、0.083g/L檸檬酸鐵銨以及8.3ml/L痕量元素溶液(含有2g/L二水氯化鈣、2.2g/L七水石克S吏鋅、0.5g/L—水石克酸錳、lg/L七水碌u酸亞銅、0.1g/L四水鉬酸銨和0.02g/L十水四硼酸鈉)的6.0L生長培養(yǎng)基加熱至3(TC的溫度。向所述發(fā)酵罐接種大腸桿菌W3110(包含具有所感興趣的酮還原酶基因的質(zhì)粒)的指數(shù)末期培養(yǎng)物,其如實(shí)施例3中所述在搖瓶中生長到0.5至2.0的起始OD600。以500-1500rpm攪動發(fā)酵罐,并且以1.0-15.0L/分鐘向所述發(fā)酵容器提供空氣以保持30%飽和或更多的溶氧水平。通過添加20%v/v氬氧化銨將培養(yǎng)物的pH控制在7.0。通過添加包含500g/L工業(yè)葡萄糖、12g/L氯化銨和10.4g/L七水硫酸鎂的料液(feedsolution)維持培養(yǎng)物的生長。在培養(yǎng)物達(dá)到50的OD,后,通過添加異丙基-b-D-硫代半乳糖苷(IPTG)到1mM的終濃度來誘導(dǎo)酮還原酶的表達(dá)。使培養(yǎng)物生長另外的14小時(shí)。然后將培養(yǎng)物冷卻至4。C并保持在4。C直到收集。通過在SorvalRC12BP離心才幾中于4。C下以5000G離心40分鐘收集細(xì)胞。收集的細(xì)胞直接用于下述下游回收工藝或在4。C下貯藏直到這種使用。在4°C下將細(xì)胞沉淀物重懸于2倍體積pH6.8的100mM三乙醇胺(氯化物)緩沖液(每體積的濕細(xì)胞糊狀物(wetcellpaste))。通過使用12000psig的壓力將懸浮液通過設(shè)有二級勻裝閥部件(assembly)的勻漿器,從細(xì)胞中釋放細(xì)胞內(nèi)酮還原酶。破裂后立即將細(xì)胞勻漿物冷卻至4°C。向溶解產(chǎn)物中加入pH7.2的10%w/v聚乙烯亞胺溶液至0.5%w/v的終濃度,并攪拌30分鐘。所得的懸浮液通過在標(biāo)準(zhǔn)的實(shí)驗(yàn)室離心機(jī)中以5000G離心30分鐘而澄清。潷出澄清的上清液并使用截留分子量為30Kd的纖維素超濾膜濃縮10倍。將終濃縮物分散于淺器皿中,在-2CTC下冷凍,并且凍干成粉末。酮還原酶粉末在-8(TC下]l!i藏。此實(shí)施例示例了通過可調(diào)整至實(shí)用規(guī)模的程序(practicalscaleableprocedure)制備酮還原酶粉末。本申請中引用的所有出版物、專利、專利申請和其他文獻(xiàn)為了所有目的特此通過引用以其整體并入,達(dá)到如同單獨(dú)地表明每一個單獨(dú)的出版物、專利、專利申請或其他文獻(xiàn)為了所有目的通過引用并入的相同程度。盡管已經(jīng)示例并描述了各種特定實(shí)施方案,但是應(yīng)理解,可作出各種改變而不偏離本發(fā)明的精神和范圍。權(quán)利要求1.一種酮還原酶,其源于釀酒酵母的野生型酮還原酶,能立體選擇地還原5-羥基-3-氧代己酸酯的3-氧代基團(tuán)以產(chǎn)生對應(yīng)的順式3,5-二羥基己酸酯,所述酮還原酶與SEQIDNO2的野生型酮還原酶相比具有改進(jìn)的性質(zhì)。2.根據(jù)權(quán)利要求1所述的酮還原酶,其中所述改進(jìn)的性質(zhì)是比酮還原酶活性增加。3.根據(jù)權(quán)利要求2所述的酮還原酶,其具有的比酮還原酶活性比野生型酮還原酶的比酮還原酶活性大至少約1.5-300倍。4.根據(jù)權(quán)利要求1所述的酮還原酶,其中所述改進(jìn)的性質(zhì)是熱穩(wěn)定性增加。5.根據(jù)權(quán)利要求1所述的酮還原酶,其與SEQIDNO:2相比在第63位包括芳香族氨基酸。6.根據(jù)權(quán)利要求5所述的酮還原酶,其中所迷芳香族氨基酸是色氨酸。7.根據(jù)權(quán)利要求1所述的酮還原酶,其包括與SEQIDNO:2具有至少約95%同一性的氨基酸序列。8.根據(jù)權(quán)利要求1所述的酮還原酶,其包括下述氨基酸序列(a)與SEQIDNO:2具有至少90。/。同一性,且(b)具有下述特征中的一個或多個X6是極性或酸性氨基酸殘基;X27是脂肪族或堿性氨基酸殘基;X31是包含羥基的或脂肪族氨基酸殘基;X^是小氨基酸殘基;X"是堿性氨基酸殘基;X63是疏水性或芳香族氨基酸殘基;x65是包含羥基的或小氨基酸殘基;X86是脂肪族或疏水性氨基酸殘基;X125是脂肪族或芳香族氨基酸殘基;X^是堿性氨基酸殘基;X16()是包含羥基的或小氨基酸殘基;X165是極性或酸性氨基酸殘基;X194是芳香族氨基酸或極性親水性氨基酸殘基;X214是極性親水性氨基酸殘基;X,是包含羥基的氨基酸殘基;X234是極性親水性氨基酸殘基;X,是脂肪族氨基酸殘基;X,是堿性氨基酸殘基;X263是酸性或極性氨基酸殘基;X,是酸性氨基酸殘基;X296是脂肪族氨基酸殘基;X,是芳香族氨基酸殘基;X301是脂肪族或包含羥基的或酸性或親水性或堿性氨基酸殘基;且X,是芳香族、極性或包含羥基的氨基酸殘基。9.根據(jù)權(quán)利要求8所述的酮還原酶,其中X"是芳香族氨基酸殘基。10.根據(jù)權(quán)利要求8所述的酮還原酶,其包括選自以下的一種或多種突變X6是E;X"是A或K;X31是S或P;X"是V;X48是H;X"是W;X"是G或S;X秘是I;f是L;X,R;X湖是T或S;X,E;X,是C;X^是R或H;X,是T;X"4是Q;X旭是I;X,是R;X26lE;X,是V;X預(yù)是I;X,是F或W;X則是R、K、A、V、S、T、Y、D、E、P或Q;且X,是H、N或S。11.根據(jù)權(quán)利要求1所述的酮還原酶,其包括選自以下的一種或多種突變X"是P;X"是D;X4lL;X"是V;X56是V;X,T;X"是V;X7lM;X朋是S;X嵐是I;f是G;XW是I或M;X,R;X雨是T;X"8是H;X,是S;,是E;X^是R或H;X223是R或G;X23lQ;X"7是N、G或Q;X,是T;X"3是A;和XW是E。12.根據(jù)權(quán)利要求11所述的酮還原酶,其包括選自以下的一種或多種突變X"是D;X恥是L;X"是V;X"是V;X63是V;X7lM;X皿是S;X,I;X,G;xm是I或M;X,R;X,T;X223是R或G;X,是Q;X"7是N、G、R或Q;X,是T;且X253是A。13.根據(jù)權(quán)利要求1所述的酮還原酶,其具有選自以下的氨基酸序列:<formula>formulaseeoriginaldocumentpage0</formula><formula>formulaseeoriginaldocumentpage7</formula>14.一種多核苷酸,其包括編碼根據(jù)權(quán)利要求1所述的酮還原酶的序列,或在高嚴(yán)格條件下與編碼根據(jù)權(quán)利要求1所述的酮還原酶的序列雜交的序列。15.根據(jù)權(quán)利要求14所迷的多核苷酸,其選自SEQIDNO:15、17、<formula>formulaseeoriginaldocumentpage7</formula>。16.—種表達(dá)系統(tǒng),其包括與適于在宿主細(xì)胞中指導(dǎo)表達(dá)的控制序列可操作地連接的權(quán)利要求14所述的多核芬酸。17.—種宿主細(xì)胞,其包括權(quán)利要求16所述的表達(dá)系統(tǒng)。18.根據(jù)權(quán)利要求17所述的宿主細(xì)胞,其為大腸桿菌。19.根據(jù)權(quán)利要求17所述的宿主細(xì)胞,其中所述表達(dá)載體所包含的密碼子已4t優(yōu)化以在所述宿主細(xì)胞中表達(dá)。20.—種用于制備根據(jù)式(IIa)的順式3,5-二羥基己酸酯化合物的工藝<formula>formulaseeoriginaldocumentpage8</formula>其中X選自囟素、氰基和-OR6,其中W是氫或保護(hù)基團(tuán),且W選自(Cl-C12)烴基、(C6-C10)芳基和(C7-C12)芳基烴基,所述工藝包括立體選擇地還原根據(jù)結(jié)構(gòu)式(Ia)的5-羥基-3-氧代己酸酯化合物的對映體<formula>formulaseeoriginaldocumentpage8</formula>其中X和R1如對結(jié)構(gòu)式(IIa)所定義;所述工藝在適合的條件下使用根據(jù)權(quán)利要求1所述的酮還原酶以將3-氧代基團(tuán)還原為3-羥基基團(tuán)。21.根據(jù)權(quán)利要求20所述的工藝,其進(jìn)一步包括從反應(yīng)混合物回收根據(jù)結(jié)構(gòu)式(IIa)的3,5-二羥基己酸酯化合物。22.根據(jù)權(quán)利要求20所述的工藝,其中所述5-羥基-3-氧代己酸酯化合物是以結(jié)構(gòu)式(Ia)的對映體大致純的。23.根據(jù)權(quán)利要求20所述的工藝,其用表達(dá)所述酮還原酶的全細(xì)胞或者用所述細(xì)胞的提取物或溶解產(chǎn)物進(jìn)行。24.根據(jù)權(quán)利要求20所述的工藝,其中所述酮還原酶是分離的和/或純化的,并且所述對映選擇性還原反應(yīng)在所述酮還原酶的輔因子和任選地所述輔因子的再生系統(tǒng)的存在下進(jìn)行。25.根據(jù)權(quán)利要求20所述的工藝,其在約15。C至約75。C范圍的溫度下進(jìn)行。26.根據(jù)權(quán)利要求20所述的工藝,其在約pH5至pH8范圍的pH下進(jìn)行。27.根據(jù)權(quán)利要求20所述的工藝,其中結(jié)構(gòu)式(Ia)所述的5-羥基-3-氧代己酸酯化合物與所述酮還原酶的重量比在約10:1至200:1的范圍內(nèi)。28.根據(jù)權(quán)利要求20所述的工藝,其中X選自氯、氰基和羥基,且其中W是低級烷基或叔丁基。29.根據(jù)權(quán)利要求20所述的工藝,其在輔因子和任選地輔因子再生系統(tǒng)的存在下進(jìn)行。30.根據(jù)權(quán)利要求29所述的工藝,其中所述輔因子是NADH和/或NADPH,且其中所述輔因子與所述酮還原酶的重量比在約10:1至100:1的范圍內(nèi)。31.根據(jù)權(quán)利要求29所述的工藝,其中所述輔因子再生系統(tǒng)包括葡萄糖脫氬酶和葡萄糖;甲酸脫氫酶和甲酸;或異丙醇和仲醇脫氫酶。32.根據(jù)權(quán)利要求31所述的工藝,其中所述仲醇脫氫酶是所述酮還原酶。33.根據(jù)權(quán)利要求20所述的工藝,其中所述3,5-二羥基己酸酯化合物的制品是以順式非對映體大致純的。34.—種順式3,5-二羥基己酸酯化合物,其由權(quán)利要求20所述的工藝制備。35.—種反應(yīng)混合物,其包括根據(jù)權(quán)利要求1所述的酮還原酶、所述酮還原酶的輔因子和根據(jù)結(jié)構(gòu)式(Ia)的底物<formula>formulaseeoriginaldocumentpage9</formula>其中X選自鹵素、氰基和-OR6,其中W是氫或保護(hù)基團(tuán),且Rt選自(Cl-C12)烴基、(C6-C10)芳基和(C7-C12)芳基烴基。36.—種反應(yīng)混合物,其包括根據(jù)權(quán)利要求1所述的酮還原酶、所述酮還原酶的輔因子和根據(jù)結(jié)構(gòu)式(IIa)的底物OHOHO(Ha)X^k^A0Rl其中X選自卣素、氰基和-OR、其中RS是氫或保護(hù)基團(tuán),且I^選自(Cl-C12)烴基、(C6-C10)芳基和(C7-C12)芳基烴基。37.根據(jù)權(quán)利要求35或36所述的混合物,其中結(jié)構(gòu)式(Ia)或(IIa)所迷的5-羥基-3-氧代己酸酯化合物與所述酮還原酶的重量比在約10:1至200:1的范圍內(nèi)。38.根據(jù)權(quán)利要求35或36所述的混合物,其中X選自氯、氰基和羥基,且其中W是低級烷基或叔丁基。39.根據(jù)權(quán)利要求35或36所述的混合物,其中所述輔因子是NADH和/或NADPH,且其中所述輔因子與所述酮還原酶的重量比在約10:l至100:1的范圍內(nèi)。40.根據(jù)權(quán)利要求35或36所述的混合物,其進(jìn)一步包括輔因子再生系統(tǒng)。41.根據(jù)權(quán)利要求40所述的混合物,其中所述輔因子再生系統(tǒng)包括葡萄糖脫氫酶和葡萄糖;曱酸脫氫酶和曱酸;或異丙醇和仲醇脫氫酶。42.根據(jù)權(quán)利要求41所述的混合物,其中所述仲醇脫氫酶是所述酮還原酶。43.—種合成他汀類化合物的方法,其包括對映選擇性還原根據(jù)結(jié)構(gòu)式(Ia)的化合物以產(chǎn)生根據(jù)結(jié)構(gòu)式(IIa)的化合物作為一個步驟,改進(jìn)包括用根據(jù)權(quán)利要求1所述的酮還原酶進(jìn)行化合物(Ia)至化合物(IIa)的對映選擇性還原;其中結(jié)構(gòu)式(Ia)是OHOOda)X^AA^其中X選自卣素、氰基和-OR6,其中R"是氫或保護(hù)基團(tuán),且W選自(Cl-C12)烴基、(C6-C10)芳基和(C7-C12)芳基烴基;且其中結(jié)構(gòu)式(IIa)是<formula>formulaseeoriginaldocumentpage11</formula>其中X和R1如對結(jié)構(gòu)式(Ia)所定義。44.根據(jù)權(quán)利要求43所述的方法,其中所述他汀類選自阿托伐他汀、羅蘇伐他汀和匹伐他汀。45.—種用于制備根據(jù)結(jié)構(gòu)式(IIIa)的受保護(hù)的順式3,5-二羥基-3-氧代己酸酯化合物的工藝<formula>formulaseeoriginaldocumentpage11</formula>其中X選自鹵素、氰基和-OR6,其中W是氫或保護(hù)基團(tuán);W選自(C1-C12)烴基、(C6-C10)芳基和(C7-C12)芳基烴基;且每個f都是保護(hù)基團(tuán),或可選地,所述W基團(tuán)可一起形成式《113尺4-的亞烴基橋或-:6115-的硼酸酯,其中W和W各自彼此獨(dú)立地選自氫、(Cl-C12)烴基、(C6-C10)芳基和(C7-C12)芳基烴基,或可選地,R3與R4—起形成(C4-C10)環(huán)烴基或雜環(huán)烴基,且R5選自(C1-C12)烴基、(C6-C10)芳基和(C7-C12)芳基烴基,所述工藝包括如下步驟(i)立體選擇性還原結(jié)構(gòu)式(Ia)的5-羥基-3-氧代己酸酯對映體;其中結(jié)構(gòu)式(Ia)是<formula>formulaseeoriginaldocumentpage11</formula>其中X選自卣素、氰基和-OR6,其中116是氫或保護(hù)基團(tuán),且W選自(Cl-C12)烴基、(C6-C10)芳基和(C7-C12)芳基烴基;使用根據(jù)權(quán)利要求1所述的酮還原酶在合適的條件下將3-氧代基團(tuán)還原為3-羥基基團(tuán),以產(chǎn)生包括根據(jù)結(jié)構(gòu)式(IIa)的順式3,5-二羥基己酸酯化合物的第一反應(yīng)產(chǎn)物;其中結(jié)構(gòu)式(IIa)是<formula>formulaseeoriginaldocumentpage12</formula>其中X和R1如對結(jié)構(gòu)式(Ia)所定義;以及(ii)保護(hù)所述順式3,5-二羥基己酸酯化合物的羥基基團(tuán)以產(chǎn)生包括根據(jù)結(jié)構(gòu)式(IIIa)的受保護(hù)的順式3,5-二羥基-3-氧代己酸酯化合物的第二反應(yīng)產(chǎn)物。46.根據(jù)權(quán)利要求45所述的工藝,其中113和]^4各為甲基。47.根據(jù)權(quán)利要求45所述的工藝,其中X選自氯、氰基和羥基。48.根據(jù)權(quán)利要求45所述的工藝,其中W是低級烷基。49.根據(jù)權(quán)利要求48所述的工藝,其中W是叔丁基。50.根據(jù)權(quán)利要求47所述的工藝,其中X是氯。51.根據(jù)權(quán)利要求47所述的工藝,其中X是氰基。52.根據(jù)權(quán)利要求47所述的工藝,其中x是羥基。53.一種受保護(hù)的順式3,5-二羥基-3-氧代己酸酯化合物,其由權(quán)利要求45所述的方法制備。全文摘要本發(fā)明提供了與天然存在的野生型酮還原酶相比具有改進(jìn)性質(zhì)的酮還原酶。還提供了編碼工程酮還原酶的多核苷酸、能表達(dá)所述工程酮還原酶的宿主細(xì)胞、使用所述工程酮還原酶合成多種手性純的化合物的方法以及由所述方法制備的手性純的化合物。文檔編號C12N9/00GK101528917SQ200780036841公開日2009年9月9日申請日期2007年10月1日優(yōu)先權(quán)日2006年10月2日發(fā)明者利薩·瑪麗·紐曼,史提芬尼·J·珍妮,吉伽特·W·哈思曼,軍朱,洛林·瓊吉爾,約翰·H·格瑞特,艾米麗·穆德弗,詹姆士·拉倫德,貝娜·貝洛茨安申請人:科德克希思公司