專利名稱::磷脂酶、編碼它們的核酸及其制備和應(yīng)用方法
技術(shù)領(lǐng)域:
:0002總體上說,本發(fā)明涉及磷脂酶、編碼磷脂酶的多核苷酸、制備以及使用這些多核苷酸和多肽的方法。特別地,本發(fā)明提供了具有磷脂酶活性的新穎多肽、編碼它們的核酸以及與它們結(jié)合的抗體。也提供了包括應(yīng)用這些磷脂酶的工業(yè)方法和產(chǎn)
背景技術(shù):
:0003磷脂酶是水解磷脂中的酯鍵的酶。與它們在磷脂代謝中的重要性相對應(yīng),這些酶廣泛存在于真核和原核細(xì)胞中。磷脂酶影響生物膜的代謝、形成和再組織,并且磷脂酶也參與信號的級聯(lián)作用。已經(jīng)知道了幾種類型的磷脂酶,按照磷脂分子中受到攻擊的鍵的位置,它們在特異性上有所不同。磷脂酶A1(PLA1)除去l-位的脂肪酸,產(chǎn)生游離的脂肪酸和l-溶血-2-?;字?l-lyso-2-acylphospholipid)。磷脂酶A2(PLA2)去除2-位的脂肪酸,產(chǎn)生游離的脂肪酸和l-?;?2-溶血磷脂(l-acyl-2-lysophospholipid)。PLA1和PLA2酶可以是胞內(nèi)酶或胞外酶,是膜結(jié)合的酶或者可溶性酶。發(fā)現(xiàn)胞內(nèi)的PLA2存在于幾乎所有的哺乳動物細(xì)胞中。磷脂酶C(PLC)去除磷酸部分,產(chǎn)生1,2二?;视秃土姿狨ァA字窪(PLD)產(chǎn)生1,2-二?;视土姿岷蛪A性基團(basegroup)。PLC和PLD對于細(xì)胞功能和信號傳導(dǎo)是重要的。PLD是生物催化中主要的磷脂酶(參見,如,Godfrey,T.禾BWestS.(1996)Industrialenzymology,299-300,StocktonPress,NewYork)。馬鈴薯塊莖儲藏蛋白(Patatins)是另一類磷脂酶,據(jù)認(rèn)為其作用如同PLA(參見例如,HirschbergHJ,等,(2001),EurJBiochem268(19):5037-44)。0004常見的含油種子,如大豆、油菜籽、向日葵籽、米糠油、芝麻和花生被用作油的來源和原料。在搾油過程中,種子被機械和熱處理。用溶劑從粗粉(meal)中分離和分開油。然后應(yīng)用蒸餾法,從油中分離出溶劑并回收。油經(jīng)過"脫膠(degummed)"并且進行精煉。粗粉中的溶劑組分可以通過"脫溶劑烤爐(desolventizertoaster)"的熱處理而蒸發(fā)掉,隨后,粗粉干燥和冷卻。當(dāng)溶劑通過蒸餾分離掉以后,產(chǎn)生的粗油利用特殊的脫膠程序和物理精煉的方法加工成為食用油。它也可以作為原料用于產(chǎn)生脂肪酸和甲基酯。粗粉可以用做動物飼料(animalrations)。0005脫膠是植物油精煉的第一步,脫膠的目的是去除與油一起被抽提、但干擾隨后的油加工的污染磷脂。這些磷脂僅僅以無水形式溶于植物油中,如果簡單地被水合,磷脂可以被沉淀并去除。水合作用一般通過小比例的水與充分干燥的油連續(xù)混合來完成。典型地,水的量是磷脂含量的75%,磷脂的量典型地是1至lj1.5%。雖然在5(TC到80'C的范圍內(nèi),油的粘度降低,水合膠的分離效果更好,但是溫度條件并不非常嚴(yán)格。0006很多油脫膠(oildegumming)的方法目前都在使用。油脫膠的過程可以通過使用磷脂酶酶法協(xié)助進行。磷脂酶Al和A2已經(jīng)在各種商業(yè)方法中用于油脫膠,如"ENZYMAXTM脫膠"(LurgiLifeScienceTechnologiesGmbH,Germany)。也已經(jīng)考慮將磷脂酶C(PLC)應(yīng)用于油的脫膠作用,因為磷脂酶C在磷脂上作用產(chǎn)生的磷酸鹽部分是極易溶于水的,并且容易去除,而且甘油二酯會與油在一起,降低了損失;參見,如Godfrey,T.禾卩WestS.(1996)IndustrialEnzymology第299-300頁,StocktonPress,NewYork;Dahlke(1998)"Anenzymaticprocessforthephysicalrefiningofseedoils,"Chem.Eng.Technol.21:278-281;Clausen(2001)"Enzymaticoildeg腿mingbyanovelmicrobialphospholipase,"Eur.J.LipidSci.Technol.103:333-340。0007高磷脂油,例如黃豆、油菜和向日葵油的處理方法不同于別的油如棕櫚的處理方法。不像低磷脂油的蒸氣或"物理精煉"處理,這些高磷油需要特別的化學(xué)和機械處理,以去除含磷的磷脂。這些油一般在這樣的過程中化學(xué)精煉,該過程必需中和游離脂肪酸,以形成皂和不溶性的膠成分。中和過程對于去除游離脂肪酸和磷脂非常有效,但是該過程也導(dǎo)致產(chǎn)率和質(zhì)量顯著降低。在一些情況下,高磷脂的粗制油在堿中和之前的步驟中進行脫膠。用于卵磷脂的大豆油就是這種情況,其中的油首先用水或者酸來脫膠。0008植物固醇(phytosterols)(植物甾醇(plantsterols))是天然產(chǎn)物三萜家族的成員,其包括100種以上不同的植物固醇和4000種以上其它種類的三萜。一般而言,據(jù)認(rèn)為,植物甾醇是由于甾醇/磷脂配給量增加導(dǎo)致膜硬化,從而穩(wěn)定植物膜。在化學(xué)上,植物甾醇在結(jié)構(gòu)上非常類似于膽固醇,并被認(rèn)為調(diào)節(jié)植物膜的膜流動性,如膽固醇在動物膜中所做的那樣。主要的植物甾醇是P-谷甾醇、菜油甾醇和豆留醇。其它的植物甾醇包括豆甾烯醇(二氫(3-谷甾醇)、二氫谷甾醇、24-脫氫膽固醇、二氫菜油甾醇、海綿甾醇(chalinasterol)、多孔甾醇、,谷甾醇和菜籽甾醇。0009植物留醇是健康和營養(yǎng)行業(yè)中的重要的農(nóng)產(chǎn)品。它們是用于制造化妝品的有用乳化劑并且為激素藥物的生產(chǎn)提供大多數(shù)甾體中間體和前體。植物甾醇的飽和類似物以及它們的酯己經(jīng)被認(rèn)為是益于心血管健康的有效的降低膽固醇的試劑。植物甾醇通過在腸腔中抑制膽固醇的吸收來降低血清膽固醇水平,并且植物甾醇在極低的濃度時便具有免疫調(diào)節(jié)特性,包括T淋巴細(xì)胞的增強的細(xì)胞應(yīng)答和抗癌細(xì)胞系的天然殺傷細(xì)胞的細(xì)胞毒性能力。此外,它們的治療效應(yīng)已在治療肺結(jié)核、風(fēng)濕性關(guān)節(jié)炎、控制HIV感染的病人和抑制馬拉松選手的免疫壓力的臨床研究中已經(jīng)得到證明。0010植物甾醇的酯類,也指植物甾醇酯,由美國食品藥品管理局(FDA)批準(zhǔn)為GRAS(—般認(rèn)為安全,GenerallyRecognizedAsSafe),用于人造黃油,并在1999年得到推廣。2000年9月,F(xiàn)DA也提出一個試行規(guī)定,該規(guī)定準(zhǔn)許了含有植物甾醇酯類的食品使用健康聲明標(biāo)記(hea他-claiminglabeling)。因此,用植物甾醇酯類強化的食品非常有望受到消費者的青睞。0011大豆油被廣泛使用,是重要的糧食,占來自種子和水果的油產(chǎn)量的約30%。大豆僅含有20%的油,在商業(yè)規(guī)模上通常通過使用溶劑諸如己垸來提取。其油公認(rèn)的質(zhì)量和粗粉蛋白的營養(yǎng)價值使得大豆成為首要的含油種子。在提取之前,大豆必需清洗,破碎并去皮,這是因為對油來說有效的溶劑提取需要破碎每一個油細(xì)胞以提高物質(zhì)轉(zhuǎn)移水平。細(xì)胞壁主要由纖維素——其與半纖維素相關(guān)、果膠物質(zhì)和木質(zhì)素組成,細(xì)胞壁也可以用酶破碎,以顯著提高提取產(chǎn)量和速度。0012二酰甘油(DAG)油是食用油,比天然脂肪酸含有80%或更多的DAG。已經(jīng)顯示,在人中,消化DAG油乳劑之后,相比具有類似的脂肪酸組成的TAG油,餐后乳糜微粒中的甘油三脂的升高水平明顯較低。在以日本男子和美國男子和女子為對象的研究中,長期食用DAG油促進體重減輕和身體脂肪減少。一項研究顯示,用DAG油取代普通的烹飪油降低肥胖和其它危險因素的發(fā)生率。發(fā)明概述0013本發(fā)明提供包括與具有一個或多個編碼E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突變的SEQIDNO:177或SEQIDNO:178在至少大約10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850或者更多個的殘基范圍內(nèi)具有至少大約50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77Q/o、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或者更多的或者完全的(100%)序列同一性的核酸序列的分離的、合成的或者重組的核酸,在一個方面所述核酸編碼具有磷脂酶(PL)活性的至少一種多肽,所述磷脂酶活性例如磷脂酶A(PLA)、磷脂酶C(PLC)或磷脂酶D(PLD)活性,或磷脂酶活性的任何組合,例如PLA、PLC和/或PLD活性——作為多功能活性。一方面,所述序列同一性通過用序列比較算法分析或者通過目測檢查來確定。0014本發(fā)明提供包括與具有一個或多個編碼E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突變的SEQIDNO:177或SEQIDNO:178在至少大約10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850更多個連續(xù)殘基范圍內(nèi)具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或者更多的或者完全的(100%)序列同一性的核酸序列的分離的、合成的或者重組的核酸,在一個方面所述核酸編碼具有磷脂酶(PL)活性的至少一種多肽,所述磷脂酶活性例如磷脂酶A、C或D活性,或磷脂酶活性的任何組合,例如PLA、PLC和/或PLD活性——作為多功能活性。一方面,所述序列同一性通過用序列比較算法分析或者通過目測檢查來確定。0015在可選的方面,分離的、合成的或者重組的核酸編碼這樣的多肽,其包括具有一個或多個編碼E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突變的SEQIDNO:177或SEQIDNO:178中列出的序列。一方面,這些多肽具有磷脂酶,例如磷脂酶A、B、C或D的活性,或磷脂酶活性的任何組合,例如PLA、PLC禾口/或PLD活性-作為多功能活性。0016在一方面,序列比較算法是BLAST算法,如BLAST2.2.2版算法。一方面,過濾設(shè)置(filteringsetting)設(shè)為blastall-p,blastp-d"nrpataa"-FF,所有其它選項設(shè)為默認(rèn)值。0017在可選的方面,分離的、合成的或者重組的核酸編碼這樣的多肽,其具有磷脂酶活性,但缺少;信號序列或原蛋白序列(proproteinsequences),或者同源啟動子序列;或者本發(fā)明的核酸(多核苷酸)編碼具有磷脂酶活性以及進一步包括異源28氨基酸序列的多肽,或者本發(fā)明的核酸(多核苷酸)包括異源核苷酸序列;或者本發(fā)明的核酸(多核苷酸)包括由編碼異源(前導(dǎo))信號序列、或標(biāo)記或表位的序列,或由編碼異源(前導(dǎo))信號序列、或標(biāo)記或表位的序列組成,或者異源核苷酸序列包括異源啟動子序列;或者本發(fā)明的核酸(多核苷酸)包括編碼異源(前導(dǎo))信號序列的異源核苷酸序列,其包括N-末端和/或C-末端延伸或由N-末端和/或C-末端延伸組成,用于靶向至內(nèi)質(zhì)網(wǎng)(ER)或內(nèi)膜、或者靶向至植物內(nèi)質(zhì)網(wǎng)(ER)或內(nèi)膜系統(tǒng),或者該異源序列編碼限制性位點;或者本發(fā)明的核酸(多核苷酸)包括異源啟動子序列,其包括組成型或誘導(dǎo)型啟動子、或者細(xì)胞類型特異性啟動子、或者植物特異性啟動子或者細(xì)菌特異性啟動子,或由這些啟動子組成。0018一方面,磷脂酶活性包括催化甘油磷酸酯鍵的水解(即,切割甘油磷酸酯鍵)。磷脂酶活性可以包括催化植物油中磷脂的酯鍵的水解。植物油磷脂可以包括油籽(anoilseed)的磷脂。磷脂酶活性可以包括磷脂酶C(PLC)活性;磷脂酶A(PLA)活性,如磷脂酶A1或者磷脂酶A2活性;磷脂酶D(PLD)活性,如磷脂酶D1或者磷脂酶D2活性;磷脂酶B(PLB)活性,例如磷脂酶和溶血磷脂酶(LPL)活性或磷脂酶和溶血磷脂酶-轉(zhuǎn)酰基酶(LPTA)活性或磷脂酶和溶血磷脂酶(LPL)活性和溶血磷脂酶-轉(zhuǎn)?;?LPTA)活性;或馬鈴薯塊莖蛋白(patatin)活性,或其組合。磷脂酶活性可以包括水解糖蛋白,例如馬鈴薯塊莖中發(fā)現(xiàn)的糖蛋白。磷脂酶活性可以包括patatin酶活性。磷脂酶活性可以包括脂酰水解酶(LAH)活性。一方面,本發(fā)明的磷脂酶可以具有多功能的活性,例如本文中描述的一種或多種酶活性的組合,例如本發(fā)明的磷脂酶可以具有PLC和PLA活性;PLB和PLA活性;PLC和PLD活性;PLC和PLB活性;PLB禾Qpatatin活性;PLC禾npatatin活性;PLD禾BPLA;PLD、PLA、PLB禾口PLC活性;或PLD、PLA、PLB、PLC和patatin活性;或磷脂酶和溶血磷脂酶(LPL)活性或磷脂酶和溶血磷脂酶-轉(zhuǎn)酰基酶(LPTA)活性,或磷脂酶和溶血磷脂酶(LPL)活性和溶血磷脂酶-轉(zhuǎn)?;?LPTA)活性,或其任意組合。0019例如,一方面,本發(fā)明的多肽具有酶活性,但是缺少脂酶活性,例如缺少影響中性油(甘油三酯)部分的任何酶活性。在特定的方法中使用這種多肽可能是有利的,例如在脫膠方法中,中性油部分不受損(不減少,例如不水解)是重要的。因此,一方面,本發(fā)明提供了脫膠方法,該方法包括使用本發(fā)明的具有磷脂酶活性但不具有脂酶活性的多肽。0020一方面,分離的、合成的或重組的核酸編碼具有磷脂酶活性的多肽,其是熱穩(wěn)定性的。例如本發(fā)明的多肽,舉例來說——例如本發(fā)明的變體或者進化的酶,例如SEQIDN0:2、SEQIDNO:175、SEQIDNO:176、SEQIDNO:177和SEQIDNO:178的具體變異,如表5和實施例4所述一一可以是熱穩(wěn)定性的。根據(jù)本發(fā)明的熱穩(wěn)定性多肽可在包括溫度范圍為約-100'C至約-8(TC、約-80。C至約-4(TC、約-4(TC至約-20。C、約-20。C至約0。C、約(TC至約37。C、約0。C至約5'C、約5。C至約15。C、約15。C至約25。C、約25。C至約37。C、約37。C至約45。C、約45。C至約55°C、約55°C至約7fTC、約70"C至約75°C、約75。C至約85°C、約85。C至約卯。C、約90。C至約95°C、約95。C至約IO(TC、約IO(TC至約105°C、約105。C至約IIO'C、約110。C至約120°C、或者95。C、96°C、97°C、98°C、99。C、100。C、101°C、102°C、103°C、104°C、105。C、106°C、107°C、108°C、109。C、ll(TC、111°C、112°C、113。C、114°C、115°C或更高溫度的條件下,保持結(jié)合和/或酶活性,例如磷脂酶活性。根據(jù)本發(fā)明的熱穩(wěn)定性多肽可在范圍為約-10(TC至約-8(rC、約-80。C至約-4(TC、約-40。C至約-2(TC、約-20"至約0°C、約(TC至約5°C、約5。C至約15°C、約15。C至約25°C、約25。C至約37°C、約37。C至約45"C、約45。C至約55。C、約55。C至約7(TC、約70。C至約75。C、約75。C至約85°C、約85。C至約90°C、約90。C至約95°C、約95。C至約IO(TC、約IOO'C至約105。C、約105。C至約11(TC、約110。C至約120。C的溫度、或者95。C、96。C、97。C、98。C、99°C、IOO'C、101°C、102。C、103。C、104。C、105°C、106°C、107。C、108。C、109°C、IIO'C、lirC、112。C、113°C、114°C、115。C或更高的溫度中,保持活性,例如磷脂酶活性。在一些實施方式中,根據(jù)本發(fā)明的熱穩(wěn)定性多肽在上述溫度范圍,在約pH3.0、約pH3.5、約pH4.0、約pH4.5、約pH5.0、約pH5.5、約pH6.0、約pH6.5、約pH7.0、約pH7.5、約pH8.0、約pH8.5、約pH9.0、約pH9.5、約pH10.0、約pH10.5、約pHll.O、約pH11.5、約pH12.0或更高pH下,保持活性,例如磷脂酶活性。0021在另一個方面,分離的、合成的或重組的核酸編碼具有磷脂酶活性的多肽,其是耐熱的。例如本發(fā)明的多肽,舉例來說——例如本發(fā)明的變體或者進化的酶,例如SEQIDN0:2、SEQIDNO:175、SEQIDNO:176、SEQIDNO:177和SEQIDNO:178的具體變異,如表5和實施例4和7所述——是耐熱的或熱活性的。根據(jù)本發(fā)明的耐熱多肽可在暴露于包括溫度范圍為約-10(TC至約-8(rC、約-8(TC至約-4(TC、約-40。C至約-2(TC、約-20。C至約(TC、約(TC至約5。C、約5'C至約15°C、約15。C至約25°C、約25°。至約37°C、約37。C至約45°C、約45°〇至約55°C、約55°〇至約70°C、約70。C至約75°C、約75。C至約85°C、約85。C至約90°C、約9(TC至約95°C、約95°C至約IOO'C、約IO(TC至約105°C、約105。C至約110。C、約ll(TC至約120°C、或95。C、96。C、97°C、98°C、99°C、100°C、101°C、102°C、103°C、104。C、105°C、106°C、107°C、108°C、109°C、110°C、111。C、112°C、113°C、114。C、115。C或更高溫度的條件后,保持結(jié)合和/或酶活性,例如磷脂酶活性。根據(jù)本發(fā)明的耐熱多肽可在暴露于范圍約-100。C至約-8(rC、約-8(TC至約-40。C、約-4(rC至約-2(TC、約-20。C至約0。C、約(TC至約5'C、約5'C至約15°C、約15。C至約25°C、約25。C至約37°C、約37'C至約45°C、約45。C至約55°C、約55。C至約70°C、約7(TC至約75°C、約75。C至約85°C、約85。C至約90。C、約90。C至約95°C、約95。C至約IO(TC、約100。C至約105。C、約105。C至約U0。C、約110。C至約120。C的溫度、或95。C、96°C、97°C、98°C、99°C、100°C、101。C、102°C、103°C、104°C、105°C、106°C、107°C、108°C、109°C、ll(TC、nrc、ii2°c、ii3°c、i"°c、115r或更高的溫度后,保持活性,例如磷脂酶活性。一方面,該多肽在pH4.5下暴露于高于9(TC至約95'C范圍的溫度后,保持磷脂酶或其它活性。0022一方面,分離的、合成的或重組的核酸包括在嚴(yán)格條件下,與具有一個或多個編碼E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、謂0F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突變的SEQIDNO:177或SEQIDNO:178中所示序列雜交的序列,其中該核酸編碼具有磷脂酶活性的多肽。如本文所述,核酸的長度上可以為至少大約10、20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850個或更多殘基或者是基因或者轉(zhuǎn)錄體的全長,具有或者不具有信號序列。如此處所述,嚴(yán)格條件可以是高度嚴(yán)格、中度嚴(yán)格或者低嚴(yán)格性。嚴(yán)格條件可以包括洗滌步驟,如,包括在0.2xSSC,大約65'C的溫度下洗滌大約15分鐘的洗滌步驟。0023本發(fā)明提供用于鑒定編碼具有磷脂酶,例如磷脂酶活性的多肽的核酸的核酸探針,其中該探針包括本發(fā)明的序列,例如具有一個或多個編碼E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突變的SEQIDNO:177或SEQIDNO:178中所示序列的至少10、20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850個或者更多的連續(xù)堿基,并且該探針通過結(jié)合或者雜交鑒定核酸。該探針可包括寡核苷酸,該寡核苷酸包括根據(jù)本發(fā)明序列的約10-100個之間的連續(xù)堿基,或者是其片段或子序列,例如在具有一個或多個編碼E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突變的SEQIDNO:177或SEQIDNO:178中所示序列的10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100個堿基或者更多堿基,或任何所期望的長度。0024本發(fā)明提供了用于鑒定編碼具有磷脂酶,如磷脂酶活性多肽的核酸的核酸探針,其中該探針包括本發(fā)明的核酸,例如在至少大約10、20、30、40、50、60、70、80、卯、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850或者更多連續(xù)殘基的范圍內(nèi),與具有一個或多個編碼E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、31D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突變的SEQIDNO:177或SEQIDNO:178中所示的序列或者它們的子序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%,或者更多,或者完全的(100%)的序列同一性的核酸,并且一方面,序列同一性通過序列比較算法分析或者通過目測檢查確定。0025本發(fā)明提供用于擴增編碼具有磷脂酶活性多肽的核酸的擴增引物序列對,其中該引物對能夠擴增包括本發(fā)明的序列或者片段或者其子序列的核酸。一個或每一個擴增引物序列對的成員可以包括含有該序列至少大約10到50個連續(xù)堿基,或者該序列大約10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、或者25個或更多個連續(xù)堿基的寡核苷酸。0026本發(fā)明提供擴增引物對,其中該引物對包括第一成員和第二成員,其中第一成員具有本發(fā)明核酸的大約前(5'端)12、13、14、15、16、17、18、19、20、21、22、23、24、或者25個或更多個殘基所示的序列,第二成員具有第一成員互補鏈的大約前(5')12、13、14、15、16、17、18、19、20、21、22、23、24或者25個或更多個殘基所示的序列。0027本發(fā)明提供了使用本發(fā)明的擴增引物對通過擴增,例如聚合酶鏈?zhǔn)椒磻?yīng)(PCR)產(chǎn)生的磷脂酶。本發(fā)明提供了應(yīng)用發(fā)明的擴增引物對通過擴增,例如聚合酶鏈?zhǔn)椒磻?yīng)(PCR)制備磷脂酶的方法。一方面,擴增引物對擴增來自文庫的核酸,例如基因文庫,如環(huán)境文庫。0028本發(fā)明提供了擴增編碼具有磷脂酶活性的多肽的核酸的方法,包括用能夠擴增本發(fā)明核酸序列或者片段或者其子序列的擴增引物序列對來擴增模板核酸序列。該擴增引物對可以是本發(fā)明的擴增引物對。0029本發(fā)明提供包括本發(fā)明的核酸或者其子序列的表達盒(expressioncassettes)。一方面,表達盒可以包括可操作性地連接于啟動子的核酸。啟動子可以是病毒的、細(xì)菌的、哺乳動物的或者植物的啟動子。一方面,植物啟動子可以是馬鈴薯、水稻、玉米、小麥、煙草或者大麥啟動子。啟動子可以是組成型啟動子。組成型啟動子可以包括CaMV35S。另一方面,啟動子可以是誘導(dǎo)型啟動子。一方面,啟動子可以是組織特異性啟動子或者環(huán)境調(diào)控或者發(fā)育調(diào)控的啟動子。因此,啟動子可以是,例如種子特異性、葉特異性、根特異性、莖特異性或者脫落誘導(dǎo)啟動子。一方面,表達盒可以進一步包括植物表達載體或者植物病毒表達載體。0030本發(fā)明提供包括本發(fā)明的表達盒(如載體)或者本發(fā)明的核酸的克隆載體??寺≥d體可以是病毒載體、質(zhì)粒、噬菌體、噬菌粒(phagemid)、粘粒、F粘粒(fosmid)、細(xì)菌噬菌體或者人工染色體。病毒載體可以包括腺病毒載體,逆轉(zhuǎn)錄病毒載體或者腺相關(guān)病毒載體??寺≥d體可以包括細(xì)菌人工染色體(BAC)、質(zhì)粒、細(xì)菌噬菌體Pl衍生載體(PAC)、酵母人工染色體(YAC)、或者哺乳動物人工染色體(MAC)。0031本發(fā)明提供含有本發(fā)明核酸或者本發(fā)明表達盒(如,載體)或者本發(fā)明克隆載體的轉(zhuǎn)化細(xì)胞。一方面,轉(zhuǎn)化細(xì)胞可以是細(xì)菌細(xì)胞、哺乳動物細(xì)胞、真菌細(xì)胞、酵母細(xì)胞、昆蟲細(xì)胞或者植物細(xì)胞。一方面,植物細(xì)胞可以是馬鈴薯、小麥、水稻、玉米、煙草或者大麥細(xì)胞。0032本發(fā)明提供包括本發(fā)明的核酸或者本發(fā)明的表達盒(如,載體)的轉(zhuǎn)基因非-人類動物。在一方面,動物是小鼠、大鼠、兔、羊、豬或奶?;蚱渌溉閯游铩?033本發(fā)明提供包括本發(fā)明的核酸或者本發(fā)明的表達盒(如,載體)的轉(zhuǎn)基因植物。轉(zhuǎn)基因植物可以是玉米植物、馬鈴薯植物、番茄植物、小麥植物、油籽植物、油菜籽植物、大豆植物、水稻植物、大麥植物或煙草植物。本發(fā)明提供包括本發(fā)明的核酸或本發(fā)明的表達盒(例如,載體)的轉(zhuǎn)基因種子。轉(zhuǎn)基因種子可以是玉米種子、小麥仁、油籽、油菜籽(油菜植物)、大豆種子、棕櫚仁、向日葵種子、芝麻種子、花生、水稻或煙草植物種子。0034本發(fā)明提供含有與本發(fā)明的核酸互補或在嚴(yán)格條件下能夠與本發(fā)明的核酸雜交的核酸序列的反義寡核苷酸。本發(fā)明提供抑制細(xì)胞內(nèi)磷脂酶信使翻譯的方法,該方法包括向細(xì)胞施用或在細(xì)胞中表達含有與本發(fā)明的核酸互補或在嚴(yán)格條件下能夠與本發(fā)明的核酸雜交的核酸序列的反義寡核苷酸。0035本發(fā)明提供含有與本發(fā)明的核酸互補或在嚴(yán)格條件下能夠與本發(fā)明的核酸雜交的核酸序列的反義寡核苷酸。本發(fā)明提供抑制細(xì)胞內(nèi)磷脂酶信使翻譯的方法,該方法包括向細(xì)胞施用或在細(xì)胞中表達含有與本發(fā)明的核酸互補或在嚴(yán)格條件下能夠與本發(fā)明的核酸雜交的核酸序列的反義寡核苷酸。反義寡核苷酸的長度可以是大約10到50、大約20到60、大約30到70、大約40到80、大約60到100、大約70到110或者大約80到120個堿基。0036本發(fā)明提供抑制磷脂酶如細(xì)胞內(nèi)磷脂酶信使翻譯的方法,該方法包括向細(xì)胞施用或在細(xì)胞中表達含有與本發(fā)明的核酸互補或在嚴(yán)格條件下能夠與本發(fā)明的核酸雜交的核酸序列的反義寡核苷酸。本發(fā)明提供包括本發(fā)明序列的子序列的雙鏈抑制性RNA(RNAi)分子。在一方面,RNAi長度是大約15、16、17、18、19、20、21、22、23、24、25或者更多的雙鏈核苷酸。本發(fā)明提供抑制磷脂酶如細(xì)胞內(nèi)磷脂酶表達的方法,該方法包括向細(xì)胞施用或者在細(xì)胞中表達雙鏈抑制性RNA(RNAi),其中該RNA包括本發(fā)明序列的子序列。0037本發(fā)明提供了分離的、合成的或重組的多肽,該多肽包含與本發(fā)明示例性的多肽或肽(例如具有一個或多個E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、E41A、E41W、E41F、E41Y、E41R、E94R、D訓(xùn)L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R突變的SEQIDNO:175或SEQIDNO:176)在多肽的至少大約10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、90、100、125、150、175、200、225、250、275、300、325、350、400、450、500、550或600或更多殘基,或多肽的全長范圍內(nèi),具有至少大約50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%,或更大,或完全的(100%)序列同一性的氨基酸序列;并且,一方面,序列同一性通過序列比較算法分析或者通過目測觀察來確定。0038一方面,本發(fā)明提供包括與具有一個或多個編碼E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突變的SEQIDNO:175或SEQIDNO:176具有至少大約81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或者更多,或者完全的(100%)序列同一性的氨基酸序列的分離的、合成的或者重組的多肽。0039本發(fā)明提供由本發(fā)明的核酸編碼的分離的、合成的或者重組的多肽。在可選的方面,多肽可以具有如在具有一個或多個編碼E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突變的SEQIDNO:175或SEQIDNO:176中所示的序列。多肽可以具有磷脂酶活性,如磷脂酶A、B、C或D活性,或磷脂酶活性的任何組合,例如PLA、PLC和/或PLD活性——作為多功能活性。例如,一方面,本發(fā)明的多肽具有酶活性,但是缺少脂酶活性,例如缺少影響中性油(甘油三酯)部分的任何酶活性。一方面,本發(fā)明提供了脫膠方法,該方法包括使用具有磷脂酶活性但不具有脂酶活性的本發(fā)明的多肽,這樣在脫膠方法中,任何中性油部分不受損害(減少、改變、降解,例如水解)。0040在可選的方面,本發(fā)明的多肽具有磷脂酶活性,但缺乏信號序列或原蛋白序列;或者,具有磷脂酶活性以及進一步包括異源氨基酸序列,或者本發(fā)明的核酸(多核苷酸)包括異源核苷酸序列。一方面,異源氨基酸序列包括編碼異源(前導(dǎo))信號序列、或標(biāo)記或表位的序列、或由之組成,或者異源核苷酸序列包括異源啟動子序列;一方面,異源(前導(dǎo))信號序列包括N-末端和/或C-末端延伸或由之組成,其用于靶向至內(nèi)質(zhì)網(wǎng)(ER)或內(nèi)膜、或者靶向至植物內(nèi)質(zhì)網(wǎng)(ER)或內(nèi)膜系統(tǒng),或者該異源序列編碼限制性位點。0041本發(fā)明提供了含有缺乏信號序列的本發(fā)明多肽的分離的、合成的或者重組的多肽。一方面,缺乏信號肽的多肽與具有一個或多個編碼E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突變的SEQIDNO:175或SEQIDNO:176的殘基30到287具有至少81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或者更多序列同一性。序列同一性通過序列比較算法分析或者通過目測觀察確定。0042本發(fā)明的另一方面提供分離的、合成的或者重組的多肽或者肽,該分離的、合成的或者重組的多肽或者肽包括本發(fā)明的多肽或肽序列、與之基本相同的序列,和與之互補的序列的至少10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或者100或者更多的連續(xù)堿基。該肽可以是,例如,免疫源性的片段、基序(如結(jié)合位點)或者活性位點。0043一方面,本發(fā)明分離的、合成的或重組的多肽(有或無信號序列)具有磷脂酶活性。一方面,磷脂酶活性包括催化甘油磷酸酯鍵的水解(即,切割甘油磷酸酯鍵)。磷脂酶活性可以包括催化植物油中磷脂的酯鍵的水解。植物油磷脂可以包括油籽的磷脂。磷脂酶活性可以包括磷脂酶C(PLC)活性;磷脂酶A(PLA)活性,如磷脂酶A1或者磷脂酶A2活性;磷脂酶D(PLD)活性,如磷脂酶D1或者磷脂酶D2活性;磷脂酶B(PLB)活性,例如磷脂酶和溶血磷脂酶(LPL)活性,或磷脂酶和溶血磷脂酶-轉(zhuǎn)酰基酶(LPTA)活性,或磷脂酶和溶血磷脂酶(LPL)活性和溶血磷脂酶-轉(zhuǎn)?;?LPTA)活性;或patatin活性,或其組合。例如,一方面,磷脂酶活性包括本文中描述的一種或多種酶活性的組合,例如磷脂酶可以具有PLC和PLA活性;PLB和PLA活性;PLC和PLD活性;PLC和PLB活性;PLB和patatin活性;PLC和patatin活性;PLD禾BPLA;PLD、PLA、PLB禾卩PLC活性;或PLD、PLA、PLB、PLC和patatin活性;或磷脂酶和溶血磷脂酶(LPL)活性或磷脂酶和溶血磷脂酶-轉(zhuǎn)?;?LPTA)活性或磷脂酶和溶血磷脂酶(LPL)活性和溶血磷脂酶-轉(zhuǎn)?;?LPTA)活性,或其任意組合。0044磷脂酶活性可以包括水解糖蛋白,如馬鈴薯塊莖中發(fā)現(xiàn)的糖蛋白。磷脂酶活性可以包括patatin酶活性。磷脂酶活性可以包括脂酰水解酶(LAH)活性。0045一方面,分離的、合成的或者重組的多肽可以包括缺乏信號序列的本發(fā)明的多肽。一方面,分離的、合成的或者重組的多肽可以包括含有異源信號序列,如異源磷脂酶或者非-磷脂酶信號序列的本發(fā)明多肽。0046一方面,本發(fā)明提供包括第一結(jié)構(gòu)域和至少第二結(jié)構(gòu)域的嵌合蛋白,第一結(jié)構(gòu)域包括本發(fā)明的信號序列。該蛋白可以是融合蛋白。第二結(jié)構(gòu)域可以包括酶。酶可以是磷脂酶。0047本發(fā)明提供包括至少第一結(jié)構(gòu)域和至少第二結(jié)構(gòu)域的嵌合多肽,第一結(jié)構(gòu)域包括發(fā)明的信號肽(SP)或本發(fā)明磷脂酶的催化結(jié)構(gòu)域(CD),或活性位點,第二結(jié)構(gòu)域包括異源多肽或肽,其中異源多肽或者肽與信號肽(SP)或者催化結(jié)構(gòu)域(CD)之間沒有天然的聯(lián)系。一方面,異源多肽或者肽不是磷脂酶。異源多肽或者肽可以在信號肽(SP)或者催化結(jié)構(gòu)域(CD)的氨基末端,羧基末端或者羧基和氨基末端。0048本發(fā)明提供編碼嵌合多肽的分離的、合成的或者重組的核酸,其中嵌合多肽包括至少第一結(jié)構(gòu)域和至少第二結(jié)構(gòu)域,第一結(jié)構(gòu)域含有本發(fā)明多肽的信號肽(SP)或者催化結(jié)構(gòu)域(CD)或者活性位點,第二結(jié)構(gòu)域包括異源多肽或者肽,其中異源多肽或者肽與信號肽(SP)或者催化結(jié)構(gòu)域(CD)之間沒有天然的聯(lián)系。0049一方面,磷脂酶活性包括在大約37i:下,每毫克蛋白大約IO到大約100單位范圍的比活性。另一方面,磷脂酶活性包括每毫克蛋白大約100到大約1000單位,大約500到大約750單位范圍的比活性??蛇x地,磷脂酶活性包括在37'C下每毫克蛋白大約100到大約500單位的比活性。在一方面,磷脂酶活性包括在37。C下每毫克蛋白大約500到大約1200單位的比活性。另一方面,磷脂酶活性包括在37'C下每毫克蛋白大約750到大約1000單位的比活性。另一方面,耐熱性包含經(jīng)加熱至升高的溫度以后,在37"C下仍保持磷脂酶至少一半的比活性。可選地,耐熱性包含經(jīng)加熱至升高的溫度——例如約(TC至約20°C、約20'C至約37°C、約37。C至約50°C、約50。C至約70°C、約70。C至約75°C、約75。C至約80°C、約80。C至約85°C、約85°C至約90°C、約卯。C至約95°C、約95。C至約100°C、約IO(TC至約110。C或更高的溫度以后,在37。C下仍保持每毫克蛋白大約500到大約1200單位的比活性??蛇x地,耐熱性可包括經(jīng)加熱至升高的溫度以后,在37。C下仍保持每毫克蛋白大約1至大約1200單位、或每毫克蛋白大約500至大約1000單位的比活性。另一方面,耐熱性可包括經(jīng)加熱至如上所述的升高的溫度以后,在37。C下仍保持每毫克蛋白大約1至大約500單位的比活性。0050本發(fā)明提供本發(fā)明分離的、合成的或者重組的多肽,其中多肽包括至少一個糖基化位點。一方面,糖基化可以是N-連接糖基化。一方面,多肽可以是在巴斯德畢赤酵母(PpaWw^)或者粟酒裂殖酵母(S.pow&)中表達后進行糖基化。0051本發(fā)明提供了磷脂酶和編碼它們的核酸,該磷脂酶具有本發(fā)明任何示例性磷脂酶的序列,其中一個或多個或所有糖基化位點被改變,如上所述。因此,本發(fā)明提供了制備在宿主細(xì)胞中具有增加的表達水平的變體磷脂酶編碼序列的方法,其中該方法包括修飾本發(fā)明的磷脂酶編碼序列,這樣,一個、多個或所有N-連接的糖基化位點編碼基序被修改為非糖基化基序。本發(fā)明也提供了由該方法制得的磷脂酶編碼序列,和它們編碼的酶。0052本發(fā)明提供了制備變體磷脂酶編碼序列的方法,該序列編碼對蛋白酶具有增加的耐受性的磷脂酶,該方法包括將等同于具有一個或多個編碼E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突變的SEQIDNO:175或SEQIDNO:176的位置131的氨基酸修改成一個、多個或所有下述殘基賴氨酸(K);絲氨酸(S);甘氨酸(G);精氨酸(R);谷氨酰胺(Q);丙氨酸(A);異亮氨酸(I);組氨酸(H);苯丙氨酸(F);蘇氨酸(T);蛋氨酸(M);亮氨酸(L)。本發(fā)明也提供由該方法制得的序列所編碼的分離的、合成的或重組的磷脂酶。0053本發(fā)明提供了制備變體磷脂酶編碼序列的方法,該序列編碼對蛋白酶具有減少的耐受性的磷脂酶,該方法包括將等同于具有一個或多個編碼E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171、VE41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突變的SEQIDNO:175或SEQIDNO:176的位置131的氨基酸修改成一個、多個或所有下述殘基色氨酸(W);谷氨酸(E);酪氨酸(Y)。本發(fā)明也提供由該方法制得的序列所編碼的分離的、合成的或重組的磷脂酶。0054本發(fā)明提供包括本發(fā)明多肽的蛋白制備物,其中蛋白制備物包括液體、固體或者凝膠制備物。0055本發(fā)明提供包括本發(fā)明多肽和第二種蛋白或者結(jié)構(gòu)域的異源二聚體。異源二聚體的第二個成員可以是不同的磷脂酶、不同的酶或者另一種蛋白。在一方面,第二個結(jié)構(gòu)域可以是多肽,且異源二聚體可以是融合蛋白。在一方面,第二個結(jié)構(gòu)域可以是表位(抗原決定簇)或者標(biāo)記。在一方面,本發(fā)明提供包括本發(fā)明多肽的同源二聚體。0056本發(fā)明提供具有磷脂酶活性的固定化多肽,其中多肽包含本發(fā)明的多肽,本發(fā)明核酸編碼的多肽,或者包括本發(fā)明多肽和第二個結(jié)構(gòu)域的多肽(例如融合蛋白)。在一方面,本發(fā)明多肽固定在細(xì)胞、細(xì)胞小泡、脂質(zhì)體、薄膜(film)、膜(membrane)、金屬、樹脂、聚合物、陶瓷、玻璃、微電極、石墨顆粒、珠子、凝膠、板、晶體、片劑、丸、膠囊、粉末、附聚物、表面、多孔結(jié)構(gòu)、陣列或者毛細(xì)管上。一方面,本發(fā)明的多肽固定在物質(zhì)諸如谷物、果殼、樹皮、皮、毛發(fā)、釉質(zhì)、骨、殼和由它們衍生的物質(zhì),或動物詞料物質(zhì),或其組合上。0057本發(fā)明的多肽(例如磷脂酶)也可以單獨存在或以磷脂酶混合物或磷脂酶與其它水解酶混合物的形式存在,其它水解酶諸如纖維素酶、木聚糖酶、蛋白酶、脂酶、淀粉酶、或氧化還原酶如漆酶、過氧化物酶、過氧化氫酶、氧化酶或還原酶。它們可以配制成固體形式如粉末、凍干制劑、顆粒、片劑、條、晶體、膠囊、丸、丸粒,或液體形式如水溶液、氣溶膠、凝膠、糊、漿、水/油乳狀液、乳劑、膠囊、小泡或膠束懸浮液。一方面,本發(fā)明的這些制劑可以包括任何下述組分或它們的組合-多元醇如聚乙二醇、聚乙烯醇、丙三醇,糖類如蔗糖、山梨醇、海藻糖、葡萄糖、果糖、麥芽糖;膠凝劑如瓜爾樹膠、鹿角菜膠、藻酸鹽、葡聚糖、纖維素衍生物、果膠;鹽如氯化鈉、硫酸鈉、硫酸銨、氯化鈣、氯化鎂、氯化鋅、硫酸鋅、脂肪酸及其衍生物的鹽;金屬螯合劑如EDTA、EGTA、檸檬酸鈉;抗微生物劑如脂肪酸、其衍生物、對羥基苯甲酸酯、山梨酸酯、苯甲酸鹽;抑制蛋白酶作用的其它化合物如大體積蛋白質(zhì)(bulkprotein),諸如BSA;小麥水解產(chǎn)物;硼酸鹽化合物;乳化劑如非離子型和離子型洗滌劑可以單獨或組合使用;植物甾醇;維生素;氨基酸;還原劑如半胱氨酸或抗氧化化合物如抗壞血酸可以包括在內(nèi)以及分散劑。0058一方面,交聯(lián)和蛋白質(zhì)修飾作用如聚乙二醇化、脂肪酸修飾和糖基化被用于提高本發(fā)明多肽的穩(wěn)定性(例如酶穩(wěn)定性)。一方面,多元醇和/或糖占制劑的約5%至約60%,或更多,制劑的約10%至約50%、制劑的約20%至約40%、或制劑的約5%至約20%。另一方面,膠凝劑占制劑的約0.5%至約10%、制劑的約1%至約8%、制劑的約2%至約5%、或制劑的約0.5%至約3%。另一方面,鹽如氯化鈉、硫酸鈉、硫酸銨、氯化鈣和/或氯化鎂占制劑的約1%至約30%、制劑的約2%至約20%、制劑的約5%至約15%、或制劑的約1%至約10%。另一方面,氯化鋅以包括約0.1mM至約20mM、約0.5mM至約10mM、約1mM至約5mM、或約0.1mM至約5mM的濃度存在于制劑中。又在另一個方面,硫酸鋅以包括約0.1mM至約20mM、約0.5mM至約10mM、約1mM至約5mM、或約0.1mM至約5mM的濃度存在于制劑中。在另一個方面,脂肪酸和/或其衍生物的鹽占制劑的約5%至約40%、制劑的約10%至約30%、制劑的約15%至約25%、或制劑的約5%至約20%。另一方面,金屬螯合劑如EDTA、EGTA和/或檸檬酸鈉以包括0.1mM至約10mM、約0.5mM至約8mM、約1mM至約5mM或約0.1mM至約1mM的濃度存在于制劑中。另一方面,抗微生物劑如對羥基苯甲酸酯類、山梨酸酯和/或苯甲酸鹽占制劑的約0.01%至約10%、制劑的約0.05%至約5%、制劑的約0.1%至約1%、或制劑的約0.05%至約0.5%。又在另一個方面,大體積蛋白質(zhì)如BSA和/或小麥水解產(chǎn)物占制劑的約1%至約20%、制劑的約5%至約15%、制劑的約2.5%至約7.5%、或制劑的約1%至約5%。另一方面,乳化劑如非離子型和/或離子型洗滌劑以一定濃度存在于制劑中,該濃度包括約lx臨界膠束濃度(CMC)至約10xCMC,約2.5xCMC至約7.5xCMC,約lxCMC至約5xCMC,或約3x至約6xCMC。在另一個方面,維生素、氨基酸、還原劑和/或抗氧化化合物占制劑的約0.1%至約5%、制劑的約0.5%至約4%、制劑的約1%至約2.5%、制劑的約0.1%至約1%。0059本發(fā)明提供包含固定化多肽的陣列,其中多肽是本發(fā)明的磷脂酶或者本發(fā)明核酸編碼的多肽。本發(fā)明提供含有本發(fā)明的固定化核酸的陣列。本發(fā)明提供含有本發(fā)明的固定化抗體的陣列。0060本發(fā)明提供特異性地結(jié)合于本發(fā)明多肽或者本發(fā)明的核酸編碼的多肽的分離的、合成的或者重組的抗體。抗體可以是單克隆抗體或者多克隆抗體。本發(fā)明提供含有本發(fā)明抗體的雜交瘤。0061本發(fā)明提供分離和鑒定具有磷脂酶活性的多肽的方法,包括以下歩驟(a)提供本發(fā)明的抗體;(b)提供含有多肽的樣品;以及(c)在抗體能夠特異性地結(jié)合于該多肽的條件下,將步驟(b)的樣品與步驟(a)的抗體接觸,從而分離和鑒定磷脂酶。本發(fā)明提供制備抗-磷脂酶抗體的方法,包括向非人類動物施用足以產(chǎn)生體液免疫應(yīng)答的量的本發(fā)明核酸或者本發(fā)明多肽,從而制備抗磷脂酶抗體。0062本發(fā)明提供生產(chǎn)重組多肽的方法,包含以下的步驟(a)提供可操作地連接于啟動子的本發(fā)明的核酸,以及(b)在允許多肽表達的條件下表達步驟(a)的核酸,從而生產(chǎn)重組多肽。該核酸可以包括與具有一個或多個編碼E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突變的SEQIDNO:175或SEQIDNO:176在至少大約100個殘基的區(qū)域內(nèi)具有至少85%的序列同一性的序列,其中序列同一性通過序列比較算法分析或者目測觀察來確定。核酸可以包括在嚴(yán)格的條件下與具有一個或多個編碼E41A、E41W、E41F、E41Y、E41R、所示的核酸雜交的核酸。該方法可以進一步包括用步驟(a)的核酸轉(zhuǎn)化宿主細(xì)胞,隨后表達步驟(a)的核酸,從而在轉(zhuǎn)化細(xì)胞中生產(chǎn)重組多肽。該方法可以進一步包括把步驟(a)的核酸插入到非人類動物宿主中,隨后表達步驟(a)的核酸,從而在非人動物宿主中生產(chǎn)重組多肽。0063本發(fā)明提供鑒定具有磷脂酶活性的多肽的方法,包括以下的步驟(a)提供本發(fā)明的多肽或由本發(fā)明核酸編碼的多肽,或其片段或變體,(b)提供磷脂酶底物;和(c)將步驟(a)的多肽或其片段或變體與步驟(b)的底物接觸,并檢測底物量的增加或者反應(yīng)產(chǎn)物量的減少,其中底物量的減少或者反應(yīng)產(chǎn)物量的增加說明檢測到了具有磷脂酶活性的多肽。在可選的方面,核酸包括與具有一個或多個編碼E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D71V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突變的SEQIDNO:177或SEQIDNO:178在至少大約100個殘基的范圍內(nèi)具有至少85%的序列同一性的序列,其中序列同一性通過序列比較算法分析或者目測觀察來確定。在可選的方面,核酸可以在嚴(yán)格的條件下與具有一個或多個編碼E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突變的SEQIDNO:177或SEQIDNO:178所示的序列雜交。0064本發(fā)明提供確定磷脂酶底物的方法,包括以下步驟(a)提供本發(fā)明的多肽或者本發(fā)明核酸編碼的多肽;(b)提供測試底物;以及(c)將步驟(a)的多肽與步驟(b)的測試底物接觸,檢測底物量的增加或者反應(yīng)產(chǎn)物量的減少,其中底物量的減少或者反應(yīng)產(chǎn)物量的增加確定測試底物為磷脂酶底物。在可選的方面,核酸可以與具有一個或多個編碼E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突變的SEQIDNO:177或SEQIDNO:178具有至少85%的序列同一性,其中序列同一性通過序列比較算法分析或者目測觀察來確定。在可選的方面,核酸在嚴(yán)格的條件下與具有一個或多個編碼E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D00F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突變的SEQIDNO:177或SEQIDNO:178所示的序列雜交。0065本發(fā)明提供確定化合物是否特異性地與磷脂酶結(jié)合的方法,包括以下步驟(a)在允許核酸翻譯成多肽的條件下,表達核酸或者包含該核酸的載體,其中該核酸和載體包括本發(fā)明的核酸或者載體;或者,提供本發(fā)明的多肽,(b)使多肽與測試化合物接觸;和(c)確定測試化合物是否特異性地與多肽結(jié)合,從而確定該化合物是否特異地與磷脂酶結(jié)合。在可選的方面,核酸序列與具有一個或多個編碼E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突變的SEQIDNO:177或SEQIDNO:178具有至少85%的序列同一性,其中序列同一性通過序列比較算法分析或者通過目測觀察來確定。在可選的方面,核酸在嚴(yán)格的條件下與具有一個或多個編碼E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突變的SEQIDNO:177或SEQIDNO:178所示的序列或其子序列雜交。0066本發(fā)明提供鑒定磷脂酶活性的調(diào)節(jié)物的方法,包括以下步驟(a)提供本發(fā)明的多肽或者本發(fā)明核酸編碼的多肽;(b)提供測試化合物;以及(c)將歩驟(a)的多肽與步驟(b)的測試化合物接觸;并測定磷脂酶的活性,其中在測試化合物存在的條件下測得的磷脂酶活性與在無測試化合物存在的條件下測得的磷脂酶活性相比的變化證明測試化合物調(diào)節(jié)磷脂酶的活性。在可選的方面,核酸可以與具有一個或多個編碼E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突變的SEQIDNO:177或SEQIDNO:178在至少大約100個殘基的范圍內(nèi),具有至少85%的序列同一性,其中序列同一性通過序列比較算法分析或者通過目測觀察來確定。在可選的方面,核酸可以在嚴(yán)格的條件下與選自具有一個或多個編碼E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、EI25K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突變的SEQIDNO:177或SEQIDNO:178所示的序列或其子序列的核酸序列雜交。0067一方面,磷脂酶活性通過提供磷脂酶底物并且檢測底物量的增加或者反應(yīng)產(chǎn)物量的減少來測定。與不存在測試化合物的條件下底物或者反應(yīng)產(chǎn)物的量相比,在存在測試化合物的條件下,底物量的減少或者反應(yīng)產(chǎn)物量的增加證明測試化合物是磷脂酶活性的激活劑。與不存在測試化合物的條件下底物或者反應(yīng)產(chǎn)物的量相比,在存在測試化合物的條件下,底物量的增加或者反應(yīng)產(chǎn)物量的減少證明測試化合物是磷脂酶活性的抑制劑。0068本發(fā)明提供包含處理器和數(shù)據(jù)存儲設(shè)備的計算機系統(tǒng),其中所述的數(shù)據(jù)存儲設(shè)備上己存儲了本發(fā)明的多肽序列或者本發(fā)明的核酸序列。0069一方面,計算機系統(tǒng)可以進一步包括序列比較算法,和其上己經(jīng)存儲了至少一個參照序列的數(shù)據(jù)存儲設(shè)備。序列比較算法可以包括表明多態(tài)性的計算機程序。計算機系統(tǒng)可以進一步包括鑒定所述序列的一個或者多個特征的鑒定器(anidentifier)。0070本發(fā)明提供其上已儲存了包括本發(fā)明多肽序列或本發(fā)明核酸序列的序列的計算機可讀介質(zhì)。0071本發(fā)明提供了鑒定序列中的特征的方法,包括以下步驟(a)應(yīng)用鑒定序列的一個或者多個特征的計算機程序來讀取序列,其中該序列包括本發(fā)明的多肽序列或者本發(fā)明的核酸序列;和(b)用計算機程序鑒定序列中的一個或者多個特征。0072本發(fā)明提供比較第一序列和第二序列的方法,該方法包括以下步驟(a)應(yīng)用比較序列的計算機程序讀取第一序列和第二序列,其中第一序列包括本發(fā)明的多肽序列或者本發(fā)明的核酸序列;并且(b)用計算機程序確定第一序列和第二序列間的差異。一方面,確定第一序列和第二序列間差異的步驟進一步包括鑒定多態(tài)性的步驟。一方面,該方法進一步包括鑒定序列中一個或者多個特征的鑒定器(以及鑒定器的應(yīng)用)。一方面,該方法包括用計算機程序讀取第一序列,并鑒定該序列中的一個或者多個特征。0073本發(fā)明提供從環(huán)境樣品中分離或者回收編碼具有磷脂酶活性的多肽的核酸的方法,包括以下步驟(a)提供擴增編碼具有磷脂酶活性的多肽的核酸的擴增引物序列對,其中引物對能夠擴增本發(fā)明的核酸(如具有一個或多個編碼E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突變的SEQIDNO:177或SEQIDNO:178或其子序列,等等);(b)從環(huán)境樣品中分離核酸或者處理環(huán)境樣品以便樣品中的核酸可以與擴增引物對雜交;和(c)將步驟(b)的核酸和步驟(a)的擴增引物對結(jié)合,并且從環(huán)境樣品中擴增核酸,從而從環(huán)境樣品中分離或者回收編碼具有磷脂酶活性的多肽的核酸。在一方面,擴增引物序列對的每一個成員包括含有本發(fā)明的核酸序列的至少大約10到50個連續(xù)堿基的寡核苷酸。在一方面,擴增引物序列對是本發(fā)明的擴增對。0074本發(fā)明提供從環(huán)境樣品中分離或者回收編碼具有磷脂酶活性的多肽的核酸的方法,包括以下步驟(a)提供包含本發(fā)明的核酸序列或其子序列的多核苷酸探針;(b)從環(huán)境樣品中分離核酸或者處理環(huán)境樣品以便樣品中的核酸可以與步驟(a)的多核苷酸探針雜交;(c)將步驟(b)的分離的核酸或者經(jīng)處理的環(huán)境樣品與步驟(a)的多核苷酸探針結(jié)合;和(d)分離與步驟(a)的多核苷酸探針特異性雜交的核酸,因此從環(huán)境樣品中分離或者回收編碼具有磷脂酶活性的多肽的核酸。在可選的方面,環(huán)境樣品包括水樣品、液體樣品、土壤樣品、空氣樣品或者生物樣品。在可選的方面,生物樣品來源于細(xì)菌細(xì)胞、原生動物細(xì)胞、昆蟲細(xì)胞、酵母細(xì)胞、植物細(xì)胞、真菌細(xì)胞、藻類細(xì)胞、地衣細(xì)胞或者哺乳動物細(xì)胞。0075本發(fā)明提供產(chǎn)生編碼磷脂酶的核酸的變體的方法,包括以下步驟(a)提供包括本發(fā)明核酸的模板核酸;(b)在模板序列中修飾、缺失或者添加一個或者多個核苷酸,或其組合,從而產(chǎn)生模板核酸的變體。0076在一方面,該方法進一步包括表達變異核酸,以產(chǎn)生變體磷脂酶多肽。在可選的方面,修飾、添加或者缺失由易錯PCR(error-pronePCR)、重排(shuffling)、寡核苷酸定向誘變(oligonucleotide-directedmutagenesis)、裝酉己PCR(assemblyPCR)、有性PCR誘變(sexualPCRmutagenesis)、體內(nèi)誘變(invivomutagenesis)、盒式誘變(cassettemutagenesis)、回歸整體誘變(recursiveensemblemutagenesis)、指數(shù)整體誘變(exponentialensemblemutagenesis)、位點特異性誘變(site-specificmutagenesis)、基因重裝酉己(genereassembly)、基因{立點飽禾卩誘變(GeneSiteSaturationMutagenesis,GSSM)、合成連接重裝配(syntheticligationreassembly,SLR)和/或其組合的方法來引入。在可選的方面,修飾、添加或者缺失通過選自下述的方法引入重組、回歸序列重組(recursivesequencerecombination)、硫代磷酸酉旨-修飾的DNA誘變(phosphothioate-modifiedDNAmutagenesis)、含尿卩密卩定的t莫板i秀變(uracil陽containingtemplatemutagenesis)、缺口二重誘變(gappedduplexmutagenesis)、點錯酉己修復(fù)誘變(pointmismatchrepairmutagenesis)、修復(fù)-缺陷型宿主株誘變(repair-deficienthoststrainmutagenesis)、化學(xué)誘變、放射誘變、缺失誘變、限制-選擇誘變(restriction-selectionmutagenesis)、限帝U-純化誘變(restriction-purificationmutagenesis)、人工基因合成(artificialgenesynthesis)、整體誘變(ensemblemutagenesis)、嵌合核酸多聚體生成(chimericnucleicacidmultimercreation)禾口/或其組合。0077在一方面,該方法被反復(fù)重復(fù),直到產(chǎn)生與模板核酸編碼的磷脂酶相比,具有改變的或不同的活性或者改變的或不同的穩(wěn)定性的磷脂酶。在一方面,改變的或不同的活性是在酸性條件下的磷脂酶活性,其中模板核酸編碼的磷脂酶在酸性條件下沒有活性。一方面,改變的或不同的活性是在高溫下的磷脂酶活性,其中模板核酸編碼的磷脂酶在高溫的條件下沒有活性。一方面,該方法反復(fù)重復(fù),直到產(chǎn)生與模板核酸的密碼子選擇相比具有改變的密碼子選擇的磷脂酶編碼序列。該方法反復(fù)重復(fù),直到產(chǎn)生與模板核酸的信使表達或者信使穩(wěn)定性相比具有更高或更低水平的信使表達或者信使穩(wěn)定性的磷脂酶基因。0078本發(fā)明提供修飾編碼磷脂酶的核酸中密碼子以增強其在宿主細(xì)胞中表達的方法,該方法包括(a)提供本發(fā)明的編碼磷脂酶的核酸;(b)鑒定步驟(a)的核酸中的非偏愛(non-preferrd)或者不太偏愛(lesspreferred)的密碼子,并且用編碼相同氨基酸的偏愛的(或優(yōu)選的)或者中度使用(neutrallyused)的密碼子作為替代密碼子替換之,其中偏愛密碼子是在宿主細(xì)胞基因的編碼序列中過度表現(xiàn)(出現(xiàn)頻率較多,over-represent)的密碼子,而非偏愛(或非優(yōu)選的)或不太偏愛的密碼子是在宿主細(xì)胞基因的編碼序列中表現(xiàn)不足(出現(xiàn)頻率較少,under-represent)的密碼子,由此修飾該核酸以增加其在宿主細(xì)胞中的表達。0079本發(fā)明提供修飾編碼磷脂酶的核酸中的密碼子的方法,該方法包括(a)提供本發(fā)明的編碼磷脂酶的核酸;并且(b)確定步驟(a)的核酸中的密碼子,并用編碼相同氨基酸的不同的密碼子作為替代密碼子來替換之,從而修飾編碼磷脂酶的核酸中的密碼子。0080本發(fā)明提供修飾編碼磷脂酶的核酸中的密碼子以增強其在宿主細(xì)胞中的表達的方法,該方法包括(a)提供本發(fā)明的編碼磷脂酶的核酸,和(b)鑒定步驟(a)的核酸中的非偏愛的或者不太偏愛的密碼子,并用編碼相同氨基酸的偏愛的或者中度使用的密碼子作為替代密碼子來替換之,其中偏愛密碼子是在宿主細(xì)胞基因的編碼序列中過度表現(xiàn)的密碼子,非-偏愛或不太偏愛的密碼子是在宿主細(xì)胞基因的編碼序列中表現(xiàn)不足的密碼子,由此修飾該核酸以增加其在宿主細(xì)胞中的表達。0081本發(fā)明提供修飾編碼磷脂酶的核酸中的密碼子以降低其在宿主細(xì)胞的表達的方法,該方法包括(a)提供本發(fā)明的編碼磷脂酶的核酸;和(b)鑒別步驟(a)的核酸中的至少一個偏愛的密碼子,并用編碼相同氨基酸的非偏愛的或者不太偏愛的密碼子作為替代密碼子替換之,其中偏愛密碼子是在宿主細(xì)胞基因的編碼序列中過度表現(xiàn)的密碼子,非偏愛或不太偏愛的密碼子是在宿主細(xì)胞基因的編碼序列中表現(xiàn)不足的密碼子,由此修飾該核酸以減少其在宿主細(xì)胞中的表達。在可選的方面,宿主細(xì)胞是細(xì)菌細(xì)胞、真菌細(xì)胞、昆蟲細(xì)胞、酵母細(xì)胞、植物細(xì)胞、藻類細(xì)胞、地衣細(xì)胞或哺乳動物細(xì)胞。0082本發(fā)明提供產(chǎn)生編碼多個經(jīng)修飾的磷脂酶活性位點或底物結(jié)合位點的核酸文庫的方法,其中經(jīng)修飾的活性位點或者底物結(jié)合位點來源于包括編碼第一活性位點或者第一底物結(jié)合位點的序列的第一核酸,該方法包括(a)提供編碼第一個活性位點或者第一個底物結(jié)合位點的第一核酸,其中第一核酸序列包括本發(fā)明的核酸,(b)提供一組在第一核酸的多個靶密碼子處編碼天然產(chǎn)生的氨基酸變體的誘變寡核苷酸;和(c)應(yīng)用該組誘變寡核苷酸產(chǎn)生一組編碼活性位點或者編碼底物結(jié)合位點的變體核酸,在每一個被誘變的氨基酸密碼子處,變體核酸編碼一定范圍的氨基酸變異,從而產(chǎn)生編碼多個修飾的磷脂酶活性位點或者底物結(jié)合位點的核酸文庫。在可選的方面,本方法包括通過下列的方法誘變步驟(a)的第一核酸,所述方法包括優(yōu)化的定向進化系統(tǒng)(optimizeddirectedevolutionsystem)、基因位點飽和誘變(GeneSite-SaturationMutagenesis)(GSSM)、合成連接重裝配(SLR)。該方法可以進一步包括通過下列方法誘變步驟(a)的第一核酸或變體,所述方法包括易錯PCR、重排、寡核苷酸定點突變、裝配PCR、有性PCR誘變、體內(nèi)誘變、盒式誘變、回歸整體誘變、指數(shù)整體誘變、位點特異性誘變、基因重裝配、基因位點飽和誘變(GSSM)、合成連接重裝配(SLR)及其組合。本方法可以進一步包括通過以下的方法誘變步驟(a)的第一核酸或變體,所述方法包括重組、回歸序列重組、硫代磷酸酯修飾的DNA誘變、含尿嘧啶的模板誘變、缺口二重誘變、點錯配修復(fù)誘變、修復(fù)-缺陷型宿主株誘變、化學(xué)誘變、放射誘變、缺失誘變、限制-選擇誘變、限制-純化誘變、人工基因合成、整體誘變、嵌合核酸多聚體生成及其組合。0083本發(fā)明提供制備小分子的方法,包括以下步驟(a)提供可以合成或者修飾小分子的多種生物合成酶,其中一種酶包括由本發(fā)明核酸編碼的磷脂酶;(b)提供步驟(a)的至少一種酶的底物,并且(c)在利于許多生物催化反應(yīng)進行的條件下,將歩驟(b)的底物和酶反應(yīng),通過一系列生物催化反應(yīng)產(chǎn)生小分子。0084本發(fā)明提供修飾小分子的方法,包括以下步驟(a)提供由本發(fā)明核酸編碼的磷脂酶;(b)提供小分子;和(c)在利于磷脂酶催化的酶反應(yīng)進行的條件下,將歩驟(a)的酶與步驟(b)的小分子反應(yīng),從而通過磷脂酶酶促反應(yīng)修飾小分子。一方面,該方法包括提供多種用于步驟(a)的酶的小分子底物,從而產(chǎn)生經(jīng)修飾的小分子文庫,該小分子文庫由磷脂酶催化的至少一種酶促反應(yīng)產(chǎn)生。一方面,該方法可以包括多種其它的酶,在有助于這些酶的多個生物催化反應(yīng)的條件下使用,以形成由多個酶促反應(yīng)產(chǎn)生的被修飾小分子的文庫。另一方面,該方法可以進一步包括測試該文庫以確定該文庫中是否存在表現(xiàn)出期望活性的特定被修飾小分子的步驟。測試該文庫的步驟可以進一步包括系統(tǒng)地去除所有但保留一個用于產(chǎn)生文庫中多個被修飾小分子中的一部分的生物催化反應(yīng),方法是通過測試被修飾小分子的所述部分中存在或不存在具有期望活性的特定被修飾小分子,并鑒定出產(chǎn)生具有期望活性的特定修飾小分子的至少一個特定生物催化反應(yīng)。0085本發(fā)明提供用于確定磷脂酶的功能性片段方法,包括以下步驟(a)提供包括本發(fā)明氨基酸序列的磷脂酶;和(b)刪除步驟(a)序列中的多個氨基酸殘基,并且測定剩余子序列的磷脂酶活性,從而確定磷脂酶的功能性片段。一方面,磷脂酶活性通過提供磷脂酶底物,并檢測底物量的增加或者反應(yīng)產(chǎn)物量的減少來測定。一方面,與不存在測試化合物條件下確定的底物或者反應(yīng)產(chǎn)物的量相比較,在測試化合物存在的條件下,酶底物量的減少或者反應(yīng)產(chǎn)物量的增加表明測試化合物是磷脂酶活性的激活劑。0086本發(fā)明提供切割甘油磷酸酯鍵的方法,包括以下步驟(a)提供具有磷脂酶活性的多肽,其中該多肽包括本發(fā)明的氨基酸序列,或者該多肽由本發(fā)明的核酸編碼;(b)提供包含甘油磷酸酯鍵的組合物;和(c)在該多肽切割甘油磷酸酯鍵的條件下,將步驟(a)的多肽與步驟(b)的組合物接觸。一方面,該條件包括大約pH5到大約8.5之間,或者大約pH4.5(或酸性更大,即pH<4.5)到大約9.0(或堿性更大,即pH〉9)之間。一方面,該條件包括大約4(TC到大約7(TC之間的溫度。一方面,該組合物包括植物油。一方面,該組合物包括油籽磷脂。一方面,切割反應(yīng)可以產(chǎn)生水可抽提的磷酸化的堿和甘油二酯。0087本發(fā)明提供了水解、分解或破壞含磷脂組合物(或組分)的方法,該方法包括提供具有磷脂酶活性的至少一種本發(fā)明的多肽,或由本發(fā)明的至少一種核酸編碼的具有磷脂酶活性的多肽;提供包含磷脂的組合物;以及在磷脂酶水解、分解或破壞含磷脂組合物的條件下將所述多肽與所述組合物接觸。一方面,該方法包括使用高剪切,然后不使用低剪切或使用低剪切,將組合物與至少一種具有磷脂酶活性的本發(fā)明的多肽混合,以使磷脂底物與磷脂酶充分"接觸"。具有磷脂酶活性的至少一種多肽也可以存在于高剪切混合步驟中。該方法可以以任何規(guī)模實施,例如以包括約1克(g)至約500、1000、2000、2500、5000g或更多,或該范圍內(nèi)的任何數(shù)量的規(guī)模實施。0088本發(fā)明提供油脫膠(oildegumming)方法,包括以下步驟(a)提供具有磷脂酶活性的至少一種多肽,其中多肽包括本發(fā)明的氨基酸序列,或者多肽由本發(fā)明的核酸序列編碼;(b)提供包括植物油的組合物;和(c)在多肽可以切割植物油中的酯鍵的條件下,將步驟(a)的多肽與步驟(b)的植物油接觸,從而進行油的脫膠。在一方面,植物油包括油籽。植物油可以包括米糠油(ricebranoil)、棕櫚油、油菜籽油、玉米油、大豆油、油菜油(canolaoil)、芝麻油、花生油、或者葵花油。在一方面,該方法進一步包括加入本發(fā)明的磷脂酶、其它磷脂酶或其組合。一方面,將一種以上具有磷脂酶活性的多肽加入到該方法中,其中至少一種多肽是本發(fā)明的酶。一方面,酶以特定順序加入,例如,具有不同特性的PLC以特定順序加入,例如具有PC和PE活性的酶被首先加入(或者兩種酶同時加入,一種具有PC活性,另一種具有PE活性),然后加入具有PIPLC活性的酶,或其任意組合。0089在油脫膠方法的一個方面,含油組合物包括植物、動物、藻類或魚的油或脂肪。植物油可以包括米糠油、大豆油、油菜籽油、玉米油、來自棕櫚仁的油、油菜油、向日葵油、芝麻油或花生油。多肽可以水解含油組合物中來自水合和/或非水合磷脂的磷脂。一方面,多肽在甘油磷酯鍵處水解磷脂從而產(chǎn)生甘油二酯和水溶性磷酸鹽化合物。一方面,多肽具有磷脂酶C的活性。一方面,多肽是磷脂酶D,且也可以加入磷酸酶。0090在油脫膠方法的一個方面,接觸步驟包括水解油中的水合磷脂。水解條件可以包括堿性條件,例如一方面,該條件包括在堿性pH條件下約20r至4(TC的溫度。堿性條件可以包括約pH8至pH10,或更大的pH。在該方法的任何時刻,水解條件都可以被變?yōu)閴A性,例如一方面,在該條件變成堿性之前,加入磷脂酶諸如PLC(例如,含酸諸如磷脂酸的油的"堿中和")。0091在油脫膠方法的一個方面,在PLC的作用下,堿將使1,2-DAG異構(gòu)成1,3-DAG,1,3-DAG的營養(yǎng)健康價值超過1,2-DAG,例如1,3-DAG作為能源被燃燒掉,而不是作為脂肪儲存起來(如1,2-DAG似的)。因此,本發(fā)明提供了堿性油精煉方法,其中磷脂酶例如本發(fā)明的酶——包括PLC,"在前端"加入,即在加入任何酸和堿之前加入,例如,如圖13的示例性方法中所示。在本發(fā)明的堿性精煉方法的前端加入PLC(參見下面進一步的論述)以及隨后加入酸和堿的結(jié)果之一就是產(chǎn)生了提高水平的1,3-DAG(不是l,2-DAG)。這可能是酸或堿催化的?;D(zhuǎn)移的結(jié)果。從營養(yǎng)角度講,1,3-DAG勝于1,2-DAG。因此,本發(fā)明包括使用本發(fā)明的PLC進行的油脫膠方法,因而最終的脫膠油產(chǎn)物含有不少于約0.5%、1.0%、2.0%、3.0%、4.0%或5.0%的1,3-DAG。0092在油脫膠方法的一個方面,水解條件可以包括反應(yīng)時間約3至10分鐘或更多時間。水解條件可以包括在約5(TC至6(TC的溫度下,在約pH5至pH6.5,或約pH5至pH7.5,或約pH5至pH8.0的pH,水解油中的水合或非水合的磷脂,反應(yīng)時間是約30至60分鐘。0093在油脫膠方法的一個方面,多肽被結(jié)合到過濾器上,并使含磷脂的脂肪或油通過過濾器。該多肽可以被加入到包括含磷脂脂肪或油的溶液中,然后使該溶液通過過濾器。0094在油脫膠方法的一個方面,該方法還包括通過物理的方法除去脫膠方法產(chǎn)生的膠,這是通過加入硬化物質(zhì)例如云母或等同物進行的。一方面,這增加了油產(chǎn)0095本發(fā)明還提供將非水合磷脂轉(zhuǎn)化成水合形式的磷脂的方法,包括以下步驟(a)提供具有磷脂酶活性的多肽,其中多肽包括本發(fā)明的氨基酸序列,或者多肽由本發(fā)明的核酸編碼;(b)提供包括非水合磷脂的組合物;和(c)在多肽能夠切割非水合磷脂中的酯鍵的條件下,將步驟(a)的多肽與步驟(b)的非水合磷脂接觸,從而將非水合磷脂轉(zhuǎn)化為水合形式。0096本發(fā)明提供使油脫膠的方法,包括以下步驟(a)提供包括具有磷脂酶活性的本發(fā)明的多肽,或者由本發(fā)明核酸編碼的多肽的組合物;(b)提供包括含有磷脂的脂肪或者油的組合物;(c)在多肽能夠?qū)字慕M合物進行脫膠的條件下(在本發(fā)明的多肽能夠催化磷脂水解的條件下),將步驟(a)的多肽與步驟(b)的組合物接觸。在一方面,含油的組合物包括植物、動物、藻或者魚的油。植物油可以包括米糠油、大豆油、油菜籽油、玉米油、棕櫚仁的油、油菜油、葵花子油、芝麻油或者花生油。多肽可以水解含油組合物中水合和/或非水合磷脂中的磷脂。多肽可以在甘油磷脂鍵處水解磷脂,產(chǎn)生甘油二酯和水溶性的磷酸鹽化合物。多肽可以具有磷脂酶C,B,A或者D的活性。在一方面,加入了磷脂酶D活性和磷酸酶活性。接觸可以包括油中的水合磷脂的水解。水解條件可以包括在堿性pH下,溫度為大約2(TC到4CTC。堿性條件可以包括大約pH8到pH10的pH。水解條件可以包括反應(yīng)時間為3到10分鐘。水解條件可以包括在溫度為大約5(TC到60°C,pH大約為pH5到pH6.5,反應(yīng)時間為大約30到60分鐘,水解油中水合的或者非水合的磷脂。多肽可以結(jié)合于過濾器,并使含有磷脂的脂肪或者油通過過濾器。多肽可以加入到包含含磷脂的脂肪或者油的溶液中,然后使溶液通過過濾器。0097本發(fā)明提供將非水合的磷脂轉(zhuǎn)化為水合形式的方法,包括以下的步驟(a)提供包括具有本發(fā)明磷脂酶活性的多肽,或者由本發(fā)明的核酸序列編碼的多肽的組合物;(b)提供包括非水合的磷脂的組合物;和(C)在多肽將非水合磷脂轉(zhuǎn)化為水合形式的條件下,將步驟(a)的多肽與步驟(b)組合物接觸。多肽可以具有磷脂酶C的活性。多肽可以具有磷脂酶D的活性,并且也加入磷酸酶。0098本發(fā)明提供堿法精煉含磷脂的組合物的方法,包括以下步驟(a)提供包含磷脂酶的組合物,磷脂酶可以是本發(fā)明的具有磷脂酶活性的多肽,或者由本發(fā)明核酸編碼的多肽;(b)提供包含磷脂的組合物;和(c)在堿法精煉之前,堿法精煉期間或者之后,將步驟(a)的多肽與步驟(b)的組合物接觸。多肽可以具有磷脂酶活性,例如PLC、PLB、PLD禾n/或PLA活性。多肽可以在堿性精煉之前即在該方法的"前端",在加入酸或堿之前加入,如圖13所示。0099多肽(其可以是本發(fā)明的酶,例如PLC)可以在堿性精煉期間加入,并根據(jù)磷水平和游離脂肪酸的水平,可以加入變化水平的酸或堿。多肽(其可以是本發(fā)明的酶)可以在堿性精煉之前或之后加入分離以前,在強力混合器(intensemixer)或恒定混合器(retentionmixer)中;加熱步驟之后;在離心機中;在皂腳中;在洗滌水中;和/或在漂白或除臭步驟中。該方法可以包括使用濃的堿溶液,例如濃度比11%的工業(yè)標(biāo)準(zhǔn)更高,以降低膠的質(zhì)量。在可選的方面,濃的堿溶液濃度在約12%至50%之間,例如約20%、30%、40%、50%或60%或更濃。0100含磷脂的組合物可以包括植物。多肽可以通過轉(zhuǎn)基因的方式在該植物中表達。具有磷脂酶活性的多肽可以在破碎種子或植物其它部分期間加入,或者具有磷脂酶活性的多肽在破碎之后或精煉之前加入。0101還提供了使用本發(fā)明的多肽水解油(例如植物油)中的磷脂,以產(chǎn)生二酰甘油(DAG)和水溶性磷酸酯的堿法精煉方法。一方面,本發(fā)明的酶必須在堿法精煉方法中,包括任選地低含量水和/或在約55t:至約7(rC的溫度范圍內(nèi)操作。在該溫度范圍內(nèi),以低水含量條件使用堿法精煉方法,將通過增加DAG和減少夾帶油(entrainedoil)而使產(chǎn)量最大化。一方面,在本發(fā)明的堿法精煉方法中使用的酶對磷脂酰膽堿(PC)和磷脂酰乙醇胺(PE)具有非常好的活性,在約pH6至pH9具有活性,在高達75'C下具有活性,在油中的低含量水例如約2%至5%水中具有活性,例如由具有一個或多個編碼E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突變的SEQIDNO:177或SEQIDNO:178的序列編碼的酶。在本發(fā)明用于水解油中磷脂的堿法精煉方法的另一方面,使用了兩種酶PI-特異性PLC(水解PI)和水解PC、PE及PA的PC-PLC。該實施方式產(chǎn)生適合于化學(xué)或物理精煉的油,并使DAG的產(chǎn)量增加最大化,并減少夾帶的油。0102本發(fā)明提供純化植物甾醇或者三萜的方法,包括以下的步驟(a)提供包括本發(fā)明的具有磷脂酶活性的多肽或者由本發(fā)明核酸編碼的多肽的組合物;(b)提供含有植物甾醇或者三萜的組合物;和(c)在多肽可以催化組合物中磷脂的水解的條件下,將步驟(a)的多肽與步驟(b)的組合物接觸。該多肽可以具有磷脂酶C的活性。植物甾醇或者三萜可以包括植物甾醇(plantsterol)。該植物甾醇可以來源于植物油。植物油可以包括米糠油、椰子油、油菜油、可可黃油、玉米油、棉籽油、亞麻油、橄欖油、棕櫚油、花生油、來自米糠的油、紅花油、芝麻油、大豆油或者葵花油。該方法可以包括應(yīng)用非極性溶劑來定量地提取游離的植物甾醇和甾醇脂肪酸酯。植物甾醇或者三萜可以包括l3-谷甾醇、菜油甾醇、豆甾醇、豆甾垸醇、P-谷留垸醇、谷甾烷醇、鏈甾醇、海綿甾醇、多孔甾醇、穿貝海綿甾醇或者菜籽甾醇。0103本發(fā)明提供精煉粗制油的方法,包括以下步驟(a)提供包括本發(fā)明的具有磷脂酶活性的多肽,或者由本發(fā)明核酸編碼的多肽的組合物;(b)提供包括含磷脂的油的組合物;和(c)在多肽催化組合物中的磷脂水解的條件下,將步驟(a)的多肽與步驟(b)的組合物接觸。該多肽可以具有磷脂酶C的活性。多肽可以在加入到組合物的水溶液中具有磷脂酶活性。水的水平可以是在0.5到5%之間。處理時間可以大約2小時以下,大約60分鐘以下,大約30分鐘以下,大約15分鐘以下,或者5分鐘以下。水解條件可以包括溫度范圍在大約25。C到7(TC之間。水解條件可以包括使用苛性堿??梢允褂脡A的濃溶液,例如比11%的工業(yè)標(biāo)準(zhǔn)更濃的濃度,以減少膠的質(zhì)量。在可選的方面,堿的濃溶液是在約12%至50%之間的濃度,例如約20%、30%、40%、50%或60%或更濃的濃度。0104水解條件可以包括pH在大約pH3到pH10之間、在大約pH4到pH9之間、或者在大約pH5到pH8之間。水解條件可以包括在接觸步驟(c)后加入乳化劑和/或進行混合。該方法可以包括加入乳化劑破乳劑(emulsifiers-breaker)禾口/或加熱或冷卻(例如在約(C至約-2(TC之間,或更低溫度),來促進水相的分離。該方法可以包括在接觸步驟前進行脫膠,通過離心收集卵磷脂,然后再加入PLC,PLC和/或PLA以去除非水合的磷脂。該方法可以包括水脫膠粗制油至少于10ppm的磷以獲得食用油,以及接著物理精煉至少于大約50ppm的磷以獲得生物柴油。該方法可以包括加入酸來增強非水合磷脂的水合作用。一方面,加入酸來促進鈣鎂金屬含量的降低。0105本發(fā)明提供了改善、處理或防止脂多糖(LPS)-介導(dǎo)的毒性的方法,該方法包括給予患者包含本發(fā)明多肽的藥物組合物。本發(fā)明提供了內(nèi)毒素的解毒方法,包括使內(nèi)毒素與本發(fā)明的多肽接觸。本發(fā)明提供了從類脂A上脫去2'或3'脂肪酸鏈的脫酰基方法,包括將類脂A與本發(fā)明的多肽接觸。0106本發(fā)明提供了使用本發(fā)明的多肽來制造藥物組合物一例如來制造用于防止、處理或改善脂多糖(LPS)-介導(dǎo)的毒性的藥物組合物,或用來解毒內(nèi)毒素,或者從類脂A上脫去2'或3'脂肪酸鏈的脫酰基。本發(fā)明提供用于內(nèi)毒素的解毒的方法,包括將內(nèi)毒素與本發(fā)明的多肽接觸。0107本發(fā)明提供了精煉潤滑劑的方法,包括以下步驟(a)提供包括本發(fā)明的酶的組合物;(b)提供潤滑劑;和(c)在酶可以選擇性地水解潤滑劑中的油的條件下,用酶處理潤滑劑,從而精煉該潤滑劑。該潤滑劑可以是液壓油。0108本發(fā)明提供了處理織物的方法,包括下述步驟(a)提供包括本發(fā)明的酶的組合物;(b)提供織物;和(C)用該酶處理織物。織物的處理可以包括最終織物的手感與懸垂的改善、染色、獲得阻燃性、獲得防水性、獲得光學(xué)亮度或者獲得樹脂整理。該織物可以包括棉、粘膠纖維、人造纖維、萊塞爾纖維(lyocell)、亞麻(flax)、亞麻(linen)、苧麻、其所有的混合物,或者它們與聚酯、羊毛、聚酰胺丙烯酸或聚丙烯酸的混合物。本發(fā)明提供了包含本發(fā)明的酶的織物、紗線或纖維。該酶可以被吸附,吸收或固定在織物、紗或纖維的表面。0109本發(fā)明提供了表達磷脂酶C方法,該方法包括提供具有Mut+表型的畢赤酵母菌株;將異源的磷脂酶C-編碼核酸插入畢赤酵母菌株;并將畢赤酵母菌株培養(yǎng)在表達磷脂酶C的條件下。該方法還可以包括用鋅補充培養(yǎng)條件。本發(fā)明也提供了用于表達磷脂酶C的細(xì)胞體系,分離的細(xì)胞和細(xì)胞系,包括Mut+表型畢赤酵母菌株,其含有可操作性地連接于畢赤酵母菌株中可以操作的啟動子的異源的磷脂酶C-編碼核酸。0110本發(fā)明提供了用于表達異源蛋白的耐zeocin的酵母細(xì)胞體系(例如酵母細(xì)胞、細(xì)胞系、單細(xì)胞),包括步驟提供含有能夠表達異源蛋白的異源核酸的畢赤酵母某種(P/c/z,'a(例如巴斯德畢赤酵母(尸.p"Wo/10)細(xì)胞;在含某一初始濃度zeodn的條件下培養(yǎng)該細(xì)胞;挑選對初始濃度的zeocin有抗性的細(xì)胞,并在含有較高濃度zeocin的條件下再培養(yǎng);并挑選出步驟(C)中培養(yǎng)的耐較高濃度zeocin的細(xì)胞。一方面,異源蛋白是酶,或任選地是磷脂酶,或任選地是磷脂酶C(PLC),例如本發(fā)明的任何酶。0111本發(fā)明提供制造生物燃料的方法,其包括(A)(a)提供本發(fā)明的具有磷脂酶,或者由本發(fā)明核酸(多核苷酸)編碼的磷脂酶,或者由本發(fā)明的方法制造的磷脂酶;(b)提供包括脂或垸基酯的生物質(zhì)組合物;(c)將(a)的磷脂酶與(b)的生物質(zhì)組合物接觸,以產(chǎn)生生物燃料或?qū)χ蜊ミM行酯交換;(B)(A)的方法,其中所述生物燃料是或包括生物柴油;(C)(A)或(B)的方法,其中所述包括脂或垸基酯的生物質(zhì)組合物是或包括植物油和/或動物脂肪;(D)(A)至(C)的任何方法,其中所述包括脂或垸基酯的生物質(zhì)組合物是或包括藻類、植物油、直鏈植物油、oil)、廢植物油(wastevegetableoil)、動物脂肪、動物脂(grease)、牛脂(tallow)、豬脂(lard)或黃油(yellowgrease);或(E)(A)至(D)的任何方法,其中所述磷脂酶是或包括具有SEQIDNO:l至SEQIDNO:178的任何一個所示的序列的多肽,或其任何組合。0112本發(fā)明提供生物燃料(a)其根據(jù)權(quán)利要求68所述的方法制備;(b)其包括(i)本發(fā)明的磷脂酶,或由本發(fā)明的核酸(多核苷酸)編碼的磷脂酶,或根據(jù)本發(fā)明方法制備的磷脂酶。0113本發(fā)明提供可溶性干酒糟(distillersdriedsoluble,DDS)、谷物干酒糟(distillersdriedgrain,DDS)、可溶性濃縮酒糟(acondenseddistillerssoluble,CDS)、谷物濕酒糟(adistillerswetgrain,DWG)或含可溶物的谷物干酒糟(distillersdriedgrainw他solubles,DDGS):其包括(i)具有SEQIDNO:l至SEQIDNO:178任何一個所示序列的所述磷脂酶,或其任何組合,或(ii)本發(fā)明的磷脂酶,或由本發(fā)明的核酸(多核苷酸)編碼的磷脂酶,或本發(fā)明方法制備的磷脂酶。0114本發(fā)明提供生物質(zhì),包括(a)(i)具有SEQIDNO:l至SEQIDNO:178任何一個所示序列的磷脂酶,或其任何組合,或(ii)本發(fā)明的磷脂酶,或由本發(fā)明的核酸(多核苷酸)編碼的磷脂酶,或本發(fā)明方法制備的磷脂酶;或(b)(a)的生物質(zhì),其中所述生物質(zhì)是或包括動物、藻類和/或植物生物質(zhì),或含脂類的生物質(zhì)或木質(zhì)纖維生物質(zhì),或者廢物材料;(c)(a)的生物質(zhì),其中所述生物質(zhì)是或包括生物乙醇、生物丙醇、生物丁醇、生物丙醇或生物甲醇或其任何組合。0115本發(fā)明提供基于石油的產(chǎn)品,其包括(a)(i)具有SEQIDNO:l至SEQIDNO:178任何一個所示的序列的磷脂酶,或其任何組合,或(ii)本發(fā)明的磷脂酶,或由本發(fā)明的核酸(多核苷酸)編碼的磷脂酶,或本發(fā)明方法制備的磷脂酶;或(b)(a)的基于石油的產(chǎn)品,其包括油、生物柴油或汽油、或生物乙醇、生物丙醇、生物丁醇、生物丙醇或生物甲醇;或者生物乙醇、生物丙醇、生物丁醇、生物丙醇或生物甲醇和/或生物柴油或汽油的混合物。0116本發(fā)明的一個或者多個實施方式的細(xì)節(jié)在附圖和以下的說明書中進行闡明。本發(fā)明的其它特征、目標(biāo)以及優(yōu)勢將通過閱讀說明書和附圖以及權(quán)利要求得變得顯而易見。0117出于各種目的,本文所引用的所有出版物、專利、專利申請、GenBank序列以及美國典型培養(yǎng)物保藏中心(ATCC)保藏物,通過引用特意并入本文。附圖簡述0118下圖是本發(fā)明的實施方式的示例性說明,并非為了限制權(quán)利要求所包含的發(fā)明范圍。0119圖l是計算機系統(tǒng)的框圖,具體細(xì)節(jié)如下所述。0120圖2是圖解過程200的一個方面的流程圖,為確定新序列與數(shù)據(jù)庫中序列間的同源性水平,將新的核苷酸或蛋白質(zhì)序列與序列數(shù)據(jù)庫相比較,具體細(xì)節(jié)如下所述。0121圖3是圖解在計算機中確定兩個序列是否是同源的過程的一種實施方式的流程圖,具體細(xì)節(jié)如下所述。0122圖4是圖解鑒定器過程的一個方面的流程圖,該鑒定器過程用于檢測序列中特征的存在與否,具體細(xì)節(jié)如下所述。0123圖5A、5B和5C示意性說明用于模擬PLC-介導(dǎo)的脫膠的典型兩相系統(tǒng),具體細(xì)節(jié)如下文實施例2中所述。0124圖6示意性說明了應(yīng)用本發(fā)明磷脂酶的示例性植物油精煉過程。0125圖7示意性說明了用于物理精煉油的本發(fā)明的示例性脫膠過程,具體細(xì)節(jié)如下所述。0126圖8示意性說明了用本發(fā)明的磷脂酶C進行的磷脂水解,具體細(xì)節(jié)如下所述。0127圖9示意性說明了本發(fā)明的示例性堿煉方法,并圖解了用本發(fā)明的磷脂酶C作為"堿煉助劑"(長混合堿煉,LongMixCausticRefining)的一個可選擇的實施方式,具體細(xì)節(jié)如下所述。0128圖IO示意性說明了應(yīng)用本發(fā)明的磷脂酶C作為脫膠助劑,具體細(xì)節(jié)如下所述。0129圖11是描述本發(fā)明的示例性核酸和多肽的選擇特征的表,如在下面所進一步詳細(xì)描述的。0130圖12示意性說明了來自本發(fā)明的兩個酶系統(tǒng)的數(shù)據(jù),如在下面實施例3中所述。0131圖13示意性說明了本發(fā)明的示例性堿煉方法,并圖解了一個可選的實施方式,包括應(yīng)用本發(fā)明的磷脂酶C作為"堿煉助劑"(長混合堿煉),如下面所詳細(xì)描述的。0132圖14圖解了本發(fā)明方法的另一種變化,其中在方法中使用了兩個離心歩驟,如下面所詳細(xì)描述的。0133圖15說明了本發(fā)明方法的另一種變化,其中在方法中使用了三個離心步驟,如下面所詳細(xì)描述的。0134圖16示出了本方法的另一種示例性變化,其使用酸處理并在脫膠步驟前有離心步驟,如下面所詳細(xì)描述的。0135圖17圖解了體外消化實驗的結(jié)果,其中本發(fā)明的磷脂酶C變體,如下面實施例4中所詳細(xì)描述的。0136圖18圖解了使用本發(fā)明的示例性酶進行的分批發(fā)酵罐培養(yǎng)的結(jié)果,如下面實施例5中所詳細(xì)描述的。0137圖19圖解了本發(fā)明的巴斯德畢赤酵母MutS菌株培養(yǎng)物的氧吸收速率(OxygenUptakeRate,"OUR")比較結(jié)果,如下面實施例5中所詳細(xì)描述的。0138圖20圖解了本發(fā)明的巴斯德畢赤酵母MutS菌株的甲醇消耗圖比較,如下面實施例5中所詳細(xì)描述的。0139圖21圖解了本發(fā)明SEQIDNO:2的示例性PLC酶的重組形式的培養(yǎng)物的"OUR"圖,如下面實施例5中所詳細(xì)描述的。0140圖22圖解了SDS-PAGE的結(jié)果,顯示了在培養(yǎng)物中產(chǎn)生的PLC蛋白的質(zhì)量,及與之相對應(yīng)的本發(fā)明SEQIDNO:2的示例性PLC酶的重組形式的培養(yǎng)物的"OUR"圖,如下面實施例5中所詳細(xì)描述的。0141圖23說明了SDS-PAGE的結(jié)果,顯示了活性PLC的數(shù)量,該活性PLC位于本發(fā)明SEQIDNO:2的示例性PLC酶的重組形式的培養(yǎng)物的細(xì)胞內(nèi),如下面實施例5中所詳細(xì)描述的。0142圖24說明了與活性PLC——本發(fā)明SEQIDNO:2的示例性PLC酶的重組形式相關(guān)的酵母細(xì)胞形態(tài)學(xué)變化的可視化圖,如下面實施例5中所詳細(xì)描述的。0143圖25用圖概述了數(shù)據(jù),顯示了在95hTFT(總發(fā)酵時間),在畢赤酵母中使用本發(fā)明SEQIDNO:2的示例性PLC酶進行的PLC生產(chǎn)性能的狀態(tài),如下面實施例5中所詳細(xì)描述的。0144圖26是數(shù)據(jù)簡表,這些數(shù)據(jù)來自對本發(fā)明的示例性zeocin-適應(yīng)的細(xì)胞菌落的表達篩選,如下面實施例5中所詳細(xì)描述的。0145圖27說明了數(shù)據(jù),這些數(shù)據(jù)顯示在含有本發(fā)明的示例性zeocin-適應(yīng)的細(xì)胞菌落的培養(yǎng)物中,PLC蛋白水平是較高的,如下面實施例5中詳細(xì)描述地。0146圖28說明了數(shù)據(jù),這些數(shù)據(jù)顯示了本發(fā)明的zeocin-適應(yīng)的菌落與對照的生長比較,如下面實施例5中所詳細(xì)描述的。0147圖29說明了加熱實驗的結(jié)果,顯示了本發(fā)明SEQIDNO:2的示例性酶的熱穩(wěn)定性,圖中指出了實驗條件,如下面實施例6中所詳細(xì)描述的。0148圖30說明了總結(jié)加熱實驗的NMR數(shù)據(jù),證明了本發(fā)明SEQIDNO:2的示例性酶的熱穩(wěn)定性,如下面實施例6中所詳細(xì)描述的。0149圖31、32和33說明了數(shù)據(jù),使用p-NPPC,這些數(shù)據(jù)證明了SEQIDNO:2的熱穩(wěn)定性,實驗條件為圖中所示的條件,如下面實施例6中所詳細(xì)描述的。0150圖34說明了數(shù)據(jù),使用DSC分析,這些數(shù)據(jù)證明了SEQIDNO:2的熱穩(wěn)定性,如下面實施例6中所詳細(xì)描述的。0151圖35說明了在用本發(fā)明突變體磷脂酶處理后,單獨磷脂(PL)種類(PA、PE、PI和PC)相對于剩余的總PL的重量分?jǐn)?shù)。0152圖36說明了選擇包含在基因重裝配文庫(GeneReassemblyLibrary)中的GSSM高表達突變型(upmutant),其包括本發(fā)明示例性的磷脂酶。0153圖37說明了示例性的醇方法,其可包括本發(fā)明酶的使用。0154在不同的附圖中同樣的標(biāo)記符號表示同樣的要素。發(fā)明詳述0155本發(fā)明提供了磷脂酶,如,具有磷脂酶A、B、C和D、patatin、磷脂酸磷酸酶(PAP)和/或脂酰水解酶(LAH)或等同活性的多肽,編碼它們的核酸,以及制備和應(yīng)用它們的方法。本發(fā)明提供了有效地切割油,如植物油,例如油籽磷脂中的甘油磷酸酯鍵,產(chǎn)生水可提取的磷酸化的堿和甘油二酯的酶。一方面,本發(fā)明的磷脂酶具有脂酰水解酶(LAH)的活性。在可選的方面,本發(fā)明的磷脂酶可以切割磷脂酰膽堿(PC)、磷脂酰乙醇胺(PE)、磷脂酰絲氨酸(PS)、磷脂酰肌醇(PI)、磷脂酸和/或鞘磷脂或它們的組合中的甘油磷酸酯鍵。例如,一方面,本發(fā)明的磷脂酶對一種或多種特定的底物具有特異性,例如本發(fā)明的酶可以對PE和PC;PE和PI;PE和PS;PS禾口PE;PS禾口PI;PI禾口PE;PS、PI禾口PC;PE、PI禾口PC;或PE、PS、PI和PC具有特異性作用。0156本發(fā)明的磷脂酶(如,具有磷脂酶A、B、C和D、patatin、磷脂酸磷酸酶(PAP)和/或脂酰水解酶(LAH)或等同活性的多肽)可以用于植物油的酶法脫膠,這是因為磷酸部分可溶于水,并且容易去除。甘油二酯產(chǎn)物將仍存留在油中,從而降低損失。在商業(yè)油脫膠中,諸如ENZYMAX⑧方法中,本發(fā)明的PLC可以用于加入到PLA1和PLA2或者替換PLA1和PLA2,其中磷脂是由PLA1和PLA2水解的。0157在一方面,本發(fā)明的磷脂酶在高溫和/或低溫下,或者在較寬的溫度范圍內(nèi),具有活性,例如,它們可以在2(TC到9(TC,3(TC到80。C,或者在40'C到7(TC的溫度范圍內(nèi)具有活性。本發(fā)明也提供在堿性pH或者酸性pH下,例如低的水酸度具有活性的本發(fā)明的磷脂酶??蛇x擇的方面,本發(fā)明的磷脂酶可以在酸性pH低至pH6.5、pH6.0、pH5.5、pH5.0、pH4.5、pH4.0、和pH3.5或酸性更大(即pH〈3.5)的條件下具有活性。在可選的方面,本發(fā)明的磷脂酶可以在堿性pH高至pH7.5、pH8.0、pH8.5、pH9.0、pH9.5、pH10或堿性更大(即pH〉10)的條件下具有活性。一方面,本發(fā)明的磷脂酶在低水活度(低的水含量)條件下,在約40到約7(TC、75'C或8(TC或更大溫度的溫度范圍內(nèi)具有活性。0158本發(fā)明也提供了進一步修飾本發(fā)明的示例性磷脂酶,以便產(chǎn)生具有期望特性的酶的方法。例如,由本發(fā)明方法產(chǎn)生的磷脂酶可以具有改變的底物特異性、底物結(jié)合特異性、底物切割形式、熱穩(wěn)定性、pH/活性曲線、pH/穩(wěn)定性曲線(如在低pH值,例如pI"K6或者pPK5,或者高的pH值,如pH〉9的情況下熱穩(wěn)定性提高)、對于氧化作用的穩(wěn)定性、012+的依賴性、比活性和類似特性。本發(fā)明提供對于任何感興趣特性的改變。例如,這些改變可以產(chǎn)生與親本磷脂酶相比,具有改變的pH和溫度活性曲線的變體。0159在一方面,本發(fā)明的磷脂酶被用于各種植物油處理步驟中,如植物油提取中,特別地,用于在稱為"油脫膠"的過程中去除"磷脂膠",如在此所述。本發(fā)明提供了組合物(例如包含本發(fā)明酶的組合物)和由各種來源生產(chǎn)植物油的方法,所述各種來源如米糠、大豆、油菜、花生、芝麻、向日葵和玉米。本發(fā)明的磷脂酶可以在任何植物油加工步驟中用于替代PLA,例如磷脂酶A2。0160術(shù)語"磷脂酶"包括具有任何磷脂酶活性的酶,例如,切割油中,如植物油中的甘油磷酸酯鍵(催化水解甘油磷酸酯鍵)。本發(fā)明的磷脂酶活性可以產(chǎn)生水可提取的磷酸化的堿以及甘油二酯。本發(fā)明的磷脂酶活性也包括在高溫、低溫、堿性pH和酸性pH條件下水解甘油磷酸酯鍵。術(shù)語"磷脂酶活性"也包括切割甘油磷酸酯,產(chǎn)生水可提取的磷酸化的堿以及甘油二酯。術(shù)語"磷脂酶活性"也包括切割磷脂中甘油和磷酸的酯鍵。術(shù)語"磷脂酶活性"也包括其它的活性,如結(jié)合并水解底物,如油,例如植物油的能力,底物也包括植物和動物的卵磷脂、磷脂酰乙醇胺、磷脂酰絲氨酸和鞘磷脂。磷脂酶活性可以包括磷脂酶C(PLC)的活性;磷脂酶A(PLA)的活性,如磷脂酶A1或者磷脂酶A2的活性;磷脂酶B(PLB)活性,如磷脂酶B1或者磷脂酶B2的活性,包括溶血磷脂酶(LPL)活性和/或溶血磷脂酶-轉(zhuǎn)?;?LPTA)活性;磷脂酶D(PLD)的活性,如磷脂酶D1或者磷脂酶D2的活性;和/或patatin活性或它們的任何組合。磷脂酶活性可以包括水解糖蛋白,如馬鈴薯塊莖中或者任何茄屬(So/a"ww)植物,如馬鈴薯(So/"層w中的糖蛋白。磷脂酶活性可以包括patatin酶活性,如patatin酯酶活性(見,例如,Jimenez(2002)Biotechnol.Prog.18:635-640)。磷脂酶活性可以包括脂酰水解酶(LAH)活性。磷脂酶活性可以包括對一種或多種特定的底物具有特異性,例如本發(fā)明的酶可以對PE和PC;PE和PI;PE禾口PS;PS禾口PE;PS禾口PI;PI禾口PE;PS、PI禾口PC;PE、PI禾口PC;或PE、PS、PI和PC,或它們的任何組合具有特異性作用。0161一方面,本發(fā)明的磷脂酶可以具有多功能活性,例如一種或多種本文中描述的酶活性的組合。例如,一方面,本發(fā)明的多肽具有酶活性,但是缺少脂酶活性,或缺少影響中性油(甘油三脂)部分的任何酶活性。在特定的方法中,例如在脫膠方法中使用這樣的多肽可能是有利的,在脫膠方法中,中性油部分不受損害(減少、降解例如水解)是重要的。因此,一方面,本發(fā)明提供了脫膠方法,該方法包括使用具有磷脂酶活性但是缺少脂酶活性的本發(fā)明的多肽。0162一方面,本發(fā)明的PLC磷脂酶利用(例如催化水解)各種磷脂底物,包括磷脂酰膽堿(PC)、磷脂酰乙醇胺(PE)、磷脂酰絲氨酸(PS)、磷脂酰肌醇(PI)和/或磷脂酸或它們的組合。此外,這些酶對溶血磷脂形式的這些磷脂具有不同程度的活性。在不同的方面,本發(fā)明的PLC酶可以對磷脂酰膽堿和磷脂酰乙醇胺底物顯示出優(yōu)選性。0163一方面,本發(fā)明的磷脂酰肌醇PLC磷脂酶利用各種磷脂底物,包括磷脂酰膽堿、磷脂酰乙醇胺、磷脂酰絲氨酸、磷脂酰肌醇和磷脂酸或它們的組合。此外,這些酶可以對溶血磷脂形式的這些磷脂具有不同程度的活性。在不同的方面,本發(fā)明的磷脂酰肌醇PLC酶可以對磷脂酰肌醇底物顯示出優(yōu)選性。0164一方面,本發(fā)明的patatin酶利用各種磷脂底物,包括磷脂酰膽堿、磷脂酰乙醇胺、磷脂酰絲氨酸、磷脂酰肌醇和磷脂酸或它們的組合。此外,這些酶可以對溶血磷脂形式的這些磷脂具有不同程度的活性。在不同的方面,本發(fā)明的patatin酶可以基于氨基序列相似性的保守性。在不同的方面,這些酶展示出多組不同的生物化學(xué)活性,并可以發(fā)揮PLA1、PLA2、PLC或PLD酶類的反應(yīng)特征。0165一方面,本發(fā)明的PLD磷脂酶利用各種磷脂底物,包括磷脂酰膽堿、磷脂酰乙醇胺、磷脂酰絲氨酸、磷脂酰肌醇和磷脂酸或它們的組合。此外,這些酶可以對溶血磷脂形式的這些磷脂具有不同程度的活性。一方面,這些酶可用于進行酯交換反應(yīng),以產(chǎn)生有結(jié)構(gòu)的磷脂。0166如在此所用的,術(shù)語"陣列(array)"或者"微陣列(microarray)"或者"生物芯片(biochip)"或者"芯片(chip)"是許多靶元素,每一個靶元素包括確定量的一個或者多個多肽(包括抗體)或者固定于底物表面的確定區(qū)域上的核酸,如下面進一步詳細(xì)討論的。0167如在此所用的,術(shù)語"計算機","計算機程序"和"處理器"以其最廣義的一般語境使用,并整合所有這樣的設(shè)備,如以下詳細(xì)描述的。0168特定的多肽或者蛋白的"編碼序列"或者"編碼特定的多肽或者蛋白的序列",是指當(dāng)置于合適的調(diào)控序列的控制下時可以轉(zhuǎn)錄和翻譯成多肽或者蛋白的核酸序列。0169在此使用的術(shù)語"表達盒(expressioncassette)"是指在宿主中可以影響結(jié)構(gòu)基因(即,編碼蛋白質(zhì),如本發(fā)明的磷脂酶的序列)表達的核苷酸序列,所述宿主與所述序列相容。表達盒包括至少一個與編碼多肽的序列可操作地連接的啟動子;并且,任選地,與其它的序列例如轉(zhuǎn)錄終止信號可操作地連接。也可以應(yīng)用進行表達所必要的或有幫助的額外的因子,例如增強子。如在此所應(yīng)用的"可操作地連接(operablylinked)"是指連接DNA序列上游的啟動子,這樣該啟動子能夠介導(dǎo)該DNA序列的轉(zhuǎn)錄。因此,表達盒也包括質(zhì)粒、表達載體、重組病毒、任何形式的重組的"裸露DNA"載體,和類似物。"載體"包括可以感染、轉(zhuǎn)染、瞬間或者永久轉(zhuǎn)導(dǎo)細(xì)胞的核酸。將被認(rèn)識到,載體可以是裸露的核酸,或者與蛋白或者脂類復(fù)合的核酸。載體任選地包括病毒或者細(xì)菌的核酸和/或蛋白,和/或膜(如,細(xì)胞膜,病毒的脂包膜,等等)。載體包括,但不限于復(fù)制子(如,RNA復(fù)制子,細(xì)菌噬菌體),DNA片段可以與其連接,并被復(fù)制。載體因此包括,但不限于是RNA,自主復(fù)制的環(huán)狀或者線性的DNA或者RNA(如質(zhì)粒、病毒以及類似物,參見,如美國專利第5,217,879號),并且也包括表達質(zhì)粒和非表達質(zhì)粒。當(dāng)重組微生物或者細(xì)胞培養(yǎng)物被描述為容納"表達載體"時,其包括染色體外的環(huán)狀和線性DNA,和己經(jīng)整合進入宿主染色體的DNA。當(dāng)載體由宿主細(xì)胞維持時,該載體可以在細(xì)胞有絲分裂期間作為自主結(jié)構(gòu)由細(xì)胞穩(wěn)定地復(fù)制,或者整合入宿主基因組中。0170"質(zhì)粒"命名為在大寫字母和/或數(shù)字之前和/或之后加上小寫字母"p"。在此使用的起始質(zhì)粒(startingplasmid)可以通過商業(yè)渠道獲得,通過公共渠道自由獲得,或者按照公開的程序從可利用的質(zhì)粒構(gòu)建得到。此外,與那些在此描述的質(zhì)粒等價的質(zhì)粒是在本領(lǐng)域是已知的,并且對普通技術(shù)人員而言是顯而易見的。0171術(shù)語"基因"是指參與產(chǎn)生多肽鏈的DNA片段,包括在編碼區(qū)的前面和后面的區(qū)域,如頭部和尾部,啟動子和增強子,以及適當(dāng)情況下,單個編碼片段(外顯子)之間的插入序列(內(nèi)含子),等等。0172如本文所用,短語"核酸"或者"核酸序列"是指寡核苷酸、核苷酸、多核苷酸、或者是指它們中的任何之一的片段,是指基因組或者合成來源的DNA或者RNA(如,mRNA、rRNA、tRNA、iRNA),其可以是單鏈的或者雙鏈的,并且可以代表有義鏈或者無義鏈,是指肽核酸(PNA),或者是指任何DNA樣或RNA樣的物質(zhì),天然的或者合成來源的,包括如iRNA,核糖核蛋白(如雙鏈iRNA,如iRNPs)。該術(shù)語包括核酸,即,寡核苷酸,包括天然核苷酸的已知類似物。該術(shù)語也包括具有合成骨架的核酸樣結(jié)構(gòu),參見如Mata(1997)Toxicol.Appl.Pharmacol.144:189-197;Strauss-Soukup(1997)Biochemistry36:8692-8698;Samstag(1996)AntisenseNucleicAcidDrugDev6:153-156。0173如本文所用,"氨基酸"或者"氨基酸序列"是指寡肽、肽、多肽或者蛋白序列,或者是指這些序列中的任何序列的片段、部分或亞基,并且是指天然產(chǎn)生的或者合成的分子。0174如本文所用,術(shù)語"多肽"和"蛋白"是指通過肽鍵或者修飾的肽鍵相互連接在一起的氨基酸,即,肽等排體(peptideisosteres),可以含有除了20個基因編碼的氨基酸外的修飾氨基酸。術(shù)語"多肽"也指肽或者多肽片段,基序和類似物。該術(shù)語也包括糖基化的多肽。本發(fā)明的肽或者多肽也包括所有"模擬"和"肽模擬"形式,正如下面進一步詳細(xì)描述的。0175如本文所用,術(shù)語"分離的"是指從原始的環(huán)境(例如天然環(huán)境,如果該環(huán)境是天然存在的話)中移取的物質(zhì)。例如,存在于活動物中的天然發(fā)生的多核苷酸或者多肽不是分離的,但是,如果該同樣的多核苷酸或者多肽,與天然系統(tǒng)中的一些或者所有的共存物分離,那么就是分離的。這樣的多核昔酸可以是載體的一部分和/或這樣的多核苷酸或者多肽可以是組合物的一部分,并且仍然是分離,這是因為這樣的載體或者組合物不是其天然環(huán)境的一部分。如本文所用,分離的物質(zhì)或者組合物也可以是"純化"的組合物,S卩,它并不需要絕對的純度;相反,這意味著是一個相對定義。從文庫中得到的單個核酸可以經(jīng)過常規(guī)純化為具有電泳均一性。在可選擇的方面,本發(fā)明提供從基因組DNA或者從文庫中的其它序列中或者其它的環(huán)境中以至少一個、兩個、三個、四個、五個或者更多數(shù)量級純化得到的核酸。0176如本文所用,術(shù)語"重組子"是鄰接于"骨架"核酸的核酸,而在天然環(huán)境下它們并不鄰接。在一方面,核酸代表了核酸"骨架分子"群體中5%或者更多數(shù)目的核酸插入物。本發(fā)明的"骨架分子"包括核酸,如表達載體、自主復(fù)制核酸、病毒、整合性核酸,和用于維持或者操作感興趣的核酸插入物的其它的載體或者核酸。在一方面,富集的核酸代表了重組骨架分子群體中的15%、20%、30%、40%、50%、60%、70%、80%、90%或者更多數(shù)目的核酸插入物。"重組"多肽或者蛋白是指由重組DNA技術(shù)產(chǎn)生的多肽或者蛋白,如,從用編碼所需多肽或者蛋白的外源DNA構(gòu)建物轉(zhuǎn)化的細(xì)胞產(chǎn)生。"合成的"多肽或者蛋白是那些通過化學(xué)合成制備的多肽或者蛋白,如下面進一步詳細(xì)描述地。0177如下面進一步討論地,當(dāng)在啟動子處啟動轉(zhuǎn)錄的RNA聚合酶將編碼序列轉(zhuǎn)錄成為mRNA時,啟動子序列被"可操作地連接于"編碼序列。0178"寡核苷酸"是指單鏈多聚脫氧核苷酸或者可以被化學(xué)合成的兩個互補的多聚脫氧核苷酸鏈。這樣的合成的寡核苷酸沒有5'磷酸,因此如果不在存在激酶的情況下采用ATP添加磷酸,該合成寡核苷酸便不會連接到另一個寡核苷酸上。合成的寡核苷酸可以連接到?jīng)]有被去磷酸化的片段上。0179在兩個核酸或者多肽的上下文中,短語"實質(zhì)上相同(substantiallyidentical)",是指當(dāng)比較和比對最大對應(yīng)性(correspondence)時,具有至少50%、60%、70%、75%、80%、85%、90%、95%、98%或者99%的核苷酸或者氨基酸殘基(序列)的同一性的兩個或者多個序列,所述最大對應(yīng)性用一個任何已知的序列比較算法測量,如以下詳細(xì)討論的,或者通過目測的方法測量。在可選的方面,本發(fā)明提供與本發(fā)明的示例性序列,例如具有一個或多個編碼E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突變的SEQIDNO:175或SEQIDNO:176等等,在核酸或者多肽的至少大約100個殘基、150個殘基、200個殘基、300個殘基、400個殘基或者從約50個殘基到全長的區(qū)域范圍內(nèi),具有實質(zhì)上同一性的核酸和多肽序列。本發(fā)明的核酸序列可以在多肽編碼區(qū)域的整個長度上實質(zhì)一致。0180另外,"實質(zhì)上相同"的氨基酸序列是與參考序列差異一個或者多個保守性或者非保守性氨基酸置換、缺失或者插入的序列,特別地,當(dāng)這樣的置換發(fā)生在分子的非活性位點的位置上,并且前提是多肽基本上保留其功能特性。保守氨基酸置換,例如,用一個氨基酸置換另一個同類的氨基酸(如,將一個疏水性氨基酸,如異亮氨酸、纈氨酸、亮氨酸或者甲硫氨酸置換為另一個疏水性氨基酸,或者將一個極性氨基酸置換為另一個極性氨基酸,諸如用精氨酸置換賴氨酸,用谷氨酸置換天冬氨酸,或者用谷酰胺置換天冬酰胺)。可以缺失一個或者多個氨基酸,例如,從磷脂酶多肽中缺失一個或者多個氨基酸,從而對多肽結(jié)構(gòu)進行修飾,而并不顯著改變其生物活性。例如,可以去除對于磷脂酶的生物活性并不需要的氨基或者羧基端氨基酸??梢酝ㄟ^很多方法中的任何方法分析本發(fā)明修飾的多肽序列的磷脂酶生物活性,包括將修飾的多肽序列與磷脂酶底物接觸,并且確定是否修飾的多肽減少了分析中的特異底物的量或者增加了功能性磷脂酶與底物的酶促反應(yīng)的生物產(chǎn)物的量,如下面進一步論述地。0181"雜交"是指通過堿基配對,核酸鏈與互補鏈結(jié)合的過程。雜交反應(yīng)可能是敏感的并且具有選擇性,這樣可以鑒定在樣品中以低濃度存在的感興趣的特定的序列。合適的嚴(yán)格條件可以通過例如,預(yù)雜交和雜交溶液中的鹽和甲酰胺濃度,或者雜交溫度來確定,并且在本領(lǐng)域是熟知的。例如,嚴(yán)格性可以通過降低鹽濃度,增加甲酰胺的濃度,或者提高雜交溫度,改變雜交時間而增加,如下面所詳細(xì)描述地。在可選的方面,本發(fā)明的核酸通過它們在各種嚴(yán)格條件下(如,高、中和低嚴(yán)格條件)的雜交能力來定義,如在此所闡明地。0182術(shù)語"變體"是指在一個或者多個堿基對、密碼子、內(nèi)含子、外顯子、或者氨基酸殘基(分別地)被修飾,但仍保持本發(fā)明的磷脂酶生物活性的本發(fā)明的多核苷酸或者多肽。變體可以通過很多種方法中的任何方法產(chǎn)生,例如易錯PCR、重排、寡核苷酸定向誘變、裝配PCR、有性PCR誘變、體外誘變、盒式誘變、遞歸整體誘變、指數(shù)整體誘變、定點誘變、基因重裝配、GSSM和它們的任何組合。在此包括了產(chǎn)生在一定的pH或溫度下具有活性的變體磷脂酶,例如不同于野生型磷脂酶的變體磷脂酶的技術(shù)。0183術(shù)語"飽和誘變"、基因位點飽和誘變TM(GSSM)或者"GSSM",包括應(yīng)用簡并性寡核苷酸引物將點突變引入多核苷酸中的方法,如下詳細(xì)描述地。0184術(shù)語"優(yōu)化的定向進化系統(tǒng)"或者"優(yōu)化的定向進化"包括對相關(guān)核酸序列,例如相關(guān)基因的片段重新進行裝配的方法,并在下面進行了詳細(xì)解釋。0185術(shù)語"合成連接重裝配"或者"SLR"包括以非隨機的方式連接寡核苷酸片段的方法,并在下面進行了詳細(xì)解釋。核酸的產(chǎn)生和操作0186本發(fā)明提供分離的和重組的核酸(例如具有一個或多個編碼E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突變的示例性SEQIDNO:177或SEQIDNO:178),包括編碼本發(fā)明的多肽和磷脂酶的表達盒,如表達載體。本發(fā)明也包括應(yīng)用本發(fā)明的核酸發(fā)現(xiàn)新的磷脂酶序列的方法。也提供用于修飾本發(fā)明核酸的方法,例如通過合成連接重裝配、優(yōu)化的定向進化系統(tǒng)和/或飽和誘變。0187通過,例如克隆和表達cDNA文庫,通過PCR擴增信使或者基因組DNA,和類似方法,可以制備、合成和/或操作本發(fā)明的核酸。在實踐本發(fā)明的方法中,通過操作模板核酸,可以修飾同源基因,如本文所述的??梢耘c本領(lǐng)域已知的其它任何方法或者方案或者裝置結(jié)合來實踐本發(fā)明,這些方法或者方案或者裝置在科學(xué)和專利文獻中得到充分描述。一麼財0188用于實踐本發(fā)明的核酸,不管是RNA、iRNA、反義核酸、cDNA、基因組DNA、載體、病毒或者它們的雜合體,都可以從不同的來源分離、進行遺傳工程改造、擴增和/或表達/重組產(chǎn)生。從這些核酸產(chǎn)生的重組多肽可以單獨分離或者克隆,并且檢測所需的活性。可以應(yīng)用任何重組表達系統(tǒng),包括細(xì)菌、哺乳動物、酵母、昆蟲或者植物細(xì)胞表達系統(tǒng)。0189可選地,這些核酸可以通過已知的化學(xué)合成技術(shù)在體外合成,如在例如Adams(1983)J.Am.Chem,Soc.105:661;Belousov(1997)NucleicAcidsRes.25:3440-3444;Frenkel(1995)FreeRadic.Biol.Med.19:373-380;Blommers(1994)Biochemistry33:7886-7896;Narang(1979)Meth.Enzymol.68:90;Brown(1979)Meth.Enzymol.68:109;Beaucage(1981)Tetra.Lett.22:1859;美國專利4,458,066中描述的。0190用于操縱核酸的技術(shù),例如亞克隆、標(biāo)記探針(例如使用Klenow聚合酶的隨機引物標(biāo)記、切口平移、擴增)、測序、雜交以及類似的技術(shù)在科學(xué)和專利文獻中有充分的描述,例如參見Sambrook編著,MOLECULARCLONING:ALABORATORYMANUAL(2NDED.),1-3巻,ColdSpringHarborLaboratory,(1989);CURRENTPROTOCOLSINMOLECULARBIOLOGY,Ausubel編著,JohnWiley&Sons,Inc.,NewYork(1997);LABORATORYTECHNIQUESINBIOCHEMISTRYANDMOLECULARBIOLOGY:HYBRIDIZATIONWITHNUCLEICACIDPROBES,PartI.TheoryandNucleicAcidPreparation,Tijssen,ed.Elsevier,N.Y,(1993)。0191獲得和操縱用于實踐本發(fā)明的方法的核酸的另一個有用方法是從基因組樣品中克隆,并且如果期望的話,篩選和再克隆插入物,插入物可以分離或擴增自例如基因組克隆或cDNA克隆。用于本發(fā)明的方法中的核酸的來源包括基因組或cDNA文庫,所述文庫可以包含在例如哺乳動物人工染色體(MACs),例如參見美國專利5,721,118;6,025,155;人類人工染色體,例如參見Rosenfeld(1997)Nat.Genet,15:333-335;酵母人工染色體(YAC);細(xì)菌人工染色體(BAC);PI人工染色體,例如參見Woon(1998)Genomics50:306-316;PI來源的載體(PACs),例如參見Kern(1997)Biotechniques23:120-124;粘粒、重組病毒、噬菌體或質(zhì)粒中。0192在一方面,編碼本發(fā)明的多肽的核酸與能指導(dǎo)翻譯出的多肽或其片段的分泌的前導(dǎo)序列以適當(dāng)?shù)奈恢藐P(guān)系進行裝配。0193本發(fā)明提供了融合蛋白和編碼這些融合蛋白的核酸。本發(fā)明的多肽可以被融合到異源肽或多肽上,如N-末端鑒定肽,其給予了期望的特性,如增加的穩(wěn)定性或簡化的純化特性。本發(fā)明的肽和多肽也可以作為融合蛋白被合成和表達,其中所述融合蛋白中連接有一個或多個額外的結(jié)構(gòu)域,例如用于產(chǎn)生免疫原性更強的肽、以便更易于分離重組合成的肽、以便鑒定和分離抗體和表達抗體的B細(xì)胞,等等。有利于檢測和純化的結(jié)構(gòu)域包括,例如金屬螯合肽,如多組氨酸標(biāo)記和組氨酸-色氨酸模塊,其允許在固定的金屬上純化,還包括蛋白A結(jié)構(gòu)域,其允許在固定的免疫球蛋白上純化,還包括在FLAGS延伸/親和純化系統(tǒng)中所使用的結(jié)構(gòu)域(ImmunexCorp,SeattleWA)。在純化結(jié)構(gòu)域和含有基序的肽或多肽之間包含可切裂的連接子序列有助于純化,這樣的連接子序列例如Xa因子或腸激酶(Invitrogen,SanDiegoCA)。例如,表達載體可以包括編碼表位的核酸序列,其連接到六組氨酸殘基上,還連接有硫氧還蛋白和腸激酶切割位點(例如參見Williams(1995)Biochemistry34:1787-1797;Dobeli(1998)ProteinExpr.Purif.12:404-414)。組氨酸殘基有助于檢測和純化,而腸激酶切割位點提供了從融合蛋白的剩余部分純化表位的手段。關(guān)于編碼融合蛋白的載體的技術(shù)以及融合蛋白的應(yīng)用在科學(xué)和專利文獻中進行了充分的描述,例如參見Kroll(1993)DNACell.Biol.,12:441-53。録禱鞭劍謂0194本發(fā)明提供了可操作地連接到一個或多個表達(例如轉(zhuǎn)錄或翻譯)控制序列上的本發(fā)明的核酸(例如DNA)序列,所述控制序列例如啟動子或增強子,它們指導(dǎo)或調(diào)節(jié)RNA合成/表達。表達控制序列可以在表達載體中。示例性的細(xì)菌啟動子包括lacl、lacZ、T3、T7、gpt、人PR、PL和trp。示例性的真核啟動子包括CMV即時早期啟動子、HSV胸苷激酶啟動子、早期和晚期SV40啟動子、來自逆轉(zhuǎn)錄病毒的LTR啟動子以及鼠金屬硫蛋白I啟動子。0195適合于在細(xì)菌中表達多肽的啟動子包括大腸桿菌(£.^//)^1(;或1。啟動子、lacl啟動子、lacZ啟動子、T3啟動子、T7啟動子、gpt啟動子、人PR啟動子和XPL啟動子、來自編碼糖酵解酶如3-磷酸甘油酯激酶(PGK)的操縱子的啟動子以及酸性磷酸酶啟動子。真核啟動子包括CMV即時早期啟動子、HSV胸苷激酶啟動子、熱激啟動子、早期和晚期SV40啟動子、來自逆轉(zhuǎn)錄病毒的LTRs、以及小鼠金屬硫蛋白-I啟動子。也可以使用已知在原核或真核細(xì)胞或它們的病毒中控制基因表達的其它啟動子。表達載嫌藩載銀0196本發(fā)明提供包括本發(fā)明的核酸,如,編碼本發(fā)明的磷脂酶的序列的表達載體和克隆載體。本發(fā)明的表達載體和克隆載體可以包括病毒顆粒、桿狀病毒、噬菌體、質(zhì)粒、噬菌粒、粘粒、fos-質(zhì)粒(fosmids)、細(xì)菌人工染色體、病毒DNA(如,牛痘、腺病毒、禽痘病毒、偽狂犬病病毒和SV40衍生物),以P1為基礎(chǔ)的人工染色體、酵母質(zhì)粒、酵母人工染色體以及對感興趣的特定宿主(如桿菌屬(5a"7/"s)、曲霉屬U^wg///^)和酵母)特異的任何其它載體。本發(fā)明的載體可以包括染色體的,非染色體的和合成的DNA序列。很多合適的載體為本領(lǐng)域技術(shù)人員所知的,并且可以商業(yè)獲得。典型的載體包括細(xì)菌的pQE載體(Qiagen)、pBluescript質(zhì)粒、pNH載體、(X-ZAP載體(Stratagene);ptrc99a、pKK223-3、pDR540、pRIT2T(Pharmacia);真核的PXT1、pSG5(Stmtagene)、pSVK3、pBPV、pMSG、pSVLSV40(Pharmacia)。然而,也可以應(yīng)用任何其它的質(zhì)?;蚱渌妮d體,只要它們可以在宿主中復(fù)制并且可存活??梢栽诒景l(fā)明中使用低拷貝數(shù)或高拷貝數(shù)的載體。0197表達載體可以包括啟動子、用于起始翻譯的核糖體結(jié)合位點和轉(zhuǎn)錄終止子。載體也可以包括用于擴增表達的合適序列。哺乳動物表達載體可以包括復(fù)制起點、任何必需的核糖體結(jié)合位點、聚腺苷酸化位點、剪接供體和受體位點、轉(zhuǎn)錄終止序列、5'側(cè)翼非轉(zhuǎn)錄序列。在一些方面,衍生于SV40剪接子和聚腺苷酸化位點的DNA序列可以用于提供所需要的非轉(zhuǎn)錄遺傳元件。0198在一個方面,表達載體含有一個或多個選擇性標(biāo)記基因,使得可以對含有該載體的宿主細(xì)胞進行選擇。這樣的選擇性標(biāo)記包括編碼二氫葉酸還原酶的基因或使得真核細(xì)胞培養(yǎng)物具有新霉素抗性的基因、使得大腸桿菌(五.co//)具有四環(huán)素或氨芐青霉素抗性的基因和釀酒酵母(S.ce^Ww'^)TRP1基因。啟動子區(qū)域可以從任何期望的基因中選擇出來,使用氯霉素轉(zhuǎn)移酶(CAT)載體或具有選擇標(biāo)記的其它載體。0199用于在真核細(xì)胞中表達多肽或其片段的載體也可以含有增強子,以增加表達水平。增強子是DNA的順式作用元件,一般長度為大約10到大約300bp,其作用于啟動子,增強其轉(zhuǎn)錄。例子包括在復(fù)制起點下游側(cè)100bp到270bp的SV40增強子、巨細(xì)胞病毒早期啟動子增強子、在復(fù)制起點下游側(cè)的多瘤增強子,和腺病毒增強子。0200DNA序列可以通過各種方法插入載體中。一般而言,將插入物和載體用合適的限制性內(nèi)切酶消化后,DNA序列可以連接到載體中的所希望的位置??蛇x擇地,插入物和載體的平末端可以被連接。多種克隆技術(shù)在本領(lǐng)域己知,例如在Ausubel禾QSambrook中描述的。這樣的方法和其它方法被認(rèn)為在本領(lǐng)域技術(shù)人員的范圍內(nèi)。0201載體可以是質(zhì)粒、病毒顆?;蚴删w的形式。其它載體包括染色體的、非染色體的和合成的DNA序列,SV40的衍生物;細(xì)菌質(zhì)粒、噬菌體DNA、桿狀病毒、酵母質(zhì)粒、衍生于質(zhì)粒和噬菌體DNA的組合的載體、病毒DNA例如牛痘、腺病毒、禽痘病毒和偽狂犬病病毒DNA。在原核和真核宿主中使用的各種克隆和表達載體被例如Sambrook描述。0202可以使用的具體細(xì)菌載體包括商業(yè)上可獲得的質(zhì)粒,其包括以下熟知的克隆載體的遺傳元件pBR322(ATCC37017)、pKK223-3(PharmaciaFineChemicals,Uppsala,Sweden)、GEM1(PromegaBiotec,Madison,WI,USA)、pQE70、pQE60、pQE-9(Qiagen)、pD10、psiX174pBluescriptIIKS、pNH8A、pNH16a、pNH18A、pNH46A(Stratagene)、p加99a、pKK223-3、pKK233-3、DR540、pRIT5(Pharmacia)、pKK232-8和pCM7。具體的真核載體包括pSV2CAT、pOG44、pXTl、pSG(Stratagene)pSVK3、pBPV、pMSG和pSVL(Pharmacia)。然而,可以使用任何其它載體,只要它可以在宿主細(xì)胞中復(fù)制和存活。涼主潘扉存歸謝應(yīng)0203本發(fā)明也提供包括發(fā)明核酸序列,如編碼本發(fā)明磷脂酶的序列、本發(fā)明的載體的轉(zhuǎn)化的細(xì)胞。宿主細(xì)胞可以是本領(lǐng)域技術(shù)熟練人員所熟悉的任何宿主細(xì)胞,包括原核細(xì)胞,真核細(xì)胞,如細(xì)菌細(xì)胞、真菌細(xì)胞、酵母細(xì)胞、哺乳動物細(xì)胞、昆蟲細(xì)胞或者植物細(xì)胞。本發(fā)明的酶可以在任何宿主細(xì)胞中表達,例如任何細(xì)菌細(xì)胞、任何酵母細(xì)胞,例如巴斯德畢赤酵母、釀酒酵母或粟酒裂殖酵母(&^zo抑cc/aramj;c^p謹(jǐn)6e)。示例性的細(xì)菌細(xì)胞包括埃希氏菌屬(&c/zm'c/n'")、桿菌屬d"7/船)、鏈霉菌屬(&r印to附^m)、沙門氏菌屬(&/mo"e〃a)、假單胞菌屬(PwMtfom朋氾)和葡萄球菌屬(Stop/^/ococc船)內(nèi)的任何種,包括例如大腸桿菌(£.co//)、乳酸乳球菌(丄actococc^/acto)、枯草芽包桿菌(5"c/〃rara6"fc)、錯狀芽抱桿菌(Sw7/mceret^)、鼠傷寒沙門菌(5"a/wo"e〃a(y;/z/wi^7't/m)禾卩熒光假單胞菌(i^eMtfo附o"(ZS1y/卵re"era)。示例性真菌細(xì)胞包括曲霉菌屬(A/^gz7/M)內(nèi)的任何種。示例性酵母細(xì)胞包括畢赤酵母屬(A'c/z/a)、酵母屬(&cc/zaramyc")、裂殖酵母屬(&/H'mracc/7"ram_ycM)或許旺酵母屬(Sc/wa"m'om_ycM)的種,包括巴斯德畢赤酵母(尸/c/n'a戸tor/s)、釀酒酵母(Sacc/wram戸scere由'oe)或粟酒裂殖酵母(5"c/^asacc/z"ra附y(tǒng)ces;wm6e)。示例性昆蟲細(xì)胞包括灰翅夜蛾屬(S/wfifc^era)或果蠅屬("ras印M")內(nèi)的任何禾中,包括果蠅S2(£ro^/n7aS2)和草地夜蛾Sf9(S;wcfo/^ra5/9)。示例性的動物細(xì)胞包括CHO、COS或者Bowesmelanoma或者任何小鼠或者人類細(xì)胞系。適當(dāng)?shù)乃拗鞯倪x擇是在本領(lǐng)域技術(shù)人員的能力之內(nèi)。0204載體可以使用各種技術(shù)導(dǎo)入宿主細(xì)胞中,包括轉(zhuǎn)化、轉(zhuǎn)染、轉(zhuǎn)導(dǎo)、病毒感染、基因槍或者Ti介導(dǎo)的基因轉(zhuǎn)移。具體的方法包括磷酸鈣轉(zhuǎn)染、DEAE-Dextnm介導(dǎo)的轉(zhuǎn)染、脂轉(zhuǎn)染法(lipofection)或電穿孑L(Davis,L.,Dibner,M.,Battey,I.,BasicMethodsinMolecularBiology,(1986))。0205在適當(dāng)?shù)那闆r下,工程化宿主細(xì)胞可以在傳統(tǒng)的營養(yǎng)培養(yǎng)基中培養(yǎng),所述營養(yǎng)培養(yǎng)基經(jīng)改良而適于激活啟動子、選擇轉(zhuǎn)化子或擴增本發(fā)明的基因。在合適的宿主株被轉(zhuǎn)化和宿主株生長到合適的細(xì)胞密度之后,用合適的方法(例如,溫度變化或化學(xué)誘導(dǎo))誘導(dǎo)被選擇的啟動子,細(xì)胞再培養(yǎng)一段時期,使得它們產(chǎn)生所需的多肽或其片段。0206細(xì)胞可以通過離心收獲,通過物理或化學(xué)方法破碎,保留得到的粗提物以用于進一步的純化。被用來表達蛋白質(zhì)的微生物細(xì)胞可以用任何常規(guī)方法破碎,包括冷凍-融解循環(huán)、超聲波裂解法、機械破碎法或使用細(xì)胞裂解劑。這些方法為本領(lǐng)域技術(shù)人員所熟知。表達的多肽或其片段可以從重組細(xì)胞培養(yǎng)物中通過包括硫酸銨或乙醇沉淀、酸提取、陰離子或陽離子交換層析、磷酸纖維素層析、疏水作用層析、親和層析、羥基磷灰石層析和凝集素層析在內(nèi)的方法回收和純化。假如必要的話,可以應(yīng)用蛋白質(zhì)重折疊來完成多肽的構(gòu)象。假如需要的話,在最終的純化步驟中可以采用高效液相層析(HPLC)。0207各種哺乳動物培養(yǎng)系統(tǒng)可以用來表達重組蛋白。哺乳動物表達系統(tǒng)的例子包括猴腎成纖維細(xì)胞COS-7細(xì)胞系和能夠從相容性載體中表達蛋白的其它的細(xì)胞系,如C127、3T3、CHO、Hela和BHK細(xì)胞系。0208宿主細(xì)胞中的構(gòu)建物可以以傳統(tǒng)方式用于產(chǎn)生由重組序列編碼的基因產(chǎn)物。取決于重組生產(chǎn)方法中所用的宿主,由含有載體的宿主細(xì)胞產(chǎn)生的多肽可以糖基化或者未糖基化。本發(fā)明的多肽也可以包括或不包括起始甲硫氨酸殘基。0209也可以采用無細(xì)胞的翻譯系統(tǒng)來產(chǎn)生本發(fā)明的多肽。無細(xì)胞翻譯系統(tǒng)可以應(yīng)用由DNA構(gòu)建物轉(zhuǎn)錄得到的mRNA,所述DNA構(gòu)建物包括與編碼所述多肽或其片段的核酸可操作地連接的啟動子。在一些方面,該DNA構(gòu)建物在進行體外轉(zhuǎn)錄反應(yīng)之前可以被線性化。轉(zhuǎn)錄得到的mRNA然后與合適的無細(xì)胞翻譯提取物例如兔網(wǎng)狀細(xì)胞提取物溫育,產(chǎn)生所需的多肽或其片段。0210表達載體可以含有一個或多個選擇性標(biāo)記基因,為選擇轉(zhuǎn)化的宿主細(xì)胞提供表型特征,例如真核細(xì)胞培養(yǎng)物的二氫葉酸還原酶或新霉素抗性,或者例如大腸桿菌的四環(huán)素或氨芐青霉素抗性。0211示例性磷脂酶C酶(具有SEQIDNO:2中所示的序列)已在各種宿主系統(tǒng)中以活性形式被過量表達,這些系統(tǒng)包括革蘭氏陰性細(xì)菌,諸如大腸桿菌,革蘭氏陽性細(xì)菌,諸如任何桿菌屬的種(例如枯草芽孢桿菌、蠟狀芽孢桿菌)、酵母宿主細(xì)胞(包括例如巴斯德畢赤酵母、酵母屬某種(Sflcc/rarow;;c"w.),諸如釀酒酵母和粟酒裂殖酵母)和乳酸乳球菌或哺乳動物、真菌、植物或昆蟲細(xì)胞。在每一宿主系統(tǒng)中,由各種構(gòu)建物表達活性酶。這些核酸表達構(gòu)建物可以包含編碼全長開放閱讀框(由信號序列、前序列和成熟蛋白編碼序列組成)的核苷酸,或它們可以包含這些遺傳元件的亞組,單獨或者與異源遺傳元件組合,異源遺傳元件充當(dāng)信號序列和/或成熟開放閱讀框的前序列。這些系統(tǒng)中的每一個可以充當(dāng)表達PLC的商用生產(chǎn)性宿主,PLC用于之前描述的酶法油脫膠方法中。核酸的擴增0212在實踐本發(fā)明時,編碼本發(fā)明多肽的核酸,或者修飾的核酸可以如通過擴增復(fù)制。本發(fā)明提供用于擴增編碼具有磷脂酶活性的多肽的核酸的擴增引物序列對。在一方面,引物對能夠擴增本發(fā)明的核酸序列。本領(lǐng)域技術(shù)人員可以設(shè)計用于擴增這些序列的任何部分或全長的擴增引物序列對。0213本發(fā)明提供用于擴增編碼具有磷脂酶活性的多肽的核酸的擴增引物序列對,其中引物對可以擴增包括本發(fā)明序列,或者其片段或子序列的核酸。擴增引物序列對的其中一個或每一個成員可以包括含有該序列的至少大約10到50個連續(xù)堿基的寡核苷酸,或者包括含有該序列的大約12、13、14、15、16、17、18、19、20、21、22、23、24或者25個連續(xù)堿基的寡核苷酸。0214本發(fā)明提供擴增引物對,其中引物對包括具有在本發(fā)明核酸的大約前(5'端)12、13、14、15、16、17、18、19、20、21、22、23、24或者25個殘基中闡明的序列的第一成員,和具有在第一成員的互補鏈的大約前(5')12、13、14、15、16、17、18、19、20、21、22、23、24或者25個殘基中闡明的序列的第二成員。本發(fā)明提供應(yīng)用本發(fā)明的擴增引物對,通過擴增如聚合酶鏈?zhǔn)椒磻?yīng)(PCR)產(chǎn)生的磷脂酶。本發(fā)明提供使用本發(fā)明的擴增引物對,通過擴增例如聚合酶鏈?zhǔn)椒磻?yīng)(PCR)制備發(fā)明磷脂酶的方法。在一方面,擴增引物對從文庫,例如基因文庫,如環(huán)境文庫中擴增核酸。0215擴增反應(yīng)也可以被用于量化樣品中核酸的量(如細(xì)胞樣品中信息的量)、標(biāo)記核酸(例如將其應(yīng)用于陣列或印跡)、檢測核酸,或量化樣品中特異性核酸的量。在本發(fā)明的一個方面,擴增從細(xì)胞或cDNA文庫分離出的信息。技術(shù)人員可以選擇和設(shè)計合適的寡核苷酸擴增引物。擴增方法在本
技術(shù)領(lǐng)域:
也是熟知的,包括,例如聚合酶鏈?zhǔn)椒磻?yīng)PCR(例如參見PCRPROTOCOLS,AGUIDETOMETHODSANDAPPLICATIONS,ed.I皿is,AcademicPress,N.Y.(1990)和PCRSTRATEGIES(1995),ed.Innis,AcademicPress,Inc.N.Y.,連接酶鏈?zhǔn)椒磻?yīng)(LCR)(例如參見Wu(1989)Genomics4:560;Landegren(1988)Science241:1077;Barringer(1990)Gene89:117);轉(zhuǎn)錄擴增(例如參見Kwoh(1989)Proc.Natl.Acad.Sci.USA86:1173);和自主維持序列復(fù)制(例如參見Guatelli(1990)Proc,Natl.Acad.Sci.USA87:1874);Qp復(fù)制酶擴增(例如參見Smith(1997)J.Clin.Microbiol.35:1477-1491),自動Q-p復(fù)制酶擴增測定法(例如參見Burg(1996)Mol.Cell.Probes10:257-271)和其它的RNA聚合酶介導(dǎo)的技術(shù)(例如NASBA,Cangene,Mississauga,Ontario);也參見Berger(1987)MethodsEnzymol.152:307-316;Sambrook;A醫(yī)bel;美國專利4,683,195和4,683,202;Sooknanan(1995)Biotechnology13:563-564。確定序列同一性程度0216本發(fā)明提供包括與本發(fā)明的示例性核酸(例如具有一個或多個編碼E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突變的SEQIDNO:177或SEQIDNO:178,以及編碼具有一個或多個編碼E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突變的SEQIDNO:177或SEQIDNO:178的核酸),在至少大約50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550或者更多的殘基范圍內(nèi),具有至少大約50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或者更多的或者完全的(IO()%)的序列同一性的序列的分離的和重組的核酸。本發(fā)明提供包括與本發(fā)明的示例性多肽具有至少大約50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、卯%、91%、92%、93%、94%、95%、96%、97%、98%、99%或者更多的或者完全的(100%)的序列同一性的序列的多肽。序列同一性(同源性)的程度可以應(yīng)用任何計算機程序和相關(guān)參數(shù)來確定,包括那些在此所描述的,如用默認(rèn)參數(shù)的BLAST2.2.2.或者FASTA3.0t78版。在可選擇的實施方式中,序列同一性可以在核酸或者多肽的至少大約5、10、20、30、40、50、100、150、200、250、300、350、400個連續(xù)的殘基,或者全長的范圍內(nèi)。序列同一性(同源性)的程度可以應(yīng)用任何計算機程序和相關(guān)聯(lián)的參數(shù)來確定,包括那些在此所說明的,如使用默認(rèn)參數(shù)的BLAST2.2.2.或者FASTA3.0t78版。0217圖11用圖表描述了本發(fā)明的示例性核酸和多肽的選擇的特征,包括示例性序列與公共數(shù)據(jù)庫的序列同一性比較。圖11中描述的所有序列對兩組數(shù)據(jù)庫進行BLAST搜索(如在下面詳細(xì)描述地)。第一數(shù)據(jù)庫獲自NCBI(美國國家生物技術(shù)信息中心)。對這些數(shù)據(jù)庫搜索所獲得的所有結(jié)果參見名稱為"NR描述(NRDescription)"、"NR登錄號(NRAccessionCode)"、"NR評價(NREvalue)"或"NR生物(NROrganism)"的各欄。"NR,,指由NCBI維護的非-冗余(Non-Redundant)核苷酸數(shù)據(jù)庫。該數(shù)據(jù)庫是GenBank、GenBank更新和EMBL更新的綜合。欄"NR描述(NRDescription)"中的條目指任何給定的NCBI記錄中的定義行(definitionline),其包括了對序列的描述,諸如來源生物、基因名稱/蛋白質(zhì)名稱,或?qū)π蛄械囊恍┕δ苊枋觥?NR登錄號(NRAccessionCode)"—欄中的條目指給予序列記錄的獨特的標(biāo)識符(identifier)。"NR評價(NREvalue)"—欄中的條目指期望值(評價),其代表了這樣的可能性同詢問序列(querysequence)(本發(fā)明的序列)與數(shù)據(jù)庫序列之間發(fā)現(xiàn)的比對分值一樣良好的比對分值,發(fā)現(xiàn)在隨機序列之間具有相同的數(shù)量的比較,如在當(dāng)前的BLAST搜索中所進行的。"NR生物(NROrganism)"—欄中的條目指被鑒定為關(guān)系最密切的BLAST命中(hit)的序列的來源生物。第二組數(shù)據(jù)庫統(tǒng)稱為GeneseqTM數(shù)據(jù)庫,其可從ThomsonDerwent(Philadelphia,PA)獲得。對該數(shù)據(jù)庫所作搜索的所有結(jié)果參見名稱為"Genes叫蛋白質(zhì)描述(GeneseqProteinDescription)"、"Geneseq蛋白質(zhì)登錄號(GeneseqProteinAccessionCode)"、"Geneseq蛋白質(zhì)評價(GeneseqProteinEvalue)"、"GeneseqDNA描述(GeneseqDNADescription)"、"GeneseqDNA登錄號(GeneseqDNAAccessionCode)"、"GeneseqDNA評價(GeneseqDNAEvalue)"各欄中。這些欄中發(fā)現(xiàn)的信息與上述NR各欄中發(fā)現(xiàn)的信息具有可比性,除了它來自對GeneseqTM數(shù)據(jù)庫而不是對NCBI數(shù)據(jù)庫進行的BLAST搜索。此外,該表包括欄"預(yù)測的EC編號(PredictedECNo.)"—欄。EC編號是根據(jù)標(biāo)準(zhǔn)化的酶命名法的方案賦予一類酶的編號,該命名法是由國際生物化學(xué)和分子生物學(xué)聯(lián)合會(IUBMB)的命名委員會的酶分組(EnzymeCommissionoftheNomenclature測的EC編號',欄中的結(jié)果由對Kegg(KyotoEncyclopediaofGenesandGenomes)數(shù)據(jù)庫的BLAST搜索結(jié)果測定。如果最高BLAST匹配(topBLASTmatch)的評價值等于或小于e—6,那么賦予最高匹配的EC編號進入表中。最高命中(tophit)的EC編號用作向?qū)?,用于指出本發(fā)明序列的EC編號可能是什么。"詢問DNA長度(QueryDNALength)"和"詢問蛋白質(zhì)程度(QueryProteinLength)"這兩欄分別指本發(fā)明的序列中核苷酸的數(shù)目或氨基酸的數(shù)目,本發(fā)明的序列被用于對NCBI或Geneseq數(shù)據(jù)庫進行搜索或查詢。"Geneseq或NRDNA長度(GeneseqorNRDNALength)"、"Geneseq或NR蛋白質(zhì)長度(GeneseqorNRProteinLength)"這兩欄分別指從BLAST搜索獲得的最高匹配的序列中的核苷酸的數(shù)目或氨基酸的數(shù)目。這些欄中給出的結(jié)果來自搜索,其將較低的評價——或者來自NCBI數(shù)據(jù)庫或者來自Geneseq數(shù)據(jù)庫的較低的評價返回(return)。"Geneseq或NR%10蛋白質(zhì)(Geneseq或NR%IDProtein),,禾口"Geneseq或NR%IDDNA(GeneseqorNR%IDDNA)"指本發(fā)明序列與最高BLAST匹配的序列之間的百分序列同一性。這些欄中給出的結(jié)果來自搜索,其將較低的評價一或者來自NCBI數(shù)據(jù)庫或者來自Geneseq數(shù)據(jù)庫的較低的評價返回。0218同源性序列也包括RNA序列,其中在核酸序列中尿嘧啶替代了胸腺嘧啶。同源序列可以應(yīng)用在此說明的任何程序得到或者可以由校正測序錯誤得到。應(yīng)該理解到的是,在此所示核酸序列可以以傳統(tǒng)的單字母形式表示(見,如,Stryer,Lubert.Biochemistry3rdEd.,W.H.Freeman&Co.,NewYork)或者以記錄序列中的核苷酸的同一性的任何其它形式來表示。0219在本發(fā)明的這一方面,可以使用在此指明的各種序列比較程序。蛋白和/或核酸序列同一性(同源性)可以應(yīng)用本領(lǐng)域已知的任何序列比較算法和程序評估。這樣的算法和程序包括,但不限于,TBLASTN、BLASTP、FASTA、TFASTA和CLUSTALW(Pearson和Lip腿n,Proc.Natl.Acad.Sci.USA85(8):2444-2448,1988;Altschul等,J.Mol.Biol.215(3):403-410,1990;Thompson等,NucleicAcidsRes.22(2):4673-4680'1994;Higgins等,MethodsEnzymol.266:383-402,1996;Altschul等,J.Mol.Biol.215(3):403-410,1990;Altschul等,NatureGenetics3:266-272,1993)。0220同源性或者同一性可以應(yīng)用序列分析軟件來測定(例如,位于1710UniversityAvenue,Madison,WI53705的威斯康星大學(xué)生物技術(shù)中心遺傳學(xué)計算機組(GeneticsComputerGroup)的序列分析軟件包)。這樣的軟件通過對各種缺失、置換和其它的修飾指定同源性程度來匹配相似的序列。在兩個或者多個核酸或者多肽序列的情況下,術(shù)語"同源性"和"同一性"是指兩個或者多個序列或者子序列,當(dāng)在比較窗口或者指定區(qū)域中應(yīng)用任何數(shù)量的序列比較算法或者手動比對和目測來測定,通過比較和比對以便獲得最大的一致性時,它們是相同的或者具有相同的氨基酸殘基或者核苷酸的特異百分比。對于序列比較,一個序列可以作為參照序列與待測序列進行比較。當(dāng)應(yīng)用序列比較算法,待測序列和參照序列被輸入到計算機中,指定子序列坐標(biāo),如果必要,指定序列算法程序參數(shù)??梢詰?yīng)用默認(rèn)程序參數(shù),或者指定選擇性參數(shù)。依據(jù)程序參數(shù),序列比較算法計算待測序列和參照序列同一性的百分比。0221如本文所用,"比較窗口(comparisonwindow)",包括涉及任一數(shù)目的連續(xù)殘基的片段。例如,在本發(fā)明可選擇的方面,當(dāng)兩個序列優(yōu)化比對后,將范圍從20到本發(fā)明的示例性序列的全長的連續(xù)殘基,與相同數(shù)目的連續(xù)位置的參照序列進行比較。如果參照序列與本發(fā)明的示例性序列具有必要的序列同一性,如50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或者更多的序列同一性,那么該序列是屬于本發(fā)明的范圍。在可選擇的實施方式中,當(dāng)兩個序列優(yōu)化地比對后,將范圍從大約20到600、大約50到200、和大約100到150的序列,與同樣數(shù)目的連續(xù)位置的參照序列進行比較。用于比較的聯(lián)配方法在本
技術(shù)領(lǐng)域:
是熟知的。可以通過如下方法進行用于比較的序列的最優(yōu)化聯(lián)配:例如Smith和Waterman,Adv.Appl.Math.2:482,1981的局部同源性算法,Needleman和Wunsch,J.Mol.Biol.站:443,1970的同源性聯(lián)配算法,person和Lipman,Proc.Nat'l.Acad.Sci.USA2444,1988的査找相似性的方法,這些算法的計算機化實施(WisconsinGeneticsSoftwarePackage中的GAP、BESTFIT、FASTA禾卩TFASTA,GeneticsComputerGroup,575ScienceDr.,Madison,WI),或者手工聯(lián)配和觀察檢驗。除了BLAST程序(國家生物信息中心的基本局域聯(lián)配搜索工具(BasicLocalAlignmentSearchTool))夕卜,用于確定同源性或者同一性的其它的算法包括,例如,ALIGN、AMAS(多重聯(lián)配序列分析(AnalysisofMultiplyAlignedSequences))、AMPS(蛋白多重序列聯(lián)配(ProteinMultipleSequenceAlignment))、ASSET(聯(lián)配片段統(tǒng)計評估工具(AlignedSegmentStatisticalEvaluationTool))、BANDS、BESTSCOR、BIOSCAN(生物學(xué)序列比較分析節(jié)點(BiologicalSequenceComparativeAnalysisNode))、BLIMPS(BLocksIMProvedSearcher)、FASTA、Intervals&Points、BMB、CLUSTALV、CLUSTALW、CONSENSUS、LCONSENSUS、WCONSENSUS、Smhh-Waterman算法、DARWIN、LasVegas算法、FNAT(強迫核苷酸聯(lián)配工具(ForcedNucleotideAlignmentTool))、Framealign、Framesearch、DYNAMIC、FILTER、FASP(Fristensky序列分析軟件包)、GAP(全局聯(lián)配程序(GlobalAlignmentProgram))、GENAL、GIBBS、GenQuest、ISSC(靈敏性序列比較(SensitiveSequenceComparison))、LALIGN(局部序列聯(lián)配(LocalSequenceAlignment))、LCP(局部內(nèi)容程序(LocalContentProgram))、MACAW(多重聯(lián)配構(gòu)建和分析工作臺(MultipleAlignmentConstruction&AnalysisWorkbench))、MAP(多重聯(lián)配程序(MultipleAlignmentProgram))、MBLKP、MBLKN、PIMA(模式誘導(dǎo)的多重序列聯(lián)配(Pattern-InducedMulti-sequenceAlignment))、SAGA(通過遺傳算法的序列聯(lián)配(SequenceAlignmentbyGeneticAlgorithm))禾nWHAT-IF。這樣的聯(lián)配程序也可以用于篩查基因組數(shù)據(jù)庫,以鑒定具有大體上相同的序列的多核苷酸序列。大量的基因組數(shù)據(jù)庫是可利用的,例如,作為人類基因組測序工程的一部分的人類基因組的實質(zhì)部分可以被利用(Gibbs,1995)。若干基因組已經(jīng)被測序,如生殖器支原體(M.ge"/to/z'畫)(Fraser等,1995)、甲垸球菌(Mya朋a"to')(Bult等,1996)、流行性感冒桿菌(/£/"/固認(rèn))(Fleischmann等,1995)、大腸桿菌(£.co/O(Blattner等,1997)和酵母(釀酒酵母(S.cwevi"'ae))(Mewes等,1997)和黑腹果蠅(".me/a"oga艦r)(Adams等,2000)。在模式生物的基因組序列的測序上已經(jīng)取得了很大的進展,如小鼠,線蟲(Ce/eg"m)和擬南芥Ur^a^;z^,)。含有基因組信息并且注釋有一些功能性信息的數(shù)據(jù)庫由不同組織維護,可以通過互聯(lián)網(wǎng)登錄。0222BLAST、BLAST2.0和BLAST2.2.2算法也用于實踐本發(fā)明。這些算法在,如Altschul(1977)Nuc.AcidsRes.25:3389-3402;Altschul(1990)J,Mol.Biol,215:403-410中有描述。用于實施BLAST分析的軟件可以通過美國國家生物技術(shù)信息中心公開獲得。這一算法涉及首先通過鑒別待詢序列(querysequence)中長度為W的短的字串來確定高分序列對(highscoringsequencepairs,HSPs),所述高分序列對在與數(shù)據(jù)庫序列中同樣長度的字串聯(lián)配吋,匹配或者滿足某些正值的閾值T。T是指鄰近字串(neighborhoodword)的分?jǐn)?shù)閾值(Altschul(1990),如上)。這些初始的鄰近字串作為種子(seed)用來啟動搜索以發(fā)現(xiàn)包含有它們的更長的HSPs。只要累積的聯(lián)配分?jǐn)?shù)能夠被增加,所述字串一直沿著每一個序列向兩個方向延伸。對于核苷酸序列,使用參數(shù)M(—對匹配的殘基的獎勵分?jǐn)?shù);總是大于0)來計算累積分?jǐn)?shù)。對于氨基酸序列,使用記分矩陣來計算累計分?jǐn)?shù)。出現(xiàn)下面情況時,字串在各個方向上的延伸便停止累積的聯(lián)配分?jǐn)?shù)由達到的最大值下降了數(shù)量X;由于一個或者多個記分為負(fù)的殘基聯(lián)配的累積,累積分?jǐn)?shù)達到0或者0以下;或者延伸到了任一序列的末端。BLAST算法的參數(shù)W、T和X決定了聯(lián)配的靈敏度和速率。BLASTN程序(對于核苷酸序列)使用的默認(rèn)值的是字串長度(W)為11,期望值(E)為10,M=5,N=-4,對兩條鏈進行比較。對于氨基酸序列,BLASTP程序使用的默認(rèn)值的是字串長度為3,期望值(E)為10,BLOSUM62記分矩陣(參見Henikoff和Henikoff(1989),Proc.Natl.Acad.Sci.USA89:10915)聯(lián)配(B)為50,期望值(E)為10,M=5,N=-4,對兩條鏈進行比較。BLAST算法也進行兩個序列之間的相似性的統(tǒng)計學(xué)分析(參見,例如,Karlin和Altschul(1993),Proc.Natl.Acad.Sci.USA90:5873)。由BLAST算法提供的一種相似性量度是最小合計概率(smallestsumprobability,P(N)),其表示兩個核苷酸或者氨基酸序列間的匹配將偶然發(fā)生的概率。例如,在測試核酸和參考核酸的比較中,如果最小合計概率小于約0.2,在一方面中更優(yōu)選的是小于約0.01,在一方面中最優(yōu)選的是小于約0.001,就認(rèn)為該核酸與參考序列相似。一方面,應(yīng)用基本局域聯(lián)配搜索工具("BLAST")來評價蛋白和核酸序列同源性。具體而言,五個特定的BLAST程序可以用來進行以下的任務(wù)(1)BLASTP和BLAST3將氨基酸待詢序列與蛋白質(zhì)序列數(shù)據(jù)庫進行比較;(2)BLASTN將核苷酸待詢序列與核苷酸序列數(shù)據(jù)庫進行比較;(3)BLASTX將待詢核苷酸序列(兩條鏈)的六個閱讀框架的概念上的翻譯產(chǎn)物與蛋白序列數(shù)據(jù)庫進行比較;(4)TBLASTN將待詢蛋白序列與核苷酸序列數(shù)據(jù)庫的所有六個閱讀框架(兩條鏈)的翻譯結(jié)果進行比較;和(5)TBLASTX將核苷酸待詢序列的六個框架的翻譯結(jié)果與核苷酸序列數(shù)據(jù)庫的六個框架的翻譯結(jié)果進行比較。BLAST程序通過確定相似片段來確定同源序列,所述相似片段在此是指在待查詢的氨基酸或核酸序列與受測序列之間的"高分片段對(high-scoringsegmentpairs)",該受測序列優(yōu)選從蛋白或者核酸序列數(shù)據(jù)庫得到。高分片段對優(yōu)選利用記分矩陣來鑒定(即,聯(lián)配),很多的記分矩陣在本領(lǐng)域是巳知的。優(yōu)選地,應(yīng)用的記分矩陣為BLOSUM62矩陣(Go誕t等,Science256:1443-1445,1992);Henikoff和Henikoff,Proteins12:49-61,1993)。較不優(yōu)選地,也可以應(yīng)用PAM或者PAM250矩陣(參見如,Schwartz禾卩Dayhoff,eds.,1978,MatricesforDetectingDistanceRelationships:AtlasofproteinSequenceandStructure,Washingion:NationalBiomedicalResearchFoundation)。0223本發(fā)明的一方面,為了確定是否核酸具有本發(fā)明范圍內(nèi)的必需的序列同一性,應(yīng)用NCBIBLAST2.2.2程序,默認(rèn)值的選擇是blastp。在BLAST2.2.2程序中,有大約38個設(shè)置選擇。在本發(fā)明的該示例性方面,除了默認(rèn)的過濾設(shè)置外,應(yīng)用所有的默認(rèn)值(即除了過濾設(shè)置為關(guān)閉(OFF)夕卜,所有的參數(shù)設(shè)定為默認(rèn)值),在該位置上應(yīng)用"-FF"設(shè)置,其使得不能進行過濾。由于短的序列的長度的緣故,默認(rèn)過濾的使用經(jīng)常導(dǎo)致與Karlin-Altschul不同。0224如上所述,用于本發(fā)明該示例性方面,并用于測定圖11中值的默認(rèn)值包括"低復(fù)雜性過濾器(Filterforlowcomplexity):開啟(ON)〉字長3>矢巨卩車Blosum62>空位成本存在值11>延伸1"其它的默認(rèn)值設(shè)置為低復(fù)雜性過濾器關(guān)閉(OFF),蛋白質(zhì)字長為3,BLOSUM62矩陣,空位存在罰值-11,并且空位延伸罰值一1。0225示例性的NCBIBLAST2.2.2程序設(shè)置在下面的實施例1中闡明。注意,"-W"選項默認(rèn)值為0。這是指,如果沒有設(shè)置,對于蛋白,字長默認(rèn)值為3,對于核苷酸字長默認(rèn)值為11。計算機系統(tǒng)和計算機程序產(chǎn)品0226為了確定和鑒定序列同一性、結(jié)構(gòu)同源性、基序和在計算機芯片上的類似物,本發(fā)明的多肽或核酸序列可以在可被計算機讀取和訪問的任何介質(zhì)上存儲、記錄和操作。因此,本發(fā)明提供了計算機、計算機系統(tǒng)、計算機可讀取的介質(zhì)、計算機程序產(chǎn)品以及其上記錄或存儲了本發(fā)明的核酸和多肽序列,例如本發(fā)明的示例性序列的類似設(shè)備。如本文所用,詞語"記錄"和"存儲"指在計算機介質(zhì)上存儲信息的過程。熟練的技術(shù)人員能容易地采用任何己知方法,在計算機可讀取的介質(zhì)上存儲信息,以產(chǎn)生包括本發(fā)明的一個或多個核酸和/或多肽序列的產(chǎn)品。0227本發(fā)明的另一方面是其上已記錄有本發(fā)明的至少一個核酸和/或多肽序列的計算機可讀介質(zhì)。計算機可讀介質(zhì)包括磁性可讀介質(zhì)、光學(xué)可讀介質(zhì)、電子可讀介質(zhì)和磁性/光學(xué)介質(zhì)、閃存。例如,計算機可讀介質(zhì)可以是硬盤、軟盤、磁帶、閃存、CD-ROM、數(shù)碼多功能光盤(DVD)、隨機存儲器(RAM)、或只讀存儲器(ROM)或本領(lǐng)域技術(shù)人員知道的任何類型的介質(zhì)。0228本發(fā)明的方面包括系統(tǒng)(如,以因特網(wǎng)為基礎(chǔ)的系統(tǒng)),特別地計算機系統(tǒng),其存儲和操作在此描述的序列和序列信息。計算機系統(tǒng)100的一個例子描述在圖1的方塊圖中。正如此處所用,"計算機系統(tǒng)"指硬件部分、軟件部分以及數(shù)據(jù)存儲部分,它們用于分析本發(fā)明的核酸序列的核苷酸序列或本發(fā)明的多肽序列。計算機系統(tǒng)100可包括用于處理、訪問和操縱序列數(shù)據(jù)的處理器。處理器105可以是任何熟知類型的中央處理單元,如來自英特爾公司的奔騰III,或來自Sun、Motorola.Compag、AMD或IBM公司的類似處理器。計算機系統(tǒng)100是一個通用的系統(tǒng),該系統(tǒng)包括處理器105和用于存儲數(shù)據(jù)的一個或多個內(nèi)部數(shù)據(jù)存儲部件110,以及用于檢索數(shù)據(jù)存儲部件上存儲的數(shù)據(jù)的一個或多個數(shù)據(jù)檢索設(shè)備。技術(shù)人員能容易地意識到,任何一種當(dāng)前可獲得的計算機系統(tǒng)都是合適的。0229在一個特定的方面,計算機系統(tǒng)100包括連接到總線上的處理器105,總線連接到主存儲器115(優(yōu)選地,以RAM來實現(xiàn)),和一個或多個內(nèi)部數(shù)據(jù)存儲設(shè)備110,例如其上已經(jīng)存儲了數(shù)據(jù)的硬盤驅(qū)動器和/或其它計算機可讀介質(zhì)。計算機系統(tǒng)100進一步包括一個或多個數(shù)據(jù)檢索設(shè)備118,用于讀取在內(nèi)部數(shù)據(jù)存儲設(shè)備110上存儲的數(shù)據(jù)。0230數(shù)據(jù)檢索設(shè)備118可以是,例如軟盤驅(qū)動器、壓縮磁盤驅(qū)動器、磁帶驅(qū)動器或能連接到遠(yuǎn)程數(shù)據(jù)存儲系統(tǒng)的調(diào)制解調(diào)器(例如通過因特網(wǎng))等等。在一些實施方式中,內(nèi)部數(shù)據(jù)存儲設(shè)備110是可移動的計算機可讀介質(zhì),例如含有控制邏輯和/或其上記錄的數(shù)據(jù)的軟盤、壓縮磁盤、磁帶等等。計算機系統(tǒng)100可以有利地包括適當(dāng)?shù)能浖蛴眠m當(dāng)?shù)能浖幊?,用于?dāng)數(shù)據(jù)存儲部件被插入到數(shù)據(jù)檢索設(shè)備中時從數(shù)據(jù)存儲部件讀取控制邏輯和/或數(shù)據(jù)。0231計算機系統(tǒng)100包括用于給計算機應(yīng)用者顯示輸出的結(jié)果的顯示器120。應(yīng)當(dāng)注意到,計算機系統(tǒng)100可以在網(wǎng)絡(luò)中或者寬域網(wǎng)中與其它的計算機系統(tǒng)125a-c相聯(lián),以便給計算機100提供集中訪問。訪問和處理本發(fā)明的核苷酸或者氨基酸序列的軟件可以在執(zhí)行過程中駐留在主存儲器115中。0232在一些方面,計算機系統(tǒng)100可以進一步包括比較發(fā)明的本核酸序列的序列比較算法。算法和序列可以儲存在計算機可讀的介質(zhì)中。"序列比較算法"是指一個或多個程序,其可在計算機系統(tǒng)100上(本地或遠(yuǎn)程)執(zhí)行以比較核苷酸序列和數(shù)據(jù)儲存裝置中存儲的其它的核苷酸序列和/或化合物。例如,序列比較算法可將儲存在計算機可讀介質(zhì)上的示例性序列的核苷酸序列與儲存在計算機可讀介質(zhì)上的參考序列比較,以鑒定同源性或結(jié)構(gòu)基序。0233以上算法應(yīng)用的參數(shù)可以依據(jù)所研究的序列長度和同源性水平而加以調(diào)整。在一些方面,在使用者沒有給出指令的情況下,算法使用的參數(shù)可以應(yīng)用默認(rèn)參數(shù)。圖2是說明過程200的一個方面的流程圖,這個處理過程是為了確定新序列和數(shù)據(jù)庫中的序列間的同源性水平,把新的核苷酸或者蛋白序列與數(shù)據(jù)庫中的序列加以比較。含有序列的數(shù)據(jù)庫可以是存儲于計算機系統(tǒng)ioo的私人數(shù)據(jù)庫,或者公共的數(shù)據(jù)庫,如通過因特網(wǎng)可以訪問到的GENBANK。過程200開始于起始狀態(tài)201,然后轉(zhuǎn)到狀態(tài)202,其中待比較的新序列存儲在計算機系統(tǒng)100的存儲器上。如上討論,存儲器可以是任何形式的存儲器,包括RAM或者內(nèi)部存儲設(shè)備。0234然后過程200轉(zhuǎn)到狀態(tài)204,其中打開序列數(shù)據(jù)庫以進行分析和比較。然后過程200轉(zhuǎn)到狀態(tài)206,其中數(shù)據(jù)庫中存儲的第一個序列被讀取到計算機的存儲器中。然后在狀態(tài)210進行比較,以確定第一個序列是否與第二個序列相同。重要的是應(yīng)該注意到,該步驟不限于進行新序列和數(shù)據(jù)庫中第一個序列之間的精確比較。用于比較兩個核苷酸或蛋白序列的熟知的方法對于本
技術(shù)領(lǐng)域:
的普通技術(shù)人員是已知的,即使所述兩個核苷酸或蛋白序列不相同。例如,可以在一個序列中引入空位,以提高兩個測試序列之間的同源性水平。控制空位或其它特征在比較過程中是否被引入到序列中的參數(shù)通常由計算機系統(tǒng)的用戶輸入。0235一旦已經(jīng)在狀態(tài)210進行兩個序列的比較,在決策狀態(tài)210就要作出兩個序列是否相同的判斷。當(dāng)然,術(shù)語"相同的"不限于絕對相同的序列。在過程200中,在由用戶輸入的同源性參數(shù)范圍內(nèi)的序列都將被標(biāo)記為"相同的"。如果作出兩個序列相同的判斷,過程200轉(zhuǎn)到狀態(tài)214,其中來自數(shù)據(jù)庫的序列的名稱被顯示給用戶。該狀態(tài)通知用戶,具有顯示的名稱的序列滿足所輸入的同源性限制。一旦所存儲序列的名稱被顯示給用戶,過程200轉(zhuǎn)到?jīng)Q策狀態(tài)218,其中作出數(shù)據(jù)庫中是否存在更多序列的判斷。如果數(shù)據(jù)庫中不存在更多的序列,那么過程200在結(jié)束狀態(tài)220終止。然而,如果數(shù)據(jù)庫中確實存在更多的序列,那么過程200轉(zhuǎn)到狀態(tài)224,其中指針被指向數(shù)據(jù)庫中的下一個序列,以便與新序列進行比較。以這種方式,將新序列與數(shù)據(jù)庫中的每一序列聯(lián)配并進行比較。0236應(yīng)該注意到,如果已經(jīng)在決策狀態(tài)212已經(jīng)作出了序列不同源的判斷,那么過程200將立即轉(zhuǎn)到?jīng)Q策狀態(tài)218,以便確定用于比較的數(shù)據(jù)庫中的任何其它序列是否可利用。因此,發(fā)明的一方面是包括處理器,其上儲存有本發(fā)明的核酸序列的數(shù)據(jù)存儲設(shè)備以及用于進行比較的序列比較器的計算機系統(tǒng)。序列比較器可以指示待比較序列之間的同源性水平或者鑒定結(jié)構(gòu)基序,或者可以確定與這些核酸代碼和多肽代碼相比較的序列中的結(jié)構(gòu)基序。0237圖3是示意性說明計算機中的過程250的一個實施方式的流程圖,該過程用于確定兩個序列是否同源。過程250在起始狀態(tài)252開始,然后轉(zhuǎn)到狀態(tài)254,其中要被比較的第一個序列被存儲到存儲器上。然后要被比較的第二個序列在狀態(tài)256被存儲到存儲器上。然后過程250轉(zhuǎn)到狀態(tài)260,其中讀取第一個序列中的第一個字符,然后轉(zhuǎn)到狀態(tài)262,其中讀取第二個序列的第一個字符。應(yīng)該理解到,如果序列是核苷酸序列,那么字符將通常是A、T、C、G或U。如果序列是蛋白序列,那么字符可以是單字母氨基酸代碼,以便第一個序列和第二個序列可以被容易地比較。然后在決策狀態(tài)264作出兩個字符是否相同的判斷。如果它們相同,那么過程250轉(zhuǎn)到狀態(tài)268,其中第一個和第二個序列中的下一個字符被讀取。然后作出該下一個字符是否相同的判斷。如果它們相同,那么過程250繼續(xù)循環(huán),直到兩個字符不相同。如果作出的判斷是這兩個字母不相符,那么過程250轉(zhuǎn)到?jīng)Q策狀態(tài)274,以確定是否有更多的字符或者序列可以讀取。如果沒有可讀取的任何更多的字符,那么過程250轉(zhuǎn)到狀態(tài)276,其中第一個和第二個序列之間的同源性水平被顯示給用戶。同源性水平通過計算序列之間相同的字符在第一個序列的序列總數(shù)中的比例來確定。因此,如果前IOO個核苷酸序列中的每一個字符都與第二個序列中的每一個字符聯(lián)配,那么同源性水平將是100%。0238可選地,計算機程序可以比較參照序列與本發(fā)明的序列,以確定是否序列在一個或者多個位置上不同。程序可以記錄本發(fā)明序列或參照序列中插入、缺失或者替換的核苷酸或者氨基酸殘基的長度和同一性。計算機程序可以是確定是否參照序列與本發(fā)明的序列相比,含有單核苷酸多態(tài)性(SNP),或者是否本發(fā)明的序列含有已知序列的SNP的程序。因此,在一些方面,計算機程序是鑒定SNPs的程序。該方法可以通過以上描述的計算機系統(tǒng)來完成并且該方法描述在圖3中。該方法可以通過應(yīng)用計算機程序讀取本發(fā)明序列和參照序列,并且用計算機程序來鑒定差異來進行。0239在其它方面,以計算機為基礎(chǔ)的系統(tǒng)包括鑒定本發(fā)明的核酸或者多肽中的特征的鑒定器。"鑒定器"是指鑒定核酸序列中的某些特征的一個或者多個程序。例如,鑒定器可以包括鑒定核酸序列中的開放閱讀框架(ORF)的程序。圖4是說明用于檢測序列中特征存在與否的鑒定器程序300的一個方面的流程圖。過程300起始于起始狀態(tài)302,然后轉(zhuǎn)到狀態(tài)304,其中待檢測特征的第一序列存儲于計算機系統(tǒng)100的存儲器115上。過程300然后轉(zhuǎn)到狀態(tài)306,在該狀態(tài)下,打開具有序列特征的數(shù)據(jù)庫。這樣數(shù)據(jù)庫將包括一系列每一個特征的屬性和特征的名稱。例如,特征名稱可以是"起始密碼子",屬性為"ATG"。另一個例子是特征名稱為"TAATAA盒",特征屬性為"TAATAA"。這樣的數(shù)據(jù)庫的例子是由烕斯康辛大學(xué)遺傳學(xué)計算機組(UniversityofWisconsinGeneticsComputerGroup)制作。可選地,特征可以是結(jié)構(gòu)多肽基序,如ct螺旋、卩折疊,或者功能性多肽基序,如酶的活性位點、螺旋-轉(zhuǎn)角-螺旋基序或者本領(lǐng)域技術(shù)知道的其它基序。一旦在狀態(tài)306打開特征數(shù)據(jù)庫,過程300轉(zhuǎn)到狀態(tài)308,其中第一特征從數(shù)據(jù)庫中讀取。然后在狀態(tài)310中進行第一特征的屬性與第一序列的比較。然后在決定狀態(tài)316下作出決定,確定是否在第一序列發(fā)現(xiàn)所述特征的屬性。如果發(fā)現(xiàn)該屬性,過程300轉(zhuǎn)到狀態(tài)318,其中所發(fā)現(xiàn)的特征的名稱顯示給使用者。過程300然后轉(zhuǎn)到?jīng)Q定狀態(tài)320,在其中作出是否在數(shù)據(jù)庫中存在更多的特征的決定。如果不存在更多的特征,過程300終止于結(jié)束狀態(tài)324。然而,如果數(shù)據(jù)庫中確實存在有更多的特征,那么過程300在狀態(tài)326讀取下一個序列特征,并且循環(huán)回到狀態(tài)310,其中該下一個特征的屬性與第一序列進行比較。如果在決定狀態(tài)316在第一個序列中沒有發(fā)現(xiàn)特征屬性,那么過程300直接轉(zhuǎn)到?jīng)Q定狀態(tài)320,以便確定數(shù)據(jù)庫中是否存在更多特征。因此,在一方面,本發(fā)明提供了鑒定開放閱讀框架(ORFs)的計算機程序。0240本發(fā)明的多肽或核酸序列可在各種數(shù)據(jù)處理程序中以多種格式被儲存和進行操作。例如,序列可以以文本形式儲存在字處理文件如MicrosoftWORD或WORDPERFECT中,或以ASCII文件儲存在各種本領(lǐng)域技術(shù)人員所熟悉的數(shù)據(jù)庫程序如DB2、SYBAS或ORACL中。另外,許多計算機程序和數(shù)據(jù)庫都可用作序列比較算法、鑒定器、或參考核苷酸序列或多肽序列的來源,所述參考核苷酸序列或多肽序列要與本發(fā)明的核酸序列進行比較。用于實踐本發(fā)明的程序和數(shù)據(jù)庫包括,但不限于MacPattern(EMBL)、DiscoveryBase(MolecularApplicationsGroup)、GeneMine(MolecularApplicationsGroup)、Look(MolecularApplicationsGroup)、MacLook(MolecularApplicationsGroup)、BLAST和BLAST2(NCBI)、BLASTN和BLASTX(Altschul等,J.Mol.Biol.215:403,19卯)、FASTA(Pearson和Lipman,Proc.Natl.Acad.Sci.USA,85:2444,1988)、FASTDB(Brutlag等,Comp.App.Biosci.6:237-245,1990)、Catalyst(MolecularSimulationsInc.)、Catalyst/SHAPE(MolecularSimulationsInc.)、Cerius2.DBAccess(MolecularSimulationsInc.)、HypoGen(MolecularSimulationsInc.)、InsightII(MolecularSimulationsInc.)、Discover(MolecularSimulationsInc.)、CHARMm(MolecularSimulationsInc.)、Felix(MolecularSimulationsInc.)、DelPhi(MolecularSimulationsInc.)、QuanteMM(MolecularSimulationsInc.)、Homology(MolecularSimulationsInc.)、Modeler(MolecularSimulationsInc.)、ISIS(MolecularSimulationsInc.)、Quanta/ProteinDesign(MolecularSimulationsInc.)、WebLab(MolecularSimulationsInc.)、WebLabDiversityExplorer(MolecularSimulationsInc.)、GeneExplorer(MolecularSimulationsInc.)、SeqFold(MolecularSimulationsInc.)、MDL可用化學(xué)制品目錄數(shù)據(jù)庫(AvailableChemicalsDirectorydatabase)、MDL藥品數(shù)據(jù)報告數(shù)據(jù)庫(DragDataReportdatabase)、綜合醫(yī)藥化學(xué)數(shù)據(jù)庫(ComprehensiveMedicinalChemistrydatabase)、德溫特世界藥物索引數(shù)據(jù)庫(WorldDragIndexdatabase)、BioByteMasterFile數(shù)據(jù)庫、Genbank數(shù)據(jù)庫和Genseqn數(shù)據(jù)庫。其它的程序和數(shù)據(jù)庫對于本公開內(nèi)容的所述
技術(shù)領(lǐng)域:
內(nèi)的技術(shù)人員是顯而易見的。0241可以用上述程序檢測的基序包括編碼亮氨酸拉鏈的序列、螺旋-轉(zhuǎn)角-螺旋基序、糖基化位點、泛素化位點、ct螺旋和(3折疊、編碼指導(dǎo)被編碼的蛋白分泌的信號肽的信號序列、在轉(zhuǎn)錄調(diào)節(jié)中涉及的序列如同源框、酸性伸展物(acidicstretohes)、酶活性位點、底物結(jié)合位點和酶切割位點。核酸的雜交0242本發(fā)明提供了可在嚴(yán)格性條件下與本發(fā)明的示例性序列,例如在具有一個或多個編碼E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突變的SEQIDNO:177或SEQIDNO:178中所提及的序列,或者編碼包括在具有一個或多個編碼E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突變的SEQIDNO:177或SEQIDNO:178中所提及的序列的多肽的核酸雜交的分離的、合成的或者重組的核酸。嚴(yán)格條件可以是高度嚴(yán)格條件、中度嚴(yán)格條件、低度嚴(yán)格條件,包括在此描述的高度的和降低的嚴(yán)格性條件。在可選的方面,本發(fā)明的核酸根據(jù)它們在嚴(yán)格條件下雜交的能力來定義,它們可以在大約5個殘基到某分子,例如本發(fā)明的示例性核酸全長之間。例如,它們的長度可以是至少5、10、15、20、25、30、35、40、50、55、60、65、70、75、80、90、亂150、200、250、300、350、400個殘基。比全長核酸較短的核酸也包括在內(nèi)。這些核酸可以用作例如雜交探針、標(biāo)記探針、PCR寡核苷酸探針、iRNA(單鏈或者雙鏈)、編碼抗體結(jié)合肽(表位)的反義序列或序列、基序、活性位點、結(jié)合結(jié)構(gòu)域、調(diào)控結(jié)構(gòu)域以及類似物。0243一方面,本發(fā)明的核酸通過它們在高度嚴(yán)格性下雜交的能力定義,高度嚴(yán)格性包括在大約37'C到42"C的溫度下大約50M的甲酰胺的條件。一方面,本發(fā)明的核酸通過它們在降低的嚴(yán)格性下雜交的能力定義,降低的嚴(yán)格性包括在大約30°C到35'C在大約35%至25%的甲酰胺中的條件。可以選擇地,本發(fā)明的核酸通過它們在高度嚴(yán)格性下雜交的能力定義,高度嚴(yán)格性包括的條件為在42'C、在50%甲酰胺、5xSSPE、0.3%SDS中,和封閉核酸的重復(fù)序列,如cot-l或鮭精DNA(例如200pg/ml的剪切和變性鮭精DNA)。一方面,本發(fā)明的核酸通過它們在降低的嚴(yán)格性條件下雜交的能力定義,降低的嚴(yán)格性條件包括在35'C的降低溫度下的35%甲酰胺中。0244雜交以后,濾膜可以在50°C,用6xSSC,0.5%的SDS洗滌。超過25%的甲酰胺,這些條件認(rèn)為是"中度"條件,低于25%的甲酰胺,這些條件認(rèn)為是"低度"條件。"中度"雜交條件的一個特定例子是當(dāng)上面的雜交在甲酰胺為30%進行時。"低嚴(yán)格性"雜交條件的特定例子是當(dāng)上面的雜交在甲酰胺為10%進行時。0245與特定水平的嚴(yán)格性相對應(yīng)的溫度范圍可以進一步通過計算感興趣的核酸中嘌呤與嘧啶的比例,并且相應(yīng)地調(diào)節(jié)溫度來縮小。本發(fā)明的核酸也通過其可以在Ausubel和Sambrook中所述的高度、中度、低度嚴(yán)格性條件下雜交的能力來定義。對上面的范圍和條件所作的變化可以用于實施本發(fā)明,并且是本領(lǐng)域技術(shù)人員所熟知的。下面進一步描述了雜交條件。76寡核苷酸探針和應(yīng)用方法0246本發(fā)明也提供了用于鑒定編碼具有磷脂酶活性的多肽的核酸的核酸探針。一方面,探針包括在具有一個或多個編碼E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、1117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突變的SEQIDNO:177或SEQIDNO:178中所闡明的序列的至少IO個連續(xù)的堿基??蛇x地,本發(fā)明的探針可以是本發(fā)明的序列中所闡明的序列的至少大約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、50、55、60、65、70、75、80、90、100或150,或更多,或大約10到50、大約20到60、大約30到70個連續(xù)堿基。這些探針通過結(jié)合或者雜交來鑒定核酸。這些探針可以用于本發(fā)明的陣列中,見下面的討論,包括例如毛細(xì)管陣列。本發(fā)明的探針也可以用于分離其它的核酸或多肽。0247本發(fā)明的探針可以用于確定是否生物樣品,如土壤樣品,含有具有本發(fā)明的核酸序列的生物或者可以從其獲得該核酸的生物。在這一程序中,獲得了潛在地隱藏了從其分離得到核酸的生物體的生物樣品,并且從該生物樣品獲得核酸。在允許探針與樣品中存在的任何互補序列特異性雜交的條件下,將核酸與探針接觸。在必要的情況下,為了確定允許探針特異地與互補序列雜交的條件,可以讓探針與來自已知含有互補序列的樣品中的互補序列相接觸,同時與不含有互補序列的對照序列相接觸。雜交條件,如雜交緩沖液中的鹽濃度、雜交緩沖液中甲酰胺的濃度或者雜交溫度,可以進行變化以確定允許所述探針特異地與互補的核酸雜交的條件(參見有關(guān)特異性雜交條件的論述)。0248如果該樣品含有從中可分離出核酸的生物體,那么探針的特異性雜交被檢測到。雜交可以通過用可檢測的試劑標(biāo)記探針來檢測,所述可檢測的試劑如放射性同位素、熒光染料或能催化可檢測產(chǎn)物形成的酶。使用標(biāo)記探針來檢測樣品中互補核酸的存在的許多方法對于本領(lǐng)域技術(shù)人員是熟知的。這些方法包括DNA印跡法、RNA印跡法、集落雜交方法和斑點印跡法。這些方法中的每一種方法的方案在Ansubel和Sambrook中給出。0249可選地,可以在一個擴增反應(yīng)中使用一種以上的探針(其中的至少之一可以特異地與存在于核酸樣品的任何互補序列雜交)來檢測樣品中是否含有包括本發(fā)明的核酸序列的生物體(如,從中分離出所述核酸的生物體)。在一方面,所述探針包括寡核苷酸。一方面,所述擴增反應(yīng)可以包括PCR反應(yīng)。PCR的實驗方案見前面Ausubd和Sambrook的如上的所述(參見有關(guān)擴增反應(yīng)的討論)。在這些程序中,所述樣品中的核酸與所述探針相接觸,進行所述擴增反應(yīng),檢測任何得到的擴增產(chǎn)物。擴增產(chǎn)物可以通過對反應(yīng)產(chǎn)物進行凝膠電泳,并用嵌入劑如溴化乙啶染膠來進行檢測??蛇x地,一種或者多種探針可以用放射性同位素標(biāo)記,并且在凝膠電泳后通過放射性自顯影來檢測放射性的擴增產(chǎn)物的存在與否。0250源自位于本發(fā)明序列的3'或者5'末端附近的序列的探針也可以用于染色體步移(chromosomewalking)程序中,以鑒定含有另外的,如基因組序列的克隆。這樣的方法允許從宿主生物體中分離出編碼其它感興趣的蛋白的基因。0251在一方面,本發(fā)明的核酸被用作探針來鑒定和分離相關(guān)的核酸。在一些方面,所述的相關(guān)的核酸可以是來自某些生物體的cDNA或者基因組DNA,而不是本發(fā)明的核酸起初被分離出來的那些生物體。在這樣的程序中,核酸樣品與所述探針在允許探針特異地與相關(guān)序列雜交的條件下接觸。所述探針與來自相關(guān)生物體的核酸的雜交然后采用以上描述的任何方法來檢測。0252在核酸雜交反應(yīng)中,用于達到特定嚴(yán)格性水平的條件可以根據(jù)待雜交核酸的性質(zhì)來進行改變。例如,在選擇雜交條件時可以考慮核酸雜交區(qū)域的長度、互補程度、核苷酸序列組成(如,GC對AT含量的比率)、以及核酸類型(如,RNA對DNA)。另外考慮是否其中一個核酸固定于,如濾膜上。雜交可以在低嚴(yán)格性,中度嚴(yán)格性或者高嚴(yán)格性的條件下進行。作為核酸雜交的例子,含有固定化變性核酸的多聚膜首先在45。C下,在由0.9MNaCl、50mMNaH2P04,PH7,0、5.0mMNa2EDTA、0.5%SDS、10xDenhardt's和0.5mg/ml多核腺苷酸組成的溶液中預(yù)雜交30分鐘。然后將大約2x107cpm(比活性4-9x108cpm/ug)的32P末端標(biāo)記的寡核苷酸探針加入到溶液中。在12-16小時的溫育以后,膜在室溫(RT)下于含有0.5XSDS的1xSET(150mMNaCl、20mMTris鹽酸,PH7.8、1mMNa2EDTA)中洗滌30分鐘,然后在新鮮配制的lxSET,在Tm-l(TC下,再洗滌寡核苷酸探針30分鐘。然后將膜暴露于自顯影膜上來檢測雜交信號。0253通過改變用于鑒定核酸,如與可檢測探針雜交的cDNA或者基因組DNA的雜交條件的嚴(yán)格性,可以鑒定和分離與探針具有不同同源性水平的核酸。可以通過在低于探針的解鏈溫度下的不同溫度中進行雜交而使嚴(yán)格性變化。解鏈溫度,Tm,是指(在定義的離子強度和pH下)50%的靶序列與精確互補的探針雜交的溫度。非常嚴(yán)格的條件被選擇為與特定的探針的Tm值相等或比其低大約5'C。探針的解鏈溫度可以通過應(yīng)用以下的示例性公式計算。對于在14到70個核苷酸長度的探針,應(yīng)用此公式計算解鏈溫度Tm=81.5+16.6(log[Na+])+0.41(G+C分?jǐn)?shù))-(600/N),其中的N是探針的長度。如果雜交在含有甲酰胺的溶液中進行,解鏈溫度可以通過應(yīng)用以下的公式來計算Tm=81.5+16.6(log[Na+])+0.41(G+C分?jǐn)?shù))-(0.63%甲酰胺)-(600/N),其中的N是探針的長度。預(yù)雜交可以在6xSSC、5xDenhardt's試齊U、0.5%SDS、100叱/ml變性的鮭魚精DNA片段或者6xSSC、5xDenhardt's試劑、0.5%SDS、100嗎/ml變性的鮭魚精DNA片段、50%甲酰胺中進行。SSC和Denhardt's和其它溶液的配方列于例如Sambrook中。0254通過在以上所示預(yù)雜交溶液中加入可以檢測到的探針來進行雜交。當(dāng)所述探針包括雙鏈DNA時,它應(yīng)在加入到雜交緩沖液前被變性。濾膜與雜交緩沖液接觸足夠長的時間使得探針與含有其互補序列或者其同源序列的cDNA或者基因組DNA雜交。對于超過200個核苷酸長度的探針,雜交可以是在低于Tm溫度15-25°C進行。對于較短的探針,如寡核苷酸探針,雜交可以是在低于Tm溫度5-l(TC下進行。一方面,在6xSSC溶液中的雜交在大約68t:進行。一方面,在含有50%甲酰胺的溶液中的雜交在大約42t:進行??紤]所有前述的雜交在高嚴(yán)格性條件下進行。0255雜交以后,洗滌濾膜以去除任何非特異結(jié)合的可以檢測到的探針。洗滌濾膜所用的嚴(yán)格性也可以根據(jù)正被雜交的核酸的性質(zhì)、正被雜交的核酸的長度、互補的程度,核苷酸序列的組成(如,GC對AT的含量),以及核酸類型(如,RNA對DNA)來進行變化。逐漸增高的嚴(yán)格性條件洗滌的例子如下2xSSC,0.1%SDS,室溫下15分鐘,(低嚴(yán)格性);O.lxSSC,0.5%SDS,室溫下30分鐘到1小時(中度嚴(yán)格性);O.lxSSC,0.5%SDS,雜交溫度和68匸之間,15到30分鐘(高嚴(yán)格性);0.15MNaCl,在72i:下15分鐘(極高嚴(yán)格性)。最后低嚴(yán)格性洗滌可以在O.lxSSC,室溫下進行。以上的例子僅僅示出了可以用于實施本發(fā)明,例如洗滌濾膜的一組條件。本領(lǐng)域技術(shù)人員將知道,對于不同嚴(yán)格性洗滌有無數(shù)方案,所有這些方案都可以用于實施本發(fā)明。0256己經(jīng)與探針雜交的核酸可以通過放射自顯影或者其它傳統(tǒng)的技術(shù)來確定。可以改變以上的程序來鑒定與探針序列具有降低水平的同源性的核酸。例如為了獲得與可檢測探針具有降低水平的同源性的核酸,可以應(yīng)用不太嚴(yán)格的條件。例如,在含有Na+濃度為大約1M的雜交緩沖液中,雜交溫度可以以5。C的幅度從68'C降低到42。C。雜交后,濾膜用2xSSC,0.5%SDS,在雜交溫度下洗膜。超過50°C,這些條件認(rèn)為是"中度"條件,低于5(TC,這些條件認(rèn)為是"低度"條件。"中度"雜交條件的例子是上面的雜交在55'C進行時。"低嚴(yán)格性"雜交條件的特定例子是上面的雜交在45'C進行時。0257可選地,雜交在緩沖液,如含有甲酰胺的6xSSC中,在42'C下進行。在這種情況下,雜交緩沖液中甲酰胺的濃度可以以5%的幅度從50%降低到0%,來確定與探針具有降低的同源性水平的克隆。雜交后,濾膜可以用6xSSC,0.5%SDS在5(TC下洗滌。當(dāng)甲酰胺濃度大于25%時,這些條件認(rèn)為是"中度"條件,而低于25%時為"低度"條件。"中度"雜交條件的特定例子是當(dāng)以上的雜交在30%的甲酰胺中進行時。"低嚴(yán)格性"雜交條件的特定例子是當(dāng)以上的雜交在10%的甲酰胺中進行時。02580本發(fā)明的這些探針和方法可以用于分離具有與本發(fā)明的核酸序列有至少大約99%、至少98%、至少97%、至少96%、至少95%、至少90%、至少85%、至少80%、至少75%、至少70%、至少65%、至少60%、至少55%、或者至少50%的同源性的序列的核酸,該本發(fā)明的核酸序列包括其的至少大約10、15、20、25、30、35、40、50、75、100、150、200、250、300、350、400或者500個連續(xù)的堿基,和與之互補的序列。同源性可以應(yīng)用在此所述的比對算法測定。例如,同源的多核苷酸可以具有在此說明的其中一個編碼序列的天然發(fā)生的等位基因突變體的編碼序列。當(dāng)與本發(fā)明的核酸比較時,這樣的等位基因突變體可以具有置換,缺失或者插入一個或者多個核苷酸。0259此外,本發(fā)明的探針和方法可以用于分離編碼與本發(fā)明多肽具有至少大約99%、至少95%、至少90%、至少85%、至少80%、至少75%、至少70%、至少65%、至少60%、至少55%、或者至少50%的序列同一性(同源性)的多肽的核酸,如應(yīng)用序列比對算法(如,使用默認(rèn)參數(shù)的FASTA版本3.0t78的算法,或者具有在此提及的示例性設(shè)置的BLAST2.2.2程序)確定的,所述本發(fā)明多肽含有其至少5、10、15、20、25、30、35、40、50、75、100或者150個連續(xù)的氨基酸。抑制磷脂酶的表達0260本發(fā)明進一步提供與本發(fā)明的核酸序列如磷脂酶編碼核酸互補的核酸(如,本發(fā)明的核酸序列的反義序列)。反義序列可以抑制磷脂酶編碼基因的轉(zhuǎn)運,剪接或者轉(zhuǎn)錄。抑制可以通過靶向基因組DNA或者信使RNA而起作用。例如,通過雜交和/或切割,可以抑制被靶向的核酸的轉(zhuǎn)錄或者功能。本發(fā)明提供的特別有效的一套抑制物包括能夠結(jié)合磷脂酶基因或者信使的寡核苷酸,在每一種情況下,阻止或者抑制磷脂酶的產(chǎn)生或者發(fā)揮功能。結(jié)合可以通過序列特異性的雜交實現(xiàn)。另一類有用的抑制物包括引起磷脂酶信使物失活或者切割的寡核苷酸。寡核苷酸可以具有引起此種切割的酶活性,如核酶。寡核苷酸可以進行化學(xué)修飾,或者接合到能夠切割互補核酸的酶或組合物上。操作人員可以篩選具有許多不同的此類寡核苷酸的文庫,以獲得那些具有期望的活性的寡核苷酸。0261磷脂酶表達的抑制可以具有多種不同的工業(yè)用途。例如,抑制磷脂酶的表達可以減慢或者阻止酸敗。當(dāng)脂類或多肽,如,結(jié)構(gòu)脂類或者多肽,被酶降解時,可能發(fā)生酸敗。這可以導(dǎo)致水果和蔬菜的變質(zhì)或者腐敗。一方面,應(yīng)用可以抑制磷脂酶的表達和/或活性的本發(fā)明的組分,例如,抗體、反義寡核苷酸、核酶和RNAi,可以用于減緩或者阻止酸敗。因此,在一方面,本發(fā)明提供方法和組分,包括將本發(fā)明的抗體、反義寡核苷酸、核酶和RNAi應(yīng)用于植物或者植物產(chǎn)品(如,水果、種籽、根、葉等),以阻止或者延緩酸敗。這些組分也可以由植物(如,轉(zhuǎn)基因植物)或者其它生物(如,用本發(fā)明的磷脂酶基因轉(zhuǎn)化的細(xì)菌或者其它微生物)表達。0262用于抑制磷脂酶表達的本發(fā)明的組分(如反義物、iRNA、核酶、抗體)可以用作藥物組分。0263本發(fā)明提供能夠結(jié)合磷脂酶信使的反義寡核苷酸,該反義寡核苷酸可以通過靶向mRNA來抑制磷脂酶活性。設(shè)計反義寡核苷酸的策略在科學(xué)和專利文獻中己經(jīng)充分說明,并且技術(shù)熟練人員可以應(yīng)用本發(fā)明的新型試劑來設(shè)計這樣的磷脂酶寡核苷酸。例如,用于篩選有效的反義寡核苷酸的基因步行/RNA作圖試驗方案是本領(lǐng)域所熟知的參見,如Ho(2000)MethodsEnzymol.314:168-183,該文獻描述了RNA作圖分析方法,作圖分析方法以標(biāo)準(zhǔn)的分子技術(shù)為基礎(chǔ),為有效的反義序列選擇提供了簡單而可靠的方法。也參見Smith(2000)Eur.J.Pharm.Sci.11:191-198。0264也可以應(yīng)用天然存在的核酸作為反義寡核苷酸。反義寡核苷酸可以是任何長度;例如,在可選的方面,反義寡核苷酸在大約5到100、大約10到80、大約15到60、大約18到40之間。最佳長度可以通過常規(guī)的篩選方法來確定。反義寡核苷酸可以以任何濃度存在。最佳濃度可以通過常規(guī)的篩選方法來確定。巳經(jīng)知道有許多能夠解決該潛在的問題的合成的,非天然存在的核苷酸和核酸類似物。例如,可以應(yīng)用含有非離子性骨架,如N-(2-氨基乙基)甘氨酸單位的肽核酸(PNAs)。也可以應(yīng)用具有硫代磷酸連接的反義寡核苷酸,如WO97/03211;WO96/39154;Mata(1997)ToxicolApplPharmacol144:189-197;AntisenseTherapeutics,ed.Agrawal(HumanaPress,Totowa,N丄,1996)所述。正如上面所描述的,本發(fā)明提供的具有合成DNA骨架類似物的反義寡核苷酸也可以包括二硫代磷酸酯、甲基膦酸、氨基磷酸酯、烷基磷酸三酯、氨基磺酸酯、3'-硫代乙縮醛、亞甲基(甲基亞氨)、3'-N-氨基甲酸酯和嗎啉代氨基甲酸酯核酸。0265可以應(yīng)用組合化學(xué)方法產(chǎn)生大量的寡核苷酸,可以對這些寡核苷酸快速篩選,以獲得對任何靶,如本發(fā)明的有義和反義的磷脂酶序列,具有適當(dāng)?shù)慕Y(jié)合親和性和特異性的特定的寡核苷酸(見,如Gold(1995)J.ofBiol.Chem.270:13581-13584)。層絲提艨0266本發(fā)明提供能夠結(jié)合磷脂酶信使的核酶,其可以通過耙向mRNA來抑制磷脂酶的酶活性。設(shè)計核酶和選擇用于靶向作用的對磷脂酶具特異性的反義序列在科學(xué)和專利文獻中已經(jīng)充分說明,并且技術(shù)熟練人員可以應(yīng)用本發(fā)明的新型試劑來設(shè)計這樣的核酶。核酶通過核酶的靶RNA結(jié)合部分結(jié)合耙RNA而起作用,該核酶的靶RNA結(jié)合部分與切割靶RNA的RNA酶活部分非常接近。因此,核酶通過互補的堿基配對作用,識別并且結(jié)合靶RNA,并且一旦結(jié)合于正確的位點,將酶法切割靶RNA并且使靶RNA失活。如果切割發(fā)生在編碼序列中,以這種方式進行的耙RNA的切割將破壞其指導(dǎo)編碼蛋白合成的能力。當(dāng)核酶結(jié)合并且切割其耙RNA后,一般情況下,將從RNA上釋放,因此能夠反復(fù)地結(jié)合和切割新的耙標(biāo)。0267在一些情況下,核酶的酶促性質(zhì)會優(yōu)于其它的技術(shù),如反義技術(shù)(其中核酸分子僅結(jié)合于核酸靶來阻止其轉(zhuǎn)錄、翻譯或者與其它分子的結(jié)合),因為實現(xiàn)治療效果所必要的核酶有效濃度可能低于反義寡核苷酸的濃度。這一潛在的優(yōu)點反映出核酶可以以酶促方式進行作用的能力。因此,單個核酶分子可以切割靶RNA的多個分子。另外,核酶典型地是高度特異性的抑制物,其抑制作用的特異性不僅依賴于堿基配對的結(jié)合機制,也依賴于該分子抑制與其結(jié)合的RNA的表達的機制。即,所述抑制是由切割靶RNA引起的,因此特異性定義為靶RNA的切割率與非靶RNA的切割率的比值。除了涉及堿基配對的那些因素,這種切割機制還依賴于另外的因素。這樣,核酶作用的特異性比結(jié)合于同樣的RNA位點的反義寡核苷酸高。0268具有酶活的核酶RNA分子可以以錘頭狀基序(hammerheadmotif)形成,但也可以以發(fā)夾、肝炎S病毒、I類內(nèi)含子或者RnaseP樣的RNA(與RNA的引導(dǎo)序列有關(guān))基序形成。這樣的錘頭狀基序的例子在如Rossi(1992)AidsResearchandHumanRetroviruses8:183中有描述;發(fā)夾基序在Hampel(1989)Biochemistry28:4929和Hampel(1990)Nuc.AcidsRes.18:299中有描述;肝炎S病毒基序在Perrotta(1992)Biochemistry31:16中有描述;RNaseP基序在Guetrier陽Takada(1983)Cell35:849中有描述;I類內(nèi)含子在Cech美國專利4,987,071中有描述。描述這些特異基序的目的不是限制性的;本領(lǐng)域技術(shù)人員將認(rèn)識到,本發(fā)明的酶RNA分子具有與一個或者多個耙基因RNA區(qū)域互補的特異性底物結(jié)合位點,并且具有在底物結(jié)合位點內(nèi)或者周圍賦予該分子以RNA切割活性的核苷酸序列。m4f涉譜A0269一方面,本發(fā)明提供包括本發(fā)明的磷脂酶序列的RNA抑制分子,所謂的"RNAi"分子。RNAi分子包括雙鏈RNA(dsRNA)分子。RNAi可以抑制磷脂酶基因的表達。在一個方面,RNAi的長度大約為15、16、17、18、19、20、21、22、23、24、25或更多個雙鏈體核苷酸。雖然本發(fā)明不限于任何特殊的作用機制,但RNAi可進入細(xì)胞中,引起相似或相同序列的單鏈RNA(ssRNA)的降解,包括內(nèi)源性mRNA。當(dāng)細(xì)胞暴露于雙鏈RNA(dsRNA)時,來自同源基因的mRNA被稱為RNA干擾(RNAi)的過程選擇性地降解。RNAi的一個可能的基本機制是將與特定的基因序列匹配的雙鏈RNA(dsRNA)打斷成為稱為短的干擾RNA的短碎片,它可觸發(fā)與其序列匹配的mRNA的降解。在一個方面,本發(fā)明的RNAi可用于基因沉默(gene-silencing)療法中,見,例如Shuey(2002)DrugDiscov.Today7:1040-1046。在一個方面,本發(fā)明提供了使用本發(fā)明的RNAi選擇性降解RNA的方法。該過程可在體外、離體或體內(nèi)實施。在一個方面,本發(fā)明的RNAi分子可用來在細(xì)胞、器官或動物中產(chǎn)生喪失功能的突變。制備和應(yīng)用可選擇性降解RNA的RNAi分子的方法在本領(lǐng)域中是熟知的,見,例如美國專利6,506,559;6,511,82;6,515,109;6,489,127。核酸修飾0270本發(fā)明提供產(chǎn)生本發(fā)明的核酸,例如那些編碼磷脂酶的核酸的變體的方法。在可選擇的實施方式中,本發(fā)明提供了修飾本發(fā)明的酶的方法,例如通過隨意或隨機方法,或非隨機方法或"定向進化"方法,諸如基因位點飽和誘變TM(GSSM)對其編碼序列進行突變,以改變酶的活性pH范圍或最佳活性pH范圍,活性溫度范圍或最佳活性溫度范圍、特異性、活性(動力學(xué));酶對糖基化、磷酸化或金屬(例如Ca、Mg、Zn、Fe、Na)的應(yīng)用,例如以影響pH/溫度穩(wěn)定性。本發(fā)明提供了修飾本發(fā)明的酶的方法,例如通過GSSM對其編碼序列進行突變,以增加它對蛋白酶活性的抗性。本發(fā)明提供了修飾本發(fā)明的酶的方法,例如通過GSSM對其編碼序列進行突變,以改變酶對Ca、Mg、Na的特異性金屬螯合劑的應(yīng)用,其不會螯合Zn。本發(fā)明提供了修飾本發(fā)明的酶的方法,例如通過GSSM對其編碼序列進行突變,其將具有期望的活性組合,例如PI、PA和PC/PE特異性PLCs。0271這些方法可以重復(fù)或者在不同的組合中使用,產(chǎn)生與模板核酸編碼的磷脂酶相比具有改變的或不同活性或者改變的或不同穩(wěn)定性的磷脂酶。這些方法也可以重復(fù)或者在不同的組合中使用,例如,產(chǎn)生基因/信息表達,信息翻譯或者信息穩(wěn)定性上的變異。另一方面,細(xì)胞的遺傳組分可以通過,例如離體的同源基因修飾,然后再插入細(xì)胞中而加以改變。0272本發(fā)明的核酸可以通過任何方法改變。例如,無規(guī)則或隨機方法,或者,非隨機方法,或者"定向進化"方法。0273基因的隨機突變方法在本領(lǐng)域是已知的,參見如,美國專利5,830,696。例如,可以應(yīng)用突變劑來對基因進行隨機突變。突變劑包括,如,紫外線或者Y輻射,或者化學(xué)誘變劑,如,絲裂霉素,亞硝酸,光活化的補骨脂內(nèi)酯,它們單獨使用或者組合使用來誘導(dǎo)DNA的斷裂,其可以通過重組被修復(fù)。其它的化學(xué)誘變劑包括,女口,亞硫酸氫鈉、亞硝酸、羥胺、肼或者甲酸。其它的誘變劑是核苷酸前體的類似物,如,亞硝基胍、5-溴尿嘧啶、2-氨基嘌呤或者吖啶。這些試劑可以加入到PCR反應(yīng)中替換核苷酸前體,從而突變該序列。也可以應(yīng)用嵌入試劑如普羅黃素、吖啶黃、奎納克林和類似物。0274可以應(yīng)用分子生物學(xué)上的任何技術(shù),如隨機PCR誘變,參見,如,Rice(1992)Proc.Natl.Acad.Sci.USA89:5467-5471;或者組合式多重盒式誘變,參見如,Crameri(1995)Biotechinques18:194-196??蛇x擇地,核酸,如基因,可以在隨機片段化后重新裝配,參見,如,美國專利6,291,242;6,287,862;6,287,861;5,955,358;5,830,721;5,824,514,5,811,238;5,605,793。在可選擇的方面,修飾、增加或者刪除可以通過易錯PCR、改組、寡核苷酸誘導(dǎo)的定點突變、裝配PCR、有性PCR誘變、體內(nèi)誘變、盒式誘變、遞歸整體誘變、指數(shù)整體突變、位點專一性誘變、基因再裝配、基因位點飽和誘變(GSSM)、合成連接重裝配(SLR)、重組、遞歸序列重組(recursivesequencerecombination)、硫代磷酸酯修飾的DNA誘變、含有尿嘧啶模板的誘變、缺口只又重i秀變(gappedduplexmutagenesis)、點錯酉己4彥復(fù)i秀變(pointmismatchrepairnmtagenesis)、修復(fù)缺陷型宿主株誘變、化學(xué)誘變、放射誘變、缺失誘變、限制選擇誘變(restriction-selectionmutagenesis)、限制純化誘變(restriction-purificationmutagenesis)、人工基因合成、整體誘變、嵌合核酸多聚體生成和/或者這些方法和其它方法的組合產(chǎn)生。0275以下的出版物描述了各種遞歸重組程序和/或可以并入到本發(fā)明的方法中的方法Stemmer(1999)"Molecularbreedingofvirusesfortargetingandotherclinicalproperties"TumorTargeting4:1-4;Ness(1999)NatureBiotechnology17:893-896;Chang(1999)"EvolutionofacytokineusingDNAfamilyshuffling"NatureBiotechnology17:793-797;Minshull(1999)"Proteinevolutionbymolecularbreeding"CurrentOpinioninChemicalBiology3:284-290;Christians(1999"DirectedevolutionofthymidinekinaseforAZTphosphorylationusingDNAfamilyshuffling"NatureBiotechnology17:259-264;Crameri(1998)"DNAshufflingofafamilyofgenesfromdiversespeciesacceleratesdirectedevolution"Nature391:288-291;Crameri(1997)"MolecularevolutionofanarsenatedetoxificationpathwaybyDNAshuffling"NatureBiotechnology15:436-438;Zhang(1997)"DirectedevolutionofaneffectivefucosidasefromagalactosidasebyDNAshufflingandscreening"Proc.Natl.Acad.Sci.USA94:4504-4509;Patten等(1997)"ApplicationsofDNAShufflingtoPharmaceuticalsandVaccines"CurrentOpinioninBiotechnology8:724-733;Crameri等(1996)"Constructionandevolutionofantibody-phagelibrariesbyDNAshuffling"NatureMedicine2:100-103;Crameri等(1996)"ImprovedgreenfluorescentproteinbymolecularevolutionusingDNAshuffling"NatureBiotechnology14:315-319;Gates等(1996)"Affinityselectiveisolationofligandsfrompeptidelibrariesthroughdisplayonaiacrepressor'headpiecedimer"JournalofMolecularBiology255:373-386;Stemmer(1996)"SexualPCRandAssemblyPCR"In:TheEncyclopediaofMolecularBiology.VCHPublishers,NewYork.447-457頁;Crameri禾口Stemmer(1995)"Combinatorialmultiplecassettemutagenesiscreatesallthepermutationsofmutantandwildtypecassettes"BioTechniques18:194-195;Stemmer等(1995)"Single-stepassemblyofageneandentireplasmidformlargenumbersofoligodeoxyribonucleotides"Gene,164:49-53;Stemmer(1995)"TheEvolutionofMolecularComputation''Science270:1510;Stemmer(1995)"SearchingSequenceSpace,,Bio/Technology13:549-553;Stemmer(1994)"RapidevolutionofaproteininvitrobyDNAshuffling"Nature370:389-391;禾口Stemmer(1994〉"DNAshufflingbyrandomfragmentationandreassembly:Invitrorecombinationformolecularevolution"Proc.NatLAcad.Sci,USA91:10747-10751。0276產(chǎn)生多樣性的突變方法包括,例如,定點誘變(Ling等(1997"ApproachestoDNAmutagenesis:anoverview"AnalBiochem.254(2):157-178;Dale等(1996)"Oligonucleotide-directedrandommutagenesisusingthephosphorothioatemethod"MethodsMol.Biol.57:369-374;Smith(1985)"Invitromutagenesis"Ann.Rev.Genet.19:423-462;Botstein&Shortle(1985)"Strategiesandapplicationsofinvitromutagenesis"Science229:1193-1201;Carter(1986)"Site-directedmutagenesis,,Biochem.J.237:1-7;Kunkel(1987)"Theefficiencyofoligonucleotidedirectedmutagenesis"在NucleicAcids&MolecularBiology(Eckstein,F.禾口Lilley,D.M.J.eds.,SpringerVerlag,Berlin));使用含有尿嘧啶的模板的誘變(Kunkel(1985)"Rapidandefficientsite-specificmutagenesiswithoutphenotypicselection"Proc.Natl.Acad.Sci.USA82:488-492;Kunkel等(1987)"Rapidandefficientsite-specificmutagenesiswithoutphenotypicselection"MethodsinEnzymol.154,367-382;禾卩Bass等(1988)"MutantTrprepressorswithnewDNA-bindingspecificities"Science242:240-245);寡核苷酸誘導(dǎo)的定點誘變(MethodsinEnzymol.100:468-500(1983);MethodsinEnzymol.154:329-350(1987);Zoller&Smith(1982)"Oligonucleotide-directedmutagenesisusingM13-derivedvectors:anefficientandgeneralprocedurefortheproductionofpointmutationsinanyDNAfragment"NucleicAcidsRes.10:6487-6500;Zoller&Smith(1983)"Oligonucleotide-directedmutagenesisofDNAfragmentsclonedintoMl3vectors"MethodsinEnzymol.100:468-500;禾口Zoller&Smith(1987)"Oligonucleotide-directedmutagenesis:asimplemethodusingtwooligonucleotideprimersandasingle-strandedDNAtemplate"MethodsinEnzymol.154:329-350);硫代磷酸酯修飾的DNA誘變(Taylor等(1985)"Theuseofphosphorothioate陽modifiedDNAinrestrictionenzymereactionstopreparenickedDNA"Nucl.AcidsRes,13:8749-8764;Taylor等(1985)"Therapidgenerationofoligonucleotide-directedmutationsathighfrequencyusingphosphorothioate-modifiedDNA"Nucl.AcidsRes.13:8765-8787(1985);Nakamaye(1986)"InhibitionofrestrictionendonucleaseNciIcleavagebyphosphorothioategroupsanditsapplicationtooligonucleotide-directedmutagenesis"Nud,AcidsRes,14:9679-9698;Sayers等(1988)"Y-TExonucleasesinphosphorothioate-basedoligonucleotide-directedmutagenesis"Nucl.AsidsRes.16:791-802;禾口Sayers等(1988)"Strandspecificcleavageofphosphorothioate-containingDNAbyreactionwithrestrictionendonucleasesinthepresenceofethidiumbromide"Nucl.AcidsRes.16:803-814);使用缺口二倍DNA的誘變(Kramer等(1984)"ThegappedduplexDNAapproachtooligonucleotide-directedmutationconstruction"Nucl.AcidsRes.12:9441-9456;Kramer&Fritz(1987)MethodsinEnzymol."Oligonucleotide-directedconstructionofmutationsviagappedduplexDNA"154:350-367;Kramer等(1988)"ImprovedenzymaticinvitroreactionsinthegappedduplexDNAapproachtooligonucleotide-directedconstructionofmutations"Nucl.AcidsRes,16:7207;禾口Fritz等(1988)"Oligonucleotide-directedconstructionofmutations:agappedduplexDNAprocedurewithoutenzymaticreactionsin85vitro"Nucl.AcidsRes.16:6987-6999)。0277可以用于實踐本發(fā)明方法的另外的實驗方案包括點錯配修復(fù)(Kramer(1984)"PointMismatchRepair"Cell38:879-887),應(yīng)用修復(fù)缺陷型宿主株的誘變(Carter等(1985)"Improvedoligonucleotidesite-directedmutagenesisusingMl3vectors"Nucl.AcidsRes.13:4431-4443;禾口Carter(1987)"Improvedoligonucleotide-directedmutagenesisusingMl3vectors"MethodsinEnzymol.154:382-403),缺失誘變(Eghtedarzadeh(1986)"Useofoligonucleotidestogeneratelargedeletions"Nucl,AcidsRes.14:5115),限帝U-選擇和限制陽選擇和限制-純化(Wells等(1986)"Importanceofhydrogen-bondformationinstabilizingthetransitionstateofsubtilisin"Phil.Trans.R,Soc.Lond.A317:415-423),通過全基因合成的誘變(Nambiar等(1984)"TotalsynthesisandcloningofagenecodingfortheribonucleaseSprotein"Science223:1299-1301;Sakamar禾口Khorana(1988)"Totalsynthesisandexpressionofageneforthea-subunitofbovinerodoutersegmentguaninenucleotide-bindingprotein(transducin)"Nucl.AcidsRes,14:6361-6372;Wells等(1985)"Cassettemutagenesis:anefficientmethodforgenerationofmultiplemutationsatdefinedsites"Gene34:315-323;禾口Gmndstrom等(1985)"Oligonucleotide-directedmutagenesisbymicroscale'shot-gun'genesynthesis"Nucl.AcidsRes,13:3305-3316),雙鏈斷裂修復(fù)(Mandecki(1986);Arnold(1993)"Proteinengineeringforunusualenvironments"CurrentOpinioninBiotechnology4:450-455。"Oligonucleotide-directeddouble-strandbreakrepairinplasmidsofEscherichiacoli:amethodforsite-specificmutagenesis"Proc.Natl,Acad.Sci.USA,83:7177-7181)。很多以上的方法的另外的細(xì)節(jié)可在MethodsinEnzymology第154巻中發(fā)現(xiàn),其中也描述了用于解決各種誘變方法中所遇到的問題的有用策略。0278也參見Stemmer的美國專利5,605,793(1997年2月25日),"MethodsforInVitroRecombination;"Stemmer等人的美國專利5,811,238(1998年9月22日)"MethodsforGeneratingPolynucleotideshavingDesiredCharacteristicsbyIterativeSelectionandRecombination;"Stemmer等人的美國專利5,830,721(1998年11月3日),"DNAMutagenesisbyRandomFragmentationandReassembly;"Stemmer等人的美國專利5,834,252(1998年11月10日)"End-ComplementaryPolymeraseReaction;"Minshull等人的美國專利5,837,458(1998年11月17日),"MethodsandCompositionsforCellularandMetabolicEngineering;"WO95/22625,Stemmer禾卩Cramen,"MutagenesisbyRandomFragmentationandReassembly;"Stemmer禾卩Lipschutz的WO96/33207"EndComplementaryPolymeraseChainReaction;"Stemmer禾卩Crameri的WO97/20078"MethodsforGeneratingPolynucleotideshavingDesiredCharacteristicsbyIterativeSelectionandRecombination;"Minshull禾卩Stemmer的WO97/35966,"MethodsandCompositionsforCellularandMetabolicEngineering;"Punnonen等人的WO99/41402"TargetingofGeneticVaccineVectors;"Punnonen等人的WO99/41383"AntigenLibraryImmunization;"Punnonen等人的WO99/41369"GeneticVaccineVectorEngineering;"Punnonen等人的WO99/41368"OptimizationofImmunomodulatoryPropertiesofGeneticVaccines;"Stemmer禾口Crameri的EP752008"DNAMutagenesisbyRandomFragmentationandReassembly;"Stemmer的EP0932670"EvolvingCellularDNAUptakebyRecursiveSequenceRecombination;"Stemmer等人的WO99/23107,"ModificationofVimsTropismandHostRangebyViralGenomeShuffling;"Apt等人的WO99/21979,"HumanPapillomavirusVectors;"delCardayre等人的WO98/31837"EvolutionofWholeCellsandOrganismsbyRecursiveSequenceRecombination;"Patten禾口Stemmer的WO98/27230"MethodsandCompositionsforPolypeptideEngineering,"Stemmer等人的WO98/27230,"MethodsforOptimizationofGeneTherapybyRecursiveSequenceShufflingandSelection,"WO00/00632,"MethodsforGeneratingHighlyDiverseLibraries,"WO00/09679,"MethodsforObtaininginVitroRecombinedPolynucleotideSequenceBanksandResultingSequences,"Arnold等人的WO98/42832,"RecombinationofPolynucleotideSequencesUsingRandomorDefinedPrimers,"Arnold等人的WO99/29902,"MethodforCreatingPolynucleotideandPolypeptideSequences,"Vind的WO98/41653,"AninVitroMethodforConstructionofaDNALibrary,"Borchert等人的WO98/41622,"MethodforconstructingaLibraryUsingDNAShuffling,"禾卩Pati禾口Zarling的WO98/42727,"SequenceAlterationsusingHomologousRecombination"。0279某些美國申請?zhí)峁┝岁P(guān)于產(chǎn)生不同多樣性的方法的額外細(xì)節(jié),包括Patten等人于1999年9月28日提交的"SHUFFLINGOFCODONALTEAEDGENES"(美國系列號09/407,800);delCardayre等人于1998年7月15日提交的(美國系列號09/166,188)和于1999年7月15日提交的(美國系列號09/354,922)"EVOLUTIONOFWHOLECELLSANDORGANISMSBYRECURSIVESEQUENCERECOMBINATION";Crameri等人的于1999年9月28日提交的"OLIGONUCLEOTIDEMEDIATEDNUCLEICACIDRECOMBINATION"(美國系列號09/408,392)和Crameri等人于2000年1月18日提交的"OLIGONUCLEOTIDEMEDIATEDNUCLEICACIDRECOMBINATION"(PCT/US00/01203);Welch等人于1999年9月28日提交的"USEOFCODON-VARIEDOLIGONUCLEOTIDESYNTHESISFORSYNTHETICSHUFFLING"(美國系列號09/408,393);Selifonov等人于2000年1月18日提交的"METHODSFORMAKINGCHARACTERSTRINGS,POLYNUCLEOTIDS&POLYPEPTIDESHAVINGDESIREDCHARACTERISTICS"(PCT/US00/01202)禾口,例如,Selifonov等人于2000年7月18日提交的"METHODSFORMAKINGCHARACTERSTRINGS,POLYNUCLEOTIDS&POLYPEPTIDESHAVINGDESIREDCHARACTERISTICS"(美國系列號09/618,579);Selifonov和Stemmer于2000年1月18日提交的"METHODSOFPOPULATINGDATASTRUCTURESFORUSEINEVOLUTIONARYSIMULATIONS"(PCT/US00/01138);和Affholter于2000年9月6日提交的"SINGLE-STRANDEDNUCLEICACIDTEMPLATE-MEDIATEDRECOMBINATIONANDNUCLEICACIDFRAGMENTISOLATION"(美國系列號09/656,549)。0280非隨機或"定向進化"方法包括,例如飽和誘變(例如GSSM)、合成連接重裝配(SLR)或其組合,它們被用于修飾本發(fā)明的核酸,以產(chǎn)生具有新的或改變的特性(例如在高度酸性或堿性條件下的活性,在高溫或低溫的活性,等等)的磷脂酶。由修飾的核酸編碼的多肽可以在測試磷脂酶或其它活性之前被篩選活性??梢允褂萌魏螠y試形式或?qū)嶒灧桨?,例如使用毛?xì)管陣列平臺。例如參見美國專利6,361,974;6,280,926;5,939,250。潛游誘變或G5W0281本發(fā)明的一個方面,非隨機的基因修飾,"定向進化過程"用于產(chǎn)生具有新的或者改變的特性的磷脂酶。本方法的各種變化已經(jīng)被稱為"基因位點誘變"、"位點飽和誘變"、"基因位點飽和誘變"或者簡單地稱為"GSSM"。飽和誘變可以與別的誘變過程相結(jié)合。見,例如,美國專利6,171,820;6,238,884。一方面,GSSM包括提供模板多核苷酸和眾多的寡核苷酸,其中每種寡核苷酸包括與模板多核苷酸同源的序列,因此靶向模板多核苷酸中的特異序列,以及為同源基因的變體的序列;通過使用寡核苷酸復(fù)制模板多核苷酸,產(chǎn)生包括非隨機序列變體的子代多核苷酸,從而產(chǎn)生包括同源基因序列變異的多核苷酸。0282一方面,含有簡并N,N,G/T序列的密碼子引物被用于將點突變引入多核苷酸中,以便產(chǎn)生一組子代多肽,其中在每一氨基酸位置上可表現(xiàn)出全范圍的單氨基酸置換,置換發(fā)生的位置例如酶活性位點中的氨基酸殘基,或?qū)⒁恍揎椀呐潴w結(jié)合位點。這些寡核苷酸可以包括相鄰的第一同源序列,簡并N,N,G/T序列,和任選地第二同源序列。由使用這些寡核苷酸而得到的下游子代翻譯產(chǎn)物包含沿著多肽的每一氨基酸位點上的所有可能的氨基酸變化,這是由于N,N,G/T序列的簡并性包括了所有20個氨基酸的密碼子。一方面,一個這樣的簡并寡核苷酸(例如包括一個簡并N,N,G/T序列盒)被用于使親本多核苷酸模板中的每一原始密碼子進行完全范圍的密碼子置換。另一方面,使用至少兩個簡并序列盒,或在相同的寡核苷酸中或不同的寡核苷酸中,用于使親本多核苷酸模板中的至少兩個原始密碼子進行完全范圍的密碼子置換。例如,一個寡核苷酸中可以包含一個以上N,N,G/T序列,以便在多于一個的位點上引入氨基酸突變。這些多個N,N,G/T序列可以直接相鄰,或被一個或多個額外的核苷酸序列分隔開。另一方面,用于引入插入和刪除的寡核苷酸可以單獨使用,或者與含有N,N,G/T序列的密碼子組合使用,以便引入氨基酸插入、刪除和/或置換的任何排列組合0283一方面,兩個或更多個連續(xù)氨基酸位置的同時誘變是使用含有相鄰N,N,G/T三聯(lián)體的寡核苷酸進行的,即簡并(N,N,G/T)n序列。另一方面,使用與N,N,G/T序列相比具有較低簡并性的簡并序列盒。例如,在一些情況下,可能期望(例如,在寡核苷酸中)使用僅包括一個N的簡并三聯(lián)體序列,其中所述的N可以在三聯(lián)體的第一、第二或第三位置上。在該三聯(lián)體的剩余兩個位置上,可以使用包括任意排列組合的任何其它堿基。可以選擇地,在一些情況下可能期望使用(例如在寡聚體中)簡并N,N,N三聯(lián)體序列。0284一方面,使用簡并三聯(lián)體(例如N,N,G/T三聯(lián)體)允許在多肽中的每一和每個氨基酸位置上系統(tǒng)且容易地產(chǎn)生完全范圍的可能的天然氨基酸(總共20種氨基酸)(在可以選擇的方面,這些方法也包括在每一氨基酸殘基或密碼子、位置產(chǎn)生少于全部的可能置換)。例如,對于100個氨基酸的多肽,可以產(chǎn)生2000個不同種類(即每個位置上的20種可能氨基酸x100個氨基酸位置)。通過使用含有簡并N,N,G/T三聯(lián)體的寡核苷酸或一組寡核苷酸,32種不同序列可編碼所有20種可能的天然氨基酸。因此,在其中使用至少一種這樣的寡核苷酸對親本多核苷酸序列進行飽和誘變的反應(yīng)容器中,產(chǎn)生了編碼20種不同多肽的32種不同的子代多核苷酸。相反,在定點誘變中使用非簡并寡核苷酸在每個反應(yīng)容器中僅僅導(dǎo)致一種子代多肽。非簡并寡核苷酸可以任選地與所公開的簡并引物組合使用;例如,非簡并寡核苷酸可以被用于在工作多核苷酸中產(chǎn)生特異性點突變。這提供了產(chǎn)生特異性沉默點突變、導(dǎo)致相應(yīng)的氨基酸變化的點突變、以及導(dǎo)致產(chǎn)生終止密碼子和多肽片段的相應(yīng)表達的手段。0285一方面,每一飽和誘變反應(yīng)容器含有編碼至少20種子代多肽(例如磷脂酶)分子的多核苷酸,以便所有的20種天然氨基酸都會出現(xiàn)在對應(yīng)于親本多核苷酸中被誘變的密碼子位置的特定氨基酸位置(其它方面使用了少于20個天然的組合)。從每一飽和誘變反應(yīng)容器產(chǎn)生的32倍簡并的子代多肽可以被克隆擴增(例如使用表達載體克隆到合適的宿主中,例如大腸桿菌宿主中),并進行表達篩選。當(dāng)單個子代多肽通過篩選鑒定,顯示出有利的特性變化時(當(dāng)與親本多肽相比時,如在堿性或酸性條件下增高的磷脂酶水解活性),可以對其測序以鑒定其中所含的相應(yīng)的有利氨基酸置換。0286一方面,如本文所公開的,應(yīng)用飽和誘變對親本多肽的各個和所有的氨基酸位置進行誘變后,可以在超過一個的氨基酸位置確定出有利的氨基酸變化。可以產(chǎn)生一個或多個新的子代分子,其含有所有或部分這些有利的氨基酸置換的組合。例如,如果在多肽的3個氨基酸位置的每一個氨基酸位置處鑒定出2個特異的有利的氨基酸變化,那么出現(xiàn)的排列就包括每一位置上的3種可能性(與原始氨基酸沒有變化的可能性,以及兩個有利變化中的每一個的可能性)和3個位置。因此,總共有3x3x3或27種可能性,其中包括了先前被檢驗的7種可能性,即6個單點突變(即三個位置的每一個位置有2個)和在任何位置上沒有變化的點突變。0287另一方面,為了改變序列,定點飽和誘變可以與任何隨機的或非隨機方法一起使用,例如合成的連接重裝配(見下文)、重排、嵌合化、重組和其它誘變方法和誘變劑。本發(fā)明提供以重復(fù)方式使用任何誘變方法,包括飽和誘變。會成遂體微"丄W0288本發(fā)明提供稱為"合成連接重裝配",或者簡單地稱為"SLR"的非隨機基因修飾系統(tǒng),這是一種"定向進化方法",以產(chǎn)生具有新的或者改變的特性的磷脂酶。SLR是非隨機地把寡核苷酸片段連接在一起的方法。此方法與隨機的寡核苷酸重排不同,因為核酸構(gòu)件不是改組的、串聯(lián)的或者隨機地嵌合的,而是非隨機組裝的。參見,例如,美國專利申請系列號(USSN)09/332,835,題目是"SyntheticLigationReassembtyinDirectedEvolution",于1999年6月14日提交("USSN09/332,835")。一方面,SLR包括下述步驟(a)提供模板多核苷酸,其中模板多核苷酸包含編碼同源基因的序列;(b)提供多個構(gòu)件多核苷酸,其中這些構(gòu)件多核苷酸被設(shè)計成可在預(yù)定的序列處與模板多核苷酸交換重裝配(cross-overreassemble),所述構(gòu)件多核苷酸包含作為同源基因變體的序列和與變體序列兩側(cè)的模板多核苷酸同源的序列;(c)將構(gòu)件多核苷酸與模板多核苷酸組合在一起,以便構(gòu)件多核苷酸與模板多核苷酸交換重裝配,以產(chǎn)生包含同源基因序列變異的多核苷酸。0289SLR不依賴于將被重新排列的多核苷酸之間存在高度同源性。因此,該方法可以被用于非隨機地產(chǎn)生包括超過10,個不同嵌合體的子代分子的文庫(或集合)。SLR可以被用于產(chǎn)生包括超過101()()()個不同子代嵌合體的文庫。因此,本發(fā)明的一些方面包括產(chǎn)生一組最終嵌合的核酸分子的非隨機方法,所述最終嵌合的核酸分子具有按設(shè)計所選擇的整個裝配次序。該方法包括按設(shè)計產(chǎn)生多個特異性核酸構(gòu)件的步驟,以及裝配這些核酸構(gòu)件的步驟,這樣可獲得依設(shè)計而定的整個裝配次序,所述的多個特異性核酸構(gòu)件具有可被應(yīng)用的互相相容的可連接末端。02卯將被裝配的核酸構(gòu)件的互相相容的可連接末端被認(rèn)為對于這種類型的有序裝配是"有用的",如果它們能使這些構(gòu)件以預(yù)定次序結(jié)合的話。因此,核酸構(gòu)件可以被偶聯(lián)的整個裝配次序是由可連接末端的設(shè)計來確定的。如果使用多于一個的裝配步驟,那么核酸構(gòu)件可被偶聯(lián)的總裝配次序也由裝配步驟的連續(xù)次序來確定。一方面,用酶例如連接酶(例如T4DNA連接酶)處理退火的結(jié)構(gòu)片段,以實現(xiàn)結(jié)構(gòu)片段的共價結(jié)合。0291一方面,寡核苷酸構(gòu)件的設(shè)計通過分析一組祖先核酸序列模板來獲得,所述祖先核酸模板作為產(chǎn)生最終嵌合的多核苷酸的子代集合的基礎(chǔ)。這些親本寡核苷酸模板因此作為序列信息的來源,它們在將被誘變例如被嵌合或改組的核酸構(gòu)件的設(shè)計中有用。0292在該方法的一個方面,多個親本核酸模板的序列被聯(lián)配,以便選擇一個或多個分界點。這些分界點可以位于同源區(qū)域,由一個或多個核苷酸構(gòu)成。這些分界點優(yōu)選地由至少兩個祖先模板共享。從而這些分界點可以被用于描繪將要產(chǎn)生的寡核苷酸構(gòu)件的邊界,以便重排列親本多核苷酸。在祖先分子中鑒定和選擇的分界點作為最終嵌合的子代分子的裝配中的潛在嵌合點。分界點可以是由至少兩個親本多核苷酸序列分享的同源區(qū)域(包括至少一個同源性核苷酸堿基)??梢赃x擇地,分界點可以是由至少一半的親本多核苷酸序列分享的同源區(qū)域,或者可以是由至少三分之二的親本多核苷酸序列分享的同源區(qū)域。甚至更優(yōu)選地,在一個方面,有用的分界點是由至少四分之三的親本多核苷酸序列分享的同源區(qū)域,或者可以是由幾乎所有的親本多核苷酸序列分享的同源區(qū)域。一方面,分界點是由所有親本多核苷酸序列共有的同源區(qū)域。0293一方面,連接再裝配過程被徹底地進行,以便產(chǎn)生含有盡量可能多的子代嵌合多核苷酸的文庫。換句話說,核酸構(gòu)件的所有可能的有序組合都呈現(xiàn)在最終嵌合的核酸分子集合中。同時,另一方面,在每一組合中的裝配次序(即各個最終嵌合核酸的5'到3序列中每一構(gòu)件的裝配次序)遵循如上所述的設(shè)計(或非隨機地)。由于本發(fā)明的非隨機特性,大大地降低了不需要的副產(chǎn)品的可能性。0294另一方面,連接再裝配方法被系統(tǒng)地進行。例如,實施該方法,以便產(chǎn)生子代分子的系統(tǒng)區(qū)分化的文庫,該文庫分成能被系統(tǒng)地篩選的數(shù)個部分,例如可以逐個地篩選。換句話說,通過選擇性的和審慎的應(yīng)用特定的核酸構(gòu)件,再加上選擇性的和審慎的應(yīng)用連續(xù)的分步驟的裝配反應(yīng),本發(fā)明使得這樣一種設(shè)計可以實現(xiàn),即可以在各個反應(yīng)容器中制備出各自特定的一系列子代產(chǎn)物。這樣的設(shè)計允許進行系統(tǒng)的檢查和篩選步驟。因此,這些方法允許很可能非常大量的子代分子以更小的組被系統(tǒng)地檢查。由于其具有以高度變通而又徹底和系統(tǒng)的方式進行嵌合化反應(yīng)的能力,尤其是當(dāng)祖先分子之間具有低水平的同源性時,這些方法可以產(chǎn)生包含大量子代分子的文庫(或集合)。由于本發(fā)明的連接再裝配的非隨機特性,所產(chǎn)生的子代分子一方面包含有最終嵌合核酸分子的文庫,這些核酸分子具有按設(shè)計而選擇的總裝配次序。飽和誘變和優(yōu)化的定向進化方法也可以被用于產(chǎn)生不同的子代分子種類。應(yīng)該意識到,本發(fā)明在分界點的選擇、核酸構(gòu)件的大小和數(shù)量以及偶聯(lián)的大小和設(shè)計方面提供了選擇的自由度和可控制性。進一步,應(yīng)該意識到,就本發(fā)明的可操作性而言,對分子間同源性的要求大大地放寬了。事實上,甚至可以在有很少的分子間同源性或沒有分子間同源性的區(qū)域內(nèi)選擇分界點。例如,由于密碼子的擺動,即密碼子的簡并性,可以將核苷酸取代引入核酸構(gòu)件,同時又不會改變在相應(yīng)的祖先模板中最初編碼的氨基酸。可以選擇地,可以改變密碼子,從而改變對原始氨基酸的編碼。在本發(fā)明中,這樣的取代可以被引入到核酸構(gòu)件中,以便增加分子間同源分界點的發(fā)生率,從而使得在構(gòu)件之間可獲得的偶聯(lián)的數(shù)量增加,而這又允許產(chǎn)生更多數(shù)量的子代嵌合分子。0295另一方面,產(chǎn)生構(gòu)件的步驟的合成屬性允許設(shè)計和引入核苷酸(例如一個或多個核苷酸,例如可以是密碼子或內(nèi)含子或調(diào)控序列),這些核苷酸隨后可以在體外過程中(例如通過誘變)或者在體內(nèi)過程中(例如通過利用宿主生物體的基因剪接能力)被任選地去除。應(yīng)該意識到,在許多情況下,除了產(chǎn)生有用的分界點的潛在好處之外,還有許多其它原因也使得可能期望引入這些核苷酸。0296一方面,核酸構(gòu)件被用于引入內(nèi)含子。因此,功能性的內(nèi)含子被引入進根據(jù)在此描述的方法產(chǎn)生的人造基因中。人工引入的內(nèi)含子可以在宿主細(xì)胞中發(fā)揮基因剪切的功能,作用方式非常像天然產(chǎn)生的內(nèi)含子發(fā)揮基因剪切功能的方式。汰眾/^定砟遂眾z務(wù)-統(tǒng)0297本發(fā)明提供了一種非隨機的基因修飾系統(tǒng),命名為"優(yōu)化的定向進化系統(tǒng)",其可以用來產(chǎn)生具有新的或者改變的特性的磷脂酶。優(yōu)化的定向進化涉及還原性重配、重組和選擇的重復(fù)循環(huán)應(yīng)用,其使得可以通過重組實現(xiàn)核酸的定向分子進化。優(yōu)化的定向進化允許產(chǎn)生大量的進化出的嵌合序列,其中產(chǎn)生的群體顯著地富集了具有預(yù)定數(shù)目遺傳交換事件(crossoverevents)的序歹"0298遺傳交換事件是在嵌合序列中的一個點,在這里,從一個親本變體到另一個親本變體的序列轉(zhuǎn)換發(fā)生。這樣的點一般在來自兩個親本的寡核苷酸連接在一起形成單個序列的連接處。這一方法允許計算寡核苷酸序列的正確濃度,這樣,序列的最終嵌合群體富集了選定數(shù)目的遺傳交換事件。這也提供了對選擇具有預(yù)定數(shù)目的遺傳交換事件的嵌合突變體的更多控制。0299此外,這一方法與其它系統(tǒng)相比,提供了一種用于探究大數(shù)量的可能蛋白變體空間的方便手段。以前,例如,如果在反應(yīng)中產(chǎn)生了1013個嵌合分子,測試這樣大數(shù)目的嵌合突變體的特定活性將會非常困難。此外,子代群體的相當(dāng)部分將具有很高數(shù)目的遺傳交換事件,其中得到的蛋白較不可能具有增高水平的特定活性。通過應(yīng)用這些方法,嵌合分子的群體可以富集那些含有特定數(shù)目的遺傳交換事件的變體。因此,盡管在反應(yīng)中可以仍然產(chǎn)生1013嵌合分子,但是所選擇的用于進一步分析的每一個分子很可能具有,例如,僅僅三個遺傳學(xué)交換事件。因為得到的子代群體可以偏向于具有預(yù)定數(shù)目的遺傳交換事件,所以嵌合分子之間的功能多樣性的界限縮小了。當(dāng)要計算在最初的親本多核苷酸中的哪一個寡核苷酸可能影響到特定的性質(zhì)時,這便提供了更加可控數(shù)目的變量。0300產(chǎn)生嵌合子代多核苷酸序列的一個方法是產(chǎn)生對應(yīng)于每一個親本序列的片段或者部分的寡核苷酸。每一個寡核苷酸優(yōu)選地包括重疊的獨特區(qū)域,這樣把所述寡核苷酸混合在一起,得到具有以正確順序裝配的每一寡核苷酸片段的新的變體。在USSN09/332,835中可以發(fā)現(xiàn)另外的信息。對應(yīng)于每一個親本變體產(chǎn)生的寡核苷酸數(shù)目與在最終產(chǎn)生的嵌合分子中得到的交換的總的數(shù)目具有一定的關(guān)系。例如,為了發(fā)現(xiàn)如在高溫下具有更高活性的嵌合變體,可以提供三個親本核苷酸序列變體來進行連接反應(yīng)。作為一個例子,對應(yīng)于每一個親本變體的每一部分可以產(chǎn)生總共50個寡核苷酸序列。相應(yīng)地,在連接再裝配過程中,在每一個嵌合序列中就有可能有多達50個交換事件。產(chǎn)生的每一個嵌合多核苷酸都以交替的順序含有來自各個親本變體的寡核苷酸的可能性很低。如果每一個寡核苷酸片段以同樣的摩爾量存在于連接反應(yīng)中,有可能在一些位置上來自同一親本多核苷酸的寡核苷酸將與相鄰的彼此連接,而不導(dǎo)致遺傳交換事件。如果在這一例子的任何連接步驟中,來自每一個親本的每一種寡核苷酸的濃度都保持不變,那么將會有三分之一的機會(假定3個親本)來自同一個親本變體的寡核苷酸將連接于嵌合序列內(nèi)而不產(chǎn)生交換。0301因此,可以確定概率密度函數(shù)(PDF),預(yù)測在一個連接反應(yīng)的每一步中可能發(fā)生的遺傳交換事件的總數(shù),其中給出了一套許多的親本變體、對應(yīng)于每種變體的許多寡核苷酸、以及在連接反應(yīng)的每個步驟中的每種變體的濃度。在確定PDF中應(yīng)用到的統(tǒng)計學(xué)和數(shù)學(xué)在下面被描述。通過應(yīng)用這些方法,可以計算這樣的概率密度函數(shù),而且這樣就富集了來源于特定連接反應(yīng)的具有預(yù)定數(shù)目的遺傳交換事件的嵌合子代群體。此外,可以預(yù)先確定遺傳交換事件的目標(biāo)數(shù)目,然后對該系統(tǒng)進行程序化,以計算在該連接反應(yīng)的每一個步驟中,每種親本寡核苷酸的起始量,從而得到以遺傳交換事件的預(yù)先確定的數(shù)目為中心的概率密度函數(shù)。這些方法涉及還原性重配、重組和選擇的重復(fù)循環(huán)應(yīng)用,使得能夠通過重組實現(xiàn)編碼多肽的核酸的定向分子進化。該系統(tǒng)允許產(chǎn)生大量的進化出的嵌合序列,其中產(chǎn)生的群體顯著地富集了具有預(yù)定數(shù)目遺傳交換事件的序列。遺傳交換事件是在嵌合序列中的一個點,在這里,從一個親本變體到另一個親本變體的序列轉(zhuǎn)換發(fā)生。這樣的點一般是在兩個親本的寡核苷酸連接在一起形成單個序列的連接處。這一方法允許計算寡核苷酸序列的正確濃度,這樣,序列的最終嵌合群體富集了選定數(shù)目的遺傳交換事件。這也提供了對選擇具有預(yù)定數(shù)目的遺傳交換事件的嵌合突變體的更多控制。0302此外,這些方法與其它系統(tǒng)相比,提供了一種用于探究大數(shù)量的可能蛋白變體空間的方便手段。通過應(yīng)用在這里描述的方法,嵌合分子的群體可以富集那些含有特定數(shù)目的遺傳交換事件的變體。因此,盡管在反應(yīng)中可以仍然產(chǎn)生1013個嵌合分子,但是所選擇的用于進一步分析的每一個分子很可能具有,例如,僅僅三個遺傳學(xué)交換事件。因為得到的子代群體可以傾向于具有預(yù)定數(shù)目的遺傳交換事件,所以造成嵌合分子之間的功能多樣性的界限減少。當(dāng)計算出在最初的親本多核苷酸中的哪一個可能影響到特定的性質(zhì)時,便提供了更加可控制的變量。0303一方面,該方法通過產(chǎn)生對應(yīng)于每一個親本序列的片段或者部分的寡核苷酸,產(chǎn)生嵌合子代多核苷酸序列。每一個寡核苷酸優(yōu)選地包括重疊的獨特區(qū)域,這樣把所述寡核苷酸混合一起,得到具有以正確順序裝配的每一寡核苷酸片段的新的變體。也可參見USSN09/332,835。0304對應(yīng)于每一個親本變體產(chǎn)生的寡核苷酸數(shù)目與在最終產(chǎn)生的嵌合分子中得到的交換的總的數(shù)目具有一定的關(guān)系。例如,為了發(fā)現(xiàn)如在高溫下具有更高活性的嵌合變體,可以提供三個親本核苷酸序列變體來進行連接反應(yīng)。作為一個例子,對應(yīng)于每一個親本變體的每一部分可以產(chǎn)生一組50個寡核苷酸序列。相應(yīng)地,在連接再裝配過程中,在每一個嵌合序列中就有可能有多達50個交換事件。產(chǎn)生的每一個嵌合多核苷酸都以交替的順序含有來自各個親本變體的寡核苷酸的可能性很低。如果每一個寡核苷酸片段以同樣的摩爾量存在于連接反應(yīng)中,有可能在一些位置上來自同一親本多核苷酸的寡核苷酸將與相鄰的彼此連接,而不導(dǎo)致遺傳交換事件。如果在這一例子的任何連接歩驟中,來自每一個親本的每一種寡核苷酸的濃度都保持不變,那么將會有三分之一的機會(假定3個親本)來自同一個親本變體的寡核苷酸將連接于嵌合序列內(nèi)而不產(chǎn)生交換。0305因此,可以確定概率密度函數(shù)(PDF),預(yù)測在一個連接反應(yīng)的每一步中可能發(fā)生的遺傳交換事件的總數(shù),其中給出了一套許多的親本變體、對應(yīng)于每種變體的許多寡核苷酸、以及在連接反應(yīng)的每個步驟中的每種變體的濃度。在確定PDF中應(yīng)用到的統(tǒng)計學(xué)和數(shù)學(xué)在下面被描述??梢杂嬎氵@樣的概率密度函數(shù),而且這樣就富集了來源于特定連接反應(yīng)的具有預(yù)定數(shù)目的遺傳交換事件的嵌合子代群體。此外,可以預(yù)先確定遺傳交換事件的目標(biāo)數(shù)目,然后對該系統(tǒng)進行程序化,以計算在該連接反應(yīng)的每一個步驟中,每種親本寡核苷酸的起始量,從而得到以遺傳交換事件的預(yù)先確定的數(shù)目為中心的概率密度函數(shù)。緣敘襲事伴0306本發(fā)明的多個實施方式包括系統(tǒng)和軟件,它們接收所需的遺傳交換的概率密度函數(shù)(PDF)、待再裝配的親本基因的數(shù)目以及在再裝配中的片段數(shù)目作為輸入值。該程序輸出是"片段PDF",它可以用于確定用于產(chǎn)生重新裝配的基因和那些基因的估計的遺傳交換PDF的方案。在此描述的過程優(yōu)選地在MATLAB(TheMathworks,Natick,Massachusetts)中進行,MATLAB是一種用于技術(shù)計算的程序語言和開發(fā)環(huán)境。0307在實踐本發(fā)明時,這些過程可以迭代反復(fù)。例如,對產(chǎn)生改變的磷脂酶表型的核酸(或者,所述核酸)進行鑒定,重新分離,再修飾,再檢測活性。此過程可以反復(fù)重復(fù),直到得到所需的表型。例如,整個生物化學(xué)的合成代謝或者分解代謝途徑可以被工程化到細(xì)胞中,包括磷脂酶活性。0308類似地,如果確定了某特定寡核苷酸對于所期望的特性(例如新的磷脂酶表型)根本不會造成影響,則可以通過合成包括待除去的序列的更大的親本寡核苷酸,從而將這段序列作為變量除去。由于將這一序列合并到更大的序列中避免了任何遺傳交換事件,所以在子代多核苷酸中,這一序列不再有任何變異。確定哪些寡核苷酸與所需的性質(zhì)最有關(guān)系,以及哪些與所需的性質(zhì)無關(guān)的重復(fù)實踐可以更有效地探尋所有可能的可能提供特定性質(zhì)或者活性的蛋白變體。沐力改邀0309分子的體內(nèi)改組在本發(fā)明的方法中使用,提供本發(fā)明的多肽的變體,例如抗體、磷脂酶以及類似物。體內(nèi)改組可以利用重組多聚體的細(xì)胞的天然特性進行。盡管體內(nèi)重組已經(jīng)提供了分子多樣性的主要天然途徑,但遺傳重組仍然是一種相對復(fù)雜的過程,該過程涉及1)同源性識別;2)鏈切割,鏈侵入,和導(dǎo)致產(chǎn)生重組交叉(recombinationchiasma)的代謝步驟;和最后3)交叉消除,得到分離的重組分子。交叉的形成需要同源序列的識別。0310一方面,本發(fā)明提供由至少第一個多核苷酸和第二個多核苷酸產(chǎn)生雜合多核苷酸的方法。本發(fā)明可以用于通過將共有部分序列同源性的至少一個區(qū)域的至少第一多核苷酸和第二多核苷酸引入到合適的宿主細(xì)胞中而產(chǎn)生雜合多核苷酸。該部分序列同源性的區(qū)域促進導(dǎo)致產(chǎn)生雜合多核苷酸的序列識別的過程。如本文所用,術(shù)語"雜合多核苷酸"是由本發(fā)明的方法產(chǎn)生的任何核苷酸序列,含有從至少兩個最初多核苷酸序列得到的序列。這樣的雜合多核苷酸可以由促進DNA分子間的序列整合的分子間重組事件產(chǎn)生。另外,這樣的雜合多核苷酸可以由利用重復(fù)序列以改變DNA分子中的核苷酸序列的分子內(nèi)還原性重配過程產(chǎn)生。0311本發(fā)明也提供使用本發(fā)明的核酸和多肽產(chǎn)生本發(fā)明的核酸和磷脂酶序列的序列變體,或者分離磷脂酶,例如,磷脂酶的序列變體的方法。一方面,本發(fā)明提供本發(fā)明的磷脂酶基因的變體,該變體可以使用任何方法改變,包括,例如隨意或隨機方法,或者非隨機方法,或者"定向進化"方法,如以上描述。0312被分離的變體可以是天然發(fā)生的。變體也可以在體外產(chǎn)生。變體也可以應(yīng)用基因工程技術(shù)來產(chǎn)生,如定點誘變、隨機的化學(xué)誘變、核酸外切酶III缺失方法和標(biāo)準(zhǔn)的克隆技術(shù)。可選擇地,可以應(yīng)用化學(xué)合成或者修飾方法來產(chǎn)生這樣的變體、片段、類似物或者衍生物。本領(lǐng)域技術(shù)人員也熟悉制備變體的其它方法。這些方法包括這樣的程序,其中,從天然分離物中獲得的核酸序列經(jīng)過修飾而產(chǎn)生編碼具有某些特征的多肽的核酸,所述的特征增加這些多肽在工業(yè)或?qū)嶒炇覒?yīng)用中的價值。在這樣的程序中,大量的變體序列被獲得和表征,這些變體序列與從天然分離物中得到的序列相比,有一個或者多個核苷酸的差異。這些核苷酸的差異可能引起相對于天然分離物的核酸編碼的多肽的氨基酸變化。0313例如,變體可以通過使用易錯PCR產(chǎn)生。在易錯PCR中,PCR在DNA聚合酶的復(fù)制保真性較低的情況下進行,這樣便在全長的PCR產(chǎn)物中得到較高的點突變率。易錯PCR在例如,Leung,D.W.等,Technique,1:11~15,1989和Caldwell,R.C.和JoyceG.R,PCRMethodsApplic.,2:28-33,1992中描述。簡要地說,在這樣的程序中,待誘變的核酸與PCR引物、反應(yīng)緩沖液、MgCl2、MnCl2、Taq聚合酶以及適當(dāng)濃度的dNTP混合,從而在全長的PCR產(chǎn)物中得到高的點突變率。例如,反應(yīng)可以使用20fmo1待誘變的核酸進行,每種PCR引物30pmo1,反應(yīng)緩沖液包含50mMKC1、10mMTrisHC1(pH8.3)和0.0r^明膠、7mMMgCl2、0.5mMMnCl2、5單位的Taq聚合酶、0.2mMdGTP、0.2mMdATP、lmMdCTP禾卩l(xiāng)mMdTTP。PCR可以進行30個循環(huán),每個循環(huán)為94°C1分鐘;45°Cl分鐘;和72'Cl分鐘。然而,應(yīng)該意識到,這些參數(shù)可以適當(dāng)?shù)刈兓UT變的核酸被克隆到一個適當(dāng)?shù)妮d體,并評價由誘變核酸編碼的多肽的活性。0314變體也可以用寡核苷酸誘導(dǎo)的定向突變產(chǎn)生,在任何感興趣的克隆DNA中產(chǎn)生位點特異性的突變。寡核苷酸誘變在,例如,Reidhaar-Olson(1988)Science241:53-57中描述。簡要地說,在這樣的程序中,合成多個具有將要被導(dǎo)入被克隆的DNA中的一個或多個突變的雙鏈寡核苷酸,將這些寡核苷酸插入到待誘變的克隆DNA中?;厥蘸姓T變DNA的克隆,并評估它們編碼的多肽的活性。0315另一種產(chǎn)生變體的方法是裝配PCR。裝配PCR涉及由小DNA片段的混合物來裝配PCR產(chǎn)物。大量不同的PCR反應(yīng)在相同的容器中平行地發(fā)生,一個反應(yīng)的產(chǎn)物引發(fā)另一個反應(yīng)的產(chǎn)物。裝配PCR已經(jīng)被描述,例如在美國專利5,965,408中。0316還有另一種產(chǎn)生變體的方法是有性PCR誘變。在有性PCR誘變中,由于基于序列同源性的DNA分子隨機片段化,在不同的但是高度相關(guān)的DNA序列的DNA分子之間,在體外強行發(fā)生同源重組,然后通過PCR反應(yīng)的引物延伸,交換得到固定。有性PCR誘變在,例如,Stemmer(1994)Proc.Natl.Asad.Sci.USA91:10747-10751中描述。簡要地說,在這樣的程序中,多個待重組的核酸用DNase消化,產(chǎn)生具有50到200個核苷酸的平均大小的片段。純化具有所需的平均大小的片段,并重懸于PCR混合物中。在有利于核酸片段之間發(fā)生重組的條件下進行PCR反應(yīng)。例如,PCR可以這樣進行將純化的片段以10-30ng/nl的濃度重懸于含有0.2mM的各種dNTP、2.2mMMgCl2、50mMKCl、10mM的Tris-HCl,pH9.0以及0.1%的TritonX-100的溶液中。以100:1的比例在反應(yīng)混合物中加入2.5單位的Taq聚合酶,用以下的條件進行PCR:94'C60秒,94。C30秒,50陽55。C30秒,72°C30秒(30-45次),然后72"C進行5分鐘。然而,可以意識到,這些參數(shù)可以進行適當(dāng)?shù)淖兓?。在一些方面,寡核苷酸可以被包括在該PCR反應(yīng)中。在其它方面,DNA聚合酶I的Kleriow片段可以用于第一組PCR反應(yīng),而Taq聚合酶可以用于后續(xù)組的PCR反應(yīng)。重組序列被分離,并評估它們編碼的多肽的活性。0317變體也可以通過體內(nèi)誘變產(chǎn)生。在一些實施方式中,感興趣的序列中的隨機突變通過在細(xì)菌菌株中擴增該感興趣的序列而產(chǎn)生,所述細(xì)菌菌株例如在一個或者多個DNA修復(fù)途徑中具有突變的大腸桿菌菌株。這樣的"突變"菌株具有比野生型親本更高的隨機突變率。在一種這樣的菌株中進行DNA的繁殖將最終產(chǎn)生DNA中的隨機突變。適于在體內(nèi)誘變中應(yīng)用的突變菌株在,例如,PCT發(fā)明者E·奧多諾谷,N·R·巴爾頓申請人:維萊尼姆公司