專利名稱:甲基營養(yǎng)型酵母中蛋白質糖基化修飾的制作方法
技術領域:
本發(fā)明涉及用于生產(chǎn)具有哺乳動物樣糖基化的糖蛋白的方法和基因工程化甲基營養(yǎng)型酵母菌株。本發(fā)明還涉及用于產(chǎn)生能生產(chǎn)具有哺乳動物樣糖基化的糖蛋白的甲基營養(yǎng)型酵母菌株的載體。本發(fā)明還提供由所述基因工程化甲基營養(yǎng)型酵母菌株生產(chǎn)的糖蛋白。
背景技術:
包括巴斯德畢赤酵母在內(nèi)的甲基營養(yǎng)型酵母已被廣泛用于生產(chǎn)商業(yè)上或醫(yī)療上重要的重組蛋白質。然而,這些酵母和靶生物例如哺乳動物或人類對象之間在與蛋白質連接的碳水化合物的生物合成方面的差異可以阻礙一些治療性糖蛋白的生產(chǎn)和醫(yī)療上的應用。
蛋白質N-糖基化起始于內(nèi)質網(wǎng)(ER),在此將組裝在多萜醇(脂質載體中間體)上的N-連接寡糖(Glc3Man9GlcNAc2)轉移到新生蛋白質的適當Asn上。這是所有真核N-連接糖蛋白共有的事件。通過內(nèi)質網(wǎng)中特異性葡萄糖苷酶和α-1,2-甘露糖苷酶去除三個葡萄糖殘基和一個特異性α-1,2-連接的甘露糖殘基,產(chǎn)生核心寡糖結構Man8GlcNAc2。將具有這種核心糖結構的蛋白質運輸?shù)綄μ墙Y構進行各種修飾的高爾基體內(nèi)。在酵母和高等真核生物之間高爾基體內(nèi)糖鏈修飾存在顯著差異。
哺乳動物細胞內(nèi),根據(jù)所添加到的蛋白質結構通過3種不同途徑進行糖鏈修飾。也就是說,(1)核心糖鏈不改變;(2)通過將來自UDP-N-乙酰葡糖胺(UDP-GlcNAc)的N-乙酰葡糖胺-1-磷酸基團(GlcNAc-1-P)加到核心糖鏈中甘露糖的6-位,隨后去除GlcNAc基團以在糖蛋白中形成酸性糖鏈,從而改變核心糖鏈或(3)通過甘露糖苷酶l去除3個甘露糖殘基從而首先將核心糖鏈轉變成Man5GlcNAc2;通過添加GlcNAc并再去除兩個甘露糖殘基進一步修飾Man5GlcNAc2,隨后順序添加GlcNAc、半乳糖(Gal)和N-乙酰神經(jīng)胺酸(也稱為唾液酸(NeuNAc))以形成各種雜合或復合的糖鏈(R.Kornfeld and S.Kornfeld,Ann.Rev.Biochem.54631-664,1985;Chibaet al J.Biol.Chem.27326298-26304,1998)。
酵母中,Man8GlcNAc2多糖不被修整。高爾基體中糖鏈的修飾包括一系列通過不同的甘露糖基轉移酶添加甘露糖殘基(“外鏈”糖基化)。外鏈糖基化的結構是生物特異性的,典型地在釀酒酵母中具有超過50個甘露糖殘基,在巴斯德畢赤酵母中更通常具有小于Man14GlcNAc2的結構。這種酵母特異性高甘露糖型外鏈糖基化也表示為超糖基化或超甘露糖基化。
糖基化對蛋白質的正確折疊、穩(wěn)定性和生物活性至關重要。在人體內(nèi),糖基化是蛋白質的藥物動力學特性的部分原因,例如組織分布和從血流中清除。另外,多糖結構可以參與抗原應答。例如,糖蛋白上存在α-半乳糖是抗來自豬的異種移植物的免疫反應的主要原因(Chen et al.,Curr Opin Chem Biol,3(6)650-658,1999),而抗酵母糖蛋白的免疫反應主要由于下列物質的存在α-1,3-甘露糖、β-連接甘露糖和/或磷酸單酯或磷酸二酯鍵中的磷酸殘基(Ballou,C.E.,Methods Enzymol,185440-470,1990;Yip et al.,Proc Natl Acad Sci USA,91(7)2723-2727,1994)。
超糖基化通常是不期望的,因為它導致重組蛋白質產(chǎn)物在碳水化合物組成和分子量上的不均勻性,這使蛋白質純化復雜化。碳水化合物部分的增加導致超糖基化的酶的比活性(單位/重量)降低。另外,外鏈糖基化通常具有強免疫原性,這在治療性應用中是不期望的。而且,大的外鏈糖可以掩蓋治療性蛋白質的免疫決定簇。例如,在巴斯德畢赤酵母中表達的流感神經(jīng)氨酸酶(NA)被含高達30-40個甘露糖殘基的N-多糖糖基化。由于位于NA分子頂部的可變且免疫優(yōu)勢的表面環(huán)被N-多糖掩蓋,超糖基化的NA在小鼠中的免疫原性降低(Martinet et al.Eur J.Biochem.247332-338,1997)。
所以,期望得到生產(chǎn)這種重組糖蛋白的基因工程化甲基營養(yǎng)型酵母株,所述重組糖蛋白具有類似哺乳動物(例如人類)的碳水化合物結構的碳水化合物結構。
發(fā)明內(nèi)容
本發(fā)明涉及用于生產(chǎn)具有哺乳動物樣N-多糖的糖蛋白的基因工程化甲基營養(yǎng)型酵母菌株和方法。本發(fā)明還涉及用于產(chǎn)生能生產(chǎn)具有哺乳動物樣N-多糖的糖蛋白的甲基營養(yǎng)型酵母菌株的載體和試劑盒。
在此使用的術語“甲基營養(yǎng)型酵母”包括但不限于能夠在甲醇上生長的酵母株,例如念珠菌屬、漢遜酵母屬、球擬酵母屬或畢赤酵母屬的酵母。
在一個實施方案中,本發(fā)明提供生產(chǎn)具有哺乳動物樣N-多糖結構的糖蛋白的甲基營養(yǎng)型酵母菌株,其特征在于具有五個或更少甘露糖殘基和至少一個N-乙酰葡糖胺殘基(GlcNAc),所述N-乙酰葡糖胺殘基與含甘露糖的核心結構和末端半乳糖殘基連接。
在一個優(yōu)選的實施方案中,本發(fā)明提供生產(chǎn)具有哺乳動物樣N-多糖結構GalGlcNAcMan5GlcNAc2的糖蛋白的基因工程化甲基營養(yǎng)型酵母株。
根據(jù)本發(fā)明,將生產(chǎn)具有GalGlcNAcMan5GlcNAc2的糖蛋白的甲基營養(yǎng)型酵母菌株基因工程化以表達α-1,2-甘露糖苷酶或其功能部分;N-乙酰葡糖胺基轉移酶I(或GnTI)或其功能部分;和β-1,4-半乳糖基轉移酶(GalT)或其功能部分。優(yōu)選地,所述甲基營養(yǎng)型酵母菌株還被基因工程化使得基因組OCH1基因滅活。
用于在基因工程化甲基營養(yǎng)型酵母菌株中表達的α-1,2-甘露糖苷酶或其功能部分可以來源于任何物種,包括哺乳動物物種如小鼠、兔或人,和真菌物種例如曲霉或瑞氏木霉(Trichoderma reesei)。用于本發(fā)明的優(yōu)選的α-1,2-甘露糖苷酶是瑞氏木霉α-1,2-甘露糖苷酶。優(yōu)選地,α-1,2-甘露糖苷酶或其功能部分靶向分泌途徑中可獲得其底物Man8GlcNAc2的位點。更優(yōu)選地,將α-1,2-甘露糖苷酶或其功能部分基因工程化以包含ER駐留信號并靶向ER。優(yōu)選的ER駐留信號是肽HDEL(SEQ ID NO1)。
用于在基因工程化甲基營養(yǎng)型酵母菌株中表達的GnTI或其功能部分可以來源于任何物種,包括兔、大鼠、人、植物、昆蟲、線蟲和原生動物如利什曼原蟲(Leishmaniatarentolae)。優(yōu)選的用于本發(fā)明的GnTI是如SEQ ID NO13列出的人GnTI。優(yōu)選地,GnTI或其功能部分靶向分泌途徑中可獲得其底物Man5GlcNAc2的位點。更優(yōu)選地,將GnTI或其功能部分基因工程化以包含高爾基體駐留信號并靶向高爾基體。優(yōu)選的高爾基體駐留信號是如SEQ ID NO11列出的肽,由釀酒酵母Kre2蛋白的前100個氨基酸組成。
用于在基因工程化甲基營養(yǎng)型酵母菌株中表達的GalT或其功能部分可以來源于任何物種,包括人、植物(例如擬南芥)、昆蟲(例如黑腹果蠅)。優(yōu)選的用于本發(fā)明的GalT是如SEQ ID NO21列出的人GalT。優(yōu)選地,將GalT或其功能部分基因工程化以包含高爾基體駐留信號并靶向高爾基體。優(yōu)選的高爾基體駐留信號是如SEQ ID NO11列出的肽,由釀酒酵母Kre2蛋白的前100個氨基酸組成。
通過將編碼這些酶的核苷酸序列例如由轉化方式導入菌株,可以將甲基營養(yǎng)型酵母菌株基因工程化以表達上述期望的酶。優(yōu)選地,在載體中提供編碼序列,每個序列與在所述酵母菌株中有功能的啟動子序列和3′終止序列可操作的連接。隨后將所述載體或其線性片段導入菌株。
根據(jù)本發(fā)明的一個優(yōu)選實施方案,還將甲基營養(yǎng)型酵母菌株基因工程化使得基因組OCH1基因被破壞?;蚱茐目梢酝ㄟ^基因組OCH1序列和敲出載體中的OCH1序列之間的同源重組實現(xiàn)。
進一步的方面中,本發(fā)明提供用于產(chǎn)生生產(chǎn)具有哺乳動物樣N-多糖結構的糖蛋白的甲基營養(yǎng)型酵母菌株的載體。
在一個實施方案中,本發(fā)明提供包含編碼待表達酶的核苷酸序列的“敲入”載體,所述待表達酶即是α-1,2-甘露糖苷酶、GnTI、GalT或這些蛋白質的任一個的功能部分。編碼序列可以與在表達所編碼蛋白質的宿主甲基營養(yǎng)型酵母中有功能的啟動子和3′終止序列可操作的連接。可以將兩個或更多編碼序列置于同一載體中以同時轉化入甲基營養(yǎng)型酵母菌株內(nèi)。優(yōu)選地,所述載體還包含便于轉化子選擇的選擇標志基因。敲入載體可以是整合性載體或復制性載體。
另一個實施方案中,本發(fā)明提供滅活載體(或“敲出”載體),其在導入甲基營養(yǎng)型酵母菌株時,滅活或破壞基因組OCH1基因。
OCH1敲出載體可以包含選擇標志基因,在其5′和3′端與足以介導與基因組OCH1基因發(fā)生雙同源重組的長度的OCH1序列可操作的連接。作為替代方案,OCH1滅活載體可以包含選擇標志基因和待破壞的OCH1基因的一部分,該部分不編碼OCH1蛋白質或編碼OCH1蛋白質的無活性片段。OCH1部分不與任何已知啟動子序列可操作的連接,并可在轉化載體的線性片段時通過單同源重組整合入基因組OCH1基因座。優(yōu)選地,還往載體的OCH1序列中引入一個或多個滅活突變,例如終止密碼子或移碼突變,以阻止產(chǎn)生任何潛在活性的OCH1多肽。
另一個方面中,本發(fā)明提供生產(chǎn)具有哺乳動物樣N-多糖結構的糖蛋白的方法??梢詫⒕幋a感興趣的糖蛋白的核苷酸序列導入已被工程化生產(chǎn)哺乳動物樣N-多糖的甲基營養(yǎng)型酵母菌株。作為替代方案,可以修飾表達感興趣的糖蛋白的甲基營養(yǎng)型酵母菌株以表達期望的酶(即α-1,2-甘露糖苷酶、GnTI和GalT)并滅活基因組OCH1基因,從而生產(chǎn)具有哺乳動物樣N-多糖的糖蛋白。
另一個方面中,本發(fā)明提供通過使用本發(fā)明的方法生產(chǎn)的糖蛋白,即具有哺乳動物樣N-多糖的糖蛋白,尤其是具有GalGlcNAcMan5GlcNAc2N-多糖的糖蛋白。
在進一步的方面中,本發(fā)明提供含有一個或多個本發(fā)明載體、或一個或多個本發(fā)明的基因工程化菌株的試劑盒。
圖1描述M8GlcNAc2、M5GlcNAc2、GlcNAcM5GlcNAc2和GalGlcNAcM5GlcNAc2的結構。
圖2用圖描述酵母和人類N-連接糖基化和使巴斯德畢赤酵母糖基化人源化的策略。糖-工程化步驟包括滅活α-1,6-甘露糖基轉移酶OCH1、過表達HDEL標記的α-1,2-甘露糖苷酶和定位高爾基體的GnTI和GalT。最后部分獲得的雜合結構被框起來。
圖3A用圖描述通過單同源重組滅活基因組OCH1基因的策略。
圖3B用圖描述用于糖工程化巴斯德畢赤酵母的質粒pGlycoSwitchM5。經(jīng)使用Bst BI線性化pGlycoSwitchM5,接著轉化并正確整合到巴斯德畢赤酵母的基因組中,從而滅活OCH1基因。
圖3C用圖描述pPIC6AKrecoGnTI。
圖3D用圖描述pBlKanMX4KrehGalT。
圖4用圖描述來自不同的糖工程化巴斯德畢赤酵母菌株的N-多糖的DSA-FACE分析。板塊1寡麥芽糖參照。板塊2-9表示來自下列菌株的N-多糖——2野生型菌株GS115,具有Man9GlcNAc2代表的主峰;3ochl滅活菌株,具有Man8GlcNAc2代表的主峰;4ochl滅活的ManHDEL表達菌株,具有Man5GlcNAc2代表的主峰;5ochl滅活的ManHDEL、KreGnTI表達菌株,具有GlcNAcMan5GlcNAc2代表的主峰;6與5相同,除了多糖用β-N-乙?;禾前访柑幚聿⑶褿lcNAcMan5GlcNAc2移至Man5GlcNAc2的位置,指示末端GlcNAc存在;7ochl滅活的ManHDEL、KreGnTI、KreGalT表達菌株,具有代表GalGlcNAcMan5GlcNAc2的另外峰,其在用β-半乳糖苷酶處理時消失;9來自牛RnaseB的參照多糖(Man5-9GlcNAc2)。
圖5A-5B表明滅活巴斯德畢赤酵母OCH1之后的糖基化。5A分泌瑞氏木霉甘露糖苷酶的巴斯德畢赤酵母菌株上清液的SDS-PAGE凝膠用CBB染色。未工程化菌株(WT)中可見清楚的彌散條帶而在och1滅活菌株(ochl(M8))中沒有這個彌散條帶。5BN-多糖的FACE分析,所述N-多糖來源于未工程化菌株(WT)和ochl菌株分泌的甘露糖苷酶。具有較高電泳遷移率的條帶標為Man8和Man9,表示“核心”N-多糖結構。
具體實施例方式
本發(fā)明涉及制造具有哺乳動物樣或人樣的糖基化的重組糖蛋白的方法、載體和基因工程甲基營養(yǎng)型酵母菌株。
“哺乳動物”意思包括哺乳動物的任何物種,例如人、小鼠、貓、狗、兔、牛、綿羊、馬等。
典型復合型哺乳動物多糖,例如人產(chǎn)生的多糖,含二至六個具有與Man3GlcNAc2的內(nèi)核心結構連接的唾液酰-N-乙酰-乳糖胺序列的外分支。哺乳動物N-多糖起源于在ER中形成的核心寡糖結構Man8GlcNAc2。含該核心糖結構的蛋白質被轉運到高爾基體,作為由高爾基甘露糖苷酶I(高爾基α-1,2-甘露糖苷酶)去除3個甘露糖殘基的結果,Man8GlcNAc2被轉化成Man5GlcNAc2。當?shù)鞍踪|通過高爾基體時,Man5GlcNAc2通過添加GlcNAc和去除另兩個甘露糖殘基并且隨后添加GlcNAc、半乳糖(Gal)和唾液酸(SA)殘基而被進一步修飾。
在此使用的術語“哺乳動物樣糖基化”意思是,基因工程甲基營養(yǎng)型酵母菌株產(chǎn)生的糖蛋白的N-多糖包括五個或更少甘露糖殘基,并且具有哺乳動物細胞例如人類細胞中產(chǎn)生的蛋白質的N-多糖生物合成中N-多糖或碳水化合物中間結構的特征。
在一個優(yōu)選實施方案中,本發(fā)明的基因工程化甲基營養(yǎng)型酵母菌株生產(chǎn)的糖蛋白包含五個或更少甘露糖殘基和至少一個N-乙酰葡糖胺殘基(GlcNAc),所述N-乙酰葡糖胺殘基與含甘露糖殘基的核心結構和末端半乳糖殘基連接。例如基因工程化甲基營養(yǎng)型酵母菌株生產(chǎn)的糖蛋白含如圖1用圖描述的GalGlcNAcMan5GlcNAc2。該碳水化合物(GalGlcNAcMan5GlcNAc2)的IUPAC命名是Gal(β-1,4)GlcNAc(β-1,2)Man(α-1,3){Man(α-1,3)[Man(α-1,6)]Man(α-1,6)}Man(β-1,4)GlcNAc(β-1,4)GlcNAc。它的擴展命名是β-D-Galp-(1→4)-β-D-GlcpNAc-(1→2)-α-D-Manp-(1→3)-{α-D-Manp-(1→3)-[α-D-Manp-(1→6)]-α-D-Manp-(1→6)}-β-D-Manp-(1→4)-β-D-GlcpNAc-(1→4)-D-GlcpNAc。
已經(jīng)確定的是,離開甲基營養(yǎng)型酵母內(nèi)質網(wǎng)(ER)的糖蛋白上的大部分N-多糖具有Man8GlcNAc2寡糖結構,所述甲基營養(yǎng)型酵母包括畢赤酵母,尤其是巴斯德畢赤酵母。糖蛋白從ER轉運到高爾基體之后,通過不同的甘露糖基轉移酶將額外的甘露糖殘基添加到這種核心糖結構上,得到具有由高級甘露糖核心或延伸的支化甘露聚糖外鏈組成的寡糖結構的糖蛋白。
根據(jù)本發(fā)明,為了生產(chǎn)具有哺乳動物樣糖基化的重組糖蛋白,修飾甲基營養(yǎng)型酵母以表達經(jīng)過一系列步驟將碳水化合物結構Man8GlcNAc2轉化成哺乳動物樣N-多糖的酶。優(yōu)選地,也修飾甲基營養(yǎng)型酵母以滅活參與生成高度甘露糖結構的一個或多個酶的表達,例如由OCH1基因編碼的α-1,6-甘露糖基轉移酶。
在此使用的術語“甲基營養(yǎng)型酵母”包括但不限于能夠在甲醇中生長的酵母菌株,例如念珠菌屬、漢遜酵母屬、球擬酵母屬或畢赤酵母屬的酵母。本發(fā)明的優(yōu)選的甲基營養(yǎng)型酵母是畢赤酵母屬菌株。尤其優(yōu)選的是巴斯德畢赤酵母菌株GS115(NRRLY-15851)、GS190(NRRL Y-18014)、PPF1(NRRL Y-18017)、PPY120H、YGC4和由此衍生的菌株。
在一個實施方案中,本發(fā)明提供生產(chǎn)具有哺乳動物樣N-多糖結構的糖蛋白的基因工程化甲基營養(yǎng)型酵母,所述N-多糖的特征在于具有五個或更少甘露糖殘基和至少一個N-乙酰葡糖胺殘基(GlcNAc),所述N-乙酰葡糖胺殘基與含甘露糖殘基的核心結構和末端半乳糖殘基連接。
在一個優(yōu)選實施方案中,本發(fā)明提供生產(chǎn)具有哺乳動物樣N-多糖結構GalGlcNAcMan5GlcNAc2的糖蛋白的基因工程化甲基營養(yǎng)型酵母。
根據(jù)本發(fā)明,將生產(chǎn)具有GalGlcNAcMan5GlcNAc2的糖蛋白的甲基營養(yǎng)型酵母基因工程化以表達α-1,2-甘露糖苷酶或其功能部分、N-乙酰葡糖胺基轉移酶I(或GnTI)或其功能部分和β-1,4-半乳糖基轉移酶(GalT)或其功能部分。優(yōu)選地,甲基營養(yǎng)型酵母還被基因工程化以便滅活基因組OCH1基因。
α-1,2-甘露糖苷酶在Man8GlcNAc2的非還原端切割α-1,2-連接的甘露糖殘基,并將糖蛋白上的該核心寡糖轉化為Man5GlcNAc2,其是哺乳動物樣N-乙酰葡糖胺基轉移酶I的接受底物。
根據(jù)本發(fā)明,可以將甲基營養(yǎng)型酵母菌株工程化以表達α-1,2-甘露糖苷酶或其功能部分,這是通過將編碼α-1,2-甘露糖苷酶或其功能部分的核苷酸序列例如通過轉化導入菌株實現(xiàn)的。編碼α-1,2-甘露糖苷酶或其功能部分的核苷酸序列可以來源于任何物種。許多α-1,2-甘露糖苷酶已經(jīng)被克隆并可以被本領域的技術人員所用,包括編碼例如小鼠α-1,2-甘露糖苷酶(Herscovics et al.J.Biol.Chem.2699864-9871,1994)、兔α-1,2-甘露糖苷酶(Lal et al.J.Biol.Chem.2699872-9881,1994)或α-1,2-甘露糖苷酶(Tremblay et al.Glycobiology 8585-595,1998)的哺乳動物基因,還有編碼例如曲霉α-1,2-甘露糖苷酶(msdS基因)或瑞氏木霉α-1,2-甘露糖苷酶(Maras et al.J.Biotechnol.77255-263,2000)的真菌基因。蛋白質序列分析已經(jīng)顯示至今鑒定的真核生物的α-1,2-甘露糖苷酶高度保守。
優(yōu)選地,用于本發(fā)明載體的核苷酸序列編碼真菌α-1,2-甘露糖苷酶,更優(yōu)選地,編碼瑞氏木霉α-1,2-甘露糖苷酶,更具體地,編碼Maras et al.J.Biotechnol.77255-63(2000)所述的瑞氏木霉α-1,2-甘露糖苷酶。
“功能部分”意思是指基本上保留全長蛋白質酶活性的α-1,2-甘露糖苷酶的多肽片段?!盎旧稀币馑际侵副A羧Lα-1,2-甘露糖苷酶的至少約40%、或優(yōu)選地至少50%或更多酶活性。文獻描述了許多α-1,2-甘露糖苷酶的各種結構域的特征,包括催化結構域的特征。例如見,“Isolation of a mouse Golgi mannosidase cDNA,a memberof a gene family conserved from yeast to mammals”,Herscovics et al.,J Biol Chem26913 9864-71(1994);“Isolation and expression of murine and rabbit cDNAsencoding an alpha 1,2-mannosidase involved in the processing of asparagine-linkedoligosaccharides”,Lal et al.,J Biol Chem 269139872-81(1994);“Molecular cloningand enzymatic characterization of a Trichoderma reesei 1,2-alpha-D-mannosidase”,Maras M et al.,J Biotechnol 77255-63(2000)和美國專利申請20020188109,通過引用并入本文。組合使用本領域已知技術,那些本領域的技術人員可以輕易地鑒定和制造α-1,2-甘露糖苷酶的功能部分。感興趣的α-1,2-甘露糖苷酶的一部分的活性,可以使用美國專利申請20020188109中描述的體外或體內(nèi)測試法驗證,通過引用并入本文。
依照本發(fā)明,將甲基營養(yǎng)型酵母中表達的α-1,2-甘露糖苷酶或其功能部分優(yōu)選地靶向分泌途徑的位點,分泌途徑中Man8GlcNAc2(α-1,2-甘露糖苷酶的底物)已經(jīng)在糖蛋白上形成,但是還沒有到達用另外的甘露糖殘基延長糖鏈的高爾基糖基轉移酶。本發(fā)明的優(yōu)選的實施方案中,將α-1,2-甘露糖苷酶或其功能部分工程化以包含ER駐留信號,使得在甲基營養(yǎng)型酵母菌株中表達的α-1,2-甘露糖苷酶或其功能部分靶向ER。
“ER駐留信號”表示指導包含這種肽序列的蛋白質轉運并保留在ER內(nèi)的肽序列。這種ER駐留序列經(jīng)常在ER中存在并發(fā)揮功能的蛋白質中發(fā)現(xiàn)。ER駐留信號的多重選擇對那些本領域的技術人員是可用的,例如釀酒酵母ER蛋白質MNS1的前21個氨基酸殘基(Martinet et al.Biotechnology Letters 201171-1177,1998),和肽HDEL(SEQ ID NO1)。
本發(fā)明使用的優(yōu)選的ER駐留信號是肽HDEL(SEQ ID NO1)。在許多酵母蛋白質的C-末端發(fā)現(xiàn)的HDEL肽序列作為ER的駐留/返回信號起作用(PelhamEMBO J.7913-918,1988)。具有HDEL序列的蛋白質被膜結合受體(Erd2p)結合并隨后進入由高爾基體返回ER的逆向轉運途徑。
可以將本發(fā)明使用的α-1,2-甘露糖苷酶進一步工程化,例如使它包含具有可用抗體的表位標簽,例如本領域公知的Myc、HA、FLAG和His6標簽。帶表位標簽的α-1,2-甘露糖苷酶可以方便的純化或監(jiān)測其表達和細胞內(nèi)定位。
根據(jù)本發(fā)明,通過基因工程,ER駐留信號可以放置在α-1,2-甘露糖苷酶的蛋白質序列內(nèi)任何地方,但是優(yōu)選地在α-1,2-甘露糖苷酶的C-末端。
使用本領域已知的任何分子生物技術,通過將編碼這種信號或標簽的核苷酸序列插入編碼α-1,2-甘露糖苷酶或其功能部分的核苷酸序列,可以將ER駐留信號和表位標簽容易地引入α-1,2-甘露糖苷酶或其功能部分。
工程化甲基營養(yǎng)型酵母菌株中α-1,2-甘露糖苷酶的表達可以例如通過Northern印跡分析在mRNA水平和例如通過Western印跡分析在蛋白質水平進行驗證??梢酝ㄟ^使用多種技術,包括亞細胞分級分離和免疫熒光實驗,分析蛋白質的細胞內(nèi)定位。α-1,2-甘露糖苷酶在ER中的定位可以由該酶和已知ER停留蛋白質(例如蛋白質二硫化物異構酶)的共沉降來確定。ER中的定位也可以由ER駐留蛋白質的免疫熒光染色模式特征來確定,典型地是核周染色模式。
為了證實甲基營養(yǎng)型酵母菌株中表達的α-1,2-甘露糖苷酶或其功能部分具有預期的甘露糖修飾活性,可以使用體外和體內(nèi)測試法。典型地,體外測試法包括使用從甲基營養(yǎng)型酵母菌株表達和純化的酶消化體外合成的底物,例如Man8GlcNAc2,并估計這種酶將Man8GlcNAc2修飾為例如Man5GlcNAc2的能力。在體內(nèi)測試法中,將α-1,2-甘露糖苷酶或其功能部分在甲基營養(yǎng)型酵母中與糖蛋白共表達,已知所述糖蛋白在該酵母中被攜帶末端α-1,2-連接甘露糖殘基的N-多糖糖基化。α-1,2-甘露糖苷酶或其功能部分的酶活性可以基于所述糖蛋白的N-多糖結構中的α-1,2-連接的甘露糖殘基數(shù)的減少來測量。在體外和體內(nèi)測試法中,碳水化合物基團的組成可以使用本領域公知的技術確定并在下面的實施例中舉例說明。
進一步根據(jù)本發(fā)明,通過將編碼GlcNAc-轉移酶I或其功能部分的核苷酸序列例如通過轉化導入菌株,可以將甲基營養(yǎng)型酵母菌株工程化以表達GlcNAc-轉移酶I或其功能部分。GlcNAc-轉移酶I負責向Man5GlcNAc2添加β-1,2-GlcNAc,并將糖蛋白上的這種核心寡糖轉化成GlcNAcMan5GlcNAc2。GlcNAcMan5GlcNAc2的甘露糖殘基可以被哺乳動物高爾基體甘露糖苷酶II進一步修飾,并且可以添加另外的糖單元,例如半乳糖,形成哺乳動物糖蛋白的雜合或復合型糖分支特征。
用于導入甲基營養(yǎng)型酵母菌株的編碼GlcNAc-轉移酶I(GnTI)的核苷酸序列可以來源于任何物種,例如兔、大鼠、人、植物、昆蟲、線蟲和原生動物例如利什曼原蟲。優(yōu)選地,本發(fā)明使用的核苷酸序列編碼人GnTI,更優(yōu)選地編碼SEQ ID NO13中列出的人GnTI。
GnTI的“功能部分”是指基本上保留全長GnTI的酶活性的GnTI的多肽片段?!盎旧稀笔侵副A羧LGnTI的至少約40%、或優(yōu)選至少50%或更多酶活性。GnTI或其一部分的酶活性可以通過Reeves et al.(Proc.Natl.Acad.Sci.USA.99(21)13419-24,2002),Maras et al.(Eur J Biochem.249(3)701-7,1997)或下面的實施例中描述的測試法確定。組合使用本領域已知的技術,那些本領域的技術人員可以輕易地鑒定和制造GnTI的功能部分。例如,如本發(fā)明中舉例說明的,人GnTI的催化結構域(包含后327個殘基)構成人GnTI的“功能部分”。
依據(jù)本發(fā)明,甲基營養(yǎng)型酵母菌株中表達的GnTI或其功能部分優(yōu)選地靶向分泌途徑的位點,分泌途徑中Man5GlcNAc2(GnTI的底物)已經(jīng)在糖蛋白上形成。優(yōu)選地,GnTI或其功能部分靶向高爾基體。
因此,本發(fā)明的優(yōu)選的實施方案中,將GnTI或其功能部分工程化以包含高爾基體定位信號。
在此使用的“高爾基體定位信號”指的是肽序列,其將具有該序列的蛋白質導向甲基營養(yǎng)型酵母菌株的高爾基體并將蛋白質保留在其中。這樣的高爾基體定位序列經(jīng)常在高爾基體內(nèi)存在和起作用的蛋白質內(nèi)發(fā)現(xiàn)。
高爾基體定位信號的選擇對那些本領域的技術人員是可以實現(xiàn)的。本發(fā)明使用的優(yōu)選的高爾基體定位信號是來源于釀酒酵母Kre2蛋白(SeKre2)的N-末端的肽;更優(yōu)選的是SEQ ID NO10中列出的ScKre2蛋白。尤其優(yōu)選的高爾基體定位信號是由SEQ ID NO10列出的ScKre2蛋白中1-100位氨基酸組成的肽(SEQ ID NO11)。
根據(jù)本發(fā)明,可以將高爾基體定位信號置于GnTI中的任何地方,但是優(yōu)選地在GnTI末端,更優(yōu)選地在GnTI的N-末端。
可以將本發(fā)明中使用的GnTI進一步工程化,例如包含具有可用抗體的表位標簽,例如本領域公知的Myc、HA、FLAG和His6標簽。帶表位標簽的GnTI可以方便的純化或監(jiān)測其表達和細胞內(nèi)定位。
使用本領域已知的任何分子生物技術,通過將編碼這種信號或標簽的核苷酸序列插入編碼GnTI的核苷酸序列,可以將ER駐留信號和表位標簽容易地引入GnTI。
進一步根據(jù)本發(fā)明,典型地可以通過轉化將編碼β-1,4-半乳糖基轉移酶(GalT)或其功能部分的核苷酸序列導入菌株,將甲基營養(yǎng)型酵母菌株工程化以表達β-1,4-半乳糖基轉移酶(GalT)或其功能部分。GalT將β-1,4-半乳糖殘基添加到多糖結構左臂(GlcNAcMan5GlcNAc2)的GlcNAc上,如圖1所示。
用于導入甲基營養(yǎng)型酵母菌株的編碼GalT或其功能部分的核苷酸序列可以來源于任何物種,例如哺乳動物(例如人、小鼠)、植物(例如擬南芥)、昆蟲(例如黑腹果蠅)或線蟲(例如秀麗隱桿線蟲)。優(yōu)選地,本發(fā)明中使用的核苷酸序列編碼人GalT,更優(yōu)選編碼SEQ ID NO21中列出的人GalT。
GalT的“功能部分”是指基本上保留全長GalT的酶活性的GalT的多肽片段?!盎旧稀笔侵副A羧LGalT的至少約40%或優(yōu)選至少50%或更多酶活性。GalT或其一部分的酶活性可以通過Maras et al.(Eur J Biochem.249(3)701-7,1997)或下面的實施例中描述的測試法確定。組合使用本領域已知的技術,那些本領域的技術人員可以輕易地鑒定和制造GalT的功能部分。例如,如本發(fā)明中舉例說明的,人GalT的催化結構域構成人GalT的“功能部分”。
依據(jù)本發(fā)明,甲基營養(yǎng)型酵母菌株中表達的GalT或其功能部分優(yōu)選地靶向分泌途徑的位點,分泌途徑中GlcNAcMan5GlcNAc2(GalT的底物)已經(jīng)在糖蛋白上形成。優(yōu)選地,GalT或其功能部分靶向高爾基體。
因此,本發(fā)明的優(yōu)選的實施方案中,將GalT或其功能部分工程化以包含上面描述的高爾基體定位信號。將GalT靶向高爾基體的優(yōu)選高爾基體定位信號是由SEQ IDNO10列出的ScKre2蛋白中1-100位氨基酸組成的肽(SEQ ID NO11)。
根據(jù)本發(fā)明,可以將高爾基體定位信號置于GalT中的任何地方,但是優(yōu)選地在GalT末端,更優(yōu)選地在GalT的N-末端。
可以將本發(fā)明中使用的GalT進一步工程化,例如包含具有可用抗體的表位標簽,例如本領域公知的Myc、HA、FLAG和His6標簽。帶表位標簽的GalT可以方便的純化或監(jiān)測其表達和細胞內(nèi)定位。
使用本領域已知的任何分子生物技術,通過將編碼這種信號或標簽的核苷酸序列插入編碼GalT的核苷酸序列,可以將ER駐留信號和表位標簽容易地引入GalT。
為了實現(xiàn)所希望的蛋白質(即,α-1,2-甘露糖苷酶、GnTI、GalT或任何這些酶的功能部分)在甲基營養(yǎng)型酵母菌株中的表達,可以將編碼蛋白質的核苷酸序列置于載體,并與在甲基營養(yǎng)型酵母菌株中有功能的啟動子和3′終止序列可操作的連接。隨后將載體導入甲基營養(yǎng)型酵母菌株中,例如通過轉化導入。
適合于在甲基營養(yǎng)型酵母菌株中表達蛋白質的啟動子包括組成型啟動子和誘導型啟動子。組成型啟動子例如包括巴斯德畢赤酵母甘油醛-3-磷酸脫氫酶啟動子(“GAP啟動子”)。誘導型啟動子的實例例如包括巴斯德畢赤酵母醇氧化酶I啟動子(“AOXI啟動子”)(美國專利No.4,855,231)或巴斯德畢赤酵母甲醛脫氫酶啟動子(“FLD啟動子”)(Shen et al.Gene 21693-102,1998)。
3′終止序列是結構基因終止密碼子3′的序列,起到使與序列可操作連接的基因的mRNA轉錄產(chǎn)物穩(wěn)定的作用,例如引起聚腺苷酸化的序列。3′終止序列可以從畢赤酵母或其它甲基營養(yǎng)型酵母獲得。用于實施本發(fā)明的巴斯德畢赤酵母3′終止序列的實例包括AOXI基因和HIS4基因的終止序列。
載體或其線性片段的轉化可以使用任何已知的方法實現(xiàn),例如Cregg et al.(Mol.Cell.Biol.(12)3376-85,1985)描述的原生質球技術,或Ito et al.(Agric.Biol.Chem.48(2)341,(1984))描述的整個細胞氯化鋰酵母轉化系統(tǒng),如EP 312,934所述修改用于畢赤酵母。其它可用于轉化的方法包括下列描述的方法美國專利No.4,929,555;Hinnen et al.(Proc.Nat.Acad.Sci.USA 751929(1978));Ito et al.(J.Bacteriol.153163(1983));美國專利No.4,879,231;和Sreekrishna et al.(Gene 59115(1987))。也可以使用電穿孔和PEG1000完整細胞轉化程序。見Cregg and Russel,Methods inMolecular BiologyPichia Protocols,Chapter 3,Humana Press,Totowa,N.J.,pp.27-39(1998)。
可以使用適當?shù)募夹g選擇轉化的酵母細胞,適當?shù)募夹g包括但不限于在轉化之后在缺少所需生化產(chǎn)物的條件下培養(yǎng)營養(yǎng)缺陷型細胞(由于細胞的營養(yǎng)缺陷型)、選擇和檢測新的表型或在抗生素存在條件下培養(yǎng),所述抗生素在缺少轉化子中含有的抗性基因時對酵母有毒。也可以將表達盒整合入基因組來選擇和/或驗證轉化子,這可以通過例如Southern印跡或PCR分析來評價。
如上所述,除了表達α-1,2-甘露糖苷酶和N-乙酰葡糖胺基轉移酶I(或GnTI)、β-1,4-半乳糖基轉移酶(GalT)或其功能部分之外,優(yōu)選地甲基營養(yǎng)型酵母菌株還被工程化以滅活基因組OCH1基因,從而有效地生產(chǎn)具有GalGlcNAcMan5GlcNAc2多糖的糖蛋白。
OCH1基因編碼膜結合型α-1,6-甘露糖基轉移酶,該酶定位于早期高爾基復合體并啟動將α-1,6-聚甘露糖外鏈添加至N-連接核心寡糖(Man5GlcNAc2和Man8GlcNAc2)。釀酒酵母OCH1基因和畢赤酵母OCH1基因已經(jīng)被克隆(分別在Nakayama et al.EMBO J.112511-2519,1992和日本專利申請No.07145005中描述)。那些本領域的技術人員可以用本領域公知技術從其它甲基營養(yǎng)型酵母中分離OCH1基因。
根據(jù)本發(fā)明,破壞甲基營養(yǎng)型酵母菌株的OCH1基因可以導致產(chǎn)生無活性蛋白質產(chǎn)物或無產(chǎn)物。這種破壞可以采用插入異源DNA序列到編碼區(qū)和/或刪除一些或全部編碼區(qū)的形式?;蚱茐目梢酝ㄟ^同源重組產(chǎn)生,基本上如Rothstein(Methods inEnzymology,Wu et al.,eds.,vol 101202-211,1983)所述。
為了通過雙同源重組破壞基因組OCH1基因,可以構建OCH1“敲出”載體,其中包括選擇標志基因,在它的5′和3′端都與OCH1的足以介導同源重組的長度的部分可操作的連接。選擇標志可以是任意數(shù)目的補充宿主細胞營養(yǎng)缺陷型或提供抗生素抗性的基因之一,包括URA3、ARG4、HIS4、ADE1、LEU2 HIS3、Sh ble(印度斯坦鏈異壁菌博萊霉素基因)和BSD(土曲霉的殺稻瘟素S脫氨酶)基因。其它合適的選擇標志包括釀酒酵母的轉化酶,其允許甲基營養(yǎng)型酵母在蔗糖上生長;或lacZ基因,其由于活性β-半乳糖苷酶的表達而產(chǎn)生藍色菌落。然后將OCH1滅活載體的線性DNA片段用本領域公知的任何轉化方法導入宿主甲基營養(yǎng)型酵母細胞,其中所述OCH1滅活載體在它的5′和3′端都具有OCH1序列的選擇標志基因。線性片段整合入基因組OCH1基因座,OCH1基因的破壞可以基于選擇標志確定,并可以例如通過Southern印跡分析驗證。
作為替代方案,可以構建OCH1敲出載體,其包含OCH1基因的一部分,其中該部分無任何OCH1啟動子序列并且不編碼OCH1蛋白質或編碼OCH1蛋白質的無活性片段?!盁o活性片段”是指全長OCH1蛋白質的片段,所述片段優(yōu)選地含全長OCH1蛋白質活性的少于約10%,更優(yōu)選地約0%。將OCH1基因的這部分插入載體,并且不與在甲基營養(yǎng)型酵母中有功能的任何啟動子序列可操作的連接。隨后可以將該載體在OCH1序列內(nèi)的位點上線性化,并使用本領域已知的任何轉化方法轉化入甲基營養(yǎng)型酵母菌株。通過單同源重組的方式,將該線性化載體整合入OCH1基因座,在染色體中產(chǎn)生兩個och1序列,沒有一個能夠產(chǎn)生活性Och1p蛋白質,如圖3A所示。
優(yōu)選地,將滅活突變也導入載體的och1序列中線性化位點的5’位置(上游)和OCH1翻譯起始密碼子的3’位置(下游)處?!皽缁钔蛔儭笔侵敢虢K止密碼子的突變,移碼突變或引起讀碼框破壞的任何其它突變??梢允褂帽绢I域已知的任何定點突變方法將這種突變引入載體的och1序列中。這種滅活突變確保了在同源重組后沒有功能性Och1p蛋白質形成,即使在敲出載體中och1序列的5′存在一些啟動子序列也是如此。
如果期望可以將如上所述的基因工程化甲基營養(yǎng)型酵母菌株進一步修飾。例如,可以破壞編碼任何其它畢赤酵母甘露糖基轉移酶的其他基因。如果期望,可以導入編碼在哺乳動物糖基化途徑中起作用的除α-1,2-甘露糖苷酶、GnTI或GalT之外的酶的基因,以增加哺乳動物樣N-多糖的比例和/或進一步修飾哺乳動物樣N-多糖。例如,可以將上述基因工程甲基營養(yǎng)型酵母菌株進一步修飾以表達釀酒酵母GAL10編碼的酶,該酶將UDP-葡萄糖轉化成UDP-半乳糖,反之亦然。這可以提高胞漿UDP-半乳糖的水平,從而刺激GalT的活性并增加GalGlcNAcM5GlcNAc2多糖的比例。另外,可以將上述基因工程化甲基營養(yǎng)型酵母菌株進一步修飾以在高爾基體中表達甘露糖苷酶II,該酶從GalGlcNAcM5GlcNAc2中除去額外的甘露糖殘基,從而允許添加其它糖殘基。
遺傳修飾的順序對本發(fā)明不是關鍵的。導入編碼α-1,2-甘露糖苷酶、GnTI和GalT的核苷酸序列和破壞基因組OCH1基因可以以任何順序依次進行,或通過共轉化兩個或更多不同載體或編碼序列或通過轉化包括兩個或更多不同編碼序列的一個載體而同時進行。
進一步方面中,本發(fā)明提供用于產(chǎn)生具有哺乳動物樣N-多糖結構的糖蛋白的甲基營養(yǎng)型酵母菌株的載體,所述N-多糖的特征為具有五個或更少甘露糖殘基和至少一個與包含甘露糖的核心結構和末端半乳糖殘基連接的N-乙酰葡糖胺殘基(GlcNAc),例如GalGlcNAcMan5GlcNAc2。
在一個實施方案中,本發(fā)明提供包含編碼待表達酶的核苷酸序列的載體,所述酶即,α-1,2-甘露糖苷酶、GnTI、GalT或任何這些蛋白質的功能部分。這種載體也稱為“敲入”載體??梢詫⒕幋a序列與在表達所編碼蛋白質的宿主甲基營養(yǎng)型酵母中有功能的啟動子和3′終止序列可操作的連接。可以將兩個或更多編碼序列置于同一載體中以同時轉化入甲基營養(yǎng)型酵母菌株內(nèi)。優(yōu)選地,所述載體還包含上述便于轉化子選擇的任一種選擇標志基因。
根據(jù)本發(fā)明,敲入載體可以是整合型載體或復制型載體(例如復制型環(huán)狀質粒),其中含有編碼準備在甲基營養(yǎng)型酵母菌株表達的期望蛋白質的序列。整合型載體例如已公開在美國專利No.4,882,279中,其通過引用并入本文。整合型載體通常包含至少第一個可插入DNA片段、選擇標志基因和第二個可插入DNA片段的依次排列的序列。第一和第二個可插入DNA片段每個可以是約200個核苷酸長,并包含與待轉化物種的部分基因組DNA同源的核苷酸序列。將包含用于表達的感興趣結構基因的核苷酸序列在第一和第二個可插入DNA片段之間在標志基因之前或之后插入上述載體??梢詫⒄闲洼d體在酵母轉化之前線性化,以促進感興趣的核苷酸序列整合入宿主細胞基因組。
另一個實施方案中,本發(fā)明提供滅活載體(或“敲出”載體),其在導入甲基營養(yǎng)型酵母菌株時滅活或破壞基因組OCH1基因。
如上所述,滅活基因組OCH1基因的載體可以包含選擇標志基因,在其5′和3′端與足以介導同源重組的長度的OCH1基因的一部分可操作的連接。用OCH1滅活載體的線性DNA片段轉化甲基營養(yǎng)型酵母細胞導致線性片段整合入基因組OCH1基因座并破壞基因組OCH1基因,所述OCH1滅活載體包含選擇標志基因,在選擇標志基因的5′和3′端具有OCH1序列。
作為替代方案,OCH1滅活載體可以包含待破壞的OCH1基因的一部分和上述任何一個選擇標志基因,OCH1基因的所述部分不編碼OCH1蛋白質或編碼OCH1蛋白質的無活性片段。OCH1的這個部分沒有任何OCH1啟動子序列并且不與任何已知啟動子序列可操作的連接??梢詫⑦@樣的載體在Och1序列內(nèi)的位點處被線性化并隨后轉化入甲基營養(yǎng)型酵母菌株,通過單同源重組介導的整合導致基因組OCH1基因被滅活。優(yōu)選地,在線性化位點的5’位置(上游)和OCH1翻譯起始密碼子的3’位置(下游)處的載體Och1序列中還引入滅活突變,例如終止密碼子或移碼突變。
如果期望,編碼待表達于甲基營養(yǎng)型酵母菌株中的酶的核苷酸序列可以與能夠滅活基因組OCH1基因的核苷酸序列組合在同一載體中,從而產(chǎn)生“敲入并敲出”載體。
本發(fā)明的載體,包括敲入載體和敲出載體,也可以包含在細菌中起作用的選擇標志基因,以及負責在細菌中復制和染色體外維持的序列。細菌選擇標志基因的實例包括氨芐青霉素抗性(Ampr)、四環(huán)素抗性(Tetr)、潮霉素抗性、殺稻瘟菌素抗性和zeocin抗性(ZeoR)基因。
此外,任何以上描述的載體可以進一步包括編碼感興趣的糖蛋白的核苷酸序列,用于在甲基營養(yǎng)型酵母菌株中表達這種糖蛋白。
另一個方面中,本發(fā)明提供生產(chǎn)具有哺乳動物樣N-多糖結構的糖蛋白的方法。
在此使用的“糖蛋白”表示在甲基營養(yǎng)型酵母中在一個或多個天冬酰胺殘基上或一個或多個絲氨酸或蘇氨酸殘基上、或同時在天冬酰胺和絲氨酸或蘇氨酸殘基上被糖基化的蛋白質。優(yōu)選地,所述糖蛋白對宿主甲基營養(yǎng)型酵母菌株是異源的。
依據(jù)本發(fā)明,生產(chǎn)具有降低糖基化的感興趣糖蛋白可以以許多方式實現(xiàn)。例如,可以將編碼感興趣糖蛋白的核苷酸序列導入事先已被工程化生產(chǎn)哺乳動物樣N-多糖的甲基營養(yǎng)型酵母菌株。
可以使編碼糖蛋白的核苷酸序列與在宿主菌株中起作用的啟動子序列和3′終止序列可操作連接。當期望蛋白質產(chǎn)物分泌時,所述核苷酸序列可以包含額外的序列,例如編碼轉運肽的信號序列。這種信號序列是廣為人知的,容易得到并包括釀酒酵母α交配因子prepro(αmf)、巴斯德畢赤酵母酸性磷酸酶(PHO1)信號序列等。
作為替代方案,可以將已經(jīng)導入感興趣糖蛋白質的編碼序列的甲基營養(yǎng)型酵母菌株修飾以表達期望的酶(即α-1,2-甘露糖苷酶、GnTI和GalT),并滅活基因組OCH1基因,如上所述,從而生產(chǎn)具有哺乳動物樣N-多糖的糖蛋白。
甲基營養(yǎng)型酵母中生產(chǎn)的糖蛋白可以通過常規(guī)的方法純化。純化方案可以根據(jù)待純化的特定蛋白質的性質來確定。這種確定在本領域的技術人員的正常水平內(nèi)。例如,將細胞培養(yǎng)基與細胞分離并可以通過常規(guī)分離技術例如沉淀、免疫吸附、分級分離或各種色譜方法從培養(yǎng)基中分離細胞分泌的蛋白質。
可以通過本發(fā)明的方法生產(chǎn)的糖蛋白包括細菌、真菌或病毒蛋白質或抗原,例如解淀粉芽孢桿菌α-淀粉酶、釀酒酵母轉化酶、克氏錐蟲反-唾液酸酶、HIV包膜蛋白、流感病毒A血細胞凝集素、流感神經(jīng)氨酸酶、1型牛皰疹病毒糖蛋白D;蛋白質,哺乳動物來源的蛋白質,例如人蛋白質、生長因子或受體,例如人血管抑素、人B7-1、B7-2和B-7受體CTLA-4、人組織因子、生長因子(例如血小板來源生長因子)、組織纖溶酶原激活化因子、纖溶酶原激活活化因子抑制劑-I、尿激酶、人溶酶體蛋白質例如α-半乳糖苷酶、纖溶酶原、凝血酶、因子XIII;和免疫球蛋白或免疫球蛋白的片段(例如Fab、Fab′、F(ab′)2)。對可以在本發(fā)明的基因工程化畢赤酵母菌株中表達的其它有用的糖蛋白,見Bretthauer and Castellino,Biotechnol. Appl.Biochem.30193-200(1999),和Kukuruzinska et al.,Ann Rev.Biochem.56915-944(1987)。
通過使用本發(fā)明的方法生產(chǎn)的糖蛋白,即具有哺乳動物樣N-多糖的糖蛋白,尤其具有GalGlcNAcMan5GlcNAc2N-多糖的糖蛋白也是本發(fā)明的一部分。
另一個方面中,本發(fā)明提供包含上面描述的本發(fā)明的一個或多個敲入載體、敲出載體或敲入-敲出載體的試劑盒。
更具體地,本發(fā)明的試劑盒包含具有編碼α-甘露糖苷酶I或其功能部分的核苷酸序列的載體,優(yōu)選地包含ER駐留信號;具有編碼GnTI或其功能部分的核苷酸序列的載體,優(yōu)選地包含高爾基體駐留信號;具有編碼GalT或其功能部分的核苷酸序列的載體,優(yōu)選地包含高爾基體駐留信號;或能夠破壞甲基營養(yǎng)型酵母中基因組OCH1基因的載體,或其任何組合。
所述試劑盒還可以包含具有編碼感興趣的異源糖蛋白的序列的核酸分子。這種核酸分子可以在含有上述敲入或敲出序列的不同載體上或同一載體上提供。作為替代方案,試劑盒中的敲入或敲出載體包含方便插入編碼感興趣的異源蛋白質的核苷酸序列的克隆位點。
試劑盒也可以包含甲基營養(yǎng)型酵母菌株,其可以使用任何上面描述的敲入、敲出或敲入-敲出載體轉化。作為替代方案,試劑盒可以包含已經(jīng)被工程化以生產(chǎn)哺乳動物樣N-多糖的甲基營養(yǎng)型酵母菌株。
本發(fā)明通過下列實施例進一步舉例說明。
實施例1材料和方法載體構建和轉化巴斯德畢赤酵母序列的GenBank登記號為E12456(SEQ ID NO2),描述于日本專利申請No.07145005中,該文獻通過引用并入本文。該序列顯示α-1,6-甘露糖基轉移酶的所有典型特征并與釀酒酵母OCH1最同源,因此在此稱為巴斯德畢赤酵母OCH1基因。
通過PCR分離巴斯德畢赤酵母OCH1基因的全部ORF,其中使用由菌株GS115分離的基因組DNA作為模板和下列寡核苷酸5′GGAATTCAGCATGGAGTATGGATCATGGAGTCCGTTGGAAAGG(SEQ IDNO4)和5′GCCGCTCGAGCTAGCTTTCTTTAGTCC(SEQ ID NO5)。將分離的OCH1基因克隆到pUC18中以獲得pUC18pOCH1,通過測序確認OCH1基因的身份。
質粒pGlycoSwitchM8(2875bp,SEQ ID NO6,在圖3A中描述)包含巴斯德畢赤酵母OCH1 ORF的編碼Ala25-Alal55的片段,所述片段插入pPICZB(Invitrogen,Carlsbad,CA)的BglII和HindIII位點之間。兩個框內(nèi)的終止密碼子位于緊接在Ala25密碼子之前的位置,以防止合成截短蛋白質的可能。通過消化后的補平和再連接預先除去pPICZB的多接頭的BstB I位點。位于克隆的OCH1片段內(nèi)的唯一BstB I位點可用于質粒的線性化(見圖3A概述了滅活策略)。
pGlycoSwitchM5(5485bp,SEQ ID NO9,在圖3B描述)如下構建。將包含巴斯德畢赤酵母HIS4轉錄終止序列的pPIC9(Invitrogen,Carlsbad,CA)的XbaI/Cla I片段插入pGlycoSwitchM8的HindIII和EcoR I位點之間。隨后,將包含GAP啟動子和preMF甘露糖苷酶HDEL盒的pGAPZMFManHDEL的2.3kb BglII/Not I片段(Callewaert et al.,F(xiàn)EBS Lett,503(2-3)173-178,2001)插入HindIII和Not I位點之間。將所有用于此構建的限制性位點(除了Not I位點)用Klenow DNA聚合酶補平。通過補平和消化后再連接預先除去pGAPZMFmanHDEL中的唯一BstB I位點。
為了使人GlcNAc-轉移酶I(GnTI)靶向高爾基體,將GnTI N-末端部分用負責定位至酵母高爾基體中的釀酒酵母Kre2 N-末端部分替換(Lussier et al.,J Cell Biol,131(4)913-927,1995)。通過將Kre2基因的Sac I/Pvu II片段插入到已用Sal I(用Klenow平端化)和Sac I消化的YEp352載體中產(chǎn)生質粒YEp352Kre2(由Dr.HowardBussey,McGill University,Montreal,Canada提供)。將YEp352Kre2用Sac I/Pvu I消化并通過T4-聚合酶平端化。分離Kre2基因的5′端并克隆入Klenow平端化的SgrAI/Xba I切開的pUChGnTI(Maras et al.,Eur J Biochem 249(3)701-707,1997)。使用標準程序對兩個DNA片段之間的融合位置測序。得到的Kre2-GnTI開放讀碼框包含Kre2基因的N-末端部分(編碼Kre2蛋白的前100個氨基酸,如SEQ ID NO11中列出)和GnTI的催化結構域(如SEQ ID NO13中列出的GnTI的最后327個氨基酸),所述開放讀碼框通過EcoR V/Hind III雙重消化分離并在兩個片段用Klenow聚合酶平端化后連接入Sal I/EcoR I切開的pPIC6A載體(Invitrogen)中。得到的質粒命名為pPIC6AKrecoGnTI(SEQ ID NO14,在圖3C中描述)。它包含位于甲醇誘導型AOX1啟動子控制下的Kre2GnTI開放讀碼框和來自土曲霉的對殺稻瘟菌素有抗性的BSD基因。
通過以靶向GnTI的同樣方式將GalT的催化域與Kre2p的N-末端部分融合來實現(xiàn)GalT的定位。從hepg2 cDNA文庫擴增β-1,4-半乳糖基轉移酶,其中使用寡核苷酸5′TTCGAAGCTTCGCTAGCTCGGTGTCCCGATGTC(SEQ ID NO15)和5′GAATTCGAAGGGAAGATGAGGCTTCGGGAGCC(SEQ ID NO16)作為起始序列。將擴增的片段經(jīng)Hind III/EcoR I克隆入pUC18。為了刪除GalT蛋白質的N-末端77氨基酸,使用下列寡核苷酸作為引物進行PCR5′TTCGAAGCTTCGCTAGCTCGGTGTCCCGATGTC(SEQ ID NO15)和5′CGTTCGCGACCGGAGGGGCCCGGCCGCC(SEQ ID NO17)。擴增的片段用Nru I/Hind III切割并連接入Hind III/SgrA I Klenow平端化的pUCKreGnTI載體。得到的Kre2-GalT融合構建體再用下列引物通過PCR擴增5′TCGATATCAAGCTTAGCTCGGTGTCCCGATGTC(SEQ ID NO18)和5′GAATTCGAACTTAAGATGGCCCTCTTTCTCAGTAAG(SEQ ID NO19)。將擴增的片段經(jīng)EcoR V/BstB I克隆入pBLURA IX(Cereghino et al.,Gene,263159-169,2001)(由James Cregg,Oregon Graduate Institute of Science and Technology,Beaverton,USA提供)。最后通過將來自載體pFA6a-KanMX4的Spe I/Sma I片段連接入Spe I/Ssp I切開的質粒,用卡那霉素抗性盒替換URA3基因。最終的質粒命名為pBlKanMX4KrehGalT(SEQ ID NO7,在圖3D描述),包含編碼Kre2-GalT融合蛋白質的序列,所述序列與AOX1啟動子可操作的連接。所述融合蛋白質由Kre2的前100個氨基酸和GalT的最后320個氨基酸組成。
按事先描述將這些質粒轉化至表達各種蛋白質的GS115畢赤酵母菌株中(Cregget al.,Methods in MolecularBiology,10327-39,1998)。通過對基因組DNA進行PCR證實PpOCH1基因座處的正確基因組整合。
蛋白質制備如所述,使用HIC、陰離子交換和凝膠過濾色譜的組合來純化分泌的瑞氏木霉α-1,2-甘露糖苷酶(Maras et al.,J Biotechnol,77(2-3)255-263,2000;Van Petegem etal.,J Mol Biol 312(1)157-165,2001)。所有的SDS-PAGE實驗在標準運行條件下在10%PAA上進行。酵母細胞壁甘露糖蛋白質如Ballou所述釋放(Methods Enzymol,185440-470,1990),其中包括用0.9%NaCl水溶液徹底洗滌酵母細胞、酵母細胞在20mM檸檬酸鈉緩沖液中長時間高壓滅菌(90分鐘),隨后用甲醇沉淀(4體積)。
N-多糖分析N-多糖分析通過激光誘導DNA-測序儀輔助的熒光物輔助的碳水化合物電泳(DSA-FACE)在ABI 377 DNA-測序儀上進行,如所述(Callewaert et al.,Glycobiology,11(4)275-281,2001)。簡言之,將糖蛋白固定在MultiscreenImmobilon-P板上并通過PNGase處理而去糖基化?;厥誑-多糖并用APTS衍生化。過量的標記通過在Sephadex G10樹脂上按大小分級分離來去除。APTS-標記的寡糖蒸發(fā)之后,加入ROX-標記的GENESCAN 500標準混合物(Applied Biosystems)實現(xiàn)內(nèi)部標準化。將該混合物在ABI 377A DNA測序儀(Applied Biosystems)上用使12%聚丙烯酰胺凝膠在89mM Tris、89mM硼酸鹽、2.2mM EDTA緩沖液中跑膠。每塊凝膠上,跑牛核糖核酸酶B的N-多糖和麥芽糊精ladder作為參照。使用GENESCAN3.1軟件(Applied Biosystems)進行數(shù)據(jù)分析。用β-N-乙酰氨基己糖苷酶(Glyko)和β-半乳糖苷酶(Prozyme)對標記多糖在37℃在20mM醋酸鈉pH5.5中進行外切糖苷酶處理過夜。傳統(tǒng)的FACE(N-多糖的ANTS標記和在30%PAA微型凝膠上電泳)如Jackson描述的進行(Biochem J,270(3)705-713,1990)。DSA-FACE方法具有非常高的分辨率和靈敏度,而傳統(tǒng)的FACE很好的適用于檢測較高分子量N-多糖的復雜混合物(′超糖基化′),這種糖不能分辨并因此在傳統(tǒng)FACE中在凝膠上形成特征性′彌散條帶′。因此,DSA-FACE和傳統(tǒng)FACE分析的結合得到酵母產(chǎn)生的糖蛋白的特征的更完整圖像。
生長曲線確定新鮮過夜的酵母培養(yǎng)物用新鮮的YPD培養(yǎng)基稀釋到OD600為0.02并在250rpm、30℃過夜生長(12小時,OD600<3.0)。為了開始實驗,將過夜的酵母培養(yǎng)物接種到50mL聚丙烯管中的10mL新鮮YPD以使開始OD600值為0.5。每2小時取等分試樣并測量OD600值。所有酵母菌株在同一時間平行進行。
實施例2OCH1的滅活基因組巴斯德畢赤酵母OCH1基因的破壞通過如下的單同源重組實現(xiàn)。如實施例1所述產(chǎn)生質粒pGlycoSwitchM8(圖3A),其包含巴斯德畢赤酵母OCH1基因的第73-467堿基對,之前是兩個框內(nèi)無義密碼子以避免從載體中潛在的更早的翻譯起始位點通讀。該片段包含位于中心位置的BstB I位點,用于在轉化之前將載體線性化,并將該片段的3′端與AOX1轉錄終止序列連接。當經(jīng)單同源重組整合入畢赤酵母的基因組OCH1基因座時,該載體將復制存在于載體中的OCH1序列。結果,畢赤酵母染色體中的OCH1基因被兩個Och1序列替換。第一個OCH1序列編碼最大長度161個氨基酸的蛋白質產(chǎn)物(其中6個氨基酸由載體中的序列產(chǎn)生),其不包含由全長OCH1基因編碼的II型跨膜蛋白質的催化結構域。第二個OCH1序列缺少全長蛋白質的前25個氨基酸的編碼序列,并包含兩個框內(nèi)終止密碼子以防止從潛在的上游翻譯起始位點的任何通讀。
用質粒pGlycoSwitchM8轉化GS115菌株。轉化子表示為GlycoSwitchM8,或簡稱為M8菌株或och1菌株。用圖3A中給出的引物組合對基因組DNA進行PCR,由三次獨立實驗指出,顯示在約50%Zeocin抗性轉化子中,這種構建體正確整合在預期基因組座位中。
細胞壁甘露糖蛋白質N-多糖的分析揭示了可從圖4推導出的糖基化模式的改變。對于野生型GS115菌株的細胞壁甘露糖蛋白質,優(yōu)勢峰是Man9GlcNAc2;而對于GlycoSwitchM8菌株,主峰是Man8GlcNAc2(比較圖4中板塊2和3)。N-多糖中的這種改變在用全長OCH1 ORF轉化M8菌株以后可以逆轉。
為了評價M8菌株的分泌糖蛋白的異質性是否降低,使用och1 M8菌株,分析野生型GS115菌株中通常超糖基化的分泌蛋白質,即瑞氏木霉α-1,2-甘露糖苷酶(Maras et al.,J Biotechnol,77(2-3)255-263,2000)。經(jīng)SDS-PAGE分離M8菌株細胞的培養(yǎng)上清液,所述菌株已經(jīng)用編碼瑞氏木霉α-1,2-甘露糖苷酶的核苷酸序列轉化(圖5A)。凝膠顯示在GlycoSwitchM8菌株中生產(chǎn)的蛋白質中不存在超糖基化蛋白質的特征性彌散條帶。平行地,通過PNGase F處理將分泌的糖蛋白去糖基化,通過微型凝膠上的FACE分析法來分析多糖。通常在FACE分析中,不能分辨大的超糖基結構并表現(xiàn)為一個彌散條帶(圖5B)。och1菌株的糖蛋白缺少彌散條帶,這證實了och1菌株的N-多糖的異質性降低。
實施例3表達ER保留的甘露糖苷酶-HDEL為了進一步人源化巴斯德畢赤酵母的N-多糖,在och1菌株中表達ER保留的木霉α-1,2-甘露糖苷酶-HDEL。為了容易轉變巴斯德畢赤酵母表達菌株,將編碼瑞氏木霉α-1,2-甘露糖苷酶-HDEL的核苷酸序列插入och1滅活載體。得到的組合載體稱為pGlycoSwitchM5,其構建在實施例1中描述。
用線性化的pGlycoSwitchM5轉化GS115菌株。通過PCR分析證實載體的正確整合。通過DSA-FACE方法分析來自轉化子的甘露糖蛋白質的N-多糖。多糖譜分析顯示了均一的Man5GlcNAc2峰(圖4,板塊4)。在5到最高25葡萄糖單元的大小范圍內(nèi)對Man5GlcNAc2峰和該方法檢測限之上的所有小峰(S/N>3)進行積分,發(fā)現(xiàn)這種高等真核生物類型的高甘露糖多糖組成這種混合物中存在的總N-多糖池的至少90%。
在替代方法中,在甲醇誘導型AOX1啟動子調控下表達甘露糖苷酶-HDEL。在兩種甘露糖苷酶-表達菌株(即組成型和誘導型)之間沒有發(fā)現(xiàn)N-多糖譜的明顯差別。
為了證實異源蛋白質的N-多糖修飾,將pGlycoSwitchM5質粒轉化入表達克氏錐蟲反-唾液酸酶的畢赤酵母菌株,如Laroy等人所述(Protein Expr Purif,20(3)389-393,2000)。在純化的蛋白質上也檢測到Man5GlcNAc2,占純化的蛋白質上總N-多糖的超過95%。
搖瓶培養(yǎng)物中pGlycoSwitchM5轉化菌株的生長曲線分析表明它的倍增時間與野生型菌株非常相似。然而,工程化菌株在比野生型菌株低約20%的光密度時達到穩(wěn)定期,說明它可能對高細胞密度的脅迫條件多少更敏感一些。不過,它的脅迫敏感性表型比釀酒酵母och1菌株所表現(xiàn)的小得多。
實施例4表達定位高爾基體的N-乙酰葡糖胺基轉移酶I(Kre2GnTI)為了將GnTI靶向高爾基體,用編碼釀酒酵母Kre2信號序列的核苷酸序列替換編碼GnTI的N-末端部分的核苷酸序列,所述GnTI的N-末端部分包括胞漿部分、跨膜區(qū)和腔內(nèi)莖區(qū)(luminal stem region)的一部分。由此得到編碼具有Kre2p的前100個氨基酸和GnTI的最后327個氨基酸的嵌合蛋白的核苷酸序列。
為了在巴斯德畢赤酵母中表達,將Kre2-GnTI嵌合序列置于具有殺稻瘟菌素抗性標志物的質粒中強甲醇誘導型AOX1啟動子的調控下。用Nsi I消化使得AOX1基因座被線性化之后,將得到的構建體pPIC6KrecoGnTI(如實施例1所述)轉化入GS115 M5菌株。轉化子中構建體的存在通過使用AOX1 3′和5′引物對基因組DNA進行PCR來證實。
通過DSA-FACE方法分析了幾個轉化子的甘露糖蛋白的N-多糖。優(yōu)勢峰比Man5GlcNAc2峰大了大約一個葡萄糖單元(圖4,板塊5)。為了確定該峰是否含末端GlcNAc,用水解β-GlcNAc鍵的酶即β-N-乙酰氨基己糖苷酶進行外切糖苷酶消化。經(jīng)過用這種酶消化,峰移回到Man5GlcNAc2(圖4,板塊6)。這說明原來的峰代表GlcNAcMan5GlcNAc2,因此證實了嵌合GnTI酶的正確的體內(nèi)活性。
Kre2GnTI嵌合體的過表達導致Man5GlcNAc2幾乎完全轉化為GlcNAcMan5GlcNAc2。這提示在高爾基體中存在足夠的UDP-GlcNAc供體底物以便N-乙酰葡糖氨基化幾乎所有N-多糖。
實施例5表達高爾基體保留的β-1,4-半乳糖基轉移酶用編碼釀酒酵母Kre2信號序列的核苷酸序列替換編碼人β-1,4-半乳糖基轉移酶1的N-末端部分(前77個氨基酸)的核苷酸序列,所述N-末端部分包括酶的跨膜結構域和胞漿部分。將該嵌合融合序列置于AOX1啟動子和作為終止子的AOX13′端的調控下。在轉化入M5-GnTI菌株之前用Pme I將最終質粒pBlKanMX4KrehGalT(實施例1中所述)線性化。
用來自幾個轉化子的甘露糖蛋白進行N-多糖分析。在轉化子中檢測到比GlcNAcMan5GlcNAc2峰大了約一個葡萄糖單元的峰,而在非轉化菌株中不存在該峰(圖3,板塊7)。用β-半乳糖苷酶消化N-多糖以便確定這個峰是否代表包含末端β-半乳糖的多糖。消化多糖譜之后,該峰移回GlcNAcMan5GlcNAc2的位置(圖4,板塊8,與板塊7比較)。通過對β-半乳糖苷酶消化之前和之后的GlcNAcMan5GlcNAc2峰進行積分來確定GalGlcNAcMan5GlcNAc2的量。這兩個峰相減顯示約10%的GlcNAcMan5GlcNAc2被轉化為GalGlcNAcMan5GlcNAc2。向培養(yǎng)基中添加0.2%半乳糖不增加含Gal的寡糖的量。
序列表SEQ ID NO1HDEL(肽)SEQ ID NO2巴斯德畢赤酵母OCH1基因1AGATCTGCCT GACAGCCTTA AAGAGCCCGC TAAAAGACCC GGAAAACCGA GAGAACTCTG61GATTAGCAGT CTGAAAAAGA ATCTTCACTC TGTCTAGTGG AGCAATTAAT GTCTTAGCGG121CACTTCCTGC TACTCCGCCA GCTACTCCTG AATAGATCAC ATACTGCAAA GACTGCTTGT181CGATGACCTT GGGGTTATTT AGCTTCAAGG GCAATTTTTG GGACATTTTG GACACAGGAG241ACTCAGAAAC AGACACAGAG CGTTCTGAGT CCTGGTGCTC CTGACGTAGG CCTAGAACAG301GAATTATTGG CTTTATTTGT TTGTCCATTT CATAGGCTTG GGGTAATAGA TAGATGACAG361AGAAATAGAG AAGACCTAAT ATTTTTTGTT CATGGCAAAT CGCGGGTTCG CGGTCGGGTC421ACACACGGAG AAGTAATGAG AAGAGCTGGT AATCTGGGGT AAAAGGGTTC AAAAGAAGGT481CGCCTGGTAG GGATGCAATA CAAGGTTGTC TTGGAGTTTA CATTGACCAG ATGATTTGGC541TTTTTCTCTG TTCAATTCAC ATTTTTCAGC GAGAATCGGA TTGACGGAGA AATGGCGGGG601TGTGGGGTGG ATAGATGGCA GAAATGCTCG CAATCACCGC GAAAGAAAGA CTTTATGGAA661TAGAACTACT GGGTGGTGTA AGGATTACAT AGCTAGTCCA ATGGAGTCCG TTGGAAAGGT721AAGAAGAAGC TAAAACCGGC TAAGTAACTA GGGAAGAATG ATCAGACTTT GATTTGATGA781GGTCTGAAAA TACTCTGCTG CTTTTTCAGT TGCTTTTTCC CTGCAACCTA TCATTTTCCT841TTTCATAAGC CTGCCTTTTC TGTTTTCACT TATATGAGTT CCGCCGAGAC TTCCCCAAAT901TCTCTCCTGG AACATTCTCT ATCGCTCTCC TTCCAAGTTG CGCCCCCTGG CACTGCCTAG961TAATATTACC ACGCGACTTA TATTCAGTTC CACAATTTCC AGTGTTCGTA GCAAATATCA1021TCAGCCATGG CGAAGGCAGA TGGCAGTTTG CTCTACTATA ATCCTCACAA TCCACCCAGA1081AGGTATTACT TCTACATGGC TATATTCGCC GTTTCTGTCA TTTGCGTTTT GTACGGACCC1141TCACAACAAT TATCATCTCC AAAAATAGAC TATGATCCAT TGACGCTCCG ATCACTTGAT1201TTGAAGACTT TGGAAGCTCC TTCACAGTTG AGTCCAGGCA CCGTAGAAGA TAATCTTCGA1261AGACAATTGG AGTTTCATTT TCCTTACCGC AGTTACGAAC CTTTTCCCCA ACATATTTGG1321CAAACGTGGA AAGTTTCTCC CTCTGATAGT TCCTTTCCGA AAAACTTCAA AGACTTAGGT1381GAAAGTTGGC TGCAAAGGTC CCCAAATTAT GATCATTTTG TGATACCCGA TGATGCAGCA1441TGGGAACTTA TTCACCATGA ATACGAACGT GTACCAGAAG TCTTGGAAGC TTTCCACCTG1501CTACCAGAGC CCATTCTAAA GGCCGATTTT TTCAGGTATT TGATTCTTTT TGCCCGTGGA1561GGACTGTATG CTGACATGGA CACTATGTTA TTAAAACCAA TAGAATCGTG GCTGACTTTC1621AATGAAACTA TTGGTGGAGT AAAAAACAAT GCTGGGTTGG TCATTGGTAT TGAGGCTGAT1681CCTGATAGAC CTGATTGGCA CGACTGGTAT GCTAGAAGGA TACAATTTTG CCAATGGGCA1741ATTCAGTCCA AACGAGGACA CCCAGCACTG CGTGAACTGA TTGTAAGAGT TGTCAGCACG1801ACTTTACGGA AAGAGAAAAG CGGTTACTTG AACATGGTGG AAGGAAAGGA TCGTGGAAGT1861GATGTGATGG ACTGGACGGG TCCAGGAATA TTTACAGACA CTCTATTTGA TTATATGACT1921AATGTCAATA CAACAGGCCA CTCAGGCCAA GGAATTGGAG CTGGCTCAGC GTATTACAAT1981GCCTTATCGT TGGAAGAACG TGATGCCCTC TCTGCCCGCC CGAACGGAGA GATGTTAAAA2041GAGAAAGTCC CAGGTAAATA TGCACAGCAG GTTGTTTTAT GGGAACAATT TACCAACCTG2101CGCTCCCCCA AATTAATCGA CGATATTCTT ATTCTTCCGA TCACCAGCTT CAGTCCAGGG2161ATTGGCCACA GTGGAGCTGG AGATTTGAAC CATCACCTTG CATATATTAG GCATACATTT2221GAAGGAAGTT GGAAGGACTA AAGAAAGCTA GAGTAAAATA GATATAGCGA GATTAGAGAA2281TGAATACCTT CTTCTAAGCG ATCGTCCGTC ATCATAGAAT ATCATGGACT GTATAGTTTT2341TTTTTTGTAC ATATAATGAT TAAACGGTCA TCCAACATCT CGTTGACAGA TCTCTCAGTA2401CGCGAAATCC CTGACTATCA AAGCAAGAAC CGATGAAGAA AAAAACAACA GTAACCCAAA2461CACCACAACA AACACTTTAT CTTCTCCCCC CCAACACCAA TCATCAAAGA GATGTCGGAA2521CACAAACACC AAGAAGCAAA AACTAACCCC ATATAAAAAC ATCCTGGTAG ATAATGCTGG2581TAACCCGCTC TCCTTCCATA TTCTGGGCTA CTTCACGAAG TCTGACCGGT CTCAGTTGAT2641CAACATGATC CTCGAAATGG GTGGCAAGCA TCGTTCCAGA CCTGCCTCCT CTGGTAGATG2701GAGTGTTGTT TTTGACAGGG GATTACAAGT CTATTGATGA AGATACCCTA AAGCAACTGG2761GGGACGTTCC AATATACAGA GACTCCTTCA TCTACCAGTG TTTTGTGCAC AAGACATCTC2821TTCCCATTGA CACTTTCCGA ATTGACAAGA ACGTCGACSEQ ID NO3由OCH1基因編碼的巴斯德畢赤酵母α-1,6-甘露糖基轉移酶(nt 1027-2241)
MAKADGSLLYYNPHNPPRRYYFYMAIFAVSVICVLYGPSQQLSSPKIDYDPLTLRSLDLKTLEAPSQLSPGTVEDNLRRQLEFHFPYRSYEPFPOHIWQTWKVSPSDSSFPKNFKDLGESWLQRSPNYDHFVIPDDAAWELIHHEYERVPEVLEAFHLLPEPILKADFFRYLILFARGGLYADMDTMLLKPIESWLTFNETIGGVKNNAGLVIGIEADPDRPDWHDWYARRIQFCQWAIQSKRGHPALRELIVRVVSTTLRKEKSGYLNMVEGKDRGSDVMDWTGPGIFTDTLFDYMTNVNTTGHSGQGIGAGSAYYNALSLEERDALSARPNGEMLKEKVPGKYAQQVVLWEQFTNLRSPKLIDDILILPITSFSPGIGHSGAGDLNHHLAYIRHTFEGSWKDSEQ ID NO45′GGAATTCAGCATGGAGTATGGATCATGGAGTCCGTTGGAAAGGSEQ ID NO55′GCCGCTCGAGCTAGCTTTCTTTAGTCCSEQ ID NO6質粒pGlycoSwitchM8(2875bp)AGATCTAACATCCATAATCGATCTAAGCTATATTCGCCGTTTCTGTCATTTGCGTTTTGTACGGACCCTCACAACAATTATCATCTCCAAAAATAGACTATGATCCATTGACGCTCCGATCACTTGATTTGAAGACTTTGGAAGCTCCTTCACAGTTGAGTCCAGGCACCGTAGAAGATAATCTTCGAAGACAATTGGAGTTTCATTTTCCTTACCGCAGTTACGAACCTTTTCCCCAACATATTTGGCAAACGTGGAAAGTTTCTCCCTCTGATAGTTCCTTTCCGAAAAACTTCAAAGACTTAGGTGAAAGTTGGCTGCAAAGGTCCCCAAATTATGATCATTTTGTGATACCCGATGATGCAGCATGGGAACTTATTCACCATGAATACGAACGTGTACCAGAAGTCTTGGAAGCTTTTGATTTTAACGACTTTTAACGACAACTTGAGAAGATCAAAAAACAACTAATTATTCGCGAAACGAGGAATTCACGTGGCCCAGCCGGCCGTCTCGGATCGGTACCTCGAGCCGCGGCGGCCGCCAGCTTTCTAGAGAACAAAAACTCATCTCAGAAGAGGATCTGAATAGCGCCGTCGACCATCATCATCATCATCATTGAGTTTGTAGCCTTAGACATGACTGTTCCTCAGTTCAAGTTGGGCACTTACGAGAAGACCGGTCTTGCTAGATTCTAATCAAGAGGATGTCAGAATGCCATTTGCCTGAGAGATGCAGGCTTCATTTTTGATACTTTTTTATTTGTAACCTATATAGTATAGGATTTTTTTTGTCATTTTGTTTCTTCTCGTACGAGCTTGCTCCTGATCAGCCTATCTCGCAGCTGATGAATATCTTGTGGTAGGGGTTTGGGAAAATCATTCGAGTTTGATGTTTTTCTTGGTATTTCCCACTCCTCTTCAGAGTACAGAAGATTAAGTGAGACCTTCGTTTGTGCGGATCCCCCACACACCATAGCTTCAAAATGTTTCTACTCCTTTTTTACTCTTCCAGATTTTCTCGGACTCCGCGCATCGCCGTACCACTTCAAAACACCCAAGCACAGCATACTAAATTTTCCCTCTTTCTTCCTCTAGGGTGTCGTTAATTACCCGTACTAAAGGTTTGGAAAAGAAAAAAGAGACCGCCTCGTTTCTTTTTCTTCGTCGAAAAAGGCAATAAAAATTTTTATCACGTTTCTTTTTCTTGAAATTTTTTTTTTTAGTTTTTTTCTCTTTCAGTGACCTCCATTGATATTTAAGTTAATAAACGGTCTTCAATTTCTCAAGTTTCAGTTTCATTTTTCTTGTTCTATTACAACTTTTTTTACTTCTTGTTCATTAGAAAGAAAGCATAGCAATCTAATCTAAGGGGCGGTGTTGACAATTAATCATCGGCATAGTATATCGGCATAGTATAATACGACAAGGTGAGGAACTAAACCATGGCCAAGTTGACCAGTGCCGTTCCGGTGCTCACCGCGCGCGACGTCGCCGGAGCGGTCGAGTTCTGGACCGACCGGCTCGGGTTCTCCCGGGACTTCGTGGAGGACGACTTCGCCGGTGTGGTCCGGGACGACGTGACCCTGTTCATCAGCGCGGTCCAGGACCAGGTGGTGCCGGACAACACCCTGGCCTGGGTGTGGGTGCGCGGCCTGGACGAGCTGTACGCCGAGTGGTCGGAGGTCGTGTCCACGAACTTCCGGGACGCCTCCGGGCCGGCCATGACCGAGATCGGCGAGCAGCCGTGGGGGCGGGAGTTCGCCCTGCGCGACCCGGCCGGCAACTGCGTGCACTTCGTGGCCGAGGAGCAGGACTGACACGTCCGACGGCGGCCCACGGGTCCCAGGCCTCGGAGATCCGTCCCCCTTTTCCTTTGTCGATATCATGTAATTAGTTATGTCACGCTTACATTCACGCCCTCCCCCCACATCCGCTCTAACCGAAAAGGAAGGAGTTAGACAACCTGAAGTCTAGGTCCCTATTTATTTTTTTATAGTTATGTTAGTATTAAGAACGTTATTTATATTTCAAATTTTTCTTTTTTTTCTGTACAGACGCGTGTACGCATGTAACATTATACTGAAAACCTTGCTTGAGAAGGTTTTGGGACGCTCGAAGGCTTTAATTTGCAAGCTGGAGACCAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCAATGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGGACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGA
TTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATCSEQ ID NO7pBlKanMX4KrehGalTCTAGTGCACAAACGAACGTCTCACTTAATCTTCTGTACTCTGAAGAGGAGTGGGAAATACCAAGAAAAACATCAAACTCGAATGATTTTCCCAAACCCCTACCACAAGATATTCATCAGCTGCGAGATAGGCTGATCAGGAGCAAGCTCGTACGAGAAGAAACAAAATGACAAAAAAAATCCTATACTATATAGGTTACAAATAAAAAAGTATCAAAAATGAAGCCTGCATCTCTCAGGCAAATGGCATTCTGACATCCTCTTGATTAGAATCTAGCAAGACCGGTCTTCTCGTAAGTGCCCAACTTGAACTGAGGAACAGTCATGTCTAAGGCGAATTATCAAGCTTAGCTCGGTGTCCCGATGTCCACTGTGATTTGGGTATACAATGGGTATCTCTGTACATCCAGCACCTGGTAGGTGAGTGAGTTCAAACCATCAGAGAGCATTGTCTCCTTTGTGTGTGCAATTCGGTCAAACCTCTGAGGATTGGGTTCATTTTTTTTGTCTCTTGAGTGGCGGATCATGCGACACCTCCCGACCACAGCATTTGGGCGAGATATAGACATGCCTCTAAAAACTAATCTGTTAAAAATGTCATCATCTTCTCCTCCCCAGCCCCAATAATTATTAGGAAATCCATTGATGGTTAGAAACTGTTGTTTACTTAGAGCAGAGACACCTCCAAAATACTGAACATAAGGTAGGCTGAATCCAAACTTATCCATTGCAACGGAAATGTGCCGTGGCTGTGAAAAACACCTGTACGCATTATGGTCATTCATTGGAATGAGGTCCACGTCACTAAACACAAAGCAGGTGTAGTCATAGTCCTTCAAGGCTTCTTGAAAGCCAACATTGAGGAGCTTAGCACGATTGAATATAGTGTCTCCCGCCTGGTTGATAACATAGATGCCATAGTCCAGCTGCTGGCGCTGCAGGACTGGGTGCAAATAATATAGCCAGTACTTGAGGTGCTCCTGCCGGTTGCGGAATGGAATGATGATGGCCACCTTGTGAGGAGAGACGCAGTCCCTGGGGGCATAGCGGCCGCCCATCTTCACATTTGGGTTCTGCTTTGCCACGAGCTCCAGGTCCACAGGCATGTTAAACTCAATCAGCATGGGGCCCACAAGCAGCGGGGACTCCTCAGGGCAGGCGGGCAGCGACAGTGCGGTGGTGTGGGGCACTGGGACCGAGGTCAAGTTGCTAGCGGGGCCAGGGCCAGAATCCACGACTGGGCTGGAGTCGCCACCCGGGCGCGGCTGGGAGGAGGCGCCTAGAGGAGGCGGCGGCCGGGCCCCTCCGGTCGCCGGCGGGGCATCTGCCTTTTCAGCGGCAGCTTTCAGAGCCTTGGATTCTTCATCCATGGCTTCGGAGTCTTCGCTTGCCTCTGAATTCAGAGCACTTTGCTCTAATTTTTTAGCATCATTTTCCTCAGAGATGACTTGTTGTTCAGGGGATATAGATCCTGAGGTAAAATCAAATGCAGCGGAGATGGAACTCGGAATATATTGCTGAGTTCTACTGTTGGAATTCAATGTTAGGAGGAGAACAATAACCGCACCTGCAATGACGGTAAATCTCAACAGTCTCTTACTGAGAAAGAGGGCCATCTTAAGTTCGAATAATTAGTTGTTTTTTGATCTTCTCAAGTTGTCGTTAAAAGTCGTTAAAATCAAAAGCTTGTCAATTGGAACCAGTCGCAATTATGAAAGTAAGCTAATAATGATGATAAAAAAAAAGGTTTAAGACAGGGCAGCTTCCTTCTGTTTATATATTGCTGTCAAGTAGGGGTTAGAACAGTTAAATTTTGATCATGAACGTTAGGCTATCAGCAGTATTCCCACCAGAATCTTGGAAGCATACAATGTGGAGACAATGCATAATCATCCAAAAAGCGGGTGTTTCCCCATTTGCGTTTCGGCACAGGTGCACCGGGGTTCAGAAGCGATAGAGAGACTGCGCTAAGCATTAATGAGATTATTTTTGAGCATTCGTCAATCAATACCAAACAAGACAAACGGTATGCCGACTTTTGGAAGTTTCTTTTTGACCAACTGGCCGTTAGCATTTCAACGAACCAAACTTAGTTCATCTTGGATGAGATCACGCTTTTGTCATATTAGGTTCCAAGACAGCGTTTAAACTGTCAGTTTTGGGCCATTTGGGGAACATGAAACTATTTGACCCCACACTCAGAAAGCCCTCATCTGGAGTGATGTTCGGGTGTAATGCGGAGCTTGTTGCATTCGGAAATAAACAAACATGAACCTCGCCAGGGGGGCCAGGATAGACAGGCTAATAAAGTCATGGTGTTAGTAGCCTAATAGAAGGAATTGGAATGAGCGAGCTCCAATCAAGCCCAATAACTGGGCTGGTTTTTCGATGGCAAAAGTGGGTGTTGAGGAGAAGAGGAGTGGAGGTCCTGCGTTTGCAACGGTCTGCTGCTAGTGTATCCCCTCCTGTTGCGTTTGGCACTTATGTGTGAGAATGGACCTGTGGATGTCGGATGGCAAAAAGGTTTCATTCAACCTTTCGTCTTTGGATGTTAGCTAGCCGGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGGACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGAT
CTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATGCTTCTAGTGGTAGGAATTAATTCTGTACCGGTTTACAGAAGGACGACTCTTGATGCGCCAACCACAGTGACAATAGACATAGAGGAAATGACAAAAGGATTATGCGAGGATGCTGCTGGAGACGATTCAAAGTTTAGTTTAGAAAGGTCCTCCATTTATGCTGATAGAATACTAGATACCCGTGAACTTTGTCTCAGGAGATCCGCATCAGACGAAGGATGTTCCGACCTGCAAATAATCGAAGAAGAGACCCCTAGGCAGTTGGTGAGCTTACATGAGAAGTCTAAACTATCTTGGACCCGCTGGTTTTATAAAGGGTTCGTTAGGAATGCGTTAACTACCATTCCAGCAACATCCGTGGGGCTTCTGGTGTTTGAAATACTGCGTCAAAAATTGAGCGATGAAATTGAAGATCGATTCAGTTGAATCGCCCGAAACAATTGATCCCCTGTACATACTTGTAATTTACCTCAGAATGGGTTAATTAAGGCGCGCCAGATCTGTTTAGCTTGCCTCGTCCCCGCCGGGTCACCCGGCCAGCGACATGGAGGCCCAGAATACCCTCCTTGACAGTCTTGACGTGCGCAGCTCAGGGGCATGATGTGACTGTCGCCCGTACATTTAGCCCATACATCCCCATGTATAATCATTTGCATCCATACATTTTGATGGCCGCACGGCGCGAAGCAAAAATTACGGCTCCTCGCTGCAGACCTGCGAGCAGGGAAACGCTCCCCTCACAGACGCGTTGAATTGTCCCCACGCCGCGCCCCTGTAGAGAAATATAAAAGGTTAGGATTTGCCACTGAGGTTCTTCTTTCATATACTTCCTTTTAAAATCTTGCTAGGATACAGTTCTCACATCACATCCGAACATAAACAACCATGGGTAAGGAAAAGACTCACGTTTCGAGGCCGCGATTAAATTCCAACATGGATGCTGATTTATATGGGTATAAATGGGCTCGCGATAATGTCGGGCAATCAGGTGCGACAATCTATCGATTGTATGGGAAGCCCGATGCGCCAGAGTTGTTTCTGAAACATGGCAAAGGTAGCGTTGCCAATGATGTTACAGATGAGATGGTCAGACTAAACTGGCTGACGGAATTTATGCCTCTTCCGACCATCAAGCATTTTATCCGTACTCCTGATGATGCATGGTTACTCACCACTGCGATCCCCGGCAAAACAGCATTCCAGGTATTAGAAGAATATCCTGATTCAGGTGAAAATATTGTTGATGCGCTGGCAGTGTTCCTGCGCCGGTTGCATTCGATTCCTGTTTGTAATTGTCCTTTTAACAGCGATCGCGTATTTCGTCTCGCTCAGGCGCAATCACGAATGAATAACGGTTTGGTTGATGCGAGTGATTTTGATGACGAGCGTAATGGCTGGCCTGTTGAACAAGTCTGGAAAGAAATGCATAAGCTTTTGCCATTCTCACCGGATTCAGTCGTCACTCATGGTGATTTCTCACTTGATAACCTTATTTTTGACGAGGGGAAATTAATAGGTTGTATTGATGTTGGACGAGTCGGAATCGCAGACCGATACCAGGATCTTGCCATCCTATGGAACTGCCTCGGTGAGTTTTCTCCTTCATTACAGAAACGGCTTTTTCAAAAATATGGTATTGATAATCCTGATATGAATAAATTGCAGTTTCATTTGATGCTCGATGAGTTTTTCTAATCAGTACTGACAATAAAAAGATTCTTGTTTTCAAGAACTTGTCATTTGTATAGTTTTTTTATATTGTAGTTGTTCTATTTTAATCAAATGTTAGCGTGATTTATATTTTTTTTCGCCTCGACATCATCTGCCCAGATGCGAAGTTAAGTGCGCAGAAAGTAATATCATGCGTCAATCGTATGTGAATGCTGGTCGCTATACTGCTGTCGATTCGATACTAACGCCGCCATCCAGTGTCGAAAACGAGCTCGAATTCATCGATGATATCAGATCCASEQ ID NO8pGAPZMFManHDEL中的MFManHDEL融合體的ORF序列ATGAGATTTCCTTCAATTTTTACTGCTGTTTTATTCGCAGCATCCTCCGCATTAGCTGCTCCAGTCAACACTACAACAGAAGATGAAACGGCACAAATTCCGGCTGAAGCTGTCATCGGTTACTCAGATTTAGAAGGGGATTTCGATGTTGCTGTTTTGCCATTTTCCAACAGCACAAATAACGGGTTATTGTTTATAAATACTACTATTGCCAGCATTGCTGCTAAAGAAGAAGGGGTATCTCTCGAGAAAAGAGAGGCTGAAGCTGAATTCGCCACAAAACGTGGATCTCCCAACCCTACGAGGGCGGCAGCAGTCAAGGCCGCATTCCAGACGTCGTGGAACGCTTACCACCATTTTGCCTTTCCCCATGACGACCTCCACCCGGTCAGCAACAGCTTTGATGATGAGAGAAACGGCTGGGGCTCGTCGGCAATCGATGGCTTGGACACGGCTATCCTCATGGGGGATGCCGACATTGTGAACACGATCCTTCAGTATGTACCGCAGATCAACTTCACCACGACTGCGGTTGCCAACCAAGGATCCTCCGTGTTCGAGACCAACA
TTCGGTACCTCGGTGGCCTGCTTTCTGCCTATGACCTGTTGCGAGGTCCTTTCAGCTCCTTGGCGACAAACCAGACCCTGGTAAACAGCCTTCTGAGGCAGGCTCAAACACTGGCCAACGGCCTCAAGGTTGCGTTCACCACTCCCAGCGGTGTCCCGGACCCTACCGTCTTCTTCAACCCTACTGTCCGGAGAAGTGGTGCATCTAGCAACAACGTCGCTGAAATTGGAAGCCTGGTGCTCGAGTGGACACGGTTGAGCGACCTGACGGGAAACCCGCAGTATGCCCAGCTTGCGCAGAAGGGCGAGTCGTATCTCCTGAATCCAAAGGGAAGCCCGGAGGCATGGCCTGGCCTGATTGGAACGTTTGTCAGCACGAGCAACGGTACCTTTCAGGATAGCAGCGGCAGCTGGTCCGGCCTCATGGACAGCTTCTACGAGTACCTGATCAAGATGTACCTGTACGACCCGGTTGCGTTTGCACACTACAAGGATCGCTGGGTCCTTGGTGCCGACTCGACCATTGGGCATCTCGGCTCTCACCCGTCGACGCGCAAGGACTTGACCTTTTTGTCTTCGTACAACGGACAGTCTACGTCGCCAAACTCAGGACATTTGGCCAGTTTTGGCGGTGGCAACTTCATCTTGGGAGGCATTCTCCTGAACGAGCAAAAGTACATTGACTTTGGAATCAAGCTTGCCAGCTCGTACTTTGGCACGTACACCCAGACGGCTTCTGGAATCGGCCCCGAAGGCTTCGCGTGGGTGGACAGCGTGACGGGCGCCGGCGGCTCGCCGCCCTCGTCCCAGTCCGGGTTCTACTCGTCGGCAGGATTCTGGGTGACGGCACCGTATTACATCCTGCGGCCGGAGACGCTGGAGAGCTTGTACTACGCATACCGCGTCACGGGCGACTCCAAGTGGCAGGACCTGGCGTGGGAAGCGTTGAGTGCCATTGAGGACGCATGCCGCGCCGGCAGCGCGTACTCGTCCATCAACGACGTGACGCAGGCCAACGGCGGGGGTGCCTCTGACGATATGGAGAGCTTCTGGTTTGCCGAGGCGCTCAAGTATGCGTACCTGATCTTTGCGGAGGAGTCGGATGTGCAGGTGCAGGCCACCGGCGGGAACAAATTTGTCTTTAACACGGAGGCGCACCCCTTTAGCATCCGTTCATCATCACGACGGGGCGGCCACCTTGCTCACGACGAGTTGTAASEQ ID NO9pGlycoSwitch M5(5485bp)AGATCTAACATCCATAATCGATCTAAGCTATATTCGCCGTTTCTGTCATTTGCGTTTTGTACGGACCCTCACAACAATTATCATCTCCAAAAATAGACTATGATCCATTGACGCTCCGATCACTTGATTTGAAGACTTTGGAAGCTCCTTCACAGTTGAGTCCAGGCACCGTAGAAGATAATCTTCGAAGACAATTGGAGTTTCATTTTCCTTACCGCAGTTACGAACCTTTTCCCCAACATATTTGGCAAACGTGGAAAGTTTCTCCCTCTGATAGTTCCTTTCCGAAAAACTTCAAAGACTTAGGTGAAAGTTGGCTGCAAAGGTCCCCAAATTATGATCATTTTGTGATACCCGATGATGCAGCATGGGAACTTATTCACCATGAATACGAACGTGTACCAGAAGTCTTGGAAGCTCTAGATGCTCACCGCAATGCTGTTAAGGTTCGTATGGAGAAACTGGGACTTATTTAATTATTTAGAGATTTTAACTTACATTTAGATTCGATAGATCCACAGGACGGGTGTGGTCGCCATGATCGCGTAGTCGATAGTGGCTCCAAGTAGCGAAGCGAGCAGGACTGGGCGGCGGCCAAAGCGGTCGGACAGTGCTCCGAGAACGGGTGCGCATAGAAATTGCATCAACGCATATAGCGCTAGCAGCACGCCATAGTGACTGGCGATGCTGTCGGAATGGACGATATCCCGCAAGAGGCCCGGCAGTACCGGCATAACCAAGCCTATGCCTACAGCATCCAGGGTGACGGTGCCGAGGATGACGATGAGCGCATTGTTAGATTTCATACACGGTGCCTGACTGCGTTAGCAATTTAACTGTGATAAACTACCGCATTAAAGCTGATCTTTTTTGTAGAAATGTCTTGGTGTCCTCGTCCAATCAGGTAGCCATCTCTGAAATATCTGGCTCCGTTGCAACTCCGAACGACCTGCTGGCAACGTAAAATTCTCCGGGGTAAAACTTAAATGTGGAGTAATGGAACCAGAAACGTCTCTTCCCTTCTCTCTCCTTCCACCGCCCGTTACCGTCCCTAGGAAATTTTACTCTGCTGGAGAGCTTCTTCTACGGCCCCCTTGCAGCAATGCTCTTCCCAGCATTACGTTGCGGGTAAAACGGAGGTCGTGTACCCGACCTAGCAGCCCAGGGATGGAAAAGTCCCGGCCGTCGCTGGCAATAATAGCGGGCGGACGCATGTCATGAGATTATTGGAAACCACCAGAATCGAATATAAAAGGCGAACACCTTTCCCAATTTTGGTTTCTCCTGACCCAAAGACTTTAAATTTAATTTATTTGTCCCTATTTCAATCAATTGAACAACTATTTCGCGAAACGATGAGATTTCCTTCAATTTTTACTGCTGTTTTATTCGCAGCATCCTCCGCATTAGCTGCTCCAGTCAACACTACAACAGAAGATGAAACGGCACAAATTCCGGCTGAAGCTGTCATCGGTTACTCAGATTTAGAAGGGGATTTCGATGTTGCTGTTTTGCCATTTTCCAACAGCACAAATAACGGGTTATTGTTTATAAATACTACTATTGCCAGCATTGCTGCTAAAGAAGAAGGGGTATCTCTCGAGAAAAGAGAGGCTGAAGCTGAATTCGCCACAAAACGTGGATCTCCCAACCCTACGAGGGCGGCAGCAGTCAAGGCCGCATTCCAGACGTCGTGGAACGCTTACCACCATTTTGCCTTTCCCCATGACGACCTCCACCCGGTCAGCAACAGCTTTGATGATGAGAGAAACGGCTGGGGCTCGTCGGCAATCGATGGCTTGGACACGGCTATCCTCATGGGGGATGCCGACATTGTGAACACGATCCTTCAGTATGTACCGCAGATCAACTTCACCACGACTGCGGTTGCCAACCAAGGATCCTCCGTGTTCGAGACCAACATTCGGTACCTCGGTGGCCTGCTTTCTGCCTATGACCTGTTGCGAGGTCCTTTCAGCTCCTTGGCGACAAACCAGACCCTGGTAAACAGCCTTCTGAGGCAGGCTCAAACACTGGCCAACGGCCTCAAGGTTGCGTTCACCACTCCCAGCGGTGTCCCGGACCCTACCGTCTTCTTCAACCCTACTGTCCGGAGAAGTGGTGCATCTAGCAACAACGTCGCTGAAATTGGAAGCCTGGTGCTCGAGTGGACACGGTTGAGCGACCTGACGGGAAACCCGCAGTATGCCCAGCTTGCGCAGAAGGGCGAGTCGTATCTCCTGAATCCAAAGGGAAGCCCGGAGGCATGGCCTGGCCTGATTGGAACGTTTGTCAGCACGAGCAACGGTACCTTTCAGGATAGCAGCGGCAGCTGGTCCGGCC
TCATGGACAGCTTCTACGAGTACCTGATCAAGATGTACCTGTACGACCCGGTTGCGTTTGCACACTACAAGGATCGCTGGGTCCTTGGTGCCGACTCGACCATTGGGCATCTCGGCTCTCACCCGTCGACGCGCAAGGACTTGACCTTTTTGTCTTCGTACAACGGACAGTCTACGTCGCCAAACTCAGGACATTTGGCCAGTTTTGGCGGTGGCAACTTCATCTTGGGAGGCATTCTCCTGAACGAGCAAAAGTACATTGACTTTGGAATCAAGCTTGCCAGCTCGTACTTTGGCACGTACACCCAGACGGCTTCTGGAATCGGCCCCGAAGGCTTCGCGTGGGTGGACAGCGTGACGGGCGCCGGCGGCTCGCCGCCCTCGTCCCAGTCCGGGTTCTACTCGTCGGCAGGATTCTGGGTGACGGCACCGTATTACATCCTGCGGCCGGAGACGCTGGAGAGCTTGTACTACGCATACCGCGTCACGGGCGACTCCAAGTGGCAGGACCTGGCGTGGGAAGCGTTGAGTGCCATTGAGGACGCATGCCGCGCCGGCAGCGCGTACTCGTCCATCAACGACGTGACGCAGGCCAACGGCGGGGGTGCCTCTGACGATATGGAGAGCTTCTGGTTTGCCGAGGCGCTCAAGTATGCGTACCTGATCTTTGCGGAGGAGTCGGATGTGCAGGTGCAGGCCACCGGCGGGAACAAATTTGTCTTTAACACGGAGGCGCACCCCTTTAGCATCCGTTCATCATCACGACGGGGCGGCCACCTTGCTCACGACGAGTTGTAATCTAGGGCGGCCGCCAGCTTTCTAGAGAACAAAAACTCATCTCAGAAGAGGATCTGAATAGCGCCGTCGACCATCATCATCATCATCATTGAGTTTGTAGCCTTAGACATGACTGTTCCTCAGTTCAAGTTGGGCACTTACGAGAAGACCGGTCTTGCTAGATTCTAATCAAGAGGATGTCAGAATGCCATTTGCCTGAGAGATGCAGGCTTCATTTTTGATACTTTTTTATTTGTAACCTATATAGTATAGGATTTTTTTTGTCATTTTGTTTCTTCTCGTACGAGCTTGCTCCTGATCAGCCTATCTCGCAGCTGATGAATATCTTGTGGTAGGGGTTTGGGAAAATCATTCGAGTTTGATGTTTTTCTTGGTATTTCCCACTCCTCTTCAGAGTACAGAAGATTAAGTGAGACCTTCGTTTGTGCGGATCCCCCACACACCATAGCTTCAAAATGTTTCTACTCCTTTTTTACTCTTCCAGATTTTCTCGGACTCCGCGCATCGCCGTACCACTTCAAAACACCCAAGCACAGCATACTAAATTTTCCCTCTTTCTTCCTCTAGGGTGTCGTTAATTACCCGTACTAAAGGTTTGGAAA GAAAAAAGAGACCGCCTCGTTTCTTTTTCTTCGTCGAAAAAGGCAATAAAAATTTTTATCACGTTTCTTTTTCTTGAAATTTTTTTTTTTAGTTTTTTTCTCTTTCAGTGACCTCCATTGATATTTAAGTTAATAAACGGTCTTCAATTTCTCAAGTTTCAGTTTCATTTTTCTTGTTCTATTACAACTTTTTTTACTTCTTGTTCATTAGAAAGAAAGCATAGCAATCTAATCTAAGGGGCGGTGTTGACAATTAATCATCGGCATAGTATATCGGCATAGTATAATACGACAAGGTGAGGAACTAAACCATGGCCAAGTTGACCAGTGCCGTTCCGGTGCTCACCGCGCGCGACGTCGCCGGAGCGGTCGAGTTCTGGACCGACCGGCTCGGGTTCTCCCGGGACTTCGTGGAGGACGACTTCGCCGGTGTGGTCCGGGACGACGTGACCCTGTTCATCAGCGCGGTCCAGGACCAGGTGGTGCCGGACAACACCCTGGCCTGGGTGTGGGTGCGCGGCCTGGACGAGCTGTACGCCGAGTGGTCGGAGGTCGTGTCCACGAACTTCCGGGACGCCTCCGGGCCGGCCATGACCGAGATCGGCGAGCAGCCGTGGGGGCGGGAGTTCGCCCTGCGCGACCCGGCCGGCAACTGCGTGCACTTCGTGGCCGAGGAGCAGGACTGACACGTCCGACGGCGGCCCACGGGTCCCAGGCCTCGGAGATCCGTCCCCCTTTTCCTTTGTCGATATCATGTAATTAGTTATGTCACGCTTACATTCACGCCCTCCCCCCACATCCGCTCTAACCGAAAAGGAAGGAGTTAGACAACCTGAAGTCTAGGTCCCTATTTATTTTTTTATAGTTATGTTAGTATTAAGAACGTTATTTATATTTCAAATTTTTCTTTTTTTTCTGTACAGACGCGTGTACGCATGTAACATTATACTGAAAACCTTGCTTGAGAAGGTTTTGGGACGCTCGAAGGCTTTAATTTGCAAGCTGGAGACCAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCAATGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGGACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATCSEQ ID NO10釀酒酵母Kre2蛋白質MALFLSKRLLRFTVIAGAVIVLLLTLNSNSRTQQYIPSSIAAFDFTSGSISPEQQVISEENDAKKLEQSALNSEASEDSEAMDEESKALKAAAEKADAPIDTKTTMDYITPSFANKAGKPKACYVTLVRNKELKGLLSSIKYVENKINKKFPYPWVFLNDEPFTEEFKEAVTKAVSSEVKFGILPKEHWSYPEWINQTKAAEIRADAATKYIYGGSESYRHMCRYQSGFFWRHELLEEYDWYWRVEPDIKLYCDINYDVFKWMQENEKVYGFTVSIHEYEVTIPTLWQTSMDFIKKNPEYLDENNLMSFLSNDNGKTYNLCHFWSNFEIANLNLWRSPAYREYFDTLDHQGGFFY
ERWGDAPVHSIAAALFLPKDKIHYFSDIGYHHPPYDNCPLDKEVYNSNNCECDQGNDFTFQGYSCGKEYYDAQGLVKPKNWKKFRESEQ ID NO11釀灑酵母Kre2高爾基體定位信號(前100個氨基酸)MALFLSKRLLRFTVIAGAVIVLLLTLNSNSRTQQYIPSSISAAFDFTSGSISPEQQVISEENDAKKLEQSALNSEASEDSEAMDEESKALKAAAEKADAPSEQ ID NO12人類GnTI cDNAATGCTGAAGAAGCAGTCTGCAGGGCTTGTGCTGTGGGGCGCTATCCTCTTTGTGGCCTGGAATGCCCTGCTGCTCCTCTTCTTCTGGACGCGCCCAGCACCTGGCAGGCCACCCTCAGTCAGCGCTCTCGATGGCGACCCCGCCAGCCTCACCCGGGAAGTGATTCGCCTGGCCCAAGACGCCGAGGTGGAGCTGGAGCGGCAGCGTGGGCTGCTGCAGCAGATCGGGGATGCCCTGTCGAGCCAGCGGGGGAGGGTGCCCACCGCGGCCCCTCCCGCCCAGCCGCGTGTGCCTGTGACCCCCGCGCCGGCGGTGATTCCCATCCTGGTCATCGCCTGTGACCGCAGCACTGTTCGGCGCTGCCTGGACAAGCTGCTGCATTATCGGCCCTCGGCTGAGCTCTTCCCCATCATCGTTAGCCAGGACTGCGGGCACGAGGAGACGGCCCAGGCCATCGCCTCCTACGGCAGCGCGGTCACGCACATCCGGCAGCCCGACCTGAGCAGCATTGCGGTGCCGCCGGACCACCGCAAGTTCCAGGGCTACTACAAGATCGCGCGCCACTACCGCTGGGCGCTGGGCCAGGTCTTCCGGCAGTTTCGCTTCCCCGCGGCCGTGGTGGTGGAGGATGACCTGGAGGTGGCCCCGGACTTCTTCGAGTACTTTCGGGCCACCTATCCGCTGCTGAAGGCCGACCCCTCCCTGTGGTGCGTCTCGGCCTGGAATGACAACGGCAAGGAGCAGATGGTGGACGCCAGCAGGCCTGAGCTGCTCTACCGCACCGACTTTTTCCCTGGCCTGGGCTGGCTGCTGTTGGCCGAGCTCTGGGCTGAGCTGGAGCCCAAGTGGCCAAAGGCCTTCTGGGACGACTGGATGCGGCGGCCGGAGCAGCGGCAGGGGCGGGCCTGCATACGCCCTGAGATCTCAAGAACGATGACCTTTGGCCGCAAGGGTGTGAGCCACGGGCAGTTCTTTGACCAGCACCTCAAGTTTATCAAGCTGAACCAGCAGTTTGTGCACTTCACCCAGCTGGACCTGTCTTACCTGCAGCGGGAGGCCTATGACCGAGATTTCCTCGCCCGCGTCTACGGTGCTCCCCAGCTGCAGGTGGAGAAAGTGAGGACCAATGACCGGAAGGAGCTGGGGGAGGTGCGGGTGCAGTATACGGGCAGGGACAGCTTCAAGGCTTTCGCCAAGGCTCTGGGTGTCATGGATGACCTTAAGTCGGGGGTTCCGAGAGCTGGCTACCGGGGTATTGTCACCTTCCAGTTCCGGGGCCGCCGTGTCCACCTGGCGCCCCCACCGACGTGGGAGGGCTATGATCCTAGCTGGAATATGCTGAAGAAGCAGTCTGCAGGGCTTGTGCTGTGGGGCGCTATCCTCTTTGTGGCCTGGAATGCCCTGCTGCTCCTCTTCTTCTGGACGCGCCCAGCACCTGGCAGGCCACCCTCAGTCAGCGCTCTCGATGGCGACCCCGCCAGCCTCACCCGGGAAGTGATTCGCCTGGCCCAAGACGCCGAGGTGGAGCTGGAGCGGCAGCGTGGGCTGCTGCAGCAGATCGGGGATGCCCTGTCGAGCCAGCGGGGGAGGGTGCCCACCGCGGCCCCTCCCGCCCAGCCGCGTGTGCCTGTGACCCCCGCGCCGGCGGTGATTCCCATCCTGGTCATCGCCTGTGACCGCAGCACTGTTCGGCGCTGCCTGGACAAGCTGCTGCATTATCGGCCCTCGGCTGAGCTCTTCCCCATCATCGTTAGCCAGGACTGCGGGCACGAGGAGACGGCCCAGGCCATCGCCTCCTACGGCAGCGCGGTCACGCACATCCGGCAGCCCGACCTGAGCAGCATTGCGGTGCCGCCGGACCACCGCAAGTTCCAGGGCTACTACAAGATCGCGCGCCACTACCGCTGGGCGCTGGGCCAGGTCTTCCGGCAGTTTCGCTTCCCCGCGGCCGTGGTGGTGGAGGATGACCTGGAGGTGGCCCCGGACTTCTTCGAGTACTTTCGGGCCACCTATCCGCTGCTGAAGGCCGACCCCTCCCTGTGGTGCGTCTCGGCCTGGAATGACAACGGCAAGGAGCAGATGGTGGACGCCAGCAGGCCTGAGCTGCTCTACCGCACCGACTTTTTCCCTGGCCTGGGCTGGCTGCTGTTGGCCGAGCTCTGGGCTGAGCTGGAGCCCAAGTGGCCAAAGGCCTTCTGGGACGACTGGATGCGGCGGCCGGAGCAGCGGCAGGGGCGGGCCTGCATACGCCCTGAGATCTCAAGAACGATGACCTTTGGCCGCAAGGGTGTGAGCCACGGGCAGTTCTTTGACCAGCACCTCAAGTTTATCAAGCTGAACCAGCAGTTTGTGCACTTCACCCAGCTGGACCTGTCTTACCTGCAGCGGGAGGCCTATGACCGAGATTTCCTCGCCCGCGTCTACGGTGCTCCCCAGCTGCAGGTGGAGAAAGTGAGGACCAATGACCGGAAGGAGCTGGGGGAGGTGCGGGTGCAGTATACGGGCAGGGACAGCTTCAAGGCTTTCGCCAAGGCTCTGGGTGTCATGGATGACCTTAAGTCGGGGGTTCCGAGAGCTGGCTACCGGGGTATTGTCACCTTCCAGTTCCGGGGCCGCCGTGTCCACCTGGCGCCCCCACCGACGTGGGAGGGCTATGATCCTAGCTGGAATSEQ ID NO13人類GnTI蛋白質1MLKKQSAGLV LWGAILFVAW NALLLLFFWT RPAPGRPPSV SALDGDPASL TREVIRLAQD61AEVELERQRG LLQQIGDALS SQRGRVPTAA PPAQPRVPVT PAPAVIPILV IACDRSTVRR121CLDKLLHYRP SAELFPIIVS QDCGHEETAQ AIASYGSAVT HIRQPDLSSI AVPPDHRKFQ
181GYYKIARHYR WALGQVFRQF RFPAAVVVED DLEVAPDFFE YFRATYPLLK ADPSLWCVSA241WNDNGKEQMV DASRPELLYR TDFFPGLGWL LLAELWAELE PKWPKAFWDD WMRRPEQRQG301RACIRPEISR TMTFGRKGVS HGQFFDQHLK FIRLNQQFVH FTQLDLSYLQ REAYDRDFLA361RVYGAPQLQV EKVRTNDRKE LGEVRVQYTG RDSFKAFAKA LGVMDDLKSG VPRAGYRGIV421TFQFRGRRVH LAPPPTWEGY DPSWNSEQ ID NO14pPIC6AKrecoGnTIGAAATTTTTTTTTTTAGTTTTTTTCTCTTTCAGTGACCTCCATTGATATTTAAGTTAATAAACGGTCTTCAATTTCTCAAGTTTCAGTTTCATTTTTCTTGTTCTATTACAACTTTTTTTACTTCTTGTTCATTAGAAAGAAAGCATAGCAATCTAATCTAAGGGGCGGTGTTGACAATTAATCATCGGCATAGTATATCGGCATAGTATAATACGACAAGGTGAGGAACTAAACCATGGCCAAGCCTTTGTCTCAAGAAGAATCCACCCTCATTGAAAGAGCAACGGCTACAATCAACAGCATCCCCATCTCTGAAGACTACAGCGTCGCCAGCGCAGCTCTCTCTAGCGACGGCCGCATCTTCACTGGTGTCAATGTATATCATTTTACTGGGGGACCTTGTGCAGAACTCGTGGTGCTGGGCACTGCTGCTGCTGCGGCAGCTGGCAACCTGACTTGTATCGTCGCGATCGGAAATGAGAACAGGGGCATCTTGAGCCCCTGCGGACGGTGCCGACAGGTGCTTCTCGATCTGCATCCTGGGATCAAAGCCATAGTGAAGGACAGTGATGGACAGCCGACGGCAGTTGGGATTCGTGAATTGCTGCCCTCTGGTTATGTGTGGGAGGGCTAAGCACTTCGTGGCCGAGGAGCAGGACTGACACGTCCGACGGCGGCCCACGGGTCCCAGGCCTCGGAGATCCGTCCCCCTTTTCCTTTGTCGATATCATGTAATTAGTTATGTCACGCTTACATTCACGCCCTCCCCCCACATCCGCTCTAACCGAAAAGGAAGGAGTTAGACAACCTGAAGTCTAGGTCCCTATTTATTTTTTTATAGTTATGTTAGTATTAAGAACGTTATTTATATTTCAAATTTTTCTTTTTTTTCTGTACAGACGCGTGTACGCATGTAACATTATACTGAAAACCTTGCTTGAGAAGGTTTTGGGACGCTCGAAGGCTTTAATTTGCAAGCTGGAGACCAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCAATGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGGACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATCAGATCTAACATCCAAAGACGAAAGGTTGAATGAAACCTTTTTGCCATCCGACATCCACAGGTCCATTCTCACACATAAGTGCCAAACGCAACAGGAGGGGATACACTAGCAGCAGACCGTTGCAAACGCAGGACCTCCACTCCTCTTCTCCTCAACACCCACTTTTGCCATCGAAAAACCAGCCCAGTTATTGGGGTTGATTGGAGCTCGCTCATTCCAATTCCTTCTATTAGGCTACTAACACCATGACTTTATTAGCCTGTCTATCCTGGCCCCCCTGGCGAGGTTCATGTTTGTTTATTTCCGAATGCAACAAGCTCCGCATTACACCCGAACATCACTCCAGATGAGGGCTTTCTGAGTGTGGGGTCAAATAGTTTCATGTTCCCCAAATGGCCCAAAACTGACAGTTTAAACGCTGTCTTGGAACCTAATATGACAAAAGCGTGATCTCATCCAAGATGAACTAAGTTTGGTTCGTTGAAATGCTAACGGCCAGTTGGTCAAAAAGAAACTTCCAAAAGTCGGCATACCGTTTGTCTTGTTTGGTATTGATTGACGAATGCTCAAAAATAATCTCATTAATGCTTAGCGCAGTCTCTCTATCGCTTCTGAACCCCGGTGCACCTGTGCCGAAACGCAAATGGGGAAACACCCGCTTTTTGGATGATTATGCATTGTCTCCACATTGTATGCTTCCAAGATTCTGGTGGGAATACTGCTGATAGCCTAACGTTCATGATCAAAATTTAACTGTTCTAACCCCTACTTGACAGCAATATATAAACAGAAGGAAGCTGCCCTGTCTTAAACCTTTTTTTTTATCATCATTATTAGCTTACTTTCATAATTGCGACTGGTTCCAATTGACAAGCTTTTGATTTTAACGACTTTTAACGACAACTTGAGAAGATCAAAAAACAACTAATTATTCGAAACGAGGAATTATCCATATTCGCAAGCAGTTCCACTCGAAAGCATGGCCCTCTTTCTCAGTAAGAGACTGTTGAGATTTACCGTCATTGCAGGTGCGGTTATTGTTCTCCTCCTAACATTGAATTCCAACAGTAGAACTCAGCAATATATTCCGAGTTCCATCTCCGCTGCATTTGATTTTACCTCAGGATCTATATCCCCTGAACAACAAGTCATCTCTGAGGAAAATGATGCTAAAAAATTAGAGCAAAGTGCTCTGAATTCAGAGGCAAGCGAAGACTCCGAAGCCATGGATGAAGAATCCAAGGCTCTGAAAGCTGCCGCTGAAAAGGCAGATGCCCCGCCGGCGGTGATTCCCATCCTGGTCATCGCCTGTGACCGCAGCACTGTTCGGCGCTGCCTGGACAAGCTGCTGCATTATCGGCCCTCGGCTGAGCTCTTCCCCATCATCGTTAGCCAGGACTGCGGG
CACGAGGAGACGGCCCAGGCCATCGCCTCCTACGGCAGCGCGGTCACGCACATCCGGCAGCCCGACCTGAGCAGCATTGCGGTGCCGCCGGACCACCGCAAGTTCCAGGGCTACTACAAGATCGCGCGCCACTACCGCTGGGCGCTGGGCCAGGTCTTCCGGCAGTTTCGCTTCCCCGCGGCCGTGGTGGTGGAGGATGACCTGGAGGTGGCCCCGGACTTCTTCGAGTACTTTCGGGCCACCTATCCGCTGCTGAAGGCCGACCCCTCCCTGTGGTGCGTCTCGGCCTGGAATGACAACGGCAAGGAGCAGATGGTGGACGCCAGCAGGCCTGAGCTGCTCTACCGCACCGACTTTTTCCCTGGCCTGGGCTGGCTGCTGTTGGCCGAGCTCTGGGCTGAGCTGGAGCCCAAGTGGCCAAAGGCCTTCTGGGACGACTGGATGCGGCGGCCGGAGCAGCGGCAGGGGCGGGCCTGCATACGCCCTGAGATCTCAAGAACGATGACCTTTGGCCGCAAGGGTGTGAGCCACGGGCAGTTCTTTGACCAGCACCTCAAGTTTATCAAGCTGAACCAGCAGTTTGTGCACTTCACCCAGCTGGACCTGTCTTACCTGCAGCGGGAGGCCTATGACCGAGATTTCCTCGCCCGCGTCTACGGTGCTCCCCAGCTGCAGGTGGAGAAAGTGAGGACCAATGACCGGAAGGAGCTGGGGGAGGTGCGGGTGCAGTATACGGGCAGGGACAGCTTCAAGGCTTTCGCCAAGGCTCTGGGTGTCATGGATGACCTTAAGTCGGGGGTTCCGAGAGCTGGCTACCGGGGTATTGTCACCTTCCAGTTCCGGGGCCGCCGTGTCCACCTGGCGCCCCCACCGACGTGGGAGGGCTATGATCCTAGCTGGAATTAGCACCTGTCGACTGGAGACCTGCAGGCATGCAAGCTTCGACCATCATCATCATCATCATTGAGTTTGTAGCCTTAGACATGACTGTTCCTCAGTTCAAGTTGGGCACTTACGAGAAGACCGGTCTTGCTAGATTCTAATCAAGAGGATGTCAGAATGCCATTTGCCTGAGAGATGCAGGCTTCATTTTTGATACTTTTTTATTTGTAACCTATATAGTATAGGATTTTTTTTGTCATTTTGTTTCTTCTCGTACGAGCTTGCTCCTGATCAGCCTATCTCGCAGCTGATGAATATCTTGTGGTAGGGGTTTGGGAAAATCATTCGAGTTTGATGTTTTTCTTGGTATTTCCCACTCCTCTTCAGAGTACAGAAGATTAAGTGAGACCTTCGTTTGTGCGGATCCCCCACACACCATAGCTTCAAAATGTTTCTACTCCTTTTTTACTCTTCCAGATTTTCTCGGACTCCGCGCATCGCCGTACCACTTCAAAACACCCAAGCACAGCATACTAAATTTTCCCTCTTTCTTCCTCTAGGGTGTCGTTAATTACCCGTACTAAAGGTTTGGAAAAGAAAAAAGAGACCGCCTCGTTTCTTTTTCTTCGTCGAAAAAGGCAATAAAAATTTTTATCACGTTTCTTTTTCTTSEQ ID NO155′TTCGAAGCTTCGCTAGCTCGGTGTCCCGATGTCSEQ ID NO165′GAATTCGAAGGGAAGATGAGGCTTCGGGAGCCSEQ ID NO175′CGTTCGCGACCGGAGGGGCCCGGCCGCCSEQ ID NO185′TCGATATCAAGCTTAGCTCGGTGTCCCGATGTCSEQ ID NO195′GAATTCGAACTTAAGATGGCCCTCTTTCTCAGTAAGSEQ ID NO20人類GalT1 cDNAATGAGGCTTCGGGAGCCGCTCCTGAGCGGCGCCGCGATGCCAGGCGCGTCCCTACAGCGGGCCTGCCGCCTGCTCGTGGCCGTCTGCGTCTGGCACCTTGGCGTCACCCTCGTTTACTACCTGGCTGGCCGCGACCTGAGCCGCCTGCCCCAACTGGTCGGAGTCTCCACACCGCTGCAGGGCGGCTCGAACAGTGCCGCCGCCATCGGGCAGTCCTCCGGGGAGCTCCGGACCGGAGGGGCCCGGCCGCCGCCTCCTCTAGGCGCCTCCTCCCAGCCGCGCCCGGGTGGCGACTCCAGCCCAGTCGTGGATTCTGGCCCTGGCCCCGCTAGCAACTTGACCTCGGTCCCAGTGCCCCACACCACCGCACTGTCGCTGCCCGCCTGCCCTGAGGAGTCCCCGCTGCTTGTGGGCCCCATGCTGATTGAGTTTAACATGCCTGTGGACCTGGAGCTCGTGGCAAAGCAGAACCCAAATGTGAAGATGGGCGGCCGCTATGCCCCCAGGGACTGCGTCTCTCCTCACAAGGTGGCCATCATCATTCCATTCCGCAACCGGCAGGAGCACCTCAAGTACTGGCTATATTATTTGCACCCAGTCCTGCAGCGCCAGCAGCTGGACTATGGCATCTATGTTATCAACCAGGCGGGAGACACTATATTCAATCGTGCTAAGCTCCTCAATGTTGGCTTTCAAGAAGCCTTGAAGGACTATGACTACACCTGCTTTGTGTTTAGTGACGTGGACCTCATTCCAATGAATGACCATAATGCGTACAGGTGTTTTTCACAGCCACGGCACATTTCCGTTGCAATGGATAAGTTTGGATTCAGCCTACCTTATGTTCAGTATTTTGGAGGTGTCTCTGCTCTAAGTAAACAACAGTTTCTAACCATCAATGGATTTCCTAATAATTATTGGGG
CTGGGGAGGAGAAGATGATGACATTTTTAACAGATTAGTTTTTAGAGGCATGTCTATATCTCGCCCAAATGCTGTGGTCGGGAGGTGTCGCATGATCCGCCACTCAAGAGACAAAAAAAATGAACCCAATCCTCAGAGGTTTGACCGAATTGCACACACAAAGGAGACAATGCTCTCTGATGGTTTGAACTCACTCACCTACCAGGTGCTGGATGTACAGAGATACCCATTGTATACCCAAATCACAGTGGACATCGGGACACCGAGCSEQ ID NO21人類GalT1蛋白質MRLREPLLSGAAMPGASLQRACRLLVAVCVWHLGVTLVYYLAGRDLSRLPQLVGVSTPLQGGSNSAAAIGQSSGELRTGGARPPPPLGASSQPRPGGDSSPVVDSGPGPASNLTSVPVPHTTALSLPACPEESPLLVGPMLIEFNMPVDLELVAKQNPNVKMGGRYAPRDCVSPHKVAIIIPFRNRQEHLKYWLYYLHPVLQRQQLDYGIYVINQAGDTIFNRAKLLNVGFQEALKDYDYTCFVFSDVDLIPMNDHNAYRCFSQPRHISVAMDKFGFSLPYVQYFGGVSALSKQQFLTINGFPNNYWGWGGEDDDIFNRLVFRGMSISRPNAVVGRCRMIRHSRDKKNEPNPQRFDRIAHTKETMLSDGLNSLTYQVLDVQRYPLYTQITVDIGTPS
序列表<110>羅蘭德·孔特雷拉斯尼科·L·M·卡勒瓦特沃特·韋爾夫肯弗拉迪米爾·凱戈羅多夫<120>甲基營養(yǎng)型酵母中蛋白質糖基化修飾<130>17106<140>10/713,970<141>2003-11-14<160>21<170>PatentIn version 3.2<210>1<211>4<212>PRT<213>人工的序列<220>
<223>ER-定位信號<400>1His Asp Glu Leu1<210>2<211>2858<212>DNA<213>巴斯德畢赤酵母<400>2agatctgcct gacagcctta aagagcccgc taaaagaccc ggaaaaccga gagaactctg 60gattagcagt ctgaaaaaga atcttcactc tgtctagtgg agcaattaat gtcttagcgg120cacttcctgc tactccgcca gctactcctg aatagatcac atactgcaaa gactgcttgt180cgatgacctt ggggttattt agcttcaagg gcaatttttg ggacattttg gacacaggag240actcagaaac agacacagag cgttctgagt cctggtgctc ctgacgtagg cctagaacag300gaattattgg ctttatttgt ttgtccattt cataggcttg gggtaataga tagatgacag360agaaatagag aagacctaat attttttgtt catggcaaat cgcgggttcg cggtcgggtc420acacacggag aagtaatgag aagagctggt aatctggggt aaaagggttc aaaagaaggt480cgcctggtag ggatgcaata caaggttgtc ttggagttta cattgaccag atgatttggc540tttttctctg ttcaattcac atttttcagc gagaatcgga ttgacggaga aatggcgggg600tgtggggtgg atagatggca gaaatgctcg caatcaccgc gaaagaaaga ctttatggaa660tagaactact gggtggtgta aggattacat agctagtcca atggagtccg ttggaaaggt720aagaagaagc taaaaccggc taagtaacta gggaagaatg atcagacttt gatttgatga780
ggtctgaaaa tactctgctg ctttttcagt tgctttttcc ctgcaaccta tcattttcct 840tttcataagc ctgccttttc tgttttcact tatatgagtt ccgccgagac ttccccaaat 900tctctcctgg aacattctct atcgctctcc ttccaagttg cgccccctgg cactgcctag 960taatattacc acgcgactta tattcagttc cacaatttcc agtgttcgta gcaaatatca1020tcagccatgg cgaaggcaga tggcagtttg ctctactata atcctcacaa tccacccaga1080aggtattact tctacatggc tatattcgcc gtttctgtca tttgcgtttt gtacggaccc1140tcacaacaat tatcatctcc aaaaatagac tatgatccat tgacgctccg atcacttgat1200ttgaagactt tggaagctcc ttcacagttg agtccaggca ccgtagaaga taatcttcga1260agacaattgg agtttcattt tccttaccgc agttacgaac cttttcccca acatatttgg1320caaacgtgga aagtttctcc ctctgatagt tcctttccga aaaacttcaa agacttaggt1380gaaagttggc tgcaaaggtc cccaaattat gatcattttg tgatacccga tgatgcagca1440tgggaactta ttcaccatga atacgaacgt gtaccagaag tcttggaagc tttccacctg1500ctaccagagc ccattctaaa ggccgatttt ttcaggtatt tgattctttt tgcccgtgga1560ggactgtatg ctgacatgga cactatgtta ttaaaaccaa tagaatcgtg gctgactttc1620aatgaaacta ttggtggagt aaaaaacaat gctgggttgg tcattggtat tgaggctgat1680cctgatagac ctgattggca cgactggtat gctagaagga tacaattttg ccaatgggca1740attcagtcca aacgaggaca cccagcactg cgtgaactga ttgtaagagt tgtcagcacg1800actttacgga aagagaaaag cggttacttg aacatggtgg aaggaaagga tcgtggaagt1860gatgtgatgg actggacggg tccaggaata tttacagaca ctctatttga ttatatgact1920aatgtcaata caacaggcca ctcaggccaa ggaattggag ctggctcagc gtattacaat1980gccttatcgt tggaagaacg tgatgccctc tctgcccgcc cgaacggaga gatgttaaaa2040gagaaagtcc caggtaaata tgcacagcag gttgttttat gggaacaatt taccaacctg2100cgctccccca aattaatcga cgatattctt attcttccga tcaccagctt cagtccaggg2160attggccaca gtggagctgg agatttgaac catcaccttg catatattag gcatacattt2220gaaggaagtt ggaaggacta aagaaagcta gagtaaaata gatatagcga gattagagaa2280tgaatacctt cttctaagcg atcgtccgtc atcatagaat atcatggact gtatagtttt2340ttttttgtac atataatgat taaacggtca tccaacatct cgttgacaga tctctcagta2400cgcgaaatcc ctgactatca aagcaagaac cgatgaagaa aaaaacaaca gtaacccaaa2460caccacaaca aacactttat cttctccccc ccaacaccaa tcatcaaaga gatgtcggaa2520cacaaacacc aagaagcaaa aactaacccc atataaaaac atcctggtag ataatgctgg2580taacccgctc tccttccata ttctgggcta cttcacgaag tctgaccggt ctcagttgat2640caacatgatc ctcgaaatgg gtggcaagca tcgttccaga cctgcctcct ctggtagatg2700
gagtgttgtt tttgacaggg gattacaagt ctattgatga agatacccta aagcaactgg2760gggacgttcc aatatacaga gactccttca tctaccagtg ttttgtgcac aagacatctc2820ttcccattga cactttccga attgacaaga acgtcgac2858<210>3<211>404<212>PRT<213>巴斯德畢赤酵母<400>3Met Ala Lys Ala Asp Gly Ser Leu Leu Tyr Tyr Asn Pro His Asn Pro1 5 10 15Pro Arg Arg Tyr Tyr Phe Tyr Met Ala Ile Phe Ala Val Ser Val Ile20 25 30Cys Val Leu Tyr Gly Pro Ser Gln Gln Leu Ser Ser Pro Lys Ile Asp35 40 45Tyr Asp Pro Leu Thr Leu Arg Ser Leu Asp Leu Lys Thr Leu Glu Ala50 55 60Pro Ser Gln Leu Ser Pro Gly Thr Val Glu Asp Asn Leu Arg Arg Gln65 70 75 80Leu Glu Phe His Phe Pro Tyr Arg Ser Tyr Glu Pro Phe Pro Gln His85 90 95Ile Trp Gln Thr Trp Lys Val Ser Pro Ser Asp Ser Ser Phe Pro Lys100 105 110Asn Phe Lys Asp Leu Gly Glu Ser Trp Leu Gln Arg Ser Pro Asn Tyr115 120 125Asp His Phe Val Ile Pro Asp Asp Ala Ala Trp Glu Leu Ile His His130 135 140Glu Tyr Glu Arg Val Pro Glu Val Leu Glu Ala Phe His Leu Leu Pro145 150 155 160Glu Pro Ile Leu Lys Ala Asp Phe Phe Arg Tyr Leu Ile Leu Phe Ala165 170 175Arg Gly Gly Leu Tyr Ala Asp Met Asp Thr Met Leu Leu Lys Pro Ile180 185 190Glu Ser Trp Leu Thr Phe Asn Glu Thr Ile Gly Gly Val Lys Asn Asn195 200 205
Ala Gly Leu Val Ile Gly Ile Glu Ala Asp Pro Asp Arg Pro Asp Trp210 215 220His Asp Trp Tyr Ala Arg Arg Ile Gln Phe Cys Gln Trp Ala Ile Gln225 230 235 240Ser Lys Arg Gly His Pro Ala Leu Arg Glu Leu Ile Val Arg Val Val245 250 255Ser Thr Thr Leu Arg Lys Glu Lys Ser Gly Tyr Leu Asn Met Val Glu260 265 270Gly Lys Asp Arg Gly Ser Asp Val Met Asp Trp Thr Gly Pro Gly Ile275 280 285Phe Thr Asp Thr Leu Phe Asp Tyr Met Thr Asn Val Asn Thr Thr Gly290 295 300His Ser Gly Gln GlyIle Gly Ala Gly Ser Ala Tyr Tyr Asn Ala Leu305 310 315 320Ser Leu Glu Glu Arg Asp Ala Leu Ser Ala Arg Pro Asn Gly Glu Met325 330 335Leu Lys Glu Lys Val Pro Gly Lys Tyr Ala Gln Gln Val Val Leu Trp340 345 350Glu Gln Phe Thr Asn Leu Arg Ser Pro Lys Leu Ile Asp Asp Ile Leu355 360 365Ile Leu Pro Ile Thr Ser Phe Ser Pro Gly Ile Gly His Ser Gly Ala370 375 380Gly Asp Leu Asn His His Leu Ala Tyr Ile Arg His Thr Phe Glu Gly385 390 395 400Ser Trp Lys Asp<210>4<211>43<212>DNA<213>人工的序列<220>
<223>寡核苷酸引物<400>4ggaattcagc atggagtatg gatcatggag tccgttggaa agg 43
<210>5<211>27<212>DNA<213>人工的序列<220>
<223>寡核苷酸引物<400>5gccgctcgag ctagctttct ttagtcc 27<210>6<211>2875<212>DNA<213>人工的序列<220>
<223>質粒pGlycoSwitchM8的核苷酸序列<400>6agatctaaca tccataatcg atctaagcta tattcgccgt ttctgtcatt tgcgttttgt 60acggaccctc acaacaatta tcatctccaa aaatagacta tgatccattg acgctccgat 120cacttgattt gaagactttg gaagctcctt cacagttgag tccaggcacc gtagaagata 180atcttcgaag acaattggag tttcattttc cttaccgcag ttacgaacct tttccccaac 240atatttggca aacgtggaaa gtttctccct ctgatagttc ctttccgaaa aacttcaaag 300acttaggtga aagttggctg caaaggtccc caaattatga tcattttgtg atacccgatg 360atgcagcatg ggaacttatt caccatgaat acgaacgtgt accagaagtc ttggaagctt 420ttgattttaa cgacttttaa cgacaacttg agaagatcaa aaaacaacta attattcgcg 480aaacgaggaa ttcacgtggc ccagccggcc gtctcggatc ggtacctcga gccgcggcgg 540ccgccagctt tctagagaac aaaaactcat ctcagaagag gatctgaata gcgccgtcga 600ccatcatcat catcatcatt gagtttgtag ccttagacat gactgttcct cagttcaagt 660tgggcactta cgagaagacc ggtcttgcta gattctaatc aagaggatgt cagaatgcca 720tttgcctgag agatgcaggc ttcatttttg atactttttt atttgtaacc tatatagtat 780aggatttttt ttgtcatttt gtttcttctc gtacgagctt gctcctgatc agcctatctc 840gcagctgatg aatatcttgt ggtaggggtt tgggaaaatc attcgagttt gatgtttttc 900ttggtatttc ccactcctct tcagagtaca gaagattaag tgagaccttc gtttgtgcgg 960atcccccaca caccatagct tcaaaatgtt tctactcctt ttttactctt ccagattttc1020tcggactccg cgcatcgccg taccacttca aaacacccaa gcacagcata ctaaattttc1080cctctttctt cctctagggt gtcgttaatt acccgtacta aaggtttgga aaagaaaaaa1140gagaccgcct cgtttctttt tcttcgtcga aaaaggcaat aaaaattttt atcacgtttc1200tttttcttga aatttttttt tttagttttt ttctctttca gtgacctcca ttgatattta1260
agttaataaa cggtcttcaa tttctcaagt ttcagtttca tttttcttgt tctattacaa1320ctttttttac ttcttgttca ttagaaagaa agcatagcaa tctaatctaa ggggcggtgt1380tgacaattaa tcatcggcat agtatatcgg catagtataa tacgacaagg tgaggaacta1440aaccatggcc aagttgacca gtgccgttcc ggtgctcacc gcgcgcgacg tcgccggagc1500ggtcgagttc tggaccgacc ggctcgggtt ctcccgggac ttcgtggagg acgacttcgc1560cggtgtggtc cgggacgacg tgaccctgtt catcagcgcg gtccaggacc aggtggtgcc1620ggacaacacc ctggcctggg tgtgggtgcg cggcctggac gagctgtacg ccgagtggtc1680ggaggtcgtg tccacgaact tccgggacgc ctccgggccg gccatgaccg agatcggcga1740gcagccgtgg gggcgggagt tcgccctgcg cgacccggcc ggcaactgcg tgcacttcgt1800ggccgaggag caggactgac acgtccgacg gcggcccacg ggtcccaggc ctcggagatc1860cgtccccctt ttcctttgtc gatatcatgt aattagttat gtcacgctta cattcacgcc1920ctccccccac atccgctcta accgaaaagg aaggagttag acaacctgaa gtctaggtcc1980ctatttattt ttttatagtt atgttagtat taagaacgtt atttatattt caaatttttc2040ttttttttct gtacagacgc gtgtacgcat gtaacattat actgaaaacc ttgcttgaga2100aggttttggg acgctcgaag gctttaattt gcaagctgga gaccaacatg tgagcaaaag2160gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc2220gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag2280gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga2340ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc2400aatgctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg2460tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat cgtcttgagt2520ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac aggattagca2580gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac tacggctaca2640ctagaaggac agtatttggt atctgcgctc tgctgaagcc agttaccttc ggaaaaagag2700ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt tttgtttgca2760agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg2820ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg agatc 2875<210>7<211>6406<212>DNA<213>人工的序列<220>
<223>質粒pBlKanMX4KrehGalT的核苷酸序列
<400>7ctagtgcaca aacgaacgtc tcacttaatc ttctgtactc tgaagaggag tgggaaatac 60caagaaaaac atcaaactcg aatgattttc ccaaacccct accacaagat attcatcagc 120tgcgagatag gctgatcagg agcaagctcg tacgagaaga aacaaaatga caaaaaaaat 180cctatactat ataggttaca aataaaaaag tatcaaaaat gaagcctgca tctctcaggc 240aaatggcatt ctgacatcct cttgattaga atctagcaag accggtcttc tcgtaagtgc 300ccaacttgaa ctgaggaaca gtcatgtcta aggcgaatta tcaagcttag ctcggtgtcc 360cgatgtccac tgtgatttgg gtatacaatg ggtatctctg tacatccagc acctggtagg 420tgagtgagtt caaaccatca gagagcattg tctcctttgt gtgtgcaatt cggtcaaacc 480tctgaggatt gggttcattt tttttgtctc ttgagtggcg gatcatgcga cacctcccga 540ccacagcatt tgggcgagat atagacatgc ctctaaaaac taatctgtta aaaatgtcat 600catcttctcc tccccagccc caataattat taggaaatcc attgatggtt agaaactgtt 660gtttacttag agcagagaca cctccaaaat actgaacata aggtaggctg aatccaaact 720tatccattgc aacggaaatg tgccgtggct gtgaaaaaca cctgtacgca ttatggtcat 780tcattggaat gaggtccacg tcactaaaca caaagcaggt gtagtcatag tccttcaagg 840cttcttgaaa gccaacattg aggagcttag cacgattgaa tatagtgtct cccgcctggt 900tgataacata gatgccatag tccagctgct ggcgctgcag gactgggtgc aaataatata 960gccagtactt gaggtgctcc tgccggttgc ggaatggaat gatgatggcc accttgtgag1020gagagacgca gtccctgggg gcatagcggc cgcccatctt cacatttggg ttctgctttg1080ccacgagctc caggtccaca ggcatgttaa actcaatcag catggggccc acaagcagcg1140gggactcctc agggcaggcg ggcagcgaca gtgcggtggt gtggggcact gggaccgagg1200tcaagttgct agcggggcca gggccagaat ccacgactgg gctggagtcg ccacccgggc1260gcggctggga ggaggcgcct agaggaggcg gcggccgggc ccctccggtc gccggcgggg1320catctgcctt ttcagcggca gctttcagag ccttggattc ttcatccatg gcttcggagt1380cttcgcttgc ctctgaattc agagcacttt gctctaattt tttagcatca ttttcctcag1440agatgacttg ttgttcaggg gatatagatc ctgaggtaaa atcaaatgca gcggagatgg1500aactcggaat atattgctga gttctactgt tggaattcaa tgttaggagg agaacaataa1560ccgcacctgc aatgacggta aatctcaaca gtctcttact gagaaagagg gccatcttaa1620gttcgaataa ttagttgttt tttgatcttc tcaagttgtc gttaaaagtc gttaaaatca1680aaagcttgtc aattggaacc agtcgcaatt atgaaagtaa gctaataatg atgataaaaa1740aaaaggttta agacagggca gcttccttct gtttatatat tgctgtcaag taggggttag1800aacagttaaa ttttgatcat gaacgttagg ctatcagcag tattcccacc agaatcttgg1860aagcatacaa tgtggagaca atgcataatc atccaaaaag cgggtgtttc cccatttgcg1920
tttcggcaca ggtgcaccgg ggttcagaag cgatagagag actgcgctaa gcattaatga1980gattattttt gagcattcgt caatcaatac caaacaagac aaacggtatg ccgacttttg2040gaagtttctt tttgaccaac tggccgttag catttcaacg aaccaaactt agttcatctt2100ggatgagatc acgcttttgt catattaggt tccaagacag cgtttaaact gtcagttttg2160ggccatttgg ggaacatgaa actatttgac cccacactca gaaagccctc atctggagtg2220atgttcgggt gtaatgcgga gcttgttgca ttcggaaata aacaaacatg aacctcgcca2280ggggggccag gatagacagg ctaataaagt catggtgtta gtagcctaat agaaggaatt2340ggaatgagcg agctccaatc aagcccaata actgggctgg tttttcgatg gcaaaagtgg2400gtgttgagga gaagaggagt ggaggtcctg cgtttgcaac ggtctgctgc tagtgtatcc2460cctcctgttg cgtttggcac ttatgtgtga gaatggacct gtggatgtcg gatggcaaaa2520aggtttcatt caacctttcg tctttggatg ttagctagcc ggctgcatta atgaatcggc2580caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt ccgcttcctc gctcactgac2640tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa ggcggtaata2700cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa2760aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct ccgcccccct2820gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac aggactataa2880agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg2940cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc tcatagctca3000cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa3060ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga gtccaacccg3120gtaagacacg acttatcgcc actggcagca gccactggta acaggattag cagagcgagg3180tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta cactagaagg3240acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag agttggtagc3300tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg caagcagcag3360attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac ggggtctgac3420gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc aaaaaggatc3480ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag tatatatgag3540taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc agcgatctgt3600ctatttcgtt catccatagt tgcctgactc cccgtcgtgt agataactac gatacgggag3660ggcttaccat ctggccccag tgctgcaatg ataccgcgag acccacgctc accggctcca3720gatttatcag caataaacca gccagccgga agggccgagc gcagaagtgg tcctgcaact3780ttatccgcct ccatccagtc tattaattgt tgccgggaag ctagagtaag tagttcgcca3840
gttaatagtt tgcgcaacgt tgttgccatt gctacaggca tcgtggtgtc acgctcgtcg3900tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac atgatccccc3960atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag aagtaagttg4020gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac tgtcatgcca4080tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg agaatagtgt4140atgcggcgac cgagttgctc ttgcccggcg tcaatacggg ataataccgc gccacatagc4200agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact ctcaaggatc4260ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg atcttcagca4320tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa tgccgcaaaa4380aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt tcaatgcttc4440tagtggtagg aattaattct gtaccggttt acagaaggac gactcttgat gcgccaacca4500cagtgacaat agacatagag gaaatgacaa aaggattatg cgaggatgct gctggagacg4560attcaaagtt tagtttagaa aggtcctcca tttatgctga tagaatacta gatacccgtg4620aactttgtct caggagatcc gcatcagacg aaggatgttc cgacctgcaa ataatcgaag4680aagagacccc taggcagttg gtgagcttac atgagaagtc taaactatct tggacccgct4740ggttttataa agggttcgtt aggaatgcgt taactaccat tccagcaaca tccgtggggc4800ttctggtgtt tgaaatactg cgtcaaaaat tgagcgatga aattgaagat cgattcagtt4860gaatcgcccg aaacaattga tcccctgtac atacttgtaa tttacctcag aatgggttaa4920ttaaggcgcg ccagatctgt ttagcttgcc tcgtccccgc cgggtcaccc ggccagcgac4980atggaggccc agaataccct ccttgacagt cttgacgtgc gcagctcagg ggcatgatgt5040gactgtcgcc cgtacattta gcccatacat ccccatgtat aatcatttgc atccatacat5100tttgatggcc gcacggcgcg aagcaaaaat tacggctcct cgctgcagac ctgcgagcag5160ggaaacgctc ccctcacaga cgcgttgaat tgtccccacg ccgcgcccct gtagagaaat5220ataaaaggtt aggatttgcc actgaggttc ttctttcata tacttccttt taaaatcttg5280ctaggataca gttctcacat cacatccgaa cataaacaac catgggtaag gaaaagactc5340acgtttcgag gccgcgatta aattccaaca tggatgctga tttatatggg tataaatggg5400ctcgcgataa tgtcgggcaa tcaggtgcga caatctatcg attgtatggg aagcccgatg5460cgccagagtt gtttctgaaa catggcaaag gtagcgttgc caatgatgtt acagatgaga5520tggtcagact aaactggctg acggaattta tgcctcttcc gaccatcaag cattttatcc5580gtactcctga tgatgcatgg ttactcacca ctgcgatccc cggcaaaaca gcattccagg5640tattagaaga atatcctgat tcaggtgaaa atattgttga tgcgctggca gtgttcctgc5700gccggttgca ttcgattcct gtttgtaatt gtccttttaa cagcgatcgc gtatttcgtc5760
tcgctcaggc gcaatcacga atgaataacg gtttggttga tgcgagtgat tttgatgacg5820agcgtaatgg ctggcctgtt gaacaagtct ggaaagaaat gcataagctt ttgccattct5880caccggattc agtcgtcact catggtgatt tctcacttga taaccttatt tttgacgagg5940ggaaattaat aggttgtatt gatgttggac gagtcggaat cgcagaccga taccaggatc6000ttgccatcct atggaactgc ctcggtgagt tttctccttc attacagaaa cggctttttc6060aaaaatatgg tattgataat cctgatatga ataaattgca gtttcatttg atgctcgatg6120agtttttcta atcagtactg acaataaaaa gattcttgtt ttcaagaact tgtcatttgt6180atagtttttt tatattgtag ttgttctatt ttaatcaaat gttagcgtga tttatatttt6240ttttcgcctc gacatcatct gcccagatgc gaagttaagt gcgcagaaag taatatcatg6300cgtcaatcgt atgtgaatgc tggtcgctct actgctgtcg attcgatact aacgccgcca6360tccagtgtcg aaaacgagct cgaattcatc gatgatatca gatcca 6406<210>8<211>1785<212>DNA<213>人工的序列<220>
<223>pGAPZMFManHDEL中的MFManHDEL融合體的ORF序列<400>8atgagatttc cttcaatttt tactgctgtt ttattcgcag catcctccgc attagctgct 60ccagtcaaca ctacaacaga agatgaaacg gcacaaattc cggctgaagc tgtcatcggt120tactcagatt tagaagggga tttcgatgtt gctgttttgc cattttccaa cagcacaaat180aacgggttat tgtttataaa tactactatt gccagcattg ctgctaaaga agaaggggta240tctctcgaga aaagagaggc tgaagctgaa ttcgccacaa aacgtggatc tcccaaccct300acgagggcgg cagcagtcaa ggccgcattc cagacgtcgt ggaacgctta ccaccatttt360gcctttcccc atgacgacct ccacccggtc agcaacagct ttgatgatga gagaaacggc420tggggctcgt cggcaatcga tggcttggac acggctatcc tcatggggga tgccgacatt480gtgaacacga tccttcagta tgtaccgcag atcaacttca ccacgactgc ggttgccaac540caaggatcct ccgtgttcga gaccaacatt cggtacctcg gtggcctgct ttctgcctat600gacctgttgc gaggtccttt cagctccttg gcgacaaacc agaccctggt aaacagcctt660ctgaggcagg ctcaaacact ggccaacggc ctcaaggttg cgttcaccac tcccagcggt720gtcccggacc ctaccgtctt cttcaaccct actgtccgga gaagtggtgc atctagcaac780aacgtcgctg aaattggaag cctggtgctc gagtggacac ggttgagcga cctgacggga840aacccgcagt atgcccagct tgcgcagaag ggcgagtcgt atctcctgaa tccaaaggga900agcccggagg catggcctgg cctgattgga acgtttgtca gcacgagcaa cggtaccttt960
caggatagca gcggcagctg gtccggcctc atggacagct tctacgagta cctgatcaag1020atgtacctgt acgacccggt tgcgtttgca cactacaagg atcgctgggt ccttggtgcc1080gactcgacca ttgggcatct cggctctcac ccgtcgacgc gcaaggactt gacctttttg1140tcttcgtaca acggacagtc tacgtcgcca aactcaggac atttggccag ttttggcggt1200ggcaacttca tcttgggagg cattctcctg aacgagcaaa agtacattga ctttggaatc1260aagcttgcca gctcgtactt tggcacgtac acccagacgg cttctggaat cggccccgaa1320ggcttcgcgt gggtggacag cgtgacgggc gccggcggct cgccgccctc gtcccagtcc1380gggttctact cgtcggcagg attctgggtg acggcaccgt attacatcct gcggccggag1440acgctggaga gcttgtacta cgcataccgc gtcacgggcg actccaagtg gcaggacctg1500gcgtgggaag cgttgagtgc cattgaggac gcatgccgcg ccggcagcgc gtactcgtcc1560atcaacgacg tgacgcaggc caacggcggg ggtgcctctg acgatatgga gagcttctgg1620tttgccgagg cgctcaagta tgcgtacctg atctttgcgg aggagtcgga tgtgcaggtg1680caggccaccg gcgggaacaa atttgtcttt aacacggagg cgcacccctt tagcatccgt1740tcatcatcac gacggggcgg ccaccttgct cacgacgagt tgtaa1785<210>9<211>5485<212>DNA<213>人工的序列<220>
<223>質粒pGlycoSwitch M5的核苷酸序列<400>9agatctaaca tccataatcg atctaagcta tattcgccgt ttctgtcatt tgcgttttgt 60acggaccctc acaacaatta tcatctccaa aaatagacta tgatccattg acgctccgat120cacttgattt gaagactttg gaagctcctt cacagttgag tccaggcacc gtagaagata180atcttcgaag acaattggag tttcattttc cttaccgcag ttacgaacct tttccccaac240atatttggca aacgtggaaa gtttctccct ctgatagttc ctttccgaaa aacttcaaag300acttaggtga aagttggctg caaaggtccc caaattatga tcattttgtg atacccgatg360atgcagcatg ggaacttatt caccatgaat acgaacgtgt accagaagtc ttggaagctc420tagatgctca ccgcaatgct gttaaggttc gtatggagaa actgggactt atttaattat480ttagagattt taacttacat ttagattcga tagatccaca ggacgggtgt ggtcgccatg540atcgcgtagt cgatagtggc tccaagtagc gaagcgagca ggactgggcg gcggccaaag600cggtcggaca gtgctccgag aacgggtgcg catagaaatt gcatcaacgc atatagcgct660agcagcacgc catagtgact ggcgatgctg tcggaatgga cgatatcccg caagaggccc720ggcagtaccg gcataaccaa gcctatgcct acagcatcca gggtgacggt gccgaggatg780
acgatgagcg cattgttaga tttcatacac ggtgcctgac tgcgttagca atttaactgt 840gataaactac cgcattaaag ctgatctttt ttgtagaaat gtcttggtgt cctcgtccaa 900tcaggtagcc atctctgaaa tatctggctc cgttgcaact ccgaacgacc tgctggcaac 960gtaaaattct ccggggtaaa acttaaatgt ggagtaatgg aaccagaaac gtctcttccc1020ttctctctcc ttccaccgcc cgttaccgtc cctaggaaat tttactctgc tggagagctt1080cttctacggc ccccttgcag caatgctctt cccagcatta cgttgcgggt aaaacggagg1140tcgtgtaccc gacctagcag cccagggatg gaaaagtccc ggccgtcgct ggcaataata1200gcgggcggac gcatgtcatg agattattgg aaaccaccag aatcgaatat aaaaggcgaa1260cacctttccc aattttggtt tctcctgacc caaagacttt aaatttaatt tatttgtccc1320tatttcaatc aattgaacaa ctatttcgcg aaacgatgag atttccttca atttttactg1380ctgttttatt cgcagcatcc tccgcattag ctgctccagt caacactaca acagaagatg1440aaacggcaca aattccggct gaagctgtca tcggttactc agatttagaa ggggatttcg1500atgttgctgt tttgccattt tccaacagca caaataacgg gttattgttt ataaatacta1560ctattgccag cattgctgct aaagaagaag gggtatctct cgagaaaaga gaggctgaag1620ctgaattcgc cacaaaacgt ggatctccca accctacgag ggcggcagca gtcaaggccg1680cattccagac gtcgtggaac gcttaccacc attttgcctt tccccatgac gacctccacc1740cggtcagcaa cagctttgat gatgagagaa acggctgggg ctcgtcggca atcgatggct1800tggacacggc tatcctcatg ggggatgccg acattgtgaa cacgatcctt cagtatgtac1860cgcagatcaa cttcaccacg actgcggttg ccaaccaagg atcctccgtg ttcgagacca1920acattcggta cctcggtggc ctgctttctg cctatgacct gttgcgaggt cctttcagct1980ccttggcgac aaaccagacc ctggtaaaca gccttctgag gcaggctcaa acactggcca2040acggcctcaa ggttgcgttc accactccca gcggtgtccc ggaccctacc gtcttcttca2100accctactgt ccggagaagt ggtgcatcta gcaacaacgt cgctgaaatt ggaagcctgg2160tgctcgagtg gacacggttg agcgacctga cgggaaaccc gcagtatgcc cagcttgcgc2220agaagggcga gtcgtatctc ctgaatccaa agggaagccc ggaggcatgg cctggcctga2280ttggaacgtt tgtcagcacg agcaacggta cctttcagga tagcagcggc agctggtccg2340gcctcatgga cagcttctac gagtacctga tcaagatgta cctgtacgac ccggttgcgt2400ttgcacacta caaggatcgc tgggtccttg gtgccgactc gaccattggg catctcggct2460ctcacccgtc gacgcgcaag gacttgacct ttttgtcttc gtacaacgga cagtctacgt2520cgccaaactc aggacatttg gccagttttg gcggtggcaa cttcatcttg ggaggcattc2580tcctgaacga gcaaaagtac attgactttg gaatcaagct tgccagctcg tactttggca2640cgtacaccca gacggcttct ggaatcggcc ccgaaggctt cgcgtgggtg gacagcgtga2700
cgggcgccgg cggctcgccg ccctcgtccc agtccgggtt ctactcgtcg gcaggattct2760gggtgacggc accgtattac atcctgcggc cggagacgct ggagagcttg tactacgcat2820accgcgtcac gggcgactcc aagtggcagg acctggcgtg ggaagcgttg agtgccattg2880aggacgcatg ccgcgccggc agcgcgtact cgtccatcaa cgacgtgacg caggccaacg2940gcgggggtgc ctctgacgat atggagagct tctggtttgc cgaggcgctc aagtatgcgt3000acctgatctt tgcggaggag tcggatgtgc aggtgcaggc caccggcggg aacaaatttg3060tctttaacac ggaggcgcac ccctttagca tccgttcatc atcacgacgg ggcggccacc3120ttgctcacga cgagttgtaa tctagggcgg ccgccagctt tctagagaac aaaaactcat3180ctcagaagag gatctgaata gcgccgtcga ccatcatcat catcatcatt gagtttgtag3240ccttagacat gactgttcct cagttcaagt tgggcactta cgagaagacc ggtcttgcta3300gattctaatc aagaggatgt cagaatgcca tttgcctgag agatgcaggc ttcatttttg3360atactttttt atttgtaacc tatatagtat aggatttttt ttgtcatttt gtttcttctc3420gtacgagctt gctcctgatc agcctatctc gcagctgatg aatatcttgt ggtaggggtt3480tgggaaaatc attcgagttt gatgtttttc ttggtatttc ccactcctct tcagagtaca3540gaagattaag tgagaccttc gtttgtgcgg atcccccaca caccatagct tcaaaatgtt3600tctactcctt ttttactctt ccagattttc tcggactccg cgcatcgccg taccacttca3660aaacacccaa gcacagcata ctaaattttc cctctttctt cctctagggt gtcgttaatt3720acccgtacta aaggtttgga aaagaaaaaa gagaccgcct cgtttctttt tcttcgtcga3780aaaaggcaat aaaaattttt atcacgtttc tttttcttga aatttttttt tttagttttt3840ttctctttca gtgacctcca ttgatattta agttaataaa cggtcttcaa tttctcaagt3900ttcagtttca tttttcttgt tctattacaa ctttttttac ttcttgttca ttagaaagaa3960agcatagcaa tctaatctaa ggggcggtgt tgacaattaa tcatcggcat agtatatcgg4020catagtataa tacgacaagg tgaggaacta aaccatggcc aagttgacca gtgccgttcc4080ggtgctcacc gcgcgcgacg tcgccggagc ggtcgagttc tggaccgacc ggctcgggtt4140ctcccgggac ttcgtggagg acgacttcgc cggtgtggtc cgggacgacg tgaccctgtt4200catcagcgcg gtccaggacc aggtggtgcc ggacaacacc ctggcctggg tgtgggtgcg4260cggcctggac gagctgtacg ccgagtggtc ggaggtcgtg tccacgaact tccgggacgc4320ctccgggccg gccatgaccg agatcggcga gcagccgtgg gggcgggagt tcgccctgcg4380cgacccggcc ggcaactgcg tgcacttcgt ggccgaggag caggactgac acgtccgacg4440gcggcccacg ggtcccaggc ctcggagatc cgtccccctt ttcctttgtc gatatcatgt4500aattagttat gtcacgctta cattcacgcc ctccccccac atccgctcta accgaaaagg4560aaggagttag acaacctgaa gtctaggtcc ctatttattt ttttatagtt atgttagtat4620
taagaacgtt atttatattt caaatttttc ttttttttct gtacagacgc gtgtacgcat4680gtaacattat actgaaaacc ttgcttgaga aggttttggg acgctcgaag gctttaattt4740gcaagctgga gaccaacatg tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg4800ccgcgttgct ggcgtttttc cataggctcc gcccccctga cgagcatcac aaaaatcgac4860gctcaagtca gaggtggcga aacccgacag gactataaag ataccaggcg tttccccctg4920gaagctccct cgtgcgctct cctgttccga ccctgccgct taccggatac ctgtccgcct4980ttctcccttc gggaagcgtg gcgctttctc aatgctcacg ctgtaggtat ctcagttcgg5040tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct5100gcgccttatc cggtaactat cgtcttgagt ccaacccggt aagacacgac ttatcgccac5160tggcagcagc cactggtaac aggattagca gagcgaggta tgtaggcggt gctacagagt5220tcttgaagtg gtggcctaac tacggctaca ctagaaggac agtatttggt atctgcgctc5280tgctgaagcc agttaccttc ggaaaaagag ttggtagctc ttgatccggc aaacaaacca5340ccgctggtag cggtggtttt tttgtttgca agcagcagat tacgcgcaga aaaaaaggat5400ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc tcagtggaac gaaaactcac5460gttaagggat tttggtcatg agatc 5485<210>10<211>441<212>PRT<213>釀酒酵母<400>10Met Ala Leu Phe Leu Ser Lys Arg Leu Leu Arg Phe Thr Val Ile Ala1 5 10 15Gly Ala Val Ile Val Leu Leu Leu Thr Leu Asn Ser Asn Ser Arg Thr20 25 30Gln Gln Tyr Ile Pro Ser Ser Ile Ala Ala Phe Asp Phe Thr Ser Gly35 40 45Ser Ile Ser Pro Glu Gln Gln Val Ile Ser Glu Glu Asn Asp Ala Lys50 55 60Lys Leu Glu Gln Ser Ala Leu Asn Ser Glu Ala Ser Glu Asp Ser Glu65 70 75 80Ala Met Asp Glu Glu Ser Lys Ala Leu Lys Ala Ala Ala Glu Lys Ala85 90 95Asp Ala Pro Ile Asp Thr Lys Thr Thr Met Asp Tyr Ile Thr Pro Ser
100 105 110Phe Ala Asn Lys Ala Gly Lys Pro Lys Ala Cys Tyr Val Thr Leu Val115 120 125Arg Asn Lys Glu Leu Lys Gly Leu Leu Ser Ser Ile Lys Tyr Val Glu130 135 140Asn Lys Ile Asn Lys Lys Phe Pro Tyr Pro Trp Val Phe Leu Asn Asp145 150 155 160Glu Pro Phe Thr Glu Glu Phe Lys Glu Ala Val Thr Lys Ala Val Ser165 170 175Ser Glu Val Lys Phe Gly Ile Leu Pro Lys Glu His Trp Ser Tyr Pro180 185 190Glu Trp Ile Asn Gln Thr Lys Ala Ala Glu Ile Arg Ala Asp Ala Ala195 200 205Thr Lys Tyr Ile Tyr Gly Gly Ser Glu Ser Tyr Arg His Met Cys Arg210 215 220Tyr Gln Ser Gly Phe Phe Trp Arg His Glu Leu Leu Glu Glu Tyr Asp225 230 235 240Trp Tyr Trp Arg Val Glu Pro Asp Ile Lys Leu Tyr Cys Asp Ile Asn245 250 255Tyr Asp Val Phe Lys Trp Met Gln Glu Asn Glu Lys Val Tyr Gly Phe260 265 270Thr Val Ser Ile His Glu Tyr Glu Val Thr Ile Pro Thr Leu Trp Gln275 280 285Thr Ser Met Asp Phe Ile Lys Lys Asn Pro Glu Tyr Leu Asp Glu Asn290 295 300Asn Leu Met Ser Phe Leu Ser Asn Asp Asn Gly Lys Thr Tyr Asn Leu305 310 315 320Cys His Phe Trp Ser Asn Phe Glu Ile Ala Asn Leu Asn Leu Trp Arg325 330 335Ser Pro Ala Tyr Arg Glu Tyr Phe Asp Thr Leu Asp His Gln Gly Gly340 345 350Phe Phe Tyr Glu Arg Trp Gly Asp Ala Pro Val His Ser Ile Ala Ala
355 360 365Ala Leu Phe Leu Pro Lys Asp Lys Ile His Tyr Phe Ser Asp Ile Gly370 375 380Tyr His His Pro Pro Tyr Asp Asn Cys Pro Leu Asp Lys Glu Val Tyr385 390 395 400Asn Ser Asn Asn Cys Glu Cys Asp Gln Gly Asn Asp Phe Thr Phe Gln405 410 415Gly Tyr Ser Cys Gly Lys Glu Tyr Tyr Asp Ala Gln Gly Leu Val Lys420 425 430Pro Lys Asn Trp Lys Lys Phe Arg Glu435 440<210>11<211>100<212>PRT<213>釀酒酵母<400>11Met Ala Leu Phe Leu Ser Lys Arg Leu Leu Arg Phe Thr Val Ile Ala1 5 10 15Gly Ala Val Ile Val Leu Leu Leu Thr Leu Asn Ser Asn Ser Arg Thr20 25 30Gln Gln Tyr Ile Pro Ser Ser Ile Ser Ala Ala Phe Asp Phe Thr Ser35 40 45Gly Ser Ile Ser Pro Glu Gln Gln Val Ile Ser Glu Glu Asn Asp Ala50 55 60Lys Lys Leu Glu Gln Ser Ala Leu Asn Ser Glu Ala Ser Glu Asp Ser65 70 75 80Glu Ala Met Asp Glu Glu Ser Lys Ala Leu Lys Ala Ala Ala Glu Lys85 90 95Ala Asp Ala Pro100<210>12<211>2670<212>DNA<213>人<400>12
atgctgaaga agcagtctgc agggcttgtg ctgtggggcg ctatcctctt tgtggcctgg 60aatgccctgc tgctcctctt cttctggacg cgcccagcac ctggcaggcc accctcagtc 120agcgctctcg atggcgaccc cgccagcctc acccgggaag tgattcgcct ggcccaagac 180gccgaggtgg agctggagcg gcagcgtggg ctgctgcagc agatcgggga tgccctgtcg 240agccagcggg ggagggtgcc caccgcggcc cctcccgccc agccgcgtgt gcctgtgacc 300cccgcgccgg cggtgattcc catcctggtc atcgcctgtg accgcagcac tgttcggcgc 360tgcctggaca agctgctgca ttatcggccc tcggctgagc tcttccccat catcgttagc 420caggactgcg ggcacgagga gacggcccag gccatcgcct cctacggcag cgcggtcacg 480cacatccggc agcccgacct gagcagcatt gcggtgccgc cggaccaccg caagttccag 540ggctactaca agatcgcgcg ccactaccgc tgggcgctgg gccaggtctt ccggcagttt 600cgcttccccg cggccgtggt ggtggaggat gacctggagg tggccccgga cttcttcgag 660tactttcggg ccacctatcc gctgctgaag gccgacccct ccctgtggtg cgtctcggcc 720tggaatgaca acggcaagga gcagatggtg gacgccagca ggcctgagct gctctaccgc 780accgactttt tccctggcct gggctggctg ctgttggccg agctctgggc tgagctggag 840cccaagtggc caaaggcctt ctgggacgac tggatgcggc ggccggagca gcggcagggg 900cgggcctgca tacgccctga gatctcaaga acgatgacct ttggccgcaa gggtgtgagc 960cacgggcagt tctttgacca gcacctcaag tttatcaagc tgaaccagca gtttgtgcac1020ttcacccagc tggacctgtc ttacctgcag cgggaggcct atgaccgaga tttcctcgcc1080cgcgtctacg gtgctcccca gctgcaggtg gagaaagtga ggaccaatga ccggaaggag1140ctgggggagg tgcgggtgca gtatacgggc agggacagct tcaaggcttt cgccaaggct1200ctgggtgtca tggatgacct taagtcgggg gttccgagag ctggctaccg gggtattgtc1260accttccagt tccggggccg ccgtgtccac ctggcgcccc caccgacgtg ggagggctat1320gatcctagct ggaatatgct gaagaagcag tctgcagggc ttgtgctgtg gggcgctatc1380ctctttgtgg cctggaatgc cctgctgctc ctcttcttct ggacgcgccc agcacctggc1440aggccaccct cagtcagcgc tctcgatggc gaccccgcca gcctcacccg ggaagtgatt1500cgcctggccc aagacgccga ggtggagctg gagcggcagc gtgggctgct gcagcagatc1560ggggatgccc tgtcgagcca gcgggggagg gtgcccaccg cggcccctcc cgcccagccg1620cgtgtgcctg tgacccccgc gccggcggtg attcccatcc tggtcatcgc ctgtgaccgc1680agcactgttc ggcgctgcct ggacaagctg ctgcattatc ggccctcggc tgagctcttc1740cccatcatcg ttagccagga ctgcgggcac gaggagacgg cccaggccat cgcctcctac1800ggcagcgcgg tcacgcacat ccggcagccc gacctgagca gcattgcggt gccgccggac1860caccgcaagt tccagggcta ctacaagatc gcgcgccact accgctgggc gctgggccag1920
gtcttccggc agtttcgctt ccccgcggcc gtggtggtgg aggatgacct ggaggtggcc1980ccggacttct tcgagtactt tcgggccacc tatccgctgc tgaaggccga cccctccctg2040tggtgcgtct cggcctggaa tgacaacggc aaggagcaga tggtggacgc cagcaggcct2100gagctgctct accgcaccga ctttttccct ggcctgggct ggctgctgtt ggccgagctc2160tgggctgagc tggagcccaa gtggccaaag gccttctggg acgactggat gcggcggccg2220gagcagcggc aggggcgggc ctgcatacgc cctgagatct caagaacgat gacctttggc2280cgcaagggtg tgagccacgg gcagttcttt gaccagcacc tcaagtttat caagctgaac2340cagcagtttg tgcacttcac ccagctggac ctgtcttacc tgcagcggga ggcctatgac2400cgagatttcc tcgcccgcgt ctacggtgct ccccagctgc aggtggagaa agtgaggacc2460aatgaccgga aggagctggg ggaggtgcgg gtgcagtata cgggcaggga cagcttcaag2520gctttcgcca aggctctggg tgtcatggat gaccttaagt cgggggttcc gagagctggc2580taccggggta ttgtcacctt ccagttccgg ggccgccgtg tccacctggc gcccccaccg2640acgtgggagg gctatgatcc tagctggaat 2670<210>13<211>445<212>PRT<213>人<400>13Met Leu Lys Lys Gln Ser Ala Gly Leu Val Leu Trp Gly Ala Ile Leu1 5 10 15Phe Val Ala Trp Asn Ala Leu Leu Leu Leu Phe Phe Trp Thr Arg Pro20 25 30Ala Pro Gly Arg Pro Pro Ser Val Ser Ala Leu Asp Gly Asp Pro Ala35 40 45Ser Leu Thr Arg Glu Val Ile Arg Leu Ala Gln Asp Ala Glu Val Glu50 55 60Leu Glu Arg Gln Arg Gly Leu Leu Gln Gln Ile Gly Asp Ala Leu Ser65 70 75 80Ser Gln Arg Gly Arg Val Pro Thr Ala Ala Pro Pro Ala Gln Pro Arg85 90 95Val Pro Val Thr Pro Ala Pro Ala Val Ile Pro Ile Leu Val Ile Ala100 105 110Cys Asp Arg Ser Thr Val Arg Arg Cys Leu Asp Lys Leu Leu His Tyr115 120 125
Arg Pro Ser Ala Glu Leu Phe Pro Ile Ile Val Ser Gln Asp Cys Gly130 135 140His Glu Glu Thr Ala Gln Ala Ile Ala Ser Tyr Gly Ser Ala Val Thr145 150 155 160His Ile Arg Gln Pro Asp Leu Ser Ser Ile Ala Val Pro Pro Asp His165 170 175Arg Lys Phe Gln Gly Tyr Tyr Lys Ile Ala Arg His Tyr Arg Trp Ala180 185 190Leu Gly Gln Val Phe Arg Gln Phe Arg Phe Pro Ala Ala Val Val Val195 200 205Glu Asp Asp Leu Glu Val Ala Pro Asp Phe Phe Glu Tyr Phe Arg Ala210 215 220Thr Tyr Pro Leu Leu Lys Ala Asp Pro Ser Leu Trp Cys Val Ser Ala225 230 235 240Trp Asn Asp Asn Gly Lys Glu Gln Met Val Asp Ala Ser Arg Pro Glu245 250 255Leu Leu Tyr Arg Thr Asp Phe Phe Pro Gly Leu Gly Trp Leu Leu Leu260 265 270Ala Glu Leu Trp Ala Glu Leu Glu Pro Lys Trp Pro Lys Ala Phe Trp275 280 285Asp Asp Trp Met Arg Arg Pro Glu Gln Arg Gln Gly Arg Ala Cys Ile290 295 300Arg Pro Glu Ile Ser Arg Thr Met Thr Phe Gly Arg Lys Gly Val Ser305 310 315 320His Gly Gln Phe Phe Asp Gln His Leu Lys Phe Ile Lys Leu Asn Gln325 330 335Gln Phe Val His Phe Thr Gln Leu Asp Leu Ser Tyr Leu Gln Arg Glu340 345 350Ala Tyr Asp Arg Asp Phe Leu Ala Arg Val Tyr Gly Ala Pro Gln Leu355 360 365Gln Val Glu Lys Val Arg Thr Asn Asp Arg Lys Glu Leu Gly Glu Val370 375 380
Arg Val Gln Tyr Thr Gly Arg Asp Ser Phe Lys Ala Phe Ala Lys Ala385 390 395 400Leu Gly Val Met Asp Asp Leu Lys Ser Gly Val Pro Arg Ala Gly Tyr405 410 415Arg Gly Ile Val Thr Phe Gln Phe Arg Gly Arg Arg Val His Leu Ala420 425 430Pro Pro Pro Thr Trp Glu Gly Tyr Asp Pro Ser Trp Asn435 440 445<210>14<211>4677<212>DNA<213>人工的序列<220>
<223>質粒pPIC6AkrecoGnTI的核苷酸序列<400>14gaaatttttt tttttagttt ttttctcttt cagtgacctc cattgatatt taagttaata 60aacggtcttc aatttctcaa gtttcagttt catttttctt gttctattac aacttttttt 120acttcttgtt cattagaaag aaagcatagc aatctaatct aaggggcggt gttgacaatt 180aatcatcggc atagtatatc ggcatagtat aatacgacaa ggtgaggaac taaaccatgg 240ccaagccttt gtctcaagaa gaatccaccc tcattgaaag agcaacggct acaatcaaca 300gcatccccat ctctgaagac tacagcgtcg ccagcgcagc tctctctagc gacggccgca 360tcttcactgg tgtcaatgta tatcatttta ctgggggacc ttgtgcagaa ctcgtggtgc 420tgggcactgc tgctgctgcg gcagctggca acctgacttg tatcgtcgcg atcggaaatg 480agaacagggg catcttgagc ccctgcggac ggtgccgaca ggtgcttctc gatctgcatc 540ctgggatcaa agccatagtg aaggacagtg atggacagcc gacggcagtt gggattcgtg 600aattgctgcc ctctggttat gtgtgggagg gctaagcact tcgtggccga ggagcaggac 660tgacacgtcc gacggcggcc cacgggtccc aggcctcgga gatccgtccc ccttttcctt 720tgtcgatatc atgtaattag ttatgtcacg cttacattca cgccctcccc ccacatccgc 780tctaaccgaa aaggaaggag ttagacaacc tgaagtctag gtccctattt atttttttat 840agttatgtta gtattaagaa cgttatttat atttcaaatt tttctttttt ttctgtacag 900acgcgtgtac gcatgtaaca ttatactgaa aaccttgctt gagaaggttt tgggacgctc 960gaaggcttta atttgcaagc tggagaccaa catgtgagca aaaggccagc aaaaggccag1020gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca1080tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca1140
ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg1200atacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcaatgct cacgctgtag1260gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt1320tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca1380cgacttatcg ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg1440cggtgctaca gagttcttga agtggtggcc taactacggc tacactagaa ggacagtatt1500tggtatctgc gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc1560cggcaaacaa accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg1620cagaaaaaaa ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg1680gaacgaaaac tcacgttaag ggattttggt catgagatca gatctaacat ccaaagacga1740aaggttgaat gaaacctttt tgccatccga catccacagg tccattctca cacataagtg1800ccaaacgcaa caggagggga tacactagca gcagaccgtt gcaaacgcag gacctccact1860cctcttctcc tcaacaccca cttttgccat cgaaaaacca gcccagttat tgggcttgat1920tggagctcgc tcattccaat tccttctatt aggctactaa caccatgact ttattagcct1980gtctatcctg gcccccctgg cgaggttcat gtttgtttat ttccgaatgc aacaagctcc2040gcattacacc cgaacatcac tccagatgag ggctttctga gtgtggggtc aaatagtttc2100atgttcccca aatggcccaa aactgacagt ttaaacgctg tcttggaacc taatatgaca2160aaagcgtgat ctcatccaag atgaactaag tttggttcgt tgaaatgcta acggccagtt2220ggtcaaaaag aaacttccaa aagtcggcat accgtttgtc ttgtttggta ttgattgacg2280aatgctcaaa aataatctca ttaatgctta gcgcagtctc tctatcgctt ctgaaccccg2340gtgcacctgt gccgaaacgc aaatggggaa acacccgctt tttggatgat tatgcattgt2400ctccacattg tatgcttcca agattctggt gggaatactg ctgatagcct aacgttcatg2460atcaaaattt aactgttcta acccctactt gacagcaata tataaacaga aggaagctgc2520cctgtcttaa accttttttt ttatcatcat tattagctta ctttcataat tgcgactggt2580tccaattgac aagcttttga ttttaacgac ttttaacgac aacttgagaa gatcaaaaaa2640caactaatta ttcgaaacga ggaattatcc atattcgcaa gcagttccac tcgaaagcat2700ggccctcttt ctcagtaaga gactgttgag atttaccgtc attgcaggtg cggttattgt2760tctcctccta acattgaatt ccaacagtag aactcagcaa tatattccga gttccatctc2820cgctgcattt gattttacct caggatctat atcccctgaa caacaagtca tctctgagga2880aaatgatgct aaaaaattag agcaaagtgc tctgaattca gaggcaagcg aagactccga2940agccatggat gaagaatcca aggctctgaa agctgccgct gaaaaggcag atgccccgcc3000ggcggtgatt cccatcctgg tcatcgcctg tgaccgcagc actgttcggc gctgcctgga3060
caagctgctg cattatcggc cctcggctga gctcttcccc atcatcgtta gccaggactg3120cgggcacgag gagacggccc aggccatcgc ctcctacggc agcgcggtca cgcacatccg3180gcagcccgac ctgagcagca ttgcggtgcc gccggaccac cgcaagttcc agggctacta3240caagatcgcg cgccactacc gctgggcgct gggccaggtc ttccggcagt ttcgcttccc3300cgcggccgtg gtggtggagg atgacctgga ggtggccccg gacttcttcg agtactttcg3360ggccacctat ccgctgctga aggccgaccc ctccctgtgg tgcgtctcgg cctggaatga3420caacggcaag gagcagatgg tggacgccag caggcctgag ctgctctacc gcaccgactt3480tttccctggc ctgggctggc tgctgttggc cgagctctgg gctgagctgg agcccaagtg3540gccaaaggcc ttctgggacg actggatgcg gcggccggag cagcggcagg ggcgggcctg3600catacgccct gagatctcaa gaacgatgac ctttggccgc aagggtgtga gccacgggca3660gttctttgac cagcacctca agtttatcaa gctgaaccag cagtttgtgc acttcaccca3720gctggacctg tcttacctgc agcgggaggc ctatgaccga gatttcctcg cccgcgtcta3780cggtgctccc cagctgcagg tggagaaagt gaggaccaat gaccggaagg agctggggga3840ggtgcgggtg cagtatacgg gcagggacag cttcaaggct ttcgccaagg ctctgggtgt3900catggatgac cttaagtcgg gggttccgag agctggctac cggggtattg tcaccttcca3960gttccggggc cgccgtgtcc acctggcgcc cccaccgacg tgggagggct atgatcctag4020ctggaattag cacctgtcga ctggagacct gcaggcatgc aagcttcgac catcatcatc4080atcatcattg agtttgtagc cttagacatg actgttcctc agttcaagtt gggcacttac4140gagaagaccg gtcttgctag attctaatca agaggatgtc agaatgccat ttgcctgaga4200gatgcaggct tcatttttga tactttttta tttgtaacct atatagtata ggattttttt4260tgtcattttg tttcttctcg tacgagcttg ctcctgatca gcctatctcg cagctgatga4320atatcttgtg gtaggggttt gggaaaatca ttcgagtttg atgtttttct tggtatttcc4380cactcctctt cagagtacag aagattaagt gagaccttcg tttgtgcgga tcccccacac4440accatagctt caaaatgttt ctactccttt tttactcttc cagattttct cggactccgc4500gcatcgccgt accacttcaa aacacccaag cacagcatac taaattttcc ctctttcttc4560ctctagggtg tcgttaatta cccgtactaa aggtttggaa aagaaaaaag agaccgcctc4620gtttcttttt cttcgtcgaa aaaggcaata aaaattttta tcacgtttct ttttctt 4677<210>15<211>33<212>DNA<213>人工的序列<220>
<223>寡核苷酸引物
<400>15ttcgaagctt cgctagctcg gtgtcccgat gtc 33<210>16<211>32<212>DNA<213>人工的序列<220>
<223>寡核苷酸引物<400>16gaattcgaag ggaagatgag gcttcgggag cc32<210>17<211>28<212>DNA<213>人工的序列<220>
<223>寡核苷酸引物<400>17cgttcgcgac cggaggggcc cggccgcc 28<210>18<211>33<212>DNA<213>人工的序列<220>
<223>寡核苷酸引物<400>18tcgatatcaa gcttagctcg gtgtcccgat gtc 33<210>19<211>36<212>DNA<213>人工的序列<220>
<223>寡核苷酸引物<400>19gaattcgaac ttaagatggc cctctttctc agtaag36<210>20<211>1191<212>DNA<213>人<400>20atgaggcttc gggagccgct cctgagcggc gccgcgatgc caggcgcgtc cctacagcgg 60gcctgccgcc tgctcgtggc cgtctgcgtc tggcaccttg gcgtcaccct cgtttactac 120ctggctggcc gcgacctgag ccgcctgccc caactggtcg gagtctccac accgctgcag 180
ggcggctcga acagtgccgc cgccatcggg cagtcctccg gggagctccg gaccggaggg 240gcccggccgc cgcctcctct aggcgcctcc tcccagccgc gcccgggtgg cgactccagc 300ccagtcgtgg attctggccc tggccccgct agcaacttga cctcggtccc agtgccccac 360accaccgcac tgtcgctgcc cgcctgccct gaggagtccc cgctgcttgt gggccccatg 420ctgattgagt ttaacatgcc tgtggacctg gagctcgtgg caaagcagaa cccaaatgtg 480aagatgggcg gccgctatgc ccccagggac tgcgtctctc ctcacaaggt ggccatcatc 540attccattcc gcaaccggca ggagcacctc aagtactggc tatattattt gcacccagtc 600ctgcagcgcc agcagctgga ctatggcatc tatgttatca accaggcggg agacactata 660ttcaatcgtg ctaagctcct caatgttggc tttcaagaag ccttgaagga ctatgactac 720acctgctttg tgtttagtga cgtggacctc attccaatga atgaccataa tgcgtacagg 780tgtttttcac agccacggca catttccgtt gcaatggata agtttggatt cagcctacct 840tatgttcagt attttggagg tgtctctgct ctaagtaaac aacagtttct aaccatcaat 900ggatttccta ataattattg gggctgggga ggagaagatg atgacatttt taacagatta 960gtttttagag gcatgtctat atctcgccca aatgctgtgg tcgggaggtg tcgcatgatc1020cgccactcaa gagacaaaaa aaatgaaccc aatcctcaga ggtttgaccg aattgcacac1080acaaaggaga caatgctctc tgatggtttg aactcactca cctaccaggt gctggatgta1140cagagatacc cattgtatac ccaaatcaca gtggacatcg ggacaccgag c 1191<210>21<211>397<212>PRT<213>人<400>21Met Arg Leu Arg Glu Pro Lau Leu Ser Gly Ala Ala Met Pro Gly Ala1 5 10 15Ser Leu Gln Arg Ala Cys Arg Leu Leu Val Ala Val Cys Val Trp His20 25 30Leu Gly Val Thr Leu Val Tyr Tyr Leu Ala Gly Arg Asp Leu Ser Arg35 40 45Leu Pro Gln Leu Val Gly Val Ser Thr Pro Leu Gln Gly Gly Ser Asn50 55 60Ser Ala Ala Ala Ile Gly Gln Ser Ser Gly Glu Leu Arg Thr Gly Gly65 70 75 80Ala Arg Pro Pro Pro Pro Leu Gly Ala Ser Ser Gln Pro Arg Pro Gly85 90 95
G1y Asp Ser Ser Pro Val Val Asp Ser Gly Pro Gly Pro Ala Ser Asn100 105 110Leu Thr Ser Val Pro Val Pro His Thr Thr Ala Leu Ser Leu Pro Ala115 120 125Cys Pro Glu Glu Ser Pro Leu Leu Val Gly Pro Met Leu Ile Glu Phe130 135 140Asn Met Pro Val Asp Leu Glu Leu Val Ala Lys Gln Asn Pro Asn Val145 150 155 160Lys Met Gly Gly Arg Tyr Ala Pro Arg Asp Cys Val Ser Pro His Lys165 170 175Val Ala Ile Ile Ile Pro Phe Arg Asn Arg Gln Glu His Leu Lys Tyr180 185 190Trp Leu Tyr Tyr Leu His Pro Val Leu Gln Arg Gln Gln Leu Asp Tyr195 200 205Gly Ile Tyr Val Ile Asn Gln Ala Gly Asp Thr Ile Phe Asn Arg Ala210 215 220Lys Leu Leu Asn Val Gly Phe Gln Glu Ala Leu Lys Asp Tyr Asp Tyr225 230 235 240Thr Cys Phe Val Phe Ser Asp Val Asp Leu Ile Pro Met Asn Asp His245 250 255Asn Ala Tyr Arg Cys Phe Ser Gln Pro Arg His Ile Ser Val Ala Met260 265 270Asp Lys Phe Gly Phe Ser Leu Pro Tyr Val Gln Tyr Phe Gly Gly Val275 280 285Ser Ala Leu Ser Lys Gln Gln Phe Leu Thr Ile Asn Gly Phe Pro Asn290 295 300Asn Tyr Trp Gly Trp Gly Gly Glu Asp Asp Asp Ile Phe Asn Arg Leu305 310 315 320Val Phe Arg Gly Met Ser Ile Ser Arg Pro Asn Ala Val Val Gly Arg325 330 335Cys Arg Met Ile Arg His Ser Arg Asp Lys Lys Asn Glu Pro Asn PrG340 345 350
Gln Arg Phe Asp Arg Ile Ala His Thr Lys Glu Thr Met Leu Ser Asp355 360 365Gly Leu Asn Ser Leu Thr Tyr Gln Val Leu Asp Val Gln Arg Tyr Pro370 375 380Leu Tyr Thr Gln Ile Thr Val Asp Ile Gly Thr Pro Ser385 390 39權利要求
1.一種基因工程化甲基營養(yǎng)型酵母菌株,其產(chǎn)生包含哺乳動物樣N-多糖結構的糖蛋白,其中所述哺乳動物樣N-多糖含有五個或更少甘露糖殘基和至少一個N-乙酰葡糖胺殘基(GlcNAc),所述N-乙酰葡糖胺殘基與甘露糖殘基和末端半乳糖殘基連接。
2.權利要求1的菌株,其中所述哺乳動物樣N-多糖包含GalGlcNAcMan5GlcNAc2。
3.權利要求1的菌株,其中所述菌株是念珠菌屬、漢遜酵母屬、球擬酵母屬或畢赤酵母屬的菌株。
4.權利要求3的菌株,其中所述菌株是巴斯德畢赤酵母菌株。
5.權利要求2的菌株,其中所述菌株表達(1)α-1,2-甘露糖苷酶或其功能部分;(2)N-乙酰葡糖胺基轉移酶I(或GnTI)或其功能部分;和(3)β-1,4-半乳糖基轉移酶(GalT)或其功能部分。
6.權利要求2的菌株,其中滅活基因組OCH1基因。
7.權利要求5的菌株,其中所述α-1,2-甘露糖苷酶或所述其功能部分來源于哺乳動物物種或真菌物種。
8.權利要求7的菌株,其中所述哺乳動物物種選自小鼠、兔或人。
9.權利要求7的菌株,其中所述真菌物種選自曲霉或瑞氏木霉。
10.權利要求5的菌株,其中所述α-1,2-甘露糖苷酶或所述其功能部分靶向所述菌株的ER或高爾基體。
11.權利要求10的菌株,其中所述α-1,2-甘露糖苷酶或所述其功能部分被工程化為包含ER駐留信號。
12.權利要求11的菌株,其中所述ER駐留信號包含HDEL(SEQ ID NO1)。
13.權利要求5的菌株,其中所述GnTI或所述其功能部分來源于選自兔、大鼠、人、植物、昆蟲、線蟲和原生動物的物種。
14.權利要求13的菌株,其中所述GnTI或所述其功能部分來源于人。
15.權利要求5的菌株,其中所述GnTI或所述其功能部分靶向所述菌株的高爾基體。
16.根據(jù)權利要求15的菌株,其中所述GnTI或所述其功能部分被工程化為包含高爾基體駐留信號。
17.權利要求16的菌株,其中所述高爾基體駐留信號包含SEQ ID NO11。
18.權利要求5的菌株,其中所述GalT或所述其功能部分來源于選自兔、大鼠、人、植物、昆蟲和線蟲的物種。
19.權利要求18的菌株,其中所述GalT或所述其功能部分來源于人。
20.權利要求5的菌株,其中所述GalT或所述其功能部分靶向所述菌株的高爾基體。
21.權利要求20的菌株,其中所述GalT或所述其功能部分被工程化為包含高爾基體駐留信號。
22.權利要求21的菌株,其中所述高爾基體駐留信號包含SEQ ID NO11。
23.權利要求5的菌株,其中所述α-1,2-甘露糖苷酶或所述其功能部分從選自下組的啟動子表達巴斯德畢赤酵母的AOXI啟動子、AOXII啟動子、GAP啟動子和FLD啟動子。
24.權利要求5的菌株,其中所述GnTI或所述其功能部分從選自下組的啟動子表達巴斯德畢赤酵母的AOXI啟動子、AOXII啟動子、GAP啟動子和FLD啟動子。
25.權利要求5的菌株,其中所述GalT或所述其功能部分從選自下組的啟動子表達巴斯德畢赤酵母的AOXI啟動子、AOXII啟動子、GAP啟動子和FLD啟動子。
26.權利要求5的菌株,其中所述α-1,2-甘露糖苷酶或所述其功能部分從巴斯德畢赤酵母的AOXI啟動子表達,所述GnTI或所述其功能部分從巴斯德畢赤酵母的GAP啟動子表達。
27.權利要求1的菌株,其中所述哺乳動物樣多糖是類似人的多糖。
28.一種重組生產(chǎn)具有哺乳動物樣N-多糖結構的糖蛋白的方法,包括用編碼所述糖蛋白的核苷酸序列轉化根據(jù)權利要求1-2或5-6中任一項的菌株,并使所述糖蛋白在所述菌株中表達。
29.權利要求28的方法,其中所述糖蛋白是來源于細菌、真菌、病毒或哺乳動物的蛋白質。
30.權利要求28的方法,其中所述糖蛋白是免疫球蛋白或其片段。
31.由權利要求28的方法生產(chǎn)的糖蛋白。
32.權利要求31的糖蛋白,其中所述糖蛋白是免疫球蛋白或其片段。
33.一種在甲基營養(yǎng)型酵母菌株中重組生產(chǎn)具有哺乳動物樣N-多糖結構的糖蛋白的方法,包括用編碼所述糖蛋白的核苷酸序列轉化所述菌株;修飾所述菌株使得修飾的菌株表達(1)α-1,2-甘露糖苷酶或其功能部分、(2)N-乙酰葡糖胺基轉移酶I(或GnTI)或其功能部分和(3)β-1,4-半乳糖基轉移酶(GalT)或其功能部分,并且其中修飾的菌株中基因組OCH1基因被滅活;在修飾的菌株中生產(chǎn)所述糖蛋白。
34.權利要求33的方法,其中所述糖蛋白選自來源于細菌、真菌、病毒或哺乳動物的蛋白質。
35.權利要求33的方法,其中所述糖蛋白是免疫球蛋白或其片段。
36.由權利要求33的方法生產(chǎn)的糖蛋白。
37.權利要求36的糖蛋白,其中所述糖蛋白是免疫球蛋白或其片段。
38.包含編碼GalT的核苷酸序列的載體,所述核苷酸序列與啟動子序列和3′終止序列可操作的連接,其中所述啟動子序列和所述3′終止序列在甲基營養(yǎng)型酵母菌株中是有功能的,以實現(xiàn)所述GalT在所述菌株中的表達。
39.一種試劑盒,包含(1)包含編碼α-1,2-甘露糖苷酶或其功能部分的核苷酸序列的載體;(2)包含編碼GnTI或其功能部分的核苷酸序列的載體;和(3)包含編碼GalT或其功能部分的核苷酸序列的載體,其中每種載體能夠指導所編碼蛋白質在甲基營養(yǎng)型酵母菌株中的表達。
40.權利要求39的試劑盒,還包含能夠破壞所述甲基營養(yǎng)型酵母菌株的基因組OCH1基因的載體。
41.權利要求39的試劑盒,還包含編碼糖蛋白的載體,所述糖蛋白對所述甲基營養(yǎng)型酵母菌株是異源的。
42.權利要求39的試劑盒,還包含所述甲基營養(yǎng)型酵母菌株。
全文摘要
本發(fā)明涉及用于生產(chǎn)具有哺乳動物樣糖基化的糖蛋白的方法和基因工程化甲基營養(yǎng)型酵母菌株。本發(fā)明還涉及用于產(chǎn)生能生產(chǎn)具有哺乳動物樣糖基化的糖蛋白的甲基營養(yǎng)型酵母菌株的載體。本發(fā)明還提供由所述基因工程化甲基營養(yǎng)型酵母菌株生產(chǎn)的糖蛋白。
文檔編號C12N15/81GK1894398SQ200480037294
公開日2007年1月10日 申請日期2004年11月12日 優(yōu)先權日2003年11月14日
發(fā)明者羅蘭德·孔特雷拉斯, 尼科·L·M·卡勒瓦特, 沃特·韋爾夫肯, 弗拉迪米爾·凱戈羅多夫 申請人:研究技術公司