專利名稱:蛋白酶抑制劑及其變異體在絲狀真菌中的表達(dá)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及蛋白酶抑制劑及其變異體在絲狀真菌中表達(dá)的方法。本發(fā)明公開了融 合核酸、載體、融合多肽以及用于獲得蛋白酶抑制劑的方法。
背景技術(shù):
蛋白酶參與很多生物過程。蛋白酶與蛋白酶抑制劑之間的平衡失調(diào)經(jīng)常與病理組 織破壞有關(guān)。許多研究集中在蛋白酶在組織損傷中的作用,并且據(jù)認(rèn)為,蛋白酶與蛋白酶抑制 劑之間的平衡對(duì)保持組織完整性是主要的決定因素。來自包括嗜中性白細(xì)胞的炎性細(xì)胞的 絲氨酸蛋白酶參與多種炎癥疾病,例如肺氣腫、關(guān)節(jié)炎、過敏性濕疹和銀屑病。蛋白酶似乎也對(duì)一些癌的擴(kuò)散起作用。正常細(xì)胞與被稱作胞外基質(zhì)(ECM)的復(fù)雜 蛋白質(zhì)網(wǎng)絡(luò)接觸而生存。ECM是細(xì)胞運(yùn)動(dòng)的屏障,為了轉(zhuǎn)移,癌細(xì)胞必須設(shè)計(jì)出打破它們的 粘附、使之降解的途徑、并移動(dòng)通過ECM。蛋白酶是降解其它蛋白質(zhì)的酶,并且長(zhǎng)久以來被認(rèn) 為是通過消耗ECM幫助腫瘤細(xì)胞從其原始位置釋放出來。最近的研究已經(jīng)表明,通過激活 被稱作蛋白酶-激活受體-2 (PAR2)的腫瘤細(xì)胞膜中的蛋白質(zhì),它們可以促進(jìn)細(xì)胞形狀改變 以及運(yùn)動(dòng)。這導(dǎo)致激活細(xì)胞的運(yùn)動(dòng)器(motility apparatus)的胞內(nèi)反應(yīng)的級(jí)聯(lián)。因此,假 設(shè)在腫瘤轉(zhuǎn)移中的第一步驟之一是細(xì)胞形狀的再組織,以使其在面向移動(dòng)的方向的一邊上 形成不同的突出。然后,細(xì)胞遷移通過血管壁,并移動(dòng)到遠(yuǎn)側(cè)位置,最終重新附著并形成轉(zhuǎn) 移腫瘤(metastasis tumor)。例如,人前列腺上皮細(xì)胞組成性地分泌前列腺-特異性抗原 (PSA),一種激肽釋放酶-樣絲氨酸蛋白酶(kallikrein-like serine protease),其為精液 血漿的正常組分。蛋白酶的作用是降解胞外基質(zhì)并促進(jìn)癌細(xì)胞的侵入。[10]合成的和天然 的蛋白酶抑制劑已經(jīng)顯示出在體內(nèi)和體外抑制腫瘤誘發(fā)。在前的研究調(diào)查表明,已知屬于 結(jié)構(gòu)-相關(guān)蛋白質(zhì)家族的被分類為絲氨酸蛋白酶抑制劑或SERPINS的一些蛋白酶抑制劑, 抑制數(shù)種蛋白酶,包括胰蛋白酶、組織蛋白酶G、凝血酶、組織激肽釋放酶以及嗜中性白細(xì)胞 彈性蛋白酶。SERPINS對(duì)體外預(yù)防/抑制致癌劑_誘導(dǎo)的轉(zhuǎn)化和動(dòng)物模型系統(tǒng)中的癌的發(fā) 生非常有效。全身性給予純化蛋白酶抑制劑減少了關(guān)節(jié)炎癥以及軟骨和骨破壞。 發(fā)現(xiàn)局部施用蛋白酶抑制劑在如過敏性濕疹這樣的狀況中有用途,過敏性濕 疹是皮膚炎癥的一種常見形式,其可以定位于少量的部分,或涉及身體的大部分。蛋白 酶抑制劑的褪色活性以及其可以預(yù)防紫外_誘導(dǎo)色素形成的能力已經(jīng)在體外和體內(nèi)都 H 以 ilH $。 Paine , Journal of Investigative Dermatology 116,587—595 (2001)。 此外,已經(jīng)發(fā)現(xiàn)蛋白酶抑制劑有助于創(chuàng)傷愈合(http://www. sciencedaily. com/ releases/2000/10/001002071718, htm)。已經(jīng)證實(shí),分泌性白細(xì)胞蛋白酶抑制劑在被局部
6給予時(shí),可逆轉(zhuǎn)組織破壞并加速創(chuàng)傷愈合過程。另外,絲氨酸蛋白酶抑制劑也可以幫助減輕 紅斑狼瘡患者的疼痛(參見美國(guó)專利號(hào)6537968)。如上所述,蛋白酶抑制劑干擾蛋白酶的作用。天然存在的蛋白酶抑制劑可以在很 多食品中找到,例如谷類(燕麥、大麥和玉米)、芽甘藍(lán)(Brussels sprouts)、洋蔥、甜菜根、 小麥、龍爪稷(finger millet)和花生。一種感興趣的來源是大豆。在大豆中的Kunitz和 Bowman-Birk的平均含量分別是大約1. 4%和0. 6%, Kuniz和Bowman_Birk是兩種最重要 的蛋白酶抑制劑。這些低含量使得分離用于臨床應(yīng)用的天然蛋白酶抑制劑是不現(xiàn)實(shí)的。因此,需要可生產(chǎn)大量蛋白酶抑制劑及其變異體的方法,這種方法也可以減少或 消除在哺乳動(dòng)物組織培養(yǎng)細(xì)胞中產(chǎn)生這些物質(zhì)中的,與血液_攜帶的傳染劑(blood-borne infectious agent)有關(guān)的風(fēng)險(xiǎn)。在此所提供的本發(fā)明的生產(chǎn)方法允許大量的蛋白質(zhì)治療 劑的生產(chǎn)。
發(fā)明概述在此所提供的是核酸、細(xì)胞以及用于生產(chǎn)蛋白酶抑制劑及其變異體的方法。在第一個(gè)實(shí)施方案中,提供了編碼功能性蛋白酶抑制劑的核酸。在一個(gè)方面,提供 了包含與第一個(gè)、第二個(gè)、第三個(gè)和第四個(gè)核酸序列可操作連接的調(diào)節(jié)序列的核酸。提供了 在第四個(gè)核酸序列之后的終止序列。在第二個(gè)方面,所述第一個(gè)核酸序列編碼在第一絲狀真菌中功能為分泌性序列的 信號(hào)多肽,第二個(gè)核酸編碼正常分泌自所述第一絲狀真菌或第二絲狀真菌的分泌多肽或其 功能部分,第三個(gè)核酸編碼可切割連接子,以及第四個(gè)核酸編碼蛋白酶抑制劑或其片段。在第三個(gè)方面,提供了包含編碼蛋白酶抑制劑的核酸序列的表達(dá)盒。在第四個(gè)方面,本發(fā)明涉及編碼蛋白酶抑制劑變異體的多核苷酸。所述多核苷酸 可以編碼Bowman-Birk抑制劑變異體,其中至少一個(gè)環(huán)已被改變。所述多核苷酸可以編碼 大豆胰蛋白酶抑制劑變異體,其中至少一個(gè)環(huán)已被改變。在第二個(gè)實(shí)施方案中,提供了表達(dá)功能性蛋白酶抑制劑或其變異體的方法。在一 個(gè)方面,(i)宿主細(xì)胞用包含編碼蛋白酶抑制劑或其變異體的核酸序列的表達(dá)盒轉(zhuǎn)化,和 (ii)在合適的條件下被培養(yǎng),以表達(dá)蛋白酶抑制劑或其變異體。任選地,所述方法進(jìn)一步包 括回收蛋白酶抑制劑或其變異體。在第二個(gè)方面,(i)宿主細(xì)胞用包含編碼蛋白酶抑制劑或其變異體的核酸序列的 第一個(gè)表達(dá)盒轉(zhuǎn)化,(ii)用包含編碼侶伴蛋白的核酸序列的第二個(gè)表達(dá)盒轉(zhuǎn)化,和(iii) 在合適的條件下被培養(yǎng),以表達(dá)蛋白酶抑制劑或其變異體。任選地,可以回收蛋白酶抑制劑 或其變異體。在一個(gè)方面,蛋白酶抑制劑或其變異體作為融合蛋白被表達(dá)。任選地,所述方 法進(jìn)一步包括回收蛋白酶抑制劑或其變異體。在第三個(gè)實(shí)施方案中,提供了可以表達(dá)蛋白酶抑制劑或其變異體的細(xì)胞。宿 主細(xì)胞用編碼蛋白酶抑制劑或其變異體的表達(dá)盒轉(zhuǎn)化。宿主細(xì)胞可以選自曲霉屬 (Aspergillus)或木霉屬(Trichoderma)。在第四個(gè)實(shí)施方案中,提供了功能性蛋白酶抑制劑或其變異體。在一個(gè)方面,所 述功能性蛋白酶抑制劑或其變異體作為融合蛋白表達(dá),所述融合蛋白由葡糖淀粉酶信號(hào)序 列、前序列、催化結(jié)構(gòu)域和連接區(qū)域,其可達(dá)成熟葡糖淀粉酶的氨基酸數(shù)目502,隨后的氨基酸NVISKP,以及然后的成熟蛋白酶抑制劑或其變異體組成。在第二個(gè)方面,用蛋白酶處理表達(dá)的蛋白質(zhì),以便從融合蛋白中釋放蛋白酶抑制 劑或其變異體。在第三個(gè)方面,本發(fā)明提供具有蛋白酶抑制活性的多肽,選自a)B0Wman-Birk抑 制劑變異體;b)大豆胰蛋白酶抑制劑變異體;c)B0Wman-Birk抑制劑;d)大豆胰蛋白酶抑 制劑;和e)包含至少一個(gè)變異體序列的骨架。根據(jù)下面詳細(xì)的描述,本發(fā)明的其它目的、特征和優(yōu)勢(shì)將是顯而易見的。然而,應(yīng) 當(dāng)理解,雖然指明是本發(fā)明的優(yōu)選實(shí)施方案,所述詳細(xì)的描述和具體實(shí)施例僅通過舉例說 明被提供,因?yàn)楦鶕?jù)該詳細(xì)描述,在本發(fā)明的范圍和精神之內(nèi)的各種改變和修改對(duì)本領(lǐng)域 普通技術(shù)人員將是顯而易見的。
附圖簡(jiǎn)述
圖1是大豆Bowman-Birk型蛋白酶抑制劑的密碼子優(yōu)化的核苷酸序列(BBI) (SEQ ID N0:1)。該序列包括編碼NVISKR的核苷酸(點(diǎn)下劃線)、融合蛋白的切割位點(diǎn)以及克隆 到表達(dá)質(zhì)粒中的三個(gè)限制性酶位點(diǎn)。在5’端的Nhel位點(diǎn)和在3’端的Xhol位點(diǎn)被加以下 劃線并進(jìn)行標(biāo)記。在3’端的BstEII位點(diǎn)用#符號(hào)標(biāo)出。終止密碼子用星號(hào)標(biāo)明。沒有起 始密碼子,因?yàn)槠渥鳛槿诤系鞍妆槐磉_(dá)。編碼成熟BBI的序列由雙下劃線標(biāo)注(SEQ ID NO 2)。在圖2中所示,使用編碼三個(gè)甘氨酸殘基的序列,可以將編碼三個(gè)甘氨酸(圖1B)殘基 的核苷酸添加到編碼成熟BBI的序列之前(SEQ ID N0:5)。圖1C示出了編碼BBI的核苷 酸序列、三個(gè)限制性位點(diǎn)、kex2位點(diǎn)、在N-端的三個(gè)甘氨酸殘基和在C-端的六個(gè)組氨酸殘 基(SEQ ID NO 54)。圖2是大豆胰蛋白酶抑制劑(STI),Kunitz型蛋白酶抑制劑的密碼子優(yōu)化的核苷 酸序列(SEQ ID NO 3)。該序列包括編碼NVISKR的核苷酸(點(diǎn)下劃線)(SEQ ID NO 4)、融 合蛋白的切割位點(diǎn)以及在C-端的六個(gè)組氨酸殘基(用點(diǎn)表示)。也包括用于克隆到表達(dá)質(zhì) 粒中的三個(gè)限制酶位點(diǎn)(在5'端的Nhel和在3'端的Xhol和BstEII,如圖1所述進(jìn)行標(biāo) 記)。用黑體表示在kex2位點(diǎn)(NVISKR)之后的三個(gè)甘氨酸殘基。編碼成熟STI的核苷酸 序列由虛下劃線標(biāo)出(SEQ IN NO 6) 0圖3A是BBI的成熟氨基酸序列(SEQ ID NO 7)。圖3B是在N-端具有三個(gè)甘氨 酸殘基的BBI(SEQ ID N0:8)。圖3C是在N-端具有三個(gè)甘氨酸殘基和在C-端具有六個(gè)組 氨酸殘基的BBI(SEQ IDN0 9)。在圖3A-C中,環(huán)1由下劃線標(biāo)出的氨基酸殘基表示,環(huán)II
氨基酸殘基由黑體字表示。圖4A是在N-端具有三個(gè)甘氨酸殘基和在C-端具有六個(gè)組氨酸殘基的成熟 STI (SEQ ID NO: 10)。圖4B是在N-端具有三個(gè)甘氨酸殘基的STI (SEQ ID NO: 11)。圖4C 是STI的成熟氨基酸序列(SEQ IDN0 :12)。環(huán)1由下劃線的氨基酸殘基表示(SEQ ID NO 13)。環(huán)II氨基酸殘基由黑體字表示(SEQ ID NO 14)。圖5是表達(dá)質(zhì)粒pSLGAMpR2-BBI的圖。該表達(dá)質(zhì)?;趐SLGAMpR2,其是 通過插入黑曲霉(A.niger)葡糖淀粉酶啟動(dòng)子、催化核心和終止子、標(biāo)記基因(黑曲 霉pyrG)和牛凝乳酶原基因,由pSLl 180衍生而來。pSLl 180質(zhì)粒供應(yīng)自Amersham Biosciences (Piscataway,NJ)。pSLGAMpR2質(zhì)粒具有上面所列出的插入在與如
8pSLGAMpR2-BBI所示的相同的相對(duì)位置的元件,除牛凝乳酶原基因位于BBI基因處之外。因 此,在pSLGAMpR2中BBI基因置換凝乳酶原基因,以產(chǎn)生pSLGAMpR2_BBI。圖 6 是野生型 BBI (SEQ ID NO :7)和 BBI 的選擇的變異體(SEQID NOs 15 thru 29)的氨基酸序列。野生型BBI具有下劃線的環(huán)。變異體與野生型的差別被顯示為或者粗 體/下劃線(環(huán)1)或者粗體(環(huán)II)。在一些變異體中,例如02丄3丄4丄5和8因子,在 位置13的丙氨酸(在兩個(gè)半光氨酸之間)也被變?yōu)榛蛘摺敖z氨酸”、“甘氨酸”或者“谷氨酰 胺”。并且,compstatin肽具有9個(gè)氨基酸而不是7個(gè)。也顯示了變異體序列(SEQ ID NOs 30 thru 40)。圖7是蛋白質(zhì)SDS凝膠的照片。泳道1含有分子量標(biāo)記。泳道2是未轉(zhuǎn)化的親代 菌株。泳道3是用編碼BBI的DNA轉(zhuǎn)化的親代菌株。泳道4是用編碼BBI的載體和編碼侶 伴蛋白(pdiA)的載體共轉(zhuǎn)化的親代菌株。泳道15是用編碼BBI的載體和編碼侶伴蛋白 (prpA)的載體共轉(zhuǎn)化的親代菌株。在侶伴蛋白存在時(shí),期望蛋白質(zhì)例如BBI的表達(dá)得以增強(qiáng)。圖8是質(zhì)粒pTrex4的圖。圖 9A-D 是 pTrex2 的核酸序列(SEQ ID NO 41)。
發(fā)明詳述現(xiàn)在使用下面的定義和實(shí)施例,僅以參考的方式,本發(fā)明被予以詳細(xì)的描述。在此 所參考的所有專利和出版物,包括公開在此類專利和出版物中的所有序列,被清楚地引入 作為參考。除非在本文中另外被定義,此處所使用的所有技術(shù)和科學(xué)術(shù)語(yǔ)具有與本發(fā)明 所屬領(lǐng)域中的普通技術(shù)人員一般所理解的同樣的含義。Singleton等,DICTIONARY OF MICROBIOLOGY AND M0LECULARBI0L0GY,2D ED.,John Wiley and Sons,New York(1994)和 Hale &Marham,THE HARPER C0LINS DICTIONARY OF BIOLOGY,HarperPerennial,NY (1991) 為普通技術(shù)人員提供了關(guān)于本發(fā)明中所使用的很多術(shù)語(yǔ)的綜合詞典。盡管在本發(fā)明的實(shí)踐 或試驗(yàn)中可以使用與那些在此所述的相似或等同的任何方法或材料,優(yōu)選的方法和材料被 予以描述。數(shù)字范圍包括定義范圍的數(shù)字。除非另外指示,分別地,核酸以5'到3'的方 向,從左到右書寫;氨基酸以氨基到羧基的方向,從左到右書寫。至于本領(lǐng)域的定義和術(shù)語(yǔ), 技術(shù)人員特別要參考Sambrook等,1989和Ausubel FM等,1993。應(yīng)當(dāng)理解,本發(fā)明并不限 于所述的具體方法、方案和試劑,因?yàn)檫@些可以改變。此處所提供的標(biāo)題并非限制本發(fā)明的各個(gè)方面或?qū)嵤┓桨?,其通過參考說明書作 為一個(gè)整體而被擁有。因此,通過參考作為整體的說明書,下面隨即所定義的術(shù)語(yǔ)被更加充 分地定義。
定義(expression cassette)(expression vector) "^M^Lf1 生或合成產(chǎn)生的核酸構(gòu)建物(nucleic acid construct),該核酸構(gòu)建物具有允許特定核酸 在靶細(xì)胞中轉(zhuǎn)錄的一系列具體的核酸元件。重組表達(dá)盒可以被整合到質(zhì)粒、染色體、線粒體 DNA、質(zhì)粒DNA、病毒或核酸片段中。一般地,除其它序列之外,表達(dá)載體的重組表達(dá)盒部分包括待轉(zhuǎn)錄的核酸序列和啟動(dòng)子。表達(dá)盒可以與DNA構(gòu)建物及其語(yǔ)法等同物交替使用。如此處所用,術(shù)語(yǔ)“載體(vector) ”指的是被設(shè)計(jì)為將核酸序列轉(zhuǎn)移到細(xì)胞中的核 酸構(gòu)建物。“表達(dá)載體(expression vector) ”指的是有能力將異源DNA片段整合到外源細(xì) 胞中,并在外源細(xì)胞中表達(dá)的載體。許多原核和真核表達(dá)載體是商業(yè)可得的。合適的表達(dá) 載體的選擇在具有本領(lǐng)域技術(shù)的普通技術(shù)人員的知識(shí)范圍內(nèi)。如此處所用,術(shù)語(yǔ)“質(zhì)粒(plasmid) ”指的是被用作克隆載體的環(huán)狀雙鏈(ds)DNA 構(gòu)建物,并且其在一些真核細(xì)胞中形成染色體外自我復(fù)制的遺傳元素,或者整合到宿主染 色體內(nèi)。術(shù)語(yǔ)“核酸分子(nucleicacid molecule)” 或“核酸序列(nucleicacid sequence) ”包括RNA、DNA和cDNA分子。應(yīng)當(dāng)理解,作為遺傳密碼簡(jiǎn)并性的結(jié)果,可以產(chǎn)生 眾多編碼特定蛋白質(zhì)的核苷酸序列。如此處所用,“融合DNA序列(fusion DNA sequence)”從5'到3',包含第一個(gè)、 第二個(gè)、第三個(gè)和第四個(gè)DNA序列。如此處所用,“第一個(gè)核酸序列(first nucleic acid sequence) ”或“第一個(gè) DNA序列(first DNA sequence) ”編碼在絲狀真菌中功能為分泌性序列的信號(hào)肽。這 樣的信號(hào)序列包括來自葡糖淀粉酶、a-淀粉酶和天冬氨酰蛋白酶的那些信號(hào)序列,所 述葡糖淀粉酶、a-淀粉酶和天冬氨酰蛋白酶來自黑曲霉泡盛變種(Aspergillus niger var. awamori)、黑曲霉(Aspergillus niger)、米曲霉(Aspergillus oryzae);來自木 霉屬(Trichoderma)的纖維二糖水解酶I、纖維二糖水解酶II、內(nèi)切葡聚糖酶I、內(nèi)切 葡聚糖酶III的信號(hào)序列;來自葡糖淀粉酶的信號(hào)序列,所述葡糖淀粉酶來自鏈孢霉屬 (Neurospora)和腐質(zhì)霉屬(Humicola);以及真核細(xì)胞的信號(hào)序列,包括來自牛凝乳酶、人 組織纖溶酶原激活子、人干擾素的信號(hào)序列,以及例如由Gwyrme等(1987)Bio/Technoloqy 5,713-719 Ijf^W^j^W^W^tlff(consensuseukaryotic signal sequence)。 特別優(yōu)選的信號(hào)序列是那些由表達(dá)宿主所分泌的多肽衍生而來的信號(hào)序列,所述表達(dá)宿主 被用于表達(dá)和分泌融合多肽。例如,當(dāng)表達(dá)和分泌來自黑曲霉(Aspergillus niqer)的融 合多肽時(shí),則優(yōu)選來自黑曲霉的葡糖淀粉酶的信號(hào)序列。如此處所用,第一個(gè)氨基酸序列對(duì) 應(yīng)于在絲狀真菌內(nèi)起作用的分泌性序列。這樣的氨基酸序列由所定義的第一個(gè)DNA序列編 碼。如此處所用,“第二個(gè)DNA序列(second DNA sequences) ”編碼從絲狀真菌中正 常表達(dá)的“分泌多肽(secreted polypeptides) 這樣的分泌多肽包括來自黑曲霉泡盛變 種、黑曲霉和米曲霉的葡糖淀粉酶、a-淀粉酶和天冬氨酰蛋白酶;來自木霉屬的纖維二糖 水解酶I、纖維二糖水解酶II、內(nèi)切葡聚糖酶I和內(nèi)切葡聚糖酶III ;以及來自鏈孢霉屬的 種和腐質(zhì)霉的種的葡糖淀粉酶。如同第一個(gè)DNA序列,優(yōu)選的分泌多肽是那些由絲狀真菌 表達(dá)宿主天然分泌的多肽。因此,例如當(dāng)使用黑曲霉時(shí),優(yōu)選的分泌多肽是來自黑曲霉的葡 糖淀粉酶和a-淀粉酶,最優(yōu)選葡糖淀粉酶。在一個(gè)方面,該葡糖淀粉酶與曲霉屬的葡糖淀 粉酶的同源性大于95%、96%、97%、98%或99%。當(dāng)曲霉屬葡糖淀粉酶是由第二個(gè)DNA序列編碼的分泌多肽時(shí),可以使用全蛋白質(zhì) 或其部分,任選包括前序列。因此,在從位置468-509的任何氨基酸殘基上,可以將可切割 連接多肽(linker polypeptide)融合到葡糖淀粉酶中。其它氨基酸殘基也可以成為融合
10位點(diǎn),但是利用上述殘基是特別有優(yōu)勢(shì)的?!胺置诙嘣绿墓δ懿糠?functional portion of a secretedpolyp印tide) ”或語(yǔ) 法等同物指截?cái)嗟姆置诙嚯?,雖然被截短,其保留可折疊成正常構(gòu)型的能力。例如,在通過 黑曲霉泡盛變種生產(chǎn)牛凝乳酶的情況下,已經(jīng)顯示,與前凝乳酶原(pr印rochymosin)的生 產(chǎn)相比,在成熟葡糖淀粉酶的第11個(gè)氨基酸之后的凝乳酶原的融合沒有提供益處(美國(guó)專 利5,364,770)。在USSN 08/318,494中顯示,在高達(dá)成熟葡糖淀粉酶的第297個(gè)氨基酸處, 將凝乳酶原融合到前葡糖淀粉酶(pr印roglucoamylase)的C_端,加上成熟葡糖淀粉酶的 氨基酸1-11的重復(fù),沒有在黑曲泡盛變種中產(chǎn)生分泌型凝乳酶。在后面的情況中,存在于 融合蛋白中的葡糖淀粉酶催化結(jié)構(gòu)域的部分(大約63% )能夠正確地折疊是不可能的,因 此可能已經(jīng)產(chǎn)生了異常的、錯(cuò)誤折疊的和/或不穩(wěn)定的融合蛋白,其不能被細(xì)胞分泌。部分 催化結(jié)構(gòu)域不能正確地折疊可能已經(jīng)干擾了所連接的凝乳酶的折疊。因此,必須存在天然 分泌多肽的結(jié)構(gòu)域的足夠殘基,以允許它以其正常構(gòu)型折疊,獨(dú)立于它所連接的期望多肽, 這是有可能的。在大多數(shù)情況下,分泌多肽的部分不但會(huì)正確折疊,并且與其不存在時(shí)相比可導(dǎo) 致分泌增加。類似地,在大多數(shù)情況下,分泌多肽的截?cái)嘁馕吨δ懿糠?functional portion)保留了生物功能。在優(yōu)選的實(shí)施方案中,使用了分泌多肽的催化結(jié)構(gòu)域 (catalytic domain),盡管可以使用其它功能域,例如底物結(jié)合結(jié)構(gòu)域(substrate binding domains)。在黑曲霉和黑曲霉泡盛變種葡糖淀粉酶的情況下,優(yōu)選的功能部分保 留了酶的催化結(jié)構(gòu)域,并且包括氨基酸1-471。另外優(yōu)選的實(shí)施方案使用催化結(jié)構(gòu)域和所有 或部分連接區(qū)。可選擇地,可以使用葡糖淀粉酶的淀粉結(jié)合結(jié)構(gòu)域,其包含黑曲霉和黑曲霉 泡盛變種葡糖淀粉酶的氨基酸509-616。如此處所用,“第三個(gè)DNA序列(third DNA sequences) ”包含編碼可切割連接多 肽的DNA序列。這樣的序列包括那些編碼葡糖淀粉酶的前序列、牛凝乳酶的前序列、枯草蛋 白酶的前序列、包括人免疫缺陷病毒蛋白酶的逆轉(zhuǎn)錄蛋白酶的前序列的序列,以及編碼被 胰蛋白酶、因子Xa膠原酶、梭菌蛋白酶、枯草蛋白酶、凝乳酶、酵母KEX2蛋白酶、曲霉屬KEXB 及類似物識(shí)別并切割的氨基酸序列的DNA序列。參見例如Marston,F(xiàn). A. 0. (1986)Biol. Chem J. 240,1-12。這樣的第三個(gè)DNA序列也可以編碼可以被溴化氰選擇性切割的氨基酸 甲硫氨酸。應(yīng)當(dāng)理解,第三個(gè)DNA序列僅需要編碼被特定的酶或化學(xué)試劑識(shí)別所必需的氨 基酸序列,以進(jìn)行融合多肽的切割。因此,不必使用例如葡糖淀粉酶、凝乳酶或枯草蛋白酶 的完整前序列。相反,僅對(duì)被合適的酶識(shí)別和切割是必需的那部分前序列是不可缺少的。應(yīng)當(dāng)理解,第三個(gè)核酸僅需要編碼被特定的酶或化學(xué)試劑識(shí)別所必需的氨基酸序 列,以引起融合多肽的切割。特別優(yōu)選的可切割連接子是KEX2蛋白酶識(shí)別位點(diǎn)(Lys-Arg)——其可以被天然 曲霉屬KEX2-樣(KEX2-like) (KEXB)蛋白酶切割、胰蛋白酶識(shí)別位點(diǎn)Lys和Arg,以及內(nèi)切 蛋白酶的切割識(shí)別位點(diǎn)-Lys-C。如此處所用,“第四個(gè)DNA序列(fourth DNA sequence) ”編碼“期望多肽(desired polypeptides) ”。這樣的期望多肽包括蛋白酶抑制劑及其變異體。上面所定義的編碼相應(yīng)的四種氨基酸序列的DNA序列結(jié)合形成“融合DNA序列(fusion DNA sequence)”。這樣的融合DNA序列從5 ‘端到3'端按第一、第二、第三和第 四DNA序列的順序被裝配在合適的閱讀框中。當(dāng)這樣裝配時(shí),DNA序列將編碼“融合多肽 (fusionpolyp印tide) ”或“融合蛋白(fusion protein) ”或“融合類似物(fusionanalog), 從其氨基端起,編碼在絲狀真菌中功能為分泌性序列的信號(hào)肽、正常分泌自絲狀真菌的分 泌多肽或其部分、可切割連接多肽以及期望多肽。如此處所用,術(shù)語(yǔ)“期望蛋白質(zhì)(desired protein) ”或“期望多肽(desired polyp印tide)”指的是處于其成熟形式的多肽或蛋白質(zhì),其沒有被融合到分泌增強(qiáng)構(gòu)建物 (secretion enhancing construct)中。因此,“其月望蛋白質(zhì)(desired protein),,或“其月望 多肽(desired polyp印tide) ”指的是以非融合形式被宿主細(xì)胞表達(dá)和分泌的蛋白質(zhì)。如此處所用,“融合多肽(fusionpolypeptide) ”或“融合蛋白(fusion protein),, 或“融合類似物(fusion analog)”從其氨基端起,編碼在宿主細(xì)胞中作為分泌性序列的信 號(hào)肽、正常分泌自宿主細(xì)胞的分泌多肽或其部分、可切割連接多肽以及期望的多肽??梢?通過宿主細(xì)胞酶例如蛋白酶加工融合蛋白,以便產(chǎn)生與融合蛋白中的其它蛋白質(zhì)序列分離 的期望蛋白質(zhì)。如此處所用,術(shù)語(yǔ)“融合類似物(fusion analog)”或“融合多肽(fusion polyp印tide)”或“融合蛋白(fusion protein) ”可以被交替使用。如此處所用,“啟動(dòng)子序列(promoter sequence) ”是被具體絲狀真菌識(shí)別用于 表達(dá)目的的DNA序列。它被可操作性地連接到編碼上面所定義的融合多肽的DNA序列上。 這樣的連接包括與編碼融合DNA序列的DNA序列的翻譯起始密碼子有關(guān)的啟動(dòng)子的定位。 啟動(dòng)子序列含有介導(dǎo)融合DNA序列表達(dá)的轉(zhuǎn)錄和翻譯控制序列。例子包括來自黑曲霉泡 盛變種或黑曲霉葡糖淀粉酶基因的啟動(dòng)子(Nunberg, J. H.等(1984)Mol. Cell. Biol. 4, 2306-2315 ;Boel, E.等(1984)EMB0 J. 3,1581-1585);米曲霉、黑曲霉泡盛變種或黑曲霉 a-淀粉酶基因,米黑根毛霉(Rhizomucor miehei)羧基蛋白酶基因,里氏木霉纖維二糖 水解酶I基因的啟動(dòng)子(Shoemaker, S. P.等(1984)歐洲專利申請(qǐng)?zhí)朎P00137280A1);構(gòu) 巢曲霉菌(A. nidulans)trpC 基因的啟動(dòng)子(Yelton,M.等(1984)Proc. Natl. Acad. Sci. USA 81,1470-1474 ;Mullaney, E.J.等(1985) Mol. Gen. Genet. 199,37-45);構(gòu)巢曲霉菌 alcA 基因的啟動(dòng)子(Lockington, R. A.等(1986)Gene 33 137-149);構(gòu)巢曲霉菌 amdS 基 因的啟動(dòng)子(McKnight,G. L.等(1986) Cell 46,143-147);構(gòu)巢曲霉菌amdS基因的啟動(dòng)子 (Hynes,M. J.等(1983)Mol. Cell Biol. 3,1430-1439),以及較高等的真核細(xì)胞啟動(dòng)子,例如 SV40 早期啟動(dòng)子(Barclay, S. L.和 E. Meller (1983)Molecular and Cellular Bioloay 3, 2117-2130)。同樣,“終止序列(terminator sequence) ”是被表達(dá)宿主識(shí)別以終止轉(zhuǎn)錄的DNA 序列。它被可操作性地連接到編碼待被表達(dá)的融合多肽的融合DNA的3'端。例子包括來 自構(gòu)巢曲霉菌 trpC 基因(Yelton, M.等(1984)Proc. Natl. Acad. Sci. USA 81,1470-1474 ; Mullaney, E.J.等(1985) Mol. Gen. Genet. 199,37-45)、黑曲霉泡盛變種或黑曲霉葡糖淀粉 酶基因(Nunberg,J. H.等(1984)Mol. Cell. Biol. 4,2306-253 ;Boel,E.等(1984)EMB0 J. 3, 1581-1585)、米曲霉、黑曲霉泡盛變種或黑曲霉a-淀粉酶基因以及米黑根毛霉羧基蛋白 酶基因(EP0
發(fā)明者B·施密特, D·A·埃斯特爾, H·德諾貝爾, S·D·鮑爾, 劉巍, 王華明 申請(qǐng)人:金克克國(guó)際有限公司