專利名稱:生物合成的脯氨酸/丙氨酸無規(guī)卷曲多肽及其用途的制作方法
生物合成的脯氨酸/丙氨酸無規(guī)卷曲多肽及其用途本發(fā)明涉及生物合成的無規(guī)卷曲多肽(random coil polypeptide)或生物合成的無規(guī)卷曲多肽區(qū)段或綴合物,所述生物合成的無規(guī)卷曲多肽或生物合成的無規(guī)卷曲多肽區(qū)段或綴合物包含僅由脯氨酸和丙氨酸氨基酸殘基組成的氨基酸序列,其中所述氨基酸序列由至少約50個脯氨酸(Pro)和丙氨酸(Ala)氨基酸殘基組成。所述至少約50個脯氨酸(Pro)和丙氨酸(Ala)氨基酸殘基可以是異源多肽或異源多肽構建體的組成部分。還描述了這些生物合成的無規(guī)卷曲多肽、所述多肽區(qū)段或所述綴合物的用途和使用方法。所述用途可特別包括醫(yī)藥用途、診斷用途或食品工業(yè)用途以及在其它工業(yè)應用中的用途,例如造紙工業(yè)、采油等。本發(fā)明還涉及本文提供的生物合成的無規(guī)卷曲多肽或生物合成的無規(guī)卷曲多肽區(qū)段或綴合物的具體用途,所述生物合成的無規(guī)卷曲多肽或生物合成的無規(guī)卷曲多肽區(qū)段或綴合物包含僅由脯氨酸和丙氨酸氨基酸殘基組成的氨基酸序列。本文提供的生物合成的無規(guī)卷曲多肽或生物合成的無規(guī)卷曲多肽區(qū)段的氨基酸序列由至少約50、至少 約100、至少約150、至少約200、至少約250、至少約300、至少約350或至少約400個脯氨酸(Pro)和丙氨酸(Ala)氨基酸殘基組成。所述至少約50、至少約100、至少約150、至少約200、至少約250、至少約300、至少約350或至少約400個脯氨酸(Pro)和丙氨酸(Ala)氨基酸殘基優(yōu)選為(a)異源多肽或異源多肽構建體的組成部分或優(yōu)選為(b)綴合物的組成部分,所述綴合物例如藥物綴合物、具有食品或美容用品成分或添加劑的綴合物、具有生物活性化合物的綴合物或具有光譜學活性化合物的綴合物。具體而言,本文提供異源蛋白,其中這些蛋白包含至少兩個結構域,其中所述至少兩個結構域中的第一結構域包含具有和/或介導諸如生物活性的活性的氨基酸序列,所述至少兩個結構域中的第二結構域包含本發(fā)明的生物合成的無規(guī)卷曲脯氨酸/丙氨酸多肽或脯氨酸/丙氨酸多肽區(qū)段。本發(fā)明特別涉及藥物綴合物,其包含(i)生物合成的無規(guī)卷曲多肽或多肽區(qū)段,所述多肽或多肽區(qū)段包含僅由脯氨酸和丙氨酸氨基酸殘基組成的氨基酸序列,其中所述氨基酸序列由至少50個脯氨酸(Pro)和丙氨酸(Ala)氨基酸殘基組成,和(ii)藥物,所述藥物選自(a)包含具有或介導生物活性的氨基酸序列或是具有或介導生物活性的氨基酸序列的生物活性蛋白或多肽,和(b)小分子藥物。本發(fā)明的另一主題是藥物綴合物,其包含本文提供的生物合成的無規(guī)卷曲脯氨酸/丙氨酸多肽或脯氨酸/丙氨酸多肽區(qū)段,以及藥學或醫(yī)學有用的分子,例如小分子、肽或生物大分子(例如蛋白、核酸、碳水化合物、脂質囊泡)等,所述藥學或醫(yī)學有用的分子與所述生物合成的無規(guī)卷曲脯氨酸/丙氨酸多肽或脯氨酸/丙氨酸多肽區(qū)段連接和/或偶聯(lián)。此外,公開了編碼生物合成的無規(guī)卷曲多肽或多肽區(qū)段和/或生物活性異源蛋白的核酸分子以及包含所述核酸分子的載體和細胞。此外,公開了產生本文所述的本發(fā)明生物合成的無規(guī)卷曲多肽或多肽區(qū)段和相應藥物或食品綴合物(即,包含本文所述的生物合成的無規(guī)卷曲多肽或多肽區(qū)段和食品成分或食品添加劑的綴合物)的方法。還公開了相應的綴合物(作為一種組成部分包含本文公開的生物合成的無規(guī)卷曲多肽或多肽區(qū)段),其特別包含美容用品成分或添加劑或生物學或光譜學活性化合物。此外,本發(fā)明提供包含本發(fā)明的化合物的組合物(即,本文公開的無規(guī)卷曲多肽或無規(guī)卷曲多肽區(qū)段和編碼其的核酸分子,所述無規(guī)卷曲多肽或無規(guī)卷曲多肽區(qū)段包含僅由脯氨酸和丙氨酸氨基酸殘基組成的氨基酸序列),以及本發(fā)明的所述無規(guī)卷曲多肽或多肽區(qū)段、包含所述無規(guī)卷曲多肽或無規(guī)卷曲多肽區(qū)段的生物活性蛋白、藥物綴合物、食品綴合物或核酸分子、載體和細胞的具體用途。還提供了產生和/或獲得本發(fā)明生物合成的無規(guī)卷曲多肽或多肽區(qū)段的方法,以及產生和/或獲得本發(fā)明生物活性異源蛋白和/或多肽構建體或藥物綴合物的方法。此外,本文提供了生物合成的無規(guī)卷曲多肽或多肽區(qū)段(或包含所述無規(guī)卷曲多肽或多肽區(qū)段的分子和綴合物)的醫(yī)學用途、藥學用途以及診斷用途,所述無規(guī)卷曲多肽或多肽區(qū)段包含本文所述的僅由脯氨酸和丙氨酸氨基酸殘基組成的氨基酸序列。所述醫(yī)學用途或藥學用途可以包括所述生物合成的無規(guī)卷曲多肽或多肽區(qū)段作為血漿擴容劑等的用途。然而,本文提供的方式和方法不限于藥學、醫(yī)學和生物學用途,并且還可以用于其它工業(yè)領域,例如造紙工業(yè)、采油等。由腎過濾導致的從血液循環(huán)快速清除是小分子(包括小蛋白和肽)的通常性質。然而,通過使表觀分子維度增大至超過腎小球的孔徑,可以將治療蛋白的血漿半衰期延長到醫(yī)學上有用的數(shù)天的范圍。實現(xiàn)該效果的一個策略是將生物制劑與合成聚合物 聚乙二醇(PEG)進行化學偶聯(lián)。這種策略已經獲得了數(shù)種獲批準的藥物,例如PEG-干擾素 a 2a (Pegasys )、PEG-G-CSF (Neulasta )以及近期的 PEG 化的 a TNF-Fab 片段(Cimzia )J^管如此,"peg化〃技術具有幾個缺點臨床級PEG衍生物很昂貴,并且它們與重組蛋白的共價偶聯(lián)需要額外的下游加工和純化步驟,從而會降低產率并提高成本。此夕卜,PEG不是生物可降解的,這能帶來副作用,例如連續(xù)治療后的腎上皮空泡形成;參見,例如,Gaberc-Porekar(2008)Curr Opin Drug Discov Devel 11:242-50 ;Knop (2010)AngewChem Int Ed Engl 49:6288-308 或Armstrong in:Veronese (Ed.), “PEGylated Proteindrugs:Basic Science and Clinical Applications,,;BirkJlMuSer Verlag, Basel 2009。為了克服PEG技術的一些缺點,本領域中已提供了某些重組多肽模擬物,其中的一些是基于天然存在的氨基酸序列或合成的氨基酸段(stretch)。大部分天然氨基酸序列在生理溶液中的表現(xiàn)不像理想的隨機鏈,因為它們傾向于采取折疊的構象(二級結構),或者如果它們不折疊,它們通常是不溶的并形成聚集體。事實上,研究多肽的隨機鏈行為的大部分經典實驗是在變性條件下進行的,即,在化學變性劑例如尿素或鹽酸胍的存在下(參見,例如,Cantor(1980)Biophysical Chemistry,ff. H. Freeman and Company, New York)。因此,這些技術通常依賴于,即使與折疊的治療蛋白結構域基因融合的情況下,也能在生理緩沖液條件和溫度下抵抗折疊、聚集以及非特異性吸附并從而能提供穩(wěn)定的隨機鏈的特殊氨基酸序列。在這些情況下,這類重組PEG模擬物會使尺寸的增加大大超過僅基于它們的分子量所能通常預期的尺寸,最終阻礙腎過濾并有效地延長重要因子所連接的生物制劑的血漿半衰期。然而,這些技術中的很多具有其它注意事項和缺點。例如,已經測試了天然存在的重復性氨基酸序列在醫(yī)學和藥學方法中的可用性。這些方法中的一種涉及克氏錐蟲(Trypanosoma cruzi)的反式唾液酸酶。其含有680個氨基酸殘基的催化結構域,催化結構域之后是C末端重復性結構域,被稱為"流急性期抗原(shed acute phase antigen)" (SAPA),其包含數(shù)量可變的12聚體氨基酸重復。含有13個親水性和(在生理PH下)帶負電的對應氨基酸重復(具有天然序列DSSAHSTPSTPA)的反式唾液酸酶的小鼠藥代動力學(PK)研究顯示出血漿半衰期比缺失了 C末端重復性序列的重組酶長5倍(Buscaglia (1999) Blood 93:2025-32)。在相同的反式唾液酸酶融合之后,即,它的76kDa催化結構域與在克氏錐蟲蛋白抗原13中發(fā)現(xiàn)的13個帶電的序列EPKSA氨基酸重復,也觀察到相似的半衰期延長效應。在來自SAPA的重復和來自抗原13的重復與來自日本血吸蟲(Schistosoma japonicum)的異源蛋白谷胱甘肽S轉移酶(GST)的兩個C末端基因融合之后,兩種重復都能將該同二聚化酶的血漿半衰期延長7-8倍(參見Buscaglia,同上)。然而,盡管這些來自人病原體的天然存在的重復性氨基酸序列原則上似乎很適合于優(yōu)化治療蛋白的藥代動力學,但是發(fā)現(xiàn)它們的免疫原性很高(參見AfTranchino (1989),MolBiochem Parasitol 34:221-8 或Buscaglia(1998), J Infect Dis 1998;177:431-6)。另一方法涉及使用明膠。明膠是水解并變性了的動物膠原蛋白,其含有長段的Gly-Xaa-Yaa重復,其中Xaa和Yaa分別主要由脯氨酸和4_羥基脯氨酸構成。明膠的琥珀酰化主要是通過天然散在的賴氨酸側鏈的ε -氨基,這能增加該生物聚合物的親水性并降低其等電點(PD。據(jù)推測,經修飾的側鏈的帶負電的羧化物基團之間的分子內靜電排斥能使分子展開為多少伸展的構象。所實現(xiàn)的增大的體積使琥珀?;拿髂z能作為用于人體血衆(zhòng)擴容劑的大分子,特別是在市場上以VolpjexW: (Beacon Pharmaceutics Ltd) 或Gebfusine (B. Braun Melsungen AG)銷售。此外,粒細胞集落刺激因子(G-CSF)與人工明膠樣多肽的基因融合實現(xiàn)了半衰期延長效應(Huang(2010)Eur J Pharm Biopharm74:435-41)。為此,天然明膠的所有疏水性側鏈被親水性殘基交換,這產生了包含不同順序的氨基酸G、P、E、Q、N、S和K的116個氨基酸的明膠樣蛋白(GLK)。G-CSF在其N末端與4拷貝的該GLK序列融合,并在巴斯德畢赤酵母(Pichia pastoris)中分泌。巴斯德畢赤酵母看起來可作為GLK融合蛋白的良好的制備生物體;然而,其它生物體中是否也能產生GLK還是未知的,因為已知的是重組明膠片段在大腸桿菌中僅低量表達,如01sen(2003),AdvDrug Deliv Rev 55:1547-67 所不。彈性蛋白是很多組織中細胞外基質的組分。其由可溶性前體彈性蛋白原形成,彈性蛋白原由親水性的富含Lys/Ala的結構域和具有重復性序列的疏水性彈性體結構域組成。親水性結構域中賴氨酸側鏈的酶學交聯(lián)實現(xiàn)不可溶性彈性蛋白的形成。彈性蛋白樣多肽(ELP)是人工設計的、源于彈性蛋白原的疏水性結構域的重復性氨基酸序列。ELP的最常見的重復序列基序是V-P-G-X-G,其中“X”可以是除Pro之外的任何氨基酸(MacEwan(2010)Biopolymers 94:60-77;Kim(2010)Adv Drug Deliv Rev62:1468-78)。合適的 ELP 可以與治療蛋白和融合,并在大腸桿菌中產生。因此,ELP在注射后形成凝膠樣貯庫的能力能顯著延長所連接的生物制劑的體內半衰期,但是是通過的機制不同于其它無組織的多肽。然而,ELP連接能阻礙融合伴侶的生物活性,正如在IL-I誘導的淋巴細胞增殖生物學檢測中對于白介素-I 受體拮抗劑所顯示的(Shamji (2007)Arthritis Rheum. 11:3650-3661)。此外,ELP易于被諸如膠原蛋白酶的內源性蛋白酶降解。同樣,聚集的蛋白通常對免疫原性更敏感。其它方法涉及使用聚陰離子聚合物。例如,聚谷氨酸(PG)已與用于癌癥治療的可溶性較差的細胞毒性小分子藥物化學偶聯(lián)。相應的產品是Opaxio ,其是目前處于臨床III期研究中的紫杉醇藥物綴合物。與未修飾的化合物相比,紫杉醇PG綴合物的半衰期延長3-14 倍(Singer (2005) JControl Release 109:120-6)。其它融合蛋白,例如在 N末端與一段175個連續(xù)Glu殘基融合的G-CSF,或在C末端攜帶84個殘基PG尾部的IFN- α 2,在大腸桿菌細胞質中以可溶性狀態(tài)產生(參見W02002/077036)。對于有效翻譯,N末端融合需要前導肽,其隨后由煙草蝕紋病毒(TEV)蛋白酶切割來去除。G-CSF和INF-a 2的聚谷氨酸融合物在細胞培養(yǎng)測定中表現(xiàn)出生物活性。然而,至今這些PG融合物的藥代動力學數(shù)據(jù)還沒有報道。另外,由于人為靜電吸引或排斥效應,PG融合物的大量負電荷是相對于生物分子相互作用(例如,靶受體或可溶性因子的結合)而言的普遍缺點。WO 2006/081249描述了具有約2-500個重復單元的多肽序列,所述重復單元為3-6個氨基酸,其中G、N或Q代表主要組成部分,而次要組成部分可以是A、S、T、D或E。該氨基酸組成允許糖基化序列子Asn-Xaa-Ser/Thr (其中Xaa是除Pro之外的任何氨基酸)的整合,用于真核表達體系中Asn側鏈的N連接糖基化。所得融合蛋白增加的大分子尺寸,包括大的溶劑化碳水化合物結構的翻譯后修飾在內,能延長基因綴合蛋白的藥代動力學。這些寡糖連接物(“糖工程”)通常能減小對蛋白水解的易感性并增加流體動力學體積(Sinclair (2005) J Pharm Sci 94:1626-35)。缺點是糖基化生物大分子的內在分子異質性,這使得在生物技術生產和質量控制過程中需要付出更多勞動。
WO 2010/091122(以及 WO 2007/103515)和 SchelIenberger (2009)NatBiotechnol 27:1186-90公開了無組織的非重復性氨基酸聚合物,所述聚合物包括和包含殘基P、E、S、T、A和G。這組氨基酸顯示的組成不是不同于上文進一步描述的PSTAD重復,這組氨基酸經過序列的系統(tǒng)性篩選,從而產生具有大分子尺寸的溶劑化多肽,由于避免能引起聚集和可以導致HLA/MHC-II介導的免疫應答的疏水性側鏈(特別是F、I、L、M、V和W),所述溶劑化多肽適合于生物藥物研發(fā)。另外,排除了可能交聯(lián)的Cys殘基、可以與帶負電的細胞膜相互作用的陽離子氨基酸K、R和H、以及可能易于水解的N和Q的酰胺側鏈(參見Schellenberger (2009)同上)。針對大腸桿菌中的可溶性表達水平,篩選編碼包含PESTAG殘基組的非重復性序列(其與綠色熒光蛋白(GFP)融合)的合成基因文庫,以及進一步研究所得到的亞組的基因穩(wěn)定性、蛋白可溶性、熱穩(wěn)定性、聚集傾向和雜質屬性。最終,進一步測試了含有216個Ser殘基(25. O摩爾%)、72個Ala殘基(8. 3摩爾%)和Pro、Thr, Glu和Gly中每種144個氨基酸(16. 7摩爾%)的864個氨基酸的序列與GLP-I受體激動劑艾塞那肽-4(E-XTEN)和幾種其它生物制劑的融合。在大腸桿菌細胞質中產生可溶狀態(tài)的融合蛋白,并將其分離,所述融合蛋白通常攜帶纖維素結合結構域,該纖維素結合結構域隨后被切掉。通過圓二色(⑶)光譜對E-XTEN的研究顯示二級結構的缺乏,同時在尺寸排阻色(SEC)過程中,融合蛋白表明駐留明顯少于預期的84kDa蛋白,從而證實增加的流體動力學體積(Schellenberg (2009)同上)。分布在XTEN序列之間的攜帶高的凈負電荷的氨基酸之間的靜電排斥,可以有利于PESTAG多肽的無序結構和流體動力學半徑的相關增加(參見WO2010/091122)。然而,另一項研究即 Geething (2010) PLoSOne 2010 ;5: el0175 表明,XTEN 降低其治療融合伴侶的效力。在細胞培養(yǎng)測定中,胰高血糖素XTEN融合物僅表現(xiàn)出未修飾的肽的生物活性的15%。人生長激素(hGH)的XTEN融合顯示出受體親和力的更大丟失(EC5tl增加 17 倍);參見 WO 2010/144502。此外,甘氨酸作為最小且結構最簡單的氨基酸,在理論層面上,其已被認為是在構象上柔性最好的氨基酸;參見,例如Schulz GE, Schirmer RH。Principles ofProtein Structure. Springer, New York 1979。此外,計算機模擬已經表明,Gly 聚合物缺少二級結構,并且在溶液中易于形成無規(guī)卷曲;參見Shental-Bechor(2005)Biophys J88:2391-402。從化學的觀點來看,聚甘氨酸是線性無支鏈的聚酰胺,其與聚醚PEG在某些方面表現(xiàn)出一定相似性,例如它們本質上都是一維的大分子,沿著鏈具有很多轉動自由度,由被氫鍵鍵合且高度溶劑化的極性基團規(guī)律性中斷的重復短碳氫化合物單元組成。因此,聚甘氨酸應當構成最簡單的基因可編碼的PEG模擬物,其預期能延長治療蛋白的血漿半衰期。分別以“同氨基酸聚合物(HAP) ”的形式 或富含甘氨酸的序列(GRS)采用該觀點;參見,Schlapschy(2007)Protein Eng Des Sel 20:273-84 ;W0 2007/103515。然而,早就已知的是,Gly的化學合成的純聚合物在水中表現(xiàn)出差的可溶性;特別可參見BamfordCH et al. Synthetic PoIypeptides-Preparation, Structure, and Properties. AcademicPress, New York 1956。因此,進行了不同的嘗試來增加親水性,其中通過引入氫鍵鍵合的絲氨酸醇側鏈(W0 2007/103515以及Schlapschy (2007)同上)或者另外引入帶負電的谷氨酸殘基(W02007/103515)。已注意到,為了以柔性方式連接融合蛋白中的結構域,具有(Gly4Ser)n組成的肽間隔物在本領域中已有描述。在分析SEC中,對于這些融合蛋白檢測到顯著增加的流體動力學體積。對于200個殘基的HAP形式,與未融合的Fab片段相比,表觀尺寸增加為120%,而真實質量僅增大29%,因此表現(xiàn)出流體動力學體積增加的效果,這是由于聚甘氨酸標簽的溶劑化無規(guī)卷曲結構所致。此外,CD差光譜對于HAP部分的無序二級結構是特征性的。最后,攜帶200個殘基HAP的Fab片段在小鼠中的最終血漿半衰期延長約3倍。盡管這僅是中等程度的延長,但該效果可以適合于某些(專門)診斷應用,例如體內成像;參見Schlapschy (2007);同上。不幸的是,具有較長的(Gly4Ser) 重復序列的融合蛋白的制備似乎不太可行,這是由于形成聚集體的傾向增加,從而造成對有一定純度的甘氨酸聚合物作為PEG模擬物的應用天然限制。WO 2008/155134公開了具有Pro、Ala和Ser ( S卩,PAS)殘基的合適混合的序列導致它們獨特二級結構偏好的共同取消,并因此導致穩(wěn)定無序的多肽。然而,WO 2008/155134還記載了,具有僅由絲氨酸和丙氨酸(SA)殘基組成的結構域(即,結構域僅包含兩種氨基酸)的融合蛋白不會形成無規(guī)卷曲,而是會形成β折疊結構。多肽的化學合成是公知的,并且在本領域中已有描述。Izuka公開了含有脯氨酸的多肽的化學合成(參見Izuka(1993),Bull.Chem.Soc. Jpn 66,1269-1272)。這些共聚多肽(copolypeptide)含有脯氨酸分別和甘氨酸、L-丙氨酸、L- α -氨基丁酸(Abu)、L-正纈氨酸(Nva)或L-亮氨酸的隨機序列,并且通過化學共聚作用合成。Izuka公開了,這些共聚多肽通常具有限定的膠原蛋白樣構象。此外,該出版物還描述了脯氨酸和丙氨酸(或脯氨酸和L-α-氨基丁酸)的共聚多肽在水中是部分可溶的,而其它共聚多肽完全不可溶。Izuka推測,脯氨酸/丙氨酸共聚多肽可以具有局部無序構象。Izuka強調,具有隨機脯氨酸/丙氨酸序列的化學合成多肽主要出現(xiàn)在膠原蛋白樣構象中,即,在有組織的構象中。因此,本發(fā)明的基本技術問題是提供具有真實無規(guī)卷曲構象的大的多肽。通過提供權利要求中描述的和本文提供的實施方案能解決該技術問題。因此,本發(fā)明涉及提供和應用生物合成的無規(guī)卷曲多肽或多肽區(qū)段,所述無規(guī)卷曲多肽或多肽區(qū)段包含由至少約50、特別是至少約100、特別是至少約150、特別是至少約200、特別是至少約250、特別是至少約300、特別是至少約350、特別是至少約400個脯氨酸和丙氨酸氨基酸殘基組成的氨基酸序列。因此,本發(fā)明涉及提供生物合成的無規(guī)卷曲多肽或多肽區(qū)段,所述無規(guī)卷曲多肽或多肽區(qū)段包含至少50個氨基酸殘基的氨基酸序列,所述氨基酸序列僅由脯氨酸和丙氨酸氨基酸殘基組成且包含至少一個脯氨酸和至少一個丙氨酸。本發(fā)明還提供了藥物綴合物,其包含α)生物合成的無規(guī)卷曲多肽或多肽區(qū)段,所述無規(guī)卷曲多肽或多肽區(qū)段包含僅由脯氨酸和丙氨酸氨基酸殘基組成的氨基酸序列,其中所述氨基酸序列由至少50個脯氨酸(Pro)和丙氨酸(Ala)氨基酸殘基組成,和(ii)藥物,所述藥物選自(a)包含具有或介導生物活性的氨基酸序列或是具有或介導生物活性的氨基酸序列的生物活性蛋白或多肽和(b)小分子藥物。本文提供的具有真實無規(guī)卷曲構象的多肽和具有真實無規(guī)卷曲構象的多肽區(qū)段還可用于以下環(huán)境美容用品應用以及食品工業(yè)應用和飲料生產。本文提供的表現(xiàn)出真實無規(guī)卷曲構象的大的多肽僅由脯氨酸(P,Pro)和丙氨酸(A,Ala)殘基組成,并且包含大于至少50個氨基酸、特別是至少約100、特別是至少約150、特別是至少約200、特別是至少約250、特別是至少約300、特別是至少約350、特別是至少約400個脯氨酸和丙氨酸氨基酸殘基。兩種氨基酸P和A都需要存在于本文提供的具有真實無規(guī)卷曲構象的大的多肽和具有真實無規(guī)卷曲構象的多肽區(qū)段中。本文還提供了編碼本文公開的生物合成的無規(guī)卷曲多肽或多肽區(qū)段的核酸分子,以及編碼藥物或食品綴合物的核酸分子,所述藥物或食品綴合物包含所述生物合成的無規(guī)卷曲多肽或多肽區(qū)段和(共 價連接的)感興趣的蛋白,例如生物活性蛋白。本文所述的和可用于本文提供的藥物或食品綴合物中的且包含由至少約50、至少約100、至少約150、至少約200、至少約250、至少約300、至少約350、至少約400個脯氨酸(P)和丙氨酸(A)氨基酸殘基組成的氨基酸序列的生物合成的無規(guī)卷曲多肽或生物合成的無規(guī)卷曲多肽區(qū)段,特別可用于異源環(huán)境中,即,用于生物活性異源蛋白、蛋白構建體和/或藥物綴合物中,所述藥物綴合物包含所述生物合成的無規(guī)卷曲多肽或多肽區(qū)段和藥學上或醫(yī)學上有用的分子,例如小分子、肽或生物大分子,例如蛋白、核酸、碳水化合物、脂質囊泡等。如后文實施例所示,本發(fā)明人成功提供了由本文所述的真實無規(guī)卷曲多肽和生物活性蛋白或蛋白段組成的藥物綴合物,以及由包含和/或連接于本文所述的無規(guī)卷曲多肽的小分子或小分子藥物組成的藥物綴合物,所述無規(guī)卷曲多肽僅由脯氨酸和丙氨酸氨基酸殘基組成(即,由氨基酸P和A組成)。因此,本發(fā)明特別提供了生物活性異源蛋白,其包含至少兩個結構域,其中(a)所述至少兩個結構域的第一結構域包含具有和/或介導所述生物活性的氨基酸序列;和(b)所述至少兩個結構域的第二結構域包含生物合成的無規(guī)卷曲多肽或多肽區(qū)段,所述無規(guī)卷曲多肽或多肽區(qū)段由氨基酸序列組成,所述氨基酸序列由至少約50、至少約100、至少約150、至少約200、至少約250、至少約300、至少約350、至少約400個脯氨酸和丙氨酸氨基酸殘基組成。按照本發(fā)明,所述“第一結構域和所述“第二結構域”不包含在天然(即,天然存在)蛋白或來源于天然存在的編碼核酸序列(例如開放讀碼框等)的假定蛋白中。此外,本發(fā)明提供了藥物綴合物,其由生物合成的無規(guī)卷曲多肽或多肽區(qū)段和藥學上、治療上和/或醫(yī)學上有用的分子組成,所述無規(guī)卷曲多肽或多肽區(qū)段包含由至少約50、至少約100、至少約150、至少約200、至少約250、至少約300、至少約350、至少約400個脯氨酸和丙氨酸氨基酸殘基組成的氨基酸序列,所述藥學上、治療上和/或醫(yī)學上有用的分子例如小分子、肽或生物大分子,例如蛋白、核酸、碳水化合物、脂質囊泡等,所述藥學上、治療上和/或醫(yī)學上有用的分子與所述生物合成的無規(guī)卷曲多肽或多肽區(qū)段綴合。此外,應當注意到,對于本文公開的綴合物,術語“生物活性”不限于純生物分子,還包括具有醫(yī)學活性的、治療活性的、藥學活性的分子等。對于本領域技術人員顯而易見的是,本文提供的方式和方法不限于藥學和醫(yī)學用途,還可以用于很多技術中,包括但不限于美容用品、食品、飲料和營養(yǎng)學技術、石油工業(yè)、造紙工業(yè)等。相比于化學合成的共聚多肽(例如Izuka,同上),本文提供的無規(guī)卷曲多肽是通過生物合成方式產生的。本文所用的術語“生物合成”是指借助于生物技術方法合成(與化學合成不同)。這些生物技術方法是本領域公知的,并且在下文有進一步的描述。本發(fā)明的無規(guī)卷曲多肽的生物合成允許產生具有規(guī)定的脯氨酸和丙氨酸殘基序列、規(guī)定的長度和/或規(guī)定的脯氨酸和丙氨酸殘基比率的多肽。此外,本發(fā)明所提供的多肽是基本上純的,即,所產生的多肽是基本上均一的,并共有以上特征(即,規(guī)定的序列、規(guī)定的長度和/或規(guī)定的氨基酸比率)。按照本發(fā)明,由至少約50、特別是至少約100、特別是至少約150、特別是至少約200、特別是至少約250、特別是至少約300、特別是至少約350、特別是至少約400個脯氨酸和丙氨酸氨基酸殘基組成的無規(guī)卷曲多肽例如包含在生物活性異源多肽/多肽構建體和/或藥物或食品綴合物以及在其它工業(yè)領域有用的其它綴合物中,所述其它工業(yè)領域例如,但不限于,造紙工業(yè)、石油工業(yè)等。
總體上,本發(fā)明多肽的上述特征允許形成穩(wěn)定的無規(guī)卷曲多肽,并且這些無規(guī)卷曲多肽具有令人意想不到的和有利的性質。例如,本發(fā)明的多肽在水性溶液中是完全可溶的,并且具有增加的流體動力學體積。令人意想不到的是,本文所述的無規(guī)卷曲多肽還能提供增加的體內/體外穩(wěn)定性。這對于醫(yī)學應用是特別重要的,例如,對于包含本發(fā)明無規(guī)卷曲多肽的生物活性蛋白或藥物綴合物。然而,本發(fā)明無規(guī)卷曲多肽的許多有利性質不僅允許它們可用于醫(yī)學領域,而且還可用于其它領域,例如美容用品/美容治療或營養(yǎng)學和食品技術領域,例如乳品業(yè)或肉品加工??捎糜谑称饭I(yè)等的綴合物的實例,是包含本文公開的無規(guī)卷曲多肽或多肽區(qū)段和可用于這些技術的化合物(例如用作乳化劑的非離子型表面活性劑的聚氧化丙烯或聚氧化乙烯聚合物)的綴合物,所述無規(guī)卷曲多肽或多肽區(qū)段包含僅由脯氨酸和丙氨酸氨基酸殘基組成的氨基酸序列。本文還考慮到在生物化學方法和技術過程中使用本文所述的生物合成的無規(guī)卷曲多肽,例如造紙、采油等。本文提供的僅由脯氨酸和丙氨酸殘基組成的生物合成的無規(guī)卷曲多肽(以及本文公開的包含所述生物合成的真實無規(guī)卷曲多肽的綴合物和構建體,例如藥物或食品綴合物/構建體)的令人意想不到的和有利的特征在下文更詳細地描述。此外,下文提供了利用這些本發(fā)明生物合成的無規(guī)卷曲多肽的示例性的應用和方式和方法。本文還提供了產生所述生物合成的無規(guī)卷曲多肽以及生物活性異源多肽或多肽構建體的方式和方法,以及制備本文公開的包含所述無規(guī)卷曲多肽的綴合物和構建體例如藥物構建體的方式和方法。在本發(fā)明的背景下,驚奇地發(fā)現(xiàn),具有均勻組成的脯氨酸-丙氨酸聚合物/多肽形成穩(wěn)定的無規(guī)卷曲構象。這在后文的實施例中也得到證明,其中通過圓二色(CD)光譜驗證生物合成的脯氨酸/丙氨酸(共)聚合物/多肽的無規(guī)卷曲結構。獲得和利用所述生物合成的真實無規(guī)卷曲多肽/聚合物是令人意想不到的,因為已建立的Chou-Fasman法(Chouand Fasman (1974), Biochemistry 13,223-245)預測到由脯氨酸和丙氨酸組成的聚合物/多肽(或其區(qū)段)為100%α_螺旋二級結構,如圖7所示。然而,本文驚奇地發(fā)現(xiàn)并通過實驗證實,具有均勻組成的脯氨酸-丙氨酸聚合物/多肽形成穩(wěn)定的無規(guī)卷曲構象。這在后文的實施例中也得到證明,其中通過諸如圓二色(CD)光譜和尺寸排阻色譜(SEC)的實驗技術驗證脯氨酸/丙氨酸(共)聚合物/多肽的無規(guī)卷曲結構。 相比于本發(fā)明的多肽/聚合物,例如Izuka(1993)(同上)中所述的化學合成多肽具有任意/無規(guī)定的且隨機的序列以及不同的長度。因此,化學合成多肽包含具有不同脯氨酸/丙氨酸比率、長度等的完全不同的肽的混合物。如Izuka所述,這樣的混合物中的化學合成多肽不會(或僅會部分地)形成無規(guī)卷曲,并因此不會具有本文下文提供和描述的生物合成的多肽的任何有利性質。因此,本發(fā)明包括和涉及包含本文公開的本發(fā)明生物合成的無規(guī)卷曲多肽/聚合物的組合物,其中所述生物合成的無規(guī)卷曲多肽/聚合物特別由它們的僅包含脯氨酸和丙氨酸殘基的序列定義。在一個具體實施方案中,本發(fā)明涉及包含作為一個組成部分的本文公開的這些無規(guī)卷曲多肽/聚合物的綴合物,例如藥物或食品綴合物。在一個實施方案中,所述組合物中包含的這些本發(fā)明生物合成的無規(guī)卷曲多肽/聚合物具有均勻長度。
如上文所述,本發(fā)明的僅由脯氨酸和丙氨酸殘基組成的生物合成的無規(guī)卷曲多肽(或無規(guī)卷曲多肽區(qū)段)令人意想不到地形成穩(wěn)定的無規(guī)卷曲構象。本文所用的術語"無規(guī)卷曲"通常涉及包括氨基酸聚合物/氨基酸序列/多肽在內的聚合分子的任何構象,其中形成所述聚合結構的各個單體元素基本上隨機地定向朝向相鄰的單體元素,同時還與所述相鄰的單體元素化學結合。具體而言,采取/具有形成"無規(guī)卷曲構象"的多肽、氨基酸序列或氨基酸聚合物基本上缺少規(guī)定的二級結構和三級結構。對于本發(fā)明的多肽,形成聚合結構(即,多肽/氨基酸序列)的單體元素是諸如脯氨酸和丙氨酸的單個氨基酸本身或諸如下文進一步描述和限定的“氨基酸重復”/ “氨基酸盒”/ “盒重復”/ “構成部分(buildingblock) ”/ “模塊(module) ” (或其片段)的肽段。多肽無規(guī)卷曲的性質和它們的實驗鑒定方法是本領域技術人員已知的,并且在科學文獻中已有描述(Cantor (1980)Biophysical Chemistry, 2nd ed. , ff. H. Freemanand Company, New York;Creighton (1993)Proteins-Structures and MolecularProperties,2nd ed. , ff. H. Freeman and Company,New York;Smith (1996)Fold Des1:R95-R106)。本文所用的術語“區(qū)段”是指本文所限定的生物合成的無規(guī)卷曲多肽的一部分,其中所述的一部分可以本文所述的生物合成的無規(guī)卷曲多肽的內部一部分。所述“區(qū)段”可以是,例如,一個(或多個)氨基酸被缺失的本文所限定的生物合成的無規(guī)卷曲多肽,例如從本發(fā)明多肽的起點和/或終點缺失。此外,所述“區(qū)段”可以被用作或可以形成較大的蛋白或多肽的一部分,例如,具有生物活性蛋白的融合蛋白的一部分。所述“融合蛋白”還是本發(fā)明的異源生物活性多肽/蛋白/多肽構建體的實例。本文所用的術語“異源”在本文的下文中定義。本發(fā)明提供的和可用于本發(fā)明的無規(guī)卷曲多肽(或其無規(guī)卷曲區(qū)段)例如在水性溶液或在生理條件下采取/形成無規(guī)卷曲構象。術語〃生理條件〃是本領域已知的,并且涉及蛋白通常采取其天然的、折疊構象的條件。更具體而言,術語〃生理條件〃涉及對于高等生命形式、特別是哺乳動物、最優(yōu)選人類通常很重要的生物物理參數(shù)。術語〃生理條件"可以涉及在哺乳動物并特別是人類的機體(特別是體液)中通常存在的生物化學和生物物理參數(shù)。所述〃生理條件〃可以涉及健康機體中存在的相應參數(shù)以及疾病條件下或人類患者中存在的參數(shù)。例如,當所述哺乳動物或所述人類發(fā)熱時,患病哺乳動物或人類患者可以具有較高、但任然是“生理”的溫度條件。對于蛋白采取其天然構象/狀態(tài)的〃生理條件〃,最重要的參數(shù)是溫度(對人體是37° C)、pH(對于人類血液為7. 35-7. 45)、同滲容摩(280-300mmol/kg H2O)、以及如果必要的話,蛋白含量(66_85g/l血清)。然而,本領域技術人員知道,在生理條件下,這些參數(shù)可以變化,例如在指定的體液或組織液例如血液、腦脊液、腹膜液和淋巴液中,溫度、pH、同滲容摩和蛋白含量可以不同(Klinke (2005)Physiologie, 5th ed. , Georg Thieme Verlag, Stuttgart)。例如,在腦脊液中,同滲容摩可以為約290mmol/kg H2O,蛋白濃度可以為O. 15g/l至O. 45g/l,而在淋巴液中,pH可以為約7. 4,蛋白含量可以為3g/l至5g/l。當使用下文所述的方法確定多肽(或其區(qū)段)/氨基酸序列在實驗條件下是否形成/采取無規(guī)卷曲構象時,諸如溫度、pH、同滲容摩和蛋白含量的生物物理參數(shù)可以不同于體內通常存在的生理條件。1° C至42° C或優(yōu)選4° C至25。C的溫度可以被認為可用于在體外測試和/或驗證蛋白在生理條件下的生物物理性質和生物活性。數(shù)種緩沖液,特別是在實驗環(huán)境中(例如在確定蛋白結構,特別是在CD測量和允許本領域技術人員測定蛋白/氨基酸段的結構性質的其它方法中)或在藥物組合物的緩沖齊U、溶劑和/或賦形劑中,被認為能代表體外“生理溶液”/ “生理條件”。這些緩沖液的實例是,例如磷酸緩沖鹽溶液(PBS:115mM NaCl、4mM KH2PO4U6mM Na2HP04pH 7.4)、Tris 緩沖 液、乙酸鹽緩沖液,檸檬酸鹽緩沖液或類似緩沖液,例如后文實施例中所用的那些緩沖液。通常,代表“生理溶液條件”的緩沖液的pH應當位于6. 5至8. 5的范圍內,優(yōu)選位于7. O至8. O的范圍內,最優(yōu)選位于7. 2至7. 7的范圍內,同滲容摩應當位于10至lOOOmmol/kg H2O的范圍內,更優(yōu)選位于50至500mmol/kg H2O的范圍內,最優(yōu)選位于200至350mmol/kg H2O的范圍內??蛇x地,代表生理溶液條件的緩沖液的蛋白含量可以位于O至100g/l的范圍內,忽略具有生物活性的蛋白本身,其中可以使用典型穩(wěn)定化蛋白,例如人或牛血清白蛋白。本文已發(fā)現(xiàn),多肽(或其區(qū)段)不僅在生理條件下形成無規(guī)卷曲構象,而且更通常在水性溶液中形成無規(guī)卷曲構象。術語“水性溶液”是本領域公知的?!八匀芤骸笨梢允撬?H2O)含量為至少約20%、至少約30%、至少約40%、至少約50%、至少約60%、至少約70%、至少約80%或至少約90%H20(重量/重量)的溶液。因此,本發(fā)明的多肽(或其區(qū)段)可以在可能含有其它可混溶劑的水性溶液中形成無規(guī)卷曲構象,或在具有更寬范圍的溫度、PH值、同滲容摩或蛋白含量的水性分散液中形成無規(guī)卷曲構象。這對于無規(guī)卷曲多肽(或其區(qū)段)在醫(yī)藥治療或體內診斷之外的應用是特別相關的,例如在美容用品、營養(yǎng)學或食品技術中。因此,本發(fā)明中還考慮到,可以將本發(fā)明的脯氨酸/丙氨酸生物合成多肽(或其區(qū)段)的無規(guī)卷曲構象得到保持和/或利用于藥物組合物例如液體藥品/生物制品或凍干的藥物組合物環(huán)境中。這對于本文提供的特別包含本發(fā)明無規(guī)卷曲多肽(或多肽區(qū)段)的生物活性異源蛋白或藥物綴合物是特別重要的。優(yōu)選地,“生理條件”會被用于相應的緩沖液體系、溶劑和/或賦形劑中。然而,例如在凍干的或干燥的組合物(例如,藥物組合物/生物制品)中,考慮到本文提供的無規(guī)卷曲多肽(或多肽區(qū)段)的無規(guī)卷曲構象暫時不存在和/或不能被檢測到。然而,在相應的緩沖液/溶液/賦形劑/溶劑復原后或在給予機體后,所述無規(guī)卷曲多肽(或多肽區(qū)段)會再次采取/形成其無規(guī)卷曲。確定多肽(或其區(qū)段)是否形成/采取無規(guī)卷曲構象的方法是本領域已知的(Cantor(1980)同上;Creighton(1993)同上;Smith(1996)同上)。這些方法包括本文后文所例舉的圓二色(⑶)光譜。⑶光譜代表光吸收光譜方法,其中測量某種物質對右旋圓偏振光和左旋圓偏振光的吸光度的差異??梢岳貌ㄩL為約190-250nm的遠紫外光譜通過CD光譜確定蛋白的二級結構。在這些波長下,可以分析多肽中常見的不同二級結構,因為α螺旋、平行和反向平行β折疊以及無規(guī)卷曲構象中的每一種都能產生特征性的⑶譜形狀和幅度。因此,通過使用⑶光譜法,本領域技術人員能容易地確定多肽(或其區(qū)段)在水性溶液中或在生理條件下是否形成/采取無規(guī)卷曲構象。其它建立的生物物理學方法包括核磁共振(NMR)光譜、吸收光譜法、紅外線和拉曼光譜、通過尺寸排阻色譜測量流體動力學體積、分析超離心或動態(tài)/靜態(tài)光散射,以及測量摩擦系數(shù)或固有粘度(Cantor(1980)同上;Creighton(1993)同上;Smith(1996)同上)。除了上述實驗方法之外,還描述了預測蛋白的二級結構的理論方法。這種理論方法的一個實例是Chou-Fasman法(Chou and Fasman,同上),其是基于根據(jù)例如用X射線晶體學解析的已知的蛋白結構來分析α螺旋、β折疊和轉角中每種氨基酸的相對頻率。然 而,已知蛋白二級結構的理論預測是不可靠的。如下文所示例,根據(jù)Chou-Fasman法預期采取α螺旋二級結構的氨基酸序列通過實驗發(fā)現(xiàn)形成無規(guī)卷曲。因此,諸如Chou-Fasman算法的理論方法對于指定多肽是否采取無規(guī)卷曲構象僅可以具有有限的預測價值,這在后文的實施例和圖中也有證實。盡管如此,上述理論預測通常是評估給定多肽/氨基酸序列的推定二級結構中的第一方法。無規(guī)卷曲結構的理論預測還表明,通過以上實驗手段驗證給定多肽/氨基酸序列是否確實具有無規(guī)卷曲構象可能是非常值得的。大部分氨基酸、特別是疏水性氨基酸的同聚物在水性溶液中通常是不溶的(Bamford(1956)Synthetic Polypeptides - Preparation, Structure, and Properties, 2nded. , Academic Press, New York)。數(shù)種親水性氨基酸的同聚物已知能形成二級結構,例如,對于 Ala 為 α 螺旋(Shental-Bechor (2005) Biophys J 88:2391-2402),對于 Ser 為 β 折疊(Quadrifoglio (1968) J Am Chem Soc 90:2760-2765),而聚脯氨酸是硬度最強的同聚寡肽(Schimmel (1967) Proc Natl Acad Sci USA 58:52 - 59),其在水性溶液中形成 II 型反式螺旋(Cowan (1955) Nature 176:501 - 503)。例如,對于聚甘氨酸,利用聚合物生物物理學的理論原理,200個氨基酸殘基的
鏈的無規(guī)卷曲直徑相當于約其計算為均方根端到端距離^^ = I^n-Ces其中
75A,,
n=200,對于每個Ca -Ca距離,長度I的可轉動的鍵=3.8 A,對于聚(Gly)的“特征
比” C 2. O (Brant (1967) J Mol Biol 23:47-65 ;Creighton, (1993)同上)。這種關系
表明,本領域技術人員會預期到通過(a)利用較長的鏈長度I或通過(b)利用表現(xiàn)出較大
的特征比C c 的氨基酸可以增大隨機鏈氨基酸聚合物的流體動力學體積。C c 是是分子隨
機鏈的固有硬度的衡量標準,并且對于大多數(shù)氨基酸的一般值為9 (Brant (1967)同上)。只
有缺少側鏈的Gly以及亞氨基酸Pro表現(xiàn)出顯著較小的值。因此,Gly和Pio (在變性條件
下)預期能有助于減小無規(guī)卷曲蛋白的維度(Miller(1968)Biochemistry 7:3925-3935)。
因此,包含脯氨酸殘基的氨基酸序列預期具有相對緊湊的流體動力學體積。然而,與該教導
相反,本文表明與預期的流體動力學體積相比,如通過分析凝膠滲透/尺寸排阻色譜所測
定的,包含脯氨酸和丙氨酸殘基混合物的本發(fā)明氨基酸聚合物/多肽的流體動力學體積具
有明顯增加的流體動力學體積。事實上,令人意想不到的是,包含這兩種氨基酸(脯氨酸和
丙氨酸)的混合物的多肽在生理條件下采取無規(guī)卷曲構象,這兩種氨基酸中的每一種單獨傾向于形成具有規(guī)定的二級結構的同聚寡肽。這些本發(fā)明的脯氨酸/丙氨酸多肽具有的流體動力學半徑大于包含相同數(shù)量的Gly殘基的同聚物的半徑,例如,并且它們?yōu)楸景l(fā)明的生物活性蛋白或構建體(即,生物活性異源蛋白或藥物綴合物)提供更好的可溶性。如上文所述,本發(fā)明的生物合成的無規(guī)卷曲脯氨酸/丙氨酸多肽與化學合成多肽的不同之處在于,通過簡單的方式和方法,它們能采取規(guī)定的均勻長度。然而,現(xiàn)有技術提供的多肽的混合物/組合物在肽的長度方面具有明顯變化,而本發(fā)明能提供具有規(guī)定的長度的生物合成的無規(guī)卷曲多肽的混合物/組合物。優(yōu)選地,這樣的混合物/組合物中包含的基本上所有本發(fā)明的多肽具有相同的規(guī)定的長度,并因此共有相同的生物化學性質。這樣的均勻組合物在可應用生物合成的無規(guī)卷曲多肽的各種醫(yī)學、美容用品、營養(yǎng)學應用中更有優(yōu)勢。此外,特別是在醫(yī)學或藥學背景下,包含由至少約50、特別是至少約100、特別是至少約150、特別是至少約200、特別是至少約250、特別是至少約300、特別是至少約350、特別是至少約400個脯氨酸和丙氨酸氨基酸殘基組成的氨基酸序列的本文所限定的生物合成的無規(guī)卷曲多肽或多肽區(qū)段,還可用于預防、改善和/或治療與受損的血漿狀況有關和/ 或相關的病癥,例如損傷、燒傷、手術后等。因此,所述生物合成的無規(guī)卷曲多肽或多肽區(qū)段的一個醫(yī)學應用是用作血漿擴容劑。然而,應當注意到,按照本發(fā)明,本文所述的藥物綴合物和異源多肽或異源多肽構建體可以可用于與受損的血漿量或血漿內容物相關的病癥或與受損的血容量相關的病癥的醫(yī)學或藥物干預。因此,在一個實施方案中,本發(fā)明涉及生物合成的隨機多肽(或其區(qū)段),其包含僅由至少約50個脯氨酸和丙氨酸氨基酸殘基、至少約100個脯氨酸和丙氨酸氨基酸殘基、至少約150個脯氨酸和丙氨酸氨基酸殘基或至少約200個脯氨酸和丙氨酸殘基組成的氨基酸序列,特別是當所述生物合成的隨機多肽(或其區(qū)段)包含在異源蛋白/多肽/多肽構建體或藥物綴合物中時。本發(fā)明還涉及生物合成的無規(guī)卷曲多肽,其包含僅由至少約200個脯氨酸和丙氨酸氨基酸殘基、甚至更優(yōu)選至少約300個脯氨酸和丙氨酸氨基酸殘基、特別優(yōu)選至少約400個脯氨酸和丙氨酸氨基酸殘基、更特別優(yōu)選至少約500個脯氨酸和丙氨酸氨基酸殘基和最優(yōu)選至少約600個脯氨酸和丙氨酸氨基酸殘基組成的氨基酸序列。形成無規(guī)卷曲構象的氨基酸序列可以由最多約3000個脯氨酸和丙氨酸氨基酸殘基、最多約2000個脯氨酸和丙氨酸氨基酸殘基、最多約1500個脯氨酸和丙氨酸氨基酸殘基、最多約1200個脯氨酸和丙氨酸氨基酸殘基、最多約800個脯氨酸和丙氨酸氨基酸殘基組成。因此,脯氨酸/丙氨酸氨基酸序列段可以由約50、約100、約150、約200、約250、約300、約350、約400、約500、約600、約700、約800、約900至約3000個脯氨酸和丙氨酸氨基酸殘基組成。在某些實施方案中,本發(fā)明生物合成的氨基酸序列包含約200至約3000個脯氨酸和丙氨酸殘基、約200至約2500個脯氨酸和丙氨酸殘基、約200至約2000個脯氨酸和丙氨酸殘基、約200至約1500個脯氨酸和丙氨酸殘基、約200至約1000個脯氨酸和丙氨酸殘基、約300至約3000個脯氨酸和丙氨酸殘基、約300至約2500個脯氨酸和丙氨酸殘基、約300至約2000個脯氨酸和丙氨酸殘基、約300至約1500個脯氨酸和丙氨酸殘基、約300至約1000個脯氨酸和丙氨酸殘基、約400至約3000個脯氨酸和丙氨酸殘基、約400至約2500個脯氨酸和丙氨酸殘基、約400至約2000個脯氨酸和丙氨酸殘基、約400至約1500個脯氨酸和丙氨酸殘基、約400至約1000個脯氨酸和丙氨酸殘基、約500至約3000個脯氨酸和丙氨酸殘基、約500至約2500個脯氨酸和丙氨酸殘基、約500至約2000個脯氨酸和丙氨酸殘基、約500至約1500個脯氨酸和丙氨酸殘基、約500至約1000個脯氨酸和丙氨酸殘基、約600至約3000個脯氨酸和丙氨酸殘基、約600至約2500個脯氨酸和丙氨酸殘基、約600至約2000個脯氨酸和丙氨酸殘基、約600至約1500個脯氨酸和丙氨酸殘基、約600至約1000個脯氨酸和丙氨酸殘基、約700至約3000個脯氨酸和丙氨酸殘基、約700至約2500個脯氨酸和丙氨酸殘基、約700至約2000個脯氨酸和丙氨酸殘基、約700至約1500個脯氨酸和丙氨酸殘基、約700至約1000個脯氨酸和丙氨酸殘基、約800至約3000個脯氨酸和丙氨酸殘基、約800至約2500個脯氨酸和丙氨酸殘基、約800至約2000個脯氨酸和丙氨酸殘基、約800至約1500個脯氨酸和丙氨酸殘基、約800至約1000個脯氨酸和丙氨酸殘基。從本發(fā)明的內容可以看出,較大的生物合成的氨基酸序列(基本上由脯氨酸和丙氨酸組成)也在本發(fā)明的范圍內,并且能容易地用于本文所限定的生物活性蛋白或蛋白構建體,所述生物活性蛋白或蛋白構建體包含作為至少兩個結構域中的一個結構域的具有和/或介導所述生物活性的氨基酸序列和作為至少兩個結構域中的另一個結構域的生物合成的無規(guī)卷曲多肽或多肽區(qū)段,所述無規(guī)卷曲多肽或多肽區(qū)段由至少約50個脯氨酸和丙氨酸氨基酸殘基、至少約100個脯氨酸和 丙氨酸氨基酸殘基、至少約150個脯氨酸和丙氨酸氨基酸殘基、至少約200、至少約250、至少約300、至少約350、至少約400個脯氨酸和丙氨酸氨基酸殘基組成。這類生物合成的無規(guī)卷曲多肽或多肽區(qū)段相當于異源蛋白/蛋白構建體的生物合成的無規(guī)卷曲部分。這些生物合成的脯氨酸/丙氨酸段由最多約3000個脯氨酸和丙氨酸氨基酸殘基組成。這些氨基酸序列(脯氨酸/丙氨酸段)包含作為主要或獨特殘基的脯氨酸和丙氨酸,這在下文中有進一步解釋。考慮到,本文所限定的生物合成的氨基酸序列僅由脯氨酸(P)和丙氨酸(A)氨基酸殘基組成,其形成/采取/具有無規(guī)卷曲構象。在最簡單的情況下,生物合成的多肽或多肽區(qū)段由具有本文所限定的無規(guī)卷曲構象的氨基酸序列組成。然而,除了本文所述的形成/采取/具有無規(guī)卷曲構象的氨基酸序列之外,生物合成的多肽(或其區(qū)段)還可以包含不能有助于無規(guī)卷曲構象的形成或本身不能形成/采取/具有無規(guī)卷曲構象的氨基酸序列/氨基酸殘基。在不脫離本發(fā)明主旨的情況下,這樣的生物合成的多肽(或其區(qū)段)也是生物合成的“無規(guī)卷曲”多肽或多肽區(qū)段。例如,其它氨基酸序列/氨基酸殘基可以被用作連接子。特別是,本發(fā)明中還考慮到生物合成的無規(guī)卷曲多肽的二聚體、三聚體,即,一般多聚體,并且這些多聚體可以通過不形成無規(guī)卷曲構象的氨基酸序列/殘基連接??梢园@樣的無規(guī)卷曲多肽的蛋白的實例是本文提供的生物活性蛋白,除了本文所限定的由脯氨酸和丙氨酸氨基酸殘基組成的無規(guī)卷曲多肽之外,其還可以包含具有/介導生物活性的另一多肽。此外,這樣的構建體可以是本文所限定的異源生物活性蛋白或多肽構建體。術語“至少約50/100/150/200/300/400/500/600/700/800/ 等個氨基酸殘基”不限于所述明確數(shù)量的氨基酸殘基,還包括這樣的氨基酸段,所述氨基酸段包含增加約1-20%(例如10%至20%)的殘基或減少約1-20%(例如約10%至20%)的殘基。例如“至少約100個氨基酸殘基”還可以包括約80至100和約100至120個氨基酸殘基,而不脫離本發(fā)明的主旨。例如“至少約200個氨基酸殘基”還可以包括約160至200和約200至240個氨基酸殘基,而不脫離本發(fā)明的主旨。在必要的變通下,上文給出的定義和解釋還適用于術語“最多約3000/2000/1500/1200/800個氨基酸殘基”等。因此,對于較長的氨基酸序列(例如包含最多3000個氨基酸殘基或由最多3000個氨基酸殘基組成的氨基酸序列),術語“約”不局限于或不受限于所述明確數(shù)量的氨基酸殘基。因此,術語“最多約3000/2000/1500/1200/800個氨基酸殘基”還可以包括這樣的氨基酸段,所述氨基酸段包含增加10%至20%或減少10%至20%的殘基,這不脫離本發(fā)明。此外,生物合成的無規(guī)卷曲多肽(或其區(qū)段)的特征在于氨基酸殘基、特別是主要組成部分脯氨酸和丙氨酸的規(guī)定的含量或比率。如上文所述,本發(fā)明涉及生物合成的無規(guī)卷曲多肽或多肽區(qū)段,其包含僅由脯氨酸和丙氨酸氨基酸殘基組成的氨基酸序列,其中所述氨基酸序列由至少約50、至少約100、至少約150、至少約200、至少約250、至少約300、至少約350、至少約400個脯氨酸(Pro)和丙氨酸(Ala)氨基酸殘基組成,特別是當所述生物合成的無規(guī)卷曲多肽或多肽區(qū)段包含在異源生物活性蛋白/蛋白構建體/多肽或藥物綴合物中時。本文所用的術語“僅”表示,優(yōu)選至少約90%或至少約95%的氨基酸是脯氨酸和丙氨酸,其中脯氨酸和丙氨酸構成主要部分,但可以不是僅有的氨基酸殘基,即,本發(fā)明的這些氨基酸序列未必是100%的脯氨酸和丙氨酸氨基酸段。因此,本發(fā)明的生物合成的多肽/氨基酸序列還可以包含作為次要組成部分的除脯氨酸和丙氨酸之外的其它氨基酸,只要氨基酸序列形成/采取/具有無規(guī)卷曲構象。通過本文提供的方式和方法能容易地確定這類 無規(guī)卷曲構象。因此,對于術語“僅”,可以包含少量(小于約10%或小于約5%)的其它氨基酸殘基。所述“其它”的次要氨基酸殘基在下文中有定義。因此,在一個實施方案中,本發(fā)明涉及生物合成的無規(guī)卷曲多肽(或其區(qū)段),其中氨基酸序列主要由脯氨酸和丙氨酸組成,并且其中脯氨酸殘基構成大于約10%且小于75%的氨基酸序列。丙氨酸殘基包含所述氨基酸序列(或無規(guī)卷曲多肽或多肽區(qū)段,如果其由氨基酸序列組成)的剩余至少25%至90%。優(yōu)選地,氨基酸序列包含大于約10%、優(yōu)選大于約12%、甚至更優(yōu)選大于約14%、特別優(yōu)選大于約18%、更特別優(yōu)選大于約20%、甚至更特別優(yōu)選大于約22%、23%或24%和最優(yōu)選大于約25%的脯氨酸殘基。氨基酸序列優(yōu)選包含小于約75%、更優(yōu)選小于70%、65%、60%、55%或50%的脯氨酸殘基,其中較低的值是優(yōu)選的。甚至更優(yōu)選地,氨基酸序列包含小于約48%、46%、44%、42%的脯氨酸殘基。特別優(yōu)選的是,氨基酸序列包含小于約41%、40%、39%、38%,37%或36%的脯氨酸殘基,其中較低的值是優(yōu)選的。最優(yōu)選地,氨基酸序列包含小于約35%的脯氨酸殘基;還可參見下文提供的PA構建體。反之亦然,氨基酸序列優(yōu)選包含小于約90%、更優(yōu)選小于88%、86%、84%、82%或80%的丙氨酸殘基,其中較低的值是優(yōu)選的。甚至更優(yōu)選地,氨基酸序列包含小于約79%、78%、77%,76%的丙氨酸殘基,其中較低的值是優(yōu)選的。最優(yōu)選地,氨基酸序列包含小于約75%的
丙氨酸殘基。本文還優(yōu)選的是,氨基酸序列包含大于約25%、優(yōu)選大于約30%、甚至更優(yōu)選大于約35%、特別優(yōu)選大于約40%、更特別優(yōu)選大于約45%或50%、甚至更特別優(yōu)選大于約52%、54%、56%、58%或59%的丙氨酸殘基,其中較高的值是優(yōu)選的。甚至更優(yōu)選地,氨基酸序列包含大于約60%、61%、62%、63%或64%的丙氨酸殘基,最優(yōu)選大于約65%的丙氨酸殘基。因此,無規(guī)卷曲多肽(或其區(qū)段)可以包含由約25%的脯氨酸殘基和約75%的丙氨酸殘基組成的氨基酸序列。或者,無規(guī)卷曲多肽(或其區(qū)段)可以包含由約35%的脯氨酸殘基和約65%的丙氨酸殘基組成的氨基酸序列。上文所用的術語“約X%”不限于所述明確數(shù)量的百分比,還包括增加10%至20%或減少10%至20%的殘基的值。例如,術語10%還可以分別涉及11%或12%和9%和8%O然而,如上文所提及的和下文進一步的詳細描述,所述無規(guī)卷曲多肽(或多肽區(qū)段)并且特別是氨基酸序列還可以包含不同于脯氨酸和丙氨酸的作為次要組成部分的其它氨基酸。如上文已經討論的那樣,所述次要組成部分,即,除脯氨酸或丙氨酸之外的氨基酸,可以構成本發(fā)明生物合成的無規(guī)卷曲多肽/聚合物的小于約10%、小于約9%、小于約8%、小于約7%、小于約6%、小于約5%、小于約4%、小于約4%、小于約3%或小于約2%。本領域技術人員明白,當除脯氨酸或丙氨酸之外的其他殘基作為次要組成部分包含在氨基酸序列/多肽(多肽區(qū)段)中時,所述氨基酸序列/多肽(或其區(qū)段)還可以形成無規(guī)卷曲構象。本文所用的術語"次要組成部分"表示,在本發(fā)明的生物合成的無規(guī)卷曲多肽/聚合物中,最多5%或最多10%的氨基酸殘基不同于脯氨酸或丙氨酸。這表示,在100個氨基酸中,最多10個可以不同于脯氨酸和丙氨酸;優(yōu)選最多8%,即,在100個氨基酸中,最多8個可以不同于脯氨酸和丙氨酸;更優(yōu)選最多6%,即,在100個氨基酸中,最多6個可 以不同于脯氨酸和丙氨酸;甚至更優(yōu)選最多5%,即,在100個氨基酸中,最多5個可以不同于脯氨酸和丙氨酸;特別優(yōu)選最多4%,即,在100個氨基酸中,最多4個可以不同于脯氨酸和丙氨酸;更特別優(yōu)選最多3%,即,在100個氨基酸中,最多3個可以不同于脯氨酸和丙氨酸;甚至更特別優(yōu)選最多2%,S卩,在100個氨基酸中,最多2個可以不同于脯氨酸和丙氨酸;最優(yōu)選最多1%,即,在無規(guī)卷曲多肽(或其區(qū)段)包含的100個氨基酸中,最多I個可以不同于脯氨酸和丙氨酸。所述不同于脯氨酸和丙氨酸的氨基酸可以選自Arg、Asn、Asp、Cys、Gin、Glu、Gly、His、lie、Leu、Lys> Met、Phe> Thr、Trp> Tyr 和 Val,包括翻譯后修飾的氨基 酸或非天然氨基酸(參見,例如,Budisa(2004)Angew Chem Int Ed Engl 43:6426-6463 或Young (2010) J Biol Chem285:11039-11044)。當生物合成的無規(guī)卷曲多肽/構建體/聚合物(或其片段)的“次要組成部分”(即,除脯氨酸或丙氨酸之外的氨基酸)包含Ser作為“其它氨基酸”/ “不同的氨基酸”時,所述Ser氨基酸優(yōu)選構成這些(次要)氨基酸殘基的小于50%、更優(yōu)選小于40%、小于30%、小于20%或小于10%。在最優(yōu)選的實施方案中,本文所述的生物合成的無規(guī)卷曲多肽/構建體/聚合物或本文所述的(例如)融合蛋白的無規(guī)卷曲多肽部分不包含絲氨酸殘基。通常,本文優(yōu)選的是,這些“次要”氨基酸(除脯氨酸和丙氨酸之外)不存在于本文提供的生物合成的無規(guī)卷曲多肽/構建體/聚合物或(例如)融合蛋白的無規(guī)卷曲多肽部分。按照本發(fā)明,生物合成的無規(guī)卷曲多肽(或其區(qū)段)/氨基酸序列可以特別地僅僅由脯氨酸和丙氨酸氨基酸殘基構成(即,無規(guī)卷曲多肽或氨基酸序列中不存在其它氨基酸殘基)。雖然上文涉及無規(guī)卷曲多肽(或其區(qū)段)中包含的氨基酸序列的總長度和脯氨酸/丙氨酸含量,但下文更詳細地涉及具體的示例性氨基酸序列(或其片段)。在一個實施方案中,例如在水性溶液中或在生理條件下采取無規(guī)卷曲構象的氨基酸序列/多肽(本文所限定的無規(guī)卷曲多肽或其區(qū)段)可以包含多個“氨基酸重復”/ “氨基酸盒”/ “盒重復”,其中所述“氨基酸重復”/ “氨基酸盒”/ “盒重復”/ “構成部分”/ “模塊”(這些術語在本文中可交換使用)主要或僅僅由脯氨酸(Pro,P)和丙氨酸(Ala,A)氨基酸殘基組成(本文描述為“PA”或“AP”),其中不多于6個連續(xù)氨基酸殘基是相同的。示例性的“構成部分”是例如“AP”,并且在后文示例性的實例中將其提供為本發(fā)明的功能性生物合成的無規(guī)卷曲結構域。該示例性的實例是序列“P1A1 ”,其也以APAPAPAPAPAPAPAPAPAP(SEQ ID N0:51)的形式提供,即,“聚PA” “氨基酸重復” / “氨基酸盒”/ “盒重復”。在優(yōu)選的實施方案中,包含上文所限定的“氨基酸重復”/ “氨基酸盒”/”盒重復”等的氨基酸序列/多肽包含不多于5個相同的連續(xù)氨基酸殘基。對于示例性的個體構成部分,下文提供了其它可選實施方案。在本發(fā)明的無規(guī)卷曲多肽(或其區(qū)段)中,氨基酸重復可以是相同的或不相同的。由脯氨酸和丙氨酸殘基組成的“氨基酸重復”、“構成部分”、“模塊”、“重復”、“氨基酸盒”等的非限制性實例在下文提供;參見,例如SEQ ID NO: K SEQ ID N0:2、SEQ ID N0:3、SEQID NO: 4、SEQ ID NO: 5、SEQ ID NO: 6和SEQ ID NO: 51 (所附的序列表還包含編碼這些“重復”/ “模塊”等的示例性核酸序列。與本文共同提交的所述序列表中的附加序列構成本說明書的一部分)。此外,本文考慮了這些序列(相同的和/或不相同的)片段的用 途,其中“片段”包含至少2個氨基酸并包含至少一個脯氨酸和/或丙氨酸,優(yōu)選至少一個脯氨酸和一個丙氨酸。本發(fā)明中用于產生無規(guī)卷曲多肽(或其區(qū)段)的這些序列的“片段”可以由選自所述SEQ ID N0:l、2、3、4、5、6和51的氨基酸序列的至少3個、優(yōu)選至少4個、更優(yōu)選至少5個、甚至更優(yōu)選至少6個、仍然更優(yōu)選至少8個、特別優(yōu)選至少10個、更特別優(yōu)選至少12個、甚至更特別優(yōu)選至少14個、仍然更特別優(yōu)選至少16個、并且最優(yōu)選至少18個連續(xù)氨基酸組成(此處應當注意到,SEQ ID No: 51由示例性“AP”或“PA”重復組成)。基于本文給出的教導,本領域技術人員能夠容易地制備能例如在水性或生理條件下形成無規(guī)卷曲構象并且如本文所限定主要由脯氨酸和丙氨酸組成的其它氨基酸序列/多肽??捎米鞅疚乃薅ǖ臒o規(guī)卷曲多肽(或其區(qū)段)的構成部分或模塊的形成無規(guī)卷曲構象的氨基酸序列/多肽的其它實例可以特別包含上文所示的具體“構成部分”、“聚合物盒”或“聚合物重復”的組合和/或片段或環(huán)狀排列形式。因此,無規(guī)卷曲多肽/氨基酸序列的示例性模塊/序列單元/聚合物重復/聚合物盒還可以提供可以按照本發(fā)明重新組合而形成其它模塊/序列單元/聚合物重復/聚合物盒的個體片段。術語“模塊”、“序列單元”、“聚合物重復”、“聚合物盒”和“構成部分”在本文作為同義詞使用,并涉及可以用于形成本文所限定的無規(guī)卷曲多肽(或其區(qū)段)/氨基酸序列的個體氨基酸段。氨基酸重復(用作本發(fā)明生物合成的無規(guī)卷曲多肽的“構成部分”等)可以由至少 3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、
30或更多個氨基酸殘基組成,其中每個重復都包含脯氨酸和丙氨酸殘基。然而,如后文的SEQ ID No:51所示,所述“構成部分”還可以僅由2個本文提供的氨基酸殘基P和A組成,SP“PA”或“AP”的形式。在一個實施方案中,本發(fā)明的氨基酸重復不包含大于50個氨基酸殘基。然而,對于本領域技術人員顯而易見的是,所述“重復”可以包含甚至大于50個氨基酸殘基,例如當所述本發(fā)明生物合成的無規(guī)卷曲多肽/聚合物包含大于約例如100個氨基酸、大于約150個氨基酸、大于約200個氨基酸等的情況下。因此,所述“重復”中包含的氨基酸殘基的最大量以本文提供的生物合成的多肽(或其區(qū)段)/聚合物的總長度為前提條件。然而,應當注意到,包含上述重復等的生物合成的無規(guī)卷曲多肽/氨基酸序列應當優(yōu)選具有上文限定和解釋的總長度和/或脯氨酸/丙氨酸含量,即,由約50、約100、約150、約200、約250、約300、約350、約400至約3000個氨基酸組成和/或包含大于約10%且小于約75%的脯氨酸殘基。在必要的變通下,上文中關于此方面給出的所有限定也適用于此處。正如本文詳細討論和上文所提供的那樣,本發(fā)明提供了在藥學、醫(yī)學和/或治療領域中特別有用的生物活性異源蛋白或蛋白構建體。這些生物活性異源蛋白/蛋白構建體包含作為所述至少兩個結構域中的至少一個結構域的無規(guī)卷曲多肽或多肽區(qū)段,所述無規(guī)卷曲多肽或多肽區(qū)段包含僅由脯氨酸和丙氨酸殘基組成的氨基酸序列,其中所述氨基酸序列由約50、約100、約150、約200、約250、約300、約350、約400至約3000個脯氨酸(Pro)和丙氨酸(Ala)殘基組成。對于本文公開的生物活性異源蛋白、多肽或蛋白構建體,術語“異源”涉及所述蛋白、多肽或蛋白構建體中的至少兩個結構域,其中所述至少兩個結構域的第一結構域提供、具有和/或介導規(guī)定的生物活性,并且其中所述至少兩個結構域的第二結構域包含僅由脯氨酸和丙氨酸氨基酸殘基組成的生物合成的無規(guī)卷曲多肽,并且其中所述至少兩個結構域在自然界不是彼此有效連接的,或不是由自然界存在的單個編碼核酸序列(例如開放讀碼框)所編碼的。本文提供的和用于本發(fā)明生物活性異源蛋白/蛋白構建體的僅由脯氨酸和丙氨酸氨基酸殘基組成的生物合成的無規(guī)卷曲多肽/多肽區(qū)段優(yōu)選不進行其它(化學)修·飾,例如它們優(yōu)選不是糖基化或羥基化的。應當注意到,某些天然存在的蛋白或從測序的天然存在核酸段推定的假定蛋白被描述為包含相對高(即,高于平均值)含量的脯氨酸和丙氨酸。例如,已對于利什曼蟲(Leishmania)主要株 Friedlin 描述了同源假定蛋白(Ivens (2005) Science 309,436-442.)。所公開的包含1514個三聯(lián)密碼子的讀碼框包括一段412個三聯(lián)密碼子,其由240個Ala、132個Pro、34個Lys和4個Val密碼子組成。Lys殘基在生理緩沖液條件下是帶正電的,它們幾乎均勻地分布在該序列中,這提示增溶效果。然而,從本文公開內容能夠明顯判斷出,這種源自天然存在的核酸分子或開放讀碼框、包含高于平均值的高脯氨酸和丙氨酸含量的同源假定蛋白不是本發(fā)明的一部分。本發(fā)明是基于下述事實提供了在醫(yī)學/藥物領域特別有用的相當大的無規(guī)卷曲多肽或多肽區(qū)段,其不在自然中以分離的形式存在,并且其包含僅由脯氨酸和丙氨酸殘基組成的氨基酸序列,其中所述氨基酸序列由約50、約100、約150、約200、約250、約300、約350、約400至約3000個脯氨酸(Pro)和丙氨酸(Ala)殘基組成。本文所述的不在自然中以分離的形式存在的分離的生物合成無規(guī)卷曲多肽或多肽區(qū)段也包含在本文公開的在藥學、醫(yī)學和/或醫(yī)療領域中特別有用的生物活性異源蛋白或蛋白構建體中。這些生物活性異源蛋白/蛋白構建體包含作為所述至少兩個結構域中的至少一個結構域的無規(guī)卷曲多肽或多肽區(qū)段,所述無規(guī)卷曲多肽或多肽區(qū)段包含僅由脯氨酸和丙氨酸殘基組成的氨基酸序列,其中所述氨基酸序列由約50、約100、約150、約200、約250、約300、約350、約400至約3000個脯氨酸(Pro)和丙氨酸(Ala)殘基組成。另外,阿拉伯半乳聚糖蛋白(AGP)(富含Pro蛋白)和伸展蛋白屬于一大組稱為富含羥基脯氨酸(Hyp)的糖蛋白(HRGPs)的糖蛋白,其在植物界廣泛表達。包含Ala-PiO重復(AP) 51的一種所述AGP基序在轉基因擬南芥(Arabidopsis thaliana)中被表達為具有N末端信號序列和C末端綠色熒光蛋白的合成糖模塊肽,并被作為脯氨酰羥化酶和后續(xù)的羥基脯氨酸殘基O-糖基化的底物得到研究(Est6vez (2006) Plant Physiol. 142,458-470)。此外,所公開的能與水分子形成氫鍵的羥化和/或糖基化Pro側鏈看起來具有增溶效果。
應當注意到,本文所述的“包含作為(至少)一個結構域的生物合成的無規(guī)卷曲多肽或肽區(qū)段的生物活性蛋白或蛋白構建體,所述無規(guī)卷曲多肽或肽區(qū)段包含僅由脯氨酸和丙氨酸殘基組成的氨基酸序列”涉及在自然界中通常不存在的并因此是“異源”的蛋白或蛋白構建體。此外,相比于植物界中所述的富含脯氨酸的序列,本文所述的生物合成的無規(guī)卷曲多肽/多肽區(qū)段優(yōu)選不是化學修飾的,即,它們優(yōu)選不是糖基化或羥基化的。本發(fā)明的生物合成的無規(guī)卷曲多肽或多肽區(qū)段的特別優(yōu)勢在于它們固有親水、但不帶電的性質。因此,作為本文所述的生物合成的無規(guī)卷曲多肽或多肽段中的"次要"氨基酸(除脯氨酸和丙氨酸之外),這些氨基酸優(yōu)選不具有疏水性側鏈(例如Val、Ile、Leu、Met>Phe>Tyr或Trp)和/或不具有帶電側鏈(例如Lys、Arg、Asp或Glu)。本發(fā)明考慮到(當這些個體氨基酸包含于本發(fā)明生物合成的無規(guī)卷曲多肽/多肽區(qū)段中時),本文所述的生物合成的無規(guī)卷曲多肽(或其區(qū)段)中具有疏水性側鏈(例如Val,He, Leu, Met, Phe,Tyr或Trp)和/或具有帶電側鏈(例如Lys, Arg, Asp或Glu)的每種個體氨基酸的總含量不超過 8%、7%、6%、5%、4%、3%、2% 或 1%?!?br>
本發(fā)明的生物合成的無規(guī)卷曲多肽/氨基酸序列可以包含個體構成部分的多連體,所述個體模塊包含序列(Pro)x-(Ala)y的組合的脯氨酸/丙氨酸段,其中x可具有I至優(yōu)選15、更優(yōu)選I至10、甚至更優(yōu)選I至5的整數(shù)值,y可具有I至優(yōu)選15、更優(yōu)選I至10、甚至更優(yōu)選I至5的整數(shù)值,并且X和y在相繼的構成部分之間可以不同。所述X和y也可以是以下整數(shù):1、2、3、4、5、6、7、8、9、10、11、12、13、14 或 15。能在水性溶液中或在生理條件下形成無規(guī)卷曲構象的氨基酸序列/多肽可以具有式⑴[ProxAlayJn其中X獨立選自整數(shù)I至5。此外,對于每個n, y獨立選自整數(shù)I至5。最后,η是任何整數(shù),條件是無規(guī)卷曲多肽(或其區(qū)段)/氨基酸序列優(yōu)選由至少約50、至少約100、至少約150、至少約200、至少約250、至少約300、至少約350、至少約400個氨基酸殘基和最高至約3000個氨基酸殘基組成。在該方面還應當注意到,包含上述多連體或具有上述式(I)的多肽/氨基酸序列應當優(yōu)選具有上文所限定和解釋的總長度和/或脯氨酸/丙氨酸含量,即,由約50、約100、約150、約200、約250、約300、約350、約400至約3000個氨基酸組成和/或包含大于約10%且小于約75%的脯氨酸殘基。此外,在必要的變通下,上文對于該方面給出的所有限定也適用于此處。本發(fā)明還涉及包含選自以下的氨基酸段的無規(guī)卷曲多肽(多肽區(qū)段)/氨基酸序列AAPAAPAPAAPAAPAPAAPA (SEQ ID NO:I) ;AAPAAAPAPAAPAAPAPAAP (SEQID NO:2) ;AAAPAAAPAAAPAAAPAAAP(SEQ ID NO:3 是[Pro1Ala3]5 的一個實例);AAPAAPAAPAAPAAPAAPAAPAAP (SEQ ID NO :4) ;APAAAPAPAAAPAPAAAPAPAAAP (SEQ ID NO :5);AAAPAAPAAPPAAAAPAAPAAPPA(SEQ ID NO:6)和 APAPAPAPAPAPAPAPAPAP(SEQ ID NO: 51是[Pro1AlaJltl的一個實例)或作為這些序列整體或這些序列的一部分的這些序列的環(huán)狀排列形式或多聚體。因此,無規(guī)卷曲多肽(其多肽區(qū)段)/氨基酸序列可以包含氨基酸段 AAPAAPAPAAPAAPAPAAPA(SEQ ID NO: I), AAPAAPAPAAPAAPAPAAPA(SEQ IDNO:I) ;AAPAAAPAPAAPAAPAPAAP(SEQ ID NO:2) ;AAAPAAAPAAAPAAAPAAAP(SEQ ID NO:3);AAPAAPAAPAAPAAPAAPAAPAAP(SEQ ID NO :4) ;APAAAPAPAAAPAPAAAPAPAAAP(SEQ ID NO :5);AAAPAAPAAPPAAAAPAAPAAPPA(SEQ ID NO:6)和 APAPAPAPAPAPAPAPAPAP(SEQ ID NO:51),以及這些基序的組合或這些基序的片段和部分的組合,只要所產生的生物合成的無規(guī)卷曲多肽僅由脯氨酸和丙氨酸氨基酸殘基組成,其中所述氨基酸序列由至少50個脯氨酸(Pro)和丙氨酸(Ala)氨基酸殘基組成。此外,根據(jù)本發(fā)明,可以使用上述氨基酸序列的環(huán)狀排列形式??梢匀菀椎禺a生例如AAPAAPAPAAPAAPAPAAPA (SEQ ID NO: I)的示例性的環(huán)狀排列形式,例如通過去除第一丙氨酸并在上述序列的末端添加另一丙氨酸。SEQ ID NO: I的這樣的環(huán)狀排列形式會是APAAPAPAAPAAPAPAAPAA (SEQ ID NO: 7)。此外,SEQ ID NO: I的環(huán)狀排列形式的非限制性實例是PAAPAPAAPAAPAPAAPAAA(SEQ ID NO:8),AAPAPAAPAAPAPAAPAAAP(SEQ ID NO:9),
APAPAAPAAPAPAAPAAAPA(SEQ ID NO:10),PAPAAPAAPAPAAPAAAPAA(SEQ ID NO:11),APAAPAAPAPAAPAAAPAAP(SEQ ID NO:12),PAAPAAPAPAAPAAAPAAPA(SEQ ID NO:13),AAPAAPAPAAPAAAPAAPAP(SEQ ID NO:14),APAAPAPAAPAAAPAAPAPA(SEQ ID NO:15),PAAPAPAAPAAAPAAPAPAA(SEQ ID NO: 16)等?;诒景l(fā)明的教導,本領域技術人員能容易地制備SEQ ID NO:2,SEQ ID NO:3,SEQID NO:4、SEQ ID NO: 5、SEQ ID NO:6 和 SEQ ID NO: 51 (所述 SEQ ID No: 51 完全基于 “AP”重復,和環(huán)狀排列形式可以完全基于“PA”或“AP”重復/構成部分)所示的氨基酸段的相應環(huán)狀排列形式。這類環(huán)狀排列形式還可以被認為是本文提供的多肽/氨基酸序列的其它“模塊” /”構成部分”等的實例,因而可用于本發(fā)明。對于本領域技術人員顯而易見的是,本文提供的氨基酸段的“模塊”和(較短的)片段或環(huán)狀排列形式可以被用作本文所限定的無規(guī)卷曲多肽(或其區(qū)段)/氨基酸序列的“模塊”、“重復”和/或構成部分。按照上文,形成無規(guī)卷曲構象的無規(guī)卷曲多肽/氨基酸序列可以包含任何上述氨基酸段(或其環(huán)狀排列形式或片段)的多聚體,優(yōu)選SEQ ID NO: K SEQ ID NO:2, SEQ IDN0:3、SEQ ID NO:4, SEQ ID N0:5、SEQ ID N0:6 和 SEQ ID N0:51 所示的氨基酸段的多聚體。應當注意到,這些序列并非意圖限制本發(fā)明。此外,包含上述氨基酸段(或其片段)、環(huán)狀突變形式(或其片段)的多肽/氨基酸序列應當優(yōu)選具有上文所限定和解釋的總長度和/或脯氨酸/丙氨酸含量,即,由約50、約100、約150、約200、約250、約300、約350、約400至約3000個氨基酸組成和/或包含大于約10%且小于約75%的脯氨酸殘基。在必要的變通下,上文對于該方面給出的所有限定也適用于此處。此外,術語“片段”在上文已有定義。如上文所述,對于本發(fā)明,意外發(fā)現(xiàn)本文提供的生物合成的無規(guī)卷曲多肽(或多肽區(qū)段)/聚合物的特征為相對較大的流體動力學體積。通過分析凝膠過濾(也稱為尺寸排阻色譜,SEC)可以容易地測定該流體動力學體積(也稱為表觀尺寸)。優(yōu)選地,無規(guī)卷曲多肽(或其區(qū)段)具有的表觀尺寸為至少lOkDa、優(yōu)選至少25kDa、更優(yōu)選至少50kDa、甚至更優(yōu)選至少lOOkDa、特別優(yōu)選至少200kDa,最優(yōu)選至少400kDa。本領域技術人員能容易地測定具體蛋白的流體動力學體積。這些方法可以包括下文所示例的動態(tài)/靜態(tài)光散射、分析超離心或分析凝膠過濾。分析凝膠過濾代表本領域已知的用于測量大分子的流體動力學體積的方法。或者,球形多肽的流體動力學體積可以通過其分子量來估計(Creighton(1993)同上)。如本文所述,相對于基于分子量對于相應的折疊球形蛋白所估計出的流體動力學體積,本發(fā)明的優(yōu)選由至少約50、至少約100、至少約150、至少約200、至少約250、至少約300、至少約350、至少約400至約3000個脯氨酸和丙氨酸氨基酸殘基組成并具有無規(guī)卷曲構象的多肽的流體動力學體積意想不到地表現(xiàn)出高值。下文涉及生物活性異源蛋白或蛋白構建體,其特別包含上文描述和限定的、代表本發(fā)明優(yōu)選實施方案的生物合成的無規(guī)卷曲多肽(或其區(qū)段)。在不被理論束縛的情況下,在本發(fā)明中意外地發(fā)現(xiàn),本文提供的僅由脯氨酸和丙氨酸組成的生物合成的無規(guī)卷曲多肽段能提供的流體動力學體積甚至高于具有相同氨基酸殘基總數(shù)、但僅由脯氨酸、丙氨酸和絲氨酸組成的相應的生物合成的無規(guī)卷曲段(如WO 2008/155134中所提供的)的流體動力學體積。
諸如血清白蛋白(HSA)和免疫球蛋白(Ig)(包括人源化抗體)的常見人血漿蛋白表現(xiàn)出長的半衰期,通常為2至3周,這歸因于它們與新生Fe受體(FcRn)的特異性相互作用,從而導致胞內體再循環(huán)(Ghetie (2002) Immunol Res,25:97-113)。相比之下,大部分其它藥學上感興趣的蛋白,特別是重組抗體片段、激素、干擾素等,會遭受快速(血液)清除。這對于大小小于約70kDa的腎過濾的閾值的蛋白是特別明顯的(Caliceti (2003)Adv DrugDeliv Rev 55:1261-1277)。在這些情況下,未修飾的藥學蛋白的血衆(zhòng)半衰期可以顯著小于I小時,因此使其基本無法用于大部分治療應用。為了實現(xiàn)持續(xù)的藥理學作用以及改善的患者依從性(使所需的給藥間隔延長至數(shù)天或數(shù)周),為了生物藥學藥物開發(fā)目的之前已經建立了數(shù)種策略。第一,已經通過下述方式利用了天然血漿蛋白的再循環(huán)機制產生具有Ig的Fe部分的融合蛋白(例如Enbrel ,其是TNFa受體的細胞外結構域和人IgGi的雜合體(Goldenberg(1999)Clin Ther 21:75-87))或具有血清白蛋白的融合蛋白(例如Albuferond (albinterferon alfa_2b,ZALBIN , |QlJI..rHRON^ ),其是 IFNa 與 HAS的對應融合物(Osborn(2002) JPharmacol Exp Ther 303:540-548))。還也以間接的方式使用具有600 μ M的高血漿濃度的白蛋白,其作為配置了白蛋白結合功能的生物藥物的載體,例如,通過與來自鏈球菌蛋白G的細菌白蛋白結合結構域(ABD)進行融合(Makrides (1996)J Pharmacol Exp Ther 277:534-542)或與從噬菌體展示文庫針對HAS選擇的肽進行融合(Dennis(2002)J Biol Chem,277:35035-35043 ;Nguyen(2006)Protein Eng Des Sel19:291-297)。第二,延長生物藥物的血漿半衰期的本質上不同的方法是與高度溶劑化的和生理上惰性的化學聚合物綴合,從而有效增大治療蛋白的流體動力學半徑,使其超過約3 - 5nm的腎小球孔徑(Caliceti (2003)同上)。在生物化學上的溫和條件下與聚乙二醇(PEG)的活化衍生物的共價偶聯(lián)已取得一定成功,并且目前正用于數(shù)種獲批準的藥物,所述共價偶聯(lián)是通過Lys側鏈隨機地偶聯(lián)(Clark (1996) J Biol Chem 271:21969-21977)或借助于特別引入的 Cys 殘基(Rosendahl (2005) BioProcess International: 52-60)。已經取得了相應的優(yōu)勢,特別是在具有具體藥學活性的小蛋白中,例如Pegasys ,其是化學peg化的重組IFNa_2a(Harris(2003)Nat Rev Drug Discov, 2:214-221 ;ffalsh(2003)Nat Biotechnol21:865-870)。然而,生物活性蛋白與合成聚合物的化學偶聯(lián)在生物藥物研發(fā)和生產方面具有缺點。合適的PEG衍生物是昂貴的,特別是需要高純度時,并且它們與重組蛋白的綴合需要額外的體外加工和純化步驟,這會降低產率并提高生產成本。事實上,PEG經常被醛類和過氧化物污染(Ray (1985) Anal Biochem 146:307-312),并且其在氧的存在下貯存時本質上易于化學降解。另外,如果治療蛋白的生物化學活性位點附近的氨基酸側鏈在PEG化過程中被修飾,則該治療蛋白的藥物功能可能受到影響。此外,與合成聚合物的化學偶聯(lián)通常產生分子的異質混合物,這可能會表現(xiàn)出明顯的體內活性變化。第三,已經提議使用生物活性蛋白的糖基化類似物來延長血漿半衰期,其中引入新的N連接糖基化共有序列;參見WO 02/02597 ;Perlman(2003) J Clin Endocrinol Metab88:2327-2335 ;或 Elliott (2003)Nat Biotechnol 21:414-420)。然而,所述糖工程化蛋白 表現(xiàn)出改變的體內活性,這表明新的碳水化合物側鏈影響工程化蛋白的生物活性。此外,額外的碳水化合物側鏈可能會增加產生的生物活性分子的抗原性,這會明顯增加安全性問題。此外,據(jù)報道,包含克氏錐蟲來源的人工重復性序列PSTAD的融合蛋白能誘導反式唾液酸酶的延長的血漿半衰期(Alvarez (2004) JBC 279:3375-3381)。然而,據(jù)報道,這樣的克氏錐蟲來源的重復會誘導體液免疫應答(Alvarez (2004)同上)。因此,需要延長生物活性蛋白的作用的備選策略。意外地發(fā)現(xiàn),本文公開的和按照本發(fā)明僅由脯氨酸和丙氨酸組成的生物合成的氨基酸序列/多肽能采取無規(guī)卷曲構象,特別是在生理條件下。因此,它們是提供下文限定的生物活性蛋白/多肽的“第二結構域”的有利的分子,即,所述生物活性蛋白/多肽包含在生理條件下形成無規(guī)卷曲構象并從而能為生物活性(“功能”)蛋白或多肽介導增加的體內和/或體外穩(wěn)定性,特別是增加的血漿半衰期的多肽段。與所述無規(guī)卷曲結構域融合的功能蛋白的流體動力學體積顯著增加,這可以通過使用本文所述的標準方法進行估計。因為無規(guī)卷曲結構域被認為不會干擾生物活性蛋白的第一結構域的生物活性,所以與其融合的感興趣的功能蛋白所介導的生物活性基本上能被保留。此外,形成本文公開的無規(guī)卷曲結構域的氨基酸聚合物/多肽被認為是生物學上惰性很大的,特別是在血漿中的蛋白水解、免疫原性、等電點/靜電行為、與細胞表面受體的結合以及內化的方面,但是其仍是生物可降解的,這會提供超過諸如PEG的合成聚合物的清楚優(yōu)勢。按照上文,本發(fā)明涉及包含本文所述的生物合成的無規(guī)卷曲多肽的生物活性蛋白。包含本文所述的生物合成的無規(guī)卷曲多肽的生物活性蛋白/蛋白構建體是異源生物活性蛋白/蛋白構建體。具體而言,本文還公開了包含至少兩個結構域或由至少兩個結構域組成的生物活性異源蛋白,其中(a)所述至少兩個結構域的第一結構域包含具有和/或介導所述生物活性的氨基酸序列或由具有和/或介導所述生物活性的氨基酸序列組成;和(b)所述至少兩個結構域的第二結構域包含本文所述的和限定的無規(guī)卷曲多肽或多肽區(qū)段或由本文所述的和限定的無規(guī)卷曲多肽或多肽區(qū)段組成。應當注意到,按照本發(fā)明,所述“第一結構域”和所述“第二結構域”涉及這樣的蛋白段,所述蛋白段在同一蛋白中不是天然存在的或預期不是自然界存在的編碼核酸序列(例如,開放讀碼框)所編碼的同一假定蛋白的一部分。在必要的變通下,上文對于無規(guī)卷曲多肽或其多肽區(qū)段的給出的限定和解釋也適用于包含所述無規(guī)卷曲多肽(或其多肽區(qū)段)的生物活性蛋白。優(yōu)選地,所述無規(guī)卷曲構象介導所述生物活性蛋白的增加的體內和/或體外穩(wěn)定性,例如生物樣品中或生理環(huán)境中的體內和/或體外穩(wěn)定性。例如,本文中考慮到,包含本文所限定的能在水性溶液中或在生理條件下采取無規(guī)卷曲構象的其它“第二結構域”(例如,由約200或約400或約600個氨基酸殘基組成并包含作為“構成部分”的 PA#1/SEQ ID N0:1、PA#2/SEQ ID N0:2、PA#3/SEQ ID N0:3、PA#4/SEQ ID NO:4, PA#5/SEQ ID NO:5、PA#6/SEQ ID NO:6 和 / 或 P1A1/SEQ ID N0:51 的聚合物)的蛋白與缺少所述無規(guī)卷曲構象的對照相比,具有有利的血清穩(wěn)定性或血漿半衰期,甚至在體內,(特別是在靜脈內給藥時)。 在WO 2008/155134(如上文所討論)中證實,包含具有能采取無規(guī)卷曲構象的氨基酸序列的結構域的生物活性蛋白具有增加的體內和/或體外穩(wěn)定性。具體而言,WO2008/155134所公開的無規(guī)卷曲結構域由脯氨酸、丙氨酸和絲氨酸(PAS)殘基組成。該現(xiàn)有技術文件中描述了這三種殘基的存在,作為在水性溶液中形成穩(wěn)定和可溶性無規(guī)卷曲的基本要求。如上文的背景部分所討論的,WO 2007/103515描述了無組織的重組聚合物,其包含多種氨基酸作為主要組成部分,特別是甘氨酸、天冬氨酸、丙氨酸、絲氨酸、蘇氨酸、谷氨酸和脯氨酸。然而,相比于術語“生物合成”和“無規(guī)卷曲”,術語“無組織的重組聚合物”沒有公認的清楚含義。上文還描述了 WO 2006/081249。該文件描述了蛋白綴合物,其包含與包含2至500個氨基酸重復單元的多肽偶聯(lián)的生物活性蛋白,所述氨基酸重復具有作為主要組成部分的Gly、Asn和Gln和作為次要組成部分的Ser、Thr> Asp、Gin、Glu、His和Asn。與未綴合的生物活性蛋白相比,所述蛋白綴合物被描述為具有增加的或減少的血漿半衰期。然而,WO2006/081249未提供任何教導來預測具體的氨基酸重復能減少還是增加綴合物的血漿半衰期。此外,WO 2006/081249未教導或暗示,當綴合的蛋白包含本發(fā)明所示的形成無規(guī)卷曲構象的氨基酸重復時,蛋白的血漿半衰期能增加。此外,WO 2006/081249所公開的氨基酸重復包含至少兩種選自Gly、Asn和Gln的殘基,這與本發(fā)明的生物合成的無規(guī)卷曲多肽明顯不同,本發(fā)明的生物合成的無規(guī)卷曲多肽包含僅由脯氨酸和丙氨酸氨基酸殘基組成的氨基酸序列。令人意想不到的是,本申請發(fā)現(xiàn),本文提供的生物合成的無規(guī)卷曲氨基酸序列,與現(xiàn)有技術相比,僅包含脯氨酸和丙氨酸殘基(即,其優(yōu)選不包含大量的任何其它氨基酸,也不包含大量的絲氨酸或根本不包含絲氨酸),并且也形成有效的無規(guī)卷曲結構??紤]到WO2008/155134的公開內容,S卩,具有僅由絲氨酸和丙氨酸(SA)殘基組成的結構域(即,缺少脯氨酸殘基)的融合蛋白,本申請的發(fā)現(xiàn)是特別意想不到的,從而表明這樣僅包含兩種氨基酸的結構域不能形成無規(guī)卷曲,而是形成β折疊結構。這些絲氨酸-丙氨酸結構域也未表現(xiàn)出對于“PAS”所觀察到的增加的流體動力學體積,或特別是未表現(xiàn)出對于本文提供的“Ρ/Α”序列所觀察到的增加的流體動力學體積。
本文所用的術語〃生物活性〃描述了某一物質對生命體的生物效應。因此,本文所用的術語"生物活性蛋白"涉及能在暴露于所述蛋白或多肽的活的細胞/生物體中誘導生物效應的蛋白。然而,應當注意到,對于本發(fā)明,術語"生物活性蛋白"涉及包含具有和/或介導所述生物活性的氨基酸序列(所述第一結構域)和能采取/形成無規(guī)卷曲構象并僅由脯氨酸和丙氨酸組成的本發(fā)明氨基酸序列(所述第二結構域)的本發(fā)明完整蛋白。因此,本文所用的術語〃具有和/或介導生物活性的氨基酸序列〃或〃具有生物活性的氨基酸序列"涉及上文所限定的本發(fā)明的生物活性蛋白的"第一結構域〃,其介導或具有或能介導或能具有上文所限定的"生物活性〃。術語"具有和/或介導生物活性的氨基酸序列"或"具有生物活性的氨基酸序列"還包括在體內或體外半衰期需要被延長的任何感興趣的蛋白(及其功能片段,例如抗體片段、包含膜受體的細胞外或細胞內結構域的片段、生長因子或細胞因子等的截短形式)。在本發(fā)明的一個實施方案中,本發(fā)明的具有和/或介導生物活性的氨基酸序列可以來自任何"感興趣的蛋白〃,即,藥學或生物學所關注的任何蛋白或可用作治療劑/診斷劑的任何蛋白。因此,生物活性蛋白可以包含第一結構域,所述第一結構域包含來源于天然產生 的多肽或通過重組DNA技術產生的多肽的生物活性氨基酸序列。在優(yōu)選的實施方案中,感興趣的蛋白可以選自結合蛋白/結合分子、免疫球蛋白、抗體片段、轉運蛋白、膜受體、諸如細胞因子、生長因子、激素或酶等的信號蛋白/肽。如上文所解釋的,包含于生物活性蛋白的第二結構域中的無規(guī)卷曲多肽(或多肽區(qū)段)形成無規(guī)卷曲構象,特別是在生理條件下。這對于可以形成待給予個體或患者的藥物組合物的一部分的生物活性蛋白是特別重要的。應當注意到,本發(fā)明的生物活性蛋白的生物合成的無規(guī)卷曲結構域(所述“第二結構域”)天然地(即,在生理條件下)采取/形成/具有無規(guī)卷曲構象,特別是在體內以及給予需要醫(yī)學干預的哺乳動物或人類患者時。相比之下,本領域已知的是,具有非隨機二級結構和/或三級結構作為天然構象的蛋白傾向于在非生理條件下(即,在變性條件下)采取無規(guī)卷曲構象。然而,與包含本發(fā)明的無規(guī)卷曲多肽的生物活性蛋白相比,這樣的變性蛋白具有完全不同的性質。因此,本發(fā)明的主旨是,本文提供的“生物活性蛋白”和融合蛋白/融合構建體的生物活性部分,當與本發(fā)明生物合成的無規(guī)卷曲多肽(或多肽區(qū)段)結合和/或連接時,也保持它們的生物功能。此外,無規(guī)卷曲多肽(或多肽區(qū)段)在生理條件下仍然保持可溶性。因此,還考慮至IJ,本發(fā)明的蛋白構建體(包含上文所限定的“第一結構域”和“第二結構域”)可以包含暫時或暫且不處于無規(guī)卷曲構象的“第二”無規(guī)卷曲形成/采取結構域,例如,當處于諸如凍干的或干燥的組合物的某些組合物形式時。然而,重要的是,本發(fā)明蛋白構建體的這類“第二結構域”,當例如在相應的緩沖液(優(yōu)選“生理”緩沖液/賦形劑和/或溶劑)中復原之后,能再次采取本文所限定的無規(guī)卷曲構象。所述“第二結構域”能(如果需要,則在相應的復原之后)介導本發(fā)明生物活性蛋白的增加的體內和/或體外穩(wěn)定性。本文優(yōu)選的是,本文所限定的“第二結構域”由本發(fā)明的無規(guī)卷曲多肽(或多肽區(qū)段)組成。本文所用的術語"結構域"涉及能自主采取具體結構和/或功能的任何氨基酸序列區(qū)域/部分。因此,對于本發(fā)明,"結構域"可以代表功能結構域或結構結構域。如本文所述,本發(fā)明的蛋白包含至少一個具有和/或介導生物活性的結構域/部分和至少一個形成無規(guī)卷曲構象的結構域/部分。然而,本發(fā)明的蛋白也可以由大于兩個結構域組成,并且可以包含例如本文所限定的兩個結構域/部分之間的額外的連接子或間隔子結構或另一結構域/部分,例如蛋白酶敏感切割位點、親和標簽(例如His6-標簽或Strep標簽)、信號肽、停留肽、靶向肽(例如膜轉位肽)或其它效應結構域,例如用于與抗腫瘤毒素相關的腫瘤靶向的抗體片段或用于前藥活化的酶等。在另一個實施方案中,通過分析凝膠過濾(也稱為尺寸排阻色譜,SEC)測定,本發(fā)明的生物活性蛋白具有的流體動力學體積為至少50kDa、優(yōu)選至少70kDa、更優(yōu)選至少80kDa、甚至更優(yōu)選至少lOOkDa、特別優(yōu)選至少125kDa,最優(yōu)選至少150kDa。本領域技術人員能容易地測定具體蛋白的流體動力學體積。示例性的方法在上文關于無規(guī)卷曲多肽中已有描述。本領域技術人員還能根據(jù)本發(fā)明的生物活性蛋白容易地調整這些方法。如下文所述,相比于基于氨基酸殘基的分子量或分子數(shù)/組成,對相應的折疊球形蛋白所估計出的流體動力學體積,本發(fā)明的包含上文所限定的第二結構域(即,包含本文提供的無規(guī)卷曲多肽(或其區(qū)段)或由本文提供的無規(guī)卷曲多肽(或其區(qū)段)組成的結構域)的生物活性蛋白的流體動力學體積被證實具有意想不到的大流體動力學體積。 應當注意到,包含〃具有和/或介導生物活性的氨基酸序列〃的第一結構域在另一多肽或氨基酸序列的情況下或與另一多肽或氨基酸序列結合之后還可以保留其生物活性。例如,抗體的Fab片段,例如抗腫瘤抗體赫塞汀(Herceptin)的一個Fab片段(Eigenbrot (1993) J. Mol. Biol. 229:969-995),由兩個不同多肽鏈組成,即免疫球蛋白輕鏈和免疫球蛋白重鏈的片段,它們還可以通過鏈間二硫鍵被連接起來。按照本發(fā)明,將那些鏈中的一個(例如通過基因融合)與無規(guī)卷曲多肽(或多肽區(qū)段)連接,同時通過與其它鏈結合來重建完整的生物活性蛋白就可以是足夠的。例如,可以通過以下實現(xiàn)所述重建,如后文實施例所述的不同多肽(一方面是一條鏈與無規(guī)卷曲多肽的融合蛋白,另一方便是其它鏈)在相同宿主細胞的共表達,或體外重建,例如,作為再折疊方案的一部分。因此,這樣的蛋白(包含兩個單獨的多肽鏈)也被視為本發(fā)明的生物活性蛋白。在這樣的情況下,本文所限定的第一結構域可以包含僅非共價連接的兩個單獨的多肽鏈。此夕卜,生物活性蛋白/結構域的單獨鏈可以各自都與無規(guī)卷曲多肽(或多肽區(qū)段)連接。除抗體片段之外,還有很多其它由數(shù)個相關的多肽鏈組成并適合于本發(fā)明的感興趣的同寡聚蛋白或異寡聚蛋白(例如,胰島素、血紅蛋白等)。本文所用的術語"結合蛋白"涉及這樣的分子,其能特異性地與可能的結合伴侶相互作用,從而能將所述可能的結合伴侶和作為所述可能結合伴侶的多個不同分子區(qū)別至這樣的程度,即在所述作為可能的結合伴侶的多個不同分子的庫中,僅有所述可能的結合伴侶是結合的或顯著結合的。測定結合蛋白和可能的結合伴侶之間的結合的方法是本領域已知的,并且能常規(guī)地實施,例如,通過使用ELISA、等溫滴定量熱法、平衡透析法、拉下實驗(pull down assay)、表面等離子體共振或Biacore裝置??捎糜诒景l(fā)明的示例性的結合蛋白/結合分子包括但不限于,抗體、抗體片段,例如Fab片段、F(ab' )2片段、單鏈可變片段(scFv)、抗體的分離的可變區(qū)(VL和/或VH區(qū))、CDR、單結構域抗體/免疫球蛋白、CDR衍生的肽模擬物、凝集素、免疫球蛋白結構域、纖連蛋白結構域、蛋白A結構域、SH3結構域、錨蛋白重復結構域、脂質運載蛋白(Iipocalin)或各種支架衍生的結合蛋白,例如,如Skerra(2000)J Mol Recognit 13:167-187, Gebauer(2009)Curr Opin Chem Biol 13:245-255,Binz (2005)Nat Biotechnol 23:1257-1268 或 Nelson(2009)Nat Biotechnol 27:331-337中所述。可用于本發(fā)明的其它示例性的感興趣的生物活性蛋白(特別是生物活性蛋白的第一結構域中包含的或組成/作為生物活性蛋白的第一結構域的蛋白)包括但不限于,粒細胞集落刺激因子、人生長激素、α-干擾素、β-干擾素、Y-干擾素、λ-干擾素、腫瘤壞死因子、紅細胞生成素、凝血因子(例如凝血因子VIII、凝血因子Vila、凝血因子IX)、gpl20/gpl60、可溶性腫瘤壞死因子I和II受體、溶栓劑(例如瑞替普酶)、具有代謝效應的肽(例如GLP-I或艾塞那肽-4)、免疫抑制/免疫調節(jié)蛋白(例如白介素-I受體拮抗劑或阿那白滯素、白介素-2和中性粒細胞明膠酶相關脂質運載蛋白)或其它天然的或工程化的脂質運載蛋白或例如,Walsh (2003)Nat Biotechnol 21:865-870 或 Walsh (2004)Eur JPharm Biopharm 58:185-196 列出的蛋白或化合物,或諸如 http: //www.biopharma.com/approvals, html或http: Il www.drugbank.ca.的在線數(shù)據(jù)庫列出的蛋白或化合物。可用于本發(fā)明的其它生物活性蛋白(特別是生物活性蛋白的第一結構域中包含的或組成/作為生物活性蛋白的第一結構域的蛋白)特別是卵泡刺激素、葡糖腦苷脂酶、胸腺素α I、胰高血糖素、生長激素抑制素、腺苷脫氨酶、白介素11、hematide、瘦素、白介素-20、白介素-22 受體α亞基(IL_22ra)、白介素-22、透明質酸酶、成纖維細胞生長因子18、成纖維細胞生長因子21、胰高血糖素樣肽I、骨保護素、IL-18結合蛋白、生長激素釋放因子、可溶性TACI受體、血小板反應蛋白-I、可溶性VEGF受體Flt-1、α-半乳糖苷酶A、肌骨素拮抗劑、抑胃多肽、α-I抗胰蛋白酶、IL-4突變蛋白等。從本文公開的內容可以顯而易見的是,本發(fā)明還涉及包含生物合成的無規(guī)卷曲脯氨酸/丙氨酸多肽或脯氨酸/丙氨酸多肽區(qū)段和藥學上或醫(yī)學上有用的分子,例如小分子、肽或生物大分子,例如蛋白、核酸、碳水化合物、脂質囊泡等,特別是藥學上或醫(yī)學上有用的蛋白,例如(但不限于)結合蛋白/結合分子、免疫球蛋白、抗體片段、轉運蛋白、膜受體、信號蛋白/肽、細胞因子、生長因子、激素或酶等,并且它們可以被包含在本文所限定的藥物構建體中,但它們還可以是本文所限定的包含所限定的至少兩個結構域或由所限定的至少兩個結構域組成的生物活性異源蛋白的一部分。在這樣的情況下,所述具體的藥學上或醫(yī)學上有用的蛋白(或其功能片段)可以是包含具有和/或介導所述生物活性的氨基酸序列或由具有和/或介導所述生物活性的氨基酸序列組成的所述至少兩個結構域的“第一結構域”。在這樣的情況下,功能片段是所述藥學上或醫(yī)學上有用的蛋白的片段,所述片段仍能在體內和/或體外引發(fā)所需的生物學或藥學應答和/或仍具有或介導所需的生物活性。在所述第一和所述第二結構域之間插入的上述多肽連接子/間隔子優(yōu)選包含多個親水性、肽鍵連接的氨基酸,其與兩個結構域共價連接。在另一個實施方案中,所述多肽連接子/間隔子包含血漿蛋白酶切割位點,其允許包含具有和/或介導生物活性的多肽的所述第一結構域的受控釋放??梢匀菀椎罔b定出不同類型或長度的連接子,而獲得具體蛋白的的最佳生物活性。在優(yōu)選的實施方案中,本發(fā)明的生物活性蛋白是融合蛋白。本文所述的融合蛋白可以在單個多結構域多肽中包含至少一個能介導生物活性的結構域和至少一個包含本文所述的生物合成的無規(guī)卷曲多肽(或多肽區(qū)段)的其它結構域。此外,應當注意到,本發(fā)明不限于其中一個結構域介導生物活性的融合蛋白。本文還提供了其它“融合蛋白” /”融合構建體”,其中一個部分/結構域是本發(fā)明的脯氨酸/丙氨酸無規(guī)卷曲多肽/聚合物或包含本發(fā)明的脯氨酸/丙氨酸無規(guī)卷曲多肽/聚合物,并且其它部分/結構域包含另一蛋白段/結構。特別是,對于融合蛋白,本發(fā)明的無規(guī)卷曲多肽(或多肽區(qū)段)不一定在其氨基或羧基末端攜帶Pr0或Ala殘基。在可選實施方案中,本發(fā)明的生物活性蛋白可以代表蛋白綴合物,其中感興趣的蛋白或具有和/或介導生物活性的多肽/多肽段/肽/氨基酸序列通過非肽鍵與形成/采取無規(guī)卷曲構象的氨基酸序列、特別是本文提供的且僅由脯氨酸和丙氨酸殘基組成的無規(guī)卷曲多肽(或多肽區(qū)段)綴合。可用于將蛋白與包含僅由脯氨酸和丙氨酸氨基酸殘基組成的氨基酸序列的生物合成的無規(guī)卷曲多肽或多肽區(qū)段進行交聯(lián)的非肽鍵是本領域已知的,其中所述氨基酸序列由本文提供的至少50個脯氨酸(Pro)和丙氨酸(Ala)氨基酸殘基組成。所述非肽鍵可以包括例如Cys側鏈之間的二硫鍵、硫醚鍵或由化學交聯(lián)子產生的非肽共價鍵,例如雙琥珀酰亞胺辛二酸酯(DSS)或磺基琥珀酰亞胺4-[P-馬來酰亞胺苯基]丁酸酯(硫代SMPB)、金屬螯合/復合基團,以及非共價蛋白-蛋白相互作用。應當注意到,本發(fā)明的〃生物活性蛋白〃還可以包含多于一個〃具有和/或介導·生物活性的氨基酸序列〃。此外,生物活性蛋白還可以包含大于生物合成的無規(guī)卷曲多肽(或其區(qū)段)。在最簡單的情況下,生物活性蛋白由兩個結構域組成,即,包含具有和/或介導生物活性的氨基酸序列的第一結構域和包含生物合成的多肽(或其區(qū)段)的第二結構域。應當注意到,本發(fā)明不限于與本文公開的生物合成的無規(guī)卷曲多肽或多肽區(qū)段連接的“生物學上或治療上的活性蛋白”,所述生物合成的無規(guī)卷曲多肽或多肽區(qū)段包含僅由脯氨酸和丙氨酸氨基酸殘基組成的氨基酸序列,其中所述氨基酸序列由至少50個脯氨酸(Pro)和丙氨酸(Ala)氨基酸殘基組成。此外,在例如食品或飲料工業(yè)、美容用品工業(yè)等的其它工業(yè)中有重要作用其它感興趣的蛋白或分子可以通過本文提供的方式和方法來制備。本領域技術人員知曉,可以將"包含具有和/或介導生物活性的氨基酸序列的結構域"和"包含在本發(fā)明的生物活性蛋白中包含的無規(guī)卷曲多肽(或其區(qū)段)的第二結構域〃以具體的順序組織在一起。因此,在本發(fā)明中,本發(fā)明生物活性多肽的所述“第一”和“第二”結構域的順序可以按順序安排,由此所述“第一結構域”(即,感興趣的蛋白;“具有和/或介導所述生物活性的氨基酸序列”)位于生物活性蛋白的氨基(N-)末端,且所述“第二結構域”(即,包含本文提供的無規(guī)卷曲多肽(或其區(qū)段)的結構域)位于生物活性蛋白的羧基(C-)末端。然而,該順序還可以顛倒,例如所述“第一結構域”(即,感興趣的蛋白;“具有和/或介導所述生物活性的氨基酸序列”)位于生物活性蛋白的羧基(C-)末端,所述“第二結構域”(即,包含本文提供的無規(guī)卷曲多肽(或其區(qū)段)的結構域)位于生物活性蛋白的氨基(N-)末端。如果生物活性蛋白僅由一個第一結構域和一個第二結構域組成,則結構域順序因此可以為(從N末端至C末端)第一結構域(具有和/或介導生物活性的氨基酸序列)_第二結構域(無規(guī)卷曲多肽(或其區(qū)段))。反之亦然,結構域順序可以為(從N末端至C末端) 第二結構域(無規(guī)卷曲多肽(或其區(qū)段))_第一結構域(具有和/或介導生物活性的氨基酸序列)。還考慮到,多于一個包含具有和/或介導所述生物活性的氨基酸序列或由具有和/或介導所述生物活性的氨基酸序列組成的結構域可用于本發(fā)明的蛋白構建體。例如,生物活性蛋白可以包含兩個“第一結構域”,即,兩個具有和/或介導生物活性的具體氨基酸序列,由此這種生物活性可以是相同的或不同的活性。如果生物活性蛋白由兩個這樣的“第一結構域”即兩個具有和/或介導生物活性的具體氨基酸序列和一個“第二結構域”(包含生物合成的無規(guī)卷曲多肽(或其區(qū)段)組成,則結構域順序可以為(從N末端至C末端)第一結構域(具有和/或介導具體生物活性的氨基酸序列)-第二結構域(無規(guī)卷曲多肽(或其區(qū)段))-第一結構域(具有和/或介導具體(任選地不同)生物活性的氨基酸序列)。相同的解釋適用于生物活性蛋白包含多于一個“第二結構域”(即,生物活性蛋白包含多于一個無規(guī)卷曲多肽(或其區(qū)段)的情況。如果生物活性蛋白由兩個這樣的“第二結構域”即兩個包含生物合成的無規(guī)卷曲多肽(或其區(qū)段)的結構域和一個“第一結構域”(包含具有和/或介導生物活性的氨基酸序列)組成,則結構域順序可以為(從N末端至C末端)第二結構域(無規(guī)卷曲多肽(或其區(qū)段))-第一結構域(具有和/或介導具體生物活性的氨基酸序列)-第二結構域(無規(guī)卷曲多肽(或其區(qū)段))。如果生物活性蛋白包含多于一個“第二結構域”,本文考慮到,這些“第二結構域”可以是相同的或可以是不 同的。如上文所述,生物活性蛋白可以包含多于一個“第一結構域”,即,多于一個具有和/或介導生物活性的具體氨基酸序列,和多于一個“第二結構域”(生物合成的無規(guī)卷曲多肽(或其區(qū)段)),其中這些“第一結構域”可以是相同的或不同,和/或其中所述“第二結構域”可以是相同的或不同。在這些情況下,下述示例性的結構域順序是可能的(從N末端至C末端)-第一結構域(具有和/或介導具體生物活性的氨基酸序列)_第二結構域(無規(guī)卷曲多肽(或其區(qū)段))-第一結構域(具有和/或介導具體生物活性的氨基酸序列)_第二結構域(無規(guī)卷曲多肽(或其區(qū)段));-第二結構域(無規(guī)卷曲多肽(或其區(qū)段))_第一結構域(具有和/或介導具體生物活性的氨基酸序列)-第一結構域(具有和/或介導具體生物活性的氨基酸序列)-第二結構域(無規(guī)卷曲多肽(或其區(qū)段));-第一結構域(具有和/或介導具體生物活性的氨基酸序列)_第二結構域(無規(guī)卷曲多肽(或其區(qū)段))_第二結構域(無規(guī)卷曲多肽(或其區(qū)段))_第一結構域(具有和/或介導具體生物活性的氨基酸序列);-第二結構域(無規(guī)卷曲多肽(或其區(qū)段))-第一結構域(具有和/或介導具體生物活性的氨基酸序列)-第二結構域(無規(guī)卷曲多肽(或其區(qū)段))-第一結構域(具有和/或介導具體生物活性的氨基酸序列);-第二結構域(無規(guī)卷曲多肽(或其區(qū)段))-第二結構域(無規(guī)卷曲多肽(或其區(qū)段))-第一結構域(具有和/或介導具體生物活性的氨基酸序列)-第一結構域(具有和/或介導具體生物活性的氨基酸序列);或-第一結構域(具有和/或介導具體生物活性的氨基酸序列)-第一結構域(具有和/或介導具體生物活性的氨基酸序列)-第二結構域(無規(guī)卷曲多肽(或其區(qū)段))-第二結構域(無規(guī)卷曲多肽(或其區(qū)段))。
對于本領域技術人員,其它相應的結構域順序(特別是生物活性蛋白中包含大于兩個“第一結構域”或“大于兩個“第二結構域”的情況下)是容易想到的。對于本發(fā)明多肽/生物活性蛋白的所有實施方案,包含具有和/或介導所述生物活性的氨基酸序列的所述結構域,還可以是具有所需生物功能的給定蛋白的生物活性片段。因此,本文所限定的“第二結構域”(優(yōu)選包含本文提供的無規(guī)卷曲多肽(或其區(qū)段))還可以位于感興趣的蛋白的兩個生物活性片段之間或兩個感興趣的蛋白的生物活性片段之間。在必要的變通下,上文對于“全長”感興趣的蛋白/多肽(即,當氨基酸序列自身具有/介導某一生物活性時)給出的所有解釋和限定適用于這樣的片段。此外,上述發(fā)明不限于包含具有“生物活性功能”的“結構域”的構建體。本發(fā)明的構建體還可以包含具有其它功能的結構域,并且不限于生物活性。這些僅是本發(fā)明的實施方案,并且對于本領域技術人員顯而易見的是,在不脫離本發(fā)明的主旨的情況下,能容易地制備和使用其它構建體。因此,在必要的變通下,本文關于“具有和/或介導具體生物活性的氨基酸序列”的所述適用于其它構建體,例如可用于其它技術領域的構建體,例如美容用品、食品加工、乳制品、造紙工業(yè)等。如上文所述,本發(fā)明的生物合成的多肽/聚合物也可 以用于與例如小分子等連接。此外,應當指出,術語“具有和/或介導第一生物活性的氨基酸序列”不限于具有和/或介導所述生物活性或功能的全長多肽,還包括它的生物學和/或藥理學活性片段。特別是(但不僅如此),在本發(fā)明的“生物活性蛋白”中包含兩個或更多個本文所限定的“第一結構域”時,還考慮到,這些“第一結構域”是或代表蛋白復合物的不同的部分或蛋白復合物的該部分的片段。如下文所例示,與缺少無規(guī)卷曲結構域的未修飾的生物活性蛋白相比,經過修飾而包含所述無規(guī)卷曲多肽的本發(fā)明的生物活性蛋白意外地表現(xiàn)出增加的體內和/或體外穩(wěn)定性。本文所用的術語"體內穩(wěn)定性"涉及被給予活體的具體物質保持生物可利用性和生物活性的能力。在體內,由于排泄、腎過濾、肝攝取、聚集、降解和/或其它代謝過程,物質可以被移除和/或失活。因此,對于本發(fā)明,具有增加的體內穩(wěn)定性的生物活性蛋白通過腎(尿)或通過排泄物排泄的速度可以較慢,和/或可以更穩(wěn)定對抗蛋白水解,特別是對抗生物液體(例如血液、腦脊液、腹膜液和淋巴液)中的體內蛋白水解。在一個實施方案中,生物活性蛋白的增加的體內穩(wěn)定性表現(xiàn)為所述生物活性蛋白的延長的血漿半衰期。具體而言,與缺少第二結構域的生物活性蛋白相比,生物活性蛋白的增加的體內穩(wěn)定性是包含所述第二結構域的所述生物活性蛋白的延長的血漿半衰期。測量生物活性蛋白的體內穩(wěn)定性的方法是本領域已知的。如下文所例示,利用Western印跡技術或酶連接免疫吸附測定(ELISA),可以在血漿中特異性地檢測生物活性蛋白。然而,本領域技術人員知曉,其它方法可以用于特異性地測定感興趣的蛋白的血漿半衰期。這些方法包括但不限于放射性標記的感興趣的蛋白的物理學檢測。放射性標記蛋白方法(例如通過放射性碘化)是本領域已知的。本文所用的術語"增加的體外穩(wěn)定性"涉及生物活性蛋白在體外環(huán)境中抵抗降解和/或聚集并保持其原始生物活性的能力。測量生物活性蛋白的生物活性的方法是本領域公知的。此外,提供了藥物綴合物,其包含本文所述和限定的無規(guī)卷曲多肽或多肽區(qū)段和小分子藥物,所述小分子藥物與所述無規(guī)卷曲多肽或多肽區(qū)段綴合。小分子的非限制性實例是地高辛配基、熒光素、多柔比星、卡里奇霉素、喜樹堿、煙曲霉素、地塞米松、格爾德霉素、紫杉醇、多西他賽、伊立替康、環(huán)孢霉素、丁丙諾啡、納曲酮、納洛酮、長春地辛、萬古霉素、利培酮、阿立哌唑、帕洛諾司瓊、格拉司瓊、阿糖胞苷、NX1838、亮丙瑞林、戈舍瑞林、布舍瑞林、奧曲肽、替度魯肽、西侖吉肽、阿巴瑞克、恩夫韋地、葛瑞林和衍生物、tubulysins、鉬衍生物、α 4整合素抑制劑、反義核酸、小干擾RNAJi RNA、類固醇、DNA或RNA適體、肽、肽模擬物。通常,本發(fā)明還涉及藥物構建體,所述藥物構建體包含本文所限定的無規(guī)卷曲多肽或多肽區(qū)段和特別是藥學上或醫(yī)學上有用的分子,例如小分子、肽或生物大分子,例如蛋白、核酸、碳水化合物、脂質囊泡等。在后文的示例性實驗部分(參見,例如實施例22)中,成功地制備了本發(fā)明的構建體/綴合物,在構建體中,“小化學分子”與本文公開的無規(guī)卷曲多肽綴合。因此,本發(fā)明的附圖
和相應的圖例中的實驗信息提供了說明性的示例,其中本文公開的藥物綴合物包含(i)生物合成的無規(guī)卷曲多肽或多肽區(qū)段,所述無規(guī)卷曲多肽或多肽區(qū)段包含僅由脯氨酸和丙氨酸氨基酸殘基組成的氨基酸序列,其中所述氨基酸序列由至少50個脯氨酸(Pro)和丙氨酸(Ala)氨基酸殘基組成,和(ii)小分子,作為說明,所述小分子選自地高辛配基和熒光素。應當注意到,這些不是僅有的理論實例。熒光素或熒光素衍生物常 用作診斷制劑,并且醫(yī)學熒光素溶液以商品名Fiuoeseite⑩、AK-FLUOR 或Fluress 銷售。這些化合物顯然等夠受益于本文提供的方式和方法。地高辛配基形成地高辛的類固醇部分,地高辛是公知的具有心臟活性功能的植物次生代謝產物,其還含有三個洋地黃毒糖。地高辛,以及在較小的程度上說,密切相關的化合物洋地黃毒苷,被廣泛用于治療室性快速型心律失常和充血性心力衰竭(Hauptman (1999) Circulation 99:1265-1270)。所有具有心臟活性的類固醇是位于細胞質膜中的Na+/K+-ATP酶的強力且高度特異性的抑制劑,因此發(fā)揮交感神經阻滯作用或正性肌力作用。在必要的變通下,上文關于無規(guī)卷曲多肽或其多肽區(qū)段給出的限定和解釋也適用于這樣的藥物綴合物,其包含無規(guī)卷曲多肽(或其多肽區(qū)段)和選自以下的藥物(a)包含具有或介導生物活性的氨基酸序列或是具有或介導生物活性的氨基酸序列的生物活性蛋白或多肽和(b)小分子藥物。本文所限定和提供的形成無規(guī)卷曲構象的氨基酸聚合物/無規(guī)卷曲多肽(或其區(qū)段)可以與小分子/小分子藥物綴合。由此,小分子/小分子藥物的血漿半衰期和/或可溶性可以增加,非特異性毒性可以降低,并且體內的目標細胞或結構暴露于活性藥物的時間延長可以實現(xiàn)藥效增強。無規(guī)卷曲多肽的N末端與活化的藥物衍生物的位點特異性綴合,例如N-羥基琥珀酸亞胺(NHS)酯衍生物(Hermanson (1996) Bioconjugate Techniques, Academic Press, SanDiego,CA),是可能的。通常,N末端氨基可以與多種官能團化學偶聯(lián),例如醛和酮(從而形成席夫堿,例如,利用硼氫化鈉或氰基硼氫化鈉可以將其還原為胺)或活化的碳酸衍生物(酸酐、氯化物、酯等,從而形成酰胺)或其它反應性化學物,例如異氰酸酯、異硫氰酸酯、磺?;然锏?。另外,可以首先用合適的保護基修飾氨基酸聚合物/多肽的N末端,例如乙酸基、BOC 基團或 FMOC 基團(Jakubke (1996)Peptide. Spektrum AkdemischerVerlag, Heidelberg, Germany)。此外,可以用焦谷氨?;Wo氨基末端,焦谷氨?;苄纬勺訮ro/Ala多肽或多肽區(qū)段之前的編碼的Gln氨基酸殘基。在例如利用常用試劑EDC (N-(3- 二甲基氨基丙基)-N’ -乙基碳化二亞胺)和NHS使C末端羧酸基團活化后,如果藥物攜帶例如自由氨基,則可以實現(xiàn)與受保護的無規(guī)卷曲多肽的C末端的位點特異性偶聯(lián)?;蛘?,可以用能提供馬來酰亞胺基團的可商購的連接試劑來修飾形成無規(guī)卷曲構象的氨基酸聚合物/無規(guī)卷曲多肽的N末端或C末端,從而允許與作為藥物分子的一部分的硫醇基化學偶聯(lián)。按照該方式,可容易地獲得均一的藥物綴合物。本領域公知的的類似技術(Hermanson(1996)同上)可用于將無規(guī)卷曲多肽與肽或甚至與蛋白藥物偶聯(lián)??梢匀菀椎刂苽鋽y帶Lys或Cys側鏈的這些肽或蛋白,這允許它們通過NHS酯或馬來酰亞胺活性基團與形成無規(guī)卷曲構象的氨基酸聚合物進行體外偶聯(lián)。通常,用包含無規(guī)卷曲多肽(或其區(qū)段)的融合蛋白可以制備相似的藥物綴合物。然而,如后文實施例和附圖所示,本發(fā)明還提供了本發(fā)明的創(chuàng)新綴合物中包含的無規(guī)卷曲多肽或無規(guī)卷曲多肽區(qū)段的制備方式。作為單一位點特異性綴合的可選方案,可以使無規(guī)卷曲多肽在N末端或C末端或 內部裝配適于化學修飾的額外的側鏈,例如,具有ε -氨基的賴氨酸殘基、具有硫醇基團的半胱氨酸殘基或甚至是非天然氨基酸,從而允許利用例如NHS酯或馬來酰亞胺活性基團實現(xiàn)多個小分子的綴合。除穩(wěn)定的綴合之外,可以使前藥與無規(guī)卷曲多肽暫時連接??梢詫⑦B接設計為能以可預見的方式在體內被切割,所述切割可以通過酶學機制或通過在生理PH下開始的緩慢水解,這與例如低可溶性抗腫瘤劑喜樹堿與PEG聚合物綴合是相似的,從而實現(xiàn)生物分布增加、毒性減小、功效和腫瘤累積增強(Conover (1998)Cancer ChemotherPharmacol,42:407-414)。其它前藥的實例是化療劑,例如多西他賽(Liu(2008) J PharmSci. 97:3274-3290)、多柔比星(Veronese (2005)Bioconjugate Chem. 16:775-784)或紫杉醇(Greenwald(2001)J Control Release 74:159-171)。此外,小分子可以與融合蛋白偶聯(lián),所述融合蛋白包含與諸如抗體片段的靶向結構域基因融合的氨基酸聚合物/多肽,從而實現(xiàn)小分子藥物的特異性遞送。對于后一種情況,例如,如果靶向結構域是針對經歷內化的細胞表面受體,可以通過與細胞毒性小分子綴合容易地制備免疫毒素。按照上文,本發(fā)明因此還涉及提供本文公開的生物合成的無規(guī)卷曲多肽或多肽區(qū)段用于與其它所選化合物進行進一步的和其它的偶聯(lián),所述無規(guī)卷曲多肽或多肽區(qū)段包含僅由脯氨酸和丙氨酸氨基酸殘基組成的氨基酸序列。所述進一步的和其它的偶聯(lián)可以是和/或可以包含所述生物合成的無規(guī)卷曲多肽或生物合成的無規(guī)卷曲多肽區(qū)段與另一化合物的首先偶聯(lián)。在另一個實施方案中,本發(fā)明涉及編碼本文所述的無規(guī)卷曲多肽(或其區(qū)段)或生物活性蛋白的核酸分子。因此,所述核酸分子可以包含編碼具有生物活性的多肽的核酸序列和編碼無規(guī)卷曲多肽(或其區(qū)段)的核酸序列。本文所用的術語"核酸分子"意圖包括諸如DNA分子和RNA分子的核酸分子。所述核酸分子可以是單鏈的或雙鏈的,但優(yōu)選雙鏈DNA。優(yōu)選地,所述核酸分子可以被包含在載體中。因此,本發(fā)明還涉及編碼本文提供的綴合物(例如本文所限定的藥物綴合物)中包含的無規(guī)卷曲多肽或多肽區(qū)段的核酸分子,或編碼包含上文所限定的生物活性蛋白并且還包含生物合成的無規(guī)卷曲多肽或多肽區(qū)段的蛋白綴合物的核酸分子,所述無規(guī)卷曲多肽或多肽區(qū)段包含僅由脯氨酸和丙氨酸氨基酸殘基組成的氨基酸序列,其中所述氨基酸序列由至少50個脯氨酸(Pro)和丙氨酸(Ala)氨基酸殘基組成。在一個實施方案中,提供了編碼綴合物(例如,上文所限定的藥物綴合物或食品綴合物)的核酸分子,所述核酸分子包含(i)編碼翻譯的氨基酸和/或前導序列的核酸序列;(ii)編碼生物合成的無規(guī)卷曲多肽或多肽區(qū)段的核酸序列,所述無規(guī)卷曲多肽或多肽區(qū)段包含僅由脯氨酸和丙氨酸氨基酸殘基組成的氨基酸序列,其中所述氨基酸序列由至少50個脯氨酸(Pro)和丙氨酸(Ala)氨基酸殘基組成;(iii)編碼包含具有或介導生物活性的氨基酸序列或是具有或介導生物活性的氨基酸序列的所述生物活性蛋白或多肽或感興趣的蛋白的核酸序列,所述感興趣的蛋白例如是可用于諸如食品工業(yè)的其它工業(yè)領域的蛋白;和·
(iv)提供翻譯終止密碼子或是翻譯終止密碼子的核酸序列。例如,⑴中的上述“翻譯的氨基酸和/或前導序列”可以是起始“M”,即,來自相應的起始密碼子的蛋氨酸,其還可以包含mRNA的非翻譯序列,例如5’序列直至起始密碼子,非翻譯序列例如包含核糖體結合位點。然而,這樣的序列還可以包含典型前導和/或信號序列,例如用于使表達的蛋白分泌到周質或培養(yǎng)基中。原核信號肽例如是OmpA、MalE、PhoA、DsbA、pelB、Afa、npr、STII。真核信號肽例如是蜂素信號序列、酸性糖蛋白gp67信號序列、小鼠IgM信號序列、hGH信號序列。包含具有或介導生物活性的氨基酸序列或是具有或介導生物活性的氨基酸序列的生物活性蛋白或多肽以及其它感興趣的蛋白(例如可用于其它工業(yè)領域的蛋白)已在上文提供。在必要的變通下,所述實施方案適用于上文所述的核酸分子(部分/區(qū)段(iii))。可用于本文提供的核酸分子中的翻譯終止密碼子是本領域公知的,例如是密碼子UAA、UAG 或 UGA。在上文提供的核酸分子的一個實施方案中,上述核酸分子部分/區(qū)段(ii)和
(iii)在編碼綴合物(例如藥物綴合物或食品綴合物)的所述核酸分子中的位置互換。這樣的核酸分子會包含下述順序的部分/區(qū)段(i)編碼翻譯的氨基酸和/或前導序列的核酸序列;(ii)編碼包含具有或介導生物活性的氨基酸序列或是具有或介導生物活性的氨基酸序列的生物活性蛋白或多肽或感興趣的蛋白的核酸序列,所述感興趣的蛋白例如是可用于諸如食品工業(yè)的其它工業(yè)領域的蛋白;(iii)編碼生物合成的無規(guī)卷曲多肽或多肽區(qū)段的核酸序列,所述無規(guī)卷曲多肽或多肽區(qū)段包含僅由脯氨酸和丙氨酸氨基酸殘基組成的氨基酸序列,其中所述氨基酸序列由至少50個脯氨酸(Pro)和丙氨酸(Ala)氨基酸殘基組成;以及(iv)代表翻譯終止密碼子或是翻譯終止密碼子的核酸序列。上文提供的核酸分子還可以任選地包含在部分/區(qū)段(i)和(ii)之間和/或在部分/區(qū)段(ii)和(iii)之間包含蛋白酶和/或化學切割位點和/或識別位點。這些化學切割位點是本領域公知的,并且包括例如特定的個體氨基酸序(參見,例如Lottspeichand Engels (Hrsg.) (2006)Bioanalytik. 2. Auflage. Spektrum Akademischer Verlag, Elsevier, Munchen, Germany)。例如,溴化氰或氯化氰切割Met殘基后的肽鍵;輕基野芝麻堿切割天冬酰胺-甘氨酰鍵;甲酸切割Asp-PiO ;2-(2’ -硝基苯基亞氧硫基)-3-甲基-3-溴吲哚啉,2-氧碘苯甲酸或N-氯琥珀酰亞胺切割Trp之后的鍵;2_硝基-5-硫代氰酰苯甲酸切割Cys之后的鍵。本文還考慮到并且也可能的是,Pro/Ala多肽或多肽區(qū)段之前的殘基可以通過定點誘變被取代為Met,并且然后所得的融合蛋白可以被BrCN切割。相似地,可通過定點誘變將包含切割位點的其它氨基酸序列引入重組融合蛋白或其編碼核酸。其它有用的蛋白酶識別/切割位點是本領域已知的。這些包括但不限于胰蛋白酶、糜蛋白酶、腸激酶、煙草蝕紋病毒(TEV)蛋白酶、PreScission蛋白酶、HRV 3C蛋白酶、SUMO蛋白酶、分揀酶A、顆粒酶B、弗林蛋白酶、凝血酶、因子Xa或自我可切割的內含肽。因子Xa在氨基酸序列IIeGluGlyArg的C末端水解肽鍵,氨基酸序列IIeGluGlyArg可以被插在N末端融合伴侶和Pro/Ala多肽或多肽區(qū)段之間。實現(xiàn)蛋白水解切割的特別簡單的方法是,通過在Pro/Ala多肽或多肽區(qū)段的N末端插入或取代Lys或Arg側鏈,然后用胰蛋白酶進行消化,胰蛋白酶不會切割Pro/Ala多肽或多肽區(qū)段的內部,只要在內部避免Lys或Arg側鏈。示例性的識別位點可以是,但不限于,D-D-D-D-K (腸激酶)、ENLYFQ (G/S) (TEV蛋白酶),I-(E/D) -G-R(因子 Xa)、L-E-V-L-F-Q-G-P (HRV 3C)、R-X-(K/R) -R(弗林蛋白酶)、LPXTG (分揀酶 A)、L-V-P-R-G (凝血酶)或 I-E-X-D-X-G (顆粒酶 B)。
·
從上文的公開內容可以明顯看出,本發(fā)明提供了重組產生的生物合成的無規(guī)卷曲多肽和多肽區(qū)段,其可以與所選的分子綴合,所述所選的分子例如是有用的蛋白、藥學活性多肽或小分子、診斷上有用的多肽或小分子,或者其它工業(yè)領域(例如食品或造紙工業(yè)或采油)的其它有用的蛋白或小分子。因此,本發(fā)明還提供了編碼生物合成的無規(guī)卷曲多肽或多肽區(qū)段的核酸,所述無規(guī)卷曲多肽或多肽區(qū)段包含僅由脯氨酸和丙氨酸氨基酸殘基組成的氨基酸序列,其中所述氨基酸序列由至少50個脯氨酸(Pro)和丙氨酸(Ala)氨基酸殘基組成,所述核酸分子包含(i)編碼翻譯的氨基酸和/或前導序列的核酸序列;(ii)編碼所述生物合成的無規(guī)卷曲多肽或多肽區(qū)段的核酸序列,所述無規(guī)卷曲多肽或多肽區(qū)段包含僅由脯氨酸和丙氨酸氨基酸殘基組成的氨基酸序列;和(iii)代表翻譯終止密碼子或是翻譯終止密碼子的核酸序列。上述核酸分子可以任選地在(i)和(ii)之間包含蛋白酶和/或化學切割位點和/或識別位點)。此外,對于上述核酸分子,上文關于前兩種核酸分子(即,蛋白酶和/或化學切割位點和/或識別)提供的實施方案在必要的變通下適用于此處??捎糜诒景l(fā)明的有用的和示例性的信號序列包括,但不限于,原核序列,例如OmpA> MalE、PhoA> DsbA、pelB、Afa、npr、STII,或真核序列,例如蜂素信號序列、酸性糖蛋白gp67信號序列、小鼠IgM信號序列、hGH信號序列具體而言,編碼本發(fā)明的生物合成的無規(guī)卷曲多肽或多肽區(qū)段的核酸分子可用于下文提供的以及后文實施例和附圖所示的方法,所述生物合成的無規(guī)卷曲多肽或多肽區(qū)段包含僅由脯氨酸和丙氨酸氨基酸殘基組成的氨基酸序列。這樣的表達的無規(guī)卷曲多肽或無規(guī)卷曲多肽區(qū)段可以從例如表達該無規(guī)卷曲多肽或無規(guī)卷曲多肽區(qū)段的宿主細胞分離。這類宿主細胞可以是例如用本文提供的載體轉染的細胞。因此,考慮到用本文所述的核酸分子或載體轉染細胞。在另一實施方案中,本發(fā)明涉及這樣的核酸分子,所述核酸分子在表達時能編碼本發(fā)明的無規(guī)卷曲多肽(或其區(qū)段)或生物活性蛋白。然而,在另一實施方案中,本發(fā)明涉及這樣的核酸分子,所述核酸分子在表達時能編碼本文公開的在水性溶液中或在生理條件下完全地或部分地形成/采取無規(guī)卷曲構象的多肽。所述核酸分子可以與本領域已知的合適的表達控制序列融合,從而確保多肽以及信號序列的合適的轉錄和翻譯,進而確保細胞分泌或靶向細胞器。這類載體還可以包含其它基因,例如允許所述載體在合適的宿主細胞中和在合適的條件下的選擇的標記基因。優(yōu)選地,本發(fā)明的核酸分子被包含在重組載體中,在所述重組載體中,編碼本文所述的生物活性蛋白的核酸分子與允許在原核或真核細胞中表達的表達控制序列可操作地連接。所述核酸分子的表達包括核酸分子轉錄為可翻譯的mRNA。允許原在核宿主細胞中表達的調節(jié)元件包括,例如,大腸桿菌中的λ PL、lac、trp、tac、ara、phoA、tet或T7啟動子。確保在真核細胞、優(yōu)選哺乳動物細胞或酵母中表達的可能的調節(jié)元件是本領域技術人員公知的。它們通常包括確保啟動轉錄的調節(jié)序列以及任選的影響轉錄終止和轉錄物穩(wěn)定化的多聚腺苷酸(PolyA)信號。其它調節(jié)元件可以包括轉錄增強子以及翻譯增強子,和/或天然相關的啟動子區(qū)或異源啟動子區(qū)。允許在真核宿主細胞中表達的調節(jié)元件的實例是酵母中的AOXl或GALl啟動子或CMV、SV40、RSV(勞斯氏肉瘤病毒)啟動子、CMV增強子、SV40 增強子或哺乳動物和其它動物細胞中的球蛋白內含子。除了負責啟動轉錄的元件,所述調節(jié)元件還可以包括編碼區(qū)下游的轉錄終止信號,例如SV40多聚腺苷酸位點或tk多聚腺苷酸位點??墒褂帽绢I域技術人員公知的方法來構建重組載體(參見,例如,Sambrook(1989) , Molecular Cloning:A Laboratory Manual, Cold Spring HarborLaboratory NY 和 Ausubel(1989), Current Protocols in Molecular Biology, GreenPublishing Associates and Wiley Interscience, NY 中描述的技術)。在本發(fā)明中,合適的表達載體是本領域已知的,例如Okayama-Berg cDNA表達載體pcDV I (Pharmacia)、pCDM8、pRc/CMV、pcDNAl、pcDNA3、pPICZa A(Invitrogen)或 pSPORT UGIBCO BRL)。此外,根據(jù)所用的表達體系,可以將能將多肽引導至細胞區(qū)室或將多肽分泌到培養(yǎng)基中的前導序列添加到本發(fā)明的核酸分子的編碼序列。本發(fā)明還涉及常規(guī)用于基因工程的載體,特別是質粒、粘粒、病毒和噬菌體,所述載體包含編碼本發(fā)明的無規(guī)卷曲多肽(或其區(qū)段)或生物活性蛋白的核酸分子。優(yōu)選地,所述載體是表達載體和/或基因轉移或靶向載體。來自諸如逆轉錄病毒、痘病毒、腺相關病毒、皰疹病毒或牛乳頭狀瘤病毒等病毒的表達載體可以用于將本發(fā)明的多核苷酸或載體遞送到靶細胞群中。通過公知的方法可以將含有本發(fā)明的核酸分子的載體轉染到宿主細胞中,所述方法根據(jù)細胞類型會有不同。因此,本發(fā)明還涉及包含所述核酸分子或所述載體的細胞。這類方法,例如,包括Sambrook (1989),同上和Ausubel (1989),同上,中描述的技術。因此,氯化鈣轉染或電穿孔常用于原核細胞,而磷酸鈣處理或電穿孔可以用于其它細胞宿主(Sambrook (1989),同上)。作為另一可選方案,可以將本發(fā)明的核酸分子和載體包裝在脂質體中,用于遞送至靶細胞。存在于宿主細胞中的本發(fā)明的核酸分子或載體可以被整合到宿主細胞的基因組中或可以保持在染色體外。因此,本發(fā)明還涉及包含本發(fā)明的核酸分子和/或載體的宿主細胞。用于表達多肽的宿主細胞是本領域公知的,并包括原核細胞以及真核細胞,例如大腸桿菌細胞、酵母細胞、無脊椎動物細胞、CHO細胞、CHO-Kl細胞、HEK 293細胞、Hela細胞、C0S-1猴細胞、黑素瘤細胞(例如Bowes細胞)、小鼠L-929細胞、來自瑞士、Balb-c或NIH小鼠的3T3細胞系、BHK或HaK倉鼠細胞系等。另一方面,本發(fā)明包含制備本發(fā)明的綴合物以及本文提供的生物合成的無規(guī)卷曲多肽(或其區(qū)段)或生物活性蛋白的方法,并包括培養(yǎng)本發(fā)明的(宿主)細胞以及從本文所述的培養(yǎng)物分離所述無規(guī)卷曲多肽(或其區(qū)段)或綴合物或生物活性蛋白。通常,可以通過重組DNA技術產生本發(fā)明的無規(guī)卷曲多肽(或其區(qū)段)、包含無規(guī)卷曲結構域的綴合物或生物活性蛋白,例如,通過培養(yǎng)包含編碼本發(fā)明的生物活性蛋白或無規(guī)卷曲多肽(或其區(qū)段)的所述核酸分子或載體的細胞,以及從培養(yǎng)物分離所述蛋白/多肽??梢栽谌魏魏线m的細胞培養(yǎng)體系中產生本發(fā)明的生物活性蛋白或無規(guī)卷曲多肽(或其區(qū)段),包括原核細胞,例如大腸桿菌BL21、KS272或JM83,或真核細胞,例如巴斯德畢赤酵母、酵母株X-33或CHO細胞。本領域已知的其它合適的細胞系可獲自細胞系保藏單位,例如美國典型培養(yǎng)物保藏中心(ATCC)。
術語“原核”意圖包括細菌細胞,而術語〃真核〃意圖包括酵母、高等植物、昆蟲和哺乳動物細胞。可以使轉化的宿主在發(fā)酵罐中生長并按照本領域已知的技術進行培養(yǎng),從而實現(xiàn)最佳的細胞生長。在另一實施方案中,本發(fā)明涉及制備上文所述的無規(guī)卷曲多肽(或其區(qū)段)或生物活性蛋白的方法,包括在適于生物活性蛋白或無規(guī)卷曲多肽(或其區(qū)段)的表達的條件下培養(yǎng)本發(fā)明的細胞,以及從細胞或培養(yǎng)基分離所述蛋白/多肽。本發(fā)明的無規(guī)卷曲多肽(或其區(qū)段)本身優(yōu)選不包含任何化學反應基團,然而,也可能有一個N末端伯胺基團(或,對于脯氨酸為仲胺)和位于聚合物的C末端的一個羧酸基團。然而,對于本領域技術人員顯而易見的是,本文提供的生物合成的無規(guī)卷曲多肽/聚合物可以包含化學反應基團,例如,當所述無規(guī)卷曲多肽/聚合物是“融合蛋白”/”融合構建體”的一部分時。還如上文所述,可以按照本領域技術人員公知的方法,以數(shù)種方式通過轉化的細胞中的重組表達來制備生物合成的無規(guī)卷曲多肽(或其區(qū)段),例如(i)借助于N末端Met殘基/起始密碼子在細胞質中直接表達;(ii)通過N末端信號肽(例如 OmpA, PhoA (Montei Ihet (1993) Gene. 1993125:223-228)、蜂毒肽(Tessier (1991)Gene 98:177-183)、白介素 2 (Zhang(2005) J Gene Med 7:354365)、hGH(Pecceu (1991)Gene97(2) :253-258)等)分泌,然后是細胞內切割,從而得到成熟的N末端,例如Ala或Pro; (iii)表達為與另一可溶蛋白的融合蛋白,例如,麥芽糖結合蛋白位于N末端并具有散布的蛋白酶切割位點(Kapust and Waugh(2000)Protein Expr. Purif. 19:312-318),然后是體外或體內特異性蛋白酶切割,從而釋放具有成熟N末端(例如Ala或Pro)的氨基酸聚合物/多肽。另一合適的融合伴侶是SUMO蛋白,其可以被SUMO蛋白酶切割,正如實施例20和21所述。其它融合伴侶包括在不限于,谷胱甘肽-S-轉移酶、硫氧還蛋白、纖維素結合結構域、白蛋白結合結構域、熒光蛋白(例如GFP)、蛋白A、蛋白G、內含肽等(Malhotra(2009)Methods Enzymol. 463:239-258)。如上文所解釋的,所述的無規(guī)卷曲多肽(或多肽區(qū)段)/聚合物主要由丙氨酸和脯氨酸殘基組成,而O-糖基化或N-糖基化所需的絲氨酸、蘇氨酸或天冬酰胺優(yōu)選不存在。因此,產生多肽本身或產生包含無規(guī)卷曲多肽(或其多肽區(qū)段)的生物活性蛋白或通常產生包含無規(guī)卷曲多肽(或其多肽區(qū)段)的融合蛋白,令人意想不到地能夠產生單分散的產物,所述產物優(yōu)選在Pro-Ala序列中沒有翻譯后修飾。這對于真核細胞中的重組蛋白產生是特別有利的,所述真核細胞例如是常被選擇用于復合蛋白的生物合成的中國倉鼠卵巢細胞(CHO)或酵母。例如,酵母已被用于產生獲批準的治療蛋白,例如胰島素、粒細胞-巨噬細胞集落刺激因子、血小板衍生的生長因子或水蛭素(Gerngross (2004)Nat.Biotechnol. 22:1409-1414)。CHO細胞已被用于產生治療蛋白,例如凝血因子IX、干擾素β-la、替奈普酶(Chu(2001)Curr. Opin. Biotechnol. 12:180-187)或促性腺激素,其中糖組分可以正性地影響數(shù)方面,例如功能活性、折疊、二聚化、分泌以及受體相互作用、信號轉導和代謝清除(Walsh(2006)Nat. Biotechnol. 24:-1241-1252)。因此,本文還公開了本發(fā)明的構建體、無規(guī)卷曲多肽和綴合物在真核表達體系中的制備。利用本文提供的方式和方法,現(xiàn)已能夠制備和提供本文公開的綴合物和分子,所述綴合物和分子包含(i)生物合成的無規(guī)卷曲多肽或多肽區(qū)段,所述無規(guī)卷曲多肽或多肽區(qū)段包含僅由脯氨酸和丙氨酸氨基酸殘基組成的氨基酸序列和(ii)另一感興趣的分子,例如有用的蛋白、蛋白區(qū)段或小分子。因此,本發(fā)明還提供了制備或生產所述綴合物以及生物合成的無規(guī)卷曲多肽和/或分子或包含所述生物合成的無規(guī)卷曲多肽和/或分子的綴合 物的方法。因此,本發(fā)明還提供了制備和/或生產綴合物(例如藥物綴合物、食品綴合物、診斷綴合物等)中包含的無規(guī)卷曲多肽或無規(guī)卷曲多肽區(qū)段的方法。此外,提供了制備和/或生產包含無規(guī)卷曲多肽或無規(guī)卷曲多肽區(qū)段的生物活性蛋白或綴合物的方法。此外,提供了制備和/或生產多肽的方法,所述多肽包含具有或介導生物活性的氨基酸序列或是具有或介導生物活性的氨基酸序列并且還包含所述無規(guī)卷曲多肽或無規(guī)卷曲多肽區(qū)段。這些方法特別包括(作為一個步驟)培養(yǎng)上文提供的(宿主)細胞,和從培養(yǎng)物或所述細胞分離(作為另一個步驟)所述無規(guī)卷曲多肽或生物活性蛋白和/或所述生物活性蛋白和/或所述多肽綴合物。這種分離的無規(guī)卷曲、包含僅由脯氨酸和丙氨酸氨基酸殘基組成的氨基酸序列的生物合成的無規(guī)卷曲多肽或多肽區(qū)段以及分離的綴合物可以被進一步加工。例如,所述包含僅由脯氨酸和丙氨酸氨基酸殘基組成的氨基酸序列的生物合成的無規(guī)卷曲多肽或多肽區(qū)段可以與感興趣的分子化學連接或偶聯(lián),如后文實施例所示。此外并作為備選方案,感興趣的分子可以例如通過轉谷氨酰胺酶(Besheer (2009) J Pharm Sci. 98:4420-8)或其它酶(Subul (2009)0rg. Biomol. Chem. 7:3361-3371)與所述包含由脯氨酸和丙氨酸氨基酸殘基組成的氨基酸序列的生物合成的無規(guī)卷曲多肽或多肽區(qū)段酶學綴合。無規(guī)卷曲多肽(或其區(qū)段)和/或包含無規(guī)卷曲多肽(或其區(qū)段)和感興趣的蛋白(例如,生物活性蛋白或治療活性蛋白,或可用于例如診斷方法中的蛋白)的蛋白綴合物可以(特別是)從生長介質、細胞裂解物、周質或細胞膜組分分離。(此外,本發(fā)明不限于可用于醫(yī)學或藥物領域的(蛋白)綴合物。本文提供的方式和方法還可用于其它工業(yè)領域,例如但不限于食品和飲料工業(yè)、營養(yǎng)品工業(yè)、造紙工業(yè)、生物制劑工業(yè)、研究工具和試劑工業(yè)、需要利用酶的工業(yè)、美容用品工業(yè)、石油加工和采油等)??梢酝ㄟ^任何常規(guī)方式進行本發(fā)明的表達的多肽的分離和純化(Scopes (1982) " Protein Purification^, Springer, NewYork,NY),包括硫酸銨沉淀、親和純化、柱層析、凝膠電泳等,并且可以涉及利用針對例如與本發(fā)明的生物活性蛋白融合的標簽的單克隆或多克隆抗體。例如,可以利用鏈霉親和素親和層析、通過 Strep 標簽 II 純化蛋白(Skerra(2000)MethodsEnzymol. 326:271-304),如后文實施例所述。具有至少約90至95%同質性(在蛋白水平上)的基本純的多肽是優(yōu)選的,并且98至99%或更高的同質性是最優(yōu)選的,特別是對于藥物用途/應用。根據(jù)制備過程中所用的宿主細胞/生物體,本發(fā)明的多肽可以是糖基化的或可以是非糖基化的。本發(fā)明還涉及本發(fā)明的生物活性蛋白、無規(guī)卷曲多肽(或其區(qū)段)或綴合物(例如藥物綴合物)、本發(fā)明的核酸分子、本發(fā)明的載體或本發(fā)明的(宿主)細胞在制備藥物中的用途,其中與不包含或不連接于生物合成的無規(guī)卷曲多肽或多肽區(qū)段的對照分子相比,所述生物活性蛋白或藥物(或任何其它感興趣的小分子或蛋白)具有增加的體內和/或體外穩(wěn)定性,所述生物合成的無規(guī)卷曲多肽或多肽區(qū)段包含僅由脯氨酸和丙氨酸氨基酸殘基組成的氨基酸序列,其中所述氨基酸序列由至少50個脯氨酸(Pro)和丙氨酸(Ala)氨基酸殘基組成。在另一實施方案中,本發(fā)明涉及治療能受益于所述生物活性蛋白或藥物的提高的穩(wěn)定性的疾病和/或病癥的方法,所述方法包括將本文所述的生物活性蛋白或藥物綴合物給予需要這種治療的哺乳動物。根據(jù)本發(fā)明蛋白或藥物綴合物的生物活性,本領域技術人 員能容易地確定利用本發(fā)明的具體生物活性蛋白或藥物綴合物能治療哪種疾病/病癥。一些非限制性實例提供在下表中
生物話性蛋白待治療的病癥/疾病(或其生物活性組分/片段)或藥物
粒細胞集落刺激因子癌癥和/或化療相關的嗜中性白血球減少癥人生長激素_生長激素缺陷相關的低血糖癥和/或生長不足
千擾素O_癌癥、病毒感染、丙型肝炎_
千擾素β__自身免疫疾病,多發(fā)性硬化_
千擾素γ_病毒感染_
胂瘤壞死因子_癌癥_
白介素-20_銀屑病_
α-半乳糖苷峰A_法布瑞氏癥_
fl肉抑制素拮抗劑肌肉減少癥_
胃抑制多肽_O型糖尿病_
α-l抗胰蛋白酶錄替換療法、嚢性纖維化,慢性阻塞性肺病、_急性呼吸綜合征、嚴重哮嗔_
紅細胞生成素_貧血癥_凝血因子VIII_I血友病_
權利要求
1.藥物綴合物,包含 (i)生物合成的無規(guī)卷曲多肽或多肽區(qū)段,所述多肽或多肽區(qū)段包含僅由脯氨酸和丙氨酸氨基酸殘基組成的氨基酸序列,其中所述氨基酸序列由至少50個脯氨酸(Pro)和丙氨酸(Ala)氨基酸殘基組成,和 ( )藥物,所述藥物選自(a)包含具有或介導生物活性的氨基酸序列或是具有或介導生物活性的氨基酸序列的生物活性蛋白或多肽,和(b)小分子藥物。
2.如權利要求I所述的藥物綴合物,其中所述無規(guī)卷曲多肽或多肽區(qū)段包含由約50至約3000個氨基酸殘基組成的氨基酸序列。
3.如權利要求I或2所述的藥物綴合物,其中所述脯氨酸殘基構成大于約10%且小于約75%的所述氨基酸序列。
4.如權利要求1-3中任一項所述的藥物綴合物,其中所述無規(guī)卷曲多肽或多肽區(qū)段包含多個氨基酸重復,其中所述重復由脯氨酸和丙氨酸殘基組成,并且其中不多于6個連續(xù)氣基酸殘基是相同的。
5.如權利要求1-4中任一項所述的藥物綴合物,其中所述無規(guī)卷曲多肽或多肽區(qū)段包含選自以下的氨基酸序列AAPAAPAPAAPAAPAPAAPA(SEQ ID NO:I);AAPAAAPAPAAPAAPAPAAP(SEQ ID NO:2);AAAPAAAPAAAPAAAPAAAP(SEQ ID NO:3);AAPAAPAAPAAPAAPAAPAAPAAP(SEQ ID NO:4);APAAAPAPAAAPAPAAAPAPAAAP(SEQ ID NO:5);AAAPAAPAAPPAAAAPAAPAAPPA(SEQ ID NO:6);和APAPAPAPAPAPAPAPAPAP(SEQ ID NO:51) 或作為這些序列的整體或這些序列的一部分的這些序列的環(huán)狀排列形式或多聚體。
6.如權利要求1-5中任一項所述的藥物綴合物,其中所述具有生物活性的多肽、所述包含具有或介導生物活性的氨基酸序列或是具有或介導生物活性的氨基酸序列的生物活性蛋白或多肽選自結合蛋白、抗體片段、細胞因子、生長因子、激素或酶。
7.如權利要求6所述的藥物綴合物,其中所述具有生物活性的多肽是結合蛋白,并且其中所述結合分子選自抗體、Fab片段、F(ab’)2片段、CDR衍生的肽模擬物、單鏈可變片段(scFv)、結構域抗體、凝集素、免疫球蛋白結構域、纖連蛋白結構域、蛋白A結構域、SH3結構域、錨蛋白重復結構域和脂質運載蛋白。
8.如權利要求1-7中任一項所述的藥物綴合物,其中所述生物活性蛋白選自粒細胞集落刺激因子、人生長激素、α-干擾素、β-干擾素、Y-干擾素、腫瘤壞死因子、紅細胞生成素、凝血因子VIII、gpl20/gpl60、可溶性腫瘤壞死因子I和II受體、瑞替普酶、艾塞那肽-4、阿那白滯素、白介素-2、中性粒細胞明膠酶相關脂質運載蛋白、卵泡刺激素、葡糖腦苷脂酶、胸腺素α I、胰高血糖素、生長激素抑制素、腺苷脫氨酶、白介素11、凝血因子Vila、凝血因子IX、hematide、λ -干擾素、瘦素、白介素-22受體α亞基(IL_22ra)、白介素-22、透明質酸酶、成纖維細胞生長因子18、成纖維細胞生長因子21、胰高血糖素樣肽I、骨保護素、IL-18結合蛋白、生長激素釋放因子、可溶性TACI受體、血小板反應蛋白-I、可溶性VEGF受體Flt-I和IL-4突變蛋白。
9.如權利要求1-8中任一項所述的藥物綴合物,其中所述生物合成的無規(guī)卷曲多肽或多肽介導所述藥物綴合物的增加的體內和/或體外穩(wěn)定性。
10.如權利要求9所述的藥物綴合物,其中所述增加的體內穩(wěn)定性是與缺少所述無規(guī)卷曲多肽或多肽區(qū)段的對照多肽或對照綴合物的穩(wěn)定性相比,所述藥物綴合物的延長的血漿半衰期,所述藥物綴合物包含所述生物合成的無規(guī)卷曲多肽或多肽區(qū)段,所述多肽或多肽區(qū)段包含僅由脯氨酸和丙氨酸氨基酸殘基組成的氨基酸序列,其中所述氨基酸序列由至少50個脯氨酸(Pro)和丙氨酸(Ala)氨基酸殘基組成。
11.如權利要求ι- ο中任一項所述的藥物綴合物,其中所述小分子選自地高辛配基、熒光素、多柔比星、卡里奇霉素、喜樹堿、煙曲霉素、地塞米松、格爾德霉素、紫杉醇、多西他賽、伊立替康、環(huán)孢霉素、丁丙諾啡、納曲酮、納洛酮、長春地辛、萬古霉素、利培酮、阿立哌唑、帕洛諾司瓊、格拉司瓊、阿糖孢苷NX1838、亮丙瑞林、戈舍瑞林、布舍瑞林、奧曲肽、替度魯肽、西侖吉肽、阿巴瑞克、恩夫韋地、葛瑞林、α 4整合素抑制劑、反義核酸、小干擾RNA、微RNA、類固醇、DNA或RNA適體和肽和/或肽模擬物。
12.組合物,包含權利要求1-11中任一項所述的藥物綴合物。
13.如權利要求12所述組合物,其是藥物組合物或診斷組合物,所述藥物組合物任選地還包含藥學可接受的載體,所述診斷組合物任選地還包含診斷組合物中可接受的載體。
14.編碼權利要求1-11中任一項所述的藥物綴合物中所包含的無規(guī)卷曲多肽或多肽區(qū)段的核酸分子,或編碼蛋白綴合物的核酸分子,所述蛋白綴合物包含權利要求6-8中任一項所述的生物活性蛋白并包含生物合成的無規(guī)卷曲多肽或多肽區(qū)段,所述多肽或多肽區(qū)段包含僅由脯氨酸和丙氨酸氨基酸殘基組成的氨基酸序列,其中所述氨基酸序列由至少50個脯氨酸(Pro)和丙氨酸(Ala)氨基酸殘基組成。
15.編碼權利要求1-10中任一項所述的藥物綴合物的核酸分子,所述核酸分子包含 (i)編碼翻譯的氨基酸和/或前導序列的核酸序列; ( )編碼生物合成的無規(guī)卷曲多肽或多肽區(qū)段的核酸序列,所述多肽或多肽區(qū)段包含僅由脯氨酸和丙氨酸氨基酸殘基組成的氨基酸序列,其中所述氨基酸序列由至少50個脯氨酸(Pro)和丙氨酸(Ala)氨基酸殘基組成; (iii)編碼包含具有或介導生物和/或治療活性的氨基酸序列或是具有或介導生物和/或治療活性的氨基酸序列的生物活性蛋白或多肽的核酸序列;和 (iv)代表翻譯終止密碼子或是翻譯終止密碼子的核酸序列。
16.如權利要求15所述的核酸分子,其中(ii)和(iii)中所述的所述核酸分子部分或區(qū)段在所述編碼藥物綴合物的核酸分子上的位置互換。
17.如權利要求15或16所述的核酸分子,任選地在(i)和(ii)所述的部分或區(qū)段之間和/或(ii)和(iii)所述的部分或區(qū)段之間包含蛋白酶和/或化學切割位點和/或識別位點。
18.編碼生物合成的無規(guī)卷曲多肽或多肽區(qū)段的核酸,所述多肽或多肽區(qū)段包含僅由脯氨酸和丙氨酸氨基酸殘基組成的氨基酸序列,其中所述氨基酸序列由至少50個脯氨酸(Pro)和丙氨酸(Ala)氨基酸殘基組成,所述核酸分子包含 (i)編碼翻譯的氨基酸和/或前導序列的核酸序列; ( )編碼所述生物合成的無規(guī)卷曲多肽或多肽區(qū)段的核酸序列,所述多肽或多肽區(qū)段包含僅由脯氨酸和丙氨酸氨基酸殘基組成的氨基酸序列;和 (iii)代表翻譯終止密碼子或是翻譯終止密碼子的核酸序列。
19.如權利要求18所述的核酸分子,任選地在⑴和(ii)之間包含蛋白酶和/或化學切割位點和/或識別。
20.載體,包含權利要求14-19中任一項所述的核酸。
21.宿主細胞,包含權利要求14-19中任一項所述的核酸或權利要求20所述的載體。
22.如權利要求21所述的宿主細胞,其中所述宿主細胞是真核宿主細胞。
23.如權利要求22所述的宿主細胞,其中所述真核宿主細胞是真菌或動物細胞。
24.制備權利要求1-11中任一項所述的藥物綴合物中包含的無規(guī)卷曲多肽或無規(guī)卷曲多肽區(qū)段、制備包含所述無規(guī)卷曲多肽或所述無規(guī)卷曲多肽區(qū)段的生物活性蛋白或藥物或食品綴合物和/或制備權利要求1-8中任一項所述的包含具有或介導生物活性的氨基酸序列或是具有或介導生物活性的氨基酸序列并且還包含所述無規(guī)卷曲多肽或無規(guī)卷曲多肽區(qū)段的多肽的方法, 所述方法包括培養(yǎng)權利要求21-23中任一項所述的細胞,并從培養(yǎng)物或所述細胞分離所述無規(guī)卷曲多肽或生物活性蛋白和/或所述生物活性蛋白或所述多肽。
25.權利要求1-11中任一項所述的藥物綴合物、權利要求12或13所述的組合物、權利要求14-19中任一項所述的核酸、權利要求20所述的載體、權利要求21-23中任一項所述的細胞或通過權利要求24所述的方法制備的包含所述無規(guī)卷曲多肽或無規(guī)卷曲多肽區(qū)段的生物活性蛋白或多肽,其用于治療激素缺陷相關病癥、自身免疫疾病、增殖性病癥、癌癥、貧血癥、新生血管性疾病、感染性/炎癥性疾病、變應性病癥、血栓形成、心肌梗塞、視網(wǎng)膜變性、糖尿病、不孕癥、高球氏癥、慢性乙型肝炎、丙型肝炎、低血糖癥、肢端肥大癥、腺苷脫氨酶缺陷、血小板減少癥、血友病、貧血癥、肥胖癥、阿爾茨海默病、脂肪代謝障礙、銀屑病、轉移性黑素瘤、骨關節(jié)炎、血脂異常、風濕性關節(jié)炎、系統(tǒng)性紅斑狼瘡、多發(fā)性硬化、哮喘、骨質疏松癥和再灌注損傷或其它腎病。
26.權利要求1-11中任一項所述的藥物綴合物、權利要求12或13所述的組合物、權利要求14-19中任一項所述的核酸、權利要求20所述的載體、權利要求21-24中任一項所述的細胞,其用作藥物,所述藥物具有所述無規(guī)卷曲多肽或多肽區(qū)段、生物活性蛋白或藥物綴合物的增加的體內和/或體外穩(wěn)定性。
27.權利要求1-5中任一項所述的無規(guī)卷曲多肽或無規(guī)卷曲多肽區(qū)段或權利要求14-19中任一項所述的核酸分子或其部分所編碼的無規(guī)卷曲多肽或無規(guī)卷曲多肽區(qū)段在美容用品、美容治療、營養(yǎng)學或食品技術或造紙工業(yè)中的用途。
28.制備權利要求1-11中任一項所述的綴合物、美容用品、用于美容治療中的化合物、食品或飲料或工業(yè)中的感興趣的綴合物的方法, 所述方法包括培養(yǎng)權利要求21-23中任一項所述的細胞,以及從培養(yǎng)物或所述細胞分離所述無規(guī)卷曲多肽、所述生物活性蛋白和/或包含具有或介導生物活性或感興趣的活性的氨基酸序列或是具有或介導生物活性或感興趣的活性的氨基酸序列、并且還包含所述無規(guī)卷曲多肽或無規(guī)卷曲多肽區(qū)段的所述生物活性蛋白或所述多肽。
29.如權利要求28所述的方法,其中所述所述無規(guī)卷曲多肽、所述生物活性蛋白和/或包含具有或介導生物活性或感興趣的活性的氨基酸序列或是具有或介導生物活性或感興趣的活性的氨基酸序列的、并且還包含所述無規(guī)卷曲多肽或無規(guī)卷曲多肽區(qū)段的所述生物活性蛋白或所述多肽分離自所述(宿主)細胞的生長介質或培養(yǎng)基、細胞裂解物、細胞膜組分、周質。
30.如權利要求28或29所述的方法,其中所述無規(guī)卷曲多肽與感興趣的分子連接和/或偶聯(lián)。
31.如權利要求30所述的方法,其中所述連接或所述偶聯(lián)是化學連接或偶聯(lián)。
全文摘要
本發(fā)明涉及生物合成的無規(guī)卷曲多肽(random coil polypeptide)或生物合成的無規(guī)卷曲多肽區(qū)段或生物合成的綴合物,其中所述生物合成的無規(guī)卷曲多肽、所述生物合成的無規(guī)卷曲多肽區(qū)段或所述生物合成的綴合物包含僅由脯氨酸和丙氨酸氨基酸殘基組成的氨基酸序列,其中所述氨基酸序列由至少約50個脯氨酸(Pro)和丙氨酸(Ala)氨基酸殘基組成。所述至少約50個脯氨酸(Pro)和丙氨酸(Ala)氨基酸殘基可以是異源多肽或異源多肽構建體的組成部分。還描述了這些生物合成的無規(guī)卷曲多肽或多肽區(qū)段或所述綴合物的用途和使用方法。特別地,所述用途可以包括醫(yī)藥用途,診斷用途或食品工業(yè)用途以及其它工業(yè)應用中的用途,例如造紙工業(yè)、采油等。具體而言,提供了藥物綴合物,其包含(i)生物合成的無規(guī)卷曲多肽或多肽區(qū)段,所述多肽或多肽區(qū)段包含僅由脯氨酸和丙氨酸氨基酸殘基組成的氨基酸序列,其中所述氨基酸序列由至少50個脯氨酸(Pro)和丙氨酸(Ala)氨基酸殘基組成,和(ii)藥物,所述藥物選自(a)包含具有或介導生物活性的氨基酸序列或是具有或介導生物活性的氨基酸序列的生物活性蛋白或多肽,和(b)小分子藥物。此外,公開了編碼所述生物合成的無規(guī)卷曲多肽或多肽區(qū)段和/或所述生物活性異源蛋白的核酸分子,以及包含所述核酸分子的載體和細胞。此外,本發(fā)明提供包含本發(fā)明化合物的組合物,以及本發(fā)明的無規(guī)卷曲多肽或多肽區(qū)段、生物活性蛋白、藥物綴合物或核酸分子、載體和細胞的具體用途。還提供了產生和/或獲得本發(fā)明生物合成的無規(guī)卷曲多肽或多肽區(qū)段的方法,以及產生和/或獲得本發(fā)明的生物活性異源蛋白和/或多肽構建體或綴合物(例如藥物綴合物)的方法。
文檔編號C07K7/00GK102883734SQ201180022849
公開日2013年1月16日 申請日期2011年5月20日 優(yōu)先權日2010年5月21日
發(fā)明者阿恩·斯科拉, 尤里·賓德爾, 馬丁·斯拉珀斯其 申請人:Xl-蛋白有限責任公司, 慕尼黑科技大學