文中提供的不同的SEQIDNO限定SPl的一個(gè)單體的氨基酸序列或編 碼SPl的一個(gè)單體的核苷酸序列。
[0062] 在一些實(shí)施方案中,SPl是野生型多肽(其單體在例如[14]中作為SEQIDN0:4 公開;本文中稱為SEQIDNO: 1)或例如,在文獻(xiàn)[11-14]的任何一個(gè)中公開的其任何片段、 肽、變體、類似物、同源物和衍生物,每個(gè)通過引用并入本文)。在一些實(shí)施方案中,SPl多肽 是野生型多肽(其單體在例如[14]中作為SEQIDN0:4公開;本文中稱為SEQIDNO: 1) 或其任何衍生物(例如,在文獻(xiàn)[11-14]的任何一個(gè)中公開的,每個(gè)通過引用并入本文)。
[0063] 應(yīng)該理解,在某些實(shí)施方案中,SPl蛋白是指如由SEQIDNO:1表示的SPl多肽。如 貫穿本文所指出的,這是指SPl的一個(gè)單體的序列。具體地,SPl蛋白包含如標(biāo)示為GenBank 登錄號(hào)AJ276517. 1的108個(gè)氨基酸殘基的一個(gè)單體的氨基酸序列。
[0064] 在某些實(shí)施方案中,SPl多肽包含如由SEQIDNO: 1表示的氨基酸序列MATRTPKL VKHTLLTRFKDEITREQIDNYINDYTNLLDLIPSMKSFNWGTDLGAELNRGYTHAFESTFESKSGLQEYLDSAALAA FAEGFLPTLSQRLVIDYFLY。
[0065] 在一些實(shí)施方案中,SPl多肽是由在NCBI中以GenBank:AJ276517. 1儲(chǔ)存的多核 苷酸(SEQIDNO:8)編碼的多肽。
[0066] 在一些實(shí)施方案中,SPl多肽是野生型SPl多肽(SEQIDNO: 1)。
[0067] 如本領(lǐng)域技術(shù)人員可理解,多肽的遺傳修飾是常見的實(shí)踐,并包括編碼各自多肽 的多核苷酸中的突變,使得核苷酸序列中的選擇性突變將導(dǎo)致期望的氨基酸突變。本文所 指的SPl多肽的任何突變是基于野生型多肽的突變。多肽中的突變可包括至少一個(gè)氨基酸 的取代(突變)、至少一個(gè)氨基酸的缺失或至少一個(gè)氨基酸的添加。因此,根據(jù)本發(fā)明使用 的多肽可選自野生型SPl多肽、半胱氨酸突變的/取代的/添加的SPl多肽,組氨酸突變的 /取代的/添加的SPl多肽和甲硫氨酸突變的/取代的/添加的SPl多肽。
[0068] 本發(fā)明的某些實(shí)施方案包含SPl多肽及其任何片段、肽、類似物、同源物和衍生 物。應(yīng)當(dāng)理解,這樣的肽(多肽)或氨基酸序列優(yōu)選地是分離的和純化的分子,如本文所定 義。術(shù)語(yǔ)"純化的"或"分離的"是指從它們的天然環(huán)境中移出、分離或分開的分子,諸如氨 基酸序列或肽。因此"分離的肽"是純化的氨基酸序列。"基本上純化的"分子至少60%不 含、優(yōu)選至少75%不含、且更優(yōu)選至少90%不含與它們天然締合的其他組分。如本文所用, 術(shù)語(yǔ)"純化的"或"純化"還指從樣品中除去污染物。
[0069] 如本文所用的術(shù)語(yǔ)"多肽"是指通過肽鍵連接的氨基酸殘基。多肽序列通常從包 含游離氨基基團(tuán)的N-末端至包含游離羧基基團(tuán)的C-末端報(bào)告。
[0070] 更具體地,"氨基酸分子"、"氨基酸序列"或"肽序列"是以其中通過肽鍵連接的氨 基酸殘基位于肽和蛋白中的鏈的順序。序列通常從包含游離氨基基團(tuán)的N-末端至包含酰 胺的C-末端報(bào)告。如果它表示蛋白的一級(jí)結(jié)構(gòu),氨基酸序列通常稱為肽、蛋白序列,然而 人們必須分清術(shù)語(yǔ)"氨基酸序列"或"肽序列"和"蛋白"之間的差別,由于蛋白定義為折疊 成特定三維構(gòu)象的氨基酸序列并且其通常已經(jīng)歷了翻譯后修飾,諸如磷酸化、乙酰化、糖基 化、甘露糖基化、酰胺化、羧化、巰基鍵形成,切割等。
[0071] 如本文所用,氨基酸是指天然存在的和合成的氨基酸,以及其以類似于天然存在 的氨基酸的方式起作用的氨基酸類似物和氨基酸模擬物。天然存在的氨基酸是由遺傳密碼 編碼的那些,以及隨后被修飾的那些氨基酸,例如,羥脯氨酸、y-羧基谷氨酸、和0-磷酸絲 氨酸。"氨基酸類似物"是指具有與天然存在的氨基酸相同的基本化學(xué)結(jié)構(gòu)的化合物,即,與 氫、羧基基團(tuán)、氨基基團(tuán)、和R基團(tuán)結(jié)合的a-碳,例如,高絲氨酸、正亮氨酸、甲硫氨酸亞砜、 甲硫氨酸甲基锍。這樣的類似物具有修飾的R基團(tuán)或修飾的肽骨架,但保留了與天然存在 的氨基酸相同的基本化學(xué)結(jié)構(gòu)。"氨基酸模擬物"是指具有不同于氨基酸的一般化學(xué)結(jié)構(gòu)的 結(jié)構(gòu),但以類似于天然存在的氨基酸的方式起作用的化學(xué)化合物。氨基酸在本文中可通過 由IUPAC-IUB生物化學(xué)命名委員會(huì)推薦的它們的通常已知的三字母符號(hào),或通過單字母符 號(hào)提及。
[0072] 應(yīng)注意,除了本文包括的SPl衍生的片段或肽的任一種以外,本發(fā)明還包括SPl多 肽的任一種的任何衍生物、類似物、變體或同系物。術(shù)語(yǔ)"衍生物"用于定義具有對(duì)氨基酸 序列(多肽)的任何插入、缺失、取代和修飾的氨基酸序列(多肽)。在一些實(shí)施方案中,這 些不改變?cè)级嚯牡幕钚?。術(shù)語(yǔ)"衍生物"還指其同系物、變體和類似物,以及根據(jù)本發(fā)明 制備的多肽的共價(jià)修飾形式。
[0073] 在一些實(shí)施方案中,SPl多肽包含另外的組氨酸殘基(SEQIDN0:2)并由具有序 列SEQIDN0:9的多核苷酸編碼。更具體地,SPl多肽包含如SEQIDN0:2表示的氨基酸 序列MHHHHHHATRTPKLVKHTLLTRFKDEITREQIDNYINDYTNLLDLIPSMKSFNWGTDLGMESAELNRGYTHAF ESTFESKSGLQEYLDSAALAAFAEGFLPTLSQRLVIDYFLY。如此,本文描述的 6His-SPl衍生物對(duì)應(yīng)于 SEQIDNO:2。
[0074] 在另外的實(shí)施方案中,SPl多肽是野生型SPl的同源變體。同源變體可包含例如 野生型SPl的N-末端區(qū)中的氨基酸的缺失。
[0075] 在一些實(shí)施方案中,SPl多肽是具有N-末端區(qū)域中的氨基酸的缺失的多肽。具有 SEQIDNO:3的該變體SPl多肽由具有序列SEQIDNO: 10的多核苷酸編碼。
[0076] 在一些實(shí)施方案中,SPl多肽包含氨基酸至半胱氨酸的突變。這樣的多肽的非限制 性實(shí)例包括:SEQIDN0:4(由具有序列SEQIDN0:11的多核苷酸編碼);SEQIDN0:5(由 具有序列SEQIDNO: 12的多核苷酸編碼);SEQIDNO: 6 (由具有序列SEQIDNO: 13的多 核苷酸編碼);和SEQIDNO: 7 (由具有序列SEQIDNO: 14的多核苷酸編碼)。
[0077] 在一些其他實(shí)施方案中,SPl多肽包含如SEQIDNO:4表示的氨基酸序列。在一 些另外實(shí)施方案中,SPl多肽是由SEQIDNO: 11表示的多核苷酸編碼的多肽。
[0078] 在一些其他實(shí)施方案中,SPl多肽包含如SEQIDNO:5表示的氨基酸序列。在一 些另外實(shí)施方案中,SPl多肽是由SEQIDNO: 12表示的多核苷酸編碼的多肽。
[0079] 在一些其他實(shí)施方案中,SPl多肽包含如SEQIDNO:6表示的氨基酸序列。在一 些另外實(shí)施方案中,SPl多肽是由SEQIDNO: 13表示的多核苷酸編碼的多肽。
[0080] 在一些其他實(shí)施方案中,SPl多肽包含如SEQIDNO:7表示的氨基酸序列。在一 些另外實(shí)施方案中,SPl多肽是由SEQIDNO: 14表示的多核苷酸編碼的多肽。
[0081] 在一些其他實(shí)施方案中,SPl多肽包含如SEQIDNO: 15表示的氨基酸序列。在一 些另外實(shí)施方案中,SPl多肽是由SEQIDNO: 16表示的多核苷酸編碼的多肽。
[0082] 在一些實(shí)施方案中,SPl多肽包含如SEQIDNO: 15表示的氨基酸序列MRKLPDAAT RTPKLVKHTLLTRFKDEITREQIDNYINDYTNLLDLIPSMKSFNWGTDLGMESAELNRGYTHAFESTFESKSGLQEY LDSAALAAFAEGFLPTLSQRLVIDYFLY。
[0083] 在一些其他實(shí)施方案中,SPl多肽包含如SEQIDNO: 17表示的氨基酸序列。在一 些另外實(shí)施方案中,SPl多肽是由SEQIDNO: 18表示的多核苷酸編碼的多肽。
[0084] 在一些實(shí)施方案中,SPl多肽包含如SEQIDNO: 17表示的氨基酸序列MRKLPDAAT RTPKLVKHTLLTRFKDEITREQIDNYINDYTNLLDLIPSCKSFNWGTDLGMESAELNRGYTHAFESTFESKSGLQEY LDSAALAAFAEGFLPTLSQRLVIDYFLY。
[0085] 在本公開內(nèi)容的上下文中,對(duì)任何一個(gè)SEQIDNO: 1、SEQIDNO:2、SEQIDNO:3、 5£〇10勵(lì):4、5£〇10勵(lì):5、5£〇10勵(lì):6、5£〇10勵(lì):7、5£〇10勵(lì):15或5£〇10勵(lì):17的 任何提及,視為提及十二聚體SPl多肽的一個(gè)單體。另外,當(dāng)提及由SEQIDN0:8、SEQID N0:9、SEQIDNO:10、SEQIDNO:11、SEQIDNO:12、SEQIDNO:13、SEQIDNO:14、SEQID NO: 16或SEQIDNO: 18表示的序列時(shí),應(yīng)視為提及編碼十二聚體SPl多肽的一個(gè)單體的多 核苷酸。
[0086] 可遺傳操作SPl以包括12個(gè)單體,其中至少1個(gè)、至少2個(gè)、至少3個(gè)、至少4個(gè)、 至少5個(gè)、至少6個(gè)、至少7個(gè)、至少8個(gè)、至少9個(gè)、至少10個(gè)、至少11個(gè)或至少12個(gè)單體 是相同或不同的。在一些實(shí)施方案中,單體的至少1個(gè)、至少2個(gè)、至少3個(gè)、至少4個(gè)、至 少5個(gè)、至少6個(gè)、至少7個(gè)、至少8個(gè)、至少9個(gè)、至少10個(gè)、至少11個(gè)或至少12個(gè)獨(dú)立地 選自SEQIDN0:1、SEQIDN0:2、SEQIDN0:3、SEQIDN0:4、SEQIDN0:5、SEQIDN0:6、 SEQIDNO:7、SEQIDNO:15 和SEQIDNO:17。
[0087] 根據(jù)本發(fā)明應(yīng)用的多肽可合成地或通過重組DNA技術(shù)來(lái)產(chǎn)生。用于產(chǎn)生多肽肽類 的方法是本領(lǐng)域中熟知的。
[0088] 在一些實(shí)施方案中,SPl衍生物包括但不限于其整體序列與本文定義的多肽(根 據(jù)本發(fā)明的SPl蛋白或由其衍生的任何片段或肽)在一個(gè)或更多個(gè)氨基酸中不同的多肽, 具有缺失、取代、倒位或添加的多肽。
[0089] 在一些實(shí)施方案中,衍生物是通過氨基酸殘基的插入與本發(fā)明中具體定義的多肽 不同的多肽。應(yīng)理解,術(shù)語(yǔ)"插入"或"缺失分別意指1個(gè)至50個(gè)氨基酸殘基之間、20個(gè)至 1個(gè)氨基酸殘基之間、且具體地在1個(gè)至10個(gè)氨基酸殘基之間的氨基酸殘基向多肽的任何 添加或從其缺失。插入或缺失可以是1個(gè)、2個(gè)、3個(gè)、4個(gè)、5個(gè)、6個(gè)、7個(gè)、8個(gè)、9個(gè)或10 個(gè)氨基酸中的任何一個(gè),并可發(fā)生在修飾的肽的任何位置上,以及其N'或C'末端的任何一 個(gè)中。
[0090] 本發(fā)明的肽可全部帶正電、帶負(fù)電荷或是中性的。另外,它們可呈二聚體、多聚體 的形式或呈受限的構(gòu)象,其可通過內(nèi)部橋、短程環(huán)化、延伸或其他化學(xué)修飾形式來(lái)實(shí)現(xiàn)。
[0091] 本發(fā)明的多肽可通過它們的任何殘基與另一個(gè)肽或試劑偶合(綴合)。例如,本發(fā) 明的多肽可通過它們的N-末端與月桂酰-半胱氨酸(LC)殘基偶合和/或通過它們的C-末 端與半胱氨酸(C)殘基偶合。
[0092] 此外,肽可在其N-末端和/或C-末端處用各種相同或不同的氨基酸殘基來(lái)延伸。 作為這樣的延伸的實(shí)例,肽可在其N-末端和/或C-末端處用可以是天然存在或合成的氨 基酸殘基的相同或不同的氨基酸殘基來(lái)延伸。這樣的延伸的另外的實(shí)例,可由在其N-末端 和/或C-末端兩處用半胱氨酸殘基延伸的肽提供。自然地,由于起因于二硫鍵的形成的 Cys-Cys環(huán)化,這樣的延伸可導(dǎo)致受限的構(gòu)象。另一個(gè)實(shí)例可以是N-末端賴氨酰-棕櫚酰 尾部的摻入,賴氨酸用作連接物且棕櫚酸作為疏水性錨點(diǎn)。另外,肽可通過可以是天然存在 或合成的氨基酸殘基的芳族氨基酸殘基來(lái)延伸,例如,特定的芳族氨基酸殘基可以是色氨 酸。肽可在其N-末端和/或C-末端用各種相同或不同的不是天然存在或合成的氨基酸的 有機(jī)部分來(lái)延伸。作為這樣的延伸的實(shí)例,肽可在其N-末端和/或C-末端用N-乙酰基基 團(tuán)來(lái)延伸。
[0093] 對(duì)于本文定義的每個(gè)單一的肽,本發(fā)明包括相應(yīng)的逆-反向(retro-inverse)序 列,其中肽鏈的方向已反轉(zhuǎn)并且其中所有氨基酸屬于D-系列。
[0094] 本發(fā)明還包括根據(jù)本發(fā)明通過它們的氨基酸序列明確定義的多肽(SP1蛋白或其 任何片段或肽類)的任何同系物。術(shù)語(yǔ)"同系物"用于定義保持了與由本發(fā)明定義的氨基 酸序列的最低同源性的氨基酸序列(多肽),例如,優(yōu)選地與如以上在結(jié)構(gòu)方面定義的多肽 的任何一個(gè)、例如特定的序列的氨基酸序列具有至少約65%,更優(yōu)選地至少約75%,甚至 更優(yōu)選地至少約85%,最優(yōu)選地至少約95%的整體序列同源性的氨基酸序列,更具體地, 如由以下的任何一個(gè)表示的多肽的氨基酸序列:SEQIDNO: 1、SEQIDN0:2、SEQIDN0:3、 SEQIDNO:4、SEQIDNO:5、SEQIDNO:6、SEQIDNO:7、SEQIDNO:15、SEQIDNO:17。
[0095] 更具體地,關(guān)于天然多肽和其功能性衍生物的"同源性"在本文定義為,在比對(duì)序 列且如果必要引入缺口以達(dá)到最大同源性百分比后,候選序列中與相應(yīng)天然多肽的殘基相 同的氨基酸殘基的百分比,并且不考慮任何保守取代作為序列同一性的部分。N-末端延伸 和C-末端延伸以及插入或缺失都不應(yīng)解釋為減少同一性或同源性。用于比對(duì)的方法和計(jì) 算機(jī)程序是本領(lǐng)域已知的。
[0096] 在一些實(shí)施方案中,本發(fā)明還包括在本發(fā)明中通過它們的氨基酸序列被明確定義 的多肽的變體或類似物的多肽。關(guān)于氨基酸序列,本領(lǐng)域技術(shù)人員將認(rèn)識(shí)到,對(duì)肽、多肽或 蛋白序列的單獨(dú)的取代、缺失或添加從而改變、添加或缺失編碼的序列中的單個(gè)氨基酸或 小百分比氨基酸,是"保守地修飾的變體",其中改變導(dǎo)致用化學(xué)上相似的氨基酸取代氨基 酸。
[0097] 提供功能上相似的氨基酸的保守取代表格是本領(lǐng)域熟知的。這樣的保守修飾的變 體是本發(fā)明的多態(tài)變體(polymorphicvariant)、種間同系物、和等位基因和類似肽的附加 的,并不排除本發(fā)明的多態(tài)變體、種間同系物、和等位基因和類似肽。
[0098] 例如,可進(jìn)行其中脂肪族氨基酸(G、A、I、L或V)被該組的另一個(gè)成員取代的取 代、或諸如一個(gè)極性殘基取代另一個(gè)的取代,諸如精氨酸取代賴氨酸、谷氨酸取代天冬氨酸 或谷氨酰胺取代天冬酰胺。以下八組的每個(gè)包含是彼此的保守取代的其他示例性氨基酸:
[0099] 1)丙氨酸(A)、甘氨酸(G);
[0100] 2)天冬氨酸(D)、谷氨酸(E);
[0101] 3)天冬酰胺(N)、谷氨酰胺(Q);
[0102] 4)精氨酸(R)、賴氨酸(K);
[0103] 5)異亮氨酸(I)、亮氨酸(L)、甲硫氨酸(M)、纈氨酸(V);
[0104] 6)苯丙氨酸(F)、酪氨酸(Y)、色氨酸(W);
[0105] 7)絲氨酸⑶、蘇氨酸(T);和
[