專利名稱::蛋白酶檢測(cè)系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
:本發(fā)明一般涉及細(xì)胞內(nèi)蛋白酶檢測(cè)系統(tǒng)。優(yōu)選的系統(tǒng)包括嵌合底物蛋白質(zhì),其包括共價(jià)連接成分1)至少一種任選地掩蔽信號(hào)蛋白質(zhì)(optionallymasksignalprotein);2)至少一種蛋白酶特異的切割位點(diǎn);和3)至少一種可檢測(cè)的氨基酸序列。本發(fā)明有廣譜重要的應(yīng)用,包括用于篩選以檢測(cè)阻斷一種或多種人類病原體產(chǎn)生的蛋白酶的化合物。
背景技術(shù):
:蛋白酶是切割蛋白質(zhì)特定肽鍵的酶。在生物組織中,蛋白酶有特異的蛋白水解活性,且其抑制劑參與調(diào)節(jié)多種生物功能。在多種生物過程中,生物必需的功能可通過導(dǎo)致活化蛋白質(zhì)形成的蛋白酶對(duì)聚蛋白前體的蛋白酶剪切而被活化和調(diào)節(jié)。實(shí)例包括血液凝固、免疫防御過程、蛋白質(zhì)通過細(xì)胞內(nèi)膜的選擇轉(zhuǎn)運(yùn)、宿主細(xì)胞中的病毒增殖等。因此,蛋白酶是特異的蛋白酶抑制劑作為新藥開發(fā)中的主要靶標(biāo)。病毒蛋白酶抑制劑是作為新藥開發(fā)的蛋白酶抑制劑的典型實(shí)例。由于病毒蛋白酶參與聚蛋白前體通過蛋白酶剪切的活化,因此蛋白酶是宿主細(xì)胞中病毒增殖起始及復(fù)制病毒正確衣殼裝配的重要成分。蛋白酶抑制劑已被開發(fā)以阻斷導(dǎo)致獲得性免疫缺陷綜合癥(AIDS)12的HIV的增殖。例如安潑那韋(amprenavir)、那非那韋(nelfinavir)、印地那韋(indinavir)、利托那韋(ritonavir),和斯查那韋(squinavir)已被FDA批準(zhǔn)作為抑制HIV蛋白酶的藥物,洛匹那韋(lopinavir)和依法韋侖(efavirenz)處于臨床研究中。給予那些藥物的患者顯示HIV顆粒數(shù)降低到該藥物療法前的約10%。這顯示蛋白酶抑制劑可用作有效的藥物。但是,報(bào)道了這些治療中的幾種副作用(Miller,T.L.等人,2001),和報(bào)道了在長(zhǎng)期治療的情況下攜帶突變蛋白酶基因的突變體(Jacobsen,H等人,1996;Cote,H等人,2001)。因此,需要開發(fā)能特異阻斷多種突變HIV病毒增殖的更多不同的蛋白酶抑制劑。已經(jīng)研究了蛋白酶抑制劑對(duì)其他人和動(dòng)物病毒的抑制,例如HCV(Kasai,N.等人,2001)和HERV(Kuhelj,R.等人,2001)?;谕瑯拥母拍钸€進(jìn)行了植物病毒病的研究。例如,通過在轉(zhuǎn)基因植物中表達(dá)作為蛋白酶抑制劑的重組蛋白質(zhì),研究了由TEV(煙草蝕刻病毒)和PVY(馬鈴薯Y病毒)產(chǎn)生的聚蛋白的蛋白酶剪切抑制(Gutierres-Campos,R.等人,1999)。還進(jìn)行了植物病毒蛋白酶蛋白水解位點(diǎn)鑒定的研究(Yoon,H.Y.等人,2000)。已有多種嘗試開發(fā)蛋白酶抑制劑。例如,多數(shù)情況下,在蛋白酶、其底物肽或蛋白質(zhì),和候選化學(xué)物質(zhì)體外混合反應(yīng)后,通過使用電泳檢測(cè)底物切割進(jìn)行蛋白酶抑制劑的篩選。由于已認(rèn)識(shí)到重要的蛋白水解位點(diǎn),因此氨基酸序列與蛋白水解位點(diǎn)相似的肽被合成并用于尋找蛋白酶抑制劑(Kettner,C.A.和Korant,B.D.,1987)。由于蛋白質(zhì)三級(jí)結(jié)構(gòu)的確定變得更容易并且還可能使用計(jì)算機(jī)模擬設(shè)計(jì)化學(xué)物質(zhì),所以已進(jìn)行了許多研究以設(shè)計(jì)和合成與酶活性位點(diǎn)特異結(jié)合的分子(Wlodawer,A.和Erickson,J.W.,1993;Rodgers,J.D.等人,1998;Mardis,K.L.等人,2001)。并且,嘗試使用熒光標(biāo)記底物以提高蛋白酶活性檢測(cè)的效率(Ermolief,J.等人,2000),并使用大腸桿菌(CW/)周質(zhì)中表達(dá)的抗體片段作為蛋白酶抑制劑以擴(kuò)大蛋白酶抑制劑的骨架結(jié)構(gòu)(Kasai,N.等人,2001)。現(xiàn)在使用的大多數(shù)蛋白酶活性篩選方法在體外進(jìn)行。可是,在體外篩選方法中,不可能檢測(cè)多種復(fù)雜的效果,例如候選藥物轉(zhuǎn)運(yùn)入細(xì)胞的效率、候選藥物在細(xì)胞中的穩(wěn)定性和細(xì)胞毒性等。因此在體外篩選方法選擇的候選藥物活體檢測(cè)前,需要許多另外的費(fèi)時(shí)的實(shí)驗(yàn)。所以,需要開發(fā)更簡(jiǎn)單和更通用的體內(nèi)篩選方法以檢測(cè)候選蛋白酶抑制劑的細(xì)胞功能并篩選更特異的蛋白酶抑制劑。已在多種體內(nèi)或類似體內(nèi)的條件下嘗試檢測(cè)蛋白酶剪切和篩選蛋白酶抑制劑。例如,有使用存在于分離嚢泡(vesicle)中的蛋白酶方法的報(bào)道(Hook,V.Y.,2001)。其他公開的方法包括使用組織切片的原位酶譜法(Yi,C.-F.等人,2001),和用蛋白酶的多肽底物處理細(xì)胞的方法(Kuhelj,R.等人,2001)。然而對(duì)這些方法和相關(guān)方法缺點(diǎn)的認(rèn)識(shí)漸增。例如,多數(shù)方法據(jù)信僅近似體內(nèi)環(huán)境。因此,這樣的方法不一定反映可實(shí)質(zhì)影響蛋白酶功能的細(xì)胞內(nèi)環(huán)境。另外,多數(shù)先前的的方法據(jù)信在敏感性、選擇性,和便利性上有局限。據(jù)信這些缺點(diǎn)和其他缺點(diǎn)已經(jīng)減低了過去篩選嘗試的效率和可信度。需要有更好的檢測(cè)細(xì)胞內(nèi)蛋白酶的體內(nèi)方法,其更敏感和更易于使用.尤其需要有容易適合檢測(cè)哺乳動(dòng)物和病毒蛋白酶抑制劑的體內(nèi)方法。
發(fā)明內(nèi)容14本發(fā)明涉及細(xì)胞和組織內(nèi)蛋白酶檢測(cè)系統(tǒng)。在一個(gè)實(shí)施方案中,該系統(tǒng)包括至少一種嵌合蛋白質(zhì),其包括共價(jià)連接成分l)至少一種可選地掩蔽信號(hào)蛋白質(zhì);2)至少一種蛋白酶特異的切割位點(diǎn);和3)至少一種可檢測(cè)的氨基酸序列。優(yōu)選的嵌合蛋白質(zhì)有作為"分子標(biāo)志(moiecuiarbeacon)"的功能,其在蛋白酶存在的細(xì)胞內(nèi)改變位置。本發(fā)明有廣泛的應(yīng)用,包括用于體內(nèi)篩選以檢測(cè)抑制或阻斷人類病原體相關(guān)蛋白酶的化合物。本發(fā)明優(yōu)選的用途要求受試細(xì)胞或組織中包括至少一種活性蛋白酶。適當(dāng)?shù)牡鞍酌赴切┘?xì)胞內(nèi)源的,例如,那些公知的"持家"酶。其他適當(dāng)?shù)牡鞍酌赴切┘?xì)胞或組織非自然發(fā)生的。例如,這樣的蛋白酶可以是病原體感染產(chǎn)生的。另外,該蛋白酶在細(xì)胞或組織內(nèi)的存在可以是欲在其中引入蛋白酶的實(shí)驗(yàn)操作的結(jié)果。在這些實(shí)施方案中,嵌合蛋白質(zhì)(或其可檢測(cè)的成分)亞細(xì)胞位置的變化被作為細(xì)胞或組織內(nèi)存在蛋白酶的指示。因此本發(fā)明提供作為空間敏感的"分子標(biāo)志",其在細(xì)胞或組織內(nèi)的定位是存在(或缺失)受試蛋白酶的指示。顯而易見,本發(fā)明是一個(gè)有廣泛應(yīng)用的發(fā)明。即,它可用于檢測(cè)細(xì)胞或組織內(nèi)廣譜的蛋白酶。優(yōu)選的蛋白酶能切割(水解),尤其優(yōu)選,在嵌合蛋白質(zhì)中的切割位點(diǎn)。有時(shí)此處的嵌合蛋白質(zhì)將作為嵌合底物蛋白質(zhì)以指示目的蛋白酶的切割潛能。位點(diǎn)特異的切割理解為通常在特異的切割位點(diǎn)或其附近分裂嵌合分子,并從中釋放至少一種成分,例如,可選地掩蔽信號(hào)蛋白質(zhì)、切割位點(diǎn),或可檢測(cè)的氨基酸序列。優(yōu)選的釋放包括至少一種可檢測(cè)的氨基酸序列,但根據(jù)用途可包括嵌合分子的其他成分。嵌合分子一種或多種成分更優(yōu)選的釋放是為了提供空間敏感的分子標(biāo)志。例如,在一個(gè)實(shí)施方案中,可檢測(cè)的氨基酸序列從嵌合底物蛋白質(zhì)中釋放并基本上自由地在整個(gè)宿主細(xì)胞或組織擴(kuò)散。該擴(kuò)散信號(hào)易于15檢測(cè)并可作為蛋白酶存在的指示。然而在另一發(fā)明實(shí)施方案中,一種或多種可檢測(cè)的氨基酸序列的釋放與通過可選地掩蔽信號(hào)蛋白質(zhì)指導(dǎo)分子到另一亞細(xì)胞位置相關(guān)。在本發(fā)明的這個(gè)實(shí)施例中,更集中和更高強(qiáng)度的信號(hào)作為蛋白酶的指示。在本發(fā)明的一些實(shí)施方案中,甚至在細(xì)胞或組織內(nèi)存在蛋白酶的情況下,嵌合分子保持至少一種可檢測(cè)的氨基酸序列是有用的,優(yōu)選以符合讀框的融合。在這一情況下,當(dāng)?shù)鞍酌复嬖跁r(shí),通過參照可檢測(cè)的氨基酸序列可監(jiān)測(cè)嵌合分子的定位。在多數(shù)情況下,可檢測(cè)的氨基酸序列(單獨(dú)或與另一可檢測(cè)的嵌合蛋白質(zhì)成分結(jié)合)的釋放和后續(xù)的亞細(xì)胞定位,易于通過一種或組合常規(guī)檢測(cè)策略原位顯像。因此本發(fā)明的一個(gè)目的是將目的蛋白酶的存在和優(yōu)選其活性與嵌合蛋白質(zhì)的定位改變結(jié)合起來。該改變因信號(hào)位置(并優(yōu)選強(qiáng)度)的增加或減少是易于檢測(cè)的。作為實(shí)例,可檢測(cè)的標(biāo)記嵌合蛋白質(zhì)(或一種或多種成分)的亞細(xì)胞分布最初可限制在相對(duì)小的區(qū)域,例如細(xì)胞器。該限制產(chǎn)生相對(duì)高的信號(hào)強(qiáng)度。然而在特異切割嵌合蛋白質(zhì)的蛋白酶存在的情況下,該分布受到更少的束綽甚至擴(kuò)散。限制的缺少產(chǎn)生相對(duì)低的信號(hào)強(qiáng)度。在這個(gè)實(shí)例中,通過蛋白酶的特異切割可與嵌合蛋白質(zhì)(或標(biāo)記成分)從細(xì)胞器到更大空間(例如胞質(zhì)溶膠)的運(yùn)動(dòng)相關(guān)。另外,在活性蛋白酶的存在通過本發(fā)明與標(biāo)記蛋白質(zhì)從胞質(zhì)溶膠到更狹窄空間(例如,細(xì)胞器或液泡)的亞細(xì)胞移動(dòng)相關(guān)的實(shí)施方案中,信號(hào)強(qiáng)度可突然升高。在另一實(shí)施方案中,活性蛋白酶的存在可與很少或沒有變化的信號(hào)強(qiáng)度相關(guān)。替代的,通過標(biāo)記蛋白質(zhì)從一個(gè)亞細(xì)胞位置向另一個(gè)亞細(xì)胞位置的移動(dòng)來監(jiān)測(cè)這種變化,例如,嵌合底物蛋白質(zhì)從一個(gè)細(xì)胞器到另一細(xì)胞器或液泡的移動(dòng)。本發(fā)明的實(shí)施提供了許多重要的優(yōu)點(diǎn)。例如,本發(fā)明提供嵌合蛋白質(zhì),其被受試蛋白酶特異切割產(chǎn)生標(biāo)記(和非標(biāo)記)組分蛋白質(zhì)。本發(fā)明優(yōu)選的實(shí)施將亞細(xì)胞位置,并且優(yōu)選地,標(biāo)記蛋白質(zhì)的信號(hào)強(qiáng)度與受試蛋白酶的存在(或缺失)相關(guān)。這一"雙因子"檢測(cè)策略提供高度靈敏和可信的蛋白酶檢測(cè)。即,細(xì)胞或組織內(nèi)的標(biāo)記蛋白質(zhì)的位置和其信號(hào)強(qiáng)度均可作為活性蛋白酶存在的指示。本發(fā)明還是高度選擇性的,即,其容易鑒別細(xì)胞內(nèi)不同的蛋白酶或同工酶的存在及同一蛋白酶無(wú)活性和活性形式的存在。本發(fā)明優(yōu)選的嵌合蛋白質(zhì)可用可獲得的試劑和標(biāo)準(zhǔn)的重組操作制備,其使本發(fā)明易于應(yīng)用。另外,本發(fā)明是靈活的,可用于檢測(cè)多種細(xì)胞中的活性蛋白酶,尤其是真核細(xì)胞,包括那些衍生自植物、酵母、真菌、動(dòng)物,和昆蟲的細(xì)胞。優(yōu)選的嵌合蛋白質(zhì)對(duì)細(xì)胞或組織中的基因表達(dá)影響很小,因此避免了潛在復(fù)雜的遺傳影響。本發(fā)明還適宜許多種適當(dāng)?shù)牡鞍酌盖懈钗稽c(diǎn)和可檢測(cè)的氨基酸序列。因此,一方面,本發(fā)明提供細(xì)胞內(nèi)蛋白酶檢測(cè)系統(tǒng),該系統(tǒng)優(yōu)選包括至少一種上述的嵌合蛋白質(zhì)。對(duì)于嵌合蛋白質(zhì),只要達(dá)到預(yù)期的結(jié)果,每一種蛋白質(zhì)成分(可選地掩蔽信號(hào)蛋白質(zhì)、蛋白酶切割位點(diǎn),和可檢測(cè)的序列)的連接順序并不重要。然而典型地,連接順序從一種成分的N末端開始并在另一種成分的C末端結(jié)束。如前所述,嵌合蛋白質(zhì)包括共價(jià)連接成分l)至少一種可選地掩蔽信號(hào)蛋白質(zhì);2)至少一種蛋白酶特異的切割位點(diǎn);和3)至少一種可檢測(cè)的氨基酸序列。優(yōu)選地,該嵌合蛋白質(zhì)包括少于約IO種可選地掩蔽信號(hào)蛋白質(zhì),更優(yōu)選少于約5種上述的蛋白質(zhì),一般約l、2,或3種這樣的信號(hào)蛋白質(zhì)。短語(yǔ)"可選地掩蔽"意指信號(hào)蛋白質(zhì)的預(yù)期功能(一般是運(yùn)輸信號(hào))被掩蔽或未掩蔽。術(shù)語(yǔ)"掩蔽"意指通過共價(jià)連接至少一種掩蔽序列到信號(hào)蛋白質(zhì)上,可逆或不可逆地,基本上降低或優(yōu)選地完全封閉信號(hào)蛋白質(zhì)的預(yù)期功能。一般優(yōu)選的被掩蔽的信號(hào)蛋白質(zhì)包括約1種到約2種這樣的掩蔽序列。一般優(yōu)選的掩蔽序列由少于約200個(gè)氨基酸的殘基組成,優(yōu)選少于約50個(gè)殘基,對(duì)于多數(shù)應(yīng)用優(yōu)選約3到約20個(gè)殘基。多數(shù)發(fā)明應(yīng)用特別優(yōu)選的掩蔽序列為至少一種位點(diǎn)特異的蛋白酶切割位點(diǎn),例如,1、2、3或4種這樣的位點(diǎn)。根據(jù)本發(fā)明另外的優(yōu)選嵌合蛋白質(zhì)包括,以共價(jià)連接成分,少于約IO種蛋白酶特異的切割位點(diǎn),優(yōu)選少于約5種位點(diǎn),其中經(jīng)常優(yōu)選約l、2、3,或4種這樣的位點(diǎn)。還進(jìn)一步優(yōu)選的嵌合蛋白質(zhì)包括,作為共價(jià)連接成分,少于約10種可檢測(cè)的氨基酸序列,優(yōu)選少于約5種所迷序列,其中一般優(yōu)選約l、2、3,或4種這樣的可檢測(cè)的氨基酸序列。在一個(gè)實(shí)施方案中,該序列是熒光、磷光或化學(xué)發(fā)光的蛋白質(zhì)或其功能片段。可檢測(cè)的氨基酸序列的功能片段能以與全長(zhǎng)序列基本上同樣的敏感性被檢測(cè)。在另一實(shí)施方案中,該氨酸序列是酶或其催化片段,其通過與適當(dāng)?shù)牡孜锝佑|,可產(chǎn)生熒光、磷光或化學(xué)發(fā)光。來自可檢測(cè)氨基酸序列的信號(hào)的檢測(cè)和可選地定量的方法是本領(lǐng)域公知的并在下面更詳細(xì)地解釋。另一方面,本發(fā)明提供基本上純的嵌合蛋白質(zhì),其包括共價(jià)連接成分1)至少一種可選地掩蔽信號(hào)蛋白質(zhì);2)至少一種蛋白酶特異的切割位點(diǎn);和3)至少一種可檢測(cè)的氨基酸序列。再一方面,本發(fā)明涉及核酸,其包括編碼嵌合蛋白質(zhì)的序列。在一個(gè)實(shí)施方案中,編碼的嵌合蛋白質(zhì)包括共價(jià)連接成分l)至少一種可選地掩蔽信號(hào)蛋白質(zhì);2)至少一種蛋白酶特異的切割位點(diǎn);和3)至少一種可檢測(cè)的氨基酸序列。本發(fā)明還提供載體,其包括編碼如此處所公開嵌合蛋白質(zhì)的核酸。還提供細(xì)胞例如植物、酵母、動(dòng)物,真菌或昆蟲細(xì)胞,其包括并優(yōu)選還表達(dá)嵌合蛋白質(zhì)。18本發(fā)明還提供細(xì)胞內(nèi)蛋白酶檢測(cè)試劑盒。在一個(gè)實(shí)施方案中,試劑盒包括此處描述的系統(tǒng),該系統(tǒng)優(yōu)選包括至少一種a)如此處所描述的嵌合蛋白質(zhì);和b)包含編碼此處公開嵌合蛋白質(zhì)的任一核酸的栽體。可選地,試劑盒還可包括包含編碼嵌合蛋白質(zhì)特異蛋白酶的核酸的栽體和/或細(xì)胞,其包括并優(yōu)選還表達(dá)嵌合蛋白質(zhì)和蛋白酶。試劑盒還可用于篩選蛋白酶的抑制劑。本發(fā)明提供另外的用途和優(yōu)點(diǎn)。例如,提供有效和通用的蛋白酶特異抑制劑的體內(nèi)篩選方法也是本發(fā)明的目的。因此在一個(gè)實(shí)施方案中,本發(fā)明提供(1)嵌合底物蛋白質(zhì),其包含至少一種指導(dǎo)向亞細(xì)胞器轉(zhuǎn)運(yùn)的信號(hào)蛋白質(zhì),至少一種蛋白酶特異的蛋白酶剪切位點(diǎn),和至少一種熒光蛋白標(biāo)記,和構(gòu)建嵌合底物蛋白質(zhì)的通用方法;(2)包含編碼嵌合底物蛋白質(zhì)的核酸序列的重組基因,其可用于轉(zhuǎn)化細(xì)胞以表達(dá)嵌合底物蛋白質(zhì);(3)—個(gè)系統(tǒng),其中嵌合底物蛋白質(zhì)和其特異的蛋白酶共存在一個(gè)活細(xì)胞中,以便蛋白酶對(duì)底物的蛋白酶剪切可發(fā)生在一個(gè)活細(xì)胞中;(4)確定體內(nèi)蛋白酶活性的有效分步的方法,其通過直接觀測(cè)具有從與底物綴合的熒光蛋白標(biāo)記發(fā)出的熒光信號(hào)的細(xì)胞,而直接鑒定活細(xì)胞中蛋白酶對(duì)嵌合底物蛋白質(zhì)的切割;和(5)篩選蛋白酶特異抑制劑的有效分步的方法,其使用以上構(gòu)建的系統(tǒng)以確定活細(xì)胞中蛋白酶活性。通過論述涉及的技術(shù)問題,本發(fā)明提供分析特定蛋白酶活性和篩選蛋白酶抑制劑的更現(xiàn)實(shí)的體內(nèi)方法,其中蛋白酶和其特異的底物共存在一個(gè)活細(xì)胞中,以便蛋白酶對(duì)底物的切割可發(fā)生在一個(gè)活細(xì)胞中,結(jié)果可從活細(xì)胞直接見察。19在相關(guān)方面,本發(fā)明提供檢測(cè)細(xì)胞或組織內(nèi)蛋白酶非常有用的方法。在本發(fā)明的實(shí)例中,該方法包括下述至少一個(gè)并優(yōu)選所有的步驟a)將包含編碼嵌合蛋白質(zhì)的核酸的第一載體引入受試細(xì)胞或組織,其中嵌合蛋白質(zhì)包括共價(jià)連接成分1)至少一種可選地掩蔽信號(hào)蛋白質(zhì);2)至少一種蛋白酶特異的切割位點(diǎn);和3)至少一種可檢測(cè)的氨基酸序列,b)在使第一栽體編碼的嵌合蛋白質(zhì)表達(dá)的條件下培養(yǎng)細(xì)胞或組織;和c)檢測(cè)嵌合蛋白質(zhì)(或其可檢測(cè)的標(biāo)記成分)的亞細(xì)胞定位和信號(hào)強(qiáng)度中的至少一個(gè)的變化作為細(xì)胞內(nèi)蛋白酶存在的指示。如上所述,該方法是靈活的并容易改變以適合預(yù)期使用。例如,如果需要,該方法還可包括引入第二載體到受試細(xì)胞或組織的步驟,該第二載體包含編碼蛋白酶的核酸序列;并在細(xì)胞或組織中表達(dá)第二栽體以在細(xì)胞或組織內(nèi)產(chǎn)生蛋白酶。本發(fā)明還提供蛋白酶抑制劑體內(nèi)活性檢測(cè)和可選地定量的方法。優(yōu)選的抑制劑可以是目的細(xì)胞或組織內(nèi)源的。然而,在許多發(fā)明實(shí)施方案中將給予細(xì)胞或組織該抑制劑,其包括自然發(fā)生的、合成的,和半合成的分子。這種分子可從化學(xué)文庫(kù)中獲得,并可包括那些已知的、可疑的或完全未知的抑制活性。例如,在特定蛋白酶抑制劑活性確定的實(shí)施方案中,本發(fā)明可用于證實(shí)蛋白酶在特定細(xì)胞、組織類型,或培養(yǎng)條件中的活性。在其他實(shí)施方案中,本發(fā)明可用于從化學(xué)文庫(kù)中篩選候選化合物。在本發(fā)明的一個(gè)實(shí)例中,檢測(cè)方法包括下述至少一個(gè)并優(yōu)選所有的步驟a)將包含編碼嵌合蛋白質(zhì)的核酸的第一載體引入受試細(xì)胞或組織,其中嵌合蛋白質(zhì)包括共價(jià)連接成分1)至少一種可選地掩蔽信號(hào)蛋白質(zhì);2)至少一種蛋白酶特異的切割位點(diǎn);和3)至少一種可檢測(cè)的氨基酸序列,b)在細(xì)胞或組織中引入編碼至少一種受試蛋白酶的第二載體,優(yōu)選上述的一個(gè)蛋白酶,C)將細(xì)胞或組織與候選化合物接觸,d)在使第一載體編碼的嵌合蛋白質(zhì)和第二載體編碼的蛋白酶表達(dá)的條件下培養(yǎng)細(xì)胞或組織;和e)檢測(cè)嵌合蛋白質(zhì)(或其可檢測(cè)的標(biāo)記成分)的亞細(xì)胞定位和信號(hào)強(qiáng)度中至少一個(gè)的變化作為蛋白酶抑制劑存在的指示。上述檢測(cè)方法是靈活的并容易適用于以單獨(dú)的、低或高通量模式篩選候選化合物。例如,在一個(gè)實(shí)施方案中,該方法還包括使用自動(dòng)或半自動(dòng)設(shè)備,其優(yōu)選來檢測(cè)可檢測(cè)的標(biāo)記嵌合蛋白質(zhì)或其標(biāo)記蛋白質(zhì)成分在亞細(xì)胞定位和信號(hào)強(qiáng)度的變化。更具體的設(shè)備包括適合檢測(cè)細(xì)胞或組織內(nèi)可檢測(cè)序列的光學(xué)系統(tǒng),該系統(tǒng)可向使用者提供實(shí)時(shí)結(jié)果或作為存儲(chǔ)結(jié)果。如果需要,通過參照適當(dāng)?shù)膶?duì)照可監(jiān)測(cè)嵌合蛋白質(zhì)(或其可檢測(cè)的標(biāo)記成分)在亞細(xì)胞定位、信號(hào)強(qiáng)度(或二者)的可檢測(cè)的變化。一種適當(dāng)?shù)膶?duì)照是加入水、鹽水或緩沖液,而不是步驟c)中要檢測(cè)的化合物。當(dāng)然,在特定方法的嵌合蛋白質(zhì)、宿主細(xì)胞或組織等的性質(zhì)已經(jīng)確定的實(shí)施方案中,可不需要^:用對(duì)照。如上所述,本發(fā)明非常適合檢測(cè)蛋白酶抑制劑。根據(jù)本發(fā)明,已知的蛋白酶抑制劑是確認(rèn)的病毒疾病抑制劑。因?yàn)椴《镜鞍酌笇?duì)復(fù)制和病毒衣殼重新組裝是必需的,所以蛋白酶抑制劑可通過抑制蛋白酶以抑制病毒增殖而用于病毒疾病的治療。動(dòng)物病毒可引起疾病,例如AIDS和肝炎等,植物病毒通過引起萎蔫的葉子和色斑而降低作物產(chǎn)量。一方面,通過提供底物和多種蛋白酶特異抑制劑的體內(nèi)篩選方法,本發(fā)明提供有效開發(fā)多種蛋白酶特異抑制劑的方案(framework)。該方法還可用于確定常規(guī)體外方法篩選的候選藥物的效力。附圖筒述圖1顯示帶有亞細(xì)胞器的運(yùn)輸信號(hào)并用熒光蛋白質(zhì)標(biāo)記的信號(hào)蛋白質(zhì)的示意圖。圖2(a)-(h)顯示當(dāng)熒光蛋白質(zhì)標(biāo)記的信號(hào)蛋白質(zhì)在細(xì)胞中正確表達(dá)時(shí)它們定位分布的熒光照片。(a)顯示用綠色熒光蛋白質(zhì)(GFP)標(biāo)記的擬南芥屬(Jn^,V/o/w&)外包膜蛋白質(zhì)(AtOEP7)定位在葉綠體包膜;(b)、(c)和(d)顯示用GFP標(biāo)記的Rubisco(核酮糖二磷酸羧化酶-加氧酶)小亞單位(RbcS)、葉綠素a/b結(jié)合蛋白質(zhì)(Cab),Rubisco活化酶(Rubiscoactivase)(RA)定位在葉綠體基質(zhì);(e)顯示用GFP標(biāo)記的Fl-ATPase(Fl-腺普三磷酸酶)定位在線粒體;(f)顯示用GFP標(biāo)記的過氧化物酶體把向基序(SKL)定位在過氧化物酶體;和(g)和(h)顯示用GFP標(biāo)記的H+-ATPase(H+"腺苷三磷酸酶)和Pleckstrin同源結(jié)構(gòu)域(PH)(血小板-白細(xì)胞C激酶底物同源結(jié)構(gòu)域)定位在質(zhì)膜(plasmaenvelope).圖3顯示NIa蛋白酶重組基因和NIa蛋白酶體內(nèi)底物,RFP:PS(NIa):AtOEP7:GFP的示意圖(a)顯示構(gòu)建用以表達(dá)嵌合蛋白質(zhì)RFP:PS(NIa):AtOEP7:GFP重組基因的結(jié)構(gòu),其用作本發(fā)明實(shí)施例2中NIa蛋白酶的體內(nèi)底物,其中RFP、GFP、PS(NIa)、AtOEP7和35S分別代表紅色熒光蛋白質(zhì)、綠色熒光蛋白質(zhì)、蛋白酶的蛋白酶剪切位點(diǎn)、擬南芥屬外包膜蛋白質(zhì)和CaMV35S啟動(dòng)子;和(b)顯示實(shí)施例2中使用的表達(dá)NIa蛋白酶的重組基因的結(jié)構(gòu),其中A7a代表來自TVMV的NIa蛋白酶的編碼區(qū)。圖4顯示嵌合蛋白質(zhì)RTP:PS(NIa):AtOEP7:GFP在圖3(a)顯示的重組基因轉(zhuǎn)化的擬南芥屬原生質(zhì)體中表達(dá)后觀察到的熒光照片(a)、(b)、(c),和(d)分別是綠色熒光信號(hào)、紅色熒光信號(hào),和綠色和紅色熒光重疊信號(hào)的圖像,及在亮視野下獲得的圖像。葉綠體中觀察到的紅色焚光信號(hào)是葉綠體的自發(fā)熒光信號(hào),且胞質(zhì)溶膠中觀察到的紅色熒光信號(hào)來自紅色熒光蛋白質(zhì)。圖5顯示嵌合蛋白質(zhì)RFP:PS(NIa):AtOEP7:GFP和NIa蛋白酶,在圖3(a)和3(b)顯示的重組基因轉(zhuǎn)化的擬南芥屬原生質(zhì)體中共表達(dá)后觀察到的熒光圖像,其顯示可觀察到NIa蛋白酶對(duì)RFP:PS(NIa):AtOEP7:GFP的切割(a)、(b)、(c),和(d)分別是綠色熒光信號(hào)、紅色熒光信號(hào),和綠色和紅色熒光重疊信號(hào)的圖像,及在亮視野下獲得的圖像。葉綠體中觀察到的紅色焚光信號(hào)是葉綠體的自發(fā)熒光信號(hào),且胞質(zhì)溶膠中觀察到的紅色熒光信號(hào)來自紅色熒光蛋白質(zhì)。圖6是Western印跡,顯示NIa蛋白酶對(duì)嵌合蛋白質(zhì)REP:PS(NIa):AtOEP7:GEP的切割發(fā)生在擬南芥屬原生質(zhì)體中。圖3(a)中顯示的RFP:PS(NIa):AtOEP7:GFP和圖3(b)中顯示的NIa蛋白酶共表達(dá)(+)的情況和RFP:PS(NIa):AtOEP7:GFP單獨(dú)表達(dá)(-)的情況相比。在70kD和35kD觀察到的蛋白質(zhì)條帶分別對(duì)應(yīng)于完整的嵌合蛋白質(zhì)RFP:PS(NIa):AtOEP7:GFP和由蛋后酶剪切產(chǎn)生的AtOEP7:GFP蛋白質(zhì)片段。圖7(a)-(j)是顯示用于表達(dá)圖1中顯示的融合蛋白質(zhì)的不同構(gòu)建體質(zhì)粒圖譜的圖(a)AtOEP7:GFP、(b)4tOEP7:RFP、(c)RbcS:GFP(d)RbcS:RFP、(e)Cab:GFP、(f)RA:GFP、(g)Fl-ATPase:GFP、23(h)GFP:SKL、(i)H+隱ATPase:GFP、(j)GFP:PH。圖8(a)和(b)分別顯示NIa蛋白酶和其嵌合底物蛋白質(zhì)RFP:PS(NIa):AtOEP7:GFP的質(zhì)粒圖譜。標(biāo)注了嵌合底物蛋白質(zhì)的核酸序列的重要部分。圖9(a)和(b)分別顯示HIV-1蛋白酶和其嵌合底物蛋白質(zhì)RFP:PS(HIV-l):AtOEP7:GFP的質(zhì)粒圖譜。標(biāo)注了蛋白酶剪切位點(diǎn)的核酸和蛋白質(zhì)序列(SEQIDNO:57-74)。圖10顯示編碼可選地掩蔽嵌合底物蛋白質(zhì)實(shí)例的重組基因的示意圖,其中一種信號(hào)蛋白質(zhì)的運(yùn)輸信號(hào)保持活性。PS代表蛋白酶剪切位點(diǎn)序列。FP-1和FP-2代表具有不同熒光波長(zhǎng)的熒光蛋白質(zhì)的編碼序列。圖11顯示嵌合底物蛋白質(zhì)RFP:PS(HIV-l):AtOEP7:GFP在圖9(b)中顯示的重組質(zhì)粒中的一種轉(zhuǎn)化的擬南芥屬原生質(zhì)體中表達(dá)后觀察到的熒光圖像.圖ll(a)、(b)和(c)分別是綠色熒光信號(hào)、紅色熒光信號(hào),和綠色和紅色熒光重疊信號(hào)的圖像。綠色熒光圖像中觀察到的微弱紅色熒光信號(hào)是葉綠體的自發(fā)熒光。圖12顯示HIV-1蛋白酶和嵌合底物蛋白質(zhì)RFP:PS(HIV-l):AtOEP7:GFP在圖9(a)和(b)顯示的重組基因轉(zhuǎn)化的擬南芥屬原生質(zhì)體中共表達(dá)后觀察到的熒光圖像。圖12(a)、(b)和(c)分別是綠色熒光信號(hào)、紅色熒光信號(hào),和綠色和紅色熒光重疊信號(hào)的圖像。綠色熒光圖像中觀察到的微弱紅色熒光信號(hào)是葉綠體的自發(fā)熒光。圖13(a)和(b)顯示嵌合底物蛋白質(zhì)H、ATPase:PS(NIa):GFP表達(dá)后觀察到的圖像。圖13(c)和(d)顯示NIa蛋白酶和嵌合底物蛋白質(zhì)H+-ATPase:PS(NIa):GFP共表達(dá)后觀察到的圖像。圖13(a)和(c)24是綠色熒光信號(hào)的圖像,圖13(b)和(d)是在亮視野下獲得的圖像。綠色熒光圖像中觀察到的紅色焚光是葉綠體的自發(fā)焚光。實(shí)施本發(fā)明的最佳模式如上所述,本發(fā)明提供檢測(cè)細(xì)胞或組織內(nèi)蛋白酶非常有用的系統(tǒng)。如果需要,該系統(tǒng)容易改變以適應(yīng)檢測(cè)一種以上的蛋白酶,優(yōu)選少于約3種蛋白酶,通常約1種蛋白酶。優(yōu)選地,該系統(tǒng)包括嵌合蛋白質(zhì),其包括共價(jià)連接成分1)至少一種可選地掩蔽信號(hào)蛋白質(zhì);2)至少一種蛋白酶特異的切割位點(diǎn);和3)至少一種可檢測(cè)的氨基酸序列。一般優(yōu)選的嵌合蛋白質(zhì)由少于約20種成分組成,更優(yōu)選少于約10種成分,對(duì)于大多數(shù)蛋白質(zhì)通常優(yōu)選約3種到約6種成分。本發(fā)明有廣譜重要的應(yīng)用,包括用于篩選以檢測(cè)在體內(nèi)降低或完全阻斷蛋白酶活性的候選化合物。根據(jù)本發(fā)明,"系統(tǒng)"包括一種或多種此處描述的嵌合分子及可向其添加的任何附加成分,例如可促進(jìn)上述分子可溶性和穩(wěn)定性的那些成分。實(shí)例包括但不限于血清蛋白質(zhì),例如牛血清白蛋白,緩沖液例如磷酸鹽緩沖液,或可接受的載體或穩(wěn)定劑。對(duì)可接受的載體、穩(wěn)定劑等的詳細(xì)論述,通常參見及e挑/ziiVig^"S尸/t"/7Mflcewrica/5"c/ewc^s,MackPub.Co.,Easton,PA,1980。本發(fā)明的典型的系統(tǒng)還會(huì)包括至少一種此處描述的核酸、載體、處理細(xì)胞或組織。在這種發(fā)明實(shí)施方案中,嵌合蛋白質(zhì)可作為有用的實(shí)驗(yàn)對(duì)照。優(yōu)選的系統(tǒng)包括大約1到10、優(yōu)選少于約5和更優(yōu)選約1種溶解在可接受的載體中嵌合蛋白質(zhì),所述載體例如水或緩沖鹽。優(yōu)選地,系統(tǒng)以無(wú)菌提供。短語(yǔ)"信號(hào)蛋白質(zhì),,意指多肽序列,其具有耙向亞細(xì)胞器的特異運(yùn)輸信號(hào)或與其在細(xì)胞中的定位相關(guān)的特殊性質(zhì),例如聚集體形成。優(yōu)選的信號(hào)蛋白質(zhì)可參見整個(gè)此處公開內(nèi)容,包括實(shí)施例部分。本發(fā)明優(yōu)選的嵌合蛋白質(zhì)包括通過重組的、化學(xué)的或其他適當(dāng)?shù)姆椒ü矁r(jià)連接到一起(即融合的)可選地掩蔽信號(hào)蛋白質(zhì)、蛋白酶特異的切割位點(diǎn)和可檢測(cè)的氨基酸序列。在大多數(shù)實(shí)施方案中,將優(yōu)選重組方法。雖然大多數(shù)發(fā)明實(shí)施方案通常不需要,但一種或多種成分可通過肽接頭序列在一個(gè)或幾個(gè)位點(diǎn)融合。具體的肽接頭序列會(huì)少于約30個(gè)氨基酸,更優(yōu)選少于約15個(gè)氨基酸,還更優(yōu)選約1個(gè)到約5個(gè)氨基酸。該肽序列可包括一種或多種病原體誘導(dǎo)的或宿主細(xì)胞誘導(dǎo)的蛋白酶切割位點(diǎn)??商娲?,肽接頭可用于協(xié)助嵌合蛋白質(zhì)構(gòu)建。特別優(yōu)選的嵌合蛋白質(zhì)可稱為"符合讀框的"融合分子。如上所述,只要蛋白質(zhì)有預(yù)期的功能,可幾乎以任何方式組織此處公開的嵌合蛋白質(zhì)成分。并如上所述,嵌合蛋白質(zhì)的每一成分可通過至少一種適當(dāng)?shù)碾慕宇^序列與另一成分隔開。例如,嵌合蛋白質(zhì)的任何一種成分均可包括該蛋白質(zhì)的N末端。另外,任何一種成分均可包括嵌合蛋白質(zhì)的C末端,該末端可包括另一成分,例如如下討論的純化標(biāo)簽序列。除另外指出外,對(duì)于氨基酸序列,短語(yǔ)"共價(jià)順序連接"代表,肽鍵以N到C的方向連接到一起。對(duì)于核苷酸序列,該短語(yǔ)意味著表示一個(gè)核苷酸與另一個(gè)以5'到3'的方向連接。作為該系統(tǒng)更具體的實(shí)例,嵌合蛋白質(zhì)包括共價(jià)順序連接的l)信號(hào)蛋白質(zhì);2)蛋白酶特異的切割位點(diǎn);和3)可檢測(cè)的氨基酸序列??商娲兀逗系鞍踪|(zhì)可包括共價(jià)順序連接的l)掩蔽序列;2)蛋白酶切割位點(diǎn);3)信號(hào)蛋白質(zhì);和4)可檢測(cè)的氨基酸序列。在另一實(shí)施方案中,根據(jù)系統(tǒng)特點(diǎn)使.用的嵌合蛋白質(zhì)共價(jià)順序連接的l)信號(hào)蛋白質(zhì);2)蛋白酶切割位點(diǎn);3)掩蔽序列;和4)可檢測(cè)的氨基酸序列。在嵌合蛋白質(zhì)需要一種以上信號(hào)蛋白質(zhì)的發(fā)明實(shí)施方案中,這樣的蛋白質(zhì)可包括共價(jià)順序連接的1)第一信號(hào)蛋白質(zhì);2)蛋白酵切割位點(diǎn);3)第二信號(hào)蛋白質(zhì);和4)可檢測(cè)的氨基酸序列。更具體的,這樣26的蛋白質(zhì)可包括共價(jià)順序連接1)第一信號(hào)蛋白質(zhì);2)第一蛋白酶切割位點(diǎn);3)掩蔽序列;4)第二信號(hào)蛋白質(zhì);和5)可檢測(cè)的氨基酸序列。在某些情況下,使系統(tǒng)中的嵌合蛋白質(zhì)包括一種以上的蛋白酶切割位點(diǎn)是有用的,例如l、2、3或4種。在這種情況下,嵌合蛋白質(zhì)可包括共價(jià)順序連接l)掩蔽序列;2)第一蛋白酶切割位點(diǎn);3)第一信號(hào)蛋白質(zhì);4)第二蛋白酶切割位點(diǎn);5)第二信號(hào)蛋白質(zhì);和6)可檢測(cè)的氨基酸序列??商娲兀逗系鞍踪|(zhì)可包括共價(jià)順序連接l)第一信號(hào)蛋白質(zhì);2)第一蛋白酶切割位點(diǎn);3)第二信號(hào)蛋白質(zhì);4)第二蛋白酶切割位點(diǎn);5)掩蔽序列;和6)可檢測(cè)的氨基酸序列。在另一發(fā)明實(shí)施方案中,嵌合蛋白質(zhì)包括共價(jià)順序連接l)蛋白酶特異切割位點(diǎn);2)信號(hào)蛋白質(zhì);和3)可檢測(cè)的氨基酸序列??商娲兀逗系鞍踪|(zhì)可包括共價(jià)順序連接l)第一信號(hào)蛋白質(zhì);2)第一可檢測(cè)序列;3)蛋白酶切割位點(diǎn);和4)第二可檢測(cè)序列。在這一發(fā)明實(shí)例中,蛋白質(zhì)還可包括共價(jià)連接在蛋白酶切割位點(diǎn)C末端和第二可檢測(cè)序列N末端之間的第二信號(hào)蛋白質(zhì)。本發(fā)明還進(jìn)一步提供嵌合蛋白質(zhì),其包括共價(jià)順序連接l)第一信號(hào)蛋白質(zhì);2)蛋白酶切割位點(diǎn);3)第二信號(hào)蛋白質(zhì);和4)第二可檢測(cè)序列??商娲?,嵌合蛋白質(zhì)可包括共價(jià)順序連接l)第一可檢測(cè)序列;2)蛋白酶切割位點(diǎn);3)信號(hào)蛋白質(zhì);和4)第二可檢測(cè)序列。使用適當(dāng)?shù)姆肿恿繕?biāo)記通過標(biāo)準(zhǔn)的SDSPAGE凝膠電泳確定,本發(fā)明更優(yōu)選的嵌合蛋白質(zhì)將具有小于約250kDa的分子大小,優(yōu)選小于約200kDa,更優(yōu)選的分子大小約25到約175kDa。"多肽"指優(yōu)選基本上由20種天然氨基酸的任何氨基酸組成的任何大小的任何聚合體。盡管術(shù)語(yǔ)"蛋白質(zhì)"經(jīng)常用于指相對(duì)大的蛋白質(zhì),而"肽,,27經(jīng)常用于指小的多肽,但本領(lǐng)域中這些術(shù)語(yǔ)的使用經(jīng)常重疊。除非另外指明,術(shù)語(yǔ)"多肽"通常指蛋白質(zhì)、多肽和肽。如此處所^使用,術(shù)語(yǔ)"細(xì)胞"包括任何原代細(xì)胞或永生化的細(xì)胞系,如組織或器官中任何這樣的細(xì)胞群。優(yōu)選的細(xì)胞包括那些如人源的哺乳動(dòng)物細(xì)胞、植物細(xì)胞、酵母、真菌和昆蟲細(xì)胞。根據(jù)本發(fā)明,"宿主細(xì)胞"可是感染細(xì)胞或其可是如此處所描述的可用于擴(kuò)增核酸或載體的細(xì)胞,例如大腸桿菌(E.coli)。應(yīng)當(dāng)理解,本發(fā)明的特殊用途會(huì)經(jīng)常要求特異的嵌合蛋白質(zhì)構(gòu)型。通過已確認(rèn)的參數(shù)指導(dǎo)特異嵌合蛋白質(zhì)成分或成分組的選擇,其中包括信號(hào)蛋白質(zhì)、蛋白酶特異切割位點(diǎn),和選擇的可檢測(cè)氨基酸序列、要監(jiān)測(cè)的蛋白酶,和應(yīng)用要求的敏感性或選擇性水平。舉例來說,本發(fā)明包括的實(shí)施方案,其中嵌合蛋白質(zhì)包括一種信號(hào)蛋白質(zhì)、一種可檢測(cè)序列和一種蛋白酶特異的切割位點(diǎn)。在這個(gè)實(shí)例中,包括與信號(hào)蛋白質(zhì)N或C末端連接的掩蔽序列經(jīng)常是有用的。即,對(duì)于一些發(fā)明用途,不希望掩蔽序列與可檢測(cè)序列連接。本發(fā)明其他特殊的用途一般會(huì)要求其他特異的嵌合蛋白質(zhì)構(gòu)型。例如,如果一種具體蛋白質(zhì)有一種信號(hào)蛋白質(zhì),和位于兩種可檢測(cè)氨基酸序列之間的一種蛋白酶特異切割位點(diǎn),經(jīng)常希望除去其中一種可檢測(cè)氨基酸序列以優(yōu)化系統(tǒng)。帶有多掩蔽序列會(huì)促進(jìn)本發(fā)明的其他用途,其中序列可是信號(hào)序列、可檢測(cè)的氨基酸序列或其他適當(dāng)?shù)男蛄校绲鞍酌柑禺惖那懈钗稽c(diǎn)。在這些實(shí)施方案中,具有一種或多種另外的掩蔽序列,例如蛋白酶切割位點(diǎn),對(duì)達(dá)到系統(tǒng)的最大應(yīng)用可能并不是必需的。然而在包括兩種不同信號(hào)蛋白質(zhì)、一種蛋白酶切割位點(diǎn)和兩種可檢測(cè)的氨基酸序列的實(shí)施方案中,其上的一種或兩種掩蔽序列是有用的。另外,特異的嵌合蛋白質(zhì)可能包括可移去的標(biāo)簽序列,其在一些實(shí)施方案中,可能協(xié)助嵌合蛋白質(zhì)的鑒定和/或純化。一個(gè)實(shí)例是6Xhis和MYC標(biāo)簽。其他適合的標(biāo)簽序列是本領(lǐng)域眾所周知的,如果需要可與本發(fā)明一起應(yīng)用。本發(fā)明的實(shí)施完全適合多種掩蔽或暴露的信號(hào)蛋白質(zhì)和其功能片段。優(yōu)選的實(shí)例通常足以將嵌合蛋白質(zhì)(或該蛋白質(zhì)的可檢測(cè)成分,例如可檢測(cè)序列)定位到細(xì)胞器或其他亞細(xì)胞區(qū)室。術(shù)語(yǔ)"區(qū)室"代表內(nèi)部限制空間,例如液泡、過氧化物酶體、線粒體等。優(yōu)選的植物信號(hào)蛋白質(zhì)定位嵌合蛋白質(zhì)或其至少一種成分到植物細(xì)胞的細(xì)胞核、高爾基體、溶解液泡、儲(chǔ)存液泡、過氧化物酶體、線粒體、內(nèi)質(zhì)網(wǎng)、質(zhì)膜,或葉綠體。更優(yōu)選的植物信號(hào)蛋白質(zhì)包括AtOEP7;RbcS;Cab;RA;SKL;Fl-ATPase;PH;FAPP;H+-ATPase;或其功能片段。優(yōu)選的動(dòng)物信號(hào)蛋白質(zhì)定位嵌合蛋白質(zhì)或其至少一種成分到動(dòng)物細(xì)胞的細(xì)胞核、高爾基體、儲(chǔ)存液泡、溶酶體、過氧化物酶體、內(nèi)質(zhì)網(wǎng)、質(zhì)膜或線粒體。實(shí)例包括人肽蛋氨酸亞砜還原酶(MSRA)、細(xì)胞色素b2、羥基類固醇脫氫酶(IIP-HSD)、G9-AKL、過氧化物酶整合膜蛋白質(zhì)47(PMP47);或其功能片段。參見以下優(yōu)選動(dòng)物信號(hào)蛋白質(zhì)序列的實(shí)施例。如上所述,本發(fā)明的實(shí)施適合使用動(dòng)物細(xì)胞有效的信號(hào)蛋白質(zhì)。一般實(shí)例包括,但不限于,下面表I中列出的動(dòng)物信號(hào)。表I<table>tableseeoriginaldocumentpage30</column></row><table>1.類型A:信號(hào)蛋白質(zhì)可用作掩蔽信號(hào)蛋白質(zhì)。類型B:信號(hào)蛋白質(zhì)可用作暴露信號(hào)蛋白質(zhì)。參見Hansel等人7^45^5/2002年6月;16:911-31(humanpeptidemethioninesulfoxidereductase;"MSRA");Bomeru等人(1997)/j5,WC7^w巡30439-30446(Cytochromeb2);Naray陽(yáng)Fejes-TothA和Fejes-TothG(1996)C7^附m15436-1544(ll卩-hydroxysteroiddehydrogenase(lip-HSD));McNewJA和GoodmanJM(1994)/CW/祝o/1221245-1257(G9-AKL);Dyer等人,(1996)/C>〃所o/269-280(PMP47(peroxisomalintegralmembraneprotein47))。當(dāng)此處用于描述信號(hào)蛋白質(zhì)時(shí),短語(yǔ)"功能片段",代表特定信號(hào)蛋白質(zhì)的片段,其能提供至少約70%、優(yōu)選高于約90%的全長(zhǎng)序列的穿梭功能。信號(hào)蛋白質(zhì)功能的檢測(cè)和定量方法是公知的,包括使用實(shí)施例部分描述的熒光成像技術(shù)定位和定量信號(hào)強(qiáng)度。顯而易見,本發(fā)明是靈活的并不限于使用任何特定的蛋白酶特異的切割位點(diǎn)。例如,切割位點(diǎn)可被哺乳動(dòng)物或病毒蛋白酶特異切割。術(shù)語(yǔ)"特異切割"是指蛋白酶特異切割位點(diǎn)中的肽鍵被受試蛋白酶特異斷裂(即,水解)。即,蛋白酶切割位點(diǎn)不被宿主細(xì)胞中天然存在的蛋白酶斷裂,包括通常稱為持家蛋白酶的那些。可用多種技術(shù)監(jiān)測(cè)那些蛋白酶切割位點(diǎn)的特異切割,包括SDS聚丙烯酰胺凝膠電泳方法。30優(yōu)選的蛋白酶切割位點(diǎn)是那些被人類病原體相關(guān)蛋白酶特異水解的位點(diǎn),例如,酵母、細(xì)菌、真菌、線蟲,病毒或原生動(dòng)物。更具體的實(shí)例包括巨細(xì)胞病毒(CMV);單純皰滲病毒(HSV);肝炎病毒,優(yōu)選甲型或丙型;瘧原蟲、人類免疫缺陷病毒(HIV)、卡波濟(jì)肉瘤相關(guān)皰滲病毒(KSHV)、黃熱病病毒、黃病毒、鼻病毒,或癥原蟲,例如惡性疾原蟲(P)、間日癡原蟲(Av/vox)、卵形癡原蟲(Eov"/e),或三日瘧原蟲(jRwWfln'fle)。一般地,癥原蟲導(dǎo)致癡疾或多種與癥疾相關(guān)的醫(yī)學(xué)并發(fā)癥。認(rèn)識(shí)到瘧原蟲天冬氨酸蛋白酶I和II(plasmepsinI和plasmepsinll)是相互聯(lián)系的。在HSV作為目標(biāo)的實(shí)施方案中,蛋白酶是HSV成熟蛋白酶。多種特定的HIV-1和HCV蛋白酶特異的切割位點(diǎn)已經(jīng)公開。參見例如,GIuzman,I.Y.等人,《/C7,"./"veW.,94:1602(1994);Grakoui,A.等人,Ww/.,67:2832(1993);Kolykholov,AA.等人,/o/Wfv/.,68:7525(1994);和Barrie,K.A.等人,腸/柳,219:407(1996),引用其內(nèi)容作為參考。另外的病原體特異的蛋白酶和特異切割位點(diǎn)已經(jīng)公開,并可根據(jù)本發(fā)明應(yīng)用。例如,HSV-1成熟蛋白酶和蛋白酶切割位點(diǎn)已經(jīng)公開。參見例如,Hall,M.R.T.和W.Gibson,W/wj,227:160(1997)。另外,已在惡性瘧原蟲消化液泡中發(fā)現(xiàn)了瘧原蟲天冬氨酸蛋白酶I和II。對(duì)應(yīng)的蛋白酶切割位點(diǎn)也已公開.參見例如,Moon,R.P.,jE^/;丄5iVc/^w,244:552(1997).本發(fā)明使用的其他蛋白酶切割位點(diǎn),被血液凝固、凋亡或細(xì)胞外基質(zhì)相關(guān)的哺乳動(dòng)物蛋白酶特異切割。參見下面的實(shí)施例和討論。本發(fā)明的實(shí)施適應(yīng)使用一種或組合的可檢測(cè)氨基酸序列,例如,那31些直接或間接熒光、磷光,發(fā)光或化學(xué)發(fā)光的序列。在使用兩種或更多這種可檢測(cè)序列的實(shí)施方案中,其中一種可檢測(cè)序列的發(fā)射波長(zhǎng)總是與至少另一種可檢測(cè)序列的發(fā)射波長(zhǎng)不同。例如,優(yōu)選的可檢測(cè)序列衍生自某些眾所周知的水母熒光蛋白質(zhì),包括那些已知在適當(dāng)激發(fā)條件下,發(fā)射綠、紅,和黃光的蛋白質(zhì)。如上所述,本發(fā)明還提供基本上純的嵌合蛋白質(zhì)。這種嵌合蛋白質(zhì)可通過公知技術(shù)的適當(dāng)組合分離和純化。如需要,這種蛋白質(zhì)可包括一種或多種此處所描述的純化標(biāo)簽。這些方法包括,例如,利用溶解性的方法,例如鹽沉淀和溶劑沉淀,利用分子量不同的方法,例如透析、超濾、凝膠過濾,和SDS聚丙烯酰胺凝膠電泳,利用電荷不同的方法,例如離子交換柱層析,利用特異親和性的方法,例如親和層析,利用疏水性不同的方法,例如反相高效液相色譜,和利用等電點(diǎn)不同的方法,例如等電聚焦電泳,金屬親和柱例如Ni-NTA。通常參見Sambrook等人,MolecularCloning:^Maw柳/,2nded.(1989);Ausubel等人,CV/fmi,/Vo似co/s/"Md/ecw/flr5t》/ogv,JohnWiley&Sons,NewYork(1989);和Ausubel等人,ShortiVCoco/s/"Afo/ecw/"r5,》,ogy,JohnWHey&Sons,NewYork(1999)與這些方法相關(guān)的內(nèi)容。優(yōu)選本發(fā)明的嵌合蛋白質(zhì)是基本上純的。即,嵌合蛋白質(zhì)已經(jīng)從其自然伴隨的細(xì)胞取代物中分離出來,以便嵌合蛋白質(zhì)優(yōu)選以至少80%或90%到95%的同質(zhì)性(WAV)存在。對(duì)于多數(shù)制藥、臨床和研究應(yīng)用,嵌合蛋白質(zhì)具有至少98到99%的同質(zhì)性(WAV)是最優(yōu)選的。一旦基本上純化,嵌合蛋白質(zhì)應(yīng)當(dāng)基本上沒有細(xì)胞培養(yǎng)和相關(guān)應(yīng)用的污染。一旦部分純化或達(dá)到基本純度,溶解的嵌合蛋白質(zhì)可用于治療,或進(jìn)行如此處所公開的體外或體內(nèi)試驗(yàn)?;炯兌瓤赏ㄟ^許多標(biāo)準(zhǔn)技術(shù)確定,例如色譜法和凝膠電泳。適當(dāng)?shù)乃拗骷?xì)胞可用于制備目的以增殖編碼目的嵌合蛋白質(zhì)的核酸。因此宿主細(xì)胞可包括欲在其中產(chǎn)生嵌合蛋白質(zhì)的原核、植物或真核細(xì)胞。因此宿主細(xì)胞尤其包括能增殖編碼嵌合蛋白質(zhì)的核酸的酵母、竭、蠕蟲、植物、蛙、哺乳動(dòng)物細(xì)胞,植物細(xì)胞和器官。可使用的哺乳動(dòng)物細(xì)胞系非限制性的實(shí)例包括CHOdhfl-細(xì)胞(Urlaub和Chasm,7VW/.爿c^/.Sdf/5^,77:4216(1980)),293細(xì)胞(Graham等人,/Ge".W/W.,36:59(1977)),骨髓瘤細(xì)胞,象SP2或NSO(Galfre和Milstein,胸A.f"矽挑o/.,73(B):3(1981)).其他適當(dāng)?shù)募?xì)胞公開在Sambrook等人,同上。能增殖編碼目的嵌合蛋白質(zhì)的核酸的宿主細(xì)胞,也包括非哺乳動(dòng)物真核細(xì)胞,包括昆蟲(例如,5^./n/^^n/fl)、酵母(例如,啤酒糖酵母(51."fw/s/"e)、粟酒裂殖糖酵母(5*./^/&)、巴斯德畢赤氏酵母(i戶"stom)、乳克魯維氏酵母()、多態(tài)絲狀單孢菌(i7./w/j;附or/;/m);如Fleer,R.所做的一般綜述Omw^0/w'附ow/"說》tecAwotogK,3(5):486496(1992)),真菌和植物細(xì)胞(例如,擬南芥屬和煙草屬(7V/c油7i/fl))。還包括使用某些原核細(xì)胞,例如大腸桿菌和芽胞桿菌(iflci7/ws)。編碼目的嵌合蛋白質(zhì)的核酸可通過轉(zhuǎn)染細(xì)胞的標(biāo)準(zhǔn)技術(shù)引入宿主細(xì)胞。術(shù)語(yǔ)"轉(zhuǎn)染,,包含將核酸引入宿主細(xì)胞的所有常規(guī)技術(shù),包括磷酸鈣共沉淀、DEAE葡聚糖介導(dǎo)的轉(zhuǎn)染、脂質(zhì)轉(zhuǎn)染、電穿孔、顯微注射,病毒轉(zhuǎn)導(dǎo)和/或整合。適當(dāng)?shù)霓D(zhuǎn)染宿主細(xì)胞的方法可見Sambrook等人(見上文)和其他實(shí)驗(yàn)室教科書。本發(fā)明還提供分離目的嵌合蛋白質(zhì)的制備方法。在該方法中,宿主細(xì)胞(例如,酵母、真菌、昆蟲,細(xì)菌或動(dòng)物細(xì)胞),其中已經(jīng)引入與調(diào)控序列有效連接的編碼目的蛋白質(zhì)的核酸,在嵌合蛋白質(zhì)存在下于生產(chǎn)規(guī)模的培養(yǎng)基中生長(zhǎng)以刺激編碼目的嵌合蛋白質(zhì)的核苷酸序列轉(zhuǎn)錄。然后,從收獲的宿主細(xì)胞或從培養(yǎng)基中分離目的嵌合蛋白質(zhì)??墒褂脴?biāo)準(zhǔn)的蛋白質(zhì)純化技術(shù)從培養(yǎng)基或從收獲的細(xì)胞中分離目的蛋白質(zhì)。具體地,33從許多種器具,包括滾瓶、旋轉(zhuǎn)燒瓶、組織培養(yǎng)皿、生物反應(yīng)器,或發(fā)酵罐中,可使用純化技術(shù)大規(guī)模(即,至少毫克量)表達(dá)和純化目的嵌合蛋白質(zhì)。因此本發(fā)明還提供編碼嵌合底物蛋白質(zhì)的核酸序列。編碼嵌合底物蛋白質(zhì)的核酸可用于轉(zhuǎn)化細(xì)胞以在細(xì)胞中表達(dá)嵌合底物蛋白質(zhì)。為轉(zhuǎn)化細(xì)胞,重組基因必需包括啟動(dòng)子和其他與嵌合底物蛋白質(zhì)編碼區(qū)可操作連接的調(diào)控核酸序列。通過已知的參數(shù)指導(dǎo)啟動(dòng)子的選擇,一般是宿主細(xì)胞的選擇。如上所述,本發(fā)明還提供核酸序列,尤其是編碼本發(fā)明嵌合蛋白質(zhì)的DNA序列。優(yōu)選地,DNA序列由適合染色體外復(fù)制的栽體攜帶,例如噬菌體、病毒、質(zhì)粒、噬菌粒、祐粒、YAC,或附加體。特別地,編碼目的嵌合蛋白質(zhì)的DNA載體可用于促進(jìn)此處描述的制備方法和獲得大量嵌合蛋白質(zhì)。DNA序列可插入適當(dāng)?shù)谋磉_(dá)載體,即,含有插入蛋白質(zhì)編碼序列轉(zhuǎn)錄和翻譯必需元件的載體。多種宿主載體系統(tǒng)可用于表達(dá)蛋白質(zhì)編碼序列。這些包括病毒(例如,痘苗病毒、腺病毒等)感染的哺乳動(dòng)物細(xì)胞系統(tǒng);病毒(例如,桿狀病毒)感染的昆蟲細(xì)胞系統(tǒng);微生物,例如含有酵母載體的酵母,或用噬菌體DNA、質(zhì)粒DNA或粘粒DNA轉(zhuǎn)化的細(xì)菌。根據(jù)使用的宿主載體系統(tǒng),可使用大量適當(dāng)?shù)霓D(zhuǎn)錄和翻譯成分中的任何一個(gè)。通常參見Sambrook等人,見上文和Ausubel等人,見上文。大體上,根據(jù)本發(fā)明,優(yōu)選的DNA載體包括磷酸二酯鍵連接的核普酸序列,其包括,以5'到3'的方向,第一克隆位點(diǎn),用于引入編碼此處所描述的嵌合蛋白質(zhì)的第一核苷酸序列。如果需要,蛋白質(zhì)可與編碼一種或多種適當(dāng)標(biāo)簽序列的DNA連接。圖7(a)-(j);8(a)-(b);和9(a)-(c)提供這種栽體的實(shí)例。在一些發(fā)明實(shí)施方案中,優(yōu)選以"盒,,的形式提供DNA載體編碼的嵌合蛋白質(zhì)。術(shù)語(yǔ)"盒"意思是編碼的蛋白質(zhì)(或其成分)易于通過標(biāo)準(zhǔn)的重組方法用另一成分取代。特別地,當(dāng)用一種蛋白酶特異的切割位點(diǎn)或可檢測(cè)的氨基酸序列與另一種"交換,,時(shí),以盒的形式裝配的DNA載體是特別需要的。參見圖7(a)-(j);8(a)-(b);和9(a)-(c),其中核心載體用于表達(dá)多種嵌合蛋白質(zhì)。更具體地,預(yù)見在一些實(shí)例中,某些病原體血清型,尤其是病毒抹,可與個(gè)別該血清型或病毒抹特異的蛋白酶切割位點(diǎn)相關(guān)。關(guān)于這一點(diǎn),藥物抗性HIV血清型的出現(xiàn)尤其成問題。在這種情況下,形式為盒的DNA載體中一種或多種存在的蛋白酶切割位點(diǎn)可用其他所需的預(yù)定的蛋白酶切割位點(diǎn)替換。具體的蛋白酶切割位點(diǎn)可根據(jù)特定病人中存在的病原體選擇。值得注意的是,本發(fā)明可作為顯示受試細(xì)胞或組織中蛋白酶活性變化的有效"警告系統(tǒng)"。例如,在PCR或雜交實(shí)驗(yàn)已經(jīng)表明編碼病原體相關(guān)蛋白酶的基因組DNA存在的情況下,使用本發(fā)明可檢測(cè)細(xì)胞或組織中活性蛋白酶的存在。本發(fā)明的這個(gè)特點(diǎn)在多種情況下是有用的,包括已知或懷疑病原體污染的細(xì)胞培養(yǎng)。如上所述,本發(fā)明可用于檢測(cè)目的宿主細(xì)胞或組織中一種或多種蛋白酶的存在。對(duì)于檢測(cè)和分析蛋白酶抑制劑分子,此處描述的方法和組分尤其有用,如上所述,其中蛋白酶抑制劑分子可天然存在或是這種分子庫(kù)(即,化學(xué)文庫(kù))的一部分。A.使用本發(fā)明篩選候選蛋白酶抑制劑1.一般論述除本發(fā)明描述的實(shí)施例中使用的植物原生質(zhì)體外,根椐本發(fā)明,帶細(xì)胞壁的正常植物細(xì)胞或人、動(dòng)物,或昆蟲細(xì)胞也可用于篩選蛋白酶抑制劑。因?yàn)楦菀邹D(zhuǎn)化和培養(yǎng)及由于原生質(zhì)體規(guī)則的球形也方便蛋白質(zhì)定位的鑒定,因此經(jīng)常優(yōu)選植物細(xì)胞。然而,其他細(xì)胞和組織也是有用的,例如,目的蛋白酶不能以活性形式在植物細(xì)胞中表達(dá)時(shí)。例如,這種蛋白酶難以表達(dá)可能由于不適當(dāng)?shù)姆g后修飾。如果這個(gè)問題出現(xiàn),可使用適當(dāng)?shù)膭?dòng)物或昆蟲細(xì)胞解決它。在這種情況下,必需使用在所選細(xì)胞中有效的信號(hào)蛋白質(zhì)。例如,如果人、動(dòng)物,或昆蟲細(xì)胞用于篩選,就不能使用葉綠體耙向的信號(hào)蛋白質(zhì),例如AtOEP7、RbcS、Cab和RA,因?yàn)槿~綠體在這些細(xì)胞中不存在。對(duì)于人、動(dòng)物,或昆蟲細(xì)胞,可使用靶向到其他亞細(xì)胞器的信號(hào)蛋白質(zhì),例如線粒體、過氧化物酶體、質(zhì)膜等。另外,必需根據(jù)使用的細(xì)胞正確選擇包含啟動(dòng)子和其他調(diào)控元件的載體系統(tǒng)。對(duì)于本發(fā)明的蛋白酶抑制劑的體內(nèi)篩選,制備可表達(dá)目的蛋白酶和該蛋白酶特異的嵌合底物蛋白質(zhì)的轉(zhuǎn)化細(xì)胞。制備轉(zhuǎn)化細(xì)胞最優(yōu)選的方法是,用本發(fā)明提供的編碼蛋白酶的重組質(zhì)粒和編碼嵌合底物蛋白質(zhì)的重組質(zhì)粒共轉(zhuǎn)化細(xì)胞。如果蛋白酶是病毒蛋白酶,還可使用病毒感染在轉(zhuǎn)化細(xì)胞中表達(dá)蛋白酶。多種植物、動(dòng)物、酵母、真菌和昆蟲細(xì)胞的轉(zhuǎn)化方法已經(jīng)建立。例如,通過引入重組質(zhì)粒轉(zhuǎn)化細(xì)胞的方法包括,但不限于,使用PEG(聚乙二醇)、磷酸鉀,或DEAE葡聚糖的化學(xué)介導(dǎo)方法,陽(yáng)離子脂質(zhì)介導(dǎo)的脂質(zhì)轉(zhuǎn)染、顯微注射、電穿孔、電融合,和DNA轟擊。根據(jù)使用的細(xì)胞類型,必需選擇適當(dāng)?shù)霓D(zhuǎn)化方法并需要優(yōu)化條件以達(dá)到有效轉(zhuǎn)化。如果使用植物細(xì)胞的原生質(zhì)體,例如擬南芥屬或煙草原生質(zhì)體,實(shí)施例l(c)中描述的PEG介導(dǎo)的轉(zhuǎn)化方法是優(yōu)選的方法。實(shí)施例l(c)中給出的條件對(duì)于擬南芥原生質(zhì)體進(jìn)行優(yōu)化。如果使用帶細(xì)胞壁的正常植物細(xì)胞,可根據(jù)植物細(xì)胞類型使用基因槍DNA轟擊或PEG介導(dǎo)的轉(zhuǎn)化方法。對(duì)于人、動(dòng)物,或昆蟲細(xì)胞,可使用磷酸鉀介導(dǎo)或DEAE葡聚糖介導(dǎo)的轉(zhuǎn)染方法或陽(yáng)離子脂質(zhì)介導(dǎo)的脂質(zhì)轉(zhuǎn)染方法轉(zhuǎn)化細(xì)胞。為篩選蛋白酶抑制劑,在表達(dá)蛋白酶和嵌合底物蛋白質(zhì)時(shí),轉(zhuǎn)化細(xì)胞需要與候選化合物接觸。一般地,候選化合物加入包含轉(zhuǎn)化細(xì)胞的溶液,并將產(chǎn)生的溶液在適當(dāng)?shù)臏囟葷裼?。候選抑制劑可以選自化合物、肽、化合物或肽的混合物、和天然產(chǎn)物的提取物。根據(jù)細(xì)胞類型和溫育溫度,可改變表達(dá)蛋白質(zhì)的溫育時(shí)間。它可為約1小時(shí)到幾天。對(duì)于擬南芥屬原生質(zhì)體,根據(jù)溫育條件,溫育時(shí)間可短至4小時(shí)和長(zhǎng)至約1周。當(dāng)擬南芥屬原生質(zhì)體在22X:于W5溶液中溫育時(shí),優(yōu)選的溫育時(shí)間是12到48小時(shí)??梢詸z測(cè)的候選抑制劑濃度為約0.1到100ng/ml。在一般篩選中,可使用的濃度為約1到幾個(gè)pg/ml。在大量候選化合物需要篩選的情況下,在第一輪篩選中可使用約5-30種候選抑制劑的混合物。根據(jù)本發(fā)明,可篩選幾乎任何化合物或化合物組的抗蛋白酶活性。實(shí)例包括,但不限于,細(xì)胞因子、胂瘤抑制因子、抗體、受體、突變蛋白質(zhì)、這種蛋白質(zhì)的片段或部分,和活性RNA分子,例如,反義RNA分子或核酶。用于篩選的優(yōu)選化合物是合成或半合成藥物(有時(shí)指"小分子")。例如,通過本方法容易檢測(cè)已知人類病毒病原體抑制劑的衍生物庫(kù)。參見例如,美國(guó)專利6,420,438;6,329,525;6,287,840;6,147,188;和6,046,1卯(其公開了多種可檢測(cè)的分子和其書f生物)??墒褂帽景l(fā)明篩選另外的化合物。參見Pillay等人(1995)及ev.AfW.Wro/.(公開了多種潛在的病毒蛋白酶抑制劑化合物);和Wei等人(1995)A^"",373:117(公開了印地那韋、ABT-538);Ho等人(1992)Ann.Intern.Med.113:111(公開了抗皰滲劑)。另外,根據(jù)本發(fā)明,可篩選上述特異化合物的衍生物,包括但不限于,沙奎那韋(saquinavir)和其衍生物。為筌定候選化合物對(duì)蛋白酶活性的抑制,優(yōu)選監(jiān)測(cè)轉(zhuǎn)化細(xì)胞作為時(shí)間函數(shù)的熒光圖像。根據(jù)細(xì)胞條件表達(dá)時(shí)間可能改變,因此可能在不同時(shí)間出現(xiàn)蛋白水解活性或抑制。如果擬南芥屬原生質(zhì)體是要用的細(xì)胞,監(jiān)測(cè)熒光圖像的優(yōu)選時(shí)間順序是在表達(dá)開始后的12、18、24、36,和48小時(shí)。如果嵌合底物蛋白質(zhì)有兩種或多種不同的熒光標(biāo)記,優(yōu)選在兩種或多種熒光標(biāo)記特異的熒光波長(zhǎng)上監(jiān)測(cè)熒光圖像。因?yàn)槠淇煞奖銇喖?xì)胞器的鑒定,因此優(yōu)選監(jiān)測(cè)亮視野圖像。為方便蛋白酶抑制劑的鑒定,為了比較,還優(yōu)選監(jiān)測(cè)未與候選抑制劑接觸的轉(zhuǎn)化細(xì)胞的熒光圖像。裝備有多色熒光濾光片裝置的標(biāo)準(zhǔn)熒光顯微鏡,例如ZeissAxiopian熒光顯微鏡或NikonE800熒光顯微鏡,可以200x、400x,或600x的放大倍數(shù)用于監(jiān)測(cè)熒光圖像。掃描聚焦顯微鏡可用于獲得更高分辨率的圖像.顯而易見,本發(fā)明適合廣譜嵌合底物蛋白質(zhì)的構(gòu)建和應(yīng)用。例如,參見實(shí)施例1。2.NIa蛋白酶的應(yīng)用說明為使用如上所述構(gòu)建的嵌合底物蛋白質(zhì)檢測(cè)蛋白酶活性,在本發(fā)明實(shí)施例中使用煙草葉脈色斑病毒(veinmottlingvirus)(TVMV)NIa蛋白酶作為模型系統(tǒng)。NIa蛋白酶是定性最好的病毒蛋白酵之一,并已知其切割TVMV產(chǎn)生的聚蛋白的七個(gè)特異位點(diǎn)。為達(dá)到最佳的蛋白酶活性,需要N末端的六個(gè)氨基酸殘基(P6-P1)和C末端的四個(gè)氨基酸殘基(P1,_P4,),并必需包括底物蛋白質(zhì)P4-P1位的四個(gè)保守氨基酸殘基(V-R-F-Q)。.如果四個(gè)保守氨基酸殘基的任何一個(gè)突變成甘氨酸(Gly),底物蛋白質(zhì)的蛋白酶剪切就不能發(fā)生(Yoon,H.Y.等人,2000)。當(dāng)表達(dá)嵌合底物蛋白質(zhì)(包含NIa蛋白酶蛋白水解位點(diǎn)(PS(NIa))的RFP:PS(NIa):AtOEP7:GFP)的重組基因通過聚乙二醇介導(dǎo)的轉(zhuǎn)化方法引入原生質(zhì)體時(shí),GFP和RFP在胞質(zhì)溶膠中積聚成大的聚集似圖4)。這種結(jié)果對(duì)應(yīng)于蛋白酶沒有作用的情況。在這種情況下,懷疑胞質(zhì)溶膠中聚集體的積聚是AtOEP7蛋白質(zhì)疏水區(qū)中疏水相互作用的結(jié)果。如果嵌合底物蛋白質(zhì)的紅色熒光不易與葉綠體的自發(fā)熒光區(qū)別時(shí)(圖4(b)),可通過使用兩種不同的熒光標(biāo)記,并觀察重疊熒光圖像(圖4(c))中綠色熒光和紅色熒光是否相合,而清楚地測(cè)定底物反應(yīng)。當(dāng)編碼Nla蛋白酶的質(zhì)粒和編碼RFP:PS(NIa):AtOEP7:GFP的質(zhì)粒在轉(zhuǎn)化中一起引入時(shí),綠色和紅色熒光信號(hào)被分別分離到葉綠體外包膜和胞質(zhì)溶膠中(圖5)。這種結(jié)果說明NIa蛋白酶成功地切割了嵌合底物蛋白質(zhì)的蛋白水解位點(diǎn)以產(chǎn)生兩種蛋白質(zhì),RTP和AtOEP7:GFP。通過觀察由于信號(hào)蛋白質(zhì)的作用,綠色熒光信號(hào)易位到葉綠體外包膜(圖5(a))、紅色熒光信號(hào)在胞質(zhì)溶膠中彌散(圖5(b)),和兩種熒光信號(hào)的重疊圖像(圖5(c)),可鑒定蛋白酶反應(yīng)。通過與對(duì)照實(shí)驗(yàn)對(duì)比,可更清楚地看到本發(fā)明鑒定酶反應(yīng)結(jié)果的效率。比較圖4(a)和5(a),可觀察到蛋白酶剪切使信號(hào)蛋白質(zhì)的掩蔽運(yùn)輸信號(hào)活化,引起熒光分布的改變。比較圖4(b)和5(b),可觀察到,紅色熒光蛋白質(zhì)用作信號(hào)掩蔽蛋白質(zhì)除掩蔽運(yùn)輸信號(hào)外,還在改變熒光信號(hào)的分布中發(fā)揮作用。因此建議,嵌合底物蛋白質(zhì),其包括帶信號(hào)蛋白質(zhì)和熒光蛋白質(zhì)的嵌合蛋白質(zhì)和帶蛋白水解位點(diǎn)的信號(hào)掩蔽蛋白質(zhì),可用作底物以確定蛋白酶活性及體內(nèi)篩選其抑制劑。3.高通量篩選方法總體考慮本發(fā)明提供的體內(nèi)蛋白酶抑制劑篩選方法容易適用于高通量試驗(yàn)。高通量篩選方法,包括表達(dá)蛋白酶和其嵌合底物蛋白質(zhì)的轉(zhuǎn)化細(xì)胞與候選化合物接觸、溫育轉(zhuǎn)化細(xì)胞、獲得轉(zhuǎn)化細(xì)胞的熒光圖像、將熒光圖像轉(zhuǎn)換成數(shù)字?jǐn)?shù)據(jù),并分析數(shù)字?jǐn)?shù)據(jù)以確定候選化合物是否抑制了蛋白酶.在本發(fā)明的高通量篩選中,等量的轉(zhuǎn)化細(xì)胞溶液加入96或384孔微量滴定板的陣列孔中,并且每個(gè)孔中加入不同的候選化合物。然后在控制環(huán)境中(適宜的溫度、濕度,和空氣構(gòu)成)溫育微量滴定板中的轉(zhuǎn)化細(xì)胞以表達(dá)蛋白酶和其嵌合底物蛋白質(zhì)。在預(yù)選溫育時(shí)間后,用萸光顯39微鏡獲得每孔轉(zhuǎn)化細(xì)胞的熒光圖像。高通量篩選裝置由以下部分組成(1)多個(gè)微量滴定板中轉(zhuǎn)化細(xì)胞樣品陣列的培養(yǎng)箱、(2)自動(dòng)采樣器、(3)裝備XY平移樣品平臺(tái)(XY-translationsamplestage)和高分辨數(shù)字照相機(jī)的自動(dòng)焚光顯微鏡。在預(yù)選溫育時(shí)間后,自動(dòng)采樣器從每孔中取樣一小部分轉(zhuǎn)化細(xì)胞溶液并置于觀察片上,例如載物玻片.采樣可使用多吸頭(tip)或吸管以平行方式或使用單吸頭或吸管以連續(xù)方式進(jìn)行。在每次采樣后,吸頭或吸管要用適當(dāng)?shù)南匆合礈?。轉(zhuǎn)化細(xì)胞樣品在預(yù)選位置以陣列的形式置于觀察片上。XY平移平臺(tái)在XY方向上固定和移動(dòng)觀察片以在顯微鏡物鏡下定位每個(gè)樣品。Z軸聚焦驅(qū)動(dòng)器(focusdrive)在Z方向上移動(dòng)顯微鏡物鏡或觀察片以聚焦。對(duì)于每個(gè)樣品,使用數(shù)字照相機(jī)在預(yù)選熒光波長(zhǎng)上捕獲熒光圖像,輸入個(gè)人計(jì)算機(jī),并作為數(shù)字?jǐn)?shù)據(jù)保存。裝備自動(dòng)控制器以控制吸管采樣器、XY平移平臺(tái)和Z聚焦驅(qū)動(dòng)器。個(gè)人計(jì)算機(jī)提供顯示器和數(shù)據(jù)分析軟件。通過檢測(cè)亞細(xì)胞熒光分布可自動(dòng)確定蛋白酶抑制劑。一般地,可從數(shù)字圖像數(shù)據(jù)中計(jì)算觀察細(xì)胞范圍內(nèi)熒光信號(hào)集中或分散的程度,并用作判斷的標(biāo)準(zhǔn)。某些情況下,熒光信號(hào)分布的方式或形狀可用作判斷的標(biāo)準(zhǔn).適合本發(fā)明使用的高通量篩選實(shí)驗(yàn)方案的實(shí)例已經(jīng)公開在美國(guó)專利號(hào)5,989,835和PCT申請(qǐng)WO00/79241A2中。下述表2和3提供本發(fā)明使用的序列信息表2<table>tableseeoriginaldocumentpage41</column></row><table>47-50)、HIV-1蛋白酶(SEQIDNO:55和56)和其切割位點(diǎn)(SEQIDNO:57-74)、HCVNS3蛋白酶(SEQIDNO:77和78)和其切割位點(diǎn)(SEQIDNO:79-84)、HSV-1蛋白酶(SEQIDNO:85和86)和其切割位點(diǎn)(SEQIDNO:87-90)、HTLV-1蛋白酶(SEQIDNO:91和92)和其切割位點(diǎn)(SEQIDNO:93-96)、HCMV蛋白酶(SEQIDNO:97和98)和其切割位點(diǎn)(SEQIDNO:99-102)、APP|3-分泌酶(SEQIDNO:103和104)和其切割位點(diǎn)(SEQIDNO:105和106)、天冬氨酸特異性半胱氨酸蛋白酶(caspase)3(SEQIDNO:107和108)和其切割位點(diǎn)(SEQIDNO:113和114)、天冬氨酸特異性半胱氨酸蛋白酶3大亞單位(SEQIDNO:109和110)、天冬氨酸特異性半胱氨酸蛋白酶3小亞單位(SEQIDNO:111和112)、人凝血因子II(SEQIDNO:115和116)和其切割位點(diǎn)(SEQIDNO:117和118),和人凝血因子XI(SEQIDNO:119和120)。兩種NIa蛋白酶底物蛋白質(zhì)的核酸和蛋白質(zhì)序列提供在SEQIDNO:51-54,HIV-1蛋白酶底物蛋白質(zhì)的那些序列提供在SEQIDNO:55和56。下面的論述涉及韓國(guó)申請(qǐng)No.10-2001-0048123,其中公開了本發(fā)明另外的用途和優(yōu)點(diǎn)。如其中所提供,本發(fā)明提供可用于篩選體內(nèi)蛋白酶抑制劑的重要嵌合底物蛋白質(zhì)。如其中特別公開的,本發(fā)明涉及篩選蛋白酶抑制劑的系統(tǒng)并且其提供(i)通過蛋白酶的特異功能引起熒光亞細(xì)胞定位和分布改變的構(gòu)建的嵌合底物蛋白質(zhì)、(ii)包含編碼嵌合底物蛋白質(zhì)核酸序列的重組基因,其可用于在細(xì)胞中表達(dá)嵌合底物蛋白質(zhì)、(Hi)在蛋白酶和嵌合底物蛋白質(zhì)一起出現(xiàn)在一個(gè)細(xì)胞中,以便通過蛋白酶的蛋白酶剪切可在細(xì)胞中發(fā)生的情況下,通過檢測(cè)熒光的亞細(xì)胞定位和分布鑒定蛋白酶活性的方法,和(iv)使用嵌合底物蛋白質(zhì)和上述方法體內(nèi)篩選蛋白酶抑制劑的方法。更具體地,韓國(guó)申請(qǐng)No.10-2001-0048123公開了這種嵌合底物蛋白質(zhì)可用在細(xì)胞中,其中當(dāng)信號(hào)蛋白質(zhì)在細(xì)胞中表達(dá)時(shí),其可指導(dǎo)向亞細(xì)胞器的運(yùn)輸。更詳細(xì)地,指向特定亞細(xì)胞器的運(yùn)輸信號(hào)(包括在信號(hào)蛋白質(zhì)中),可通過在信號(hào)蛋白質(zhì)的N或C末端連接信號(hào)掩蔽蛋白質(zhì)而失活。在本發(fā)明中,信號(hào)蛋白質(zhì)與帶蛋白酶的蛋白酶剪切位點(diǎn)的信號(hào)掩蔽蛋白質(zhì)連接,以便根據(jù)蛋白水解位點(diǎn)的切割活化或失活信號(hào)蛋白質(zhì)的運(yùn)輸。換言之,嵌合底物蛋白質(zhì)的運(yùn)輸(其中用蛋白水解位點(diǎn)連接信號(hào)蛋白質(zhì)和信號(hào)掩蔽蛋白質(zhì))直到信號(hào)掩蔽蛋白質(zhì)被蛋白酶切掉時(shí)才發(fā)生。這種切割誘導(dǎo)信號(hào)蛋白質(zhì)的正常運(yùn)輸。在本發(fā)明中,用熒光蛋白質(zhì)標(biāo)記信號(hào)蛋白質(zhì)和/或信號(hào)掩蔽蛋白質(zhì),以便可通過檢測(cè)熒光信號(hào)定位和分布特征的變化確定蛋白酶活性。因此,在本發(fā)明中用作蛋白酶底物的嵌合蛋白質(zhì)有以下特點(diǎn)(1)嵌合底物蛋白質(zhì)包括至少一種信號(hào)蛋白質(zhì),其具有指導(dǎo)向特定亞細(xì)胞器轉(zhuǎn)運(yùn)的運(yùn)輸信號(hào)。(2)嵌合底物蛋白質(zhì)包括至少一種特定蛋白酶的蛋白酶剪切位點(diǎn)。(3)通過蛋白酶剪切位點(diǎn)與信號(hào)蛋白質(zhì)的連接,或通過蛋白酶剪切位點(diǎn)將信號(hào)掩蔽蛋白質(zhì)與信號(hào)蛋白質(zhì)連接,可失活(l)中闡明的信號(hào)蛋白質(zhì)的運(yùn)輸信號(hào)。(4)當(dāng)?shù)鞍酌冈诘鞍姿馕稽c(diǎn)上的切割時(shí),可活化信號(hào)蛋白質(zhì)的失活的運(yùn)輸信號(hào)。(5)至少用一種熒光蛋白質(zhì)標(biāo)記嵌合底物蛋白質(zhì),來自細(xì)胞的熒光信號(hào)隨蛋白酵的蛋白酶剪切而變化。如韓國(guó)申請(qǐng)No.10-2001-0048123中所述,本發(fā)明還提供使用此處描述的嵌合底物蛋白質(zhì)體內(nèi)檢測(cè)蛋白酶活性的方法。還提供使用蛋白酶活性檢測(cè)方法篩選蛋白酶抑制劑的方法。如韓國(guó)申請(qǐng)No.10-2001-0048123中進(jìn)一步公開的那樣,為體內(nèi)檢測(cè)蛋白酶活性,蛋白酶和蛋白酶特異的嵌合底物蛋白質(zhì)必需共存在一個(gè)細(xì)胞中。另外,根據(jù)一個(gè)發(fā)明方面,在細(xì)胞中引入嵌合底物蛋白質(zhì)的重組基因以在細(xì)胞中表達(dá)嵌合底物蛋白質(zhì)。篩選蛋白酶抑制劑的靶蛋白酶可以是存在于細(xì)胞中的內(nèi)源性蛋白酶,或通過重組基因轉(zhuǎn)化或病毒感染表達(dá)的外源性蛋白酶。然而,當(dāng)內(nèi)源性蛋白酶是靶標(biāo)時(shí),例如,由于蛋白酶表達(dá)調(diào)節(jié)及低水平蛋白酶表達(dá)下的檢測(cè)困難,可降低篩選的精度和效率。因此,本發(fā)明提供測(cè)定體內(nèi)蛋白酶活性效率更高的系統(tǒng),其中可通過用重組基因轉(zhuǎn)化細(xì)胞或用病毒感染細(xì)胞以調(diào)節(jié)方式過表達(dá)或表達(dá)特定的蛋白酶。對(duì)于病毒蛋白酶可使用病毒感染。然而,由于不完全明白病毒蛋白酶的表達(dá)調(diào)節(jié),因此更優(yōu)選使用通過編碼蛋白酶的重組基因轉(zhuǎn)化細(xì)胞表達(dá)的蛋白酶。因?yàn)楸磉_(dá)的蛋白酶定位在胞質(zhì)溶膠中,所以需要使嵌合底物蛋白質(zhì)也定位在胞質(zhì)溶膠中。因此,根據(jù)本發(fā)明的第一部分,可通過使用嵌合底物蛋白質(zhì)構(gòu)建有效檢測(cè)體內(nèi)蛋白酵活性的系統(tǒng),其中包括在嵌合底物蛋白質(zhì)中的信號(hào)蛋白質(zhì)的運(yùn)輸信號(hào)被掩蔽。另外,可通過檢測(cè)熒光信號(hào)定位和分布的變化選擇蛋白酶抑制劑,這種變化是通過在蛋白酶和其嵌合底物蛋白質(zhì)在細(xì)胞中表達(dá)之前、之后,或同時(shí),用候選化合物處理細(xì)胞引起。在許多酶促反應(yīng)中,反應(yīng)物不能完全轉(zhuǎn)化成產(chǎn)物。在反應(yīng)被抑制劑抑制的情況下,其也可被部分抑制而非完全抑制。而且,當(dāng)觀察多細(xì)胞時(shí),每個(gè)細(xì)胞中的蛋白酶活性水平可相當(dāng)大地改變。因此,如果用于測(cè)定蛋白酶活性的方法具有低靈敏度或低對(duì)比度,可能在測(cè)定蛋白酶抑制劑的抑制活性上有相當(dāng)大地錯(cuò)讀(ambiguity)。為避免這種錯(cuò)讀,在嵌合底物蛋白質(zhì)的構(gòu)建中,選擇可因?yàn)榈鞍酌讣羟卸馃晒庑盘?hào)細(xì)胞定位44和分布可清楚辨別變化的信號(hào)蛋白質(zhì)是重要的。另外,通過使用兩種或多種不同熒光波長(zhǎng)的熒光蛋白質(zhì)可增加測(cè)定抑制活性的效率。在本發(fā)明的實(shí)施例2中,在嵌合底物蛋白質(zhì)的構(gòu)建中使用了GFP和RFP,以便它們可根據(jù)蛋白酶剪切定位在不同的亞細(xì)胞器中。如上所述,根據(jù)本發(fā)明某些信號(hào)蛋白質(zhì)是可選地掩蔽的。在這個(gè)實(shí)施方案中,由于與信號(hào)蛋白質(zhì)連接的蛋白水解位點(diǎn)或信號(hào)掩蔽蛋白質(zhì)的信號(hào)掩蔽,本發(fā)明提供的包括在嵌合底物蛋白質(zhì)中的信號(hào)蛋白質(zhì)是失活的,因此嵌合底物蛋白質(zhì)存在于胞質(zhì)溶膠中。蛋白酶剪切可活化信號(hào)蛋白質(zhì)以指導(dǎo)其運(yùn)輸?shù)絹喖?xì)胞器。在選擇運(yùn)輸信號(hào)在嵌合底物蛋白質(zhì)中失活的信號(hào)蛋白質(zhì)時(shí),需要考慮信號(hào)蛋白質(zhì)的不同性質(zhì)。內(nèi)體運(yùn)輸?shù)鞍踪|(zhì)在它們剛一合成時(shí)就包封在內(nèi)質(zhì)網(wǎng)中轉(zhuǎn)運(yùn)到高爾基體、溶解液泡、儲(chǔ)存液泡,或細(xì)胞膜中。內(nèi)體運(yùn)輸?shù)鞍踪|(zhì)的運(yùn)輸信號(hào)在翻譯過程中被識(shí)別。因此,不可能通過簡(jiǎn)單地連接和切掉有或沒有信號(hào)掩蔽蛋白質(zhì)的蛋白水解位點(diǎn),失活和活化內(nèi)體運(yùn)輸?shù)鞍踪|(zhì)的運(yùn)輸信號(hào)。因此,這些內(nèi)體運(yùn)輸?shù)鞍踪|(zhì)不適合作為運(yùn)輸信號(hào)被失活的信號(hào)蛋白質(zhì)用于本發(fā)明。根據(jù)本發(fā)明,因?yàn)榭裳诒纹溥\(yùn)輸信號(hào),所以在胞質(zhì)溶膠中表達(dá)并直接運(yùn)輸?shù)絹喖?xì)胞器的蛋白質(zhì)可用作信號(hào)蛋白質(zhì)。在后面的信號(hào)蛋白質(zhì)中,有核定位信號(hào)(NLS)的信號(hào)蛋白質(zhì)不依賴N或C末端,因此通過連接或切掉有或沒有信號(hào)掩蔽蛋白質(zhì)的蛋白水解位點(diǎn)控制這些信號(hào)蛋白質(zhì)的運(yùn)輸是困難的。因此希望選擇靶向有線粒體、葉綠體,或過氧化物酶體的運(yùn)輸信號(hào)的信號(hào)蛋白質(zhì)。對(duì)于植物細(xì)胞,更優(yōu)選使用葉綠體靶向的信號(hào)蛋白質(zhì),因?yàn)槿~綠體比較大并更容易檢測(cè)其形狀和分布。包括在本發(fā)明嵌合底物蛋白質(zhì)中的信號(hào)掩蔽蛋白質(zhì),通過蛋白水解位點(diǎn)與信號(hào)蛋白質(zhì)連接而失活信號(hào)蛋白質(zhì)的運(yùn)輸信號(hào)。信號(hào)掩蔽蛋白質(zhì)可是通過蛋白水解位點(diǎn)與信號(hào)蛋白質(zhì)連接的氨基酸、肽或蛋白質(zhì)。對(duì)于一些實(shí)例,可通過蛋白水解位點(diǎn)單獨(dú)與信號(hào)蛋白質(zhì)的連接失活信號(hào)蛋白質(zhì)的運(yùn)輸信號(hào)。信號(hào)掩蔽蛋白質(zhì)和蛋白水解位點(diǎn)必需不干擾底物與蛋白酶的結(jié)合。除簡(jiǎn)單信號(hào)掩蔽外,信號(hào)掩蔽蛋白質(zhì)還可用于改變嵌合底物蛋白質(zhì)的整體性質(zhì),或附加另外的運(yùn)輸信號(hào)或熒光標(biāo)記。例如,如果另一信號(hào)蛋白質(zhì)被選作信號(hào)掩蔽蛋白質(zhì),當(dāng)被蛋白酶切掉時(shí),該信號(hào)蛋白質(zhì)將移動(dòng)到其靶細(xì)胞器。在這種情況中,如果還用熒光蛋白質(zhì)標(biāo)記該信號(hào)蛋白質(zhì),可通過檢測(cè)兩種不同的熒光信號(hào)更清楚地鑒定底物蛋白質(zhì)的切割。在另一實(shí)例中,可使用熒光蛋白質(zhì)作為信號(hào)掩蔽蛋白質(zhì)。在這個(gè)情況中,通過蛋白酶剪切形成的熒光蛋白質(zhì)將停留在胞質(zhì)溶膠中。因此可通過分別觀察來自胞質(zhì)溶膠和亞細(xì)胞器的熒光信號(hào),提高測(cè)定蛋白酶活性或檢測(cè)蛋白酶抑制劑抑制活性的效率,其中通過蛋白酶剪切形成的信號(hào)蛋白質(zhì)被轉(zhuǎn)運(yùn)到亞細(xì)胞器中??墒褂靡环N標(biāo)準(zhǔn)重組方法或方法組合制備此處公開的嵌合底物蛋白質(zhì)。即,嵌合底物蛋白質(zhì)的構(gòu)建方法的特征在于其可擴(kuò)充性(expandability).例如,如果在蛋白酶的嵌合底物蛋白質(zhì)中包括至少兩種蛋白水解位點(diǎn),則可觀察到兩種或多種信號(hào)蛋白質(zhì)的運(yùn)輸。如果引入兩種或多種不同蛋白酶的蛋白水解位點(diǎn),則可同時(shí)檢測(cè)兩種或多種蛋白酶的活性。信號(hào)蛋白質(zhì)和信號(hào)掩蔽蛋白質(zhì)的選擇及嵌合底物蛋白質(zhì)構(gòu)建的詳細(xì)方法如下。標(biāo)志4-代表蛋白酶的蛋白水解位點(diǎn),M代表信號(hào)掩蔽蛋白質(zhì)。(1)在運(yùn)輸信號(hào)在信號(hào)蛋白質(zhì)N末端(nS)的情況中,信號(hào)掩蔽蛋白質(zhì)置于信號(hào)蛋白質(zhì)N末端一邊(M4-nS)。(2)在運(yùn)輸信號(hào)在信號(hào)蛋白質(zhì)C末端(Sc)的情況中,信號(hào)掩蔽蛋白質(zhì)置于信號(hào)蛋白質(zhì)C末端一側(cè)(Sc4-M)。(3)在另一信號(hào)蛋白質(zhì)S,用作信號(hào)掩蔽蛋白質(zhì)的情況中,可選擇S,在與S相對(duì)的一側(cè)保持運(yùn)輸信號(hào)??赏ㄟ^構(gòu)建兩個(gè)信號(hào)蛋白質(zhì)運(yùn)輸信號(hào)46部分連接的嵌合底物蛋白質(zhì),同時(shí)掩蔽兩個(gè)信號(hào)蛋白質(zhì)的運(yùn)輸信號(hào)(Sc4-nS,或S,c-"S)。(4)在如(3)的構(gòu)建中,如果引入兩種蛋白水解位點(diǎn),信號(hào)掩蔽蛋白質(zhì)必需置于兩種信號(hào)蛋白質(zhì)之間(Sc4-M4-nS,或Sc,4-M-;nS)。(5)如果信號(hào)蛋白質(zhì)(S)和用作信號(hào)掩蔽蛋白質(zhì)的另一信號(hào)蛋白質(zhì)(S,)的運(yùn)輸信號(hào)在同一側(cè),則需要連接掩蔽S,運(yùn)輸信號(hào)的另一信號(hào)掩蔽蛋白質(zhì)(M-;nS,4-nS或Sc4-Sc,4-M)。通過擴(kuò)展上述(1)到(5)的構(gòu)建,可用三種或更多的蛋白水解位點(diǎn)構(gòu)建嵌合底物蛋白質(zhì)(Scm4-......4-Sc24-Sd4-M4-nSi4-nSr;…...->UnSn)。上述構(gòu)建方法是可能構(gòu)建方法的代表實(shí)例。除上述包括在嵌合底物蛋白質(zhì)中的所有信號(hào)蛋白質(zhì)的運(yùn)輸信號(hào)都被掩蔽的實(shí)例外,有可以提供蛋白酶剪切在胞質(zhì)溶膠中發(fā)生的嵌合底物蛋白質(zhì)的其他構(gòu)建方法。如果只有一種包括在嵌合底物蛋白質(zhì)中的信號(hào)蛋白質(zhì)的運(yùn)輸信號(hào)保持活性,而其余信號(hào)蛋白質(zhì)的所有運(yùn)輸信號(hào)都被掩蔽,則嵌合底物蛋白質(zhì)將被易位到活性信號(hào)蛋白質(zhì)耙標(biāo)的亞細(xì)胞器。在這當(dāng)中,如果易位嵌合底物蛋白質(zhì)位于亞細(xì)胞器膜,可構(gòu)建嵌合底物蛋白質(zhì),其中暴露至少一種蛋白水解位點(diǎn)和至少一種失活信號(hào)蛋白質(zhì)于胞質(zhì)溶膠中,以便達(dá)到與使用所有信號(hào)蛋白質(zhì)的運(yùn)輸信號(hào)都被掩蔽的嵌合底物蛋白質(zhì)同樣效果。如果該只有一種信號(hào)蛋白質(zhì)保持活性的嵌合底物蛋白質(zhì)用作底物,因?yàn)榈鞍姿馕稽c(diǎn)暴露于胞質(zhì)溶膠中,所以可通過存在于胞質(zhì)溶膠中的蛋白酶發(fā)生蛋白水解反應(yīng),盡管嵌合底物蛋白質(zhì)不是自由分散在胞質(zhì)溶膠中。在這種情況中,暴露于胞質(zhì)溶膠的失活信號(hào)蛋白質(zhì)通過蛋白酶剪切被活化。因此,包括該活化信號(hào)蛋白質(zhì)的蛋白質(zhì)片段將易位到與嵌合底物蛋白質(zhì)居留的亞細(xì)胞器不同的特定亞細(xì)胞器,這導(dǎo)致附著于活化信號(hào)蛋白質(zhì)的熒光信號(hào)定位和分布的改變。構(gòu)建只有一種信號(hào)蛋白質(zhì)運(yùn)輸信號(hào)保持活性的嵌合底物蛋白質(zhì)的另一可能方法是,無(wú)運(yùn)輸信號(hào)的熒光蛋白質(zhì),例如GFP或RFP,與暴露于胞質(zhì)溶膠的蛋白水解位點(diǎn)連接,而不是連接信號(hào)蛋白質(zhì)。在這種情況中,因?yàn)橛傻鞍酌讣羟挟a(chǎn)生的熒光蛋白質(zhì)分散在胞質(zhì)溶膠中,所以熒光信號(hào)的分布從特定細(xì)胞器變成胞質(zhì)溶膠。然而,在這種情況中,由于酶反應(yīng)的不完全,所以熒光信號(hào)是否定位在膜或胞質(zhì)溶膠的分辨清晰度是低的。另外,在構(gòu)建只有一種信號(hào)蛋白質(zhì)保持活性的嵌合底物蛋白質(zhì)中可能有相當(dāng)大的困難,因?yàn)椴粌H需要信號(hào)蛋白質(zhì)易位到的亞細(xì)胞器的詳細(xì)信息,而且需要易位信號(hào)蛋白質(zhì)定向和位置的詳細(xì)信息。靶向到線粒體、葉綠體,和細(xì)胞核外膜、過氧化物酶體膜和質(zhì)膜的信號(hào)蛋白質(zhì),可用作在嵌合底物蛋白質(zhì)中保持活性的信號(hào)蛋白質(zhì).還可使用可特異結(jié)合磷脂的信號(hào)蛋白質(zhì)。實(shí)例包括,如圖2(h)中所顯示的與磷脂酰肌醇4,5-二磷酸(PI(4,5)P2)結(jié)合的Pleckstrin同源結(jié)構(gòu)域(PH),和與磷脂酰肌醇4-磷酸(PI(4)P)結(jié)合的FAPP(家族A(磷酸肌醇特異結(jié)合)成員3)的Pleckstrin同源結(jié)構(gòu)域。在實(shí)施例2中,對(duì)根據(jù)本發(fā)明構(gòu)建的表達(dá)蛋白酶和其嵌合底物蛋白質(zhì)的轉(zhuǎn)化細(xì)胞進(jìn)行Western印跡分析,并證實(shí)正確地發(fā)生了蛋白酶反應(yīng)。與進(jìn)行細(xì)胞溶解和粗提物電泳及抗體鑒定的Western印跡分析相比,本發(fā)明提供的系統(tǒng)可通過簡(jiǎn)單地觀察細(xì)胞本身進(jìn)行鑒定,因此在時(shí)間和成本兩方面都是更高效的.在本發(fā)明實(shí)施例1中,構(gòu)建了可直觀確定細(xì)胞中蛋白質(zhì)的運(yùn)輸和分布的系統(tǒng)。通過選擇具有至亞細(xì)胞器的運(yùn)輸信號(hào)的信號(hào)蛋白質(zhì)并用熒光蛋白質(zhì)標(biāo)記構(gòu)建嵌合蛋白質(zhì)以顯示易位后的蛋白質(zhì)定位。這表明通過觀48察用包括嵌合蛋白質(zhì)重組基因的重組質(zhì)粒轉(zhuǎn)化細(xì)胞的熒光圖像,可鑒定嵌合蛋白質(zhì)的定位。在這些嵌合蛋白質(zhì)中,選擇AtOEP7:GFP并連接蛋白酶的蛋白水解位點(diǎn),以構(gòu)建可用于體內(nèi)蛋白酶抑制劑篩選的嵌合底物蛋白質(zhì)。AtOEP7是靶向擬南芥屬葉綠體外包膜的蛋白質(zhì),前已述及,對(duì)于植物細(xì)胞更希望選擇葉綠體耙向的蛋白質(zhì)。因?yàn)锳tOEP7在N末端有運(yùn)輸信號(hào),所以信號(hào)掩蔽蛋白質(zhì)被連接到AtOEP7:GFP的N末端一側(cè)。選擇紅色焚光蛋白質(zhì)作為信號(hào)掩蔽蛋白質(zhì)。因此,構(gòu)建了嵌合底物蛋白質(zhì),在蛋白酶剪切后綠色熒光定位到葉綠體外包膜,而紅色熒光分布在胞質(zhì)溶膠中。一般而言,本發(fā)明融合分子的制備包括常規(guī)重組步驟,涉及,例如,聚合酶鏈擴(kuò)增反應(yīng)(PCR)、質(zhì)粒DNA制備、限制性內(nèi)切酶切割DNA、寡聚核苷酸制備、DNA連接、mRNA分離、DNA引入到適當(dāng)細(xì)胞,和細(xì)胞培養(yǎng)。另外,根據(jù)眾所周知的技術(shù),包括那些包含標(biāo)準(zhǔn)電泳、離心和層析操作的方法,可分離和純化此處描述的嵌合蛋白質(zhì)。對(duì)于涉及這些方法的內(nèi)容,一般參見,Sambrook等人,見上文;和Ausubel等人,見上文??蓮亩喾N公共來源,包括那些特別提到的來源獲得此處描述的DNA和蛋白質(zhì)序列。優(yōu)選的來源是位于NationalLibraryofMedicine,38A,8N05,RockvillePike,Bethesda,MD20894的NationalCenterforBiotechnologyInformation(NCBI)-GeneticSequenceDataBank(GenBank)。也可使用互聯(lián)網(wǎng)上的GenBank。有關(guān)GenBank的描述,一般參見Benson,D.A.等人,iV"c/.J"Vfc,25:1(1997)。實(shí)施例中使用的其他試劑,例如抗體、細(xì)胞和病毒,可從公認(rèn)的商業(yè)或公共來源獲得,例如jL/"s",sD/re"ofj(40GlenDrive,MiHValleyCalifornia94941),和theAmericanTypeCultureCollection(ATCC)12301ParklawnDrive,Rockv川e,MD20852。此處引用這里提及的所有文獻(xiàn)作為參考。通過下面的實(shí)施例進(jìn)一步說明本發(fā)明。提供的這些實(shí)施例是幫助理解本發(fā)明的,不能作為其限制解釋。實(shí)施例1:檢測(cè)嵌合蛋白質(zhì)和向亞細(xì)胞器運(yùn)輸(a)表達(dá)嵌合蛋白質(zhì)重組質(zhì)粒的構(gòu)建擬南芥屬外包膜蛋白質(zhì)AtOEP7(是豌豆OEP14的同系物)的編碼區(qū),使用設(shè)計(jì)除去天然終止密碼子的兩條特異引物(5,-GACGACGACGCAGCGATG和5,-GGATCCCCAAACCCTCTTTGGATGT),從擬南芥屬基因組DNA中通過聚合酶鏈反應(yīng)(PCR)擴(kuò)增。然后,其符合讀框地連接到綠色或紅色熒光蛋白質(zhì)編碼區(qū)的5,末端,以分別構(gòu)建重組質(zhì)粒AtOEP7:GFP和AtOEP7:RFP。重組質(zhì)粒中連接基因由35S啟動(dòng)子調(diào)節(jié)。同樣的方法用于此后描述的其他重組質(zhì)粒的構(gòu)建。對(duì)于嵌合蛋白質(zhì)Rubisco復(fù)合蛋白質(zhì)的表達(dá),使用兩條特異引物(5,-CCTCAGTCACACAAAGAG和5,-ACTCGAGGGAATCGGTAAGGTCAG),從人ZAPIIcDNA文庫(kù)PCR擴(kuò)增Rubisco復(fù)合體小亞單位轉(zhuǎn)運(yùn)肽的編碼區(qū)。獲得的PCR產(chǎn)物亞克隆到pBluescript,然后符合讀框地連接到GFP或RFP編碼區(qū)的5,末端,以分別構(gòu)建重組質(zhì)粒RbcS:GFP和RbcS:RFP。對(duì)于葉綠素a/b結(jié)合蛋白質(zhì)的表達(dá),使用兩條特異引物(5,-TAGAGAGAAACGATGGCG和5,-GGATCCCGTTTGGGAGTGGAACTCC),從人ZAPIIcDNA文庫(kù)PCR擴(kuò)增對(duì)應(yīng)的基因,以構(gòu)建重組質(zhì)粒Cab:GFP。使用兩條特異引物(5'-TCTAGAATGGCCGCCGCAGTTTCC和5,-GGATCCATCTGTCTCCATCGGTTTG),從XZAPIIcDNA文庫(kù)PCR擴(kuò)增rubisco活化酶(RA)的轉(zhuǎn)運(yùn)肽編碼區(qū),并連接到GFP編碼區(qū)的5,末端,構(gòu)建重組質(zhì)粒RA:GFP。<吏用兩條特異引物(5'-CTTTAATCAATGGCAATG和5,-CCATGGCCTGAACTGCTCTAAGCTT),從AZAPIIcDNA文庫(kù)PCR擴(kuò)增Fl-ATPase(登錄號(hào)D88374)轉(zhuǎn)運(yùn)肽編碼區(qū),并連接到GFP編碼區(qū)的5,末端,構(gòu)建Fl-ATPase:GFP。過氧化物酶體耙向蛋白質(zhì)重組質(zhì)粒,GFP:SKL,通過使用兩條特異引物(5,-CCGTATGTTACATCACC和5,-TTATAGCTTTGATTTGTATAGTTCATCCAT),以326GFP(Davis,S.J.和Viestra,R.D.,1998)為模版PCR擴(kuò)增構(gòu)建。4吏用上述方法,以兩條特異引物(5,-GAGATGTCGAGTCTCGAA和5,-CTCGAGCACAGTGTAGTGACTGG)擴(kuò)增全長(zhǎng)H、ATPase(擬南芥屬的AHA2),并連接到GFP編碼區(qū)的5,末端,構(gòu)建H、ATPase:GFP的重纟且質(zhì)粒'PH結(jié)構(gòu)域(Pleckstrin同源結(jié)構(gòu)域)的嵌合蛋白質(zhì)GFP:PH的重組質(zhì)粒,根據(jù)Kost,B.等人(1998)描述的方法構(gòu)建。圖1中顯示從根據(jù)上述方法構(gòu)建的重組質(zhì)粒表達(dá)的嵌合蛋白質(zhì)的結(jié)構(gòu)圖解。(b)原生質(zhì)體制備用新刀片,將生長(zhǎng)在溫室土壤上的3-4周齡的擬南芥屬植物葉組織(5g)切成小方塊(5-10mm2),并用50ml酶溶液(0.25%解析酶R-IO、1.0。/。纖維素酶R-10、400mM甘露醇、8mMCaCl2、5mMMes畫KOH,pH5.6)于22C輕輕攪拌(50-75rpm)溫育。溫育以后,100pm篩目過濾原生質(zhì)體懸液,并于46xg離心5分鐘收集原生質(zhì)體。在5到10mlW5溶液(154mMNaCl、125mMCaCl2、5mMKC1、5mM葡萄糖、1.5mMMes-KOH,pH5.6)中重懸原生質(zhì)體沉淀,在上面覆蓋20ml21%的蔗糖,并于78xg離心IO分鐘。轉(zhuǎn)移界面上完整的原生質(zhì)體到20mlW5溶液中。在55xg離心5分鐘,再次沉淀原生質(zhì)體,在20mlW5溶液中中重懸,然后在冰上溫育30分鐘。(c)重組質(zhì)粒DNA的分離和原生質(zhì)體的轉(zhuǎn)化根據(jù)產(chǎn)品說明書,使用Qiagencolumns(Valencia,CA)純化重組質(zhì)粒。為了用DNA轉(zhuǎn)化原生質(zhì)體,46xg5分鐘再次沉淀原生質(zhì)體,并以5xl()6原生質(zhì)體/ml的密度重懸于MaMg溶液(400mM甘露醇、15mMMgCl2、5mMMes-KOH,pH5.6)。通過PEG(聚乙二醇)介導(dǎo)的轉(zhuǎn)化方法(Jin等人,2001)在擬南芥屬原生質(zhì)體中引入重組質(zhì)粒構(gòu)建體。約20-50pg濃度為2|ig^l的質(zhì)粒DNA與300|il原生質(zhì)體懸液混合,加入325piPEG(聚乙二醇)溶液(400mM甘露醇、100mMCa(N03)2、40%PEG4000)并輕輕混合.混合物室溫溫育30分鐘。溫育后,混合物用10mlW5溶液稀釋。50xg離心5分鐘重新收集原生質(zhì)體,在3mlW5溶液中重懸,并在黑暗中于22X:溫育。(d)嵌合蛋白質(zhì)的表達(dá)和其亞細(xì)胞定位的觀察根據(jù)實(shí)施例l(c)中描述的方法,用實(shí)施例l(a)中構(gòu)建的重組質(zhì)粒DNA轉(zhuǎn)化原生質(zhì)體。使用帶冷電荷耦合裝置照相機(jī)(cooledcharge-coupleddevicecamera)的焚光顯微鏡(Axioplan熒光顯微鏡,Zeiss,德國(guó))捕捉圖像,監(jiān)測(cè)轉(zhuǎn)化后嵌合蛋白質(zhì)表達(dá)的時(shí)間函數(shù)。對(duì)于GFP、RFP,和葉綠素的自發(fā)熒光,分別使用的濾光設(shè)置為XFH6(激光器474AF20、分色鏡(dichroic):500DRLP、發(fā)射器510AF23)、52XF33/E(激光器535DF35、分色鏡570DRLP、發(fā)射器605DF50),和XF137(激光器540AF30、分色鏡570DRLP、發(fā)射器585ALP)(Omega,Inc.,Brattleboro,VT)。然后用Adobe(MountainView,CA)Photoshop軟件處理數(shù)據(jù)并以偽彩色格式呈現(xiàn)。在葉綠體外包膜上可觀察到嵌合蛋白質(zhì)AtOEP7:GFP的綠色焚光(圖2(a))。這一結(jié)果表明包含葉綠體包膜靶向信號(hào)蛋白質(zhì)和熒光蛋白質(zhì)標(biāo)記的嵌合蛋白質(zhì)正確粑向到葉綠體包膜。圖2(b)、(c),和(d)分別表示來自嵌合蛋白質(zhì)RbcS:GFP、Cab:GFP和RA:GFP的綠色焚光定位。如圖中所顯示,RbcS:GFP定位在葉綠體間質(zhì),及Cab:GFP和RA:GFP也在葉綠體中發(fā)射萸光。這些結(jié)果表明包含RbcS、Cab,或RA信號(hào)肽及熒光蛋白質(zhì)標(biāo)記的嵌合蛋白質(zhì)把向到葉綠體。分別在線粒體、過氧化物酶體和質(zhì)膜上觀察到嵌合蛋白質(zhì)Fl-ATPase:GFP、GFP:SKL,和H、ATPase:GFP的綠色熒光(圖2(e)-(g))。這些結(jié)果中的紅色熒光信號(hào)是葉綠體的自發(fā)熒光。GFP:PH的綠色熒光信號(hào),分布在磷脂酰肌醇4,5-二磷酸(PI(4,5)P2)存在的質(zhì)膜上,其中GFP:PH包含與磷脂特異結(jié)合的PH結(jié)構(gòu)域(Pleckstrin同源結(jié)構(gòu)域)。下面更詳細(xì)的解釋閨7(a)-(j)。圖中顯示了用于表達(dá)圖1所示融合蛋白質(zhì)重組質(zhì)粒質(zhì)粒圖譜。本實(shí)施例中描述構(gòu)建這些重組質(zhì)粒的方法。SEQIDNO:29-42中提供了包括在這些融合蛋白質(zhì)中的信號(hào)蛋白質(zhì)的核酸和蛋白質(zhì)序列。另外,SEQIDNO:43和44中提供部分FAPP(家族A(特異結(jié)合磷酸肌醇)成員3)Pleckstrin同源結(jié)構(gòu)域的核酸和蛋白質(zhì)序列。53這些信號(hào)蛋白質(zhì)是可用作本發(fā)明失活信號(hào)蛋白質(zhì)或活性信號(hào)蛋白質(zhì)的信號(hào)蛋白質(zhì)的實(shí)例。AtOEP7、RbcS、Cab、RA、Fl-ATPase和SKL(過氧化物酶體靶向序列)是嵌合底物蛋白質(zhì)中可通過掩蔽失活的信號(hào)蛋白質(zhì)的實(shí)例。AtOEP7、H、ATPase:GFP、PH和FAPP是在嵌合底物蛋白質(zhì)中保持活性的信號(hào)蛋白質(zhì)的實(shí)例。實(shí)施例2:蛋白酶對(duì)嵌合底物蛋白質(zhì)切割的檢測(cè)(a)重組質(zhì)粒的構(gòu)建通過將NIa蛋白酶編碼區(qū)置于pUC載體35S啟動(dòng)子的控制之下,構(gòu)建NIa蛋白酶的重組質(zhì)粒。無(wú)終止密碼子的AtOEP7編碼區(qū)與326GFP載體(從Jm力/^/w/sBiologicalResourceCenter,OhioUniversity,美國(guó),獲得)中的綠色熒光蛋白質(zhì)編碼區(qū)5,末端連接,構(gòu)建擬南芥屬外包膜蛋白質(zhì):綠色熒光蛋白質(zhì)(AtOEP7:GFP)的重組質(zhì)粒。通過用兩條引物(5,引物引物5,-GAGCTCTTATTTGTATAGTTCATC)PCR擴(kuò)增該質(zhì)粒,將蛋白酶切割位點(diǎn)VRFQ連接到AtOEP7:GFP的N末端。然后將PCR產(chǎn)物(和X/^I片段)與326RFP-nt載體的(補(bǔ)平)和X/^I位點(diǎn)連接,構(gòu)建嵌合底物蛋白質(zhì)RFP:VRFQ:AtOEP7:GFP的重組質(zhì)粒(圖3(a))。(b)重組質(zhì)粒轉(zhuǎn)化如實(shí)施例1(b)和(c)進(jìn)行轉(zhuǎn)化。(c)用熒光顯微鏡檢測(cè)熒光蛋白質(zhì)如實(shí)施例1(d)進(jìn)行熒光蛋白質(zhì)檢測(cè)。將表達(dá)嵌合底物蛋白質(zhì)RFP:VRFQ:AtOEP7:GFP的最終的重組質(zhì)粒引入原生質(zhì)體,并在轉(zhuǎn)化后的24-36小時(shí)檢測(cè)亞細(xì)胞運(yùn)輸。如圖4中所示,嵌合底物蛋白質(zhì)以大斑點(diǎn)或聚集體定位在原生質(zhì)體中,但不進(jìn)入葉綠體。在同一個(gè)斑點(diǎn)上可觀察到紅色和綠色兩種熒光信號(hào)。在下一個(gè)實(shí)驗(yàn)中,檢測(cè)NIa蛋白酶是否能切割嵌合底物蛋白質(zhì)中的切割位點(diǎn)。當(dāng)用NIa蛋白酶的重組質(zhì)粒共轉(zhuǎn)化原生質(zhì)體時(shí),如圖5所示,在葉綠體包膜上可觀察到綠色熒光信號(hào),而觀察到紅色熒光信號(hào)均勻地分散在胞質(zhì)溶膠中。另外,紅色和綠色熒光信號(hào)不再互相重疊,這強(qiáng)烈表明NIa蛋白酶體內(nèi)切割了嵌合底物蛋白質(zhì)。(d)Western印跡分析收集轉(zhuǎn)化原生質(zhì)體,并在50|ul細(xì)胞溶解緩沖液(50mMTris-HCl,pH7.5、lmMDTT、1mMEDTA、50mMNaCl)中溶解。用抗GFP的單克隆抗體(Clontech,Inc)和ECL試劑盒(Amersham,Inc),通過Western印跡分析鑒定嵌合底物蛋白質(zhì)RFP:VRFQ:AtOEP7:GFP的表達(dá),和NIa蛋白酶將嵌合底物蛋白質(zhì)切割成RFP和AtOEP7:GFP。如圖6所示,當(dāng)NIa蛋白酶不被共轉(zhuǎn)化時(shí),以70kDa的預(yù)期大小檢測(cè)到嵌合底物蛋白質(zhì)RFP:VRFQ:AtOEP7:GFP。相反,當(dāng)NIa蛋白酶共轉(zhuǎn)化時(shí),抗GFP的抗體在AtOEP7:GFP預(yù)期大小的35kDa檢測(cè)到蛋白質(zhì)。這一結(jié)果表明嵌合底物蛋白質(zhì)RFP:VRFQ:AtOEP7:GFP被切割成兩個(gè)蛋白質(zhì),RFP和AtOEP7:GFP。因此,這一結(jié)果清楚地表明NIa蛋白酶可在體內(nèi)切割嵌合底物蛋白質(zhì),并通過檢測(cè)綠色焚光信號(hào)在葉綠體包膜的定位和紅色熒光信號(hào)在胞質(zhì)溶膠中的分散分布,可輕易地測(cè)定切割反應(yīng)。圖8(a)-(b)更詳細(xì)的解釋如下。此圖分別顯示本實(shí)施例中用于表達(dá)NIa蛋白酶和其嵌合底物蛋白質(zhì)RFP:PS(NIa):AtOEP7:GFP重組質(zhì)粒的質(zhì)粒圖譜。SEQIDNO:45-50中提供NIa蛋白酶和其切割位點(diǎn)的核酸和蛋白質(zhì)序列。SEQIDNO:51和52中分別提供該嵌合底物蛋白質(zhì)的完整核酸和蛋白質(zhì)序列。實(shí)施例3:HIV-1蛋白酶抑制劑的體內(nèi)篩選系統(tǒng)檢測(cè)人免疫缺陷病毒(HIV-1)蛋白酶抑制劑的便利的體內(nèi)篩選系統(tǒng)如下所示。(a)表達(dá)HIV-1蛋白酶重組質(zhì)粒的構(gòu)建以pHX2BART為模版,用兩條引物(5,誦TCTAGAATGCCTCAGGTCACTCTTTGG隱3,和5,-CTCGAGTCAAAAATTTAAAGTGCAACC-3,)PCR擴(kuò)增HIV-1蛋白酶編碼區(qū),構(gòu)建HIV-1蛋白酶的重組質(zhì)粒。PHX-2BART是包含無(wú)逆轉(zhuǎn)錄酶編碼區(qū)的HX2B(GenBank登錄號(hào)K03455)的質(zhì)粒克隆。擴(kuò)增產(chǎn)物亞克隆到pBluescript-T載體,然后克隆到35S啟動(dòng)子控制下的pUC載體的X6"I和X/ioI位點(diǎn)。圖9(a)中顯示HIV-1蛋白酶的質(zhì)粒圖譜,SEQIDNO:55和56中分別提供核酸和蛋白質(zhì)序列。(b)表達(dá)HIV-1蛋白酶嵌合底物蛋白質(zhì)的重組質(zhì)粒構(gòu)建共構(gòu)建了9種嵌合底物蛋白質(zhì)的重組質(zhì)粒,使用的引物如下正向引物是5,-CCCGGGTAGCCAAAATTACCCTATAGTGGGAAAAACTTCGGGAGCG-3,,5,-CCCGGGTGCAAGAGTTTTGGCTGAAGCAGGAAAAACTTCGGGAGCG-3,,5,-CCCGGGTGCTACCATAATGATGCAGAGAGGAAAAACTTCGGGAGCG-3,.S'-CCCGGGTAGACAGGCTAATTTTTTAGGGGGAAAAACTTCGGGAGCGL5,-CCCGGGTCCAGGGAATTTTCTTCAGAGCGGAAAAACTTCGGGAGCG-3,55'-CCCGGGTAGCGTGCCTCAAATAGGAAAAACTTCGGGAGCG-3',5'-CCCGGGTACTTTAAATTTTCCCATTAGCGGAAAAACTTCGGGAGCG-3',5,-CCCGGGTGCAGAAACCTTCTATGTAGATGGAAAAACTTCGGGAGCG-3,.和5,-CCCGGGTAGGAAAGTACTATrTTTAGATGGAAAAACTTCGGGAGn(U,,使用的通用反向引物是5,-CTCGAGTTATTTGTATAGTTCATC-3,。這些引物設(shè)計(jì)包含HIV-1蛋白酶的蛋白水解位點(diǎn)。正向引物的下劃線部分對(duì)應(yīng)蛋白水解位點(diǎn)序列(SEQIDNO:57、59、61、63、65、67、69、71,和73)。以NIa蛋白酶底物蛋白質(zhì)(SEQIDNO:51)的質(zhì)粒為模版,用上述正向引物之一和通用引物進(jìn)行PCR擴(kuò)增。用5挑fll和XAoI限制性消化PCR產(chǎn)物,并亞克隆到(補(bǔ)平)和JVT^I消化的326RFP-nt載體.因此,9種所得質(zhì)粒的每一種包含編碼組成為RFP:PS(HIV-l):AtOEP7:GFP的嵌合底物蛋白質(zhì)之一的DNA序列,其中PS(HIV-1)是HIV-1蛋白酶蛋白水解位點(diǎn)之一。SEQIDNO:75和76提供這些嵌合底物蛋白質(zhì)之一的核酸和蛋白質(zhì)序列。(c)HIV-1蛋白酶抑制劑的體內(nèi)篩選根據(jù)實(shí)施例1(b)和(c)描述的方法進(jìn)行擬南芥屬葉組織原生質(zhì)體的制備和轉(zhuǎn)化。如實(shí)施例1(d)中所描述(使用同類型的濾光片裝置,但使用NikonE800熒光顯微鏡),進(jìn)行轉(zhuǎn)化原生質(zhì)體熒光圖像的檢測(cè)。作為體內(nèi)檢測(cè)HIV-1蛋白酶抑制的工作實(shí)施例,用HIV-1蛋白酶底物蛋白質(zhì)RFP:PS(HIV-l):AtOEP7:GFP的重組質(zhì)粒轉(zhuǎn)化原生質(zhì)體。包括在嵌合底物蛋白質(zhì)中的蛋白水解位點(diǎn)序列是RQANFLG(SEQIDNO:64)。轉(zhuǎn)化原生質(zhì)體在于\V5溶液中溫育18-48小時(shí)以表達(dá)嵌合底物蛋白質(zhì),用熒光顯微鏡監(jiān)測(cè)來自表達(dá)嵌合底物蛋白質(zhì)的熒光信號(hào)的亞細(xì)胞定位,如圖11所示,在胞質(zhì)溶膠的同一位置可觀察到綠色和紅色焚光兩種信號(hào)都形成大斑點(diǎn)或聚集體,但不耙向到葉綠體。這一結(jié)果表明嵌合底物蛋白質(zhì)未被切割,因此它們以未切割的形式存在于胞質(zhì)溶膠中。這一數(shù)據(jù)對(duì)應(yīng)于發(fā)生HIV-1蛋白酶完全抑制時(shí)的結(jié)果。如下進(jìn)行HIV-1蛋白水解活性的檢測(cè)。用HIV-1蛋白酶的重組質(zhì)粒和HIV-1蛋白酶底物蛋白質(zhì)RFP:PS(HIV-1):AtOEP7:GFP的重組質(zhì)粒共轉(zhuǎn)化原生質(zhì)體。包括在嵌合底物蛋白質(zhì)中的蛋白水解位點(diǎn)序列是RQANFLG(SEQIDNO:64)。用熒光顯微鏡監(jiān)測(cè)轉(zhuǎn)化后18-48小時(shí),來自表達(dá)嵌合底物蛋白質(zhì)的熒光信號(hào)的亞細(xì)胞定位。如國(guó)12所示,觀察到紅色熒光信號(hào)均勻地分散在胞質(zhì)溶膠中,而觀察到大部分綠色熒光信號(hào)在葉綠體周圍。這些結(jié)果表明嵌合底物蛋白質(zhì)已被HIV-1蛋白酶切割。該系統(tǒng)可用于檢測(cè)那些減少分散的紅色熒光信號(hào)和葉綠體耙向的綠色熒光信號(hào),并因此在原生質(zhì)體中封閉或抑制HIV-1蛋白酶活性的分子。圖9(a)和(b)更詳細(xì)的解釋如下。該圖顯示HIV-1蛋白酶和嵌合底物蛋白質(zhì)RFP:PS(HIV-l):AtOEP7:GFP重組質(zhì)粒的質(zhì)粒圖譜。這些重組質(zhì)??捎糜谠谥参锛?xì)胞例如鼠耳芥(^m6,Wo/w/s/Afl//"/m)、煙草等中表達(dá)HIV-1蛋白酶和嵌合底物蛋白質(zhì)。SEQIDNO:55-74中提供HIV-1蛋白酶和其切割位點(diǎn)的核酸和蛋白質(zhì)序列。SEQIDNO:75和76中分別提供實(shí)施例3中使用的嵌合底物蛋白質(zhì)的完整核酸和蛋白質(zhì)序列。實(shí)施例4:一種信號(hào)蛋白質(zhì)保持活性的可選地掩蔽嵌合蛋白質(zhì)的制備和使用如上所述,本發(fā)明的一個(gè)目的是提供重組嵌合蛋白質(zhì),其中至少一些信號(hào)蛋白質(zhì)被至少一種適當(dāng)?shù)陌被嵝蛄醒诒巍@?,根?jù)本發(fā)明,特定嵌合蛋白質(zhì)的所有信號(hào)蛋白質(zhì)可根據(jù)需要掩蔽或暴露??商娲?,可暴露嵌合蛋白質(zhì)的部分信號(hào)成分,而其余信號(hào)被掩蔽。對(duì)于本發(fā)明,58這種"可選地掩蔽,,嵌合蛋白質(zhì)提供了重要的靈活性并有廣泛而重要的應(yīng)用。例如,這種嵌合蛋白質(zhì)可用于根據(jù)嵌合蛋白質(zhì)一或多種焚光信號(hào)亞細(xì)胞定位的變化,檢測(cè)體內(nèi)蛋白酶活性的篩選。這種篩選高度靈敏,就是因?yàn)槠淇娠@示嵌合蛋白質(zhì)空間分布的微小變化。預(yù)期的發(fā)明應(yīng)用將指導(dǎo)選擇是否掩蔽或暴露包括在受試嵌合分子中的一種或一種以上的信號(hào)蛋白質(zhì)。圖IO提供一些說明性的"可選地掩蔽"嵌合蛋白質(zhì)。更具體地,該圖顯示編碼一種信號(hào)蛋白質(zhì)的運(yùn)輸信號(hào)保持活性的嵌合底物蛋白質(zhì)的重組基因的示意圖。H、ATPase用作活性信號(hào)蛋白質(zhì)的實(shí)例,其在嵌合底物蛋白質(zhì)中的運(yùn)輸信號(hào)不被掩蔽??捎米骰钚孕盘?hào)蛋白質(zhì)的其他實(shí)例包括AtOEP7、PH和FAPP。AtOEP7用作失活信號(hào)蛋白質(zhì)的實(shí)例,其運(yùn)輸信號(hào)通過連接蛋白酶剪切位點(diǎn)或通過蛋白酶剪切位點(diǎn)連接信號(hào)掩蔽蛋白質(zhì)而被掩蔽??捎米魇Щ钚盘?hào)蛋白質(zhì)的其他實(shí)例包括RbcS、Cab、RA、Fl-ATPase和SKL。這些嵌合底物蛋白質(zhì)設(shè)計(jì)根據(jù)蛋白酶剪切誘導(dǎo)亞細(xì)胞熒光信號(hào)分布的改變。幾乎此處公開的任何蛋白酶切割序列均可用于提供圖10中舉例說明的嵌合蛋白質(zhì)的切割位點(diǎn)(PS)。因此,這種可選地掩蔽嵌合蛋白質(zhì)可用于檢測(cè)廣泛的蛋白酶抑制劑分子。當(dāng)然,幾乎此處公開的任何蛋白酶切割序列均可用于提供圖10中舉例說明的嵌合蛋白質(zhì)的切割位點(diǎn)(PS)。圖10更詳細(xì)的解釋如下。圖l(Ka)顯示構(gòu)建體,其中熒光信號(hào)(FP-1)因蛋白酶剪切從質(zhì)膜易位到胞質(zhì)溶膠。在圖10(b)的情況中,一種熒光信號(hào)(FP-2)以圖l(Ka)情況中的同樣方式易位,但另一種熒光信號(hào)(FP-1)仍留在質(zhì)膜上。在圖10(c)的情況中,熒光信號(hào)(FP-1)因蛋白酶剪切從質(zhì)膜易位到葉綠體。在圖10(d)的情況中,一種熒光信號(hào)(FP-2)以圖10(c)情況中的同樣方式易位,但另一種熒光信號(hào)(FP-1)仍留在質(zhì)59膜上。(a)表達(dá)一種信號(hào)蛋白質(zhì)保持活性的嵌合底物蛋白質(zhì)的重組質(zhì)粒的構(gòu)建圖10中描述的重組質(zhì)粒的實(shí)例構(gòu)建如下。編碼H+-ATPase:PS:GFP(圖10(a))的兩個(gè)重組質(zhì)粒構(gòu)建如下,其中蛋白酶剪切位點(diǎn)序列是VRFQ(SEQIDNO:48)和RQANFLG(SEQIDNO:64)。正向引物5'誦CTCGAGPSATGAGTAAAGGAGAAGAA畫3,(這里PS對(duì)于VRFQNIa切割位點(diǎn)是GTGCGCTTCCAG,或?qū)τ赗QANFLGHIV-1切割位點(diǎn)是AGACAGGCTAATTTTTTAGGG)和反向引物5,-GAGCTCTTATTTGTATAGTTCATC-3,用于326GFP載體的PCR擴(kuò)增。這些PCR產(chǎn)物,其中包括NIa或HIV-l蛋白酶的蛋白酶剪切位點(diǎn)、亞克隆的限制性位點(diǎn)(A7roI和5Vzc1),和GFPC末端的終止密碼子,被亞克隆到pBluscript-T載體。這些亞克隆的A^oI片段連接到X/^I和5WI消化的pH+ATPase-G載體(圖7(i))。編碼H+-ATPase:GFP:PS:RFP(圖10(b))的兩個(gè)重組質(zhì)粒構(gòu)建如下,其中蛋白酶剪切位點(diǎn)序列是VRFQ(SEQIDNO:48)和RQANFLG(SEQIDNO:64)。為制備無(wú)終止密碼子的GFP,用引物5,-CTCGAGATGAAAGGAGAAGAACTT-3,和5,-GAGCTCTTTGTATAGTTCATCCAT畫3,進(jìn)行PCR擴(kuò)增。包含JV/ioI和5VicI位點(diǎn)的PCR產(chǎn)物亞克隆到pBluscript-T載體,然后用I和5WcI限制性消化。該A7ioI片段亞克隆到I和5VicI消化的pH+ATPase-G載體(圖7(i))。為將蛋白酶剪切位點(diǎn)置于RFP的上游,正向引物5,-GAGCTCPSATGGTGCGCTCCTCCAAG-3,(這里PS對(duì)于VRFQNIa切割位點(diǎn)是GTGCGCTTCCAG,或?qū)τ赗QANFLGHIV-1切割位點(diǎn)是AGACAGGCTAATTTTTTAGGG)和反向引物5,-GAGCTCCTACAGGAACAGGTGGTG-3,用于326GFP栽體的PCR擴(kuò)增。構(gòu)建體包括PS:RFP,還包括5VzcI位點(diǎn),其用5VzcI限制性消化,這些5VicI片段亞克隆到如上所述制備的H+-ATPase:GFP(無(wú)終止密碼子)亞克隆的5VicI位點(diǎn),產(chǎn)生H+曙ATPase:GFP:PS:RFP的重組質(zhì)粒。編碼H+-ATPase:PS:AtOEP7:GFP(圖10(c))的兩個(gè)重組質(zhì)粒構(gòu)建如下,其中蛋白酶剪切位點(diǎn)序列是VRFQ(SEQIDNO:48)和RQANFLG(SEQIDNO:64)。用引物5,-CTCGAGPSGGAAAAACTTCGGGAGCG-3,(這里PS對(duì)于VRFQNIa切割位點(diǎn)是GTGCGCTTCCAG,或?qū)τ赗QANFLGHIV-1切割位點(diǎn)是AGACAGGCTAATTTTTTAGGG)和5,醫(yī)GAGCTCTTATTTGTATAGTTCATC-3,PCR擴(kuò)增pSub曙NIal載體(圖8(b))。因此,PCR產(chǎn)物包括AT^I和SacI位點(diǎn)。這些亞克隆的I片段連接到JV/^I和I消化的pH+ATPase-G載體(圖7(i)),產(chǎn)生H、ATPase:PS:AtOEP7:GFP的重組質(zhì)粒。編碼H+-ATPase:RFP:PS:AtOEP7:GFP(圖10(d))的兩個(gè)重組質(zhì)粒構(gòu)建如下,其中蛋白酶剪切位點(diǎn)序列是VRFQ(SEQIDNO:48)和RQANFLG(SEQIDNO:64)。引物5,-CTCGAGATGGTGCGCTCCTCCAAG-3,和5'畫GAGCTCTTATTTGTATAGTTCATC隱3,用于PCR擴(kuò)增pSub-NIal載體(圖8(b))和pSub-HTV4栽體(圖9(b))。因此,這些PCR產(chǎn)物包括I和5VicI位點(diǎn)。這些亞克隆的XAoI/SacI片段連接到A7i<I和61I消化的pH+ATPase-G載體(圖7(i)),產(chǎn)生H+-ATPase:RTP:PS:AtOEP7:GFP的重組質(zhì)粒。(b)使用圖10(a)中描述的重組質(zhì)粒的工作實(shí)施例根據(jù)實(shí)施例1(b)和(c)描述的方法,進(jìn)行擬南芥屬葉組織原生質(zhì)體的制備和轉(zhuǎn)化。如實(shí)施例l(d)中所描述(使用同類型的濾光片裝置,但使用NikonE800焚光顯微鏡),進(jìn)行轉(zhuǎn)化原生質(zhì)體焚光圖像的檢測(cè)。作為檢測(cè)NIa蛋白酶抑制的工作實(shí)施例,用如實(shí)施例4(a)所描述制備的編碼嵌合底物蛋白質(zhì)H、ATPase:PS:GFP的重組質(zhì)粒轉(zhuǎn)化原生質(zhì)體。包括在嵌合底物蛋白質(zhì)中的蛋白水解位點(diǎn)序列是VRQF(SEQIDNO:48)。轉(zhuǎn)化原生質(zhì)體在22X:于W5溶液中溫育18-48小時(shí)以表達(dá)嵌合底物蛋白質(zhì),用熒光顯微鏡監(jiān)測(cè)來自表達(dá)嵌合底物蛋白質(zhì)的熒光信號(hào)的亞細(xì)胞定位。如圖13(a)所示,綠色熒光信號(hào)易位到質(zhì)膜。這一結(jié)果表明嵌合底物蛋白質(zhì)如預(yù)期的那樣未被切割,因此附加的綠色焚光蛋白質(zhì)通過H+-ATPase的運(yùn)輸信號(hào)耙向到質(zhì)膜。這一數(shù)據(jù)對(duì)應(yīng)于發(fā)生蛋白酶完全抑制時(shí)的結(jié)果。如下進(jìn)行NIa蛋白水解活性的檢測(cè)。用NIa蛋白酶的重組質(zhì)粒(SEQIDNO:45)和嵌合底物蛋白質(zhì)H+-ATPase:PS:GFP的重組質(zhì)粒(SEQIDNO:53)共轉(zhuǎn)化原生質(zhì)體。包括在嵌合底物蛋白質(zhì)中的蛋白水解位點(diǎn)序列是VRQF(SEQIDNO:48)。用熒光顯微鏡監(jiān)測(cè)轉(zhuǎn)化后18-48小時(shí),來自表達(dá)嵌合底物蛋白質(zhì)的熒光信號(hào)的亞細(xì)胞定位。如圖13(c)所示,觀察到綠色熒光信號(hào)在胞質(zhì)溶膠中,而不把向到質(zhì)膜。這一結(jié)果表明GFP被蛋白酶從嵌合底物蛋白質(zhì)上切割掉。引用此處公開的所有參考文獻(xiàn)作為參考。特別引用以下參考文獻(xiàn)作為參考。62Hook,V.Y.H.US6,245,884(2001).Kettner,C.A.andKorant,B.D.US4,644,055(1987).Cote,H.C.F.,Brumme,Z丄"andHarrig叫P.R.(2001).J.Virol.75,589-594.Davis,S丄andVierstr^R.D.(1998).PlantPhysiol.112,833-844.Ermolieff,J.,Loy,J.A.,Koelsch,G.,andTang,J.(2000).Biochem.39,12450-12456.Gillooly,D.J.,Morrow,I.C.,Lindsay,M.,Gould,R.,Bryant,N.J.,Gaullier,J.-M.,Parton,R.G.,andStenmark,H.(2000).EMBO119,45774588.Gutierrez-Campos,R.,Torress-Acosta,J.A.,Saucedo-Arias,L.etal.(199).Nat.Biotechnol.17,1223-1226.acobsen,H"Hanggi,M.,Ott,M.,Duncan,I.B.,andOwen,S.(1996).J.Infect.Dis.173,1379-1387.Kasai,N.,Tsumoto,K.,Niwa,S.,Misawa,S.,Ueno,T.,Hayashi,H.,andKumagai,I.(2001).Biochem.Biophys.Res.Comm.281,416-424.Kuhelj,R.,Rizzo,C丄,Chang,C.-H.,Jadha^P.K.,Towler,E.M.,andKorant,B.D.(2001).J.Biol.Chem.276,16674-16682.Kost,B.,Spidhofer,P.,andChua,N.H.(1998).PlantJ.16,383-401.Mardis,K丄.,Luo,R.,andGilsoAM.K.(2001).J.Mol.Biol.309,507-517.Miller,T.L.,Mawn,B.E"Orav,E丄,Wilk,D.,Weinberg,G.A.,Nicchitta^J"Furuta^L"Cutroni,R.,Mcintosh,K.,Burchett,S.K.,andGorbach,S丄.(2001),Pediat.107-5,1-6.Morise,H"Shimomura,0"Johnson,RH.,andWinant,J.(1974).Biochem.13,2656-2662.Pih,K.T.,Yi,M丄,Liang,Y.S.,Shin,B丄,Cho,M丄,Hwang,I.,andSon,D.(2000).PlantPhysiol.123,51-58.Rogers,J.D.,Lam,P.Y"Johnson,B丄.,Wang,H.S.,Ko,S.S.,Seits,S.P.,Trainor,G丄.,Anderson,RS.,Klabe,R.M.,Bachelor,L.T"Cordov*B.,Garber,S,,Reid,C.,Wright,M.R"Chang,C.H.,andErickson-Biitanen,S.(1998).Chem.Biol.5,597-608.Wlodawer,A.andErickson,J.W.(1983).Annu.Rev.Biochem.61,543-585.Yi,C.-R,Gosiewska,A.,Burtis,D.,andGeesin,J.(2001).Anal.Biochem.291,27-33.Yoon,H.Y"Hwang,D.C.,Choi,K.Y"andSong,B.D.(2000).Mol.Cell10,213-219.通過參考本發(fā)明優(yōu)選的實(shí)施例,已對(duì)本發(fā)明進(jìn)行了詳細(xì)的描述。然而,應(yīng)當(dāng)理解,本領(lǐng)域的那些技術(shù)人員,通過參考本公開內(nèi)容,可在本發(fā)明的精神和范圍內(nèi)進(jìn)行變更和改進(jìn)。序列喪<110>AHRAMBIOSYSTEMSINC.HWANG,InhwanKIM,DaeHeonLEE,YongJik<120>蛋白酶檢測(cè)系統(tǒng)<130>APB02一KR一PCT<150>KR10-2001-0048123<151>2001-08-10<160>120<170>Patentlnversion3.1<210>1c211>18<212>DNA<213>人工序列<220><223>合成序列'<220><221>'misc—特征<222>'(l)..(18)<223>部分AtOEP7編碼序列的5'PCR引物<400>1gacgacgacgcagcgatg<210>2<211>25<212>DNA<213>人工序列<220><223>合成序列<220><22l>misc—特征<222>(1)..(15)<223>部分AtOEP7編碼序列的3'PCR引物<400>2ggatccccaaaccctctttggatgt25<210:>3<211;>18<212>DNA<213>人工序列<223>合成序列<220><221>misc—特征<222>(1)..(18)<223>部分rubisco小亞基編碼序列的5'PCR引物<400>3cctcagtcacacaaagag18<210>4<211>24<212>DMA<220><213>人工序列<220><223>合成序列<220><221><222><223>misc—特征(24)部分rubisco小亞基編碼序列的3'PCR引物<400>4actcgagggaatcggtaaggtcag24<211,<213,18DNA人工序列<220-<223》合成序列<220〉<221><222><223>misc—特征(1)…(18):部分葉綠素a/b結(jié)合蛋白質(zhì)編碼序列5(TPCR引物<400>5tagagagaaacgstggcg18<211,<212,<213-25DNA人工序列<220><223>合成序列<220;<22l5<222-<223>misc—特征(25)部分葉綠素a/b結(jié)合蛋白質(zhì)編碼序列3(TPCR引物<400>6ggatcccgtttgggagtggaactcc25<210-<211,<212j<220><223><220-<222:<223>724D船人工序列合成,—iquencemisc—特征(1):(24)部分rubisco活化酶編碼序列的5'PCR引物<400>7tctagaatggccgccgcagtttcc24<210>8<211>25<212>DNA<213>人工序列-220>-223>合成序列<220><221>misc—特征U〉…(25)部分rubisco活化酶編碼序列的3'PCR引物<223><400>ggatccatctgtctccatcggtttg<210>9<211>18<212>DNA<213>人工序列<220><223>合成序列<220><221>misc—特征<222>(1)..(18)<223>部分F1-ATPase編碼序列的5'PCR引物<400>9ctttaatcaatggcaatg18<210>10<211>2S<212>DNA<213>人工序列<220><223>合成序列<220><22l》nusc—特征<222>(1).(25)<223>部分F-ATPase編碼序列的3'PCR引物<400>10ccatggcctgaactgctctaagctt25<210><211><212><213><220><223><220)<221〉<222;<223>1117DNA人工序列合成序列misc—特征(17)過氧化物酶體靶向序列的5'PCR引物"00>11ccgtatgttacatcacc17<210>12<211>30<212>DNA<213>人工.序列<220><223>合成序列-220》<22i>misc—特征<222>a)..(30)<223>過氧化物酶體靶向序列的3'PCR引物69<400>12ttatagctttgatttgtatagttcatccat30<21Cb<211》<220》<223><220=<221><222;=<223-1318DNA人工序列合成序列misc—特征(1)…(18)H+-ATPase編碼序列的5'PCR引物<400>13gagatgtcgagtctcgaa18<211>23<212>DNA<213>人工序列<223:<221-合成序列misc—特征(1)..(23)H+-ATPase編碼序列的3'PCR引物70<400>14ctcgagcacagtgtagtgactgg23<210><211><212><220><223><221><223>1538DNA人工序列合成序列misc—特征(〗),.(38)Nla蛋白酶底物蛋白質(zhì)編碼序列的5'PCR引物<400>15cccggggtgtgcgcttccagggaaaaacttcgggagcg38<210><211><212;><213><220》<220><222-1624DNA人工序列合成序列misc—特征(24)Nla蛋白酶底物蛋白質(zhì)編碼序列的3'PCR引物gagctcttat仁tgtatagt:tcatc2471<2lCb<211》<212)<220><223><220》<221〉<223》1727DNA人工序列合成序列misc—特征(1):(27)HIV-1蛋白酶編碼序列的5TCR引物tctagaatgcctcaggtcactctttgg27<210><211><212><213><220><223><220-<221:<222;=<223::1827DNA人工序列合成序列misc—特征(〗).「(27)HIV-1蛋白酶編碼序列的3'PCR引物<400〉18ctcgagtcaaaaatttaaagtgcaacc2772《210>19<211>46<212>DNA<213>人工序列<220><223>合成序列<220:><221>misc—特征<222>(46)<223>包含HIV-1蛋白酶的蛋白水解位點(diǎn)的編碼序列的5'PCR引物<400>19cccgggtagccaaaattaccctatagtgggaaaaacttcgggagcg46<210>20<211>4S<212>DNA<213>人工序列<220><223>合成序列<220><221>mlSC—特征<222>(1)(4"<223>包含HIV-1蛋白酶的蛋白水解位點(diǎn)的編碼序列的5'PCR引物<400>20cccgggtgcaagagttttggctgaagcaggaaaaacttcgggagcg4S<210><211><212><213><220><223><220><222><223>2146DNA人工序列合成序列misc一特征(46)包含HIV-1蛋白酶的蛋白水解位點(diǎn)的編碼序列的5'PCR引物<400>21cccgggtgctaccataatgatgcagagaccaaaaacttcgggagcg46<;210><211><212><213><220><223><220)<221〉《223〉2246DNA人工序列合成序列misc—特征U)…(46)包含HIV-1蛋白酶的蛋白水解位點(diǎn)的編碼序列的5'PCR引物<400>22cccgggtagacaggctaattttttagggggaaaaacttcgggagcg4674<210><211><212><213><220><223><220><221><222><223>2346DNA人工序列合成序列misc—特征(46)包含HIV-1蛋白酶的蛋白水解位點(diǎn)的編碼序列的5'PCR引物<400>23cccgggtccagggaattttcttcagagcggaaaaacttcgggagcg46<210><211><212><213><220><223><221><222><223>2441DMA人工序列合成序列misc—特征(1)…(41)包含HIV-1蛋白酶的蛋白水解位點(diǎn)的編碼序列的5'PCR引物<400>24cccgggtagcgtgcctcaaataggaaaaaacttcgggagcg41<210>25<211>"<212>DNA<213>人工序列<220><223》合成序列<220><221>:misc—特征<222>:(1)..(46)<223>i包含HIV-l蛋白酶的蛋白水解位點(diǎn)的編碼序列的5'pcR引物<400>25cccgggtactttaaattttcccattagcggaaaaacttcgggagcg46<210>26<211>4S<212>DNA<213>人工序列<220><223>合成序列<220><223><221><222>misc一特征(1)…(46)包含HIV-1蛋白酶的蛋白水解位點(diǎn)的編W序列的5'PCR引物<400>cccgggtgcagaaaccttctatgtagatggaaaaacttcgggagcg76<210>27<211>46<212>DNA<213>人工序列<220><223>合成序列<220><221>misc—特征<222>(1)..(46)<223>包含HIV-1蛋白酶的蛋白水解位點(diǎn)的編碼序列的5'PCR引物<400>27cccgggtaggaaagtactatttttagatggaaaaacttcgggagcg46<210>28<211>24<212>DNA<213>人工序列<220><223>合成序列<220><221>misc—特征(24)包含HIV-l蛋白酶的蛋白水解位點(diǎn)的編fi馬序列的3'PCR引物<222><223><400>ctcgagttatttgtatagttcatc<210><211><212><213>29192DNA鼠耳芥<220><221><222><223>CDS(1)..U92)包含葉綠體(外包膜)靶向序列的部分AtOEP7(豌豆DEP14的同系物)GenBank/NM一1151022002-01-10<400>atgggsMetGly29aaaacttcgLysThrSerGlyAla333cagGinAla10actgtgThrVal9tgValgtcValgcaAla15Ala48atgMetAlattaggatggLeuGlyTrp20tt3gccIjeuAlaatagagGlu25ateliegetAlattcPheaa_gcctPro30PheetcLeugatAspttccgctecPheArgSer35tcsateSerliegacAsp40tctSergacAspcc3Pro3ccThr45£133LysgacAspgccPro144gatAspAsp50ttcgsicaccPheAspThrgecgetAlaAla55setThrgcaAla3ccThr3c3ThrSer60gagGluGlyttglieu192<210><211><212><213>3064PRT鼠耳芥<400>30MetGlyLysThrSerGlyAlaLysGinAlaThrValValValAlaAla151015MetAlaLeuGlyTrplieuAlalieGlulieAlaPheLysProPheLeu202530AspLysPheArgSerSer工leAspLysSerAspProThrLysAspPro354045A印AspPheAspThrAlaAlaThrAiLaThrThrSerLysGluGlyLeu505S60<210><211><213)31237DNA鼠耳芥<220:=<221><222-<223>CDS(1)..(237>包含葉綠體(基質(zhì))靶向序列的部分rubisco小亞基<300><308>GenBank/NM—105379<309>2002-01-10<400>31atggettectctatgetctcttecgetactatggttgectctccgget48MetAlaSerSerMetLeuSerSerAlaThrMetValAlaSerProAla151015caggecactatggtcgetcctttcaacggacttaagtectecgetgecGinAlaThrMetValAlaProPheAsnGlyLeuLysSerSerAlaAla2025309679ttcccagccacccgcaaggetPheProAlaThrArgLysAla35aacaacgacattacttecAsnAsnAsplieThrSer4045ateacaagelieThrSer144aacggcggaagagttaactgcAsnGlyGlyArg"ValAsnCys5055atgcaggtgtggcctccgMetGinValTrpProProGOattggaaaglieGlyliys192aagaagtttgagactetctctLysLysPheGluThrLeuSer6570t3CcttcctgaccttTyxlieuProAspLeu75ThrgattecAspSer237<210><211><212><213>3279鼠耳芥<400>32MetAlaSerSerMetLeuSerSerAlaThrMetValAla10SerProAla15GinAlaThrMetValAlaProPheAsnGlyLeuLysSerSerAlaAla202530PheProAlaThrArgLysAlaA曰nAsnAsplieThrSerlieThrSer354045AsnGlyGlyArgValAsnCysMetGinValTrpProProlieGlyLys505560LysLysPheGluThrLeuSerTyrLeuProAspLeuThrA叩Ser657075<210〉<211><212-33105DNA鼠耳芥<220,<221<222-<223>CDS(1)..U05).包含葉綠體(基質(zhì))靶向序列的部分葉綠素a/b結(jié)合蛋白質(zhì)<3005008-<309>GenBank/X560621992-10—12<400>atggcgMetAla33tcgSeraactcgcttatgagetgtggcatagccgccgtgtaccctAsnSerLeuMetSerCysGlylieAlaAlaValTyrPro5101548tcgcttetctcttcttecaagtctaaattcgtatecgccggagttccaSerLeuLeuSerSerSerLysSerLysPheValSerAlaGlyValPro20253096etcccaLieuPro33C35105<210>34<211>35<212>PRT<213>鼠耳芥<400〉34MetAlaSerAsnSerLeuMetSerCysGlylieAlaAlaValTyrPro151015SerLeuLeuSerSerSerLysSerLysPheValSerAlaGlyValPro202530LeuProAsn3581<210>35<211>204<212>DNA<213>鼠耳芥<220><221>CDS<222>(1)-(204><223>包含葉綠體(基質(zhì))靶向序列的部分rubisco活化酶<300><30B>GeriBank/3Q42121993-09-12"00>atggccMetAla35gccAlagcaAlagttVal5tecThrgtcValGlygccAla10lieAsnagagetAlaccgPro15ttg48ageSerttgLeu999Gly20SerGlySerggaGlygetAla25gtaValSergccAlaProgetAla30Ser3CCThr96ttcPhett9Leu99aGly35aag33aLysgttvalgtaValsetThr40gtgValtegSeragaArgttcAla45cagGinageSersiaic144sagsag50ageSer砂teaSerttcPhe55LysValttggetAla9t960gaaGlugacAspLys192Gin6SsecThrgatAsp柳Gly204<210>36<211>68<212>PRT<213>鼠耳芥<400>36MetAlaAlaAlaValSerThrValGlyAlalieAsnArgAlaProLeu151015SerLeuAsnGlySer<31ySerGlyAlaValSerAlaProAlaSerThr202530PheLeuGlyLysLysValValThrValSerArgPheAlaGinSerAsn354045LysIjysSerAsnGlySerPheLysValLeuAlaValLysGluAspLys505560GinThrAspGly65<210>37<211>234<212>DNA<213>鼠耳芥<220><221>CDS<222>(1)--(234)<223>包含線粒體靶向序列的部分線粒體F1-ATPaseg亞基<300>O0B>GenBank/D88374<309>1999-02-07<400>37atggc3atggetgttttccgtcgcgaagggaggcgtetcetcccttea48MetAlaMetAlaValPheArgArgGluGlyArgArgLeuLeuProSerategcclieAlacaggagGinGlucgtaacArgAsn50MetLys65getcgcAlaArg20geiaggaGluGly35cgcatgArgMetMetVal<210》<211><212》3878PRT鼠耳芥<400>38MetAlaMetAlaCC3ProcttLeuaagLysateliecttLeuagtSergetgetAlaAla70ValPhe10getgetatecgatctAlaAlalieArgSer25ggagttcgatctateGlyValArgSerlie40gttaagaacatecaaValLysAsnlieGin5StecaagcttagagcaSerLysI;euArgAla7SProteaSeraagLys6015etctcttctgacLeuSerSerAsp30actcaagtggtgThrGinValVal45ateacaaaggcalieThrLysAlacaggecGinAlaArgArgGluGlyArg10ArglieuLeuProSer15lieAlaAlaArgProlieAlaAlalieArgSerProLeuSerSerAsp202530GinGluGluGlyLeuLeuGlyValArgSerlieSerThrGinValVal354045ArgAsnArgMetLyBSerValLysAsnlieGinLyslieThrLysAla505560MetLysMetValAlaAlaSerLysLeuArgAlaValGinAlaS570759614419223484atgtggaatccacttteatgggtcatggaaatggetgcaateatggccMetTrpAsnProLeuSerTrpValMe仁GluMetAlaAlalieMetAla657075802403ttliegetAlattggccAlaAsn85ggtgatggtaiggcctccggaittggcaggattttGlyAspGlyArgProProAspTrpGinAspPhe9095288gttggtattatetgtctgttggttateaactctaccateagttttateValGlylielieCysLeuI*euVal工leAsnSerThrlieSerPhelie100105110336GlugaaGlu11533tAsngetAlaggtGlyaatgetAsnAla120getgetgetcttAlaAlaAlaLeuatgMet125getAlaGlycttLieu3B4getcctaaaaccaaggttcttagggatggaaagtggagtgaacaagaaAlaProLysThi:LysValIeuArgAspGlyLysTrpSerGluGinGlu130135140432getgetattcttgtcccaggagatattgttageattaaattaggagacAlaAlalieLeuValProGlyAsp工leValSerlieLysLeuGlyAsp145150155160480attateccagetgatgcccgtctacttgaaggtgatcctttaaagg仁tlielieProAlaAspAlaArgLeuLeuGluGlyAspProLeuLysVal1S5V70175528gaccaatctgetctaactggagagteccttcctgtaAspGinSerAlaLeuThrGlyGluSerLeuProVal180185Thrsag190HisccgPro5*76GlyGinGlu195gttvalttctctggttea200acctgcaaacsaThrCysLysGinGly205gaaGluliegag624gcggttgttattgccactg的gttcataccttcttcggtAlaValVallieAlaThrGlyValHisThrPhePheGly210215220LyagetAlagetMa67285<210>39<211>2B47<212>DNA<213>鼠耳芥<220><221>基因<222>(1),(2847)<223>包含質(zhì)膜靶向序列的^4了356基因<220><221>CDS<222>(1)--(2844)<223>包含質(zhì)膜靶向序列的^+1了?356<300><308>GenBank/J05570<309>1993-04-27<400>atgtcgMetSer39agtSeretcUeugaaGlugatAsp3tClieaagLysAsmgaga_ctgttGluThrVal10AspctgLeuGlu15liys4B3ttlieccgProattlieSf3gGlu20gaaGlugttValttcPhecagGincagGin25etaaaatgtIjeuLysCystC3Ser柳Arg30gaaGluggaGly36ttgLeuThraegThr35GingaaGiugggGlygaggacAsp403ggattcagatelieGinliettt45cccProAsti144aagLysLeu50GlugagGlu333lysaagIjysGlu55ageSer333liyscttctgaagLeuLeuIjys60tttPhettgLeugggGlytttPhe192C3C225ctt9tgAspageact23033CC33cat235ttcGingttcttLeu2407203C3ThrgccAlaliegggGlyAsn245ttcPhetgtCysELtClieCystecSet*250UegetAlaatelie的tGlyatgMet2553t9V3l7SBliegagGlu3tClieate工le2S0gtcatgMetTyrccgProatelie2S5GincgcljysTyr270agaArggatAsp816993GlyattlieASp275ABncttLeuttgLeugtcValetcLeu230tt3Leuatelie的tGly的tGly3tClie2fl5ProattliegetAla8S4atgMetcctPro290acagtcValttgLeutecgtgVal295ThrMetgetAla3ttlieggg300tctSerC3CHis叩gArgttglieuS12tct305C3gGinC3&GinggtgccAlalie310ThrcgtatgMetsetThr315gccAlaattliegasGlugagGluaitgMet320960AlaGlyatgMetgatAspgtcVal32SctgLeutgcCysagtSergacAspLysThr330柳GlyThretaLeu3CCThr335etcLeu100833C333IjysttgLeuSer340gtgABp333ijys33CAsn345gtcvalgagGlugttttctgcCys350aagIjysggtGly1056gtgValgagGluLys355gatAspGingtcValetalieuLeu360tttgcaAlagetAlaatgMetgetAla365tecSer9ttValgagGluAsncagGingatAspgccAlaattliegatAsp375gcaAlaAlaatgMetgttVal鵬Gly380atgMetcttLeugetAlagatAsp1152Pro385gagGlugetAlaagaArggetAla39099aGlyatelieaggArggaaGlugtt395HisttcPhecttLeuProttcPhe4001200AsncctProgtggatAspaag405agasetThrgetAlattgLeuactThr410t3C3ttliegacAspGlyagtSer415ggtGly1248AsntggTrpHisArg420gtcvalagtSerLysggtGlygetAla425cctProgagGlucagGinstcetcLeu430gaaGlucttLeugecAlagecAla435ageSer33tAsngatAspcttLeuSer440aagaagLys9tgValetclieutecSer445attlieattUeAsp1344aagLys450getAlagagGlucgtGlycttLeu4553的ArgSerttgLeugetAlagttVal460getAlacgcArgGingtgVal1392gtgVal465ccaProGluLysThr470333GluSerCC3Pro犯tGlyAla475ProTrpGluttt4801440ggcGlyttgttgTLeuProcttLeu48St仁tPhegaitAspProCC3Proaga490catHisgacAspagtSergetAlagaaGlu495Thr1488attcgaArgegggetAla500ttg33tcttggtGlygttVal5053dCgtcvalaagatgMetatelie510actThrGly1536gacAspGinctt]jeu515getAlaattlieggtGlyaagLysGlu520setThrggtGlycgcArgagacttLeu525gg3GlyatgMetGly15843C3Thr33仁Asn530MettatTyrCC3ProtcttcgSer535getAlacttcttLeuggtacaGlyThr540HisLysgacAspgcaAla1632aacetcgcatecattcctgttgaggagttgattgaaaaggetgatggaAsnLeuAlaSerlieProValGluGluLeu工leGluLysAlaAspGly5455505555S01S80tttgccggagtcttcccagagcacPheAlaGlyValPheProGluHis565tacTyr57DGluattlieVal站aLys站g575ttgLeu1728caggagaggaagcatattgttggaatgactggtgatggtgtcaatgatGinGluArgLysHislieValGiyMetThrGlyAspGlyValAsnAsp5805855901"6gcccctgetetaaagaaagetgatateggtattgc仁gt仁getgatgetAlaProAlaLeuLysLyBAlaAsplieGlylieAlaValAlaAspAla5956006051824acagatgetgetcgtggtgetteagatategtgetcactgagcctggaThrAsp-AlaAlaArgGlyAlaSerAsplieValLeuThrGluProGlyS10S15S201872etcagegttattateagtgetgttetcLeuSerVallielieSerAlaValLeu625S30ThrageSer635getAlaliettcPheGin6401920agaatgaagaactatactatetatgcagtcteaateArgMetLysAsnTyrThrlieTyrAlaValSerlie650Thrateliecgt655lie1963gtgtttggtttcatgcttattgetttgatatgggaattt9acttcteaValPheGlyPheMetlieulieAlaI*eulieTrpGluPheAspPheSer660665。02016gccttcatggt仁ctgateattgccattcttaacgacAlaPheMetValLeulielieAlalieLeuAsnAsp675680ggtGiyTha:S8SatelieatgMetacaateteaaaggacagagttaagccatctThrlieSerLysAspArgValI*ysProSer690635ProThr700cctgatProAspageSerTrp2112aaacttaaagaaatttttgetLysLeuLysGluliePheAla705710actggagtcgttctaggaggcThrGlyValValiei;G2yG2y715cag7202160gecatcatgactgttattttcttctgggcggcgcacaagactgactttAlaUeMetThrValliePhePheTrpAlaAlaHisLysThrA印Phe72S7307352208ttcteggacacattcggtgtgaggtecattagggacaataacPheSerAspThrPheGlyValArgSerIjeArgAspAsnAsn740745750HisgagGlu225€ctaatgggtgcggtgtacttacaagttagtatcattagtLeuMetGlyAlaValTyrLeuGinValSerlielieSer755760765GingetAlactglieu2304atcttcgtcacaagateaaggagttggtcttttgttgaacgtcctggaliePheValThrArgSerArgSerTrpSerPheValGluArgProGly7707757802352gcattgctgatgattgetttcetcattgcacaactgattgetactttgAlaLeuLeuMetlieAlaPheLeulieAlaGinLeulieAlaThrLeu7857S07358002400attgcggtttacgecaactgggaatttgcaaagattaggggtattggalieAlaValTyrAlaAsnTrpGluPheAlaLyslieArgGlylieGly8058108152448tggggatgggetggtgtgatctggctatacagtattgtcacatacttcTrpGlyTrpAlaGlyVallieTrpLeuTyrSerlieValThrTyrPhe8208258302496ccattggacg仁tttcaagt仁tgecattcgatacatcttgageggaaagProLeuAspValPheLysPheAlalieArgTyrlieLeuSerGlyLys83584084S2544gcgtggetcaacttgtttgagaacaagacggetttcacgatgasgaaaAlaTrpleuAsiiLeuPheGluAsrxLysThrAlaPheThrMetLysLys850B558602592gatAsp865TyrGlyLysgaagagGluGlu870gaggetGluAlacaatgggcaGinTrpAla875cttgetLeuAlacaaaggGinArg8802G40ThrcttLeuHisGlyttacagLeuGlu885CC3ProgaaIiysGlugetgttaacAlaValAsn890atettc工lePhecctgagProGluB952688333Lys躬aGlyagtSerTyx900agagaaArgGluLeutctgagSerGlu905ategetgaglieAlaGlucaagetGinAla910aagagaLysArg2736agagetAlaGlu915ateliegetaggAlaArgcttLeuagggagArgGlu920ctgcacacaLeuHisThretcaagIjeuLys92SggacatGlyHis27849tgValgaaGlu930SerValgtgaagValLysetaIjeu935aagggcI*ysGlyttggacattLeuAsplie340gaaactGluThrcccagtProSer2832C3CHis945setThrValtag2847<213:40PRT鼠耳芥<400>40MetSerSerIjeuGluAsplieLysAsnGluThrValAspleuGluLys51015liePro工leGluGluValPheGinGinLeuLysCysSerArgGluGly202S30LeuThrThrGinGluGlyGluAspArglieGinliePheGlyProAsn35404591lysLeuGluGluLystiysGluSerLysLeuL>euLysPheLeuGlyPhe505560MetTrpAstiproLeuSerTrpValMetGluMetAlaAla工leMetAla65707580lieAlaLeuAlaAsnGlyAspGlyArgProProAspTrpGinAspPhe859095ValGlylielieCysLeuLeuVallieAsnSerThrlieSerPhelie10D105110GluGluAsnAsnAlaGlyAsnAlaAlaAlaAlaLeuMetAlaGlyLeu115120125AlaProLysThrLysValLeuArgAspGlyLysTrpSerG1mGinGlu130135140AlaAlalieLeuValProGlyAsplieValSerlieLysLeuGlyAsp145150155160lielieProAlaAspAlaArgLeuLeuGluGlyAspproLeuLysVal165170175AspG工nSerAlaLeuThrGlyGluSerLeuProVa工ThrLysffisPro180185190GlyGinGluValPheSerGlySerThrCysLysGinGlyGlulieGlu195200205AlaValVallieAlaThrGlyValHisThrPhePheGlyLysAlaAla210215220HisLeuValAspSerThrAsnGinValGlyHisPheGinLysVa〗Leu225230235240TlirAlalieGlyAsnPheCyslieCysSetlieAlalieGlyMetVal245250255lieGlulielieValMetTyrProlieGinArgArgLysTyrArgAsp260265270GlylieA曰pAsnLeuLeuValLeuLeulieGlyGlylieProlieAla27528028SMetProThrValIeuSerValThrMetAlalieGlySerHisArgLeu290295300SerGinGinGlyAlalieThrLysArgMetThrAlalieGluGluMet305310315320AlaGlyMetAspValLeuCysSerAspLysThrGlyThrLeuThrLeu32533033SAsnLysLeuSerValAspLysAsnLeuValGluValPheCysLysGly340345350ValGluLysAspGinValLeulieuPheAlaAlaMetAlaSerArgVal3553603S5GluAsnGinAspAlalieAspAlaAlaMetValGlyMetLeuAlaAsp370375380ProLysGluAlaArgAlaGly工leArgGluValHisPheLeuProPhe385390335400AsnProValAspLysArgThrAlaLeuThrTyrlieAspGlySerGly40S410415AsnTrpHisArgValSerJbysGlyAlaProGluGinlieLeuGluLeu420425430AlaLysAlaSerAsnAspLeuSerUysLysValLeuSerlielieAsp435440445LysTyrAlaGluArgGlyLeuArgSerJjeuAlaValAlaArgGinVal450455460ValProGluLysThrLysGluSerProGlyAlaProTrpGluPheVal46547047548093GlyLeuLeuProLeuPheAspProProArgHisAspSerAlaGluThr405490495lieArgArgAlaLeuAsnLeuGlyValAsnValLysMetlieThrGlyS00505510A印GinLeuAlalieGlyLysGluThrGlyArgArgLeuGlyMetGly515520525ThrAsnMetTyxProSerSerAlaLeuLeuGlyThrHisLysAspAla53053S540AsnIjeuAlaSerlieProValGluGluI^ulieGluLysAlaAspGly545550555560PheAlaGlyValPheProGluHisLysTyrGlulieValLysLysLeu565570575GinGluArgLysHislieValGlyMetThrGlyAspGlyValAsnAsp580585590AlaProAlaLeuLysLysAlaAsplieGlylieAlaValAlaAspAla595600605ThrAspAlaAlaArgrGlyAlaSerAsplieValLeuThrGluProGly610615620LeuServallielieSerAlaValLeuThrSerArgAlaliePheGinS25630635640ArgMetLysAsnTyrThrlieTyxAlaValSerlieThrlieArglie645650655ValPheGlyPheMetLeulieAlaLeulieTrpGluPheAspPheSer660665670AlaPheMetValLeulie工leAlalieLeuAsnAspGlyThrlieMet67568068594ThrlieSerLysAspArgValLysproSerProThrProAspSerTrp。0S95700LysLeuLysGluliePheAlaThr705710AlalieMetThrValPhePhe725PheSerAspThrPheGlyValArg740liePheValThrArgSerArgSer770775AlaLeuLeuMetlieAlaPheLeu785790GlyValValLeuGlyGlyTyrGin715720TrpAlaAlaHisLysThrAspPhe730735SerlieArgAspAsnAsnHi曰Glu745750SerlielieSerGinAlaLeuTrpSerpheValGluArgProGlylieAlaGinLeulieAlaThrLeu795BOOLeuMetGlyAlaValTyxLeuGinVal7S5760lieAlaValTyrAlaAsnTrpGluPheAlaLyslieArgGlylieGly805810815TrpClyTrpAlaGlyVal工leTrpLeuTyrSerlieValThrTyrPhe820825830ProLeuAspValPhelysPheAlalieArgTyrlieLeuSerGlylys835840845AlaTrpLeuAsnLeuPheGluAsnLysThrAlaPheTh:CMetLysLys850855860AspTyrGlyLysGluGluArgGluAlaGinTrpAlaLeuAlaGinArg865870875BBOThrLeuHisGlyI*euGinProLysGluAlaValAsn工lePheProGlu88589089SLysGlySerTyxArgGluIeuSerGlulieAlaGluGinAlaLysArg900905910ArgAlaGlulieAlaArgLeuArgGluLeuHisThrLeuLysGlyHis915920925ValGluSerValValLysLeuLysGlyLeuAsplieGluThrProSer930935940HisTyrThrVal345<212)<221:=<222-<220><221><222><223><300><308><309>41525DNA褐家鼠基因(l)..(525)包含磷脂酰肌醇4,5-二磷酸靶向序列的磷脂酶C-delta1的部分pleckstrin同源結(jié)構(gòu)域的CDS(1)*(522)包含磷脂酰肌醇4,5-二磷酸靶向序列的磷脂酶Odelta1的部分pleckstrin同源結(jié)構(gòu)域GenBank/NM一O1703S2000-11-01<4D0>41gatetegggtagggacttcctgaccctgcacgggetccaggatgacccg48AspSerGlyArgAspPheLeuThrLeuHisGlyLeuGinAspAspPro151015gacAspcttLeucagGinAla20cttctglieuaagLysggcageSer25cagGincttctgLeuLeuaaggtgVal30LystecSerageSertegSerTrp35a的Argg貼GlucgcttcPhe40taicTyxetaca_gLeu(Un弼45gacAspCysaag144Thratelie50tggTrpcagGingaaGlutctSercga55aaggtcatgMetaggtecArgSer—60ccgProgagGlutegSercagGin192ctg65ttcPhetecSerliegagGluAsp70lieGingagGlugtaValeggatgArgMet75GlyHiscgcArg3C3Thr80240GluGlyLeugagGluaagLys85tttPhegccAlacgaArggacAsplie90cccgagProGlugatAspcgaArgtgcCysttcPhe288tecattliegtcValttcPhe100sagAspcagGinArgAsn105ThretagacLeuAspetc3tt工le110gccAlaPro336teaSerProgetAla115gacAspgetAlacagGinescHist的Trp120gtgValGinggcctgGlyLeucgcArg工253sgLyslie3tClie3B4HisescHis130tec躬cGlytecSexatgMetgacAsp135cagGineggArgcagGinaagctgIjysLeu140cagGinHistggTrp3ttlie432His145tecSertgcCystt9LeucgaArgLys150getAlagatAsp333AsngacLysAsp155AsnaagatgMetAsn160480ttcPhegagGluctgLeusagIiys165gacAspttcPhectgLeuaagLysgagGlu170CtC33CliecagGinS25<210>42<211>174<212>PRT<213>褐家鼠AspPheLeuThrLeuHisGlyLeuGinAspAspPro51015AspLeuGinAlaLeuLeuLysGlySerGinLeuLeuLys"ValLysSer202530SerSerTrpArgArgGluArgPheTyrLysLeuGinGluAspCysLys354045ThrHeTrpGinGluSerArgJjysValMetArgSerProGluSerGin505560LeuPheSerlieGluAsplieGinGluValArgMetGlyHisArgThr65707580GiuGlyLeuGluLysPheAlaArgAsplieProGluAspArgCysPhe85903SSerlieValPheLysAspGinArgAsnThrLeuAspLeulieAlaPro100105110SerProAlaAspAlaGinHisTrpValGinGlyLeuArgLyslielie11512012SHisHisSerGlySerMetAspGinArgGinLysLeuGinHisTrplie130135140HisSerCysLeuArgLysAlaAspLysAsnLysAspAsnLysMetAsn145150155、160PheLysGluIjeuLysAspPheLeuLysGluLeuAsnlieGin165170<400>42AspSerGlyArg<210>43<211>2B2<212>DNA<213>小家鼠(Musmuscu]us)<220><221>CDS<222>《1).-(282)<223〉包含磷脂酰肌醇4-磷酸靶向序列的FAPP(家族A(磷酸肌醇結(jié)合特異)成員3)的部分pleckstrin同源結(jié)構(gòu)域c308>GenBank/BCMmilO<400>43atg9aggggMetGluGlygt仁ctgtacaagtggaccaactatetcacaggttggcagValLeuTyrLysTrpThrAsiiTyrThrGlyTrpGin5101548cctcgatggtttgttctggataatggaatectgtectactatgacteaProArgTrpPheValLeuAspAsnGlylieLeuSerTyrTyrAspSer202530caggatgatgtctgcaaagggageaaagggagtataaagatggcggtcGinAspAsp"ValCysLysGlySerLysGlySerlieLysMetAlaVal354045144tgt9agattaaa9tccatcccgcagacaacacaagaatggag匕taateCysGlulieLysValHisProAlaAspAsnThrArgMetGluLeulie50'5560192attccaggagagcagcatttc仁acatgaaggcagtaaatgccgccgaglieProGlyGluGinHisPheTyrMetLysAlaValAsnAlaAlaGlu6570758024099agacagaggtggctggttgcccttgggagetecaaagcgtgc282ArgGinArgTrpLeuVaiAlaLeuGlySerSerLysAlaCys8530<210>44<211>94<212>PRT<213>小家鼠MetGluGlyValLeuTyrLysTrpThrAsnTyrLeuThrGlyTrpGin151015ProArgTrpPheValLeuAspAsnGlylieLeuSerTyrTyrA日pSer202530GinAspAspValCysLysGlySerLysGlySerlieLysMetAlaVal354045CysGlulieLysValHisProAlaAspAsnThrArgMetGluLeulie505560lieProGlyGluGinHisPheTyrMetLysAlaValAsnAlaAlaGlu65707580ArgGinArgTrpLeuValAlaLeuGlySerSerLysAlaCys8S90(210>45c21h741c213>煙草葉脈斑-點(diǎn)病毒<220><221>基閔<222>(1)..(741)<223>NIa蛋白酶基因<220><221>CDS<222>U)--(738)<223>NIa蛋白酶<300x<30S>GenBanJc/AF*222050<309>2000-02-07<400>atgteaMetSer45aagLysgcgAlaetaLeucttLeuaagIjysGlygtgValArg10gatAsptttPhe33tCC3Proatelie15tctSer48gettgcAlaCysgtatgcCys20etclieucttlieu闊GlutecSer25tegSergatAsp卿catHisagtSer30gagGluaga9Sctgt仁tLeuPheggcGly353ttlieggtGlytttPheGlyPro40tatTyratelie3tt工legecAla33CAsn45GincatHisLeu144tttageiPheArg50aggAsnaatGlygagGlu55ttgLeua_ctThr3tClieLysThr60atgMetcatHis妙GlyGlu192ttcaaaPheLys65ValLysteaSer703C3ThrGinttgLeuGinatgMet75333Pro3ttValgagGluGly80240agagacArgAspatalie3t3lie853tClieLysatgMetgetAlaaagSOgacAspttcPheProccaProttcPhe95cctPro288C33333GinLysLeu333100ttcagacagGinPro3CCThr105ateaaagatlieLysAspagaArgg仁gVal110tgcCysatgMet33SgtatecValSera_c3aat115tttPheGincagGin120agtgtctctagtLeu125gag384tcsteaSerSer130C3C3ttHisliegtgValestHis135gagGlugacAspactteaThrSerttcPhe140TrpGinC3CHistggTrp432aLtaiacalieThr;u5acaa_agThrUysgatAspGly150GintgtCysGlyagtccgSerPro155g仁tVal仁C3Ser3tclie3仁tlie160430ga仁ggaAspGlyaatafctAsnliettgLeu165Gly3tClieHisagectgacgJjeuThr170catHisacgThr3CCThr331Asn175Gly528agea3tSerAsntscttcTyrPhe180ValgaaGlutttPhecc仁Pro柳185sagttcIjysPhegtaValgetAlaa_c3Thr190TyrcttLeu576gatgccAspAlagetgatAlaAsp195ggtGlytggTrptgcCys200BattggaagTrpIjysttcPhe33tAsn205getAlagatAsp624ateagtlieSer210tggggtTrpGlytectttPheThr215ttaValgaggatGluAspAla220cccProgaaGlugatAspAsp672ttcatgPheMet225gccaagAlaLys335act230gttValgccAlagccAlaateatglieMet235gacAspgatAspttgLeugtcValcgc240720ThrGin393ggaGlyGlyGlu24SgetAlatg741<210>46<211>246<212>PRT102<2i3>煙草葉脈斑點(diǎn)病毒<400>46MetSerLysAlalieuLeuLysGlyValArgAspPheAsnProlieSer15.1015AlaCysValQysLeuLeuGluAsnSerSerAspGlyHisSerGluArg202530LeuPheGlylieGlyPheGlyProTyxlielieAlaAsnGinHisLeu354045PheArgArgAsnAsnGlyGluLeuThrlieLysThrMetHisGlyGlu505560PheLysValLysAsnSerThrGinLieuGinMe仁LysProValGluGly65707580ArgAsplielieVallieLysMetAlaLysAspPheProProPhePro859095GinLysLeuLysPheArgGinProThrlieLysAspArgValCysMet100105110ValSerThrAsnPheGinGinLysSerValSerSerLeuValSerGlu115120125SerSerHislieValHisLysGluAspThrSerPheTrpGinHisTrp130135140lieThrThrLysAspGlyGinCysGlySerProLeuValSerlielie145150155160AspGlyAsnlieLeuGlylieHisSerLeuThrHisThrThrAsnGly165170175SerAsnTyrPheValGluPheProGluLysPheValAlaThrTyrLeu180185190AspAlaAlaAspGlyTrpCysLysAsnTrpLysPheAsnAlaAspLys195200205lieSerTrpGlySerPheThrLeuValGluAspAlaProGluAspAsp210215220PheMetAlaLysLysThrValAlaAlalieMetAspAspLeu"ValArg225230235240ThrGinGlyGlyGluAla245<:210-4712人工序列<220-<223-合成序列《220)<2225<223-CDS(1)..U2)Nla蛋白酶切割序列<400>47gtgcgcttccagValArgPheGin12-210>-211:=-212:4PRT人丁序歹'J<400>48ValArgPheGin<210>49<211>21<212>DNA<213>人工序列<220><:223>合成序列<220><221>CDS<222>(1)--(21)《223>NIa蛋白酶切割序列<300><:308>GenBank/AX427722<309>2002-06-2049gaaccagtcGluProValtatttccaagggTyrPheGinGly21<210>50<211>7<212>PRT<213>人工序列<400>50GluProValTyrPheGinGly<210>51<211>1638105<212><220><223><220><221><222><223><221)<222><223;><220><221><222)<223〉DNA人工序列合成序列(l)..(翻)RFP:PS(NIa蛋白酶):At0EP7:GEP基因CDSU).,(1635)RFP:PS(NIa蛋白酶):AtOEP7:GFP雜合蛋白misc—特征("..(1638)CDS:RFP(l..678)+ADs-CDS:NIa蛋白酶水解位點(diǎn)(700..711)十ADs-CDS:AtOEP7(712..900)+ADs-CDS:GFP(922,.1635)<400atgMet51gtgcgcValArgtecSertecsagLysAsrxgtcValatelieaagLys10gagGluPheatgMetttcaagPheLysIS489tgValcgcatgArgMetgagGlu209SCValAbuGly25HisgagGluttcPhe柳Glu3tClie30gagggcGluGly96gagGluggc939GlyGlu35GlycgccccPro弼Glu40GlyHis33CAsngtgVal45aagLysctgaagLeuLys1"gtgaccaagggcggccccctgcccttcgectgggacatectgtecccc192ValThrLysGlyGlyProI^uProPheAlaTrpAsplieLeuSerPro505S60cagttcGinPhe65cagGintac卿tecSea:70aaggtgtacgtgValLys75HiscccProgccAlagacAspatelie80240ProAsp33gLys站gLys8SctgLeutecSerttcPhecccProgagGlu90ggcGlyttcPheaagLyst的Trpgag95cgc288gtgatgValMe'tttcPbe100SagGluAspGly砂GlyVal105Val2LCCThr9tgValThrcagGin110gacAsptecSer336tecctgSerLeuGinU5AsptgcCysttcate工le120tacTyraagLysValaagttcPhe125ate工leGlygtgVal384aacttcAsxiPhe130cccProtecSergacAsp的cGlycccPro135gtaValMetGinLysaagLys140ThrMetGlyt的Trp432gaggcctecaccgagcgcctgtacccccgcgacggcgtgctgaagggcGluAlaSerThrGluArgLeuTyrProArgAspGlyValLeuLysGly1451501S5160480gagateGulieC3CHisaagAla165ctgLysctgLysgacAsp170的c的cHistacTyrctgLeu175ValS28gagttcaagtecatetacatggc:caagaagcccgtgcagctgcccggcGluPheLysSerlieTyrMetAlaLysLysProValGinlsuProGly180185190576tsctacTyrTyrTyi:"5gtgValgacAsptecSerctg200Asp3tClietecSerHis205a玉cA幼gagGlu624tacaccategtggagcagtacgagcgcaccgagggccgccaccacctgS72107TyrThrlieValGluGinTyrGluArgThrGluGlyArgHisHisLeu210215220ttcctgPhelieu225cccProegggcaAlaate工le230aagctgGlygtgValcgcArg235ttcPhecagGinggaGlyIiysactThr240720tegggaSerGlygcgAlacagGin245AlasetThrgtgValgtcVal250gcaAlagcgAlaatgMetgcgAlat匕aLeu25SggaGly768tggttaTrpLeugccAlalie2609agGlu3tcliegetAlaPheLys265cctProttcetcLeugatAsp270ttcPhecgc816tecteaategacaaatctgacccaaccaaagaccccgatgacttcgacSerSer工leAspLyBSexA叩ProThrLysAspProAspAspPheAsp2752802B58643ccgccThrAla290getAlaactThrAlaa>ccThr3C3Thr295tecSerLysgag991Glytt3Leu300的gGlyatelieGinggaGly912gatataAsplie305ThratgMetagtSer310的aGlygasGluGlucttttc315setThrGlygttgtcValCCSlPro320960attcttlieLeugttValttaLeu325gatAsp的tGlyAspValsat330鵬GlyHisLysttttctSer335gtcVal1008SerGlygagGluggtGly340gaaggtGlygatAspgcaAlaseaThr345tac993GlycttaccThr3S0CttLeu1056tttattPhelietgcCys355ELCtThractThrGlyCt3Leu3SDcctProgttValProtggPro3S5ThrcttLeu1104actactttctcttatggtgttcaatgctttteaagatacccagatcat1152ThrThrPheSerTyrGlyValGinCysPheSerArgTyrProAspHis370375380atgaagMet:Dys38SeggescHisgacAspttcPhe390ttcaagLysageSergccAlaatgcctgagMetProGlu395ggaGlytacTyrSftg4001200caggagGinGluArgThrateHe405tctttcaaggacAspgacAsp410gggaactacGlyAsnTyraagThr415cgt1248getgaaAlaGlugtcValsag420tttPhegagGlu砂GlyAspsecThr425etcLeugtcaaca的ValAsnArgatelie430gagGlucttLeu1296aagggaLysGlyatelie435gatAspttcPtiegagGlugacAsp440GlyAsillieetcggcLeuGly445HisaagttgLeu1344gaatacGluTyr450AsntacTyrAsntecSerescHis455ValTyrlieacggcsiThrAla460gacAspGin1332aagaatggsiateaaagetaacttcaaaattagacacaacattgaagatLysAsnGlylieLysAlaAsnPheLyslieArgHisAsnlieGluAsp4654151440的aageGlySer9ttValc站GinetaLeu485AlagacAspestHistatcsaTyrGin490Gin33tsetProattlie495柳Gly1488gatggcAspGlycc仁ProgtcVal500cttlieuLeuCC3ProAspaacC3tAsnHis505t3CTyrctgtecI*euSerThr510C33GintctSer1S36gcccttAlaLeutegSer515LysAspProAsngaaGlu520aagagaLysArggacAspcacatgHisMet52SgtcValcttctt!>eu1584gagtttgtaacagetgetgggattacacatggcatggatgaaetatac1632109GlxiPheValThrAlaAlaGlylieThrHisGlyMetAspGluLeuTyr530535540aaataa545<212:<213:=52545PRT人工序列<400>52Met"ValArgSerSerLysAsnVallieLysGluPheMetArgPheLys151015ValArgMetGluGlyThrValAsiaGlyHisGluPheGlulieGluGly202530GluGlyGluGlyArgProTyrGluGlyHisAsnThrValLysLeuLys354045ValThrXjysGlyGlyProI*euProPheAlaTrpAsplieLeuSerPro505560GinPheGinTyrGlySerLysValTyrValLysHisProAlaAsplie65707580ProAspTyrLysLysLeuSerPheProGluGlyPheLysTrpGluArg9095ValMetAsnPheGluAspGlyGlyValValThrValThrGinAspSer100105110SerLeuGinAspGlyCysPhelieTyrLysValLysPhelieGlyVal115120125AsiiPheProSerAspGlyProValMetGinLysLysThrMetGlyTrp1301351401638GluAla8erThrGluArgLeuTyrProArgAspGlyValLeuLysGly14515015SISOGlulieHisLysAlaLeuLysLeuLysAspGlyGlyHisTyrLeuVal165170175GluPheLysSerlieTyrMetAlaLysLysProValGinLeuProGly180185190TyrTyxTyxValAspSerLysLeuAsplieThrSerHisAsnGluAsp135200205TyrThrlieValGluGinTyrGluArgThrGlu.GlyArgHisHisLeu210215220PheLeuProArgAlalieLysLeuGlyValArgPheGinGlyLysThr225230235240SerGlyAlaLysGinAlaThrValValValAlaAlaMetAlaLeuGly24525025STrpLeuAlalieGlulieAlaPheLysProPheLeuAspLysPheArg260265270SerSerlieAspLysSerAspProThrLysAspPj:oAspAspPheAsp275280285ThrAlaAlaThrAlaThrThrSerLysGluGlyLeuGlylieGinGly290295300A印lieThrMetSerLysGlyGluGluLeuPheThrGlyValValPro305310315320lieLeuValGluLeuAspGlyAspValAsnGlyHisLysPheSerVal325330335SerGlyGluGlyGluGlyAspAlaThrTyrGlyLysLeuThrLeuLys340345350PhelieCysThrThrGlyLysLeuProValProTrpProThrLeuVal355360365ThrThrPheSerTyrGlyValGinCysPheSerArgTyrProAspHis37037S380MetLysArgHisAspPhePheLysSerAlaMetProGluGlyTyrVal385390395400GinGluArgThrlieSerPheLysAspAspGlyAsnTyrLysThrArg405410415AlaGluValLysPheGluGlyAspThrI*euValAsnArglieGluI>eu420425430LysGlylieAspPheLysGluAspGlyAsnlieLeuGlyHisLysLeu435440445GluTyrAsnTyrAsnSerHisAsnValTyrlieThrAlaAspLysGin450455460LysAsnGlylieLysAlaAsnPheLyslieArgHisAsnlieGluAsp46S470475480GlySerValGinLeuAlaAspHisTyrGinGinAsnThrProlieGly'485430495AspGlyProValLeuI*euProAspAsnHisTyrLeuSerThrGinSer500505510AlaLeuSerLyBAspProAsnGluLysArgAspHisMetValLeuLeu515520525GluPheValThrAlaAlaGlylieThrHisGlyMetAspGluLeuTyr53053S54054S<210>53<211>3579<212>DNA<213>人工序列<220><223>合成序列<220><221>基因<222>(1).(3579)<223>H—ATPase:PS(NIa蛋白酶)GTP雜合蛋白基因<220><221>CDS<222>U)--(3576)<223>H+-ATPase:PS(NIa蛋白酶)GFP雜合蛋白<220><22l>misc—特征<222>(1)..(3579)<223>CDS:H+-ATPase(l..2844)+ADs-CDS:NIa蛋白酶切割序列(2851..2862)+ADs—CDS:GFP(2863..3576)<40D>53atgtcgagtMetSerSeretcLeuGluAspateliesagLys弼Glu10actThrgttValgatAspctgLeugsaaaaGluLysIS48attccgatt工leProliegagGlu20gaagttttcPheGinGin25eta:Leu333CystC3SerArg30gaaggaGuGly96ttgacaacgLeuThrThr35GingasGluGlyGlugacAsp40的gArgliecagGinlietttPhe45的CGlyCCC33CProAsn144113aagetcLysLeu50gaaGlugagGluaagLysGlu55ageSercttctgLeuLeuLys60仁ttPhettgGlyttt192atgtggMetTrp65AbiiCCSLProcttLeuteaSet*70tggTrpgtcValatgMetgaaatgGluMet75getAlagcaAla3tClieatgMetAla80240attgetlieAlaLeugccAla站cAsn85GlygatAspGlycctccgProPro90gatAsptggcagGlugatAsp9StttPhe288gttggtValGlyattliea_tclie100tgtCysctgIjeuttgIjeugttatelie105sactctAsnSerThrate工leagtSer110tttPheatelie336gaagaaGluGlu115satAsngetAlaggtGly33tAsngetAla120getAlagetgetAlaAlac仁tatgMet125getAla妙GlycttLeu384getcctAlaPro130Lys3CCThraagLysgttValcttLeu135ArggatAspGlyaagLystggTrp140sigtSerGingaaGlu432getgetAlaAla145liecttLeugtcValCC3Pro150GlygatAsp3ttliegttvalage155attlieLysttaLeuGlygacAspISO4803tt3tClielieProgetAlagatAsp165gccAlacgtCt3cttLeugaaGlu170GlygatAspcctProttaLeuaagLys175gttVal528gaccaatctAspGinSergetAla180Ct3Leu3CtThrgga9agGlutec185cttlieucctPro9t33CCThrISOC3CHisccgProggtcaagaaGlyGinGlu195gttValttcPhetctSerGlytC3Ser2003CCThrtgcCysLysGin卵a(bǔ)Gly205GluateliegagGlu624114gcggttgtt:AlaValVal2103ttliegccAla3CtThr卿21SgttValC3tHisThrttcPhettcPhe220GlygetAlagetAlaS72c&ccttgtgHisLeuVal225actThr230AsnGingttValggaGlycatHis235ttcPheGinaag9"cttLeu240720acagccattrie245ttctgtCys3tClietgttec250attliegetAlaatelie鵬atgMe仁255gtg768attgag工leGluatelie3tClie260ValMett3tTyrProlie265GinArgcgaaagTyr270gatAsp816ggaattGlylieAsp27533CcttLeuttgLeugtcValetc280Leuatelie99tGly<3ly3tClie285ccca仁tliegetAla8643tgcc:tMetPro290ThrValttgSer295ThratgMetgetAlaattlie999Gly300tctHisttgLeu912tctcagSerGin305C33GinGlygccAla3tClie310ThrLyscgt3tgMetactThr315gccAlalieGluSagGluatgMet320960gcaggaAlaGlyatgMetgatAspVal325ctgtgcCysgacAsp3303CCThrGlyThrCtSLLeu335etcLeu1008AsnIjys仁tgLeuagt340gtgValAsp333"9lieugtcValgagGlugttVa〗ttcPhetgcCys350aagLys柳Glygtggag3S5SatAspGing仁cValetaLeutt3Ijeu360tttPhegetAlaatgMetgetAla365tecSeragg1104gagaaccaggatgccattgatgcagccatggttgggatgcttgetgatGluAsnGinAspAlalieAspAlaAlaMetValGlyMetTjeuAlaAsp3703753801152ccaaaggaggetagagetggaateagggaagttProLysGluAlaArgAlaGlylieArgGluVal38539039SHisttcPhecttLeuProttcPhe4001200aaccctgtggataagagaactgetttgacttacattgacggcagtggtAsnProValAspLysArgThrAlaLeuThrTyrlieAspGlySerGly4054104151248AsntggTrpcacagaHisArg420gtcagtaaaggtValSerLysGlygetAla425cctPro9agcagGinatelieetc430gaaGlucttlieu1236gecaaagecageaatgatcttageaagaaggtgetctecattattgacAlaLysAlaSerAsnAspLeuSerLysLysValLeuSerlielieAsp4354404451344aagtatgetgagcgtggtctta的tegttggetgttgetcgccaggtgLysTyrAlaGluAxgGlyLeuArgSerLeuAlaValAlaArgGinVal45045S4601392gtgccagagaaaacaaaggaaageccaggtgcgValProGluLysThrLysGluSerProGlyAla465470475ProTrpgaaGlutttgttVal4801440ggcttgttgccactttttgatcccGlyLeuLeuProLeuPheAspPro485ProagaArg490C3tHisAspagtgetAlagaaGlu495Thr1488attlieegaegggetArgAla500ttgaatcttggtlieuAsnLeuGlygttVal50533CgtcValaagatgMet3tC工le510actggt1536gaccaacttgetattggtaaggaaactggtcgcagacttggaatgggaAspGinLeuAlalieGlyLy曰GluThrGlyArgArgLeuGlyMetGly5155205251584116ThrAsn530atgMettatTyrProtctSertcgSer535getAlacttLeucttLeuggtGiyThr540CSCHis333gacAspAla1S3233CCtCAsnLeu545gcaAlatecSer3ttliecctPro550gttValgagGlu弼GluttgIeuattlie555g汪aGluaaggetAlagatAspGly5S01680tttgccPheAlaggaGlygtcttcPheSS5ProgagGluHis333LysTyr570GluattUe9tgValLysaagLysS75ttgLeu1728caggagGinGlusag580C3tHis3tt工legtt的aGlyatgMetS85actThrggtGlygatAsp的tGlygtcval59033tAsnga仁Asp177SgcccctAlaProgetAla595lieuaagLysLiysgetAlagatAsp6003tClieggtGlyattliegetAlagttVal60SgetAlagatAspgetAla1824acagatThrAsp610getAlagetAlaArgggtGlygetJUa61SSergatAspateliec仁cLeu620ThrgagGiucctProGly1872etcageI*euSer62S3"Val3ttlieatelieagtSer630getAlagttValetclieuage635getAlaattliettcPheGinS401320agaatgArgMetLys33CAsnTyr"5actThr3tC工let3tTyrgcaAlagtc650teaSeratelie3CCThrateliecgt6S53ttliegtgtttValPhe妙GlyttcPheatgMetct仁Leu3ttliegetAlattg"53talieTrpGluPheAsp670ttcPheSer20JLGgcc仁tcAlaPheMetS75gttValctg3tClieliegccAla680attlieCttIi6uAsnAspggtaccGlyThr6853tCatgMet2064117acsateteaThrlieSer690"9LysgacAspArgValS9SsagccsLysProtctSerProThr700cctgatAspageSertggTrp2112aaacttaaaLysLeuLys705gaaGluattlietttPhe710getAlaactggagtcgtt715etaLeu的aGlyGlytacTyrcagGin720gecateAlalieatgMetactThrgtt725attliettcPhettcPhet的TrpAla730AlaHisaag&ctThrAsp735ttt2208ttctegPheSergacAspThx740ttcPhe的tGlygtgValArgtecSer745attliegacAsp3at750His9a3Glu2256etaatg的tgcggtgtacttacaagttagtateattagtcaagetctgLeuMetGlyAlaValTyrI*euGinValSerlielieSerGinAlaLeu7557607652304atettcliePhe770gtcValThragaSerArg77Sagtt的TrptctSertttPheg仁tVal780GlucgtArgcctProGly2352gcattgAleLeu785ctgLeuMetattliegetAla790ttcetc3ttliegcaAlaGin79SctgXjeuattliegetAlaactThrttgLeu8002400attgcggtttacgecaactgggaatttgcaaagattaggggtattggalieAlaValTyrAlaAsiiTrpGluPheAlaLys工leArgGlylieGly8058108152448TrpGlytggTrpgetAla820鵬GlygtgVal3tClieTrpetaLeu825TyragtSerliegtcThr830t3CTyrttcPhe24%cca仁tgProLeugacAsp835ValttcPheLystttgecAla840工leArgTyrlie"3Leu845ageSerGly2544118AlaTrp8S0etcLeuAsntt3tttgagGlu855AsnaagThrgetAlattcPhe8S0acgThratgMetLysLys2592gattacAspTyr865GlyLysgaaGlugagGlu870agaArggagGlugetAlaGilltggTrp875AlacttLeugetAlaGinaggArg8802640acacttThrlieuescHisGly885cagGinPro333LysGlugetAlaB90gtt■AsnateliettcPhecctPro89SgagGlu26B8aaaggaLysGlyagtSer900agaArggasGluttgLeutctSer評(píng)gGlu90SliegetAlagagGluGingetAla910Lysaga2736agagetArgAlagagGlu915UegetAlaArgcttLeuArg9209a3c仁glieucaicHis3C3ThretcLeu925aagLysGlycatHis27S4gtggaaValGlu930SerVal9tgValaagLeu935aagLysggcGlyttggacAsplie940gasGluThrProagtSer2832C3Ct3CHisTyr945actThrgtgValetcLeug巧Glu950ValArgttccagGinatgMet955agtSerGiyGlugasGlu9602880cttttcLeuPheSLCtThrggaGlygttVal9659tCValProattliecttLeugttValGluLeugatAsp99tGlygatAsp"5gttVal2928aatgggAsnGlyHis980tttPhetctSergtcValagtSerGly985gagGlugaaGluGlygatAsp3909caAlaThr2976tacggaTyrGly333Lys"5cttlieuThrcttLeu333tttLysPhe1000lietgcThractThrGly1005333LysetalieucctProgttccatggccaacactt:gtcactactttctcttatggtgttcaatgc3072ValProTrpProThrLeuValThrThrPheSerTyrGlyValGinCys101010151020tttteaagatacccagatcatatgaageggcacgacttcttcaagage3120PheSerArgTyrProA叩HisMetLysArgHisAspPhePheLysSer102S103010351040gecatgcctgagggatacgtgcaggagaggaccatetctttcaaggac3168AlaMetProGluGlyTyxValGinGluArgThr工leSerPheLysA印104510501055gacgggasctacaagacacgtgetAspGlyAsnTyxLysThrArgAla1060gaaGlu1065gtcValtttPhegagGluGly10*70Aspsec321Setcgtcaacaggategagcttaagggaategatttcaaggaggacgga3264LeuValAsnArglieGlu!LeuLysGlylieAspPheLysGluAspGly107510801085aacatec仁cggccacaagttggaatacaactacaacteccacaacgta3312AsnlieLeuGlyHisLysLeiiGluTyrAsnTyrAsnSerHisAsnVal109010951100tacateacggcagacaaacaaaagaatggaateaaagetaacttcaaa3360TyrlieThrAlaAspLysGinLysAsnGlylieLysAlaAsnPheLys1105111011151120attagacacaacattgaagatggaagegttcaaetagcagaccattat3408lieArgHisAsnlieGluAspGlySerValGinLeuAlaAspHisTyr11251130caacaaaatactccaattggcgatggccctgtccttttaccagacaacGinGinAsnThrProlieGlyAspGlyProVa2LeulieuProAspAsn114011451150cattacctgtecacacaatctHisTyrUeuSerThrGinSer1155gecctttegaaagatAlaLeuSerLysAsp11S0cccaacgaaaagProAsnGluLys11653504120agagaccacatggtccttcttgagtttgtaacagetgetgggattaca35S2ArgAspHisMetVallieuL^uGluPheValThrAlaAlaGlylieThr117011751180catggcatggatgaaetatacaaataa3579HisGlyMetAspGluI^uTyrLys1185<210><211><212><213>1190541192PRT人工序列<400>54MetSerSerLeuGluAsplieLysAsnGluThrValAspLeu510GluLys15lieProlieGluGluValPheGinGinLeuLysCysSerAtgGluGly202S30LeuThrThrGinGluGlyGluAspArglieGinliePheGlyProAsn354045LysLeuGluGluLysLysGluSerLysLeuLeuLysPheLeuGlyPheSOS5SOMetTrpAsnProSerTrpValMetGluMetXlaAlalieMetAlaS5707580I〗eAlaLeuAlaAsnGyAspCyArgProProAspTrpGinAspPhe859035ValGlylielieCysI/euI/euVallieAsnSerThrlieSerPhe工le100105110GluGluA抑AsnA2aG2yAsnAlaAJLaAlaA2aLeuMetAiaGlyLeu115120125121AlaProLysThrLysVallieuArgAspGlyLysTrpSerGluGinGlu130135140AlaAlalieLeuValProGlyAsplieValSerlieLysLeuGlyAsp145ISO155160lie工leProAlaAspAlaArgLeuLeuGluGlyAbpProLeuLysVal170175AspGinSerAlaLeuThrGlyGluSerLeuProValThrLysHisPro180185ISOGlyGinGluValPheSerGlySerThrcysGinGlyGlulieGlu195200205AlaValVallieAlaThrGiyValHisThrPhePheGiyLysAlaAla210215220HisLeuValAspSerThrAsnGinValGlyHisPheGinLysValLeu225230235240ThrAlalieGlyAsnPheCyslieCysSerlieAlalieGlyMetVal245250255lieGlulie工leValMetTyrPro工leGinArgArgLysTyrArgAsp260265270GlylieAspAsnLeuLeuValLeuLeulieGlyGlylieProlieAla275280285MetProThrValLeuSerValThrMetAlalieGlySerHisArgLeu290295300SerGinGinGlyAlalieThrLysArgMetThrAlalieGluGluMet305310315320AlaGlyMetAspValLeuCysSerAspLysThrGlyThrLeuThrLeu325330335AsnLysljeuSerValAspLysAsnILeuValGluValPheCysLysGly122340345350ValGluLysAspGinValLeuLeuPheAlaAlaMetAlaSerArgVal3S5360365GVaAsnGinAspAlalieAspAlaAlaMetValGlyMetLeuAlaAsp370375380ProLysGluAlaArgAlaGlylieArgGluValHisPheLeuProPhe3BS390395400AsnProValAspLysArgThrAlaLeuThrTyxlieAspGlySerGly405410415AsnTrpHisArgValSerLysGlyAlaProGluGinlieLeuGluLeu42042S430AlaLysAlaSerAsnAspLieuSerLysIiysValIeuSerlielieAsp435440"5LysTyrAlaGluArgGlyLeuArgSerLeuAlaValAlaArgGin"Val4504554S0ValProGluLiysThrLysGluSerProGlyAlaProTrpGluPheVal465470475480GlyLeuLeuProLeuPheAspProProArgHisAspSerAlaGluThr485490495lieArgArgAlaLeuAsnLeuGlyValAsnValLysMet工leThrGly50050S510AspGinLeuAlalieGlyLysGluThrGlyArgArgLeuGlyMetGly515520525ThrAsnMetTyrProSerSerAlaI>euLeuGlyThrHisLysAspAla530535S40AsnAlaSerlieProValGluGluLeulieGluI;ysAlaAspGly545550555560PheAlaGlyValPheProGluHisLystyrGlulieValLysLysLeu565570575GinGluArgLysHislieValGlyMetThrGlyAspGlyValAsnAsp5805855S0AlaProAlaIjeuLysLysAlaAsplieGly工leAlaValAlaAspAla595600605Tin:AspAlaAlaArgGlyAlaSerAsplieValLeuThrGluProGlyS10S15620LeuSerVallielieSerAlaValLeuThrSerArgAlaliePheGinS25630635S40ArgMetLysAsnTyrThrlieTyrAlaValSerlieThr工leArglie"5650655ValPheGlyPheMetLeulieAlaLeulieTrpGluPheAspPheSer660665S70AlaPheMetValI>eulielieAlalieLeuAsnAspGlyThr工leMet675680685ThrHeSerLysAspArgVaiLysProSerProThrProAspSerTrp690700LysLeuLysGluliePheAlaThrGlyValValLeuGlyGlyTyrGin705710715720AlalieMetThrValliePhePheTrpAlaAlaHisLysThrAspPhe72S730735PheSerAspThrPheGlyVaiArgSerlieArgAspAsnAsnHisGlu7407457S0LeuMetGlyAlaValTyrLeuGinValSerlielieSerGinAlaLeu7557607S5124liePheValThrArgSerArgSerTrpSerPheValGluArgProGly770"775780AlaLeuLeuMetlieAlaPheLeulieAlaGinLeulieAlaThrLeu785790795800lieAlaValTyrAlaAsnTrpGluPheAlaLyslieArgGly工leGly805810815TrpGlyTrpAlaGlyVallieTrpLeuTyrSerlieValThrTyrPheB20825830ProLeuAspValPheLysPheAlalieArgTyrlieLeuSerGlyLys835840845AlaTrpLeuAsnLeuPheGluAsnLysThrAlaPheThrMetLysLys8508558S0AspTyrGlyLysGluGluArgGluAla'GlnTrpAlaLeuAlaGinArg865870875880ThrLeuHisGlyLeuGinProLysGluAlaValAsnliePheProGlu8BS89089SLysGlySerTyrArgGlulieuSerGlulieAlaGluGinAlaLysArg300905910ArgAlaGlulieAlaArgLeuArgGluLeuHisThrLeuLysGlyHis915920925ValGluSerValValLysLeuLysGlyLeuAsplieGluThrProSer930935940HisTyrThrValLeuGluValArgPheGinMetSerLysGlyGluGlu945950955960LeuPheThrGlyValValProlieLeuValGluLeuAspGlyAspVal965970975AsnGlyHisLysPheSerValSerGlyGluGlyGluGlyAspAlaThr125TyrGlyLysLeuThrLeuLysPhelieCysThrThrGlyLysLeuPro9951000ValProTrpProThrLeuValThrThrPheSerTyrGlyValGinCys101010151020PheSerArgTyrProAspHisMetLysArgHisAspPhePheLysSer1025103010351040AlaMetPro<31uGlyTyrValGinGluArgThrlieSerPheLysAsp104510S01055AspGlyAsnTyrLysThrArgAlaGluVaiLysPheGluGlyAspThr106010651070LeuValAsnArglieGluLeuLys10751080Asnlie1090TyrlieThrAlaAspLysGinLys11051110lieArgHisAbiilieGluAspGly1125GinGinAsnThrProHisTyrlieuSerThr1155ArgAspHisMetVal1170HisGlyMetAspGluLeuTyrLys11851190GlylieAspPheIiysGluAspGly108SAsnTyrAsnSerHisAsnVal1100AsnGly工leLysAlaAsnPheLys11151120SerValGinLeuAlaAspHisTyr1135lieGlyAspGlyProValLeuLeuProAspAsn11451150GinSerAlaI*euSerLysAspProAsnGluLys11601165LeuLeuGluPheValThrAlaAlaGlylieThr117511B0LeuGlyHisLysLeuGluTyr1095126<210>55<211>303<212>DNA<213>人類免疫缺陷病毒型l<220><221>基因<222>(1)..(303)<223>HIV蛋白基因<:220>《221>CDS<222>(1),.(300)<:223>HIV-l蛋白酶<:300><308>GenBank/XJ31398<309>19S6-03-07<400>55atgcctcaggtcactctttggcaacgacccetcgtcacaataaagata48MetProGinValThrLeuTrpGinArgProLeuValThrlieLyslieIS1015ggggggcaaetaaaggaagetetattagatacaggagcagatgatGlyGlyGinIjeuLysGluAlaLeuUeuAspThrGlyAlaAspAsp20253036Thrgtattagaagaaatgagtttgccaggaagatggaaaccaaaaatgata144ValLeuGluGluMetSerI>euProGlyArgTrpLysPro!>ysMetlie354045gggggaattggaggttttateaaagtaagacagtatgatcagataetc192GlyGlylieGlyGlyPhelieLysValArgGinTyrAspGin工leLeu505560atagaaatelieGlulieacacctgtcThxProValactttsaeitThrLeuAsntgtCysggacataaagetataggtacagtattagtaggacctGlyHisLysAlalieGlyThrValLeuValGlyPro707580ataattggaagaaatctgttgactcagattggttgclielieGlyArgAsnLeuLeuThrGinlieGlyCys859095tgatttPhe100<210>56<212>PRT<213>人類免疫缺陷病毒型l<400>56MetProGinValThrLeu15TrpGinArgProI*euValThrlieLyslie10ISGlyGlyGinLeuLysGluAlaLeuLeuAspThrGlyAlaAspAspThr202530ValLeuGluGluMetSerLeuProGlyArgTrpLysProLysMetlie354045GlyGlylieGlyGlyPtie工leLysValArgGinTyrAspGinlieLeu505560lieGlu工leCysGlyHisLysAlalieGlyThrValLeuValGlyPro65707580ThrProValAsnlielieGlyArgAsnLeuLeuThrGinlieGlyCys859095ThrLeuAsnPhe100240288303128<2;0>57<211>21<212>DUA<213>人工序列<220><223>合成序列《220>《221>CDS<:222>(11.(21)<223>HIV-l蛋白酶切割序列<400>57agccaaaattaccctatagtg21SerGinAsnTyrProlieVal<210>58<211>7<212>PRT《213>人工序列<400>58SerGlnAsnTyrProlieVal<210><211><212><213><220><223>5921DNA人T.序列合成序列<223>HIV-l蛋白酶切割序列"00>59gcaagagttttggetgaagcaAlaAi:gValLeuAlaGluAla15<210>60<211>7<212>PRTdlh人丁序列<400>60AlaArgValLeuAlaGluAla15《211>21<212>DMA<213>人工序列<220><223>合成序列<220><221>CDS<222>(1),-(21)<223;>HIV-l蛋白酶切割序列<400>61getaccataatgatgcagaga說明書第119/193頁(yè)2121130<210;62<211>7<212>PRT<2">人工序列<400>62AlaThrlieMet他tGinArg15<210>63<211>21<212>DMA<213>人工序列<220><223>合成序列<220><221>CDS<222>(1),.(21}<223>HIV-i蛋白酶切割序列"O0:>63agacaggetaattttttag的ArgGinAlaAsnPheLeuGly15<211>7<212>PRT<213>人工序列說明書第120/193頁(yè)21131<400>S4ArgGinAlaAsnPheLeuGly<210>6S<211>21<212>DNA<213>人工序列<220><223>合成序列《220><221>CDS<222>(1J,,(21)<223>HIV-l蛋白酶切割序列<40O>65ccagggasttttProGlyAsnPhecttcagageLeuGinSer21<210>S6<212>PRT<213>人工序列<400>66ProGlyAsnPheLeuGinSer<210>67<211>IS<212>MA<213>人工序列132<220><223>合成序列<220><221>CTS<222>(1〉.-(15)<223>HIV-l蛋白酶切割序列<400>agcgtgSerVal67cctcaaataProGinlie515<210>68<211>5<212>PRT<213>人工序列<400>68SerValProGinlie<210><211:=<212〉<220><223>6921DNA人工序列合成序列<220><221>CDS<222>Ul--(21)<223>HIV-1蛋白酶切割序列69actttaaattttThr"LeuAsnPhecccstt3tgcProlieSer21<210><211><212><213>70PRT人工序列<400>70ThrLeuAsnPheProlieSer5<210><213:7121MA人工序列<22Cb<223-合成序列<220-<222)CDSHIV-l蛋白酶切割序列《400:71gcagaaaccttctatgtagatAlaGluThrPheTyxValAsp1521<211>7<212>PRT<213>人工序列<400>72AlaGluThrPheTyxValAsp<210>73<211>21<212>DNA<213>人工序列<220><223>合成序列<220><221>CDS<222>(1)--{21><223》HIV-l蛋白酶切割序列<400>73aggaaagtactaArgLysValLeutttttagatPheI*euAsp21<210>"74<211>7<212>PRT<213>人工序列<400;>*74ArgLysValLeuPhelieuAsp135<210>75<211><212>D肌<213>人工序列<220><22^合成序列<220><221><222><223>(1647)RFP:PS(HIV-l蛋白酶):At0EP7:GFP雜合蛋白基因<220><221>CDS<222>(1)*<223>RFP:,(1S")PS(H1V-l蛋白酶)AtOEP7:GFP雜合蛋白<220><221>misc一特征<222>,(1647)<223>CDS:RFP(1..678)+ADs-CDS:HIV-1蛋白酶水解位點(diǎn)(700..720)+ADs-CDS:AtOEP7(721..909)+ADs-CDS:GFP(931..1644)<400>75at3gt9cgctectecaagaacgtcateaaggagttcatgcgcttcaag48MetValArgSerSerLysAsnVallieLysGluPheMetArgPheLys151015gtgcgcatggagggcaccgtgaacggccacgagt仁cgagategagggc96ValArgMetGluGlyThrValAsnGlyHisGluPheGlulieGluGly202530gag的cgagggccgcGluGlyGluGlyArg35cccta_cgagProTyrGlu40GlyHisAsiiThr3tgVal45aagLysctgLeu3a9144136gtgaccVal"Thr50sag卵c(31yGlycccProctg55ProttcPhegcctgggacAlaTrpAsp60ateliectgLeutecSercccPro1S2C3gttcGinPheS5GinTyrggcGlytecSer70LysgtgvalTyrgtgasgcacValLysHis75gccgacProAlaAspELtClie80240cccgacProAapTyrLyssag85ctglieutecttcPhecccProgagggcttcGluGlyPhe90aagTrpgagGlu95cgcArg288gtgatgValMetttc100gagGlugacAspggcGlyggcGly9tg105gtgaccgtgValThrValThrGin110gacAsptecSer33StecctgSerLieuGin:U5Asp躬cGlytgcttcPhe工le120t3CaaggtgaagLysValLysttcPhe125atelieGly9tgVal384ttCAsnPhe130cccProtecAspGlyPro135gtaValatgMetcagaagaagGinliysLys140ThratgMet的cGly432gaggcctecaccgagcgcctgtacccccgcgacggcgtgctgaagggcGl\iAlaSerThrGluArgLeuTyrproArgA印GlyValLeuLysGly14515015S160480gagatecacaaggccctgaagctgaaggacggcggccactacctggtgGiulieHisLysAlaLeuLysLeuLysAspGlyGlyHisTyrLeuVal165170175528gagt仁caagtecatetacatggccaagaagcccgtgcagctgGiuPheLysSer工leTyxMetAlaLysLysProValGinI*eu180185190ProS76t3Ct3CTyrTyrTyrgtgValAspSeraagLysctgLeu200gacateacctecAsplieThrSerHis205AsngagGlu9"AspTyr3CCThr210atelieValgagGlucagGin215gagGluaccgagggcThrGluGly220cgcescescHisHisctgLeu672ttcPhe225ctgLeuProc的gcaAlasitelie230aagctg的tGlyagacaggetArgGinAla23SaatAsntttttsPhelieu犯gGly240720GlyactThrtegSerGly245AlaGingcgAlaactgtggtgThrValVal250gtcValgcagcgAlaAla255atgMet768gcgttaggatggttagccatagagategetttcaagcctttcetcgatAlaLeuGlyTrpLeuAlalieGlulieAlaPhel*ysProPheLeuAsp260265270816LysttcPhecgcArg275tecteaSerateliegstcAsp280tctgaccc3a_ccSerAspProThrLye285AspcccProgatAsp864gacttcgacaccgccgc仁actgcaaccacatecaaagagggtttggggAspPheAspThrAlaAlaThrAlaThrThrSerLysGluGlyLeuGly290295300312atecaaggagatataacaatgagtaaaggafifaagaacttttcactggalieGinGlyAsplieThrMetSerLysGlyGluGluLeuPheThrGly30531D315320960gttg仁cccaattcttgttgaattagatggtgatgttaatgggcacaaaValValProlieLeuValGluLeuAspGlyAspValAsnGlyHisLys325330335ttt仁ctgtcagtggagagggtgaaggtgatgcaaca仁acggaaaacttPheSerValS&rGlyGluGlyGluGlyAspAlaThrTyrGlyLysLeu34034535010081056ThrLeuLys355tttPhelieThr3CtThr360ggaaaaetacctGlyijysLeuProgttVal3S5ProTrpCC3Pro1104138acacttgtcactactttctcttatggtgttcaatgctttteaagatacThrLeuValThrThrPheSerTyrGlyValGinCysPheSerArgTyr3703753801152Pro385AspcatHisMetaagegg390HisgacttcttcaagagegccatgcctgagAspPhePheLysSerAlaMetProGlu3954001200ggatacgtgcaggagaggaccatetctttcaaggacgacgggaactacGlyTyrValGinGluArgThrlieSerPheLysAspAspGlyAsnTyr40541041S1248aagacacgtgetgaagtcaagtttgagggagacaccetcgtcaacaggLysThrArgAlaGluValLysPheGluGlyAspThrI^euValAsnArg420425430ateliegagGluCttlieu435aag砂GlyateliegatAspttc440aaggaggacggaLysGluAspGly33c445atelieetc!>eusec1344HisaagLys450ttgLeugaaGlutacTyrAsntacaacteccacaacgtatacateacggcaTyrAsnSerHisAsnValTyrlieThrAla4SS4601392gacAsp465333LysGinaagaatggaateaaagetaacttcaaaattagaLysAsnGlylieLysAlaAsnPheLyslieArg470475HisAsn4801440attgaaga仁ggaagegttcaaetagcagaccattatc:aacaaaatactlieGluAspGlySerValGinLeuAlaAspHisTyrGinGinAsnThr4854S04951488ccaattggcgatggccctgtccttttaccagacaaccattacctgtecProlieGlyAspGlyProValLeuLeuProAspAsnHisTyrLeuSer5005055101536ThrGintctSer51SgccAlactttegLeuSer333LysgatAsp520cccsl3cgaaaagProAsnGluLysaga52593cAspHisatgMet1584139gaaetatacaaataaGluLeuTyrLys545<210>76<211>548<212>PRT<213>人工序列<400>76MetValArgSerSerI>ysAsnVallieIiysGluPheMetArgPheLys1015ValArgMetGluGlyThrValAsnGlyHisGluPheGlu工leGluGly202530GluGlyGluGlyArgProTyrGluGlyHisAsnThrValLysLeuLys354045ValThrLysGlyGlyProLeuProPheAlaTrpAsplieLeuSerPro505560GinPheGinTyrGlySerLysValTyrValLysHisProAlaAsplie65707580ProAspTyrLysLysLeuSet"PheProGluGlyPheLysTrpGluAzrg859095ValMetAsnPheGluAspGlyGlyValValThrValThrGinAspSer100105110SerLeuGinAspGlyCysPhelieTyrLysValLysPhelieGlyVal11512012S16321647140AsnPheProSerAspGlyProValMetGinLysLysThrMetGlyTrp130135140GluAlaSerThrGluArgLeviTyxProArgAspGlyValLeuLysGly:U5150155160GlulieHisIjysAlaIjeuLysLeuLysAspGlyGlyHisTyrteuVal"5170175GluPheIjysSerlieTyrMetAlaLysLysProValGinLeuProGly180185190TyrTyrTyrValAspSerLysLeuAsplieThrSerHisAsnGluAsp1S5200205TyrThrlieValGluGinTyrGluArgThrGluGlyArgHisHiBLeu210215220PheLeuProArgAlalieLysLeuGlyArgGinAlaAsnPheLeuGly225230235240GlyLysThrSerGlyAlaLysGinAlaThrValValValAlaAlaMet245250255AlaLeuGlyTrpLeuAlalieGlulieAlaPheLysProPheLeuAsp260265270LysPheArgSerSerlieAspLysSerAspProThrLysAspProAsp275280285AspPheAspThrAlaAlaThrAlaThrThrSerLysGluGlyLeuGly290295300lieGinGlyAsplieThrMetSerLy3GlyGluGluLeuPheThrGly30S310315320ValValProlieLeuValGluLeuAspGlyAspValAsnGlyHisLys325330335PheSerValSerGlyGluGlyGluGlyAspAlaThrTyrGlyLysLeu340345350ThrLeuLysPhe工leCysThrThrGlyLysLeuProValProTrpPro3S53S0365ThrLeuValThrThrPheSerTyrGlyValGinCysPheSerArgTyr370375380ProA印HisMetLysArgHisAspPhePheLysSerAlaMetProGlu385390395400GlyTyrValGinGluArgThrlieSerPheLysAspAspGlyAsnTyr4054104i5LysThrArgAlaGluValLysPheGluGlyAspThrLeuValAsnArg420425430lieGluLeuLysGlylieAspPheLysGiuAspGlyAsnlieLeuGly435440445HisLysLeuGluTyrAsnTyrAsn450455Aspl>ysGinLysAsnGlylieLys465470lieGluAspGlySerValLeu485ProlieGlyAspGlyProVallieu500ThrGinSerAlaLeuSerLysAsp515520SerHisAsnValTyrlieThrAla460AlaAsnPheLyslieArgHisAsn47S480AlaAspHisTyrGinGinAsnThr490495LeuProAspAsnHisTyrLeuSer505510ProAsnGluLysArgAspHisMet525ValLeuLeuGluPheValThrAlaAlaGlylieThrHisGlyMetAsp530535540GluLeuTyxLys545142<210>77<211>1893<212>DNA<213>丙肝病毒<220><221>CDS<222>U).(1833)<223>HCVNS3蛋白酶<300><308>GenBank/D1643S<309>2000-02-01gcgcctAla1Pro77atelieacgThrgecAla5tatTyrtecGinGinacgThr10eggggcGlyctglieucttLeuggc15tgtCys48lieatelieThr20etclieuThr的tGlyegggacArgAsp2SAsnGingtcValgatAsp30gggGlygagGlu36gttvalcagGin3tgVal35etcI^eutecThrAlaacg40GintctSerttcPhectglieu9c9Ala45ThrtgcCys9tcVal14433t99cGly509tgt9tTrpsecgtcVal55tacTyrcatHis鵬GlygecAlaGly60tegSeraag3CCThrLeu192gecAla6599CGlyccgProaag39tGlyCCSPro70atelie3CCca3GinatgMetTyr75secThrgtagacAspcagGin80240gacetcgtcggctggccggcgccccccggggcgcgctecatgacaccgAspLeuValGlyTrpProAlaProProGlyAlaArgSerMetThrPro288B59095tgcThrtgcggcGly100ageSerteggacAspctttacTyr105t仁9LeugtcValaegThr柳紅STC3tHis110gecAl3gatAsp336VallieccgPro115gtgValcgcArgeggcga的cGly120gacAspageSei:Arg999GlySer125Ct3etcLeutecSer384cctPro130ProgtcValtecSerTyrctgLeu135sag的cGlytecSertegSer99t140卿GlyCCSProctglieucttlieu432Cys145cctProtegSerg的GlyHisgttVal150gtaval的cGlyate工lettcPheeggArg155getAlagetAlatgcCys160480eggArg的9GlygttAlaaag165Ala9tgValgacAspttcPheatalie170ProgttValgagGlutctSeratgMet175gaa_GluS28actsecThrMetc的1B0tctSer*ProgtcValttc185gacAspteaSertecSercctPro190Pro9ccAla576gtaValccgProGin195ThrttcPheGingcaAla200catHisttaLeuHisgetAlacccPro205ThrageSer624Glyaag210ageSerThrValPro215getAlaAlat3tTyrgcaAlagecAla220Gin939Tyr6*729tgVal225etcValLeu33CASI1ccgPro230tecSergttValgetAlaAlaThr235ttglieuggcGlytttggaGlyAla240720tatatgtecaaggcacatggcategagcctaaca仁cagaactggggtaTyrMetSerLysAlaHisGlylieGluProAsnlieArgThrGlyVal758144245250255aggaccArgThraitcliesecThr260Thr穿GlyggccccGlyProlie265acgtacTyrtecThrtatggcTyrGly270B16ttccttgccAla275gacAsp的tGly93aGlytgcCysSer2B0的gGlyGlygccAlaAsp28S3tCat3lielieUe864tgtgscCysAsp290GluCysHi8teaSer3Ct23SgacAspThra_ccThr3tClie300ttgLeuggcateGlylie的cGly912acagtc305ctggatAspcagGingcaAla310gagGluThrgetAlaGlyAla315cg9etcLeugtcValetclieu320960gccsecAlaThrgccAlaacgPro32SPro卿GlytegSersitelieThr330ValccaProC3CHiscccProsac335atelie1008gaggaa狗Ala340LeutecSersetThr的gGly345g巧GluattliecccProttcPheTyr350的cGly3的1056jeeate—工lePro3553ttlieGluAlaatelieaagLys360999GlyC3tHisetcLeu365ateliettctgcCys1104cattec370laystgtCysgacAsp375柳GluetcLeuAlagcaAlaaag380ctgLeu3CaGlyLeu1152ggaetc3B5satAsngetAlagcgAla390TyrtacTyreggArg的tGlyetclieu395Asp9tgValSergtcValatalie4001200ccgactageggagacgtcgttgtcgtggcaacagacgetetaatgacgProThrSerGlyAspValValValValAlaThrAspAlaLeuMetThr1248145405410415GlyPheaccggcThrGly420gacAsptttgacAsptea9tgval425atelieAsptgcCysAsiaThr430tgtCysgtcVal1296seccsgThrGinacagtcThrVal435gatAspttcagettgLeu440gatAspProThrttc3CCThr445工legagGluacgThr1344aC33CCThrThr4503tgValcccProGingacAspgcgAla455ValtegcgcArgtegSercagGin460eggcga妙柳Arg1392actggcThrGly465Arg99CGlyArgSer470ggcGly3tC工letacTyx鄉(xiāng)tttPhe475valactThrPro的aGlygaaGlu4801440eggcccArgProteaSerGlyMet40SttcgacAsptecSertegSergtcVal490LeuCysgagGlutgcCystatTyr495Asp1488gcaggcAlaGlytgcCysgetAla500t的tatTyrgagetcLeuacgThrSOSProgetAlagagGlusetThr510gtcVal1536ttgeggLeuArggetAla515tacctgLeuaat3C3ThrCC3Pro520鵬Glytt9LeuProgtcValtgcCys525cagGingacAspcatHis1584ctggagLeuGlu530ttct的GluagegtcVal535PheThrc仁cr*euacc540Hisata工legatAspgccAla1632cacttcHisPhe54SLeutecGin3CCThr550cagGinAla卿Asp555AsnttcProTyzctgSS0gtggcataccaagccacggtgtgcgccagggetcaggetccacctccaValAlaTyrGluAlaThrValCysAlaArgAlaGinAlaProProPro1728146565570S75tcgtgggatcaaatgtggaagtgtetcataeggcttaaacctacgctgSerTrpAspGinMetTrpLysCysLeulieArgLeuLysProThrLeu5805855901776cacgggccaacacccctgctgtataggetaggagccgttcaaaatgagHisGlyProThrProLeuLeuTyrArglieuGlyAlaValGinAsiaGlu595600605ateaccetcacacatcccataaccaaattcgtcatggcatgcatgtcglieThrI*euThrHisProlieThrLysPheValMetAlaCysMetSer"06156201872gccgacctggaggtcgtcactAlaAspleuGluvalValThr625S301833<210><:211><:212><213>78PRT丙肝病毒<400>78AlaProlieThrAlaTyxSerGinGinThrArgGlyLeuLeuGlyCys510ISlielieThrSerLeuThrGlyArgAspLysAsriGinValAspGlyGlu202530VaiGinValLeuSerThrAlaThrGinSerPheLeuAlaThrCysVal354045AsnGlyValCysTrpThrValTyrHisGlyAlaGlySerLysThrLeu505560AlaAspLeuValGlyTrpProAlaProProGlyAlaArgSerMetThrPro859095CysThrCysGlySerSerAspLeuTyrLeuValThrArgHisAlaAsp100105110VallieProValArgArgArgGlyAspSerArgGlySerLeuLeuSer115120125ProArgProValSerTyrLeuLysGlySerSerGlyGlyProLeuLeu130335140CysProSerGlyHisValValGlyliePheArgAlaAlaValCysThr145150155160ArgGlyValAlaLysAlaValAspPhelieProValGluSerMetGlu"5170175ThrThrMetArgSerProValPheThrAspAsnSerSerProProAla180185190ValProGinThrPheGinValAlaHisLeuHisAlaProThrGlySer195200205GiyLysSerThrI*ysValProAlaAlaTyrAlaAlaGinGlyTyrLys210215220ValLeuValI*euAsnProSerVa2AlaAlaThrLeuGlyPheGlyAla22S230235240TyrMetSerLysAlaHisGlylieGluProAsnlieArgThrGlyVal24525025SArgThrlieThrTharGlyGlyProlieThrTyrSerThrTyrGlyLys2S0265270PheLeuAlaAspGlyGlyCysSerGlyGlyAlaTyrAsp工lelielie275280285CysAspGluCysHisSerThrAspTrpThrThrlieLeuGlylieGly290295300ThrValLeuAspGinAlaGluThrAlaGlyAlaArgLeuV沃lVaiLeu305310315320AlaThrAlaThrProProGlySerlieThrValProHisProAsnlie325330335Glu<31uValAlaLeuSerAsnThrGlyGlulieProPheTyrGlyLye340345350AlalieProlieGluAlalieLysGlyGlyArgHisLeuliePheCye355360365HisSerI*ysLysLysCysAspGluLeuAlaAlaLysLeuThrGlyLeu3703753B0GlyLeuAsnAlaValAlaTyrTyrArgGlyIeuAspVa!LSerVallie385390395400ProThrSerGlyAspValValValValAlaThrAspAlaLeuMetThr405410415GlyPheThrGlyAspPheAspSerVallieAspCysAsnThrCysVal420425430ThrGinThrValAspPheSerLeuAspProThrPheThrlieGluThr435"0445ThrThrValProGinAspAlaValSerArgSerGinArgArgGlyArg450455460ThrGlyArgGlyArgSerGly工leTyrArgPheVaJThrProGlyGlu"5470475480ArgProSerGlyMetPheAspSer*SerValLeuCysGluCysTyrAsp485490495AlaGlyCysAlaTrpTyrGluLeuThrProAlaGluThrThrValArgS00505510149LeuArgAlaTyrIjeuAsnThrProGly:beuProValCysGinAspHis51552052SLeuGluPheTrpGluSerValPheThrGlyLeuThrHis工leAspAla530535540HisPheLeuSerGinThrLysGinAlaGlyAspAsnPheProTyrLeu545SSOValAlaTyrGinAlaThrValCysAlaArgAlaGinAlaProProPro565570575SerTrpAspGinMetTrpUysCysLeu工leArgLeuUysProThrlieu580SB5590HisGlyProThrProLeuLeuTyrArgleuGlyAlaValGinAsnGluS95600605lieThrLeuThrHisProlieThrLysPheValMetAlaCysMetSet61061SAlaAspLeuGluValValThr625S30<210>79<2JU>30<2H加A<213>人工序列<220>《223>合成序列<220><221>CDS<222>(1)-(30)<223>HCVNS3蛋白酶切割序列620<400>79gatgaaatggaagagtgcgccteacacetc30AspGluMetGluGluCysAlaSerHisI^u1510<210>80<211>10<212>PRT<213>人工序列"00>80AspGluMetGluGluCysAlaSerHisLeu1510<210>81<211>30<212>DNA<213>人工序列<223>合成序列<220><221>CDS<222>U)--(30)<223>HCVNS3蛋白酶切割序列<400>81gactgctecacgccatgctecggctegtgg30A印CysSerThrProCysSerGlySerTrp1510<210>82<211>10<212>PRT<213>人工序列<400>82AspCysSerThrProCysSerGlySerTrp1510<210>83<211>30<212>DNA<213>人工序列<220><223>合成序列<220><221>CDS<222>(1)-,(30)<223>HCVNS3蛋白酶切割序列"00>83gacgacategtctgctgcteaatgtectac30AspAsplieValCysCysSerMetSerTyr1510<"0>84<211>10<212>PRT<213>人T—序列<400>84AspAsplieValCysCysSerMetSerTyr1510<210>85152<211,1908<212:>DNA<2">人皰疹病毒l<220><221>基因<222,("..(1908)<2237HSV-l蛋白酶基因<221;>CDS<222,(1)..(1905)<223>HSV-l蛋白酶<300><308>GenBank/X14112<309>1997-04-17<400>85atggcagccgatgccccgggagaceggatggaggagcccctgcccgac48MetAlaAlaAspAlaProGlyAspArgMetGluGluProLeuProAsp151015agggccgtgcccatttacgtggetgggtttttggccctgtatgacage96ArgAlaValProlieTyrValAlaGlyPheLeuAlaLeuTyrAspSer202530ggggactegggcgagttggcattggatccggatacggtgegggcggcc144GlyAspSerGlyGluLeuAlaLeuAspProAspThrValArgAlaAla354045ctgcctccggataacccaetcccgattaacgtggaccaccgcgetggc132LeuProProAspAsnProLeuProlieAsnValAspHisArgAlaGly50S560tgcgaggtggggegggtgctggccgtggtcgacgacccccgcgggccg240CysGluValGlyArgValLeuAlaValValAspAspProArgGlyPro65707580ttttttgtggggctgategcctgcgtgcagctggagcgcgtcetcgagPhePheValGlyLeulieAlaCysValGinLeuGluArgValLeuGlu859095288acggccgccagegetgcgattttcgagcgccgcgggccgccgetctecThrAlaAlaSerAlaAlaliePheGluArgArgGlyProProLeuSer100105110egggaggagcgcctgttgtacctgateaccaactacctgcccteggtcArgGluGluArgLeuLeuTyxLeulieThr"AsnTyrLeuProSerVal11512012S3B4tecctgSe:cLeu130gccAla3C3ThrcgcctggggggcgaggcgcaccccgatcgcacgArgLeuGlyGlyGluAlaHisProABpArgThr135140432ctgttcLeuPhe145AlaC3CHisValAla150ctgLeutgcgcgCysAlaategggeggcgc工leGlyArgArg155etcggcactIeuGlyThxISO480ategtcacctacgacaccggtetcgacgccgccategcgccctttcgclieValThrTyrAspThrblyLeuAspAlaAlalieAlaProPheArg165170175528cacctgHisLeutegSerccgPro1&0AlatctSercgcArggag卿GluGlyIBSgcgeggcgactgAlaArgArgLeugccgccgagAlaAlaGlu190576gccgagAlaGluetcAla195LeuSer999cgcacctgggcgcccggcgtggaggcgGlyArgThrTrpAlaProGlyValGluAla200205624ctgacccacacgctgctttecaccgccgttaacaacatgatgctgeggLeuThrHisThrLeuLeuSerThrAlaValAsnAsnMetMetLeuArg210215220672gaccgctggagectggtggccgageggAspArgTrpSerLeuValAlaGluArg225230eggeggcaggccArgArgGinAla23SgggategccGlylieAla240720ggacacGlyHis3CCThrtacTyretcI>eu245cagGinAlaageSergaaGlu333Lys250ttcaaaatgPheIiysMettggggggcgTrpGlyAla25S768gagcctGluProgttValtecSer260AlaccgProAlacgcArgg的Gly265tatTyraagaacgggLysAsnGlygccccggagAlaProGlu270816tecacgSerThrgacAsp275lieccgProPro的cGlytegSer2803tcliegetgccgcgccgAlaAiaPro285cagggtgacGinGlyAsp864eggtgcArgCys290CC3Pro3tcliegtcValcgtArgca_gGin295cgcgggGlygtcValgccttgtecAlaLeuSer300ccggtactgProValLeu912ccccccProPro305atgMetcccPro9tt310ccgPro3C3ThrtegSerGly3CCThr315ccggccProAlacccgcgccgProAlaPro320S60cccggcProGlygacAsp999GlyageSer325tacTyrctgLeuTrp3tClieccgPro330gccAlateccatSerHistacaaccagTyrAsnGin3351008etcgtcLeuValAlaGly340C3tHisgccAlaAlacccProGin345cccProcagGinccgcatProHistecgcgtttSerAl3Phe3501056ggtttcGlyPheccgPro355getAlaAlaAla鵬GlytecSet:3609tgValgccAlaTyrgggcctGlyPro365cacggtgcgHisGlyAla1104ggtcttGlyLeu370tecSercagGinHistacTyrcctPro375cccProCSCHisgtcValAlacatcagHisGin380tatcccgggTyrProGly1152gtgctgValLeu385ttcPhetegSerggaageProSer390CC3ProetcIjeugagGlugcgAla395cagataGinliegccgcgttgAlaAlaLeu40012009tgrgggValGlygccAlaataliegccgcgAlaAla405gaccgcAspArgcaggcgggcGinAlaGly410ggtcagccgGlyGinProgccgcgAlaAla4151248ggagacGlyAspcctPro的gGly420gtceggGlySerggaaagcgtGlyLysArg425cgceggtacArgArgTyr430gaggcgGluAla1296柳ccgGlyProtegSer435gagGlutecSertacTyrtgcgacCysAsp440caggacgaaGinAspGluccggacgcgProAspAla445gactacAspTyr1344ccgtacProTyr4S0tacTyrPro卿GlygaggetcgaGluAlaArg455ggcgcgccgGlyAlaProcgcggggtcArgGlyVal460gactecAspSer1392cg9cgc465AlagccAlacgcArgesttctcccHisSerPro470gggaccaacGlyThrAsii47^'gagaccateGluTharlieacggcgThrAla480"40ctgatgggggcggtgacgtet'etgcagcaggaactggcgcacatgeggLeuMetGlyAlaValThrSerLeuGinGinGluLeuAlaHieMetArg4854904951488geteggaccagegccccctatggaatgtacacgccggtggcgcactatAlaArgThrSerAlaproTyrGlyMetTyrThrProValAlaHisTyr500SOS5101536cgccct:caggtgggggagccggaaccaacaacgacccacccggccpttArgProGinValGlyGluProGluProThrThrThrHisProAlaLeu5155205252584tgtcccccggaggccgtgtatcgccccccaccacacagegccccctacCysProProGluAlaValTyrArgproProProHisSerAlaProTyr530535540S3tcc'tteccagggtcicggcg仁ccestgccc*ccactcccccgtat,gccGiyprop竹S€THisAlaproThrProProTyrAla545S'二':)5555601680156cagGinThrAsngatAsp625getMaacgThrGlygccAla610ttgLeugpctgpppg吞1^y戸Pro565cgcgcccctArgAlaPro580teccaaccgSerGinPro595ageagegcaSerSerAla《211><212><213>86S35人皰疹病毒lq:ca的9ccgcpapro斷種ttcgtctctPheValSeretaccgacggagLeuProThrGlu585gaggcatecaacGluAlaSerAsn600gcacacgtggacAlaHisValAspcagatgatggggGinMetMetGly630ccgC(fCccaproproPro570cccgcgttcProAlaPhegcggaggccAlaGluAlagttgacacgValAspThr620gcccgcAlaArg635<400>86MetAlaAlaAspAla15ProGlyAspArgCyscccPro卿Gly605gccAlacctProccc"Pro590gccAlacgcArgtecsecSerThrS75gccgccAlaAlacttgtcLeuValgccgccAlaAla1728MetGluGlu10ProLeuProAsp15ArgAlaValPro工leTyrValAlaGlyPheljeuAlaleuTyrAspSer202530GlyAspSerGlyGluLeuAlaLeuAspProAspThrValArgAlaAla354045LeuProProAspAsnProLeuProlieAsnValAspHisArgAlaGly505S601776182418721908157CysGluValGlyArgValLeuAlaValValAspAspProArgGlyPro657D75BOthePheValGlyLeulieAlaCysValGinLeuGluArgValLeuGlu859095ThrAlaAlaSerAlaAlaliePheGluArgArgGlyProProLeuSer100105110ArgGluGl\iArgLeuLeuTyrLeu工leThrAsnTyrLeuProSerVal11S120125SerLeuAlaTlirLysArgLeuGlyGlyGluAlaHiBProAspArgThr13D135140LeuPheAlaHisValAlaLeuCysAlalieGlyArgArgLeuGlyThr"5150155160lieValThrTyrAspThrGlyLeuAspAlaAlalieAlaProPheArg165170175HisLeuSerProAlaSerArgGluGlyAlaArgArgLeuAlaAlaGlu180185190AlaGluLeuAlaLeuSerGlyArgThrTrpAlaProGlyValGluAla195200205LeuThrHisThrLeuLeuSerThrAlaValAsnAsnMetMetLeuArg210215220AspArgTrpSerLeuValAlaGluArgArgArgGinAlaGlylieAla225230235240GlyHisTturTyrI^uGinAlaSerGluLysPheLysMetTrpGlyAla245250255GluProValSerAlaProAlaArgGlyTyrLysAsnGlyAlaProGlu260265270SerThrAsplieProProGlySerlieAlaAlaAlaProGinGlyAsp27528028SArgCysProlieValArgGinArg<3iyValAlaLeuSerProValLeu290295300ProProMetAsnProValProThrSerGlyThrProAlaProAlaPro305310315320ProGlyAspGlySerTyrLeuTrplieProAlaSerKisTyrAsnGin32S330335LeuValAlaGlyHisAlaAlaProGinProGinProHisSerAlaPhe340345350GlyPheProAlaAlaAlaGlySerValAlaTyrGlyProHisGlyAla355360365GlyLeuSerGinHisTyrProProHisValAlaHisGinTyrProGly"037S380ValLeuPheSerGlyProSerProL>e\iGluAlaGinlieAlaAlaLeu385390395400ValGlyAlaTieAlaAlaAspArgGinAlaGlyGlyGinProAlaAla405410415GlyAspProGlyValArgGlySerGlyLysArgArgArgTyrGluAla420425430GlyProSerGluSerTyrCysA叩GinAspGluProA印AlaAspTyr435440445ProTyrTyrProGlyGluAlaArgGlyAlaProArgGlyValAspSer450455460ArgArgAlaAlaArgHisSerProGlyThrAsnGluThrlieThrAla46547047S480LeuMetGlyAlaValThrSerLeuGinGinGluLeuAlaHisMetArg485490495159AlaArgThrSerAlaProTyrGlyMetTyrThrProValAlaHisTyr500505510ArgProGinValGlyGluProGluProThrThrThrHisProAlaLeu515520525CysProProGluAlaValTyrArgProProProHisSerAlaProTyr530S35540GlyProProGinGlyProAlaSerHisAlaProThrProProTyrAla545550555560ProAlaAlaCysProProGlyProProProProProCysProSerThr565570575GinThrArgAlaProLeuProThrGluProAlaPheProProAlaAla5805B5590ThxGlySerGinProGluAlaSerAsnAlaGluAlaGlyAlaLeuVal535600SOSAbtiAlaSerSerAlaAlaHisValAspValAspThrAlaArgAlaAla610S15S20AspLeuPheValSerGinMetMetGlyAlaArg625630635<210>87<211>15<212>D貼"13>人T.序列<220><223>合成序列<220><221>CDS<222>(1)..(15)《223>HSV-1蛋白酶切割序列misc一特征《222>(1)-.(1S)<223>hba,g,c,ort;r-aorgy-cort<400>87ctngtnctngenagy15XaaXaaXaaXaaXaa<211》<212)<213)885人工序列<400>8BXaaXaaXaaXaaXaa15<210>89<211>18<212>DNA<213>人工序列<220><223>SyntheticSequence<220><221>CDS<222>(1).-(18)<223>HSV-l蛋白酶切割序列161<220><221><222><223>misc—特征(1)…(18)n+ADO—a,g,c,或t+ADs_y+AD0-c或<400>89ctngtnctngenagyagy18XaaXasXaaXaaXaaXaa15<210,<212:=<21h906PRT人工序列<400>90XaaXaaXaaXaa_XaaXas15<23L0>91<211>501<212>DNA<213>人嗜T淋巴細(xì)胞病毒l<220><221>基因<222>(1)..(501)<:223>HTLV-]蛋白酶基因<220><221>CDS<222>U)-(498)<223>肌V-l蛋白酶<309>199G-01-1891MetThrVal<400>atgacacttLeuPro53t3liegccAlattgLeuttcPheSer10agtSeraatAsxiactThrProetc!>eu15agaArg48331ThrtecSergtaVal20ttaiLeu鵬GlygcaAlag的GlyGly2SGinThrGingatAspHis30tttPhesagIjys36etcLieu3CCThrtecSer35c仁tcc仁ProgtaValLeuatalie40cgcetcLeucctProttcPheegg45ThraegThrcctPro1443ttliegtt50ThrtctSerCys55gttgatAsp333Asn60TrpgccAla工le192atalieS5柳GlyArggatAspgccAlatt3L>eu70GinGintgcCysGinGly75gccAlatacetcLeucctPro80240gagGlugcaiAlaccgPro85ProVal工lettgIjeuPro30ataliecagGin9cgAlaProgccAla9SgtcVal2B8cttLeugggGlyetaLeugaaGlu100C3CHisetclieuProArgPro105cccProgaaGluatelieagecagGin110ttcPhecctPro33SttaLeu33CcagGinAsnggcGlytecArgcctPro120tgcaacCysA_snactThrTrptecSer125993Glya的ArgProtggTrp130cagGingccAlalie仁cgSer33CASIX13SProThrccgProGlycagGin140gaa3t3lie3CCcagGin432163tatteccagttaTyrSerGinLeu145tgcgggccactsCysGlyProI^uaaaaggccaatggaacctggcgatteatecacgacc480LysArgProMetGluProGlyAspSerSerThrThr150155ISOactetctaa501ThrLeu165<210>92<211>166<212>PRT<213>人嗜T淋巴細(xì)胞病毒l<400>92MetThrValLeuPro工leAlaLeuPheSerSerAsnThrProLeuArg151015AsnThrSerValLeuGlyAlaGlyGlyGinThrGinAspHisPheLys202530LeuThrSerLeuProValLeulieArgLeuProPheArgThrThrPro3S4045lieValLeuThrSerCysLeuValAspThrLysAsnAsnTrpAlalie505560lieGlyArgAspAlaLeuGinGinCysGinGlyAlaLieuTyrLeuPro65707S80GluAlaLysGlyProProVallieLeuProlieGinAlaProAlaVal859095LeuGlyLeuGluHisLeuProArgProProGlulieSerGinPhePro100105110LeuAsnGinAsnGlySerArgProCysAsnThrTrpSerGlyArgPro115120125TrpArgGinAlalieSarAsnProThrProGlyGinGlulieThrGin130135140TyrSerGinLeuLysArgProMetGluProGlyAspSerSerThrThr"5150155160CysGlyProLeuThrLeu1S5<210><2ll><213>9336人工序列<220-合成序列<220)<221)<223,CDS(1〉..(36)HTLV-l蛋白酶切割序列<220><221><222>misc—特征(l)..(36)n+AD0-a,g,c,或t+Af)s-r+扁-a或g+ADs-y+ADO-c或"oo>93tencgnccncargtnctnccngtnatgcayccnaayXaaXaaXaaXaaXaaXaaXaaXaaMetXaaXaaXaa151036(210》-211〉9412PRT<213>人工序列<400>94XaaXaaXaaXaaXaaXaaXaaXaaMetXaaXaaXaa1<210><211><212><213><220><223><220<221,<222><223-<220:;<221-<222-<223:10S536人工序列合成序列CDS(1)..(36)H丁LV-l蛋白酶切割序列misc—特征(1〉..(36)n+AD0-a,g,c,或t+ADs-r+ADO-a或g+ADs-y+ADO-c或<400>95tenaaracnaargtnctngtngtncarccnaaraay36XaaXaaXaaXaaXaaXaaXaaXaaXaaXaaXaaXaa15109512PRT人工序列96XaaXaaXaaXaaXaaXaaXaaXaaXaaXaaXaaXaa1510<210>37<211>768<212>DNA<213>人巨細(xì)胞病毒<220><221>CDS<222>(1)-,(768)<223>包含于"UT80"中的HCMV次晶蛋白(蛋白酶)<300><308>GeriBank/X17403,P1S7<30S>1999-02-10<400>atgacgMetThr97atgMetgacAsp9sgGluGincagGintegcaggetGinAla10ValgcgccggtcAlaProValTyr15Val48ggcGlyGlytttPheetclieu20gecAlacgcArgtacTyrgacAspcagtctGinSer25ccgProgacgaggecAspGluAla30Gluttgijeu95ctgLeuttgLeuccgPro35eggArggacAspgtaValgtg柳Glu40cactggHisTrpLeucacgcgcagHisAlaGinGlyGin144GlycagGinSOcctProtegSerttgLeutegSer9ftcVal55AlaetcccgLeuProetcLieu33C3tC33CAsnlieAsn60C3CHisgacAsp192gacAspacgAlagttValgtaValgg3Gly70C3CHisgttvalgcggcgAlaAla3tgMet7ScagagegtcGinSerValcgcgacAsp80240ggtcttttttgcctgggctgcgtcacttegcccaggtttctggaga仁tGlyLeuPheCysLeuGlyCysValThrSerProArgPheLeuGlulie859095288gtacgccgcgetteggaaaagtecgagctggtttegcgcgggcccgtcValArgArgAlaSerGluLysSerGluLeuValSerArgGlyProVal10010511033SagtccgctgcagccagacaaggtggtggagtttetcageggcagetacSearProLeuGinProAspLysValValGluPheLeuSerGlySerTyr115120125384gccggcetctegetctecageeggcgctgcgacgacgtggaggccgcgAlaGlyLeuSerLeuSerSerArgArgCysAspAspValGluAlaAla130135140432acgThr145tegSerctttegGlytegSer150gaaGluThracgThrccgProttcPhe1S5aaacacgtggetLysHisValAlattgLeu160480tgcagegtggg仁eggcgtcgcggtacgttggccgtgtacgggcgcgatCysSerValGlyKrgArgArgGVyThrLeuAlaValTyrGlyArgAsp1S51701*75528cccgagtgggtcacacageggtttccagacc仁cacggcggccgaccgtProGluTrpValThrGinArgPheProAspLeuThrAlaAlaAspArg180185190576gacgggetacgtgcacagtggcagcgctgcggcageactgetgtcgacAspGlyIjeuArgAlaGinTrpGinArgCysGlySerThrAlaValAsp195200205624gcgtegggcgatccctttcgcteagacagetacggcctgttgggcaacAlaSerGlyAspProPheArgSerAspSerTyrGlylieuLeuGlyAsn210215220672ageSer225gtgValAspgcgAlaetcLeuTyr230ateliecgtArggagGluegaArgctglieu235ccc3agctgcgcProlysLeuArgTyr240720168gacaagcaactagtcggcgtgacggagcgcgagteatacgtcaaggcg768AspI/ysGinLeuValGlyValThrGluArgGluSerTyrValLysAla245250255<210>38<211>25S<212>PRT<213>人巨細(xì)胞病毒<400>98MetThrMetAspGluGinGinSerGinAlaValAlaProValTyrVal1510ISGlyGlyPheLeuAlaArgTyrAspGinSerProAspGluAlaGluLeu202530LeuLeuProArgAspValValGluHisTrpLeuHisAlaGinGlyGin354045GlyGinProSerI^uSerValAlaLeuProLeuAsnlieAsnHisABp505560AspThrAlaValValGlyHisValAlaAlaMetGinSerValArgAsp65707580GlyI*euPheCysLeuGlyCysValThrSerProArgPheLeuGlulie8S9095ValArgArgAlaSerGluLysSerGluLeuValSerArgGlyProVal100105110SerProI>euGinProAspLysValValGluPheLeuSerGlySerTyx115120125AlaGlyLeuSerLeuSerSerArgArgCysAspAspValGluAlaAla130135140ThrSerLeuSerGlySerGluThrThrProPheLysHisValAlaLeu145150155160169CysSerVaGlyArgArgArgGlyThrLeuAlaValTyrGlyArgAsp165170175ProGluTrpValThrGinArgPheProAspLeuThrAlaAlaAspArg180185190AspGlyLeuArgAlaGinTrpGinArgCysGlySerThrAlaValAsp195200205AlaSerGlyAspProPheArgSerAspSerTyrGlyLeuLeuGlyAsn210215220SerValAspAlaleuTyr工leArgGluArgLeuProLysLeuArgTyr225230235240AspLysGinLeuValGlyValThrGiuArgGluSerTyrValLysAla245250255<210>99<211>15<212>DNA<213>人工序列<220><223>合成序列<220><221>CDS<222>(1)--(15)<223>HCMV蛋[^酶切割序列<400>99gtgg仁gaacgccagt15ValValAsnAlaSer170<212><213>1005人工序列<400>100ValValAsnAlaSer<210><213〉15DNA人工序列<22Cb<223:合成序列-220--222--223:CDS(1)..(15)HCMV蛋白酶切割序列<400>101tacgtcaaggcgagcTyrValLysAlaSer15-212-1025PRT人丁.序列<40O:102171TyrValLysAlaSer<210><211><212><213>1031506DNA人類<221-<222-<223-基因(I)..(1506)APP&分泌酶基因<220><221)<222::<223sCDS(1)..(1503)APP分泌酶-300》-308>GenBank/AF2014S81999-12-19103<400>atggccMetAlaGingccAlactgLeu5ProtggetcTrpLeuctgLeuctgtggLeuTrp10atgMetGly9cgAla99aGly159tgVal48ctgcctgccLeuProAlaHis20GlyThrcagescGinHisGly25ateegglieArgctgLeucccProctgLeu30cgcage969gcctggggGlyLeuGly35gccAlacccProctgggg乙euGly40ctgeggctgArgLeuccceggProArg45339Glu3CCThi:gacAsp144gaagagcccgaggagcccggceggaggggcagetttgtggagatgg仁gGluGluProGluGluProGlyArgArgGlySerPheValGluMetVal192172505560Asp65AsnctgaggArgggcGly站gLys70tcggggSerGlycagGinGlytsicTyr75tacTyrgtgVal9agGluatgMetThrBO240ValGlyageSercccProccg8ScagGinacgetcThrLeuAsn3tC工le90ctggtgValgatAspTh:rGly95a_gcSer288SertttPhegcaAla100gtg99tGlygetgccAlaAlaPro105C3CHisProttcPhectgLieuestHis110cgct£lCTyr336tacTyrGin115cagGinctgLeuageSerThr120tacTyreggArgAspetcIjeueggArg125aagLysggtGlygtgVal384tatTyrgtg130cccProtacTyrsecThrcagGin的cGly135LystggTrpGlu993GlygagGlu140ctgLeuGly3CCThrgacAsp432ctgLieu145gtaValageSerateliecccProHisISOGlycccProgtcactThr155ValcgtArggccAlaattlie160480getAlagccAla3tCliesetThrgaaGlu165tC3SergacAspaagLysttcPhettcPhe170lieaacAsnGlySer175Trp528GluggcGlyliectgLeu180卿GlyctgLeuAlaTyrgetAla185gagGlulieAlaPro190gacAspgacAsp576tecSerctggagGlu195cctProttcPhetttPhegacAsptctSer200ctgLieugtaValLyscagGin3CCThr20SHisValcccPro624aacetcttctecctgcagctttgtggtgetggcttccccetcaaccagAsnLeuPheSerLeuGinLeuCysGlyAlaG]yPheProI;euAsnGin672173210215220tc仁gaa225ValctggccAlatctSer230gtcGly鵬GlyageSer他t23SateattlielieGlyGly3tClie240720gax:escAspHistcgctgtacTyx245ThrGlyagtSeretcLeutggTrp250tatTyrcccThrProateegglieArg255eggArg768gagtggGluTrptatTyrtatTyr26DgagGlugtcVallieattliegtgVal2S5egggtgValgagateGlulieaatggaAsnGly270Gin816gatctgAspLeuLyB275atgMetAsptgcCysGlu280Tyrt3tTyrgacaagAsp!>ys285ageattSerlieVal864gacagtAspSer290ggcGlya^ccThr3CCThrLeu295cgtttgI*eucccProIjysaaagtgIjysVal300tttgaaPheGlugetAla912gesgtcAlaVsl305tecSLtClieBagLys310AlagccAlatecSerSerThr315gagaagGluIjysttccctPheProAsp320960ggtttcGlyPheCt3Leu325gagGluGinctgLeugtgValtgcCys330tggTrpgesGinAlaggc5ccGlyThr335secThr1008ccttggaacattttcProTrpAsnliePhe340ProgtcatelieteaSer345etclieutacTyretaatgLeuMetggtgagGlyGlu350gttVal1056accaaccagtecttccgcateaccatecttccgcagcaatacctgeggThrAsnGinSerPheArg工leThrlieLeuProGinGinTyrLeuArg3553603651104ccagtggaagatgtggccacgteccaagacgactgttacaagtttgccProValGluAspValAlaThrSerGinAspAspCysTyrLysPheAla11521743703753803tClie385tC3cagGintcaiSertecSeracgThr390ggc3CtThrgttatgValMetggagetgttGlyAlaVal395ate3tglieMetgagGlu4001200Glyt3CTyrValgtcVal405tttPhegatAspegggcccgaAlaArg410aaacgaattLysArglieggctttGlyPhe41SgetAla1248gtcValageSergetAlatgcCys420ValescHisgatAspgagttcGluPhe425aggacggcaArgThrAlaAlaVal430gaaGlu1296GlycctProtttPhe435gtcThrttgAspMet440gaagacGluAsptgtggctacCysGlyTyr445ascattAsnlieCC3Pro1344cagGin3C3Thr450gatAspgagGluteaSerThretcLeu455atgMetThrliegcctatgtcAlaTyrVal460atggetMetAlagccAla1392lie465tgcCysgccAlaetcLeuttcatgMet470ctgLeuccaiProct.ctgcLeuCysetcatggtgLeuMetVai475tgtcagCysGinTrp4801440tgcCysetcLeucgcArgtgcCys4B5ctgLeucgcGincagcatGluHis490gatgactttAspAspPhegetgatAlaAsp495Asp1488lieSerctgctg500aag1506<210>104<211>501<212>PRT<:213>人類<400>104Met;UaGinAlaLeuProTrpLeuLeuLeuTrpMetGlyAlaGlyVai151015LeuProAlaHisGlyThrGinHisGlylieArgLeuPrpLeuArgSer202530GlyLeuGlyGlyAlaProLeuGlyLeuArgLeuProArgGluThrAsp354045GluGluProGluGluProGlyArgArgGlySerPheValGluMetVal505560AspAsnIeuArgGlyLysSerGlyGinGlyTyrTyrValGluMetThrS5707580ValGlySerProProGinThrLeuAsnlieLeuValAspThrGiySer859095SerAsnPheAlaValGlyAlaAlaProHisProPheLeuHisArgTyr100105110TyrGinArgGinLeuSerSerThrTyrArgAspLeuArgLysGlyValIIS120125TyrValProryrThrGinGlyLysTrpGluGlyGluLeuGlyThrAsp130135140LeuValSerlieProHisGlyProAsnValThrValArgAlaAsnlie1451501S5ISOAlaAlalieThrGluSerAspLysPhePhe工leAsnGlySerAsnTrp165170175GlUGlylieLeuGlyLeuAlaTyrAiaGlulieAlaArgProAspAsp180185130SerLeuGluProPhePheAspSerLeuValLysGinThrHisValPro195200205176AsnLeuPheSerLeuGinIjeuCysGlyAlaGlyPheProLeuAsnGin210215220Se:rGluVallieuAlaSerValGlyGlySei:MetlielieGlyGlylie225230235240AspHisSerLeuTyrThrGlySerIteuTrpTyrThrProlieArgArg2452S0255GluTrpTyrTyrGluVallielieValArgValGlulieAsnGlyGin2S5270AspLeuLysMetAspCysLysGluTyrAsnTyrAspLysSerlieVal2752B0285AspSerGlyThrThrAsnLeuArgLeuProLysLysValPheGluAla290295300AlaValLysSerlieLysAlaAlaSerSerThrGluLysPheProAsp305310315320GlyPheTrpLeuGlyGluGinLeuValCysTrpGinAlaGlyThrThr325330335ProTrpAsnliePheProVallieSerLeuTyrLeuMetGlyGluVal34034S350ThrAsnGinSerPheArglieThrlieLeuProGinGinTyrLeuArg35S360365Pro"ValGluA印ValAlaThrSerGinAspAspCysTyrLysPheAla370375380lieSerGinSerSerThrGlyThrValMetGlyAlaVallieMetGlu385390395400GlyPheTyrValValPheAspArgAlaArgLysArglieGlyPheAla405410415ValSerAlaCysHisValHisAspGluPheArgThrAlaAlaValGlu420425430GlyProPheValThrLeuAspMetGluAspCysGlyTyrAsnliePro435"0445GinThrAspGluSerThrLeuMetThr工leAlaTyrValMetAlaAla450455460lieCysAlaLeuPheMetleuProLeuCysLeuMetValCysGinTrp465470475480ArgCysI*euArgCysLeuArgGinGinHisAepAspPheAlaAspAsp485490495工leSerLeuLeuLys500<210>105<211>18<212>DNA<213>人工序列<220><223>合成序列<220><221>CDS<222>(1),-(18)<223>APPI-分泌酶切割序列<400>105gaagtaaagatggatgcaGluValL>ysMetAspAlaIB<210>106<21b6<212》PRT<213>人工序列<400>106GluValliysMetAspAla15<210>107<211>834<212>DNA<2">人類<220>《221>基因<222>(1)..(834)<223>大冬氨酸特異性半胱氨酸蛋白酶3的基因<220><221>CDS<222>(1)-(831)<223>天冬氨酸特異性半胱氨酸蛋白酶3前原蛋白<220><221〉misc—特征《222>(1)..(834)<223〉CDS:天冬氨酸特異性半胱氨酸蛋白酶3,信號(hào)肽(1..84)+ADs-CDS天冬酸特異性半胱氨酸蛋白酶3,大亞基(85.,525)+ADs-CDS:大冬氨酸特異性半胱氨酸蛋白酶3,小亞基(526.,831)<30O><308>GenBanJc/NM—004346<309>2001-07-13"00>107atggagaacactgaaaacteagtggat仁caaaatecattaaaaatttg48MetGluAsnThrGluAsnSerValAspSerLysSer工leLysAsnLeu1791015933CC3GluP:roa的atclie203t3工lecatHisGlyageSergaaGlu2SSeratgMetgacAsptctSer30atalietec96ctggacLieuAspAsn35agtSert3tTyrLysatgMetgatAsp40tatcctProgagGluatgMetGly45ttaLeutgtCyslie144ataattlielie50AsnAsnaagLys33tAsnttt55estHis333ageSer3CtThrGly60atgMet3C3ThrtctSerc9gArg192tctggtSerGly65這caThrgatAspValgatAsp70AlaAlaetcIjeua的Arg75GluttcPheArgBO240ttgaaaLeuLystatTyxgaaGlugtcVal85ArgAsnljys3&tgatAsp90cttlieuArgGluGlu95attlie28>gg33ValGlu仁tgLeu3tgMet100cgtArggatAspgttVal333Iiys105GlugatAspca_cHisSer333Ijys110鄉(xiāng)ArgageSer336agttttSerPhegttVal115tg仁Cys9tgValcttlieuctgageSer120estHisggtGlygaaGlugasGluGly125lie3ttlietttPhe384ggaacaGlyThr13033tAsncctProgttgacAsp135ctgLeuljys333Lysatalie3C3Thr140AsntttPhettcPheArg432ggggatGlyAsp145cgtArgCysagaArgSer150Ct3LeuactThr的aGlycccPro155aaaLyscttLeuttcPheattlieattlie160480caggectgccgtggtacagaactggactgtggcattgagacagacagtGinAlaCysArgGlyThrGluLeuAspCysGlylieGluThrAspSer528180"5170175ggtGlyg仁tValAspgatAsp180gacA叩atgMetAlatgtcatCysHis1853t3ccagtgProValgag190gccgacAlaAsp576ttcPhettgtatTyr195gcaiAlatacTyxtecSerThrgcacctAlsPro200GlytatTyrtattctTyrSer205tggTrp624teataagLys210gat■Asp的cGlySerTrpPhe215lieGintegSercttlieutgtgccCysAlai220atgMetctgaaalieuLys672cagGin22STyrgccAlaAspsagLyscttLeu230gaaGlutttatgPheMetescHisattlie235Ctt3CCLeuThregggttaacValAsn240720Lys9tgVal9c3AlaThr245gaaGlutttPhegagtecGluSertttPhe250tecSertttgacPheAspgetAlaacttttThrPhe25S768catHisgcaAlaaag260cagGinattlieCC3ProtgtattCyslie265gttValtecSeratgetcMetLeu270g站LysGlu816etcLeutatTyrtttPhe275tatTyrC3CHist33834<210>108<211>277<212>PRT<213>人炎<4Q0>108MetGluAsnThrGluAsnSerValAspSerLysSerlieLysAsnLeuIS10IS181GluProLyslielieHiBGlySerGluSerMetAspSerGly工leSer20253DLeuAspAsnSerTyxLysMetAspTyrProGluMetGlyLeuCys工le354045lielieAsnAsnLysAsnPheHisLysSerThrGlyMetThrSerArg505560SerGlyThrAspValAspAlaAlaAbixLeuArgGluThrPheArgAsn65707580LeuLysTyxGluValArgAsnLysAsnAspLeuThrArgGluGlulie859095ValGluLeuMetArgAspValSerLysGluAspHisSerLysArgSer100105110SerPheValCysValLeuLeuSerHisGlyGluGluGlylieliePhe115120125GlyThrAsnGlyProValAspLeuLysLyslieThrAsnPhePheArg130135140GlyAspArgCysArgSerLeuThrGlyLysProLysLeuPhelielie145150155160GinAlaCysArgGlyThrGluLeuAspCysGlylieGluThrAspSer1S5170175GlyValAspAspAspMetAlaCysHisLys工leProValGluAlaAsp180185190PheLeuTyrAlaTyrSerThrAlaProGlyTyrTyrSerTrpArgAsn19520020SSerLysAspGlySerTrpPhe工leGinSerLeuCysAlaMetLeuLys210215220GinTyrAlaAspLysLeuGluPheMetHislieL<euThrArgValAsn230235240ArgLysValAlaThrGluPheGluSerPheSerPheAspAlaThrPhe245250255HisAlaLysLysGinlieProCyslieValSerMetLeuThrLysGlu260265270LeuTyrPheTyrHis275<212-<213:109441DNA人類c221)(222-(223:CDS(1)..(441)天冬氨酸特異性半胱氨酸蛋白酶3,大亞基-3005-308-GenBank/XM一0S46862002-05-13<400>tctggaSerGly1109lietecSe;rctgLeugacAspagttataaaatgTyrLysMet10gattatcctgagatgAspTyrProGluMet1548ggtttaGlyLeutgtCya3t3lie20lielie33tAsn站tAsnaagaattttLysAsnPhe25cataaaageactggaHisLysSerThrGly3096atgacaMetThrSer35eggtctSerGly3C3ThrgatAsp40gtcgatgcaValAspAlagcaaacetcagggaaAlaAsnLeuArgGlu451443c3ThrttcPhe50agattgaaaIj6uLystatgaagtcaggTyrGluValArg55aataaaaatgatct仁acaAsnLysAbuAspLeuThr60192cgtArg65GluGluliegtggaaValGlu70ttgatgcgtgatLeuMetArgAspgtttctaaagaagatcacValSerLysGluAspHis7580240ageSer333LysageagttttSerPhe85gtttgtgtgcttValCysValLeu90ctgagecatggtgaagaaLeuSerHisGlyGluGlu95288ggaataatttttggaacaaatggacctgttGlylieliePheGiyThrAsnGlyProVal100105gacctgaaaaaaataacaAspLeuLysLyslieThr110336aactttttcagaggggatcgttg仁agaagtAsnPhePheArgGlyAspArgCysArgSer115120etaactggaaaacccaaaLeuThrGlyLysProLys1253S4cttttcattattcaggectgccgtggtacaLeuPhelie工leGinAlaCysArgGlyThr130135gaactggactgtggcattGluLeuAspCysGly工le140432gagGlu145ThrgacA叩441<210>110<211>147<212>PRT<:213>Homosapiens<400>110SerGly工leSerLeuAspAsnSerTyrLys510MetAspTyrProGluMet15GlyleuCyslielielieAsnAsnLysAsnPheHisLysSerThrGly202S30184MetThrSerArgSerGlyThrAspValAspAlaAlaAsnLeuArgGlu354045ThrPheArgAsnLeuLysTyrGluValArgAsnLysAsnAspLeuThr50S560ArgGluGlulieVa工GluLeuMetArgAspValSerLysGluAspHisS57075SOSerLy曰ArgSerSerPheValCysVall^uLeuSerHisGlyGluGlu859095GlylieliePheGlyThrAsnGlyProValAspLeuLysLyslieThr100105110AsnPhePheArgGlyAspArgCysArgSerLeuThrGlyLysProLys115120125LeuPhelielieGinAlaCysArgGlyThrGluLeuAspCysGlylie130135140GluThrAsp145<210;111<211>306<212>DMA<213>人類<220-<221-<222:;<223-CDSU)..(30S)天冬氨酸特異性半胱氨酸蛋白酶3,小亞基<300><308>GenBank/XM一054686<309>2002-05-13185<400>111agtggtgttgatSerGlyValAspgatAsp5gacAspMetgcgtgtAlaCysestHis103333t3lieccagtggagProValGlu15gecAla48gacttcAspPhettgLeutat20gcaAlaTyrtec3C3gesThrAla25cctProGlytattcttggTyrSerTrp30cga96asttea35gatAsptecSerTipttcatePhelie40cagGintegSercttLeutgtgecatgCysAlaMet4SctgIjeu144aisacagLyeGin50t3tgecAlaAspaagLyscttlieuS5gaatttGluPheMetC3CHis3ttlie60cttacceggLeuThxArggttval13233ccgsAsnArgaagLys3tgValgcaAlaThr70gaaGlutttgagPheGluSertttPhe75tecSertttgacgetPheAspAlasetThr80240tttcatPheHisAlaaag33385cagGinattlieccatgtProCysattlie90g仁tValtecatgetcacaMstLe\iThr95333Lys288gaaetcGluLeutEltTyr仁ttPhe100t3tTyrHis30S<210-<211:<212:<213-112102PRT人類<400>112SerGlyValAspA印AspMetAlaCysHis510LyslieProValGluAla15AspPheLeuTyrAlaTyrSerThrAlaProGlyTyrTyrSerTrpArg202530AsnSerI>ysAspGlySerTrpPhelieGinSerLeuCysAlaMetLeu354045LysGinTyrAlaAspLysLeuGluPheMetHislieLeuThrArgVal505560AsnArgLysValAlaThrGluPheGluSerPheSerPheAspAlaThr657075BOPheHisAlaLysLysGinlieProCyslieValSerMetLeuThrLys859095GluLeuTyrPheTyrHis100《210>113《211>12<212>DWA<213>人工序列-223>合成序列《220><221>CDS<222>(1)--(12)<223>夭冬氨酸特異性半胱氨酸蛋白酶3蛋白酶切割序列《221>misc—特征《222>0)..(12)<223>r+ADG_a或g+ADs-y十AD0-c或t<400>113garagyatggay12XaaXaaMetXaa<210>114<211>4<212>PRT<213>人工序列<400>114XaaXaaMe仁Xaa<210><211><212><213><220><t222><223>1869人類基因(l腳)人凝血因子n(凝血酶)的基因<220:><221>CDS<222》U)..(186S)<223>凝血因子"前體c220>c221>misc—特征(222>0)..(1869)-223>CDS:凝血W子II信號(hào)肽U..129)+ADs-CDS:凝血因于H(130.■1866)188-300,-3095GetiBank/NM—00050G2000-10-31<400,atggcgMetAla115cacgtcHiscgaArgggcttgLeuGinctgLeucct10GlytgcCysctgLeugccAlactglieu15getAla48gccctgAlaLeutgtCysageSer20cttIjeu9tgValHisSerGin25catHisgtgValPhectgLeugetAla30cctProGincaagcaGinAlaeggAxg35tcglieuetccagGineggArg40gtcc的gccAla3&CAsn45arcThrPhettgLeu144柳gagGluGlu50Valsag的cGly55LeugagGlucgaArggagtgc60gtggagacgThr132tgcageCysSer65TyrgagGlugagGlugccAla70ttcPhegagGlugetAlactgLeugagGlu75tecSertecgetAlaacgThr80240gatgtgAspValt的gccAla85t3cTyrThrgetAlaCys30gag3C3gcgAlaacgThr95cctpro288cgagstArgAspIjyscttLieu100getAlaAlaCysc匸ggaaLeuGl"u10S砂tgtgetgag110991lieu336ggtacgaac匕accgagggcatgtgaacateacceggteaggcattgagGlyThrAsnTyrArgGlyHisValAsn工leThrArgSerGlylieGlu115120125384tgccagCysGin130Ct3LeuTrpArgSercgcArg135t3CCCaTyrProcatHisaagcctLysPro140g的GluatelieAsntecSer4323Ct145ThrHiscctProgggGlygccAla150AspCtSLLeuGingagaatGluAsn155ttctgccgcPheCysArgssccccAsnPro160480AspageSerageSer3CCThracgThr165GlyProtggTrptgcCystacactTyrThr1703C3g&ccccThrAspProaccgtgThrVal175528ArgaggcagGinGlu180tgcCysageSer3tcliecctProgtcVal185tgtggcCysGlycaggatcaaGinAspGin190gtcactValThr57SValAlaMet195setThrProcgctecSergaaGlu20099CGlytecagtgtgaatctgValAsnLeu205tCSLCCtSerPro624ProLeu210GlucagGintgtCys9tccctPro215gatAspegggggcsgGlyGincagtaccagGinTyrGin220gggcgcGlyArg672ct:g225A!LaVal3CCcatHis230gggGlyetcLeuProtgcctgCysLeu23SgcctgggccAlaTrpAlaSerAla240720cagGingccAlaAlactgLeu245ageSercagGingacttcAspPhe250aacteagetAsnSerAlagtgcagValGin255768ctggtggagaacttctgccgcaacccagacggggatgaggagggcgtgLeuValGluAsnPheCysArgAsnProAspGlyAspGluGluGlyVal2S026527081StggtgctatgtggccgggaagcctggcgactttgggtactgcgacetcTrpCysTyrValAlaGlyLysProGlyAspPheGlyTyrCysAspLeu2752BD2858"aactattgtgaggaggccgtggagga9gagacaggagatgggctggatAsnTyrCysGluGluAlaValGluGluGluThrGlyAspGlyle\iAsp290295300912190gaggacteagacagggccategaagggcgtaccgccaccagtgagtacGluAspSerAspArgAlalieGluGlyArgThrAlaThrSearGluTyr3053103153209S0cagactttcttcaatccgaggacctttggctegggagaggcagactgtGinThrPhePheAsnProArgThrPheGlySerGlyGluAlaAspCys32533033S1008gggctgcgacctctgttcgagaagaagtegctggaggacaaaaccgaaGly!>euArgProLeuPheGluLysLysSerLeuGluAspLysThrGlu3403453501056agagagetcctggaatectacategacgggcgcattgtggagggctegArgGluLeuLeuGluSerTyr工leAspGlyArglieValGluGlySer3553603651104ga_tgcaAspAla370gagateggcatgGlu工leGlyMetteaSer375ProTrpcagGingtgatgcttValMetLeu380t仁ceggPheArgsag1152agtccccaggagctgctgtgtggggccageetcateagtgaccgctggSerProGinGluLeulieuCysGlyAlaSerLeulieSerAspArgTrp3853903954001200gtcetcaccgccgcccactgcetcctgtacccgccctgggacaagaacValLeuThrAlaAlaHisCysLeuLeuTyrProProTrpAspLysAsn40S41041S1248ttcaccgagaatgaccttctggtgcgcattggcaagcacteccgcacaPheThrGluAsnAspLieuLeuValArglieGlyLysHisSerArgThr42042S4301296aggtacgagcgaaacattgaaaagatatecArgTyrGluArgAsnlieGluLyslieSer435440atgttggaaaagateMetLeuGluLyslie445Tyr1344lieHis450cccaggtacaacProArgTyrAsntggc躬gagaacctggacegggaca匕tgccTrpArgGluAsnLeviAspArgAsplieAla45546013S2191ctgatgLeuMet465ctgIjeuaagLysaag470cctPro9ttValgccAlattcagtSer475AsptscTyr3ttlieC3CHisPro4801440gtgtgtValCysc仁gLeuProgacAsp485鄉(xiāng)gagGluThrgcaAlaAla430ageSerttgLeuLieucagGingetAla495Gly1488tacaaggggeggArg500gtgValscatThr9gcGlyt的TrpggcGly505sacctgLeuLysgagGlu3cgThr510tggTrp3C3Thr1536gccaacAlaAsn51SggtGlycagGinPiro520391SergtcValctgLeuGin卿Val525gtgValLeu1S84cccattProlie530ValgagGlueggccgProgtcVal535匕gcCysgacAsptecSerThr540c93liecgcArg3tClie1632actgacThrAsp54533C3tgMetttctgtCys550getAlaGlyTyrProS55gatABpgaaGlugggGly333LyscgaArg5601680卿gatGlyAspgccAlaCysgaaGlu565GlyAsp鵬Gly570ProtttMetaagLys57SageSer1728ccctttProPhe580柳TrptatTyrGinatgMet58599CGlyliegtcValtC3SertggTrp590931GlyGlu1776ggctgtGlyCysgac■Asp59Sc的gatAspGly"仁60Dt3CThrC3tHis60SValttccgc1824ctgaagLeuLys610Trp3C3liecagGinLys515gtcVal^仁tliegatAspGintttS20Gly柳tag192<210>116<211>"2<212>PRT<213>人類<400>116MetAlaHisValArgGlyLeuGinLeuProGlyCysLeuAlaLeuAla151015AlaI>euCy曰SerLeuValHisSerGinHisValPheLeuAlaProGin202530GinAlaArgSerLeuLeuGinArgValArgArgAlaAsnThrPheLeu354045GluGluValArgLysGlyAsnLeuGluArgGluCysValGluGluThrSO55SOCysSerTyxGluGluAlaPheGluAlaLeuGluSerSerThrAlaThr65707580AspValPheTrpAlaliysTyxThrAlaCysGluThrAlaArgThrPro8S9095ArgAspLysLeuAlaAlaCysLeuGluGlyAsnCysAlaGluGlyLeu100105110GlyThrAsnTyrA巧GlyHisValAsnlieThrArgSerGly工leGlu115120125CysGinLeuTrpArgSerArgTyxProHisLysProGlulieAsnSer130135140ThrThrHisProGlyAlaAspLeuGinGluAsnPheCysArgAsnPro145ISO155160AspSerSerThrThrGlyProTrpCysTyrThrThrAspProThrVal170175ArgArgGinG:iuCysSerlieProValCysGlyGinAspGinValThr180185190ValAlaMetThrProArgSerGluGlySerSerValAsnLeuSerPro19520020SProLeuGluGinCysValProAspArgGlyGinGinTyxGinGlyArg210215220LeuAlaValThxThrHisGlyLeuProCysLeuAlaTrpAlaSerAla225230235240GinAlaLysAlaLeuSerLysHisGinAspPheAsnSerAlaValGin2452S0255LeuValGluAsnPheCysArgAsnProAspGlyAspGluGluGly"Val2602S5270TrpCysTyrValAlaGlyLysProGlyAspPheGlyTyrCysAspLeu27S280285AsnTyxCysGluGluAlaValGluGluGluThrGlyAspGlyLeuA印2902953D0GluAspSerAspArgAlalieGluGlyArgThrAlaThrSerGluTyx305310315320GinThrPhePheAsnProArgThrPheGlySerGlyGluAlaAspCys32S33033SGlyJjeuArgProI*euPheGluLysLysSerLeviGluAspLysTho:Glu340345350ArgGluLeuLeuGluSerTyxlieAspGlyArglieValGluGlySer35S3S0365AspAlaGlu工leGlyMetSerProTrpGinValMetLeuPheArgIys370375380194SerProGinGluLeuLeuCysGlyAlaSerLeulieSerAspArgTrp385390335400ValLeuThrAlaAlaHisCysLeuLeuTyrProProTrpAspLysAsn405410415PheThrGluAsnAspLeiiLeuValArg工leGlyLysHisSerArgThr420425430ArgTyrGluArgAsnlieGluLyslieSerMetLeuGluLyslieTyr435440445lieHisProArgTyrAsnTrpArgGluAsnLeuAspArgAsplieAla450455"0LeuMetLysLieuliysLysProValAlaPheSerAspTyrlieHisPro465470475480ValCysLeuProAspArgGluThrAlaAlaSerLeuLeuGinAlaGly485490495TyrLysGlyArgValThrGlyTrpGlyAsnLeuLysGluThrTrpThr500505510AlaAsnValGlyLysGlyGinProSerValLeuGinValValAsnLeu515520S25Prolie"ValGluArgProValCysLysAspSerThrArglieArglieS30535540ThrAspAsnMetPheCysAlaGlyTyrLysProAspGluGlyLysArg5455S0555560GlyAspAlaCysGluGlyAspSerGlyGlyProPheValMetLysSer565570575ProPheAsnAsnArgTrpTyrGinMetGlylieValSerTrpGlyGlu580585590GlyCysAspArgAspGlyLysTyrGlyPheTyrThrHisValPheArg195595SOOG05Leu!>ysLysTrplieGinLysVallieAspGinPheGlyGluS10S15S20<210><211><212><213><220><223><220><221><222><223>11721人工序列合成序列CDS(1)..(21)血小板糖蛋白V凝血酶切割序列"00>117cccgggccceggggcccgcct21ProGlyProArgGlyProPro<210><213>118人丁序列<400>118ProGlyProArgGlyProPro-210>119196<211>1878<212>UNA<213>人類<220><221><222><223>基因(〗)..(]878)人因子XI(血液凝固因子)的基因<220><221>CDS<222>(1)-(18*75)<223>前原因子x〗<220><221>misc一特征<222>(1)…(18781〈223>CDS:因子XI信號(hào)肽(1..54)+ADs-CDS:因子XI重鏈(55,,1161)+ADs-CDS:因子XI輕鏈(1162....1875)<3O0><308>GenBank/M13142OD9>1994-11-08<400>119atgattttcttatatcaagtggtacatttcattttatttactteagtt48MetnePheLeuTyrGinValValHisPhe工leLeuPheThrSerVal151015tc仁ggtgaatgtgtgactcag仁tgttgaaggacaectgctttgaagga96SerGlyGluCysValThrGinLeuLeuLysAspTtirCysPheGluGly202530ggggacattGlyAsplie35actThraeggtcValttC3C3PheThr40ProageSergecAlaLystsictgccagCysGingtaVal144197gtctgcacttaccacValCysThrTyrHis50ccaagatgtProArgCys55tt3LeuetcttcLeuPhesetThr60ttcPheacggcggaaThrAlaGlu192teaccstctSerProSer65gaggatGluAspcccseccgsProThrArg70Tiptttset75tgtCysgtcValctgaaalieuIjysgacAsp80240agtgttacaSerValThrgaaacaGluThr85ctgccaagaProArggtgValaataggAsnArg30ThrAlagcgattAlalie95tctSer288gggtattctGlyTyrSerttcPhe100GintgcteaCysSerC3CHis105Ginat3lieageSergetAlatgcaacCysAsn11033333SgacsttAsplieTyr115gtgValgacAspCt3lieugacatgAspMet120aag的cGly3t3lie33CAsn125sacageAsnSertC3Ser384gttgccValAla130ag仁SergetAlaGingaatgcGluCys135GingaaGluagaArgtgcCys140acggatgacAspAspgtcVal432cactgcHisCys14SCSCHistttPhettcPheaegThr150tacgccTyxAlaThrArgGin155tttPheProagectgSerLeugagGlu160480catcgtHisArg3ttlieCys165ctaLeuctgaagLeuIjysC3CHisThr170Gin3C3ThrgggGly3C3ThrPro1753CCThr528agaataArgliesegThraagLys180etcLeugatAspaaagtgIjysValgtg18StctSer的aGly仁ttPhetc3Serctgaaalieulys190tecSer576tgtgcaCysAlacttIjeu195tc仁SeraatAsnctgLeugc仁tgtAlaCys200attlieaggArggacAsp3ttliettcPhe205CCt33tProAsnaegThr624gtgtttValPhe210gca■MagacAspageSeratelie215gaca_gtAspSergtcatgValMetgetAla220cccProgatAspgetAlatttPhe672gtctgtValCys225GlyArgatelietgcCys230actThrestcatHisHiscccggtProGly235CysttgLeutttPhetttPhe3CCThr240720ttctttPhePhetecSerceigGingasGlu245tggcccProgaaLyBGlutctcaaSerGin250ag改cttLeutgtCys255etcLeu768cttaasLeuLysThrtctSer260gagagtSer的aGlyttgccc!>euPro265agtacaSerThrcgcArgattlieLys270aagageSer816aaagetLysAlacttlieu275tctggtGlyttcPheagtSerctsc站lieuGin280agetgcS6i:Cys鄉(xiāng)ArgCSLCHis2B5ageSerliePro8"gtgttcValPhe290tgcCysC3tHistctSerteatttPhe235taccatTyrHiBgacactAspThrgatAsp300ttcttgLeuGlygaa912gasctgGluLeu305gatAspliegttValgetAla310gcaAlaaaaagtcacgagHisGiu315AlatgcCyscagGin333ctgLeu320960tgcaccCysThr33tAsngecAlagtcVal325cgctgcCyscagtttGinPhetttaccPheThr330TyrThrProgecAla335C33Gin1008gcatecAlaSertgc340gaagggGlyLysggcaagGlyLys345tgttacCysTyrttaLeuLysctt3S0tctSerteaSer1056AsnGlySer355CC3ProactThr3333t3liecttcaclieuHis360的gsgaGlyArgGlyGlyatelietctSerGly1104199t3CTyr370tt3ArgttgLieu仁gtCys333375atgMetgatAspaatgagAsiaGlutgtCys3803CCThrThrLys3tClie1152Lys385ProArgateliegttVal的3Gly390333actThrAlatctgttSerVal395Arg99tGlygagGlut39Pro4001200TrpcagGingtgVal3CGThrctgLeu405cscHisThrsecThrteaccc3CtProThr410cagGinArgHisctgLieu415tgtCys1248GlyggcGlytecSeratelie4203tt工le的aGlycagGintggTrp425atattalieLeuThrgecAlagetAla430C3CHistgtCysttcTyrgggGly435gtagagGluteaSexProaagLys440attliettgcgtIjsuArggtcValtacTyr445SerGlylie1344ttaLeu33tAsn450C33GintctSergaaGluatalie的ElLys455gagGlugacAspacatctThrSerttcPhe4S0ttt鵬GlygttValC33Gin1392gaaGlu465lieatalie3tCHeC3tHisgatAsp470Gint3tTyxLysatggcaMetAla475gaaGluSerGlygatAsp4801440attliegecAlattgLeuttglieu333Lys485LeugaaGluThr3C3gtgaatValAsn490tacgattctAspSer"5Gin1488ccc3t3lietgcCys500ctgLeucctProtecSer333LysGly505gatagaAspArg33仁AsnlieTyr510Thr1536Asp仁gcCysTrp5153仁3ValsetThrGlyGly520tacTyxArgLysCt3LeuagaArg525AspLyslie1584200caaaatactetccagaaagecaagatacccttagtgaccaacgaagag1632GinAsnThrLeuGinLysAlaLys工leProLeuValThrAsnGluGlu530535540tgccagaagagatacagaggacataaaataacccataagatgatetgt16BOCysGinLysArgTyrArgGlyHisLyslieThrHisLysMetlieCys5455S0555gecggctacagggaaggagggaaggacgettgcaag的agatteggga1728AlaGlyTyrArgGluGlyGlyLysA印AlaCysLysGlyA叩SerGly565570S75ggccctctgtectgcaaacacaatgaggtctggcatctggta的cate1776GlyProLe\iSe:cCysLysHisAsnGluValTrpHisLeuValGlylieS80585590acgagetggggcgaaggctgtgetcaaagggageggccaggtgtttac1824ThrSerTrpGlyGluGlyCysAlaGinArgGluArgProGlyValTyr59S600605accaacgtggtcgagtacgtggactggattctggagaaaactcaagca1872ThrAsnValValGluTyrValAspTrplieLeuGluLysThrGinAla610615620gtgtga1878VaiS2S<210><212>120625人類"00>120Met工lePheIeuTyrGinValValHisPhelieLeuPheThrSerVal51015SerGlyGluCysValThrGinI*euLeuLysAspThrCysPheGluGly202530GlyAsplieThrThrValPheThrProSerAlaLysTyrCysGinVal354045ValCysThrTyrHisProArgCysLeuLeuPheThrPheThrAlaGlu505560SerProSerGluAspProThrArgTrpPheThrCysValLeuLysA印6S707580SerValThrGluTbrLeuProArgValAsnArgThrAlaAlalieSer859095GlyTyrSerPheLysGinCysSerHisGinlieSerAlaCysABnLys100105110AsplieTyrValAspLeuAspMetLysGly工leAsnTyrAsnSerSerIIS120125ValAlaLysSerAlaGinGluCysGinGluArgCysThrAspAspVal130135140HisCysHisPhePheThrTyrAlaThrArgGinPheProSerLeuGlu14S1501SS160KisArgAsnlieCysLeuI^uLysHisThrGinThrGlyThrProThr165170175ArglieThrLysLeuAspLysValValSerGlyPheSerLeuLysSer180185130CysAlaLeuSerAsnLeuAlaCys工leArgAspliePheProAsnThr195200205ValPheAlaAspSerAsn工leAspSerValMetAlaProAspAlaPhe210215220ValCysGlyArg工leCysThrHisHisProGlyCysLeuPhePheThr225230235240202PhePheSerGinGluTrpProLysGluSerGinArgAsnLeuCysLeu245250255LeuLysThrSerGluSerGlyLeuProSerThrArglieLysLysSer260265270LysAlaLeu-SerGlyPheSerLeuGinSerCysArgHisSerliePro275280285ValPheCysHisSerSerPheTyrHisAspThrAspPheLeuGlyGlu290295300GluLeuAsplieValAlaAlaLysSerHisGluAlaCysGinLysLeu305310315320CysThrAsnAlaValArgCysGinPhePheThrTyrThrProAlaGin325330335AlaSerCysAsnGluGlyLysGlyLysCysTyrLeuLysLeuSerSer340345350.AsiaGlySerProThrLyslieLeuHisGlyArgGlyGlylieSerGly3553603S5TyrThrLeuArgI*euCysLysMetAspAsnGluCysThrThrLyslie370375380LysProArglieValGlyGlyThrAlaSerValArgGlyGluTrpPro38539039S400TrpGinValThrLeuHisThrThrSerProThrGinArgHisLeuCys405410415GlyGlySerlielieGlyAsnGinTrplieLeuThrAlaAlaHisCys420425430PheTyiGlyValGluSerProLys工leLeuArgValTyrSerGlylie435440445LeuAsnGinSerGlulieLysGluAspThrSerPhePheGlyValGin203450455460GlulielielieHisAspGinTyrLysMetAlaGluSerGlyTyrAsp465470475480lieAlaLeuLeuLysLeu(31uThrThrValAsnTyrThrAspSerGin485490495ArgProlieCysLeuProSerLysGlyAspArgAsnVallieTyrThr500505510AspCysTrpValThrGlyTrpGlyTyxArgLysI*euArgAspLyslie515520525GinAsnThrLeuGinLysAlaLyslieProLeuValThrAsnGluGlu530535540CysGinLysArgTyrArgGlyHisLyslieThrHisLysMet工leCys5455S0555560AlaGlyTyrArgGluGlyGlyLysAspAlaCysLysGlyAspSerGly565570575GlyProLeuSerCysLysHisAsnGluValTrpHisLeuValGly工le580585590ThrSerTrpGlyGluGlyCysAlaGinArgGluArgProGlyValTyr535600605ThrAsnValValGluTyrValAspTrplieLeuGluLysThrGinAla610615620Val62520權(quán)利要求1.嵌合蛋白質(zhì),其包含至少一種有靶向到亞細(xì)胞器的運(yùn)輸信號(hào)的信號(hào)蛋白質(zhì)和至少一種蛋白酶的蛋白酶剪切位點(diǎn),將其構(gòu)建為(a)通過連接蛋白水解位點(diǎn)或通過蛋白水解位點(diǎn)連接信號(hào)掩蔽蛋白質(zhì)至信號(hào)蛋白質(zhì)的N或C末端,失活所有信號(hào)蛋白質(zhì)的運(yùn)輸信號(hào),因此嵌合蛋白質(zhì)存在于胞質(zhì)溶膠中;(b)當(dāng)?shù)鞍酌讣羟形稽c(diǎn)被蛋白酶切割時(shí),至少一種信號(hào)蛋白質(zhì)的運(yùn)輸信號(hào)被活化,并導(dǎo)致至少一種包含活化信號(hào)蛋白質(zhì)的片段蛋白質(zhì)被轉(zhuǎn)運(yùn)到亞細(xì)胞器;和(c)用至少一種熒光蛋白質(zhì)標(biāo)記嵌合蛋白質(zhì),熒光標(biāo)記信號(hào)在細(xì)胞中的位置和強(qiáng)度分布根據(jù)蛋白酶的切割而改變。2.嵌合蛋白質(zhì),其包含至少兩種有把向到亞細(xì)胞器的運(yùn)輸信號(hào)的信號(hào)蛋白質(zhì)和至少一種蛋白酶的蛋白酶剪切位點(diǎn),將其構(gòu)建為(a)—種信號(hào)蛋白質(zhì)的運(yùn)輸信號(hào)保持活性,通過連接蛋白水解位點(diǎn)或通過蛋白水解位點(diǎn)連接信號(hào)掩蔽蛋白質(zhì)至信號(hào)蛋白質(zhì)的N或C末端,失活其余信號(hào)蛋白質(zhì)的運(yùn)輸信號(hào),因此嵌合蛋白質(zhì)被轉(zhuǎn)運(yùn)到特定的通過活性信號(hào)蛋白質(zhì)運(yùn)輸信號(hào)把向的亞細(xì)胞器;(b)在嵌合蛋白質(zhì)轉(zhuǎn)運(yùn)到亞細(xì)胞器后,至少一種蛋白水解位點(diǎn)和至少一種失活信號(hào)蛋白質(zhì)暴露于胞質(zhì)溶膠中;(c)當(dāng)?shù)鞍酌讣羟形稽c(diǎn)被蛋白酶切割時(shí),所述的至少一種暴露于胞質(zhì)溶膠的失活信號(hào)蛋白質(zhì)的運(yùn)輸信號(hào)被活化,并導(dǎo)致包含活化信號(hào)蛋白質(zhì)的片段蛋白質(zhì)被轉(zhuǎn)運(yùn)到與嵌合蛋白質(zhì)被轉(zhuǎn)運(yùn)的亞細(xì)胞器不同的亞細(xì)胞器;和(d)用至少一種焚光蛋白質(zhì)標(biāo)記嵌合蛋白質(zhì),熒光信號(hào)在細(xì)胞中的位置和強(qiáng)度分布根據(jù)蛋白酶的切割而改變。3.根據(jù)權(quán)利要求1和2任一權(quán)利要求的嵌合蛋白質(zhì),其中在蛋白酶剪切產(chǎn)生的片段蛋白質(zhì)中,至少兩種有不同的細(xì)胞定位特點(diǎn)的片段蛋白質(zhì),其各自包括一種熒光蛋白質(zhì),使用的熒光蛋白質(zhì)由至少兩種不同波長(zhǎng)的熒光蛋白質(zhì)組成。4.根據(jù)權(quán)利要求1和2任一權(quán)利要求的嵌合蛋白質(zhì),其中在包含失活運(yùn)輸信號(hào)被蛋白酶剪切活化的信號(hào)蛋白質(zhì)的片段蛋白質(zhì)中,至少一種片段蛋白質(zhì)包含熒光蛋白質(zhì).5.嵌合蛋白質(zhì),其包含有靶向到亞細(xì)胞器的運(yùn)輸信號(hào)的信號(hào)蛋白質(zhì)和通過蛋白酶的蛋白酶剪切位點(diǎn)與信號(hào)蛋白質(zhì)連接的熒光蛋白質(zhì),將其構(gòu)建為(a)由于嵌合蛋白質(zhì)中信號(hào)蛋白質(zhì)的運(yùn)輸信號(hào)保持活性,因此嵌合蛋白質(zhì)被轉(zhuǎn)運(yùn)到亞細(xì)胞器;(b)在嵌合蛋白質(zhì)轉(zhuǎn)運(yùn)到亞細(xì)胞器后,蛋白酶剪切位點(diǎn)和熒光蛋白質(zhì)暴露于胞質(zhì)溶膠中;和(c)因此,當(dāng)暴露于胞質(zhì)溶膠的蛋白酶剪切位點(diǎn)被蛋白酶切割時(shí),暴露于胞質(zhì)溶膠的熒光蛋白質(zhì)被釋放到胞質(zhì)溶膠中.6.權(quán)利要求5的嵌合蛋白質(zhì),其中保持活性的信號(hào)蛋白質(zhì)用與暴露到胞質(zhì)溶膠的萸光蛋白質(zhì)熒光波長(zhǎng)不同的熒光蛋白質(zhì)進(jìn)一步標(biāo)記,且該另外的熒光蛋白質(zhì)在蛋白酶剪切發(fā)生后仍附著在活性信號(hào)蛋白質(zhì)上。7.根據(jù)權(quán)利要求l和2任一權(quán)利要求的嵌合蛋白質(zhì),其中失活信號(hào)蛋白質(zhì)的運(yùn)輸信號(hào)是靶向到選自線粒體、葉綠體和過氧化物酶體亞細(xì)胞器的信號(hào)。8.根據(jù)權(quán)利要求1和2任一權(quán)利要求的嵌合蛋白質(zhì),其中失活信號(hào)蛋白質(zhì)是選自擬南芥屬外包膜蛋白質(zhì)7(AtOEP7)、Rubisco小亞單位(RbcS)、葉綠素a/b結(jié)合蛋白質(zhì)(Cab)、Rubisco活化酶(RA)、Fl-ATPase和過氧化物酶體把向基序(SKL)的全長(zhǎng)蛋白質(zhì)或其包含運(yùn)輸信號(hào)的片段。9.根據(jù)權(quán)利要求2和5任一權(quán)利要求的嵌合蛋白質(zhì),其中保持活性的信號(hào)蛋白質(zhì)的運(yùn)輸信號(hào)是靶向到選自線粒體、葉綠體和細(xì)胞核的外膜、過氧化物酵體膜和質(zhì)膜之一的信號(hào)。10.根據(jù)權(quán)利要求2和5任一權(quán)利要求的嵌合蛋白質(zhì),其中保持活性的信號(hào)蛋白質(zhì)是與特定磷脂特異結(jié)合的蛋白質(zhì)。11.根據(jù)權(quán)利要求2和5任一權(quán)利要求的嵌合蛋白質(zhì),其中保持活性的信號(hào)蛋白質(zhì)是選自擬南芥屬外包膜蛋白質(zhì)7(AtOEP7)、H+-ATPase、Pleckstrin同源結(jié)構(gòu)域(PH)和FAPP(家族A(磷酸肌醇結(jié)合特異)成員3)的Pleckstrin同源結(jié)構(gòu)域的全長(zhǎng)蛋白質(zhì)或其包含運(yùn)輸信號(hào)的片段。12.根據(jù)權(quán)利要求1和2任一權(quán)利要求的嵌合蛋白質(zhì),其中信號(hào)掩蔽蛋白質(zhì)選自氨基酸、肽和蛋白質(zhì)。13.根據(jù)權(quán)利要求l、2,和5任一權(quán)利要求的嵌合蛋白質(zhì),其中熒光蛋白質(zhì)選自綠色熒光蛋白質(zhì)(GFP)、紅色焚光蛋白質(zhì)(RFP)、其突變體和其衍生物。14.包含編碼權(quán)利要求l、2,和5任一權(quán)利要求的嵌合蛋白質(zhì)的核酸序列的重組基因,其被構(gòu)建以在細(xì)胞中表達(dá)該嵌合蛋白質(zhì)。15.用權(quán)利要求14的重組基因轉(zhuǎn)化的細(xì)胞。16.權(quán)利要求15的細(xì)胞,其中細(xì)胞是真核細(xì)胞。17.權(quán)利要求16的細(xì)胞,其中真核細(xì)胞是植物細(xì)胞。18.分析體內(nèi)蛋白酶活性的方法,包括(a)用權(quán)利要求14的重組基因轉(zhuǎn)化細(xì)胞;(b)在步驟(a)之前、之后或同時(shí)轉(zhuǎn)化該細(xì)胞以表達(dá)蛋白酶;(c)溫育轉(zhuǎn)化細(xì)胞以表達(dá)蛋白質(zhì);(d)觀察溫育細(xì)胞中熒光信號(hào)分布的圖像;和(e)通過步驟(d)中觀察到的熒光圖像與無(wú)步驟(b)制備的對(duì)照轉(zhuǎn)化細(xì)胞的熒光圖像對(duì)比,確定蛋白酶的活性。19.篩選體內(nèi)蛋白酶抑制劑的方法,包括(a)用權(quán)利要求14的重組基因轉(zhuǎn)化細(xì)胞;(b)在步驟(a)之前、之后,或同時(shí)轉(zhuǎn)化該細(xì)胞以表達(dá)蛋白酶;(c)在步驟(b)之前、之后,或同時(shí)用抑制蛋白酶的候選藥物處理轉(zhuǎn)化細(xì)胞;(d)溫育轉(zhuǎn)化細(xì)胞以表達(dá)蛋白質(zhì);(e)觀察溫育細(xì)胞中熒光信號(hào)分布的圖像;和(f)通過步驟(e)中觀察到的熒光圖像與無(wú)步驟(b)制備的對(duì)照轉(zhuǎn)化細(xì)胞、無(wú)步驟(c)制備的對(duì)照轉(zhuǎn)化細(xì)胞、及無(wú)步驟(b)和(c)制備的對(duì)照轉(zhuǎn)化細(xì)胞中至少一個(gè)的熒光圖像對(duì)比,確定候選藥物的蛋白酶抑制活性。20.權(quán)利要求18和19任一權(quán)利要求的方法,其中轉(zhuǎn)化細(xì)胞表達(dá)蛋白酶的步騍是插入表達(dá)蛋白酶的重組基因的步驟,或用能表達(dá)蛋白酶的病毒感染的步驟。21.權(quán)利要求18和19任一權(quán)利要求的方法,其中被轉(zhuǎn)化的細(xì)胞是真核細(xì)胞。22.權(quán)利要求18和19任一權(quán)利要求的方法,其中被轉(zhuǎn)化的細(xì)胞是植物細(xì)胞。23.檢測(cè)細(xì)胞中蛋白酶的系統(tǒng),其中系統(tǒng)包含嵌合蛋白質(zhì),其包含共價(jià)連接成分1)至少一種可選地掩蔽的信號(hào)蛋白質(zhì);2)至少一種蛋白酶特異的切割位點(diǎn);和3)至少一種可檢測(cè)的氨基酸序列。24.權(quán)利要求23的系統(tǒng),其中嵌合蛋白質(zhì)包含共價(jià)順序連接的1)信號(hào)蛋白質(zhì);2)蛋白酶特異的切割位點(diǎn);和3)可檢測(cè)的氨基酸序列。25.權(quán)利要求23的系統(tǒng),其中嵌合蛋白質(zhì)包含共價(jià)順序連接的1)掩蔽序列;2)蛋白酶切割位點(diǎn);3)信號(hào)蛋白質(zhì);和4)可檢測(cè)的氨基酸序列。26.權(quán)利要求23的系統(tǒng),其中嵌合蛋白質(zhì)包含共價(jià)順序連接的1)信號(hào)蛋白質(zhì);2)蛋白酶切割位點(diǎn);3)掩蔽序列;和4)可檢測(cè)的氨基酸序列。27.權(quán)利要求23的系統(tǒng),其中嵌合蛋白質(zhì)包含共價(jià)順序連接的1)第一信號(hào)蛋白質(zhì);2)蛋白酶切割位點(diǎn);和3)第二信號(hào)蛋白質(zhì);和4)可檢測(cè)的氨基酸序列。28.權(quán)利要求27的系統(tǒng),其中嵌合蛋白質(zhì)包含共價(jià)順序連接的1)第一信號(hào)蛋白質(zhì);2)第一蛋白酶切割位點(diǎn);3)掩蔽序列;4)第二信號(hào)蛋白質(zhì);和5)可檢測(cè)的氨基酸序列。29.權(quán)利要求23的系統(tǒng),其中嵌合蛋白質(zhì)包含共價(jià)順序連接的l)掩蔽序列;2)第一蛋白酶切割位點(diǎn);3)第一信號(hào)蛋白質(zhì);4)第二蛋白酶切割位點(diǎn);5)第二信號(hào)蛋白質(zhì);和6)可檢測(cè)的氨基酸序列。30.權(quán)利要求23的系統(tǒng),其中嵌合蛋白質(zhì)包含共價(jià)順序連接的1)第一信號(hào)蛋白質(zhì);2)第一蛋白酶切割位點(diǎn);3)第二信號(hào)蛋白質(zhì);4)第二蛋白酶切割位點(diǎn);5)掩蔽序列;和6)可檢測(cè)的氨基酸序列。31.權(quán)利要求23的系統(tǒng),其中嵌合蛋白質(zhì)包含共價(jià)順序連接的1)蛋白酶特異的切割位點(diǎn);2)信號(hào)蛋白質(zhì);和3)可檢測(cè)的氨基酸序列。32.權(quán)利要求23的系統(tǒng),其中嵌合蛋白質(zhì)包含共價(jià)順序連接的l)第一信號(hào)蛋白質(zhì);2)第一可檢測(cè)序列;3)蛋白酶切割位點(diǎn);和4)第二可檢測(cè)序列。33.權(quán)利要求32的系統(tǒng),其中嵌合蛋白質(zhì)進(jìn)一步包含共價(jià)連接在蛋白酶切割位點(diǎn)C末端和第二可檢測(cè)序列N末端之間的第二信號(hào)蛋白質(zhì)。34.權(quán)利要求23的系統(tǒng),其中嵌合蛋白質(zhì)包含共價(jià)順序連接的l)第一信號(hào)蛋白質(zhì);2)蛋白酶切割位點(diǎn);3)第二信號(hào)蛋白質(zhì);和4)第二可檢測(cè)序列。35.權(quán)利要求23的系統(tǒng),其中嵌合蛋白質(zhì)包含共價(jià)順序連接的1)第一可檢測(cè)序列;2)蛋白酶切割位點(diǎn);3)信號(hào)蛋白質(zhì);和4)第二可檢測(cè)序列。36.權(quán)利要求23的系統(tǒng),其中任何一種成分構(gòu)成嵌合蛋白質(zhì)的N末端。37.權(quán)利要求23的系統(tǒng),其中任何一種成分構(gòu)成嵌合蛋白質(zhì)的C末端。38.權(quán)利要求23的系統(tǒng),其中信號(hào)蛋白質(zhì)足以將嵌合蛋白質(zhì)或至少一種其成分定位到植物或動(dòng)物細(xì)胞的細(xì)胞器。39.權(quán)利要求38的系統(tǒng),其中信號(hào)蛋白質(zhì)將嵌合蛋白質(zhì)或至少一種其成分定位到植物細(xì)胞的細(xì)胞核、高爾基體、溶解液泡、儲(chǔ)存液泡、過氧化物酶體、線粒體、內(nèi)質(zhì)網(wǎng)、質(zhì)膜或葉綠體。40.權(quán)利要求39的系統(tǒng),其中信號(hào)蛋白質(zhì)是AtOEP7;RbcS;Cab;RA;SKL;Fl-ATPase;PH;FAPP;H+-ATPase之一;或其功能片段。41.權(quán)利要求38的系統(tǒng),其中信號(hào)蛋白質(zhì)將嵌合蛋白質(zhì)定位到動(dòng)物細(xì)胞的細(xì)胞核、高爾基體、儲(chǔ)存液泡、溶酶體、過氧化物酶體、內(nèi)質(zhì)網(wǎng)、質(zhì)膜或線粒體。42.權(quán)利要求41的系統(tǒng),其中信號(hào)蛋白質(zhì)是人肽蛋氨酸亞砜還原酶(MSRA)、細(xì)胞色素b2、ll-P-羥基類固醇脫氫酶(lip-HSD)、G9-AKL、過氧化物酶體整合膜蛋白質(zhì)47(PMP47)之一;或其功能片段。43.權(quán)利要求23的系統(tǒng),其中切割位點(diǎn)被哺乳動(dòng)物或病毒蛋白酶特異切割。44.權(quán)利要求43的系統(tǒng),其中切割位點(diǎn)被人類病原體相關(guān)的蛋白酶特異切割。45.權(quán)利要求44的系統(tǒng),其中蛋白酶由巨細(xì)胞病毒(CMV);單純皰滲病毒(HSV);肝炎病毒;瘧原蟲、人類免疫缺陷病毒(HIV)、卡波濟(jì)肉瘤相關(guān)皰滲病毒(KSHV)、黃熱病病毒、黃病毒或鼻病毒表達(dá)。46.權(quán)利要求43的系統(tǒng),其中蛋白酶是絲氨酸類型的蛋白酶。47.權(quán)利要求45的系統(tǒng),其中瘧原蟲是惡性瘧原蟲,蛋白酶是癥原蟲天冬氨酸蛋白酶I和瘧原蟲天冬氨酸蛋白酶II之一。48.權(quán)利要求45的系統(tǒng),其中切割位點(diǎn)被HSV成熟蛋白酶特異切割。49.權(quán)利要求45的系統(tǒng),其中肝炎病毒是丙型。50.權(quán)利要求44的系統(tǒng),其中人類病原體是酵母、細(xì)菌、真菌、線蟲、病毒或原生動(dòng)物。'51.權(quán)利要求43的系統(tǒng),其中切割位點(diǎn)被與血液凝固、凋亡或細(xì)胞外基質(zhì)相關(guān)的哺乳動(dòng)物蛋白酶特異切割。52.權(quán)利要求23的系統(tǒng),其中至少一種可檢測(cè)的序列是熒光、磷光或化學(xué)發(fā)光的序列。53.權(quán)利要求52的系統(tǒng),其中一種可檢測(cè)序列的發(fā)射波長(zhǎng)與至少一種其它的可檢測(cè)序列的發(fā)射波長(zhǎng)不同。54.權(quán)利要求52的系統(tǒng),其中可檢測(cè)序列是水母熒光蛋白質(zhì)或其衍生物。55.基本上純的嵌合蛋白質(zhì),包含共價(jià)連接成分l)至少一種可選地掩蔽的信號(hào)蛋白質(zhì);2)至少一種蛋白酶特異的切割位點(diǎn);和3)至少一種可檢測(cè)的氨基酸序列。56.包含編碼用于檢測(cè)細(xì)胞中蛋白酶活性的嵌合蛋白質(zhì)的序列的核酸,其中嵌合蛋白質(zhì)包含共價(jià)連接成分l)至少一種可選地掩蔽的信號(hào)蛋白質(zhì);2)至少一種蛋白酶特異的切割位點(diǎn);和3)至少一種可檢測(cè)的氨基酸序列。57.包含權(quán)利要求56的核酸的載體。58.用權(quán)利要求57的載體轉(zhuǎn)化的細(xì)胞。59.檢測(cè)細(xì)胞內(nèi)蛋白酶的試劑盒,該試劑盒包含至少下列之一a)嵌合蛋白質(zhì),其包含共價(jià)連接成分i)至少一種可選地掩蔽的信號(hào)蛋白質(zhì);ii)至少一種蛋白酶特異的切割位點(diǎn);和iii)至少一種可檢測(cè)的氨基酸序列;和b)包含核酸的栽體,其中核酸包含編碼嵌合蛋白質(zhì)的序列。60.檢測(cè)細(xì)胞或組織內(nèi)蛋白酶的方法,該方法包含a)將包含編碼嵌合蛋白質(zhì)的核酸的第一載體引入受試細(xì)胞或組織,其中嵌合蛋白質(zhì)包含共價(jià)連接成分1)至少一種可選地掩蔽的信號(hào)蛋白質(zhì);2)至少一種蛋白酶特異的切割位點(diǎn);和3)至少一種可檢測(cè)的氨基酸序列,b)在使第一載體編碼的嵌合蛋白質(zhì)表達(dá)的條件下溫育細(xì)胞或組織;和c)檢測(cè)嵌合蛋白質(zhì)亞細(xì)胞定位的變化作為細(xì)胞內(nèi)蛋白酶存在的指示。61.權(quán)利要求60的方法,其中該方法還包含將包含編碼蛋白酶的核酸序列的第二載體引入受試細(xì)胞或組織;并在細(xì)胞或組織中表達(dá)第二載體以在其中產(chǎn)生蛋白酶。62.檢測(cè)體內(nèi)蛋白酶抑制劑的方法,該方法包含a)將包含編碼嵌合蛋白質(zhì)的核酸的第一載體引入受試細(xì)胞或組織,其中嵌合蛋白質(zhì)包含共價(jià)連接成分1)至少一種可選地掩蔽的信號(hào)蛋白質(zhì);2)至少一種蛋白酶特異的切割位點(diǎn);和3)至少一種可檢測(cè)的氨基酸序列,b)將編碼受試蛋白酶的第二載體引入細(xì)胞或組織,c)細(xì)胞或組織與候選化合物接觸,d)在使第一栽體編碼的嵌合蛋白質(zhì)和第二載體編碼的蛋白酶表達(dá)的條件下溫育細(xì)胞或組織;和e)檢測(cè)嵌合蛋白質(zhì)亞細(xì)胞定位的變化作為蛋白酶抑制劑存在的指示。63.權(quán)利要求62的方法,其中該方法還包含使用自動(dòng)或半自動(dòng)的設(shè)備檢測(cè)嵌合蛋白質(zhì)亞細(xì)胞定位的變化。64.權(quán)利要求63的方法,其中自動(dòng)或半自動(dòng)的設(shè)備包含適于檢測(cè)細(xì)胞或組織內(nèi)可檢測(cè)序列的光學(xué)系統(tǒng)。全文摘要本發(fā)明公開了細(xì)胞內(nèi)蛋白酶檢測(cè)系統(tǒng)。在一個(gè)實(shí)施方案中,該系統(tǒng)包括嵌合蛋白質(zhì),其包括共價(jià)連接成分1)至少一種可選地掩蔽信號(hào)蛋白質(zhì);2)至少一種蛋白酶特異的切割位點(diǎn);和3)至少一種可檢測(cè)的氨基酸序列。本發(fā)明有廣譜的應(yīng)用,包括用于細(xì)胞和組織內(nèi)新蛋白酶抑制劑的檢測(cè)。文檔編號(hào)C12N15/63GK101684161SQ20091016576公開日2010年3月31日申請(qǐng)日期2002年8月8日優(yōu)先權(quán)日2001年8月10日發(fā)明者李勇直,金旲憲,黃仁煥申請(qǐng)人:阿赫姆生物系統(tǒng)公司