專利名稱:一種人白血病相關(guān)逆轉(zhuǎn)錄病毒基因組編碼的蛋白質(zhì)與多肽序列及其應(yīng)用的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及與人白血病病因、發(fā)病機理及治療有關(guān)的逆轉(zhuǎn)錄病毒基因組編碼的新蛋白質(zhì),其具有SEQ ID NO.1、3或5所示的氨基酸序列或其片段,或為與其同源性在95%以上的病毒蛋白多肽變體或衍生物。本發(fā)明還涉及該病毒基因組編碼的病毒蛋白質(zhì)和多肽序列的制備方法。本發(fā)明還涉及一種用于檢測樣本中是否存在人白血病相關(guān)逆轉(zhuǎn)錄病毒基因組編碼的病毒蛋白的方法和一種用于阻抑人白血病相關(guān)逆轉(zhuǎn)錄病毒方法。
本發(fā)明人首次從白血病患者原代白血病細胞中分離和克隆到一種全長逆轉(zhuǎn)錄病毒前病毒基因組。實驗證實該病毒基因組不僅存在于大多數(shù)白血病患者中,表達相應(yīng)的病毒RNA和病毒蛋白,而且具有惡性轉(zhuǎn)化正常細胞的功能。并在此基礎(chǔ)上得到了與人白血病病因、發(fā)病機理及治療有關(guān)的逆轉(zhuǎn)錄病毒基因組編碼的新蛋白質(zhì)。由此,為鑒定、治療和/或預(yù)防人類白血病提供了一條新的途徑。
本發(fā)明的另一方面提供了一種分離的人白血病相關(guān)逆轉(zhuǎn)錄病毒基因組POL基因編碼的病毒蛋白多肽,其具有SEQ ID NO.3所示的氨基酸序列或其片段,或為與其同源性在95%以上的病毒蛋白多肽變體或衍生物。
本發(fā)明的再一方面,提供了一種分離的人白血病相關(guān)逆轉(zhuǎn)錄病毒基因組ENV基因編碼的病毒蛋白多肽,其具有SEQ ID NO.5所示的氨基酸序列或其片段,或為與其同源性在95%以上的病毒蛋白多肽變體或衍生物。
本發(fā)明的又一方面,提供了一種用于檢測樣本中是否存在人白血病相關(guān)逆轉(zhuǎn)錄病毒基因組編碼的病毒蛋白的方法,其特征在于利用了本發(fā)明所述的病毒蛋白多肽。
本發(fā)明的又一方面,提供了一種用于阻抑人白血病相關(guān)逆轉(zhuǎn)錄病毒方法,其特征在于利用了本發(fā)明所述的病毒蛋白多肽。
圖2顯示GAG基因編碼的癌性蛋白與貓肉瘤病毒的編碼的酪氨酸蛋白激酶的氨基酸序列同源性比較結(jié)果。
圖3顯示ENV基因編碼的癌性蛋白與腫瘤病毒癌基因v-src編碼的癌性蛋白氨基酸序列同源性比較結(jié)果發(fā)明詳述在本發(fā)明中,術(shù)語“該病毒基因組編碼的病毒蛋白質(zhì)和多肽的氨基酸序列”是指如SEQ ID NO.1、SEQ ID NO.3、或SEQ ID NO.5所述的GAG、POL、ENV基因編碼的病毒蛋白質(zhì)和多肽的氨基酸序列。該術(shù)語還包括與SEQ ID NO.1、SEQ ID NO.3、或SEQ ID NO.5所述的序列同源性在95%以上的所有具有生物學功能的蛋白質(zhì)和多肽變體或衍生物。
“分離的”指“通過人工”從天然狀態(tài)改變和/或從天然環(huán)境分離。這樣,如果存在于自然界的“分離的”組合物或物質(zhì)被“分離”,那么它已被改變或已被從其最初的環(huán)境移走,或兩者都有。例如,天然存在于活的動物內(nèi)的多核苷酸或多肽不是“分離”的,但從其天然狀態(tài)的共存物質(zhì)中分離的同一多核苷酸或多肽是“分離的”,正如此處所用的該術(shù)語。
此處所用的術(shù)語“變體”是指多核苷酸或多肽,其分別不同于參考的多核苷酸或多肽,但保留了基本的特性,如基本的生物特性、結(jié)構(gòu)特性、調(diào)節(jié)特性或生化特性。多核苷酸的一般變體之核苷酸序列不同于另一個,參考核苷酸。變體核苷酸序列的變化可改變或不改變多肽的氨基酸序列,其中所述的多肽由參考多核苷酸編碼。核苷酸的變化可導(dǎo)致參考序列所編碼的多肽中氨基酸的替換、添加、刪除、融合和截短,對此將在下面討論。多肽的一般變體之氨基酸序列不同于另一個,參考多肽。通常,差異是有限的,以使參考多肽之序列與變體總體上非常相似,并且在許多區(qū)域是相同的。變體和參考多肽氨基酸序列上的差異可以是一個或多個氨基酸以任一組合的替換、添加和刪除。替換或插入的氨基酸殘基可由遺傳密碼編碼,也可不由遺傳密碼編碼。多核苷酸或多肽的變體可以自然產(chǎn)生(如等位基因變體),或者它可以是非自然產(chǎn)生的變體。多核苷酸和多肽之非自然產(chǎn)生的變體可通過誘變技術(shù)或直接合成而產(chǎn)生。
“同源性”是對核苷酸序列或氨基酸序列之同源性的量度。通常將序列排列起來,以獲得最大限度的匹配?!巴葱浴北旧砭哂斜绢I(lǐng)域認知的意義并且可用公開的技術(shù)計算。見例如(計算分子生物學(COMPUTATIONAL MOLECULAR BIOLOGY),Lesk,A.M.,ed.,牛津大學出版社,紐約,1988;生物計算機學資訊學和基因組計劃(BIOCOMPUTINGINFORMATICS AND GENOME PROJECTS),Smith,D.W.,ed.,學術(shù)出版社,紐約,1993;序列數(shù)據(jù)的計算機分析,第一部分(COMPUTER ANALYSIS OF SEQUENCE DATA,PARTI),Griffin,A.M.,和Griffin,H.G.,eds.,Humana Press,新澤西,1994;分子生物學中的序列分析(SEQUENCE ANALYSIS IN MOLECULARBIOLOGY),von Heinje,G.,學術(shù)出版社,1987;以及序列分析導(dǎo)引(SEQUENCE ANALYSIS PRIMER),Gribskov,M.和Devereux,J.,eds.,M Stockton Press,紐約,1991)。雖然存在許多可用于測量兩個多核苷酸或多肽間同源性的方法,該術(shù)語“同源性”為技術(shù)人員周知(Carillo,H.,和Lipton,D.,工業(yè)與應(yīng)用數(shù)學會應(yīng)用數(shù)學雜志(SIAMJ.Applied Math.)(1988)481073)。測定兩個序列間的同源性或相似性的常用方法包括(但不限于)公開于超大計算機指南(Guide to HugeComputers),Martin J.Bishop,ed.,學術(shù)出版社,圣地亞哥,1994和Carillo,H.,和Lipton,D.,工業(yè)與應(yīng)用數(shù)學會應(yīng)用數(shù)學雜志(1988)481073中的方法。測定同源性或相似性的方法已按規(guī)則編在計算機程序中。優(yōu)選的、用于測定兩個序列間的同源性或相似性的計算機程序方法包括(但不限于)GCG程序包(Devereux,J.,等人,核酸研究(Nucleic AcidsResearch)(1984)12(1)387)、BLASTP、BLASTN、FASTA(Atschul,S.F.等人,分子生物學雜志(J.Molec.Biol.)(1990)215403)。
通過一種多核苷酸進行說明,其所具有的核苷酸序列例如與SEQ IDNO1的參考核苷酸序列至少具95%的“同源性”是指在SEQ ID NO1的參考核苷酸序列之每100個核苷酸中,該多核苷酸的核苷酸序列除了含有多達5個核苷酸的不同外,該多核苷酸之核苷酸序列與參考序列相同。換句話說,為了獲得核苷酸序列與參考核苷酸序列至少95%相同的多核苷酸,參考序列中多達5%的核苷酸可被刪除或被另一核苷酸替代;或可將一些核苷酸插入?yún)⒖夹蛄兄?,其中插入的核苷酸可多達參考序列之總核苷酸的5%;或在一些核苷酸中,存在刪除、插入和替換的組合,其中所述核苷酸多達參考序列之總核苷酸的5%。參考序列的這些突變可發(fā)生在參考核苷酸序列的5或3末端位置,或在這些末端位置之間的任意地方,它們或單獨散在于參考序列的核苷酸中,或以一個或多個鄰近的組存在于參考序列中。
類似地,一種多肽,其所具有的氨基酸序列例如與SEQ ID NO2的參考氨基酸序列至少具95%的“同源性”是指在SEQ ID NO2的參考氨基酸序列之每100個氨基酸中,該多肽之氨基酸序列除了含有多達5個氨基酸的變化外,該多肽之氨基酸序列與參考序列相同。換句話說,為了獲得氨基酸序列與參考氨基酸序列至少95%相同的多肽,參考序列中多達5%的氨基酸殘基可被刪除或被另一氨基酸替代;或可將一些氨基酸插入?yún)⒖夹蛄兄?,其中插入的氨基酸多達參考序列之總氨基酸殘基的5%。參考序列的這些突變可發(fā)生在參考氨基酸序列的氨基或羧基末端位置,或在這些末端位置之間的任意地方,它們或單獨散在于參考序列的殘基中,或以一個或多個鄰近的組存在于參考序列中。
本發(fā)明的一個方面,提供了一種分離的人白血病相關(guān)逆轉(zhuǎn)錄病毒基因組GAG基因編碼的病毒蛋白多肽,其特征在于,它具有SEQ ID NO.1所示的氨基酸序列或其片段,或為與其同源性在95%以上的具有相同或相似生物學功能的病毒蛋白多肽變體或衍生物。事實上,SEQ ID NO.1是由GAG基因(1570個核苷酸)編碼的由523個氨基酸組成的多聚蛋白,在氨基端含有一個逆轉(zhuǎn)錄病毒核殼體基質(zhì)蛋白(MA)保守功能域(Conserved Domain,CD),在羧基端含有一個逆轉(zhuǎn)錄病毒核殼體P30蛋白保守功能域(Conserved Domain,CD)。具體地,在本發(fā)明的一個實施方案中,提供了一種分離的人白血病相關(guān)逆轉(zhuǎn)錄病毒基因組GAG基因編碼的病毒蛋白多肽的片段,其特征在于與腫瘤病毒癌基因v-abl高度同源,具有與SEQ ID NO.4所示的氨基酸序列同源性在95%以上的具有相同或相似生物學功能的病毒蛋白多肽變體或衍生物。更具體地,在本發(fā)明的一個實施方案中,提供了一種分離的人白血病相關(guān)逆轉(zhuǎn)錄病毒基因組GAG基因編碼的病毒蛋白多肽的片段,其特征在于具有SEQ ID NO.2所示的氨基酸序列。事實上,由該病毒基因組中GAG基因編碼的癌性蛋白氨基酸序列與腫瘤病毒癌基因v-abl編碼的癌性蛋白的氨基酸序列的同源性高達36%(58/159),與貓肉瘤病毒的編碼的酪氨酸蛋白激酶的氨基酸序列同源性高達47%(33/70)。
本發(fā)明的又一方面,提供了一種分離的人白血病相關(guān)逆轉(zhuǎn)錄病毒基因組POL基因編碼的病毒蛋白多肽,其特征在于,它具有SEQ ID NO.3所示的氨基酸序列或其片段,或為與其同源性在95%以上的具有相同或相似生物學功能的病毒蛋白多肽變體或衍生物。事實上,SEQ ID NO.3是由POL基因(3550個核苷酸)編碼的由1183個氨基酸組成的多聚蛋白,從氨基端到羧基端依次含有逆轉(zhuǎn)錄病毒蛋白酶、逆轉(zhuǎn)錄酶、逆轉(zhuǎn)錄酶H和整合酶四個保守功能域(Conserved Domain,CD)。具體地,在本發(fā)明的一個實施方案中,提供了一種分離的人白血病相關(guān)逆轉(zhuǎn)錄病毒基因組POL基因編碼的病毒蛋白多肽的片段,其特征在于與腫瘤病毒癌基因v-src高度同源,具有與SEQ ID NO.4所示的氨基酸序列同源性在95%以上的具有相同或相似生物學功能的病毒蛋白多肽變體或衍生物.更具體地,在本發(fā)明的一個實施方案中,提供了一種分離的人白血病相關(guān)逆轉(zhuǎn)錄病毒基因組POL基因編碼的病毒蛋白多肽的片段,其特征在于具有SEQ ID NO.4所示的氨基酸序列。
本發(fā)明的另一方面,提供了一種分離的人白血病相關(guān)逆轉(zhuǎn)錄病毒基因組ENV基因編碼的病毒蛋白多肽,其特征在于,它具有SEQ ID NO.5所示的氨基酸序列或其片段,或為與其同源性在95%以上的具有相同或相似生物學功能的病毒蛋白多肽變體或衍生物。事實上,SEQ ID NO.5是由ENV基因(2047個核苷酸)編碼的由682個氨基酸組成的多聚蛋白,在氨基端含有一個逆轉(zhuǎn)錄病毒外殼蛋白的表面糖蛋白,在羧基端含有一個逆轉(zhuǎn)錄病毒外殼跨膜蛋白TM保守功能域(Conserved Domain,CD)。本發(fā)明中,由該病毒基因組中ENV基因編碼的癌性蛋白氨基酸序列與腫瘤病毒癌基因v-src編碼的癌性蛋白的氨基酸序列的同源性高達32%(49/154)。
在本發(fā)明的另一方面,還提供一種載體,它包含了該病毒基因組中ENV基因全長表達序列。
本發(fā)明的又一方面, 提供一種利用基因重組技術(shù)生產(chǎn)上述新的人白血病相關(guān)逆轉(zhuǎn)錄病毒基因組編碼的各種病毒蛋白和多肽及相應(yīng)核酸序列的方法。在本發(fā)明的一個實施方案中,提供一種利用基因重組技術(shù)生產(chǎn)該病毒基因組中GAG基因編碼的病毒蛋白方法,其步驟如下(1)將編碼該病毒基因組中GAG完整蛋白的核苷酸序列可操作地連接于表達調(diào)控序列,形成GAG蛋白表達載體;(2)將步驟(1)中表達載體轉(zhuǎn)入宿主細胞,形成該病毒基因組中GAG基因編碼的病毒蛋白的重組細胞;(3)在適合表達病毒GAG蛋白多肽的條件下,培養(yǎng)步驟(2)中的重組細胞;(4)分離出具有生物活性的病毒GAG蛋白。
在本發(fā)明的另一實施方案中,提供一種利用基因重組技術(shù)生產(chǎn)該病毒基因組中ENV基因編碼的病毒蛋白方法,其步驟如下(1)將編碼該病毒基因組中ENV完整蛋白的核苷酸序列可操作地連接于表達調(diào)控序列,形成ENV蛋白表達載體;(2)將步驟(1)中表達載體轉(zhuǎn)入宿主細胞,形成該病毒基因組中ENV基因編碼的病毒蛋白的重組細胞;(3)在適合表達病毒ENV蛋白多肽的條件下,培養(yǎng)步驟(2)中的重組細胞;(4)分離出具有生物活性的病毒ENV蛋白。
本發(fā)明還提供了對上述逆轉(zhuǎn)錄病毒GAG、POL、ENV基因編碼的病毒蛋白及由GAG和ENV基因編碼的癌性蛋白特異性結(jié)合的各種抗體,包括多克隆抗體和單克隆抗體。
在本發(fā)明中,可以使用一系列本領(lǐng)域已知的方法來制備針對上述逆轉(zhuǎn)錄病毒GAG、POL、ENV基因編碼的病毒蛋白及由GAG和ENV基因編碼的癌性蛋白的各種特異性抗體。例如,將提純的上述各種病毒基因產(chǎn)物或他們的抗原片段注入動物體內(nèi)(如兔、羊、馬、小鼠等)來產(chǎn)生多克隆抗體。同樣,也可以應(yīng)用雜交瘤技術(shù)制備針對上述各種病毒蛋白特異性單克隆抗體。本發(fā)明的抗體包括可以抑制上述各種病毒蛋白生物功能的抗體,也可以是不影響所述功能的抗體。每一種抗體都可以通過對上述病毒基因產(chǎn)物片段或功能域致免疫而產(chǎn)生,而上述病毒基因產(chǎn)物及其片段還可以用重組的方法生產(chǎn)或多肽合成儀生產(chǎn)。
本發(fā)明的各種特異性抗體可以用來鑒定表達上述病毒GAG、POL、ENV基因編碼的病毒蛋白及由GAG和ENV基因編碼的癌性蛋白的細胞,如人白血病細胞。如可以用本發(fā)明的各種特異性抗體結(jié)合免疫熒光試驗、免疫細胞化學、流式細胞術(shù)等技術(shù),檢測和分析表達相應(yīng)病毒蛋白或多肽的細胞。也可以用本發(fā)明的抗體結(jié)合免疫印跡技術(shù)(Western Blot)定量分析細胞表達病毒蛋白或多肽。
本發(fā)明又一方面,提供了一種用于檢測樣本中是否存在人白血病相關(guān)逆轉(zhuǎn)錄病毒基因組編碼的病毒蛋白的方法,其特征在于利用了本發(fā)明所述的病毒蛋白多肽。在本發(fā)明的一個實施方案中,利用本發(fā)明所述病毒蛋白多肽制備了相應(yīng)的單克隆抗體或多克隆抗體。進一步地,利用如上制備的單克隆或多克隆抗體用本領(lǐng)域周知的酶免疫試驗、免疫組織化學技術(shù)、免疫印跡如WESTERN BLOT等方法檢測生物學樣本中的與人白血病相關(guān)逆轉(zhuǎn)錄病毒基因組編碼的多種病毒蛋白。
本發(fā)明的再一方面,提供了一種用于阻抑人白血病相關(guān)逆轉(zhuǎn)錄病毒方法,其特征在于利用了本發(fā)明所述的病毒蛋白多肽。在本發(fā)明的一個實施方案中,利用本發(fā)明所述的病毒蛋白多肽制備相應(yīng)的單克隆抗體或多克隆抗體;以及利用所得單克隆抗體或多克隆抗體直接封閉該病毒基因組編碼的多種活性病毒蛋白多肽。
本發(fā)明進一步構(gòu)思了利用本發(fā)明所述的病毒蛋白多肽,從其中的功能域中尋找和設(shè)計相應(yīng)的藥物來阻斷或抑制所述病毒蛋白,進而抑制該病毒的活性。具體地,本發(fā)明提供的該病毒基因組編碼的病毒蛋白或多肽氨基酸序列SEQ ID NO.1、SEQ ID NO.2、SEQ ID NO.3、SEQ IDNO.4及SEQ ID NO.5,還可以用作設(shè)計抗病毒藥物靶分子或靶位點。可以根據(jù)這些序列設(shè)計相應(yīng)的多克隆抗體或單克隆抗體用于阻抑和封閉病毒蛋白或多肽。也可以利用這些序列中的一些有重要功能的功能域(Domain)尋找和設(shè)計相應(yīng)的化學藥物,來阻斷或抑制病毒。
下面結(jié)合具體實施例,進一步闡述本發(fā)明。應(yīng)理解,這些實施例僅用于說明本發(fā)明而不用于限制本發(fā)明的范圍。下列實施例中未注明具體條件的實驗方法,通常按照常規(guī)條件,例如Sambrook等人編著的《分子克隆實驗手冊》中所述的實驗條件,或按照試劑或試劑盒制造商提供的實驗條件。
將GAG基因編碼的癌性蛋白214氨基酸殘基用NCBI提供的BLAST工具對GenBank、EMBL等蛋白質(zhì)數(shù)據(jù)庫進行同源性檢索,結(jié)果發(fā)現(xiàn)在氨基酸水平上它與腫瘤病毒癌基因v-abl編碼的癌性蛋白的氨基酸序列的同源性高達36%(58/159,結(jié)果見附
圖1),與貓肉瘤病毒的編碼的酪氨酸蛋白激酶的氨基酸序列同源性高達47%(33/70,結(jié)果見附圖2)。
將編碼人白血病相關(guān)逆轉(zhuǎn)錄病毒基因GAG病毒蛋白多肽以GST融合蛋白形式在大腸桿菌中進行原核表達。
原核表達載體的構(gòu)建根據(jù)SEQ ID NO.1提供的序列,設(shè)計擴增編碼完整GAG病毒蛋白多肽的核酸序列的PCR引物,經(jīng)PCR擴增后將擴增的DNA片段克隆到pGEX-T載體。然后,用氯化鈣方法轉(zhuǎn)入合適的大腸桿菌中,篩選和鑒定含有能表達GAG病毒蛋白多肽的重組子。
表達GAG重組融合蛋白分離和純化取含有GAG病毒蛋白多肽的重組子的工程菌,放入含7ml LB培養(yǎng)液試管中,37℃振搖培養(yǎng)過夜。然后,按1∶100濃度比例將工程菌接種到新鮮的LB培養(yǎng)基中,37℃繼續(xù)振搖培養(yǎng)3小時,然后加入IPTG(終濃度1mmol/L),37℃繼續(xù)振搖培養(yǎng)3小時。取IPTG誘導(dǎo)后的工程菌液,離心,棄上清液,用PBS懸浮細菌沉淀,然后用超聲粉碎法破碎細菌。然后用柱離心法純化重組GAG病毒蛋白。
SEQUENCE LISTING<110>養(yǎng)生堂有限公司浙江大學醫(yī)學院附屬第二醫(yī)院<120>一種新的人白血病相關(guān)逆轉(zhuǎn)錄病毒基因組編碼的蛋白質(zhì)與多肽序列及其應(yīng)用<130>idc020022<160>5<170>PatentIn version 3.1<210>1<211>523<212>PRT<213>Homo sapiens<400>1Met Leu Lys Asn Phe Lys Lys Gly Phe Asn Gly Asp Tyr Gly Val Thr1 5 10 15Met Thr Pro Gly Lys Leu Arg Ile Leu Cys Glu Ile Asp Trp Pro Thr20 25 30Leu Glu Val Gly Trp Pro Ser Glu Gly Ser Leu Asp Arg Ser Leu Val35 40 45Ser Lys Val Trp His Lys Val Thr Gly Lys Ser Gly His Ser Asp Gln50 55 60Phe Pro Tyr Ile Asp Thr Trp Leu Leu Gln Leu Val Gln Asp Pro Pro65 70 75 80Gln Trp Leu Arg Gly Gln Ala Ala Ala Val Leu Val Ala Lys Gly Gln85 90 95Ile Ala Lys Glu Gly Ser Arg Ser Thr His Trp Gly Lys Ser Thr Pro100 105 110Glu Val Leu Phe Asp Pro Thr Ser Glu Asp Pro Leu Gln Glu Met Ala
115 120 125Pro Val Ile Pro Val Leu Pro Ser Pro Tyr Gln Ala Glu Arg Leu Pro130 135 140Thr Phe Glu Pro Thr Val Leu Val Pro Pro Gln Asp Lys His Ile Pro145 150 155 160Arg Pro Pro Arg Val Asp Lys Arg Gly Gly Glu Ala Ser Gly Glu Thr165 170 175Pro Pro Leu Ala Ala Cys Leu Arg Pro Lys Thr Gly Ile Gln Met Pro180 185 190Leu Arg Glu Gln Arg Tyr Thr Gly Ile Glu Glu Asp Gly His Met Val195 200 205Glu Lys Arg Val Phe Val Tyr Gln Pro Phe Thr Ser Ala Asn Leu Leu210 215 220Asn Trp Lys Asn Asn Thr Leu Ser Tyr Thr Glu Lys Pro Gln Ala Leu225 230 235 240Ile Asp Leu Leu Gln Thr Ile Ile Gln Thr His Asn Ser Thr Arg Ala245 250 255Asp Cys His Gln Leu Leu Met Phe Leu Phe Asn Thr Asp Glu Arg Gln260 265 270Arg Val Leu Gln Ala Ala Thr Lys Trp Val Gln Glu His Ala Pro Ala275 280 285Asp Tyr Gln Asn Pro Gln Glu Cys Val Arg Thr Gln Leu Pro Gly Thr290 295 300Asp Pro Gln Trp Asp Pro Asn Glu Arg Glu Asp Met Gln Arg Leu Asn305 310 315 320Arg Asp Arg Glu Ala Val Leu Glu Gly Leu Lys Arg Gly Ala Gln Lys325 330 335Ala Thr Asn Val Asn Lys Val Ser Glu Val Ile Arg Gly Lys Glu Glu340 345 350Ser Pro Ala Gln Phe Tyr Gln Arg Leu Cys Glu Gly Tyr Arg Met Tyr355 360 365Thr Pro Phe Asp Pro Val Ser Pro Glu Asn Gln Arg Met Val Asn Met370 375 380Ala Leu Val Ser Gln Ser Ala Glu Asp Ile Arg Arg Lys Leu Gln Lys385 390 395 400Gln Asp Gly Phe Ala Gly Thr Asn Thr Ser Gln Leu Leu Glu Val Ala405 410 415Asn Gln Val Phe Val Asn Arg Asp Ala Val Ser Pro Lys Glu Asn Arg420 425 430Arg Glu Asn Glu Arg Gln Ala Arg Arg Asn Ala Glu Leu Leu Ala Ala435 440 445Ala Val Gly Gly Val Ser Ser Lys Arg Gln Gly Lys Gly Gly Pro Gly450 455 460Lys Glu Thr Gln Pro Gly Cys Gln Ser Leu Gln Cys Asn Gln Cys Ala465 470 475 480Tyr Cys Lys Glu Ile Gly Tyr Trp Lys Asn Lys Cys Pro Gln Leu Lys485 490 495Gly Lys Gln Gly Asp Leu Glu Gln Glu Val Pro Asp Lys Glu Glu Gly500 505 510Ala Leu Leu Asn Leu Ala Glu Glu Leu Leu Asp515 520<210>2<211>214<212>PRT<213>Homo sapiens<400>2Met Leu Lys Asn Phe Lys Lys Gly Phe Asn Gly Asp Tyr Gly Val Thr1 5 10 15Met Thr Pro Gly Lys Leu Arg Ile Leu Cys Glu Ile Asp Trp Pro Thr20 25 30Leu Glu Val Gly Trp Pro Ser Glu Gly Ser Leu Asp Arg Ser Leu Val35 40 45Ser Lys Val Trp His Lys Val Thr Gly Lys Ser Gly His Ser Asp Gln50 55 60Phe Pro Tyr Ile Asp Thr Trp Leu Leu Gln Leu Val Gln Asp Pro Pro65 70 75 80Gln Trp Leu Arg Gly Gln Ala Ala Ala Val Leu Val Ala Lys Gly Gln85 90 95Ile Ala Lys Glu Gly Ser Arg Ser Thr His Trp Gly Lys Ser Thr Pro100 105 110Glu Val Leu Phe Asp Pro Thr Ser Glu Asp Pro Leu Gln Glu Met Ala115 120 125Pro Val Ile Pro Val Leu Pro Ser Pro Tyr Gln Ala Glu Arg Leu Pro130 135 140Thr Phe Glu Pro Thr Val Leu Val Pro Pro Gln Asp Lys His Ile Pro145 150 155 160Arg Pro Pro Arg Val Asp Lys Arg Gly Gly Glu Ala Ser Gly Glu Thr165 170 175Pro Pro Leu Ala Ala Cys Leu Arg Pro Lys Thr Gly Ile Gln Met Pro180 185 190Leu Arg Glu Gln Arg Tyr Thr Gly Ile Glu Glu Asp Gly His Met Val195 200 205Glu Lys Arg Val Phe Val210<210>3<211>1183<212>PRT<213>Homo sapiens<400>3Met Ala Arg Met Thr Val Gly Gly Lys Asp Ile Asp Phe Leu Val Asp1 5 10 15Thr Gly Ala Glu His Ser Val Val Thr Ala Pro Val Ala Pro Leu Ser20 25 30Lys Lys Thr Ile Asp Ile Ile Gly Ala Met Gly Val Ser Ala Lys Gln35 40 45Ala Phe Cys Leu Pro Arg Thr Cys Thr Val Gly Gly His Lys Val Ile50 55 60His Gln Phe Leu Tyr Met Pro Asp Cys Pro Leu Pro Leu Leu Gly Arg65 70 75 80Asp Leu Leu Ser Lys Leu Arg Ala Thr Ile Ser Phe Thr Glu His Gly85 90 95Ser Leu Leu Leu Lys Leu Pro Gly Thr Gly Val Ile Met Thr Leu Thr100 105 110Val Pro Arg Glu Glu Glu Trp Arg Leu Phe Leu Thr Glu Ser Gly Gln115 120 125Glu Ile Arg Pro Ala Leu Ala Lys Arg Trp Pro Arg Val Trp Ala Glu130 135 140Asp Asn Pro Pro Gly Leu Ala Val Asn Gln Ala Pro Val Leu Ile Glu145 150 155 160Val Lys Pro Gly Ala Gln Pro Val Arg Gln Lys Gln Tyr Pro Val Pro165 170 175Arg Glu Ala Leu Glu Gly Ile Gln Val Pro Leu Lys Cys Leu Arg Thr180 185 190Phe Gly Met Ile Val Pro Cys Gln Ser Pro Trp Asn Thr Pro Leu Leu195 200 205Pro Val Pro Glu Pro Lys Thr Lys Asp Tyr Trp Pro Gly Gln Asp Leu210 215 220Arg Leu Val Lys Gln Ala Thr Val Thr Leu His Pro Ala Val Pro Asn225 230 235 240Pro Tyr Thr Leu Leu Gly Leu Leu Pro Ala Glu Asp Ser Cys Phe Thr245 250 255Cys Leu Asp Leu Lys Asp Ala Phe Phe Ser Ile Arg Phe Ala Pro Glu260 265 270Ser Gln Lys Leu Phe Ala Phe Gln Trp Glu Asp Pro Glu Ser Gly Val275 280 285Thr Thr Gln Tyr Thr Trp Thr Trp Leu Pro G1n Gly Phe Lys Asn Ser290 295 300Pro Thr Ile Phe Gly Glu Glu Leu Ala Arg Asp Leu Gln Lys Cys Pro305 310 315 320Thr Arg Asp Leu Gly Cys Val Leu Leu Gln Tyr Val Asp Asp Leu Leu325 330 335Leu Gly His Pro Thr Ala Val Gly Cys Ala Lys Gly Thr Asp Ala Leu340 345 350Leu Arg His Leu Glu Asp Cys Gly Tyr Lys Val Ser Lys Lys Lys Ala355 360 365Gln Ile Cys Arg Pro Gln Val Arg Tyr Leu Gly Phe Thr Ile Arg Gln370 375 380Gly Glu Arg Ser Leu Gly Ser Glu Arg Lys Gln Val Ile Cys Thr Leu385 390 395 400Pro Glu Pro Lys Ser Arg Lys Gln Val Arg Lys Phe Leu Gly Ala Ala405 410 415Gly Phe Cys Arg Leu Trp Ile Pro Asn Phe Ala Val Leu Ala Lys Pro420 425 430Leu Tyr Glu Val Thr Lys Trp Gly Asp Arg Glu Pro Phe Glu Trp Gly435 440 445Ser Gln Gln Gln Gln Ala Phe Arg Glu Leu Lys Glu Lys Leu Met Ser450 455 460Ala Pro Ala Leu Gly Leu Pro Asn Leu Thr Lys Pro Phe Thr Leu Tyr465 470 475 480Val Ser Glu Arg Glu Lys Met Ala Val Arg Val Leu Thr Gln Thr Val
485 490 495Gly Pro Trp Pro Arg Pro Val Ala Tyr Leu Ser Lys Gln Leu Asp Gly500 505 510Val Ser Lys Gly Trp Pro Pro Cys Leu Arg Ala Leu Ala Ala Thr Ala515 520 525Leu Leu Val Gln Glu Ala Val Lys Leu Thr Leu Gly Gln Asn Leu Asn530 535 540Ile Lys Ala Pro His Ala Met Val Thr Leu Ile Asn Thr Lys Gly His545 550 555 560His Trp Leu Thr Asn Ala Arg Leu Thr Lys Tyr Gln Ser Leu Leu Cys565 570 575Glu Asn Pro Arg Ile Thr Ile Glu Ile Cys Asn Thr Leu Asn Pro Thr580 585 590Thr Leu Leu Leu Val Ser Glu Gly Pro Val Glu His Asp Cys Val Glu595 600 605Val Leu Asp Ser Val Tyr Ser Ser Arg Pro Asp Leu Gln Asp Gln Pro610 615 620Trp Ala Pro Val Asp Trp Glu Leu Tyr Met Asp Gly Gly Ser Phe Ile625 630 635 640Asn Pro Gln Gly Glu Arg Gly Ala Gly Tyr Ala Val Val Thr Leu Asp645 650 655Thr Val Val Glu Ala Arg Ser Leu Pro Gln Ala Thr Ser Ala Gln Lys660 665 670Ala Glu Leu Ile Ala Phe Ile Arg Ala Leu Glu Leu Ser Glu Gly Glu675 680 685Thr Val Asn Ile Tyr Thr Asp Ser Arg Tyr Pro Phe Leu Thr Leu Gln690 695 700Val His Glu Ala Ser Tyr Lys Glu Lys Gly Leu Leu Asn Ser Gly Gly705 710 715 720Lys Asp Ile Lys Tyr Gln Gln Glu Ile Leu Gln Leu Leu Glu Ala Val725 730 735Trp Lys Pro His Lys Val Ala Val Met His Cys Arg Gly His Gln Arg740 745 750Ala Ser Thr Leu Val Gly Leu Gly Asn Ser Arg Ala Asp Ala Arg Lys755 760 765Ala Ala Ser Ala Pro Phe Arg Ala Ser Val Thr Ala Pro Leu Leu Pro770 775 780Gln Ala Pro Asp Leu Leu Pro Thr Tyr Ser Lys Glu Glu Lys Asp Phe785 790 795 800Leu Gln Ala Glu Gly Gly Gln Val Met Glu Glu Gly Trp Ile Arg Leu805 810 815Pro Asp Gly Arg Glu Ala Val Pro Gln Leu Leu Gly Ala Ala Val Val820 825 830Leu Ala Val His Lys Thr Thr His Leu Gly Gln Glu Ser Leu Glu Lys835 840 845Leu Leu Val Arg Tyr Phe Tyr Ile Leu His Leu Ser Ala Leu Ala Lys850 855 860Thr Val Thr Gln Arg Cys Val Thr Cys Pro Lys His Asn Ala Lys Gln865 870 875 880Gly Pro Ala Val Pro Pro Val Ile Gln Ala Tyr Gly Ala Ala Pro Phe885 890 895Glu Asp Val Gln Val Asp Phe Thr Glu Met Pro Lys Cys Gly Gly Asn900 905 910Lys Tyr Leu Leu Val Leu Val Cys Thr Tyr Ser Gly Gly Trp Arg Leu915 920 925Ile Gln His Lys Leu Arg Lys Leu Val Lys Leu Thr Cys Val Leu Leu930 935 940Arg Asp Pro Ile Pro Arg Phe Gly Leu Pro Leu Arg Ile Gly Ser Asp945 950 955 960Asn Gly Pro Ala Phe Val Ala Asp Leu Val Gln Lys Arg Ala Lys Val965 970 975Leu Gly Asn Thr Trp Lys Leu His Ala Ala Tyr Arg Pro Gln Ser Ser980 985 990Gly Lys Val Glu Gln Met Asn Trp Thr Ile Lys Asn Ser Lys Gly Lys995 10001005Val Cys Gln Glu Thr Gly Leu Lys Trp Ile Gln Ala Leu Pro Met1010 1015 1020Val Leu Phe Lys Ile Arg Cys Thr Pro Ser Lys Arg Thr Gly Tyr1025 1030 1035Ser Pro Tyr Glu Ile Leu Tyr His Arg Pro Pro Pro Ile Leu Arg1040 1045 1050Gly Leu Pro Gly Thr Pro Arg Glu Leu Gly Glu Ile Glu Leu Gln1055 1060 1065Arg Gln Leu Gln Ala Leu Gly Lys Ile Thr Gln Thr Ile Ser Ala1070 1075 1080Trp Val Asn Glu Arg Cys Pro Val Ser Leu Phe Ser Pro Val His1085 1090 1095Pro Phe Ser Pro Gly Asn Arg Val Trp Ile Lys Asp Trp Asn Val1100 1105 1110Ala Ser Leu Cys Pro Arg Trp Lys Gly Pro Gln Thr Val Ile Leu1115 1120 1125Thr Thr Pro Thr Ala Val Lys Val Glu Gly Val Pro Ala Trp Ile1130 1135 1140His His Ser Arg Val Lys Pro Ala Val Pro Glu Thr Ser Glu Val1145 1150 1155Arg Pro Ser Pro Glu Asp Pro Cys Arg Val Thr Leu Lys Lys Thr1160 1165 1170Thr Ser Pro Ala Pro Val Thr Pro Gly Ser1175 1180<210>4<211>179<212>PRT<213>Homo sapiens<400>4Met Leu Asn Gln Ile Ile Arg Leu Gln Thr Val Leu Glu Ile Ile Thr1 5 10 15Asn Glu Thr Gly Arg Ala Leu Thr Val Leu Ala Arg Gln Glu Thr Gln20 25 30Met Arg Asn Ala Ile Tyr Gln Asn Arg Leu Ala Leu Asp Tyr Leu Leu35 40 45Ala Ala Glu Gly Gly Val Cys Gly Lys Phe Asn Leu Thr Asn Cys Cys50 55 60Leu Gln Ile Asp Asp Gln Gly Gln Val Ile Glu Asn Ile Val Arg Asp65 70 75 80Met Thr Lys Leu Ala His Thr Pro Ile Gln Val Trp His Lys Phe Asp85 90 95Pro Glu Ser Leu Phe Gly Lys Trp Phe Pro Ala Ile Gly Gly Phe Lys100 105 110Thr Leu Ile Val Gly Val Leu Leu Val Ile Arg Thr Cys Leu Leu Leu115 120 125Pro Cys Val Leu Pro Leu Leu Phe Gln Met Ile Lys Gly Ile Val Ala130 135 140Thr Leu Val His Gln Lys Thr Ser Ala His Val Asn Tyr Met Asn His145 150 155 160Tyr Arg Ser Ile Ser Gln Arg Asp Ser Lys Ser Glu Asp Glu Ser Glu165 170 175Asn Ser His<210>5<211>682<212>PRT<213>Homo sapiens<400>5Met Arg Lys Leu Ile Val Gly Phe Ile Phe Leu Thr Phe Trp Thr Tyr1 5 10 15Thr Val Arg Ala Ser Thr Asp Leu Thr Gln Thr Gly Asp Cys Ser Gln20 25 30Ser Ile His Gln Val Thr Glu Val Gly Gln Gln Ile Lys Thr Asn Phe35 40 45Leu Phe Tyr Ser Tyr Tyr Glu Cys Met Gly Thr Leu Lys Glu Thr Cys50 55 60Leu Tyr Asn Ala Thr Gln Tyr Lys Val Cys Ser Pro Gly Asn Asp Arg65 70 75 80Pro Asp Val Cys Tyr Asn Pro Ser Glu Pro Pro Ala Thr Thr Val Phe85 90 95Glu Ile Arg Leu Arg Thr Gly Leu Phe Leu Gly Asp Thr Ser Lys Ile100 105 110Ile Thr Arg Thr Val Glu Lys Gly Ile Pro Lys Gln Ile Thr Leu Arg115 120 125Phe Asp Ala Arg Ala Ala Ile Asn Ser Asn Lys Leu Gly Thr Arg Cys130 135 140Gly Ser Leu Asn Trp Glu Arg Ser Tyr Thr Val Gln Asn Lys Tyr Val145 150 155 160Cys His Glu Ser Gly Val Cys Glu Asn Cys Ala Phe Trp Pro Cys Val165 170 175Ile Trp Ala Thr Trp Lys Lys Asn Lys Lys Asp Pro Val His Leu Gln180 185 190Lys Gly Glu Ala Asn Pro Ser Cys Ala Ala Gly His Cys Asn Pro Leu195 200 205Glu Leu Ile Ile Thr Asn Pro Leu Asp Pro Pro Trp Lys Lys Gly Glu
210 215 220Arg Val Thr Leu Gly Ile Asp Gly Thr Gly Leu Asn Pro Gln Val Ala225 230 235 240Ile Leu Val Arg Gly Glu Val His Lys Arg Ser Pro Lys Pro Val Phe245 250 255Gln Thr Phe Tyr Glu Glu Leu Asn Leu Pro Ala Pro Glu Leu Pro Lys260 265 270Lys Thr Lys Ser Leu Phe Leu Gln Leu Ala Gly Asn Val Ala His Ser275 280 285Leu Asn Val Thr Ser Cys Tyr Val Cys Arg Gly Thr Thr Ile Gly Asp290 295 300Arg Trp Pro Trp Glu Ala Arg Glu Leu Val Pro Thr Asp Pro Ala Pro305 310 315 320Asp Ile Ile Pro Val Gln Lys Ala Gln Ala Ser Asn Phe Trp Val Leu325 330 335Lys Thr Ser Ile Ile Gly Gln Tyr Cys Ile Ala Arg Glu Gly Lys Glu340 345 350Phe Ile Val Pro Val Gly Lys Leu Asn Cys Ile Gly Gln Lys Leu Tyr355 360 365Asn Ser Thr Thr Lys Thr Ile Thr Trp Trp Gly Leu Asn His Thr Glu370 375 380Lys Asn Pro Phe Ser Lys Phe Ser Lys Leu Lys Thr Ala Trp Ala His385 390 395 400Pro Glu Ser His Gln Asp Trp Thr Ala Pro Thr Gly Leu Tyr Arg Ile405 410 415Cys Gly His Thr Ala Tyr Ile Gln Leu Pro Asn Lys Trp Ala Gly Ser420 425 430Cys Val Ile Gly Thr Ile Lys Leu Ser Phe Phe Leu Leu Pro Ile Lys435 440 445Thr Gly Glu Leu Leu Gly Phe Arg Val Tyr Thr Ser Arg Glu Lys Arg450 455 460Gly Ile Val Ile Gly Asn Trp Lys Asp Asn Glu Trp Pro Pro Glu Arg465 470 475 480Ile Ile Gln Tyr Tyr Gly Pro Ala Thr Trp Val Gln Asp Gly Ser Trp485 490 495Gly Tyr Gln Thr Pro Ile Tyr Met Leu Asn Gln Ile Ile Arg Leu Gln500 505 510Thr Val Leu Glu Ile Ile Thr Asn Glu Thr Gly Arg Ala Leu Thr Val515 520 525Leu Ala Arg Gln Glu Thr Gln Met Arg Asn Ala Ile Tyr Gln Asn Arg530 535 540Leu Ala Leu Asp Tyr Leu Leu Ala Ala Glu Gly Gly Val Cys Gly Lys545 550 555 560Phe Asn Leu Thr Asn Cys Cys Leu Gln Ile Asp Asp Gln Gly Gln Val565 570 575Ile Glu Asn Ile Val Arg Asp Met Thr Lys Leu Ala His Thr Pro Ile580 585 590Gln Val Trp His Lys Phe Asp Pro Glu Ser Leu Phe Gly Lys Trp Phe595 600 605Pro Ala Ile Gly Gly Phe Lys Thr Leu Ile Val Gly Val Leu Leu Val610 615 620Ile Arg Thr Cys Leu Leu Leu Pro Cys Val Leu Pro Leu Leu Phe Gln625 630 635 640Met Ile Lys Gly Ile Val Ala Thr Leu Val His Gln Lys Thr Ser Ala645 650 655His Val Asn Tyr Met Asn His Tyr Arg Ser Ile Ser Gln Arg Asp Ser660 665 670Lys Ser Glu Asp Glu Ser Glu Asn Ser His675 680
權(quán)利要求
1.一種分離的人白血病相關(guān)逆轉(zhuǎn)錄病毒基因組GAG基因編碼的病毒蛋白多肽,其特征在于,它具有SEQ ID NO.1所示的氨基酸序列或其片段,或為與其同源性在95%以上的具有相同或相似生物學功能的病毒蛋白多肽變體或衍生物。
2.如權(quán)利要求1所述病毒蛋白多肽,其特征在于與腫瘤病毒癌基因v-abl高度同源,具有SEQ ID NO.2所示的氨基酸序列或為與其同源性在95%以上的具有相同或相似生物學功能的病毒蛋白多肽變體或衍生物。
3.一種分離的人白血病相關(guān)逆轉(zhuǎn)錄病毒基因組POL基因編碼的病毒蛋白多肽,其特征在于,它具有SEQ ID NO.3所示的氨基酸序列或其片段,或為與其同源性在95%以上的具有相同或相似生物學功能的病毒蛋白多肽變體或衍生物。
4.如權(quán)利要求3所述的病毒蛋白多肽,其特征在于與腫瘤病毒癌基因v-src高度同源,具有SEQ ID NO.4所示的氨基酸序列或為與其同源性在95%以上的具有相同或相似生物學功能的病毒蛋白多肽變體或衍生物。
5.一種分離的人白血病相關(guān)逆轉(zhuǎn)錄病毒基因組ENV基因編碼的病毒蛋白多肽,其特征在于,它具有SEQ ID NO.5所示的氨基酸序列或其片段,或為與其同源性在95%以上的具有相同或相似生物學功能的病毒蛋白多肽變體或衍生物。
6.一種用于檢測樣本中是否存在人白血病相關(guān)逆轉(zhuǎn)錄病毒基因組編碼的病毒蛋白的方法,其特征在于利用了權(quán)利要求1-5中任一項所述病毒蛋白多肽。
7.權(quán)利要求6所述的方法,其中包括利用權(quán)利要求1-5中任一項所述病毒蛋白多肽制備相應(yīng)的單克隆抗體或多克隆抗體。
8.一種用于阻抑人白血病相關(guān)逆轉(zhuǎn)錄病毒方法,其特征在于利用了權(quán)利要求1-5中任一項所述病毒蛋白多肽。
9.權(quán)利要求8所述的方法,其中包括利用權(quán)利要求1-5中任一項所述病毒蛋白多肽制備相應(yīng)的單克隆抗體或多克隆抗體;以及利用所得單克隆抗體或多克隆抗體直接封閉該病毒基因組編碼的多種活性病毒蛋白多肽。
10.權(quán)利要求8所述的方法,其中包括利用了權(quán)利要求1-5中任一項所述病毒蛋白多肽,中的功能域?qū)ふ液驮O(shè)計相應(yīng)的藥物來阻斷或抑制病毒。
全文摘要
本發(fā)明涉及與人白血病病因、發(fā)病機理及治療有關(guān)的逆轉(zhuǎn)錄病毒基因組編碼的新蛋白質(zhì),其具有SEQ ID NO.1、3或5所示的氨基酸序列或其片段,或為與其同源性在95%以上的具有相同或相似生物學功能的病毒蛋白多肽變體或衍生物。本發(fā)明還涉及該病毒基因組編碼的病毒蛋白質(zhì)和多肽序列的制備方法。本發(fā)明還涉及一種用于檢測樣本中是否存在人白血病相關(guān)逆轉(zhuǎn)錄病毒基因組編碼的病毒蛋白的方法和一種用于阻抑人白血病相關(guān)逆轉(zhuǎn)錄病毒方法。
文檔編號A61P35/02GK1461752SQ02121790
公開日2003年12月17日 申請日期2002年5月31日 優(yōu)先權(quán)日2002年5月31日
發(fā)明者徐榮臻, 鄭樹, 鐘睒睒 申請人:浙江養(yǎng)生堂天然藥物研究所有限公司, 浙江大學醫(yī)學院附屬第二醫(yī)院