專利名稱:一株hiv病毒的全基因組的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一株HIV病毒(艾滋病毒)的全基因組,該全基因組命名為05CNHB-hp3,含有該全長基因組的質(zhì)粒保存于大腸桿菌Top10中,該大腸桿菌命名為Top10/05CNHB-hp3(Escherichia coli Top10/05CNHB-hp3),由中國典型培養(yǎng)物保藏中心保藏,保藏日期是2006年6月20日,保藏號為CCTCC NOM206056。
背景技術(shù):
目前,國內(nèi)外研究者曾測定多株HIV的病毒全基因組序列,范圍涉及HIV病毒的多個亞型。艾滋病的疫苗具有一定的亞型特異性,不同亞型的毒株之間難以產(chǎn)生有效的免疫保護(hù),因此中國的艾滋病疫苗設(shè)計必須基于中國流行株的基因序列。據(jù)查,流行于中國的B’亞型的HIV病毒全基因組序列最初見于1998年廣西的一株毒株RL42(序列號U71182),其后是4株來自我國河南地區(qū)采供血感染人群的毒株序列(序列號DQ007902,DQ007903,DQ007901,AY180905)。以上流行于我國的5株B’亞型病毒株基因組序列均未作專利申請。
另外,各亞型病毒的酶和配體組份對于艾滋病治療藥物的敏感性以及耐藥變異特性也不盡相同,為了今后有效控制中國可能出現(xiàn)的耐藥毒株,可能需要針對國內(nèi)流行毒株進(jìn)行特征性的治療藥物設(shè)計。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問題是基于以上兩方面應(yīng)用的設(shè)想,提供一株HIV病毒的全基因組,以便希望以此序列和此序列表達(dá)的蛋白為目標(biāo)開展疫苗和治療藥物研究,從而對我國艾滋病毒防控產(chǎn)生積極影響。
本發(fā)明解決其技術(shù)問題采用以下的技術(shù)方案本發(fā)明提供的一株HIV病毒的全基因組,它具有SEQ ID NO.5所示的核苷酸全序列。
SEQ ID NO.5所示的核苷酸全序列與上述公布的U71182、DQ007902、DQ007903、DQ007901和AY180905序列相比,其同源性為91~96%。
本發(fā)明提供的SEQ ID NO.5所示的核苷酸全序列,其第786至2291核苷酸序列編碼病毒的核蛋白(gag)融合蛋白,其在成熟HIV顆粒組裝中被裂解為P24、P17、P9、P6等蛋白,依據(jù)該序列所得到的各蛋白被應(yīng)用于和作為疫苗開發(fā)材料的應(yīng)用。
本發(fā)明提供的SEQ ID NO.5所示的核苷酸全序列,其第2084至5095核苷酸序列編碼病毒多聚酶(pol)融合蛋白,在成熟病毒顆粒組裝中被切割為蛋白酶、逆轉(zhuǎn)錄酶和整合酶,依據(jù)該序列所得到的各蛋白被用于HIV的疫苗設(shè)計和作為重要的疫苗開發(fā)材料,以及重要的藥物靶點(diǎn)的應(yīng)用。
本發(fā)明提供的SEQ ID NO.5所示的核苷酸全序列,其第6232至8811核苷酸序列編碼病毒的膜蛋白(env)融合蛋白,在病毒成熟和包裝過程中被切割為GP120糖蛋白和GP41糖蛋白,依據(jù)該序列所得的蛋白被用于HIV的疫苗設(shè)計和應(yīng)用,以及作為重要的疫苗開發(fā)材料的應(yīng)用。
本發(fā)明提供的SEQ ID NO.5所示的核苷酸全序列,其第5040至5618核苷酸序列編碼病毒的Vif蛋白,第5558至5848核苷酸序列編碼病毒的Vpr蛋白,第5829至6043以及第8395至8485核苷酸序列編碼病毒的Tat蛋白,第5968至6043以及第8395至8669核苷酸序列編碼病毒的Rev蛋白,第8813至9427核苷酸序列編碼病毒的Nef蛋白,依據(jù)以上序列所得蛋白被用于HIV的疫苗設(shè)計和應(yīng)用,以及作為重要的疫苗開發(fā)材料和藥物靶點(diǎn)的應(yīng)用。
本發(fā)明提供的SEQ ID NO.5所示的核苷酸全序列,其第1至632以及第9096至9641核苷酸序列編碼病毒的LTR(長末端重復(fù)序列)序列,該序列在病毒復(fù)制中與病毒增殖能力密切相關(guān),該LTR核苷酸序列被應(yīng)用于艾滋病藥物的研究與應(yīng)用,以及作為艾滋病藥物的重要靶點(diǎn)的應(yīng)用。
本發(fā)明涉及毒株基因組序列與以上公布的U71182、DQ007902、DQ007903、DQ007901和AY180905等5株序列同源性在91%-96%范圍,本序列與其它B’亞型病毒基因組序列的差異部分為本專利的特征,該差異所產(chǎn)生的核酸以及氨基酸水平的功能變化將直接或間接的影響后續(xù)的藥物和疫苗設(shè)計,依據(jù)本序列所開發(fā)的疫苗和治療藥物將可能對我國的艾滋病防控產(chǎn)生積極影響。
圖1是本發(fā)明的技術(shù)流程圖。
圖2為p05CNHB_hp3 cut in MluI and NotI(質(zhì)粒p05CNHB_hp3被MluI和NotI內(nèi)切酶切割)照片。用限制性內(nèi)切酶MluI和NotI酶切質(zhì)粒WHiov06。泳道1酶切質(zhì)粒WHiov06后有9.8kb片段切出;泳道2DNA分子量標(biāo)記。
圖3為9kb-PCR product(9kb長度的PCR產(chǎn)物)照片。以引物1和引物2、擴(kuò)增經(jīng)分離的病毒株05CNHBhp感染健康人外周血單核淋巴細(xì)胞(PBMC)提取的細(xì)胞DNA產(chǎn)生的片段。泳道1long PCR擴(kuò)增DNA 3′產(chǎn)生的目的片段,9040bp;泳道2DNA分子量標(biāo)記。
圖4為1.8kb-PCR product(1.8kb長度的PCR產(chǎn)物)照片。以引物3和引物4泳道擴(kuò)增經(jīng)分離的病毒株05CNHBhp感染健康人外周血單核淋巴細(xì)胞(PBMC)提取的細(xì)胞DNA產(chǎn)生的片段。泳道1擴(kuò)增病毒DNA 5′產(chǎn)生的目的片段,1831bp;泳道2DNA分子量標(biāo)記。
具體實(shí)施例方式
本發(fā)明通過提取病毒培養(yǎng)細(xì)胞的DNA,用HIV病毒特征性的引物進(jìn)行PCR擴(kuò)增該毒株的全基因組序列,經(jīng)回收PCR產(chǎn)物所得DNA序列經(jīng)全序列測定和分析,最終得到所需的該基因組全序列。
本發(fā)明收集的樣本來源于通過母嬰傳播感染的兒童,其母因有償采供血途徑被HIV感染。通過將健康人外周血單核淋巴細(xì)胞(PBMC)與分離的HIV病毒進(jìn)行共培養(yǎng)的方式擴(kuò)增病毒基因組拷貝數(shù),提取培養(yǎng)細(xì)胞的DNA采用PCR技術(shù)擴(kuò)增目標(biāo)病毒的全基因組,最后通過序列測定方法獲得該毒株的全基因組序列。
下面結(jié)合實(shí)例及附圖對本發(fā)明作進(jìn)一步說明。
一.一株HIV病毒的全基因組及其應(yīng)用它具有SEQ ID NO.5所示的核苷酸全序列。該序列與上述公布的U71182、DQ007902、DQ007903、DQ007901和AY180905序列相比,其同源性為91~96%。
本發(fā)明提供的SEQ ID NO.5所示的核苷酸全序列,其第786至2291核苷酸序列編碼病毒的核蛋白(gag)融合蛋白,在成熟HIV顆粒組裝中被裂解為P24、P17、P9、P6等蛋白,依據(jù)該序列所得到的各蛋白被應(yīng)用于和作為疫苗開發(fā)材料的應(yīng)用。
本發(fā)明提供的SEQ ID NO.5所示的核苷酸全序列,其第2084至5095核苷酸序列編碼病毒多聚酶(pol)融合蛋白,在成熟病毒顆粒組裝中被切割為蛋白酶、逆轉(zhuǎn)錄酶和整合酶,依據(jù)該序列所得到的各蛋白被用于HIV的疫苗設(shè)計和作為重要的疫苗開發(fā)材料,以及重要的藥物靶點(diǎn)的應(yīng)用。
本發(fā)明提供的SEQ ID NO.5所示的核苷酸全序列,其第6232至8811核苷酸序列編碼病毒的/的病毒膜蛋白(env)融合蛋白,在病毒成熟和包裝過程中被切割為GP120糖蛋白和GP41糖蛋白,依據(jù)該序列所得的蛋白被用于HIV的疫苗設(shè)計和應(yīng)用,以及作為重要的疫苗開發(fā)材料的應(yīng)用。
本發(fā)明提供的SEQ ID NO.5所示的核苷酸全序列,其第5040至5618核苷酸序列編碼病毒的Vif蛋白,第5558至5848核苷酸序列編碼病毒的Vpr蛋白,第5829至6043以及第8395至8485核苷酸序列編碼病毒的Tat蛋白,第5968至6043以及第8395至8669核苷酸序列編碼病毒的Rev蛋白,第8813至9427核苷酸序列編碼病毒的Nef蛋白,依據(jù)以上序列所得蛋白被用于HIV的疫苗設(shè)計和應(yīng)用,以及作為重要的疫苗開發(fā)材料和藥物靶點(diǎn)的應(yīng)用。
本發(fā)明提供的SEQ ID NO.5所示的核苷酸全序列,其序列的第1至632以及第9096至9641核苷酸序列編碼病毒的LTR(長末端重復(fù)序列)序列,該序列在病毒復(fù)制中與病毒增殖能力密切相關(guān),該LTR核苷酸序列被應(yīng)用于艾滋病藥物的研究與應(yīng)用,以及作為艾滋病藥物的重要靶點(diǎn)的應(yīng)用。
下面敘述本發(fā)明的實(shí)驗(yàn)方法。
二.實(shí)驗(yàn)材料1.HIV-1感染者血液通過湖北省武漢市疾病預(yù)防控制中心采集。
2.HIV-1(-)健康人血液由湖北省武漢市中心血站提供。
3.菌株和質(zhì)粒大腸桿菌TG-1為中國科學(xué)院武漢病毒研究所保存菌株,來源于美國ATCC 43525。
載體試劑盒TOPOXLPCR Cloning Kit購自美國Invitrogen公司。
4.引物、酶與試劑PCR引物由上海生工生物工程技術(shù)服務(wù)有限公司合成。
限制性內(nèi)切酶、LATaq DNA聚合酶、T4DNA連接酶等購自寶生物公司。
DNA凝膠回收試劑盒購自德國Qiagen公司。
質(zhì)粒提取試劑盒購自美國Omega公司。
淋巴細(xì)胞分離液購自中國醫(yī)學(xué)科學(xué)院生物工程研究所。
植物血球凝集素(PHA)、白細(xì)胞介素(IL-2)購自長春生物制品研究所。
三.操作程序本發(fā)明的實(shí)驗(yàn)操作過程如圖1所示。
1.分離血液PBMCs1)抗凝全血倒入尖底離心管中,常溫下2,000rpm/min離心30min。
2)取中間白細(xì)胞富集層,置入離心管中,并加入其4倍體積含1%牛血清的PBS。
3)另取一尖底離心管,預(yù)先在其中加入淋巴細(xì)胞分離液,其上緩緩加入細(xì)胞-PBS混合液,常溫下2,000rpm/min,離心30min。
4)取兩液體中間界面的淋巴細(xì)胞層轉(zhuǎn)移至另一離心管中,加入含1%牛血清的PBS重懸,常溫下2,000轉(zhuǎn)/分鐘離心10min。
5)棄上清,加入含1%牛血清的PBS重懸,2,000rpm/min離心10min。
6)棄上清,用含有10%牛血清1640培養(yǎng)液重懸細(xì)胞,37℃5%CO2培養(yǎng)。
2.共培養(yǎng)感染者PBMCs和健康人PBMCs,分離擴(kuò)增HIV-1病毒。
將感染者PBMCs與用PHA刺激生長3天的健康人PBMCs混合,用含有20U/ml的IL-2、10%胎牛血清的1640培養(yǎng)液,37℃5%CO2培養(yǎng)。
3.PBMCs DNA提取用Qiagen公司生產(chǎn)的細(xì)胞基因組DNA提取試劑盒提取細(xì)胞基因組DNA。
4.PCR擴(kuò)增病毒基因組利用引物1和引物2,大連寶生物公司生產(chǎn)的LA Taq DNA聚合酶擴(kuò)增基因組DNA 3′端9kb片段(從5′端LTR末端與PBS位點(diǎn)(Lys tRNA primer binding site)連接區(qū)起始至3′端LTR近U5區(qū)的R區(qū)末端)。在無菌PCR管中加入4ul 10×LA Taq PCR緩沖液,2ul 10mM4dNTPs,20uM上游及下游引物各1ul,模板DNA,2U LATaq聚合酶,加水至40ul總體積。反應(yīng)條件為94℃ 5min,94℃ 10s,62℃ 30s,68℃ 10min,10個循環(huán);94℃ 10s,55℃ 30s,68℃ 10min,20個循環(huán);72℃ 10min;4℃ ∞;
利用引物3和引物4擴(kuò)增病毒基因組5′端1.8kb序列。在無菌PCR管中加入4ul 10×Ex Taq PCR緩沖液,0.8ul 10mM 4dNTPs,20uM上游及下游引物各1ul,模板DNA,2U LATaq聚合酶,加水至40ul總體積。PCR擴(kuò)增條件為94℃ 5min,94℃ 30s,49℃ 30s,72℃ 2min10s,35個循環(huán);72℃ 10min;4℃ ∞。
5.TAE-瓊脂糖凝膠電泳和回收PCR產(chǎn)物。
分別用0.7%、1%瓊脂糖凝膠(含10ng/ml EB)電泳分離PCR產(chǎn)物,電泳結(jié)束,將凝膠置于紫外分析儀內(nèi),切取含PCR產(chǎn)物的膠塊,用DNA凝膠回收試劑盒回收,PCR產(chǎn)物最后溶于30ul的Elution Buffer中。
6.DNA連接、轉(zhuǎn)化大腸桿菌在無菌Eppendorf管中加入4ul PCR產(chǎn)物,1ul pCR-XL-TOPOvector,混勻,室溫連接5min,加入1ul 6×TOPOCloning Stop solution終止連接反應(yīng);將2ul連接產(chǎn)物加入到TOPOXLPCR Cloning Kit的TOP10感受態(tài)細(xì)菌,混勻,2,500V電擊轉(zhuǎn)化,加入450ul SOC培養(yǎng)液,37℃劇烈振蕩培養(yǎng)1h,將混合液涂布在硫酸卡那霉素抗性的LB培養(yǎng)基上,37℃培養(yǎng)過夜。
7.DNA序列測定將篩選出的陽性克隆菌送Invitrogen上海英俊測序服務(wù)公司,采用ABI3730型測序儀測定DNA序列。
8.質(zhì)粒DNA制備通過菌落PCR鑒定,從培養(yǎng)基平板上挑取含目的片段的單菌落,接種于5ml含硫酸卡那霉素抗性的LB液體培養(yǎng)基中,振蕩培養(yǎng)過夜(37℃,200rpm/min)。在1.5ml無菌Eppendorf管中,倒入1.5ml菌液,按照Omega公司質(zhì)粒提取試劑盒說明書提取質(zhì)粒DNA,保存于-20℃?zhèn)溆谩?br>
9.限制性內(nèi)切酶酶切質(zhì)粒DNA。
將9KB和1.8KB片斷克隆質(zhì)粒用PvuI和BspT104I做雙酶切,酶切反應(yīng)參照限制性內(nèi)切酶說明書操作,反應(yīng)結(jié)束后,通過瓊脂糖凝膠電泳分離酶切產(chǎn)物,回收操作與PCR產(chǎn)物回收相同。
10.兩質(zhì)粒酶切片段重組連接3′端9KB片段克隆質(zhì)粒中酶切下來的11.2kb片段和5′端1.8KB短片段克隆質(zhì)粒中酶切下來的2kb片段按照摩爾比1∶10比例,用T4DNA連接酶于16℃連接過夜。
11.制備TG-1大腸桿菌感受態(tài)細(xì)胞在LB平板上劃線接種大腸桿菌TG-1,37℃培養(yǎng)過夜,挑取單克隆接種于5ml的LB培養(yǎng)基中振蕩培養(yǎng)過夜;接種前述初始培養(yǎng)物1ml于200ml LB培養(yǎng)基,振蕩培養(yǎng)至OD600=0.6。菌液分裝于50ml離心管,冰浴10min,4℃、3,000rpm/min離心10min,收集細(xì)胞;用30ml預(yù)冷的0.1M CaCl2溶液輕輕重懸細(xì)胞,混勻,冰浴10min,4℃、3,000rpm/min離心10min,收集細(xì)胞;每管加入含20%甘油的0.1M CaCl2溶液,混勻,分裝凍存于-80℃。
12.兩質(zhì)粒酶切片段重組連接產(chǎn)物轉(zhuǎn)化大腸桿菌。
將步驟10中連接產(chǎn)物20ul加入到100ul的感受態(tài)細(xì)胞中,混勻,置冰浴30min;42℃水浴熱休克90s,并迅速放回冰上冰浴2min;加入880ul LB培養(yǎng)基,37℃劇烈振蕩培養(yǎng)1h;將培養(yǎng)液低速離心,去除上清900ul,重懸沉淀,涂布于硫酸卡那霉素抗性培養(yǎng)基,37℃培養(yǎng)過夜。
四.所涉及的序列及記號1.SEQ ID NO.1的信息(1)序列特征長度27bp類型核苷酸鏈性單鏈拓?fù)浣Y(jié)構(gòu)線性(2)分子類型寡核苷酸(3)序列描述SEQ ID NO.1aaatctctagcagtggcgcccgaacag作為PCR反應(yīng)的正向引物,用于擴(kuò)增從病毒基因組5′端LTR末端與PBS位點(diǎn)連接區(qū)起始至3′端LTR近U5區(qū)的R區(qū)末端共計9kb片段。
2.SEQ ID NO.2的信息(1)序列特征長度27bp類型核苷酸鏈性單鏈拓?fù)浣Y(jié)構(gòu)線性(2)分子類型寡核苷酸(3)序列描述SEQ ID NO.2gcactcaaggcaagctttattgaggct作為PCR反應(yīng)的反向引物,用于擴(kuò)增從病毒基因組5′端LTR末端與PBS位點(diǎn)連接區(qū)起始至3′端LTR近U5區(qū)的R區(qū)末端共計9kb片段。
3.SEQ ID NO.3的信息(1)序列特征長度17bp類型核苷酸鏈性單鏈拓?fù)浣Y(jié)構(gòu)線性(2)分子類型寡核苷酸。
(3)序列描述SEQ ID NO.3tggaagggctaatttac作為PCR反應(yīng)的正向引物,用于擴(kuò)增病毒基因組5′端1.8kb序列。
4.SEQ ID NO.4的信息(1)序列特征長度22bp類型核苷酸鏈性單鏈拓?fù)浣Y(jié)構(gòu)線性(2)分子類型寡核苷酸(3)序列描述SEQ ID NO.4tcatcatttcttctagtgtagc作為PCR反應(yīng)的反向引物,用于擴(kuò)增病毒基因組5′端1.8kb序列。
5.SEQ ID NO.5的信息SEQ ID NO.5是本發(fā)明提供的一株HIV病毒全基因組的核苷酸全序列,其編碼區(qū)全長9642個核苷酸,此全基因組編碼多個蛋白以及非蛋白的病毒特征序列。
(1)序列特征長度9642bp類型核苷酸鏈性單鏈拓?fù)浣Y(jié)構(gòu)線性(2)分子類型寡核苷酸。
(3)序列描述SEQ ID NO.5(4)序列表見下述內(nèi)容。
序列表<110>中國科學(xué)院武漢病毒研究所<120>一株HIV病毒的全基因組<140>
<141>
<160>1<170>
<210>1<211>9642<212>DNA<213>人免疫缺陷病毒(Human Immunodeficiency Virus,HIV)<220>
<221>
<222>
<223>
<400>11 tggaagggct aatttactcc caaaagagac aagagatcct tgatctgtgg gtctaccata61 cacaaggctt cttccctgat tgggacaact atacaccagg gccaggaatc agataccctc121 tgacctttgg atggtgcttc aagctagtac cagttgatcc agagcaggta gaagaagcca181 acaaaggaga gaacagctgc ttgctacatc ctataagcca acatggaaca gatgacccag241 agagagaagt gctgatgtgg aagtttgaca gccacctagc cttccatcac atggcccgag301 agaaacatcc tgagttctac aaagactgct gacactgagc tatctacaag ggactttccg361 ctggggactt tccagggagg cgtggcatgg gcgggaccgg ggagtggcga gccctcagat421 gctgcatata agcagccgct tttgcctgta ctgggtctct ctagtcagac cagatccgag481 cctgggagct ctctggctga ttagggaacc cactgcttaa gcctcaataa agcttgcctt541 gagtgcttca agtagtgtgt gcccgtctgt tgtgtgactc tggtaactag agatccctca601 gaccctttag tttgtgtgga aaatctctag cagtggcgcc cgaacaggga cgcgaaagcg661 aaagtgagac cagaggagat ctctcgacgc aggactcggc ttgctgaagc gcgcacagca721 agaggcgagg ggcggcgact ggtgagtacg ccattttttg actagcggag gctagaagga781 gagagatggg tgcgagagcg tcagtattaa gtggcggaca attggataga tgggaaagaa841 ttcggttaag gccaggggga aagaaaaaat ataaattaaa acatatagta tgggcaagca
901 gggagctgga acgattcgca gttaatcctg gcctcttaga aacagcagaa ggttgtagac961 aaatactgca acagctacaa ccatcccttc agacaggatc agaagaattg aaatcattat1021 tcaatgcagt agcagtcctc tattgtgtgc atcaaaggat agaggtaaaa gacaccaagg1081 aagctttaga gaagatagag gaagagcaaa acaaaagtaa gaaaaaggca cagcaagcag1141 cagctgctga cacaggaaac aacagccagg tcagccacaa ttaccctata gtgcaaaacc1201 ttcaggggca aatggtacat cagcccatat cacctagaac tttaaatgca tgggtaaagg1261 tagtagaaga gaaggctttt aatccagaag taatacccat gtttacagca ttatcagaag1321 gagccacccc acaagattta aacaccatgc taaacacggt ggggggacat caggcagcca1381 tgcagatgtt aaaagaaacc atcaatgagg aagctgcaga atgggataga gtacacccag1441 tgcaggcagg gccagttgca ccaggccagc tgagagatcc aaggggaagt gacatagcag1501 gaactactag tactcttcag gagcaaatag gatggatgac agctaatcca cctgtcccag1561 taggagaaat ctataaagga tggataatcc tgggattaaa taaaatagta agaatgtata1621 gccctaccgg tattctggac ataagacaag gaccaaagga accctttaga gactatgtag1681 acaggttcta taagactcta agagccgaac aagcttcaca agatgtaaaa aattggatga1741 cagaaacctt gttggtccaa aattcgaacc cagattgtag gactatttta aaagcattgg1801 gaccaggagc tacactagaa gaaatgatga cagcatgtca gggagtgggg ggacccagcc1861 ataaagcaag aatattggct gaagcaatga gccaagtaac aaattcagct aatataatga1921 tgcagagagg caatttcagg aaccaaagaa agattgtcaa gtgtttcaat tgtggcaaag1981 aagggcacat agccaaaaat tgtagggccc ccaggaaaaa gggctgttgg agatgtggaa2041 aggaaggaca ccaaatgaag gagtgtactg agagacaggc taatttttta gggaaaatct2101 ggccttccca caaggggagg ccagggaatt ttcttcagag cagaccagag ccatcagccc2161 caccagagga gagcttcagg ttcggggagg agacaacaac tccacctcag aagcaggagc2221 cgatagacaa ggaactatat cctttaacct ccctcagatc actctttggc aacgacccct2281 cgtcccaata aagatagggg ggcaaataaa ggaagctctg ttagatacag gagcagatga2341 tacagtatta gaagacatga atttgccagg aagatggaaa ccaaaaatga tagggggaat2401 tggaggtttt atcaaagtaa gacagtatga tcagataccc atagaaatct gcggacacaa2461 ggctgtaggt acagtactaa taggacctac acctatcaac ataattggga gaaatctgtt2521 gactcagctt ggttgcactt taaattttcc cattagtcct attgaaactg taccagtaaa2581 attaaagcca ggaatggatg gcccaaaagt taaacaatgg ccattgacag aagaaaaaat2641 aaaagcatta atggaaattt gtacagaaat ggaaaaggaa gggaaaattt caaaaattgg2701 gcctgaaaat ccatacaata ctccagtatt tgccataaag aaaaaagaca gtactaaatg
2761 gagaaaatta gtagatttta gggaacttaa taaaagaact caagacttct gggaagttca2821 attaggaata ccacatccgg cagggttgaa gaagaaaaaa tctgtaacag tcctggatgt2881 gggtgatgca tatttctcgg tccctttaga tgaggacttc aggaagtata ctgcatttac2941 catacctagt aggaacaatg agacaccagg gatcagatat cagtacgatg tgcttccaca3001 gggatggaaa ggatcaccag caatattcca atgtagcatg acaaaaatct tagagccttt3061 tagaaaacaa aatccagaca tagttatcta tcaatacatg gatgatttgt atgtaggatc3121 tgacttagaa atagggcagc atagagcaaa agtagaggaa ctgagagaac atttgttgag3181 gtggggattt accacaccag acaaaaaaca tcagaaagaa cctccattcc tttggatggg3241 ttatgaactc catcctgata aatggacggt acagcctata gtgctgccag aaaaggacag3301 ctggactgtc aatgacatac agaagttagt gggaaaatta aattgggcaa gtcagattta3361 tgcagggatt aaggtaaagg aattatgtaa actacttagg ggaaccaaag cattaacaga3421 agtaatacca ctaacagaag aagcagagct agaactggcg gaaaacaggg aaattctaaa3481 agaaacagta catggagtgt attatgaccc atcaaaagac ttaatagcag aaatacagaa3541 gcagggacta ggtcaatgga cataccaaat ttatcaagag caatataaaa atctgaaaac3601 aggaaaatat gcaagaatga ggggtgctca cactaatgat gtaaaacaat taacagaggc3661 agtgcaaaaa atagccacag aaagcatagt aatatgggga aagactccta aatttaaact3721 acccatacaa aaggaaacat gggaagcatg gtggacagag tattggcaag ccacatggat3781 tcctgagtgg gagtttgtca atacccctcc cttagtgaaa ttatggtatc agttagagaa3841 ggaacccata gaaggagcag aaactttcta tgtagatggg gcagctaata gggagactaa3901 attaggaaaa gcaggatatg ttactaacaa aggaagacaa agagttgtca ccctaaatga3961 cacaacaaat cagaagactg agttacatgc aattcattta gctttgcagg attcaggagc4021 agaagtaaac atagtaacag actcacaata tgcattgggg atcattcaag cacaaccaga4081 taagagtgaa tctgaattag tcagtcaaat aatagaacag ttaataaaaa aggaaaaaat4141 ctacctggca tgggtgccag cacacaaggg aattggaggg aatgaacaaa tagataaatt4201 agtcagtgct ggaatcagga aagtactatt tttagatgga atagataagg cccaagaaga4261 acatgagaaa tatcacaata actggagagc aatggctagt gattttaaca taccacctgt4321 ggtagcaaaa gaaatagtag cctgctgtga taaatgtcag ctgaaaggag aagccatgca4381 tggacaagta gactgtagcc caggaatatg gcaactagat tgtacacatc tagaaggaaa4441 aattatcctg gtagcggttc atgtagccag tggatatata gaagcagaaa ttattccaac4501 agagacaggg caagaaacag catactttat cctaaaatta gcaggaagat ggccagtgaa4561 aacaatacat acagacaatg gcagaaattt taccagtact tcagttaagg ccgcctgttg
4621 gtgggcaggg atcaagcagg aatttggcat tccctacaat ccccaaagtc aaggagtagt4681 agaatctatg aataatgagt taaagaaaat tataggacag gtaagagatc aagctgaaca4741 tcttaagaca gcagtacaaa tggcagtatt tatccacaat tttaagagaa aaggggggat4801 tggggggtac agtgcagggg aaaggatagt agacataata gcaacagaca tacaaactag4861 agaactacaa aaacaaatta caaaaattca aaattttcgg gtttattaca gggacagcag4921 agatccactt tggaaaggac cagcaaagct tctgtggaaa ggtgaagggg cagtagtgat4981 acaagataat agtgacataa aagtagtgcc aagaagaaaa gcaaagatca ttagggacta5041 tggcaaacag atggcaggtg atgattgtgt ggcaagtaga caggatgagg attagaacat5101 ggaaaagctt agtaaaacac catatgtata tttcaaggaa agctaaagga tggtgttata5161 aacaccacta tgatagcact catccaaaaa taagttcaga agtacacatc ccactagggg5221 atgctaaatt ggtaataaca acatattggg gtctgcatac aggagaaaga gactggcatt5281 tgggccaggg agtctccata gaatggagga gagacagata tagcacacaa gcagaaccta5341 gcctagcaga ccaactaatt catctgtatt attttgattg tttttcagaa tctgccataa5401 gaaaagccat tttaggacgt gtagttagct ctagttgcaa ttatccagaa ggacatagca5461 aggtaggatc cctacagtac ttggcactag cagcattagt aacaccaaaa aggagaaagc5521 cacctttgcc tagtgttgcg aaactgacag aggatagatg gaacaagccc cagaggatca5581 agggccacag agggaaccat acaatgagtg gacactagag cttttagagg agattaaaag5641 ggaagctgtt agacattttc ctaggagatg gctccatgag ttgggacaat acatctatga5701 aacatatggg gatacttggg taggagtgga agccataata agaattctgc aacaactgct5761 gtttactcat ttcagaattg gatgtcaaca tagcagaata ggcattactc gacagaggag5821 agcaagaaat ggagccagta gatcctagat tagagccctg gaagcatcca ggaagtcagc5881 ctaagactgc ttgtaacaat tgctattgta aaaaatgcag ctttcattgc caagtttgtt5941 tcacaaaaaa aggcttaggc atctcctatg gcaggaagaa gagaagacaa cgacgaagaa6001 ctcctcaaga cagtcaaact catcaagttt ctctaccaaa gcagtaagta atatatgtaa6061 tgcaatcttt gcaagcttta accatttttg caatagtagc tttaatagta gtagcaataa6121 tagcaatagt tgtgtggacc atagtattac tagaatatag gaaaatatta agacagagaa6181 aaatagatag gttaattgat agaataagag aaagagcaga agacagtggc aatgagagcg6241 acggggatca ggaagaatta tcagcattgg agatggggca ccttattcct cggaatgctg6301 atgatctgta gtgctgcaga aaaattgtgg gtcacagtct attatggggtacctgtatgg6361 aaagaaacaa ctaccactct attttgtgca tcagaggcta aagcatatgc tacagaggta6421 cataatattt gggccacaca tgcctgtgta cccacagacc ccaacccaca agaagtagtc
6481 ttggaaaatg tgacagaaaa ttttaacatg tgggaaaata acatggtaga acagatgcat6541 gaagatataa tcagtttatg ggatcaaggc ctaaagccat gtgtaagatt aaccccactc6601 tgtgttactt taaattgcac tgatttcaag agtaatagta ccagtagtaa taacagtagt6661 acaacagaga aaggagaaat aaaaaactgc tctttcaata tcaccacaag cacaggaact6721 aaggtaagag actctgcact ttttaataag cttgatgtat taccaataga taatagtagt6781 accagctata atagtagtac cagcaatagg tatcacagct ataggttgat acattgtaac6841 acctcaagaa ttacacaagc ttgtccaaag gtatcctttg agccaattcc catacattat6901 tgtaccccgg ctggttttgc gctcctaaag tgtaacaata aaacgttcaa tggaatagga6961 ccatgtacaa atgtcagtac agtacaatgt acacatggaa ttagaccagt agtaacaact7021 caactgctgt tgaatggtag tttagcagac gaagaggtag taattagatc taaaaatttc7081 acagacaatg ctaaaatcat aatagtacag ctgaaacaat ccgtagaaat taattgtaca7141 agacccaaca acaatacaag aaaaaggata actatgggac cagggagagt attgtataca7201 acaggacaaa tagtaggaga tataagaaaa gcacattgta accttagtag accacaatgg7261 gatgacactc taagacaggt agttggaaaa ttaagagaac aatttgggaa caaaacaata7321 atctttaatc aatctgcagg aggggatcca gaggttgtaa tgcacatttc taattgtgga7381 ggggaatttt tctactgtaa tacctcacga ctgtttaata gtacttggta taataatggt7441 acttggaata atgctagtac tgggaatgat agcactatta tactcccttg cagaataaaa7501 caaattgtaa acaggtggca ggaagtaggg aaagcaatat atgcccctcc cattgcagga7561 ccaattaatt gttcatcaaa aattacaggg ttactattaa caagagatgg tgggattaat7621 aagactgaca ccgagacctt cagacctgga ggaggagata tgagagacaa ttggagaagt7681 gaattatata aatataaagt agtgaaaatt gaaccattag gagtagcacc caccagggca7741 aagagaagag tggtgcaaag agaaaaaaga gcagtgggag caataggagc gatgttcctt7801 gggttcttgg gagcagcagg aagcactatg ggcgcagcgt caataacgct gacggtacag7861 gccagacaat tgttgactgg tatagtgcaa cagcaaagaa atttgctgag agctattgag7921 gcgcaacagc atctgttgca actcacagtc tggggcatca aacagctcca ggcaagagtc7981 ttggctgtgg aaagatacct aaaggatcaa cagctcctag ggatttgggg ttgctctgga8041 aaactcattt gcaccactgc tgtgccttgg aatgctagtt ggagtaataa atctcacgat8101 gagatttgga ataacatgac ttggatggag tgggaaagac aaattgacaa ttatacagca8161 gaaatataca ccttaattga acaatcgcag aaccaacaag aaaagaatga gttagaacta8221 ttggaattgg ataagtgggc aagcttgtgg aattggttta acatgacaca atggctgtgg8281 tatattaaaa tattcataat gatagtagga ggcttgatag gtttaagaat aatttttgct
8341 gtactttcta tagtaaatag agttaggcag ggatactcac cattgtcatt gcagacccac8401 ttcccaaccc agaggggacc cggaaggccc gaaggaatcg aagaagaagg tggagagcga8461 gacagaggca gatccgagag attagtgaac ggattcttga cacttatctg ggaggatcta8521 cggagcctgt gcctcttcag ctaccaccgc ttgagagact tactcttgat tgtagcgagg8581 attgtggaac ttctgggacg cagagggtgg gaagccctca aatattgggg gaatctcctg8641 cagtattgga ttcaggaact aaagaatagt gctattagct tgcttaacgc cacagccata8701 gcagtaggtg aagggacaga taggattata gaagtagcac aaagagcttg gagagctatt8761 ctcaacatac ctacaagaat cagacagggc ctcgaaagag ctttgctata agatgggagg8821 caagtggtca aaaggttgta tggctggatg gcctagtgtg agggaaagaa tggaacgagc8881 tgagccagca gcagatgggg tgggagcagt atctcgagac ctgggaagac atggagcaat8941 cacaagtagc aatacagcaa atgatgcctg tgtatggcta gaagcacaag aggaggagga9001 agtgggcttt ccagtcagac ctcaggtacc tttaagacca atgacttaca agggagcgtt9061 agatctcagc cactttttaa gagaaaaggg gggactggaa gggctaattt actcccaaaa9121 gagacaagag atccttgatc tgtgggtcta ccatacacaa ggcttcttcc ctgattggca9181 taactacaca ccagggccag ggatcagata ccctctgacc tttggatggt gcttcaagct9241 agtaccagtt gatccagagc aggtagaaga agccaacaaa gaagagaaca actgcctgct9301 acatcctatg agccaacatg gaacagatga cccagagaga gaagtgctga tgtggaagtt9361 tgacagccgc ctagccttcc atcacatggc ccgagagaaa catcctgagt tctacaaaga9421 ctgctgacac cgagctttct acaagggact ttccgctggg gactttccag ggaggcgtga9481 catgggcggg accggggagt ggcgagccct cagatgctgc atataagcag ccgcttttgc9541 ctgtactggg tctctctagt cagaccagat ccgagcctgg gagctctctg gctgattagg9601 gaacccactg cttaagcctc aataaagctt gccttgagtg c
權(quán)利要求
1.一株HIV病毒的全基因組,它具有SEQ ID NO.5所示的核苷酸全序列。
2.根據(jù)權(quán)利要求1所述的HIV病毒的全基因組,SEQ ID NO.5所示的核苷酸全序列與GENEBANK公布的我國的U71182、DQ007902、DQ007903、DQ007901和AY180905毒株序列相比,其同源性為91~96%。
3.權(quán)利要求1所述的HIV病毒的全基因組,其第786至2291核苷酸序列編碼病毒核蛋白融合蛋白,在成熟HIV顆粒組裝中被裂解為P24、P17、P9、P6等蛋白,依據(jù)該序列所得到的各蛋白被應(yīng)用于HIV的疫苗設(shè)計和作為重要的疫苗開發(fā)材料的應(yīng)用。
4.權(quán)利要求1所述的HIV病毒的全基因組,其第2084至5095核苷酸序列編碼病毒多聚酶融合蛋白,在成熟病毒顆粒組裝中被裂解為蛋白酶、逆轉(zhuǎn)錄酶和整合酶,依據(jù)該序列所得到的各蛋白被用于HIV的疫苗設(shè)計和作為重要的疫苗開發(fā)材料以及重要的藥物治療靶點(diǎn)的應(yīng)用。
5.權(quán)利要求1所述的HIV病毒的全基因組,其第6232至8811核苷酸序列編碼病毒膜蛋白融合蛋白,在病毒成熟和包裝過程中被切割為GP120糖蛋白和GP41糖蛋白,依據(jù)該序列所得到的蛋白被用于HIV的疫苗設(shè)計和應(yīng)用。
6.根據(jù)權(quán)利要求5所述的HIV病毒的全基因組,其特征在于依據(jù)該膜蛋白編碼序列所得到的蛋白在作為重要的疫苗開發(fā)材料上的應(yīng)用。
7.權(quán)利要求1所述的HIV病毒的全基因組,其第5040至5618核苷酸序列編碼病毒的Vif蛋白,第5558至5848核苷酸序列編碼病毒的Vpr蛋白,第5829至6043以及第8395至8485核苷酸序列編碼病毒的Tat蛋白,第5968至6043以及第8395至8669核苷酸序列編碼病毒的Rev蛋白,第8813至9427核苷酸序列編碼病毒的Nef蛋白,依據(jù)以上序列所得蛋白被用于HIV的疫苗設(shè)計和應(yīng)用。
8.根據(jù)權(quán)利要求7所述的HIV病毒的全基因組,其特征在于依據(jù)以上序列所得蛋白在作為重要的疫苗開發(fā)材料和藥物靶點(diǎn)上的應(yīng)用。
9.權(quán)利要求1所述的HIV病毒的全基因組,其第1至632以及第9096至9641核苷酸序列編碼病毒的長末端重復(fù)序列,該序列被應(yīng)用于艾滋病藥物的研究與應(yīng)用。
10.根據(jù)權(quán)利要求9所述的HIV病毒的全基因組,其特征在于該序列作為艾滋病藥物的重要靶點(diǎn)的應(yīng)用。
全文摘要
本發(fā)明涉及一株HIV病毒(艾滋病毒)的全基因組,它具有SEQ ID NO.5所示的核苷酸全序列,其中一些部分的核苷酸序列可應(yīng)用于HIV的疫苗設(shè)計和作為重要的疫苗開發(fā)材料的應(yīng)用。本發(fā)明提供的序列與公布的U71182、DQ007902、DQ007903、DQ007901和AY180905等5株序列同源性在91%-96%范圍,本序列與其它B’亞型病毒基因組序列的差異部分為本專利的特征,該差異所產(chǎn)生的核酸以及氨基酸水平的功能變化將直接或間接的影響后續(xù)的藥物和疫苗設(shè)計,依據(jù)本序列所開發(fā)的疫苗和治療藥物將可能對我國的艾滋病防控產(chǎn)生積極影響。
文檔編號A61K39/21GK1928089SQ200610124558
公開日2007年3月14日 申請日期2006年9月19日 優(yōu)先權(quán)日2006年9月19日
發(fā)明者楊榮閣, 童驍, 譚建新 申請人:中國科學(xué)院武漢病毒研究所