專利名稱:Hiv-1亞型間(c/b’)基因組和其用途的制作方法
發(fā)明說明本發(fā)明涉及一種多核苷酸,其包括在SEQ ID NO1,2或3中所示的核酸序列或其片段或衍生物,或與在SEQ ID NO1,2或3中所示的核酸序列雜交的多核苷酸。本發(fā)明更涉及由在SEQ ID NO1,2或3中所示的核酸序列或其片段或衍生物所編碼的多肽。該等多核苷酸和多肽可用為藥品,疫苗或診斷用物質(zhì),較佳者是用于HIV感染的治療,預(yù)防或診斷。
在考慮到至本世紀末全世界經(jīng)估計有超過四千萬受感染的人且其中有超過90%是生活在發(fā)展中國家中的人類免疫缺陷性病毒(Human Immunodeficiency Virus)(HIV)的全球分布程度,HIV疫苗的開發(fā)據(jù)認為是現(xiàn)代工業(yè)化社會的重大挑戰(zhàn)之一。不過,到目前為止,成功的HIV疫苗的開發(fā)仍然受限于此種病毒的復(fù)雜生物學(xué)及其與宿主所具免疫系統(tǒng)的復(fù)雜相互作用。到目前為止已經(jīng)在發(fā)展中國家中對臨床第三期用藥中試驗過的少數(shù)可選用疫苗主要是以第1型HIV之外部糖蛋白gp120或gp160為基礎(chǔ)。不過,這些研究的結(jié)果十分令人失望,該等疫苗不僅不能誘導(dǎo)出寬廣的交叉中和抗體與T細胞反應(yīng),而且甚至于不能防止已對某些接種疫苗的個體報導(dǎo)過的突破感染。這種結(jié)果的諸項原因之一確定是來自于所使用的衍生自經(jīng)實驗室適應(yīng)的病毒株的抗原與在試驗區(qū)例如泰國境內(nèi)循環(huán)的遺傳分歧性病毒之間的廣泛序列變異。
對在全球流轉(zhuǎn)的HIV病毒株所進行的分類學(xué)分析,除了O組病毒以外,已鑒定出在包膜蛋白質(zhì)中存在著高達24%序列變異的10種不同的序列亞型(A-J)組成的一主要組(M)(Kostrikis et al.,1995;Leitner and Albert,1995;Gaywee et al.,1996World HealthOrganisation Network for HIV lsolation and Characterization,1994)該O組病毒與M組病毒在某些讀框上有超過40%的差異(LoussertAjaka et al.,1995;Myers et al.,1996;Sharp et al.,1995;Shary etal.,1999)。HIV是經(jīng)由突變與亞型間重組的快速累積而進行演化。在地理區(qū)群中共同循環(huán)的諸不同亞型代表進化枝間鑲嵌性病毒(interclade mosaic virus)的產(chǎn)生與分布的分子基礎(chǔ)。雖然已經(jīng)利用血清學(xué)和異型雙螺旋體DNA分析對全球HIV-1變異體作過精深的研究,不過因為現(xiàn)有諸亞型和多種重組形式都缺乏經(jīng)完整測序的基因組,所以大部份分類學(xué)研究都是以包膜序列為基礎(chǔ)。
非亞型B病毒會引起極多種全球性新的HIV-1感染。其中,進化枝CHIV-1病毒株在有關(guān)受感染人的總數(shù)以及新感染例特別是在南美和亞洲中的高發(fā)生率兩者扮有前導(dǎo)性角色。因此之故,進化枝C病毒的鑒定對于診斷、預(yù)防和治療目的而言都是頂級優(yōu)先者之一。除了泰國之外,有關(guān)在整個亞洲流傳的HIV-1病毒株的分布與分子特性所能得到的資訊直到最近仍然有限。WHO估計南亞與東南亞具有最快速的HIV傳播速率且很快就會變成全世界最大的HIV流行區(qū)。中國具有與這些區(qū)域非常類似的社會和經(jīng)濟狀況與直接的倫理和經(jīng)濟關(guān)聯(lián)。自從1995年早期之后,在中國許多省中即可清楚地看到HIV感染的快速增加。與1985年到1994年所偵檢到的HIV和AIDS的累積1774病例相比,在1995年偵檢到1421例,而單在1997年就偵檢出超過4000病例。WHO估計到1997年底在中國境內(nèi)會有超過400,000 HIV感染例,且單在1997年內(nèi),估計有6400個累積的AIDS死亡例和4000個死亡途中者。于最近的全國HIV分子流行病學(xué)調(diào)查中,可以發(fā)現(xiàn)在云南省所存在的亞型原型B與B’-亞型(Graf et al.,1998)已被毒品使用者,污染的血液和tat漿收集服務(wù)傳播到中國中部與東部。第二種流行病最可能是在1990年代早期由帶有亞型C病毒株的印度IDUs輸入到該等相同的地區(qū)(Luoet al.,1995;Shao et al.,1999)。在數(shù)年之內(nèi),亞型C病毒經(jīng)由毒品運輸在中國南部、中部及甚至于西北部快速地傳播且在中國境內(nèi)引起廣泛傳播的流行病。根據(jù)最近的全國HIV分子流行病學(xué)調(diào)查,幾乎所有感染亞型C的個體都是IDUs且占有中國HIV感染IDUs的約40%,可以推測出亞型C病毒為在中國境內(nèi)IDUs中所遍布的諸主要HIV-1亞型中之一(Shao et al,1998;Shao et al.,1994)。
由此點可以推測出在中國境內(nèi)IDUs之間的HIV流行病于短短數(shù)年之間就從單一主要亞型(B)擴展到至少兩種主要亞型,B-Thai和C,增加了亞型間重組的可能性。根據(jù)我們對于不同病毒株所具可變異性與抗原性的認知,應(yīng)該對區(qū)域性病毒株調(diào)整診斷工具,治療藥劑與疫苗。不過,目前對于非-亞型B病毒所用的分子藥劑的種類數(shù)目仍然極為有限。目前,對于B或C以外的病毒只有少數(shù)非重組分子克隆(molecular clone)和一些鑲嵌性基因組(mosaicgenomes)可以取用。有關(guān)進化枝CHIV-1病毒,到目前為止只有公開出非一重組型代表物與4A/C重組體,彼等全部都是源自非洲、南美或印度(Lao et al.1995;Gao et al,1998Loke et al.1999)。再者,所有先前對于在中國境內(nèi)的亞型C病毒的數(shù)據(jù)都局限在env基因的遺傳亞型定型(genetic subtyping)(Luo et al.1995;Yu etal.1997;Salminen et al.1995)。
到目前為止已有數(shù)個使用疫苗實施針對HIV感染的臨床實驗。在該等臨床實驗中所觀察到的令人失望的結(jié)果包括在接受疫苗的人中不斷地報導(dǎo)出有突破防線性的感染。這種結(jié)果經(jīng)歸因于所施用的包膜蛋白質(zhì)與感染性輸入病毒之間的重大序列變異,此點于事實上主要是來自于對于在獨特地理區(qū)域內(nèi)流傳的病毒群所作的鑒定不足所致。此點導(dǎo)致對和在試驗場域中的病毒群不相關(guān)的病毒的病毒抗原產(chǎn)生體液免疫反應(yīng)與(較少程度地)細胞介導(dǎo)的免疫反應(yīng)。再者,已經(jīng)報導(dǎo)的低親和結(jié)合性,包膜特異性抗體不僅缺乏中和能力,而且甚至于會助成通過補體-或Fc-受體的感染的增強。另外,所選用的抗原和輸送系統(tǒng)會轉(zhuǎn)變成為極端微弱的細胞介導(dǎo)的免疫反應(yīng)的誘導(dǎo)劑。
基于對跨進化枝保護性免疫反應(yīng)的正確知識的缺乏以及有關(guān)在已知有多重HIV-1亞型共同流傳的發(fā)展中國家境內(nèi)的復(fù)雜情勢,疫苗制劑應(yīng)該包括多種代表性抗原的混合物。因此,有需要分離與鑒定進化枝C病毒,特別是克隆其編碼區(qū)。
本發(fā)明的問題是由權(quán)利要求的主題內(nèi)容予以解決。
本發(fā)明用附圖進一步闡明。
圖1顯示來自克隆97cn54的env C2V3編碼區(qū)與主要HIV-1(M組)亞型的代表的分類學(xué)關(guān)系的圖解說明。Cn-con-c代表在中國境內(nèi)普遍流行的HIV-1亞型C病毒株的env共有序列(consensussequence)。分類學(xué)樹是使用鄰域連接法(neighbour joining method)構(gòu)成的。在結(jié)點的值指的是朝右的簇集受到支持的相生百分比(percent bootstrap)。其中只顯示出70%和更高的相生率。右邊括號表HIV-1M組的主要亞型序列。
圖2顯示出97cn54完整gagpol編碼區(qū)的重組鑒定程序分析(theRecombinant Identification Program analysi)(RIP,versionl,1.3)的圖解說明(窗尺寸200,統(tǒng)計意義閾值90%,Gap處置STRIP)。gag和pol兩開放讀框的位置是在圖的頂端用箭號指示出。Rip分析是以使用從所選代表最相關(guān)性HIV-1亞型的病毒株導(dǎo)出的參比序列進行背景對比(background alignment)為基礎(chǔ)的。標準代表物是使用如所示的不同顏色予以標記出。X軸指示出沿著該對比的核苷酸位置。Y軸指示出97cn54與所列出的參比亞型的類似率。
圖3顯示出在97cn54衍生的gagpol讀框內(nèi)的諸不同區(qū)相對于主要HIV-1(M組)亞型的標準代表物的分類關(guān)系的圖解說明。分類學(xué)樹是使用鄰域連接法以下列序列連續(xù)段(stretch)為基礎(chǔ)而構(gòu)成者(A)核苷酸1-478,(B)479-620,(C)621-1290,(D)1291-1830,(E)1831-2220,(F)2221-2520和(G)2521-2971。所給位置指的是gag開放讀框的第一個核苷酸?;疑珔^(qū)突顯出用進化枝C-(A,C,E,G)或B-(B,D,F(xiàn))衍生的參比株分析的序列的簇集。在結(jié)點的值指的是朝右的簇集受到支持的相生百分比。其中只顯示出70%和更高的相生率。
圖4顯示出97cn54所含諸不同區(qū)的重組鑒定程序分析(RIP,version 1.3)的圖解說明(窗尺寸200,統(tǒng)計意義閡值90%,Gap處置STRIP)。分析包括(A)-1500bp的序列連續(xù)段,從vif基因的起始密碼子到env基因的5’端,內(nèi)含vif,vpr,tat和rev的第一個外顯子,vpu以及env基因的前面200bp與(B)從env的3’端有300bp重疊之一段約700bp的片段內(nèi)含完整的nef基因與3’LTR的部份。vpr,tat,vpu,env,nef的起始密碼子以及3’-LTR的5’端等的位置是在圖的頂端分別以箭號指示出。Rip分析是以便用從所選代表最相關(guān)性HIV-1亞型的病毒株導(dǎo)出的參比序列進行背景對比(background alignment)為基礎(chǔ)的。所示標準代表物是使用不同顏色予以標記出。X軸指示比沿著該對比的核苷酸位置。Y軸指示出97cn54與所列出的參比亞型的類似率。(C)和(D)得自中國境內(nèi)的兩種獨立進化枝C-分離物(xj24和xj158)的序列的Rip分析,其中vpr與vpu基因重疊包括tat的第一個外顯子。
圖5顯示出一分類學(xué)樹分析。分類學(xué)樹是使用鄰域連接法以下列序列連續(xù)段(stretch)為基礎(chǔ)而構(gòu)成(A)-380bp片段將vpr基因的3’150bp到vpu讀框的末端重疊,(B)net編碼區(qū)的前面290bp與(C)nef基因的3’320bp。在結(jié)點的值指的是朝右的簇集受到支承的相生百分比。其中只顯示70%和更高的相生率。右邊括號表HIV-1M組的主要亞型序列。
圖6為97cn54的鑲嵌性基因組組織的示意圖。
圖7為在已知且經(jīng)實驗證明過的原型B(HIV-1LAI)衍生CTL表位與在進化枝C病毒株97cn54的gag,pol和env多肽中的相應(yīng)氨基酸序列之間的比較的圖解說明。顯示出下列功能結(jié)構(gòu)區(qū)(functional domain)gag(p17基質(zhì),p24衣殼,p15核衣殼和連結(jié)蛋白質(zhì)),POL(PR蛋白酶,RT反轉(zhuǎn)錄酶,IN整合酶(integrase))和ENV(gp120外部糖蛋白,gp41透膜蛋白)。在開放讀框下方的數(shù)值分別指示出相對于多肽氨基端的氨基酸位置。已知HIV-1LAI衍生CTL表位的單倍型(haplotype)限制分別在左和右兩邊緣指示出。綠色條代表在已知的表位與對應(yīng)的進化枝C序列之間的相同率,藍色條指示出2或更少的保守性錯配(conservative mismatch)。紅色條表相對于相應(yīng)的LAI衍生表位具有超過2個保守性錯配或任何非保守性取代的進化枝C衍生序列連續(xù)段。
圖8顯示出進化枝CHIV-1 97cn54的完整長度密碼核苷酸序列(SEQ ID NO1)與相應(yīng)的以一字母碼示出的氨基酸。所有三個讀框都在此給出。星號表終止密碼子。
圖9顯示出使用各DNA質(zhì)粒進行肌肉內(nèi)免疫之后細胞毒性T細胞在小鼠BALB/c脾細胞內(nèi)的活性結(jié)果的圖解說明。將在初次免疫3星期之后從每組各5只的小鼠分別取得的淋巴細胞與裝載入具有氨基酸序列AMOMLKETI的gag多肽的同基因P815肥大細胞瘤細胞(用20,000rad照射過)共同培養(yǎng)。對照組包括從未免疫處理,用裝載肽的P815細胞刺激過的小鼠所取得的脾細胞。在體外培養(yǎng)5天之后收獲細胞毒性效應(yīng)細胞群。在51C釋放標準檢定中針對用上面所提九肽裝載過的A20細胞或針對未裝載的A20細胞讀取細胞毒性反應(yīng)。所顯示出的數(shù)據(jù)代表從分別實施三次該做法所得的平均值。所測定的標準偏差分別低于相對于該平均值的15%。
“表位”(epitope)或“抗原決定簇”(antigenic determinant)一詞如本文中所用者指的是可為一抗體所特異地辨識的抗原所含免疫學(xué)決定基。一表位包括至少3個,較佳者至少5個氨基酸的呈空間或不連續(xù)構(gòu)象的氨基酸。一表位也可以包括一包括著一連續(xù)氨基酸序列的單一節(jié)段多肽鏈。
“多核苷酸”一詞如本文中所用者是指稱具有任何長度,可為核糖核苷酸或脫氧核糖核苷酸的核苷酸單位的單鏈或雙鏈異元聚合物。該術(shù)語也包括經(jīng)修飾的核苷酸。
“衍生物”一詞如本文中所用者指的是一核酸,其亦編碼一或多種被另一核酸序列所編碼的多肽,雖則該核酸的核酸序列不同于該另一核酸序列。于此種意義中,“衍生物”一詞也指稱因為遺傳密碼簡并(degeneration)而存在的其他核酸序列的相等物(equivalent)。因此,“衍生物”一詞包括例如編碼相同多肽的核酸如根據(jù)SEQ IDNO1,2或3的核酸但具有另一核酸序列者。再者,該術(shù)語包括編碼相同多肽的核酸片段如具有根據(jù)SEQ ID NO1,2或3的核酸序列的核酸片段。
“多肽’一詞如本文中所用者是指稱具有至少兩個氨基酸殘基由肽鍵所連接成的鏈。所以,該術(shù)語包括任何氨基酸鏈,例如寡肽(oligopeptides)或蛋白質(zhì)。該術(shù)語也指稱其中有一或更多個氨基酸是經(jīng)修飾過,例如乙?;⑻腔蛄姿峄被徭?。
“連續(xù)序列”或“片段”一詞如本文中所用者是指稱一衍生自一參比序列的線型核苷酸或氨基酸連續(xù)段,例如在序列表中所列的本發(fā)明各序列。
“選擇性雜交”或“可選擇性雜交”,一詞如本文中所用者是指稱在嚴格雜交條件(stringent hybridization condition)之下兩多核苷酸形成雙螺旋核苷酸分子的雜交條件。此等條件為現(xiàn)有技術(shù)所知悉者且見于例如,Sambrook et al.,Molecular Cloning,Cold SpringHarbour Laboratory(1989),ISBN 0-87969-309-6之中。嚴格雜交條件的例子包括(1)在4×SSC內(nèi)于65℃之下或(2)在50%甲酰胺于4×SSC中42℃之下,兩者都于其后接著進行在0.1×SSC內(nèi)于65℃之下1小時的洗滌步驟。
“病毒載體”或“細菌載體”一詞如本文中所用者指的是經(jīng)遺傳修飾的病毒或細菌,其可用來將SEQ ID NO1,2或3的DNA序列或其衍生物,片段,或其編碼表位或表位串的序列導(dǎo)到不同的細胞,較佳者抗原呈遞細胞,例如樹突狀細胞(dendritic cell)之內(nèi)。此外,細菌載體可以適當?shù)赜脕碇苯颖磉_由SEQ ID NO1,2或3所編碼的多肽或由其衍生的表位或表位串。
本發(fā)明的一方面涉及在SEQ ID NO1,SEQ ID NO2或SEQ IDNO3中所示的核苷酸序列。為了收集所需的有關(guān)代表性和實質(zhì)完全長度病毒基因組的資訊,首先對中國境內(nèi)超過100個HIV-1亞型C血清陽性靜脈內(nèi)毒品使用者(IDUs)進行分子流行病學(xué)研究,對于在病毒包膜糖蛋白基因內(nèi)的固定區(qū)2和可變區(qū)3(C2V3)進行的基因定型(genotyping)揭露出在整個中國境內(nèi)最普遍流傳的病毒株相對于印度來源的亞型C序列有最高的同源性(homology)。根據(jù)此等結(jié)果,從選出的經(jīng)HIV感染IDU的周圍血液單核細胞(PBMCs)擴增與亞克隆實質(zhì)完整長度代表在整個中國境內(nèi)最普遍流傳的進化枝C病毒株的基因組。序列分析鑒定出一鑲嵌性構(gòu)造,其可推斷出在該地理區(qū)域內(nèi)普及性進化枝C與(B’)-亞型Thai病毒株的基因組之間有廣泛的亞型間重組事件。RIP(重組檢定程序)分析與分類學(xué)相生推斷總共有10個斷點(i)在gagpol編碼區(qū)內(nèi),(ii)在vpr內(nèi)與在vpu基因的3’端以及(iii)在nef開放讀框之內(nèi)。Thai(B)-序列因而包括(i)在gagpol編碼區(qū)內(nèi)的數(shù)個插入(核苷酸478-620,1290-1830,2221-2520,各分別相對于在gag起始密碼子與gagpol讀框內(nèi)的第一個核苷酸),(ii)在3’-vpr,完整的vpu,tat和rev的第一個外顯子(從相對于Vpr讀框的起始密碼子的核苷酸138起算的約1000個核苷酸)以及(iii)nef基因的5’半部(核苷酸1-300)。在包括9078個核苷酸的序列(SEQ IDNO1,表3)之內(nèi)的其余諸部份顯示出對已知亞型C分離物的最高同源性。位于97cn54中的vpr/vpu編碼區(qū)內(nèi)以及在nef基因內(nèi)的諸斷點經(jīng)發(fā)現(xiàn)也出現(xiàn)于從往在中國境內(nèi)不同地區(qū)的IDUs分離出的許多亞型C病毒株的類似位置上,由此可以推測C/B’重組株有一個共同的始祖。有超過50%在Gap和Pol內(nèi)的明確亞型B-衍生CTL表位與10%在Env內(nèi)的已知表位經(jīng)發(fā)現(xiàn)可以與在此進化枝C/B’嵌合型參比株內(nèi)的多個序列正確地匹配。這些結(jié)果可以經(jīng)由對疫苗設(shè)計提供高度相關(guān)性模板(templates)與開發(fā)出為最恰當?shù)拿庖邔W(xué)/病毒學(xué)請出資料所用藥劑而實質(zhì)地幫助在中國境內(nèi)的疫苗相關(guān)性努力。
上文所說明的代表最普及的中國C型病毒株的本發(fā)明HIV-1序列作為基礎(chǔ)與來源的用途有利于預(yù)防性與治療性疫苗的開發(fā)。對于成功的HIV候選疫苗的開發(fā)所需的結(jié)果為(i)對于個別流行病學(xué)情勢的詳細知識與(ii)代表在一地理區(qū)域內(nèi)或獨特的人群中最普及病毒株的克隆編碼序列的可取得性。此等序列代表著作為下列的基礎(chǔ)(i)在預(yù)防上與治療上可以應(yīng)用的HIV候選疫苗的合理設(shè)計,(ii)特異性治療醫(yī)藥品的開發(fā),例如治療有效的誘餌寡核苷酸和蛋白質(zhì),反義構(gòu)建體(antisense constructs),核糖體和反式顯性陰性效應(yīng)突變體(transdominant negative effective mutants),(iii)基因療法所用慢病毒載體之開發(fā),與(iv)可以用來診斷或監(jiān)測HIV感染及用于免疫學(xué)/病毒學(xué)監(jiān)測疫苗處理過程的藥劑的制造。
此點對于以HIV包膜蛋白質(zhì)為基礎(chǔ)的候選疫苗特別正確,該等HIV包膜蛋白質(zhì)業(yè)經(jīng)證實為在所有HIV蛋白質(zhì)中最具可變異性者。除此之外,一種成功的疫苗必須誘發(fā)免疫系統(tǒng)的最可能兩種分支中和抗體,其理想上是針對包膜蛋白質(zhì)中的構(gòu)象表位,以及細胞介導(dǎo)的免疫反應(yīng)(CD4陽性T-輔助細胞,CD8陽性細胞溶解性T-細胞,Th1型細胞因子,β-趨化因子(chemokines)),其是針對不同病毒蛋白質(zhì)的表位而產(chǎn)生的。根據(jù)本發(fā)明的構(gòu)象表位包括涉及抗體結(jié)合作用的至少3個氨基酸且可能為5或更多個氨基酸。構(gòu)象表位也可以包括數(shù)個節(jié)段,其可能為單一蛋白質(zhì)的節(jié)段或在低聚物復(fù)合物例如三聚物型糖蛋白包膜復(fù)合物的情況中為數(shù)個具有不同亞單位的節(jié)段。根據(jù)本發(fā)明一線型表位在長度上的變異通常為包括至少8個氨基酸到約15個氨基酸或更長者,較佳者包括9到11個氨基酸,特別是在MHC第I類限制CTL表位的情況中。
因此,本發(fā)明更有涉及SEQ ID NO1,2或3的核酸序列或其片段或衍生物所編碼的多肽。本發(fā)明更涉及SEQ ID NO1,2或3的核酸序列或其片段或衍生物所編碼的包括至少8個氨基酸的連續(xù)序列。較佳者本發(fā)明多肽包括一可自然地引起感染患者內(nèi)免疫反應(yīng)的抗原決定簇。更佳者為包括SEQ ID NO2或3的核酸序列或其片段或衍生物所編碼的氨基酸序列。最佳者為表位,其包括一相同于SEQ ID NO1所編碼的多肽與-HIV-1LAI參比分析物的具有9到11個氨基酸的連續(xù)區(qū),或其為包括在該有9到11個氨基酸的序列內(nèi)的2或更少個保守性氨基酸取代者。本發(fā)明多肽可以用為例如疫苗和治療性物質(zhì)或診斷用物質(zhì)。
本發(fā)明的另一方面涉及SEQ ID NO1,2或3的多核苷酸。本發(fā)明更涉及一種具有SEQ ID NO1,2或3的核苷酸序列的多核苷酸片段或涉及一種包括至少一個能夠選擇性地雜交到如SEQ IDNO1,2或3所示核苷酸序列的連續(xù)核苷酸序列。再者,本發(fā)明也涉及本發(fā)明多核苷酸的衍生物或多核苷酸片段。較佳者該多核苷酸或多核苷酸片段包括一有至少9個核苷酸,較佳者至少15個核苷酸,更佳者至少27個核苷酸或更長者的連續(xù)序列。該多核苷酸或多核苷酸片段也可以包括單一HIV基因的編碼區(qū),例如gag,pol,env。其例子為在SEQ ID NO2和SEQ ID NO3中所列出者。本發(fā)明的另一方面涉及一種多核苷酸,其包括至少兩個本發(fā)明多核苷酸片段,其中該等多核苷酸片段可以重疊或可由一核苷酸序列間隔段所分隔。該等多核苷酸片段的序列可相同或相異。本發(fā)明多核苷酸或多核苷酸片段可以用為疫苗或治療性物質(zhì)或診斷用物質(zhì)。
克隆的SEQ ID NO1的進化枝C HIV-1 97cn54編碼序列和其衍生物可以用為下列應(yīng)用的基礎(chǔ)供治療與預(yù)防目的所用的進化枝-C特異性HIV-1疫苗之開發(fā)。此等進化枝特異性疫苗可以在全世界所有地理區(qū)中使用,于該等區(qū)域中該進化枝C病毒株在HIV流行病中扮有主要角色,例如在拉丁美洲,非洲以及亞洲境內(nèi)。更特定言之,要針對東南亞和中國進行試驗且開發(fā)出的HIV疫苗應(yīng)該以上文所說明的97cn54編碼序列為基礎(chǔ)以期誘導(dǎo)出亞型特異性體液與細胞介導(dǎo)的免疫反應(yīng)。再者,此等進化枝-C特異性HIV-1疫苗可以在考慮所有的或明確選定的全世界性相關(guān)HIV亞型之下用作混合疫苗的成分。
要輸送到免疫系統(tǒng)的抗原或編碼序列包括(i)從表3中所列出的諸開放讀框中之一者衍生的有至少3個到約5個氨基酸的連續(xù)段或更長的連續(xù)段,(ii)具有較佳者9到11個氨基酸的連續(xù)段,(iii)以分開的方式或以多肽串形式(表位串)輸送的此等連續(xù)段的組合,其中該表位串與彼等的氨基酸序列分別地可以重疊或可用氨基酸或其他間隔段予以分隔,且最佳者完整的蛋白質(zhì)或?qū)?yīng)的編碼序列或其變異體,彼等也可以包括延伸的刪除(deletion)以期在接受疫苗者體內(nèi)誘導(dǎo)出恰當?shù)捏w液與細胞介導(dǎo)的免疫反應(yīng)。因此之故,本發(fā)明的另一個目的涉及SEQ ID NO1,SEQ ID NO2和SEQ ID NO3中所示核苷酸序列或其片段所編碼的多肽。較佳者,該多肽包括具有至少8個氨基酸,較佳者至少9到11氨基酸,更佳者至少15個氨基酸或更長序列的連續(xù)序列,或較佳者,包括單一多肽鏈的至少3個氨基酸的不連續(xù)表位或于低聚物蛋白質(zhì)的情況中,包括具有不同多肽鏈的復(fù)合物。以91cn54編碼序列為基礎(chǔ)的疫苗構(gòu)建體包括現(xiàn)有技術(shù)中已知的所有抗原形式且包括所有已知的輸送系統(tǒng)。
由SEQ ID NO1到3的核酸序列的片段所編碼且于每一情況中包括3到5個氨基酸,較佳者9到11或更多個氨基酸的短表位可以較佳地以合成方式制成。此等肽包括B細胞表位,第II類MHC限制輔助T細胞表位,第I類MHC限制細胞毒性T細胞表位,或所提變異體的組合。具體表位可以重疊或由一間隔段所分隔,其優(yōu)先地包括甘氨酸及/或絲氨酸部份。分支型肽可以根據(jù)現(xiàn)有技術(shù)于合成中產(chǎn)生或在具體肽的合成與純化之后利用已知且為市面上可取得的同元或異元雙官能化學(xué)交聯(lián)劑予以產(chǎn)生。另外,可以將本身為小型的免疫原性肽經(jīng)由交聯(lián)反應(yīng)綴合到所選定的載體蛋白質(zhì)例如卵白蛋白,經(jīng)基因工程方式嵌入到載體蛋白質(zhì)之內(nèi)或分別融合到彼等的N端和C端。較佳者,此等載體蛋白質(zhì)都能夠形成特別的構(gòu)造,其中(i)于適當?shù)募毎囵B(yǎng)系統(tǒng)內(nèi)進行表達的過程中(參看下文)或(ii)在經(jīng)純化變性的蛋白質(zhì)的適當回折之后,將B細胞表位較佳地安置在該特別載體的表面上。同時,有傾向于形成特別構(gòu)造的多肽的許多例子是已知的,例如B型肝炎病毒(HBV)核心抗原(HBcAg),HBV表面抗原(HBsAg),HIV組特異性抗原,多瘤病毒VP1蛋白,乳頭狀瘤病毒L1蛋白,或酵母IA蛋白。由于大部份到目前為止所提及的粒子形成性蛋白質(zhì)都是從不同病毒的衣殼或結(jié)構(gòu)蛋白質(zhì)衍生的,因此彼等也稱為似病毒粒子;可參看特別版的Vaccine.(1999),Vol.18,Advances in,Proteln and Nuddc Acid VaccineStrategies.Edhed by Pof.P.T.P.Kauvama。
由SEQ ID NO1到3的核酸序列的片段所編碼且具有超過30,較佳者超過50個氨基酸的表位串和多肽,及具有形成粒狀結(jié)構(gòu)(VLP)的傾向的多肽可以使用現(xiàn)有技術(shù)中已知的手段在原核生物體內(nèi)制造與純化。該等質(zhì)粒因而包括細菌復(fù)制源例如ColEl,通用的選擇標志例如對康那霉素(kanamycin)或氨芐青霉素(ampicillin)的抗性,組成型活性或可誘導(dǎo)性轉(zhuǎn)錄控制單元例如LacZ或Tac啟動子,以及轉(zhuǎn)譯起始和終止信號。對于經(jīng)簡化的表達和親和性純化,可以視情況使用可分離的融合部份與純化工具例如谷胱甘肽-S-轉(zhuǎn)移酶或低聚組氨酸標簽(tag)。
(i)在真核生物細胞培養(yǎng)物例如酵母細胞、真菌、昆蟲細胞或哺乳動物細胞內(nèi)制造該等表位串,完全蛋白質(zhì)或似病毒粒子結(jié)構(gòu)體,或(ii)為了免疫化目的直接輸送DNA,等所使用的DNA或RNA可以依賴病毒本身所利用的密碼子用法。另外,在技術(shù)上可行的任何情況中可以將該密碼子用法調(diào)整成適用于在個別制造系統(tǒng)內(nèi)高度表達的基因內(nèi)最常或次最常使用的密碼子。在為了保險措施經(jīng)最佳化的多基因內(nèi)使用的密碼子最佳化的例子包括Gag,Pol和Nef等基因以及包膜基因都列于SEQ ID NO2和3之中。該SEQ ID NO2和3在實施例15中有更特別的說明。
建立細胞系以在所提細胞培養(yǎng)系統(tǒng)內(nèi)生產(chǎn)表位串,多肽或似病毒粒子結(jié)構(gòu)體可以使用現(xiàn)有技術(shù)的載體(vector)為基礎(chǔ)。該等載體同樣地可以包括細菌復(fù)制源點,陽性或陰性選擇標志及主要的外來蛋白質(zhì)的正常轉(zhuǎn)錄和轉(zhuǎn)譯所用的具體控制區(qū)。后面所說明的DNA疫苗構(gòu)建體所含成分也代表出現(xiàn)在載體內(nèi)用以在不同的哺乳動物細胞培養(yǎng)物內(nèi)表達表位串,多肽或完全蛋白質(zhì)的模組。
最簡單的免疫化形式為純DNA疫苗的直接應(yīng)用。該疫苗基本上包括編碼區(qū)的5’,一轉(zhuǎn)錄控制區(qū)也稱為啟動子/增強子(promoter/enhancer)區(qū),視情況后面接著功能插入序列以增強基因表達,(ii)一Kozak共有序列包括一轉(zhuǎn)譯起始密碼子以及一轉(zhuǎn)譯終止密碼子后面接著一在該外來基因3’端的聚腺苷酸化信號。較佳者,該啟動子/增強子區(qū)可以支持所欲基因產(chǎn)物的組成性表達且為衍生自巨細胞病毒立即早期基因(immediate early gene)(CMV-IE)或羅氏肉瘤病毒長末端重復(fù)體(RSV-LTV)。另外,可以使可誘導(dǎo)形式的轉(zhuǎn)錄控制區(qū)例如經(jīng)由例如應(yīng)用四環(huán)素或類似物來調(diào)節(jié)轉(zhuǎn)錄的Teton/Tet off啟動子。再者,有利者為使用細胞類型特異性調(diào)節(jié)轉(zhuǎn)錄控制區(qū)例如肌肉肌酸激酶基因(MCK基因;肌肉特異性表達)或CD4受體基因的上游區(qū),或在第II類MHC基因(在抗原呈遞細胞中優(yōu)先表達)配置的啟動子/增強子區(qū)。于某些情況中,也使用來自(i)細胞類型特異性啟動子與(ii)病毒增強子區(qū)的嵌合型組合間組織特異性表達與病毒增強子所具強轉(zhuǎn)錄活性等多項優(yōu)點組合在一起。經(jīng)由整合入通常配置在一開放讀框5’端的功能性插入序列所達到的基因表達的增強是因為從經(jīng)剪接轉(zhuǎn)錄本的核所得相對于未經(jīng)剪接者較增強的輸出速率且是經(jīng)由嵌置在一經(jīng)配置在β-球蛋白基因之內(nèi)的插入序列而得到。
以SEQ ID NO1,2或3為基礎(chǔ)的交佳DNA疫苗也另外包括一源自α病毒類例如西門利克森林α病毒(SFV)或委內(nèi)瑞拉腦炎病毒(VEE)的復(fù)制子(replicon)。此處,前面提及的核轉(zhuǎn)錄控制區(qū)與視情況考慮到的插入序列后面先接著該VEE或SFV非結(jié)構(gòu)蛋白質(zhì)(NS)的編碼區(qū)。只有其3’端才接著實際的外來基因,該外來基因的細胞質(zhì)內(nèi)轉(zhuǎn)錄是由NS敏感性啟動子所調(diào)節(jié)。相應(yīng)地,產(chǎn)生一從核轉(zhuǎn)錄控制單元起始的跨過數(shù)個開放讀框的長轉(zhuǎn)錄本,其接著轉(zhuǎn)位到細胞質(zhì)內(nèi)。于此處合成的NS蛋白質(zhì)隨即經(jīng)由結(jié)合到相應(yīng)的控制區(qū)而活化該等外來基因的細胞質(zhì)內(nèi)轉(zhuǎn)錄。此種擴增處理通常會導(dǎo)致豐富的RNA合成且因而導(dǎo)致該外來蛋白質(zhì)的高合成速率。與放棄上述細胞質(zhì)內(nèi)RNA擴增的效應(yīng)的傳統(tǒng)質(zhì)粒直接相比,于至少可相比擬的免疫原性之下,后者通常可以促成要施用的質(zhì)粒用量的明顯減少。
前述肽、蛋白質(zhì)、似病毒粒子和DNA構(gòu)建體可以經(jīng)由肌肉內(nèi)、皮下、皮內(nèi)、靜脈內(nèi)注射來施用,其中可以使用個別的先前技術(shù)來施用蛋白質(zhì)抗原。對于DNA免疫,可以使用帶有注射針頭的傳統(tǒng)注射針筒,或者使用沒有注射針頭者而通常為利用空氣壓力將DNA直接導(dǎo)到合意的組織之內(nèi)。此舉也特別包括利用噴霧工具將含有DNA的疫苗調(diào)配物經(jīng)鼻內(nèi)和經(jīng)口施用者。另外,也可以將DNA拼合到固體支持物例如金珠粒上且通過空氣壓力施用到組織之內(nèi)。
為了增強或調(diào)制免疫反應(yīng),可以將前述蛋白質(zhì)抗原和DNA構(gòu)建體與通常為免疫反應(yīng)刺激劑的所謂佐劑組合施用或按順序施用。傳統(tǒng)佐劑例如氫氧化鋁或羥基磷酸鋁,可以導(dǎo)致體液免疫反應(yīng)的刺激顯示出IgG1亞型的高抗體滴定度。更現(xiàn)代的佐劑例如CpG寡核苷酸(共有核心序列嘌呤-嘌呤-CpG-嘧啶-嘧啶)或其經(jīng)化學(xué)修飾的衍生物(硫代磷酸寡核苷酸,具有肽主鏈的寡核苷酸)通??稍鰪娂毎械拿庖叻磻?yīng)且主要支援Thl型的細胞介導(dǎo)的免疫性,其具有下列特征高IgG2a亞型的抗體滴度及誘導(dǎo)Thl細胞因子例如γ-IFN,IL-2和IL-12。
前述肽、蛋白質(zhì)、似病毒粒子和DNA構(gòu)建體的施用和攝取可以經(jīng)由結(jié)合到較高分子結(jié)構(gòu)物上或摻加到較高分子結(jié)構(gòu)物之內(nèi)而獲得特別地改良,該較高分子結(jié)構(gòu)物的例子為生物可降解性粒子,多層狀物(multilamellar),較佳者陽離子性微脂粒,免疫刺激性復(fù)合物(ISCOMS),病毒脂蛋白體(virosomes)或在體外(invitro)組裝的病毒粒子。該等生物可降解性粒子有例如PLA-(L-乳酸),PGA-(聚乙醇酸)或PLGA-[聚(D,L-乳交酯-共聚-乙交酯)]微球體或其衍生物,陽離子性微粒子或衍生自細菌多糖莢膜的載體物質(zhì)。集合名詞ISCOMS是指稱從石鹼樹(Quillajia saponaria)的樹皮所得水溶性萃取物衍生出且經(jīng)層析法醇化過的免疫刺激性復(fù)合物。有關(guān)各種佐劑與給藥手段的先前技術(shù)詳細摘要見于http//www.niaid.gov/aidsvaccine/pdf/compendium/pdf[Vogel,F(xiàn).R.,Powell,M.F.andAlving,C.R.,A Compendium of Vaccine Adjuvants andExcipients(2ndEdition)]。
再者,也可以使用病毒載體或細菌載體來適當?shù)爻蔬f表位串,多肽和似病毒粒子。
根據(jù)現(xiàn)有技術(shù)狀態(tài),例如經(jīng)遺傳修飾的沙門氏菌與李斯特氏菌(listeriae),因為彼等所具有的天然細胞向性(cell tropism)可以將DNA疫苗構(gòu)建體導(dǎo)到抗原呈遞細胞例如單核細胞,巨噬細胞和主要的樹突狀細胞之內(nèi)而為可較佳地使用者。除了細胞類型特異性的效益之外,遺傳修飾可以達成下述事實,亦即DNA可以無損壞地進入抗原呈遞細胞的細胞質(zhì)之內(nèi)。于此種情況的中,DNA疫苗構(gòu)建體可進入細胞核內(nèi)而于該處讀框可通過真核生物型、較佳者病毒型或細胞型特異性啟動子使用細胞資源和蛋白質(zhì)進行轉(zhuǎn)錄。在RNA輸送到細胞質(zhì)之內(nèi)后即轉(zhuǎn)譯出相應(yīng)的基因產(chǎn)物,且根據(jù)個別狀況進行轉(zhuǎn)譯后的修飾并分配到相應(yīng)的細胞區(qū)室之內(nèi)。
也可以使用細菌載體(沙門氏菌、李斯特氏菌、耶爾森氏菌(yersiniae)等)來誘導(dǎo)出粘膜免疫性,較佳者是在口服之后。藉此經(jīng)由細菌的轉(zhuǎn)錄和轉(zhuǎn)譯機制產(chǎn)生相應(yīng)的抗原,因而不會發(fā)生通常存在于喃乳動物細胞內(nèi)的轉(zhuǎn)譯后修飾(沒有相應(yīng)的糖基化;沒有分泌途徑)。
此外,到目前為止已經(jīng)有眾多經(jīng)減毒的病毒載體,彼等可以成功地以高產(chǎn)率地幫助合意抗原的表達。此等病毒載體除了彼等所具有的唯一抗原產(chǎn)生能力之外,可以直接用于免疫化。該產(chǎn)生可先在體外(ex vivo)進行例如用于在給疫苗接受者服用之后將抗原呈遞細胞感染的情況,或者直接在體內(nèi)(in vivo)使用重組病毒經(jīng)由皮下、透皮、皮內(nèi)、肌肉內(nèi)或鼻內(nèi)免疫化導(dǎo)致隨著個別免疫化成功的有益抗原呈現(xiàn)。如此,可以經(jīng)由使用重組疫苗病毒例如經(jīng)由通過雞細胞予以減毒的修飾安卡拉牛痘病毒(Modified VacciniaAncararirus)(MVA),經(jīng)遺傳減毒的紐約型牛痘(NYVAC)或鳥類地方性禽痘病毒類(禽痘病毒(Fowlpox),金絲雀痘病毒(Canarypox))。另外,有數(shù)種其他病毒也經(jīng)鑒定過例如重組α病毒類例如西門利克森林α病毒或委內(nèi)瑞拉腦炎病毒,重組腺病毒類,重組單純庖疹病毒類,流感病毒類等。
最后,若根據(jù)先前技術(shù)經(jīng)由克隆方法補充側(cè)接在密碼部份的調(diào)節(jié)性序列(LTR,長末端重復(fù)體)時,也可以根據(jù)SEQ ID NO1,2或3產(chǎn)生經(jīng)減毒的HIV病毒且用于免疫目的。隨后也可以根據(jù)先前技術(shù)在例如nef基因中施以一或多個刪除而得到充分的減毒。在SEQ ID NO1和3中所顯示出的核酸序列以及從其所衍生的肽、蛋白質(zhì)和似病毒粒子也可以用為基因轉(zhuǎn)移所用病毒載體所含的成分。
由GagPol基因(SEQ ID NO1,核甘酸177-4458;表3)所編碼的多肽可以對例如短病毒或反轉(zhuǎn)錄病毒提供例如包裝和受體功能。也可以產(chǎn)生病毒粒子,其可以往例如使用可同時支援GagPol和VSV-G(水庖性口炎病毒包膜蛋白)基因的表達且確保治療性轉(zhuǎn)殖基因(transgene)的包裝的適當質(zhì)粒載體將哺乳動物細胞短暫轉(zhuǎn)染之后,用來轉(zhuǎn)導(dǎo)休眠期有絲分裂后的細胞或經(jīng)最后分化的細胞。該用來產(chǎn)生專導(dǎo)勝任性病毒粒子所用的方法可以通過例如根據(jù)例如人類胚胎腎細胞(HEK293)建立可以組成,性地(constitutively)或在誘導(dǎo)性啟動子的控制下表達GagPol多蛋白的穩(wěn)定細胞是獲得明顯地幫助且可有效率地成形。另外,可以產(chǎn)生重組型腺病毒,其包括包裝功,受體功能和轉(zhuǎn)殖基因功能或彼等的組合且因而可作為一工具用來進行反轉(zhuǎn)錄病毒載體或短病毒載體的活體外,原位(in situ)和活體內(nèi)輸送。
由SEQ ID NO3所編碼的背末蛋白質(zhì)或其衍生物可以經(jīng)由摻加到脂質(zhì)雙層而提供受體功能給短病毒載體,泡沫病毒(spumavirus)載體或反轉(zhuǎn)錄病毒載體或以包被病毒(coated virus)為基礎(chǔ)的其他載體。對于此種目的而言,可以產(chǎn)生例如包裝細胞系,其可以組成性地,或在誘導(dǎo)性,或取代地,可調(diào)節(jié)性啟動子的控制,表達來自反轉(zhuǎn)錄病毒,泡沫病毒和較佳者短病毒GagPol蛋白以及衍生處SEQID NO3的包膜蛋白質(zhì)。另外,可以產(chǎn)生以C型或D型反轉(zhuǎn)錄病毒或其他膜被覆病毒例如流感病毒或庖疹病毒的基因組為基礎(chǔ)的嵌合型病毒,其在表面上載有針對天熱發(fā)生的包膜蛋白質(zhì),加添地或取而代之地,一衍生自SEQ ID NO1或3的包膜蛋白質(zhì)。
針對SEQ ID NO1至3衍生的肽、蛋白質(zhì)或似病毒粒子,可以產(chǎn)生(i)多株抗體血清,(ii)單株抗體(鼠類,人類,駱駝),(iii)抗體行衍生物價例如單鏈抗體,人類化抗體,雙-特異性抗體,抗體噬菌體庫或(iv)其他高親和性結(jié)合性多肽例如hPSTI(人類胰分泌胰蛋白醣抑制劑)。該等藥劑可以用于治療目的例如治療HIV感染,或用于診斷目的例如用于檢驗套劑的制造。
類似地,SEQ ID NO1,2或3衍生的類似肽、蛋白質(zhì)或核酸序列可以應(yīng)用核酸雜交技術(shù),采用核酸擴增系統(tǒng)或彼等的組合用于診斷目的例如用于血清診斷。較佳者,根據(jù)本發(fā)明,依照SEQ ID NO1核甘酸序列的多核苷酸片段可以用于聚合酶鏈型反應(yīng)之中。特別較佳者為根據(jù)本發(fā)明,依照SEQ ID NO1核甘酸序列的多核苷酸片段經(jīng)由利用DNA晶片技術(shù)作為診斷劑的用途。
本發(fā)明要用下列實施例予以示范說明但非予以限制。
實施例實施例1.血液樣品。本研究中所使用的所有血液樣品都是在1996-1997年期間于中國境內(nèi)數(shù)個HIV流行地區(qū)進行全國分子流行病學(xué)調(diào)查中從HIV-1亞型C血清陽性的注射藥物使用者(IDUs)收集到者。以發(fā)克梯度(ficoll gradient)分離出周圍血液單核細胞(PBMC)。經(jīng)由將得自血清陽性IDUs的PBMCs與經(jīng)用植物血球凝集素(phytohemagglutinin)(PHA)刺激過的捐血者的PBMCs共同培養(yǎng)以分離出病毒。使用HIV-1 p24 Core Profile ELISA套劑(DuPontInc.,Boston,MA)從細胞上澄液偵檢出陽性病毒培養(yǎng)物。
實施例2.聚合醣鏈型反應(yīng)和DNA定序。從超過100個來自中國西北省份預(yù)先選定的HIV-1陽性IDUs經(jīng)有成果地感染過的PBMCs萃取出前病毒DNA(provirus DNA)(Qiagen Inc.,Valencia,CA)。使用套試PCR(nesied PCR)來擴增包膜C2V3編碼區(qū)。使用螢光染料—標記終止序列(terminators)(Applied Biosystems,373A-Fosier Ciiy,CA)按先前技術(shù)所述(Bai et al.1997;Yu et al.,1997)以Taq-循環(huán)定序法(Taq-cycle sequencing)將PCR產(chǎn)物直接定序。經(jīng)由應(yīng)用威斯康辛套裝軟體Genetics Computer Group加上Kimura的校正法(GCG,1997,第9版)進行多重序列排比。
實施例3.使用PHYLIP套裝軟體進行所有所得序列的分類學(xué)樹分析。以最大節(jié)省法(maximum parsimony method)計算進化距離并用累積水平分校長度予以指示出。按先前技術(shù)所述(Graf etal.1998)以相生重取樣方式(bootstrap resampling)試驗鄰域連接法的統(tǒng)計穩(wěn)健性。
實施例4.從中國IDUs選擇出代表性C-進化枝HIV-1分離物。經(jīng)計算出的在C2V3編碼區(qū)內(nèi)的平均組內(nèi)距離于DNA層次上低到2.26±1,43,顯示比在此地區(qū)內(nèi)的流行病仍然非常的早期。在中國進化枝C序列與來自印度,非洲和南美洲來源的序列之間的組間差異分別為9.67±2.31(印度),15.02±4.13非洲與8.78±3.41(南美)。此種結(jié)果證實在印度與中國進化枝C序列之間有密切的關(guān)系(Lole et al,1999)且對本身相當異源性的非洲進化枝CHIV-1病毒株有一實質(zhì)的遺傳距離。
實施例5.最代表在整個中國境內(nèi)流傳的遍性進化枝C病毒株的病毒分離物的檢定。從分析周的檢體看來,經(jīng)稱為97cn54的代表性分離物經(jīng)鑒定為相對于一經(jīng)計算出之共有序列(cn-conV3)展現(xiàn)出最高同源性(99.6%),此點是經(jīng)由以經(jīng)鑒定過的局部HIV序列為基礎(chǔ)而確定者(表1)。包括從不同流行病區(qū)選巴的原C-進化枝代表物V3-環(huán)圈序列以及其他進化枝(A-,O,CPZ)之共有序列等在內(nèi)的多重氨基酸序列排比強調(diào)出帶有所選原分離物97cn54的亞型C特質(zhì)的(表1)。與整個V3共有序列(共有)比較之下,97cn54以及cn-con-c顯示出在位置13(H→R)和19(A→T)處有氨基酸變更,兩者都是亞型分離物的特性(C共有)。
表1V3-環(huán)圈氨基酸序列排比位置位置 111 21 3138共有 CTRPNNNTRK SIHIGPGQAF YA---TGDII GDIRQAHCC_94IN11246 ---------- --r-----t- -- --e-v -n------C_93IN905---------- --r-----t- -- ----m --------C_93IN999-Vr------e --r-----t- -- --e-- --------C_consensus ---------- --r-----t- --...----- --------C_ind8 ---------- -tr-----t- --...----- --------97cn54-V3----g----- --r-----t- --...----- --------cn-con-V3----g----- --r-----t- --...----- --------C_bro025 ---------- --r------- --...--e-- --------C_ind1024---------- --r-----t- --...----- ----r-y-C_nof---------- r-rv----tv --...-na-- --------C_zam20 -a--g----- --r-----t- f-...--a-- --------C_sm145 ---ya----- -Vr-----t- -....-n--- --------A_consensus ---------- -Vr------- --...----- --------B_consensus ---------- -------r-- -t...--e-- --------D_consensus ----y----q rt-------l -....-tr-- --------E_consensus ----s----t --t-----v- -r...----- ----k-v-F_consensus ---------- ---l------ --...----- ----k---G_consensus ---------- --t------- --...----- --------H_consensus ---------- --s------- --...----- ----k-y-O_consensus -e--gidiqe .-r---.m-w -smglg-tng nss-a-y-表1得自不同HIV-1進化枝(A-O)之共有序列與所選來自不同國家的亞型C分離物的V3氨基酸排比。完整V3共有序列是經(jīng)由將得自不同進化枝(A-O)之共有序列排比而構(gòu)成者,Cn-con-V3代表在中國境內(nèi)普及的HIV-1亞型C病毒株之共有序列。97cn54是經(jīng)選擇為在中國境內(nèi)流傳的最遍性進化枝CHIV-1病毒株的標準代表性分離物?!?”表相對于V3-共有序列沒有改變,小寫字母表氨基酸取代且“-”表間隙。多重排比所用的所有共有序列和分離物序列都得自Los Akamos數(shù)據(jù)庫。
實施例6.97cn54包膜蛋白編碼序列對于印度進化枝C病毒株有最密切的關(guān)聯(lián)。以包膜蛋白的C2V3序列為起始基礎(chǔ)的分類學(xué)樹分析揭露出97cn54以及中國進化枝C分離物兩者對群集到來自印度(ind8,d1024,c-95in025,c--93in999,c-93in11246),非洲(c-eth2220,c-ug286a2)和南美(92br025,nof,cam20,和sm145)的亞型C病毒株。此結(jié)果可推測印度C-進化枝病毒株可能為在中國境內(nèi)流行的HIV-1亞型C的來源(第1圖)。此種假說也與我們早期的流行病學(xué)參考文獻相符合,其中確定在云南省內(nèi)的HIV-1亞型C感染個體與在邊界地區(qū)的印度珠責(zé)生意人共用針頭(Shao etal,1999)。
實施例7.幾乎完整長度HIV-1基因組的克隆。幾乎完整長度HIV-1基因組是按先前技術(shù)所述(Grafet al.1998;Salminen et al.,1995)經(jīng)由使用the Expand Long Template PCR系統(tǒng)予以擴增(Boehringer-Mannheim,Mannheim,Germany)。引子(primers)是位于HIV-1長端重復(fù)體(LTR)內(nèi)的保守區(qū)中TBS-A1(5’-ATC TCT AGC AGT GGC GGC GGA A)和NP-(5’-GCA CTCAAG GCA AGC TTT ATT G)。將經(jīng)純化的PCR-片段鈍端連接到一經(jīng)SrfI消化過的pCR-Script載體中(Stratagene,Heidelberg,Germany)并轉(zhuǎn)形到大腸桿菌(E.coli)菌株DH5α之內(nèi)。經(jīng)由限制片段長度多形性(RFLP)分析及將V3-環(huán)圈編碼序列定序分析而鑒定出數(shù)個含有幾乎完整長度HIV-1基因組的重組殖株。根據(jù)RFLP分析,于使用不同的限制核酸內(nèi)切酶的組合,接著將V3-環(huán)圈編碼序列定序分析,得知有77%陽性完整長度構(gòu)建體接近于相同。按照上述所述使用引子-走引法(primer-walking approach)對代表廣多種陽性殖株的前病毒構(gòu)建體進行選擇與定序(引子是沿著兩股基因組上每約300bp而設(shè)計)。
實施例8.使用Lasergene Software(DNASTAR,Inc.,Madison,WI)在Macintosh電腦上匯編DNA序列。所有在此研究中使用的參比亞型序列都得自Los Akamos HIV數(shù)據(jù)庫。核苷酸序列類似率是經(jīng)由Smiih和Waterman的局部同源性算法予以計算出。與可取得的其他亞型序列數(shù)據(jù)的多重序列排恍是使用威斯康辛套裝軟體GeneticsComputer Group(GCG,1997,第9版)進行。
實施例9.97cn54編碼序列的整體結(jié)構(gòu)。衍生自分離物97cn54的9078bp基因組序列含有HIV-1基因組的所有已知的結(jié)構(gòu)基因和調(diào)節(jié)基因。沒有發(fā)現(xiàn)有重大的刪除、嵌入或重排。經(jīng)由將97cn54的所有編碼序列(CDS)與不同基因型之共有序列和所選亞型分離物(表刀相比較而探討出核苷酸序列類似率。gag、pol、env和vif請碼相對于對應(yīng)的進化枝-C共有序列的簸高同源性都在93.93%-95.06%的范圍內(nèi)。此種觀察結(jié)果顯著地擴展上述以C2V3為基礎(chǔ)的序列比較與分類學(xué)樹分析(參看表1和
圖1)且因而清楚地確定所選擇巴的病毒分離物對于先前公開的C-進化枝病毒株的歸屬。不過,由此類分析對對tat、vpu、vpr和nef等基因所測定出的同源性仍不足以促成此等讀框?qū)τ谶M化枝-B或C病毒株的清楚指定(表2)。對于vpu基因而言,相對于進化枝-B有最高同源性(94.24%),比較之下對于進化枝-C共有序列只有78.23%。對于tat基因也得到類似的觀察結(jié)果,對B,-r142分離物有最高同源性(>91%),而對所選巴的元C-進化枝代表物為85.5%(C-eth2220)或?qū)M化枝-C共有序列有89.01%。這些數(shù)據(jù)加上B、C和E基因型在整個云南省流行病地區(qū)內(nèi)的巴現(xiàn)事實可以推測出所分析的病毒可能代表從B’/C進化枝間重組事件所得的鑲嵌型病毒株。
表2.97cn54衍生的編碼序列與參比病毒株的相應(yīng)基因和進化枝特異性共有序列的比較對97cn54的相同百分率CDS gag pol vif vpr tat rev vpu env nefA 87.6891.80 86.8183.66 84.9083.97 79.82 85.75 84.19B 90.4391.93 88.0490.31 86.5682.08 94.24 84.52 88.13B-mn 89.3890.82 86.0189.31 87.4479.48 88.21 82.33 85.41B’-r142 91.5390.76 86.0188.97 91.163 80.23 96.74 82.70 85.99C 94.6594.29 95.0691.39 89.0191.99 78.23 93.93 88.82C-92.1992.91 88.5190.03 87.9189.70 76.13 88.51 86.2092br025C-91.4 92.06 87.1590.77 85.5788.08 80.09 87.15 87.08eth2220D 89.8091.08 87.7487.94 83.9384.39 87.30 85.26 86.88E/A 86.324 89.07 86.5983.39 81.4481.74 77.31 82.09 84.18F 88.0288.99 86.3686.25 80.6586.25 82.33 84.02 /G 88.08/ // // / 84.55 /H 87.6989.45 86.0185.22 // / 83.74 /O 73.4278.02 72.1276.604 72.3176.60 59.54 67.01 80.35CPZ 74.1478.80 93.7575.44 76.0075.44 64.41 72.42 /表2在97cn54與下列諸DNA序列之間的所有編碼序列(CDS)的核苷酸比較(1)諸獨特HIV-1進化枝之共有序列(得自LasAlamos HIV數(shù)聚庫)或(2)標準亞型C(92br025和eth2220)和B(mn和r142)分離物。該數(shù)據(jù)呈現(xiàn)出所給序列對97cn54的相同百分率。在諸共有序列內(nèi)的不明確核苷酸位置經(jīng)計為一匹配。其中將最高同源性以黑體突顯出。/,表示無法從LasA lamos HIV數(shù)聚庫取得共有序列。
實施例10.亞型間重組的測定。使用重組體鑒定程序(RIP,第3.1版;hiip//hiv-web.lanl.gov/tools)來鑒定在此殖株的至長度序列內(nèi)所含的潛在鑲嵌型結(jié)構(gòu)(窗尺寸200,統(tǒng)計意義閾值90%,Gap處置STRIP;Informative modeOFF)。導(dǎo)入間隙以造成對齊。于此分析中的背景亞型序列為u455(亞型A),RL42(中國亞型B-Thai(B)),eth2220(亞型C),z2d2(亞型D),93th2(亞型A/E)。
實施例11.在97cn54的Gag-pol編碼區(qū)內(nèi)的進化枝間重組。雖然在高度保守的gag和pol讀框內(nèi)觀察到對C-進化枝病毒株的實質(zhì)同質(zhì)性,不過RIP分析鑒定出在gagpol內(nèi)在gag起始密碼子上游約在位置478-620,1290-1830和2221-2520處有引固進化枝間重組區(qū)。這些分散開的連續(xù)段是位于顯示出對原型B有最高同賈率且特別是對源自云南省的亞型B(B’)分離物有最高同源性的gag和pol讀框之內(nèi)(位顯示出數(shù)據(jù))(圖2)。這種觀察結(jié)果清楚地強調(diào)RIP分析的重要性,是因為單純的以完全基因為基礎(chǔ)的同質(zhì)性排比部能夠鑒定出這些不同亞型的小分散開的片段之故。為了肯定RIP分析所得數(shù)據(jù),我們使用側(cè)接或跨展所提重組連續(xù)段的諸區(qū)造出數(shù)個分類學(xué)樹(圖3)。使用數(shù)種不同亞型的標準代表物與某些經(jīng)選出的C-進化枝原分離物,可以經(jīng)由97cn54與個別C-進化枝參比分離物(圖3A,3C,3E,3G)或B-進化枝參比分離物(圖3F,3D,3F)進行差式簇集(differential clustering),可以確定出所有經(jīng)提出的重組區(qū)。
實施例12.于97cn54的Env編碼區(qū)內(nèi)的進化枝間重組。如從表2中所摘列出的是列排比所預(yù)期者,RIP分析清楚地確定出在亞型(B’)-Thai與亞型C之間有亞型間重組(圖4)。一段從vpr的3’150bp延伸經(jīng)過tat和rev的第一個外顯子到vpu的約1000bp的片段顯示出與局部亞型(B’)代表物(r142)有最高同源性(圖4A)。再者,一段重疊在nef基因5’-半部的長約300bp的序列連續(xù)段顯示出對(B,)-Thai亞型有最高同源性而其余部份,包括延伸到3’-LTR之一300bp片段則與亞型C簇集(圖4B)。
將RIP分析予以擴大之下,分類學(xué)樹顯示出vpr/vpu和ne基因的5’-部份對進化枝-b分離物有最密切的關(guān)系(圖5A,圖5b),而3’-nef片段則明確地與亞型C代表物簇集(圖5C)。進一部分析確定出在此鑲嵌段內(nèi)的亞型B序列相對于非常最近時所述的分離自中國IDU的Thai-(B,)病毒株(r142)(Graf et al,1998)比相對于原型B分離物(mn和sf2)有更密切的關(guān)聯(lián)(表2)。
實施例13.97cn54的代表性特質(zhì)。在vpr/vpu編碼區(qū)內(nèi)以及在97cn54的nef基因內(nèi)的斷點經(jīng)發(fā)現(xiàn)出現(xiàn)于從生活在中國西北諸省境內(nèi)的IDUs所分離出的所有亞型C病毒株上的幾乎相同位置上。對于8份獨立地從Xinjiang自治區(qū)境內(nèi)的不同HIV-1感染個體所分離出且分析過的HIV-1病毒株所做的兩份RIP分析代表值經(jīng)顯示于圖4C和D之中。有關(guān)97cn54(中國西南部)與xj24和xj25(中國西北地區(qū)))的來源,這些數(shù)據(jù)可以推測出對于流傳在整個中國境內(nèi)的C/B’重組病毒株有一個共同的始祖。總而言之,我們的結(jié)果證實97cn54表一在中國西北省份境內(nèi)的IDUs最為普及的具有10個進化枝間重阻斷點的C/(B’)進化枝間鑲嵌型病毒。圖6為分離物97cn54的(B’/C)擇嵌型基因組的示意性呈現(xiàn)。
實施例14.對HIV特異性細胞溶解性T細胞的跨—進化枝特異性表位的預(yù)測。基因組序列可提供機會來評估可能對HIV-1候選疫苗的效率有影響的以的CTL表位的保守性。對于CTL表位的大部份藥劑與數(shù)據(jù)都是導(dǎo)自進化枝B HIV-1 Lai序列。為了提出對于跨進化枝CTL-表位保守性的評估,將經(jīng)預(yù)測過的97cn54蛋白質(zhì)序列相對于已知且經(jīng)制造過與圖的LAI特異性CTL表位進行比較。于194個報導(dǎo)過的HIV-1 CTL表位中75,55,40和24是分別位于Gagp(g17,p24,p15),反轉(zhuǎn)錄酶(RT),gp120和gp41之中,而在Gag和RT中有幾乎50%或更多的表位是完全相同者,而gp12.0和gp41HIV-1LAI衍生的CTL表位只的5%和17%與預(yù)測的97cn54氨基酸序列正確匹配。不過,在所給CTL表位中允許有多達2個保守性錯配之下,則會有增加的48%(p17),33%(p24),40%(RT),57%(gp120)和33%(g41)部份之以之HIV-1 LAI CTL缺的決定部位與對應(yīng)的97cn54衍生多肽中的序列相關(guān)聯(lián)。當然,后面所述的考慮必須加以某些地小心,因為會有甚至于非保守性改變可能廢止一抗原性肽的HLA-結(jié)合或T-細胞受體辨識之故。無論如何,總而言之,此等觀察結(jié)果清楚地預(yù)測出一顯著的跨—進化枝CTL反應(yīng)性,尤其是有關(guān)功能上與免疫學(xué)上保守的HIV-1蛋白質(zhì)。此外,這些數(shù)據(jù)可推測,有顯著部份的經(jīng)合成且確立用來對進化枝B CTL表位進行與圖繪制與示性的藥劑(肽、疫苗病毒構(gòu)建體)也可以用來以進化枝C HIV序列為基礎(chǔ)而測定CTL反應(yīng)性。
表3.97cn54編碼序列的讀框(reading frame)
其編碼是參照SEQ ID NO1中所示DNA序列的5’端。
實施例15.(A)合成C54gp160編碼區(qū)C-gp160的描述。將C-gp120基因克隆到pCR-Sctipt cmp(+)克隆載體(Stratagene,GenbankAccessionU46017)的獨特KpnI/SacI限制部位內(nèi)。經(jīng)密碼子-最佳化以高表達哺乳動物基因的合成C54gp160編碼區(qū)是列于SEQ ID NO3之中者。合成信號序列包括一傳輸信號用以將所編碼的多肽輸入到內(nèi)質(zhì)網(wǎng)之內(nèi)。
不同編碼區(qū)的位置為如下所列者
(B)合成C54gagpolnef序列C-gpnef的描述。將C-gpnef基因克隆到pCR-Scriptamp(+)克隆載體(Stratagene)的獨特KpnI/SacI限制部全內(nèi)。經(jīng)密碼子優(yōu)化以高表達哺乳動物基因的合成C54nagpolnef序列是列SEQ ID NO2之中者。于本構(gòu)建體之中,N端甘氨酸是經(jīng)為丙氨酸(核苷酸序列GGC)以防止將多肽目標導(dǎo)引到細胞質(zhì)膜及隨后的將經(jīng)裝配好的似病毒粒子的通過出芽(budding)而分泌出。同時,將一(-1)移碼(frame shift)導(dǎo)到天然移碼序列之內(nèi)以保證從Gag強制讀經(jīng)核醣體進入Pol編閱架構(gòu)之內(nèi),且因而保證GagPolNef多蛋白的合成。
不同編碼區(qū)的位置為如下所列者
實施例16.將SEQ ID NO1所編碼的GagPolNef多基因通過KpnI/XhoI部位嵌入到載體pcDNA3.1之中并轉(zhuǎn)形到大腸桿菌菌株XL1blue之內(nèi)。GagPolNef表達載體誘導(dǎo)Gag特異性抗體反應(yīng)的是在雌性BALB/c小鼠體內(nèi)分析(圖9)。使兩組各5只的小鼠接受每免疫化處理各100微克DNA的肌肉內(nèi)(i.m.)第一次免疫化接著在3和6星期之后追加兩次后續(xù)i.m.免疫化處理(第1組pcDNA-GagPolNef;第2組pcDNA)。對照組(第3組)只接受PBS免疫化處理。Gag特異性IgG的剖滴定度是以ELISA相對于經(jīng)純化的Gag蛋白質(zhì)而測定。使用pcDNA-GagPolNef的免疫化處理導(dǎo)致快速誘導(dǎo)出高滴定度的Gag特異性抗體(1∶4,000),該抗體是由抗體亞型的典型Thl走勢(IgG2a>>IgG1)予以示性。第2和第3兩對照組都沒有產(chǎn)生Gag特異性抗體的跡象。在第一次追加免疫化處理的1星期之后抗體滴定度增加到幾乎百倍(1∶20,000)且在第次加強的1星期之后導(dǎo)致1∶80,000的Gag特異性終端滴定度。于該兩對照組中都沒有可證實出有明顯的Gag特異性抗體反應(yīng)者。對照組中都沒有可證實出有明顯的Gag特異性抗體反應(yīng)者。
實施例17.抗原特異性細胞介素分泌是用分別在第二次后續(xù)追加處理5解剖下脾細胞予以分析,其證據(jù)為T輔助細胞記憶反應(yīng)的誘導(dǎo)。接受三次使用pcDNA-GagPolNef的肌肉內(nèi)免疫化處理的彼等小鼠以明顯的γIFN分泌表現(xiàn)出對Gag特異性抗原刺激的反應(yīng)(表3)。在從根據(jù)上述相同時間表用pcDNA-GagPolNef進行三次皮下(s.c.)或皮內(nèi)(i.d.)免疫化處理后的小鼠解剖下來的脾細胞觀察到比較上有所減低的γIFN產(chǎn)生。于所有免疫化處理組中,從免疫化途徑?jīng)]有獨立地測定出從經(jīng)活體外特異性刺激過的脾細胞發(fā)生的明顯IL4和IL5分泌。也沒有觀察到從未經(jīng)刺激的脾細胞發(fā)生的細胞介素分泌。
根據(jù)此項結(jié)果,使用pcDNA-GagPolNef進行肌肉內(nèi)疫化處理可誘導(dǎo)出強烈的Thl細胞因子走勢,而皮下施用則誘導(dǎo)出更微弱的Thl反應(yīng)。
表4.在使用所提的DNA利用粒子槍進行免疫化處理(使用注射針注射)或皮內(nèi)或皮下免疫處理之后來自經(jīng)活體外刺激的小鼠脾細胞的細胞介素走勢。
每實驗從5只小鼠解剖下的脾細胞所得平均值±標準偏差實施例18.為了證實pcDNA-GagPolNef對于Gag對特異性CTLs的誘導(dǎo)能力,乃在第一次免疫化處理的3星期后用pcDNA-GagPolNEF(第一組),pcDNA(第2組)和PBS(第3組)在混合淋巴細胞腫瘤細胞培養(yǎng)物中進行活體外劃地再刺激6天且于隨后探討彼等的細胞毒性活性。已知者,衍生自亞型B病毒(IIIB分離物)Gag蛋白質(zhì)的毫微米AMQMLKETI肽(單字母代碼)為在BALB/c小鼠體內(nèi)的Dd限制CTL表位。使用該肽于實驗中以再刺激活體外特異性細胞毒性活性以及測定該活性。在使用pcDNA-GagPolNef質(zhì)粒單次肌肉內(nèi)注之后可以測定出Gag特異性細胞毒性T細胞但在對照組2和3中則沒有測定到。使用該質(zhì)粒處理脾細胞時不會導(dǎo)致Gag特異性細胞毒性T細胞的活體外引動(in vitro priming)。這些結(jié)果可確定(i)pcDNA-GagPolNef誘發(fā)特異性細胞毒性T細胞的能力,及(ii)該能力為跨亞型活性者(圖9)。
參考文獻Bai,X.,Su,L.,Zhang,Y,and et al(1997).Subtype and sequenceanalysis of the CZV3 region of gp 120 gene among HIV-1 strains inXinjiang.Chin.J Virology 13.
Carr,J.K.,Salminen,M.O.,Koch,C.,Gotte,D.,Artenstein,A.WHegerich,P.A.,St Louis,D.,Burke,D.S.,and McCutchan,F(xiàn).E.(1996).Full-length sequence and mosaic stmcture of a human imnunodeficiencyVirus type I isolate from Thailand.J Virol.70,5935-5943.
Carr,J.K.,Salminen,M.O.,Albert,J.,Sanders Buell,E.,Gotte,D.,Birx,D.L.,and McCutchan,F(xiàn).E.(1998).Full genome sequences ofhuman immunodeficiency Virus type I subtypes G and A/G intersubtyperecombinants.Virology 247,22-31.
Esparza,J.,Osmanov,S.,and Heyward,W L.(1995).HIVpreventive.Progress to date.Drugs 50,792-804.
Expert,group of joint United Nations programme on HIV/AIDS(1999).Implications of HIV variability for transmission scientific andpolicy issues.AIDS 11,UNAIDSI-UNAIDS 15.
Gao,F(xiàn).,Robertson,D.L.,Morrison,S.G.,Hui,H.,Craig,S.,Decker,J.,F(xiàn)ultz,P N.,Girard,M.,Shaw,G.M.,Hahi],B.H.,and Sharp,P M.(1996),The heterosexual human immunodeficiency viru type 1 epidemic inThailand is caused by an intersubtype(A/E)recombinant of Africanorigin.J.VlrOI.70.7013-7029.
Gao,F(xiàn).,Robertson,D.L.,Carruthers,C.D.,Morrison,S.G.,Jian,B.,Chen,Y,Barre Sinoussi,F(xiàn).,Girard,M.,Srinivasan,A.,Abimiku,A.G.,Shaw,G.M.,Sharp,P M.,and Hahii,B.H.(1998).A comprehensivepanel of near-full-length clones and reference sequences for non-subtypeB isolates of human immunodeficiency virus type I.j Virol.72,5680-5698.
Gaywee,J.,ArtenStein,A.W,VanCott,T.C.,Trichavaroj,R.,Sukchamnong,A.,Amlee,P,de Souza,M.,McCutchan,F(xiàn).E.,(Carr,J.K.,Markowitz,L.E.,Michael,R.,and Nittayaphan,S.(1996).Correlationof genetic and serologic approaches to HIV-1 subtyping in Thailand.JAcquir lmmune.
Graf,M.,Shao,Y,Zhao,Q.,Seidl,T.,Kostler,J.,Wolf,H.,andWagner,R.(1998).Cloning and characterization of a Virtually full-lengthHIV type 1 genome from a subtybe B′-Thai strain representing the mostprevalent B-clade isolate in China.AIDS Res.Hum.Retroviruses I4.285-288.
Graham,B.S.and Wright,P.F.(1995).Candidate AIDS vaccines.NEngl.J Med.333,1331-1339.
Kostrikis,L.G.,Bagdades,E.,Cao,Y,Zhang,L.,Dimitriou,D.,andHo,D.D.(1995).Genetic analysis of human immunodeficiency virustype 1 strains from patients in Cyprus;identification of a new subtypedesignated subtype i.J Virol.69,6122-6130.
Leitner,T.and Albert,J.(1995).Human Retroviruses and AIDS 199i..a compilation and analysis of nucleic acid and amino acid sequences.(Myers,G.,Korber,B.,Wain-Hobson,S.,Jeang,K.,Mellors J.,McCutchan,F(xiàn).,Henderson,L.,and Paviakis,G.Eds.)Los AlamosNational Laboratory,Los Alamos.N.Mex.lll 147-lll 150.
Lloe,K.S.,Bollinger,R.C.,Paranjape,R.S.,Gadkari,D.,Kulkarni,S.S.,Novfor,N.G.,Ingersoll,R.,Sheppard,H.W,and Ray,S.(C.(1999).Full-length human immunodeficiency virus type I genomes from subtypeC-infected seroconverters in india,with evidence of intersubtyperecombination.J Firol.73-152-160.
Loussert Kjaka,I.,Chaix,M.L.,Korber,B.,Letoumeur,F(xiàn).,Gomas,E.,Allen,E.,Ly,T-D.,Brun Vezinet,F(xiàn).,Simon,F(xiàn).,and Saragosti,S.(1995).Variability of human immunodeficiency virus type 1 group Ostrains isolated from Cameroonian patients living in France..J Virol.69.5640-5649.
Luo,C.C.,Tian,C.,Hu,D.J.,Kai,M.,DOndero,T.,and Zheng,X.(1995).HIV-1 subtype C in China[letter].Lancet 345,1051-1052.
Myers,G.,Korber,B.,F(xiàn)oley,B.,Jeang,K.T.,Mellors,J.W,andWain Hobson,S.(1996).Human retroviruses and AIDS a compilationand analysis ofnucleic acid and amino acid sequences.
(Anonymous Theoretical Biology and Biophysics Group,LosAlamos.N.Mex.
Salminen,M.O.,Koch,C.,Sanders Buell,E.,Ehrenberg,P K.,Michael,N.L.,Carr,J.K.,Burke,D.S.,and McCutchan,F(xiàn).E.(1995).Recovery of Virtually full-length HIV-1 provirus of diverse subtypesfrom primary Virus cultures using the polymerase chain reaction.Virology 213.80-86.
Shao,Y,Zhao,Q.,Wang B.,and et al(1994).Sequence analysis ofHIV env gene among HIV infected IDUs in Yunnan epidemic area ofChina.Chin.J Virology 10,291-299.
Shao,Y,Su,L.,Sun,X.,and et al(1998).Molecular Epidemiologyof HIV infection in China.12thworld AIDS conference,Geneva 13132,(Abstract)Shao,Y,Guan,Y,Zhao,Q.,and et al(1999).Genetic variation andmolecular epidemiology of the Ruily HIV-1 strains of Yumian in 1995.Chin.J Virol.12,9.
Sharp,P.M.,Robertson,D.L.,and Hahn,B.H.(1995).Cross-species transmission and recombination of`AIDS'viruses.Philos.Trans.R.Soc.Lond B.Biol.Sci.349.41-47.
Sharp,P.M.,Bailes,E.,Robertson,D.L.,Gao,F(xiàn).,and Hahn,B.H.(1999).Origins and evolution of AIDS viruses.Biol.Bull.196.338-342.
World Health Organisation Network for HIV Isolation andCharacterization(1994).HIV-1 variation in WHO-sponsored vaccine-evaluation sites genetic screening,sequence analysis and preliminarybiological characterization of selected viral strains.AIDS Res.Hum.Retroviruses 10,1327-1344.
Yu,H.,Su,L.,and Shao,Y(1997).Identification of the HIV-1subtypes by HMA and sequencing.Chin.J Epidemiol.18,201-204.
序 列 表序列表<110>Geneart GmbH<120>Dae Genom des HIV-1 Intersubtype (C/B') und seineAnwendungen<130>WAG-001 PCT<140>xx<141>2000-11-16<150>DE 199 55 089.1<151>1999-11-16<160>3<170>PatentIn Ver.2.1<210>1<211>9078<212>DNA<213>Human immunodeficiency virus<400>1aatctctagc agtggcgccc gaacagggac ttgaaagcga aagtaagacc agaggagatc 60tctcgac9ca ggactcggct tgctgaagtg cactcggcaa gaggcgagag cggcgactgg 120tga9tacgcc aattatattt gactagcgga ggctagaagg agagagatgg gtgcgagagc 180gtcaatatta agagggggaa aattagataa atgggaaaaa attaggttaa ggccaggggg 240aaagaaacac tatatgctaa aacacctagt atgggcaagc agggagctgg aaagattcgc 300acttaaccct ggccttttag agacatcaga aggctgtaaa caaataacga aacagctaca 360atcagctctt cagacaggaa cagaggaact tagatcatta ttcaacacag tagcaactcc 420ctattgtgta catacagaga tagatgtacg agacaccaga gaagccttag acaagataga 480ggaagaacaa aacaaaattc agcaaaaaac acagcaggca aaggaggctg acgggaaggt 540cagtcaaaat tatcctatag tacagaatct ccaagggcaa atggtacatc agcccatatc 600acctagaact ttaaatgcat gggtaaaagt ggtagaagag aaggctttta gcccagaagt 660aatacccatg ttttcagcgt tatcagaagg agccacccca caagatttaa acaccatgct 720aaacacagtg gggggacatc aagcagctat gcaaatatta aaagatacca tcaatgaaga 780ggctgcagaa tgggatagat tacatccagt aaatgcaggg cctattgcac caggccaaat 840gagagaacca aggggaagtg acatagcagg aactactagt aacctacagg aacaaatagc 900atggatgacg agtaacccac ctgttccagt aggagacatc tataaaagat ggataattct 960gggattaaat aaaatagtaa gaatgtatag ccctaccagc attctggaca taaaacaagg 1020gccgaaggaa ccctttagag actatgtaga ccggtttctt aaaactttaa gagcggaaca 1080agctacgcaa ggtgttaaaa attggatgac agacaccttg ttggtccaaa atgcgaaccc 1140agattgtaag accattttaa gagcattagg accaggggct tcaatagaag aaatgatgac 1200agcatgtcag ggagtgggag gacctagcca taaagcaaaa gtgttggccg aggcaatgag 1260ccaaacaaac agtgccatac tgatgcagag aagcaatttt aaaggctcta aaagaattgt 1320taaatgtttc aactgtggca aggaagggca catagccaga aattgcaggg cccctaggaa 1380aaagggctgt tggaaatgtg gaaaagaagg acaccaaatg aaagattgta ctgagagaca 1440ggccaatttt ttagggaaaa tctggccctc ccacaaggga gggccaggga attttcttca 1500gaacagacca gagccaacag ccccaccaga ggagagcttc aggtttgggg aagagacaac 1560aactccatct cagaagcagg agccaataga caaggaacta tatcctttaa cttccctcaa 1620atcactcttt ggcaacgacc cctcgtcaca ataaagatag gggggcaatt aaaggaagct 1680ctattagata caggagcagg tgatacagta ttagaagacc tgaatttgcc agggaaatgg 1740aaaccaaaaa tgataggggg aattggaggt tttatcaaag taagacagta tgaacagata 1800cccatagaaa tttgcggaca caaagctata ggtacagtat tagtaggacc tacacctgtc 1860aacacaattg gaagaaatct gttgactcag cttggttgca ctttaaattt tccaatcagt 1920cccattgaaa ctgtaccagt aaaattaaag ccaggaatgg atggcccaaa ggttaaacaa 1980tggccattga cagaagagaa aataaaagca ttaacagcaa tttgtgatga aatggagaaa 2040gaaggaaaaa ttacaaaaat tgggcctgaa aatccatata acactccaat atttgccata 2100aaaaagaagg acagtactaa gtggagaaag ttagtagatt tcagggaact caataaaaga 2160actcaagatt tttgggaagt tcaattagga ataccacacc cagcagggtt aaaaaagaaa 2220aaatcagtga cagtactgga tgtgggggat gcatattttt caattccttt atatgaagac 2280ttcaggaagt atactgcatt caccatacct agtagaaaca atgaaacacc agggattagg 2340tatcagtaca atgtacttcc acagggatgg aaaggatcac tagcaatatt ccaaagtagc 2400atgacaaaaa ccttagagcc ttttagaaaa caaaatccag gcatagttat ctatcaatac 2460atggatgatt tgtatgtagg atctgactta gagatagggc agcatagaac aaaaatagag 2520gaactgagac aacatttgtt gaggtgggga tttaccacac cagacaagaa acattagaaa 2580gaacctccat ttctttggat ggggtatgaa ctccatcctg acaaatggac agtacagcct 2640acacagctgc cagaaaaaga tagctggact gtcaatgata tacaaaagtt agtgggaaaa 2700ttaaactggg caagtcagat ttatcctgga attaaagtaa ggcaactttg taaactcctt 2760aggggggcca aagcactaac agacatagta ccactaactg aagaagcaga attagaattg 2820gcagaaaaca gggaaattct aaaagaacca gtacatggag tatactatga cccatcaaaa 2880gacttgatag ctgaaataca gaaacagggg caggaacaat ggacatatca aatttaccaa 2940gaaccattca aaaatctaaa aacagggaag tatgcaaaaa tgaggactgc ccacactaat 3000gatgtaaaac aattaacaga ggctgtgcag aaaatagcca tggaaggcat agtaatatgg 3060ggaaaaactc ctaaatttag attacccatc caaaaagaaa catgggagac atggtggaca 3120gactattggc aagccacctg gattcctgag tgggaatttg ttaatacccc tcccttagta 3180aaattatggt accagctgga aaaagatccc atagtaggag tagaaacttc ctatgtagat 3240ggagcagcta atagggagac taaaatagga aaagcagggt atgttactga cagaggaagg 3300aagaaaattg tttctctaac tgaaacaaca aatcagaaga ctgaattgca agcaatttgt 3360atagctttgc aagattcagg atcagaagta aacatagtaa cagattcaca gtatgcatta 3420gggatcattc aagcacaacc agataagagt gaatcagagt tagttaacca aataatagaa 3480caattaatga aaaaggaaag agtctacctg tcatgggtac cagcacataa aggaattgga 3540ggaaatgaac aagtagataa attagtaagt agtggaatca ggaaagtgct atttctagat 3600ggaatagata aagctcaaga agagcatgaa aagtatcaca gcaattggag agcaatggct 3660agtgacttta atctgccacc catagtagca aaagaaatag tggctagctg tgatcaatgt 3720cagctaaaag gagaagccat gcatggacaa gtagactgta gtccagggat atggcaatta 3780gattgtacac atttagaagg aaaaatcatc ctggtagcag tccatgtagc cagtggctac 3840atggaagcag aggttatccc agcagaaaca agacaagaga cagcatactt tatactaaaa 3900ttagcaggaa gatggccagt caaagtaata aatacagata atggtagtaa tttcaccagt 3960actgcagtta aggcagcctg ttggtgggca ggtatccaac aggaatttgg aattccctac 4020agtccccaaa gtcagggagt agtagaagcc atgaataaag aattaaagaa aattataggg 4080caggtaagag atcaagctga gcaccttaag acagcagtac taatggcagt attcattcac 4140aattttaaaa gaaaaggggg gattgggggg tacagtgcag gggaaagaat aatagatata 4200atagcaacag acatacaaac taaagaatta caaaaacaga ttacaaaaat tcaaaatttt 4260cgggtttatt acagagacag cagagacccc agttggaaag gaccagccaa actactctgg 4320aaaggtgaag gggcagtaat aatacaagat aatagtgaca taaaggtagt accaaggagg 4380aaagcaaaaa tcattaagga ctatggaaaa cagatggcag gtgctgattg tgtggcaggt 4440agacaggatg aagattagaa catggaatag tttagtaaaa caccatatgt atgtttcaag 4500gagagctaat ggatggtttt acagacatca ttatgacagc agacatccaa aagtaagttc 4560agaagtacac atcccattag gaaaggctaa attagtaata aaaacatatt gggggttgca 4620gacaggagaa agagatcggc atttgggtca tggagtctcc atagaatgga gattgagaag 4680atataccaca caaatagaac ctggcctggc agaccagcta attcatttgt attattttga 4740ttgttttgca gactctgata taaggaaagc catattagga cacatagtta ttcctaggtg 4800tgactatcaa gcaggacata ataataaggt aggatctcta caatacttgg cactgacagc 4860attgataaaa ccaaaaaaga taaagccacc tctgcctagt atcaagaaat tagtagagga 4920tagatggaac aatccccagg agatcagggg ccgcagaggg aaccacacaa tgaatggaca 4980ctagagcttc tagaggagct caagcaggaa gctgttagac actttcctag accatggctt 5040catagcttag gacaacatat ctatgaaaca tatggggata cttgggcagg agtggaagcc 5100ataataagaa ttctgcaaca actgctgttt attcatttca gaattgggtg tcagcatagc 5160agaataggca ttttgagaca gagaagaaca agaaatggag ccagtaaatc ataaaggaga 5220gccttgggag catccaggaa gtcagcctaa gactgcttgt aacagttgct attgtaaaaa 5280gtgctgcttt cattgccaag tttgtttcac gaaaaaaggc ttaggcatct tctatggcag 5340gaagaagcga agacagcgac gaagcgctca tcgaagcagt gaggatcatc aaaatcctat 5400atcaaagcag taagtagtaa atgtaatgca agctttaacc attttagcaa tagtagcctt 5460agtagtagca acaataatag caatagttgt gtggaccata gtattcatag aatataggaa 5520aatattaaga cagaaaaaaa tagacaggtt aattgataga ataagagaaa gagcagaaga 5580cagtggcaat gagggtgacg gggatcagga agaattatcg gcatttatgg agatggggca 5640ccatgctcct tgggatgttg atgatcagta gtgctgtagg aaacttgtgg gtcacagtct 5700attatggggt acctgtatgg aaaggggcaa ccaccacttt attttgtgca tcagatgcta 5760aagcatatga tacagaggta cataatgttt gggctacaca tgcctgtgta cccgcagacc 5820ccaacccaca agaaatggtt ttggaaaatg taacagaaaa ttttaacatg tggaaaaatg 5880aaatggtaaa tcagatgcag gaagatgtaa tcagtttttg ggatcaaagc ctaaaaccac 5940gtgtaaagtt gaccccactc tgtgccacct tagaatgtag aaatgttagc agtaatagta 6000atgataccta ccatgagacc taccatgaga gcatgaagga aatgaaaaat tgctctttca 6060atgcaaccac agtagtaaga gataggaagc agacagtgta tgcacttttt tatagacttg 6120atatagcacc acttactaag aagaactata gtgagaattc tagtgagtat tatagattaa 6180taaattgtaa tacctcagcc ataacacaag cctgtccaaa ggtcactttt gatccaattc 6240ctatacacta ttgcactcca gctggttatg caattctaaa gtgtaatgat aagatattca 6300atgggacagg accatgccat aatgttagca cagtacaatg tacacatggg attaagccag 6360tggtatcaac ccaactactg ttaaatggta gcctagcaga aggagaaata ataattagat 6420ctgaaaatct gacaaacaat gtcaaaacaa taatagtaca tcttaatcaa tctgtagaaa 6480ttgtatgtac aagacccggc aataatacaa gaaaaagtat aaggatagga ccaggacaaa 6540cattctatgc aacaggagac ataataggag acataagaca agcacactgt aacattagtg 6600aagataaatg gaatgaaact ctacaaaggg taagtaaaaa attagcagaa cacttccaga 6660ataaaacaat aaaatttgca tcatcctcag gaggggacct agaagttaca acacatagct 6720ttaattgtag aggagaattt ttctattgta atacatcagg cctgtttaat ggtgcataca 6780cgcctaatgg tacaaaaagt aattcaagct caatcatcac aatcccatgc agaataaagc 6840aaattataaa tatgtggcag gaggtaggac gagcaatgta tgcccctccc ataaaaggaa 6900acataacatg taaatcaaat atcacaggac tactattggt acgtgatgga ggaacagagc 6960caaacgatac agagacattc agacctggag gaggagatat gaggaacaat tggagaagtg 7020aattatataa atataaagtg gtagaaacta agccattggg agtagcaccc actacaacaa 7080aaaggagagt ggtggagaga gaaaaaagag cagtgggaat aggagctgtg ttccttgggt 7140tcttaggagt agcaggaagc actatgggcg cggcgtcaat aacgctgacg gtacaggcca 7200gacaattgct gtctggtata gtgcaacagc aaagcaattt gctgagggct atagaagcgc 7260aacagcatct gttgcaactc acggtctggg gcattaagca gctccagaca agagtcctgg 7320ctatagaaag atacctaaag gatcaacagc tcctagggat ttggggctgc tctggaaaac 7380tcatctgcac tactgctgta ccttggaact ccagttggag taacaaatct caaaaagaga 7440tttgggataa catgacctgg atgcaatggg ataaagaaat tagtaattac acaaacacag 7500tatacaggtt gcttgaagaa tcgcaaaacc agcaggaaag gaatgaaaaa gatctattag 7560cattggacag ttggaaaaat ctatggagtt ggtttgacat aacaaattgg ctgtggtata 7620taaaaatatt cataataata gtaggaggct tgataggttt aagaataatt tttgctgtgc 7680tctctatagt aaatagagtt aggcagggat actcaccttt gtcgtttcag acccttaccc 7740cgaacccagg gggacccgac aggctcggaa gaatcgaaga agaaggtgga aagcaagaca 7800gggacagatc cattcgatta gtgaacggat tcttagcgct tgcctgggac gacctgcgga 7860acctgtgcct cttcagctac caccgattga gggacttcac attagtggca gcgagggtgg 7920tggaacttct gggacgcaat agtctcaggg gactacagag agggtgggaa gcccttaaat 7980atctgggaag tcttgtgcag tactggggtc aggagctaaa aaagagtact attagtccgg 8040ttgataccat agcaatagca gtagctgaag gaacagatag gattatagaa ttagtacaag 8100gactttgtag agctatctac agcataccta gaagaataag acagggcttt gaagcagctt 8160tgcaataaaa tggggggcaa gtggtcgaaa agtagcatag ttggatggcc tgctataagg 8220gagagaatga gaagaactga gccagcagca gatggggtgg gagcagtatc tcgagacctg 8280gaaaaacatg gagcaatcac gagtagcaat acagcagcta ctaatgagga ttgtgcctgg 8340ctggaagcac aagaggaggg ggaggtgggt tttccagtca gacctcaggt acctttaaga 8400ccaatgactt acaagggagc tgtagatctt agcttctttt taaaagaaaa ggggggactg 8460gaagggttaa tttactctaa gaaaaggcta gagatccttg atttgtgggt ctatcacaca 8520caaggctact tccctgattg gcacaactac acaccaggac caggggtcag attcccactg 8580acttttgggt ggtgcttcaa gctagtacca gttgacccaa gggaagtaga agaggccaac 8640gagggagaag acaactgctt gctacaccct gtgtgccagc atggaatgga ggatgatcac 8700agagaagtat taaagtggaa gtttgacagt caactagcac acagacacag ggcccgcgaa 8760ctacatccgg agttttacaa agactgctga cacagaaggg actttccgcg gggactttcc 8820actggggcgt tctaggaggt gtggtctggc gggactggga gtggtcaacc ctcaaatgct 8880gcatataagc agctgctttt cgcctgtact gggtctctct agtcagacca gatctgagcc 8940tgggagctct ctggctaact agggaaccca ctgcttaagc ctcaataaag cctgccttga 9000ggggctagag cggccgccac cgcggtggag ctccagcttt tgttcccttt agtgag9gtt 9060aattgcgcgc tggcgatc9078<210>2<211>4288<212>DNA<213>Human immunodeficiency virus<400>2gctaggtacc taatgggcgc cagggccagc atcctgaggg gcggcaagct ggacaagtgg 60gagaagacca ggctgaggcc cggcggcaag aagcactaca tgctgaagca cctggtgtgg 120gccagcaggg agctggagag gttcgccctg aaccccggcc tgctggagac cagcgagggc 180tgcaagcaga tcatgaagca gctgcagagc gccctgcaga ccggcaccga ggagctgagg 240agcctgttca acaccgtggc caccccctac tgcgtgcaca ccgagatcga cgtgagggac 300accagggagg ccctggacaa gatcgaggag gagcagaaca agatccagca gaagacccag 360caggccaagg aggccgacgg caaggtgagc cagaactacc ccatcgtgca gaacctgcag 420ggccagatgg tgcaccagcc catcagcccc aggaccctga atgcatgggt gaaggtggtg 480gaggagaagg ccttcagccc cgaggtgatc cccatgttca gcgccctgag cgagggcgcc 540accccccagg acctgaacac catgctgaac accgtgggcg gccaccaggc cgccatgcag 600atcctgaagg acaccatcaa cgaggaggcc gccgagtggg acaggctgca ccccgtgcac 660gccggcccca tcgcccccgg ccagatgagg gagcccaggg gcagcgacat cgccggcacc 720accagcaacc tgcaggagca gatcgcctgg atgaccagca acccccccgt gcccgtgggc 780gacatctaca agaggtggat catcccgggt ttaaacaaga tcgtgaggat gcacagcccc 840accagcatcc tggacatcaa gcagggcccc aaggagccct tcagggacta cgtcgacagg 900ttcttcaaga ccctgagggc ggagcaggcc acccagggcg tgaagaactg gatgaccgac 960accctgctgg tgcagaacgc caaccccgac tgcaagacca tcctgagggc cctgggcccc 1020ggcgccagca tcgaggagat gatgaccgcc tgccagggcg tgggcggccc cagccacaag 1080gccaaggtgc tggccgaggc catgagccag accaacagcg ccatcctgat gcagaggagc 1140aacttcaagg gcagcaagag gatcgtgaag tgcttcaact gcggcaagga gggccacatc 1200gccaggaact gcagggcccc caggaagaag ggctgctgga agtgcggcaa ggagggccac 1260cagatgaagg accgcaccga gaggcaggcc aacttcctgg gcaagatctg gcccagccac 1320aagggcggcc ccggcaacct cctgcagaac aggcccgagc ccaccgcccc ccccgaggag 1380agcttcaggt tcgaggagga gaccaccacc cccagccaga agcaggagcc catcgacaag 1440gagctgtacc ccctgaccag cctgaagagc ctgttcggca acgaccccag cagccaggaa 1500ttcttcaggg agaacctggc cctgccccag ggcagggcca gggagttcag cagcgagcag 1560accagggcca acagccccac caggggcgag ctgcaggtgt ggggcaggga caacaacagc 1620atcagcgagg ccggcgccaa caggcagggc accaccagct tcaacttccc ccagatcacc 1680ctgtggcaga ggcccctggt gaccatcagg atcggcggcc agctgaagga ggccctgctg 1740aacaccggcg ccggcgacac cgtgctggag gacctgaacc tgcccggcaa gtggaagccc 1800aagatgatcg gcggcatcgg cggcttcatc aaggtgaggc agtacgagca gatccccatc 1860gagatctgcg gccacaaggc catcggcacc gcgctggtgg gccccacccc cgtgaacatc 1920atcggcagga acctgctgac ccagctgggc tgcaccctga actcccccat cagccccatc 1980gagaccgtgc ccgtgaagct gaagcccggc acggacggcc ccaaggtgaa gcagtggccc 2040ctgaccgagg agaagatcaa ggccctgacc gccatctgcg acgagatgga gaaggagggc 2100aagatcacca agatcggccc cgagaacccc tacaacaccc ccatcttcgc catcaagaag 2160aaggacagca ccaagtggag gaagctggtg gacttcaggg agctgaacaa gaggacccag 2220gacttctggg aggtgcagct gggcatcccc caccccgccg gcctgaagaa gaagaagagc 2280gtgaccgtgc tggacgtggg cgacgcctac ttcagcatcc ccctgtacga ggacttcagg 2340aagtacaccg ccttcaccat ccccagcagg aacaacgaga cccccggcat cagctaccag 2400tacaacgtgc tgccccaggg ctggaagggc agcctggcca tcttccagag cagcatgacc 2460atcgaggagc tgatctacag caagaagagg caggagatcc tggacctgtg ggtgtaccac 2520acccagggct acttccccga ctggcacaac tacacccccg gccccggcgt gaggttcccc 2580ctgaccttcg gctggtgctt caagctggtg cccgtggacc ccagggaggt ggaggaggcc 2640aacgagggcg aggacaactg cctgctgcac cccgtgtgcc agcacggcat ggaggacgac 2700cacagggagg tgctgaagtg gaagttcgac agccagctgg cccacaggca cagggccagg 2760gagctgcacc ccgagttcta caaggactgc atgggcggca agtggagcaa gagcagcatc 2820gtgggctggc ccgccatcag ggagaggatg aggaggaccg agcccgccgc cgacggcgtg 2880ggcgccgt9a gcagggacct ggagaagcac ggcgccatca ccagcagcaa caccgccgcc 2940accaacgagg actgcgcctg gctggaggcc caggaggagg gcgaggtggg cttccccgtg 3000aggccccagg tgcccctgag gcccatgacc tacaagggcg ccgtggacct gagcttcttc 3060ctgaaggaga agggcggcct ggagggcctg aggcagcacc tgctgaggtg gggcttcacc 3120acccccgaca agaagcacca gaaggagccc cccttcctgt ggatgggcta cgagctgcac 3180cccgacaagt ggaccgtgca gcccacccag ctgcccgaga aggacagctg gaccgtgaac 3240gacatccaga agctggtggg caagctgaac tgggccagcc agatctaccc cggcatcaag 3300gtgaggcagc tgtgcaagct gctgaggggc gccaaggccc tgaccgacat cgtgcccctg 3360accgaggagg ccgagctgga gctggccgag aacagggaga tcctgaagga gcccgtgcac 3420ggcgtgtact acgaccccag caaggacctg atcgccgaga tccagaagca gggccaggag 3480cagtggacct accagatcta ccaggagccc ttcaagaacc tgaagaccgg caagtacgcc 3540aagatgagga ccgcccacac caacgacgtg aagcagctga ccgaggccgt gcagaagatc 3600gccatggagg gcatcgtgat ctggggcaag acccccaagt tcaggctgcc catccagaag 3660gagacctggg agacctggcg gaccgactac tggcaggcca cctggatccc cgagtgggag 3720ttcgtgaaca cccctcccct ggtgaagctg tggtatcagc tggagaagga ccccatcgtg 3780ggcgtggaga ccttctacgt ggacggcgcc gccaacaggg agaccaagat cggcaaggcc 3840ggctacgtga ccgacagggg caggaagaag atcgtgagcc tgaccgagac caccaaccag 3900aagaccgagc tgcaggccat ctgcatcgcc ctgcaggaca gcggcagcga ggtgaacatc 3960gtgaccgaca gccagtacgc cctgggcatc atccaggccc agcccgacaa gagcgagagc 4020gagctggtga accagatcat cgagcagctg atgaagaagg agagggtgta cctgagctgg 4080gtgcccgccc acaagggcat cggcggcaac gagcaggtgg acaagctggt gagcagcggc 4140atcaggaagg tgctgaagac cctggagccc ttcaggaagc agaaccccgg catcgtgatc 4200taccagtaca tggacgacct gtacgtgggc agcgacctgg agatcggcca gcacaggacc 4260aagtaaagat ctctcgagga gctcaagc 4288<210>3<211>2605<212>DNA<213>Human immunodeficiency virus<400>3gcggcgggta ccgaactcgc cgccagcatg gacagggcca agctgctgct gctgctgctg 60ctgctgctgc tgccccaggc ccaggccgtg ggcaacctgt gggtgaccgt gtaccacggc 120gtgcccgtgt ggaagggcgc caccaccacc ctgttctgcg ccagcgacgc caaggcctac 180gacaccgagg tgcacaacgt gtgggccacc cacgcctgcg tgcccgccga ccccaacccc 240caggagatgg tgctggagaa cgtgaccgag aacttcaaca tgtggaagaa cgagatggtg 300aaccagatgc aggaggacgt catcagcctg tgggaccaga gcctgaagcc ctgcgtgaag 360ctgacccccc tgtgcgtgac cctggagtgc aggaacgtga gcagcaacag caacgacacc 420taccacgaga cctaccacga gagcatgaag gagatgaaga actgcagctt caacgccacc 480accgtggtga gggacaggaa gcagaccgtg tacgccctgt tctacaggct ggacatcgtg 540cccctgacca agaagaacta cagcgagaac agcagcgagt actacaggct gatcaactgc 600aacaccagcg ccatcaccca ggcctgcccc aaggtgacct tcgaccccat ccccatccac 660tactgcaccc ccgccggcta cgccatcctg aagtgcaacg acaagatctt caacggcacc 720ggcccctgcc acaacgtgag caccgtgcag tgcacccacg gcatcaagcc cgtggtgagc 780acccagctgc tgctgaacgg cagcctggcc gagggcgaga tcatcatcag gagcgagaac 840ctgaccaaca acgtgaaaac catcatcgtg cacctgaacc agagcgtgga gatcgtgtgc 900accaggcccg gcaacaacac caggaagagc atcaggatcg gccccggcca gaccttctac 960gccaccggcg acatcatcgg cgacatcagg caggcccact gcaacatcag cgaggacaag 1020tggaacgaga ccctgcagag ggtgagcaag aagcttgccg agcacttcca gaacaagacc 1080atcaagttcg ccagcagcag cggcggcgac ctggaggtga ccacccacag cttcaactgc 1140aggggcgagt tcttctactg caacaccagc ggcctgttca acggcgccta cacccccaac 1200ggcaccaaga gcaacagcag cagcatcatc accatcccct gcaggatcaa gcagatcatc 1260aacatgcggc aggaggtggg cagggccatg tacgcccctc ccatcaaggg caacatcacc 1320tgcaagagca acatcaccgg cctgctgatg gtgagggacg gcggcaccga gcccaacgac 1380accgagacct tcaggcccgg cggcggcgac atgaggaaca actggaggag cgagctgcac 1440aagtacaagg tggtggagat caagcccctg ggcgtggccc ccaccaccac caagaggagg 1500gtggtggaga gggagaagag ggccgtgggc atcggcgccg tgttcctggg cttcctgggc 1560gtggccggca gcaccatggg cgccgccagc atcaccctga ccgtgcaggc caggcagctg 1620ctgagcggca tcgtgcagca gcagagcaac ctgctgaggg ccatcgaggc ccagcagcac 1680ctgctgcagc tgaccgtgtg gggcatcaag cagctgcaga ccagggagct ggccatcgag 1740aggtacctga aggaccagca gctgctgggc atctggggct gcagcggcaa gctgatctgc 1800accaccgccg tgccctggaa cagcagctgg agcaacaaga gccagaagga gatctgggac 1860aacatgacct ggatgcagtg ggacaaggag atcagcaact acaccaacac cgtgtacagg 1920ctgctggagg agagccagaa ccagcaggag aggaacgaga aggacctgct ggccctggac 1980agctggaaga acctgtggag ctggttcgac atcaccaact ggctgtggta catcaagatc 2040ttcatcatca tcgtgggcgg cctgatcggc ctgaggatca tcttcgccgt gctgagcatc 2100gtgaacaggg tgaggcaggg ctacagcccc ctgagcttcc agaccctgac ccccaacccc 2160ggcggccccg acaggctggg caggatcgag gaggagggcg gcaagcagga cagggacagg 2220agcatcaggc tggtgaacgg cttcctggcc ctggcctggg acgacctgag gaacctgtgc 2280ctgttcagct accacaggct gagggacttc accctggtgg ccgccagggt ggtggagctg 2340ctgggcagga acagcctgag gggcctgcag aggggctggg aggccctgaa gtacctgggc 2400agcctggtgc agtactgggg ccaggagctg aagaagagca ccatcagcct ggtggacacc 2460atcgccatcg ccgtggccga gggcaccgac aggatcatcg agctggtgca gggcctgtgc 2520agggccatct acagcatccc caggaggatc aggcagggct tcgaggccgc cctgcagtga 2580taaagatctc tcgaggagct caagc260權(quán)利要求
1.一種多核苷酸,其包括如SEQ ID NO1,2或3中所示核酸序列,或其片段或衍生物,或一種可與如SEQ ID NO1,2或3中所示核酸序列雜交的多核苷酸。
2.如權(quán)利要求1的多核苷酸或其片段或衍生物,其中該雜交多核苷酸是在嚴格條件與如SEQ ID NO1,2或3中所示核酸序列雜交。
3.如權(quán)利要求1或2的多核苷酸或其片段或衍生物,其包括至少一個具有至少9個核苷酸,優(yōu)選至少15個核苷酸,更優(yōu)選至少27個核苷酸,或更長的連續(xù)序列。
4.如權(quán)利要求3的多核苷酸或其片段或衍生物,其具有一個以上的連續(xù)核苷酸序列,其中至少兩個連續(xù)序列是由一核苷酸序列間隔段所分隔。
5.如權(quán)利要求1到4項中任一項的多核苷酸或其片段或衍生物,其包括至少一個如SEQ ID NO1,2或3中所示核酸序列所編碼的多肽。
6.DNA構(gòu)建體,其包括如權(quán)利要求1到5項中任一項的多核苷酸或其片段或衍生物。
7.細菌或病毒載體,其包括如權(quán)利要求1到5項中任一項的多核苷酸或其片段或衍生物。
8.如權(quán)利要求1到5項中任一項的多核苷酸或其片段或衍生物,用作藥物,疫苗或診斷物質(zhì)。
9.如權(quán)利要求1到5項中任一項的多核苷酸或其片段或衍生物用于制造治療或預(yù)防HIV感染所用的藥物或疫苗的用途。
10.一種多肽,其是由如SEO ID NO1,2或3中所示核酸序列或其片段或衍生物所編碼。
11.如權(quán)利要求10的多肽,其包括一由如SEQ ID NO1,2或3中所示核酸序列或其片段或衍生物所編碼的含有至少8個氨基酸的連續(xù)序列。
12.如權(quán)利要求10或11的多肽,其中該氨基酸序列對應(yīng)于HIV包膜蛋白質(zhì)或其片段。
13.如權(quán)利要求10到12項中任一項的多肽,其還包括在一受感染對象體內(nèi)天然地誘導(dǎo)免疫反應(yīng)的抗原決定簇。
14.如權(quán)利要求13的多肽,其中該抗原決定簇為一種構(gòu)象表位或線性表位。
15.如權(quán)利要求10到14項中任一項的多肽,用作藥物,疫苗或診斷物質(zhì)。
16.如權(quán)利要求10到14項中任一項的多肽用于制造治療或預(yù)防HIV感染所用的藥物或疫苗的用途。
17.分離的多肽,其對如權(quán)利要求10到14項中任一項所述多肽具有特異性。
18.如權(quán)利要求17的分離的多肽,用作藥物或診斷物質(zhì)。
19.如權(quán)利要求17的分離的多肽用于制造治療或預(yù)防HIV感染所用的藥物的用途。
20.如權(quán)利要求17到19項中任一項的分離的多肽,其中該分離的多肽為一種抗體。
全文摘要
本發(fā)明涉及一種多核苷酸,其包括在SEQ ID NO:1,2或3中所示的核酸序列或其片段或衍生物,或與在SEQ ID NO:1,2或3中所示的核酸序列雜交的多核苷酸。本發(fā)明更涉及由在SEQ ID NO:1,2或3中所示的核酸序列或其片段或衍生物所編碼的多肽。該等多核苷酸和多肽可用為藥品,疫苗或診斷用物質(zhì),較佳者是用于HIV感染的治療,預(yù)防或診斷。
文檔編號C12N15/00GK1423698SQ00818426
公開日2003年6月11日 申請日期2000年11月16日 優(yōu)先權(quán)日1999年11月16日
發(fā)明者邵一鳴, 羅夫·偉格拿, 漢思·渥夫, 麻庫司·葛拉夫 申請人:真那特應(yīng)用生物科技有限公司, 邵一鳴