背景
許多病原體與大量個人痛苦和重要的社會-經(jīng)濟后果諸如醫(yī)療費用等相關。病原體諸如細菌和病毒經(jīng)常作為不同的株系、基因型或亞型存在。個體株系、基因型或亞型可以或多或少易受可用治療例如抗生素或抗病毒藥物影響。近年來,抗生素耐受細菌的發(fā)展和未受或較少受已知抗病毒藥物影響的病毒的發(fā)展是主要關注來源。例如,漸增數(shù)目的無法用過去足夠有效的抗生素治療的金黃色葡萄球菌菌株、結核分支桿菌菌株等被以下匹配:較高數(shù)目的死亡率和相關的社會-經(jīng)濟后果,例如,數(shù)天住院治療、從感染恢復所需天數(shù)的總體增加。
此外,人的重要病毒病原體,例如HIV、HCV和HBV,也值得較高注意,這是由于目前已知的抗病毒藥物,例如γ干擾素、抗逆轉錄病毒藥物等未充分消除病毒變體的發(fā)展。這些病毒具有可改變藥物結合位點、從而賦予針對已知藥物的部分或完全抗性的基因突變的高比率。這導致具有對于受害個體和社會兩者的后果的受影響患者中的耐受病原體的較高滴度。
對于社會-經(jīng)濟重要和已知發(fā)展引起針對一些抗病毒藥物的耐受性的突變的病毒一個實例是丙型肝炎病毒(HCV)。該病毒是說明本發(fā)明的一個實例。
HCV涉及黃病毒科含RNA病毒家族,并引起具有肝硬化和肝癌的最常見并發(fā)癥的感染過程(CDC Report N°61;Younossi Z,Kallman J,Kincaid J.The effects of HCV infection and management on health-related quality of life;Hepatology.2007Mar;45(3):806-16)。在2005年,地球上估計數(shù)目超過1.7億人受該疾病折磨(Robert-Koch-Institut:Epidemiologisches Bulletin.46/2005),并且受影響的人數(shù)仍在上升。
HCV的急性感染(所有急性肝炎感染的20%)經(jīng)常導致慢性肝炎(所有慢性肝炎病例的70%)和終末期肝硬化。據(jù)估計,多達20%的HCV慢性攜帶者可經(jīng)約20年的時間段發(fā)展肝硬化,并且每年1至4%的具有肝硬化的HCV慢性攜帶者處于發(fā)展肝癌的風險中(Shiffman 1999;Lauer和Walker 2001)。
增加HCV引起的終末期肝病的壽命的一個選項是肝移植(全世界所有肝移植中的30%是由于HCV-感染)。
此外,當肝移植不適應或不可行時,當代廣泛的HCV治療的趨勢是使用聯(lián)合療法,其包括共同注射大劑量的干擾素與含有常見抗病毒制劑和一種或兩種HCV復制抑制劑(特定蛋白酶-解旋酶和/或RNA聚合酶抑制劑)兩者的雞尾酒混合物(例如,Toniutto P,Fabris C,Bitetto D,Fomasiere E,Rapetti R,Pirisi M.Valopicitabine dihydrochloride;a specific polymerase inhibitor of Hepatitis C virus.Curr Opin Investig Drugs.2007Feb;8(2):150-8;)。這些雞尾酒混合物增加恢復的百分比,然而不可避免地導致適應性的抑制劑耐受的HCV突變體的形成。
HCV具有高突變率,這被認為幫助病毒逃脫其宿主的免疫系統(tǒng)。高突變率反映于受感染的個體中被稱為準種的許多不同的HCV基因組序列的存在(Bukh等人1995;Farci等人1997)。準種由病毒編碼的NS5B RNA依賴的RNA聚合酶的活性所導致,所述NS5B RNA依賴的RNA聚合酶,由于其缺乏校對功能,固有地是低保真酶。準種的可能生物后果包括:(i)發(fā)展對體液免疫和細胞免疫的逃逸突變體,導致持續(xù)性感染的建立;(ii)可變細胞嗜性(例如,嗜淋巴細胞vs嗜肝);(iii)疫苗失敗,和(iv)快速發(fā)展耐藥性。
因此,HCV樣本的基因型和亞型的鑒定對于檢測治療反應、評估抗病毒療法的持續(xù)時間和效力和建立病毒傳播的途徑的目的具有顯著重要性。取決于亞型的基因型,患者目前用基于干擾素的藥物(其可用于治療基因型2、3、5和6的感染)治療,而基因型1和4對基于干擾素的治療不那么響應?,F(xiàn)在公認,HCV在不同HCV分離株間作為獨特基因型存在,其中每種基因型流行于特定地理位置。目前,HCV變體主要分為6種基因型,代表由核心/E1和NS5B亞基因組序列以及完整基因組序列的系統(tǒng)發(fā)育分析定義的6種基因組。在每種基因型內(nèi),HCV變體可進一步分為亞型(Simmonds等人.1994)。HCV基因型的命名法的當前統(tǒng)一系統(tǒng)的概述由Simmonds等人(2005)給出。
用當前標準FDA批準的與利巴韋林組合的聚乙二醇化干擾素α的抗病毒療法,僅約一半對于該治療合格的基因型-1HCV感染的個體實現(xiàn)持續(xù)的病毒學響應(Manns等人,2001)。因為嚴重的副作用和其它醫(yī)療并發(fā)癥,目前從治療排除多達75%的HCV患者。因此,目前正在開發(fā)和早期臨床試驗中的新的抗HCV藥物目的在于采用新的目標,諸如HCV內(nèi)部核糖體進入位點(IRES)、HCV NS3絲氨酸蛋白酶和HCV NS5B RNA依賴的RNA聚合酶(參見例如Tan等人2002;De Francesco等人2003)。
然而,預期HCV的高突變率和變異性有利于耐藥性的出現(xiàn),限制了這些抑制劑的臨床有用性。事實上,已經(jīng)在體外實驗和初始臨床試驗過程中發(fā)現(xiàn)耐藥性突變。例如,HCV亞基因組復制子已經(jīng)用于研究病毒對核苷和非核苷NS5B抑制劑以及NS3/4A蛋白酶抑制劑兩者的耐受性(Kukolj等人2005;Mo等人2005;綜述于:Tomei等人2005)。HCV耐受性突變體的理解將朝著有效的治療HCV進一步進展。換言之,評估現(xiàn)有藥物耐受性突變體對不同類別的抗病毒劑的敏感性對于新藥的開發(fā)至關重要。此外,探索組合治療對耐藥性的影響可以提供對未來HCV治療策略的見解。所有這都使得能夠快速開發(fā)和/或改變適當?shù)闹委煼桨?。因此,用適當(即,活性)藥物治療HCV-感染的患者將變得可行得多。
為了跨越HCV基因型進行此類精確耐藥性概況分析,需要有效地分析HCV核酸序列的方法。盡管HCV充當響應于治療干預而進化的病原體的實例,但類似的關注也適用于變得對某些藥物(例如HIV、抗生素耐受的細菌(例如MRSA)等)更加響應的其它病原體。
本發(fā)明解決該需求以可靠和準確地確定病原體(例如病毒諸如HCV)的基因型或亞型,并提供用于使用下一代測序確定病毒基因型的新方法和裝置。
下一代測序是在疾病(例如感染性疾病諸如病毒感染)的診斷中變得越來越重要的方法。下一代測序允許測定核酸(例如病毒核酸)的序列,并且為醫(yī)師當選擇用于個體的正確治療時提供重要信息。
下一代測序基于巨量(例如,數(shù)千或數(shù)百萬)序列的同時并行測序。目前,使用各種類型的下一代測序方法,Roche的454焦磷酸測序、Illumina測序、SOLiD測序和離子半導體測序是最先進的測序方法。幾家公司已經(jīng)在市場上引入允許以自動方式進行下一代測序方法的裝置。下一代測序是該領域中的技術專家已知的,且主要基于從來源(例如臨床來源,諸如臨床樣品)分離核酸,生成具有幾百至幾千堿基對的大小的核酸的短片段。將這些短片段克隆入文庫,然后將序列個別引入其中測序反應發(fā)生的分開反應容器中。存在用于測序核酸的不同方法,例如基于磷酸鹽的釋放、熒光的釋放或帶正電的氫離子的檢測的方法。
本發(fā)明提供分析在下一代測序方法的過程中獲得的數(shù)據(jù)的方式。相當經(jīng)常地,僅測序期望的基因組區(qū)域的短片段,并且必須組裝成覆蓋必需的所有目的基因組區(qū)域的重疊群。
此外,臨床樣品可含有對于懷疑存在于臨床樣品中的特定病毒的基因型代表性的不同類型的期望的目標基因組區(qū)域(例如,病毒基因組區(qū)域),找出目標基因(例如,病毒基因)的基因型的確切性質以找到受影響的患者的正確治療是重要的。
當使用下一代測序方法諸如離子半導體測序方法測序特定長度(例如,約1000個堿基對)的基因,覆蓋整個基因組區(qū)域的巨量片段必須在測序之后重新組裝以形成連續(xù)序列(重疊群)。
本發(fā)明提供用于組裝在巨量個別測序反應中獲得的信息并以非常高效率將獲得的信息與先前收集的信息(例如,以基因數(shù)據(jù)庫諸如含有關于已知HCV基因型和亞型的信息的數(shù)據(jù)庫的形式)進行比較的令人驚訝有效的方法。
定義
如說明書和權利要求中所使用,單數(shù)形式“一個/種(a)”和“一個/種(an)”也包括相應的復數(shù),除非上下文另有明確說明。
在本發(fā)明的上下文中的術語“約”表示本領域技術人員將理解仍確保討論中的特征的技術效果的精確度的區(qū)間。該術語通常表示與所示數(shù)值的±10%、優(yōu)選±5%的偏差。
需要理解的是,術語“包含”不是限制性的。為了本發(fā)明的目的,術語“由...組成”被認為是術語“包含”的一個優(yōu)選實施方案。如果組群在下文被定義為包含至少特定數(shù)目的實施方案,這也意指涵蓋優(yōu)選僅由這些實施方案組成的組群。
如本文所使用的術語“檢測存在”應當在“檢測存在或不存在”的含義中理解。如本申請中請求保護的方法中所提及,待分析的樣品被懷疑包含核酸,所述核酸包含表明病原體的存在的共有核酸序列(其也可以指定為目標序列)。
在本發(fā)明的上下文中,“表明病原體的存在的共有核酸序列”或“目標序列”表示給定病原體對于所述病原體特異性的基因組區(qū)域。基因組區(qū)域的擴增(例如使用(RT-)PCR)和擴增產(chǎn)物的測序允許確定給定病原體是否存在于由其獲得擴增的核酸的樣品。術語“共有”意指基因組區(qū)域允許特異性確定給定病原體的核酸序列是否存在于樣品中,但考慮存在多于一種核酸序列變體,即所述病原體的多于一種基因型、亞型或株系。例如,HCV的NS5B基因組區(qū)域允許鑒定樣品中存在HCV。然而,存在該基因組區(qū)域的幾種基因型和亞型,即盡管基因組區(qū)域包含表明所有HCV基因型的共有序列,但這些個別基因型和亞型具有不同的核酸序列或所述核酸序列的變體。
在本發(fā)明的上下文中,術語“核酸”是指單鏈或雙鏈形式的天然存在的脫氧核糖核苷酸或核糖核苷酸聚合物。該核酸可以特別是雙鏈DNA和單鏈RNA。
如本文所使用的術語“序列”是指脫氧核糖核苷酸或核糖核苷酸聚合物中的堿基的連續(xù)存在,其中脫氧核糖核苷酸聚合物中發(fā)現(xiàn)的堿基選自A、T、G和C且核糖核苷酸聚合物中發(fā)現(xiàn)的堿基選自A、U、G和C。脫氧核糖核苷酸聚合物中的堿基的序列因此可以是例如GGAAGCAAGCCT,而核糖核苷酸聚合物中的堿基的序列可以例如是GGAAUCGAU。
如本文所使用,術語“樣品”是指可以針對包含目標序列的核酸的存在進行測試的來自任何人或獸醫(yī)受試者的任何生物樣品。所述樣品可以包括從任何器官獲得的組織,例如,肺組織;和從任何器官獲得的流體,諸如例如,血液、血漿、血清、淋巴液、滑液、腦脊液、羊水、羊膜臍帶血、淚液、唾液和鼻咽洗滌液。如上所列出,樣品也可以源自機體中的特定區(qū)域,例如呼吸道;來自呼吸道樣品的樣品包括咽喉拭子、咽喉洗滌液、鼻拭子和來自下呼吸道的樣本。
所述樣品可尤其源自人或獸醫(yī)受試者。因此,“患者”可以是人或獸醫(yī)受試者。如果提及“臨床樣品”,這表明所述樣品來自懷疑被具有包含目標序列的核酸的病原體感染的患者。
如本文所使用,術語“擴增”是指能夠產(chǎn)生數(shù)十億拷貝的核酸目標的酶介導的程序。本領域已知的酶介導的目標擴增程序的實例包括PCR。
用于擴增DNA的“PCR反應”已經(jīng)由Mullis等人的美國專利號4,683,195和Mullis的美國專利號4,683,202首先描述,并且是本領域普通技術人員眾所周知的。在PCR技術中,將DNA的樣品在溶液中與摩爾過量的至少兩種寡核苷酸引物(制備為與DNA雙鏈體的每條鏈的3'末端互補)(參見上文,正向和反向引物);摩爾過量的核苷酸堿基(即,dNTP);和熱穩(wěn)定的DNA聚合酶(優(yōu)選Taq聚合酶)(其催化由寡核苷酸引物和dNTP形成DNA)混合。所述引物中,至少一種是正向引物,其將在5'至3'方向結合至變性的DNA分析物的一條鏈(在上述定義中,無義鏈)的3'末端,且另一種是反向引物,其將在3'至5'方向結合至變性的DNA分析物的另一條鏈(在上述定義中,有義鏈)的5'末端。將溶液加熱至約94-96℃,以便將雙鏈DNA變性為單鏈DNA。當溶液冷卻下來且達到所謂的退火溫度時,引物結合至分離鏈且DNA聚合酶通過將dNTP接合至引物而催化分析物的新鏈。當重復該過程且將從所述引物合成的延伸產(chǎn)物與其互補物分離時,各延伸產(chǎn)物充當用于從另一引物合成的互補延伸產(chǎn)物的模板。由于序列在各循環(huán)后被擴增一倍,所以在重復該過程幾小時會后可獲得巨量拷貝的理論擴增;因此,可以在相對短的時間內(nèi)使用PCR擴增極小量的DNA。
當用于PCR反應的起始材料是RNA時,經(jīng)由逆轉錄從RNA合成互補DNA(“cDNA”)。然后使用上述PCR方案擴增所得cDNA。本領域普通技術人員已知逆轉錄酶是逆轉錄病毒中發(fā)現(xiàn)的酶,其可以從mRNA序列作為模板合成DNA的互補單鏈。用于擴增RNA產(chǎn)物的PCR被稱為逆轉錄酶PCR或“RT-PCR”。
術語“測序”在本文中以其在分子生物學中的通常含義使用。因此,確定核酸序列中的堿基的確切連續(xù)存在。
如本文所使用的術語“病原體”以其最廣泛的含義使用。因此,病原體可以是任何類型的細菌、古細菌、原生生物、真菌和病毒。明確地提及的是,病毒落在如本文所使用的“微生物”的定義下。
本發(fā)明的實施方案
在一個方面,本發(fā)明涉及(i)確定或檢測樣品中的病原體的存在或不存在,和(ii)確定樣品中的病原體的基因型和/或亞型的方法,所述方法包括以下步驟:
a.提供懷疑含有病原體的樣品,
b.選擇表明存在所述病原體的共有序列,
c.使用適合于測序讀取值裝配的軟件(例如MTRA)確定選擇的表明所述病原體的共有序列的核酸序列,
d.提供用使用廣泛接受的多重序列比對算法(例如MAFFT、CLUSTALW、MUSCLE)和系統(tǒng)發(fā)生樹構建算法(例如最大似然,最近鄰,最大-簡約)的軟件構建的具有已知基因型的基因序列的集合的系統(tǒng)發(fā)生樹,
e.使用適合于序列比對的軟件(例如BLAST、TMAP、BWA)將獲得的共有核酸序列與表明所述病原體的具有已知基因型的基因序列的集合進行比對,
f.確定與獲得的共有核酸序列具有高相似性的基因序列的子集,
g.確定步驟f)中與獲得的共有核酸序列具有高相似性的基因序列的子集的步驟d)中的系統(tǒng)發(fā)生樹中的最低共同祖先,
h.基于步驟g)中獲得的結果,診斷樣品中存在的病原體基因型/亞型,和
i.任選確定表明所述病原體的基因序列的至少兩種不同的基因型或亞型的共感染。
適合于通過上述方法分析的樣品可以是任何類型的樣品,尤其是如上所定義的臨床樣品。提供樣品意味著從懷疑含有給定病原體(被給定病原體感染)的生物體移取樣品。此外,該方法通常包括這樣的步驟,其中提取并純化樣品中的核酸,使得可以進行進一步分析步驟,諸如逆轉錄、PCR等。
上述方法包括這樣的步驟,其中選擇表明存在所述病原體的共有序列。該步驟依賴于關于給定病原體的基因身份和變異性的信息。例如,如果HCV是應當測定其存在和基因型/亞型的病原體,則數(shù)據(jù)庫提供關于那些區(qū)域的信息,其允許特異性檢測HCV和確定所述HCV的基因型/亞型。顯然,基于(RT-)PCR的擴增和檢測方法需要設計特異性擴增允許特異性擴增的HCV基因組區(qū)域的引物。因此,本發(fā)明的方法進一步包括設計PCR引物的步驟,所述PCR引物與HCV的基因組區(qū)域或它們的互補物特異性雜交,以允許特異性擴增共有基因組區(qū)域,即,目的基因組區(qū)域(目標區(qū)域)。擴增的基因組區(qū)域的長度優(yōu)選在約100至1000個核苷酸的范圍內(nèi),但如果需要的話,也可以擴增基因組區(qū)域的較長片段,例如約1100、1200、1300、1400、1500個核苷酸長度或更長的區(qū)域。靶向基因組區(qū)域的選擇通常取決于這樣的問題,所述基因組區(qū)域是否對于給定病原體(例如HCV)是特異性的,和擴增產(chǎn)物的進一步分析是否允許確定所述病原體的基因型/亞型。例如,如果約800個核苷酸長度的基因組區(qū)域的擴增和分析足以特異性檢測病原體,例如HCV,則沒有必要獲得更長片段,條件是該片段(共有基因組區(qū)域)也允許確定各自病原體的基因型/亞型。
在擴增核酸序列之后進行確定選擇的表明所述病原體的共有序列的核酸序列的步驟。核酸序列通過病原體的靶向基因組區(qū)域的測序,優(yōu)選下一代測序,最優(yōu)選離子半導體測序來確定。在本發(fā)明的方法中,測序代表目的基因組區(qū)域的更大量擴增產(chǎn)物。組裝所有測序反應的測序讀取值以提供連續(xù)序列(重疊群)。組裝步驟使用被稱為MIRA組裝器的自由可得的軟件(即,適合于核苷酸序列的自動組裝和編輯的軟件)進行??梢允褂玫钠渌浖悦QNewbler、CLC Bio等已知,條件是此類軟件適合于指導此類重疊群的組裝。組裝重疊群中的核苷酸序列之后,在覆蓋范圍、長度方面檢查組裝的重疊群的質量,其中具有至少300倍平均覆蓋范圍的目標核酸序列且具有長于250個核苷酸、長于300個核苷酸的長度的重疊群,優(yōu)選長于400個核苷酸或仍更長序列的重疊群被認為對于本發(fā)明的目的是有效的。
在本發(fā)明的方法中,使用多重序列比對算法和樹構建算法生成表明所述病原體的具有已知基因型的基因序列的集合的系統(tǒng)發(fā)生樹。然后,使用適合于序列比對的軟件(例如,TMAP軟件)(其針對來自Ion Torrent PGM的數(shù)據(jù)特定調整的短讀取值比對器)將獲得的核酸序列與具有已知基因型的基因序列的集合進行比對。當病原體是HCV時,具有已知基因型的基因序列的集合可以收集自公眾可得的“丙型肝炎病毒(HCV)數(shù)據(jù)庫項目”,其最初由國家過敏和傳染病研究所的微生物和傳染病部門(Division of Microbiology and Infectious Diseases of the National Institute of Allergies and Infectious Diseases,NIAID)資助。
由于病毒的高突變率,獲得的核酸序列將完全匹配于數(shù)據(jù)庫中的單一已知基因序列是不可能的。此外,數(shù)據(jù)庫中儲存的許多已知的基因序列是彼此高度類似的。因此,對于各核酸序列,獲得基于BLAST比對分數(shù)與核酸序列最密切匹配的具有已知基因型的基因序列的子集S。從As(系統(tǒng)發(fā)生樹上S中的已知基因序列的最低共有祖先)的基因型推斷核酸序列的基因型。系統(tǒng)發(fā)生樹T上的節(jié)點N的集合的最低共同祖先被定義為T中在N中具有所有節(jié)點作為后代的最低節(jié)點。生物學上,As代表S中已知基因序列的進化親代。使用該方法,基因分型精確度改善,因為使用來自與核酸序列密切匹配的基因序列的所有基因型信息。此外,如果與核酸密切匹配的基因序列具有不同的基因型,則可以推斷重組。類似地,如果相同樣品中的核酸序列具有不同的基因型,則可以推斷共感染。
本發(fā)明的方法的一個優(yōu)點是,可以通過查看BLAST結果來檢測重組或不尋常的序列變異。此外,也可能當最高匹配涉及來自不同基因型的序列時檢測這一點??赡苁褂帽景l(fā)明的方法來使用重疊群序列直接構建系統(tǒng)發(fā)生樹,其中可將所述序列置于所述樹的與一種或其它基因型更近的一些部分中。通常,在該情況下很難檢測到重組。
與本發(fā)明的方法相關的另一個優(yōu)點是,檢測共感染,例如病原體的至少兩種株系、基因型或亞型(例如HCV的兩種不同的基因型或亞型)共感染的能力。
上述方法的子方面涉及檢測選自包含細菌或病毒的微生物的病原體。如本文所使用,細菌可優(yōu)選選自已經(jīng)發(fā)展對于藥物諸如抗生素的耐受性的人致病細菌,例如甲氧西林耐受的金黃色葡萄球菌菌株(MRSA)、抗生素耐受的肺炎克雷伯氏菌菌株、抗生素耐受的結核分枝桿菌菌株、或毒素產(chǎn)生細菌,諸如EFIEC(腸出血性大腸桿菌菌株)。
優(yōu)選檢測或確定其基因型或亞型的病毒的實例選自人致病性病毒,包括HIV、HCV、HBV、諾羅病毒、冠狀病毒、乳頭瘤病毒、腺病毒、皰疹病毒。
本發(fā)明的方法優(yōu)選用于檢測選自HCV、HIV、HBV、人皰疹病毒(例如CMV)等的病毒的病毒基因型/亞型的存在或不存在和確定。
當致病病毒是HCV時,本發(fā)明的方法特別非常適合于多于一種基因型或亞型的基因分型或共感染的檢測。
當致病病毒是HCV時,本發(fā)明的方法特別適合于多于一種基因型或亞型的基因分型或共感染的檢測,其中表明感染的共有序列(目標序列)是包含核苷酸位置8614和9298的HCV NS5B基因組區(qū)域的片段。
本發(fā)明的方法特別適用于分析臨床樣品,其中所述臨床樣品源自選自以下的患者:
a)懷疑被HCV感染的患者,
b)已知被HCV感染的患者,其中HCV的基因型和/或亞型是未知的,
c)先前未用抗病毒藥物治療的患者;
d)已經(jīng)用抗病毒藥物治療的患者,
e)對抗病毒藥物不響應的患者,
f)被似乎對抗病毒藥物耐受的HCV感染的患者,
g)被HCV感染且在臨床試驗中用抗病毒藥物治療的患者。
本發(fā)明的方法優(yōu)選包括測序步驟,其中通過下一代測序測定核苷酸序列。
當通過測序所述共有核酸(目標)序列的片段和將測序信息組裝成重疊群來測定序列時,本發(fā)明的方法是特別合適的。
本發(fā)明的方法特別適合于使用軟件算法(例如,MIRA組裝器,參見http://www.chevreux.org/projects_main.html)將核酸序列讀取值組裝成重疊群序列。
在本發(fā)明的方法中,使用適合于序列比對的軟件(例如,BLAST)將各重疊群與表明所述病原體的已知基因序列進行比對。
本發(fā)明還涵蓋包含實施本文提及的方法的步驟的軟件路徑的軟件產(chǎn)品。
本發(fā)明還涉及選擇治療療法的方法,其包括進行任何前述段落的方法和基于所述確定所述病原體的基因型/亞型的方法的結果選擇治療。在本發(fā)明的該方面的優(yōu)選實施方案中,用于治療病原體感染的療法是對于選自HCV、HIV、HBV、皰疹病毒(例如CMV)的病毒特異性的。本發(fā)明的該方面的最優(yōu)選的實施方案涉及HCV感染的治療。本發(fā)明的該方面中的表明HCV感染的共有序列是HCV基因組區(qū)域NS5B或其片段。優(yōu)選地,該片段包含核苷酸位置8614和9298。然而,明確地考慮使用其它HCV基因組區(qū)域用于確定合適的基因型或亞型特異性治療性處理。
本發(fā)明還涉及選擇HCV感染的受試者的治療療法的方法,其包括進行任何前述段落的方法。例如,當患者被HCV基因型1感染時,用例如特拉匹韋加上干擾素和利巴韋林或Boceprivir加上干擾素和利巴韋林治療是合適的。對于其它基因型,例如HCV2、3和4,可以選擇用干擾素加上利巴韋林治療。
本發(fā)明還涉及適用于閱讀軟件來進行任何上述用于檢測病原體(例如HCV)的基因型的存在和確定病原體(例如HCV)的基因型的方法的裝置。該裝置能夠執(zhí)行軟件中提供的方法步驟。
應當理解,盡管本發(fā)明已經(jīng)結合本文所述的實施方案進行描述,前述描述以及隨后的實施例意欲說明而非限制本發(fā)明的范圍。本發(fā)明的范圍內(nèi)的其它方面、優(yōu)點和改變對于本發(fā)明所屬領域中的技術人員將是顯而易見的。本文提及的所有專利和出版物都以其整體通過引用并入本文。
提出以下實施例,以便為本領域技術人員提供如何制備和使用本發(fā)明的組合物的完全公開和描述。實施例意欲作為本發(fā)明的非限制性實例。盡管已經(jīng)作出努力以確保關于變量諸如量、溫度等的精確度,但應當考慮實驗誤差和偏差。除非此外指出,否則份是重量份,溫度是攝氏度,壓力為大氣壓或接近大氣壓。所有組分均商業(yè)獲得,除非另有說明。
實施例
獲得自人患者的血液樣品用于提取核酸,所述核酸后面進行準備步驟,用于使用Ion Torrent半導體測序裝置的下一代測序。
作為表明HCV的存在的共有序列,選擇包含核苷酸位置8614和9298的NS5B區(qū)域。
NGS測序用于測定上述選擇的表明HCV的共有序列的核酸序列。使用適合于測序讀取值組裝的MTRA(http://mira-assembler.sourceforge.net/docs/DefinitiveGuideToMIRA.html)完成該步驟。
用使用廣泛接受的多重序列比對算法MAFFT(http://mbe.oxfordjournals.org/content/30/4/772)和系統(tǒng)發(fā)生樹構建算法(例如最大似然http://code.google.eom/p/phyml/)的軟件構建具有已知HCV基因型的基因序列的集合的系統(tǒng)發(fā)生樹。
使用適合于序列比對的軟件(例如,來自IonTorrent的TMAP)將獲得的共有核酸序列與表明所述病原體的具有已知基因型的基因序列的集合進行比對。
確定與獲得的共有核酸序列具有高相似性的基因序列的子集。確定前述步驟中與獲得的共有核酸序列具有高相似性的基因序列的子集的步驟d)中的系統(tǒng)發(fā)生樹中的最低共同祖先。
基于前述步驟中獲得的結果,診斷樣品中存在的病原體基因型/亞型。