本申請涉及基因突變檢測技術領域,具體而言,涉及一種用于制備和分析核酸的方法和體系(systems)。
背景技術:
基于核酸的檢測能檢測到樣品中特定核酸(DNA或RNA)的存在。它已被用于各種臨床和診斷。對于傳染性疾病,基于核酸的診斷能夠從感染的生物體內(nèi)檢測到DNA或RNA。對于非傳染性疾病,基于核酸的診斷可用于檢測特定基因或與疾病相關基因的表達。臨床和診斷的一個主要關注是檢測具有重要臨床意義的低水平突變和少量等位基因的能力。能夠辨別突變在很多方面非常重要,尤其是對從組織樣本中和體液如血漿或血清進行癌癥早期檢測;評估手術或化療后的疾病殘留;疾病分期和預后的分子圖譜或個性化治療;監(jiān)測治療結果和癌癥緩解/復發(fā)。高效檢測癌癥相關的體細胞突變很大程度上取決于所用的技術和方法。
大規(guī)模平行DNA測序引領了劃時代的核酸檢測方法,僅用傳統(tǒng)的Sanger方法一小部分時間和成本識別成百上千億的堿基對。不像傳統(tǒng)技術簡單報告平均基因型,這些技術能統(tǒng)計很多單獨的DNA片段,檢測出混合物中輕微的突變。然而,這種深度測序的方法有局限性。雖然在理論上,當深度測序足夠數(shù)量的分子時,任何大小的DNA亞群都是可以檢測的,在樣本制備和測序過程中導致的誤差使得實際的檢測受限。混合物的PCR擴增也由于隨機的和非隨機的擴增偏向性導致群體偏差(population skewing),進而導致特定變異的代表性不足或者過多(Kanagawa T.Bias and Artifacts in Multitemplate Polymerase Chain Reactions(PCR).J Biosci Bioeng.2003;96:317-23.)。
因此,有必要提供富集少數(shù)群體等位基因和基因突變的系統(tǒng)和方法。
技術實現(xiàn)要素:
本申請旨在提供一種富集少量等位基因和突變的體系和方法,以解決現(xiàn)有技術中的問題。
為了實現(xiàn)上述目的,根據(jù)本申請的一個方面,本發(fā)明提供了一種指數(shù)擴增一個或多個雙鏈靶核酸的方法。該方法包括:(a)雙鏈靶核酸和接頭末端相連得到雙鏈核酸,其中接頭包括(i)配對區(qū)域和(ii)非配對區(qū)域;(b)提供(i)接頭引物,此引物可互補或雜交到非配對區(qū)域的引物結合位點和(ii)目標特異性引物,此引物可互補或雜交到靶核酸的結合位點;(c)擴增末端相連的雙鏈核酸,擴增反應體系包括接頭引物和目標特異性引物。
非配對區(qū)域可以是環(huán)(ring)結構,5’和/或3’突出(overhang),或形成泡泡形(bubble)結構。在一些實施例中,非配對區(qū)域是一個環(huán)。在這種情況下,這個環(huán)含有尿嘧啶,且需在擴增前由尿嘧啶DNA糖基化酶(UDG)切割環(huán)。特異性引物、接頭引物或兩者都可以在5’端包含一個標簽序列。標簽序列可用于檢測,測序,克隆和/或擴增。
在其他實施例中,擴增反應體系還包括第一阻斷物,(i)此阻斷物與靶核酸中的野生型等位基因相匹配或互補,(ii)能夠通過DNA聚合酶延伸。擴增反應體系可以進一步包括具有與野生型等位基因相匹配或互補的第二阻斷物。第一或第二阻斷物包含一個或多個修飾的核酸或鍵。例如,第一阻斷物或第二阻斷物可以在3’端有一個修飾的核酸或鍵。修飾的核苷酸或鍵包括PNA,LNA,2’-O-甲基核酸,2’-O-烷基核酸,2’-氟核酸,硫代磷酸酯鍵以及它們的任意組合。在一些實施例中,第一或第二阻斷物不與接頭引物或目標特異性引物重疊。
在上述方法中,靶核酸可以是細胞游離核酸(cfNA),細胞游離DNA(cfDNA)或循環(huán)腫瘤DNA(ctDNA)。靶核酸長度在20bp到20kb之間,如20bp到2kb,20bp到1kb,或20bp到200bp。在一些例子中,靶核酸覆蓋編碼EGFR T790M,EGFR L858R,BRAF V600E,BRAF V600K BRAF V600D,BRAF V600G,BRAF V600A,或BRAF V600R的區(qū)域。
上述方法可用于獲得一個或多個雙鏈靶核酸的序列。該方法包括根據(jù)上述方法獲得的第一批擴增分子,對第一批擴增分子進行第二次擴增反應獲得第二批擴增產(chǎn)物并測序所獲得的產(chǎn)物,此擴增反應包括一對帶有條形碼(barcode)的引物。
上述方法可用于評估患有癌癥或懷疑有癌癥的個體。此方法包括從該個體中獲得生物樣本;并根據(jù)上述方法檢測生物樣本中是否存在一個或多個靶核苷酸。生物樣本包括血清、血漿、全血、唾液和痰。在一些實施例中,評估方法還包括決定或推薦基于所述一個或多個靶核苷酸存在時的治療方案。在另一些實施例中,該方法進一步包括在所述一個或多個靶核酸存在時實施所述治療方案。擴增反應可以是多重擴增反應。
另一方面,本發(fā)明提供擴增靶核酸的試劑盒。試劑盒包括(a)接頭,接頭包括(i)配對區(qū)域和(ii)非配對區(qū)域;(b)和非配對區(qū)域互補部分互補的接頭引物,和(c)與靶核苷酸結合位點互補的目標特異性引物。試劑盒還可以包括(d)第一阻斷物,與靶核酸的野生型等位位點相匹配或互補的一段序列和(II)能被DNA聚合酶延伸,或(e)第二阻斷物,和野生型等位位點互補相匹配或者互補的一段序列。非配對區(qū)域可以是一個環(huán),5’和/或3’突出,或一個泡泡形(bubble)。優(yōu)選地,非配對區(qū)域是一個環(huán),可以包含尿嘧啶。至少引物和阻斷物之一包含一個或多個修飾核酸或修飾的鍵,包括但不限于PNA,LNA,2’-O-甲基核酸,2’-O-烷基核酸,2’-氟核酸,硫代磷酸酯鍵以及它們的任意組合。在一些實施例中,目標特異性引物或接頭引物或兩者都可以在5’端包含一段標簽序列。標簽序列可用于檢測,測序,克隆和/或擴增。例如,標簽可以包括一段和測序引物完全相同或者幾乎完全相同的序列用于測序。測序引物例如Illumina P5 barcode引物,Illumina P7 barcode引物,Ion Torrent A barcode引物和Ion Torrent P1 barcode引物。在這種情況下,試劑盒也可以包括一個或多個包含標簽的引物和已知的測序引物,例如Illumina P5 barcode primer,Illumina P7 barcode primer,Ion Torrent barcode primer和Ion Torrent P1 barcode primer。
本發(fā)明涉及準備和分析核酸的方法和體系。本發(fā)明所述的方法和體系可用于檢測特定核酸并用于分析。
本發(fā)明至少部分基于有效富集DNA并且準確擴增目標區(qū)域的方法。一個方面,發(fā)明提供了新方法將唯一標識碼(unique identification,UID)整合到對一個特定目標的特異性擴增。和傳統(tǒng)以PCR為基礎的方法相比,本發(fā)明可使測序更準確,更能檢測罕見的突變。在檢測和擴增大量DNA樣本中的極少量DNA時,本發(fā)明可以通過UID來計算富集的極少量DNA模板(例如ctDNA或者cfDNA)的含量,因此特別有用。
本發(fā)明披露了用于分析的一種或多種核酸制備方法:
(a)將目標雙鏈核酸和接頭在核酸連接的條件下連接成雙鏈核酸,所述接頭包括(i)配對區(qū)域和(ii)非配對區(qū)域;
(b)提供(i)目標特異性引物,其與靶核酸的結合位點互補;和/或,(ii)接頭引物,其與非配對區(qū)域互補鏈上的引物結合位點互補;
(c)在目標特異性引物和/或接頭引物存在的條件下進行擴增反應擴增末端相連的雙鏈靶核酸分子,產(chǎn)生第一個擴增分子。
例如,圖1所示的擴增gRNA片段的方法。圖上部是U型Illumina接頭,帶有UID和T突出。以U型Illumina接頭為例,許多其他的接頭(例如,Y形接頭,泡泡形接頭(bubble adapters),splinkerette接頭)也都可以使用。這種接頭在目標靶核酸上沒有引物結合位點來啟動PCR。
如圖1步驟1所示,接頭連接到目標gDNA片段。在這個特定的例子中,接頭的環(huán)形區(qū)有一個尿嘧啶(U)。一旦接頭連接上以后,可以用DNA糖基化酶(UDG)和/或其他合適的限制性內(nèi)切酶去除尿嘧啶打開環(huán)形區(qū)域,從而產(chǎn)生5′端突出。
如圖1步驟2所示,5’端突出含有和接頭引物(如Illumina P7)完全相同或者幾乎完全相同的序列,5’端突出的互補序列為接頭引物提供了結合位點,通過結合目標gDNA內(nèi)的特定位點來擴增。
在步驟2,gDNA與目標特異性引物(或基因特異性引物,GSP)和接頭引物(例如,Illumina P7)連接。開始,基因特異性引物合成核酸之前,Illumina P7無法合成或者延伸核酸。在此合成/延伸過程中,阻斷物(圖1中兩個條形)被引入,直到基因特異性引物(如Illumina P5)延伸到接頭引物結合和擴增的接頭區(qū)域。這種設計可以避免大量的非特異性擴增。步驟2獲得的引物延伸物可以用作目標特異性模板獲得更多的拷貝。多個不同的基因特異性引物可以用類似的方式,但以平行的,多重的方式構建文庫用于后續(xù)的高通量分析。在一些實施例中,也可以使用巢式目標特異性引物(相對于步驟2的目標特異性引物的巢式)。
目標特異性引物和靶核酸雜交。在一些實施例中,不同目標特異性的引物混合物雜交到一個核酸的不同部分。在一些實施例中,使用不同的目標特異性引物優(yōu)勢明顯,因為相對于靶核酸,可以產(chǎn)生不同的帶有重疊但是交錯的序列。在一些實施例中,不同的延伸產(chǎn)物可以測序獲得重疊的序列數(shù)據(jù)(sequence reads)。在一些實施例中,重疊的序列數(shù)據(jù)(sequence reads)可以評估序列的準確度,核酸擴增的保真度,和/或檢測突變的可信度,如檢測染色體重排位置(例如,融合斷點fushion breakpoints)。在一些實施例中,不同目標特異性引物的混合物可以雜交到樣品中的不同靶核酸的不同部分。在一些實施例中,使用不同目標特異性引物的混合物優(yōu)勢明顯,因為它有利于同時處理(如擴增)和分析不同的靶核酸。在一些實施例中,使用2,3,4,5,6,7,8,9,10,15,20,100個或更多的不同的目標特異性引物混合物。在一些實施例中,使用2到5,2到10,5到10,5到15,10到15,10到20,10到100,50到100個或更多的不同的目標特異性引物。
在一些實施例中,目標特異性引物可能5’端除了雜交序列外,包括額外序列。此額外序列可能包含條形碼(barcode)序列,索引序列(index),接頭序列或者測序引物位點。例如,圖1的步驟3進行第二次PCR完成文庫構建,其中加入條形碼(barcode)序列(Illumina barcodes P5和P7)。在一些實施例中,擴增產(chǎn)物在步驟2,3或4后進行純化。第二次PCR的擴增產(chǎn)物(步驟4)可以直接用于分析。例如,步驟4的產(chǎn)物可以用于測序(如NGS)。
每個片段的UIDs可以用來確定ctDNA的絕對數(shù)量,驗證交叉污染和進行其他分析,例如,生物信息學分析。UID是驗證PCR/測序錯誤的常用技術。通常UID連接在每個DNA片段上,目標片段用探針識別(例如www.genomics.agilent.com/article.jsp?pageId=3083)。然而,這種依賴于探針的富集方法成本高而且耗時。相比較,用本發(fā)明所述接頭和基因特異性引物的方法富集片段可以將文庫制備時間從4到7天縮短到約1天。和傳統(tǒng)的PCR方法相比,本方法還有下述優(yōu)勢:測序準確度更高(可以檢測罕見突變)和總DNA(如cfDNA)中極少量DNA(如ctDNA)的準確定量,因為UID可以鑒別富集產(chǎn)物來自于多少腫瘤DNA。
接頭(Adapters)
本發(fā)明用寡核苷酸接頭對核酸序列進行指數(shù)擴增,擴增產(chǎn)物在每端有不同的核酸序列。
接頭包括一個可連接的末端和至少一個非配對或者單鏈區(qū)域。非配對區(qū)域可以是任何大小,例如,從至少約3個核苷酸到200個核苷酸(nt),如5到150nt,10到100nt和15-50nt。在實施例中,非配對區(qū)域大小應滿足引物結合以擴增,至少引物的3‘端可以和接頭的非配對區(qū)域匹配。單鏈區(qū)、末端或突出(overhang)是接頭任一端(5’或3’端)的單鏈核酸序列的延伸,其中接頭的長鏈不和另一條鏈(反鏈)的反向互補配對(見圖1)。實施例中,突出部分長至少約3到200個核苷酸(nt),優(yōu)選5到150nt,10到100nt和15-50nt。
可用于本發(fā)明的接頭包括雙鏈接頭,圖1所示的U形接頭,Y形接頭和專利US20100222238所述的泡泡形接頭(bubble adapter),AA型和Uren等所述的splinkerette形接頭(Nat Protoc.2009;4(5):789-98.)。
接頭包括至少一個阻斷物基團。本文所使用的阻斷物基團是一種可以阻斷核酸延伸的試劑或者替代物(例如,通過DNA聚合酶或DNA連接酶),因此可以防止含有阻斷物的核酸擴增。脫氧核苷酸2’末端可能的3’阻斷物包括3’脫氧,3’磷酸,3’氨基,或3’-O-R核酸,其中R表示烷基,烯丙基,芳基或雜環(huán)基。在特定的實施例中,第二個非對稱尾部接頭包括一個阻斷物。此處所用的“雙鏈”是指成對的核酸序列,其中兩個鏈基本上是互補的,這樣兩個鏈可以形成一個成對的結構(例如,雙螺旋)。正如本行業(yè)人員所熟知,兩條鏈可能包含一個或多個不匹配,但仍然保留配對結構。在特定的實施例中,配對是穩(wěn)定的。
如本文所述,接頭包括一個可連接的末端。可連接末端具有平末端或者粘末端的雙鏈寡核苷酸上的一段序列。本行業(yè)人員很容易理解,平末端是指雙鏈核酸在5’或3’端沒有突出,粘末端指的是在5‘或3’端有突出。平末端和粘末端都可以連接到另外一個互補端。本文所述的互補末端是指能和另外一段平末端核酸序列相連接的一段平末端或者能與另外一段帶有反向互補粘末端相連接的粘性末端。因此,粘性末端依賴于序列連接,而平末端不依賴于序列連接?;パa的末端,因此也是可連接末端可以通過本行業(yè)的標準方法制備。例如,核酸序列的互補末端可以由5’和/或3’末端的限制性內(nèi)切酶酶切制備。在另一個實施例中,核酸序列的互補末端(例如,通過退火,結扎,或重組)通過在其5’端和/或3’端引入接頭來制備,其中接頭包括互補末端或者包括可以產(chǎn)生互補末端的限制性內(nèi)切酶的識別位點。平末端可以通過位點特異性的核酸內(nèi)切酶酶切制備(例如,限制性核酸內(nèi)切酶),非特異性DNA雙鏈特異性核酸內(nèi)切酶(如依賴于Mn2+的DNA聚合酶I)或隨機打斷(例如,通過超聲波,聲波或通過迫使DNA溶液在壓力下通過一個小的孔的水打斷(hydrophobic shearing)。在隨機打斷或者DNA酶消化以后,DNA末端往往磨損(frayed)(包含短的有或者無末端磷酸基團的5’或3’突出)。磨損末端通過鈍化或者修復(healing)轉換為可連接末端。鈍化或者修復使用如下一個或多個方式:DNA聚合酶,dATP、dCTP、dGTP和dTTP混合物,具有較強的3’至5’和5’至3’的核酸外切酶活性的DNA聚合酶,多核苷酸激酶,ATP,單鏈DNA特異性核酸外切酶,單鏈DNA特異性核酸內(nèi)切酶。
在本發(fā)明中,上述接頭連接到靶核酸導入接頭引物的結合位點。如圖1所示,接頭引物和基因特異性引物一起讓引物延伸和/或擴增靶核酸。
此處使用的引物結合位點包括結合整個引物長度的序列或一段可以和引物3‘端足夠部分的序列,此足夠部分足以讓引物結合以延伸和/或擴增。優(yōu)選地,接頭的非配對或者單鏈區(qū)域并不直接提供或者包含接頭引物的結合位點。只有當基因特異性引物延伸并且填補了不平的末端,才能產(chǎn)生結合位點。參見圖1的步驟3。也就是說,接頭引物(如圖2所示的Illumina P7)和接頭的非配對單鏈區(qū)雜交。
阻斷物
在某些實施例中,本發(fā)明所提供的方法包括與一個特定的核酸變異(如野生型變種)相匹配或互補的寡核苷酸阻斷物。這種阻斷物的例子包括在美國申請?zhí)?2/244,279所描述的,其內(nèi)容被整體納入本文作為參考。這些阻斷物可以阻止或抑制特定核酸變異的擴增,從而允許其他變種的富集(例如突變體)。相應地,本發(fā)明提供了用于檢測目標區(qū)域中的核酸變異是否存在的富集系統(tǒng)和方法。
在這些實施例中,本發(fā)明的富集反應體系包括上述引物、阻斷物和用于PCR擴增的必需成分。如圖2A-C所示,本發(fā)明的體系包括(i)和正向引物結合或者雜交到同一條鏈的第一阻斷物和(ii)和反向鏈或者互補序列結合或者雜交的第二阻斷物。一對引物(即一條正向引物和一條反向引物)用于擴增含有熱點突變的區(qū)域和阻斷物用來阻止核酸變異體的擴增(例如一個豐富等位基因變異,如野生型等位基因)。阻斷物是和核酸變異體互補的一段寡核苷酸(如野生型等位基因)。它的3'端和目標變異完全匹配。例如它和野生型等位基因退火,可以通過DNA聚合酶延伸。溶解溫度與寡核苷酸(Oligo)長度高度相關。通過延長阻斷物長度,阻斷物可以承受更高的反應溫度,從而保持與野生型等位基因的結合。另一方面,在一個較低初始反應溫度,阻斷物也可以退火到突變的等位基因,但是,因為突變的等位基因的突變堿基不匹配阻斷物的3'端,延伸不會發(fā)生。一旦溫度上升,阻斷物會從突變等位基因的解鏈。因此阻斷物和野生型緊密結合因而阻斷物相對容易從突變等位基因變性解鏈。反應中引物可以擴增目標區(qū)域。由于阻斷物和野生型退火,引物延伸無法通過阻斷區(qū),因此突變的等位基因優(yōu)先擴增。
以圖2A為例,阻斷物和野生型等位基因退火,延伸的寡核苷酸阻斷物阻斷了外引物的擴增。在圖2B中,每個寡核苷酸阻斷物3’端錯配,不和突變等位基因退火,從而允許外引物擴增。圖2C,非特異性延伸只在這個循環(huán)中導致特定模板變異的擴增失敗,沒有形成假陽性的PCR產(chǎn)物。
本發(fā)明所述體系優(yōu)于等位基因特異性PCR(AS-PCR),系統(tǒng)提供優(yōu)越的等位基因特異性PCR(AS-PCR),也稱為ARMS(Newton C,et al.Nucleic acids.1989;17(7):2503-2516),ARMS是一種目前仍然不成熟(tried-and-true)的熱點突變富集技術。在AS-PCR中,引物的3’端和目標變異(variant)完全匹配,從而允許特定突變擴增。Qiagen Therascreen EGFR and Roche Cobas EGFR都采用這種技術。然而,等位基因特異性引物的非特異性擴增的固有缺點降低了靈敏度,導致區(qū)分稀有突變和野生型的可靠性不高。據(jù)記錄,Therascreen的檢測靈敏度(LOD)是0.5%-7.02%,COBAS為5%。
如上所述,阻斷物(本文有時也稱”阻斷寡核苷酸”)和要抑制的特定核酸變異互補,如豐富等位基因變異(例如野生型等位基因)。阻斷物可以是單鏈的短寡核苷酸,長度不超過100nt,更優(yōu)選地50nt或更少,更為優(yōu)選地30nt或更少,最優(yōu)選地20個nt或更少,最少可至5nt。
阻斷物和此處公開的引物在某些情況下可以使用本領域現(xiàn)有的各種技術進行修飾以避免3’或5’外切酶活性。阻斷物可以包括一個或多個修飾以防止3’或5’外切酶活性。此類修飾包括但不限于2’-O-甲基核苷酸修飾,硫代磷酸骨架的修飾、二硫代磷酸酯骨架的修飾、氨基磷酸酯骨架的修飾,甲基磷酸酯骨架的修飾,3’端磷酸修飾和3’烷基取代。在一些實施例中,阻斷物由于有一個或多個修飾而抵御3’和/或5‘外切酶活性的攻擊。
阻斷物的3’端和目標特定核酸變異完全匹配。在一些實施例中,阻斷物和野生型等位基因完全退火,可以通過DNA聚合酶延伸。
阻斷物的溶解溫度(Tm)與它的長度高度相關。阻斷物的Tm可以從40到70℃,如40至70℃,41至69℃,42至68℃,43至67℃,44至66℃,或約53至約56℃,或二者內(nèi)的任意區(qū)間。在另一實施例中,阻斷物的Tm值可以比PCR循環(huán)中的退火/延伸溫度高約3至6℃。
在一些實施例中,阻斷物在PCR擴增時不被剪切。根據(jù)本發(fā)明,阻斷物可以是可延伸的也可以是不可延伸的。在一些實施例中,該阻斷物可以在3‘端包括不可延伸阻斷基團(moiety)。在一些實施例中,該阻斷物還可在3’端,5‘端和/或二者之間包括其他部分(包括但不限于其他不可延伸基團,淬滅基團,熒,光基團等)在其3’-端,5’端,和/或任何內(nèi)部位置之間。在其他情況下,阻斷物是可延伸的,在3’端不含任何不可延伸的阻斷基團。在這種情況下,阻斷物在PCR中可以延伸。通過延伸阻斷寡核苷酸的長度,阻斷物可以承受較高的反應溫度,從而保持與野生型等位基因緊密結合。
引物
根據(jù)本發(fā)明,正向引物和/或反向引物可以與一個或多個目標核酸變異的不同位置互補(完全或部分)。例如,在某些情況下當和目標區(qū)域雜交時,正向引物或反向引物的3’端可以距離目標區(qū)域的核酸變異0,5,10,15,20,25,30,35,40,45,50,55,60,80,100,250,500,1000,2000或更多的核苷酸。在一些實施例中,在和目標區(qū)域雜交時,正向引物或反向引物的3’端距離目標區(qū)域中的一個或多個核酸變異小于約30個核苷酸。該引物可以是10-50nt之間的寡聚體,例如,約15-30,約16-28,約17-26,約18-24或約20-22或二者之間的任何長度范圍。
在某些情況下,正向或反向引物和阻斷物可以重疊和競爭雜交到部分或全部的目標區(qū)域。例如,引物和阻斷物可以重疊0,5,10,15或更多的核苷酸。在一些實施例中,引物和阻斷物不重疊或不競爭雜交到部分或全部的目標區(qū)域。
上述引物和/或阻斷物可以包括一個或多個修飾的堿基或不同于自然存在的堿基的核苷堿基(nucleosidic bases)(即腺嘌呤、胞嘧啶、鳥嘌呤、胸腺嘧啶和尿嘧啶)。在一些實施例中,修飾堿基仍然可以有效地雜交到含有A,T,C,U或者T的核酸上。在一些實施例中,修飾堿基可以增加配對和錯配的目標序列的Tm值和/或減少錯配效率,因此不僅提高檢測特異性,也可以提高選擇性。
修飾堿基是指那些不同于自然發(fā)生的堿基,通過加上或刪除一個或多個功能基團,雜環(huán)(heterocyclic ring)結構有差異(即雜原子替代碳原子,反之亦然),和/或加上一個或多個連接臂到堿基上。在一些實施例中,自然發(fā)生的堿基所有的互變異構形式,修飾堿基和堿基類似物也可包括在寡核苷酸引物和本發(fā)明的阻斷物中。
一些修飾堿基的例子包括7-deazapurines堿基類似物及其衍生物和吡唑并嘧啶(pyrazolopyrimidines)及其衍生物類(參考WO 90/14353和us20100285478,將其內(nèi)容通過引用整體并入本文)。這種類型的堿基類似物包括鳥嘌呤類似物6-amino-1H-pyrazolo[3,4-d]pyrimidin-4(5H)-one(ppG),腺嘌呤類似物4-amino-1H-pyrazolo[3,4-d]pyrimidine(ppA),和黃嘌呤類似物1H-pyrazolo[4,4-d]pyrimidin-4(5H)-6(7H)-dione(ppX)。這些堿基類似物,當用在本發(fā)明某些實施例的寡核苷酸中時,可以加強雜交并提高錯配識別力。
此外,在一些實施例中,根據(jù)本發(fā)明,寡核苷酸的一個或多個核苷酸亞基包括修飾的糖基或糖基類似物。糖基的修改包括但不限于糖的2',3’和/或4’的碳原子替代,糖不同的差向異構體,糖苷鍵α或β-構型的差異,和其他異構體變化。糖部分包括但不限于戊糖,己糖,脫氧戊糖,己糖,脫氧核糖,脫氧己糖,核糖,脫氧核糖,葡萄糖,阿拉伯糖,木糖、pentofuranose,木糖,來蘇糖,和環(huán)戊基。
LNA(locked nucleic acid)類型的修改通常涉及核糖和脫氧核糖核苷酸的戊糖變化,約束或“鎖定”的A型構象DNA中的N型構造中的糖基。在一些實施例中,鎖定可以通過1,2:5,6-di-o-isopropylene-α-D-阿洛糖中的2‘-O,4’-C的亞甲基鍵獲得。在其它實施例中,鎖苷酸的亞磷酰胺單體在此修飾的基礎上合成。(參考Wengel J.,Ace.Chem.Res.,32:301-310(1998),U.S.Pat.No.7,060,809;Obika,et al.,Tetrahedron Lett 39:5401-5405(1998);Singh,et al.,Chem Commun 4:455-456(1998);Koshkin,et al.,Tetrahedron 54:3607-3630(1998),每個內(nèi)容被整體納入本文作為參考)。
在一些優(yōu)選的實施例中,修飾的堿基包括8-aza-7-deaza-da(PPA),8-aza-7-deaza-dg(PPG),2’-Deoxypseudoisocytidine(ISO dC),5-氟-2’-脫氧尿苷(fdU),LNA,或2’-O,4’-c-ethylene橋聯(lián)核酸(ENA)堿基??稍诒景l(fā)明中使用的其他修飾堿基的例子在美國專利(專利號7517978)有描述,其內(nèi)容被整體納入本文作為參考引用。
許多修飾堿基包括LNA,ppA,PPG,5-fluoro-du(fdU)是市售的,可用于寡核苷酸合成。在一些實施例中,可以使用業(yè)界熟知的標準的化學方法來合成修飾引物和阻斷物。例如,在一些實施例中,修改的部分或堿基可以通過引入(a)修飾核苷作為DNA合成的支持,(b)修飾的核苷作為亞磷酰胺,(C)DNA合成的試劑(如芐胺處理過的酰胺單體插入DNA序列),或(d)通過合成后修飾。
由于核苷酸結構的靈活性,一些錯配的堿基對可以局部形成沃森-克里克結構。這使得阻斷物能夠延伸通過突變等位基因,阻斷效率下降。LNA和一些其他核酸類似物結構更嚴謹(more rigid structure),可以緩解這個問題。所用的阻斷物在目標變異點上或者附近可以包含一個或者2個LNA。
在一些實施例中,修飾堿基合成在引物或者阻斷物的3’端。在一些實施例中,修飾堿基位于1-6個核苷酸之間,比如距離引物或者阻斷物的3’端2,3,4或5個核苷酸遠。在一些優(yōu)選的實施例中,修飾堿基合成在引物或者阻斷物的3’最末端。
修飾的核苷酸間的鍵也可以存在于本發(fā)明所公開的引物和阻斷物中。這種修飾的鍵包括但不限于多肽、磷酸、磷酸二脂鍵、磷酸烷基酯,alkanephosphonate、thiophosphate、phosphorothioate,phosphorodithioate,methylphosphonate,phosphoramidate,substituted phosphoramidate等。幾個進一步修飾的堿基,糖基和/或核苷酸間的鍵,和它們作為阻斷物和/或引物的寡核苷酸使用,和本領域的合成技術相關。
具有3’到5‘外切酶活性的DNA聚合酶能夠從引物的3’端去除錯配堿基,因而阻斷物的不同的堿基可以切除。硫代磷酸酯鍵比磷酸二酯鍵更耐核酸外切酶活性;因此它被用在阻斷物的3’端。
方法
上述系統(tǒng)可用于各種識別,富集和/或定量靶核酸或樣品中的等位基因變異的方法中。
本發(fā)明公開了一種方法,通常包括在一個或多個阻斷物存在的情況下,用正向引物和反向引物擴增目標區(qū)域。該阻斷物包括一段需要富集的核酸變異不存在的情況下和目標區(qū)域互補的序列。該方法可以進一步檢測目標區(qū)域的擴增。本發(fā)明方法檢測核酸變異具有很高的靈敏度,在某些情況下檢測限(LOD)約0.01%至0.001%。
如圖2A,當阻斷物和核酸變異(如野生型變異)退火時,阻斷物延伸并阻止PCR擴增,從而阻止遠端的正向引物和反向引物延伸。在一些實施例中,正向引物或反向引物可以距離阻斷物雜交的區(qū)域0,5,10,15,20,25,30,35,40,45,50,55,60,80,100,250,500,1000,2000或更多的核苷酸。在一些實施例中,該阻斷物具有足夠高的Tm值,不會被復制的正向引物或反向引物取代。在一些實施例中,擴增反應中使用的酶不具有鏈置換活性。
各種DNA聚合酶可用于本發(fā)明。在一些案例中,本發(fā)明所用的擴增目標區(qū)域的酶包括但不限于高保真DNA聚合酶和可以修復3’外切酶活性的酶。用于本發(fā)明的酶舉例如下,包括但不限于Pfu Turbo Hotstart DNA聚合酶,PhusionTM Hot Start High Fidelity DNA聚合酶,Phusion HotTM Start II High Fidelity DNA聚合酶,PhireTM Hot Start DNA聚合酶,PhireTM Hot Start II DNA聚合酶,KOD Hot Start DNA聚合酶,Q5High Fidelity Hot Start DNA聚合酶,AmpliTaq,Phusion HS II,Deep Vent,和Kapa HiFi DNA聚合酶。
擴增核酸序列的一般方法是行業(yè)中眾所周知的。任何這樣的方法都可以為本發(fā)明的方法所采用。在一些實施例中,使用數(shù)字PCR擴增的方法,如Vogelstein和Kinzler所描述("Digital PCR,"PNAS,96:9236-9241(1999);通過引用全文并入本文)。這種方法包括將帶有目標區(qū)域的樣品在擴增前稀釋。稀釋包括稀釋到常規(guī)板、多孔板、納米孔,以及稀釋到微板(micropads)或微滴。(參見Beer N R,et al.,"On-chip,real-time,single-copy polymerase chain reaction in picoliter droplets,"Anal.Chem.79(22):8471-8475(2007);Vogelstein and Kinzler,"Digital PCR,"PNAS,96:9236-9241(1999);and Pohl and Shih,"Principle and applications of digital PCR,"Expert Review of Molecular Diagnostics,4(1):41-47(2004);所有這些都通過引用全文并入本文)。當與數(shù)字PCR結合使用時,本發(fā)明可以大大提高數(shù)字PCR的靈敏度。部分是由于當檢測遺傳案例(events)包括稀有遺傳案例時,本發(fā)明提供了顯著抑制野生型背景的方法(如至少約60%,65%,70%,75%,80%,85%,90%,95%,97%,98%,99%,99.9%,99.99%,99.999%,或約100%)。通過本發(fā)明方法提供的靶向靈敏度可在單個數(shù)字PCR反應的體積中檢測出更多的目標。
當用PCR(如數(shù)字PCR)用于檢測罕見的遺傳病(genetic events)時,在給定的反應混合物中絕大多數(shù)events是野生型序列,極少數(shù)包含罕見的遺傳事件。本發(fā)明方法可以有效抑制野生型,如大于1:10000。在一些實施例中,因為對野生型擴增的有效抑制,可以從10000個野生型中檢測出一個稀有目標,由于有效的結合抑制野生型擴增,不抑制擴增單一的罕見的目標。
本發(fā)明方法可以進一步包括使用本領域中任何檢測方法檢測目標區(qū)域的擴增。例如,檢測可以通過獲得擴增產(chǎn)物的溶解曲線,通過質譜,或通過對擴增產(chǎn)物測序。擴增產(chǎn)物根據(jù)其核酸變異的類型和數(shù)量顯示出不同的溶解曲線。確定溶解曲線的方法在本領域眾所周知,任何此類方法都可用于本發(fā)明方法。質譜法和測序法也都是本領域眾所周知的技術。參見Sambrook and Russell,Molecular Cloning:A Laboratory Manual,(3rd ed.)(2001)and Plum,Optical Methods,Current Protocols in Nucleic Acid Chemistry,2001-2011,所有這些都通過引用全部并入本文;參見Current Protocols in Nucleic Acid Chemistry,2001-2011,特別是Liquid Chromatography-Mass Spectrometry Analysis of DNA Polymerase Reaction Products;通過引用全文并入本文。核酸測序方法也是常用的并且在本領域眾所周知,任何測序方法都可用于本發(fā)明方法。參見Current Protocols in Molecular Biology,1995-2010;通過引用全文并入本文。
本發(fā)明方法還包括通過比較擴增產(chǎn)物的量和目標區(qū)域的核酸變異是否存在相關聯(lián)的預先確定的量來檢測目標區(qū)域的擴增。檢測擴增或確定擴增產(chǎn)物的量的方法是眾所周知的,任何這樣的方法都可以采用。見Sambrook and Russell,Molecular Cloning:A Laboratory Manual(3rd ed.)(2001)和Gallagher,Current Protocols Essential Laboratory Techniques,2008);所有這些都通過引用全文并入本文。
本發(fā)明方法可以檢測核酸變異包括目標區(qū)域的突變、缺失和/或插入。缺失包括目標區(qū)域的堿基的去除??梢詸z測的目標區(qū)域缺失包括1個缺失,2個缺失,3個缺失,4個缺失,5個缺失或更多個缺失(如數(shù)百或數(shù)千)。突變包括但不限于替換(如顛換和轉換),無堿基位點,交聯(lián)位點,和化學改變或修飾的堿基??梢詸z測的目標區(qū)域突變包括1個突變,2個突變,3個突變,4個突變,5個突變或更多個突變。插入包括核苷酸加入到目標區(qū)域??梢詸z測的目標區(qū)域插入包括插入1個堿基,2個堿基,3個堿基,4個堿基,5個堿基或更多個堿基(如數(shù)百或數(shù)千)。在一些實施例中,本發(fā)明方法可以檢測到一個缺失、突變和/或插入。
本發(fā)明公開的體系和方法可減少假陽性,假陽性是AS-PCR最大的不足。阻斷引物和野生型DNA退火,阻止它的擴增,因此突變DNA被優(yōu)先擴增(圖2A和2B)。偶然的等位基因非特異性阻斷物的延伸對富集結果幾乎沒有影響(圖2C)。沒有被阻斷的野生型擴增在隨后的NGS測序中可以識別出來。
本發(fā)明公開的體系和方法可以有效地阻斷超過99.9%的野生型擴增,可以顯著放大突變位點的擴增,從1/10000到1/14,亦即從約0.01%到約14%。罕見的假陽性不會通過等位基因特異y引物的非特異性延伸導入,而是由DNA聚合酶導致核苷酸摻入錯誤。采用具有3’到5‘外切酶活性的高保真聚合酶可以進一步降低了罕見的假陽性。
應用
本發(fā)明公開的方法可以用于富集或檢測多個目標靶核酸。靶核酸可以是雙鏈核酸一部分或單鏈核酸。
核酸樣品來源包括但不限于人類細胞,如血液,培養(yǎng)的細胞和腫瘤細胞。還有其他哺乳動物組織,血液和培養(yǎng)的細胞也是核酸的合適來源。此外,病毒、噬菌體、細菌、真菌和其他微生物也可以是核酸的來源。DNA可以是基因組也可被克隆在質粒、噬菌體、細菌人工染色體(BAC),酵母人工染色體(YAC)或其他載體。RNA可直接從相關的細胞中分離出來,也可以從合適的RNA啟動子體外擴增或體外轉錄。本發(fā)明可用于人類,動物或者其它來源的基因組DNA變異的檢測。它在遺傳性或獲得性疾病或功能失調(diào)的分析中特別有用。一個特定的用途是在遺傳性疾病和癌癥的檢測。
在一些實施例中,模板序列或核酸樣品可以是基因組DNA。在其他實施例中,模板序列或核酸樣品可以是cDNA。在其他的實施例中,如通過RT-PCR實時分析基因的表達,模板序列或核酸樣品可以是RNA。DNA或RNA模板序列或核酸樣品可以從任何類型的組織中提取,例如石蠟包埋的腫瘤標本(FFPE)。
在一些實施例中,靶核酸鏈可以來源于個體的一個細胞,如哺乳動物(如人類)、植物、真菌(如酵母)、原蟲、細菌或病毒。例如,靶核酸可以在目標生物體的基因組上(如染色體上)或染色體外的核酸。在一些實施例中,靶核酸可以是RNA,例如mRNA。在其他一些實施例中,靶核酸可以是DNA(例如雙鏈DNA)。
在特定實施例中,靶核酸可以是特定生物的,即靶核酸不存在于其他生物中或不存在于和感興趣生物接近的生物體中。在一些實施例中,靶核酸可以是病毒核酸。例如,病毒核酸可以是人類免疫缺陷病毒(HIV),流感病毒(例如甲型流感病毒,乙型流感病毒,或丙型流感病毒),或登革病毒。靶核酸可以存在于細菌中。在一些實施例中,靶核酸可以是原生生物核酸。在一些實施例中,靶核酸是一種真菌(例如酵母)核酸。
在一些優(yōu)選的實施例中,靶核酸可以是哺乳動物(例如人)核酸。例如哺乳動物核酸可以存在于循環(huán)腫瘤細胞,上皮細胞或成纖維細胞中。在其他例子中,靶核酸是在個體血液中自由循環(huán)的核酸,如癌癥患者血液中的細胞游離核酸(cfNA)或循環(huán)腫瘤DNA(ctDNA)。為了最有效利用從病人血漿中獲得的有限的細胞游離核酸量(cfNA),使用多重PCR和通用PCR反應程序。多重檢測可以同時檢測一系列的驅動突變,這是全面的肺癌液體活檢的要求。
在血液和其他身體組織中發(fā)現(xiàn)的細胞游離DNA可以用于檢測和診斷許多遺傳性疾病。有多種方法用于非侵入性產(chǎn)前遺傳診斷。無創(chuàng)性產(chǎn)前遺傳診斷可對從病人血液中獲得細胞游離DNA進行檢測。細胞游離DNA也可用于檢測或監(jiān)測患者的腫瘤細胞的存在。
為了達到CAP建議的5天交貨周期(Lindeman NI,Cagle PT,Beasley MB,et al.Molecular testing guideline for selection of lung cancer patients for EGFR and ALK tyrosine kinase inhibitors:guideline from the College of American Pathologists,International Association for the Study of Lung Cancer,and Association for Molecular Patho.Arch Pathol Lab Med.2013;137(6):828-860.doi:10.5858/arpa.2012-0720-OA),文庫制備流程已經(jīng)優(yōu)化到4個小時。據(jù)估計,包括樣品運輸,測序,數(shù)據(jù)分析和注釋,液體活檢的交貨周期為4天。
在一個例子中,目標鏈是一個包含特定變異的鏈,如單核苷酸多態(tài)性(SNP)或基因突變。這種突變的例子包括點突變,易位,或反轉。
在一些實施例中,本文所公開的組成成分、方法和/或試劑盒,可在診斷中用于檢測循環(huán)細胞。在一個實施例中,組成成分、方法和/或試劑盒可用于檢測血液中的腫瘤細胞DNA,用于早期癌癥診斷。在一些實施例中,組成成分、方法和/或試劑盒可用于癌癥或疾病相關的遺傳變異或體細胞突變檢測和驗證。在一些實施例中,組成成分、方法和/或試劑盒可用于基因分型的四-,三-和二等位基因SNPs(allelic SNPs)。在其他實施例中,組成成分、方法和/或試劑盒可用于識別單個或多個核苷酸插入或缺失。在一些實施例中,組成成分、方法和/或試劑盒可用于混合DNA樣品中DNA分型做QC和人體識別檢測,檢測細胞污染的細胞系QC,等位基因表達分析,病毒分型/罕見病原體檢測,從混合樣本中檢測突變,在血液中檢測循環(huán)腫瘤細胞,和/或產(chǎn)前診斷。
在一些實施例中,當靶核酸是RNA時,樣品可以反轉錄成DNA模板和模板DNA可以被打斷。在一些實施例中,目標RNA在反轉錄前可以先打斷。在一些實施例中,從新鮮組織或降解組織中抽提出來的核酸包含目標DNA的樣本時可適用于本發(fā)明所述方法,cDNA測序無需去除gDNA,cDNA測序無需去除rRNA,任何步驟中無需機械或者酶打斷;采用隨機的六聚體將RNA合成為雙鏈cDNA。
在一些實施例中,一個已知的靶核酸可以包含基因重排產(chǎn)生的融合序列。在一些實施例中,本文所述方法適用于確定基因重排與否和/或鑒定。在一些實施例中,基因重排的一部分是已知的(例如,由基因特異性引物針對的基因重排的部分)和其他部分的序列確定可使用本發(fā)明公開的方法。在一些實施例中,基因重排可涉及致癌基因。在一些實施例中,基因重排可以組成融合致癌基因。
在一些實施例中,靶核酸可從適當?shù)臉颖局蝎@得(例如,食品樣本、環(huán)境樣本、生物樣本,如血液樣本等)。在一些實施例中,樣本是從研究對象獲得的生物樣本。在一些實施例中,樣本可以是從研究對象獲得的診斷樣本。在一些實施例中,樣本還包括蛋白質、細胞、液體(fluids)、體液、保存液、和/或其他物質。一些非限制性的實施例中(By way of non-limiting example),樣本可以是口腔拭子、血液、血清、血漿、痰液、腦脊髓液、尿液、眼淚、肺泡分離物、胸腔積液、心包積液、囊液、腫瘤組織、組織、組織活檢、唾液、呼吸物、或它們的組合。在一些實施例中,可以通過切除或活檢來獲得樣本。
在一些實施例中,樣本是新鮮收集的。在一些實施例中,樣本在使用前已經(jīng)儲存過。在一些實施例中,樣本是未經(jīng)處理的。此處所述“未經(jīng)處理的樣本”是指生物樣本除了稀釋或者懸浮在溶液中外,并沒有任何前處理。在一些實施例中,樣本是從研究對象處獲得并在使用前保存或者處理過。一些非限制的例子中(By way of non-limiting example),樣本可以石蠟包埋,冷藏或冷凍。根據(jù)本文所述的方法和組合物,在確定核酸存在之前,可以解凍冷凍樣本。在一些實施例中,樣本可以用是加工過或處理過的樣品。處理或加工樣本的方法包括但不限于離心、過濾、超聲、勻漿、加熱、冷凍和解凍,放入保存液(如抗凝血劑或核酸酶抑制劑)及其任何組合。在一些實施例中,樣品可以用化學和/或生物試劑處理?;瘜W和/或生物試劑可以用來保護和/或維持加工或儲存過程中樣本或核酸的穩(wěn)定性。此外,化學和/或生物試劑可用于從樣本中釋放核酸。一些非限制性的例子(By way of non-limiting example)中,血液樣本在使用前可以用抗混凝劑處理。本發(fā)明公開了用于核酸分析的樣本加工,保存或處理的方法和過程。在一些實施例中,樣品可以是澄清的液體樣本,例如通過離心。在一些實施例中,可以通過低速離心(例如3000x G或更少)澄清樣品,并收集包括澄清的液體樣本的上清液。
在一些實施例中,樣品中的核酸在使用前可以被分離、富集或純化。從樣品中分離、富集或純化核酸的適當方法可被使用。例如從不同種類的樣本中提取基因組DNA的試劑盒是市售的(例如Catalog Nos.51104,51304,56504,and 56404;Qiagen;Germantown,Md.)。在一些實施例中,本文所述方法涉及用于富集靶核酸的方法,例如在靶核酸序列測定之前。在一些實施例中,在測序前靶核酸的一端的序列是未知的。在一些實施例中,本文描述的方法涉及在使用第二代測序(next generation sequencing,NGS)獲得核苷酸序列之前富集特定核苷酸序列的方法。在一些實施例中,富集特定核苷酸序列的方法不包括雜交富集。
多重擴增反應
本發(fā)明公開的方法可以采用多重擴增的方式。在本文所述的方法的實施例中,多重應用包括確定臨近于一個或多個已知靶核酸序列的核酸序列。此處所用的“多重擴增”是指在一個反應管里同時擴增多個靶核酸的過程。在一些實施例中,方法涉及到使用一套或多套引物得到的多重擴增產(chǎn)物的序列測定。多重是指在一個反應中檢測2-1000不同的目標序列。此處所用的多重是指在一個反應中在2到1000之間的任何范圍,如5-500,25-1000,或10-100個不同的目標序列。術語多重PCR是指在同一PCR反應中引物可以特異性的檢測至少兩個不同的目標序列。
在一些實施例中,樣本中或樣本一部分中的靶核酸可以用多個引物擴增(例如多個第一和第二目標特異引物)。在一些實施例中,多個引物(例如多個第一和第二目標特異性引物)可以存在于一個單一的反應混合物中,例如多個擴增產(chǎn)物可以在同一反應混合物中產(chǎn)生。在一些實施例中,多個引物(例如多個第一和第二目標特異性引物)可以特異性地退火到由分開的基因組成的已知目標序列中。在一些實施例中,至少兩組引物(例如至少兩組第一和第二目標特異性引物)可以特異性地退火到已知目標序列的不同部分。在一些實施例中,至少兩組引物(例如至少兩組第一和第二目標特異性引物)可以特異性地退火由一個單一基因組成的已知目標序列的不同部分。在一些實施例中,至少兩組引物(例如至少兩組第一和第二目標特異性引物)可以特異性地退火到包括已知目標序列的基因的不同外顯子上。在一些實施例中,多個引物(例如第一條目標特異性引物)可以包括相同的5’標記序列部分。
在此處所述方法的實施例中,多重擴增的應用包括確定在一個測序反應中多個樣本中的一個或多個已知靶核酸序列臨近的核酸序列。在一些實施例中,多個樣本可以是不同的來源,例取自不同的組織和/或不同的個體。在這樣的實施例中,引物可以進一步包括條形碼(barcode)部分。在一些實施例中,帶有唯一條形碼的引物可以被添加到每個樣本并連接到核酸上。在這樣的實施例中,每個擴增產(chǎn)物的測序讀長將包括一個條形碼,該條形碼識別包含模板核酸的樣本。
癌癥相關用途
在一些實施例中,樣本可以從患有某種遺傳改變的疾病、需要治療的個體中獲得,例如癌癥或遺傳性疾病。在一些實施例中,已知的目標序列是存在于疾病相關基因中。
在一些實施例中,樣本從需要治療癌癥的個體中獲得。在一些實施例中,樣本包括一群腫瘤細胞,如至少一個腫瘤細胞。在一些實施例中,樣本包括腫瘤活檢,包括但不限于,未經(jīng)處理的活檢組織或處理過的活檢組織(例如,甲醛固定和/或石蠟包埋的活檢組織)。
在本文中所述方法的一些實施例中,確定所公開的序列可以提供與疾病治療相關的信息。因此,在一些實施例中,本發(fā)明公開的方法可以用于治療疾病。在一些實施例中,樣本可以是從一個需要治療的和遺傳改變相關的疾病相關的患者獲得。在一些實施例中,目標序列是與疾病相關的基因的序列,例如致癌基因。在一些實施例中,目標序列可以包含疾病相關的突變或遺傳異常,例如SNP,插入,刪除,和/或基因重排。在一些實施例中,目標序列是基因重排的產(chǎn)物。在一些實施例中,基因重排可以是致癌基因,例如融合致癌基因。
某些癌癥的治療方法對包含某些致癌基因或突變的腫瘤特別有效,例如治療試劑針對那些含有融合致癌基因驅動(action)或表達的腫瘤有效而對不含融合致癌基因的腫瘤無效。本文中所描述的方法可以方便確定特定的序列,揭示致癌基因狀態(tài)(例如突變,SNPs和/或重排)。在一些實施例中,當側翼序列是已知的,本文所述方法可以進一步測定特定序列。本文所述方法可以測定設計已知基因(致癌基因)的基因重排,在使用本方法前已知基因的精確位置和重排對象未知。
在一些實施例中,本文所述的技術涉及治療癌癥的方法。相應地,在一些實施例中,本文提供的方法可能涉及從需要治療癌癥的個體所獲得的腫瘤樣本中檢測一個或多個致癌基因重排是否存在;并對任何檢測到的具有致癌基因重排的腫瘤給予治療。在一些實施例中,本文所述的技術涉及確定需要癌癥治療的個體是否對所給予的治療有響應。因此,在一些實施例中,本文提供的方法可能涉及從個體獲得的腫瘤樣本中檢測致癌基因的重排是否存在,其中如果檢測到致癌基因重排,個體應會對靶向致癌基因重排的治療有響應。
本發(fā)明公開的體系和方法在下述領域特別有用(a)從組織活檢和血漿或血清等體液中進行早期癌癥檢測;(b)評估手術后或放/化療后殘留病灶;(C)疾病分期和預后的分子圖譜或將患者治療個性化;和(d)治療效果和緩解/癌癥復發(fā)的監(jiān)測。
癌癥可以包括但不限于源自上皮組織的惡性腫瘤,包括腺癌、淋巴瘤、母細胞瘤、黑色素瘤、肉瘤、白血病、鱗狀細胞癌、小細胞肺癌,非小細胞肺癌、胃腸道癌、霍奇金和非霍奇金淋巴瘤、胰腺癌、腦膠質瘤、基底細胞癌、膽管癌,膀胱癌,腦癌包括膠質母細胞瘤和髓母細胞瘤;乳腺癌、宮頸癌、絨毛膜上皮癌;結腸癌、直腸癌、子宮內(nèi)膜癌(endometrial carcinoma)、子宮內(nèi)膜癌(endometrial cancer);食管癌、胃癌;各種類型的頭頸部癌、上皮內(nèi)腫瘤包括Bowen’s病和Paget’s??;血液腫瘤包括以急性淋巴細胞和粒細胞白血?。籏aposi’s肉瘤、毛細胞白血病;慢性髓細胞性白血病,艾滋病相關的白血病和成人T細胞淋巴瘤;腎癌如腎細胞癌、急性T細胞淋巴白血病/淋巴瘤,淋巴瘤包括霍奇金病、淋巴細胞性淋巴瘤;肝癌如肝癌(hepatic cancer)、肝癌(hepatoma)、Merkel細胞癌(Merkel cell carcinoma)、黑色素瘤、多發(fā)性骨髓瘤;神經(jīng)母細胞瘤;口腔癌包括鱗狀細胞癌;卵巢癌包括上皮細胞產(chǎn)生的,肉瘤(sarcoma)包括平滑肌肉瘤、橫紋肌肉瘤、脂肪肉瘤、fibROS1arcoma,骨肉瘤;胰腺癌;皮膚癌包括黑色素瘤,基質細胞皮膚癌、生殖細胞和間充質細胞;pROS ltate癌、直腸癌;外陰癌、腎癌包括腺癌;睪丸癌包括生殖腫瘤如精原細胞瘤、非精原細胞瘤(畸胎瘤、絨毛膜癌)、間質腫瘤、生殖細胞腫瘤;甲狀腺癌包括甲狀腺腺癌和髓樣癌;食管癌、唾液腺癌和Wilm’s瘤。在一些實施方案中,癌癥可以是肺癌,如非小細胞肺癌。
非小細胞肺癌(NSCLC)
美國癌癥死亡數(shù)預計在2015年為589430例((Siegel RL,Miller KD,Jemal A.Cancer statistics,2015.CA Cancer J Clin.2015;65(1):5-29)。在所有的癌癥中,非小細胞肺癌(NSCLC)是癌癥死亡的頭號原因,占22.8%。鉑類聯(lián)合化療方案可以稍微提高晚期非小細胞肺癌患者生存率9%(Spiro SG,Rudd RM,Souhami RL,et al.Chemotherapy versus supportive care in advanced non-small cell lung cancer:improved survival without detriment to quality of life.Thorax.2004;59(10):828-836)。相比之下,考慮腫瘤基因分型的針對性治療大大提高了治療效果。例如,吉非替尼是一種針對表皮生長因子受體(EGFR)的小分子酪氨酸激酶抑制劑(TKI),和通常的20%化療響應率相比,響應率高達75%,中位生存期28.2個月對比10.3個月。(參考Paez JG,Ja PA,Tracy S,et al.EGFR Mutations in Lung Cancer:Correlation with Clinical Response to Gefitinib Therapy.2004;304(June):1497-1501和Barr Kumarakulasinghe N,Zanwijk N Van,Soo R a.Molecular targeted therapy in the treatment of advanced stage non-small cell lung cancer(NSCLC).Respirology.February2015)。然而,有針對性的治療并沒有受益所有的非小細胞肺癌患者。高療效依賴于患者體內(nèi)存在的致癌驅動基因。這些突變是分子異常,導致或者維持腫瘤的生長,可被直接針對每個基因組改變來negated。如沒有靶向位點,吉非替尼對具有野生型EGFR基因的NSCLC只有極低的0-6.6%響應率,但對EGFR突變的患者,有75%的響應率。(參考Douillard J-Y,Shepherd F a,Hirsh V,et al.Molecular predictors of outcome with gefitinib and docetaxel in previously treated non-small-cell lung cancer:data from the randomized phase III INTEREST trial.J Clin Oncol.2010;28(5):744-752;Hirsch FR,Varella-Garcia M,Bunn P a.,et al.Molecular Predictors of Outcome With Gefitinib in a Phase III Placebo-Controlled Study in Advanced Non-Small-Cell Lung Cancer.J Clin Oncol.2006;24(31):5034-5042;Maruyama R,Nishiwaki Y,Tamura T,et al.Phase III study,V-15-32,of gefitinib versus docetaxel in previously treated Japanese patients with non-small-cell lung cancer.J Clin Oncol.2008;26(26):4244-4252;and Mok T,Wu Y.Gefitinib or carboplatin–paclitaxel in pulmonary adenocarcinoma.Engl J 2009:947-957)。因此在靶向治療前要求檢測驅動基因。
組織活檢是鑒定突變的主要來源。然而,它并不適用于非小細胞肺癌患者。約75%的NSCLC患者在診斷時處于晚期(參考Reade C,Ganti A.EGFR targeted therapy in non-small cell lung cancer:potential role of cetuximab.Biol targets Ther.2009:215-224),但固體活檢(solid biopsy)在檢測腫瘤間和腫瘤內(nèi)的異質性時,具有固有缺點,這種異質性往往導致耐藥性。事實上,腫瘤的異質性是使用靶向療法治療癌癥的一個主要挑戰(zhàn)(Yancovitz M,Litterman A,Yoon J,et al.Intra-and inter-tumor heterogeneity of BRAF(V600E)mutations in primary and metastatic melanoma.PLoS One.2012;7(1):e29336)。液體活檢作為一個有吸引力的方法有可能捕捉到一個全面的基因組改變圖譜,從而提供有效的靶向治療。此外,液體活檢容易重復,可以動態(tài)監(jiān)測腫瘤,因此,在治療過程中指導用藥改變。液體活檢也可能被用于手術或治療后,監(jiān)測可能導致復發(fā)的殘留病灶(Diehl F,Schmidt K,Choti M a,et al.Circulating mutant DNA to assess tumor dynamics.Nat Med.2008;14(9):985-990)。此外它可作為輔助工具,作為后續(xù)護理中監(jiān)測復發(fā)的標志(參考Misale S,Yaeger R,Hobor S,et al.Emergence of KRAS mutations and acquired resistance to anti-EGFR therapy in colorectal cancer.Nature.2012;486(7404):532-536和Diaz L a,Williams RT,Wu J,et al.The molecular evolution of acquired resistance to targeted EGFR blockade in colorectal cancers.Nature.2012;486(7404):537-540.)。然而,由于循環(huán)腫瘤核酸(ctNA)和循環(huán)腫瘤細胞含量很低,再加上檢測方法導致的人為錯誤,液體活檢仍然未能用于醫(yī)生的臨床應用。
本發(fā)明公開的體系和方法可作為可靠和快速的液體活檢檢測方法用于晚期NSCLC患者。發(fā)展這樣一個可靠和快速的檢測方法的障礙是雙重的,目前沒有可用的平臺能克服二者。
第一個是靈敏度。即使在晚期NSCLC患者中循環(huán)腫瘤DNA(ctDNA)也是極少的。Newman等在晚期NSCLC患者的血漿檢測到0.4%-3.2%的ctDNA(參考Newman AM,Bratman S V,To J,et al.An ultrasensitive method for quantitating circulating tumor DNA with broad patient coverage.Nat Med.2014;20(5):548-554)。常用的定量PCR(qPCR)可以達到約1%的檢測限(LOD)和下一代測序技術(NGS)大多可以達到1-2%的LOD。在這方面最有前途的數(shù)字PCR有0.01%的LOD(參考Detection of rare mutations in blood samples by droplet digital PC at www.bio-rad.com/webroot/web/pdf/lsr/literature/Bulletin_6317.pdf.)。
第二是多重能力??砂l(fā)現(xiàn)的突變數(shù)量和有限的血液樣本使得單重檢測不適合液體活檢。因此液體活檢的一個重要特征是從單一的血漿DNA中同時檢測多個驅動突變。NGS是目前唯一成熟的可以提供足夠的多重檢測能力的平臺。
本文所公開的液體活檢專注于鑒定可操作的致癌基因突變以指導治療選擇。大約75%的非小細胞肺癌診斷時是轉移性或晚期(參考Reade C,Ganti A.EGFR targeted therapy in non-small cell lung cancer:potential role of cetuximab.Biol Targets Ther.2009:215-224)和適合靶向治療。在這些患者中,腫瘤異質性很高。本文的主要目的是在異質性腫瘤細胞群體中檢測具有臨床意義的突變(actional mutations),然后密切監(jiān)測腫瘤對治療的反應和分子阻力的升高?;颊咴诤罄m(xù)的護理中也大大受益于液體活檢。研究發(fā)現(xiàn),分子檢測能在放射檢查前幾個月發(fā)現(xiàn)復發(fā)(參考Misale S,Yaeger R,Hobor S,et al.Emergence of KRAS mutations and acquired resistance to anti-EGFR therapy in colorectal cancer.Nature.2012;486(7404):532-536,和Diaz L a,Williams RT,Wu J,et al.The molecular evolution of acquired resistance to targeted EGFR blockade in colorectal cancers.Nature.2012;486(7404):537-540)。
本發(fā)明公開的系統(tǒng)和方法可以用來富集和檢測一些熱點突變包括編碼EGFR T790M,EGFR L858R,BRAF V600E,BRAF V600K,BRAF V600D,BRAF V600G,BRAF V600A,BRAF V600R,和KRAS G12V的突變。
EGFR T790M突變在TKI靶向治療的患者中是一種常見的獲得性突變患者,突變導致在EGFR790位置上甲硫氨酸取代蘇氨酸。這種突變增加了EGFR對ATP的親和力和對抑制劑的結合有競爭優(yōu)勢(參考Yun C-H,Mengwasser KE,Toms A V,et al.The T790M mutation in EGFR kinase causes drug resistance by increasing the affinity for ATP.Proc Natl Acad Sci,USA.2008;105(6):2070-2075)。有低至5%的癌細胞獲得這種突變時,患者就開始出現(xiàn)對TKI的敏感性降低(參考Lindeman NI,Cagle PT,Beasley MB,et al.Molecular testing guideline for selection of lung cancer patients for EGFR and ALK tyrosine kinase inhibitors:guideline from the College of American Pathologists,International Association for the Study of Lung Cancer,and Association for Molecular Patho.Arch Pathol Lab Med.2013;137(6):828-860)。因此,有必要密切監(jiān)視T790M突變的出現(xiàn)。T790M的檢測可以幫助醫(yī)生的用藥時使用第三代EGFR TKI抑制劑或中斷治療(參考Watanabe S,Tanaka J,Ota T,et al.Clinical responses to EGFR-tyrosine kinase inhibitor retreatment in non-small cell lung cancer patients who benefited from prior effective gefitinib therapy:a retrospective analysis.BMC Cancer.2011;11(1):1.)。EGFR L858R是致癌基因,占所有EGFR激活的肺癌的43%(參考Mitsudomi T,Yatabe Y.Epidermal growth factor receptor in relation to tumor development:EGFR gene and cancer.FEBS J.2010;277(2):301-308.doi:10.1111/j.1742-4658.2009.07448.x)。
除了上述點突變外,其他核酸變異或突變可以通過本發(fā)明的方法和體系進行富集和/或擴增。核酸變異的例子包括在美國專利號62/244279中描述的,如在表A和表B中所列出的(US Application No.62/244,279通過引用整體并入本文)。
表A富集的具有臨床意義突變列表List of actionable mutations to be enriched
表B ALK and ROS1融合位點列表
本發(fā)明公開了本文所公開的系統(tǒng)和方法,提供最好的一流的液體活檢產(chǎn)品。相比于電子增強液體活檢可能占用的Illumina HiSeq的全部功能,由一個單一的活檢樣本(Sullivan M.Guardant Health takes another$50M for“l(fā)iquid biopsy”cancer test.2015.http://venturebeat.com/2015/02/03/guardant-health-takes-another-50m-for-ground-breaking-liquid-biopsy-test/),測定了非公開存在突變的DNA在體外使致癌突變更敏感的檢測,可以使用相同的HiSeq測序過程中的10000個樣本容量。
在一些實施例中,本文所述方法和治療癌癥患者或診斷為癌癥患者相關。癌癥患者可以由醫(yī)生用現(xiàn)有的診斷方法診斷。例如,確診肺癌的特征和綜合性狀在業(yè)界為人所熟知,包括但不限于,呼吸微弱,鎖骨上方的淋巴結腫大,肺部聲音異常,胸部聽診時有濁音和胸痛。有助于診斷肺癌的檢查包括但不限于X射線,血液檢測某些高水平的物質(如鈣),CT掃描和腫瘤活檢。肺癌家族史,或暴露于導致肺癌的危險因素(例如吸煙或暴露于吸煙和/或空氣污染)也有助于確定患者可能患有肺癌或進行肺癌診斷。
除肺癌外,本發(fā)明還公開了用于檢測其他惡性腫瘤的標志物。本發(fā)明應用的例子包括血液腫瘤標志物檢測和基因面板(panel)檢測(包括檢測淋巴瘤和白血病的基因組重排),腫瘤相關的基因組重排和基因面板(panel);檢測IgH/TCR淋巴瘤基因重排及用于淋巴瘤檢測的基因面板(panel)。
組成成分和試劑盒
本發(fā)明包括組成成分或由前面提到的接頭、引物和阻斷物組成的反應混合物。該組成成分可以進一步包括核酸聚合酶、核苷酸和檢測試劑中的一種或多種。
檢測劑可以是核酸探針,如分子信標探針或標記熒光基團和淬滅劑基團的Yin-Yang探針(參考US Patent Nos.U.S.Pat.Nos.5925517,6103476,6150097,6270967,6326145,and7799522)。除上述試劑外,該組合物還可包括如下的一個或多個成分:鹽類,如NaCl,MgCl2,KC1,MgSO4;緩沖液如a Tris buffer,N-(2-Hydroxyethyl)piperazine-N'-(2-ethanesulfonic acid)(HEPES),2-(N-Morpholino)ethanesulfonic acid(MES),MES sodium salt,3-(N-Morpholino)propanesulfonic acid(MOPS),N-tris[Hydroxymethyl]methyl-3-aminopro-panesulfonic acid(TAPS);增溶劑;洗滌劑,如Tween-20的非離子洗滌劑;核酸酶抑制劑等。
本發(fā)明包括用于擴增、富集和/或用于檢測靶序列的試劑盒和診斷體系。為此,用于本發(fā)明所述方法的一個或多個組分都以試劑盒的形式提供,用于靶核酸的富集和檢測。在此試劑盒中,可用于一個或多個反應的組分以一個或多個容器(containers)提供(例如通過靜電相互作用或共價鍵)。
可用于本文所述方法對靶核酸擴增、富集或測序(如NGS測序或Sanger測序)的試劑盒可以包括一個或多個以下成分:一個或多個接頭,正向引物,反向引物,一個或多個阻斷物、核酸聚合酶、核苷酸和檢測探針。試劑盒的額外組分包括但不限于一種或多種不同的聚合酶,一條或多條擴增對照或靶核酸的引物,一條或多條檢測對照或靶核酸的探針,聚合反應的緩沖液(以1x或濃度的形式),和一種或多種檢測聚合產(chǎn)物的染料或熒光分子。該試劑盒還包括一個或多個以下組分:支持、終止、修改或消化試劑、滲透劑和一個用于檢測探針的檢測裝置。
用于擴增或檢測的反應組分以各種形式提供。例如,組分(如酶、核苷三磷酸,接頭,阻斷物和/或引物)可以懸浮在水溶液或凍干或干粉,顆粒或珠。在后者的情況下,當組分重新溶解時形成可用于檢測的混合物。
試劑盒包括所述組分的任何組合和使用說明,這些組分的量可用于至少一個檢測。在一些應用中,一個或多個反應成分以單次使用的量預裝在一次性使用的試管中。在此情況下,檢測靶核酸的待檢測樣本可以放入到單個試管中直接擴增。試劑盒提供的組分的量可以是任何適當?shù)牧?,并可能取決于產(chǎn)品的目標市場。決定適當?shù)牧康闹笇г瓌t下面可以找到,Joseph Sambrook and David W.Russell,Molecular Cloning:A Laboratory Manual,3rd edition,Cold Spring Harbor Laboratory Press,2001;and Frederick M.Ausubel,Current Protocols in Molecular Biology,John Wiley&Sons,2003。
本發(fā)明的試劑盒可以包括任何用于實施本發(fā)明方法的試劑或物質。這些物質包括但不限于:細胞裂解液(包括緩沖液),二價陽離子的螯合劑或其他抑制不需要的核酸酶的試劑,用于確保酶復合物與其他反應成分正常工作的對照DNA,DNA斷裂試劑(包括緩沖液),擴增反應試劑(包括緩沖液),洗脫液。本發(fā)明的試劑盒可在任何溫度下提供。例如,用于存儲包含在液體中的蛋白質組分或它們的復合物的時候,希望保持在低于0℃,優(yōu)選在或低于-20℃,或以其他方式保持在冷凍狀態(tài)。
盛放組成成分的器皿可以是任何傳統(tǒng)的能盛放東西的容器,例如微量離心管,安瓿瓶,瓶,或綜合測試設備,如流體設備、盒子、橫向流動,或其他類似的設備。該試劑盒可包括用于檢測靶核酸的標記或未標記的核酸探針。在一些實施例中,所述試劑盒可以進一步包括使用所述方法中的組分的使用說明。用于此類試劑盒和體系的傳統(tǒng)包裝材料包括固體基質(如玻璃、塑料、紙張、鋁箔、微粒等),它們可以盛放反應組分或者檢測探針(例如在小瓶,微孔板,芯片等)。
體系,除了包含試劑盒組分,還可包括用于檢測的儀器,如用于檢測標記探針信號的照度計(luminometer)。
使用指南如說明書或錄像演示詳細介紹了如何使用本發(fā)明的試劑盒或體系,也隨附試劑盒中。在另一方面,本發(fā)明提供了使用本發(fā)明的任何組分或試劑盒,使用或檢測方法,和/或使用任何儀器或試劑盒進行試驗的方法。
可選擇的,本發(fā)明的試劑盒或體系還包括軟件,以加快數(shù)據(jù)的生成、分析和/或存儲,并方便對數(shù)據(jù)庫的訪問。軟件包括邏輯指令,指令集,或計算機程序,可用于數(shù)據(jù)的收集,存儲和/或分析。使用所提供的軟件可對數(shù)據(jù)進行比較和分析。
所有上述描述的方法,試劑和體系提供了多種診斷工具,可對患者的疾病狀態(tài)進行非侵入性的血液檢查。在診斷中使用這些方法、試劑和體系,可與其他篩查如胸部X射線或CT掃描結合使用,和/或增加直接額外的檢測可提高診斷的準確性。其他方面,本發(fā)明可監(jiān)測疾病預后,監(jiān)測對特定治療方法的反應,并定期評估復發(fā)風險。本發(fā)明也可對手術前和治療后的診斷標記的變化進行評估,識別基因表達譜或反映腫瘤存在的標記,并可用于評估復發(fā)概率。
采用上述方案后,本發(fā)明與現(xiàn)有技術相比較具有以下突出的優(yōu)點和效果:相比現(xiàn)有方法,本發(fā)明的一個顯著優(yōu)勢是它們能夠從最小創(chuàng)傷的過程例如通過采取血液樣本而不分離癌細胞的情況下評估疾病狀態(tài)。目前常用的從基因表達譜對腫瘤分類需要組織樣本,通常從腫瘤取樣。如果腫瘤非常小,活檢很困難甚至不可能,如果腫瘤未知或不可見。對腫瘤樣本進行分析時要求腫瘤沒有純化或分離。血液樣本有一個額外的優(yōu)勢,材料很容易準備和后續(xù)分析穩(wěn)定。當要分析的是RNA時,這是很重要的。
附圖說明
構成本申請的一部分的說明書附圖用來提供對本申請的進一步理解,本申請的示意性實施例及其說明用于解釋本申請,并不構成對本申請的不當限定。在附圖中:
圖1示出了擴增基因組DNA的方法示意圖
圖2A,2B和2C示出了本發(fā)明的原理示意圖。其中,圖2A:阻斷物結合到野生型等位基因和延伸阻斷物阻斷了外引物的PCR擴增。圖2B:每個阻斷物寡核苷酸在3'端錯配和無法退火到突變型等位基因,從而允許通過外引物擴增。圖2C:非特異性延伸導致這一循環(huán)中特定模板擴增失敗。沒有假陽性的PCR產(chǎn)物形成。
具體實施方式
應該指出,以下詳細說明都是例示性的,旨在對本申請?zhí)峁┻M一步的說明。除非另有指明,本文使用的所有技術和科學術語具有與本申請所屬技術領域的普通技術人員通常理解的相同含義。
需要注意的是,這里所使用的術語僅是為了描述具體實施方式,而非意圖限制根據(jù)本申請的示例性實施方式。如在這里所使用的,除非上下文另外明確指出,否則單數(shù)形式也意圖包括復數(shù)形式,此外,還應當理解的是,當在本說明書中使用術語“包含”和/或“包括”時,其指明存在特征、步驟、操作、器件、組件和/或它們的組合。
需要說明的是,本申請的說明書和權利要求書及上述附圖中的術語“第一”、“第二”等是用于區(qū)別類似的對象,而不必用于描述特定的順序或先后次序。應該理解這樣使用的數(shù)據(jù)在適當情況下可以互換,以便這里描述的本申請的實施方式例如能夠以除了在這里圖示或描述的那些以外的順序實施。此外,術語“包括”和“具有”以及它們的任何變形,意圖在于覆蓋不排他的包含,例如,包含了一系列步驟或單元的過程、方法、系統(tǒng)、產(chǎn)品或設備不必限于清楚地列出的那些步驟或單元,而是可包括沒有清楚地列出的或對于這些過程、方法、產(chǎn)品或設備固有的其它步驟或單元。
正如背景技術所介紹的,現(xiàn)有技術中在許多情況下,野生型DNA大大超過突變DNA,使檢測和鑒定極低濃度少數(shù)等位基因極為困難,本發(fā)明提供了一種用于分析的一種或多種核酸制備方法:(a)將目標雙鏈核酸和接頭在核酸連接的條件下連接成雙鏈核酸,所述接頭包括(i)配對區(qū)域和(ii)非配對區(qū)域;(b)提供(i)序列和非配對區(qū)域互補鏈上的引物結合位點互補的接頭引物和(ii)序列與靶核酸上的結合位點互補的目標特異性引物;和(c)在包含接頭引物和特異性引物的擴增反應中擴增末端相連的雙鏈核酸,產(chǎn)生第一個擴增分子。
定義
“核酸”是指DNA分子(例如,cDNA或基因組DNA),RNA分子(例如,mRNA),或DNA或RNA類似物。DNA或RNA類似物可從核苷酸類似物合成。所述核酸分子可以是單鏈或雙鏈的,但優(yōu)選是雙鏈DNA。
本文所用術語“靶核酸”或“靶”是指含有靶核酸序列的核酸。靶核酸可以是單鏈或雙鏈,通常是DNA、RNA、DNA或RNA的衍生物或它們的組合?!鞍泻怂嵝蛄小薄ⅰ鞍心繕诵蛄小被颉澳繕藚^(qū)域”是指一個特定的序列,包括一個單鏈核酸序列的所有或部分。目標序列可能在核酸模板中,可以是單鏈或雙鏈核酸的任何形式。模板可以是純化或分離的核酸,或可能是非純化或非分離的。
術語“等位基因”是指在一段DNA上同一位點另一段DNA序列,例如,在同源染色體上。一個等位基因指的是同一細胞或生物體內(nèi)同源染色體上同一位點的不同DNA序列或多個細胞或生物體內(nèi)同一位置的不同DNA序列(“等位基因變異”)。在一些情況下,一個等位基因可以對應于一個特定物理位點的單核苷酸差異。在另一個實施例中,一個等位基因可以對應于核苷酸(單個或多個)的插入或缺失。
本文所用的術語“稀有等位基因變異”是指樣本中和另一個等位基因變異相比目標多核苷酸較少。稀有等位基因變異也可稱為“小的等位基因變異”和/或一個“突變的等位基因變異”,例如,對于給定的SNP位點或者基因的等位基因變異,稀有等位基因變異可能發(fā)生頻率小于1/10,1/100,1/1000,1/10000,1/100000,1/1000000,1/10000000,1/100000000或1/1000000000。另外,稀有等位基因變異可以是在每1、10、100、1000微升的樣本中或反應量中有小于2,3,4,5,6,7,8,9,10,15,20,25,50,100,250,500,750,2500,5000,7500,10000,25000,50000,75000,100000,250000,500000,750000,或1000000個拷貝。
術語“豐富等位基因”(abundant allelic variant)是指和樣本中另一等位基因變異相比目標多核苷酸含量較多。豐富等位基因變異也可指多數(shù)等位基因變異和/或野生型等位基因變異。例如,對于給定的SNP位點或者基因的等位基因變異,“豐富等位基因變異”發(fā)生頻率大于10×,100×,1000×,10000×,100000×,1000000×,10000000×,100000000×或1000000000×。另外,豐富等位基因變異可以是在每1,10、100、1000微升的樣本中或反應量中有大于2,3,4,5,6,7,8,9,10,15,20,25,50,75,100,250,500,750,1000,2500,5000,7500,10000,25000,50000,75000,100000,250000,500000,750000,1000000。
本文所用術語“擴增”和它的變體包括產(chǎn)生多個拷貝的過程或多核苷酸的至少一部分,所述的多核苷酸通常被稱為“模板”。模板可以是單鏈或雙鏈多核苷酸鏈。一個給定的模板擴增可以產(chǎn)生多核苷酸的擴增產(chǎn)物,統(tǒng)稱為“擴增產(chǎn)物”。擴增產(chǎn)物的多核苷酸是單鏈或者雙鏈或者是二者的混合物。通常,模板包括目標序列和擴增產(chǎn)物包括一段序列高度相同或者和目標序列高度互補的多核苷酸。在一些實施例中,特定擴增產(chǎn)物的多核苷酸高度相同或者相互高度互補。另外一些實施例中,擴增產(chǎn)物中多核苷酸的核酸序列彼此不同。擴增可以線性或者指數(shù)方式進行,可以對特定模板重復連續(xù)擴增,形成兩個或多個擴增產(chǎn)物。通常的擴增反應涉及到依賴于模板的連續(xù)和重復的循環(huán)來合成核酸,形成多個多核苷酸,這些多核苷酸包括至少部分的模板的核酸序列,并和模板的核酸序列至少部分相同(或互補)。在一些實施例中,每一次的核酸合成,也稱為擴增的循環(huán),包括產(chǎn)生自由的3’端(例如dsDNA的一條鏈缺口),從而連接引物和引物延伸步驟;可選的,可包括額外的變性步驟,其中包括模板部分或者全部變性。在一些實施例中,一輪擴增包括給定數(shù)量的一輪循環(huán)的擴增。例如,一輪擴增可包括5,10,15,20,25,30,35,40,50,75,100或更多特定循環(huán)的重復。在一個實施例中,擴增包括一個特定的多核苷酸模板進行兩個連續(xù)的核酸合成。合成包括依賴模板的核酸合成。
術語“阻斷物”(此處也稱為“寡核苷酸阻斷物”、“阻斷引物”、”阻斷探針”或“引物阻斷物”)能夠雜交到DNA一條鏈上的一條核酸或引物,DNA這條鏈包括一個在相同、相反或者互補鏈上的特定的等位基因變異(正向或反向引物),減少或防止特定等位基因變異的擴增。阻斷物可以設計與野生型等位基因緊密結合(豐富等位基因變異)以抑制野生型等位基因的擴增,同時相同或者相反鏈上的突變等位基因(稀有等位基因變異)可以擴增。
術語“引物”或“引物寡核苷酸”指的是單鏈核酸和/或能夠雜交到模板核酸的寡核苷酸,引物可以根據(jù)模板核酸的序列啟動堿基延伸進行核酸合成?!澳0逄禺愋砸铩被颉被蛱禺愋砸铩敝傅氖菃捂満怂峄蚰軌蚝桶泻塑账岬牟糠只蚰繕嘶螂s交的寡核苷酸?!敖宇^引物”是指接頭特異性的引物,而非靶核酸或目標基因的特異性引物。
本文術語“特異性”當用于特異性擴增靶核苷酸時,指的是引物和靶核苷酸之間互補程度很高,在某一退火溫度下引物能夠退火并間接完成(mediate)靶核苷酸的擴增,而不會退火或間接完成(mediate)樣本中非靶核苷酸的擴增。
本文所用”擴增的產(chǎn)物”,“擴增產(chǎn)物”,”擴增分子”,或“擴增子”指的是擴增反應得到的寡核苷酸,它是特定靶核苷酸模板鏈的一部分和/或它的互補序列的拷貝,核酸序列上和模板核酸序列和/或其互補序列相對應。擴增產(chǎn)物還包括和引物特異性結合的序列,側翼(flanks)靶核苷酸和/或它互補的一部分序列。本文所述的擴增產(chǎn)物通常是雙鏈DNA,盡管參考序列可能是指單鏈
在一些實施例中,引物可能還有額外的識別序列(如條形碼,索引序列)、測序引物雜交序列(Rd1)和接頭序列。在一些實施例中,接頭序列是和下一代測序系統(tǒng)(NGS)使用的序列。在一些實施例中,接頭序列是Illumina平臺的P5和P7序列。在一些實施例中,接頭序列是和Ion Torrent測序平臺兼容的P1序列。
本文所用“條形碼”、“分子條碼”,“分子條形碼標簽”和“索引序列”可以互相代替,通常是指可以用來識別核酸序列,比如識別來源,識別位置,日期或時間(例如樣本取樣或處理的日期或時間)等。在一些實施例中,條形碼或索引序列可用于在很多核酸中識別核酸的不同方面。在一些實施例中,條形碼或索引序列可提供靶核苷酸的來源或者位置。例如,條形碼或者索引序列可用來識別核酸來自于哪個患者。在一些實施例中,條形碼或索引序列可在一個反應中對多個不同樣本進行測序(在一個通道測序)。在一些實施例中,索引序列可用來引導檢測單個測序反應的序列成像。在一些實施例中,條形碼或索引序列長度可以是2-25個核苷酸、2-15個核苷酸,2-10個核苷酸、2-6個核苷酸。在一些實施例中,條形碼或索引序列包括至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或至少25個核苷酸。
”延伸核苷酸”是指任何在擴增中可以摻入到延伸產(chǎn)物中的核苷酸,即DNA,RNA或者DNA或RNA的衍生物。
本文屬于”修飾堿基”通常指核酸中堿基或者堿基的化學鍵的任何和自然界存在的核酸結構不同的修飾。這種修飾包括堿基的化學結構變化或者核酸中堿基的化學鍵的變化或核酸骨架結構的變化(參考Latorra,D.et al.,Hum Mut 2003,2:79-85.Nakiandwe,J.et al.,Plant Method 2007,3:2)。
術語”檢測探針”是指一段和靶核酸序列充分互補的寡核苷酸,它在嚴格的雜交條件下和靶序列形成穩(wěn)定的可檢測的探針:目標雜交。探針通常是合成的寡核苷酸,可包括和靶區(qū)域以外的序列互補的堿基,在嚴格的雜交條件下不能阻止和靶核酸的雜交。和靶核酸不互補的序列可能是均聚物(Poly-A或Poly-T),啟動子序列,限制性內(nèi)切酶識別位點或者具有二級或者三級結構的序列(如催化位點或發(fā)夾結構),或有助于檢測或擴增的標簽序列。“穩(wěn)定”或“可檢測的穩(wěn)定”是指反應混合物的溫度比混合物中核酸二聚體的溶解溫度Tm至少低2℃,優(yōu)選地比Tm至少低5℃,更優(yōu)選地,比Tm低至少10℃。
“雜交”或“退火”是指完全或部分互補的核酸鏈在特定的雜交條件下以平行或反向平行的方式通過氫鍵結合形成穩(wěn)定的雙鏈結構或區(qū)域(有時稱為“雜交產(chǎn)物”)。雖然氫鍵通常形成于腺嘌呤與胸腺嘧啶或尿嘧啶之間(A和T或U)或胞嘧啶和鳥嘌呤(C和G),也可以形成其他的堿基對(參考Adams et al.,The Biochemistry of the Nucleic Acids,11th ed.,1992)。
“優(yōu)選雜交”指在嚴格的雜交條件下,核酸或寡核苷酸(如引物,阻斷物,或探針)可以與靶核酸序列雜交形成穩(wěn)定雜交產(chǎn)物,顯示在樣本中至少存在一段序列或目標生物。核酸和靶核酸特異性地雜交,即比和非靶核酸雜交程度大得多,以準確檢測欲檢測的靶序列存在(或不存在)。優(yōu)先雜交通常是指在樣品中的靶核酸和非靶核酸的雜交信號之間至有10倍的差異。
術語“嚴格的雜交條件”或“嚴格的條件”是指核酸或寡聚物特異性地雜交到靶核酸而不是非靶核酸。嚴格的條件取決于眾所周知的因素,例如GC含量和序列長度,可憑借分子生物學常用的技術方法預測或確定(參考Sambrook,J.et al.,1989,Molecular Cloning,A Laboratory Manual,2nd ed.,Ch.11,pp.11.47-11.57,(Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.)。
“高度同源”或“基本上對應”是指探針、核酸或寡核苷酸具有至少10、20、30、40、50、100、150、200、300、400、或500個連續(xù)堿基,至少80%(優(yōu)選地,至少85%、90%、95%、96%、97%、98%、和99%,最優(yōu)選地100%)和參考序列上的連續(xù)堿基相同。序列之間的同源性可以表示為在比較的每一組中至少10個相鄰中的堿基錯配數(shù)。
本文所用術語“互補”是指核苷酸以氫鍵形成堿基對的能力。在一些實施例中,互補是指以氫鍵結合的堿基對在G,A,T,C和U的偏好,當兩個多核苷酸或多核苷酸序列彼此退火,在DNA中A與T,G與C配對,在RNA中G與C,A與U配對?!案叨然パa”是指寡核苷酸含有至少10、20、30、40、50、100、150、200、300、400或500個連續(xù)堿基至少80%(優(yōu)選地至少85%,90%,95%,96%,97%,98%,和99%,最優(yōu)選地100%)和靶核苷酸序列相同長度的連續(xù)堿基互補。序列之間的互補可用至少10個連續(xù)堿基間的錯配數(shù)來表示。本文所用“高度相同”是指核酸或其部分和第二個核苷酸分子的全部或者部分至少90%相同,比如90%相同,95%相同,98%相同,99%相同,或100%相同。
本文所用屬于“受試對象”是指具有基因組的任何生物,優(yōu)選地是一種活的動物,如哺乳動物,它是診斷、治療、觀察或實驗的對象。受試對象可以是一個人,一個動物(牛和奶牛,羊,家禽,豬等),或伴侶動物(狗,貓,馬等)。
本文所用術語“治療”,“處理”或“改善”是指治療方法,其中受試對象好轉,減輕,改善,抑制,放慢,或者阻止了和疾病或者功能失調(diào)進展或嚴重性。屬于“處理”包括減少或減輕至少一個和疾病或功能失調(diào)相關的不良影響或癥狀。如果一個或多個癥狀或臨床標記減少,那么治療通常是有效的。同樣地,疾病進展減弱或停止,治療也是有效的。也就是說,“治療”不僅僅包括癥狀改善或標記減少,也包括和不治療相比進展停止或癥狀惡化減輕。有益或想要的臨床結果包括但不是限于,一個或多個癥狀的緩解,患病程度的減輕,疾病狀態(tài)的穩(wěn)定(不惡化),疾病進展延遲或放緩,或疾病狀態(tài)的改善或緩和,緩解(不論是部分或全部),和/或減少死亡率。術語“治療”也減輕疾病的癥狀或副作用(包括姑息療法)。
術語“生物樣本”指的是從生物體(例如病人)或生物體的部分(例如細胞)獲得的樣本。樣本可以是任何生物組織,細胞或體液。樣本可以是從受試對象(比如人或牲畜)獲得的“臨床樣本”。樣本包括但不限于唾液,痰,血,血細胞(如白細胞),羊膜體液,血漿,精液,骨髓和組織穿刺樣本,尿液,腹水和胸膜,或細胞來源的。生物樣本可以指”病人樣本”。生物樣本也可指高度純化或分離的蛋白,膜制品或細胞培養(yǎng)液。
本文所用術語“接觸”和它的類似用語,當用于指任何組成成分時,包括要接觸的組分混合到同一混合物的過程(例如添加到同一容器或者溶液),并不要求所提組分之間的直接接觸。所提組分的接觸可以是任何順序或任何組合(小組合),也包括一個或幾個組分在添加其他組分前從混合物中去除的情況。例如,“A與B和C接觸”包括任何或所有以下情況:(1)A和C混合,然后B添加到混合物中;(ii)A和B混合,B從混合物中去除,然后C添加到混合物;(iii)A添加到B和C的混合物中?!澳0迮c混合物接觸”包括任何或所有以下情況:(i)模本和反應混合物中的第一種組分接觸形成混合物,然后反應混合物中的其它組分以任何順序或者組合加入到混合物中;(ii)先形成反應混合物,然后和模板接觸。
本文所用術語“混合物”是成分的組合,是散開的,無特定順序?;旌衔锸遣痪|的,也不分成不同部分?;旌衔锇ㄈ芙庠谕灰后w中的幾種組分,或隨機沾附在固相支持物的幾種成分,這些成分沒有特定順序不同組分間無明顯區(qū)分。換句話說,混合物是無法確定位置的。更準確地說,行業(yè)中眾所周知的沾附在支撐物表面的引物陣列不是支撐物表面的引物混合物,因為它們空間上是不同的,在陣列表面也是可以定位的。
癌癥的“診斷”或“評估”(例如肺腫瘤或黑色素瘤)是指癌癥的診斷,癌癥分期的診斷,癌癥類型或分類的診斷,癌癥緩解的診斷,癌癥復發(fā)的診斷,癌癥的預后,或手術或非手術治療后癌癥反應的評估。
通常疾病或功能失調(diào)的診斷是基于一個或多個顯示疾病的因素和/或癥狀。也就是說,一個診斷可以根據(jù)存在或不存在的疾病或條件的一個因素的存在,不存在或數(shù)量。被認為是一種特定疾病的診斷的每一個因素或癥狀不需要完全與特定的疾病匹配,即有可能是不同的診斷,可以推斷出從一個診斷因素或癥狀。同樣,有可能是一個因素或癥狀,是表示一個特定的疾病存在于一個個體,沒有特定的疾病的情況下。診斷方法可獨立使用,或與其他診斷和/或分期方法相結合,用于特定疾病或疾病的醫(yī)學藝術中已知的,例如,肺癌或黑色素瘤。
本文提供了一些數(shù)值的范圍。每一個中間的數(shù)值,下限為1/10。除非文中明確指定,否則數(shù)值范圍的上限和下限也在文中公開。本發(fā)明公開了任何數(shù)值或者所述范圍內(nèi)的中間值或者其他所述值或中間值之間的較小的范圍。在數(shù)值范圍內(nèi),這些小范圍的上限和下限可分別包括或排除,每個范圍在所述范圍內(nèi)都在可特定排除的界限中,在較小的范圍內(nèi)不論任何一個,或者任何一個都不或者兩個界限都包括在本發(fā)明中。在所述范圍包括一個或兩個限制,排除任何一個或兩個包括的限制的范圍也包括在本發(fā)明中。
術語“大約”通常是指指定數(shù)字的上或下10%。例如,“大約20”可表示18至22之間。“大約1”表示從0.9-1.1?!按蠹s”的其他意義在文中所指明確,如四舍五入,如“約1”,也可能意味著從0.5到1.4。
優(yōu)選的實施例也在本文中說明,但本領域的技術人員除了這些說明外,其他組分和條件可能會使用本文中所描述的方法。
實施例
本實施例以6個突變熱點EGFR T790,L858R,E19_del,KRAS G12V,Q61H,BRAF V600E作為示例來實施上述公開的方法。以下以EGFR T790為雙鏈靶核酸模板進行方法的詳細說明。
(1)使用的接頭結構為通用的U型Illumina通用接頭:
其中短線位置為接頭的連接點,即為(右側的12nt(接頭序列1中GCTCTTCCGATC與接頭序列2中CGAGAAGGCTAG片段)為配對區(qū)域)配對區(qū)域;其他部分為非配對區(qū)域;本接頭結構的非配對區(qū)域形成U型接頭結構。
接頭結構為一段核酸序列兩端配對形成U型接頭:5’P-GATCGGAAGAGCACACGTCTGAACTCCAGTC-U-ACACTCTTTCCCTACACGACGCTCTTCCGATC*T3’。在酶切以后,使用的接頭序列1:5′ACACTCTTTCCCTACACGACGCTCTTCCGATC*T3’(其中3’端硫代磷酸二酯鍵(*));使用的接頭序列2:5′P-GATCGGAAGAGCACACGTCTGAACTCCAGTC3’(其中5’端磷酸化)。
(2)使用的模板DNA序列
EGFR目標區(qū)段序列如下:
AGGGACTCTGGATCCCAGAAGGTGAGAAAGTTAAAATTCCCGTCGCTATCAAGGAATTAAGAGAAGCAACATCTCCGAAAGCCAACAAGGAAA
(3)目標特異性引物采用反向PCR Illumina P7Primer和正向PCR Primer序列P5序列,典型的序列如下:
使用的正向PCR Primer序列P5:5'AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATC*T 3’;
使用的反向PCR Primer序列P7:5'-GACTGGAGTTCAGACGTGTGCTCTTCCGATCTNTTTCCTTGTTGGCTTTCGGAGA-3’。
使用正向PCR Primer序列P5、反向PCR Primer序列P7引物進行PCR擴增EGFR目標區(qū)段序列,可以加入阻斷物進行富集。
(4)檢測靈敏度測試
將含量分別為0.1%的EGFR T790,L858R,E19_del,KRAS G12V,Q61H,BRAF V600E總共6個位點加入到野生型(wild type,WT)cfDNA中檢測,采用所述方法檢測,以下為檢測UID結果:
以上所述僅為本申請的優(yōu)選實施例而已,并不用于限制本申請,對于本領域的技術人員來說,本申請可以有各種更改和變化。凡在本申請的精神和原則之內(nèi),所作的任何修改、等同替換、改進等,均應包含在本申請的保護范圍之內(nèi)。
SEQUENCE LISTING
<110> 蘇州艾達康醫(yī)療科技有限公司
<120> 核酸制備及分析
<130>
<160> 5
<170> PATENTIN VERSION 3.51
<210> 1
<211> 33
<212> DNA/RNA
<213> 人工序列
<220>
<221> 修飾的堿基
<222> (32)…(32)
<223> 硫代磷酸二酯鍵修飾的C
<400> 1
acactctttc cctacacgac gctcttccga tct 33
<210> 2
<211> 32
<212> DNA/RNA
<213> 人工序列
<220>
<221> 修飾的堿基
<222> (1)…(1)
<223> 磷酸化的G
<400> 2
gatcggaaga gcacacgtct gaactccagt c 31
<210> 3
<211> 93
<212> DNA
<213> 智人(HOMO SAPIENS)
<400> 3
agggactctg gatcccagaa ggtgagaaag ttaaaattcc cgtcgctatc aaggaattaa 60
gagaagcaac atctccgaaa gccaacaagg aaa 93
<210> 4
<211> 57
<212> DNA/RNA
<213> 引物序列
<220>
<221> 修飾的堿基
<222> (57)…(57)
<223> 硫代磷酸二酯鍵修飾的C
<400> 4
aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct tccgatct 58
<210> 5
<211> 55
<212> DNA/RNA
<213> 引物序列
<400> 5
gactggagtt cagacgtgtg ctcttccgat ctntttcctt gttggctttc ggaga 55