本發(fā)明涉及核酸序列分析領域。具體地,本發(fā)明涉及與下一代測序(NGS)有關的方法和工具。DNA測序是解碼一些人類疾病,包括參與癌癥發(fā)展的不同類型的基因的有力方法。
下一代測序(NGS)技術的出現將測序成本降低了數個數量級并顯著提高了通量,從而使全基因組測序成為獲得采取臨床操作的患者相關的全基因組信息的可能方法。DNA測序可以用于確定個別基因、較大基因區(qū)域(即基因或操縱子簇)、完整染色體或整個基因組的序列。根據所使用的方法,測序可以提供DNA中或分離自動物、植物、細菌等的細胞或事實上任何其它遺傳信息來源的核苷酸的順序。分子生物學或遺傳學的研究人員可以使用所得序列并用于進一步科學進步,或者醫(yī)務人員可以使用所得序列以做出治療決策或輔助遺傳咨詢。在個性化醫(yī)學或伴隨診斷應用的背景中經常引用后兩種用途。
不考慮NGS技術所提供的益處,在它們可以從研究工具轉化為常規(guī)臨床實踐前,必須充分解決一些問題。用于診斷目的的NGS技術應需要盡量少的手動步驟,包括防止來源于在給定時間點進行分析的臨床樣品以外的其它來源的核酸材料的污染的充分機制,并且所述方法應快速并且應易于臨床實驗室中的工作人員進行。
已開發(fā)了不同的NGS技術,其涉及導致在各個核酸序列分析中使用的不同方法的物理化學機制。這些技術通常是技術領域中已知的。最廣泛應用的技術是離子半導體(Ion Torrent)測序、焦磷酸測序和合成序列(Illumina)。
定義
通過一般地描述本發(fā)明所述的方法,將更詳細地描述該方法的每個方面。
如本文所使用的,將正在測序的核酸稱為靶標核酸(或靶標)。靶標核酸包括但不限于DNA,如但不限于基因組DNA、線粒體DNA、cDNA等,和RNA,如但不限于mRNA、miRNA等。靶標核酸可以來源于任何來源,包括天然存在的來源或合成來源。所述核酸可以是PCR產物、粘粒、質粒、天然存在或合成的文庫成員或種類等。本發(fā)明不意欲限制于該方面。所述核酸可以來自動物或病原體來源,其包括但不限于哺乳動物,如人,和微生物,如細菌、病毒、真菌、寄生蟲和分枝桿菌屬。在一些實施方式中,所述核酸不是病毒核酸。靶標核酸可以得自任何體液或組織,其包括但不限于血液、唾液、腦脊髓液(“CSF”)、皮膚、毛發(fā)、尿液、大便和粘液。靶標核酸還可以來源于但不限于環(huán)境樣品(如水樣)、食品樣品、森林樣品,所述樣品可以是新鮮樣品(例如,直接進行核酸提取的活組織檢查材料),或已處理能夠儲存的樣品,例如,福爾馬林-固定和/或石蠟包埋的樣品(FFPE樣品)。
使用本領域中已知的任何方式制備靶標核酸。舉例來說,可以根據本領域中已知的技術從樣品收獲基因組DNA(參見,例如,Sambrook等人,“Maniatis”)。收獲后,可以使DNA斷裂以獲得較小長度的核酸。所得片段的長度可以為約數百、數千或數萬個核苷酸。在一些實施方式中,所述片段為50-1000個核苷酸長度、100-1000個核苷酸長度、200-1000個堿基對長度或300-800個堿基對長度,盡管它們不限于此??梢酝ㄟ^任何方式使核酸片段化,其包括(但不限于)機械、酶促或化學方法。實例包括剪切、超聲、霧化和核酸內切酶(例如,DNA酶I)消化,或本領域中已知產生核酸片段(優(yōu)選地,具有所需長度)的任何其它技術。在片段化后,可以是用于富集或分離特定長度的片段的大小選擇技術。這些技術也是本領域中已知的并且包括但不限于凝膠電泳或SPRI。
可選地,可以使用已具有所需長度的靶標核酸。這些靶標核酸包括來源于外顯子富集方法的那些。參見Albert等人Nat Meth 4(l l):903-905(2007),Porreca等人,Nat Meth 4(11):931-936(2007),Okou等人,Nat Meth 4(11):907-909(2007)對于測序前分離和/或富集序列(如外顯子)的方法,因此,所述靶標可以是天然存在的核酸或者可以較短、可用的長度分離,如mRNA、cDNA、外顯子、PCR產物(如上所述)等,而不是使較長的靶標核酸片段化(隨機或非隨機)。
一般地,將靶標核酸在5'和3'端之一或兩者處連接到序列。這些銜接頭序列包括在本發(fā)明所述的測序方法中使用的測序引物位點(即,測序引物將雜交到的位點)。
在一些實施方式中,如以下所討論的,將進行擴增的靶標具有相同或類似長度(例如,靶標間5-10%的變化)。在一些實施方式中,可以保持盡可能小的這種變化,以確保均勻使用所有模板。
可以通過多種方式將擴增產物固定在支持物表面(例如,玻璃表面)上。例如,可以在溶液中進行擴增過程,然后將最終產物連接到支持物表面。可以將擴增產物在其5'端或其3'端連接到固體支持物。連接可以通過與固定在支持物表面上的核酸的雜交或者它可以通過擴增產物末端上的部分與支持物表面上的部分之間的相互作用。實例包括使用生物素或雙重生物素標記的DNA(Margulies等人,Nature437:376(2005))與鏈霉親和素/親和素/中性抗生物素蛋白包被的支持物表面、DIG(洋地黃毒苷)和抗DIG抗體或抗體片段、熒光素和抗熒光素抗體或抗體片段(Gore等人,Nature 442,836-9(2006)),或通過使用雜官能化的交聯劑,如生物素化的琥珀酰亞胺基丙酸酯-PEG,其可以偶聯(例如)至胺-官能化的玻璃并通過鏈霉親和素夾心(即核酸生物素-鏈霉親和素/親和素/中性抗生物素蛋白-生物素固體支持物相互作用)用于固定生物素-標記的DNA。
模板可以是指隨機固定至表面上。這表示基于序列,模板未放置到固體支持物表面上。然而,以在聚合酶-介導的摻入反應期間和/或在模板延伸期間確保每個模板被未被另一模板占據的區(qū)域(并因此,體積)所圍繞的方式將它們置于固體支持物上。也就是說,在一些情況下,將模板以彼此之間足夠的距離布置在表面上以防止模板之間的任何相互作用。
固體支持物是指模板所結合或固定的部件,其可以由任何材料組成,所述材料包括但不限于玻璃或其它二氧化硅基材料、塑料或其它聚合物基材料,然而前提是所述材料對測序反應和清洗中使用的模板、引物、聚合酶、dNTP和其它成分是相對惰性的。固體支持物可以或可以不是剛性的。它可以是多孔的。它可以或可以不是連續(xù)的。在一些實施方式中,固體支持物是玻璃載玻片。在一些實施方式中,所述支持物是本身固定在固體支持物上的多個珠或顆粒(如微粒)。這些珠可以是多孔的。所述支持物可以是篩網。在一些實施方式中,所述固體支持物本身是檢測器或傳感器,如但不限于接觸成像儀。
應理解可以將多個模板(無論是否相同)連接至固體支持物,前提是所述多個模板的每個部件與其它部件之間的間隔足夠遠,從而在模板之間不會發(fā)生重疊。
通常,模板必須連接到其游離端上的可觀察(或可檢測)部分。該部分旨在表示模板的游離端,并因此其位置和在作用力方向上的移動表明了模板的長度。所述可觀察部分可以是任何數目的部分,并且本發(fā)明不受限于其性質??捎^察部分的性質將決定適于觀察(或檢測或監(jiān)控)模板長度變化的傳感器或檢測器的類型。在一些重要的實施方式中,所述可觀察部分為珠,如微珠,并且更具體地,如磁珠。
所述部分可以通過多種方法并且使用多種相互作用連接到模板,其包括但不限于非共價相互作用,如生物素/鏈霉親和素、DIG/抗-DIG抗體和熒光素/抗熒光素抗體結合對,以及共價相互作用,如本文中對于模板(或引物)與支持物表面共價固定化所討論的那些。
所述固體支持物是流通池的一部分或鄰近于流通池。如本文所使用的,流通池是具有至少入口和出口的室,其中液體通過入口和出口移動。根據用于觀察模板的檢測系統(tǒng)的位置,模板所栓系到的固體支持物可以在流通池的下方、上方或旁邊。所述固體支持物可以是流通池的壁,包括下壁、側壁或上壁。
如將理解的,模板準確且快速的測序取決于未引入的核苷酸從系統(tǒng)移除的程度和速率。因此,未引入的核苷酸的快速且完全(或接近完全)的移除是重要的。還必須設計微流體系統(tǒng)以使清洗最大化,從而可能導致較小的清洗體積和清洗時間。
還可以通過腺苷三磷酸雙磷酸酶的使用部分或完全促進未摻入的核苷酸的清除,所述腺苷三磷酸雙磷酸酶將未引入的dNTP降解并使它們不適于進一步摻入。一旦任何給定核苷酸三磷酸鹽類型的摻入停止(如通過模板末端可檢測部分的任何上述背景移動的停止所指示的),則腺苷三磷酸雙磷酸酶可以自由流動,加入到清洗緩沖液中并引入到流通池中。可選地或者額外地,腺苷三磷酸雙磷酸酶可以固定或固定化到流通池內,如(例如),固體支持物表面(模板也固定或固定化到該表面)。這可以通過接頭的使用進行,以使所述酶更可接近并去除與表面密切鄰近有關的任何空間位阻。腺苷三磷酸雙磷酸酶可以連接到長度不同的多個接頭。以這種方式,腺苷三磷酸雙磷酸酶可以存在于流通池內的多種液流中,包括與壁更接近的那些和與中央更接近或位于中央的那些液流。如以上所討論的,接近壁的液流以低速移動,并且這些液流中存在的未摻入的dNTP不易清除。這些液流中具有腺苷三磷酸雙磷酸酶應改善這些dNTP的去除。這將增加以下可能性:模板長度的變化是新引入到流通池的dNTP的摻入的結果,而不是清洗后流通池中保留的殘余和未摻入的dNTP的結果。
在本發(fā)明的一些方面中,所述測序方法被稱為通過合成反應的測序。這表示確定第一核酸的序列需要使用第一核酸作為模板的第二核酸的合成。以這種方式,根據摻入的dNTP的順序和數目確定第二核酸的序列,并且將第一核酸的序列確定為第一核酸序列的互補物。本發(fā)明所述的方法通過模板長度的變化并且不是通過直接觀察dNTP向正在合成的核酸中的添加來檢測dNTP的摻入。因此,dNTP可以是天然的dNTP(即,缺少任何修飾(包括任何外源可檢測標記物,如熒光團)的dNTP)。如根據本發(fā)明公開應清楚的,本發(fā)明的測序方法還需要模板保持完整。本發(fā)明的一些方面包括描述為在不存在熒光的情況下發(fā)生或以非熒光方式發(fā)生的測序方法。這些表征意指可以在不檢測熒光(特別是在不檢測來自每個摻入的dNTP的熒光)的情況下進行所述方法。因此,這些方法的實施方式可以使用未通過添加外源熒光團修飾的天然dNTP。然而,這些表征不排除以下可能性:綴合至模板游離端的可觀察部分本身是發(fā)熒光的。在該后一種情況下,可以通過可觀察部分的熒光而不是來自個別摻入的dNTP的任何熒光來使模板長度變化可視化。
類似地,還將理解本文所提供的測序方法能夠通過檢測可觀察部分本身來檢測核苷酸摻入(例如,如通過CMOS接觸成像儀所可能的)。因此,在一些實施方式中,直接檢測可觀察部分,并且無需酶-介導的事件。酶促檢測核苷酸摻入的實例是偶聯釋放的無機焦磷酸的硫酸化酶和熒光素酶介導的檢測的焦磷酸測序。(參見Leamon and Rothberg,Chemical Reviews,"Cramming More Sequencing Reactions onto Microreactor Chips",2006)。因此,本發(fā)明的方面被認為是非酶促法(或者作為非酶促檢測核苷酸摻入),這是因為可以在不存在酶產生的信號的情況下檢測核苷酸摻入。
在多個實施方式中,特別感興趣的分析物是氫離子,并且具體地配置了根據本發(fā)明公開的大規(guī)模ISFET陣列來測量pH。在其它實施方式中,正在監(jiān)控的化學反應可以涉及DNA合成過程,或者其它化學和/或生物過程,并且可以具體地配置chemFET陣列以測量pH或提供與目的具體化學過程有關的相關信息的一個或多個其它分析物。在各個方面,使用常規(guī)CMOS處理技術制造chemFET陣列,并且具體地配置chemFET陣列以有利于從整個陣列快速采集數據(掃描所有像素以獲得相應的像素輸出信號)。優(yōu)選的測序系統(tǒng)是Ion PGM系統(tǒng),然而,還考慮了其它基于質子檢測的測序系統(tǒng)。例如,焦磷酸測序系統(tǒng)和Illumina通過合成測序是選項。相對于分析物的檢測和測量,應理解在以下更詳細地討論的多個實施方式中,通過根據本發(fā)明公開的chemFET陣列測量的一個或多個分析物可以包括提供一個或多個目的化學過程(例如,多個核酸鏈的結合,抗體與抗原的結合等)的相關信息的任何各種化學物質。在一些方面,除了僅檢測分析物的存在之外,測量一種或多種分析物的水平或濃度的能力還提供了與化學過程有關的有價值的信息。在其它方面,僅檢測一種或多種目的分析物的存在可以提供有價值的信息。本發(fā)明最優(yōu)選的測序方法包括Ion Torrent's PGM系統(tǒng)的使用。
在另一個方面,本發(fā)明提供了用于測序核酸的方法,其包括將模板核酸片段化以產生多個片段化核酸,將來自多個片段化核酸的每一個的一條鏈單獨連接至珠以產生分別具有連接其上的單鏈片段化核酸的多個珠,將具有連接其上的單鏈片段化核酸的多個珠遞送到對該區(qū)域中每個傳感器具有單獨的反應室的chemFET陣列,并且其中僅一個珠位于每個反應室中,并且在多個室中同時進行測序反應。
本發(fā)明考慮在相同流通池內或在相同固體支持物上同時進行多個不同的測序反應。每個測序反應獲得了固定在固體支持物上的一個模板的相關信息。單次運行中可以測序的模板數目將取決于模板的預期長度以及固體支持物的面積。因此,根據實施方式,可以將至少100、至少200、至少300、至少400、至少500、至少600、至少700、至少800、至少900或至少1000個模板固定在固體支持物上并因此同時測序。在其它實施方式中,可以同時測序100-500、100-750、100-1000、500-1000、600-1000、700-1000、800-1000、900-1000、1000-2000、2000-3000、3000-4000、4000-5000、5000-10000個或更多個模板。表1顯示可以將固體支持物配置成具有每2.8μm珠具有1.6個像素。
通過將dNTP引入到雜交至模板的新合成的核酸鏈來進行測序反應。新合成的鏈可以衍生自結合至模板的引物或衍生自可以進行聚合酶-介導的延伸的其它分子。
在一個非限制性實例中,可以通過在允許雜交的情況下將模板與引物接觸,并將模板/引物的雜交物與聚合酶接觸來開始測序反應。這種接觸可以在固定化至固體支持物之前、期間和/或之后發(fā)生。在一個重要的實施方式中,在固定化至固體支持物之后發(fā)生。
一旦將引物和聚合酶固定到模板,則將試劑的重復循環(huán)流入并通過流通池。當試劑流含有與直接在引物3'端的下游的模板上的核苷酸互補的核苷酸時,聚合酶將摻入dNTP。如果模板上鄰接的下游位置未被相同的核苷酸(本文中稱為均聚物)占據,則聚合酶將摻入相同數目的互補dNTP。當流中的dNTP與模板上下一個可用的核苷酸不互補時,這種摻入將停止。流動的dNTP的量和這種流動的時間將分別超過模板上互補堿基的數目和摻入所有可能的dNTP所需的時間。
重要地,互補dNTP的摻入在超過一種結合引物上發(fā)生。更優(yōu)選地,摻入在至少10%、至少25%、至少50%、至少60%、至少70%、至少80%、至少90%或在全部結合的引物上發(fā)生。引物的百分比可以取決于模板中靶標拷貝的數目。對于一些實施方式,每個單個模板中,摻入在至少30、至少35、至少40、至少45、至少50、至少60、至少70、至少80、至少90、至少100個或更多個引物上發(fā)生。將理解本發(fā)明考慮在給定模板上的盡可能多的雜交引物上摻入dNTP以通過增加所發(fā)生的長度變化的幅度(無論長度增加或減少)來提高信噪比。
如果其互補核苷酸存在于模板核酸上的相同位置,作為測序反應的一部分,將dNTP連接至(或如本文所使用的“摻入至”)新合成鏈的3'端(或就第一個摻入的dNTP來說,測序引物的3'端)。引入的dNTP的摻入將模板的單鏈區(qū)轉化為雙鏈區(qū),并且然后這種轉化反映在張力作用下模板長度的變化。通過確定和監(jiān)控模板游離端的可觀察部分(例如,珠)的位置,檢測長度變化。因此,如果在任何給定流經過后,珠位置未改變,則無dNTP摻入,并且可以推斷流過的dNTP與模板中下一個可接近的核苷酸不互補。如果檢測了所述部分位置的變化,則流過的dNTP是互補的并且摻入到新合成的鏈中。dNTP可以以任何順序流動,前提是所述順序是已知的并且優(yōu)選地在整個測序試驗中保持恒定。
對于本發(fā)明的一些方面,典型的測序循環(huán)可以包括用清洗緩沖液清洗流動室(和孔),測量連接到模板核酸末端的可觀察部分的位置,在存在聚合酶的情況下將第一dNTP物質(例如,dATP)引入到流動室,測量可觀察部分的位置,任選地在清洗緩沖液中的腺苷三磷酸雙磷酸酶流過,清洗緩沖液的流過,在存在聚合酶的情況下第二dNTP種類的引入等。該過程持續(xù)直至所有4種dNTP(即dATP、dCTP、dGTP和dTTP)已流過所述室并允許摻入到新合成的鏈中。這種4-核苷酸循環(huán)可以重復任何次數,包括(但不限于)10、25、50、100、200、300、400、500、600、700、800、900、1000次或更多次。循環(huán)次數將取決于正在測序的靶標長度和補充反應試劑(具體地,dNTP儲備溶液和清洗緩沖液)的需要。因此,可以使用本發(fā)明所述的方法確定的序列長度可以為至少50個核苷酸、至少100個核苷酸、至少200個核苷酸、至少300個核苷酸、至少400個核苷酸、至少500個核苷酸、至少600個核苷酸、至少700個核苷酸、至少800個核苷酸、至少900個核苷酸、多至并且包括1000個核苷酸、1500個核苷酸、2000個核苷酸或更多個核苷酸。
適合的聚合酶可以是DNA聚合酶、RNA聚合酶或其亞基,前提是這些亞基能夠基于模板合成新的核酸鏈并能夠從雜交引物開始。適合的聚合酶亞基的實例是缺少3'至5'外切核酸酶活性的大腸桿菌(E.coli)DNA聚合酶I的Klenow片段的外切形式。其它適合的聚合酶包括T4exo-、Therminator和Bst聚合酶。聚合酶在溶液中可以是游離的(并且可以存在于清洗和/或dNTP溶液中)或者它可以固定在固體支持物、流通池的一個或多個壁、模板或引物上。
將理解本文所提供的測序方法具有一些應用,其包括但不限于確定核酸(或者一系列核酸,如存在于基因組中的核酸,包括哺乳動物基因組并且更具體地人基因組)的部分或完全的核苷酸序列,確定樣品中是否存在核酸(如在(例如)診斷和法醫(yī)學方法中可以是有用的樣品),確定核酸在序列中是否包括突變或變化(如(例如)等位變化,包括單核苷酸多態(tài)性),確定已知核酸是否經歷導致新物種產生的的突變(如可能是抗生素耐受性微生物的潛在原因),確定基因修飾的生物或基因工程核酸的存在,確定兩種樣品(如(例如)正常組織和患病組織)間是否存在遺傳學差異并且存在何種遺傳學差異,確定對于患有如可以通過受試者的遺傳構成確定的特定病況的受試者的治療哪種治療方案將最有效,和基因分型(例如,分析一個或多個基因座以確定(例如)載體狀態(tài))。在這些實施方式的一些中,可以將使用本發(fā)明所述的方法確定的核苷酸序列與已知或參考序列相比較以定向所獲得的序列和/或鑒定兩條序列間的差異。這可以幫助鑒定遺傳變化和突變。所述已知或參考序列可以是先前確定的序列(例如,由物種完整的基因組測序所產生的)。
本文所述的方法也可以用于幫助鑒定和治療病況。例如,所述方法可以用于鑒定與特定病況有關的序列或用于鑒定用于診斷特定病況不存在的序列。所分析的樣品可以來自于任何受試者,包括人。所述病況可以是癌癥或感染。
所述方法也可以用于鑒定與對試劑的陽性反應有關的序列。所述方法可以包括使用本文所提供的一種或多種測序方法對來自多位對試劑顯示出陽性反應的受試者和來自多位對試劑顯示出陰性反應的受試者的DNA測序,和鑒定多位顯示陽性反應的受試者中的共有序列和來自顯示出陰性反應的受試者中的共有序列,并且該共有序列不存在于其它多位受試者中。優(yōu)選地,所述受試者是哺乳動物,并且更優(yōu)選地,是人。
本文所述的方法可以自動化進行從而通過機器人進行測序反應。另外,得自檢測器或傳感器的測序數據可以輸入到個人電腦、個人數字助理、移動電話、電視游戲系統(tǒng)或電視中,從而使用者可以遠程監(jiān)控測序反應的進行。
本發(fā)明還考慮了包含進行擴增和/或測序反應所必需的多種試劑的試劑盒,以及根據本文所述方法的使用說明書。
本文所提供的方法依賴于檢測模板中每個靶標拷貝的單個核苷酸。分辨率極限依賴于所使用的檢測系統(tǒng)的分辨率。
盡管在本文中已描述和說明了一些發(fā)明性實施方式,但是本領域那些技術人員將容易地設想用于實施功能和/或獲得結果的各種其它方式和/或結構和/或本文所述的一種或多種優(yōu)勢,并且這些變化和/或改變中的每一個被認為在本文所述的本發(fā)明的實施方式的范圍內。更一般地,本領域技術人員將容易地理解本文所述的所有參數、尺寸、材料和配置意在為示例性的,并且實際參數、尺寸、材料和/或配置將取決于本發(fā)明教導內容所使用的一種或多種特定用途。僅使用常規(guī)實驗方法,本領域技術人員將認識或能夠確定與本文所述的具體的本發(fā)明的實施方式等價的多種實施方式。因此,應理解僅通過舉例的方式提供了上述實施方式,并且上述實施方式在所附權利要求及其等價形式的范圍內;可以以如本文具體所述和所主張的之外的其它方式實踐本發(fā)明的實施方式。本發(fā)明公開的發(fā)明實施方式涉及每個單獨的本文所述的特征、系統(tǒng)、制品、材料、試劑盒和/或方法。另外,如果這些特征、系統(tǒng)、制品、材料、試劑盒和/或方法彼此不一致,則這些特征、系統(tǒng)、制品、材料、試劑盒和/或方法中的兩種或更多種的任意組合包含在本發(fā)明公開的發(fā)明范圍內。
應理解如本文所定義和使用的所有定義優(yōu)先于詞典定義、通過引用并入的文檔中的定義和/或所定義術語的常規(guī)含義。
除非上下文中明確規(guī)定,否則如本說明書和所附權利要求中所使用的,單數形成的“一個”和“所述”包括復數對象。
具體實施方式
本發(fā)明尤其涉及用于從樣品分離核酸的獨特的半自動化方法、(RT-)PCR反應設置、基于(RT-)PCR的核酸擴增、PCR后標準化和擴增產物的清理、PCR擴增產物的片段化、與銜接子的連接,其特征在于(A)和(B)中所列的以下步驟:
方法(A)
(a)從樣品提取核酸;
(b)任選地,在進行(RT-)PCR反應前,將尿嘧啶-DNA-糖基化酶(UDG)加入至(RT-)PCR混合物中以消化來自先前擴增反應的交叉和殘留污染。
(c)根據分離核酸的類型,即RNA或DNA,使用核苷三磷酸構建塊(即各個核苷酸),包括A、T、C、G,任選地還包括尿嘧啶,進行(RT-)PCR;
(d)RT-PCR中獲得的核酸的標準化(使用載體結構,例如順磁微珠(例如,AxyPrep Mag PCR Normalizer,Axygen)用于標準化,其中所述珠結合所需序列長度的核苷酸序列),其包括在PCR之后使RT-PCR混合物結合至所述珠,在PCR-產物結合后徹底清洗所述微珠,從微珠洗脫PCR擴增產物;
(e)將步驟(d)中獲得的洗脫的PCR擴增產物片段化(剪切);
(f)使步驟(e)的產物結合至載體結構,例如,微珠,然后清洗和洗脫所結合的核酸;
(g)將銜接頭序列(包括條型碼序列,從而使得能夠將核酸歸為特定樣品(例如,臨床樣品和患者))連接至步驟(f)中獲得的產物;
(h)使用載體結構清洗步驟(g)中獲得的產物,所述載體結構例如先前步驟(d)和/或(f)中使用的微珠;
(i)使步驟(h)中獲得的產物進行測序反應(例如,使用Ion PGM系統(tǒng)),和
(j)分析步驟(i)中獲得的測序反應的結果。
方法(B)
(a)從樣品提取核酸;
(b)任選地,在進行(RT-)PCR反應前,將尿嘧啶-DNA-糖基化酶(UDG)加入至(RT-)PCR混合物中以消化來自先前擴增反應的交叉和殘留污染。
(c)根據分離核酸的類型,即RNA或DNA,使用核苷三磷酸構建塊(即各個核苷酸),包括A、T、C、G,任選地還包括尿嘧啶,進行RT-PCR;
(d)引物的部分消化(例如,使用Life Technologies的FuPa試劑);
(e)將銜接頭序列(包括條型碼)連接至步驟(d)中獲得的產物;
(f)RT-PCR中獲得的核酸的標準化(使用載體結構,例如順磁微珠(例如,AxyPrep Mag PCR Normalizer,Axygen)用于標準化,其中所述珠結合所需序列長度的核苷酸序列),其包括在PCR之后使RT-PCR混合物結合至所述珠,在PCR-產物結合后徹底清洗所述微珠,從微珠洗脫PCR擴增產物;
(g)使用載體結構清理步驟(g)中獲得的產物,所述載體結構例如先前步驟(d)和/或(f)中使用的微珠;
(i)將步驟(h)中獲得的產物進行測序反應(例如,使用Ion PGM系統(tǒng)Ion Torrent),和
(j)分析步驟(i)中獲得的測序反應的結果。
以上工藝流程方法的獨特性使得能夠降低用于分析的核酸的提取和最終NGS反應的過程中所需的時間量,在此之后是結果分析。UDG的使用很大程度上降低了用于核酸提取、PCR裝置、PCR后的純化步驟、文庫制備和NGS的自動系統(tǒng)中的污染風險。使用以上方法的這些步驟的自動化降低了(具體地)診斷應用所需的時間和成本。
意外地,注意到可以在下一代測序文庫的制備中使用本文所述的新型替代方法??梢栽诓煌愋偷腘GS-文庫的制備中使用本發(fā)明的方法,例如,用于Illumina測序或用于Ion Torrent測序的NGS-文庫。可以將該方法引入到上述NGS工藝流程中。
通常,使用包含緩沖液的適合于該目的的可商購的試劑盒制備NGS文庫。不考慮GC-含量,為了NGS-文庫的穩(wěn)健、高保真擴增,具體地優(yōu)化了這些緩沖液。由于用于NGS文庫制備的自動化開放系統(tǒng)可以容易具有對來自先前試驗的PCR擴增子的臨床樣品污染殘留的高風險,因此目標為減少所述危險。為了防止殘留污染,將dUTP加入至(RT-)PCR預混液(master mixes)中。PCR預混液的尿嘧啶脫氫酶(UDG)-處理除去了來自先前試驗并且可能偶然殘留至后續(xù)反應混合物中的污染物擴增子。尿嘧啶脫氫酶(UDG)是通過水解脫氧核糖和堿基之間的N-糖苷鍵來從DNA除去尿嘧啶,從而留下無嘌呤或無嘧啶位點(AP位點)的酶。
然而,用于NGS-文庫制備的緩沖液(例如,具有Taq High Fidelity的SuperScriptTM III One-Step RT-PCR系統(tǒng))通常不適合于在擴增反應期間摻入dUTP。意外地注意到可以用非高保真酶的常規(guī)Taq聚合酶取代專門為NGS-文庫制備開發(fā)的特異性高保真酶??梢允褂贸R?guī)(RT-)PCR緩沖液(例如,含有100mM Tris-HCl,pH 8.3,500mM KCl,15mM MgCl2的緩沖液)。NGS-文庫制備規(guī)程的這一改變使得能夠在擴增期間摻入dUTP。
因此,在一個方面,本發(fā)明涉及制備NGS文庫的方法,其包括在不使用專門的高保真PCR緩沖液的情況下在擴增期間摻入dUTP,但是其中使用了適合于PCR的基本上任何DNA聚合酶(例如,Taq聚合酶)。緩沖液和酶的這種相當簡單的更換使得能夠引入dUTP和使用UDG進行后續(xù)處理以防止污染物殘留。
此外,本發(fā)明涉及使用用于dUTP摻入的野生型(重組或天然)Taq聚合酶,在用于下一代測序文庫的制備的核酸擴增反應中,用于除去殘留污染物,即用于消除包含應分析的提取核酸和來自于先前(RT-)PCR反應的可能的污染DNA的試劑混合物的污染的方法,其包括以下步驟:
a)使得自樣品的核酸片段化,
b)加入適合于降解擴增反應混合物中存在的任何污染核酸擴增物的降解酶;
c)擴增核酸模板,以在存在dUTP的情況下在第一核酸擴增反應中提供第一核酸擴增物;和
d)使所述降解酶失活。
在上述方法(在使用用于dUTP摻入的野生型(重組或天然)Taq聚合酶或其衍生物用于制備下一代測序文庫的核酸擴增反應中除去殘留污染的方法)的優(yōu)選實施方式中,所述降解酶為UDG。UDG處理通常需要幾分鐘,例如,多至10分鐘,優(yōu)選地,多至5分鐘。隨后,將所述酶失活,例如,通過暴露于約50℃的溫度約5分鐘。
在上述方法(在使用用于dUTP摻入的野生型Taq聚合酶用于制備下一代測序文庫的核酸擴增反應中除去殘留污染的方法)的另一個優(yōu)選實施方式中,所述降解酶為UDG,所述Taq聚合酶為重組或天然聚合酶。
在上述方法(在使用用于dUTP摻入的野生型(重組或天然)Taq聚合酶用于制備下一代測序文庫的核酸擴增反應中除去殘留污染的方法)的優(yōu)選實施方式中,所述降解酶為UDG,并且在下一代測序方法中將UDG-處理的文庫進行其它步驟,其包括:
a)使得自樣品的核酸片段化,
b)加入適合于降解擴增反應混合物中存在的任何污染核酸擴增物的降解酶;
c)擴增核酸模板,以在存在dUTP的情況下在第一核酸擴增反應中提供第一核酸擴增物;和
d)使所述降解酶失活。
在權利要求中還描述了用于DNA文庫產生或在以上DNA文庫制備過程中消除反應混合物污染的本發(fā)明方法的優(yōu)選實施方式。
以上方法(A)和(B)的優(yōu)選實施方式涉及其中由于一些致癌基因中的修飾賦予了某些藥物耐藥性,因此存在于臨床樣品中的靶標核酸(例如,致癌基因或來源于如HCV、HIV等的病原體的核酸)的序列相關知識有助于醫(yī)師為患者選擇最有希望的治療的體外診斷應用,例如,在伴隨診斷中的應用。
在方法(A)的優(yōu)選實施方式中,所述樣品是得自(例如)患者,優(yōu)選地人患者的新鮮樣品。樣品材料可以是(例如)血液、血漿、血細胞亞群(例如,T細胞)、腦脊髓液、痰液、大便等。
在方法(A)的優(yōu)選實施方式中,樣品是為了分離其中存在的核酸材料的血漿,所述核酸材料例如,病毒、細菌、真菌或寄生蟲-來源的核酸或含有這些核酸的材料,例如,病毒粒子、細菌等。
在方法(A)的優(yōu)選實施方式中,樣品材料是血漿并且所述核酸材料來源于病毒,例如,HCV、HIV等。當靶向HCV時,目的區(qū)域優(yōu)選地為NS5B基因區(qū),其很適合鑒定6個主要的HCV基因型和大量亞型。HCV基因組中的靶標區(qū)優(yōu)選地從核苷酸8616延伸至核苷酸9298,但是該區(qū)域可以稍微更長或更短一些,只要6個HCV基因型的鑒定是可能的。優(yōu)選的引物結合至HCV基因組的核苷酸8616-8638、8614-8635、9276-9298和9171-9191。所述引物可以包括如本領域中已知的天然或修飾的核苷酸構建塊。
在方法(B)的優(yōu)選實施方式中,所述樣品是得自(例如)患者,優(yōu)選地人患者的新鮮樣品。樣品材料可以是(例如)血液、血漿、血細胞亞群(例如,T細胞)、腦脊髓液、痰液、大便等。在方法(B)的另一個優(yōu)選實施方式中,所述樣品不是新鮮樣品,而是獲得后(例如)使用福爾馬林-固定和/或石蠟-包埋處理的樣品(FFPE樣品是用于多個致癌基因分析的優(yōu)選樣品)。
在方法(B)的優(yōu)選實施方式中,樣品材料是來源于人患者的FFPE-樣品,例如,來自可以福爾馬林-固定和/或石蠟-包埋的任何組織的樣品,例如,來源于皮膚、乳腺組織、結腸、肺、肝、肌肉等的樣品。在非常優(yōu)選的實施方式中,樣品是用于參與黑素瘤形成的基因分析的皮膚樣品。在該方面,靶向的優(yōu)選基因包括以下基因中的至少一種或多種:NRAS、AKT3、MAP2K1、GNA11、ERBB4、PIK3CA、FGFR3、KIT、BRAF、CDKN2A和GNAQ。這些基因已知參與了黑素瘤的發(fā)展并且可以在各個基因的不同位點含有不同的點突變。特定突變的分析使得治療醫(yī)師能夠選擇適合的療法,這是因為已知一些突變賦予了耐藥性,而其它是藥物可控制(對藥物敏感)。
本發(fā)明的另一個方面是提供可以用作來自FFPE組織的核酸提取的對照材料的新的FFPE細胞系。這些細胞系可以攜帶對應于靶標序列的遺傳信息,例如,先前通過轉化或使用其它方法引入的遺傳物質??蛇x地,這些基因可能未進行基因修飾,例如,當細胞已攜帶目的靶標基因(例如,致癌基因)或當靶標基因應不同于實際測定中的所靶向的基因時。例如,當測定靶向臨床樣品中一個或多個致癌基因的突變時,FFPE細胞系中靶向的基因可以是管家基因或非突變野生型基因。所述細胞系提供了可計量的量的靶標核酸的來源,這是因為可以選擇FFPE細胞系材料的量以達到各個測定的要求。本發(fā)明的細胞系可以作為用于任何給定測定的試劑盒的一部分提供。所述試劑盒還可以包含適合于核酸提取、純化、擴增或其它操作的其它化學試劑,例如,引物、緩沖液、酶等。
本文提供的另一個方面是DNA文庫標準化的方法。在其它實施方式中,這些DNA文庫用于涉及載體顆粒(如磁性微珠)的使用的后續(xù)NGS。
在現有方法中,DNA文庫的標準化需要在銜接子連接前對(RT-)PCR反應中獲得的片段化DNA擴增產物進行定量和/或大小選擇。意外地發(fā)現涉及微珠使用的文庫制備不需要大小選擇和/或預先定量,優(yōu)選的微珠為Axygen(AxyPrep MAG-PCR-CL-5Kit)提供的那些或類似產品。這些微珠的使用還消除了核酸擴增和/或銜接子與擴增產物連接后仍存在的較短的片段。
此外,意外地發(fā)現與其中在連接之后包含銜接子的文庫再次擴增的現有技術方法不同,因此產生的DNA文庫的PCR擴增不是必需的。
根據珠的量和所述珠與DNA文庫的孵育時間,可以限定結合的DNA的量,這是因為珠隨時間被核酸飽和。
本發(fā)明的自動核酸提取、擴增和文庫制備方法(例如,使用Vela Diagnostic的Sentosa SX101平臺)使得通常能夠減少時間、試劑的量和成本并且避免與用于NGS的DNA文庫的手動制備有關的風險。
本發(fā)明還考慮了用于制備同類文庫的試劑盒。
更進一步,本發(fā)明提供了簡化且改善的文庫制備方案。如上所述,用于使用后續(xù)NGS方案的DNA文庫的制備的標準化磁珠是極其重要的以獲得用于進一步分析的核酸的正確的量。出于該目的,在(RT-)PCR之后具有可以使用的有限結合表面的DNA結合珠可以用于擴增核酸的標準化。
此外,為了獲得用于以下下一代測序步驟的預先限定量的DNA,現有技術方法基本需要以下步驟:
1)(RT-)PCR
2)使用磁珠和清理緩沖液清理PCR產物
3)清洗珠(例如,用乙醇)
4)洗脫結合至磁珠的PCR產物
5)使用標準化磁珠和標準化緩沖液的PCR產物的標準化
6)清洗珠(例如,用乙醇)
7)標準化PCR產物的洗脫。
標準化磁珠(定義)對RT-PCR緩沖液很敏感,可能是因為一步RT-PCR緩沖液中的dTT抑制擴增DNA產物與標準化珠的結合。在現有技術方法中,先前需要進行以上步驟2)至4),其在進行擴增之后除去了RT-PCR混合物中存在的試劑。
意外地,本發(fā)明人發(fā)現當將(RT-)PCR產物暴露于新的本發(fā)明的組合物(包含用于標準化的用于NGS文庫制備的珠,包含溶劑,例如聚乙二醇和堿金屬鹽,例如NaCl、MgCl等)時,可以省去繁重、耗時且昂貴的步驟2)至4)。在一些實施方式中,所述組合物包括,例如,約2.0至約5.0M的NaCl,例如,約2.0M至約4.0M的NaCl,優(yōu)選地,2.5至約3.5M的NaCl,非常優(yōu)選地,約2.5至約3.0M的NaCl,并且最優(yōu)選地,本發(fā)明的緩沖液中堿金屬的濃度為2.5M NaCl。本發(fā)明用于NGS文庫制備的標準化珠的緩沖液還包括約10%至約30%的溶劑,例如,約12.5%至約25%,或15.0%至約25%,或17.5%至約22.5%,優(yōu)選地約20%的溶劑。所述溶劑優(yōu)選地為聚乙二醇,例如,高分子量PEG,如聚乙二醇(PEG)8000。還可能用其它堿金屬鹽替換NaCl,如Mg、K等。在非常優(yōu)選的實施方式中,本發(fā)明用于NGS文庫制備的標準化珠的緩沖液包含約2.5M NaCl和20%的聚乙二醇(PEG)8000。
在本發(fā)明用于NGS文庫制備和改善的NGS工藝流程的方法中,將上述緩沖液直接加入到含有擴增核酸的所獲得的RT-PCR擴增混合物中。優(yōu)選地,將本發(fā)明的緩沖液以2:1至1:2的比值加入到擴增混合物中,并且最優(yōu)選地,將本發(fā)明的緩沖液以約相等的量(例如,1:1)加入到PCR擴增混合物中。在非常優(yōu)選的實施方式中,本發(fā)明用于NGS文庫制備的標準化珠的緩沖液包含約2.5M NaCl和20%聚乙二醇(PEG)8000,并以1:1的比值加入到PCR擴增混合物中。
因此,可以大大減少用于NGS的文庫制備的時間和步驟。此外,加入(RT-)PCR產物的緩沖液相當便宜,具體地,它比清理珠和清理緩沖液便宜許多。
以下所述的實施例僅用作實例并且決不應視為對本發(fā)明范圍的限制。
實施例
實施例1:使用Vela Diagnostic的自動化平臺Sentosa SX101的用
于NGS的HCV文庫的制備
1.RT-PCR
·從人血漿分離HCV病毒RNA并合成cDNA。在本發(fā)明中,使用自動化平臺Sentosa SX 101進行該步驟。
·在進行RT-PCR之前,將尿嘧啶-DNA-糖基化酶(UDG)加入至RT-PCR混合物中以消除來源于先前測定的可能的污染物。在擴增之前,在25℃用UDG進行擴增子殘留污染物消化4min。
2.RT-PCR之后的標準化
·參考圖1中所示的工作平臺。
·制備試劑96-孔板的孔(圖1,位置C1):
·將試劑96-孔板(圖1中的TEMP2)的溫度設置為15℃;
·將25μl的每個樣品的每個PCR產物(總計4個)合并至限定位置。
·混合5次并轉移195μl的標準化珠至1500μl PCR清洗緩沖液(Lib Prep Reagent);
·混合10次并轉移86μl的PCR清洗緩沖液(Vela Diagnostics)和標準化珠(Axygen)?;旌?文庫制備試劑)至合并的PCR產物的限定位置并混合10次。
·在室溫下孵育3min;
·將PCR板轉移至圖1中的平臺中的位置B5處的磁性支架;
·孵育2min;
·通過吸取40μl三次和50μl一次來棄去上清液;
·將100μl 80%的EtOH加入至PCR板上所選的孔中;
·將PCR板轉移至恒溫混合器(TMX)并以1000rpm振蕩2min;
·將PCR板轉移回到圖1中的位置B5處的磁性支架;
·打開TMX的溫度控制并設置為56℃。
·孵育2min;
·通過吸取70μl三次和40μl一次棄去上清液;
·將PCR板轉移至先前設為56℃的恒溫混合器(TMX);
·將板干燥2min;
·將PCR板轉移至位置C1;
·加入35μl洗脫緩沖液(Lib Prep Reagent 1A至PCR板);
·通過抽吸混合5次;
·將PCR板轉移至恒溫混合器;
·在恒溫混合器上在56℃以1400rpm振蕩5min;
·將板轉移回到磁性板(B5)并等待2min;
3.剪切
·將63μL剪切緩沖液(Life technologies)和30μL轉移至限定位置并混合5次。將80μl混合物分別轉移至剪切酶(Life technologies)(C4和D4)混合20×;
·轉移15μl至限定位置。轉移15μl洗脫樣品(來自步驟2)至相同限定位置并混合。;
·將PCR板轉移至恒溫混合器并孵育12min,在38℃孵育13分鐘。
3.PCR珠清理;
·混合PCR清理珠并將50μl來自Lib Prep Reagent的珠轉移到限定的PCR板的孔;
·將PCR板轉移至TMX并以1200rpm在26℃振蕩3min;
·將PCR板轉移回到位置B5處的磁性支架并等待2min;
·通過分別吸取70μl和30μl棄去上清液
·加入100μl,80%的EtOH(文庫制備試劑至PCR板);
·將PCR板轉移回到TMX并以1200rpm在26℃振蕩3min;
·將PCR板轉移至B5處的磁性支架。等待3min;
·通過吸取70μl一次和50μl一次棄去上清液;
·等待5min使珠干燥;
將PCR板轉移回到位置C1;
加入28μl洗脫緩沖液(將洗脫緩沖液從文庫制備試劑轉移至所選的PCR板的孔中);
將PCR板轉移至TMX并在26℃以1200rom振蕩2min;
將PCR板轉移至B5上的磁性支架,并等待2min;
5.連接
·將90μl連接酶緩沖液(Enzymatics)、18μl dNTP、36μl T4連接酶(Enzymatics)、18μl Manta聚合酶(Enzymatics)和108μl水從限定的試劑板孔轉移到另一個限定的管中并混合10次;
·將另外15μl的混合物從試劑板限定的孔轉移至另一限定的孔;
·隨后,轉移10μl條型碼銜接子至相同的限定的孔。
·將25uL從步驟4洗脫的樣品轉移至相同的限定的孔并混合10次。用25uL礦物油覆蓋混合物。
·將PCR板轉移回到TMX并在26℃孵育10min;
·將溫度升高至65℃,并孵育另外5min。
實施例2:AmpliSeqTM文庫自動化
使用AmpliSeqTM試劑(Life technologies,Inc.),制備試劑96-孔板的孔(圖1,位置C1):):
使用自動化平臺Sentosa SX 101(Vela Diagnostics)的Ampliseq文庫自動化)
1.PCR
·將位置TEMP2的溫度設置為4℃。
·將4μl PCR預混液從試劑板中限定的孔轉移至其它所選孔中的引物混合物;
·通過抽吸10次混合;
·分別將7μl PCR混合物從所選的試劑96-孔板的孔中轉移到所選的PCR 96-孔板的孔中;
·分別將3μl gDNA樣品從限定的洗脫板的孔中轉移至所選的PCR 96孔板的孔中(總PCR體積=10μl);
·手動密封PCR板并轉移至PCR以使用以下程序擴增:
步驟1:99℃,2min
步驟2:99℃,15秒
步驟3:60℃,4min
重復步驟2(21次)
保持在10℃
·PCR之后,將PCR板返回至Sentosa平臺SX 101上的C1位置(圖1);
·將恒溫混合器的溫度設置為52℃。
2.FuPa反應
·將2μl FuPa(Life technologies)從所選的試劑96-孔板的孔中轉移至預定的96-孔板的孔中(使用自動化系統(tǒng)轉移極少量的粘稠試劑);
·將限定的孔中的10μl PCR產物合并至含有FuPa試劑的PCR板上的孔中,并通過抽吸5次混合;
·將40μl油覆蓋物加入到上一步驟中的PCR板孔中。(文庫制備試劑->PCR板);
·將PCR板轉移至TMX并在52℃以300rpm振蕩10min,57℃振蕩10min和62℃振蕩20min;
·將PCR板轉移回到SX 101上的位置C1。
3.連接反應
·將4μl轉換溶液(Life technologies)從限定的試劑板孔加入到其它限定的PCR板孔中;
·將2μl連接酶從限定的試劑板孔轉移至另一個限定的PCR板孔;
·將2μl條型碼銜接子從限定的試劑板孔轉移至預定的PCR板孔;
·將5μl水從含有文庫制備試劑的預定的孔加入到另一個預定的PCR板孔;
·加入17μl樣品并通過抽吸5次混合;
·將整個樣品從所選的PCR板孔轉移至已含有連接酶的孔并通過抽吸5次混合;
·將40μl油覆蓋物加入到所選的PCR板孔B5。(Lib制備試劑至限定的PCR板孔);
·等待20分鐘;
·將恒溫混合器設置為72℃,并等待另外10min;
·將PCR板轉移至TMX并以300rpm在72℃振蕩10min;
4.珠標準化
·通過抽吸10次混合標準化珠;
·將10μl Lib制備試劑中的標準化珠加入到200μL Lib制備試劑中的結合緩沖液中;
·將PCR板從TMX送至位置C1;
·將恒溫混合器的溫度設置為25℃;
·在轉移100μl珠溶液至所需的PCR板孔之前,將限定孔中的珠溶液混合10次;
·將25μl樣品從一個所選的PCR板孔轉移至另一個用于結合的限定的孔并通過抽吸10×混合;
·等待5分鐘;
·將PCR板送至TMX;
·在25℃,以1200rpm振蕩1min;
·孵育4min;
·將PCR板轉移至磁性板支架B5并孵育2min;
·通過吸取50μl兩次和20μl一次,棄去上清液;
·100μl 80%的EtOH轉移至所選的PCR板孔;
·將板送回到TMX并以1000rpm在25℃振蕩1min;
·孵育1min;
·將PCR板送回到磁性板支架B5并孵育2min;
·通過吸取50μl兩次和20μl一次,棄去上清液;
·將板送回到TMX并以1000rpm在25℃振蕩1min;
·孵育1min;
·將PCR板轉移回到磁性板支架B5并孵育2min;
·通過吸取50μl兩次和20μl一次,棄去上清液;
·將TMX設置為58℃;
·將PCR板轉移回至TMX并干燥2分鐘除去EtOH;
·將PCR板轉移回至位置C1;
·將25μl洗脫緩沖液加入至PCR板所選的孔;
·將PCR板轉移回至TMX并以1200rpm振蕩2min;
·將PCR板轉移至磁性板支架B5并孵育2min;
·從一個限定的PCR板孔吸取25μl洗脫樣品至另一個限定的孔。
所述方法和與這些方法有關的其它方面為與非自動化或需要更多手動步驟的相應方法相比,需要較少的勞動力、安全成本、試劑并且較不易污染。