用于檢測(cè)胎兒染色體非整倍性的無創(chuàng)性方法
【專利說明】用于檢測(cè)胎兒染色體非整倍性的無創(chuàng)性方法
[0001] 本發(fā)明涉及使用游離DNA,特別是經(jīng)大小選擇的游離DNA進(jìn)行胎兒非整倍性的無 創(chuàng)性產(chǎn)前診斷。更具體地說,本發(fā)明涉及診斷胎兒非整倍性的方法,其特征在于使用一組提 供高度增強(qiáng)的靈敏度和特異性的外部參照樣品。本發(fā)明還涉及獲得所述參照樣品和包含所 述參照樣品的試劑盒和/或一組用于診斷胎兒非整倍性的參照參數(shù)的方法。
[0002] 胎兒染色體非整倍性檢測(cè)是產(chǎn)前診斷中的重要步驟。染色體非整倍性引起幾種主 要疾病,如唐氏綜合癥(也稱為21三體)、18三體、13三體,盡快預(yù)測(cè)胎兒是否會(huì)受到這些 異?,F(xiàn)象之一的影響是至關(guān)重要的。此外,胎兒患非整倍性的風(fēng)險(xiǎn)通常隨母親年齡的增加 而增加。因此,在大多數(shù)發(fā)達(dá)國(guó)家中孕婦平均年齡的增加,進(jìn)一步提高了對(duì)強(qiáng)大且安全的檢 測(cè)胎兒染色體非整倍性的診斷方法的需求。
[0003]通常通過有創(chuàng)性方法進(jìn)行胎兒染色體非整倍性的檢測(cè),如絨膜絨毛取樣、羊膜腔 穿刺術(shù)或臍帶血取樣。這些方法的共同之處在于它們依賴于收集胎兒生物材料(羊水、絨 膜絨毛、臍帶血)以獲得胎兒細(xì)胞,這是染色體核型分析所必需的。這些方法已被常規(guī)性地 實(shí)施了很長(zhǎng)時(shí)間。然而,由于它們的有創(chuàng)性,它們對(duì)于胎兒和母親并不是無風(fēng)險(xiǎn)的。最常見 的風(fēng)險(xiǎn)是流產(chǎn)的可能性,就羊膜腔穿刺術(shù)來說其接近1 %。其他風(fēng)險(xiǎn)也與這些有創(chuàng)性方法有 關(guān),如感染、疾?。ɡ鏏IDS或乙型肝炎)從母體到胎兒的傳播、羊水滲漏或早產(chǎn)的風(fēng)險(xiǎn)。
[0004] 也已經(jīng)開發(fā)了基于超聲掃描或基于檢測(cè)母體血清生化標(biāo)記物的無創(chuàng)性方法,但是 這些方法主要局限于檢測(cè)副現(xiàn)象,并且對(duì)檢測(cè)染色體異常的核心病理具有有限的臨床有效 性。
[0005] 1997年,母體血漿中的游離胎兒核酸的發(fā)現(xiàn)開啟了新的可能性。使用這些核酸評(píng) 估胎兒染色體劑量的第一個(gè)策略是基于分析靶核酸(胎盤mRNA和含有胎盤特異性DNA甲 基化標(biāo)記的DNA分子)中SNP的等位基因比例,這基于通過SNP的等位基因比例分析來評(píng) 估胎兒染色體劑量。最近開發(fā)了另一種使用數(shù)字PCR的策略(Loetal.,2007)。該技術(shù)在 于測(cè)量母體血漿中潛在的非整倍體染色體(例如21號(hào)染色體)上的特定基因座的總量并 將該數(shù)量與參照染色體上的進(jìn)行比較。
[0006] 2008年,Chiu等人在用于在母體血漿中診斷胎兒21三體的方法中成功實(shí)施了大 規(guī)模平行測(cè)序(Chiuetal.,2008)。他們的方法在于對(duì)從血漿樣品中提取的DNA進(jìn)行大規(guī) 模平行測(cè)序。隨后將從MPGS步驟中獲得的序列與人類基因組的參照序列進(jìn)行比對(duì),計(jì)算每 條染色體的已被唯一映射(map)至人類基因組上的位置而沒有錯(cuò)配的序列的數(shù)量,并將其 與在MPGS中獲得的序列的總數(shù)進(jìn)行比較。該比率指示了存在于母體血漿樣品中的DNA分 子的"染色體表達(dá)"。與一組已知為整倍體的參照樣品相比,給定的樣品中的21號(hào)染色體的 過表達(dá)指示胎兒21三體。
[0007] 大約在同一時(shí)間,F(xiàn)an等人成功地開發(fā)了另一種使用鳥槍法測(cè)序無細(xì)胞血漿來診 斷胎兒21三體的方法(Fanetal.,2008)。對(duì)提取自母體血漿樣品的游離DNA進(jìn)行大規(guī)模 測(cè)序后,F(xiàn)an等人將每個(gè)序列映射到人類基因組上。然后,將人類基因組的每條染色體分為 50kb的區(qū)段(bin),并計(jì)算每個(gè)區(qū)段的唯一映射到人類基因組上且?guī)в凶疃嘁粋€(gè)錯(cuò)配的序 列標(biāo)簽的數(shù)量。隨后,F(xiàn)an等人計(jì)算了每條染色體上的序列標(biāo)簽的這種計(jì)數(shù)的中位值。最 后,F(xiàn)an等人將來自懷有患21三體的胎兒的母親的血漿中21號(hào)染色體的序列標(biāo)簽密度與來 自懷有整倍體胎兒的母親的血漿中21號(hào)染色體的序列標(biāo)簽密度進(jìn)行比較,他們注意到21 三體的序列標(biāo)簽密度高于整倍體樣品的序列標(biāo)簽密度,置信水平為99%。
[0008] 這些技術(shù)都依賴于檢測(cè)給定的染色體與整倍體參照樣品相比的過表達(dá)。它們提供 了有用的"概念驗(yàn)證"并為在胎兒非整倍性診斷中有效使用新一代測(cè)序技術(shù)鋪平了道路。然 而,在常規(guī)臨床環(huán)境中實(shí)施該方法需要比目前在現(xiàn)有技術(shù)中所述的更高水平的靈敏度和特 異性。
[0009] 無創(chuàng)性產(chǎn)前診斷使用全基因組新一代測(cè)序(WG-NGS)檢測(cè)胎兒非整倍性的靈敏度 取決于母體血漿中的胎兒DNA分?jǐn)?shù),并取決于測(cè)序深度。而所述胎兒DNA分?jǐn)?shù)取決于一系列 大量固有的生物變量,經(jīng)實(shí)驗(yàn)修正的技術(shù)變量包括i),DNA提取方法的效率,ii),NGS的精 度和通量,即可比對(duì)到所測(cè)序的基因組上的具有唯一精確匹配的序列標(biāo)簽(稱為"沒有錯(cuò) 配的唯一精確序列"或"UES")的分?jǐn)?shù)以及所測(cè)序的分子的總數(shù),iii),生物信息學(xué)算法的 性質(zhì),和iv),來自具有正常胎兒染色體核型的孕婦的樣品的對(duì)照組一一其提供了參照組。 后者是最重要的,因?yàn)槊織l單染色體的單個(gè)分子計(jì)數(shù)由所有常染色體的中位序列標(biāo)簽密度 來標(biāo)準(zhǔn)化(Fanetal2008)。
[0010] 本發(fā)明實(shí)施了之前未被用于無創(chuàng)性產(chǎn)前診斷并且比標(biāo)準(zhǔn)方法具有高五倍的產(chǎn)量 的DNA提取方法,以及嚴(yán)格質(zhì)量控制的NGS工作流程,所述NGS工作流程具有比所公開的參 考文獻(xiàn)總體上多25-30%的UES,并具有比當(dāng)前標(biāo)準(zhǔn)高三倍的大于15 ? 106的平均UES總計(jì) 數(shù)。所述測(cè)試的最終讀出符合穩(wěn)健的臨床測(cè)試的要求,即對(duì)主要的胎兒非整倍性的100%靈 敏度和100%特異性。例如,該方法將21三體或唐氏綜合征與正常的男性和女性染色體核 型區(qū)別開,其偶然產(chǎn)生錯(cuò)誤結(jié)果的先驗(yàn)概率< 1. 1 ? 10 5。由于基準(zhǔn)是< 2. 7 ? 10 3,這表示 提高了兩個(gè)數(shù)量級(jí)。本發(fā)明提供了方法的組合,所述方法使得能夠建立高質(zhì)量的參照組序 列,這是確定NGS方法的性能的關(guān)鍵步驟。
[0011] 因此,本發(fā)明的第一方面涉及從母體生物樣品,優(yōu)選血液樣品中獲得用于診斷胎 兒非整倍性的一組參照樣品和/或一組參照參數(shù)的方法,所述方法包括:
[0012] -從獲自懷有整倍體胎兒的整倍體孕婦的一組生物樣品,優(yōu)選血液樣品中提取游 離DNA的步驟;
[0013]-對(duì)每個(gè)樣品中的DNA進(jìn)行大規(guī)模平行測(cè)序的步驟;
[0014] _將每個(gè)樣品所獲得的序列映射到人類基因組上的步驟;
[0015]-任選計(jì)算一組參照參數(shù),其中每個(gè)參照參數(shù)指示每個(gè)樣品映射到目的染色體或 染色體區(qū)域上的唯一精確序列的數(shù)量;
[0016] _獲得一組參照樣品和/或一組參照參數(shù);
[0017] 其中所述方法包括以下額外的步驟/特征中的至少一種:
[0018] _從每個(gè)生物樣品中提取游離DNA,其包括:
[0019] 〇將所述生物樣品與包含氯仿和苯酚的組合物混合;
[0020] 〇從所述混合物中萃取水相;
[0021] 〇從所述水相中沉淀DNA;
[0022] 〇任選收集沉淀的DNA。
[0023] -在所述提取步驟之后,分析每個(gè)樣品內(nèi)DNA分子的大小分布,并基于所述樣品內(nèi) DNA分子的大小分布選擇一組樣品;
[0024] -在所述提取步驟之后或在所述基于DNA分子的大小分布的選擇步驟之后,對(duì)每 個(gè)樣品的DNA進(jìn)行預(yù)測(cè)序,將所獲得的序列映射到人類基因組上,并基于映射到人類基因 組上的唯一精確序列的量來選擇一組樣品;
[0025]-在將獲自大規(guī)模平行測(cè)序的序列進(jìn)行映射的步驟之后,基于映射到人類基因組 上的唯一精確序列的數(shù)量選擇一組樣品。
[0026] 所述方法可包含這些額外的步驟或特征中的任一個(gè)、這些額外的步驟或特征中的 任意兩個(gè)或三個(gè)的組合或所述四個(gè)額外的步驟和特征。
[0027] 優(yōu)選地,本發(fā)明的方法包括游離DNA的大小選擇的步驟,特別是緊接所述提取步 驟之后和大規(guī)模平行測(cè)序之前。根據(jù)這個(gè)實(shí)施方案,本發(fā)明涉及從包含游離DNA的母體生 物樣品中獲得用于診斷胎兒非整倍性的一組參照樣品和/或一組參照參數(shù)的方法,所述方 法包括:
[0028]-從獲自懷有整倍體胎兒的整倍體孕婦的一組生物樣品中提取游離DNA;
[0029] -在所述提取步驟之后,分析每個(gè)樣品內(nèi)DNA分子的大小分布,并基于所述樣品內(nèi) DNA分子的大小分布選擇一組樣品;
[0030] -對(duì)每個(gè)經(jīng)大小選擇的樣品的DNA進(jìn)行大規(guī)模平行測(cè)序;
[0031] _將每個(gè)樣品所獲得的序列映射到人類基因組上;
[0032]-計(jì)算一組參照參數(shù),其中每個(gè)參照參數(shù)指示每個(gè)樣品映射到目的染色體或染色 體區(qū)域上的唯一精確序列的數(shù)量;
[0033] _獲得一組參照樣品和/或一組參照參數(shù)。
[0034] 這種包括大小選擇步驟的用于獲得一組參照樣品的方法的一個(gè)優(yōu)選實(shí)例包括:
[0035]a)從一組生物樣品中提取游離DNA,所述生物樣品獲自懷有整倍體胎兒的整倍體 孕婦,并且還任選獲自懷有非整倍體胎兒的整倍體孕婦;
[0036]b)將所提取的游離DNA的樣品進(jìn)行大小選擇的步驟,特別是為了將大小大于 200bp的游離DNA分子去除;
[0037]c)對(duì)在步驟(b)中獲得的經(jīng)大小選擇的提取的DNA樣品進(jìn)行處理,以用于制備測(cè) 序文庫,例如通過末端修復(fù)DNA分子和連接測(cè)序接頭,任選隨后擴(kuò)增經(jīng)接頭-連接的片段;
[0038]d)對(duì)在(c)中獲得的每一個(gè)經(jīng)大小選擇的樣品的DNA進(jìn)行大規(guī)模平行測(cè)序;
[0039]e)將每個(gè)樣品在步驟⑷中獲得的序列映射到人類基因組上;
[0040]f)計(jì)算一組參照參數(shù),其中每個(gè)參照參數(shù)指示每個(gè)樣品映射到目的染色體或染色 體區(qū)域上的唯一精確序列的數(shù)量;
[0041]g)獲得一組參照樣品和/或一組參照參數(shù)。
[0042] 特別優(yōu)選的是,在獲得參照組樣品時(shí),從其中提取游離DNA的生物樣品組還包括 獲自懷有非整倍體胎兒的整倍體孕婦的樣品,通過這種方式,所述參照組為整倍體和非整 倍體樣品都提供了參照值。
[0043] 在一個(gè)替代的實(shí)施方案中,從包含游離DNA的母體生物樣品中獲得用于診斷胎兒 非整倍性的一組參照樣品的方法在大規(guī)模平行測(cè)序之前包括對(duì)樣品的經(jīng)大小選擇的子集 進(jìn)行預(yù)測(cè)序和映射的步驟。根據(jù)這個(gè)替代的實(shí)施方案,所述方法包括:
[0044] (i)從獲自一組懷有整倍體胎兒的整倍體孕婦的一組生物樣品,優(yōu)選血液樣品中 提取游離DNA;
[0045] (ii)分析每個(gè)樣品內(nèi)DNA分子的大小分布;
[0046] (iii)基于所述樣品內(nèi)DNA分子的大小分布選擇第一組樣品;
[0047] (iv)對(duì)來自所述第一組樣品的每個(gè)樣品的DNA進(jìn)行預(yù)測(cè)序;
[0048] (V)將步驟(iv)中獲得的序列映射到人類基因組上;
[0049] (vi)基于步驟(V)中映射到人類基因組上的唯一精確序列的數(shù)量選擇第二組樣 品;
[0050] (vii)對(duì)來自所述第二組樣品的每個(gè)樣品的DNA進(jìn)行大規(guī)模平行測(cè)序;
[0051] (viii)將步驟(vii)中獲得的序列映射到人類基因組上;
[0052] (ix)基于步驟(viii)中映射到人類基因組上的唯一精確序列的數(shù)量選擇一組參 照樣品。
[0053] 在一個(gè)具體的實(shí)施方案中,步驟(iii)包括選擇其中至少90wt%,優(yōu)選95wt%以 上的DNA分子的大小為156bp至176bp的樣品。
[0054] 在另一個(gè)實(shí)施方案中,步驟(iii)包括選擇具有至少0. 88ng/yL大小為156bp至 176bp的DNA分子的樣品。
[0055] 在另一個(gè)實(shí)施方案中,步驟(iv)包括對(duì)每個(gè)樣品內(nèi)1000至100000個(gè)序列進(jìn)行測(cè) 序。
[0056] 在另一個(gè)實(shí)施方案中,步驟(vi)包括選擇具有相對(duì)于步驟(iv)中獲得的序列總 數(shù)至少70%的唯一精確序列的樣品。
[0057] 在另一個(gè)實(shí)施方案中,步驟(vii)包括對(duì)每個(gè)樣品的至少2500萬個(gè)序列進(jìn)行測(cè) 序。在另一個(gè)實(shí)施方案中,步驟(vii)包括獲得每個(gè)樣品的至少2500萬個(gè)過濾后(filter passing)讀長(zhǎng)(read)〇
[0058] 在另一個(gè)實(shí)施方案中,步驟(ix)包括選擇具有超過1500萬個(gè)唯一精確序列讀長(zhǎng) 的樣品。
[0059] 本發(fā)明還涉及從母體生物測(cè)試樣品,優(yōu)選血液樣品診斷胎兒非整倍性的方法,所 述方法包括:
[0060] (a)從獲自孕婦的母體生物測(cè)試樣品中提取游離DNA;
[0061] (b)對(duì)提取自所述測(cè)試樣品的游離DNA進(jìn)行大規(guī)模平行測(cè)序;
[0062](c)將步驟(b)中獲得的序列映射到人類基因組上;
[0063] (d)計(jì)算指示映射到目的染色體或染色體區(qū)域的唯一精確序列的數(shù)量的測(cè)試參 數(shù);
[0064] (e)計(jì)算一組參照參數(shù),其中每個(gè)參照參數(shù)指示例如根據(jù)本發(fā)明所獲得的一組參 照樣品(如一組整倍體參照樣品)的樣品映射到目的染色體或染色體區(qū)域上的唯一精確序 列的數(shù)量;
[0065] (f)將步驟(d)中計(jì)算的所述測(cè)試參數(shù)與步驟(e)中計(jì)算的所述參照參數(shù)組進(jìn)行 比較;
[0066] (g)基于所述比較,診斷胎兒非整倍性。
[0067] 診斷胎兒非整倍性的一個(gè)優(yōu)選的方法包括上述方法,其中,在所述提取步驟之后, 進(jìn)行基于所述樣品內(nèi)DNA分子的大小的大小選擇步驟。所述大小選擇步驟基本上從所述測(cè) 試樣品中去除了大小大于200bp的DNA分子。優(yōu)選地,在制備測(cè)序文庫之前進(jìn)行這個(gè)步驟。 特別優(yōu)選地,這個(gè)診斷方法與參照樣品的使用相結(jié)合,所述參照樣品也經(jīng)過了如上所述的 游離DNA大小選擇的步驟。事實(shí)上,根據(jù)本發(fā)明,優(yōu)選對(duì)測(cè)試樣品進(jìn)行與參照樣品相同的方 法學(xué)。
[0068] 根據(jù)這個(gè)優(yōu)選的實(shí)施方案,用于從母體生物測(cè)試樣品,優(yōu)選血液樣品診斷胎兒非 整倍性的方法包括:
[0069] (a)從獲自孕婦的母體生物測(cè)試樣品(如血液)中提取游離DNA;
[0070] (b)對(duì)所提取的游離DNA進(jìn)行大小選擇的步驟,以使大小大于200bp的DNA分子從 所述樣品中基本去除;
[0071] (c)對(duì)經(jīng)大小選擇的提取的游離DNA進(jìn)行處理,以用于制備測(cè)序文庫,例如通過末 端修復(fù)DNA分子和連接測(cè)序接頭,任選隨后擴(kuò)增經(jīng)接頭-連接的片段;
[0072] (d)對(duì)步驟(c)中獲得的游離DNA進(jìn)行大規(guī)模平行測(cè)序;
[0073] (e)將步驟⑷中獲得的序列映射到人類基因組上;
[0074] (f)計(jì)算指示映射到目的染色體或染色體區(qū)域上的唯一精確序列的數(shù)量的測(cè)試參 數(shù);
[0075] (g)計(jì)算一組參照參數(shù),其中每個(gè)參照參數(shù)指示根據(jù)本發(fā)明的大小選擇的方法獲 得的一組參照樣品(如一組整倍體參照樣品)的樣品映射到目的染色體或染色體區(qū)域上的 唯一精確序列的數(shù)量;
[0076] (h)將步驟(f)中計(jì)算的所述測(cè)試參數(shù)與步驟(g)中計(jì)算的所述參照參數(shù)組進(jìn)行 比較;
[0077] ⑴基于所述比較,診斷胎兒非整倍性。
[0078] 優(yōu)選地,從母體生物測(cè)試樣品中提取游離DNA包括:
[0079] -將所述生物樣品與包含氯仿和苯酚的組合物混合;
[0080] -從所述混合物中萃取水相;
[0081] -從所述水相中沉淀DNA;
[0082] -任選收集沉淀的DNA。
[0083] 在一個(gè)具體的實(shí)施方案中,所述測(cè)試參數(shù)是標(biāo)準(zhǔn)化為所有常染色體的中位唯一精 確序列標(biāo)簽密度的目的染色體或染色體區(qū)域的唯一序列標(biāo)簽密度。
[0084] 在另一個(gè)實(shí)施方案中,所述測(cè)試參數(shù)是映射到所述染色體或染色體區(qū)域上的唯一 精確序列相對(duì)于映射到所有染色體上的唯一精確序列總數(shù)或映射到所有常染色體上的唯 一精確序列總數(shù)的百分比。
[0085] 在另一個(gè)實(shí)施方案中,通過計(jì)算所述測(cè)試參數(shù)相對(duì)于參照參數(shù)組的z分?jǐn)?shù)來進(jìn)行 步驟(f)中的所述比較。
[0086] 在另一個(gè)實(shí)施方案中,所述測(cè)試參數(shù)是目的染色體或染色體區(qū)域的絕對(duì)精確序列 計(jì)數(shù)或目的染色體或染色體區(qū)域的平均精確序列計(jì)數(shù)。
[0087] 在其他的實(shí)施方案中,通過計(jì)算目的染色體或染色體區(qū)域的唯一精確序列計(jì)數(shù), 或目的染色體或染色體區(qū)域的平均精確序列計(jì)數(shù)屬于參照組的目的染色體的唯一精確序 列計(jì)數(shù)的正態(tài)分布的概率來進(jìn)行步驟(f)中的所述比較。
[0088] 在另一個(gè)實(shí)施方案中,所述目的染色體是21號(hào)染色體、18號(hào)染色體、16號(hào)染色體、 11號(hào)染色體或13號(hào)染色體。
[0089] 在另一個(gè)實(shí)施方案中,所述目的染色體是21號(hào)染色體,并且21三體樣品的z分?jǐn)?shù) 至少是4. 4,而21號(hào)染色體是整倍體的樣品的z分?jǐn)?shù)的絕對(duì)值小于4. 4。
[0090] 本發(fā)明還涉及從包含胎兒和母體游離DNA的母體生物樣品中提取游離DNA的方 法,所述方法包括:
[0091]-將所述生物樣品與包含氯仿和苯酚的組合物混合;
[0092] _從所述混合物中萃取水相;
[0093]-從所述水相中沉淀DNA;
[0094]-任選收集沉淀的DNA。
[0095]