、12ql4 復(fù)制、 13ql2 復(fù)制、15qll. 2 復(fù)制、Prader-Willi/ 天使區(qū)域復(fù)制、15q13. 3 復(fù)制、15q24BP0_BPl 復(fù)制、15q24BP2_BP3 復(fù)制、15q25. 2 復(fù)制、Rubinstein-Taybi區(qū)域復(fù)制、16pl3. 11 復(fù)制、 16pll. 2pl2. 1 復(fù)制、16pl2. 1 復(fù)制、16pll. 2 末端復(fù)制、16pll. 2 復(fù)制、17pl3. 3 復(fù)制、17pl3. 3 復(fù)制、17pl3. 3 復(fù)制、CMTlA、Potocki_Lupski綜合征、NF1 復(fù)制、17ql2 復(fù)制、17q21. 31 復(fù)制、 22qll. 2復(fù)制、22qll. 2末端復(fù)制、22ql3復(fù)制。
[0174] 關(guān)于這些疾病的參考文獻(xiàn)以及涉及小于10Mb的染色體部分的拷貝數(shù)變異的非整 倍性相關(guān)的基因組疾病的全面綜述可參見(jiàn)Cooperetal.,2011,其通過(guò)引用的方式納入本 文。
[0175] 本文使用的術(shù)語(yǔ)"整倍體樣品"是指獲自懷有整倍體胎兒的整倍體母親的樣品。術(shù) 語(yǔ)"整倍體"可以相對(duì)的意義來(lái)使用,即涉及特定的目的染色體或染色體區(qū)域?;蛘?,術(shù)語(yǔ) "整倍體"可以絕對(duì)的意義來(lái)使用,即涉及整個(gè)基因組。在這種情況下,整倍體樣品在其整個(gè) 基因組上不具有任何非整倍性。
[0176] 本文使用的術(shù)語(yǔ)"非整倍體樣品"是指獲自懷有非整倍體胎兒的整倍體母親的樣 品。與"整倍體"類似,術(shù)語(yǔ)"非整倍體"可參照特定的目的染色體或染色體區(qū)域來(lái)使用或 參照整個(gè)染色體組來(lái)使用。
[0177] 本文使用的術(shù)語(yǔ)"唯一精確序列"是指唯一映射到人類基因組上而沒(méi)有任何錯(cuò)配 的序列。換言之,所述序列已和人類基因組中的單個(gè)位置進(jìn)行比對(duì),并且與所述位置具有完 全相同的序列,即相對(duì)于人類基因組中的所述位置處存在的序列沒(méi)有任何缺失、添加或突 變。所述唯一精確序列的長(zhǎng)度通常為20至100bp,優(yōu)選40至70bp,更優(yōu)選50bp。本文使用 的術(shù)語(yǔ)"唯一精確序列"(UES)與術(shù)語(yǔ)"唯一精確匹配"(UEM)是同義的。
[0178] 如本文所使用的,例如在"母體生物樣品"中的"母體樣品"是獲自孕婦的樣品。
[0179] 如本文所使用的,"生物樣品"優(yōu)選是指包含游離DNA的生物樣品,更優(yōu)選是指全 血、血漿、血清、尿液或母乳樣品。
【具體實(shí)施方式】
[0180] 本發(fā)明的第一方面是指建立一組整倍體參照生物樣品,或一組整倍體和非整倍體 參照樣品,其中仔細(xì)選擇每個(gè)參照樣品以增加胎兒非整倍性診斷方法的統(tǒng)計(jì)置信度。這個(gè) 選擇過(guò)程的工作流程包括如下若干重要的選擇步驟:
[0181]-基于樣品內(nèi)DNA的大小分布的選擇(步驟(ii)和(iii));
[0182]-基于通過(guò)對(duì)樣品進(jìn)行預(yù)測(cè)序并將所得到的序列映射到人類基因組上而獲得的唯 一精確序列的數(shù)量的選擇(步驟(iv)至(vi));
[0183]-基于通過(guò)對(duì)樣品進(jìn)行測(cè)序并將得到的序列映射到人類基因組上而獲得的唯一精 確序列的數(shù)量的選擇(步驟(vii)至(ix));
[0184] 本發(fā)明的方法可包括三個(gè)上述選擇步驟中的任意一個(gè)。然而,在一個(gè)優(yōu)選的實(shí)施 方案中,進(jìn)行所有三個(gè)選擇步驟,從而增加了最終參照樣品組的質(zhì)量。
[0185]牛物樣品收集
[0186] 本發(fā)明方法通常可在游離DNA、特別是胎兒和母體游離DNA可存在于其中的任何 生物樣品上進(jìn)行。特別地,所述生物樣品可以是體液,如血液、尿液、母乳。優(yōu)選血液樣品。 本文提及的血液樣品是指全血樣品、血漿樣品或血清樣品??稍谌焉锲诘娜魏螘r(shí)間收集生 物樣品,但優(yōu)選從妊娠7周起收集,例如在妊娠7周至20周之間,優(yōu)選妊娠7周至14周,更 優(yōu)選妊娠7周至10周。在決定中斷妊娠的情況下(例如,取決于國(guó)家法律,可能允許通過(guò) 使用藥物或藥物的組合進(jìn)行中斷),早在妊娠7周時(shí)進(jìn)行的診斷具有使更多醫(yī)療選擇保持 開(kāi)放的優(yōu)點(diǎn)。
[0187] 可在有創(chuàng)性產(chǎn)前方法(如絨膜絨毛取樣、羊膜腔穿刺術(shù)或臍帶血取樣)后收集 生物樣品。可在所述有創(chuàng)性方法之后的任何時(shí)間收集樣品,例如所述有創(chuàng)性方法后至少 10min、20min或30min。也可在所述有創(chuàng)性方法的至少一天或更多天后收集生物樣品,例如 所述有創(chuàng)性方法的二至五天后。
[0188] 或者,生物樣品可收集自尚未經(jīng)過(guò)有創(chuàng)性產(chǎn)前方法的婦女。這種情況對(duì)于待診斷 的生物樣品是優(yōu)選的,因?yàn)樵摲椒ǖ膬?yōu)點(diǎn)就是避免任何有創(chuàng)性方法。
[0189] 可不依賴于本發(fā)明的方法來(lái)診斷用于形成參照組的樣品中的胎兒非整倍性狀態(tài)。 這可用于確定用于形成參照組樣品的樣品確實(shí)是整倍體樣品,或換言之,是獲自懷有整倍 體胎兒的整倍體母親的樣品。用于獲得參照組樣品的整倍體樣品優(yōu)選是參照如上文所給出 的術(shù)語(yǔ)的"絕對(duì)"定義的整倍體,即它們?cè)谡麄€(gè)基因組上是整倍體,而非僅對(duì)于特定的目的 染色體。如上所述,根據(jù)本發(fā)明的一個(gè)優(yōu)選的變體,用于建立參照樣品的樣品還可包括來(lái)自 懷有非整倍體胎兒(例如具有21、18或13三體的胎兒)的整倍體母親的樣品。同樣地,可 不依賴于本發(fā)明的方法來(lái)診斷這種樣品中的胎兒非整倍性狀態(tài)。
[0190] 評(píng)估胎兒非整倍性狀態(tài)的方法可包括通過(guò)有創(chuàng)性產(chǎn)前診斷方法(如羊膜腔穿刺 術(shù)、絨膜絨毛取樣或臍帶血取樣)從母親處收集胎兒細(xì)胞材料。然后,可通過(guò)下列技術(shù)中的 任一種來(lái)評(píng)估胎兒的非整倍性狀態(tài):染色體核型分析、熒光原位雜交(FISH)、短串聯(lián)重復(fù) 序列的定量聚合酶鏈反應(yīng)(PCR)、熒光定量PCR(QF-PCR)、定量實(shí)時(shí)PCR(RT-PCR)劑量分析、 單核苷酸多態(tài)性的定量質(zhì)譜分析以及比較基因組雜交(CGH)。
[0191] 在大多數(shù)情況下,母親的非整倍性狀態(tài)是已知的,因?yàn)榇蠖鄶?shù)非整倍性相關(guān)的疾 病是有癥狀的。然而,如果需要的話,也可通過(guò)使用獲自母親的細(xì)胞材料來(lái)評(píng)估母親的非整 倍性狀態(tài)??墒褂蒙鲜龅娜我饧夹g(shù)。
[0192]游離DNA的提取
[0193] 本發(fā)明方法的重要參數(shù)是從母體生物樣品中有效提取DNA。優(yōu)選通過(guò)苯酚-氯仿 提取方案進(jìn)行游離DNA的提取。所述提取方案通常包括:
[0194]-將所述生物樣品與包含氯仿和苯酚的組合物混合;
[0195] _從所述混合物中萃取水相;
[0196]-從所述水相中沉淀游離DNA;
[0197] -任選收集游離DNA。
[0198] 本發(fā)明包括苯酚/氯仿用于從生物樣品、優(yōu)選從血液樣品如血漿樣品中提取游離 DNA的用途。本方法對(duì)于從母體生物樣品中提取混合的胎兒和母體游離DNA是特別可觀的, 因?yàn)樗痊F(xiàn)有方法產(chǎn)生更穩(wěn)健的胎兒DNA信號(hào)。根據(jù)本發(fā)明,術(shù)語(yǔ)"苯酚/氯仿"是指苯酚 和氯仿的混合物,即包含苯酚和氯仿的組合物。所述組合物優(yōu)選是水溶液,并優(yōu)選還包含異 戊醇。所述組合物的pH優(yōu)選為7至9,更優(yōu)選7. 8至8.2。一個(gè)優(yōu)選的組合物是pH為7. 8 至8. 2的苯酚:氯仿:異戊醇的25:24:1的混合物。所述組合物可包含一種或多種添加劑, 如一種或多種抗氧化劑和/或穩(wěn)定劑。
[0199] 在一個(gè)具體的實(shí)施方案中,所述提取方法包括用一種或多種蛋白酶如蛋白酶K對(duì) 生物樣品進(jìn)行預(yù)處理的步驟。
[0200] 水相的萃取可包括將與氯仿和苯酚混合的生物樣品離心,并收集水相。所述離心 實(shí)現(xiàn)了將混合的生物樣品分離成主要包含苯酚、蛋白質(zhì)或蛋白質(zhì)碎片的下層有機(jī)相和包含 核酸的上層水相。
[0201] 在一個(gè)實(shí)施方案中,從水相中沉淀游離DNA包括以下的步驟:
[0202] -將至少一種沉淀劑與水相混合;
[0203]-將所述混合的水相離心;以及
[0204]-收集離心沉淀物。
[0205] 所述沉淀劑優(yōu)選選自糖原、低級(jí)醇如異丙醇或乙醇或其混合物。隨后,可將包含 DNA的離心沉淀物例如用乙醇和/或乙醚洗滌一次或多次。最后,可將DNA重懸于懸浮緩沖 液,例如Tris緩沖液中。
[0206] 所述苯酚-氯仿提取方案比在使用大規(guī)模平行測(cè)序進(jìn)行胎兒非整倍性檢測(cè)的情 況下傳統(tǒng)使用的柱法產(chǎn)生的DNA量高5倍(Chiuetal.,2008、Fanetal.,2008)。其還 產(chǎn)生了更高分?jǐn)?shù)的大小為156-176bp的DNA,即母體和胎兒游離DNA。因此,這個(gè)方案是增 加來(lái)自胎兒DNA的序列讀長(zhǎng)的數(shù)量的重要工具。
[0207] 測(cè)序f庫(kù)的制備
[0208] 提取游離DNA之后,任選對(duì)含提取的DNA的樣品進(jìn)行處理以用于制備測(cè)序文庫(kù)。這 種處理可在提取游離DNA之后立即進(jìn)行,或優(yōu)選地,可在對(duì)所提取的游離DNA進(jìn)行大小選擇 的步驟之后進(jìn)行。
[0209] 所述文庫(kù)制備可包括一個(gè)或多個(gè)擴(kuò)增步驟、與一個(gè)或多個(gè)測(cè)序接頭連接、和/或 條形編碼DNA分子。測(cè)序文庫(kù)制備的一般工作流程包括將任選和一個(gè)或多個(gè)條形碼序列連 接的一個(gè)或多個(gè)接頭序列連接至樣品內(nèi)的DNA分子上的步驟,然后對(duì)經(jīng)接頭/條形碼連接 的DNA分子進(jìn)行擴(kuò)增。
[0210] 測(cè)序接頭是通常用于現(xiàn)代測(cè)序技術(shù)中的短核苷酸序列。所述接頭用于將待測(cè)序的 DNA分子錨定在(例如流動(dòng)池中的)固體表面上。因此,設(shè)計(jì)這些接頭以便和連接在所述 固體表面上的靶寡核苷酸雜交。優(yōu)選通過(guò)修復(fù)DNA分子末端來(lái)進(jìn)行接頭的連接,即將所提 取的DNA分子的突出端去除或補(bǔ)平,例如通過(guò)一種或多種核酸外切酶和/或聚合酶的作用, 從而產(chǎn)生平末端DNA分子。然后,可任選將一個(gè)或多個(gè)'A'堿基的突出端加至所述平末端 DNA分子的3'末端。然后加入在其3'末端包含一個(gè)或多個(gè)'T'堿基的突出端的接頭并將 其連接至DNA分子3'末端的一個(gè)或多個(gè)'A'堿基的突出端。也可將接頭進(jìn)行平端連接。
[0211] 也可對(duì)樣品內(nèi)的DNA片段進(jìn)行條形編碼。條形編碼是指將樣品特異性的標(biāo)簽連接 至樣品的DNA分子。條形編碼使得能夠在單次測(cè)序運(yùn)行中對(duì)若干樣品進(jìn)行測(cè)序,這節(jié)省了 時(shí)間和資源。
[0212] 還可對(duì)樣品內(nèi)的DNA片段進(jìn)行一個(gè)或多個(gè)擴(kuò)增循環(huán),例如通過(guò)PCR。可運(yùn)行10至 25個(gè)擴(kuò)增循環(huán),例如18個(gè)擴(kuò)增循環(huán)。優(yōu)選在將接頭序列連接至DNA分子之后進(jìn)行擴(kuò)增。PCR 擴(kuò)增優(yōu)選使用針對(duì)所述接頭序列的引物,從而將文庫(kù)富集為經(jīng)接頭連接的片段。
[0213]游離DNA大小分布的分析和詵擇
[0214] 在提取游離DNA之后,可分析每個(gè)樣品內(nèi)DNA分子的大小分布。優(yōu)選通過(guò)毛細(xì)管 電泳進(jìn)行所述分析。例如通過(guò)使用商業(yè)的lab-on-a-chip毛細(xì)管電泳系統(tǒng)進(jìn)行??梢栽谥?備測(cè)序文庫(kù)之前或之后進(jìn)行大小分布分析。然而,優(yōu)選在制備測(cè)序文庫(kù)之前進(jìn)行。
[0215] 本發(fā)明人已證實(shí):對(duì)于總量相等的輸入DNA,在NGS之后總原始讀長(zhǎng)的數(shù)量發(fā)生 意想不到的變化。原始提取物的毛細(xì)管電泳顯示對(duì)此的一個(gè)可能的解釋可以是高分子量 (MW)DNA種類(>1000bp)--其降低了包含可用于NGS的目的胎兒DNA的小麗部分的相對(duì) 量一一的存在。在游離DNA提取之后和在文庫(kù)制備之前立即進(jìn)行的去除高分子量種類的實(shí) 驗(yàn)已經(jīng)證實(shí)小MW種類(<200bp,特別是150-200bp)的大小選擇和高M(jìn)W種類的排除大大消 除了NGS之后獲得的原始讀長(zhǎng)的數(shù)量的可變性(見(jiàn)圖16)。除了其由僅僅對(duì)經(jīng)大小選擇的 分子進(jìn)行處理用于測(cè)序文庫(kù)制備并進(jìn)行大規(guī)模測(cè)序這樣的事實(shí)所產(chǎn)生的經(jīng)濟(jì)利益,該技術(shù) 步驟還提高了實(shí)驗(yàn)的穩(wěn)健性和分辨率。具體地,該大小選擇的步驟增加胎兒分?jǐn)?shù),即游離循 環(huán)胎兒DNA占循環(huán)游離DNA總量的比例,使得在低胎兒分?jǐn)?shù)的情況下它的使用對(duì)實(shí)驗(yàn)的穩(wěn) 健性至關(guān)重要。文庫(kù)制備之前的大小選擇所帶來(lái)的胎兒分?jǐn)?shù)的增加具有降低可靠地檢測(cè)三 體性所需的讀長(zhǎng)的數(shù)量的作用。
[0216] 可通過(guò)本領(lǐng)域已知的任何技術(shù)進(jìn)行去除大小大于200bp的游離DNA分子的步驟。 特別優(yōu)選使用磁珠,例如如下文實(shí)施例中所述的AMPureXP?珠。也可以使用凝膠電泳。 本發(fā)明人已經(jīng)證明不論用于大規(guī)模平行測(cè)序步驟的具體技術(shù)是什么,都能獲得本發(fā)明的大 小選擇的有益效果。例如,使用邊合成邊測(cè)序法以及基于半導(dǎo)體的新一代測(cè)序技術(shù)都能獲 得。還已經(jīng)證明:雖然測(cè)試樣品和參照組使用相同的大規(guī)模平行測(cè)序平臺(tái)是最佳的,但是當(dāng) 將不同的平臺(tái)施用于樣品和參照組時(shí)也能獲得可靠的結(jié)果。
[0217] 此外,通過(guò)分析一組整倍體樣品中的DNA分子的大小分布,本申請(qǐng)的發(fā)明人已發(fā) 現(xiàn):用于制備測(cè)序文庫(kù)而處理的游離DNA-一即,經(jīng)接頭連接的游離DNA-一的大小分布在 約298bp處具有大小頂峰(圖1)。在減去132bp的接頭/條形碼序列大小之后,峰值大小 相當(dāng)于166bp。該值與之前由Fanetal.,2008提供的數(shù)據(jù)一致并與游離DNA主要來(lái)自單 核小體的假設(shè)一致。
[0218] 根據(jù)本發(fā)明,樣品內(nèi)DNA的大小分布可在構(gòu)建用于診斷胎兒非整倍體的合適的參 照樣品組的過(guò)程中用作標(biāo)準(zhǔn)。該標(biāo)準(zhǔn)使得能夠選擇具有高水平游離DNA的樣品并去除具有 低水平游離DNA的樣品。
[0219] 選擇標(biāo)準(zhǔn)可在于在約166bp處大小頂峰的出現(xiàn)。本文使用的術(shù)語(yǔ)"約166bp"可 具有下列含義:"151至181bp"或"156至176bp"或"161至171bp"或"163至169bp"或 "165至167bp"?;蛘?,該術(shù)語(yǔ)的含義可以是"恰恰在166bp處"。
[0220] 用于選擇合適的參照樣品的另一標(biāo)準(zhǔn)可能在于在約166bp處的頂峰的高度,或換 句話說(shuō),大小為約166bp的DNA分子的分?jǐn)?shù)。因此,在一個(gè)具體的實(shí)施方案中,步驟(iii) 包括選擇這樣的樣品:其中樣品內(nèi)至少80wt%,更優(yōu)選至少90wt%,優(yōu)選至少95wt%,更優(yōu) 選至少97wt%的DNA分子的大小為約166bp,優(yōu)選156至176bp。
[0221] 可選地或另外地,步驟(iii)包括選擇這樣的樣品:其中大小為約166bp(優(yōu)選 156至176bp)的DNA分子的濃度為至少0. 88ng/y1,優(yōu)選至少0. 90ng/y1,更優(yōu)選至少 0? 95ng/y1 或至少 1. 00ng/y1 或至少 1. 05ng/y1 或至少 1. 10ng/y1。
[0222] 可選地或另外地,步驟(iii)包括選擇這樣的樣品:其中大小為約166bp(優(yōu)選 156至176bp)的DNA分子的量為至少13ng,優(yōu)選至少13. 5ng,更優(yōu)選至少14. 25ng或至少 15ng或至少15. 75ng或至少16. 5ng。
[0223] 優(yōu)選地,在步驟(iii)所選擇的樣品組中的大小為約166bp(優(yōu)選156至176bp)的 提取的DNA分子的平均濃度為至少0. 88ng/y1,優(yōu)選至少0. 90ng/y1,更優(yōu)選至少0. 95ng/ y1 或至少 1. 〇〇ng/y1 或至少 1. 05ng/y1 或至少 1. 10ng/y1。
[0224] 優(yōu)選地,在步驟(iii)所選擇的樣品組中的大小為約166bp(優(yōu)選156至176bp) 的DNA分子的平均量為至少13ng,優(yōu)選至少13. 5ng,更優(yōu)選至少14. 25ng或至少15ng或至 少15. 75ng或至少為16. 5ng。
[0225] 可以為測(cè)序步驟制備的DNA文庫(kù)來(lái)測(cè)量濃度和/或量,例如可以經(jīng)接頭/條形碼 連接的DNA分子(例如以與132bp的接頭/條形碼連接的DNA分子)來(lái)測(cè)量。優(yōu)選地,在 連接接頭/條形碼之后,所述DNA分子已經(jīng)進(jìn)行了 18個(gè)擴(kuò)增循環(huán)。更優(yōu)選地,以通過(guò)使用 20ngDNA作為輸入材料使用lllumina'sChIP測(cè)序方案制備的DNA文庫(kù)來(lái)測(cè)量濃度和/或 量。也可以在制備DNA文庫(kù)之前測(cè)量濃度和/或量。
[0226] 有趣的是,本申請(qǐng)的發(fā)明人還發(fā)現(xiàn):母體血漿樣品中的DNA分子在約133至143bp 處存在較小的大小肩峰(圖1,右圖)。這個(gè)肩峰很可能反映的是胎兒DNA,并可被用作選擇 具有富集的胎兒DNA分?jǐn)?shù)的樣品的額外或可選的質(zhì)量控制標(biāo)準(zhǔn)。因此,步驟(iii)還可包 括選擇其DNA大小分布在133和143bp之間顯不出頂峰或肩峰的樣品。
[0227] 上文所示的大小值(166bp處的峰值和相關(guān)值)相當(dāng)于未經(jīng)接頭或條形碼連接的 DNA分子,即母體血液中存在的DNA分子。如果需要的話,可對(duì)這些值進(jìn)行調(diào)整以考慮接頭、 條形碼的存在,或在DNA分子的一個(gè)或兩個(gè)末端的任何序列標(biāo)簽的存在。
[0228] 如本文所使用的,峰值是指表示樣品內(nèi)DNA分子的大小分布的曲線中的局部最大 值。肩峰是指這條曲線中的拐點(diǎn)。
[0229] 預(yù)測(cè)序
[0230] 根據(jù)本發(fā)明,預(yù)測(cè)序是指可以任選在大規(guī)模新一代測(cè)序之前進(jìn)行的小規(guī)模測(cè)序。 因此,與現(xiàn)有技術(shù)的方法相反,本發(fā)明的這種變體的特征在于對(duì)參照組的每個(gè)樣品先后進(jìn) 行兩個(gè)測(cè)序步驟。因此,"預(yù)測(cè)序"也可稱為"第一測(cè)序"。類似地,"大規(guī)模平行測(cè)序"可稱 為"第二測(cè)序"。
[0231] 本發(fā)明人假定小序列文庫(kù)內(nèi)唯一精確序列的比例將代表通過(guò)新一代測(cè)序獲得的 全規(guī)模文庫(kù)中唯一精確序列的比例。因此,通過(guò)在早期階段進(jìn)行DNA樣品的小規(guī)模測(cè)序,可 在早期去除唯一精確序列數(shù)不足的樣品。這個(gè)預(yù)測(cè)序步驟比隨后進(jìn)行的大規(guī)模平行測(cè)序所 消耗的時(shí)間和成本都要小得多。因此,本發(fā)明使得能夠節(jié)約