專利名稱::用于基于溶液的序列富集和基因組區(qū)域分析的方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
:本申請(qǐng)涉及核酸序列的富集和分析領(lǐng)域,其方法為將所述序列捕獲到固體載體上。更確切地說(shuō),本發(fā)明提供了一種捕獲特定基因組區(qū)域用于隨后進(jìn)一步分析的新方法,如果該目標(biāo)區(qū)域太大而不能僅通過(guò)一個(gè)或幾個(gè)PCR反應(yīng)擴(kuò)增。具體來(lái)說(shuō),本發(fā)明提供了以基于溶液的形式的目標(biāo)序列富集。
背景技術(shù):
:核酸微陣列技術(shù),例如DNA微陣列技術(shù)的出現(xiàn),使在很小區(qū)域例如在顯微鏡載玻片上生成數(shù)百萬(wàn)核酸序列例如DNA序列的陣列成為可能(例如美國(guó)專利6,375,903和5,143,854)。最初,通過(guò)將預(yù)先合成的DNA序列點(diǎn)樣在載玻片上建立此類陣列。然而,如美國(guó)專利6,375,903所述的無(wú)掩膜陣列合成器(MAS)構(gòu)建如今可直接在載玻片上自身原位合成寡核苷酸序列,其中光用于導(dǎo)向DNA序列合成,使用數(shù)字微鏡裝置(DMD)進(jìn)行光導(dǎo)向。使用MAS設(shè)備,將在微陣列上構(gòu)建的寡核苷酸序列或DNA序列的選擇由軟件控制,因此如今有可能根據(jù)研究者的特定需要建立個(gè)別定制的陣列。一般來(lái)說(shuō),基于MAS的寡核苷酸或DNA微陣列合成技術(shù)可在標(biāo)準(zhǔn)顯微鏡載玻片的很小區(qū)域并行合成數(shù)百萬(wàn)獨(dú)特的寡核苷酸特征。微陣列合成通常使用光導(dǎo)向在陣列的特定點(diǎn)位合成的寡核苷酸,這些點(diǎn)位稱為特征。有數(shù)百種生物的全基因組可供利用,其參考序列一般存放于公共數(shù)據(jù)庫(kù),微陣列已用于進(jìn)行大量生物中提取的核酸或DNA的序列分析。核酸或DNA微陣列技術(shù)已應(yīng)用于研究和診斷的很多領(lǐng)域,例如基因表達(dá)和開發(fā)、突變檢測(cè)、等位基因和進(jìn)化序列比較、基因組作圖、藥物開發(fā)、以及更多。很多應(yīng)用需要搜索引起人類疾病的涉及整個(gè)人類基因組的遺傳變異和突變。對(duì)于復(fù)雜疾病,這些搜索通常得出與疾病和/或疾病風(fēng)險(xiǎn)關(guān)聯(lián)的單核苷酸多態(tài)性(SNP)或SNP組。已證實(shí)鑒定此類SNP是艱苦且經(jīng)常無(wú)結(jié)果的任務(wù),因?yàn)樾枰贉y(cè)序來(lái)自感染個(gè)體或組織樣品的大區(qū)域基因組DNA,其通常大于100千堿基對(duì)(Kb),以尋找單個(gè)堿基改變或鑒定所有序列變異。其它應(yīng)用涉及鑒定染色體序列的增減,所述序列也可與癌癥關(guān)聯(lián),例如淋巴癌(Martinez-ClimentJA等人,2003,Blood101:3109-3117)、胃癌(WeissMM等人,2004,Cell.Oncol.26:307_317)、乳腺癌(CallagyG等人,2005,J.Path.205:388_396)、和前列腺癌(Paris,PL等人,2004,Hum.Mol.Gen.131303-1313)。因此,微陣列技術(shù)對(duì)科學(xué)研究者和臨床醫(yī)生在其對(duì)疾病和治療疾病中治療方案效果的理解方面是極其有用的工具?;蚪M典型地過(guò)于復(fù)雜而不能整體研究,必須使用技術(shù)降低基因組的復(fù)雜度。為解決此問(wèn)題,一種方案為從基因組核酸或DNA樣品中減少某種類型的大量序列,見(jiàn)于美國(guó)專利6,013,440。用于富集基因組序列的替代使用的方法和組合物描述于,例如Albert等人(2007,Nat.Meth.,4903-5),Okou等人(2007,Nat.Meth.4:907_9),OlsonM.(2007,Nat.Meth.4:891_892),Hodges等人(2007,Nat.Genet.391522-1527),以及見(jiàn)于美國(guó)專利申請(qǐng)11/638,004、11/970,949、和61/032,594。Albert等人公開了一種既經(jīng)濟(jì)又快速的替代方案,其以用戶指定的方式有效降低基因組樣品的復(fù)雜度,以用于進(jìn)一步處理和分析。Lovett等人(1991,Proc.Natl.Acad.Sci.88:9628_9632)也描述了使用細(xì)菌人工染色體進(jìn)行基因組選擇的方法。然而,現(xiàn)有方法受限于,例如,其易用性以及材料和方法的不靈活。微陣列技術(shù)的現(xiàn)有技術(shù),即富集技術(shù)或其它,典型地為具有內(nèi)在可變性的基質(zhì)相關(guān)技術(shù),例如微陣列載玻片、芯片等等??勺冃钥沙尸F(xiàn)多種形式,例如背景、探針/雜交動(dòng)力學(xué)、玻璃來(lái)源等等的變化性??勺冃栽趯?shí)驗(yàn)分析中起重要作用,可使實(shí)驗(yàn)成功或失敗。因此,需要方法、系統(tǒng)、和組合物以不同于典型的基質(zhì)類型微陣列方式的方式提供目標(biāo)序列的富集。新微陣列方式的出現(xiàn)將為研究者和臨床醫(yī)生提高其對(duì)疾病和疾病狀態(tài)的知識(shí)提供另外的工具。
發(fā)明內(nèi)容本發(fā)明提供了用于捕獲和富集目標(biāo)核酸以及分析所富集目標(biāo)核酸的方法和系統(tǒng)。具體來(lái)說(shuō),本發(fā)明提供了以基于溶液的方式的目標(biāo)序列富集。本發(fā)明的方法和系統(tǒng)用于幫助研究者和臨床醫(yī)生鑒別、研究和跟進(jìn)與疾病和疾病狀態(tài)關(guān)聯(lián)的治療方案。本發(fā)明總結(jié)為一種創(chuàng)新方法,其用于降低大核酸樣品,例如基因組樣品、cDNA文庫(kù)、或者mRNA或mRNA文庫(kù)的復(fù)雜度,以促進(jìn)進(jìn)一步處理和遺傳分析。本發(fā)明的實(shí)施方案包含(預(yù)選的)固定或非固定核酸探針,從例如基因組樣品中,通過(guò)所述樣品與探針、或源自探針的擴(kuò)增子在固體載體或在溶液中雜交以捕獲目標(biāo)核酸。所捕獲的目標(biāo)核酸優(yōu)選地洗滌并洗脫所述探針。所洗脫的基因組序列比未經(jīng)本文所述方法處理的樣品更適于詳細(xì)的遺傳分析。本發(fā)明提供了用于捕獲和富集目標(biāo)核酸以及分析所富集目標(biāo)核酸的方法和系統(tǒng)。在某些實(shí)施方案中,本發(fā)明提供了以基于溶液的方式的目標(biāo)序列富集。在某些實(shí)施方案中,本發(fā)明提供了用于基于溶液的目標(biāo)核酸捕獲和富集(例如基因組DNA、RNA、cDNA、mRNA等等)的方法和系統(tǒng)。所公開的方法提供了用于降低基因組樣品復(fù)雜度的經(jīng)濟(jì)、靈活、并有效的方法?;蚪M樣品在本文中用于說(shuō)明目的,但是應(yīng)了解其它非基因組樣品,還有大的非基因組樣品可用于相同方法。本文所述的方法和系統(tǒng)提供了以基于溶液的方法的目標(biāo)序列富集,因此提供了基于微陣列基質(zhì)的方法的替代方法,用于與疾病和疾病狀態(tài)關(guān)聯(lián)的研究和治療,列舉一些,例如癌癥(Durkin等人,2008,Proc.Natl.Acad.Sci.105:246_251;Natrajan等人,2007,Genes,Chr.AndCancer46:607_615;Kim等人,2006,Cell1251269-1281;Stallings等人,2006Can.Res.66:3673_3680)、遺傳病癥(Balciuniene等人,Am.J.Hum.Genet.在出版中)、精神疾病(Walsh等人,2008,Science320:539_543;Roohi等人,2008,J.Med.Genet.Epub18March2008;Sharp等人,2008,Nat.Genet.40:322_328;Kumar等人,2008,Hum.Mol.Genet.17628-638;)、以及進(jìn)化和基礎(chǔ)研究(Lee等人,2008,Hum.Mol.Gen.171127-1136Jones等人,2007,BMCGenomics8402;Egan等人,2007,Nat.Genet.391384-1389;Levy等人,2007,PLoSBiol.5:e254;Ballif等人,2007,Nat.Genet.391071-1073;Scherer等人,2007,Nat.Genet.S7-S15;Feuk等人,2006,Nat.Rev.Genet.7:85_97)。在一實(shí)施方案中,本發(fā)明提供了用于降低一組核酸分子的遺傳復(fù)雜度的方法,所述方法包含下列步驟在雜交條件下將所述片段化變性核酸分子組接觸多種不同的寡核苷酸探針,然后將所述雜交分子復(fù)合物結(jié)合到固體載體以捕獲與所述探針特異性雜交的核酸分子,其中所述片段化變性核酸分子平均大小約100到約1000個(gè)核苷酸殘基,優(yōu)選地約250到約800個(gè)核苷酸殘基,最優(yōu)選地約400到約600個(gè)核苷酸殘基,從所捕獲分子中分離未結(jié)合和非特異性雜交的核酸,洗脫所捕獲分子,以及可選地用所洗脫的捕獲分子將上述過(guò)程至少再重復(fù)一輪。在本發(fā)明的另一實(shí)施方案中,基于溶液的捕獲方法包含源自探針的擴(kuò)增子,其中所述用于擴(kuò)增的探針固定于固體載體。所述固體載體包含載體固定的核酸探針以從例如基因組樣品中捕獲特定的核酸序列(例如目標(biāo)核酸)。探針擴(kuò)增提供了在溶液中的探針擴(kuò)增子,其與目標(biāo)序列雜交。探針擴(kuò)增子與目標(biāo)序列雜交之后,所述樣品中的目標(biāo)核酸序列通過(guò)捕獲(例如,通過(guò)連接化合物,例如生物素、地高辛等等)和洗滌所述探針以及從所捕獲探針洗脫所雜交的目標(biāo)核酸進(jìn)行富集(圖6)。所述目標(biāo)核酸序列可進(jìn)一步擴(kuò)增,其使用例如非特異性連接介導(dǎo)的PCR(LM-PCR),得到與初始目標(biāo)樣品相比復(fù)雜度降低的PCR產(chǎn)物擴(kuò)增庫(kù)。在某些實(shí)施方案中,所述探針與目標(biāo)核酸之間的雜交在優(yōu)選地嚴(yán)格條件下進(jìn)行,所述嚴(yán)格條件足以支持所述基于溶液的探針擴(kuò)增子之間的雜交,其中所述探針包含連接化合物和所述目標(biāo)核酸樣品的互補(bǔ)區(qū)域,以提供探針/目標(biāo)雜交復(fù)合物。所述復(fù)合物隨后通過(guò)所述連接化合物捕獲,并在足以去除非特應(yīng)性結(jié)合核酸的條件下洗滌,然后所雜交的目標(biāo)核酸序列從所捕獲的探針/目標(biāo)復(fù)合物中洗脫。在某些實(shí)施方案中,所述多種不同的寡核苷酸探針包含化學(xué)基團(tuán)或連接化合物,例如結(jié)合部分例如生物素、地高辛等等,其能結(jié)合于固體載體。用于結(jié)合的固體載體包含相應(yīng)的捕獲化合物,例如用于生物素的鏈霉親和素和用于地高辛的抗地高辛抗體。本領(lǐng)域的技術(shù)人員將認(rèn)識(shí)到本發(fā)明不限于所使用的連接化合物,并且替代的連接化合物等同適用于本發(fā)明的方法和系統(tǒng)。在本發(fā)明的實(shí)施方案中,所述組或多種目標(biāo)核酸分子優(yōu)選地包含一種生物的全基因組或至少一條染色體或至少一種分子量至少約IOOkb的核酸分子。具體來(lái)說(shuō),所述核酸分子的大小至少約200kb、至少約500kb、至少約1Mb、至少約2Mb、或至少約5Mb,尤其是大小在約IOOkb到約5Mb之間、在約200kb到約5Mb之間、在約500kb到約5Mb之間、在約1Mb到約2Mb之間或在約2Mb到約5Mb之間。在某些實(shí)施方案中,所述目標(biāo)核酸分子選自動(dòng)物、植物或微生物,在優(yōu)選的實(shí)施方案中,所述生物為人。如果只有少量核酸(例如人類基因組)樣品可供利用,在實(shí)踐本發(fā)明的方法之前可擴(kuò)增所述核酸,例如通過(guò)全基因組擴(kuò)增。為進(jìn)行所述創(chuàng)新方法,預(yù)先擴(kuò)增可能是必須的,例如,用于法醫(yī)目的(例如,在法醫(yī)學(xué)中用于遺傳特征目的)。在某些實(shí)施方案中,所述組或多種目標(biāo)核酸分子為一組基因組DNA分子。所述探針可選自例如限定來(lái)自多個(gè)遺傳基因座的多種外顯子、內(nèi)含子、或調(diào)控序列的多種探針或序列;限定至少一個(gè)單獨(dú)遺傳基因座的全序列的多種探針,所述基因座大小至少lOOkb,優(yōu)選至少1Mb,或至少上述特定大小之一;限定單核苷酸多態(tài)性(SNPs)的多種探針;或限定一種陣列的多種探針,例如設(shè)計(jì)為捕獲至少一條完整染色體的全序列的嵌合陣列。在某些實(shí)施方案中,所述固體載體或者為核酸微陣列或者為一組珠子。在某些實(shí)施方案中,本發(fā)明包含在片段化核酸樣品與雜交探針接觸之前或之后,將接頭分子連接到所述核酸分子的一端或兩端,優(yōu)選地為兩端的步驟。在某些實(shí)施方案中,本發(fā)明的方法進(jìn)一步包含用至少一種引物擴(kuò)增所述目標(biāo)核酸分子,所述引物包含與所述接頭分子序列特異性雜交的序列。在某些實(shí)施方案中,所擴(kuò)增的目標(biāo)核酸序列可進(jìn)行測(cè)序,與再測(cè)序或SNP判讀(calling)陣列雜交,且所述序列或基因型可進(jìn)一步分析。在某些實(shí)施方案中,本發(fā)明提供了一種富集方法,其用于基因組樣品中的目標(biāo)核酸序列,例如外顯子或變體,優(yōu)選地為SNP位點(diǎn)。這可通過(guò)設(shè)計(jì)將在微陣列上合成的基因組的一個(gè)區(qū)域特異性的基因組探針實(shí)現(xiàn),或者合成所述基因組的一個(gè)區(qū)域特異性的基因組探針,以捕獲復(fù)雜基因組樣品中包含的互補(bǔ)目標(biāo)核酸序列實(shí)現(xiàn)。在某些實(shí)施方案中,本發(fā)明致力于提供一種方法,其用于尤其在樣品中確定核酸至少一個(gè)區(qū)域的核酸序列信息,特別是基因組核酸,例如全基因組或至少一條染色體,例如其大小如上所述,所述方法包含實(shí)現(xiàn)上述方法和確定所捕獲(以及洗脫)分子核酸序列的步驟,特別是通過(guò)合成反應(yīng)進(jìn)行測(cè)序的方法確定。在某些實(shí)施方案中,本發(fā)明致力于提供一種方法,其用于檢測(cè)相對(duì)于參考基因組的編碼區(qū)變異,特別是相對(duì)于包含片段化變性基因組核酸分子的參考基因組,如上所述的方法進(jìn)一步包含確定所捕獲(以及洗脫)的目標(biāo)分子核酸序列,特別是通過(guò)經(jīng)合成反應(yīng)進(jìn)行測(cè)序的方法所確定,以及將所確定序列與數(shù)據(jù)庫(kù)中序列比較,特別是與所述參考基因組多態(tài)性數(shù)據(jù)庫(kù)中序列比較,以從所述參考基因組中鑒別出變體。在某些實(shí)施方案中,本發(fā)明致力于提供一種試劑盒,其包含用于實(shí)現(xiàn)本發(fā)明方法的固體載體和試劑。所述試劑盒可包含雙鏈接頭分子,和具有多種不同寡核苷酸探針的固體載體,其中所述探針選自限定來(lái)自多個(gè)遺傳基因座的多種外顯子、內(nèi)含子、或調(diào)控序列的多種探針;限定至少一個(gè)單獨(dú)遺傳基因座的全序列的多種探針,所述基因座大小至少lOOkb,優(yōu)選至少1Mb,或至少上述特定大小之一;限定已知包含SNPs的位點(diǎn)的多種探針;或限定設(shè)計(jì)為捕獲至少一條完整染色體的全序列的嵌合陣列的多種探針。優(yōu)選地,所述試劑盒包含兩種不同的雙鏈接頭分子(A和B)。所述固體載體也為多種珠子或者為微陣列。所述試劑盒可進(jìn)一步包含至少一種或多種其它成分,其選自DNA聚合酶、T4多核苷酸激酶、T4DNA連接酶、陣列雜交液和陣列洗滌液,和/或陣列洗脫液。在其它實(shí)施方案中,本發(fā)明致力于提供一種試劑盒,其包含用于實(shí)現(xiàn)本發(fā)明方法的組合物和試劑。所述試劑盒可包含,但不限于,雙鏈接頭分子、多種不同的寡核苷酸探針、用于捕獲所述探針的固體載體,其中所述探針選自限定來(lái)自多個(gè)遺傳基因座的多種外顯子、內(nèi)含子、或調(diào)控序列的多種序列;限定至少一個(gè)單獨(dú)遺傳基因座的全序列的多種探針,所述位點(diǎn)大小至少lOOkb,優(yōu)選至少1Mb,或至少上述特定大小之一;限定已知包含SNPs的位點(diǎn)的多種探針;或限定設(shè)計(jì)為捕獲至少一條完整染色體的全序列的嵌合陣列的多種探針。在某些實(shí)施方案中,試劑盒包含多種珠子或微陣列基質(zhì)(例如載玻片、芯片等等)。在某些實(shí)施方案中,試劑盒包含兩種不同雙鏈接頭分子。試劑盒可進(jìn)一步包含至少一種或多種其它成分,其選自DNA聚合酶、T4多核苷酸激酶、T4DNA連接酶、雜交液、洗滌液,和/或洗脫液。在本發(fā)明的實(shí)施方案中,核酸(預(yù)選的)捕獲探針使用多種公認(rèn)方法(例如點(diǎn)樣、光刻、原位合成等等)固定于固體載體(例如載玻片、芯片、珠子等等)上。在優(yōu)選的實(shí)施方案中,所述探針通過(guò)無(wú)掩膜陣列合成在基質(zhì)上原位合成,然后通過(guò)例如PCR擴(kuò)增產(chǎn)生在溶液中的源自探針的擴(kuò)增子。在某些實(shí)施方案中,所合成的探針序列包含引物結(jié)合位點(diǎn),用于在所述探針的3’和5’端(例如,位于或接近末端)之一或兩者擴(kuò)增。在某些實(shí)施方案中,所述探針上的引物結(jié)合位點(diǎn)的序列在3’與5’引物末端或所述探針是相同的,然而在其它實(shí)施方案中,所述引物結(jié)合位點(diǎn)的序列在3’引物末端與5’引物末端序列不同。在某些實(shí)施方案中,用于探針擴(kuò)增的擴(kuò)增引物進(jìn)一步包含限制性內(nèi)切酶位點(diǎn),例如MlyI位點(diǎn),其用于從最終捕獲目標(biāo)容易去除引物序列,其中所述引物之一(例如正向或反向引物)進(jìn)一步包含連接化合物,例如結(jié)合部分或序列(例如生物素、地高辛、HIS標(biāo)簽等等),并與所述固定探針及指數(shù)PCR擴(kuò)增(例如本領(lǐng)域技術(shù)人員已知的用于目標(biāo)指數(shù)擴(kuò)增的PCR程序)必需的試劑共同置于所述載體上。進(jìn)行PCR以產(chǎn)生探針捕獲序列的擴(kuò)增子,因此其中一鏈包含連接化合物,例如結(jié)合部分或序列。所述包含擴(kuò)增子的溶液轉(zhuǎn)移到容器(例如試管、96孔板的孔)中,并且,在某些實(shí)施方案中,從反應(yīng)成分中純化。使用不對(duì)稱PCR對(duì)所述源自探針的擴(kuò)增子優(yōu)先進(jìn)行另一輪擴(kuò)增,其中連接化合物標(biāo)記的引物與非標(biāo)記引物相比過(guò)量,以優(yōu)選地合成單鏈結(jié)合部分/序列標(biāo)記的擴(kuò)增子。所述擴(kuò)增子從反應(yīng)成分中純化出來(lái)并轉(zhuǎn)移到容器中,加入變性核酸樣品,進(jìn)行雜交。雜交之后,標(biāo)記的擴(kuò)增子/目標(biāo)核酸復(fù)合物被捕獲。例如,當(dāng)生物素為結(jié)合部分時(shí),鏈霉親和素(SA)包被的基質(zhì),例如SA包被的珠子(例如磁珠/顆粒)用于捕獲所述生物素標(biāo)記的擴(kuò)增子/目標(biāo)復(fù)合物。洗滌所述SA結(jié)合的復(fù)合物,所雜交的目標(biāo)核酸從所述復(fù)合物洗脫并用于下游應(yīng)用,例如測(cè)序應(yīng)用。在某些實(shí)施方案中,本發(fā)明提供了一種用于分離和降低多種核酸序列復(fù)雜度的方法,其包含提供固體載體,其中所述固體載體包含可與目標(biāo)核酸序列雜交的雜交探針;并提供包含目標(biāo)核酸序列的片段化核酸樣品;擴(kuò)增所述雜交探針,其中擴(kuò)增產(chǎn)物包含結(jié)合部分,且其中擴(kuò)增產(chǎn)物在溶液中;在允許所述擴(kuò)增產(chǎn)物與目標(biāo)核酸序列雜交的條件下使所述核酸樣品與溶液中的所述擴(kuò)增產(chǎn)物雜交;通過(guò)所述結(jié)合部分從非特異性雜交核酸中分離所雜交的目標(biāo)核酸序列/擴(kuò)增產(chǎn)物復(fù)合物;以及從所述復(fù)合物洗脫所雜交的目標(biāo)核酸序列,由此分離和降低多種核酸序列的復(fù)雜度。在某些實(shí)施方案中,所洗脫的目標(biāo)核酸序列被測(cè)序。在某些實(shí)施方案中,所述固體載體為微陣列載玻片。在某些實(shí)施方案中,所述目標(biāo)核酸樣品為片段化基因組DNA,在所述片段一端或兩端具有或不具有接頭分子。在某些實(shí)施方案中,所述雜交探針包含限制性內(nèi)切酶位點(diǎn),例如MlyI位點(diǎn)。在某些實(shí)施方案中,探針擴(kuò)增包含指數(shù)聚合酶鏈反應(yīng),并可進(jìn)一步包含非對(duì)稱非指數(shù)擴(kuò)增。在某些實(shí)施方案中,所述結(jié)合部分為生物素,且所述捕獲基質(zhì),例如珠子,例如順磁顆粒,用鏈霉親和素包被,用于從非特異性雜交目標(biāo)核酸中分離所述目標(biāo)核酸/擴(kuò)增產(chǎn)物復(fù)合物。在某些實(shí)施方案中,在洗脫結(jié)合的目標(biāo)核酸之前洗滌所捕獲的目標(biāo)核酸/擴(kuò)增產(chǎn)物復(fù)合物。在某些實(shí)施方案中,本發(fā)明提供了一種試劑盒,其包含雜交探針序列,該序列包含結(jié)合部分和限制性酶切位點(diǎn),其中所述探針序列設(shè)計(jì)為與一種或多種目標(biāo)核酸序列雜交,并且其中所述探針序列在溶液中;一種包含用于結(jié)合所述結(jié)合部分的結(jié)合伴侶的基質(zhì);以及用于實(shí)現(xiàn)本發(fā)明方法的說(shuō)明。在某些實(shí)施方案中,試劑盒進(jìn)一步包含一種或多種溶液,例如雜交、洗滌、和洗脫液。在某些實(shí)施方案中,試劑盒包含磁體。在某些實(shí)施方案中,試劑盒包含一種或多種酶,以及相應(yīng)的試劑、緩沖液等等,例如限制性內(nèi)切酶,例如Mlyl,以及用于使用MlyI進(jìn)行限制性酶切反應(yīng)的緩沖液/試劑。從下面的說(shuō)明與附圖相結(jié)合,本發(fā)明的其它目的、優(yōu)點(diǎn)和特征將變得顯而易見(jiàn)。圖1為使用微陣列的直接基因組選擇過(guò)程流程圖的概括圖解。圖2為使用微陣列的直接基因組選擇過(guò)程流程圖的另一種圖解。圖3(a_b)顯示了根據(jù)實(shí)施例2使用微陣列的直接基因組選擇過(guò)程的結(jié)果。(a)來(lái)自3個(gè)微陣列基因組選擇重復(fù)的染色體16的190Kb序列讀圖詳情,顯示靶向測(cè)序的可重復(fù)性?;蚪MDNA來(lái)自純化并片段化的Burkett淋巴瘤細(xì)胞系。腫瘤測(cè)序程序外顯子(大小500bp的6726基因組區(qū)域),使用NimbleGen寡核苷酸微陣列捕獲并使用454測(cè)序儀測(cè)序。(1)染色體位置,(2,3,4)來(lái)自3個(gè)獨(dú)立微陣列選擇和測(cè)序?qū)嶒?yàn)的454讀數(shù)的最高BLAST分?jǐn)?shù)的讀圖,(5)微陣列探針靶向的區(qū)域。(b)來(lái)自包含BRCAl基因的2Mb相鄰區(qū)域的微陣列選擇的染色體17的2000堿基的序列讀圖詳情。(1)染色體位置,(2)微陣列選擇探針。探針沿y軸每IOpb進(jìn)行間隔并錯(cuò)開。(3)每堿基倍數(shù)序列范圍。范圍從0到100倍。(4)454測(cè)序讀數(shù)的最高blast分?jǐn)?shù)的讀圖。圖4(a_c)顯示了在微陣列上合成探針、從微陣列上釋放探針、以及將探針固定于載體用于捕獲目標(biāo)多核苷酸的方法的結(jié)果。(a)實(shí)施例2公開的‘外顯子’和‘基因座’選擇和測(cè)序的范圍深度比較。圖表顯示一次454FLX運(yùn)行后每個(gè)聚集目標(biāo)區(qū)域的堿基部分以及對(duì)應(yīng)的序列范圍累積深度?!怙@子’樣品代表6,726外顯子分級(jí)區(qū)域。2MbBRCAl區(qū)域從人類染色體17上的位置37,490,417到39,490,417獲取目標(biāo)。通過(guò)選擇探針僅靶向唯一的部分。(b)實(shí)施例2公開的外顯子exuer0,emt的每堿基序列范圍深度的直方圖。(c)根據(jù)實(shí)施例3的2Mb基因座示例的每堿基范圍深度的直方圖。圖5顯示了來(lái)自3個(gè)基因組樣品的染色體16上的一個(gè)基因座的讀圖詳情。通過(guò)溶液中捕獲的6726外顯子的靶向測(cè)序獲得數(shù)據(jù)。使用實(shí)施例4所述的操作程序從微陣列切除并擴(kuò)增捕獲寡核苷酸。呈現(xiàn)的數(shù)據(jù)代表來(lái)自染色體3的示例基因圖。(1)染色體位置,(2)來(lái)自一次454-FLX測(cè)序運(yùn)行的測(cè)序讀圖,以及(3)靶向區(qū)域。溶液相捕獲數(shù)據(jù)分析顯示83.8%的讀圖退回目標(biāo)區(qū)域,顯示與基于陣列的捕獲操作程序相似的表現(xiàn)。圖6說(shuō)明了本發(fā)明的一種實(shí)施方案;富集過(guò)程的概括流程圖,其中所述富集方法用于分離并富集水溶液中的多種核酸序列。附著于微陣列基質(zhì)的雜交探針原位擴(kuò)增以產(chǎn)生溶液中的源自探針的擴(kuò)增子,其擴(kuò)增子包含結(jié)合部分。片段化核酸(例如檢測(cè)部分標(biāo)記的)在溶液中與標(biāo)記的探針擴(kuò)增子雜交,復(fù)合物隨后被捕獲(例如通過(guò)順磁捕獲顆粒)。洗滌所捕獲并固定的雜交復(fù)合物,并從結(jié)合的固定探針擴(kuò)增子中洗脫特異性結(jié)合的目標(biāo)。所洗脫的(例如分離并富集的)目標(biāo)序列應(yīng)用于下游應(yīng)用,例如測(cè)序。圖7證實(shí)了使用本發(fā)明的溶液捕獲方法的再測(cè)序一致性。再測(cè)序分析由靶向捕獲區(qū)域的子集組成。X軸表示來(lái)自更大目標(biāo)區(qū)域的一組任意區(qū)域,其代表靶向捕獲區(qū)域的整體。y軸表示與已知目標(biāo)序列的測(cè)序一致性百分比。定義當(dāng)用于本文時(shí),術(shù)語(yǔ)“樣品”以其最廣泛的意思使用。在一種意思中,其意在包括從任何來(lái)源,優(yōu)選地從生物來(lái)源獲得的樣本或培養(yǎng)物。生物樣品可從動(dòng)物(包括人)獲得,并包括液體、固體、組織和氣體。生物樣品包括血液制品,例如血漿、血清等等。因此,“核酸的樣品”或“核酸樣品”、“目標(biāo)樣品”包含任何來(lái)源的核酸(例如DNA、RNA、cDNA、mRNA、tRNA、miRNA等等)。在本申請(qǐng)中,核酸樣品優(yōu)選源自生物來(lái)源,例如人或非人細(xì)胞、組織等等。術(shù)語(yǔ)“非人”系指所有非人動(dòng)物和實(shí)體,包括但不限于,脊椎動(dòng)物例如嚙齒動(dòng)物、非人靈長(zhǎng)動(dòng)物、綿羊、牛、反芻動(dòng)物、兔類動(dòng)物、豬、山羊、馬、犬、貓、鳥類等等。非人還包括無(wú)脊椎動(dòng)物和原核生物,例如細(xì)菌、植物、酵母、病毒等等。因此,用于本發(fā)明的方法和系統(tǒng)的核酸樣品為源自任何生物,無(wú)論真核或者原核的核酸樣品。當(dāng)用于本文時(shí),術(shù)語(yǔ)“雜交”系指互補(bǔ)核酸的配對(duì)。雜交和雜交強(qiáng)度(例如核酸之間結(jié)合的強(qiáng)度)受如下因素影響核酸之間互補(bǔ)的程度、涉及條件的嚴(yán)格程度、所形成雜交體的解鏈溫度(Tm)、以及核酸的GC比值。雖然本發(fā)明不受限于特定的雜交條件,但優(yōu)選使用嚴(yán)格的雜交條件。嚴(yán)格的雜交條件取決于序列并因變化的環(huán)境參數(shù)(例如鹽濃度、有機(jī)物存在等等)而不同。通常,“嚴(yán)格的”條件選擇為在規(guī)定的離子強(qiáng)度和PH下低于特定核酸序列的Tm約5°C到約20°C。優(yōu)選地,嚴(yán)格的條件為低于結(jié)合互補(bǔ)核酸的特定核酸的溫度熔點(diǎn)約5°C到10°C。所述1為50%核酸(例如目標(biāo)核酸)與完全配對(duì)探針雜交的溫度(在規(guī)定的離子強(qiáng)度和PH下)。“嚴(yán)格的條件”或“高度嚴(yán)格的條件”,例如,可為50%甲酰胺,5xSSC(0.75MNaCl,0.075M檸檬酸鈉),50mM磷酸鈉(pH6.8),0.焦磷酸鈉,5xDenhardt‘s溶液、超聲波處理的鮭魚精子DNA(50mg/ml),0.1%SDS,以及10%硫酸葡聚糖在42°C下雜交,在42°C以0.2xSSC(氯化鈉/檸檬酸鈉)和在55°C以50%甲酰胺洗滌,然后在55°C以含有EDTA的0.IxSSC洗滌。舉例來(lái)說(shuō),但不限于,預(yù)期包含35%甲酰胺、5xSSC、和0.1%(w/v)十二烷基硫酸鈉(SDS)的緩沖液適合在適度非嚴(yán)格條件下在45°C雜交16-72小時(shí)。此外,預(yù)期甲酰胺濃度可根據(jù)探針長(zhǎng)度和所需嚴(yán)格程度在20-45%范圍內(nèi)適當(dāng)調(diào)節(jié)。雜交條件的其它實(shí)例見(jiàn)于多種來(lái)源,包括MolecularCloning=ALaboratoryManual,Sambrook等人編輯,ColdSpringHarbourPress(通過(guò)引用將其全部?jī)?nèi)容結(jié)合到本文中)。相似地,用于目標(biāo)與探針雜交,或在本發(fā)明中,源自探針的擴(kuò)增子的雜交的“嚴(yán)格的”洗滌條件通常根據(jù)經(jīng)驗(yàn)確定,。擴(kuò)增子/目標(biāo)雜交(例如在嚴(yán)格的雜交條件下),然后用包含連續(xù)降低濃度的鹽、或增高濃度的洗滌劑的緩沖液洗滌,或者在增加的溫度下洗滌直至特異性與非特異性雜交的信噪比足夠高以促進(jìn)特異性雜交的檢測(cè)。嚴(yán)格的溫度條件通常包括溫度超過(guò)約30°C,更通常地超過(guò)約37°C,并有時(shí)候超過(guò)約45°C。嚴(yán)格的鹽條件一般低于約IOOOmM,通常低于約500mM,更通常地低于約150mM(WeTmur等人,1966,J.Mol.Biol.,31349-370;WeTmur,1991,CriticalReviewsinBiochemistryandMolecularBiology,26:227-259,通過(guò)引用將其全部?jī)?nèi)容結(jié)合到本文中)。當(dāng)用于本文時(shí),術(shù)語(yǔ)“引物”系指寡核苷酸,無(wú)論天然存在于純化的限制性消化物中或者由合成生產(chǎn),當(dāng)置于誘導(dǎo)與核酸鏈互補(bǔ)的引物延伸產(chǎn)物的合成的條件下(例如在核苷酸和誘導(dǎo)試劑例如DNA聚合酶存在下,并在合適的溫度和pH下),能夠作為合成的起點(diǎn)。所述引物優(yōu)選地為具有最大擴(kuò)增效率的單鏈。優(yōu)選地,所述引物為寡脫氧核苷酸。所述引物必須足夠長(zhǎng)以在所述誘導(dǎo)試劑存在下引發(fā)延伸產(chǎn)物的合成。所述引物的確切長(zhǎng)度取決于很多因素,包括溫度、弓I物來(lái)源和所使用方法。當(dāng)用于本文時(shí),術(shù)語(yǔ)“探針”系指寡核苷酸(例如核苷酸序列),無(wú)論天然存在于純化的限制性消化物中或者由合成、重組、或PCR擴(kuò)增生產(chǎn),能夠與另一目標(biāo)寡核苷酸例如目標(biāo)核酸序列的至少一部分雜交。探針可為單鏈或雙鏈。探針可用于特定基因序列的檢測(cè)、鑒別和分離。當(dāng)用于本文時(shí),術(shù)語(yǔ)“目標(biāo)核酸分子”和“目標(biāo)核酸序列,,可互換使用,系指來(lái)自所研究的目標(biāo)基因組區(qū)域的分子或序列。預(yù)選的探針確定了目標(biāo)核酸分子的范圍。因此,所述“目標(biāo)”試圖與其它核酸序列區(qū)分出來(lái)。一個(gè)“片段”定義為所述目標(biāo)序列中的一個(gè)核酸區(qū)域,如作為核酸序列的一個(gè)“片段”或一“部分”。當(dāng)用于本文時(shí),術(shù)語(yǔ)“分離”當(dāng)用于涉及核酸時(shí),如用于“分離核酸”時(shí),系指核酸序列從其天然來(lái)源通常結(jié)合的至少一種成分或污染物中被鑒別并分離出來(lái)。分離的核酸以不同于其天然發(fā)現(xiàn)的形式或背景存在。相反,未分離的核酸例如DNA和RNA的核酸以其天然存在的狀態(tài)發(fā)現(xiàn)。所述分離的核酸、寡核苷酸、或多核苷酸可以單鏈或雙鏈形式存在。詳細(xì)說(shuō)明本發(fā)明廣泛地涉及經(jīng)濟(jì)、靈活、且快速的方法,以用于降低核酸樣品復(fù)雜度以富集感興趣的目標(biāo)核酸并促進(jìn)進(jìn)一步處理和分析,例如測(cè)序、再測(cè)序和SNP判讀。所捕獲的目標(biāo)核酸序列,其為更確定的低復(fù)雜度的基因組群組,更適用于詳細(xì)的遺傳分析,例如疾病和疾病狀態(tài)(例如癌癥、遺傳突變、遺傳疾病等等)的遺傳分析。本發(fā)明提供的方法和系統(tǒng)用于,例如,搜索遺傳變體和突變,例如引起人類疾病的單核苷酸多態(tài)性(SNPs)、SNPs組、基因組插入、缺失等等。因此,本發(fā)明提供了用于在復(fù)雜核酸樣品中富集目標(biāo)核酸的方法。在一種實(shí)施方案中,本發(fā)明涉及一種降低一組核酸分子遺傳復(fù)雜度的方法,所述方法包含下列步驟在雜交條件下將所述片段化變性核酸分子組接觸結(jié)合于固體載體的多種不同的寡核苷酸探針以捕獲與所述探針特異性雜交的核酸分子,或者在雜交條件下將所述片段化變性核酸分子組接觸多種不同的寡核苷酸探針然后將所述雜交分子復(fù)合物結(jié)合到固體載體以捕獲與所述探針特異性雜交的核酸分子,其中所述片段化變性核酸分子平均大小約100到約1000個(gè)核苷酸殘基,優(yōu)選約250到約800個(gè)核苷酸殘基,最優(yōu)選約400到約600個(gè)核苷酸殘基;從所捕獲分子中分離未結(jié)合和非特異性雜交的核酸;從所述固體載體洗脫所捕獲分子,以及可選地用所洗脫的捕獲分子至少再重復(fù)一輪步驟(a)到(C)。在另一種實(shí)施方案中,本發(fā)明致力于提供一種試劑盒,其包含雙鏈接頭分子,和一種具有多種不同寡核苷酸探針的固體載體,其中所述探針選自限定來(lái)自多個(gè)遺傳基因座的多種外顯子、內(nèi)含子或調(diào)控序列的多種探針;限定至少一個(gè)單獨(dú)遺傳基因座的全序列的多種探針,所述基因座大小至少lOOkb,優(yōu)選至少1Mb,或至少上述特定大小之一;限定已知包含SNPs的位點(diǎn)的多種探針;或限定設(shè)計(jì)為捕獲至少一條完整染色體的全序列的嵌合陣列的多種探針。在一種實(shí)施方案中,一種樣品,其包含變性(即單鏈)核酸分子,優(yōu)選地為基因組核酸分子,所述核酸分子可為片段化分子,在雜交條件下接觸多種寡核苷酸探針,所述探針在雜交之前或之后固定于具有多種寡核苷酸探針的一種固體載體上,以從所述樣品中捕獲與所述固定的探針雜交的目標(biāo)核酸分子。所述基因組的未雜交區(qū)域或任何其它樣品核酸保留在溶液中。所述核酸典型地為脫氧核糖核酸或核糖核酸,并包括通過(guò)一種核酸分子類型(例如DNA、RNA和cDNA)轉(zhuǎn)化為另一種類型體外合成的產(chǎn)物,以及含有核苷酸類似物例如PNAs的合成分子。變性基因組DNA分子特別是源自基因組的分子,其比天然存在的基因組核酸分子短。本領(lǐng)域的技術(shù)人員可使用熟知的方法通過(guò)化學(xué)、物理、或酶裂解或剪切從較大分子制備隨機(jī)或非隨機(jī)大小的分子?;瘜W(xué)裂解可使用含鐵金屬(例如Fe-EDTA)。物理方法可包括超聲波處理、流體動(dòng)力或噴霧(參見(jiàn)歐洲專利申請(qǐng)EPO552290)。酶學(xué)方法可使用核酸酶,例如微球菌核酸酶(Mnase)或外切核酸酶(例如ExoI或Bal31)或限制性內(nèi)切酶。產(chǎn)生片段的方法不應(yīng)影響所述片段在所述方法中的使用。在富集中使用與所富集片段使用的富集后技術(shù)相當(dāng)?shù)拇笮》秶鷥?nèi)的片段可能是有利的。合適的片段大小范圍可為約100到約1000個(gè)核苷酸殘基或堿基對(duì),或約250到約800個(gè)核苷酸殘基或堿基對(duì),可為約400到約600個(gè)核苷酸殘基或堿基對(duì),特別是約500個(gè)核苷酸殘基或堿基對(duì)??墒褂脽o(wú)掩膜陣列合成技術(shù)在固體載體上并行提供序列中與所述基因組至少一個(gè)區(qū)域?qū)?yīng)的探針。替代性地,探針可使用標(biāo)準(zhǔn)DNA合成儀連續(xù)獲得并應(yīng)用到所述固體載體,或可從有機(jī)體獲得并固定于所述固體載體。雜交之后,未雜交或與所述探針?lè)翘禺愋噪s交的核酸通過(guò)洗滌從所述載體結(jié)合的探針中分離。剩余的核酸與所述探針特異性結(jié)合,在例如熱水中或在包含例如TRIS緩沖液和/或EDTA的核酸洗脫緩沖液中從所述固體載體洗脫,以產(chǎn)生所述目標(biāo)核酸分子富集的洗脫物。在某些實(shí)施方案中,在所述片段變性并與所述固定的探針雜交之前至少在所述(基因組)核酸分子一端提供了雙鏈連接物。在此類實(shí)施方案中,目標(biāo)核酸分子可在洗脫后擴(kuò)增,以產(chǎn)生比初始樣品復(fù)雜度降低的擴(kuò)增產(chǎn)物集合。可使用例如非特異性LM-PCR通過(guò)多輪熱循環(huán)擴(kuò)增所述目標(biāo)核酸分子??蛇x地,所述擴(kuò)增產(chǎn)物可通過(guò)對(duì)所述探針的第二次選擇進(jìn)一步富集。所述第二次選擇的產(chǎn)物可在使用前如上所述再次擴(kuò)增。此方法在圖1中以圖表并在圖2中以流程圖總結(jié)。所述連接物可根據(jù)所述復(fù)雜度降低步驟之后的下游分析應(yīng)用的需要以任意大小和任意核酸序列提供。所述連接物可在約12到約100堿基對(duì)范圍內(nèi),包括約18到100堿基對(duì)的范圍,優(yōu)選地約20到24堿基對(duì)的范圍。替代性地,用于目標(biāo)分子的核酸探針可如上所述在固體載體上合成,作為探針集合從所述固體載體釋放并擴(kuò)增。所述擴(kuò)增的釋放探針集合可共價(jià)或非共價(jià)固定于載體,例如玻璃、金屬、陶瓷、或聚合珠子或其它固體載體。所述探針可設(shè)計(jì)為從所述固體載體方便釋放,例如在最接近載體的探針末端或其附近提供酸或堿不穩(wěn)定的核酸序列,其分別在低或高PH條件下釋放所述探針。本領(lǐng)域已知多種可剪切的連接化合物。所述載體可以,例如,以具有液體進(jìn)口和出口的圓柱提供。本領(lǐng)域熟悉將核酸固定到載體的方法,例如通過(guò)將生物素標(biāo)記的核苷酸結(jié)合到所述探針中,并使用鏈霉親和素包被所述載體,由此所述包被的載體非共價(jià)吸引并固定所述集合中的所述探針。所述樣品在雜交條件下通過(guò)所述包含探針的載體,由此與所述固定載體雜交的目標(biāo)核酸分子可洗脫,用于之后的分析或其它用途。在一個(gè)方面,本發(fā)明通過(guò)直接基因組選擇能夠從復(fù)雜生物樣品中捕獲并富集目標(biāo)核酸分子或目標(biāo)基因組區(qū)域。本發(fā)明還可用于搜索遺傳變體和突變,例如引起人類疾病的單核苷酸多態(tài)性(SNPs)、或SNPs組。預(yù)期使用微陣列雜交技術(shù)的捕獲和富集比基因組富集領(lǐng)域目前可用的其它方法更靈活,目前的方法例如使用用于直接基因組選擇的BAC(細(xì)菌人工染色體)(參見(jiàn)Lovett等人,1991)。本發(fā)明允許使用本領(lǐng)域已知的靶向的基于陣列的、鳥槍、毛細(xì)管、或其它測(cè)序方法。通常,隨機(jī)生成片段的鳥槍測(cè)序策略經(jīng)濟(jì)并易于結(jié)合到規(guī)劃中,但是本發(fā)明只提交來(lái)自一個(gè)或多個(gè)目標(biāo)基因組區(qū)域的片段進(jìn)行測(cè)序,由此增強(qiáng)了所述鳥槍方法的效率。本發(fā)明提供了將所述測(cè)序策略聚焦到特定基因組區(qū)域,例如用于醫(yī)學(xué)測(cè)序目的的個(gè)體染色體或外顯子的能力。目標(biāo)核酸分子可以純化或非純化形式從包括任何來(lái)源核酸的一種或多種樣品中富集。所述來(lái)源不需包含有機(jī)體基因組核酸分子的全部補(bǔ)充物。所述樣品,優(yōu)選地來(lái)自生物來(lái)源,包括但不限于,來(lái)自個(gè)體病人、組織樣品、或細(xì)胞培養(yǎng)物的集合的分離物。當(dāng)用于本文時(shí),術(shù)語(yǔ)“目標(biāo)核酸分子”系指來(lái)自所研究的目標(biāo)基因組區(qū)域的分子。所述預(yù)選的探針確定目標(biāo)核酸分子的范圍。具有本公開的技術(shù)人員將了解可能目標(biāo)和關(guān)聯(lián)目標(biāo)的全部范圍。所述目標(biāo)區(qū)域可為幾百萬(wàn)堿基(Mb)的一個(gè)或多個(gè)連續(xù)區(qū)段,或幾個(gè)較小的相鄰或不相鄰區(qū)域,例如來(lái)自一條或多條染色體的全部外顯子,或已知包含SNPs的位點(diǎn)。例如,所述固體載體可支持嵌合陣列,其設(shè)計(jì)用于捕獲一條或多條完整染色體、一條或多條染色體的部分、所有外顯子、來(lái)自一條或多條完整染色體的所有外顯子、選擇的外顯子、一個(gè)或多個(gè)基因的內(nèi)含子和外顯子、基因調(diào)控區(qū)域等等。替代性地,為提高捕獲所需非獨(dú)特或難以捕獲的目標(biāo)富集的可能性,所述探針可針對(duì)與實(shí)際目標(biāo)序列相關(guān)(例如,在相同片段上,但區(qū)分開)的序列,在此情況下可捕獲并富集既包含所需目標(biāo)又包含關(guān)聯(lián)序列的基因組片段。所述相關(guān)序列可與所述目標(biāo)序列相鄰或間隔,但是技術(shù)人員將了解,所述兩部分相互越接近,基因組片段同時(shí)包含兩部分的可能性越大。另外,為進(jìn)一步降低脫靶分子交叉雜交的有限影響,由此增強(qiáng)所述富集的完整性,可使用不同但相關(guān)的針對(duì)目標(biāo)區(qū)域的捕獲探針組進(jìn)行隨后幾輪捕獲。相關(guān)的探針為對(duì)應(yīng)基因組中相互接近區(qū)域的探針,因此其可與相同的基因組DNA片段雜交。微陣列寡核苷酸設(shè)計(jì)為靶向所述基因組目標(biāo)區(qū)域。單個(gè)探針的長(zhǎng)度典型地在50到200個(gè)堿基之間。這些探針可設(shè)計(jì)為重疊探針,意為相鄰探針的起始核苷酸短于探針長(zhǎng)度,或者非重疊探針,其中相鄰探針之間的距離長(zhǎng)于探針長(zhǎng)度。相鄰探針之間的距離通常重疊,兩個(gè)探針的起始核苷酸之間間隔在1到100個(gè)堿基之間變化。所述距離可變化以使某些基因組區(qū)域比其它區(qū)域更能成為大量探針的靶點(diǎn)。所述變化可用于調(diào)整單個(gè)基因組區(qū)域的捕獲效率,標(biāo)準(zhǔn)化捕獲??蓽y(cè)試探針在所述基因組中的獨(dú)特性。為避免基因組成分與捕獲陣列的非特異性結(jié)合,應(yīng)使用一種新方法從選擇微陣列設(shè)計(jì)中排除所述基因組的高度重復(fù)成分,所述方法使用與Morgolis(2006)開發(fā)的WindowMasker程序相似的策略以鑒別這些區(qū)域并將其從探針選擇中排除。所述過(guò)程比較探針組與人類基因組中所有可能的15-聯(lián)體探針的預(yù)先計(jì)算的頻率直方圖。對(duì)每個(gè)探針,包含所述探針的15-聯(lián)體組的頻率用于計(jì)算所述探針的平均15-聯(lián)體頻率。平均15-聯(lián)體頻率越高,探針越有可能位于所述基因組的重復(fù)區(qū)域。只應(yīng)使用平均15-聯(lián)體頻率低于100的探針。所述探針的特性和表現(xiàn)可變化以有利地標(biāo)準(zhǔn)化或調(diào)節(jié)根據(jù)所述方法捕獲并富集的目標(biāo)分子的分布。所述標(biāo)準(zhǔn)化的目標(biāo)為每個(gè)讀取提供一種表達(dá)的基因(參見(jiàn)Soares,等人,1994)。標(biāo)準(zhǔn)化可以,例如,在文庫(kù)建立之前應(yīng)用于cDNA分子組,因?yàn)樗鼋M中分子的分布反映了產(chǎn)生所述cDNA分子組的表達(dá)基因的不同表達(dá)水平。例如,有效分析每個(gè)目標(biāo)區(qū)域所需的測(cè)序反應(yīng)數(shù)量可通過(guò)標(biāo)準(zhǔn)化所富集組中每個(gè)目標(biāo)序列的拷貝數(shù)而減少,因此基于適合度和其它探針屬性的組合可標(biāo)準(zhǔn)化遍及所述探針組中不同探針的捕獲表現(xiàn)。適合度,以“捕獲度量”為特征,可通過(guò)信息或經(jīng)驗(yàn)確定。在一種方法中,所述目標(biāo)分子的結(jié)合能力可通過(guò)提供如美國(guó)專利申請(qǐng)US-2005/0282209(NimbleGenSystems,Madison,WI)所述的所謂等溫(Tm平衡)寡核苷酸探針進(jìn)行調(diào)節(jié),其提供統(tǒng)一的探針表現(xiàn),消除雜交假象和/或偏差,并提供更高質(zhì)量的輸出。調(diào)節(jié)探針長(zhǎng)度(典型地,約20到約100個(gè)核苷酸,優(yōu)選地約40到約85個(gè)核苷酸,尤其是約45到約75個(gè)核苷酸,例如45個(gè)核苷酸,但是可選地還有多于100個(gè)核苷酸,直到約250個(gè)核苷酸)以平衡整個(gè)組的解鏈溫度(例如Tm=76°C,典型地約55°C到約76°C,尤其是約72°C到76°C)。如此,探針被優(yōu)化以在所述目標(biāo)基因組區(qū)域包括富AT及富GC區(qū)域內(nèi)在規(guī)定的嚴(yán)格條件下等同進(jìn)行。相關(guān)地,可使用天然堿基或人工堿基類似物例如肌醇,或者兩者的組合調(diào)節(jié)單個(gè)探針的序列,以達(dá)到那些探針的所需捕獲適合度。相似地,可使用具有產(chǎn)生所需捕獲表現(xiàn)的結(jié)構(gòu)的鎖定核酸探針、肽核酸探針等等。具有本公開的技術(shù)人員將了解,對(duì)于任何特定探針,可協(xié)同調(diào)節(jié)探針長(zhǎng)度、解鏈溫度以及序列,以達(dá)到所述探針的所需捕獲表現(xiàn)。方便地,探針的解鏈溫度(Tm)可使用公式Tm=5x(Gn+Cn)+lx(An+Tn)計(jì)算,其中η為探針中存在的每種特定堿基(A、T、G、或C)的數(shù)量。捕獲表現(xiàn)也可通過(guò)確定所述探針組中探針的捕獲適合度,然后相應(yīng)調(diào)節(jié)所述固體載體上的單個(gè)探針數(shù)量進(jìn)行標(biāo)準(zhǔn)化。例如,如果第一種探針捕獲的核酸是第二種探針的20倍,則兩種探針的捕獲表現(xiàn)可通過(guò)提供第二種探針的20倍拷貝進(jìn)行平衡,例如通過(guò)增加20倍表現(xiàn)第二種探針的特征的數(shù)量。如果所述探針系列制備并應(yīng)用于所述固體載體,集合中單個(gè)探針的濃度可以相同方式變化。另外,另一種標(biāo)準(zhǔn)化目標(biāo)核酸捕獲的策略是將所洗脫的目標(biāo)分子對(duì)所述探針進(jìn)行第二輪雜交,其條件不如第一輪雜交使用的嚴(yán)格。除第一次雜交中相對(duì)于初始基因組核酸復(fù)雜度降低的基本富集外,第二次雜交可在使所有捕獲探針飽和的雜交條件下進(jìn)行。假設(shè)在所述固體載體上提供基本等量的捕獲探針,所述探針的飽和可確保在第二次雜交和洗滌之后洗脫基本等量的各種目標(biāo)。另一種標(biāo)準(zhǔn)化策略在從所述固體載體捕獲的目標(biāo)分子洗脫和擴(kuò)增之后進(jìn)行。洗脫物中的目標(biāo)分子使用,例如化學(xué)或溫度變性過(guò)程進(jìn)行變性,以成為單鏈狀態(tài)并重新復(fù)性。動(dòng)力學(xué)考慮要求豐度較大種類(abundantspecies)在豐度較少種類之前重新復(fù)性。因此,通過(guò)去除重新復(fù)性種類的起始餾分,剩余單鏈種類可相對(duì)于所述洗脫物中的起始組進(jìn)行平衡。最佳去除豐度較大種類所需的時(shí)機(jī)通過(guò)經(jīng)驗(yàn)確定。總體來(lái)說(shuō),本發(fā)明的一種實(shí)施方案提供了一種降低一組核酸分子遺傳復(fù)雜度的新方法。所述方法包含(a)在雜交條件下將所述片段化變性核酸分子組與結(jié)合于固體載體的多種不同的寡核苷酸探針接觸以捕獲與所述探針特異性雜交的核酸分子,或者在雜交條件下將所述片段化變性核酸分子組與多種不同的寡核苷酸探針接觸,然后將所述雜交分子復(fù)合物結(jié)合到固體載體上,以捕獲與所述探針特異性雜交的核酸分子,其中(在兩種情況下)所述片段化變性核酸分子平均大小約100到約1000個(gè)核苷酸殘基,優(yōu)選約250到約800個(gè)核苷酸殘基,最優(yōu)選約400到約600個(gè)核苷酸殘基,(b)從所捕獲分子中分離未結(jié)合和非特異性雜交的核酸;(c)從所述固體載體洗脫所捕獲分子,其優(yōu)選在相對(duì)于初始樣品具有遺傳復(fù)雜性降低的洗脫物集合中,以及(d)可選地用所洗脫的捕獲分子至少再重復(fù)一輪步驟(a)到(C)。大多數(shù)情況下,所述核酸分子組為源自基因組DNA(基因組核酸分子)樣品的分子。然而,也可能用源自cDNA或甚至RNA的樣品開始。如上所述,原則上可使用本領(lǐng)域已知的任何方法進(jìn)行片段化處理。然而,所述片段化變性核酸分子平均大小應(yīng)為約100到約1000個(gè)核苷酸殘基,優(yōu)選約250到約800個(gè)核苷酸殘基,最優(yōu)選約400到約600個(gè)核苷酸殘基。例如,這可使用基因組DNA噴霧方法實(shí)現(xiàn)(參見(jiàn)例如歐洲專利申請(qǐng)EP0552290)。遺傳復(fù)雜度降低的參數(shù)可根據(jù)用戶的序列選擇需要幾乎任意選擇,并由所述多個(gè)寡核苷酸探針的序列確定。在一種實(shí)施方案中,所述多種探針確定來(lái)自多個(gè)遺傳基因座的多種外顯子、內(nèi)含子、或調(diào)控序列。在另一種實(shí)施方案中,所述多種探針確定至少一個(gè)單獨(dú)遺傳基因座的全序列,所述基因座大小至少lOOkb,優(yōu)選至少1Mb,或上述特定的大小。在另一種實(shí)施方案中,所述多種探針確定已知包含SNPs的位點(diǎn)。在另一種實(shí)施方案中,所述多種探針確定一種嵌合陣列。所述嵌合陣列在本發(fā)明上下文中定義為經(jīng)設(shè)計(jì)以捕獲至少一條完整染色體的全序列。在此上下文中,術(shù)語(yǔ)“定義”以如此方式理解,所述多種探針組對(duì)每種將要富集的目標(biāo)序列包含至少一種探針。優(yōu)選地,所述多種探針組對(duì)每種將要富集的目標(biāo)序列另外包含至少第二種探針,其特征為所述第二種探針具有與所述第一種序列互補(bǔ)的序列。根據(jù)本發(fā)明的固體載體或者為核酸微陣列或者為一組珠子。所述珠子可為玻璃、金屬、陶瓷和聚合物珠子。如果所述固體載體為微陣列,可能在所述固體載體上直接原位合成所述寡核苷酸捕獲探針。例如,可使用無(wú)掩膜陣列合成器在所述微陣列上合成所述探針(US6,375,903)。所述多種寡核苷酸探針的長(zhǎng)度可變化,其取決于實(shí)驗(yàn)設(shè)計(jì),并只受限于合成此類探針的可能性。優(yōu)選地,所述多種探針組的平均長(zhǎng)度約20到約100個(gè)核苷酸,優(yōu)選地約40到約85個(gè)核苷酸,尤其是約45到約75個(gè)核苷酸,例如45個(gè)核苷酸。如果所述固體載體為一組珠子,可使用無(wú)掩膜陣列合成器在微陣列上初始合成所述捕獲探針,然后根據(jù)已知標(biāo)準(zhǔn)方法釋放或切除,然后根據(jù)本領(lǐng)域已知的方法任選擴(kuò)增,并固定于所述珠子組。所述珠子可包裝在柱子中,以使樣品裝入并經(jīng)過(guò)所述柱子以降低遺傳復(fù)雜度。替代性地,為了改進(jìn)雜交動(dòng)力學(xué),可在包含具有固定的多種寡核苷酸分子的懸浮珠子的水溶液中進(jìn)行雜交。在一種實(shí)施方案中,所述多種不同的寡核苷酸探針各攜帶一化學(xué)基團(tuán)或連接物,即允許固定于固體載體的部分,也稱為固定基團(tuán)。然后在水溶液中進(jìn)行所述樣品的片段化變性核酸分子在雜交條件下與所述多種不同的寡核苷酸探針接觸的步驟,然后進(jìn)行在合適的固體載體上固定。例如,所述部分可為用于固定于鏈霉親和素包被的固體載體的生物素。在另一種實(shí)施方案中,所述部分可為類似半抗原的地高辛,其可用于固定于半抗原識(shí)別抗體例如地高辛結(jié)合抗體包被的固體載體。在一種特定的實(shí)施方案中,所述多種固定的探針的特點(diǎn)是標(biāo)準(zhǔn)化的捕獲表現(xiàn)。所述標(biāo)準(zhǔn)化的捕獲表現(xiàn)通常由上述方法達(dá)到,典型地包含下列步驟a)確定所述探針組中探針的捕獲適合度;以及b)調(diào)節(jié)所述固體載體上的至少一種探針數(shù)量。替代性地,所述標(biāo)準(zhǔn)化的捕獲表現(xiàn)由包含下列步驟的方法達(dá)到a)確定所述探針組中探針的捕獲適合度;以及b)調(diào)節(jié)所述固體載體上的至少一種探針的序列、解鏈溫度和探針長(zhǎng)度至少其中之一。仍然替代性地,所述標(biāo)準(zhǔn)化的捕獲表現(xiàn)由包含下列步驟的方法達(dá)到a)在不如第一次接觸步驟嚴(yán)格的條件下,所捕獲分子與所述固體載體上的至少一種固定探針接觸,以使所述至少一種探針飽和,b)從所述固體載體上洗除未結(jié)合和非特異性結(jié)合的核酸;以及C)從所述固體載體洗脫所結(jié)合的目標(biāo)核酸。仍然替代性地,所述標(biāo)準(zhǔn)化的捕獲表現(xiàn)由包含下列步驟的方法達(dá)到a)將所洗脫的捕獲分子變性成為單鏈狀態(tài);b)將所述單鏈分子重新復(fù)性,直至所述分子的一部分成為雙鏈;丟棄所述雙鏈分子,以及C)保留所述單鏈分子。通常至少一種固定探針與樣品中核酸片段的目標(biāo)基因組區(qū)域雜交。替代性地,所述至少一種固定探針可與包含目標(biāo)基因組區(qū)域的目標(biāo)核酸片段的序列雜交,所述雜交序列與所述目標(biāo)基因組區(qū)域分離。另外,使用至少一種寡核苷酸探針進(jìn)行至少第二個(gè)雜交步驟也在本發(fā)明范圍內(nèi),所述寡核苷酸探針與初次雜交中使用的至少一種探針有關(guān)但不同。具體來(lái)說(shuō),本發(fā)明還致力于提供一種方法,其用于確定樣品中基因組核酸的至少一個(gè)區(qū)域的核酸序列信息,所述方法包含下列步驟-根據(jù)本文公開的任何方法降低一組核酸分子的遺傳復(fù)雜度,以及_確定所捕獲分子的核酸序列,例如通過(guò)進(jìn)行測(cè)序反應(yīng)的方法。優(yōu)選地,所述測(cè)序反應(yīng)為通過(guò)合成反應(yīng)測(cè)序。根據(jù)本實(shí)施方案,所述基因組DNA優(yōu)選地通過(guò)機(jī)械應(yīng)力裂解。所需DNA片段平均大小應(yīng)該小(<=IOOObp),并取決于將要應(yīng)用的測(cè)序方法。根據(jù)本領(lǐng)域文獻(xiàn)(參見(jiàn),例如Hyman,Ε.D.,1988),通過(guò)合成測(cè)序定義為在測(cè)序反應(yīng)中加入特定的脫氧核苷三磷酸時(shí)監(jiān)測(cè)副產(chǎn)物生成的任何測(cè)序方法(參見(jiàn),例如Rhonaghi等人,1998)。通過(guò)合成反應(yīng)測(cè)序的一種特定的且最重要的實(shí)施方案為焦磷酸鹽測(cè)序方法。在這種情況下,通過(guò)最終導(dǎo)致化學(xué)冷光信號(hào)生成的酶級(jí)聯(lián)方法監(jiān)測(cè)加入核苷酸時(shí)焦磷酸鹽的生成。例如,454基因組測(cè)序系統(tǒng)(RocheAppliedSciencecat.No.04760085001)基于所述焦磷酸鹽測(cè)序技術(shù)。對(duì)于在454GS20或454FLX儀器上的測(cè)序,平均基因組DNA片段大小應(yīng)分別在200或600bp范圍內(nèi)。替代性地,所述通過(guò)合成反應(yīng)測(cè)序?yàn)榻K止子染色類型的測(cè)序反應(yīng)。在這種情況下,加入的dNTP組成塊包含可檢測(cè)的標(biāo)記,優(yōu)選地為一種防止新生DNA鏈進(jìn)一步延伸的熒光標(biāo)記。然后當(dāng)所述dNTP組成塊加入模板/引物延伸雜交體時(shí)所述標(biāo)記被去除并檢測(cè),例如通過(guò)使用包含3’-5’外切酶或校讀活性的DNA聚合酶。有利地,所述首先降低基因組復(fù)雜度然后確定多種序列的創(chuàng)新方法進(jìn)一步包含將接頭分子連接到所述片段化核酸分子的一端或兩端,優(yōu)選地為兩端的步驟。接頭分子在本發(fā)明上下文中優(yōu)選地定義為平端雙鏈寡核苷酸。另外,所述創(chuàng)新方法可進(jìn)一步包含使用至少一種引物擴(kuò)增所述核酸分子的步驟,所述引物包含與所述接頭分子序列對(duì)應(yīng)或特異性雜交的序列。為了將接頭分子連接到雙鏈目標(biāo)分子上,優(yōu)選地所述目標(biāo)分子自身為平端。為達(dá)到此目標(biāo),所述雙鏈目標(biāo)分子在脫氧核苷三磷酸存在下使用DNA聚合酶,例如T4-DNA聚合酶或Klenow聚合酶進(jìn)行填充反應(yīng),其產(chǎn)生平端目標(biāo)分子。另外,在連接之前加入例如T4多核苷酸激酶以在5’端加入磷酸基團(tuán)用于隨后的連接步驟??筛鶕?jù)本領(lǐng)域已知的任何方法,優(yōu)選地通過(guò)T4-DNA連接酶反應(yīng)的方法進(jìn)行隨后的所述接頭(約3-20堿基對(duì)的短雙鏈平端DNA寡核苷酸)與修飾的目標(biāo)DNA的連接。所述連接可在下述步驟之前或之后進(jìn)行將包含片段化變性基因組核酸分子的樣品在雜交條件下與多種寡核苷酸探針接觸以捕獲與所述探針雜交的目標(biāo)核酸分子。如果隨后進(jìn)行連接,從所述固體載體以單鏈形式釋放的所富集核酸應(yīng)首先重新復(fù)性,然后根據(jù)本領(lǐng)域已知的標(biāo)準(zhǔn)方法進(jìn)行引物延伸反應(yīng)和填充反應(yīng)。所述接頭分子的連接允許隨后擴(kuò)增所捕獲分子的步驟。無(wú)論連接在所述捕獲步驟之前或之后進(jìn)行,有兩種備選的實(shí)施方案。在第一種實(shí)施方案中,使用一種類型的接頭分子。這導(dǎo)致在片段兩端具有相同末端序列的一組片段。因此,在可能的隨后擴(kuò)增步驟中僅使用一種引物就足夠。在替代的實(shí)施方案中,使用兩種類型的接頭分子A和B。這導(dǎo)致由3種不同類型組成的一組富集分子(i)在一端具有一種接頭(A)并在另一端具有另一種接頭(B)的片段,(ii)在兩端具有接頭A的片段,以及(iii)在兩端具有接頭B的片段。如果擴(kuò)增和測(cè)序例如使用4541ifesciencecorporationGS20和GSFLX儀器進(jìn)行,根據(jù)類型⑴產(chǎn)生富集分子非常有利(參見(jiàn)GS20LibraryPr印Manual,Dec2006,WO2004/070007)。如果所述接頭之一,例如接頭B帶有生物素修飾,則分子(i)和(iii)可以例如結(jié)合于鏈霉親和素(SA)包被的磁珠用于進(jìn)一步分離和洗去(ii)的產(chǎn)物。如果所富集并SA固定的DNA從所述捕獲陣列/固體載體洗脫之后為單鏈,將所述DNA轉(zhuǎn)為雙鏈?zhǔn)怯欣?。在這種情況下,可在所述洗滌SA得到的結(jié)合產(chǎn)物中加入與接頭A互補(bǔ)的引物。因?yàn)锽-B(上述iii)部分沒(méi)有A或其互補(bǔ)存在,只有A-B連接的且SA捕獲的產(chǎn)物可在A互補(bǔ)引物的引物延伸后成為雙鏈。隨后,已結(jié)合于所述磁珠的所述雙鏈DNA分子通過(guò)溫度或化學(xué)(例如NaOH)變性的方法以使新合成的鏈釋放到溶液中。由于緊密的生物素/鏈霉親和素結(jié)合,例如,僅具有兩個(gè)接頭B的分子不會(huì)釋放到溶液中。可用于釋放的鏈僅為A互補(bǔ)與B互補(bǔ)引物延伸合成鏈。所述包含在一端具有接頭A并在另一端具有接頭B的單鏈目標(biāo)分子的溶液可以,例如隨后結(jié)合于另一種類型的珠子,其包含與所述接頭A或B序列充分互補(bǔ)的捕獲序列,用于進(jìn)一步處理。在GenomeSequencerworkflow(RocheAppliedScienceCatalogNo.04896548001)情況下,在第一步,使用乳液PCR方法進(jìn)行(克隆)擴(kuò)增。因此,以乳液PCR形式進(jìn)行擴(kuò)增步驟也在本發(fā)明的范圍內(nèi)。然后帶有所述克隆擴(kuò)增的目標(biāo)核酸的珠子可根據(jù)制造商說(shuō)明書任意轉(zhuǎn)入Picotiter板,并進(jìn)行焦磷酸鹽測(cè)序反應(yīng),用于序列確定。因此,根據(jù)本發(fā)明的方法可在多種不同應(yīng)用中確定序列。例如,本發(fā)明還提供了一種檢測(cè)相對(duì)于參考基因組的編碼區(qū)變異的方法,優(yōu)選地用于包含片段化變性基因組核酸分子的樣品,所述方法包含下列步驟-進(jìn)行如上所述的方法,-確定所捕獲分子的核酸序列,以及-所確定序列與數(shù)據(jù)庫(kù)比較,特別是與所述參考基因組多態(tài)性數(shù)據(jù)庫(kù)比較,以從所述參考基因組中鑒別出變體。在另一個(gè)主要方面,本發(fā)明還提供了一種用于進(jìn)行根據(jù)本文公開的本發(fā)明的方法或部分方法的試劑盒。因此,本發(fā)明還致力于提供一種試劑盒,其包含-一種(第一種)雙鏈接頭分子,以及-具有多種探針的固體載體,其中所述多種探針選自-限定來(lái)自多個(gè)遺傳基因座的多種外顯子、內(nèi)含子或調(diào)控序列的多種探針,-限定至少一個(gè)單獨(dú)遺傳基因座的全序列的多種探針,所述基因座大小至少IOOkb,優(yōu)選至少1Mb,或本文所述大小,-限定已知包含SNPs的位點(diǎn)的多種探針,以及-限定一種陣列,尤其是特別設(shè)計(jì)為捕獲至少一條完整染色體的全序列的嵌合陣列的多種探針。優(yōu)選地,所述試劑盒包含兩種不同的雙鏈接頭分子。所述固體載體可為如本文公開的多種珠子或微陣列。在一種實(shí)施方案中,所述試劑盒進(jìn)一步包含至少一種或多種化合物,其選自下列DNA聚合酶;T4多核苷酸激酶;T4DNA連接酶;陣列雜交液,例如如本文公開的;陣列洗滌液,特別是含有SSC、DTT、以及可選的SDS的洗滌液,例如洗滌緩沖液1(0.2xSSC,0.2%(ν/v)SDS,0.ImMDTT)、洗滌緩沖液II(0.2xSSC,0.ImMDTT)、和/或洗滌緩沖液III(0.05xSSC,0.ImMDTT);和/或陣列洗脫液,例如水或者包含TRIS緩沖液和/或EDTA的溶液。在另一種特定的實(shí)施方案中,與本文公開的實(shí)施方案不相互排斥,所述試劑盒包含第二種接頭分子。所述第一種或第二種接頭分子的至少一條寡核苷酸鏈可帶有修飾,其允許固定于固體載體。例如,所述修飾可為生物素標(biāo)記,其可用于固定于鏈霉親和素包被的固體載體。替代性地,所述修飾可為類似半抗原的地高辛,其可用于固定于半抗原識(shí)別抗體包被的固體載體。當(dāng)用于本文時(shí),術(shù)語(yǔ)“雜交”系指互補(bǔ)核酸的配對(duì)。雜交和雜交強(qiáng)度(即所述核酸之間結(jié)合的強(qiáng)度)受如下因素影響所述核酸之間互補(bǔ)的程度、涉及條件的嚴(yán)格程度、所形成雜交體的Tm、以及所述核酸的GC比值。雖然本發(fā)明不受限于特定的一組雜交條件,但優(yōu)選使用嚴(yán)格的雜交條件。嚴(yán)格的雜交條件取決于序列,并因變化的環(huán)境參數(shù)(例如鹽濃度、以及有機(jī)物的存在)而不同。通常,“嚴(yán)格的”條件選擇為在規(guī)定的離子強(qiáng)度和PH下低于特定核酸序列的溫度熔點(diǎn)(Tm)約5°C到20°C。優(yōu)選地,嚴(yán)格的條件為低于與互補(bǔ)核酸結(jié)合的特定核酸的溫度熔點(diǎn)約5°C到10°C。所述Tm為50%核酸(例如標(biāo)簽核酸)與完全配對(duì)探針雜交的溫度(在規(guī)定的離子強(qiáng)度和PH下)。相似地,“嚴(yán)格的”洗滌條件通常根據(jù)經(jīng)驗(yàn)為每組標(biāo)簽與對(duì)應(yīng)的探針陣列雜交確定。所述陣列首先雜交(典型地在嚴(yán)格的雜交條件下),然后用包含連續(xù)降低濃度的鹽、或增高濃度的洗滌劑的緩沖液洗滌,或者在增加的溫度下洗滌直至特異性與非特異性雜交的信噪比足夠高以促進(jìn)特異性雜交的檢測(cè)。嚴(yán)格的溫度條件通常包括溫度超過(guò)約30°C,更通常超過(guò)約37°C,并有時(shí)候超過(guò)約45°C。嚴(yán)格的鹽條件通常低于約IOOOmM,通常低于約500mM,更通常低于約150mM。更多信息參見(jiàn)例如Wetmur等人(1966)andWetmur(1991)。如本文定義的“嚴(yán)格的條件”或“高度嚴(yán)格的條件”,可為在50%甲酰胺、5xSSC(0.75MNaCl,0.075M檸檬酸鈉)、50mM磷酸鈉(pH6.8)、0.1%焦磷酸鈉、5xDenhardt‘s溶液、超聲波處理的鮭魚精子DNA(50mg/ml)、0.1%SDS、和10%硫酸葡聚糖中,在42°C下雜交,在42°C以0.2xSSC(氯化鈉/檸檬酸鈉)和在55°C以50%甲酰胺洗滌,然后在55°C以含EDTA的0.IxSSC洗滌。舉例來(lái)說(shuō),但不限于,預(yù)期含35%甲酰胺、5xSSC和0.1%(w/v)十二烷基硫酸鈉的緩沖液適合在適度非嚴(yán)格條件下在45°C雜交16-72小時(shí)。此外,預(yù)期甲酰胺濃度可根據(jù)探針長(zhǎng)度和所需嚴(yán)格程度在20-45%范圍內(nèi)適當(dāng)調(diào)節(jié)。通過(guò)升高雜交溫度或甲酰胺濃度補(bǔ)償探針長(zhǎng)度變化而進(jìn)行探針優(yōu)化以獲得更長(zhǎng)探針(>>50體)也包括在本發(fā)明范圍內(nèi)。雜交條件的其它實(shí)例見(jiàn)于多種來(lái)源,包括〃DirectselectionofcDNAswithlargegenomicDNAclones,“inMolecularCloning:ALaboratoryManual(2001)。在另一種實(shí)施方案中,本發(fā)明致力于提供一種分離和降低多種核酸序列復(fù)雜度的方法,其包含提供一種固體載體,其中所述固體載體包含可與目標(biāo)核酸序列雜交的雜交探針,以及包含目標(biāo)核酸序列的片段化核酸樣品;擴(kuò)增所述雜交探針,其中擴(kuò)增產(chǎn)物包含結(jié)合部分,且其中所述擴(kuò)增產(chǎn)物保持在溶液中;將所述核酸樣品與溶液中的所述擴(kuò)增產(chǎn)物雜交,使得所述擴(kuò)增產(chǎn)物與目標(biāo)核酸序列進(jìn)行雜交;通過(guò)所述結(jié)合部分從非特異性雜交核酸中分離所述目標(biāo)核酸/擴(kuò)增產(chǎn)物雜交復(fù)合物;以及從所述復(fù)合物洗脫所雜交的目標(biāo)核酸序列,由此分離和降低多種核酸序列的復(fù)雜度。在另一種實(shí)施方案中,本發(fā)明包含上述方法,其進(jìn)一步包含測(cè)序所洗脫的目標(biāo)核酸序列。在另一種實(shí)施方案中,本發(fā)明致力于提供一種試劑盒,其包含包含結(jié)合部分的雜交探針序列,其中所述探針序列設(shè)計(jì)為與一種或多種目標(biāo)核酸序列雜交,并且其中所述探針序列在溶液中;包含用于結(jié)合所述結(jié)合部分的結(jié)合伴侶的基質(zhì);以及用于實(shí)現(xiàn)上述方法的說(shuō)明。在本發(fā)明的實(shí)施方案中,包含變性(例如單鏈)核酸分子,優(yōu)選地為基因組核酸分子,其可為片段化分子的樣品,在雜交條件下接觸多種寡核苷酸探針,其中所述多種寡核苷酸探針或源自所述探針的擴(kuò)增子在溶液中,以從所述樣品核酸分子中捕獲目標(biāo)核酸序列,并從所述雜交目標(biāo)序列中分離基因組非雜交區(qū)域或任何其它樣品核酸,其中所述分離包含通過(guò)結(jié)合部分(例如,與所述探針或源自探針的擴(kuò)增子結(jié)合)捕獲溶液中的雜交復(fù)合物,并洗滌所結(jié)合的復(fù)合物,由此從非特異性非目標(biāo)雜交序列中分離所雜交的目標(biāo)序列(圖6)。本發(fā)明提供了方法和系統(tǒng),其用于分離多種核酸序列,以及降低大核酸樣品的復(fù)雜度,所述大核酸樣品為例如基因組DNA或RNA樣品、cDNA文庫(kù)、或mRNA文庫(kù),以促進(jìn)進(jìn)一步處理和遺傳分析。在本發(fā)明的某些實(shí)施方案中,方法和系統(tǒng)包含(預(yù)選的)固定核酸探針的原位擴(kuò)增,其中源自探針的擴(kuò)增子包含結(jié)合部分。標(biāo)記的擴(kuò)增子在溶液中通過(guò)樣品與所述擴(kuò)增子以基于溶液的方法雜交以從樣品中捕獲目標(biāo)序列。標(biāo)記的擴(kuò)增子/目標(biāo)核酸雜交復(fù)合物通過(guò)所述結(jié)合部分捕獲,優(yōu)選地洗滌,并且所述目標(biāo)核酸被洗脫。所洗脫的基因組序列比未經(jīng)過(guò)所述富集過(guò)程的基因組樣品更適用于詳細(xì)的遺傳分析。因此,所公開的方法提供了用于降低基因組樣品復(fù)雜度的經(jīng)濟(jì)、靈活、并有效的方法。在本說(shuō)明的其余部分中,基因組樣品用于說(shuō)明目的,但應(yīng)理解其它非基因組樣品可用于相同過(guò)程。在某些實(shí)施方案中,本發(fā)明提供了一種分離多種核酸序列并降低核酸樣品復(fù)雜度的方法,其通過(guò)在優(yōu)選的足以支持探針擴(kuò)增子與所述核酸樣品互補(bǔ)區(qū)域雜交的嚴(yán)格條件下,在溶液中將所述樣品與核酸探針擴(kuò)增子雜交實(shí)現(xiàn)。探針擴(kuò)增子/目標(biāo)核酸復(fù)合物在足以去除非特異性結(jié)合核酸的條件下洗滌。所雜交的目標(biāo)核酸序列從源自探針的擴(kuò)增子中洗脫,并可以可選地進(jìn)一步擴(kuò)增(例如通過(guò)LM-PCR),例如用于下游應(yīng)用,例如再測(cè)序。本發(fā)明提供了用于分離多種核酸序列并降低一組核酸分子的遺傳復(fù)雜度的方法,所述方法包含下列步驟一組目標(biāo)片段化變性核酸分子在雜交條件下接觸多種不同的源自寡核苷酸探針的擴(kuò)增子以捕獲與所述探針擴(kuò)增子特異性雜交的核酸分子,其中所述擴(kuò)增子在溶液中且其中所述擴(kuò)增子進(jìn)一步包含結(jié)合部分;通過(guò)將所述探針擴(kuò)增子上的結(jié)合部分與其結(jié)合伴侶結(jié)合(例如生物素/SA、地高辛/抗地高辛、6HIS/鎳等等),結(jié)合或捕獲雜交分子復(fù)合物,其中所述片段化變性核酸分子平均大小約100到約1000個(gè)核苷酸殘基,優(yōu)選地約250到約800個(gè)核苷酸殘基,最優(yōu)選地約400到約600個(gè)核苷酸殘基;從結(jié)合探針擴(kuò)增子中分離未結(jié)合和非特異性雜交的核酸;從所述擴(kuò)增子中洗脫所雜交目標(biāo)分子;以及可選地測(cè)序所述目標(biāo)分子。因此,本發(fā)明的實(shí)施方案提供了基于溶液的方法和系統(tǒng),其用于分離多種核酸序列并降低一組核酸分子的遺傳復(fù)雜度。本發(fā)明的方法和系統(tǒng)包含下列步驟片段化變性核酸樣品序列在足以使所述變性核酸目標(biāo)序列與源自探針的擴(kuò)增子(例如在溶液中)雜交的雜交條件下,接觸多種不同的在溶液中的雜交探針擴(kuò)增子,其中所述片段化變性核酸樣品序列在變性之前在所述片段化核酸樣品一端或兩端可包含或可不包含一個(gè)或多個(gè)連接接頭,其中所述擴(kuò)增子源自預(yù)先設(shè)計(jì)的多種不同的雜交探針,其中所述擴(kuò)增子包含結(jié)合部分或序列和可選的限制性內(nèi)切酶(RE)位點(diǎn),其中所述片段化變性核酸序列平均大小為約100到約1000個(gè)核苷酸殘基,優(yōu)選地約250到約800個(gè)核苷酸殘基,最優(yōu)選地約400到約600個(gè)核苷酸殘基;通過(guò)所述結(jié)合部分結(jié)合擴(kuò)增子/目標(biāo)復(fù)合物,從源自探針的擴(kuò)增子分離未結(jié)合和非特異性雜交的核酸分子,并洗滌所結(jié)合復(fù)合物;從所結(jié)合復(fù)合物洗脫所述目標(biāo)核酸序列,其中所述目標(biāo)序列顯示相對(duì)初始樣品降低的遺傳復(fù)雜度;以及可選地使用初次洗脫的富集目標(biāo)核酸序列重復(fù)雜交、洗滌和洗脫步驟以進(jìn)一步富集目標(biāo)核酸序列。在本發(fā)明的實(shí)施方案中,用于捕獲目標(biāo)核酸的探針通過(guò)多種方法固定于基質(zhì)上。在一種實(shí)施方案中,探針可點(diǎn)樣在載玻片上(例如美國(guó)專利6,375,903和5,143,854)。在優(yōu)選的實(shí)施方案中,使用如美國(guó)專利6,375,903,7,037,659,7,083,975,7,157,229所述的無(wú)掩膜陣列合成器(MAS)在基質(zhì)上原位合成探針,其允許在載玻片上直接原位合成寡核苷酸序列用于隨后的原位聚合酶鏈反應(yīng)(PCR)擴(kuò)增。在某些實(shí)施方案中,固體載體為一組珠子或顆粒。所述捕獲探針首先使用無(wú)掩膜陣列合成器在微陣列載玻片上合成,擴(kuò)增,根據(jù)標(biāo)準(zhǔn)方法釋放或切除,可選地?cái)U(kuò)增并固定于所述珠子組上。所述珠子可包裝在例如柱子中,以使目標(biāo)樣品裝入并通過(guò)柱子,以及探針/目標(biāo)序列在柱子中雜交,然后洗滌,并且洗脫目標(biāo)樣品序列以降低遺傳復(fù)雜度。在某些實(shí)施方案中,柱子具有液體進(jìn)口和出口。在某些實(shí)施方案中,為增強(qiáng)雜交動(dòng)力學(xué),雜交在水溶液中進(jìn)行,其包含在水環(huán)境中懸浮的具有固定的多種探針的珠子。在某些實(shí)施方案中,目標(biāo)分子的核酸探針在固體載體上合成,從所述固體載體上以探針集合釋放并擴(kuò)增。所述擴(kuò)增的釋放探針集合共價(jià)或非共價(jià)固定于載體(例如玻璃、金屬、陶瓷、聚合物珠子、順磁性顆粒等等)。所述探針設(shè)計(jì)為從所述固體載體方便釋放,例如通過(guò)在最接近載體的探針末端或其附近提供酸或堿不穩(wěn)定的核酸序列,其分別在低或高PH條件下釋放所述探針。本領(lǐng)域熟知將核酸固定于載體的方法,例如通過(guò)在所述探針中引入生物素標(biāo)記的核苷酸并使用鏈霉親和素包被載體,由此所包被載體吸引并固定集合中的所述探針。樣品在雜交條件下通過(guò)包含探針的載體(例如載玻片、柱子等等),由此與所述固定載體雜交的目標(biāo)核酸分子可被洗脫用于隨后的分析或其它用途。在本發(fā)明的實(shí)施方案中,設(shè)計(jì)為隨后的用于本文所述的基于溶液的捕獲方法的擴(kuò)增的起始雜交探針印制或放置于固體載體,例如微陣列載玻片、芯片、微孔、柱子、管子、珠子或顆粒?;|(zhì)可為,例如玻璃、金屬、陶瓷、聚合物珠子等等。在優(yōu)選的實(shí)施方案中,所述固體載體為微陣列(例如玻璃載玻片),其中所述探針使用無(wú)掩膜陣列合成器在所述微陣列上合成。所述多種寡核苷酸探針的長(zhǎng)度可變化并取決于實(shí)驗(yàn)設(shè)計(jì),并僅受限于合成所述探針的可能性。在優(yōu)選的實(shí)施方案中,所述多種探針組在原位擴(kuò)增之前的平均長(zhǎng)度為約20到約100個(gè)核苷酸,優(yōu)選地約40到約85個(gè)核苷酸,特別是約45到約75個(gè)核苷酸。所述固定雜交探針隨后用作原位PCR擴(kuò)增和可選的非對(duì)稱PCR擴(kuò)增的模板,以提供源自探針的擴(kuò)增子用于基于溶液的雜交和復(fù)合物樣品中目標(biāo)核酸分子的富集。在本發(fā)明的實(shí)施方案中,雜交探針與基因組至少一個(gè)區(qū)域序列對(duì)應(yīng),并可使用例如無(wú)掩膜陣列合成(MAS)技術(shù)在固體載體上并行提供。替代性地,可使用標(biāo)準(zhǔn)DNA合成儀連續(xù)獲得探針并應(yīng)用于所述固體載體,或者可從有機(jī)體獲得并固定于所述固體載體。在本發(fā)明的實(shí)施方案中,預(yù)期與合成方法無(wú)關(guān),雜交探針包含用于擴(kuò)增技術(shù)的擴(kuò)增引物序列。在本發(fā)明的實(shí)施方案中,引入至雜交探針序列的擴(kuò)增引物序列進(jìn)一步包含限制性內(nèi)切酶(RE)序列。在本發(fā)明的實(shí)施方案中,微陣列基質(zhì)上的雜交探針使用與所述引物序列互補(bǔ)的引物原位擴(kuò)增,其中一個(gè)或兩個(gè)所述引物進(jìn)一步包含連接化合物,例如結(jié)合部分(例如生物素、地高辛等等),由此源自所述雜交探針的PCR擴(kuò)增子在溶液中。包含源自探針的擴(kuò)增子的溶液轉(zhuǎn)移到例如管子、孔、或其它容器中并保持在溶液中。預(yù)期另外進(jìn)行一輪或多輪擴(kuò)增以促進(jìn)包含所述結(jié)合部分的擴(kuò)增子鏈生產(chǎn),例如通過(guò)非對(duì)稱PCR。核酸樣品,優(yōu)選地為片段化且變性以產(chǎn)生片段化單鏈目標(biāo)序列,加入到溶液中的擴(kuò)增子,所述源自探針的擴(kuò)增子與所述片段化單鏈目標(biāo)核酸樣品進(jìn)行雜交。雜交之后,通過(guò)經(jīng)所述結(jié)合部分捕獲擴(kuò)增子/目標(biāo)復(fù)合物和洗滌擴(kuò)增子/目標(biāo)復(fù)合物從擴(kuò)增子/目標(biāo)復(fù)合物分離不雜交或非特異性雜交的核酸。例如,如果所述結(jié)合部分為生物素,使用鏈霉親和素包被的基質(zhì)捕獲所述復(fù)合物。洗滌所述結(jié)合復(fù)合物,例如使用一種或多種洗滌液。剩余核酸(例如特異性結(jié)合于所述擴(kuò)增子)從所述復(fù)合物洗脫,例如使用水或洗脫緩沖液(例如包含TRIS緩沖液和/或EDTA),以產(chǎn)生富集所述目標(biāo)核酸序列的洗脫物。用于本文所述的基于溶液的捕獲方法和系統(tǒng)中擴(kuò)增的基于微陣列的寡核苷酸設(shè)計(jì)為靶向基因組的一個(gè)或多個(gè)區(qū)域。單個(gè)探針的長(zhǎng)度典型地在50到200個(gè)堿基之間。這些探針可設(shè)計(jì)為重疊探針,意為相鄰探針的起始核苷酸在所述基因組中以短于探針的長(zhǎng)度相隔,或者非重疊探針,其中相鄰探針之間的距離長(zhǎng)于探針長(zhǎng)度。相鄰探針之間的距離通常重疊,兩個(gè)探針的起始核苷酸之間的間隔在1到100個(gè)堿基之間變化。所述距離可變化以使某些基因組區(qū)域比其它區(qū)域更能成為大量探針的靶點(diǎn)。所述變化可用于例如調(diào)整單個(gè)基因組區(qū)域的捕獲效率,使捕獲標(biāo)準(zhǔn)化。可測(cè)試探針在所述基因組中的獨(dú)特性。在本發(fā)明的優(yōu)選實(shí)施方案中,為避免基因組成分與源自探針的擴(kuò)增子的非特異性結(jié)合,使用一種方法從選擇探針設(shè)計(jì)中排除所述基因組的高度重復(fù)成分,所述方法使用與例如Morgolis(2006,Bioinformatics15:134_141,其全部?jī)?nèi)容通過(guò)引用結(jié)合到本文中)開發(fā)的WindowMasker程序相似的策略以鑒別這些區(qū)域并將其從探針選擇中排除。根據(jù)本發(fā)明的方法,用于本發(fā)明的基于溶液的捕獲方法的設(shè)計(jì)的擴(kuò)增探針的特性與表現(xiàn)可變化,以有利地標(biāo)準(zhǔn)化或調(diào)節(jié)捕獲并富集的目標(biāo)分子的分布。所述標(biāo)準(zhǔn)化的一個(gè)目標(biāo)是通過(guò)每個(gè)讀數(shù)提供一種表達(dá)的基因(例如Soares,等人,1994,Proc.Natl.Acad.Sci.91=9228-9232)。標(biāo)準(zhǔn)化,例如在文庫(kù)構(gòu)建之前應(yīng)用于cDNA分子組,因?yàn)橥ǔK鼋M中的分子分布反映產(chǎn)生所述cDNA分子組的表達(dá)基因的不同表達(dá)水平。例如,有效分析每個(gè)目標(biāo)區(qū)域所需的測(cè)序反應(yīng)數(shù)量可通過(guò)標(biāo)準(zhǔn)化所富集組中每個(gè)目標(biāo)序列的拷貝數(shù)而減少,由此基于適合度和其它探針屬性的組合可標(biāo)準(zhǔn)化所述探針組中不同探針的捕獲表現(xiàn)。適合度,以捕獲度量為特征,可通過(guò)信息或經(jīng)驗(yàn)確定。在一種方法中,所述目標(biāo)分子的結(jié)合能力可通過(guò)提供如美國(guó)專利2005/10282209所述的所謂等溫(Tm平衡)寡核苷酸探針進(jìn)行調(diào)節(jié),其提供統(tǒng)一的探針表現(xiàn),消除雜交假象和/或偏差,并提供更高質(zhì)量的輸出。調(diào)節(jié)探針長(zhǎng)度(典型地,約20到約100個(gè)核苷酸,優(yōu)選地約40到約85個(gè)核苷酸,尤其是約45到約75個(gè)核苷酸,但是可選地還可多于100個(gè)核苷酸,直到約250個(gè)核苷酸)以在擴(kuò)增之前平衡整個(gè)組的探針的解鏈溫度(例如Tm=76°C,典型地約55°C到約76°C,尤其是約72°C到76°C)。因此,探針被優(yōu)化以在包括富AT及富GC區(qū)域的目標(biāo)基因組區(qū)域內(nèi)在規(guī)定的嚴(yán)格條件下等同表現(xiàn)。本領(lǐng)域技術(shù)人員將了解,對(duì)于源自任何給定探針的擴(kuò)增子,可協(xié)同調(diào)節(jié)探針長(zhǎng)度、解鏈溫度以及序列,以達(dá)到所述探針擴(kuò)增子的所需雜交表現(xiàn)。例如,源自探針的擴(kuò)增子的解鏈溫度(Tm)可使用公式Tm=Sx(Gn+Cn)+lx(An+Tn)計(jì)算,其中η為探針擴(kuò)增子中存在的每種特定堿基(A、T、G或C)的數(shù)量。捕獲表現(xiàn)也可通過(guò)確定所述探針組中探針擴(kuò)增子的捕獲適合度,然后相應(yīng)調(diào)節(jié)用于擴(kuò)增目的的固體載體上的單個(gè)探針數(shù)量進(jìn)行標(biāo)準(zhǔn)化。例如,如果源自第一種探針的探針擴(kuò)增子預(yù)期捕獲的核酸是源自第二組探針的擴(kuò)增子的20倍,則兩組探針擴(kuò)增子的捕獲表現(xiàn)可通過(guò)提供第二種擴(kuò)增目的探針的20倍拷貝進(jìn)行平衡,例如通過(guò)在擴(kuò)增之前增加20倍顯示第二種探針的微陣列探針的數(shù)量。在其它實(shí)施方案中,另一種標(biāo)準(zhǔn)化目標(biāo)核酸捕獲的策略是將所洗脫的目標(biāo)分子對(duì)源自探針的擴(kuò)增子進(jìn)行第二輪基于溶液的雜交,其條件不如第一輪雜交使用的嚴(yán)格。除第一次雜交中相對(duì)于初始基因組核酸降低復(fù)雜度的基本富集外,第二次雜交可在所有捕獲探針飽和的雜交條件下進(jìn)行。假設(shè)在溶液中提供基本等量的源自探針的擴(kuò)增子,所述擴(kuò)增子的飽和可確保在第二次雜交和洗滌之后洗脫基本等量的各種目標(biāo)。在本發(fā)明的實(shí)施方案中,用于在本文所述的基于溶液的捕獲和富集方法和系統(tǒng)中使用的雜交探針的原位擴(kuò)增的擴(kuò)增引物包含連接化合物,例如結(jié)合部分。結(jié)合部分包含任何連接或引入用于隨后捕獲探針擴(kuò)增子/目標(biāo)核酸雜交復(fù)合物的擴(kuò)增引物的5’端的部分。結(jié)合部分為引入引物序列5’端的任何序列,例如可捕獲的6組氨酸(6HIS)序列。例如,包含6HIS序列的引物可被鎳捕獲,例如在鎳包被或包含鎳包被珠子、顆粒等的管子、微孔、或純化柱中,其中所述珠子包裝入柱子中,樣品裝入并通過(guò)柱子以捕獲復(fù)雜度降低的復(fù)合物(例如,和隨后的目標(biāo)洗脫)。用于本發(fā)明的實(shí)施方案的另一種結(jié)合部分的實(shí)例包括半抗原,例如地高辛,例如其連接到擴(kuò)增引物的5’端。地高辛可使用地高辛抗體捕獲,例如包被或包含抗地高辛抗體的基質(zhì)。在優(yōu)選的實(shí)施方案中,用于本發(fā)明的方法和系統(tǒng)的擴(kuò)增引物包含生物素部分,其與所述引物的5’端及隨后源自探針的擴(kuò)增子結(jié)合。生物素可被鏈霉親和素(SA)捕獲,因此生物素標(biāo)記的擴(kuò)增子可在包被或包含SA的基質(zhì)或柱子上捕獲。在優(yōu)選的實(shí)施方案中,鏈霉親和素包被在順磁性顆粒上,其可依次被磁性捕獲,以利于目標(biāo)核酸分子的洗滌并洗脫。本發(fā)明不受限于使用的連接化合物種類,并且本領(lǐng)域技術(shù)人員可知等同適用于本發(fā)明的方法和系統(tǒng)的其它選擇。在本發(fā)明的實(shí)施方案中,所述方法和系統(tǒng)包含確定樣品中核酸至少一個(gè)區(qū)域的核酸序列信息,特別是基因組核酸,(全基因組或至少一條完整或部分染色體),所述方法包含實(shí)現(xiàn)上述方法然后確定所捕獲分子核酸序列的步驟,特別是通過(guò)合成反應(yīng)進(jìn)行測(cè)序。在本發(fā)明的實(shí)施方案中,目標(biāo)核酸典型地為脫氧核糖核酸或核糖核酸,并包括通過(guò)將一種核酸分子類型(例如DNA、RNA和cDNA)轉(zhuǎn)化為另一種類型的體外合成產(chǎn)物,以及包含核苷酸類似物的合成分子。變性基因組DNA分子是特別比天然存在的基因組核酸分子短的分子。本領(lǐng)域技術(shù)人員可使用熟知的方法通過(guò)化學(xué)、物理或酶裂解或剪切從較大分子制備隨機(jī)或非隨機(jī)大小的分子。例如,化學(xué)裂解可使用含鐵金屬(例如Fe-EDTA),物理方法可包括超聲波處理、流體動(dòng)力或噴霧(例如參見(jiàn)歐洲專利申請(qǐng)EP0552290),酶學(xué)方法可使用核酸酶,例如微球菌核酸酶(Mnase)或外切核酸酶(例如ExoI或Bal31)或限制性內(nèi)切酶。本發(fā)明不受限于產(chǎn)生片段的方法,預(yù)期任何可用于使核酸片段化的方法。在本發(fā)明的實(shí)施方案中,與所富集片段使用的富集后技術(shù)相當(dāng)?shù)拇笮》秶鷥?nèi)的片段是優(yōu)選的。例如,本發(fā)明的實(shí)施方案預(yù)期核酸片段大小范圍為約100到約1000個(gè)核苷酸殘基或堿基對(duì),或約250到約800個(gè)核苷酸殘基或堿基對(duì),或約400到約600個(gè)核苷酸殘基或堿基對(duì),特別是約500個(gè)核苷酸殘基或堿基對(duì)??赡馨繕?biāo)核酸序列的核酸分子組優(yōu)選包含一種有機(jī)體的全基因組或至少一條染色體,或至少一種至少約IOOkb的核酸分子。具體來(lái)說(shuō),所述核酸分子的大小至少約200kb、至少約500kb、至少約1Mb、至少約2Mb、或至少約5Mb,尤其是大小在約IOOkb到約5Mb之間、在約200kb到約5Mb之間、在約500kb到約5Mb之間、在約1Mb到約2Mb之間、或在約2Mb到約5Mb之間。在某些實(shí)施方案中,所述核酸分子為基因組DNA,而在其它實(shí)施方案中,所述核酸分子為cDNA或RNA種類(例如tRNA、mRNA、miRNA)。在本發(fā)明的實(shí)施方案中,可能包含或不包含目標(biāo)核酸序列的核酸分子可選自動(dòng)物、植物或微生物,在特定的實(shí)施方案中,所述核酸分子來(lái)自靈長(zhǎng)動(dòng)物,優(yōu)選為人。在某些實(shí)施方案中,如果只有少量核酸分子樣品可供利用,在實(shí)踐本發(fā)明的方法之前擴(kuò)增所述核酸(例如通過(guò)全基因組擴(kuò)增)。例如,為法醫(yī)目的(例如,在法醫(yī)學(xué)中等等)進(jìn)行本發(fā)明的實(shí)施方案,預(yù)先擴(kuò)增可能是必須的。預(yù)期在優(yōu)選的實(shí)施方案中,所述核酸分子組為一組基因組DNA分子。雜交探針及隨后的擴(kuò)增子可包含一種或多種序列,其靶向來(lái)自多個(gè)遺傳基因座的多種外顯子、內(nèi)含子或調(diào)控序列;至少一個(gè)單獨(dú)遺傳基因座的全序列,所述基因座大小至少lOOkb,優(yōu)選至少1Mb,或至少上述特定大小之一;已知包含SNPs的位點(diǎn);或限定陣列的序列,尤其是設(shè)計(jì)為捕獲至少一條完整染色體的全序列的嵌合陣列。預(yù)期目標(biāo)核酸序列可以純化或非純化形式從包括任何來(lái)源核酸的一個(gè)或多個(gè)樣品中富集。所述來(lái)源不需包含有機(jī)體基因組核酸分子的全部補(bǔ)充物。所述樣品,優(yōu)選地來(lái)自生物來(lái)源,包括但不限于,來(lái)自個(gè)體病人、組織樣品、或細(xì)胞培養(yǎng)物的集合的分離物。所述目標(biāo)區(qū)域可為幾百萬(wàn)堿基的一個(gè)或多個(gè)連續(xù)區(qū)段,或幾個(gè)較小的相鄰或不相鄰區(qū)域,例如來(lái)自一條或多條染色體的全部外顯子,或已知包含SNPs的位點(diǎn)。例如,所述雜交探針以及隨后源自探針的擴(kuò)增子可支持嵌合陣列,其設(shè)計(jì)為捕獲一條或多條完整染色體、一條或多條染色體的部分、所有外顯子、來(lái)自一條或多條完整染色體的所有外顯子、選擇的外顯子、一個(gè)或多個(gè)基因的內(nèi)含子和外顯子、基因調(diào)控區(qū)域等等。替代性地,為提高富集所需非獨(dú)特或難以捕獲的目標(biāo)的可能性,所述探針可針對(duì)與實(shí)際目標(biāo)序列相關(guān)(例如,在其相同片段上,但與其區(qū)分開)的序列,在此情況下可捕獲并富集既包含所需目標(biāo)又包含相關(guān)序列的基因組片段。所述相關(guān)序列可與所述目標(biāo)序列相鄰或間隔,但是本領(lǐng)域技術(shù)人員將了解,所述兩部分相互越接近,基因組片段同時(shí)包含兩部分的可能性越大。為降低脫靶分子交叉雜交的有限影響,由此增強(qiáng)所述富集的完整性,使用不同但相關(guān)的針對(duì)目標(biāo)區(qū)域的捕獲探針組以及源自探針的擴(kuò)增子進(jìn)行隨后幾輪捕獲。相關(guān)的探針為對(duì)應(yīng)基因組中相互接近區(qū)域的探針,其可與相同的基因組DNA片段雜交。在本發(fā)明的某些實(shí)施方案中,所述方法包含在變性和與溶液中的探針擴(kuò)增子雜交之前將接頭或連接分子連接到核酸分子一端或兩端的步驟。在本發(fā)明的某些實(shí)施方案中,所述方法進(jìn)一步包含使用至少一種弓I物擴(kuò)增所述接頭修飾的核酸分子,所述引物包含與所述接頭分子序列特異性雜交的序列。在本發(fā)明的某些實(shí)施方案中,在樣品變性和與溶液中的源自探針的擴(kuò)增子雜交之前,在片段化核酸分子一端或兩端提供雙鏈連接物。在此類實(shí)施方案中,目標(biāo)核酸分子在洗脫后擴(kuò)增以產(chǎn)生比初始樣品進(jìn)一步降低復(fù)雜度的擴(kuò)增產(chǎn)物集合。所述目標(biāo)核酸分子可使用,例如非特異性連接介導(dǎo)PCR(LM-PCR)通過(guò)多輪擴(kuò)增進(jìn)行擴(kuò)增,如果需要,產(chǎn)物可通過(guò)針對(duì)源自擴(kuò)增子的探針的一輪或多輪選擇進(jìn)一步富集。所述連接物或接頭例如可根據(jù)所述復(fù)雜度降低步驟之后的下游分析應(yīng)用的需要以任意大小和任意核酸序列提供。所述連接物可在約12到約100個(gè)堿基對(duì)范圍內(nèi),包括約18到100個(gè)堿基對(duì)的范圍,優(yōu)選地約20到24個(gè)堿基對(duì)的范圍。在本發(fā)明上下文中的接頭分子優(yōu)選地定義為平端雙鏈寡核苷酸。為了將接頭分子連接到雙鏈目標(biāo)分子上,優(yōu)選地所述目標(biāo)分子自身為平端。為達(dá)到此目標(biāo),所述雙鏈目標(biāo)分子例如在dNTPs存在下使用DNA聚合酶,例如T4-DNA聚合酶或Klenow聚合酶進(jìn)行填充反應(yīng),從而產(chǎn)生平端目標(biāo)分子。另外,在連接所述接頭之前使用T4多核苷酸羥激酶和本領(lǐng)域技術(shù)人員已知的方法(例如參見(jiàn)MolecularCloning:ALaboratoryManual,Eds.Sambrook等人,CoIdSpringHarbourPress;其全部?jī)?nèi)容通過(guò)弓|用結(jié)合到本文中)使片段末端磷酸化以在所述片段5’端加入磷酸基團(tuán)??筛鶕?jù)本領(lǐng)域已知的任何方法,例如通過(guò)T4-DNA連接酶反應(yīng)進(jìn)行隨后的所述接頭(例如約3-20堿基對(duì)的短雙鏈平端DNA寡核苷酸)與修飾的磷酸化目標(biāo)DNA的連接。所述接頭與片段化目標(biāo)核酸分子的連接可在下述步驟之前或之后進(jìn)行將包含片段化變性基因組核酸分子的樣品在雜交條件下與溶液中的多種寡核苷酸探針擴(kuò)增子接觸以捕獲目標(biāo)核酸分子。當(dāng)在雜交之后進(jìn)行連接時(shí),從所述擴(kuò)增子以單鏈形式釋放的所富集核酸首先重新復(fù)性,然后根據(jù)本領(lǐng)域已知的標(biāo)準(zhǔn)方法進(jìn)行引物延伸反應(yīng)和填充反應(yīng)。接頭分子的連接允許所捕獲分子的隨后擴(kuò)增步驟。無(wú)論在所述捕獲步驟之前或之后進(jìn)行連接,有多種替代性的實(shí)施方案。在一種實(shí)施方案中,連接一種類型的接頭分子(例如接頭分子A),其導(dǎo)致在片段兩端具有相同末端序列的一組片段。因此,在可能的隨后擴(kuò)增步驟中僅使用一種引物就足夠。在一種替代性的實(shí)施方案中,使用兩種類型的接頭分子A和B。這導(dǎo)致由3種不同類型組成的一組富集分子(i)在一端具有一種接頭(A)并在另一端具有另一種接頭(B)的片段,(ii)在兩端具有接頭A的片段,以及(iii)在兩端具有接頭B的片段。如果擴(kuò)增和測(cè)序例如使用454LifeSciencesCorporationGS20和GSFLX儀器進(jìn)行,產(chǎn)生具有接頭的富集分子非常有利(例如參見(jiàn)GS20LibraryPrepManual,Dec2006,WO2004/070007;其全部?jī)?nèi)容通過(guò)引用結(jié)合到本文中)。本發(fā)明致力于提供一種方法,其用于檢測(cè)相對(duì)于參考基因組樣品的測(cè)試基因組樣品編碼區(qū)變異,特別是相對(duì)包含片段化變性基因組核酸分子的參考基因組,所述方法包含在試驗(yàn)和參考基因組的上述步驟,進(jìn)一步比較所述序列與數(shù)據(jù)庫(kù)中的序列,特別是與所述參考基因組樣品的多態(tài)性數(shù)據(jù)庫(kù)中的序列比較,以從試驗(yàn)基因組樣品中鑒別出變體。因此本發(fā)明可用于搜索遺傳變體與突變,例如可導(dǎo)致人類疾病的單核苷酸多態(tài)性(SNP)、或SNPs組、基因組插入和/或缺失、易位等等。預(yù)期使用本文所述的基于溶液的雜交技術(shù)的捕獲和富集比基因組富集領(lǐng)域現(xiàn)有的其它方法更加靈活。在本發(fā)明的某些實(shí)施方案中,所洗脫的目標(biāo)核酸序列可進(jìn)行測(cè)序,與再測(cè)序或SNP判讀陣列雜交,且可進(jìn)一步分析所述序列或基因型。本發(fā)明的實(shí)施方案提供的基于溶液的富集允許本領(lǐng)域已知的靶向的基于陣列的、鳥槍、毛細(xì)管或其它測(cè)序方法。通常,隨機(jī)生成片段的鳥槍測(cè)序策略經(jīng)濟(jì)并易于結(jié)合到規(guī)劃中。本發(fā)明通過(guò)只提交來(lái)自一個(gè)或多個(gè)目標(biāo)基因組區(qū)域的片段進(jìn)行測(cè)序,加強(qiáng)了所述鳥槍方法的效率。本發(fā)明提供了將所述測(cè)序策略聚焦到特定基因組區(qū)域,例如用于醫(yī)學(xué)測(cè)序目的的個(gè)體染色體或外顯子的能力。因此實(shí)現(xiàn)了一種更集中的疾病發(fā)現(xiàn)方法。在本發(fā)明的實(shí)施方案中,本文所述的基于溶液的富集方法產(chǎn)生的洗脫目標(biāo)核酸序列隨后被測(cè)序。可使用多種不同方法進(jìn)行測(cè)序,例如通過(guò)使用通過(guò)合成技術(shù)測(cè)序。根據(jù)現(xiàn)有技術(shù),通過(guò)合成測(cè)序定義為在測(cè)序反應(yīng)中加入特定的脫氧核苷三磷酸時(shí)監(jiān)測(cè)副產(chǎn)物生成的任何測(cè)序方法(Hyman,1988,Anal.Biochem.174:423_436;Rhonaghi等人,1998,Science281:363-365)。通過(guò)合成反應(yīng)測(cè)序的一個(gè)最重要的實(shí)施方案為焦磷酸鹽測(cè)序方法。在這種情況下,通過(guò)導(dǎo)致化學(xué)冷光信號(hào)生成的酶級(jí)聯(lián)監(jiān)測(cè)加入核苷酸時(shí)焦磷酸鹽的生成。通過(guò)合成測(cè)序的一個(gè)實(shí)施例,454基因組測(cè)序系統(tǒng)(RocheAppliedSciencecat.No.04760085001)基于所述焦磷酸鹽測(cè)序技術(shù)。如產(chǎn)品文獻(xiàn)所述,對(duì)于在454GS20或454FLX儀器上的測(cè)序,平均基因組DNA片段大小分別在200或600bp范圍內(nèi)。通過(guò)合成反應(yīng)測(cè)序可替代性地基于一種終止子染色類型的測(cè)序反應(yīng)。在這種情況下,加入的染色脫氧核苷三磷酸(ddNTPs)組成塊包含一種可檢測(cè)的標(biāo)記,優(yōu)選地為一種防止新生DNA鏈進(jìn)一步延伸的熒光標(biāo)記。然后當(dāng)所述ddNTP組成塊加入至模板/引物延伸雜交體時(shí)所述標(biāo)記被去除并檢測(cè),例如通過(guò)使用包含3’-5’外切酶或校讀活性的DNA聚合酶。在GenomeSequencerworkflow(RocheAppliedScienceCatalogNo.04896548001)情況下,在第一步,使用乳液PCR進(jìn)行(克隆)擴(kuò)增。因此,以乳液PCR方法進(jìn)行擴(kuò)增步驟也在本發(fā)明的范圍內(nèi)。然后帶有所述克隆擴(kuò)增的目標(biāo)核酸的珠子根據(jù)制造商說(shuō)明書任意轉(zhuǎn)入picotiter板,并進(jìn)行焦磷酸鹽測(cè)序反應(yīng),以用于確定序列。在某些實(shí)施方案中,本發(fā)明包含一種試劑盒,其包含實(shí)施本發(fā)明的方法的試劑和材料。所述試劑盒可包括一種或多種微陣列基質(zhì),其上固定對(duì)來(lái)自一個(gè)或多個(gè)目標(biāo)遺傳基因座的一個(gè)或多個(gè)目標(biāo)核酸序列特異的(例如,對(duì)外顯子、內(nèi)含子、SNP序列等等特異的)多種雜交探針,確定設(shè)計(jì)為捕獲至少一條完整染色體全序列的嵌合陣列的多種探針,擴(kuò)增引物,用于進(jìn)行聚合酶鏈反應(yīng)方法的試劑(例如鹽溶液、聚合酶、dNTPs、擴(kuò)增緩沖液等等),用于進(jìn)行連接反應(yīng)的試劑(例如連接接頭、T4多聚核苷酸激酶、連接酶、緩沖液等等),包含結(jié)合伴侶部分的基質(zhì),管子、雜交液、洗滌液、洗脫液、磁體、以及管的支架。在某些實(shí)施方案中,本發(fā)明提供了一種系統(tǒng)(例如試劑盒),其用于實(shí)施本文公開的本發(fā)明的方法或部分方法。因此,本發(fā)明的試劑盒包含一種(第一種)雙鏈接頭分子,和溶液中的源自探針的多種擴(kuò)增子,其中所述源自探針的擴(kuò)增子從多個(gè)探針擴(kuò)增,所述多個(gè)探針限定來(lái)自多個(gè)遺傳基因座的多個(gè)外顯子、內(nèi)含子和/或調(diào)控序列的;和/或限定至少一個(gè)單獨(dú)遺傳基因座的金序列的溶液中的源自探針的多個(gè)擴(kuò)增子,所述基因座大小至少lOOkb,優(yōu)選地至少1Mb,或本文所述特定大??;和/或限定已知包含SNPs的位點(diǎn)的多個(gè)源自探針的擴(kuò)增子;和/或多個(gè)源自探針的擴(kuò)增子,其限定一個(gè)陣列,尤其是特別設(shè)計(jì)為捕獲至少一條完整染色體全序列的嵌合陣列。在某些實(shí)施方案中,試劑盒進(jìn)一步包含兩種不同的雙鏈接頭分子。在某些實(shí)施方案中,試劑盒包含一種或多種捕獲分子或化合物。例如,至少一種寡核苷酸探針,其包含允許固定于固體載體的修飾。例如,探針包含生物素部分,其用于固定于鏈霉親和素包被的順磁性顆粒。另一個(gè)實(shí)例為半抗原,例如地高辛,其使用半抗原識(shí)別抗體(例如抗地高辛)與固定于固體載體的探針結(jié)合。在某些實(shí)施方案中,試劑盒進(jìn)一步包含至少一種或多種化合物,其選自下列DNA聚合酶、T4多核苷酸激酶、T4DNA連接酶、一種或多種陣列雜交液、和/或一種或多種陣列洗滌液。在優(yōu)選的實(shí)施方案中,本發(fā)明的試劑盒包括3種洗滌液,所述洗滌液包含SSC、DTT、以及可選的SDS。例如,本發(fā)明的試劑盒包含洗滌緩沖液1(0.2%SSC,0.2%(v/v)SDS,0.ImMDTT)、洗滌緩沖液11(0.2%SSC,0.ImMDTT)、和/或洗滌緩沖液111(0.05%SSC,0.ImMDTT)。在某些實(shí)施方案中,本發(fā)明的系統(tǒng)進(jìn)一步包含洗脫液,例如水或者包含TRIS緩沖液和/或EDTA的溶液。下列實(shí)施例作為本發(fā)明的特定實(shí)施方案的進(jìn)一步非限制性說(shuō)明提供。實(shí)驗(yàn)提供下列實(shí)施例以證實(shí)并進(jìn)一步說(shuō)明本發(fā)明的某些優(yōu)選實(shí)施方案和方面,而不應(yīng)解釋為限制其范圍。當(dāng)提供數(shù)值的范圍時(shí),應(yīng)了解除非上下文明確另有所指,至下限單位的l/10(tothetenthoftheunitofthelowerlimit),在所述范圍上下限之間的每個(gè)中間數(shù)值也特定地公開。在任何所述數(shù)值或所述范圍內(nèi)的中間數(shù)值與所述范圍內(nèi)任何其它所述或其中的數(shù)值之間的每個(gè)較小范圍也包括在本發(fā)明中。這些較小范圍的上下限可獨(dú)立地包括或排除在所述范圍內(nèi),且任一、沒(méi)有、或兩個(gè)限值包括在所述較小范圍內(nèi)的每個(gè)范圍也包括在本發(fā)明中,以在所述范圍內(nèi)任何特別排除的限值為準(zhǔn)。當(dāng)所述范圍包括一個(gè)或兩個(gè)所述限值時(shí),排除任一或兩個(gè)所述包括限值的范圍也包括在本發(fā)明中。實(shí)施例1-在大基因組區(qū)域中發(fā)現(xiàn)新多態(tài)性和突變這個(gè)一般實(shí)施例描述了如何進(jìn)行允許在大基因組區(qū)域中快速有效發(fā)現(xiàn)新多態(tài)性和突變的選擇。在一輪或多輪雜交選擇中使用具有固定探針的微陣列和全基因組DNA目標(biāo),所選擇的序列使用LM-PCR擴(kuò)增(參見(jiàn)圖1和2)。a)基因組DNA和雙鏈連接物的制備使用超聲波處理使DNA片段化為平均大小500堿基對(duì)。建立修飾超聲波處理的DNA片段末端的反應(yīng)DNA片段41μ1T4DNA聚合酶20μ1T4DNA聚合酶反應(yīng)混合物20μ1/K10μ1所述反應(yīng)物在irC孵育30分鐘。然后所述反應(yīng)經(jīng)過(guò)酚/氯仿抽提過(guò)程,DNA通過(guò)乙醇沉淀回收。沉淀物溶解在10μ17jC中(以得到終濃度2μg/μ1)。通過(guò)混合下列寡核苷酸,兩種互補(bǔ)寡核苷酸復(fù)性產(chǎn)生雙鏈連接物寡核苷酸1(1μg/μ1)22.5μ1(5'-CTCGAGAATTCTGGATCCTC-3‘)(SEQIDNO1)寡核苷酸2(1μg/μ1)22.5μ1(5'-GAGGATCCAGAATTCTCGAGTT-3')(SEQIDNO2)IOx復(fù)性緩沖液5μ1水補(bǔ)足至50μ1所述反應(yīng)在65°C加熱10分鐘;然后在15-25°C冷卻2小時(shí)。2種互補(bǔ)寡核苷酸1和2的長(zhǎng)度在12到24核苷酸之間,且序列根據(jù)用戶所需的功能性選擇。然后所述雙鏈連接物通過(guò)柱色譜使用Si^phadexG-50離心柱純化。然后純化的連接物溶液通過(guò)凍干法濃縮至濃度為2μg/μ1。b)連接物與基因組DNA片段的連接建立下列將連接物連接到基因組DNA片段的反應(yīng)。所述反應(yīng)在14°C孵育過(guò)夜。來(lái)自步驟a)的復(fù)性連接物(20μg)10μ1來(lái)自步驟a)的基因組DNA(10μ1)5μ1T4DNA連接酶IOUIOx連接緩沖液2μ1水補(bǔ)足至20μ1用水將反應(yīng)體積調(diào)節(jié)到500μ1,連接的基因組DNA使用QIAquickPCR純化試劑盒純化。純化的DNA以濃度1μg/μ1儲(chǔ)存。c)雜交體的初步選擇與捕獲為制備與微陣列雜交的基因組DNA樣品,連接物修飾的基因組DNA(10yg)重懸于3.5μ1無(wú)核酸酶的水中,并與31.5μ1NimbleGen雜交緩沖液(RocheNimbleGen,Inc.,Madison,WI)、9μ1雜交添加劑(RocheNimbleGen,Inc)混合至終體積45μ1。所述樣品在95°C熱變性5分鐘并轉(zhuǎn)移至42°C熱溫區(qū)。為了在微陣列上捕獲目標(biāo)基因組DNA,樣品與如美國(guó)專利6,375,903(RocheNimbleGen,Inc)所述制造的NimbleGenCGH陳列雜交。使用如Singh-Gasson等人(1999,Nat.Biotech.17:974_978,其全部?jī)?nèi)容通過(guò)引用結(jié)合到本文中)所述的數(shù)字微鏡,通過(guò)光導(dǎo)寡核苷酸合成,利用無(wú)掩膜陣列合成器在所述微陣列上進(jìn)行捕獲寡核苷酸的無(wú)掩膜生產(chǎn)。使用無(wú)掩膜光刻生產(chǎn)的寡核苷酸陣列的基因表達(dá)分析如Nuwaysir等人(2002,GenomeRes.12:1749-1755,其全部?jī)?nèi)容通過(guò)引用結(jié)合到本文中)所述。雜交在MAUI雜交系統(tǒng)(BioMicroSystems,Inc.,SaltLakeCity,UT)上根據(jù)生產(chǎn)商說(shuō)明使用混合模式B在42°C進(jìn)行16小時(shí)。雜交之后,陣列用洗滌緩沖液I(0.2xSSC,0.2%(v/v)SDS,0.ImMDTT,NimbleGenSystems)洗滌兩次,共2.5分鐘。然后陣列用洗滌緩沖液II(0.2xSSC,0.ImMDTT,NimbleGenSystems)洗滌1分鐘,之后用洗滌緩沖液III(0.05xSSC,0.ImMDTT,RocheNimbleGeh,Inc.)洗滌15秒。為了洗脫與所述微陣列雜交的基因組DNA,所述陣列在95°C水中5分鐘孵育兩次。洗脫的DNA使用真空離心干燥。d)初步選擇DNA的擴(kuò)增初步選擇基因組DNA如下所述擴(kuò)增。在200μ1PCR管中建立10個(gè)單獨(dú)的重復(fù)擴(kuò)增反應(yīng)。僅需要一種寡核苷酸引物,因?yàn)槊糠N片段每個(gè)末端連接相同的連接物。反應(yīng)試劑模板初步選擇材料5μ1寡核苷酸1(200ng/μ1)1μ1(5'-CTCGAGAATTCTGGATCCTC-3‘)(SEQIDNO1)dNTPs(每種25mM)0.4μ1IOxPfuUltraHFDNA聚合酶反應(yīng)緩沖液5μ1PfuUltraHFDNA聚合酶2.5U水補(bǔ)足50μ1所述反應(yīng)根據(jù)下列程序進(jìn)行擴(kuò)增循環(huán)數(shù)變件復(fù)件聚合195"C2分鐘2-3195"C30秒55°C30秒72°C1分鐘反應(yīng)產(chǎn)物通過(guò)瓊脂糖凝膠電泳分析。擴(kuò)增產(chǎn)物使用QIAquickPCR純化試劑盒純化。匯集洗脫的樣品,擴(kuò)增的初步選擇DNA濃度通過(guò)分光光度法確定。集合中相當(dāng)于Iyg的DNA體積在超速真空濃縮器中濃縮至5μ1。留出1μ1(至少200ng)初步選擇材料用于與二次選擇產(chǎn)物比較。如果必要,通過(guò)另外幾輪陣列雜交和洗脫樣品擴(kuò)增進(jìn)行隨后幾輪富集。e)從微陣列釋放及在載體上固定的目標(biāo)寡核苷酸探針的制備探針在微陣列上合成,然后使用堿不穩(wěn)定的Fmoc(9-芴甲氧羰基)基團(tuán)釋放。所述探針用生物素標(biāo)記,然后使用已知方法共價(jià)或非共價(jià)連接固定于鏈霉親和素固體載體表面??蛇x地,在固定至所述固體載體之前,合成的探針使用LM_PCR、Phi29、或其它擴(kuò)增策略擴(kuò)增,以通過(guò)在其上插入促進(jìn)擴(kuò)增的序列增加合成探針的數(shù)量。此時(shí)所述材料可通過(guò)使用液相雜交和SA介導(dǎo)的雜交產(chǎn)物捕獲用于直接測(cè)序、基于陣列的再測(cè)序、基因型分型、或任何其它靶向所述基因組富集區(qū)域的遺傳分析。實(shí)施例2-靶向陣列的再測(cè)序根據(jù)標(biāo)準(zhǔn)RocheNimbleGen,Inc.微陣列制作規(guī)程合成一系列高密度寡核苷酸微陣列,其捕獲對(duì)應(yīng)選自在人類基因組中分布的660個(gè)基因(序列構(gòu)件HG17)(總序列約5Mb)的至少500堿基對(duì)的6,726單獨(dú)基因外顯子區(qū)域的短片段。所述陣列上的各個(gè)多于60堿基的重疊微陣列探針貫穿每個(gè)目標(biāo)基因組區(qū)域,對(duì)于所述基因組正鏈每10個(gè)堿基定位一個(gè)探針。通過(guò)設(shè)計(jì)從所述捕獲微陣列中排除高度重復(fù)基因組區(qū)域,以降低所述微陣列與基因組核酸分子非特異性結(jié)合的可能性。鑒別并排除高度重復(fù)基因組區(qū)域的策略與WindowMasker程序(Morgulis等人)的策略相似。通過(guò)比較所述探針中存在的所有15-聯(lián)體的頻率與人類基因組中所有可能的15-聯(lián)體探針的預(yù)先計(jì)算的頻率直方圖計(jì)算各探針的平均15-聯(lián)體頻率。當(dāng)平均15-聯(lián)體頻率升高時(shí),探針代表基因組重復(fù)區(qū)域的可能性也升高。只有平均15-聯(lián)體頻率低于100的探針包括在所述捕獲微陣列中。為了測(cè)試所述捕獲系統(tǒng)的可重復(fù)性,首先使用圖2所示的方法使用外顯子設(shè)計(jì)從人類細(xì)胞系(Burkitt,sLymphoma,NA04671(Coriell))中捕獲片段化基因組DNA。簡(jiǎn)單地說(shuō),基因組DNA(20μg)進(jìn)行全基因組擴(kuò)增(WGA;使用Qiagenservice(Hilden,Germany))20μg全基因組擴(kuò)增(WGA)產(chǎn)物用DNA聚合酶I的Klenow片段(NEB,BeverlyΜΑ)處理以產(chǎn)生平頭末端。所述平頭末端片段用超聲波處理以產(chǎn)生約500堿基對(duì)的片段,然后用多核苷酸激酶(NEB)進(jìn)行5,磷酸化。寡核苷酸連接物5‘-Pi-GAGGATCCAGAATTCTCGAGTT-3‘(SEQIDNO2)和5'-CTCGAGAATTCTGGATCCTC-3‘(SEQIDNO1)復(fù)性并連接到所述5,磷酸化的片段末端。所述以連接物為末端的片段變性以產(chǎn)生單鏈產(chǎn)物,其在雜交條件下在Ix雜交緩沖液(RocheNimbleGen,Inc.)存在下使用MAUI雜交工作站(RocheNimbleGen,Inc.)與所述捕獲微陣列劇烈混合在42°C接觸約65小時(shí)。未雜交的單鏈分子在嚴(yán)格的洗滌條件下使用嚴(yán)格的洗滌緩沖液(RocheNimbleGen,Inc.)洗滌3x5分鐘,從所述微陣列洗去,并使用洗滌緩沖液I、II、和III(RocheNimbleGen,Inc.)漂洗。在所述微陣列上捕獲的片段立即在95°C用2x250μ1水洗脫,干燥并重懸,用于使用與此前連接的連接物寡核苷酸互補(bǔ)的引物的LM-PCR擴(kuò)增。為定量所述外顯子區(qū)域的富集,選擇8個(gè)隨機(jī)區(qū)域進(jìn)行定量PCR(qPCR)。所述區(qū)域使用下列引物擴(kuò)增區(qū)域1F:5'-CTACCACGGCCCTTTCATAAAG-3‘(SEQIDNO3)R5'-AGGGAGCATTCCAGGAGAGAA-3‘(SEQIDNO4)區(qū)域2F:5'-GGCCAGGGCTGTGTACAGTT-3‘(SEQIDNO5)R5'-CCGTATAGAAGAGAAGACTCAATGGA-3‘(SEQIDNO6)區(qū)域3F:5'-TGCCCCACGGTAACAGATG-3‘(SEQIDNO7)R5'-CCACGCTGGTGATGAAGATG-3‘(SEQIDNO8)區(qū)域4F:5'-TGCAGGGCCTGGGTTCT-3‘(SEQIDNO9)R5'-GCGGAGGGAGAGCTCCTT-3‘(SEQIDNO10)區(qū)域-GTCTCTTTCTCTCTCTTGTCCAGTTTT-3‘(SEQIDNO11)R5'-CACTGTCTTCTCCCGGACATG-3‘(SEQIDNO12)區(qū)域6F:5'-AGCCAGAAGATGGAGGAAGCT-3‘(SEQIDNO:13)R5'-TTAAAGCGCTTGGCTTGGA-3‘(SEQIDNO14)區(qū)域7F:5'-TCTTTTGAGAAGGTATAGGTGTGGAA-3‘(SEQIDN0:15)R5'-CAGGCCCAGGCCACACT-3‘(SEQIDNO16)區(qū)域8F:5'-CGAGGCCTGCACAGTATGC-3‘(SEQIDN0:17)R5'-GCGGGCTCAGCTTCTTAGTG-3‘(SEQIDNO18)一輪微陣列捕獲之后,所富集的擴(kuò)增樣品和對(duì)照基因組DNA,所述對(duì)照基因組DNA被片段化、連接連接物、并LM-PCR擴(kuò)增,但未與捕獲陣列雜交,根據(jù)生產(chǎn)商規(guī)程使用ABI7300實(shí)時(shí)PCR系統(tǒng)(AppliedBiosystems,FosterCity,CA)測(cè)量SYBR綠色熒光進(jìn)行比較。對(duì)于3個(gè)重復(fù)外顯子捕獲產(chǎn)物達(dá)到平均378倍富集。理論最大富集水平為600倍(基因組中3,000Mb,總序列5Mb)。從所述捕獲微陣列洗脫的樣品連接到可用454測(cè)序兼容的連接物,在珠子上使用乳液PCR擴(kuò)增,并使用454FLX測(cè)序儀器(454,BranfordCT)測(cè)序。因?yàn)槊總€(gè)測(cè)序片段還包含微陣列洗脫后立即使用的20bpLM-PCR連接物,大部分454測(cè)序讀數(shù)包含所述連接物序列。所述3個(gè)重復(fù)在454FLX儀器上的DNA測(cè)序產(chǎn)生63Mb、115Mb和93Mb的總序列。在硅片上去除所述連接物序列后,使用BLAST分析(Altschul,等人,1990,J.Mol.Biol.215403-410;其全部?jī)?nèi)容通過(guò)引用結(jié)合到本文中)使用截止分?jǐn)?shù)e=10_48比較每個(gè)測(cè)序讀數(shù)與全部合適版本的人類基因組,調(diào)整以使唯一結(jié)果的數(shù)量最大化。舍棄未能唯一定位到基因組的讀數(shù)(在10到20%之間)。其它視為所捕獲序列。根據(jù)初始BLAST比較,唯一定位到所述目標(biāo)區(qū)域內(nèi)的區(qū)域的所捕獲序列視為測(cè)序結(jié)果。然后這些用于計(jì)算找到目標(biāo)區(qū)域的讀數(shù)的百分比,以及對(duì)于全部目標(biāo)區(qū)域的倍數(shù)測(cè)序范圍。使用SignalMap軟件(RocheNimbleGen,Inc.)展現(xiàn)數(shù)據(jù)。BLAST分析顯示91%、89%和91%的讀數(shù)分別唯一定位到基因組;75%、65%和77%來(lái)自目標(biāo)區(qū)域,96%、93%和95%的目標(biāo)序列包含至少一個(gè)序列讀數(shù)(表2,上3行)代表約400倍的平均富集。每個(gè)樣品的中點(diǎn)每堿基范圍分別為5、7和7倍。表1<table>tableseeoriginaldocumentpage31</column></row><table>實(shí)施例3-基因組富集捕獲的序列變異與再測(cè)序?yàn)榱舜_定在人類基因組中辨別變異的能力,來(lái)自人類HapMap集合中4種細(xì)胞類型的基因組DNA樣品(CEPH/NA11839、CHB/NA18573、JPT/NA18942、YRI/NA18861,Coriell)在前述實(shí)例的外顯予陣列上捕獲、洗脫并測(cè)序,如本文所公開,除了所述基因組DNA在捕獲之前沒(méi)有進(jìn)行全基因組擴(kuò)增。捕獲結(jié)果(如表1,4-7行所示)與上述結(jié)果相似,除了序列范圍比前述結(jié)果更一致,提示在WGA過(guò)程中引入了偏差。集合了來(lái)自所述4種HapMap樣品的序列,鑒別了突變并與每個(gè)樣品的HapMapSNP數(shù)據(jù)比較(表1和2)。在所述HapMap項(xiàng)目中做基因型分析的目標(biāo)區(qū)域中的位點(diǎn)總數(shù)對(duì)所述4種基因組中的每種為8103(CEU),8134(CHB),8134(JPT),8071(YRI)。其中,大多數(shù)(6000)位點(diǎn)與參考基因組等位基因同型。已知的變體等位基因(同型或異型)的數(shù)量列在表2的第2行。分析了這些位點(diǎn)的范圍并確定所述等位基因是否在所捕獲DNA中發(fā)現(xiàn)。表2<formula>formulaseeoriginaldocumentpage32</formula>假陰性率7.4%14.9%5.8%“20.9%每個(gè)已知變體HapMap等位基因至少2個(gè)讀數(shù)的嚴(yán)恪法具有乏1讀數(shù)的位2176(97.3%)2104~~(93.2%)""“2168(98.2%)2133(91.3%)點(diǎn)在52讀數(shù)中發(fā)現(xiàn)1907(85.3%)1569~(69.5%)1939(87.8%)469(62.9%)的變體等位基因假陰性率14.7%30.5%12.2%37.1%基于總體序列范圍,預(yù)期所述HapMap樣品中94%到79%的已知變體位點(diǎn)在至少一個(gè)序列讀數(shù)中鑒別出來(lái)。當(dāng)比較包含0、1或>1個(gè)已知變異的目標(biāo)范圍(分別為7.95、8.48和8.82倍數(shù)范圍)時(shí),沒(méi)有對(duì)于不在所述捕獲陣列上的等位基因的明顯偏差。分析大的相鄰基因組區(qū)域相當(dāng)令人關(guān)注。使用NA04671DNA測(cè)試靶向人BRCAl基因周圍的200kb-5Mb單個(gè)長(zhǎng)片段的捕獲微陣列系列。對(duì)于用于捕獲BRCAl基因的基因座的陣列系列,從人類基因組序列(構(gòu)件HG18)中選擇了BRCAl基因的基因座周圍5種增大的(200kb、500kb、lMb、2Mb、和5Mb)基因組區(qū)域?;蜃东@陣列的特性如表3所示。平均探針嵌合密度為一種探針起點(diǎn)與下一種探針起點(diǎn)之間的平均距離。表3BRCAl區(qū)域大小平均選擇探針嵌合密度(堿基對(duì))染色體17對(duì)應(yīng)物(HG18)200kbIbp38’390’417-38’590’417500kbIbp38,240,417-38,740,417<table>tableseeoriginaldocumentpage33</column></row><table>表4顯示所有捕獲目標(biāo)表現(xiàn)良好,在單次測(cè)序機(jī)器運(yùn)行中從5Mb捕獲區(qū)域產(chǎn)生高達(dá)140Mb的原始序列,產(chǎn)生18倍范圍。圖4b提供了對(duì)基因座特異性捕獲與測(cè)序的序列讀圖詳情。直線1描述了在人類染色體17上2000個(gè)堿基的染色體位置,直線2顯示了所述探針的位置,每10個(gè)堿基對(duì)間隔并沿Y軸錯(cuò)開,3處的圖表顯示了每堿基倍數(shù)序列范圍在0到100百分比之間,項(xiàng)目4描述了454測(cè)序讀數(shù)的最高BLAST分?jǐn)?shù)的讀圖。圖5顯示了累積每堿基序列范圍(圖5a)和BRCA12Mb區(qū)域的序列范圍直方圖(圖4c)。定位到目標(biāo)序列的讀數(shù)百分比隨目標(biāo)區(qū)域的大小升高。表4<table>tableseeoriginaldocumentpage33</column></row><table>這些數(shù)據(jù)說(shuō)明用于富集目標(biāo)序列的基于微陣列的直接選擇方法的能力。本發(fā)明人使用一種可編程的高密度陣列平臺(tái),其具有能夠容易地捕獲至少5Mb全序列的385,000個(gè)探針。除所述陣列的特異性之外,下游DNA測(cè)序步驟的高產(chǎn)量也相應(yīng)優(yōu)于使用非捕獲DNA來(lái)源的常規(guī)平均表現(xiàn)。這歸因于所述捕獲_富集過(guò)程,其提供了從重復(fù)和可混淆的其它雜質(zhì)中純化唯一序列的方法,例如所述454測(cè)序過(guò)程的首次乳液PCR步驟。實(shí)施例4-液相捕獲與再測(cè)序?qū)嵤├?和3的樣品使用如上合成的捕獲探針測(cè)試,然后從固體載體釋放,由此富集有利地在液相中進(jìn)行。修改標(biāo)準(zhǔn)微陣列設(shè)計(jì)(例如BRCA1200K嵌合陣列和前面實(shí)施例的人類外顯子捕獲陣列),其通過(guò)加入包含MlyI識(shí)別位點(diǎn)的末端15聯(lián)體引物序列,其促進(jìn)酶學(xué)方法的引物去除,同時(shí)保持捕獲寡核苷酸序列完整。通過(guò)在初始1~5連接物之后并在3’引物序列之前加入化學(xué)磷酸化試劑(GlenResearch)合成陣列。進(jìn)行了3個(gè)單獨(dú)的偶聯(lián)以使隨后捕獲探針從所述陣列的切除最大化。所述陣列固定的捕獲探針用30%氫氧化銨(NH4OH,Aldrich)處理。合成之后,陣列放置在潮濕的小室中,在環(huán)境室溫下向合成區(qū)域施用約700μ1NH4OH20分鐘以從所述陣列切除探針。由于反應(yīng)區(qū)域與周圍玻璃之間的疏水性差異,NH4OH大部分保留在合成區(qū)域范圍內(nèi)。所述溶液使用吸液管移除并保留。向所述表面施用另外700μ1新鮮ΝΗ40Η。所述過(guò)程共重復(fù)3次(共60分鐘和2.Iml)。然后切除的寡核苷酸捕獲探針在真空下在本領(lǐng)域已知的標(biāo)準(zhǔn)條件下離心干燥。切除的捕獲探針在標(biāo)準(zhǔn)條件下擴(kuò)增。干燥的探針重懸于30μ1去離子水(diH20)并等分為下述30個(gè)單獨(dú)PCR運(yùn)行反應(yīng)試劑IOx緩沖液2.5μ125mMdNTPs0.125μ120μM引物la1.25μ120μM引物lb(生物素標(biāo)記)1·25μ1HotStartTaq0.25μ1MgCl1μ1樣品Ιμ水17.625μ1總體積25μ1引物la5,-TGCCGGAGTCAGCGT-3,(SEQIDNO19)引物lb5,-生物素-AGTCAGAGTCGCCAC-3,(SEQIDNO20)所述反應(yīng)根據(jù)下述程序擴(kuò)增循環(huán)數(shù)變性復(fù)性聚合195°C15分鐘2-3195°C20秒48°C45秒72°C20秒使用QiaQuick核苷酸去除試劑盒(Qiagen)從反應(yīng)成分中純化PCR產(chǎn)物,干燥,并重懸于20μ1diH20o通過(guò)Nanodrop測(cè)定純化后的通常產(chǎn)量約為400-700ng/rxn。擴(kuò)增子可在3%瓊脂糖凝膠上檢查。根據(jù)捕獲探針的數(shù)量要求,如上所述進(jìn)行另外幾輪PCR產(chǎn)生每反應(yīng)約200ng樣品。擴(kuò)增子如上所述純化并鑒定。所述捕獲探針的最后一輪擴(kuò)增使用非對(duì)稱PCR進(jìn)行。方法如上所述,除了生物素標(biāo)記的引物濃度保持不變,非生物素標(biāo)記的引物濃度降低到0.OOlx原濃度。所述方法延長(zhǎng)到35循環(huán)以允許非指數(shù)擴(kuò)增。干燥擴(kuò)增子,重懸于20μ1DIH2O,并鑒定。基因組DNA樣品根據(jù)標(biāo)準(zhǔn)方法制備;20ygWGA帶有連接物的樣品與100μgCot-lDNA干燥,重懸于7.5μ1雜交緩沖液和3μ1甲酰胺。干燥2μg等分樣品的捕獲探針并重懸于4.5μIdiH2O0所述樣品溶液與所述捕獲探針溶液混合并在95°C孵育10分鐘。然后所述混合物轉(zhuǎn)移入PCR管并放入熱循環(huán)儀在42°C下雜交3天,以形成雙鏈體。雜交之后,所述雙鏈體與順磁性珠子(Dynal)結(jié)合。25μ1珠子在2xBff緩沖液(IOmMTrisHCiamMEDTA,2ΜNaCl)中洗滌3次,所述珠子重懸于所述雜交混合物。在42°C下不時(shí)輕輕混合,使結(jié)合超過(guò)45分鐘。結(jié)合的珠子使用磁體分離并使用40μ1洗滌緩沖液I短暫洗滌,在47°C下,在嚴(yán)格的洗滌緩沖液中孵育2x5分鐘,在環(huán)境室溫下使用洗滌緩沖液I洗滌約2分鐘,使用洗滌緩沖液II洗滌約1分鐘,以及使用洗滌緩沖液III洗滌約30秒。為洗脫所捕獲的片段,洗滌緩沖液III中的含有珠子的溶液轉(zhuǎn)移至1.5mlEppendorf管。使用磁體分離所述珠子。去除洗滌緩沖液并加入100μ195°CdiH20。所述溶液在95°C下孵育5分鐘,之后所述珠子與磁體結(jié)合并用95°CdiH20輕輕洗滌。然后去除所述洗滌液體并保留,用新鮮95°CdiH20替換。孵育和洗滌共重復(fù)3次(15分鐘,約300μ1洗脫物)。最后洗滌之后,包含洗脫物的Eppendorf管置于磁架上約5分鐘,以分離洗脫時(shí)吸入的任何珠子。所述溶液在新Eppendorf管中高熱干燥。洗脫的捕獲片段在標(biāo)準(zhǔn)LM-PCR之前重懸于263μ1diH20oLM-PCR之后,所捕獲的片段如上所述使用454FLX平臺(tái)進(jìn)行標(biāo)準(zhǔn)超深測(cè)序。替代性地,通過(guò)在預(yù)富集樣品上連接454測(cè)序接頭序列,可避免LM-PCR。在此情況下,洗脫的富集序列可直接加入乳液PCR用于超深測(cè)序。數(shù)據(jù)顯示83.8%的讀數(shù)定位到目標(biāo)區(qū)域,這與使用基于陣列的捕獲方法得到的結(jié)果類似且不能區(qū)別。實(shí)施例5-使用捕獲探針原位擴(kuò)增的液相捕獲通過(guò)加入包含MlyI(GAGTC(5/5))識(shí)別位點(diǎn)的末端15聯(lián)體引物序列修改標(biāo)準(zhǔn)微陣列設(shè)計(jì)。在所述引物序列中引入MlyI位點(diǎn)促進(jìn)引物的酶切除同時(shí)保持捕獲寡核苷酸完整。陣列通過(guò)本領(lǐng)域技術(shù)人員已知的標(biāo)準(zhǔn)無(wú)掩膜陣列合成方法合成。使用密封雜交室(GraceBio-Labs,Inc.,Bend,OR)與SlideGriddle接頭(Bio-RadLaboratories,Hercules,CA)在熱循環(huán)儀中在陣列上使用原位聚合酶鏈反應(yīng)(PCR)擴(kuò)增捕獲探針。PCR反應(yīng)成分(25ulIOX聚合酶緩沖液、1.25ul25mMdNTPs、20uM引物Ia和Ib各12.5ul、2.5ulHotstartTaq聚合酶、10ul25mMMgCl2和176.5uldiH20,總反應(yīng)體積250ul)加入到所述微陣列雜交室,PCR使用下列條件進(jìn)行;100°C30秒,97°C15分鐘,30個(gè)循環(huán)100°C30秒、47.5°C45秒、78°C30秒,然后冷卻所述反應(yīng)到1°C30秒,3.5°C保溫。引物序列為引物Ia5,-TGCCGGAGTCAGCGT-3,(SEQIDNO19)和引物Ib5,-生物素-AGTCAGAGTCGCCAC-3,(SEQIDNO:20),反映引入到所述探針序列的引物結(jié)合位點(diǎn)。聚合酶鏈反應(yīng)捕獲探針擴(kuò)增子使用QIAquick核苷酸去除試劑盒(Qiagen,Inc.,Valencia,CA)從所述反應(yīng)成分中純化,干燥并重懸于20μ1diH20。擴(kuò)增產(chǎn)量通過(guò)NanoDrop分光光度計(jì)(ThermoFisherScientific)測(cè)量大致共5μg。如果需要更多擴(kuò)增子數(shù)量,可根據(jù)上述方法進(jìn)行另外幾輪擴(kuò)增(例如使用上述方法和每次反應(yīng)IOOng樣品)所述捕獲探針的最后一輪擴(kuò)增使用非對(duì)稱PCR進(jìn)行;2.5ul10X聚合酶緩沖液、0.125ul25mMdNTPs、0.0125ul20uM引物la、1.25ul20uM引物lb、0.25ulHotstartTaq、Iul25mMMgCl2和18.86uldiH20(總反應(yīng)體積25ul)。擴(kuò)增子使用QiagenMinElute柱從反應(yīng)成分中純化并如上所述定量。根據(jù)標(biāo)準(zhǔn)方法制備基因組DNA樣品。20μg連接連接物的樣品與100μgCot-IDNA干燥并重懸于7.5μ1雜交緩沖液(RocheNimbleGen,Madison,WI)和3μ1甲酰胺。1μg等分樣品的捕獲探針干燥并重懸于4.5uldiH20。所述樣品溶液在95°C孵育10分鐘,以使DNA變性,并加入到所述捕獲探針溶液中。所述混合物轉(zhuǎn)移至PCR管并在42°C下熱循環(huán)儀中放置3天以形成雙鏈體。雜交之后,所述雙鏈體與鏈霉親和素包被的順磁性珠子(Dynal,Invitrogen,Carlsbad,CA)結(jié)合。100u1珠子用2xBW緩沖液(lOmMTrisHCl,ImMEDTA,2MNaCl)洗滌3次,并重懸于所述雜交雙鏈體混合物。在42°C下不時(shí)輕柔混合以允許所述珠子與雙鏈體結(jié)合超過(guò)45分鐘。結(jié)合的珠子使用磁體分離并使用洗滌緩沖液1(0.2XSSC,0.2%(v/v)SDS,0.ImMDTT)在室溫下短暫洗滌,然后使用200yl嚴(yán)格的洗滌緩沖液(0.1MMESpH6.65,0.1MNaCl,0.1%Tween20)洗滌2次(在47。C每次洗洚5分鐘),使用洗滌緩沖液I在室溫下再洗滌2分鐘,在室溫下使用洗滌緩沖液II(0.2XSSC,0.ImMDTT)洗滌1分鐘1次,最后使用洗滌緩沖液III(0.05XSSC,0.ImMDTT)在室溫下洗滌30秒。捕獲的片段從所述珠子洗脫。洗滌緩沖液III中的洗滌珠子溶液轉(zhuǎn)移至1.5mlEppendorf管,使用磁體分離所述珠子,去除洗滌緩沖液并用100u195°CdiH20替換,所述珠子從磁體上釋放。懸浮的珠子在95°C孵育5分鐘,之后所述珠子被捕獲并用95°CdiH20輕輕洗滌以洗脫所捕獲片段。去除洗脫物,再次洗滌所述珠子,共水洗3次;共10分鐘,匯集的洗脫物終體積約300yl。最后洗滌之后,殘留的磁珠通過(guò)再次磁性捕獲從匯集的洗脫物中去除,所述洗脫物轉(zhuǎn)移至新管.干燥所述溶液,所捕獲并洗脫的片段重懸于263ii1diH20用于隨后的LM-PCR。使用連接子序列5,-CTCGAGAATTCTGGATCC-3,(SEQIDN0:21)通過(guò)本領(lǐng)域技術(shù)人員已知的確定方法進(jìn)行連接。LM-PCR之后,所捕獲的片段使用454FLX平臺(tái)(454LifeSciences,Branford,CT)進(jìn)行超深測(cè)序。替代性地,通過(guò)在預(yù)富集樣品上連接454測(cè)序接頭序列可避免LM-PCR。在后者情況下,洗脫的富集序列可直接加入454FLX平臺(tái)工作流程的乳液PCR。圖7說(shuō)明了使用上述方法在溶液中捕獲的片段的再測(cè)序?qū)嶒?yàn)。使用PCR對(duì)照引物序列的qPCR對(duì)照顯示4個(gè)對(duì)照基因座的平均2600倍富集。qPCR對(duì)照引物序列qPCRgSel-0210FGACCCTCTTACCTTGGCATTCTC(SEQIDNO22)qPCRgSel-0210RGCTGGTACCCATTGGCAACT(SEQIDNO23)qPCRgSel-0271FGGAGTGAGTGGTTTTTCTTCATTTTT(SEQIDNO24)qPCRgSel_0271RGCGCCACAAAGAGACATTCA(SEQIDNO25)qPCRgSel-0266FAAGGCCATACTTGGGTGAACTG(SEQIDNO26)qPCRgSel-0266RGCTCTGATTGGTGGCTTCGT(SEQIDNO27)qPCRgSel_0283FTGCTTGCAGGTGTCTCTCAGA(SEQIDNO28)qPCRgSel-0283RCAGTGAGATATTTGGTACCATGGTGTA(SEQIDNO29)實(shí)際上,對(duì)于幾乎所有再測(cè)序的區(qū)域,預(yù)期的再測(cè)序與實(shí)際的再測(cè)序的一致性百分比約為100%。本申請(qǐng)中提及的所有出版物和專利通過(guò)引用結(jié)合到本文中。本發(fā)明所述方法和組合物的多種修改和變型對(duì)本領(lǐng)域技術(shù)人員是顯而易見(jiàn)的,并不背離本發(fā)明的范圍和精神。雖然本發(fā)明已結(jié)合特定的優(yōu)選實(shí)施方案描述,但應(yīng)了解所要求的本發(fā)明不應(yīng)不當(dāng)?shù)厥芟抻谒鎏囟ǖ膶?shí)施方案。實(shí)際上,對(duì)相關(guān)領(lǐng)域技術(shù)人員顯而易見(jiàn)的用于實(shí)施本發(fā)明的對(duì)所述36方法的多種修改明確包括在下列權(quán)利要求的范圍內(nèi)。參考文獻(xiàn)Altschul,S.F.等人(1990)T.Mol.Biol.215,403-410Hyman,Ε.D.(1988),Anal.Biochem.174,423-436Lovett等人(1991)PNASUSA,巡,9628—9632Morgulis,Α.等人(2006)Bioinformatics,!^,134-41Nuwaysir,Ε.F.,等人,(2002)GenomeRes.12,1749—1755Rhonaghi等人(1998),Science281,363-365Soares,等人(1994)PNAS,^!,9228-9232Singh-Gasson,S.,等人(1999)Nat.Biotechnol.17,974-978Wetmur(1991)CriticalReviewsinBiochemistryandMolecularBiology,26(34)227-59Wetmur等人(1966)J.Mol.Biol.,31,349-70“DirectselectionofcDNAswithlargegenomicDNAclones,"inMolecularCloning:ALaboratoryManual(eds.Sambrook,J.&Russell,D.W.)Chapter11Protocol4,pages11.98-11.106(ColdSpringHarborLaboratoryPress,ColdSpringHarbor,NewYork,USA,2001)EPO552290US2005/0282209US5,143,854US6,013,440US6,375,903WO2004/07000權(quán)利要求一種降低一組核酸分子遺傳復(fù)雜度的方法,所述方法包含下列步驟(a)在雜交條件下將所述片段化變性核酸分子組與多種不同的寡核苷酸探針接觸,然后將所述雜交分子復(fù)合物結(jié)合到固體載體,以捕獲與所述探針特異性雜交的核酸分子,其中所述片段化變性核酸分子平均大小約100到約1000個(gè)核苷酸殘基,優(yōu)選約250到約800個(gè)核苷酸殘基,最優(yōu)選約400到約600個(gè)核苷酸殘基,(b)從所捕獲分子中分離未結(jié)合和非特異性雜交的核酸;(c)從所述固體載體洗脫所捕獲分子,以及(d)可選地用所洗脫的捕獲分子至少再重復(fù)一輪步驟(a)到(c)。2.根據(jù)權(quán)利要求1所述的方法,其中所述多種不同的寡核苷酸探針各包含可結(jié)合于固體載體的化學(xué)基團(tuán)或連接物。3.根據(jù)權(quán)利要求1或2其中之一所述的方法,進(jìn)一步包含在步驟(a)之前或之后,將接頭分子連接到所述核酸分子的一端或兩端,優(yōu)選地為兩端的步驟。4.根據(jù)權(quán)利要求3所述的方法,進(jìn)一步包含用至少一種引物擴(kuò)增所述核酸分子的步驟,所述引物包含與所述接頭分子序列特異性雜交的序列。5.根據(jù)權(quán)利要求1-4之一所述的方法,其中所述核酸分子組為一組基因組DNA分子。6.根據(jù)權(quán)利要求1-5之一所述的方法,其中所述固體載體為核酸微陣列或者為一組珠子。7.一種用于分離和降低多種核酸序列復(fù)雜度的方法,其包含a)提供i)固體載體,其中所述固體載體包含可與目標(biāo)核酸序列雜交的雜交探針,ii)包含目標(biāo)核酸序列的核酸樣品,b)擴(kuò)增所述雜交探針,其中擴(kuò)增產(chǎn)物包含結(jié)合部分,且其中所述擴(kuò)增產(chǎn)物保持在溶液中,c)使所述核酸樣品與溶液中的所述擴(kuò)增產(chǎn)物雜交,使得允許所述擴(kuò)增產(chǎn)物與目標(biāo)核酸序列雜交,d)通過(guò)所述結(jié)合部分,從非特異性雜交核酸中分離所述目標(biāo)核酸/擴(kuò)增產(chǎn)物雜交復(fù)合物,以及e)從所述復(fù)合物洗脫所雜交的目標(biāo)核酸序列,由此分離和降低多種核酸序列的復(fù)雜度。8.根據(jù)權(quán)利要求7所述的方法,進(jìn)一步包含對(duì)所洗脫的目標(biāo)核酸序列測(cè)序。9.根據(jù)權(quán)利要求7或8中任一權(quán)利要求所述的方法,其中所述固體載體為微陣列載玻片。10.根據(jù)權(quán)利要求7-9中任一權(quán)利要求所述的方法,其中所述核酸樣品為片段化基因組DNA樣品。11.根據(jù)權(quán)利要求10所述的方法,其中所述片段化基因組DNA樣品在所述基因組DNA樣品片段的一端或兩端進(jìn)一步包含接頭分子。12.根據(jù)權(quán)利要求7-11中任一權(quán)利要求所述的方法,其中所述雜交探針在所述探針的一端或兩端進(jìn)一步包含引物結(jié)合序列。13.根據(jù)權(quán)利要求12所述的方法,其中所述引物結(jié)合序列當(dāng)在所述探針兩端存在時(shí)是相同的。14.根據(jù)權(quán)利要求13所述的方法,其中所述引物結(jié)合序列當(dāng)在所述探針兩端存在時(shí)是不同的。15.根據(jù)權(quán)利要求7-14中任一權(quán)利要求所述的方法,其中所述擴(kuò)增包含指數(shù)聚合酶鏈反應(yīng)。16.根據(jù)權(quán)利要求15所述的方法,其中所述擴(kuò)增進(jìn)一步包含非對(duì)稱聚合酶鏈反應(yīng)。17.根據(jù)權(quán)利要求7-16中任一權(quán)利要求所述的方法,其中所述結(jié)合部分為生物素結(jié)合部分。18.根據(jù)權(quán)利要求17所述的方法,其中所述分離包含使所述生物素結(jié)合部分結(jié)合到鏈霉親和素包被的基質(zhì)。19.根據(jù)權(quán)利要求18所述的方法,其中所述鏈霉親和素包被的基質(zhì)為鏈霉親和素包被的順磁顆粒。20.根據(jù)權(quán)利要求7-19中任一權(quán)利要求所述的方法,進(jìn)一步包含在洗脫之前洗滌所述分離的目標(biāo)核酸/擴(kuò)增產(chǎn)物雜交復(fù)合物。21.根據(jù)權(quán)利要求1-20中任一權(quán)利要求所述的方法,其中所述核酸分子組或所述多種核酸序列包含一種有機(jī)體的全基因組或至少一條染色體,或者至少一種核酸分子,其大小至少約200kb、至少約500kb、至少約1Mb、至少約2Mb、或至少約5Mkb,尤其是大小在約lOOkb到約5Mb之間、在約200kb到約5Mb之間、在約500kb到約5Mb之間、在約1Mb到約2Mb之間或在約2Mb到約5Mb之間。22.根據(jù)權(quán)利要求5、6或10-21中任一權(quán)利要求所述的方法,其中所述探針選自-限定來(lái)自多個(gè)遺傳基因座的多種外顯子、內(nèi)含子或調(diào)控序列的多種探針,-限定至少一個(gè)單獨(dú)遺傳基因座的全序列的多種探針,所述基因座大小至少lOOkb,優(yōu)選至少1Mb,或至少如權(quán)利要求3所述的大小之一,-限定已知包含單核苷酸多態(tài)性(SNPs)的位點(diǎn)的多種探針,或者_(dá)限定一種陣列的多種探針,尤其是設(shè)計(jì)為捕獲至少一條完整染色體的全序列的嵌合陣列。23.一種確定核酸、特別是基因組核酸的約至少一個(gè)區(qū)域的核酸序列信息的方法,所述方法包含下列步驟1).根據(jù)權(quán)利要求1-22之一所述的方法降低一組核酸分子的遺傳復(fù)雜度,以及2).確定所捕獲分子的核酸序列,特別是通過(guò)經(jīng)合成反應(yīng)進(jìn)行測(cè)序的方法。24.一種檢測(cè)相對(duì)于參考基因組的編碼區(qū)變異的方法,所述方法包含下列步驟1).根據(jù)權(quán)利要求1-22之一所述的方法降低一組核酸分子的遺傳復(fù)雜度,2).確定所捕獲分子的核酸序列,以及3).將所確定序列與所述參考基因組數(shù)據(jù)庫(kù)中序列對(duì)比,特別是與所述參考基因組多態(tài)性數(shù)據(jù)庫(kù)中序列對(duì)比,以從所述參考基因組中鑒別出變體。25.—種試劑盒,其包含-雙鏈接頭分子,以及-具有多種不同寡核苷酸探針的固體載體,其中所述探針選自-限定來(lái)自多個(gè)遺傳基因座的多種外顯子、內(nèi)含子或調(diào)控序列的多種探針,-限定至少一個(gè)單獨(dú)遺傳基因座的全序列的多種探針,所述基因座大小至少lOOkb,優(yōu)選至少1Mb,或至少如權(quán)利要求21所述的大小之一,-限定已知包含SNPs的位點(diǎn)的多種探針,或者-限定設(shè)計(jì)為捕獲至少一條完整染色體的全序列的嵌合陣列的多種探針。26.根據(jù)權(quán)利要求25所述的試劑盒,其中所述試劑盒包含兩種不同的雙鏈接頭分子。27.根據(jù)權(quán)利要求25或26所述的試劑盒,其中所述固體載體為多個(gè)珠子或者微陣列。28.根據(jù)權(quán)利要求25-27之一所述的試劑盒,進(jìn)一步包含至少一種或多種成分,其選自DNA聚合酶、T4多核苷酸激酶、T4DNA連接酶、陣列雜交液、陣列洗滌液,和/或陣列洗脫液。29.—種試劑盒,其包含a)包含結(jié)合部分的雜交探針序列,其中所述探針序列設(shè)計(jì)為與一種或多種目標(biāo)核酸序列雜交,并且其中所述探針序列在溶液中,b)包含用于結(jié)合所述結(jié)合部分的結(jié)合伴侶的基質(zhì),以及c)用于實(shí)現(xiàn)權(quán)利要求7所述方法的說(shuō)明。30.根據(jù)權(quán)利要求29所述的試劑盒,進(jìn)一步包含雜交液、洗滌液和洗脫液中的一種或多種。31.根據(jù)權(quán)利要求30所述的試劑盒,進(jìn)一步包含磁體。全文摘要本發(fā)明提供了創(chuàng)新的方法和系統(tǒng),其用于捕獲和富集目標(biāo)核酸,以降低目標(biāo)核酸,優(yōu)選基因組樣品的復(fù)雜度,用于進(jìn)一步分析,例如直接DNA測(cè)序、再測(cè)序、或SNP判讀。具體來(lái)說(shuō),本發(fā)明提供了以基于溶液的形式的目標(biāo)序列富集。文檔編號(hào)C12Q1/68GK101835907SQ200880113397公開日2010年9月15日申請(qǐng)日期2008年10月22日優(yōu)先權(quán)日2007年10月23日發(fā)明者M(jìn)·羅德希,T·阿爾伯特申請(qǐng)人:霍夫曼-拉羅奇有限公司