用于單分子全基因組分析的方法和相關(guān)裝置制造方法
【專利摘要】本發(fā)明提供了沿著至少一個(gè)大分子例如線性生物聚合物對(duì)特征進(jìn)行標(biāo)記和分析的方法,包括沿著單個(gè)解折疊的核酸分子對(duì)特定序列基序的分布和頻率或這些序列基序的化學(xué)或蛋白質(zhì)組修飾狀態(tài)進(jìn)行作圖的方法。本發(fā)明還提供了沿著這些被標(biāo)記的大分子來(lái)鑒定序列的特征模式或表觀遺傳變異以用于直接大規(guī)模并行單分子水平分析的方法。本發(fā)明還提供了適用于這樣被標(biāo)記的大分子的高通量分析的系統(tǒng)。
【專利說(shuō)明】用于單分子全基因組分析的方法和相關(guān)裝置
[0001]與相關(guān)申請(qǐng)的交叉參考
[0002]本申請(qǐng)要求2009年10月21日提交的序號(hào)61/253,639的美國(guó)申請(qǐng)“用于單分子全基因組分析的方法和相關(guān)裝置(Methods and Devices for Single Molecule WholeGenome Analysis)”的優(yōu)先權(quán),所述申請(qǐng)的全部?jī)?nèi)容在此引為參考。
【技術(shù)領(lǐng)域】
[0003]本發(fā)明涉及納米【技術(shù)領(lǐng)域】和單分子基因組分析領(lǐng)域。
【背景技術(shù)】
[0004]大分子例如DNA或RNA是由核苷酸組成的長(zhǎng)聚合物鏈,其線性序列與源生物體的基因組和后基因組基因表達(dá)信息直接相關(guān)。
[0005]序列區(qū)、基序和功能單元例如開(kāi)放閱讀框(0RF)、非翻譯區(qū)(UTR)、外顯子、內(nèi)含子、蛋白因子結(jié)合位點(diǎn)、表觀基因組位點(diǎn)例如CpG簇、microRNA位點(diǎn)、轉(zhuǎn)座子、逆轉(zhuǎn)座子以及其他結(jié)構(gòu)和功能單元的直接測(cè)序和作圖,在個(gè)體的基因組組成和“健康概況”的評(píng)估中是重要的。
[0006]在某些情況下,核苷酸序列的復(fù)雜重排,包括片段復(fù)制、插入、缺失、倒置和易位,在個(gè)體的生命期內(nèi)引起疾病狀態(tài),包括遺傳畸變或細(xì)胞惡變。在其他情況下,序列差異、拷貝數(shù)變異(CNV)和不同個(gè)體的遺傳構(gòu)成之間的其他差異,反映出群體遺傳構(gòu)成的多樣性和對(duì)環(huán)境刺激物和其他外部影響例如藥物治療的差異響應(yīng)。
[0007]其他進(jìn)行過(guò)程例如DNA甲基化、組蛋白修飾、染色質(zhì)折疊和改變DNA-DNA、DNA-RNA或DNA-蛋白質(zhì)相互作用的其他 變化,影響基因調(diào)控、表達(dá)以及最終細(xì)胞功能,引起疾病和癌癥。
[0008]基因組結(jié)構(gòu)變異(SV)甚至在健康個(gè)體中也廣泛分布。理解基因組序列信息對(duì)人類健康的重要性,已變得越來(lái)越明顯。
[0009]常規(guī)細(xì)胞遺傳學(xué)方法例如核型分析、FISH (熒光原位雜交),提供了對(duì)少至單個(gè)細(xì)胞中基因組組成的全面觀察。這些方法揭示了基因組的總體變化,例如非整倍性、數(shù)千和數(shù)百萬(wàn)堿基對(duì)的大片段的獲得、丟失或重排。然而,這些方法患于在檢測(cè)中到小序列基序或病變中靈敏度和分辨率相對(duì)低,以及繁瑣、速度有限和精確性不一致。
[0010]更近的用于檢測(cè)序列區(qū)、目標(biāo)序列基序和SV的方法例如aCGH(陣列比較基因組雜交)、fiberFISH或大規(guī)模末端配對(duì)測(cè)序,具有提高的分辨率和通量。這些更近的方法仍然是間接、繁瑣和不一致、昂貴的,并往往具有有限的固定分辨率,依賴于回到參比基因組進(jìn)行作圖以重新裝配來(lái)提供推斷的位置信息,或提供不能揭示平衡病變事件例如倒置或易位的比較性強(qiáng)度比率信息。
[0011]據(jù)認(rèn)為,功能單元和常見(jiàn)結(jié)構(gòu)變異涵蓋從數(shù)十堿基至數(shù)兆堿基以上的范圍。因此,沿著大的天然基因組分子,跨越從不到千堿基(即長(zhǎng)度小于約I千堿基)至數(shù)兆堿基的分辨率尺度揭示序列信息和SV的方法,在更多個(gè)體的測(cè)序和精細(xì)尺度作圖計(jì)劃中是非常合乎需要的,以便一覽以前未表征的基因組特征。
[0012]此外,生物系統(tǒng)、特別是多倍體生物例如人類的表型多態(tài)性或疾病狀態(tài),是從母系和父系遺傳的兩個(gè)單倍體基因組之間相互作用的結(jié)果。癌癥常常是二倍體染色體病變中雜合性丟失的結(jié)果。
[0013]當(dāng)前的測(cè)序分析方法多半基于源自于具有有限單倍型信息的平均化多倍體基因組材料的樣品。這大多是由于目前使用的現(xiàn)有前端樣品制備方法從非均質(zhì)細(xì)胞群體提取混合二倍體基因組材料、然后將它們破碎成隨機(jī)的較小碎片所造成的。然而,這種方法破壞了二倍體基因組的天然結(jié)構(gòu)信息。
[0014]最近開(kāi)發(fā)的第二代測(cè)序方法,盡管通量提高,但由于從短得多的測(cè)序讀出結(jié)果進(jìn)行裝配更加困難,因此使勾勒復(fù)雜基因組信息進(jìn)一步復(fù)雜化。
[0015]一般來(lái)說(shuō),短讀出結(jié)果更難在復(fù)雜基因組內(nèi)進(jìn)行唯一比對(duì),需要其他序列信息來(lái)破譯短的靶區(qū)的線性次序。需要25倍量級(jí)的測(cè)序覆蓋度才能達(dá)到在常規(guī)BAC和鳥槍法Sanger測(cè)序中需要8-10倍覆蓋率所達(dá)到的近似的裝配可信度(Wendl MC, Wilson RK,醫(yī)學(xué)DNA 測(cè)序中的覆蓋度情況(Aspects of coverage in medical DNA sequencing), BMC Bioinformatics 2008 May 16;9:239)。這對(duì)測(cè)序成本降低提出了進(jìn)一步挑戰(zhàn),并使將測(cè)序成本顯著降低至1000美元目標(biāo)標(biāo)桿以下的初始主要目標(biāo)受挫。
[0016]大的完整基因組分子的單分子水平分析,通過(guò)不使用克隆過(guò)程或擴(kuò)增對(duì)序列基序進(jìn)行原位精細(xì)作圖,提供了保留準(zhǔn)確的天然基因組結(jié)構(gòu)的可能性?;蚪M片段越大,基因組分析物中樣品群體的復(fù)雜性越低。在理想情形下,只需要對(duì)46個(gè)染色體片段進(jìn)行單分子水平分析,就能覆蓋整個(gè)二倍體人類基因組;從這樣的方法得到的序列在其本質(zhì)上具有完整的單倍型信息。
[0017]在實(shí)踐水平上,可以從細(xì)胞提取并保存兆堿基基因組片段用于直接分析。這將降低復(fù)雜算法和裝配的負(fù)擔(dān),并且也將處于原始背景中的基因組和/或表觀基因組信息共同與個(gè)體的細(xì)胞表型更直接地相關(guān)聯(lián)`。
[0018]大分子例如基因組DNA常為半柔性蠕蟲狀聚合鏈的形式。通常假定這些大分子在自由溶液中具有隨機(jī)卷曲構(gòu)型。對(duì)于生物溶液中未修飾的dsDNA來(lái)說(shuō),持續(xù)長(zhǎng)度(定義其剛性的參數(shù))典型約為50nm。
[0019]為了實(shí)現(xiàn)對(duì)沿著大的完整大分子的標(biāo)記特征進(jìn)行一致分離以便定量測(cè)量,一種方法是將這樣的聚合分子在平表面、化學(xué)或拓?fù)鋵W(xué)預(yù)定的表面模式、優(yōu)選為長(zhǎng)的納米軌道上或受限的微米/納米通道上拉伸成一致的線性形式。
[0020]延長(zhǎng)和拉伸長(zhǎng)基因組分子的方法,已通過(guò)使用外力例如光學(xué)鑷子、液體-空氣邊界對(duì)流(梳理)或流體力學(xué)層流得以演示。
[0021]分子的拉伸形式將或者在保持外力維持時(shí)暫時(shí)穩(wěn)定,或者通過(guò)附著到經(jīng)靜電或化學(xué)處理修飾被增強(qiáng)的表面上而更持久地穩(wěn)定。所演示的聚合大分子在微米/納米通道內(nèi)的拉伸,已通過(guò)物理熵限制被證實(shí)(參見(jiàn)Cao等,Applied Phys.Lett.2002a ;Cao等,AppliedPhys.Lett.2002b ;美國(guó)專利申請(qǐng)10/484,293號(hào);在此以其全文引為參考)。
[0022]已顯示,直徑在IOOnm左右的納米通道將長(zhǎng)達(dá)數(shù)十萬(wàn)堿基至兆數(shù)堿基的dsDNA基因組片段線性化(Tegenfeldt等,Proc.Natl.Acad.Sc1.2004)。使用納米流體學(xué)拉伸的半柔性靶分子可以懸浮在生物離子濃度和PH值范圍內(nèi)的緩沖條件下,因此更適于對(duì)這樣的分子執(zhí)行生物功能分析。這種拉伸形式也相對(duì)容易操作,例如在電場(chǎng)或壓力梯度下,以精確受控方式的從高速度到完全靜止?fàn)顟B(tài)的大范圍速度移動(dòng)帶電荷核酸分子。
[0023]此外,流體在納米尺度環(huán)境中流動(dòng)的性質(zhì),排除了否則可能打斷長(zhǎng)DNA分子的湍流和許多剪切力。這對(duì)于大分子線性分析、特別是在可以使用ss-DNA的測(cè)序應(yīng)用中,特別有價(jià)值。最終,有效讀取長(zhǎng)度可以只取決于能夠維持的最大完整片段。
[0024]除了基因組學(xué)之外,由于在人類疾病例如癌癥中的作用,表觀基因組學(xué)領(lǐng)域也已被認(rèn)為是非常重要的。隨著基因組學(xué)和表觀基因組學(xué)兩者知識(shí)的積累,主要的挑戰(zhàn)在于理解如何將基因組和表觀基因組因素直接或間接地與多態(tài)性或人類疾病和惡性腫瘤中的病理生理狀況相關(guān)聯(lián)。
[0025]全基因組分析的概念已經(jīng)從基因組測(cè)序、表觀遺傳學(xué)甲基化分析和功能基因組學(xué)領(lǐng)域主要分開(kāi)進(jìn)行研究的劃區(qū)方法,演化到更多面的整體方法。已經(jīng)以更系統(tǒng)的方式考慮了 DNA測(cè)序、結(jié)構(gòu)變異作圖、CpG島甲基化模式、組蛋白修飾、核小體重塑、microRNA功能和轉(zhuǎn)錄表達(dá)譜。然而,檢查細(xì)胞分子狀態(tài)的上述每個(gè)方面的技術(shù)通常是孤立、繁瑣和不相容的,使需要相干實(shí)驗(yàn)數(shù)據(jù)結(jié)果的系統(tǒng)生物學(xué)分析嚴(yán)重復(fù)雜化。
[0026]大的完整天然生物樣品的單分子水平分析能夠提供以真實(shí)有意義的整體分析方式研究靶樣品的基因組和表觀基因組信息的潛力,例如將序列結(jié)構(gòu)變異與異常甲基化模式、microRNA沉默位點(diǎn)和其他功能性分子信息相疊加。(參見(jiàn)例如PCT專利申請(qǐng)US2009/049244,在此以其全文引為參考)。它將在理解細(xì)胞的分子功能和個(gè)性化醫(yī)學(xué)中的疾病發(fā)生機(jī)理中,提供非常強(qiáng)有力的工具。
[0027]發(fā)明概述
[0028]一方面,本發(fā)明涉及沿著至少一個(gè)大分子例如線性生物聚合物進(jìn)行標(biāo)記并分析標(biāo)記特征的方法。在某些實(shí)施方案中,所述方法涉及沿著單個(gè)解折疊的核酸分子,根據(jù)特定序列基序的長(zhǎng)度和序列,對(duì)這些 序列基序的分布和頻率(即模式、主題)或這些序列基序的化學(xué)或蛋白質(zhì)組修飾狀態(tài)進(jìn)行作圖的方法。
[0029]還公開(kāi)了適用于對(duì)標(biāo)記的大分子進(jìn)行分揀和線性解折疊的流體芯片和系統(tǒng)。這些芯片和系統(tǒng)能夠以并行方式操作,用于光學(xué)和非光學(xué)信號(hào)分析。
[0030]本發(fā)明的另一方面是通過(guò)沿著DNA骨架對(duì)短序列基序的分布進(jìn)行作圖,以鑒定雙鏈DNA分子。這在序列基序之間提供了高空間分辨率。根據(jù)該高分辨率圖譜,在每個(gè)序列特異性基序位點(diǎn)處開(kāi)始測(cè)序反應(yīng)并循環(huán)一段時(shí)間以獲得已知空間位置處的多堿基信息,其可以被稱為STS或時(shí)空測(cè)序。本發(fā)明還涉及這樣的標(biāo)記方法和特征的使用。
[0031]在一個(gè)實(shí)施方案中,雙鏈DNA上標(biāo)記的特定序列基序通過(guò)在DNA單鏈上產(chǎn)生切口并形成間隙(這可以通過(guò)酶來(lái)實(shí)現(xiàn))來(lái)產(chǎn)生。然后使用者可以使用聚合酶進(jìn)行鏈延伸,同時(shí)產(chǎn)生被稱為“瓣片(flaps)”的“被剝離的”短序列片段。這些被剝離的單鏈瓣片產(chǎn)生了可用于與標(biāo)記的探針進(jìn)行序列特異性雜交的區(qū)域。在某些實(shí)施方案中,堿基(包括標(biāo)記的堿基或標(biāo)記的探針)與被剝離的瓣片結(jié)合。在其他實(shí)施方案中,堿基(或探針)結(jié)合以填充形成瓣片的鏈中留下的“間隙”的至少一部分。在這些實(shí)施方案中,填充間隙的堿基或探針的存在起到在間隙中進(jìn)行填充的作用,使得瓣片保持“游離”并且不返回到其原始位置。標(biāo)記的堿基或探針可以結(jié)合于瓣片和由瓣片的形成所留下的間隙。
[0032]適合的標(biāo)記物包括熒光染料分子例如熒光素等。熒光團(tuán)的非窮舉的列舉可以在WWW.abeam. com處獲得,并且適合的突光團(tuán)對(duì)于本【技術(shù)領(lǐng)域】的專業(yè)人員也是公知的。標(biāo)記物還可以包括磁性體、放射活性體、量子點(diǎn)等。
[0033]當(dāng)標(biāo)記的基因組DNA在承載表面上或納米通道陣列內(nèi)線性伸展時(shí),來(lái)自于與序列特異性瓣片雜交的裝飾探針的信號(hào)之間的空間距離可以被定量測(cè)量(以一致的方式)。然后可以將該信息用于產(chǎn)生反映出該區(qū)域中特定基因組序列信息的獨(dú)特的“條形碼”特征模式。靶分子上切開(kāi)的間隙適合由特定酶產(chǎn)生,所述酶包括但不限于Nb.BbvC1、Nb.BsmI,Nb.BsrD1、Nb.Bts1、Nt.Alw1、Nt.BbvC1、Nt.BspQ1、Nt.BstNB1、Nt.CviPII 及其組合。根據(jù)該圖譜可以執(zhí)行測(cè)序。
[0034]作為一個(gè)非限制性實(shí)例,可以如下形成條形碼。一種已知的疾病狀態(tài)的特征為獨(dú)特的核苷酸序列TTT- (10個(gè)堿基)-CCC- (5個(gè)堿基)-AAA。形成三種探針:AAA_紅色染料,GGG-藍(lán)色染料和TTT-綠色染料。然后將探針與帶有瓣片的dsDNA樣品在促進(jìn)探針結(jié)合的條件下相接觸,其中所述瓣片是在dsDNA的已知含有上述獨(dú)特核苷酸序列的區(qū)域中形成的。然后將DNA樣品拉伸,并由使用者測(cè)定樣品中探針的存在。如果使用者檢測(cè)到三種染料存在于樣品中,并且彼此具有適合的次序并適合地隔開(kāi)(即染料次序?yàn)榧t-藍(lán)-綠,并且紅色與藍(lán)色染料隔開(kāi)的距離對(duì)應(yīng)于10個(gè)堿基,藍(lán)色與綠色染料隔開(kāi)的距離對(duì)應(yīng)于約5個(gè)堿基),使用者將獲得提示所研究的dsDNA樣品可能具有所述已知疾病的信息。
[0035]上面列出的探針僅僅是說(shuō)明性的。探針可以具有1-10個(gè)堿基、1-100個(gè)堿基、
1-1000個(gè)堿基或甚至更大的長(zhǎng)度。探針可以帶有單個(gè)標(biāo)簽或標(biāo)記物或者多個(gè)標(biāo)簽或標(biāo)記物。作為一個(gè)實(shí)例,探針可以被構(gòu)建成帶有兩個(gè)(或以上)熒光團(tuán)、或熒光團(tuán)與放射活性體。探針可以包括通過(guò)柔性或剛性間隔區(qū)相連的兩個(gè)或以上結(jié)合區(qū)(例如AAA和CGG)。
[0036]本本發(fā)明也可用于檢測(cè)特定序列或基因的拷貝。在這些實(shí)施方案中,使用者可以如本文中別處所述處理DNA以形成瓣片并將探針與該DNA相接觸。然后可以利用特定DNA序列所獨(dú)有的兩個(gè)或以上“條形碼”的存在,來(lái)表明個(gè)體可能具有特定基因或特定序列的多個(gè)拷貝。這可用于診斷或預(yù)測(cè)本身以多個(gè)基因拷貝為特征的病癥、例如各種多基因病的存在。使用者也可以利用兩個(gè)或以上條形碼之間的距離(所述距離可以通過(guò)拉伸樣品來(lái)確定)來(lái)協(xié)助dsDNA樣品的表征。例如,使用者可以在已知(或懷疑)含有對(duì)特定疾病的表達(dá)關(guān)鍵的區(qū)域的dsDNA樣品上,在區(qū)域的開(kāi)始和結(jié)束處利用探針產(chǎn)生條形碼。
[0037]如果疾病不存在,條形碼之間的距離可能是第一距離D0。另一方面,如果疾病存在,兩個(gè)條形碼之間的距離可能被發(fā)現(xiàn)是更長(zhǎng)的距離D1。在這種情況下,使用者將獲得提示目標(biāo)序列(例如基因)在提供dsDNA樣品的對(duì)象中存在的信息。在其他實(shí)施方案中,“正?!眰€(gè)體可能具有使得針對(duì)DNA特定區(qū)域的開(kāi)始和結(jié)束處的條形碼之間的“正常”距離為Dl的基因。然而,如果個(gè)體缺少該基因,兩個(gè)條形碼之間的距離可能是更短的距離D0,在這種情況下,使用者將獲得提示dsDNA供體缺少目標(biāo)堿基序列(或基因)的信息。
[0038]這種信息進(jìn)而可以用于為對(duì)象或患者設(shè)計(jì)保護(hù)性(或治療性)方案。作為一個(gè)實(shí)例,如果使用者確定對(duì)象具有與苯丙酮酸尿癥一致的遺傳概況,使用者可以建議對(duì)象避免攝食含苯丙氨酸的物質(zhì)。
[0039]本發(fā)明還用于檢測(cè)dsDNA樣品中多個(gè)不同堿基序列的存在。這可以通過(guò)使用探針以便為不同序列產(chǎn)生不同條形碼來(lái)實(shí)現(xiàn)。例如,使用者可能已知疾病I的特征為以距離Dl彼此相隔的堿基序列Sla和Sib。疾病2的特征為以距離D2彼此相隔的堿基序列S2a和S2b。然后使用者可以產(chǎn)生用于疾病I的條形碼(使用Sla和Slb特異性或指示性探針)和用于疾病2的條形碼(使用S2a和S2b特異性或指示性探針)。通過(guò)將適合的探針施加到經(jīng)瓣片處理過(guò)的dsDNA樣品并通過(guò)檢查樣品中兩種條形碼的存在,使用者能夠確定dsDNA樣品的供體是否被定性為患有疾病1、疾病2或兩者。通過(guò)這種方式,使用者可以測(cè)定單一樣品的多種病癥。
[0040]用于特定分析的探針在標(biāo)記物、結(jié)合特異性或兩方面可以彼此相同或不同。例如,使用者可以使用帶有紅色熒光染料并與序列AAA結(jié)合的探針和與GTTC序列結(jié)合并帶有綠色熒光染料的探針來(lái)執(zhí)行分析。使用者可以同時(shí)使用帶有磁性或放射活性體的探針和帶有熒光團(tuán)的探針。通過(guò)這種方式,使用者可以同時(shí)測(cè)定多種探針。
[0041]使用者也可以同時(shí)測(cè)定多個(gè)樣品以檢測(cè)單一病癥。例如,使用者可以通過(guò)測(cè)定來(lái)自于多個(gè)個(gè)體的多個(gè)dsDNA樣品中特定條形碼的存在(或缺少),并行地測(cè)定那些樣品以檢測(cè)特定病癥。因此使用者也可以同時(shí)測(cè)定多個(gè)dsDNA樣品以檢測(cè)多種病癥,允許對(duì)多個(gè)個(gè)體進(jìn)行高通量篩查。在一個(gè)這樣的實(shí)施方案中,使用者使用納米通道組或陣列,其中每個(gè)納米通道被用于拉伸來(lái)自于不同對(duì)象的處理過(guò)的(例如帶有瓣片的)dsDNA。然后對(duì)各個(gè)樣品進(jìn)行探查(例如通過(guò)施加輻射以激發(fā)樣品中可能存在的熒光探針),以檢測(cè)表明特定序列的存在或條形碼存在的各個(gè)探針的存在。
[0042]本發(fā)明也可用于產(chǎn)生遺傳概況。在這樣的實(shí)施方案中,使用者可以從以特定病癥(例如疾病或失調(diào))為特征的對(duì)象獲取dsDNA樣品。然后使用者可以在dsDNA中一個(gè)或多個(gè)位置處形成瓣片,然后將標(biāo)記的探針結(jié)合于樣品中生成的瓣片或間隙。然后使用者可以探查對(duì)象的dsDNA以檢測(cè)這些探針的存在和位置,這進(jìn)而產(chǎn)生了關(guān)于對(duì)象的dsDNA內(nèi)容的信息(例如具有ACACAC序列的探針與對(duì)象dsDNA的結(jié)合,表明dsDNA在該位置處具有TGTGTG序列)。
[0043]然后使用者可以構(gòu)建對(duì)象DNA的圖譜,所述圖譜由關(guān)于特定序列段的信息(由與那些序列互補(bǔ)的探針的結(jié)合來(lái)顯示)和那些序列的位置(由那些結(jié)合的探針的位置來(lái)顯示)構(gòu)成。因此,在非限制性實(shí)例中,使用者能夠確定被鑒定為患有遺傳病X的個(gè)體所擁有的dsDNA具有在該dsDNA樣品的堿基位置10,321處開(kāi)始的序列SI和在該dsDNA樣品的堿基位置11,555處開(kāi)始的序列S2。
[0044]通過(guò)處理該信息作為存在遺傳病X的指示,使用者然后可以將來(lái)自于另一個(gè)對(duì)象的dsDNA與來(lái)自于第一個(gè)對(duì)象的信息進(jìn)行比較。如果第二個(gè)對(duì)象分別在堿基位置10,321和11,555處顯示出序列SI和S2,那么第二個(gè)對(duì)象可能也具有遺傳病X。通過(guò)這種方式,使用者能夠根據(jù)各種序列特異性探針在從被鑒定為具有各種遺傳病癥的個(gè)體獲得的dsDNA上的結(jié)合位置,產(chǎn)生他們自己的信息“文庫(kù)”。然后可以按照本發(fā)明對(duì)來(lái)自于新對(duì)象的dsDNA進(jìn)行處理(例如形成瓣片然后與標(biāo)記的探針結(jié)合),以確定新對(duì)象是否可能具有(即攜帶)已經(jīng)在使用者的結(jié)合信息文庫(kù)中分類的一種或多種疾病。
[0045]在另一個(gè)實(shí)施方案中,通過(guò)制造帶切口的單鏈間隙然后在其中摻入標(biāo)記的核苷酸,來(lái)產(chǎn)生雙鏈DNA的標(biāo)記的(例如帶有共價(jià)標(biāo)簽的)特異性序列基序。對(duì)這種特異性標(biāo)記的序列基序沿著單個(gè)解折疊核酸分子的物理分布和頻率進(jìn)行作圖。在某些實(shí)施方案中,在這以后可以進(jìn)行單喊基測(cè)序以獲得關(guān)于樣品的逐喊基序列"[目息。
[0046]在另一個(gè)實(shí)施方案中,單個(gè)的標(biāo)記解折疊核酸分子被線性伸展。這通過(guò)在納米尺度通道、拓?fù)浼{米尺度溝槽或表面性質(zhì)限定的納米尺度軌道內(nèi)對(duì)這種拉伸的單分子進(jìn)行物理限制來(lái)實(shí)現(xiàn)。作為一個(gè)實(shí)例,美國(guó)專利申請(qǐng)10/484,293中的裝置和方法被認(rèn)為適合于執(zhí)行線性伸展。光學(xué)鑷子和剪切-應(yīng)力施加方法(例如美國(guó)專利6,696,022,在此引為參考)也被認(rèn)為適合于執(zhí)行這種拉伸。
[0047]在另一個(gè)實(shí)施方案中,在基材上制造極小的納米流體結(jié)構(gòu)例如納米通道、柱、溝等,并將其用作大規(guī)模并行陣列,用于以單分子分辨率操作和分析生物分子例如DNA和蛋白質(zhì)。適合地,通道橫截面積大小與被拉伸的生物分子的橫截面積相似,即在約I至約IO6平方納米左右,以提供可以被單個(gè)分離并可以同時(shí)分析數(shù)十、數(shù)百、數(shù)千或甚至數(shù)百萬(wàn)個(gè)的拉伸的(例如以至少部分線性或部分解折疊為特征的)生物分子。
[0048]理想地(但不是必需的),通道的長(zhǎng)度長(zhǎng)得足以容納大分子長(zhǎng)度的相當(dāng)部分或甚至相當(dāng)數(shù)量的大分子,其范圍從具有光學(xué)放大倍數(shù)的典型CCDA相機(jī)的單一視野的長(zhǎng)度(約100微米)直到長(zhǎng)至整個(gè)染色體,其可以大致10厘米長(zhǎng)。最適長(zhǎng)度取決于使用者的需要。
[0049]本發(fā)明還涉及這些標(biāo)記方法和特征的應(yīng)用。瓣片和單鏈DNA間隙可用于許多領(lǐng)域中,包括但不限于基因組學(xué)、遺傳學(xué)、臨床診斷學(xué)。
[0050]在一個(gè)實(shí)施方案中,將帶標(biāo)簽的探針(例如具有熒光團(tuán))雜交到沿著長(zhǎng)的雙鏈基因組DNA分子的瓣片或單鏈DNA間隙上,然后可以將標(biāo)記的DNA分子在熒光顯微鏡下成像,以觀察標(biāo)記的瓣片或單鏈DNA間隙的空間條形碼(即與核苷酸間隔、測(cè)序或兩者相關(guān)的特征)。條形碼進(jìn)而可用于全基因組作圖,因?yàn)榭梢詫?lái)自于各個(gè)條形碼的特征拼合在一起,提供關(guān)于樣品大分子特定區(qū)域的附加信息。作為一個(gè)非限制性實(shí)例,使用者可以將DNA樣品打碎成子區(qū)段,然后測(cè)定每個(gè)子區(qū)段中特定堿基序列的存在(或缺少)以及這些序列以特定次序的存在。在對(duì)子區(qū)段進(jìn)行測(cè)定 后,使用者可以將從各個(gè)子區(qū)段收集的信息匯集成整個(gè)原始樣品的總體信息“圖譜”。
[0051]作為一個(gè)非限制性實(shí)例,使用者可以獲取5kb樣品并將樣品切斷成5個(gè)Ikb子區(qū)段。然后使用者可以在這些子區(qū)段的每個(gè)中形成瓣片,并測(cè)定每個(gè)子區(qū)段以檢測(cè)已知(或懷疑)以該子區(qū)段中存在的堿基序列為特征的一種或多種遺傳病癥。例如,可以測(cè)定子區(qū)段I以檢測(cè)心臟病,其中特征性序列或序列組已知出現(xiàn)在0-1000堿基位置處,并且可以測(cè)定子區(qū)段2以檢測(cè)糖尿病,其中特征性序列或序列組已知出現(xiàn)在1001-1999位置處。然后使用者可以將該信息匯集,以獲得對(duì)個(gè)體疾病狀態(tài)的綜合評(píng)估。
[0052]在另一個(gè)實(shí)施方案中,將不同基因組區(qū)域的瓣片或單鏈DNA用產(chǎn)不同顏色(或發(fā)出不同信號(hào))的探針標(biāo)記,以鑒定兩個(gè)區(qū)域的關(guān)系。在BCR-ABL融合的一個(gè)這樣的實(shí)例中,兩種或以上顏色存在于相同位置,表明了結(jié)構(gòu)變異,例如易位。這顯示在圖5中,所述圖顯示了 BCR和ABL染色體區(qū)段的部分的易位。
[0053]在另一個(gè)實(shí)施方案中,可以將標(biāo)記的瓣片或單鏈DNA間隙的一個(gè)或多個(gè)空間條形碼模式(其可以包括含有單一顏色或多種顏色的模式)用于探查多個(gè)區(qū)域,以用于多路疾病診斷。作為一個(gè)非限制性實(shí)例,使用者可以探查多個(gè)區(qū)域以檢查多個(gè)易位。
[0054]這由例如但不限于圖6來(lái)顯示。該圖描繪了多個(gè)探針與DNA樣品上多個(gè)位置的結(jié)合,能夠讓使用者測(cè)定樣品中多種疾病的存在,所述測(cè)定可以同時(shí)進(jìn)行。正如在該非限制性的圖中所示,BCR-ABL區(qū)域中顯露的特定疾病(疾病1),當(dāng)在該區(qū)域中形成特定瓣片然后通過(guò)適合標(biāo)記物進(jìn)行標(biāo)記時(shí),呈現(xiàn)出獨(dú)特的條形碼或特征。同樣地,疾病2當(dāng)在該區(qū)域中形成特定瓣片并標(biāo)記時(shí)也呈現(xiàn)出獨(dú)特的條形碼或特征。因此使用者能夠同時(shí)測(cè)定兩種或以上疾病,能夠在給定對(duì)象中快速檢測(cè)多種疾病或其他狀態(tài)。通過(guò)形成瓣片,使用者獲得了進(jìn)入DNA樣品結(jié)構(gòu)的進(jìn)入點(diǎn),所述進(jìn)入點(diǎn)隨后可用于探針的序列特異性結(jié)合。
[0055]本發(fā)明還可用于執(zhí)行DNA樣品的測(cè)序。在這樣的實(shí)施方案中,使用者可以在DNA中形成瓣片(提供進(jìn)入DNA結(jié)構(gòu)的進(jìn)入點(diǎn))。然后使用者可以一次一個(gè)地導(dǎo)入單堿基標(biāo)記的探針,以探測(cè)DNA樣品的逐堿基序列。例如,使用者可以在DNA中導(dǎo)入切口,然后導(dǎo)入用于A的紅色探針。如果隨后觀察到紅色標(biāo)記物,使用者將獲得A存在于切口位點(diǎn)處的信息。如果沒(méi)有觀察到紅色標(biāo)記物,使用者可以導(dǎo)入特異性用于不同核苷酸的第二種標(biāo)記的探針。
[0056]在另一個(gè)實(shí)施方案中,使用者也可以將DNA樣品斷裂成片段,沿著片段的長(zhǎng)度形成切口 /瓣片,然后在片段上的切口 /瓣片處導(dǎo)入堿基-或序列-特異性的探針。然后可以將從每個(gè)片段收集到的獲得的信息反向匯集在一起,產(chǎn)生原始的全長(zhǎng)DNA樣品的序列圖譜。切口 /瓣片可以在DNA樣品上的特定位置或隨機(jī)位置處形成。例如,使用者可以在20個(gè)堿基的片段的第I堿基位置和第11堿基位置處形成10個(gè)堿基的瓣片/間隙。然后使用者可以向片段導(dǎo)入各種獨(dú)一標(biāo)記的和獨(dú)一特異性的探針(包括長(zhǎng)度最多10個(gè)堿基的探針)。然后使用者可以通過(guò)確定何種探針結(jié)合于片段(基于從結(jié)合的探針檢測(cè)到的特定信號(hào)),來(lái)獲得關(guān)于片段的序列信息。
[0057]可以將探針設(shè)計(jì)成與特定染色體上的瓣片或單鏈DNA間隙結(jié)合。存在的染色體拷貝過(guò)多或過(guò)少可用于診斷非整倍性。例如,探針可以被設(shè)計(jì)成表明特定基因或甚至染色體存在的標(biāo)記序列。然后對(duì)象中多個(gè)探針(或與探針的存在相關(guān)的多個(gè)條形碼)的存在,可用于顯示對(duì)象具有所研究的基因或染色體的多個(gè)拷貝。
[0058]在另一個(gè)實(shí)施方案中,本發(fā)明鑒定病原體基因組。適合在瓣片產(chǎn)生過(guò)程中病原體基因組斷成預(yù)測(cè)的片段,然后使用探針(例如所謂的通用探針)探查瓣片的保守序列。然后將由此獲得的條形碼模式與預(yù)測(cè)的參比圖譜進(jìn)行比較,使得使用者能夠確定所分析的基因組的結(jié)構(gòu)。這被稱為雙層DNA條形碼編碼,其考慮到了 DNA片段尺寸和具有不同尺寸的每種片段上的條形碼兩者。`
[0059]在另一個(gè)實(shí)施方案中,該程序被用于鑒定病原體基因組。在瓣片產(chǎn)生期間病原體基因組斷成預(yù)測(cè)的片段,然后使用探針來(lái)探測(cè)瓣片保守序列。
[0060]然后將獲得的條形碼與預(yù)測(cè)的參比圖譜進(jìn)行比較,以產(chǎn)生病原體基因組的從頭作圖。這是雙層DNA條形碼編碼流程,其將DNA片段尺寸和用于不同尺寸片段的條形碼相結(jié)
八
口 o
[0061]在另一個(gè)實(shí)施方案中,該程序鑒定病原體基因組。基于已知的病原體基因組序列,使用者可以設(shè)計(jì)病原體特異性的瓣片或單鏈DNA間隙探針,其對(duì)不同病原體產(chǎn)生不同條形碼,使得使用者能夠構(gòu)建指示各種病原體或其他目標(biāo)序列的各種條形碼的“文庫(kù)”。這顯示在非限制性的圖7中,該圖演示了向源自于乳腺癌基因組的樣品施加各種序列特異性探針,以測(cè)定該基因組內(nèi)各種區(qū)段的存在。
[0062]在另一個(gè)實(shí)施方案中,瓣片或單鏈DNA間隙可用于富集特定基因組區(qū)域。例如,可以執(zhí)行生物素標(biāo)記的探針與含有特定瓣片序列的特定區(qū)域的雜交,以便固定所分析的區(qū)域。通過(guò)與含有親和素分子的珠子或基質(zhì)結(jié)合,對(duì)雜交的DNA分子進(jìn)行選擇。結(jié)合的分子被保留用于進(jìn)一步基因組分析,未結(jié)合的DNA分子被洗掉。通過(guò)這種方式,使用者可以將DNA固定化以便于分析和處理。瓣片可以是樣品DNA與珠子或基質(zhì)之間的附著點(diǎn)。在其他實(shí)施方案中,結(jié)合點(diǎn)可以位于主dsDNA的堿基與珠子或基質(zhì)之間,而不是在瓣片與珠子或基質(zhì)之間。
[0063]在另一個(gè)實(shí)施方案中,獲得瓣片序列或單鏈DNA間隙序列上的單堿基突變,以用于SNP或單倍型信息收集,正如由非限制性的圖11所顯示的。在該圖中,(分別)顯示了 SNPl和2的A和G等位基因。
[0064]附圖簡(jiǎn)述
[0065]當(dāng)結(jié)合附圖閱讀時(shí),可以進(jìn)一步理解發(fā)明概述以及下面的詳細(xì)描述。出于說(shuō)明本發(fā)明的目的,在圖中顯示了本發(fā)明的示例性實(shí)施方案;然而,本發(fā)明不限于所公開(kāi)的具體方法、組合物和裝置。此外,圖不是必定按比例繪制的。在所述圖中:
[0066]圖1顯示了在長(zhǎng)的基因組區(qū)域上產(chǎn)生特征“條形碼”模式的示意圖,所述基因組區(qū)域具有在形成切口后產(chǎn)生的單鏈瓣片。序列特異性的切口內(nèi)切核酸酶或切口酶在雙鏈DNA上產(chǎn)生單鏈切割間隙,聚合酶將結(jié)合在其中并開(kāi)始鏈延伸,同時(shí)產(chǎn)生被置換的鏈或所謂的“被剝離的瓣片”。這些被剝離的單鏈瓣片產(chǎn)生了可用于與標(biāo)記的探針進(jìn)行序列特異性雜交以產(chǎn)生可鑒定信號(hào)的區(qū)域。形成切口也可以通過(guò)將樣品與輻射(例如UV輻射)、自由基或其任何組合相接觸來(lái)執(zhí)行。
[0067]圖1還顯示了在納米通道陣列中被線性解折疊的標(biāo)記的基因組DNA,其中來(lái)自于在序列特異性瓣片上雜交的裝飾探針的信號(hào)之間的空間距離是可測(cè)量的,因此產(chǎn)生了獨(dú)特的“條形碼”特征模式,其反映出該區(qū)域中存在的特定基因組序列。作為實(shí)例,顯示了在入ds-DNA (總長(zhǎng)度48.5kbp)上通過(guò)特異性酶產(chǎn)生的多個(gè)形成切口位點(diǎn),所述酶包括但不限于 Nb.BbvC1、Nb.Bsm1、Nb.BsrD1、Nb.Bts1、Nt.Alw1、Nt.BbvC1、Nt.BspQ1、Nt.BstNB1、Nt.CviPII以及它們的任何組合。也顯示了線性化的單個(gè)入DNA的圖像,其顯示了與預(yù)期的切口酶產(chǎn)生的位置雜交的熒光標(biāo)記的寡核苷酸探針。這種沿著長(zhǎng)生物聚合物記錄到的實(shí)際條形碼在本文中被命名為所謂的觀 察到的條形碼;
[0068]圖2顯示了使用ADNA分子作為模型系統(tǒng),在其上執(zhí)行了不同的標(biāo)記方案。圖2a顯示了切口標(biāo)記;圖2b顯示了在兩個(gè)瓣片結(jié)構(gòu)上雜交的具有特定序列的熒光探針;圖2c顯示了從標(biāo)記的形成切口位點(diǎn)和標(biāo)記的瓣片結(jié)構(gòu)產(chǎn)生的信號(hào);
[0069]圖3顯示了基于Nb.BbVCI,跨22號(hào)染色體的50個(gè)堿基對(duì)的瓣片序列的6堿基滑動(dòng)分析。正如所示,在瓣片序列上觀察到了顯著的保守序列。該保守序列進(jìn)而可用于設(shè)計(jì)一種或多種探針以靶向多個(gè)瓣片結(jié)構(gòu):
[0070]圖4顯示了示例性通用探針TGAGGCAGGAGAAT的用途,所述探針被設(shè)計(jì)成與BAC克隆3f5上的(總共52個(gè)形成切口位點(diǎn)中的)21個(gè)瓣片結(jié)構(gòu)雜交。其中產(chǎn)生的條形碼編碼模式與預(yù)測(cè)模式匹配良好,證明了人們可以將這樣的通用探針用于全基因組作圖;
[0071]圖5顯示了 BCR和ABLl基因翻譯的易位的臨床診斷,所述易位形成了所謂的費(fèi)城染色體,是白血病的主要病因。在該方案中,將BCR基因在多個(gè)瓣片處用綠色探針標(biāo)記,將ABLl基因在多個(gè)瓣片處用紅色探針標(biāo)記。如果觀察到紅色和綠色模式,則證實(shí)了兩個(gè)基因的易位。
[0072]圖6是示意圖,顯示了所公開(kāi)的多路診斷方法。每種疾病或基因區(qū)域形成其自身的特征條形碼,所述條形碼可以包括兩種(或以上)顏色。將多個(gè)條形碼置于多個(gè)瓣片上,為使用者提供了基本上無(wú)限的條形碼編碼能力:
[0073]圖7描繪了結(jié)構(gòu)變異的驗(yàn)證,其中通過(guò)瓣片作圖證實(shí)了 BAC克隆3f5具有多個(gè)結(jié)構(gòu)重排;
[0074]圖8是使用通用探針,利用雙層條形碼、即片段尺寸和瓣片條形碼編碼進(jìn)行病原體鑒定的不意圖;
[0075]圖9顯示了使用病原體特異性探針進(jìn)行病原體鑒定;所述探針被設(shè)計(jì)成靶向病原體基因組的特定區(qū)域,其中標(biāo)記的結(jié)構(gòu)形成獨(dú)特的條形碼。在這種情況下,沙門氏菌(Salmonell)的350000-400000和1090000-1130000區(qū)域被用作實(shí)例;也顯示了大腸桿菌(E coli)的區(qū)域;
[0076]圖10是樣品富集和診斷的不意圖;和
[0077]圖11顯示了基于瓣片結(jié)構(gòu)的分子單倍型分析。
[0078]說(shuō)明性實(shí)施方案的詳細(xì)描述
[0079]通過(guò)參考下面的詳細(xì)描述并結(jié)合形成本公開(kāi)的一部分的附圖和實(shí)施例,可以更容易地理解本發(fā)明。應(yīng)該理解,本發(fā)明不限于本文中描述和/或顯示的具體裝置、方法、應(yīng)用、條件或參數(shù),并且出于描述具體實(shí)施方案的目的在本文中使用的術(shù)語(yǔ)僅僅是示例性的,不打算對(duì)本發(fā)明構(gòu)成限制。此外,當(dāng)在本說(shuō)明書包括隨附的權(quán)利要求書中使用時(shí),不帶具體數(shù)量的指稱物包括其復(fù)數(shù)形式,并且對(duì)具體數(shù)值的指稱至少包括該具體值,除非上下文明確指明不是如此。當(dāng)在本文中使用時(shí),術(shù)語(yǔ)“多個(gè)”是指超過(guò)一個(gè)。當(dāng)表述值的范圍時(shí),另一個(gè)實(shí)施方案包括從一個(gè)具體值和/或到另一個(gè)具體值。同樣地,當(dāng)通過(guò)使用先行詞“約”將值表示為近似值時(shí),應(yīng)該理解該具體值形成了另一個(gè)實(shí)施方案。所有范圍都是包含性和可組合的。
[0080]應(yīng)該認(rèn)識(shí)到,本發(fā)明的某些特點(diǎn)為了清楚起見(jiàn)在本文中描述在分開(kāi)的實(shí)施方案的背景中,但它們也可以組合提供在單一實(shí)施方案中。相反,為了簡(jiǎn)單起見(jiàn)描述在單個(gè)實(shí)施方案的背景中的本發(fā)明的各種特點(diǎn),也可以單獨(dú)或以任何子組合形式提供。此外,涉及以范圍形式陳述的值,包括該范圍內(nèi)的每個(gè)和所有值。
[0081]在第一個(gè)實(shí)施方案中,本發(fā)明提供了從DNA或其他核酸樣品獲得結(jié)構(gòu)信息的方法。這些方法適合包括對(duì)雙鏈DNA樣品進(jìn)行處理以產(chǎn)生從所述雙鏈DNA樣品上被置換下來(lái)的雙鏈DNA樣品第一鏈的瓣片。瓣片適合的長(zhǎng)度在約I至約1000個(gè)堿基、或5至750個(gè)堿基、或10至200個(gè)堿基、或50至100個(gè)堿基的范圍內(nèi)。瓣片的最適長(zhǎng)度取決于使用者的需要。正如在本文別處解釋的,瓣片的形成導(dǎo)致在dsDNA中形成與瓣片相對(duì)的“間隙”。
[0082]瓣片的產(chǎn)生在dsDNA樣品中相配地產(chǎn)生與瓣片位置相對(duì)應(yīng)的間隙,如例如圖1所示。因此,該瓣片(和間隙)可用于暴露dsDNA的單鏈部分,以備擴(kuò)增、探測(cè)或進(jìn)一步標(biāo)記。因此,使用者可以執(zhí)行DNA或其他核酸生物聚合物樣品的遺傳分析,而不必將生物聚合物斷裂成單個(gè)核酸進(jìn)行分析。此外,本發(fā)明使得使用者能夠基本上不依賴生物聚合物中的核酸序列而執(zhí)行核酸生物聚合物的分析。
[0083]這是因?yàn)榭梢詢H僅從側(cè)翼帶有兩個(gè)或以上探針的DNA區(qū)域的尺寸/長(zhǎng)度收集遺傳信息。例如,如果將探針結(jié)合于樣品使其位于目標(biāo)區(qū)域側(cè)翼,并且觀察到目標(biāo)區(qū)域比在對(duì)象中正常觀察到的更長(zhǎng)(或比應(yīng)該觀察到的更長(zhǎng)),那么使用者將了解到對(duì)象可能有以目標(biāo)區(qū)域加長(zhǎng)為特征的生理狀況或疾病的傾向,例如以特定基因的拷貝數(shù)過(guò)高為特征的病癥。[0084]將一個(gè)或多個(gè)替代堿基適當(dāng)?shù)夭迦氲诫p鏈DNA的第一鏈中以消除間隙,并將由此產(chǎn)生的雙鏈樣品的至少一部分用一種或多種標(biāo)簽適合地標(biāo)記。標(biāo)簽適合是熒光標(biāo)記物、放射活性標(biāo)記物等。標(biāo)記物可以沿著大分子的長(zhǎng)度布置(參見(jiàn)例如圖2)在切口或瓣片處,或這些位置的任何組合處。標(biāo)記物(例如由探針?biāo)鶖y帶)也可以導(dǎo)入到dsDNA的間隙中。
[0085]在一個(gè)或多個(gè)序列特異性位置處適當(dāng)實(shí)現(xiàn)形成切口。這可以通過(guò)例如切口酶或切口內(nèi)切核酸酶、或通過(guò)任何引起單鏈斷裂的酶、通過(guò)電磁波(例如紫外線)、通過(guò)自由基等來(lái)實(shí)現(xiàn)。也可以在非序列特異性位置處實(shí)現(xiàn)形成切口。用于產(chǎn)生這樣的瓣片的酶是可商購(gòu)的,例如從 New England Biolabs, www.neb, com。
[0086]上面提到的替代堿基的摻入,可以通過(guò)將雙鏈DNA的第一鏈與聚合酶、一種或多種核苷酸、連接酶或其任何組合相接觸來(lái)實(shí)現(xiàn)。在某些實(shí)施方案中,這在一種或多種替代堿基存在下執(zhí)行,所述堿基可以包括可檢測(cè)的標(biāo)簽或標(biāo)記物。通過(guò)這種方式,使用者可以在靶中摻入標(biāo)記物或標(biāo)簽,這進(jìn)而允許使用者獲得關(guān)于靶大分子的結(jié)構(gòu)信息。
[0087]瓣片結(jié)構(gòu)的產(chǎn)生由聚合酶延伸和一種或多種核苷酸的摻入來(lái)適當(dāng)控制,正如本【技術(shù)領(lǐng)域】中已知的。所述聚合酶適合具有5’-3’置換活性,并且在某些實(shí)施方案中,缺少5’-3’外切核酸酶活性。適合的聚合酶包括但不限于vent外切聚合酶(New EnglandBiolabs, www.neb, com)。
[0088]可以對(duì)聚合酶和核苷酸進(jìn)行選擇以控制瓣片的長(zhǎng)度。也可以調(diào)節(jié)反應(yīng)溫度和時(shí)間以便控制產(chǎn)生的瓣片的長(zhǎng)度。瓣片長(zhǎng)度也可以通過(guò)存在的不同核苷酸的相對(duì)比例、即dATP、dCTP、dTTP和dGTP的比率來(lái)控制。核苷酸與聚合物終止物的比率也能影響瓣片長(zhǎng)度;終止物可以包括(但不限于)ddNTP和acylo-dNTP。
[0089]適合如下實(shí)現(xiàn)標(biāo)記:通過(guò)(a)將至少一個(gè)互補(bǔ)探針結(jié)合于瓣片的至少一部分上,所述探針適合包含一個(gè)或多個(gè)標(biāo)簽(例如熒光團(tuán)),通過(guò)(b)將兩個(gè)或以上互補(bǔ)探針彼此相鄰地雜交,并可以將其連接在一起,或`甚至通過(guò)(c)將兩個(gè)或以上互補(bǔ)探針彼此相鄰地雜交,在其間具有一個(gè)或多個(gè)堿基的間隙。然后可以用標(biāo)記或未標(biāo)記的核苷酸填充間隙,所述核苷酸可以通過(guò)連接酶連接。標(biāo)記物可以存在于瓣片上、生成的“間隙”中或多個(gè)位置中。
[0090]還提供了從DNA樣品獲得結(jié)構(gòu)信息的方法。這些方法包括對(duì)雙鏈DNA樣品進(jìn)行處理以在雙鏈DNA樣品的第二鏈中產(chǎn)生單鏈DNA間隙。這可以通過(guò)例如在dsDNA DNA樣品的形成切口位點(diǎn)處對(duì)第一鏈DNA進(jìn)行消化來(lái)實(shí)現(xiàn)。間隙的長(zhǎng)度適合在約I至約1000個(gè)堿基、或5至750個(gè)堿基、或甚至100至500個(gè)堿基的范圍內(nèi)。使用者適合對(duì)單鏈DNA間隙的至少一部分進(jìn)行標(biāo)記。
[0091]形成切口通過(guò)如本文中別處所述的使雙鏈DNA分子的第一鏈形成切口來(lái)實(shí)現(xiàn)。切口內(nèi)切核酸酶Nb.BbvCI被認(rèn)為是適合的。其他適合的切口內(nèi)切核酸酶可以從商業(yè)來(lái)源獲得,包括 New England Biolabs (www.neb.com)和 Fermentas (www.fermentas.com)。
[0092]在某些實(shí)施方案中,通過(guò)5’ 一 3’ exo+聚合酶,使用例如dUTP dA(C,G)TP對(duì)切口下游的鏈進(jìn)行延伸。Vent聚合酶是適用于此的一種酶。
[0093]然后將DNA用例如尿嘧啶DNA糖基化酶進(jìn)行消化。dUTP的移除產(chǎn)生了單鏈DNA間隙。
[0094]在某些實(shí)施方案中,瓣片可以被部分或完全移除。然后將生成的間隙用瓣片內(nèi)切核酸酶填充,所述酶產(chǎn)生單鏈DNA間隙結(jié)構(gòu)。將延伸的序列再一次用相同的切口內(nèi)切核酸酶產(chǎn)生切口,并將所述序列通過(guò)變性移除。
[0095]實(shí)現(xiàn)標(biāo)記適合通過(guò)(a)將至少一個(gè)互補(bǔ)探針結(jié)合于瓣片的至少一部分上,所述探針包含一個(gè)或多個(gè)標(biāo)簽,通過(guò)(b)將兩個(gè)或以上互補(bǔ)探針彼此相鄰地雜交,并可以連接在一起,和/或通過(guò)(C)將兩個(gè)或以上互補(bǔ)探針彼此相鄰地雜交,在其間具有一個(gè)或多個(gè)堿基的間隙。然后可以用標(biāo)記或未標(biāo)記的核苷酸填充間隙,并用連接酶將其連接在一起。
[0096]然后可以按照本文中別處所述對(duì)標(biāo)記的樣品進(jìn)行拉伸。拉伸可以通過(guò)熵限制、通過(guò)施加流動(dòng)或剪切力、通過(guò)光學(xué)鑷子、通過(guò)施加磁力(例如其中樣品包括磁性材料例如珠子)等來(lái)實(shí)現(xiàn)。
[0097]還提供了從DNA獲得結(jié)構(gòu)信息的方法。這些方法包括在第一個(gè)雙鏈DNA樣品上,標(biāo)記第一個(gè)樣品上的一個(gè)或多個(gè)序列特異性位置;在第二個(gè)雙鏈DNA樣品上,標(biāo)記第二個(gè)雙鏈DNA樣品上相應(yīng)的一個(gè)或多個(gè)序列特異性位置;拉伸第一個(gè)雙鏈DNA樣品的至少一部分;拉伸第一個(gè)雙鏈DNA樣品的至少一部分;以及將第一個(gè)拉伸的雙鏈DNA樣品的至少一種標(biāo)記物的信號(hào)強(qiáng)度、位置或兩者,與第二個(gè)拉伸的雙鏈DNA樣品的至少一種標(biāo)記物的信號(hào)強(qiáng)度進(jìn)行比較。
[0098]在本發(fā)明的這一方面中,使用者對(duì)兩種(或以上)樣品的條形碼或探針結(jié)合譜進(jìn)行比較。這使得使用者能夠在來(lái)自于已知具有(或沒(méi)有)特定病癥的個(gè)體的樣品與來(lái)自于第二個(gè)個(gè)體的樣品之間進(jìn)行遺傳概況比較,使得能夠確定第二個(gè)個(gè)體的疾病狀況。例如,使用者可以將已知對(duì)可以通過(guò)基因組分析檢測(cè)的疾病(例如糖尿病)陽(yáng)性的個(gè)體的探針譜圖,與尚未進(jìn)行所述疾病測(cè)試的測(cè)試個(gè)體的譜圖進(jìn)行比較。如果兩種譜圖一致(例如如果測(cè)試個(gè)體顯示出與陽(yáng)性對(duì)照個(gè)體相同的“條形碼”),使用者將獲得提示測(cè)試個(gè)體對(duì)所述疾病“陽(yáng)性”的信息。
[0099]正如在本文別處描述的,這適合通過(guò)將一種或多種探針與至少一個(gè)DNA樣品進(jìn)行雜交來(lái)實(shí)現(xiàn)。這可以通過(guò)本文中別處描述的基于瓣片的方法來(lái)實(shí)現(xiàn)。
[0100]正如本文中別處描述的,實(shí)現(xiàn)標(biāo)記是通過(guò)在雙鏈DNA樣品的第一鏈形成切口以便產(chǎn)生(a)與雙鏈DNA樣品分開(kāi)的第一鏈瓣片和(b)在雙鏈DNA樣品的第一鏈中對(duì)應(yīng)于所述瓣片的間隙,所述間隙由形成切口的位點(diǎn)和瓣片與雙鏈DNA樣品的第一鏈相接的位點(diǎn)來(lái)確定。
[0101]所述方法適合使用被設(shè)計(jì)用于全基因組作圖的探針,其探測(cè)全基因組范圍內(nèi)的保守瓣片序列。通過(guò)這種方式,利用在這些瓣片中保守的序列,可以將一個(gè)或僅僅幾個(gè)探針與成千上萬(wàn)的瓣片序列雜交。雜交的探針相配地形成條形碼以鑒定每個(gè)單獨(dú)的DNA片段,其中條形碼對(duì)于特定片段是獨(dú)特的。探針可以是序列特異性的。
[0102]可以使用各種用于基因組作圖的方案。在一個(gè)實(shí)施方案中,可以使用切口標(biāo)記加上瓣片標(biāo)記(兩種或以上顏色)。在另一個(gè)實(shí)施方案中,可以使用一種切口酶,并用具有兩種或以上不同顏色的兩種或以上探針進(jìn)行瓣片標(biāo)記。在另一個(gè)實(shí)施方案中,可以使用兩種不同的切口酶以及瓣片和切口標(biāo)記的各種組合。
[0103]還提供了用于從DNA獲得結(jié)構(gòu)信息的其他方法。這些方法包括用帶有不同顏色的探針標(biāo)記瓣片的不同(例如兩個(gè)或以上)區(qū)域,以鑒定兩個(gè)區(qū)域之間的空間關(guān)系?;蛘?,使用者可以用不同顏色的探針和不同數(shù)量的探針標(biāo)記不同區(qū)域的瓣片,以鑒定兩個(gè)區(qū)域的關(guān)系。使用者還可以用不同數(shù)量的差異(或相同)著色的探針標(biāo)記不同區(qū)域的瓣片,并使用生成的顏色模式來(lái)鑒定兩個(gè)或以上區(qū)域之間的關(guān)系??梢栽诓煌瑓^(qū)域的瓣片上使用不同探針執(zhí)行標(biāo)記。也可以將探針靶向到特定染色體,用于鑒定特異性染色體。
[0104]可以部署探針以篩查單一疾病或異常的存在。也可以多路方式使用探針,以同時(shí)鑒定多個(gè)區(qū)域或甚至多種疾病。在這樣的實(shí)施方案中,使用者可以
[0105]可以通過(guò)探測(cè)瓣片或ssDNA間隙來(lái)鑒定病原性基因組物質(zhì)。這種鑒定適合包括使用與在多個(gè)區(qū)域之間保守的序列結(jié)合的通用探針,并且該通用探針可用于病原體從頭鑒定。在一個(gè)實(shí)施方案中,這通過(guò)在瓣片產(chǎn)生期間病原體基因組斷成預(yù)測(cè)的片段、并使用通用探針探查瓣片保守序列來(lái)實(shí)現(xiàn)。然后將獲得的條形碼與病原體基因組的預(yù)測(cè)的參比圖譜進(jìn)行比較。這被稱為“雙層” DNA條形碼編碼,其將DNA片段尺寸和條形碼信息相組合。
[0106]圖8顯示了這種雙層條形碼編碼的一個(gè)實(shí)例。如該圖中所示,通用(或其他)探針在瓣片、切口或兩個(gè)位置處結(jié)合于樣品大分子。可以將大分子細(xì)分成某些尺寸的片段,并且可以使用片段的尺寸來(lái)收集關(guān)于樣品的進(jìn)一步結(jié)構(gòu)信息。作為一個(gè)非限制性實(shí)例,使用者在知道原始樣品上限定給定片段的終點(diǎn)的位置后,可以將特定片段的尺寸與該片段在原始樣品內(nèi)的位置相關(guān)聯(lián)。
[0107]還提供了使用病原體特異性探針進(jìn)行多路病原體鑒定。這通過(guò)使用已知病原體基因組序列來(lái)設(shè)計(jì)病原體特異性瓣片探針來(lái)實(shí)現(xiàn),其中不同病原體具有不同條形碼。正如在非限制性的圖9中所示,綠色-紅色-綠色-紅色探針以該次序的出現(xiàn),表明存在沙門氏菌。在相同細(xì)菌的其他區(qū)域中可以測(cè)定到相同的條形碼。本發(fā)明的這一方面使得使用者能夠使用序列特異性探針,其進(jìn)而被用于產(chǎn)生病原體(例如細(xì)菌)特異性條形碼。
[0108]然后可以使用這樣的條形碼來(lái)測(cè)定特定樣品中病原體(或甚至病原體基因組的一部分)的存在。正如本文中所述,使用者可以根據(jù)一種或多種探針?biāo)巺^(qū)域獨(dú)有的信號(hào)來(lái)確定一種或多種探針的位置;并且將結(jié)合于DNA樣品的一種或多種探針的位置、顏色或兩者,與來(lái)自于已知對(duì)應(yīng)于一種或多種病原性狀態(tài)的DNA區(qū)域的相應(yīng)信號(hào)進(jìn)行比較。通過(guò)這種方式,使用者可以確定對(duì)象是否患 有(或傾向于患有)病原性狀態(tài)。
[0109]另一方面,本發(fā)明提供了富集某些基因組區(qū)域的方法。這些方法包括將帶有錨定物的探針與含有特定瓣片序列的一個(gè)或多個(gè)區(qū)域進(jìn)行雜交。(一種適合的這樣的探針是生物素標(biāo)記的探針)。雜交的DNA分子可以結(jié)合于例如帶有接頭分子例如親和素的珠子或玻璃表面。將未結(jié)合的DNA分子洗掉,結(jié)合的分子隨后可用于進(jìn)一步分析、成像等。在另一個(gè)實(shí)施方案中,磁性珠子可以結(jié)合或附著于DNA樣品,然后將樣品磁性吸引到基質(zhì),以固定化樣品。
[0110]圖10是本發(fā)明技術(shù)的示例性、非限制性實(shí)施方案。正如該圖中所示,探針可以結(jié)合于DNA樣品上形成的瓣片,以及插入到由于形成瓣片而留下的間隙中。生物素標(biāo)記的探針將瓣片固定于基質(zhì)。在該圖中所顯示的實(shí)例中,紅色和綠色兩種探針的出現(xiàn)表明BCR-ABL融合體的存在。如果只顯示綠色探針,那么只有ABL可見(jiàn)。如果只顯示紅色探針,那么只存在BCR。通過(guò)探查瓣片序列和單鏈DNA間隙序列上的單堿基突變,也可以實(shí)現(xiàn)分子單倍型分型。
[0111]還提供了適用于以大規(guī)模并行方式對(duì)如此標(biāo)記的大分子進(jìn)行分揀和線性解折疊以用于光學(xué)和非光學(xué)信號(hào)分析的系統(tǒng)。在示例性實(shí)施方案中,這些系統(tǒng)包括一個(gè)或多個(gè)反應(yīng)區(qū),DNA、RNA或其他樣品材料在其中經(jīng)歷形成切口、瓣片形成、標(biāo)記和本文中描述的其他步驟。這樣的位點(diǎn)可以是反應(yīng)容器,例如試管、搖瓶或其他通??色@得的實(shí)驗(yàn)室物品?;蛘?,這些步驟中的一個(gè)或多個(gè)可以在與納米通道或納米通道陣列流體連通的反應(yīng)區(qū)中執(zhí)行,正如本文中別處所述,所述納米通道或納米通道陣列隨后被用于拉伸大分子,以允許使用者收集與大分子相關(guān)的結(jié)構(gòu)信息。拉伸可以通過(guò)物理/熵限制、通過(guò)剪切流體流、通過(guò)物理力(光學(xué)鑷子)等來(lái)實(shí)現(xiàn)。適合的納米通道芯片和陣列描述在美國(guó)專利申請(qǐng)10/484,293中,其全部?jī)?nèi)容在此引為參考。
[0112]所述系統(tǒng)還可以包括裝置例如成像儀,以收集關(guān)于標(biāo)記樣品的可視信息。在一個(gè)實(shí)施方案中,成像儀包含一個(gè)或多個(gè)輻射(例如光、激光等)源,用于激發(fā)可能存在于按照本發(fā)明處理過(guò)的大分子上的標(biāo)記物。成像儀相配地包括CXD裝置或其他圖像收集硬件。圖像可以由使用者檢查或由系統(tǒng)處理和進(jìn)一步分析。這樣的進(jìn)一步處理可以包括對(duì)從標(biāo)記的大分子獲得的原始圖像進(jìn)行精修,以及將從標(biāo)記的大分子獲得的圖像與通過(guò)分析其他樣品材料或與所分析的樣品可比的材料而產(chǎn)生的模型或預(yù)測(cè)圖像進(jìn)行比較。可以在從所分析的核酸生物聚合物獲取的圖像與代表疾病狀態(tài)、健康狀態(tài)或其他遺傳變異的對(duì)照?qǐng)D像之間執(zhí)行比較。比較可以通過(guò)計(jì)算機(jī)來(lái)實(shí)現(xiàn)(或協(xié)助)。
[0113]其他公開(kāi)內(nèi)容
[0114]本申請(qǐng)基于納米通道(在適合的實(shí)施方案中直徑<500nm)內(nèi)單個(gè)DNA分子的直接成像和多個(gè)序列基序或多態(tài)性位點(diǎn)在單一 DNA分子上的定位,提出了與DNA作圖和測(cè)序相關(guān)的方法,包括用于制造長(zhǎng)基因組DNA的方法、序列特異性標(biāo)簽的方法和DNA條形碼編碼策略。這些方法在DNA圖譜的背景中獲得了連續(xù)的逐堿基測(cè)序信息。
[0115]與現(xiàn)有方法相比,所公開(kāi)的DNA作圖方法提供了更高的標(biāo)記效率、更穩(wěn)定的標(biāo)記、高靈敏度和更好的分辨率;所公開(kāi)的DNA測(cè)序方法提供了長(zhǎng)模板背景中的堿基讀出,易于裝配,并提供了不能從其他測(cè)序技術(shù)獲得的信息,例如單倍型和結(jié)構(gòu)變異。
[0116]在DNA作圖應(yīng)用中,將單個(gè)基因組DNA分子或長(zhǎng)片段PCR的片段用熒光染料在特定序列基序處標(biāo)記。然后將標(biāo)記的`DNA分子在納米通道內(nèi)拉伸成線性形式,并使用熒光顯微術(shù)成像。通過(guò)確定熒光標(biāo)記物相對(duì)于DNA骨架的位置和顏色,可以采用與讀取條形碼類似的方式精確地建立序列基序的分布。該DNA條形碼編碼方法被應(yīng)用于例如\噬菌體DNA分子和人類bac克隆的鑒定中。
[0117]在序列特異性形成切口位點(diǎn)處帶有瓣片序列的一個(gè)示例性實(shí)施方案包含下列步驟:
[0118]a)使用切口內(nèi)切核酸酶使長(zhǎng)的(例如>2Kb)雙鏈基因組DNA分子的一條鏈產(chǎn)生切口,在特定序列基序處引入切口 ;
[0119]b)使用DNA聚合酶在切口處摻入熒光染料標(biāo)記的核苷酸或非熒光染料標(biāo)記的核苷酸,置換下游鏈以產(chǎn)生瓣片序列;
[0120]c)通過(guò)標(biāo)記核苷酸的聚合酶摻入、或通過(guò)熒光探針的直接雜交或通過(guò)用連接酶連接熒光探針,對(duì)瓣片序列進(jìn)行標(biāo)記;
[0121]d)在納米通道內(nèi),通過(guò)將樣品流過(guò)所述通道或通過(guò)將DNA的一端固定在通道內(nèi),將標(biāo)記的DNA分子拉伸成線性形式;以及
[0122]e)使用熒光顯微術(shù)確定熒光標(biāo)記物相對(duì)于DNA骨架的位置,以獲得DNA的圖譜或特征條形碼。[0123]在序列特異性形成切口位點(diǎn)處具有ssDNA間隙的另一個(gè)實(shí)施方案包括下列步驟:
[0124]a)使用切口內(nèi)切核酸酶使長(zhǎng)的(例如>2Kb)雙鏈基因組DNA分子的一條鏈產(chǎn)生切口,以在特定序列基序處引入切口 ;
[0125]b)通過(guò)DNA聚合酶在切口處摻入熒光染料標(biāo)記的核苷酸或非熒光染料標(biāo)記的核苷酸,置換下游鏈以產(chǎn)生瓣片序列;
[0126]c)使用相同的切口內(nèi)切核酸酶在新延伸的鏈上形成切口,并用瓣片內(nèi)切核酸酶切開(kāi)新形成的瓣片序列(可以通過(guò)提高溫度移除脫離的ssDNA);
[0127]d)通過(guò)標(biāo)記核苷酸的聚合酶摻入、或熒光探針的直接雜交或用連接酶連接熒光探針,對(duì)ssDNA間隙進(jìn)行標(biāo)記;
[0128]e)在納米通道內(nèi),將標(biāo)記的DNA分子通過(guò)流過(guò)通道或?qū)⑺鯠NA的一端固定在通道內(nèi)而拉伸成線性形式;以及
[0129]f )使用熒光顯微術(shù)確定熒光標(biāo)記物相對(duì)于DNA骨架的位置,以獲得DNA的圖譜或條形碼。
[0130]瓣片和單鏈DNA間隙的另一種應(yīng)用是全基因組作圖。對(duì)通過(guò)切口內(nèi)切核酸酶(包括但不限于Nb.BbVCI)制造的全基因組DNA的瓣片和/或ssDNA間隙序列進(jìn)行分析,并根據(jù)跨樣品的多個(gè)區(qū)域或跨多個(gè)樣品保守(即出現(xiàn))的序列來(lái)設(shè)計(jì)雜交探針??梢允褂脝蝹€(gè)或幾個(gè)(少于4個(gè))探針,例如cy3-TGAGGCAGGAGAAT-cy3。將標(biāo)記的DNA分子在納米通道內(nèi)線性化(如本文別處所述),并產(chǎn)生DNA條形碼。
[0131]圖3是示例性實(shí)施方案,顯示了使用所謂的通用探針來(lái)結(jié)合并定位保守區(qū)。如該圖中所示,可以使用探針(在這種情況下是碰巧具有比較高GC含量的探針)沿著給定樣品大分子的長(zhǎng)度來(lái)靶向并定位保守 序列。通用探針的使用進(jìn)一步顯示在圖4中,該圖顯示了與沿著樣品大分子長(zhǎng)度的多個(gè)位點(diǎn)結(jié)合的單一通用探針的使用。
[0132]使用瓣片和/或ssDNA間隙的另一個(gè)實(shí)施方案是檢測(cè)由結(jié)構(gòu)變異引起的疾病。這樣的疾病的一個(gè)實(shí)例是BCR-ABL基因融合,該情況是白血病的主要病因。在這種情況下(如圖5和6所示),帶有綠色熒光團(tuán)標(biāo)簽的探針雜交在BCR基因的瓣片上或單鏈DNA間隙中,而帶有紅色熒光團(tuán)標(biāo)簽的探針將雜交在ABL基因的瓣片上或單鏈DNA間隙中。如果在相同DNA分子上觀察到綠色-紅色兩種顏色,則證實(shí)了存在BCR-ABL融合基因。
[0133]上述疾病診斷的另一個(gè)實(shí)施方案包括兩個(gè)以上區(qū)域的重排,例如鋅指乳腺癌診斷標(biāo)志物,其包含來(lái)自于基因組4個(gè)不同區(qū)域的4區(qū)段重排。
[0134]在另一個(gè)實(shí)施方案中,可以使用更多顏色的組合、或使用更復(fù)雜的瓣片或ssDNA間隙空間條形碼、或顏色與著色瓣片和ssDNA間隙的空間分布兩者的多重檢測(cè)格式,來(lái)測(cè)試兩種或以上疾病。
[0135]在另一個(gè)實(shí)施方案中,所述程序被用于鑒定病原體基因組?;蚪M適當(dāng)?shù)赜们锌趦?nèi)切核酸酶(包括但不限于Nb.BbVC1、Nb.BsmI等)在雙鏈DNA分子的第一鏈上形成切口。兩個(gè)形成切口位點(diǎn)適合位于相反鏈上IOObp之內(nèi),所述鏈由于產(chǎn)生瓣片而相應(yīng)斷裂。斷裂模式對(duì)于特定病原體基因組來(lái)說(shuō)是特異性的,所述模式可用作第一層條形碼信息。
[0136]然后可以使用通用探針,將瓣片或ssDNA間隙上的每個(gè)片段亞組用熒光探針進(jìn)行標(biāo)記。然后用片段尺寸和內(nèi)部顏色條形碼的組合鑒定病原體基因組。例如,以這種方式可以鑒定耶爾森氏菌屬(Yersinia)細(xì)菌。[0137]在另一個(gè)實(shí)施方案中,基于已知的病原體基因組序列,人們可以選擇病原體基因組的特定區(qū)域以證實(shí)病原體的存在。在這種情況下,可以設(shè)計(jì)病原體特異性的瓣片或單鏈DNA間隙探針,其對(duì)不同病原體產(chǎn)生特定模式。例如,沙門氏菌屬(Salmonella)細(xì)菌基因組在350000-400000bp位置處(50kb的區(qū)域)可以用Nb.BbVCI和相關(guān)探針進(jìn)行切口-瓣片標(biāo)記,以對(duì)基因組產(chǎn)生條形碼。為了增加特異性,可以使用其他這樣的區(qū)域,例如從I, 000, 000-1, 500, OOObp的50kb區(qū)域。以類似方式可以鑒定病原體基因組的混合物。
[0138]在另一個(gè)實(shí)施方案中,瓣片或單鏈DNA間隙可用于富集特定基因組區(qū)域。在這些實(shí)施方案中,使用者執(zhí)行生物素標(biāo)記探針與含有特定瓣片序列的特定區(qū)域的雜交。然后通過(guò)將雜交的DNA分子結(jié)合于含有親和素分子的珠子或玻璃表面,來(lái)篩選它們。結(jié)合的分子被留存用于進(jìn)一步基因組分析。將未結(jié)合的DNA分子洗掉,并對(duì)固定化樣品進(jìn)行進(jìn)一步分析。
實(shí)施例
[0139]下面的實(shí)施例僅僅是說(shuō)明性的,而不一定限制本發(fā)明的范圍。
[0140]實(shí)施例:在雙鏈DNA分子上產(chǎn)生單鏈DNA瓣片
[0141]將基因組DNA樣品稀釋至50ng,供用于形成切口反應(yīng)。向0.2mL PCR離心管加入IOuL入0嫩(50叩/^),然后加入2^ IOX NE緩沖液#2和3 ii L切口內(nèi)切核酸酶,包括但不限于 Nb.BbvC1、Nb.Bsm1、Nb.BsrD1、Nb.Bts1、Nt.Alw1、Nt.BbvC1、Nt.BspQ1、Nt.BstNB1、Nt.CviPII。將混合物在37°C溫育I小時(shí)。
[0142]在形成切口反應(yīng)完成后,實(shí)驗(yàn)前進(jìn)到在形成切口位點(diǎn)處進(jìn)行有限聚合酶延伸,以置換3’下游鏈并形成單鏈瓣片。瓣片生成反應(yīng)混合物由15 u I形成切口產(chǎn)物和5 摻入混合物構(gòu)成,所述摻入混合物含有2 ill IOX緩沖液、0.5 u I聚合酶和I ill從I ii M至ImM各種不同濃度的核苷酸,所述聚 合酶包括(但不限于)vent (exon-)、Bst和Phi29聚合酶。將瓣片生成反應(yīng)混合物在55°C下溫育。瓣片的長(zhǎng)度由溫育時(shí)間、所使用的聚合酶以及所使用的核苷酸的量來(lái)控制。
[0143]實(shí)施例:雙鏈DNA分子上的序列特異性切口的熒光標(biāo)記
[0144]將基因組DNA樣品稀釋至50ng,供用于形成切口反應(yīng)。向0.2mL PCR離心管加入IOuL入0嫩(50叩/^),然后加入2^ IOX NE緩沖液#2和3 ii L切口內(nèi)切核酸酶,包括但不限于 Nb.BbvC1、Nb.Bsm1、Nb.BsrD1、Nb.Bts1、Nt.Alw1、Nt.BbvC1、Nt.BspQ1、Nt.BstNB1、Nt.CviPII。將混合物在37°C溫育I小時(shí)。
[0145]在形成切口反應(yīng)完成后,實(shí)驗(yàn)前進(jìn)到在形成切口位點(diǎn)處進(jìn)行聚合酶延伸,以摻入染料核苷酸。在一個(gè)實(shí)施方案中,摻入單一熒光核苷酸終止物。在另一個(gè)實(shí)施方案中,摻入多種熒光核苷酸。摻入混合物由15 Ul形成切口產(chǎn)物和5iU摻入混合物構(gòu)成,所述摻入混合物含有2 u IlOX緩沖液、0.5 u I聚合酶包括(但不限于)vent (exon-)、以及I yl熒光染料核苷酸或核苷酸終止物,包括(但不限于)cy3、alexa標(biāo)記的核苷酸。將摻入混合物在55°C下溫育30分鐘。
[0146]實(shí)施例:雙鏈DNA分子上形成切口位點(diǎn)和單鏈DNA瓣片的雙色標(biāo)記
[0147]將形成切口位點(diǎn)用一種顏色的突光團(tuán)標(biāo)記。反應(yīng)用250nM未標(biāo)記的核苷酸dNTP進(jìn)行,以產(chǎn)生瓣片。在瓣片序列產(chǎn)生后,將瓣片用不同顏色的熒光染料分子標(biāo)記。這通過(guò)例如探針雜交、用聚合酶摻入熒光核苷酸和連接熒光探針來(lái)實(shí)現(xiàn)。
[0148]實(shí)施例:使用單一探針TGAGGCAGGAGAAT進(jìn)行全基因組作圖
[0149]將基因組DNA樣品稀釋至50ng,供用于形成切口反應(yīng)。向0.2mL PCR離心管加入IOuL入0嫩(50叩/^),然后加入2^ IOX NE緩沖液#2和3 ii L切口內(nèi)切核酸酶,包括但不限于 Nb.BbvC1、Nb.Bsm1、Nb.BsrD1、Nb.Bts1、Nt.Alw1、Nt.BbvC1、Nt.BspQ1、Nt.BstNB1、Nt.CviPII。將混合物在37°C溫育I小時(shí)。
[0150]在形成切口反應(yīng)完成后,實(shí)驗(yàn)前進(jìn)到在形成切口位點(diǎn)處進(jìn)行有限聚合酶延伸,以置換3’下游鏈并形成單鏈瓣片。瓣片生成反應(yīng)混合物由15iU形成切口產(chǎn)物和5iU摻入混合物構(gòu)成,所述摻入混合物含有2 IOX緩沖液、0.5 u I聚合酶包括(但不限于)vent(exon-)和I ill從I ii M至ImM各種不同濃度的核苷酸。將瓣片生成反應(yīng)混合物在55°C下溫育。瓣片的長(zhǎng)度由溫育時(shí)間、所使用的聚合酶以及所使用的核苷酸的量來(lái)控制。然后將產(chǎn)生的瓣片用通用探針例如用于Nb.BbVCI的TGAGGCAGGAGAAT進(jìn)行雜交和標(biāo)記。
[0151]實(shí)施例:來(lái)自乳腺癌基因組的MCF-7 3F5 BAC克隆的重排結(jié)構(gòu)的結(jié)構(gòu)變異驗(yàn)證
[0152]該區(qū)域由4個(gè)區(qū)段構(gòu)成:3pl4.1,反向的14.1Kb區(qū)塊;20ql2,反向的22.3Kb區(qū)塊,其含有PTPRT基因的外顯子6 ;20pl3.31,45.5Kb的區(qū)塊,其含有截短的BMP7基因的外顯子I及其完整啟動(dòng)子;20pl3.2,23.4Kb的區(qū)塊,其含有完整的ZNF217基因。使用與瓣片雜交的區(qū)域特異性探針來(lái)證實(shí)4個(gè)區(qū)域的存在:用于20ql2的TGCCACCTACCCCT ;用于20pl3.31的 AGAAGCCTGTCAGATGCAT ;用于 20pl3.2 的 ACTGTAGTCTTGAATTCCTGA,以及用于 3pl4.1 的TCCTTGGTTGACCTAACAACACA。
[0153]實(shí)施例:檢測(cè)方案
[0154]在檢測(cè)方案的一個(gè)實(shí)例中,通過(guò)時(shí)間延遲積分(TDI)相機(jī)捕獲以流動(dòng)方式移動(dòng)的DNA的視頻圖像。在這樣的實(shí)施方`案中,將DNA的移動(dòng)與TDI同步。
[0155]在檢測(cè)方案的另一個(gè)實(shí)例中,通過(guò)CXD或CMOS相機(jī)捕獲以流動(dòng)方式移動(dòng)的DNA的視頻圖像,并通過(guò)軟件或硬件將幀集成,以鑒定和重構(gòu)DNA圖像。
[0156]在檢測(cè)方案的另一個(gè)實(shí)施例中,通過(guò)在分開(kāi)的一組傳感器上同時(shí)捕獲不同波長(zhǎng)來(lái)收集DNA的視頻圖像。這可以使用一個(gè)相機(jī)或雙或多視圖分割器,或使用濾光片和多個(gè)相機(jī)來(lái)進(jìn)行。相機(jī)可以是TD1、C⑶或CMOS檢測(cè)系統(tǒng)。
[0157]在另一個(gè)實(shí)例中,使用同時(shí)多波長(zhǎng)視頻檢測(cè),將骨架染料用于鑒定獨(dú)特DNA片段,并將標(biāo)記物用作標(biāo)志物以追蹤DNA移動(dòng)。這可用于DNA長(zhǎng)度大于相機(jī)視野的情況,并且標(biāo)志物可用于協(xié)助作圖DNA的重構(gòu)圖像。
【權(quán)利要求】
1.一種對(duì)雙鏈DNA樣品進(jìn)行分析的方法,所述方法包含: 對(duì)雙鏈DNA樣品進(jìn)行處理以產(chǎn)生從雙鏈DNA樣品置換下來(lái)的雙鏈DNA樣品的第一鏈的瓣片, 所述瓣片的長(zhǎng)度在約I至約1000個(gè)堿基的范圍內(nèi),并且 所述瓣片在雙鏈DNA樣品的第一鏈中產(chǎn)生對(duì)應(yīng)于所述瓣片的間隙; 將一個(gè)或多個(gè)堿基摻入到雙鏈DNA中,以消除間隙的至少一部分; 用一個(gè)或多個(gè)標(biāo)簽標(biāo)記處理過(guò)的雙鏈DNA的至少一部分;以及 將一個(gè)或多個(gè)標(biāo)記物的位置與所述DNA樣品的結(jié)構(gòu)特征相關(guān)聯(lián)。
2.權(quán)利要求1的方法,其中處理包含使雙鏈DNA的第一鏈形成切口。
3.權(quán)利要求2的方法,其中形成切口在雙鏈DNA上的一個(gè)或多個(gè)序列特異性位置處實(shí)現(xiàn)。
4.權(quán)利要求2的方法,其中形成切口在雙鏈DNA上的一個(gè)或多個(gè)非特異性位置處實(shí)現(xiàn)。
5.權(quán)利要求2的方法,其中形成切口通過(guò)將雙鏈DNA樣品暴露于形成切口的內(nèi)切核酸酶、引起單鏈斷裂的酶、電磁輻射、自由基或其任意組合來(lái)實(shí)現(xiàn)。
6.權(quán)利要求1的方法,其中將一個(gè)或多個(gè)替代堿基摻入雙鏈DNA的第一鏈包含將雙鏈DNA的第一鏈與聚合酶、一種或多種核苷酸、連接酶或其任意組合相接觸。
7.權(quán)利要求1的方法,其中瓣片的產(chǎn)生通過(guò)聚合酶延伸、一種或多種核苷酸的摻入、反應(yīng)時(shí)間、反應(yīng)終止物的存在或其任意組合來(lái)調(diào)節(jié)。
8.權(quán)利要求6的方法,其中聚合酶具有5’至3’置換活性。
9.權(quán)利要求8的方法,其中聚合酶包含vent外切聚合酶。
10.權(quán)利要求7的方法,其中一種或多種核苷酸包含dATP、dCTP、dTTP、dGTP或其任意組合。
11.權(quán)利要求7的方法,其中反應(yīng)終止物包含ddNTP、acylo-dNTP或其任意組合。
12.權(quán)利要求1的方法,其中標(biāo)記通過(guò)將至少一種互補(bǔ)的標(biāo)記探針與瓣片的一部分、DNA第一鏈的一部分、DNA第二鏈的一部分或其任意組合相結(jié)合來(lái)實(shí)現(xiàn)。
13.權(quán)利要求1的方法,其還包含將兩種以上互補(bǔ)探針與DNA樣品雜交并將所述探針連接在一起。
14.權(quán)利要求1的方法,其還包含將兩種以上互補(bǔ)探針與DNA樣品雜交,在所述探針之間有一個(gè)或多個(gè)堿基的間隙。
15.權(quán)利要求14的方法,其還包含用一個(gè)或多個(gè)核苷酸填充間隙的至少一部分。
16.權(quán)利要求14的方法,其還包含用一個(gè)或多個(gè)標(biāo)記的核苷酸填充間隙的至少一部分。
17.權(quán)利要求15的方法,其中一個(gè)或多個(gè)核苷酸連接在一起。
18.權(quán)利要求16的方法,其中一個(gè)或多個(gè)標(biāo)記的核苷酸連接在一起。
19.權(quán)利要求1的方法,其還包含用切口內(nèi)切核酸酶移除瓣片。
20.權(quán)利要求1的方法,其還包含拉伸雙鏈DNA樣品的至少一部分。
21.權(quán)利要求1的方法,其還包含將一個(gè)或多個(gè)瓣片附著到基質(zhì)上。
22.—種從DNA獲得結(jié)構(gòu)信息的方法,所述方法包含: 在第一個(gè)雙鏈DNA樣品上,標(biāo)記所述第一個(gè)樣品上的一個(gè)或多個(gè)序列特異性位置;在第二個(gè)雙鏈DNA樣品上,標(biāo)記所述第二個(gè)雙鏈DNA樣品上相應(yīng)的一個(gè)或多個(gè)序列特異性位置; 拉伸第一個(gè)雙鏈DNA樣品的至少一部分; 拉伸第二個(gè)雙鏈DNA樣品的至少一部分;以及 將第一個(gè)拉伸的雙鏈DNA樣品的所述至少一種標(biāo)記物的信號(hào)的強(qiáng)度、位置或兩者,與第二個(gè)拉伸的雙鏈DNA樣品的所述至少一種標(biāo)記物的信號(hào)的強(qiáng)度、位置或兩者進(jìn)行比較。
23.權(quán)利要求22的方法,其中經(jīng)如下實(shí)現(xiàn)標(biāo)記:使雙鏈DNA樣品的第一鏈形成切口,以便產(chǎn)生(a)與雙鏈DNA樣品分離開(kāi)的第一鏈的瓣片、和(b)在雙鏈DNA樣品的第一鏈中與瓣片對(duì)應(yīng)的間隙,所述間隙由形成切口的位點(diǎn)和瓣片與雙鏈DNA樣品的第一鏈相接的位點(diǎn)來(lái)確定。
24.權(quán)利要求22的方法,其還包含將一種或多種探針與雙鏈DNA樣品的至少一種雜交。
25.權(quán)利要求22的方法,其中一種或多種探針與一個(gè)或多個(gè)保守的瓣片序列結(jié)合,使得所述一種或多種探針能夠與樣品的至少兩個(gè)區(qū)域雜交。
26.—種從DNA獲得結(jié)構(gòu)信息的方法,所述方法包含: 用兩種以上探針標(biāo)記雙鏈DNA樣品的單鏈DNA成員的瓣片上的兩個(gè)以上區(qū)域,并將探針的位置與所述兩個(gè)以上區(qū)域之間的空間關(guān)系、與一個(gè)或多個(gè)所述區(qū)域的結(jié)構(gòu)、序列或兩者相關(guān)聯(lián)。
27.權(quán)利要求26的方法,其中兩種以上探針彼此不同。
28.權(quán)利要求26的方法,其中一種或多種探針是序列特異性的。
29.一種鑒定病原性遺傳物質(zhì)的方法,所述方法包含: 將一種或多種標(biāo)記的探針與DNA樣品的一個(gè)或多個(gè)區(qū)域相結(jié)合; 根據(jù)一種或多種探針?biāo)巺^(qū)域獨(dú)有的信號(hào)確定一種或多種探針的位置;以及 將結(jié)合于DNA樣品的一種或多種探針的位置、顏色或兩者,與來(lái)自于已知對(duì)應(yīng)于一種或多種病原性狀態(tài)的DNA區(qū)域的相應(yīng)信號(hào)進(jìn)行比較。
30.權(quán)利要求29的方法,其還包含在DNA上產(chǎn)生一個(gè)或多個(gè)瓣片。
31.權(quán)利要求30的方法,其還包含將DNA樣品分離成兩種以上的片段。
32.權(quán)利要求29的方法,其中一種或多種探針與DNA樣品的兩個(gè)以上區(qū)域互補(bǔ)。
33.權(quán)利要求29的方法,其還包含將一個(gè)或多個(gè)瓣片與基質(zhì)結(jié)合。
34.權(quán)利要求33的方法,其中結(jié)合通過(guò)生物素-親和素偶聯(lián)來(lái)實(shí)現(xiàn)。
35.一種分析系統(tǒng),其包含: 使單鏈或雙鏈核酸生物聚合物形成切口和進(jìn)行標(biāo)記的一個(gè)或多個(gè)區(qū)域; 適用于拉伸核酸生物聚合物的一個(gè)或多個(gè)區(qū)域;以及 適用于從標(biāo)記的核酸生物聚合物收集可視信息的成像裝置。
36.權(quán)利要求35的分析系統(tǒng),其還包含適用于激發(fā)布置在核酸生物聚合物上的熒光標(biāo)記物的一個(gè)或多個(gè)輻射源。
37.權(quán)利要求35的分析系統(tǒng),其中成像裝置包含CXD裝置。
38.權(quán)利要求37的分析系統(tǒng),其還包含適用于將從標(biāo)記的核酸生物聚合物獲得的圖像與對(duì)照?qǐng)D像進(jìn)行比較的計(jì)算機(jī)。
39.權(quán)利要求35的分析系統(tǒng),其中適用于拉伸核酸生物聚合物的區(qū)域包含納米通道、光學(xué)鑷子、流動(dòng)通道或其任意組`合。
【文檔編號(hào)】C12Q1/68GK103502468SQ201080056871
【公開(kāi)日】2014年1月8日 申請(qǐng)日期:2010年10月21日 優(yōu)先權(quán)日:2009年10月21日
【發(fā)明者】肖明, 索梅斯庫(kù)瑪·達(dá)斯 申請(qǐng)人:生物納米基因公司