用于分析三維dna結(jié)構(gòu)中的核苷酸序列相互作用的方法
【專利摘要】本發(fā)明提供了一種用于分析三維DNA結(jié)構(gòu)中來自一個(gè)或多個(gè)感興趣的區(qū)域的一個(gè)或多個(gè)核苷酸序列與其它核苷酸序列的相互作用的方法,其包括下述步驟:(a)提供交聯(lián)的DNA的樣品;(b)用第一限制性酶消化交聯(lián)的DNA;(c)連接交聯(lián)的核苷酸序列;(d)反轉(zhuǎn)交聯(lián);(e)使來自(d)的連接的分子片段化;(f)使來自(e)的片段與代表與第一限制性酶的切割位點(diǎn)相鄰的序列的一個(gè)或多個(gè)寡核苷酸雜交,以富集已經(jīng)在步驟(c)中與另一個(gè)核苷酸序列連接的核苷酸序列的末端;并且(g)分析富集的片段的核苷酸序列以鑒定牽涉相互作用的核苷酸序列。
【專利說明】用于分析三維DNA結(jié)構(gòu)中的核苷酸序列相互作用的方法 發(fā)明領(lǐng)域
[0001]本發(fā)明涉及用于分析三維DNA結(jié)構(gòu),如染色質(zhì)中的核苷酸序列相互作用的方法。
[0002] 發(fā)明背景
[0003] 許多最近的研究已經(jīng)顯示了基因組在許多以接頭區(qū)分開的自身結(jié)合域中構(gòu)造。這 些所謂的"拓?fù)鋵W(xué)域"一般范圍為300千堿基對(duì)(kb)至1兆堿基對(duì)(1Mb)。拓?fù)鋵W(xué)域由一系列 染色質(zhì)環(huán)組成,其中環(huán)定義為使染色質(zhì)的兩個(gè)部分緊密接近,從而容許區(qū)域間的相互作用, 盡管后者不需要如此。這些環(huán)是動(dòng)態(tài)的,并且依賴于大量的蛋白質(zhì),包括CTCF和粘結(jié)蛋白 (cohesion)以及調(diào)節(jié)域內(nèi)基因需要的一系列轉(zhuǎn)錄因子。認(rèn)為域內(nèi)的許多環(huán)是完全結(jié)構(gòu)性 的,即實(shí)現(xiàn)創(chuàng)建不同域的基因組折疊;而其它環(huán)在基因的表達(dá)中具有功能。后一類環(huán)(染色 體接近)在拓?fù)鋵W(xué)域內(nèi)是常見的,并且在位于不同拓?fù)鋵W(xué)域中的染色質(zhì)間少見得多。
[0004] 調(diào)節(jié)性DNA元件彼此之間及與域內(nèi)的基因相互作用,并且形成復(fù)雜的相互作用網(wǎng) 絡(luò)。這些元件內(nèi)的變化及其相互作用(除了基因中的突變外)造成基因表達(dá)的變化,這繼而 造成物種個(gè)體間的差異或引起疾病。如此,這些元件已經(jīng)對(duì)疾病的診斷和治療變得重要。然 而,這些調(diào)節(jié)網(wǎng)絡(luò)仍然是相對(duì)未知的,盡管最近已經(jīng)投入相當(dāng)大的努力來闡明其功能。
[0005] 調(diào)節(jié)元件是含有一個(gè)或多個(gè)用于激活或阻抑基因的轉(zhuǎn)錄因子的結(jié)合位點(diǎn)的短片 段。調(diào)節(jié)元件經(jīng)常遠(yuǎn)離其靶基因定位,并且盡管它們可以通過結(jié)合特定因子(如P300)或染 色質(zhì)修飾識(shí)別,但是經(jīng)常不清楚它們與哪些基因相互作用。在基因組的空間構(gòu)造中,它們緊 密接近其靶基因。例如,在多指(Polydactyly)中,盡管影響的增強(qiáng)子在基因組的線性圖譜 上與受影響的生長因子基因 Shh相距約IMbp定位,但是它在細(xì)胞核的3D空間中與該基因緊 密關(guān)聯(lián)。
[0006] 雖然已經(jīng)清楚調(diào)節(jié)元件通過成環(huán)調(diào)芐基因,但是染色體構(gòu)象捕捉(3C)通過容許快 速鑒定此類相互作用在該領(lǐng)域中帶來革命。3C技術(shù)的基本原理是細(xì)胞核空間中的DNA片段 的緊密接近可以通過交聯(lián),接著限制性酶消化、連接和擴(kuò)增連接的產(chǎn)物檢測(cè)。隨后,已經(jīng)開 發(fā)出許多3C類型技術(shù),其提供關(guān)于相互作用和調(diào)芐基因的方式的更多信息:3C/3C-qPCR; 3C-seq/4C_seq;4C(3C-芯片上(on_a chip)) ;5C(3C碳拷貝(carbon copy));和Hi_C。
[0007] 這些方法中的每一種與各種優(yōu)點(diǎn)和缺點(diǎn)有關(guān)(表1)。3(:和4C技術(shù)是相當(dāng)費(fèi)力的,需 要基因座的在先知識(shí),并且受限于從特定觀察點(diǎn)檢測(cè)相互作用。為了分析幾種相互作用,不 得不使用需要分開分析的許多不同觀察點(diǎn)。3C和4C技術(shù)不產(chǎn)生全基因組數(shù)據(jù)。
[0008] 5C和HiC技術(shù)是更先進(jìn)的。5C在引物設(shè)計(jì)中是高度苛求的,并且容許分析許多不同 相互作用,但是不給出全基因組覆蓋。HiC是非常昂貴的,因?yàn)樗枰浅4罅康臏y(cè)序以分 析整個(gè)基因組,而不提供高分辨率分析(通常為40Kbp)。新近的HiC分析方法使用新算法,并 且提供lOKbp的分辨率。然而,它需要大量的測(cè)序(來自6個(gè)生物學(xué)重復(fù)的34億個(gè)定位的配對(duì) 末端讀出)。在此規(guī)模上的測(cè)序?qū)τ诖蠖鄶?shù)研究小組是不可用的。還有,興趣經(jīng)常涉及牽涉 有限組的特定基因座或域,例如參與疾病中的基因組變化的區(qū)域的特定問題,這意味著相 當(dāng)大比例的通過HiC法進(jìn)行的測(cè)序?qū)τ谶@些應(yīng)用是多余的。
[0009] 如此,需要不受上述限制的用于分析三維染色質(zhì)結(jié)構(gòu)中的核苷酸序列相互作用的 改善的方法。
[0010] 表1-不同染色質(zhì)構(gòu)象捕捉技術(shù)間的比較
[0011]
[0012] 附圖簡述
[0013] 圖1:T2C規(guī)程的概述
[0014] 在稀釋的條件下消化并連接分離的交聯(lián)染色質(zhì)以有利于緊密接近的限制性片段 間的連接。在去交聯(lián)(de cr 〇 s s 1 i nk i ng)和二次消化后,修復(fù)突出端,接著進(jìn)行銜接頭連接。 銜接頭含有測(cè)序方法需要的序列,例如配對(duì)末端Illumina或任選的短地址序列。會(huì)在不同 樣品中使用不同地址以容許多路復(fù)用(multiplexing^使不同樣品與相同組的寡核苷酸探 針雜交),其中地址序列容許序列與衍生它的樣品匹配。使所得的一個(gè)或多個(gè)文庫與陣列上 的獨(dú)特寡核苷酸探針或可以在珠上捕獲的溶液中的寡核苷酸探針的組雜交。獨(dú)特的寡核苷 酸探針(綠色波形線)盡可能接近第一限制性位點(diǎn)定位。洗脫雜交的DNA,并且它含有選定的 基因組區(qū)域的所有相互作用的文庫,并且在Illumina HiSeq2000上進(jìn)行成對(duì)末端測(cè)序 (pair-end sequencing),然后是生物信息學(xué)分析和可視化相互作用(即緊密接近的序列)。 垂直的黑線描繪了一級(jí)限制性酶切割位點(diǎn)。橙色小垂直線描繪了二級(jí)限制性酶切割位點(diǎn)。
[0015] 圖2:與Hi-c數(shù)據(jù)和4C數(shù)據(jù)比較通過T2C對(duì)人chrl 1ρ15.5區(qū)檢測(cè)的相互作用。
[0016] A)對(duì)于頂R90細(xì)胞產(chǎn)生的Hi-C數(shù)據(jù),覆蓋感興趣的H19/IGF2區(qū),以40Kbp分辨率呈 現(xiàn)(Zuin等(2013),印刷中)。
[0017] B)使用與在(A)中相同的40kbp聚類(bin)呈現(xiàn)在HB2細(xì)胞中通過T2C觀察到的相互 作用。通過兩種方法觀察到的總體拓?fù)鋵W(xué)域模式是相似的。
[0018] C)T2C數(shù)據(jù),在片段水平上以其實(shí)際分辨率呈現(xiàn)。右側(cè)的有色柱形給出從低(藍(lán)色) 至高(黃色)讀出數(shù)目的每種相互作用的序列讀出的頻率。讀出數(shù)目代表兩個(gè)片段間連接的 頻率,并且因此代表細(xì)胞核的三維空間中的那些片段間的相互作用。
[0019] D)與IGF2基因接近的一個(gè)觀察點(diǎn)的4C相互作用數(shù)據(jù),與通過T2C對(duì)此特定觀察點(diǎn) 觀察到的相互作用比較(粗紅線)。也在(C)中指示觀察點(diǎn),以容許方法間的直接比較。細(xì)紅 線指示相互作用片段的數(shù)目以易于比較。
[0020] 圖3:對(duì)β-珠蛋白基因座比較區(qū)室化(compartmentalization)和相互作用。
[0021 ]在來自E12.5小鼠的小鼠原代紅系細(xì)胞(A)和小鼠胎腦細(xì)胞(B)的β-珠蛋白基因座 周圍的~2MB區(qū)中進(jìn)行的T2C。不同生物學(xué)材料間的拓?fù)鋵W(xué)域模式似乎是相同的,不依賴于 兩種生物學(xué)樣品中的相互作用的不同數(shù)目。對(duì)來自E12.5小鼠的小鼠原代紅系細(xì)胞(C)和小 鼠胎腦細(xì)胞(D)的β-珠蛋白基因座周圍的相互作用的放大。白線指示β-珠蛋白基因座中的 特別感興趣的區(qū)域(如3 ' HS1、β-珠蛋白啟動(dòng)子和LCR)。LCR、β-珠蛋白啟動(dòng)子和3 ' HS1之間的 相互作用在小鼠腦細(xì)胞中喪失。相對(duì)于相同顏色代碼標(biāo)準(zhǔn)化所有相互作用。
[0022]基因座的線性表示與LDB1和CTCF在紅系細(xì)胞中的結(jié)合位點(diǎn)一起在底部顯示。
[0023]圖4:比較含有LDB1或CTCF結(jié)合位點(diǎn)的片段的相互作用。
[0024]對(duì)于來自Ε12.5小鼠的小鼠原代紅系細(xì)胞(A)、(C)和小鼠胎腦細(xì)胞(Β)、(D),結(jié)合 LDB1(A)、(B)或CTCF(C)、(D)的片段在β-珠蛋白基因組周圍的~2MB區(qū)內(nèi)的相互作用。當(dāng)與 小鼠腦細(xì)胞比較時(shí),在小鼠肝細(xì)胞中清楚描繪了 珠蛋白基因座周圍的拓?fù)鋵W(xué)域。對(duì)于小 鼠原代紅系細(xì)胞(E)、(G)和小鼠腦細(xì)胞(F)、(H),i3-珠蛋白基因座周圍的LDB1結(jié)合片段(Ε)、 (F)和CTCF結(jié)合片段(G)、(H)之間的相互作用的放大表示。白線指示β-珠蛋白基因座中的感 興趣的特定區(qū)域(如3'HS1、β-珠蛋白啟動(dòng)子和LCR) ICRj-珠蛋白啟動(dòng)子和3'HS1之間的胎 肝相互作用在小鼠腦細(xì)胞中喪失。相對(duì)于相同顏色代碼標(biāo)準(zhǔn)化所有相互作用。底部顯示了 珠蛋白基因座的線性表示及LDB1和CTCF在紅系細(xì)胞中的結(jié)合位點(diǎn)。
[0025]圖5:僅含有LDB1或CTCF的片段的相互作用的均值、中值和數(shù)目。
[0026]當(dāng)與原代紅系細(xì)胞相比時(shí),LDB1(A)和CTCF(B)相互作用的數(shù)目在小鼠胎腦中更 低。此外,當(dāng)與原代紅系細(xì)胞相比時(shí),LDB1(C)或CTCF(D)相互作用模式之間距離的均值和中 值在小鼠胎腦細(xì)胞中更低。
[0027]圖6至10:對(duì)于小鼠胎腦(圖6)、小鼠胎肝(圖7)、人HB2(圖8)、人TEV(圖9)、和人HEV (圖10)細(xì)胞,均對(duì)~2Mbp區(qū)并且在可視化中使用對(duì)數(shù)頻率范圍和彩虹顏色代碼可視化相互 作用矩陣。照片清楚顯示了T2C的卓越分辨率和質(zhì)量,并且憑借直接的視覺讀出,顯示了基 因組構(gòu)造為亞染色體域,其由形成環(huán)聚集體/玫瑰花結(jié)的染色質(zhì)環(huán)組成。這是物種特異性的 (比較圖6和7與圖8-10),組織/細(xì)胞特異性的(圖6和7和圖8-10),依賴于基因的活性(圖6、 7、8和9),和結(jié)構(gòu)相關(guān)蛋白(如粘結(jié)蛋白)的存在(圖8和9)。如此,結(jié)構(gòu)也依賴于遺傳或結(jié)構(gòu) 變化改變相互作用的疾病狀態(tài)(圖6和7,或圖9和10)。
[0028] 圖11:免疫球蛋白重鏈基因座和帕-魏二氏(Prader-Willi)/安格曼(Angelmann) 綜合征區(qū)域中,模擬染色質(zhì)模型描述和基因組標(biāo)志物間的空間距離的關(guān)系/評(píng)估:a,模擬隨 機(jī)步移(Random-Walk) /巨大環(huán)(Giant-Loop)和多環(huán)亞區(qū)室模型(Multi-Loop-Subcompartment Model)的體積植染圖像(Volume rendered image)。作為具有中期染色體 的形式和大小的起始構(gòu)象(頂部),堆積玫瑰花結(jié)(α)。從此類起始構(gòu)型,通過蒙特卡洛和松 弛布朗動(dòng)力學(xué)步驟(Monte-Carlo and relaxing Brownian Dynamics step)解聚熱動(dòng)力學(xué) 平衡中的間期染色體。顯示了含有大環(huán)(5Mbp)的模擬隨機(jī)步移/巨大環(huán)模型的體積渲染圖 像(左邊;β)。注意大環(huán)不形成獨(dú)特的結(jié)構(gòu),但是自由混合(左邊;β)。相對(duì)而言,在含有 126kbp大小的環(huán)和接頭的模擬多環(huán)亞區(qū)室模型的體積渲染圖像中,玫瑰花結(jié)形成獨(dú)特的染 色質(zhì)范圍,其中環(huán)不自由混合(中間;γ )。在含有126kbp環(huán)和63kbp接頭的模擬RW/GL模型的 圖像中,再形成獨(dú)特的染色質(zhì)范圍,但是與MLS模型形成對(duì)比,不形成亞區(qū)室(右邊;β)。匕隨 機(jī)步移巨大環(huán)和多環(huán)亞區(qū)室模型:指示RW/GL模型,其中大環(huán)附著于非DNA主鏈。顯示含有環(huán) 間的染色質(zhì)接頭的模擬模型。顯示了含有126kbp環(huán)和接頭的MLS模型,個(gè)別的玫瑰花結(jié)跨越 l-2Mbp〇
[0029] 圖12:對(duì)于各種多環(huán)亞區(qū)室模型(模型參數(shù):環(huán)大小/接頭大小/模型名稱),用于染 色質(zhì)模型描述和空間距離的關(guān)系/評(píng)估的不同交聯(lián)可能性(d 1:相互作用的距離)的模擬相 互作用圖。
[0030] 圖13:對(duì)于各種隨機(jī)步移/巨大環(huán)模型(模型參數(shù):環(huán)大小/接頭大小/模型名稱), 用于染色質(zhì)模型描述和空間距離的關(guān)系/評(píng)估的不同交聯(lián)可能性(d 1:相互作用的距離)的 模擬相互作用圖。
[0031] 發(fā)明概述
[0032]本發(fā)明人已經(jīng)開發(fā)出一種名稱為"靶向染色質(zhì)捕捉"(T2C)的新技術(shù)以克服5C和 HiC的缺點(diǎn)。
[0033] T2C采用來自一個(gè)或多個(gè)感興趣區(qū)域的3C連接產(chǎn)物的選擇性富集以鑒定與域的相 互作用和基因組的一個(gè)或幾個(gè)特定區(qū)域的區(qū)室化。感興趣的區(qū)域可以是大的(例如多兆堿 基大小)連續(xù)基因組區(qū)域或者可以備選是較小區(qū)域(各幾兆堿基)的集合。
[0034]可將每個(gè)捕獲的限制性片段用作"觀察點(diǎn)",鑒定在三維基因組結(jié)構(gòu)中與所述序列 相互作用的核苷酸序列。T2C的輸出以限制性片段水平分辨率提供局部相互作用圖。方法比 Hi-C法牽涉少得相當(dāng)多的序列努力和更少的復(fù)雜的生物信息學(xué)分析。方法還不受5C法的限 制阻礙,因?yàn)門2C還鑒定靶定區(qū)域內(nèi)的片段與靶定區(qū)域外部的區(qū)域的相互作用。
[0035]如此,在第一個(gè)方面,本發(fā)明提供了用于分析三維DNA結(jié)構(gòu)中來自一個(gè)或多個(gè)感興 趣的區(qū)域的一個(gè)或多個(gè)核苷酸序列與其它核苷酸序列的相互作用的方法,其包括下述步 驟:
[0036] (a)提供交聯(lián)的DNA的樣品;
[0037] (b)用第一限制性酶消化所述交聯(lián)的DNA;
[0038] (c)連接交聯(lián)的核苷酸序列;
[0039] (d)反轉(zhuǎn)所述交聯(lián);
[0040] (e)使來自(d)的連接的分子片段化;
[0041] (f)使來自(e)的片段與代表與所述第一限制性酶的切割位點(diǎn)相鄰的序列的一個(gè) 或多個(gè)寡核苷酸雜交,以富集已經(jīng)在步驟(c)中與另一個(gè)核苷酸序列連接的核苷酸序列的 末端;并且
[0042] (g)分析富集的片段的核苷酸序列以鑒定牽涉相互作用的核苷酸序列。
[0043]方法可以用于分析三維染色質(zhì)結(jié)構(gòu)中來自一個(gè)或多個(gè)感興趣的基因組區(qū)的一個(gè) 或多個(gè)核苷酸序列與其它核苷酸序列的相互作用。
[0044]第一限制性酶可以是識(shí)別6_8bp識(shí)別位點(diǎn)的任何限制性酶。
[0045] 第一限制性酶可以選自下組:Bglll、HindIII、EcoRI、BamHI、SpeI、PstI和Ndel。
[0046] 在方法的步驟(e)中,可以通過用第二限制性酶,如識(shí)別4或5bp核苷酸序列識(shí)別位 點(diǎn)或甚至二核苷酸序列的酶消化使所述連接的分子片段化。
[0047] 第二限制性酶可以選自下組:TspEI、MaeII、AluI、NlaIII、HpaII、FnuDII、MaeI、 DpnI、MboI、HhaI、HaeIII、RsaI、TaqI、CviRI、MseI、Sthl32I、AciI、DpnII、Sau3AMPMnlL·
[0048] 或者,在步驟(e)中,可以通過機(jī)械手段,如剪切或超聲處理使連接的分子片段化。
[0049] 或者,第一限制性酶可以是識(shí)別4-6個(gè)堿基對(duì)的識(shí)別位點(diǎn)的任何限制性酶(其中 6bp是簡并序列),在該情況中,會(huì)通過非特異性核酸酶或剪切的機(jī)械手段替換第二限制性 酶。這會(huì)導(dǎo)致較高數(shù)目的用于雜交的寡核苷酸(參見下文)和較高的相互作用分辨率,因?yàn)?存在有較多的一級(jí)限制性片段。
[0050] 在步驟(f)中,一個(gè)或多個(gè)寡核苷酸探針可以在微陣列上點(diǎn)樣(spot)或在珠上捕 獲,或者備選存在于溶液中,其隨后在珠上捕獲。
[0051] 寡核苷酸探針可識(shí)別與第一限制性酶的識(shí)別位點(diǎn)相鄰的序列,如第一限制性酶的 識(shí)別位點(diǎn)的l〇〇bp內(nèi)的序列。
[0052] 在步驟(f)中,可以使核苷酸序列片段與寡核苷酸探針組雜交,所述寡核苷酸探針 組包含多個(gè)寡核苷酸,每個(gè)所述寡核苷酸與下述序列雜交,所述序列與來自感興趣的基因 組區(qū)的核苷酸序列上的第一限制性酶的消化位點(diǎn)相鄰。
[0053]寡核苷酸探針組包含對(duì)基本上所有限制性片段特異性的探針,所述限制性片段可 通過用第一限制性酶處理感興趣的基因組區(qū)獲得。
[0054] 可在步驟(f)前將銜接頭序列與來自步驟(e)的核苷酸序列片段的一個(gè)或兩個(gè)末 端連接,從而可以通過雜交在陣列上捕獲連接的核苷酸序列片段,擴(kuò)增和/或測(cè)序或者容許 區(qū)分與相同的寡核苷酸探針組雜交的不同樣品。銜接頭可以含有特定的地址序列,其容許 區(qū)分一個(gè)樣品與另一個(gè)樣品。然后,知道所有具有特定地址序列的序列源自一個(gè)特定樣品。
[0055] 方法的步驟(g)可牽涉富集的核苷酸序列片段的高通量測(cè)序。
[0056] 步驟(g)可以繼之以相互作用的生物信息分析和/或可視化。
[0057] 感興趣的區(qū)域(如感興趣的基因組區(qū))可以包含感興趣的遺傳基因座。
[0058] 感興趣的區(qū)域的長度總共可以是約1-50MB。
[0059] 若在步驟(g)中,僅分析包含特定遺傳元件的富集的核苷酸序列片段的序列以鑒 定牽涉與遺傳元件的相互作用的核苷酸序列,本發(fā)明的方法可以用于分析三維結(jié)構(gòu)中特定 遺傳元件與其它核苷酸序列的相互作用。
[0000]遺傳元件可以包含用于轉(zhuǎn)錄因子或絕緣子(insulator)或屏障元件的結(jié)合位點(diǎn)。
[0061] 遺傳元件可以在感興趣的區(qū)域中,例如經(jīng)常牽涉或接近疾病中重排或缺失的基因 組區(qū)域的元件。
[0062] 本發(fā)明的方法也可以用于通過分析包含基因的感興趣區(qū)域中的相互作用的數(shù)目、 類型或密度而確定基因的表達(dá)狀態(tài)。
[0063] 方法可以用于比較兩種樣品間的基因活性,通過分析這兩種樣品,并且比較感興 趣區(qū)域中的相互作用的數(shù)目、類型或密度進(jìn)行。
[0064]方法可以用于鑒定哪個(gè)蛋白質(zhì)(如轉(zhuǎn)錄因子)負(fù)責(zé)特定的相互作用。
[0065]例如,樣品可:來自同一受試者的不同組織;來自不同時(shí)間點(diǎn)里的單一受試者;來 自不同受試者(例如健康/患病/疑似患病的受試者)的等同組織。
[0066]方法可用于鑒定一種或多種指示特定疾病狀態(tài)的DNA-DNA相互作用,通過分析來 自患病細(xì)胞和非患病細(xì)胞的交聯(lián)DNA的樣品,來自患病細(xì)胞和非患病細(xì)胞的DNA序列之間的 三維染色質(zhì)結(jié)構(gòu)中核苷酸序列相互作用間的差異顯示DNA-DNA相互作用或DNA-DNA相互作 用的模式指示特定的疾病狀態(tài)。
[0067]本發(fā)明的方法可以在診斷或預(yù)后由DNA-DNA相互作用的變化引起的或與DNA-DNA 相互作用的變化有關(guān)的疾病或綜合征中使用。在這點(diǎn)上,步驟(a)牽涉提供來自受試者的交 聯(lián)DNA的樣品;并且步驟(g)牽涉與不受影響的對(duì)照比較DNA序列之間的相互作用;對(duì)照和所 述受試者之間的差異指示受試者正患有疾病或綜合征或者指示受試者會(huì)患有疾病或綜合 征。
[0068]疾病可以是遺傳性遺傳病,或體細(xì)胞遺傳病,如癌癥。
[0069]在第二個(gè)方面,本發(fā)明還提供了用于鑒定一種或多種調(diào)控DNA的三維結(jié)構(gòu)的作用 劑的測(cè)定方法,其包括下述步驟:
[0070] (a)使樣品與一種或多種作用劑接觸;并
[0071] (b)進(jìn)行本發(fā)明的第一個(gè)方面的方法,其中步驟(a)包括提供來自所述樣品的交聯(lián) DNA;
[0072]其中(i)在存在所述作用劑的情況下的DNA相互作用和(ii)在缺乏所述作用劑的 情況下的DNA相互作用之間的差異指示調(diào)控DNA的所述三維結(jié)構(gòu)的作用劑。
[0073] T2C相對(duì)于已知的5C或HiC方法提供重大的優(yōu)點(diǎn),例如:
[0074] ?如與5C形成對(duì)比每個(gè)限制性片段可以充當(dāng)"觀察點(diǎn)",并且可鑒定所有其相互作 用,無論它們?cè)诙叹嚯x或長距離里或者相對(duì)于其它染色體;
[0075] ?可在不需要HiC需要的大量序列努力的情況下在感興趣的區(qū)域中鑒定基因組的 區(qū)室化,因而顯著降低成本;
[0076] ?當(dāng)與其它技術(shù)相比時(shí)獲得基因座的更好的覆蓋和分辨率。T2C的分辨率基于使 用的限制性酶,但是經(jīng)常為l-l〇Kb等級(jí)的(對(duì)于6bp識(shí)別限制性酶,平均值4_5kb)。這比用常 見的HiC獲得的常見40Kbp聚類提供顯著更好的分辨率。
[0077]發(fā)明詳述
[0078]本發(fā)明涉及用于分析三維DNA結(jié)構(gòu)中核苷酸序列間的相互作用的方法。
[0079] 三維DNA結(jié)構(gòu)
[0080]術(shù)語"三維DNA結(jié)構(gòu)"意指包含具有與蛋白質(zhì)分子中的氨基酸序列的高級(jí)結(jié)構(gòu)類似 的形成DNA雙螺旋的高級(jí)結(jié)構(gòu),例如環(huán)和折疊的DNA的結(jié)構(gòu)。該結(jié)構(gòu)可以僅由DNA構(gòu)成,或者 可以另外包含其它分子,如蛋白質(zhì)。染色質(zhì)是DNA和蛋白質(zhì)之間的復(fù)合物的一個(gè)例子。
[0081] 理想地,本發(fā)明的方法適合于分析基因組的三維染色質(zhì)構(gòu)造。
[0082] 染色質(zhì)的主要功能是1)將DNA包裝成較小的體積以適合于細(xì)胞,2)在DNA上提供錨 定點(diǎn)以容許有絲分裂,和4)控制基因表達(dá)、DNA復(fù)制和修復(fù)。染色質(zhì)的最豐富的蛋白質(zhì)組分 是壓緊DNA的組蛋白。
[0083] 染色質(zhì)的結(jié)構(gòu)取決于幾個(gè)因素??傮w結(jié)構(gòu)取決于細(xì)胞周期的階段:在分裂間期期 間,染色質(zhì)是結(jié)構(gòu)上松散的,從而容許接近轉(zhuǎn)錄和復(fù)制DNA的RNA和DNA聚合酶。分裂間期期 間的染色質(zhì)的局部結(jié)構(gòu)取決于DNA上存在的基因:活躍轉(zhuǎn)錄的DNA編碼基因是最松散包裝 的,并且發(fā)現(xiàn)它們與RNA聚合酶聯(lián)合(稱為常染色質(zhì)),而發(fā)現(xiàn)編碼無活性基因的DNA與結(jié)構(gòu) 蛋白聯(lián)合,并且是更為緊密包裝的(異染色質(zhì))。染色質(zhì)中的結(jié)構(gòu)蛋白的表遺傳化學(xué)修飾也 改變局部染色質(zhì)結(jié)構(gòu),特別是通過甲基化和乙?;瘜?duì)組蛋白蛋白質(zhì)的化學(xué)修飾。由于細(xì)胞 準(zhǔn)備分裂,即進(jìn)入有絲分裂或減數(shù)分裂,染色質(zhì)更緊密包裝以促進(jìn)后期期間的染色體分離。 [0084]在真核細(xì)胞的細(xì)胞核中,分裂間期染色體占據(jù)獨(dú)特的染色體區(qū)域。最近,已經(jīng)鑒定 出較大的兆堿基大小的局部染色質(zhì)相互作用域,稱作"拓?fù)鋵W(xué)域"(Dixon等(2012,Nature 485,376-380)。這些域與約束異染色質(zhì)擴(kuò)散的基因組區(qū)域相關(guān)聯(lián)。所述域在不同細(xì)胞類型 間穩(wěn)定并且在物種間高度保守,這指示了拓?fù)鋵W(xué)域是哺乳動(dòng)物基因組的固有特性。
[0085] 拓?fù)鋵W(xué)域也彼此相互作用,這提示了基因組的可能高級(jí)結(jié)構(gòu)為一系列玫瑰花結(jié) (rosette)樣結(jié)構(gòu)。
[0086] 可以使用本發(fā)明的方法來鑒定和表征基因組、染色體或其部分內(nèi)的拓?fù)鋵W(xué)域或更 高級(jí)結(jié)構(gòu)。
[0087] 基因組的空間構(gòu)造與其生物學(xué)功能密切聯(lián)系,因此了解高級(jí)基因組結(jié)構(gòu)是重要 的。
[0088]雖然理想地,本發(fā)明的方法適合于分析基因組的三維染色質(zhì)構(gòu)造,但是它可以適 用于分析任何三維結(jié)構(gòu)中的核苷酸序列相互作用。
[0089] 核酸(如DNA)能與自身、其它核酸和其它分子(如蛋白質(zhì))自發(fā)形成"四級(jí)結(jié)構(gòu)"???使用本發(fā)明的方法分析任何含有核酸的結(jié)構(gòu)的三維構(gòu)造。例如,可使用該方法調(diào)查和確認(rèn) DNA納米技術(shù)中使用的人工核酸構(gòu)件塊的分層裝配。
[0090] 感興趣的區(qū)域
[0091] 本發(fā)明牽涉分析感興趣的區(qū)域中的核苷酸序列與其它核苷酸序列之間的相互作 用。
[0092] 感興趣的區(qū)域可以是一條(或多條)染色體內(nèi)的感興趣的基因組區(qū)。
[0093] 感興趣的區(qū)域可以包含感興趣的特定遺傳基因座。遺傳基因座是染色體上的基因 或DNA序列或位置的特定位置。感興趣的基因組區(qū)可以包含特定的基因座,如特定基因的序 列,連同一個(gè)或兩個(gè)側(cè)翼區(qū)。例如,感興趣的區(qū)域可以包含在基因的兩側(cè)的約1、2、3或4MB的 序列。
[0094] "其它核苷酸序列",即與感興趣的區(qū)域內(nèi)的核苷酸序列相互作用的核苷酸序列可 自身位于感興趣的區(qū)域中,或者它們可來自其它區(qū)域,如相同染色體的其它部分,或者來自 不同染色體。如果遇到基因調(diào)節(jié)已經(jīng)改變或者基因喪失的疾病,那么與此類區(qū)域的相互作 用可以改變。
[0095] DNA
[0096] 3D DNA結(jié)構(gòu)可包含基因組DNA:其由一個(gè)或多個(gè)基因組基因座組成或者包含一個(gè) 或多個(gè)基因組基因座。
[0097] 方法
[0098]本發(fā)明的方法包括下列步驟:
[00" ] (a)提供交聯(lián)的DNA的樣品;
[0100] (b)用第一限制性酶消化交聯(lián)的DNA;
[0101] (c)連接交聯(lián)的核苷酸序列;并
[0102] (d)反轉(zhuǎn)交聯(lián)。
[0103] 本發(fā)明的方法的這前四個(gè)步驟類似于記載于Dekker等(2002)Science295:1306的 染色體構(gòu)象捕捉(3C)和4C(Capture and Characterise Colocalised Chromatin)(其記載 于TO 2007/004057)的那些步驟。
[0104]可使用已知的方法,如由Splinter等·,(2004)Methods Enzymol · 375,493-507描 述的方法制備3C樣模板。簡言之,使用交聯(lián)劑(如甲醛)固定樣品(如細(xì)胞、組織或細(xì)胞核)。 然后,進(jìn)行一級(jí)限制性酶消化,使得在交聯(lián)的細(xì)胞核的背景中消化DNA。然后,在低DNA濃度 進(jìn)行分子內(nèi)連接,所述低DNA濃度相對(duì)于非交聯(lián)DNA片段間的連接(即分子間或隨機(jī)連接)有 利于交聯(lián)的DNA片段間的連接(即分子內(nèi)連接)。接著,反轉(zhuǎn)交聯(lián)并可純化DNA。產(chǎn)生的3C模板 含有連接的限制性片段,因?yàn)樗鼈冏畛踉诩?xì)胞核空間中是接近的。
[0105]由于在分子內(nèi)連接步驟前使用一級(jí)限制性酶消化DNA,用于一級(jí)限制性酶的酶識(shí) 別位點(diǎn)會(huì)分開第一(靶)核苷酸序列和已經(jīng)連接的核苷酸序列。因而,一級(jí)限制性酶識(shí)別位 點(diǎn)位于第一(靶)核苷酸序列和連接的核苷酸序列(即連接的第二序列)之間。
[0106] 交聯(lián)
[0107] 可以使用交聯(lián)劑(如甲醛)交聯(lián)蛋白質(zhì)與其它鄰近的蛋白質(zhì)和核酸。如此,兩個(gè)或 更多個(gè)核苷酸序列可以經(jīng)由與這些核苷酸序列(之一)結(jié)合的蛋白質(zhì)而交聯(lián)。與甲醛不同的 交聯(lián)劑也可根據(jù)本發(fā)明使用,包括那些直接交聯(lián)核苷酸序列的交聯(lián)劑。交聯(lián)DNA的作用劑的 例子包括但不限于UV光、絲裂霉素 C、氮芥、美法侖(melphalan)、l,3-丁二烯二環(huán)氧化物(1, 3-butadiene diepoxide)、順二胺二氯鉬(II)和環(huán)磷酰胺。
[0108] 合適地,交聯(lián)劑會(huì)形成交聯(lián),所述交聯(lián)橋接相對(duì)較短的距離,如約2A,由此選擇可 反轉(zhuǎn)的密切相互作用。
[0109] 例如,可通過于室溫在2%甲醛中溫育細(xì)胞,如通過將IX 107個(gè)細(xì)胞在10ml補(bǔ)充有 2%甲醛的DMEM-10%FCS中于室溫溫育10分鐘進(jìn)行交聯(lián)。
[0110] 用限制性酶消化
[0111] 用第一限制性酶消化交聯(lián)的DNA。
[0112] 限制性內(nèi)切核酸酶是切割DNA的糖-磷酸主鏈的酶。在大多數(shù)實(shí)際背景中,給定的 限制性酶切割僅幾個(gè)堿基的區(qū)段內(nèi)的雙鏈體DNA的兩條鏈。限制性酶的底物是稱作識(shí)別位 點(diǎn)/序列的雙鏈DNA序列。
[0113] 限制性識(shí)別位點(diǎn)的長度隨使用的限制性酶而變化。識(shí)別序列的長度決定酶會(huì)多么 頻繁地在DNA的序列中切割。
[0114] 識(shí)別DNA的4bp序列的限制性酶以及其限制性位點(diǎn)包括:AATT(TspEI)、ACGT (MaeII)、AGCT(AluI)、CATG(NlaIII)、CCGG(HpaII)、CGCG(FnuDII)、CTAG(MaeI)、GATC (DpnI、DpnII、Sau3AI和MboI)、GCGC(HhaI)、GGCC(HaeIII)、GTAC(RsaI)、TCGA(TaqI)、TGCA (CviRI)、TTAA(MseI)、CCCG(Sthl32I)、CCGC(AciI)和CCTC(Mnll)。
[0115] 識(shí)別DNA的6bp序列的限制性酶以及其限制性位點(diǎn)包括:AACGTT(AclI)、AAGCTT (Hindlll)、AATATT(SspI)、ACATGT(BspLUlII)、ACCGGT(AgeI)、ACGCGT(MluI)、ACTAGT (Spel)、AGATCT(BglII)、AGCGCT(Eco47III)、AGGCCT(StuI)、AGTACT(ScaI)、ATCGAT(ClaI)、 ATGCAT(AvaIII)、ATTAAT(VspI)、CAATTG(MfeI)、CACGTG(PmaCI)、CAGCTG(PvuII)、CATATG (NdeI)、CCATGG(NcoI)、CCCGGG(Smal)、CCGCGG(SacII)、CCTAGG(AvrII)、CGATCG(PvuI)、 CGGCCG(XmaIII)、CGTACG(Sp11)、CTCGAG(XhoI)、CTGCAG(P s 11)、CTTAAG(AfllI)、GAATTC (EcoRI)、GACGTC(AatII)、GAGCTC(SacI)、GATATC(EcoRV)、GCATGC(SphI)、GCCGGC(NaeI)、 GCGCGC(BsePI)、GCTAGC(NheI)、GGATCC(BamHI)、GGCGCC(NarI)、GGGCCC(ApaI)、GGTACC (Kpnl)、GTATAC(SnaI)、GTCGAC(SalI)、GTGCAC(ApaLI)、GTTAAC(HpaI)、TACGTA(SnaBI)、 TCATGA(BspHI)、TCCGGA(BspMII)、TCGCGA(NruI)、TCTAGA(XbaI)、TGATCA(BclI)、TGCGCA (MstI)、TGGCCA(BalI)、TGTACA(Bspl407I)、TTATAA(PsiI)、TTCGAA(AsuIlWPTTTAAA (AhaIII)〇
[0116] 識(shí)別DNA的7bp序列的限制性酶以及其限制性位點(diǎn)包括:CCTNAGG( Saul)、GCTNAGC (EspI)、GGTNACC BstEII和TCCNGGA Pfol。
[0117] 識(shí)別DNA的8bp序列的限制性酶以及其限制性位點(diǎn)包括:ATTTAAAT ( Swa I)、 CCTGCAGG(Sse8387I)、CGCCGGCG(Sse232I)、CGTCGACG(SgrDI)、GCCCGGGC(SrfI)、GCGATCGC (Sgfl)、GCGGCCGC(NotI)、GGCCGGCC(FseI)、GGCGCGCC(AscI)、GTTTAAAC(PmeI)和TTAATTAA (PacI)〇
[0118] 還有識(shí)別簡并序列的限制性酶,所述簡并序列意味著兩個(gè)或更多個(gè)堿基可能在識(shí) 別序列中的特定位置處,從而有效產(chǎn)生識(shí)別的DNA的3或5bp序列。也可以使用酶的組合來有 效識(shí)別2bp,例如邱7〇121¥、]^?1、把1^11和了391的組合有效識(shí)別2&?序列〇6。
[0119] 第一限制性酶(或酶的組合)可識(shí)別DNA的2、4、5、6、7或8bp序列。
[0120] 特別地,第一限制性酶可以是6-切割劑,如Hindlll或Bglll。
[0121] 第二限制性酶(或酶的組合)可以識(shí)別DNA的2或4bp序列或者替換為非特異性核酸 酶(在該情況中,僅會(huì)應(yīng)用有限的消化)或機(jī)械片段化。
[0122] 連接和交聯(lián)的反轉(zhuǎn)
[0123] 然后,消化步驟繼之以稀釋條件下的連接,所述稀釋條件有利于分子內(nèi)相互作用 和經(jīng)由相容末端的DNA連接。
[0124] 可通過添加酶連接酶誘導(dǎo)連接。
[0125] 可在低DNA濃度(如約l-5ngAU)進(jìn)行連接反應(yīng)。
[0126] 可通過添加作用劑如蛋白酶K反轉(zhuǎn)交聯(lián)。
[0127] 方法的其它步驟
[0128] 本發(fā)明的方法還可牽涉:
[0129] e)使連接的DNA片段化,例如用第二限制性酶(如4bp識(shí)別酶)或其它核酸酶或者通 過機(jī)械剪切進(jìn)行。在后一種情況中,可修復(fù)DNA末端以變?yōu)槠蕉耍瑥亩菰S添加銜接頭序列。 [0130] (f)連接銜接頭序列,其含有容許區(qū)分樣品(含有具有不同特定序列的接頭的另一 種樣品)的特定序列和/或容許尚通量測(cè)序的序列。
[0131] g)使連接的樣品與代表一種或多種基因組基因座的一種寡核苷酸探針或寡核苷 酸探針組雜交。一種寡核苷酸探針或寡核苷酸探針組基于其與如在步驟(a)中的第一識(shí)別 位點(diǎn)的接近和其雜交溫度選擇。后者依賴于其長度和堿基組成。組中的不同寡核苷酸探針 應(yīng)當(dāng)具有相似的雜交/熔解溫度。此外,它們應(yīng)當(dāng)是獨(dú)特的,從而防止重復(fù)DNA的雜交。寡核 苷酸探針可附著于固體表面或者含有標(biāo)簽,如生物素,其容許在固體表面,優(yōu)選鏈霉親合素 珠上捕獲。
[0132] (h)在雜交后嚴(yán)格清洗雜交的固體表面以除去非雜交的材料。
[0133] (i)洗脫雜交的材料。
[0134] (j)例如通過配對(duì)末端11 lumina測(cè)序來對(duì)雜交的材料測(cè)序。
[0135] (k)使用生物信息學(xué)將序列返回定位到基因組,并且產(chǎn)生相互作用的矩陣。
[0136] 片段化
[0137] 可通過本領(lǐng)域中已知的各種方法,如用第二限制性酶或其它核酸酶消化;使用放 射或重離子;或者機(jī)械手段,如超聲處理或剪切使連接的DNA分子片段化。
[0138] 第二限制性酶應(yīng)當(dāng)比方法的步驟(b)中使用的第一限制性酶更頻繁切割DNA。第二 限制性酶可比第一限制性酶識(shí)別更短或更常見的DNA區(qū)段(識(shí)別位點(diǎn))。
[0139] 若第一限制性酶是6_8bp切割劑,則第二限制性酶可為例如2或4-切割劑。
[0140] 例如,第二限制性酶可為4-切割劑,如Dpn II或Nlalll。
[0141] 第二限制性酶(或酶的組合)可識(shí)別DNA的2或4bp序列或者替換為非特異性核酸酶 (在該情況中,僅會(huì)應(yīng)用有限的消化)或機(jī)械片段化。存在有大量的非序列特異性核酸酶,如 微球菌核酸酶或DNA酶I。
[0142] 在機(jī)械方法(如剪切)、非特異性核酸酶或使用放射或重離子處理后,可需要通過 標(biāo)準(zhǔn)方法"修復(fù)"核苷酸序列的末端以容許下一步。
[0143] 銜接頭
[0144] 為了測(cè)序目的,可將銜接頭與來自步驟(e)的片段的末端連接,即以實(shí)現(xiàn)用于方法 如Illumina方法的序列分析。
[0145] 銜接頭可包含地址序列。對(duì)不同樣品使用不同地址序列以容許多路復(fù)用(使不同 樣品與相同的寡核苷酸探針組雜交),其中地址序列容許序列與衍生它的樣品匹配。當(dāng)使用 多種樣品或內(nèi)部摻加時(shí),地址序列是有用的。
[0146] 在雜交前添加銜接頭序列是優(yōu)選的。有可能通過雜交后的連接添加它們,但是可 能不太有效,因?yàn)镈NA作為單鏈DNA脫離雜交。
[0147] 雜交
[0148] 在方法的步驟(f)中,使核苷酸序列片段與一種或多種寡核苷酸探針雜交以富集 含有相互作用的核苷酸序列的片段。
[0149] 寡核苷酸探針附著于固體支持物或者可以在固體支持物上捕獲,如陣列或珠(參 見下文)。
[0150] 寡核苷酸探針基于來自感興趣區(qū)域的序列設(shè)計(jì),記住第一限制性酶的限制性位點(diǎn) 的位置。
[0151] 每個(gè)寡核苷酸探針對(duì)應(yīng)于與第一限制性位點(diǎn)接近定位的序列。本發(fā)明的方法的步 驟(d)中生成的連接的DNA分子包含在第一限制性酶的識(shí)別位點(diǎn)處連接的不同核苷酸序列。 不同核苷酸序列在三維結(jié)構(gòu)中"相互作用"(即,足夠緊密接近以進(jìn)行交聯(lián))。當(dāng)使連接的分 子片段化時(shí),一些片段會(huì)通過內(nèi)部片段化(例如通過第二限制性酶的內(nèi)部消化)源自單一核 苷酸序列。其它片段會(huì)源自相互作用的核苷酸序列兩者。
[0152] 通過選擇具有與第一限制性位點(diǎn)接近定位的序列的片段,對(duì)片段富集那些代表 "相互作用片段"的片段,即包含通過連接步驟(c)在第一限制性酶的識(shí)別位點(diǎn)處連接的兩 個(gè)核苷酸序列的部分。
[0153]寡核苷酸探針
[0154] 適當(dāng)?shù)?,寡核苷酸探針的長度會(huì)是至少15、20、25、30或40個(gè)核苷酸。
[0155] 寡核苷酸探針設(shè)計(jì)為盡可能接近第一限制性酶的限制性酶識(shí)別位點(diǎn)。術(shù)語"接近" 意指寡核苷酸探針設(shè)計(jì)為使得它們識(shí)別與第一限制性酶識(shí)別位點(diǎn)相距約1〇〇個(gè)核苷酸,如 約 90、80、70、60、50、40、30、20、10、9、8、7、6、5、4、3、2或1個(gè)核苷酸內(nèi)的位點(diǎn)。
[0156]若感興趣的區(qū)域具有X個(gè)第一限制性酶(RE1)識(shí)別位點(diǎn),則用RE1的消化會(huì)產(chǎn)生X+1 個(gè)片段。這些片段會(huì)在兩個(gè)末端都具有RE1識(shí)別位點(diǎn),因此有必要設(shè)計(jì)2X個(gè)寡核苷酸探針以 涵蓋感興趣的區(qū)域中的所有片段。
[0157] 寡核苷酸探針的文庫可以包含對(duì)基本上所有限制性片段特異性的寡核苷酸,所述 限制性片段可通過用第一限制性酶處理感興趣的區(qū)域獲得。"基本上所有"在此背景中意指 限制性片段-側(cè)翼位點(diǎn)的至少60、70、80、90、95或99%。
[0158] 有時(shí)不可能設(shè)計(jì)代表末端之一的寡核苷酸探針,例如:
[0159] (i)序列可以是重復(fù)的;
[0160] (ii)第二識(shí)別酶位點(diǎn)(RE2)可以過于接近RE1位點(diǎn);
[0161] (iii)兩個(gè)RE1位點(diǎn)之間沒有RE2位點(diǎn)。(當(dāng)使用非特異性核酸酶或機(jī)械片段化時(shí), 這不適用)。
[0162] 若適用任何上述限制,則可以從寡核苷酸探針組中省略針對(duì)該特定RE1限制性片 段或其末端的寡核苷酸探針,但是寡核苷酸組仍會(huì)含有針對(duì)"基本上所有" RE1-側(cè)翼位點(diǎn)的 寡核苷酸探針。
[0163] 分析
[0164] 一旦已經(jīng)對(duì)片段富集那些代表"相互作用"的片段,可以通過測(cè)序表征參與相互作 用的核苷酸序列。
[0165] 可使用已知的技術(shù),如11 lumina系統(tǒng)實(shí)施成對(duì)末端測(cè)序。
[0166] 可以將銜接頭序列優(yōu)選在步驟(f)前或不太優(yōu)選在步驟(f)后與來自(e)的核苷酸 序列片段的一個(gè)或兩個(gè)末端連接,從而可在陣列上捕獲連接的核苷酸序列片段,對(duì)其擴(kuò)增 和/或測(cè)序。銜接頭序列可提供地址以在同一陣列上分析幾個(gè)樣品(即多路復(fù)用)時(shí)識(shí)別樣 品。有可能在Illumina儀的一條道中多路復(fù)用8份樣品,目前每道產(chǎn)生± 1.5億個(gè)序列讀出。
[0167] 更為詳細(xì)地,可以對(duì)片段進(jìn)行末端修復(fù)和A加尾,并且將索引化(indexed)銜接頭 與經(jīng)A加尾的DNA片段連接。
[0168] 可捕捉、洗脫和PCR擴(kuò)增所得的經(jīng)銜接頭修飾的DNA文庫。在本發(fā)明的方法中,可以 不在富集步驟(步驟(f))前對(duì)片段進(jìn)行PCR擴(kuò)增。
[0169] 然后,可通過已知的技術(shù)(例如使用IIlumina簇試劑和HiSeq 2000測(cè)序儀)進(jìn)行簇 產(chǎn)生和高通量測(cè)序。
[0170] 可以通過產(chǎn)生二維熱圖可視化相互作用頻率,如先前描述的(Liberman-Aiden等 (Science 2009 326:289-293;Dixon等(2012,如上文)??梢酝ㄟ^以與連鎖不平衡圖相似的 方式鑒定源自每個(gè)基因座的對(duì)角線相交的偏軸點(diǎn)來可視化任何兩個(gè)基因座間的相互作用 頻率。
[0171] 圖上的每個(gè)點(diǎn)代表兩個(gè)片段(緊密接近的兩個(gè)片段)間的相互作用點(diǎn)。圖上的每個(gè) 相互作用點(diǎn)的強(qiáng)度相對(duì)于其代表的片段的相互作用頻率/接近性。對(duì)角線上的點(diǎn)代表自身 連接效應(yīng)以及與緊密鄰近片段的連接??梢暬旧鲜蔷仃嚪治觥?br>[0172] 樣品
[0173]樣品可以是包含DNA的任何物理實(shí)體,所述DNA被交聯(lián)或能夠被交聯(lián)。樣品可以是 或可以源自生物學(xué)材料。
[0174]樣品可以是或者可以源自一種或多種細(xì)胞、一種或多種細(xì)胞核、或一種或多種組 織樣品。實(shí)體可以是或者可為可源自存在DNA (如染色質(zhì))的任何實(shí)體。樣品可以是或者可以 源自一種或多種分離的細(xì)胞或一種或多種分離的組織樣品,或者一種或多種分離的細(xì)胞 核。
[0175] 樣品可以是或者可以源自活細(xì)胞和/或死細(xì)胞和/或核裂解物和/或分離的染色 質(zhì)。
[0176] 樣品可以是或者可以源自患病和/或非患病受試者的細(xì)胞。
[0177] 樣品可以是或者可以源自懷疑患有疾病的受試者。
[0178] 樣品可以是或者可以源自要測(cè)試他們將來會(huì)患有疾病的可能性的受試者。
[0179] 樣品可以是或者可以源自存活或非存活患者材料。
[0180] 可以將標(biāo)準(zhǔn)樣品添加至每個(gè)實(shí)驗(yàn)樣品(摻加)以容許不同樣品間的更好比較,因?yàn)?可以使用摻加樣品的序列讀出標(biāo)準(zhǔn)化樣品。摻加樣品可以來自與實(shí)驗(yàn)樣品不同的物種,以 容許在第一步時(shí)以細(xì)胞形式摻加,或者,摻加樣品可以具有其自身地址或者當(dāng)在規(guī)程中的 后來階段摻加時(shí)來自不同物種。
[0181] 陣列
[0182] 通常,寡核苷酸探針組會(huì)在支持物上固定化或者在固體支持物(如珠)上捕獲。支 持物(例如固體支持物)可以由多種材料制成,如玻璃、硅土、塑料、尼龍或硝酸纖維素。當(dāng)附 著于固體支持物時(shí),它優(yōu)選是剛性的并且具有平坦表面。支持物通常具有約1-10,000,000 個(gè)離散空間可尋址區(qū)域,或細(xì)胞。具有約10-1,〇〇〇,〇〇〇或約100-100,000或約1000-100,000 個(gè)細(xì)胞的支持物是常見的。細(xì)胞密度通常是1平方厘米內(nèi)的至少約1000、10,〇〇〇、100,〇〇〇或 1,000,000個(gè)細(xì)胞。在一些支持物中,所有細(xì)胞由寡核苷酸探針的合并混合物或寡核苷酸探 針組占據(jù)。在其它支持物中,一些細(xì)胞由寡核苷酸探針的匯集混合物或寡核苷酸探針組占 據(jù),而其它細(xì)胞至少在通過合成方法可獲得的純度程度上由單一類型的寡核苷酸占據(jù)。
[0183] 對(duì)于識(shí)別>6bp識(shí)別序列的限制性酶,可以使用約2x 750,000個(gè)寡核苷酸探針的單 一陣列以在每個(gè)限制性位點(diǎn)的每側(cè)的1個(gè)寡核苷酸探針覆蓋例如完全人或小鼠基因組。
[0184] 溶液中的寡核苷酸探針
[0185] 溶液中的寡核苷酸探針可以含有可以在固體表面上捕獲的模塊,如含有可以通過 鏈霉親合素珠捕獲的生物素的寡核苷酸。溶液中的雜交可以是更有效的。
[0186] 捕獲可以在雜交后發(fā)生。
[0187] 雜交
[0188] 如本文中使用的,術(shù)語"雜交"應(yīng)當(dāng)包括"核酸鏈經(jīng)由堿基配對(duì)與互補(bǔ)鏈連接的過 程"。
[0189] 能夠選擇性雜交的核苷酸序列一般在寡核苷酸探針的長度里會(huì)與相應(yīng)的互補(bǔ)核 苷酸序列是至少75%、85%、90%、95%或98%同源的。選擇性是由雜交期間的鹽和溫度條 件確定的。
[0190] "特異性雜交"指在嚴(yán)格條件(例如65°(:和0.1133(:{^330 = 0.151恥(:1,0.0151檸 檬酸鈉 pH 7.0})下分子僅對(duì)特定核苷酸序列的結(jié)合、雙鏈化或雜交。嚴(yán)格條件是寡核苷酸 探針會(huì)與其靶序列,而不與其它序列雜交的條件。嚴(yán)格條件是序列依賴性的,并且在不同情 況中是不同的。較長的序列在較高的溫度特異性雜交。一般地,非常嚴(yán)格的條件選擇為在限 定的離子強(qiáng)度和pH比特定序列的熱熔點(diǎn)(Tm)低約5°C。雜交溫度是低于熔點(diǎn)(Tm)的溫度,并 且雜交溫度越接近Tm,雜交越嚴(yán)格,這意味著錯(cuò)配的DNA序列不會(huì)彼此雜交。寡核苷酸序列 應(yīng)當(dāng)過量超過基因組DNA以確保有效的,優(yōu)選完全的雜交,從而確保定量的雜交。通常,嚴(yán)格 條件包括于pH 7.0至8.3的至少約0.01至1.0M Na離子濃度(或其它鹽)的鹽濃度。也可以通 過添加去穩(wěn)定劑,如甲醛或四烷基銨鹽(tetraalkyl ammonium salt)實(shí)現(xiàn)嚴(yán)格條件。
[0191] 本發(fā)明現(xiàn)在會(huì)通過實(shí)施例進(jìn)一步描述,所述實(shí)施例意圖用來幫助本領(lǐng)域普通技術(shù) 人員實(shí)施本發(fā)明,并且不以任何方式意圖限制本發(fā)明的范圍。 實(shí)施例
[0192] 實(shí)施例1:T2C鑒定已知的長范圍相互作用
[0193] 為了測(cè)試方法并且將其與其它方法比較,發(fā)明人首先選擇人染色體11上的IGF/ H19區(qū),其先前已經(jīng)用于研究粘結(jié)蛋白和CTCF對(duì)于染色體長范圍相互作用的作用,并且關(guān)于 該IGF/H19區(qū)的Hi-C和4C數(shù)據(jù)已經(jīng)可用于比較(圖2)。
[0194] 設(shè)計(jì)一組基于陣列的寡核苷酸,它們?cè)诟采wH19基因座的約2.1Mbp區(qū)的所有Bglll 片段的末端附近定位,總計(jì)為對(duì)應(yīng)于344個(gè)Bglll片段的524個(gè)寡核苷酸。許多Bglll片段不 容許設(shè)計(jì)代表末端之一的寡核苷酸,因?yàn)樾蛄惺侵貜?fù)的或者4bp識(shí)別酶位點(diǎn)(Nlalll)太接 近Bglll位點(diǎn)或者從Bglll片段中完全缺乏。將交聯(lián)的經(jīng)Bglll限制的DNA連接,去交聯(lián),用 Nlain酶消化,并且在去交聯(lián)后與寡核苷酸陣列雜交(參見方法)。
[0195]如對(duì)HiC使用的首先用基因組的40kb框并法(binning)分析測(cè)序的連接產(chǎn)物證明 了T2C揭示與由Dixon等((2012),如上文)對(duì)IMR90細(xì)胞觀察到的相似的總體相互作用模式 (還觀察到區(qū)域外部或與其它染色體的相互作用,但是沒有顯示)。這也與不同細(xì)胞系間的 總體構(gòu)造特征,如拓?fù)鋵W(xué)域的先前觀察到的保守相一致(圖2A+B)。
[0196] 然而,憑借T2C,獲得限制性片段分辨率的相互作用圖(圖2C),這就區(qū)域的一般染 色質(zhì)構(gòu)造和基因與其調(diào)節(jié)元件之間的接觸而言揭示了更多詳情。為了比較T2C的此染色質(zhì) 結(jié)構(gòu)信息,將該數(shù)據(jù)與4C數(shù)據(jù)比較,并且繪制對(duì)特定的CTCF觀察點(diǎn)獲得的4C數(shù)據(jù),緊鄰于對(duì) T2C數(shù)據(jù)中存在的相同觀察點(diǎn)觀察到的相互作用數(shù)據(jù)(圖2D)。
[0197] 雖然個(gè)別相互作用的讀出覆蓋有一些變化,但是可以通過4C和T2C觀察到相同的 相互作用。因此,T2C方法產(chǎn)生可重復(fù)的結(jié)果,忠實(shí)地檢測(cè)相互作用(或者緊密接近)的片段, 清楚再現(xiàn)拓?fù)鋵W(xué)域中的總體基因組結(jié)構(gòu),并且給出對(duì)6bp識(shí)別限制性片段預(yù)期的4-5kbp左 右的分辨率。
[0198] 實(shí)施例2:基于不同生物學(xué)材料,T2C鑒定不同相互作用網(wǎng)絡(luò)
[0199] 為了還測(cè)試不同基因表達(dá)狀態(tài)是否可以在具有不同染色質(zhì)相互作用的不同生物 學(xué)組織中檢出,在來自E12.5小鼠的小鼠胎肝的體內(nèi)小鼠原代紅系細(xì)胞和小鼠胎腦細(xì)胞中 應(yīng)用T2C。使用充分研究的β-珠蛋白基因座作為基因周圍的約2MB的區(qū)域中的一個(gè)例子。完 善建立的是,由于與胎腦細(xì)胞相比,珠蛋白在原代紅系細(xì)胞中更高度表達(dá),在此細(xì)胞類型 中在基因周圍和基因和其基因座控制區(qū)(LCR)之間預(yù)期更密集的相互作用數(shù)目。用Hindlll 作為6bp酶消化β-珠蛋白區(qū),并且設(shè)計(jì)799個(gè)寡核苷酸探針以覆蓋基因座中的HindllI片段 的末端(724個(gè)片段,其中許多是重復(fù)的),并且在交聯(lián)后用DpnII再消化。
[0200] 在用DpnII切割后分析雜交的片段顯示了小鼠原代紅系細(xì)胞和小鼠胎腦細(xì)胞兩者 中感興趣的區(qū)域(~2MB)中的5個(gè)拓?fù)鋵W(xué)域,每個(gè)拓?fù)鋵W(xué)域內(nèi)有許多相互作用。拓?fù)鋵W(xué)域也 彼此相互作用,提示了基因組的可能高級(jí)結(jié)構(gòu)為一系列玫瑰花結(jié)樣結(jié)構(gòu)。雖然不同生物學(xué) 材料間的拓?fù)鋵W(xué)域數(shù)目似乎是相同的,但是與小鼠原代紅系細(xì)胞相比,拓?fù)鋵W(xué)域之內(nèi)和之 間的相互作用在小鼠胎腦細(xì)胞中似乎不太密集(圖3)。對(duì)所有β-珠蛋白區(qū)的放大顯示了胎 肝材料中的β-珠蛋白基因座中的所有已知的相互作用。清楚地可視化所述相互作用,如β-珠蛋白啟動(dòng)子和LCR之間及LCR-3 ' HS1之間的(圖3)。這些是胎腦樣品中缺乏的。此外,可能 鑒定比直到現(xiàn)在對(duì)β-珠蛋白啟動(dòng)子報(bào)告的相互作用更遠(yuǎn)離的新的其它相互作用。這些定位 于距β-珠蛋白啟動(dòng)子遠(yuǎn)達(dá)~IMbp。
[0201]還比較胎肝細(xì)胞中的重要調(diào)節(jié)轉(zhuǎn)錄因子(LDB1復(fù)合物或結(jié)構(gòu)因子CTCF)的結(jié)合位 點(diǎn)的相互作用。當(dāng)與胎腦細(xì)胞相比時(shí),LDB1在小鼠原代紅系細(xì)胞中在β-珠蛋白基因座及其 LCR上高度富集。通過僅可視化含有LDB1或CTCF轉(zhuǎn)錄因子結(jié)合位點(diǎn)的限制性片段,如通過 ChIP-seq測(cè)定的(例如Soler等(2010)GenesDev;24(3):277-89),可能立即推斷出所有相 互作用中的哪些相互作用牽涉LDB1復(fù)合物或CTCF(圖4)。還清楚的是,當(dāng)與小鼠腦細(xì)胞相比 時(shí),在小鼠原代紅系細(xì)胞中,更多的LDB1占據(jù)的限制性片段與基因座中的其它位置具有相 互作用(圖4)。另外,當(dāng)與胎腦相比時(shí),緊密接近的兩個(gè)片段間的距離的均值在胎肝細(xì)胞中 更大,表明基因組的此區(qū)域在胎肝中不太凝聚(圖5)。
[0202]因此,T2C是一種可用于檢測(cè)拓?fù)鋵W(xué)域和該域內(nèi)的不同相互作用的工具,這取決于 基因的表達(dá)狀態(tài),如原代胎肝細(xì)胞中的活性珠蛋白基因座對(duì)胎腦中的相同沉默基因座。 另外,高水平的相互作用分辨率容許新的觀察結(jié)果,如對(duì)珠蛋白基因座LDB1結(jié)合位點(diǎn)和 環(huán)大小顯示的。經(jīng)由相互作用信號(hào)的變化,如例如由DNA缺失引起的β-地中海貧血中的基因 座內(nèi)的缺失會(huì)立即可見。
[0203] 討論
[0204]染色質(zhì)相互作用在基因調(diào)節(jié)中的作用的重要性是完善建立的。然而,越來越需要 一種快速、容易且負(fù)擔(dān)得起的技術(shù)來提供關(guān)于相互作用和基因組的區(qū)室化的信息。T2C滿足 這些需要。每個(gè)限制性片段可以充當(dāng)"觀察點(diǎn)",并且可以鑒定所有其相互作用,短或長或?qū)?其它染色體(本文未顯示)。如此,不必進(jìn)行多個(gè)3C_seq、4C或5C實(shí)驗(yàn)。此外,憑借T2C,可在不 需要HiC需要的大量序列努力(這顯著增加成本)的情況下在感興趣的區(qū)域中鑒定基因組的 區(qū)室化。
[0205]由于T2C的設(shè)計(jì),當(dāng)與其它技術(shù)相比時(shí)獲得了基因座的更好的覆蓋和分辨率。T2C 的分辨率基于使用的限制性酶。用Hindll I或Bgl II消化來自原代紅系細(xì)胞和HB2細(xì)胞的交 聯(lián)的染色質(zhì)分別導(dǎo)致2.9Kb和6.1Kb的平均分辨率。這提供了比用HiC獲得的常見40Kbp聚類 顯著更好的分辨率。此外,為了測(cè)序目的通過在連接到片段上(在雜交前的第二次切割后) 的寡核苷酸中添加合適的地址容許不同樣品對(duì)相同寡核苷酸組的多路復(fù)用,因?yàn)榈刂沸蛄?鑒定衍生它的樣品。多路復(fù)用進(jìn)一步降低T2C的成本。
[0206] 此外,比較T2C與3C-seq和HiC(對(duì)于Igf2基因座)及與先前對(duì)β-珠蛋白基因座發(fā)表 的3C_qPCR數(shù)據(jù),鑒定出相同的拓?fù)鋵W(xué)域和相互作用網(wǎng)絡(luò)。所有這些揭示T2C作為鑒定基因 組的特定區(qū)域的所有相互作用和區(qū)室化的工具的長處。
[0207]如此,T2C是一種負(fù)擔(dān)得起的、劃算的工具,以在不需要費(fèi)力工藝或大規(guī)模測(cè)序努 力的情況下探索基因組的局部空間構(gòu)造和染色質(zhì)相互作用。
[0208] 用于實(shí)施例1和2的材料和方法
[0209] 染色質(zhì)分離和文庫制備
[0210] 將來自小鼠胎肝E12.5的小鼠原代紅系細(xì)胞、小鼠胎腦細(xì)胞和人乳腺內(nèi)皮細(xì)胞 (HB2)的細(xì)胞核分離并交聯(lián)。用6-切割劑(對(duì)于小鼠細(xì)胞的Hindlll和對(duì)于HB2細(xì)胞的Bglll) 消化染色質(zhì),連接,并且去交聯(lián)。從所得的文庫中,用常見的4-切割劑(對(duì)于小鼠細(xì)胞的 DpnII或Nlalll,對(duì)于HB2細(xì)胞的Nlalll)消化50yg DNA。根據(jù)先前描述的3C-seq方案 (Stadhouders,R.等.Nat Protoc 8,509-524(2013))進(jìn)行所有這些步驟。
[0211] 設(shè)計(jì)用于β-珠蛋白基因座的微陣列,其含有盡可能接近跨越基因(chr7: 109875617-111971734,mm9)周圍的~2MB的Hindlll限制性位點(diǎn)的獨(dú)特寡核苷酸。對(duì)于Igf2 基因座,設(shè)計(jì)獨(dú)特的寡核苷酸,其接近跨越~2 . 1ΜB區(qū)域的BgIII限制性位點(diǎn)(ch 11 : 1091427-3228670,hgl9)。通過配對(duì)末端測(cè)序?qū)νㄟ^在微陣列上雜交富集的連接產(chǎn)物進(jìn)行 測(cè)序,對(duì)于第一種或第二種設(shè)計(jì)分別產(chǎn)生超過1億個(gè)獨(dú)特的讀出對(duì)。
[0212] 制備最終的文庫以在Illumina Cluster Station和HiSeq 2000測(cè)序儀上根據(jù)具 有修改的Illumina TruSeq DNA方案(www. illumina. com)分析。簡言之,使用AMPure XP珠 (Beckman Coulter)純化20yg經(jīng)消化的文庫,并且進(jìn)行末端修復(fù)。在存在ATP的情況下使用 Klenow外切酶對(duì)現(xiàn)在的平端片段進(jìn)行A加尾,并且使用AMPure XP珠再次純化。將索引化的 銜接頭(I1 lumina)與經(jīng)A加尾的DNA片段連接,隨后使用AMPure XP珠純化。
[0213]陣列捕獲
[0214]于42°C在定制的NimbleGen Sequence Capture 2· 1M捕捉陣列上根據(jù)NimbleGen Sequence Capture陣列方案( www.nimbiegen.com/seqcapez)在NimbleGen雜交系統(tǒng)上雜交 所得的經(jīng)銜接頭修飾的DNA文庫達(dá)64小時(shí)。從雜交的陣列洗脫捕獲的DNA片段,并且使用 MinElute柱(Qiagen)純化。通過如下使用Phusion聚合酶通過PCR擴(kuò)增捕獲的DNA片段:于98 °C 30秒,24個(gè)循環(huán)(于98°C 10秒,于60°C 30秒,于72°C 30秒),于72°C 5分鐘最終延伸。使 用AMPure XP珠純化PCR產(chǎn)物,并且在30μ1重懸緩沖液中洗脫。使用DNA1000測(cè)定法在 Agilent Technologies 2100Bioanalyzer上加載1微升以測(cè)定文庫濃度并檢查質(zhì)量。
[0215] 簇產(chǎn)生和高通量測(cè)序
[0216] 根據(jù)Illumina簇試劑制備方案(www. illumina. com)進(jìn)行簇產(chǎn)生。簡言之,將ΙμL 10nM TruSeq DNA文庫儲(chǔ)液用NaOH變性,稀釋至9-10ρΜ,并且雜交到流動(dòng)池上。根據(jù) Illumina成對(duì)末端測(cè)序用戶指導(dǎo)方案,將雜交的片段序貫擴(kuò)增,線性化,并且末端封閉。在 測(cè)序引物的雜交后,使用HiSeq 2000測(cè)序儀用101個(gè)循環(huán)的方案根據(jù)制造商的方案進(jìn)行合 成測(cè)序。使用HiSeq 2000將經(jīng)測(cè)序的片段用NaOH變性,并且將索引-引物雜交到片段上。用7 循環(huán)方案對(duì)索引測(cè)序。將片段用NaOH變性,序貫擴(kuò)增,線性化并末端封閉。在測(cè)序引物的雜 交后,使用HiSeq 2000測(cè)序儀用101循環(huán)方案進(jìn)行第三個(gè)讀出的合成測(cè)序。
[0217] 實(shí)施例3:測(cè)定基因組的3D結(jié)構(gòu):
[0218]基因組的動(dòng)態(tài)三維染色質(zhì)構(gòu)造和與其功能的明顯共-進(jìn)化聯(lián)系(遺傳信息的存儲(chǔ) 和表達(dá))在約130年的集合研究后仍然是當(dāng)代的中心問題之一。在此實(shí)施例中,首次可以借 助組合所有物理基因組相互作用(HRHTiCIC 2)的新型卓越選擇性高通量高分辨率染色體相互 作用捕捉、標(biāo)度分析和聚合物模擬的已有視覺手段從幾個(gè)到兆堿基對(duì)水平直接測(cè)定小鼠和 人基因組的詳細(xì)3D構(gòu)造:清楚存在的且差異壓縮的染色質(zhì)纖維折疊成~30-150kbp的環(huán),該 環(huán)形成通過接頭連接的~500-1500kbp的限定環(huán)聚集體/玫瑰花結(jié)(亞染色體域)。存在復(fù)雜 (螺旋)環(huán)和環(huán)-環(huán)構(gòu)造,并且相互作用在不同細(xì)胞類型或功能狀態(tài)之間僅在微小但是顯著 的程度上變化。另外,標(biāo)度分析證明顯示了DNA序列和基因組構(gòu)造之間的緊密進(jìn)化牽連。因 此,這最終打開了通向基因組的詳細(xì)構(gòu)造"測(cè)序"及由此在"基因組不確定性原則"的限制上 真正的系統(tǒng)基因組學(xué)的路徑,其整個(gè)對(duì)于基因組理解及診斷和治療的R&D有基礎(chǔ)的重要性。
[0219] 盡管事實(shí)上基因組的結(jié)構(gòu)和功能作為不能分開的系統(tǒng)明顯共進(jìn)化以容許遺傳信 息的物理存儲(chǔ)和表達(dá),基因組的動(dòng)態(tài)學(xué)三維高級(jí)構(gòu)造、其空間和時(shí)間修飾,或其與功能性多 維相互作用和調(diào)節(jié)網(wǎng)絡(luò)的關(guān)系從17世紀(jì)由A.van Leeuwenhoek發(fā)現(xiàn)細(xì)胞核起和許多其它新 近的里程碑結(jié)果:C.W. !^^8丨丨(1842)/1.!1〇伽6丨8七641848)對(duì)中期染色體,]\^68(31^^(1869) 對(duì)DNA,R · E · Frankl in,L · C · Paul ing,J · D · Watson,和F · Η· Crick,( 1953)對(duì)DNA雙螺旋, 尺.1(〇?^6坪(1973)/^.01丨118&0.01丨118(1974)對(duì)核小體,和1(丄1^641997)對(duì)核小體的30結(jié) 構(gòu)的發(fā)現(xiàn)/描述,直至千禧年之交對(duì)整個(gè)人基因組的測(cè)序都尚未得到詳細(xì)確定。另外,變得 明顯的是基因組構(gòu)造和功能實(shí)際上建造系統(tǒng)基因組(Knoch,2003)實(shí)體,其負(fù)責(zé)基因表達(dá), 由此負(fù)責(zé)個(gè)體和其疾病史間的內(nèi)在差異以及功能性環(huán)境基因組變化的接受者,并由此負(fù)責(zé) 最終外部疾病原因。
[0220] 基因組的大小、結(jié)構(gòu)和復(fù)雜性跨越從ΚΓ9至1〇Λι和10-1()至10 5s的標(biāo)度,如此導(dǎo)致巨 大的實(shí)驗(yàn)挑戰(zhàn):核小體已經(jīng)如何被間隔、定位、重建模,以及核小體鏈在生理學(xué)鹽濃度時(shí)是 否/如何折疊成纖維是不斷討論的事情:例如Finch和Klug(1976)提出規(guī)則螺線管,體內(nèi)中 子散射實(shí)驗(yàn)揭示了 30 ± 5nm的纖維直徑為占優(yōu)勢(shì)的核特征,近來與根本無壓縮,或高度多態(tài) 性和動(dòng)力學(xué)功能依賴性結(jié)構(gòu)形成的對(duì)比,在沒有所述結(jié)構(gòu)的情況下核小體濃度分布、作為 大分子擴(kuò)散的動(dòng)力學(xué)和功能特性、和DNA序列的標(biāo)度是不能解釋的。
[0221] 超過一個(gè)世紀(jì)以來,高級(jí)染色質(zhì)構(gòu)造已經(jīng)成為甚至更大討論的事情:Rabl(1885) 和B〇veri(1909)的光學(xué)顯微研究產(chǎn)生分層自相似模型,這表明了區(qū)域性構(gòu)造,之后電子顯 微術(shù)表明了更隨機(jī)的分裂間期構(gòu)造,如在Comings (1968,1978)和Vogel&Schroeder( 1974) 的模型中。在Paulson&Laemmli( 1980)的放射-環(huán)-骨架(radial-loop-scaffold)模型中,附 著于核基質(zhì)/支架的染色質(zhì)環(huán)應(yīng)當(dāng)解釋中期染色體的凝聚程度。根據(jù)Pienta&Cof fey (1977, 1984發(fā)表),這些環(huán)在分裂間期中持續(xù),并且在中期中形成堆積的玫瑰花結(jié)。C.Crem er& T · Cremer( 1974,1982)的微照射已經(jīng)確認(rèn)并且C · Cremer&T · Cremer( 2001 ),P.Lichter (1988)及此后的出版物的熒光原位雜交(FISH)最終確認(rèn)分裂間期期間染色體、其臂、和亞 染色體域的區(qū)域性構(gòu)造,包括其在中期(去)凝聚期間的結(jié)構(gòu)持續(xù)性(~2500個(gè)亞染色體域 中分開的~850個(gè)G、Q、R和C染色體模式圖(ideogram)條帶)。然而,通過電子顯微術(shù)可視化 染色質(zhì)玫瑰花結(jié)在西半球沒有嚴(yán)肅米納(Erenpreisa, 1989,Belmont&Bruce( 1994)基于電 子顯微術(shù)也提出了螺旋層次染色線纖維(CF)模型,用于內(nèi)-(亞-區(qū)域性折疊。大致在相同時(shí) 間,小FISH標(biāo)記遺傳區(qū)之間的空間距離測(cè)量由于建筑"破壞"而產(chǎn)生隨機(jī)步移/巨大環(huán)(RW/ GL)模型及Sachs第一次分析性成環(huán)聚合物描述(1995 ;Yokota,1995 ;Yokota, 1997 ;Knoch, 1998;1(11〇(*,2002),其中1至51?^環(huán)附著于非蛋白質(zhì)主鏈。此后,使用結(jié)構(gòu)保持?13!1技術(shù)、高 分辨率顯微術(shù)、和染色體和整個(gè)細(xì)胞核的巨大平行聚合物模擬的距離測(cè)量的組合僅可產(chǎn)生 玫瑰花結(jié)多環(huán)亞區(qū)室(MLS)模型,其中60至120kbp環(huán)形成由相似接頭連接的玫瑰花結(jié)。再一 次,核小體濃度分布的體內(nèi)測(cè)量,和作為大分子擴(kuò)散的動(dòng)力學(xué)和功能性特性僅與小環(huán)聚集 體/玫瑰花結(jié)樣染色質(zhì)折疊相容,并且DNA序列的標(biāo)度也預(yù)測(cè)這點(diǎn),因?yàn)榉駝t本文發(fā)現(xiàn)的模 式以其它方式不能解釋。
[0222]另外,由于物理相互作用在功能性化學(xué)反應(yīng)及因此過程鏈的中心,變得明顯的是 含有轉(zhuǎn)錄因子的幾個(gè)結(jié)合位點(diǎn)的短調(diào)節(jié)元件經(jīng)常經(jīng)由巨大基因組分離調(diào)芐基因轉(zhuǎn)錄,如此 其(物理)相互作用可能性的所得變化造成基因表達(dá)的變化,因?yàn)榇祟惤Y(jié)構(gòu)(例如環(huán))的預(yù)先 形成的構(gòu)造或修飾或新形成與空間接近,以及因此變化的相互作用可能性有關(guān)。通過邏輯 推理似乎也已經(jīng)明顯的是,在這些結(jié)構(gòu)的形成中,轉(zhuǎn)錄級(jí)聯(lián)的因子似乎直接或者作為雙重 或多重用例(use case)發(fā)揮重要作用,如例如CTCF或粘結(jié)蛋白。因此,已經(jīng)變得明顯的是, 基因組構(gòu)造和功能性調(diào)節(jié)兩者都是經(jīng)由轉(zhuǎn)錄級(jí)聯(lián)在基因組上負(fù)責(zé)的系統(tǒng),不僅造成個(gè)體和 其疾病史間的內(nèi)在差異,而且繼而也是功能性環(huán)境基因組變化的接受者及因此最終外部疾 病原因。
[0223] 為了測(cè)定是否存在i)局部或多或少壓縮的染色質(zhì)纖維,ii)在環(huán)聚集體/玫瑰花結(jié) 中折疊(與所有這些實(shí)驗(yàn),和就從幾個(gè)至兆堿基對(duì)水平的基因組"活"循環(huán)而言的每個(gè)功能 性要求一致是否存在此構(gòu)造的一般標(biāo)度行為,iv)與DNS序列自身的長范圍關(guān)聯(lián)一 致,以及這是否與v)新的體內(nèi)測(cè)量一致,開發(fā)出所有物理基因組相互作用(萬物與萬物)的 新的選擇性高分辨率高通量染色體相互作用捕捉方法:HRHTiCIC 2,其還開啟了對(duì)基因組的有 效且便宜的構(gòu)造測(cè)序以進(jìn)行診斷和治療的路徑,本質(zhì)上(參見補(bǔ)充方法):i)以約1〇 7個(gè)培 養(yǎng)/制備細(xì)胞開始,i i)用甲醛固定細(xì)胞(即形成DNA-DNA、RNA-RNA、DNA-RNA、蛋白質(zhì)-蛋白 質(zhì)、DNA-蛋白質(zhì)、RNA-蛋白質(zhì)和更復(fù)雜的基因組交聯(lián)透化以容許用第一限制性酶的 核內(nèi)限制,iv)通過提取交聯(lián)的片段進(jìn)行大幅稀釋以容許主要在這些復(fù)合物內(nèi)的再連接,之 后v)去交聯(lián),純化,并且最終通過第二高頻率限制性酶或者通過超聲處理(對(duì)于最高分辨 率)將DNA嵌合片段縮短到<500bp的大小。然后,vi)使用每個(gè)獨(dú)特且雜交優(yōu)化的寡聚物具有 ~10 9-101()個(gè)分子(即,捕捉總是在線性方案中,并且遠(yuǎn)離飽和)的DNA捕捉陣列(珠捕捉也是 可能的)生成干凈的區(qū)域HRH TiCIC2DNA相互作用片段文庫,所述DNA捕捉陣列序貫緊靠第一限 制性酶直接放置。vii)在高通量測(cè)序后,修整獲得的序列以僅含有直到第一限制性酶的序 列片,然后首先定位到全參照基因組,并且在使用兩種限制性酶的情況中也針對(duì)僅含有第 一和第二限制性酶之間的區(qū)域的掩蔽序列,以最終僅使用100%獨(dú)特定位的序列。
[0224] 此新的選擇性HRHTiCIC2方法具有極大的優(yōu)點(diǎn):i)與現(xiàn)在的其它相互作用捕捉技術(shù) 相比限制因素僅僅是測(cè)序能力/成本和第一限制性酶的分辨率、捕捉區(qū)的大小、相互作用頻 率范圍、和多重化實(shí)驗(yàn)的數(shù)目之間選擇的關(guān)系:例如~500bp片段分辨率,在2Mbp區(qū)中,以1-1〇 6相互作用頻率范圍,和10-100倍多路復(fù)用可容易地實(shí)現(xiàn),測(cè)序10-100道(注意:幾個(gè)區(qū)域 也可以存在于一個(gè)捕捉陣列上hii)由于寡聚物位置的設(shè)計(jì),達(dá)到數(shù)據(jù)清潔(cleanness)最 大值及因此最小測(cè)序情況下的最大相互作用信息。iii)另外,已經(jīng)對(duì)整個(gè)過程優(yōu)化結(jié)構(gòu)保 存(參見補(bǔ)充方法),其是也在高分辨率FISH期間的點(diǎn),其中已有的略微差異在歷史上已經(jīng) 導(dǎo)致不同染色體模型。這還包括使每個(gè)步驟中的扭曲和DNA損傷最小化,其經(jīng)常通過精密/ 精細(xì)的實(shí)驗(yàn)室/臺(tái)式操作實(shí)現(xiàn)。值得注意地,在本文的測(cè)序前不牽涉已知的結(jié)構(gòu)扭曲、(成本 驅(qū)動(dòng)性引物)或PCR步驟。
[0225] 另外,憑借下至50-100bp的可能的片段長度(游離DNA的持續(xù)性長度平均~50nm或 ~140bp;典型的蛋白質(zhì)/核小體結(jié)合位點(diǎn)~200-500bp),不僅達(dá)到此方法的基本限度,而且 更重要的是,本文引入基因組不確定性原則,其起源于與時(shí)間上給定時(shí)刻的每個(gè)細(xì)胞的獨(dú) 特個(gè)別概率片段背景/條件/環(huán)境的每個(gè)高分辨的相互作用的個(gè)體性(其被測(cè)量破壞),因此 引入不確定性原則的經(jīng)典定義:i)細(xì)胞群體已經(jīng)具有細(xì)胞狀態(tài)和功能差異的分布,ii)每個(gè) 片段具有或多或少動(dòng)態(tài)的(如此穩(wěn)定的或可變的)個(gè)別的DNA、RNA、蛋白質(zhì)、限制聯(lián)合,如此 整個(gè)交聯(lián)、限制、和再連接具有不同的個(gè)體效率,并且當(dāng)然,iii)與寡聚物雜交捕捉、測(cè)序和 定位相關(guān)的DNA序列也添加于此。如此,最后,僅可以引出概率分析和敘述,如一般從量子介 觀系統(tǒng)已知并且從經(jīng)典的光雙縫實(shí)驗(yàn)已知。目前,還沒有用于任何明白的校正的手段,因?yàn)?至少目前,影響因素 /參數(shù)的實(shí)際狀態(tài)是無數(shù)的,不能計(jì)算的(尤其是由于其非線性)、對(duì)于 每個(gè)單一片段是不同的,以及除此之外被測(cè)量破壞。任何相互作用捕捉種類總是如此,盡管 效應(yīng)被低分辨率平均(容許雖然無意義,但是在其效應(yīng)上不是有害的校正),但是現(xiàn)在達(dá)到 基礎(chǔ)限度。這開啟了以前所未有的洞察力在此基礎(chǔ)水平上以其完整性和美麗察覺在所有這 些效應(yīng)上整合的相互作用信息的機(jī)會(huì)。
[0226] 為了以必要的分辨率和生物學(xué)影響調(diào)查染色質(zhì)纖維構(gòu)象和3D構(gòu)造,選擇人染色體 1 lp 15.5-15.4,即IGF/H19區(qū)和小鼠染色體7qE3-Fl,即β-珠蛋白區(qū),因?yàn)檫@兩個(gè)~2. IMbp 區(qū)域都是典型的,通過表遺傳和局部控制區(qū)調(diào)節(jié)的FISH和3C例子完善研究的。通過使用Bgl II和Hind III作為第一限制性酶和Nlalll作為第二限制性酶,這產(chǎn)生許多下至~200-500bp的片段,平均值分別為6121和2915bp。為了研究甚至更高的分辨率,然后以較高的分 辨率分析染色質(zhì)纖維構(gòu)象,一般地,我們還以~50至500bp以及至平均片段大小549bp大致 (及以低測(cè)序覆蓋)調(diào)查了 10個(gè)不同小鼠染色體上的總共99.5Mbp的15個(gè)區(qū)域。如此,我們達(dá) 到分子和核小體(平均核小體重復(fù)長度約200bp,如此3-6kbp平均對(duì)應(yīng)于~15-30個(gè)核小體) 和甚至亞核小體分辨率,并因而即基因組不確定性原則的水平。為了調(diào)查物種、細(xì)胞系之間 的差異和功能/構(gòu)造差異,使用人HB2細(xì)胞系和粘結(jié)蛋白可切割的TEV/HRV RAD21-eGFP細(xì)胞 系系統(tǒng)(未切割的和經(jīng)切割的粘結(jié)蛋白,Zuin等2013PNAS,印刷中),和小鼠胎腦(β-珠蛋白 無活性)和胎肝(β_珠蛋白活性)細(xì)胞。為了調(diào)查染色質(zhì)纖維形成,也使用胎肝細(xì)胞。憑借涉 及測(cè)序的~1〇 7個(gè)輸入細(xì)胞,在捕捉陣列上多路復(fù)用相應(yīng)的材料(例如兩種不同狀態(tài))以保 證相等的條件。在相同測(cè)序運(yùn)行或不同運(yùn)行中測(cè)序一道或兩道。由于各種效應(yīng),僅對(duì)具有合 理錯(cuò)配率(以造成對(duì)參照基因組及在參照基因組中的測(cè)序差異/誤差)的整個(gè)基因組中獨(dú)特 的序列清潔僅在第一和第二限制性位點(diǎn)之間定位的序列。
[0227] 如此,以對(duì)數(shù)和彩虹顏色頻率范圍在垂直平方相互作用矩陣(具有兩個(gè)鏡像三角 形半部)中分類和繪制區(qū)域性相互作用直接顯示了實(shí)驗(yàn)自身的有效性和一般跨越6個(gè)數(shù)量 級(jí)和排除對(duì)角線為4-5的前所未有的頻率范圍分布。如此,還可以在區(qū)域大小、片段分辨率 和測(cè)序努力的此背景中可視化具有10- 4至10-5的頻率的罕見相互作用。改變此關(guān)系,這可以 容易地增加 2-4個(gè)數(shù)量級(jí)。另外,相對(duì)于~107百萬/兆(million)個(gè)輸入細(xì)胞的每個(gè)片段的 平均累積條目的關(guān)系顯示HRHTiCIC 2的估計(jì)的~0.1-1.0%效率。另外,模式清楚顯示了達(dá)到 某個(gè)水平,其中統(tǒng)計(jì)學(xué)限度中的不確定性原則達(dá)到穩(wěn)定概率水平,因?yàn)閬碜詿o論多路復(fù)用 與否的相同實(shí)驗(yàn)的不同測(cè)序道的圖像僅顯示微小的統(tǒng)計(jì)學(xué)偏差。
[0228] 通過視覺手段自T2C測(cè)定3D結(jié)構(gòu)
[0229] 不同實(shí)驗(yàn)的所有相互作用矩陣是可再現(xiàn)的,可再現(xiàn)或多或少空的,即沒有突出的 一致的噪音或背景,盡管序列讀出數(shù)目較高且盡管大多數(shù)對(duì)角元素顯示非連接或自身連接 的片段的條目,并且因此證明了捕捉寡聚物是存在的并且起作用。"空"也是清楚構(gòu)造而非 任意的,并且在極高的詳細(xì)程度上在重復(fù)中似乎是相同的,即既不是統(tǒng)計(jì)學(xué)上突然出現(xiàn)的 相互作用,也不是在接近更顯著的相互作用的某處統(tǒng)計(jì)學(xué)聚簇的。如此,考慮來自明確>1〇 4 個(gè)細(xì)胞的信息經(jīng)歷規(guī)程后存在,噪音原則上可以在規(guī)程的任何步驟時(shí)出現(xiàn),并且甚至假設(shè) 正常分布的噪音信號(hào)朝著例如相互作用的不可能高度偏好的扭曲,信噪比必須是>105-106。
[0230]甚至已經(jīng)在視覺上更令人驚訝的,相互作用自身在基因組分離的所有標(biāo)度上就明 顯不同模式的出現(xiàn)而言甚至更引人注目,并且甚至事實(shí)上模式一致在其它標(biāo)度上出現(xiàn)或不 出現(xiàn)(它們必須進(jìn)行這點(diǎn),因?yàn)榛蚪M是標(biāo)度橋接系統(tǒng)),并且還立即顯示了完整的T2C過程 實(shí)際上起作用,盡管牽涉大量且非線性的參數(shù),因?yàn)橐鸫祟惸J降膸茁市〉脽o法想象。與 已知觀察點(diǎn)的第一次比較揭示了 T2C與例如3Cseq的一致,盡管對(duì)于相同片段分布具有清楚 且明銳得多的相互作用,因?yàn)樵赥2C的情況下,不出現(xiàn)相互作用的PCR增寬。因此,現(xiàn)在可以 甚至更容易解讀詳細(xì)的相互作用模式。
[0231 ]通過視覺檢查測(cè)定染色質(zhì)纖維的構(gòu)象:
[0232]在最小的基因組標(biāo)度上,與較大的基因組分離相比,與基因組分離〈5-10kbp(即〈 25-50個(gè)核小體)的對(duì)角線平行的條帶中明顯有更密集的相互作用模式。此模式不隨局部片 段分辨率而變化(不然,其需要進(jìn)行考慮),并且與同質(zhì)相互作用,例如高斯樣相互作用"污 點(diǎn)"降低(對(duì)于增加的基因組分離)形成對(duì)比,由與中間的非相互作用性"缺口"的不同相互 作用組成。如此,因此,視覺檢查已經(jīng)直接顯示了在此標(biāo)度(DNA/核小體標(biāo)度)上,存在穩(wěn)定 而確定的相互作用,并且如此由于這些相互作用是空間接近的結(jié)果,指示了存在核小體壓 縮成不規(guī)則但仍然局部限定的結(jié)構(gòu),即適用纖維的概念,其一般可以給予其變化名稱具有 平均密度的"準(zhǔn)纖維(quasi-fiber)"等。明顯地,與同質(zhì)的條帶樣亞模式形成對(duì)比,會(huì)產(chǎn)生 結(jié)構(gòu)上每處地方完全相同且一致的纖維,如由螺旋染色質(zhì)纖維模型提出,并且核小體的不 斷動(dòng)態(tài)隨機(jī)步移也會(huì)以作為基因組分離的函數(shù)的Reighley分布相互作用減少產(chǎn)生同質(zhì)相 互作用模式。如此,通過視覺檢查,可以直接讀出染色質(zhì)"準(zhǔn)纖維"、其局部相互作用及如此 在整個(gè)T2C過程邊界里自然取平均的壓緊結(jié)構(gòu)的存在。
[0233]通過視覺檢查測(cè)定亞染色體結(jié)構(gòu)域:
[0234] 在最大的標(biāo)度上,也立即可見在幾百至~1-1.5Mbp范圍中的準(zhǔn)樣(square-like) 域的出現(xiàn),具有尖銳的邊界和與其它域的相互作用(盡管與小鼠的情況相比更主要在人類 中),具有幾個(gè)顯著的一般特性:第一,對(duì)于忽略其亞結(jié)構(gòu)的時(shí)刻而言域內(nèi)的相互作用頻率 一般在與限定各亞域間的相互作用的另一個(gè)一致高度的邊緣具有平均一致高度和下降。如 此,與經(jīng)常認(rèn)為隨增長的基因組分離而一般連續(xù)的相互作用降低和清楚而確定的與其它域 的相互作用形成對(duì)比,有相互作用的樓梯樣行為。第二,在域的邊界,存在有域間的清楚過 渡或接頭區(qū),盡管域間的相互作用是特別強(qiáng)且復(fù)雜的,因?yàn)榻咏鼘?duì)角線,染色質(zhì)準(zhǔn)纖維也開 始起作用,并且因?yàn)榻宇^就結(jié)構(gòu)而言是非常柔性的。因此,這些結(jié)果再次證明結(jié)構(gòu)穩(wěn)定的亞 染色體單位的存在,其是相對(duì)穩(wěn)定的,并且在其邊界上彼此特別好地相互作用,如歷史觀察 點(diǎn)中描述的。另外,已經(jīng)在此水平上,域內(nèi)的平均一致相互作用和邊界處的尖銳下降非常清 楚指示已經(jīng)朝向通過接頭連接的域的環(huán)-聚集體和甚至玫瑰花結(jié)樣結(jié)構(gòu),因?yàn)橐粋€(gè)大環(huán)、隨 機(jī)步移或分形小球體樣折疊都不會(huì)導(dǎo)致本文發(fā)現(xiàn)的尖銳邊緣和限定行為。
[0235] 通過視覺檢查測(cè)定染色質(zhì)高等結(jié)構(gòu)(即染色體的環(huán)/聚集體/玫瑰花結(jié)折疊)的構(gòu) 象。
[0236]在中等標(biāo)度上并且如此在亞染色體域水平上,相互作用模式的特征在于相互作用 間再次明顯不同的缺口,其以交叉的線性或網(wǎng)格樣模式排布。令人感興趣地,線性模式在亞 染色體域外部繼續(xù),并且在那里與源自后續(xù)亞染色體域的線性模式"交叉"。另外,域外部的 一般較低的一般相互作用頻率水平和那里看到的不太復(fù)雜的相互作用模式容許將線性模 式返回域,這揭示了域內(nèi)存在也明顯在外部的簡單/清楚得多的模式,但是那里富集并且由 于其它相互作用變得更復(fù)雜?,F(xiàn)在可以順著此線返回對(duì)角線,并且采取這作為接下來的相 關(guān)相互作用(可以水平上追蹤它再次從外部到域中)垂直跟隨的起始觀察點(diǎn)。然后,在對(duì)角 線上再次水平定位作用點(diǎn)。將此重復(fù)在對(duì)角線上給出第二個(gè)相互作用點(diǎn),現(xiàn)在可以證明在 大多數(shù)情況中,此第二相互作用也與第一以及因此起始點(diǎn)相互作用。如此,可以手動(dòng)構(gòu)建相 互作用的網(wǎng)格。這可以通過垂直和水平投射相互作用增強(qiáng),導(dǎo)致沿著染色體序列的峰樣模 式,其峰與交叉的線性模式一致。與小鼠情況相比,這在人類中更明顯。由于特別地,認(rèn)為并 且可以僅認(rèn)為在數(shù)十個(gè)千堿基對(duì)的標(biāo)度上的相互作用是染色質(zhì)成環(huán),這意味著環(huán)基部通過 相互作用可視化的幾個(gè)連續(xù)環(huán)具有重合的環(huán)基部,即具有核心的環(huán)聚集體,并且如此也是 具有或多或少清楚核心的環(huán)的玫瑰花結(jié)。相互作用間的缺口和網(wǎng)格樣模式也顯示了無其它 折疊樣隨機(jī)步移巨大環(huán)、染色體樣、或分形小球體模式不能是那點(diǎn)的起源,因?yàn)樗鼈內(nèi)繒?huì) 導(dǎo)致同質(zhì)的相互作用模式,而沒有清楚的域邊界和明顯沒有不同的域邊界。對(duì)準(zhǔn)染色質(zhì)纖 維的非壓緊也會(huì)如此,大量核小體構(gòu)造會(huì)預(yù)測(cè)這點(diǎn),導(dǎo)致巨大且非常動(dòng)態(tài)的相互作用可能 性。值得注意地,不同標(biāo)度上的數(shù)據(jù)結(jié)構(gòu)也證明了在所有標(biāo)度上相互作用實(shí)際上可以進(jìn)行 交聯(lián),并且依賴于不同基礎(chǔ)的可交聯(lián)劑的假設(shè)是正確的,如此特定DNA位置或蛋白質(zhì)等之間 的交聯(lián)創(chuàng)建此類模式的假設(shè)是非常不可能的。另外,簡單模式是更復(fù)雜的,由于染色質(zhì)的壓 縮密度的變化及下述事實(shí),在環(huán)內(nèi)發(fā)生各種形式的其它相互作用:在較大標(biāo)度上,簡單環(huán)或 甚至超螺旋樣模式似乎可能,而在較低標(biāo)度上,大環(huán)堿基相互作用周圍的模式指示玫瑰花 結(jié)核心的結(jié)構(gòu)和局部染色質(zhì)壓縮及那兩者的牽連。雖然進(jìn)行在最高分辨率的實(shí)驗(yàn)以一般性 更詳細(xì)調(diào)查染色質(zhì)纖維構(gòu)象,并且如此牽涉不太深的測(cè)序,但是這些數(shù)據(jù)的總體評(píng)估實(shí)際 上導(dǎo)致發(fā)現(xiàn)可以歸因于環(huán)聚集體/玫瑰花結(jié)的幾個(gè)此類結(jié)構(gòu)和具有導(dǎo)致特殊相互作用模式 的進(jìn)入和外出環(huán)的詳細(xì)核心結(jié)構(gòu)。如此,域間的相互作用及其模式可以歸因于兩種起源:在 一方面,隨后域的環(huán)聚集體/玫瑰花結(jié)核心可由于相對(duì)較小的環(huán)數(shù)目及由此密度和環(huán)動(dòng)力 學(xué)而非常容易相互作用。另一方面,在細(xì)胞群體中,還有有絲分裂染色體,其中凝聚程度通 常非常高。如此,所述模式一致地解釋了經(jīng)由細(xì)胞周期的構(gòu)造和其動(dòng)力學(xué)兩者,并且再次, 這僅在壓縮的染色質(zhì)纖維的情況下可能,因?yàn)榉駝t,聚集體/玫瑰花結(jié)核心之間的核心相互 作用會(huì)通過聚合物纖維排阻而被遮蔽。
[0237] 通過視覺檢查測(cè)定3D結(jié)構(gòu),作為不同細(xì)胞類型、或細(xì)胞的處理/治療、或患病狀態(tài) 的函數(shù):
[0238] 為了調(diào)查由于調(diào)節(jié)或有意系統(tǒng)扭曲一般作為物種、細(xì)胞類型、區(qū)域、功能或結(jié)構(gòu)差 異的函數(shù)的構(gòu)造變化,調(diào)查人IGF/H19 1 lp 15.5-15.4區(qū),和小鼠 β-珠蛋白7qE3-Fl,在人 HB2和TEV/HEV細(xì)胞,和小鼠胎腦(FB)和胎肝(FL)細(xì)胞中:一般的域在HB2、TEV、HEV、及FB和 FL細(xì)胞中,且因此在相同物種的不同細(xì)胞類型中明顯相同,但是至少由于選擇的區(qū)域而在 人和小鼠間不同。與TEV/HEV系統(tǒng)相比,人HB2細(xì)胞詳情的更精細(xì)程度似乎顯示域內(nèi)更多且 更密集的相互作用模式。比較FB與FL細(xì)胞沒有顯示此類明顯的差異:實(shí)際上,非常細(xì)微的差 異經(jīng)常屬于單一相互作用或較小的一組相互作用,如可以對(duì)β-珠蛋白基因座顯示的,其中 形成額外的環(huán),如從較早的實(shí)驗(yàn)預(yù)測(cè)的。不過,本文的術(shù)語小是相對(duì)的,因?yàn)榇祟悊苇h(huán)形成 實(shí)際上激活β-珠蛋白轉(zhuǎn)錄,即整個(gè)途徑及如此整個(gè)細(xì)胞特性可以被改變。另外,然而,切割 TEV/HEV系統(tǒng)中的粘結(jié)蛋白(據(jù)稱在基因組構(gòu)造中發(fā)揮重大組成性作用)也不導(dǎo)致動(dòng)態(tài)變 化,實(shí)際上僅略微越來越均勻擴(kuò)散的相互作用,表明了略高的柔性/動(dòng)態(tài)構(gòu)造,但是不如先 前在全基因組分析中認(rèn)為的一樣大。如此,粘結(jié)蛋白不能是單一且明確不是主要/單一組分 負(fù)責(zé)試劑,而取而代之明顯是影響/形成基因組構(gòu)造的幾種組分之一,并且顯示了基因組構(gòu) 造的柔性和穩(wěn)定性之間的進(jìn)化平衡。因此,這些變化不僅顯示了不同條件下T2C及其分析的 可再現(xiàn)質(zhì)量,并且存在清楚的一般基因組構(gòu)造,而且基因組不確定性原則的達(dá)到的水平本 質(zhì)上局部每個(gè)細(xì)節(jié)上是被認(rèn)為精細(xì)調(diào)節(jié)系統(tǒng)的極大主題的變化。如此,明顯地,在僅~2Mbp 大基因組區(qū)中,存在相互作用數(shù)據(jù)的財(cái)富以詳細(xì)仔細(xì)分析。
[0239] 與T2C比較通過蒙特卡洛和布朗動(dòng)力學(xué)模擬測(cè)定3D染色質(zhì)高等結(jié)構(gòu)
[0240] 為了獨(dú)立且以更清楚的方式在預(yù)先設(shè)置的條件下在所有標(biāo)度上探索并了解此行 為,目前已經(jīng)開發(fā)出聚合物模型以評(píng)估(不是擬合)一般的實(shí)驗(yàn)結(jié)果,設(shè)計(jì)和關(guān)于三維基因 組構(gòu)造的假設(shè)。那里,分辨率基于可伸展、可成帶的聚合物區(qū)段,和體積排阻,其具有與~1-2.5kbp相當(dāng)?shù)姆直媛?,并且以大環(huán)(0.5-5. OMbp)通過類似柔性主鏈的接頭連接的隨機(jī)步 移/巨大環(huán)模型為特征,并且以具有玫瑰花結(jié)樣聚集體(〇.5-2Mbp)的多環(huán)亞區(qū)室(MLS)模型 為特征,所述玫瑰花結(jié)樣聚集體具有由可變長度(60-250kbp)的接頭連接的較小環(huán)(60-250kbp)。這些模擬得到增強(qiáng),并且首次用極高的統(tǒng)計(jì)學(xué)有效性計(jì)算二維空間距離和相互作 用缺口(對(duì)于不同交聯(lián)可能性和程度)。視覺比較立即揭示了所有上文描述的效應(yīng)解讀與模 擬一致,并且另外相互作用是所有模型參數(shù)的函數(shù),甚至略微詳細(xì)考慮無本文建模的核小 體:i)一般地,相互作用程度依賴于相互作用和交聯(lián)可能性,ii)域大小、域分離、和環(huán)間隔 與其大小成比例,iii)域間的相互作用依賴于接頭大小、環(huán)的大小和數(shù)目,即玫瑰花結(jié)的密 度。如此,由于環(huán)大小、環(huán)數(shù)目、染色質(zhì)纖維持續(xù)性導(dǎo)致玫瑰花結(jié)的密度的微妙組合,因此最 終導(dǎo)致所得的排阻效應(yīng)(對(duì)于高數(shù)目)擴(kuò)展和玫瑰花結(jié)的遮蔽效應(yīng),以及對(duì)整個(gè)域間的相互 作用模式的微妙影響。域間的接頭及其與域間相互作用的比例性與非平衡效應(yīng)一樣好地清 楚可見,我們?cè)诒疚挠幸怙@示所述非平衡效應(yīng)以創(chuàng)建對(duì)聚集體/玫瑰花結(jié)邊界的環(huán)的相互 作用及相似效應(yīng)的了解。還有,相互作用矩陣的一般較大的空性和與存在專門的染色質(zhì)纖 維的聯(lián)系是明顯的,并且還證明了交聯(lián)可能性、半徑、和頻率可以評(píng)估為相對(duì)較低,盡管由 于關(guān)系含有過于復(fù)雜的參數(shù)集,不能毫無疑義適用。模型還清楚顯示了玫瑰花結(jié)的環(huán)基部 的特殊行為,其實(shí)際上由于壓縮變化而實(shí)際上可以是更復(fù)雜的,盡管具有最高分辨率的實(shí) 驗(yàn)顯示了存在各種此類結(jié)構(gòu),但是將來必須以詳細(xì)得多地調(diào)查。
[0241]通過自測(cè)定相互作用頻率的標(biāo)度行為測(cè)定T2C的標(biāo)度行為,作為相互作用間的遺 傳距離的函數(shù)并且與蒙特卡洛和布朗動(dòng)力學(xué)模擬的標(biāo)度行為和DNA自身中的長范圍關(guān)聯(lián)的 標(biāo)度比較測(cè)定3D染色質(zhì)高等結(jié)構(gòu):
[0242]為了以統(tǒng)一標(biāo)度橋接訪視調(diào)查自幾個(gè)堿基對(duì)的標(biāo)度,經(jīng)由兆堿基對(duì)和亞域水平, 直至整個(gè)染色體及因此核(跨越10-9至l(T5m的標(biāo)度)的標(biāo)度的行為,我們引入標(biāo)度分析,并 且顯示了其能力:作為基因組分離的函數(shù)的相互作用頻率的標(biāo)度,給出的不同模擬模型清 楚顯示了長范圍標(biāo)度,具有精細(xì)結(jié)構(gòu)的多標(biāo)度行為可歸因于i)一般相互作用減少,即空間 距離增加,ii)亞染色體域樣結(jié)構(gòu),iii)亞域中的聚集的環(huán)/玫瑰花結(jié)樣結(jié)構(gòu)。所有參數(shù)變化 可以在本文的標(biāo)度上在改變的標(biāo)度行為中再找到。這與標(biāo)度的其它度量一致。如此,沒有一 致的標(biāo)度,如例如在自相似的分形橋接中看到,并且在所有標(biāo)度上相同,但是其偏差顯示了 域和環(huán)中的亞結(jié)構(gòu)。
[0243] 不同區(qū)的標(biāo)度行為與染色體亞組的標(biāo)度行為比較,并且如此以與一般標(biāo)度行為的 局部構(gòu)造偏差占優(yōu)勢(shì),并且也受到本文使用的相互作用量危害。不過,標(biāo)度行為顯示了 i)具 有精細(xì)結(jié)構(gòu)的長范圍多標(biāo)度行為,ii)對(duì)于各種物種、細(xì)胞類型、功能/扭曲差異,具有細(xì)微 但不一般性的差異。
[0244] 相互作用頻率的標(biāo)度行為作為對(duì)整個(gè)基因組進(jìn)行的不同發(fā)表實(shí)驗(yàn)的其基因組分 離的函數(shù)也顯示了 i)具有精細(xì)結(jié)構(gòu)的長范圍多標(biāo)度行為,ii)對(duì)于各種物種、細(xì)胞類型、功 能/扭曲差異,具有細(xì)微但不一般性的差異。然而,實(shí)驗(yàn)和建模的標(biāo)度行為兩者僅與具有環(huán) 聚集體(0.5_2Mbp)的環(huán)聚集/玫瑰花結(jié)樣基因組構(gòu)造一致,所述環(huán)聚集體具有通過可變大 ?。?0-250kbp)的接頭連接的較小環(huán)(60-250kbp)。
[0245] 由于物理空間中接近的事情也應(yīng)當(dāng)在DNA序列空間中接近,由于所有種類的突變 會(huì)由于基因組構(gòu)造自身而有偏倚,我們還通過可能的最簡單關(guān)聯(lián)分析調(diào)查了DNA序列的關(guān) 聯(lián)行為,即兩個(gè)不同人和小鼠完全測(cè)序品系的不同大小窗內(nèi)的堿基對(duì)組成的均方偏差:i) 對(duì)幾乎整個(gè)可觀察的標(biāo)度使用關(guān)聯(lián)分析發(fā)現(xiàn)了長范圍冪法則( power-law)關(guān)聯(lián),ii)用局部 關(guān)聯(lián)系數(shù),其顯示了物種特異性多標(biāo)度行為,在幾個(gè)堿基對(duì)的標(biāo)度上接近隨機(jī)關(guān)聯(lián),從40至 3400bp的第一最大值,和從10 5至3xl05bp的第二最大值,和iii)第一和第二最大值中存在額 外的精細(xì)結(jié)構(gòu)。一般且詳細(xì)地,與小鼠情況相比,行為在人類中更強(qiáng),但是在不同染色體內(nèi), 幾乎相同并且對(duì)于某些染色體在稍大的程度上僅偏差。所有標(biāo)度上的行為不僅在細(xì)節(jié)上等 同于基因組構(gòu)造的長范圍多標(biāo)度,而且還在正確標(biāo)度上等同。如此,發(fā)現(xiàn)的第二最大值在大 小和位置上對(duì)應(yīng)于亞染色體域。尤其在精細(xì)結(jié)構(gòu)水平上,先前已經(jīng)在第一一般最大值上證 明的與核小體結(jié)合的聯(lián)系現(xiàn)在也可擴(kuò)展到第二最大值并且與如先前預(yù)測(cè)的其中的成環(huán)結(jié) 構(gòu)聯(lián)系起來。
[0246]另外,最高分辨率的相互作用標(biāo)度顯示了不同染色體間與相同最大值中的DNA序 列的標(biāo)度行為相同的行為:盡管由于實(shí)驗(yàn)分辨率不能找到精細(xì)結(jié)構(gòu),在高于~4kbp的標(biāo)度 上具有寬峰和較強(qiáng)相互作用降低的一般行為強(qiáng)烈提示了在相互作用實(shí)驗(yàn)和DNA序列兩者 中,確實(shí)存在壓縮的染色質(zhì)纖維。
[0247] 用于實(shí)施例3的方法及T2C的詳細(xì)描述:
[0248] HB2細(xì)胞系和細(xì)胞培養(yǎng)
[0249] 在補(bǔ)充有0.2mM L-谷氨酰胺,100個(gè)單位/ml青霉素、100mg/ml鏈霉素、10%FCS、5y g/ml羥基可的松、和10μg/ml人胰島素的DMEM中培養(yǎng)HB2細(xì)胞(1-7HB2,人乳腺管腔上皮細(xì)胞 系MTSV1-7的克隆衍生物)。在先前的3C研究中,我們確認(rèn)了幾個(gè)區(qū)域的核型和DNA甲基化。 [0250] TEV/HRV細(xì)胞系系統(tǒng)和細(xì)胞培養(yǎng)
[0251] 可切割TEV/HRV RAD21-eGFP細(xì)胞系系統(tǒng)是HEK293T細(xì)胞系系統(tǒng),其用編碼可切割 RAD21-eGFP融合蛋白和用于內(nèi)源RAD21敲低的siRNA的pRTS-Ι載體轉(zhuǎn)染。兩者通過多西環(huán)素 誘導(dǎo)的其間的雙向啟動(dòng)子的激活而表達(dá),并且因此同時(shí)表達(dá)。對(duì)于RAD2-eGFP融合蛋白,在 eGFP前插入可切割RAD21,其中基于PCR的誘變將第一 RAD21-分離酶(separase)切割位點(diǎn)替 換為人鼻病毒的3C蛋白酶(HRV蛋白酶)的切割位點(diǎn)(第二切割位點(diǎn)保持不變以確保較小的 細(xì)胞細(xì)胞毒性)。煙草蝕紋病毒蛋白酶(TEV蛋白酶)不識(shí)別HRV切割位點(diǎn),如此可以充當(dāng)對(duì) 照。內(nèi)源RAD21敲低序列容許用下述3 ' UTR指導(dǎo)性s iRNA的敲低:
[0252] 5' -ACUCAGACUUCAGUGUAUA-3'(Sccl-1),
[0253] 5'-AGGACAGACUGAUGGGAAA-3' (Sccl-2)。
[0254] 為了生成TEV/HRV RAD21-eGFP細(xì)胞系系統(tǒng),將初始HEK293T細(xì)胞系在補(bǔ)充有0.2mM L_谷氨酰胺、100個(gè)單位/ml青霉素、100mg/ml鏈霉素、10%FCS的DMEM中培養(yǎng),并且于37°C和 5%C〇2培養(yǎng)。為了轉(zhuǎn)染,遵循制造商的用法說明使用Lipofectamine 2000(Invitrogen)。通 過在含有150yg/mL潮霉素的培養(yǎng)基中生長選擇攜帶載體的細(xì)胞。挑出單克隆,并且在用2μ g/ml多西環(huán)素誘導(dǎo)后3天分析RAD21c V和RAD21wt構(gòu)建體的表達(dá)和內(nèi)源RAD21的耗盡。所得的 TEV/HRV RAD21-eGFP細(xì)胞系同樣在具有0.2mM L-谷氨酰胺的DMEM中于37 °C和5 % C02培養(yǎng)。
[0255] 對(duì)于實(shí)驗(yàn)并且為了用HRV(或充當(dāng)對(duì)照的TEV,如此發(fā)生轉(zhuǎn)染,但無切割)激活轉(zhuǎn)基 因表達(dá),在2μg/ml多西環(huán)素的情況下培養(yǎng)細(xì)胞3天。此后,分開細(xì)胞,再接種直到50%匯合, 并且再使用Lipofectamine 2000(Invitrogen)根據(jù)制造商的用法說明用HRV或TEV載體轉(zhuǎn) 染。蛋白酶轉(zhuǎn)染后24小時(shí),使用細(xì)胞進(jìn)行實(shí)驗(yàn)。
[0256]自小鼠的細(xì)胞制備
[0257] 對(duì)于小鼠胎肝和胎腦細(xì)胞,來自1至2只轉(zhuǎn)基因 FVB/N小鼠的12.5天妊娠的~10個(gè) 胚胎用于實(shí)驗(yàn)需要的~1000萬細(xì)胞以最后具有足夠復(fù)雜的細(xì)胞群體和足夠的DNA以進(jìn)行測(cè) 序:用70%Et0H清潔小鼠,并且打開腹部以取出含有胚胎的宮頸,之后切開它們,并且從卵 黃囊和胎盤取出它們。棄去小的且發(fā)育不全的胚胎。在培養(yǎng)皿中在冰上在〇.5ml 10%FCS/ PBS的情況中收集胚胎。然后,從胚胎切出胎肝和胎腦,并且在冰上再在含有500μ1 10% FCS/PBS的管(1ml)中收集。然后,用P1000/lml塑料移液器尖端重懸細(xì)胞,并且通過添加25μ 1 2.5 %膠原酶儲(chǔ)液(0.125 %終濃度)消化結(jié)締組織,并且于37 °C溫育~45分鐘。此后,將細(xì) 胞懸浮液于室溫轉(zhuǎn)移到具有12ml 10%FCS/PBS的Falcon管,此后溫和擠壓通過刮板篩孔, 其再使用Pl〇〇〇/lml塑料移液管尖端置于6孔板內(nèi)部。于室溫用2ml 10%FCS/PBS清洗篩孔 以從篩孔得到所有細(xì)胞。于室溫在具有終體積12ml 10%FCS/PBS的Falcon管中再收集所得 的單細(xì)胞懸浮液。值得注意地,我們嘗試將細(xì)胞的應(yīng)激(stress)保持于最小值,以避免對(duì)細(xì) 胞核的任何損傷。重懸、膠原酶處理后,和/或刮下胎肝和胎腦后,將材料/細(xì)胞在玻璃載玻 片上點(diǎn)樣以通過顯微術(shù)檢查細(xì)胞和特別是核完整性,具有或沒有用DAPI對(duì)核的染色(或最 后任何其它免疫熒光或熒光原位雜交)。
[0258] HRHTiCIC2交聯(lián)/固定細(xì)胞
[0259] 為了交聯(lián)/固定基因組和整個(gè)細(xì)胞,首先計(jì)數(shù)細(xì)胞,并且將其濃度于室溫調(diào)節(jié)到 12ml 10%FCS/PBS中的1000萬,并且放入15ml聚丙烯管中(用于細(xì)胞培養(yǎng),并且如此不過度 吸附/固定細(xì)胞至管壁,Greiner Bio One)。然后,添加650μ1 37%甲醛roS溶液,即終濃度 1.9%甲醛用于交聯(lián)/固定,于室溫持續(xù)10分鐘,同時(shí)柔和倒轉(zhuǎn)以避免細(xì)胞聚集。注意:用于 此階段的交聯(lián)/固定的甲醛濃度對(duì)于隨后的步驟以及就我們?cè)谶@里使用的人和小鼠細(xì)胞的 細(xì)胞/核完整性而言是理想的;雖然這一般可以保持,但是已知其中其它濃度和溫育時(shí)間實(shí) 現(xiàn)更好的結(jié)果的情況。如此,將管放置在冰上(從現(xiàn)在起,我們將每件東西置于冰上,直至 DNA的第一次限制(參見下文)以避免對(duì)材料的任何損傷),并且添加 PBS中的1.6ml冷1M甘氨 酸,以停止交聯(lián)/固定反應(yīng)。此后,以1300rpm于4°C向下旋轉(zhuǎn)細(xì)胞8分鐘,在冰冷的PBS中清洗 所得的團(tuán)粒(pellet),并且首先在lml中吸出,之后添加到14ml PBS,接著再以1300rpm于4 °(:向下旋轉(zhuǎn)8分鐘。在棄去上清液后,現(xiàn)在還可以冷凍團(tuán)粒以貯存,盡管我們建議立即繼續(xù) 裂解和第一次限制。再次,在玻璃載玻片上點(diǎn)樣細(xì)胞以通過顯微術(shù)檢查細(xì)胞和尤其是核完 整性,具有/沒有用DAPI對(duì)核的染色(注意:再一次,現(xiàn)在也可以使用細(xì)胞最終用于任何其它 免疫熒光或熒光原位雜交實(shí)驗(yàn))。
[0260] 制備細(xì)胞核和第一次核基因組DNA限制
[0261]為了裂解細(xì)胞并且為了制備細(xì)胞核,我們?cè)诒希ǎ。┲苽?ml新鮮(對(duì)于完全活性) 裂解緩沖液,其由 l〇mM Tris pH 8·0(50μ1 lM)、10mM NaCl(10yl5M)、0.2%NP-40(100yl 10%)、10(^15(^完全蛋白酶抑制劑(?仰111^13).(5(^=11111?83中1片)組成,并且用多 達(dá)5ml MilliQ(4.74ml)補(bǔ)足。在lml此裂解緩沖液中取出最后的交聯(lián)/固定步驟中制備的團(tuán) 粒,重懸,并且再用4ml補(bǔ)足到總共5ml,并且在冰上溫育10分鐘。以ISOOrpm于4°C將現(xiàn)在游 離的細(xì)胞核向下旋轉(zhuǎn)5分鐘,在0.5ml冰冷的roS Safe-lock管中取出團(tuán)粒,并且以2600rpm 于4°C旋轉(zhuǎn)1分鐘。再次,本文有可能在除去上清液并且快速冷凍后于-80°C貯存核。為了檢 查,我們總是在玻璃載玻片上點(diǎn)樣核以通過顯微術(shù)和/或用DAPI染色核檢查核完整性。
[0262] 對(duì)于第一次限制,現(xiàn)在用1.2x限制緩沖液(60μ1限制緩沖液,440μ1 Mi 11 iQ,并且 在必要時(shí)調(diào)節(jié)(對(duì)于BSA))在0.5ml/管中重懸核,并且轉(zhuǎn)移到1.5ml Safe-lock管。然后,為 了溫和透化核纖層,將管放到37 °C,并且添加7.5μ120 % SDS(0.3 %終濃度),并且于37 °C溫 育1小時(shí),同時(shí)以900rpm搖動(dòng)。在添加50μ1 Triton-X-100(2%終濃度)以進(jìn)一步溫和透化核 纖層后,再次于37°C溫育1小時(shí),同時(shí)以900rpm搖動(dòng)。注意:需要非常小心實(shí)施SDS和Triton-X-100步驟兩者以避免任何去交聯(lián),我們通過在具有和/或沒有DAPI染色情況下顯微檢查核 再次檢查那點(diǎn)。對(duì)于未消化的材料的未來對(duì)照(所謂的第一未限制對(duì)照),現(xiàn)在采用5μ1等分 試樣,并且于_20°C貯存。然后,添加400個(gè)單位的選定的限制性酶,并且于37°C溫育過夜(約 20小時(shí))。對(duì)于所有情況中的人細(xì)胞,使用限制性酶Bglll(Roche)。對(duì)于小鼠細(xì)胞,我們使用 Hindlll (Roche)或Apol (New England Biolabs)。注意:即使其最佳的溫度是50°C (對(duì)于 Apol),應(yīng)當(dāng)使用37°C來防止樣品的部分去交聯(lián);_)。并且再次對(duì)于限制的未來對(duì)照,現(xiàn)在采 用5μ1等分試樣,并且于-20°C貯存(所謂的第一限制對(duì)照)。在第一次限制后,對(duì)剩余的樣品 添加40μ1 20%SDS(終濃度1.6%)以停止限制,并且為了進(jìn)一步分解核纖層,通過于65°C溫 育20-25分鐘,同時(shí)以900rpm搖動(dòng)。
[0263] 限制的基因組DNA的稀釋、再連接和去交聯(lián)
[0264] 此后,通過轉(zhuǎn)移到50ml Falcon管,并且添加6.125ml 1·15χ連接緩沖液(6.125ml: 5421ml MilliQ+704yl連接緩沖液)稀釋完全消化的核材料。然后,添加375μ1 20%Triton-X-100(終濃度1.0% ),并且在37°C水浴中溫育1小時(shí),期間每10分鐘用手搖動(dòng)。然后,添加20 μL連接酶HC 5UAU(總共100U,Roche),并且于16°C溫育過夜(~20小時(shí)),接著于室溫再溫 育30分鐘。為了使非連接的和連接的DNA去交聯(lián),添加30μ1 10mg/ml蛋白酶K,并且于65 °C在 水浴中溫育過夜(~20小時(shí))。再次對(duì)于再連接和去交聯(lián)的未來對(duì)照,現(xiàn)在采集5μ1等分試 樣,并且于_20°C貯存(所謂的再連接/去交聯(lián)對(duì)照)。
[0265] DNA純化和第二次(再連接)DNA限制/超聲處理
[0266] 為了進(jìn)一步處理樣品,首先通過添加30μ1 10mg/ml RNA酶(總共300yg),并且于37 °C溫育30-45分鐘,接著短暫冷卻到室溫,并且添加7ml酚-氯仿和劇烈搖動(dòng)來純化DNA。然 后,以4,000rmp(2200xg)離心樣品15分鐘,之后將上層相置于新的50ml管中,并且添加7ml 1111丨0及每11111以1糖原、1.5111121乙酸鈉?!15.6,并且添加351111 100%乙醇以增強(qiáng)純化,溫 和但徹底混合,此后置于-80°C達(dá)1.5-3小時(shí)。這接下去是以4,OOOrmp(2200xg)直接離心15 分鐘,除去上清液,添加 l〇ml 70%Et0H,重懸,并且以4,000rmp(2200xg)于4°C再離心15分 鐘。在除去上清液后,將團(tuán)粒干燥20分鐘,并且于37°(:在15(^11〇11^1^ 8?!17.5中溶解30 分鐘。再次用于再連接和去交聯(lián)的未來對(duì)照,現(xiàn)在采集5μ1等分試樣,并且于-20°C貯存(所 謂的第一次純化對(duì)照)。
[0267] 此后,通過第二次限制縮短所得的再連接并且去交聯(lián)的純化的材料:首先,為了控 制此階段的DNA量,在2%瓊脂糖凝膠上靠著已知濃度的物種匹配基因組DNA的參照樣品運(yùn) 行ΙμL等分試樣。然后,在〇.5ml/管中將DNA調(diào)節(jié)到lOOng/μΙ濃度,并且通過每yg DNA添加1U 選擇的限制性酶用第二限制性酶限制,并且于37°C溫育過夜(~20小時(shí))。對(duì)于所有情況中 的人細(xì)胞,使用限制性酶NlaII(New England Biolabs)。對(duì)于小鼠細(xì)胞,我們使用Hindlll 作為第一限制性酶DpnII(New England Biolabs)或者使用Apol作為第一限制性酶,以15秒 開啟和45秒關(guān)閉的10個(gè)循環(huán)超聲處理。
[0268] 多種DNA對(duì)照的處理
[0269] 對(duì)于不同階段的DNA的完整性的對(duì)照,使用下述對(duì)照:i)第一次未限制的對(duì)照,ii) 第一次限制的對(duì)照,iii)再連接/去交聯(lián)對(duì)照,iv)第一次純化對(duì)照,和v)第二次限制/最終 純化對(duì)照。這些樣品與相應(yīng)的質(zhì)粒DNA-起在2%瓊脂糖凝膠上做對(duì)照,所述質(zhì)粒DNA并排限 制,再連接,并且純化作為外部限制對(duì)照。對(duì)于對(duì)照i )_iii),于65°C將等分試樣與90μ1 10mM Tris pH 7.5中的10μ1蛋白酶K(10mg/ml) -起溫育至少1小時(shí)。通過添加3μ1 10mg/ml RNA酶,并且于37 °C溫育30-45分鐘,接著短暫冷卻至室溫,并且添加 Mill iQ直至500μ1 (約 400ml)及500μ1酚-氯仿并劇烈振蕩來純化DNA。然后,以13,200rmp離心對(duì)照15分鐘,每ml 2 41糖原,5(^121乙酸鈉?!15.6,并且添加85(^1100^^切!1,溫和但徹底混合,并且快速冷 凍,之后直接進(jìn)行以13,200rmp離心20分鐘,接著除去上清液,添加 lml 70Et0H,于4°C以13, 200rpm離心,除去更新的上清液,干燥團(tuán)粒20分鐘,并且于37°C在20μ1 10mM Tris pH 7.5 中溶解30分鐘。
[0270] ^General DNA全基因組測(cè)序文庫制備
[0271] 一般地,制備DNA T2C片段文庫以在Illumina Cluster Station和HiSeq2000測(cè)序 儀根據(jù)具有來自我們的增強(qiáng)修改的Illumina TruSeq DNA方案(www. illumina. com,TruSeq DNA樣品制備LS方案;部分#15026489Rev. C)進(jìn)行測(cè)序分析:i)純化DNA片段,ii)末端修復(fù)以 達(dá)到平端狀態(tài),i ii)3 '端腺苷?;员苊馇逗衔铮琲v)對(duì)銜接頭連接測(cè)序,包括最終的多路 復(fù)用步驟,和最終v)純化T2C全基因組測(cè)序DNA片段文庫。
[0272] 因此,首先使用Quant-it dsDNA寬范圍測(cè)定試劑盒使用ΙμL材料再次測(cè)量T2C DNA 片段文庫的濃度以細(xì)微調(diào)節(jié)。然后,將樣品分成4組各5yg的T2C DNA片段文庫,并且對(duì)這4組 材料中的每組完成下述完全規(guī)程:
[0273] i)為了在第二次限制后純化T2C DNA文庫,通過每Ι.ΟμΙ經(jīng)消化的DNA添加1.8μ1 AMPure ΧΡ珠使用AMPure ΧΡ珠 (Beckman Coulter)。這于室溫溫育5分鐘,置于磁性支架上, 并且于室溫溫育5分鐘,并且在不擾亂珠的情況下棄去上清液。用新鮮制備的70%乙醇清洗 珠2次,于37 °C放置5分鐘以讓珠干燥。然后,將珠在50μ1 PCR級(jí)水中重懸,并且于室溫溫育5 分鐘,置于磁性支架上5分鐘,最終將50μ1上清液轉(zhuǎn)移至新管。最終,使用DNA 1000測(cè)定法在 Agilent Technologies 2100Bioanalyzer上加載1微升以測(cè)定純化的經(jīng)消化的DNA的質(zhì)量。
[0274] ii)對(duì)于T2C文庫DNA片段的末端修復(fù),由于它們?cè)诰哂型怀龆饲斑M(jìn)行限制或超聲 處理,將4個(gè)材料組各自在50μ1中轉(zhuǎn)移到96孔板。由于不使用避免材料污染的串聯(lián)(inline) 對(duì)照試劑,添加 1〇μ1 重懸緩沖液,接著是 40μ1 末端修復(fù)混合物,并且將整個(gè)體積上下 移液10次徹底但溫和混合。然后,用Micr〇-seal"B"粘性封條覆蓋板,并且置于30°C預(yù)先加 熱的熱循環(huán)儀上30分鐘。在從板除去粘性封條后,首先將AMPure XP珠渦旋振蕩,直至它們 完全分散,并且將160μ1(由與24μ1 PCR級(jí)水混合的136μ1 AMPure XP珠組成)添加至孔,并 將整個(gè)體積再次徹底但溫和地上下移液10次。在溫育15分鐘后,將板于室溫在磁性支架上 再放置15分鐘,直至液體表現(xiàn)得清澈。然后,除去127.5μ1上清液兩次,此后,在不擾亂珠的 情況下將200μ1新鮮制備的80%Et0H填充入板的孔中,于室溫溫育30秒,并且在不擾亂珠的 情況下再次棄去。這重復(fù)兩次,之后將板干燥15分鐘。僅在此后,從磁性支架中取出板,并且 用17.5μ1重懸緩沖液重懸團(tuán)粒,接著通過上下移液10次進(jìn)行10次徹底但溫和混合。在于室 溫溫育2分鐘后,于室溫將板放回磁性支架上,再持續(xù)5分鐘,直至液體表現(xiàn)得清澈,然后,取 出15μ1清澈的上清液,其含有準(zhǔn)備好進(jìn)行接下去步驟中的3'端的腺苷?;哪┒诵迯?fù)的材 料。
[0275] iii)對(duì)于末端修復(fù)的匪TiCIC DNA片段文庫的3'-端腺苷酰化,即,以防止平端彼 此連接,如此確保步驟iv)中的銜接頭連接反應(yīng)期間低比率的嵌合物(串聯(lián)模板)形成,使用 在存在ATP的情況下的Klenow外切酶。在銜接頭的3'端上的相應(yīng)的單一 "T"核苷酸提供了互 補(bǔ)的突出物,用于將銜接頭與片段連接。
[0276] 因此,將15μ1末端修復(fù)的T2C DNA片段文庫轉(zhuǎn)移到新的0.3ml PCR板。由于不再次 使用避免材料污染的串聯(lián)對(duì)照試劑,添加2.5μ1重懸緩沖液,接著是12.5μ1融化的A-加尾混 合物,徹底但溫和地上下移液10次。然后,用Micr 〇seal"B"粘性封條密封板,并且置于30°C 預(yù)先加熱的熱循環(huán)儀上30分鐘。從熱循環(huán)儀中取出板后立即發(fā)生銜接頭連接。
[0277] i v)為了使用11 lumina提供的索引化銜接頭#6和#12連接測(cè)序銜接頭,使用DNA銜 接頭管和停止連接緩沖液管,并且以600xg離心5秒。使用前立即,從-25°C貯存取出含有連 接混合物的管,如由11 lumina推薦。由于不再次使用避免材料污染的串聯(lián)對(duì)照試劑,將2.5μ 1重懸緩沖液添加到另一塊PCR板的孔,并且也添加2.5μ1連接混合物。然后,添加來自合適 的銜接頭管的2.5μ1,并且徹底但溫和地上下移液10次。然后,再用Mic r〇seal"B"粘性封條 密封板,并且以280xg離心板1分鐘。此后,在30°C預(yù)先加熱的熱循環(huán)儀上將板溫育10分鐘, 從循環(huán)儀取下板,除去粘性封條,添加5yl停止連接緩沖液,并且徹底但溫和地上下移液10 次。
[0278] ν)為了再次純化適合測(cè)序儀的T2C DNA片段文庫,使用AMPure ΧΡ珠。因此,離心 AMPure XP珠,直到它們完全分散,并且將42 · 5μ1混合的AMPure XP珠添加到孔,并且徹底但 溫和地上下移液10次,之后于室溫溫育15分鐘。然后,于室溫在磁性支架上放置板最少5分 鐘或更長,直至液體表現(xiàn)得清澈。然后,從板的每個(gè)孔中取出80μ1上清液,并且在板保持在 磁性支架上時(shí),在不擾亂珠的情況下添加200μ1新鮮制備的80%Et0H,并且于室溫溫育30 秒。然后,除去全部的上清液。將此EtOH清洗進(jìn)行兩次,之后仍然在磁性支架上靜置,于室溫 將板風(fēng)干15分鐘。在從磁性支架中取出后,使用52.5μ1重懸緩沖液重懸干燥的團(tuán)粒,并且徹 底但溫和地上下移液10次。在溫育2分鐘后,于室溫將板放回到磁性支架,最少5分鐘或更 長,直至液體表現(xiàn)得清澈。然后,將50μ1清澈的上清液轉(zhuǎn)移到新的0.3. PCR板,用于第二次清 潔,并且添加50μ1渦旋振蕩的AMPure XP珠,并且徹底但溫和地上下移液10次。然后,于室溫 再溫育板15分鐘,于室溫在磁性支架上再放置板,最少5分鐘或更長,直至液體表現(xiàn)得清澈。 除去95μ1上清液,并且在板仍保持在磁性支架上時(shí),在不擾亂珠的情況下對(duì)每孔添加200μ1 新鮮制備的80%Et0H,于室溫溫育30秒。然后,除去全部的上清液。將此EtOH清洗再進(jìn)行兩 次,之后仍然在磁性支架上靜置,于室溫將板風(fēng)干15分鐘。在從磁性支架中取出后,使用 22.5μ1重懸緩沖液重懸干燥的團(tuán)粒,并且徹底但溫和地上下移液10次。再溫育2分鐘后,于 室溫將板放回到磁性支架上,最少5分鐘或更長,直至液體表現(xiàn)得清澈。最后,收集來自板的 每孔的20μ1清澈上清液,并且將來自4個(gè)平行處理的T2C DNA片段文庫中每個(gè)的材料分流匯 集(split pool)。
[0279] 區(qū)域性DNA測(cè)序捕捉微陣列設(shè)計(jì)
[0280] 為了實(shí)現(xiàn)高分辨率并且容許高通量多路復(fù)用測(cè)序以及因此為了實(shí)現(xiàn)高度相關(guān)的 局部相互作用定位,即為了實(shí)現(xiàn)高質(zhì)量T2C2,設(shè)計(jì)特殊的捕捉陣列以特異性選擇感興趣的 基因組區(qū),避免不必要背景的測(cè)序,即以創(chuàng)建區(qū)域性DNA測(cè)序文庫,其經(jīng)優(yōu)化以在第一次限 制后選擇再連接的DNA段,即直接用于僅在特定且相對(duì)較小的基因組區(qū)中的相互作用。因 此,與NimbleGen緊密合作,我們?cè)O(shè)計(jì)了DNA寡聚物用于2.1M捕捉微陣列,即能夠在原則上用 相同量的不同寡聚物釣出210萬不同基因組序列的捕捉微陣列。為了實(shí)現(xiàn)實(shí)際的高質(zhì)量結(jié) 果T2C,盡可能接近在核全基因組限制中使用的第一識(shí)別位點(diǎn),在上游放置僅(?。?個(gè)寡聚 物,并且在下游放置1個(gè),因?yàn)槟繕?biāo)在于測(cè)序此第一次限制的再連接后的僅每側(cè)。使用基因 組版本mm9和HG19,針對(duì)人和小鼠基因組的選定區(qū),在寡聚物長度72 ± 3bp、在整個(gè)基因組中 的獨(dú)特出現(xiàn)(不容許錯(cuò)配)的情況下以及就微陣列上最佳且相似的(即相似的雜交)捕捉而 言,NimbleGen和我們?cè)O(shè)計(jì)了寡聚物。然后,進(jìn)一步選擇寡聚物:在使用第二限制性酶來縮短 再連接的DNA文庫以進(jìn)行測(cè)序的情況中,寡聚物必須位于第一和第二限制性位點(diǎn)之間。在使 用超聲處理來縮短再連接的DNA的情況中,僅選擇在第一識(shí)別位點(diǎn)的150bp內(nèi)的寡聚物。若 僅存在一種寡聚物(其與第一或第二或甚至這兩個(gè)限制性位點(diǎn)交叉),則僅容許總共不超過 10%的寡聚物起始或末端處的切割,即寡聚物可以明確捕捉具有62bp最小值的DNA段以保 證特異性和相似的雜交效率。對(duì)于第一次限制側(cè),在超聲處理情況中應(yīng)用相同的條件。此 后,我們?cè)诨蚪M上定位寡聚物,并且手動(dòng)控制是否滿足條件以及就其它基因組特征而言 是否正確放置寡聚物。為了生成微陣列,用210萬可能的不同寡聚物數(shù)目Qi綱(t\_)除以選 擇的寡聚物的數(shù)目0?(免抱^),然后在NimbleGen的捕捉微陣列的生成過程期間的實(shí)際捕 捉陣列上每個(gè)選擇的寡聚物點(diǎn)樣N點(diǎn)樣)次,其中N點(diǎn)樣A b s ( 0陣列/ 0選擇)
J 口此,憑借使用第一和第二限制性酶進(jìn)行捕捉(參見下文)的寡聚物的 數(shù)目,我們可以確保具有微陣列上每種不同寡聚物的約1〇1()個(gè)寡聚物分子,并且如此憑借 1〇7個(gè)細(xì)胞,我們用作輸入,我們遠(yuǎn)離陣列飽和達(dá)>1〇5至1〇6倍。在使用超聲處理的實(shí)驗(yàn)的情 況中,覆蓋~250倍多的寡聚物和總共~50倍多的基因組區(qū),仍然>10 2,若考慮實(shí)驗(yàn)規(guī)程直 到捕捉陣列中的損失。
[0281] 關(guān)于使用第一和第二限制性酶的實(shí)驗(yàn),計(jì)算選擇的區(qū)域大小、相互作用矩陣的所 得大小,即此區(qū)域內(nèi)的所有限制性片段間的所有可能的相互作用,和對(duì)于每種可能的相互 作用實(shí)現(xiàn)最小值4至5個(gè)數(shù)量級(jí)的高頻率范圍的測(cè)序能力(我們假設(shè)平均值2至3個(gè)數(shù)量級(jí), 其導(dǎo)致4至5個(gè)數(shù)量級(jí)的擴(kuò)散)之間的平衡。如此,對(duì)于約3億和5億個(gè)序列的兩個(gè)測(cè)序道(即 可能的相互作用事件的3億和5億個(gè)測(cè)序)中的測(cè)序能力,以實(shí)現(xiàn)每個(gè)相互作用平均100至1, 〇〇〇個(gè)測(cè)序事件為目標(biāo),500至1,000個(gè)寡聚物以及如此相互作用片段是最佳的。然后覆蓋的 基因組區(qū)僅依賴于分辨率,即基因組內(nèi)的第一限制性酶的平均間隔。
[0282] 在第一和第二限制性酶的情況中,我們選擇如下的寡聚物和捕捉陣列:在人情況 中,這對(duì)從堿基對(duì)位置~1,110,650至~3,216,350的染色體11上的H19/IGF2區(qū),即2,105, 700bp大小的區(qū)域和525個(gè)寡聚物完成。在小鼠情況中,這對(duì)從堿基對(duì)位置~109,876,350至 111,966,600的染色體7上的β-珠蛋白區(qū),即2,090,250bp大小的區(qū)域和800個(gè)寡聚物完成。
[0283] HRHTiCIC2區(qū)域DNA測(cè)序文庫制備-微陣列捕捉
[0284] 為了從T2C全基因組DNA片段測(cè)序文庫生成亞選擇的區(qū)域T2C DNA片段測(cè)序文庫, 使用NimbieGen Array捕捉方案和雜交系統(tǒng)及增強(qiáng)修改(www.nimblegen. com/seqcapez , NimbleGen Arrays User's Guide,Sequence Capture Array Delivery version 3.2),將 連接測(cè)序銜接頭后的匯集DNA文庫進(jìn)行用上文描述的新近且明確開發(fā)的捕捉微陣列的亞選 擇:整個(gè)規(guī)程由以下各項(xiàng)組成:i)微陣列雜交,ii)清洗,之后iii)從微陣列洗脫捕獲的區(qū)域 DNA文庫。
[0285] i)因此,捕捉前3小時(shí),將雜交系統(tǒng)設(shè)置為42°C,將第一加熱快設(shè)置為95°C,并且將 另一個(gè)設(shè)置為70°C,以平衡。然后,通過在連接測(cè)序銜接頭后添加300μ1 lmg/ml Cot-IDNA 至匯集的DNA文庫制備雜交混合物。在使用多路復(fù)用樣品的情況中,不僅匯集4組材料,而且 還匯集多路復(fù)用的樣品。這節(jié)約微陣列能力,且由于要捕捉的DNA的量是微陣列飽和的斗 爭,這為多路復(fù)用多達(dá)10至100個(gè)樣品留下空間,取決于DNA量、濃度和要使用的方法。本文, 僅通過匯集2個(gè)不同材料進(jìn)行多路復(fù)用。然后,在SpeedVac中于60°C干燥30至45分鐘左右, 添加11.2μ1 VWR水以再水合,渦旋振蕩,并且以最大速度離心30秒,之后在70 °C加熱塊上放 置10分鐘以完全溶解DNA。在第二次渦旋振蕩和再以最大速度離心30秒后,添加18.5μ1 2X SC雜交緩沖液和SC雜交組分Α,接著再渦旋振蕩,并且再以最大速度離心30秒。然后,為了使 DNA變性,將樣品置于95°C加熱塊上10分鐘,之后以最大速度再離心30秒。此后,于42°C放置 樣品,并且從那里立即在微陣列雜交室(平行制備完整的微陣列系統(tǒng))上加載,并且于42°C 雜交64小時(shí)。
[0286] ii)為了清洗微陣列上捕獲的區(qū)域性T2C DNA文庫,首先,根據(jù)NimbleGen陣列用戶 指南裝配洗脫室。因此,從42°C NimbleGene雜交系統(tǒng)中取出微陣列載玻片,并且直接放入 含有加熱到47.5°C的100ml SC清洗緩沖液II的解裝配盆中。在用于平衡的~10秒后,剝?nèi)?混合儀,并且將載玻片轉(zhuǎn)移到含有47.5°C的SC清洗緩沖液II的第二清洗管,以每秒1次倒轉(zhuǎn) 的速率將閉合的清洗管倒轉(zhuǎn)10次。然后,將載玻片轉(zhuǎn)移到含有47.5°C的32ml嚴(yán)格清洗緩沖 液的新清洗管,并且以每秒1次倒轉(zhuǎn)的速率將閉合管倒轉(zhuǎn)10次,之后于47.5°C靜置5分鐘,并 且以每秒1次倒轉(zhuǎn)的速率再倒轉(zhuǎn)10次。然后,再將載玻片轉(zhuǎn)移到含有47.5°C的32ml嚴(yán)格清洗 緩沖液的新管,并且以每秒1次倒轉(zhuǎn)的速率將閉合管倒轉(zhuǎn)10次,之后于47.5°C靜置5分鐘,并 且以每秒1次倒轉(zhuǎn)的速率再倒轉(zhuǎn)10次。然后,再將載玻片轉(zhuǎn)移到含有室溫的32ml SC清洗緩 沖液I的新管,并且以每秒1次倒轉(zhuǎn)的速率倒轉(zhuǎn)閉合管2分鐘。然后,再將載玻片轉(zhuǎn)移到含有 室溫的32ml SC清洗緩沖液II的新管,并且以每秒1次倒轉(zhuǎn)的速率倒轉(zhuǎn)閉合管1分鐘。然后, 再將載玻片轉(zhuǎn)移到含有室溫的32ml SC清洗緩沖液III的新管,并且以每秒1次倒轉(zhuǎn)的速率 倒轉(zhuǎn)閉合管10次。
[0287] iii)為了從微陣列洗脫捕獲的區(qū)域性T2C DNA片段測(cè)序文庫,于室溫將載玻片轉(zhuǎn) 移到NimbleGen ELI洗脫系統(tǒng)。然后,將~900μ1 125mM NaOH添加到洗脫室,直到它充滿,并 且溫育10分鐘。將洗脫的區(qū)域性DNA片段測(cè)序文庫移液到1.5ml管,并且補(bǔ)足到900μ1 125mM NaOH,接著在兩個(gè)新管中相等分開,所述管含有在1.5ml管中預(yù)先制備的500μ1 Qiagen緩沖 液roi和16μ120 %乙酸溶液的516μ1完全混合的溶液。然后,將混合物轉(zhuǎn)移到離心機(jī)上的單 一 MinElute柱以在各700μ1的幾個(gè)步驟中使溶液穿過柱。然后,將750μ1緩沖液ΡΕ上柱,并且 離心通過。然后,將MinElute柱放到2ml收集管中,并且以最大速度離心1分鐘以除去任何殘 留的緩沖液PE。棄去流過物,之后在干凈的1.5ml管中放置MinElute柱,將25μ1緩沖液EB添 加到柱,溫育1分鐘,并且以最大速度離心1分鐘。
[0288] T2C擴(kuò)增、簇生成、和配對(duì)末端高通量測(cè)序
[0289] 首先對(duì)于配對(duì)末端測(cè)序,首先通過使用于98°C 30秒,12個(gè)循環(huán)(于98°C10秒,于60 °C 30秒,于72°C 30秒),于72C 5分鐘最終延伸使用Phusion聚合酶的PCR富集T2C區(qū)域性 DNA片段測(cè)序文庫以測(cè)序。對(duì)于各lyg的T2C區(qū)域性DNA片段文庫,將5μ1 PCR引物混合物和25 μL PCR主混合物添加到PCR板。對(duì)于純化,通過每Ι.ΟμΙ DNA添加1.8μ1 AMPure ΧΡ珠使用 AMPure XP珠 (Beckman Coulter)。這于室溫溫育5分鐘,置于磁性支架上,并且于室溫溫育5 分鐘,并且在不擾亂珠的情況下棄去上清液。用新鮮制備的70%乙醇清洗珠2次,于37°C放 置5分鐘以讓珠干燥。然后,將珠在30μ1重懸緩沖液中重懸,并且于室溫溫育5分鐘,在磁性 支架上放置5分鐘,最終將50μ1上清液轉(zhuǎn)移到新管。最后,使用DNA 1000測(cè)定法,在Agi lent Technologies 2100生物分析儀上加載1微升以測(cè)定純化的經(jīng)消化的DNA的質(zhì)量。
[0290] 根據(jù)Illumina cBot用戶指南(www. illumina.com,部分#15006165RevE)進(jìn)行族生 成。簡言之,用NaOH變性ΙμL 10nM TruSeq DNA文庫儲(chǔ)液DNA,稀釋到10pM,并且雜交到流動(dòng) 池(flowcell)上。根據(jù)Illumina配對(duì)末端測(cè)序用戶指南方案,將雜交的片段序貫擴(kuò)增,線性 化,并且末端封閉。在測(cè)序引物雜交后,使用HiSeq 2000測(cè)序儀以101個(gè)循環(huán)方案根據(jù)制造 商的用法說明進(jìn)行合成測(cè)序。使用HiSeq 2000用NaOH變性經(jīng)測(cè)序的片段,并且將索引-引物 雜交到片段上。用7循環(huán)方案測(cè)序索引。用ΝΑ0Η變性片段,序貫擴(kuò)增,線性化,并末端封閉。在 測(cè)序引物雜交后,使用HiSeq 2000測(cè)序儀以101個(gè)循環(huán)方案進(jìn)行第三個(gè)讀出的合成測(cè)序。
[0291] HRHTiCIC2序列定位和分類
[0292]對(duì)原始序列讀出檢查測(cè)序方向上第一限制性酶識(shí)別序列的存在。除去第一酶識(shí)別 位點(diǎn)后的序列。若突出物后的識(shí)別位點(diǎn)堿基不是明確的,則通過除去突出物的末端后的所 有堿基進(jìn)一步修剪讀出。然后,使用Burrows-Wheeler比對(duì)(BWA)工具與全人基因組NCBI36/ hgl8集合(assembly)和小鼠 NCBI37/mm9集合比對(duì)這些經(jīng)修剪的序列。因此,使用下述缺省 參數(shù)集(參數(shù)的數(shù)值在[]括號(hào)中):
[0293] bwa aln[options]<prefix><in.fq>
[0296]在使用第二限制性酶的情況中(并且如此不在超聲處理的情況中),然后,在第二 步中與遮蔽的基因組比對(duì)獨(dú)特的序列,其排除第二限制性酶間的序列部分,并且不含有第 一酶識(shí)別位點(diǎn)。最后,僅那些序列使用SAMtools配對(duì)以生成配對(duì)末端二進(jìn)制比對(duì)/圖(BAM) 文件,其在完全和遮蔽基因組參照序列而兩者中顯示獨(dú)特比對(duì)。注意:比對(duì)是獨(dú)特的,但盡 管如此含有錯(cuò)配等,其帶來測(cè)序誤差或者命中我們的細(xì)胞/小鼠與參照基因組的差異。不幸 地,也沒有區(qū)分假陽性或假陰性比對(duì)的方式。因此,所得的配對(duì)末端序列然后含有具有誤差 率的相互作用信息,其由測(cè)序誤差率、參照序列的質(zhì)量、和我們的細(xì)胞/小鼠的序列與此參 照基因組的差異確定。使用已知的誤差率在此方法結(jié)束時(shí)沒有錯(cuò)配的獨(dú)特序列的假陽性和 假陰性結(jié)果的大致評(píng)估指示由于我們的規(guī)程在誤差積累和誤差降低后誤差小于1 %。這也 可以通過貫穿整個(gè)方法的初始原始序列到最終結(jié)果的序列對(duì)減少而扣除。
[0297]上述說明書中提及的所有出版物通過提及并入本文。在不偏離本發(fā)明的范圍和精 神的前提下,本發(fā)明描述的方法和系統(tǒng)的各種修改和變型對(duì)于本領(lǐng)域技術(shù)人員會(huì)是明顯 的。雖然已經(jīng)結(jié)合具體的優(yōu)選實(shí)施方案描述了本發(fā)明,但是應(yīng)當(dāng)理解如要求保護(hù)的發(fā)明不 應(yīng)過度限于此類具體的實(shí)施方案。實(shí)際上,用于實(shí)施本發(fā)明的描述的模式的各種修改對(duì)于 分子生物學(xué)或相關(guān)領(lǐng)域的技術(shù)人員是明顯的,其意欲在所附權(quán)利要求書的范圍內(nèi)。
【主權(quán)項(xiàng)】
1. 一種用于分析三維DNA結(jié)構(gòu)中來自一個(gè)或多個(gè)感興趣的區(qū)域的一個(gè)或多個(gè)核苷酸序 列與其它核苷酸序列的相互作用的方法,其包括下述步驟: (a) 提供交聯(lián)的DNA的樣品; (b) 用第一限制性酶消化所述交聯(lián)的DNA; (c) 連接交聯(lián)的核苷酸序列; (d) 反轉(zhuǎn)所述交聯(lián); (e) 使來自(d)的連接的分子片段化; (f) 使來自(e)的片段與代表與所述第一限制性酶的切割位點(diǎn)相鄰的序列的一個(gè)或多 個(gè)寡核苷酸雜交,以富集已經(jīng)在步驟(c)中與另一個(gè)核苷酸序列連接的核苷酸序列的末端; 并且 (g) 分析富集的片段的核苷酸序列以鑒定牽涉相互作用的核苷酸序列。2. 根據(jù)權(quán)利要求1的方法,其用于分析三維染色質(zhì)結(jié)構(gòu)中來自一個(gè)或多個(gè)感興趣的基 因組區(qū)的一個(gè)或多個(gè)核苷酸序列與其它核苷酸序列的相互作用。3. 根據(jù)權(quán)利要求1或2的方法,其中所述第一限制性酶是識(shí)別6-8bp識(shí)別位點(diǎn)的限制性 酶。4. 根據(jù)權(quán)利要求3的方法,其中所述第一限制性酶選自下組:BglII、HindIII、EC〇RI、 BamHI、SpeI、PstI和Ndel。5. 根據(jù)前述權(quán)利要求中任一項(xiàng)的方法,其中在步驟(e)中,通過用第二限制性酶消化使 所述連接的分子片段化。6. 根據(jù)權(quán)利要求5的方法,其中所述第二限制性酶識(shí)別4或5bp核苷酸序列識(shí)別位點(diǎn)。7. 根據(jù)權(quán)利要求6的方法,其中所述第二限制性酶選自下組:TSpEI、MaeII、AluI、 Nlalll、HpaII、FnuDII、MaeI、DpnI、MboI、HhaI、HaeIII、RsaI、TaqI、CviRI、MseI、Sthl32I、 AciI、DpnII、Sau3AHPMnlI。8. 根據(jù)權(quán)利要求1至4中任一項(xiàng)的方法,其中在步驟(e)中,通過機(jī)械手段使所述連接的 分子片段化。9. 根據(jù)權(quán)利要求8的方法,其中在步驟(e)中,通過剪切使所述連接的分子片段化。10. 根據(jù)權(quán)利要求1至74中任一項(xiàng)的方法,其中在步驟(e)中,使用識(shí)別2bp酶的限制性 酶或限制性酶的組合或者使用通過通用核酸酶的有限消化使所述連接的分子片段化。11. 根據(jù)權(quán)利要求1至4中任一項(xiàng)的方法,其中在步驟(e)中,使用放射或重離子使所述 連接的分子片段化。12. 根據(jù)前述權(quán)利要求中任一項(xiàng)的方法,其中在步驟(e)后,修復(fù)片段化的分子的DNA末 端。13. 根據(jù)前述權(quán)利要求中任一項(xiàng)的方法,其中在步驟(e)后,為了測(cè)序目的連接銜接頭。14. 根據(jù)權(quán)利要求13的方法,其中所述銜接頭包含地址序列。15. 根據(jù)權(quán)利要求14的方法,其中使用多個(gè)寡核苷酸,其包含不同樣品中的多個(gè)地址序 列以在多路復(fù)用(multiplexing)時(shí)實(shí)現(xiàn)不同樣品的區(qū)分。16. 根據(jù)前述權(quán)利要求中任一項(xiàng)的方法,其中在步驟(f)中,一個(gè)或多個(gè)寡核苷酸探針 在微陣列上點(diǎn)樣或在珠上捕獲,或者存在于溶液中,其隨后在珠上捕獲。17. 根據(jù)前述權(quán)利要求中任一項(xiàng)的方法,其中所述寡核苷酸探針識(shí)別與所述第一限制 性酶的識(shí)別位點(diǎn)相鄰的序列。18. 根據(jù)權(quán)利要求17的方法,其中所述寡核苷酸探針識(shí)別所述第一限制性酶的識(shí)別位 點(diǎn)的lOObp內(nèi)的序列。19. 根據(jù)前述權(quán)利要求中任一項(xiàng)的方法,其中在步驟(f)中,使所述核苷酸序列片段與 寡核苷酸探針組雜交,所述寡核苷酸探針組包含多個(gè)寡核苷酸,每個(gè)所述寡核苷酸與下述 序列雜交,所述序列與來自所述感興趣的基因組區(qū)的核苷酸序列上的所述第一限制性酶的 消化位點(diǎn)相鄰。20. 根據(jù)權(quán)利要求19的方法,其中所述寡核苷酸探針組包含對(duì)基本上所有限制性片段 特異性的探針,所述限制性片段可通過用所述第一限制性酶處理所述感興趣的基因組區(qū)獲 得。21. 根據(jù)前述權(quán)利要求中任一項(xiàng)的方法,其中步驟(g)牽涉富集的核苷酸序列片段的高 通量測(cè)序。22. 根據(jù)前述權(quán)利要求中任一項(xiàng)的方法,其中步驟(g)繼之以所述相互作用的可視化和 生物信息分析。23. 根據(jù)權(quán)利要求2的方法,其中所述感興趣的基因組區(qū)包含感興趣的遺傳基因座。24. 根據(jù)前述權(quán)利要求中任一項(xiàng)的方法,其中所述感興趣的區(qū)域是1-10MB。25. -種用于分析三維結(jié)構(gòu)中特定遺傳元件與其它核苷酸序列的相互作用的方法,其 包括進(jìn)行前述權(quán)利要求中任一項(xiàng)的步驟(a)-(g)的步驟,其中在步驟(g)中,僅分析包含所 述特定遺傳元件的所述富集的核苷酸序列片段的序列以鑒定牽涉與所述遺傳元件的相互 作用的核苷酸序列。26. 根據(jù)權(quán)利要求25的方法,其中所述遺傳元件包含用于轉(zhuǎn)錄因子或絕緣子或屏障元 件的結(jié)合位點(diǎn)。27. 根據(jù)權(quán)利要求25或26的方法,其中所述遺傳元件在所述感興趣的區(qū)域中。28. -種用于確定基因的表達(dá)狀態(tài)的方法,其包括進(jìn)行權(quán)利要求1至24中任一項(xiàng)的步驟 (a)-(g)的步驟,和分析包含所述基因的感興趣區(qū)域中的相互作用的數(shù)目、類型或密度。29. -種比較兩種樣品間的基因活性的方法,其包括對(duì)這兩種樣品進(jìn)行權(quán)利要求1至24 中任一項(xiàng)的步驟(a)-(g)的步驟,和比較感興趣區(qū)域中的相互作用的數(shù)目、類型或密度。30. 根據(jù)權(quán)利要求29的方法,其中所述樣品:來自同一受試者的不同組織;來自不同時(shí) 間點(diǎn)里的單一受試者;來自不同受試者的等同組織。31. -種用于鑒定一種或多種指示特定疾病狀態(tài)的DNA-DNA相互作用的方法,其包括進(jìn) 行權(quán)利要求1至24中任一項(xiàng)的步驟(a) - (g)的步驟,其中在步驟(a)中,從患病細(xì)胞和非患病 細(xì)胞中提供交聯(lián)DNA的樣品,且其中來自所述患病細(xì)胞和非患病細(xì)胞的DNA序列之間的三維 染色質(zhì)結(jié)構(gòu)中核苷酸序列相互作用之間的差異指示所述DNA-DNA相互作用或DNA-DNA相互 作用的模式指示特定的疾病狀態(tài)。32. -種診斷或預(yù)后由DNA-DNA相互作用的變化引起的或與DNA-DNA相互作用的變化有 關(guān)的疾病或綜合征的方法,其包括進(jìn)行權(quán)利要求1-24中任一項(xiàng)的步驟(a)-(g)的步驟,其中 步驟(a)包括提供來自受試者的交聯(lián)DNA的樣品;且其中步驟(f)包括與不受影響的對(duì)照比 較DNA序列之間的相互作用;其中所述對(duì)照和所述受試者之間的差異指示所述受試者正患 有所述疾病或綜合征或者指示所述受試者會(huì)患有所述疾病或綜合征。33. 根據(jù)權(quán)利要求32的方法,其中所述疾病是遺傳疾病。34. 根據(jù)權(quán)利要求32或33的方法,其中所述疾病是癌癥。35. -種用于鑒定一種或多種調(diào)控DNA的三維結(jié)構(gòu)的作用劑的測(cè)定方法,其包括下述步 驟: (a) 使樣品與一種或多種作用劑接觸;并 (b) 進(jìn)行權(quán)利要求1-24中任一項(xiàng)的步驟(a)至(g),其中步驟(a)包括提供來自所述樣品 的交聯(lián)DNA; 其中(i)在存在所述作用劑的情況下的DNA相互作用和(ii)在缺乏所述作用劑的情況 下的DNA相互作用之間的差異指示調(diào)控DNA的三維結(jié)構(gòu)的作用劑。36. -種基本上如本文中描述及參考任何實(shí)施例或附圖的方法或測(cè)定法。37. 根據(jù)權(quán)利要求1至24中任一項(xiàng)的方法,用于通過視覺檢查以小于lOkbp的分辨率鑒 定基因組的3D構(gòu)造。38. 根據(jù)權(quán)利要求1至24中任一項(xiàng)的方法,用于通過視覺檢查以小于lOkbp的分辨率鑒 定確定染色質(zhì)纖維構(gòu)象。39. 根據(jù)權(quán)利要求1至24中任一項(xiàng)的方法,用于通過視覺檢查以小于lOkbp的分辨率鑒 定染色體的亞染色體域結(jié)構(gòu)。40. 根據(jù)權(quán)利要求1至24中任一項(xiàng)的方法,用于通過視覺檢查以小于lOkbp的分辨率鑒 定染色體的亞染色體域結(jié)構(gòu)。41. 根據(jù)權(quán)利要求1至24中任一項(xiàng)的方法,用于通過視覺檢查以小于lOkbp的分辨率鑒 定染色體的環(huán)聚集體/玫瑰花結(jié)結(jié)構(gòu)。42. 根據(jù)權(quán)利要求1至24中任一項(xiàng)的方法,用于當(dāng)與蒙特卡洛和布朗動(dòng)力學(xué)模擬 (Monte-Carlo and Brownian-Dynamic simulation)比較時(shí)以小于lOkbp的分辨率鑒定染 色體的環(huán)聚集體/玫瑰花結(jié)結(jié)構(gòu)。43. 根據(jù)權(quán)利要求1至24中任一項(xiàng)的方法,用于從作為相互作用之間的遺傳距離的函數(shù) 的相互作用頻率的標(biāo)度行為并且與來自蒙特卡洛和布朗動(dòng)力學(xué)模擬的標(biāo)度行為和所述DNA 自身中的長程關(guān)聯(lián)的標(biāo)度比較以小于lOkbp的分辨率鑒定染色體的環(huán)聚集體/玫瑰花結(jié)結(jié) 構(gòu)。
【文檔編號(hào)】C12Q1/68GK105992825SQ201480062775
【公開日】2016年10月5日
【申請(qǐng)日】2014年11月18日
【發(fā)明人】F·格羅斯瓦爾德, T·諾奇
【申請(qǐng)人】鹿特丹伊拉斯謨大學(xué)醫(yī)療中心