相關(guān)申請(qǐng)
本申請(qǐng)要求享有2014年2月3日提交的美國(guó)臨時(shí)專利申請(qǐng)第61/935,129號(hào)的提交日的權(quán)益,該申請(qǐng)的內(nèi)容在此以引用的方式并入本文。
聯(lián)邦政府資助的研究
本發(fā)明在美國(guó)政府的支持下完成,基金號(hào)為nih-1r21hg007426。美國(guó)政府擁有本申請(qǐng)的某些權(quán)利。
背景
染色質(zhì)即蛋白質(zhì)與dna的集合物,其是基因組的生理形式,是dna基本功能的重要調(diào)節(jié)物,在dna代謝、細(xì)胞和整個(gè)有機(jī)體功能中發(fā)揮關(guān)鍵作用。染色質(zhì)結(jié)構(gòu)的基本重復(fù)單位是核小體:8個(gè)核心組蛋白(兩個(gè)拷貝的h2a、h2b、h3和h4)的dna結(jié)合軸狀物(spool),基因組dna纏繞8個(gè)核心組蛋白近兩整圈。例如,可通過(guò)微球菌核酸酶消化來(lái)產(chǎn)生單個(gè)核小體。組蛋白包括h1組蛋白、h2a組蛋白、h2b組蛋白、h3組蛋白和h4組蛋白,并且可被修飾為包含多個(gè)表位和翻譯后修飾。
在細(xì)胞中,組蛋白的翻譯后修飾(或氨基酸序列的變化)能夠調(diào)節(jié)局部染色質(zhì)狀態(tài)的變化,所述局部染色質(zhì)狀態(tài)的變化控制基本dna的可及性,從而調(diào)節(jié)從轉(zhuǎn)錄激活到基因沉默的過(guò)程。這些化學(xué)修飾稱作“表觀遺傳標(biāo)記”,增加了另一信息層而不改變dna的標(biāo)準(zhǔn)堿基配對(duì)容量,而且似乎互相作用并與其它區(qū)別染色質(zhì)特征配合以控制基因組。多種細(xì)胞過(guò)程例如轉(zhuǎn)錄、復(fù)制、干細(xì)胞多能性、基因沉默、x染色體失活、dna修復(fù)、細(xì)胞凋亡、表觀遺傳、細(xì)胞身份記憶(cellularidentityretention)、造血、癌癥、多種中樞神經(jīng)系統(tǒng)疾病、心血管疾病、糖尿病、肥胖、細(xì)菌感染以及發(fā)育期間的基因表達(dá)程序都似乎在其過(guò)程或因果關(guān)系中涉及表觀遺傳修飾。
染色質(zhì)免疫沉淀(chip)是發(fā)現(xiàn)這些表觀遺傳修飾存在于基因組何處以及追蹤它們隨著發(fā)育和病理轉(zhuǎn)變(例如造血干細(xì)胞到白細(xì)胞)中細(xì)胞身份信息的變化而變化的主要方法。chip是本領(lǐng)域熟知的。簡(jiǎn)言之,chip是拉下試驗(yàn)(pull-downassay),其依賴于通過(guò)機(jī)械、物理、化學(xué)或酶法剪切使活生物體的基因組物質(zhì)片段化以產(chǎn)生蛋白質(zhì)-dna片段池(主要為核小體),然后用親和劑例如結(jié)合特定蛋白或其翻譯后修飾的抗體探測(cè)(probed)所述蛋白質(zhì)-dna片段池以拉下特定染色質(zhì)片段。chip利用從片段化的染色質(zhì)“輸入”庫(kù)進(jìn)行的親和捕獲來(lái)富集攜帶有感興趣的表位的片段。可通過(guò)本領(lǐng)域已知的包括rt-pcr、下一代測(cè)序、ddpcr,qpcr、微陣列探針雜交的多種技術(shù)和能夠讀出且量化dna序列的其他方法來(lái)鑒定間接捕獲的dna片段的身份信息、相對(duì)豐度和在基因組中的位置。
然后,這種與蛋白質(zhì)原位結(jié)合的dna位置有關(guān)的信息可用于推斷完整基因組中與dna結(jié)合的蛋白質(zhì)的位置,并評(píng)估與該序列在經(jīng)受親和捕獲的初始片段池(pool)即“輸入”中的頻率相比或相對(duì)于一些其他的基因組基因座,該dna基因座上存在多少結(jié)合的物質(zhì)。換言之,將所捕獲的物質(zhì)用qpcr、下一代測(cè)序等進(jìn)行分析并與陰性對(duì)照進(jìn)行比較以評(píng)估也稱作拉下試驗(yàn)(pull-down)的免疫沉淀所給予的相對(duì)富集。明顯的是,現(xiàn)有技術(shù)從相對(duì)意義上回答了“在基因組何處”這一問(wèn)題,但并沒(méi)有提供與該位點(diǎn)上靶向表位的實(shí)際豐度有關(guān)的重要信息。然而,chip提供了對(duì)位置、組蛋白標(biāo)記和組蛋白變體的組合如何能夠調(diào)控基因表達(dá)(henikoff,2008;jiang和pugh,2009;li和carey,2007)以及這些變化如何能夠調(diào)控細(xì)胞分化(bernstein等,2007)的深刻見(jiàn)解。而且,它是理解表觀遺傳學(xué)在癌癥和其他疾病中的作用包括發(fā)現(xiàn)疾病標(biāo)記物的關(guān)鍵工具(dawson和kouzarides,2012;feinberg,2007)。
盡管用作表觀遺傳學(xué)研究的主要實(shí)驗(yàn)技術(shù),染色質(zhì)免疫沉淀結(jié)合深度測(cè)序(chip-seq)或其它分析仍有許多嚴(yán)重的缺陷。首先,每個(gè)chip測(cè)量都是相對(duì)的,其并不能標(biāo)準(zhǔn)化為任意的參照物(reference),這阻礙了對(duì)來(lái)自同一樣品、不同細(xì)胞和不同患者的不同重復(fù)的數(shù)據(jù)進(jìn)行直接比較。其次,chip重度依賴于抗體試劑的質(zhì)量,即使在同一抗體的不同批次中,抗體試劑的特異性和親和力也有所不同,抗體試劑可對(duì)脫靶(off-target)表位具有明顯的親和力,常常導(dǎo)致假陽(yáng)性檢測(cè)和對(duì)數(shù)據(jù)的曲解(bocketal.,2011;nadyetal.,2008;park,2009;fuchsetal.,2011;landtetal.,2012;egelhoferetal.,2011)。chip中實(shí)驗(yàn)誤差的最大來(lái)源是用于捕獲所期望的表位(組蛋白修飾、變體或轉(zhuǎn)錄因子)的抗體親和劑的質(zhì)量。相關(guān)肽表位的固定排列揭示了“chip級(jí)”抗體結(jié)合的令人頭疼的亂交(bocketal.,2011;egelhoferetal.,2011;fuchsetal.,2011),其因日益復(fù)雜的親和力、特異性和再現(xiàn)性測(cè)量而復(fù)雜化;幾百種商用抗體中有高達(dá)80%不能進(jìn)行嚴(yán)格的質(zhì)量控制(egelhoferetal.,2011;landtetal.,2012)。甚至不同批次的同一商用抗體對(duì)靶標(biāo)的表觀親和力有高達(dá)20倍的不同(hattorietal.,2013)且展現(xiàn)出顯著的特異性差異(nishikorietal.,2012)。然而目前可用的chip實(shí)驗(yàn)內(nèi)并沒(méi)有可用的抗體特異性測(cè)量,這導(dǎo)致評(píng)估數(shù)據(jù)時(shí)的巨大不確定性。再次,即使對(duì)兩種不同抗體具有等價(jià)的抗體親和力和特異性,變化范圍非常大的表位豐度會(huì)妨礙對(duì)chip結(jié)果的有意義比對(duì)(leroyetal.,2013;youngetal.,2009)。最后,chip制備中的非常小的差異可導(dǎo)致輸出數(shù)據(jù)的明顯差異,導(dǎo)致實(shí)驗(yàn)間的不一致。實(shí)驗(yàn)處理的差異(marinovetal.,2014)以及在每個(gè)測(cè)序儀泳道中裝載等量的樣品,即使進(jìn)行差別擴(kuò)增,也使得基于chip的公正比較有問(wèn)題。
因?yàn)閏hip數(shù)據(jù)以重度依賴于精確實(shí)驗(yàn)條件的相對(duì)值(onarelativescale)來(lái)表示,所以歸一化最終需要可能沒(méi)有根據(jù)的假設(shè)(binliuetal.,2013;liang和keles,2012),或者在峰識(shí)別(peakcalling)中必須犧牲掉大部分實(shí)驗(yàn)數(shù)據(jù)以容許進(jìn)行比較(zhangetal.,2008)。除了峰識(shí)別以外,幾乎沒(méi)有廣泛應(yīng)用的chip-seq質(zhì)量控制,到目前為止,在最壞的情形中,chip不可再現(xiàn)(egelhoferetal.,2011;landtetal.,2012;marinovetal.,2014)。到目前為止,在當(dāng)前的方法或技術(shù)中,這些因素中沒(méi)有一個(gè)被考慮到。用目前的chip技術(shù)不可能測(cè)量以基因座特異性(locus-specific)的方式測(cè)量組蛋白修飾的絕對(duì)密度。因此,不能對(duì)某些基因組基因座上看似重疊的不同組蛋白修飾的峰進(jìn)行有意義的比較。而且,實(shí)驗(yàn)者所知曉的實(shí)驗(yàn)變化和缺陷不但阻礙chip試驗(yàn)用作可靠的患者診斷法(盡管其測(cè)量的表觀遺傳標(biāo)記與多種疾病狀態(tài)有明顯的關(guān)聯(lián))而且妨礙chip在基礎(chǔ)科學(xué)研究中的效用。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的一個(gè)方面提供進(jìn)行可應(yīng)用于醫(yī)學(xué)診斷和研究的拉下試驗(yàn)(pull-downassay)例如chip的材料和方法。本發(fā)明使得能夠用絕對(duì)值量化來(lái)自拉下試驗(yàn)的結(jié)果。提供的材料和方法涉及評(píng)價(jià)含核小體的樣品以測(cè)定多個(gè)樣品中基因組基因座上特定表位的密度。
在本發(fā)明的一個(gè)方面,提供了將來(lái)自拉下試驗(yàn)的結(jié)果從用任意單位的任意標(biāo)度(arbitraryscale)轉(zhuǎn)化為用絕對(duì)單位的標(biāo)準(zhǔn)化標(biāo)度(standardizedscale)的方法,該方法改善了數(shù)據(jù)闡釋的精確度。在本發(fā)明的一個(gè)實(shí)施方案中,標(biāo)準(zhǔn)物包含具有真陽(yáng)性表位的類天然親和力、特異性和抗體親抗原性(avidity)的至少一種重構(gòu)dna-結(jié)合蛋白、重組dna-結(jié)合蛋白、半合成dna-結(jié)合蛋白和/或含有變體的dna-結(jié)合蛋白,例如含有感興趣的翻譯后修飾的組蛋白。在優(yōu)選的實(shí)施方案中,標(biāo)準(zhǔn)物還含有條形碼分子,所述條形碼分子被連接至重構(gòu)dna-結(jié)合蛋白、重組dna-結(jié)合蛋白、半合成dna-結(jié)合蛋白和/或含有變體的dna-結(jié)合蛋白。同一類型的多種標(biāo)準(zhǔn)物可組成標(biāo)準(zhǔn)物(standard)。不同類型的多種標(biāo)準(zhǔn)物也可組成標(biāo)準(zhǔn)物。“標(biāo)準(zhǔn)物”可以是例如多種同一類型的組蛋白-條形碼分子,在其他實(shí)施方案中,其可包括包含多種不同條形碼分子的組蛋白-條形碼分子,例如每個(gè)條形碼分子指示所述標(biāo)準(zhǔn)物摻雜至庫(kù)時(shí)的不同濃度。
在本發(fā)明的另一方面,通過(guò)采用一組標(biāo)準(zhǔn)物對(duì)原位假陽(yáng)性表位和真陽(yáng)性表位的拉下效率進(jìn)行量化,這改善了數(shù)據(jù)闡釋的準(zhǔn)確度。在一個(gè)實(shí)施方案中,一組標(biāo)準(zhǔn)物包括具有真陽(yáng)性表位的類天然親和力、特異性和抗體親抗原性的至少一種重構(gòu)dna-結(jié)合蛋白、半合成dna-結(jié)合蛋白或含有變體的dna-結(jié)合蛋白,以及具有假陽(yáng)性表位的類天然親和力、特異性和抗體親抗原性的至少一種半合成dna-結(jié)合蛋白或含有變體的dna-結(jié)合蛋白。該組標(biāo)準(zhǔn)物的使用改善了拉下試驗(yàn)的絕對(duì)定量,因?yàn)樗沟萌藗兡軌蚨吭患訇?yáng)性表位和真陽(yáng)性表位的豐度。對(duì)原位假陽(yáng)性表位和真陽(yáng)性表位的豐度的了解改善了數(shù)據(jù)分析,因?yàn)榭扇菀椎赜?jì)算陽(yáng)性預(yù)測(cè)值(positivepredictivevalue)。對(duì)陽(yáng)性預(yù)測(cè)值的了解改善了數(shù)據(jù)分析,因?yàn)樗沟媚軌蛞砸欢ǖ目煽慷裙浪惚徽J(rèn)為是真陽(yáng)性的表位的最小豐度,這對(duì)于用作醫(yī)學(xué)診斷法和研究而言至關(guān)重要。
在本發(fā)明的另一方面,本發(fā)明提供了包含標(biāo)準(zhǔn)物或一組標(biāo)準(zhǔn)物以及一種或多種親和劑的試劑盒,所述試劑盒用于對(duì)染色質(zhì)免疫沉淀試驗(yàn)中真陽(yáng)性表位和在一組標(biāo)準(zhǔn)物的情況下對(duì)假陽(yáng)性表位進(jìn)行絕對(duì)定量。在本發(fā)明的另一個(gè)方面,本發(fā)明提供了比較多個(gè)樣品的拉下試驗(yàn)結(jié)果的方法。
在另一個(gè)方面,本發(fā)明提供了測(cè)定細(xì)胞染色質(zhì)中基因組基因座上核心組蛋白第一表位的密度的方法。所述方法包括:由染色質(zhì)制備天然核小體庫(kù),其中所述庫(kù)包含核小體,所述核小體含有具有第一表位的核心組蛋白和指示基因組基因座的核小體核苷酸序列。將標(biāo)準(zhǔn)物添加至庫(kù)以生成摻雜庫(kù)(dopedlibrary);其中標(biāo)準(zhǔn)物含有重構(gòu)核小體,重構(gòu)核小體包含(i)具有第一表位的標(biāo)準(zhǔn)組蛋白或標(biāo)準(zhǔn)組蛋白片段和(ii)含有連接至條形碼分子的標(biāo)準(zhǔn)核苷酸序列的標(biāo)準(zhǔn)分子,其中標(biāo)準(zhǔn)組蛋白或標(biāo)準(zhǔn)組蛋白片段與標(biāo)準(zhǔn)核苷酸序列形成穩(wěn)定的蛋白質(zhì)-dna結(jié)合體(association)。
將第一親和劑添加至摻雜庫(kù)以捕獲一定量的天然核小體和含有第一表位的標(biāo)準(zhǔn)物,并通過(guò)對(duì)與所捕獲的含第一表位的天然核小體相關(guān)的給定核苷酸序列的量和與摻雜庫(kù)輸入量的天然核小體相關(guān)的給定核苷酸序列的量進(jìn)行比較來(lái)測(cè)定第一表位的相對(duì)基因組豐度。通過(guò)對(duì)與所捕獲的標(biāo)準(zhǔn)物相關(guān)的條形碼序列的量和與摻雜庫(kù)的輸入量的標(biāo)準(zhǔn)物相關(guān)的給定核苷酸序列的量進(jìn)行比較來(lái)測(cè)定對(duì)第一表位的標(biāo)準(zhǔn)捕獲效率。通過(guò)將相對(duì)基因組豐度與標(biāo)準(zhǔn)捕獲效率進(jìn)行比較來(lái)測(cè)定基因組基因座上核心組蛋白的第一表位的密度。
在一個(gè)實(shí)施方案中,測(cè)定標(biāo)準(zhǔn)捕獲效率包括對(duì)條形碼分子的捕獲量與重構(gòu)核小體的輸入量的比例進(jìn)行比較。在另一個(gè)實(shí)施方案中,測(cè)定相對(duì)基因組豐度包括對(duì)天然核小體核苷酸序列的捕獲量與天然核小體核苷酸序列的輸入量的比例進(jìn)行比較。在另一個(gè)實(shí)施方案中,第一親和劑為針對(duì)第一表位的抗體。
在一些實(shí)施方案中,將多種標(biāo)準(zhǔn)物添加到所述庫(kù),每種標(biāo)準(zhǔn)物含有重構(gòu)核小體,其包含(i)具有第一表位的標(biāo)準(zhǔn)組蛋白和(ii)含有連接至條形碼分子的標(biāo)準(zhǔn)核苷酸序列的標(biāo)準(zhǔn)分子,其中條形碼分子編碼指示添加至庫(kù)的標(biāo)準(zhǔn)物的濃度的濃度參數(shù),并且其中將具有至少兩種不同濃度的標(biāo)準(zhǔn)物添加至庫(kù)。多種標(biāo)準(zhǔn)物還可包括含有重構(gòu)核小體的標(biāo)準(zhǔn)物,所述重構(gòu)核小體包含(i)一種或多種脫靶表位和(ii)編碼脫靶表位身份信息并指示脫靶表位的濃度參數(shù)的標(biāo)準(zhǔn)分子條形碼。
可基于對(duì)脫靶表位的一個(gè)或多個(gè)捕獲效率測(cè)定第一親和劑的脫靶捕獲的特異性,并且基于脫靶捕獲的特異性修正基因組基因座上核心組蛋白的第一表位的密度。第一表位為翻譯后修飾或蛋白質(zhì)同種型(isoform)。條形碼序列為細(xì)胞基因組中沒(méi)有的序列。
可通過(guò)選自pcr、qpcr、ddpcr、下一代測(cè)序、雜交、放射自顯影、熒光標(biāo)記、光密度和使用嵌入探針的方法來(lái)測(cè)定核小體核苷酸序列和標(biāo)準(zhǔn)核苷酸序列中至少一個(gè)的豐度。核心組蛋白的第一表位可含有選自以下的至少一種翻譯后氨基酸修飾:絲氨酸和丙氨酸的n-乙?;?;絲氨酸、蘇氨酸和酪氨酸的磷酸化;n-巴豆?;?n-crotonylation);賴氨酸的n-乙?;?;賴氨酸的n6-甲基化、n6,n6-二甲基化、n6,n6,n6-三甲基化;精氨酸的ω-n-甲基化、對(duì)稱-二甲基化、不對(duì)稱-二甲基化;精氨酸的瓜氨酸化;賴氨酸的泛素化;賴氨酸的類泛素化;絲氨酸和蘇氨酸的o-甲基化;以及精氨酸、天冬氨酸和谷氨酸的adp-核糖基化。
標(biāo)準(zhǔn)分子可以為雙鏈多核苷酸。雙鏈多核苷酸可包括選自seqid.no:1-115的核苷酸序列。條形碼分子可包括選自以下的分子:核苷酸條形碼序列分子、鎖核酸序列以及dna序列。
細(xì)胞可以為來(lái)自患者的細(xì)胞,其中給定基因座上第一表位的量指示選自以下的疾病或病癥:腎細(xì)胞癌、神經(jīng)膠質(zhì)瘤、膠質(zhì)肉瘤、間變性星形細(xì)胞瘤、髓母細(xì)胞瘤、肺癌、小細(xì)胞肺癌、宮頸癌、結(jié)腸癌、直腸癌、脊索瘤、喉癌、卡波濟(jì)氏肉瘤(kaposi'ssarcoma)、淋巴管肉瘤、淋巴管內(nèi)皮肉瘤、結(jié)腸直腸癌、子宮內(nèi)膜癌、卵巢癌、乳腺癌、胰腺癌、前列腺癌、腎細(xì)胞癌、肝癌、膽管癌、絨毛膜癌、精原細(xì)胞瘤、睪丸腫瘤、威爾姆斯瘤(wilms'tumor)、尤文氏瘤(ewing'stumor)、膀胱癌、血管肉瘤、內(nèi)皮肉瘤、腺癌、汗腺癌、皮脂腺肉瘤、乳頭狀肉瘤、乳頭狀腺肉瘤、囊腺肉瘤、支氣管癌、髓樣癌、肥大細(xì)胞瘤、間皮瘤、滑膜瘤、黑色素瘤、平滑肌肉瘤、橫紋肌肉瘤、神經(jīng)母細(xì)胞瘤、視網(wǎng)膜母細(xì)胞瘤、少突神經(jīng)膠質(zhì)瘤、聽(tīng)神經(jīng)瘤、血管母細(xì)胞瘤、腦膜瘤、松果體瘤、室管膜瘤、顱咽管瘤、上皮癌、胚胎癌、鱗狀細(xì)胞癌、基細(xì)胞癌、纖維肉瘤、粘液瘤、粘液肉瘤、神經(jīng)膠質(zhì)瘤、脂肪肉瘤,由幽門(mén)螺旋桿菌(heliocobacterpylori)、單核細(xì)胞增生性李斯特菌(listeriamonocytogenes)、弗氏志賀菌(shigellaflexneri)、嗜吞噬細(xì)胞無(wú)形體(anaplasmaphagocytophilum)、貓披衣菌(chlamdophila)、eb病毒、皰疹病毒、hiv、埃及血吸蟲(chóng)(schistosomahaematobium)引起的感染,肥胖癥、糖尿病、心臟疾病、孤獨(dú)癥、脆性x綜合征、atr-x綜合征、天使人綜合征(angelmansyndrome)、普拉德-威利綜合征(prader-willisyndrome)、貝克威思威德曼綜合征(beckwithwiedemannsyndrome)、雷特氏綜合征(rettsyndrome)、魯賓斯坦-泰必氏綜合癥(rubinstein-taybisyndrome)、coffin-lowry綜合征、免疫缺陷-著絲粒不穩(wěn)定-面部異常綜合征(immunodeficiency-centrometricinstability-facialanomaliessyndrome)、α-地中海貧血、白血病、亨廷頓氏病(huntington’sdisease,)、精神分裂癥、雙相型疾病(bipolardisease)、衰老、癡呆、阿爾茨海默氏病、帕金森氏病、德朗熱綜合征、歌舞伎綜合征、干燥綜合征(sjogren’ssyndrome)、白癜風(fēng)、進(jìn)行性系統(tǒng)性硬化癥、銀屑病、原發(fā)性膽汁性肝硬化、克羅恩病(crohn’sdisease)和潰瘍性結(jié)腸炎、橋本氏甲狀腺炎(hashimoto’sthyroiditis)、格雷夫斯病(grave’sdisease)、炎性腸病、動(dòng)脈粥樣硬化和心臟肥大。
另一個(gè)實(shí)施方案提供了測(cè)定細(xì)胞染色質(zhì)中基因組基因座上核心組蛋白第一表位的密度的方法,所述方法包括:由染色質(zhì)制備天然核小體的庫(kù),其中所述庫(kù)包含核小體,每個(gè)核小體包含核心組蛋白和指示其基因組基因座來(lái)源的核小體核苷酸序列。將標(biāo)準(zhǔn)物添加至所述庫(kù)以生成摻雜庫(kù);其中標(biāo)準(zhǔn)物包含重構(gòu)核小體,其含有(i)具有第一表位的標(biāo)準(zhǔn)組蛋白或標(biāo)準(zhǔn)組蛋白片段和(ii)含有條形碼分子的標(biāo)準(zhǔn)分子,其中標(biāo)準(zhǔn)組蛋白或標(biāo)準(zhǔn)組蛋白片段與標(biāo)準(zhǔn)分子形成穩(wěn)定的蛋白質(zhì)-dna結(jié)合體。
測(cè)定摻雜庫(kù)中基因組基因座上核心組蛋白的量,并測(cè)定摻雜庫(kù)中標(biāo)準(zhǔn)物的量。將親和劑添加至摻雜庫(kù)以捕獲一定量的天然核小體和含有所述表位的重構(gòu)核小體,并基于所捕獲的包含所述表位的標(biāo)準(zhǔn)物的量和摻雜庫(kù)中基因組基因座上核心組蛋白的量測(cè)定基因組基因座上第一表位的相對(duì)基因組豐度?;谒东@的重構(gòu)核小體的量以及摻雜庫(kù)中標(biāo)準(zhǔn)物的量測(cè)定所述表位的標(biāo)準(zhǔn)捕獲效率,并且基于核心組蛋白的第一表位豐度以及標(biāo)準(zhǔn)捕獲效率測(cè)定基因組基因座上核心組蛋白的第一表位的相對(duì)基因組豐度。
在一個(gè)實(shí)施方案中,測(cè)定摻雜庫(kù)中基因組基因座上核心組蛋白的量包括:將第二親和劑添加至摻雜庫(kù)以回收一定量的包含第二表位的核小體,其中第二表位為存在于核心組蛋白上的不變表位(invariantepitope);并測(cè)定所回收的包含第二表位的核小體的量中核小體核苷酸序列的量。在另一個(gè)實(shí)施方案中,測(cè)定摻雜庫(kù)中標(biāo)準(zhǔn)物的量包括回收一定量的重構(gòu)核小體,其中所述重構(gòu)核小體包含第二表位,并測(cè)定所回收的包含第二表位的重構(gòu)核小體的量中標(biāo)準(zhǔn)分子的量。在另一個(gè)實(shí)施方案中,第一親和劑為針對(duì)第一表位的抗體,其中第二親和劑為針對(duì)第二表位的抗體。
另一個(gè)方面提供包含核小體的組合物,所述核小體包含選自含有seqid.no:1-115的序列的核苷酸序列。另一方面提供用于實(shí)施本文所述的方法的試劑盒。在一個(gè)實(shí)施方案中,所述試劑盒包含一種或多種標(biāo)準(zhǔn)物,所述一種或多種標(biāo)準(zhǔn)物包含多種表位和含條形碼的標(biāo)準(zhǔn)分子。在另一個(gè)實(shí)施方案中,所述試劑盒包含至少一種識(shí)別所述多種表位中的至少一種的親和劑。
附圖說(shuō)明
圖1是校準(zhǔn)的染色質(zhì)免疫沉淀實(shí)驗(yàn)實(shí)施方案之一h3k4me3ice-chip-seq的示意圖。
圖2示出了帶條形碼的半合成核小體的設(shè)計(jì)和制備。示意性描述了半合成h3k4me3核小體梯狀物(nucleosomeladder)的重構(gòu):純化組蛋白八聚體,其通過(guò)重折疊等摩爾的核心組蛋白從重組來(lái)源和半合成來(lái)源產(chǎn)生,然后將組蛋白八聚體與等量的帶條形碼的梯狀dna(ladderdna)混合?;?01定位核小體序列圖示了帶條形碼的核小體定位dna序列。
圖3:(a)利用2×連續(xù)稀釋系列用qpcr測(cè)量每個(gè)循環(huán)帶條形碼的梯狀dna(ladderdna)的擴(kuò)增,用線性回歸擬合(擬合的r2示于每個(gè)條中)。(b)在用與測(cè)序銜接子雜交的引物連接所述測(cè)序銜接子后,每個(gè)循環(huán)所有帶條形碼的dna梯狀成員相對(duì)于天然基因組dna片段的擴(kuò)增。
圖4:mescse14細(xì)胞系的h3k4me3ice-chip-seq表明組蛋白修飾密度在所預(yù)期的范圍內(nèi)。最上面的圖表示mesce14細(xì)胞系中hoxa基因簇的實(shí)際h3k4me3組蛋白修飾密度作為chr6染色質(zhì)坐標(biāo)的函數(shù)。icechip結(jié)合illumina配對(duì)末端測(cè)序顯示了e14mesc細(xì)胞系中hoxa基因簇上每堿基對(duì)的h3k4me3修飾密度(hmd,深色線,95%置信區(qū)間,淺色線)作為染色體坐標(biāo)的函數(shù)。編碼基因和非編碼基因用每個(gè)圖下面的線條(bars)和方向箭頭標(biāo)出。下面的小峰代表以原始讀序計(jì)數(shù)(rawreadcont)表示的h3k4me3chip信號(hào)(上圖)(top)和輸入信號(hào)(下圖)。
圖5:icechip的關(guān)鍵考驗(yàn)(a)條形碼標(biāo)簽的相對(duì)豐度歸一化為在ip中測(cè)量到的最豐富的梯狀成員和來(lái)自hek293h3k4me3icechip-seq的輸入。(b)icechip-seq與ddpcr和qpcr相比:中間線代表mesce14細(xì)胞系中未修正的h3k4me3組蛋白修飾密度(hmd)±95%ci(上面的線和下面的線)作為染色體窗口(chromosomalwindow)的函數(shù)。線條分別代表由ddpcr和qpcr測(cè)量的h3k4me3,hmd標(biāo)度(hmdscale)相同(誤差條為95%ci),位于所示的擴(kuò)增子之上。
圖6:icechip是可高度再現(xiàn)的并且比傳統(tǒng)chip更好地防止(robustto)實(shí)驗(yàn)差異。(a)通過(guò)將單核小體hmd平均值(%h3k4me3)繪制成圖比較兩個(gè)樣品(s1和s2)在同一基因座上所識(shí)別的峰的散點(diǎn)圖。(b)通過(guò)icechip-qpcr測(cè)量的mesc中dnmt3a基因座上的hmd(%h3k4me3)和富集(%ip/輸入,代表呈現(xiàn)chip數(shù)據(jù)的常規(guī)方式)作為固定的10μg染色質(zhì)輸入的抗體-樹(shù)脂綴合物的函數(shù)。
圖7:icechip的可再現(xiàn)性和穩(wěn)健性(robustness)。(a)比較果蠅(drosophila)s2細(xì)胞兩次針對(duì)h3k27me3的icechip實(shí)驗(yàn),兩次實(shí)驗(yàn)的輸入相同,但是ip和洗滌有很大的差異。使用標(biāo)準(zhǔn)icechip條件(輸入與樹(shù)脂-ab綴合物孵育15分鐘,然后在50分鐘內(nèi)洗滌5次)得到樣品1數(shù)據(jù),而用更短的孵育和在一分鐘時(shí)間內(nèi)用相同體積流動(dòng)洗滌樹(shù)脂來(lái)實(shí)施樣品2ip。每個(gè)數(shù)據(jù)點(diǎn)對(duì)應(yīng)3000bp非重疊窗口的平均h3k27me3(n=41158);將輸入深度(inputdepth)不足的窗口從分析中排除掉(截止值(cut-off)>5)。對(duì)于每個(gè)試驗(yàn)方案,從一式三份的技術(shù)實(shí)驗(yàn)采集數(shù)據(jù)(單獨(dú)的ip和測(cè)量)。
圖8:具有多種內(nèi)標(biāo)物的icechip。用于小型icechip實(shí)驗(yàn)的染色質(zhì)輸入滴定法如圖9所示。該方法對(duì)等同于400個(gè)細(xì)胞的染色質(zhì)效果很好。
圖9:具有多種內(nèi)標(biāo)物的icechip揭示了原位ip的特異性。(a)比較5個(gè)多標(biāo)準(zhǔn)物icechip-seq實(shí)驗(yàn)中的內(nèi)標(biāo)物捕獲(未修飾的,h3k4me3、h3k9me3、h3k27me3、h3k36me3、帶有條形碼的核小體梯狀物同時(shí)以等摩爾濃度摻入的h3k79me2),使用針對(duì)每種甲基標(biāo)記物的抗體。以相對(duì)ip效率表示的、歸一化為靶上(on-target)梯狀物的數(shù)據(jù)使得能夠容易地比較潛在的脫靶甲基化核小體以及未修飾的核小體。(b)計(jì)算mesc的多標(biāo)準(zhǔn)物icechip實(shí)驗(yàn)中的ip-富集,其表示為ip中原始梯狀成員讀出計(jì)數(shù)相對(duì)于靶上標(biāo)記輸入,以及對(duì)于h3k4me3的最高脫靶背景梯狀物(活性基序am39159)。(c)h3k9me3(m309m3-a(hattorietal.,2013)),(d)h3k27me3(millipore07-449)。
具體實(shí)施方式
除非另有定義,本文使用的所有技術(shù)術(shù)語(yǔ)和科學(xué)術(shù)語(yǔ)的含義與本發(fā)明所述領(lǐng)域的普通技術(shù)人員所通常理解的含義相同。在有沖突的情況下,以本申請(qǐng)文件為準(zhǔn),包括定義。雖然下文描述了優(yōu)選的方法和材料,但是與本文描述的方法和材料類似或等價(jià)的那些可用于實(shí)踐或測(cè)試本發(fā)明。
在描述本發(fā)明的上下文(尤其在接下來(lái)的權(quán)利要求的上下文中),術(shù)語(yǔ)“一個(gè)(a)”和“an(一種)”和“所述(the)”以及類似提法的使用被解釋為包括單數(shù)和復(fù)數(shù),除非本文另有說(shuō)明或明顯與上下文沖突。本文記載值的范圍僅僅意在作為一種便捷的方式單獨(dú)提及落入該范圍內(nèi)的每個(gè)單獨(dú)的值,除非本文另有說(shuō)明。每個(gè)單獨(dú)的值被并入本說(shuō)明書(shū),就如同它們被單獨(dú)記載在本文中。本文描述的所有方法可以任何合適的順序?qū)嵤?,除非本文另有說(shuō)明或明顯與上下文沖突。本文提供的任意或任何舉例或例示性文字(例如,“如”、“例如”)的使用僅意在更好地闡釋本發(fā)明,而不限制本發(fā)明的范圍,除非另有說(shuō)明。說(shuō)明書(shū)中的所有文字都不被解釋為表明任何非請(qǐng)求保護(hù)的元素是實(shí)施本發(fā)明所必需的。
i)定義
術(shù)語(yǔ)“表位”是指生物分子上可引起親和劑結(jié)合的任何位點(diǎn)。親和劑可識(shí)別生物分子或生物分子片段的線性序列、生物分子或生物分子片段的形狀、生物分子或其片段的化學(xué)物理性質(zhì),或它們的組合。
“氨基酸”在本文中可以用其公知的三字母符號(hào)或以iupac-iubbiochemicalnomenclaturecommission(iupac-iub生化命名委員會(huì))推薦的單字母符號(hào)來(lái)提及。蛋白質(zhì)或肽的氨基酸殘基縮寫(xiě)如下:苯丙氨酸是phe或f;亮氨酸是leu或l;異亮氨酸是ile或i;甲硫氨酸是met或m;纈氨酸是val或v;絲氨酸是ser或s;脯氨酸是pro或p;蘇氨酸是thr或t;丙氨酸是ala或a;酪氨酸是tyr或y;組氨酸是his或h;谷氨酰胺是gln或q;天冬酰胺是asn或n;賴氨酸是lys或k;天冬氨酸是asp或d;谷氨酸是glu或e;半胱氨酸是cys或c;色氨酸是trp或w;精氨酸是arg或r;甘氨酸是gly或g。
術(shù)語(yǔ)“氨基酸”是指天然存在的氨基酸和非天然氨基酸,以及以類似于天然存在氨基酸的方式起作用的氨基酸類似物和氨基酸模擬物。天然編碼的氨基酸為20種常見(jiàn)氨基酸(丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、組氨酸、異亮氨酸、亮氨酸、賴氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、絲氨酸、蘇氨酸、色氨酸、酪氨酸和纈氨酸)和吡咯賴氨酸和硒代半胱氨酸。氨基酸類似物是指基本化學(xué)結(jié)構(gòu)與天然存在的氨基酸相同的化合物,即,碳結(jié)合于氫、羧基、氨基、和r基團(tuán),例如高絲氨酸、正亮氨酸、甲硫氨酸亞砜、甲硫氨酸甲基锍。這種類似物具有修飾的r基團(tuán)(如正亮氨酸)或修飾的肽骨架,但保留了與天然存在的氨基酸相同的基本化學(xué)結(jié)構(gòu)。
至于氨基酸序列,本領(lǐng)域技術(shù)人員會(huì)認(rèn)識(shí)到,對(duì)核酸、肽、多肽或蛋白序列的單獨(dú)取代、缺失或添加(改變、添加或缺失所編碼的序列中的單個(gè)氨基酸或少部分氨基酸)是“保守修飾的變體”,其中所述改變導(dǎo)致氨基酸被化學(xué)上類似的氨基酸取代。提供功能類似氨基酸的保守取代表是本領(lǐng)域不同技術(shù)人員所知曉的。除了這種保守修飾變體之外,也不排斥本文所述的物質(zhì)(agent)的多態(tài)變體、種間同源物/直向同源物,以及等位基因。
本文使用的“抗原”可以具有5個(gè)以上氨基酸的任意氨基酸片段(修飾的或未修飾的),其被抗體識(shí)別或可產(chǎn)生識(shí)別其的抗體。在某些實(shí)施方案中,抗原可包含氨基酸修飾例如乙酰化、甲基化(例如單甲基化、二甲基化、三甲基化)、磷酸化、泛素化(例如單泛素化、二泛素化、三泛素化、多泛素化)、類泛素化(sumoylation)、adp-核糖基化、瓜氨酸化(citullination)、生物素化以及順?lè)串悩?gòu)化。在其他實(shí)施方案中,抗原可包含特定的突變例如點(diǎn)突變。在其他實(shí)施方案中,抗原可包含野生型氨基酸序列。
術(shù)語(yǔ)“多肽”、“肽”和“蛋白質(zhì)”在本文中互換使用,指的是氨基酸殘基的聚合物。也就是說(shuō),對(duì)多肽的描述等同地適用于對(duì)肽的描述和對(duì)蛋白質(zhì)的描述,反之亦然。所述術(shù)語(yǔ)適用于天然存在的氨基酸聚合物以及其中一個(gè)或多個(gè)氨基酸殘基為非天然氨基酸的氨基酸聚合物。如本文所用,所述術(shù)語(yǔ)涵蓋任意長(zhǎng)度的氨基酸鏈,包括全長(zhǎng)蛋白,其中氨基酸殘基通過(guò)共價(jià)肽鍵和/或偽肽鍵(pseudopeptidebond)連接。
術(shù)語(yǔ)“翻譯后修飾”是對(duì)天然或非天然氨基酸的任何修飾,在體內(nèi)和體外,在這樣的氨基酸被納入多肽鏈之后所述修飾發(fā)生或?qū)?huì)發(fā)生在該氨基酸上。這樣的修飾包括,但不限于,乙?;?、甲基化(例如單甲基化、二甲基化、三甲基化)、磷酸化、泛素化(例如單泛素化、二泛素化、三泛素化、多泛素化)、類泛素化、adp-核糖基化、瓜氨酸化、生物素化以及順?lè)串悩?gòu)化??赏ㄟ^(guò)合成引入例如化學(xué)法引入(,在多肽合成期間)或酶法引入(在多肽合成或多肽純化之后)這樣的修飾。
術(shù)語(yǔ)“免疫沉淀(ip)富集”是指來(lái)自經(jīng)免疫沉淀樣品的內(nèi)標(biāo)物讀數(shù)除以來(lái)自輸入樣品的內(nèi)標(biāo)物讀數(shù)。
術(shù)語(yǔ)“不對(duì)稱的”是指組蛋白的二聚體內(nèi)的一個(gè)組蛋白含有翻譯后修飾的核小體。例如,三甲基修飾存在于一個(gè)組蛋白h3的9位賴氨酸上,而不存在于二聚體內(nèi)的第二個(gè)h3上。
術(shù)語(yǔ)“對(duì)稱的”是指組蛋白二聚體的兩個(gè)組蛋白均含有翻譯后修飾的核小體。例如三甲基修飾存在于兩個(gè)組蛋白h3的9位氨基酸上。
ii)內(nèi)標(biāo)物校準(zhǔn)的chip(icechip)
目前實(shí)施的拉下試驗(yàn)存在測(cè)量結(jié)果的單位是任意的這一問(wèn)題,這使得任意類型拉下實(shí)驗(yàn)間的任意類型的比較是高度不準(zhǔn)確的并且妨礙拉下試驗(yàn)在醫(yī)學(xué)診斷和醫(yī)學(xué)研究中的使用。通過(guò)將測(cè)試結(jié)果數(shù)值從該試驗(yàn)中分離出來(lái)并將所述測(cè)試結(jié)果數(shù)值與實(shí)際生物現(xiàn)象結(jié)合用具有絕對(duì)單位的標(biāo)準(zhǔn)化標(biāo)度(standardizedscale)來(lái)改善數(shù)據(jù)闡釋的精確度。本發(fā)明的一個(gè)方面提供使得能夠在醫(yī)學(xué)診斷中例如鑒定疾病標(biāo)記物的試驗(yàn)中使用拉下測(cè)試的材料和方法。在這些方法中,拉下試驗(yàn)例如chip所得的數(shù)據(jù)不通過(guò)試驗(yàn)專用的任意值來(lái)表征,而是通過(guò)疾病標(biāo)記物本身專用的絕對(duì)值來(lái)表征。這意味著不同樣品的拉下試驗(yàn)、同一樣品的不同拉下試驗(yàn)、不同表位的拉下試驗(yàn)、在不同實(shí)驗(yàn)室中實(shí)施的拉下試驗(yàn)的結(jié)果可容易且直接地進(jìn)行相互比較,這對(duì)于目前可用的方法和技術(shù)常常是不可能的。
本發(fā)明的一個(gè)方面包括絕對(duì)評(píng)估結(jié)合dna的蛋白、蛋白同種型以及蛋白翻譯后修飾密度的方法,其稱為內(nèi)標(biāo)物校準(zhǔn)的chip(icechip)。該方法在有生物學(xué)價(jià)值范圍內(nèi)提供對(duì)組蛋白修飾的第一局部測(cè)量。該chip的改善利用了非天然存在內(nèi)標(biāo)物,該內(nèi)標(biāo)物可與chip讀數(shù)進(jìn)行比較。作為內(nèi)標(biāo)物,已經(jīng)開(kāi)發(fā)了重組蛋白質(zhì)-dna復(fù)合物和半合成蛋白質(zhì)-dna復(fù)合物,所述重組蛋白質(zhì)-dna復(fù)合物和半合成蛋白質(zhì)-dna復(fù)合物被設(shè)計(jì)為含有具有類天然親和力、特異性和抗體親抗原性特性的表位。
這些蛋白質(zhì)-dna復(fù)合物包括帶有對(duì)親和劑有類天然親和力、特異性和抗體親抗原性的蛋白表位的核小體以及含有標(biāo)準(zhǔn)識(shí)別分子的dna序列,所述標(biāo)準(zhǔn)識(shí)別分子包含定位序列以及獨(dú)特的序列或條形碼。“條形碼”提供特異性識(shí)別dna-蛋白質(zhì)復(fù)合物的獨(dú)一無(wú)二的方法,例如可以為鑒定特定標(biāo)準(zhǔn)半合成核小體的身份和/或濃度的核苷酸序列例如dna、多肽、熒光團(tuán)、發(fā)色團(tuán)、rna序列、鎖核酸序列、親和標(biāo)簽等。在此,術(shù)語(yǔ)“類天然的”是指親和力、特異性和抗體親抗原性與天然存在的表位相似的任何蛋白表位。
圖1示出了icechi試驗(yàn)的一個(gè)實(shí)施方案。在該示意圖中,將標(biāo)準(zhǔn)物的半合成核小體梯狀物-具有攜帶4位賴氨酸n6,n6,n6-三甲基化的修飾的組蛋白h3-以所定義的濃度(由每種獨(dú)特的dna條形碼編碼)摻雜至天然核小體的庫(kù)中,所述天然核小體分離自人細(xì)胞核并通過(guò)用微球菌核酸酶進(jìn)行核內(nèi)消化而釋放出來(lái)。然后使摻雜梯狀物的庫(kù)的樣品經(jīng)受免疫沉淀(ip)、dna純化和下一代測(cè)序。保留摻雜梯狀物的庫(kù)的另一份樣品作為輸入樣品,其不經(jīng)受免疫沉淀。在此,免疫沉淀(ip)或“拉下”是指純化包含一個(gè)或多個(gè)目標(biāo)表位的染色質(zhì)、核小體、dna-蛋白質(zhì)復(fù)合物或蛋白質(zhì)的方法或技術(shù),其中所述表位與對(duì)表位有特異性的親和劑接觸并與所述庫(kù)的其他組分分離開(kāi)來(lái)。
對(duì)經(jīng)免疫沉淀的樣品和輸入樣品實(shí)施能夠讀取并量化dna序列的方法?;趨⒖蓟蚪M對(duì)回收的dna片段定位(mappedto)至相對(duì)基因組位置,并測(cè)量從ip(使用親和劑通過(guò)免疫沉淀產(chǎn)生的樣品)和輸入(不經(jīng)受免疫沉淀的樣品)中回收的dna基因組中每個(gè)堿基對(duì)的這些片段的豐度。對(duì)于用于制備半合成核小體的獨(dú)特核苷酸序列,對(duì)測(cè)序數(shù)據(jù)中的同一讀序(read)進(jìn)行計(jì)數(shù)。ip和輸入中半合成核小體的豐度的比例用于測(cè)量ip效率,ip和輸入中任意基因組基因座的dna片段的豐度的比例用于測(cè)量相對(duì)豐度。所得的所添加的半合成核小體的標(biāo)簽計(jì)數(shù)構(gòu)成獲得基因組范圍上天然核小體的組蛋白修飾密度的校準(zhǔn)曲線。帶有100%修飾的半合成核小體梯狀物的平均ip-富集度(enrichment)比例用作帶有同一表位的天然染色質(zhì)的修正標(biāo)量(scalarcorrection)從而以比例的比例計(jì)算所期望的基因組間隔內(nèi)修飾的量。隨后,將ip效率應(yīng)用于相對(duì)富集度從而以堿基對(duì)分辨率(basepairresolution)測(cè)量整個(gè)基因組內(nèi)h3k4me3組蛋白翻譯后修飾的組蛋白修飾密度。
在一些實(shí)施方案中,具有類天然親和力、特異性和抗體親抗原性的蛋白表位包括具有翻譯后修飾的蛋白同種型和/或蛋白。例如,表位可以是在所述試驗(yàn)中測(cè)量其密度的組蛋白修飾或具有類似結(jié)合特性的表位。在優(yōu)選的實(shí)施方案中,dna-蛋白質(zhì)復(fù)合物的蛋白部分是核心組蛋白八聚體復(fù)合物,其含有核心組蛋白h2a、h2b、h3、h4。這些序列描述于第us2013/044537號(hào)的專利申請(qǐng)中,該申請(qǐng)通過(guò)引用的方式并入本文。為了再現(xiàn)蛋白表位對(duì)任意上述核心組蛋白的類天然親和力、特異性和抗體親抗原性,可由包括表1a-f中列出的那些的任意組蛋白變體來(lái)表示。在本發(fā)明的一個(gè)實(shí)施方案中,蛋白表位可以是組蛋白的片段。
在本發(fā)明的另一個(gè)方面,蛋白質(zhì)-dna復(fù)合物包含標(biāo)準(zhǔn)識(shí)別分子,所述標(biāo)準(zhǔn)識(shí)別分子包括但并不限于定位序列和獨(dú)特的序列或條形碼。包含蛋白定位序列使得能夠通過(guò)與蛋白的特定的類天然相互作用來(lái)形成dna-蛋白質(zhì)復(fù)合物。在優(yōu)選的實(shí)施方案中,蛋白定位序列是核小體定位序列。在一個(gè)實(shí)施方案中,定位序列包含具有至少146個(gè)堿基對(duì)的天然或合成雙鏈dna序列。在一個(gè)更優(yōu)選的實(shí)施方案中,蛋白定位序列為“601-widom”序列-通過(guò)選擇展現(xiàn)出對(duì)核小體的親和力的序列制備的合成核小體結(jié)合序列。雖然此處提及“601-widom”序列作為核小體定位序列,但是本申請(qǐng)實(shí)施方案涵蓋使用展現(xiàn)出對(duì)核小體的親和力的其他這樣的合成序列和天然序列。
獨(dú)特的序列,即條形碼,使得能夠特異性鑒定天然dan-蛋白質(zhì)復(fù)合物的庫(kù)或池中的dna-蛋白質(zhì)復(fù)合物。在一些實(shí)施方案中,獨(dú)特的序列可以被另一種特異性識(shí)別方式例如多肽、熒光團(tuán)、發(fā)光團(tuán)、rna序列、鎖核酸序列、親和標(biāo)簽等所替代。在一個(gè)方面,獨(dú)特的序列可通過(guò)已知的核苷酸分析例如下一代測(cè)序、qpcr或ddpcr進(jìn)行分析。獨(dú)特的序列和定位序列可能是同一序列,并作為識(shí)別分子起雙重作用。獨(dú)特的序列可位于定位序列的5’-末端、定位序列的3’-末端或定位序列的兩端。
在優(yōu)選的實(shí)施方案中,獨(dú)特的序列是雙鏈體dna序列,其具有能夠維持與正在被研究的有機(jī)體的基因組序列以及可能存在于樣品中的所有其他序列相距至少1個(gè)海明距離(hammingdistance)的最小長(zhǎng)度。在更優(yōu)選的實(shí)施方案中,為了保證在天然基因組序列環(huán)境中明顯區(qū)分條形碼,每個(gè)條形碼由不存在于人和小鼠基因組中的兩條11堿基對(duì)(bp)序列制備(heroldetal.,2008),其中11bp序列是保證與人和小鼠基因組至少一個(gè)海明距離的最短序列。在另一個(gè)實(shí)施方案中,條形碼序列為不存在于細(xì)胞基因組中的序列。在另一個(gè)實(shí)施方案中,條形碼序列是自然中不存在的序列。雖然此處提及11bp對(duì)于對(duì)人和小鼠的至少1個(gè)海明距離的最短的可能序列,但是存在可成功用作上述獨(dú)特的序列且具有至少1個(gè)海明距離的無(wú)數(shù)更長(zhǎng)的序列。而且具有對(duì)于其它有機(jī)體基因組的至少1個(gè)海明距離的獨(dú)特序列的最短序列可能短于11bp,正因?yàn)槿绱?,短?1bp的序列可能成功用于這些有機(jī)體。條形碼是分子,在優(yōu)選的實(shí)施方案中,它是可通過(guò)已知dna分析法分析的dna,所述已知的dna分析法包括但不限于下一代測(cè)序和pcr。條形碼序列編碼給定內(nèi)標(biāo)核小體的濃度和/或密度。
在優(yōu)選的實(shí)施方案中,獨(dú)特核苷酸序列指示給定內(nèi)標(biāo)物的濃度和身份。在本發(fā)明的一個(gè)方面,獨(dú)特序列包含至少或至多10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、60、70、80、90或100個(gè)堿基對(duì)的長(zhǎng)度。在另一個(gè)實(shí)施方案中,定位序列和獨(dú)特序列的總長(zhǎng)度為至少100個(gè)堿基對(duì)。在優(yōu)選的實(shí)施方案中,定位序列和獨(dú)特序列選自表7。在一個(gè)方面,獨(dú)特序列為耐微球菌核酸酶(micrococcalnucleaseresistant)的序列。在本發(fā)明的一個(gè)實(shí)施方案中,包含但不限于定位序列以及獨(dú)特序列或條形碼的標(biāo)準(zhǔn)分子包括seqidno:1、seqidno:2、seqidno:3、seqidno:4、seqidno:5、seqidno:6、seqidno:7、seqidno:8、seqidno:9、seqidno:10、seqidno:11、seqidno:12、seqidno:13、seqidno:14或seqidno:15。在優(yōu)選的實(shí)施方案中,包含但不限于定位序列以及獨(dú)特序列或條形碼的標(biāo)準(zhǔn)分子包括seqidno:16、seqidno:17、seqidno:18、seqidno:19、seqidno:20、seqidno:21、seqidno:22、seqidno:23、seqidno:24、seqidno:25、seqidno:26、seqidno:27、seqidno:28、seqidno:29、seqidno:30、seqidno:31、seqidno:32、seqidno:33、seqidno:34、seqidno:35、seqidno:36、seqidno:37、seqidno:38、seqidno:39、seqidno:40、seqidno:41、seqidno:42、seqidno:43、seqidno:44、seqidno:45、seqidno:46、seqidno:47、seqidno:48、seqidno:49、seqidno:50、seqidno:51、seqidno:52、seqidno:53、seqidno:54、seqidno:55、seqidno:56、seqidno:57、seqidno:58、seqidno:59、seqidno:60、seqidno:61、seqidno:62、seqidno:63、seqidno:64、seqidno:65、seqidno:66、seqidno:67、seqidno:68、seqidno:69、seqidno:70、seqidno:71、seqidno:72、seqidno:73、seqidno:74、seqidno:seqidno:75、seqidno:76、seqidno:77、seqidno:78、seqidno:79、seqidno:80、seqidno:81、seqidno:82、seqidno:83、seqidno:84、seqidno:85、seqidno:86、seqidno:87、seqidno:88、seqidno:89、seqidno:90、seqidno:91、seqidno:92、seqidno:93、seqidno:94、seqidno:95、seqidno:96、seqidno:97、seqidno:98、seqidno:99、seqidno:100、seqidno:101、seqidno:102、seqidno:103、seqidno:104、seqidno:.105、seqidno:106seqidno:107、seqidno:108、seqidno:109、seqidno:110、seqidno:111、seqidno:112、seqidno:113、seqidno:114或seqidno:115。
在本文描述的測(cè)定表位密度的方法的一個(gè)實(shí)施方案中,將一組具有標(biāo)準(zhǔn)識(shí)別分子的上述半合成核小體摻雜至一些天然核小體中。該半合成核小體組可包含具有標(biāo)準(zhǔn)識(shí)別分子、帶有多于一種表位但含有至少一種目標(biāo)表位的半合成核小體。例如,一組半合成核小體可帶有翻譯后修飾,即h3k9me3,以及保守表位或不變表位,例如組蛋白的多肽序列。或者,一組半合成核小體可帶有多于一種翻譯后修飾,例如h3k9me3或插入第二表位。在另一個(gè)方面,該組標(biāo)準(zhǔn)物包含具有假陽(yáng)性表位的類天然親和力、特異性和抗體親抗原性的至少一種半合成的dna結(jié)合蛋白、重構(gòu)的dna結(jié)合蛋白或含變體的dna結(jié)合蛋白,所述假陽(yáng)性表位不同于目標(biāo)表位。在優(yōu)選的實(shí)施方案中,一組半合成核小體或含變體核小體包含至少一種具有真陽(yáng)性表位的類天然親和力、特異性和抗體親抗原性的核小體以及至少一種具有假陽(yáng)性表位的類天然親和力、特異性和抗體親抗原性的核小體。
為了從蛋白質(zhì)-dna復(fù)合物池純化天然核小體或半合成核小體的群,人們可使用親和捕獲步驟,在該步驟中親和劑識(shí)別核小體的不變片段例如組蛋白。在一個(gè)方面,接觸目標(biāo)表位的親和劑包括抗體、單克隆抗體、適配體、fab或結(jié)合肽。純化核小體群的方法可應(yīng)用于單獨(dú)的半合成核小體、單獨(dú)的天然核小體,或摻雜有半合成核小體的天然核小體。
ice-chip數(shù)據(jù)分析
在一個(gè)實(shí)施方案中,為了實(shí)施ice-chip,將一組上述內(nèi)標(biāo)物摻雜至一些天然dna-蛋白質(zhì)復(fù)合物中,所述內(nèi)標(biāo)物可與chip讀數(shù)(read-out)進(jìn)行比較。下面描述如何用這些標(biāo)準(zhǔn)物計(jì)算標(biāo)準(zhǔn)ip效率,然后根據(jù)所研究的表位是否為不變蛋白片段、蛋白同種型或蛋白翻譯后修飾,進(jìn)而用該標(biāo)準(zhǔn)ip效率計(jì)算蛋白或表位密度(pd)、蛋白變體密度(pvd)或蛋白修飾密度(pmd)?;诰哂蓄愄烊挥H和力、特異性和抗體親抗原性的半合成或含變體核小體的標(biāo)準(zhǔn)物通過(guò)使人們能夠?qū)M蛋白修飾密度(hmd)或組蛋白變體密度(hvd)進(jìn)行絕對(duì)定量來(lái)改善染色質(zhì)免疫沉淀。
組蛋白修飾密度是標(biāo)準(zhǔn)化的標(biāo)度(scale),定義為給定基因組位置內(nèi)所有核小體中帶有特定表位的核小體的表觀百分比(apparentpercentage)。組蛋白修飾密度以類比標(biāo)度(analogscale)表示,所述類比標(biāo)度的范圍為從意味著表位不存在的0%至意味著表位飽和存在的100%。例如,gapdh基因核小體+1(轉(zhuǎn)錄起始位點(diǎn)下游第一個(gè)核小體)的90%h3k4me3組蛋白修飾密度應(yīng)被理解為,在構(gòu)成gapdh基因啟動(dòng)子上核小體+1的所有組蛋白h3分子的群中,它們中有90%帶有組蛋白h3的4位賴氨酸的n6,n6,n6-三甲基化(h3k4me3)翻譯后修飾,10%應(yīng)沒(méi)有h3k4me3。雖然針對(duì)為約147bp的跨越(spanning)單個(gè)核小體的基因組區(qū)域給出了該實(shí)例,但同樣的方法可應(yīng)用于從單個(gè)堿基對(duì)到整個(gè)基因組的任意的基因組范圍。
為了計(jì)算蛋白密度或表位密度,人們需要知曉4項(xiàng)內(nèi)容:基因組基因座大小、表位豐度、總蛋白豐度以及免疫沉淀效率(“ip效率”)。基因組基因座大小由使用者定義,其范圍可以為從單個(gè)堿基對(duì)到整個(gè)基因組。表位豐度定義為基因組基因座范圍內(nèi)表位的豐度。通常通過(guò)量化結(jié)合至dna-蛋白質(zhì)復(fù)合物的dna的量來(lái)推斷豐度,因?yàn)槠渑c蛋白質(zhì)有化學(xué)計(jì)量關(guān)系;dna易于用多種方法進(jìn)行量化,例如pcr、rt-pcr、ddpcr、下一代測(cè)序、雜交、放射自顯影、熒光標(biāo)記、光密度和插入熒光探針等。然而,還可通過(guò)用光密度、熒光、放射自顯影、質(zhì)譜、比色試驗(yàn)、多肽全分解等測(cè)量蛋白質(zhì)濃度來(lái)直接測(cè)量豐度。
在其中特異性親和劑識(shí)別表位的親和捕獲步驟之后測(cè)量表位豐度,在該親和捕獲步驟之后,將表位-親和劑復(fù)合物與dna-蛋白質(zhì)復(fù)合物的未結(jié)合群分離開(kāi)。很多時(shí)候,通過(guò)將表位-親和劑復(fù)合物固定在表面上并洗掉dna-蛋白質(zhì)復(fù)合物的未結(jié)合群來(lái)將表位-親和劑復(fù)合物與未結(jié)合的核小體分離開(kāi)??偟鞍棕S度定義為給定基因組基因座范圍內(nèi)所有給定類型的形成dna-復(fù)合物的蛋白的豐度。用與表位豐度相同的方法測(cè)量總蛋白豐度。
為了從其他蛋白質(zhì)-dna復(fù)合物純化核小體群,人們可使用其中親和劑識(shí)別核小體的不變片段例如組蛋白的親和捕獲步驟。然而,如果給定的參與形成蛋白質(zhì)-dna復(fù)合物的不變片段在所考慮的基因組基因座大小(size)內(nèi)是占支配地位的,那么在假設(shè)其他蛋白質(zhì)-dna復(fù)合物的群無(wú)關(guān)緊要的情況下可跳過(guò)針對(duì)總蛋白群的親和捕獲步驟。表位豐度與總蛋白豐度的比例應(yīng)給出每蛋白表位密度。然而這相當(dāng)少見(jiàn),因?yàn)橛H和捕獲步驟是100%有效的,如果利用了兩個(gè)或多個(gè)親和捕獲步驟,那么它們的捕獲效率很少會(huì)彼此相同。為了解決這一問(wèn)題,人們需要知曉表位豐度與總蛋白豐度測(cè)量之間的相對(duì)ip效率。
“ip”效率是指一個(gè)或多個(gè)拉下試驗(yàn)之間表位的相對(duì)回收率。知曉標(biāo)準(zhǔn)物的ip效率使得能夠通過(guò)修正一次或多次拉下試驗(yàn)之間回收率的差異來(lái)進(jìn)行絕對(duì)定量。在一個(gè)實(shí)施方案中,通過(guò)使用一組具有與天然表位相同的親和力、特異性和抗體親抗原性且在復(fù)合物混合物中的豐度易于測(cè)量的上述標(biāo)準(zhǔn)物來(lái)測(cè)量上述ip效率。將這些半合成標(biāo)準(zhǔn)物摻雜至天然dna-蛋白質(zhì)復(fù)合物的池中,該天然dna-蛋白質(zhì)復(fù)合物池的樣品將經(jīng)受親和捕獲。該步驟之后,用提及的豐度測(cè)量方法中的一種對(duì)半合成標(biāo)準(zhǔn)物和天然dna-蛋白質(zhì)復(fù)合物群進(jìn)行上述表位豐度和總蛋白密度測(cè)量。在一個(gè)實(shí)施方案中,該標(biāo)準(zhǔn)物組包括以不同濃度添加的標(biāo)準(zhǔn)物。在此,添加濃度被條形碼唯一地鑒定出來(lái)。
在一個(gè)實(shí)施方案中,可通過(guò)對(duì)結(jié)合至dna-蛋白質(zhì)復(fù)合物的dna進(jìn)行定量來(lái)測(cè)量標(biāo)準(zhǔn)dna-蛋白質(zhì)復(fù)合物和天然dna-蛋白質(zhì)復(fù)合物的表位豐度。在優(yōu)選的實(shí)施方案中,ip中給定標(biāo)準(zhǔn)條形碼的表位與半合成核小體輸入原料的比例等于標(biāo)準(zhǔn)ip效率?;蛘?,該標(biāo)準(zhǔn)ip效率可計(jì)算為表位特異性ip中條形碼豐度與總蛋白豐度(對(duì)于組蛋白h3,例如抗-h3總ip中的條形碼計(jì)數(shù))的比例。一旦計(jì)算出ip效率,就可將該標(biāo)準(zhǔn)ip效率應(yīng)用于任何基因組基因座的ip/輸入dna比例或ip-表位/ip-總蛋白比例。這通過(guò)將基因組ip效率即ip中表位豐度(親和步驟中捕獲的給定基因組間隔的dna的量)與輸入中存在的同一間隔內(nèi)dna的量的比例除以標(biāo)準(zhǔn)ip效率計(jì)算出來(lái)。或者這可計(jì)算為對(duì)于上述任何基因組基因座,ip中給定基因組dna片段除以總表位豐度ip中同一物質(zhì)(species)的量然后除以標(biāo)準(zhǔn)ip效率。所得的值為蛋白密度或表位密度(pd),也稱為蛋白變體密度(pvd)或蛋白修飾密度(pmd)。
修正脫靶特異性
分析拉下實(shí)驗(yàn)所面臨的另一問(wèn)題是源于拉下試驗(yàn)中所用親和劑的脫靶特異性進(jìn)行預(yù)測(cè)的精確度較低。術(shù)語(yǔ)“假陽(yáng)性”和“脫靶”是同義詞,是指表位雜亂地或非特異性地接觸親和劑或不正確的結(jié)果。術(shù)語(yǔ)“真陽(yáng)性”和“中靶(on-target)”是同義詞,是指感興趣的表位或正確的結(jié)果。
假陽(yáng)性表位的發(fā)生率在拉下試驗(yàn)之間是不同的,并且取決于親和劑的質(zhì)量(其固有的對(duì)所期望表位的結(jié)合親和力相對(duì)于其對(duì)其他相關(guān)表位的親和力)、天然染色質(zhì)中靶表位和脫靶表位的富集度、拉下試驗(yàn)中親和劑的能力與dna-蛋白質(zhì)復(fù)合物裝載水平的比例以及進(jìn)行拉下試驗(yàn)的其他條件。對(duì)于不同的親和劑,中靶結(jié)合和脫靶結(jié)合以不同程度促成表觀chip信號(hào),在用常規(guī)chip進(jìn)行的給定試驗(yàn)中,每種來(lái)源作出何種程度的貢獻(xiàn)是未知的。在不知曉脫靶結(jié)合的豐度的情況下,人們不能決定所觀察到的表位豐度是明顯的還是不明顯的,這進(jìn)而使得在醫(yī)學(xué)診斷和醫(yī)學(xué)研究中使用拉下試驗(yàn)是不切實(shí)際的。本發(fā)明人已發(fā)現(xiàn),原位量化拉下試驗(yàn)中假陽(yáng)性表位和真陽(yáng)性表位的ip效率的方法,該方法改善了數(shù)據(jù)闡釋的精確度,因?yàn)榭扇菀椎赜?jì)算陽(yáng)性預(yù)測(cè)值(ppv)。ppv使得能夠以一定的可靠度估計(jì)被認(rèn)為是真陽(yáng)性的表位的最小豐度。
使用上述計(jì)算ip效率和標(biāo)準(zhǔn)ip效率的方法,可計(jì)算陽(yáng)性預(yù)測(cè)值(ppv),也稱作精確度。知曉ppv簡(jiǎn)化了任何數(shù)據(jù)分析因?yàn)槠涫沟媚軌蚬烙?jì)蛋白密度的任意差異是明顯的還是不明顯的,這是目前可用的方法和技術(shù)所不能實(shí)現(xiàn)的。
ηtp為真陽(yáng)性表位的ip效率,α為真陽(yáng)性表位的給定重量,ηfp為假陽(yáng)性表位也稱為脫靶表位的ip效率,β為假陽(yáng)性表位的重量。在缺乏重量分布現(xiàn)有知識(shí)的情況下,α=β=1。存在該等式的其他變形形式。假陽(yáng)性和真陽(yáng)性表位發(fā)生率知識(shí)的使用可用于其他應(yīng)用。
有兩種校準(zhǔn)chip的備選方法:使用外標(biāo)的總組蛋白修飾密度校準(zhǔn)以及直接的內(nèi)標(biāo)校準(zhǔn)。如這項(xiàng)工作中主要采用的相對(duì)內(nèi)標(biāo)方法,這兩種方法給出以“組蛋白修飾密度”單位表示的結(jié)果,其等于所檢測(cè)的表位與給定基因座中可得的所有其他表位的表觀比例。
總組蛋白修飾密度校準(zhǔn)依賴于測(cè)量修飾相對(duì)于組蛋白的量的總比例,例如知曉為k4三甲基化的所有h3的百分比。該總組蛋白修飾密度,獲自質(zhì)譜或定量蛋白質(zhì)印跡測(cè)量,可隨后在任何給定基因座的對(duì)輸入深度校準(zhǔn)的ip峰中重新分布。該方法的缺陷除了進(jìn)行總豐度測(cè)量中的相當(dāng)大的誤差(例如ms精確度加上可能不能觀察到修飾的所有潛在形式的不確定性)之外還有需要通過(guò)正交法對(duì)chip中使用的相同核小體樣品進(jìn)行這樣的外部測(cè)量,并且兩種技術(shù)的樣品處理?yè)p失是誤差的主要來(lái)源。尤其是,ip效率從不是100%(尤其是其可以小很多),因此ip效率偏離理論最大值的程度將反映在明顯增高的表觀hmd值上。
直接內(nèi)標(biāo)校準(zhǔn)通過(guò)chip法測(cè)量摻入的帶條形碼的核小體標(biāo)準(zhǔn)物的標(biāo)簽數(shù),知曉輸入中每種內(nèi)標(biāo)梯狀物成員的精確摩爾濃度以推斷原始樣品中所探測(cè)的表位的絕對(duì)摩爾豐度。這種校準(zhǔn)受到經(jīng)受微球菌核酸酶消化的細(xì)胞核數(shù)量的計(jì)數(shù)精確度和有偏差的損失的限制,從良好量化的數(shù)目轉(zhuǎn)為(mountontheway)徹底片段化的染色質(zhì)分離物。因?yàn)樵诟叨葍?yōu)化的消化條件和分離條件下從經(jīng)消化的核酸中回收僅略高于80%的核酸,所以存在由有偏差的基因組回收造成的系統(tǒng)性誤差(henikoffetal.,2009)。
該實(shí)施方案的另一優(yōu)點(diǎn)是通過(guò)解以下矩陣方程式:a*x=b從假陽(yáng)性表位信號(hào)中去卷積(deconvolute)真陽(yáng)性表位信號(hào),在此以組蛋白修飾密度為例示出。對(duì)于所指示的數(shù)據(jù)集,通過(guò)解以下矩陣方程式:a*x=b對(duì)icechip-seq跟蹤數(shù)據(jù)(track)進(jìn)行脫靶特異性(off-specificity)修正。
本發(fā)明的另一個(gè)實(shí)施方案描述了通過(guò)解以下矩陣方程式:a*x=b從假陽(yáng)性表位信號(hào)中去卷積(deconvolute)真陽(yáng)性表位信號(hào)的方法,在此以組蛋白修飾密度為例示出:
其中,x是經(jīng)修正的hmd得分矩陣,a是修正系數(shù)矩陣,b是未修正的hmd得分矩陣,其中t是在使用針對(duì)來(lái)自“a”到“z”(上標(biāo))組蛋白標(biāo)記組的組蛋白標(biāo)記的抗體的免疫沉淀中,針對(duì)來(lái)自“a”到“z”(下標(biāo))組蛋白標(biāo)記組的組蛋白標(biāo)記的特異性的修正系數(shù);hmd是從第一基因座到第n基因座給定組蛋白標(biāo)記(“a”到“z”)的組蛋白修飾密度;hmd(cor)是從第1基因座到第n基因座給定組蛋白標(biāo)記的經(jīng)修正的組蛋白修飾密度
其中,t是在使用針對(duì)來(lái)自“a”到“z”(上標(biāo))組蛋白標(biāo)記組的組蛋白標(biāo)記的抗體的免疫沉淀中,針對(duì)來(lái)自“a”到“z”(下標(biāo))組蛋白標(biāo)記組的組蛋白標(biāo)記的特異性的修正系數(shù);hmd是從第1基因座到第n基因座給定組蛋白標(biāo)記(“a”到“z”)的組蛋白修飾密度;hmd(cor)是從第1基因座到第n基因座給定組蛋白標(biāo)記的經(jīng)修正的組蛋白修飾密度
其中,
疾病診斷
臨床不采用常規(guī)chip試驗(yàn)的主要原因是,它們常常因?yàn)槲⑷醯奶幚聿町惡妥兓目贵w特異性而不可再現(xiàn),使得實(shí)驗(yàn)之間ip的富集%變化很大,并且使得客觀公正的比較是有問(wèn)題且不可靠的。利用具有經(jīng)受對(duì)變化敏感的chip步驟的內(nèi)標(biāo),如6a、表6b和表7a所表明的,ice-chip在結(jié)果的重復(fù)性和可靠性方面要穩(wěn)健很多,可容易地比較數(shù)值,因?yàn)閔md是通過(guò)與良好定義的內(nèi)標(biāo)進(jìn)行直接原位比較得到的通用的生物相關(guān)標(biāo)度。
組蛋白修飾和其他表觀遺傳機(jī)制對(duì)于調(diào)節(jié)基因活性和細(xì)胞過(guò)程是關(guān)鍵的。不同的組蛋白修飾調(diào)節(jié)不同的過(guò)程,例如轉(zhuǎn)錄、dna復(fù)制和dna修復(fù)。這些修飾中任一修飾的解除調(diào)節(jié)(deregulation)可改變基因表達(dá)平衡,導(dǎo)致異常的表觀遺傳模式和細(xì)胞異常。例如,已經(jīng)在各種癌癥中檢測(cè)到組蛋白翻譯后修飾和變體的變化,并且已知異常修飾模式在某些情況下是疾病的驅(qū)動(dòng)者(daigleetal.,2011;chietal.,2010)。
本發(fā)明的材料和方法可用于與組蛋白翻譯后修飾的變化相關(guān)的任何疾病的診斷、預(yù)后、分類、疾病風(fēng)險(xiǎn)預(yù)測(cè)、復(fù)發(fā)檢測(cè)、選擇療法以及評(píng)估療效,所述任何疾病包括患者例如人類患者中的癌癥。這種分析還可與患者細(xì)胞或誘導(dǎo)多能性干細(xì)胞的離體(exvivo)培養(yǎng)結(jié)合以評(píng)估給定的產(chǎn)生真正多能性干細(xì)胞的去分化實(shí)驗(yàn)方案或使干細(xì)胞分化成特定細(xì)胞類型的實(shí)驗(yàn)方案的適用性。
可檢測(cè)到任何發(fā)展期,例如原發(fā)性癌、轉(zhuǎn)移癌和復(fù)發(fā)性癌。有關(guān)多種類型的癌癥的信息可從例如americancancersociety(美國(guó)癌癥協(xié)會(huì))(可在萬(wàn)維網(wǎng)的cancer.org上找到)或從例如harrison'sprinciplesofinternalmedicine(哈里森內(nèi)科學(xué)),(2005)中找到。
本發(fā)明的某些方面提供疾病診斷的方法,例如評(píng)估患者患癌癥的可能性、將病期分類、監(jiān)測(cè)癌癥患者中治療的療效。這種方法基于以下發(fā)現(xiàn):ice-chip可用于校準(zhǔn)chip實(shí)驗(yàn)以控制處理差異(handlingdifference)和抗體可變性。因此,通過(guò)測(cè)定取自患者的細(xì)胞中特定組蛋白ptm(參見(jiàn),例如表1)包括本文描述的甲基化組蛋白的水平,有可能確定患者是否有患上特定疾病的風(fēng)險(xiǎn)或已經(jīng)患上特定疾病。例如,如本文所述,癌組織中組蛋白ptm水平的量化可用于癌癥預(yù)后或癌癥診斷。
在本發(fā)明的許多實(shí)施方案中,本發(fā)明某些方面中描述的材料和方法可用于檢測(cè)給定基因組基因座上生物樣品中組蛋白ptm或變體的水平,從而檢測(cè)生物樣品中是否存在病變細(xì)胞。在一些實(shí)施方案中,生物樣品包括來(lái)自疑似含病變細(xì)胞例如癌細(xì)胞的組織的組織樣品。可通過(guò)本領(lǐng)域已知的任何手段獲得人類染色質(zhì)dna樣品。在要檢測(cè)特定表型或疾病的情況下,應(yīng)從目標(biāo)(ofinterest)組織即血細(xì)胞或視情況從腦脊髓液制備含組蛋白的樣品。例如可由活檢組織制備含組蛋白的樣品以檢測(cè)與癌癥相關(guān)的組蛋白ptm狀況。
視情況而定,可通過(guò)本領(lǐng)域已知的任何方法包括外科手術(shù)來(lái)獲得組織或細(xì)胞。在其他實(shí)施方案中,可分析已知含有癌細(xì)胞的組織樣品例如來(lái)自腫瘤的樣品在一個(gè)或多個(gè)組蛋白ptm位點(diǎn)例如表1所述的那些位點(diǎn)上組蛋白ptm的存在或量,以確定與所述疾病相關(guān)的信息,例如某些療法的療效,個(gè)體的存活預(yù)期、特定類型的疾病的存在等。在一些實(shí)施方案中,所述方法可與另外的預(yù)后方法或診斷方法例如檢測(cè)其他疾病標(biāo)記物等結(jié)合使用。
本發(fā)明的某些方面的材料和方法可用于評(píng)估已知或疑似患病包括癌癥的個(gè)體或用作常規(guī)臨床測(cè)試,例如在未必疑似患病的個(gè)體中。可實(shí)施其他診斷試驗(yàn)以確認(rèn)個(gè)體的疾病狀態(tài)。
本發(fā)明的方法和材料可進(jìn)一步地用于評(píng)價(jià)治療療程的療效??赏ㄟ^(guò)使用本文描述的方法和材料隨時(shí)間監(jiān)測(cè)患病的哺乳動(dòng)物中的組蛋白翻譯后修飾或變體沉積來(lái)評(píng)估治療療效。例如,治療后從哺乳動(dòng)物取出的生物樣品中本文描述的任一種甲基化生物標(biāo)記的組蛋白修飾的水平與治療前或治療前期從該哺乳動(dòng)物取出的樣品中的水平相比減少或缺失,這表明治療有效。本文所述的組蛋白ptm的檢測(cè)可單獨(dú)或與其它標(biāo)記物聯(lián)合用于疾病的診斷或預(yù)后。
某些實(shí)施方案的材料和方法可用于確定患病哺乳動(dòng)物的最佳治療療程。例如,本文描述的一些甲基化生物標(biāo)記中存在甲基化組蛋白標(biāo)記或某些甲基化生物標(biāo)記中甲基化的量增加可表明患癌哺乳動(dòng)物的預(yù)期存活壽命降低,從而表明對(duì)哺乳動(dòng)物更積極的治療。另外,如本文所述,可容易地建立甲基化生物標(biāo)記上甲基化的存在、缺失或其量與一種或多種抗癌劑的相對(duì)療效之間的關(guān)聯(lián)。例如,可回顧性進(jìn)行這種分析,即,通過(guò)使用本文所述的材料和方法檢測(cè)先前從哺乳動(dòng)物-該哺乳動(dòng)物隨后經(jīng)受一種或多種抗癌劑治療-取出的樣品中一種或多種甲基化生物標(biāo)記中的甲基化并將已知的治療療效與如上所述的一種或多種甲基化生物標(biāo)記的甲基化的存在、缺失或水平相關(guān)聯(lián)。
在基于特定組蛋白ptm的存在、缺失或hmd進(jìn)行診斷、預(yù)后、風(fēng)險(xiǎn)評(píng)價(jià)、分類、復(fù)發(fā)檢測(cè)或療法選擇的過(guò)程中,可將ptm或變體的量與閾值進(jìn)行比較,所述閾值將一次診斷、預(yù)后、風(fēng)險(xiǎn)評(píng)價(jià)、分類與另一次診斷、預(yù)后、風(fēng)險(xiǎn)評(píng)價(jià)、分類區(qū)分開(kāi)來(lái)。例如,閾值可代表以所期望的靈敏度和特異性水平將癌癥樣品與正?;顧z樣品充分區(qū)別開(kāi)的組蛋白甲基化水平。在使用ice-chip的情況下,閾值將不會(huì)根據(jù)所使用的抗體或處理?xiàng)l件而有所不同。閾值或閾值范圍可通過(guò)如下確定,即使用ice-chip測(cè)量病變樣品和正常樣品中特定目標(biāo)組蛋白ptm,然后確定將至少大部分癌癥樣品從大部分非癌癥樣品中區(qū)分出來(lái)的值。
在一些實(shí)施方案中,所述方法包括基于從個(gè)體測(cè)定的組蛋白ptm狀況記錄診斷、預(yù)后、風(fēng)險(xiǎn)評(píng)價(jià)或分類??煽紤]任何類型的記錄,例如電子記錄例如用計(jì)算機(jī)。
本發(fā)明的一些實(shí)施方案測(cè)定患者癌癥中的組蛋白翻譯后修飾狀況。組蛋白翻譯后修飾信息可用于癌癥預(yù)后、癌癥評(píng)價(jià)、癌癥分類和/或癌癥治療??捎帽疚乃龅姆椒z查的癌癥可包括,但不限于,腎細(xì)胞癌、神經(jīng)膠質(zhì)瘤、膠質(zhì)肉瘤、間變性星形細(xì)胞瘤、髓母細(xì)胞瘤、肺癌、小細(xì)胞肺癌、宮頸癌、結(jié)腸癌、直腸癌、脊索瘤、喉癌、卡波濟(jì)氏肉瘤、淋巴管肉瘤、淋巴管內(nèi)皮肉瘤、結(jié)腸直腸癌、子宮內(nèi)膜癌、卵巢癌、乳腺癌、胰腺癌、前列腺癌、腎細(xì)胞癌、肝癌、膽管癌、絨毛膜癌、精原細(xì)胞瘤、睪丸腫瘤、威爾姆斯瘤、尤文氏瘤、膀胱癌、血管肉瘤、內(nèi)皮肉瘤、腺癌、汗腺癌、皮脂腺肉瘤、乳頭狀肉瘤、乳頭狀腺肉瘤、囊腺肉瘤、支氣管癌、髓樣癌、肥大細(xì)胞瘤、間皮瘤、滑膜瘤、黑色素瘤、平滑肌肉瘤、橫紋肌肉瘤、神經(jīng)母細(xì)胞瘤、視網(wǎng)膜母細(xì)胞瘤、少突神經(jīng)膠質(zhì)瘤、聽(tīng)神經(jīng)瘤、血管母細(xì)胞瘤、腦膜瘤、松果體瘤、室管膜瘤、顱咽管瘤、上皮癌、胚胎癌、鱗狀細(xì)胞癌、基細(xì)胞癌、纖維肉瘤、粘液瘤、粘液肉瘤、神經(jīng)膠質(zhì)瘤或脂肪肉瘤。
在某些實(shí)施方案中,可使用本發(fā)明的方法和材料診斷以下疾?。河捎拈T(mén)螺旋桿菌、單核細(xì)胞增生性李斯特菌、弗氏志賀菌、嗜吞噬細(xì)胞無(wú)形體、貓披衣菌、eb病毒、皰疹病毒、hiv、埃及血吸蟲(chóng)引起的細(xì)菌感染;肥胖癥、糖尿病、心臟疾病、孤獨(dú)癥、脆性x綜合征、atr-x綜合征、天使人綜合征、普拉德-威利綜合征、貝克威思威德曼綜合征、雷特氏綜合征、魯賓斯坦-泰必氏綜合癥、coffin-lowry綜合征、免疫缺陷-著絲粒不穩(wěn)定-面部異常綜合征、α地中海貧血、白血病、亨廷頓氏病、精神分裂癥、雙相型疾病、衰老、癡呆、阿爾茨海默氏病、帕金森氏病、德朗熱綜合征、歌舞伎綜合征、干燥綜合征、白癜風(fēng)、進(jìn)行性系統(tǒng)性硬化癥、銀屑病、原發(fā)性膽汁性肝硬化、克羅恩病和潰瘍性結(jié)腸炎、橋本氏甲狀腺炎、格雷夫斯病、炎性腸病、動(dòng)脈粥樣硬化和心臟肥大。
試劑和試劑盒
本發(fā)明的另一個(gè)方面提供用于實(shí)施本文所述方法之一的試劑和包含試劑的試劑盒。試劑可被包含在合適的包裝或容器中。試劑盒可包括一種或多種本文描述的含標(biāo)準(zhǔn)物的試劑,所述標(biāo)準(zhǔn)物用于真陽(yáng)性表位和假陽(yáng)性表位的絕對(duì)定量,例如在拉下試驗(yàn)或染色質(zhì)免疫沉淀試驗(yàn)中。試劑盒還可包括如本文所述的至少一種親和劑例如抗體。標(biāo)準(zhǔn)物具有真陽(yáng)性表位的類天然親和力、特異性和抗體親抗原性。試劑盒還可包含至少一種具有假陽(yáng)性表位的類天然活性、特異性和抗體親抗原性的標(biāo)準(zhǔn)物。
在另一個(gè)優(yōu)選的實(shí)施方案中,上述標(biāo)準(zhǔn)物包括含半合成核小體的dna-蛋白質(zhì)復(fù)合物,所述半合成核小體由具有類天然親和力、特異性和抗體親抗原性的組蛋白、組蛋白同種型或組蛋白翻譯后修飾與條形碼分子組成。在各種實(shí)施方案中,在假定類天然親和力、特異性和抗體親抗原性得到維持的情況下,本領(lǐng)域已知的核心組蛋白序列的任意變體或包括表1中定義的那些的翻譯后修飾可放置在含組蛋白八聚體的組蛋白上。在優(yōu)選的實(shí)施方案中,一組標(biāo)準(zhǔn)物由具有真陽(yáng)性表位的類天然親和力、特異性和抗體親抗原性的至少一種dna復(fù)合物標(biāo)準(zhǔn)物以及具有涵蓋dna-蛋白質(zhì)復(fù)合物天然集合體中存在的多種脫靶表位(假陽(yáng)性表位)的具有類天然親和力、特異性和抗體親抗原性的多種dna-復(fù)合物標(biāo)準(zhǔn)物。
在其他實(shí)施方案中,試劑盒可包括一種或多種在包裝或容器中的洗滌緩沖液(例如磷酸鹽緩沖鹽水)和/或其它緩沖液。在其他實(shí)施方案中,試劑盒可包括分離所捕獲的物質(zhì)所必需的試劑,例如固相捕獲劑包括例如連接有第二抗體或蛋白-a的順磁顆粒。試劑盒還可包括測(cè)量所捕獲的標(biāo)準(zhǔn)物或樣品的量所必需的試劑。
當(dāng)提供試劑盒時(shí),不同的組分可包裝在單獨(dú)的容器中并在使用前立即混合。這樣單獨(dú)包裝組分可容許長(zhǎng)期保存而不損失活性組分的功能。試劑盒還可與說(shuō)明材料一起提供。說(shuō)明書(shū)可印在紙或其它基質(zhì)上和/或可提供為電子可讀介質(zhì)。
實(shí)施例1:小鼠esce14細(xì)胞系的h3k4me3ice-chip-seq
為了將染色質(zhì)免疫沉淀歸一化為生物學(xué)上有意義的標(biāo)度,采用了用所定義的內(nèi)標(biāo)進(jìn)行校準(zhǔn)的分析化學(xué)概念。在常規(guī)天然chip中摻入帶有翻譯后修飾的重構(gòu)核小體,所述重構(gòu)核小體恰好類似于通過(guò)微球菌核酸酶片段化分離的其天然單核小體對(duì)應(yīng)物(brandetal.,2008)。圖4示出了小鼠esce14細(xì)胞系hoxa基因簇的h3k4me3ice-chip-seq。組蛋白修飾密度值落在所預(yù)期的范圍內(nèi)(0-100%)。如先前所示,h3k4me3主要富集在轉(zhuǎn)錄起始位點(diǎn)和增強(qiáng)子上。
在icechip中,這種核小體內(nèi)標(biāo)采用的形式是同一修飾核小體的“梯狀物”或濃度系列,區(qū)別僅在于短的帶條形碼的序列編碼每個(gè)梯狀物成員的相對(duì)濃度,從而可構(gòu)建校準(zhǔn)曲線。參見(jiàn)圖2。
核小體內(nèi)標(biāo)的第二組成是一組在重構(gòu)時(shí)與組蛋白八聚體穩(wěn)定結(jié)合的帶條形碼的dna物質(zhì),可容易地與基因組序列區(qū)分開(kāi)來(lái)。構(gòu)建了九個(gè)成員的dna庫(kù),其由不變的“601”核小體定位序列(lowary和widom,1998)和可變的側(cè)翼?xiàng)l形碼序列組成,所選擇的條形碼序列是獨(dú)特的且相對(duì)于隨機(jī)dna沒(méi)有pcr擴(kuò)增人造序列(artifacts)(圖2)。條形碼序列被設(shè)計(jì)為與人、小鼠和酵母基因組明顯不同,以使得從基因組dna序列去卷積內(nèi)標(biāo)梯狀物足以經(jīng)得住配對(duì)末端測(cè)序中四個(gè)以上的堿基識(shí)別(base-calling)錯(cuò)誤。候選條形碼成對(duì)地添加至601-核兩側(cè),并進(jìn)一步挑選以高且相當(dāng)?shù)臄U(kuò)增效率形成清楚的單條帶pcr產(chǎn)物的候選條形碼(圖3a)。由于icechip分析讀數(shù)需要pcr,所以無(wú)論是制備測(cè)序用庫(kù)還是直接進(jìn)行測(cè)量(qpcr或ddpcr),都檢查了梯狀dna是否顯示出相對(duì)于基因組dna的任何擴(kuò)增偏倚(bias)并發(fā)現(xiàn)沒(méi)有可檢測(cè)到的差異(圖3b)。用一系列濃度(aconcentrationseries)的不同帶條形碼的dna下通過(guò)組蛋白八聚體的梯狀物透析在一個(gè)管中制備icechip核小體梯狀物(lugeretal.,1999;ruthenburgetal.,2011)(圖2)。
在免疫沉淀或拉下試驗(yàn)之前,將帶有h3k4me3標(biāo)記的核小體內(nèi)標(biāo)摻入至經(jīng)消化的基因組染色質(zhì)中來(lái)實(shí)施icechip-seq。在此,示出了e14小鼠胚胎干細(xì)胞的icechip-seq數(shù)據(jù)(圖4)。發(fā)現(xiàn)對(duì)天然chip的dilworth實(shí)驗(yàn)方案(brandetal.,2008)的微小改善使染色質(zhì)回收率最大化(>80%,用qpcr),提供至少95%的純核小體,從而使常染色質(zhì)偏倚最小化。然后將內(nèi)標(biāo)梯狀物摻入天然常染色體群,并使其經(jīng)受羥磷灰石色譜純化然后經(jīng)受免疫沉淀或拉下試驗(yàn)。量化細(xì)胞核的數(shù)量然后進(jìn)行微球菌酶(mnase)消化以圍繞所示的基因組拷貝呈現(xiàn)核小體梯狀物范圍,使得梯狀物濃度范圍代表給定的天然核小體。在添加的梯狀物的量極小的情況下(通常為輸入中總核小體的0.0001-0.002%),不明顯減小測(cè)序深度也不擾亂天然核小體捕獲。使經(jīng)免疫沉淀的材料和摻入-輸入都經(jīng)受illumina測(cè)序;通過(guò)比對(duì)內(nèi)標(biāo)dna序列連接的合適的基因組組裝物(assembly)來(lái)去卷積梯狀物和天然核小體的讀序(read)。
與其中峰高沒(méi)有直接生物學(xué)意義的常規(guī)chip相反,icechip能夠計(jì)算組蛋白修飾密度(hmd%):給定染色質(zhì)間隔上存在的標(biāo)記表位的實(shí)際百分比,bp分辨率適于chip-seq。在抗體良好的情況下,hmd%通常范圍為0-100%,但并不限于該范圍(圖4)。在icechip-seq中,ip和輸入中內(nèi)標(biāo)讀序的比例是ip富集的直接量度,是適于基因組范圍上每堿基對(duì)對(duì)齊的天然ip讀序/輸入讀序的比例的值(圖1)。
作為有代表性的h3k4me3富集區(qū)域,示出了小鼠細(xì)胞中的hoxa/hoxa基因簇(bernsteinetal.,2006;guentheretal.,2007;mikkelsenetal.,2007)(圖4)。在該測(cè)序深度下,明顯富集的峰的hmd的范圍為低至1%到大于100%。誤差估計(jì)值在高占有率核小體(high-occupancynucleosomes)的二分體(dyad)附近漸進(jìn)式快速上升(spikeasymptotically)。由于這些區(qū)域的讀序的數(shù)量很低,bp間隔上小數(shù)量的統(tǒng)計(jì)是實(shí)驗(yàn)誤差的主要來(lái)源。更大的輸入測(cè)序深度使誤差幅度減小,這可通過(guò)比較約4倍深的測(cè)序來(lái)辨別(誤差∝1/√深度)?;蛘咴谳^大的染色質(zhì)間隔內(nèi)以降低的不確定性表示hmd。重要的是,這些數(shù)據(jù)在生理上似乎可信的范圍之內(nèi)-在實(shí)驗(yàn)誤差內(nèi)表觀修飾密度很少超過(guò)100%。尤其是,mesch3k4me3數(shù)據(jù)集的60,530個(gè)識(shí)別峰(macs2,p<10-20)中有18300個(gè)的hmd/bp值在峰內(nèi)的任一點(diǎn)都超過(guò)100%,僅1627個(gè)的hmd/bp值的95%置信區(qū)間的下限大于100%。然而,更謹(jǐn)慎地評(píng)估了該方法在測(cè)量組蛋白修飾密度方面的有效性。
在圖4中在實(shí)施icechip-seq測(cè)量的過(guò)程中,內(nèi)標(biāo)的行為提供了對(duì)精確度的直接評(píng)價(jià)。對(duì)于針對(duì)h3k4me3的hek293icechip,ip中所觀察到的每個(gè)梯狀物成員相對(duì)于輸入的相對(duì)豐度的線性回歸揭示了斜率為1.02±0.02、r2為0.998的明顯相關(guān)性(圖5a)。另外的單獨(dú)實(shí)驗(yàn)揭示了表明精確度非常高且沒(méi)有明顯的系統(tǒng)偏差的類似的明顯的線性關(guān)系,表明每個(gè)梯狀物成員展現(xiàn)出了等效的ip富集(圖9b-d)。這些實(shí)驗(yàn)首次次證實(shí)表位的量與對(duì)應(yīng)的chip信號(hào)強(qiáng)度之間存在線性關(guān)系。這種線性關(guān)系是在icechip中使用標(biāo)度因子(scalarfactor)的必要條件,因此在應(yīng)用icechip衡量(scaling)前,通常檢查嚴(yán)格的線性關(guān)系。在實(shí)驗(yàn)中,該線性關(guān)系通過(guò)有用的工作范圍存在,因?yàn)橐呀?jīng)以與該實(shí)驗(yàn)中細(xì)胞核數(shù)量的大致相同范圍呈現(xiàn)出核小體內(nèi)標(biāo)的濃度系列(concentrationseries)。本發(fā)明人尋求將由illumina測(cè)序與其他定量dna計(jì)數(shù)方法計(jì)算出的hmd/bp進(jìn)行比較的方法。數(shù)字微滴pcr(ddpcr)和定量pcr(qpcr)依賴于由特定引物組限定的擴(kuò)增子,因此可直接比較該擴(kuò)增子染色體間隔上平均的源自icechip-seq的hmd/bp。令人驚訝的是,發(fā)現(xiàn)用配對(duì)末端測(cè)序時(shí),本發(fā)明人的ip中dna片段相對(duì)于輸入的富集是單核小體的5.7倍,導(dǎo)致表觀hmd增加約16%。本發(fā)明人將該比例過(guò)高(overrepresentation)稱為“寡核小體抗體親抗原性偏倚”,并認(rèn)為該“寡核小體抗體親抗原性偏倚”是由于每dna片段表位的效價(jià)(valence)較高造成的。作為一種修正,本發(fā)明人通常篩選原始的配對(duì)末端測(cè)序數(shù)據(jù)以除去較大的dan片段。然而,用qpcr和ddpcr進(jìn)行的測(cè)量在沒(méi)有嚴(yán)格的尺寸篩選的情況下不能區(qū)分單核小體衍生的信號(hào)和寡核小體衍生的信號(hào)。因此,為了進(jìn)行比較,本發(fā)明人示出了未校準(zhǔn)的hmd信號(hào)(圖5b),并在補(bǔ)充信息中提供單核小體-校準(zhǔn)的hmd。用該分析時(shí),在mesc的hoxa5基因座上,所述三種測(cè)量方法在實(shí)驗(yàn)誤差范圍之內(nèi)是相同的(圖5b)。而且,本發(fā)明人用組蛋白h3和組蛋白h4抗體實(shí)施了icechip并發(fā)現(xiàn)所預(yù)期的核小體的約2:2的比例,該比例對(duì)于所有三種測(cè)量形式都是不可區(qū)分的。這種一致性表明要么icechip是精確的要么其有不依賴于dna定量方法的系統(tǒng)誤差。
半合成組蛋白制備
人組蛋白h3.2(c110a)k4me3通過(guò)半合成制備(ruthenburgetal.,2011;shogren-knaakandpeterson,2003),但是在一個(gè)關(guān)鍵方面有所不同脫硫步驟之后,連接結(jié)合處是無(wú)疤的(wananddanishefsky,2007)—所得的組蛋白與留著用于c110a突變的天然修飾組蛋白相同,在重組組蛋白中經(jīng)常進(jìn)行該c110a突變以便于操作。通過(guò)boc-chemistryspps在s-三苯甲基-β-巰基丙?;?對(duì)甲基-二苯甲胺(s-trityl-β-mercaptopronionyl-p-methyl-benzhydrylamine)樹(shù)脂(novabiochem)上以肽硫酯合成對(duì)應(yīng)組蛋白3的殘基1-20且?guī)в衚4me3修飾的序列(alewoodetal.,1997)。將樹(shù)脂用dmf溶脹1小時(shí),然后用95%tfa、2.5%三異丙基硅烷和2.5%h2o洗滌3次、3分鐘進(jìn)行以脫保護(hù)。在氮?dú)鈹嚢柘?,用與樹(shù)脂孵育10分鐘的4摩爾當(dāng)量的boc-保護(hù)的氨基酸、3.9摩爾當(dāng)量的hbtu和6摩爾當(dāng)量的dipea進(jìn)行所有氨基酸偶聯(lián)。偶聯(lián)后,將樹(shù)脂用dmf洗滌3次(除了對(duì)谷氨酰胺使用dcm以外),用tfa洗滌3次實(shí)現(xiàn)boc脫保護(hù),其中第一次洗滌為流動(dòng)洗滌(flowwash)。在最后一次氨基酸脫保護(hù)之后,將樹(shù)脂依次用dmf、dcm和甲醇洗滌。將所有的肽用hf/dms/苯甲醚(10:1:1)切離樹(shù)脂,用冷的二乙基醚沉淀并凍干。
重組表達(dá)截短的組蛋白h3.2δ20(c110a)與n末端的his6-標(biāo)簽以及插入在h3.2l20位置后替換a21的tev蛋白酶切割位點(diǎn)(enlyfq^c),使得一經(jīng)tev蛋白酶切割,就釋放n-末端半胱氨酸。使用mpaa連接輔助物(johnsonandkent,2006)將如上所述的c-末端肽硫酯通過(guò)天然化學(xué)連接(dawsonetal.,1994)連接至重組組蛋白h3.2δ20-a21c片段。簡(jiǎn)言之,將等摩爾量的肽基3-巰基丙酰胺硫酯(peptidyl3-mercaptopropionamidethioester)和截短的組蛋白以2mm的終濃度在30mmmpaa和20mmtcep的存在下混合于ncl緩沖液(6m鹽酸胍,200mm磷酸鹽ph7.0)。如果需要,將ph調(diào)整至7.0,反應(yīng)在室溫下孵育12-16小時(shí)。隨后用maldims確認(rèn)反應(yīng)完成,并通過(guò)半制備型hplc純化產(chǎn)物(柱ymcpackc8,250mm*10mm,5μm,30nm)。通過(guò)自由基介導(dǎo)的半胱氨酸脫硫作用恢復(fù)21位上的天然丙氨酸(wananddanishefsky,2007)。用esims確認(rèn)反應(yīng)完成,用半制備型hplc(柱ymcpackc8,250mm*10mm,5μm,30nm)進(jìn)行純化并隨后凍干。
使用大腸桿菌(e.coli)中表達(dá)的人組蛋白(ruthenburgetal.,2011),如先前所述以250-500μg的規(guī)模制備八聚體(lugeretal.,1999;muthurajanetal.,2003)。簡(jiǎn)言之,將等摩爾的核心組蛋白混合于去折疊緩沖液中(50mmtris-hclph8,6.3mhcl胍,10mm2-巰基乙醇,4mmedta)至總組蛋白的終濃度為≥1mg/ml,并在4℃下在3500mwcosnakeskin透析管(pierce)中用500體積的去折疊緩沖液(20mmtris-hclph7.8,2mnacl,1mmedta,5mmdtt)透析,在16小時(shí)內(nèi)換液兩次。在透析和離心以除去任何沉淀的物質(zhì)之后,使粗品八聚體溶于去折疊緩沖液的可溶部分(fraction)經(jīng)受凝膠過(guò)濾層析(superdex20010/300gl,gehealthcare)。將含有純八聚體的部分(fractions)合并并用amiconultra-4離心式過(guò)濾器(10kmwco,millipore)濃縮至終濃度為5-15μm(光譜測(cè)量,ε280nm=44700m-1cm-1,流過(guò)濃縮器使其空白)。
用于核小體重構(gòu)的dna基于“601-widom”核小體定位序列(lowaryandwidom,1998)。本發(fā)明人將側(cè)翼為不變的6bp接頭dna的22bp條形碼序列添加到601序列的每一末端,每個(gè)條形碼序列由兩條連接在一起的在人基因組和動(dòng)物基因組中不存在的11bp序列組成(heroldetal.,2008)。
通過(guò)混合等摩爾的組蛋白八聚體和dna至終濃度為1μm,然后在透析按鈕裝置(dialysisbuttons)(hamptonresearch)中,在12-16小時(shí)內(nèi),在含20mmtris-hclph7.5、1mmedta、10mm2-巰基乙醇(2mercaptoetanol)的緩沖液中,用以2mnacl開(kāi)始以200mmnacl結(jié)束的非線性梯度透析該溶液來(lái)重構(gòu)核小體(ruthenburgetal.,2011)。透析后,將半合成核小體用2×儲(chǔ)存緩沖液(20mm二甲次胂酸鈉ph7.5,10%v/v甘油,1mmedta)、1×rl蛋白酶抑制劑混合物(cocktail)[1mmpmsf,1mmabesf,0.8m抑肽酶,20m亮抑肽酶,15m抑肽素a,40m抑氨肽酶,15me-64]、200μmpmsf進(jìn)行1:1稀釋,并保存在4℃下。通過(guò)用2mnacl脫去dna并通過(guò)溴化乙錠染色的瓊脂糖凝膠的密度測(cè)定法(用thermoscientificmassrulerlowrangednaladder原位校準(zhǔn))測(cè)量dna的濃度,一式三份,來(lái)測(cè)量核小體的濃度。半合成核小體的工作濃度通過(guò)在長(zhǎng)期儲(chǔ)存液(10mm二甲次胂酸鈉ph7.5,100mmnacl,50%甘油,1mmedta,1×rl蛋白酶抑制劑混合物,200μmpmsf)中稀釋至所期望的濃度來(lái)得到并保存在-20℃下。
icechip
icechip實(shí)驗(yàn)方案是類似天然chip實(shí)驗(yàn)方案的拉下實(shí)驗(yàn)方案(brandetal.,2008)。將貼板(plate-adhered)細(xì)胞(每ip約107個(gè)細(xì)胞)用10ml的pbs洗滌兩次,用5mlaccutase(millipore)在37℃下釋放5分鐘,用2ml的完全培養(yǎng)基淬滅,并通過(guò)離心(500×g,4℃下5分鐘)收集。所有的后續(xù)步驟用冰冷的緩沖液在冰上進(jìn)行。將細(xì)胞用10mlpbs洗滌兩次,用5ml緩沖液n(15mmtrisph7.5,15mmnacl,60mmkcl,8.5%(w/v)蔗糖,5mmmgcl2,1mmcacl21mmdtt,200μmpmsf,1×rl蛋白酶抑制劑混合物)洗滌兩次。將細(xì)胞重懸于2pcv(細(xì)胞壓縮體積)的緩沖液n中,并通過(guò)加入2pcv的2×裂解緩沖液(補(bǔ)充有0.6%np-40替代物(sigma)的緩沖液n)在4℃下裂解10分鐘。細(xì)胞核通過(guò)離心(500×g,4℃下5分鐘)收集并重懸于6pcv的緩沖液n中。為了除去細(xì)胞碎片,將重懸的細(xì)胞核鋪在50ml離心管中的7.5ml蔗糖墊(10mmhepesph7.9,30%(w/v)蔗糖,1.5mmmgcl2)的表面上并離心(1300×g,sorvalllegendxtr浮筒式轉(zhuǎn)頭,4℃下12分鐘)。大部分細(xì)胞碎片留在上層中,而細(xì)胞核沉淀通過(guò)蔗糖墊,并在管的底部形成小球狀(pelleted)沉淀。棄去上清,將細(xì)胞核重懸于2pcv的緩沖液n中。為了測(cè)量染色質(zhì)的表觀濃度,將2μl的重懸細(xì)胞核一式三份在98μl的2mnacl中稀釋,用nanodrop(thermoscientific)在260nm處測(cè)量總核酸吸光值,換算系數(shù)假設(shè)為每μl所用的染色質(zhì)1a260=50ng?;谶@些測(cè)量結(jié)果,將染色質(zhì)的表觀濃度用緩沖液n調(diào)整為1μg/μl。還使用血細(xì)胞計(jì)數(shù)器評(píng)價(jià)細(xì)胞核的量和質(zhì)量。
在該階段中,將半合成核小體的梯狀物摻雜至天然核小體的池中,摻入的梯狀物的量相當(dāng)于基于細(xì)胞核計(jì)數(shù)乘以每細(xì)胞平均dna含量(每個(gè)細(xì)胞約2.5拷貝基因組)所估計(jì)的所述池中基因組拷貝的量。
為了除去來(lái)自細(xì)胞核裂解和微球菌酶消化的碎片以及脫去染色質(zhì)結(jié)合因子(chromatinboundfactors),使核小體的池經(jīng)受羥基磷灰石色譜純化(brandetal.,2008)。將用內(nèi)標(biāo)梯狀物片段化的染色質(zhì)分成100μg總核酸的部分,將每部分與用200μl的hap緩沖液1(3.42mmna2hpo4和1.58mmnah2po4最終ph7.2,600mmnacl,1mmedta,200μmpmsf)再水化的66mg羥基磷灰石(hap)樹(shù)脂混合(bio-rad
用10μg的染色質(zhì)和15μl的am39159抗體進(jìn)行h3k4me3chip,分別用1μg的染色質(zhì)和15μl的am61277抗體和am61299抗體進(jìn)行h3和h4chip(活性基序)。留出初始染色質(zhì)的10%作為chip輸入。每個(gè)ip實(shí)驗(yàn)使用50μl的proteinadynabeads(invitrogen),該proteinadynabeads用1ml的chip緩沖液1洗滌1分鐘,洗滌兩次,每次洗滌后在磁道上收集1分鐘。為了制備該樹(shù)脂,將15μl的抗體和85μl的chip緩沖液1添加至proteinadynabeads,并在旋轉(zhuǎn)器上在室溫下孵育10分鐘,然后用1ml的chip緩沖液1洗滌兩次。然后將500μlchip緩沖液1中的染色質(zhì)(10μg,除非另有說(shuō)明)添加至磁性珠并在旋轉(zhuǎn)器上在室溫下孵育15分鐘。將珠用1ml的chip緩沖液2(mmtrisph7.5,5mmmgcl2,300mmkcl,10%(v/v)甘油,0.1%(v/v)np-40替換物)洗滌3次,然后用chip緩沖液3(10mmtrisph7.5,250mmlicl,1mmedta,0.5%脫氧膽酸鈉,0.5%(v/v)np-40替換物)洗滌2次,每次洗滌由在4℃下旋轉(zhuǎn)孵育10分鐘和在磁道上收集1分鐘組成。在洗滌的過(guò)程中,至少兩次換管減少了非特異性背景。然后將珠用1ml的chip緩沖液1和1ml的te緩沖液沖洗,然后是兩個(gè)200μlchip洗脫緩沖步驟(50mmtrisph7.5,1mmedta,1%w/vsds)。每個(gè)洗脫步驟由在thermoshaker(eppendorf)中在65℃、900rpm下孵育10分鐘組成。將洗脫液合并,將chip洗脫緩沖液加至輸入以與chip緩沖液的體積匹配。將緩沖液調(diào)整為200mmnacl之后,將100ng的rnasea加至所述混合物中并在thermoshaker中在800rpm、65℃下孵育45分鐘,用10mmedta終止孵育。接著在thermoshaker中在800rpm、42℃下用20ug蛋白酶k(roche)消化2小時(shí)完成蛋白消化?;厥誨na并用qiaquick柱(qiagen)進(jìn)行純化:將6體積的pb緩沖液加至消化液中并將溶液應(yīng)用于柱(17900×g,30s),然后進(jìn)行3次750μlpe緩沖液洗滌(17900×g,30s),再離心1分鐘以除去殘留乙醇。通過(guò)在50℃下使用25μl的te緩沖液兩次并離心(17900×g,1分鐘)來(lái)洗脫dna。
illumina庫(kù)制備
庫(kù)制備使用分離自ip或輸入的10ngdna。在dan總量低于10ng的情況下,將所有可獲得的dna用于庫(kù)制備。使用end-ittmdnaend-repair試劑盒(epicentre)(7μl10×end-it緩沖液,7μl2.5mmdntpmix,7μl10mmatp,1.4μl的end-repairenzymemix和47.6μlte緩沖液中的dna在室溫下孵育45分鐘鈍化dna的末端。用126μl(1.8體積)的ampurexp珠(ampurexpbead,beckmancoulter)純化dna。將珠與末端修復(fù)混合物(endrepairmixture)通過(guò)上下吸打10次混合,然后在室溫下孵育5分鐘。利用磁鐵在管的側(cè)面收集磁性珠,并在磁鐵上用250μl80%etoh洗滌30秒鐘,洗滌2次。將管從磁道取下,向珠加入34μl的te緩沖液并上下吸打10次。磁性珠不從洗脫液中取出而是在加尾(a-tailing)期間留在管中。向dna的3’末端添加單個(gè)腺苷酸通過(guò)將5μlneb緩沖液2、10μl1mmdatp、1μlklenow片段(3’→5’外切酶(exo-),neb)加至經(jīng)末端修復(fù)的dna并在37℃下孵育30分鐘來(lái)完成。為了純化dna,將110μl(2.2體積)的spri緩沖液(20%peg6000,2.5mnacl)加至反應(yīng)中,上下吸打10次,然后在室溫下孵育5分鐘。用磁鐵在管的側(cè)面收集磁性珠,并在磁鐵上用200μl80%etoh洗滌30秒鐘,洗滌2次。將管從磁道取下,向珠加入13μl的te緩沖液并用微量移液器混合。磁性珠不從洗脫液中取出而是在銜接子(adaptor)連接期間留在管中。為了連接銜接子,制備以下混合物:2×quickdna連接酶緩沖液,2μl的2μm銜接子雙鏈體,1μl的quickdna連接酶(neb),并將混合物加至13μl的加尾(a-tailed)dna。在室溫下孵育反應(yīng)15分鐘。為了純化dna,將21μl(0.7體積)的spri緩沖液加至反應(yīng),上下吸打10次,然后在室溫下孵育5分鐘。磁性珠利用磁鐵收集,并用孵育30秒的200μl80%etoh=洗滌兩次,用46μl的te緩沖液洗脫。將上清液轉(zhuǎn)移至新的硅化管中。
運(yùn)行定量-pcr以估計(jì)擴(kuò)增dna庫(kù)的最小pcr循環(huán)數(shù)。7.15μl的h2o,1μl的10×accuprimepcr緩沖液ii,0.25μl的
通過(guò)混合以下:40μldna庫(kù),5μl10×accuprimepcr緩沖液ii,1μl25μmmp_pcr_引物1,1μl25μmmp_pcr_引物2_index,1μlaccuprimetaqdna聚合酶和2μl的h2o,然后在c1000(bio-rad)中進(jìn)行熱循環(huán)來(lái)擴(kuò)增tdna庫(kù)。將機(jī)器設(shè)置為:1-95℃持續(xù)5min,2-95℃持續(xù)80s,3-65℃持續(xù)90s,4-回到步驟2;用qpcr確定循環(huán)數(shù)(ct+3個(gè)循環(huán))。擴(kuò)增的dna用90μl(1.8體積)的agencourtampurexp珠純化。通過(guò)上下吸打10次將珠與pcr混合物混合,然后在室溫下孵育5分鐘。利用磁鐵在管的側(cè)面收集磁性珠,并在磁鐵上用250μl80%etoh洗滌30秒鐘,洗滌2次。將管從磁道取下,向珠加入25μl的te緩沖液并上下吸打10次。在管的側(cè)面收集磁性珠并將上清液移至新的硅化管中。用agilenttechnologies2100bioanalyzer評(píng)價(jià)擴(kuò)增庫(kù)的尺寸分布和濃度。
測(cè)序和數(shù)據(jù)分析
由芝加哥大學(xué)功能基因組核心實(shí)驗(yàn)室(universityofchicagofunctionalgenomicscorefacility)使用illuminahiseq2500的標(biāo)準(zhǔn)illumina實(shí)驗(yàn)方案進(jìn)行簇生成和測(cè)序。數(shù)據(jù)分析用galaxy進(jìn)行(blankenbergetal.,2010;giardineetal.,2005;goecksetal.,2010)。首先將fastq格式的原始讀序(reads)提交至fastqgroomer。根據(jù)有機(jī)體來(lái)源用bowtie2(langmeadetal.,2009)(敏感預(yù)設(shè)選項(xiàng),末端到末端比對(duì))將讀序定位至末端連接有條形碼序列(每個(gè)條形碼有其自己的條目(entry))的小鼠(mm10)參考基因組。然后使用samtools(lietal.,2009)篩選所得的sam文件。通過(guò)該數(shù)據(jù)分析管道將未定位的(unmapped)、未配對(duì)的(距離>1000bp)以及錯(cuò)誤配對(duì)的讀序從該集合中除去。為了除去來(lái)自低質(zhì)量讀序的噪音和污染物以及模糊(mask)可重復(fù)的基因組序列,除去定位質(zhì)量(mappingquality)低于20的讀序。為了避免信號(hào)人造物(signalartifacts)以及不使泊松抽樣(poissonsampling)統(tǒng)計(jì)失真,將配對(duì)的讀序合并在一起成為單個(gè)條目(將重疊的片段展開(kāi)并填補(bǔ)缺口)。除非另有說(shuō)明,為了避免寡核小體抗體親抗原性偏倚,除去長(zhǎng)于220bp的讀序。使用bedtools(quinlan和hall,2010)生成基因組覆蓋圖(bedgraph)。
為了獲得高精確度,本發(fā)明人旨在實(shí)現(xiàn)1000至10個(gè)讀序的深度以及至少約20的輸入的平均深度的ip覆蓋范圍。然而,輸入測(cè)序越深越好,因?yàn)槠涫蔷_度的限制因素。為了計(jì)算條形碼ip效率,本發(fā)明人計(jì)算了ip中每個(gè)條形碼整條序列上的綜合覆蓋度(integratedcoverage)與輸入的比例。
其中,n是條形碼構(gòu)建體的長(zhǎng)度,在這個(gè)列子中,其為203bp,ip為ip中的累計(jì)計(jì)數(shù)(integratedcounts),輸入為輸入的累計(jì)計(jì)數(shù)。
為了提高精確度,本發(fā)明人對(duì)多個(gè)條形碼的條形碼ip效率值求平均值。為了計(jì)算組蛋白修飾密度(hmd),本發(fā)明人將以下等式用于ip和輸入的基因組覆蓋度信息:
為了估算hmd的95%置信區(qū)間,本發(fā)明人應(yīng)用如下等式:
在此,本發(fā)明人假設(shè)效率的標(biāo)準(zhǔn)方差可忽略不計(jì),ip和輸入中讀序的抽樣符合泊松抽樣統(tǒng)計(jì)。為了計(jì)算基因組范圍的總hmd含量(所有基因組基因座中帶修飾的所有核小體的百分比),整合(integrate)hmd信號(hào)并隨后除以獲得其基因組覆蓋度的堿基對(duì)的數(shù)目或者除以所報(bào)道的總基因組大小。
實(shí)施例2:驗(yàn)證icechip-seq:可再現(xiàn)性和穩(wěn)健性(robustness)
為了檢驗(yàn)復(fù)制時(shí)icechip的一致性,本發(fā)明人重復(fù)了mesc中的h3k4me3icechip-seq,并觀察hmd軌跡(track)的緊密結(jié)合(coupling)。相應(yīng)地,所識(shí)別的峰上每個(gè)生物復(fù)制品的平均hmd值是高度關(guān)聯(lián)的(r2=0.95),并且分布落在所估計(jì)的誤差之內(nèi)(圖6a)。
由不同實(shí)驗(yàn)處理?xiàng)l件造成的ip富集度的變化是常規(guī)chip中主要的復(fù)雜化因素(marinovetal.,2014)。通過(guò)將每個(gè)實(shí)驗(yàn)的輸出值與所定義的內(nèi)標(biāo)聯(lián)系在一起(tethering),用icechip測(cè)量的hmd對(duì)實(shí)驗(yàn)變化更包容。由于表觀ip富集度是輸入染色質(zhì)的量相對(duì)于樹(shù)脂上表位結(jié)合位點(diǎn)數(shù)量的函數(shù),所以本發(fā)明人旨在通過(guò)控制輸入相對(duì)于樹(shù)脂固定的抗體的比例來(lái)模擬實(shí)驗(yàn)處理差異。在一個(gè)線性分段(linearstaging)方案中,本發(fā)明人通過(guò)icechip-qpcr檢查h3k4me3hmd并發(fā)現(xiàn)其不依賴于輸入的量,可追蹤到gapdh基因座上h3k4me3的相對(duì)均勻的ip富集。雖然這些實(shí)驗(yàn)確認(rèn)了hmd在通常的chip輸入范圍內(nèi)是一致的,但是本發(fā)明人尋求能產(chǎn)生差別化富集的實(shí)驗(yàn)條件。對(duì)于固定量的輸入,改變免疫沉淀中使用的樹(shù)脂固定抗體的量獲得高于6倍的ip效率,而根據(jù)這些實(shí)驗(yàn)計(jì)算出的dnmt3a基因座和hoxa9基因座的h3k4me3密度在實(shí)驗(yàn)誤差內(nèi)是相同的(圖6b)。類似地,icechip-seq期間結(jié)合條件和洗滌條件的劇烈改變提供非常類似的hmd測(cè)量值(圖7a)。最后,本發(fā)明人用滴定法測(cè)量輸入量以檢查接近低細(xì)胞數(shù)實(shí)驗(yàn)方案的極限時(shí)icechip的表現(xiàn),并發(fā)現(xiàn)其在低至等同于約400個(gè)細(xì)胞的輸入下表現(xiàn)穩(wěn)定(圖8)。總之,這些數(shù)據(jù)表明雖然ip富集度可能隨實(shí)驗(yàn)條件變化,但是hmd是穩(wěn)定的并且是高度可再現(xiàn)的。
實(shí)施例3:多梯狀物icechip(multipleladdericechip)原位測(cè)量ip特異性
表觀chip信號(hào)是相關(guān)表位的中靶捕獲和脫靶捕獲(例如其他賴氨酸甲基標(biāo)記物)以及核小體與抗體樹(shù)脂的非特異性粘附的混合物。用若干種不同類型的內(nèi)標(biāo)實(shí)施的icechip測(cè)量所有這三種可能的chip信號(hào)來(lái)源,從而首次精確地找到真信號(hào)以及chip的誤差。本發(fā)明人通過(guò)icechip-qpcr檢查了摻有以下三種類型內(nèi)標(biāo)的mesc核小體:在可辨別dna物質(zhì)上重構(gòu)的h3k4me3修飾的、h3k36me3修飾的和未修飾的核小體(每種類型,兩種核小體)。之所以選擇h3k36me3,是由于其帶有嵌入在不同序列背景(sequencecontext)中的三甲基賴氨酸,并且先前已經(jīng)在肽陣列上發(fā)現(xiàn)了該抗體對(duì)h3k36me3的適度的脫靶親和力(bocketal.,2011)。通過(guò)檢查內(nèi)標(biāo)物,本發(fā)明人觀察到了幾乎不能檢測(cè)到的超過(guò)未修飾核小體背景(1.9±0.2)的h3k36me3富集(2.8±0.4)。與強(qiáng)的(robust)靶信號(hào)(81±10)相比,在該實(shí)驗(yàn)中有30倍的表觀特異性。因此,該抗體與帶h3k36me3核小體的脫靶結(jié)合對(duì)表觀h3k4me3密度的貢獻(xiàn)是可忽略不計(jì)的。
為了建立更綜合的內(nèi)標(biāo)組,本發(fā)明人構(gòu)建了含有組蛋白h3中研究的最透徹的二甲基賴氨酸和三甲基賴氨酸(chenetal.,2014)的許多修飾組蛋白,并設(shè)計(jì)了更大組的帶條形碼dna模板。特別是,本發(fā)明人設(shè)計(jì)了第二代潛在dna模板(n=100),該第二代潛在dna模板相對(duì)于第一代具有被推定有微球菌酶抗性這一另外特征。本發(fā)明人在兩個(gè)并行的icechip實(shí)驗(yàn)中測(cè)試了所有這些模板,當(dāng)重構(gòu)到攜帶h3k4me3的核小體中時(shí),在用微球菌酶消化mesc細(xì)胞核之前或之后將它們摻入。將通過(guò)該嚴(yán)格測(cè)試(基本上立即組合先前確認(rèn)的所有元素)的72個(gè)獨(dú)特的帶條形碼的模板分成9組,每組8個(gè)成員。對(duì)于未修飾的核小體、h3k4me3核小體、h3k9me3核小體、h3k27me3核小體、h3k36me3核小體和h3k79me2核小體,本發(fā)明人重構(gòu)了六種離散的(discrete)梯狀物,并將等量(anequivalentof)的每種梯狀物摻入至單個(gè)mesc細(xì)胞核池中。使該合并的混合物經(jīng)受微球菌核酸酶消化,接著同前一樣經(jīng)受羥基磷石灰純化,然后用對(duì)于這些標(biāo)記中的每一種可獲得的最佳驗(yàn)證的抗體探測(cè)(probe)大部分為單核小體的池。
對(duì)每個(gè)icechip的測(cè)序通過(guò)比較靶上內(nèi)標(biāo)捕獲與脫靶內(nèi)標(biāo)捕獲來(lái)提供對(duì)抗體特異性的原位(insitu)評(píng)價(jià)(圖9a)。令人滿意的是,當(dāng)用這些其他核小體內(nèi)標(biāo)挑戰(zhàn)時(shí)(h3k9me3相當(dāng)于3%的靶上捕獲),h3k4me3抗體被證明是高度特異性的。h3k9me3抗體和h3k27me3抗體的特異性略低,存在所預(yù)期的因兩種標(biāo)記都位于“arks”基序內(nèi)而導(dǎo)致的交互識(shí)別(分別代表10%和26%的靶上信號(hào))。令人驚訝的是,最廣泛使用的h3k36me3抗體和h3k79me2抗體在該實(shí)驗(yàn)中是混雜的(最好時(shí)約2-3倍特異性,盡管通過(guò)若干獨(dú)立的encode驗(yàn)證)。對(duì)這兩種標(biāo)記而言,適度的選擇性顯然是尤其成問(wèn)題的,因?yàn)樗鼈冞h(yuǎn)不如它們的抗體同樣識(shí)別的脫靶核小體標(biāo)記中的大多數(shù)標(biāo)記那般豐富。尤其是,來(lái)自同一細(xì)胞系的質(zhì)譜測(cè)量結(jié)果報(bào)告h3k36me3和h3k79me2占所有h3的2.5%和0.5%,而h3k9me3和h3k27me3則多一個(gè)數(shù)量級(jí)(voigtetal.,2012)。因此,適度倍數(shù)的特異性將在相反方向抵消富集倍數(shù)差異。
對(duì)于5種不同的抗體,脫靶捕獲與核小體表位的量成線性關(guān)系(圖9b-d)。雖然抗體特異性可有所不同,但是給定抗體的背景是確定的,并且其與輸入中存在的脫靶物質(zhì)的量成比例。因此,當(dāng)內(nèi)標(biāo)有線性關(guān)系且背景結(jié)合是適度且可測(cè)量的時(shí)候,本發(fā)明人應(yīng)用該內(nèi)標(biāo)作為標(biāo)量(scalar)的方法是有效的。給定標(biāo)記的具體hmd信號(hào)可通過(guò)求解一組線性方程來(lái)修正。盡管在先前報(bào)道的富集h3k36me3和h3k79me2標(biāo)記的位點(diǎn)上h3k36me3和h3k79me2的表觀hmd值較高,但是在本發(fā)明人的實(shí)驗(yàn)中hmd以及用這些抗體的天然chip測(cè)量值代表噪音多于信號(hào)(圖9a)。相反,h3k4me3、h3k9me3和h3k27me3的hmd值顯示出了最小限度的增加以及可修正的脫靶結(jié)合,使得可以在基因組范圍上定量比較這三種標(biāo)記的量。
在精確測(cè)量獲自二倍體細(xì)胞h3k4me3、h3k9me3和h3k27me3icechip-seq的實(shí)際組蛋白量的情況下,當(dāng)兩種標(biāo)記的hmd的總和超過(guò)100%時(shí),本發(fā)明人對(duì)標(biāo)記的核小體共占有率(nucleosomalco-occupancy)作了統(tǒng)計(jì)學(xué)論證。該解釋適用于核小體內(nèi)的兩種不同標(biāo)記以及分別稱為不對(duì)稱修飾核小體和對(duì)稱修飾核小體的一個(gè)拷貝的給定標(biāo)記和兩個(gè)拷貝的給定標(biāo)記(voigtetal.,2012)。mesc中所有基因tss處h3k4me3hmd以從最高到最低的順序排列繪制h3k4me3和h3k27me3修飾密度的熱圖,示出了具有這兩種修飾的不同模式的若干大類基因。令人驚訝的是,在高度表達(dá)的基因上,h3k27me3的水平略降,代謝基因/管家基因就是例子,然而該標(biāo)記的最高h(yuǎn)md存在于早期發(fā)育基因的子集(subset)上。確實(shí),mesc中沉默的類別中的其他受抑制的晚期發(fā)育基因例如神經(jīng)學(xué)和免疫系統(tǒng)過(guò)程(58%和62%h3k27me3)中h3k27me3富集明顯少于(分別為p<1056,1019)受抑制的細(xì)胞分化基因(70%h3k27me3)。果蠅(drosophila)s2細(xì)胞中的發(fā)育基因也具有最高的h3k27me3平均hmd。
h3k4me3標(biāo)記通過(guò)若干已知的機(jī)制促進(jìn)轉(zhuǎn)錄起始(guentheretal.,2007;lauberthetal.,2013;ruthenburgetal.,2007a;santos-rosaetal.,2002;schubeler,2004)。先天地,hmd可能被構(gòu)建為不能為檢驗(yàn)與基因表達(dá)的關(guān)聯(lián)提供信息,因?yàn)楫?dāng)與基因表達(dá)相關(guān)時(shí)相對(duì)chip-seq峰高等于hmd。然而,當(dāng)以生物學(xué)上有意義的標(biāo)度檢查h3k4me3時(shí),分組mrna豐度(binnedmrnaabundance)揭示了令人感興趣的對(duì)相應(yīng)tss處平均表觀hmd的s形依賴。假定精確測(cè)量h3k4me3密度,那么該曲線的拐點(diǎn)(約50%hmd)大致位于通常兩個(gè)等位基因上不對(duì)稱修飾核小體與對(duì)稱修飾核小體之間的統(tǒng)計(jì)邊界處。較低的hmd群是否僅僅表示已被暗示可減少轉(zhuǎn)錄變化的在tss之外h3k4me3更廣泛的空間分布(benayounetal.,2014)?仔細(xì)的檢查表明情況恰好相反,即在小鼠細(xì)胞和人細(xì)胞中平均峰hmd值與峰跨距(peakspan)呈正相關(guān);此外,該分布是雙峰的,且較大的修飾域(modificationdomain)具有與對(duì)稱修飾相符的較高的平均hmd值。
實(shí)施例4:ice-chip作為診斷工具
設(shè)想本文描述的ice-chip材料和方法用于旨在檢測(cè)哺乳動(dòng)物樣品內(nèi)特定遺傳基因座上組蛋白ptm水平的試驗(yàn)。本發(fā)明的材料和方法可用于與組蛋白翻譯后修飾的變化相關(guān)的任何疾病的診斷、預(yù)后、分類、疾病風(fēng)險(xiǎn)預(yù)測(cè)、復(fù)發(fā)檢測(cè)、療法選擇以及療法療效的評(píng)價(jià),所述任何疾病包括癌癥。
例如h3k79me2,驅(qū)動(dòng)兩個(gè)關(guān)鍵基因hoxa9和meis1的表達(dá),其是導(dǎo)致大部分由不同的遺傳突變引起的急性髓細(xì)胞性白血病的常用檢驗(yàn)點(diǎn)(checkpoint)(berntetal.,2011;kroonetal.,1998)。本發(fā)明可用于測(cè)量患者血液樣品中這些基因座上的h3k79me2hmd,以確定患者的細(xì)胞是否通過(guò)該檢驗(yàn)點(diǎn)以及是否可診斷為急性髓細(xì)胞性白血病。將患者血液樣品中這些基因座上的h3k79me2hmd與正常樣品中這些基因座處的h3k79me2hmd進(jìn)行比較,相對(duì)于對(duì)照患者樣品,hmd增加表明高的急性髓細(xì)胞性白血病風(fēng)險(xiǎn)。
在另一個(gè)實(shí)施方案中,抗癌療法可通過(guò)隨時(shí)間監(jiān)測(cè)接受疾病療法的哺乳動(dòng)物中本文描述的組蛋白翻譯后修飾來(lái)評(píng)價(jià)。例如,施用h3k79me2-甲基轉(zhuǎn)移酶抑制劑例如dot1l抑制劑(diagleetal.,2011)以治療急性髓細(xì)胞性白血病之前,可使用ice-chip測(cè)定hoxa9和meis1基因座處h3k79me2的翻譯后修飾狀態(tài)。然后,通過(guò)如上所述將h3k79me2hmd與預(yù)處理樣品、對(duì)照樣品或預(yù)確立的閾值進(jìn)行比較來(lái)測(cè)定抑制劑的有效性。由于ice-chip標(biāo)準(zhǔn)化了多個(gè)樣品間的分析,處理前樣品與處理后樣品或健康樣品和非健康樣品之間的比較給出了生物學(xué)上相關(guān)的信息,因此有利于評(píng)價(jià)患者中治療劑的療效的診斷法,包括藥物開(kāi)發(fā)期間。
而且,本發(fā)明的方法和材料可用于檢測(cè)特定藥物是否對(duì)組蛋白無(wú)作用,從而指示藥物對(duì)于改變感興趣的組蛋白翻譯后修飾的特異性。
人組蛋白h2a型1/2/3的翻譯后修飾:
人組蛋白h2a.x的翻譯后修飾:
人組蛋白h2a.z的翻譯后修飾:
人組蛋白h2a.v同種型1/2/3/4/5的翻譯后修飾:
表1(a)-人組蛋白h2a型1/2/3、人組蛋白h2a.x、人組蛋白h2a.z和人組蛋白h2a.v同種型1/2/3/4/5的翻譯后修飾
人組蛋白h2a.j的翻譯后修飾::
人組蛋白h2b型1的翻譯后修飾:
表1(b)-人組蛋白h2a.j和人組蛋白h2b型1的翻譯后修飾人組蛋白h2b型2/3/f-s的翻譯后修飾:
表1(c)-人組蛋白h2b型2/3/f-s的翻譯后修飾
推定的(putative)人組蛋白h2b型2-d/2-c翻譯后修飾:
表1(d)–推定的人組蛋白h2b型2-d/2-c的翻譯后修飾
人組蛋白h3.1/h3.1t/h3.2/h3.3/h3.3c的翻譯后修飾:
表1(e)-人組蛋白h3.1/h3.1t/h3.2/h3.3/h3.3c的翻譯后修飾人組蛋白h3樣著絲粒蛋白a的翻譯后修飾:
人組蛋白h4的翻譯后修飾:
位置修飾類型說(shuō)明
表1(f)-人組蛋白h3樣著絲粒蛋白a和人組蛋白h4的翻譯后修飾
表2-核苷酸序列-大寫(xiě)字母->退火片段;小寫(xiě)字母->條形碼;粗體小寫(xiě)字母->核小體定位序列[601widom和lowary]
文獻(xiàn)目錄
1.alewood,p.,alewood,d.,miranda,l.,love,s.,meutermans,w.,andwilson,d.(1997).rapidinsituneutralizationprotocolsforbocandfmocsolid-phasechemistries(boc和fmoc固相化學(xué)反應(yīng)的快速原位中和實(shí)驗(yàn)方案).methodsenzymol(酶學(xué)方法).289,14–29.
2.benayoun,b.a.,pollina,e.a.,ucar,d.,mahmoudi,s.,karra,k.,wong,e.d.,devarajan,k.,daugherty,a.c.,kundaje,a.b.,mancini,e.,etal.(2014).h3k4me3breadthislinkedtocellidentityandtranscriptionalconsistency(h3k4me3廣度與細(xì)胞身份和轉(zhuǎn)錄一致性有關(guān)).cell(細(xì)胞)158,673–688.
3.bernstein,b.e.,meissner,a.,andlander,e.s.(2007).themammalianepigenome(哺乳動(dòng)物表觀基因組).cell(細(xì)胞)128,669–681.
4.berntk.m.etal.(2011).mll-rearrangedleukemiaisdependentonaberranth3k79methylationbydot1l(mll重排白血病依賴于由dot1l造成的h3k79甲基化).cancercell(癌細(xì)胞)20,66-78.
5.binliu,yi,j.,sv,a.,lan,x.,ma,y.,huang,t.h.,leone,g.,andjin,v.x.(2013).qchipat:aquantitativemethodtoidentifydistinctbindingpatternsfortwobiologicalchip-seqsamplesindifferentexperimentalconditions(qchipat:鑒定不同實(shí)驗(yàn)條件下兩種生物lchip-seq樣品的不同結(jié)合模式的定量方法).bmcgenomics(bmc基因組學(xué))14,s3.
6.blankenberg,d.,vonkuster,g.,coraor,n.,ananda,g.,lazarus,r.,mangan,m.,nekrutenko,a.,andtaylor,j.(2010).galaxy:aweb-basedgenomeanalysistoolforexperimentalists(galaxy:實(shí)驗(yàn)者可用的基于網(wǎng)絡(luò)的基因組分析工具).curr.protoc.mol.biol.ed.frederickmausubelal第19章,第19.10.1–21單元.
7.bock,i.,dhayalan,a.,kudithipudi,s.,brandt,o.,rathert,p.,andjeltsch,a.(2011).detailedspecificityanalysisofantibodiesbindingtomodifiedhistonetailswithpeptidearrays(使用肽陣列的對(duì)結(jié)合修飾組蛋白尾的抗體的詳盡特異性分析).epigeneticsoff.j.dnamethylationsoc.6,256–263.
8.brand,m.,rampalli,s.,chaturvedi,c.-p.,anddilworth,f.j.(2008).analysisofepigeneticmodificationsofchromatinatspecificgenelocibynativechromatinimmunoprecipitationofnucleosomesisolatedusinghydroxyapatitechromatography(通過(guò)對(duì)使用羥基磷灰石色譜分離的核小體進(jìn)行天然染色質(zhì)免疫沉淀分析特定基因座的表觀遺傳修飾).nat.protoc.3,398–409.
9.chen,z.,grzybowski,a.t.,andruthenburg,a.j.(2014).tracelesssemisynthesisofasetofhistone3speciesbearingspecificlysinemethylationmarks(無(wú)痕半合成一組帶有特定賴氨酸甲基化標(biāo)記的組蛋白3物質(zhì)).chembiochem(化學(xué)生物化學(xué))15,2071–2075.
10.chi,p.,allis,c.d.&wang,g.g.covalenthistonemodifications--miswritten,misinterpretedandmis-erasedinhumancancers(共價(jià)組蛋白修飾--在人癌癥中被錯(cuò)寫(xiě)、曲解以及被錯(cuò)誤抹去).nat.rev.cancer10,457–469(2010).
11.daigle,s.r.etal.(2011).selectivekillingofmixedlineageleukemiacellsbyapotentsmall-moleculedot1linhibitor(用有效的小分子dot1l抑制劑選擇性殺死混合譜系白血病細(xì)胞).cancercell(癌細(xì)胞)20(1)53-65.
12.dawson,m.a.,andkouzarides,t.(2012).cancerepigenetics:frommechanismtotherapy(癌癥表觀遺傳學(xué):從機(jī)制到療法).cell(細(xì)胞)150,12–27.
13.dawson,p.e.,muir,t.w.,clark-lewis,i.,andkent,s.b.(1994).synthesisofproteinsbynativechemicalligation(通過(guò)天然化學(xué)連接合成蛋白質(zhì)).science(科學(xué))266,776–779.
14.feinberg,a.p.(2007).phenotypicplasticityandtheepigeneticsofhumandisease(人類疾病的表型可塑性和表觀遺傳學(xué)).nature(自然)447,433–440.
15.egelhofer,t.a.etal.anassessmentofhistone-modificationantibodyquality(評(píng)價(jià)組蛋白修飾抗體特性).natstructmolbiol(自然:結(jié)構(gòu)和分子生物學(xué))18,91–93(2011).
16.fuchs,s.m.,krajewski,k.,baker,r.w.,miller,v.l.&strahl,b.d.influenceofcombinatorialhistonemodificationsonantibodyandeffectorproteinrecognition(組合的組蛋白修飾對(duì)抗體和效應(yīng)蛋白識(shí)別的影響).currbiol(當(dāng)代生物學(xué))21,53–58(2011).
17.giardine,b.,riemer,c.,hardison,r.c.,burhans,r.,elnitski,l.,shah,p.,zhang,y.,blankenberg,d.,albert,i.,taylor,j.,etal.(2005).galaxy:aplatformforinteractivelarge-scalegenomeanalysis(galaxy:交互式大規(guī)?;蚪M分析平臺(tái)).genomeres(基因組研究).15,1451–1455.
18.goecks,j.,nekrutenko,a.,taylor,j.,andgalaxyteam(2010).galaxy:acomprehensiveapproachforsupportingaccessible,reproducible,andtransparentcomputationalresearchinthelifesciences(支持生命科學(xué)中可使用的、可再現(xiàn)的以及易懂的計(jì)算研究的綜合方法).genomebiol(基因組生物學(xué)).11,r86.
19.guenther,m.g.,levine,s.s.,boyer,l.a.,jaenisch,r.,andyoung,r.a.(2007).achromatinlandmarkandtranscriptioninitiationatmostpromotersinhumancells(人細(xì)胞中大多數(shù)啟動(dòng)子上的染色質(zhì)界標(biāo)以及轉(zhuǎn)錄起始).cell(細(xì)胞)130,77–88.
20.hattori,t.,taft,j.m.,swist,k.m.,luo,h.,witt,h.,slattery,m.,koide,a.,ruthenburg,a.j.,krajewski,k.,strahl,b.d.,etal.(2013).recombinantantibodiestohistonepost-translationalmodifications(組蛋白翻譯后修飾的重組抗體).natmethods(自然:方法)10,992–995.
21.henikoff,s.(2008).nucleosomedestabilizationintheepigeneticregulationofgeneexpression(基因表達(dá)表觀遺傳調(diào)控中的核小體去穩(wěn)定化).nat.rev.genet.(自然綜述:遺傳學(xué))9,15–26.
22.herold,j.,kurtz,s.,andgiegerich,r.(2008).efficientcomputationofabsentwordsingenomicsequences(基因組序列中不存在的詞組的有效計(jì)算).bmcbioinformatics(bmc生物信息學(xué))9,167.
23.jiang,c.,andpugh,b.f.(2009).nucleosomepositioningandgeneregulation:advancesthroughgenomics(核小體定位和基因調(diào)控:基因組學(xué)上的進(jìn)展).nat.rev.genet.(自然綜述:遺傳學(xué))10,161–172.
24.johnson,e.c.b.,andkent,s.b.h.(2006).insightsintothemechanismandcatalysisofthenativechemicalligationreaction(對(duì)天然化學(xué)連接反應(yīng)的機(jī)制和催化的見(jiàn)解).j.am.chem.soc.(美國(guó)化學(xué)會(huì)志)128,6640–6646.
25.krooneandkroslj.(1998).hoxa9transformsprimarybonemarrowcellsthroughspecificcollaborationwithmeis1abutnotpbx1b(hoxa9通過(guò)與meis1a而非pbx1b的特定合作來(lái)轉(zhuǎn)化初代骨髓細(xì)胞).embo17(13)3714-3725.
26.landt,s.g.etal.chip-seqguidelinesandpracticesoftheencodeandmodencodeconsortia(encode和modencode聯(lián)盟的chip-seq指南和實(shí)踐).genomeres(基因組學(xué)研究)22,1813–1831(2012).
27.langmead,b.,trapnell,c.,pop,m.,andsalzberg,s.l.(2009).ultrafastandmemory-efficientalignmentofshortdnasequencestothehumangenome.(短dna序列與人基因組的超快且存儲(chǔ)高效的比對(duì))genomebiol.(基因組生物學(xué))10,r25.
28.lauberth,s.m.,nakayama,t.,wu,x.,ferris,a.l.,tang,z.,hughes,s.h.,androeder,r.g.(2013).h3k4me3interactionswithtaf3regulatepreinitiationcomplexassemblyandselectivegeneactivation(h3k4me3與taf3的相互作用調(diào)節(jié)前起始復(fù)合物組裝和選擇性基因激活).cell(細(xì)胞)152,1021–1036.
29.leroy,g.,dimaggio,p.a.,chan,e.y.,zee,b.m.,blanco,m.a.,bryant,b.,flaniken,i.z.,liu,s.,kang,y.,trojer,p.,etal.(2013).aquantitativeatlasofhistonemodificationsignaturesfromhumancancercells(人癌細(xì)胞組蛋白修飾特征的定量圖譜集).epigeneticschromatin(表觀遺傳學(xué)染色質(zhì))6,20.
30.li,b.,andcarey,m.(2007).theroleofchromatinduringtranscription(轉(zhuǎn)錄期間染色質(zhì)的作用).cell(細(xì)胞)128,707–719.
31.li,h.,handsaker,b.,wysoker,a.,fennell,t.,ruan,j.,homer,n.,marth,g.,abecasis,g.,durbin,r.,and1000genomeprojectdataprocessingsubgroup(2009).thesequencealignment/mapformatandsamtools(序列比對(duì)/圖譜格式和sam工具).bioinforma.oxf.engl.25,2078–2079.
32.liang,k.,andkeles,s.(2012).normalizationofchip-seqdatawithcontrol(用對(duì)照歸一化chip-seq數(shù)據(jù)).bmcbioinformatics(bmc生物信息學(xué))13,199.
33.lowary,p.t.,andwidom,j.(1998).newdnasequencerulesforhighaffinitybindingtohistoneoctamerandsequence-directednucleosomepositioning(與組蛋白八聚體高親和力結(jié)合以及序列導(dǎo)向的核小體定位的新dna序列法則).j.mol.biol(分子生物學(xué)雜志).276,19–42.
34.luger,k.,rechsteiner,t.j.,andrichmond,t.j.(1999).preparationofnucleosomecoreparticlefromrecombinanthistones(由重組組蛋白制備核小體核心顆粒).methodsenzymol(酶學(xué)方法).304,3–19.
35.marinov,g.k.,kundaje,a.,park,p.j.,andwold,b.j.(2014).large-scalequalityanalysisofpublishedchip-seqdata(大規(guī)模質(zhì)量分析公開(kāi)的chip-seq數(shù)據(jù)).g3(bethesda)4,209–223.
36.mikkelsen,t.s.,ku,m.,jaffe,d.b.,issac,b.,lieberman,e.,giannoukos,g.,alvarez,p.,brockman,w.,kim,t.-k.,koche,r.p.,etal.(2007).genome-widemapsofchromatinstateinpluripotentandlineage-committedcells(多能性細(xì)胞和譜系承諾細(xì)胞中染色質(zhì)狀態(tài)的基因組范圍圖譜).nature(自然)448,553–560.
37.muthurajan,u.m.,park,y.-j.,edayathumangalam,r.s.,suto,r.k.,chakravarthy,s.,dyer,p.n.,andluger,k.(2003).structureanddynamicsofnucleosomaldna(核小體dna的結(jié)構(gòu)和動(dòng)力學(xué)).biopolymers(生物聚合物)68,547–556.
38.nady,n.,min,j.,kareta,m.s.,chédin,f.,andarrowsmith,c.h.(2008).aspotonthechromatinlandscape?histonepeptidearraysasatoolforepigeneticresearch(染色質(zhì)景觀上的spot?組蛋白肽陣列作為表觀遺傳學(xué)研究的工具).trendsbiochem.sci.(生物化學(xué)趨勢(shì))33,305–313.
39.nishikori,s.,hattori,t.,fuchs,s.m.,yasui,n.,wojcik,j.,koide,a.,strahl,b.d.,andkoide,s.(2012).broadrangesofaffinityandspecificityofanti-histoneantibodiesrevealedbyaquantitativepeptideimmunoprecipitationassay(定量肽免疫沉淀試驗(yàn)揭示抗組蛋白抗體的廣范圍的親和力和特異性).jmolbiol(分子生物學(xué)雜志)424,391–399.
40.park,p.j.(2009).chip–seq:advantagesandchallengesofamaturingtechnology(成熟技術(shù)的優(yōu)勢(shì)和挑戰(zhàn)).nat.rev.genet.(自然綜述:遺傳學(xué))10,669–680.
41.quinlan,a.r.,andhall,i.m.(2010).bedtools:aflexiblesuiteofutilitiesforcomparinggenomicfeatures(bedtools:比較基因組特征的靈活的工具組).bioinforma.oxf.engl.26,841–842.
42.ruthenburg,a.j.,li,h.,milne,t.a.,dewell,s.,mcginty,r.k.,yuen,m.,ueberheide,b.,dou,y.,muir,t.w.,patel,d.j.,etal.(2011).recognitionofamononucleosomalhistonemodificationpatternbybptfviamultivalentinteractions(bptf通過(guò)多價(jià)相互作用識(shí)別單核小體組蛋白修飾模式).cell(細(xì)胞)145,692–706.
43.santos-rosa,h.,schneider,r.,bannister,a.j.,sherriff,j.,bernstein,b.e.,emre,n.c.t.,schreiber,s.l.,mellor,j.,andkouzarides,t.(2002).activegenesaretri-methylatedatk4ofhistoneh3(活性基因在組蛋白h3k4處被三甲基化).nature(自然)419,407–411.
44.schubeler,d.(2004).thehistonemodificationpatternofactivegenesrevealedthroughgenome-widechromatinanalysisofahighereukaryote(通過(guò)高等真核生物基因組范圍的染色質(zhì)分析揭示活性基因的組蛋白修飾模式).genes&development(基因和發(fā)育)18,1263–1271.
45.shogren-knaak,m.a.,andpeterson,c.l.(2003).creatingdesignerhistonesbynativechemicalligation(通過(guò)天然化學(xué)連接生成設(shè)計(jì)者組蛋白).inmethodsinenzymology,c.davidallis和carlwu,ed.(academicpress),pp.62–76.
46.trygvetollefsbolepigeneticsinhumandisease2012academicpress.
47.voigt,p.,leroy,g.,drury,w.j.,iii,zee,b.m.,son,j.,beck,d.b.,young,n.l.,garcia,b.a.,andreinberg,d.(2012).asymmetricallymodifiednucleosomes(不對(duì)稱修飾的核小體).cell(細(xì)胞)151,181–193.
48.wan,q.,anddanishefsky,s.j.(2007).free-radical-based,specificdesulfurizationofcysteine:apowerfuladvanceinthesynthesisofpolypeptidesandglycopolypeptides(基于自由基的半管氨酸的特定脫硫:合成多肽和糖多肽的巨大進(jìn)展).angew.chem.int.edengl.46,9248–9252.
49.young,n.l.,dimaggio,p.a.,plazas-mayorca,m.d.,baliban,r.c.,floudas,c.a.,andgarcia,b.a.(2009).highthroughputcharacterizationofcombinatorialhistonecodes(組合組蛋白密碼的高通量表征).molcellproteomics(分子生物學(xué)蛋白質(zhì)組學(xué))8,2266–2284.
50.zhang,y.,liu,t.,meyer,c.a.,eeckhoute,j.,johnson,d.s.,bernstein,b.e.,nussbaum,c.,myers,r.m.,brown,m.,li,w.,etal.(2008).model-basedanalysisofchip-seq(macs)(基于模型分析chip-seq(macs)).genomebiol(基因組生物學(xué))9,r137.
51.zhang,z.,andpugh,b.f.(2011).high-resolutiongenome-widemappingoftheprimarystructureofchromatin(染色質(zhì)一級(jí)結(jié)構(gòu)的高分辨率基因組范圍作圖).cell(細(xì)胞)144,175–186。